KR20150094741A - 지방산 유도체의 acp매개 생성 - Google Patents
지방산 유도체의 acp매개 생성 Download PDFInfo
- Publication number
- KR20150094741A KR20150094741A KR1020157018571A KR20157018571A KR20150094741A KR 20150094741 A KR20150094741 A KR 20150094741A KR 1020157018571 A KR1020157018571 A KR 1020157018571A KR 20157018571 A KR20157018571 A KR 20157018571A KR 20150094741 A KR20150094741 A KR 20150094741A
- Authority
- KR
- South Korea
- Prior art keywords
- fatty acid
- acid derivative
- aliphatic
- acp
- host cell
- Prior art date
Links
- 238000004519 manufacturing process Methods 0.000 title claims abstract description 95
- 229940053200 antiepileptics fatty acid derivative Drugs 0.000 title claims abstract description 94
- 230000001404 mediated effect Effects 0.000 title description 4
- 239000000194 fatty acid Substances 0.000 claims abstract description 428
- 235000014113 dietary fatty acids Nutrition 0.000 claims abstract description 426
- 229930195729 fatty acid Natural products 0.000 claims abstract description 426
- 150000004665 fatty acids Chemical class 0.000 claims abstract description 413
- 239000000203 mixture Substances 0.000 claims abstract description 186
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 174
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 125
- 238000000034 method Methods 0.000 claims abstract description 123
- 125000002252 acyl group Chemical group 0.000 claims abstract description 48
- 238000012546 transfer Methods 0.000 claims abstract description 35
- -1 aliphatic alcohols Chemical class 0.000 claims description 247
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 189
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 189
- 229920001184 polypeptide Polymers 0.000 claims description 188
- 102000040430 polynucleotide Human genes 0.000 claims description 160
- 108091033319 polynucleotide Proteins 0.000 claims description 160
- 239000002157 polynucleotide Substances 0.000 claims description 160
- 230000000694 effects Effects 0.000 claims description 133
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 claims description 92
- 229910052799 carbon Inorganic materials 0.000 claims description 89
- 150000001336 alkenes Chemical class 0.000 claims description 87
- 108020002982 thioesterase Proteins 0.000 claims description 68
- 102000005488 Thioesterase Human genes 0.000 claims description 67
- 101710129019 Long-chain acyl-[acyl-carrier-protein] reductase Proteins 0.000 claims description 66
- 125000001931 aliphatic group Chemical group 0.000 claims description 62
- 150000001335 aliphatic alkanes Chemical class 0.000 claims description 58
- 230000015572 biosynthetic process Effects 0.000 claims description 57
- DNIAPMSPPWPWGF-GSVOUGTGSA-N (R)-(-)-Propylene glycol Chemical compound C[C@@H](O)CO DNIAPMSPPWPWGF-GSVOUGTGSA-N 0.000 claims description 53
- 108010019670 Chimeric Antigen Receptors Proteins 0.000 claims description 52
- 241000588724 Escherichia coli Species 0.000 claims description 40
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 claims description 32
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 claims description 32
- 150000002576 ketones Chemical class 0.000 claims description 27
- 241000193830 Bacillus <bacterium> Species 0.000 claims description 25
- 102000003960 Ligases Human genes 0.000 claims description 19
- 108090000364 Ligases Proteins 0.000 claims description 19
- 101150056746 sfp gene Proteins 0.000 claims description 18
- 241000192700 Cyanobacteria Species 0.000 claims description 17
- 238000004113 cell culture Methods 0.000 claims description 17
- 239000001963 growth medium Substances 0.000 claims description 16
- 150000004670 unsaturated fatty acids Chemical class 0.000 claims description 16
- 235000021122 unsaturated fatty acids Nutrition 0.000 claims description 16
- 239000002609 medium Substances 0.000 claims description 15
- 238000012258 culturing Methods 0.000 claims description 14
- 108010078791 Carrier Proteins Proteins 0.000 claims description 12
- 102000014914 Carrier Proteins Human genes 0.000 claims description 11
- 235000014469 Bacillus subtilis Nutrition 0.000 claims description 10
- 102000004357 Transferases Human genes 0.000 claims description 8
- 108090000992 Transferases Proteins 0.000 claims description 8
- 230000002829 reductive effect Effects 0.000 claims description 8
- 150000004671 saturated fatty acids Chemical class 0.000 claims description 7
- 244000063299 Bacillus subtilis Species 0.000 claims description 6
- 241000206597 Marinobacter hydrocarbonoclasticus Species 0.000 claims description 3
- 102000057234 Acyl transferases Human genes 0.000 claims description 2
- 108700016155 Acyl transferases Proteins 0.000 claims description 2
- 108010001814 phosphopantetheinyl transferase Proteins 0.000 claims 2
- 102100026384 L-aminoadipate-semialdehyde dehydrogenase-phosphopantetheinyl transferase Human genes 0.000 claims 1
- 230000014509 gene expression Effects 0.000 abstract description 74
- 230000001965 increasing effect Effects 0.000 abstract description 42
- 244000005700 microbiome Species 0.000 abstract description 26
- 238000000855 fermentation Methods 0.000 abstract description 23
- 230000004151 fermentation Effects 0.000 abstract description 23
- 230000001747 exhibiting effect Effects 0.000 abstract description 2
- 210000004027 cell Anatomy 0.000 description 498
- 101710146995 Acyl carrier protein Proteins 0.000 description 122
- 235000018102 proteins Nutrition 0.000 description 111
- 235000019441 ethanol Nutrition 0.000 description 104
- 229940088598 enzyme Drugs 0.000 description 72
- 102000004190 Enzymes Human genes 0.000 description 69
- 108090000790 Enzymes Proteins 0.000 description 69
- 239000000047 product Substances 0.000 description 56
- 150000002148 esters Chemical class 0.000 description 53
- 230000001851 biosynthetic effect Effects 0.000 description 49
- 150000002430 hydrocarbons Chemical class 0.000 description 48
- 229930195733 hydrocarbon Natural products 0.000 description 47
- 150000007523 nucleic acids Chemical class 0.000 description 45
- 239000013598 vector Substances 0.000 description 38
- 239000013612 plasmid Substances 0.000 description 35
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 30
- 241000196324 Embryophyta Species 0.000 description 26
- 230000006696 biosynthetic metabolic pathway Effects 0.000 description 26
- 102000039446 nucleic acids Human genes 0.000 description 26
- 108020004707 nucleic acids Proteins 0.000 description 26
- 230000002018 overexpression Effects 0.000 description 25
- 102000007698 Alcohol dehydrogenase Human genes 0.000 description 24
- 239000013604 expression vector Substances 0.000 description 24
- 241000894006 Bacteria Species 0.000 description 23
- 238000006243 chemical reaction Methods 0.000 description 23
- 241000894007 species Species 0.000 description 22
- 230000004927 fusion Effects 0.000 description 21
- 125000003729 nucleotide group Chemical group 0.000 description 21
- 108020004414 DNA Proteins 0.000 description 20
- 239000000446 fuel Substances 0.000 description 20
- 239000000463 material Substances 0.000 description 20
- 239000000126 substance Substances 0.000 description 20
- 239000002028 Biomass Substances 0.000 description 19
- 239000002773 nucleotide Substances 0.000 description 19
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 18
- 150000001875 compounds Chemical class 0.000 description 17
- 108010016219 Acetyl-CoA carboxylase Proteins 0.000 description 16
- 102000000452 Acetyl-CoA carboxylase Human genes 0.000 description 16
- 108010018763 Biotin carboxylase Proteins 0.000 description 16
- 239000004215 Carbon black (E152) Substances 0.000 description 16
- 235000019387 fatty acid methyl ester Nutrition 0.000 description 16
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 15
- 108090001018 hexadecanal dehydrogenase (acylating) Proteins 0.000 description 15
- 241000228212 Aspergillus Species 0.000 description 14
- 108091028043 Nucleic acid sequence Proteins 0.000 description 14
- ZSLZBFCDCINBPY-ZSJPKINUSA-N acetyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 ZSLZBFCDCINBPY-ZSJPKINUSA-N 0.000 description 14
- 150000001299 aldehydes Chemical class 0.000 description 14
- 235000001014 amino acid Nutrition 0.000 description 14
- 239000003599 detergent Substances 0.000 description 14
- 230000000813 microbial effect Effects 0.000 description 14
- 238000002703 mutagenesis Methods 0.000 description 14
- 231100000350 mutagenesis Toxicity 0.000 description 14
- 230000037361 pathway Effects 0.000 description 14
- 235000000346 sugar Nutrition 0.000 description 14
- 125000003275 alpha amino acid group Chemical group 0.000 description 13
- 230000035772 mutation Effects 0.000 description 13
- 230000001105 regulatory effect Effects 0.000 description 13
- 239000004094 surface-active agent Substances 0.000 description 13
- 230000002255 enzymatic effect Effects 0.000 description 12
- 239000003208 petroleum Substances 0.000 description 12
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 11
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 11
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 11
- 229940024606 amino acid Drugs 0.000 description 11
- 230000001580 bacterial effect Effects 0.000 description 11
- 150000001720 carbohydrates Chemical class 0.000 description 11
- 230000006872 improvement Effects 0.000 description 11
- 108010053754 Aldehyde reductase Proteins 0.000 description 10
- 102100027265 Aldo-keto reductase family 1 member B1 Human genes 0.000 description 10
- 108090000489 Carboxy-Lyases Proteins 0.000 description 10
- 102000004031 Carboxy-Lyases Human genes 0.000 description 10
- 108700026244 Open Reading Frames Proteins 0.000 description 10
- 150000001298 alcohols Chemical class 0.000 description 10
- 150000001413 amino acids Chemical class 0.000 description 10
- 235000014633 carbohydrates Nutrition 0.000 description 10
- 239000000543 intermediate Substances 0.000 description 10
- 229920000642 polymer Polymers 0.000 description 10
- 229920006395 saturated elastomer Polymers 0.000 description 10
- 239000000758 substrate Substances 0.000 description 10
- 101100012355 Bacillus anthracis fabH1 gene Proteins 0.000 description 9
- 101100012357 Bacillus subtilis (strain 168) fabHA gene Proteins 0.000 description 9
- 108010054576 Deoxyribonuclease EcoRI Proteins 0.000 description 9
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 9
- 125000000539 amino acid group Chemical group 0.000 description 9
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N biotin Natural products N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 9
- 101150035981 fabH gene Proteins 0.000 description 9
- 235000021588 free fatty acids Nutrition 0.000 description 9
- 239000008103 glucose Substances 0.000 description 9
- 239000003921 oil Substances 0.000 description 9
- 235000019198 oils Nutrition 0.000 description 9
- 239000002994 raw material Substances 0.000 description 9
- 238000012360 testing method Methods 0.000 description 9
- 239000001993 wax Substances 0.000 description 9
- 102100037885 Calcium-independent phospholipase A2-gamma Human genes 0.000 description 8
- 101150071111 FADD gene Proteins 0.000 description 8
- 241000187747 Streptomyces Species 0.000 description 8
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 8
- 125000004432 carbon atom Chemical group C* 0.000 description 8
- 230000008859 change Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 230000002068 genetic effect Effects 0.000 description 8
- JRZJOMJEPLMPRA-UHFFFAOYSA-N olefin Natural products CCCCCCCC=C JRZJOMJEPLMPRA-UHFFFAOYSA-N 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 238000013518 transcription Methods 0.000 description 8
- 230000035897 transcription Effects 0.000 description 8
- GGQQNYXPYWCUHG-RMTFUQJTSA-N (3e,6e)-deca-3,6-diene Chemical compound CCC\C=C\C\C=C\CC GGQQNYXPYWCUHG-RMTFUQJTSA-N 0.000 description 7
- 108010011449 Long-chain-fatty-acid-CoA ligase Proteins 0.000 description 7
- 241000795633 Olea <sea slug> Species 0.000 description 7
- 241000589516 Pseudomonas Species 0.000 description 7
- 101150070497 accC gene Proteins 0.000 description 7
- 230000001419 dependent effect Effects 0.000 description 7
- 238000009396 hybridization Methods 0.000 description 7
- 230000001976 improved effect Effects 0.000 description 7
- 230000001939 inductive effect Effects 0.000 description 7
- 239000000314 lubricant Substances 0.000 description 7
- 150000002894 organic compounds Chemical class 0.000 description 7
- 239000004014 plasticizer Substances 0.000 description 7
- 238000000746 purification Methods 0.000 description 7
- 229920005989 resin Polymers 0.000 description 7
- 239000011347 resin Substances 0.000 description 7
- 239000002904 solvent Substances 0.000 description 7
- 150000008163 sugars Chemical class 0.000 description 7
- 102100022089 Acyl-[acyl-carrier-protein] hydrolase Human genes 0.000 description 6
- RGJOEKWQDUBAIZ-IBOSZNHHSA-N CoASH Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCS)O[C@H]1N1C2=NC=NC(N)=C2N=C1 RGJOEKWQDUBAIZ-IBOSZNHHSA-N 0.000 description 6
- 241000233866 Fungi Species 0.000 description 6
- 101000937642 Homo sapiens Malonyl-CoA-acyl carrier protein transacylase, mitochondrial Proteins 0.000 description 6
- 102100027329 Malonyl-CoA-acyl carrier protein transacylase, mitochondrial Human genes 0.000 description 6
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 6
- MUBZPKHOEPUJKR-UHFFFAOYSA-N Oxalic acid Chemical compound OC(=O)C(O)=O MUBZPKHOEPUJKR-UHFFFAOYSA-N 0.000 description 6
- 101710181816 Pyruvate-formate-lyase deactivase Proteins 0.000 description 6
- 101150071422 acp gene Proteins 0.000 description 6
- 239000002585 base Substances 0.000 description 6
- 229960002685 biotin Drugs 0.000 description 6
- 235000020958 biotin Nutrition 0.000 description 6
- 239000011616 biotin Substances 0.000 description 6
- 101150031021 birA gene Proteins 0.000 description 6
- 239000006143 cell culture medium Substances 0.000 description 6
- RGJOEKWQDUBAIZ-UHFFFAOYSA-N coenzime A Natural products OC1C(OP(O)(O)=O)C(COP(O)(=O)OP(O)(=O)OCC(C)(C)C(O)C(=O)NCCC(=O)NCCS)OC1N1C2=NC=NC(N)=C2N=C1 RGJOEKWQDUBAIZ-UHFFFAOYSA-N 0.000 description 6
- 239000005516 coenzyme A Substances 0.000 description 6
- 229940093530 coenzyme a Drugs 0.000 description 6
- 239000002537 cosmetic Substances 0.000 description 6
- KDTSHFARGAKYJN-UHFFFAOYSA-N dephosphocoenzyme A Natural products OC1C(O)C(COP(O)(=O)OP(O)(=O)OCC(C)(C)C(O)C(=O)NCCC(=O)NCCS)OC1N1C2=NC=NC(N)=C2N=C1 KDTSHFARGAKYJN-UHFFFAOYSA-N 0.000 description 6
- 239000003814 drug Substances 0.000 description 6
- 101150090981 fabG gene Proteins 0.000 description 6
- 101150016526 fadE gene Proteins 0.000 description 6
- 238000000769 gas chromatography-flame ionisation detection Methods 0.000 description 6
- 230000003834 intracellular effect Effects 0.000 description 6
- 101150068528 mabA gene Proteins 0.000 description 6
- 239000003550 marker Substances 0.000 description 6
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 6
- 238000006467 substitution reaction Methods 0.000 description 6
- 108091026890 Coding region Proteins 0.000 description 5
- LTYOQGRJFJAKNA-KKIMTKSISA-N Malonyl CoA Natural products S(C(=O)CC(=O)O)CCNC(=O)CCNC(=O)[C@@H](O)C(CO[P@](=O)(O[P@](=O)(OC[C@H]1[C@@H](OP(=O)(O)O)[C@@H](O)[C@@H](n2c3ncnc(N)c3nc2)O1)O)O)(C)C LTYOQGRJFJAKNA-KKIMTKSISA-N 0.000 description 5
- 240000008042 Zea mays Species 0.000 description 5
- 239000012298 atmosphere Substances 0.000 description 5
- 230000008827 biological function Effects 0.000 description 5
- 238000006473 carboxylation reaction Methods 0.000 description 5
- 239000001913 cellulose Substances 0.000 description 5
- 229920002678 cellulose Polymers 0.000 description 5
- 235000010980 cellulose Nutrition 0.000 description 5
- 230000003247 decreasing effect Effects 0.000 description 5
- 238000012217 deletion Methods 0.000 description 5
- 230000037430 deletion Effects 0.000 description 5
- 101150072202 fabV gene Proteins 0.000 description 5
- 239000004744 fabric Substances 0.000 description 5
- 230000004907 flux Effects 0.000 description 5
- 239000003205 fragrance Substances 0.000 description 5
- LTYOQGRJFJAKNA-DVVLENMVSA-N malonyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)CC(O)=O)O[C@H]1N1C2=NC=NC(N)=C2N=C1 LTYOQGRJFJAKNA-DVVLENMVSA-N 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 239000002243 precursor Substances 0.000 description 5
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 4
- 102100027841 Acyl-CoA wax alcohol acyltransferase 2 Human genes 0.000 description 4
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 4
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 4
- 241000193403 Clostridium Species 0.000 description 4
- 102000005870 Coenzyme A Ligases Human genes 0.000 description 4
- 241000195493 Cryptophyta Species 0.000 description 4
- SRBFZHDQGSBBOR-IOVATXLUSA-N D-xylopyranose Chemical compound O[C@@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-IOVATXLUSA-N 0.000 description 4
- 102000053602 DNA Human genes 0.000 description 4
- 208000031912 Endemic Flea-Borne Typhus Diseases 0.000 description 4
- 101100390711 Escherichia coli (strain K12) fhuA gene Proteins 0.000 description 4
- 241000238631 Hexapoda Species 0.000 description 4
- 241001465754 Metazoa Species 0.000 description 4
- 206010028282 Murine typhus Diseases 0.000 description 4
- 241000521981 Mycodrosophila aqua Species 0.000 description 4
- 108091034117 Oligonucleotide Proteins 0.000 description 4
- 235000019482 Palm oil Nutrition 0.000 description 4
- 241000235070 Saccharomyces Species 0.000 description 4
- 240000000111 Saccharum officinarum Species 0.000 description 4
- 235000007201 Saccharum officinarum Nutrition 0.000 description 4
- 229930006000 Sucrose Natural products 0.000 description 4
- 208000037386 Typhoid Diseases 0.000 description 4
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 4
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 4
- 125000000217 alkyl group Chemical group 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 4
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 4
- 230000027455 binding Effects 0.000 description 4
- 125000002915 carbonyl group Chemical group [*:2]C([*:1])=O 0.000 description 4
- 150000007942 carboxylates Chemical group 0.000 description 4
- 230000001413 cellular effect Effects 0.000 description 4
- 239000000571 coke Substances 0.000 description 4
- 238000009833 condensation Methods 0.000 description 4
- 230000005494 condensation Effects 0.000 description 4
- 235000005822 corn Nutrition 0.000 description 4
- 239000010779 crude oil Substances 0.000 description 4
- 125000004122 cyclic group Chemical group 0.000 description 4
- 239000000975 dye Substances 0.000 description 4
- 210000003527 eukaryotic cell Anatomy 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 101150115959 fadR gene Proteins 0.000 description 4
- 239000003925 fat Substances 0.000 description 4
- 235000019197 fats Nutrition 0.000 description 4
- NDJKXXJCMXVBJW-UHFFFAOYSA-N heptadecane Chemical compound CCCCCCCCCCCCCCCCC NDJKXXJCMXVBJW-UHFFFAOYSA-N 0.000 description 4
- 108010062385 long-chain-alcohol O-fatty-acyltransferase Proteins 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- LQERIDTXQFOHKA-UHFFFAOYSA-N nonadecane Chemical compound CCCCCCCCCCCCCCCCCCC LQERIDTXQFOHKA-UHFFFAOYSA-N 0.000 description 4
- 235000016709 nutrition Nutrition 0.000 description 4
- 238000007254 oxidation reaction Methods 0.000 description 4
- 239000002540 palm oil Substances 0.000 description 4
- YCOZIPAWZNQLMR-UHFFFAOYSA-N pentadecane Chemical compound CCCCCCCCCCCCCCC YCOZIPAWZNQLMR-UHFFFAOYSA-N 0.000 description 4
- 239000002304 perfume Substances 0.000 description 4
- 230000000644 propagated effect Effects 0.000 description 4
- 239000005720 sucrose Substances 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 230000014616 translation Effects 0.000 description 4
- 201000008297 typhoid fever Diseases 0.000 description 4
- UHPMCKVQTMMPCG-UHFFFAOYSA-N 5,8-dihydroxy-2-methoxy-6-methyl-7-(2-oxopropyl)naphthalene-1,4-dione Chemical compound CC1=C(CC(C)=O)C(O)=C2C(=O)C(OC)=CC(=O)C2=C1O UHPMCKVQTMMPCG-UHFFFAOYSA-N 0.000 description 3
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 3
- CSCPPACGZOOCGX-UHFFFAOYSA-N Acetone Chemical compound CC(C)=O CSCPPACGZOOCGX-UHFFFAOYSA-N 0.000 description 3
- 241000589291 Acinetobacter Species 0.000 description 3
- 241000194107 Bacillus megaterium Species 0.000 description 3
- 241000191368 Chlorobi Species 0.000 description 3
- 241000223218 Fusarium Species 0.000 description 3
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 3
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 3
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 3
- 241000186660 Lactobacillus Species 0.000 description 3
- 102100034337 Long-chain-fatty-acid-CoA ligase 6 Human genes 0.000 description 3
- 241000235395 Mucor Species 0.000 description 3
- 102000004316 Oxidoreductases Human genes 0.000 description 3
- 108090000854 Oxidoreductases Proteins 0.000 description 3
- 241000222350 Pleurotus Species 0.000 description 3
- 229920002472 Starch Polymers 0.000 description 3
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 3
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 3
- 239000004473 Threonine Substances 0.000 description 3
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 3
- 241000607626 Vibrio cholerae Species 0.000 description 3
- 239000002253 acid Substances 0.000 description 3
- 239000000654 additive Substances 0.000 description 3
- 125000003118 aryl group Chemical group 0.000 description 3
- 238000003556 assay Methods 0.000 description 3
- 238000007845 assembly PCR Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 239000003225 biodiesel Substances 0.000 description 3
- 235000010633 broth Nutrition 0.000 description 3
- 238000012219 cassette mutagenesis Methods 0.000 description 3
- 230000010261 cell growth Effects 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 229940079593 drug Drugs 0.000 description 3
- 239000003995 emulsifying agent Substances 0.000 description 3
- 208000028104 epidemic louse-borne typhus Diseases 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 101150026389 fabF gene Proteins 0.000 description 3
- 239000000796 flavoring agent Substances 0.000 description 3
- 235000013305 food Nutrition 0.000 description 3
- 239000003502 gasoline Substances 0.000 description 3
- 239000011521 glass Substances 0.000 description 3
- 230000012010 growth Effects 0.000 description 3
- 238000001727 in vivo Methods 0.000 description 3
- 239000003317 industrial substance Substances 0.000 description 3
- 238000011835 investigation Methods 0.000 description 3
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 3
- 229960000310 isoleucine Drugs 0.000 description 3
- 239000004922 lacquer Substances 0.000 description 3
- 229940039696 lactobacillus Drugs 0.000 description 3
- 150000002632 lipids Chemical class 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 235000015097 nutrients Nutrition 0.000 description 3
- QIQXTHQIDYTFRH-UHFFFAOYSA-N octadecanoic acid Chemical compound CCCCCCCCCCCCCCCCCC(O)=O QIQXTHQIDYTFRH-UHFFFAOYSA-N 0.000 description 3
- 239000003973 paint Substances 0.000 description 3
- 239000011846 petroleum-based material Substances 0.000 description 3
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 3
- COLNVLDHVKWLRT-QMMMGPOBSA-N phenylalanine group Chemical group N[C@@H](CC1=CC=CC=C1)C(=O)O COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 3
- 210000001236 prokaryotic cell Anatomy 0.000 description 3
- 230000002285 radioactive effect Effects 0.000 description 3
- 238000010188 recombinant method Methods 0.000 description 3
- 239000012925 reference material Substances 0.000 description 3
- 238000002741 site-directed mutagenesis Methods 0.000 description 3
- 239000008107 starch Substances 0.000 description 3
- 235000019698 starch Nutrition 0.000 description 3
- 239000002562 thickening agent Substances 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- 206010061393 typhus Diseases 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- 239000004474 valine Substances 0.000 description 3
- 239000002699 waste material Substances 0.000 description 3
- 210000005253 yeast cell Anatomy 0.000 description 3
- ADOBXTDBFNCOBN-UHFFFAOYSA-N 1-heptadecene Chemical compound CCCCCCCCCCCCCCCC=C ADOBXTDBFNCOBN-UHFFFAOYSA-N 0.000 description 2
- PJLHTVIBELQURV-UHFFFAOYSA-N 1-pentadecene Chemical group CCCCCCCCCCCCCC=C PJLHTVIBELQURV-UHFFFAOYSA-N 0.000 description 2
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 2
- GBZDALHFANHWOF-UHFFFAOYSA-N 2-methyloctadecanoic acid Chemical compound CCCCCCCCCCCCCCCCC(C)C(O)=O GBZDALHFANHWOF-UHFFFAOYSA-N 0.000 description 2
- 241000186361 Actinobacteria <class> Species 0.000 description 2
- 241000219194 Arabidopsis Species 0.000 description 2
- 239000004475 Arginine Substances 0.000 description 2
- 108010082340 Arginine deiminase Proteins 0.000 description 2
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 2
- 241001513093 Aspergillus awamori Species 0.000 description 2
- NTTIDCCSYIDANP-UHFFFAOYSA-N BCCP Chemical compound BCCP NTTIDCCSYIDANP-UHFFFAOYSA-N 0.000 description 2
- 241001328122 Bacillus clausii Species 0.000 description 2
- 241000193422 Bacillus lentus Species 0.000 description 2
- 101001074429 Bacillus subtilis (strain 168) Polyketide biosynthesis acyltransferase homolog PksD Proteins 0.000 description 2
- 101000936617 Bacillus velezensis (strain DSM 23117 / BGSC 10A6 / FZB42) Polyketide biosynthesis acyltransferase homolog BaeD Proteins 0.000 description 2
- 208000016444 Benign adult familial myoclonic epilepsy Diseases 0.000 description 2
- 101710201279 Biotin carboxyl carrier protein Proteins 0.000 description 2
- 101710180532 Biotin carboxyl carrier protein of acetyl-CoA carboxylase Proteins 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 2
- 241000193764 Brevibacillus brevis Species 0.000 description 2
- 101100173127 Caldanaerobacter subterraneus subsp. tengcongensis (strain DSM 15242 / JCM 11007 / NBRC 100824 / MB4) fabZ gene Proteins 0.000 description 2
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 2
- 241001142109 Chloroflexi Species 0.000 description 2
- 241000195628 Chlorophyta Species 0.000 description 2
- 108020004705 Codon Proteins 0.000 description 2
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 2
- JDMUPRLRUUMCTL-VIFPVBQESA-N D-pantetheine 4'-phosphate Chemical group OP(=O)(O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCS JDMUPRLRUUMCTL-VIFPVBQESA-N 0.000 description 2
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 2
- 101000836720 Dictyostelium discoideum Aldose reductase A Proteins 0.000 description 2
- 241000701988 Escherichia virus T5 Species 0.000 description 2
- RFSUNEUAIZKAJO-ARQDHWQXSA-N Fructose Chemical compound OC[C@H]1O[C@](O)(CO)[C@@H](O)[C@@H]1O RFSUNEUAIZKAJO-ARQDHWQXSA-N 0.000 description 2
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- 241000223198 Humicola Species 0.000 description 2
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 2
- 241000567769 Isurus oxyrinchus Species 0.000 description 2
- 241000235058 Komagataella pastoris Species 0.000 description 2
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 2
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 2
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 2
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 2
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 2
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 2
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 2
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical group OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 2
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 2
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 2
- 239000004472 Lysine Substances 0.000 description 2
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 2
- 102100025169 Max-binding protein MNT Human genes 0.000 description 2
- 229910019142 PO4 Inorganic materials 0.000 description 2
- 241001520808 Panicum virgatum Species 0.000 description 2
- 241000228150 Penicillium chrysogenum Species 0.000 description 2
- 241000235648 Pichia Species 0.000 description 2
- 241000209504 Poaceae Species 0.000 description 2
- 241000193448 Ruminiclostridium thermocellum Species 0.000 description 2
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 2
- 244000044822 Simmondsia californica Species 0.000 description 2
- 235000004433 Simmondsia californica Nutrition 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 235000019486 Sunflower oil Nutrition 0.000 description 2
- 108010006785 Taq Polymerase Proteins 0.000 description 2
- 244000269722 Thea sinensis Species 0.000 description 2
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- 239000004164 Wax ester Substances 0.000 description 2
- 241000588902 Zymomonas mobilis Species 0.000 description 2
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 2
- 101150008263 accD gene Proteins 0.000 description 2
- 238000004760 accelerator mass spectrometry Methods 0.000 description 2
- 230000002378 acidificating effect Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 238000001261 affinity purification Methods 0.000 description 2
- 235000004279 alanine Nutrition 0.000 description 2
- 125000003158 alcohol group Chemical group 0.000 description 2
- 125000003172 aldehyde group Chemical group 0.000 description 2
- 125000003368 amide group Chemical group 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 2
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 2
- 235000009582 asparagine Nutrition 0.000 description 2
- 229960001230 asparagine Drugs 0.000 description 2
- 235000003704 aspartic acid Nutrition 0.000 description 2
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 2
- 230000002238 attenuated effect Effects 0.000 description 2
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 2
- GUBGYTABKSRVRQ-QUYVBRFLSA-N beta-maltose Chemical compound OC[C@H]1O[C@H](O[C@H]2[C@H](O)[C@@H](O)[C@H](O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@@H]1O GUBGYTABKSRVRQ-QUYVBRFLSA-N 0.000 description 2
- 239000012620 biological material Substances 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 210000004899 c-terminal region Anatomy 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 239000001569 carbon dioxide Substances 0.000 description 2
- 229910002092 carbon dioxide Inorganic materials 0.000 description 2
- 230000021523 carboxylation Effects 0.000 description 2
- 150000001732 carboxylic acid derivatives Chemical class 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 210000000078 claw Anatomy 0.000 description 2
- 239000000356 contaminant Substances 0.000 description 2
- RWGFKTVRMDUZSP-UHFFFAOYSA-N cumene Chemical compound CC(C)C1=CC=CC=C1 RWGFKTVRMDUZSP-UHFFFAOYSA-N 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 239000000645 desinfectant Substances 0.000 description 2
- VILAVOFMIJHSJA-UHFFFAOYSA-N dicarbon monoxide Chemical compound [C]=C=O VILAVOFMIJHSJA-UHFFFAOYSA-N 0.000 description 2
- RXKJFZQQPQGTFL-UHFFFAOYSA-N dihydroxyacetone Chemical compound OCC(=O)CO RXKJFZQQPQGTFL-UHFFFAOYSA-N 0.000 description 2
- 150000002016 disaccharides Chemical class 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 101150078207 fabA gene Proteins 0.000 description 2
- 208000016427 familial adult myoclonic epilepsy Diseases 0.000 description 2
- 239000010408 film Substances 0.000 description 2
- 239000003063 flame retardant Substances 0.000 description 2
- 235000019634 flavors Nutrition 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 239000007789 gas Substances 0.000 description 2
- 239000008246 gaseous mixture Substances 0.000 description 2
- 239000000499 gel Substances 0.000 description 2
- 235000013922 glutamic acid Nutrition 0.000 description 2
- 239000004220 glutamic acid Substances 0.000 description 2
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 2
- RWSXRVCMGQZWBV-WDSKDSINSA-N glutathione Chemical compound OC(=O)[C@@H](N)CCC(=O)N[C@@H](CS)C(=O)NCC(O)=O RWSXRVCMGQZWBV-WDSKDSINSA-N 0.000 description 2
- 150000004676 glycans Chemical class 0.000 description 2
- DCAYPVUWAIABOU-UHFFFAOYSA-N hexadecane Chemical compound CCCCCCCCCCCCCCCC DCAYPVUWAIABOU-UHFFFAOYSA-N 0.000 description 2
- 238000004128 high performance liquid chromatography Methods 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- 229940088597 hormone Drugs 0.000 description 2
- 239000005556 hormone Substances 0.000 description 2
- 230000007062 hydrolysis Effects 0.000 description 2
- 238000006460 hydrolysis reaction Methods 0.000 description 2
- CBFCDTFDPHXCNY-UHFFFAOYSA-N icosane Chemical compound CCCCCCCCCCCCCCCCCCCC CBFCDTFDPHXCNY-UHFFFAOYSA-N 0.000 description 2
- VKOBVWXKNCXXDE-UHFFFAOYSA-N icosanoic acid Chemical compound CCCCCCCCCCCCCCCCCCCC(O)=O VKOBVWXKNCXXDE-UHFFFAOYSA-N 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 239000004434 industrial solvent Substances 0.000 description 2
- 239000003446 ligand Substances 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- IIYFAKIEWZDVMP-UHFFFAOYSA-N linear paraffin C13 Natural products CCCCCCCCCCCCC IIYFAKIEWZDVMP-UHFFFAOYSA-N 0.000 description 2
- 239000006210 lotion Substances 0.000 description 2
- 239000003879 lubricant additive Substances 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 230000002503 metabolic effect Effects 0.000 description 2
- 230000037353 metabolic pathway Effects 0.000 description 2
- 239000000693 micelle Substances 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 239000000178 monomer Substances 0.000 description 2
- 150000002772 monosaccharides Chemical class 0.000 description 2
- 239000003345 natural gas Substances 0.000 description 2
- 229930027945 nicotinamide-adenine dinucleotide Natural products 0.000 description 2
- 229910052757 nitrogen Inorganic materials 0.000 description 2
- 239000002736 nonionic surfactant Substances 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- FWWQKRXKHIRPJY-UHFFFAOYSA-N octadecanal Chemical compound CCCCCCCCCCCCCCCCCC=O FWWQKRXKHIRPJY-UHFFFAOYSA-N 0.000 description 2
- RZJRJXONCZWCBN-UHFFFAOYSA-N octadecane Chemical compound CCCCCCCCCCCCCCCCCC RZJRJXONCZWCBN-UHFFFAOYSA-N 0.000 description 2
- 239000002674 ointment Substances 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 239000012044 organic layer Substances 0.000 description 2
- 235000006408 oxalic acid Nutrition 0.000 description 2
- 230000003647 oxidation Effects 0.000 description 2
- 229910052760 oxygen Inorganic materials 0.000 description 2
- 239000001301 oxygen Substances 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 239000010452 phosphate Substances 0.000 description 2
- 230000029553 photosynthesis Effects 0.000 description 2
- 238000010672 photosynthesis Methods 0.000 description 2
- 239000004033 plastic Substances 0.000 description 2
- 229920003023 plastic Polymers 0.000 description 2
- 229920001282 polysaccharide Polymers 0.000 description 2
- 239000005017 polysaccharide Substances 0.000 description 2
- 239000003755 preservative agent Substances 0.000 description 2
- 230000001737 promoting effect Effects 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- 230000004952 protein activity Effects 0.000 description 2
- 230000006337 proteolytic cleavage Effects 0.000 description 2
- 238000002708 random mutagenesis Methods 0.000 description 2
- 239000011535 reaction buffer Substances 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000007670 refining Methods 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 229930195734 saturated hydrocarbon Natural products 0.000 description 2
- 230000028327 secretion Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 230000009919 sequestration Effects 0.000 description 2
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 239000003549 soybean oil Substances 0.000 description 2
- 235000012424 soybean oil Nutrition 0.000 description 2
- 125000000446 sulfanediyl group Chemical group *S* 0.000 description 2
- 239000002600 sunflower oil Substances 0.000 description 2
- 239000006188 syrup Substances 0.000 description 2
- 235000020357 syrup Nutrition 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 101150087812 tesA gene Proteins 0.000 description 2
- BGHCVCJVXZWKCC-UHFFFAOYSA-N tetradecane Chemical compound CCCCCCCCCCCCCC BGHCVCJVXZWKCC-UHFFFAOYSA-N 0.000 description 2
- 150000007970 thio esters Chemical class 0.000 description 2
- 125000003396 thiol group Chemical group [H]S* 0.000 description 2
- 150000003573 thiols Chemical group 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 108091006107 transcriptional repressors Proteins 0.000 description 2
- 230000032258 transport Effects 0.000 description 2
- 150000003626 triacylglycerols Chemical class 0.000 description 2
- IIYFAKIEWZDVMP-NJFSPNSNSA-N tridecane Chemical group CCCCCCCCCCCC[14CH3] IIYFAKIEWZDVMP-NJFSPNSNSA-N 0.000 description 2
- 230000007306 turnover Effects 0.000 description 2
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Chemical group OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 2
- 241000701447 unidentified baculovirus Species 0.000 description 2
- 239000002966 varnish Substances 0.000 description 2
- 229940118696 vibrio cholerae Drugs 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- 239000011782 vitamin Substances 0.000 description 2
- 235000013343 vitamin Nutrition 0.000 description 2
- 229940088594 vitamin Drugs 0.000 description 2
- 229930003231 vitamin Natural products 0.000 description 2
- 235000019386 wax ester Nutrition 0.000 description 2
- 239000002023 wood Substances 0.000 description 2
- MAFSBQRWNXDTRK-UHFFFAOYSA-N 15-methylheptadecanoic acid Chemical compound CCC(C)CCCCCCCCCCCCCC(O)=O MAFSBQRWNXDTRK-UHFFFAOYSA-N 0.000 description 1
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 1
- IBZUBRHHBQMYKJ-UHFFFAOYSA-N 2-methylicosanoic acid Chemical group CCCCCCCCCCCCCCCCCCC(C)C(O)=O IBZUBRHHBQMYKJ-UHFFFAOYSA-N 0.000 description 1
- YAXXOCZAXKLLCV-UHFFFAOYSA-N 3-dodecyloxolane-2,5-dione Chemical class CCCCCCCCCCCCC1CC(=O)OC1=O YAXXOCZAXKLLCV-UHFFFAOYSA-N 0.000 description 1
- 241000023308 Acca Species 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 1
- 241000588625 Acinetobacter sp. Species 0.000 description 1
- 108700037654 Acyl carrier protein (ACP) Proteins 0.000 description 1
- 102000048456 Acyl carrier protein (ACP) Human genes 0.000 description 1
- 108010001058 Acyl-CoA Dehydrogenase Proteins 0.000 description 1
- 102000002735 Acyl-CoA Dehydrogenase Human genes 0.000 description 1
- 101710104255 Acyl-CoA wax alcohol acyltransferase 2 Proteins 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 241000611270 Alcanivorax borkumensis Species 0.000 description 1
- 241000908790 Alcanivorax jadensis Species 0.000 description 1
- 241000272525 Anas platyrhynchos Species 0.000 description 1
- 241000272517 Anseriformes Species 0.000 description 1
- 241000219195 Arabidopsis thaliana Species 0.000 description 1
- 241000892910 Aspergillus foetidus Species 0.000 description 1
- 241001225321 Aspergillus fumigatus Species 0.000 description 1
- 241000351920 Aspergillus nidulans Species 0.000 description 1
- 241000228245 Aspergillus niger Species 0.000 description 1
- 240000006439 Aspergillus oryzae Species 0.000 description 1
- 235000002247 Aspergillus oryzae Nutrition 0.000 description 1
- 208000000659 Autoimmune lymphoproliferative syndrome Diseases 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 241000193744 Bacillus amyloliquefaciens Species 0.000 description 1
- 241000193752 Bacillus circulans Species 0.000 description 1
- 241000193749 Bacillus coagulans Species 0.000 description 1
- 241000194103 Bacillus pumilus Species 0.000 description 1
- 101100378010 Bacillus subtilis (strain 168) accC1 gene Proteins 0.000 description 1
- 101100322122 Bacillus subtilis (strain 168) accC2 gene Proteins 0.000 description 1
- 241000193388 Bacillus thuringiensis Species 0.000 description 1
- 229920001342 Bakelite® Polymers 0.000 description 1
- 108050003866 Bifunctional ligase/repressor BirA Proteins 0.000 description 1
- 102100033743 Biotin-[acetyl-CoA-carboxylase] ligase Human genes 0.000 description 1
- DKPFZGUDAPQIHT-UHFFFAOYSA-N Butyl acetate Natural products CCCCOC(C)=O DKPFZGUDAPQIHT-UHFFFAOYSA-N 0.000 description 1
- 210000003771 C cell Anatomy 0.000 description 1
- QWOJMRHUQHTCJG-UHFFFAOYSA-N CC([CH2-])=O Chemical group CC([CH2-])=O QWOJMRHUQHTCJG-UHFFFAOYSA-N 0.000 description 1
- 244000025254 Cannabis sativa Species 0.000 description 1
- BVKZGUZCCUSVTD-UHFFFAOYSA-L Carbonate Chemical compound [O-]C([O-])=O BVKZGUZCCUSVTD-UHFFFAOYSA-L 0.000 description 1
- 244000201986 Cassia tora Species 0.000 description 1
- 241000195597 Chlamydomonas reinhardtii Species 0.000 description 1
- 241000191382 Chlorobaculum tepidum Species 0.000 description 1
- 206010008631 Cholera Diseases 0.000 description 1
- 241000251556 Chordata Species 0.000 description 1
- 241000123346 Chrysosporium Species 0.000 description 1
- 241000193401 Clostridium acetobutylicum Species 0.000 description 1
- 241000186566 Clostridium ljungdahlii Species 0.000 description 1
- 241000218631 Coniferophyta Species 0.000 description 1
- 241000186216 Corynebacterium Species 0.000 description 1
- 241001464430 Cyanobacterium Species 0.000 description 1
- 241000159506 Cyanothece Species 0.000 description 1
- PMATZTZNYRCHOR-CGLBZJNRSA-N Cyclosporin A Chemical compound CC[C@@H]1NC(=O)[C@H]([C@H](O)[C@H](C)C\C=C\C)N(C)C(=O)[C@H](C(C)C)N(C)C(=O)[C@H](CC(C)C)N(C)C(=O)[C@H](CC(C)C)N(C)C(=O)[C@@H](C)NC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)N(C)C(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)N(C)C(=O)CN(C)C1=O PMATZTZNYRCHOR-CGLBZJNRSA-N 0.000 description 1
- 229930105110 Cyclosporin A Natural products 0.000 description 1
- 108010036949 Cyclosporine Proteins 0.000 description 1
- GUBGYTABKSRVRQ-CUHNMECISA-N D-Cellobiose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-CUHNMECISA-N 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- YAHZABJORDUQGO-NQXXGFSBSA-N D-ribulose 1,5-bisphosphate Chemical compound OP(=O)(O)OC[C@@H](O)[C@@H](O)C(=O)COP(O)(O)=O YAHZABJORDUQGO-NQXXGFSBSA-N 0.000 description 1
- 101150042222 DGAT1 gene Proteins 0.000 description 1
- 230000033616 DNA repair Effects 0.000 description 1
- 230000004568 DNA-binding Effects 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 241000350052 Daniellia ogea Species 0.000 description 1
- 108010001348 Diacylglycerol O-acyltransferase Proteins 0.000 description 1
- 102000002148 Diacylglycerol O-acyltransferase Human genes 0.000 description 1
- 101100256850 Drosophila melanogaster EndoA gene Proteins 0.000 description 1
- 101100533511 Drosophila melanogaster SIFaR gene Proteins 0.000 description 1
- 108010013369 Enteropeptidase Proteins 0.000 description 1
- 102100029727 Enteropeptidase Human genes 0.000 description 1
- 241000588722 Escherichia Species 0.000 description 1
- 241001522878 Escherichia coli B Species 0.000 description 1
- 241000644323 Escherichia coli C Species 0.000 description 1
- 241000901842 Escherichia coli W Species 0.000 description 1
- 108090000371 Esterases Proteins 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 108010074860 Factor Xa Proteins 0.000 description 1
- 108010039731 Fatty Acid Synthases Proteins 0.000 description 1
- 229930091371 Fructose Natural products 0.000 description 1
- 239000005715 Fructose Substances 0.000 description 1
- 108010010803 Gelatin Proteins 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- 241000193385 Geobacillus stearothermophilus Species 0.000 description 1
- 108010024636 Glutathione Proteins 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- UYTPUPDQBNUYGX-UHFFFAOYSA-N Guanine Natural products O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 1
- 101100135734 Haloferax mediterranei (strain ATCC 33500 / DSM 1411 / JCM 8866 / NBRC 14739 / NCIMB 2177 / R-4) pccB gene Proteins 0.000 description 1
- 244000158996 Hedysarum boreale Species 0.000 description 1
- 229920002488 Hemicellulose Polymers 0.000 description 1
- 241001480714 Humicola insolens Species 0.000 description 1
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 1
- 108020005350 Initiator Codon Proteins 0.000 description 1
- 241000235649 Kluyveromyces Species 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- 235000019738 Limestone Nutrition 0.000 description 1
- 241000206589 Marinobacter Species 0.000 description 1
- 241001074116 Miscanthus x giganteus Species 0.000 description 1
- 101100000438 Mus musculus Acacb gene Proteins 0.000 description 1
- 108010021466 Mutant Proteins Proteins 0.000 description 1
- 102000008300 Mutant Proteins Human genes 0.000 description 1
- TUNFSRHWOTWDNC-UHFFFAOYSA-N Myristic acid Natural products CCCCCCCCCCCCCC(O)=O TUNFSRHWOTWDNC-UHFFFAOYSA-N 0.000 description 1
- 241000221960 Neurospora Species 0.000 description 1
- 241000192656 Nostoc Species 0.000 description 1
- 235000010676 Ocimum basilicum Nutrition 0.000 description 1
- 240000007926 Ocimum gratissimum Species 0.000 description 1
- 241000237502 Ostreidae Species 0.000 description 1
- 241000228143 Penicillium Species 0.000 description 1
- 239000001888 Peptone Substances 0.000 description 1
- 108010080698 Peptones Proteins 0.000 description 1
- 235000004347 Perilla Nutrition 0.000 description 1
- 244000124853 Perilla frutescens Species 0.000 description 1
- 241000222385 Phanerochaete Species 0.000 description 1
- 244000046052 Phaseolus vulgaris Species 0.000 description 1
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 1
- 108091000041 Phosphoenolpyruvate Carboxylase Proteins 0.000 description 1
- 108090001050 Phosphoric Diester Hydrolases Proteins 0.000 description 1
- 102000004861 Phosphoric Diester Hydrolases Human genes 0.000 description 1
- 239000004743 Polypropylene Substances 0.000 description 1
- 101710091608 Probable diacyglycerol O-acyltransferase tgs2 Proteins 0.000 description 1
- 241000192138 Prochlorococcus Species 0.000 description 1
- 241000611429 Prochlorococcus marinus subsp. pastoris str. CCMP1986 Species 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 241000588769 Proteus <enterobacteria> Species 0.000 description 1
- 241000589517 Pseudomonas aeruginosa Species 0.000 description 1
- 241000589540 Pseudomonas fluorescens Species 0.000 description 1
- 235000019484 Rapeseed oil Nutrition 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 241000235402 Rhizomucor Species 0.000 description 1
- 241000235403 Rhizomucor miehei Species 0.000 description 1
- 241000191025 Rhodobacter Species 0.000 description 1
- 241000191023 Rhodobacter capsulatus Species 0.000 description 1
- 241000316848 Rhodococcus <scale insect> Species 0.000 description 1
- 241001524101 Rhodococcus opacus Species 0.000 description 1
- 241000190932 Rhodopseudomonas Species 0.000 description 1
- 241000131970 Rhodospirillaceae Species 0.000 description 1
- 241000190984 Rhodospirillum rubrum Species 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 241000235088 Saccharomyces sp. Species 0.000 description 1
- 241000235343 Saccharomycetales Species 0.000 description 1
- 241001466077 Salina Species 0.000 description 1
- 241000293869 Salmonella enterica subsp. enterica serovar Typhimurium Species 0.000 description 1
- 241000235346 Schizosaccharomyces Species 0.000 description 1
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 1
- 241001047198 Scomberomorus semifasciatus Species 0.000 description 1
- 241000287219 Serinus canaria Species 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 244000061458 Solanum melongena Species 0.000 description 1
- 235000002597 Solanum melongena Nutrition 0.000 description 1
- 235000021355 Stearic acid Nutrition 0.000 description 1
- 241000187398 Streptomyces lividans Species 0.000 description 1
- 241001468239 Streptomyces murinus Species 0.000 description 1
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- 241001453296 Synechococcus elongatus Species 0.000 description 1
- 241000192581 Synechocystis sp. Species 0.000 description 1
- 241000897276 Termes Species 0.000 description 1
- 108020005038 Terminator Codon Proteins 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- 241001313706 Thermosynechococcus Species 0.000 description 1
- 108090000190 Thrombin Proteins 0.000 description 1
- 241000533793 Tipuana tipu Species 0.000 description 1
- RTAQQCXQSZGOHL-UHFFFAOYSA-N Titanium Chemical compound [Ti] RTAQQCXQSZGOHL-UHFFFAOYSA-N 0.000 description 1
- 241000222354 Trametes Species 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 101710195626 Transcriptional activator protein Proteins 0.000 description 1
- 241000223259 Trichoderma Species 0.000 description 1
- 241000378866 Trichoderma koningii Species 0.000 description 1
- 241000223262 Trichoderma longibrachiatum Species 0.000 description 1
- 241000499912 Trichoderma reesei Species 0.000 description 1
- 241000223261 Trichoderma viride Species 0.000 description 1
- DRQXUCVJDCRJDB-UHFFFAOYSA-N Turanose Natural products OC1C(CO)OC(O)(CO)C1OC1C(O)C(O)C(O)C(CO)O1 DRQXUCVJDCRJDB-UHFFFAOYSA-N 0.000 description 1
- 108020000999 Viral RNA Proteins 0.000 description 1
- 241000235013 Yarrowia Species 0.000 description 1
- 235000007244 Zea mays Nutrition 0.000 description 1
- 241000588901 Zymomonas Species 0.000 description 1
- PTKRUDMLGIIORX-ITGWJZMWSA-N [[(2r,3r,4r,5r)-5-(6-aminopurin-9-yl)-3-hydroxy-4-phosphonooxyoxolan-2-yl]methoxy-hydroxyphosphoryl] [(2r,3s,4r,5r)-5-(3-carbamoyl-4h-pyridin-1-yl)-3,4-dihydroxyoxolan-2-yl]methyl hydrogen phosphate;cyclohexanamine Chemical compound NC1CCCCC1.NC1CCCCC1.NC1CCCCC1.NC1CCCCC1.C1=CCC(C(=O)N)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OC[C@@H]2[C@H]([C@@H](OP(O)(O)=O)[C@@H](O2)N2C3=NC=NC(N)=C3N=C2)O)O1 PTKRUDMLGIIORX-ITGWJZMWSA-N 0.000 description 1
- 101150057540 aar gene Proteins 0.000 description 1
- 101150046124 accA gene Proteins 0.000 description 1
- 101150013885 accB gene Proteins 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 150000001242 acetic acid derivatives Chemical class 0.000 description 1
- DPXJVFZANSGRMM-UHFFFAOYSA-N acetic acid;2,3,4,5,6-pentahydroxyhexanal;sodium Chemical compound [Na].CC(O)=O.OCC(O)C(O)C(O)C(O)C=O DPXJVFZANSGRMM-UHFFFAOYSA-N 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 101150023061 acpP gene Proteins 0.000 description 1
- 108700021044 acyl-ACP thioesterase Proteins 0.000 description 1
- 108010064926 acyl-CoA carboxylase Proteins 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000005273 aeration Methods 0.000 description 1
- 239000003513 alkali Substances 0.000 description 1
- 125000002947 alkylene group Chemical group 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- WQZGKKKJIJFFOK-PHYPRBDBSA-N alpha-D-galactose Chemical compound OC[C@H]1O[C@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-PHYPRBDBSA-N 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 235000020054 awamori Nutrition 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- 229940054340 bacillus coagulans Drugs 0.000 description 1
- 229940097012 bacillus thuringiensis Drugs 0.000 description 1
- 239000004637 bakelite Substances 0.000 description 1
- 108010051210 beta-Fructofuranosidase Proteins 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 230000008238 biochemical pathway Effects 0.000 description 1
- 238000005842 biochemical reaction Methods 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 229910021538 borax Inorganic materials 0.000 description 1
- 235000012467 brownies Nutrition 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 229940041514 candida albicans extract Drugs 0.000 description 1
- 150000001721 carbon Chemical group 0.000 description 1
- 150000001722 carbon compounds Chemical class 0.000 description 1
- 239000011203 carbon fibre reinforced carbon Substances 0.000 description 1
- 230000006860 carbon metabolism Effects 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 239000001768 carboxy methyl cellulose Substances 0.000 description 1
- 150000001735 carboxylic acids Chemical class 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 230000006037 cell lysis Effects 0.000 description 1
- 210000003850 cellular structure Anatomy 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 150000001793 charged compounds Chemical class 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 239000003638 chemical reducing agent Substances 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 229960005091 chloramphenicol Drugs 0.000 description 1
- YACLQRRMGMJLJV-UHFFFAOYSA-N chloroprene Chemical compound ClC(=C)C=C YACLQRRMGMJLJV-UHFFFAOYSA-N 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 229960001265 ciclosporin Drugs 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 238000012411 cloning technique Methods 0.000 description 1
- 230000004186 co-expression Effects 0.000 description 1
- 239000003245 coal Substances 0.000 description 1
- 239000003034 coal gas Substances 0.000 description 1
- 230000000112 colonic effect Effects 0.000 description 1
- 238000002485 combustion reaction Methods 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000005336 cracking Methods 0.000 description 1
- 235000021438 curry Nutrition 0.000 description 1
- 125000004093 cyano group Chemical group *C#N 0.000 description 1
- 150000001924 cycloalkanes Chemical class 0.000 description 1
- 229930182912 cyclosporin Natural products 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 1
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 description 1
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 description 1
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 1
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 description 1
- 238000013016 damping Methods 0.000 description 1
- 230000006324 decarbonylation Effects 0.000 description 1
- 238000006606 decarbonylation reaction Methods 0.000 description 1
- 238000006114 decarboxylation reaction Methods 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 150000001982 diacylglycerols Chemical class 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- POULHZVOKOAJMA-UHFFFAOYSA-N dodecanoic acid Chemical compound CCCCCCCCCCCC(O)=O POULHZVOKOAJMA-UHFFFAOYSA-N 0.000 description 1
- 239000010791 domestic waste Substances 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 239000003974 emollient agent Substances 0.000 description 1
- 150000002081 enamines Chemical class 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 150000002118 epoxides Chemical class 0.000 description 1
- 239000003797 essential amino acid Substances 0.000 description 1
- 235000020776 essential amino acid Nutrition 0.000 description 1
- 108010083294 ethanol acyltransferase Proteins 0.000 description 1
- 108010052305 exodeoxyribonuclease III Proteins 0.000 description 1
- 239000002360 explosive Substances 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 101150015067 fabB gene Proteins 0.000 description 1
- 101150084167 fabZ gene Proteins 0.000 description 1
- 230000004133 fatty acid degradation Effects 0.000 description 1
- 230000004129 fatty acid metabolism Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 210000003608 fece Anatomy 0.000 description 1
- 230000008713 feedback mechanism Effects 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- GNBHRKFJIUUOQI-UHFFFAOYSA-N fluorescein Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 GNBHRKFJIUUOQI-UHFFFAOYSA-N 0.000 description 1
- 235000013355 food flavoring agent Nutrition 0.000 description 1
- 239000010794 food waste Substances 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 239000002803 fossil fuel Substances 0.000 description 1
- 238000005194 fractionation Methods 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 235000011389 fruit/vegetable juice Nutrition 0.000 description 1
- 239000000295 fuel oil Substances 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 235000021255 galacto-oligosaccharides Nutrition 0.000 description 1
- 150000003271 galactooligosaccharides Chemical class 0.000 description 1
- 229930182830 galactose Natural products 0.000 description 1
- ZXQYGBMAQZUVMI-GCMPRSNUSA-N gamma-cyhalothrin Chemical compound CC1(C)[C@@H](\C=C(/Cl)C(F)(F)F)[C@H]1C(=O)O[C@H](C#N)C1=CC=CC(OC=2C=CC=CC=2)=C1 ZXQYGBMAQZUVMI-GCMPRSNUSA-N 0.000 description 1
- 238000002290 gas chromatography-mass spectrometry Methods 0.000 description 1
- 239000008273 gelatin Substances 0.000 description 1
- 229920000159 gelatin Polymers 0.000 description 1
- 235000019322 gelatine Nutrition 0.000 description 1
- 235000011852 gelatine desserts Nutrition 0.000 description 1
- 238000003209 gene knockout Methods 0.000 description 1
- 238000012239 gene modification Methods 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 230000005017 genetic modification Effects 0.000 description 1
- 230000007614 genetic variation Effects 0.000 description 1
- 235000013617 genetically modified food Nutrition 0.000 description 1
- 125000002791 glucosyl group Chemical group C1([C@H](O)[C@@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 229960003180 glutathione Drugs 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- IVSXFFJGASXYCL-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=NC=N[C]21 IVSXFFJGASXYCL-UHFFFAOYSA-N 0.000 description 1
- 239000011121 hardwood Substances 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 125000000623 heterocyclic group Chemical group 0.000 description 1
- YITMLDIGEJSENC-UHFFFAOYSA-N hexadec-2-ene Chemical compound CCCCCCCCCCCCCC=CC YITMLDIGEJSENC-UHFFFAOYSA-N 0.000 description 1
- FUZZWVXGSFPDMH-UHFFFAOYSA-M hexanoate Chemical compound CCCCCC([O-])=O FUZZWVXGSFPDMH-UHFFFAOYSA-M 0.000 description 1
- 230000013632 homeostatic process Effects 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 101150020087 ilvG gene Proteins 0.000 description 1
- 150000002466 imines Chemical class 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000001573 invertase Substances 0.000 description 1
- 235000011073 invertase Nutrition 0.000 description 1
- ZOCYQVNGROEVLU-UHFFFAOYSA-N isopentadecanoic acid Chemical compound CC(C)CCCCCCCCCCCC(O)=O ZOCYQVNGROEVLU-UHFFFAOYSA-N 0.000 description 1
- 125000001449 isopropyl group Chemical group [H]C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 1
- 238000002307 isotope ratio mass spectrometry Methods 0.000 description 1
- 230000000155 isotopic effect Effects 0.000 description 1
- 229940119170 jojoba wax Drugs 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 230000003907 kidney function Effects 0.000 description 1
- 150000003903 lactic acid esters Chemical class 0.000 description 1
- 238000011031 large-scale manufacturing process Methods 0.000 description 1
- 239000002029 lignocellulosic biomass Substances 0.000 description 1
- 239000006028 limestone Substances 0.000 description 1
- 239000010871 livestock manure Substances 0.000 description 1
- 150000004668 long chain fatty acids Chemical class 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000013028 medium composition Substances 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 229920000609 methyl cellulose Polymers 0.000 description 1
- 150000004702 methyl esters Chemical class 0.000 description 1
- 239000001923 methylcellulose Substances 0.000 description 1
- 239000004530 micro-emulsion Substances 0.000 description 1
- 235000013379 molasses Nutrition 0.000 description 1
- 235000021281 monounsaturated fatty acids Nutrition 0.000 description 1
- 239000010813 municipal solid waste Substances 0.000 description 1
- 239000003471 mutagenic agent Substances 0.000 description 1
- BOPGDPNILDQYTO-NNYOXOHSSA-N nicotinamide-adenine dinucleotide Chemical compound C1=CCC(C(=O)N)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OC[C@@H]2[C@H]([C@@H](O)[C@@H](O2)N2C3=NC=NC(N)=C3N=C2)O)O1 BOPGDPNILDQYTO-NNYOXOHSSA-N 0.000 description 1
- KUQIWULJSBTNPX-UHFFFAOYSA-N octadec-2-ene Chemical compound CCCCCCCCCCCCCCCC=CC KUQIWULJSBTNPX-UHFFFAOYSA-N 0.000 description 1
- OQCDKBAXFALNLD-UHFFFAOYSA-N octadecanoic acid Natural products CCCCCCCC(C)CCCCCCCCC(O)=O OQCDKBAXFALNLD-UHFFFAOYSA-N 0.000 description 1
- 229920001542 oligosaccharide Polymers 0.000 description 1
- 150000002482 oligosaccharides Chemical class 0.000 description 1
- 235000021354 omega 7 monounsaturated fatty acids Nutrition 0.000 description 1
- 239000011368 organic material Substances 0.000 description 1
- 239000012074 organic phase Substances 0.000 description 1
- 235000020636 oyster Nutrition 0.000 description 1
- 239000003346 palm kernel oil Substances 0.000 description 1
- 235000019865 palm kernel oil Nutrition 0.000 description 1
- 239000012188 paraffin wax Substances 0.000 description 1
- 235000019809 paraffin wax Nutrition 0.000 description 1
- 239000001814 pectin Substances 0.000 description 1
- 235000010987 pectin Nutrition 0.000 description 1
- 229920001277 pectin Polymers 0.000 description 1
- 150000002972 pentoses Chemical class 0.000 description 1
- 235000019319 peptone Nutrition 0.000 description 1
- 239000003348 petrochemical agent Substances 0.000 description 1
- 235000019271 petrolatum Nutrition 0.000 description 1
- 239000013520 petroleum-based product Substances 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 230000000243 photosynthetic effect Effects 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 229920000098 polyolefin Polymers 0.000 description 1
- 229920001155 polypropylene Polymers 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 150000003138 primary alcohols Chemical class 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 150000003212 purines Chemical class 0.000 description 1
- 150000003230 pyrimidines Chemical class 0.000 description 1
- 239000010499 rapseed oil Substances 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 238000002407 reforming Methods 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 239000007320 rich medium Substances 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 235000003441 saturated fatty acids Nutrition 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000005204 segregation Methods 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 239000010865 sewage Substances 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 239000000344 soap Substances 0.000 description 1
- 235000019812 sodium carboxymethyl cellulose Nutrition 0.000 description 1
- 229920001027 sodium carboxymethylcellulose Polymers 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 239000001488 sodium phosphate Substances 0.000 description 1
- 229910000162 sodium phosphate Inorganic materials 0.000 description 1
- 239000004328 sodium tetraborate Substances 0.000 description 1
- 235000010339 sodium tetraborate Nutrition 0.000 description 1
- 239000010421 standard material Substances 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 239000010902 straw Substances 0.000 description 1
- 150000003900 succinic acid esters Chemical class 0.000 description 1
- 125000000185 sucrose group Chemical group 0.000 description 1
- GPTONYMQFTZPKC-UHFFFAOYSA-N sulfamethoxydiazine Chemical compound N1=CC(OC)=CN=C1NS(=O)(=O)C1=CC=C(N)C=C1 GPTONYMQFTZPKC-UHFFFAOYSA-N 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 239000011593 sulfur Substances 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 239000003760 tallow Substances 0.000 description 1
- 239000013076 target substance Substances 0.000 description 1
- 150000003512 tertiary amines Chemical class 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 238000004809 thin layer chromatography Methods 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 1
- 229960004072 thrombin Drugs 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 229910052719 titanium Inorganic materials 0.000 description 1
- 239000010936 titanium Substances 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 231100000041 toxicology testing Toxicity 0.000 description 1
- 238000005924 transacylation reaction Methods 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 239000001226 triphosphate Substances 0.000 description 1
- 235000011178 triphosphate Nutrition 0.000 description 1
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 1
- RULSWEULPANCDV-PIXUTMIVSA-N turanose Chemical compound OC[C@@H](O)[C@@H](O)[C@@H](C(=O)CO)O[C@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O RULSWEULPANCDV-PIXUTMIVSA-N 0.000 description 1
- 229930195735 unsaturated hydrocarbon Natural products 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 235000015112 vegetable and seed oil Nutrition 0.000 description 1
- 239000005418 vegetable material Substances 0.000 description 1
- 239000008158 vegetable oil Substances 0.000 description 1
- 238000010792 warming Methods 0.000 description 1
- 125000005023 xylyl group Chemical group 0.000 description 1
- 239000012138 yeast extract Substances 0.000 description 1
- 239000004711 α-olefin Substances 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
- C12P7/6436—Fatty acid esters
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/24—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Enterobacteriaceae (F), e.g. Citrobacter, Serratia, Proteus, Providencia, Morganella, Yersinia
- C07K14/245—Escherichia (G)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/001—Oxidoreductases (1.) acting on the CH-CH group of donors (1.3)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1288—Transferases for other substituted phosphate groups (2.7.8)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P5/00—Preparation of hydrocarbons or halogenated hydrocarbons
- C12P5/02—Preparation of hydrocarbons or halogenated hydrocarbons acyclic
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/02—Preparation of oxygen-containing organic compounds containing a hydroxy group
- C12P7/04—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/62—Carboxylic acid esters
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
- C12P7/6409—Fatty acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
- C12P7/6436—Fatty acid esters
- C12P7/649—Biodiesel, i.e. fatty acid alkyl esters
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y102/00—Oxidoreductases acting on the aldehyde or oxo group of donors (1.2)
- C12Y102/01—Oxidoreductases acting on the aldehyde or oxo group of donors (1.2) with NAD+ or NADP+ as acceptor (1.2.1)
- C12Y102/0108—Long-chain acyl-[acyl-carrier-protein] reductase (1.2.1.80)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y102/00—Oxidoreductases acting on the aldehyde or oxo group of donors (1.2)
- C12Y102/99—Oxidoreductases acting on the aldehyde or oxo group of donors (1.2) with other acceptors (1.2.99)
- C12Y102/99006—Carboxylate reductase (1.2.99.6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y103/00—Oxidoreductases acting on the CH-CH group of donors (1.3)
- C12Y103/01—Oxidoreductases acting on the CH-CH group of donors (1.3) with NAD+ or NADP+ as acceptor (1.3.1)
- C12Y103/01009—Enoyl-[acyl-carrier-protein] reductase (NADH) (1.3.1.9)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y207/00—Transferases transferring phosphorus-containing groups (2.7)
- C12Y207/08—Transferases for other substituted phosphate groups (2.7.8)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y301/00—Hydrolases acting on ester bonds (3.1)
- C12Y301/02—Thioester hydrolases (3.1.2)
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E50/00—Technologies for the production of fuel of non-fossil origin
- Y02E50/10—Biofuels, e.g. bio-diesel
-
- Y02E50/13—
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Medicinal Chemistry (AREA)
- Biomedical Technology (AREA)
- Oil, Petroleum & Natural Gas (AREA)
- Biophysics (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
Abstract
본 발명은 지방산 유도체의 생성을 유도하는 아실기 운반 단백질(ACP)의 증가된 발현을 나타내는 재조합 미생물에 관한 것이다. 또한, 본 발명은 지방산 유도체 및 관련 조성물을 생성하기 위해 발효 배양에서 재조합 미생물을 이용하는 방법들에 관한 것이다.
Description
본 출원은 2012년 12월 12일에 출원된 미국 가출원 제 61/736,428호의 이익을 주장하며, 이는 본 명세서에서 그 전문이 인용참조된다.
본 출원은 ASCII 포맷으로 전자 제출된 서열 목록을 포함하며, 이는 본 명세서에서 그 전문이 인용참조된다. 2013년 11월 1일에 작성된 상기 ASCII 복사본(copy)은 LS00045PCT_SL.txt의 파일명 및 232,659 바이트의 크기를 갖는다.
본 발명은 지방산 유도체들의 생산을 유도하는 아실기 운반 단백질(acyl carrier protein: ACP)의 증가된 발현을 나타내는 재조합 미생물(recombinant microorganisms)에 관한 것이다. 또한, 본 발명은 지방산 유도체들 및 관련 조성물들을 생산하기 위하여 발효 배양(fermentation culture)에서 재조합 미생물을 이용하는 방법들에 관한 것이다.
지방족 알데히드들, 지방족 알코올들, 탄화수소들(예를 들어, 알칸들 및 올레핀들), 지방족 에스테르들(예를 들어, 왁스들, 지방산 에스테르들, 지방족 에스테르들), 및 케톤들과 같은 지방산 유도체들은 공업용 화학물질 및 연료의 중요한 카테고리에 빌딩 블록(building block)을 제공한다. 이 화합물들은 계면활성제, 윤활제, 용제, 유화제, 연화제, 증점제, 향미제(flavors), 향료(fragrances) 및 연료로서 포함되는 다수의 산업적 적용예들을 갖는다. 예를 들어, 바이오디젤, 대체 연료가 주로 지방산 메틸 에스테르(FAME), 지방산 에틸 에스테르(FAEE) 등과 같이 에스테르들로 만들어진다. 일부 저분자량 에스테르들은 기분 좋은 냄새와 함께 휘발하며, 향료 및 방향제의 생산에 사용된다. 또한, 지방족 에스테르들은 래커(lacquers), 페인트 및 바니시(varnishes)를 위한 용제로서; 수지 및 플라스틱의 연화제로서, 가소제로서, 난연제로서, 가솔린 및 오일의 첨가제로서, 및 중합체, 필름, 직물, 염료, 및 약제의 제조에 사용된다.
실제로, 대부분의 지방족 알코올들은 왁스들에서 발견되며, 이들은 박테리아, 식물, 및 동물에 의해 생성된 지방족 알코올들 및 지방산들을 갖는 에스테르들이다. 산업적 설정에서, 지방족 알코올들은 많은 상업적인 용도를 갖는다. 더 짧은 사슬의 지방족 알코올들은 유화제, 연화제 및 증점제로서 화장품 및 식품 산업들에 사용된다. 이들의 양친매성(amphiphilic) 성질로 인해, 지방족 알코올들은 비이온성 계면활성제처럼 거동하고, 이는 화장품 및 세제와 같은 개인 케어 용품 및 가정 용품에 유용하다. 또한, 지방족 알코올들은 왁스, 검(gums), 수지, 약제학적 연고 및 로션, 윤활유 첨가제, 직물 정전기 방지제 및 마무리제, 가소제, 화장품, 공업 용제 및 지방용 용제에 사용된다. 지방족 알코올들은 8 내지 22 개의 탄소 원자들의 사슬 길이를 갖는 지방성(aliphatic) 알코올들이다. 통상적으로, 지방족 알코올들은 짝수의 탄소 원자들 및 말단 탄소에 부착되는 단일 알코올기(OH)를 가지며, 이때 일부는 불포화되고, 일부는 분지형이다. 또한, 지방족 알코올들은 공업 화학에 폭넓게 사용된다.
지방족 알데히드들은 공업용 특수 화학물질을 생산하는 데 사용될 수 있다. 예를 들어, 알데히드들은 통상적으로 중합체, 수지, 염료, 착향료, 가소제, 향수, 및 약제를 생산하는 데 사용된다. 또한, 알데히드들은 용제, 보존제 및 소독제로서 사용될 수 있다. 비타민 및 호르몬과 같은 몇몇 천연 및 합성 화합물들이 알데히드들이며, 많은 당류가 알데히드기들을 함유한다. 지방족 알데히드들은 화학적 또는 효소적 환원에 의해 지방족 알코올들로 전환될 수 있다.
역사적으로, 공업용 화학물질 및 연료는 석유화학 제품으로부터 생산되었다. 석유화학 원료들은 지방산, 지방족 에스테르, 지방족 알코올, 지방족 알데히드, 케톤, 탄화수소 등이다. 공업용 화학물질 및 연료 제품에 사용하기 위하여 석유를 탐사, 추출, 수송 및 정제하는 데 내재하는 어려움으로 인해, 더 비용 효율적이고 환경 친화적인 원료를 생산하는 대체 방식이 요구된다. 이러한 한가지 대안적인 방식은 발효성 탄소원(fermentable carbon source)들로부터의 생물학적으로 유래된 화학물질 및 연료의 생산이다. 하지만, 생물학적으로 유래된 화학물질 및 연료가 상업적으로 실행가능한 방식으로 발효성 당 및 바이오매스로부터 생산되기 위해서는, 기존 공정들이 제품의 효율적인 전환 및 회수(recovery)를 위해 지속적으로 최적화되어야 한다. 산업에 있어서 주목할만한 성공들이 있었지만, 생물학적으로 유래된 화학물질 및 연료가 더 폭넓게 이용가능한 대체물이 되기 위해 관련 공정들의 추가 개선을 위한 필요성이 여전히 남아 있다. 개선을 위한 영역은 생산 공정의 효율 및 생성물 수율(product yield)을 포함한다. 본 발명은 이러한 필요성을 다루고 있다.
본 발명은 지방산 유도체 조성물들을 생산하기 위해서 지방산 생합성에 이용가능한 아실기 운반 단백질(ACP)의 양의 증가를 유도하는 데 효과적인 벡터 및 균주 변형(strain modification)들을 이용하는 신규한 재조합 숙주 세포(recombinant host cell)들을 제공한다. 또한, 본 발명은 재조합 숙주 세포들을 배양하고 배양 배지로부터 지방산 유도체 조성물들을 수집함으로써 지방산 유도체 조성물들을 만드는 방법들을 제공한다. 지방산 유도체 조성물들의 예시들은 지방산, 지방족 에스테르, 지방족 알코올, 지방족 알데히드, 케톤, 알칸, 알켄, 올레핀, 및/또는 그 조합들을 포괄하는 조성물들을 포함하며, 이에 제한되지는 않는다.
본 발명의 일 실시형태는 이종(heterologous) 아실기 운반 단백질(ACP)을 인코딩(encode)하는 폴리뉴클레오티드 서열, 및 이종 지방산 유도체 생합성 단백질을 인코딩하는 폴리뉴클레오티드 서열을 포함하는 재조합 숙주 세포를 제공하며, 재조합 숙주 세포는 지방산 유도체 조성물을 생성한다. 일 특정 실시형태에서, 재조합 숙주 세포는 폴리뉴클레오티드 서열들을 과발현(overexpress)시키는 데 효과적인 조건들 하에서 탄소원을 함유한 배지에서 배양되는 경우, 재조합 숙주 세포와 동일한 조건들 하에 번식되는 대응하는 야생형 숙주 세포에 비해 더 높은 역가(titer), 더 높은 수율, 및/또는 더 높은 생산성으로 지방산 유도체 조성물을 생성한다. 따라서, 재조합 숙주 세포는 대응하는 야생형 숙주 세포보다 더 높은 역가, 더 높은 수율, 및/또는 더 높은 생산성에서 지방산 유도체를 포함하는 지방산 유도체 조성물들을 생성한다. 지방산 유도체는 지방산, 지방족 알코올, 지방족 에스테르, 지방족 알데히드, 알칸, 알켄, 올레핀, 및/또는 케톤을 포함하며, 이에 제한되지는 않는다. 일 실시예에서, 재조합 숙주 세포는 이종 아실기 운반 단백질(ACP)을 인코딩하는 폴리뉴클레오티드 서열, 및 티오에스테라제 활성을 갖는 이종 지방산 유도체 생합성 단백질을 인코딩하는 폴리뉴클레오티드 서열을 포함하며, 재조합 숙주 세포는 지방산을 포함하는 지방산 유도체 조성물을 생성한다. 또 다른 실시예에서, 재조합 숙주 세포는 이종 아실기 운반 단백질(ACP)을 인코딩하는 폴리뉴클레오티드 서열, 티오에스테라제 활성을 갖는 이종 지방산 유도체 생합성 단백질을 인코딩하는 폴리뉴클레오티드 서열, 및 카르복실산 레덕타제(CAR) 활성을 갖는 단백질을 포함하며, 재조합 숙주 세포는 지방족 알코올을 포함하는 지방산 유도체 조성물을 생성한다. 또 다른 실시예에서, 재조합 숙주 세포는 이종 아실기 운반 단백질(ACP)을 인코딩하는 폴리뉴클레오티드 서열, 및 아실-ACP 레덕타제(AAR) 활성을 갖는 이종 지방산 유도체 생합성 단백질을 인코딩하는 폴리뉴클레오티드 서열을 포함하며, 재조합 숙주 세포는 지방족 알코올을 포함하는 지방산 유도체 조성물을 생성한다. 또 다른 실시예에서, 재조합 숙주 세포는 이종 아실기 운반 단백질(ACP)을 인코딩하는 폴리뉴클레오티드 서열, 및 에스테르 신타제 활성을 갖는 이종 지방산 유도체 생합성 단백질을 인코딩하는 폴리뉴클레오티드 서열을 포함하며, 재조합 숙주 세포는 지방족 에스테르를 포함하는 지방산 유도체 조성물을 생성한다.
본 발명의 또 다른 실시형태는 이종 아실기 운반 단백질(ACP)을 인코딩하는 폴리뉴클레오티드 서열, 및 이종 지방산 유도체 생합성 단백질을 인코딩하는 폴리뉴클레오티드 서열을 포함하는 재조합 숙주 세포를 제공하며, 재조합 숙주 세포는 대응하는 야생형 숙주 세포에 비해 적어도 약 10 % 내지 적어도 약 90 % 크고 더 높은 역가에서 지방산 유도체 조성물을 생성한다. 지방산 유도체 조성물은 지방산, 지방족 알코올, 지방족 에스테르, 지방족 알데히드, 알칸, 알켄, 올레핀, 및/또는 케톤을 갖는 조성물을 포함하며, 이에 제한되지는 않는다.
본 발명의 또 다른 실시형태는 이종 아실기 운반 단백질(ACP)을 인코딩하는 폴리뉴클레오티드 서열, 및 이종 지방산 유도체 생합성 단백질을 인코딩하는 폴리뉴클레오티드 서열을 포함하는 재조합 숙주 세포를 제공하며, 재조합 숙주 세포는 대응하는 야생형 숙주 세포에 비해 적어도 약 5 % 내지 적어도 약 80 % 더 큰 수율에서 지방산 유도체 조성물을 생성한다. 지방산 유도체 조성물은 지방산, 지방족 알코올, 지방족 에스테르, 지방족 알데히드, 알칸, 알켄, 올레핀, 및/또는 케톤을 갖는 조성물을 포함하며, 이에 제한되지는 않는다.
본 발명의 또 다른 실시형태는 이종 아실기 운반 단백질(ACP)을 인코딩하는 폴리뉴클레오티드 서열, 및 이종 지방산 유도체 생합성 단백질을 인코딩하는 폴리뉴클레오티드 서열을 포함하는 재조합 숙주 세포를 제공하며, 재조합 숙주 세포는 약 100 mg/L 내지 약 300 g/L의 역가; 및/또는 약 1 g/L 내지 약 250 g/L의 역가; 및/또는 적어도 약 30 g/L 또는 약 35 g/L 또는 약 40 g/L 또는 약 45 g/L 또는 약 50 g/L 또는 약 55 g/L 또는 약 60 g/L 또는 약 65 g/L 또는 약 70 g/L 또는 약 75 g/L 또는 약 80 g/L 또는 약 85 g/L 또는 약 90 g/L 또는 약 95 g/L 또는 약 100 g/L 또는 약 150 g/L 또는 약 200 g/L의 역가에서 지방산 유도체 조성물을 생성한다. 또한, 지방산 유도체 조성물은 약 0.7 mg/L/hr 내지 약 2.5 g/L/hr의 생산성에서 생성된다.
본 발명의 또 다른 실시형태는 이종 아실기 운반 단백질(ACP)을 인코딩하는 폴리뉴클레오티드 서열, 및 이종 지방산 유도체 생합성 단백질을 인코딩하는 폴리뉴클레오티드 서열을 포함하는 재조합 숙주 세포를 제공하며, 재조합 숙주 세포는 지방산 유도체 조성물을 생성한다. 일 실시예에서, ACP는 시아노박테리아의 아실기 운반 단백질(cACP)이다. 또 다른 실시예에서, ACP는 마리노박터 아쿠애올레이(Marinobacter aquaeolei) VT8 아실기 운반 단백질(mACP)이다. 또 다른 실시예에서, ACP는 대장균(Escherichia coli) 아실기 운반 단백질(ecACP)이다.
본 발명의 또 다른 실시형태는 이종 아실기 운반 단백질(ACP)을 인코딩하는 폴리뉴클레오티드 서열, 및 이종 지방산 유도체 생합성 단백질을 인코딩하는 폴리뉴클레오티드 서열을 포함하는 재조합 숙주 세포를 제공하며, 재조합 숙주 세포는 지방산 유도체 조성물을 생성한다. 일 특정 실시형태에서, 재조합 숙주 세포는 4'-포스포판테테이닐 트랜스페라제(PPTase) 단백질을 인코딩하는 sfp 유전자를 더 발현시킨다. 일 실시예에서, sfp 유전자는 재조합 세포에 대해 이종인 바실루스 서브틸리스(B. subtilis) sfp 유전자이다. 또 다른 실시예에서, 재조합 세포는 원시(native) 4'-포스포판테테이닐 트랜스페라제(PPTase) 단백질이다. 또 다른 실시예에서, 재조합 숙주 세포는 세포밖에서(extracellularly) 지방산 유도체 조성물을 생성한다. 또 다른 실시예에서, 재조합 숙주 세포는 세포안에서(intercellularly) 지방산 유도체 조성물을 생성한다.
본 발명은 이종 아실기 운반 단백질(ACP)을 인코딩하는 폴리뉴클레오티드 서열, 및 이종 지방산 유도체 생합성 단백질을 인코딩하는 폴리뉴클레오티드 서열을 발현시키는 재조합 숙주 세포를 포함하는 세포 배양을 고려하며, 재조합 숙주 세포는 지방산 유도체 조성물을 생성한다. 일 실시예에서, 지방산 유도체 조성물(예를 들어, 지방산, 지방족 알코올, 지방족 에스테르)는 배양 배지에서 발견된다. 조성물의 지방산 유도체는 C6, C8, C10, C12, C13, C14, C15, C16, C17, 및/또는 C18 지방산 유도체이다. 일 실시예에서, 조성물의 지방산 유도체는 C10:1, C12:1, C14:1, C16:1, 및/또는 C18:1 불포화 지방산 유도체와 같은 불포화 지방산 유도체이다. 또 다른 실시예에서, 조성물의 지방산 유도체는 포화 지방산 유도체이다. 일 특정 실시예에서, 지방산 유도체 조성물은 지방산, 지방족 에스테르, 또는 지방족 알코올의 환원된 말단(reduced end)으로부터 7번 및 8번 탄소 사이에 이중 결합을 갖는 지방산 유도체를 포함한다. 또 다른 실시예에서, 지방산 유도체 조성물은 분지쇄(branched chain) 지방산 유도체를 포함한다. 또 다른 실시예에서, 지방산 유도체 조성물은 약 1.003 내지 약 1.5의 현대 탄소(modern carbon)의 분율; 및/또는 약 -10.9 내지 약 -15.4의 δ13C를 갖는 지방산 유도체를 포함한다.
본 발명의 또 다른 실시형태는 지방산 유도체 조성물을 만드는 방법을 제공한다. 상기 방법은 지방산 유도체 조성물을 생성하고 배양 배지로부터 지방산 유도체 조성물을 수집하기 위해서 탄소원의 존재 하에 앞서(supra) 설명된 바와 같은 재조합 숙주 세포를 배양하는 단계를 포함하며, 지방산 유도체 조성물의 수율, 역가 및/또는 생산성은 동일한 조건들 하에서 배양된 대응하는 야생형 숙주 세포에 의해 생성된 지방산 유도체 조성물의 수율, 역가 및/또는 생산성보다 적어도 약 10 % 더 크다. 상기 방법은 선택적으로 재조합 숙주 세포로부터 생성된 지방산 유도체 조성물을 분리시키는 단계를 포함한다. 일 특정 실시예에서, 지방산 유도체 조성물은 배양 배지에서 발견된다. 지방산 유도체 조성물은 지방산, 지방족 알코올, 지방족 에스테르, 지방족 알데히드, 알칸, 알켄, 올레핀, 및/또는 케톤을 포함하며, 이에 제한되지는 않는다. 일 실시예에서, 지방산 유도체 조성물은 지방산 또는 지방족 알코올 또는 지방족 에스테르 또는 지방족 알데히드 또는 알칸 또는 알켄 또는 올레핀 또는 케톤을 포함한다. 또 다른 실시예에서, 지방산 유도체 조성물은 지방산, 지방족 알코올, 지방족 에스테르, 지방족 알데히드, 알칸, 알켄, 올레핀(예를 들어, 내부 올레핀 또는 말단 올레핀), 및 케톤을 포함 -단, 이에 제한되지는 않음- 하는 1 이상의 지방산 유도체들의 조합이다. 지방산 유도체 조성물은 포화 및/또는 불포화 지방산 유도체들을 포함할 수 있다. 일 실시예에서, 상기 방법은 C6, C8, C10, C12, C13, C14, C15, C16, C17, 또는 C18 지방산 유도체를 포함하는 지방산 유도체 조성물을 생성한다. 일 특정 실시예에서, 상기 방법은 C10:1, C12:1, C14:1, C16:1, 또는 C18:1 불포화 지방산 유도체를 포함하는 지방산 유도체 조성물을 생성한다. 또 다른 특정 실시예에서, 지방산 유도체 조성물은 지방산은 포함한다. 또 다른 특정 실시예에서, 지방산 유도체 조성물은 지방족 알코올을 포함한다. 또 다른 특정 실시예에서, 지방산 유도체 조성물은 지방족 에스테르를 포함한다. 또 다른 특정 실시예에서, 지방산 유도체 조성물은 지방족 알데히드를 포함한다. 또 다른 특정 실시예에서, 지방산 유도체 조성물은 알칸을 포함한다. 또 다른 특정 실시예에서, 지방산 유도체 조성물은 알켄을 포함한다. 또 다른 특정 실시예에서, 지방산 유도체 조성물은 내부 및/또는 말단 올레핀과 같은 올레핀을 포함한다. 또 다른 특정 실시예에서, 지방산 유도체 조성물은 케톤을 포함한다. 또 다른 실시예에서, 지방산 유도체 조성물은 분지쇄 지방산 유도체를 포함한다. 또 다른 실시예에서, 지방산 유도체 조성물은 약 1.003 내지 약 1.5의 현대 탄소의 분율; 및/또는 약 -10.9 내지 약 -15.4의 δ13C를 갖는 지방산 유도체를 포함한다. 또 다른 특정 실시예에서, 지방산 유도체 조성물은 지방산, 지방족 에스테르, 및/또는 지방족 알코올의 환원된 말단으로부터 7번 및 8번 탄소 사이에 이중 결합을 갖는 지방산 유도체를 포함한다.
또한, 본 발명은 지방산, 지방족 에스테르, 및/또는 지방족 알코올의 환원된 말단으로부터 7번 및 8번 탄소 사이에 이중 결합을 갖는 지방산 유도체를 포함하는 앞서(supra) 설명된 바와 같은 방법에 의해 생성된 지방산 유도체 조성물을 고려한다. 이 지방산 유도체 조성물은 본 명세서에(supra) 설명된 바와 같은 이종 아실기 운반 단백질(ACP)을 인코딩하는 폴리뉴클레오티드 서열, 및 이종 지방산 유도체 생합성 단백질을 인코딩하는 폴리뉴클레오티드 서열을 포함하는 재조합 숙주 세포에 의해 생성된다.
본 발명은 재조합 숙주 세포들과 동일한 조건들 하에 번식되는 대응하는 야생형 숙주 세포에 비해 더 높은 역가, 더 높은 수율, 및/또는 더 높은 생산성에서 지방산 유도체 조성물을 생성하는 신규한 재조합 숙주 세포들, 관련 방법들 및 공정들을 제공한다. 특히, 본 발명의 일 실시형태는 이종 아실기 운반 단백질(ACP)을 인코딩하는 폴리뉴클레오티드 서열, 및 이종 지방산 유도체 생합성 단백질을 인코딩하는 폴리뉴클레오티드 서열을 포함하거나 발현시키는 재조합 숙주 세포들을 제공하며, 재조합 숙주 세포들은 지방산 유도체 또는 지방산 유도체 조성물을 생성한다. 또 다른 실시형태에서, 본 발명은 이종 아실기 운반 단백질(ACP)을 인코딩하는 폴리뉴클레오티드 서열; 이종 포스포판테테이닐 트랜스페라제(PPTase) 단백질을 인코딩하는 폴리뉴클레오티드 서열; 및 이종 지방산 유도체 생합성 단백질을 인코딩하는 폴리뉴클레오티드 서열을 포함하거나 발현시키는 재조합 숙주 세포들을 제공하며, 재조합 숙주 세포들은 지방산 유도체 조성물을 생성한다. 일 실시예에서, ACP는 시아노박테리아의 아실기 운반 단백질(cACP)이다. 또 다른 실시예에서, ACP는 마리노박터 아쿠애올레이 VT8 아실기 운반 단백질(mACP)이다. 또 다른 실시예에서, ACP는 대장균 아실기 운반 단백질(ecACP)이다. 또 다른 실시예에서, 포스포판테테이닐 트랜스페라제(PPTase) 단백질은 sfp 유전자에 의해 인코딩되는 4'-포스포판테테이닐 트랜스페라제 단백질이다. 지방산 유도체 생합성 단백질은 티오에스테라제 활성을 갖는 단백질; 카르복실산 레덕타제(CAR) 활성을 갖는 단백질; 아실-ACP 레덕타제(AAR) 활성을 갖는 단백질; 및/또는 에스테르 신타제 활성을 갖는 단백질을 포함하며, 이에 제한되지는 않는다. 일 특정 실시형태에서, 재조합 숙주 세포들은 폴리뉴클레오티드 서열들을 과발현시키는 데 효과적인 조건들 하에서 탄소원을 함유한 배지에서 배양되는 경우, 재조합 숙주 세포들과 동일한 조건들 하에 번식되는 대응하는 야생형 숙주 세포들에 비해 더 높은 역가, 더 높은 수율, 및/또는 더 높은 생산성으로 지방산 유도체 조성물을 생성한다. 재조합 숙주 세포들에 의해 생성되는 지방산 유도체 조성물들은 지방산, 지방족 에스테르, 지방족 알코올, 지방족 알데히드, 케톤, 알칸, 알켄, 올레핀, 및/또는 그 조합들을 포함하며, 이에 제한되지는 않는다.
본 발명의 또 다른 실시형태는 이종 아실기 운반 단백질(ACP)을 인코딩하는 폴리뉴클레오티드 서열, 및 티오에스테라제 활성을 갖는 이종 지방산 유도체 생합성 단백질을 인코딩하는 폴리뉴클레오티드 서열을 포함하거나 발현시키는 재조합 숙주 세포들을 제공한다. 일 실시예에서, 지방산 유도체 생합성 단백질은 티오에스테라제 단백질이다. 또 다른 실시예에서, 재조합 숙주 세포들은 이종 포스포판테테이닐 트랜스페라제(PPTase) 단백질을 인코딩하는 폴리뉴클레오티드 서열을 더 포함하거나 발현시킨다. 본 명세서에서, 이 재조합 숙주 세포들에 의해 생성되는 지방산 유도체 조성물들은 지방산이다. 또 다른 실시예에서, 재조합 숙주 세포들은 카르복실산 레덕타제(CAR) 활성을 갖는 단백질을 더 포함하거나 발현시킨다. 또 다른 실시예에서, 재조합 숙주 세포들은 카르복실산 레덕타제(CAR) 단백질을 더 포함하거나 발현시킨다. 이 재조합 숙주 세포들에 의해 생성되는 지방산 유도체 조성물들은 지방족 알코올 및/또는 지방족 알데히드이다.
본 발명의 또 다른 실시형태는 이종 아실기 운반 단백질(ACP)을 인코딩하는 폴리뉴클레오티드 서열, 및 카르복실산 레덕타제(CAR) 활성을 갖는 이종 지방산 유도체 생합성 단백질을 인코딩하는 폴리뉴클레오티드 서열을 포함하거나 발현시키는 재조합 숙주 세포들을 제공한다. 일 실시예에서, 재조합 숙주 세포들은 카르복실산 레덕타제(CAR) 단백질을 포함하거나 발현시킨다. 또 다른 실시예에서, 재조합 숙주 세포들은 이종 포스포판테테이닐 트랜스페라제(PPTase) 단백질을 인코딩하는 폴리뉴클레오티드 서열을 더 포함하거나 발현시킨다. 이 재조합 숙주 세포들에 의해 생성되는 지방산 유도체 조성물들은 지방족 알코올 및/또는 지방족 알데히드이다.
본 발명의 또 다른 실시형태는 이종 아실기 운반 단백질(ACP)을 인코딩하는 폴리뉴클레오티드 서열, 및 아실-ACP 레덕타제(AAR) 활성을 갖는 이종 지방산 유도체 생합성 단백질을 인코딩하는 폴리뉴클레오티드 서열을 포함하거나 발현시키는 재조합 숙주 세포를 제공한다. 일 실시예에서, 재조합 숙주 세포들은 아실-ACP 레덕타제(AAR) 단백질을 포함하거나 발현시킨다. 또 다른 실시예에서, 재조합 숙주 세포는 이종 포스포판테테이닐 트랜스페라제(PPTase) 단백질을 인코딩하는 폴리뉴클레오티드 서열을 더 포함하거나 발현시킨다. 이 재조합 숙주 세포들에 의해 생성되는 지방산 유도체 조성물들은 지방족 알코올 및/또는 지방족 알데히드이다.
또한, 본 발명은 신규한 재조합 숙주 세포들을 포함한 세포 배양 및 세포 배양을 이용하는 방법을 포괄한다. 또한, 본 발명은 본 발명의 재조합 숙주 세포들을 배양함으로써 지방산 유도체들을 포함하는 조성물들을 만드는 방법들, 이러한 방법들에 의해 만들어진 조성물들, 및 추가 검토 시 명백해지는 다른 특징들을 제공한다.
일 실시형태에서, 본 발명은 이종 ACP 단백질을 인코딩하는 폴리뉴클레오티드 서열, 및 지방산 유도체 생합성 폴리펩티드를 인코딩하는 폴리뉴클레오티드 서열을 포함하는 배양된 재조합 숙주 세포를 제공하며, 배양된 재조합 숙주 세포는 폴리뉴클레오티드를 과발현시키는 데 효과적인 조건들 하에서 탄소원을 함유한 배지에서 배양되는 경우, 재조합 숙주 세포와 동일한 조건들 하에 번식되는 대응하는 야생형 숙주 세포에서의 발현 수준에 비해 지방산 유도체의 더 높은 역가, 더 높은 수율, 또는 더 높은 생산성으로 지방산 유도체 조성물을 생성한다. 지방산 유도체 조성물은 지방산, 지방족 알데히드, 지방족 알코올, 지방족 에스테르, 알칸, 알켄, 올레핀, 및/또는 케톤과 같은 지방산 유도체를 포함한다. ACP는 시아노박테리아의 아실기 운반 단백질(cACP), 마리노박터 하이드로카보노클라스티쿠스(Marinobacter hydrocarbonoclasticus) 아실기 운반 단백질(mACP), 또는 대장균 아실기 운반 단백질(ecACP)일 수 있다. 또한, 재조합 및 배양된 숙주 세포는 sfp 유전자를 포함할 수 있으며, sfp 유전자는 변형된 4'-포스포판테테이닐 트랜스페라제(PPTase) 단백질을 인코딩하는 바실루스 서브틸리스 sfp 유전자일 수 있고, 이는 조효소 A(CoA)의 4'-포스포판테테이닐 모이어티(moiety)를 세린 잔기로 전달한다. 당업자라면, 본 명세서에 제공된 본 발명의 검토 시, 이 실시예들 및 다른 실시예들을 쉽게 알 것이다.
본 발명은 바람직한 실시예들을 나타내는 데 도움이 되는 첨부된 도면들과 관련하여 읽을 때 가장 잘 이해된다. 하지만, 본 발명은 도면에 개시된 특정 실시예들로 제한되지 않는다는 것을 이해한다.
도 1은 재조합 숙주 세포에서의 지방산 유도체 생성에 대한 전구체로서 아실-CoA의 생성에 사용되는 예시적인 생합성 경로의 개략적인 개관이다. 사이클은 말로닐-ACP 및 아세틸-CoA의 축합에 의해 시작된다.
도 2는 말로닐-ACP 및 아실-ACP의 축합으로 시작하여 아실-ACP로 끝나는 예시적인 지방산 생합성 사이클의 또 다른 개략적인 개관이다.
도 3은 아세틸-CoA 카르복실라제 효소 복합체(accABCD 유전자에 의해 인코딩됨)의 구조 및 기능을 예시한다.
도 4는 아실-ACP로 시작하는 지방족 알코올들의 생성을 위한 예시적인 생합성 경로의 개략적인 개관을 나타낸다.
도 5는 아실-ACP로 시작하는 지방족 에스테르들의 생성을 위한 2 개의 예시적인 생합성 경로들의 개관을 나타낸다.
도 6은 아실-ACP로 시작하는 탄화수소들(올레핀 및 알칸)의 생성을 위한 예시적인 생합성 경로들의 또 다른 개관을 나타낸다.
도 7은 표준 미량 역가 플레이트 발효 실험에서 선도없는(leaderless) 대장균 티오에스테라제('tesA 유전자에 의해 인코딩됨)를 발현시키고, 시아노박테리아의 아실기 운반 단백질(cACP) 및 바실루스 서브틸리스 sfp를 공동발현(coexpress)시킴으로써 대장균 DV2 세포들에서의 지방산 생성을 예시한다.
도 8은 표 2로부터 시네코코쿠스 엘롱가투스(synechococcus elongatus) 아실-ACP 레덕타제(AAR)를 발현시키고, 다양한 시아노박테리아의 아실기 운반 단백질(ACP)들을 공동발현시킴으로써 대장균 DV2 세포들에서의 지방족 알코올 생성을 예시한다.
도 9는 pEP.100 플라스미드를 함유한 균주들의 96 웰 플레이트(96 well plate) 발효의 결과들을 나타낸다. stEP604 균주들은 대조군 균주 sven038보다 나은 큰 역가 개선(3 배)을 유도하였다. BD64 균주 배경에서의 동일한 플라스미드는 대조군 KEV075 균주보다 약간 더 낮은 역가들을 유도하였다.
도 10은 stEP604 균주의 5 리터 탱크 발효의 결과들을 나타낸다. stEP604 균주는 지속적으로 진행 내내 대조군(sven38)에 비해 더 높은 역가를 생성하였다.
도 11은 mACP를 과발현시키도록 조작(engineer)된 플레이트 발효의 결과들을 나타낸다. 모든 균주들은 GLPH-077 숙주 균주로부터 유래되었고, ACP 과발현을 이용하여, 및 ACP 과발현을 이용하지 않고 비교되었다.
도 12는 pKEV022 또는 pSHU018을 함유하는 균주들에서 총 역가[총 FAS(Fatty Acid Species)의 g/L] 및 퍼센트(%) 오메가-하이드록시(β-OH) 에스테르 생성에 대한 ecACP의 과발현의 효과를 예시한다.
도 13은 mACP 또는 ecACP를 과발현시키는 균주들의 5 리터 바이오리액터(bioreactor) 발효(즉, 24 내지 72 시간) 동안의 FAS 역가(g/L)를 나타낸다. 결과들은 ecACP를 갖는 pSHU18이 총 FAS 생성에 관하여 다른 에스테르 신타제 변이체(variant)들을 능가한 것을 예시한다.
도 14는 5 리터 바이오리액터들에서 배양되는 경우, 다양한 균주들에 의해 생성된 오메가-하이드록시(β-OH) FAME의 퍼센트를 예시한다. ecACP를 과발현시킨 pSHU18 균주는 약 68 % β-OH FAME를 생성하였다.
도 15는 글루코스에 대한 수율을 비교하는 데이터로 5 리터 바이오리액터 발효 진행(즉, 24 내지 72 시간) 동안의 글루코스에 대한 퍼센트(%) 수율을 나타낸다. ecACP를 과발현시킨 pSHU18 균주는 이 연구에서 테스트된 다른 균주들보다 더 높은 수율을 명확히 나타내었다.
도 16은 플라스미드 pDS171S를 함유한 균주 iDJ에서의 알칸 생성의 mg/L을 예시한다(오른쪽으로 3번째 기둥을 참조). 노스톡 73102 acp + sfp의 발현이 개선된 알칸 생성을 입증하였다. 대조군들(acp/sfp 없음)은 pLS9-185였다(첫번째 및 두번째 기둥 참조).
도 1은 재조합 숙주 세포에서의 지방산 유도체 생성에 대한 전구체로서 아실-CoA의 생성에 사용되는 예시적인 생합성 경로의 개략적인 개관이다. 사이클은 말로닐-ACP 및 아세틸-CoA의 축합에 의해 시작된다.
도 2는 말로닐-ACP 및 아실-ACP의 축합으로 시작하여 아실-ACP로 끝나는 예시적인 지방산 생합성 사이클의 또 다른 개략적인 개관이다.
도 3은 아세틸-CoA 카르복실라제 효소 복합체(accABCD 유전자에 의해 인코딩됨)의 구조 및 기능을 예시한다.
도 4는 아실-ACP로 시작하는 지방족 알코올들의 생성을 위한 예시적인 생합성 경로의 개략적인 개관을 나타낸다.
도 5는 아실-ACP로 시작하는 지방족 에스테르들의 생성을 위한 2 개의 예시적인 생합성 경로들의 개관을 나타낸다.
도 6은 아실-ACP로 시작하는 탄화수소들(올레핀 및 알칸)의 생성을 위한 예시적인 생합성 경로들의 또 다른 개관을 나타낸다.
도 7은 표준 미량 역가 플레이트 발효 실험에서 선도없는(leaderless) 대장균 티오에스테라제('tesA 유전자에 의해 인코딩됨)를 발현시키고, 시아노박테리아의 아실기 운반 단백질(cACP) 및 바실루스 서브틸리스 sfp를 공동발현(coexpress)시킴으로써 대장균 DV2 세포들에서의 지방산 생성을 예시한다.
도 8은 표 2로부터 시네코코쿠스 엘롱가투스(synechococcus elongatus) 아실-ACP 레덕타제(AAR)를 발현시키고, 다양한 시아노박테리아의 아실기 운반 단백질(ACP)들을 공동발현시킴으로써 대장균 DV2 세포들에서의 지방족 알코올 생성을 예시한다.
도 9는 pEP.100 플라스미드를 함유한 균주들의 96 웰 플레이트(96 well plate) 발효의 결과들을 나타낸다. stEP604 균주들은 대조군 균주 sven038보다 나은 큰 역가 개선(3 배)을 유도하였다. BD64 균주 배경에서의 동일한 플라스미드는 대조군 KEV075 균주보다 약간 더 낮은 역가들을 유도하였다.
도 10은 stEP604 균주의 5 리터 탱크 발효의 결과들을 나타낸다. stEP604 균주는 지속적으로 진행 내내 대조군(sven38)에 비해 더 높은 역가를 생성하였다.
도 11은 mACP를 과발현시키도록 조작(engineer)된 플레이트 발효의 결과들을 나타낸다. 모든 균주들은 GLPH-077 숙주 균주로부터 유래되었고, ACP 과발현을 이용하여, 및 ACP 과발현을 이용하지 않고 비교되었다.
도 12는 pKEV022 또는 pSHU018을 함유하는 균주들에서 총 역가[총 FAS(Fatty Acid Species)의 g/L] 및 퍼센트(%) 오메가-하이드록시(β-OH) 에스테르 생성에 대한 ecACP의 과발현의 효과를 예시한다.
도 13은 mACP 또는 ecACP를 과발현시키는 균주들의 5 리터 바이오리액터(bioreactor) 발효(즉, 24 내지 72 시간) 동안의 FAS 역가(g/L)를 나타낸다. 결과들은 ecACP를 갖는 pSHU18이 총 FAS 생성에 관하여 다른 에스테르 신타제 변이체(variant)들을 능가한 것을 예시한다.
도 14는 5 리터 바이오리액터들에서 배양되는 경우, 다양한 균주들에 의해 생성된 오메가-하이드록시(β-OH) FAME의 퍼센트를 예시한다. ecACP를 과발현시킨 pSHU18 균주는 약 68 % β-OH FAME를 생성하였다.
도 15는 글루코스에 대한 수율을 비교하는 데이터로 5 리터 바이오리액터 발효 진행(즉, 24 내지 72 시간) 동안의 글루코스에 대한 퍼센트(%) 수율을 나타낸다. ecACP를 과발현시킨 pSHU18 균주는 이 연구에서 테스트된 다른 균주들보다 더 높은 수율을 명확히 나타내었다.
도 16은 플라스미드 pDS171S를 함유한 균주 iDJ에서의 알칸 생성의 mg/L을 예시한다(오른쪽으로 3번째 기둥을 참조). 노스톡 73102 acp + sfp의 발현이 개선된 알칸 생성을 입증하였다. 대조군들(acp/sfp 없음)은 pLS9-185였다(첫번째 및 두번째 기둥 참조).
개관(General Overview)
석유 및 석유화학에 대한 의존성을 제거하는 한가지 방식은 아주 작은 생성 숙주(miniature production host)들의 역할을 하는 환경 친화적인 미생물들을 통해 지방산 유도체들을 생성하는 것이다. 이러한 세포 숙주들(즉, 생성 숙주 세포들 또는 생성 균주들)은 재생가능한 공급원료와 같은 재생가능한 자원들(예를 들어, 발효성 당, 탄수화물, 바이오매스, 셀룰로스, 글리세롤, CO, CO2 등)로부터 지방산 유도체들을 생성하도록 조작되었다. 이 지방산 유도체들은 공업용 특수 화학물질 및 연료를 포함한 대부분의 공업용 제품들에 대한 원료 또는 빌딩 블록이다. 생물학적으로 유래된 화학물질 및 연료들에 대한 기초를 제공하는 생물학적으로 유래된 지방산 유도체들은 석유로부터 만들어지는 화학물질 및 연료보다 나은 뚜렷한 장점들을 제공한다. 무엇보다 먼저, 이들은 환경을 보호하고 천연 자원들을 보존함으로써 더 깨끗한 대안을 제공한다. 인구는 2050 년에 90 억에 달할 것으로 추정되며, 천연 오일의 비축은 꾸준히 감소하고 있다. 둘째로, 생물학적으로 유래된 화학물질 및 연료의 제조는 세상에 더 유해하지 않고(gentle) 더 지속 가능한 생성 방법을 허용함으로써 지구 온난화 위험을 감소시킨다. 셋째로, 생물학적으로 유래된 화학물질 및 연료의 제조는, 제조 공정들이 석유의 하베스팅(harvesting) 및 지방-분해 공정들보다 훨씬 적은 비용이 드는 재생가능한 탄소원들(예를 들어, 탄수화물, CO2, 바이오매스, 글리세롤)을 사용하기 때문에, 뜨고 있는 에너지 비용들과 정렬된다. 예를 들어, 목질 섬유소 바이오매스에서의 높은 함유량의 탄수화물의 존재비(abundance)는 이로 하여금 효소 반응을 위한 매력적인 공급원료가 되게 한다. 유사한 저비용의 풍부한(abundant) 재생가능한 공급원료는 CO2 및 글리세롤을 포함하며, 이들은 다른 산업 공정들의 부산물들이다.
본 명세서에서 고려되는 생물학적으로 유래된 화학물질 및 연료는 지방산, 지방족 에스테르, 지방족 알코올, 지방족 알데히드, 탄화수소(예를 들어, 알칸, 알켄, 및/또는 올레핀) 및/또는 케톤으로부터 만들어진다. 이러한 것으로서, 이들은 발효성 당, 탄수화물, 바이오매스, CO2, CO, 셀룰로스, 글리세롤 등으로부터 생성되어, 원하는 화학 제품을 산출할 수 있다(예를 들어, 지방족 알코올의 생성에 대한 미국 특허 제 8,535,916호; 제 8,283,143호; 8,268,599호; 및 제 8,110,670호 참조; 지방족 에스테르의 생성에 대한 미국 특허 제 8,110,670호 및 제 8,313,934호 참조; 홀수 사슬 지방산 유도체의 생성에 대한 미국 특허 제 8,372,610호 및 분지쇄 지방산 유도체의 생성에 대한 미국 특허 제 8,530,221호 참조; 알칸 및 알켄의 생성에 대한 미국 특허 제 8,323,924호 참조; 올레핀의 생성에 대한 미국 특허 제 8,183,028호 참조; 지방족 알데히드의 생성에 대한 미국 특허 제 8,097,439호 참조; 및 바이오크루드(biocrude)로부터의 저분자 탄화수소의 생성에 대한 미국 특허 제 8,110,093 참조, 이들은 모두 본 명세서에서 인용참조됨).
본 발명은 지방산 유도체들의 생성을 위해 지방산 유도체 생합성 단백질(예를 들어, 말단 효소)을 발현(또는 과발현)시키고, 아실기 운반 단백질(ACP)을 과발현시키는 환경 친화적인 미생물을 조작함으로써 추가 개선을 제공한다. 본 발명자들은 놀랍게도 말단 효소[예를 들어, 티오에스테라제(TE), 카르복실산 레덕타제(CAR), 에스테르 신타제, 아실-ACP 레덕타제(AAR) 등]와 같은 생합성 단백질을 발현시키거나 과발현시키는 것과 조합하여 ACP를 과발현시키는 것이 미생물을 통한 지방산 유도체들의 역가, 수율, 및/또는 생산성에 있어서 상당한 증가를 초래한다는 것을 발견하였다. 따라서, 이러한 변형된 미생물들은 그 원시 대응물(native counterparts) 또는 대응하는 야생형 미생물에 비해, 더 높은 역가, 더 높은 수율, 및/또는 더 높은 생산성의 지방산 유도체 생성을 특징으로 할 수 있다.
정의
달리 정의되지 않는 한, 본 명세서에서 사용되는 모든 기술적 및 과학적 용어들은 본 발명과 관계되는 당업자들에 의해 통상적으로 이해되는 것과 동일한 의미를 갖는다. 본 명세서에 설명되는 것과 유사한 다른 방법들 및 재료들, 또는 균등물들이 본 발명의 구현에 사용될 수 있지만, 바람직한 재료들 및 방법들은 본 명세서에서 설명된다.
본 명세서 및 첨부된 청구항에서 사용되는 바와 같이, 단수 형태 "a", "an" 및 "the"는 본문에 달리 명확히 명시되지 않는 한 복수의 지시대상(referent)을 포함한다. 따라서, 예를 들어 "재조합 숙주 세포"에 대한 언급은 이러한 2 이상의 재조합 숙주 세포를 포함하고, "지방족 알코올"에 대한 언급은 1 이상의 지방족 알코올 또는 지방족 알코올들의 혼합물을 포함하며, "핵산 코딩 서열"에 대한 언급은 1 이상의 핵산 코딩 서열을 포함하고, "효소"에 대한 언급은 1 이상의 효소를 포함하며, 그 밖에도 이와 마찬가지이다.
본 명세서 전반에 걸쳐 서열 수탁 번호는 (여기에서 "NCBI 수탁 번호" 또는 대안적으로 "GenBank 수탁 번호"로 식별되는) 미국 국립보건원에 의해 유지되는 NCBI(미국 국립 생물공학 정보센터)에 의해 제공되는 데이터베이스로부터, 그리고 (여기에서 "UniProtKB 수탁 번호"로 식별되는) 스위스 생물정보학 연구소에 의해 제공되는 UniProt 지식베이스(UniProtKB) 및 Swiss-Prot 데이터베이스로부터 얻어졌다.
EC(Enzyme Classification) 번호는 생화학 및 분자생물학 국제 연합(International Union of Biochemistry and Molecular Biology: IUBMB)의 명명 위원회(Nomenclature Committee)에 의해 제정되며, 이의 설명은 월드 와이드 웹의 IUBMB 효소 명명 웹사이트에서 이용가능하다. EC 번호는 효소-촉매 반응들에 따라서 효소들을 분류한다. 예를 들어, (예를 들어, 상이한 유기체들로부터의) 상이한 효소들이 동일한 반응을 촉진시키는 경우, 이들은 동일한 EC 번호 하에 분류된다. 또한, 수렴 진화를 통해 상이한 단백질 폴드(protein fold)들은 동일한 반응들을 촉진시킬 수 있으므로, 동일한 EC 번호들이 할당된다[Omelchenko 외(2010) Biol . Direct 5:31 참조]. 진화론적으로 관련되지 않고 동일한 생화학 반응들을 촉진시킬 수 있는 단백질들은 때때로 (동종 효소와 대조적으로) 상사 효소(analogous enzyme)라고 칭해진다. EC 번호들은, 예를 들어 그 아미노산 서열에 의해 단백질을 지정하는 UniProt 식별자들로부터 상이하다.
본 명세서에서 사용되는 바와 같이, "뉴클레오티드"라는 용어는 헤테로사이클릭 염기, 당 및 1 이상의 포스페이트 기로 이루어진 폴리뉴클레오티드의 단위체 단위를 지칭한다. 자연적으로 발생하는 염기[구아닌(G), 아데닌(A), 사이토신(C), 티민(T) 및 우라실(U)]는 통상적으로 퓨린 또는 피리미딘의 유도체이지만, 자연적으로 및 비-자연적으로 발생하는 염기 유사체(base analog)들도 포함되는 것으로 이해하여야 한다. 자연적으로 발생하는 당은 펜토오스(5-탄당)의 (DNA를 형성하는) 디옥시리보오스 또는 (RNA를 형성하는) 리보오스이지만, 자연적으로 및 비-자연적으로 발생하는 당 유사체들도 포함되는 것으로 이해하여야 한다. 핵산은 통상적으로 핵산 또는 폴리뉴클레오티드를 형성하는 포스페이트 결합을 통해 연결되지만, 많은 다른 연결들(예를 들어, 포스포로티오에이트, 보라노포스페이트 등)이 해당 기술분야에 알려져 있다.
본 명세서에서 사용되는 바와 같이, "폴리뉴클레오티드"라는 용어는 리보뉴클레오티드(RNA) 또는 디옥시리보뉴클레오티드(DNA)의 중합체를 지칭하며, 이는 외가닥 또는 이중 가닥일 수 있으며, 비-천연 또는 변경된 뉴클레오티드들을 함유할 수 있다. "폴리뉴클레오티드", "핵산 서열" 및 "뉴클레오티드 서열"이라는 용어들은 여하한 길이의 뉴클레오티드들의 중합체 형태, RNA 또는 DNA 중 하나를 지칭한다. 이 용어들은 분자의 일차 구조를 지칭하고, 따라서 이중 및 외가닥의 DNA, 및 이중 및 외가닥의 RNA를 포함한다. 용어들은 메틸화된 및/또는 캡핑된(capped) 폴리뉴클레오티드(단, 이로 제한되지 않음)와 같은 변형된 폴리뉴클레오티드 및 뉴클레오티드 유사체로부터 만들어지는 RNA 또는 DNA 중 어느 하나의 유사체를 등가물로서 포함한다. 폴리뉴클레오티드는 플라스미드, 바이러스성, 염색체의, EST, cDNA, mRNA 및 rRNA를 포함하는 여하한 형태로 존재할 수 있으며, 이에 제한되지는 않는다.
본 명세서에서 사용되는 바와 같이, "폴리펩티드" 및 "단백질"이라는 용어는 아미노산 잔기의 중합체를 지칭하는 데 교환가능하게 사용된다. "재조합 폴리펩티드"라는 용어는 재조합 기술에 의해 생성되는 폴리펩티드를 지칭하며, 일반적으로 발현되는 단백질을 인코딩하는 DNA 또는 RNA가 숙주 세포를 형질전환하여 폴리펩티드를 생성하는 데 사용되는 적절한 발현 벡터 내로 삽입된다.
본 명세서에서 사용되는 바와 같이, "동족체(homolog)" 및 "상동(homologous)"이라는 용어는 대응하는 폴리뉴클레오티드 또는 폴리펩티드 서열과 적어도 약 50 % 동일한 서열을 포함하는 폴리뉴클레오티드 또는 폴리펩티드를 지칭한다. 바람직하게는, 상동 폴리뉴클레오티드들 또는 폴리펩티드는 대응하는 아미노산 서열 또는 폴리뉴클레오티드 서열에 대해 적어도 약 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % 또는 적어도 약 99 % 상동성(homology)을 갖는 폴리뉴클레오티드 서열들 또는 아미노산 서열들을 갖는다. 본 명세서에서 사용되는 바와 같이, 서열 "상동성" 및 서열 "동일성"은 교환가능하게 사용된다. 해당 기술분야의 당업자는 2 이상의 서열들 간의 상동성을 결정하는 방법들을 잘 알고 있다. 간명하게, 두 서열들 간의 "상동성"의 계산은 다음과 같이 수행될 수 있다. 이 서열들은 최적의 비교를 위해 정렬된다[예를 들어, 최적의 정렬을 위해 제 1 및 제 2 아미노산 또는 핵산 서열 중 하나 또는 둘 모두에 갭(gap)들이 도입될 수 있으며, 비교를 위해 비-상동 서열은 무시될 수 있다]. 바람직한 일 실시예에서, 비교를 위해 정렬되는 제 1 서열의 길이는 제 2 서열의 길이의 적어도 약 30 %, 바람직하게는 적어도 약 40 %, 더 바람직하게는 적어도 약 50 %, 훨씬 더 바람직하게는 적어도 약 60 %, 그리고 훨씬 더 바람직하게는 적어도 약 70 %, 적어도 약 80 %, 적어도 약 90 %, 또는 약 100 %이다. 그 후, 제 1 및 제 2 서열들의 대응하는 아미노산 위치들 또는 뉴클레오티드 위치들에서의 아미노산 잔기들 또는 뉴클레오티드들이 비교된다. 제 1 서열에서의 위치가 제 2 서열에서의 대응하는 위치와 동일한 아미노산 잔기 또는 뉴클레오티드에 의해 점유될 때, 분자들은 그 위치에서 동일하다. 두 서열들 간의 퍼센트 상동성은 두 서열들의 최적의 정렬을 위해 도입될 필요가 있는, 갭의 개수 및 각 갭의 길이를 고려한, 서열들에 의해 공유되는 동일한 위치들의 개수의 함수이다. 두 서열들 간의 퍼센트 상동성의 결정 및 서열들의 비교는 BLAST와 같은 수학적 알고리즘을 이용하여 달성될 수 있다[Altschul 외(1990) J. Mol . Biol . 215(3):403-410]. 또한, 두 아미노산 서열들 간의 퍼센트 상동성은 Blossum 62 매트릭스 또는 PAM250 매트릭스 중 어느 하나, 그리고 16, 14, 12, 10, 8, 6 또는 4의 갭량(gap weight) 및 1, 2, 3, 4, 5 또는 6의 길이량(length weight)을 이용하는 소프트웨어 패키지의 GAP 프로그램에 통합된 Needleman 및 Wunsch 알고리즘을 사용하여 결정될 수 있다[Needleman 및 Wunsch(1970) J. Mol . Biol . 48:444-453]. 또한, 두 뉴클레오티드 서열들 간의 퍼센트 상동성은 NWSgapdna.CMP 매트릭스, 그리고 40, 50, 60, 70 또는 80의 갭량 및 1, 2, 3, 4, 5 또는 6의 길이량을 이용하는, GCG 소프트웨어 패키지의 GAP 프로그램을 이용하여 결정될 수 있다. 해당 기술분야의 당업자는 초기 상동성 계산을 수행할 수 있으며, 이에 따라 알고리즘 파라미터들을 조정할 수 있다. 바람직한 파라미터들의 세트(및 당업자가, 분자가 청구항의 상동성 제한 내에 있는지 여부를 결정하기 위해 어떤 파라미터들이 적용되어야 하는지에 대한 확신이 없는 경우에 사용되어야 하는 파라미터들의 세트)는 12의 갭 페널티(gap penalty), 4의 갭 확장 페널티 및 5의 프레임시프트 갭 페널티(frameshift gap penalty)를 갖는 Blossum 62 스코어링 매트릭스(scoring matrix)이다. 서열 정렬의 추가적인 방법들은 생물공학 분야에 알려져 있다[예를 들어, Rosenberg(2005) BMC Bioinformatics 6:278; Altschul 외(2005) FEBS J. 272(20):5101-5109 참조].
"낮은 엄격성, 중간 엄격성, 높은 엄격성 또는 매우 높은 엄격성 조건들 하에서 혼성화(hybridize)한다"라는 용어는 혼성화 및 세정에 대한 조건들을 설명한다. 혼성화 반응을 수행하기 위한 안내는 Current Protocols in Molecular Biology[John Wiley & Sons, N.Y.(1989), 6.3.1-6.3.6]에서 찾을 수 있으며, 이는 수성 및 비-수성 방법들을 설명한다. 여기에 언급된 특정 혼성화 조건들은 다음과 같다: 1) 낮은 엄격성 혼성화 조건 -- 약 45 ℃에서 6X 소듐 클로라이드/소듐 시트레이트(SSC), 이후에 적어도 50 ℃에서 0.2X SSC, 0.1 % SDS로 두 번 세정(세정의 온도는 낮은 엄격성 조건에 대해 55 ℃로 증가될 수 있음); 2) 중간 엄격성 혼성화 조건 -- 약 45 ℃에서 6X SSC, 이후에 60 ℃에서 0.2X SSC, 0.1 % SDS로 한 번 이상 세정; 3) 높은 엄격성 혼성화 조건 -- 약 45 ℃에서 6X SSC, 이후에 65 ℃에서 0.2X SSC, 0.1 % SDS로 한 번 이상 세정; 및 4) 매우 높은 엄격성 혼성화 조건 -- 65 ℃에서 0.5 M 소듐 포스페이트, 7 % SDS, 이후에 65 ℃에서 0.2X SSC, 1 % SDS로 한 번 이상 세정. 달리 명시되지 않는 한, 일반적으로 매우 높은 엄격성 조건(4)이 바람직한 조건이다.
"내인성"이라는 용어는 "내부에서 기인함"을 의미한다. 이러한 것으로서, "내인성" 폴리펩티드는 숙주 세포의 원시 게놈(native genome)에 의해 인코딩되는 폴리펩티드를 지칭한다. 예를 들어, 내인성 폴리펩티드는 재조합 세포가 조작되거나(또는 유래되는) 모 미생물 세포(parental microbial cell)(예를 들어, 모 숙주 세포)의 게놈에 의해 인코딩되는 폴리펩티드를 지칭할 수 있다.
"외인성"이라는 용어는 "외부로부터 기인함"을 의미한다. 이러한 것으로서, "외인성" 폴리펩티드는 세포의 원시 게놈에 의해 인코딩되지 않는 폴리펩티드를 지칭한다. 이러한 외인성 폴리펩티드는 세포로 전달되고, 상이한 세포 타입 또는 종(species)으로부터 클로닝(clone)되거나 유래될 수 있으며; 또는 동일한 세포 타입 또는 종으로부터 클로닝되거나 유래될 수 있다. 예를 들어, 변이(즉, 돌연변이 또는 변형된) 폴리펩티드는 외인성 폴리펩티드의 일 예시이다. 이와 유사하게, 비-자연적으로 발생하는 핵산 분자가 세포로 도입되면 세포에 대해 외인성인 것으로 간주된다. 또한, "외인성"이라는 용어는 비-원시 상태(non-native state)에서 재조합 숙주 세포에 존재하는 폴리뉴클레오티드, 폴리펩티드, 또는 단백질에 관련하여 사용될 수 있다. 예를 들어, "외인성" 뉴클레오티드, 폴리펩티드 또는 단백질 서열이 대응하는 야생형 숙주 세포에 자연적으로 존재하는 야생형 서열에 대해 변형될 수 있다(예를 들어, 뉴클레오티드, 폴리펩티드 또는 단백질의 서열 또는 발현 수준에서의 변형). 이 동일한 선에서, 자연적으로 발생하는 핵산 분자가 특정 세포에 대해 외인성일 수 있다. 예를 들어, 세포 X로부터 격리된 전체 코딩 서열은 그 코딩 서열이 세포 Y로 도입되면, X 및 Y가 동일한 세포 타입이더라도 세포 Y에 대한 외인성 핵산이다.
"과발현되는"이라는 용어는, 유전자가 그 유전자에 대한 내인성 전사율(transcription rate)에 비해 상승된 비율로 전사되도록 야기된다는 것을 의미한다. 몇몇 예시들에서, 과발현은 추가적으로 대응하는 단백질에 대한 내인성 번역률(translation rate)에 비해 대응하는 단백질의 상승된 번역률을 포함한다. 과발현에 대한 테스트 방법들은 당업계에 잘 알려져 있으며, 예를 들어 전사된 RNA 수준이 rtPCR을 이용하여 평가되고, 단백질 수준이 SDS page 겔 분석을 이용하여 평가될 수 있다.
"이종"이라는 용어는 "상이한 세포, 상이한 유기체, 상이한 세포 타입, 및/또는 상이한 종으로부터 유래된"을 의미한다. 본 명세서에서 사용되는 바와 같은 "이종"이라는 용어는 통상적으로 폴리뉴클레오티드 또는 폴리펩티드 또는 단백질과 연계되며, 주어진 유기체, 세포 타입, 또는 종 내에 자연적으로 존재하지 않는 폴리뉴클레오티드, 폴리펩티드 또는 단백질을 지칭한다. 예를 들어, 식물로부터의 폴리뉴클레오티드 서열이 재조합 방법들에 의해 미생물 숙주 세포 내로 도입될 수 있으며, 그 후 식물 폴리뉴클레오티드는 그 재조합 미생물 숙주 세포에 대해 이종이다. 이와 유사하게, 시아노박테리아로부터의 폴리뉴클레오티드 서열이 재조합 방법들에 의해 대장균 속의 미생물 숙주 세포로 도입될 수 있으며, 그 후 시아노박테리아로부터의 폴리뉴클레오티드는 그 재조합 미생물 숙주 세포에 대해 이종이다. 몇몇 실시예들에서, "이종"이라는 용어는 "외인성"이라는 용어와 교환가능하게 사용될 수 있다. 예를 들어, 세포 X로부터 격리된 전체 코딩 서열은 그 코딩 서열이 세포 Y로 도입되면, X 및 Y가 동일한 세포 타입이더라도 세포 Y에 대한 이종 핵산이다.
본 명세서에서 사용되는 바와 같이, 폴리펩티드의 "분절(fragment)"이라는 용어는 4 개의 아미노산 잔기에서부터 1 개의 아미노산 잔기를 뺀 전체 아미노산 서열에 이르는 크기 범위를 갖는 전체-길이 폴리펩티드 또는 단백질의 더 짧은 부분을 지칭한다. 본 발명의 소정 실시예들에서, 분절은 폴리펩티드 또는 단백질의 도메인[예를 들어, 기질 결합 도메인 또는 촉매 도메인]의 전체 아미노산 서열을 지칭한다.
본 명세서에서 사용되는 바와 같이, "돌연변이유발(mutagenesis)"이라는 용어는 유기체의 유전 정보를 안정된 방식으로 변화시키는 과정을 지칭한다. 단백질 코딩 핵산 서열의 돌연변이유발은 돌연변이 단백질을 생성한다. 또한, 돌연변이유발은 변형된 단백질 활성을 야기하는 비-코딩 핵산 서열들의 변화들을 지칭한다.
본 명세서에서 사용되는 바와 같이, "유전자"라는 용어는 RNA 생성물 또는 단백질 생성물 중 어느 하나를 인코딩하는 핵산 서열뿐만 아니라, RNA 또는 단백질의 발현에 영향을 주는 작동가능하게-연결된(operably-linked) 핵산 서열[예를 들어, 이러한 서열은 프로모터 또는 증폭자(enhancer) 서열을 포함하며, 이에 제한되지는 않음] 또는 RNA 또는 단백질의 발현에 영향을 주는 서열을 인코딩하는 작동가능하게 연결된 핵산 서열[예를 들어, 이러한 서열은 리보솜 결합 부위 또는 번역 조절 서열(translational control sequences)을 포함하며, 이에 제한되지는 않음]을 지칭한다.
발현 조절 서열은 당업계에 알려져 있으며, 예를 들어 숙주 세포에서 폴리뉴클레오티드 서열의 발현을 위하여 제공되는 프로모터, 증폭자, 아데닐산중합반응 신호(polyadenylation signal), 전사 종결자(transcription terminator), 내부 리보솜 유입점(internal ribosome entry sites: IRES) 등을 포함한다. 발현 조절 서열은 특히 전사에 관련된 세포성 단백질들과 상호작용한다[Maniatis 외(1987) Science 236:1237-1245]. 예시적인 발현 조절 서열은, 예를 들어 Goeddel, Gene Expression Technology: Methods in Enzymology, Vol. 185, Academic Press, San Diego, Calif.(1990)에 개시되어 있다. 본 발명의 방법들에서, 발현 조절 서열은 폴리뉴클레오티드 서열에 작동가능하게 연결된다. "작동가능하게 연결된"이라는 것은, 적절한 분자(예를 들어, 전사 활성화 단백질)가 발현 조절 서열에 결합될 때, 폴리뉴클레오티드 서열 및 발현 조절 서열이 유전자 발현을 허용하는 방식으로 연결되는 것을 의미한다. 작동가능하게 연결된 프로모터는, 전사 및 번역의 방향에 관하여, 선택된 폴리뉴클레오티드 서열의 상류(upstream)에 위치된다. 작동가능하게 연결된 증폭자는 선택된 폴리뉴클레오티드의 상류, 내부 또는 하류(downstream)에 위치될 수 있다.
본 명세서에서 사용되는 바와 같이, "벡터"라는 용어는 상기 벡터와 연결된 또 다른 핵산, 즉 폴리뉴클레오티드 서열을 수송할 수 있는 핵산 분자를 지칭한다. 유용한 벡터 중 한 가지 타입은 에피솜(episome)[즉, 염색체외 복제(extra-chromosomal replication)가 가능한 핵산]이다. 유용한 벡터는 벡터와 연결되는 핵산들의 자동 복제 및/또는 발현이 가능한 벡터이다. 작동가능하게 연결되는 유전자들의 발현을 지시할 수 있는 벡터는 본 명세서에서 "발현 벡터"로 칭해진다. 일반적으로, 재조합 DNA 기술들에서 유용한 발현 벡터는 흔히 "플라스미드"의 형태이며, 이는 일반적으로 벡터 형태에서 염색체에 결합되지 않는 원형 이중 가닥 DNA 루프(loops)를 칭한다. 다른 유용한 벡터가 선형 형태(linear form)로 제공된다. 또한, 등가적인 기능들을 제공하고, 이후에 해당 기술분야에 알려지는 이러한 다른 형태들의 발현 벡터도 포함된다. 몇몇 실시예들에서, 재조합 벡터는 폴리뉴클레오티드 서열에 작동가능하게 연결된 프로모터를 더 포함한다. 몇몇 실시예들에서, 프로모터는 발달-조절된(developmentally-regulated) 프로모터, 세포소기관-특이적 프로모터, 조직-특이적 프로모터, 유도성 프로모터, 구성적(constitutive) 프로모터, 또는 세포-특이적 프로모터이다. 전형적으로, 재조합 벡터는 폴리뉴클레오티드 서열에 작동가능하게 연결된 발현 조절 서열; 폴리뉴클레오티드 서열에 작동가능하게 연결된 선택 마커; 폴리뉴클레오티드 서열에 작동가능하게 연결된 마커 서열; 폴리뉴클레오티드 서열에 작동가능하게 연결된 정제 모이어티(purification moiety); 폴리뉴클레오티드 서열에 작동가능하게 연결된 분비 서열(secretion sequence); 및 폴리뉴클레오티드 서열에 작동가능하게 연결된 표적화 서열(targeting sequence)로부터 선택되는 적어도 하나의 서열을 포함한다. 소정 실시예들에서, 뉴클레오티드 서열은 숙주 세포의 게놈 DNA 내로 안정적으로 통합되고, 상기 뉴클레오티드 서열의 발현은 조절된 프로모터 영역에 의해 제어된다. 본 명세서에 사용된 바와 같은 발현 벡터들은 숙주 세포 내에서 폴리뉴클레오티드 서열의 발현에 적절한 형태인 본 명세서에 설명된 특정 폴리뉴클레오티드 서열을 포함한다. 당업자라면, 발현 벡터의 설계가 형질전환되는 숙주 세포의 선택, 원하는 폴리펩티드의 발현 수준 등과 같은 요인들에 의존할 수 있다는 것을 이해할 것이다. 본 명세서에 설명된 발현 벡터들은 본 명세서에 설명되는 바와 같이 폴리뉴클레오티드 서열들에 의해 인코딩되는, 융합 폴리펩티드들을 포함하는 폴리펩티드들을 생성하도록 숙주 세포들에 도입될 수 있다. 원핵생물, 예를 들어 대장균(E. coli)에서 폴리펩티드들을 인코딩하는 유전자의 발현은 대부분 융합 및 비-융합 폴리펩티드들 중 하나의 발현을 지시하는 구성적 또는 유도성 프로모터를 함유하는 벡터들로 수행된다. 융합 벡터들은 그 안에 인코딩된 폴리펩티드에, 일반적으로는 재조합 폴리펩티드의 아미노 또는 카르복시 말단에 다수의 아미노산들을 첨가한다. 전형적으로, 이러한 융합 벡터들은 다음의 3 가지 목적: 재조합 폴리펩티드의 발현을 증가시키고; 재조합 폴리펩티드의 용해도를 증가시키며; 그리고 친화성 정제(affinity purification)에서 리간드로서 작용함으로써 재조합 폴리펩티드의 정제를 돕는 것 중 1 이상을 제공한다. 흔히, 융합 발현 벡터에서, 융합 모이어티와 재조합 폴리펩티드의 접합점에 단백질분해 절단(proteolytic cleavage) 부위가 도입된다. 이는 융합 폴리펩티드의 정제 이후에 융합 모이어티로부터 재조합 폴리펩티드의 분리를 가능하게 한다. 소정 실시예들에서, 본 발명의 폴리뉴클레오티드 서열은 박테리오파지 T5로부터 유래된 프로모터에 작동가능하게 연결된다.
소정 실시예들에서, 숙주 세포는 효모 세포이고, 발현 벡터는 효모 발현 벡터이다. 효모인 맥주효모균(S. cerevisiae) 내에서의 발현을 위한 벡터들의 예시들은 pYepSec1[Baldari 외(1987) EMBO J. 6:229-234]; pMFa[Kurjan 외(1982) Cell 30:933-943]; pJRY88[Schultz 외(1987) Gene 54:113-123]; pYES2(Invitrogen Corp., San Diego, CA), 및 picZ(Invitrogen Corp., San Diego, CA)를 포함한다. 다른 실시예들에서, 숙주 세포는 곤충 세포이고, 발현 벡터는 배큘로바이러스 발현 벡터이다. 배양된 곤충 세포들(예를 들어, Sf9 세포들) 내에서의 단백질들의 발현에 이용가능한 배큘로바이러스 벡터들은, 예를 들어 pAc 계열(series)[Smith 외(1983) Mol . Cell Biol . 3:2156-2165] 및 pVL 계열[Lucklow 외(1989) Virology 170:31-39]을 포함한다. 또 다른 실시예에서, 본 명세서에 설명된 폴리뉴클레오티드 서열들은 포유동물 발현 벡터를 이용하여 포유동물 세포들 내에서 발현될 수 있다. 원핵 및 진핵 세포들 둘 모두에 대한 다른 적절한 발현계들은 당업계에 잘 알려져 있다; 예를 들어, Sambrook 외, "Molecular Cloning: A Laboratory Manual", second edition, Cold Spring Harbor Laboratory(1989)를 참조한다.
본 명세서에서 사용되는 바와 같이, "CoA"는 조효소 A(CoA)의 4'-포스포판테티오닐 모이어티의 술프하이드릴기와 알킬 사슬의 카르보닐 탄소 사이에서 형성되는 아실 티오에스테르를 칭하고, 이는 화학식 R-C(O)S-CoA를 가지며, 여기서 R은 적어도 4 개의 탄소 원자들을 갖는 여하한의 알킬기이다.
"ACP"라는 용어는 아실기 운반 단백질을 의미한다. ACP는 지방산 생합성 동안의 아실 중간체(intermediates)의 고보존성 운반체(highly conserved carrier)이며, 이때 성장 사슬(growing chain)은 4'-포스포판테테인 모이어티의 말단(distal) 티올에서 티올 에스테르로서 합성 동안 결합된다. 단백질은 2 개의 형태, 즉 아포-ACP(지방산 생합성에서 비활성)및 ACP 또는 홀로(holo)-ACP(지방산 생합성에서 활성)로 존재한다. "ACP" 및 "홀로-ACP"라는 용어들은 본 명세서에서 교환가능하게 사용되며, 단백질의 활성 형태를 칭한다. 포스포판테테이닐트랜스페라제라고 하는 효소가 비활성 아포-ACP의 활성 홀로-ACP로의 전환에 관련된다. 더 구체적으로, ACP는 비활성 아포-ACP 형태로 발현되고, 4'-포스포판테테인 모이어티가 홀로-ACP를 생성하기 위해 홀로-아실기 운반 단백질 신타제(ACPS)인 포스포판테테이닐트랜스페라제의 작용에 의해 ACP 상의 보존된 세린 잔기에 번역-후(post-translationally) 부착되어야 한다.
본 명세서에서 사용되는 바와 같이, "아실-ACP"라는 용어는 아실기 운반 단백질(ACP)의 포스포판테테이닐 모이어티의 술프하이드릴기와 알킬 사슬의 카르보닐 탄소 사이에서 형성되는 아실 티오에스테르를 칭한다. 몇몇 실시예들에서, ACP는 완전히 포화된 아실-ACP들의 합성에 있어서 중간체이다. 다른 실시예들에서, ACP는 불포화된 아실-ACP들의 합성에 있어서 중간체이다. 몇몇 실시예들에서, 탄소 사슬은 약 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25 또는 26 개의 탄소들을 가질 것이다.
본 명세서에서 사용되는 바와 같이, "지방산 유도체"라는 용어는 "지방산" 또는 "지방산 유도체"를 의미하고, 이는 "지방산 또는 이의 유도체"로 칭해질 수 있다. "지방산"이라는 용어는 화학식 RCOOH를 갖는 카르복실산을 의미한다. R은 지방족 기(aliphatic group), 바람직하게는 알킬기를 나타낸다. R은 약 4 내지 약 22 개의 탄소 원자들을 포함할 수 있다. 지방산들은 포화, 단일불포화 또는 다중불포화될 수 있다. "지방산 유도체"는 부분적으로 생산 숙주 유기체의 지방산 생합성 경로로부터 만들어지는 생성물이다. "지방산 유도체들"은 부분적으로 ACP, 아실-ACP 또는 아실-ACP 유도체들로부터 만들어지는 생성물들을 포함한다. 예를 들어, 예시적인 지방산 유도체들은 아실-CoA, 지방산, 지방족 알데히드, 짧은 사슬형 및 긴 사슬형 알코올, 지방족 알코올, 탄화수소, 에스테르(예를 들어, 왁스, 지방산 에스테르 또는 지방족 에스테르), 말단 올레핀, 내부 올레핀 및 케톤을 포함한다.
본 명세서에서 언급된 바와 같은 "지방산 유도체 조성물"은 재조합 숙주 세포에 의해 생성되고, 전형적으로 지방산 유도체들의 혼합물을 포함한다. 몇몇 경우에, 혼합물은 하나 이상의 타입의 생성물(예를 들어, 지방산 및 지방족 알코올, 지방산 및 지방산 에스테르, 또는 알칸 및 올레핀)을 포함한다. 다른 경우에, 지방산 유도체 조성물들은 예를 들어 다양한 사슬 길이 및 포화도 또는 분지 특성을 갖는 지방족 알코올들(또는 또 다른 지방산 유도체)의 혼합물을 포함할 수 있다. 다른 경우에, 지방산 유도체 조성물은 하나 이상의 타입의 생성물 및 다양한 사슬 길이 및 포화도 또는 분지 특성을 갖는 생성물들 둘 모두의 혼합물을 포함한다.
본 명세서에서 사용되는 바와 같이, "지방산 생합성 경로"라는 용어는 지방산들 및 이들의 유도체들을 생성하는 생합성 경로를 의미한다. 지방산 생합성 경로는 원하는 특성들을 갖는 지방산 유도체들을 생성하도록 추가적인 효소들을 포함할 수 있다.
"지방산 유도체 생합성 단백질"이라는 용어는 지방산들 및 이들의 유도체들을 생성하는 생합성 단백질(예를 들어, 효소)을 의미한다. 말단 효소[예를 들어, 티오에스테라제(TE), 카르복실산 레덕타제(CAR), 에스테르 신타제, 아실-ACP 레덕타제(AAR), 탈카르보닐라제(decarbonylase), 아실-CoA 레덕타제 등]가 지방산 생합성 단백질의 일 예시이다. 지방산 유도체 생합성 단백질(또는 이러한 지방산 유도체 생합성 단백질들의 조합들)은 지방산, 지방족 알코올, 지방족 에스테르, 지방족 알데히드, 알칸, 알켄, 올레핀, 케톤 등을 생성할 수 있다. 일 실시예에서, 지방산 유도체 생합성 단백질은 효소 활성을 갖는다. 또 다른 실시예에서, 지방산 유도체 생합성 단백질은 지방산, 지방족 알코올, 지방족 에스테르, 지방족 알데히드, 알칸, 알켄, 올레핀(예를 들어, 말단 올레핀, 내부 올레핀), 및/또는 케톤과 같은 지방산 유도체의 생성을 촉진시킬 수 있는 효소이다. 일 특정 실시예에서, 지방산 유도체 생합성 단백질은 지방산을 생성하기 위해 티오에스테라제 활성을 갖거나 티오에스테라제이다. 또 다른 특정 실시예에서, 지방산 유도체 생합성 단백질은 지방족 알코올을 생성하기 위해 카르복실산 레덕타제(CAR) 활성을 갖거나 CAR이다. 또 다른 특정 실시예에서, 지방산 유도체 생합성 단백질은 지방족 알코올 및/또는 지방족 알데히드 및/또는 지방족 알칸 및 알켄을 생성하기 위해 아실-ACP 레덕타제(AAR) 활성을 갖거나 AAR이다. 또 다른 특정 실시예에서, 지방산 유도체 생합성 단백질은 지방족 에스테르를 생성하기 위해 에스테르 신타제 활성을 갖거나 에스테르 신타제이다. 또 다른 특정 실시예에서, 지방산 유도체 생합성 단백질은 올레핀과 같은 탄화수소를 생성하기 위해 OleABCD 활성을 갖거나 OleABCD 단백질이다. 또 다른 특정 실시예에서, 지방산 유도체 생합성 단백질은 케톤을 생성하기 위해 OleA 활성을 갖거나 OleA 단백질이다.
본 명세서에서 사용되는 바와 같이, "지방족 에스테르"는 화학식 RCOOR'를 갖는 에스테르를 의미한다. 본 명세서에서 언급되는 지방족 에스테르는 지방산, 예를 들어 지방산 에스테르로부터 만들어지는 여하한의 에스테르일 수 있다. 몇몇 실시예들에서, R기는 길이가 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 11, 적어도 12, 적어도 13, 적어도 14, 적어도 15, 적어도 16, 적어도 17, 적어도 18, 또는 적어도 19 개의 탄소들이다. 대안적으로 또는 추가적으로, R기는 길이가 20 이하, 19 이하, 18 이하, 17 이하, 16 이하, 15 이하, 14 이하, 13 이하, 12 이하, 11 이하, 10 이하, 9 이하, 8 이하, 7 이하, 또는 6 이하의 탄소들이다. 따라서, R기는 앞선 종말점들 중 어느 2 개로 한정되는 R기를 가질 수 있다. 예를 들어, R기는 길이가 6 내지 16 개의 탄소들, 10 내지 14 개의 탄소들, 또는 12 내지 18 개의 탄소들일 수 있다. 몇몇 실시예들에서, 지방족 에스테르 조성물은 C6, C7, C8, C9, C1O, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C21, C22, C23, C24, C25 및 C26 지방족 에스테르 중 1 이상을 포함한다. 다른 실시예들에서, 지방족 에스테르 조성물은 C6, C7, C8, C9, C1O, C11, C12, C13, C14, C15, C16, C17 및 C18 지방족 에스테르 중 1 이상을 포함한다. 다른 실시예들에서, 지방족 에스테르 조성물은 C12, C14, C16 및 C18 지방족 에스테르; C12, C14 및 C16 지방족 에스테르; C14, C16 및 C18 지방족 에스테르; 또는 C12 및 C14 지방족 에스테르를 포함한다.
지방산 유도체, 예를 들어 지방족 에스테르의 R기는 직쇄형(straight chain) 또는 분지쇄형일 수 있다. 분지쇄형은 1 이상의 분지점을 가질 수 있으며, 사이클릭 분지들을 포함할 수 있다. 몇몇 실시예들에서, 분지형 지방산, 분지형 지방족 알데히드 또는 분지형 지방족 에스테르는 C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C21, C22, C23, C24, C25 또는 C26 분지형 지방산, 분지형 지방족 알데히드 또는 분지형 지방족 에스테르이다. 특정 실시예들에서, 분지형 지방산, 분지형 지방족 알데히드 또는 분지형 지방족 에스테르는 C6, C7, C8, C9, C1O, C11, C12, C13, C14, C15, C16, C17 또는 C18 분지형 지방산 또는 분지형 지방족 에스테르이다. 본 발명의 지방족 에스테르는 A 측 및 B 측을 포함하는 것으로 언급될 수 있다. 본 명세서에서 사용되는 바와 같이, 에스테르의 "A 측"은 에스테르의 카르복실레이트 산소에 부착된 탄소 사슬을 지칭한다. 본 명세서에서 사용되는 바와 같이, 에스테르의 "B 측"은 에스테르의 모(parent) 카르복실레이트를 포함하는 탄소 사슬을 지칭한다. 지방족 에스테르가 지방산 생합성 경로로부터 유래되는 경우, A 측은 통상적으로 알코올이 기여하고, B 측은 지방산이 기여한다.
본 명세서에서 사용되는 바와 같이, "지방족 알데히드"는 카르보닐기(C=O)에 의해 특징되는 화학식 RCHO를 갖는 알데히드를 의미한다. 소정 실시예들에서, R기는 길이가 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 11, 적어도 12, 적어도 13, 적어도 14, 적어도 15, 적어도 16, 적어도 17, 적어도 18, 또는 적어도 19 개의 탄소들이다. 대안적으로 또는 추가적으로, R기는 길이가 20 이하, 19 이하, 18 이하, 17 이하, 16 이하, 15 이하, 14 이하, 13 이하, 12 이하, 11 이하, 10 이하, 9 이하, 8 이하, 7 이하, 또는 6 이하의 탄소들이다. 따라서, R기는 앞선 종말점들 중 어느 2 개로 한정되는 R기를 가질 수 있다. 예를 들어, R기는 길이가 6 내지 16 개의 탄소들, 10 내지 14 개의 탄소들, 또는 12 내지 18 개의 탄소들일 수 있다. 몇몇 실시예들에서, 지방족 알데히드는 C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C21, C22, C23, C24, C25 또는 C26 지방족 알데히드이다. 소정 실시예들에서, 지방족 알데히드는 C6, C7, C8, C9, C1O, C11, C12, C13, C14, C15, C16, C17 또는 C18 지방족 알데히드이다.
본 명세서에서 사용되는 바와 같이, "지방족 알코올"은 화학식 ROH를 갖는 알코올을 의미한다. 몇몇 실시예들에서, R기는 길이가 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 11, 적어도 12, 적어도 13, 적어도 14, 적어도 15, 적어도 16, 적어도 17, 적어도 18, 또는 적어도 19 개의 탄소들이다. 대안적으로 또는 추가적으로, R기는 길이가 20 이하, 19 이하, 18 이하, 17 이하, 16 이하, 15 이하, 14 이하, 13 이하, 12 이하, 11 이하, 10 이하, 9 이하, 8 이하, 7 이하, 또는 6 이하의 탄소들이다. 따라서, R기는 앞선 종말점들 중 어느 2 개로 한정되는 R기를 가질 수 있다. 예를 들어, R기는 길이가 6 내지 16 개의 탄소들, 10 내지 14 개의 탄소들, 또는 12 내지 18 개의 탄소들일 수 있다. 몇몇 실시예들에서, 지방족 알코올은 C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C21, C22, C23, C24, C25 또는 C26 지방족 알코올이다. 소정 실시예들에서, 지방족 알코올은 C6, C7, C8, C9, C1O, C11, C12, C13, C14, C15, C16, C17 또는 C18 지방족 알코올이다.
본 명세서에서 사용되는 바와 같이, "알칸"이라는 용어는 단일 탄소-탄소 결합들만을 포함하는 탄화수소를 의미한다. 알칸은 3 내지 25 개의 탄소들을 포함할 수 있다. 몇몇 예시적인 경우에, 알칸은 트리데칸, 메틸트리데칸, 노나데칸, 메틸노나데칸, 헵타데칸, 메틸헵타데칸, 펜타데칸 또는 메틸펜타데칸이다.
본 명세서에서 사용되는 바와 같이, "알켄" 및 "올레핀"이라는 용어들은 적어도 하나의 탄소-대-탄소 이중 결합을 포함한 불포화 화합물에 관하여 사용된다. 알켄은 3 내지 25 개의 탄소들을 포함할 수 있다. 올레핀은 말단 올레핀일 수 있거나, 또는 내부 이중 결합을 가질 수 있다.
지방산 유도체, 예를 들어 지방족 알코올의 R기는 직쇄형 또는 분지쇄형일 수 있으며, 짝수 또는 홀수의 탄소들을 가질 수 있다. 분지쇄형은 하나 이상의 분지점들을 가질 수 있고, 사이클릭 분지들을 포함할 수 있다. 몇몇 실시예들에서, 분지형 지방산, 분지형 지방족 알데히드 또는 분지형 지방족 알코올은 각각 C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C21, C22, C23, C24, C25 또는 C26 분지형 지방산, 분지형 지방족 알데히드 또는 분지형 지방족 알코올이다. 특정 실시예들에서, 분지형 지방산, 분지형 지방족 알데히드 또는 분지형 지방족 알코올은 각각 C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17 또는 C18 분지형 지방산, 분지형 지방족 알데히드 또는 분지형 지방족 알코올이다. 소정 실시예들에서, 분지형 지방산, 분지형 지방족 알데히드 또는 분지형 지방족 알코올의 하이드록실기는 최초(C1) 위치에 존재한다.
소정 실시예들에서, 분지형 지방산 유도체는 이소(iso)-지방산 유도체, 예를 들어 이소-지방족 알데히드, 이소-지방족 알코올, 이소-지방족 에스테르 또는 안테이소(anteiso)-지방산 유도체, 안테이소-지방족 알데히드, 안테이소-지방족 에스테르, 또는 안테이소-지방족 알코올이다. 예시적인 실시예들에서, 분지형 지방산 유도체는 이소-C7:0, 이소-C8:0, 이소-C9:0, 이소-C10:0, 이소-C11:0, 이소-C12:0, 이소-C13:0, 이소-C14:0, 이소-C15:0, 이소-C16:0, 이소-C17:0, 이소-C18:0, 이소-C19:0, 안테이소-C7:0, 안테이소-C8:0, 안테이소-C9:0, 안테이소-C10:0, 안테이소-C11:0, 안테이소-C12:0, 안테이소-C13:0, 안테이소-C14:0, 안테이소-C15:0, 안테이소-C16:0, 안테이소-C17:0, 안테이소-C18:0 및 안테이소-C19:0 분지형 지방족 알데히드, 지방족 알코올, 지방족 에스테르 또는 지방산으로부터 선택된다.
분지형 또는 비분지형 지방산 유도체의 R기는 포화되거나 불포화될 수 있다. 불포화된 경우, R기는 1 이상의 불포화점을 가질 수 있다. 몇몇 실시예들에서, 불포화 지방산 유도체는 단일불포화 지방산 유도체이다. 소정 실시예들에서, 불포화 지방산 유도체는 C6:1, C7:1, C8:1, C9:1, C10:1, C11:1, C12:1, C13:1, C14:1, C15:1, C16:1, C17:1, C18:1, C19:1, C20:1, C21:1, C22:1, C23:1, C24:1, C25:1 또는 C26:1 불포화 지방산 유도체이다. 소정 실시예들에서, 불포화 지방산 유도체는 C10:1, C12:1, C14:1, C16:1 또는 C18:1 불포화 지방산 유도체이다. 다른 실시예들에서, 불포화 지방산 유도체는 오메가-7 위치에서 불포화된다. 소정 실시예들에서, 불포화 지방산 유도체는 시스(cis) 이중 결합을 포함한다.
본 명세서에서 사용되는 바와 같이, "재조합 또는 조작된 숙주 세포"는 아실-CoA, 지방산, 짧은 사슬형 및 긴 사슬형 알코올, 지방족 알코올, 지방족 알데히드, 지방족 에스테르(예를 들어, 왁스, 지방산 에스테르 또는 지방족 에스테르), 탄화수소(예를 들어, 말단 올레핀 및 내부 올레핀), 및 케톤을 포함(단, 이에 제한되지 않음)하는 지방산 유도체들 중 1 이상을 생성하도록(또는 그 증가된 양을 생성하도록) 변형된 숙주 세포(예를 들어, 미생물 또는 미생물 세포)이다. 바람직한 일 실시예에서, 재조합 숙주 세포는 소정 지방산 유도체(또는 소정 지방산 유도체를 더 많이)를 생성하기 위해 증가된 효소 활성을 포함한다. 재조합 숙주 세포는 1 이상의 이러한 증가된 효소 활성들을 포함하도록 변형되거나 조작될 수 있다. 다른 바람직한 실시예들에서, 재조합 숙주 세포는 1 이상의 폴리뉴클레오티드들을 포함하며, 각각의 폴리뉴클레오티드는 지방산 유도체 생합성 단백질 활성을 갖는 폴리펩티드를 인코딩하고, 이때 재조합 숙주 세포는 폴리뉴클레오티드를 발현시키는 데 효과적인 조건들에서 탄소원의 존재 하에 배양되는 경우 지방산 유도체 조성물을 생성한다.
본 명세서에서 사용되는 바와 같이, 재조합 숙주 세포의 "변형된" 또는 "변경된 수준"이라는 용어는 모 또는 원시 숙주 세포에 대해 결정된 활성의 1 이상의 특징의 차이를 지칭한다. 통상적으로, 활성의 차이는 변형된 활성을 갖는 재조합 숙주 세포와 대응하는 야생형 숙주 세포 사이에서 결정된다(예를 들어, 대응하는 야생형 숙주 세포에 대한 재조합 숙주 세포의 배양물의 비교). 예를 들어, 변형된 활성들은 [예를 들어, 단백질을 인코딩하는 DNA 서열의 증가 또는 감소된 수의 복제, 단백질을 인코딩하는 증가 또는 감소된 수의 mRNA 전사체, 및/또는 mRNA로부터의 단백질의 증가 또는 감소된 양의 단백질 번역의 결과로서] 재조합 숙주 세포에 의해 발현되는 변형된 양의 단백질; 단백질의 구조 변화[예를 들어, 기질 특이성의 변화, 관찰되는 운동 파라미터들(kinetic parameters)의 변화를 유도하는 단백질 코딩 서열에 대한 변화와 같은 일차 구조에 대한 변화); 및 단백질 안정성의 변화(예를 들어, 단백질의 증가 또는 감소된 분해)의 결과일 수 있다. 몇몇 실시예들에서, 폴리펩티드는 본 명세서에 설명된 폴리펩티드들 중 어느 하나의 돌연변이체 또는 변이체이다. 소정 경우들에서, 본 명세서에 설명된 폴리펩티드들의 코딩 서열들은 특정 숙주 세포에서의 발현에 최적화된 코돈(codon)이다. 예를 들어, 대장 균에서의 발현에 대하여, 예를 들어 Grosjean 외(1982) Gene 18:199-209에 설명된 바와 같이 1 이상의 코돈이 최적화될 수 있다.
본 명세서에서 사용되는 바와 같이, "클론"이라는 용어는 통상적으로 단일 공통 선조와 본질적으로 유전적으로 동일하고 이의 자손인 세포 또는 세포들의 그룹, 예를 들어 단일 박테리아 세포에서 발생하는 클로닝된 박테리아 콜로니(cloned bacterial colony)의 박테리아를 지칭한다.
본 명세서에서 사용되는 바와 같이, "배양"이라는 용어는 통상적으로 생세포(viable cell)들을 포함하는 액체 배지를 지칭한다. 일 실시예에서, 배양은 제어된 조건들 하에서 사전설정된 배양 배지에서 번식하는 세포들, 예를 들어 선택된 탄소원 및 질소를 포함하는 액체 배지에서 성장되는 재조합 숙주 세포들의 배양을 포함한다.
"배양하는" 또는 "배양"은 액체 또는 고체 배지의 적절한 조건들 하에서 재조합 숙주 세포들의 개체군을 성장시키는 것을 지칭한다. 특정 실시예들에서, 배양은 최종 생성물로의 기질의 발효성 생물전환(bioconversion)을 지칭한다. 배양 배지는 잘 알려져 있으며, 이러한 배양 배지의 각각의 성분들은 예를 들어 DIFCO 및 BBL 상표들의 상용 공급원(commercial source)들로부터 이용가능하다. 비-제한적인 일 예시에서, 수성 영양 배지(aqueous nutrient medium)는 YP 배지와 같이 질소, 염 및 탄소의 복합원을 포함하는 "풍부한 배지(rich medium)"이며, 이는 약 10 g/L의 펩톤 및 10 g/L 효모 추출물을 포함한다. 배양되어야 하는 여하한의 숙주 세포는, 미국 특허들 5,000,000; 5,028,539; 5,424,202; 5,482,846; 5,602,030; 및 특허 출원 공개공보 WO 2010127318에 설명된 방법들에 따라, 탄소를 효율적으로 동화시키고 탄소원으로서 셀룰로스 물질(cellulosic material)들을 사용하도록 조작될 수 있다. 또한, 몇몇 실시예들에서, 숙주 세포는 인베르타제를 발현시키도록 조작되어, 수크로스가 탄소원으로서 사용될 수 있도록 한다.
본 명세서에서 사용되는 바와 같이, "외인성 또는 이종 뉴클레오티드 서열을 발현시키기에 효과적인 조건들 하에서"라는 용어는 숙주 세포(예를 들어, 재조합 숙주 세포)로 하여금 원하는 지방산 유도체를 생성하게 하는 여하한의 조건들을 의미한다. 적절한 조건들은, 예를 들어 발효 조건들을 포함한다.
통상적으로, 본 명세서에서 사용되는 바와 같은 "조절 서열(regulatory sequences)"이라는 용어는 궁극적으로 단백질의 발현을 제어하는 단백질을 인코딩하는 DNA 서열들에 작동가능하게 연결된, DNA의 염기 서열을 지칭한다. 조절 서열의 예시들은 RNA 프로모터 서열, 전사 인자 결합 서열(transcription factor binding sequences), 전사 종결 서열, [증폭자 요소와 같은] 전사의 조절인자(modulators), RNA 안정성에 영향을 주는 뉴클레오티드 서열, 및 번역 조절 서열[예컨대, 리보솜 결합 부위(예를 들어, 원핵생물의 샤인-달가노 서열(Shine-Dalgarno sequences) 또는 진핵생물의 코작 서열(Kozak sequences), 개시 코돈, 종결 코돈]을 포함하며, 이에 제한되지는 않는다.
본 명세서에 사용되는 바와 같이, 상기 뉴클레오티드 서열의 발현은 야생형 뉴클레오티드 서열에 대해 변형된다"라는 어구는, 내인성 뉴클레오티드 서열의 발현 및/또는 활성, 또는 외인성 또는 이종 또는 비-원시 폴리펩티드-인코딩 뉴클레오티드 서열의 발현 및/또는 활성의 수준의 증가 또는 감소를 의미한다.
본 명세서에서 사용되는 바와 같이, 폴리뉴클레오티드에 대한 "발현"이라는 용어는 이것이 기능하게 한다는 것이다. 폴리펩티드(또는 단백질)를 인코딩하는 폴리뉴클레오티드는, 발현될 때, 그 폴리펩티드(또는 단백질)를 생성하기 위해 전사 및 번역될 것이다. 본 명세서에 사용되는 바와 같이, "과발현"이라는 용어는 동일한 조건들 하에서 대응하는 야생형 세포에서 정상적으로 발현되는 것보다 더 높은 농도로 세포에서 폴리뉴클레오티드 또는 폴리펩티드를 발현시키는 것(또는 발현시키게 하는 것)을 의미한다.
"변경된 수준의 발현" 및 "변형된 수준의 발현"이라는 용어는 교환가능하게 사용되며, 폴리뉴클레오티드 또는 폴리펩티드가 동일한 조건들 하에서 대응하는 야생형 세포의 농도에 비해 조작된 숙주 세포에서 상이한 농도로 존재한다는 것을 의미한다.
본 명세서에서 사용되는 바와 같이, "역가"라는 용어는 숙주 세포 배양의 단위 부피당 생성된 지방산 유도체의 양(quantity)을 지칭한다. 본 명세서에 설명된 조성물들 및 방법들의 여하한의 실시형태에서, 지방산 유도체는 약 25 mg/L, 약 50 mg/L, 약 75 mg/L, 약 100 mg/L, 약 125 mg/L, 약 150 mg/L, 약 175 mg/L, 약 200 mg/L, 약 225 mg/L, 약 250 mg/L, 약 275 mg/L, 약 300 mg/L, 약 325 mg/L, 약 350 mg/L, 약 375 mg/L, 약 400 mg/L, 약 425 mg/L, 약 450 mg/L, 약 475 mg/L, 약 500 mg/L, 약 525 mg/L, 약 550 mg/L, 약 575 mg/L, 약 600 mg/L, 약 625 mg/L, 약 650 mg/L, 약 675 mg/L, 약 700 mg/L, 약 725 mg/L, 약 750 mg/L, 약 775 mg/L, 약 800 mg/L, 약 825 mg/L, 약 850 mg/L, 약 875 mg/L, 약 900 mg/L, 약 925 mg/L, 약 950 mg/L, 약 975 mg/L, 약 1000 mg/L, 약 1050 mg/L, 약 1075 mg/L, 약 1100 mg/L, 약 1125 mg/L, 약 1150 mg/L, 약 1175 mg/L, 약 1200 mg/L, 약 1225 mg/L, 약 1250 mg/L, 약 1275 mg/L, 약 1300 mg/L, 약 1325 mg/L, 약 1350 mg/L, 약 1375 mg/L, 약 1400 mg/L, 약 1425 mg/L, 약 1450 mg/L, 약 1475 mg/L, 약 1500 mg/L, 약 1525 mg/L, 약 1550 mg/L, 약 1575 mg/L, 약 1600 mg/L, 약 1625 mg/L, 약 1650 mg/L, 약 1675 mg/L, 약 1700 mg/L, 약 1725 mg/L, 약 1750 mg/L, 약 1775 mg/L, 약 1800 mg/L, 약 1825 mg/L, 약 1850 mg/L, 약 1875 mg/L, 약 1900 mg/L, 약 1925 mg/L, 약 1950 mg/L, 약 1975 mg/L, 약 2000 mg/L(2 g/L), 3 g/L, 5 g/L, 1O g/L, 20 g/L, 30 g/L, 40 g/L, 50 g/L, 60 g/L, 70 g/L, 80 g/L, 90 g/L, 1OO g/L 또는 상기 값들 중 어느 2 개의 값들에 의해 한정되는 범위의 역가로 생성된다. 다른 실시예들에서, 지방산 유도체는 1OO g/L 초과, 200 g/L 초과, 300 g/L 초과 또는 그 이상의 역가로 생성된다. 본 발명의 방법들에 따라 재조합 숙주 세포에 의해 생성되는 지방산 유도체의 바람직한 역가는 5 g/L 내지 200g/L, 1O g/L 내지 150 g/L, 20 g/L 내지 120 g/L, 및 30 g/L 내지 1OO g/L이다. 역가는 주어진 재조합 숙주 세포 배양에 의해 생성되는 특정 지방산 유도체 또는 지방산 유도체들의 조합물을 언급할 수 있다.
본 명세서에서 사용되는 바와 같이, "숙주 세포에 의해 생성되는 지방산 유도체의 수율"은 투입된 탄소원이 숙주 세포의 생성물(즉, 지방산, 지방족 알데히드, 지방족 알코올, 지방족 에스테르, 알칸, 알켄, 올레핀, 케톤 등)로 전환되는 효율을 지칭한다. 본 발명의 방법들에 따라 지방산 유도체들을 생성하도록 조작된 숙주 세포는 적어도 3 %, 적어도 4 %, 적어도 5 %, 적어도 6 %, 적어도 7 %, 적어도 8 %, 적어도 9 %, 적어도 10 %, 적어도 11 %, 적어도 12 %, 적어도 13 %, 적어도 14 %, 적어도 15 %, 적어도 16 %, 적어도 17 %, 적어도 18 %, 적어도 19 %, 적어도 20 %, 적어도 21 %, 적어도 22 %, 적어도 23 %, 적어도 24 %, 적어도 25 %, 적어도 26 %, 적어도 27 %, 적어도 28 %, 적어도 29 %, 또는 적어도 30 % 또는 상기 값들 중 어느 2 개의 값들에 한정되는 범위의 수율을 갖는다. 다른 실시예들에서, 지방산 유도체 또는 유도체들은 30 %, 40 %, 50 %, 60 %, 70 %, 80 %, 90 % 또는 그 이상을 초과하는 수율로 생성된다. 대안적으로 또는 추가적으로, 수율은 약 30 % 이하, 약 27 % 이하, 약 25 % 이하, 또는 약 22 % 이하이다. 따라서, 수율은 상기 종말점들 중 어느 2 개의 값들에 의해 한정될 수 있다. 예를 들어, 본 발명의 방법들에 따라 재조합 숙주 세포에 의해 생성되는 지방산 유도체 또는 유도체들의 수율은 5 % 내지 15 %, 10 % 내지 20 %, 10 % 내지 22 %, 10 % 내지 25 %, 15 % 내지 20 %, 15 % 내지 22 %, 15 % 내지 25 %, 18 % 내지 22 %, 20 % 내지 28 %, 또는 20 % 내지 30 %일 수 있다. 수율은 주어진 재조합 숙주 세포 배양에 의해 생성되는 특정 지방산 유도체 또는 지방산 유도체들의 조합물을 언급할 수 있다.
본 명세서에서 사용되는 바와 같이, "생산성"이라는 용어는 단위 시간당 숙주 세포 배양의 단위 부피당 생성되는 지방산 유도체 또는 유도체들의 양을 지칭한다. 본 명세서에 설명된 조성물들 및 방법들의 여하한의 실시형태에서, 재조합 숙주 세포에 의해 생성되는 지방산 유도체 또는 유도체들의 생산성은 적어도 100 mg/L/hour, 적어도 200 mg/L/hour, 적어도 300 mg/L/hour, 적어도 400 mg/L/hour, 적어도 500 mg/L/hour, 적어도 600 mg/L/hour, 적어도 700 mg/L/hour, 적어도 800 mg/L/hour, 적어도 900 mg/L/hour, 적어도 1000 mg/L/hour, 적어도 1100 mg/L/hour, 적어도 1200 mg/L/hour, 적어도 1300 mg/L/hour, 적어도 1400 mg/L/hour, 적어도 1500 mg/L/hour, 적어도 1600 mg/L/hour, 적어도 1700 mg/L/hour, 적어도 1800 mg/L/hour, 적어도 1900 mg/L/hour, 적어도 2000 mg/L/hour, 적어도 2100 mg/L/hour, 적어도 2200 mg/L/hour, 적어도 2300 mg/L/hour, 적어도 2400 mg/L/hour, 또는 적어도 2500 mg/L/hour이다. 예를 들어, 본 발명의 방법들에 따라 재조합 숙주 세포에 의해 생성되는 지방산 유도체 또는 유도체들의 생산성은 500 mg/L/hour 내지 2500 mg/L/hour, 또는 700 mg/L/hour 내지 2000 mg/L/hour일 수 있다. 생산성은 주어진 재조합 숙주 세포 배양에 의해 생성되는 특정 지방산 유도체 또는 지방산 유도체들의 조합물을 언급할 수 있다.
본 명세서에서 사용되는 바와 같이, "총 지방 종(total fatty species)" 및 "총 지방산 생성물"이라는 용어는, 예를 들어 GC-FID에 의해 평가되는 바와 같은 지방족 알코올, 지방족 알데히드, 지방족 에스테르, 지방산, 탄화수소 등의 조합된 양과 관련하여 본 명세서에서 교환가능하게 사용될 수 있다. 예를 들어, 지방족 에스테르 분석을 설명하는 경우, "총 지방 종" 및 "총 지방산 생성물"이라는 용어들은 지방족 에스테르 및 유리 지방산의 조합된 양을 언급하는 데 사용된다.
본 명세서에서 사용되는 바와 같이, "글루코스 이용률"이라는 용어는 그램/리터/시간(g/L/hr)으로 기록되는, 단위 시간당 배양에 의해 사용되는 글루코스의 양을 의미한다.
본 명세서에서 사용되는 바와 같이, "탄소원"이라는 용어는 원핵 또는 단순한 진핵 세포 성장을 위한 탄소원으로서 사용되는 데 적절한 기질 또는 화합물을 지칭한다. 탄소원은 중합체, 탄수화물, 산, 알코올, 알데히드, 케톤, 아미노산, 펩티드 및 기체(예를 들어, CO 및 CO2)를 포함하는 다양한 형태로 존재할 수 있으며, 이에 제한되지는 않는다. 예시적인 탄소원은 글루코스, 프럭토스, 마노스, 갈락토스, 자일로스 및 아라비노스와 같은 단당류; 프럭토-올리고당 및 갈락토-올리고당과 같은 올리고당류; 녹말, 셀룰로스, 펙틴 및 자일란과 같은 다당류; 수크로스, 말토스, 셀로비오스 및 투라노스(turanose)와 같은 이당류; 헤미셀룰로스, 메틸 셀룰로스 및 소듐 카르복시메틸 셀룰로스와 같은 셀룰로스 물질 및 변이체들; 포화 또는 불포화 지방산, 숙시네이트, 락테이트 및 아세테이트; 에탄올, 메탄올 및 글리세롤과 같은 알코올류, 또는 이의 혼합물들을 포함하며, 이에 제한되지는 않는다. 또한, 탄소원은 글루코스와 같은 광합성의 산물일 수 있다. 소정 실시예들에서, 탄소원은 플루 가스(flu gas)로부터 나오는 CO를 함유한 기체 혼합물이다. 또 다른 실시예에서, 탄소원은 바이오매스, 석탄, 또는 천연 가스와 같은 탄소 함유 물질의 개량(reformation)으로부터 나오는 CO를 함유한 기체 혼합물이다. 다른 실시예들에서, 탄소원은 합성가스, 메탄, 또는 천연 가스이다. 바람직한 소정 실시예들에서, 탄소원은 바이오매스이다. 다른 바람직한 실시예들에서, 탄소원은 글루코스이다. 다른 바람직한 실시예들에서, 탄소원은 수크로스이다. 다른 실시예들에서, 탄소원은 글리세롤이다. 다른 바람직한 실시예들에서, 탄소원은 사탕수수 쥬스, 사탕수수 시럽, 또는 옥수수 시럽이다. 다른 바람직한 실시예들에서, 탄소원은 CO2, CO, 글루코스, 수크로스, 자일로스, 아라비노스, 글리세롤, 마노스, 또는 이의 혼합물들과 같은 재생가능한 공급원료로부터 유래된다. 다른 실시예들에서, 탄소원은 녹말, 셀룰로스 바이오매스, 당밀, 및 셀룰로스 바이오매스의 가수분해로부터 유래된 탄수화물 혼합물들 또는 식물이나 천연 오일 처리로부터 유래된 폐기물을 포함한 다른 탄수화물 공급원들을 포함하는 재생가능한 공급원료로부터 유래된다.
본 명세서에서 사용되는 바와 같이, "바이오매스"라는 용어는 탄소원이 유래되는 여하한의 생물학적 물질을 지칭한다. 몇몇 실시예들에서, 바이오매스는 탄소원으로 처리되며, 이는 생물전환에 적절하다. 다른 실시예들에서, 바이오매스는 탄소원으로의 추가적인 처리를 요구하지 않는다. 예시적인 바이오매스의 공급원은 옥수수, 사탕수수 또는 스위치그래스(switchgrass)와 같은 식물성 물질 또는 식생(vegetation)이다. 또 다른 예시적인 바이오매스의 공급원은 동물성 물질[예를 들어, 우분(cow manure)]과 같은 신진대사 노폐물(metabolic waste products)이다. 또 다른 예시적인 바이오매스의 공급원은 조류 및 다른 해양 식물을 포함한다. 또한, 바이오매스는 글리세롤, 발효 찌꺼기, 목초, 짚, 목재, 오수, 쓰레기, 셀룰로스 도시 폐기물 및 음식 쓰레기(예를 들어, 비누, 오일 및 지방산)를 포함하는(단, 이에 제한되지 않음) 산업, 농업, 임업 및 가정으로부터의 폐기물을 포함한다. 또한, "바이오매스"라는 용어는 탄수화물(예를 들어, 단당류, 이당류 또는 다당류)과 같은 탄소원을 지칭할 수 있다.
본 명세서에서 사용되는 바와 같이, (지방산 및 그 유도체와 같은) 생성물들에 대하여 "격리된(isolated)"이라는 용어는 세포 성분, 세포 배양 배지, 또는 화학적 또는 합성 전구체로부터 분리(separate)되는 생성물들을 언급한다. 본 명세서에 설명된 방법들에 의해 생성되는 지방산 및 그 유도체는 세포질뿐만 아니라 발효액에서 비교적 혼합되지 않을 수 있다. 그러므로, 지방산 및 그 유도체는 세포내 또는 세포외에서 유기 상(organic phase)으로 수집될 수 있다.
본 명세서에서 사용되는 바와 같이, "정제한다", "정제된" 또는 "정제"라는 용어들은, 예를 들어 격리 또는 분리에 의한 그 환경으로부터의 분자의 제거 또는 격리를 의미한다. "실질적으로 정제된" 분자는 연계되는 다른 성분들로부터 적어도 약 60 % 유리(예를 들어, 적어도 약 70 % 유리, 적어도 약 75 % 유리, 적어도 약 85 % 유리, 적어도 약 90 % 유리, 적어도 약 95 % 유리, 적어도 약 97 % 유리, 적어도 약 99 % 유리)된다. 본 명세서에서 사용되는 바와 같이, 또한 이러한 용어들은 샘플로부터의 오염물의 제거를 지칭한다. 예를 들어, 오염물의 제거는 샘플에서의 지방산 유도체의 비율의 증가를 유도할 수 있다. 예를 들어, 지방산 유도체가 재조합 숙주 세포에서 생성될 때, 지방산 유도체는 숙주 세포 단백질 또는 다른 숙주 세포 물질들의 제거에 의해 정제될 수 있다. 정제 후, 샘플에서의 지방산 유도체의 비율이 증가된다. "정제한다", "정제된" 및 "정제"라는 용어들은 절대 순도를 필요로 하지 않는 상대적인 용어들이다. 따라서, 예를 들어 지방산 유도체가 재조합 숙주 세포에서 생성될 때, 정제된 지방산 유도체는 다른 세포 성분(예를 들어, 핵산, 폴리펩티드, 지질, 탄수화물 또는 기타 탄화수소)으로부터 실질적으로 분리되는 지방산 유도체이다.
생합성 경로 조작
생합성 경로들은 지방산 유도체 생성을 증가시키기 위해, 특정한 효소 활성을 갖는 단백질들에 대해 코딩하는 유전자들을 추가하거나 제거하도록 조작 또는 조정(manipulate)될 수 있다. 도 2는 말로닐-ACP 및 아실-ACP의 축합으로 시작하고 아실-ACP로 끝나는 예시적인 생합성 경로를 나타내고, 이는 많은 조작된 생화학 경로들에 대한 시작점을 제공한다. 나타낸 바와 같이, 말로닐-ACP는 (말로닐-CoA:ACP 트랜스아실라제; fabD에 의해 촉진되는) 말로닐-CoA의 말로닐-ACP로의 아실기전이(transacylation)에 의해 생성되고, 그 후 β-케토아실-ACP 신타제 Ⅲ(fabH)가 아세틸-CoA와 말로닐-ACP의 축합을 개시한다. 도 2에 더 나타낸 바와 같이, 신장 주기(elongation cycle)들이 β-케토아실-ACP 신타제 I(fabB) 및 β-케토아실-ACP 신타제 Ⅱ(fabF)에 의해 촉진되는 말로닐-ACP 및 아실-ACP의 축합으로 시작되어 β-케토-아실-ACP를 생성한다. 그 후, β-케토-아실-ACP는 NADPH-의존 β-케토아실-ACP 레덕타제(fabG)에 의해 환원되어 β-하이드록시-아실-ACP를 생성하며, 이는 β-하이드록시아실-ACP 탈수효소(fabA 또는 fabZ)에 의해 트랜스-2-엔오일-아실-ACP로 탈수된다. 또한, FabA는 트랜스-2-엔오일-아실-ACP를 시스-3-엔오일-아실-ACP로 이성질화(isomerize)할 수 있으며, 이는 fabI를 우회할 수 있고 (전형적으로 C16의 지방족 사슬 길이까지) fabB에 의해 사용되어 β-케토-아실-ACP를 생성할 수 있다. 각각의 주기에서 최종 단계는 트랜스-2-엔오일-아실-ACP를 아실-ACP로 전환시키는 NADH 또는 NADHPH-의존 엔오일-ACP 레덕타제(fabI)에 의해 촉진된다.
본 명세서에 설명된 방법들에서, 지방산 생합성의 종료는 유리 지방산(FFA)을 방출하도록 아실-ACP에서 아실기의 티오에스테라제를 제거함으로써 일어난다. 여기에서, 티오에스테라제들이 티오에스테르 결합들을 가수분해하고, 이는 술프하이드릴 결합들을 통하여 ACP 및 아실 사슬들 사이에서 일어난다. 따라서, 지방산 유도체 생성은 지방산의 더 높은 생성을 초래하는 티오에스테라제를 과발현시키거나 상향-조절함으로써 증가될 수 있다. 티오에스테라제가 카르복실산 레덕타제(CAR)와 같은 다른 지방산 유도체 생합성 효소들과 조합하여 과발현되는 경우, 경로는 증가된 양의 지방족 알데히드를 초래할 것이다. 도 4에 나타낸 바와 같이, 지방족 알코올의 생성을 위한 예시적인 생합성 경로는 아실-ACP 레덕타제(AAR); 또는 카르복실산 레덕타제(CAR)와 조합한 티오에스테라제의 효소 활성에 의해 촉진되는 지방족 알데히드의 생성으로 시작한다. 그 후, 지방족 알데히드는 지방족 알데히드 레덕타제 활성(알코올 탈수소효소 활성이라고도 함)에 의해 지방족 알코올로 전환될 수 있다.
아실-ACP로 시작하는 조작된 생합성 경로의 또 다른 예시가 도 5에 도시되며, 이때 지방족 에스테르가 2 개의 대안적인 루트를 통해 생성된다. 나타낸 바와 같이, 하나의 예시적인 생합성 경로는 1 효소계(즉, 에스테르 신타제)를 채택하여 지방족 에스테르를 생성한다. 또 다른 예시적인 생합성 경로는, 지방족 에스테르를 생성하기 위해 3 효소계[즉, 티오에스테라제(TE), 아실-CoA 신테타제(FadD), 및 에스테르 신타제(ES)]를 사용한다.
아실-ACP로 시작하는 또 다른 예시적인 생합성 경로는 탄화수소의 생성이다. 도 6에 나타낸 바와 같이, 내부 올레핀의 생성은 OleABCD의 효소 활성에 의해 촉진된다. 알칸의 생성은 AAR에 의한 아실-ACP의 지방족 알데히드로의 효소 전환에 의해, 그리고 이후 알데히드 탈카르보닐라제(ADC)에 의한 지방족 알데히드의 알칸으로의 효소 전환에 의해 촉진된다. 말단 올레핀의 생성은 탈카르복실라제에 의한 지방산의 말단 올레핀으로의 효소 전환에 의해 촉진된다. 또한, 케톤의 생성은 아실-ACP를 지방족 케톤(aliphatic ketone)으로 전환시키는 OleA의 효소 활성에 의해 촉진된다.
지방산, 지방족 알코올, 지방족 에스테르, 지방족 알데히드 등의 생성과 같은 지방산 유도체 생성은 아실-CoA 카르복실라제를 과발현시키거나 상향-조절함으로써 더 증가될 수 있다. 이는 ACC가 말로닐-CoA를 생성하고, 이후 이것이 아세토아세틸-ACP 개시 분자들의 주기적 신장을 통해 모든 지방족 아실 화합물들이 만들어지는 기질인 말로닐-ACP로 전환되기 때문에 일어난다. 도 3은 (aacABCD 유전자에 의해 인코딩된) 아세틸-CoA 카르복실라제 효소 복합체의 구조 및 기능을 예시한다. 비오틴 카르복실라제가 accC 유전자에 의해 인코딩되는 반면, 비오틴 카르복실 운반 단백질(BCCP)이 accB 유전자에 의해 인코딩된다. 카르복실 트랜스페라제 활성과 관련된 2 개의 서브유닛(subunit)은 accA 및 accD 유전자들에 의해 인코딩된다. BCCP의 공유 결합된 비오틴은 카르복실레이트 모이어티를 운반한다. birA 유전자는 birA 비오티닐레이트 홀로-accB를 생성한다(도 3 참조). BirA는 이작용기 비오틴-[아세틸-CoA-카르복실라제] 리가제 및 전사 리프레서를 나타낸다. 이러한 것으로서, birA는 비오틴 리가제 활성을 보이고, 또한 비오틴 오페론의 DNA 결합 전사 리프레서로서 작용하는 이작용기 단백질이다.
지방산 유도체 생성에 대한
ACP
증가의 효과
본 발명은 지방산 유도체의 생성을 위한 지방산 유도체 생합성 단백질 및 아실기 운반 단백질(ACP)을 과발현시키는 재조합 미생물을 제공한다. 이 변형된 미생물들은 그 원시 대응물 또는 대응하는 야생형 미생물에 비해, 더 높은 역가, 더 높은 수율, 및/또는 더 높은 생산성의 지방산 유도체 생성을 특징으로 할 수 있다.
본 발명을 예시하기 위해, 미생물(예를 들어, 미생물 세포)은 지방산 유도체들의 생성을 증가시키기 위해 ACP 및 지방산 유도체 생합성 단백질을 과발현시키도록 변형되었다[이하(infra) 예시들 참조]. 아세틸-CoA 카르복실라제(ACC) 복합체 및 지방산 생합성(Fab) 경로를 통한 아세틸-CoA로부터의 아실-ACP의 공급은 원시 세포에서 지방산 및 지방산 유도체 생성률에 영향을 줄 수 있다. 지방산 생합성을 통해 플럭스(flux)를 증가시키는 한가지 접근법은, Fab 경로에서 다양한 효소들을 조정하고, 및/또는 ACP와 같은 율속 시작 물질(rate-limiting starting material)의 양을 증가시키는 것이다. ACP 단백질들은 모든 미생물에서 어느 정도까지 전환되지만, 이들의 일차 서열(primary sequence)이 상이할 수 있다. 지방족 아실-ACP를 생성물로 전환시키기 위해 대장균(E. coli) 이외의 공급원들로부터의 말단 경로 효소들이 대장균에서 발현되는 경우, 예를 들어 지방족 아실-ACP를 향한 재조합 경로 효소의 인식, 친화성, 및/또는 대사회전(turnover)에 있어서 한계들이 존재할 수 있음이 제안되었다[Suh 외(1999) The Plant Journal 17(6):679-688; Salas 외(2002) Archives of Biochemistry and Biophysics 403:25-34 참조].
하지만, ACP는 지방산의 신장에서 중요한 역할을 하는 것으로 알려져 있다. 예를 들어, acpP 유전자에 의해 인코딩된 대장균 ACP(ecACP)는 지방산 사슬들이 신장될 때, 포스포판테테인 보결분자단(prosthetic group)에 대한 티오에스테르 연결을 통해 지방산 사슬들을 운반한다. 이론에 얽매이고자 하는 것은 아니지만, 본 명세서에서는 ACP 유전자들의 과발현이 아실-ACP의 양을 증가시키는 데 효과적일 수 있으며, 이는 지방산 생합성 및 신장의 효율성의 수준에 긍정적 영향을 줄 수 있다고 제시된다. 예를 들어, 세포들에서 산출되는 생성물은 아실-ACP의 가용률(availability)에 어느 정도 의존하며, 따라서 ACP 발현을 증가시키는 것이 세포 내에서 아실-ACP 분자들의 수를 증가시켜, 지방산 생합성 기구에 의해 더 많은 수의 아실-사슬들이 신장될 것이므로 더 많은 지방산 유도체 생성물을 초래하는 것으로 여겨진다. 또한, ACP의 발현을 증가시키는 것이 예를 들어 ACC, fabH, 및/또는 fabI와 같은 상이한 노드들에서 지방산 생합성을 탈-조절(de-regulate)할 수 있다. 효소 ACC, fabH 및/또는 fabI은 긴 사슬형 아실-ACP에 의해 억제되는 것으로 여겨진다[Davis 외(2001) Journal of Bacteriology 183(4):1499-1593; Heath 외(1996) The Journal of Biological Chemistry 271(4):1833-1836; 및 Heath 외(1996) The Journal of Biological Chemistry 271(18):10996-11000 참조]. 따라서, 긴 사슬형 아실-ACP의 누적은 지방산 유도체의 생성을 늦출 것이다. ACP의 가용률을 증가시키는 것이 ACC, fabH 및/또는 fabI를 탈-억제(de-inhibit)하고, 이어서 지방산 유도체 산출량을 증가시킬 수 있다.
화합물 아세틸-CoA 및 말로닐-CoA는 지방산 생합성을 위한 중요한 전구체들이다. 세포에서 이 전구체들의 가용률이 감소되는 경우, 이는 지방산 유도체들의 합성을 감소시킬 수 있다. 지방산 생합성을 통해 플럭스를 증가시키는 한가지 접근법은 경로에서 다양한 효소들을 조정하는 것이다(도 1 내지 도 3 참조). 아세틸-CoA 카르복실라제(ACC) 복합체 및 지방산 생합성(Fab) 경로를 통한 아세틸-CoA로부터의 아실-ACP의 공급은 지방산 유도체 생성률에 영향을 줄 수 있다(도 2 참조). 지방산 유도체들의 생성에 대한 ACP의 과발현의 효과는 예시 1 내지 예시 4(이하)에서 테스트되었다. 놀랍게도, 세포들은 최종 생성물 산출, 즉 지방산 유도체 생성에 있어서 상당한 증가를 나타내었다. 이는 (세포 내에서 가장 풍부한 단백질들 중 하나인) ACP의 과발현이 대장균에서 세포 성장을 억제, 즉 완전히 중단된 대장균 세포들의 성장률의 약 20 배만큼 ACP를 과발현시킨 3 내지 4 시간 이내에서 세포 성장을 억제하는 것으로 나타났기 때문에 기대되지 않았다[Keating 외(1995) The Journal of Biological Chemistry 270(38):22229-22235 참조]. 앞서, ACP가 다-복사 플라스미드로부터 과잉 생성되는 경우, ACP의 번역-후 변형을 위한 세포 능력(cellular capacity)은 율속(rate-limiting)이 되고, 아포-ACP(비활성 형태)가 세포에 누적되어, 야생형 세포들은 아포-ACP의 검출가능한 풀(detectable pools)을 갖지 않으므로 독성을 초래할 가능성이 크다고 결정되었다(앞선 Keating 참조). 따라서, ACP 발현을 증가시키는 것이 앞서 관찰된 세포 피드백 억제 및 제한된 성장을 유도할 것으로 기대되었다. 그 대신, ACP를 과발현시키는 세포들은 지방산 유도체 생성에 있어서 상당한 증가를 나타내었다[예시 1 내지 예시 4(이하) 참조].
재조합 ACP-발현 숙주 세포가 지방산 유도체 조성물 또는 특정 지방산 유도체의 역가의 증가를 보일 수 있으며, 상기 증가는 동일한 조건들 하에서 배양되는 경우 ACP를 발현시키지 않는 대응하는 숙주 세포에 의해 생성된 지방산 유도체 조성물 또는 특정 지방산 유도체의 역가보다 적어도 3 %, 적어도 4 %, 적어도 5 %, 적어도 6 %, 적어도 7 %, 적어도 8 %, 적어도 9 %, 적어도 10 %, 적어도 11 %, 적어도 12 %, 적어도 13 %, 적어도 14 %, 적어도 15 %, 적어도 16 %, 적어도 17 %, 적어도 18 %, 적어도 19 %, 적어도 20 %, 적어도 21 %, 적어도 22 %, 적어도 23 %, 적어도 24 %, 적어도 25 %, 적어도 26 %, 적어도 27 %, 적어도 28 %, 적어도 29 %, 또는 적어도 30 % 더 크다. ACP-발현 숙주 세포들에 의한 증가된 지방산 유도체들의 생성은 확인되었으며(이하 예시 1 및 예시 4 참조), 여기서 지방산, 지방족 에스테르, 지방족 알코올 및 알칸을 포함하는, 증가된 양의 지방산 유도체들이 만들어졌다.
ACP
단백질
일 실시형태에서, 본 발명은 원시(내인성) 또는 비-원시(외인성 또는 이종) ACP 단백질을 발현시키도록 숙주 세포를 조작함에 의한, 예를 들어 지방족 알코올 및/또는 지방족 에스테르와 같은 지방산 유도체들의 개선된 생성에 관한 것이다. ACP 폴리펩티드 또는 ACP 폴리펩티드를 인코딩하는 폴리뉴클레오티드 서열은 비-원시 또는 외인성 또는 이종일 수 있으며, 즉 이는 대응하는 야생형 숙주 세포에 자연적으로 존재하는 야생형 서열과 상이할 수 있다. 예시들은 발현의 수준 또는 뉴클레오티드, 폴리펩티드 또는 단백질의 서열의 변형을 포함한다. 본 발명은 ACP 폴리펩티드 및 그 동족체를 포함한다.
일 실시예에서, 본 발명을 구현하는 데 사용되는 ACP 폴리펩티드는 SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8 또는 SEQ ID NO: 10에 대해 적어도 70 %의 서열 동일성을 갖는다. 몇몇 실시예들에서, ACP는 마리노박터 종 또는 대장균으로부터 유래된다. 다른 실시예들에서, 본 발명을 구현하는 데 사용되는 ACP 폴리펩티드는 SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8 또는 SEQ ID NO: 10의 야생형 ACP 폴리펩티드 서열에 대해 적어도 75 %(예를 들어, 적어도 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % 또는 적어도 99 %)의 서열 동일성을 가지며, 또한 본 명세서에서 설명된 바와 같은 유용한 특징들 및/또는 특성들을 유도하는 1 이상의 치환체를 포함할 수 있다. 본 발명의 일 실시형태에서, 본 발명을 구현하는 데 사용되는 ACP 폴리펩티드는 SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8 또는 SEQ ID NO: 10에 대해 100 %의 서열 동일성을 갖는다. 다른 실시예들에서, 개선된 또는 변이 ACP 폴리펩티드 서열은 M. 하이드로카보노클라스티쿠스 또는 대장균 이외의 종으로부터 유래된다. 관련 실시형태에서, 본 발명을 구현하는 데 사용되는 ACP 폴리펩티드는 SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7 또는 SEQ ID NO: 9에 대해 100 %의 서열 동일성을 갖는 뉴클레오티드 서열에 의해 인코딩된다. 관련 실시형태에서, 본 발명은 SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7 또는 SEQ ID NO: 9에 대해 적어도 75 %(예를 들어, 적어도 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % 또는 적어도 99 %)의 서열 동일성을 갖는 핵산 서열에 의해 인코딩된 아미노산 서열을 포함하는 ACP 폴리펩티드에 관한 것이다. 몇몇 실시예들에서, 핵산 서열은 본 명세서에서 설명된 바와 같은 개선된 특징들 및/또는 특성들을 유도하는 1 이상의 치환체를 갖는 ACP 변이체를 인코딩한다. 다른 실시예들에서, 개선된 또는 변이 ACP 핵산 서열은 M. 하이드로카보노클라스티쿠스 또는 대장균 이외의 종으로부터 유래된다. 또 다른 실시형태에서, 본 발명은 SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7 또는 SEQ ID NO: 9에 대응하는 핵산의 실질적으로 전체 길이에 대하여 엄격한 조건들 하에서 혼성화되는 핵산에 의해 인코딩된 아미노산 서열을 포함하는 ACP 폴리펩티드에 관한 것이다. 몇몇 실시예들에서, 핵산 서열은 마리노박터 하이드로카보노클라스티쿠스 또는 대장균 이외의 종으로부터 유래되는 개선된 또는 변이 ACP 핵산 서열을 인코딩한다.
ACP
돌연변이체 및
변이체
몇몇 실시예들에서, ACP 폴리펩티드는 본 명세서에서 설명된 여하한의 폴리펩티드들의 돌연변이체 또는 변이체이다. 본 명세서에서 사용되는 바와 같은 "돌연변이체" 및 "변이체"라는 용어들은 적어도 하나의 아미노산에 의해 야생형 폴리펩티드와 상이한 아미노산 서열을 갖는 폴리펩티드를 지칭한다. 예를 들어, 돌연변이체는 다음의 보존적 아미노산 치환체들: 지방족 아미노산(예를 들어, 알라닌, 발린, 류신, 및 이소류신)의 또 다른 지방족 아미노산으로의 대체; 세린의 트레오닌으로의 대체; 트레오닌의 세린으로의 대체; 산성 잔기, 예컨대 아스파르트산 및 글루탐산의 또 다른 산성 잔기로의 대체; 아미드기를 지닌 잔기, 예컨대 아스파라긴 및 글루타민의 또 다른 아미드기를 지닌 잔기로의 대체; 염기성 잔기, 예컨대 리신 및 아르기닌의 또 다른 염기성 잔기로의 교체; 및 방향족 잔기, 예컨대 페닐알라닌 및 티로신의 또 다른 방향족 잔기로의 대체 중 1 이상을 포함할 수 있다. 몇몇 실시예들에서, 돌연변이 폴리펩티드는 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100 또는 그 이상의 아미노산 치환, 추가, 삽입 또는 결실을 갖는다. 바람직한 폴리펩티드의 분절 또는 돌연변이체는 대응하는 야생형 폴리펩티드의 생물학적 기능(예를 들어, 효소 활성)의 일부 또는 전체를 유지한다. 몇몇 실시예들에서, 분절 또는 돌연변이체는 대응하는 야생형 폴리펩티드의 생물학적 기능의 적어도 75 %, 적어도 80 %, 적어도 90 %, 적어도 95 %, 또는 적어도 98 % 이상을 유지한다. 다른 실시예들에서, 분절 또는 돌연변이체는 대응하는 야생형 폴리펩티드의 생물학적 기능의 약 100 %를 유지한다. 어느 아미노산 잔기들이 생물학적 활성에 영향을 주지 않고 치환, 삽입, 또는 결실될 수 있는지를 결정함에 있어서 안내는 당업계에 잘 알려진 컴퓨터 프로그램들, 예를 들어 LASERGENE 소프트웨어(DNASTAR, Inc., Madison, WI)를 이용하여 찾을 수 있다. 다른 실시예들에서, 분절 또는 돌연변이체는 대응하는 야생형 폴리펩티드에 비해 증가된 생물학적 기능을 보인다. 예를 들어, 분절 또는 돌연변이체는 대응하는 야생형 폴리펩티드에 비해 효소 활성에 있어서 적어도 10 %, 적어도 25 %, 적어도 50 %, 적어도 75 %, 또는 적어도 90 %의 개선을 나타낼 수 있다. 다른 실시예들에서, 분절 또는 돌연변이체는 대응하는 야생형 폴리펩티드에 비해 효소 활성에 있어서 적어도 100 % 또는 적어도 200 % 또는 적어도 500 %의 개선을 나타낸다.
본 명세서에 설명된 폴리펩티드들은 추가적인 보존적 또는 비-필수 아미노산 치환체들을 가질 수 있으며, 이는 폴리펩티드 기능에 실질적인 영향을 미치지 않는다는 것을 이해한다. 특정 치환이 용인되는지(즉, ACP 활성과 같은 요구되는 생물학적 기능에 악영향을 주지 않는지)의 여부가 해당 기술분야에서 설명되는 바와 같이 결정될 수 있다[Bowie 외(1990) Science 247:1306-1310 참조]. "보존적 아미노산 치환"은 아미노산 잔기가 유사한 곁사슬(side chain)을 갖는 아미노산 잔기로 대체되는 것이다. 유사한 곁사슬들을 갖는 아미노산 잔기들의 계열(family)들이 해당 기술분야에 정의되어 있다. 이 계열들은 염기성 곁사슬(예를 들어, 리신, 아르기닌, 히스티딘), 산성 곁사슬(예를 들어, 아스파르트산, 글루탐산), 비전하 극성 곁사슬(uncharged polar side chain)(예를 들어, 글리신, 아스파라긴, 글루타민, 세린, 트레오닌, 티로신, 시스테인), 무극성 곁사슬(예를 들어, 알라닌, 발린, 류신, 이소류신, 프롤린, 페닐알라닌, 메티오닌, 트립토판), 베타-분지형 곁사슬(예를 들어, 트레오닌, 발린, 이소류신), 및 방향족 곁사슬(예를 들어, 티로신, 페닐알라닌, 트립토판, 히스티딘)을 갖는 아미노산들을 포함한다.
변이체들은 자연적으로 발생하거나 시험관 내에서(in vitro) 생성될 수 있다. 특히, 이러한 변이체들은 위치 지정 돌연변이, 무작위 화학적 돌연변이유발(random chemical mutagenesis), 엑소뉴클레아제 Ⅲ 결실 절차, 또는 표준 클로닝 기술들과 같은 유전자 조작 기술들을 이용하여 생성될 수 있다. 대안적으로, 이러한 변이체, 분절, 유사체, 또는 유도체는 화학 합성 또는 변형 절차들을 이용하여 생성될 수 있다. 변이체를 만드는 방법들이 당업계에 잘 알려져 있다. 이들은 자연적 분리주(natural isolate)로부터 얻어진 핵산 서열들이 산업적 또는 실험실 적용들에서 그 값을 향상시키는 특징들을 갖는 폴리펩티드를 인코딩하는 핵산을 발생시키도록 변형되는 절차들을 포함한다. 이러한 절차들에서는, 자연적 분리주로부터 얻어진 서열에 대해 1 이상의 뉴클레오티드 차이들을 갖는 많은 수의 변이체 서열들이 발생되고 특징화된다. 전형적으로, 이 뉴클레오티드 차이들은 자연적 분리주로부터의 핵산에 의해 인코딩된 폴리펩티드들에 대해 아미노산 변화들을 유도한다. 예를 들어, 변이체들은 무작위 및 위치 지정 돌연변이를 이용함으로써 제조(prepare)될 수 있다. 무작위 및 위치 지정 돌연변이는 당업계에 알려져 있다[Arnold Curr . Opin . Biotech.(1993) 4:450-455 참조]. 무작위 돌연변이유발은 오류 빈발(error prone) PCR[Leung 외(1989) Technique 1:11-15; 및 Caldwell 외(1992) PCR Methods Applic . 2:28-33 참조]을 이용하여 달성될 수 있다. 오류 빈발 PCR에서, 실제 PCR은 DNA 폴리메라제의 복사 정확도(copying fidelity)가 낮은 조건들 하에서 수행되어, PCR 생성물의 전체 길이를 따라 높은 점 돌연변이율(high rate of point mutations)이 얻어지도록 한다. 간명하게, 이러한 절차들에서, 돌연변이유발될 핵산(ACP를 인코딩하는 폴리뉴클레오티드 서열)은 PCR 생성물의 전체 길이를 따라 높은 점 돌연변이율을 달성하기 위하여 PCR 프라이머, 반응 완충제, MgCl2, MnCl2, Taq 폴리메라제, 및 적절한 농도의 dNTP와 혼합된다. 예를 들어, 이러한 반응은 돌연변이유발될 20 fmole의 핵산, 30 pmole의 각 PCR 프라이머, 50 mMKCl, 10 mM Tris HCl(pH 8.3) 및 0.01 % 젤라틴을 포함하는 반응 완충제, 7 mM MgCl2, 0.5 mM MnCl2, 5 단위(unit)의 Taq 폴리메라제, 0.2 mM dGTP, 0.2 mM dATP, 1 mM dCTP, 그리고 1 mM dTTP를 이용하여 수행될 수 있다. PCR은 94 ℃에서 1 분, 45 ℃에서 1 분, 그리고 72 ℃에서 1 분의 30 회 주기 동안 수행될 수 있다. 하지만, 이러한 파라미터들은 적절하게 변동될 수 있음을 이해할 것이다. 이후, 돌연변이유발된 핵산은 적절한 벡터 내로 클로닝되며, 돌연변이유발된 핵산에 의해 인코딩되는 폴리펩티드들의 활성이 평가된다. 또한, 위치 지정 돌연변이가 관심 있는 여하한의 클로닝된 DNA의 부위-특이적 돌연변이를 발생시키기 위해 올리고뉴클레오티드-지정 돌연변이유발을 이용하여 달성될 수 있다. 올리고뉴클레오티드 돌연변이유발은 당업계에서 설명된다[Reidhaar-Olson 외(1988) Science 241:53-57 참조]. 간명하게, 이러한 절차들에서, 클로닝된 DNA 내로 도입될 1 이상의 돌연변이를 지닌(bearing) 복수의 이중 가닥 올리고뉴클레오티드가 합성되고, 돌연변이유발될 클로닝된 DNA(예를 들어, CAR 폴리펩티드를 인코딩하는 폴리뉴클레오티드 서열) 내로 삽입된다. 돌연변이유발된 DNA를 함유한 클론들이 회수되고, 이들이 인코딩한 폴리펩티드의 활성이 평가된다.
변이체를 발생시키는 또 다른 방법은 조립 PCR이다. 조립 PCR은 작은 DNA 분절들의 혼합으로부터 PCR 생성물의 조립을 수반한다. 다수의 상이한 PCR 반응이 동일한 바이알(vial)에서 병행하여 일어나며, 일 반응의 생성물이 또 다른 반응의 생성물을 프라이밍한다(priming). 조립 PCR은, 예를 들어 미국 특허 5,965,408에 개시되어 있다. 변이체를 발생시키는 또 다른 방법은 유성(sexual) PCR 돌연변이유발이다[Stemmer(1994) Proc. Natl. Acad. Sci., U.S.A. 91:10747-10751]. 유성 PCR 돌연변이유발에서는, 강제된(forced) 상동성 재조합이 서열 상동성에 기초한 DNA 분자의 무작위 분절화(random fragmentation)의 결과로서 시험관 내에서 상이하지만 고도로 관련된 DNA 서열의 DNA 분자들 사이에 일어난다. 이후, PCR 반응의 프라이머 신장법에 의한 크로스오버(crossover)의 고정이 이어진다.
또한, 변이체들은 생체 내 돌연변이유발(in vivo mutagenesis)에 의해 생성될 수 있다. 몇몇 실시예들에서, 핵산 서열에서의 무작위 돌연변이가 DNA 복원 경로(repair pathway)들 중 1 이상에 돌연변이를 운반하는 박테리아 균주, 예컨대 대장균 균주에서의 서열을 증식시킴으로써 발생된다. 이러한 "돌연변이유발 유전자(mutator)" 균주는 야생형 균주보다 높은 무작위 돌연변이율을 갖는다. 이러한 균주들 중 하나에서의 DNA 서열(예를 들어, CAR 폴리펩티드를 인코딩한 폴리뉴클레오티드 서열)의 증식이 결국 DNA 내에서 무작위 돌연변이를 생성할 것이다. 생체 내 돌연변이유발에 사용하기 적절한 돌연변이유발 유전자 균주는, 예를 들어 국제 특허 출원 공개 WO 1991/016427에 기술되어 있다. 또한, 변이체들은 카세트 돌연변이유발(cassette mutagenesis)을 이용하여 발생될 수 있다. 카세트 돌연변이유발에서는, 이중 가닥 DNA 분자의 작은 영역이 원시 서열(native sequence)과 상이한 합성 올리고뉴클레오티드 카세트로 대체된다. 올리고뉴클레오티드는 흔히 완전히 및/또는 부분적으로 무작위화된 원시 서열을 포함한다. 또한, 반복 앙상블 돌연변이유발(Recursive ensemble mutagenesis)이 변이체들을 발생시키는 데 사용될 수 있다. 반복 앙상블 돌연변이유발은 표현형 관련 돌연변이체들(phenotypically related mutants)(이의 멤버들은 아미노산 서열에 있어서 상이함)의 다양한 개체군들을 생성하기 위해 개발된 단백질 조작(즉, 단백질 돌연변이유발)을 위한 알고리즘이다. 이 방법은 조합 카세트 돌연변이유발의 연속 라운드(successive rounds)를 제어하기 위해 피드백 메카니즘을 이용한다. 반복 앙상블 돌연변이유발은 당업계에 알려져 있다[Arkin 외(1992) Proc . Natl . Acad . Sci ., U.S.A . 89:7811-7815 참조]. 몇몇 실시예들에서, 변이체들은 지수 앙상블 돌연변이유발(exponential ensemble mutagenesis)을 이용하여 생성된다[Delegrave 외(1993) Biotech. Res. 11:1548-1552 참조]. 지수 앙상블 돌연변이유발은 높은 비율의 독특한 기능성 돌연변이체를 갖는 조합 라이브러리를 발생시키는 프로세스이며, 잔기들의 작은 그룹들이 기능성 단백질들을 야기하는 아미노산을 각각의 변경된 위치에서 식별하기 위해 병행하여 무작위화된다. 몇몇 실시예들에서, 변이체들은 별개의 폴리펩티드들을 인코딩하는 복수의 핵산들의 부분들이 함께 융합되어 키메라 폴리펩티드를 인코딩하는 키메라 핵산 서열들을 생성하는 셔플링(shuffling) 절차들을 이용하여 생성되며, 이는 예를 들어 미국 특허 5,965,408 및 5,939,250에 개시되어 있다.
지방산 유도체의 생성
본 발명은 본 명세서에 설명된 바와 같은 지방산 생합성 경로들에서 사용하기에 적절한 활성들을 갖는 폴리펩티드들(효소들)의 다수 예시들을 제공한다. 이러한 폴리펩티드는 본 명세서에서 집합적으로 지방산 생합성 폴리펩티드 또는 단백질 또는 지방산 생합성 효소라고 칭해진다. 본 발명의 재조합 숙주 세포에서 사용하기에 적절한 지방산 경로 폴리펩티드들의 비-제한적인 예시들이 본 명세서에 제공된다. 몇몇 실시예들에서, 본 발명은 지방산 생합성 폴리펩티드를 인코딩하는 폴리뉴클레오티드 서열(본 명세서에서, 지방산 생합성 폴리뉴클레오티드 서열이라고도 함)을 포함한 재조합 숙주 세포를 포함한다. 지방산 생합성 폴리펩티드를 인코딩하는 개방형 해독틀(open reading frame) 및 작동가능하게 연결된 조절 서열들을 포함하는 폴리뉴클레오티드 서열은 재조합 숙주 세포들의 염색체로 통합되거나, 재조합 숙주 세포에 존재하는 1 이상의 플라스미드 발현계(plasmid expression systems)에 합입(incoporate)되거나, 둘 모두일 수 있다. ACP와 조합되어 발현될 수 있는 생합성 폴리펩티드 또는 단백질의 예시들은 카르복실산 레덕타제(CAR), 티오에스테라제(TE), 아실-ACP 레덕타제(AAR), 아실-CoA 레덕타제(ACR), 에스테르 신타제(ES), 탈카르보닐라제, 아세틸-CoA 카르복실라제(ACC), 지방족 알코올 형성 아실-CoA 레덕타제(FAR) 등이다(이하, 표 1 또한 참조). 예시 1 내지 예시 4에서(이하), 플라스미드 발현계 및 숙주 게놈으로의 통합이 둘 다 본 발명의 상이한 실시예들을 예시하는 데 사용된다.
몇몇 실시예들에서, 지방산 생합성 폴리뉴클레오티드 서열은 조작되는 재조합 세포의 모 숙주 세포에 대해 내인성인 폴리펩티드를 인코딩한다. 다른 실시예들에서, 지방산 생합성 폴리뉴클레오티드 서열은 조작되는 재조합 세포의 모 숙주 세포에 대해 외인성인 폴리펩티드를 인코딩한다. 다른 실시예들에서, 지방산 생합성 폴리뉴클레오티드 서열은 조작되는 재조합 세포의 모 숙주 세포에 대해 이종인 폴리펩티드를 인코딩한다. 다른 실시예들에서, 지방산 생합성 폴리뉴클레오티드 서열은 대응하는 모 숙주 세포와 비교할 때 재조합 세포에서 발현되는 외인성 또는 이종 폴리펩티드를 인코딩한다. 다른 실시예들에서, 지방산 생합성 폴리뉴클레오티드 서열은 대응하는 모 숙주 세포와 비교할 때 재조합 세포에서 과발현되는 내인성 폴리펩티드를 인코딩한다. 소정 실시예들에서, 과발현된 유전자에 의해 인코딩된 효소는 지방산 생합성에 직접 관련된다. 몇몇 실시예들에서, 지방산 생합성 폴리뉴클레오티드에 의해 인코딩되는 적어도 하나의 폴리펩티드는 외인성 또는 이종 폴리펩티드이다. 다른 실시예들에서, 지방산 생합성 폴리뉴클레오티드에 의해 인코딩되는 적어도 하나의 폴리펩티드는 과발현된 폴리펩티드이다. 표 1은 특정 지방산 유도체의 생성을 용이하게 하도록 재조합 숙주 세포들에서 발현되거나 과발현될 수 있는 예시적인 단백질들의 목록을 제공한다.
표 1: 유전자 명칭
지방산의 생성
재조합 숙주 세포들은 지방산을 생성하기 위해 재조합 숙주 세포들에서 단백질의 발현을 용이하게 하는 작동가능하게 연결된 조절 서열들과 함께, EC 3.1.1.5 또는 EC 3.1.2.-(예를 들어, EC 3.1.2.14)의 티오에스테라제 및 ACP를 인코딩하는 개방형 해독틀을 포함하는 1 이상의 폴리뉴클레오티드 서열들을 포함할 수 있다. 재조합 숙주 세포들에서, 개방형 해독틀 코딩 서열들 및/또는 조절 서열들은 티오에스테라제 및/또는 ACP를 인코딩하는 대응하는 야생형 유전자에 대해 변형된다. 재조합 숙주 세포의 티오에스테라제의 활성은 대응하는 숙주 세포의 대응하는 야생형 유전자로부터 발현된 티오에스테라제의 활성에 대해 변형된다. 몇몇 실시예들에서, 지방산을 포함하는 지방산 유도체 조성물은 티오에스테라제를 발현시키기에 효과적인 조건들에서 탄소원의 존재 하에 재조합 세포를 배양함으로써 생성된다. 관련 실시예들에서, 재조합 숙주 세포는 티오에스테라제 활성을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오티드; ACP 폴리펩티드를 인코딩하는 폴리뉴클레오티드; 및 선택적으로 다른 지방산 생합성 효소 활성들을 갖는 폴리펩티드들을 인코딩하는 1 이상의 추가적인 폴리뉴클레오티드들을 포함한다. 이러한 몇몇 경우들에서, 티오에스테라제의 작용에 의해 생성된 지방산은 상이한 지방산 생합성 효소 활성을 갖는 1 이상의 효소들에 의해, 예를 들어 지방족 에스테르, 지방족 알데히드, 지방족 알코올 또는 탄화수소와 같은 또 다른 지방산 유도체로 전환된다.
지방산 또는 이로부터 만들어지는 지방산 유도체의 사슬 길이는 특정 티오에스테라제의 발현을 변형시킴으로써 선택될 수 있다. 특정 티오에스테라제는 생성되는 지방산 유도체들의 사슬 길이에 영향을 미칠 것이다. 지방산 유도체 기질의 사슬 길이는 선택된 티오에스테라제(예를 들어, EC 3.1.2.14 또는 EC 3.1.1.5)의 발현을 변형시킴으로써 선택될 수 있다. 따라서, 숙주 세포들이 바람직한 지방산 유도체 기질의 생성을 증가시키기 위해 1 이상의 선택된 티오에스테라제를 발현시키거나, 과발현시키거나, 발현 감쇠시키거나, 또는 전혀 발현시키지 않도록 조작될 수 있다. 예를 들어, C10 지방산이 C10 지방산을 생성하는 선호도(preference)를 갖는 특정 티오에스테라제를 발현시키고, C10 지방산 이외의 지방산을 생성하는 선호도를 갖는 티오에스테라제들(예를 들어, C14 지방산의 생성을 선호하는 티오에스테라제)을 감쇠시킴으로써 생성될 수 있다. 이는 10의 탄소 사슬 길이를 갖는 지방산의 비교적 균일한 개체군을 유도할 것이다. 다른 경우들에서, C14 지방산이 비-C14 지방산을 생성하는 내인성 티오에스테라제를 감쇠시키고, C14-ACP를 사용하는 티오에스테라제를 발현시킴으로써 생성될 수 있다. 몇몇 상황들에서, C12-ACP를 사용하는 티오에스테라제를 발현시키고, 비-C12 지방산을 생성하는 티오에스테라제를 감쇠시킴으로써 C12 지방산이 생성될 수 있다. 예를 들어, C12 지방산은 C12 지방산을 생성하는 선호도를 갖는 티오에스테라제를 발현시키고, C12 지방산 이외의 지방산을 생성하는 선호도를 갖는 티오에스테라제를 감쇠시킴으로써 생성될 수 있다. 이는 12의 탄소 사슬 길이를 갖는 지방산의 비교적 균일한 개체군을 유도할 것이다. 바람직한 일 실시예에서, 지방산 조성물은 재조합 숙주 세포의 세포외 환경, 즉 세포 배양 배지로부터 회수된다. 또 다른 실시예에서, 지방산 조성물은 재조합 숙주 세포들의 세포내 환경으로부터 회수된다. 재조합 숙주 세포에 의해 생성된 지방산 유도체 조성물은, 지방산 유도체 조성물의 성분들의 포화도 및 사슬 길이뿐만 아니라 특정 지방산 유도체들의 분포를 결정하기 위해 당업계에 알려진 방법들, 예를 들어 GC-FID를 이용하여 분석될 수 있다. 아세틸-CoA, 말로닐-CoA, 및 지방산 과잉 생성이 당업계에 알려진 방법들을 이용하여, 예를 들어 세포 용해(cell lysis)에 후속하여 방사성 전구물질, HPLC, 또는 GC-MS를 이용함으로써 검증될 수 있다. 지방산 경로에서 사용하기 위한 티오에스테라제 및 이들을 인코딩하는 폴리뉴클레오티드의 추가적인 예시들이, 본 명세서에서 인용참조되는 PCT 공개공보 WO 2010/075483에서 제공된다.
지방족 알데히드의 생성
재조합 숙주 세포들은 지방족 알데히드를 생성하기 위해 재조합 숙주 세포들에서 단백질의 발현을 용이하게 하는 작동가능하게 연결된 조절 서열들과 함께, EC 1.2.1.42 또는 1.2.1.80의 아실-ACP 레덕타제(AAR); 또는 EC 6.2.1.3 또는 EC 1.2.1.42의 카르복실산 레덕타제(CAR)와 같은 1 이상의 생합성 단백질 및 ACP를 인코딩하는 개방형 해독틀을 포함하는 1 이상의 폴리뉴클레오티드 서열들을 포함할 수 있다. 재조합 숙주 세포들에서, 개방형 해독틀 코딩 서열들 및/또는 조절 서열들은 AAR 또는 CAR 및/또는 ACP를 인코딩하는 대응하는 야생형 유전자에 대해 변형된다. 또한, 재조합 숙주 세포들은 EC 3.1.1.5 또는 EC 3.1.2.-(예를 들어, EC 3.1.2.14)의 티오에스테라제 및 6.2.1.3의 아실-CoA 신테타제(FadD)와 조합하여 EC 1.2.1.42의 아실-CoA 레덕타제와 같은 1 이상의 생합성 단백질 및 ACP를 인코딩하는 개방형 해독틀을 포함하는 1 이상의 폴리뉴클레오티드 서열들을 포함할 수 있다.
몇몇 실시예들에서, 재조합 숙주 세포에 의해 생성된 지방산이 지방족 알데히드로 전환된다. 그 후, 몇몇 실시예들에서, 재조합 숙주 세포에 의해 생성된 지방족 알데히드는 지방족 알코올 또는 탄화수소로 전환된다. 몇몇 실시예들에서, 알데히드 레덕타제 또는 알코올 탈수소효소와 같은 원시 (내인성) 지방족 알데히드 생합성 폴리펩티드들이 숙주 세포(예를 들어, 대장균) 내에 존재하고, 지방족 알데히드를 지방족 알코올로 전환하기에 효과적이다. 다른 실시예들에서, 원시 (내인성) 지방족 알데히드 생합성 폴리펩티드가 과발현된다. 다른 실시예들에서, 외인성 지방족 알데히드 생합성 폴리펩티드가 재조합 숙주 세포로 도입되고, 발현되거나 과발현된다. 원시 또는 재조합 숙주 세포가 지방족 알데히드 생합성 활성을 갖는 효소(본 명세서에서, 지방족 알데히드 생합성 폴리펩티드 또는 지방족 알데히드 생합성 폴리펩티드 또는 효소라고도 함)를 인코딩하는 폴리뉴클레오티드를 포함할 수 있다. 지방족 알데히드 생합성 효소(예를 들어, AAR)가 숙주 세포에서 발현되거나 과발현되는 경우에 지방족 알데히드가 생성된다. 통상적으로, 지방족 알데히드를 생성하도록 조작된 재조합 숙주 세포가 지방족 알데히드 중 일부를 지방족 알코올로 전환시킬 것이다.
몇몇 실시예들에서, 카르복실산 레덕타제(CAR) 활성 또는 아실-ACP 레덕타제(AAR) 활성과 같은 지방족 알데히드 생합성 활성을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오티드를 재조합 숙주 세포에서 발현시키거나 과발현시킴으로써 지방족 알데히드가 생성된다. CarB가 예시적인 카르복실산 레덕타제이다. 본 발명을 구현함에 있어서, 카르복실산 레덕타제 폴리펩티드를 인코딩하는 유전자가 숙주 세포에서 발현되거나 과발현될 수 있다(도 4 참조). 몇몇 실시예들에서, CarB 폴리펩티드는 SEQ ID NO: 90의 아미노산 서열을 갖는다. 다른 실시예들에서, CarB 폴리펩티드는 SEQ ID NO: 88(CarB) 또는 SEQ ID NO: 89(CarB60), 또는 이의 돌연변이체 또는 변이체에 의해 인코딩된다. 카르복실산 레덕타제(CAR) 폴리펩티드들 및 이들을 인코딩하는 폴리뉴클레오티드들의 예시들은 FadD9(EC 6.2.1.-, UniProtKB Q50631, GenBank NP_217106), CarA(GenBank ABK75684), CarB(GenBank YP889972), 및 본 명세서에서 각각 인용참조되는 PCT 공개공보 WO 2010/042664 및 미국 특허 제 8,097,439호에 개시되어 있는 관련 폴리펩티드들을 포함하며, 이에 제한되지는 않는다. 몇몇 실시예들에서, 재조합 숙주 세포는 티오에스테라제를 인코딩하는 폴리뉴클레오티드를 더 포함한다.
몇몇 실시예들에서, 지방족 알데히드는 아실-ACP 레덕타제(AAR) 활성을 갖는 폴리펩티드와 같은 지방족 알데히드 생합성 폴리펩티드를 인코딩하는 폴리뉴클레오티드를 재조합 숙주 세포에서 발현시키거나 과발현시킴으로써 생성된다. 재조합 숙주 세포에서의 AAR의 발현은 지방족 알데히드 및/또는 지방족 알코올의 생성을 유도한다(도 4). 예시적인 AAR 폴리펩티드들은 PCT 공개공보 WO2009/140695 및 WO2009/140696에 개시되어 있으며, 이는 둘 다 본 명세서에서 인용참조된다. 지방족 알데히드를 포함한 조성물(지방족 알데히드 조성물)이 지방족 알데히드 생합성 효소를 발현시키기에 효과적인 조건들에서 탄소원의 존재 하에 숙주 세포를 배양함으로써 생성된다. 몇몇 실시예들에서, 지방족 알데히드 조성물은 지방족 알데히드 및 지방족 알코올을 포함한다. 바람직한 일 실시예에서, 지방족 알데히드 조성물은 재조합 숙주 세포들의 세포외 환경, 즉 세포 배양 배지로부터 회수된다. 또 다른 실시예에서, 지방족 알데히드 조성물은 재조합 숙주 세포들의 세포내 환경으로부터 회수된다.
지방족 알코올의 생성
재조합 숙주 세포들은 지방족 알코올을 생성하기 위해 재조합 숙주 세포들에서 단백질의 발현을 용이하게 하는 작동가능하게 연결된 조절 서열들과 함께, 내인성 또는 외인성 알데히드 레덕타제 또는 알코올 탈수소효소와 조합하여 EC 1.2.1.42 또는 1.2.1.80의 아실-ACP 레덕타제(AAR); 또는 EC 6.2.1.3 또는 EC 1.2.1.42의 카르복실산 레덕타제(CAR)와 같은 1 이상의 생합성 단백질 및 ACP를 인코딩하는 개방형 해독틀을 포함하는 1 이상의 폴리뉴클레오티드 서열들을 포함할 수 있다. 재조합 숙주 세포들에서, 개방형 해독틀 코딩 서열들 및/또는 조절 서열들은 AAR 또는 CAR 및 선택적인 알데히드 레덕타제 또는 알코올 탈수소효소 및/또는 ACP를 인코딩하는 대응하는 야생형 유전자에 대해 변형된다.
몇몇 실시예들에서, 재조합 숙주 세포는 지방족 알코올 생합성 활성(본 명세서에서, 지방족 알코올 생합성 폴리펩티드 또는 지방족 알코올 생합성 효소라고도 함)을 갖는 폴리펩티드(효소)를 인코딩하는 폴리뉴클레오티드를 포함하며, 재조합 숙주 세포에 의해 지방족 알코올이 생성된다. 지방족 알코올을 포함한 조성물(지방족 알코올 조성물)이 지방족 알코올 생합성 효소를 발현시키기에 효과적인 조건들에서 탄소원의 존재 하에 재조합 숙주 세포를 배양함으로써 생성될 수 있다. 재조합 숙주 세포(예를 들어, 대장균)에 존재하는 원시 (내인성) 알데히드 레덕타제 또는 알코올 탈수소효소가 지방족 알데히드를 지방족 알코올로 전환시킬 것이다. 몇몇 실시예들에서, 지방족 알코올 조성물은 1 이상의 지방족 알코올을 포함하지만, 지방족 알코올 조성물은 다른 지방산 유도체들을 포함할 수 있다. 바람직한 일 실시예에서, 지방족 알코올 조성물은 재조합 숙주 세포들의 세포외 환경, 즉 세포 배양 배지로부터 회수된다. 또 다른 실시예에서, 지방족 알코올 조성물은 재조합 숙주 세포들의 세포내 환경으로부터 회수된다.
일 접근법에서, 재조합 숙주 세포들이 유리 지방산을 지방족 알데히드로 전환시키는 아실-ACP들의 유리 지방산들(FFAs) 및 카르복실산 레덕타제(CAR)로의 전환을 촉진시키는 티오에스테라제를 발현시킴으로써 지방족 알코올을 생성하도록 조작되었다. 숙주 세포(예를 들어, 대장균)에 존재하는 원시 (내인성) 알데히드 레덕타제 또는 알코올 탈수소효소가 지방족 알데히드를 지방족 알코올로 전환시킬 수 있다. 몇몇 실시예들에서, 숙주 세포에 존재하는 알데히드 레덕타제 및/또는 알코올 탈수소효소와 같은 원시 (내인성) 지방족 알데히드 생합성 폴리펩티드가 지방족 알데히드를 지방족 알코올로 전환시키기에 충분할 수 있다. 하지만, 다른 실시예들에서는 원시 (내인성) 지방족 알데히드 생합성 폴리펩티드가 과발현되고, 다른 실시예들에서는 외인성 지방족 알데히드 생합성 폴리펩티드가 재조합 숙주 세포로 도입되고 발현 또는 과발현된다. 몇몇 실시예들에서, 지방족 알코올은 지방족 알데히드를 지방족 알코올로 전환시키는 지방족 알코올 생합성 활성을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오티드를 재조합 숙주 세포에서 발현시키거나 과발현시킴으로써 생성된다. 예를 들어, 알코올 탈수소효소 또는 알데히드 레덕타제(예를 들어, EC 1.1.1.1)가 본 발명을 구현하는 데 사용될 수 있다. 본 명세서에서 사용되는 바와 같이, 알코올 탈수소효소 또는 알데히드 레덕타제는 지방족 알데히드의 알코올(예를 들어, 지방족 알코올)로의 전환을 촉진시킬 수 있는 폴리펩티드를 지칭한다. 당업자라면, 소정 알코올 탈수소효소들이 다른 반응들도 촉진시킬 수 있고, 이 비-특이적 알코올 탈수소효소들도 알코올 탈수소효소라는 용어에 포괄된다는 것을 이해할 것이다. 본 발명에 따라 유용한 알코올 탈수소효소 폴리펩티드의 예시들은 아시네토박터 종(acinetobacter sp .) M-1(CAG70252)의 AlrA 또는 AlrAadp1과 같은 AlrA 동족체들, YjgB(AAC77226), DkgA(NP_417485), DkgB(NP_414743), YdjL(AAC74846), YdjJ(NP_416288), AdhP(NP_415995), YhdH(NP_417719), YahK(NP_414859), YphC(AAC75598), YqhD(446856) 및 YbbO[AAC73595.1]와 같은 내인성 대장균 알코올 탈수소효소들을 포함하며, 이에 제한되지는 않는다. 추가적인 예시들이 국제 특허 출원 공개 WO 2007/136762, WO 2008/119082 및 WO 2010/062480에 개시되어 있고, 이들 각각은 본 명세서에서 인용참조된다. 소정 실시예들에서, 지방족 알코올 생합성 폴리펩티드는 알데히드 레덕타제 또는 알코올 탈수소효소 활성(EC 1.1.1.1)을 갖는다.
또 다른 접근법에서, 재조합 숙주 세포들이 지방족 아실-티오에스테르 기질(예를 들어, 지방족 아실-CoA 또는 지방족 아실-ACP)을 지방족 알코올로 전환시키는 지방족 알코올 형성 아실-CoA 레덕타제 또는 지방족 아실 레덕타제(FARs)를 발현시킴으로써 지방족 알코올을 생성하도록 조작되었다. 몇몇 실시예들에서, 지방족 알코올은 재조합 숙주 세포 내에서 지방족 알코올 형성 아실-CoA 레덕타제(FAR) 활성을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오티드를 발현시키거나 과발현시킴으로써 생성된다. 본 실시예에 따라 유용한 FAR 폴리펩티드의 예시들은 PCT 공개공보 WO 2010/062480에 기재되고, 이는 본 명세서에서 인용참조된다. 지방족 알코올은 지방족 아실-ACP 및 지방족 아실-CoA 중간체들을 이용하는 아실-CoA 의존적 경로, 및 지방족 아실-ACP 중간체들을 이용하지만 지방족 아실-CoA 중간체는 이용하지 않는 아실-CoA 독립적 경로를 통해 생성될 수 있다. 특정 실시예들에서, 과발현된 유전자에 의해 인코딩되는 효소는 지방산 신타제, 아실-ACP 티오에스테라제, 지방족 아실-CoA 신타제 및 아세틸-CoA 카르복실라제(ACC)를 포함하며, 이에 제한되지는 않는다. 몇몇 실시예들에서, 과발현된 유전자에 의해 인코딩되는 단백질은 숙주 세포에 대해 내인성이다. 다른 실시예들에서, 과발현된 유전자에 의해 인코딩되는 단백질은 숙주 세포에 대해 이종 또는 외인성이다.
또한, 지방족 알코올은 다양한 아실-ACP 또는 아실-CoA 분자들을 대응하는 일차 알코올들로 환원시킬 수 있는 효소들에 의해 자연적으로 만들어진다(본 명세서에서 인용참조되는 미국 특허 공개 제 20100105963호 및 제 20110206630호; 및 미국 특허 제 8,097,439호 참조). 재조합 숙주 세포에 의해 지방족 알코올의 생성을 증가시키기 위한 전략들은, 지방족 알코올 생합성이 증가되도록 하는 생산 숙주 내의 상이한 유기체들로부터의 외인성 지방산 생합성 유전자들의 발현 및/또는 원시 지방산 생합성 유전자들의 과발현에 의한 지방산 생합성 경로를 통한 증가된 플럭스를 포함한다.
에스테르의 생성
재조합 숙주 세포들은 지방족 에스테르를 생성하기 위해 재조합 숙주 세포들에서 단백질의 발현을 용이하게 하는 작동가능하게 연결된 조절 서열들과 함께, EC 2.3.1.75의 에스테르 신타제(ES); 또는 EC 3.1.1.5 또는 EC 3.1.2.-의 내인성 또는 외인성 티오에스테라제 및 EC 6.2.1.3의 아실-CoA 신테타제/신타제(fadD)와 조합한 ES와 같은 1 이상의 생합성 단백질 및 ACP를 인코딩하는 개방형 해독틀을 포함하는 1 이상의 폴리뉴클레오티드 서열들을 포함할 수 있다. 재조합 숙주 세포들에서, 개방형 해독틀 코딩 서열들 및/또는 조절 서열들은 ES 및 선택적인 TE 및 fadD 및/또는 ACP를 인코딩하는 대응하는 야생형 유전자에 대해 변형된다.
본 명세서에서 언급된 바와 같은 지방족 에스테르는 지방산으로부터 만들어지는 여하한의 에스테르, 예를 들어 지방산 에스테르일 수 있다. 몇몇 실시예들에서, 지방족 에스테르는 A 측 및 B 측을 포함한다. 에스테르의 A 측은 에스테르의 카르복실레이트 산소에 부착되는 탄소 사슬을 지칭한다. 에스테르의 B 측은 에스테르의 모 카르복실레이트를 포함하는 탄소 사슬을 지칭한다. 지방족 에스테르가 지방산 생합성 경로로부터 유래되는 실시예들에서, A 측은 알코올이 기여하고, B 측은 지방산이 기여한다. 여하한의 알코올이 지방족 에스테르의 A 측을 형성하는 데 사용될 수 있다. 예를 들어, 알코올은 지방산 생합성 경로로부터 유래될 수 있다. 대안적으로, 알코올은 비-지방산 생합성 경로를 통해 생성될 수 있다. 또한, 알코올은 외인성으로 제공될 수 있다. 예를 들어, 알코올은 지방족 에스테르가 유기체에 의해 생성되는 경우에 발효액에 공급될 수 있다. 대안적으로, 지방족 에스테르가 알코올도 생성할 수 있는 유기체에 의해 생성되는 경우에 지방산 또는 아세트산과 같은 카르복실산이 외인성으로 공급될 수 있다. A 측 또는 B 측을 포함하는 탄소 사슬은 여하한의 길이로 이루어질 수 있다. 일 실시예에서, 에스테르의 A 측은 길이가 적어도 약 1, 2, 3, 4, 5, 6, 7, 8, 10, 12, 14, 16 또는 18 개의 탄소들이다. 지방족 에스테르가 지방산 메틸 에스테르인 경우, 에스테르의 A 측은 길이가 1 개의 탄소이다. 지방족 에스테르가 지방산 에틸 에스테르인 경우, 에스테르의 A 측은 길이가 2 개의 탄소들이다. 에스테르의 B 측은 길이가 적어도 약 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24 또는 26 개의 탄소들이다. A 측 및/또는 B 측은 직쇄형 또는 분지쇄형일 수 있다. 분지쇄형은 1 이상의 분지점을 가질 수 있다. 또한, 분지쇄형은 사이클릭 분지들을 포함할 수 있다. 또한, A 측 및/또는 B 측은 포화되거나 불포화될 수 있다. 불포화되는 경우, A 측 및/또는 B 측은 1 이상의 불포화점들을 가질 수 있다.
일 실시예에서, 지방족 에스테르는 생합성으로 생성된다. 이 실시예에서, 지방산은 우선 활성화된다. 활성화된 지방산의 예시들은 아실-CoA, 아실 ACP 및 아실 포스페이트이다. 아실-CoA는 지방산 생합성 또는 분해의 직접적인 생성물일 수 있다. 또한, 아실-CoA는 유리 지방산, CoA 및 아데노신 뉴클레오티드 트리포스페이트(ATP)로부터 합성될 수 있다. 아실-CoA를 생성하는 효소의 일 예시는 아실-CoA 신타제이다. 몇몇 실시예들에서, 재조합 숙주 세포는 폴리펩티드, 예를 들어 에스테르 신타제 활성을 갖는 효소(본 명세서에서, 에스테르 신타제 폴리펩티드 또는 에스테르 신타제라고도 함)를 인코딩하는 폴리뉴클레오티드를 포함한다. 지방족 에스테르는 재조합 숙주 세포에서 발현되거나 과발현되는 에스테르 신타제 폴리펩티드에 의해 촉진되는 반응에 의해 생성된다. 몇몇 실시예들에서, 지방족 에스테르를 포함하는 조성물(본 명세서에서, 지방족 에스테르 조성물이라고도 함)이 에스테르 신타제를 발현시키기에 효과적인 조건들에서 탄소원의 존재 하에 재조합 세포를 배양함으로써 생성된다. 몇몇 실시예들에서, 지방족 에스테르 조성물은 세포 배양으로부터 회수된다. 예를 들어, 에스테르 신타제 폴리펩티드는 EC 2.3.1.75로 분류된 에스테르 신타제 폴리펩티드, 또는 티오에스테라제, 에스테르 신타제, 아실-CoA:알코올트랜스아실라제, 아실트랜스페라제 또는 지방족 아실-CoA:지방족 알코올 아실트랜스페라제를 포함하되 이에 제한되지는 않는, 아실-티오에스테르의 지방족 에스테르로의 전환을 촉진시키는 여하한의 다른 폴리펩티드를 포함한다. 예를 들어, 재조합 숙주 세포에서 발현되는 폴리뉴클레오티드가 호호바(Simmondsia chinensis), 아시네토박터 종 균주 ADP, 알카니보락스 보르쿠멘시스(Alcanivorax borkumensis), 녹농균, 펀디박터 자덴시스(Fundibacter jadensis), 애기장대, 또는 알칼리제네스 유트로푸스(Alkaligenes eutrophus)로부터의 이작용기 에스테르 신타제/아실-CoA:디아실글리세롤 아실트랜스라제, 왁스/dgat를 인코딩할 수 있다. 특정 실시예에서, 에스테르 신타제 폴리펩티드는 아시네토박터 종 디아실글리세롤 O-아실트랜스페라제(wax-dgat; UniProtKB Q8GGG1, GenBank AAO17391) 또는 호호바 왁스 신타제(UniProtKB Q9XGY6, GenBank AAD38041)이다. 또 다른 실시예에서, 에스테르 신타제 폴리펩티드는 예를 들어 ES9, ws2 유전자에 의해 인코딩되는, 마리노박터 하이드로카보노클라스티쿠스로부터의 왁스 에스테르 신타제(SEQ ID NO: 93); DSM 8798, UniProtKB A3RE51(SEQ ID NO: 94); 또는 ws1 유전자에 의해 인코딩되는, M. 하이드로카보노클라스티쿠스 DSM8798의 ES8(GenBank 수탁 번호 ABO21020)이다. 특정 실시예에서, 에스테르 신타제 폴리펩티드를 인코딩하는 폴리뉴클레오티드는 재조합 숙주 세포에서 과발현된다. 몇몇 실시예들에서, 지방산 에스테르는 티오에스테라제(TE) 효소, 아실-CoA 신테타제(fadD) 효소, 및 에스테르 신타제(ES) 효소를 포함한 3 개의 지방산 생합성 효소들을 발현시키도록 조작된 재조합 숙주 세포에 의해 생성된다(3 효소계, 도 5 참조). 다른 실시예들에서, 지방산 에스테르는 하나의 지방산 생합성 효소, 에스테르 신타제(ES) 효소를 발현시키도록 조작된 재조합 숙주 세포에 의해 생성된다(1 효소계, 도 5 참조). 이 실시예들에서 사용하기에 적절한 에스테르 신타제 폴리펩티드 (및 이들을 인코딩하는 폴리뉴클레오티드)의 예시들은, 본 명세서에서 각각 인용참조되는 PCT 공개공보 WO 2007/136762 및 WO 2008/119082, 및 WO 2011/038134(3 효소계) 및 WO 2011/038132(1 효소계)에 개시되어 있는 것들을 포함한다. 재조합 숙주 세포는 지방산 메틸 에스테르, 지방산 에틸 에스테르 및/또는 왁스 에스테르와 같은 지방족 에스테르를 생성할 수 있다. 바람직한 일 실시예에서, 에스테르 조성물은 재조합 숙주 세포들의 세포외 환경, 즉 세포 배양 배지로부터 회수된다. 또 다른 실시예에서, 에스테르 조성물은 재조합 숙주 세포들의 세포내 환경으로부터 회수된다.
탄화수소의 생성
재조합 숙주 세포들은 탄화수소들(예를 들어, 알칸, 올레핀) 및/또는 케톤을 생성하기 위해 재조합 숙주 세포들에서 단백질의 발현을 용이하게 하는 작동가능하게 연결된 조절 서열들과 함께, 내인성 또는 외인성 탈카르보닐라제(ADC)와 조합한 EC 1.2.1.42 또는 1.2.1.80의 아실-ACP 레덕타제(AAR); 또는 탈카르복실라제와 조합한 EC 3.1.1.5 또는 EC 3.1.2.-의 내인성 또는 외인성 티오에스테라제(TE)와 같은 1 이상의 생합성 단백질 및 ACP를 인코딩하는 개방형 해독틀을 포함하는 1 이상의 폴리뉴클레오티드 서열들을 포함할 수 있다. 재조합 숙주 세포들에서, 개방형 해독틀 코딩 서열들 및/또는 조절 서열들은 AAR 및 ADC 또는 TE 및 탈카르복실라제 및/또는 ACP를 인코딩하는 대응하는 야생형 유전자에 대해 변형된다.
따라서, 이 실시형태는 적어도 부분적으로, 재조합 숙주 세포에서 탈카르보닐라제 폴리펩티드와 같은 탄화수소 생합성 폴리펩티드 및 AAR과 같은 지방족 알데히드 생합성 폴리펩티드의 발현 수준을 변경하는 것이 세포에 의한 탄화수소의 증대된 생성을 용이하게 한다는 발견을 기초로 한다. 일 실시예에서, 재조합 숙주 세포는 알칸 또는 알켄과 같은 탄화수소를 생성한다. 몇몇 실시예들에서, 재조합 숙주 세포에 의해 생성되는 지방족 알데히드가 탄소 원자를 제거하는 탈카르보닐(decarbonylation)에 의해 전환되어 탄화수소를 형성한다. 다른 실시예들에서, 재조합 숙주 세포에 의해 생산되는 지방산이 탄소 원자를 제거하는 탈카르복실(decarboxylation)에 의해 전환되어 말단 올레핀을 형성한다. 몇몇 실시예들에서, 아실-ACP 중간체가 탄소 원자를 제거하는 탈카르복실에 의해 전환되어 내부 올레핀 또는 케톤을 형성한다(도 6 참조). 몇몇 실시예들에서, 재조합 숙주 세포는 탄화수소 생합성 활성을 갖는 폴리펩티드(효소)[본 명세서에서, 탄화수소 생합성 폴리펩티드 또는 탄화수소 생합성 효소라고도 함]를 인코딩하는 폴리뉴클레오티드를 포함하고, 탄화수소는 재조합 숙주 세포에서 탄화수소 생합성 효소의 발현 또는 과발현에 의해 생성된다. 지방산 대사의 중간체들을 알칸들 및 알켄들로 함께 전환시키는 EC 4.1.99.5의 알데히드 탈카르보닐라제(ADC) 및 아실-ACP 레덕타제(AAR)를 포함하는 알칸 생합성 경로가 탄화수소의 생성을 위해 재조합 숙주 세포를 조작하는 데 사용되었다(본 명세서에서 인용참조되는 미국 특허 제 8,323,924호 참조).
몇몇 실시예들에서, 탄화수소를 포함하는 조성물(탄화수소 조성물이라고도 함)이 AAR 및 ADC 폴리뉴클레오티드를 발현시키기에 효과적인 조건들에서 탄소원의 존재 하에 재조합 세포를 배양함으로써 생성된다. 몇몇 실시예들에서, 탄화수소 조성물은 포화 및 불포화 탄화수소들을 포함하지만, 탄화수소 조성물이 다른 지방산 유도체들을 포함할 수 있다. 바람직한 일 실시예에서, 탄화수소 조성물은 재조합 숙주 세포들의 세포외 환경, 즉 세포 배양 배지로부터 회수된다. 또 다른 실시예에서, 탄화수소 조성물은 재조합 숙주 세포들의 세포내 환경으로부터 회수된다. 알칸과 같은 탄화수소는 탄소(C) 및 수소(H)로 이루어지는 포화 탄화수소 또는 화합물을 지칭하며, 이 원자들은 단일 결합에 의해 함께 연결된다(즉, 이들은 포화 화합물임). 올레핀 및 알켄은 적어도 하나의 탄소-대-탄소 이중 결합을 함유하는 탄화수소(화합물)의 동일한 형태를 지칭한다(즉, 불포화 화합물). 알켄/올레핀의 예시들은 화학식 CxH2x를 갖는 말단 올레핀들(α-올레핀, 말단 알켄, 또는 1-알켄이라고도 함)이고, 이는 일차 또는 알파 위치에서의 이중 결합의 위치 및 탄화수소 사슬의 선형성(linearity)에 의해 구별되는 유사한 분자식을 갖는 다른 올레핀들과 상이하다. 몇몇 실시예들에서, 말단 올레핀은 예를 들어 본 명세서에서 인용참조되는 PCT 공개공보 WO 2009/085278에 기재된 바와 같이, 탈카르복실라제 활성을 갖는 폴리펩티드와 같은 탄화수소 생합성 폴리펩티드를 인코딩하는 폴리뉴클레오티드를 재조합 숙주 세포에서 발현시키거나 과발현시킴으로써 생성된다. 몇몇 실시예들에서, 재조합 숙주 세포는 티오에스테라제를 인코딩하는 폴리뉴클레오티드를 더 포함한다.
다른 실시예들에서, 케톤은 예를 들어 본 명세서에서 인용참조되는 PCT 공개공보 WO 2008/147781에 기재된 바와 같이, OleA 활성을 갖는 폴리펩티드와 같은 탄화수소 생합성 폴리펩티드를 인코딩하는 폴리뉴클레오티드를 재조합 숙주 세포에서 발현시키거나 과발현시킴으로써 생성된다. 관련 실시예들에서, 내부 올레핀은 예를 들어 본 명세서에서 인용참조되는 PCT 공개공보 WO 2008/147781에 기재된 바와 같이, OleA 활성을 갖는 폴리펩티드와 함께 OleCD 또는 OleBCD 활성을 갖는 폴리펩티드와 같은 탄화수소 생합성 폴리펩티드를 인코딩하는 폴리뉴클레오티드를 재조합 숙주 세포에서 발현시키거나 과발현시킴으로써 생성된다.
재조합 숙주 세포 및 세포 배양
재조합 숙주 세포에 의해 지방산 유도체들의 생성을 증가시키기 위한 전략들은, 앞서(supra) 설명된 바와 같은 생산 숙주 내의 상이한 유기체들로부터의 외인성 지방산 생합성 유전자들의 발현 및 원시 지방산 생합성 유전자들의 과발현에 의한 지방산 생합성 경로를 통한 증가된 플럭스를 포함한다. 재조합 숙주 세포(또는 조작된 숙주 세포)는 유전적 구성(genetic makeup)이, 예를 들어 새로운 유전적 요소(genetic element)들의 의도적인 도입 및/또는 숙주 세포에 자연적으로 존재하는 유전적 요소들의 의도적인 변형에 의해 대응하는 야생형 숙주 세포에 대해 변경된 숙주 세포를 칭한다. 또한, 이러한 재조합 숙주 세포의 자손(offspring)은 이 새로운 및/또는 변형된 유전적 요소들을 함유한다. 본 명세서에 설명된 본 발명의 여하한의 실시형태들에서, 숙주 세포는 식물 세포, 곤충 세포, 균류 세포[예를 들어, 칸디다 종(Candida sp .)과 같은 사상균류, 사카로미세스 종(Saccharomyces sp.)과 같은 출아 효모], 조류 세포(algal cell) 및 박테리아 세포로부터 선택될 수 있다. 바람직한 일 실시예에서, 재조합 숙주 세포는 박테리아로부터 유래되는 재조합 미생물이다. 또 다른 실시예에서, 재조합 숙주 세포는 균류로부터 유래되는 재조합 미생물이다. 또 다른 실시예에서, 재조합 숙주 세포는 조류로부터 유래되는 재조합 미생물이다. 또 다른 실시예에서, 재조합 숙주 세포는 식물 또는 곤충으로부터 유래되는 재조합 미생물이다.
미생물인 숙주 세포의 예시들은 에스체리치아(Escherichia) 속, 바실루 스(Bacillus) 속, 락토바실루스(Lactobacillus) 속, 자이모모나스(Zymomonas) 속, 로도코쿠스(Rhodococcus) 속, 슈도모나스(Pseudomonas) 속, 아스페르길루스(Aspergillus) 속, 트리코데르마(Trichoderma) 속, 뉴로스포라(Neurospora) 속, 푸사리움(Fusarium) 속, 후미콜라(Humicola) 속, 리조무코르(Rhizomucor) 속, 클루 이베로미세스(Kluyveromyces) 속, 피치아(Pichia) 속, 무코르(Mucor) 속, 미셀리오 프토라(Myceliophtora) 속, 페니실리움(Penicillium) 속, 파네로카에테(Phanerochaete) 속, 느타리(Pleurotus) 속, 트라메테스(Trametes) 속, 크리소스 포리움(Chrysosporium) 속, 사카로미세스(Saccharomyces) 속, 스테노트로파모나 스(Stenotrophamonas) 속, 스키조사카로미세스(Schizosaccharomyces) 속, 야로위 아(Yarrowia) 속, 또는 스트렙토미세스(Streptomyces) 속으로부터의 세포들을 포함하며, 이에 제한되지는 않는다. 몇몇 실시예들에서, 숙주 세포는 그람-양성(Gram-positive) 박테리아 세포이다. 다른 실시예들에서, 숙주 세포는 그람-음성(Gram-negative) 박테리아 세포이다. 바람직한 일 실시예에서, 숙주 세포는 대장균 세포이다. 다른 실시예들에서, 숙주 세포는 바실루스 렌투스(Bacillus lentus) 세포, 바실루스 브레비스(Bacillus brevis) 세포, 바실루스 스테아로서모필루스(Bacillus stearothermophilus) 세포, 바실루스 리케니포르미스(Bacillus lichenoformis) 세포, 바실루스 알칼로필루스(Bacillus alkalophilus) 세포, 바실루스 코아굴란 스(Bacillus coagulans) 세포, 바실루스 키르쿨란스(Bacillus circulans) 세포, 바 실루스 푸밀리스(Bacillus pumilis) 세포, 바실루스 투린지엔시스(Bacillus thuringiensis) 세포, 바실루스 클라우시(Bacillus clausii) 세포, 바실루스 메가 테리움(Bacillus megaterium) 세포, 바실루스 서브틸리스(Bacillus subtilis) 세포, 또는 바실루스 아밀로리퀴파시엔스(Bacillus amyloliquefaciens) 세포이다. 다른 실시예들에서, 숙주 세포는 트리코데르마 코닌지(Trichoderma koningii) 세포, 트리코데르마 비리데(Trichoderma viride) 세포, 트리코데르마 르에세 이(Trichoderma reesei) 세포, 트리코데르마 롱기브라키아텀(Trichoderma longibrachiatum) 세포, 아스페르길루스 아와모리(Aspergillus awamori) 세포, 아스페르길루스 푸미가테스(Aspergillus fumigates) 세포, 아스페르길루스 포에티두 스(Aspergillus foetidus) 세포, 아스페르길루스 니둘란스(Aspergillus nidulans) 세포, 아스페르길루스 니게르(Aspergillus niger) 세포, 아스페르길루스 오리재(Aspergillus oryzae) 세포, 후미콜라 인솔렌스(Humicola insolens) 세포, 후미콜라 라누기노세(Humicola lanuginose) 세포, 로도코쿠스 오파쿠스(Rhodococcus opacus) 세포, 리조무코르 미에헤이(Rhizomucor miehei) 세포, 또는 무코르 미에헤 이(Mucor michei) 세포이다. 또 다른 실시예들에서, 숙주 세포는 스트렙토미세스 리비단스(Streptomyces lividans) 세포 또는 스트렙토미세스 무리누스(Streptomyces murinus) 세포이다. 또 다른 실시예들에서, 숙주 세포는 방선균(Actinomycetes) 세포이다. 몇몇 실시예들에서, 숙주 세포는 맥주효모균(Saccharomyces cerevisiae) 세포이다. 다른 실시예들에서, 숙주 세포는 진핵 식물(eukaryotic plant), 조류, 남세균(cyanobacterium), 녹색-황 세균, 녹색 비-황 세균(green non-sulfur bacterium), 자색 황세균, 자색 비-황 세균, 극한 생물(extremophile), 효모, 균류, 이들의 조작된 유기체, 또는 합성 유기체로부터의 세포이다. 몇몇 실시예들에서, 숙주 세포는 광 의존적이거나 탄소를 고정시킨다. 몇몇 실시예들에서, 숙주 세포는 독립영양적 활성을 갖는다. 몇몇 실시예들에서, 숙주 세포는 빛의 존재 하에서와 같이, 광독립영양적 활성(photoautotrophic activity)을 갖는다. 몇몇 실시예들에서, 숙주 세포는 빛의 부재 하에서 종속영양적 또는 혼합영양적이다. 소정 실시예들에서, 숙주 세포는 애기장대, 파니쿰 비르 가툼(Panicum virgatum), 미스칸투스 기간테우스(Miscanthus giganteus), 제아 메 이스(Zea mays), 보트리오코쿠스 브라우니(Botryococcuse braunii), 녹조류(Chlamydomonas reinhardtii), 두나리엘라 살리나(Dunaliela salina), 시네코코 쿠스 종 PCC 7002, 시네코코쿠스 종 PCC 7942, 시네코시스티스 종(Synechocystis Sp.) PCC 6803, 서모시네코코쿠스 엘롱가투스(Thermosynechococcus elongates) BP-1, 클로로비움 테피둠(Chlorobium tepidum), 클로로프렉수스 아우란티쿠스(Chlorojlexus auranticus), 크로마티움 비노숨(Chromatiumm vinosum), 로도스피 릴룸 루브룸(Rhodospirillum rubrum), 로도박터 캡술라투스(Rhodobacter capsulatus), 로도슈도모나스 파루스리스(Rhodopseudomonas palusris), 클로스트리 디움 융달리(Clostridium ljungdahlii), 클로스트리디움 서모셀룸(Clostridium thermocellum), 페니실리움 크리소게눔(Penicillium chrysogenum), 피치아 파스토 리스(Pichia pastoris), 맥주효모균(Saccharomyces cerevisiae), 스키조사카로미세 스 폼베(Schizosaccharomyces pombe), 슈도모나스 플루오레센스(Pseudomonas fluorescens), 또는 자이모모나스 모빌리스(Zymomonas mobilis)로부터의 세포이다.
매우 다양한 지방산 유도체들이 본 명세서에 설명된 균주 개량 및 재조합 숙주 세포에 의해 생성될 수 있고, 지방산, 아실-CoA, 지방족 알데히드, 짧은 사슬형 및 긴 사슬형 알코올, 지방족 알코올, 탄화수소(예를 들어, 알칸, 알켄, 또는 말단 또는 내부 올레핀과 같은 올레핀), 왁스 에스테르 또는 지방산 에스테르[예를 들어, 지방산 메틸 에스테르(FAME) 또는 지방산 에틸 에스테르(FAEE)]와 같은 에스테르, 및 케톤을 포함하며, 이에 제한되지는 않는다. 본 발명의 몇몇 실시예들에서, 특정 조성물 내의 지방산 유도체들의 더 높은 역가는 대응하는 야생형 숙주 세포의 대조군 배양(control culture)에 의해 생성되는 동일한 지방산 유도체들의 역가에 대한, 재조합 숙주 세포 배양에 의해 생성되는 특정 타입의 지방산 유도체(예를 들어, 지방족 알코올, 지방산 에스테르 또는 탄화수소)의 더 높은 역가이다. 이러한 경우들에서, 지방산 유도체 조성물들은 예를 들어 다양한 사슬 길이 및 포화도 또는 분지 특성을 갖는 지방족 알코올들의 혼합물을 포함할 수 있다. 본 발명의 다른 실시예들에서, 특정 조성물들에서의 지방산 유도체들의 더 높은 역가는 대응하는 야생형 숙주 세포의 대조군 배양에 의해 생성되는 동일한 지방산 유도체의 역가에 대한, 상이한 지방산 유도체들의 조합물(예를 들어, 지방족 알데히드 및 알코올, 또는 지방산 및 에스테르)의 더 높은 역가이다.
숙주 세포의 조작
몇몇 실시예들에서, 폴리뉴클레오티드(또는 유전자) 서열이 폴리뉴클레오티드 서열에 작동가능하게 연결된 프로모터를 포함하는 재조합 벡터에 의해 숙주 세포에 제공된다. 소정 실시예들에서, 프로모터는 발달-조절된, 세포소기관-특이적, 조직-특이적, 유도성, 구성적, 또는 세포-특이적 프로모터이다. 몇몇 실시예들에서, 재조합 벡터는 폴리뉴클레오티드 서열에 작동가능하게 연결된 발현 조절 서열; 폴리뉴클레오티드 서열에 작동가능하게 연결된 선택 마커; 폴리뉴클레오티드 서열에 작동가능하게 연결된 마커 서열; 폴리뉴클레오티드 서열에 작동가능하게 연결된 정제 모이어티; 폴리뉴클레오티드 서열에 작동가능하게 연결된 분비 서열; 및 폴리뉴클레오티드 서열에 작동가능하게 연결된 표적화 서열로부터 선택되는 적어도 하나의 서열을 포함한다. 본 명세서에 설명된 발현 벡터들은 숙주 세포 내에서의 폴리뉴클레오티드 서열의 발현에 적절한 형태인 폴리뉴클레오티드 서열을 포함한다. 당업자라면, 발현 벡터의 설계가 형질전환되는 숙주 세포의 선택, 원하는 폴리펩티드의 발현 수준 등과 같은 요인들에 의존할 수 있다는 것을 이해할 것이다. 본 명세서에 설명된 발현 벡터들은 앞서(supra) 설명된 바와 같은 폴리뉴클레오티드 서열들에 의해 인코딩되는, 융합 폴리펩티드들을 포함하는 폴리펩티드들을 생성하도록 숙주 세포들에 도입될 수 있다. 원핵생물, 예를 들어 대장균에서 폴리펩티드들을 인코딩하는 유전자의 발현은 대부분 융합 또는 비-융합 폴리펩티드들의 발현을 지시하는 구성적 또는 유도성 프로모터를 함유하는 벡터들로 수행된다. 융합 벡터들은 그 안에 인코딩된 폴리펩티드에, 일반적으로는 재조합 폴리펩티드의 아미노- 또는 카르복시-말단에 다수의 아미노산들을 첨가한다. 전형적으로, 이러한 융합 벡터들은 다음의 3 가지 목적, 즉 재조합 폴리펩티드의 발현을 증가시키고; 재조합 폴리펩티드의 용해도를 증가시키며; 친화성 정제에서 리간드로서 작용함으로써 재조합 폴리펩티드의 정제를 돕는 것 중 1 이상을 수행한다. 흔히, 융합 발현 벡터에서, 융합 모이어티와 재조합 폴리펩티드의 접합점에 단백질분해 절단 부위가 도입된다. 이는 융합 폴리펩티드의 정제 이후에 융합 모이어티로부터 재조합 폴리펩티드의 분리를 가능하게 한다. 이러한 효소들 및 이들의 동족 인식 서열(cognate recognition sequence)들의 예시들은 Xa 인자(Factor Xa), 트롬빈 및 엔테로키나아제를 포함한다. 예시적인 융합 발현 벡터는 pGEX 벡터[Pharmacia Biotech, Inc., Piscataway, NJ; Smith 외(1988) Gene 67:31-40], pMAL 벡터(New England Biolabs, Beverly, MA), 및 pRITS 벡터(Pharmacia Biotech, Inc., Piscataway, N.J.)를 포함하고, 이들은 표적 재조합 폴리펩티드에 각각 글루타티온 S-트랜스페라제(GST), 말토스 E 결합 단백질, 또는 단백질 A를 융합시킨다.
유도성, 비-융합 대장균 발현 벡터의 예시들은 pTrc 벡터[Amann 외(1988) Gene 69:301-315] 및 pET 11d 벡터[Studier 외, Gene Expression Technology: Methods in Enzymology 185, Academic Press, San Diego, Calif.(1990) 60-89]를 포함한다. pTrc 벡터로부터의 표적 유전자 발현은 하이브리드 trp-lac 융합 프로모터로부터의 숙주 RNA 폴리메라제 전사에 의존한다. pET 11d 벡터로부터의 표적 유전자 발현은 공동발현되는 바이러스 RNA 폴리메라제(T7 gn1)에 의해 매개되는 T7 gn10-lac 융합 프로모터로부터의 전사에 의존한다. 이 바이러스 폴리메라제는 lacUV 5 프로모터의 전사 제어 하에서 T7 gn1 유전자를 보유하는 내재성 λ 프로파지(resident λ prophage)로부터 BL21(DE3) 또는 HMS174(DE3)와 같은 숙주 균주들에 의해 공급된다. 원핵 세포 및 진핵 세포 모두에 적절한 발현계들이 해당 기술분야에서 잘 알려져 있다[예를 들어, Sambrook 외(1989) Molecular Cloning: A Laboratory Manual, second edition, Cold Spring Harbor Laboratory 참조]. 유도성, 비-융합 대장균 발현 벡터의 예시들은 pTrc 벡터[Amann 외(1988) Gene 69:301-315] 및 pET 11d 벡터[Studier 외(1990) Gene Expression Technology: Methods in Enzymology 185, Academic Press, San Diego, CA, pp. 60-89]를 포함한다. 소정 실시예들에서, 본 발명의 폴리뉴클레오티드 서열은 박테리오파지 T5로부터 유래된 프로모터에 작동가능하게 연결된다. 일 실시예에서, 숙주 세포는 효모 세포이다. 이 실시예에서, 발현 벡터는 효모 발현 벡터이다. 벡터들은 외래성(foreign) 핵산(예를 들어, DNA)을 숙주 세포 내로 도입하기 위하여 본 기술분야에서 인정되는 다양한 기술들을 통해 원핵 세포 또는 진핵 세포 내로 도입될 수 있다. 숙주 세포를 형질전환 또는 형질감염(transfecting)시키는 적절한 방법들은, 예를 들어 Sambrook 외(supra)에서 찾아볼 수 있다. 박테리아 세포들의 안정적인 형질전환을 위하여, 사용되는 발현 벡터 및 형질전환 기술에 따라, 세포들의 소정 부분이 발현 벡터를 흡수하고 복제하는 것으로 알려져 있다. 이 형질전환체들을 식별하고 선택하기 위하여, 선택가능한 마커(예를 들어, 항생제에 대한 내성)를 인코딩하는 유전자가 관심 유전자와 함께 숙주 세포 내로 도입될 수 있다. 선택가능한 마커들은 암피실린, 카나마이신, 클로람페니콜, 또는 테트라사이클린과 같은 -단, 이에 제한되지 않음- 약물들에 대한 내성을 제공하는 것들을 포함한다. 선택가능한 마커를 인코딩하는 핵산들은 본 명세서에서 설명되는 폴리펩티드를 인코딩하는 벡터와 동일한 벡터에서 숙주 세포 내로 도입될 수 있거나, 또는 별개의 벡터에서 도입될 수 있다. 도입된 핵산에 의해 안정적으로 형질전환된 세포들은 적절한 선택 약물의 존재 하에서 성장에 의해 식별될 수 있다. 본 명세서에서 설명된 바와 같은(supra) 조작된 또는 재조합 숙주 세포는 지방산 유도체 조성물을 생성하는 데 사용되는 세포이다. 본 명세서에서 설명된 본 발명의 여하한의 실시형태들에서, 숙주 세포는 진핵 식물, 박테리아, 조류, 남세균, 녹색-황 세균, 녹색 비-황 세균, 자색 황 세균, 자색 비-황 세균, 극한 생물, 효모, 균류, 이들의 조작된 유기체, 또는 합성 유기체로부터 선택될 수 있다. 몇몇 실시예들에서, 숙주 세포는 광 의존적이거나 탄소를 고정시킨다. 몇몇 실시예들에서, 숙주 세포는 독립영양적 활성을 갖는다. 다양한 숙주 세포들이 본 명세서에 설명된 바와 같은 지방산 유도체들을 생성하는 데 사용될 수 있다.
본 발명의 숙주 세포 또는 미생물은, 효소 활성들에 대한 특정 돌연변이의 효율성을 테스트하기 위해 변경들을 포함하도록 유전적으로 조작되는 숙주 균주 또는 숙주 세포(즉, 재조합 세포 또는 미생물)를 포함한다. 다양한 선택적인 유전적 조정 및 변경이, 어떠한 원시 효소 경로들이 원래 숙주 세포에 존재하는지에 따라 한 숙주 세포로부터 다른 세포로 교환가능하게 사용될 수 있다. 일 실시예에서, 숙주 균주는 다른 생합성 폴리펩티드(예를 들어, 효소)와 조합하여 ACP 폴리펩티드의 발현을 테스트하는 데 사용될 수 있다. 숙주 균주는, 발효 성분들, 탄소원(예를 들어, 공급원료), 온도, 압력, 감소된 배양 오염 상태들, 및 산소 수준들을 포함한 배양 조건들을 포함하는 -단, 이에 제한되지 않음- , 특정 변수들을 테스트하기 위해 다수의 유전적 변경들을 포함한다.
일 실시예에서, 숙주 균주는 선택적인 fadE 및 fhuA 결실을 포함한다. 아실-CoA 탈수소효소(FadE)는 지방산을 대사시키는 데 중요한 효소이다. 이는 지방산 이용(베타-산화)에서 두번째 단계를 촉진시키며, 이는 지방산(아실-CoA)의 긴 사슬들을 아세틸-CoA 분자로 부수는(break) 프로세스이다. 더 구체적으로, 박테리아에서의 지방산 분해의 β-산화 사이클의 두번째 단계는 아실-CoA의 2-엔오일-CoA로의 산화이며, 이는 FadE에 의해 촉진된다. 대장균에 FadE가 없는 경우, 이는 탄소원으로서 지방산에서 성장할 수 없지만, 아세테이트에서 성장할 수 있다. 여하한의 사슬 길이의 지방산 이용의 불능(inability)은 fadE 균주들, 즉 FadE 기능이 파괴(disrupt)되는 fadE 돌연변이 균주들의 보고된 표현형과 일치한다. fadE 유전자는 선택적으로 녹아웃(knock out)되거나 감쇠되어, 지방산 유도체 경로에서 중간체일 수 있는 아실-CoA가 모두 지방산 유도체로 효율적으로 전환될 수 있도록 세포에 누적될 것을 보장할 수 있다. 하지만, fadE 감쇠는 탄소원으로서 당(sugar)이 사용되는 경우에는, 이러한 조건 하에서 FadE의 발현이 억제될 가능성이 있고, 이에 따라 FadE가 소량만 존재할 수 있으며 아실-CoA 기질에 대해 에스테르 신타제 또는 다른 효소들과 효율적으로 경쟁(compete with)할 수 없기 때문에, 선택적이다. FadE는 분해대사물 억제(catabolite repression)로 인해 억제된다. 대장균 및 많은 다른 미생물들은 지방산보다 당의 소모를 선호하므로, 두 공급원들이 이용가능한 경우 fad 레귤론을 억제함으로써 당이 우선 소모된다[D. Clark, J Bacteriol . (1981) 148(2):521-6 참조]. 또한, 당의 부재는 FadE 발현을 유도한다. (FadE를 포함한) fad 레귤론에 의해 발현되는 단백질들이 상향-조절되고 아실-CoA에 대해 효율적으로 경쟁할 것이므로, 아실-CoA 중간체들이 베타 산화 경로에 대해 손실될 수 있다. 따라서, 녹아웃 또는 감쇠되는 fadE 유전자를 갖는 것이 유리할 수 있다. 대부분의 탄소원들이 주로 당 기반이기 때문에, FadE를 감쇠시키는 것은 선택적이다. 유전자 fhuA는 TonA 단백질을 코딩하며, 이는 대장균의 외막에서의 에너지-관련 운반체(energy-coupled transporter) 및 수용체이다[V. Braun(2009) J Bacteriol. 191(11):3431-3436 참조]. 이것의 결실은 선택적이다. fhuA 결실은 세포로 하여금 소정 발효 조건들에 유리할 수 있는 파지 공격(phage attack)에 대해 더 내성이 되게 한다. 따라서, 발효 진행 시 잠재적 오염의 가능성이 있는 숙주 세포에서 fhuA를 결실시키는 것이 바람직할 수 있다.
또 다른 실시예에서, 숙주 세포(supra)는 fadR, fabA, fabD, fabG, fabH, fabV, 및/또는 fabF를 포함하는 유전자들 중 1 이상의 선택적인 과발현을 포함한다. 이러한 유전자들의 예시들은 대장균으로부터의 fadR, 쥐티푸스균(Salmonella typhimurium)으로부터의 fabA(NP_460041), 쥐티푸스균으로부터의 fabD(NP_460164), 쥐티푸스균으로부터의 fabG(NP_460165), 쥐티푸스균으로부터의 fabH(NP_460163), 콜레라균(Vibrio cholera)으로부터의 fabV(YP_001217283), 및 클로스트리디움 아세토부틸리쿰(Clostridium acetobutylicum)으로부터의 fabF(NP_350156)이다. 지방산 생합성에서 효소들 및 조절제를 코딩하는 이 유전자들 중 1 이상의 과발현은 다양한 배양 조건들 하에서 지방산 유도체 화합물들의 역가를 증가시키는 역할을 할 수 있다.
또 다른 실시예에서, 지방산 유도체들의 생성을 위해 숙주 세포로서 대장균 균주가 사용된다. 이와 유사하게, 이 숙주 세포들은 fadR, fabA, fabD, fabG, fabH, fabV, 및/또는 fabF를 포함 -단, 이에 제한되지 않음- 하는 다양한 배양 조건들 하에서 지방산 유도체(예를 들어, 지방산, 지방족 에스테르, 지방족 알코올, 지방족 알데히드, 탄화수소 등)와 같은 지방산 유도체 화합물의 역가를 더 증가시키거나 증대시킬 수 있는 1 이상의 생합성 유전자들(즉, 지방산 생합성의 효소들 및 조절제들을 코딩하는 유전자들)의 선택적인 과발현을 제공한다. 유전적 변경의 예시들은 대장균으로부터의 fadR, 쥐티푸스균으로부터의 fabA(NP_460041), 쥐티푸스균으로부터의 fabD(NP_460164), 쥐티푸스균으로부터의 fabG(NP_460165), 쥐티푸 스균으로부터의 fabH(NP_460163), 콜레라균으로부터의 fabV(YP_001217283), 및 클 로스트리디움 아세토부틸리쿰으로부터의 fabF(NP_350156)를 포함한다. 몇몇 실시예들에서, 이 생합성 유전자들을 운반하는 합성 오페론들이, 다양한 배양 조건들 하에서 지방산 유도체 과발현을 테스트하고, 지방산 유도체 생성을 더 증대시키기 위해 세포 내에서 조작되고 발현될 수 있다. 이러한 합성 오페론들은 1 이상의 생합성 유전자를 함유한다. ifab138 오페론은, 예를 들어 특정한 배양 조건들을 테스트하기 위해 지방산 유도체들의 과발현을 용이하게 하는 데 사용될 수 있는 콜레라균으로부터의 fabV, 쥐티푸스균으로부터의 fabH, 쥐티푸스균으로부터의 fabD , 쥐 티푸스균으로부터의 fabG, 쥐티푸스균으로부터의 fabA, 및/또는 클로스트리디움 아세토부틸리쿰으로부터의 fabF를 포함한 선택적인 지방산 생합성 유전자들을 함유하는 조작된 오페론이다. 이러한 합성 오페론들의 한가지 장점은, 지방산 유도체 생성률이 더 증가되거나 증대될 수 있다는 것이다.
몇몇 실시예들에서, ACP 및 다른 생합성 효소들(예를 들어, TE, ES, CAR, AAR, ADC 등)을 발현시키는 데 사용되는 숙주 세포 또는 미생물은, 지방족 에스테르, 지방족 알코올, 지방족 아민, 지방족 알데히드, 이작용기 지방산 유도체, 디애시드(diacid) 등과 같은 1 이상의 특정 지방산 유도체(들)에 대한 생성을 증가시킬 수 있는 소정 효소 활성들을 포괄하는 유전자들을 더 발현시킬 것이다. 일 실시예에서, 숙주 세포는 유전자를 과발현시킴으로써 증가될 수 있는 지방산의 생성을 위해 티오에스테라제 활성(E.C. 3.1.2.* 또는 E.C. 3.1.2.14 또는 E.C. 3.1.1.5)을 갖는다. 또 다른 실시예에서, 숙주 세포는 지방족 에스테르의 생성을 위해 에스테르 신타제 활성(E.C. 2.3.1.75)을 갖는다. 또 다른 실시예에서, 숙주 세포는 지방족 알코올의 생성을 위해 아실-ACP 레덕타제(AAR)(E.C, 1.2.1.80) 활성 및/또는 알코올 탈수소효소 활성(E.C. 1.1.1.1) 및/또는 지방족 알코올 아실-CoA 레덕타제(FAR)(E.C. 1.1.1.*) 활성 및/또는 카르복실산 레덕타제(CAR)(E.C. 1.2.99.6) 활성을 갖는다. 또 다른 실시예에서, 숙주 세포는 지방족 알데히드의 생성을 위해 아실-ACP 레덕타제(AAR)(E.C. 1.2.1.80) 활성을 갖는다. 또 다른 실시예에서, 숙주 세포는 알칸 및 알켄의 생성을 위해 아실-ACP 레덕타제(AAR)(E.C. 1.2.1.80) 활성 및 탈카르보닐라제(ADC) 활성을 갖는다. 또 다른 실시예에서, 숙주 세포는 지방족 알코올의 생성을 위해 아실-CoA 레덕타제(E.C. 1.2.1.50) 활성, 아실-CoA 신타제(FadD)(E.C. 2.3.1.86) 활성, 및 티오에스테라제(E.C. 3.1.2.* 또는 E.C. 3.1.2.14 또는 E.C. 3.1.1.5) 활성을 갖는다. 또 다른 실시예에서, 숙주 세포는 지방족 에스테르의 생성을 위해 에스테르 신타제 활성(E.C. 2.3.1.75), 아실-CoA 신타제(FadD)(E.C. 2.3.1.86) 활성, 및 티오에스테라제(E.C. 3.1.2.* 또는 E.C. 3.1.2.14 또는 E.C. 3.1.1.5) 활성을 갖는다. 또 다른 실시예에서, 숙주 세포는 케톤의 생성을 위해 OleA 활성을 갖는다. 또 다른 실시예에서, 숙주 세포는 내부 올레핀의 생성을 위해 OleBCD 활성을 갖는다. 또 다른 실시예에서, 숙주 세포는 지방족 알코올의 생성을 위해 아실-ACP 레덕타제(AAR)(E.C. 1.2.1.80) 활성 및 알코올 탈수소효소 활성(E.C. 1.1.1.1)을 갖는다. 또 다른 실시예에서, 숙주 세포는 말단 올레핀을 만들기 위해 티오에스테라제(E.C. 3.1.2.* 또는 E.C. 3.1.2.14 또는 E.C. 3.1.1.5) 활성 및 탈카르복실라제 활성을 갖는다. 미생물 및 미생물 세포에서의 효소 활성들의 발현은 미국 특허 제 8,097,439호; 제 8,110,093호; 제 8,110,670호; 제 8,183,028호; 제 8,268,559호; 제 8,283,143호; 제 8,232,924호; 제 8,372,610호; 및 제 8,530,221호에 의해 교시되며, 이들은 본 명세서에서 인용참조된다. 다른 실시예들에서, ACP 및 다른 생합성 효소들을 발현시키는 데 사용되는 숙주 세포 또는 미생물은 지방산 유도체와 같은 1 이상의 특정 지방산 유도체(들)를 생성하기 위해 상향조절되거나 과발현되는 소정 원시 효소 활성들을 포함할 것이다. 일 실시예에서, 숙주 세포는 티오에스테라제 유전자를 과발현시킴으로써 증가될 수 있는 지방산의 생성을 위해 원시 티오에스테라제(E.C. 3.1.2.* 또는 E.C. 3.1.2.14 또는 E.C. 3.1.1.5) 활성을 갖는다.
본 발명은 ACP 및 다른 생합성 효소들(supra)을 코딩하는 유전자들을 발현시키는 숙주 균주 또는 미생물을 포함한다. 재조합 숙주 세포들은 지방산 유도체들 및 이들의 조성물들 및 블렌드(blend)들을 생성한다. 지방산 유도체들은 전형적으로 배양 배지로부터 회수되고, 및/또는 숙주 세포로부터 격리된다. 일 실시예에서, 지방산 유도체들은 배양 배지(세포외)로부터 회수된다. 또 다른 실시예에서, 지방산 유도체들은 숙주 세포(세포내)로부터 격리된다. 또 다른 실시예에서, 지방산 유도체들은 배양 배지로부터 회수되고, 숙주 세포로부터 격리된다. 숙주 세포에 의해 생성되는 지방산 유도체 조성물은, 지방산 유도체 조성물의 성분들의 포화도 및 사슬 길이뿐만 아니라 특정 지방산 유도체들의 분포를 결정하기 위해 당업계에 알려진 방법들, 예를 들어 GC-FID를 이용하여 분석될 수 있다.
미생물(예를 들어, 미생물 세포)로서 기능하는 숙주 세포의 예시들은 에스체 리치아 속, 바실루스 속, 락토바실루스 속, 자이모모나스 속, 로도코쿠스 속, 슈도모나스 속, 아스페르길루스 속, 트리코데르마 속, 뉴로스포라 속, 푸사리움 속, 후미콜라 속, 리조무코르 속, 클루이베로미세스 속, 피치아 속, 무코르 속, 미셀리오 프토라 속, 페니실리움 속, 파네로카에테 속, 느타리 속, 트라메테스 속, 크리소스포리움 속, 사카로미세스 속, 스테노트로파모나스 속, 스키조사카로미세스 속, 야로위아 속, 또는 스트렙토미세스 속으로부터의 세포들을 포함하며, 이에 제한되지는 않는다. 몇몇 실시예들에서, 숙주 세포는 그람-양성 박테리아 세포이다. 다른 실시예들에서, 숙주 세포는 그람-음성 박테리아 세포이다. 몇몇 실시예들에서, 숙주 세포는 대장균 세포이다. 몇몇 실시예들에서, 숙주 세포는 대장균 B 세포, 대장균 C 세포, 대장균 K 세포, 또는 대장균 W 세포이다. 다른 실시예들에서, 숙주 세포는 바실루스 렌투스 세포, 바실루스 브레비스 세포, 바실루스 스테아로서모필 루스 세포, 바실루스 리케니포르미스 세포, 바실루스 알칼로필루스 세포, 바실루스 코아굴란스 세포, 바실루스 키르쿨란스 세포, 바실루스 푸밀리스 세포, 바실루스 투린지엔시스 세포, 바실루스 클라우시 세포, 바실루스 메가테리움 세포, 바실루스 서브틸리스 세포, 또는 바실루스 아밀로리퀴파시엔스 세포이다. 다른 실시예들에서, 숙주 세포는 트리코데르마 코닌지 세포, 트리코데르마 비리데 세포, 트리코데 르마 르에세이 세포, 트리코데르마 롱기브라키아텀 세포, 아스페르길루스 아와모리 세포, 아스페르길루스 푸미가테스 세포, 아스페르길루스 포에티두스 세포, 아스페르길루스 니둘란스 세포, 아스페르길루스 니게르 세포, 아스페르길루스 오리재 세포, 후미콜라 인솔렌스 세포, 후미콜라 라누기노세 세포, 로도코쿠스 오파쿠스 세포, 리조무코르 미에헤이 세포, 또는 무코르 미에헤이 세포이다. 다른 실시예들에서, 숙주 세포는 스트렙토미세스 리비단스 세포 또는 스트렙토미세스 무리누스 세포이다. 다른 실시예들에서, 숙주 세포는 방선균 세포이다. 몇몇 실시예들에서, 숙주 세포는 맥주효모균 세포이다. 다른 실시예들에서, 숙주 세포는 진핵 식물, 조류, 남세균, 녹색-황 세균, 녹색 비-황 세균, 자색 황세균, 자색 비-황 세균, 극한 생물, 효모, 균류, 이들의 조작된 유기체, 또는 합성 유기체로부터의 세포이다. 몇몇 실시예들에서, 숙주 세포는 광 의존적이거나 탄소를 고정시킨다. 몇몇 실시예들에서, 숙주 세포는 독립영양적 활성을 갖는다. 몇몇 실시예들에서, 숙주 세포는 빛의 존재 하에서와 같이, 광독립영양적 활성을 갖는다. 몇몇 실시예들에서, 숙주 세포는 빛의 부재 하에서 종속영양적 또는 혼합영양적이다. 소정 실시예들에서, 숙주 세포는 애기장대, 파니쿰 비르가툼, 미스칸투스 기간테우스, 제아 메이스, 보트리오코쿠스 브라우니, 녹조류, 두나리엘라 살리나, 시네코코쿠스 종 PCC 7002, 시네코코쿠스 종 PCC 7942, 시네코시스티스 종 PCC 6803, 서모시네코코쿠스 엘롱가투스 BP-1, 클로로비움 테피둠, 클로로프렉수스 아우란티쿠스, 크로마티움 비노숨, 로도스피릴룸 루브룸, 로도박터 캡술라투스, 로도슈도모나스 파루스리스, 클로스트리디움 융달리, 클로스트리디움 서모셀룸, 페니실리움 크리소게눔, 피치아 파스토리스, 맥주효모균, 스키조사카로미세스 폼베, 슈도모나스 플루오레센스, 또는 자이모모나스 모빌리스로부터의 세포이다. 일 특정 실시예에서, 미생물 세포는 프로클로로코쿠스(Prochlorococcus), 시네코코쿠스, 시네코시스티스, 시아노테 세(Cyanothece), 및 노스톡 펑크티포르메(Nostoc Punctiforme)를 포함하는 시아노박테리아로부터이며, 이에 제한되지는 않는다. 또 다른 실시예에서, 미생물은 시네코코쿠스 엘롱가투스 PCC7942, 시네코시스티스 종 PCC6803, 및 시네코코쿠스 종 PCC7001을 포함하는 특정한 시아노박테리아 종으로부터이며, 이에 제한되지는 않는다.
재조합 숙주 세포 및 발효
본 명세서에서 사용되는 바와 같이, 발효라는 용어는 광범위하게 숙주 세포에 의한 유기 물질의 표적 물질(target substance)로의 전환, 예를 들어 탄소원을 포함하는 배지에서 재조합 숙주 세포의 배양물을 증식시킴으로써 재조합 숙주 세포에 의한 탄소원의 지방산 또는 그 유도체들로의 전환을 지칭한다. 생성을 위하여 허용되는 조건들은 숙주 세포로 하여금 원하는 생성물, 예컨대 지방산 또는 지방산 유도체를 생성하게 하는 여하한의 조건들을 지칭한다. 이와 유사하게, 벡터의 폴리뉴클레오티드 서열이 발현되는 조건 또는 조건들은 숙주 세포로 하여금 폴리펩티드를 합성하게 하는 여하한의 조건들을 의미한다. 적절한 조건들은, 예를 들어 발효 조건들을 포함한다. 발효 조건들은 온도 범위, 통기 수준, 공급량(feed rate), 및 배지 조성을 포함하는 다수 파라미터를 포함할 수 있으며, 이에 제한되지는 않는다. 이 조건들 각각은 개별적으로 및 조합하여, 숙주 세포가 성장하게 한다. 발효는 호기성, 혐기성, 또는 [미-호기성(micro-aerobic)과 같은] 이의 변이성(variations)일 수 있다. 예시적인 배양 배지는 배양액(broths) 또는 겔(gels)을 포함한다. 일반적으로, 배지는 숙주 세포에 의해 직접적으로 대사될 수 있는 탄소원을 포함한다. 또한, 효소들이 탄소원의 가동화(mobilization)[예를 들어, 전분 또는 셀룰로스의 발효성 당들로의 해중합(depolymerization)] 및 탄소원의 후속한 대사를 용이하게 하도록 배지에서 사용될 수 있다.
소규모 생성을 위해, 조작된 숙주 세포들은 예를 들어 약 100 μL, 200 μL, 300 μL, 400 μL, 500 μL, 1 mL, 5 mL, 10 mL, 15 mL, 25 mL, 50 mL, 75 mL, 100 mL, 500 mL, 1 L, 2 L, 5 L 또는 10 L의 뱃치(batchs)에서 성장될 수 있고; 발효될 수 있으며; 원하는 폴리뉴클레오티드 서열, 예컨대 ACP 및/또는 생합성 폴리펩티드를 인코딩하는 폴리뉴클레오티드 서열을 발현시키도록 유도될 수 있다. 대규모 생성을 위해, 조작된 숙주 세포들은 약 10 L, 100 L, 1000 L, 10,000 L, 100,000 L 및 1,000,000 L 또는 그 이상의 뱃치에서 성장될 수 있고; 발효될 수 있으며; 원하는 폴리뉴클레오티드 서열을 발현시키도록 유도될 수 있다. 대안적으로, 대규모 유가배양식 발효(fed-batch fermentation)가 수행될 수 있다. 본 명세서에서 설명되는 지방산 유도체 조성물은 재조합 숙주 세포 배양의 세포외 환경에서 발견되고, 배양 배지로부터 쉽게 격리될 수 있다. 지방산 유도체는 재조합 숙주 세포에 의해 분비될 수 있고, 세포외 환경으로 수송될 수 있거나 또는 수동적으로 재조합 숙주 세포 배양의 세포외 환경으로 전달될 수 있다. 지방산 유도체 조성물은 해당 기술분야에 알려진 통상의 방법들을 이용하여 재조합 숙주 세포 배양물로부터 격리된다.
재조합 숙주 세포로부터
유래된
생성물
본 명세서에서 사용되는 바와 같이, 현대 탄소의 분율 또는 fM은 각각 옥살산 표준 HOxI 및 HOxII로 알려져 있는 미국 국립표준기술연구소(National Institute of Standards and Technology: NIST) 표준 참고 물질(Standard Reference Materials: SRMs) 4990B 및 4990C에 의해 정의된 바와 동일한 의미를 갖는다. 이러한 기본적인 정의는 (AD 1950을 기준으로) 0.95 배의 14C/12C 동위원소 비율 HOxI에 관한 것이다. 이는 붕괴-보정된 산업혁명-전 목재(decay-corrected pre-Industrial Revolution wood)에 거의 등가이다. 현재 생존 생물권(living biosphere)(식물 재료)에 대하여, fM은 약 1.1이다. 바이오생성물(bioproduct)(예를 들어, 본 발명에 따라 생성되는 지방산 유도체들)은 생물학적으로 생성되는 유기 화합물을 포함한다. 특히, 본 명세서의 지방산 생합성 경로를 이용하여 생성되는 지방산 유도체들은 재생가능한 공급원들로부터 생성되지 않았으며, 말하자면 새로운 물질의 조성물이다. 이 새로운 바이오생성물은 이중 탄소-동위원소 핑거프린팅(dual carbon-isotopic fingerprinting) 또는 14C 연대측정(dating)에 기초하여 석유화학의 탄소로부터 유래되는 유기 화합물과 구별될 수 있다. 추가적으로, 생물자원 탄소(biosourced carbon)의 특이적 공급원(예를 들어, 글루코스 대 글리세롤)은 이중 탄소-동위원소 핑거프린팅에 의해 결정될 수 있다(예를 들어, 미국 특허 제 7,169,588호 참조). 석유 기반 유기 화합물과 바이오생성물을 구별하는 능력은 상업적으로(in commerce) 이러한 물질들을 추적하는 데 유익하다. 예를 들어, 생물학적 기반 및 석유 기반 탄소 동위원소 프로파일 둘 모두를 포함하는 유기 화합물 또는 화학물질은 석유 기반 물질들로만 만들어진 유기 화합물 및 화학물질과 구별될 수 있다. 따라서, 본 명세서의 바이오생성물은 이들의 특유한 탄소 동위원소 프로파일에 기초하여 상업적으로 후속되거나 추적될 수 있다. 바이오생성물은 각 샘플의 안정적인 탄소 동위원소 비율(13C/12C)을 비교함으로써 석유 기반 유기 화합물과 구별될 수 있다. 주어진 바이오생성물의 13C/12C 비율은, 이산화탄소가 고정된 시간에 대기 중의 이산화탄소에서의 13C/12C 비율의 결과이다. 또한, 이는 정확한 대사 경로를 반영한다. 또한, 국부적인 변이들도 일어난다. 석유, C3 식물(활엽), C4 식물(목초), 및 해양 탄산염(marine carbonate)이 모두 13C/12C 및 대응하는 δ13C 값들에서 상당한 차이를 나타낸다. 또한, C3 및 C4 식물들의 지질 물질은 대사 경로의 결과로서 동일한 식물들의 탄수화물 성분들로부터 유래된 물질들과 상이하게 분석한다. 측정의 정확도 내에서, 13C은 동위원소 분별 효과들로 인하여 큰 변화들을 나타내며, 바이오생성물들에 대한 이의 가장 중요한 점은 광합성 메카니즘이다. 식물들에서의 탄소 동위원소 비율 차이의 주요한 원인은 식물들에서의 광합성 탄소 대사의 경로, 특히 일차 카르복실화(primary carboxylation)(즉, 대기 중 CO2의 초기 고정) 동안 발생하는 반응의 차이들과 밀접하게 관련된다. 식생의 크게 두 가지 종류들은 C3[또는 캘빈-벤슨(Calvin-Benson)] 생합성 회로를 병합하는 것들 및 C4[또는 해치-슬랙(Hatch-Slack)] 생합성 회로를 병합하는 것들이다. C3 식물들에서, 일차 CO2 고정 또는 카르복실화 반응은 효소인 리불로스-1,5-디포스페이트 카르복실라제를 수반하며, 첫번째 안정적인 생성물은 3-탄소 화합물이다. 경목(hardwood)들 및 침엽수들과 같은 C3 식물들은 온대 기후 지역들에서 우세하다. C4 식물들에서, 또 다른 효소인 포스포엔올-피루베이트 카르복실라제를 수반하는 부가적인 카르복실화 반응은 일차 카르복실화 반응이다. 첫번째 안정적인 탄소 화합물은 이후에 탈카르복실화되는 4-탄소산(carbon acid)이다. 이에 따라 방출된 CO2는 C3 회로에 의해 재고정된다. C4 식물의 예시들은 열대형 목초들, 옥수수, 및 사탕수수이다. C4 및 C3 식물들이 모두 13C/12C 동위원소 비율의 범위를 나타내지만, 통상적인 값들은 C4 식물에 대해 약 -7 내지 약 -13 퍼밀(per mil)이고, C3 식물에 대해 약 -19 내지 약 -27 퍼밀이다[예를 들어, Stuiver 외(1977) Radiocarbon 19:355 참조]. 석탄 및 석유는 일반적으로 이 후자의 범위에 속한다. 13C 측정 척도는 본래 Pee Dee Belemnite(PDB) 석회암에 의한 제로 세트(zero set)에 의해 정의되며, 여기서 값들은 이 재료로부터 천분율 편차로 주어진다. δ13C 값들은 천분율(퍼밀), 약어로는 ‰로 표현되고, 아래와 같이 계산된다:
PDB 표준 물질(RM)이 고갈되고 있으므로, 일련의 대안적인 RM들이 IAEA, USGS, NIST 및 다른 선택된 국제 동위원소 실험실들과 협력하여 개발되었다. PDB로부터의 퍼밀 편차에 대한 표기는 δ13C이다. 질량 44, 45 및 46의 분자 이온들에 대한 고정밀 안정 비율 질량 분석[high precision stable ratio mass spectrometry](IRMS)에 의해 CO2 상에서 측정이 행해진다. 본 명세서에서 설명되는 조성물들은 본 명세서에서 설명되는 방법들 중 어느 하나에 의해 생성되는 바이오생성물을 포함하며, 예를 들어 지방산 유도체 생성물을 포함한다. 구체적으로, 바이오생성물은 약 -28 이상, 약 -27 이상, -20 이상, -18 이상, -15 이상, -13 이상, -10 이상, 또는 -8 이상의 δ13C를 가질 수 있다. 예를 들어, 바이오생성물은 약 -30 내지 약 -15, 약 -27 내지 약 -19, 약 -25 내지 약 -21, 약 -15 내지 약 -5, 약 -13 내지 약 -7, 또는 약 -13 내지 약 -10의 δ13C를 가질 수 있다. 다른 경우들에서, 바이오생성물은 약 -10, -11, -12 또는 -12.3의 δ13C를 가질 수 있다. 또한, 본 명세서의 기재내용에 따라 생성되는 바이오생성물은 각 화합물의 14C의 양을 비교함으로써 석유 기반 유기 화합물과 구별될 수 있다. 14C는 핵 반감기가 5730년이기 때문에, 더 오래된 탄소를 함유한 석유 기반 연료가 더 새로운 탄소를 함유한 바이오생성물과 구별될 수 있다[예를 들어, Currie, Source Apportionment of Atmospheric Particles, Characterization of Environmental Particles, J. Buffle and H. P. van Leeuwen, Eds., 1 of Vol. I of the IUPAC Environmental Analytical Chemistry Series(Lewis Publishers, Inc.) 3-74, (1992) 참조]. 방사성탄소 연대측정법(radiocarbon dating)의 기본적인 가정은 대기 중의 14C 농도의 항상성(constancy)이 생물(living organism)의 14C의 항상성을 유도한다는 것이다. 하지만, 1950년 이후부터의 대기권 핵실험 및 1850년 이후부터의 화석 연료의 연소로 인하여, 14C는 제 2의, 지구화학적인 시간 특성을 얻었다. 대기 CO2 및 이에 따른 생물권(living biosphere)의 그 농도는 1960년대 중반의 핵실험 피크의 거의 두 배였다. 이후, 7년 내지 10년의 근사적 이완 "반-감기"(approximate relaxation "half-life")를 갖는 약 1.2×10-12의 정상-상태 우주기원(steady-state cosmogenic) (대기) 기준 동위원소 비율(14C/12C)로 점진적으로 복귀되었다. 이 후자의 반감기가 문자 그대로 취해져야 하는 것이 아니라; 그보다는 핵무기 시대의 시작 이후로 대기권 및 생물권의 14C의 변이성을 추적하기 위해 상세한 대기 핵 투입/붕괴의 함수(detailed atmospheric nuclear input/decay function)를 사용하여야 한다. 이는 최근 생물권 탄소의 매년 연대측정의 가능성(promise of annual dating)을 지속하는 후자의 생물권 14C 시간 특성이다. 14C는 현대 탄소의 분율(fM)의 단위로 주어지는 결과들을 갖는 가속기 질량 분광 분석(accelerator mass spectrometry: AMS)에 의해 측정될 수 있다. fM은 미국 국립표준기술연구소(NIST) 표준 참고 물질(SRMs) 4990B 및 4990C에 의해 정의된다. 본 명세서에서 사용되는 바와 같이, 현대 탄소의 분율 또는 fM은 각각 옥살산 표준 HOxI 및 HOxⅡ로 알려져 있는 미국 국립표준기술연구소(NIST) 표준 참고 물질들(SRMs) 4990B 및 4990C에 의해 정의되는 바와 동일한 의미를 갖는다. 기본적인 정의는 (AD 1950을 기준으로) 0.95 배의 14C/12C 동위원소 비율 HOxI에 관한 것이다. 이는 붕괴-보정된 산업혁명-전 목재에 거의 등가이다. 현재 생물권(식물 재료)에 대하여, fM은 약 1.1이다. 본 명세서에서 설명되는 조성물들은 적어도 약 1의 fM 14C를 가질 수 있는 바이오생성물을 포함한다. 예를 들어, 본 발명의 바이오생성물은 적어도 약 1.01의 fM 14C, 약 1 내지 약 1.5의 fM 14C, 약 1.04 내지 약 1.18의 fM 14C, 또는 약 1.111 내지 약 1.124의 fM 14C를 가질 수 있다.
14C의 또 다른 측정은 pMC(percent of modern carbon)로 알려져 있다. 14C 연대를 이용하는 고고학자 또는 지질학자에 대하여, AD 1950년은 0의 해(zero years old)와 같다. 또한, 이는 100 pMC를 나타낸다. 대기 중의 핵무기 탄소(Bomb carbon)는 열(thermo)-핵무기의 피크에서 1963년의 통상 수준의 거의 두 배에 달하였다. 대기권 내의 이의 분포는 이의 출연 이후로 근사화되었으며, AD 1950년 이후로 살아 있는 식물들 및 동물들에 대하여 100 pMC보다 더 큰 값을 나타낸다. 이는 시간이 지나면서 107.5 pMC 부근인 현재의 값으로 점차 감소하였다. 이는 옥수수와 같은 신선한(fresh) 바이오매스 재료가 107.5 pMC 부근의 14C 시그너처(signature)를 제공한다는 것을 의미한다. 석유 기반 화합물들은 0의 pMC 값을 가질 것이다. 오늘날의 탄소와 화석 탄소의 조합은 오늘날의 pMC 함량의 희석을 유도할 것이다. 107.5 pMC가 오늘날의 바이오매스 재료의 14C 함량을 나타내고 0 pMC가 석유 기반 생성물의 14C 함량을 나타낸다고 가정함으로써, 재료에 대해 측정된 pMC 값은 두 성분 유형의 비율을 반영할 것이다. 예를 들어, 오늘날의 콩으로부터 100 % 유래된 재료는 107.5 pMC 부근의 방사성탄소 시그너처를 제공할 것이다. 그 재료가 석유 기반 생성물로 50 % 희석되었다면, 이는 약 54 pMC의 방사성탄소 시그너처를 제공할 것이다. 생물학적 기반 탄소 함량은 107.5 pMC와 같은 100 %, 및 0 pMC와 같은 0 %를 할당함으로써 유래된다. 예를 들어, 99 pMC로 측정된 샘플은 93 %의 등가의 생물학적 기반 탄소 함량을 제공할 것이다. 이 값은 평균 생물학적 기반 탄소 결과로 지칭되며, 오늘날의 생물학적 재료 또는 석유 기반 재료 중 어느 하나로부터 비롯된 분석된 재료 내의 모든 성분을 가정한다. 본 명세서에서 설명되는 바와 같은 1 이상의 지방산 유도체를 포함하는 바이오생성물은 적어도 약 50, 60, 70, 75, 80, 85, 90, 95, 96, 97, 98, 99 또는 100의 pMC를 가질 수 있다. 다른 경우에, 본 명세서에서 설명되는 지방산 유도체는 약 50 내지 약 100; 약 60 내지 약 100; 약 70 내지 약 100; 약 80 내지 약 100; 약 85 내지 약 100; 약 87 내지 약 98; 또는 약 90 내지 약 95의 pMC를 가질 수 있다. 또 다른 경우에, 본 명세서에서 설명되는 지방산 유도체는 약 90, 91, 92, 93, 94, 또는 94.2의 pMC를 가질 수 있다.
재조합 숙주 세포에 의해 생성된 지방산 유도체 조성물의 스크리닝
조건들이 발현을 허용하기에 충분한지를 결정하기 위하여, 숙주 세포가 예를 들어 약 4, 8, 12, 24, 36, 또는 48 시간 동안 배양될 수 있다. 배양 동안 및/또는 배양 이후, 샘플들이 얻어지고 조건들이 발현을 허용하는지를 결정하도록 분석될 수 있다. 예를 들어, 샘플 또는 숙주 세포들이 성장된 배지 내의 숙주 세포들은 원하는 생성물의 존재에 대해 테스트될 수 있다. 생성물의 존재에 대해 테스트하는 경우, TLC, HPLC, GC/FID, GC/MS, LC/MS, MS와 같은 -단, 이에 제한되지 않음- 어세이(assay)들이 사용될 수 있다. 재조합 숙주 세포 배양물은 총 FAS(Fatty Acid Species)에 대해 GC/FID 어세이를 사용하여, 96 웰 플레이트 수준, 1 리터, 5 리터 탱크 수준, 및 1000 L 파일럿 플랜트(pilot plant) 규모에서 스크리닝된다.
지방산 알코올 생성에 대한
ACP
증가의 효과
재조합 숙주 세포가 ACP(예를 들어, 시아노박테리아 ACP, 이하 표 3 참조)를 과발현시키도록 조작될 수 있다. 몇몇 실시예들에서, 재조합 숙주 세포는 1 이상의 지방산 생합성 폴리펩티드, 예를 들어 티오에스테라제(TE) 활성을 갖는 폴리펩티드 및 카르복실산 레덕타제(CAR) 활성을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오티드 서열을 포함하도록 더 조작될 수 있으며, 이때 재조합 숙주 세포는 지방족 알데히드 및/또는 지방족 알코올을 합성한다. 다른 실시예들에서, 재조합 숙주 세포는 TE 활성, CAR 활성 및 알코올 탈수소효소 활성을 인코딩하는 폴리뉴클레오티드 서열을 포함하도록 더 조작될 수 있으며, 이때 재조합 숙주 세포는 지방족 알코올을 합성한다. 다른 실시예들에서, 재조합 숙주 세포는 아실-ACP 레덕타제(AAR) 활성을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오티드 서열을 포함하도록 조작되며, 이때 재조합 숙주 세포는 지방족 알데히드 및 지방족 알코올을 합성하고; 또는 AAR 활성 및 알코올 탈수소효소 활성을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오티드 서열을 포함하도록 조작되며, 이때 재조합 숙주 세포는 지방족 알코올을 합성한다. 몇몇 경우에, 재조합 숙주 세포는 지방족 알코올 형성 아실-CoA 레덕타제(FAR) 활성을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오티드 서열을 포함하도록 조작되며, 이때 재조합 숙주 세포는 지방족 알코올을 합성한다. 시아노박테리아 ACP(이하 표 3 참조)를 인코딩하는 핵산 서열들의 과발현이 지방족 알코올 역가 및 수율을 개선하는 것으로 나타났다(이하, 예시 1 및 도 8 참조).
지방족 에스테르 생성에 대한
ACP
증가의 효과
재조합 숙주 세포가 ACP[예를 들어, M. 아쿠애올레이 VT8 ACP(SEQ ID NO: 122, NCBI: YP_959135.1)]를 과발현시키도록 조작될 수 있다. 몇몇 실시예들에서, 재조합 숙주 세포는 1 이상의 지방산 생합성 폴리펩티드, 예를 들어 에스테르 신타제(ES) 활성을 갖는 폴리펩티드; 또는 티오에스테라제(TE) 활성, 아실-CoA 신타제/신테타제(fadD) 활성 및 에스테르 신타제 활성을 갖는 1 이상의 폴리펩티드를 인코딩하는 폴리뉴클레오티드 서열을 포함하도록 더 조작될 수 있으며, 이때 재조합 숙주 세포는 지방족 에스테르(예를 들어, FAME, FAEE)를 합성한다. 몇몇 실시예들에서, 재조합 숙주 세포는 에스테르 신타제 활성을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오티드 서열을 포함하도록 조작될 수 있으며, 이때 재조합 숙주 세포는 지방족 에스테르를 합성하고(1 효소계, 도 5 참조); 또는 티오에스테라제 활성, 아실-CoA 신타제 활성 및 에스테르 신타제 활성을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오티드 서열을 포함하도록 조작될 수 있으며, 이때 재조합 숙주 세포는 지방족 에스테르를 합성한다(3 효소계, 도 5 참조). M . 아쿠애올레이 VT8 ACP(SEQ ID NO: 122, NCBI: YP_959135.1)를 인코딩하는 핵산 서열의 과발현이 지방족 아실 메틸 에스테르(FAME) 역가 및 수율을 개선하는 것으로 나타났다(이하, 예시 2 및 예시 3 및 도 9 내지 도 15 참조).
탄화수소 생성에 대한
ACP
증가의 효과
재조합 숙주 세포가 ACP(예를 들어, 시아노박테리아 ACP, 이하 표 3 참조)를 과발현시키도록 조작될 수 있다. 몇몇 실시예들에서, 재조합 숙주 세포는 1 이상의 지방산 생합성 폴리펩티드, 예를 들어 아실-ACP 레덕타제(AAR) 활성을 갖는 폴리펩티드 및 탈카르보닐라제(ADC) 활성을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오티드 서열을 포함하도록 더 조작될 수 있으며, 이때 재조합 숙주 세포는 알칸을 합성한다. 시아노박테리아 ACP(이하, 표 3 참조)를 인코딩하는 핵산 서열들의 과발현이 알칸 역가 및 수율을 개선하는 것으로 나타났다(이하, 예시 4 참조).
몇몇 실시예들에서, 알칸은 C3C25 알칸이다. 예를 들어, 알칸은 C3, C4, C5, C6, C7, C8, C9, C1O, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C21, C22, C23, C24, C25 또는 C26 알칸이다. 몇몇 실시예들에서, 알칸은 트리데칸, 메틸트리데칸, 노나데칸, 메틸노나데칸, 헵타데칸, 메틸헵타데칸, 펜타데칸, 또는 메틸펜타데칸이다. 알칸은 직쇄형 알칸, 분지쇄형 알칸, 또는 사이클릭 알칸일 수 있다. 소정 실시예들에서, 본 방법은 포화 지방산 유도체의 존재 하에 숙주 세포를 배양하는 것을 더 포함하며, 생성된 탄화수소는 알칸 또는 알켄이다. 소정 실시예들에서, 포화 지방산 유도체는 C6C26 지방산 유도체 기질이다. 특정 실시예들에서, 지방산 유도체 기질은 2-메틸이코산알, 이코산알, 옥타데칸알, 테트라데칸알, 2-메틸옥타데칸알, 스테아르알데히드, 또는 팔미트알데히드이다. 몇몇 실시예들에서, 본 방법은 숙주 세포 또는 배양 배지로부터 알칸을 격리시키는 것을 더 포함한다. 다른 실시예들에서, 본 방법은 알칸을 크래킹(crack) 또는 리파이닝(refine)하는 것을 더 포함한다.
다른 실시예들에서, 생성된 탄화수소는 알켄이다. 몇몇 실시예들에서, 알켄은 C3C25 알켄이다. 예를 들어, 알켄은 C3, C4, C5, C6, C7, C8, C9, C1O, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C21, C22, C23, C24, C25 또는 C26 알켄이다. 몇몇 실시예들에서, 알켄은 펜타데센, 헵타데센, 메틸펜타데센, 또는 메틸헵타데센이다. 알켄은 직쇄형 알켄, 분지쇄형 알켄, 또는 사이클릭 알켄일 수 있다. 몇몇 실시예들에서, 재조합 숙주 세포가 아실-CoA 레덕타제(AAR) 활성 및 알데히드 탈카르보닐라제(ADC) 활성을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오티드 서열을 포함하도록 조작되며, 이때 재조합 숙주 세포는 탄화수소(알칸 및 알켄)를 합성한다. 다른 실시예들에서, 재조합 숙주 세포는 티오에스테라제 활성, 카르복실산 레덕타제 활성 및 알데히드 탈카르보닐라제 활성을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오티드 서열을 포함하도록 조작되며, 이때 재조합 숙주 세포는 탄화수소(알칸 및 알켄)를 합성한다. 다른 실시예들에서, 재조합 숙주 세포는 아실-CoA 레덕타제 활성 및 OleA 활성을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오티드 서열을 포함하도록 조작되며, 이때 재조합 숙주 세포는 지방족 케톤을 합성하고; OleABCD 활성을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오티드 서열을 포함하도록 조작되며, 이때 재조합 숙주 세포는 내부 올레핀을 합성하고; 또는 티오에스테라제 활성 및 탈카르복실라제 활성을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오티드 서열을 포함하도록 조작되며, 이때 재조합 숙주 세포는 말단 올레핀을 합성한다.
지방산 유도체 조성물 및 이들의 이용
지방산은 긴 지방성 꼬리(aliphatic tail)(사슬)을 갖는 카르복실산이며, 이는 포화 또는 불포화된다. 대부분 자연적으로 발생하는 지방산은 4 내지 28 개의 짝수 개의 탄소 원자들의 사슬을 갖는다. 지방산은 일반적으로 트리글리세리드로부터 유래된다. 이들이 다른 분자에 부착되지 않는 경우, 이들은 유리 지방산으로 알려져 있다. 지방산은 일반적으로, 글리세롤의 제거와 함께 트리글리세리드의 가수분해에 의해 산업적으로 생산된다. 팜유, 콩기름, 유채유, 야자유 및 해바라기유가 현재 지방산의 가장 흔한 공급원이다. 이러한 공급원들로부터 유래되는 대부분의 지방산은 식료품(human food product)에서 사용된다. 야자유 및 팜핵유는 주로 12 및 14 개의 탄소 지방산으로 이루어진다. 특히, 이들은 화장품뿐만 아니라 세제 및 세정제용 계면활성제에 대한 추가 처리에 적절하다. 탤로(tallow)와 같은 동물성 지방뿐만 아니라, 팜유, 콩기름, 유채유 및 해바라기유가 주로 윤활제 및 중합체 적용물(polymer applications)에 대한 원료로서 사용되는 긴 사슬형 지방산(예를 들어, 포화 및 불포화 C18)을 함유한다. 생태학적 및 독성학적 연구들은, 재생가능한 자원을 기반으로 하는 지방산-유래 생성물들이 석유 기반 물질보다 더 유리한 속성들을 갖는다고 제안한다.
지방족 알데히드가 많은 특수 화학물질을 생산하는 데 사용된다. 예를 들어, 알데히드는 중합체, 수지[예를 들어, 베이클라이트(BAKELITE) 수지], 염료, 착향료, 가소제, 향수, 약제 및 다른 화학물질들을 생산하는 데 사용되고, 이들 중 일부는 용제, 보존제 또는 소독제로서 사용될 수 있다. 또한, 비타민 및 호르몬과 같은 소정 천연 및 합성 화합물들이 알데히드들이고, 많은 당이 알데히드기들을 함유한다. 지방족 알데히드들은 화학적 또는 효소적 환원에 의해 지방족 알코올들로 전환될 수 있다.
지방족 알코올들은 많은 상업적 용도들을 갖는다. 지방족 알코올들 및 이들의 유도체들의 전 세계적인 연간 판매액은 10억 달러를 초과한다. 짧은 사슬형 지방족 알코올들은 유화제, 연화제 및 증점제로서 화장품 산업 및 식품 산업에 사용된다. 이들의 양친매성 성질로 인해, 지방족 알코올들은 비이온성 계면활성제처럼 거동하고, 이는 예를 들어 세제와 같은 개인 위생 용품 및 가정 용품에 유용하다. 또한, 지방족 알코올들은 왁스, 검, 수지, 약제학적 연고 및 로션, 윤활유 첨가제, 직물 정전기 방지제 및 마무리제, 가소제, 화장품, 공업 용제 및 지방용 용제에 사용된다. 또한, 본 발명은 본 명세서에서 설명되는 여하한 방법들에 의해 생성되는 지방족 알코올을 포함하는 계면활성제 조성물 또는 세제 조성물을 제공한다. 본 기술분야의 당업자라면, 계면활성제 또는 세제 조성물의 의도된 목적에 따라, 상이한 지방족 알코올들이 생성되고 사용될 수 있다는 것을 이해할 것이다. 예를 들어, 본 명세서에서 설명되는 지방족 알코올들이 계면활성제 또는 세제 생산을 위한 공급원료로서 사용되는 경우, 본 기술분야의 당업자라면 지방족 알코올 공급원료의 특성들이 생산되는 계면활성제 또는 세제 조성물의 특성들에 영향을 미칠 것을 이해할 것이다. 따라서, 계면활성제 또는 세제 조성물의 특성들은 공급원료로서 사용되는 특정 지방족 알코올들을 생성함으로써 선택될 수 있다. 본 명세서에서 설명되는 지방족 알코올-기반 계면활성제 및/또는 세제 조성물은 본 기술분야에 잘 알려진 다른 계면활성제 및/또는 세제와 혼합될 수 있다. 몇몇 실시예들에서, 혼합물은 지방족 알코올의 중량의 적어도 약 10 %, 적어도 약 15 %, 적어도 약 20 %, 적어도 약 30 %, 적어도 약 40 %, 적어도 약 50 %, 적어도 약 60 %, 또는 상기 값들 중 어느 두 개의 값들에 의해 한정되는 범위를 포함할 수 있다. 다른 예시들에서, 계면활성제 또는 세제 조성물은 길이가 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21 또는 22 개의 탄소들인 탄소 사슬을 포함하는 지방족 알코올의 중량의 적어도 약 5 %, 적어도 약 10 %, 적어도 약 20 %, 적어도 약 30 %, 적어도 약 40 %, 적어도 약 50 %, 적어도 약 60 %, 적어도 약 70 %, 적어도 약 80 %, 적어도 약 85 %, 적어도 약 90 %, 적어도 약 95 %, 또는 상기 값들 중 어느 두 개의 값들에 의해 한정되는 범위를 포함하도록 만들어질 수 있다. 또한, 이러한 계면활성제 또는 세제 조성물은 식물성유 또는 석유와 같은 비-미생물 공급원(non-microbial sources)으로부터의 계면활성제 또는 세제 또는 마이크로에멀션(microemulsion)과 같은 적어도 하나의 첨가제를 포함할 수 있고, 이는 지방족 알코올의 중량의 적어도 약 5 %, 적어도 약 10 %, 적어도 약 15 %, 적어도 약 20 %, 적어도 약 30 %, 적어도 약 40 %, 적어도 약 50 %, 적어도 약 60 %, 적어도 약 70 %, 적어도 약 80 %, 적어도 약 85 %, 적어도 약 90 %, 적어도 약 95 %, 또는 상기 값들 중 어느 두 개의 값들에 의해 한정되는 범위의 양으로 존재할 수 있다.
에스테르들은 많은 상업적 용도들을 갖는다. 예를 들어, 바이오디젤, 대체 연료가 에스테르(예를 들어, 지방산 메틸 에스테르, 지방산 에틸 에스테르 등)로 이루어진다. 일부 저분자량 에스테르들은 기분 좋은 냄새와 함께 휘발하며, 이는 향료 또는 방향제로서 유용하게 한다. 또한, 에스테르들은 래커, 페인트 및 바니시를 위한 용제로서 사용된다. 또한, 왁스, 지방 및 오일과 같은 일부 자연적으로 발생하는 물질들도 에스테르들로 이루어진다. 또한, 에스테르들은 수지의 연화제, 가소제, 난연제, 및 가솔린 및 오일의 첨가제로서도 사용된다. 또한, 에스테르들은 중합체, 필름, 직물, 염료 및 약제의 제조에 사용될 수 있다.
탄화수소들은 많은 상업적 용도들을 갖는다. 예를 들어, 보다 짧은 사슬형 알칸들이 연료로서 사용된다. 보다 긴 사슬형 알칸들(예를 들어, 5 내지 16 개의 탄소들)은 수송 연료(예를 들어, 가솔린, 디젤 또는 항공 연료)로서 사용된다. 16 개 이상의 탄소 원자들을 갖는 알칸들은 연료유(fuel oil) 및 윤활유의 중요한 성분이다. 실온에서 고체인 더 긴 알칸들이, 예를 들어 파라핀 왁스로서 사용될 수 있다. 또한, 더 긴 사슬형 알칸들은 상업적으로 가치가 큰 더 짧은 사슬형 탄화수소들을 생성하도록 크래킹될 수 있다. 짧은 사슬형 알칸들과 같이, 짧은 사슬형 알켄들은 수송 연료에서 사용된다. 더 긴 사슬형 알켄들은 플라스틱, 윤활제 및 합성 윤활제에서 사용된다. 또한, 알켄들은 알코올, 에스테르, 가소제, 계면활성제, 삼차 아민, 석유회수증진제(enhanced oil recovery agents), 지방산, 티올, 알케닐숙신산 무수물, 에폭시드, 염소화 알칸, 염소화 알켄, 왁스, 연료 첨가제, 및 항력 흐름 감소제(drag flow reducers)를 생산하도록 공급원료로서 사용된다.
케톤들은 상업적으로 용제로서 사용된다. 예를 들어, 아세톤이 용제로서 흔히 사용되지만, 이는 중합체를 만드는 원료이기도 하다. 또한, 케톤은 래커, 페인트, 폭발물, 향수 및 직물 처리에 사용된다. 또한, 케톤은 알코올, 알켄, 알칸, 이민, 및 에나민을 생성하는 데 사용된다.
전형적으로, 윤활제는 올레핀, 특히 폴리올레핀 및 알파-올레핀으로 구성된다. 윤활제는 원유로부터 정제되거나, 원유로부터 정제된 원료를 사용하여 제조될 수 있다. 원유로부터 이러한 특수 화합물질을 얻는 것은 다량의 에너지뿐만 아니라 상당한 재정적 투자를 필요로 한다. 또한, 이는 흔히 보다 작은 단량체를 생산하기 위해 원유의 긴 사슬형 탄화수소가 크래킹되기 때문에 비효율적인 과정이다. 그 후, 이 단량체들은 더 복합적인 특수 화합물질을 제조하기 위해 원료로서 사용된다.
예시들
다음의 특정 예시들은 본 발명을 예시하기 위해 의도된 것이며, 청구항의 범위를 제한하는 것으로 해석되어서는 안 된다.
96 웰 플레이트에서 성장된 LB 배양물로부터, 270 μL FA2P 배지(이하, 표 2 참조)에 주입(inoculate)하기 위해 30 μL의 LB 배양물이 사용되었으며, 이는 이후 하루가 지난 종자(overnight seed)를 발생시키도록 32 ℃ 진탕기(shaker)에서 약 16 시간 동안 배양되었다. 하루가 지난 종자의 30 μL가 300 μL FA4P 배지 + 2% MeOH + 1mM 이소프로필 β-D-1-티오갈락토피라노시드(IPTG)(아래 표 2 참조)에 주입하는 데 사용되었다. 배양물은 24 시간 동안 32 ℃ 진탕기에서 배양되었고, 이후 이들은 아래에 자세히 설명된 표준 추출 프로토콜을 이용하여 추출되었다.
표 2:
배지명
및 제제(Formulation)
지방산 종류 표준 추출 프로토콜:
40 μL의 1M HCl이 추출되도록 각각의 웰(well)에, 내부 표준으로서 500 mg/L C11-FAME을 갖는 300 μL 부틸 아세테이트가 첨가되었다. 96 웰 플레이트는 플레이트 실러(plate sealer)(ALPS-300; Abgene, ThermoScientific, Rockford, IL)를 이용하여 열-융착되었고(heat-sealed), MixMate(Eppendorf, Hamburg, Germany)를 이용하여 2000 rpm으로 15 분 동안 진탕되었다. 진탕 후, 상기 플레이트는 실온에서 4500 rpm으로 10 분 동안 원심분리되어(Allegra X-15R, rotor SX4750A, Beckman Coulter, Brea, CA), 수성 및 유기 층들을 분리하였다. 유기 층의 50 μL가 96 웰 플레이트(96-well plate, polypropylene, Corning, Amsterdam, The Netherlands)로 전달되었다. 상기 플레이트는 열-융착된 후, 아래에서 설명되는(이하의) Upstream_Biodiesel_FAME_ BOH-FAME-underivitized 방법을 이용하여 GC-FID에 의해 평가될 때까지 -20 ℃로 저장되었다.
Upstream Biodiesel FAME BOH FAME Underivitized 방법:
1 mL의 샘플이 불꽃 이온화 검출기(FID)를 갖는 Trace GC Ultra(Thermo Fisher Scientific, Waltham, MA)에서 UFM 칼럼(column)(cat#: UFMC00001010401, Thermo Fisher Scientific, Waltham, MA) 상에 주입되었다. 이 기구는 C8 내지 C18 FAME 및 C8 내지 C18 β-OH FAME을 검출하도록 셋업되었다.
앞서 자세히 설명된 프로토콜들은 표준 조건들을 나타내며, 이는 분석 결과들을 최적화하기 위해 필요에 따라, 추출 부피 또는 또 다른 파라미터를 변화시키도록 변형될 수 있다.
예시 1
증가된
아실기
운반 단백질(
ACP
)-
매개되는
지방산 생합성 경로를 통한 플럭스
수 개의 시아노박테리아로부터의 acp 유전자들은 플라스미드 pLS9-185에서 시네코코쿠스 엘롱가투스 PCC7942 아실-ACP 레덕타제(AAR)로부터 하류에(downstream) 클로닝되었으며, 이는 pCL1920 유도체(3-5 복사체/세포)이다. 바 실루스 서브틸리스로부터의 sfp 유전자(수탁 번호 X63158; SEQ ID NO: 11)는 비활성 아포-ACP 단백질의 활성 홀로-ACP 단백질로의 전환에 관련되는 포스포판테테이닐트랜스페라제를 인코딩한다. 폭넓은 기질 특이성을 갖는 이 포스포판테테이닐트랜스페라제가 각각의 acp 유전자들의 하류에 클로닝되었다. 표 3(이하)에 열거된 플라스미드들은 다수의 연구들을 수행하도록 구성되었다.
표 3: (기본 플라스미드
pLS9
-185에서) S.
엘롱가투스
PCC7942
AAR로부터의
하류에 B.
서브틸리스
sfp를
포함하는, 및 포함하지 않는 시아노박테리아
ACP를
공동발현시키는 플라스미드
지방산 생성
ACP의 과발현이 유리 지방산 생성을 증가시킬 수 있는지를 평가하기 위하여, sfp를 포함하는 일 시아노박테리아 ACP 유전자가 pDS171s로부터 증폭되었고(앞선 표 3 참조), pCL 벡터로 'tesA(선도없는 티오에스테라제 유전자)로부터 하류에 클로닝되었다. 결과적인 오페론은 Ptrc3 프로모터의 제어 하에 있었고, 이는 Ptrc 야생형 프로모터보다 약간 더 낮은 전사 수준을 제공했다. 구조체(construct)는 대장균 DV2 내로 클로닝되었고, 지방산 생성에 대하여 평가되었다. 대조군 균주는 동일한 플라스미드를 함유하였으나, 시아노박테리아 ACP 및 B. 서브틸리스 sfp는 포함하지 않았다. 표준 미량역가 플레이트(microtiter plate) 발효 실험으로부터의 결과들은 도 7에 나타낸다. 나타낸 바와 같이, 지방산 역가의 상당한 개선이 이종 ACP를 공동발현시키는 숙주 균주에서 관찰되었고, 이는 ACP 과발현이 이 경우에 아마도 지방산 생합성 경로를 통한 플럭스를 증가시킴으로써 지방산 생성에 유익할 수 있다는 것을 입증한다.
지방족 알코올 생성
수 개의 시아노박테리아 acp 유전자들이 pLS9-185에서 노스톡 73102 아실-ACP 레덕타제(AAR; SEQ ID NO: 80)의 하류에 클로닝되었다. 이 플라스미드는 pCL1920-기반이고, 약 3-5 복사체/세포에 존재한다. 또한, 몇몇 플라스미드에서, 포스포판테테이닐 트랜스페라제를 인코딩하는 바실루스 서브틸리스로부터의 sfp 유전자는 각각의 acp 유전자들의 하류에 클로닝되었다. acp 유전자들은 모두 IN-FUSION 기술(IN_FUSION HD cloning kit; Clonetech Laboratories, Inc.)을 이용하여 pLS9-185에서 aar 유전자의 하류에 가까운 EcoRI 부위로 합성 RBS와 클로닝되었다. EcoRI 부위는 acp 유전자의 하류에 재구성되었다. 이와 유사하게, B. 서브틸리스 sfp 유전자는 합성 RBS와 함께 이 EcoRI 부위로 IN-FUSION 클로닝되었다.
시네코시스티스 7942 acp(SEQ ID NO: 7)가 프라이머들 168IFF(SEQ ID NO: 13) 및 168IFR(SEQ ID NO: 14)을 이용하여 플라스미드 pEP09로부터 증폭되었다. 이 PCR 생성물은 플라스미드 pDS168을 형성하도록 플라스미드 pLS9-185의 EcoRI 부위로 (앞선) IN-FUSION kit를 이용하여 클로닝되었다.
시네코시스티스 6803 acp(SEQ ID NO: 3)가 프라이머들 169IFF(SEQ ID NO: 15) 및 169IFR(SEQ ID NO: 16)을 이용하여 플라스미드 pTB044로부터 증폭되었다. 이 PCR 생성물은 플라스미드 pDS169를 형성하도록 플라스미드 pLS9-185의 EcoRI 부위로 (앞선) IN-FUSION kit를 이용하여 클로닝되었다.
프로클로로코쿠스 마리누스 MED4 acp(SEQ ID NO: 5)가 프라이머들 170IFF(SEQ ID NO: 17) 및 170IFR(SEQ ID NO: 18)을 이용하여 플라스미드 pEP07로부터 증폭되었다. 이 PCR 생성물은 플라스미드 pDS170을 형성하도록 플라스미드 pLS9-185의 EcoRI 부위로 (앞선) IN-FUSION kit를 이용하여 클로닝되었다.
노스톡 73102 acp(SEQ ID NO: 1)가 프라이머들 171IFF(SEQ ID NO: 19) 및 171IFR(SEQ ID NO: 20)을 이용하여 플라스미드 pEP11로부터 증폭되었다. 이 PCR 생성물은 플라스미드 pDS171을 형성하도록 플라스미드 pLS9-185의 EcoRI 부위로 (앞선) IN-FUSION kit를 이용하여 클로닝되었다.
노스톡 7120 acp(SEQ ID NO: 9)가 프라이머들 172IFF(SEQ ID NO: 21) 및 172IFR(SEQ ID NO: 22)을 이용하여 플라스미드 pTB045로부터 증폭되었다. 이 PCR 생성물은 플라스미드 pDS172를 형성하도록 플라스미드 pLS9-185의 EcoRI 부위로 (앞선) IN-FUSION kit를 이용하여 클로닝되었다.
(변형된 4'-포스포판테테이닐 트랜스페라제를 인코딩하는) 합성 sfp 유전자는 증폭되고, 플라스미드들 pDS168 내지 pDS172의 EcoRI 부위로 클로닝되었다. sfp + 합성 RBS는 다음의 포워드 프라이머(forward primer)들: 168SIFF(SEQ ID NO: 23), 170SIFF(SEQ ID NO: 24), 171SIFF(SEQ ID NO: 25) 중 하나를 이용하여 증폭되었다. 다음과 같은: 즉, 168SIFR(SEQ ID NO: 26)과 같은 동일한 리버스 프라이머(reverse primer)가 각각의 증폭에 사용되었다. 168S PCR 생성물은 pDS168S를 형성하도록 (앞선) IN-FUSION 기술을 이용하여 EcoRI-제한 pDS168로 클로닝되었다. 170S PCR 생성물은 pDS170S를 형성하도록 (앞선) IN-FUSION 기술을 이용하여 EcoRI-제한 pDS170으로 클로닝되었다. 171S PCR 생성물은 pDS171S를 형성하도록 (앞선) IN-FUSION 기술을 이용하여 EcoRI-제한 pDS171로 클로닝되었다. 172S PCR 생성물은 pDS172S를 형성하도록 (앞선) IN-FUSION 기술을 이용하여 EcoRI-제한 pDS172로 클로닝되었다.
표준 진탕 플라스크 발효 실험들로부터의 결과들은 도 8에 나타낸다. 나타낸 바와 같이, 지방족 알코올 역가의 상당한 개선이 플라스미드들 pDS168 및 pDS169를 함유하는 숙주 균주들에서 관찰되었고(앞선 표 3 참조), 이는 ACP 과발현이 이 경우에 아마도 이종의 말단 경로 효소에 의해 아실-ACPs의 인식, 친화성 및/또는 대사회전을 도움으로써 지방족 알코올 생성에 유익할 수 있다는 것을 입증한다. 또한, 역가의 상당한 개선이 플라스미드들 pDS171S 및 pDS172S를 함유하는 숙주 균주들에서 관찰되었다. 이 플라스미드들은 sfp 유전자가 이어지는 노스톡 7120 또는 73102_acp 유전자들을 함유한다. 또한, pDS169를 함유하는 숙주 균주들(시네코시스티스 6803_acp)이 역가의 개선을 보였다. 이는 여러 독립적 실험들에서 재현가능한 것으로 나타났다. 원시 알코올 탈수소효소들이 생체 내에서 알데히드를 알코올로 전환하였다.
예시 2
증가된
아실기
운반 단백질(
ACP
)-
매개되는
지방산 생합성 경로를 통한 플럭스 - 지방족 에스테르 생성
본 명세서에서, 메틸 에스테르 생성은 M. 아쿠애올레이 VT8 아실기 운반 단백질(mACP)의 과발현에 의해 개선될 수 있는 것으로 나타났다. 마리노박터 아쿠애 올레이 VT8(SEQ ID NO: 122)로부터의 ACP의 단백질 서열은 마리노박터 하이드로카보노클라스티쿠스(DSM8798; ATCC49840; SEQ ID NO: 124)로부터의 ACP의 단백질 서열과 동일하다. 하지만, M. 아쿠애올레이 VT8(SEQ ID NO: 121)에 대한 핵산 서열은 하나의 염기쌍에 의해 DSM8798(SEQ ID NO: 123)에 대한 핵산 서열과 상이하다(즉, 잠재성 돌연변이).
지방족 에스테르(즉, FAME)를 생성하도록 앞서 조작된 숙주 세포 균주(즉, DfadE, DtonA, rph+ 및 ilvG+ T5_ifab138 T5_fadR을 갖는 MG1655에 기초한 sven.036)는 (에스테르 신타제, 코리네박테리움 글루타미쿰으로부터의 ACC, 및 코 리네박테리움 글루타미쿰으로부터의 birA에 대한 유전자들을 운반하는) pKEV022라는 명칭의 생성 플라스미드(production plasmid)를 운반하도록 더 변형되었으며, 여기에서 mACP가 birA 유전자 뒤에 클로닝되었다(즉, pKEV022-mACP와 동일한 pEP.100). 여기에서, birA는 비오틴을 AccB(비오틴 카르복실 운반 단백질)에 결찰(ligate)할 때 ACC 활성을 향상시키기 위해 사용되었다.
이 균주들은 mACP를 함유하지 않는 지방족 에스테르 숙주 세포 생성 균주에 비해, 플레이트 발효 및 5 L 바이오리액터 발효에서 더 높은 지방산 메틸 에스테르(FAME) 수율 및 역가를 생성하였다. 마리오박터 ACP라고도 하는 M. 아쿠애올레 이 VT8 아실기 운반 단백질(mACP)은 프라이머들 EP343(SEQ ID NO: 27) 및 EP345(SEQ ID NO: 28)을 이용하여 플라스미드 pNH153L로부터 증폭되었고, 그 후 birA 유전자 뒤에 pKEV022 플라스미드로 (앞선) IN-FUSION kit를 통해 클로닝되었다. M. 아쿠애올레이 VT8의 게놈 DNA 준비(preparation)로부터 mACP를 증폭시킴으로써 pNH153L이 발생되었다.
최적화된 IGR 서열[birA-TAAtagaggaggataactaaATG-mACP(SEQ ID NO: 29)]이 mACP 앞에 사용되었다. 인퓨전 클로닝(infusion cloning)을 위한 pKEV022 플라스미드 백본은 프라이머들 EP342(SEQ ID NO: 30) 및 EP344(SEQ ID NO: 31)을 이용하여 증폭되었다. pEP.100 플라스미드에서의 에스테르 신타제, ACC-birA 및 mACP 유전자들의 서열들은 서열 확인되었다(sequence verified). 플라스미드 pEP.100은 BD64 및 sven036 대장균 균주들로 형질전환되었다. 결과적인 균주들은 각각 stEP598 및 stEP604로 명명되었다. Sven036 균주는 ifab138 오페론 앞의 T5 프로모터 및 rph+ 및 ilvG+ 보정들의 추가 특징을 갖는 BD 64와 동질유전자이다(PCT/US13/35037 참조). 적절한 제어군들과 함께 각 균주로부터의 2 개의 콜로니(KEV075 = BD64/pKEV022 및 sven038 = sven036/pKEV022)가 앞서 설명된 플레이트들에서의 프로토콜 에스테르 스크리닝을 이용하여 삼중으로 테스트되었다. 도 9는 pEP.100 플라스미드를 함유하는 균주들의 플레이트 발효의 결과들을 나타낸다. 도시된 바와 같이, stEP604 균주들은 제어군 sven038 균주보다 놀랄만큼 높은 역가 개선(3 배)을 나타낸다. BD64 균주 배경에서의 동일한 플라스미드는 대조군 KEV075 균주보다 약간 더 낮은 역가들을 유도하였다. 이 발효 결과들에 기초하여, stEP604가 그 다음 5L 바이오리액터에서 평가되었다. 도 10은 stEP604에 대한 탱크 데이터를 예시한다. 나타낸 바와 같이, stEP604는 진행 내내 지속적으로 제어군(sven38)보다 더 높은 역가를 가졌다.
이 결과들은, pKEV022 플라스미드에서 birA 뒤에 M. 아쿠애올레이 VT8 ACP를 클로닝하고 sven036 배경에서 이를 발현시키는 것이 제어군 sven038 균주와 비교하는 경우 역가의 35 % 이상의 증가 및 10 % 수율 개선을 유도하였음을 나타낸다. 이 결과들은 다른 미생물로부터의 ACP를 포함한 ACP의 과발현이 지방산 유도체들의 수율을 효과적으로 증가시킬 수 있다고 제안한다. M . 아쿠애올레이 VT8 ACP의 발현 수준은 RBS 또는 프로모터 라이브러리들을 통해 더 최적화되어, 훨씬 더 큰 수율 개선 및 역가의 더 큰 증가를 유도할 수 있다.
예시 3
대장균
또는
마리오박터
아쿠애올레이
VT8
ACP의
과발현이 지방산 합성 경로를 통한 플럭스를 증가시킴 - 지방족 에스테르 생성
재조합 숙주 세포에 의해 생성된 FAME는 상업용 바이오디젤의 생성에 사용될 수 있지만; 경제적으로 실행가능한 상업적 규모에 대한 발효 과정들의 최적화가 FAME 생성의 역가 및 수율을 최대화하여야 한다. 후보 상업적 균주들은 5L 바이오리액터에서의 배양에 의해서뿐 아니라, 고스루풋 스크린들에서 식별될 수 있다. 이 연구에서, 대장균 ACP 또는 M. 아쿠애올레이 VT8 ACP 각각의 과발현이 재조합 숙주 세포들로부터의 지방족 아실 메틸 에스테르(FAME) 역가 및 수율을 증가시키는 것으로 나타났다. 앞서 M. 아쿠애올레이 VT8 ACP(mACP), 예를 들어 플라스미드 pKEV022를 발현시키도록 유전적으로 변형된 숙주 세포 균주들이 더 높은 역가의 FAME를 생성하는 것으로 나타냈었다(앞선 예시 2 참조). 이 예시에서는, 대장균 ACP가 유사한 조건들 하에서 평가되었다. 대장균 ACP(ecACP) 또는 M. 아쿠애올레 이 VT8s ACP(mACP)는 이들이 효소 변이체들과 화합가능(compatible)한지의 여부를 확인하도록 상이한 에스테르 신타제 변이체들과 조합하여 테스트되었다.
플라스미드 구성
플라스미드 pSven.036은 pKEV022-ecACP를 포함하고; 플라스미드 pSven.037은 pSHU18-ecACP를 포함한다. ecACP는 프라이머들 oSV44(SEQ ID NO: 32) 및 oSV45(SEQ ID NO: 33)를 이용하여 생성 숙주 균주 sven.036으로부터 증폭되었다. 그 후, 유전자 서열은 (앞선) IN-FUSION kit 클로닝을 통해 birA 유전자 뒤에 pKEV022 및 pSHU18 플라스미드로 클로닝되었다. (프라이머 oSV44에서 강조되는) 최적화된 IGR 서열이 대장균 ACP 앞에서 사용되었다. 인퓨전 클로닝을 위한 pKEV022/pSHU18 플라스미드 백본은 프라이머들 EP342(SEQ ID NO: 30) 및 EP344(SEQ ID NO: 31)를 이용하여 증폭되었다. 클로닝 반응은 우선 STELLAR 화학적 수용성 세포(chemically competent cell)들에서 형질전환되었으며, 그 후 새로운 플라스미드들 pSven.036 및 pSven.037의 정제에 앞서 서열이 확인되었다. 또한, 유사한 전략이 상이한 에스테르 신타제 변이체들로 mACP를 클로닝하기 위해 사용되었으며, 이때 플라스미드 pEP100이 프라이머들 EP343(SEQ ID NO: 27) 및 EP345(SEQ ID NO: 28)를 이용하여 mACP를 증폭시키도록 주형(template)으로서 사용되었다. 결과적인 플라스미드들은 아래의(이하) 표 4에 나타낸다. D+는 에스테르 신타제의 하류에서의 accDA, accBC 및 birA 유전자들의 존재를 언급한다(accDA, accBC 및 birA 유전자들은 코리네박테리움 글루타미쿰으로부터 비롯되었음).
표 4: 플라스미드들의 기재(Description)
발효 결과
표 4에 나타낸 모든 플라스미드들은 생성 숙주, GLPH-077로 형질전환되었다. 균주들 GLPH-077 및 GLPH-009는 파지에 대한 내성을 위해 선택함으로써 sven.036으로부터 유래되었다. Sven.036은 WT MG1655 균주들에 자연적으로 존재하는 ilvG 및 rph의 틀-이동 돌연변이에 대한 보정들을 포함하며, 또한 지방산 생합성에 관련된 유전자들의 과발현을 용이하게 하는 (앞선) ifab138 오페론을 구동하는 T5 프로모터를 갖는다. 4 개의 개별적인 형질전환체가 선택되고, 앞서 설명된 플레이트들에서 프로토콜 에스테르 스크리닝을 이용하여 적절한 제어군들에 대해 비교되었다. 표 4에 나타낸 플라스미드들과 형질전환된 생성 숙주 GLPH-077에 의해 생성된 FAME의 역가 및 β-OH 함량은 ACP의 과발현을 이용하지 않고 동일한 에스테르 신타제 변이체들을 발현시키는 생성 숙주 GLPH-077에 의해 생성된 FAME의 역가 및 β-OH 함량과 비교되었다. 이 연구에서 사용된 균주들은 표 5에서 열거되며, 마리노박터 하이드로카보노클라스티쿠스로부터의 에스테르 신타제 변이체들을 포함한다.
표 5: 균주 기재(Strain Description)
도 11에서 알 수 있는 바와 같이, mACP 과발현을 갖는 균주들은, 특히 제어군 균주(sven.315 및 sven.205)의 역가의 약 3 배인 역가를 생성하는 pKEV022 플라스미드(pSven.037이 pKEV022-mACP를 포함함)를 이용하는 경우, 각각의 제어군들보다 나은 총 FAME 역가의 상당한 증가를 나타냈다. 도 12는 pKEV022 및 pSHU018에서의 ecACP의 과발현을 예시한다. 이 발효 결과들에 기초하여, 균주들은 5 L 바이오리액터에서 진행되었다. 도 13은 mACP 및 ecACP 과발현의 바이오리액터 역가 데이터를 나타낸다. ecACP를 갖는 pSHU18이 생성되는 총 FAS(Fatty Acid Species)에 관하여 다른 에스테르 신타제 변이체들을 능가하는 것으로 나타났다. 도 14는 바이오리액터에서의 β-OH FAME 생성을 예시한다. ecACP의 과발현을 갖는 pSHU18이 약 68 % β-OH FAME를 생성하였다. 도 15는 글루코스에 대한 수율을 비교하는 바이오리액터 데이터를 예시한다. ecACP의 과발현을 갖는 pSHU18이 이 연구에서 테스트된 다른 균주들보다 더 높은 수율을 분명하게 보였다. 이 데이터는, pSHU18 플라스미드에서 birA 뒤에 ecACP를 클로닝하고 GLPH77 배경(sven.315)에서 이를 발현시키는 것이 step604에 비해 8 % 수율 개선 및 6 % FAS 역가 개선을 유도하였음을 나타낸다. 또한, sven.315는 sven.241(이는 pSHU18 플라스미드에서 과발현된 mACP를 가짐)에 비해 수율에 관하여 60 % 및 역가의 2 배 개선을 이루었다. 균주 sven.315는 FAS에 대한 역가의 67 % 증가 및 64 % 더 큰 수율을 보였다. sven.313(이는 pSven.023 플라스미드에서 과발현된 mACP를 가짐)이 sven.227에 비교된 경우, 역가에 있어서 36 %, 및 수율에 있어서 32 %의 개선이 관찰되었다. 이 데이터는 ecACP 또는 mACP의 존재가 FAS의 역가 및 수율의 큰 증가를 유도하는 것으로 나타낸다.
mACP 및 ecACP의 서열들은 NCBI 툴 "BLASTp"를 이용하여 비교되었다. 결과들은 다음과 같았다: Query 1 서열(77 개의 아미노산 길이).
서열 정렬 결과들은, mACP 및 ecACP 단백질들이 아미노산 잔기들에 관하여 서로 82 % 동일하고 89 % 유사함을 나타낸다. 이는 (소정 서열 유사성을 갖는) 다른 유기체들로부터의 ACP들이 지방족 알코올 및 지방족 에스테르와 같은 지방산 유도체들의 생성을 향상시키는 데 있어서 (예시로 든 mACP 및 ecACP 서열들과) 유사한 효과를 가질 수 있다고 제안한다. 세포에서의 ACP의 발현 수준은 IGR 라이브러리를 통해 더 최적화될 수 있다. 강한 프로모터에 대한 배지의 제어 하의 발현에 의해, 및/또는 대장균 염색체 내의 ACP 유전자의 통합에 의해 수율의 추가 개선들이 얻어질 수 있다. 이 균주들을 이용하여 프로모터 라이브러리들이 형성될 수 있다. 대안적으로, 다른 유기체들로부터의 ACP들이 테스트될 수 있다.
예시 4
대장균
또는
마리노박터
하이드로카보노클라스티쿠스
ACP의
과발현이 지방산 합성 경로를 통한 플럭스를 증가시킴 -
알칸
생성
다수의 시아노박테리아 acp 유전자들이 pLS9-185에 존재하는 노스톡 73102 아실-ACP 레덕타제(SEQ ID NO: 80)로부터 하류에 클로닝되었다. 플라스미드 pDS171S가 pLS9-185 내의 aar 유전자의 하류에 가까운 EcoRI 부위로 합성 RBS와 클로닝된 노스톡 73102 acp를 함유한다. 바실루스 서브틸리스로부터의 sfp 유전자는 각각의 acp 유전자들의 하류에 클로닝되었다. 이 플라스미드들은 플라스미드 pLS9-181과 공동발현되었으며, 이는 ADC(노스톡 PCC73102로부터의 알데히드 탈카르보닐라제; SEQ ID NO: 38)를 함유한다. 두 플라스미드들을 함유한 균주는 25 mM Mn2+의 첨가와 함께 32 ℃에서 표준 발효 프로토콜을 거쳤다. 도 16은 24 시간 유도-후(post-induction) 생성되었던 알칸의 평균 양을 나타낸다(3 배 +/- 표준 오차). 알칸 역가에 있어서 상당한 5 배 개선(도 16의 기둥 3 참조)이 플라스미드 pDS171S를 함유한 균주에서 관찰되었다. 제어군(acp/sfp 없음)은 pLS9-185였다. 결과들은 노스톡 73102 acp + sfp 발현이 알칸 생성을 개선하였음을 나타낸다.
시아노박테리아 acp + sfp 유전자들은 수 개의 형태들로, 예를 들어 알칸 오페론과 연계되거나 개별 유닛으로서 존재하는 염색체 내의 부위에 통합되어 공급될 수 있다. acp 및 sfp의 발현은 프로모터 및/또는 리보솜 결합 부위의 조정에 의해 변화될 수 있다. 결과들은 활성 시아노박테리아 ACP의 발현이 재조합 숙주 생성 균주들에 의한 알칸의 증가된 역가/수율을 가능하게 할 수 있다고 제안한다.
예시 1 내지 예시 4의 결과들은, 글루코스와 같은 원료를 지방산, 지방족 에스테르, 지방족 알코올 및 지방족 알칸으로 전환시키는 향상되고 변경된 능력들을 갖는 새로운 재조합 숙주 세포 균주들의 생성을 예시한다. 따라서, 본 명세서에서는 ACP들의 과발현이 재조합 숙주 세포들을 통한 지방산 유도체들의 생성을 개선하고, 대응하는 야생형 세포들과 비교하여 더 높은 역가, 더 높은 수율 및 더 높은 생산성을 유도한다는 것을 나타내었다. 모든 서열 식별 번호들(SEQ ID NOS)이 아래의 표 6에 열거된다(완전한 서열 정보를 위해서는 서열 목록 참조).
표 6: 서열들의 표
당업자라면 이해할 수 있는 바와 같이, 앞선 실시형태들 및 실시예들의 다양한 변형들 및 변경들이 본 발명의 기술사상 및 범위를 벗어나지 않고 행해질 수 있다. 이러한 변형들 및 변경들은 본 발명의 범위 내에 있다.
<110> LS9, INC.
<120> EFFECT OF ACP ON PRODUCTION OF FATTY ACID DERIVATIVES
<130> LS00045PCT
<140>
<141>
<150> 61/736,428
<151> 2012-12-12
<160> 124
<170> PatentIn version 3.5
<210> 1
<211> 255
<212> DNA
<213> Nostoc punctiforme
<400> 1
atgagccaaa cggaactttt tgaaaaggtc aagaaaatcg tcatcgaaca actgagtgtt 60
gaagatgctt ccaaaatcac tccacaagct aagtttatgg aagatttagg agctgattcc 120
ctggatactg ttgaactcgt gatggctttg gaagaagaat ttgatatcga aattcccgac 180
gaagctgccg agcagattgt atcggttcaa gacgcagtag attacatcaa taacaaagtt 240
gctgcatcag cttaa 255
<210> 2
<211> 84
<212> PRT
<213> Nostoc punctiforme
<400> 2
Met Ser Gln Thr Glu Leu Phe Glu Lys Val Lys Lys Ile Val Ile Glu
1 5 10 15
Gln Leu Ser Val Glu Asp Ala Ser Lys Ile Thr Pro Gln Ala Lys Phe
20 25 30
Met Glu Asp Leu Gly Ala Asp Ser Leu Asp Thr Val Glu Leu Val Met
35 40 45
Ala Leu Glu Glu Glu Phe Asp Ile Glu Ile Pro Asp Glu Ala Ala Glu
50 55 60
Gln Ile Val Ser Val Gln Asp Ala Val Asp Tyr Ile Asn Asn Lys Val
65 70 75 80
Ala Ala Ser Ala
<210> 3
<211> 234
<212> DNA
<213> Synechocystis sp.
<400> 3
atgaatcagg aaatttttga aaaagtaaaa aaaatcgtcg tggaacagtt ggaagtggat 60
cctgacaaag tgacccccga tgccaccttt gccgaagatt taggggctga ttccctcgat 120
acagtggaat tggtcatggc cctggaagaa gagtttgata ttgaaattcc cgatgaagtg 180
gcggaaacca ttgataccgt gggcaaagcc gttgagcata tcgaaagtaa ataa 234
<210> 4
<211> 77
<212> PRT
<213> Synechocystis sp.
<400> 4
Met Asn Gln Glu Ile Phe Glu Lys Val Lys Lys Ile Val Val Glu Gln
1 5 10 15
Leu Glu Val Asp Pro Asp Lys Val Thr Pro Asp Ala Thr Phe Ala Glu
20 25 30
Asp Leu Gly Ala Asp Ser Leu Asp Thr Val Glu Leu Val Met Ala Leu
35 40 45
Glu Glu Glu Phe Asp Ile Glu Ile Pro Asp Glu Val Ala Glu Thr Ile
50 55 60
Asp Thr Val Gly Lys Ala Val Glu His Ile Glu Ser Lys
65 70 75
<210> 5
<211> 243
<212> DNA
<213> Prochlorococcus marinus
<400> 5
atgtcacaag aagaaatcct tcaaaaagta tgctctattg tttctgagca actaagtgtt 60
gaatcagccg aagtaaaatc tgattcaaac tttcaaaatg atttaggtgc agactcccta 120
gacaccgtag agctagttat ggctcttgaa gaagcatttg atatcgagat acctgatgaa 180
gcagctgaag gtatcgcaac agtaggagat gctgttaaat tcatcgaaga aaaaaaaggt 240
taa 243
<210> 6
<211> 80
<212> PRT
<213> Prochlorococcus marinus
<400> 6
Met Ser Gln Glu Glu Ile Leu Gln Lys Val Cys Ser Ile Val Ser Glu
1 5 10 15
Gln Leu Ser Val Glu Ser Ala Glu Val Lys Ser Asp Ser Asn Phe Gln
20 25 30
Asn Asp Leu Gly Ala Asp Ser Leu Asp Thr Val Glu Leu Val Met Ala
35 40 45
Leu Glu Glu Ala Phe Asp Ile Glu Ile Pro Asp Glu Ala Ala Glu Gly
50 55 60
Ile Ala Thr Val Gly Asp Ala Val Lys Phe Ile Glu Glu Lys Lys Gly
65 70 75 80
<210> 7
<211> 243
<212> DNA
<213> Synechococcus elongatus
<400> 7
atgagccaag aagacatctt cagcaaagtc aaagacattg tggctgagca gctgagtgtg 60
gatgtggctg aagtcaagcc agaatccagc ttccaaaacg atctgggagc ggactcgctg 120
gacaccgtgg aactggtgat ggctctggaa gaggctttcg atatcgaaat ccccgatgaa 180
gccgctgaag gcattgcgac cgttcaagac gccgtcgatt tcatcgctag caaagctgcc 240
tag 243
<210> 8
<211> 80
<212> PRT
<213> Synechococcus elongatus
<400> 8
Met Ser Gln Glu Asp Ile Phe Ser Lys Val Lys Asp Ile Val Ala Glu
1 5 10 15
Gln Leu Ser Val Asp Val Ala Glu Val Lys Pro Glu Ser Ser Phe Gln
20 25 30
Asn Asp Leu Gly Ala Asp Ser Leu Asp Thr Val Glu Leu Val Met Ala
35 40 45
Leu Glu Glu Ala Phe Asp Ile Glu Ile Pro Asp Glu Ala Ala Glu Gly
50 55 60
Ile Ala Thr Val Gln Asp Ala Val Asp Phe Ile Ala Ser Lys Ala Ala
65 70 75 80
<210> 9
<211> 255
<212> DNA
<213> Nostoc sp.
<400> 9
atgagccaat cagaaacttt tgaaaaagtc aaaaaaattg ttatcgaaca actaagtgtg 60
gagaaccctg acacagtaac tccagaagct agttttgcca acgatttaca ggctgattcc 120
ctcgatacag tagaactagt aatggctttg gaagaagaat ttgatatcga aattcccgat 180
gaagccgcag agaaaattac cactgttcaa gaagcggtgg attacatcaa taaccaagtt 240
gccgcatcag cttaa 255
<210> 10
<211> 84
<212> PRT
<213> Nostoc sp.
<400> 10
Met Ser Gln Ser Glu Thr Phe Glu Lys Val Lys Lys Ile Val Ile Glu
1 5 10 15
Gln Leu Ser Val Glu Asn Pro Asp Thr Val Thr Pro Glu Ala Ser Phe
20 25 30
Ala Asn Asp Leu Gln Ala Asp Ser Leu Asp Thr Val Glu Leu Val Met
35 40 45
Ala Leu Glu Glu Glu Phe Asp Ile Glu Ile Pro Asp Glu Ala Ala Glu
50 55 60
Lys Ile Thr Thr Val Gln Glu Ala Val Asp Tyr Ile Asn Asn Gln Val
65 70 75 80
Ala Ala Ser Ala
<210> 11
<211> 674
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 11
atgaagattt acggaattta tatggaccgc ccgctttcac aggaagaaaa tgaacggttc 60
atgactttca tatcacctga aaaacgggag aaatgccgga gattttatca taaagaagat 120
gctcaccgca ccctgctggg agatgtgctc gttcgctcag tcataagcag gcagtatcag 180
ttggacaaat ccgatatccg ctttagcacg caggaatacg ggaagccgtg catccctgat 240
cttcccgacg ctcatttcaa catttctcac tccggccgct gggtcattgg tgcgtttgat 300
tcacagccga tcggcataga tatcgaaaaa acgaaaccga tcagccttga gatcgccaag 360
cgcttctttt caaaaacaga gtacagcgac cttttagcaa aagacaagga cgagcagaca 420
gactattttt atcatctatg gtcaatgaaa gaaagcttta tcaaacagga aggcaaaggc 480
ttatcgcttc cgcttgattc cttttcagtg cgcctgcatc aggacggaca agtatccatt 540
gagcttccgg acagccattc cccatgctat atcaaaacgt atgaggtcga tcccggctac 600
aaaatggctg tatgcgccgc acaccctgtt tccccgagga tatcacaatg gtctcgtacg 660
aagagctttt ataa 674
<210> 12
<211> 224
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 12
Met Lys Ile Tyr Gly Ile Tyr Met Asp Arg Pro Leu Ser Gln Glu Glu
1 5 10 15
Asn Glu Arg Phe Met Thr Phe Ile Ser Pro Glu Lys Arg Glu Lys Cys
20 25 30
Arg Arg Phe Tyr His Lys Glu Asp Ala His Arg Thr Leu Leu Gly Asp
35 40 45
Val Leu Val Arg Ser Val Ile Ser Arg Gln Tyr Gln Leu Asp Lys Ser
50 55 60
Asp Ile Arg Phe Ser Thr Gln Glu Tyr Gly Lys Pro Cys Ile Pro Asp
65 70 75 80
Leu Pro Asp Ala His Phe Asn Ile Ser His Ser Gly Arg Trp Val Ile
85 90 95
Gly Ala Phe Asp Ser Gln Pro Ile Gly Ile Asp Ile Glu Lys Thr Lys
100 105 110
Pro Ile Ser Leu Glu Ile Ala Lys Arg Phe Phe Ser Lys Thr Glu Tyr
115 120 125
Ser Asp Leu Leu Ala Lys Asp Lys Asp Glu Gln Thr Asp Tyr Phe Tyr
130 135 140
His Leu Trp Ser Met Lys Glu Ser Phe Ile Lys Gln Glu Gly Lys Gly
145 150 155 160
Leu Ser Leu Pro Leu Asp Ser Phe Ser Val Arg Leu His Gln Asp Gly
165 170 175
Gln Val Ser Ile Glu Leu Pro Asp Ser His Ser Pro Cys Tyr Ile Lys
180 185 190
Thr Tyr Glu Val Asp Pro Gly Tyr Lys Met Ala Val Cys Ala Ala His
195 200 205
Pro Asp Phe Pro Glu Asp Ile Thr Met Val Ser Tyr Glu Glu Leu Leu
210 215 220
<210> 13
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 13
ggcaatttga gaatttaagg aggaaaacaa aatgagccaa gaagacatct tc 52
<210> 14
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 14
cccaagcttc gaattcctag gcagctttgc tag 33
<210> 15
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 15
ggcaatttga gaatttaagg aggaaaacaa aatgaatcag gaaatttttg aaaaag 56
<210> 16
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 16
cccaagcttc gaattcttat ttactttcga tatgctcaac g 41
<210> 17
<211> 53
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 17
ggcaatttga gaatttaagg aggaaaacaa aatgtcacaa gaagaaatcc ttc 53
<210> 18
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 18
cccaagcttc gaattcttaa cctttttttt cttcgatgaa tttaac 46
<210> 19
<211> 53
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 19
ggcaatttga gaatttaagg aggaaaacaa aatgagccaa acggaacttt ttg 53
<210> 20
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 20
cccaagcttc gaattcttaa gctgatgcag caactttg 38
<210> 21
<211> 53
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 21
ggcaatttga gaatttaagg aggaaaacaa aatgagccaa tcagaaactt ttg 53
<210> 22
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 22
cccaagcttc gaattcttaa gctgatgcgg caac 34
<210> 23
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 23
agctgcctag gaatttaagg aggaataaac catgaagatt tac 43
<210> 24
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 24
aaaaggttaa gaatttaagg aggaataaac catgaagatt tac 43
<210> 25
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 25
atcagcttaa gaatttaagg aggaataaac catgaagatt tac 43
<210> 26
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 26
cccaagcttc gaattcttat aaaagctctt cgtacgagac c 41
<210> 27
<211> 69
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 27
gaaatcacgc atctgcgttt gcaataataa tagaggagga taactaaatg agtacagttg 60
aagagcgcg 69
<210> 28
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 28
gccaagctgg agaccgttta aactcaggtg tgcgcgacaa tgtag 45
<210> 29
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 29
taatagagga ggataactaa atg 23
<210> 30
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 30
ttattgcaaa cgcagatgcg tgatttc 27
<210> 31
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 31
gtttaaacgg tctccagctt ggc 23
<210> 32
<211> 69
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 32
gaaatcacgc atctgcgttt gcaataataa tagaggagga taactaaatg agcactatcg 60
aagaacgcg 69
<210> 33
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 33
gccaagctgg agaccgttta aacttacgcc tggtggccgt tgatg 45
<210> 34
<211> 696
<212> DNA
<213> Synechococcus elongatus
<400> 34
atgccgcagc ttgaagccag ccttgaactg gactttcaaa gcgagtccta caaagacgct 60
tacagccgca tcaacgcgat cgtgattgaa ggcgaacaag aggcgttcga caactacaat 120
cgccttgctg agatgctgcc cgaccagcgg gatgagcttc acaagctagc caagatggaa 180
cagcgccaca tgaaaggctt tatggcctgt ggcaaaaatc tctccgtcac tcctgacatg 240
ggttttgccc agaaattttt cgagcgcttg cacgagaact tcaaagcggc ggctgcggaa 300
ggcaaggtcg tcacctgcct actgattcaa tcgctaatca tcgagtgctt tgcgatcgcg 360
gcttacaaca tctacatccc agtggcggat gcttttgccc gcaaaatcac ggagggggtc 420
gtgcgcgacg aatacctgca ccgcaacttc ggtgaagagt ggctgaaggc gaattttgat 480
gcttccaaag ccgaactgga agaagccaat cgtcagaacc tgcccttggt ttggctaatg 540
ctcaacgaag tggccgatga tgctcgcgaa ctcgggatgg agcgtgagtc gctcgtcgag 600
gactttatga ttgcctacgg tgaagctctg gaaaacatcg gcttcacaac gcgcgaaatc 660
atgcgtatgt ccgcctatgg ccttgcggcc gtttga 696
<210> 35
<211> 231
<212> PRT
<213> Synechococcus elongatus
<400> 35
Met Pro Gln Leu Glu Ala Ser Leu Glu Leu Asp Phe Gln Ser Glu Ser
1 5 10 15
Tyr Lys Asp Ala Tyr Ser Arg Ile Asn Ala Ile Val Ile Glu Gly Glu
20 25 30
Gln Glu Ala Phe Asp Asn Tyr Asn Arg Leu Ala Glu Met Leu Pro Asp
35 40 45
Gln Arg Asp Glu Leu His Lys Leu Ala Lys Met Glu Gln Arg His Met
50 55 60
Lys Gly Phe Met Ala Cys Gly Lys Asn Leu Ser Val Thr Pro Asp Met
65 70 75 80
Gly Phe Ala Gln Lys Phe Phe Glu Arg Leu His Glu Asn Phe Lys Ala
85 90 95
Ala Ala Ala Glu Gly Lys Val Val Thr Cys Leu Leu Ile Gln Ser Leu
100 105 110
Ile Ile Glu Cys Phe Ala Ile Ala Ala Tyr Asn Ile Tyr Ile Pro Val
115 120 125
Ala Asp Ala Phe Ala Arg Lys Ile Thr Glu Gly Val Val Arg Asp Glu
130 135 140
Tyr Leu His Arg Asn Phe Gly Glu Glu Trp Leu Lys Ala Asn Phe Asp
145 150 155 160
Ala Ser Lys Ala Glu Leu Glu Glu Ala Asn Arg Gln Asn Leu Pro Leu
165 170 175
Val Trp Leu Met Leu Asn Glu Val Ala Asp Asp Ala Arg Glu Leu Gly
180 185 190
Met Glu Arg Glu Ser Leu Val Glu Asp Phe Met Ile Ala Tyr Gly Glu
195 200 205
Ala Leu Glu Asn Ile Gly Phe Thr Thr Arg Glu Ile Met Arg Met Ser
210 215 220
Ala Tyr Gly Leu Ala Ala Val
225 230
<210> 36
<211> 696
<212> DNA
<213> Synechocystis sp.
<400> 36
atgcccgagc ttgctgtccg caccgaattt gactattcca gcgaaattta caaagacgcc 60
tatagccgca tcaacgccat tgtcattgaa ggcgaacagg aagcctacag caactacctc 120
cagatggcgg aactcttgcc ggaagacaaa gaagagttga cccgcttggc caaaatggaa 180
aaccgccata aaaaaggttt ccaagcctgt ggcaacaacc tccaagtgaa ccctgatatg 240
ccctatgccc aggaattttt cgccggtctc catggcaatt tccagcacgc ttttagcgaa 300
gggaaagttg ttacctgttt attgatccag gctttgatta tcgaagcttt tgcgatcgcc 360
gcctataaca tatatatccc tgtggcggac gactttgctc ggaaaatcac tgagggcgta 420
gtcaaggacg aatacaccca cctcaactac ggggaagaat ggctaaaggc caactttgcc 480
accgctaagg aagaactgga gcaggccaac aaagaaaacc tacccttagt gtggaaaatg 540
ctcaaccaag tgcaggggga cgccaaggta ttgggcatgg aaaaagaagc cctagtggaa 600
gattttatga tcagctacgg cgaagccctc agtaacatcg gcttcagcac cagggaaatt 660
atgcgtatgt cttcctacgg tttggccgga gtctag 696
<210> 37
<211> 231
<212> PRT
<213> Synechocystis sp.
<400> 37
Met Pro Glu Leu Ala Val Arg Thr Glu Phe Asp Tyr Ser Ser Glu Ile
1 5 10 15
Tyr Lys Asp Ala Tyr Ser Arg Ile Asn Ala Ile Val Ile Glu Gly Glu
20 25 30
Gln Glu Ala Tyr Ser Asn Tyr Leu Gln Met Ala Glu Leu Leu Pro Glu
35 40 45
Asp Lys Glu Glu Leu Thr Arg Leu Ala Lys Met Glu Asn Arg His Lys
50 55 60
Lys Gly Phe Gln Ala Cys Gly Asn Asn Leu Gln Val Asn Pro Asp Met
65 70 75 80
Pro Tyr Ala Gln Glu Phe Phe Ala Gly Leu His Gly Asn Phe Gln His
85 90 95
Ala Phe Ser Glu Gly Lys Val Val Thr Cys Leu Leu Ile Gln Ala Leu
100 105 110
Ile Ile Glu Ala Phe Ala Ile Ala Ala Tyr Asn Ile Tyr Ile Pro Val
115 120 125
Ala Asp Asp Phe Ala Arg Lys Ile Thr Glu Gly Val Val Lys Asp Glu
130 135 140
Tyr Thr His Leu Asn Tyr Gly Glu Glu Trp Leu Lys Ala Asn Phe Ala
145 150 155 160
Thr Ala Lys Glu Glu Leu Glu Gln Ala Asn Lys Glu Asn Leu Pro Leu
165 170 175
Val Trp Lys Met Leu Asn Gln Val Gln Gly Asp Ala Lys Val Leu Gly
180 185 190
Met Glu Lys Glu Ala Leu Val Glu Asp Phe Met Ile Ser Tyr Gly Glu
195 200 205
Ala Leu Ser Asn Ile Gly Phe Ser Thr Arg Glu Ile Met Arg Met Ser
210 215 220
Ser Tyr Gly Leu Ala Gly Val
225 230
<210> 38
<211> 699
<212> DNA
<213> Nostoc punctiforme
<400> 38
atgcagcagc ttacagacca atctaaagaa ttagatttca agagcgaaac atacaaagat 60
gcttatagcc ggattaatgc gatcgtgatt gaaggggaac aagaagccca tgaaaattac 120
atcacactag cccaactgct gccagaatct catgatgaat tgattcgcct atccaagatg 180
gaaagccgcc ataagaaagg atttgaagct tgtgggcgca atttagctgt taccccagat 240
ttgcaatttg ccaaagagtt tttctccggc ctacaccaaa attttcaaac agctgccgca 300
gaagggaaag tggttacttg tctgttgatt cagtctttaa ttattgaatg ttttgcgatc 360
gcagcatata acatttacat ccccgttgcc gacgatttcg cccgtaaaat tactgaagga 420
gtagttaaag aagaatacag ccacctcaat tttggagaag tttggttgaa agaacacttt 480
gcagaatcca aagctgaact tgaacttgca aatcgccaga acctacccat cgtctggaaa 540
atgctcaacc aagtagaagg tgatgcccac acaatggcaa tggaaaaaga tgctttggta 600
gaagacttca tgattcagta tggtgaagca ttgagtaaca ttggtttttc gactcgcgat 660
attatgcgct tgtcagccta cggactcata ggtgcttaa 699
<210> 39
<211> 232
<212> PRT
<213> Nostoc punctiforme
<400> 39
Met Gln Gln Leu Thr Asp Gln Ser Lys Glu Leu Asp Phe Lys Ser Glu
1 5 10 15
Thr Tyr Lys Asp Ala Tyr Ser Arg Ile Asn Ala Ile Val Ile Glu Gly
20 25 30
Glu Gln Glu Ala His Glu Asn Tyr Ile Thr Leu Ala Gln Leu Leu Pro
35 40 45
Glu Ser His Asp Glu Leu Ile Arg Leu Ser Lys Met Glu Ser Arg His
50 55 60
Lys Lys Gly Phe Glu Ala Cys Gly Arg Asn Leu Ala Val Thr Pro Asp
65 70 75 80
Leu Gln Phe Ala Lys Glu Phe Phe Ser Gly Leu His Gln Asn Phe Gln
85 90 95
Thr Ala Ala Ala Glu Gly Lys Val Val Thr Cys Leu Leu Ile Gln Ser
100 105 110
Leu Ile Ile Glu Cys Phe Ala Ile Ala Ala Tyr Asn Ile Tyr Ile Pro
115 120 125
Val Ala Asp Asp Phe Ala Arg Lys Ile Thr Glu Gly Val Val Lys Glu
130 135 140
Glu Tyr Ser His Leu Asn Phe Gly Glu Val Trp Leu Lys Glu His Phe
145 150 155 160
Ala Glu Ser Lys Ala Glu Leu Glu Leu Ala Asn Arg Gln Asn Leu Pro
165 170 175
Ile Val Trp Lys Met Leu Asn Gln Val Glu Gly Asp Ala His Thr Met
180 185 190
Ala Met Glu Lys Asp Ala Leu Val Glu Asp Phe Met Ile Gln Tyr Gly
195 200 205
Glu Ala Leu Ser Asn Ile Gly Phe Ser Thr Arg Asp Ile Met Arg Leu
210 215 220
Ser Ala Tyr Gly Leu Ile Gly Ala
225 230
<210> 40
<211> 696
<212> DNA
<213> Nostoc sp.
<400> 40
atgcagcagg ttgcagccga tttagaaatt gatttcaaga gcgaaaaata taaagatgcc 60
tatagtcgca taaatgcgat cgtgattgaa ggggaacaag aagcatacga gaattacatt 120
caactatccc aactgctgcc agacgataaa gaagacctaa ttcgcctctc gaaaatggaa 180
agccgtcaca aaaaaggatt tgaagcttgt ggacggaacc tacaagtatc accagatatg 240
gagtttgcca aagaattctt tgctggacta cacggtaact tccaaaaagc ggcggctgaa 300
ggtaaaatcg ttacctgtct attgattcag tccctgatta ttgaatgttt tgcgatcgcc 360
gcatacaata tctacattcc cgttgctgac gattttgctc gtaaaatcac tgagggtgta 420
gtcaaagatg aatacagcca cctcaacttc ggcgaagttt ggttacagaa aaattttgcc 480
caatccaaag cagaattaga agaagctaat cgtcataatc ttcccatagt ttggaaaatg 540
ctcaatcaag tcgcggatga tgccgcagtc ttagctatgg aaaaagaagc cctagtcgaa 600
gattttatga ttcagtacgg cgaagcgtta agtaatattg gcttcacaac cagagatatt 660
atgcggatgt cagcctacgg acttacagca gcttaa 696
<210> 41
<211> 231
<212> PRT
<213> Nostoc sp.
<400> 41
Met Gln Gln Val Ala Ala Asp Leu Glu Ile Asp Phe Lys Ser Glu Lys
1 5 10 15
Tyr Lys Asp Ala Tyr Ser Arg Ile Asn Ala Ile Val Ile Glu Gly Glu
20 25 30
Gln Glu Ala Tyr Glu Asn Tyr Ile Gln Leu Ser Gln Leu Leu Pro Asp
35 40 45
Asp Lys Glu Asp Leu Ile Arg Leu Ser Lys Met Glu Ser Arg His Lys
50 55 60
Lys Gly Phe Glu Ala Cys Gly Arg Asn Leu Gln Val Ser Pro Asp Met
65 70 75 80
Glu Phe Ala Lys Glu Phe Phe Ala Gly Leu His Gly Asn Phe Gln Lys
85 90 95
Ala Ala Ala Glu Gly Lys Ile Val Thr Cys Leu Leu Ile Gln Ser Leu
100 105 110
Ile Ile Glu Cys Phe Ala Ile Ala Ala Tyr Asn Ile Tyr Ile Pro Val
115 120 125
Ala Asp Asp Phe Ala Arg Lys Ile Thr Glu Gly Val Val Lys Asp Glu
130 135 140
Tyr Ser His Leu Asn Phe Gly Glu Val Trp Leu Gln Lys Asn Phe Ala
145 150 155 160
Gln Ser Lys Ala Glu Leu Glu Glu Ala Asn Arg His Asn Leu Pro Ile
165 170 175
Val Trp Lys Met Leu Asn Gln Val Ala Asp Asp Ala Ala Val Leu Ala
180 185 190
Met Glu Lys Glu Ala Leu Val Glu Asp Phe Met Ile Gln Tyr Gly Glu
195 200 205
Ala Leu Ser Asn Ile Gly Phe Thr Thr Arg Asp Ile Met Arg Met Ser
210 215 220
Ala Tyr Gly Leu Thr Ala Ala
225 230
<210> 42
<211> 696
<212> DNA
<213> Acaryochloris marina
<400> 42
atgccccaaa ctcaggctat ttcagaaatt gacttctata gtgacaccta caaagatgct 60
tacagtcgta ttgacggcat tgtgatcgaa ggtgagcaag aagcgcatga aaactatatt 120
cgtcttggcg aaatgctgcc tgagcaccaa gacgacttta tccgcctgtc caagatggaa 180
gcccgtcata agaaagggtt tgaagcctgc ggtcgcaact taaaagtaac ctgcgatcta 240
gactttgccc ggcgtttctt ttccgactta cacaagaatt ttcaagatgc tgcagctgag 300
gataaagtgc caacttgctt agtgattcag tccttgatca ttgagtgttt tgcgatcgca 360
gcttacaaca tctatatccc cgtcgctgat gactttgccc gtaagattac agagtctgtg 420
gttaaggatg agtatcaaca cctcaattat ggtgaagagt ggcttaaagc tcacttcgat 480
gatgtgaaag cagaaatcca agaagctaat cgcaaaaacc tccccatcgt ttggagaatg 540
ctgaacgaag tggacaagga tgcggccgtt ttaggaatgg aaaaagaagc cctggttgaa 600
gacttcatga tccagtatgg tgaagccctt agcaatattg gtttctctac aggcgaaatt 660
atgcggatgt ctgcctatgg tcttgtggct gcgtaa 696
<210> 43
<211> 231
<212> PRT
<213> Acaryochloris marina
<400> 43
Met Pro Gln Thr Gln Ala Ile Ser Glu Ile Asp Phe Tyr Ser Asp Thr
1 5 10 15
Tyr Lys Asp Ala Tyr Ser Arg Ile Asp Gly Ile Val Ile Glu Gly Glu
20 25 30
Gln Glu Ala His Glu Asn Tyr Ile Arg Leu Gly Glu Met Leu Pro Glu
35 40 45
His Gln Asp Asp Phe Ile Arg Leu Ser Lys Met Glu Ala Arg His Lys
50 55 60
Lys Gly Phe Glu Ala Cys Gly Arg Asn Leu Lys Val Thr Cys Asp Leu
65 70 75 80
Asp Phe Ala Arg Arg Phe Phe Ser Asp Leu His Lys Asn Phe Gln Asp
85 90 95
Ala Ala Ala Glu Asp Lys Val Pro Thr Cys Leu Val Ile Gln Ser Leu
100 105 110
Ile Ile Glu Cys Phe Ala Ile Ala Ala Tyr Asn Ile Tyr Ile Pro Val
115 120 125
Ala Asp Asp Phe Ala Arg Lys Ile Thr Glu Ser Val Val Lys Asp Glu
130 135 140
Tyr Gln His Leu Asn Tyr Gly Glu Glu Trp Leu Lys Ala His Phe Asp
145 150 155 160
Asp Val Lys Ala Glu Ile Gln Glu Ala Asn Arg Lys Asn Leu Pro Ile
165 170 175
Val Trp Arg Met Leu Asn Glu Val Asp Lys Asp Ala Ala Val Leu Gly
180 185 190
Met Glu Lys Glu Ala Leu Val Glu Asp Phe Met Ile Gln Tyr Gly Glu
195 200 205
Ala Leu Ser Asn Ile Gly Phe Ser Thr Gly Glu Ile Met Arg Met Ser
210 215 220
Ala Tyr Gly Leu Val Ala Ala
225 230
<210> 44
<211> 696
<212> DNA
<213> Thermosynechococcus elongatus
<400> 44
atgacaacgg ctaccgctac acctgttttg gactaccata gcgatcgcta caaggatgcc 60
tacagccgca ttaacgccat tgtcattgaa ggtgaacagg aagctcacga taactatatc 120
gatttagcca agctgctgcc acaacaccaa gaggaactca cccgccttgc caagatggaa 180
gctcgccaca aaaaggggtt tgaggcctgt ggtcgcaacc tgagcgtaac gccagatatg 240
gaatttgcca aagccttctt tgaaaaactg cgcgctaact ttcagagggc tctggcggag 300
ggaaaaactg cgacttgtct tctgattcaa gctttgatca tcgaatcctt tgcgatcgcg 360
gcctacaaca tctacatccc aatggcggat cctttcgccc gtaaaattac tgagagtgtt 420
gttaaggacg aatacagcca cctcaacttt ggcgaaatct ggctcaagga acactttgaa 480
agcgtcaaag gagagctcga agaagccaat cgcgccaatt tacccttggt ctggaaaatg 540
ctcaaccaag tggaagcaga tgccaaagtg ctcggcatgg aaaaagatgc ccttgtggaa 600
gacttcatga ttcagtacag tggtgcccta gaaaatatcg gctttaccac ccgcgaaatt 660
atgaagatgt cagtttatgg cctcactggg gcataa 696
<210> 45
<211> 231
<212> PRT
<213> Thermosynechococcus elongatus
<400> 45
Met Thr Thr Ala Thr Ala Thr Pro Val Leu Asp Tyr His Ser Asp Arg
1 5 10 15
Tyr Lys Asp Ala Tyr Ser Arg Ile Asn Ala Ile Val Ile Glu Gly Glu
20 25 30
Gln Glu Ala His Asp Asn Tyr Ile Asp Leu Ala Lys Leu Leu Pro Gln
35 40 45
His Gln Glu Glu Leu Thr Arg Leu Ala Lys Met Glu Ala Arg His Lys
50 55 60
Lys Gly Phe Glu Ala Cys Gly Arg Asn Leu Ser Val Thr Pro Asp Met
65 70 75 80
Glu Phe Ala Lys Ala Phe Phe Glu Lys Leu Arg Ala Asn Phe Gln Arg
85 90 95
Ala Leu Ala Glu Gly Lys Thr Ala Thr Cys Leu Leu Ile Gln Ala Leu
100 105 110
Ile Ile Glu Ser Phe Ala Ile Ala Ala Tyr Asn Ile Tyr Ile Pro Met
115 120 125
Ala Asp Pro Phe Ala Arg Lys Ile Thr Glu Ser Val Val Lys Asp Glu
130 135 140
Tyr Ser His Leu Asn Phe Gly Glu Ile Trp Leu Lys Glu His Phe Glu
145 150 155 160
Ser Val Lys Gly Glu Leu Glu Glu Ala Asn Arg Ala Asn Leu Pro Leu
165 170 175
Val Trp Lys Met Leu Asn Gln Val Glu Ala Asp Ala Lys Val Leu Gly
180 185 190
Met Glu Lys Asp Ala Leu Val Glu Asp Phe Met Ile Gln Tyr Ser Gly
195 200 205
Ala Leu Glu Asn Ile Gly Phe Thr Thr Arg Glu Ile Met Lys Met Ser
210 215 220
Val Tyr Gly Leu Thr Gly Ala
225 230
<210> 46
<211> 732
<212> DNA
<213> Synechococcus sp.
<400> 46
atggccccag cgaacgtcct gcccaacacc cccccgtccc ccactgatgg gggcggcact 60
gccctagact acagcagccc aaggtatcgg caggcctact cccgcatcaa cggtattgtt 120
atcgaaggcg aacaagaagc ccacgacaac tacctcaagc tggccgaaat gctgccggaa 180
gctgcagagg agctgcgcaa gctggccaag atggaattgc gccacatgaa aggcttccag 240
gcctgcggca aaaacctgca ggtggaaccc gatgtggagt ttgcccgcgc ctttttcgcg 300
cccttgcggg acaatttcca aagcgccgca gcggcagggg atctggtctc ctgttttgtc 360
attcagtctt tgatcatcga gtgctttgcc attgccgcct acaacatcta catcccggtt 420
gccgatgact ttgcccgcaa gatcaccgag ggggtagtta aggacgagta tctgcacctc 480
aattttgggg agcgctggct gggcgagcac tttgccgagg ttaaagccca gatcgaagca 540
gccaacgccc aaaatctgcc tctagttcgg cagatgctgc agcaggtaga ggcggatgtg 600
gaagccattt acatggatcg cgaggccatt gtagaagact tcatgatcgc ctacggcgag 660
gccctggcca gcatcggctt caacacccgc gaggtaatgc gcctctcggc ccagggtctg 720
cgggccgcct ga 732
<210> 47
<211> 243
<212> PRT
<213> Synechococcus sp.
<400> 47
Met Ala Pro Ala Asn Val Leu Pro Asn Thr Pro Pro Ser Pro Thr Asp
1 5 10 15
Gly Gly Gly Thr Ala Leu Asp Tyr Ser Ser Pro Arg Tyr Arg Gln Ala
20 25 30
Tyr Ser Arg Ile Asn Gly Ile Val Ile Glu Gly Glu Gln Glu Ala His
35 40 45
Asp Asn Tyr Leu Lys Leu Ala Glu Met Leu Pro Glu Ala Ala Glu Glu
50 55 60
Leu Arg Lys Leu Ala Lys Met Glu Leu Arg His Met Lys Gly Phe Gln
65 70 75 80
Ala Cys Gly Lys Asn Leu Gln Val Glu Pro Asp Val Glu Phe Ala Arg
85 90 95
Ala Phe Phe Ala Pro Leu Arg Asp Asn Phe Gln Ser Ala Ala Ala Ala
100 105 110
Gly Asp Leu Val Ser Cys Phe Val Ile Gln Ser Leu Ile Ile Glu Cys
115 120 125
Phe Ala Ile Ala Ala Tyr Asn Ile Tyr Ile Pro Val Ala Asp Asp Phe
130 135 140
Ala Arg Lys Ile Thr Glu Gly Val Val Lys Asp Glu Tyr Leu His Leu
145 150 155 160
Asn Phe Gly Glu Arg Trp Leu Gly Glu His Phe Ala Glu Val Lys Ala
165 170 175
Gln Ile Glu Ala Ala Asn Ala Gln Asn Leu Pro Leu Val Arg Gln Met
180 185 190
Leu Gln Gln Val Glu Ala Asp Val Glu Ala Ile Tyr Met Asp Arg Glu
195 200 205
Ala Ile Val Glu Asp Phe Met Ile Ala Tyr Gly Glu Ala Leu Ala Ser
210 215 220
Ile Gly Phe Asn Thr Arg Glu Val Met Arg Leu Ser Ala Gln Gly Leu
225 230 235 240
Arg Ala Ala
<210> 48
<211> 708
<212> DNA
<213> Gloeobacter violaceus
<400> 48
gtgaaccgaa ccgcaccgtc cagcgccgcg cttgattacc gctccgacac ctaccgcgat 60
gcgtactccc gcatcaatgc catcgtcctt gaaggcgagc gggaagccca cgccaactac 120
cttaccctcg ctgagatgct gccggaccat gccgaggcgc tcaaaaaact ggccgcgatg 180
gaaaatcgcc acttcaaagg cttccagtcc tgcgcccgca acctcgaagt cacgccggac 240
gacccgtttg caagggccta cttcgaacag ctcgacggca actttcagca ggcggcggca 300
gaaggtgacc ttaccacctg catggtcatc caggcactga tcatcgagtg cttcgcaatt 360
gcggcctaca acgtctacat tccggtggcc gacgcgtttg cccgcaaggt gaccgagggc 420
gtcgtcaagg acgagtacac ccacctcaac tttgggcagc agtggctcaa agagcgcttc 480
gtgaccgtgc gcgagggcat cgagcgcgcc aacgcccaga atctgcccat cgtctggcgg 540
atgctcaacg ccgtcgaagc ggacaccgaa gtgctgcaga tggataaaga agcgatcgtc 600
gaagacttta tgatcgccta cggtgaagcc ttgggcgaca tcggtttttc gatgcgcgac 660
gtgatgaaga tgtccgcccg cggccttgcc tctgcccccc gccagtga 708
<210> 49
<211> 235
<212> PRT
<213> Gloeobacter violaceus
<400> 49
Met Asn Arg Thr Ala Pro Ser Ser Ala Ala Leu Asp Tyr Arg Ser Asp
1 5 10 15
Thr Tyr Arg Asp Ala Tyr Ser Arg Ile Asn Ala Ile Val Leu Glu Gly
20 25 30
Glu Arg Glu Ala His Ala Asn Tyr Leu Thr Leu Ala Glu Met Leu Pro
35 40 45
Asp His Ala Glu Ala Leu Lys Lys Leu Ala Ala Met Glu Asn Arg His
50 55 60
Phe Lys Gly Phe Gln Ser Cys Ala Arg Asn Leu Glu Val Thr Pro Asp
65 70 75 80
Asp Pro Phe Ala Arg Ala Tyr Phe Glu Gln Leu Asp Gly Asn Phe Gln
85 90 95
Gln Ala Ala Ala Glu Gly Asp Leu Thr Thr Cys Met Val Ile Gln Ala
100 105 110
Leu Ile Ile Glu Cys Phe Ala Ile Ala Ala Tyr Asn Val Tyr Ile Pro
115 120 125
Val Ala Asp Ala Phe Ala Arg Lys Val Thr Glu Gly Val Val Lys Asp
130 135 140
Glu Tyr Thr His Leu Asn Phe Gly Gln Gln Trp Leu Lys Glu Arg Phe
145 150 155 160
Val Thr Val Arg Glu Gly Ile Glu Arg Ala Asn Ala Gln Asn Leu Pro
165 170 175
Ile Val Trp Arg Met Leu Asn Ala Val Glu Ala Asp Thr Glu Val Leu
180 185 190
Gln Met Asp Lys Glu Ala Ile Val Glu Asp Phe Met Ile Ala Tyr Gly
195 200 205
Glu Ala Leu Gly Asp Ile Gly Phe Ser Met Arg Asp Val Met Lys Met
210 215 220
Ser Ala Arg Gly Leu Ala Ser Ala Pro Arg Gln
225 230 235
<210> 50
<211> 732
<212> DNA
<213> Prochlorococcus marinus
<400> 50
atgcctacgc ttgagatgcc tgtggcagct gttcttgaca gcactgttgg atcttcagaa 60
gccctgccag acttcacttc agatagatat aaggatgcat acagcagaat caacgcaata 120
gtcattgagg gcgaacagga agcccatgac aattacatcg cgattggcac gctgcttccc 180
gatcatgtcg aagagctcaa gcggcttgcc aagatggaga tgaggcacaa gaagggcttt 240
acagcttgcg gcaagaacct tggcgttgag gctgacatgg acttcgcaag ggagtttttt 300
gctcctttgc gtgacaactt ccagacagct ttagggcagg ggaaaacacc tacatgcttg 360
ctgatccagg cgctcttgat tgaagccttt gctatttcgg cttatcacac ctatatccct 420
gtttctgacc cctttgctcg caagattact gaaggtgtcg tgaaggacga gtacacacac 480
ctcaattatg gcgaggcttg gctcaaggcc aatctggaga gttgccgtga ggagttgctt 540
gaggccaatc gcgagaacct gcctctgatt cgccggatgc ttgatcaggt agcaggtgat 600
gctgccgtgc tgcagatgga taaggaagat ctgattgagg atttcttaat cgcctaccag 660
gaatctctca ctgagattgg ctttaacact cgtgaaatta cccgtatggc agcggcagct 720
cttgtgagct ga 732
<210> 51
<211> 243
<212> PRT
<213> Prochlorococcus marinus
<400> 51
Met Pro Thr Leu Glu Met Pro Val Ala Ala Val Leu Asp Ser Thr Val
1 5 10 15
Gly Ser Ser Glu Ala Leu Pro Asp Phe Thr Ser Asp Arg Tyr Lys Asp
20 25 30
Ala Tyr Ser Arg Ile Asn Ala Ile Val Ile Glu Gly Glu Gln Glu Ala
35 40 45
His Asp Asn Tyr Ile Ala Ile Gly Thr Leu Leu Pro Asp His Val Glu
50 55 60
Glu Leu Lys Arg Leu Ala Lys Met Glu Met Arg His Lys Lys Gly Phe
65 70 75 80
Thr Ala Cys Gly Lys Asn Leu Gly Val Glu Ala Asp Met Asp Phe Ala
85 90 95
Arg Glu Phe Phe Ala Pro Leu Arg Asp Asn Phe Gln Thr Ala Leu Gly
100 105 110
Gln Gly Lys Thr Pro Thr Cys Leu Leu Ile Gln Ala Leu Leu Ile Glu
115 120 125
Ala Phe Ala Ile Ser Ala Tyr His Thr Tyr Ile Pro Val Ser Asp Pro
130 135 140
Phe Ala Arg Lys Ile Thr Glu Gly Val Val Lys Asp Glu Tyr Thr His
145 150 155 160
Leu Asn Tyr Gly Glu Ala Trp Leu Lys Ala Asn Leu Glu Ser Cys Arg
165 170 175
Glu Glu Leu Leu Glu Ala Asn Arg Glu Asn Leu Pro Leu Ile Arg Arg
180 185 190
Met Leu Asp Gln Val Ala Gly Asp Ala Ala Val Leu Gln Met Asp Lys
195 200 205
Glu Asp Leu Ile Glu Asp Phe Leu Ile Ala Tyr Gln Glu Ser Leu Thr
210 215 220
Glu Ile Gly Phe Asn Thr Arg Glu Ile Thr Arg Met Ala Ala Ala Ala
225 230 235 240
Leu Val Ser
<210> 52
<211> 717
<212> DNA
<213> Prochlorococcus marinus
<400> 52
atgcaaacac tcgaatctaa taaaaaaact aatctagaaa attctattga tttacccgat 60
tttactactg attcttacaa agacgcttat agcaggataa atgcaatagt tattgaaggt 120
gaacaagagg ctcatgataa ttacatttcc ttagcaacat taattcctaa cgaattagaa 180
gagttaacta aattagcgaa aatggagctt aagcacaaaa gaggctttac tgcatgtgga 240
agaaatctag gtgttcaagc tgacatgatt tttgctaaag aattcttttc caaattacat 300
ggtaattttc aggttgcgtt atctaatggc aagacaacta catgcctatt aatacaggca 360
attttaattg aagcttttgc tatatccgcg tatcacgttt acataagagt tgctgatcct 420
ttcgcgaaaa aaattaccca aggtgttgtt aaagatgaat atcttcattt aaattatgga 480
caagaatggc taaaagaaaa tttagcgact tgtaaagatg agctaatgga agcaaataag 540
gttaaccttc cattaatcaa gaagatgtta gatcaagtct cggaagatgc ttcagtacta 600
gctatggata gggaagaatt aatggaagaa ttcatgattg cctatcagga cactctcctt 660
gaaataggtt tagataatag agaaattgca agaatggcaa tggctgctat agtttaa 717
<210> 53
<211> 238
<212> PRT
<213> Prochlorococcus marinus
<400> 53
Met Gln Thr Leu Glu Ser Asn Lys Lys Thr Asn Leu Glu Asn Ser Ile
1 5 10 15
Asp Leu Pro Asp Phe Thr Thr Asp Ser Tyr Lys Asp Ala Tyr Ser Arg
20 25 30
Ile Asn Ala Ile Val Ile Glu Gly Glu Gln Glu Ala His Asp Asn Tyr
35 40 45
Ile Ser Leu Ala Thr Leu Ile Pro Asn Glu Leu Glu Glu Leu Thr Lys
50 55 60
Leu Ala Lys Met Glu Leu Lys His Lys Arg Gly Phe Thr Ala Cys Gly
65 70 75 80
Arg Asn Leu Gly Val Gln Ala Asp Met Ile Phe Ala Lys Glu Phe Phe
85 90 95
Ser Lys Leu His Gly Asn Phe Gln Val Ala Leu Ser Asn Gly Lys Thr
100 105 110
Thr Thr Cys Leu Leu Ile Gln Ala Ile Leu Ile Glu Ala Phe Ala Ile
115 120 125
Ser Ala Tyr His Val Tyr Ile Arg Val Ala Asp Pro Phe Ala Lys Lys
130 135 140
Ile Thr Gln Gly Val Val Lys Asp Glu Tyr Leu His Leu Asn Tyr Gly
145 150 155 160
Gln Glu Trp Leu Lys Glu Asn Leu Ala Thr Cys Lys Asp Glu Leu Met
165 170 175
Glu Ala Asn Lys Val Asn Leu Pro Leu Ile Lys Lys Met Leu Asp Gln
180 185 190
Val Ser Glu Asp Ala Ser Val Leu Ala Met Asp Arg Glu Glu Leu Met
195 200 205
Glu Glu Phe Met Ile Ala Tyr Gln Asp Thr Leu Leu Glu Ile Gly Leu
210 215 220
Asp Asn Arg Glu Ile Ala Arg Met Ala Met Ala Ala Ile Val
225 230 235
<210> 54
<211> 726
<212> DNA
<213> Prochlorococcus marinus
<400> 54
atgcaagctt ttgcatccaa caatttaacc gtagaaaaag aagagctaag ttctaactct 60
cttccagatt tcacctcaga atcttacaaa gatgcttaca gcagaatcaa tgcagttgta 120
attgaagggg agcaagaagc ttattctaat tttcttgatc tcgctaaatt gattcctgaa 180
catgcagatg agcttgtgag gctagggaag atggagaaaa agcatatgaa tggtttttgt 240
gcttgcggga gaaatcttgc tgtaaagcct gatatgcctt ttgcaaagac ctttttctca 300
aaactccata ataatttttt agaggctttc aaagtaggag atacgactac ctgtctccta 360
attcaatgca tcttgattga atcttttgca atatccgcat atcacgttta tatacgtgtt 420
gctgatccat tcgccaaaag aatcacagag ggtgttgtcc aagatgaata cttgcatttg 480
aactatggtc aagaatggct taaggccaat ctagagacag ttaagaaaga tcttatgagg 540
gctaataagg aaaacttgcc tcttataaag tccatgctcg atgaagtttc aaacgacgcc 600
gaagtccttc atatggataa agaagagtta atggaggaat ttatgattgc ttatcaagat 660
tcccttcttg aaataggtct tgataataga gaaattgcaa gaatggctct tgcagcggtg 720
atataa 726
<210> 55
<211> 241
<212> PRT
<213> Prochlorococcus marinus
<400> 55
Met Gln Ala Phe Ala Ser Asn Asn Leu Thr Val Glu Lys Glu Glu Leu
1 5 10 15
Ser Ser Asn Ser Leu Pro Asp Phe Thr Ser Glu Ser Tyr Lys Asp Ala
20 25 30
Tyr Ser Arg Ile Asn Ala Val Val Ile Glu Gly Glu Gln Glu Ala Tyr
35 40 45
Ser Asn Phe Leu Asp Leu Ala Lys Leu Ile Pro Glu His Ala Asp Glu
50 55 60
Leu Val Arg Leu Gly Lys Met Glu Lys Lys His Met Asn Gly Phe Cys
65 70 75 80
Ala Cys Gly Arg Asn Leu Ala Val Lys Pro Asp Met Pro Phe Ala Lys
85 90 95
Thr Phe Phe Ser Lys Leu His Asn Asn Phe Leu Glu Ala Phe Lys Val
100 105 110
Gly Asp Thr Thr Thr Cys Leu Leu Ile Gln Cys Ile Leu Ile Glu Ser
115 120 125
Phe Ala Ile Ser Ala Tyr His Val Tyr Ile Arg Val Ala Asp Pro Phe
130 135 140
Ala Lys Arg Ile Thr Glu Gly Val Val Gln Asp Glu Tyr Leu His Leu
145 150 155 160
Asn Tyr Gly Gln Glu Trp Leu Lys Ala Asn Leu Glu Thr Val Lys Lys
165 170 175
Asp Leu Met Arg Ala Asn Lys Glu Asn Leu Pro Leu Ile Lys Ser Met
180 185 190
Leu Asp Glu Val Ser Asn Asp Ala Glu Val Leu His Met Asp Lys Glu
195 200 205
Glu Leu Met Glu Glu Phe Met Ile Ala Tyr Gln Asp Ser Leu Leu Glu
210 215 220
Ile Gly Leu Asp Asn Arg Glu Ile Ala Arg Met Ala Leu Ala Ala Val
225 230 235 240
Ile
<210> 56
<211> 732
<212> DNA
<213> Synechococcus sp.
<400> 56
atgccgaccc ttgagacgtc tgaggtcgcc gttcttgaag actcgatggc ttcaggctcc 60
cggctgcctg atttcaccag cgaggcttac aaggacgcct acagccgcat caatgcgatc 120
gtgatcgagg gtgagcagga agcgcacgac aactacatcg ccctcggcac gctgatcccc 180
gagcagaagg atgagctggc ccgtctcgcc cgcatggaga tgaagcacat gaaggggttc 240
acctcctgtg gccgcaatct cggcgtggag gcagaccttc cctttgctaa ggaattcttc 300
gcccccctgc acgggaactt ccaggcagct ctccaggagg gcaaggtggt gacctgcctg 360
ttgattcagg cgctgctgat tgaagcgttc gccatttccg cctatcacat ctacatcccg 420
gtggcggatc ccttcgctcg caagatcact gaaggtgtgg tgaaggatga gtacacccac 480
ctcaattacg gccaggaatg gctgaaggcc aattttgagg ccagcaagga tgagctgatg 540
gaggccaaca aggccaatct gcctctgatc cgctcgatgc tggagcaggt ggcagccgac 600
gccgccgtgc tgcagatgga aaaggaagat ctgatcgaag atttcctgat cgcttaccag 660
gaggccctct gcgagatcgg tttcagctcc cgtgacattg ctcgcatggc cgccgctgcc 720
ctcgcggtct ga 732
<210> 57
<211> 243
<212> PRT
<213> Synechococcus sp.
<400> 57
Met Pro Thr Leu Glu Thr Ser Glu Val Ala Val Leu Glu Asp Ser Met
1 5 10 15
Ala Ser Gly Ser Arg Leu Pro Asp Phe Thr Ser Glu Ala Tyr Lys Asp
20 25 30
Ala Tyr Ser Arg Ile Asn Ala Ile Val Ile Glu Gly Glu Gln Glu Ala
35 40 45
His Asp Asn Tyr Ile Ala Leu Gly Thr Leu Ile Pro Glu Gln Lys Asp
50 55 60
Glu Leu Ala Arg Leu Ala Arg Met Glu Met Lys His Met Lys Gly Phe
65 70 75 80
Thr Ser Cys Gly Arg Asn Leu Gly Val Glu Ala Asp Leu Pro Phe Ala
85 90 95
Lys Glu Phe Phe Ala Pro Leu His Gly Asn Phe Gln Ala Ala Leu Gln
100 105 110
Glu Gly Lys Val Val Thr Cys Leu Leu Ile Gln Ala Leu Leu Ile Glu
115 120 125
Ala Phe Ala Ile Ser Ala Tyr His Ile Tyr Ile Pro Val Ala Asp Pro
130 135 140
Phe Ala Arg Lys Ile Thr Glu Gly Val Val Lys Asp Glu Tyr Thr His
145 150 155 160
Leu Asn Tyr Gly Gln Glu Trp Leu Lys Ala Asn Phe Glu Ala Ser Lys
165 170 175
Asp Glu Leu Met Glu Ala Asn Lys Ala Asn Leu Pro Leu Ile Arg Ser
180 185 190
Met Leu Glu Gln Val Ala Ala Asp Ala Ala Val Leu Gln Met Glu Lys
195 200 205
Glu Asp Leu Ile Glu Asp Phe Leu Ile Ala Tyr Gln Glu Ala Leu Cys
210 215 220
Glu Ile Gly Phe Ser Ser Arg Asp Ile Ala Arg Met Ala Ala Ala Ala
225 230 235 240
Leu Ala Val
<210> 58
<211> 681
<212> DNA
<213> Synechococcus sp.
<400> 58
atgacccagc tcgactttgc cagtgcggcc taccgcgagg cctacagccg gatcaacggc 60
gttgtgattg tgggcgaagg tctcgccaat cgccatttcc agatgttggc gcggcgcatt 120
cccgctgatc gcgacgagct gcagcggctc ggacgcatgg agggagacca tgccagcgcc 180
tttgtgggct gtggtcgcaa cctcggtgtg gtggccgatc tgcccctggc ccggcgcctg 240
tttcagcccc tccatgatct gttcaaacgc cacgaccacg acggcaatcg ggccgaatgc 300
ctggtgatcc aggggttgat cgtggaatgt ttcgccgtgg cggcttaccg ccactacctg 360
ccggtggccg atgcctacgc ccggccgatc accgcagcgg tgatgaacga tgaatcggaa 420
cacctcgact acgctgagac ctggctgcag cgccatttcg atcaggtgaa ggcccgggtc 480
agcgcggtgg tggtggaggc gttgccgctc accctggcga tgttgcaatc gcttgctgca 540
gacatgcgac agatcggcat ggatccggtg gagaccctgg ccagcttcag tgaactgttt 600
cgggaagcgt tggaatcggt ggggtttgag gctgtggagg ccaggcgact gctgatgcga 660
gcggccgccc ggatggtctg a 681
<210> 59
<211> 226
<212> PRT
<213> Synechococcus sp.
<400> 59
Met Thr Gln Leu Asp Phe Ala Ser Ala Ala Tyr Arg Glu Ala Tyr Ser
1 5 10 15
Arg Ile Asn Gly Val Val Ile Val Gly Glu Gly Leu Ala Asn Arg His
20 25 30
Phe Gln Met Leu Ala Arg Arg Ile Pro Ala Asp Arg Asp Glu Leu Gln
35 40 45
Arg Leu Gly Arg Met Glu Gly Asp His Ala Ser Ala Phe Val Gly Cys
50 55 60
Gly Arg Asn Leu Gly Val Val Ala Asp Leu Pro Leu Ala Arg Arg Leu
65 70 75 80
Phe Gln Pro Leu His Asp Leu Phe Lys Arg His Asp His Asp Gly Asn
85 90 95
Arg Ala Glu Cys Leu Val Ile Gln Gly Leu Ile Val Glu Cys Phe Ala
100 105 110
Val Ala Ala Tyr Arg His Tyr Leu Pro Val Ala Asp Ala Tyr Ala Arg
115 120 125
Pro Ile Thr Ala Ala Val Met Asn Asp Glu Ser Glu His Leu Asp Tyr
130 135 140
Ala Glu Thr Trp Leu Gln Arg His Phe Asp Gln Val Lys Ala Arg Val
145 150 155 160
Ser Ala Val Val Val Glu Ala Leu Pro Leu Thr Leu Ala Met Leu Gln
165 170 175
Ser Leu Ala Ala Asp Met Arg Gln Ile Gly Met Asp Pro Val Glu Thr
180 185 190
Leu Ala Ser Phe Ser Glu Leu Phe Arg Glu Ala Leu Glu Ser Val Gly
195 200 205
Phe Glu Ala Val Glu Ala Arg Arg Leu Leu Met Arg Ala Ala Ala Arg
210 215 220
Met Val
225
<210> 60
<211> 696
<212> DNA
<213> Cyanothece sp.
<400> 60
atgcaagagc ttgctttacg ctcagagctt gattttaaca gcgaaaccta taaagatgct 60
tacagtcgca tcaatgctat tgtcattgaa ggggaacaag aagcctatca aaattatctt 120
gatatggcgc aacttctccc agaagacgag gctgagttaa ttcgtctctc caagatggaa 180
aaccgtcaca aaaaaggctt tcaagcctgt ggcaagaatt tgaatgtgac cccagatatg 240
gactacgctc aacaattttt tgctgaactt catggcaact tccaaaaggc aaaagccgaa 300
ggcaaaattg tcacttgctt attaattcaa tctttgatca tcgaagcctt tgcgatcgcc 360
gcttataata tttatattcc tgtggcagat ccctttgctc gtaaaatcac cgaaggggta 420
gttaaggatg aatataccca cctcaatttt ggggaagtct ggttaaaaga gcattttgaa 480
gcctctaaag cagaattaga agacgcaaat aaagaaaatt taccccttgt ttggcaaatg 540
ctcaaccaag ttgaaaaaga tgccgaagtg ttagggatgg agaaagaagc cttagtggaa 600
gatttcatga ttagttatgg agaagcttta agtaatattg gtttctctac ccgtgagatc 660
atgaaaatgt ctgcttacgg gctacgggct gcttaa 696
<210> 61
<211> 231
<212> PRT
<213> Cyanothece sp.
<400> 61
Met Gln Glu Leu Ala Leu Arg Ser Glu Leu Asp Phe Asn Ser Glu Thr
1 5 10 15
Tyr Lys Asp Ala Tyr Ser Arg Ile Asn Ala Ile Val Ile Glu Gly Glu
20 25 30
Gln Glu Ala Tyr Gln Asn Tyr Leu Asp Met Ala Gln Leu Leu Pro Glu
35 40 45
Asp Glu Ala Glu Leu Ile Arg Leu Ser Lys Met Glu Asn Arg His Lys
50 55 60
Lys Gly Phe Gln Ala Cys Gly Lys Asn Leu Asn Val Thr Pro Asp Met
65 70 75 80
Asp Tyr Ala Gln Gln Phe Phe Ala Glu Leu His Gly Asn Phe Gln Lys
85 90 95
Ala Lys Ala Glu Gly Lys Ile Val Thr Cys Leu Leu Ile Gln Ser Leu
100 105 110
Ile Ile Glu Ala Phe Ala Ile Ala Ala Tyr Asn Ile Tyr Ile Pro Val
115 120 125
Ala Asp Pro Phe Ala Arg Lys Ile Thr Glu Gly Val Val Lys Asp Glu
130 135 140
Tyr Thr His Leu Asn Phe Gly Glu Val Trp Leu Lys Glu His Phe Glu
145 150 155 160
Ala Ser Lys Ala Glu Leu Glu Asp Ala Asn Lys Glu Asn Leu Pro Leu
165 170 175
Val Trp Gln Met Leu Asn Gln Val Glu Lys Asp Ala Glu Val Leu Gly
180 185 190
Met Glu Lys Glu Ala Leu Val Glu Asp Phe Met Ile Ser Tyr Gly Glu
195 200 205
Ala Leu Ser Asn Ile Gly Phe Ser Thr Arg Glu Ile Met Lys Met Ser
210 215 220
Ala Tyr Gly Leu Arg Ala Ala
225 230
<210> 62
<211> 696
<212> DNA
<213> Cyanothece sp.
<400> 62
atgcctcaag tgcagtcccc atcggctata gacttctaca gtgagaccta ccaggatgct 60
tacagccgca ttgatgcgat cgtgatcgag ggagaacagg aagcccacga caattacctg 120
aagctgacgg aactgctgcc ggattgtcaa gaagatctgg tccggctggc caaaatggaa 180
gcccgtcaca aaaaagggtt tgaagcttgt ggccgcaatc tcaaggtcac acccgatatg 240
gagtttgctc aacagttctt tgctgacctg cacaacaatt tccagaaagc tgctgcggcc 300
aacaaaattg ccacctgtct ggtgatccag gccctgatta ttgagtgctt tgccatcgcc 360
gcttataaca tctatattcc tgtcgctgat gactttgccc gcaaaattac cgaaaacgtg 420
gtcaaagacg aatacaccca cctcaacttt ggtgaagagt ggctcaaagc taactttgat 480
agccagcggg aagaagtgga agcggccaac cgggaaaacc tgccgatcgt ctggcggatg 540
ctcaatcagg tagagactga tgctcacgtt ttaggtatgg aaaaagaggc tttagtggaa 600
agcttcatga tccaatatgg tgaagccctg gaaaatattg gtttctcgac ccgtgagatc 660
atgcgcatgt ccgtttacgg cctctctgcg gcataa 696
<210> 63
<211> 702
<212> DNA
<213> Cyanothece sp.
<400> 63
atgtctgatt gcgccacgaa cccagccctc gactattaca gtgaaaccta ccgcaatgct 60
taccggcggg tgaacggtat tgtgattgaa ggcgagaagc aagcctacga caactttatc 120
cgcttagctg agctgctccc agagtatcaa gcggaattaa cccgtctggc taaaatggaa 180
gcccgccacc agaagagctt tgttgcctgt ggccaaaatc tcaaggttag cccggactta 240
gactttgcgg cacagttttt tgctgaactg catcaaattt ttgcatctgc agcaaatgcg 300
ggccaggtgg ctacctgtct ggttgtgcaa gccctgatca ttgaatgctt tgcgatcgcc 360
gcctacaata cctatttgcc agtagcggat gaatttgccc gtaaagtcac cgcatccgtt 420
gttcaggacg agtacagcca cctaaacttt ggtgaagtct ggctgcagaa tgcgtttgag 480
cagtgtaaag acgaaattat cacagctaac cgtcttgctc tgccgctgat ctggaaaatg 540
ctcaaccagg tgacaggcga attgcgcatt ctgggcatgg acaaagcttc tctggtagaa 600
gactttagca ctcgctatgg agaggccctg ggccagattg gtttcaaact atctgaaatt 660
ctctccctgt ccgttcaggg tttacaggcg gttacgcctt ag 702
<210> 64
<211> 702
<212> DNA
<213> Cyanothece sp.
<400> 64
atgtctgatt gcgccacgaa cccagccctc gactattaca gtgaaaccta ccgcaatgct 60
taccggcggg tgaacggtat tgtgattgaa ggcgagaagc aagcctacga caactttatc 120
cgcttagctg agctgctccc agagtatcaa gcggaattaa cccgtctggc taaaatggaa 180
gcccgccacc agaagagctt tgttgcctgt ggccaaaatc tcaaggttag cccggactta 240
gactttgcgg cacagttttt tgctgaactg catcaaattt ttgcatctgc agcaaatgcg 300
ggccaggtgg ctacctgtct ggttgtgcaa gccctgatca ttgaatgctt tgcgatcgcc 360
gcctacaata cctatttgcc agtagcggat gaatttgccc gtaaagtcac cgcatccgtt 420
gttcaggacg agtacagcca cctaaacttt ggtgaagtct ggctgcagaa tgcgtttgag 480
cagtgtaaag acgaaattat cacagctaac cgtcttgctc tgccgctgat ctggaaaatg 540
ctcaaccagg tgacaggcga attgcgcatt ctgggcatgg acaaagcttc tctggtagaa 600
gactttagca ctcgctatgg agaggccctg ggccagattg gtttcaaact atctgaaatt 660
ctctccctgt ccgttcaggg tttacaggcg gttacgcctt ag 702
<210> 65
<211> 233
<212> PRT
<213> Cyanothece sp.
<400> 65
Met Ser Asp Cys Ala Thr Asn Pro Ala Leu Asp Tyr Tyr Ser Glu Thr
1 5 10 15
Tyr Arg Asn Ala Tyr Arg Arg Val Asn Gly Ile Val Ile Glu Gly Glu
20 25 30
Lys Gln Ala Tyr Asp Asn Phe Ile Arg Leu Ala Glu Leu Leu Pro Glu
35 40 45
Tyr Gln Ala Glu Leu Thr Arg Leu Ala Lys Met Glu Ala Arg His Gln
50 55 60
Lys Ser Phe Val Ala Cys Gly Gln Asn Leu Lys Val Ser Pro Asp Leu
65 70 75 80
Asp Phe Ala Ala Gln Phe Phe Ala Glu Leu His Gln Ile Phe Ala Ser
85 90 95
Ala Ala Asn Ala Gly Gln Val Ala Thr Cys Leu Val Val Gln Ala Leu
100 105 110
Ile Ile Glu Cys Phe Ala Ile Ala Ala Tyr Asn Thr Tyr Leu Pro Val
115 120 125
Ala Asp Glu Phe Ala Arg Lys Val Thr Ala Ser Val Val Gln Asp Glu
130 135 140
Tyr Ser His Leu Asn Phe Gly Glu Val Trp Leu Gln Asn Ala Phe Glu
145 150 155 160
Gln Cys Lys Asp Glu Ile Ile Thr Ala Asn Arg Leu Ala Leu Pro Leu
165 170 175
Ile Trp Lys Met Leu Asn Gln Val Thr Gly Glu Leu Arg Ile Leu Gly
180 185 190
Met Asp Lys Ala Ser Leu Val Glu Asp Phe Ser Thr Arg Tyr Gly Glu
195 200 205
Ala Leu Gly Gln Ile Gly Phe Lys Leu Ser Glu Ile Leu Ser Leu Ser
210 215 220
Val Gln Gly Leu Gln Ala Val Thr Pro
225 230
<210> 66
<211> 696
<212> DNA
<213> Anabaena variabilis
<400> 66
atgcagcagg ttgcagccga tttagaaatc gatttcaaga gcgaaaaata taaagatgcc 60
tatagtcgca taaatgcgat cgtgattgaa ggggaacaag aagcatatga gaattacatt 120
caactatccc aactgctgcc agacgataaa gaagacctaa ttcgcctctc gaaaatggaa 180
agtcgccaca aaaaaggatt tgaagcttgt ggacggaacc tgcaagtatc cccagacata 240
gagttcgcta aagaattctt tgccgggcta cacggtaatt tccaaaaagc ggcagctgaa 300
ggtaaagttg tcacttgcct attgattcaa tccctgatta ttgaatgttt tgcgatcgcc 360
gcatacaata tctacatccc cgtggctgac gatttcgccc gtaaaatcac tgagggtgta 420
gttaaagatg aatacagtca cctcaacttc ggcgaagttt ggttacagaa aaatttcgct 480
caatcaaaag cagaactaga agaagctaat cgtcataatc ttcccatagt ctggaaaatg 540
ctcaatcaag ttgccgatga tgcggcagtc ttagctatgg aaaaagaagc cctagtggaa 600
gattttatga ttcagtacgg cgaagcacta agtaatattg gcttcacaac cagagatatt 660
atgcggatgt cagcctacgg actcacagca gcttaa 696
<210> 67
<211> 231
<212> PRT
<213> Anabaena variabilis
<400> 67
Met Gln Gln Val Ala Ala Asp Leu Glu Ile Asp Phe Lys Ser Glu Lys
1 5 10 15
Tyr Lys Asp Ala Tyr Ser Arg Ile Asn Ala Ile Val Ile Glu Gly Glu
20 25 30
Gln Glu Ala Tyr Glu Asn Tyr Ile Gln Leu Ser Gln Leu Leu Pro Asp
35 40 45
Asp Lys Glu Asp Leu Ile Arg Leu Ser Lys Met Glu Ser Arg His Lys
50 55 60
Lys Gly Phe Glu Ala Cys Gly Arg Asn Leu Gln Val Ser Pro Asp Ile
65 70 75 80
Glu Phe Ala Lys Glu Phe Phe Ala Gly Leu His Gly Asn Phe Gln Lys
85 90 95
Ala Ala Ala Glu Gly Lys Val Val Thr Cys Leu Leu Ile Gln Ser Leu
100 105 110
Ile Ile Glu Cys Phe Ala Ile Ala Ala Tyr Asn Ile Tyr Ile Pro Val
115 120 125
Ala Asp Asp Phe Ala Arg Lys Ile Thr Glu Gly Val Val Lys Asp Glu
130 135 140
Tyr Ser His Leu Asn Phe Gly Glu Val Trp Leu Gln Lys Asn Phe Ala
145 150 155 160
Gln Ser Lys Ala Glu Leu Glu Glu Ala Asn Arg His Asn Leu Pro Ile
165 170 175
Val Trp Lys Met Leu Asn Gln Val Ala Asp Asp Ala Ala Val Leu Ala
180 185 190
Met Glu Lys Glu Ala Leu Val Glu Asp Phe Met Ile Gln Tyr Gly Glu
195 200 205
Ala Leu Ser Asn Ile Gly Phe Thr Thr Arg Asp Ile Met Arg Met Ser
210 215 220
Ala Tyr Gly Leu Thr Ala Ala
225 230
<210> 68
<211> 765
<212> DNA
<213> Synechococcus elongatus
<400> 68
gtgcgtaccc cctgggatcc accaaatccc acattctccc tctcatccgt gtcaggagac 60
cgcagactca tgccgcagct tgaagccagc cttgaactgg actttcaaag cgagtcctac 120
aaagacgctt acagccgcat caacgcgatc gtgattgaag gcgaacaaga ggcgttcgac 180
aactacaatc gccttgctga gatgctgccc gaccagcggg atgagcttca caagctagcc 240
aagatggaac agcgccacat gaaaggcttt atggcctgtg gcaaaaatct ctccgtcact 300
cctgacatgg gttttgccca gaaatttttc gagcgcttgc acgagaactt caaagcggcg 360
gctgcggaag gcaaggtcgt cacctgccta ctgattcaat cgctaatcat cgagtgcttt 420
gcgatcgcgg cttacaacat ctacatccca gtggcggatg cttttgcccg caaaatcacg 480
gagggggtcg tgcgcgacga atacctgcac cgcaacttcg gtgaagagtg gctgaaggcg 540
aattttgatg cttccaaagc cgaactggaa gaagccaatc gtcagaacct gcccttggtt 600
tggctaatgc tcaacgaagt ggccgatgat gctcgcgaac tcgggatgga gcgtgagtcg 660
ctcgtcgagg actttatgat tgcctacggt gaagctctgg aaaacatcgg cttcacaacg 720
cgcgaaatca tgcgtatgtc cgcctatggc cttgcggccg tttga 765
<210> 69
<211> 254
<212> PRT
<213> Synechococcus elongatus
<400> 69
Met Arg Thr Pro Trp Asp Pro Pro Asn Pro Thr Phe Ser Leu Ser Ser
1 5 10 15
Val Ser Gly Asp Arg Arg Leu Met Pro Gln Leu Glu Ala Ser Leu Glu
20 25 30
Leu Asp Phe Gln Ser Glu Ser Tyr Lys Asp Ala Tyr Ser Arg Ile Asn
35 40 45
Ala Ile Val Ile Glu Gly Glu Gln Glu Ala Phe Asp Asn Tyr Asn Arg
50 55 60
Leu Ala Glu Met Leu Pro Asp Gln Arg Asp Glu Leu His Lys Leu Ala
65 70 75 80
Lys Met Glu Gln Arg His Met Lys Gly Phe Met Ala Cys Gly Lys Asn
85 90 95
Leu Ser Val Thr Pro Asp Met Gly Phe Ala Gln Lys Phe Phe Glu Arg
100 105 110
Leu His Glu Asn Phe Lys Ala Ala Ala Ala Glu Gly Lys Val Val Thr
115 120 125
Cys Leu Leu Ile Gln Ser Leu Ile Ile Glu Cys Phe Ala Ile Ala Ala
130 135 140
Tyr Asn Ile Tyr Ile Pro Val Ala Asp Ala Phe Ala Arg Lys Ile Thr
145 150 155 160
Glu Gly Val Val Arg Asp Glu Tyr Leu His Arg Asn Phe Gly Glu Glu
165 170 175
Trp Leu Lys Ala Asn Phe Asp Ala Ser Lys Ala Glu Leu Glu Glu Ala
180 185 190
Asn Arg Gln Asn Leu Pro Leu Val Trp Leu Met Leu Asn Glu Val Ala
195 200 205
Asp Asp Ala Arg Glu Leu Gly Met Glu Arg Glu Ser Leu Val Glu Asp
210 215 220
Phe Met Ile Ala Tyr Gly Glu Ala Leu Glu Asn Ile Gly Phe Thr Thr
225 230 235 240
Arg Glu Ile Met Arg Met Ser Ala Tyr Gly Leu Ala Ala Val
245 250
<210> 70
<211> 1026
<212> DNA
<213> Synechococcus elongatus
<400> 70
atgttcggtc ttatcggtca tctcaccagt ttggagcagg cccgcgacgt ttctcgcagg 60
atgggctacg acgaatacgc cgatcaagga ttggagtttt ggagtagcgc tcctcctcaa 120
atcgttgatg aaatcacagt caccagtgcc acaggcaagg tgattcacgg tcgctacatc 180
gaatcgtgtt tcttgccgga aatgctggcg gcgcgccgct tcaaaacagc cacgcgcaaa 240
gttctcaatg ccatgtccca tgcccaaaaa cacggcatcg acatctcggc cttggggggc 300
tttacctcga ttattttcga gaatttcgat ttggccagtt tgcggcaagt gcgcgacact 360
accttggagt ttgaacggtt caccaccggc aatactcaca cggcctacgt aatctgtaga 420
caggtggaag ccgctgctaa aacgctgggc atcgacatta cccaagcgac agtagcggtt 480
gtcggcgcga ctggcgatat cggtagcgct gtctgccgct ggctcgacct caaactgggt 540
gtcggtgatt tgatcctgac ggcgcgcaat caggagcgtt tggataacct gcaggctgaa 600
ctcggccggg gcaagattct gcccttggaa gccgctctgc cggaagctga ctttatcgtg 660
tgggtcgcca gtatgcctca gggcgtagtg atcgacccag caaccctgaa gcaaccctgc 720
gtcctaatcg acgggggcta ccccaaaaac ttgggcagca aagtccaagg tgagggcatc 780
tatgtcctca atggcggggt agttgaacat tgcttcgaca tcgactggca gatcatgtcc 840
gctgcagaga tggcgcggcc cgagcgccag atgtttgcct gctttgccga ggcgatgctc 900
ttggaatttg aaggctggca tactaacttc tcctggggcc gcaaccaaat cacgatcgag 960
aagatggaag cgatcggtga ggcatcggtg cgccacggct tccaaccctt ggcattggca 1020
atttga 1026
<210> 71
<211> 341
<212> PRT
<213> Synechococcus elongatus
<400> 71
Met Phe Gly Leu Ile Gly His Leu Thr Ser Leu Glu Gln Ala Arg Asp
1 5 10 15
Val Ser Arg Arg Met Gly Tyr Asp Glu Tyr Ala Asp Gln Gly Leu Glu
20 25 30
Phe Trp Ser Ser Ala Pro Pro Gln Ile Val Asp Glu Ile Thr Val Thr
35 40 45
Ser Ala Thr Gly Lys Val Ile His Gly Arg Tyr Ile Glu Ser Cys Phe
50 55 60
Leu Pro Glu Met Leu Ala Ala Arg Arg Phe Lys Thr Ala Thr Arg Lys
65 70 75 80
Val Leu Asn Ala Met Ser His Ala Gln Lys His Gly Ile Asp Ile Ser
85 90 95
Ala Leu Gly Gly Phe Thr Ser Ile Ile Phe Glu Asn Phe Asp Leu Ala
100 105 110
Ser Leu Arg Gln Val Arg Asp Thr Thr Leu Glu Phe Glu Arg Phe Thr
115 120 125
Thr Gly Asn Thr His Thr Ala Tyr Val Ile Cys Arg Gln Val Glu Ala
130 135 140
Ala Ala Lys Thr Leu Gly Ile Asp Ile Thr Gln Ala Thr Val Ala Val
145 150 155 160
Val Gly Ala Thr Gly Asp Ile Gly Ser Ala Val Cys Arg Trp Leu Asp
165 170 175
Leu Lys Leu Gly Val Gly Asp Leu Ile Leu Thr Ala Arg Asn Gln Glu
180 185 190
Arg Leu Asp Asn Leu Gln Ala Glu Leu Gly Arg Gly Lys Ile Leu Pro
195 200 205
Leu Glu Ala Ala Leu Pro Glu Ala Asp Phe Ile Val Trp Val Ala Ser
210 215 220
Met Pro Gln Gly Val Val Ile Asp Pro Ala Thr Leu Lys Gln Pro Cys
225 230 235 240
Val Leu Ile Asp Gly Gly Tyr Pro Lys Asn Leu Gly Ser Lys Val Gln
245 250 255
Gly Glu Gly Ile Tyr Val Leu Asn Gly Gly Val Val Glu His Cys Phe
260 265 270
Asp Ile Asp Trp Gln Ile Met Ser Ala Ala Glu Met Ala Arg Pro Glu
275 280 285
Arg Gln Met Phe Ala Cys Phe Ala Glu Ala Met Leu Leu Glu Phe Glu
290 295 300
Gly Trp His Thr Asn Phe Ser Trp Gly Arg Asn Gln Ile Thr Ile Glu
305 310 315 320
Lys Met Glu Ala Ile Gly Glu Ala Ser Val Arg His Gly Phe Gln Pro
325 330 335
Leu Ala Leu Ala Ile
340
<210> 72
<211> 1023
<212> DNA
<213> Synechocystis sp.
<400> 72
atgtttggtc ttattggtca tctcacgagt ttagaacacg cccaagcggt tgctgaagat 60
ttaggctatc ctgagtacgc caaccaaggc ctggattttt ggtgttcggc tcctccccaa 120
gtggttgata attttcaggt gaaaagtgtg acggggcagg tgattgaagg caaatatgtg 180
gagtcttgct ttttgccgga aatgttaacc caacggcgga tcaaagcggc cattcgtaaa 240
atcctcaatg ctatggccct ggcccaaaag gtgggcttgg atattacggc cctgggaggc 300
ttttcttcaa tcgtatttga agaatttaac ctcaagcaaa ataatcaagt ccgcaatgtg 360
gaactagatt ttcagcggtt caccactggt aatacccaca ccgcttatgt gatctgccgt 420
caggtcgagt ctggagctaa acagttgggt attgatctaa gtcaggcaac ggtagcggtt 480
tgtggcgcca cgggagatat tggtagcgcc gtatgtcgtt ggttagatag caaacatcaa 540
gttaaggaat tattgctaat tgcccgtaac cgccaaagat tggaaaatct ccaagaggaa 600
ttgggtcggg gcaaaattat ggatttggaa acagccctgc cccaggcaga tattattgtt 660
tgggtggcta gtatgcccaa gggggtagaa attgcggggg aaatgctgaa aaagccctgt 720
ttgattgtgg atgggggcta tcccaagaat ttagacacca gggtgaaagc ggatggggtg 780
catattctca agggggggat tgtagaacat tcccttgata ttacctggga aattatgaag 840
attgtggaga tggatattcc ctcccggcaa atgttcgcct gttttgcgga ggccattttg 900
ctagagtttg agggctggcg cactaatttt tcctggggcc gcaaccaaat ttccgttaat 960
aaaatggagg cgattggtga agcttctgtc aagcatggct tttgcccttt agtagctctt 1020
tag 1023
<210> 73
<211> 340
<212> PRT
<213> Synechocystis sp.
<400> 73
Met Phe Gly Leu Ile Gly His Leu Thr Ser Leu Glu His Ala Gln Ala
1 5 10 15
Val Ala Glu Asp Leu Gly Tyr Pro Glu Tyr Ala Asn Gln Gly Leu Asp
20 25 30
Phe Trp Cys Ser Ala Pro Pro Gln Val Val Asp Asn Phe Gln Val Lys
35 40 45
Ser Val Thr Gly Gln Val Ile Glu Gly Lys Tyr Val Glu Ser Cys Phe
50 55 60
Leu Pro Glu Met Leu Thr Gln Arg Arg Ile Lys Ala Ala Ile Arg Lys
65 70 75 80
Ile Leu Asn Ala Met Ala Leu Ala Gln Lys Val Gly Leu Asp Ile Thr
85 90 95
Ala Leu Gly Gly Phe Ser Ser Ile Val Phe Glu Glu Phe Asn Leu Lys
100 105 110
Gln Asn Asn Gln Val Arg Asn Val Glu Leu Asp Phe Gln Arg Phe Thr
115 120 125
Thr Gly Asn Thr His Thr Ala Tyr Val Ile Cys Arg Gln Val Glu Ser
130 135 140
Gly Ala Lys Gln Leu Gly Ile Asp Leu Ser Gln Ala Thr Val Ala Val
145 150 155 160
Cys Gly Ala Thr Gly Asp Ile Gly Ser Ala Val Cys Arg Trp Leu Asp
165 170 175
Ser Lys His Gln Val Lys Glu Leu Leu Leu Ile Ala Arg Asn Arg Gln
180 185 190
Arg Leu Glu Asn Leu Gln Glu Glu Leu Gly Arg Gly Lys Ile Met Asp
195 200 205
Leu Glu Thr Ala Leu Pro Gln Ala Asp Ile Ile Val Trp Val Ala Ser
210 215 220
Met Pro Lys Gly Val Glu Ile Ala Gly Glu Met Leu Lys Lys Pro Cys
225 230 235 240
Leu Ile Val Asp Gly Gly Tyr Pro Lys Asn Leu Asp Thr Arg Val Lys
245 250 255
Ala Asp Gly Val His Ile Leu Lys Gly Gly Ile Val Glu His Ser Leu
260 265 270
Asp Ile Thr Trp Glu Ile Met Lys Ile Val Glu Met Asp Ile Pro Ser
275 280 285
Arg Gln Met Phe Ala Cys Phe Ala Glu Ala Ile Leu Leu Glu Phe Glu
290 295 300
Gly Trp Arg Thr Asn Phe Ser Trp Gly Arg Asn Gln Ile Ser Val Asn
305 310 315 320
Lys Met Glu Ala Ile Gly Glu Ala Ser Val Lys His Gly Phe Cys Pro
325 330 335
Leu Val Ala Leu
340
<210> 74
<211> 1023
<212> DNA
<213> Cyanothece sp.
<400> 74
atgtttggtt taattggtca tcttacaagt ttagaacacg cccactccgt tgctgatgcc 60
tttggctatg gcccatacgc cactcaggga cttgatttgt ggtgttctgc tccaccccaa 120
ttcgtcgagc attttcatgt tactagcatc acaggacaaa ccatcgaagg aaagtatata 180
gaatccgctt tcttaccaga aatgctgata aagcgacgga ttaaagcagc aattcgcaaa 240
atactgaatg cgatggcctt tgctcagaaa aataacctta acatcacagc attagggggc 300
ttttcttcga ttatttttga agaatttaat ctcaaagaga atagacaagt tcgtaatgtc 360
tctttagagt ttgatcgctt caccaccgga aacacccata ctgcttatat catttgtcgt 420
caagttgaac aggcatccgc taaactaggg attgacttat cccaagcaac ggttgctatt 480
tgcggggcaa ccggagatat tggcagtgca gtgtgtcgtt ggttagatag aaaaaccgat 540
acccaggaac tattcttaat tgctcgcaat aaagaacgat tacaacgact gcaagatgag 600
ttgggacggg gtaaaattat gggattggag gaggctttac ccgaagcaga tattatcgtt 660
tgggtggcga gtatgcccaa aggagtggaa attaatgccg aaactctcaa aaaaccctgt 720
ttaattatcg atggtggtta tcctaagaat ttagacacaa aaattaaaca tcctgatgtc 780
catatcctga aagggggaat tgtagaacat tctctagata ttgactggaa gattatggaa 840
actgtcaata tggatgttcc ttctcgtcaa atgtttgctt gttttgccga agccatttta 900
ttagagtttg aacaatggca cactaatttt tcttggggac gcaatcaaat tacagtgact 960
aaaatggaac aaataggaga agcttctgtc aaacatgggt tacaaccgtt gttgagttgg 1020
taa 1023
<210> 75
<211> 340
<212> PRT
<213> Cyanothece sp.
<400> 75
Met Phe Gly Leu Ile Gly His Leu Thr Ser Leu Glu His Ala His Ser
1 5 10 15
Val Ala Asp Ala Phe Gly Tyr Gly Pro Tyr Ala Thr Gln Gly Leu Asp
20 25 30
Leu Trp Cys Ser Ala Pro Pro Gln Phe Val Glu His Phe His Val Thr
35 40 45
Ser Ile Thr Gly Gln Thr Ile Glu Gly Lys Tyr Ile Glu Ser Ala Phe
50 55 60
Leu Pro Glu Met Leu Ile Lys Arg Arg Ile Lys Ala Ala Ile Arg Lys
65 70 75 80
Ile Leu Asn Ala Met Ala Phe Ala Gln Lys Asn Asn Leu Asn Ile Thr
85 90 95
Ala Leu Gly Gly Phe Ser Ser Ile Ile Phe Glu Glu Phe Asn Leu Lys
100 105 110
Glu Asn Arg Gln Val Arg Asn Val Ser Leu Glu Phe Asp Arg Phe Thr
115 120 125
Thr Gly Asn Thr His Thr Ala Tyr Ile Ile Cys Arg Gln Val Glu Gln
130 135 140
Ala Ser Ala Lys Leu Gly Ile Asp Leu Ser Gln Ala Thr Val Ala Ile
145 150 155 160
Cys Gly Ala Thr Gly Asp Ile Gly Ser Ala Val Cys Arg Trp Leu Asp
165 170 175
Arg Lys Thr Asp Thr Gln Glu Leu Phe Leu Ile Ala Arg Asn Lys Glu
180 185 190
Arg Leu Gln Arg Leu Gln Asp Glu Leu Gly Arg Gly Lys Ile Met Gly
195 200 205
Leu Glu Glu Ala Leu Pro Glu Ala Asp Ile Ile Val Trp Val Ala Ser
210 215 220
Met Pro Lys Gly Val Glu Ile Asn Ala Glu Thr Leu Lys Lys Pro Cys
225 230 235 240
Leu Ile Ile Asp Gly Gly Tyr Pro Lys Asn Leu Asp Thr Lys Ile Lys
245 250 255
His Pro Asp Val His Ile Leu Lys Gly Gly Ile Val Glu His Ser Leu
260 265 270
Asp Ile Asp Trp Lys Ile Met Glu Thr Val Asn Met Asp Val Pro Ser
275 280 285
Arg Gln Met Phe Ala Cys Phe Ala Glu Ala Ile Leu Leu Glu Phe Glu
290 295 300
Gln Trp His Thr Asn Phe Ser Trp Gly Arg Asn Gln Ile Thr Val Thr
305 310 315 320
Lys Met Glu Gln Ile Gly Glu Ala Ser Val Lys His Gly Leu Gln Pro
325 330 335
Leu Leu Ser Trp
340
<210> 76
<211> 1041
<212> DNA
<213> Prochlorococcus marinus
<400> 76
atgtttgggc ttataggtca ttcaactagt tttgaagatg caaaaagaaa ggcttcatta 60
ttgggctttg atcatattgc ggatggtgat ttagatgttt ggtgcacagc tccacctcaa 120
ctagttgaaa atgtagaggt taaaagtgct ataggtatat caattgaagg ttcttatatt 180
gattcatgtt tcgttcctga aatgctttca agatttaaaa cggcaagaag aaaagtatta 240
aatgcaatgg aattagctca aaaaaaaggt attaatatta ccgctttggg ggggttcact 300
tctatcatct ttgaaaattt taatctcctt caacataagc agattagaaa cacttcacta 360
gagtgggaaa ggtttacaac tggtaatact catactgcgt gggttatttg caggcaatta 420
gagatgaatg ctcctaaaat aggtattgat cttaaaagcg caacagttgc tgtagttggt 480
gctactggag atataggcag tgctgtttgt cgatggttaa tcaataaaac aggtattggg 540
gaacttcttt tggtagctag gcaaaaggaa cccttggatt ctttgcaaaa ggaattagat 600
ggtggaacta tcaaaaatct agatgaagca ttgcctgaag cagatattgt tgtatgggta 660
gcaagtatgc caaagacaat ggaaatcgat gctaataatc ttaaacaacc atgtttaatg 720
attgatggag gttatccaaa gaatctagat gaaaaatttc aaggaaataa tatacatgtt 780
gtaaaaggag gtatagtaag attcttcaat gatataggtt ggaatatgat ggaactagct 840
gaaatgcaaa atccccagag agaaatgttt gcatgctttg cagaagcaat gattttagaa 900
tttgaaaaat gtcatacaaa ctttagctgg ggaagaaata atatatctct cgagaaaatg 960
gagtttattg gagctgcttc tgtaaagcat ggcttctctg caattggcct agataagcat 1020
ccaaaagtac tagcagtttg a 1041
<210> 77
<211> 346
<212> PRT
<213> Prochlorococcus marinus
<400> 77
Met Phe Gly Leu Ile Gly His Ser Thr Ser Phe Glu Asp Ala Lys Arg
1 5 10 15
Lys Ala Ser Leu Leu Gly Phe Asp His Ile Ala Asp Gly Asp Leu Asp
20 25 30
Val Trp Cys Thr Ala Pro Pro Gln Leu Val Glu Asn Val Glu Val Lys
35 40 45
Ser Ala Ile Gly Ile Ser Ile Glu Gly Ser Tyr Ile Asp Ser Cys Phe
50 55 60
Val Pro Glu Met Leu Ser Arg Phe Lys Thr Ala Arg Arg Lys Val Leu
65 70 75 80
Asn Ala Met Glu Leu Ala Gln Lys Lys Gly Ile Asn Ile Thr Ala Leu
85 90 95
Gly Gly Phe Thr Ser Ile Ile Phe Glu Asn Phe Asn Leu Leu Gln His
100 105 110
Lys Gln Ile Arg Asn Thr Ser Leu Glu Trp Glu Arg Phe Thr Thr Gly
115 120 125
Asn Thr His Thr Ala Trp Val Ile Cys Arg Gln Leu Glu Met Asn Ala
130 135 140
Pro Lys Ile Gly Ile Asp Leu Lys Ser Ala Thr Val Ala Val Val Gly
145 150 155 160
Ala Thr Gly Asp Ile Gly Ser Ala Val Cys Arg Trp Leu Ile Asn Lys
165 170 175
Thr Gly Ile Gly Glu Leu Leu Leu Val Ala Arg Gln Lys Glu Pro Leu
180 185 190
Asp Ser Leu Gln Lys Glu Leu Asp Gly Gly Thr Ile Lys Asn Leu Asp
195 200 205
Glu Ala Leu Pro Glu Ala Asp Ile Val Val Trp Val Ala Ser Met Pro
210 215 220
Lys Thr Met Glu Ile Asp Ala Asn Asn Leu Lys Gln Pro Cys Leu Met
225 230 235 240
Ile Asp Gly Gly Tyr Pro Lys Asn Leu Asp Glu Lys Phe Gln Gly Asn
245 250 255
Asn Ile His Val Val Lys Gly Gly Ile Val Arg Phe Phe Asn Asp Ile
260 265 270
Gly Trp Asn Met Met Glu Leu Ala Glu Met Gln Asn Pro Gln Arg Glu
275 280 285
Met Phe Ala Cys Phe Ala Glu Ala Met Ile Leu Glu Phe Glu Lys Cys
290 295 300
His Thr Asn Phe Ser Trp Gly Arg Asn Asn Ile Ser Leu Glu Lys Met
305 310 315 320
Glu Phe Ile Gly Ala Ala Ser Val Lys His Gly Phe Ser Ala Ile Gly
325 330 335
Leu Asp Lys His Pro Lys Val Leu Ala Val
340 345
<210> 78
<211> 1053
<212> DNA
<213> Gloeobacter violaceus
<400> 78
atgtttggcc tgatcggaca cttgaccaat ctttcccatg cccagcgggt cgcccgcgac 60
ctgggctacg acgagtatgc aagccacgac ctcgaattct ggtgcatggc ccctccccag 120
gcggtcgatg aaatcacgat caccagcgtc accggtcagg tgatccacgg tcagtacgtc 180
gaatcgtgct ttctgccgga gatgctcgcc cagggccgct tcaagaccgc catgcgcaag 240
atcctcaatg ccatggccct ggtccagaag cgcggcatcg acattacggc cctgggaggc 300
ttctcgtcga tcatcttcga gaatttcagc ctcgataaat tgctcaacgt ccgcgacatc 360
accctcgaca tccagcgctt caccaccggc aacacccaca cggcctacat cctttgtcag 420
caggtcgagc agggtgcggt acgctacggc atcgatccgg ccaaagcgac cgtggcggta 480
gtcggggcca ccggcgacat cggtagcgcc gtctgccgat ggctcaccga ccgcgccggc 540
atccacgaac tcttgctggt ggcccgcgac gccgaaaggc tcgaccggct gcagcaggaa 600
ctcggcaccg gtcggatcct gccggtcgaa gaagcacttc ccaaagccga catcgtcgtc 660
tgggtcgcct cgatgaacca gggcatggcc atcgaccccg ccggcctgcg caccccctgc 720
ctgctcatcg acggcggcta ccccaagaac atggccggca ccctgcagcg cccgggcatc 780
catatcctcg acggcggcat ggtcgagcac tcgctcgaca tcgactggca gatcatgtcg 840
tttctaaatg tgcccaaccc cgcccgccag ttcttcgcct gcttcgccga gtcgatgctg 900
ctggaattcg aagggcttca cttcaatttt tcctggggcc gcaaccacat caccgtcgag 960
aagatggccc agatcggctc gctgtctaaa aaacatggct ttcgtcccct gcttgaaccc 1020
agtcagcgca gcggcgaact cgtacacgga taa 1053
<210> 79
<211> 350
<212> PRT
<213> Gloeobacter violaceus
<400> 79
Met Phe Gly Leu Ile Gly His Leu Thr Asn Leu Ser His Ala Gln Arg
1 5 10 15
Val Ala Arg Asp Leu Gly Tyr Asp Glu Tyr Ala Ser His Asp Leu Glu
20 25 30
Phe Trp Cys Met Ala Pro Pro Gln Ala Val Asp Glu Ile Thr Ile Thr
35 40 45
Ser Val Thr Gly Gln Val Ile His Gly Gln Tyr Val Glu Ser Cys Phe
50 55 60
Leu Pro Glu Met Leu Ala Gln Gly Arg Phe Lys Thr Ala Met Arg Lys
65 70 75 80
Ile Leu Asn Ala Met Ala Leu Val Gln Lys Arg Gly Ile Asp Ile Thr
85 90 95
Ala Leu Gly Gly Phe Ser Ser Ile Ile Phe Glu Asn Phe Ser Leu Asp
100 105 110
Lys Leu Leu Asn Val Arg Asp Ile Thr Leu Asp Ile Gln Arg Phe Thr
115 120 125
Thr Gly Asn Thr His Thr Ala Tyr Ile Leu Cys Gln Gln Val Glu Gln
130 135 140
Gly Ala Val Arg Tyr Gly Ile Asp Pro Ala Lys Ala Thr Val Ala Val
145 150 155 160
Val Gly Ala Thr Gly Asp Ile Gly Ser Ala Val Cys Arg Trp Leu Thr
165 170 175
Asp Arg Ala Gly Ile His Glu Leu Leu Leu Val Ala Arg Asp Ala Glu
180 185 190
Arg Leu Asp Arg Leu Gln Gln Glu Leu Gly Thr Gly Arg Ile Leu Pro
195 200 205
Val Glu Glu Ala Leu Pro Lys Ala Asp Ile Val Val Trp Val Ala Ser
210 215 220
Met Asn Gln Gly Met Ala Ile Asp Pro Ala Gly Leu Arg Thr Pro Cys
225 230 235 240
Leu Leu Ile Asp Gly Gly Tyr Pro Lys Asn Met Ala Gly Thr Leu Gln
245 250 255
Arg Pro Gly Ile His Ile Leu Asp Gly Gly Met Val Glu His Ser Leu
260 265 270
Asp Ile Asp Trp Gln Ile Met Ser Phe Leu Asn Val Pro Asn Pro Ala
275 280 285
Arg Gln Phe Phe Ala Cys Phe Ala Glu Ser Met Leu Leu Glu Phe Glu
290 295 300
Gly Leu His Phe Asn Phe Ser Trp Gly Arg Asn His Ile Thr Val Glu
305 310 315 320
Lys Met Ala Gln Ile Gly Ser Leu Ser Lys Lys His Gly Phe Arg Pro
325 330 335
Leu Leu Glu Pro Ser Gln Arg Ser Gly Glu Leu Val His Gly
340 345 350
<210> 80
<211> 1020
<212> DNA
<213> Nostoc punctiforme
<400> 80
atgtttggtc taattggaca tctgactagt ttagaacacg ctcaagccgt agcccaagaa 60
ttgggatacc cagaatatgc cgatcaaggg ctagactttt ggtgcagcgc cccgccgcaa 120
attgtcgata gtattattgt caccagtgtt actgggcaac aaattgaagg acgatatgta 180
gaatcttgct ttttgccgga aatgctagct agtcgccgca tcaaagccgc aacacggaaa 240
atcctcaacg ctatggccca tgcacagaag cacggcatta acatcacagc tttaggcgga 300
ttttcctcga ttatttttga aaactttaag ttagagcagt ttagccaagt ccgaaatatc 360
aagctagagt ttgaacgctt caccacagga aacacgcata ctgcctacat tatttgtaag 420
caggtggaag aagcatccaa acaactggga attaatctat caaacgcgac tgttgcggta 480
tgtggagcaa ctggggatat tggtagtgcc gttacacgct ggctagatgc gagaacagat 540
gtccaagaac tcctgctaat cgcccgcgat caagaacgtc tcaaagagtt gcaaggcgaa 600
ctggggcggg ggaaaatcat gggtttgaca gaagcactac cccaagccga tgttgtagtt 660
tgggttgcta gtatgcccag aggcgtggaa attgacccca ccactttgaa acaaccctgt 720
ttgttgattg atggtggcta tcctaaaaac ttagcaacaa aaattcaata tcctggcgta 780
cacgtgttaa atggtgggat tgtagagcat tccctggata ttgactggaa aattatgaaa 840
atagtcaata tggacgtgcc agcccgtcag ttgtttgcct gttttgccga atcaatgcta 900
ctggaatttg agaagttata cacgaacttt tcgtggggac ggaatcagat taccgtagat 960
aaaatggagc agattggccg ggtgtcagta aaacatggat ttagaccgtt gttggtttag 1020
<210> 81
<211> 339
<212> PRT
<213> Nostoc punctiforme
<400> 81
Met Phe Gly Leu Ile Gly His Leu Thr Ser Leu Glu His Ala Gln Ala
1 5 10 15
Val Ala Gln Glu Leu Gly Tyr Pro Glu Tyr Ala Asp Gln Gly Leu Asp
20 25 30
Phe Trp Cys Ser Ala Pro Pro Gln Ile Val Asp Ser Ile Ile Val Thr
35 40 45
Ser Val Thr Gly Gln Gln Ile Glu Gly Arg Tyr Val Glu Ser Cys Phe
50 55 60
Leu Pro Glu Met Leu Ala Ser Arg Arg Ile Lys Ala Ala Thr Arg Lys
65 70 75 80
Ile Leu Asn Ala Met Ala His Ala Gln Lys His Gly Ile Asn Ile Thr
85 90 95
Ala Leu Gly Gly Phe Ser Ser Ile Ile Phe Glu Asn Phe Lys Leu Glu
100 105 110
Gln Phe Ser Gln Val Arg Asn Ile Lys Leu Glu Phe Glu Arg Phe Thr
115 120 125
Thr Gly Asn Thr His Thr Ala Tyr Ile Ile Cys Lys Gln Val Glu Glu
130 135 140
Ala Ser Lys Gln Leu Gly Ile Asn Leu Ser Asn Ala Thr Val Ala Val
145 150 155 160
Cys Gly Ala Thr Gly Asp Ile Gly Ser Ala Val Thr Arg Trp Leu Asp
165 170 175
Ala Arg Thr Asp Val Gln Glu Leu Leu Leu Ile Ala Arg Asp Gln Glu
180 185 190
Arg Leu Lys Glu Leu Gln Gly Glu Leu Gly Arg Gly Lys Ile Met Gly
195 200 205
Leu Thr Glu Ala Leu Pro Gln Ala Asp Val Val Val Trp Val Ala Ser
210 215 220
Met Pro Arg Gly Val Glu Ile Asp Pro Thr Thr Leu Lys Gln Pro Cys
225 230 235 240
Leu Leu Ile Asp Gly Gly Tyr Pro Lys Asn Leu Ala Thr Lys Ile Gln
245 250 255
Tyr Pro Gly Val His Val Leu Asn Gly Gly Ile Val Glu His Ser Leu
260 265 270
Asp Ile Asp Trp Lys Ile Met Lys Ile Val Asn Met Asp Val Pro Ala
275 280 285
Arg Gln Leu Phe Ala Cys Phe Ala Glu Ser Met Leu Leu Glu Phe Glu
290 295 300
Lys Leu Tyr Thr Asn Phe Ser Trp Gly Arg Asn Gln Ile Thr Val Asp
305 310 315 320
Lys Met Glu Gln Ile Gly Arg Val Ser Val Lys His Gly Phe Arg Pro
325 330 335
Leu Leu Val
<210> 82
<211> 1020
<212> DNA
<213> Anabaena variabilis
<400> 82
atgtttggtc taattggaca tctgacaagt ttagaacacg ctcaagcggt agctcaagaa 60
ctgggatacc cagaatacgc cgaccaaggg ctagattttt ggtgcagcgc tccaccgcaa 120
atagttgacc acattaaagt tactagcatt actggtgaaa taattgaagg gaggtatgta 180
gaatcttgct ttttaccaga aatgctagcc agccgtagga ttaaagccgc aacccgcaaa 240
gtcctcaatg ctatggctca tgctcaaaaa catggcattg acatcaccgc tttgggtggt 300
ttctcctcca ttatttttga aaacttcaaa ttggaacagt ttagccaagt tcgtaatgtc 360
acactagagt ttgaacgctt cactacaggc aacactcaca cagcttatat catttgtcgg 420
caggtagaac aagcatcaca acaactcggc attgaactct cccaagcaac agtagctata 480
tgtggggcta ctggtgacat tggtagtgca gttactcgct ggctggatgc caaaacagac 540
gtaaaagaat tactgttaat cgcccgtaat caagaacgtc tccaagagtt gcaaagcgag 600
ttgggacgcg gtaaaatcat gagcctagat gaagcattgc ctcaagctga tattgtagtt 660
tgggtagcta gtatgcctaa aggcgtggaa attaatcctc aagttttgaa acaaccctgt 720
ttattgattg atggtggtta tccgaaaaac ttgggtacaa aagttcagta tcctggtgtt 780
tatgtactga acggaggtat cgtcgaacat tccctagata ttgactggaa aatcatgaaa 840
atagtcaata tggatgtacc tgcacgccaa ttatttgctt gttttgcgga atctatgctc 900
ttggaatttg agaagttgta cacgaacttt tcttgggggc gcaatcagat taccgtagac 960
aaaatggagc agattggtca agcatcagtg aaacatgggt ttagaccact gctggtttag 1020
<210> 83
<211> 339
<212> PRT
<213> Anabaena variabilis
<400> 83
Met Phe Gly Leu Ile Gly His Leu Thr Ser Leu Glu His Ala Gln Ala
1 5 10 15
Val Ala Gln Glu Leu Gly Tyr Pro Glu Tyr Ala Asp Gln Gly Leu Asp
20 25 30
Phe Trp Cys Ser Ala Pro Pro Gln Ile Val Asp His Ile Lys Val Thr
35 40 45
Ser Ile Thr Gly Glu Ile Ile Glu Gly Arg Tyr Val Glu Ser Cys Phe
50 55 60
Leu Pro Glu Met Leu Ala Ser Arg Arg Ile Lys Ala Ala Thr Arg Lys
65 70 75 80
Val Leu Asn Ala Met Ala His Ala Gln Lys His Gly Ile Asp Ile Thr
85 90 95
Ala Leu Gly Gly Phe Ser Ser Ile Ile Phe Glu Asn Phe Lys Leu Glu
100 105 110
Gln Phe Ser Gln Val Arg Asn Val Thr Leu Glu Phe Glu Arg Phe Thr
115 120 125
Thr Gly Asn Thr His Thr Ala Tyr Ile Ile Cys Arg Gln Val Glu Gln
130 135 140
Ala Ser Gln Gln Leu Gly Ile Glu Leu Ser Gln Ala Thr Val Ala Ile
145 150 155 160
Cys Gly Ala Thr Gly Asp Ile Gly Ser Ala Val Thr Arg Trp Leu Asp
165 170 175
Ala Lys Thr Asp Val Lys Glu Leu Leu Leu Ile Ala Arg Asn Gln Glu
180 185 190
Arg Leu Gln Glu Leu Gln Ser Glu Leu Gly Arg Gly Lys Ile Met Ser
195 200 205
Leu Asp Glu Ala Leu Pro Gln Ala Asp Ile Val Val Trp Val Ala Ser
210 215 220
Met Pro Lys Gly Val Glu Ile Asn Pro Gln Val Leu Lys Gln Pro Cys
225 230 235 240
Leu Leu Ile Asp Gly Gly Tyr Pro Lys Asn Leu Gly Thr Lys Val Gln
245 250 255
Tyr Pro Gly Val Tyr Val Leu Asn Gly Gly Ile Val Glu His Ser Leu
260 265 270
Asp Ile Asp Trp Lys Ile Met Lys Ile Val Asn Met Asp Val Pro Ala
275 280 285
Arg Gln Leu Phe Ala Cys Phe Ala Glu Ser Met Leu Leu Glu Phe Glu
290 295 300
Lys Leu Tyr Thr Asn Phe Ser Trp Gly Arg Asn Gln Ile Thr Val Asp
305 310 315 320
Lys Met Glu Gln Ile Gly Gln Ala Ser Val Lys His Gly Phe Arg Pro
325 330 335
Leu Leu Val
<210> 84
<211> 1026
<212> DNA
<213> Synechococcus elongatus
<400> 84
atgttcggtc ttatcggtca tctcaccagt ttggagcagg cccgcgacgt ttctcgcagg 60
atgggctacg acgaatacgc cgatcaagga ttggagtttt ggagtagcgc tcctcctcaa 120
atcgttgatg aaatcacagt caccagtgcc acaggcaagg tgattcacgg tcgctacatc 180
gaatcgtgtt tcttgccgga aatgctggcg gcgcgccgct tcaaaacagc cacgcgcaaa 240
gttctcaatg ccatgtccca tgcccaaaaa cacggcatcg acatctcggc cttggggggc 300
tttacctcga ttattttcga gaatttcgat ttggccagtt tgcggcaagt gcgcgacact 360
accttggagt ttgaacggtt caccaccggc aatactcaca cggcctacgt aatctgtaga 420
caggtggaag ccgctgctaa aacgctgggc atcgacatta cccaagcgac agtagcggtt 480
gtcggcgcga ctggcgatat cggtagcgct gtctgccgct ggctcgacct caaactgggt 540
gtcggtgatt tgatcctgac ggcgcgcaat caggagcgtt tggataacct gcaggctgaa 600
ctcggccggg gcaagattct gcccttggaa gccgctctgc cggaagctga ctttatcgtg 660
tgggtcgcca gtatgcctca gggcgtagtg atcgacccag caaccctgaa gcaaccctgc 720
gtcctaatcg acgggggcta ccccaaaaac ttgggcagca aagtccaagg tgagggcatc 780
tatgtcctca atggcggggt agttgaacat tgcttcgaca tcgactggca gatcatgtcc 840
gctgcagaga tggcgcggcc cgagcgccag atgtttgcct gctttgccga ggcgatgctc 900
ttggaatttg aaggctggca tactaacttc tcctggggcc gcaaccaaat cacgatcgag 960
aagatggaag cgatcggtga ggcatcggtg cgccacggct tccaaccctt ggcattggca 1020
atttga 1026
<210> 85
<211> 340
<212> PRT
<213> Synechococcus elongatus
<400> 85
Met Phe Gly Leu Ile Gly His Leu Thr Ser Leu Glu Gln Ala Arg Asp
1 5 10 15
Val Ser Arg Arg Met Gly Tyr Asp Glu Tyr Ala Asp Gln Gly Leu Glu
20 25 30
Phe Trp Ser Ser Ala Pro Pro Gln Ile Val Asp Glu Ile Thr Val Thr
35 40 45
Ser Ala Thr Gly Lys Val Ile His Gly Arg Tyr Ile Glu Ser Cys Phe
50 55 60
Leu Pro Glu Met Leu Ala Ala Arg Arg Phe Lys Thr Ala Thr Arg Lys
65 70 75 80
Val Leu Asn Ala Met Ser His Ala Gln Lys His Gly Ile Asp Ile Ser
85 90 95
Ala Leu Gly Gly Phe Thr Ser Ile Ile Phe Glu Asn Phe Asp Leu Ala
100 105 110
Ser Leu Arg Gln Val Arg Asp Thr Thr Leu Glu Phe Glu Arg Phe Thr
115 120 125
Thr Gly Asn Thr His Thr Ala Tyr Val Ile Cys Arg Gln Val Glu Ala
130 135 140
Ala Ala Lys Thr Leu Gly Ile Asp Ile Thr Gln Ala Thr Val Ala Val
145 150 155 160
Val Gly Ala Thr Gly Asp Ile Gly Ser Ala Val Cys Arg Trp Leu Asp
165 170 175
Leu Lys Leu Gly Val Gly Asp Leu Ile Leu Thr Ala Arg Asn Gln Glu
180 185 190
Arg Leu Asp Asn Leu Gln Ala Glu Leu Gly Arg Gly Lys Ile Leu Pro
195 200 205
Leu Glu Ala Ala Leu Pro Glu Ala Asp Phe Ile Val Trp Val Ala Ser
210 215 220
Met Pro Gln Gly Val Val Ile Asp Pro Ala Thr Leu Lys Gln Pro Cys
225 230 235 240
Val Leu Ile Asp Gly Gly Tyr Pro Lys Asn Leu Gly Ser Lys Val Gln
245 250 255
Gly Glu Gly Ile Tyr Val Leu Asn Gly Gly Val Val Glu His Cys Phe
260 265 270
Asp Ile Asp Trp Gln Ile Met Ser Ala Ala Glu Met Ala Arg Pro Glu
275 280 285
Arg Gln Met Phe Ala Cys Phe Ala Glu Ala Met Leu Leu Glu Phe Glu
290 295 300
Gly Trp His Thr Asn Phe Ser Trp Gly Arg Asn Gln Ile Thr Ile Glu
305 310 315 320
Lys Met Glu Ala Ile Gly Glu Ala Ser Val Arg His Gly Phe Gln Pro
325 330 335
Leu Ala Leu Ala
340
<210> 86
<211> 1020
<212> DNA
<213> Nostoc sp.
<400> 86
atgtttggtc taattggaca tctgacaagt ttagaacacg ctcaagcggt agctcaagaa 60
ctgggatacc cagaatacgc cgaccaaggg ctagattttt ggtgtagcgc tccaccgcaa 120
atagttgacc acattaaagt tactagtatt actggtgaaa taattgaagg gaggtatgta 180
gaatcttgct ttttaccgga gatgctagcc agtcgtcgga ttaaagccgc aacccgcaaa 240
gtcctcaatg ctatggctca tgctcaaaag aatggcattg atatcacagc tttgggtggt 300
ttctcctcca ttatttttga aaactttaaa ttggagcagt ttagccaagt tcgtaatgtg 360
acactagagt ttgaacgctt cactacaggc aacactcaca cagcatatat tatttgtcgg 420
caggtagaac aagcatcaca acaactcggc attgaactct cccaagcaac agtagctata 480
tgtggggcta ctggtgatat tggtagtgca gttactcgct ggctggatgc taaaacagac 540
gtgaaagaat tgctgttaat cgcccgtaat caagaacgtc tccaagagtt gcaaagcgag 600
ctgggacgcg gtaaaatcat gagccttgat gaagcactgc cccaagctga tatcgtagtt 660
tgggtagcca gtatgcctaa aggtgtggaa attaatcctc aagttttgaa gcaaccctgt 720
ttgctgattg atgggggtta tccgaaaaac ttgggtacaa aagttcagta tcctggtgtt 780
tatgtactga acggcggtat cgtcgaacat tcgctggata ttgactggaa aatcatgaaa 840
atagtcaata tggatgtacc tgcacgccaa ttatttgctt gttttgcgga atctatgctc 900
ttggaatttg agaagttgta cacgaacttt tcttgggggc gcaatcagat taccgtagac 960
aaaatggagc agattggtca agcatcagtg aaacatgggt ttagaccact gctggtttag 1020
<210> 87
<211> 339
<212> PRT
<213> Nostoc sp.
<400> 87
Met Phe Gly Leu Ile Gly His Leu Thr Ser Leu Glu His Ala Gln Ala
1 5 10 15
Val Ala Gln Glu Leu Gly Tyr Pro Glu Tyr Ala Asp Gln Gly Leu Asp
20 25 30
Phe Trp Cys Ser Ala Pro Pro Gln Ile Val Asp His Ile Lys Val Thr
35 40 45
Ser Ile Thr Gly Glu Ile Ile Glu Gly Arg Tyr Val Glu Ser Cys Phe
50 55 60
Leu Pro Glu Met Leu Ala Ser Arg Arg Ile Lys Ala Ala Thr Arg Lys
65 70 75 80
Val Leu Asn Ala Met Ala His Ala Gln Lys Asn Gly Ile Asp Ile Thr
85 90 95
Ala Leu Gly Gly Phe Ser Ser Ile Ile Phe Glu Asn Phe Lys Leu Glu
100 105 110
Gln Phe Ser Gln Val Arg Asn Val Thr Leu Glu Phe Glu Arg Phe Thr
115 120 125
Thr Gly Asn Thr His Thr Ala Tyr Ile Ile Cys Arg Gln Val Glu Gln
130 135 140
Ala Ser Gln Gln Leu Gly Ile Glu Leu Ser Gln Ala Thr Val Ala Ile
145 150 155 160
Cys Gly Ala Thr Gly Asp Ile Gly Ser Ala Val Thr Arg Trp Leu Asp
165 170 175
Ala Lys Thr Asp Val Lys Glu Leu Leu Leu Ile Ala Arg Asn Gln Glu
180 185 190
Arg Leu Gln Glu Leu Gln Ser Glu Leu Gly Arg Gly Lys Ile Met Ser
195 200 205
Leu Asp Glu Ala Leu Pro Gln Ala Asp Ile Val Val Trp Val Ala Ser
210 215 220
Met Pro Lys Gly Val Glu Ile Asn Pro Gln Val Leu Lys Gln Pro Cys
225 230 235 240
Leu Leu Ile Asp Gly Gly Tyr Pro Lys Asn Leu Gly Thr Lys Val Gln
245 250 255
Tyr Pro Gly Val Tyr Val Leu Asn Gly Gly Ile Val Glu His Ser Leu
260 265 270
Asp Ile Asp Trp Lys Ile Met Lys Ile Val Asn Met Asp Val Pro Ala
275 280 285
Arg Gln Leu Phe Ala Cys Phe Ala Glu Ser Met Leu Leu Glu Phe Glu
290 295 300
Lys Leu Tyr Thr Asn Phe Ser Trp Gly Arg Asn Gln Ile Thr Val Asp
305 310 315 320
Lys Met Glu Gln Ile Gly Gln Ala Ser Val Lys His Gly Phe Arg Pro
325 330 335
Leu Leu Val
<210> 88
<211> 3522
<212> DNA
<213> Mycobacterium smegmatis
<400> 88
atgaccagcg atgttcacga cgccacagac ggcgtcaccg aaaccgcact cgacgacgag 60
cagtcgaccc gccgcatcgc cgagctgtac gccaccgatc ccgagttcgc cgccgccgca 120
ccgttgcccg ccgtggtcga cgcggcgcac aaacccgggc tgcggctggc agagatcctg 180
cagaccctgt tcaccggcta cggtgaccgc ccggcgctgg gataccgcgc ccgtgaactg 240
gccaccgacg agggcgggcg caccgtgacg cgtctgctgc cgcggttcga caccctcacc 300
tacgcccagg tgtggtcgcg cgtgcaagcg gtcgccgcgg ccctgcgcca caacttcgcg 360
cagccgatct accccggcga cgccgtcgcg acgatcggtt tcgcgagtcc cgattacctg 420
acgctggatc tcgtatgcgc ctacctgggc ctcgtgagtg ttccgctgca gcacaacgca 480
ccggtcagcc ggctcgcccc gatcctggcc gaggtcgaac cgcggatcct caccgtgagc 540
gccgaatacc tcgacctcgc agtcgaatcc gtgcgggacg tcaactcggt gtcgcagctc 600
gtggtgttcg accatcaccc cgaggtcgac gaccaccgcg acgcactggc ccgcgcgcgt 660
gaacaactcg ccggcaaggg catcgccgtc accaccctgg acgcgatcgc cgacgagggc 720
gccgggctgc cggccgaacc gatctacacc gccgaccatg atcagcgcct cgcgatgatc 780
ctgtacacct cgggttccac cggcgcaccc aagggtgcga tgtacaccga ggcgatggtg 840
gcgcggctgt ggaccatgtc gttcatcacg ggtgacccca cgccggtcat caacgtcaac 900
ttcatgccgc tcaaccacct gggcgggcgc atccccattt ccaccgccgt gcagaacggt 960
ggaaccagtt acttcgtacc ggaatccgac atgtccacgc tgttcgagga tctcgcgctg 1020
gtgcgcccga ccgaactcgg cctggttccg cgcgtcgccg acatgctcta ccagcaccac 1080
ctcgccaccg tcgaccgcct ggtcacgcag ggcgccgacg aactgaccgc cgagaagcag 1140
gccggtgccg aactgcgtga gcaggtgctc ggcggacgcg tgatcaccgg attcgtcagc 1200
accgcaccgc tggccgcgga gatgagggcg ttcctcgaca tcaccctggg cgcacacatc 1260
gtcgacggct acgggctcac cgagaccggc gccgtgacac gcgacggtgt gatcgtgcgg 1320
ccaccggtga tcgactacaa gctgatcgac gttcccgaac tcggctactt cagcaccgac 1380
aagccctacc cgcgtggcga actgctggtc aggtcgcaaa cgctgactcc cgggtactac 1440
aagcgccccg aggtcaccgc gagcgtcttc gaccgggacg gctactacca caccggcgac 1500
gtcatggccg agaccgcacc cgaccacctg gtgtacgtgg accgtcgcaa caacgtcctc 1560
aaactcgcgc agggcgagtt cgtggcggtc gccaacctgg aggcggtgtt ctccggcgcg 1620
gcgctggtgc gccagatctt cgtgtacggc aacagcgagc gcagtttcct tctggccgtg 1680
gtggtcccga cgccggaggc gctcgagcag tacgatccgg ccgcgctcaa ggccgcgctg 1740
gccgactcgc tgcagcgcac cgcacgcgac gccgaactgc aatcctacga ggtgccggcc 1800
gatttcatcg tcgagaccga gccgttcagc gccgccaacg ggctgctgtc gggtgtcgga 1860
aaactgctgc ggcccaacct caaagaccgc tacgggcagc gcctggagca gatgtacgcc 1920
gatatcgcgg ccacgcaggc caaccagttg cgcgaactgc ggcgcgcggc cgccacacaa 1980
ccggtgatcg acaccctcac ccaggccgct gccacgatcc tcggcaccgg gagcgaggtg 2040
gcatccgacg cccacttcac cgacctgggc ggggattccc tgtcggcgct gacactttcg 2100
aacctgctga gcgatttctt cggtttcgaa gttcccgtcg gcaccatcgt gaacccggcc 2160
accaacctcg cccaactcgc ccagcacatc gaggcgcagc gcaccgcggg tgaccgcagg 2220
ccgagtttca ccaccgtgca cggcgcggac gccaccgaga tccgggcgag tgagctgacc 2280
ctggacaagt tcatcgacgc cgaaacgctc cgggccgcac cgggtctgcc caaggtcacc 2340
accgagccac ggacggtgtt gctctcgggc gccaacggct ggctgggccg gttcctcacg 2400
ttgcagtggc tggaacgcct ggcacctgtc ggcggcaccc tcatcacgat cgtgcggggc 2460
cgcgacgacg ccgcggcccg cgcacggctg acccaggcct acgacaccga tcccgagttg 2520
tcccgccgct tcgccgagct ggccgaccgc cacctgcggg tggtcgccgg tgacatcggc 2580
gacccgaatc tgggcctcac acccgagatc tggcaccggc tcgccgccga ggtcgacctg 2640
gtggtgcatc cggcagcgct ggtcaaccac gtgctcccct accggcagct gttcggcccc 2700
aacgtcgtgg gcacggccga ggtgatcaag ctggccctca ccgaacggat caagcccgtc 2760
acgtacctgt ccaccgtgtc ggtggccatg gggatccccg acttcgagga ggacggcgac 2820
atccggaccg tgagcccggt gcgcccgctc gacggcggat acgccaacgg ctacggcaac 2880
agcaagtggg ccggcgaggt gctgctgcgg gaggcccacg atctgtgcgg gctgcccgtg 2940
gcgacgttcc gctcggacat gatcctggcg catccgcgct accgcggtca ggtcaacgtg 3000
ccagacatgt tcacgcgact cctgttgagc ctcttgatca ccggcgtcgc gccgcggtcg 3060
ttctacatcg gagacggtga gcgcccgcgg gcgcactacc ccggcctgac ggtcgatttc 3120
gtggccgagg cggtcacgac gctcggcgcg cagcagcgcg agggatacgt gtcctacgac 3180
gtgatgaacc cgcacgacga cgggatctcc ctggatgtgt tcgtggactg gctgatccgg 3240
gcgggccatc cgatcgaccg ggtcgacgac tacgacgact gggtgcgtcg gttcgagacc 3300
gcgttgaccg cgcttcccga gaagcgccgc gcacagaccg tactgccgct gctgcacgcg 3360
ttccgcgctc cgcaggcacc gttgcgcggc gcacccgaac ccacggaggt gttccacgcc 3420
gcggtgcgca ccgcgaaggt gggcccggga gacatcccgc acctcgacga ggcgctgatc 3480
gacaagtaca tacgcgatct gcgtgagttc ggtctgatct ga 3522
<210> 89
<211> 3582
<212> DNA
<213> Mycobacterium smegmatis
<400> 89
atgggcagca gccatcatca tcatcatcac agcagcggcc tggtgccgcg cggcagccat 60
atgacgagcg atgttcacga cgcgaccgac ggcgttaccg agactgcact ggatgatgag 120
cagagcactc gtcgtattgc agaactgtac gcaacggacc cagagttcgc agcagcagct 180
cctctgccgg ccgttgtcga tgcggcgcac aaaccgggcc tgcgtctggc ggaaatcctg 240
cagaccctgt tcaccggcta cggcgatcgt ccggcgctgg gctatcgtgc acgtgagctg 300
gcgacggacg aaggcggtcg tacggtcacg cgtctgctgc cgcgcttcga taccctgacc 360
tatgcacagg tgtggagccg tgttcaagca gtggctgcag cgttgcgtca caatttcgca 420
caaccgattt acccgggcga cgcggtcgcg actatcggct ttgcgagccc ggactatttg 480
acgctggatc tggtgtgcgc gtatctgggc ctggtcagcg ttcctttgca gcataacgct 540
ccggtgtctc gcctggcccc gattctggcc gaggtggaac cgcgtattct gacggtgagc 600
gcagaatacc tggacctggc ggttgaatcc gtccgtgatg tgaactccgt cagccagctg 660
gttgttttcg accatcatcc ggaagtggac gatcaccgtg acgcactggc tcgcgcacgc 720
gagcagctgg ccggcaaagg tatcgcagtt acgaccctgg atgcgatcgc agacgaaggc 780
gcaggtttgc cggctgagcc gatttacacg gcggatcacg atcagcgtct ggccatgatt 840
ctgtatacca gcggctctac gggtgctccg aaaggcgcga tgtacaccga agcgatggtg 900
gctcgcctgt ggactatgag ctttatcacg ggcgacccga ccccggttat caacgtgaac 960
ttcatgccgc tgaaccatct gggcggtcgt atcccgatta gcaccgccgt gcagaatggc 1020
ggtaccagct acttcgttcc ggaaagcgac atgagcacgc tgtttgagga tctggccctg 1080
gtccgcccta ccgaactggg tctggtgccg cgtgttgcgg acatgctgta ccagcatcat 1140
ctggcgaccg tggatcgcct ggtgacccag ggcgcggacg aactgactgc ggaaaagcag 1200
gccggtgcgg aactgcgtga acaggtcttg ggcggtcgtg ttatcaccgg ttttgtttcc 1260
accgcgccgt tggcggcaga gatgcgtgct tttctggata tcaccttggg tgcacacatc 1320
gttgacggtt acggtctgac cgaaaccggt gcggtcaccc gtgatggtgt gattgttcgt 1380
cctccggtca ttgattacaa gctgatcgat gtgccggagc tgggttactt ctccaccgac 1440
aaaccgtacc cgcgtggcga gctgctggtt cgtagccaaa cgttgactcc gggttactac 1500
aagcgcccag aagtcaccgc gtccgttttc gatcgcgacg gctattacca caccggcgac 1560
gtgatggcag aaaccgcgcc agaccacctg gtgtatgtgg accgccgcaa caatgttctg 1620
aagctggcgc aaggtgaatt tgtcgccgtg gctaacctgg aggccgtttt cagcggcgct 1680
gctctggtcc gccagatttt cgtgtatggt aacagcgagc gcagctttct gttggctgtt 1740
gttgtcccta ccccggaggc gctggagcaa tacgaccctg ccgcattgaa agcagccctg 1800
gcggattcgc tgcagcgtac ggcgcgtgat gccgagctgc agagctatga agtgccggcg 1860
gacttcattg ttgagactga gccttttagc gctgcgaacg gtctgctgag cggtgttggc 1920
aagttgctgc gtccgaattt gaaggatcgc tacggtcagc gtttggagca gatgtacgcg 1980
gacatcgcgg ctacgcaggc gaaccaattg cgtgaactgc gccgtgctgc ggctactcaa 2040
ccggtgatcg acacgctgac gcaagctgcg gcgaccatcc tgggtaccgg cagcgaggtt 2100
gcaagcgacg cacactttac tgatttgggc ggtgattctc tgagcgcgct gacgttgagc 2160
aacttgctgt ctgacttctt tggctttgaa gtcccggttg gcacgattgt taacccagcg 2220
actaatctgg cacagctggc gcaacatatc gaggcgcagc gcacggcggg tgaccgccgt 2280
ccatccttta cgacggtcca cggtgcggat gctacggaaa tccgtgcaag cgaactgact 2340
ctggacaaat tcatcgacgc tgagactctg cgcgcagcac ctggtttgcc gaaggttacg 2400
actgagccgc gtacggtcct gttgagcggt gccaatggtt ggttgggccg cttcctgacc 2460
ctgcagtggc tggaacgttt ggcaccggtt ggcggtaccc tgatcaccat tgtgcgcggt 2520
cgtgacgatg cagcggcacg tgcacgtttg actcaggctt acgatacgga cccagagctg 2580
tcccgccgct tcgctgagtt ggcggatcgc cacttgcgtg tggtggcagg tgatatcggc 2640
gatccgaatc tgggcctgac cccggagatt tggcaccgtc tggcagcaga ggtcgatctg 2700
gtcgttcatc cagcggccct ggtcaaccac gtcctgccgt accgccagct gtttggtccg 2760
aatgttgttg gcaccgccga agttatcaag ttggctctga ccgagcgcat caagcctgtt 2820
acctacctgt ccacggttag cgtcgcgatg ggtattcctg attttgagga ggacggtgac 2880
attcgtaccg tcagcccggt tcgtccgctg gatggtggct atgcaaatgg ctatggcaac 2940
agcaagtggg ctggcgaggt gctgctgcgc gaggcacatg acctgtgtgg cctgccggtt 3000
gcgacgtttc gtagcgacat gattctggcc cacccgcgct accgtggcca agtgaatgtg 3060
ccggacatgt tcacccgtct gctgctgtcc ctgctgatca cgggtgtggc accgcgttcc 3120
ttctacattg gtgatggcga gcgtccgcgt gcacactacc cgggcctgac cgtcgatttt 3180
gttgcggaag cggttactac cctgggtgct cagcaacgtg agggttatgt ctcgtatgac 3240
gttatgaatc cgcacgatga cggtattagc ttggatgtct ttgtggactg gctgattcgt 3300
gcgggccacc caattgaccg tgttgacgac tatgatgact gggtgcgtcg ttttgaaacc 3360
gcgttgaccg ccttgccgga gaaacgtcgt gcgcagaccg ttctgccgct gctgcatgcc 3420
tttcgcgcgc cacaggcgcc gttgcgtggc gcccctgaac cgaccgaagt gtttcatgca 3480
gcggtgcgta ccgctaaagt cggtccgggt gatattccgc acctggatga agccctgatc 3540
gacaagtaca tccgtgacct gcgcgagttc ggtctgattt ag 3582
<210> 90
<211> 1173
<212> PRT
<213> Mycobacterium smegmatis
<400> 90
Met Thr Ser Asp Val His Asp Ala Thr Asp Gly Val Thr Glu Thr Ala
1 5 10 15
Leu Asp Asp Glu Gln Ser Thr Arg Arg Ile Ala Glu Leu Tyr Ala Thr
20 25 30
Asp Pro Glu Phe Ala Ala Ala Ala Pro Leu Pro Ala Val Val Asp Ala
35 40 45
Ala His Lys Pro Gly Leu Arg Leu Ala Glu Ile Leu Gln Thr Leu Phe
50 55 60
Thr Gly Tyr Gly Asp Arg Pro Ala Leu Gly Tyr Arg Ala Arg Glu Leu
65 70 75 80
Ala Thr Asp Glu Gly Gly Arg Thr Val Thr Arg Leu Leu Pro Arg Phe
85 90 95
Asp Thr Leu Thr Tyr Ala Gln Val Trp Ser Arg Val Gln Ala Val Ala
100 105 110
Ala Ala Leu Arg His Asn Phe Ala Gln Pro Ile Tyr Pro Gly Asp Ala
115 120 125
Val Ala Thr Ile Gly Phe Ala Ser Pro Asp Tyr Leu Thr Leu Asp Leu
130 135 140
Val Cys Ala Tyr Leu Gly Leu Val Ser Val Pro Leu Gln His Asn Ala
145 150 155 160
Pro Val Ser Arg Leu Ala Pro Ile Leu Ala Glu Val Glu Pro Arg Ile
165 170 175
Leu Thr Val Ser Ala Glu Tyr Leu Asp Leu Ala Val Glu Ser Val Arg
180 185 190
Asp Val Asn Ser Val Ser Gln Leu Val Val Phe Asp His His Pro Glu
195 200 205
Val Asp Asp His Arg Asp Ala Leu Ala Arg Ala Arg Glu Gln Leu Ala
210 215 220
Gly Lys Gly Ile Ala Val Thr Thr Leu Asp Ala Ile Ala Asp Glu Gly
225 230 235 240
Ala Gly Leu Pro Ala Glu Pro Ile Tyr Thr Ala Asp His Asp Gln Arg
245 250 255
Leu Ala Met Ile Leu Tyr Thr Ser Gly Ser Thr Gly Ala Pro Lys Gly
260 265 270
Ala Met Tyr Thr Glu Ala Met Val Ala Arg Leu Trp Thr Met Ser Phe
275 280 285
Ile Thr Gly Asp Pro Thr Pro Val Ile Asn Val Asn Phe Met Pro Leu
290 295 300
Asn His Leu Gly Gly Arg Ile Pro Ile Ser Thr Ala Val Gln Asn Gly
305 310 315 320
Gly Thr Ser Tyr Phe Val Pro Glu Ser Asp Met Ser Thr Leu Phe Glu
325 330 335
Asp Leu Ala Leu Val Arg Pro Thr Glu Leu Gly Leu Val Pro Arg Val
340 345 350
Ala Asp Met Leu Tyr Gln His His Leu Ala Thr Val Asp Arg Leu Val
355 360 365
Thr Gln Gly Ala Asp Glu Leu Thr Ala Glu Lys Gln Ala Gly Ala Glu
370 375 380
Leu Arg Glu Gln Val Leu Gly Gly Arg Val Ile Thr Gly Phe Val Ser
385 390 395 400
Thr Ala Pro Leu Ala Ala Glu Met Arg Ala Phe Leu Asp Ile Thr Leu
405 410 415
Gly Ala His Ile Val Asp Gly Tyr Gly Leu Thr Glu Thr Gly Ala Val
420 425 430
Thr Arg Asp Gly Val Ile Val Arg Pro Pro Val Ile Asp Tyr Lys Leu
435 440 445
Ile Asp Val Pro Glu Leu Gly Tyr Phe Ser Thr Asp Lys Pro Tyr Pro
450 455 460
Arg Gly Glu Leu Leu Val Arg Ser Gln Thr Leu Thr Pro Gly Tyr Tyr
465 470 475 480
Lys Arg Pro Glu Val Thr Ala Ser Val Phe Asp Arg Asp Gly Tyr Tyr
485 490 495
His Thr Gly Asp Val Met Ala Glu Thr Ala Pro Asp His Leu Val Tyr
500 505 510
Val Asp Arg Arg Asn Asn Val Leu Lys Leu Ala Gln Gly Glu Phe Val
515 520 525
Ala Val Ala Asn Leu Glu Ala Val Phe Ser Gly Ala Ala Leu Val Arg
530 535 540
Gln Ile Phe Val Tyr Gly Asn Ser Glu Arg Ser Phe Leu Leu Ala Val
545 550 555 560
Val Val Pro Thr Pro Glu Ala Leu Glu Gln Tyr Asp Pro Ala Ala Leu
565 570 575
Lys Ala Ala Leu Ala Asp Ser Leu Gln Arg Thr Ala Arg Asp Ala Glu
580 585 590
Leu Gln Ser Tyr Glu Val Pro Ala Asp Phe Ile Val Glu Thr Glu Pro
595 600 605
Phe Ser Ala Ala Asn Gly Leu Leu Ser Gly Val Gly Lys Leu Leu Arg
610 615 620
Pro Asn Leu Lys Asp Arg Tyr Gly Gln Arg Leu Glu Gln Met Tyr Ala
625 630 635 640
Asp Ile Ala Ala Thr Gln Ala Asn Gln Leu Arg Glu Leu Arg Arg Ala
645 650 655
Ala Ala Thr Gln Pro Val Ile Asp Thr Leu Thr Gln Ala Ala Ala Thr
660 665 670
Ile Leu Gly Thr Gly Ser Glu Val Ala Ser Asp Ala His Phe Thr Asp
675 680 685
Leu Gly Gly Asp Ser Leu Ser Ala Leu Thr Leu Ser Asn Leu Leu Ser
690 695 700
Asp Phe Phe Gly Phe Glu Val Pro Val Gly Thr Ile Val Asn Pro Ala
705 710 715 720
Thr Asn Leu Ala Gln Leu Ala Gln His Ile Glu Ala Gln Arg Thr Ala
725 730 735
Gly Asp Arg Arg Pro Ser Phe Thr Thr Val His Gly Ala Asp Ala Thr
740 745 750
Glu Ile Arg Ala Ser Glu Leu Thr Leu Asp Lys Phe Ile Asp Ala Glu
755 760 765
Thr Leu Arg Ala Ala Pro Gly Leu Pro Lys Val Thr Thr Glu Pro Arg
770 775 780
Thr Val Leu Leu Ser Gly Ala Asn Gly Trp Leu Gly Arg Phe Leu Thr
785 790 795 800
Leu Gln Trp Leu Glu Arg Leu Ala Pro Val Gly Gly Thr Leu Ile Thr
805 810 815
Ile Val Arg Gly Arg Asp Asp Ala Ala Ala Arg Ala Arg Leu Thr Gln
820 825 830
Ala Tyr Asp Thr Asp Pro Glu Leu Ser Arg Arg Phe Ala Glu Leu Ala
835 840 845
Asp Arg His Leu Arg Val Val Ala Gly Asp Ile Gly Asp Pro Asn Leu
850 855 860
Gly Leu Thr Pro Glu Ile Trp His Arg Leu Ala Ala Glu Val Asp Leu
865 870 875 880
Val Val His Pro Ala Ala Leu Val Asn His Val Leu Pro Tyr Arg Gln
885 890 895
Leu Phe Gly Pro Asn Val Val Gly Thr Ala Glu Val Ile Lys Leu Ala
900 905 910
Leu Thr Glu Arg Ile Lys Pro Val Thr Tyr Leu Ser Thr Val Ser Val
915 920 925
Ala Met Gly Ile Pro Asp Phe Glu Glu Asp Gly Asp Ile Arg Thr Val
930 935 940
Ser Pro Val Arg Pro Leu Asp Gly Gly Tyr Ala Asn Gly Tyr Gly Asn
945 950 955 960
Ser Lys Trp Ala Gly Glu Val Leu Leu Arg Glu Ala His Asp Leu Cys
965 970 975
Gly Leu Pro Val Ala Thr Phe Arg Ser Asp Met Ile Leu Ala His Pro
980 985 990
Arg Tyr Arg Gly Gln Val Asn Val Pro Asp Met Phe Thr Arg Leu Leu
995 1000 1005
Leu Ser Leu Leu Ile Thr Gly Val Ala Pro Arg Ser Phe Tyr Ile
1010 1015 1020
Gly Asp Gly Glu Arg Pro Arg Ala His Tyr Pro Gly Leu Thr Val
1025 1030 1035
Asp Phe Val Ala Glu Ala Val Thr Thr Leu Gly Ala Gln Gln Arg
1040 1045 1050
Glu Gly Tyr Val Ser Tyr Asp Val Met Asn Pro His Asp Asp Gly
1055 1060 1065
Ile Ser Leu Asp Val Phe Val Asp Trp Leu Ile Arg Ala Gly His
1070 1075 1080
Pro Ile Asp Arg Val Asp Asp Tyr Asp Asp Trp Val Arg Arg Phe
1085 1090 1095
Glu Thr Ala Leu Thr Ala Leu Pro Glu Lys Arg Arg Ala Gln Thr
1100 1105 1110
Val Leu Pro Leu Leu His Ala Phe Arg Ala Pro Gln Ala Pro Leu
1115 1120 1125
Arg Gly Ala Pro Glu Pro Thr Glu Val Phe His Ala Ala Val Arg
1130 1135 1140
Thr Ala Lys Val Gly Pro Gly Asp Ile Pro His Leu Asp Glu Ala
1145 1150 1155
Leu Ile Asp Lys Tyr Ile Arg Asp Leu Arg Glu Phe Gly Leu Ile
1160 1165 1170
<210> 91
<211> 3507
<212> DNA
<213> Mycobacterium smegmatis
<400> 91
atgacgatcg aaacgcgcga agaccgcttc aaccggcgca ttgaccactt gttcgaaacc 60
gacccgcagt tcgccgccgc ccgtcccgac gaggcgatca gcgcggctgc cgccgatccg 120
gagttgcgcc ttcctgccgc ggtcaaacag attctggccg gctatgcgga ccgccctgcg 180
ctgggcaagc gcgccgtcga gttcgtcacc gacgaagaag gccgcaccac cgcgaagctc 240
ctgccccgct tcgacaccat cacctaccgt cagctcgcag gccggatcca ggccgtgacc 300
aatgcctggc acaaccatcc ggtgaatgcc ggtgaccgcg tggccatcct gggtttcacc 360
agtgtcgact acacgacgat cgacatcgcc ctgctcgaac tcggcgccgt gtccgtaccg 420
ctgcagacca gtgcgccggt ggcccaactg cagccgatcg tcgccgagac cgagcccaag 480
gtgatcgcgt cgagcgtcga cttcctcgcc gacgcagtcg ctctcgtcga gtccgggccc 540
gcgccgtcgc gactggtggt gttcgactac agccacgagg tcgacgatca gcgtgaggcg 600
ttcgaggcgg ccaagggcaa gctcgcaggc accggcgtcg tcgtcgagac gatcaccgac 660
gcactggacc gcgggcggtc actcgccgac gcaccgctct acgtgcccga cgaggccgac 720
ccgctgaccc ttctcatcta cacctccggc agcaccggca ctcccaaggg cgcgatgtac 780
cccgagtcca agaccgccac gatgtggcag gccgggtcca aggcccggtg ggacgagacc 840
ctcggcgtga tgccgtcgat caccctgaac ttcatgccca tgagtcacgt catggggcgc 900
ggcatcctgt gcagcacact cgccagcggc ggaaccgcgt acttcgccgc acgcagcgac 960
ctgtccacct tcctggagga cctcgccctc gtgcggccca cgcagctcaa cttcgttcct 1020
cgcatctggg acatgctgtt ccaggagtac cagagccgcc tcgacaaccg ccgcgccgag 1080
ggatccgagg accgagccga agccgcagtc ctcgaagagg tccgcaccca actgctcggc 1140
gggcgattcg tttcggccct gaccggatcg gctcccatct cggcggagat gaagagctgg 1200
gtcgaggacc tgctcgacat gcatctgctg gagggctacg gctccaccga ggccggcgcg 1260
gtgttcatcg acgggcagat ccagcgcccg ccggtcatcg actacaagct ggtcgacgtg 1320
cccgatctcg gctacttcgc cacggaccgg ccctacccgc gcggcgaact tctggtcaag 1380
tccgagcaga tgttccccgg ctactacaag cgtccggaga tcaccgccga gatgttcgac 1440
gaggacgggt actaccgcac cggcgacatc gtcgccgagc tcgggcccga ccatctcgaa 1500
tacctcgacc gccgcaacaa cgtgctgaaa ctgtcgcagg gcgaattcgt cacggtctcc 1560
aagctggagg cggtgttcgg cgacagcccc ctggtacgcc agatctacgt ctacggcaac 1620
agcgcgcggt cctatctgct ggcggtcgtg gtcccgaccg aagaggcact gtcacgttgg 1680
gacggtgacg aactcaagtc gcgcatcagc gactcactgc aggacgcggc acgagccgcc 1740
ggattgcagt cgtatgagat cccgcgtgac ttcctcgtcg agacaacacc tttcacgctg 1800
gagaacggcc tgctgaccgg tatccgcaag ctggcccggc cgaaactgaa ggcgcactac 1860
ggcgaacgcc tcgaacagct ctacaccgac ctggccgagg ggcaggccaa cgagttgcgc 1920
gagttgcgcc gcaacggagc cgaccggccc gtggtcgaga ccgtcagccg cgccgcggtc 1980
gcactgctcg gtgcctccgt cacggatctg cggtccgatg cgcacttcac cgatctgggt 2040
ggagattcgt tgtcggcctt gagcttctcg aacctgttgc acgagatctt cgatgtcgac 2100
gtgccggtcg gcgtcatcgt cagcccggcc accgacctgg caggcgtcgc ggcctacatc 2160
gagggcgaac tgcgcggctc caagcgcccc acatacgcgt cggtgcacgg gcgcgacgcc 2220
accgaggtgc gcgcgcgtga tctcgccctg ggcaagttca tcgacgccaa gaccctgtcc 2280
gccgcgccgg gtctgccgcg ttcgggcacc gagatccgca ccgtgctgct gaccggcgcc 2340
accgggttcc tgggccgcta tctggcgctg gaatggctgg agcgcatgga cctggtggac 2400
ggcaaggtga tctgcctggt gcgcgcccgc agcgacgacg aggcccgggc gcgtctggac 2460
gccacgttcg acaccgggga cgcgacactg ctcgagcact accgcgcgct ggcagccgat 2520
cacctcgagg tgatcgccgg tgacaagggc gaggccgatc tgggtctcga ccacgacacg 2580
tggcagcgac tggccgacac cgtcgatctg atcgtcgatc cggccgccct ggtcaatcac 2640
gtcctgccgt acagccagat gttcggaccc aatgcgctcg gcaccgccga actcatccgg 2700
atcgcgctga ccaccacgat caagccgtac gtgtacgtct cgacgatcgg tgtgggacag 2760
ggcatctccc ccgaggcgtt cgtcgaggac gccgacatcc gcgagatcag cgcgacgcgc 2820
cgggtcgacg actcgtacgc caacggctac ggcaacagca agtgggccgg cgaggtcctg 2880
ctgcgggagg cgcacgactg gtgtggtctg ccggtctcgg tgttccgctg cgacatgatc 2940
ctggccgaca cgacctactc gggtcagctg aacctgccgg acatgttcac ccgcctgatg 3000
ctgagcctcg tggcgaccgg catcgcgccc ggttcgttct acgaactcga tgcggacggc 3060
aaccggcagc gcgcccacta cgacgggctg cccgtggagt tcatcgccga ggcgatctcc 3120
accatcggct cgcaggtcac cgacggattc gagacgttcc acgtgatgaa cccgtacgac 3180
gacggcatcg gcctcgacga gtacgtggac tggctgatcg aggccggcta ccccgtgcac 3240
cgcgtcgacg actacgccac ctggctgagc cggttcgaaa ccgcactgcg ggccctgccg 3300
gaacggcaac gtcaggcctc gctgctgccg ctgctgcaca actatcagca gccctcaccg 3360
cccgtgtgcg gtgccatggc acccaccgac cggttccgtg ccgcggtgca ggacgcgaag 3420
atcggccccg acaaggacat tccgcacgtc acggccgacg tgatcgtcaa gtacatcagc 3480
aacctgcaga tgctcggatt gctgtaa 3507
<210> 92
<211> 1168
<212> PRT
<213> Mycobacterium smegmatis
<400> 92
Met Thr Ile Glu Thr Arg Glu Asp Arg Phe Asn Arg Arg Ile Asp His
1 5 10 15
Leu Phe Glu Thr Asp Pro Gln Phe Ala Ala Ala Arg Pro Asp Glu Ala
20 25 30
Ile Ser Ala Ala Ala Ala Asp Pro Glu Leu Arg Leu Pro Ala Ala Val
35 40 45
Lys Gln Ile Leu Ala Gly Tyr Ala Asp Arg Pro Ala Leu Gly Lys Arg
50 55 60
Ala Val Glu Phe Val Thr Asp Glu Glu Gly Arg Thr Thr Ala Lys Leu
65 70 75 80
Leu Pro Arg Phe Asp Thr Ile Thr Tyr Arg Gln Leu Ala Gly Arg Ile
85 90 95
Gln Ala Val Thr Asn Ala Trp His Asn His Pro Val Asn Ala Gly Asp
100 105 110
Arg Val Ala Ile Leu Gly Phe Thr Ser Val Asp Tyr Thr Thr Ile Asp
115 120 125
Ile Ala Leu Leu Glu Leu Gly Ala Val Ser Val Pro Leu Gln Thr Ser
130 135 140
Ala Pro Val Ala Gln Leu Gln Pro Ile Val Ala Glu Thr Glu Pro Lys
145 150 155 160
Val Ile Ala Ser Ser Val Asp Phe Leu Ala Asp Ala Val Ala Leu Val
165 170 175
Glu Ser Gly Pro Ala Pro Ser Arg Leu Val Val Phe Asp Tyr Ser His
180 185 190
Glu Val Asp Asp Gln Arg Glu Ala Phe Glu Ala Ala Lys Gly Lys Leu
195 200 205
Ala Gly Thr Gly Val Val Val Glu Thr Ile Thr Asp Ala Leu Asp Arg
210 215 220
Gly Arg Ser Leu Ala Asp Ala Pro Leu Tyr Val Pro Asp Glu Ala Asp
225 230 235 240
Pro Leu Thr Leu Leu Ile Tyr Thr Ser Gly Ser Thr Gly Thr Pro Lys
245 250 255
Gly Ala Met Tyr Pro Glu Ser Lys Thr Ala Thr Met Trp Gln Ala Gly
260 265 270
Ser Lys Ala Arg Trp Asp Glu Thr Leu Gly Val Met Pro Ser Ile Thr
275 280 285
Leu Asn Phe Met Pro Met Ser His Val Met Gly Arg Gly Ile Leu Cys
290 295 300
Ser Thr Leu Ala Ser Gly Gly Thr Ala Tyr Phe Ala Ala Arg Ser Asp
305 310 315 320
Leu Ser Thr Phe Leu Glu Asp Leu Ala Leu Val Arg Pro Thr Gln Leu
325 330 335
Asn Phe Val Pro Arg Ile Trp Asp Met Leu Phe Gln Glu Tyr Gln Ser
340 345 350
Arg Leu Asp Asn Arg Arg Ala Glu Gly Ser Glu Asp Arg Ala Glu Ala
355 360 365
Ala Val Leu Glu Glu Val Arg Thr Gln Leu Leu Gly Gly Arg Phe Val
370 375 380
Ser Ala Leu Thr Gly Ser Ala Pro Ile Ser Ala Glu Met Lys Ser Trp
385 390 395 400
Val Glu Asp Leu Leu Asp Met His Leu Leu Glu Gly Tyr Gly Ser Thr
405 410 415
Glu Ala Gly Ala Val Phe Ile Asp Gly Gln Ile Gln Arg Pro Pro Val
420 425 430
Ile Asp Tyr Lys Leu Val Asp Val Pro Asp Leu Gly Tyr Phe Ala Thr
435 440 445
Asp Arg Pro Tyr Pro Arg Gly Glu Leu Leu Val Lys Ser Glu Gln Met
450 455 460
Phe Pro Gly Tyr Tyr Lys Arg Pro Glu Ile Thr Ala Glu Met Phe Asp
465 470 475 480
Glu Asp Gly Tyr Tyr Arg Thr Gly Asp Ile Val Ala Glu Leu Gly Pro
485 490 495
Asp His Leu Glu Tyr Leu Asp Arg Arg Asn Asn Val Leu Lys Leu Ser
500 505 510
Gln Gly Glu Phe Val Thr Val Ser Lys Leu Glu Ala Val Phe Gly Asp
515 520 525
Ser Pro Leu Val Arg Gln Ile Tyr Val Tyr Gly Asn Ser Ala Arg Ser
530 535 540
Tyr Leu Leu Ala Val Val Val Pro Thr Glu Glu Ala Leu Ser Arg Trp
545 550 555 560
Asp Gly Asp Glu Leu Lys Ser Arg Ile Ser Asp Ser Leu Gln Asp Ala
565 570 575
Ala Arg Ala Ala Gly Leu Gln Ser Tyr Glu Ile Pro Arg Asp Phe Leu
580 585 590
Val Glu Thr Thr Pro Phe Thr Leu Glu Asn Gly Leu Leu Thr Gly Ile
595 600 605
Arg Lys Leu Ala Arg Pro Lys Leu Lys Ala His Tyr Gly Glu Arg Leu
610 615 620
Glu Gln Leu Tyr Thr Asp Leu Ala Glu Gly Gln Ala Asn Glu Leu Arg
625 630 635 640
Glu Leu Arg Arg Asn Gly Ala Asp Arg Pro Val Val Glu Thr Val Ser
645 650 655
Arg Ala Ala Val Ala Leu Leu Gly Ala Ser Val Thr Asp Leu Arg Ser
660 665 670
Asp Ala His Phe Thr Asp Leu Gly Gly Asp Ser Leu Ser Ala Leu Ser
675 680 685
Phe Ser Asn Leu Leu His Glu Ile Phe Asp Val Asp Val Pro Val Gly
690 695 700
Val Ile Val Ser Pro Ala Thr Asp Leu Ala Gly Val Ala Ala Tyr Ile
705 710 715 720
Glu Gly Glu Leu Arg Gly Ser Lys Arg Pro Thr Tyr Ala Ser Val His
725 730 735
Gly Arg Asp Ala Thr Glu Val Arg Ala Arg Asp Leu Ala Leu Gly Lys
740 745 750
Phe Ile Asp Ala Lys Thr Leu Ser Ala Ala Pro Gly Leu Pro Arg Ser
755 760 765
Gly Thr Glu Ile Arg Thr Val Leu Leu Thr Gly Ala Thr Gly Phe Leu
770 775 780
Gly Arg Tyr Leu Ala Leu Glu Trp Leu Glu Arg Met Asp Leu Val Asp
785 790 795 800
Gly Lys Val Ile Cys Leu Val Arg Ala Arg Ser Asp Asp Glu Ala Arg
805 810 815
Ala Arg Leu Asp Ala Thr Phe Asp Thr Gly Asp Ala Thr Leu Leu Glu
820 825 830
His Tyr Arg Ala Leu Ala Ala Asp His Leu Glu Val Ile Ala Gly Asp
835 840 845
Lys Gly Glu Ala Asp Leu Gly Leu Asp His Asp Thr Trp Gln Arg Leu
850 855 860
Ala Asp Thr Val Asp Leu Ile Val Asp Pro Ala Ala Leu Val Asn His
865 870 875 880
Val Leu Pro Tyr Ser Gln Met Phe Gly Pro Asn Ala Leu Gly Thr Ala
885 890 895
Glu Leu Ile Arg Ile Ala Leu Thr Thr Thr Ile Lys Pro Tyr Val Tyr
900 905 910
Val Ser Thr Ile Gly Val Gly Gln Gly Ile Ser Pro Glu Ala Phe Val
915 920 925
Glu Asp Ala Asp Ile Arg Glu Ile Ser Ala Thr Arg Arg Val Asp Asp
930 935 940
Ser Tyr Ala Asn Gly Tyr Gly Asn Ser Lys Trp Ala Gly Glu Val Leu
945 950 955 960
Leu Arg Glu Ala His Asp Trp Cys Gly Leu Pro Val Ser Val Phe Arg
965 970 975
Cys Asp Met Ile Leu Ala Asp Thr Thr Tyr Ser Gly Gln Leu Asn Leu
980 985 990
Pro Asp Met Phe Thr Arg Leu Met Leu Ser Leu Val Ala Thr Gly Ile
995 1000 1005
Ala Pro Gly Ser Phe Tyr Glu Leu Asp Ala Asp Gly Asn Arg Gln
1010 1015 1020
Arg Ala His Tyr Asp Gly Leu Pro Val Glu Phe Ile Ala Glu Ala
1025 1030 1035
Ile Ser Thr Ile Gly Ser Gln Val Thr Asp Gly Phe Glu Thr Phe
1040 1045 1050
His Val Met Asn Pro Tyr Asp Asp Gly Ile Gly Leu Asp Glu Tyr
1055 1060 1065
Val Asp Trp Leu Ile Glu Ala Gly Tyr Pro Val His Arg Val Asp
1070 1075 1080
Asp Tyr Ala Thr Trp Leu Ser Arg Phe Glu Thr Ala Leu Arg Ala
1085 1090 1095
Leu Pro Glu Arg Gln Arg Gln Ala Ser Leu Leu Pro Leu Leu His
1100 1105 1110
Asn Tyr Gln Gln Pro Ser Pro Pro Val Cys Gly Ala Met Ala Pro
1115 1120 1125
Thr Asp Arg Phe Arg Ala Ala Val Gln Asp Ala Lys Ile Gly Pro
1130 1135 1140
Asp Lys Asp Ile Pro His Val Thr Ala Asp Val Ile Val Lys Tyr
1145 1150 1155
Ile Ser Asn Leu Gln Met Leu Gly Leu Leu
1160 1165
<210> 93
<211> 1422
<212> DNA
<213> Marinobacter hydrocarbonoclasti
<400> 93
atgaaacgtc tcggaaccct ggacgcctcc tggctggcgg ttgaatctga agacaccccg 60
atgcatgtgg gtacgcttca gattttctca ctgccggaag gcgcaccaga aaccttcctg 120
cgtgacatgg tcactcgaat gaaagaggcc ggcgatgtgg caccaccctg gggatacaaa 180
ctggcctggt ctggtttcct cgggcgcgtg atcgccccgg cctggaaagt cgataaggat 240
atcgatctgg attatcacgt ccggcactca gccctgcctc gccccggcgg ggagcgcgaa 300
ctgggtattc tggtatcccg actgcactct aaccccctgg atttttcccg ccctctttgg 360
gaatgccacg ttattgaagg cctggagaat aaccgttttg ccctttacac caaaatgcac 420
cactcgatga ttgacggcat cagcggcgtg cgactgatgc agagggtgct caccaccgat 480
cccgaacgct gcaatatgcc accgccctgg acggtacgcc cacaccagcg ccgtggtgca 540
aaaaccgaca aagaggccag cgtgcccgca gcggtttccc aggcaatgga cgccctgaag 600
ctccaggcag acatggcccc caggctgtgg caggccggca atcgcctggt gcattcggtt 660
cgacacccgg aagacggact gaccgcgccc ttcactggac cggtttcggt gctcaatcac 720
cgggttaccg cgcagcgacg ttttgccacc cagcattatc aactggaccg gctgaaaaac 780
ctggcccatg cttccggcgg ttccttgaac gacatcgttc tttacctgtg tggcaccgca 840
ttgcggcgct ttctggctga gcagaacaat ctgccagaca ccccgctgac ggctggtata 900
ccggtgaata tccggccggc agacgacgag ggtacgggca cccagatcag ttttatgatt 960
gcctcgctgg ccaccgacga agctgatccg ttgaaccgcc tgcaacagat caaaacctcg 1020
acccgacggg ccaaggagca cctgcagaaa cttccaaaaa gtgccctgac ccagtacacc 1080
atgctgctga tgtcacccta cattctgcaa ttgatgtcag gtctcggggg gaggatgcga 1140
ccagtcttca acgtgaccat ttccaacgtg cccggcccgg aaggcacgct gtattatgaa 1200
ggagcccggc ttgaggccat gtatccggta tcgctaatcg ctcacggcgg cgccctgaac 1260
atcacctgcc tgagctatgc cggatcgctg aatttcggtt ttaccggctg tcgggatacg 1320
ctgccgagca tgcagaaact ggcggtttat accggtgaag ctctggatga gctggaatcg 1380
ctgattctgc cacccaagaa gcgcgcccga acccgcaagt aa 1422
<210> 94
<211> 473
<212> PRT
<213> Marinobacter hydrocarbonoclasti
<400> 94
Met Lys Arg Leu Gly Thr Leu Asp Ala Ser Trp Leu Ala Val Glu Ser
1 5 10 15
Glu Asp Thr Pro Met His Val Gly Thr Leu Gln Ile Phe Ser Leu Pro
20 25 30
Glu Gly Ala Pro Glu Thr Phe Leu Arg Asp Met Val Thr Arg Met Lys
35 40 45
Glu Ala Gly Asp Val Ala Pro Pro Trp Gly Tyr Lys Leu Ala Trp Ser
50 55 60
Gly Phe Leu Gly Arg Val Ile Ala Pro Ala Trp Lys Val Asp Lys Asp
65 70 75 80
Ile Asp Leu Asp Tyr His Val Arg His Ser Ala Leu Pro Arg Pro Gly
85 90 95
Gly Glu Arg Glu Leu Gly Ile Leu Val Ser Arg Leu His Ser Asn Pro
100 105 110
Leu Asp Phe Ser Arg Pro Leu Trp Glu Cys His Val Ile Glu Gly Leu
115 120 125
Glu Asn Asn Arg Phe Ala Leu Tyr Thr Lys Met His His Ser Met Ile
130 135 140
Asp Gly Ile Ser Gly Val Arg Leu Met Gln Arg Val Leu Thr Thr Asp
145 150 155 160
Pro Glu Arg Cys Asn Met Pro Pro Pro Trp Thr Val Arg Pro His Gln
165 170 175
Arg Arg Gly Ala Lys Thr Asp Lys Glu Ala Ser Val Pro Ala Ala Val
180 185 190
Ser Gln Ala Met Asp Ala Leu Lys Leu Gln Ala Asp Met Ala Pro Arg
195 200 205
Leu Trp Gln Ala Gly Asn Arg Leu Val His Ser Val Arg His Pro Glu
210 215 220
Asp Gly Leu Thr Ala Pro Phe Thr Gly Pro Val Ser Val Leu Asn His
225 230 235 240
Arg Val Thr Ala Gln Arg Arg Phe Ala Thr Gln His Tyr Gln Leu Asp
245 250 255
Arg Leu Lys Asn Leu Ala His Ala Ser Gly Gly Ser Leu Asn Asp Ile
260 265 270
Val Leu Tyr Leu Cys Gly Thr Ala Leu Arg Arg Phe Leu Ala Glu Gln
275 280 285
Asn Asn Leu Pro Asp Thr Pro Leu Thr Ala Gly Ile Pro Val Asn Ile
290 295 300
Arg Pro Ala Asp Asp Glu Gly Thr Gly Thr Gln Ile Ser Phe Met Ile
305 310 315 320
Ala Ser Leu Ala Thr Asp Glu Ala Asp Pro Leu Asn Arg Leu Gln Gln
325 330 335
Ile Lys Thr Ser Thr Arg Arg Ala Lys Glu His Leu Gln Lys Leu Pro
340 345 350
Lys Ser Ala Leu Thr Gln Tyr Thr Met Leu Leu Met Ser Pro Tyr Ile
355 360 365
Leu Gln Leu Met Ser Gly Leu Gly Gly Arg Met Arg Pro Val Phe Asn
370 375 380
Val Thr Ile Ser Asn Val Pro Gly Pro Glu Gly Thr Leu Tyr Tyr Glu
385 390 395 400
Gly Ala Arg Leu Glu Ala Met Tyr Pro Val Ser Leu Ile Ala His Gly
405 410 415
Gly Ala Leu Asn Ile Thr Cys Leu Ser Tyr Ala Gly Ser Leu Asn Phe
420 425 430
Gly Phe Thr Gly Cys Arg Asp Thr Leu Pro Ser Met Gln Lys Leu Ala
435 440 445
Val Tyr Thr Gly Glu Ala Leu Asp Glu Leu Glu Ser Leu Ile Leu Pro
450 455 460
Pro Lys Lys Arg Ala Arg Thr Arg Lys
465 470
<210> 95
<211> 1422
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 95
atgaaacgtc tcggaaccct gaacgcctcc tggctggcgg ttgaatctga agacaccccg 60
atgcatgtgg gtacgcttca gattttctca ctgccggaag gcgcaccaga aaccttcctg 120
cgtgacatgg tcactcgaat gaaagaggcc ggcgatgtgg caccaccctg gggatacaaa 180
ctggcctggt ctggtttcct cgggcgcgtg atcgccccgg cctggaaagt cgataaggat 240
atcgatctgg attatcacgt ccggcactca gccctgcctc gccccggcgg ggagcgcgaa 300
ctgggtattc tggtatcccg actgcactct aaccccctgg atttttcccg ccctctttgg 360
gaatgccacg ttattgaagg cctggagaat aaccgttttg ccctttacac caaaatgcac 420
cactcgatga ttgacggcat cagcggcgtg cgactgatgc agagggtgct caccaccgat 480
cccgaacgct gcaatatgcc accgccctgg acggtacgcc cacaccaacg ccgtggtgta 540
aaaaccgaca aagaggccag cgtgcccgca gcggtttccc aggcaatgga cgccctgaag 600
ctccaggcag acatggcccc caggctgtgg caggccggca atcgcctggt gcattcggtt 660
cgacacccgg aagacggact gaccgcgccc ttcactggac cggtttcggt gctcaatcac 720
cgggttaccg cgcagcgacg ttttgccacc cagcattatc aactggaccg gctgaaaaac 780
ctggcccatg cttccggcgg ttccttgaac gacatcgttc tttacctgtg tggcaccgca 840
ttgcggcgct ttctggctga gcagaacaat ctgccagaca ccccgctgac ggctggtata 900
ccggtgaata tccggccggc agacgacgag ggtacgggca cccagatcag ttttatgatt 960
gcctcgctgg ccaccgacga agctgatccg ttgaaccgcc tgcaacagat caaaacctcg 1020
acccgacggg ccaaggagca cctgcagaaa cttccaaaaa gtgccctgac ccagtacacc 1080
atgctgctga tgtcacccta cattctgcaa ttgatgtcag gtctcggggg gaggatgcga 1140
ccattcttca acgtgaccat ttccaacgtg cccggcccgg aaggcacgct gtattatgaa 1200
ggagcccggc ttgaggccat gtatccggta tcgctaatcg ctcacggcgg cgccctgaac 1260
atcacctgcc tgagctatgc cggatcgctg aatttcggtt ttaccggctg tcgggatacg 1320
ctgccgagca tgcagaaact ggcggtttat accggtgaag ctctggatga gctggaatcg 1380
ctgattctgc cacccaagaa gcgcgcccga acccgcaagt aa 1422
<210> 96
<211> 473
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 96
Met Lys Arg Leu Gly Thr Leu Asn Ala Ser Trp Leu Ala Val Glu Ser
1 5 10 15
Glu Asp Thr Pro Met His Val Gly Thr Leu Gln Ile Phe Ser Leu Pro
20 25 30
Glu Gly Ala Pro Glu Thr Phe Leu Arg Asp Met Val Thr Arg Met Lys
35 40 45
Glu Ala Gly Asp Val Ala Pro Pro Trp Gly Tyr Lys Leu Ala Trp Ser
50 55 60
Gly Phe Leu Gly Arg Val Ile Ala Pro Ala Trp Lys Val Asp Lys Asp
65 70 75 80
Ile Asp Leu Asp Tyr His Val Arg His Ser Ala Leu Pro Arg Pro Gly
85 90 95
Gly Glu Arg Glu Leu Gly Ile Leu Val Ser Arg Leu His Ser Asn Pro
100 105 110
Leu Asp Phe Ser Arg Pro Leu Trp Glu Cys His Val Ile Glu Gly Leu
115 120 125
Glu Asn Asn Arg Phe Ala Leu Tyr Thr Lys Met His His Ser Met Ile
130 135 140
Asp Gly Ile Ser Gly Val Arg Leu Met Gln Arg Val Leu Thr Thr Asp
145 150 155 160
Pro Glu Arg Cys Asn Met Pro Pro Pro Trp Thr Val Arg Pro His Gln
165 170 175
Arg Arg Gly Val Lys Thr Asp Lys Glu Ala Ser Val Pro Ala Ala Val
180 185 190
Ser Gln Ala Met Asp Ala Leu Lys Leu Gln Ala Asp Met Ala Pro Arg
195 200 205
Leu Trp Gln Ala Gly Asn Arg Leu Val His Ser Val Arg His Pro Glu
210 215 220
Asp Gly Leu Thr Ala Pro Phe Thr Gly Pro Val Ser Val Leu Asn His
225 230 235 240
Arg Val Thr Ala Gln Arg Arg Phe Ala Thr Gln His Tyr Gln Leu Asp
245 250 255
Arg Leu Lys Asn Leu Ala His Ala Ser Gly Gly Ser Leu Asn Asp Ile
260 265 270
Val Leu Tyr Leu Cys Gly Thr Ala Leu Arg Arg Phe Leu Ala Glu Gln
275 280 285
Asn Asn Leu Pro Asp Thr Pro Leu Thr Ala Gly Ile Pro Val Asn Ile
290 295 300
Arg Pro Ala Asp Asp Glu Gly Thr Gly Thr Gln Ile Ser Phe Met Ile
305 310 315 320
Ala Ser Leu Ala Thr Asp Glu Ala Asp Pro Leu Asn Arg Leu Gln Gln
325 330 335
Ile Lys Thr Ser Thr Arg Arg Ala Lys Glu His Leu Gln Lys Leu Pro
340 345 350
Lys Ser Ala Leu Thr Gln Tyr Thr Met Leu Leu Met Ser Pro Tyr Ile
355 360 365
Leu Gln Leu Met Ser Gly Leu Gly Gly Arg Met Arg Pro Phe Phe Asn
370 375 380
Val Thr Ile Ser Asn Val Pro Gly Pro Glu Gly Thr Leu Tyr Tyr Glu
385 390 395 400
Gly Ala Arg Leu Glu Ala Met Tyr Pro Val Ser Leu Ile Ala His Gly
405 410 415
Gly Ala Leu Asn Ile Thr Cys Leu Ser Tyr Ala Gly Ser Leu Asn Phe
420 425 430
Gly Phe Thr Gly Cys Arg Asp Thr Leu Pro Ser Met Gln Lys Leu Ala
435 440 445
Val Tyr Thr Gly Glu Ala Leu Asp Glu Leu Glu Ser Leu Ile Leu Pro
450 455 460
Pro Lys Lys Arg Ala Arg Thr Arg Lys
465 470
<210> 97
<211> 1422
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 97
atgaaacgtc tcggaaccct gaacgcctcc tggctggcgg ttgaatctga agacaccccg 60
atgcatgtgg gtacgcttca gattttctca ctgccggaag gcgcaccaga aaccttcctg 120
cgtgacatgg tcactcgaat gaaagaggcc ggcgatgtgg caccaccctg gggatacaaa 180
ctggcctggt ctggtttcct cgggcgcgtg atcgccccgg cctggaaagt cgataaggat 240
atcgatctgg attatcacgt ccggcactca gccctgcctc gccccggcgg ggagcgcgaa 300
ctgggtattc tggtatcccg actgcactct aaccccctgg atttttcccg ccctctttgg 360
gaatgccacg ttattgaagg cctggagaat aaccgttttg ccctttacac caaaatgcac 420
cactcgatga ttgacggcat cagcggcgtg cgactgatgc agagggtgct caccaccgat 480
cccgaacgct gcaatatgcc accgccctgg acggtacgcc cacaccaacg ccgtggtgta 540
aaaaccgaca aagaggccag cgtgcccgca gcggtttccc aggcaatgga cgccctgaag 600
ctccaggcag acatggcccc caggctgtgg caggccggca atcgcctggt gcattcggtt 660
cgacacccgg aagacggact gaccgcgccc ttcactggac cggtttcggt gctcaatcac 720
cgggttaccg cgcagcgacg ttttgccacc cagcattatc aactggaccg gctgaaaaac 780
ctggcccatg cttccggcgg ttccttgaac gacatcgttc tttacctgtg tggcaccgca 840
ttgcggcgct ttctggctga gcagaacaat ctgccagaca ccccgctgac ggctggtata 900
ccggtgaata tccggccggc agacgacgag ggtacgggca cccagatcag ttttatgatt 960
gcctcgctgg ccaccgacga agctgatccg ttgaaccgcc tgcaacagat caaaacctcg 1020
acccgacggg ccaaggagca cctgaggaaa cttccaaaaa gtgccctgac ccagtacacc 1080
atgctgctga tgtcacccta cattctgcaa ttgatgtcag gtctcggggg gaggatgcga 1140
ccattcttca acgtgaccat ttccaacgtg cccggcccgg aaggcacgct gtattatgaa 1200
ggagcccggc ttgaggccat gtatccggta tcgctaatcg ctcacggcgg cgccctgaac 1260
atcacctgcc tgagctatgc cggatcgctg aatttcggtt ttaccggctg tcgggatacg 1320
ctgccgagca tgcagaaact ggcggtttat accggtgaag ctctggatga gctggaatcg 1380
ctgattctgc cacccaagaa gcgcgcccga acccgcaagt aa 1422
<210> 98
<211> 473
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 98
Met Lys Arg Leu Gly Thr Leu Asn Ala Ser Trp Leu Ala Val Glu Ser
1 5 10 15
Glu Asp Thr Pro Met His Val Gly Thr Leu Gln Ile Phe Ser Leu Pro
20 25 30
Glu Gly Ala Pro Glu Thr Phe Leu Arg Asp Met Val Thr Arg Met Lys
35 40 45
Glu Ala Gly Asp Val Ala Pro Pro Trp Gly Tyr Lys Leu Ala Trp Ser
50 55 60
Gly Phe Leu Gly Arg Val Ile Ala Pro Ala Trp Lys Val Asp Lys Asp
65 70 75 80
Ile Asp Leu Asp Tyr His Val Arg His Ser Ala Leu Pro Arg Pro Gly
85 90 95
Gly Glu Arg Glu Leu Gly Ile Leu Val Ser Arg Leu His Ser Asn Pro
100 105 110
Leu Asp Phe Ser Arg Pro Leu Trp Glu Cys His Val Ile Glu Gly Leu
115 120 125
Glu Asn Asn Arg Phe Ala Leu Tyr Thr Lys Met His His Ser Met Ile
130 135 140
Asp Gly Ile Ser Gly Val Arg Leu Met Gln Arg Val Leu Thr Thr Asp
145 150 155 160
Pro Glu Arg Cys Asn Met Pro Pro Pro Trp Thr Val Arg Pro His Gln
165 170 175
Arg Arg Gly Val Lys Thr Asp Lys Glu Ala Ser Val Pro Ala Ala Val
180 185 190
Ser Gln Ala Met Asp Ala Leu Lys Leu Gln Ala Asp Met Ala Pro Arg
195 200 205
Leu Trp Gln Ala Gly Asn Arg Leu Val His Ser Val Arg His Pro Glu
210 215 220
Asp Gly Leu Thr Ala Pro Phe Thr Gly Pro Val Ser Val Leu Asn His
225 230 235 240
Arg Val Thr Ala Gln Arg Arg Phe Ala Thr Gln His Tyr Gln Leu Asp
245 250 255
Arg Leu Lys Asn Leu Ala His Ala Ser Gly Gly Ser Leu Asn Asp Ile
260 265 270
Val Leu Tyr Leu Cys Gly Thr Ala Leu Arg Arg Phe Leu Ala Glu Gln
275 280 285
Asn Asn Leu Pro Asp Thr Pro Leu Thr Ala Gly Ile Pro Val Asn Ile
290 295 300
Arg Pro Ala Asp Asp Glu Gly Thr Gly Thr Gln Ile Ser Phe Met Ile
305 310 315 320
Ala Ser Leu Ala Thr Asp Glu Ala Asp Pro Leu Asn Arg Leu Gln Gln
325 330 335
Ile Lys Thr Ser Thr Arg Arg Ala Lys Glu His Leu Arg Lys Leu Pro
340 345 350
Lys Ser Ala Leu Thr Gln Tyr Thr Met Leu Leu Met Ser Pro Tyr Ile
355 360 365
Leu Gln Leu Met Ser Gly Leu Gly Gly Arg Met Arg Pro Phe Phe Asn
370 375 380
Val Thr Ile Ser Asn Val Pro Gly Pro Glu Gly Thr Leu Tyr Tyr Glu
385 390 395 400
Gly Ala Arg Leu Glu Ala Met Tyr Pro Val Ser Leu Ile Ala His Gly
405 410 415
Gly Ala Leu Asn Ile Thr Cys Leu Ser Tyr Ala Gly Ser Leu Asn Phe
420 425 430
Gly Phe Thr Gly Cys Arg Asp Thr Leu Pro Ser Met Gln Lys Leu Ala
435 440 445
Val Tyr Thr Gly Glu Ala Leu Asp Glu Leu Glu Ser Leu Ile Leu Pro
450 455 460
Pro Lys Lys Arg Ala Arg Thr Arg Lys
465 470
<210> 99
<211> 1422
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 99
atgaaacgtc tcggaaccct gaacgcctcc tggctggcgg ttgaatctga agacaccccg 60
atgcatgtgg gtacgcttca gattttctca ctgccggaag gcgcaccaga aaccttcctg 120
cgtgacatgg tcactcgaat gaaagaggcc ggcgatgtgg caccaccctg gggatacaaa 180
ctggcctggt ctggtttcct cgggcgcgtg atcgccccgg cctggaaagt cgataaggat 240
atcgatctgg attatcacgt ccggcactca gccctgcctc gccccggcgg ggagcgcgaa 300
ctgggtattc tggtatcccg actgcactct aaccccctgg atttttcccg ccctctttgg 360
gaatgccacg ttattgaagg cctggagaat aaccgttttg ccctttacac caaaatgcac 420
cactcgatga ttgacggcat cagcggcgtg cgactgatgc agagggtgct caccaccgat 480
cccgaacgct gcaatatgcc accgccctgg acggtacgcc cacaccaacg ccgtggtgta 540
aaaaccgaca aagaggccag cgtgcccgca gcggtttccc aggcaatgga cgccctgaag 600
ctccaggcag acatggcccc caggctgtgg caggccggca atcgcctggt gcattcggtt 660
cgacacccgg aagacggact gaccgcgccc ttcactggac cggtttcggt gctcaatcac 720
cgggttaccg cgcagcgacg ttttgccacc cagcattatc aactggaccg gctgaaaaac 780
ctggcccatg cttccggcgg ttccttgaac gacatcgttc tttacctgtg tggcaccgca 840
ttgcggcgct ttctggctga gcagaacaat ctgccagaca ccccgctgac ggctggtata 900
ccggtgaata tccggccggc agacgacgag ggtacgggca cccagatcag ttttatgatt 960
gcctcgctgg ccaccgacga agctgatccg ttgaaccgcc tgcaacagat caaaacctcg 1020
acccgacggg ccaaggagca cctgcagaaa cttccaaaaa gtgccctgac ccagtacacc 1080
atgctgctga tgtcacccta cattctgcaa ttgatgtcag gtctcggggg gaggatgcga 1140
ccattcttca acgtgaccat ttccaacgtg cccggcccgg aaggcacgct gtattatgaa 1200
ggagcccggc ttgaggccat gtatccggta tcgctaatcg ctcacggcgg cgccctgaac 1260
atcacctgcc tgagctatgc cggatcgctg aatttcggtt ttaccggctg tcgggatacg 1320
ctgccgagca tgcagaaact ggcggtttat accggtgaag ctctggatga gctggaatcg 1380
ctgattctgc cacccaagaa gcgcgcccga acccgcaagt aa 1422
<210> 100
<211> 473
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 100
Met Lys Arg Leu Gly Thr Leu Asn Ala Ser Trp Leu Ala Val Glu Ser
1 5 10 15
Glu Asp Thr Pro Met His Val Gly Thr Leu Gln Ile Phe Ser Leu Pro
20 25 30
Glu Gly Ala Pro Glu Thr Phe Leu Arg Asp Met Val Thr Arg Met Lys
35 40 45
Glu Ala Gly Asp Val Ala Pro Pro Trp Gly Tyr Lys Leu Ala Trp Ser
50 55 60
Gly Phe Leu Gly Arg Val Ile Ala Pro Ala Trp Lys Val Asp Lys Asp
65 70 75 80
Ile Asp Leu Asp Tyr His Val Arg His Ser Ala Leu Pro Arg Pro Gly
85 90 95
Gly Glu Arg Glu Leu Gly Ile Leu Val Ser Arg Leu His Ser Asn Pro
100 105 110
Leu Asp Phe Ser Arg Pro Leu Trp Glu Cys His Val Ile Glu Gly Leu
115 120 125
Glu Asn Asn Arg Phe Ala Leu Tyr Thr Lys Met His His Ser Met Ile
130 135 140
Asp Gly Ile Ser Gly Val Arg Leu Met Gln Arg Val Leu Thr Thr Asp
145 150 155 160
Pro Glu Arg Cys Asn Met Pro Pro Pro Trp Thr Val Arg Pro His Gln
165 170 175
Arg Arg Gly Val Lys Thr Asp Lys Glu Ala Ser Val Pro Ala Ala Val
180 185 190
Ser Gln Ala Met Asp Ala Leu Lys Leu Gln Ala Asp Met Ala Pro Arg
195 200 205
Leu Trp Gln Ala Gly Asn Arg Leu Val His Ser Val Arg His Pro Glu
210 215 220
Asp Gly Leu Thr Ala Pro Phe Thr Gly Pro Val Ser Val Leu Asn His
225 230 235 240
Arg Val Thr Ala Gln Arg Arg Phe Ala Thr Gln His Tyr Gln Leu Asp
245 250 255
Arg Leu Lys Asn Leu Ala His Ala Ser Gly Gly Ser Leu Asn Asp Ile
260 265 270
Val Leu Tyr Leu Cys Gly Thr Ala Leu Arg Arg Phe Leu Ala Glu Gln
275 280 285
Asn Asn Leu Pro Asp Thr Pro Leu Thr Ala Gly Ile Pro Val Asn Ile
290 295 300
Arg Pro Ala Asp Asp Glu Gly Thr Gly Thr Gln Ile Ser Phe Met Ile
305 310 315 320
Ala Ser Leu Ala Thr Asp Glu Ala Asp Pro Leu Asn Arg Leu Gln Gln
325 330 335
Ile Lys Thr Ser Thr Arg Arg Ala Lys Glu His Leu Gln Lys Leu Pro
340 345 350
Lys Ser Ala Leu Thr Gln Tyr Thr Met Leu Leu Met Ser Pro Tyr Ile
355 360 365
Leu Gln Leu Met Ser Gly Leu Gly Gly Arg Met Arg Pro Phe Phe Asn
370 375 380
Val Thr Ile Ser Asn Val Pro Gly Pro Glu Gly Thr Leu Tyr Tyr Glu
385 390 395 400
Gly Ala Arg Leu Glu Ala Met Tyr Pro Val Ser Leu Ile Ala His Gly
405 410 415
Gly Ala Leu Asn Ile Thr Cys Leu Ser Tyr Ala Gly Ser Leu Asn Phe
420 425 430
Gly Phe Thr Gly Cys Arg Asp Thr Leu Pro Ser Met Gln Lys Leu Ala
435 440 445
Val Tyr Thr Gly Glu Ala Leu Asp Glu Leu Glu Ser Leu Ile Leu Pro
450 455 460
Pro Lys Lys Arg Ala Arg Thr Arg Lys
465 470
<210> 101
<211> 1422
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 101
atgaaacgtc tcggaaccct gaacgcctcc tggctggcgg ttgaatctga agacaccccg 60
atgcatgtgg gtacgcttca gattttctca ctgccggaag gcgcaccaga aaccttcctg 120
cgtgacatgg tcactcgaat gaaagaggcc ggcgatgtgg caccaccctg gggatacaaa 180
ctggcctggt ctggtttcct cgggcgcgtg atcgccccgg cctggaaagt cgataaggat 240
atcgatctgg attatcacgt ccggcactca gccctgcctc gccccggcgg ggagcgcgaa 300
ctgggtattc tggtatcccg actgcactct aaccccctgg atttttcccg ccctctttgg 360
gaatgccacg ttattgaagg cctggagaat aaccgttttg ccctttacac caaaatgcac 420
cactcgatga ttgacggcat cagcggcgtg cgactgatgc agagggtgct caccaccgat 480
cccgaacgct gcaatatgcc accgccctgg acggtacgcc cacaccaacg ccgtggtgta 540
aaaaccgaca aagaggccag cgtgcccgca gcggtttccc aggcaatgga cgccctgaag 600
ctccaggcag acatggcccc caggctgtgg caggccggca atcgcctggt gcattcggtt 660
cgacacccgg aagacggact gaccgcgccc ttcactggac cggtttcggt gctcaatcac 720
cgggttaccg cgcagcgacg ttttgccacc cagcattatc aactggaccg gctgaaaaac 780
ctggcccatg cttccggcgg ttccttgaac gacatcgtgc tttacctgtg tggcaccgca 840
ttgcggcgct ttctggctga gcagaacaat ctgccagaca ccccgctgac ggctggtata 900
ccggtgaata tccggccggc agacgacgag ggtacgggca cccagatcag ttttatgatt 960
gcctcgctgg ccaccgacga agctgatccg ttgaaccgcc tgcaacagat caaaacctcg 1020
acccgacggg ccaaggagca cctgaggaaa cttccaaaaa gtgccctgac ccagtacacc 1080
atgctgctga tgtcacccta cattctgcaa ttgatgtcag gtctcggggg gaggatgcga 1140
ccattcttca acgtgaccat ttccaacgtg cccggcccgg aaggcacgct gtattatgaa 1200
ggagcccggc ttgaggccat gtatccggta tcgctaatcg ctcacggcgg cgccctgaac 1260
atcacctgcc tgagctatgc cggatcgctg aatttcggtt ttaccggctg tcgggatacg 1320
ctgccgagca tgcagaaact ggcggtttat accggtgaag ctctggatga gctggaatcg 1380
ctgattctgc cacccaagaa gcgcgcccga acccgcaagt aa 1422
<210> 102
<211> 473
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 102
Met Lys Arg Leu Gly Thr Leu Asn Ala Ser Trp Leu Ala Val Glu Ser
1 5 10 15
Glu Asp Thr Pro Met His Val Gly Thr Leu Gln Ile Phe Ser Leu Pro
20 25 30
Glu Gly Ala Pro Glu Thr Phe Leu Arg Asp Met Val Thr Arg Met Lys
35 40 45
Glu Ala Gly Asp Val Ala Pro Pro Trp Gly Tyr Lys Leu Ala Trp Ser
50 55 60
Gly Phe Leu Gly Arg Val Ile Ala Pro Ala Trp Lys Val Asp Lys Asp
65 70 75 80
Ile Asp Leu Asp Tyr His Val Arg His Ser Ala Leu Pro Arg Pro Gly
85 90 95
Gly Glu Arg Glu Leu Gly Ile Leu Val Ser Arg Leu His Ser Asn Pro
100 105 110
Leu Asp Phe Ser Arg Pro Leu Trp Glu Cys His Val Ile Glu Gly Leu
115 120 125
Glu Asn Asn Arg Phe Ala Leu Tyr Thr Lys Met His His Ser Met Ile
130 135 140
Asp Gly Ile Ser Gly Val Arg Leu Met Gln Arg Val Leu Thr Thr Asp
145 150 155 160
Pro Glu Arg Cys Asn Met Pro Pro Pro Trp Thr Val Arg Pro His Gln
165 170 175
Arg Arg Gly Val Lys Thr Asp Lys Glu Ala Ser Val Pro Ala Ala Val
180 185 190
Ser Gln Ala Met Asp Ala Leu Lys Leu Gln Ala Asp Met Ala Pro Arg
195 200 205
Leu Trp Gln Ala Gly Asn Arg Leu Val His Ser Val Arg His Pro Glu
210 215 220
Asp Gly Leu Thr Ala Pro Phe Thr Gly Pro Val Ser Val Leu Asn His
225 230 235 240
Arg Val Thr Ala Gln Arg Arg Phe Ala Thr Gln His Tyr Gln Leu Asp
245 250 255
Arg Leu Lys Asn Leu Ala His Ala Ser Gly Gly Ser Leu Asn Asp Ile
260 265 270
Val Leu Tyr Leu Cys Gly Thr Ala Leu Arg Arg Phe Leu Ala Glu Gln
275 280 285
Asn Asn Leu Pro Asp Thr Pro Leu Thr Ala Gly Ile Pro Val Asn Ile
290 295 300
Arg Pro Ala Asp Asp Glu Gly Thr Gly Thr Gln Ile Ser Phe Met Ile
305 310 315 320
Ala Ser Leu Ala Thr Asp Glu Ala Asp Pro Leu Asn Arg Leu Gln Gln
325 330 335
Ile Lys Thr Ser Thr Arg Arg Ala Lys Glu His Leu Arg Lys Leu Pro
340 345 350
Lys Ser Ala Leu Thr Gln Tyr Thr Met Leu Leu Met Ser Pro Tyr Ile
355 360 365
Leu Gln Leu Met Ser Gly Leu Gly Gly Arg Met Arg Pro Phe Phe Asn
370 375 380
Val Thr Ile Ser Asn Val Pro Gly Pro Glu Gly Thr Leu Tyr Tyr Glu
385 390 395 400
Gly Ala Arg Leu Glu Ala Met Tyr Pro Val Ser Leu Ile Ala His Gly
405 410 415
Gly Ala Leu Asn Ile Thr Cys Leu Ser Tyr Ala Gly Ser Leu Asn Phe
420 425 430
Gly Phe Thr Gly Cys Arg Asp Thr Leu Pro Ser Met Gln Lys Leu Ala
435 440 445
Val Tyr Thr Gly Glu Ala Leu Asp Glu Leu Glu Ser Leu Ile Leu Pro
450 455 460
Pro Lys Lys Arg Ala Arg Thr Arg Lys
465 470
<210> 103
<211> 1422
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 103
atgaaacgtc tcggaaccct gaacgcctcc tggctggcgg ttgaatctga agacaccccg 60
atgcatgtgg gtacgcttca gattttctca ctgccggaag gcgcaccaga aaccttcctg 120
cgtgacatgg tcactcgaat gaaagaggcc ggcgatgtgg caccaccctg gggatacaaa 180
ctggcctggt ctggtttcct cgggcgcgtg atcgccccgg cctggaaagt cgataaggat 240
atcgatctgg attatcacgt ccgacactca gccctgcctc gccccggcgg ggagcgcgaa 300
ctgggtattc tggtatcccg actgcactct aaccccctgg atttttcccg ccctctttgg 360
gaatgccacg ttattgaagg cctggagaat aaccgttttg ccctttacac caaaatgcac 420
cactcgatga ttgacggcat cagcggcgtg cgactgatgc agagggtgct caccaccgat 480
cccgaacgct gcaatatgcc accgccctgg acggtacgcc cacaccaacg ccgtggtgta 540
aaaaccgaca aagaggccag caggcccgca gcggtttccc aggcaatgga cgccctgaag 600
ctccaggcag acatggcccc caggctgtgg caggccgcga atcgcctggt gcattcggtt 660
cgacacccgg aagacggact gaccgcgccc ttcactggac cggtttcggt gctcaatcac 720
cgggttaccg cgcagcgacg ttttgccacc cagcattatc aactggaccg gctgaaaaac 780
ctggcccatg cttccggcgg ttccttgaac gacatcgttc tttacctgtg tggcaccgca 840
ttgcggcgct ttctggctga gcagaacaat ctgccagaca ccccgctgac ggctggtata 900
ccggtgaata tccggccggc agacgacgag ggtacgggca cccagatcag ttttatgatt 960
gcctcgctgg ccaccgacga agctgatccg ttgaaccgcc tgcaacagat caaaacctcg 1020
acccgacggg ccaaggagca cctgcagaaa cttccaaaaa gtgccctgac cgtgtacacc 1080
atgctgctga tgtcacccta cattctgcaa ttgatgtcag gtctcggggg gaggatgcga 1140
ccattcttca acgtgaccat ttccaacgtg cccggcccgg aaggcacgct gtattatgaa 1200
ggagcccggc ttgaggccat gtatccggta tcgctaatcg ctcacggcgg cgccctgaac 1260
atcacctgcc tgagctatgc cggatcgctg aatttcggtt ttaccggctg tcgggatacg 1320
ctgccgagcg gccagaaact ggcggtttat accggtgaag ctctggatga gctggaatcg 1380
ctgattctgc cacccaagaa gcgcgcccga acccgcaagt aa 1422
<210> 104
<211> 473
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 104
Met Lys Arg Leu Gly Thr Leu Asn Ala Ser Trp Leu Ala Val Glu Ser
1 5 10 15
Glu Asp Thr Pro Met His Val Gly Thr Leu Gln Ile Phe Ser Leu Pro
20 25 30
Glu Gly Ala Pro Glu Thr Phe Leu Arg Asp Met Val Thr Arg Met Lys
35 40 45
Glu Ala Gly Asp Val Ala Pro Pro Trp Gly Tyr Lys Leu Ala Trp Ser
50 55 60
Gly Phe Leu Gly Arg Val Ile Ala Pro Ala Trp Lys Val Asp Lys Asp
65 70 75 80
Ile Asp Leu Asp Tyr His Val Arg His Ser Ala Leu Pro Arg Pro Gly
85 90 95
Gly Glu Arg Glu Leu Gly Ile Leu Val Ser Arg Leu His Ser Asn Pro
100 105 110
Leu Asp Phe Ser Arg Pro Leu Trp Glu Cys His Val Ile Glu Gly Leu
115 120 125
Glu Asn Asn Arg Phe Ala Leu Tyr Thr Lys Met His His Ser Met Ile
130 135 140
Asp Gly Ile Ser Gly Val Arg Leu Met Gln Arg Val Leu Thr Thr Asp
145 150 155 160
Pro Glu Arg Cys Asn Met Pro Pro Pro Trp Thr Val Arg Pro His Gln
165 170 175
Arg Arg Gly Val Lys Thr Asp Lys Glu Ala Ser Arg Pro Ala Ala Val
180 185 190
Ser Gln Ala Met Asp Ala Leu Lys Leu Gln Ala Asp Met Ala Pro Arg
195 200 205
Leu Trp Gln Ala Ala Asn Arg Leu Val His Ser Val Arg His Pro Glu
210 215 220
Asp Gly Leu Thr Ala Pro Phe Thr Gly Pro Val Ser Val Leu Asn His
225 230 235 240
Arg Val Thr Ala Gln Arg Arg Phe Ala Thr Gln His Tyr Gln Leu Asp
245 250 255
Arg Leu Lys Asn Leu Ala His Ala Ser Gly Gly Ser Leu Asn Asp Ile
260 265 270
Val Leu Tyr Leu Cys Gly Thr Ala Leu Arg Arg Phe Leu Ala Glu Gln
275 280 285
Asn Asn Leu Pro Asp Thr Pro Leu Thr Ala Gly Ile Pro Val Asn Ile
290 295 300
Arg Pro Ala Asp Asp Glu Gly Thr Gly Thr Gln Ile Ser Phe Met Ile
305 310 315 320
Ala Ser Leu Ala Thr Asp Glu Ala Asp Pro Leu Asn Arg Leu Gln Gln
325 330 335
Ile Lys Thr Ser Thr Arg Arg Ala Lys Glu His Leu Gln Lys Leu Pro
340 345 350
Lys Ser Ala Leu Thr Val Tyr Thr Met Leu Leu Met Ser Pro Tyr Ile
355 360 365
Leu Gln Leu Met Ser Gly Leu Gly Gly Arg Met Arg Pro Phe Phe Asn
370 375 380
Val Thr Ile Ser Asn Val Pro Gly Pro Glu Gly Thr Leu Tyr Tyr Glu
385 390 395 400
Gly Ala Arg Leu Glu Ala Met Tyr Pro Val Ser Leu Ile Ala His Gly
405 410 415
Gly Ala Leu Asn Ile Thr Cys Leu Ser Tyr Ala Gly Ser Leu Asn Phe
420 425 430
Gly Phe Thr Gly Cys Arg Asp Thr Leu Pro Ser Gly Gln Lys Leu Ala
435 440 445
Val Tyr Thr Gly Glu Ala Leu Asp Glu Leu Glu Ser Leu Ile Leu Pro
450 455 460
Pro Lys Lys Arg Ala Arg Thr Arg Lys
465 470
<210> 105
<211> 1422
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 105
atgaaacgtc tcggatccct ggacgcctcc tggctggcgg ttgaaggtga agacaccccg 60
atgcatgtgg gtacgcttca gattttctca ctgccggaag gcgcaccaga aaccttcctg 120
cgtgacatgg tcactcgaat gaaagaggcc ggcgatgtgg caccaccctg gggatacaaa 180
ctggcctggt ctggtttcct cgggcgcgtg atcgccccgg cctggaaagt cgataaggat 240
atcgatctgg attatcacgt ccggcactca gccctgcctc gccccggcgg ggagcgcgaa 300
ctgggtattc tggtatcccg actgcactct aacagtctgg atttttcccg ccctctttgg 360
gaatgccacg ttattgaagg cctggagaat aaccgttttg ccctttacac caaaatgcac 420
cactcgatga ttgacggcat cagcggcgtg cgactgatgc agagggtgct caccaccgat 480
cccgaacgct gcaatatgcc accgccctgg acgcgccgcc cacaccagcg ccgtggtgca 540
aaaaccgaca aagaggccag cgtgcgggca gcggtttccc aggcaatgga cgccctgaag 600
ctccaggcag acatggcccc caggctgtgg caggccggca atcgcctggt gcattcggtt 660
cgacacccgg aagacggact gaccgcgccc ttcactggac cggtttcggt gctcaatcac 720
cgggttaccg cgcagcgacg ttttgccacc cagcattatc aactggaccg gctgaaaaac 780
ctggcccatg cttccggcgg ttccttgaac gacatcgttc tttacctgtg tggcaccgca 840
ttgcggcgct ttctggctga gcagaacaat ctgccagaca ccccgctgac ggctggtata 900
ccggtgaata tccggccggc agacgacgag ggtacgggca cccagatcag ttggatgatt 960
gcctcgctgg ccaccgacga agctgatccg ttgaaccgcc tgcaacagat caaaacctcg 1020
acccgacggg ccaaggagca cctgcagaaa cttccaaaaa cggccctgac ccagtacacc 1080
atgctgctga tgtcacccta cattctgcaa ttgatgtcag gtctcggggg gaggatgcga 1140
ccagtcttca acgtgaccat ttccaacgtg cccggcccgg aaggcacgct gtattatgaa 1200
ggagcccggc ttgaggccat gtatccgttg tcgctaatcg ctcacggcgg cgccctgaac 1260
atcacctgcc tgagctatgc cggatcgctg aatttcggtt ttaccggctg tcgggatacg 1320
ctgccgggga tgcagaaact ggcggtttat accggtgaag ctctggatga gctggaatcg 1380
ctgattctgc cacccaagaa gcgcgcccga acccgcaagt aa 1422
<210> 106
<211> 473
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 106
Met Lys Arg Leu Gly Ser Leu Asp Ala Ser Trp Leu Ala Val Glu Gly
1 5 10 15
Glu Asp Thr Pro Met His Val Gly Thr Leu Gln Ile Phe Ser Leu Pro
20 25 30
Glu Gly Ala Pro Glu Thr Phe Leu Arg Asp Met Val Thr Arg Met Lys
35 40 45
Glu Ala Gly Asp Val Ala Pro Pro Trp Gly Tyr Lys Leu Ala Trp Ser
50 55 60
Gly Phe Leu Gly Arg Val Ile Ala Pro Ala Trp Lys Val Asp Lys Asp
65 70 75 80
Ile Asp Leu Asp Tyr His Val Arg His Ser Ala Leu Pro Arg Pro Gly
85 90 95
Gly Glu Arg Glu Leu Gly Ile Leu Val Ser Arg Leu His Ser Asn Ser
100 105 110
Leu Asp Phe Ser Arg Pro Leu Trp Glu Cys His Val Ile Glu Gly Leu
115 120 125
Glu Asn Asn Arg Phe Ala Leu Tyr Thr Lys Met His His Ser Met Ile
130 135 140
Asp Gly Ile Ser Gly Val Arg Leu Met Gln Arg Val Leu Thr Thr Asp
145 150 155 160
Pro Glu Arg Cys Asn Met Pro Pro Pro Trp Thr Arg Arg Pro His Gln
165 170 175
Arg Arg Gly Ala Lys Thr Asp Lys Glu Ala Ser Val Arg Ala Ala Val
180 185 190
Ser Gln Ala Met Asp Ala Leu Lys Leu Gln Ala Asp Met Ala Pro Arg
195 200 205
Leu Trp Gln Ala Gly Asn Arg Leu Val His Ser Val Arg His Pro Glu
210 215 220
Asp Gly Leu Thr Ala Pro Phe Thr Gly Pro Val Ser Val Leu Asn His
225 230 235 240
Arg Val Thr Ala Gln Arg Arg Phe Ala Thr Gln His Tyr Gln Leu Asp
245 250 255
Arg Leu Lys Asn Leu Ala His Ala Ser Gly Gly Ser Leu Asn Asp Ile
260 265 270
Val Leu Tyr Leu Cys Gly Thr Ala Leu Arg Arg Phe Leu Ala Glu Gln
275 280 285
Asn Asn Leu Pro Asp Thr Pro Leu Thr Ala Gly Ile Pro Val Asn Ile
290 295 300
Arg Pro Ala Asp Asp Glu Gly Thr Gly Thr Gln Ile Ser Trp Met Ile
305 310 315 320
Ala Ser Leu Ala Thr Asp Glu Ala Asp Pro Leu Asn Arg Leu Gln Gln
325 330 335
Ile Lys Thr Ser Thr Arg Arg Ala Lys Glu His Leu Gln Lys Leu Pro
340 345 350
Lys Thr Ala Leu Thr Gln Tyr Thr Met Leu Leu Met Ser Pro Tyr Ile
355 360 365
Leu Gln Leu Met Ser Gly Leu Gly Gly Arg Met Arg Pro Val Phe Asn
370 375 380
Val Thr Ile Ser Asn Val Pro Gly Pro Glu Gly Thr Leu Tyr Tyr Glu
385 390 395 400
Gly Ala Arg Leu Glu Ala Met Tyr Pro Leu Ser Leu Ile Ala His Gly
405 410 415
Gly Ala Leu Asn Ile Thr Cys Leu Ser Tyr Ala Gly Ser Leu Asn Phe
420 425 430
Gly Phe Thr Gly Cys Arg Asp Thr Leu Pro Gly Met Gln Lys Leu Ala
435 440 445
Val Tyr Thr Gly Glu Ala Leu Asp Glu Leu Glu Ser Leu Ile Leu Pro
450 455 460
Pro Lys Lys Arg Ala Arg Thr Arg Lys
465 470
<210> 107
<211> 1422
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 107
atgaaacgtc tcggatccct ggacgcctcc tggctggcgg ttgaaggtga agacaccccg 60
atgcatgtgg gtacgcttca gattttctca ctgccggaag gcgcaccaga aaccttcctg 120
cgtgacatgg tcactcgaat gaaagaggcc ggcgatgtgg caccaccctg gggatacaaa 180
ctggcctggt ctggtttcct cgggcgcgtg atcgccccgg cctggaaagt cgatttcgat 240
atcgatctgg attatcacgt ccggcactca gccctgcctc gccccggcgg ggagcgcgaa 300
ctgggtattc tggtatcccg actgcactct aacagtctgg atttttcccg ccctctttgg 360
gaatgccacg ttattgaagg cctggagaat aaccgttttg ccctttacac caaaatgcac 420
cactcgatga ttgacggcat cagcggcgtg cgactgatgc agagggtgct caccaccgat 480
cccgaacgct gcaatatgcc accgccctgg acgcgccgcc cacaccagcg ccgtggtgca 540
aaaaccgaca aagaggccag cgtgcgggca gcggttgtgc aggcaatgga cgccctgaag 600
ctccaggcag acatggcccc caggctgtgg caggccggca atcgcctggt gcattcggtt 660
cgacacccgg aagacggact gaccgcgccc ttcactggac cggtttcggt gctcaatcac 720
cgggttacca ggcagcgacg ttttgccacc cagcattatc aactggaccg gctgaaaaac 780
ctggcccatg cttccggcgg ttccttgaac gacatcgttc tttacctgtg tggcaccgca 840
ttgcggcgct ttctggctga gcagaacaat ctgccagaca ccccgctgac ggctggtata 900
ccggtgaata tccggccggc agacgacgag ggtacgggca cccagatcag ttggatgatt 960
gcctcgctgg ccaccgacga agctgatccg ttgaaccgcc tgcaacagat caaaacctcg 1020
acccgacggg ccaaggagca cctgcagcac cttccaaaaa cggccctgac ccagtacacc 1080
atgctgctga tgtcacccta cattctgcaa ttgatgtcag gtctcggggg gaggatgcga 1140
ccagtcttca acgtgaccat ttccaacgtg cccggcccgg aaggcacgct gtattatgaa 1200
ggagcccggc ttgaggccat gtatccgttg tcgctaatcg ctcacggcgg cgccctgaac 1260
atcacctgcc tgagctatgc cggatcgctg aatttcggtt ttaccggctg tcgggatacg 1320
ctgccgggga tgcagaaact ggcggtttat accggtgaag ctctggatga gctggaatcg 1380
ctgattctgc cacccaagaa gcgcgcccga acccgcaagt aa 1422
<210> 108
<211> 473
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 108
Met Lys Arg Leu Gly Ser Leu Asp Ala Ser Trp Leu Ala Val Glu Gly
1 5 10 15
Glu Asp Thr Pro Met His Val Gly Thr Leu Gln Ile Phe Ser Leu Pro
20 25 30
Glu Gly Ala Pro Glu Thr Phe Leu Arg Asp Met Val Thr Arg Met Lys
35 40 45
Glu Ala Gly Asp Val Ala Pro Pro Trp Gly Tyr Lys Leu Ala Trp Ser
50 55 60
Gly Phe Leu Gly Arg Val Ile Ala Pro Ala Trp Lys Val Asp Phe Asp
65 70 75 80
Ile Asp Leu Asp Tyr His Val Arg His Ser Ala Leu Pro Arg Pro Gly
85 90 95
Gly Glu Arg Glu Leu Gly Ile Leu Val Ser Arg Leu His Ser Asn Ser
100 105 110
Leu Asp Phe Ser Arg Pro Leu Trp Glu Cys His Val Ile Glu Gly Leu
115 120 125
Glu Asn Asn Arg Phe Ala Leu Tyr Thr Lys Met His His Ser Met Ile
130 135 140
Asp Gly Ile Ser Gly Val Arg Leu Met Gln Arg Val Leu Thr Thr Asp
145 150 155 160
Pro Glu Arg Cys Asn Met Pro Pro Pro Trp Thr Arg Arg Pro His Gln
165 170 175
Arg Arg Gly Ala Lys Thr Asp Lys Glu Ala Ser Val Arg Ala Ala Val
180 185 190
Val Gln Ala Met Asp Ala Leu Lys Leu Gln Ala Asp Met Ala Pro Arg
195 200 205
Leu Trp Gln Ala Gly Asn Arg Leu Val His Ser Val Arg His Pro Glu
210 215 220
Asp Gly Leu Thr Ala Pro Phe Thr Gly Pro Val Ser Val Leu Asn His
225 230 235 240
Arg Val Thr Arg Gln Arg Arg Phe Ala Thr Gln His Tyr Gln Leu Asp
245 250 255
Arg Leu Lys Asn Leu Ala His Ala Ser Gly Gly Ser Leu Asn Asp Ile
260 265 270
Val Leu Tyr Leu Cys Gly Thr Ala Leu Arg Arg Phe Leu Ala Glu Gln
275 280 285
Asn Asn Leu Pro Asp Thr Pro Leu Thr Ala Gly Ile Pro Val Asn Ile
290 295 300
Arg Pro Ala Asp Asp Glu Gly Thr Gly Thr Gln Ile Ser Trp Met Ile
305 310 315 320
Ala Ser Leu Ala Thr Asp Glu Ala Asp Pro Leu Asn Arg Leu Gln Gln
325 330 335
Ile Lys Thr Ser Thr Arg Arg Ala Lys Glu His Leu Gln His Leu Pro
340 345 350
Lys Thr Ala Leu Thr Gln Tyr Thr Met Leu Leu Met Ser Pro Tyr Ile
355 360 365
Leu Gln Leu Met Ser Gly Leu Gly Gly Arg Met Arg Pro Val Phe Asn
370 375 380
Val Thr Ile Ser Asn Val Pro Gly Pro Glu Gly Thr Leu Tyr Tyr Glu
385 390 395 400
Gly Ala Arg Leu Glu Ala Met Tyr Pro Leu Ser Leu Ile Ala His Gly
405 410 415
Gly Ala Leu Asn Ile Thr Cys Leu Ser Tyr Ala Gly Ser Leu Asn Phe
420 425 430
Gly Phe Thr Gly Cys Arg Asp Thr Leu Pro Gly Met Gln Lys Leu Ala
435 440 445
Val Tyr Thr Gly Glu Ala Leu Asp Glu Leu Glu Ser Leu Ile Leu Pro
450 455 460
Pro Lys Lys Arg Ala Arg Thr Arg Lys
465 470
<210> 109
<211> 1422
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 109
atgaaacgtc tcggatccct ggacgcctcc tggctggcgg ttgaaggtga agacaccccg 60
atgcatgtgg gtacgcttca gattttctca ctgccggaag gcgcaccaga aaccttcctg 120
cgtgacatgg tcactcgaat gaaagaggcc ggcgatgtgg caccaccctg gggatacaaa 180
ctggcctggt ctggtttcct cgggcgcgtg atcgccccgg cctggaaact ggataaggat 240
atcgatctgg attatcacgt ccggcactca gccctgcctc gccccggcgg ggagcgcgaa 300
ctgggtattc tggtatcccg actgcactct aacagtctgg atttttcccg ccctctttgg 360
gaatgccacg ttattgaagg cctggagaat aaccgttttg ccctttacac caaaatgcac 420
cactcgatga ttgacggcat cagcggcgtg cgactgatgc agagggtgct caccaccgat 480
cccgaacgct gcaatatgcc accgccctgg acgcgccgcc cacaccagcg ccgtggtgca 540
aaaaccgaca aagaggccag cgtgcgggca gcggtttccc aggcaatgga cgccctgaag 600
ctccaggcag acatggcccc caggctgtgg caggccggca atcgcctggt gcattcggtt 660
cgacacccgg aagacggact gaccgcgccc ttcactggac cggtttcggt gctcaatcac 720
cgggttaccg cgcagcgacg ttttgccacc cagcattatc aactggaccg gctgaggaac 780
ctggcccatg cttccggcgg ttccttgaac gacatcgttc tttacctgtg tggcaccgca 840
ttgcggcgct ttctggctga gcagaacaat ctgccagaca ccccgctgac ggctggtata 900
ccggtgaata tccggccggc agacgacgag ggtacgggca cccagatcgg gtggatgatt 960
gcctcgctgg ccaccgacga agctgatccg ttgaaccgcc tgcaacagat caaaacctcg 1020
acccgacggg ccaaggagca cctgcagaaa cttccaaaaa cggccctgac ccagtacacc 1080
cgcctgctga tgtcacccta cattctgcaa ttgatgtcag gtctcggggg gaggatgcga 1140
ccagtcttca acgtgaccat ttccaacgtg cccggcccgg aaggcacgct gtattatgaa 1200
ggagcccggc ttgaggccat gtatccgttg tcgctaatcg ctcacggcgg cgccctgaac 1260
atcacctgcc tgagctatgc cggatcgctg aatttcggtt ttaccggctg tcgggatacg 1320
ctgccgggga tgcagaaact ggcggtttat accggtgaag ctctggatga gctggaatcg 1380
ctgattctgc cacccaagaa gcgcgcccga acccgcaagt aa 1422
<210> 110
<211> 473
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 110
Met Lys Arg Leu Gly Ser Leu Asp Ala Ser Trp Leu Ala Val Glu Gly
1 5 10 15
Glu Asp Thr Pro Met His Val Gly Thr Leu Gln Ile Phe Ser Leu Pro
20 25 30
Glu Gly Ala Pro Glu Thr Phe Leu Arg Asp Met Val Thr Arg Met Lys
35 40 45
Glu Ala Gly Asp Val Ala Pro Pro Trp Gly Tyr Lys Leu Ala Trp Ser
50 55 60
Gly Phe Leu Gly Arg Val Ile Ala Pro Ala Trp Lys Leu Asp Lys Asp
65 70 75 80
Ile Asp Leu Asp Tyr His Val Arg His Ser Ala Leu Pro Arg Pro Gly
85 90 95
Gly Glu Arg Glu Leu Gly Ile Leu Val Ser Arg Leu His Ser Asn Ser
100 105 110
Leu Asp Phe Ser Arg Pro Leu Trp Glu Cys His Val Ile Glu Gly Leu
115 120 125
Glu Asn Asn Arg Phe Ala Leu Tyr Thr Lys Met His His Ser Met Ile
130 135 140
Asp Gly Ile Ser Gly Val Arg Leu Met Gln Arg Val Leu Thr Thr Asp
145 150 155 160
Pro Glu Arg Cys Asn Met Pro Pro Pro Trp Thr Arg Arg Pro His Gln
165 170 175
Arg Arg Gly Ala Lys Thr Asp Lys Glu Ala Ser Val Arg Ala Ala Val
180 185 190
Ser Gln Ala Met Asp Ala Leu Lys Leu Gln Ala Asp Met Ala Pro Arg
195 200 205
Leu Trp Gln Ala Gly Asn Arg Leu Val His Ser Val Arg His Pro Glu
210 215 220
Asp Gly Leu Thr Ala Pro Phe Thr Gly Pro Val Ser Val Leu Asn His
225 230 235 240
Arg Val Thr Ala Gln Arg Arg Phe Ala Thr Gln His Tyr Gln Leu Asp
245 250 255
Arg Leu Arg Asn Leu Ala His Ala Ser Gly Gly Ser Leu Asn Asp Ile
260 265 270
Val Leu Tyr Leu Cys Gly Thr Ala Leu Arg Arg Phe Leu Ala Glu Gln
275 280 285
Asn Asn Leu Pro Asp Thr Pro Leu Thr Ala Gly Ile Pro Val Asn Ile
290 295 300
Arg Pro Ala Asp Asp Glu Gly Thr Gly Thr Gln Ile Gly Trp Met Ile
305 310 315 320
Ala Ser Leu Ala Thr Asp Glu Ala Asp Pro Leu Asn Arg Leu Gln Gln
325 330 335
Ile Lys Thr Ser Thr Arg Arg Ala Lys Glu His Leu Gln Lys Leu Pro
340 345 350
Lys Thr Ala Leu Thr Gln Tyr Thr Arg Leu Leu Met Ser Pro Tyr Ile
355 360 365
Leu Gln Leu Met Ser Gly Leu Gly Gly Arg Met Arg Pro Val Phe Asn
370 375 380
Val Thr Ile Ser Asn Val Pro Gly Pro Glu Gly Thr Leu Tyr Tyr Glu
385 390 395 400
Gly Ala Arg Leu Glu Ala Met Tyr Pro Leu Ser Leu Ile Ala His Gly
405 410 415
Gly Ala Leu Asn Ile Thr Cys Leu Ser Tyr Ala Gly Ser Leu Asn Phe
420 425 430
Gly Phe Thr Gly Cys Arg Asp Thr Leu Pro Gly Met Gln Lys Leu Ala
435 440 445
Val Tyr Thr Gly Glu Ala Leu Asp Glu Leu Glu Ser Leu Ile Leu Pro
450 455 460
Pro Lys Lys Arg Ala Arg Thr Arg Lys
465 470
<210> 111
<211> 1422
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 111
atgaaacgtc tcggatccct ggacgcctcc tggctggcgg ttgaaggtga agacaccccg 60
atgcatgtgg gtacgcttca gattttctca ctgccggaag gcgcaccaga aaccttcctg 120
cgtgacatgg tcactcgaat gaaagaggcc ggcgatgtgg caccaccctg gggatacaaa 180
ctggcctggt ctggtttcct cgggcgcgtg atcgccccgg cctggaaagt cgataaggat 240
atcgatctgg attatcacgt ccggcactca gccctgcctc gccccggcgg ggagcgcgaa 300
ctgggtattc tggtatcccg actgcactct aacagtctgg atttttcccg ccctctttgg 360
gaatgccacg ttattgaagg cctggagaat aaccgttttg ccctttacac caaaatgcac 420
cactcgatga ttgacggcat cagcggcgtg cgactgatgc agagggtgct caccaccgat 480
cccgaacgct gcaatatgcc accgccctgg acgcgccgcc cacaccagcg ccgtggtgca 540
aaaaccgaca aagaggccag cgtgcgggca gcggtttccc aggcaatgga cgccctgaag 600
ctccaggcag acatggcccc caggctgtgg caggccggca atcgcctggt gcattcggtt 660
cgacacccgg aagacggact gaccgcgccc ttcactggac cggtttcggt gctcaatcac 720
cgggttaccg cgggccgacg ttttgccacc cagcattatc aactggaccg gctgaaaaac 780
ctggcccatg cttccggcgg tgggttgaac gacatcgttc tttacctgtg tggcaccgca 840
ttgcggcgct ttctggctga gcagaacaat ctgccagaca ccccgctgac ggctggtata 900
ccggtgaata tccggccggc agacgacgag gtcacgggca cccagatcag ttggatgatt 960
tgttcgctgg ccaccgacga agctgatccg ttgaaccgcc tgcaacagat caaaacctcg 1020
acccgacggg ccaaggagca cctgcagaaa cttccaaaaa cggccctgac ccagtacacc 1080
atgctgctga tgtcaccctg gattctgcaa ttgatgtcag gtctcggggg gaggatgcga 1140
ccagtcttca acgtgaccat ttccaacgtg cccggcccgg aaggcacgct gtattatgaa 1200
ggagcccggc ttgaggccat gtatccgttg tcgctaatcg ctcacggcgg cgccctgaac 1260
atcacctgcc tgagctatgc cggatcgctg aatttcggtt ttaccggctg tcgggatacg 1320
ctgccgggga tgcagaaact ggcggtttat accggtgaag ctctggatga gctggaatcg 1380
ctgattctgc cacccaagaa gcgcgcccga acccgcaagt aa 1422
<210> 112
<211> 473
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 112
Met Lys Arg Leu Gly Ser Leu Asp Ala Ser Trp Leu Ala Val Glu Gly
1 5 10 15
Glu Asp Thr Pro Met His Val Gly Thr Leu Gln Ile Phe Ser Leu Pro
20 25 30
Glu Gly Ala Pro Glu Thr Phe Leu Arg Asp Met Val Thr Arg Met Lys
35 40 45
Glu Ala Gly Asp Val Ala Pro Pro Trp Gly Tyr Lys Leu Ala Trp Ser
50 55 60
Gly Phe Leu Gly Arg Val Ile Ala Pro Ala Trp Lys Val Asp Lys Asp
65 70 75 80
Ile Asp Leu Asp Tyr His Val Arg His Ser Ala Leu Pro Arg Pro Gly
85 90 95
Gly Glu Arg Glu Leu Gly Ile Leu Val Ser Arg Leu His Ser Asn Ser
100 105 110
Leu Asp Phe Ser Arg Pro Leu Trp Glu Cys His Val Ile Glu Gly Leu
115 120 125
Glu Asn Asn Arg Phe Ala Leu Tyr Thr Lys Met His His Ser Met Ile
130 135 140
Asp Gly Ile Ser Gly Val Arg Leu Met Gln Arg Val Leu Thr Thr Asp
145 150 155 160
Pro Glu Arg Cys Asn Met Pro Pro Pro Trp Thr Arg Arg Pro His Gln
165 170 175
Arg Arg Gly Ala Lys Thr Asp Lys Glu Ala Ser Val Arg Ala Ala Val
180 185 190
Ser Gln Ala Met Asp Ala Leu Lys Leu Gln Ala Asp Met Ala Pro Arg
195 200 205
Leu Trp Gln Ala Gly Asn Arg Leu Val His Ser Val Arg His Pro Glu
210 215 220
Asp Gly Leu Thr Ala Pro Phe Thr Gly Pro Val Ser Val Leu Asn His
225 230 235 240
Arg Val Thr Ala Gly Arg Arg Phe Ala Thr Gln His Tyr Gln Leu Asp
245 250 255
Arg Leu Lys Asn Leu Ala His Ala Ser Gly Gly Gly Leu Asn Asp Ile
260 265 270
Val Leu Tyr Leu Cys Gly Thr Ala Leu Arg Arg Phe Leu Ala Glu Gln
275 280 285
Asn Asn Leu Pro Asp Thr Pro Leu Thr Ala Gly Ile Pro Val Asn Ile
290 295 300
Arg Pro Ala Asp Asp Glu Val Thr Gly Thr Gln Ile Ser Trp Met Ile
305 310 315 320
Cys Ser Leu Ala Thr Asp Glu Ala Asp Pro Leu Asn Arg Leu Gln Gln
325 330 335
Ile Lys Thr Ser Thr Arg Arg Ala Lys Glu His Leu Gln Lys Leu Pro
340 345 350
Lys Thr Ala Leu Thr Gln Tyr Thr Met Leu Leu Met Ser Pro Trp Ile
355 360 365
Leu Gln Leu Met Ser Gly Leu Gly Gly Arg Met Arg Pro Val Phe Asn
370 375 380
Val Thr Ile Ser Asn Val Pro Gly Pro Glu Gly Thr Leu Tyr Tyr Glu
385 390 395 400
Gly Ala Arg Leu Glu Ala Met Tyr Pro Leu Ser Leu Ile Ala His Gly
405 410 415
Gly Ala Leu Asn Ile Thr Cys Leu Ser Tyr Ala Gly Ser Leu Asn Phe
420 425 430
Gly Phe Thr Gly Cys Arg Asp Thr Leu Pro Gly Met Gln Lys Leu Ala
435 440 445
Val Tyr Thr Gly Glu Ala Leu Asp Glu Leu Glu Ser Leu Ile Leu Pro
450 455 460
Pro Lys Lys Arg Ala Arg Thr Arg Lys
465 470
<210> 113
<211> 1422
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 113
atgaaacgtc tcggaaccct ggacgcctcc tggctggcgg ttgaaggtga agacaccccg 60
atgcatgtgg gtacgcttca gattttctca ctgccggaag gcgcaccaga aaccttcctg 120
cgtgacatgg tcactcgaat gaaagaggcc ggcgatgtgg caccaccctg gggatacaaa 180
ctggcctggt ctggtttcct cgggcgcgtg atcgccccgg cctggaaagt cgataaggat 240
atcgatctgg attatcacgt ccggcactca gccctgcctc gccccggcgg ggagcgcgaa 300
ctgggtattc tggtatcccg actgcactct aacagtctgg atttttcccg ccctctttgg 360
gaatgccacg ttattgaagg cctggagaat aaccgttttg ccctttacac caaaatgcac 420
cactcgatga ttgacggcat cagcggcgtg cgactgatgc agaggggcct caccaccgat 480
cccgaacgct gcaatatgtc accgccctgg acgcgccgcc cacaccagcg ccgtggtgca 540
aaaaccgaca aagaggccag cgtgcgggca gcggtttccc aggcaatgga cgccctgaag 600
ctccaggcag acatggcccc caggctgtgg caggccggca atcgcctggt gcattcggtt 660
cgacacccgg aagacggact gaccgcgccc ttcactggac cggtttcggt gctcaatcac 720
cgggttaccg cgcagcgacg ttttgccacc cagcattatc aactggaccg gctgaaaaac 780
ctggcccatg cttccggcgg ttccttgaac gacatcgttc tttacctgtg tggcaccgca 840
ttgcggcgct ttctggctga gcagaacaat ctgccagaca ccccgctgac ggctggtata 900
ccggtgaata tccggccggc agacgacgag ggtacgggca cccagatcag ttggatgatt 960
gcctcgctgg ccaccgacga agctgatccg ttgaaccgcc tgcaacagat caaaacctcg 1020
acccgacggg ccaaggagca cctggcgaaa cttccaaaaa cggccctgac ccagtacacc 1080
atgctgctga tgtcacccta cattctgcaa ttgatgtcag gtctcggggg gaggatgcga 1140
ccattcttca acgtgaccat ttccaacgtg cccggcccgg aaggcacgct gtattatgaa 1200
ggagcccggc ttgaggccat gtatccgttg tcgctaatcg ctcacggcgg cgccctgaac 1260
atcacctgcc tgagctatgc cggatcgctg aatttcggtt ttaccggctg tcgggatacg 1320
ctgccgggga tgcagaaact ggcggtttat accggtgaag ctctggatga gctggaatcg 1380
ctgattctgc cacccaagaa gcgcgcccga acccgcaagt aa 1422
<210> 114
<211> 473
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 114
Met Lys Arg Leu Gly Thr Leu Asp Ala Ser Trp Leu Ala Val Glu Gly
1 5 10 15
Glu Asp Thr Pro Met His Val Gly Thr Leu Gln Ile Phe Ser Leu Pro
20 25 30
Glu Gly Ala Pro Glu Thr Phe Leu Arg Asp Met Val Thr Arg Met Lys
35 40 45
Glu Ala Gly Asp Val Ala Pro Pro Trp Gly Tyr Lys Leu Ala Trp Ser
50 55 60
Gly Phe Leu Gly Arg Val Ile Ala Pro Ala Trp Lys Val Asp Lys Asp
65 70 75 80
Ile Asp Leu Asp Tyr His Val Arg His Ser Ala Leu Pro Arg Pro Gly
85 90 95
Gly Glu Arg Glu Leu Gly Ile Leu Val Ser Arg Leu His Ser Asn Ser
100 105 110
Leu Asp Phe Ser Arg Pro Leu Trp Glu Cys His Val Ile Glu Gly Leu
115 120 125
Glu Asn Asn Arg Phe Ala Leu Tyr Thr Lys Met His His Ser Met Ile
130 135 140
Asp Gly Ile Ser Gly Val Arg Leu Met Gln Arg Gly Leu Thr Thr Asp
145 150 155 160
Pro Glu Arg Cys Asn Met Ser Pro Pro Trp Thr Arg Arg Pro His Gln
165 170 175
Arg Arg Gly Ala Lys Thr Asp Lys Glu Ala Ser Val Arg Ala Ala Val
180 185 190
Ser Gln Ala Met Asp Ala Leu Lys Leu Gln Ala Asp Met Ala Pro Arg
195 200 205
Leu Trp Gln Ala Gly Asn Arg Leu Val His Ser Val Arg His Pro Glu
210 215 220
Asp Gly Leu Thr Ala Pro Phe Thr Gly Pro Val Ser Val Leu Asn His
225 230 235 240
Arg Val Thr Ala Gln Arg Arg Phe Ala Thr Gln His Tyr Gln Leu Asp
245 250 255
Arg Leu Lys Asn Leu Ala His Ala Ser Gly Gly Ser Leu Asn Asp Ile
260 265 270
Val Leu Tyr Leu Cys Gly Thr Ala Leu Arg Arg Phe Leu Ala Glu Gln
275 280 285
Asn Asn Leu Pro Asp Thr Pro Leu Thr Ala Gly Ile Pro Val Asn Ile
290 295 300
Arg Pro Ala Asp Asp Glu Gly Thr Gly Thr Gln Ile Ser Trp Met Ile
305 310 315 320
Ala Ser Leu Ala Thr Asp Glu Ala Asp Pro Leu Asn Arg Leu Gln Gln
325 330 335
Ile Lys Thr Ser Thr Arg Arg Ala Lys Glu His Leu Ala Lys Leu Pro
340 345 350
Lys Thr Ala Leu Thr Gln Tyr Thr Met Leu Leu Met Ser Pro Tyr Ile
355 360 365
Leu Gln Leu Met Ser Gly Leu Gly Gly Arg Met Arg Pro Phe Phe Asn
370 375 380
Val Thr Ile Ser Asn Val Pro Gly Pro Glu Gly Thr Leu Tyr Tyr Glu
385 390 395 400
Gly Ala Arg Leu Glu Ala Met Tyr Pro Leu Ser Leu Ile Ala His Gly
405 410 415
Gly Ala Leu Asn Ile Thr Cys Leu Ser Tyr Ala Gly Ser Leu Asn Phe
420 425 430
Gly Phe Thr Gly Cys Arg Asp Thr Leu Pro Gly Met Gln Lys Leu Ala
435 440 445
Val Tyr Thr Gly Glu Ala Leu Asp Glu Leu Glu Ser Leu Ile Leu Pro
450 455 460
Pro Lys Lys Arg Ala Arg Thr Arg Lys
465 470
<210> 115
<211> 1422
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 115
atgaaacgtc tcggaaccct ggacgcctcc tggctggcgg ttgaaggtga agacaccccg 60
atgcatgtgg gtacgcttca gattttctca ctgccggaag gcgcaccaga aaccttctcg 120
cgtgacatgg tcactcgaat gaaagaggcc ggcgatgtgg caccaccctg gggatacaaa 180
ctggcctggt ctggtttcct cgggcgcgtg atcgccccgg cctggaaagt cgcgaaggat 240
atcgatctgg attatcacgt ccggcactca gccctgcctc gccccggcgg ggagcgcgaa 300
ctgggtattc tggtatcccg actgcactct aacagtctgg atttttcccg ccctctttgg 360
gaatgccacg ttattgaagg cctggagaat aaccgttttg ccctttacac caaaatgcac 420
cactcgatga ttgacggcat cagcggcgtg cgactgatgc agagggtgct caccaccgat 480
cccgaacgct gcaatatgcc accgccctgg acgcgccgcc cacaccagcg ccgtggtgca 540
aaaaccgaca aagaggccag cgtgcgggca gcggtttccc aggcaatgga cgccctgaag 600
ctccaggcag acatggcccc caggctgtgg caggccggca atcgcctggt gcattcggtt 660
cgacacccgg aagacggact gaccgcgccc ttcactggac cggtttcggt gctcaatcac 720
cgggttaccg cgcagcgacg ttttgccacc cagcattatc aactggaccg gctgaaaaac 780
ctggcccatg cttccggcgg ttccttgaac gacatcgttc tttacctgtg tggcaccgca 840
ttgcggcgct ttctggctga gcagaacaat ctgccagaca ccccgctgac ggctggtata 900
ccggtgaata tccggccggc agacgacgag ggtacgggca gtcagatcag ttggatgatt 960
gcctcgctgg ccaccgacga agctgatccg ttgaaccgcc tgcaacagat caaaacctcg 1020
acccgacggg ccaaggagca cctggcgaaa cttccaaaaa cggccctgac ccagtacacc 1080
atgctgctga tgtcacccta cattctgcaa ttgatgtcag gtctcggggg gaggatgcga 1140
ccattcttca acgtgaccat ttccaacgtg cccggcccgg aaggcacgct gtattatgaa 1200
ggagcccggc ttgaggccat gtatccgttg tcgctaatcg ctcacggcgg cgccctgaac 1260
gtgacctgcc tgagctatgc cggatcgctg aatttcggtt ttaccggctg tcgggatacg 1320
ctgccgggga tgcagaaact ggcggtttat accggtgaag ctctggatga gctggaatcg 1380
ctgattctgc cacccaagaa gcgcgcccga acccgcaagt aa 1422
<210> 116
<211> 473
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 116
Met Lys Arg Leu Gly Thr Leu Asp Ala Ser Trp Leu Ala Val Glu Gly
1 5 10 15
Glu Asp Thr Pro Met His Val Gly Thr Leu Gln Ile Phe Ser Leu Pro
20 25 30
Glu Gly Ala Pro Glu Thr Phe Ser Arg Asp Met Val Thr Arg Met Lys
35 40 45
Glu Ala Gly Asp Val Ala Pro Pro Trp Gly Tyr Lys Leu Ala Trp Ser
50 55 60
Gly Phe Leu Gly Arg Val Ile Ala Pro Ala Trp Lys Val Ala Lys Asp
65 70 75 80
Ile Asp Leu Asp Tyr His Val Arg His Ser Ala Leu Pro Arg Pro Gly
85 90 95
Gly Glu Arg Glu Leu Gly Ile Leu Val Ser Arg Leu His Ser Asn Ser
100 105 110
Leu Asp Phe Ser Arg Pro Leu Trp Glu Cys His Val Ile Glu Gly Leu
115 120 125
Glu Asn Asn Arg Phe Ala Leu Tyr Thr Lys Met His His Ser Met Ile
130 135 140
Asp Gly Ile Ser Gly Val Arg Leu Met Gln Arg Val Leu Thr Thr Asp
145 150 155 160
Pro Glu Arg Cys Asn Met Pro Pro Pro Trp Thr Arg Arg Pro His Gln
165 170 175
Arg Arg Gly Ala Lys Thr Asp Lys Glu Ala Ser Val Arg Ala Ala Val
180 185 190
Ser Gln Ala Met Asp Ala Leu Lys Leu Gln Ala Asp Met Ala Pro Arg
195 200 205
Leu Trp Gln Ala Gly Asn Arg Leu Val His Ser Val Arg His Pro Glu
210 215 220
Asp Gly Leu Thr Ala Pro Phe Thr Gly Pro Val Ser Val Leu Asn His
225 230 235 240
Arg Val Thr Ala Gln Arg Arg Phe Ala Thr Gln His Tyr Gln Leu Asp
245 250 255
Arg Leu Lys Asn Leu Ala His Ala Ser Gly Gly Ser Leu Asn Asp Ile
260 265 270
Val Leu Tyr Leu Cys Gly Thr Ala Leu Arg Arg Phe Leu Ala Glu Gln
275 280 285
Asn Asn Leu Pro Asp Thr Pro Leu Thr Ala Gly Ile Pro Val Asn Ile
290 295 300
Arg Pro Ala Asp Asp Glu Gly Thr Gly Ser Gln Ile Ser Trp Met Ile
305 310 315 320
Ala Ser Leu Ala Thr Asp Glu Ala Asp Pro Leu Asn Arg Leu Gln Gln
325 330 335
Ile Lys Thr Ser Thr Arg Arg Ala Lys Glu His Leu Ala Lys Leu Pro
340 345 350
Lys Thr Ala Leu Thr Gln Tyr Thr Met Leu Leu Met Ser Pro Tyr Ile
355 360 365
Leu Gln Leu Met Ser Gly Leu Gly Gly Arg Met Arg Pro Phe Phe Asn
370 375 380
Val Thr Ile Ser Asn Val Pro Gly Pro Glu Gly Thr Leu Tyr Tyr Glu
385 390 395 400
Gly Ala Arg Leu Glu Ala Met Tyr Pro Leu Ser Leu Ile Ala His Gly
405 410 415
Gly Ala Leu Asn Val Thr Cys Leu Ser Tyr Ala Gly Ser Leu Asn Phe
420 425 430
Gly Phe Thr Gly Cys Arg Asp Thr Leu Pro Gly Met Gln Lys Leu Ala
435 440 445
Val Tyr Thr Gly Glu Ala Leu Asp Glu Leu Glu Ser Leu Ile Leu Pro
450 455 460
Pro Lys Lys Arg Ala Arg Thr Arg Lys
465 470
<210> 117
<211> 1422
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 117
atgaaacgtc tcggatccct ggacgcctcc tggctggcgg ttgaaggtga agacaccccg 60
atgcatgtgg gttggcttca gattttctca ctgccggaag gcgcaccaga aaccttcctg 120
cgtgacatgg tcttccgaat gaaagaggcc ggcgatgtgg caccaccctg gggatacaaa 180
ctggcctggt ctggtttcct cgggcgcgtg atcgccccgg cctggaaagt cgataaggat 240
atcgatctgg attatcacgt ccggcactca gccctgcctc gccccggcgg ggagcgcgaa 300
ctgggtattc tggtatcccg actgcactct aacagtctgg atttttcccg ccctctttgg 360
gaatgccacg ttattgaagg cctggagaat aaccgttttg ccctttacac caaaatgcac 420
cactcgatga ttgacggctt gagcggcgtg cgactgatgc agagggtgct caccaccgat 480
cccgaacgct gcaatatgcc accgccctgg acgcgccgcc cacaccagcg ccgtggtgca 540
aaaaccgaca aagaggccag cgtgcgggca gcggtttccc aggcaatgga cgccctgaag 600
ctccaggcag acatggcccc caggctgtgg caggccggca atcgcctggt gcattcggtt 660
cgacacccgg aagacggact gaccgcgccc ttcactggac cggtttcggt gctcaatcac 720
cgggttaccg cgcagcgacg ttttgccacc cagcattatc aactggaccg gctgaaaaac 780
ctggcccatg cttccggcgg ttccttgaac gacatcgttc tttacctgtg tggcaccgca 840
ttgcggcgct ttctggctga gcagaacaat ctgccagaca ccccgctgac ggctggtata 900
ccggtgaata tccggccggc aaacgacgag ggtacgggca cccagatcag ttggatgatt 960
gcctcgctgg ccaccgacga agctgatccg ttgaaccgcc tgcaacagat caaaacctcg 1020
acccgacggg ccaaggagca cctgcagaaa cttccaaaaa cggccctgac ccagtacacc 1080
atgctgctga tgtcacccta cattctgcaa ttgatgtcag gtctcggggg gaggatgcga 1140
ccagtcttca acgtgaccat ttccaacgtg cccggcccgg aaggcacgct gtattatgaa 1200
ggagcccggc ttgaggccat gtatccgttg tcgctaatcg ctcacggcgg cgccctgaac 1260
atcacctgcc tgagctatgc cggatcgctg aatttcggtt ttaccggctg tcgggatacg 1320
ctgccgggga tgcagaaact ggcggtttat accggtgaag ctctggatga gctggaatcg 1380
ctgattctgc cacccaagaa gcgcgcccga acccgcaagt aa 1422
<210> 118
<211> 473
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 118
Met Lys Arg Leu Gly Ser Leu Asp Ala Ser Trp Leu Ala Val Glu Gly
1 5 10 15
Glu Asp Thr Pro Met His Val Gly Trp Leu Gln Ile Phe Ser Leu Pro
20 25 30
Glu Gly Ala Pro Glu Thr Phe Leu Arg Asp Met Val Phe Arg Met Lys
35 40 45
Glu Ala Gly Asp Val Ala Pro Pro Trp Gly Tyr Lys Leu Ala Trp Ser
50 55 60
Gly Phe Leu Gly Arg Val Ile Ala Pro Ala Trp Lys Val Asp Lys Asp
65 70 75 80
Ile Asp Leu Asp Tyr His Val Arg His Ser Ala Leu Pro Arg Pro Gly
85 90 95
Gly Glu Arg Glu Leu Gly Ile Leu Val Ser Arg Leu His Ser Asn Ser
100 105 110
Leu Asp Phe Ser Arg Pro Leu Trp Glu Cys His Val Ile Glu Gly Leu
115 120 125
Glu Asn Asn Arg Phe Ala Leu Tyr Thr Lys Met His His Ser Met Ile
130 135 140
Asp Gly Leu Ser Gly Val Arg Leu Met Gln Arg Val Leu Thr Thr Asp
145 150 155 160
Pro Glu Arg Cys Asn Met Pro Pro Pro Trp Thr Arg Arg Pro His Gln
165 170 175
Arg Arg Gly Ala Lys Thr Asp Lys Glu Ala Ser Val Arg Ala Ala Val
180 185 190
Ser Gln Ala Met Asp Ala Leu Lys Leu Gln Ala Asp Met Ala Pro Arg
195 200 205
Leu Trp Gln Ala Gly Asn Arg Leu Val His Ser Val Arg His Pro Glu
210 215 220
Asp Gly Leu Thr Ala Pro Phe Thr Gly Pro Val Ser Val Leu Asn His
225 230 235 240
Arg Val Thr Ala Gln Arg Arg Phe Ala Thr Gln His Tyr Gln Leu Asp
245 250 255
Arg Leu Lys Asn Leu Ala His Ala Ser Gly Gly Ser Leu Asn Asp Ile
260 265 270
Val Leu Tyr Leu Cys Gly Thr Ala Leu Arg Arg Phe Leu Ala Glu Gln
275 280 285
Asn Asn Leu Pro Asp Thr Pro Leu Thr Ala Gly Ile Pro Val Asn Ile
290 295 300
Arg Pro Ala Asn Asp Glu Gly Thr Gly Thr Gln Ile Ser Trp Met Ile
305 310 315 320
Ala Ser Leu Ala Thr Asp Glu Ala Asp Pro Leu Asn Arg Leu Gln Gln
325 330 335
Ile Lys Thr Ser Thr Arg Arg Ala Lys Glu His Leu Gln Lys Leu Pro
340 345 350
Lys Thr Ala Leu Thr Gln Tyr Thr Met Leu Leu Met Ser Pro Tyr Ile
355 360 365
Leu Gln Leu Met Ser Gly Leu Gly Gly Arg Met Arg Pro Val Phe Asn
370 375 380
Val Thr Ile Ser Asn Val Pro Gly Pro Glu Gly Thr Leu Tyr Tyr Glu
385 390 395 400
Gly Ala Arg Leu Glu Ala Met Tyr Pro Leu Ser Leu Ile Ala His Gly
405 410 415
Gly Ala Leu Asn Ile Thr Cys Leu Ser Tyr Ala Gly Ser Leu Asn Phe
420 425 430
Gly Phe Thr Gly Cys Arg Asp Thr Leu Pro Gly Met Gln Lys Leu Ala
435 440 445
Val Tyr Thr Gly Glu Ala Leu Asp Glu Leu Glu Ser Leu Ile Leu Pro
450 455 460
Pro Lys Lys Arg Ala Arg Thr Arg Lys
465 470
<210> 119
<211> 455
<212> PRT
<213> Marinobacter hydrocarbonoclasticus
<400> 119
Met Thr Pro Leu Asn Pro Thr Asp Gln Leu Phe Leu Trp Leu Glu Lys
1 5 10 15
Arg Gln Gln Pro Met His Val Gly Gly Leu Gln Leu Phe Ser Phe Pro
20 25 30
Glu Gly Ala Pro Asp Asp Tyr Val Ala Gln Leu Ala Asp Gln Leu Arg
35 40 45
Gln Lys Thr Glu Val Thr Ala Pro Phe Asn Gln Arg Leu Ser Tyr Arg
50 55 60
Leu Gly Gln Pro Val Trp Val Glu Asp Glu His Leu Asp Leu Glu His
65 70 75 80
His Phe Arg Phe Glu Ala Leu Pro Thr Pro Gly Arg Ile Arg Glu Leu
85 90 95
Leu Ser Phe Val Ser Ala Glu His Ser His Leu Met Asp Arg Glu Arg
100 105 110
Pro Met Trp Glu Val His Leu Ile Glu Gly Leu Lys Asp Arg Gln Phe
115 120 125
Ala Leu Tyr Thr Lys Val His His Ser Leu Val Asp Gly Val Ser Ala
130 135 140
Met Arg Met Ala Thr Arg Met Leu Ser Glu Asn Pro Asp Glu His Gly
145 150 155 160
Met Pro Pro Ile Trp Asp Leu Pro Cys Leu Ser Arg Asp Arg Gly Glu
165 170 175
Ser Asp Gly His Ser Leu Trp Arg Ser Val Thr His Leu Leu Gly Leu
180 185 190
Ser Asp Arg Gln Leu Gly Thr Ile Pro Thr Val Ala Lys Glu Leu Leu
195 200 205
Lys Thr Ile Asn Gln Ala Arg Lys Asp Pro Ala Tyr Asp Ser Ile Phe
210 215 220
His Ala Pro Arg Cys Met Leu Asn Gln Lys Ile Thr Gly Ser Arg Arg
225 230 235 240
Phe Ala Ala Gln Ser Trp Cys Leu Lys Arg Ile Arg Ala Val Cys Glu
245 250 255
Ala Tyr Gly Thr Thr Val Asn Asp Val Val Thr Ala Met Cys Ala Ala
260 265 270
Ala Leu Arg Thr Tyr Leu Met Asn Gln Asp Ala Leu Pro Glu Lys Pro
275 280 285
Leu Val Ala Phe Val Pro Val Ser Leu Arg Arg Asp Asp Ser Ser Gly
290 295 300
Gly Asn Gln Val Gly Val Ile Leu Ala Ser Leu His Thr Asp Val Gln
305 310 315 320
Asp Ala Gly Glu Arg Leu Leu Lys Ile His His Gly Met Glu Glu Ala
325 330 335
Lys Gln Arg Tyr Arg His Met Ser Pro Glu Glu Ile Val Asn Tyr Thr
340 345 350
Ala Leu Thr Leu Ala Pro Ala Ala Phe His Leu Leu Thr Gly Leu Ala
355 360 365
Pro Lys Trp Gln Thr Phe Asn Val Val Ile Ser Asn Val Pro Gly Pro
370 375 380
Ser Arg Pro Leu Tyr Trp Asn Gly Ala Lys Leu Glu Gly Met Tyr Pro
385 390 395 400
Val Ser Ile Asp Met Asp Arg Leu Ala Leu Asn Met Thr Leu Thr Ser
405 410 415
Tyr Asn Asp Gln Val Glu Phe Gly Leu Ile Gly Cys Arg Arg Thr Leu
420 425 430
Pro Ser Leu Gln Arg Met Leu Asp Tyr Leu Glu Gln Gly Leu Ala Glu
435 440 445
Leu Glu Leu Asn Ala Gly Leu
450 455
<210> 120
<211> 1000
<212> DNA
<213> Marinobacter hydrocarbonoclasticus
<400> 120
atgacgcccc tgaatcccac tgaccagctc tttctctggc tggaaaaacg ccagcagccc 60
atgcatgtgg gcggcctcca gctgttttcc ttccccgaag gcgcgccgga cgactatgtc 120
gcgcagctgg cagaccagct tcggcagaag acggaggtga ccgccccctt taaccagcgc 180
ctgagctatc gcctgggcca gccggtatgg gtggaggatg agcacctgga ccttgagcat 240
catttccgct tcgaggcgct gcccacaccc gggcgtattc gggagctgct gtcgttcgta 300
tcggcggagc attcgcacct gatggaccgg gagcgcccca tgtgggaggt gcacctgatc 360
gagggcctga aagaccggca gtttgcgctc tacaccaagg ttcaccattc cctggtggac 420
ggtgtctcgg ccatgcgcat ggccacccgg atgctgagtg aaaacccgga cgaacacggc 480
atgccgccaa tctgggatct gccttgcctg tcacgggata ggggtgagtc ggacggacac 540
tccctctggc gcagtgtcac ccatttgctg gggctttcgg accgccagct cggcaccatt 600
cccactgtgg caaaggagct actgaaaacc atcaatcagg cccggaagga tccggcctac 660
gactccattt tccatgcccc gcgctgcatg ctgaaccaga aaatcaccgg ttcccgtcga 720
ttcgccgctc agtcctggtg cctgaaacgg attcgcgccg tatgcgaggc ctacggcacc 780
acggtcaacg atgtcgtgac tgccatgtgc gcagcggctc tgcgtaccta tctgatgaat 840
caggatgcct tgccggagaa accactggtg gcctttgtgc cggtgtcgct acgccgggac 900
gacagctccg gcggcaacca ggtaggcgtc atcctggcga gccttcacac cgatgtgcag 960
gacgccggcg aacgactgtt aaaaattcac cacggcatgg 1000
<210> 121
<211> 234
<212> DNA
<213> Marinobacter aquaeolei
<400> 121
atgagtacag ttgaagagcg cgttaagaag attgtttgtg agcagttggg cgtgaaagag 60
tccgaagttc agaacacatc ttcttttgta gaggatcttg gcgctgactc actggacact 120
gttgagctgg ttatggccct ggaagaggaa ttcgagacag agattcctga cgaagaggcc 180
gaaaagctgg gcaccgttca ggacgcgatc gactacattg tcgcgcacac ctga 234
<210> 122
<211> 77
<212> PRT
<213> Marinobacter aquaeolei
<400> 122
Met Ser Thr Val Glu Glu Arg Val Lys Lys Ile Val Cys Glu Gln Leu
1 5 10 15
Gly Val Lys Glu Ser Glu Val Gln Asn Thr Ser Ser Phe Val Glu Asp
20 25 30
Leu Gly Ala Asp Ser Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu
35 40 45
Glu Glu Phe Glu Thr Glu Ile Pro Asp Glu Glu Ala Glu Lys Leu Gly
50 55 60
Thr Val Gln Asp Ala Ile Asp Tyr Ile Val Ala His Thr
65 70 75
<210> 123
<211> 234
<212> DNA
<213> Marinobacter hydrocarbonoclasticus
<400> 123
atgagtacag ttgaagagcg cgttaagaag attgtttgtg agcagttggg cgtgaaagag 60
tccgaagttc agaacacatc ttcttttgta gaggatcttg gcgctgactc actggacact 120
gttgagctgg ttatggccct ggaagaggaa ttcgagaccg agattcctga cgaagaggcc 180
gaaaagctgg gcaccgttca ggacgcgatc gactacattg tcgcgcacac ctga 234
<210> 124
<211> 77
<212> PRT
<213> Marinobacter hydrocarbonoclasticus
<400> 124
Met Ser Thr Val Glu Glu Arg Val Lys Lys Ile Val Cys Glu Gln Leu
1 5 10 15
Gly Val Lys Glu Ser Glu Val Gln Asn Thr Ser Ser Phe Val Glu Asp
20 25 30
Leu Gly Ala Asp Ser Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu
35 40 45
Glu Glu Phe Glu Thr Glu Ile Pro Asp Glu Glu Ala Glu Lys Leu Gly
50 55 60
Thr Val Gln Asp Ala Ile Asp Tyr Ile Val Ala His Thr
65 70 75
Claims (59)
- 재조합 숙주 세포에 있어서:
(a) 외인성 아실기 운반 단백질(ACP)을 인코딩(encode)하는 폴리뉴클레오티드 서열; 및
(b) 외인성 지방산 유도체 생합성 단백질을 인코딩하는 폴리뉴클레오티드 서열을 포함하고,
상기 재조합 숙주 세포는 지방산 유도체 조성물을 생성하는 재조합 숙주 세포. - 제 1 항에 있어서,
상기 재조합 숙주 세포는, (a) 및 (b)의 상기 폴리뉴클레오티드 서열을 과발현(overexpress)시키기에 효과적인 조건들 하에서 탄소원(carbon source)을 함유한 배지에서 배양되는 경우, 상기 재조합 숙주 세포와 동일한 조건들 하에 증식되는 대응하는 야생형 숙주 세포에 비해 더 높은 역가(titer), 더 높은 수율 또는 더 높은 생산성으로 상기 지방산 유도체 조성물을 생성하는 재조합 숙주 세포. - 제 1 항에 있어서,
상기 지방산 유도체 조성물은 지방산, 지방족 알코올, 지방족 에스테르, 지방족 알데히드, 알칸, 알켄, 올레핀, 및 케톤으로 구성된 그룹으로부터 선택된 지방산 유도체를 포함하는 재조합 숙주 세포. - 제 1 항에 있어서,
상기 지방산 유도체 생합성 단백질은 티오에스테라제 활성을 갖고, 상기 지방산 유도체 조성물은 지방산을 포함하는 재조합 숙주 세포. - 제 4 항에 있어서,
카르복실산 레덕타제(CAR) 활성을 갖는 단백질을 더 포함하고, 상기 지방산 유도체 조성물은 지방족 알코올을 포함하는 재조합 숙주 세포. - 제 1 항에 있어서,
상기 지방산 유도체 생합성 단백질은 아실 ACP 레덕타제(AAR) 활성을 갖고, 상기 지방산 유도체 조성물은 지방족 알코올을 포함하는 재조합 숙주 세포. - 제 1 항에 있어서,
지방산 유도체 생합성 폴리펩티드는 에스테르 신타제 활성을 갖고, 상기 지방산 유도체 조성물은 지방족 에스테르를 포함하는 재조합 숙주 세포. - 제 2 항에 있어서,
상기 재조합 숙주 세포의 더 높은 역가는 상기 대응하는 야생형 숙주 세포에 비해 적어도 약 10 % 내지 적어도 약 90 % 더 큰 재조합 숙주 세포. - 제 2 항에 있어서,
상기 재조합 숙주 세포의 더 높은 수율은 상기 대응하는 야생형 숙주 세포에 비해 적어도 약 5 % 내지 적어도 약 80 % 더 큰 재조합 숙주 세포. - 제 2 항에 있어서,
상기 지방산 유도체 조성물은 약 100 mg/L 내지 약 300 g/L의 역가에서 생성되는 재조합 숙주 세포. - 제 10 항에 있어서,
상기 지방산 유도체 조성물은 약 1 g/L 내지 약 250 g/L의 역가에서 생성되는 재조합 숙주 세포. - 제 10 항에 있어서,
상기 지방산 유도체 조성물은 적어도 약 30 g/L의 역가에서 생성되는 재조합 숙주 세포. - 제 2 항에 있어서,
상기 지방산 유도체 조성물은 약 0.7 mg/L/hr 내지 약 2.5 g/L/hr의 생산성에서 생성되는 재조합 숙주 세포. - 제 1 항에 있어서,
상기 ACP는 시아노박테리아의 아실기 운반 단백질(cACP)인 재조합 숙주 세포. - 제 1 항에 있어서,
상기 ACP는 마리노박터 아쿠애올레이(Marinobacter aquaeolei) VT8 아실기 운반 단백질(mACP)인 재조합 숙주 세포. - 제 1 항에 있어서,
상기 ACP는 대장균(E. coli) 아실기 운반 단백질(ecACP)인 재조합 숙주 세포. - 제 1 항에 있어서,
4'-포스포판테테이닐 트랜스페라제 단백질을 인코딩하는 sfp 유전자를 더 포함하는 재조합 숙주 세포. - 제 17 항에 있어서,
상기 sfp 유전자는 바실루스 서브틸리스(B. subtilis) sfp 유전자인 재조합 숙주 세포. - 제 1 항에 있어서,
상기 지방산 유도체 조성물은 세포밖에서(extracellularly) 또는 세포안에서(intercellularly) 생성되는 재조합 숙주 세포. - 제 1 항의 재조합 숙주 세포를 포함하는 세포 배양(cell culture).
- 제 20 항에 있어서,
상기 지방산 유도체 조성물은 배양 배지에서 발견되는 세포 배양. - 제 21 항에 있어서,
상기 지방산 유도체 조성물은 지방산, 지방족 알코올 및 지방족 에스테르로 구성된 그룹으로부터 선택된 적어도 하나의 지방산 유도체를 포함하는 세포 배양. - 제 22 항에 있어서,
상기 지방산 유도체는 C6, C8, C10, C12, C13, C14, C15, C16, C17, 또는 C18 지방산 유도체인 세포 배양. - 제 23 항에 있어서,
상기 지방산 유도체는 C10:1, C12:1, C14:1, C16:1, 또는 C18:1 불포화 지방산 유도체인 세포 배양. - 제 22 항에 있어서,
상기 지방산 유도체 조성물은 지방산을 포함하는 세포 배양. - 제 22 항에 있어서,
상기 지방산 유도체 조성물은 지방족 알코올을 포함하는 세포 배양. - 제 22 항에 있어서,
상기 지방산 유도체 조성물은 지방족 에스테르를 포함하는 세포 배양. - 제 22 항에 있어서,
상기 지방산 유도체 조성물은 상기 지방산, 상기 지방족 에스테르, 또는 상기 지방족 알코올의 환원된 말단(reduced end)으로부터 7번 및 8번 탄소 사이에 이중 결합을 갖는 지방산 유도체를 포함하는 세포 배양. - 제 22 항에 있어서,
상기 지방산 유도체 조성물은 불포화 지방산 유도체를 포함하는 세포 배양. - 제 22 항에 있어서,
상기 지방산 유도체 조성물은 포화 지방산 유도체를 포함하는 세포 배양. - 제 22 항에 있어서,
상기 지방산 유도체 조성물은 분지쇄(branched chain) 지방산 유도체를 포함하는 세포 배양. - 제 22 항에 있어서,
상기 지방산 유도체는 약 1.003 내지 약 1.5의 현대 탄소(modern carbon)의 분율(fraction)을 갖는 세포 배양. - 제 22 항에 있어서,
상기 지방산 유도체는 약 -10.9 내지 약 -15.4의 δ13C를 갖는 세포 배양. - 지방산 유도체 조성물을 만드는 방법에 있어서:
(a) 지방산 유도체 조성물을 생성하기 위해 탄소원의 존재 하에 제 1 항의 재조합 숙주 세포를 배양하는 단계; 및
(b) 배양 배지로부터 상기 지방산 유도체 조성물을 수집하는 단계
를 포함하는 방법. - 제 34 항에 있어서,
상기 지방산 유도체 조성물의 수율, 역가 또는 생산성은 동일한 조건들 하에서 배양된 대응하는 야생형 숙주 세포에 의해 생성된 지방산 유도체 조성물의 수율, 역가 또는 생산성보다 적어도 약 10 % 더 큰 방법. - 제 34 항에 있어서,
선택적으로 상기 재조합 숙주 세포로부터 상기 지방산 유도체 조성물을 격리(isolate)시키는 단계를 더 포함하는 방법. - 제 34 항에 있어서,
상기 지방산 유도체 조성물은 지방산, 지방족 알코올, 지방족 에스테르, 지방족 알데히드, 알칸, 알켄, 올레핀, 및 케톤으로 구성된 그룹으로부터 선택되는 방법. - 제 37 항에 있어서,
상기 지방산 유도체 조성물은 1 이상의 지방산 유도체들의 조합물(combination)인 방법. - 제 34 항에 있어서,
상기 재조합 숙주 세포에서 발현된 지방산 유도체 생합성 단백질은 티오에스테라제 활성을 갖고, 상기 지방산 유도체 조성물은 지방산을 포함하는 방법. - 제 34 항에 있어서,
상기 재조합 숙주 세포는 카르복실산 레덕타제(CAR) 활성을 갖는 단백질을 발현시키도록 더 조작(engineer)되고, 상기 지방산 유도체 조성물은 지방족 알코올을 포함하는 방법. - 제 34 항에 있어서,
상기 재조합 숙주 세포에서 발현된 지방산 유도체 생합성 단백질은 아실 ACP 레덕타제(AAR) 활성을 갖고, 상기 지방산 유도체 조성물은 지방족 알코올을 포함하는 방법. - 제 34 항에 있어서,
상기 재조합 숙주 세포에서 발현된 지방산 유도체 생합성 단백질은 에스테르 신타제 활성을 갖고, 상기 지방산 유도체 조성물은 지방족 에스테르를 포함하는 방법. - 제 34 항에 있어서,
상기 ACP는 시아노박테리아의 아실기 운반 단백질(cACP)인 방법. - 제 43 항에 있어서,
상기 cACP는 마리노박터 아쿠애올레이 VT8 아실기 운반 단백질(mACP)인 방법. - 제 34 항에 있어서,
상기 ACP는 대장균 아실기 운반 단백질(ecACP)인 방법. - 제 34 항에 있어서,
포스포판테테이닐트랜스페라제 단백질은 sfp 유전자에 의해 인코딩된 4'-포스포판테테이닐 트랜스페라제 단백질인 방법. - 제 46 항에 있어서,
상기 sfp 유전자는 바실루스 서브틸리스 sfp 유전자인 방법. - 제 34 항에 있어서,
상기 지방산 유도체 조성물은 배양 배지에서 발견되는 방법. - 제 34 항에 있어서,
상기 지방산 유도체 조성물은 C6, C8, C10, C12, C13, C14, C15, C16, C17, 또는 C18 지방산 유도체를 포함하는 방법. - 제 49 항에 있어서,
상기 지방산 유도체 조성물은 C10:1, C12:1, C14:1, C16:1, 또는 C18:1 불포화 지방산 유도체를 포함하는 방법. - 제 34 항에 있어서,
상기 지방산 유도체 조성물은 지방산을 포함하는 방법. - 제 34 항에 있어서,
상기 지방산 유도체 조성물은 지방족 알코올을 포함하는 방법. - 제 34 항에 있어서,
상기 지방산 유도체 조성물은 지방족 에스테르를 포함하는 방법. - 제 34 항에 있어서,
상기 지방산 유도체 조성물은 지방산, 지방족 에스테르, 또는 지방족 알코올의 환원된 말단으로부터 7번 및 8번 탄소 사이에 이중 결합을 갖는 지방산 유도체를 포함하는 방법. - 제 34 항에 있어서,
상기 지방산 유도체 조성물은 불포화 지방산 유도체를 포함하는 방법. - 제 34 항에 있어서,
상기 지방산 유도체 조성물은 포화 지방산 유도체를 포함하는 방법. - 제 34 항에 있어서,
상기 지방산 유도체 조성물은 분지쇄 지방산 유도체를 포함하는 방법. - 제 34 항에 있어서,
지방산 유도체는 약 1.003 내지 약 1.5의 현대 탄소의 분율을 갖는 방법. - 제 34 항에 있어서,
지방산 유도체는 약 -10.9 내지 약 -15.4의 δ13C를 갖는 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261736428P | 2012-12-12 | 2012-12-12 | |
US61/736,428 | 2012-12-12 | ||
PCT/US2013/074427 WO2014093505A2 (en) | 2012-12-12 | 2013-12-11 | Acp-mediated production of fatty acid derivatives |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20150094741A true KR20150094741A (ko) | 2015-08-19 |
Family
ID=50031499
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020157018571A KR20150094741A (ko) | 2012-12-12 | 2013-12-11 | 지방산 유도체의 acp매개 생성 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20160002681A1 (ko) |
EP (1) | EP2931742A2 (ko) |
JP (1) | JP2016500261A (ko) |
KR (1) | KR20150094741A (ko) |
CA (1) | CA2891353A1 (ko) |
MX (1) | MX2015007361A (ko) |
WO (1) | WO2014093505A2 (ko) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3020819A1 (en) * | 2014-11-17 | 2016-05-18 | Evonik Degussa GmbH | Fatty acid and derivatives production |
JP6779664B2 (ja) * | 2016-05-26 | 2020-11-04 | 花王株式会社 | 脂質の製造方法 |
WO2019191763A1 (en) | 2018-03-30 | 2019-10-03 | Invista North America S.A.R.L. | Methods for controlling oxygen concentration during aerobic biosynthesis |
CN112004934B (zh) | 2018-03-30 | 2024-02-23 | 英威达纺织(英国)有限公司 | 用于生物合成制造碳基化学品的材料和方法 |
WO2019191767A1 (en) | 2018-03-30 | 2019-10-03 | Invista Textiles (U.K.) Limited | High hydrogen utilization and gas recycle |
WO2019191770A1 (en) * | 2018-03-30 | 2019-10-03 | Invista North America S.A.R.L. | Materials and methods for biosynthetic manufacture of pimelic acid and utilization of synthetic polypeptides |
WO2019213017A1 (en) | 2018-05-02 | 2019-11-07 | Invista North America S.A.R.L. | Materials and methods for controlling oxidation and reduction in biosynthetic pathways of species of the genera ralstonia and cupriavidus and organisms related thereto |
EP3788148A1 (en) | 2018-05-02 | 2021-03-10 | INVISTA Textiles (U.K.) Limited | Materials and methods for maximizing biosynthesis through alteration of pyruvate-acetyl-coa-tca balance in species of the genera ralstonia and cupriavidus and organisms related thereto |
US12060596B2 (en) | 2018-05-02 | 2024-08-13 | Inv Nylon Chemicals Americas, Llc | Materials and methods for controlling limitation conditions in product biosynthesis for non-PHB generating species of the genera Ralstonia or Cupriavidus and organisms related thereto |
WO2019213028A1 (en) | 2018-05-02 | 2019-11-07 | Invista North America S.A.R.L. | Materials and methods for controlling regulation in biosynthesis in species of the genera ralstonia or cupriavidus and organisms related thereto |
US11053287B2 (en) | 2018-05-02 | 2021-07-06 | Inv Nylon Chemicals Americas, Llc | Materials and methods for differential biosynthesis in species of the genera Ralstonia and Cupriavidus and organisms related thereto |
JP7376041B2 (ja) * | 2019-09-11 | 2023-11-08 | 公益財団法人地球環境産業技術研究機構 | 形質転換体及びそれを用いる1,3-ブタンジオールの製造方法 |
JP7544594B2 (ja) | 2020-12-25 | 2024-09-03 | 株式会社ダイヘン | 高周波電源システム |
GB2620991A (en) * | 2022-07-29 | 2024-01-31 | Univ Of The Western Cape | Lyso-ornithine lipid biosurfactant overproduction system |
Family Cites Families (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5000000A (en) | 1988-08-31 | 1991-03-19 | University Of Florida | Ethanol production by Escherichia coli strains co-expressing Zymomonas PDC and ADH genes |
US5028539A (en) | 1988-08-31 | 1991-07-02 | The University Of Florida | Ethanol production using engineered mutant E. coli |
US5424202A (en) | 1988-08-31 | 1995-06-13 | The University Of Florida | Ethanol production by recombinant hosts |
US5482846A (en) | 1988-08-31 | 1996-01-09 | University Of Florida | Ethanol production in Gram-positive microbes |
WO1991016427A1 (en) | 1990-04-24 | 1991-10-31 | Stratagene | Methods for phenotype creation from multiple gene populations |
US5602030A (en) | 1994-03-28 | 1997-02-11 | University Of Florida Research Foundation | Recombinant glucose uptake system |
US6428767B1 (en) | 1995-05-12 | 2002-08-06 | E. I. Du Pont De Nemours And Company | Method for identifying the source of carbon in 1,3-propanediol |
US5965408A (en) | 1996-07-09 | 1999-10-12 | Diversa Corporation | Method of DNA reassembly by interrupting synthesis |
US5939250A (en) | 1995-12-07 | 1999-08-17 | Diversa Corporation | Production of enzymes having desired activities by mutagenesis |
US8535916B2 (en) | 2006-02-13 | 2013-09-17 | Ls9, Inc. | Modified microorganisms and uses therefor |
US8110670B2 (en) | 2006-05-19 | 2012-02-07 | Ls9, Inc. | Enhanced production of fatty acid derivatives |
WO2007136762A2 (en) | 2006-05-19 | 2007-11-29 | Ls9, Inc. | Production of fatty acids and derivatives thereof |
US8110093B2 (en) | 2007-03-14 | 2012-02-07 | Ls9, Inc. | Process for producing low molecular weight hydrocarbons from renewable resources |
EP2594633A1 (en) | 2007-03-28 | 2013-05-22 | LS9, Inc. | Enhanced production of fatty acid derivatives |
KR101862691B1 (ko) | 2007-05-22 | 2018-05-31 | 알이지 라이프 사이언시스, 엘엘씨 | 탄화수소-생산 유전자와 이들의 이용 방법 |
CN101802208B (zh) | 2007-09-27 | 2016-05-18 | Reg生命科学有限责任公司 | 通过提取式发酵减少原料中杂质的毒性作用 |
WO2009085278A1 (en) | 2007-12-21 | 2009-07-09 | Ls9, Inc. | Methods and compositions for producing olefins |
ES2667469T3 (es) | 2008-05-16 | 2018-05-11 | REG Life Sciences, LLC | Métodos y composiciones para producir hidrocarburos |
US8232924B2 (en) | 2008-05-23 | 2012-07-31 | Alliant Techsystems Inc. | Broadband patch antenna and antenna system |
AU2009302325A1 (en) | 2008-10-07 | 2010-04-15 | Ls9, Inc. | Method and compositions for producing fatty aldehydes |
EP2796559B1 (en) | 2008-10-28 | 2018-09-12 | REG Life Sciences, LLC | Microbial cell for producing fatty alcohols |
CA2747516C (en) | 2008-12-23 | 2019-11-05 | Ls9, Inc. | Methods and compositions related to thioesterase enzymes |
BRPI1009980A2 (pt) | 2009-05-01 | 2015-08-25 | Univ California | Produtos de ésteres de ácidos graxos a partir de polímeros de biomassa |
EP2464722B1 (en) * | 2009-08-11 | 2017-10-04 | Synthetic Genomics, Inc. | Microbial production of fatty alcohols |
BR112012006681A2 (pt) | 2009-09-25 | 2015-09-08 | Ls9 Inc | método para produzir uma composição de ésteres de ácidos graxos, composição de ésteres de ácidos graxos método para produzir uma composição de ésteres graxos e composição de biocombustivel |
US8530221B2 (en) | 2010-01-14 | 2013-09-10 | Ls9, Inc. | Production of branched chain fatty acids and derivatives thereof in recombinant microbial cells |
WO2011100667A1 (en) | 2010-02-14 | 2011-08-18 | Ls9, Inc. | Surfactant and cleaning compositions comprising microbially produced branched fatty alcohols |
US8372610B2 (en) | 2010-09-15 | 2013-02-12 | Ls9, Inc. | Production of odd chain fatty acid derivatives in recombinant microbial cells |
US9523096B2 (en) * | 2010-12-20 | 2016-12-20 | Matrix Genetics, Llc | Modified photosynthetic microorganisms for producing lipids |
WO2012087963A1 (en) * | 2010-12-20 | 2012-06-28 | Targeted Growth, Inc. | Modified photosynthetic microorganisms for producing lipids |
US11066682B2 (en) * | 2011-04-01 | 2021-07-20 | Genomatica, Inc. | Methods and compositions for improved production of fatty acids and derivatives thereof |
-
2013
- 2013-12-11 MX MX2015007361A patent/MX2015007361A/es unknown
- 2013-12-11 CA CA2891353A patent/CA2891353A1/en not_active Abandoned
- 2013-12-11 EP EP13826804.0A patent/EP2931742A2/en not_active Withdrawn
- 2013-12-11 KR KR1020157018571A patent/KR20150094741A/ko not_active Application Discontinuation
- 2013-12-11 US US14/760,204 patent/US20160002681A1/en not_active Abandoned
- 2013-12-11 JP JP2015547504A patent/JP2016500261A/ja active Pending
- 2013-12-11 WO PCT/US2013/074427 patent/WO2014093505A2/en active Application Filing
Also Published As
Publication number | Publication date |
---|---|
US20160002681A1 (en) | 2016-01-07 |
MX2015007361A (es) | 2015-09-10 |
WO2014093505A8 (en) | 2015-06-11 |
CA2891353A1 (en) | 2014-06-19 |
EP2931742A2 (en) | 2015-10-21 |
JP2016500261A (ja) | 2016-01-12 |
WO2014093505A2 (en) | 2014-06-19 |
WO2014093505A3 (en) | 2014-08-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102166271B1 (ko) | 지방산 유도체들의 개선된 생산 | |
US11130944B2 (en) | Acyl-ACP reductase with improved properties | |
KR20150094741A (ko) | 지방산 유도체의 acp매개 생성 | |
KR101831331B1 (ko) | Car 효소들 및 지방족 알코올들의 개선된 생산 | |
AU2016225853A1 (en) | Methods and compositions related to thioesterase enzymes | |
KR102215530B1 (ko) | 개선된 아세틸-coa 카르복실라아제 변이체 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
WITN | Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid |