KR20220160684A - 재조합 미생물 및 공정 - Google Patents
재조합 미생물 및 공정 Download PDFInfo
- Publication number
- KR20220160684A KR20220160684A KR1020227038187A KR20227038187A KR20220160684A KR 20220160684 A KR20220160684 A KR 20220160684A KR 1020227038187 A KR1020227038187 A KR 1020227038187A KR 20227038187 A KR20227038187 A KR 20227038187A KR 20220160684 A KR20220160684 A KR 20220160684A
- Authority
- KR
- South Korea
- Prior art keywords
- microorganism
- nucleic acid
- protein
- cell
- gene
- Prior art date
Links
- 244000005700 microbiome Species 0.000 title claims abstract description 178
- 238000000034 method Methods 0.000 title claims abstract description 63
- 230000008569 process Effects 0.000 title description 5
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 claims abstract description 158
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 147
- 239000001257 hydrogen Substances 0.000 claims abstract description 137
- 229910052739 hydrogen Inorganic materials 0.000 claims abstract description 137
- 238000004519 manufacturing process Methods 0.000 claims abstract description 69
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 37
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 37
- 108090000623 proteins and genes Proteins 0.000 claims description 208
- 102000004169 proteins and genes Human genes 0.000 claims description 131
- 230000014509 gene expression Effects 0.000 claims description 122
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 99
- 241000588724 Escherichia coli Species 0.000 claims description 78
- 241000019008 Hyda Species 0.000 claims description 66
- 108010020056 Hydrogenase Proteins 0.000 claims description 62
- 230000000694 effects Effects 0.000 claims description 55
- 108091033319 polynucleotide Proteins 0.000 claims description 54
- 102000040430 polynucleotide Human genes 0.000 claims description 54
- 239000002157 polynucleotide Substances 0.000 claims description 54
- 241000195597 Chlamydomonas reinhardtii Species 0.000 claims description 51
- 101150084612 gpmA gene Proteins 0.000 claims description 43
- 101150104722 gpmI gene Proteins 0.000 claims description 42
- 101150078419 zwf gene Proteins 0.000 claims description 41
- 101150014950 gnd gene Proteins 0.000 claims description 39
- 108010029731 6-phosphogluconolactonase Proteins 0.000 claims description 38
- 108020004705 Codon Proteins 0.000 claims description 38
- 102100031126 6-phosphogluconolactonase Human genes 0.000 claims description 36
- 108010046335 Ferredoxin-NADP Reductase Proteins 0.000 claims description 36
- 101150073818 gap gene Proteins 0.000 claims description 33
- 101150091570 gapA gene Proteins 0.000 claims description 31
- 101100174653 Dictyostelium discoideum g6pd-2 gene Proteins 0.000 claims description 29
- 101150085516 ZWF1 gene Proteins 0.000 claims description 29
- 101150026856 zwf2 gene Proteins 0.000 claims description 29
- 230000004108 pentose phosphate pathway Effects 0.000 claims description 28
- 101150039774 GAPA1 gene Proteins 0.000 claims description 26
- 101100282114 Pseudomonas aeruginosa (strain UCBPP-PA14) gap2 gene Proteins 0.000 claims description 26
- 229910017108 Fe—Fe Inorganic materials 0.000 claims description 24
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 22
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 22
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 claims description 21
- 229920001184 polypeptide Polymers 0.000 claims description 20
- 108010074122 Ferredoxins Proteins 0.000 claims description 19
- 108010018962 Glucosephosphate Dehydrogenase Proteins 0.000 claims description 19
- 101100176417 Pseudoalteromonas translucida (strain TAC 125) gpmI gene Proteins 0.000 claims description 19
- 238000012239 gene modification Methods 0.000 claims description 18
- 230000005017 genetic modification Effects 0.000 claims description 18
- 235000013617 genetically modified food Nutrition 0.000 claims description 18
- 241001607889 Peptoclostridium Species 0.000 claims description 17
- 102000009569 Phosphoglucomutase Human genes 0.000 claims description 17
- 238000012258 culturing Methods 0.000 claims description 17
- 108091000115 phosphomannomutase Proteins 0.000 claims description 17
- 229930006000 Sucrose Natural products 0.000 claims description 16
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 claims description 16
- 241000195614 Volvox carteri Species 0.000 claims description 16
- 239000005720 sucrose Substances 0.000 claims description 16
- 102000004567 6-phosphogluconate dehydrogenase Human genes 0.000 claims description 15
- 108020001657 6-phosphogluconate dehydrogenase Proteins 0.000 claims description 15
- 101710159527 Maturation protein A Proteins 0.000 claims description 15
- 101710091157 Maturation protein A2 Proteins 0.000 claims description 15
- 230000001419 dependent effect Effects 0.000 claims description 15
- 108010038136 phospho-2-keto-3-deoxy-gluconate aldolase Proteins 0.000 claims description 15
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 claims description 14
- 101100190555 Dictyostelium discoideum pkgB gene Proteins 0.000 claims description 14
- 241000224467 Giardia intestinalis Species 0.000 claims description 14
- 102000001105 Phosphofructokinases Human genes 0.000 claims description 14
- 108010069341 Phosphofructokinases Proteins 0.000 claims description 14
- 101100453320 Pyrococcus furiosus (strain ATCC 43587 / DSM 3638 / JCM 8422 / Vc1) pfkC gene Proteins 0.000 claims description 14
- 101100029403 Synechocystis sp. (strain PCC 6803 / Kazusa) pfkA2 gene Proteins 0.000 claims description 14
- 241000224527 Trichomonas vaginalis Species 0.000 claims description 14
- XJLXINKUBYWONI-DQQFMEOOSA-N [[(2r,3r,4r,5r)-5-(6-aminopurin-9-yl)-3-hydroxy-4-phosphonooxyoxolan-2-yl]methoxy-hydroxyphosphoryl] [(2s,3r,4s,5s)-5-(3-carbamoylpyridin-1-ium-1-yl)-3,4-dihydroxyoxolan-2-yl]methyl phosphate Chemical compound NC(=O)C1=CC=C[N+]([C@@H]2[C@H]([C@@H](O)[C@H](COP([O-])(=O)OP(O)(=O)OC[C@@H]3[C@H]([C@@H](OP(O)(O)=O)[C@@H](O3)N3C4=NC=NC(N)=C4N=C3)O)O2)O)=C1 XJLXINKUBYWONI-DQQFMEOOSA-N 0.000 claims description 14
- 229910052799 carbon Inorganic materials 0.000 claims description 14
- 229940085435 giardia lamblia Drugs 0.000 claims description 14
- 101150008884 osmY gene Proteins 0.000 claims description 14
- 101150038284 pfkA gene Proteins 0.000 claims description 14
- 101150004013 pfkA1 gene Proteins 0.000 claims description 14
- 101150060387 pfp gene Proteins 0.000 claims description 14
- RBNPOMFGQQGHHO-UWTATZPHSA-N D-glyceric acid Chemical compound OC[C@@H](O)C(O)=O RBNPOMFGQQGHHO-UWTATZPHSA-N 0.000 claims description 13
- 230000035800 maturation Effects 0.000 claims description 13
- 229930027945 nicotinamide-adenine dinucleotide Natural products 0.000 claims description 13
- 101710088194 Dehydrogenase Proteins 0.000 claims description 12
- 108090001042 Hydro-Lyases Proteins 0.000 claims description 12
- 102000004867 Hydro-Lyases Human genes 0.000 claims description 12
- 241000411968 Ilyobacter Species 0.000 claims description 12
- 241001116693 Megasphaera micronuciformis Species 0.000 claims description 12
- 241001148135 Veillonella parvula Species 0.000 claims description 12
- 230000004913 activation Effects 0.000 claims description 12
- 150000002431 hydrogen Chemical class 0.000 claims description 12
- 230000004048 modification Effects 0.000 claims description 12
- 238000012986 modification Methods 0.000 claims description 12
- 241000976303 Entamoeba nuttalli Species 0.000 claims description 11
- 241001533207 Veillonella atypica Species 0.000 claims description 11
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 claims description 11
- 101100084110 Bacillus subtilis (strain 168) pps gene Proteins 0.000 claims description 10
- 101100137465 Escherichia coli (strain K12) ppsA gene Proteins 0.000 claims description 10
- 108700039691 Genetic Promoter Regions Proteins 0.000 claims description 10
- 101100508818 Mus musculus Inpp5k gene Proteins 0.000 claims description 10
- 102000013009 Pyruvate Kinase Human genes 0.000 claims description 10
- 108020005115 Pyruvate Kinase Proteins 0.000 claims description 10
- 229910052742 iron Inorganic materials 0.000 claims description 10
- BIRSGZKFKXLSJQ-SQOUGZDYSA-N 6-Phospho-D-gluconate Chemical compound OP(=O)(O)OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C(O)=O BIRSGZKFKXLSJQ-SQOUGZDYSA-N 0.000 claims description 9
- 101710192343 NADPH:adrenodoxin oxidoreductase, mitochondrial Proteins 0.000 claims description 9
- 101710104207 Probable NADPH:adrenodoxin oxidoreductase, mitochondrial Proteins 0.000 claims description 9
- 108020004530 Transaldolase Proteins 0.000 claims description 8
- 102100028601 Transaldolase Human genes 0.000 claims description 8
- 108010043652 Transketolase Proteins 0.000 claims description 8
- 102000014701 Transketolase Human genes 0.000 claims description 8
- 239000001963 growth medium Substances 0.000 claims description 8
- 101100404144 Bacillus subtilis (strain 168) nasD gene Proteins 0.000 claims description 7
- 101710117283 Sucrose permease Proteins 0.000 claims description 7
- 101150044129 nirB gene Proteins 0.000 claims description 7
- 101710173142 Beta-fructofuranosidase, cell wall isozyme Proteins 0.000 claims description 6
- 241000193403 Clostridium Species 0.000 claims description 6
- 241000186226 Corynebacterium glutamicum Species 0.000 claims description 6
- CWYNVVGOOAEACU-UHFFFAOYSA-N Fe2+ Chemical compound [Fe+2] CWYNVVGOOAEACU-UHFFFAOYSA-N 0.000 claims description 6
- 230000005611 electricity Effects 0.000 claims description 6
- 102000034356 gene-regulatory proteins Human genes 0.000 claims description 6
- 108091006104 gene-regulatory proteins Proteins 0.000 claims description 6
- 230000036961 partial effect Effects 0.000 claims description 6
- 102000051584 NAD kinases Human genes 0.000 claims description 5
- 108010084634 NADP phosphatase Proteins 0.000 claims description 5
- 108050007763 Soluble pyridine nucleotide transhydrogenases Proteins 0.000 claims description 5
- 101150018392 cscA gene Proteins 0.000 claims description 5
- 230000035425 carbon utilization Effects 0.000 claims description 4
- 230000004777 loss-of-function mutation Effects 0.000 claims description 4
- 101100061504 Escherichia coli cscB gene Proteins 0.000 claims description 3
- 238000005265 energy consumption Methods 0.000 claims description 3
- 230000001502 supplementing effect Effects 0.000 claims description 3
- 108020000005 Sucrose phosphorylase Proteins 0.000 claims description 2
- 238000004113 cell culture Methods 0.000 claims description 2
- 102000001762 6-phosphogluconolactonase Human genes 0.000 claims 2
- 102000001390 Fructose-Bisphosphate Aldolase Human genes 0.000 claims 2
- 102000006602 glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 claims 2
- VTLYFUHAOXGGBS-UHFFFAOYSA-N Fe3+ Chemical compound [Fe+3] VTLYFUHAOXGGBS-UHFFFAOYSA-N 0.000 claims 1
- 108010068561 Fructose-Bisphosphate Aldolase Proteins 0.000 claims 1
- 230000001413 cellular effect Effects 0.000 claims 1
- JEIPFZHSYJVQDO-UHFFFAOYSA-N iron(III) oxide Inorganic materials O=[Fe]O[Fe]=O JEIPFZHSYJVQDO-UHFFFAOYSA-N 0.000 claims 1
- 101150053253 pgi gene Proteins 0.000 claims 1
- 210000004027 cell Anatomy 0.000 description 116
- 235000018102 proteins Nutrition 0.000 description 112
- 108020004414 DNA Proteins 0.000 description 44
- 230000001965 increasing effect Effects 0.000 description 42
- 102000004190 Enzymes Human genes 0.000 description 31
- 108090000790 Enzymes Proteins 0.000 description 31
- 239000000446 fuel Substances 0.000 description 31
- 101150106193 tal gene Proteins 0.000 description 28
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 25
- 239000013598 vector Substances 0.000 description 24
- 239000008103 glucose Substances 0.000 description 22
- 239000007789 gas Substances 0.000 description 21
- 108091008053 gene clusters Proteins 0.000 description 21
- 101150049837 PGM gene Proteins 0.000 description 20
- 239000007800 oxidant agent Substances 0.000 description 20
- 101100121991 Chlamydia pneumoniae glmM gene Proteins 0.000 description 18
- 101000964041 Escherichia coli (strain K12) 6-phosphogluconolactonase Proteins 0.000 description 17
- 239000013612 plasmid Substances 0.000 description 17
- 101150053890 EDA gene Proteins 0.000 description 16
- 101150107914 Ubr5 gene Proteins 0.000 description 16
- 101150090240 edd gene Proteins 0.000 description 16
- 101100010672 Mycobacterium leprae (strain TN) dxs gene Proteins 0.000 description 14
- 101150024271 TKT gene Proteins 0.000 description 14
- 238000006243 chemical reaction Methods 0.000 description 14
- 101150110498 talA gene Proteins 0.000 description 14
- 101150040618 talB gene Proteins 0.000 description 14
- 101150014795 tktA gene Proteins 0.000 description 14
- 101150071019 tktB gene Proteins 0.000 description 14
- 125000003275 alpha amino acid group Chemical group 0.000 description 13
- 230000002829 reductive effect Effects 0.000 description 13
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 12
- 238000013459 approach Methods 0.000 description 12
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 11
- 230000035772 mutation Effects 0.000 description 11
- 241000195585 Chlamydomonas Species 0.000 description 10
- 238000012217 deletion Methods 0.000 description 10
- 230000037430 deletion Effects 0.000 description 10
- 230000001105 regulatory effect Effects 0.000 description 10
- 102100031181 Glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 9
- 241000125969 Lachnoclostridium Species 0.000 description 9
- 238000007792 addition Methods 0.000 description 9
- 239000013604 expression vector Substances 0.000 description 9
- 239000000463 material Substances 0.000 description 9
- XKRFYHLGVUSROY-UHFFFAOYSA-N Argon Chemical compound [Ar] XKRFYHLGVUSROY-UHFFFAOYSA-N 0.000 description 8
- 241000193454 Clostridium beijerinckii Species 0.000 description 8
- 102100035172 Glucose-6-phosphate 1-dehydrogenase Human genes 0.000 description 8
- LCTONWCANYUPML-UHFFFAOYSA-N Pyruvic acid Chemical compound CC(=O)C(O)=O LCTONWCANYUPML-UHFFFAOYSA-N 0.000 description 8
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 8
- 239000006143 cell culture medium Substances 0.000 description 8
- 230000034659 glycolysis Effects 0.000 description 8
- 239000001301 oxygen Substances 0.000 description 8
- 229910052760 oxygen Inorganic materials 0.000 description 8
- 238000013518 transcription Methods 0.000 description 8
- 230000035897 transcription Effects 0.000 description 8
- 241000894006 Bacteria Species 0.000 description 7
- 108091026890 Coding region Proteins 0.000 description 7
- 101710155861 Glucose-6-phosphate 1-dehydrogenase Proteins 0.000 description 7
- 230000004151 fermentation Effects 0.000 description 7
- 238000000855 fermentation Methods 0.000 description 7
- 230000005764 inhibitory process Effects 0.000 description 7
- 230000001590 oxidative effect Effects 0.000 description 7
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 6
- 101710191461 F420-dependent glucose-6-phosphate dehydrogenase Proteins 0.000 description 6
- 101710174622 Glucose-6-phosphate 1-dehydrogenase, chloroplastic Proteins 0.000 description 6
- 101710137456 Glucose-6-phosphate 1-dehydrogenase, cytoplasmic isoform Proteins 0.000 description 6
- 108010070600 Glucose-6-phosphate isomerase Proteins 0.000 description 6
- 102000005731 Glucose-6-phosphate isomerase Human genes 0.000 description 6
- 230000001580 bacterial effect Effects 0.000 description 6
- 229910002092 carbon dioxide Inorganic materials 0.000 description 6
- 239000003638 chemical reducing agent Substances 0.000 description 6
- 239000003795 chemical substances by application Substances 0.000 description 6
- 230000002018 overexpression Effects 0.000 description 6
- 230000001131 transforming effect Effects 0.000 description 6
- IJOJIVNDFQSGAB-SQOUGZDYSA-N 6-O-phosphono-D-glucono-1,5-lactone Chemical compound O[C@H]1[C@H](O)[C@@H](COP(O)(O)=O)OC(=O)[C@@H]1O IJOJIVNDFQSGAB-SQOUGZDYSA-N 0.000 description 5
- 241001509477 Clostridium intestinale Species 0.000 description 5
- 108010076504 Protein Sorting Signals Proteins 0.000 description 5
- BGWGXPAPYGQALX-ARQDHWQXSA-N beta-D-fructofuranose 6-phosphate Chemical compound OC[C@@]1(O)O[C@H](COP(O)(O)=O)[C@@H](O)[C@@H]1O BGWGXPAPYGQALX-ARQDHWQXSA-N 0.000 description 5
- 150000001720 carbohydrates Chemical class 0.000 description 5
- 235000014633 carbohydrates Nutrition 0.000 description 5
- 239000001569 carbon dioxide Substances 0.000 description 5
- 239000010411 electrocatalyst Substances 0.000 description 5
- 238000010362 genome editing Methods 0.000 description 5
- 239000000543 intermediate Substances 0.000 description 5
- 229910052757 nitrogen Inorganic materials 0.000 description 5
- 239000002773 nucleotide Substances 0.000 description 5
- 125000003729 nucleotide group Chemical group 0.000 description 5
- 230000003647 oxidation Effects 0.000 description 5
- 238000007254 oxidation reaction Methods 0.000 description 5
- 101150029756 petF gene Proteins 0.000 description 5
- 239000000047 product Substances 0.000 description 5
- 150000003384 small molecules Chemical class 0.000 description 5
- 238000010561 standard procedure Methods 0.000 description 5
- 230000009466 transformation Effects 0.000 description 5
- LXJXRIRHZLFYRP-VKHMYHEASA-L (R)-2-Hydroxy-3-(phosphonooxy)-propanal Natural products O=C[C@H](O)COP([O-])([O-])=O LXJXRIRHZLFYRP-VKHMYHEASA-L 0.000 description 4
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 4
- 241001454341 Candidatus Omnitrophus fodinae Species 0.000 description 4
- 241000186320 Cellulomonas fimi Species 0.000 description 4
- 241000497271 Chlorella variabilis Species 0.000 description 4
- 241000719667 Clostridium arbusti Species 0.000 description 4
- 241000206044 Clostridium chauvoei Species 0.000 description 4
- 241000788977 Clostridium colicanis Species 0.000 description 4
- 241000193468 Clostridium perfringens Species 0.000 description 4
- 241000193452 Clostridium tyrobutyricum Species 0.000 description 4
- 241000195493 Cryptophyta Species 0.000 description 4
- NBSCHQHZLSJFNQ-GASJEMHNSA-N D-Glucose 6-phosphate Chemical compound OC1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H](O)[C@H]1O NBSCHQHZLSJFNQ-GASJEMHNSA-N 0.000 description 4
- LXJXRIRHZLFYRP-VKHMYHEASA-N D-glyceraldehyde 3-phosphate Chemical compound O=C[C@H](O)COP(O)(O)=O LXJXRIRHZLFYRP-VKHMYHEASA-N 0.000 description 4
- 241000974585 Desulfotomaculum hydrothermale Species 0.000 description 4
- 241000592830 Desulfotomaculum kuznetsovii Species 0.000 description 4
- 241000206218 Fervidobacterium nodosum Species 0.000 description 4
- 241000605956 Fusobacterium mortiferum Species 0.000 description 4
- 241000605952 Fusobacterium necrophorum Species 0.000 description 4
- 241000605991 Fusobacterium ulcerans Species 0.000 description 4
- VFRROHXSMXFLSN-UHFFFAOYSA-N Glc6P Natural products OP(=O)(O)OCC(O)C(O)C(O)C(O)C=O VFRROHXSMXFLSN-UHFFFAOYSA-N 0.000 description 4
- 241000933069 Lachnoclostridium phytofermentans Species 0.000 description 4
- 241000224437 Naegleria gruberi Species 0.000 description 4
- 229910019142 PO4 Inorganic materials 0.000 description 4
- 241001459585 Pelosinus fermentans Species 0.000 description 4
- 241001528479 Pseudoflavonifractor capillosus Species 0.000 description 4
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 4
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 4
- 102000018120 Recombinases Human genes 0.000 description 4
- 108010091086 Recombinases Proteins 0.000 description 4
- 241000193448 Ruminiclostridium thermocellum Species 0.000 description 4
- 241000123713 Sutterella wadsworthensis Species 0.000 description 4
- 241001670075 Syntrophothermus lipocalidus Species 0.000 description 4
- 241000334089 Thermotoga petrophila Species 0.000 description 4
- 241000605259 Thiomicrospira pelophila Species 0.000 description 4
- 241000588902 Zymomonas mobilis Species 0.000 description 4
- 229910052786 argon Inorganic materials 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000002255 enzymatic effect Effects 0.000 description 4
- 230000001939 inductive effect Effects 0.000 description 4
- 108010072136 iron hydrogenase Proteins 0.000 description 4
- 239000003550 marker Substances 0.000 description 4
- 239000002609 medium Substances 0.000 description 4
- 230000004060 metabolic process Effects 0.000 description 4
- 101150112257 petF1 gene Proteins 0.000 description 4
- 239000010452 phosphate Substances 0.000 description 4
- BASFCYQUMIYNBI-UHFFFAOYSA-N platinum Chemical compound [Pt] BASFCYQUMIYNBI-UHFFFAOYSA-N 0.000 description 4
- 229940107700 pyruvic acid Drugs 0.000 description 4
- 239000000523 sample Substances 0.000 description 4
- 241000894007 species Species 0.000 description 4
- 230000014616 translation Effects 0.000 description 4
- 241000147155 Ammonifex degensii Species 0.000 description 3
- 101100432072 Bacillus subtilis (strain 168) yfjB gene Proteins 0.000 description 3
- 108091033409 CRISPR Proteins 0.000 description 3
- 241001139343 Cetobacterium somerae Species 0.000 description 3
- 108700010070 Codon Usage Proteins 0.000 description 3
- GSXOAOHZAIYLCY-UHFFFAOYSA-N D-F6P Natural products OCC(=O)C(O)C(O)C(O)COP(O)(O)=O GSXOAOHZAIYLCY-UHFFFAOYSA-N 0.000 description 3
- 101100106949 Escherichia coli (strain K12) yubM gene Proteins 0.000 description 3
- 241000620209 Escherichia coli DH5[alpha] Species 0.000 description 3
- 241000192130 Leuconostoc mesenteroides Species 0.000 description 3
- 102100036777 NADPH:adrenodoxin oxidoreductase, mitochondrial Human genes 0.000 description 3
- 238000005481 NMR spectroscopy Methods 0.000 description 3
- 229910003271 Ni-Fe Inorganic materials 0.000 description 3
- 102000001253 Protein Kinase Human genes 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- 241000520826 Thermodesulfovibrio islandicus Species 0.000 description 3
- 108700040099 Xylose isomerases Proteins 0.000 description 3
- 239000003242 anti bacterial agent Substances 0.000 description 3
- 239000003054 catalyst Substances 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 3
- 230000004907 flux Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000004817 gas chromatography Methods 0.000 description 3
- 230000002414 glycolytic effect Effects 0.000 description 3
- 230000012010 growth Effects 0.000 description 3
- 238000011534 incubation Methods 0.000 description 3
- 230000006698 induction Effects 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 230000000813 microbial effect Effects 0.000 description 3
- 101150084853 nadK gene Proteins 0.000 description 3
- 230000007935 neutral effect Effects 0.000 description 3
- 150000007524 organic acids Chemical class 0.000 description 3
- 235000005985 organic acids Nutrition 0.000 description 3
- 108060006633 protein kinase Proteins 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 150000003839 salts Chemical class 0.000 description 3
- 101150033131 sthA gene Proteins 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 2
- 101710090429 2,3-bisphosphoglycerate-dependent phosphoglycerate mutase Proteins 0.000 description 2
- 101710146710 2,3-bisphosphoglycerate-independent phosphoglycerate mutase Proteins 0.000 description 2
- XTWYTFMLZFPYCI-KQYNXXCUSA-N 5'-adenylphosphoric acid Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O XTWYTFMLZFPYCI-KQYNXXCUSA-N 0.000 description 2
- XTWYTFMLZFPYCI-UHFFFAOYSA-N Adenosine diphosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(=O)OP(O)(O)=O)C(O)C1O XTWYTFMLZFPYCI-UHFFFAOYSA-N 0.000 description 2
- 108020005544 Antisense RNA Proteins 0.000 description 2
- 244000063299 Bacillus subtilis Species 0.000 description 2
- 235000014469 Bacillus subtilis Nutrition 0.000 description 2
- UGFAIRIUMAVXCW-UHFFFAOYSA-N Carbon monoxide Chemical compound [O+]#[C-] UGFAIRIUMAVXCW-UHFFFAOYSA-N 0.000 description 2
- 241000195628 Chlorophyta Species 0.000 description 2
- 241000193401 Clostridium acetobutylicum Species 0.000 description 2
- FNZLKVNUWIIPSJ-UHNVWZDZSA-N D-ribulose 5-phosphate Chemical compound OCC(=O)[C@H](O)[C@H](O)COP(O)(O)=O FNZLKVNUWIIPSJ-UHNVWZDZSA-N 0.000 description 2
- XLYOFNOQVPJJNP-ZSJDYOACSA-N Heavy water Chemical compound [2H]O[2H] XLYOFNOQVPJJNP-ZSJDYOACSA-N 0.000 description 2
- 101001112714 Homo sapiens NAD kinase Proteins 0.000 description 2
- UQSXHKLRYXJYBZ-UHFFFAOYSA-N Iron oxide Chemical compound [Fe]=O UQSXHKLRYXJYBZ-UHFFFAOYSA-N 0.000 description 2
- 229910001030 Iron–nickel alloy Inorganic materials 0.000 description 2
- 241000186610 Lactobacillus sp. Species 0.000 description 2
- 241000604449 Megasphaera Species 0.000 description 2
- 102100023515 NAD kinase Human genes 0.000 description 2
- 241000193157 Paraclostridium bifermentans Species 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 2
- 101710171275 Probable 2,3-bisphosphoglycerate-independent phosphoglycerate mutase Proteins 0.000 description 2
- 101100507983 Pyrococcus furiosus (strain ATCC 43587 / DSM 3638 / JCM 8422 / Vc1) hydG gene Proteins 0.000 description 2
- FNZLKVNUWIIPSJ-UHFFFAOYSA-N Rbl5P Natural products OCC(=O)C(O)C(O)COP(O)(O)=O FNZLKVNUWIIPSJ-UHFFFAOYSA-N 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 2
- 108091027967 Small hairpin RNA Proteins 0.000 description 2
- 108020004459 Small interfering RNA Proteins 0.000 description 2
- 241000194022 Streptococcus sp. Species 0.000 description 2
- 101710095051 Sucrose kinase Proteins 0.000 description 2
- 241000605261 Thiomicrospira Species 0.000 description 2
- 241001148134 Veillonella Species 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 2
- 239000000654 additive Substances 0.000 description 2
- 229940088710 antibiotic agent Drugs 0.000 description 2
- 230000004071 biological effect Effects 0.000 description 2
- 229910002091 carbon monoxide Inorganic materials 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 239000004020 conductor Substances 0.000 description 2
- 101150075169 cscB gene Proteins 0.000 description 2
- 238000003487 electrochemical reaction Methods 0.000 description 2
- 239000003792 electrolyte Substances 0.000 description 2
- 238000001952 enzyme assay Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 125000004072 flavinyl group Chemical group 0.000 description 2
- 235000013305 food Nutrition 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- 229910002804 graphite Inorganic materials 0.000 description 2
- 239000010439 graphite Substances 0.000 description 2
- 230000001976 improved effect Effects 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 230000002779 inactivation Effects 0.000 description 2
- 239000011261 inert gas Substances 0.000 description 2
- 239000003112 inhibitor Substances 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- JVTAAEKCZFNVCJ-UHFFFAOYSA-N lactic acid Chemical compound CC(O)C(O)=O JVTAAEKCZFNVCJ-UHFFFAOYSA-N 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- BOPGDPNILDQYTO-NNYOXOHSSA-N nicotinamide-adenine dinucleotide Chemical compound C1=CCC(C(=O)N)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OC[C@@H]2[C@H]([C@@H](O)[C@@H](O2)N2C3=NC=NC(N)=C3N=C2)O)O1 BOPGDPNILDQYTO-NNYOXOHSSA-N 0.000 description 2
- 238000001139 pH measurement Methods 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 239000008188 pellet Substances 0.000 description 2
- 101150104606 pgl gene Proteins 0.000 description 2
- 108010022393 phosphogluconate dehydratase Proteins 0.000 description 2
- 229910052697 platinum Inorganic materials 0.000 description 2
- -1 promoters Substances 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 230000000630 rising effect Effects 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- KDYFGRWQOYBRFD-UHFFFAOYSA-N succinic acid Chemical compound OC(=O)CCC(O)=O KDYFGRWQOYBRFD-UHFFFAOYSA-N 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- 150000007970 thio esters Chemical class 0.000 description 2
- 101150061497 zraR gene Proteins 0.000 description 2
- VSFVNSKIFJPFIN-SQOUGZDYSA-N (2r,3s,4s,5r)-2,3,4,6-tetrahydroxy-5-phosphonooxyhexanoic acid Chemical compound OP(=O)(O)O[C@H](CO)[C@@H](O)[C@H](O)[C@@H](O)C(O)=O VSFVNSKIFJPFIN-SQOUGZDYSA-N 0.000 description 1
- 108050004624 2,3-bisphosphoglycerate-independent phosphoglycerate mutases Proteins 0.000 description 1
- ZKBSDMGDEJPNGS-UHFFFAOYSA-N 2,3-dihydroxypropanoic acid Chemical compound OCC(O)C(O)=O.OCC(O)C(O)=O ZKBSDMGDEJPNGS-UHFFFAOYSA-N 0.000 description 1
- GXIURPTVHJPJLF-UWTATZPHSA-N 2-phospho-D-glyceric acid Chemical compound OC[C@H](C(O)=O)OP(O)(O)=O GXIURPTVHJPJLF-UWTATZPHSA-N 0.000 description 1
- OSJPPGNTCRNQQC-UWTATZPHSA-N 3-phospho-D-glyceric acid Chemical compound OC(=O)[C@H](O)COP(O)(O)=O OSJPPGNTCRNQQC-UWTATZPHSA-N 0.000 description 1
- LJQLQCAXBUHEAZ-UWTATZPHSA-N 3-phospho-D-glyceroyl dihydrogen phosphate Chemical compound OP(=O)(O)OC[C@@H](O)C(=O)OP(O)(O)=O LJQLQCAXBUHEAZ-UWTATZPHSA-N 0.000 description 1
- FVFVNNKYKYZTJU-UHFFFAOYSA-N 6-chloro-1,3,5-triazine-2,4-diamine Chemical group NC1=NC(N)=NC(Cl)=N1 FVFVNNKYKYZTJU-UHFFFAOYSA-N 0.000 description 1
- 102100028207 6-phosphogluconate dehydrogenase, decarboxylating Human genes 0.000 description 1
- 102100040353 6-phosphogluconolactonase Human genes 0.000 description 1
- BIRSGZKFKXLSJQ-SQOUGZDYSA-K 6-phosphonatooxy-D-gluconate Chemical compound [O-]P(=O)([O-])OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C([O-])=O BIRSGZKFKXLSJQ-SQOUGZDYSA-K 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 1
- ZKHQWZAMYRWXGA-KQYNXXCUSA-N Adenosine triphosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O ZKHQWZAMYRWXGA-KQYNXXCUSA-N 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- 241000147157 Ammonifex Species 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- 102100026189 Beta-galactosidase Human genes 0.000 description 1
- 239000002028 Biomass Substances 0.000 description 1
- 108010029692 Bisphosphoglycerate mutase Proteins 0.000 description 1
- 229910001369 Brass Inorganic materials 0.000 description 1
- 238000010354 CRISPR gene editing Methods 0.000 description 1
- 108010078791 Carrier Proteins Proteins 0.000 description 1
- 241001051186 Cetobacterium Species 0.000 description 1
- RGJOEKWQDUBAIZ-IBOSZNHHSA-N CoASH Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCS)O[C@H]1N1C2=NC=NC(N)=C2N=C1 RGJOEKWQDUBAIZ-IBOSZNHHSA-N 0.000 description 1
- RGHNJXZEOKUKBD-SQOUGZDYSA-M D-gluconate Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C([O-])=O RGHNJXZEOKUKBD-SQOUGZDYSA-M 0.000 description 1
- ZAQJHHRNXZUBTE-NQXXGFSBSA-N D-ribulose Chemical compound OC[C@@H](O)[C@@H](O)C(=O)CO ZAQJHHRNXZUBTE-NQXXGFSBSA-N 0.000 description 1
- ZAQJHHRNXZUBTE-UHFFFAOYSA-N D-threo-2-Pentulose Natural products OCC(O)C(O)C(=O)CO ZAQJHHRNXZUBTE-UHFFFAOYSA-N 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 102100031780 Endonuclease Human genes 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 241000224431 Entamoeba Species 0.000 description 1
- 241000588722 Escherichia Species 0.000 description 1
- 101100122730 Escherichia coli (strain K12) gpmI gene Proteins 0.000 description 1
- 101100125338 Escherichia coli (strain K12) hypF gene Proteins 0.000 description 1
- 101100309698 Escherichia coli cscK gene Proteins 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 101150112014 Gapdh gene Proteins 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- 229940123611 Genome editing Drugs 0.000 description 1
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 1
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 1
- 108020005004 Guide RNA Proteins 0.000 description 1
- 101100299372 Hydrogenobacter thermophilus (strain DSM 6534 / IAM 12695 / TK-6) pspA gene Proteins 0.000 description 1
- 102000004157 Hydrolases Human genes 0.000 description 1
- 108090000604 Hydrolases Proteins 0.000 description 1
- 102000005385 Intramolecular Transferases Human genes 0.000 description 1
- 108010031311 Intramolecular Transferases Proteins 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- 108700011259 MicroRNAs Proteins 0.000 description 1
- 229930192392 Mitomycin Natural products 0.000 description 1
- NWIBSHFKIJFRCO-WUDYKRTCSA-N Mytomycin Chemical compound C1N2C(C(C(C)=C(N)C3=O)=O)=C3[C@@H](COC(N)=O)[C@@]2(OC)[C@@H]2[C@H]1N2 NWIBSHFKIJFRCO-WUDYKRTCSA-N 0.000 description 1
- 101150042817 NFS1 gene Proteins 0.000 description 1
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 1
- 102000011025 Phosphoglycerate Mutase Human genes 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 241000589516 Pseudomonas Species 0.000 description 1
- LCTONWCANYUPML-UHFFFAOYSA-M Pyruvate Chemical compound CC(=O)C([O-])=O LCTONWCANYUPML-UHFFFAOYSA-M 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- AUNGANRZJHBGPY-SCRDCRAPSA-N Riboflavin Chemical compound OC[C@@H](O)[C@@H](O)[C@@H](O)CN1C=2C=C(C)C(C)=CC=2N=C2C1=NC(=O)NC2=O AUNGANRZJHBGPY-SCRDCRAPSA-N 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 101100126298 Rickettsia conorii (strain ATCC VR-613 / Malish 7) iscS gene Proteins 0.000 description 1
- 101150114492 SPL1 gene Proteins 0.000 description 1
- 241000607142 Salmonella Species 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 102100038014 Succinate dehydrogenase [ubiquinone] cytochrome b small subunit, mitochondrial Human genes 0.000 description 1
- 241000624635 Syntrophothermus Species 0.000 description 1
- 239000004809 Teflon Substances 0.000 description 1
- 229920006362 Teflon® Polymers 0.000 description 1
- 108020005038 Terminator Codon Proteins 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- VFRROHXSMXFLSN-KCDKBNATSA-N aldehydo-D-galactose 6-phosphate Chemical compound OP(=O)(O)OC[C@@H](O)[C@H](O)[C@H](O)[C@@H](O)C=O VFRROHXSMXFLSN-KCDKBNATSA-N 0.000 description 1
- RNBGYGVWRKECFJ-ZXXMMSQZSA-N alpha-D-fructofuranose 1,6-bisphosphate Chemical compound O[C@H]1[C@H](O)[C@](O)(COP(O)(O)=O)O[C@@H]1COP(O)(O)=O RNBGYGVWRKECFJ-ZXXMMSQZSA-N 0.000 description 1
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 239000012298 atmosphere Substances 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- 108010051210 beta-Fructofuranosidase Proteins 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 239000010951 brass Substances 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 239000000648 calcium alginate Substances 0.000 description 1
- 235000010410 calcium alginate Nutrition 0.000 description 1
- 229960002681 calcium alginate Drugs 0.000 description 1
- OKHHGHGGPDJQHR-YMOPUZKJSA-L calcium;(2s,3s,4s,5s,6r)-6-[(2r,3s,4r,5s,6r)-2-carboxy-6-[(2r,3s,4r,5s,6r)-2-carboxylato-4,5,6-trihydroxyoxan-3-yl]oxy-4,5-dihydroxyoxan-3-yl]oxy-3,4,5-trihydroxyoxane-2-carboxylate Chemical compound [Ca+2].O[C@@H]1[C@H](O)[C@H](O)O[C@@H](C([O-])=O)[C@H]1O[C@H]1[C@@H](O)[C@@H](O)[C@H](O[C@H]2[C@H]([C@@H](O)[C@H](O)[C@H](O2)C([O-])=O)O)[C@H](C(O)=O)O1 OKHHGHGGPDJQHR-YMOPUZKJSA-L 0.000 description 1
- QUWFRIXVAWMRBG-UHFFFAOYSA-L calcium;acetate;chloride Chemical compound [Cl-].[Ca+2].CC([O-])=O QUWFRIXVAWMRBG-UHFFFAOYSA-L 0.000 description 1
- OKTJSMMVPCPJKN-YPZZEJLDSA-N carbon-10 atom Chemical compound [10C] OKTJSMMVPCPJKN-YPZZEJLDSA-N 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 239000012159 carrier gas Substances 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 229960005091 chloramphenicol Drugs 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 239000013599 cloning vector Substances 0.000 description 1
- RGJOEKWQDUBAIZ-UHFFFAOYSA-N coenzime A Natural products OC1C(OP(O)(O)=O)C(COP(O)(=O)OP(O)(=O)OCC(C)(C)C(O)C(=O)NCCC(=O)NCCS)OC1N1C2=NC=NC(N)=C2N=C1 RGJOEKWQDUBAIZ-UHFFFAOYSA-N 0.000 description 1
- 239000005516 coenzyme A Substances 0.000 description 1
- 229940093530 coenzyme a Drugs 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 101150091121 cscR gene Proteins 0.000 description 1
- 238000012136 culture method Methods 0.000 description 1
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 1
- 238000006114 decarboxylation reaction Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- KDTSHFARGAKYJN-UHFFFAOYSA-N dephosphocoenzyme A Natural products OC1C(O)C(COP(O)(=O)OP(O)(=O)OCC(C)(C)C(O)C(=O)NCCC(=O)NCCS)OC1N1C2=NC=NC(N)=C2N=C1 KDTSHFARGAKYJN-UHFFFAOYSA-N 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 229910001873 dinitrogen Inorganic materials 0.000 description 1
- 238000010494 dissociation reaction Methods 0.000 description 1
- 230000005593 dissociations Effects 0.000 description 1
- GRWZHXKQBITJKP-UHFFFAOYSA-L dithionite(2-) Chemical compound [O-]S(=O)S([O-])=O GRWZHXKQBITJKP-UHFFFAOYSA-L 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 108091006047 fluorescent proteins Proteins 0.000 description 1
- 102000034287 fluorescent proteins Human genes 0.000 description 1
- 239000006260 foam Substances 0.000 description 1
- 239000002803 fossil fuel Substances 0.000 description 1
- 238000007672 fourth generation sequencing Methods 0.000 description 1
- 231100000221 frame shift mutation induction Toxicity 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 229940025237 fructose 1,6-diphosphate Drugs 0.000 description 1
- 239000002737 fuel gas Substances 0.000 description 1
- 230000004077 genetic alteration Effects 0.000 description 1
- 231100000118 genetic alteration Toxicity 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 229940050410 gluconate Drugs 0.000 description 1
- 239000005090 green fluorescent protein Substances 0.000 description 1
- 239000005431 greenhouse gas Substances 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 239000001307 helium Substances 0.000 description 1
- 229910052734 helium Inorganic materials 0.000 description 1
- SWQJXJOGLNCZEY-UHFFFAOYSA-N helium atom Chemical compound [He] SWQJXJOGLNCZEY-UHFFFAOYSA-N 0.000 description 1
- 150000002373 hemiacetals Chemical class 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 101150029013 hydA gene Proteins 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 230000000415 inactivating effect Effects 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 239000003999 initiator Substances 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 229910052816 inorganic phosphate Inorganic materials 0.000 description 1
- 235000011073 invertase Nutrition 0.000 description 1
- 239000001573 invertase Substances 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 229910000358 iron sulfate Inorganic materials 0.000 description 1
- BAUYGSIQEAFULO-UHFFFAOYSA-L iron(2+) sulfate (anhydrous) Chemical compound [Fe+2].[O-]S([O-])(=O)=O BAUYGSIQEAFULO-UHFFFAOYSA-L 0.000 description 1
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 1
- OOYGSFOGFJDDHP-KMCOLRRFSA-N kanamycin A sulfate Chemical compound OS(O)(=O)=O.O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N OOYGSFOGFJDDHP-KMCOLRRFSA-N 0.000 description 1
- 229960002064 kanamycin sulfate Drugs 0.000 description 1
- ZKLLSNQJRLJIGT-UYFOZJQFSA-N keto-D-fructose 1-phosphate Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C(=O)COP(O)(O)=O ZKLLSNQJRLJIGT-UYFOZJQFSA-N 0.000 description 1
- 239000004310 lactic acid Substances 0.000 description 1
- 235000014655 lactic acid Nutrition 0.000 description 1
- 238000009630 liquid culture Methods 0.000 description 1
- XIXADJRWDQXREU-UHFFFAOYSA-M lithium acetate Chemical compound [Li+].CC([O-])=O XIXADJRWDQXREU-UHFFFAOYSA-M 0.000 description 1
- 230000001320 lysogenic effect Effects 0.000 description 1
- 230000002101 lytic effect Effects 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 230000037353 metabolic pathway Effects 0.000 description 1
- 108091070501 miRNA Proteins 0.000 description 1
- 238000009629 microbiological culture Methods 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 230000000116 mitigating effect Effects 0.000 description 1
- 229960004857 mitomycin Drugs 0.000 description 1
- 230000011278 mitosis Effects 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 229910052754 neon Inorganic materials 0.000 description 1
- GKAOGPIIYCISHV-UHFFFAOYSA-N neon atom Chemical compound [Ne] GKAOGPIIYCISHV-UHFFFAOYSA-N 0.000 description 1
- 238000000655 nuclear magnetic resonance spectrum Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 239000002853 nucleic acid probe Substances 0.000 description 1
- 230000000269 nucleophilic effect Effects 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 230000035764 nutrition Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000012261 overproduction Methods 0.000 description 1
- 238000005895 oxidative decarboxylation reaction Methods 0.000 description 1
- 230000010627 oxidative phosphorylation Effects 0.000 description 1
- 101150031287 petH gene Proteins 0.000 description 1
- 101150016647 pgmA gene Proteins 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- DTBNBXWJWCWCIK-UHFFFAOYSA-K phosphonatoenolpyruvate Chemical compound [O-]C(=O)C(=C)OP([O-])([O-])=O DTBNBXWJWCWCIK-UHFFFAOYSA-K 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 230000000258 photobiological effect Effects 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 231100000572 poisoning Toxicity 0.000 description 1
- 230000000607 poisoning effect Effects 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 230000023603 positive regulation of transcription initiation, DNA-dependent Effects 0.000 description 1
- 238000010248 power generation Methods 0.000 description 1
- 101150043515 pps gene Proteins 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 230000004952 protein activity Effects 0.000 description 1
- 230000012846 protein folding Effects 0.000 description 1
- 229940076788 pyruvate Drugs 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000002708 random mutagenesis Methods 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 230000001718 repressive effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 108010008988 reversible hydrogenase Proteins 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000013341 scale-up Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- JVBXVOWTABLYPX-UHFFFAOYSA-L sodium dithionite Chemical compound [Na+].[Na+].[O-]S(=O)S([O-])=O JVBXVOWTABLYPX-UHFFFAOYSA-L 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 239000002915 spent fuel radioactive waste Substances 0.000 description 1
- 229910001220 stainless steel Inorganic materials 0.000 description 1
- 239000010935 stainless steel Substances 0.000 description 1
- 238000012289 standard assay Methods 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- KDYFGRWQOYBRFD-UHFFFAOYSA-L succinate(2-) Chemical compound [O-]C(=O)CCC([O-])=O KDYFGRWQOYBRFD-UHFFFAOYSA-L 0.000 description 1
- 239000001384 succinic acid Substances 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000003827 upregulation Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/405—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from algae
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/79—Transferrins, e.g. lactoferrins, ovotransferrins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
- C12N1/20—Bacteria; Culture media therefor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0006—Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0067—Oxidoreductases (1.) acting on hydrogen as donor (1.12)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0095—Oxidoreductases (1.) acting on iron-sulfur proteins as donor (1.18)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P3/00—Preparation of elements or inorganic compounds except carbon dioxide
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y101/00—Oxidoreductases acting on the CH-OH group of donors (1.1)
- C12Y101/01—Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y112/00—Oxidoreductases acting on hydrogen as donor (1.12)
- C12Y112/07—Oxidoreductases acting on hydrogen as donor (1.12) with an iron-sulfur protein as acceptor (1.12.7)
- C12Y112/07002—Ferredoxin hydrogenase (1.12.7.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y112/00—Oxidoreductases acting on hydrogen as donor (1.12)
- C12Y112/99—Oxidoreductases acting on hydrogen as donor (1.12) with other acceptors (1.12.99)
- C12Y112/99006—Hydrogenase (acceptor) (1.12.99.6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y118/00—Oxidoreductases acting on iron-sulfur proteins as donors (1.18)
- C12Y118/01—Oxidoreductases acting on iron-sulfur proteins as donors (1.18) with NAD+ or NADP+ as acceptor (1.18.1)
- C12Y118/01002—Ferredoxin-NADP+ reductase (1.18.1.2)
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01M—PROCESSES OR MEANS, e.g. BATTERIES, FOR THE DIRECT CONVERSION OF CHEMICAL ENERGY INTO ELECTRICAL ENERGY
- H01M8/00—Fuel cells; Manufacture thereof
- H01M8/06—Combination of fuel cells with means for production of reactants or for treatment of residues
- H01M8/0606—Combination of fuel cells with means for production of reactants or for treatment of residues with means for production of gaseous reactants
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01M—PROCESSES OR MEANS, e.g. BATTERIES, FOR THE DIRECT CONVERSION OF CHEMICAL ENERGY INTO ELECTRICAL ENERGY
- H01M8/00—Fuel cells; Manufacture thereof
- H01M8/10—Fuel cells with solid electrolytes
- H01M8/1007—Fuel cells with solid electrolytes with both reactants being gaseous or vaporised
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2510/00—Genetically modified cells
- C12N2510/02—Cells for production
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/10—Plasmid DNA
- C12N2800/101—Plasmid DNA for bacteria
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P1/00—Preparation of compounds or compositions, not provided for in groups C12P3/00 - C12P39/00, by using microorganisms or enzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P1/00—Preparation of compounds or compositions, not provided for in groups C12P3/00 - C12P39/00, by using microorganisms or enzymes
- C12P1/04—Preparation of compounds or compositions, not provided for in groups C12P3/00 - C12P39/00, by using microorganisms or enzymes by using bacteria
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01M—PROCESSES OR MEANS, e.g. BATTERIES, FOR THE DIRECT CONVERSION OF CHEMICAL ENERGY INTO ELECTRICAL ENERGY
- H01M8/00—Fuel cells; Manufacture thereof
- H01M8/16—Biochemical fuel cells, i.e. cells in which microorganisms function as catalysts
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E60/00—Enabling technologies; Technologies with a potential or indirect contribution to GHG emissions mitigation
- Y02E60/30—Hydrogen technology
- Y02E60/50—Fuel cells
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Medicinal Chemistry (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Sustainable Energy (AREA)
- Electrochemistry (AREA)
- Manufacturing & Machinery (AREA)
- Sustainable Development (AREA)
- Tropical Medicine & Parasitology (AREA)
- Virology (AREA)
- Toxicology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
- Fuel Cell (AREA)
Abstract
본 발명은 생물학적 수소를 생산하기 위한 재조합 미생물에 관한 것이다. 또한, 본 발명은 핵산 구조체 및 이로부터 수소의 생산을 가능하게 하기 위한 미생물을 변형하는 방법에 관한 것이다.
Description
본 발명은 수소를 생산하기 위한 방법, 핵산 구조체 및 수소를 생산하기 위한 재조합 미생물에 관한 것이다.
석유 가격 상승, 산유국과의 외교적 긴장 고조, 및 대기 중 온실가스 배출량 증가로 인해 대체 연료에 대한 관심이 높아지고 있다. 수소는 무공해 연료로 사용될 수 있는 엄청난 잠재력을 가지고 있어 화석 에너지 사용과 관련된 환경 및 정치적 우려를 완화시킨다. 따라서 청정 에너지원으로서 화석연료를 대체하거나 보충할 수 있는 후보를 발굴하기 위한 노력은 분자 수소 생산에 집중되어 왔다.
수소 경제의 핵심은 수소를 생산하기 위한 효율적이고 저렴하며 재생 가능한 공정을 찾는 동시에 수소를 경제적으로 사용 가능한 에너지로 전환한다는 동일하게 중요한 목표를 달성하는 것이다.
상업적 규모의 수소 생산에 대한 한 가지 접근법은 진핵생물에 의한 수소의 광생물학적 (photobiological) 생산을 이용하는 것이다. 예를 들어, 녹조류는 산화 경로를 발효 대사로 전환함으로써 혐기성 스트레스에 반응한다.
클라미도모나스 레인하티 (Chlamydomonas reinhardtii)와 같은 녹조류가 물에서 수소를 생산하는 능력은 오랫동안 인식되어 왔다. 이 반응은 짧은 기간의 혐기 생활 (anaerobiosis)에 노출된 후 세포에서 유도되는 효소인 가역적 수소화효소에 의해 촉진된다. 따라서 조류 생물 반응기의 사용은 수소를 생산하기 위한 하나의 접근법이었다. 그러나 광합성에 의해 생성된 O2에 의한 가역적 수소화효소의 즉각적인 비활성화로 인해 세포에 조명을 비추면 수소화효소의 활성이 빠르게 상실된다.
수소 생산을 위한 다른 접근법으로는 재조합 미생물의 생성과 이러한 미생물에 의한 탄수화물 공급 원료의 발효가 포함된다. 일부 사례에서, 박테리아, 고세균 및 조류의 수소화효소는 대장균에서 발현되었지만, 대장균에서 외인성 효소의 발현은 코돈 최적화에도 불구하고 낮은 발현율과 단백질 불안정성으로 인해 복잡해졌다.
이러한 발효 접근법에 사용하기 위한 후보로서 다양한 수소화효소가 제안되었다. 예를 들어, 보라색 박테리아 알로크로마티움 비노섬 (Alochromatiiim vinosum)의 [NiFe]-수소화효소는 현저하게 활성인 전기 촉매이다. [NiFe]-수소화효소는 가능성을 보여주지만, 이들 및 다른 수소화효소의 사용과 관련된 문제가 남아 있다. 수소화효소의 안정성은 효소 연료 전지에서의 사용에 있어 주요 단점 중 하나였다. 또한, 효소는 백금보다 CO 중독에 덜 민감하지만, 상업적으로 사용하려면 산소뿐만 아니라 CO에 대한 민감도 측면에서 추가적인 개선이 필요하다. 또한, 수소화효소를 대량으로 이용할 수 없기 때문에 효소 연료 전지에서의 잠재적인 응용이 제한된다. 따라서, 원하는 촉매 특성을 갖는 안정적인 수소화효소의 대량생산은 수소 연료를 위한 이 흥미로운 생체 전기촉매의 응용을 크게 향상시킬 것이다.
조류 생물반응기 (bioreactors)는 많은 광 포획 및 수소 포획 기술 장벽으로 인해 스케일업에 비용이 많이 든다. 수소는 적은 부피와 농도에서 함유 및 수집하기 어려운 만큼 수소 생산 속도도 중요한 고려사항이다. 조류 시스템은 매우 낮은 속도로 수소를 생산하며 생산을 시작하려면 영양소 제한이 필요하다. 현재까지 조작된 미세조류나 탄수화물 공급원료의 발효를 통해 생산되는 수소의 생산 속도와 수율은 모두 상업적으로 사용하기에 각각 너무 느리고 낮았다.
따라서, 수소 생성을 위한 개선된 공정이 필요하다.
본 명세서에서 선행기술에 대한 언급은 선행기술이 어느 관할구역에 있는 일반 지식의 일부를 형성하거나 선행기술이 당업자에 의해 이해되고, 관련성이 있다고 간주되고, 및/또는 다른 선행기술과 결합될 수 있다고 합리적으로 예상할 수 있다는 것을 인정하거나 제안하는 것은 아니다.
본 발명은 일반적으로 에너지 및 전력 발생 응용을 위한 수소 및 활성 수소화효소 효소를 생산하기 위한 발현 벡터, 미생물, 방법 및 반응기 시스템에 관한 것이다. 발현 벡터 및 미생물은 관심 산물을 생산하기 위한 배양 방법에 사용될 수 있다. 수소 및 활성 수소화효소 생성물은 모두 예를 들어 수소로부터 전기를 생산하기 위한 연료전지 시스템과 같은 시스템에 통합될 수 있다.
[관련 출원]
본 출원은 호주 임시 출원 AU 2020900990으로부터 우선권을 주장하며, 그 전체 내용은 본 명세서에 참조로 포함된다.
첫 번째 측면에서, 본 발명은 다음을 포함하는 수소 가스를 생산하기 위한 재조합 미생물을 제공한다:
미생물이 수소를 생산할 수 있도록 하는 하나 이상의 단백질을 암호화하는 외인성 핵산 서열,
- 여기서 하나 이상의 단백질은 Fe-Fe-의존성 수소화효소 및 선택적으로 수소화효소의 성숙 (maturation) 및 활성화를 가능하게 하는 적어도 하나의 조립 단백질을 포함하고;
- 여기서 핵산 서열은 미생물에서 핵산 서열의 발현을 가능하게 하기 위한 하나 이상의 프로모터에 작동가능하게 연결되고, 및
- 여기서 외인성 핵산 서열은 미생물에서 수소화효소의 최적화된 발현을 제공하도록 최적화된 코돈임.
바람직하게는, 상기 Fe-Fe 수소화효소는 Fe-Fe 수소화효소의 A1 클래스에 속한다.
바람직하게는, 상기 Fe-Fe 의존성 수소화효소는 HydA (Hyd1) 또는 이의 기능적으로 동등한 동족체 또는 유도체이다.
바람직한 실시양태에서, 상기 Fe-Fe 의존성 수소화효소는 클라미도모나스 레인하티 (Chlamydomonas reinhardtii), 볼복스 카르테리 (Volvox carteri), 지아디아 람블리아 (Giardia lamblia), 엔타모에바 누탈리 (Entamoeba nuttalli), 일로박터 폴리트러퍼스 (Ilyobacter polytrophus), 트리코모나스 바지날리스 (Trichomonas vaginalis), 메가스파에라 마이크로누시포미스 (Megasphaera micronuciformis), 베일로넬라 파르불라 (Veillonella parvula), 베일로넬라 아티피카 (Veillonella atypica), 펩토클로스트리디움 비퍼멘탄스 (Peptoclostridium bifermentans), 클로스트리디움 아르부스티 (Clostridium arbusti), 슈도플라보니프랙터 카필로수스 (Pseudoflavonifractor capillosus), 래크노클로스트리디움 시트로니아에 (Lachnoclostridium citroniae), 래크노클로스트리디움 클로스트리디오폼 (Lachnoclostridium clostridioforme), 펠로시누스 페르멘탄스 (Pelosinus fermentans), 써모데술포비브리오 아일랜디쿠스 (Thermodesulfovibrio islandicus), 수테텔라 와즈워텐시스 (Sutterella wadsworthensis), 클로스트리디움 베이예린키이 (Clostridium beijerinckii), 퓨조박테리움 울서란스 (Fusobacterium ulcerans), 클로스트리디움 타이로부티리쿰 (Clostridium tyrobutyricum), 클로스트리디움 퍼프린젠스 (Clostridium perfringens), 세토박테리움 소메레 (Cetobacterium somerae), 클로스트리디움 베이예린키이 (Clostridium beijerinckii), 클로스트리디움 콜리카니스 (Clostridium colicanis), 클로스트리디움 인테스티날레 (Clostridium intestinale), 클로스트리디움 차우보에이 (Clostridium chauvoei), 셀룰로모나스 피미 (Cellulomonas fimi), 루미니클로스트리디움 써모셀럼 (Ruminiclostridium thermocellum), 네글레이아 그루베리 (Naegleria gruberi), 클로렐라 바리아빌리스 (Chlorella variabilis), 퍼비도박테리움 노도섬 (Fervidobacterium nodosum), 써모토가 페트로필라 (Thermotoga petrophila), 써모토가 레틴게 (Thermotoga lettingae), 티오마이크로스피라 펠로필라 (Thiomicrospira pelophila), 칼다트리박테리움 칼리포르니엔스 (Caldatribacterium californiense), 푸소박테리움 네크로포룸 (Fusobacterium necrophorum), 옴니트로푸스 포디네 (Omnitrophus fodinae), 신트로포써무스 리포칼리두스 (Syntrophothermus lipocalidus), 암모니펙스 데겐시 (Ammonifex degensii), 디설포토마큘럼 하이드로써멀 (Desulfotomaculum hydrothermale), 푸소박테리움 모르티페룸 (Fusobacterium mortiferum), 디설포토마큘럼 쿠즈네초비 (Desulfotomaculum kuznetsovii) 및 라크노클로스트리디움 피토퍼멘탄스 (Lachnoclostridium phytofermentans) 또는 이들의 기능적으로 동등한 동족체 또는 유도체로 이루어진 군으로부터 선택된 HydA 단백질의 아미노산 서열을 포함한다. 바람직하게는, 상기 HydA 단백질은 클라미도모나스 레인하티 (Chlamydomonas reinhardtii), 볼복스 카르테리 (Volvox carteri), 지아디아 람블리아 (Giardia lamblia), 엔타모에바 누탈리 (Entamoeba nuttalli), 일로박터 폴리트러퍼스 (Ilyobacter polytrophus), 트리코모나스 바지날리스 (Trichomonas vaginalis), 메가스파에라 마이크로누시포미스 (Megasphaera micronuciformis), 베일로넬라 파르불라 (Veillonella parvula), 베일로넬라 아티피카 (Veillonella atypica), 펩토클로스트리디움 비퍼멘탄스 (Peptoclostridium bifermentans) 및 이들의 기능적으로 동등한 동족체로 이루어진 군으로부터 선택된다. 보다 바람직하게는, 상기 HydA 단백질은 클라미도모나스 레인하티 (Chlamydomonas reinhardtii) 또는 이의 기능적으로 동등한 동족체 또는 유도체로부터 유래된다.
특정 실시양태에서, 상기 미생물은 미생물의 배양 동안 수소화효소의 성숙 및 활성화를 가능하게 하는 하나 이상의 인자와 함께 제공될 수 있다. 바람직하게는 상기 하나 이상의 인자는 저분자의 형태이다. 수소화효소의 성숙 및 활성화를 가능하게 하는 인자의 예로는 아자디티올레이트 브릿지 (azadithiolate bridge)를 포함하는 [2Fe]-하위 모방체들 (subsite mimetics)이 있다. 이러한 인자들은, 예를 들어 Esselborn 외, (2013) Nat Chem Biol 9 (10):607-609 및 Berggren 외, (2013) Nature, 499:66-69에 기술되어 있으며, 이들의 내용은 참조에 의해 본 명세서에 통합된다.
바람직하게는, 상기 외인성 핵산 서열은 수소화효소의 성숙 및 활성화를 가능하게 하는 적어도 하나의 조립 단백질을 암호화하며, 여기서 적어도 하나의 단백질은 HydEF 및/또는 HydG로 이루어진 군으로부터 선택된다. 보다 바람직하게는, 상기 외인성 핵산 서열은 조립 단백질 HydEF 및 HydG 모두를 암호화하는 서열들을 포함한다. 특히 바람직한 실시양태에서, 상기 HydEF 및 HydG 단백질은 클라미도모나스 레인하티 (Chlamydomonas reinhardtii) 또는 이의 기능적으로 동등한 동족체 또는 유도체로부터의 HydEF 및 HydG 단백질의 아미노산 서열을 포함한다.
따라서 바람직한 실시양태에서, 본 발명은 다음을 포함하는 수소 가스 생산을 위한 재조합 미생물을 제공한다:
미생물이 수소를 생산할 수 있도록 하는 하나 이상의 단백질을 암호화하는 외인성 핵산 서열,
- 여기서 하나 이상의 단백질은 Fe-Fe-의존성 수소화효소 HydA 또는 이의 기능적으로 동등한 동족체 또는 유도체, 및 클라미도모나스 레인하티 (Chlamydomonas reinhardtii)로부터의 조립 단백질 HydEF 및 HydG 또는 이들의 기능적으로 동등한 동족체 또는 유도체를 포함하고;
- 여기서 핵산 서열은 미생물에서 핵산 서열의 발현을 가능하게 하기 위한 하나 이상의 프로모터에 작동 가능하게 연결되고, 및
- 여기서 외인성 핵산 서열은 미생물에서 수소화효소의 최적화된 발현을 제공하도록 최적화된 코돈임.
일 실시양태에서, 상기 미생물은 페레독신 NADP 환원효소 (Ferredoxin NADP reductase, FNR) 및 페레독신 (petF에 의해 암호화됨), 또는 이들의 기능적으로 동등한 동족체 또는 유도체를 암호화하는 핵산 서열을 추가로 포함한다.
바람직하게는, 상기 FNR의 공급원은 페레독신을 환원시키기 위해 환원제로서 NADPH를 이용하는 페레독신 환원효소를 포함하는 플라빈 (Flavin)이다. 보다 바람직하게는, 상기 페레독신 단백질은 클라미도모나스 레인하티 (Chlamydomonas reinhardtii)로부터 유래된 것이고, 상기 FNR은 클라미도모나스 레인하티 (Chlamydomonas reinhardtii)로부터의 페로독신을 환원시킬 수 있는 임의의 FNR이다. 특히 바람직한 실시양태에서, 상기 FNR 및 페로독신 단백질은 클라미도모나스 레인하티 (Chlamydomonas reinhardtii) 또는 이의 기능적으로 동등한 동족체 또는 유도체로부터의 아미노산 서열을 포함한다.
상기 재조합 미생물은 재조합 단백질의 발현에 사용하기에 적합한 임의의 미생물일 수 있다. 특정 실시양태에서, 상기 재조합 미생물은 에쉬리키아 콜라이 (Escherichia coli), 바실러스 서브틸리스 (Bacillus subtilis), 락토바실러스 속 (Lactobacillus sp.) 또는 스트렙토코커스 속 (Streptococcus sp.)으로 이루어진 군으로부터 선택된다. 바람직한 실시양태에서, 상기 미생물은 에쉬리키아 콜라이 (E coli)의 균주 (strain)이다.
특정 실시양태에서, 상기 재조합 미생물은 부분적으로 또는 완전히 불활성화 되고/되거나 생존 불가능 (non-viable) 할 수 있다.
일 실시양태에서, 상기 외인성 핵산 서열은 하나 이상의 폴리뉴클레오티드 구조체 (construct)에서 제공된다. 바람직한 실시양태에서, HydEF, HydG, HydA 및 선택적으로 페레독신 및 FNR을 암호화하는 상기 외인성 핵산 서열은 단일 폴리뉴클레오티드 구조체로 제공된다. 대안적인 실시양태에서, 상기 단백질을 암호화하는 핵산 서열은 별도의 폴리뉴클레오티드 구조체로 제공된다.
바람직한 실시양태에서, 본 발명은 세포가 수소를 생성할 수 있도록 하는 단백질의 클러스터를 암호화하는 재조합 구조체를 포함하는 E. coli 세포를 제공하며, 여기서 상기 단백질의 클러스터는 클라미도모나스 레인하티 (Chlamydomonas reinhardtii)의 폴리펩타이드 HydEF, HydG, HydA, 페레독신 및 FNR을 포함하거나 구성되거나 또는 본질적으로 구성된다. 바람직한 실시양태에서, 상기 재조합 구조체는 서열번호 10에 제시된 서열을 포함하거나 구성되거나 또는 본질적으로 구성된다.
다른 실시양태예에서, 상기 미생물은 탄소 이용을 5탄당 인산 경로 (pentose phosphate pathway)로 재지정 (redirecting)하기 위한 하나 이상의 유전적 변형을 포함한다. 상기 변형은 탄소를 당분해 (glycolytic) 경로로 유도하는 단백질의 활성을 감소 또는 억제하여 탄소 이용을 5탄당 인산 경로로 재지정할 수 있다.
예를 들어, 상기 미생물은 포스포프룩토키나아제 (phosphofructokinase), 피루브산 키나아제 (pyruvate kinase), 글리세레이트 뮤테이즈 (glycerate mutase), 글리세르알데하이드-3-인산 탈수소효소 (glyceraldehyde-3-phosphate dehydrogenase), 6-포스포글루코네이트 탈수소효소 (6-phosphogluconoate dehydratase), 및 2-케토-3-디옥시-6-포스포글루코네이트 알도라제 (2-keto-3-deoxy-6-phosphogluconate aldolase)로 이루어진 군으로부터 선택된 하나 이상의 내인성 단백질의 활성 또는 수준을 감소 또는 억제하기 위해 추가로 변형될 수 있다. 이들 단백질은 각각 pfkA, pps, gpmA/gpmM, gapA, edd 및 eda 유전자에 의해 암호화된다.
바람직하게는, 상기 미생물은 포스포프룩토키나아제 (phosphofructokinase), 피루브산 키나아제 (pyruvate kinase), 글리세레이트 뮤테이즈 (glycerate mutase), 글리세르알데하이드-3-인산 탈수소효소 (glyceraldehyde-3-phosphate dehydrogenase), 6-포스포글루코네이트 탈수소효소 (6-phosphogluconoate dehydratase) 및 2-케토-3-디옥시-6-포스포글루코네이트 알도라제 (2-keto-3-deoxy-6-phosphogluconate aldolase)를 각각 암호화는 pfkA, pps, gpmA/gpmM, gapA, edd 및 eda 유전자 중 하나 이상의 발현을 결실 또는 감소하도록 유전적으로 변형된다. 상기 변형은 유전자의 발현을 부분적으로 또는 완전히 감소시키는 임의의 변형일 수 있다. 발현의 부분적인 감소가 있는 경우, 상기 발현은 동일한 균주의 야생형 미생물에서의 발현과 비교하여 적어도 5%, 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90% 또는 그 이상까지 감소될 수 있다.
상기 유전자 변형은 하나 이상의 유전자의 발현을 부분적 또는 완전히 억제하기 위해 CRISPR-Cas9 시스템 또는 다른 게놈 변형 시스템 (예컨대, 람다 레드 재조합효소 (lambda red recombinase))을 사용하여 이루어질 수 있다. 상기 유전자 변형은 유전자에 완전한 또는 부분적인 기능 상실 돌연변이 (loss-of-function mutation), 바람직하게는 완전한 기능 상실 돌연변이의 도입을 초래할 수 있다. 상기 변형은 유전자 서열의 전체 또는 부분 제거일 수 있다.
특정 실시양태에서, pfkA, pps, gpmA/gpmM, gapA, edd 및 eda 유전자 중 하나만이 결실되거나 넉다운 (knocked-down)된다. 바람직하게는 pfkA 또는 gpmA가 결실되거나 넉다운된다. 다른 실시양태에서, 상기 미생물은 유전자 pfkA, pps, gpmA/gpmM, gapA, edd 및 eda 중 2개, 3개, 4개, 5개 또는 이들 모두의 발현을 결실 또는 감소시키도록 유전적으로 변형된다. 특정 실시양태에서, 상기 유전자 변형은 pfkA 및 gpmA; 또는 edd 및 eda; 또는 gpmM, edd 및 eda; 또는 gpmA, edd 및 eda; 또는 gpmM, edd, eda 및 pfkA; 또는 gpmA, edd, eda 및 pfkA 또는 pfkA, pps, gpmA/gpmM, edd 및 eda 모두의 발현을 결실 또는 감소를 초래한다.
또 다른 실시양태에서, 상기 미생물은 5탄당 인산 경로의 하나 이상의 단백질의 수준 또는 활성을 증가시키도록 유전적으로 변형된다.
바람직하게는, 상기 하나 이상의 단백질은 포스포글루코뮤타제 (phosphoglucomutase), 글루코스-6-인산 탈수소효소 (glucose-6-phosphate dehydrogenase), 6-포스포글루코노락토나제 (6-phosphogluconolactonase), 6-포스포글루코네이트 탈수소효소 (6-phosphogluconate dehydrogenase), 트랜스케톨라아제 (transketolase) 및 트랜스알돌라아제 (transaldolase)로 이루어진 군으로부터 선택된다. 이들 단백질은 각각 pgm, zwf, pgl, gnd, tktB 또는 tktA, 및 talA 또는 talB 유전자에 의해 암호화된다. 특히 바람직한 실시양태에서, 상기 단백질은 글루코스-6-인산탈수소효소 (glucose-6-phosphate dehydrogenase)이다.
다른 실시양태에서, 상기 내인성 NAD 키나아제 (NAD kinase) (NADK, yfjB에 의해 암호화됨) 및/또는 가용성 피리딘 뉴클레오티드 트랜스히드로게나아제 (pyridine nucleotide transhydrogenase) (UdhA, sthA에 의해 암호화됨)의 수준 또는 활성이 증가된다.
바람직하게는, 상기 미생물의 단백질의 증가된 수준 또는 활성은 5탄당 인산 경로의 하나 이상의 단백질을 암호화하는 핵산 서열의 발현을 증가시킴으로써 이루어지며, 상기 미생물에 의해 생성된 단백질의 수준은 동일한 균주의 야생형 미생물에 비해 증가된다. 대안적인 실시양태에서, 상기 단백질의 증가된 수준 또는 활성은 상기 단백질의 증가된 활성을 초래하는 도입 또는 하나 이상의 점 돌연변이에 의해 이루어진다.
바람직한 실시양태에서, 상기 글루코스-6-인산 탈수소효소 (glucose-6-phosphate dehydrogenase)를 암호화하는 유전자 zwf가 과발현된다. 다른 실시양태에서, 상기 6-포스포글루코네이트 탈수소효소 (6-phosphogluconate dehydrogenase)를 암호화하는 유전자 gnd가 과발현된다. 다른 실시양태에서, 상기 6-포스포글루코노락토나제 (6-phosphogluconolactonase)를 암호화하는 유전자 pgl가 과발현된다.
포스포글루코뮤타제 (phosphoglucomutase), 글루코스-6-인산 탈수소효소 (glucose-6-phosphate dehydrogenase), 6-포스포글루코노락토나제 (6-phosphogluconolactonase), 6-글루코포스포네이트 탈수소효소 (6-glucophosphonate dehydrogenase), 트랜스케톨라아제 (transketolase) 및 트랜스알돌라아제 (transaldolase)의 과발현 및 증가된 수준 또는 활성은 하나 이상의 pgm, zwf, pgl, gnd, tktB 또는 tktA, 및 talA 또는 talB 중 하나 이상의 프로모터 서열의 변형에 의해 선택적으로 달성될 수 있다. 특정 실시양태에서, pgm, zwf, pgl, gnd, tktB 또는 tktA, 및 talA 또는 talB 중 하나 이상에 대한 상기 내인성 프로모터는 상기 유전자의 발현을 증가시키기 위해 외인성 프로모터로 대체된다. 특정 실시양태에서, pgm, zwf, pgl, gnd, tktB 또는 tktA, 및 talA 또는 talB 중 하나 이상에 대한 내인성 프로모터는 상기 미생물에서 상이한 유전자의 발현을 조절하는 내인성 프로모터로 대체된다. 대안적인 실시양태에서, pgm, zwf, pgl, gnd, tktB 또는 tktA, 및 talA 또는 talB 중 하나 이상에 대한 내인성 프로모터는 외인성 프로모터로 대체된다. 상기 외인성 프로모터는 비-동족 (non-cognate) 미생물에서 상동 유전자의 발현을 조절하거나 비-동족 미생물에서 비-상동 단백질의 발현을 조절할 수 있다.
특히 바람직한 실시양태에서, pgm, zwf, pgl, gnd, tktB 또는 tktA, 및 talA 또는 talB 중 하나 이상에 대한 상기 내인성 프로모터는 osmY 프로모터, gapA 프로모터, nirB 프로모터 및 nar 프로모터로 이루어진 군으로부터 선택되는 프로모터로 대체된다.
또한, 상기 숙주 세포는 예를 들어, 5탄당 인산 경로의 관련 효소의 수준 또는 활성을 증가시키기 위한 목적으로 다른 미생물 종으로부터 이종 단백질을 암호화하는 재조합 구조체로 형질전환 (transformed)될 수 있다.
상기 재조합 구조체는 내인성 유전자의 발현과 동시에 외인성 유전자의 발현을 가능하게 할 수 있다. 대안적으로, 상기 재조합 구조체는 내인성 유전자 서열이 외인성 유전자 서열로 대체되도록 미생물 게놈에 안정적으로 도입될 수 있다.
포스포글루코뮤타제, 글루코스-6-인산 탈수소효소, 6-포스포글루코노락토나제, 6-글루코포스포네이트 탈수소효소, 트랜스케톨라아제 및 트랜스알돌라아제의 과발현 및 증가된 수준 또는 활성은 상기 단백질을 암호화하는 내인성 유전자를 상동 단백질을 암호화하는 외인성 유전자로 보충되거나 대체함으로써 달성될 수 있다. 특정 실시양태에서, 상기 내인성 zwf 유전자는 자이모모나스 모빌리스 (Zymomonas mobilis)의 zwf 유전자로 대체된다. 바람직하게는, 상기 미생물은 대장균이고 대장균 zwf 유전자는 자이나스 모빌리스의 zwf 유전자로 대체된다. 또 다른 실시양태에서, 상기 gnd 유전자는 코리네박테리움 글루타미쿰 (Corynebacterium glutamicum)의 gnd 유전자로 대체된다. 바람직하게는, 상기 미생물은 대장균 (E. coli)이고 트랜스케톨라아제 및 트랜스알돌라아제를 암호화하는 유전자는 사카로미케스 케레비시아이 (saccharomyces cerevisiae)의 상동 유전자로 보충되거나 대체된다. 바람직하게는, 상기 미생물은 대장균이고 상기 대장균 gnd 유전자는 코리네박테리움 글루타미쿰 (Corynebacterium glutamicum)의 gnd 유전자로 대체된다. 또한, 상기 내인성 gapA 유전자 (글리세르알데하이드-3-인산탈수소효소를 암호화)는 클로스트리듐 아세토부틸리쿰 (Clostridium aceteobutylicum)의 gapC 유전자로 대체된다. 바람직하게는, 상기 미생물은 대장균이고 상기 대장균 gapA 유전자는 클로스트리듐 아세토부틸리쿰 (Clostridium aceteobutylicum)의 gapC 유전자로 대체된다.
바람직하게는, 포스포글루코뮤타제, 글루코스-6-인산 탈수소효소, 6-포스포글루코노락토나제, 및 6-글루코포스포네이트 탈수소효소를 암호화하는 하나 이상의 유전자의 발현은 적어도 약 1.5배, 적어도 약 2배, 적어도 약 3배, 적어도 약 5배 이상 증가된다.
또 다른 실시양태에서, 상기 재조합 미생물은 에너지 소비를 위해 수크로스를 대사하도록 변형된다. 미생물이 대장균인 실시양태에서, 상기 미생물은 수크로스를 대사하는 대장균 균주로부터 각각 수크로스 가수분해효소 및 수크로스 투과효소를 암호화하는 cscA 및 cscB 유전자를 발현하도록 유전적으로 변형된다. 또한, 상기 대장균 미생물은 내인성 대장균 포스포글루코뮤타제 (pgm) 또는 자일로스 이소머라아제 (xylose isomerase, xylA)의 수준 또는 활성을 증가시키도록 유전적으로 변형될 수 있다. 상기 유전적 변형은 내인성 유전자의 발현을 증가시키기 위한 것일 수 있고 (예를 들어, 프로모터 영역의 변형에 의해) 또는 유전자를 암호화하는 외인성 핵산의 도입 및 발현에 의한 것일 수 있다.
다른 실시양태에서, 상기 미생물은 류코노스톡 메센테로이데스 (Leuconostoc mesenteroides)의 수크로스 인산화효소를 발현하도록 변형된다.
외인성 유전자의 발현을 요구하는 본 명세서에 기재된 임의의 실시양태에서, 상기 유전자는 미생물에서의 발현에 최적화된 코돈일 수 있다.
상기 미생물이 재조합 대장균 미생물인 경우, 상기 미생물은 외인성 핵산 서열을 발현할 수 있는 대장균의 임의의 균주일 수 있다. 특정 바람직한 실시양태에서, 상기 대장균 균주는 임의의 K12 유래 또는 W 유래 균주로부터 선택된다. 특정 실시양태에서, 상기 대장균 균주는 DH5α (DH5 alpha)로 이루어진 군으로부터 선택된다.
다른 측면에서, 본 발명은 다음의 단계를 포함하는 수소 가스의 제조 방법을 제공한다:
- Fe-Fe-의존성 수소화효소를 암호화하는 핵산 서열을 포함하는 하나 이상의 재조합 폴리뉴클레오티드를 포함하는 숙주 세포를 제공하는 단계, 여기서 핵산 서열은 미생물에서 핵산 서열을 발현시키기 위한 하나 이상의 프로모터에 작동 가능하게 연결되어 있고,
- 상기 숙주 세포를 수소화효소의 성숙 및 활성화를 가능하게 하는 외인성 인자와 접촉시키는 단계;
- 상기 숙주 세포로부터 수소 생산을 가능하게 하는 적절한 조건 하에서 숙주 세포를 배양하는 단계.
바람직하게는, 상기 하나 이상의 인자는 저분자의 형태이다. 상기 수소화효소의 성숙 및 활성화를 가능하게 하는 인자의 예로는 아자디티올레이트 브릿지 (azadithiolate bridge)를 포함하는 [2Fe]-하위 모방체들이 있다. 이러한 인자들은, 예를 들어 Esselborn 외, (2013) Nat Chem Biol 9 (10):607-609 및 Berggren 외, (2013) Nature, 499:66-69에 기술되어 있으며, 이들의 내용은 참조에 의해 본 명세서에 통합된다.
또한, 본 발명은 다음의 단계를 포함하는 수소 가스의 제조 방법을 제공한다:
- Fe-Fe 의존성 수소화효소 및 수소화효소의 성숙 및 활성화를 가능하게 하는 적어도 하나의 조립 단백질을 암호화하는 핵산 서열을 포함하는 하나 이상의 재조합 폴리뉴클레오티드를 포함하는 숙주 세포를 제공하는 단계;
o 여기서 상기 핵산 서열은 상기 미생물에서 핵산 서열의 발현을 가능하게 하기 위한 하나 이상의 프로모터에 작동 가능하게 연결되고,
o 여기서 상기 외인성 핵산 서열은 미생물에서 수소화효소의 최적화된 발현을 제공하도록 최적화된 코돈임.
또 다른 측면에서, 본 발명은 다음의 단계를 포함하는 수소 가스의 제조 방법을 제공한다:
- Fe-Fe-의존성 수소화효소 및 선택적으로 수소화효소의 성숙 및 활성화를 가능하게 하는 적어도 하나의 조립 단백질을 암호화하는 핵산 서열을 포함하는 하나 이상의 폴리뉴클레오티드를 제공하는 단계로서, 여기서 상기 핵산 서열은 핵산 서열의 발현을 가능하게 하기 위한 프로모터와 작동 가능하게 연결되고, 여기서 상기 핵산 서열은 이종 숙주 세포에서 발현되도록 최적화된 코돈임;
- 이종 숙주 세포를 제공하는 단계;
- 상기 숙주 세포를 상기 폴리뉴클레오티드(들)로 형질전환 (transforming) 또는 형질주입 (transfecting)하는 단계;
- 세포 배양 배지를 제공하는 단계; 및
- 상기 폴리뉴클레오티드의 발현에 충분한 조건 하에서 상기 세포 배양 배지에서 형질전환 또는 형질주입된 숙주 세포를 배양하는 단계.
또 다른 측면에서, 본 발명은 다음의 단계를 포함하는 이종 숙주 세포에서 수소 발생 Fe-Fe 수소화효소, 바람직하게는 A1 Fe-Fe 수소화효소의 발현을 극대화 (maximising)하는 방법을 제공한다:
- Fe-Fe 의존성 수소화효소 및 수소화효소의 성숙 및 활성화를 가능하게 하기 위한 적어도 하나의 조립 단백질을 암호화하는 핵산 서열을 포함하는 폴리뉴클레오티드를 제공하는 단계로서, 여기서 상기 핵산 서열은 프로모터에 작동 가능하게 연결되고, 이종 숙주 세포에서 상기 핵산 서열의 발현을 가능하게 하기 위해 최적화된 코돈임;
- 이종 숙주 세포를 제공하는 단계;
- 상기 숙주 세포를 상기 폴리뉴클레오티드로 형질전환 또는 형질주입하는 단계;
- 세포 배양 배지를 제공하는 단계; 및
- 상기 폴리뉴클레오티드의 발현에 충분한 조건 하에서 상기 세포 배양 배지에서 형질전환 또는 형질주입된 숙주 세포를 배양하는 단계.
바람직하게는, 상기 Fe-Fe-의존성 수소화효소는 클래스 A1 Fe-Fe 수소화효소이다.
바람직하게는, 상기 Fe-Fe-의존성 수소화효소는 HydA (Hyd1) 또는 이의 기능적으로 동등한 동족체 또는 유도체이다.
바람직한 실시양태에서, 상기 Fe-Fe-의존성 수소화효소는 클라미도모나스 레인하티 (Chlamydomonas reinhardtii), 볼복스 카르테리 (Volvox carteri), 지아디아 람블리아 (Giardia lamblia), 엔타모에바 누탈리 (Entamoeba nuttalli), 일로박터 폴리트러퍼스 (Ilyobacter polytrophus), 트리코모나스 바지날리스 (Trichomonas vaginalis), 메가스파에라 마이크로누시포미스 (Megasphaera micronuciformis), 베일로넬라 파르불라 (Veillonella parvula), 베일로넬라 아티피카 (Veillonella atypica), 펩토클로스트리디움 비퍼멘탄스 (Peptoclostridium bifermentans), 클로스트리디움 아르부스티 (Clostridium arbusti), 슈도플라보니프랙터 카필로수스 (Pseudoflavonifractor capillosus), 래크노클로스트리디움 시트로니아에 (Lachnoclostridium citroniae), 래크노클로스트리디움 클로스트리디오폼 (Lachnoclostridium clostridioforme), 펠로시누스 페르멘탄스 (Pelosinus fermentans), 써모데술포비브리오 아일랜디쿠스 (Thermodesulfovibrio islandicus), 수테텔라 와즈워텐시스 (Sutterella wadsworthensis), 클로스트리디움 베이예린키이 (Clostridium beijerinckii), 퓨조박테리움 울서란스 (Fusobacterium ulcerans), 클로스트리디움 타이로부티리쿰 (Clostridium tyrobutyricum), 클로스트리디움 퍼프린젠스 (Clostridium perfringens), 세토박테리움 소메레 (Cetobacterium somerae), 클로스트리디움 베이예린키이 (Clostridium beijerinckii), 클로스트리디움 콜리카니스 (Clostridium colicanis), 클로스트리디움 인테스티날레 (Clostridium intestinale), 클로스트리디움 차우보에이 (Clostridium chauvoei), 셀룰로모나스 피미 (Cellulomonas fimi), 루미니클로스트리디움 써모셀럼 (Ruminiclostridium thermocellum), 네글레이아 그루베리 (Naegleria gruberi), 클로렐라 바리아빌리스 (Chlorella variabilis), 퍼비도박테리움 노도섬 (Fervidobacterium nodosum), 써모토가 페트로필라 (Thermotoga petrophila), 써모토가 레틴게 (Thermotoga lettingae), 티오마이크로스피라 펠로필라 (Thiomicrospira pelophila), 칼다트리박테리움 칼리포르니엔스 (Caldatribacterium californiense), 푸소박테리움 네크로포룸 (Fusobacterium necrophorum), 옴니트로푸스 포디네 (Omnitrophus fodinae), 신트로포써무스 리포칼리두스 (Syntrophothermus lipocalidus), 암모니펙스 데겐시 (Ammonifex degensii), 디설포토마큘럼 하이드로써멀 (Desulfotomaculum hydrothermale), 푸소박테리움 모르티페룸 (Fusobacterium mortiferum), 디설포토마큘럼 쿠즈네초비 (Desulfotomaculum kuznetsovii) 및 라크노클로스트리디움 피토퍼멘탄스 (Lachnoclostridium phytofermentans) 또는 이들의 기능적으로 동등한 동족체 또는 유도체로 이루어진 군으로부터 선택된 HydA 단백질의 아미노산 서열을 포함한다. 바람직하게는, 상기 HydA 단백질은 클라미도모나스 레인하티 (Chlamydomonas reinhardtii), 볼복스 카르테리 (Volvox carteri), 지아디아 람블리아 (Giardia lamblia), 엔타모에바 누탈리 (Entamoeba nuttalli), 일로박터 폴리트러퍼스 (Ilyobacter polytrophus), 트리코모나스 바지날리스 (Trichomonas vaginalis), 메가스파에라 마이크로누시포미스 (Megasphaera micronuciformis), 베일로넬라 파르불라 (Veillonella parvula), 베일로넬라 아티피카 (Veillonella atypica), 및 펩토클로스트리디움 비퍼멘탄스 (Peptoclostridium bifermentans), 및 이들의 기능적으로 동등한 동족체로 이루어진 군으로부터 선택된다. 보다 바람직하게는, 상기 HydA 단백질은 클라미도모나스 레인하티 (Chlamydomonas reinhardtii) 또는 이의 기능적으로 동등한 동족체 또는 유도체로부터 유래된다.
바람직하게는, 상기 적어도 하나의 조립 단백질은 HydEF 및/또는 HydG로 이루어진 군으로부터의 단백질을 포함한다. 보다 바람직하게는, 상기 외인성 핵산 서열은 조립 단백질 HydEF 및 HydG 모두를 암호화하는 서열들을 포함한다. 특히 바람직한 실시양태에서, 상기 HydEF 및 HydG 단백질은 클라미도모나스 레인하티 (Chlamydomonas reinhardtii) 또는 이의 기능적으로 동등한 동족체 또는 유도체로부터의 HydEF 및 HydG 단백질의 아미노산 서열을 포함한다.
따라서, 바람직한 실시양태에서, 본 발명은 다음의 단계를 포함하는 수소 가스의 제조 방법을 제공한다:
- 클라미도모나스 레인하티 (Chlamydomonas reinhardtii) 폴리펩타이드 HydEF, HydG 및 HydA를 암호화하는 핵산 서열을 포함하는 하나 이상의 재조합 폴리뉴클레오티드를 포함하는 숙주 세포를 제공하는 단계로서,
o 여기서 상기 핵산 서열은 핵산 서열의 발현을 가능하게 하는 프로모터에 작동 가능하게 연결되고,
o 여기서 상기 핵산 서열은 이종 숙주에서의 발현에 최적화된 코돈임; 및
- 상기 숙주 세포를 폴리뉴클레오티드의 발현에 영향을 미치는 조건 하에서 적합한 배양 배지에서 배양하는 단계.
또 다른 측면에서, 본 발명은 다음의 단계를 포함하는 수소 가스의 제조 방법을 제공한다:
- 클라미도모나스 레인하티 (Chlamydomonas reinhardtii) 폴리펩타이드 HydEF, HydG 및 HydA를 암호화는 핵산 서열을 포함하는 하나 이상의 폴리뉴클레오티드를 제공하는 단계로서, 여기서 상기 핵산 서열은 핵산 서열의 발현을 가능하게 하는 프로모터에 작동 가능하게 연결되고, 여기서 상기 핵산 서열은 이종 숙주 세포에서의 발현에 최적화된 코돈임;
- 숙주 세포를 제공하는 단계;
- 상기 숙주 세포를 상기 폴리뉴클레오타이드(들)로 형질전환 또는 형질주입하는 단계;
- 세포 배양 배지를 제공하는 단계; 및
- 상기 폴리뉴클레오티드의 발현에 충분한 조건 하에서 상기 세포 배양 배지에서 형질전환 또는 형질주입된 숙주 세포를 배양하는 단계.
또 다른 측면에서, 본 발명은 다음의 단계를 포함하는 이종 숙주 세포에서 클라미도모나스 레인하티 (Chlamydomonas reinhardtii)의 수소-생성 Fe-Fe 수소화효소의 발현을 극대화하는 방법을 제공한다:
- 클라미도모나스 레인하티 폴리펩타이드 HydEF, HydG 및 HydA를 암호화하는 핵산 서열을 포함하는 폴리뉴클레오티드를 제공하는 단계로서, 여기서 상기 핵산 서열은 프로모터에 작동 가능하게 연결되고 이종 숙주 세포에서 상기 핵산 서열의 발현에 최적화된 코돈임;
- 이종 숙주 세포를 제공하는 단계;
- 상기 숙주 세포를 상기 폴리뉴클레오티드로 형질전환 또는 형질주입하는 단계;
- 세포 배양 배지를 제공하는 단계; 및
- 상기 폴리뉴클레오티드의 발현에 충분한 조건 하에서 상기 세포 배양 배지에서 형질전환 또는 형질주입된 숙주 세포를 배양하는 단계.
바람직하게는, 상기 이종 숙주 세포는 대장균 세포이고, 상기 핵산 서열은 대장균에서의 발현에 최적화된 코돈이다. 바람직하게는, 상기 폴리뉴클레오티드의 프로모터는 대장균에서 상기 폴리뉴클레오티드의 발현을 위한 것이다.
상기 측면 중 어느 하나의 바람직한 실시양태에서, 상기 재조합 폴리뉴클레오티드는 페레독신 NADP 환원효소 및 페레독신, 또는 이들의 기능적으로 동등한 동족체 또는 유도체를 암호화하는 핵산 서열을 포함한다.
바람직하게는, 상기 FNR의 공급원은 페레독신을 환원시키기 위한 환원제로서 NADPH를 이용하는 페레독신 환원효소를 포함하는 플라빈이다. 보다 바람직하게는, 상기 페레독신 단백질은 클라미도모나스 레인하티 (Chlamydomonas reinhardtii)로부터 유래된 것이고, 상기 FNR은 클라미도모나스 레인하티 (Chlamydomonas reinhardtii)로부터의 페로독신을 환원시킬 수 있는 임의의 FNR이다. 특히 바람직한 실시양태에서, 상기 FNR 및 페로독신 단백질은 클라미도모나스 레인하티 (Chlamydomonas reinhardtii) 또는 이의 기능적으로 동등한 동족체 또는 유도체로부터의 아미노산 서열을 포함한다.
상기 숙주 세포는 재조합 단백질의 발현에 사용하기에 적합한 임의의 미생물일 수 있다. 특정 실시양태에서, 상기 숙주 세포는 에쉬리키아 콜라이 (Escherichia coli), 바실러스 서브틸리스 (Bacillus subtilis), 락토바실러스 속 (Lactobacillus sp.) 또는 스트렙토코커스 속 (Streptococcus sp.)으로 이루어진 군으로부터 선택된다. 바람직한 실시양태에서, 상기 미생물은 대장균 (E coli)의 균주 (strain)이다.
특정 실시양태에서, 상기 숙주 세포는 부분적으로 또는 완전히 불활성화 되고/되거나 생존 불가능 (non-viable) 할 수 있다.
본 명세서에서 사용되는 바와 같이, HydEF, HydG, HydA, 페레독신 NADP 환원효소 및 페레독신을 암호화하는 핵산 서열의 조합은 또한 수소 생성 유전자 클러스터 (hydrogen producing gene cluster, HPGC)로 지칭될 수 있다.
일 실시양태에서, 상기 방법들은 유전적으로 변형된 숙주 세포를 이용하거나, 미생물 또는 숙주 세포를 변형시키거나, 또는 미생물 또는 숙주 세포를 포스포프룩토키나아제 (phosphofructokinase), 피루브산 키나아제 (pyruvate kinase), 글리세레이트 뮤테이즈 (glycerate mutase), 6-포스포글루코네이트 탈수소효소 (6-phosphogluconoate dehydratase) 및 2-케토-3-디옥시-6-포스포글루코네이트 알도라제 (2-keto-3-deoxy-6-phosphogluconate aldolase)로 이루어진 군으로부터 선택되는 하나 이상의 내인성 숙주 세포 단백질의 활성 또는 수준을 감소 또는 억제하는 작용제 (agent)와 접촉시키는 단계를 추가로 포함할 수 있다.
상기 포스포프룩토키나아제 (phosphofructokinase), 피루브산 키나아제 (pyruvate kinase), 글리세레이트 뮤테이즈 (glycerate mutase), 6-포스포글루코네이트 탈수소효소 (6-phosphogluconoate dehydratase) 및 2-케토-3-디옥시-6-포스포글루코네이트 알도라제 (2-keto-3-deoxy-6-phosphogluconate aldolase) 중 하나 이상의 활성 또는 수준을 감소 또는 억제하기 위한 작용제는 하나 이상의 단밸직의 활성 또는 수준을 감소시킬 수 있는 저분자, 펩타이드, 항체, 간섭 RNA, 예를 들어 안티센스 RNA, 마이크로 RNA, shRNA, siRNA로부터 선택될 수 있다.
바람직한 실시양태에서, 상기 방법은 상기 미생물 또는 숙주 세포를 유전적으로 변형하는 작용제와 접촉시키거나 관련시키는 것을 포함하며, 이는 하나 이상의 pfkA, pps, gpmA/gpmM, gapA, edd 및 eda (각각 포스포프룩토키나아제, 피루브산 키나아제, 글리세레이트 뮤테이즈, 글리세르알데히드-3-인산 탈수소효소, 6-포스포글루코노에이트 탈수효소 및 2-케토-3-디옥시-6-포스포글루코네이트 알도라제를 암호화함)의 수준 또는 활성이 부분적으로 또는 완전히 감소된다. 예를 들어, 상기 작용제는 유전자의 일부 또는 전부를 결실시키기 위해 CRISPR-Cas9 또는 다른 게놈-편집 시스템 (예컨대, 람다 레드 재조합효소)과 조합하여 사용하기 위한 gRNA 분자를 포함할 수 있다.
또 다른 실시양태에서, 상기 방법은 5탄당 인산 경로의 하나 이상의 단백질의 수준이나 활성을 증가시키기 위해 상기 미생물 또는 숙주 세포를 유전적으로 변형시키거나 변형된 것을 추가로 포함한다. 바람직하게는, 상기 하나 이상의 단백질은 포스포글루코뮤타제 (phosphoglucomutase), 글루코스-6-인산탈수소효소 (glucose-6-phosphate dehydrogenase), 6-포스포글루코노락토나제 (6-phosphogluconolactonase), 6-포스포글루코네이트 탈수소효소 (6-phosphogluconate dehydrogenase), 트랜스케톨라아제 (transketolase) 및 트랜스알돌라아제 (transaldolase)로 이루어진 군으로부터 선택된다. 이들 유전자는 각각 유전자 pgm, zwf, pgl, gnd, tktB 또는 tktA, 및 talA 또는 talB에 의해 암호화된다. 특히 바람직한 실시양태에서, 상기 단백질은 글루코스-6-인산 탈수소효소 (glucose-6-phosphate dehydrogenase)이다.
다른 실시양태에서, 상기 내인성 NAD 키나아제 (NAD kinase) (NADK, yfjB에 의해 암호화됨) 및/또는 가용성 피리딘 뉴클레오티드 트랜스히드로게나아제 (pyridine nucleotide transhydrogenase) (UdhA, sthA에 의해 암호화됨)의 수준 또는 활성이 증가된다.
바람직하게는, 상기 방법은 미생물에 의해 생성된 단백질의 수준이 같은 균주의 야생형 미생물에 비해 증가되도록, 5탄당 인산 경로의 하나 이상의 단백질을 암호화하는 유전자를 과발현하기 위한 핵산 서열을 포함하도록 상기 미생물 또는 숙주 세포를 변형시키는 단계를 포함한다. 대안적인 실시양태에서, 상기 단백질의 증가된 수준 또는 활성은 상기 단백질의 증가된 활성을 도입 또는 하나 이상의 점 돌연변이에 의해 이루어진다.
바람직한 실시양태에서, 상기 글루코스-6-인산 탈수소효소 (glucose-6-phosphate dehydrogenase)를 암호화하는 유전자 zwf가 과발현된다. 다른 실시양태에서, 상기 6-포스포글루코네이트 탈수소효소 (6-phosphogluconate dehydrogenase)를 암호화하는 유전자 gnd가 과발현된다. 또 다른 실시양태에서, 상기 6-포스포글루코노락토나제 (6-phosphogluconolactonase)를 암호화하는 유전자 pgl가 과발현된다. 또 다른 실시양태에서, 상기 글리세르알데하이드-3-인산 탈수소효소 (glyceraldehyde-3-phosphate dehydrogenase)를 암호화하는 유전자 gapA가 과발현된다. 과발현은 pgm, zwf, pgl, gnd, tktB 또는 tktA, 및 talA 또는 talB 중 하나 이상의 프로모터 서열의 변형에 의해 선택적으로 이루어질 수 있다.
특정 실시양태에서, 상기 pgm, zwf, pgl, gnd, tktB 또는 tktA, 및 talA 또는 talB 중 하나 이상에 대한 내인성 프로모터는 상기 유전자의 발현을 증가시키기 위한 외인성 프로모터로 대체된다. 특정 실시양태에서, 상기 pgm, zwf, pgl, gnd, tktB 또는 tktA, 및 talA 또는 talB 중 하나 이상에 대한 내인성 프로모터는 상기 미생물에서 상이한 유전자의 발현을 조절하는 외인성 프로모터로 대체된다. 대안적인 실시양태에서, 상기 pgm, zwf, pgl, gnd, tktB 또는 tktA, 및 talA 또는 talB 중 하나 이상에 대한 내인성 프로모터는 외인성 프로모터로 대체된다. 상기 외인성 프로모터는 비-동족 (non-cognate) 미생물에서 상동 유전자의 발현을 조절하거나 비-동족 미생물에서 비-상동 단백질의 발현을 조절할 수 있다.
특히 바람직한 실시양태에서, 상기 pgm, zwf, pgl, gnd, tktB 또는 tktA, 및 talA 또는 talB 중 하나 이상에 대한 내인성 프로모터는 osmY 프로모터, gapA 프로모터, nirB 프로모터 및 nar 프로모터로 이루어진 군으로부터 선택되는 프로모터로 대체된다.
포스포글루코뮤타제, 글루코스-6-인산 탈수소효소, 6-포스포글루코노락토나제, 6-글루코포스포네이트 탈수소효소, 트랜스케톨라아제 및 트랜스알돌라아제의 과발현 및 증가된 수준 또는 활성은 상기 단백질을 암호화하는 내인성 유전자를 상동 단백질을 암호화하는 외인성 유전자로 대체함으로써 달성될 수 있다.
바람직하게는, 포스포글루코뮤타제, 글루코스-6-인산 탈수소효소, 6-포스포글루코노락토나제, 및 6-글루코포스포네이트 탈수소효소를 암호화하는 하나 이상의 유전자의 발현은 적어도 약 1.5배, 적어도 약 2배, 적어도 약 3배, 적어도 약 5배 이상 증가된다.
또 다른 실시양태에서, 상기 재조합 미생물 또는 숙주 세포는 에너지 소비를 위해 수크로스를 대사하도록 변형된다. 미생물이 대장균인 실시양태에서, 상기 미생물은 바람직하게는 수크로스를 대사하는 대장균 균주로부터 각각 수크로스 가수분해효소 및 수크로스 투과효소를 암호화하는 cscA 및 cscB 유전자를 발현하도록 유전적으로 변형된다. 또한, 상기 대장균 미생물은 내인성 대장균 포스포글루코뮤타제 (pgm) 또는 자일로스 이소머라아제 (xylose isomerase, xylA)의 수준 또는 활성을 증가시키도록 유전적으로 변형될 수 있다. 상기 유전자 변형은 내인성 유전자의 발현을 증가시키기 위한 것일 수 있고 (예를 들어, 프로모터 영역의 변형에 의해) 또는 유전자를 암호화하는 외인성 핵산의 도입 및 발현에 의한 것일 수 있다.
다른 실시양태에서, 상기 미생물은 류코노스톡 메센테로이데스 (Leuconostoc mesenteroides)의 수크로스 인산화효소를 발현하도록 변형된다.
숙주 세포가 대장균인 실시양태에서, 상기 대장균 미생물은 외인성 핵산 서열을 발현할 수 있는 대장균의 임의의 균주일 수 있다. 특정 바람직한 실시양태에서, 상기 대장균 균주는 임의의 K12 유래 또는 W 유래 균주로부터 선택된다. 특정 실시양태에서, 상기 대장균 균주는 DH5α (DH5 alpha)로 이루어진 군으로부터 선택된다.
다른 실시양태에서, 본 명세서에 기재된 방법은 본 명세서에 기재된 수소 생성 유전자 클러스터 (HPGC)의 발현을 가능하게 하여 미생물에 의한 수소의 생산을 증가시키기 위한 최적화된 조건에서 미생물 또는 숙주 세포를 배양하는 단계를 추가로 포함한다. 일 실시예서, 상기 방법은 혐기성 조건 하에서 숙주 세포를 배양하는 것을 포함한다. 당업자는 환원제로서 중성 가스의 첨가를 포함하여 혐기성 조건에서 세포를 배양하는 방법에 익숙할 것이다.
또한, 상기 배양 조건은 배양 배지에 제2철 (ferric, 철 III) 또는 제1철 (ferrous, 철 II)의 첨가를 포함할 수 있다. 바람직한 실시양태에서, 제1철 (Fe II)은 적어도 약 20 μM 이상, 바람직하게는 약 50 μM 이하의 농도로 배양 배지에 첨가된다.
배양 조건은 바람직하게는 37 ℃ 이하, 보다 바람직하게는 약 35 ℃ 미만, 약 32 ℃ 미만, 가장 바람직하게는 약 30 ℃ 미만에서 수행된다.
본 발명은 또한 분자 수소 생성 시스템에 사용하기 위한 다양한 핵산 구조체 또는 폴리뉴클레오티드를 제공한다.
하나의 실시양태에서, 본 발명은 폴리펩타이드 HydEF, HydG 및 HydA를 암호화하는 뉴클레오티드 서열을 포함하는 핵산 구조체 또는 폴리뉴클레오티드를 제공하며, 여기서 상기 핵산 서열은 핵산 서열의 발현을 가능하게 하는 프로모터에 작동 가능하게 연결되고, 여기서 상기 핵산 서열은 이종 숙주에서의 발현을 위해 최적화된 코돈이다. 바람직하게는, 상기 핵산 서열은 대장균에서의 발현을 위해 최적화된 코돈이다. 바람직하게는, 상기 HydEF 및 HydG 폴리펩티드는 클라미도모나스 레인하티 (Chlamydomonas reinhardtii)로부터 유래된다.
바람직한 실시양태에서, 본 발명의 상기 핵산 구조체에서 HydA 단백질을 암호화하는 핵산은, 클라미도모나스 레인하티 (Chlamydomonas reinhardtii), 볼복스 카르테리 (Volvox carteri), 지아디아 람블리아 (Giardia lamblia), 엔타모에바 누탈리 (Entamoeba nuttalli), 일로박터 폴리트러퍼스 (Ilyobacter polytrophus), 트리코모나스 바지날리스 (Trichomonas vaginalis), 메가스파에라 마이크로누시포미스 (Megasphaera micronuciformis), 베일로넬라 파르불라 (Veillonella parvula), 베일로넬라 아티피카 (Veillonella atypica), 펩토클로스트리디움 비퍼멘탄스 (Peptoclostridium bifermentans), 클로스트리디움 아르부스티 (Clostridium arbusti), 슈도플라보니프랙터 카필로수스 (Pseudoflavonifractor capillosus), 래크노클로스트리디움 시트로니아에 (Lachnoclostridium citroniae), 래크노클로스트리디움 클로스트리디오폼 (Lachnoclostridium clostridioforme), 펠로시누스 페르멘탄스 (Pelosinus fermentans), 써모데술포비브리오 아일랜디쿠스 (Thermodesulfovibrio islandicus), 수테텔라 와즈워텐시스 (Sutterella wadsworthensis), 클로스트리디움 베이예린키이 (Clostridium beijerinckii), 퓨조박테리움 울서란스 (Fusobacterium ulcerans), 클로스트리디움 타이로부티리쿰 (Clostridium tyrobutyricum), 클로스트리디움 퍼프린젠스 (Clostridium perfringens), 세토박테리움 소메레 (Cetobacterium somerae), 클로스트리디움 베이예린키이 (Clostridium beijerinckii), 클로스트리디움 콜리카니스 (Clostridium colicanis), 클로스트리디움 인테스티날레 (Clostridium intestinale), 클로스트리디움 차우보에이 (Clostridium chauvoei), 셀룰로모나스 피미 (Cellulomonas fimi), 루미니클로스트리디움 써모셀럼 (Ruminiclostridium thermocellum), 네글레이아 그루베리 (Naegleria gruberi), 클로렐라 바리아빌리스 (Chlorella variabilis), 퍼비도박테리움 노도섬 (Fervidobacterium nodosum), 써모토가 페트로필라 (Thermotoga petrophila), 써모토가 레틴게 (Thermotoga lettingae), 티오마이크로스피라 펠로필라 (Thiomicrospira pelophila), 칼다트리박테리움 칼리포르니엔스 (Caldatribacterium californiense), 푸소박테리움 네크로포룸 (Fusobacterium necrophorum), 옴니트로푸스 포디네 (Omnitrophus fodinae), 신트로포써무스 리포칼리두스 (Syntrophothermus lipocalidus), 암모니펙스 데겐시 (Ammonifex degensii), 디설포토마큘럼 하이드로써멀 (Desulfotomaculum hydrothermale), 푸소박테리움 모르티페룸 (Fusobacterium mortiferum), 디설포토마큘럼 쿠즈네초비 (Desulfotomaculum kuznetsovii) 및 라크노클로스트리디움 피토퍼멘탄스 (Lachnoclostridium phytofermentans) 또는 이들의 기능적으로 동등한 동족체 또는 유도체로 이루어진 군으로부터 선택된 유기체로부터의 HydA 단백질의 아미노산 서열을 암호화한다. 바람직하게는, 상기 HydA 단백질은 클라미도모나스 레인하티 (Chlamydomonas reinhardtii), 볼복스 카르테리 (Volvox carteri), 지아디아 람블리아 (Giardia lamblia), 엔타모에바 누탈리 (Entamoeba nuttalli), 일로박터 폴리트러퍼스 (Ilyobacter polytrophus), 트리코모나스 바지날리스 (Trichomonas vaginalis), 메가스파에라 마이크로누시포미스 (Megasphaera micronuciformis), 베일로넬라 파르불라 (Veillonella parvula), 베일로넬라 아티피카 (Veillonella atypica), 및 펩토클로스트리디움 비퍼멘탄스 (Peptoclostridium bifermentans), 및 이들의 기능적으로 동등한 동족체로 이루어진 군으로부터 선택된다. 보다 바람직하게는, 상기 HydA 단백질은 클라미도모나스 레인하티 (Chlamydomonas reinhardtii) 또는 이의 기능적으로 동등한 동족체 또는 유도체로부터 유래된다.
본 발명은 또한 상기 수소 생성 유전자 클러스터 (HPGC)를 암호화하는 핵산 서열을 포함하는 폴리뉴클레오티드를 제공하며, 여기서 HPGC는 HydEF, HydG, HydA, 페레독신 NADP 환원효소 및 페레독신을 암호화하는 유전자를 포함한다. 바람직하게는, 상기 핵산은 페레독신을 환원시키기 위한 환원제로서 NADPH를 이용하는 페레독신 환원효소를 포함하는 플라빈인 FNR을 암호화한다. 보다 바람직하게는, 상기 핵산은 클라미도모나스 레인하티 (Chlamydomonas reinhardtii)로부터의 페레독신 단백질을 암호화하고, 클라미도모나스 레인하티 (Chlamydomonas reinhardtii)로부터의 페로독신을 환원시킬 수 있는 임의의 FNR인 FNR을 암호화한다. 특히 바람직한 실시양태에서, 상기 폴리뉴클레오티드는 클라미도모나스 레인하티 (Chlamydomonas reinhardtii) 또는 이의 기능적으로 동등한 동족체 또는 유도체로부터의 FNR 및 페로독신 단백질을 암호화하는 핵산을 포함한다.
특히 바람직한 실시양태에서, 상기 HPGC를 포함하는 폴리뉴클레오티드의 서열은 서열번호 10 또는 30 내지 40에 제시된 뉴클레오티드 서열을 포함하거나 구성되거나, 또는 본질적으로 구성된다.
본 발명은 또한 수소 제조 시스템에 사용되거나 사용을 위한 본 명세서와 기재된 바와 같은 미생물을 제공한다. 따라서, 본 발명은 다음을 포함하는 수소를 생산하기 위한 시스템을 제공한다:
- 본 명세서에 기재된 것과 같은 재조합 미생물의 배양물 또는 집단;
- 미생물에 의한 수소 생산을 가능하게 하는 하나 이상의 단백질의 발현을 유도하기 위해 재조합 미생물에 의해 사용되는 공급원료.
선택적으로, 상기 시스템은 또한 재조합 미생물에 의해 생성된 수소를 저장 또는 전달하기 위한 수단을 포함한다.
바람직하게는, 상기 공급원료는 글루코스 또는 수크로스 또는 임의의 다른 탄수화물 공급원과 같은 탄수화물-기반 공급원료다.
본 발명은 또한, 본 명세서에 기재된 바와 같은 수소 생성 시스템을 포함하는 용기, 본 발명의 수소 생성 미생물의 현탁액을 포함하는 상기 시스템, 상기 재조합 미생물에 의해 사용될 수 있는 탄소 공급원을 제공하기 위한 공급원료 및 상기 현탁액으로부터 수소 가스를 분리 또는 추출하기 위한 수단을 포함하는 수소 생산용 생물반응기 (bioreactor)를 제공한다.
본 발명은 또한 전기 생산 시스템에 사용되거나 사용을 위한 본 명세서와 기재된 바와 같은 미생물을 제공한다. 따라서, 본 발명은 다음을 포함하는 수소로부터 전기를 생산하기 위한 시스템 또는 장치를 제공한다:
- 본 명세서에 기재된 것과 같은 재조합 미생물의 배양 또는 집단;
- 미생물에 의한 수소 생산을 가능하게 하는 하나 이상의 단백질의 발현을 유도하기 위해 재조합 미생물에 의해 사용되는 공급원료;
- 수소 연료 전지;
- 재조합 미생물에 의해 생성된 수소를 수소 연료 전지로 전달하기 위한 수단.
본 발명은 또한 본 명세서에 기재된 바와 같은 재조합 미생물을 포함하는 시스템 또는 장치를 작동하는 단계, 또는 본 명세서에 기재된 방법에 따라 생성된 수소를 이용하는 단계를 포함하는 전기 생산 방법을 제공한다.
본 발명은 또한 수소로부터 전기를 생산하는 시스템 또는 장치에서, 본 명세서에 기재된 바와 같은 재조합 미생물의 용도를 제공한다.
문맥상 달리 요구하는 경우를 제외하고, 본 명세서에 사용된 바와 같이 용어 "포함하다"와 "포함하는", "포함한" 및 "포함된"과 같은 용어의 변형은 추가 첨가제, 성분, 정수 또는 단계를 제외하도록 의도되지 않는다.
본 발명의 추가적인 측면 및 선행 단락에서 설명된 측면들의 추가적인 실시양태는 첨부된 도면을 참조하여 예시로서 제공된 다음 설명으로부터 명백해질 것이다.
도 1 : 수소 생성 유전자 클러스터 (HPGC)를 발현하는 야생형 및 돌연변이 균주에서의 수소 생산. 50 mL 대장균 배양물에 20 mM 글루코스를 첨가한 후 H2 가스 생성. 수소 생성 유전자 클러스터 (HPGC)가 없는 DH5α는 이러한 조건에서 수소를 생성하지 않음. 플라스미드 pHPGC를 갖는 4개의 균주 DH5α; pHPGC가 있는 DH5α Δpfk; pHPGC가 있는 DH5α ΔgpmA; 및 플라스미드 pH1-HEFG (petF-FNR이 없는 pHPGC)가 있는 DH5α는 글루코스 첨가 후 빠르게 수소 축적을 시작함. 가스 크로마토그래피로 측정한 기체상의 수소 농도.
도 2: 수소 생성 유전자 클러스터를 발현하는 야생형 및 돌연변이 균주에서 총 유기산 발효 생성물 (숙신산 + 피브루산 + 젖산)의 축적. HPGC를 이용한 수소 생산을 위한 글루코스 첨가 후 유기산 축적.
도 3: 본 발명의 미생물을 포함하는 예시적인 장치의 개략도
도 4: pHPGC를 포함하는 야생형 대장균 DH5α (대조군)에 비해 pHPGC를 포함하는 다양한 재조합 미생물의 수소 생산 속도. gpmM, ΔgpmA를 제거하여 당분해 경로의 하부를 통해 글루코스로부터 탄소의 흐름을 감소시키도록 유전적으로 변형된 대장균에 의한 수소 생산 속도 (L/h). gpmA와 gpmM이 제거됨에 따라 수소 생산 속도가 증가하였음. gnd와 zwf의 증가된 발현은 또한 수소 생산 속도를 향상시켰음.
도 5: pHPGC를 포함하는 야생형 대장균 DH5α (대조군)에 대한 pHPGC를 포함하는 다양한 재조합 미생물에 의해 생성된 이산화탄소에 대한 수소의 비율. Zwf, Gp::zwf의 발현을 증가시키거나, pfk활성, Δpfk을 감소시키면서 CO2에 대한 수소의 비율이 증가하여 5탄당 인산 경로를 통한 플럭스가 증가됨. gnd는 zwf에 의해 암호화되는 단백질의 다운스트림에 있는 단백질을 암호화하므로, 이 돌연변이에서 gnd, Gp::gnd의 활성 증가는 야생형 (wt) DH5와 비교하여 H2 대 CO2 비율에 큰 영향을 미치지 않음.
도 6: 변형된 DH5α cscAB에 의한 수소 제조 시 수크로스의 활용. HPGC 균주가 가진 DH5α cscAB는 수크로스를 사용하여 HPGC를 가진 양성대조군 W 균주와 같은 수소를 만들 수 있음. HPGC를 가진 야생형 DH5α는 수크로스를 사용할 수 없으며 수크로스가 이 균주에 공급될 때 수소가 검출되지 않음.
도 2: 수소 생성 유전자 클러스터를 발현하는 야생형 및 돌연변이 균주에서 총 유기산 발효 생성물 (숙신산 + 피브루산 + 젖산)의 축적. HPGC를 이용한 수소 생산을 위한 글루코스 첨가 후 유기산 축적.
도 3: 본 발명의 미생물을 포함하는 예시적인 장치의 개략도
도 4: pHPGC를 포함하는 야생형 대장균 DH5α (대조군)에 비해 pHPGC를 포함하는 다양한 재조합 미생물의 수소 생산 속도. gpmM, ΔgpmA를 제거하여 당분해 경로의 하부를 통해 글루코스로부터 탄소의 흐름을 감소시키도록 유전적으로 변형된 대장균에 의한 수소 생산 속도 (L/h). gpmA와 gpmM이 제거됨에 따라 수소 생산 속도가 증가하였음. gnd와 zwf의 증가된 발현은 또한 수소 생산 속도를 향상시켰음.
도 5: pHPGC를 포함하는 야생형 대장균 DH5α (대조군)에 대한 pHPGC를 포함하는 다양한 재조합 미생물에 의해 생성된 이산화탄소에 대한 수소의 비율. Zwf, Gp::zwf의 발현을 증가시키거나, pfk활성, Δpfk을 감소시키면서 CO2에 대한 수소의 비율이 증가하여 5탄당 인산 경로를 통한 플럭스가 증가됨. gnd는 zwf에 의해 암호화되는 단백질의 다운스트림에 있는 단백질을 암호화하므로, 이 돌연변이에서 gnd, Gp::gnd의 활성 증가는 야생형 (wt) DH5와 비교하여 H2 대 CO2 비율에 큰 영향을 미치지 않음.
도 6: 변형된 DH5α cscAB에 의한 수소 제조 시 수크로스의 활용. HPGC 균주가 가진 DH5α cscAB는 수크로스를 사용하여 HPGC를 가진 양성대조군 W 균주와 같은 수소를 만들 수 있음. HPGC를 가진 야생형 DH5α는 수크로스를 사용할 수 없으며 수크로스가 이 균주에 공급될 때 수소가 검출되지 않음.
본 명세서에 개시되고 정의된 본 발명은 본문 또는 도면으로부터 언급되거나 명백한 개별 특징들 중 둘 이상의 모든 대안적인 조합으로 확장된다는 것을 이해할 것이다. 이러한 상이한 조합들은 모두 본 발명의 다양한 대안적 측면을 구성한다.
본 발명의 특정 실시예들에 대해 상세히 언급하기로 한다. 본 발명은 실시예와 함께 설명될 것이지만, 본 발명의 이러한 실시예로 제한하려는 의도가 아님을 이해할 것이다. 반대로, 본 발명은 청구범위에 의해 정의된 본 발명의 범위 내에 포함될 수 있는 모든 대안, 변형 및 등가물을 포함하도록 의도된다.
당업자는 본 발명의 실시에 사용될 수 있는 본 명세서에 기재된 것과 유사하거나 동등한 많은 방법 및 재료를 인식할 것이다. 본 발명은 기술된 방법 및 재료에 결코 제한되지 않는다. 본 명세서에 개시되고 정의된 본 발명은 본문 또는 도면으로부터 언급되거나 명백한 개별 특징들 중 둘 이상의 모든 대안적인 조합으로 확장된다는 것으로 이해될 것이다. 이러한 상이한 조합들은 모두 본 발명의 다양한 대안적 측면을 구성한다.
본 명세서에 언급된 모든 특허 및 간행물은 그 전체가 참조로 포함된다.
본 명세서를 해석하기 위한 목적으로, 단수로 사용된 용어는 복수도 포함하고 그 반대의 경우도 마찬가지이다.
미생물은 일반적으로 수소화효소로 알려진 부류의 효소를 사용하여 분자 수소를 합성할 수 있다. 수소를 생성하는 이러한 효소의 능력을 활용하기 위해, 연구자들은 이종 발현 시스템에서 다양한 미생물 및 조류로부터 수소화효소를 발현시키기 위해 노력해왔다. 일반적으로, 이러한 접근법은 조류 및 '극한 (extremophile) 미생물'로부터 다양한 수소화효소를 스크리닝하는 것과 관련되어 있다. 그러나, 이러한 유형의 접근법을 사용하여 충분한 양의 수소를 생성하려는 노력은 이종 유기체에서 발현될 때 이러한 수소화효소와 이들의 동족 성숙 단백질, 그리고 생성된 Fe-Fe 수소화효소 복합체의 불안정성으로 인해 방해를 받았다.
이러한 한계를 해결하기 위해, 이 분야의 다른 사람들은 이종 유기체에서 수소화효소를 발현할 때 비동족 유기체로부터 성숙 단백질을 공동 발현시키려고 노력했다. 그러나, 이 접근법은 일반적으로 상용 시스템에서 사용하기에 충분한 수준의 수소를 얻는 어려움을 극복하지 못했다.
다른 이들은 예를 들어, Fe-Fe 수소화효소보다는 Ni-Fe 수소화효소를 발현하는 것과 같이 발현되는 수소화효소의 유형에 초점을 맞추려고 한다. 이러한 시스템은 시험관 내에서 기능적이며, NADPH 의존성 Ni-Fe 수소화효소 및 5탄당 인산 경로 효소로부터 상업적으로 이용 가능한 효소의 혼합물만을 사용하여 수소를 생산하는 데 효과적인 것으로 입증되었다. 그러나 이러한 시스템은 추가 효소를 제공하는 비용으로 인해 상업적으로 실행 가능한 것이 입증되지 않았다. 또한, 수소 생산 속도가 상업적인 생산에 비해 너무 느렸다.
본 발명자들은 이종 숙주 세포에서 발현되는 조류 유전자로부터 분자 수소의 생산을 극대화하기 위한 새로운 접근법을 규명하였다. 본 발명자들이 채택한 접근법은 다양한 미생물로부터 Fe-Fe 수소화효소 복합체의 안정적인 생산을 가능하게 한다. 더욱이, 본 발명자들은 이러한 접근법이 시간이 지남에 따라 증가된 수소 생산 속도 및 수율 (투입당 생산량)을 제공한다고 믿는다. 본 발명자들의 접근법은 생물학적 수소의 생성을 위한 이전의 최적화되지 않은 접근법에 비해 주요한 발전을 나타낸다.
수소 생성 유전자 클러스터
본 발명은 본 명세서에 기재된 바와 같은 미생물에 그 미생물에서 수소를 생산하는데 필요한 분자 기계의 성분을 암호화하는 다양한 핵산 서열을 제공하는 것을 포함한다. 또한, 본 발명은 이러한 핵산 서열을 포함하는 유전적으로 변형된 미생물을 제공한다.
특히, 본 발명은 HydEF, HydG 및 HydA 단백질을 암호화하는 핵산 서열 (재조합 폴리뉴클레오티드 포함)을 갖는 숙주 세포의 제공을 포함한다. 바람직한 실시양태에서, 숙주 세포에는 또한 페레독신 NADP 환원효소 (Ferredoxin NADP reductase, FNR) 및 페레독신 (petF)을 암호화하는 핵산이 제공된다. 수소는 미생물이 HydA를 암호화하는 핵산 서열을 발현하도록 변형되고, 상기 미생물이 내인성 페로독신을 포함하는, 본 명세서에 기재된 바와 같은 미생물에 의해 생성될 수 있음이 이해될 것이다.
더욱이, 수소화효소의 성숙은 아자디티올레이트 브릿지 (azadithiolate bridge)를 포함하는 [2Fe]-하위 모방체와 같은 저분자를 사용하여 달성될 수 있다. 이러한 인자들은, 예를 들어, Esselborn 외, (2013) Nat Chem Biol 9 (10):607-609 및 Berggren 외, (2013) Nature, 499:66-69에 기술되어 있으며, 이들의 내용은 참조에 의해 본 명세서에 통합된다.
그러나, 바람직한 실시양태에서, 상기 미생물은 바람직하게 본 명세서에서 정의된 바와 같은 HPGC의 성분을 발현하도록 변형된다.
본 명세서에 사용된 바와 같이, 수소 생성 유전자 클러스터 (hydrogen producing gene cluster, HPGC)는 바람직하게는 HydA, HydEF, HydG, 페레독신 NADP 환원효소 및 페레독신을 암호화하는 핵산 서열을 포함하며, 여기서 HydA는 Fe-Fe 수소화효소 (바람직하게는, A1 서브클래스)를 의미하고 HydEF 및 HydG는 활성 FeFe-수소화효소의 형성에 필요한 단백질의 성숙 및 조립 복합체를 의미한다.
본 발명에서 사용된 HydA는 철 (iron) 수소화효소 또는 철 수소화효소 HydA1 또는 Hyd1로도 알려진 임의의 Fe-Fe-수소화효소 단백질 HydA를 의미한다. 이 단백질은 유전자 hyd1에 의해 암호화된다.
당업자는 주어진 수소화효소가 Ni-Fe 수소화효소와 구별되는 Fe-Fe 수소화효소 (A1 클래스 포함)인지 여부를 결정하는 방법을 포함하여 다양한 수소화효소를 분류하는 방법에 익숙할 것이다. 이러한 방법은 예를 들어 Søndergaard 외, (2016) Scientific Reports, 6:34212에 설명되어 있다.
HydA 단백질은 클라미도모나스 레인하티 (Chlamydomonas reinhardtii), 볼복스 카르테리 (Volvox carteri), 지아디아 람블리아 (Giardia lamblia), 엔타모에바 누탈리 (Entamoeba nuttalli), 일로박터 폴리트러퍼스 (Ilyobacter polytrophus), 트리코모나스 바지날리스 (Trichomonas vaginalis), 메가스파에라 마이크로누시포미스 (Megasphaera micronuciformis), 베일로넬라 파르불라 (Veillonella parvula), 베일로넬라 아티피카 (Veillonella atypica), 펩토클로스트리디움 비퍼멘탄스 (Peptoclostridium bifermentans), 클로스트리디움 아르부스티 (Clostridium arbusti), 슈도플라보니프랙터 카필로수스 (Pseudoflavonifractor capillosus), 래크노클로스트리디움 시트로니아에 (Lachnoclostridium citroniae), 래크노클로스트리디움 클로스트리디오폼 (Lachnoclostridium clostridioforme), 펠로시누스 페르멘탄스 (Pelosinus fermentans), 써모데술포비브리오 아일랜디쿠스 (Thermodesulfovibrio islandicus), 수테텔라 와즈워텐시스 (Sutterella wadsworthensis), 클로스트리디움 베이예린키이 (Clostridium beijerinckii), 퓨조박테리움 울서란스 (Fusobacterium ulcerans), 클로스트리디움 타이로부티리쿰 (Clostridium tyrobutyricum), 클로스트리디움 퍼프린젠스 (Clostridium perfringens), 세토박테리움 소메레 (Cetobacterium somerae), 클로스트리디움 베이예린키이 (Clostridium beijerinckii), 클로스트리디움 콜리카니스 (Clostridium colicanis), 클로스트리디움 인테스티날레 (Clostridium intestinale), 클로스트리디움 차우보에이 (Clostridium chauvoei), 셀룰로모나스 피미 (Cellulomonas fimi), 루미니클로스트리디움 써모셀럼 (Ruminiclostridium thermocellum), 네글레이아 그루베리 (Naegleria gruberi), 클로렐라 바리아빌리스 (Chlorella variabilis), 퍼비도박테리움 노도섬 (Fervidobacterium nodosum), 써모토가 페트로필라 (Thermotoga petrophila), 써모토가 레틴게 (Thermotoga lettingae), 티오마이크로스피라 펠로필라 (Thiomicrospira pelophila), 칼다트리박테리움 칼리포르니엔스 (Caldatribacterium californiense), 푸소박테리움 네크로포룸 (Fusobacterium necrophorum), 옴니트로푸스 포디네 (Omnitrophus fodinae), 신트로포써무스 리포칼리두스 (Syntrophothermus lipocalidus), 암모니펙스 데겐시 (Ammonifex degensii), 디설포토마큘럼 하이드로써멀 (Desulfotomaculum hydrothermale), 푸소박테리움 모르티페룸 (Fusobacterium mortiferum), 디설포토마큘럼 쿠즈네초비 (Desulfotomaculum kuznetsovii) 및 라크노클로스트리디움 피토퍼멘탄스 (Lachnoclostridium phytofermentans) 또는 이들의 기능적으로 동등한 (equivalent) 동족체 또는 유도체로 이루어진 군으로부터 선택된 미생물의 HydA 단백질일 수 있다.
바람직하게는, 상기 HydA 단백질은 클라미도모나스 레인하티 (Chlamydomonas reinhardtii), 볼복스 카르테리 (Volvox carteri), 지아디아 람블리아 (Giardia lamblia), 엔타모에바 누탈리 (Entamoeba nuttalli), 일로박터 폴리트러퍼스 (Ilyobacter polytrophus), 트리코모나스 바지날리스 (Trichomonas vaginalis), 메가스파에라 마이크로누시포미스 (Megasphaera micronuciformis), 베일로넬라 파르불라 (Veillonella parvula), 베일로넬라 아티피카 (Veillonella atypica), 펩토클로스트리디움 비퍼멘탄스 (Peptoclostridium bifermentans) 및 이들의 기능적으로 동등한 동족체로 이루어진 군으로부터 선택된다. 보다 바람직하게는, 상기 HydA 단백질은 클라미도모나스 레인하티 (Chlamydomonas reinhardtii) 또는 이의 기능적으로 동등한 동족체 또는 유도체로부터 유래된다.
HydA에 대한 클라미도모나스 레인하티 단백질 서열의 예시적인 서열은UnitProt 등록번호 (accession number) Q9FYU1에서 제공되고, 상기 단백질을 암호화하는 예시적인 핵산 서열은 등록번호 AJ308413, CAC83731.1 (EBI) 및 XP_001693376.1.에서 찾을 수 있다.
HydA를 암호화하는 예시적인 핵산 서열은 서열번호 6에 제시된다. hydA의 발현을 가능하게 하는 예시적인 프로모터는 서열번호 5에 제시된다.
볼복스 카르테리, 지아디아 람블리아, 엔타모에바 누탈리, 일로박터 폴리트러퍼스, 트리코모나스 바지날리스, 메가스파에라 마이크로누시포미스, 베일로넬라 파르불라, 베일로넬라 아티피카, 및 펩토클로스트리디움 비퍼멘탄스로부터의 HydA에 대한 서열 정보를 제공하는 예시적인 등록번호는 각각 XP002956049, XP001709915, XP008860420, WP013388849 (및 XP002948483), XP001330775, WP006942403, WP004697562, WP005375825 및 WP021432477이 포함된다.
볼복스 카르테리, 지아디아 람블리아, 엔타모에바 누탈리, 일로박터 폴리트러퍼스, 트리코모나스 바지날리스, 메가스파에라 마이크로누시포미스, 베일로넬라 파르불라, 베일로넬라 아티피카, 및 펩토클로스트리디움 비퍼멘탄스로부터의 HydA를 암호화하는 예시적인 코돈 최적화 핵산 서열 (제한 부위 포함)은 서열번호 18 내지 27에 제시된다.
본 명세서에서 사용된 HydEF는 바람직하게는 클라미도모나스 레인하티 Fe-수소화효소 조립 단백질 HydEF를 의미하며, 또한 철 수소화효소 조립 단백질 HydEF라고도 지칭한다. 이 단백질은 유전자 hydEF에 의해 암호화된다. HydEF에 대한 클라미도모나스 레인하티 단백질 서열의 예시적인 서열은 UniProt 등록번호 Q6PSL5에 제공되고, 상기 단백질을 암호화하는 예시적인 핵산 서열은 등록번호 DS496119, EDP05198.1 (EBI) 및 XP_001691465.1에서 찾을 수 있다.
HydEF를 암호화하는 예시적인 핵산 서열은 서열번호 2에 제공된다. hydEF의 발현을 가능하게 하는 예시적인 프로모터는 서열번호 1에 제공된다.
본 명세서에 사용된 HydG는 클라미도모나스 레인하티 Fe-수소화효소 조립 단백질 HydG를 의미하며, 또한 철 수소화효소 조립 단백질 HydG라고도 지칭한다. 이 단백질은 유전자 hydG에 의해 암호화된다. HydG에 대한 클라미도모나스 레인하티 단백질 서열의 예시적인 서열은 UniProt 등록번호 Q6PSL4에 제공되고, 상기 단백질을 암호화하는 예시적인 핵산 서열은 등록번호 DS496119, EDP05052.1 (EBI) 및 XP_001691319.1에서 찾을 수 있다.
HydG를 암호화하는 예시적인 핵산 서열은 서열번호 4에 제공된다. hydG의 발현을 가능하게 하는 예시적인 프로모터는 서열번호 3에 제공된다.
본 명세서에 사용된 페레독신은 petF 유전자에 의해 암호화된 클라미도모나스 레인하티 페레독신 단백질을 의미한다. 페레독신에 대한 클라미도모나스 레인하티 단백질 서열의 예시적인 서열은 UniProt 등록번호 A8IV40에 제공되고, 상기 단백질을 암호화하는 예시적인 핵산 서열은 등록번호 DS496124, EDP03827.1 (EBI) 및 XP_001692808.1에서 찾을 수 있다.
페레독신을 암호화하는 예시적인 핵산 서열은 서열번호 8에 제공된다. petF의 발현을 가능하게 하는 예시적인 프로모터는 서열번호 7에 제공된다.
본 명세서에서 사용된 클라미도모나스 레인하티 페레독신 NADP 환원효소 (ferredoxin NADP reductase, FNR)는 EC:1.18.1.2를 의미한다. 상기 단백질은 유전자 petH 또는 fnr1에 의해 암호화된다. FNR에 대한 클라미도모나스 레인하티 단백질 서열의 예시적인 서열은 UniProt 등록번호 A8J6Y8 및 P53991에 제공되고, 상기 단백질을 암호화하는 예시적인 핵산 서열은 등록번호 DS496140, EDP00292.1 (EBI) 및 XP_001697352.1에서 찾을 수 있다.
FNR을 암호화하는 예시적인 핵산 서열은 서열번호 9에 제공된다.
바람직한 실시양태에서, 상기 HydEF, HydG, HydA, 페레독신 및 FNR 단백질을 암호화하는 핵산 서열은 단일 폴리뉴클레오티드 구조체로 제공된다. 일 실시예에서, 상기 폴리뉴클레오티드는 서열번호 10에 제시된 핵산 서열을 갖는다.
5탄당 인산 경로로 글루코스의 산화 전환
본 발명자들은 당분해 (glycolytic) 경로로부터 5탄당 인산 경로를 분리하는 것이 탄수화물을 수소로 최적의 전환을 시킬 수 있다는 것을 발견하였다. 따라서, 바람직한 실시양태에서, 본 발명의 미생물은 포스포프룩토키나아제 (phosphofructokinase), 피루브산 키나아제 (pyruvate kinase), 글리세레이트 뮤테이즈 (glycerate mutase), 6-포스포글루코네이트 탈수소효소 (6-phosphogluconoate dehydratase) 및 2-케토-3-디옥시-6-포스포글루코네이트 알도라제 (2-keto-3-deoxy-6-phosphogluconate aldolase)를 암호화하는 하나 이상의 내인성 유전자의 발현을 감소 또는 결실시키도록 추가로 변형된다. 이 단백질들은 각각 유전자 pfkA, pps, gpmA, gpmM, gapA, edd 및 eda에 의해 암호화된다.
또한, 본 발명의 방법은 포스포프룩토키나아제, 피루브산 키나아제, 글리세레이트 뮤테이즈, 6-포스포글루코네이트 탈수소효소 및 2-케토-3-디옥시-6-포스포글루코네이트 알도라제 중 하나 이상의 단백질의 활성 또는 수준을 억제하기 위한 하나 이상의 작용제와 미생물을 접촉시키는 단계를 포함한다.
본 명세서에 사용된 바와 같이, PFK로도 알려진 포스포프룩토키나아제 (E.C. 2.7.1.11 및 E.C. 2.7.1.105)는 해당과정 (glycolysis)에서 과당 6-인산을 인산화하는 키나아제 효소이다. 포스포프룩토키나아제는 당분해 경로의 핵심 조절 단계인 과당-6-인산이 과당-1,6-이인산염 (fructose-1,6-diphosphate)으로의 인산화를 촉매한다.
본 명세서에 사용된 피루브산 키나아제 (E.C. 2.7.1.40)는 pps 유전자에 의해 암호화되는 효소로서, 포스포엔올피루브산 (phosphoenolpyruvate, PEP)에서 아데노신 이인산 (adenosine diphosphate, ADP)으로의 포스페이트 그룹의 전이를 촉매하여 한 분자의 피루브산과 한 분자의 ATP를 생성한다.
본 명세서에 사용된 글리세레이트 뮤테이즈는 2,3-비스포스포글리세레이트 (bisphosphoglyerate)-의존성 (dPGM, GpmA) 또는 보조 인자-비의존성 (iPGM, GpmM) 포스포글리세레이트 뮤테이즈 중 하나를 지칭할 수 있다. 2,3- 비스포스포글리세레이트-의존성 포스포글리세레이트 뮤테이즈는 gpmA 유전자에 의해 암호화되며, 2-포스포-D-글리세레이트 ↔ 3-포스포-D-글리세레이트 반응을 촉매한다. 2,3-비스포스포글리세레이트-비의존성 포스포글리세레이트 뮤테이즈 (gpmC; pgmI; gpmI 또는 yibO라고도 함)는 gpmM 유전자에 의해 암호화되며 동일한 반응을 촉매한다. iPGM 효소는 특이적 활성이 현저히 낮다. 따라서, 바람직하게는 pgmA는 본 발명의 방법에 따라 결실 또는 억제를 위해 표적화된다.
본 명세서에 사용된 6-포스포글루코네이트 탈수소효소 (E.C. 4.2.1.12)는 6-포스포-D-글루코네이트 ↔ 2-디하이드로-3-디옥시-6-포스포-D-글루코네이트 + H2O 반응을 촉매하는 효소이다. 일반적으로 사용되는 다른 명칭으로는 6-포스포글루코네이트 디하이드라타아제 (6-phosphogluconate dehydratase), 6-포스포글루코산 디하이드라아제 (6-phosphogluconic dehydrase), 글루코네이트-6-포스페이트 디하이드라타아제 (gluconate-6-phosphate dehydratase), 글루코네이트 6-포스페이트 디하이드라타아제 (gluconate 6-phosphate dehydratase), 6-포스포글로루네이트 디하이드라아제 (6-phosphogluconate dehydrase) 및 6-포스포-D-글루코네이트 하이드로-리아제 (6-phospho-D-gluconate hydro-lyase) 등이 있다.
본 명세서에 사용된 바와 같이, 일반적으로 KDPG 알도라제로 알려진 2-케토-3-디옥시-6-포스포글루코네이트 알도라제 (E.C. 4.1.2.14)는 2-디하이드로-3-디옥시-D-글루코네이트 6-인산 ↔ 피루브산 + D-글리세르알데하이드 3-인산 반응을 촉매하는 효소이다.
포스포프룩토키나아제, 피루브산 키나아제, 글리세레이트 뮤테이즈, 6-포스포글루코네이트 탈수소효소 및 2-케토-3-디옥시-6-포스포글루코네이트 알도라제 중 임의의 하나 이상이 본 발명의 미생물 또는 숙주 세포를 단백질의 수준 또는 활성이 감소 또는 억제시키는 임의의 작용제와 접촉시킴으로써 억제될 수 있음이 이해될 것이다. 상기 억제는 직접적이거나 간접적일 수 있다. 상기 억제는 부분적이거나 완전할 수 있다.
상기 억제제는 바람직하게는 하나 이상의 단백질의 활성 또는 수준을 감소시킬 수 있는 저분자, 펩타이드, 항체, 간섭 RNA, 예를 들어 안티센스 RNA, 마이크로RNA, shRNA, siRNA 중에서 선택된다.
바람직한 실시양태에서, 상기 미생물 또는 숙주 세포는 유전자 pfkA, pps, gpmA, gpmM, gapA, edd 및 eda 중 하나 이상의 발현을 완전히 결실시키거나 부분적으로 감소시키도록 유전적으로 변형된다.
당업자는 유전자 발현을 부분적으로 또는 완전히 감소시키기 위해 유전자 서열을 결실 또는 변형시키는 다양한 기술에 익숙할 것이다. 특정 실시양태에서, 유전자 변형은 CRISPR-Cas9 시스템의 사용에 의한 것이다. 사용할 수 있는 다른 게놈 편집 기술로는 람다 레드 재조합 효소 시스템 (lambda red recombinase system), 무작위 돌연변이 생성 및 선택, 다중 자동 게놈 엔지니어링 (Multiplex Automated Genome Engineering, MAGE) 등이 있다. 일 실시예에서, CRISPR-Cas9 및 람다 레드 재조합 효소의 조합은 Reisch CR 및 Prather KL, (2015) The no-SCAR (Scarless Cas9 Assisted Recombineering) system for genome editing in Escherichia coli, Sci Rep. 14(5): 15096 에서 개략적으로 설명된 바와 같이 사용될 수 있다.
상기 pfkA, pps, gpmA, gpmM, gapA, edd 및 eda 유전자 중 임의의 하나 이상의 감소된 발현은 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90% 감소된 발현 또는 100% 감소된 발현일 수 있다.
상기 결실되거나 발현이 감소된 유전자는 바람직하게는 pfk 또는 gpmA이다. 다른 실시양태에서, pfk 및 gpmA 또는 pfk 및 gpmM은 모두 결실된다. 또한, edd 및 eda는 모두 결실될 수 있다. 대안적인 실시양태에서, edd 및 eda와 조합된 gpmM 및/또는 gpmA는 결실된다. 또 다른 실시양태에서, pfk, edd-eda 및 gpmA 또는 gpmM은 결실된다.
글루코스의 산화를 5탄당 인산 경로로 더욱 유도하고, 수소의 생성 속도 및 수율을 극대화하기 위해, 본 발명은 또한 다양한 내인성 유전자의 증가된 발현 또는 활성 (또는 이들이 암호화하는 단백질의 억제)을 고려한다.
따라서, 바람직한 실시양태에서, 본 발명의 미생물은 포스포글루코뮤타제 (phosphoglucomutase), 글루코스-6-인산 탈수소효소 (glucose-6-phosphate dehydrogenase), 6-포스포글루코노락토나제 (6-phosphogluconolactonase), 6-글루코포스포네이트 탈수소효소 NAD 키나아제 (6-glucophosphonate dehydrogenase NAD kinase) 및 가용성 피리딘 뉴클레오티드 트랜스히드로게나아제 (pyridine nucleotide transhydrogenase)를 암호화하는 유전자 중 하나 이상의 수준 또는 활성을 증가시키도록 추가로 변형된다. 이들 단백질은 각각 pgm, zwf, pgl, gnd, yfjB 및 sthA 유전자에 의해 암호화된다. 더욱이, 본 발명의 방법은 포스포글루코뮤타제, 글루코스-6-인산 탈수소효소, 6-포스포글루코노락토나제 및 6-포스포글루코네이트 탈수소효소 중 하나 이상의 단백질의 발현을 증가시키는 것을 포함한다.
본 명세서에서 사용된 포스포글루코뮤타제 (PGM) (E.C. 5.3.1.9)는 글루코스-포스페이트 이소머라제 (glucose-phosphate isomerase), 포스포글루코스 이소모라제/포스포글루코이소머라제 (phosphoglucose isomerase/phosphoglucoisomerase, PGI) 또는 포스포헥소스 이소머라제 (phosphohexose isomerase, PHI)로도 알려져 있으며, 글루코스-6-포스페이트 (glucose-6-phosphate, G6P) 및 프룩토오스-6-포스페이트 (fructose-6-phosphate, F6P)을 상호 전환시켜 당분해 효소 (글루코스-6-포스페이트 이소머라제)로서 기능하는 효소이다. 상기 반응은 가역적이므로 그 방향은 G6P및 F6P 농도에 의해 결정된다.
특정 실시양태에서, PGM의 수준 또는 활성은 내인성 pgm 유전자의 발현을 증가, 예를 들어 유전자의 발현 증가를 가능하게 하는 프로모터를 도입함으로써 증가된다.
바람직한 실시양태에서, 대장균에서 pgm 유전자의 프로모터는 대장균으로부터의 gapA 프로모터로 대체된다. 예시적인 gapA 프로모터 (gapAp) 5'-3'은 서열번호 13에 제시되어 있다.
본 명세서에서 사용된 글루코스-6-인산 탈수소효소 (E.C. 1.1.1.49) 는 G6PD로도 알려져 있으며, D-글루코스 6-인산 + NADP+ ↔ 6-포스포-D-글루코노-1,5-락톤 + NADPH + H+의 화학 반응을 촉매하는 효소이다. G6PD는 G6P를 6-포스포글루코노-δ-락톤으로 전환하고, 5탄당 인산 경로의 속도 제한 효소이다. 따라서, G6PD의 조절은 나머지 5탄당 인산 경로의 활성에 대한 다운스트림 결과를 갖는다. 글루코스-6-인산 탈수소효소는 이의 기질 G6P에 의해 자극된다. 대장균에서 zwf 유전자는 글루코스-6-인산 1-탈수소효소를 암호화한다. 대장균 G6PD 단백질의 예시적인 아미노산 서열은 Uniprot 등록번호 POAC53에서 찾을 수 있고, 예시적인 핵산 서열은 등록번호 M55005, NP_416366.1 및 NC_000913.3에서 찾을 수 있다. 자이모모나스 모빌리스 (Zymomonas mobilis)의 동족 단백질은 zwf에 의해 암호화되며, 이의 예시적인 핵산 서열은 본 명세서의 서열번호 16에 제시되어 있다.
특정 실시양태에서, G6PD의 수준 또는 활성은 내인성 zwf 유전자의 발현을 증가시킴으로써, 예를 들어 유전자의 증가된 발현을 가능하게 하는 프로모터를 도입함으로써 증가된다. 특정 실시양태에서, 대장균 zwf 프로모터는 osmY 프로모터 (osmYp)로 대체된다. 예시적인 osmY 프로모터 (osmYp) 서열은 서열번호 12에 제시되어 있다. 대안적인 실시양태에서, 대장균 zwf 프로모터는 서열번호 13에 제시된 바와 같이 대장균 gapA 프로모터로 대체된다.
바람직한 실시양태에서, G6PD의 수준 또는 활성은 대장균의 zwf 유전자를 자이모모나스 모빌리스의 zwf 유전자로 대체 또는 보충함으로써 증가된다. 추가적인 실시양태에서, 대장균의 zwf 유전자는 임의의 그람 음성 통성 (facultative) 박테리아로부터 zwf 유전자로 대체되거나 보충된다.
본 명세서에서 6-포스포글루코노락토나제 (E.C. 3.1.1.31)는 6PGL 또는 PGLS로도 알려져 있으며, 5탄당 인산 경로의 산화 단계에서 6-포스포글루코노락톤을 6-포스포글루콘산 (또는 6-포스포-D-글루코네이트 + H+)으로 가수분해를 촉매하는 효소이다. 6-포스포글루코노락토나제는 6-포스포글루코노락톤을 6-포스포글루콘산으로 전환하는 것을 촉매하고, 이는 모두 5탄당 인산 경로의 산화 단계에서 중간체이며, 여기서 글루코스는 리불로스 5-인산으로 전환된다. 5탄당 인산 경로의 산화 단계는 CO2를 방출하고 NADP+로부터 2당량의 NADPH를 생성한다. 최종 생성물인 리불로스 5-인산은 뉴클레오티드, ATP 및 코엔자임 A를 포함한 생체 분자를 합성하기 위해 5탄당 인산 경로의 비-산화 단계동안 유기체에 의해 추가로 처리된다. 5탄당 인산 경로에서 6PGL 보다 앞서는 효소인 글루코스-6-인산 탈수소효소는 6-포스포글루코노락톤의 δ-이소머를 독점적으로 형성한다. 예시적인 대장균 6PGL 서열은 Uniprot 등록번호 P52697에서 찾을 수 있고, 예시적인 핵산 서열은 등록번호 U27192, NP_415288.1 및 NC_000913.3에서 찾을 수 있다.
특정 실시양태에서, PGL의 수준 또는 활성은 내인성 pgl 유전자의 발현을 증가시킴으로써, 예를 들어 상기 유전자의 발현 증가를 가능하게 하는 프로모터를 도입함으로써 증가한다.
바람직한 실시양태에서, 대장균에서 pgl 유전자의 프로모터는 대장균으로부터의 gapA 프로모터로 대체된다. 예시적인 gapA 프로모터 (gapAp) 5'-3'은 서열번호 13에 제시되어 있다.
본 명세서에서 사용된, GAPDH로도 알려져 있고 덜 일반적으로 G3PDH로 알려진 글리세르알데히드-3-인산 탈수소효소 (E.C. 1.2.1.12)는 대장균의 gapA 유전자에 의해 암호화된다. 상기 단백질은 보조인자 NAD를 사용하여 글리세르알데하이드 3-포스페이트 (glyceraldehyde 3-phosphate, G3P)의 1,3-비스포스포글리세레이트로 (1,3-bisphosphoglycerate, BPG)로의 산화적 인산화를 촉매한다. 첫 번째 반응 단계는 G3P와 시스테인 잔기 사이에 헤미아세탈 중간체의 형성을 포함하며, 이 헤미아세탈 중간체는 티오에스테르 (thioester)로 산화되며, NAD는 NADH로 환원된다. 환원된 NADH는 두번째 NAD와 교환되고, 티오에스테르는 친핵성 무기 인산염에 의해 공격을 받아 BPG를 생성한다. 대장균 GapA 단백질의 예시적인 아미노산 서열은 Uniprot 등록번호 POA9B2에서 찾을 수 있고, 예시적인 핵산 서열은 등록번호 X02662, NP_416293.1 및 NC_000913.3에서 찾을 수 있다. 클로스트리듐 아세토부틸리쿰 (Clostridium aceteobutylicum)의 동족 단백질은 gapC에 의해 암호화되며, 이의 예시적인 핵산 서열은 본 명세서에서 서열번호 15에 제시되어 있다.
특정 실시양태에서, GAPDH의 수준 또는 활성은 내인성 gapA 유전자의 발현을 감소 또는 제거하거나, 유전자를 결실시키거나 유전자의 발현을 감소시키기 위한 프로모터를 변경함으로써 감소된다.
바람직한 실시양태에서, 대장균의 gapA 유전자는 클로스트리듐 아세토부틸리쿰의 gapC 유전자로 대체된다.
본 명세서에서 사용된, 6-글루코포스포네이트 탈수소효소, 탈카르복실화로도 지칭되는 6-포스포글루코네이트 탈수소효소 (E.C. 1.1.1.44)는 NADP의 NADPH로의 환원과 함께 6-포스포글루코네이트의 리불로스 5-인산 및 CO2로의 산화적 탈카르복실화를 촉매하는 효소이다. 대장균에서, 6-글루코포스포네이트 탈수소효소는 gnd 유전자에 의해 암호화된다. 대장균 6-글루코포스포네이트 탈수소효소의 예시적인 아미노산 서열은 UniProt 등록번호 P00350에서 찾을 수 있고, 핵산 서열은 등록번호 K02072, NP_416533.1 및 NC_000913.3에서 찾을 수 있다. 코리네박테리움 글루타미쿰의 동족 단백질은 gnd에 의해 암호화되며, 이의 예시적인 핵산 서열은 본 명세서의 서열번호 14에 제시되어 있다.
특정 실시양태에서, 6-글루코포스포네이트 탈수소효소의 수준 또는 활성은 내인성 gnd 유전자의 발현을 증가시킴으로써, 예를 들어 유전자의 발현 증가를 가능하게 하는 프로모터를 도입함으로써 증가된다. 특정 실시양태에서, 상기 미생물이 대장균인 경우, 대장균에서 gnd 유전자의 프로모터는 대장균의 gapA 프로모터로 대체된다. 예시적인 gapA 프로모터 (gapAp) 5'-3'은 서열번호 13에 제시되어 있다. 대안적인 실시양태에서, 상기 대장균 gnd 프로모터는 osmY 프로모터 (osmYp)로 대체된다. 예시적인 osmY 프로모터 (osmYp) 서열은 서열번호 12에 제시되어 있다.
특히 바람직한 실시양태에서, 상기 pgm, zwf, pgl, gnd, tktB 또는 tktA, 및 talA 또는 talB 중 하나 이상에 대한 내인성 프로모터는 osmY 프로모터, gapA 프로모터, nirB 프로모터 및 nar 프로모터로 이루어진 군으로부터 선택되는 프로모터로 대체된다.
바람직한 실시양태에서, 상기 미생물 (예컨대, 대장균)로부터의 gnd 유전자는 코리네박테리움 글루타미쿰의 gnd 유전자로 대체된다.
특히 바람직한 실시양태에서, 상기 pgm, zwf, pgl, gnd, tktB 또는 tktA, 및 talA 또는 talB 중 하나 이상에 대한 내인성 프로모터는 osmY 프로모터, gapA 프로모터, nirB 프로모터 및 nar 프로모터로 이루어진 군으로부터 선택되는 프로모터로 대체된다. 바람직하게는, 상기 osmY, gapA, nirB 및/또는 nar 프로모터는 유기체의 내인성 프로모터이다. 보다 바람직하게는, 상기 미생물이 대장균인 경우, osmY, gapA, nirB 및/또는 nar 프로모터는 대장균으로부터 유래된다.
수크로스 대사 유전자
대부분의 대장균 균주는 탄소 공급원으로서 수크로스를 이용할 수 없기 때문에, 본 발명의 미생물 및 방법은 또한 수크로스의 대사를 가능하게 하는 숙주 미생물의 변형을 포함한다. 특정 실시양태에서, 이것은 수크로스를 대사할 수 있는 대장균 균주에서 확인된 유전자 클러스터, cscRAKB를 발현하도록 미생물을 변형함으로써 달성될 수 있다.
따라서, 바람직한 실시양태에서, 본 발명의 방법은 숙주 미생물에 수크로스 가수분해효소 (cscA 유전자에 의해 암호화됨) 및 수크로스 투과효소 (cscB 유전자에 의해 암호화됨)를 암호화하는 핵산 서열의 발현을 가능하게 하는 재조합 폴리뉴클레오티드를 제공하는 단계를 추가로 포함한다. 추가 실시양태에서, 상기 방법은 또한 조절 단백질 CscR 및 CscK (각각 cscR 및 cscK 유전자에 의해 암호화됨)를 암호화하는 재조합 폴리뉴클레오티드를 미생물에 제공하는 것을 포함한다.
본 명세서에서 사용되는 수크로스 가수분해효소 (sucrose hydrolase)는 수크로스-6-인산 가수분해효소를 의미하며, cscA 유전자에 의해 암호화되는 수크로스 또는 인버타제 (E.C. 3.2.1.26)로도 지칭된다. 수크로스 가수분해효소의 예시적인 아미노산 서열은 UniProt 등록번호 P40714로 제공되며, 예시적인 뉴클레오티드 서열은 등록번호 X81461로 제공된다.
본 명세서에서 사용되는 수크로스 투과효소 (sucrose permease)는 cscB 유전자에 의해 암호화되는 단백질을 의미한다. 수크로스 투과효소는 수크로스 수송 단백질로도 알려져 있으며, 예시적인 아미노산 서열은 UniProt 등록번호 P3000에서 찾을 수 있다. 수크로스 투과효소를 암호화하는 예시적인 뉴클레오티드 서열은 등록번호 X63740 또는 X81461에서 찾을 수 있다.
또한, 대장균 미생물은 내인성 대장균 포스포글루코뮤타제 (pgm) 또는 자일로스 이소머라아제 (xylose isomerase, xylA)의 수준 또는 활성을 증가시키기도록 유전적으로 변형될 수 있다. 상기 유전적 변형은 내인성 유전자의 발현을 증가시키기 위한 것일 수 있고 (예를 들어, 프로모터 영역의 변형에 의해), 유전자를 암호화하는 외인성 핵산의 도입 및 발현에 의한 것일 수 있다.
다른 실시양태에서, 상기 미생물은 류코노스톡 메센테로이데스 (Leuconostoc mesenteroides)로부터 수크로스 포스포릴라아제를 발현하도록 변형된다.
핵산
"단리된" 핵산 분자는 핵산을 암호화하는 폴리펩타이드의 천연 공급원에서 일반적으로 결합되는 적어도 하나의 오염 핵산 분자와 식별되고 분리된 핵산 분자이다. 단리된 핵산 분자는 자연에서 발견되는 형태나 환경과는 다르다. 따라서 단리된 핵산 분자는 천연 세포에 존재하는 핵산 분자와 구별된다. 그러나, 단리된 핵산 분자는, 예를 들어 핵산 분자가 천연 세포와는 다른 염색체 위치에 있는, 일반적으로 핵산을 발현하는 세포에 함유된 핵산 분자를 포함한다.
본 명세서에서 "핵산 분자"와 "폴리뉴클레오티드"라는 용어는 상호 교환적으로 사용되며, 임의의 길이의 뉴클레오티드의 중합체 형태, 디옥시리보뉴클레오티드 또는 리보뉴클레오티드 또는 이들의 유사체를 의미한다. 폴리뉴클레오티드의 비제한적인 예로는 유전자, 유전자 단편, 메신저 RNA (mRNA), cDNA, 재조합 폴리뉴클레오티드, 플라스미드, 벡터, 임의의 서열의 단리된 DNA, 임의의 서열의 단리된 RNA, 핵산 프로브 및 프라이머가 있다. 선택된 폴리펩타이드를 암호화하는 핵산 서열은 적절한 조절 서열의 제어 하에 놓였을 때 생체 내에서 전사되고 (DNA의 경우) 폴리펩타이드로 번역되는 핵산 분자이다. 코딩 서열의 경계는 5' (아미노) 말단의 시작 코돈과 3' (카르복시) 말단의 번역 종결 코돈에 의해 결정된다. 전사 종결 서열은 코딩 서열의 3' 에 위치할 수 있다.
본 발명의 폴리뉴클레오티드는 Sambrook 외 (1989, Molecular Cloning―a laboratory manual; Cold Spring Harbor Press)에 예로서 기술된 바와 같이 당업계에 잘 알려진 방법에 따라 합성될 수 있다.
본 명세서에 사용된 "최적화된 코돈"은 숙주 미생물에서 유전자의 코돈 사용과 유사하도록 DNA 서열을 최적화하는 것을 의미한다. 바람직한 실시양태에서, 서열에서의 코돈 사용은 고도로 발현된 대장균 유전자의 코돈 사용과 유사하도록 최적화된다.
본 발명의 폴리뉴클레오티드 분자는 삽입된 서열에 작동 가능하게 연결된 제어 서열을 포함하여 폴리펩타이드의 발현을 가능하게 하는 발현 카세트의 형태로 제공될 수 있다. 이러한 발현 카세트는, 차례로, 전형적으로 벡터 (예를 들어, 플라스미드 또는 재조합 벡터) 내에 제공된다. 적합한 벡터는 충분한 양의 유전 정보를 전달할 수 있고, 본 발명의 폴리펩타이드의 발현을 허용하는 임의의 벡터일 수 있다.
따라서 본 발명은 이러한 폴리뉴클레오티드 서열을 포함하는 발현 벡터를 포함한다. 발현 벡터는 분자 생물학 분야에서 일상적으로 구성되며 원하는 폴리펩타이드의 발현을 허용하기 위해 필요한, 예를 들어 플라스미드 DNA 및 적절한 개시제, 프로모터, 인핸서 및 기타 요소들의 사용을 포함할 수 있다. 다른 적합한 벡터들은 당업자에게 자명할 것이다. 이와 관련하여 참고할 추가적인 예로서 Sambrook 외가 언급된다.
따라서, 본 발명의 폴리펩타이드는 이러한 벡터를 세포에 전달하고, 벡터로부터의 전사가 일어나도록 함으로써 제공될 수 있다. 당업자는 형질전환 기술 등을 포함하여 이러한 발현 벡터를 세포에 전달하기 위한 표준 기술에 익숙할 것이다.
상기 벡터는 플라스미드일 수 있다. 특정 실시양태에서, 상기 플라스미드는 높은 복제수 플라스미드 또는 낮은 복제수 플라스미드이다. 벡터는 당업계에 잘 알려져 있으며 클로닝 벡터, 발현 벡터 등을 포함할 수 있다. 클로닝 벡터는 숙주 세포에서 자율적으로 복제하거나 게놈에 통합될 수 있는 재조합 핵산 구조체이며, 벡터가 결정 가능한 방식으로 절단될 수 있고 새로운 재조합 벡터가 숙주 세포에서 복제하는 능력을 유지하도록 원하는 DNA 서열이 결합될 수 있는 하나 이상의 엔도뉴클레아제 제한 부위로 특징지어진다. 플라스미드의 경우, 플라스미드가 숙주 박테리아 내에서 복제수가 증가함에 따라 원하는 서열의 복제가 여러 번 또는 숙주가 유사분열로 번식하기 전에 숙주당 단 한 번만 발생할 수 있다. 파지의 경우, 복제는 용균성 단계에서 능동적으로 또는 용원성 단계에서 수동적으로 발생할 수 있다. 발현 벡터는 원하는 DNA 서열이 조절 서열과 작동 가능하게 결합되고 RNA 전사체로 발현될 수 있도록 제한 및 결찰에 의해 삽입될 수 있는 재조합 핵산 구조체이다. 벡터들은 벡터와 함께 형질전환되거나 형질주입되지 않은 세포의 식별에 사용하기에 적합한 하나 이상의 마커 서열을 추가로 포함할 수 있다. 예를 들어, 마커는 항생제 또는 다른 화합물에 대한 저항성 또는 감도를 증가 또는 감소시키는 단백질을 암호화하는 유전자, 당업계에 알려진 표준 분석 (예를 들어, β-갈락토시다아제, 루시페레이스 또는 알칼리성 인산가수분해효소)에 의해 활성이 검출 가능한 폴리펩타이드 또는 효소를 암호화하는 유전자, 가시적으로 형질전환 또는 형질주입된 세포, 숙주, 콜로니 또는 플라크 (예: 녹색 형광 단백질과 같은 형광 단백질)의 표현형에 영향을 미치는 유전자를 포함한다. 바람직한 벡터는 작동 가능하게 연결된 DNA 세그먼트에 존재하는 구조적 유전자 생성물의 자율적인 복제 및 발현이 가능한 벡터이다.
본 명세서에서 사용되는 코딩 서열 및 조절 서열은 조절 서열의 영향 또는 제어 하에 코딩서열의 발현 또는 전사를 두는 방식으로 공유 연결될 때, "작동 가능하게" 연결되거나 연결된 것으로 언급된다. 코딩 서열이 기능적 단백질로 번역되는 것이 바람직할 경우, 두 DNA 서열은 5' 조절 서열에서 프로모터의 유도로 코딩 서열의 전사를 초래하고, 두 DNA 서열 간의 연결 특성이 (1) 프레임 이동 돌연변이의 도입을 일으키지 않거나, (2) 코딩 서열의 전사를 지시하는 프로모터 영역의 능력을 방해하거나, 또는 (3) 해당 RNA 전사체가 단백질로 번역되는 능력을 방해한다. 따라서, 프로모터 영역은 생성된 전사체가 원하는 단백질 또는 폴리펩타이드로 번역될 수 있도록 해당 DNA 서열의 전사를 수행할 수 있는 경우에 프로모터 영역이 암호화 서열에 작동 가능하게 결합되거나 연결될 것이다.
유전자 발현에 필요한 조절 서열의 정확한 특성은 종 또는 세포 유형에 따라 다를 수 있지만, 필요에 따라 TATA 박스, 캡핑 시퀀스, CAAT 시퀀스 등과 같은 각각 전사 및 번역의 개시와 관련된 5' 비-전사 및 5' 비-번역 서열을 일반적으로 포함해야 한다. 특히, 이러한 5' 비-전사 조절 서열은 작동 가능하게 연결된 유전자의 전사 조절을 위한 프로모터 서열을 포함하는 프로모터 영역을 포함할 것이다.
조절 서열은 또한 원하는 대로 인핸서 서열 또는 업스트림 활성제 서열을 포함할 수 있다. 본 발명의 벡터는 선택적으로 5' 리더 또는 신호 서열을 포함할 수 있다. 적절한 벡터의 선택 및 설계는 당업자의 능력 및 재량에 속한다.
"프로모터"는 폴리펩타이드를 암호화하는 폴리뉴클레오티드의 전사를 개시하고 조절하는 뉴클레오티드 서열이다. 프로모터는 유도성 프로모터 (프로모터에 작동 가능하게 연결된 폴리뉴클레오티드 서열의 발현이 분석물, 보조 인자, 조절 단백질 등에 의해 유도되는 경우), 억제성 프로모터 (프로모터에 작동 가능하게 연결된 폴리뉴클레오티드 서열의 발현이 분석물, 보조 인자, 조절 단백질 등에 의해 억제되는 경우) 및 구성적 프로모터를 포함할 수 있다. "프로모터" 또는 "제어 요소"라는 용어는 전장 프로모터 영역 및 이들 영역의 기능적 (예를 들어, 전사 또는 번역을 제어하는) 단편을 포함하는 것으로 의도된다.
본 발명의 핵산은 바람직하게는 본 명세서에 기재된 바와 같이 수소 생산을 가능하게 하는 적합한 조건 하에 배양될 때 대상 효소가 세포에서 발현되도록 프로모터에 작동 가능하게 연결된다. 프로모터는 개별 박테리아 세포 종에 대해 특이적일 수 있다. 프로모터는 세포에서 관찰되는 전형적인 발현 수준 이상으로 유전자의 발현을 증가시키는 이종 프로모터일 수 있다. 프로모터는 유도성 프로모터일 수 있다.
본 발명에 따른 폴리뉴클레오티드, 발현 카세트 또는 벡터는 신호 펩타이드 서열을 추가로 포함할 수 있다. 신호 펩타이드 서열은 일반적으로 프로모터와의 작동 가능한 연결로 삽입되어 신호 펩타이드가 발현되고, 또한 프로모터와의 작동 가능한 연결에서 코딩 서열에 의해 암호화된 폴리펩타이드의 분비를 촉진한다. 어떤 실시양태에서든, 본 명세서에 설명된 예시적인 발현 카세트, 벡터 또는 서열이 신호 펩타이드 서열을 포함하지 않도록 추가로 변형될 수 있음이 추가로 이해될 수 있다.
임의의 적절한 발현 벡터 (예를 들어, Pouwels 외, Cloning Vectors: Laboratory Manual(Elsvier, N.Y.: 1985)에 기재된 바와 같음) 및 상응하는 적합한 숙주는 재조합 폴리펩타이드의 생산에 사용될 수 있다. 발현 숙주는 에스케리키아 (Escherichia), 바실러스 (Bacillus), 슈도모나스 (Pseudomonas), 살모넬라 (Salmonella), 숙주 세포계 등의 박테리아 종을 포함하지만 이에 제한되지 않는다. 당업자는 발현 숙주의 선택이 생성되는 폴리펩타이드의 유형에 영향을 미친다는 것을 알고 있다.
일부 실시양태에서, 세포는 관심 분자를 생산하거나 생산을 변경, 선택적으로 증가시키도록 조작되거나 선택된다 (예를 들어, 본 명세서에 설명된 바와 같이). 일부 실시양태에서, 세포는 하나 이상의 유전자 (예를 들어, 본 명세서에 설명된 바와 같이 하나 이상의 조절 또는 경쟁 대사 유전자)의 결실 또는 돌연변이를 포함한다. 다른 실시예에서, 결실되거나 돌연변이된 하나 이상의 유전자는 경쟁 경로에 있다. 돌연변이는 단일 또는 다중 점 돌연변이, 추가, 부분 내부 결실, N-말단 또는 C-말단 결실 (절단) 또는 완전한 결실일 수 있으며, 이 모든 것은 유전자(들)로 암호화된 아미노산 서열에 영향을 미칠 수 있다.
결실 또는 돌연변이는 당업계의 표준적인 방법을 사용하여 이루어질 수 있다. 돌연변이는 비-무작위, 부분 무작위 또는 무작위, 또는 이러한 돌연변이의 조합일 수 있다. 예를 들어, 부분적으로 무작위적인 돌연변이의 경우, 돌연변이는 돌연변이가 생성될 폴리펩타이드를 암호화하는 핵산 분자의 특정 부분에 국한될 수 있다.
미생물의 배양 및 변형
특히 바람직한 실시양태에서, 본 명세서에 기재된 바와 같은 미생물 또는 숙주 세포의 배양은 초기에 바이오매스를 생성하기 위해 호기성 조건 하에서 수행된 후, HPGC의 발현동안 혐기생활 (anaerobiosis)을 유도하기 위해 혐기성 조건으로 전달된다. 당업자는 중성 가스 (예컨, N2) 또는 환원제의 첨가를 포함하여 혐기생활 생성 기술에 익숙할 것이다. 그러나, 혐기생활은 산화성 탄소 공급원의 존재 하에서 밀폐된 용기 내에서 단순히 미생물을 배양하는 것만으로 달성될 수 있음이 이해될 것이다.
또한, 미생물 또는 숙주세포의 배양은 바람직하게는 배양 배지에 제2철 (철 III) 또는 제1철 (철 II) 염을 포함하여 수행된다. 바람직하게는, 제2철 (철 III) 또는 제1철 (철 II) 염은 배지에 적어도 약 5 μM, 적어도 약 10 μM, 적어도 약 20 μM 또는 적어도 약 30 μM 또는 그 이상의 최종 농도로 제공된다. 바람직하게는, 배양 배지에 제공된 제2철 (철 III) 또는 제1철 (철 II) 염의 최종 농도는 약 20 μM 이상이다.
당업자는 재조합 단백질의 생산을 위한 재조합 숙주 세포의 배양이 유기체에서 단백질의 성장 및 발현에 최적인 온도에서 수행될 것임을 이해할 것이다. 예를 들어, 대장균 및 관련 박테리아 유기체의 성장을 위한 최적 온도는 약 37 ℃이고, 재조합 단백질을 생산하기 위한 효모의 성장 온도는 약 30-32 ℃이다. 그러나, 본 발명자들은 배양 온도가 감소하면 대장균과 같은 박테리아 발현 시스템을 사용할 때 기능적인 수소화효소의 발현이 더욱 향상될 수 있음을 발견하였다. 따라서, 미생물 또는 숙주세포가 대장균인 바람직한 실시양태에서, 배양 온도는 약 30 ℃ 이하이다. 상기 온도는 약 10 ℃ 내지 약 30 ℃일 수 있고, 바람직하게는 적어도 약 15 ℃일 수 있다. 특정 실시양태에서, 온도는 약 20 ℃ 내지 약 30 ℃이다. 특히 바람직한 실시양태에서, 온도는 약 20 ℃ (예를 들어, 18 ℃, 19 ℃, 20 ℃, 21 ℃, 22 ℃)이다.
"유전적으로 조작된" 또는 "유전적으로 변형된"은 임의의 재조합 DNA 또는 RNA 기술에 의해 변형된 모든 세포를 의미한다. 즉, 세포는 재조합된 폴리뉴클레오티드 분자와 함께 형질주입, 형질전환 또는 형질도입되어 세포가 원하는 단백질의 발현을 일으키도록 변형된다. 숙주 세포를 유전적으로 조작하기 위한 방법 및 벡터는 당업계에 잘 알려져 있으며, 예를 들어 다양한 기술들이 Current Protocols in Molecular Biology, Ausubel et al., eds. (Wiley & Sons, New York, 1988, and quarterly updates)에 설명되어 있다. 유전자 공학 기술에는 발현 벡터, 표적 상동 재조합 및 유전자 활성화 (예를 들어, 미국 특허번호 제5,272,071호 참조) 및 조작된 전사 인자에 의한 트랜스-활성화 (예를 들어, Segal et al., 1999, Proc Natl Acad Sci USA 96(6):2758-63 참조)를 포함하지만 이에 제한되지 않는다.
특정 실시양태에서, 본 명세서에 기재된 유전자 변형은 유전자 발현 또는 기능의 증가를 초래하고, 유전자의 증폭, 과잉 생산, 과발현, 활성화, 향상, 첨가 또는 상향 조절로 지칭될 수 있다. 보다 구체적으로, 본 명세서에서 논의된 효소 또는 다른 단백질의 작용 (또는 활성) 증가에 대한 언급은 일반적으로 효소 또는 단백질의 발현 및/또는 기능성 (생물학적 활성)을 증가시키고, 효소의 더 높은 활성 (예를 들어, 특정 활성 또는 생체 내 효소 활성), 효소의 억제 또는 분해 감소, 및 효소의 과발현을 포함한다. 예를 들어, 유전자 복제수를 증가시키거나, 발현 수준을 증가시키거나, 유전공학이나 고전적인 돌연변이 유발에 의해 유전자를 변형시켜 효소의 생물학적 활성을 증가시킬 수 있다. 이러한 변형 중 일부의 조합도 가능하다.
본 명세서에서 사용된 용어 "외인성 폴리뉴클레오티드"는 주어진 유기체에서 자연적으로 생성되는 폴리뉴클레오티드로부터 유래되지 않은 폴리뉴클레오티드를 의미하기 위한 것이다. 외인성 폴리뉴클레오티드는 다른 유기체에 존재하는 폴리뉴클레오티드로부터 유래될 수 있다. 본 발명에 따르면, 대장균 세포는 세포가 수소를 생성할 수 있도록 하는 하나 이상의 효소를 암호화하는 하나 이상의 외인성 폴리뉴클레오티드를 포함하는 핵산 구조체로 유전적으로 변형될 수 있다.
외인성 폴리뉴클레오티드는 이종 (heterologous) 또는 상동 (homologous)일 수 있다. "이종"이라는 용어는 언급된 종 이외의 근원에서 유래된 분자 또는 활성을 의미하며, "상동"은 숙주 미생물 유기체로부터 유래된 분자 또는 활성을 의미한다. 따라서, 본 발명의 핵산 분자의 외인성 발현은 이종 또는 상동의 핵산 분자 중 하나 또는 모두를 사용함으로써 이루어질 수 있다.
외인성 폴리뉴클레오티드는 하나 이상의 발현 구조체 (플라스미드 벡터)로 제공될 수 있다.
미생물을 형질전환시키는 방법은 당업계에 잘 알려져 있으며, 전기천공법, 염화칼슘- 또는 리튬 아세테이트- 기반 방법 등의 비제한적인 예를 포함할 수 있다.
당업자는 관련 구조체의 성공적인 형질전환을 확인하는 방법뿐만 아니라, 형질전환체가 암호화된 단백질에 의해 제공되는 관련 효소 활성을 가지고 있는지 여부를 결정하는 방법에 익숙할 것이다. 예를 들어, 포스포프룩토키나아제 활성 (따라서 암호화된 단백질의 올바른 단백질 접힘을 추론)은 시판되는 효소 분석 키트를 사용하여 추론할 수 있다.
유사하게, 당업자는 관련 단백질의 활성 수준 또는 관련 유전자의 발현 수준의 억제 또는 결실을 확인하기 위한 표준 기술에 익숙할 것이다. 성공적인 유전자 변형, 삭제 또는 대체는 표준 시퀀싱 기술을 사용하여 확인할 수 있다. 세포를 억제제와 접촉시킨 후 단백질 활성의 성공적인 억제는 예를 들어 시판되는 효소 분석 키트를 사용하여 관련 단백질의 활성을 평가함으로써 평가할 수 있다.
또한, 당업자는 재조합 미생물에서 폴리뉴클레오티드의 발현을 유도하는데 필요한 일반적인 배양 기술에 익숙할 것이며, 이에 따라 필요한 경우 HPGC의 단백질 생산을 유도하여 수소를 생산할 수 있을 것이다. 일부 실시예에서, 재조합 미생물의 액체 배양물은 글루코스가 보충된 혐기성 조건 하에 성장된다.
성공적인 형질전환은 또한 세포 내로 형질전환될 벡터의 플라스미드에 선택 마커 유전자를 포함시킴으로써 결정될 수 있다. 본 명세서에 사용된 용어 "선택 마커 유전자"는 선택적 배양 배지에서 성장한 숙주 세포의 생존 및/또는 성장에 필요한 단백질을 암호화하는 유전 물질을 의미한다. 대장균을 포함한 미생물에 사용할 전형적인 선택 마커 유전자는 당업자에게 잘 알려져 있다.
수소 생성의 측정은 실시예에 설명된 것을 포함하는 임의의 적합한 방법에 의해 수행될 수 있다. 한 가지 간단한 예로서, 수소 생성은 배양에서 기포의 생성을 관찰함으로써 간단히 측정할 수 있다. 다른 예에서, 수소 생성의 생산 및 정량화는 가스 기포를 샘플링하고 열전도율 또는 질량분석법에 의한 검출과 함께 가스 크로마토그래피에 의한 가스 조성을 분석함으로써 이루어진다. 다른 예에서는, 당업자에게 알려진 클락형 (Clark-type) 전극, 또는 수소 생성을 검출하기 위한 임의의 다른 적절한 방법이 사용될 수 있다.
본 발명의 임의의 실시양태에서, 상기 미생물, 바람직하게는 대장균 미생물은 수소 생산을 유도하기 전에 일정 기간 동안 저장될 수 있다. 예를 들어, 특정 실시양태에서, 본 발명의 미생물 또는 본 명세서에 기재된 방법은 수소를 생성할 수 있는 재조합 미생물을 생성하기 위해 필요한 폴리뉴클레오티드로 미생물의 형질전환을 수반할 수 있다. 그 다음, 미생물은 수소 생산에 필요할 때까지 미생물의 저장에 적합한 조건 (예를 들어, 4 ℃, -20 ℃ 또는 -80 ℃의 적절한 완충액에서) 하에 수확되고 저장될 수 있다. 또한 미생물은 추가 사용을 위해 필요할 때까지 동결건조될 수 있음이 이해될 것이다. 또한, 미생물은 HPGC의 발현을 가능하게 하는 조건 하에 성장한 다음 수확하고, 필요한 경우 저장한 다음, 박테리아의 수소 생산을 개시하기 위해 글루코스가 보충된 적절한 용액에 재현탁될 수 있음을 이해할 것이다.
일부 실시예에서, 생산되고 HPGC를 발현한 배양된 박테리아는 수소를 생산하기 위해 등삼투 (isoosmotic) 조건 하에 글루코스를 수확하고 공급한다.
특정 실시양태에서, 박테리아는 표준 기술을 사용하여 예를 들어 칼슘알지네이트 비드에 캡슐화되고, 수소를 생산하기 위해 등삼투성 배지에서 글루코스를 공급받는다. 당업자는 Inotech Encapsulator IE-50R (Encap Bio Systems Inc) 또는 Encapsulator B-390/B-395 pro (Buchi)와 같은 장치 또는 관련 시스템을 사용하여 바이오-캡슐화를 위한 표준 매뉴얼 및 메커니즘 기술 및 장비에 익숙할 것이다. 다른 방법은 예를 들어, Heidebach, et al., (2012) Critical Reviews in Food Science and Nutrition, 52: 291-311; Martn et al., (2015) Innovative Food Science & Emerging Technologies 27:15-25에서 설명되며, 전체 내용이 본 명세서에 참조로 포함된다.
다른 실시예에서, 재조합 미생물은 본 발명에 따라 수소를 생산할 수 있기 위해 생존가능 (즉, 재생산, "성장" 또는 세포 수 증가 가능)할 필요가 없다. 예를 들어, 임의의 실시양태에서, 상기 방법은 본 명세서에 기재된 바와 같은 재조합 미생물을 제공하거나 생성하고, 수소를 생성하는데 필요한 단백질 (예를 들어, HPGC에 의해 암호화되는 단백질)의 발현을 유도하기에 충분한 시간 및 조건 하에서 미생물을 배양하고 그 다음 미생물을 불활성화시키는 것을 포함한다. 바람직하게는, 불활성화된 미생물은 온전하게 남아있지만, 이것이 필수적인 요건은 아님을 이해할 것이다.
이어서, 본 발명의 불활성화된 재조합 미생물을 이용하여, 예를 들어 본 명세서에 기재된 바와 같이 수소를 생성할 수 있다.
당업자는 세포가 온전한 상태로 유지되지만 여전히 수소를 생산하는데 사용될 수 있도록 (즉, 세포에 의해 발현된 HPGC 및 다른 단백질부터) 미생물을 비활성화하는 방법에 익숙할 것이다. 불활성화는 감마선 조사 또는 항생제 (미토마이신 또는 이와 유사한 것과 같은) 처리에 의해 수행될 수 있다.
임의의 실시양태에서, 미생물의 적어도 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% 또는 100%가 불활성화된다.
시스템 및 장치
본 발명은 또한 본 발명의 미생물을 포함하는 시스템 및 장치, 또는 수소를 생산하기 위한 본 명세서에 기재된 방법을 포함하는 반응기 시스템을 제공한다.
바람직한 실시양태에서, 본 발명은 미생물에 의해 생성된 수소 가스를 포집하기 위한 수소 가스 포집 시스템을 추가로 포함한다. 수소 가스 포집 시스템은 생성된 수소 가스를 포집하여 선택적으로 저장하여 사용할 수 있도록 반응기 시스템에 포함될 수 있다. 대안적으로, 생성된 수소 가스는 예를 들어, 수소 연료 동력 장치와 같은 사용 지점으로 유도될 수 있다.
일부 실시양태에서, 수소 가스 포집 유닛은 반응기 시스템에서 생성된 수소 가스의 흐름을 저장 용기로 또는 직접 사용 지점으로 유도하기 위한 하나 이상의 수소 가스 도관을 포함한다. 다른 실시양태에서, 수소 가스 도관은 선택적으로 스윕 가스의 소스에 연결되며, 여기서 수소 가스는 스윕 가스를 사용하여 수집된다. 예시적인 스윕 가스는 질소이다. 예를 들어, 수소 가스가 초기에 생산됨에 따라, 스윕 가스가 수소 가스 도관에 도입되어 저장 용기 또는 수소 가스 사용 지점 방향으로 흐를 수 있다. 추가 실시양태에서, 수소 포집 시스템은 반응기 시스템으로부터 수소를 포집하기 위한 용기를 포함할 수 있다. 또 다른 실시양태에서, 포집 시스템은 수소의 통과를 위한 도관을 더 포함할 수 있다. 도관 및/또는 용기는 반응 챔버로부터 수소 가스의 유출을 위해 제공된 채널과 가스 흐름 연통될 수 있다.
연료전지는 연료의 에너지를 직접 전기화학 및 열에너지로 변환하는 전기 화학 장치이다. 일반적으로, 연료전지는 전해질을 통해 전기적으로 연결된 산화전극과 환원전극으로 구성된다. 예를 들어, 수소와 같은 연료는 산화전극에 공급되어 전기촉매의 도움으로 산화된다. 환원전극에서는 산소 (또는 공기)와 같은 산화제의 환원이 발생한다. 전극에서 발생하는 전기화학적 반응은 전류를 생성하고 그에 따라 전기 에너지를 생성한다. 일반적으로 추가 전기를 제공하거나 다른 목적으로 사용할 수 있는 열에너지도 생성된다. 현재 연료전지에 사용되는 가장 일반적인 전기화학적 반응은 수소와 산소가 반응하여 물을 생성하는 반응이다. 분자 수소 자체는 산화되는 산화전극에 공급될 수 있으며, 생성된 전자는 외부 회로를 통해 산화제가 환원되는 환원전극으로 전달된다. 중간 전해질을 통과하는 이온 흐름은 전하 중성을 유지한다.
본 발명의 연료전지는 수소의 공급원이 본 발명의 재조합 미생물로부터 유래하는 연료로서 수소를 이용한다.
일반적으로, 수소는 연료원 내에 적어도 약 2% 부피, 바람직하게는 적어도 약 5%, 더욱 바람직하게는 적어도 약 10% 부피, 예를 들어 약 25%, 50%, 75% 또는 90%의 부피로 존재한다. 연료 가스의 일부를 형성하기 위해 불활성 가스를 사용하는 경우, 일반적으로 적어도 약 10%, 예컨대 적어도 약 25%, 50% 또는 75%, 가장 바람직하게는 적어도 약 80% 이상의 부피로 존재한다.
일반적으로, 연료 공급원은 기체 또는 액체 형태로 연료 공급원의 선택적으로 가압된 용기로부터 공급된다. 연료 공급원은 선택적으로 밸브를 포함할 수 있는 입구를 통해 전극에 공급된다. 사용된 연료 또는 폐연료원이 연료전지를 나갈 수 있는 배출구도 제공된다.
산화제는 일반적으로 산소를 포함하지만, 다른 적절한 산화제가 사용될 수 있다. 상기 산화제 공급원은 통상적으로 상기 산화제를 포함하는 기체 형태로 환원전극에 산화제를 공급하며, 일부 실시양태에서는 상기 산화제가 액체 형태로 제공될 수 있다. 일반적으로, 산화제 공급원은 불활성 기체를 포함하지만, 순수한 형태의 산화제가 사용될 수도 있다. 예를 들어, 질소, 헬륨, 네온 또는 아르곤과 같은 하나 이상의 기체를 산소와 혼합하여 사용할 수 있다. 산화제 공급원은 선택적으로 추가 성분, 예를 들어 대체 산화제 또는 기타 첨가제를 포함할 수 있다. 적절한 산화제 공급원의 예는 공기이다.
일반적으로, 산소는 산화제 공급원 내에 적어도 약 2% 부피, 바람직하게는 적어도 약 5%, 더욱 바람직하게는 적어도 약 10%의 부피로 존재한다.
일반적으로, 산화제 공급원은 기체 또는 액체 형태의 산화제 공급원의 선택적으로 가압된 용기로부터 공급된다. 산화제 공급원은 선택적으로 밸브를 포함하는 입구를 통해 전극에 공급된다. 사용되거나 폐기된 산화제 공급원이 연료전지를 나갈 수 있는 배출구도 제공된다.
산화전극은 임의의 도전재로 이루어질 수 있으며, 예를 들어 스테인리스강, 황동 또는 탄소, 흑연일 수 있다. 산화전극의 표면은, 적어도 부분적으로, 촉매의 흡착을 용이하게 하는 다른 물질로 코팅될 수 있다. 촉매가 흡착되는 표면은 수소화효소의 변성을 유발하지 않는 재질로 되어있다. 적합한 표면 재료의 예로는 연마된 흑연 표면 또는 탄소 천 또는 탄소 스펀지와 같은 높은 표면적을 가진 재료를 들 수 있다. 표면이 거칠거나 표면적이 높은 소재가 일반적으로 선호된다.
환원전극은 산화제가 그 표면에서 환원될 수 있도록 하는 임의의 적합한 도전재로 이루어질 수 있다. 예를 들어, 기존의 연료 전지에서 환원전극을 형성하기 위해 사용되는 물질들이 사용될 수 있다. 원하는 경우, 전기촉매는 환원전극에 존재할 수 있다. 이러한 전기촉매는, 예를 들어 양극 자체에 코팅 또는 흡착될 수 있고, 환원전극을 둘러싸는 용액에 존재할 수 있다. 적합한 전기촉매는 백금과 같은 기존의 연료 전지에 사용되는 것을 포함한다. 생물학적 촉매는 이러한 목적, 특히 본 명세서에 기재된 효소 및 보조 단백질의 조합을 위해 사용될 수 있다.
본 발명의 연료전지는 통상 적어도 약 25 ℃, 보다 바람직하게는 적어도 약 3O ℃의 온도에서 작동된다. 연료전지는 약 35 ℃ 내지 약 65 ℃의 온도, 예컨대 약 40 ℃ 내지 약 50 ℃의 온도에서 작동되는 것이 바람직하다. 온도가 높을수록 반응 속도가 증가하고 산화 전류가 높아진다.
연료전지는 전술한 바와 같이, 전기 회로에서 전류를 발생시키기 위해, 전술한 조건 하에서 작동될 수 있다. 연료전지는 산화전극에 수소를 공급하고 환원전극에 산화제를 공급함으로써 작동된다. 본 발명의 연료전지는 양극의 표면적 cm2 당 적어도 약 0.5 mA 이상, 전형적으로 적어도 0.8 mA, 1 mA 또는 1.5 mA의 전류밀도를 생성할 수 있다. 예를 들어, 본 발명의 연료전지는 양극의 표면적 cm2 당 적어도 약 3 mA와 같이 적어도 약 2mA의 전류를 생성할 수 있다.
실시예
실시예 1
재료 및 방법
박테리아 균주 및 플라스미드
야생형 (DH5α) 에쉬리키아 콜라이 (Escherichia coli) NEB 5-알파 (CP017100.1, (Anton and Raleigh, 2016))는 DH5α의 즉각적인 fhuA2 유도체이자 K-12의 유도체로서, 뉴 잉글랜드 바이오랩 (New England Biolabs)에서 구입하여 Lubia-Bertani (LB)와 1.5% 한천이 함유된 플레이트에 유지하였다. 필요에 따라 항생제 클로로암페니콜 (chloramphenicol, Cam) 30 mg L-1과 황산 카나마이신 (kanamycin sulfate, Kan) 50 mg L-1이 포함되었다. DH5α의 돌연변이 균주는 CRISPR/Cas9 방법을 사용하여 구성되었다 (Reisch and Prather, 2015). 플라스미드 pHPGC (CamR)는 표준 바이오브릭 (Biobrick) 조립 방법, 제한 분해 및 결찰법을 사용하여 구성되었다. 생성된 플라스미드는 표준 절차에 의해 WT 및 돌연변이 균주로 형질변환되었다. 수소 생산에 사용되는 균주 및 플라스미드는 표 2에 나열되어있다. HPGC의 다양한 구성 요소 및 이종 프로모터의 서열 및 유전자 서열이 표 1에 나와 있다. 수소 생산에 사용된 야생형 및 돌연변이 균주의 게놈 서열을 나노포어 (Nanopore) 시퀀싱 기술을 사용하여 확인하였다.
발효
Cam을 포함하는 100 mL의 SOC (Super Optimal broth with Catabolite repression, SOC) 배지의 사전 배양물에 대장균 DH5α, DH5α-HPGC, ΔpfkA-HPGC 또는 ΔgpmA-HPGC (서열번호 10 및 30-40에 명시된 HPGC 구조체 사용)의 단일 콜로니를 접종하였다. 사전 배양물을 37 ℃에서 약 OD600 2 (1.6x109 세포)까지 밤새 배양하고, 멸균 여과된 (0.2 μm) 20 mM D-글루코스, 1 mM 산화철 및 Cam (30 mg L-1)을 첨가하여 2 L의 SOC 배지 (pH 7)에 접종하였다.
발효기 (Eppendorf, BioFlow 120 및 BioFlo®/CelliGen® 115 발효기/생물반응기)의 도움으로 1 M 수산화나트륨을 적정하여 37 ℃로 온도를 제어하고, pH를 7로 유지한 상태에서 100 rpm의 교반 속도로 세포는 OD600 0.6 (4.8x108 세포)로 혐기적으로 성장하였다. 세포 성장이 OD600 0.6 (4.8x108 세포)에 도달했을 때, 배양 온도는 유도 전에 18 ℃로 감소하였다. 세포는 멸균 여과된 이소프로필-b-D-티오갈락토피라노사이드 (IPTG, 1 mM) 및 1 mM 황산철로 유도되었다. 유도 중 발효 파라미터는 위와 같았으며, 세포는 밤새 대략 OD600 2 (1.6x109 세포)로 성장하였다. 이어서, 18 ℃에서 15분동안 4650 rcf의 원심 분리에 의해 세포를 수확하였다. 세포 펠렛을 1 mM 소듐 디티오나이트를 함유하는 1x PBS pH 7.4 (10 mM) 또는 1x PBS (약 50 mM) pH 8.0에서 3회 세척하여 4 ℃에서 보관하였다.
바이오수소 반응기
발효를 통해 얻은 DH5α, DH5α-HGPC, ΔpfkA-HGPC 또는 ΔgpmA-HGPC의 세포 펠렛을 20 OD600에 있는 1 x PBS (10 mM) pH 7.4 또는 1x PBS (약 50 mM) pH 8.0 에서 선택적으로 1 mM 디티오나이트와 함께 재현탁하고 (최종 부피 50 mL), 수소 생산을 테스트 및 측정하기 위해 100 mL 측면-원뿔형 플라스크에 넣었다. 플라스크는 현탁된 세포 내로 돌출된 pH 프로브가 있는 고무 마개로 밀봉되었다. 플라스크의 측면은 기체 부피를 측정하도록 설계된 맞춤 장치에 연결되었다. 테플론 코팅 마그네틱 바를 원뿔형 플라스크 내부에 배치하고 플라스크를 마그네틱 교반기 플레이트 위에 배치하였다. D-글루코스 (최종 농도 20 mM)를 첨가하여 박테리아 수소 형성을 개시하기 전에 원뿔형 플라스크의 헤드 스페이스를 100% 질소 가스 3 부피로 퍼징하였다. 실험은 약 22 ℃의 상온에서 수행되었다.
수소, 이산화탄소 및 pH측정
헤드스페이스 가스 샘플 (5 μL)과 pH 측정은 각각 시작 시 (D-글루코스 첨가 직후)와 가스 생산이 거의 중단될 때까지 약 15-20분마다 생체수소 반응기에서 채취 및 기록되었다. 가스 샘플은 시마즈 넥시스 (Shimadzu Nexis), GC-2030 컬럼 (Restek, ShinCarbon ST Micropacked GC Column, Cat. # 19808)과 하기의 GC 방법을 이용하여 분석되었다: SPL1 온도 100 ℃, 컬럼 유량 6 mL.min-1, DTCD 온도 180℃, 오븐 온도 40 ℃를 3분 동안 유지한 다음 15 ℃.min-1에서 170 ℃로 유지하고 170 ℃에서 2분 동안 유지. 캐리어 가스는 아르곤이었다. 컬럼 사양, 신카본 ST, 100/120 메쉬, 2 m, 1/16인치 OD, 1.0 mm).
가스 표준 (20% 수소, 20% 질소, 20% 일산화탄소 및 20% 이산화탄소 [제품번호: PGS402470D]; 아르곤 밸런스 가스와 10% 수소, 10% 질소, 10% 일산화탄소 및 10% 이산화탄소 [제품번호: PGS402469D]; 및 아르곤 밸런스 가스와 50% 산소 [제품번호: PGS402471D2])를 사용하여 수소와 이산화탄소의 % 농도를 측정하였다. 실험 중 원뿔형 측면 플라스크로의 공기 누출을 모니터링하기 위해 산소와 질소 가스도 측정되었다. 가스 표준은 BOC Australia에서 제공했다.
NMR 분석
각 시료에 대하여 세포배양 700 μL를 20,018 rcf에서 2분간 원심분리하여 펠렛화하였다. 상등액을 15 mL 팔콘 튜브 (600 μL)에 수집한 후 -80 ℃에서 냉동하였다. 그런 다음 샘플을 동결 건조하고 산화중수소 (800 μL)에 다시 재현탁하였다. 재현탁액을 NMR 튜브 (Norell Sample Vault Series, 표준 벽면, 폐쇄 캡, 파라미터 700 MHz 주파수, 직경 x L 5 mm x 178 mm, mfr no. Norell, SVCP-5-178-96PK)에 넣었다. 모든 NMR 스펙트럼은 5mm BBFO 스마트프로브가 장착된 Bruker AVIIIHD 400 MHz NMR 분광계에서 298K로 기록되었다. 스펙트럼은 Topspin 3.5. 1H 스펙트럼을 사용하여 64K 데이터 포인트에서 8013 Hz (20.0 ppm)의 스펙트럼 폭으로 처리하고 분석하였다.
결과
대장균의 DH5α-HPGC, ΔpkA-HPGC, ΔgpmA-HPGC 또는 DH5α-H1-HEGF (petF 및 FNR이 없는 HPGC) 균주는 글루코스를 첨가한 후 2시간 이내에 상당한 양의 가스를 생성하였다. 수소 생산의 중단은 글루코스의 완전한 소비와 관련이 있다. ΔgpmA-HGPC (예를 들어, 서열번호 10)는 글루코스 1몰 당 수소 0.95몰을 생성했고, ΔpfkA-HGPC는 글루코스 1몰 당 수소 0.85몰을 생성했으며, DH5α-H1-HEFG는 글루코스 1몰 당 수소 0.45몰을 생성하였다.
수소 가스의 최대 생산 속도는 22 ℃에서 균주를 포함하는 HPGC의 경우와 유사하며 시간당 200 OD600에서 L 세포당 3.6 +/- 0.06 L의 수소 가스이다. DH5α 및 DH5α-H1-HEFG에 대한 이러한 조건에서 검출 가능한 수소가 없는 HPGC가 없는 균주의 경우 속도가 더 낮았고 시간당 200 OD600에서 L 세포당 ~ 1.2 L의 수소 가스를 제공했으며 이는 petF-FNR이 부족했다.
충분히 완충되지 않아 pH가 5 미만으로 떨어지면 수소 생산이 중단된다. pH의 감소는 유기산 락테이트, 숙시네이트, 피루베이트 및 아세테이트의 생성에 기인하며, ΔpfkA 및 ΔgpmA 돌연변이는 유기산의 생성을 감소시켰다 (도 2).
실시예 2: 당분해 경로의 하부를 표적으로 한 수소 생산 속도
당분해 경로의 하부를 통해 글루코스로부터 탄소의 흐름을 감소시킨다는 증거가 도 4에 나타나있다. gpmM 또는 gpmA 유전자의 삭제는 수소 생산 속도를 향상시킨다.
gnd 및 zwf의 발현 증가는 또한 도 4와 같이 예상외로 수소 생산 속도를 향상시켰다.
도 5는 또한 5탄당 인산 경로 (Pentose Phosphate pathway, PPP)를 통해 글루코스로부터 탄소의 흐름 (flux)을 증가시키면 H2 대 CO2의 비율이 증가한다는 증거를 제공한다. 글루코스의 모든 탄소가 5탄당 인산 경로를 통해 CO2로 대사되고 생성된 환원제가 H2를 만드는 데 사용될 경우, 혐기성 조건에서 이론상 최대 비율은 2:1이다. 글루코스가 당분해 과정을 거치면 혐기성 조건에서 비율은 1:1이다. PPP를 통한 흐름의 증가는 글루코스로 만들어진 H2의 전반적인 수율을 향상시킬 것이다.
PPP를 통한 대사의 증가는 zwf 및/또는 gnd의 활성 및/또는 발현을 증가시킴으로써 달성될 수 있다. 대안적으로 이는 또한 pfk의 활성 (Δpfk의 경우)을 감소시켜 6개의 탄소를 가진 중간체가 있는 당분해 구간에서 3개의 탄소를 가진 중간체가 있는 당분해 구간로의 흐름을 감소시킴으로써 달성될 수 있다. 도 5에 표시된 데이터는 zwf의 발현 증가 또는 pfk 활성 감소가 수소 대 CO2의 비율을 증가시켜 5탄당 인산 경로를 통한 흐름을 증가시킨다는 것을 보여준다. gnd는 zwf에 의해 암호화되는 효소에 비해 대사 경로에서 하류에 있는 효소를 암호화하므로, 이 돌연변이에서 gnd의 활성 증가는 wt DH5α에 비해 H2 대 CO2 비율에는 큰 영향을 미치지 않는다.
본 명세서에 개시되고 정의된 본 발명은 본문 또는 도면에서 언급되거나 명백한 개별 특징들 중 둘 이상의 모든 대안적 조합으로 확장된다는 것이 이해될 것이다. 이러한 상이한 조합들 모두 본 발명의 다양한 대안적 측면을 구성한다.
SEQUENCE LISTING
<110> Macquarie University
<120> Recombinant microorganisms and process
<130> 53115999SCH
<150> 2020900990
<151> 2020-03-31
<160> 40
<170> PatentIn version 3.5
<210> 1
<211> 46
<212> DNA
<213> Chlamydomonas reinhardtii
<400> 1
ctagagggct ttacacttta tgcttccggc tcgtatgttg tgtgga 46
<210> 2
<211> 3478
<212> DNA
<213> Chlamydomonas reinhardtii
<400> 2
aagaaggaga tatacatatg gctcatagtt taagcgcaca ttcccgtcag gccggagatc 60
gcaaactggg cgcaggtgcg gcatctagcc gcccatcatg tccttctcgc cgcattgtcc 120
gcgtggcggc ccatgcttct gcgtccaagg cgactcccga tgtacctgtt gacgatcttc 180
ctcctgcgca tgcccgtgca gcagtagcgg ccgctaaccg tcgtgcgcgc gctatggcat 240
cagcggaggc cgcggcagag accctgggcg atttcctggg cttagggaag ggggggcttt 300
cgccgggcgc aaccgccaac cttgatcgtg agcaagtatt aggtgtgttg gaggcggtct 360
ggcgtcgtgg agaccttaat ctggagcgtg cgttgtacag ccatgccaat gcggtgacta 420
acaaatactg tggtgggggg gtctactatc gcggccttgt ggagttcagt aatatttgcc 480
aaaacgattg ctcatattgt gggattcgca acaatcaaaa agaagtttgg cgctatacta 540
tgccggttga agaggtggtc gaggtagcta agtgggcgct tgaaaacggc attcgcaaca 600
ttatgttgca agggggtgaa ttaaagacag agcaacgctt agcctacttg gaggcatgcg 660
tccgtgcgat tcgcgaggag acaacgcagt tagaccttga aatgcgcgca cgtgccgcga 720
gtacgacaac agcggaagcg gcagccagtg cacaggcaga cgccgaagct aaacgcggcg 780
agccagaatt gggtgtggtc gtatccttaa gcgtcggaga acttcctatg gaacagtatg 840
agcgtttgtt ccgcgccggc gcccgtcgct atctgatccg cattgaaacc tcgaatcccg 900
acctgtacgc ggcacttcac ccggagccga tgtcctggca cgcgcgtgta gaatgcctgc 960
gcaacctgaa gaaagctggg tatatgttgg gcacaggagt gatggtcggc ttgccgggac 1020
aaaccttaca cgacctggct ggggatgtca tgttctttcg cgacattaaa gcggacatga 1080
tcggtatggg ccccttcatt acgcagcctg ggacgcctgc aactgataag tggaccgcgc 1140
tgtatccgaa cgccaataag aacagccaca tgaaatctat gttcgatctg accactgcta 1200
tgaatgcact tgtacgtatt acgatgggga acgtaaatat cagtgctacg actgcattac 1260
aagcgattat ccccactgga cgtgaaattg cgcttgagcg cggcgcaaat gttgtcatgc 1320
ctattttaac gcctactcag tatcgcgagt cctatcagtt atatgagggt aagccctgca 1380
ttacggatac tgctgttcag tgtcgtcgtt gcctggacat gcgtttgcac tccgttggca 1440
aaacgtctgc ggccggagtt tggggcgatc ctgcttcgtt cttgcatccc atcgttggcg 1500
tcccagtccc gcacgacttg tcatcacctg ctttggccgc tgctgcaagt gcggattttc 1560
acgaggttgg cgcaggtccc tggaacccca tccgactaga gcgtctggtt gaagtgccgg 1620
accgttaccc tgaccccgat aaccacggac gcaaaaaggc aggagccggg aaaggaggca 1680
aggcgcatga ctctcacgac gatggcgatc acgacgacca ccaccaccac cacggagctg 1740
cccccgcggg tgcagcggct ggaaagggta ccggtgcagc tgcaattggt ggcggagcgg 1800
gggctagccg tcaacgcgta gcaggggctg ctgccgcctc tgctcgtctg tgtgcgggag 1860
ctcgccgcgc tggccgtgtt gtcgcgtcgc cattgcgccc agctgccgct tgccgtggtg 1920
tggccgtcaa ggccgcagct gctgctgcgg gtgaagacgc tggtgctggt acgtctggcg 1980
taggttcaaa tattgttacg tctcccggaa tcgctagcac tacggcacat ggtgttcctc 2040
gtatcaatat tggggtgttc ggcgtgatga atgcaggaaa gtctacactt gtgaatgctc 2100
tggcgcaaca ggaagcatgc attgttgact caacccccgg cacgaccgca gatgtaaaaa 2160
cagttttgct tgagcttcat gcccttggac cagccaagtt gctggacaca gccggattag 2220
acgaagtcgg tggacttggg gataaaaagc gccgtaaagc cctgaatacg ctgaaggagt 2280
gcgatgttgc tgtgctggtt gttgacactg atacggcagc cgccgcaatc aaatcgggac 2340
gccttgctga agccctggaa tgggaatcga aagtaatgga acaggcacac aagtataatg 2400
tcagtcctgt actgcttctg aatgtaaaat cacgcgggct gcctgaagcg caggcagcta 2460
gcatgcttga ggcggtcgct ggtatgcttg acccatccaa gcaaatccct cgtatgtcgc 2520
tggatttagc gtccaccccc ctgcacgagc gtagtacgat tacgtctgca ttcgtcaagg 2580
aaggagcagt gcgcagttca cgctatgggg ctcctctgcc ggggtgtttg ccccgttggt 2640
ctcttggacg caacgcccgc ttactgatgg taatcccgat ggatgccgaa accccaggtg 2700
gacgtcttct tcgtcctcaa gcgcaagtta tggaggaagc aatccgccat tgggctaccg 2760
tgctttccgt acgcctggat ttagacgccg cacgtggcaa attggggccc gaggcctgtg 2820
agatggagcg tcagcgtttc gacggggtaa ttgctatgat ggaacgtaat gacggaccca 2880
ccctggtggt gacagattct caagcgatcg atgttgtaca cccttggacc ctggaccgct 2940
catcaggacg tccgttggtt ccaattacta cctttagcat cgctatggcg taccaacaaa 3000
acggcggacg tttggacccg tttgtggaag gattggaagc attggagacg ttacaagatg 3060
gggatcgcgt tcttatttcg gaagcgtgta atcataaccg tatcacctcc gcttgcaacg 3120
acattggaat ggtgcagatc cctaacaagc tggaggcagc acttggcggg aaaaagttac 3180
aaatcgaaca tgcgtttggt cgcgagtttc ccgagcttga gagtgggggt atggatggat 3240
tgaagttagc gatccattgt ggagggtgta tgatcgacgc tcagaaaatg cagcagcgta 3300
tgaaagactt gcatgaggct ggggtgccgg tcactaatta tggggtgttt ttctcttggg 3360
cagcttggcc cgacgccctt cgtcgcgcat tggaaccgtg gggagtggag ccaccggtag 3420
gtactcctgc tacccccgca gccgcgcctg ctacggcagc gtccggggta taatacta 3478
<210> 3
<211> 46
<212> DNA
<213> Chlamydomonas reinhardtii
<400> 3
ctagagggct ttacacttta tgcttccggc tcgtatgttg tgtgga 46
<210> 4
<211> 1850
<212> DNA
<213> Chlamydomonas reinhardtii
<400> 4
aagaaggaga tatacatatg tcggtccccc tacagtgcaa tgcaggccgt cttttggcgg 60
gccagcgccc ctgcggcgtc cgcgcgcgtc tgaaccgccg tgtatgtgtt ccagtgaccg 120
cacacggcaa agcatctgcc acgcgcgaat acgctggtga ctttcttcca gggaccacta 180
ttagtcatgc gtggtccgtg gagcgtgaaa ctcatcaccg ttatcgtaat ccggccgagt 240
ggattaacga ggctgccatc cacaaggcgc ttgaaacgtc aaaggctgat gctcaggacg 300
caggacgcgt gcgtgagatt ttggcgaagg ctaaggaaaa ggcttttgtt actgaacatg 360
cgcctgtaaa tgcggaaagt aaatccgaat ttgtacaagg gcttaccttg gaggagtgcg 420
ccaccttaat taacgttgat tctaataatg tcgagttgat gaatgaaatc ttcgacactg 480
cgcttgctat caaagaacgt atctacggga accgcgtcgt gctgttcgcg cccttgtaca 540
ttgctaatca ttgtatgaac acttgcactt attgtgcgtt tcgctcagcc aataagggca 600
tggaacgctc tattctgaca gacgatgacc tgcgtgaaga agttgccgcc ttgcaacgtc 660
aaggtcatcg ccgcatttta gcccttactg gagaacatcc taaatacact ttcgacaatt 720
tcttgcatgc agtcaatgta atcgcttccg tgaagacaga gcctgaaggg tccattcgcc 780
gtatcaatgt cgaaatccca ccacttagtg tctcagacat gcgccgcctt aagaatacag 840
attcagttgg cacgttcgtt ctgtttcaag agacatatca ccgcgacaca ttcaaggtaa 900
tgcatccgtc aggtccaaag agcgactttg attttcgcgt cttgacccag gaccgcgcca 960
tgcgcgcagg cttggacgat gttggtattg gtgctttatt cgggttatat gattaccgtt 1020
atgaagtttg cgccatgtta atgcatagcg agcatttgga acgtgagtac aacgcaggac 1080
cacatactat ctctgttccc cgtatgcgcc ccgcggacgg aagcgagctt agtatcgcgc 1140
ctccttatcc tgttaatgat gctgatttta tgaaattagt tgcggtcctt cgtattgctg 1200
taccatacac aggtatgatc cttagcactc gtgaatcacc agaaatgcgc tcggcgcttc 1260
tgaagtgtgg gatgagtcaa atgagtgccg gctcgcgcac tgatgtagga gcctatcaca 1320
aagatcacac gttaagtaca gaggcgaatt tgagtaagtt agctgggcag tttaccttgc 1380
aggatgaacg tccaactaat gagattgtta agtggctgat ggaggagggc tatgtcccgt 1440
cttggtgcac agcttgttac cgtcaaggtc gtacgggcga agacttcatg aacatctgta 1500
aggctggtga cattcacgat ttctgtcatc ccaatagtct gcttacgctt caagagtacc 1560
ttatggatta tgcagatcca gaccttcgta agaaaggcga gcaagtaatt gcccgtgaga 1620
tgggaccgga cgcctctgag ccgttatcgg cgcaaagccg taagcgcctt gaacgcaaga 1680
tgaaacaagt attggagggg gagcacgatg tatatcttta accaggcatc aaataaaacg 1740
aaaggctcag tcgaaagact gggcctttcg ttttatctgt tgtttgtcgg tgaacgctct 1800
ctactagagt cacactggct caccttcggg tgggcctttc tgcgtttata 1850
<210> 5
<211> 46
<212> DNA
<213> Chlamydomonas reinhardtii
<400> 5
ctagagggct ttacacttta tgcttccggc tcgtatgttg tgtgga 46
<210> 6
<211> 1642
<212> DNA
<213> Chlamydomonas reinhardtii
<400> 6
aagaaggaga tatacatatg tccgcattag tacttaagcc ctgtgcggca gtatccatcc 60
gtggctcctc gtgtcgcgca cgccaagtag ccccacgcgc tccgcttgca gctagcacgg 120
ttcgtgtcgc tcttgcaacc ctggaggcac cagcgcgtcg tttaggaaac gtcgcctgtg 180
ccgcagcggc accggccgca gaggcaccct tgtctcacgt ccagcaagca ctggccgaac 240
tggcaaagcc caaagatgac cccacgcgta agcacgtttg cgttcaagtc gctcccgcag 300
tgcgtgtcgc tattgctgaa accttagggc ttgcgccggg cgctacgaca ccgaaacaat 360
tagcagaagg cctgcgtcgc ttgggctttg acgaggtttt cgatacgctg ttcggggccg 420
acttgacgat catggaagag ggctcagaac ttttgcaccg tctgacggag cacttggaag 480
cacacccgca ctctgatgag ccgctgccta tgtttaccag ctgctgtcct ggttggatcg 540
cgatgctgga gaaatcatac ccagacctta tcccttatgt aagttcttgc aaatcccctc 600
aaatgatgct ggctgctatg gtcaaatcgt atctggcgga aaaaaagggg attgcaccta 660
aagatatggt tatggtaagc attatgccat gcacacgcaa gcagagtgag gcggatcgtg 720
attggttttg tgtcgacgcg gacccaacac ttcgccaatt ggaccatgtg atcacgaccg 780
tagagctggg gaatattttc aaagagcgtg ggatcaacct tgcggaatta cccgaggggg 840
agtgggacaa cccaatgggg gtaggctccg gtgctggagt actttttggc accactggag 900
gggtaatgga ggcggcgctg cgtactgcat acgaattatt tactggaacc cccttacccc 960
gcctttcgct ttcggaggtg cgcggcatgg atggcattaa agagactaac atcacgatgg 1020
taccggcccc tggcagcaag tttgaagaac tgttaaagca ccgcgcggca gcgcgtgccg 1080
aggctgctgc acacggaaca cctggtccct tggcctggga cggcggcgca gggttcacct 1140
cggaggacgg gcgtgggggt atcactcttc gtgtggcggt agctaatggc ttgggaaacg 1200
ccaaaaagtt gatcacaaag atgcaggcgg gagaggcgaa gtatgacttt gtagaaatca 1260
tggcgtgtcc agcgggatgc gttgggggcg gcgggcagcc acgttccacc gataaagcaa 1320
ttacccagaa gcgccaggct gcactttaca atctggacga gaagtcgact ctgcgccgct 1380
cccatgaaaa cccgtctatc cgtgagttat acgacactta tttgggtgag cccttagggc 1440
acaaagcaca cgaactttta catactcact atgtagctgg cggggtcgag gagaaggatg 1500
agaaaaagtg accaggcatc aaataaaacg aaaggctcag tcgaaagact gggcctttcg 1560
ttttatctgt tgtttgtcgg tgaacgctct ctactagagt cacactggct caccttcggg 1620
tgggcctttc tgcgtttata ta 1642
<210> 7
<211> 46
<212> DNA
<213> Chlamydomonas reinhardtii
<400> 7
ctagagggct ttacacttta tgcttccggc tcgtatgttg tgtgga 46
<210> 8
<211> 392
<212> DNA
<213> Chlamydomonas reinhardtii
<400> 8
aagaaggaga tatacatatg gcgatgcgtt ccacatttgc tgcgcgtgtc ggtgccaaac 60
cggcagtgcg tggggcgcgt cccgcgtcgc gtatgtcttg catggcctat aaggttacac 120
tgaaaacgcc atcaggcgat aaaacaatcg aatgtccggc ggacacctat atcctggatg 180
ctgcggagga agccgggctg gaccttccct atagttgccg tgcgggcgcc tgttcatcct 240
gtgctggcaa agtggcagct ggaacggtag atcaatctga tcagtccttt ctggatgacg 300
ctcagatggg gaacggattc gtcctgacat gtgtcgcgta tcctacaagc gactgcacta 360
tccaaactca ccaagaggag gctttatatt aa 392
<210> 9
<211> 1189
<212> DNA
<213> Chlamydomonas reinhardtii
<400> 9
aagaaggaga tatacatatg caaactgttc gcgctccagc agcttcaggt gttgccacac 60
gtgtcgcagg tcgtcgtatg tgtcgtccgg ttgcggcgac gaaggcttcc acggctgtta 120
ccacagacat gtcgaagcgc actgttccaa ccaagttaga ggaaggtgaa atgccgttga 180
acacgtacag taataaagct ccgttcaagg caaaggttcg ttccgtggaa aaaatcacag 240
gaccaaaagc cacaggtgag acgtgccaca tcattattga aaccgagggg aagatcccgt 300
tttgggaggg acaatcgtac ggtgtaattc cgccggggac caagatcaac tctaagggaa 360
aagaagtgcc tcatggtact cgtctttatt cgattgcttc tagtcgttac ggagatgact 420
tcgatggtca aacggcatcg ctgtgtgttc gccgcgcggt atacgtcgat ccagagactg 480
gaaaggagga ccccgcgaaa aaaggactgt gtagtaactt tttgtgtgat gccacaccag 540
gcacggaaat ttccatgaca gggcccacag gaaaagtatt gcttctgcca gcagacgcga 600
acgcgccatt aatctgtgtc gcaacgggga ctggaatcgc gccttttcgc tcattctggc 660
gccgttgctt catcgagaat gtcccaagtt ataagttcac tggccttttc tggttgttta 720
tgggtgtcgc taactctgat gctaaattgt acgatgagga actgcaagct atcgcaaaag 780
cgtatccggg acaattccgc ctggactatg ccttgtctcg tgaacaaaat aatcgcaagg 840
gcgggaaaat gtacatccaa gataaggttg aagagtatgc cgacgaaatt ttcgatttat 900
tggataatgg ggcgcacatg tacttctgcg ggttaaaggg gatgatgcca ggcatccaag 960
atatgttaga acgcgttgca aaagaaaagg ggctgaacta cgaagagtgg gtcgaggggt 1020
taaagcacaa gaatcaatgg catgttgaag tctactaacc aggcatcaaa taaaacgaaa 1080
ggctcagtcg aaagactggg cctttcgttt tatctgttgt ttgtcggtga acgctctcta 1140
ctagagtcac actggctcac cttcgggtgg gcctttctgc gtttatata 1189
<210> 10
<211> 8735
<212> DNA
<213> Artificial Sequence
<220>
<223> Exemplary HPGC (hydrogen producing gene cluster) with HydA from
Chlamydomonas reinhardtii
<400> 10
ctagagggct ttacacttta tgcttccggc tcgtatgttg tgtggaaaga aggagatata 60
catatggcga tgcgttccac atttgctgcg cgtgtcggtg ccaaaccggc agtgcgtggg 120
gcgcgtcccg cgtcgcgtat gtcttgcatg gcctataagg ttacactgaa aacgccatca 180
ggcgataaaa caatcgaatg tccggcggac acctatatcc tggatgctgc ggaggaagcc 240
gggctggacc ttccctatag ttgccgtgcg ggcgcctgtt catcctgtgc tggcaaagtg 300
gcagctggaa cggtagatca atctgatcag tcctttctgg atgacgctca gatggggaac 360
ggattcgtcc tgacatgtgt cgcgtatcct acaagcgact gcactatcca aactcaccaa 420
gaggaggctt tatattaaaa gaaggagata tacatatgca aactgttcgc gctccagcag 480
cttcaggtgt tgccacacgt gtcgcaggtc gtcgtatgtg tcgtccggtt gcggcgacga 540
aggcttccac ggctgttacc acagacatgt cgaagcgcac tgttccaacc aagttagagg 600
aaggtgaaat gccgttgaac acgtacagta ataaagctcc gttcaaggca aaggttcgtt 660
ccgtggaaaa aatcacagga ccaaaagcca caggtgagac gtgccacatc attattgaaa 720
ccgaggggaa gatcccgttt tgggagggac aatcgtacgg tgtaattccg ccggggacca 780
agatcaactc taagggaaaa gaagtgcctc atggtactcg tctttattcg attgcttcta 840
gtcgttacgg agatgacttc gatggtcaaa cggcatcgct gtgtgttcgc cgcgcggtat 900
acgtcgatcc agagactgga aaggaggacc ccgcgaaaaa aggactgtgt agtaactttt 960
tgtgtgatgc cacaccaggc acggaaattt ccatgacagg gcccacagga aaagtattgc 1020
ttctgccagc agacgcgaac gcgccattaa tctgtgtcgc aacggggact ggaatcgcgc 1080
cttttcgctc attctggcgc cgttgcttca tcgagaatgt cccaagttat aagttcactg 1140
gccttttctg gttgtttatg ggtgtcgcta actctgatgc taaattgtac gatgaggaac 1200
tgcaagctat cgcaaaagcg tatccgggac aattccgcct ggactatgcc ttgtctcgtg 1260
aacaaaataa tcgcaagggc gggaaaatgt acatccaaga taaggttgaa gagtatgccg 1320
acgaaatttt cgatttattg gataatgggg cgcacatgta cttctgcggg ttaaagggga 1380
tgatgccagg catccaagat atgttagaac gcgttgcaaa agaaaagggg ctgaactacg 1440
aagagtgggt cgaggggtta aagcacaaga atcaatggca tgttgaagtc tactaaccag 1500
gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta tctgttgttt 1560
gtcggtgaac gctctctact agagtcacac tggctcacct tcgggtgggc ctttctgcgt 1620
ttatatacta gagggcttta cactttatgc ttccggctcg tatgttgtgt ggaaagaagg 1680
agatatacat atgtccgcat tagtacttaa gccctgtgcg gcagtatcca tccgtggctc 1740
ctcgtgtcgc gcacgccaag tagccccacg cgctccgctt gcagctagca cggttcgtgt 1800
cgctcttgca accctggagg caccagcgcg tcgtttagga aacgtcgcct gtgccgcagc 1860
ggcaccggcc gcagaggcac ccttgtctca cgtccagcaa gcactggccg aactggcaaa 1920
gcccaaagat gaccccacgc gtaagcacgt ttgcgttcaa gtcgctcccg cagtgcgtgt 1980
cgctattgct gaaaccttag ggcttgcgcc gggcgctacg acaccgaaac aattagcaga 2040
aggcctgcgt cgcttgggct ttgacgaggt tttcgatacg ctgttcgggg ccgacttgac 2100
gatcatggaa gagggctcag aacttttgca ccgtctgacg gagcacttgg aagcacaccc 2160
gcactctgat gagccgctgc ctatgtttac cagctgctgt cctggttgga tcgcgatgct 2220
ggagaaatca tacccagacc ttatccctta tgtaagttct tgcaaatccc ctcaaatgat 2280
gctggctgct atggtcaaat cgtatctggc ggaaaaaaag gggattgcac ctaaagatat 2340
ggttatggta agcattatgc catgcacacg caagcagagt gaggcggatc gtgattggtt 2400
ttgtgtcgac gcggacccaa cacttcgcca attggaccat gtgatcacga ccgtagagct 2460
ggggaatatt ttcaaagagc gtgggatcaa ccttgcggaa ttacccgagg gggagtggga 2520
caacccaatg ggggtaggct ccggtgctgg agtacttttt ggcaccactg gaggggtaat 2580
ggaggcggcg ctgcgtactg catacgaatt atttactgga acccccttac cccgcctttc 2640
gctttcggag gtgcgcggca tggatggcat taaagagact aacatcacga tggtaccggc 2700
ccctggcagc aagtttgaag aactgttaaa gcaccgcgcg gcagcgcgtg ccgaggctgc 2760
tgcacacgga acacctggtc ccttggcctg ggacggcggc gcagggttca cctcggagga 2820
cgggcgtggg ggtatcactc ttcgtgtggc ggtagctaat ggcttgggaa acgccaaaaa 2880
gttgatcaca aagatgcagg cgggagaggc gaagtatgac tttgtagaaa tcatggcgtg 2940
tccagcggga tgcgttgggg gcggcgggca gccacgttcc accgataaag caattaccca 3000
gaagcgccag gctgcacttt acaatctgga cgagaagtcg actctgcgcc gctcccatga 3060
aaacccgtct atccgtgagt tatacgacac ttatttgggt gagcccttag ggcacaaagc 3120
acacgaactt ttacatactc actatgtagc tggcggggtc gaggagaagg atgagaaaaa 3180
gtgaccaggc atcaaataaa acgaaaggct cagtcgaaag actgggcctt tcgttttatc 3240
tgttgtttgt cggtgaacgc tctctactag agtcacactg gctcaccttc gggtgggcct 3300
ttctgcgttt atatactaga gggctttaca ctttatgctt ccggctcgta tgttgtgtgg 3360
aaagaaggag atatacatat ggctcatagt ttaagcgcac attcccgtca ggccggagat 3420
cgcaaactgg gcgcaggtgc ggcatctagc cgcccatcat gtccttctcg ccgcattgtc 3480
cgcgtggcgg cccatgcttc tgcgtccaag gcgactcccg atgtacctgt tgacgatctt 3540
cctcctgcgc atgcccgtgc agcagtagcg gccgctaacc gtcgtgcgcg cgctatggca 3600
tcagcggagg ccgcggcaga gaccctgggc gatttcctgg gcttagggaa gggggggctt 3660
tcgccgggcg caaccgccaa ccttgatcgt gagcaagtat taggtgtgtt ggaggcggtc 3720
tggcgtcgtg gagaccttaa tctggagcgt gcgttgtaca gccatgccaa tgcggtgact 3780
aacaaatact gtggtggggg ggtctactat cgcggccttg tggagttcag taatatttgc 3840
caaaacgatt gctcatattg tgggattcgc aacaatcaaa aagaagtttg gcgctatact 3900
atgccggttg aagaggtggt cgaggtagct aagtgggcgc ttgaaaacgg cattcgcaac 3960
attatgttgc aagggggtga attaaagaca gagcaacgct tagcctactt ggaggcatgc 4020
gtccgtgcga ttcgcgagga gacaacgcag ttagaccttg aaatgcgcgc acgtgccgcg 4080
agtacgacaa cagcggaagc ggcagccagt gcacaggcag acgccgaagc taaacgcggc 4140
gagccagaat tgggtgtggt cgtatcctta agcgtcggag aacttcctat ggaacagtat 4200
gagcgtttgt tccgcgccgg cgcccgtcgc tatctgatcc gcattgaaac ctcgaatccc 4260
gacctgtacg cggcacttca cccggagccg atgtcctggc acgcgcgtgt agaatgcctg 4320
cgcaacctga agaaagctgg gtatatgttg ggcacaggag tgatggtcgg cttgccggga 4380
caaaccttac acgacctggc tggggatgtc atgttctttc gcgacattaa agcggacatg 4440
atcggtatgg gccccttcat tacgcagcct gggacgcctg caactgataa gtggaccgcg 4500
ctgtatccga acgccaataa gaacagccac atgaaatcta tgttcgatct gaccactgct 4560
atgaatgcac ttgtacgtat tacgatgggg aacgtaaata tcagtgctac gactgcatta 4620
caagcgatta tccccactgg acgtgaaatt gcgcttgagc gcggcgcaaa tgttgtcatg 4680
cctattttaa cgcctactca gtatcgcgag tcctatcagt tatatgaggg taagccctgc 4740
attacggata ctgctgttca gtgtcgtcgt tgcctggaca tgcgtttgca ctccgttggc 4800
aaaacgtctg cggccggagt ttggggcgat cctgcttcgt tcttgcatcc catcgttggc 4860
gtcccagtcc cgcacgactt gtcatcacct gctttggccg ctgctgcaag tgcggatttt 4920
cacgaggttg gcgcaggtcc ctggaacccc atccgactag agcgtctggt tgaagtgccg 4980
gaccgttacc ctgaccccga taaccacgga cgcaaaaagg caggagccgg gaaaggaggc 5040
aaggcgcatg actctcacga cgatggcgat cacgacgacc accaccacca ccacggagct 5100
gcccccgcgg gtgcagcggc tggaaagggt accggtgcag ctgcaattgg tggcggagcg 5160
ggggctagcc gtcaacgcgt agcaggggct gctgccgcct ctgctcgtct gtgtgcggga 5220
gctcgccgcg ctggccgtgt tgtcgcgtcg ccattgcgcc cagctgccgc ttgccgtggt 5280
gtggccgtca aggccgcagc tgctgctgcg ggtgaagacg ctggtgctgg tacgtctggc 5340
gtaggttcaa atattgttac gtctcccgga atcgctagca ctacggcaca tggtgttcct 5400
cgtatcaata ttggggtgtt cggcgtgatg aatgcaggaa agtctacact tgtgaatgct 5460
ctggcgcaac aggaagcatg cattgttgac tcaacccccg gcacgaccgc agatgtaaaa 5520
acagttttgc ttgagcttca tgcccttgga ccagccaagt tgctggacac agccggatta 5580
gacgaagtcg gtggacttgg ggataaaaag cgccgtaaag ccctgaatac gctgaaggag 5640
tgcgatgttg ctgtgctggt tgttgacact gatacggcag ccgccgcaat caaatcggga 5700
cgccttgctg aagccctgga atgggaatcg aaagtaatgg aacaggcaca caagtataat 5760
gtcagtcctg tactgcttct gaatgtaaaa tcacgcgggc tgcctgaagc gcaggcagct 5820
agcatgcttg aggcggtcgc tggtatgctt gacccatcca agcaaatccc tcgtatgtcg 5880
ctggatttag cgtccacccc cctgcacgag cgtagtacga ttacgtctgc attcgtcaag 5940
gaaggagcag tgcgcagttc acgctatggg gctcctctgc cggggtgttt gccccgttgg 6000
tctcttggac gcaacgcccg cttactgatg gtaatcccga tggatgccga aaccccaggt 6060
ggacgtcttc ttcgtcctca agcgcaagtt atggaggaag caatccgcca ttgggctacc 6120
gtgctttccg tacgcctgga tttagacgcc gcacgtggca aattggggcc cgaggcctgt 6180
gagatggagc gtcagcgttt cgacggggta attgctatga tggaacgtaa tgacggaccc 6240
accctggtgg tgacagattc tcaagcgatc gatgttgtac acccttggac cctggaccgc 6300
tcatcaggac gtccgttggt tccaattact acctttagca tcgctatggc gtaccaacaa 6360
aacggcggac gtttggaccc gtttgtggaa ggattggaag cattggagac gttacaagat 6420
ggggatcgcg ttcttatttc ggaagcgtgt aatcataacc gtatcacctc cgcttgcaac 6480
gacattggaa tggtgcagat ccctaacaag ctggaggcag cacttggcgg gaaaaagtta 6540
caaatcgaac atgcgtttgg tcgcgagttt cccgagcttg agagtggggg tatggatgga 6600
ttgaagttag cgatccattg tggagggtgt atgatcgacg ctcagaaaat gcagcagcgt 6660
atgaaagact tgcatgaggc tggggtgccg gtcactaatt atggggtgtt tttctcttgg 6720
gcagcttggc ccgacgccct tcgtcgcgca ttggaaccgt ggggagtgga gccaccggta 6780
ggtactcctg ctacccccgc agccgcgcct gctacggcag cgtccggggt ataatactac 6840
tagagggctt tacactttat gcttccggct cgtatgttgt gtggaaagaa ggagatatac 6900
atatgtcggt ccccctacag tgcaatgcag gccgtctttt ggcgggccag cgcccctgcg 6960
gcgtccgcgc gcgtctgaac cgccgtgtat gtgttccagt gaccgcacac ggcaaagcat 7020
ctgccacgcg cgaatacgct ggtgactttc ttccagggac cactattagt catgcgtggt 7080
ccgtggagcg tgaaactcat caccgttatc gtaatccggc cgagtggatt aacgaggctg 7140
ccatccacaa ggcgcttgaa acgtcaaagg ctgatgctca ggacgcagga cgcgtgcgtg 7200
agattttggc gaaggctaag gaaaaggctt ttgttactga acatgcgcct gtaaatgcgg 7260
aaagtaaatc cgaatttgta caagggctta ccttggagga gtgcgccacc ttaattaacg 7320
ttgattctaa taatgtcgag ttgatgaatg aaatcttcga cactgcgctt gctatcaaag 7380
aacgtatcta cgggaaccgc gtcgtgctgt tcgcgccctt gtacattgct aatcattgta 7440
tgaacacttg cacttattgt gcgtttcgct cagccaataa gggcatggaa cgctctattc 7500
tgacagacga tgacctgcgt gaagaagttg ccgccttgca acgtcaaggt catcgccgca 7560
ttttagccct tactggagaa catcctaaat acactttcga caatttcttg catgcagtca 7620
atgtaatcgc ttccgtgaag acagagcctg aagggtccat tcgccgtatc aatgtcgaaa 7680
tcccaccact tagtgtctca gacatgcgcc gccttaagaa tacagattca gttggcacgt 7740
tcgttctgtt tcaagagaca tatcaccgcg acacattcaa ggtaatgcat ccgtcaggtc 7800
caaagagcga ctttgatttt cgcgtcttga cccaggaccg cgccatgcgc gcaggcttgg 7860
acgatgttgg tattggtgct ttattcgggt tatatgatta ccgttatgaa gtttgcgcca 7920
tgttaatgca tagcgagcat ttggaacgtg agtacaacgc aggaccacat actatctctg 7980
ttccccgtat gcgccccgcg gacggaagcg agcttagtat cgcgcctcct tatcctgtta 8040
atgatgctga ttttatgaaa ttagttgcgg tccttcgtat tgctgtacca tacacaggta 8100
tgatccttag cactcgtgaa tcaccagaaa tgcgctcggc gcttctgaag tgtgggatga 8160
gtcaaatgag tgccggctcg cgcactgatg taggagccta tcacaaagat cacacgttaa 8220
gtacagaggc gaatttgagt aagttagctg ggcagtttac cttgcaggat gaacgtccaa 8280
ctaatgagat tgttaagtgg ctgatggagg agggctatgt cccgtcttgg tgcacagctt 8340
gttaccgtca aggtcgtacg ggcgaagact tcatgaacat ctgtaaggct ggtgacattc 8400
acgatttctg tcatcccaat agtctgctta cgcttcaaga gtaccttatg gattatgcag 8460
atccagacct tcgtaagaaa ggcgagcaag taattgcccg tgagatggga ccggacgcct 8520
ctgagccgtt atcggcgcaa agccgtaagc gccttgaacg caagatgaaa caagtattgg 8580
agggggagca cgatgtatat ctttaaccag gcatcaaata aaacgaaagg ctcagtcgaa 8640
agactgggcc tttcgtttta tctgttgttt gtcggtgaac gctctctact agagtcacac 8700
tggctcacct tcgggtgggc ctttctgcgt ttata 8735
<210> 11
<211> 2070
<212> DNA
<213> Artificial Sequence
<220>
<223> pSB1C3 plasmid
<400> 11
tactagtagc ggccgctgca gtccggcaaa aaagggcaag gtgtcaccac cctgcccttt 60
ttctttaaaa ccgaaaagat tacttcgcgt tatgcaggct tcctcgctca ctgactcgct 120
gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt 180
atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc 240
caggaaccgt aaaaaggccg cgttgctggc gtttttccac aggctccgcc cccctgacga 300
gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata 360
ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac 420
cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg 480
taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc 540
cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag 600
acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt 660
aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta gaagaacagt 720
atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg 780
atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac 840
gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca 900
gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac 960
ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac 1020
ttggtctgac agctcgaggc ttggattctc accaataaaa aacgcccggc ggcaaccgag 1080
cgttctgaac aaatccagat ggagttctga ggtcattact ggatctatca acaggagtcc 1140
aagcgagctc gatatcaaat tacgccccgc cctgccactc atcgcagtac tgttgtaatt 1200
cattaagcat tctgccgaca tggaagccat cacaaacggc atgatgaacc tgaatcgcca 1260
gcggcatcag caccttgtcg ccttgcgtat aatatttgcc catggtgaaa acgggggcga 1320
agaagttgtc catattggcc acgtttaaat caaaactggt gaaactcacc cagggattgg 1380
ctgagacgaa aaacatattc tcaataaacc ctttagggaa ataggccagg ttttcaccgt 1440
aacacgccac atcttgcgaa tatatgtgta gaaactgccg gaaatcgtcg tggtattcac 1500
tccagagcga tgaaaacgtt tcagtttgct catggaaaac ggtgtaacaa gggtgaacac 1560
tatcccatat caccagctca ccgtctttca ttgccatacg aaattccgga tgagcattca 1620
tcaggcgggc aagaatgtga ataaaggccg gataaaactt gtgcttattt ttctttacgg 1680
tctttaaaaa ggccgtaata tccagctgaa cggtctggtt ataggtacat tgagcaactg 1740
actgaaatgc ctcaaaatgt tctttacgat gccattggga tatatcaacg gtggtatatc 1800
cagtgatttt tttctccatt ttagcttcct tagctcctga aaatctcgat aactcaaaaa 1860
atacgcccgg tagtgatctt atttcattat ggtgaaagtt ggaacctctt acgtgcccga 1920
tcaactcgag tgccacctga cgtctaagaa accattatta tcatgacatt aacctataaa 1980
aataggcgta tcacgaggca gaatttcaga taaaaaaaat ccttagcttt cgctaaggat 2040
gatttctgga attcgcggcc gcttctagag 2070
<210> 12
<211> 87
<212> DNA
<213> E. coli
<400> 12
ttgttaaata tagatcacaa ttttgaaacc gctcgggata tcagcgaaaa cataagcaaa 60
agtgaatgtt ttaagaacat tccgtaa 87
<210> 13
<211> 215
<212> DNA
<213> E. coli
<400> 13
atattccacc agctatttgt tagtgaataa aaggttgcct gtaaaattac aaaaacctta 60
cgcagcgtca agcggaatcg tgtcaatcat tgcgacaaat caatcctgtg cctaagcatt 120
acgcgactga ctcgcctcac tcttcctttg ggcttgagac cacatggggt cggcgccccg 180
aattttaaag ggcaattacg ataaaaatgt gattt 215
<210> 14
<211> 1452
<212> DNA
<213> Corynebacterium glutamicum
<400> 14
agcctctacc tcgctgcggt cgccagacca ctctgtatgg aacgaaccgt ctttgtcgat 60
gcgtttgtat gtgtgggcac caaaaaaatc gcgctgccct tggattaacg ctgctggaag 120
gcgctcggcg cgtaatgagt cgtaataact aagactacta gcaaagacgg gaatcggcaa 180
ccccagttgg gtggcggtca caatgacgcg gcgccagcta tcgattaagt ccccaagctc 240
ggatttaaag taaggatcta acagcaacga ctctaactct gcgttcgcgt catacgcttc 300
aacgatgcga tttaaaaatt tagcgcggat gatacaaccg ccgcgccaaa tagtcgctaa 360
atcacggggg tctacatccc agttgttctc atcagaaccg gctttaattt cgtcgaaacc 420
ttgtgcgtag gctaccaact tagatgcgta aagcgcacga cggacatcct cgacaaattg 480
agccttatct acgccaagcg cttcaaggtc tgtcagtacc ccagcgggaa gattgccctg 540
ggcggcagca cgttgtgaag ttgcaccgga cagggcacgg gcaaatacgg cctcgccaat 600
tccggtggtt gcaattccca aatccagagc cgcttttact gtccagcgtc ctgtaccttt 660
ttgccccgcc gcatccacga taacatcaat caacggcttg cctgtctctg cgtcgacctg 720
agataaaacc tcagccgtaa tttcgatcaa gtaggagtca agatcaccag cattccactc 780
cttaaatacc tcggcaattt cggccggctg cattccagcc gcatagcgca gcaggtgata 840
cgcttcccca attacttgca tatcggcgta ctcaatgccg ttatgtacca tcttgacgaa 900
gtgtcctgct ccgtctggcc cgatatgcgt aacacaaggg gtaccatcca cgttggcagc 960
aattgactca agcaaagggc ccaagctttc ataactcttc gcaggacctc ccggcataat 1020
agaaggtccg ttcaaggccc cttcttctcc gccggaaatg cccgcaccca caaagtgcag 1080
tccacgggca ctgatctctt tttcgcggcg gatggtatcc gtatacagag cgttgccacc 1140
atcgataatg atgtcgcctt cgtccattgc gtctgctaat tgattgatga cggcatctgt 1200
agcgttgccg gcctggacca tgatgatggc gcgacggggc ttctctaaac tcgctacaaa 1260
ctcctcgacc gttgcggagg gaataaaatt tccctcgctg ccatgatccg cgatcaactt 1320
atccgttttg tcggtactgc ggttatagac tgcaacggtg ttgccgttac gggcaaaatt 1380
gcgggcaagg tttgagccca taaccgcaag cccaacaacg ccaatttgag ccagattatc 1440
accgtttgtc at 1452
<210> 15
<211> 1005
<212> DNA
<213> Clostridium acetobutylicum
<400> 15
atggcgaaga ttgcaatcaa tggctttggg cgtattggcc gccttgcgct tcgtcgcatt 60
ctggaagtac cgggtctgga agttgtggcg attaatgatc tgaccgatgc aaagatgctg 120
gcacatttgt ttaaatacga ttcttcgcaa ggacgcttca acggggagat tgaggtgaaa 180
gaaggcgcgt ttgtcgtcaa cggcaaagaa gtcaaggtat tcgccgaggc cgatccagaa 240
aagttgccgt ggggagacct gggcattgat gtggtccttg agtgtacggg ctttttcact 300
aagaaagaga aggccgaggc acacgtccgt gcaggggcga agaaggtcgt gatctctgct 360
ccagctggga atgatcttaa aaccattgta ttcaacgtca acaatgaaga tctggacggg 420
acggaaacgg tcatctcggg tgccagctgc acgacgaatt gtctggctcc aatggcaaaa 480
gtcttaaatg acaagtttgg cattgagaaa ggattcatga caactattca tgcgtttacc 540
aacgaccaga atacgttaga tgggccgcac cgtaaaggag acctgcgtcg tgcacgtgcc 600
gcggccgttt ccatcatccc aaattcaaca ggtgccgcaa aagctatctc gcaagttatc 660
ccggatctgg ctggtaaatt agatggaaat gcacaacgtg taccggtgcc taccggttcc 720
atcactgagc tggtctcagt cctgaagaaa aaggtaacgg tagaagagat taatgcagcg 780
atgaaagaag cagccgatga gtcttttggg tacaccgaag atcccattgt atccgcggac 840
gtcgtgggaa ttaactacgg ttctttgttt gacgcaactc tgactaaaat tgtagacgtg 900
aatgggtctc aattggttaa gaccgctgca tggtatgata atgagatgag ttacacttct 960
cagctggtac gcacacttgc atatttcgcc aagattgcta aatag 1005
<210> 16
<211> 1455
<212> DNA
<213> Zymomonas mobilis
<400> 16
gtcataccag gtcactccgt cacgttctgc caatgcgata gcggtagacg gtccccaggt 60
tcccgatacg taagtcttag gtttcataga gttagctttc cacccctcac gaattccgtc 120
aatccagacc cactgggcct caacttcgtc acggcgtaca aacagagtgg cgtctccctc 180
aatcaggtca agcatcagac gctcataggc gatacggcgt ttgcggtcct taaaaacatc 240
agtcaacgac aagtccagcc acacctcgcg catgtgggct ccgttacggt ccaatccggg 300
ctctttcacc atcatcgaga tttgaatagt ctcgtccggt tgtaagacga tgcgtaactt 360
attaggttgc aagatgccgc cactcgaact gaagatagag tgcggtacag gtttgaactg 420
taccacgatt tcggagcgac gggccggcaa gcgtttaccc gtacggatgt aaaatggaac 480
accctgccaa cgccaattgt ccacatgggc tttaattgct acgaaagttt cagtatcact 540
tggttgccct aactcgtcga tgtatcctgc aacttccttt ccgccagaga cccccgcccc 600
gtactgcccg gttacggtgt gggtaaacac cgtatcattg ttgatagggc gcaaagcgcg 660
gaatacttta accttctcat cacgcacagc attggcctcc atgtgtgcgg ggggctccat 720
tgcgaccaac gctacaagct gaagaatatg actctgaacc atgtcacgca gggagccact 780
accgtcgaag taaccaatgc gcccttcaag tccgactgtt tccgcgaccg aaatctgtac 840
gtggtcaatc cccttgctat tccaaagggg ctcgaacaat gcgttcccaa aacgcaaggt 900
caaaagattc tgcaccgttt ctttgcccaa atagtggtcg atgcggtaaa cttgcttctc 960
tgagaatacc ttcagtacag catcgttaat atggtcgctg gaggcaaggt cttgtcccag 1020
gggtttttcc aatgccaaac gtgaggttgg ccccgctaat cccgcctgct ttaatccagc 1080
aatggcgcct tcaaaaagtg aaggcgccgt acttaagtaa attgcgatgc ctttttctac 1140
gggaccacac agatccgcta atttgccgaa ctgggtgggg tcggtgatgt ccacggtagc 1200
gtaaaaaagc ttatttaaaa acttcgcttt agcatcgtca ttcaaacggt cagaggccac 1260
gaaacggtcc agcgctttct ccgcaaagtc acggaatccg tcagtatcat actcggaacg 1320
cgaggtgcat acgatacgca agtcgtccgc cagtaagccg tctgcatcaa gcccataaag 1380
gctaggcagc aacatgcgtt ggcttaaatc cccggtgcta ccgaacagaa tcattgttga 1440
cacagtattg gtcat 1455
<210> 17
<211> 1506
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised nucleic acid sequence encoding HydA from
Chlamydomonas reinhardtii, 5' - 3'
<400> 17
cccgggatgt ccgcattagt tctgaagcca tgtgcggcgg tcagtatccg cggaagcagc 60
tgccgcgccc gtcaagtcgc gccgcgcgcg ccgttagcag cgtctacagt tcgtgttgca 120
ttagcaacac ttgaagctcc tgcgcgtcgc ctgggcaacg tcgcttgtgc agcagcggct 180
ccggcggcgg aggccccttt gagccacgtc caacaagcct tagctgaatt ggccaaaccg 240
aaagatgacc ccacacgcaa gcatgtttgt gtgcaagtcg ccccagcggt ccgcgtcgct 300
attgccgaaa cacttggact tgctcccggt gccacgaccc cgaagcaatt ggcggagggc 360
ttacgccgtc tgggtttcga cgaagtattc gacacgcttt tcggggcaga tttgacaatt 420
atggaagaag ggtcagagtt gttgcatcgt ttaacggaac atttggaggc tcaccctcac 480
tctgacgaac cgttgcccat gtttacctcg tgttgtccgg gttggattgc gatgcttgag 540
aaatcgtacc cggatttaat tccttatgtg tcctcgtgca aatctcctca aatgatgtta 600
gccgcgatgg tgaagtcata tcttgccgaa aagaagggca tcgcacctaa agacatggtg 660
atggtgtcaa tcatgccttg cacccgtaag cagtccgagg ccgatcgcga ctggttttgt 720
gtggatgctg accctacatt acgccagtta gatcatgtta ttacaaccgt agagttgggt 780
aacatcttta aggagcgtgg tatcaatttg gctgagttac cggaaggtga atgggacaac 840
ccgatggggg tgggttcggg agccggagta ttatttggga ccactggcgg cgtaatggag 900
gcagcattac gtacggccta cgaactgttc acaggtaccc cgctgcctcg cctgagtttg 960
agcgaggtgc gtggtatgga cggtattaag gaaacgaaca tcacaatggt tcctgctccc 1020
ggttcaaaat tcgaggaact gttgaagcat cgcgctgccg cacgtgcaga agcagccgca 1080
cacggtactc ctggtccact tgcctgggac ggcggggccg gatttacttc agaagacggt 1140
cgtggtggaa ttactttacg tgtcgctgtt gcgaatgggc tgggtaacgc taaaaagtta 1200
attacaaaaa tgcaggccgg agaggcaaaa tatgatttcg tagagattat ggcctgtccc 1260
gctggttgcg taggaggtgg gggccagccc cgttcaactg acaaagctat cacgcagaaa 1320
cgtcaagcgg cattatacaa tctggatgaa aaatcaacgc ttcgccgttc acatgagaat 1380
ccatcaatcc gtgaattgta cgatacttat ttaggtgagc ctctggggca taaggcacac 1440
gaacttctgc atactcatta cgtcgcgggt ggagttgagg agaaggatga aaagaagtag 1500
ggatcc 1506
<210> 18
<211> 1266
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised nucleic acid sequence encoding HydA (Hyd1) from
Volvox carteri, 5' - 3'
<400> 18
cccgggatgt acgtttgcgt cgcacaagtt acgttacatg attgcttagc atgctcaggg 60
tgcatcacat ctgcggaaac ggttttgctt cagcaacagt ccggggatga gttcttatcc 120
cgcttggcag acccgcacac tactgtcgta gttaccgtct cgccccaatc gcgcacagct 180
ttggcggctt actatggatt atgcccgtct caggctcttg cccgccttgt gggctggttg 240
aagtggcttg gggttcgcgc cgtatgggat ctgacaacag cccgcgatct tgtattgttg 300
gaagaggcag ctgagttcat gaaccgttgg gtctgcatgt atgttagcgc cgggcctctt 360
ccggtcatgg gcagttcatg tcctggcaca ggctgggttt gttatgctga aaagacgcac 420
gggacgcgtg tattacccta tttgagcacc acccgttcac cccaaggagc aatgggtggc 480
ttggtaaagt ccctggtggc agcagcttgg ggcgttactc cagggtcttt gtaccacgtc 540
acaattatgc cgtgttatga caagaaattg gaagcatctc gcgatgaatt aaccacaacg 600
gcgacaacta ctaccgctgc ggggacagac gcggctggag caggtgccgc cgtaggcggg 660
cctctgcctg aagtgatggt ccgtcatgca accgcagcgc ctgatccgtt gcttccgggc 720
gtggtaccag ccgacgacca gctgtactcc cttccacatg gctccagctc gggtggatac 780
gcggacttcg ttttccgcac tgccgcgcgc gagttgtggg gggtagaagt tccgccagga 840
cctttaccat ggcgtactcg tcgtaacgcc gacttacagc ctcgtgttgg tgccccaggc 900
caatctctgg tcgttgcgcg tgtgtatgga ttccgcaata ttcagacact tttacagcag 960
cttaagcgtg gacgctgccc ttatcattat gtggaagtca tggcttgtcc tagcgggtgt 1020
ttgaacggag gaggacaaat caaaccgggg ccaggggtaa cgccgcaaca attaattgaa 1080
caattggagc ttttgtatga cgttgcggca cgttctccag cagacaaccc ggcggtagca 1140
gctttatatg gctcttggtt aggcggtcgt ccaggggcac cccccgctcg tcaactgtta 1200
catacgacat ttcgcgagcg cgaaaagact gtaactgccg caaccgtcac gaattggtag 1260
ggatcc 1266
<210> 19
<211> 1437
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised nucleic acid sequence encoding HydA (Hyd1) from
Giardia lamblia 5' - 3'
<400> 19
cccgggatgc ctccaaaacc ccaacacgat gtaacaggcg tggactccaa taacgcgatc 60
atgattgatt acgcaaagtg cattggctgc aacatgtgca tcaaagcatg cgacgtgcaa 120
ggtattggtg tttacaagca gaacgaaaaa ccgaagtacc cgcctatcgt gaagctgagc 180
accctgttta atagcgattg tatcggctgc ggtcaatgtg caacgatttg tccggtggac 240
gcgattgctc caaagaacaa tctggaaatt tacaaaggcg aatctgcttc caaaaaagtt 300
cgtgtggcgt tgatcgcgcc aagcactcgc gtggcgtttg gagatgtctt cgggctgccg 360
atcggtacaa ataccattta ctccctgatt cgcatgctga agcaatatct gggtttcgat 420
tatgtgttcg acgtgaattt cggcgcagat gaaaccaccg tcatcgacac ccaagagctg 480
ttgcacttca aacacgaggg ccgtggtccg gtgttcacca gctgctgccc ggcgtgggtt 540
aacctctgtg aaatgaagta cccggagctg ctgccccagg ttagcaccgc taaatcttgt 600
gttgcaatgg tagcgaccct tgtaaaaaga cgttgggttc aagaacattt aatcccgaag 660
ggtattgtag acagcgttga cgatgtctac gtggctgata ttatgccgtg taccgcgaaa 720
aaggatgaaa gcatgcgtcc acaactgaac cgcgatgtgg acatctgcct gacggtgcgt 780
gaagttgcgg agcacctgta ttttctgcac ggcgcgcgct tgacgctgga ggaagtcgag 840
gcggatgcgt tggttttgcg tccgggccgt agcacgcaga aaaagtggga ctttgacgct 900
ccgtttaaca ccgtgtctgg tggctcccat atctttggta agaccggtgg cgttgccgag 960
acgtgtctcc gtttcatcag ctatatgaaa aagtcgccga tagaaaacgt taaggaggaa 1020
ttgctgaaag agttcaagac gccgggtcag ctggtgcaaa ccgttaagct ggtcagctgc 1080
gagatcgccg gtgagactta tcgtgccctg attgcgcatg gcggttcagc aatcaatgcc 1140
gccgcgcgta tggtgctcaa taaagaggtg gagtgcgacg ttgttgagca gatggcctgt 1200
ccgggtggct gccagaacgg tggaggcatg ccgaagatca agggtaaaaa agaggcagtt 1260
ttgacgcgtg cgtctacctt ggacatcctg gacggtaaag agcgctttgc gagcgcgggc 1320
gagaacaaaa ctctgtgggg tttcaacggc tgcttaaccg aacacgaagc gcacgagttg 1380
cttcacaccc attatcagca tcgcccggtg gaatcgctgc tgccgcagta gggatcc 1437
<210> 20
<211> 1419
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised nucleic acid sequence encoding HydA (Hyd1) from
Entamoeba nuttalli, 5' - 3'
<400> 20
cccgggatgc ctccaaaacc ctcacacact gtaacaggcc acgaccacaa ccacagcatc 60
cagtttgact ggagcaagtg tatgggctgc ggtatgtgtg caaccaaatg caccttcggc 120
gtattggtta agcagccgcc gaagatcccg ccatttgtcc agccgaaccg tgaaaaactg 180
agccaagaga acaccgataa aacgcgtgtc ctgatcgatg aaagcgagtg caccggctgc 240
ggtcaatgct ctctggtgtg caactttgga tctatcaccc cgatcgacca cctcgttgac 300
accttcaaag caaaggaggc gggcaaaaaa ctcgtggcca tgattgcccc gagcactcgc 360
cttggtgtcg ctgaggctat gggtatgccg attggctcca ccgctatggc gcagctggtg 420
cattgtctgc gtctgattgg ttttgactac gtttttgacg tggacgcggg tgcggataag 480
acgaccatgg acgattacgc ggaagttatc gaaatgaaaa aggagggtaa gggtccggcg 540
atcaccagct gctgcccggc gtggattgag ctggtggaga aagaatatcc ggatttgatc 600
ccgaacgtgt ccactgcgcg tagcccgatc ggctgcttgg ccggttgcat caaacgtggt 660
tgggcaaaag atgttggcat cgcggtagag gatttgtaca ccgtgggtat catgccttgt 720
attgcgaaga agacggaatc ccaacgtcag caaattcatc aagattacga cgcaagctgt 780
acgtctaacg agattgcggc gtacttcaag aagcacctgc caccggaaga gtgcaaattc 840
acccaggagc gcgaggaagc tctggcaaag actgaggacg gccaatgtga tctgccgttc 900
cgtcgcatta gcggtggctc caacattttt ggtaagaccg gcggggtgtg tgaaaccgtg 960
ttgcgggtga ttgcgcgtaa tgcgggtgtt gactggaata cgtgcaccgt taacaaagag 1020
gaaacattca aacacgccgc tagcggttcg accatgacca atctgagtgt tgacatcggc 1080
ggaactataa tcaccggggc agtttgccat ggtggttatg caatccgtca tgcctgcgaa 1140
ctgattcgca aaggtgaact gaaagtcgac gttgttgaga tgatggcctg tgttggcggc 1200
tgcctgggcg gtgctggcca gcctaagatc ccgccggcga agaagctgga aatggataag 1260
cgcagagtga tgttagatat tctggaccag caaacggaca ttcgtgcagc gaatgaaaac 1320
accgacgtgc taggctggat tgataaacac ttcgaccacc agggtgcgca tcaacatctg 1380
cacacctatt tcaccccgcg ttatcagaat tagggatcc 1419
<210> 21
<211> 1413
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised nucleic acid sequence encoding HydA (Hyd1) from
Ilyobacter,polytrophus 5' - 3'
<400> 21
cccgggatga agaacaaaac agtatcaaat gataaaatag acaataaact gaactgctcc 60
gaaaacctgg aaaaccgtac catcgacaaa agcttctaca ccttttcacg tgataccagc 120
aagtgcatta agtgctacaa gtgcgtgaaa gtttgcaagg acactcaggg catttccgtt 180
tttcaggttg aggaggacgg cacggtgggc atcaaagagg agaatatggc ggccaccttg 240
tgtatcagct gtggtcaatg tattaaagtg tgcaccgcag gtgcgctgaa ggagaaatcc 300
aacatctctc tgttgaagga gcagttaaat aacccgaata agcacgttgt cgcgcagctg 360
tctccaagct tcaaacacac cattggtgat ggcttcggca tcagctcggg taccgatact 420
tccccgaaaa tcatcagcgc tctgaaagaa attggtttct ctaaggtttt cagtaccggt 480
ttcgccagcg acgtgaatat cgttgagacc agcgcggatc tgaaaaaacg cctagatgaa 540
aacggtccgt tcccggtgtt cacctccacg tgcacgggtt ggattaacta tgcggaaaag 600
ttttgtccgg agttcctggg gctgctctct ccgtgcaaaa gcccgcaaca gatcctgggt 660
agcctgagca agtcctacta cgaagagagc attgacatca gcagagaaaa tatctttagc 720
gtggcgctga tgccttgcat cgccaaaaag gatgaagcta atcgttttga catgaaggac 780
gaatatggta acaaagatgt ggacctggtc ctgaccgtga atgaagttgc tagccttttg 840
aacaaaaagg gcattgattt aaacaattac tctaagttcg gtacttttga taagccgatg 900
aaatccgaca ctggttcttc gcgtattaag gcggttacgg gtggcctggc agaggctatc 960
ctgcgcaaca ccgcacacat gatcggtgaa gatccgtttt ctgtagacct gaagaagctg 1020
cgtggtatgg atggtattaa gctcacgagc gtggttctgg gcgggaaaaa attaaacatt 1080
gcggtcgtga acggcatcaa gaacgtgccg gttattctgg acatgattaa agatggcatt 1140
accgagttcc acttggtcga ggttatggcc tgtccgggtg gctgcgtcgg cggcggtggt 1200
atcccgttgt cagaagaccc ggacattatc caaaaacgcg cagagaaaat ctactcgtac 1260
gacgcgagca gcgaaattcg ttgtagctgg gaaaacccag atgttaaaac cctgtatagc 1320
gagtacctga aggagccgct gggagaggag tctcaacgtt tgtttcattt tcattataaa 1380
aaccgccgta ccaaacgtat cttctaggga tcc 1413
<210> 22
<211> 1506
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised nucleic acid sequence encoding HydA (Hyd1) from
Volvox carteri, 5' - 3'
<400> 22
cccgggatga gtgctatgct atcttcatta acaaattctc gcttgggcgc ttacgtgccg 60
caagtggcgg taagccgtta tggttccaag ccggtctacg tcccgtgcgt gccgtttcgt 120
aagtgcacct cggcggtgcc agtgccggtt aagacggtgc aagaaggtaa ttcggtcaga 180
cttatgccag cggcggcggc tccggcgggt gcggcagcgg acccacattg gaaacaagca 240
tttgcagagc ttgataaacc gaaagccgaa cgtaaagtta tgatcgcaca ggttgctccg 300
gcggtgcgcg ttgccatctc cgagagcttt ggtctggcac cgggggctac cactccgggt 360
cagctggccg agtccctgcg ttgtctgggt tttgatatgg tgttcgacac cttgtacggc 420
gcggacctga ccattatgga agagggcact gagttgctgt cccgtctgca agcgcaattg 480
gaagcccacc cgcatagcga agaaccgctg ccgatgttta ccagctgctg tccgggctgg 540
atcgccctgt tggagaagag ctatccggaa ttaattccgt atgtgtctag ctgcaagtct 600
ccgcagatga tgttaggcgc tatggtgaag acctatctgg cagagaagaa aggcatctct 660
ccgagcgaca tctccatggt ttcgattatg ccgtgtgtga ggaagcaagg tgaagcggac 720
cgtgattggt tttgcagcgg cggcgccggc gttcgtgatg tggaccacgt tattaccacg 780
gcggagctag gcaacatcct gaaagaacgt aatatcaacc tccccgaact gccggaaggc 840
ggttgggatg agccgctggg ttcgggtagc ggtgcgggcg tcgttttcgg tacaaccggt 900
ggtgttatgg aagcggcgct gcgcaccgcg tacgagttgg ttacccagca accgctgcct 960
cgtttgaatc tgagtgaggt tcgcggtatg gacggcatta aagaaaccga aatcaagatg 1020
gttccgcctc cgggtagcaa attcgccgag cttgttgccg cacgtgcagc ggcgaaggct 1080
atggatgaag cggccgcgag cgcaggcgcg attaagtggg atggtggcag caacttcacc 1140
gcggacgacg gtgctaaggg catcaccctg cgcgtggccg tggctaatgg tctgggaaac 1200
gcgaaaaagc tgctgacgaa aatgcagacc ggtgagtgca aatacgactt cgtggaaatt 1260
atggcatgtc cgtctgggtg cgttggtggt ggtggtcagc cgcgcagcac cgataaacag 1320
gtggcggtca aacgtcagca ggcactgtac gaccttgacg agcgcgcaac gatccgtcgt 1380
agccacgaga acccggctgt ccaaaaagcg tacgaagatt tcctgggcga gccgaacagc 1440
cacaaagcgc acgatctgtt gcacacccat tatgttccgg gtggcgttga cacggagtag 1500
ggatcc 1506
<210> 23
<211> 1419
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised nucleic acid sequence encoding HydA (Hyd1) from
Trichomonas vaginalis, 5' - 3'
<400> 23
cccgggatgc tagcgtcaag tgcaacagct atgaaaggct tcgccaatag cctccgtatg 60
aaagattaca gcagcaccgg tattaacttc gacatgacta agtgcattaa ctgccaaagc 120
tgcgttcgcg cctgcacgaa catcgctggc caaaacgtct tgaagagctt gacggtgaac 180
ggcaagtccg ttgtgcagac cgttaccggt aaaccgctgg cggagaccaa ctgcatcagc 240
tgcggtcaat gtacccttgg ctgcccgaag ttcaccatct tcgaggcgga cgccatcaat 300
ccagttaaag aggtcttgac caagaaaaac ggtcgtattg ccgtgtgtca gattgctccg 360
gcgattcgta tcaacatggc tgaagctctg ggcgttccgg ctggtacgat ctccttgggt 420
aaggtggtga ccgcgctgaa acgtctgggt tttgactacg ttttcgatac caatttcgct 480
gccgatatga ccatcgtgga ggaagcgacc gaactggttc aacgtttgtc tgacaaaaac 540
gcagtgctgc ctatgtttac ttcatgctgt ccagcgtggg ttaattacgt agagaaatcc 600
gatccgagct tgatcccgca tctgagctct tgtcgtagcc cgatgagcat gctgagcagc 660
gttatcaaga acgtctttcc gaaaaagatt ggtacgaccg cagacaaaat ctacaatgtg 720
gcgatcatgc cgtgcaccgc gaagaaggac gaaattcagc gcagccaatt taccatgaag 780
gatggtaaac aagagacagg tgcggtgctg acttctcgtg aactcgcgaa aatgattaag 840
gaggcgaaga tcaacttcaa agagctgccg gatacgccgt gtgataactt ttattctgaa 900
gcatcgggcg gcggtgcgat cttttgtgca accggcggcg tgatggaagc cgcggtgcgc 960
agcgcgtata agttcctgac gaagaaagag ctggcaccga ttgacctgca agacgttcgc 1020
ggtgttgcga gcggcgttaa actggcggag gtggatattg ctggtaccaa agtaaaagtg 1080
gcggttgcgc acggcattaa gaacgccatg accctgatta agaagatcaa atcgggtgaa 1140
gagcagttta aagacgttaa gttcgtggaa gtgatggcat gtccgggtgg ctgcgtggtt 1200
ggtggtggca gcccgaaggc taagaccaag aaagctgtcc aggcacgatt gaatgcaacg 1260
tactccattg acaaaagctc caaacacaga acttctcagg acaacccgca gttgttacag 1320
ctgtataaag aatcgtttga aggtaaattc ggtggtcatg tcgcgcacca cctgctgcac 1380
acccattata agaatcgtaa agtaaatccg tagggatcc 1419
<210> 24
<211> 1470
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised nucleic acid sequence encoding HydA (Hyd1) from
Megasphaera micronuciformis, 5' - 3'
<400> 24
cccgggatga aggctgtaga gggatttgaa tcaaaatata aattttacga caagcgcgtg 60
ccgattgcgg acgacaaccc agctgtgcac tttgacgaaa cgaaatgcaa aaattgtacc 120
ctttgccgtc gtgcgtgtga aactacgcaa accgtgctgg actattacag cctggaacgc 180
accggcgatg ttccggtttg tgttcactgc ggtcaatgtg caaatgcctg cccgtttggt 240
gccatgatgg aagttgatga tacgaactta gtcaaagctg cgatcgcgga cccggataag 300
gtggtggttt tccaaacggc accggcggta cgtgtggcca ttgcggaaga gttcggtgcg 360
gaggcgggta cattcgcaca gggtaaaatg atttcagcgt tgagagccct gggtggcgac 420
tacgtgttcg acaccaactt tggcgctgac atgaccatca tggaagaaac ttccgagctg 480
gtgcgtcgta ttaccactgg taacttcgca atgccgcagt ttaccagctg ctgcccggcg 540
tgggttgagt ttgctgagac cttctacgca gaatacatcc cgcatctgtc cagcgcgaag 600
agcccgattc tgatgcaaaa caccacggaa aaaatctggt ttgccgagaa ggcgggcatc 660
gatccgaaga agatggtgac ggtttgcgtt accccgtgta ccgctaaaaa agccgagatc 720
aagcgcaaag aattgaatgc tgcggctgag tactggcata ttgatggctt aaaggactcc 780
gacatttgca tcacgacccg tgaactggca cgttggctga aagcggagaa cattgacttc 840
aataccctgg atgatggtat ttttgatagc cacctgggcg aggcgagcgg tggtggcatc 900
atcttcggca gcaccggtgg tgtcatggag tccgcactgc gcagcgcgta ttacttctat 960
accggtaaac cgatgccagc ggagtatata ccgtatgaac cggtgcgtgg cttggacggc 1020
gttaaagagg cgaccatcga cttcagcggt atctctctgc atgtcgcagt cgtgagcggt 1080
ctcggcaatg cgcgtcgttt tctggataaa attatggcgg acggcacctt caaagattac 1140
acctttatcg agttcatggc gtgccagggt ggctgcatca acggtggtgg ccaaccgaag 1200
gttaagatgc ctctggttca gaaaaccaac caggctcgca tgaatagctt gtacaaacgt 1260
gattcggagg tttcgattaa ggccgcctgg gaaaaccccg aaatccagga actctacagc 1320
gacttctacg gccagccgct gtctgagcgc tctgagaagt atattcacac cttctttgag 1380
gataagtccg gcaacctggg tgaaggtggt gctgtgaccc cgcaaacgaa cccattgtct 1440
ccgaagtata agccgattga atagggatcc 1470
<210> 25
<211> 1482
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised nucleic acid sequence encoding HydA (Hyd1) from
Veillonella parvula, 5' - 3'
<400> 25
cccgggatgt caaaatatca atttttagat agaagggtcc cgattgagga cggtaacatc 60
gctctggttc aggatttgac taagtgcaaa aattgtagcc tgtgtcgtaa agcttgcgcg 120
gtcgatatgg gcgtctttga ctactatgat ctgaccacga atggtgacca cccgatttgc 180
atccactgcg gtcaatgtgc gtccatctgc ccattcgatt ctattaatga acgcagcgag 240
atcgatgaag ttaaggcggc gattgcggac ccgaacaaaa tcgtcatctt ccagaccgca 300
ccggctgtgc gtgtgggtct tggcgaggag ttcggcttgg aggcgggtac ctttgtggaa 360
ggcaagatgg ttgcagccct gagaaagctg ggcggtgact acattctgga caccaacttt 420
ggtgcggaca tgaccatcat ggaagaggcg tccgagttgc tggaacgtgt tatcaactcg 480
gatgctgttc tgccgcaatt taccagctgt tgtccggcgt gggttaagtt cgcggagaca 540
ttctacccgg agttcctgcc taacctgagc accgcgaagt ccccgattgc catgcaggca 600
ccgacccaga aaacctattt cgccgaaaaa atgggtctgg acgcgaagca gattgtggcg 660
gtggccgtaa ctccgtgtac tgccaagaaa tttgagattc gccgtgacga aatgaacagc 720
agcgcagagt attggaatac cccagaaatg cgtgataccg attactgcat caccacgcgt 780
gagctggcaa agtggctgcg cgcagaagaa atcaactttg acgacctcga ggacagcgca 840
tttgatccgc tgatgggtga ggctagcggt ggcggtatta tttttggcaa caccggcggc 900
gttatggaag ctgccatgcg cgcggcgtat aaaatggcaa ccggtgaaga tgccccccaa 960
acccttatcc cattcgaggc catcagaggc atggatggtg cgcgcgaagc tgatgttgtg 1020
atcggtgaca agaccctgca cgttgcggcg gtgcatggta cgggcaattt acgtaaattc 1080
attgagcgca tgcgtgcgga gaacatccac tacgacttca tcgaggtgat ggcatgccgt 1140
ggtgggtgca tcggcggcgg tggccaaccg cgtgttaaat tgccgatggc cgacaaagcg 1200
cgcgaagctc gtatcgcgtc tctatacacc cgtgacgcag aagtgactgt aaaggccgcg 1260
tgcgataatc cggatattca gaaattatat gcagagtttt tcgacggcaa accgatgagc 1320
cataaagcac atcacatgct gcataccacg ttcgtgaatc gtagcgaaga tttgggtccg 1380
aacggtgcgt gcaccccggc gacgtgcccg accagtgttc cgaacctgaa aaaggctgct 1440
gaagcggcga aggcggcggc tgaagttaac tcttagggat cc 1482
<210> 26
<211> 1443
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised nucleic acid sequence encoding HydA (Hyd1) from
Veillonella atypica, 5' - 3'
<400> 26
cccgggatgt cacaatttga atttatagat aaaagggtcc ctattgcgct cgacaacccg 60
agcatctatc acgatatctc caaatgcaaa aactgcacct tatgccgtcg tgcgtgcgcc 120
gacgtgatga gcgttctgga ctactacgat ctggaagcga ccggtgacgt gccagtttgt 180
attcattgtg gacaatgtgc agcggcgtgc ccgtttgact cgatgcatgc aaaaagcgaa 240
ttggataagg tgaaggtggc tattgccgat ccggataaaa tcgtcgttat tcagaccgct 300
ccggctgtac gcgtgtcgat tggcgagggt ttcggctttg aaccgggtac gtttctcgag 360
ggcaaaatgg ttagcgcgct gcgtaaactg ggtgccgact acgtggtcga cacgaacttc 420
ggcgcggatc tgaccattat ggaggaggcg tctgaattgg ttgatcgtct gaagaacggt 480
ggcacgatcc cgcaattcac cagttgctgc ccggcttggg ttcgttttgc ggaaatctac 540
ttcccggagt tgatcccaaa tctgtctagc acccgtagct gcatcgcaat ggaggccgct 600
atgattaaaa cctatttcgc tgagaaaaag ggtattaacc cggcgaatat cgtgtccgtc 660
tccgttaatc cgtgtactgc gaagaaggct gagacaaagc gcgtggaaga aaatgctgcc 720
gcgcgttatt acgacgacga atcccttggc atggataccg acatcagcat taccaccaga 780
gaatttatcc gttggctgaa cgacgaaggc gtggacttcg agtccctgga ggacagccag 840
tttgatgatc ttatcggtat ggaaactggc gcgtctatca tttttggtaa taccggtggc 900
gttatggagg ctgctatgag aacggcgtac aaactgatta cggataagga gccgccaccg 960
tatgcactga cccacctgga ggatgtgcgc ggtatgaacg gtgtgaaaga ggcgacggtt 1020
cagctgggtg atgacgtgac tctgagcgtt gcggtggttc acggcggtaa gaacacccgt 1080
gattttttga atgcgctgaa ggagaacggc aagcactatg acttcatcga agtcatggca 1140
tgtccgggtg ggtgcattgg tggcggtggc caaccgcgta ccaaactgcc gcaggcggtt 1200
aagaccaaag aggcgcgtat cggcggtctg tacaaggcgg acgaagaata taagtacgtt 1260
gccagctatg aatcaccgga aatccaagag ttgtacaaga acttcttggg agaacctctg 1320
ggtcacaaag cacatgaatt gctgcatacc cacttcaccg atcgcagcgc acagttaggc 1380
gaccgcaaag atgttgtccc ggagacctgt ccgaccagcc cgaaatacaa gggttaggga 1440
tcc 1443
<210> 27
<211> 1413
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimised nucleic acid sequence encoding HydA (Hyd1) from
Peptoclostridium bifermentans, 5' - 3'
<400> 27
cccgggatga agcacctatt tacagaaaaa gtagttccga tcgagctgga taacccgtcc 60
attcagattg actttgataa gtgcatcaag tgcggtctgt gtaaacgcgt ttgtgaaaac 120
gagattggtg ttaatggtta tttcgacctg gagaagaccg gtgacatcgc catctgcatc 180
aactgcggcc aatgtgttca ggcatgtcca aaaaaggcga tcacccaggt tatcgatgtg 240
gatcgcgtga aggaagcgat caacgatccg gaaaagattg ttatcttcag cacagcgcca 300
gctgtgcgtg tcgcactggg cgaagaattt aacctggaag aaggcgcgta tgttgaggac 360
aaaatggtgg acgccctgcg taaactgggt ggagattacg tttttgacgt tacctttggc 420
gccgatatga ccatcatgga agaggcgaac gaacttgttt ctcgtatcaa aaacggcaaa 480
ggcaaaaccc cgcaatttac cagctgctgc ccgtcctggg ttaagttcgc ggaaacgttc 540
tatccggagt tgattccgaa tctgtctacc acgaaatctc cgattggcat tcagggtgct 600
gtcatcaaga cctatttcgc acagaaagca aatatcgacc cggagaaaat cgtgaacgta 660
accattactc cgtgcaccgc taagaagtac gaaattgacc gtccggagat gaatgcgagc 720
gcaaaataca acaaaagcga aaatatgaga gataatgaca tcatcctcac cactaaggag 780
ctggcgcagt ggctccgtga cgaagagatc gacttcaacg ctttggaggg ctcgaaattt 840
gacaacatct tgggcttggg tagcggtgcg ggcattatct tcggtaatag cggtggtgtg 900
atggaagccg cggtgcgcac ggtctacaat atcctcaccc atgagaaccc acataaagaa 960
ctgctgcact ttaatccggt tcgtggtctg gaagacgtga aggaggctac ccttaccatt 1020
ggcgatacca ccctgcgcct ggcagcggtg caaggcacgg cgaacgtgcg tacgttgatc 1080
gaaaagctga aatccggtga ggtggagtac gacttcatag aggtaatgac ttgcaaaggt 1140
ggttgtattg gtggcgctgg tcaaccgaag atgaaagcgc gtattagcaa tgagatgcgt 1200
ctcaagcgca ttgagggtct gtacgataag gacaagcaca ttgcggtcaa atgcagctat 1260
gaaaacccgg atgtcatcaa cgtgtacaag gagttcttca aacaaccgct gagccattta 1320
tcccacgagt tgctgcacac cacctttgaa agcaagcacg atatgttggg tctgaaggat 1380
gacaacaacg tttcggatat tggctaggga tcc 1413
<210> 28
<211> 83
<212> DNA
<213> E. coli
<400> 28
ggtaaatttg atgtacatca aatggatccc cttgctgaat cgttaaggta ggcggtaata 60
gaaaagaaat cgaggcaaaa atg 83
<210> 29
<211> 52
<212> DNA
<213> E. coli
<400> 29
ctcttgatcg ttatcaaatc ccaatactgt gttagagagt ataatgccct ta 52
<210> 30
<211> 8797
<212> DNA
<213> Artificial Sequence
<220>
<223> Exemplary HPGC (hydrogen producing gene cluster) with alternative
codon optimised nucleic acid sequence encoding HydA from
Chlamydomonas reinhardtii, 5' - 3'
<400> 30
ctagagggct ttacacttta tgcttccggc tcgtatgttg tgtggaaaga aggagatata 60
catatggcga tgcgttccac atttgctgcg cgtgtcggtg ccaaaccggc agtgcgtggg 120
gcgcgtcccg cgtcgcgtat gtcttgcatg gcctataagg ttacactgaa aacgccatca 180
ggcgataaaa caatcgaatg tccggcggac acctatatcc tggatgctgc ggaggaagcc 240
gggctggacc ttccctatag ttgccgtgcg ggcgcctgtt catcctgtgc tggcaaagtg 300
gcagctggaa cggtagatca atctgatcag tcctttctgg atgacgctca gatggggaac 360
ggattcgtcc tgacatgtgt cgcgtatcct acaagcgact gcactatcca aactcaccaa 420
gaggaggctt tatattaaaa gaaggagata tacatatgca aactgttcgc gctccagcag 480
cttcaggtgt tgccacacgt gtcgcaggtc gtcgtatgtg tcgtccggtt gcggcgacga 540
aggcttccac ggctgttacc acagacatgt cgaagcgcac tgttccaacc aagttagagg 600
aaggtgaaat gccgttgaac acgtacagta ataaagctcc gttcaaggca aaggttcgtt 660
ccgtggaaaa aatcacagga ccaaaagcca caggtgagac gtgccacatc attattgaaa 720
ccgaggggaa gatcccgttt tgggagggac aatcgtacgg tgtaattccg ccggggacca 780
agatcaactc taagggaaaa gaagtgcctc atggtactcg tctttattcg attgcttcta 840
gtcgttacgg agatgacttc gatggtcaaa cggcatcgct gtgtgttcgc cgcgcggtat 900
acgtcgatcc agagactgga aaggaggacc ccgcgaaaaa aggactgtgt agtaactttt 960
tgtgtgatgc cacaccaggc acggaaattt ccatgacagg gcccacagga aaagtattgc 1020
ttctgccagc agacgcgaac gcgccattaa tctgtgtcgc aacggggact ggaatcgcgc 1080
cttttcgctc attctggcgc cgttgcttca tcgagaatgt cccaagttat aagttcactg 1140
gccttttctg gttgtttatg ggtgtcgcta actctgatgc taaattgtac gatgaggaac 1200
tgcaagctat cgcaaaagcg tatccgggac aattccgcct ggactatgcc ttgtctcgtg 1260
aacaaaataa tcgcaagggc gggaaaatgt acatccaaga taaggttgaa gagtatgccg 1320
acgaaatttt cgatttattg gataatgggg cgcacatgta cttctgcggg ttaaagggga 1380
tgatgccagg catccaagat atgttagaac gcgttgcaaa agaaaagggg ctgaactacg 1440
aagagtgggt cgaggggtta aagcacaaga atcaatggca tgttgaagtc tactaaccag 1500
gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta tctgttgttt 1560
gtcggtgaac gctctctact agagtcacac tggctcacct tcgggtgggc ctttctgcgt 1620
ttatatacta gagggcttta cactttatgc ttccggctcg tatgttgtgt ggaaagaagg 1680
agatatacat atgtccgcat tagtacttaa gcccgggatg tccgcattag ttctgaagcc 1740
atgtgcggcg gtcagtatcc gcggaagcag ctgccgcgcc cgtcaagtcg cgccgcgcgc 1800
gccgttagca gcgtctacag ttcgtgttgc attagcaaca cttgaagctc ctgcgcgtcg 1860
cctgggcaac gtcgcttgtg cagcagcggc tccggcggcg gaggcccctt tgagccacgt 1920
ccaacaagcc ttagctgaat tggccaaacc gaaagatgac cccacacgca agcatgtttg 1980
tgtgcaagtc gccccagcgg tccgcgtcgc tattgccgaa acacttggac ttgctcccgg 2040
tgccacgacc ccgaagcaat tggcggaggg cttacgccgt ctgggtttcg acgaagtatt 2100
cgacacgctt ttcggggcag atttgacaat tatggaagaa gggtcagagt tgttgcatcg 2160
tttaacggaa catttggagg ctcaccctca ctctgacgaa ccgttgccca tgtttacctc 2220
gtgttgtccg ggttggattg cgatgcttga gaaatcgtac ccggatttaa ttccttatgt 2280
gtcctcgtgc aaatctcctc aaatgatgtt agccgcgatg gtgaagtcat atcttgccga 2340
aaagaagggc atcgcaccta aagacatggt gatggtgtca atcatgcctt gcacccgtaa 2400
gcagtccgag gccgatcgcg actggttttg tgtggatgct gaccctacat tacgccagtt 2460
agatcatgtt attacaaccg tagagttggg taacatcttt aaggagcgtg gtatcaattt 2520
ggctgagtta ccggaaggtg aatgggacaa cccgatgggg gtgggttcgg gagccggagt 2580
attatttggg accactggcg gcgtaatgga ggcagcatta cgtacggcct acgaactgtt 2640
cacaggtacc ccgctgcctc gcctgagttt gagcgaggtg cgtggtatgg acggtattaa 2700
ggaaacgaac atcacaatgg ttcctgctcc cggttcaaaa ttcgaggaac tgttgaagca 2760
tcgcgctgcc gcacgtgcag aagcagccgc acacggtact cctggtccac ttgcctggga 2820
cggcggggcc ggatttactt cagaagacgg tcgtggtgga attactttac gtgtcgctgt 2880
tgcgaatggg ctgggtaacg ctaaaaagtt aattacaaaa atgcaggccg gagaggcaaa 2940
atatgatttc gtagagatta tggcctgtcc cgctggttgc gtaggaggtg ggggccagcc 3000
ccgttcaact gacaaagcta tcacgcagaa acgtcaagcg gcattataca atctggatga 3060
aaaatcaacg cttcgccgtt cacatgagaa tccatcaatc cgtgaattgt acgatactta 3120
tttaggtgag cctctggggc ataaggcaca cgaacttctg catactcatt acgtcgcggg 3180
tggagttgag gagaaggatg aaaagaagta gggatccggg tcgaggagaa ggatgagaaa 3240
aagtgaccag gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta 3300
tctgttgttt gtcggtgaac gctctctact agagtcacac tggctcacct tcgggtgggc 3360
ctttctgcgt ttatatacta gagggcttta cactttatgc ttccggctcg tatgttgtgt 3420
ggaaagaagg agatatacat atggctcata gtttaagcgc acattcccgt caggccggag 3480
atcgcaaact gggcgcaggt gcggcatcta gccgcccatc atgtccttct cgccgcattg 3540
tccgcgtggc ggcccatgct tctgcgtcca aggcgactcc cgatgtacct gttgacgatc 3600
ttcctcctgc gcatgcccgt gcagcagtag cggccgctaa ccgtcgtgcg cgcgctatgg 3660
catcagcgga ggccgcggca gagaccctgg gcgatttcct gggcttaggg aagggggggc 3720
tttcgccggg cgcaaccgcc aaccttgatc gtgagcaagt attaggtgtg ttggaggcgg 3780
tctggcgtcg tggagacctt aatctggagc gtgcgttgta cagccatgcc aatgcggtga 3840
ctaacaaata ctgtggtggg ggggtctact atcgcggcct tgtggagttc agtaatattt 3900
gccaaaacga ttgctcatat tgtgggattc gcaacaatca aaaagaagtt tggcgctata 3960
ctatgccggt tgaagaggtg gtcgaggtag ctaagtgggc gcttgaaaac ggcattcgca 4020
acattatgtt gcaagggggt gaattaaaga cagagcaacg cttagcctac ttggaggcat 4080
gcgtccgtgc gattcgcgag gagacaacgc agttagacct tgaaatgcgc gcacgtgccg 4140
cgagtacgac aacagcggaa gcggcagcca gtgcacaggc agacgccgaa gctaaacgcg 4200
gcgagccaga attgggtgtg gtcgtatcct taagcgtcgg agaacttcct atggaacagt 4260
atgagcgttt gttccgcgcc ggcgcccgtc gctatctgat ccgcattgaa acctcgaatc 4320
ccgacctgta cgcggcactt cacccggagc cgatgtcctg gcacgcgcgt gtagaatgcc 4380
tgcgcaacct gaagaaagct gggtatatgt tgggcacagg agtgatggtc ggcttgccgg 4440
gacaaacctt acacgacctg gctggggatg tcatgttctt tcgcgacatt aaagcggaca 4500
tgatcggtat gggccccttc attacgcagc ctgggacgcc tgcaactgat aagtggaccg 4560
cgctgtatcc gaacgccaat aagaacagcc acatgaaatc tatgttcgat ctgaccactg 4620
ctatgaatgc acttgtacgt attacgatgg ggaacgtaaa tatcagtgct acgactgcat 4680
tacaagcgat tatccccact ggacgtgaaa ttgcgcttga gcgcggcgca aatgttgtca 4740
tgcctatttt aacgcctact cagtatcgcg agtcctatca gttatatgag ggtaagccct 4800
gcattacgga tactgctgtt cagtgtcgtc gttgcctgga catgcgtttg cactccgttg 4860
gcaaaacgtc tgcggccgga gtttggggcg atcctgcttc gttcttgcat cccatcgttg 4920
gcgtcccagt cccgcacgac ttgtcatcac ctgctttggc cgctgctgca agtgcggatt 4980
ttcacgaggt tggcgcaggt ccctggaacc ccatccgact agagcgtctg gttgaagtgc 5040
cggaccgtta ccctgacccc gataaccacg gacgcaaaaa ggcaggagcc gggaaaggag 5100
gcaaggcgca tgactctcac gacgatggcg atcacgacga ccaccaccac caccacggag 5160
ctgcccccgc gggtgcagcg gctggaaagg gtaccggtgc agctgcaatt ggtggcggag 5220
cgggggctag ccgtcaacgc gtagcagggg ctgctgccgc ctctgctcgt ctgtgtgcgg 5280
gagctcgccg cgctggccgt gttgtcgcgt cgccattgcg cccagctgcc gcttgccgtg 5340
gtgtggccgt caaggccgca gctgctgctg cgggtgaaga cgctggtgct ggtacgtctg 5400
gcgtaggttc aaatattgtt acgtctcccg gaatcgctag cactacggca catggtgttc 5460
ctcgtatcaa tattggggtg ttcggcgtga tgaatgcagg aaagtctaca cttgtgaatg 5520
ctctggcgca acaggaagca tgcattgttg actcaacccc cggcacgacc gcagatgtaa 5580
aaacagtttt gcttgagctt catgcccttg gaccagccaa gttgctggac acagccggat 5640
tagacgaagt cggtggactt ggggataaaa agcgccgtaa agccctgaat acgctgaagg 5700
agtgcgatgt tgctgtgctg gttgttgaca ctgatacggc agccgccgca atcaaatcgg 5760
gacgccttgc tgaagccctg gaatgggaat cgaaagtaat ggaacaggca cacaagtata 5820
atgtcagtcc tgtactgctt ctgaatgtaa aatcacgcgg gctgcctgaa gcgcaggcag 5880
ctagcatgct tgaggcggtc gctggtatgc ttgacccatc caagcaaatc cctcgtatgt 5940
cgctggattt agcgtccacc cccctgcacg agcgtagtac gattacgtct gcattcgtca 6000
aggaaggagc agtgcgcagt tcacgctatg gggctcctct gccggggtgt ttgccccgtt 6060
ggtctcttgg acgcaacgcc cgcttactga tggtaatccc gatggatgcc gaaaccccag 6120
gtggacgtct tcttcgtcct caagcgcaag ttatggagga agcaatccgc cattgggcta 6180
ccgtgctttc cgtacgcctg gatttagacg ccgcacgtgg caaattgggg cccgaggcct 6240
gtgagatgga gcgtcagcgt ttcgacgggg taattgctat gatggaacgt aatgacggac 6300
ccaccctggt ggtgacagat tctcaagcga tcgatgttgt acacccttgg accctggacc 6360
gctcatcagg acgtccgttg gttccaatta ctacctttag catcgctatg gcgtaccaac 6420
aaaacggcgg acgtttggac ccgtttgtgg aaggattgga agcattggag acgttacaag 6480
atggggatcg cgttcttatt tcggaagcgt gtaatcataa ccgtatcacc tccgcttgca 6540
acgacattgg aatggtgcag atccctaaca agctggaggc agcacttggc gggaaaaagt 6600
tacaaatcga acatgcgttt ggtcgcgagt ttcccgagct tgagagtggg ggtatggatg 6660
gattgaagtt agcgatccat tgtggagggt gtatgatcga cgctcagaaa atgcagcagc 6720
gtatgaaaga cttgcatgag gctggggtgc cggtcactaa ttatggggtg tttttctctt 6780
gggcagcttg gcccgacgcc cttcgtcgcg cattggaacc gtggggagtg gagccaccgg 6840
taggtactcc tgctaccccc gcagccgcgc ctgctacggc agcgtccggg gtataatact 6900
actagagggc tttacacttt atgcttccgg ctcgtatgtt gtgtggaaag aaggagatat 6960
acatatgtcg gtccccctac agtgcaatgc aggccgtctt ttggcgggcc agcgcccctg 7020
cggcgtccgc gcgcgtctga accgccgtgt atgtgttcca gtgaccgcac acggcaaagc 7080
atctgccacg cgcgaatacg ctggtgactt tcttccaggg accactatta gtcatgcgtg 7140
gtccgtggag cgtgaaactc atcaccgtta tcgtaatccg gccgagtgga ttaacgaggc 7200
tgccatccac aaggcgcttg aaacgtcaaa ggctgatgct caggacgcag gacgcgtgcg 7260
tgagattttg gcgaaggcta aggaaaaggc ttttgttact gaacatgcgc ctgtaaatgc 7320
ggaaagtaaa tccgaatttg tacaagggct taccttggag gagtgcgcca ccttaattaa 7380
cgttgattct aataatgtcg agttgatgaa tgaaatcttc gacactgcgc ttgctatcaa 7440
agaacgtatc tacgggaacc gcgtcgtgct gttcgcgccc ttgtacattg ctaatcattg 7500
tatgaacact tgcacttatt gtgcgtttcg ctcagccaat aagggcatgg aacgctctat 7560
tctgacagac gatgacctgc gtgaagaagt tgccgccttg caacgtcaag gtcatcgccg 7620
cattttagcc cttactggag aacatcctaa atacactttc gacaatttct tgcatgcagt 7680
caatgtaatc gcttccgtga agacagagcc tgaagggtcc attcgccgta tcaatgtcga 7740
aatcccacca cttagtgtct cagacatgcg ccgccttaag aatacagatt cagttggcac 7800
gttcgttctg tttcaagaga catatcaccg cgacacattc aaggtaatgc atccgtcagg 7860
tccaaagagc gactttgatt ttcgcgtctt gacccaggac cgcgccatgc gcgcaggctt 7920
ggacgatgtt ggtattggtg ctttattcgg gttatatgat taccgttatg aagtttgcgc 7980
catgttaatg catagcgagc atttggaacg tgagtacaac gcaggaccac atactatctc 8040
tgttccccgt atgcgccccg cggacggaag cgagcttagt atcgcgcctc cttatcctgt 8100
taatgatgct gattttatga aattagttgc ggtccttcgt attgctgtac catacacagg 8160
tatgatcctt agcactcgtg aatcaccaga aatgcgctcg gcgcttctga agtgtgggat 8220
gagtcaaatg agtgccggct cgcgcactga tgtaggagcc tatcacaaag atcacacgtt 8280
aagtacagag gcgaatttga gtaagttagc tgggcagttt accttgcagg atgaacgtcc 8340
aactaatgag attgttaagt ggctgatgga ggagggctat gtcccgtctt ggtgcacagc 8400
ttgttaccgt caaggtcgta cgggcgaaga cttcatgaac atctgtaagg ctggtgacat 8460
tcacgatttc tgtcatccca atagtctgct tacgcttcaa gagtacctta tggattatgc 8520
agatccagac cttcgtaaga aaggcgagca agtaattgcc cgtgagatgg gaccggacgc 8580
ctctgagccg ttatcggcgc aaagccgtaa gcgccttgaa cgcaagatga aacaagtatt 8640
ggagggggag cacgatgtat atctttaacc aggcatcaaa taaaacgaaa ggctcagtcg 8700
aaagactggg cctttcgttt tatctgttgt ttgtcggtga acgctctcta ctagagtcac 8760
actggctcac cttcgggtgg gcctttctgc gtttata 8797
<210> 31
<211> 8557
<212> DNA
<213> Artificial Sequence
<220>
<223> Exemplary HPGC (hydrogen producing gene cluster) with codon
optimised nucleic acid sequence encoding HydA (Hyd1) from Volvox
carteri, 5' - 3'
<400> 31
ctagagggct ttacacttta tgcttccggc tcgtatgttg tgtggaaaga aggagatata 60
catatggcga tgcgttccac atttgctgcg cgtgtcggtg ccaaaccggc agtgcgtggg 120
gcgcgtcccg cgtcgcgtat gtcttgcatg gcctataagg ttacactgaa aacgccatca 180
ggcgataaaa caatcgaatg tccggcggac acctatatcc tggatgctgc ggaggaagcc 240
gggctggacc ttccctatag ttgccgtgcg ggcgcctgtt catcctgtgc tggcaaagtg 300
gcagctggaa cggtagatca atctgatcag tcctttctgg atgacgctca gatggggaac 360
ggattcgtcc tgacatgtgt cgcgtatcct acaagcgact gcactatcca aactcaccaa 420
gaggaggctt tatattaaaa gaaggagata tacatatgca aactgttcgc gctccagcag 480
cttcaggtgt tgccacacgt gtcgcaggtc gtcgtatgtg tcgtccggtt gcggcgacga 540
aggcttccac ggctgttacc acagacatgt cgaagcgcac tgttccaacc aagttagagg 600
aaggtgaaat gccgttgaac acgtacagta ataaagctcc gttcaaggca aaggttcgtt 660
ccgtggaaaa aatcacagga ccaaaagcca caggtgagac gtgccacatc attattgaaa 720
ccgaggggaa gatcccgttt tgggagggac aatcgtacgg tgtaattccg ccggggacca 780
agatcaactc taagggaaaa gaagtgcctc atggtactcg tctttattcg attgcttcta 840
gtcgttacgg agatgacttc gatggtcaaa cggcatcgct gtgtgttcgc cgcgcggtat 900
acgtcgatcc agagactgga aaggaggacc ccgcgaaaaa aggactgtgt agtaactttt 960
tgtgtgatgc cacaccaggc acggaaattt ccatgacagg gcccacagga aaagtattgc 1020
ttctgccagc agacgcgaac gcgccattaa tctgtgtcgc aacggggact ggaatcgcgc 1080
cttttcgctc attctggcgc cgttgcttca tcgagaatgt cccaagttat aagttcactg 1140
gccttttctg gttgtttatg ggtgtcgcta actctgatgc taaattgtac gatgaggaac 1200
tgcaagctat cgcaaaagcg tatccgggac aattccgcct ggactatgcc ttgtctcgtg 1260
aacaaaataa tcgcaagggc gggaaaatgt acatccaaga taaggttgaa gagtatgccg 1320
acgaaatttt cgatttattg gataatgggg cgcacatgta cttctgcggg ttaaagggga 1380
tgatgccagg catccaagat atgttagaac gcgttgcaaa agaaaagggg ctgaactacg 1440
aagagtgggt cgaggggtta aagcacaaga atcaatggca tgttgaagtc tactaaccag 1500
gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta tctgttgttt 1560
gtcggtgaac gctctctact agagtcacac tggctcacct tcgggtgggc ctttctgcgt 1620
ttatatacta gagggcttta cactttatgc ttccggctcg tatgttgtgt ggaaagaagg 1680
agatatacat atgtccgcat tagtacttaa gcccgggatg tacgtttgcg tcgcacaagt 1740
tacgttacat gattgcttag catgctcagg gtgcatcaca tctgcggaaa cggttttgct 1800
tcagcaacag tccggggatg agttcttatc ccgcttggca gacccgcaca ctactgtcgt 1860
agttaccgtc tcgccccaat cgcgcacagc tttggcggct tactatggat tatgcccgtc 1920
tcaggctctt gcccgccttg tgggctggtt gaagtggctt ggggttcgcg ccgtatggga 1980
tctgacaaca gcccgcgatc ttgtattgtt ggaagaggca gctgagttca tgaaccgttg 2040
ggtctgcatg tatgttagcg ccgggcctct tccggtcatg ggcagttcat gtcctggcac 2100
aggctgggtt tgttatgctg aaaagacgca cgggacgcgt gtattaccct atttgagcac 2160
cacccgttca ccccaaggag caatgggtgg cttggtaaag tccctggtgg cagcagcttg 2220
gggcgttact ccagggtctt tgtaccacgt cacaattatg ccgtgttatg acaagaaatt 2280
ggaagcatct cgcgatgaat taaccacaac ggcgacaact actaccgctg cggggacaga 2340
cgcggctgga gcaggtgccg ccgtaggcgg gcctctgcct gaagtgatgg tccgtcatgc 2400
aaccgcagcg cctgatccgt tgcttccggg cgtggtacca gccgacgacc agctgtactc 2460
ccttccacat ggctccagct cgggtggata cgcggacttc gttttccgca ctgccgcgcg 2520
cgagttgtgg ggggtagaag ttccgccagg acctttacca tggcgtactc gtcgtaacgc 2580
cgacttacag cctcgtgttg gtgccccagg ccaatctctg gtcgttgcgc gtgtgtatgg 2640
attccgcaat attcagacac ttttacagca gcttaagcgt ggacgctgcc cttatcatta 2700
tgtggaagtc atggcttgtc ctagcgggtg tttgaacgga ggaggacaaa tcaaaccggg 2760
gccaggggta acgccgcaac aattaattga acaattggag cttttgtatg acgttgcggc 2820
acgttctcca gcagacaacc cggcggtagc agctttatat ggctcttggt taggcggtcg 2880
tccaggggca ccccccgctc gtcaactgtt acatacgaca tttcgcgagc gcgaaaagac 2940
tgtaactgcc gcaaccgtca cgaattggta gggatccggg tcgaggagaa ggatgagaaa 3000
aagtgaccag gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta 3060
tctgttgttt gtcggtgaac gctctctact agagtcacac tggctcacct tcgggtgggc 3120
ctttctgcgt ttatatacta gagggcttta cactttatgc ttccggctcg tatgttgtgt 3180
ggaaagaagg agatatacat atggctcata gtttaagcgc acattcccgt caggccggag 3240
atcgcaaact gggcgcaggt gcggcatcta gccgcccatc atgtccttct cgccgcattg 3300
tccgcgtggc ggcccatgct tctgcgtcca aggcgactcc cgatgtacct gttgacgatc 3360
ttcctcctgc gcatgcccgt gcagcagtag cggccgctaa ccgtcgtgcg cgcgctatgg 3420
catcagcgga ggccgcggca gagaccctgg gcgatttcct gggcttaggg aagggggggc 3480
tttcgccggg cgcaaccgcc aaccttgatc gtgagcaagt attaggtgtg ttggaggcgg 3540
tctggcgtcg tggagacctt aatctggagc gtgcgttgta cagccatgcc aatgcggtga 3600
ctaacaaata ctgtggtggg ggggtctact atcgcggcct tgtggagttc agtaatattt 3660
gccaaaacga ttgctcatat tgtgggattc gcaacaatca aaaagaagtt tggcgctata 3720
ctatgccggt tgaagaggtg gtcgaggtag ctaagtgggc gcttgaaaac ggcattcgca 3780
acattatgtt gcaagggggt gaattaaaga cagagcaacg cttagcctac ttggaggcat 3840
gcgtccgtgc gattcgcgag gagacaacgc agttagacct tgaaatgcgc gcacgtgccg 3900
cgagtacgac aacagcggaa gcggcagcca gtgcacaggc agacgccgaa gctaaacgcg 3960
gcgagccaga attgggtgtg gtcgtatcct taagcgtcgg agaacttcct atggaacagt 4020
atgagcgttt gttccgcgcc ggcgcccgtc gctatctgat ccgcattgaa acctcgaatc 4080
ccgacctgta cgcggcactt cacccggagc cgatgtcctg gcacgcgcgt gtagaatgcc 4140
tgcgcaacct gaagaaagct gggtatatgt tgggcacagg agtgatggtc ggcttgccgg 4200
gacaaacctt acacgacctg gctggggatg tcatgttctt tcgcgacatt aaagcggaca 4260
tgatcggtat gggccccttc attacgcagc ctgggacgcc tgcaactgat aagtggaccg 4320
cgctgtatcc gaacgccaat aagaacagcc acatgaaatc tatgttcgat ctgaccactg 4380
ctatgaatgc acttgtacgt attacgatgg ggaacgtaaa tatcagtgct acgactgcat 4440
tacaagcgat tatccccact ggacgtgaaa ttgcgcttga gcgcggcgca aatgttgtca 4500
tgcctatttt aacgcctact cagtatcgcg agtcctatca gttatatgag ggtaagccct 4560
gcattacgga tactgctgtt cagtgtcgtc gttgcctgga catgcgtttg cactccgttg 4620
gcaaaacgtc tgcggccgga gtttggggcg atcctgcttc gttcttgcat cccatcgttg 4680
gcgtcccagt cccgcacgac ttgtcatcac ctgctttggc cgctgctgca agtgcggatt 4740
ttcacgaggt tggcgcaggt ccctggaacc ccatccgact agagcgtctg gttgaagtgc 4800
cggaccgtta ccctgacccc gataaccacg gacgcaaaaa ggcaggagcc gggaaaggag 4860
gcaaggcgca tgactctcac gacgatggcg atcacgacga ccaccaccac caccacggag 4920
ctgcccccgc gggtgcagcg gctggaaagg gtaccggtgc agctgcaatt ggtggcggag 4980
cgggggctag ccgtcaacgc gtagcagggg ctgctgccgc ctctgctcgt ctgtgtgcgg 5040
gagctcgccg cgctggccgt gttgtcgcgt cgccattgcg cccagctgcc gcttgccgtg 5100
gtgtggccgt caaggccgca gctgctgctg cgggtgaaga cgctggtgct ggtacgtctg 5160
gcgtaggttc aaatattgtt acgtctcccg gaatcgctag cactacggca catggtgttc 5220
ctcgtatcaa tattggggtg ttcggcgtga tgaatgcagg aaagtctaca cttgtgaatg 5280
ctctggcgca acaggaagca tgcattgttg actcaacccc cggcacgacc gcagatgtaa 5340
aaacagtttt gcttgagctt catgcccttg gaccagccaa gttgctggac acagccggat 5400
tagacgaagt cggtggactt ggggataaaa agcgccgtaa agccctgaat acgctgaagg 5460
agtgcgatgt tgctgtgctg gttgttgaca ctgatacggc agccgccgca atcaaatcgg 5520
gacgccttgc tgaagccctg gaatgggaat cgaaagtaat ggaacaggca cacaagtata 5580
atgtcagtcc tgtactgctt ctgaatgtaa aatcacgcgg gctgcctgaa gcgcaggcag 5640
ctagcatgct tgaggcggtc gctggtatgc ttgacccatc caagcaaatc cctcgtatgt 5700
cgctggattt agcgtccacc cccctgcacg agcgtagtac gattacgtct gcattcgtca 5760
aggaaggagc agtgcgcagt tcacgctatg gggctcctct gccggggtgt ttgccccgtt 5820
ggtctcttgg acgcaacgcc cgcttactga tggtaatccc gatggatgcc gaaaccccag 5880
gtggacgtct tcttcgtcct caagcgcaag ttatggagga agcaatccgc cattgggcta 5940
ccgtgctttc cgtacgcctg gatttagacg ccgcacgtgg caaattgggg cccgaggcct 6000
gtgagatgga gcgtcagcgt ttcgacgggg taattgctat gatggaacgt aatgacggac 6060
ccaccctggt ggtgacagat tctcaagcga tcgatgttgt acacccttgg accctggacc 6120
gctcatcagg acgtccgttg gttccaatta ctacctttag catcgctatg gcgtaccaac 6180
aaaacggcgg acgtttggac ccgtttgtgg aaggattgga agcattggag acgttacaag 6240
atggggatcg cgttcttatt tcggaagcgt gtaatcataa ccgtatcacc tccgcttgca 6300
acgacattgg aatggtgcag atccctaaca agctggaggc agcacttggc gggaaaaagt 6360
tacaaatcga acatgcgttt ggtcgcgagt ttcccgagct tgagagtggg ggtatggatg 6420
gattgaagtt agcgatccat tgtggagggt gtatgatcga cgctcagaaa atgcagcagc 6480
gtatgaaaga cttgcatgag gctggggtgc cggtcactaa ttatggggtg tttttctctt 6540
gggcagcttg gcccgacgcc cttcgtcgcg cattggaacc gtggggagtg gagccaccgg 6600
taggtactcc tgctaccccc gcagccgcgc ctgctacggc agcgtccggg gtataatact 6660
actagagggc tttacacttt atgcttccgg ctcgtatgtt gtgtggaaag aaggagatat 6720
acatatgtcg gtccccctac agtgcaatgc aggccgtctt ttggcgggcc agcgcccctg 6780
cggcgtccgc gcgcgtctga accgccgtgt atgtgttcca gtgaccgcac acggcaaagc 6840
atctgccacg cgcgaatacg ctggtgactt tcttccaggg accactatta gtcatgcgtg 6900
gtccgtggag cgtgaaactc atcaccgtta tcgtaatccg gccgagtgga ttaacgaggc 6960
tgccatccac aaggcgcttg aaacgtcaaa ggctgatgct caggacgcag gacgcgtgcg 7020
tgagattttg gcgaaggcta aggaaaaggc ttttgttact gaacatgcgc ctgtaaatgc 7080
ggaaagtaaa tccgaatttg tacaagggct taccttggag gagtgcgcca ccttaattaa 7140
cgttgattct aataatgtcg agttgatgaa tgaaatcttc gacactgcgc ttgctatcaa 7200
agaacgtatc tacgggaacc gcgtcgtgct gttcgcgccc ttgtacattg ctaatcattg 7260
tatgaacact tgcacttatt gtgcgtttcg ctcagccaat aagggcatgg aacgctctat 7320
tctgacagac gatgacctgc gtgaagaagt tgccgccttg caacgtcaag gtcatcgccg 7380
cattttagcc cttactggag aacatcctaa atacactttc gacaatttct tgcatgcagt 7440
caatgtaatc gcttccgtga agacagagcc tgaagggtcc attcgccgta tcaatgtcga 7500
aatcccacca cttagtgtct cagacatgcg ccgccttaag aatacagatt cagttggcac 7560
gttcgttctg tttcaagaga catatcaccg cgacacattc aaggtaatgc atccgtcagg 7620
tccaaagagc gactttgatt ttcgcgtctt gacccaggac cgcgccatgc gcgcaggctt 7680
ggacgatgtt ggtattggtg ctttattcgg gttatatgat taccgttatg aagtttgcgc 7740
catgttaatg catagcgagc atttggaacg tgagtacaac gcaggaccac atactatctc 7800
tgttccccgt atgcgccccg cggacggaag cgagcttagt atcgcgcctc cttatcctgt 7860
taatgatgct gattttatga aattagttgc ggtccttcgt attgctgtac catacacagg 7920
tatgatcctt agcactcgtg aatcaccaga aatgcgctcg gcgcttctga agtgtgggat 7980
gagtcaaatg agtgccggct cgcgcactga tgtaggagcc tatcacaaag atcacacgtt 8040
aagtacagag gcgaatttga gtaagttagc tgggcagttt accttgcagg atgaacgtcc 8100
aactaatgag attgttaagt ggctgatgga ggagggctat gtcccgtctt ggtgcacagc 8160
ttgttaccgt caaggtcgta cgggcgaaga cttcatgaac atctgtaagg ctggtgacat 8220
tcacgatttc tgtcatccca atagtctgct tacgcttcaa gagtacctta tggattatgc 8280
agatccagac cttcgtaaga aaggcgagca agtaattgcc cgtgagatgg gaccggacgc 8340
ctctgagccg ttatcggcgc aaagccgtaa gcgccttgaa cgcaagatga aacaagtatt 8400
ggagggggag cacgatgtat atctttaacc aggcatcaaa taaaacgaaa ggctcagtcg 8460
aaagactggg cctttcgttt tatctgttgt ttgtcggtga acgctctcta ctagagtcac 8520
actggctcac cttcgggtgg gcctttctgc gtttata 8557
<210> 32
<211> 8728
<212> DNA
<213> Artificial Sequence
<220>
<223> Exemplary HPGC (hydrogen producing gene cluster) with codon
optimised nucleic acid sequence encoding HydA (Hyd1) from Giardia
lamblia 5' - 3'
<400> 32
ctagagggct ttacacttta tgcttccggc tcgtatgttg tgtggaaaga aggagatata 60
catatggcga tgcgttccac atttgctgcg cgtgtcggtg ccaaaccggc agtgcgtggg 120
gcgcgtcccg cgtcgcgtat gtcttgcatg gcctataagg ttacactgaa aacgccatca 180
ggcgataaaa caatcgaatg tccggcggac acctatatcc tggatgctgc ggaggaagcc 240
gggctggacc ttccctatag ttgccgtgcg ggcgcctgtt catcctgtgc tggcaaagtg 300
gcagctggaa cggtagatca atctgatcag tcctttctgg atgacgctca gatggggaac 360
ggattcgtcc tgacatgtgt cgcgtatcct acaagcgact gcactatcca aactcaccaa 420
gaggaggctt tatattaaaa gaaggagata tacatatgca aactgttcgc gctccagcag 480
cttcaggtgt tgccacacgt gtcgcaggtc gtcgtatgtg tcgtccggtt gcggcgacga 540
aggcttccac ggctgttacc acagacatgt cgaagcgcac tgttccaacc aagttagagg 600
aaggtgaaat gccgttgaac acgtacagta ataaagctcc gttcaaggca aaggttcgtt 660
ccgtggaaaa aatcacagga ccaaaagcca caggtgagac gtgccacatc attattgaaa 720
ccgaggggaa gatcccgttt tgggagggac aatcgtacgg tgtaattccg ccggggacca 780
agatcaactc taagggaaaa gaagtgcctc atggtactcg tctttattcg attgcttcta 840
gtcgttacgg agatgacttc gatggtcaaa cggcatcgct gtgtgttcgc cgcgcggtat 900
acgtcgatcc agagactgga aaggaggacc ccgcgaaaaa aggactgtgt agtaactttt 960
tgtgtgatgc cacaccaggc acggaaattt ccatgacagg gcccacagga aaagtattgc 1020
ttctgccagc agacgcgaac gcgccattaa tctgtgtcgc aacggggact ggaatcgcgc 1080
cttttcgctc attctggcgc cgttgcttca tcgagaatgt cccaagttat aagttcactg 1140
gccttttctg gttgtttatg ggtgtcgcta actctgatgc taaattgtac gatgaggaac 1200
tgcaagctat cgcaaaagcg tatccgggac aattccgcct ggactatgcc ttgtctcgtg 1260
aacaaaataa tcgcaagggc gggaaaatgt acatccaaga taaggttgaa gagtatgccg 1320
acgaaatttt cgatttattg gataatgggg cgcacatgta cttctgcggg ttaaagggga 1380
tgatgccagg catccaagat atgttagaac gcgttgcaaa agaaaagggg ctgaactacg 1440
aagagtgggt cgaggggtta aagcacaaga atcaatggca tgttgaagtc tactaaccag 1500
gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta tctgttgttt 1560
gtcggtgaac gctctctact agagtcacac tggctcacct tcgggtgggc ctttctgcgt 1620
ttatatacta gagggcttta cactttatgc ttccggctcg tatgttgtgt ggaaagaagg 1680
agatatacat atgtccgcat tagtacttaa gcccgggatg cctccaaaac cccaacacga 1740
tgtaacaggc gtggactcca ataacgcgat catgattgat tacgcaaagt gcattggctg 1800
caacatgtgc atcaaagcat gcgacgtgca aggtattggt gtttacaagc agaacgaaaa 1860
accgaagtac ccgcctatcg tgaagctgag caccctgttt aatagcgatt gtatcggctg 1920
cggtcaatgt gcaacgattt gtccggtgga cgcgattgct ccaaagaaca atctggaaat 1980
ttacaaaggc gaatctgctt ccaaaaaagt tcgtgtggcg ttgatcgcgc caagcactcg 2040
cgtggcgttt ggagatgtct tcgggctgcc gatcggtaca aataccattt actccctgat 2100
tcgcatgctg aagcaatatc tgggtttcga ttatgtgttc gacgtgaatt tcggcgcaga 2160
tgaaaccacc gtcatcgaca cccaagagct gttgcacttc aaacacgagg gccgtggtcc 2220
ggtgttcacc agctgctgcc cggcgtgggt taacctctgt gaaatgaagt acccggagct 2280
gctgccccag gttagcaccg ctaaatcttg tgttgcaatg gtagcgaccc ttgtaaaaag 2340
acgttgggtt caagaacatt taatcccgaa gggtattgta gacagcgttg acgatgtcta 2400
cgtggctgat attatgccgt gtaccgcgaa aaaggatgaa agcatgcgtc cacaactgaa 2460
ccgcgatgtg gacatctgcc tgacggtgcg tgaagttgcg gagcacctgt attttctgca 2520
cggcgcgcgc ttgacgctgg aggaagtcga ggcggatgcg ttggttttgc gtccgggccg 2580
tagcacgcag aaaaagtggg actttgacgc tccgtttaac accgtgtctg gtggctccca 2640
tatctttggt aagaccggtg gcgttgccga gacgtgtctc cgtttcatca gctatatgaa 2700
aaagtcgccg atagaaaacg ttaaggagga attgctgaaa gagttcaaga cgccgggtca 2760
gctggtgcaa accgttaagc tggtcagctg cgagatcgcc ggtgagactt atcgtgccct 2820
gattgcgcat ggcggttcag caatcaatgc cgccgcgcgt atggtgctca ataaagaggt 2880
ggagtgcgac gttgttgagc agatggcctg tccgggtggc tgccagaacg gtggaggcat 2940
gccgaagatc aagggtaaaa aagaggcagt tttgacgcgt gcgtctacct tggacatcct 3000
ggacggtaaa gagcgctttg cgagcgcggg cgagaacaaa actctgtggg gtttcaacgg 3060
ctgcttaacc gaacacgaag cgcacgagtt gcttcacacc cattatcagc atcgcccggt 3120
ggaatcgctg ctgccgcagt agggatccgg gtcgaggaga aggatgagaa aaagtgacca 3180
ggcatcaaat aaaacgaaag gctcagtcga aagactgggc ctttcgtttt atctgttgtt 3240
tgtcggtgaa cgctctctac tagagtcaca ctggctcacc ttcgggtggg cctttctgcg 3300
tttatatact agagggcttt acactttatg cttccggctc gtatgttgtg tggaaagaag 3360
gagatataca tatggctcat agtttaagcg cacattcccg tcaggccgga gatcgcaaac 3420
tgggcgcagg tgcggcatct agccgcccat catgtccttc tcgccgcatt gtccgcgtgg 3480
cggcccatgc ttctgcgtcc aaggcgactc ccgatgtacc tgttgacgat cttcctcctg 3540
cgcatgcccg tgcagcagta gcggccgcta accgtcgtgc gcgcgctatg gcatcagcgg 3600
aggccgcggc agagaccctg ggcgatttcc tgggcttagg gaaggggggg ctttcgccgg 3660
gcgcaaccgc caaccttgat cgtgagcaag tattaggtgt gttggaggcg gtctggcgtc 3720
gtggagacct taatctggag cgtgcgttgt acagccatgc caatgcggtg actaacaaat 3780
actgtggtgg gggggtctac tatcgcggcc ttgtggagtt cagtaatatt tgccaaaacg 3840
attgctcata ttgtgggatt cgcaacaatc aaaaagaagt ttggcgctat actatgccgg 3900
ttgaagaggt ggtcgaggta gctaagtggg cgcttgaaaa cggcattcgc aacattatgt 3960
tgcaaggggg tgaattaaag acagagcaac gcttagccta cttggaggca tgcgtccgtg 4020
cgattcgcga ggagacaacg cagttagacc ttgaaatgcg cgcacgtgcc gcgagtacga 4080
caacagcgga agcggcagcc agtgcacagg cagacgccga agctaaacgc ggcgagccag 4140
aattgggtgt ggtcgtatcc ttaagcgtcg gagaacttcc tatggaacag tatgagcgtt 4200
tgttccgcgc cggcgcccgt cgctatctga tccgcattga aacctcgaat cccgacctgt 4260
acgcggcact tcacccggag ccgatgtcct ggcacgcgcg tgtagaatgc ctgcgcaacc 4320
tgaagaaagc tgggtatatg ttgggcacag gagtgatggt cggcttgccg ggacaaacct 4380
tacacgacct ggctggggat gtcatgttct ttcgcgacat taaagcggac atgatcggta 4440
tgggcccctt cattacgcag cctgggacgc ctgcaactga taagtggacc gcgctgtatc 4500
cgaacgccaa taagaacagc cacatgaaat ctatgttcga tctgaccact gctatgaatg 4560
cacttgtacg tattacgatg gggaacgtaa atatcagtgc tacgactgca ttacaagcga 4620
ttatccccac tggacgtgaa attgcgcttg agcgcggcgc aaatgttgtc atgcctattt 4680
taacgcctac tcagtatcgc gagtcctatc agttatatga gggtaagccc tgcattacgg 4740
atactgctgt tcagtgtcgt cgttgcctgg acatgcgttt gcactccgtt ggcaaaacgt 4800
ctgcggccgg agtttggggc gatcctgctt cgttcttgca tcccatcgtt ggcgtcccag 4860
tcccgcacga cttgtcatca cctgctttgg ccgctgctgc aagtgcggat tttcacgagg 4920
ttggcgcagg tccctggaac cccatccgac tagagcgtct ggttgaagtg ccggaccgtt 4980
accctgaccc cgataaccac ggacgcaaaa aggcaggagc cgggaaagga ggcaaggcgc 5040
atgactctca cgacgatggc gatcacgacg accaccacca ccaccacgga gctgcccccg 5100
cgggtgcagc ggctggaaag ggtaccggtg cagctgcaat tggtggcgga gcgggggcta 5160
gccgtcaacg cgtagcaggg gctgctgccg cctctgctcg tctgtgtgcg ggagctcgcc 5220
gcgctggccg tgttgtcgcg tcgccattgc gcccagctgc cgcttgccgt ggtgtggccg 5280
tcaaggccgc agctgctgct gcgggtgaag acgctggtgc tggtacgtct ggcgtaggtt 5340
caaatattgt tacgtctccc ggaatcgcta gcactacggc acatggtgtt cctcgtatca 5400
atattggggt gttcggcgtg atgaatgcag gaaagtctac acttgtgaat gctctggcgc 5460
aacaggaagc atgcattgtt gactcaaccc ccggcacgac cgcagatgta aaaacagttt 5520
tgcttgagct tcatgccctt ggaccagcca agttgctgga cacagccgga ttagacgaag 5580
tcggtggact tggggataaa aagcgccgta aagccctgaa tacgctgaag gagtgcgatg 5640
ttgctgtgct ggttgttgac actgatacgg cagccgccgc aatcaaatcg ggacgccttg 5700
ctgaagccct ggaatgggaa tcgaaagtaa tggaacaggc acacaagtat aatgtcagtc 5760
ctgtactgct tctgaatgta aaatcacgcg ggctgcctga agcgcaggca gctagcatgc 5820
ttgaggcggt cgctggtatg cttgacccat ccaagcaaat ccctcgtatg tcgctggatt 5880
tagcgtccac ccccctgcac gagcgtagta cgattacgtc tgcattcgtc aaggaaggag 5940
cagtgcgcag ttcacgctat ggggctcctc tgccggggtg tttgccccgt tggtctcttg 6000
gacgcaacgc ccgcttactg atggtaatcc cgatggatgc cgaaacccca ggtggacgtc 6060
ttcttcgtcc tcaagcgcaa gttatggagg aagcaatccg ccattgggct accgtgcttt 6120
ccgtacgcct ggatttagac gccgcacgtg gcaaattggg gcccgaggcc tgtgagatgg 6180
agcgtcagcg tttcgacggg gtaattgcta tgatggaacg taatgacgga cccaccctgg 6240
tggtgacaga ttctcaagcg atcgatgttg tacacccttg gaccctggac cgctcatcag 6300
gacgtccgtt ggttccaatt actaccttta gcatcgctat ggcgtaccaa caaaacggcg 6360
gacgtttgga cccgtttgtg gaaggattgg aagcattgga gacgttacaa gatggggatc 6420
gcgttcttat ttcggaagcg tgtaatcata accgtatcac ctccgcttgc aacgacattg 6480
gaatggtgca gatccctaac aagctggagg cagcacttgg cgggaaaaag ttacaaatcg 6540
aacatgcgtt tggtcgcgag tttcccgagc ttgagagtgg gggtatggat ggattgaagt 6600
tagcgatcca ttgtggaggg tgtatgatcg acgctcagaa aatgcagcag cgtatgaaag 6660
acttgcatga ggctggggtg ccggtcacta attatggggt gtttttctct tgggcagctt 6720
ggcccgacgc ccttcgtcgc gcattggaac cgtggggagt ggagccaccg gtaggtactc 6780
ctgctacccc cgcagccgcg cctgctacgg cagcgtccgg ggtataatac tactagaggg 6840
ctttacactt tatgcttccg gctcgtatgt tgtgtggaaa gaaggagata tacatatgtc 6900
ggtcccccta cagtgcaatg caggccgtct tttggcgggc cagcgcccct gcggcgtccg 6960
cgcgcgtctg aaccgccgtg tatgtgttcc agtgaccgca cacggcaaag catctgccac 7020
gcgcgaatac gctggtgact ttcttccagg gaccactatt agtcatgcgt ggtccgtgga 7080
gcgtgaaact catcaccgtt atcgtaatcc ggccgagtgg attaacgagg ctgccatcca 7140
caaggcgctt gaaacgtcaa aggctgatgc tcaggacgca ggacgcgtgc gtgagatttt 7200
ggcgaaggct aaggaaaagg cttttgttac tgaacatgcg cctgtaaatg cggaaagtaa 7260
atccgaattt gtacaagggc ttaccttgga ggagtgcgcc accttaatta acgttgattc 7320
taataatgtc gagttgatga atgaaatctt cgacactgcg cttgctatca aagaacgtat 7380
ctacgggaac cgcgtcgtgc tgttcgcgcc cttgtacatt gctaatcatt gtatgaacac 7440
ttgcacttat tgtgcgtttc gctcagccaa taagggcatg gaacgctcta ttctgacaga 7500
cgatgacctg cgtgaagaag ttgccgcctt gcaacgtcaa ggtcatcgcc gcattttagc 7560
ccttactgga gaacatccta aatacacttt cgacaatttc ttgcatgcag tcaatgtaat 7620
cgcttccgtg aagacagagc ctgaagggtc cattcgccgt atcaatgtcg aaatcccacc 7680
acttagtgtc tcagacatgc gccgccttaa gaatacagat tcagttggca cgttcgttct 7740
gtttcaagag acatatcacc gcgacacatt caaggtaatg catccgtcag gtccaaagag 7800
cgactttgat tttcgcgtct tgacccagga ccgcgccatg cgcgcaggct tggacgatgt 7860
tggtattggt gctttattcg ggttatatga ttaccgttat gaagtttgcg ccatgttaat 7920
gcatagcgag catttggaac gtgagtacaa cgcaggacca catactatct ctgttccccg 7980
tatgcgcccc gcggacggaa gcgagcttag tatcgcgcct ccttatcctg ttaatgatgc 8040
tgattttatg aaattagttg cggtccttcg tattgctgta ccatacacag gtatgatcct 8100
tagcactcgt gaatcaccag aaatgcgctc ggcgcttctg aagtgtggga tgagtcaaat 8160
gagtgccggc tcgcgcactg atgtaggagc ctatcacaaa gatcacacgt taagtacaga 8220
ggcgaatttg agtaagttag ctgggcagtt taccttgcag gatgaacgtc caactaatga 8280
gattgttaag tggctgatgg aggagggcta tgtcccgtct tggtgcacag cttgttaccg 8340
tcaaggtcgt acgggcgaag acttcatgaa catctgtaag gctggtgaca ttcacgattt 8400
ctgtcatccc aatagtctgc ttacgcttca agagtacctt atggattatg cagatccaga 8460
ccttcgtaag aaaggcgagc aagtaattgc ccgtgagatg ggaccggacg cctctgagcc 8520
gttatcggcg caaagccgta agcgccttga acgcaagatg aaacaagtat tggaggggga 8580
gcacgatgta tatctttaac caggcatcaa ataaaacgaa aggctcagtc gaaagactgg 8640
gcctttcgtt ttatctgttg tttgtcggtg aacgctctct actagagtca cactggctca 8700
ccttcgggtg ggcctttctg cgtttata 8728
<210> 33
<211> 8710
<212> DNA
<213> Artificial Sequence
<220>
<223> Exemplary HPGC (hydrogen producing gene cluster) with codon
optimised nucleic acid sequence encoding HydA (Hyd1) from
Entamoeba nuttalli, 5' - 3'
<400> 33
ctagagggct ttacacttta tgcttccggc tcgtatgttg tgtggaaaga aggagatata 60
catatggcga tgcgttccac atttgctgcg cgtgtcggtg ccaaaccggc agtgcgtggg 120
gcgcgtcccg cgtcgcgtat gtcttgcatg gcctataagg ttacactgaa aacgccatca 180
ggcgataaaa caatcgaatg tccggcggac acctatatcc tggatgctgc ggaggaagcc 240
gggctggacc ttccctatag ttgccgtgcg ggcgcctgtt catcctgtgc tggcaaagtg 300
gcagctggaa cggtagatca atctgatcag tcctttctgg atgacgctca gatggggaac 360
ggattcgtcc tgacatgtgt cgcgtatcct acaagcgact gcactatcca aactcaccaa 420
gaggaggctt tatattaaaa gaaggagata tacatatgca aactgttcgc gctccagcag 480
cttcaggtgt tgccacacgt gtcgcaggtc gtcgtatgtg tcgtccggtt gcggcgacga 540
aggcttccac ggctgttacc acagacatgt cgaagcgcac tgttccaacc aagttagagg 600
aaggtgaaat gccgttgaac acgtacagta ataaagctcc gttcaaggca aaggttcgtt 660
ccgtggaaaa aatcacagga ccaaaagcca caggtgagac gtgccacatc attattgaaa 720
ccgaggggaa gatcccgttt tgggagggac aatcgtacgg tgtaattccg ccggggacca 780
agatcaactc taagggaaaa gaagtgcctc atggtactcg tctttattcg attgcttcta 840
gtcgttacgg agatgacttc gatggtcaaa cggcatcgct gtgtgttcgc cgcgcggtat 900
acgtcgatcc agagactgga aaggaggacc ccgcgaaaaa aggactgtgt agtaactttt 960
tgtgtgatgc cacaccaggc acggaaattt ccatgacagg gcccacagga aaagtattgc 1020
ttctgccagc agacgcgaac gcgccattaa tctgtgtcgc aacggggact ggaatcgcgc 1080
cttttcgctc attctggcgc cgttgcttca tcgagaatgt cccaagttat aagttcactg 1140
gccttttctg gttgtttatg ggtgtcgcta actctgatgc taaattgtac gatgaggaac 1200
tgcaagctat cgcaaaagcg tatccgggac aattccgcct ggactatgcc ttgtctcgtg 1260
aacaaaataa tcgcaagggc gggaaaatgt acatccaaga taaggttgaa gagtatgccg 1320
acgaaatttt cgatttattg gataatgggg cgcacatgta cttctgcggg ttaaagggga 1380
tgatgccagg catccaagat atgttagaac gcgttgcaaa agaaaagggg ctgaactacg 1440
aagagtgggt cgaggggtta aagcacaaga atcaatggca tgttgaagtc tactaaccag 1500
gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta tctgttgttt 1560
gtcggtgaac gctctctact agagtcacac tggctcacct tcgggtgggc ctttctgcgt 1620
ttatatacta gagggcttta cactttatgc ttccggctcg tatgttgtgt ggaaagaagg 1680
agatatacat atgtccgcat tagtacttaa gcccgggatg cctccaaaac cctcacacac 1740
tgtaacaggc cacgaccaca accacagcat ccagtttgac tggagcaagt gtatgggctg 1800
cggtatgtgt gcaaccaaat gcaccttcgg cgtattggtt aagcagccgc cgaagatccc 1860
gccatttgtc cagccgaacc gtgaaaaact gagccaagag aacaccgata aaacgcgtgt 1920
cctgatcgat gaaagcgagt gcaccggctg cggtcaatgc tctctggtgt gcaactttgg 1980
atctatcacc ccgatcgacc acctcgttga caccttcaaa gcaaaggagg cgggcaaaaa 2040
actcgtggcc atgattgccc cgagcactcg ccttggtgtc gctgaggcta tgggtatgcc 2100
gattggctcc accgctatgg cgcagctggt gcattgtctg cgtctgattg gttttgacta 2160
cgtttttgac gtggacgcgg gtgcggataa gacgaccatg gacgattacg cggaagttat 2220
cgaaatgaaa aaggagggta agggtccggc gatcaccagc tgctgcccgg cgtggattga 2280
gctggtggag aaagaatatc cggatttgat cccgaacgtg tccactgcgc gtagcccgat 2340
cggctgcttg gccggttgca tcaaacgtgg ttgggcaaaa gatgttggca tcgcggtaga 2400
ggatttgtac accgtgggta tcatgccttg tattgcgaag aagacggaat cccaacgtca 2460
gcaaattcat caagattacg acgcaagctg tacgtctaac gagattgcgg cgtacttcaa 2520
gaagcacctg ccaccggaag agtgcaaatt cacccaggag cgcgaggaag ctctggcaaa 2580
gactgaggac ggccaatgtg atctgccgtt ccgtcgcatt agcggtggct ccaacatttt 2640
tggtaagacc ggcggggtgt gtgaaaccgt gttgcgggtg attgcgcgta atgcgggtgt 2700
tgactggaat acgtgcaccg ttaacaaaga ggaaacattc aaacacgccg ctagcggttc 2760
gaccatgacc aatctgagtg ttgacatcgg cggaactata atcaccgggg cagtttgcca 2820
tggtggttat gcaatccgtc atgcctgcga actgattcgc aaaggtgaac tgaaagtcga 2880
cgttgttgag atgatggcct gtgttggcgg ctgcctgggc ggtgctggcc agcctaagat 2940
cccgccggcg aagaagctgg aaatggataa gcgcagagtg atgttagata ttctggacca 3000
gcaaacggac attcgtgcag cgaatgaaaa caccgacgtg ctaggctgga ttgataaaca 3060
cttcgaccac cagggtgcgc atcaacatct gcacacctat ttcaccccgc gttatcagaa 3120
ttagggatcc gggtcgagga gaaggatgag aaaaagtgac caggcatcaa ataaaacgaa 3180
aggctcagtc gaaagactgg gcctttcgtt ttatctgttg tttgtcggtg aacgctctct 3240
actagagtca cactggctca ccttcgggtg ggcctttctg cgtttatata ctagagggct 3300
ttacacttta tgcttccggc tcgtatgttg tgtggaaaga aggagatata catatggctc 3360
atagtttaag cgcacattcc cgtcaggccg gagatcgcaa actgggcgca ggtgcggcat 3420
ctagccgccc atcatgtcct tctcgccgca ttgtccgcgt ggcggcccat gcttctgcgt 3480
ccaaggcgac tcccgatgta cctgttgacg atcttcctcc tgcgcatgcc cgtgcagcag 3540
tagcggccgc taaccgtcgt gcgcgcgcta tggcatcagc ggaggccgcg gcagagaccc 3600
tgggcgattt cctgggctta gggaaggggg ggctttcgcc gggcgcaacc gccaaccttg 3660
atcgtgagca agtattaggt gtgttggagg cggtctggcg tcgtggagac cttaatctgg 3720
agcgtgcgtt gtacagccat gccaatgcgg tgactaacaa atactgtggt gggggggtct 3780
actatcgcgg ccttgtggag ttcagtaata tttgccaaaa cgattgctca tattgtggga 3840
ttcgcaacaa tcaaaaagaa gtttggcgct atactatgcc ggttgaagag gtggtcgagg 3900
tagctaagtg ggcgcttgaa aacggcattc gcaacattat gttgcaaggg ggtgaattaa 3960
agacagagca acgcttagcc tacttggagg catgcgtccg tgcgattcgc gaggagacaa 4020
cgcagttaga ccttgaaatg cgcgcacgtg ccgcgagtac gacaacagcg gaagcggcag 4080
ccagtgcaca ggcagacgcc gaagctaaac gcggcgagcc agaattgggt gtggtcgtat 4140
ccttaagcgt cggagaactt cctatggaac agtatgagcg tttgttccgc gccggcgccc 4200
gtcgctatct gatccgcatt gaaacctcga atcccgacct gtacgcggca cttcacccgg 4260
agccgatgtc ctggcacgcg cgtgtagaat gcctgcgcaa cctgaagaaa gctgggtata 4320
tgttgggcac aggagtgatg gtcggcttgc cgggacaaac cttacacgac ctggctgggg 4380
atgtcatgtt ctttcgcgac attaaagcgg acatgatcgg tatgggcccc ttcattacgc 4440
agcctgggac gcctgcaact gataagtgga ccgcgctgta tccgaacgcc aataagaaca 4500
gccacatgaa atctatgttc gatctgacca ctgctatgaa tgcacttgta cgtattacga 4560
tggggaacgt aaatatcagt gctacgactg cattacaagc gattatcccc actggacgtg 4620
aaattgcgct tgagcgcggc gcaaatgttg tcatgcctat tttaacgcct actcagtatc 4680
gcgagtccta tcagttatat gagggtaagc cctgcattac ggatactgct gttcagtgtc 4740
gtcgttgcct ggacatgcgt ttgcactccg ttggcaaaac gtctgcggcc ggagtttggg 4800
gcgatcctgc ttcgttcttg catcccatcg ttggcgtccc agtcccgcac gacttgtcat 4860
cacctgcttt ggccgctgct gcaagtgcgg attttcacga ggttggcgca ggtccctgga 4920
accccatccg actagagcgt ctggttgaag tgccggaccg ttaccctgac cccgataacc 4980
acggacgcaa aaaggcagga gccgggaaag gaggcaaggc gcatgactct cacgacgatg 5040
gcgatcacga cgaccaccac caccaccacg gagctgcccc cgcgggtgca gcggctggaa 5100
agggtaccgg tgcagctgca attggtggcg gagcgggggc tagccgtcaa cgcgtagcag 5160
gggctgctgc cgcctctgct cgtctgtgtg cgggagctcg ccgcgctggc cgtgttgtcg 5220
cgtcgccatt gcgcccagct gccgcttgcc gtggtgtggc cgtcaaggcc gcagctgctg 5280
ctgcgggtga agacgctggt gctggtacgt ctggcgtagg ttcaaatatt gttacgtctc 5340
ccggaatcgc tagcactacg gcacatggtg ttcctcgtat caatattggg gtgttcggcg 5400
tgatgaatgc aggaaagtct acacttgtga atgctctggc gcaacaggaa gcatgcattg 5460
ttgactcaac ccccggcacg accgcagatg taaaaacagt tttgcttgag cttcatgccc 5520
ttggaccagc caagttgctg gacacagccg gattagacga agtcggtgga cttggggata 5580
aaaagcgccg taaagccctg aatacgctga aggagtgcga tgttgctgtg ctggttgttg 5640
acactgatac ggcagccgcc gcaatcaaat cgggacgcct tgctgaagcc ctggaatggg 5700
aatcgaaagt aatggaacag gcacacaagt ataatgtcag tcctgtactg cttctgaatg 5760
taaaatcacg cgggctgcct gaagcgcagg cagctagcat gcttgaggcg gtcgctggta 5820
tgcttgaccc atccaagcaa atccctcgta tgtcgctgga tttagcgtcc acccccctgc 5880
acgagcgtag tacgattacg tctgcattcg tcaaggaagg agcagtgcgc agttcacgct 5940
atggggctcc tctgccgggg tgtttgcccc gttggtctct tggacgcaac gcccgcttac 6000
tgatggtaat cccgatggat gccgaaaccc caggtggacg tcttcttcgt cctcaagcgc 6060
aagttatgga ggaagcaatc cgccattggg ctaccgtgct ttccgtacgc ctggatttag 6120
acgccgcacg tggcaaattg gggcccgagg cctgtgagat ggagcgtcag cgtttcgacg 6180
gggtaattgc tatgatggaa cgtaatgacg gacccaccct ggtggtgaca gattctcaag 6240
cgatcgatgt tgtacaccct tggaccctgg accgctcatc aggacgtccg ttggttccaa 6300
ttactacctt tagcatcgct atggcgtacc aacaaaacgg cggacgtttg gacccgtttg 6360
tggaaggatt ggaagcattg gagacgttac aagatgggga tcgcgttctt atttcggaag 6420
cgtgtaatca taaccgtatc acctccgctt gcaacgacat tggaatggtg cagatcccta 6480
acaagctgga ggcagcactt ggcgggaaaa agttacaaat cgaacatgcg tttggtcgcg 6540
agtttcccga gcttgagagt gggggtatgg atggattgaa gttagcgatc cattgtggag 6600
ggtgtatgat cgacgctcag aaaatgcagc agcgtatgaa agacttgcat gaggctgggg 6660
tgccggtcac taattatggg gtgtttttct cttgggcagc ttggcccgac gcccttcgtc 6720
gcgcattgga accgtgggga gtggagccac cggtaggtac tcctgctacc cccgcagccg 6780
cgcctgctac ggcagcgtcc ggggtataat actactagag ggctttacac tttatgcttc 6840
cggctcgtat gttgtgtgga aagaaggaga tatacatatg tcggtccccc tacagtgcaa 6900
tgcaggccgt cttttggcgg gccagcgccc ctgcggcgtc cgcgcgcgtc tgaaccgccg 6960
tgtatgtgtt ccagtgaccg cacacggcaa agcatctgcc acgcgcgaat acgctggtga 7020
ctttcttcca gggaccacta ttagtcatgc gtggtccgtg gagcgtgaaa ctcatcaccg 7080
ttatcgtaat ccggccgagt ggattaacga ggctgccatc cacaaggcgc ttgaaacgtc 7140
aaaggctgat gctcaggacg caggacgcgt gcgtgagatt ttggcgaagg ctaaggaaaa 7200
ggcttttgtt actgaacatg cgcctgtaaa tgcggaaagt aaatccgaat ttgtacaagg 7260
gcttaccttg gaggagtgcg ccaccttaat taacgttgat tctaataatg tcgagttgat 7320
gaatgaaatc ttcgacactg cgcttgctat caaagaacgt atctacggga accgcgtcgt 7380
gctgttcgcg cccttgtaca ttgctaatca ttgtatgaac acttgcactt attgtgcgtt 7440
tcgctcagcc aataagggca tggaacgctc tattctgaca gacgatgacc tgcgtgaaga 7500
agttgccgcc ttgcaacgtc aaggtcatcg ccgcatttta gcccttactg gagaacatcc 7560
taaatacact ttcgacaatt tcttgcatgc agtcaatgta atcgcttccg tgaagacaga 7620
gcctgaaggg tccattcgcc gtatcaatgt cgaaatccca ccacttagtg tctcagacat 7680
gcgccgcctt aagaatacag attcagttgg cacgttcgtt ctgtttcaag agacatatca 7740
ccgcgacaca ttcaaggtaa tgcatccgtc aggtccaaag agcgactttg attttcgcgt 7800
cttgacccag gaccgcgcca tgcgcgcagg cttggacgat gttggtattg gtgctttatt 7860
cgggttatat gattaccgtt atgaagtttg cgccatgtta atgcatagcg agcatttgga 7920
acgtgagtac aacgcaggac cacatactat ctctgttccc cgtatgcgcc ccgcggacgg 7980
aagcgagctt agtatcgcgc ctccttatcc tgttaatgat gctgatttta tgaaattagt 8040
tgcggtcctt cgtattgctg taccatacac aggtatgatc cttagcactc gtgaatcacc 8100
agaaatgcgc tcggcgcttc tgaagtgtgg gatgagtcaa atgagtgccg gctcgcgcac 8160
tgatgtagga gcctatcaca aagatcacac gttaagtaca gaggcgaatt tgagtaagtt 8220
agctgggcag tttaccttgc aggatgaacg tccaactaat gagattgtta agtggctgat 8280
ggaggagggc tatgtcccgt cttggtgcac agcttgttac cgtcaaggtc gtacgggcga 8340
agacttcatg aacatctgta aggctggtga cattcacgat ttctgtcatc ccaatagtct 8400
gcttacgctt caagagtacc ttatggatta tgcagatcca gaccttcgta agaaaggcga 8460
gcaagtaatt gcccgtgaga tgggaccgga cgcctctgag ccgttatcgg cgcaaagccg 8520
taagcgcctt gaacgcaaga tgaaacaagt attggagggg gagcacgatg tatatcttta 8580
accaggcatc aaataaaacg aaaggctcag tcgaaagact gggcctttcg ttttatctgt 8640
tgtttgtcgg tgaacgctct ctactagagt cacactggct caccttcggg tgggcctttc 8700
tgcgtttata 8710
<210> 34
<211> 8704
<212> DNA
<213> Artificial Sequence
<220>
<223> Exemplary HPGC (hydrogen producing gene cluster) with codon
optimised nucleic acid sequence encoding HydA (Hyd1) from
Ilyobacter,polytrophus 5' - 3'
<400> 34
ctagagggct ttacacttta tgcttccggc tcgtatgttg tgtggaaaga aggagatata 60
catatggcga tgcgttccac atttgctgcg cgtgtcggtg ccaaaccggc agtgcgtggg 120
gcgcgtcccg cgtcgcgtat gtcttgcatg gcctataagg ttacactgaa aacgccatca 180
ggcgataaaa caatcgaatg tccggcggac acctatatcc tggatgctgc ggaggaagcc 240
gggctggacc ttccctatag ttgccgtgcg ggcgcctgtt catcctgtgc tggcaaagtg 300
gcagctggaa cggtagatca atctgatcag tcctttctgg atgacgctca gatggggaac 360
ggattcgtcc tgacatgtgt cgcgtatcct acaagcgact gcactatcca aactcaccaa 420
gaggaggctt tatattaaaa gaaggagata tacatatgca aactgttcgc gctccagcag 480
cttcaggtgt tgccacacgt gtcgcaggtc gtcgtatgtg tcgtccggtt gcggcgacga 540
aggcttccac ggctgttacc acagacatgt cgaagcgcac tgttccaacc aagttagagg 600
aaggtgaaat gccgttgaac acgtacagta ataaagctcc gttcaaggca aaggttcgtt 660
ccgtggaaaa aatcacagga ccaaaagcca caggtgagac gtgccacatc attattgaaa 720
ccgaggggaa gatcccgttt tgggagggac aatcgtacgg tgtaattccg ccggggacca 780
agatcaactc taagggaaaa gaagtgcctc atggtactcg tctttattcg attgcttcta 840
gtcgttacgg agatgacttc gatggtcaaa cggcatcgct gtgtgttcgc cgcgcggtat 900
acgtcgatcc agagactgga aaggaggacc ccgcgaaaaa aggactgtgt agtaactttt 960
tgtgtgatgc cacaccaggc acggaaattt ccatgacagg gcccacagga aaagtattgc 1020
ttctgccagc agacgcgaac gcgccattaa tctgtgtcgc aacggggact ggaatcgcgc 1080
cttttcgctc attctggcgc cgttgcttca tcgagaatgt cccaagttat aagttcactg 1140
gccttttctg gttgtttatg ggtgtcgcta actctgatgc taaattgtac gatgaggaac 1200
tgcaagctat cgcaaaagcg tatccgggac aattccgcct ggactatgcc ttgtctcgtg 1260
aacaaaataa tcgcaagggc gggaaaatgt acatccaaga taaggttgaa gagtatgccg 1320
acgaaatttt cgatttattg gataatgggg cgcacatgta cttctgcggg ttaaagggga 1380
tgatgccagg catccaagat atgttagaac gcgttgcaaa agaaaagggg ctgaactacg 1440
aagagtgggt cgaggggtta aagcacaaga atcaatggca tgttgaagtc tactaaccag 1500
gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta tctgttgttt 1560
gtcggtgaac gctctctact agagtcacac tggctcacct tcgggtgggc ctttctgcgt 1620
ttatatacta gagggcttta cactttatgc ttccggctcg tatgttgtgt ggaaagaagg 1680
agatatacat atgtccgcat tagtacttaa gcccgggatg aagaacaaaa cagtatcaaa 1740
tgataaaata gacaataaac tgaactgctc cgaaaacctg gaaaaccgta ccatcgacaa 1800
aagcttctac accttttcac gtgataccag caagtgcatt aagtgctaca agtgcgtgaa 1860
agtttgcaag gacactcagg gcatttccgt ttttcaggtt gaggaggacg gcacggtggg 1920
catcaaagag gagaatatgg cggccacctt gtgtatcagc tgtggtcaat gtattaaagt 1980
gtgcaccgca ggtgcgctga aggagaaatc caacatctct ctgttgaagg agcagttaaa 2040
taacccgaat aagcacgttg tcgcgcagct gtctccaagc ttcaaacaca ccattggtga 2100
tggcttcggc atcagctcgg gtaccgatac ttccccgaaa atcatcagcg ctctgaaaga 2160
aattggtttc tctaaggttt tcagtaccgg tttcgccagc gacgtgaata tcgttgagac 2220
cagcgcggat ctgaaaaaac gcctagatga aaacggtccg ttcccggtgt tcacctccac 2280
gtgcacgggt tggattaact atgcggaaaa gttttgtccg gagttcctgg ggctgctctc 2340
tccgtgcaaa agcccgcaac agatcctggg tagcctgagc aagtcctact acgaagagag 2400
cattgacatc agcagagaaa atatctttag cgtggcgctg atgccttgca tcgccaaaaa 2460
ggatgaagct aatcgttttg acatgaagga cgaatatggt aacaaagatg tggacctggt 2520
cctgaccgtg aatgaagttg ctagcctttt gaacaaaaag ggcattgatt taaacaatta 2580
ctctaagttc ggtacttttg ataagccgat gaaatccgac actggttctt cgcgtattaa 2640
ggcggttacg ggtggcctgg cagaggctat cctgcgcaac accgcacaca tgatcggtga 2700
agatccgttt tctgtagacc tgaagaagct gcgtggtatg gatggtatta agctcacgag 2760
cgtggttctg ggcgggaaaa aattaaacat tgcggtcgtg aacggcatca agaacgtgcc 2820
ggttattctg gacatgatta aagatggcat taccgagttc cacttggtcg aggttatggc 2880
ctgtccgggt ggctgcgtcg gcggcggtgg tatcccgttg tcagaagacc cggacattat 2940
ccaaaaacgc gcagagaaaa tctactcgta cgacgcgagc agcgaaattc gttgtagctg 3000
ggaaaaccca gatgttaaaa ccctgtatag cgagtacctg aaggagccgc tgggagagga 3060
gtctcaacgt ttgtttcatt ttcattataa aaaccgccgt accaaacgta tcttctaggg 3120
atccgggtcg aggagaagga tgagaaaaag tgaccaggca tcaaataaaa cgaaaggctc 3180
agtcgaaaga ctgggccttt cgttttatct gttgtttgtc ggtgaacgct ctctactaga 3240
gtcacactgg ctcaccttcg ggtgggcctt tctgcgttta tatactagag ggctttacac 3300
tttatgcttc cggctcgtat gttgtgtgga aagaaggaga tatacatatg gctcatagtt 3360
taagcgcaca ttcccgtcag gccggagatc gcaaactggg cgcaggtgcg gcatctagcc 3420
gcccatcatg tccttctcgc cgcattgtcc gcgtggcggc ccatgcttct gcgtccaagg 3480
cgactcccga tgtacctgtt gacgatcttc ctcctgcgca tgcccgtgca gcagtagcgg 3540
ccgctaaccg tcgtgcgcgc gctatggcat cagcggaggc cgcggcagag accctgggcg 3600
atttcctggg cttagggaag ggggggcttt cgccgggcgc aaccgccaac cttgatcgtg 3660
agcaagtatt aggtgtgttg gaggcggtct ggcgtcgtgg agaccttaat ctggagcgtg 3720
cgttgtacag ccatgccaat gcggtgacta acaaatactg tggtgggggg gtctactatc 3780
gcggccttgt ggagttcagt aatatttgcc aaaacgattg ctcatattgt gggattcgca 3840
acaatcaaaa agaagtttgg cgctatacta tgccggttga agaggtggtc gaggtagcta 3900
agtgggcgct tgaaaacggc attcgcaaca ttatgttgca agggggtgaa ttaaagacag 3960
agcaacgctt agcctacttg gaggcatgcg tccgtgcgat tcgcgaggag acaacgcagt 4020
tagaccttga aatgcgcgca cgtgccgcga gtacgacaac agcggaagcg gcagccagtg 4080
cacaggcaga cgccgaagct aaacgcggcg agccagaatt gggtgtggtc gtatccttaa 4140
gcgtcggaga acttcctatg gaacagtatg agcgtttgtt ccgcgccggc gcccgtcgct 4200
atctgatccg cattgaaacc tcgaatcccg acctgtacgc ggcacttcac ccggagccga 4260
tgtcctggca cgcgcgtgta gaatgcctgc gcaacctgaa gaaagctggg tatatgttgg 4320
gcacaggagt gatggtcggc ttgccgggac aaaccttaca cgacctggct ggggatgtca 4380
tgttctttcg cgacattaaa gcggacatga tcggtatggg ccccttcatt acgcagcctg 4440
ggacgcctgc aactgataag tggaccgcgc tgtatccgaa cgccaataag aacagccaca 4500
tgaaatctat gttcgatctg accactgcta tgaatgcact tgtacgtatt acgatgggga 4560
acgtaaatat cagtgctacg actgcattac aagcgattat ccccactgga cgtgaaattg 4620
cgcttgagcg cggcgcaaat gttgtcatgc ctattttaac gcctactcag tatcgcgagt 4680
cctatcagtt atatgagggt aagccctgca ttacggatac tgctgttcag tgtcgtcgtt 4740
gcctggacat gcgtttgcac tccgttggca aaacgtctgc ggccggagtt tggggcgatc 4800
ctgcttcgtt cttgcatccc atcgttggcg tcccagtccc gcacgacttg tcatcacctg 4860
ctttggccgc tgctgcaagt gcggattttc acgaggttgg cgcaggtccc tggaacccca 4920
tccgactaga gcgtctggtt gaagtgccgg accgttaccc tgaccccgat aaccacggac 4980
gcaaaaaggc aggagccggg aaaggaggca aggcgcatga ctctcacgac gatggcgatc 5040
acgacgacca ccaccaccac cacggagctg cccccgcggg tgcagcggct ggaaagggta 5100
ccggtgcagc tgcaattggt ggcggagcgg gggctagccg tcaacgcgta gcaggggctg 5160
ctgccgcctc tgctcgtctg tgtgcgggag ctcgccgcgc tggccgtgtt gtcgcgtcgc 5220
cattgcgccc agctgccgct tgccgtggtg tggccgtcaa ggccgcagct gctgctgcgg 5280
gtgaagacgc tggtgctggt acgtctggcg taggttcaaa tattgttacg tctcccggaa 5340
tcgctagcac tacggcacat ggtgttcctc gtatcaatat tggggtgttc ggcgtgatga 5400
atgcaggaaa gtctacactt gtgaatgctc tggcgcaaca ggaagcatgc attgttgact 5460
caacccccgg cacgaccgca gatgtaaaaa cagttttgct tgagcttcat gcccttggac 5520
cagccaagtt gctggacaca gccggattag acgaagtcgg tggacttggg gataaaaagc 5580
gccgtaaagc cctgaatacg ctgaaggagt gcgatgttgc tgtgctggtt gttgacactg 5640
atacggcagc cgccgcaatc aaatcgggac gccttgctga agccctggaa tgggaatcga 5700
aagtaatgga acaggcacac aagtataatg tcagtcctgt actgcttctg aatgtaaaat 5760
cacgcgggct gcctgaagcg caggcagcta gcatgcttga ggcggtcgct ggtatgcttg 5820
acccatccaa gcaaatccct cgtatgtcgc tggatttagc gtccaccccc ctgcacgagc 5880
gtagtacgat tacgtctgca ttcgtcaagg aaggagcagt gcgcagttca cgctatgggg 5940
ctcctctgcc ggggtgtttg ccccgttggt ctcttggacg caacgcccgc ttactgatgg 6000
taatcccgat ggatgccgaa accccaggtg gacgtcttct tcgtcctcaa gcgcaagtta 6060
tggaggaagc aatccgccat tgggctaccg tgctttccgt acgcctggat ttagacgccg 6120
cacgtggcaa attggggccc gaggcctgtg agatggagcg tcagcgtttc gacggggtaa 6180
ttgctatgat ggaacgtaat gacggaccca ccctggtggt gacagattct caagcgatcg 6240
atgttgtaca cccttggacc ctggaccgct catcaggacg tccgttggtt ccaattacta 6300
cctttagcat cgctatggcg taccaacaaa acggcggacg tttggacccg tttgtggaag 6360
gattggaagc attggagacg ttacaagatg gggatcgcgt tcttatttcg gaagcgtgta 6420
atcataaccg tatcacctcc gcttgcaacg acattggaat ggtgcagatc cctaacaagc 6480
tggaggcagc acttggcggg aaaaagttac aaatcgaaca tgcgtttggt cgcgagtttc 6540
ccgagcttga gagtgggggt atggatggat tgaagttagc gatccattgt ggagggtgta 6600
tgatcgacgc tcagaaaatg cagcagcgta tgaaagactt gcatgaggct ggggtgccgg 6660
tcactaatta tggggtgttt ttctcttggg cagcttggcc cgacgccctt cgtcgcgcat 6720
tggaaccgtg gggagtggag ccaccggtag gtactcctgc tacccccgca gccgcgcctg 6780
ctacggcagc gtccggggta taatactact agagggcttt acactttatg cttccggctc 6840
gtatgttgtg tggaaagaag gagatataca tatgtcggtc cccctacagt gcaatgcagg 6900
ccgtcttttg gcgggccagc gcccctgcgg cgtccgcgcg cgtctgaacc gccgtgtatg 6960
tgttccagtg accgcacacg gcaaagcatc tgccacgcgc gaatacgctg gtgactttct 7020
tccagggacc actattagtc atgcgtggtc cgtggagcgt gaaactcatc accgttatcg 7080
taatccggcc gagtggatta acgaggctgc catccacaag gcgcttgaaa cgtcaaaggc 7140
tgatgctcag gacgcaggac gcgtgcgtga gattttggcg aaggctaagg aaaaggcttt 7200
tgttactgaa catgcgcctg taaatgcgga aagtaaatcc gaatttgtac aagggcttac 7260
cttggaggag tgcgccacct taattaacgt tgattctaat aatgtcgagt tgatgaatga 7320
aatcttcgac actgcgcttg ctatcaaaga acgtatctac gggaaccgcg tcgtgctgtt 7380
cgcgcccttg tacattgcta atcattgtat gaacacttgc acttattgtg cgtttcgctc 7440
agccaataag ggcatggaac gctctattct gacagacgat gacctgcgtg aagaagttgc 7500
cgccttgcaa cgtcaaggtc atcgccgcat tttagccctt actggagaac atcctaaata 7560
cactttcgac aatttcttgc atgcagtcaa tgtaatcgct tccgtgaaga cagagcctga 7620
agggtccatt cgccgtatca atgtcgaaat cccaccactt agtgtctcag acatgcgccg 7680
ccttaagaat acagattcag ttggcacgtt cgttctgttt caagagacat atcaccgcga 7740
cacattcaag gtaatgcatc cgtcaggtcc aaagagcgac tttgattttc gcgtcttgac 7800
ccaggaccgc gccatgcgcg caggcttgga cgatgttggt attggtgctt tattcgggtt 7860
atatgattac cgttatgaag tttgcgccat gttaatgcat agcgagcatt tggaacgtga 7920
gtacaacgca ggaccacata ctatctctgt tccccgtatg cgccccgcgg acggaagcga 7980
gcttagtatc gcgcctcctt atcctgttaa tgatgctgat tttatgaaat tagttgcggt 8040
ccttcgtatt gctgtaccat acacaggtat gatccttagc actcgtgaat caccagaaat 8100
gcgctcggcg cttctgaagt gtgggatgag tcaaatgagt gccggctcgc gcactgatgt 8160
aggagcctat cacaaagatc acacgttaag tacagaggcg aatttgagta agttagctgg 8220
gcagtttacc ttgcaggatg aacgtccaac taatgagatt gttaagtggc tgatggagga 8280
gggctatgtc ccgtcttggt gcacagcttg ttaccgtcaa ggtcgtacgg gcgaagactt 8340
catgaacatc tgtaaggctg gtgacattca cgatttctgt catcccaata gtctgcttac 8400
gcttcaagag taccttatgg attatgcaga tccagacctt cgtaagaaag gcgagcaagt 8460
aattgcccgt gagatgggac cggacgcctc tgagccgtta tcggcgcaaa gccgtaagcg 8520
ccttgaacgc aagatgaaac aagtattgga gggggagcac gatgtatatc tttaaccagg 8580
catcaaataa aacgaaaggc tcagtcgaaa gactgggcct ttcgttttat ctgttgtttg 8640
tcggtgaacg ctctctacta gagtcacact ggctcacctt cgggtgggcc tttctgcgtt 8700
tata 8704
<210> 35
<211> 8797
<212> DNA
<213> Artificial Sequence
<220>
<223> Exemplary HPGC (hydrogen producing gene cluster) with codon
optimised nucleic acid sequence encoding HydA (Hyd1) from Volvox
carteri, 5' - 3'
<400> 35
ctagagggct ttacacttta tgcttccggc tcgtatgttg tgtggaaaga aggagatata 60
catatggcga tgcgttccac atttgctgcg cgtgtcggtg ccaaaccggc agtgcgtggg 120
gcgcgtcccg cgtcgcgtat gtcttgcatg gcctataagg ttacactgaa aacgccatca 180
ggcgataaaa caatcgaatg tccggcggac acctatatcc tggatgctgc ggaggaagcc 240
gggctggacc ttccctatag ttgccgtgcg ggcgcctgtt catcctgtgc tggcaaagtg 300
gcagctggaa cggtagatca atctgatcag tcctttctgg atgacgctca gatggggaac 360
ggattcgtcc tgacatgtgt cgcgtatcct acaagcgact gcactatcca aactcaccaa 420
gaggaggctt tatattaaaa gaaggagata tacatatgca aactgttcgc gctccagcag 480
cttcaggtgt tgccacacgt gtcgcaggtc gtcgtatgtg tcgtccggtt gcggcgacga 540
aggcttccac ggctgttacc acagacatgt cgaagcgcac tgttccaacc aagttagagg 600
aaggtgaaat gccgttgaac acgtacagta ataaagctcc gttcaaggca aaggttcgtt 660
ccgtggaaaa aatcacagga ccaaaagcca caggtgagac gtgccacatc attattgaaa 720
ccgaggggaa gatcccgttt tgggagggac aatcgtacgg tgtaattccg ccggggacca 780
agatcaactc taagggaaaa gaagtgcctc atggtactcg tctttattcg attgcttcta 840
gtcgttacgg agatgacttc gatggtcaaa cggcatcgct gtgtgttcgc cgcgcggtat 900
acgtcgatcc agagactgga aaggaggacc ccgcgaaaaa aggactgtgt agtaactttt 960
tgtgtgatgc cacaccaggc acggaaattt ccatgacagg gcccacagga aaagtattgc 1020
ttctgccagc agacgcgaac gcgccattaa tctgtgtcgc aacggggact ggaatcgcgc 1080
cttttcgctc attctggcgc cgttgcttca tcgagaatgt cccaagttat aagttcactg 1140
gccttttctg gttgtttatg ggtgtcgcta actctgatgc taaattgtac gatgaggaac 1200
tgcaagctat cgcaaaagcg tatccgggac aattccgcct ggactatgcc ttgtctcgtg 1260
aacaaaataa tcgcaagggc gggaaaatgt acatccaaga taaggttgaa gagtatgccg 1320
acgaaatttt cgatttattg gataatgggg cgcacatgta cttctgcggg ttaaagggga 1380
tgatgccagg catccaagat atgttagaac gcgttgcaaa agaaaagggg ctgaactacg 1440
aagagtgggt cgaggggtta aagcacaaga atcaatggca tgttgaagtc tactaaccag 1500
gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta tctgttgttt 1560
gtcggtgaac gctctctact agagtcacac tggctcacct tcgggtgggc ctttctgcgt 1620
ttatatacta gagggcttta cactttatgc ttccggctcg tatgttgtgt ggaaagaagg 1680
agatatacat atgtccgcat tagtacttaa gcccgggatg agtgctatgc tatcttcatt 1740
aacaaattct cgcttgggcg cttacgtgcc gcaagtggcg gtaagccgtt atggttccaa 1800
gccggtctac gtcccgtgcg tgccgtttcg taagtgcacc tcggcggtgc cagtgccggt 1860
taagacggtg caagaaggta attcggtcag acttatgcca gcggcggcgg ctccggcggg 1920
tgcggcagcg gacccacatt ggaaacaagc atttgcagag cttgataaac cgaaagccga 1980
acgtaaagtt atgatcgcac aggttgctcc ggcggtgcgc gttgccatct ccgagagctt 2040
tggtctggca ccgggggcta ccactccggg tcagctggcc gagtccctgc gttgtctggg 2100
ttttgatatg gtgttcgaca ccttgtacgg cgcggacctg accattatgg aagagggcac 2160
tgagttgctg tcccgtctgc aagcgcaatt ggaagcccac ccgcatagcg aagaaccgct 2220
gccgatgttt accagctgct gtccgggctg gatcgccctg ttggagaaga gctatccgga 2280
attaattccg tatgtgtcta gctgcaagtc tccgcagatg atgttaggcg ctatggtgaa 2340
gacctatctg gcagagaaga aaggcatctc tccgagcgac atctccatgg tttcgattat 2400
gccgtgtgtg aggaagcaag gtgaagcgga ccgtgattgg ttttgcagcg gcggcgccgg 2460
cgttcgtgat gtggaccacg ttattaccac ggcggagcta ggcaacatcc tgaaagaacg 2520
taatatcaac ctccccgaac tgccggaagg cggttgggat gagccgctgg gttcgggtag 2580
cggtgcgggc gtcgttttcg gtacaaccgg tggtgttatg gaagcggcgc tgcgcaccgc 2640
gtacgagttg gttacccagc aaccgctgcc tcgtttgaat ctgagtgagg ttcgcggtat 2700
ggacggcatt aaagaaaccg aaatcaagat ggttccgcct ccgggtagca aattcgccga 2760
gcttgttgcc gcacgtgcag cggcgaaggc tatggatgaa gcggccgcga gcgcaggcgc 2820
gattaagtgg gatggtggca gcaacttcac cgcggacgac ggtgctaagg gcatcaccct 2880
gcgcgtggcc gtggctaatg gtctgggaaa cgcgaaaaag ctgctgacga aaatgcagac 2940
cggtgagtgc aaatacgact tcgtggaaat tatggcatgt ccgtctgggt gcgttggtgg 3000
tggtggtcag ccgcgcagca ccgataaaca ggtggcggtc aaacgtcagc aggcactgta 3060
cgaccttgac gagcgcgcaa cgatccgtcg tagccacgag aacccggctg tccaaaaagc 3120
gtacgaagat ttcctgggcg agccgaacag ccacaaagcg cacgatctgt tgcacaccca 3180
ttatgttccg ggtggcgttg acacggagta gggatccggg tcgaggagaa ggatgagaaa 3240
aagtgaccag gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta 3300
tctgttgttt gtcggtgaac gctctctact agagtcacac tggctcacct tcgggtgggc 3360
ctttctgcgt ttatatacta gagggcttta cactttatgc ttccggctcg tatgttgtgt 3420
ggaaagaagg agatatacat atggctcata gtttaagcgc acattcccgt caggccggag 3480
atcgcaaact gggcgcaggt gcggcatcta gccgcccatc atgtccttct cgccgcattg 3540
tccgcgtggc ggcccatgct tctgcgtcca aggcgactcc cgatgtacct gttgacgatc 3600
ttcctcctgc gcatgcccgt gcagcagtag cggccgctaa ccgtcgtgcg cgcgctatgg 3660
catcagcgga ggccgcggca gagaccctgg gcgatttcct gggcttaggg aagggggggc 3720
tttcgccggg cgcaaccgcc aaccttgatc gtgagcaagt attaggtgtg ttggaggcgg 3780
tctggcgtcg tggagacctt aatctggagc gtgcgttgta cagccatgcc aatgcggtga 3840
ctaacaaata ctgtggtggg ggggtctact atcgcggcct tgtggagttc agtaatattt 3900
gccaaaacga ttgctcatat tgtgggattc gcaacaatca aaaagaagtt tggcgctata 3960
ctatgccggt tgaagaggtg gtcgaggtag ctaagtgggc gcttgaaaac ggcattcgca 4020
acattatgtt gcaagggggt gaattaaaga cagagcaacg cttagcctac ttggaggcat 4080
gcgtccgtgc gattcgcgag gagacaacgc agttagacct tgaaatgcgc gcacgtgccg 4140
cgagtacgac aacagcggaa gcggcagcca gtgcacaggc agacgccgaa gctaaacgcg 4200
gcgagccaga attgggtgtg gtcgtatcct taagcgtcgg agaacttcct atggaacagt 4260
atgagcgttt gttccgcgcc ggcgcccgtc gctatctgat ccgcattgaa acctcgaatc 4320
ccgacctgta cgcggcactt cacccggagc cgatgtcctg gcacgcgcgt gtagaatgcc 4380
tgcgcaacct gaagaaagct gggtatatgt tgggcacagg agtgatggtc ggcttgccgg 4440
gacaaacctt acacgacctg gctggggatg tcatgttctt tcgcgacatt aaagcggaca 4500
tgatcggtat gggccccttc attacgcagc ctgggacgcc tgcaactgat aagtggaccg 4560
cgctgtatcc gaacgccaat aagaacagcc acatgaaatc tatgttcgat ctgaccactg 4620
ctatgaatgc acttgtacgt attacgatgg ggaacgtaaa tatcagtgct acgactgcat 4680
tacaagcgat tatccccact ggacgtgaaa ttgcgcttga gcgcggcgca aatgttgtca 4740
tgcctatttt aacgcctact cagtatcgcg agtcctatca gttatatgag ggtaagccct 4800
gcattacgga tactgctgtt cagtgtcgtc gttgcctgga catgcgtttg cactccgttg 4860
gcaaaacgtc tgcggccgga gtttggggcg atcctgcttc gttcttgcat cccatcgttg 4920
gcgtcccagt cccgcacgac ttgtcatcac ctgctttggc cgctgctgca agtgcggatt 4980
ttcacgaggt tggcgcaggt ccctggaacc ccatccgact agagcgtctg gttgaagtgc 5040
cggaccgtta ccctgacccc gataaccacg gacgcaaaaa ggcaggagcc gggaaaggag 5100
gcaaggcgca tgactctcac gacgatggcg atcacgacga ccaccaccac caccacggag 5160
ctgcccccgc gggtgcagcg gctggaaagg gtaccggtgc agctgcaatt ggtggcggag 5220
cgggggctag ccgtcaacgc gtagcagggg ctgctgccgc ctctgctcgt ctgtgtgcgg 5280
gagctcgccg cgctggccgt gttgtcgcgt cgccattgcg cccagctgcc gcttgccgtg 5340
gtgtggccgt caaggccgca gctgctgctg cgggtgaaga cgctggtgct ggtacgtctg 5400
gcgtaggttc aaatattgtt acgtctcccg gaatcgctag cactacggca catggtgttc 5460
ctcgtatcaa tattggggtg ttcggcgtga tgaatgcagg aaagtctaca cttgtgaatg 5520
ctctggcgca acaggaagca tgcattgttg actcaacccc cggcacgacc gcagatgtaa 5580
aaacagtttt gcttgagctt catgcccttg gaccagccaa gttgctggac acagccggat 5640
tagacgaagt cggtggactt ggggataaaa agcgccgtaa agccctgaat acgctgaagg 5700
agtgcgatgt tgctgtgctg gttgttgaca ctgatacggc agccgccgca atcaaatcgg 5760
gacgccttgc tgaagccctg gaatgggaat cgaaagtaat ggaacaggca cacaagtata 5820
atgtcagtcc tgtactgctt ctgaatgtaa aatcacgcgg gctgcctgaa gcgcaggcag 5880
ctagcatgct tgaggcggtc gctggtatgc ttgacccatc caagcaaatc cctcgtatgt 5940
cgctggattt agcgtccacc cccctgcacg agcgtagtac gattacgtct gcattcgtca 6000
aggaaggagc agtgcgcagt tcacgctatg gggctcctct gccggggtgt ttgccccgtt 6060
ggtctcttgg acgcaacgcc cgcttactga tggtaatccc gatggatgcc gaaaccccag 6120
gtggacgtct tcttcgtcct caagcgcaag ttatggagga agcaatccgc cattgggcta 6180
ccgtgctttc cgtacgcctg gatttagacg ccgcacgtgg caaattgggg cccgaggcct 6240
gtgagatgga gcgtcagcgt ttcgacgggg taattgctat gatggaacgt aatgacggac 6300
ccaccctggt ggtgacagat tctcaagcga tcgatgttgt acacccttgg accctggacc 6360
gctcatcagg acgtccgttg gttccaatta ctacctttag catcgctatg gcgtaccaac 6420
aaaacggcgg acgtttggac ccgtttgtgg aaggattgga agcattggag acgttacaag 6480
atggggatcg cgttcttatt tcggaagcgt gtaatcataa ccgtatcacc tccgcttgca 6540
acgacattgg aatggtgcag atccctaaca agctggaggc agcacttggc gggaaaaagt 6600
tacaaatcga acatgcgttt ggtcgcgagt ttcccgagct tgagagtggg ggtatggatg 6660
gattgaagtt agcgatccat tgtggagggt gtatgatcga cgctcagaaa atgcagcagc 6720
gtatgaaaga cttgcatgag gctggggtgc cggtcactaa ttatggggtg tttttctctt 6780
gggcagcttg gcccgacgcc cttcgtcgcg cattggaacc gtggggagtg gagccaccgg 6840
taggtactcc tgctaccccc gcagccgcgc ctgctacggc agcgtccggg gtataatact 6900
actagagggc tttacacttt atgcttccgg ctcgtatgtt gtgtggaaag aaggagatat 6960
acatatgtcg gtccccctac agtgcaatgc aggccgtctt ttggcgggcc agcgcccctg 7020
cggcgtccgc gcgcgtctga accgccgtgt atgtgttcca gtgaccgcac acggcaaagc 7080
atctgccacg cgcgaatacg ctggtgactt tcttccaggg accactatta gtcatgcgtg 7140
gtccgtggag cgtgaaactc atcaccgtta tcgtaatccg gccgagtgga ttaacgaggc 7200
tgccatccac aaggcgcttg aaacgtcaaa ggctgatgct caggacgcag gacgcgtgcg 7260
tgagattttg gcgaaggcta aggaaaaggc ttttgttact gaacatgcgc ctgtaaatgc 7320
ggaaagtaaa tccgaatttg tacaagggct taccttggag gagtgcgcca ccttaattaa 7380
cgttgattct aataatgtcg agttgatgaa tgaaatcttc gacactgcgc ttgctatcaa 7440
agaacgtatc tacgggaacc gcgtcgtgct gttcgcgccc ttgtacattg ctaatcattg 7500
tatgaacact tgcacttatt gtgcgtttcg ctcagccaat aagggcatgg aacgctctat 7560
tctgacagac gatgacctgc gtgaagaagt tgccgccttg caacgtcaag gtcatcgccg 7620
cattttagcc cttactggag aacatcctaa atacactttc gacaatttct tgcatgcagt 7680
caatgtaatc gcttccgtga agacagagcc tgaagggtcc attcgccgta tcaatgtcga 7740
aatcccacca cttagtgtct cagacatgcg ccgccttaag aatacagatt cagttggcac 7800
gttcgttctg tttcaagaga catatcaccg cgacacattc aaggtaatgc atccgtcagg 7860
tccaaagagc gactttgatt ttcgcgtctt gacccaggac cgcgccatgc gcgcaggctt 7920
ggacgatgtt ggtattggtg ctttattcgg gttatatgat taccgttatg aagtttgcgc 7980
catgttaatg catagcgagc atttggaacg tgagtacaac gcaggaccac atactatctc 8040
tgttccccgt atgcgccccg cggacggaag cgagcttagt atcgcgcctc cttatcctgt 8100
taatgatgct gattttatga aattagttgc ggtccttcgt attgctgtac catacacagg 8160
tatgatcctt agcactcgtg aatcaccaga aatgcgctcg gcgcttctga agtgtgggat 8220
gagtcaaatg agtgccggct cgcgcactga tgtaggagcc tatcacaaag atcacacgtt 8280
aagtacagag gcgaatttga gtaagttagc tgggcagttt accttgcagg atgaacgtcc 8340
aactaatgag attgttaagt ggctgatgga ggagggctat gtcccgtctt ggtgcacagc 8400
ttgttaccgt caaggtcgta cgggcgaaga cttcatgaac atctgtaagg ctggtgacat 8460
tcacgatttc tgtcatccca atagtctgct tacgcttcaa gagtacctta tggattatgc 8520
agatccagac cttcgtaaga aaggcgagca agtaattgcc cgtgagatgg gaccggacgc 8580
ctctgagccg ttatcggcgc aaagccgtaa gcgccttgaa cgcaagatga aacaagtatt 8640
ggagggggag cacgatgtat atctttaacc aggcatcaaa taaaacgaaa ggctcagtcg 8700
aaagactggg cctttcgttt tatctgttgt ttgtcggtga acgctctcta ctagagtcac 8760
actggctcac cttcgggtgg gcctttctgc gtttata 8797
<210> 36
<211> 8710
<212> DNA
<213> Artificial Sequence
<220>
<223> Exemplary HPGC (hydrogen producing gene cluster) with codon
optimised nucleic acid sequence encoding HydA (Hyd1) from
Trichomonas vaginalis, 5' - 3'
<400> 36
ctagagggct ttacacttta tgcttccggc tcgtatgttg tgtggaaaga aggagatata 60
catatggcga tgcgttccac atttgctgcg cgtgtcggtg ccaaaccggc agtgcgtggg 120
gcgcgtcccg cgtcgcgtat gtcttgcatg gcctataagg ttacactgaa aacgccatca 180
ggcgataaaa caatcgaatg tccggcggac acctatatcc tggatgctgc ggaggaagcc 240
gggctggacc ttccctatag ttgccgtgcg ggcgcctgtt catcctgtgc tggcaaagtg 300
gcagctggaa cggtagatca atctgatcag tcctttctgg atgacgctca gatggggaac 360
ggattcgtcc tgacatgtgt cgcgtatcct acaagcgact gcactatcca aactcaccaa 420
gaggaggctt tatattaaaa gaaggagata tacatatgca aactgttcgc gctccagcag 480
cttcaggtgt tgccacacgt gtcgcaggtc gtcgtatgtg tcgtccggtt gcggcgacga 540
aggcttccac ggctgttacc acagacatgt cgaagcgcac tgttccaacc aagttagagg 600
aaggtgaaat gccgttgaac acgtacagta ataaagctcc gttcaaggca aaggttcgtt 660
ccgtggaaaa aatcacagga ccaaaagcca caggtgagac gtgccacatc attattgaaa 720
ccgaggggaa gatcccgttt tgggagggac aatcgtacgg tgtaattccg ccggggacca 780
agatcaactc taagggaaaa gaagtgcctc atggtactcg tctttattcg attgcttcta 840
gtcgttacgg agatgacttc gatggtcaaa cggcatcgct gtgtgttcgc cgcgcggtat 900
acgtcgatcc agagactgga aaggaggacc ccgcgaaaaa aggactgtgt agtaactttt 960
tgtgtgatgc cacaccaggc acggaaattt ccatgacagg gcccacagga aaagtattgc 1020
ttctgccagc agacgcgaac gcgccattaa tctgtgtcgc aacggggact ggaatcgcgc 1080
cttttcgctc attctggcgc cgttgcttca tcgagaatgt cccaagttat aagttcactg 1140
gccttttctg gttgtttatg ggtgtcgcta actctgatgc taaattgtac gatgaggaac 1200
tgcaagctat cgcaaaagcg tatccgggac aattccgcct ggactatgcc ttgtctcgtg 1260
aacaaaataa tcgcaagggc gggaaaatgt acatccaaga taaggttgaa gagtatgccg 1320
acgaaatttt cgatttattg gataatgggg cgcacatgta cttctgcggg ttaaagggga 1380
tgatgccagg catccaagat atgttagaac gcgttgcaaa agaaaagggg ctgaactacg 1440
aagagtgggt cgaggggtta aagcacaaga atcaatggca tgttgaagtc tactaaccag 1500
gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta tctgttgttt 1560
gtcggtgaac gctctctact agagtcacac tggctcacct tcgggtgggc ctttctgcgt 1620
ttatatacta gagggcttta cactttatgc ttccggctcg tatgttgtgt ggaaagaagg 1680
agatatacat atgtccgcat tagtacttaa gcccgggatg ctagcgtcaa gtgcaacagc 1740
tatgaaaggc ttcgccaata gcctccgtat gaaagattac agcagcaccg gtattaactt 1800
cgacatgact aagtgcatta actgccaaag ctgcgttcgc gcctgcacga acatcgctgg 1860
ccaaaacgtc ttgaagagct tgacggtgaa cggcaagtcc gttgtgcaga ccgttaccgg 1920
taaaccgctg gcggagacca actgcatcag ctgcggtcaa tgtacccttg gctgcccgaa 1980
gttcaccatc ttcgaggcgg acgccatcaa tccagttaaa gaggtcttga ccaagaaaaa 2040
cggtcgtatt gccgtgtgtc agattgctcc ggcgattcgt atcaacatgg ctgaagctct 2100
gggcgttccg gctggtacga tctccttggg taaggtggtg accgcgctga aacgtctggg 2160
ttttgactac gttttcgata ccaatttcgc tgccgatatg accatcgtgg aggaagcgac 2220
cgaactggtt caacgtttgt ctgacaaaaa cgcagtgctg cctatgttta cttcatgctg 2280
tccagcgtgg gttaattacg tagagaaatc cgatccgagc ttgatcccgc atctgagctc 2340
ttgtcgtagc ccgatgagca tgctgagcag cgttatcaag aacgtctttc cgaaaaagat 2400
tggtacgacc gcagacaaaa tctacaatgt ggcgatcatg ccgtgcaccg cgaagaagga 2460
cgaaattcag cgcagccaat ttaccatgaa ggatggtaaa caagagacag gtgcggtgct 2520
gacttctcgt gaactcgcga aaatgattaa ggaggcgaag atcaacttca aagagctgcc 2580
ggatacgccg tgtgataact tttattctga agcatcgggc ggcggtgcga tcttttgtgc 2640
aaccggcggc gtgatggaag ccgcggtgcg cagcgcgtat aagttcctga cgaagaaaga 2700
gctggcaccg attgacctgc aagacgttcg cggtgttgcg agcggcgtta aactggcgga 2760
ggtggatatt gctggtacca aagtaaaagt ggcggttgcg cacggcatta agaacgccat 2820
gaccctgatt aagaagatca aatcgggtga agagcagttt aaagacgtta agttcgtgga 2880
agtgatggca tgtccgggtg gctgcgtggt tggtggtggc agcccgaagg ctaagaccaa 2940
gaaagctgtc caggcacgat tgaatgcaac gtactccatt gacaaaagct ccaaacacag 3000
aacttctcag gacaacccgc agttgttaca gctgtataaa gaatcgtttg aaggtaaatt 3060
cggtggtcat gtcgcgcacc acctgctgca cacccattat aagaatcgta aagtaaatcc 3120
gtagggatcc gggtcgagga gaaggatgag aaaaagtgac caggcatcaa ataaaacgaa 3180
aggctcagtc gaaagactgg gcctttcgtt ttatctgttg tttgtcggtg aacgctctct 3240
actagagtca cactggctca ccttcgggtg ggcctttctg cgtttatata ctagagggct 3300
ttacacttta tgcttccggc tcgtatgttg tgtggaaaga aggagatata catatggctc 3360
atagtttaag cgcacattcc cgtcaggccg gagatcgcaa actgggcgca ggtgcggcat 3420
ctagccgccc atcatgtcct tctcgccgca ttgtccgcgt ggcggcccat gcttctgcgt 3480
ccaaggcgac tcccgatgta cctgttgacg atcttcctcc tgcgcatgcc cgtgcagcag 3540
tagcggccgc taaccgtcgt gcgcgcgcta tggcatcagc ggaggccgcg gcagagaccc 3600
tgggcgattt cctgggctta gggaaggggg ggctttcgcc gggcgcaacc gccaaccttg 3660
atcgtgagca agtattaggt gtgttggagg cggtctggcg tcgtggagac cttaatctgg 3720
agcgtgcgtt gtacagccat gccaatgcgg tgactaacaa atactgtggt gggggggtct 3780
actatcgcgg ccttgtggag ttcagtaata tttgccaaaa cgattgctca tattgtggga 3840
ttcgcaacaa tcaaaaagaa gtttggcgct atactatgcc ggttgaagag gtggtcgagg 3900
tagctaagtg ggcgcttgaa aacggcattc gcaacattat gttgcaaggg ggtgaattaa 3960
agacagagca acgcttagcc tacttggagg catgcgtccg tgcgattcgc gaggagacaa 4020
cgcagttaga ccttgaaatg cgcgcacgtg ccgcgagtac gacaacagcg gaagcggcag 4080
ccagtgcaca ggcagacgcc gaagctaaac gcggcgagcc agaattgggt gtggtcgtat 4140
ccttaagcgt cggagaactt cctatggaac agtatgagcg tttgttccgc gccggcgccc 4200
gtcgctatct gatccgcatt gaaacctcga atcccgacct gtacgcggca cttcacccgg 4260
agccgatgtc ctggcacgcg cgtgtagaat gcctgcgcaa cctgaagaaa gctgggtata 4320
tgttgggcac aggagtgatg gtcggcttgc cgggacaaac cttacacgac ctggctgggg 4380
atgtcatgtt ctttcgcgac attaaagcgg acatgatcgg tatgggcccc ttcattacgc 4440
agcctgggac gcctgcaact gataagtgga ccgcgctgta tccgaacgcc aataagaaca 4500
gccacatgaa atctatgttc gatctgacca ctgctatgaa tgcacttgta cgtattacga 4560
tggggaacgt aaatatcagt gctacgactg cattacaagc gattatcccc actggacgtg 4620
aaattgcgct tgagcgcggc gcaaatgttg tcatgcctat tttaacgcct actcagtatc 4680
gcgagtccta tcagttatat gagggtaagc cctgcattac ggatactgct gttcagtgtc 4740
gtcgttgcct ggacatgcgt ttgcactccg ttggcaaaac gtctgcggcc ggagtttggg 4800
gcgatcctgc ttcgttcttg catcccatcg ttggcgtccc agtcccgcac gacttgtcat 4860
cacctgcttt ggccgctgct gcaagtgcgg attttcacga ggttggcgca ggtccctgga 4920
accccatccg actagagcgt ctggttgaag tgccggaccg ttaccctgac cccgataacc 4980
acggacgcaa aaaggcagga gccgggaaag gaggcaaggc gcatgactct cacgacgatg 5040
gcgatcacga cgaccaccac caccaccacg gagctgcccc cgcgggtgca gcggctggaa 5100
agggtaccgg tgcagctgca attggtggcg gagcgggggc tagccgtcaa cgcgtagcag 5160
gggctgctgc cgcctctgct cgtctgtgtg cgggagctcg ccgcgctggc cgtgttgtcg 5220
cgtcgccatt gcgcccagct gccgcttgcc gtggtgtggc cgtcaaggcc gcagctgctg 5280
ctgcgggtga agacgctggt gctggtacgt ctggcgtagg ttcaaatatt gttacgtctc 5340
ccggaatcgc tagcactacg gcacatggtg ttcctcgtat caatattggg gtgttcggcg 5400
tgatgaatgc aggaaagtct acacttgtga atgctctggc gcaacaggaa gcatgcattg 5460
ttgactcaac ccccggcacg accgcagatg taaaaacagt tttgcttgag cttcatgccc 5520
ttggaccagc caagttgctg gacacagccg gattagacga agtcggtgga cttggggata 5580
aaaagcgccg taaagccctg aatacgctga aggagtgcga tgttgctgtg ctggttgttg 5640
acactgatac ggcagccgcc gcaatcaaat cgggacgcct tgctgaagcc ctggaatggg 5700
aatcgaaagt aatggaacag gcacacaagt ataatgtcag tcctgtactg cttctgaatg 5760
taaaatcacg cgggctgcct gaagcgcagg cagctagcat gcttgaggcg gtcgctggta 5820
tgcttgaccc atccaagcaa atccctcgta tgtcgctgga tttagcgtcc acccccctgc 5880
acgagcgtag tacgattacg tctgcattcg tcaaggaagg agcagtgcgc agttcacgct 5940
atggggctcc tctgccgggg tgtttgcccc gttggtctct tggacgcaac gcccgcttac 6000
tgatggtaat cccgatggat gccgaaaccc caggtggacg tcttcttcgt cctcaagcgc 6060
aagttatgga ggaagcaatc cgccattggg ctaccgtgct ttccgtacgc ctggatttag 6120
acgccgcacg tggcaaattg gggcccgagg cctgtgagat ggagcgtcag cgtttcgacg 6180
gggtaattgc tatgatggaa cgtaatgacg gacccaccct ggtggtgaca gattctcaag 6240
cgatcgatgt tgtacaccct tggaccctgg accgctcatc aggacgtccg ttggttccaa 6300
ttactacctt tagcatcgct atggcgtacc aacaaaacgg cggacgtttg gacccgtttg 6360
tggaaggatt ggaagcattg gagacgttac aagatgggga tcgcgttctt atttcggaag 6420
cgtgtaatca taaccgtatc acctccgctt gcaacgacat tggaatggtg cagatcccta 6480
acaagctgga ggcagcactt ggcgggaaaa agttacaaat cgaacatgcg tttggtcgcg 6540
agtttcccga gcttgagagt gggggtatgg atggattgaa gttagcgatc cattgtggag 6600
ggtgtatgat cgacgctcag aaaatgcagc agcgtatgaa agacttgcat gaggctgggg 6660
tgccggtcac taattatggg gtgtttttct cttgggcagc ttggcccgac gcccttcgtc 6720
gcgcattgga accgtgggga gtggagccac cggtaggtac tcctgctacc cccgcagccg 6780
cgcctgctac ggcagcgtcc ggggtataat actactagag ggctttacac tttatgcttc 6840
cggctcgtat gttgtgtgga aagaaggaga tatacatatg tcggtccccc tacagtgcaa 6900
tgcaggccgt cttttggcgg gccagcgccc ctgcggcgtc cgcgcgcgtc tgaaccgccg 6960
tgtatgtgtt ccagtgaccg cacacggcaa agcatctgcc acgcgcgaat acgctggtga 7020
ctttcttcca gggaccacta ttagtcatgc gtggtccgtg gagcgtgaaa ctcatcaccg 7080
ttatcgtaat ccggccgagt ggattaacga ggctgccatc cacaaggcgc ttgaaacgtc 7140
aaaggctgat gctcaggacg caggacgcgt gcgtgagatt ttggcgaagg ctaaggaaaa 7200
ggcttttgtt actgaacatg cgcctgtaaa tgcggaaagt aaatccgaat ttgtacaagg 7260
gcttaccttg gaggagtgcg ccaccttaat taacgttgat tctaataatg tcgagttgat 7320
gaatgaaatc ttcgacactg cgcttgctat caaagaacgt atctacggga accgcgtcgt 7380
gctgttcgcg cccttgtaca ttgctaatca ttgtatgaac acttgcactt attgtgcgtt 7440
tcgctcagcc aataagggca tggaacgctc tattctgaca gacgatgacc tgcgtgaaga 7500
agttgccgcc ttgcaacgtc aaggtcatcg ccgcatttta gcccttactg gagaacatcc 7560
taaatacact ttcgacaatt tcttgcatgc agtcaatgta atcgcttccg tgaagacaga 7620
gcctgaaggg tccattcgcc gtatcaatgt cgaaatccca ccacttagtg tctcagacat 7680
gcgccgcctt aagaatacag attcagttgg cacgttcgtt ctgtttcaag agacatatca 7740
ccgcgacaca ttcaaggtaa tgcatccgtc aggtccaaag agcgactttg attttcgcgt 7800
cttgacccag gaccgcgcca tgcgcgcagg cttggacgat gttggtattg gtgctttatt 7860
cgggttatat gattaccgtt atgaagtttg cgccatgtta atgcatagcg agcatttgga 7920
acgtgagtac aacgcaggac cacatactat ctctgttccc cgtatgcgcc ccgcggacgg 7980
aagcgagctt agtatcgcgc ctccttatcc tgttaatgat gctgatttta tgaaattagt 8040
tgcggtcctt cgtattgctg taccatacac aggtatgatc cttagcactc gtgaatcacc 8100
agaaatgcgc tcggcgcttc tgaagtgtgg gatgagtcaa atgagtgccg gctcgcgcac 8160
tgatgtagga gcctatcaca aagatcacac gttaagtaca gaggcgaatt tgagtaagtt 8220
agctgggcag tttaccttgc aggatgaacg tccaactaat gagattgtta agtggctgat 8280
ggaggagggc tatgtcccgt cttggtgcac agcttgttac cgtcaaggtc gtacgggcga 8340
agacttcatg aacatctgta aggctggtga cattcacgat ttctgtcatc ccaatagtct 8400
gcttacgctt caagagtacc ttatggatta tgcagatcca gaccttcgta agaaaggcga 8460
gcaagtaatt gcccgtgaga tgggaccgga cgcctctgag ccgttatcgg cgcaaagccg 8520
taagcgcctt gaacgcaaga tgaaacaagt attggagggg gagcacgatg tatatcttta 8580
accaggcatc aaataaaacg aaaggctcag tcgaaagact gggcctttcg ttttatctgt 8640
tgtttgtcgg tgaacgctct ctactagagt cacactggct caccttcggg tgggcctttc 8700
tgcgtttata 8710
<210> 37
<211> 8761
<212> DNA
<213> Artificial Sequence
<220>
<223> Exemplary HPGC (hydrogen producing gene cluster) with codon
optimised nucleic acid sequence encoding HydA (Hyd1) from
Megasphaera micronuciformis, 5' - 3'
<400> 37
ctagagggct ttacacttta tgcttccggc tcgtatgttg tgtggaaaga aggagatata 60
catatggcga tgcgttccac atttgctgcg cgtgtcggtg ccaaaccggc agtgcgtggg 120
gcgcgtcccg cgtcgcgtat gtcttgcatg gcctataagg ttacactgaa aacgccatca 180
ggcgataaaa caatcgaatg tccggcggac acctatatcc tggatgctgc ggaggaagcc 240
gggctggacc ttccctatag ttgccgtgcg ggcgcctgtt catcctgtgc tggcaaagtg 300
gcagctggaa cggtagatca atctgatcag tcctttctgg atgacgctca gatggggaac 360
ggattcgtcc tgacatgtgt cgcgtatcct acaagcgact gcactatcca aactcaccaa 420
gaggaggctt tatattaaaa gaaggagata tacatatgca aactgttcgc gctccagcag 480
cttcaggtgt tgccacacgt gtcgcaggtc gtcgtatgtg tcgtccggtt gcggcgacga 540
aggcttccac ggctgttacc acagacatgt cgaagcgcac tgttccaacc aagttagagg 600
aaggtgaaat gccgttgaac acgtacagta ataaagctcc gttcaaggca aaggttcgtt 660
ccgtggaaaa aatcacagga ccaaaagcca caggtgagac gtgccacatc attattgaaa 720
ccgaggggaa gatcccgttt tgggagggac aatcgtacgg tgtaattccg ccggggacca 780
agatcaactc taagggaaaa gaagtgcctc atggtactcg tctttattcg attgcttcta 840
gtcgttacgg agatgacttc gatggtcaaa cggcatcgct gtgtgttcgc cgcgcggtat 900
acgtcgatcc agagactgga aaggaggacc ccgcgaaaaa aggactgtgt agtaactttt 960
tgtgtgatgc cacaccaggc acggaaattt ccatgacagg gcccacagga aaagtattgc 1020
ttctgccagc agacgcgaac gcgccattaa tctgtgtcgc aacggggact ggaatcgcgc 1080
cttttcgctc attctggcgc cgttgcttca tcgagaatgt cccaagttat aagttcactg 1140
gccttttctg gttgtttatg ggtgtcgcta actctgatgc taaattgtac gatgaggaac 1200
tgcaagctat cgcaaaagcg tatccgggac aattccgcct ggactatgcc ttgtctcgtg 1260
aacaaaataa tcgcaagggc gggaaaatgt acatccaaga taaggttgaa gagtatgccg 1320
acgaaatttt cgatttattg gataatgggg cgcacatgta cttctgcggg ttaaagggga 1380
tgatgccagg catccaagat atgttagaac gcgttgcaaa agaaaagggg ctgaactacg 1440
aagagtgggt cgaggggtta aagcacaaga atcaatggca tgttgaagtc tactaaccag 1500
gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta tctgttgttt 1560
gtcggtgaac gctctctact agagtcacac tggctcacct tcgggtgggc ctttctgcgt 1620
ttatatacta gagggcttta cactttatgc ttccggctcg tatgttgtgt ggaaagaagg 1680
agatatacat atgtccgcat tagtacttaa gcccgggatg aaggctgtag agggatttga 1740
atcaaaatat aaattttacg acaagcgcgt gccgattgcg gacgacaacc cagctgtgca 1800
ctttgacgaa acgaaatgca aaaattgtac cctttgccgt cgtgcgtgtg aaactacgca 1860
aaccgtgctg gactattaca gcctggaacg caccggcgat gttccggttt gtgttcactg 1920
cggtcaatgt gcaaatgcct gcccgtttgg tgccatgatg gaagttgatg atacgaactt 1980
agtcaaagct gcgatcgcgg acccggataa ggtggtggtt ttccaaacgg caccggcggt 2040
acgtgtggcc attgcggaag agttcggtgc ggaggcgggt acattcgcac agggtaaaat 2100
gatttcagcg ttgagagccc tgggtggcga ctacgtgttc gacaccaact ttggcgctga 2160
catgaccatc atggaagaaa cttccgagct ggtgcgtcgt attaccactg gtaacttcgc 2220
aatgccgcag tttaccagct gctgcccggc gtgggttgag tttgctgaga ccttctacgc 2280
agaatacatc ccgcatctgt ccagcgcgaa gagcccgatt ctgatgcaaa acaccacgga 2340
aaaaatctgg tttgccgaga aggcgggcat cgatccgaag aagatggtga cggtttgcgt 2400
taccccgtgt accgctaaaa aagccgagat caagcgcaaa gaattgaatg ctgcggctga 2460
gtactggcat attgatggct taaaggactc cgacatttgc atcacgaccc gtgaactggc 2520
acgttggctg aaagcggaga acattgactt caataccctg gatgatggta tttttgatag 2580
ccacctgggc gaggcgagcg gtggtggcat catcttcggc agcaccggtg gtgtcatgga 2640
gtccgcactg cgcagcgcgt attacttcta taccggtaaa ccgatgccag cggagtatat 2700
accgtatgaa ccggtgcgtg gcttggacgg cgttaaagag gcgaccatcg acttcagcgg 2760
tatctctctg catgtcgcag tcgtgagcgg tctcggcaat gcgcgtcgtt ttctggataa 2820
aattatggcg gacggcacct tcaaagatta cacctttatc gagttcatgg cgtgccaggg 2880
tggctgcatc aacggtggtg gccaaccgaa ggttaagatg cctctggttc agaaaaccaa 2940
ccaggctcgc atgaatagct tgtacaaacg tgattcggag gtttcgatta aggccgcctg 3000
ggaaaacccc gaaatccagg aactctacag cgacttctac ggccagccgc tgtctgagcg 3060
ctctgagaag tatattcaca ccttctttga ggataagtcc ggcaacctgg gtgaaggtgg 3120
tgctgtgacc ccgcaaacga acccattgtc tccgaagtat aagccgattg aatagggatc 3180
cgggtcgagg agaaggatga gaaaaagtga ccaggcatca aataaaacga aaggctcagt 3240
cgaaagactg ggcctttcgt tttatctgtt gtttgtcggt gaacgctctc tactagagtc 3300
acactggctc accttcgggt gggcctttct gcgtttatat actagagggc tttacacttt 3360
atgcttccgg ctcgtatgtt gtgtggaaag aaggagatat acatatggct catagtttaa 3420
gcgcacattc ccgtcaggcc ggagatcgca aactgggcgc aggtgcggca tctagccgcc 3480
catcatgtcc ttctcgccgc attgtccgcg tggcggccca tgcttctgcg tccaaggcga 3540
ctcccgatgt acctgttgac gatcttcctc ctgcgcatgc ccgtgcagca gtagcggccg 3600
ctaaccgtcg tgcgcgcgct atggcatcag cggaggccgc ggcagagacc ctgggcgatt 3660
tcctgggctt agggaagggg gggctttcgc cgggcgcaac cgccaacctt gatcgtgagc 3720
aagtattagg tgtgttggag gcggtctggc gtcgtggaga ccttaatctg gagcgtgcgt 3780
tgtacagcca tgccaatgcg gtgactaaca aatactgtgg tgggggggtc tactatcgcg 3840
gccttgtgga gttcagtaat atttgccaaa acgattgctc atattgtggg attcgcaaca 3900
atcaaaaaga agtttggcgc tatactatgc cggttgaaga ggtggtcgag gtagctaagt 3960
gggcgcttga aaacggcatt cgcaacatta tgttgcaagg gggtgaatta aagacagagc 4020
aacgcttagc ctacttggag gcatgcgtcc gtgcgattcg cgaggagaca acgcagttag 4080
accttgaaat gcgcgcacgt gccgcgagta cgacaacagc ggaagcggca gccagtgcac 4140
aggcagacgc cgaagctaaa cgcggcgagc cagaattggg tgtggtcgta tccttaagcg 4200
tcggagaact tcctatggaa cagtatgagc gtttgttccg cgccggcgcc cgtcgctatc 4260
tgatccgcat tgaaacctcg aatcccgacc tgtacgcggc acttcacccg gagccgatgt 4320
cctggcacgc gcgtgtagaa tgcctgcgca acctgaagaa agctgggtat atgttgggca 4380
caggagtgat ggtcggcttg ccgggacaaa ccttacacga cctggctggg gatgtcatgt 4440
tctttcgcga cattaaagcg gacatgatcg gtatgggccc cttcattacg cagcctggga 4500
cgcctgcaac tgataagtgg accgcgctgt atccgaacgc caataagaac agccacatga 4560
aatctatgtt cgatctgacc actgctatga atgcacttgt acgtattacg atggggaacg 4620
taaatatcag tgctacgact gcattacaag cgattatccc cactggacgt gaaattgcgc 4680
ttgagcgcgg cgcaaatgtt gtcatgccta ttttaacgcc tactcagtat cgcgagtcct 4740
atcagttata tgagggtaag ccctgcatta cggatactgc tgttcagtgt cgtcgttgcc 4800
tggacatgcg tttgcactcc gttggcaaaa cgtctgcggc cggagtttgg ggcgatcctg 4860
cttcgttctt gcatcccatc gttggcgtcc cagtcccgca cgacttgtca tcacctgctt 4920
tggccgctgc tgcaagtgcg gattttcacg aggttggcgc aggtccctgg aaccccatcc 4980
gactagagcg tctggttgaa gtgccggacc gttaccctga ccccgataac cacggacgca 5040
aaaaggcagg agccgggaaa ggaggcaagg cgcatgactc tcacgacgat ggcgatcacg 5100
acgaccacca ccaccaccac ggagctgccc ccgcgggtgc agcggctgga aagggtaccg 5160
gtgcagctgc aattggtggc ggagcggggg ctagccgtca acgcgtagca ggggctgctg 5220
ccgcctctgc tcgtctgtgt gcgggagctc gccgcgctgg ccgtgttgtc gcgtcgccat 5280
tgcgcccagc tgccgcttgc cgtggtgtgg ccgtcaaggc cgcagctgct gctgcgggtg 5340
aagacgctgg tgctggtacg tctggcgtag gttcaaatat tgttacgtct cccggaatcg 5400
ctagcactac ggcacatggt gttcctcgta tcaatattgg ggtgttcggc gtgatgaatg 5460
caggaaagtc tacacttgtg aatgctctgg cgcaacagga agcatgcatt gttgactcaa 5520
cccccggcac gaccgcagat gtaaaaacag ttttgcttga gcttcatgcc cttggaccag 5580
ccaagttgct ggacacagcc ggattagacg aagtcggtgg acttggggat aaaaagcgcc 5640
gtaaagccct gaatacgctg aaggagtgcg atgttgctgt gctggttgtt gacactgata 5700
cggcagccgc cgcaatcaaa tcgggacgcc ttgctgaagc cctggaatgg gaatcgaaag 5760
taatggaaca ggcacacaag tataatgtca gtcctgtact gcttctgaat gtaaaatcac 5820
gcgggctgcc tgaagcgcag gcagctagca tgcttgaggc ggtcgctggt atgcttgacc 5880
catccaagca aatccctcgt atgtcgctgg atttagcgtc cacccccctg cacgagcgta 5940
gtacgattac gtctgcattc gtcaaggaag gagcagtgcg cagttcacgc tatggggctc 6000
ctctgccggg gtgtttgccc cgttggtctc ttggacgcaa cgcccgctta ctgatggtaa 6060
tcccgatgga tgccgaaacc ccaggtggac gtcttcttcg tcctcaagcg caagttatgg 6120
aggaagcaat ccgccattgg gctaccgtgc tttccgtacg cctggattta gacgccgcac 6180
gtggcaaatt ggggcccgag gcctgtgaga tggagcgtca gcgtttcgac ggggtaattg 6240
ctatgatgga acgtaatgac ggacccaccc tggtggtgac agattctcaa gcgatcgatg 6300
ttgtacaccc ttggaccctg gaccgctcat caggacgtcc gttggttcca attactacct 6360
ttagcatcgc tatggcgtac caacaaaacg gcggacgttt ggacccgttt gtggaaggat 6420
tggaagcatt ggagacgtta caagatgggg atcgcgttct tatttcggaa gcgtgtaatc 6480
ataaccgtat cacctccgct tgcaacgaca ttggaatggt gcagatccct aacaagctgg 6540
aggcagcact tggcgggaaa aagttacaaa tcgaacatgc gtttggtcgc gagtttcccg 6600
agcttgagag tgggggtatg gatggattga agttagcgat ccattgtgga gggtgtatga 6660
tcgacgctca gaaaatgcag cagcgtatga aagacttgca tgaggctggg gtgccggtca 6720
ctaattatgg ggtgtttttc tcttgggcag cttggcccga cgcccttcgt cgcgcattgg 6780
aaccgtgggg agtggagcca ccggtaggta ctcctgctac ccccgcagcc gcgcctgcta 6840
cggcagcgtc cggggtataa tactactaga gggctttaca ctttatgctt ccggctcgta 6900
tgttgtgtgg aaagaaggag atatacatat gtcggtcccc ctacagtgca atgcaggccg 6960
tcttttggcg ggccagcgcc cctgcggcgt ccgcgcgcgt ctgaaccgcc gtgtatgtgt 7020
tccagtgacc gcacacggca aagcatctgc cacgcgcgaa tacgctggtg actttcttcc 7080
agggaccact attagtcatg cgtggtccgt ggagcgtgaa actcatcacc gttatcgtaa 7140
tccggccgag tggattaacg aggctgccat ccacaaggcg cttgaaacgt caaaggctga 7200
tgctcaggac gcaggacgcg tgcgtgagat tttggcgaag gctaaggaaa aggcttttgt 7260
tactgaacat gcgcctgtaa atgcggaaag taaatccgaa tttgtacaag ggcttacctt 7320
ggaggagtgc gccaccttaa ttaacgttga ttctaataat gtcgagttga tgaatgaaat 7380
cttcgacact gcgcttgcta tcaaagaacg tatctacggg aaccgcgtcg tgctgttcgc 7440
gcccttgtac attgctaatc attgtatgaa cacttgcact tattgtgcgt ttcgctcagc 7500
caataagggc atggaacgct ctattctgac agacgatgac ctgcgtgaag aagttgccgc 7560
cttgcaacgt caaggtcatc gccgcatttt agcccttact ggagaacatc ctaaatacac 7620
tttcgacaat ttcttgcatg cagtcaatgt aatcgcttcc gtgaagacag agcctgaagg 7680
gtccattcgc cgtatcaatg tcgaaatccc accacttagt gtctcagaca tgcgccgcct 7740
taagaataca gattcagttg gcacgttcgt tctgtttcaa gagacatatc accgcgacac 7800
attcaaggta atgcatccgt caggtccaaa gagcgacttt gattttcgcg tcttgaccca 7860
ggaccgcgcc atgcgcgcag gcttggacga tgttggtatt ggtgctttat tcgggttata 7920
tgattaccgt tatgaagttt gcgccatgtt aatgcatagc gagcatttgg aacgtgagta 7980
caacgcagga ccacatacta tctctgttcc ccgtatgcgc cccgcggacg gaagcgagct 8040
tagtatcgcg cctccttatc ctgttaatga tgctgatttt atgaaattag ttgcggtcct 8100
tcgtattgct gtaccataca caggtatgat ccttagcact cgtgaatcac cagaaatgcg 8160
ctcggcgctt ctgaagtgtg ggatgagtca aatgagtgcc ggctcgcgca ctgatgtagg 8220
agcctatcac aaagatcaca cgttaagtac agaggcgaat ttgagtaagt tagctgggca 8280
gtttaccttg caggatgaac gtccaactaa tgagattgtt aagtggctga tggaggaggg 8340
ctatgtcccg tcttggtgca cagcttgtta ccgtcaaggt cgtacgggcg aagacttcat 8400
gaacatctgt aaggctggtg acattcacga tttctgtcat cccaatagtc tgcttacgct 8460
tcaagagtac cttatggatt atgcagatcc agaccttcgt aagaaaggcg agcaagtaat 8520
tgcccgtgag atgggaccgg acgcctctga gccgttatcg gcgcaaagcc gtaagcgcct 8580
tgaacgcaag atgaaacaag tattggaggg ggagcacgat gtatatcttt aaccaggcat 8640
caaataaaac gaaaggctca gtcgaaagac tgggcctttc gttttatctg ttgtttgtcg 8700
gtgaacgctc tctactagag tcacactggc tcaccttcgg gtgggccttt ctgcgtttat 8760
a 8761
<210> 38
<211> 8773
<212> DNA
<213> Artificial Sequence
<220>
<223> Exemplary HPGC (hydrogen producing gene cluster) with codon
optimised nucleic acid sequence encoding HydA (Hyd1) from
Veillonella parvula, 5' - 3'
<400> 38
ctagagggct ttacacttta tgcttccggc tcgtatgttg tgtggaaaga aggagatata 60
catatggcga tgcgttccac atttgctgcg cgtgtcggtg ccaaaccggc agtgcgtggg 120
gcgcgtcccg cgtcgcgtat gtcttgcatg gcctataagg ttacactgaa aacgccatca 180
ggcgataaaa caatcgaatg tccggcggac acctatatcc tggatgctgc ggaggaagcc 240
gggctggacc ttccctatag ttgccgtgcg ggcgcctgtt catcctgtgc tggcaaagtg 300
gcagctggaa cggtagatca atctgatcag tcctttctgg atgacgctca gatggggaac 360
ggattcgtcc tgacatgtgt cgcgtatcct acaagcgact gcactatcca aactcaccaa 420
gaggaggctt tatattaaaa gaaggagata tacatatgca aactgttcgc gctccagcag 480
cttcaggtgt tgccacacgt gtcgcaggtc gtcgtatgtg tcgtccggtt gcggcgacga 540
aggcttccac ggctgttacc acagacatgt cgaagcgcac tgttccaacc aagttagagg 600
aaggtgaaat gccgttgaac acgtacagta ataaagctcc gttcaaggca aaggttcgtt 660
ccgtggaaaa aatcacagga ccaaaagcca caggtgagac gtgccacatc attattgaaa 720
ccgaggggaa gatcccgttt tgggagggac aatcgtacgg tgtaattccg ccggggacca 780
agatcaactc taagggaaaa gaagtgcctc atggtactcg tctttattcg attgcttcta 840
gtcgttacgg agatgacttc gatggtcaaa cggcatcgct gtgtgttcgc cgcgcggtat 900
acgtcgatcc agagactgga aaggaggacc ccgcgaaaaa aggactgtgt agtaactttt 960
tgtgtgatgc cacaccaggc acggaaattt ccatgacagg gcccacagga aaagtattgc 1020
ttctgccagc agacgcgaac gcgccattaa tctgtgtcgc aacggggact ggaatcgcgc 1080
cttttcgctc attctggcgc cgttgcttca tcgagaatgt cccaagttat aagttcactg 1140
gccttttctg gttgtttatg ggtgtcgcta actctgatgc taaattgtac gatgaggaac 1200
tgcaagctat cgcaaaagcg tatccgggac aattccgcct ggactatgcc ttgtctcgtg 1260
aacaaaataa tcgcaagggc gggaaaatgt acatccaaga taaggttgaa gagtatgccg 1320
acgaaatttt cgatttattg gataatgggg cgcacatgta cttctgcggg ttaaagggga 1380
tgatgccagg catccaagat atgttagaac gcgttgcaaa agaaaagggg ctgaactacg 1440
aagagtgggt cgaggggtta aagcacaaga atcaatggca tgttgaagtc tactaaccag 1500
gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta tctgttgttt 1560
gtcggtgaac gctctctact agagtcacac tggctcacct tcgggtgggc ctttctgcgt 1620
ttatatacta gagggcttta cactttatgc ttccggctcg tatgttgtgt ggaaagaagg 1680
agatatacat atgtccgcat tagtacttaa gcccgggatg tcaaaatatc aatttttaga 1740
tagaagggtc ccgattgagg acggtaacat cgctctggtt caggatttga ctaagtgcaa 1800
aaattgtagc ctgtgtcgta aagcttgcgc ggtcgatatg ggcgtctttg actactatga 1860
tctgaccacg aatggtgacc acccgatttg catccactgc ggtcaatgtg cgtccatctg 1920
cccattcgat tctattaatg aacgcagcga gatcgatgaa gttaaggcgg cgattgcgga 1980
cccgaacaaa atcgtcatct tccagaccgc accggctgtg cgtgtgggtc ttggcgagga 2040
gttcggcttg gaggcgggta cctttgtgga aggcaagatg gttgcagccc tgagaaagct 2100
gggcggtgac tacattctgg acaccaactt tggtgcggac atgaccatca tggaagaggc 2160
gtccgagttg ctggaacgtg ttatcaactc ggatgctgtt ctgccgcaat ttaccagctg 2220
ttgtccggcg tgggttaagt tcgcggagac attctacccg gagttcctgc ctaacctgag 2280
caccgcgaag tccccgattg ccatgcaggc accgacccag aaaacctatt tcgccgaaaa 2340
aatgggtctg gacgcgaagc agattgtggc ggtggccgta actccgtgta ctgccaagaa 2400
atttgagatt cgccgtgacg aaatgaacag cagcgcagag tattggaata ccccagaaat 2460
gcgtgatacc gattactgca tcaccacgcg tgagctggca aagtggctgc gcgcagaaga 2520
aatcaacttt gacgacctcg aggacagcgc atttgatccg ctgatgggtg aggctagcgg 2580
tggcggtatt atttttggca acaccggcgg cgttatggaa gctgccatgc gcgcggcgta 2640
taaaatggca accggtgaag atgcccccca aacccttatc ccattcgagg ccatcagagg 2700
catggatggt gcgcgcgaag ctgatgttgt gatcggtgac aagaccctgc acgttgcggc 2760
ggtgcatggt acgggcaatt tacgtaaatt cattgagcgc atgcgtgcgg agaacatcca 2820
ctacgacttc atcgaggtga tggcatgccg tggtgggtgc atcggcggcg gtggccaacc 2880
gcgtgttaaa ttgccgatgg ccgacaaagc gcgcgaagct cgtatcgcgt ctctatacac 2940
ccgtgacgca gaagtgactg taaaggccgc gtgcgataat ccggatattc agaaattata 3000
tgcagagttt ttcgacggca aaccgatgag ccataaagca catcacatgc tgcataccac 3060
gttcgtgaat cgtagcgaag atttgggtcc gaacggtgcg tgcaccccgg cgacgtgccc 3120
gaccagtgtt ccgaacctga aaaaggctgc tgaagcggcg aaggcggcgg ctgaagttaa 3180
ctcttaggga tccgggtcga ggagaaggat gagaaaaagt gaccaggcat caaataaaac 3240
gaaaggctca gtcgaaagac tgggcctttc gttttatctg ttgtttgtcg gtgaacgctc 3300
tctactagag tcacactggc tcaccttcgg gtgggccttt ctgcgtttat atactagagg 3360
gctttacact ttatgcttcc ggctcgtatg ttgtgtggaa agaaggagat atacatatgg 3420
ctcatagttt aagcgcacat tcccgtcagg ccggagatcg caaactgggc gcaggtgcgg 3480
catctagccg cccatcatgt ccttctcgcc gcattgtccg cgtggcggcc catgcttctg 3540
cgtccaaggc gactcccgat gtacctgttg acgatcttcc tcctgcgcat gcccgtgcag 3600
cagtagcggc cgctaaccgt cgtgcgcgcg ctatggcatc agcggaggcc gcggcagaga 3660
ccctgggcga tttcctgggc ttagggaagg gggggctttc gccgggcgca accgccaacc 3720
ttgatcgtga gcaagtatta ggtgtgttgg aggcggtctg gcgtcgtgga gaccttaatc 3780
tggagcgtgc gttgtacagc catgccaatg cggtgactaa caaatactgt ggtggggggg 3840
tctactatcg cggccttgtg gagttcagta atatttgcca aaacgattgc tcatattgtg 3900
ggattcgcaa caatcaaaaa gaagtttggc gctatactat gccggttgaa gaggtggtcg 3960
aggtagctaa gtgggcgctt gaaaacggca ttcgcaacat tatgttgcaa gggggtgaat 4020
taaagacaga gcaacgctta gcctacttgg aggcatgcgt ccgtgcgatt cgcgaggaga 4080
caacgcagtt agaccttgaa atgcgcgcac gtgccgcgag tacgacaaca gcggaagcgg 4140
cagccagtgc acaggcagac gccgaagcta aacgcggcga gccagaattg ggtgtggtcg 4200
tatccttaag cgtcggagaa cttcctatgg aacagtatga gcgtttgttc cgcgccggcg 4260
cccgtcgcta tctgatccgc attgaaacct cgaatcccga cctgtacgcg gcacttcacc 4320
cggagccgat gtcctggcac gcgcgtgtag aatgcctgcg caacctgaag aaagctgggt 4380
atatgttggg cacaggagtg atggtcggct tgccgggaca aaccttacac gacctggctg 4440
gggatgtcat gttctttcgc gacattaaag cggacatgat cggtatgggc cccttcatta 4500
cgcagcctgg gacgcctgca actgataagt ggaccgcgct gtatccgaac gccaataaga 4560
acagccacat gaaatctatg ttcgatctga ccactgctat gaatgcactt gtacgtatta 4620
cgatggggaa cgtaaatatc agtgctacga ctgcattaca agcgattatc cccactggac 4680
gtgaaattgc gcttgagcgc ggcgcaaatg ttgtcatgcc tattttaacg cctactcagt 4740
atcgcgagtc ctatcagtta tatgagggta agccctgcat tacggatact gctgttcagt 4800
gtcgtcgttg cctggacatg cgtttgcact ccgttggcaa aacgtctgcg gccggagttt 4860
ggggcgatcc tgcttcgttc ttgcatccca tcgttggcgt cccagtcccg cacgacttgt 4920
catcacctgc tttggccgct gctgcaagtg cggattttca cgaggttggc gcaggtccct 4980
ggaaccccat ccgactagag cgtctggttg aagtgccgga ccgttaccct gaccccgata 5040
accacggacg caaaaaggca ggagccggga aaggaggcaa ggcgcatgac tctcacgacg 5100
atggcgatca cgacgaccac caccaccacc acggagctgc ccccgcgggt gcagcggctg 5160
gaaagggtac cggtgcagct gcaattggtg gcggagcggg ggctagccgt caacgcgtag 5220
caggggctgc tgccgcctct gctcgtctgt gtgcgggagc tcgccgcgct ggccgtgttg 5280
tcgcgtcgcc attgcgccca gctgccgctt gccgtggtgt ggccgtcaag gccgcagctg 5340
ctgctgcggg tgaagacgct ggtgctggta cgtctggcgt aggttcaaat attgttacgt 5400
ctcccggaat cgctagcact acggcacatg gtgttcctcg tatcaatatt ggggtgttcg 5460
gcgtgatgaa tgcaggaaag tctacacttg tgaatgctct ggcgcaacag gaagcatgca 5520
ttgttgactc aacccccggc acgaccgcag atgtaaaaac agttttgctt gagcttcatg 5580
cccttggacc agccaagttg ctggacacag ccggattaga cgaagtcggt ggacttgggg 5640
ataaaaagcg ccgtaaagcc ctgaatacgc tgaaggagtg cgatgttgct gtgctggttg 5700
ttgacactga tacggcagcc gccgcaatca aatcgggacg ccttgctgaa gccctggaat 5760
gggaatcgaa agtaatggaa caggcacaca agtataatgt cagtcctgta ctgcttctga 5820
atgtaaaatc acgcgggctg cctgaagcgc aggcagctag catgcttgag gcggtcgctg 5880
gtatgcttga cccatccaag caaatccctc gtatgtcgct ggatttagcg tccacccccc 5940
tgcacgagcg tagtacgatt acgtctgcat tcgtcaagga aggagcagtg cgcagttcac 6000
gctatggggc tcctctgccg gggtgtttgc cccgttggtc tcttggacgc aacgcccgct 6060
tactgatggt aatcccgatg gatgccgaaa ccccaggtgg acgtcttctt cgtcctcaag 6120
cgcaagttat ggaggaagca atccgccatt gggctaccgt gctttccgta cgcctggatt 6180
tagacgccgc acgtggcaaa ttggggcccg aggcctgtga gatggagcgt cagcgtttcg 6240
acggggtaat tgctatgatg gaacgtaatg acggacccac cctggtggtg acagattctc 6300
aagcgatcga tgttgtacac ccttggaccc tggaccgctc atcaggacgt ccgttggttc 6360
caattactac ctttagcatc gctatggcgt accaacaaaa cggcggacgt ttggacccgt 6420
ttgtggaagg attggaagca ttggagacgt tacaagatgg ggatcgcgtt cttatttcgg 6480
aagcgtgtaa tcataaccgt atcacctccg cttgcaacga cattggaatg gtgcagatcc 6540
ctaacaagct ggaggcagca cttggcggga aaaagttaca aatcgaacat gcgtttggtc 6600
gcgagtttcc cgagcttgag agtgggggta tggatggatt gaagttagcg atccattgtg 6660
gagggtgtat gatcgacgct cagaaaatgc agcagcgtat gaaagacttg catgaggctg 6720
gggtgccggt cactaattat ggggtgtttt tctcttgggc agcttggccc gacgcccttc 6780
gtcgcgcatt ggaaccgtgg ggagtggagc caccggtagg tactcctgct acccccgcag 6840
ccgcgcctgc tacggcagcg tccggggtat aatactacta gagggcttta cactttatgc 6900
ttccggctcg tatgttgtgt ggaaagaagg agatatacat atgtcggtcc ccctacagtg 6960
caatgcaggc cgtcttttgg cgggccagcg cccctgcggc gtccgcgcgc gtctgaaccg 7020
ccgtgtatgt gttccagtga ccgcacacgg caaagcatct gccacgcgcg aatacgctgg 7080
tgactttctt ccagggacca ctattagtca tgcgtggtcc gtggagcgtg aaactcatca 7140
ccgttatcgt aatccggccg agtggattaa cgaggctgcc atccacaagg cgcttgaaac 7200
gtcaaaggct gatgctcagg acgcaggacg cgtgcgtgag attttggcga aggctaagga 7260
aaaggctttt gttactgaac atgcgcctgt aaatgcggaa agtaaatccg aatttgtaca 7320
agggcttacc ttggaggagt gcgccacctt aattaacgtt gattctaata atgtcgagtt 7380
gatgaatgaa atcttcgaca ctgcgcttgc tatcaaagaa cgtatctacg ggaaccgcgt 7440
cgtgctgttc gcgcccttgt acattgctaa tcattgtatg aacacttgca cttattgtgc 7500
gtttcgctca gccaataagg gcatggaacg ctctattctg acagacgatg acctgcgtga 7560
agaagttgcc gccttgcaac gtcaaggtca tcgccgcatt ttagccctta ctggagaaca 7620
tcctaaatac actttcgaca atttcttgca tgcagtcaat gtaatcgctt ccgtgaagac 7680
agagcctgaa gggtccattc gccgtatcaa tgtcgaaatc ccaccactta gtgtctcaga 7740
catgcgccgc cttaagaata cagattcagt tggcacgttc gttctgtttc aagagacata 7800
tcaccgcgac acattcaagg taatgcatcc gtcaggtcca aagagcgact ttgattttcg 7860
cgtcttgacc caggaccgcg ccatgcgcgc aggcttggac gatgttggta ttggtgcttt 7920
attcgggtta tatgattacc gttatgaagt ttgcgccatg ttaatgcata gcgagcattt 7980
ggaacgtgag tacaacgcag gaccacatac tatctctgtt ccccgtatgc gccccgcgga 8040
cggaagcgag cttagtatcg cgcctcctta tcctgttaat gatgctgatt ttatgaaatt 8100
agttgcggtc cttcgtattg ctgtaccata cacaggtatg atccttagca ctcgtgaatc 8160
accagaaatg cgctcggcgc ttctgaagtg tgggatgagt caaatgagtg ccggctcgcg 8220
cactgatgta ggagcctatc acaaagatca cacgttaagt acagaggcga atttgagtaa 8280
gttagctggg cagtttacct tgcaggatga acgtccaact aatgagattg ttaagtggct 8340
gatggaggag ggctatgtcc cgtcttggtg cacagcttgt taccgtcaag gtcgtacggg 8400
cgaagacttc atgaacatct gtaaggctgg tgacattcac gatttctgtc atcccaatag 8460
tctgcttacg cttcaagagt accttatgga ttatgcagat ccagaccttc gtaagaaagg 8520
cgagcaagta attgcccgtg agatgggacc ggacgcctct gagccgttat cggcgcaaag 8580
ccgtaagcgc cttgaacgca agatgaaaca agtattggag ggggagcacg atgtatatct 8640
ttaaccaggc atcaaataaa acgaaaggct cagtcgaaag actgggcctt tcgttttatc 8700
tgttgtttgt cggtgaacgc tctctactag agtcacactg gctcaccttc gggtgggcct 8760
ttctgcgttt ata 8773
<210> 39
<211> 8734
<212> DNA
<213> Artificial Sequence
<220>
<223> Exemplary HPGC (hydrogen producing gene cluster) with codon
optimised nucleic acid sequence encoding HydA (Hyd1) from
Veillonella atypica, 5' - 3'
<400> 39
ctagagggct ttacacttta tgcttccggc tcgtatgttg tgtggaaaga aggagatata 60
catatggcga tgcgttccac atttgctgcg cgtgtcggtg ccaaaccggc agtgcgtggg 120
gcgcgtcccg cgtcgcgtat gtcttgcatg gcctataagg ttacactgaa aacgccatca 180
ggcgataaaa caatcgaatg tccggcggac acctatatcc tggatgctgc ggaggaagcc 240
gggctggacc ttccctatag ttgccgtgcg ggcgcctgtt catcctgtgc tggcaaagtg 300
gcagctggaa cggtagatca atctgatcag tcctttctgg atgacgctca gatggggaac 360
ggattcgtcc tgacatgtgt cgcgtatcct acaagcgact gcactatcca aactcaccaa 420
gaggaggctt tatattaaaa gaaggagata tacatatgca aactgttcgc gctccagcag 480
cttcaggtgt tgccacacgt gtcgcaggtc gtcgtatgtg tcgtccggtt gcggcgacga 540
aggcttccac ggctgttacc acagacatgt cgaagcgcac tgttccaacc aagttagagg 600
aaggtgaaat gccgttgaac acgtacagta ataaagctcc gttcaaggca aaggttcgtt 660
ccgtggaaaa aatcacagga ccaaaagcca caggtgagac gtgccacatc attattgaaa 720
ccgaggggaa gatcccgttt tgggagggac aatcgtacgg tgtaattccg ccggggacca 780
agatcaactc taagggaaaa gaagtgcctc atggtactcg tctttattcg attgcttcta 840
gtcgttacgg agatgacttc gatggtcaaa cggcatcgct gtgtgttcgc cgcgcggtat 900
acgtcgatcc agagactgga aaggaggacc ccgcgaaaaa aggactgtgt agtaactttt 960
tgtgtgatgc cacaccaggc acggaaattt ccatgacagg gcccacagga aaagtattgc 1020
ttctgccagc agacgcgaac gcgccattaa tctgtgtcgc aacggggact ggaatcgcgc 1080
cttttcgctc attctggcgc cgttgcttca tcgagaatgt cccaagttat aagttcactg 1140
gccttttctg gttgtttatg ggtgtcgcta actctgatgc taaattgtac gatgaggaac 1200
tgcaagctat cgcaaaagcg tatccgggac aattccgcct ggactatgcc ttgtctcgtg 1260
aacaaaataa tcgcaagggc gggaaaatgt acatccaaga taaggttgaa gagtatgccg 1320
acgaaatttt cgatttattg gataatgggg cgcacatgta cttctgcggg ttaaagggga 1380
tgatgccagg catccaagat atgttagaac gcgttgcaaa agaaaagggg ctgaactacg 1440
aagagtgggt cgaggggtta aagcacaaga atcaatggca tgttgaagtc tactaaccag 1500
gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta tctgttgttt 1560
gtcggtgaac gctctctact agagtcacac tggctcacct tcgggtgggc ctttctgcgt 1620
ttatatacta gagggcttta cactttatgc ttccggctcg tatgttgtgt ggaaagaagg 1680
agatatacat atgtccgcat tagtacttaa gcccgggatg tcacaatttg aatttataga 1740
taaaagggtc cctattgcgc tcgacaaccc gagcatctat cacgatatct ccaaatgcaa 1800
aaactgcacc ttatgccgtc gtgcgtgcgc cgacgtgatg agcgttctgg actactacga 1860
tctggaagcg accggtgacg tgccagtttg tattcattgt ggacaatgtg cagcggcgtg 1920
cccgtttgac tcgatgcatg caaaaagcga attggataag gtgaaggtgg ctattgccga 1980
tccggataaa atcgtcgtta ttcagaccgc tccggctgta cgcgtgtcga ttggcgaggg 2040
tttcggcttt gaaccgggta cgtttctcga gggcaaaatg gttagcgcgc tgcgtaaact 2100
gggtgccgac tacgtggtcg acacgaactt cggcgcggat ctgaccatta tggaggaggc 2160
gtctgaattg gttgatcgtc tgaagaacgg tggcacgatc ccgcaattca ccagttgctg 2220
cccggcttgg gttcgttttg cggaaatcta cttcccggag ttgatcccaa atctgtctag 2280
cacccgtagc tgcatcgcaa tggaggccgc tatgattaaa acctatttcg ctgagaaaaa 2340
gggtattaac ccggcgaata tcgtgtccgt ctccgttaat ccgtgtactg cgaagaaggc 2400
tgagacaaag cgcgtggaag aaaatgctgc cgcgcgttat tacgacgacg aatcccttgg 2460
catggatacc gacatcagca ttaccaccag agaatttatc cgttggctga acgacgaagg 2520
cgtggacttc gagtccctgg aggacagcca gtttgatgat cttatcggta tggaaactgg 2580
cgcgtctatc atttttggta ataccggtgg cgttatggag gctgctatga gaacggcgta 2640
caaactgatt acggataagg agccgccacc gtatgcactg acccacctgg aggatgtgcg 2700
cggtatgaac ggtgtgaaag aggcgacggt tcagctgggt gatgacgtga ctctgagcgt 2760
tgcggtggtt cacggcggta agaacacccg tgattttttg aatgcgctga aggagaacgg 2820
caagcactat gacttcatcg aagtcatggc atgtccgggt gggtgcattg gtggcggtgg 2880
ccaaccgcgt accaaactgc cgcaggcggt taagaccaaa gaggcgcgta tcggcggtct 2940
gtacaaggcg gacgaagaat ataagtacgt tgccagctat gaatcaccgg aaatccaaga 3000
gttgtacaag aacttcttgg gagaacctct gggtcacaaa gcacatgaat tgctgcatac 3060
ccacttcacc gatcgcagcg cacagttagg cgaccgcaaa gatgttgtcc cggagacctg 3120
tccgaccagc ccgaaataca agggttaggg atccgggtcg aggagaagga tgagaaaaag 3180
tgaccaggca tcaaataaaa cgaaaggctc agtcgaaaga ctgggccttt cgttttatct 3240
gttgtttgtc ggtgaacgct ctctactaga gtcacactgg ctcaccttcg ggtgggcctt 3300
tctgcgttta tatactagag ggctttacac tttatgcttc cggctcgtat gttgtgtgga 3360
aagaaggaga tatacatatg gctcatagtt taagcgcaca ttcccgtcag gccggagatc 3420
gcaaactggg cgcaggtgcg gcatctagcc gcccatcatg tccttctcgc cgcattgtcc 3480
gcgtggcggc ccatgcttct gcgtccaagg cgactcccga tgtacctgtt gacgatcttc 3540
ctcctgcgca tgcccgtgca gcagtagcgg ccgctaaccg tcgtgcgcgc gctatggcat 3600
cagcggaggc cgcggcagag accctgggcg atttcctggg cttagggaag ggggggcttt 3660
cgccgggcgc aaccgccaac cttgatcgtg agcaagtatt aggtgtgttg gaggcggtct 3720
ggcgtcgtgg agaccttaat ctggagcgtg cgttgtacag ccatgccaat gcggtgacta 3780
acaaatactg tggtgggggg gtctactatc gcggccttgt ggagttcagt aatatttgcc 3840
aaaacgattg ctcatattgt gggattcgca acaatcaaaa agaagtttgg cgctatacta 3900
tgccggttga agaggtggtc gaggtagcta agtgggcgct tgaaaacggc attcgcaaca 3960
ttatgttgca agggggtgaa ttaaagacag agcaacgctt agcctacttg gaggcatgcg 4020
tccgtgcgat tcgcgaggag acaacgcagt tagaccttga aatgcgcgca cgtgccgcga 4080
gtacgacaac agcggaagcg gcagccagtg cacaggcaga cgccgaagct aaacgcggcg 4140
agccagaatt gggtgtggtc gtatccttaa gcgtcggaga acttcctatg gaacagtatg 4200
agcgtttgtt ccgcgccggc gcccgtcgct atctgatccg cattgaaacc tcgaatcccg 4260
acctgtacgc ggcacttcac ccggagccga tgtcctggca cgcgcgtgta gaatgcctgc 4320
gcaacctgaa gaaagctggg tatatgttgg gcacaggagt gatggtcggc ttgccgggac 4380
aaaccttaca cgacctggct ggggatgtca tgttctttcg cgacattaaa gcggacatga 4440
tcggtatggg ccccttcatt acgcagcctg ggacgcctgc aactgataag tggaccgcgc 4500
tgtatccgaa cgccaataag aacagccaca tgaaatctat gttcgatctg accactgcta 4560
tgaatgcact tgtacgtatt acgatgggga acgtaaatat cagtgctacg actgcattac 4620
aagcgattat ccccactgga cgtgaaattg cgcttgagcg cggcgcaaat gttgtcatgc 4680
ctattttaac gcctactcag tatcgcgagt cctatcagtt atatgagggt aagccctgca 4740
ttacggatac tgctgttcag tgtcgtcgtt gcctggacat gcgtttgcac tccgttggca 4800
aaacgtctgc ggccggagtt tggggcgatc ctgcttcgtt cttgcatccc atcgttggcg 4860
tcccagtccc gcacgacttg tcatcacctg ctttggccgc tgctgcaagt gcggattttc 4920
acgaggttgg cgcaggtccc tggaacccca tccgactaga gcgtctggtt gaagtgccgg 4980
accgttaccc tgaccccgat aaccacggac gcaaaaaggc aggagccggg aaaggaggca 5040
aggcgcatga ctctcacgac gatggcgatc acgacgacca ccaccaccac cacggagctg 5100
cccccgcggg tgcagcggct ggaaagggta ccggtgcagc tgcaattggt ggcggagcgg 5160
gggctagccg tcaacgcgta gcaggggctg ctgccgcctc tgctcgtctg tgtgcgggag 5220
ctcgccgcgc tggccgtgtt gtcgcgtcgc cattgcgccc agctgccgct tgccgtggtg 5280
tggccgtcaa ggccgcagct gctgctgcgg gtgaagacgc tggtgctggt acgtctggcg 5340
taggttcaaa tattgttacg tctcccggaa tcgctagcac tacggcacat ggtgttcctc 5400
gtatcaatat tggggtgttc ggcgtgatga atgcaggaaa gtctacactt gtgaatgctc 5460
tggcgcaaca ggaagcatgc attgttgact caacccccgg cacgaccgca gatgtaaaaa 5520
cagttttgct tgagcttcat gcccttggac cagccaagtt gctggacaca gccggattag 5580
acgaagtcgg tggacttggg gataaaaagc gccgtaaagc cctgaatacg ctgaaggagt 5640
gcgatgttgc tgtgctggtt gttgacactg atacggcagc cgccgcaatc aaatcgggac 5700
gccttgctga agccctggaa tgggaatcga aagtaatgga acaggcacac aagtataatg 5760
tcagtcctgt actgcttctg aatgtaaaat cacgcgggct gcctgaagcg caggcagcta 5820
gcatgcttga ggcggtcgct ggtatgcttg acccatccaa gcaaatccct cgtatgtcgc 5880
tggatttagc gtccaccccc ctgcacgagc gtagtacgat tacgtctgca ttcgtcaagg 5940
aaggagcagt gcgcagttca cgctatgggg ctcctctgcc ggggtgtttg ccccgttggt 6000
ctcttggacg caacgcccgc ttactgatgg taatcccgat ggatgccgaa accccaggtg 6060
gacgtcttct tcgtcctcaa gcgcaagtta tggaggaagc aatccgccat tgggctaccg 6120
tgctttccgt acgcctggat ttagacgccg cacgtggcaa attggggccc gaggcctgtg 6180
agatggagcg tcagcgtttc gacggggtaa ttgctatgat ggaacgtaat gacggaccca 6240
ccctggtggt gacagattct caagcgatcg atgttgtaca cccttggacc ctggaccgct 6300
catcaggacg tccgttggtt ccaattacta cctttagcat cgctatggcg taccaacaaa 6360
acggcggacg tttggacccg tttgtggaag gattggaagc attggagacg ttacaagatg 6420
gggatcgcgt tcttatttcg gaagcgtgta atcataaccg tatcacctcc gcttgcaacg 6480
acattggaat ggtgcagatc cctaacaagc tggaggcagc acttggcggg aaaaagttac 6540
aaatcgaaca tgcgtttggt cgcgagtttc ccgagcttga gagtgggggt atggatggat 6600
tgaagttagc gatccattgt ggagggtgta tgatcgacgc tcagaaaatg cagcagcgta 6660
tgaaagactt gcatgaggct ggggtgccgg tcactaatta tggggtgttt ttctcttggg 6720
cagcttggcc cgacgccctt cgtcgcgcat tggaaccgtg gggagtggag ccaccggtag 6780
gtactcctgc tacccccgca gccgcgcctg ctacggcagc gtccggggta taatactact 6840
agagggcttt acactttatg cttccggctc gtatgttgtg tggaaagaag gagatataca 6900
tatgtcggtc cccctacagt gcaatgcagg ccgtcttttg gcgggccagc gcccctgcgg 6960
cgtccgcgcg cgtctgaacc gccgtgtatg tgttccagtg accgcacacg gcaaagcatc 7020
tgccacgcgc gaatacgctg gtgactttct tccagggacc actattagtc atgcgtggtc 7080
cgtggagcgt gaaactcatc accgttatcg taatccggcc gagtggatta acgaggctgc 7140
catccacaag gcgcttgaaa cgtcaaaggc tgatgctcag gacgcaggac gcgtgcgtga 7200
gattttggcg aaggctaagg aaaaggcttt tgttactgaa catgcgcctg taaatgcgga 7260
aagtaaatcc gaatttgtac aagggcttac cttggaggag tgcgccacct taattaacgt 7320
tgattctaat aatgtcgagt tgatgaatga aatcttcgac actgcgcttg ctatcaaaga 7380
acgtatctac gggaaccgcg tcgtgctgtt cgcgcccttg tacattgcta atcattgtat 7440
gaacacttgc acttattgtg cgtttcgctc agccaataag ggcatggaac gctctattct 7500
gacagacgat gacctgcgtg aagaagttgc cgccttgcaa cgtcaaggtc atcgccgcat 7560
tttagccctt actggagaac atcctaaata cactttcgac aatttcttgc atgcagtcaa 7620
tgtaatcgct tccgtgaaga cagagcctga agggtccatt cgccgtatca atgtcgaaat 7680
cccaccactt agtgtctcag acatgcgccg ccttaagaat acagattcag ttggcacgtt 7740
cgttctgttt caagagacat atcaccgcga cacattcaag gtaatgcatc cgtcaggtcc 7800
aaagagcgac tttgattttc gcgtcttgac ccaggaccgc gccatgcgcg caggcttgga 7860
cgatgttggt attggtgctt tattcgggtt atatgattac cgttatgaag tttgcgccat 7920
gttaatgcat agcgagcatt tggaacgtga gtacaacgca ggaccacata ctatctctgt 7980
tccccgtatg cgccccgcgg acggaagcga gcttagtatc gcgcctcctt atcctgttaa 8040
tgatgctgat tttatgaaat tagttgcggt ccttcgtatt gctgtaccat acacaggtat 8100
gatccttagc actcgtgaat caccagaaat gcgctcggcg cttctgaagt gtgggatgag 8160
tcaaatgagt gccggctcgc gcactgatgt aggagcctat cacaaagatc acacgttaag 8220
tacagaggcg aatttgagta agttagctgg gcagtttacc ttgcaggatg aacgtccaac 8280
taatgagatt gttaagtggc tgatggagga gggctatgtc ccgtcttggt gcacagcttg 8340
ttaccgtcaa ggtcgtacgg gcgaagactt catgaacatc tgtaaggctg gtgacattca 8400
cgatttctgt catcccaata gtctgcttac gcttcaagag taccttatgg attatgcaga 8460
tccagacctt cgtaagaaag gcgagcaagt aattgcccgt gagatgggac cggacgcctc 8520
tgagccgtta tcggcgcaaa gccgtaagcg ccttgaacgc aagatgaaac aagtattgga 8580
gggggagcac gatgtatatc tttaaccagg catcaaataa aacgaaaggc tcagtcgaaa 8640
gactgggcct ttcgttttat ctgttgtttg tcggtgaacg ctctctacta gagtcacact 8700
ggctcacctt cgggtgggcc tttctgcgtt tata 8734
<210> 40
<211> 8704
<212> DNA
<213> Artificial Sequence
<220>
<223> Exemplary HPGC (hydrogen producing gene cluster) with codon
optimised nucleic acid sequence encoding HydA (Hyd1) from
Peptoclostridium bifermentans, 5' - 3'
<400> 40
ctagagggct ttacacttta tgcttccggc tcgtatgttg tgtggaaaga aggagatata 60
catatggcga tgcgttccac atttgctgcg cgtgtcggtg ccaaaccggc agtgcgtggg 120
gcgcgtcccg cgtcgcgtat gtcttgcatg gcctataagg ttacactgaa aacgccatca 180
ggcgataaaa caatcgaatg tccggcggac acctatatcc tggatgctgc ggaggaagcc 240
gggctggacc ttccctatag ttgccgtgcg ggcgcctgtt catcctgtgc tggcaaagtg 300
gcagctggaa cggtagatca atctgatcag tcctttctgg atgacgctca gatggggaac 360
ggattcgtcc tgacatgtgt cgcgtatcct acaagcgact gcactatcca aactcaccaa 420
gaggaggctt tatattaaaa gaaggagata tacatatgca aactgttcgc gctccagcag 480
cttcaggtgt tgccacacgt gtcgcaggtc gtcgtatgtg tcgtccggtt gcggcgacga 540
aggcttccac ggctgttacc acagacatgt cgaagcgcac tgttccaacc aagttagagg 600
aaggtgaaat gccgttgaac acgtacagta ataaagctcc gttcaaggca aaggttcgtt 660
ccgtggaaaa aatcacagga ccaaaagcca caggtgagac gtgccacatc attattgaaa 720
ccgaggggaa gatcccgttt tgggagggac aatcgtacgg tgtaattccg ccggggacca 780
agatcaactc taagggaaaa gaagtgcctc atggtactcg tctttattcg attgcttcta 840
gtcgttacgg agatgacttc gatggtcaaa cggcatcgct gtgtgttcgc cgcgcggtat 900
acgtcgatcc agagactgga aaggaggacc ccgcgaaaaa aggactgtgt agtaactttt 960
tgtgtgatgc cacaccaggc acggaaattt ccatgacagg gcccacagga aaagtattgc 1020
ttctgccagc agacgcgaac gcgccattaa tctgtgtcgc aacggggact ggaatcgcgc 1080
cttttcgctc attctggcgc cgttgcttca tcgagaatgt cccaagttat aagttcactg 1140
gccttttctg gttgtttatg ggtgtcgcta actctgatgc taaattgtac gatgaggaac 1200
tgcaagctat cgcaaaagcg tatccgggac aattccgcct ggactatgcc ttgtctcgtg 1260
aacaaaataa tcgcaagggc gggaaaatgt acatccaaga taaggttgaa gagtatgccg 1320
acgaaatttt cgatttattg gataatgggg cgcacatgta cttctgcggg ttaaagggga 1380
tgatgccagg catccaagat atgttagaac gcgttgcaaa agaaaagggg ctgaactacg 1440
aagagtgggt cgaggggtta aagcacaaga atcaatggca tgttgaagtc tactaaccag 1500
gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta tctgttgttt 1560
gtcggtgaac gctctctact agagtcacac tggctcacct tcgggtgggc ctttctgcgt 1620
ttatatacta gagggcttta cactttatgc ttccggctcg tatgttgtgt ggaaagaagg 1680
agatatacat atgtccgcat tagtacttaa gcccgggatg aagcacctat ttacagaaaa 1740
agtagttccg atcgagctgg ataacccgtc cattcagatt gactttgata agtgcatcaa 1800
gtgcggtctg tgtaaacgcg tttgtgaaaa cgagattggt gttaatggtt atttcgacct 1860
ggagaagacc ggtgacatcg ccatctgcat caactgcggc caatgtgttc aggcatgtcc 1920
aaaaaaggcg atcacccagg ttatcgatgt ggatcgcgtg aaggaagcga tcaacgatcc 1980
ggaaaagatt gttatcttca gcacagcgcc agctgtgcgt gtcgcactgg gcgaagaatt 2040
taacctggaa gaaggcgcgt atgttgagga caaaatggtg gacgccctgc gtaaactggg 2100
tggagattac gtttttgacg ttacctttgg cgccgatatg accatcatgg aagaggcgaa 2160
cgaacttgtt tctcgtatca aaaacggcaa aggcaaaacc ccgcaattta ccagctgctg 2220
cccgtcctgg gttaagttcg cggaaacgtt ctatccggag ttgattccga atctgtctac 2280
cacgaaatct ccgattggca ttcagggtgc tgtcatcaag acctatttcg cacagaaagc 2340
aaatatcgac ccggagaaaa tcgtgaacgt aaccattact ccgtgcaccg ctaagaagta 2400
cgaaattgac cgtccggaga tgaatgcgag cgcaaaatac aacaaaagcg aaaatatgag 2460
agataatgac atcatcctca ccactaagga gctggcgcag tggctccgtg acgaagagat 2520
cgacttcaac gctttggagg gctcgaaatt tgacaacatc ttgggcttgg gtagcggtgc 2580
gggcattatc ttcggtaata gcggtggtgt gatggaagcc gcggtgcgca cggtctacaa 2640
tatcctcacc catgagaacc cacataaaga actgctgcac tttaatccgg ttcgtggtct 2700
ggaagacgtg aaggaggcta cccttaccat tggcgatacc accctgcgcc tggcagcggt 2760
gcaaggcacg gcgaacgtgc gtacgttgat cgaaaagctg aaatccggtg aggtggagta 2820
cgacttcata gaggtaatga cttgcaaagg tggttgtatt ggtggcgctg gtcaaccgaa 2880
gatgaaagcg cgtattagca atgagatgcg tctcaagcgc attgagggtc tgtacgataa 2940
ggacaagcac attgcggtca aatgcagcta tgaaaacccg gatgtcatca acgtgtacaa 3000
ggagttcttc aaacaaccgc tgagccattt atcccacgag ttgctgcaca ccacctttga 3060
aagcaagcac gatatgttgg gtctgaagga tgacaacaac gtttcggata ttggctaggg 3120
atccgggtcg aggagaagga tgagaaaaag tgaccaggca tcaaataaaa cgaaaggctc 3180
agtcgaaaga ctgggccttt cgttttatct gttgtttgtc ggtgaacgct ctctactaga 3240
gtcacactgg ctcaccttcg ggtgggcctt tctgcgttta tatactagag ggctttacac 3300
tttatgcttc cggctcgtat gttgtgtgga aagaaggaga tatacatatg gctcatagtt 3360
taagcgcaca ttcccgtcag gccggagatc gcaaactggg cgcaggtgcg gcatctagcc 3420
gcccatcatg tccttctcgc cgcattgtcc gcgtggcggc ccatgcttct gcgtccaagg 3480
cgactcccga tgtacctgtt gacgatcttc ctcctgcgca tgcccgtgca gcagtagcgg 3540
ccgctaaccg tcgtgcgcgc gctatggcat cagcggaggc cgcggcagag accctgggcg 3600
atttcctggg cttagggaag ggggggcttt cgccgggcgc aaccgccaac cttgatcgtg 3660
agcaagtatt aggtgtgttg gaggcggtct ggcgtcgtgg agaccttaat ctggagcgtg 3720
cgttgtacag ccatgccaat gcggtgacta acaaatactg tggtgggggg gtctactatc 3780
gcggccttgt ggagttcagt aatatttgcc aaaacgattg ctcatattgt gggattcgca 3840
acaatcaaaa agaagtttgg cgctatacta tgccggttga agaggtggtc gaggtagcta 3900
agtgggcgct tgaaaacggc attcgcaaca ttatgttgca agggggtgaa ttaaagacag 3960
agcaacgctt agcctacttg gaggcatgcg tccgtgcgat tcgcgaggag acaacgcagt 4020
tagaccttga aatgcgcgca cgtgccgcga gtacgacaac agcggaagcg gcagccagtg 4080
cacaggcaga cgccgaagct aaacgcggcg agccagaatt gggtgtggtc gtatccttaa 4140
gcgtcggaga acttcctatg gaacagtatg agcgtttgtt ccgcgccggc gcccgtcgct 4200
atctgatccg cattgaaacc tcgaatcccg acctgtacgc ggcacttcac ccggagccga 4260
tgtcctggca cgcgcgtgta gaatgcctgc gcaacctgaa gaaagctggg tatatgttgg 4320
gcacaggagt gatggtcggc ttgccgggac aaaccttaca cgacctggct ggggatgtca 4380
tgttctttcg cgacattaaa gcggacatga tcggtatggg ccccttcatt acgcagcctg 4440
ggacgcctgc aactgataag tggaccgcgc tgtatccgaa cgccaataag aacagccaca 4500
tgaaatctat gttcgatctg accactgcta tgaatgcact tgtacgtatt acgatgggga 4560
acgtaaatat cagtgctacg actgcattac aagcgattat ccccactgga cgtgaaattg 4620
cgcttgagcg cggcgcaaat gttgtcatgc ctattttaac gcctactcag tatcgcgagt 4680
cctatcagtt atatgagggt aagccctgca ttacggatac tgctgttcag tgtcgtcgtt 4740
gcctggacat gcgtttgcac tccgttggca aaacgtctgc ggccggagtt tggggcgatc 4800
ctgcttcgtt cttgcatccc atcgttggcg tcccagtccc gcacgacttg tcatcacctg 4860
ctttggccgc tgctgcaagt gcggattttc acgaggttgg cgcaggtccc tggaacccca 4920
tccgactaga gcgtctggtt gaagtgccgg accgttaccc tgaccccgat aaccacggac 4980
gcaaaaaggc aggagccggg aaaggaggca aggcgcatga ctctcacgac gatggcgatc 5040
acgacgacca ccaccaccac cacggagctg cccccgcggg tgcagcggct ggaaagggta 5100
ccggtgcagc tgcaattggt ggcggagcgg gggctagccg tcaacgcgta gcaggggctg 5160
ctgccgcctc tgctcgtctg tgtgcgggag ctcgccgcgc tggccgtgtt gtcgcgtcgc 5220
cattgcgccc agctgccgct tgccgtggtg tggccgtcaa ggccgcagct gctgctgcgg 5280
gtgaagacgc tggtgctggt acgtctggcg taggttcaaa tattgttacg tctcccggaa 5340
tcgctagcac tacggcacat ggtgttcctc gtatcaatat tggggtgttc ggcgtgatga 5400
atgcaggaaa gtctacactt gtgaatgctc tggcgcaaca ggaagcatgc attgttgact 5460
caacccccgg cacgaccgca gatgtaaaaa cagttttgct tgagcttcat gcccttggac 5520
cagccaagtt gctggacaca gccggattag acgaagtcgg tggacttggg gataaaaagc 5580
gccgtaaagc cctgaatacg ctgaaggagt gcgatgttgc tgtgctggtt gttgacactg 5640
atacggcagc cgccgcaatc aaatcgggac gccttgctga agccctggaa tgggaatcga 5700
aagtaatgga acaggcacac aagtataatg tcagtcctgt actgcttctg aatgtaaaat 5760
cacgcgggct gcctgaagcg caggcagcta gcatgcttga ggcggtcgct ggtatgcttg 5820
acccatccaa gcaaatccct cgtatgtcgc tggatttagc gtccaccccc ctgcacgagc 5880
gtagtacgat tacgtctgca ttcgtcaagg aaggagcagt gcgcagttca cgctatgggg 5940
ctcctctgcc ggggtgtttg ccccgttggt ctcttggacg caacgcccgc ttactgatgg 6000
taatcccgat ggatgccgaa accccaggtg gacgtcttct tcgtcctcaa gcgcaagtta 6060
tggaggaagc aatccgccat tgggctaccg tgctttccgt acgcctggat ttagacgccg 6120
cacgtggcaa attggggccc gaggcctgtg agatggagcg tcagcgtttc gacggggtaa 6180
ttgctatgat ggaacgtaat gacggaccca ccctggtggt gacagattct caagcgatcg 6240
atgttgtaca cccttggacc ctggaccgct catcaggacg tccgttggtt ccaattacta 6300
cctttagcat cgctatggcg taccaacaaa acggcggacg tttggacccg tttgtggaag 6360
gattggaagc attggagacg ttacaagatg gggatcgcgt tcttatttcg gaagcgtgta 6420
atcataaccg tatcacctcc gcttgcaacg acattggaat ggtgcagatc cctaacaagc 6480
tggaggcagc acttggcggg aaaaagttac aaatcgaaca tgcgtttggt cgcgagtttc 6540
ccgagcttga gagtgggggt atggatggat tgaagttagc gatccattgt ggagggtgta 6600
tgatcgacgc tcagaaaatg cagcagcgta tgaaagactt gcatgaggct ggggtgccgg 6660
tcactaatta tggggtgttt ttctcttggg cagcttggcc cgacgccctt cgtcgcgcat 6720
tggaaccgtg gggagtggag ccaccggtag gtactcctgc tacccccgca gccgcgcctg 6780
ctacggcagc gtccggggta taatactact agagggcttt acactttatg cttccggctc 6840
gtatgttgtg tggaaagaag gagatataca tatgtcggtc cccctacagt gcaatgcagg 6900
ccgtcttttg gcgggccagc gcccctgcgg cgtccgcgcg cgtctgaacc gccgtgtatg 6960
tgttccagtg accgcacacg gcaaagcatc tgccacgcgc gaatacgctg gtgactttct 7020
tccagggacc actattagtc atgcgtggtc cgtggagcgt gaaactcatc accgttatcg 7080
taatccggcc gagtggatta acgaggctgc catccacaag gcgcttgaaa cgtcaaaggc 7140
tgatgctcag gacgcaggac gcgtgcgtga gattttggcg aaggctaagg aaaaggcttt 7200
tgttactgaa catgcgcctg taaatgcgga aagtaaatcc gaatttgtac aagggcttac 7260
cttggaggag tgcgccacct taattaacgt tgattctaat aatgtcgagt tgatgaatga 7320
aatcttcgac actgcgcttg ctatcaaaga acgtatctac gggaaccgcg tcgtgctgtt 7380
cgcgcccttg tacattgcta atcattgtat gaacacttgc acttattgtg cgtttcgctc 7440
agccaataag ggcatggaac gctctattct gacagacgat gacctgcgtg aagaagttgc 7500
cgccttgcaa cgtcaaggtc atcgccgcat tttagccctt actggagaac atcctaaata 7560
cactttcgac aatttcttgc atgcagtcaa tgtaatcgct tccgtgaaga cagagcctga 7620
agggtccatt cgccgtatca atgtcgaaat cccaccactt agtgtctcag acatgcgccg 7680
ccttaagaat acagattcag ttggcacgtt cgttctgttt caagagacat atcaccgcga 7740
cacattcaag gtaatgcatc cgtcaggtcc aaagagcgac tttgattttc gcgtcttgac 7800
ccaggaccgc gccatgcgcg caggcttgga cgatgttggt attggtgctt tattcgggtt 7860
atatgattac cgttatgaag tttgcgccat gttaatgcat agcgagcatt tggaacgtga 7920
gtacaacgca ggaccacata ctatctctgt tccccgtatg cgccccgcgg acggaagcga 7980
gcttagtatc gcgcctcctt atcctgttaa tgatgctgat tttatgaaat tagttgcggt 8040
ccttcgtatt gctgtaccat acacaggtat gatccttagc actcgtgaat caccagaaat 8100
gcgctcggcg cttctgaagt gtgggatgag tcaaatgagt gccggctcgc gcactgatgt 8160
aggagcctat cacaaagatc acacgttaag tacagaggcg aatttgagta agttagctgg 8220
gcagtttacc ttgcaggatg aacgtccaac taatgagatt gttaagtggc tgatggagga 8280
gggctatgtc ccgtcttggt gcacagcttg ttaccgtcaa ggtcgtacgg gcgaagactt 8340
catgaacatc tgtaaggctg gtgacattca cgatttctgt catcccaata gtctgcttac 8400
gcttcaagag taccttatgg attatgcaga tccagacctt cgtaagaaag gcgagcaagt 8460
aattgcccgt gagatgggac cggacgcctc tgagccgtta tcggcgcaaa gccgtaagcg 8520
ccttgaacgc aagatgaaac aagtattgga gggggagcac gatgtatatc tttaaccagg 8580
catcaaataa aacgaaaggc tcagtcgaaa gactgggcct ttcgttttat ctgttgtttg 8640
tcggtgaacg ctctctacta gagtcacact ggctcacctt cgggtgggcc tttctgcgtt 8700
tata 8704
Claims (34)
- 수소 가스를 생산하기 위한 다음을 포함하는 재조합 미생물:
- 미생물이 수소를 생산할 수 있도록 하는 하나 이상의 단백질을 암호화하는 외인성 핵산 서열,
- 여기서 하나 이상의 단백질은 Fe-Fe 의존성 수소화효소, 바람직하게는 HydA를 포함,
- 여기서 핵산 서열은 미생물에서 핵산 서열의 발현을 가능하게 하기 위한 하나 이상의 촉진제와 작동 가능하게 연결, 및
- 여기서 미생물 또는 세포는 5탄당 인산 경로를 통한 탄소의 이용을 촉진하는 유전자 변형을 포함함. - 제1항에 있어서, 상기 핵산 서열은 단백질 페레독신 NADP 환원효소 (ferredoxin NADP reductase, FNR) 및 페레독신을 암호화하는 것인, 재조합 미생물.
- 제1항 또는 제2항에 있어서, 상기 핵산 서열은 수소화효소의 성숙 및 활성화를 가능하게 하는 적어도 하나의 조립 단백질을 암호화하는 것인, 재조합 미생물.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 5탄당 인산 경로를 통한 탄소의 이용을 촉진하는 유전자 변형은 포스포프룩토키나아제 (phosphofructokinase), 피루브산 키나아제 (pyruvate kinase), 글리세레이트 뮤테이즈 (glycerate mutase), 6-포스포글루코네이트 탈수소효소 (6-phosphogluconoate dehydratase) 및 2-케토-3-디옥시-6-포스포글루코네이트 알도라제 (2-keto-3-deoxy-6-phosphogluconate aldolase)로부터 선택된 미생물의 하나 이상의 내인성 단백질의 활성 또는 수준을 감소시키거나 억제하는 것인, 재조합 미생물.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 5탄당 인산 경로를 통한 탄소의 이용을 촉진하는 유전자 변형은 5탄당 인산 경로의 하나 이상의 단백질 및 NADPH 조절 단백질의 수준 또는 활성을 증가시키고, 여기서 유전자 변형은 a) 하나 이상의 단백질을 암호화하는 유전자의 프로모터 영역의 변형, 또는 b) 하나 이상의 단백질을 암호화하는 내인성 유전자를 이종 유전자 서열로 대체하는 것인, 재조합 미생물.
- 제2항 내지 제5항 중 어느 한 항에 있어서, 상기 FNR 및 페레독신 단백질은 클라미도모나스 레인하티 (Chlamydomonas reinhardtii)로부터 유래되거나 또는 클라미도모나스 레인하티 (Chlamydomonas reinhardtii)로부터 FNR 및 페로독신 단백질의 기능적으로 동등한 동족체 또는 유도체인 것인, 재조합 미생물.
- 제3항 내지 제6항 중 어느 한 항에 있어서, 상기 적어도 하나의 조립 단백질은 HydEF 및 HydG 또는 이들의 기능적으로 동등한 동족체 또는 유도체로부터 선택되는 것인, 재조합 미생물.
- 제7항에 있어서, 상기 핵산 서열은 클라미도모나스 레인하티 (Chlamydomonas reinhardtii)로부터의 HydEF 및 HydG, 또는 클라미도모나스 레인하티 (Chlamydomonas reinhardtii)부터의 HydEF, HydG 단백질의 기능적으로 동등한 동족체 또는 유도체를 암호화하는 것인, 재조합 미생물.
- 제1항 내지 제8항 중 어느 한 항에 있어서, 상기 Fe-Fe 의존성 수소화효소는 클라미도모나스 레인하티 (Chlamydomonas reinhardtii), 볼복스 카르테리 (Volvox carteri), 지아디아 람블리아 (Giardia lamblia), 엔타모에바 누탈리 (Entamoeba nuttalli), 일로박터 폴리트러포스 (Ilyobacter polytrophus), 트리코모나스 바지날리스 (Trichomonas vaginalis), 메가스파에라 마이크로누시포미스 (Megasphaera micronuciformis), 베일로넬라 파르불라 (Veillonella parvula), 베일로넬라 아티피카 (Veillonella atypica) 및 펩토클로스트리디움 비퍼멘탄스 (Peptoclostridium bifermentans)로 이루어진 군으로부터 선택된 미생물로부터의 HydA 단백질 또는 이의 기능적으로 동등한 동족체 또는 유도체인 것인, 재조합 미생물.
- 제9항에 있어서, 상기 HydA 단백질, 또는 이의 기능적으로 동등한 동족체 또는 그 유도체는 클라미도모나스 레인하티 (Chlamydomonas reinhardtii)로부터 유래된 것인, 재조합 미생물.
- 제1항 내지 제10항 중 어느 한 항에 있어서, 상기 미생물은 에쉬리키아 콜라이 (Escherichia coli, E coli)의 균주인, 재조합 미생물.
- 제1항 내지 제11항 중 어느 한 항에 있어서, 상기 외인성 핵산 서열은 단일 폴리뉴클레오티드 구조체로 제공되는 것인, 재조합 미생물.
- 제1항 내지 제12항 중 어느 한 항에 있어서, 상기 외인성 핵산 서열은 상기 미생물에서 최적화된 발현을 제공하도록 최적화된 코돈인 것인, 재조합 미생물.
- 세포가 수소를 생산할 수 있게 하는 단백질을 암호화하는 외인성 핵산을 포함하는 E coli 세포로서, 상기 단백질은 폴리펩타이드 HydEF, HydG, HydA, 페레독신 및 FNR로 포함하거나 구성되거나 또는 본질적으로 구성되며,
여기서 상기 HydEF, HydG, 페레독신 및 FNR은 클라미도모나스 레인하티 (Chlamydomonas reinhardtii)로부터 유래되거나, 클라미도모나스 레인하티 (Chlamydomonas reinhardtii)로부터의 HydEF, HydG, 페레독신 및 FNR의 기능적으로 동등한 동족체 또는 유도체이고,
여기서 a) 상기 세포는 포스포프룩토키나아제 (phosphofructokinase), 피루브산 키나아제 (pyruvate kinase), 글리세레이트 뮤테이즈 (glycerate mutase), 6-포스포글루코네이트 탈수소효소 (6-phosphogluconoate dehydratase) 및 2-케토-3-디옥시-6-포스포글루코네이트 알도라제 (2-keto-3-deoxy-6-phosphogluconate aldolase)로 이루어진 군으로부터 선택된 하나 이상의 내인성 단백질의 활성 또는 수준을 감소 또는 억제하는 유전적 변형을 포함하고, 및/또는 b) 상기 세포는 5탄당 인산 경로의 하나 이상의 단백질 및 NADPH 조절 단백질의 수준 또는 활성을 증가시키는 유전자 변형을 포함하는, E coli 세포. - 제14항에 있어서, 상기 HydA 단백질은 클라미도모나스 레인하티 (Chlamydomonas reinhardtii), 볼복스 카르테리 (Volvox carteri), 지아디아 람블리아 (Giardia lamblia), 엔타모에바 누탈리 (Entamoeba nuttalli), 일로박터 폴리트러퍼스 (Ilyobacter polytrophus), 트리코모나스 바지날리스 (Trichomonas vaginalis), 메가스파에라 마이크로누시포미스 (Megasphaera micronuciformis), 베일로넬라 파르불라 (Veillonella parvula), 베일로넬라 아티피카 (Veillonella atypica) 및 펩토클로스트리디움 비퍼멘탄스 (Peptoclostridium bifermentans)로 이루어진 군으로부터 선택된 미생물로부터의 HydA 단백질 또는 이의 기능적으로 동등한 동족체 또는 유도체인, E coli 세포.
- 상기 청구항들 중 어느 한 항의 재조합 미생물 또는 세포로서, 여기서 상기 미생물 또는 세포 미생물은 포스포프룩토키나아제, 피루브산 키나아제, 글리세레이트 뮤테이즈, 6-포스포글루코네이트 탈수소효소 및 2-케토-3-디옥시-6-포스포글루코네이트 알도라제를 각각 암호화하는 유전자 pfkA, pps, gpmA/gpmM, edd 및 eda 중 하나 이상에 해당하는 핵산 서열을 부분적으로 또는 완전히 절제하는 유전자 변형을 포함하는 재조합 미생물 또는 세포.
- 제16항에 있어서, 상기 유전자 변형은 상기 유전자에 부분적인 기능 상실 돌연변이를 초래하는 것인, 재조합 미생물 또는 세포.
- 제16항 또는 제17항에 있어서, 상기 유전자 변형은 포스포프룩토키나아제 및/또는 글리세레이트 뮤테이즈의 활성을 감소 또는 억제하는 것인, 재조합 미생물 또는 세포.
- 제5항 또는 제14항에 있어서, 상기 5탄당 인산 경로의 하나 이상의 단백질 및 NADPH 조절 단백질은 포스포글루코뮤타제 (phosphoglucomutase), 글루코스-6-인산 탈수소효소 (glucose-6-phosphate dehydrogenase), 6-포스포글루코노락토나제 (6-phosphogluconolactonase), 글리세르알데하이드-3-인산 탈수소효소 (glyceraldehyde-3-phosphate dehydrogenase), 6-포스포글루코네이트 탈수소효소 (6-phosphogluconate dehydrogenase), 트랜스케톨라아제 (transketolase), 트랜스알돌라아제 (transaldolase), NAD키나아제 (NAD kinase) 및 가용성 피리딘 뉴클레오티드 트랜스히드로게나아제 (soluble pyridine nucleotide transhydrogenase)로 이루어진 군으로부터 선택되는 것인, 재조합 미생물 또는 세포.
- 제5항에 있어서, 상기 하나 이상의 단백질을 암호화하는 유전자의 프로모터 영역은 gapA 또는 osmYp 프로모터로 대체된 것인, 재조합 미생물 또는 세포.
- 제20항에 있어서, 상기 글루코스-6-인산 탈수소효소를 암호화하는 zwf 유전자의 프로모터가 gapA 또는 osmY 프로모터 또는 혐기성으로 유도된 nar 또는 nirB 프로모터로 대체된 것인, 재조합 미생물 또는 세포.
- 제20항 또는 제21항에 있어서, 상기 6-포스포글루코네이트 탈수소효소를 암호화하는 gnd 유전자의 프로모터가 gapA 또는 osmY 프로모터로 대체된 것인, 재조합 미생물 또는 세포.
- 제20항 내지 제22항 중 어느 한 항에 있어서, 상기 포스포글루코뮤타제를 암호화하는 pgi 유전자의 프로모터가 gapA 또는 osmY 프로모터로 대체된 것인, 재조합 미생물 또는 세포.
- 제20항 내지 제23항 중 어느 한 항에 있어서, 상기 6-포스포글루코노락토나제를 암호화하는 유전자 pgl의 프로모터가 gapA 또는 osmY 프로모터로 대체된 것인, 재조합 미생물 또는 세포.
- 제19항에 있어서, 상기 글루코스-6-인산 탈수소효소를 암호화하는 유전자 (zwf)가 자이고모나스 모빌리스 (Zygomonas mobilis)의 zwf 유전자로 대체된 것인, 재조합 미생물 또는 세포.
- 제19항에 있어서, 상기 6-포스포글루코네이트 탈수소효소를 암호화하는 유전자 (gnd)가 코리네박테리움 글루타미쿰 (Corynebacterium glutamicum)의 gnd 유전자로 대체된 것인, 재조합 미생물 또는 세포.
- 제19항에 있어서, 상기 글리세르알데하이드-3-인산 탈수소효소를 암호화하는 유전자 (gapA)가 클로스트리듐 아세토부틸리쿰 (Clostridium aceteobutylicum)의 gapC 유전자로 대체된 것인, 재조합 미생물 또는 세포.
- 제1항 내지 제27항 중 어느 한 항에 있어서, 상기 재조합 미생물은 에너지 소비를 위해 미생물 또는 세포가 수크로스를 대사할 수 있도록 하는 하나 이상의 단백질을 암호화하는 핵산 구조체를 포함하고, 바람직하게는 상기 핵산 구조체가 각각 수크로스 가수분해효소, 수크로스 투과효소 및 수크로스 포스포릴라아제를 암호화하는 유전자 cscA, cscB 및 sp 유전자를 포함하는 것인, 재조합 미생물 또는 세포.
- 제1항 내지 제28항 중 어느 한 항의 세포를 제공하는 단계;
세포가 수소 가스를 생산할 수 있도록 하기 위한 적절한 배양 배지 및 적절한 조건 하에서 상기 세포를 배양하는 단계;를 포함하는 수소 가스를 생산하는 방법. - 제29항에 있어서, 상기 세포 배양이 혐기성 조건 하에 있는, 방법.
- 제29항 또는 제30항에 있어서, 상기 배양은 수소화효소의 성숙을 가능하게 하는 하나 이상의 인자와 세포를 접촉시키는 단계를 포함하는, 방법.
- 제29항 내지 제31항 중 어느 한 항에 있어서, 상기 배양은 제2철 (철 III) 또는 제1철 (철 II)을 바람직하게는 약 20 μM 이상의 농도로 배양 배지에 보충하는 것을 포함하는, 방법.
- 제29항 내지 제32항 중 어느 한 항에 있어서, 상기 배양은 약 37 ℃ 이하, 보다 바람직하게는 약 35 ℃ 미만, 약 32 ℃ 미만, 약 30 ℃ 미만, 약 25 ℃ 미만, 약 20 ℃ 미만, 바람직하게는 약 10 ℃ 이상에서 수행되는, 방법.
- 제1항 내지 제28항 중 어느 한 항의 미생물 또는 세포를 포함하는, 수소 가스로부터 전기를 생산하는 장치.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
AU2020900990 | 2020-03-31 | ||
AU2020900990A AU2020900990A0 (en) | 2020-03-31 | Recombinant microorganisms and process | |
PCT/AU2021/050290 WO2021195705A1 (en) | 2020-03-31 | 2021-03-31 | Recombinant microorganisms and process |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220160684A true KR20220160684A (ko) | 2022-12-06 |
Family
ID=77926819
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227038187A KR20220160684A (ko) | 2020-03-31 | 2021-03-31 | 재조합 미생물 및 공정 |
Country Status (8)
Country | Link |
---|---|
US (1) | US20230304048A1 (ko) |
EP (1) | EP4127178A4 (ko) |
JP (1) | JP2023520238A (ko) |
KR (1) | KR20220160684A (ko) |
CN (1) | CN115667518A (ko) |
AU (1) | AU2021246542A1 (ko) |
CA (1) | CA3173184A1 (ko) |
WO (1) | WO2021195705A1 (ko) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114574418B (zh) * | 2022-04-08 | 2023-06-27 | 成都理工大学 | 一种重组大肠杆菌及产氢应用 |
WO2024084049A2 (en) | 2022-10-20 | 2024-04-25 | Cysbio Aps | Genetically modified host cells producing l-serine |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007123258A1 (en) * | 2006-04-19 | 2007-11-01 | Fujirebio Inc. | Improved synthesis of hydrogen gas in genetically modified organisms by expression of oxidoreductases and ferredoxin, and improved hydrogenase activity and hydrogen synthesis in genetically modified organisms in the presence of oxygen with enhanced expression of e. coli isc-operon |
-
2021
- 2021-03-31 CN CN202180035594.8A patent/CN115667518A/zh active Pending
- 2021-03-31 US US17/916,137 patent/US20230304048A1/en active Pending
- 2021-03-31 CA CA3173184A patent/CA3173184A1/en active Pending
- 2021-03-31 JP JP2022560165A patent/JP2023520238A/ja active Pending
- 2021-03-31 AU AU2021246542A patent/AU2021246542A1/en active Pending
- 2021-03-31 KR KR1020227038187A patent/KR20220160684A/ko active Search and Examination
- 2021-03-31 EP EP21780816.1A patent/EP4127178A4/en active Pending
- 2021-03-31 WO PCT/AU2021/050290 patent/WO2021195705A1/en unknown
Also Published As
Publication number | Publication date |
---|---|
EP4127178A4 (en) | 2024-05-29 |
CN115667518A (zh) | 2023-01-31 |
EP4127178A1 (en) | 2023-02-08 |
US20230304048A1 (en) | 2023-09-28 |
AU2021246542A1 (en) | 2022-10-20 |
CA3173184A1 (en) | 2021-10-07 |
WO2021195705A1 (en) | 2021-10-07 |
JP2023520238A (ja) | 2023-05-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DK2561064T3 (en) | Cell which is suitable for fermentation of a composition of mixed sugars | |
US7527943B2 (en) | Compositions of orthogonal glutamyl-tRNA and aminoacyl-tRNA synthetase pairs and uses thereof | |
CN107771214B (zh) | 用于具有增加的2,4-二羟基丁酸外排物的优化的2,4-二羟基丁酸产生的修饰的微生物 | |
CN107429269B (zh) | 通过在微生物中转化戊糖用于生产至少一种感兴趣的代谢物的方法 | |
DK3027733T3 (en) | Preparation of 3-Hydroxypropionic Acid in Recombinant Yeast Expressing an Insect Aspartate-1 Decarboxylase | |
CN110878261B (zh) | 合成木糖醇的重组解脂耶氏酵母的构建方法及其菌株 | |
KR20200040247A (ko) | 시알릴트랜스퍼라제 및 시알릴화 올리고당류 생산에서의 그의 용도 | |
CN111647056B (zh) | 一种基于特异性转录调控因子的l-2-羟基戊二酸生物传感器及其应用 | |
KR20130117753A (ko) | 포스포케톨라아제를 포함하는 재조합 숙주 세포 | |
WO2007022623A1 (en) | Regulation of heterologous recombinant protein expression in methylotrophic and methanotrophic bacteria | |
KR20220160684A (ko) | 재조합 미생물 및 공정 | |
KR20130055571A (ko) | 콘드로이틴의 박테리아 생산을 위한 조성물 및 방법 | |
KR20220021465A (ko) | 메탄올 활용 | |
KR20220042350A (ko) | 단풍당밀뇨증 (msud)의 치료에 사용하기 위한 효소의 생합성 | |
KR20130101030A (ko) | 변형된 미생물을 사용한 개선된 글리콜산 발효 생산 | |
KR20220116505A (ko) | 히스티딘, 퓨린 경로 대사산물, 및 플라스미드 dna의 향상된 생성 | |
KR20200134333A (ko) | 발효에 의한 히스타민 생산을 위해 조작된 생합성 경로 | |
KR20230112679A (ko) | 아이소프레노이드 측쇄가 있는 사이토키닌을 생산할 수 있는 유전자 조작된 세균 | |
CN107267474B (zh) | 一种二氢硫辛酰胺脱氢酶突变体蛋白及其制备方法和应用 | |
CN114774419A (zh) | 一种温敏型基因回路系统及其构建方法与应用 | |
KR101093199B1 (ko) | 글리세롤 대사능력 및 숙신산 생산능력이 향상된 재조합 미생물 및 이를 이용한 숙신산의 제조방법 | |
KR20220039887A (ko) | 메탄 및 자일로스를 동시 대사하는 메탄자화균의 개발 및 이를 이용한 시노린 생산방법 | |
CN111826372A (zh) | 利用木糖生产丁醇的工程菌株及其构建方法和应用 | |
CN115838712B (zh) | 具有肌肽水解酶功能的蛋白酶及其在l-肌肽合成中的应用 | |
CN112941093B (zh) | 一种制备异源四聚体α2β2型蓝藻PDHc E1方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination |