KR20220160684A

KR20220160684A - 재조합 미생물 및 공정

Info

Publication number: KR20220160684A
Application number: KR1020227038187A
Authority: KR
Inventors: 로버트 윌로우즈; 루이스 브라운; 나탈리 큐라흐; 안테 예르코비치; 커스틴 페트롤; 조셀린 존스; 사무엘 킹; 아리 에드먼즈
Original assignee: 맥쿼리 유니버시티
Priority date: 2020-03-31
Filing date: 2021-03-31
Publication date: 2022-12-06
Also published as: EP4127178A4; CN115667518A; EP4127178A1; US20230304048A1; AU2021246542A1; CA3173184A1; WO2021195705A1; JP2023520238A

Abstract

본 발명은 생물학적 수소를 생산하기 위한 재조합 미생물에 관한 것이다. 또한, 본 발명은 핵산 구조체 및 이로부터 수소의 생산을 가능하게 하기 위한 미생물을 변형하는 방법에 관한 것이다.

Description

재조합 미생물 및 공정

본 발명은 수소를 생산하기 위한 방법, 핵산 구조체 및 수소를 생산하기 위한 재조합 미생물에 관한 것이다.

석유 가격 상승, 산유국과의 외교적 긴장 고조, 및 대기 중 온실가스 배출량 증가로 인해 대체 연료에 대한 관심이 높아지고 있다. 수소는 무공해 연료로 사용될 수 있는 엄청난 잠재력을 가지고 있어 화석 에너지 사용과 관련된 환경 및 정치적 우려를 완화시킨다. 따라서 청정 에너지원으로서 화석연료를 대체하거나 보충할 수 있는 후보를 발굴하기 위한 노력은 분자 수소 생산에 집중되어 왔다.

수소 경제의 핵심은 수소를 생산하기 위한 효율적이고 저렴하며 재생 가능한 공정을 찾는 동시에 수소를 경제적으로 사용 가능한 에너지로 전환한다는 동일하게 중요한 목표를 달성하는 것이다.

상업적 규모의 수소 생산에 대한 한 가지 접근법은 진핵생물에 의한 수소의 광생물학적 (photobiological) 생산을 이용하는 것이다. 예를 들어, 녹조류는 산화 경로를 발효 대사로 전환함으로써 혐기성 스트레스에 반응한다.

클라미도모나스 레인하티 (Chlamydomonas reinhardtii)와 같은 녹조류가 물에서 수소를 생산하는 능력은 오랫동안 인식되어 왔다. 이 반응은 짧은 기간의 혐기 생활 (anaerobiosis)에 노출된 후 세포에서 유도되는 효소인 가역적 수소화효소에 의해 촉진된다. 따라서 조류 생물 반응기의 사용은 수소를 생산하기 위한 하나의 접근법이었다. 그러나 광합성에 의해 생성된 O₂에 의한 가역적 수소화효소의 즉각적인 비활성화로 인해 세포에 조명을 비추면 수소화효소의 활성이 빠르게 상실된다.

수소 생산을 위한 다른 접근법으로는 재조합 미생물의 생성과 이러한 미생물에 의한 탄수화물 공급 원료의 발효가 포함된다. 일부 사례에서, 박테리아, 고세균 및 조류의 수소화효소는 대장균에서 발현되었지만, 대장균에서 외인성 효소의 발현은 코돈 최적화에도 불구하고 낮은 발현율과 단백질 불안정성으로 인해 복잡해졌다.

이러한 발효 접근법에 사용하기 위한 후보로서 다양한 수소화효소가 제안되었다. 예를 들어, 보라색 박테리아 알로크로마티움 비노섬 (Alochromatiiim vinosum)의 [NiFe]-수소화효소는 현저하게 활성인 전기 촉매이다. [NiFe]-수소화효소는 가능성을 보여주지만, 이들 및 다른 수소화효소의 사용과 관련된 문제가 남아 있다. 수소화효소의 안정성은 효소 연료 전지에서의 사용에 있어 주요 단점 중 하나였다. 또한, 효소는 백금보다 CO 중독에 덜 민감하지만, 상업적으로 사용하려면 산소뿐만 아니라 CO에 대한 민감도 측면에서 추가적인 개선이 필요하다. 또한, 수소화효소를 대량으로 이용할 수 없기 때문에 효소 연료 전지에서의 잠재적인 응용이 제한된다. 따라서, 원하는 촉매 특성을 갖는 안정적인 수소화효소의 대량생산은 수소 연료를 위한 이 흥미로운 생체 전기촉매의 응용을 크게 향상시킬 것이다.

조류 생물반응기 (bioreactors)는 많은 광 포획 및 수소 포획 기술 장벽으로 인해 스케일업에 비용이 많이 든다. 수소는 적은 부피와 농도에서 함유 및 수집하기 어려운 만큼 수소 생산 속도도 중요한 고려사항이다. 조류 시스템은 매우 낮은 속도로 수소를 생산하며 생산을 시작하려면 영양소 제한이 필요하다. 현재까지 조작된 미세조류나 탄수화물 공급원료의 발효를 통해 생산되는 수소의 생산 속도와 수율은 모두 상업적으로 사용하기에 각각 너무 느리고 낮았다.

따라서, 수소 생성을 위한 개선된 공정이 필요하다.

본 명세서에서 선행기술에 대한 언급은 선행기술이 어느 관할구역에 있는 일반 지식의 일부를 형성하거나 선행기술이 당업자에 의해 이해되고, 관련성이 있다고 간주되고, 및/또는 다른 선행기술과 결합될 수 있다고 합리적으로 예상할 수 있다는 것을 인정하거나 제안하는 것은 아니다.

본 발명은 일반적으로 에너지 및 전력 발생 응용을 위한 수소 및 활성 수소화효소 효소를 생산하기 위한 발현 벡터, 미생물, 방법 및 반응기 시스템에 관한 것이다. 발현 벡터 및 미생물은 관심 산물을 생산하기 위한 배양 방법에 사용될 수 있다. 수소 및 활성 수소화효소 생성물은 모두 예를 들어 수소로부터 전기를 생산하기 위한 연료전지 시스템과 같은 시스템에 통합될 수 있다.

[관련 출원]

본 출원은 호주 임시 출원 AU 2020900990으로부터 우선권을 주장하며, 그 전체 내용은 본 명세서에 참조로 포함된다.

첫 번째 측면에서, 본 발명은 다음을 포함하는 수소 가스를 생산하기 위한 재조합 미생물을 제공한다:

미생물이 수소를 생산할 수 있도록 하는 하나 이상의 단백질을 암호화하는 외인성 핵산 서열,

- 여기서 하나 이상의 단백질은 Fe-Fe-의존성 수소화효소 및 선택적으로 수소화효소의 성숙 (maturation) 및 활성화를 가능하게 하는 적어도 하나의 조립 단백질을 포함하고;

- 여기서 핵산 서열은 미생물에서 핵산 서열의 발현을 가능하게 하기 위한 하나 이상의 프로모터에 작동가능하게 연결되고, 및

- 여기서 외인성 핵산 서열은 미생물에서 수소화효소의 최적화된 발현을 제공하도록 최적화된 코돈임.

바람직하게는, 상기 Fe-Fe 수소화효소는 Fe-Fe 수소화효소의 A1 클래스에 속한다.

바람직하게는, 상기 Fe-Fe 의존성 수소화효소는 HydA (Hyd1) 또는 이의 기능적으로 동등한 동족체 또는 유도체이다.

바람직한 실시양태에서, 상기 Fe-Fe 의존성 수소화효소는 클라미도모나스 레인하티 (Chlamydomonas reinhardtii), 볼복스 카르테리 (Volvox carteri), 지아디아 람블리아 (Giardia lamblia), 엔타모에바 누탈리 (Entamoeba nuttalli), 일로박터 폴리트러퍼스 (Ilyobacter polytrophus), 트리코모나스 바지날리스 (Trichomonas vaginalis), 메가스파에라 마이크로누시포미스 (Megasphaera micronuciformis), 베일로넬라 파르불라 (Veillonella parvula), 베일로넬라 아티피카 (Veillonella atypica), 펩토클로스트리디움 비퍼멘탄스 (Peptoclostridium bifermentans), 클로스트리디움 아르부스티 (Clostridium arbusti), 슈도플라보니프랙터 카필로수스 (Pseudoflavonifractor capillosus), 래크노클로스트리디움 시트로니아에 (Lachnoclostridium citroniae), 래크노클로스트리디움 클로스트리디오폼 (Lachnoclostridium clostridioforme), 펠로시누스 페르멘탄스 (Pelosinus fermentans), 써모데술포비브리오 아일랜디쿠스 (Thermodesulfovibrio islandicus), 수테텔라 와즈워텐시스 (Sutterella wadsworthensis), 클로스트리디움 베이예린키이 (Clostridium beijerinckii), 퓨조박테리움 울서란스 (Fusobacterium ulcerans), 클로스트리디움 타이로부티리쿰 (Clostridium tyrobutyricum), 클로스트리디움 퍼프린젠스 (Clostridium perfringens), 세토박테리움 소메레 (Cetobacterium somerae), 클로스트리디움 베이예린키이 (Clostridium beijerinckii), 클로스트리디움 콜리카니스 (Clostridium colicanis), 클로스트리디움 인테스티날레 (Clostridium intestinale), 클로스트리디움 차우보에이 (Clostridium chauvoei), 셀룰로모나스 피미 (Cellulomonas fimi), 루미니클로스트리디움 써모셀럼 (Ruminiclostridium thermocellum), 네글레이아 그루베리 (Naegleria gruberi), 클로렐라 바리아빌리스 (Chlorella variabilis), 퍼비도박테리움 노도섬 (Fervidobacterium nodosum), 써모토가 페트로필라 (Thermotoga petrophila), 써모토가 레틴게 (Thermotoga lettingae), 티오마이크로스피라 펠로필라 (Thiomicrospira pelophila), 칼다트리박테리움 칼리포르니엔스 (Caldatribacterium californiense), 푸소박테리움 네크로포룸 (Fusobacterium necrophorum), 옴니트로푸스 포디네 (Omnitrophus fodinae), 신트로포써무스 리포칼리두스 (Syntrophothermus lipocalidus), 암모니펙스 데겐시 (Ammonifex degensii), 디설포토마큘럼 하이드로써멀 (Desulfotomaculum hydrothermale), 푸소박테리움 모르티페룸 (Fusobacterium mortiferum), 디설포토마큘럼 쿠즈네초비 (Desulfotomaculum kuznetsovii) 및 라크노클로스트리디움 피토퍼멘탄스 (Lachnoclostridium phytofermentans) 또는 이들의 기능적으로 동등한 동족체 또는 유도체로 이루어진 군으로부터 선택된 HydA 단백질의 아미노산 서열을 포함한다. 바람직하게는, 상기 HydA 단백질은 클라미도모나스 레인하티 (Chlamydomonas reinhardtii), 볼복스 카르테리 (Volvox carteri), 지아디아 람블리아 (Giardia lamblia), 엔타모에바 누탈리 (Entamoeba nuttalli), 일로박터 폴리트러퍼스 (Ilyobacter polytrophus), 트리코모나스 바지날리스 (Trichomonas vaginalis), 메가스파에라 마이크로누시포미스 (Megasphaera micronuciformis), 베일로넬라 파르불라 (Veillonella parvula), 베일로넬라 아티피카 (Veillonella atypica), 펩토클로스트리디움 비퍼멘탄스 (Peptoclostridium bifermentans) 및 이들의 기능적으로 동등한 동족체로 이루어진 군으로부터 선택된다. 보다 바람직하게는, 상기 HydA 단백질은 클라미도모나스 레인하티 (Chlamydomonas reinhardtii) 또는 이의 기능적으로 동등한 동족체 또는 유도체로부터 유래된다.

특정 실시양태에서, 상기 미생물은 미생물의 배양 동안 수소화효소의 성숙 및 활성화를 가능하게 하는 하나 이상의 인자와 함께 제공될 수 있다. 바람직하게는 상기 하나 이상의 인자는 저분자의 형태이다. 수소화효소의 성숙 및 활성화를 가능하게 하는 인자의 예로는 아자디티올레이트 브릿지 (azadithiolate bridge)를 포함하는 [2Fe]-하위 모방체들 (subsite mimetics)이 있다. 이러한 인자들은, 예를 들어 Esselborn 외, (2013) Nat Chem Biol 9 (10):607-609 및 Berggren 외, (2013) Nature, 499:66-69에 기술되어 있으며, 이들의 내용은 참조에 의해 본 명세서에 통합된다.

바람직하게는, 상기 외인성 핵산 서열은 수소화효소의 성숙 및 활성화를 가능하게 하는 적어도 하나의 조립 단백질을 암호화하며, 여기서 적어도 하나의 단백질은 HydEF 및/또는 HydG로 이루어진 군으로부터 선택된다. 보다 바람직하게는, 상기 외인성 핵산 서열은 조립 단백질 HydEF 및 HydG 모두를 암호화하는 서열들을 포함한다. 특히 바람직한 실시양태에서, 상기 HydEF 및 HydG 단백질은 클라미도모나스 레인하티 (Chlamydomonas reinhardtii) 또는 이의 기능적으로 동등한 동족체 또는 유도체로부터의 HydEF 및 HydG 단백질의 아미노산 서열을 포함한다.

따라서 바람직한 실시양태에서, 본 발명은 다음을 포함하는 수소 가스 생산을 위한 재조합 미생물을 제공한다:

- 여기서 하나 이상의 단백질은 Fe-Fe-의존성 수소화효소 HydA 또는 이의 기능적으로 동등한 동족체 또는 유도체, 및 클라미도모나스 레인하티 (Chlamydomonas reinhardtii)로부터의 조립 단백질 HydEF 및 HydG 또는 이들의 기능적으로 동등한 동족체 또는 유도체를 포함하고;

- 여기서 핵산 서열은 미생물에서 핵산 서열의 발현을 가능하게 하기 위한 하나 이상의 프로모터에 작동 가능하게 연결되고, 및

일 실시양태에서, 상기 미생물은 페레독신 NADP 환원효소 (Ferredoxin NADP reductase, FNR) 및 페레독신 (petF에 의해 암호화됨), 또는 이들의 기능적으로 동등한 동족체 또는 유도체를 암호화하는 핵산 서열을 추가로 포함한다.

바람직하게는, 상기 FNR의 공급원은 페레독신을 환원시키기 위해 환원제로서 NADPH를 이용하는 페레독신 환원효소를 포함하는 플라빈 (Flavin)이다. 보다 바람직하게는, 상기 페레독신 단백질은 클라미도모나스 레인하티 (Chlamydomonas reinhardtii)로부터 유래된 것이고, 상기 FNR은 클라미도모나스 레인하티 (Chlamydomonas reinhardtii)로부터의 페로독신을 환원시킬 수 있는 임의의 FNR이다. 특히 바람직한 실시양태에서, 상기 FNR 및 페로독신 단백질은 클라미도모나스 레인하티 (Chlamydomonas reinhardtii) 또는 이의 기능적으로 동등한 동족체 또는 유도체로부터의 아미노산 서열을 포함한다.

상기 재조합 미생물은 재조합 단백질의 발현에 사용하기에 적합한 임의의 미생물일 수 있다. 특정 실시양태에서, 상기 재조합 미생물은 에쉬리키아 콜라이 (Escherichia coli), 바실러스 서브틸리스 (Bacillus subtilis), 락토바실러스 속 (Lactobacillus sp.) 또는 스트렙토코커스 속 (Streptococcus sp.)으로 이루어진 군으로부터 선택된다. 바람직한 실시양태에서, 상기 미생물은 에쉬리키아 콜라이 (E coli)의 균주 (strain)이다.

특정 실시양태에서, 상기 재조합 미생물은 부분적으로 또는 완전히 불활성화 되고/되거나 생존 불가능 (non-viable) 할 수 있다.

일 실시양태에서, 상기 외인성 핵산 서열은 하나 이상의 폴리뉴클레오티드 구조체 (construct)에서 제공된다. 바람직한 실시양태에서, HydEF, HydG, HydA 및 선택적으로 페레독신 및 FNR을 암호화하는 상기 외인성 핵산 서열은 단일 폴리뉴클레오티드 구조체로 제공된다. 대안적인 실시양태에서, 상기 단백질을 암호화하는 핵산 서열은 별도의 폴리뉴클레오티드 구조체로 제공된다.

바람직한 실시양태에서, 본 발명은 세포가 수소를 생성할 수 있도록 하는 단백질의 클러스터를 암호화하는 재조합 구조체를 포함하는 E. coli 세포를 제공하며, 여기서 상기 단백질의 클러스터는 클라미도모나스 레인하티 (Chlamydomonas reinhardtii)의 폴리펩타이드 HydEF, HydG, HydA, 페레독신 및 FNR을 포함하거나 구성되거나 또는 본질적으로 구성된다. 바람직한 실시양태에서, 상기 재조합 구조체는 서열번호 10에 제시된 서열을 포함하거나 구성되거나 또는 본질적으로 구성된다.

다른 실시양태예에서, 상기 미생물은 탄소 이용을 5탄당 인산 경로 (pentose phosphate pathway)로 재지정 (redirecting)하기 위한 하나 이상의 유전적 변형을 포함한다. 상기 변형은 탄소를 당분해 (glycolytic) 경로로 유도하는 단백질의 활성을 감소 또는 억제하여 탄소 이용을 5탄당 인산 경로로 재지정할 수 있다.

예를 들어, 상기 미생물은 포스포프룩토키나아제 (phosphofructokinase), 피루브산 키나아제 (pyruvate kinase), 글리세레이트 뮤테이즈 (glycerate mutase), 글리세르알데하이드-3-인산 탈수소효소 (glyceraldehyde-3-phosphate dehydrogenase), 6-포스포글루코네이트 탈수소효소 (6-phosphogluconoate dehydratase), 및 2-케토-3-디옥시-6-포스포글루코네이트 알도라제 (2-keto-3-deoxy-6-phosphogluconate aldolase)로 이루어진 군으로부터 선택된 하나 이상의 내인성 단백질의 활성 또는 수준을 감소 또는 억제하기 위해 추가로 변형될 수 있다. 이들 단백질은 각각 pfkA, pps, gpmA/gpmM, gapA, edd 및 eda 유전자에 의해 암호화된다.

바람직하게는, 상기 미생물은 포스포프룩토키나아제 (phosphofructokinase), 피루브산 키나아제 (pyruvate kinase), 글리세레이트 뮤테이즈 (glycerate mutase), 글리세르알데하이드-3-인산 탈수소효소 (glyceraldehyde-3-phosphate dehydrogenase), 6-포스포글루코네이트 탈수소효소 (6-phosphogluconoate dehydratase) 및 2-케토-3-디옥시-6-포스포글루코네이트 알도라제 (2-keto-3-deoxy-6-phosphogluconate aldolase)를 각각 암호화는 pfkA, pps, gpmA/gpmM, gapA, edd 및 eda 유전자 중 하나 이상의 발현을 결실 또는 감소하도록 유전적으로 변형된다. 상기 변형은 유전자의 발현을 부분적으로 또는 완전히 감소시키는 임의의 변형일 수 있다. 발현의 부분적인 감소가 있는 경우, 상기 발현은 동일한 균주의 야생형 미생물에서의 발현과 비교하여 적어도 5%, 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90% 또는 그 이상까지 감소될 수 있다.

상기 유전자 변형은 하나 이상의 유전자의 발현을 부분적 또는 완전히 억제하기 위해 CRISPR-Cas9 시스템 또는 다른 게놈 변형 시스템 (예컨대, 람다 레드 재조합효소 (lambda red recombinase))을 사용하여 이루어질 수 있다. 상기 유전자 변형은 유전자에 완전한 또는 부분적인 기능 상실 돌연변이 (loss-of-function mutation), 바람직하게는 완전한 기능 상실 돌연변이의 도입을 초래할 수 있다. 상기 변형은 유전자 서열의 전체 또는 부분 제거일 수 있다.

특정 실시양태에서, pfkA, pps, gpmA/gpmM, gapA, edd 및 eda 유전자 중 하나만이 결실되거나 넉다운 (knocked-down)된다. 바람직하게는 pfkA 또는 gpmA가 결실되거나 넉다운된다. 다른 실시양태에서, 상기 미생물은 유전자 pfkA, pps, gpmA/gpmM, gapA, edd 및 eda 중 2개, 3개, 4개, 5개 또는 이들 모두의 발현을 결실 또는 감소시키도록 유전적으로 변형된다. 특정 실시양태에서, 상기 유전자 변형은 pfkA 및 gpmA; 또는 edd 및 eda; 또는 gpmM, edd 및 eda; 또는 gpmA, edd 및 eda; 또는 gpmM, edd, eda 및 pfkA; 또는 gpmA, edd, eda 및 pfkA 또는 pfkA, pps, gpmA/gpmM, edd 및 eda 모두의 발현을 결실 또는 감소를 초래한다.

또 다른 실시양태에서, 상기 미생물은 5탄당 인산 경로의 하나 이상의 단백질의 수준 또는 활성을 증가시키도록 유전적으로 변형된다.

바람직하게는, 상기 하나 이상의 단백질은 포스포글루코뮤타제 (phosphoglucomutase), 글루코스-6-인산 탈수소효소 (glucose-6-phosphate dehydrogenase), 6-포스포글루코노락토나제 (6-phosphogluconolactonase), 6-포스포글루코네이트 탈수소효소 (6-phosphogluconate dehydrogenase), 트랜스케톨라아제 (transketolase) 및 트랜스알돌라아제 (transaldolase)로 이루어진 군으로부터 선택된다. 이들 단백질은 각각 pgm, zwf, pgl, gnd, tktB 또는 tktA, 및 talA 또는 talB 유전자에 의해 암호화된다. 특히 바람직한 실시양태에서, 상기 단백질은 글루코스-6-인산탈수소효소 (glucose-6-phosphate dehydrogenase)이다.

다른 실시양태에서, 상기 내인성 NAD 키나아제 (NAD kinase) (NADK, yfjB에 의해 암호화됨) 및/또는 가용성 피리딘 뉴클레오티드 트랜스히드로게나아제 (pyridine nucleotide transhydrogenase) (UdhA, sthA에 의해 암호화됨)의 수준 또는 활성이 증가된다.

바람직하게는, 상기 미생물의 단백질의 증가된 수준 또는 활성은 5탄당 인산 경로의 하나 이상의 단백질을 암호화하는 핵산 서열의 발현을 증가시킴으로써 이루어지며, 상기 미생물에 의해 생성된 단백질의 수준은 동일한 균주의 야생형 미생물에 비해 증가된다. 대안적인 실시양태에서, 상기 단백질의 증가된 수준 또는 활성은 상기 단백질의 증가된 활성을 초래하는 도입 또는 하나 이상의 점 돌연변이에 의해 이루어진다.

바람직한 실시양태에서, 상기 글루코스-6-인산 탈수소효소 (glucose-6-phosphate dehydrogenase)를 암호화하는 유전자 zwf가 과발현된다. 다른 실시양태에서, 상기 6-포스포글루코네이트 탈수소효소 (6-phosphogluconate dehydrogenase)를 암호화하는 유전자 gnd가 과발현된다. 다른 실시양태에서, 상기 6-포스포글루코노락토나제 (6-phosphogluconolactonase)를 암호화하는 유전자 pgl가 과발현된다.

포스포글루코뮤타제 (phosphoglucomutase), 글루코스-6-인산 탈수소효소 (glucose-6-phosphate dehydrogenase), 6-포스포글루코노락토나제 (6-phosphogluconolactonase), 6-글루코포스포네이트 탈수소효소 (6-glucophosphonate dehydrogenase), 트랜스케톨라아제 (transketolase) 및 트랜스알돌라아제 (transaldolase)의 과발현 및 증가된 수준 또는 활성은 하나 이상의 pgm, zwf, pgl, gnd, tktB 또는 tktA, 및 talA 또는 talB 중 하나 이상의 프로모터 서열의 변형에 의해 선택적으로 달성될 수 있다. 특정 실시양태에서, pgm, zwf, pgl, gnd, tktB 또는 tktA, 및 talA 또는 talB 중 하나 이상에 대한 상기 내인성 프로모터는 상기 유전자의 발현을 증가시키기 위해 외인성 프로모터로 대체된다. 특정 실시양태에서, pgm, zwf, pgl, gnd, tktB 또는 tktA, 및 talA 또는 talB 중 하나 이상에 대한 내인성 프로모터는 상기 미생물에서 상이한 유전자의 발현을 조절하는 내인성 프로모터로 대체된다. 대안적인 실시양태에서, pgm, zwf, pgl, gnd, tktB 또는 tktA, 및 talA 또는 talB 중 하나 이상에 대한 내인성 프로모터는 외인성 프로모터로 대체된다. 상기 외인성 프로모터는 비-동족 (non-cognate) 미생물에서 상동 유전자의 발현을 조절하거나 비-동족 미생물에서 비-상동 단백질의 발현을 조절할 수 있다.

특히 바람직한 실시양태에서, pgm, zwf, pgl, gnd, tktB 또는 tktA, 및 talA 또는 talB 중 하나 이상에 대한 상기 내인성 프로모터는 osmY 프로모터, gapA 프로모터, nirB 프로모터 및 nar 프로모터로 이루어진 군으로부터 선택되는 프로모터로 대체된다.

또한, 상기 숙주 세포는 예를 들어, 5탄당 인산 경로의 관련 효소의 수준 또는 활성을 증가시키기 위한 목적으로 다른 미생물 종으로부터 이종 단백질을 암호화하는 재조합 구조체로 형질전환 (transformed)될 수 있다.

상기 재조합 구조체는 내인성 유전자의 발현과 동시에 외인성 유전자의 발현을 가능하게 할 수 있다. 대안적으로, 상기 재조합 구조체는 내인성 유전자 서열이 외인성 유전자 서열로 대체되도록 미생물 게놈에 안정적으로 도입될 수 있다.

포스포글루코뮤타제, 글루코스-6-인산 탈수소효소, 6-포스포글루코노락토나제, 6-글루코포스포네이트 탈수소효소, 트랜스케톨라아제 및 트랜스알돌라아제의 과발현 및 증가된 수준 또는 활성은 상기 단백질을 암호화하는 내인성 유전자를 상동 단백질을 암호화하는 외인성 유전자로 보충되거나 대체함으로써 달성될 수 있다. 특정 실시양태에서, 상기 내인성 zwf 유전자는 자이모모나스 모빌리스 (Zymomonas mobilis)의 zwf 유전자로 대체된다. 바람직하게는, 상기 미생물은 대장균이고 대장균 zwf 유전자는 자이나스 모빌리스의 zwf 유전자로 대체된다. 또 다른 실시양태에서, 상기 gnd 유전자는 코리네박테리움 글루타미쿰 (Corynebacterium glutamicum)의 gnd 유전자로 대체된다. 바람직하게는, 상기 미생물은 대장균 (E. coli)이고 트랜스케톨라아제 및 트랜스알돌라아제를 암호화하는 유전자는 사카로미케스 케레비시아이 (saccharomyces cerevisiae)의 상동 유전자로 보충되거나 대체된다. 바람직하게는, 상기 미생물은 대장균이고 상기 대장균 gnd 유전자는 코리네박테리움 글루타미쿰 (Corynebacterium glutamicum)의 gnd 유전자로 대체된다. 또한, 상기 내인성 gapA 유전자 (글리세르알데하이드-3-인산탈수소효소를 암호화)는 클로스트리듐 아세토부틸리쿰 (Clostridium aceteobutylicum)의 gapC 유전자로 대체된다. 바람직하게는, 상기 미생물은 대장균이고 상기 대장균 gapA 유전자는 클로스트리듐 아세토부틸리쿰 (Clostridium aceteobutylicum)의 gapC 유전자로 대체된다.

바람직하게는, 포스포글루코뮤타제, 글루코스-6-인산 탈수소효소, 6-포스포글루코노락토나제, 및 6-글루코포스포네이트 탈수소효소를 암호화하는 하나 이상의 유전자의 발현은 적어도 약 1.5배, 적어도 약 2배, 적어도 약 3배, 적어도 약 5배 이상 증가된다.

또 다른 실시양태에서, 상기 재조합 미생물은 에너지 소비를 위해 수크로스를 대사하도록 변형된다. 미생물이 대장균인 실시양태에서, 상기 미생물은 수크로스를 대사하는 대장균 균주로부터 각각 수크로스 가수분해효소 및 수크로스 투과효소를 암호화하는 cscA 및 cscB 유전자를 발현하도록 유전적으로 변형된다. 또한, 상기 대장균 미생물은 내인성 대장균 포스포글루코뮤타제 (pgm) 또는 자일로스 이소머라아제 (xylose isomerase, xylA)의 수준 또는 활성을 증가시키도록 유전적으로 변형될 수 있다. 상기 유전적 변형은 내인성 유전자의 발현을 증가시키기 위한 것일 수 있고 (예를 들어, 프로모터 영역의 변형에 의해) 또는 유전자를 암호화하는 외인성 핵산의 도입 및 발현에 의한 것일 수 있다.

다른 실시양태에서, 상기 미생물은 류코노스톡 메센테로이데스 (Leuconostoc mesenteroides)의 수크로스 인산화효소를 발현하도록 변형된다.

외인성 유전자의 발현을 요구하는 본 명세서에 기재된 임의의 실시양태에서, 상기 유전자는 미생물에서의 발현에 최적화된 코돈일 수 있다.

상기 미생물이 재조합 대장균 미생물인 경우, 상기 미생물은 외인성 핵산 서열을 발현할 수 있는 대장균의 임의의 균주일 수 있다. 특정 바람직한 실시양태에서, 상기 대장균 균주는 임의의 K12 유래 또는 W 유래 균주로부터 선택된다. 특정 실시양태에서, 상기 대장균 균주는 DH5α (DH5 alpha)로 이루어진 군으로부터 선택된다.

다른 측면에서, 본 발명은 다음의 단계를 포함하는 수소 가스의 제조 방법을 제공한다:

- Fe-Fe-의존성 수소화효소를 암호화하는 핵산 서열을 포함하는 하나 이상의 재조합 폴리뉴클레오티드를 포함하는 숙주 세포를 제공하는 단계, 여기서 핵산 서열은 미생물에서 핵산 서열을 발현시키기 위한 하나 이상의 프로모터에 작동 가능하게 연결되어 있고,

- 상기 숙주 세포를 수소화효소의 성숙 및 활성화를 가능하게 하는 외인성 인자와 접촉시키는 단계;

- 상기 숙주 세포로부터 수소 생산을 가능하게 하는 적절한 조건 하에서 숙주 세포를 배양하는 단계.

바람직하게는, 상기 하나 이상의 인자는 저분자의 형태이다. 상기 수소화효소의 성숙 및 활성화를 가능하게 하는 인자의 예로는 아자디티올레이트 브릿지 (azadithiolate bridge)를 포함하는 [2Fe]-하위 모방체들이 있다. 이러한 인자들은, 예를 들어 Esselborn 외, (2013) Nat Chem Biol 9 (10):607-609 및 Berggren 외, (2013) Nature, 499:66-69에 기술되어 있으며, 이들의 내용은 참조에 의해 본 명세서에 통합된다.

또한, 본 발명은 다음의 단계를 포함하는 수소 가스의 제조 방법을 제공한다:

- Fe-Fe 의존성 수소화효소 및 수소화효소의 성숙 및 활성화를 가능하게 하는 적어도 하나의 조립 단백질을 암호화하는 핵산 서열을 포함하는 하나 이상의 재조합 폴리뉴클레오티드를 포함하는 숙주 세포를 제공하는 단계;

o 여기서 상기 핵산 서열은 상기 미생물에서 핵산 서열의 발현을 가능하게 하기 위한 하나 이상의 프로모터에 작동 가능하게 연결되고,

o 여기서 상기 외인성 핵산 서열은 미생물에서 수소화효소의 최적화된 발현을 제공하도록 최적화된 코돈임.

또 다른 측면에서, 본 발명은 다음의 단계를 포함하는 수소 가스의 제조 방법을 제공한다:

- Fe-Fe-의존성 수소화효소 및 선택적으로 수소화효소의 성숙 및 활성화를 가능하게 하는 적어도 하나의 조립 단백질을 암호화하는 핵산 서열을 포함하는 하나 이상의 폴리뉴클레오티드를 제공하는 단계로서, 여기서 상기 핵산 서열은 핵산 서열의 발현을 가능하게 하기 위한 프로모터와 작동 가능하게 연결되고, 여기서 상기 핵산 서열은 이종 숙주 세포에서 발현되도록 최적화된 코돈임;

- 이종 숙주 세포를 제공하는 단계;

- 상기 숙주 세포를 상기 폴리뉴클레오티드(들)로 형질전환 (transforming) 또는 형질주입 (transfecting)하는 단계;

- 세포 배양 배지를 제공하는 단계; 및

- 상기 폴리뉴클레오티드의 발현에 충분한 조건 하에서 상기 세포 배양 배지에서 형질전환 또는 형질주입된 숙주 세포를 배양하는 단계.

또 다른 측면에서, 본 발명은 다음의 단계를 포함하는 이종 숙주 세포에서 수소 발생 Fe-Fe 수소화효소, 바람직하게는 A1 Fe-Fe 수소화효소의 발현을 극대화 (maximising)하는 방법을 제공한다:

- Fe-Fe 의존성 수소화효소 및 수소화효소의 성숙 및 활성화를 가능하게 하기 위한 적어도 하나의 조립 단백질을 암호화하는 핵산 서열을 포함하는 폴리뉴클레오티드를 제공하는 단계로서, 여기서 상기 핵산 서열은 프로모터에 작동 가능하게 연결되고, 이종 숙주 세포에서 상기 핵산 서열의 발현을 가능하게 하기 위해 최적화된 코돈임;

- 이종 숙주 세포를 제공하는 단계;

- 상기 숙주 세포를 상기 폴리뉴클레오티드로 형질전환 또는 형질주입하는 단계;

- 세포 배양 배지를 제공하는 단계; 및

바람직하게는, 상기 Fe-Fe-의존성 수소화효소는 클래스 A1 Fe-Fe 수소화효소이다.

바람직하게는, 상기 Fe-Fe-의존성 수소화효소는 HydA (Hyd1) 또는 이의 기능적으로 동등한 동족체 또는 유도체이다.

바람직한 실시양태에서, 상기 Fe-Fe-의존성 수소화효소는 클라미도모나스 레인하티 (Chlamydomonas reinhardtii), 볼복스 카르테리 (Volvox carteri), 지아디아 람블리아 (Giardia lamblia), 엔타모에바 누탈리 (Entamoeba nuttalli), 일로박터 폴리트러퍼스 (Ilyobacter polytrophus), 트리코모나스 바지날리스 (Trichomonas vaginalis), 메가스파에라 마이크로누시포미스 (Megasphaera micronuciformis), 베일로넬라 파르불라 (Veillonella parvula), 베일로넬라 아티피카 (Veillonella atypica), 펩토클로스트리디움 비퍼멘탄스 (Peptoclostridium bifermentans), 클로스트리디움 아르부스티 (Clostridium arbusti), 슈도플라보니프랙터 카필로수스 (Pseudoflavonifractor capillosus), 래크노클로스트리디움 시트로니아에 (Lachnoclostridium citroniae), 래크노클로스트리디움 클로스트리디오폼 (Lachnoclostridium clostridioforme), 펠로시누스 페르멘탄스 (Pelosinus fermentans), 써모데술포비브리오 아일랜디쿠스 (Thermodesulfovibrio islandicus), 수테텔라 와즈워텐시스 (Sutterella wadsworthensis), 클로스트리디움 베이예린키이 (Clostridium beijerinckii), 퓨조박테리움 울서란스 (Fusobacterium ulcerans), 클로스트리디움 타이로부티리쿰 (Clostridium tyrobutyricum), 클로스트리디움 퍼프린젠스 (Clostridium perfringens), 세토박테리움 소메레 (Cetobacterium somerae), 클로스트리디움 베이예린키이 (Clostridium beijerinckii), 클로스트리디움 콜리카니스 (Clostridium colicanis), 클로스트리디움 인테스티날레 (Clostridium intestinale), 클로스트리디움 차우보에이 (Clostridium chauvoei), 셀룰로모나스 피미 (Cellulomonas fimi), 루미니클로스트리디움 써모셀럼 (Ruminiclostridium thermocellum), 네글레이아 그루베리 (Naegleria gruberi), 클로렐라 바리아빌리스 (Chlorella variabilis), 퍼비도박테리움 노도섬 (Fervidobacterium nodosum), 써모토가 페트로필라 (Thermotoga petrophila), 써모토가 레틴게 (Thermotoga lettingae), 티오마이크로스피라 펠로필라 (Thiomicrospira pelophila), 칼다트리박테리움 칼리포르니엔스 (Caldatribacterium californiense), 푸소박테리움 네크로포룸 (Fusobacterium necrophorum), 옴니트로푸스 포디네 (Omnitrophus fodinae), 신트로포써무스 리포칼리두스 (Syntrophothermus lipocalidus), 암모니펙스 데겐시 (Ammonifex degensii), 디설포토마큘럼 하이드로써멀 (Desulfotomaculum hydrothermale), 푸소박테리움 모르티페룸 (Fusobacterium mortiferum), 디설포토마큘럼 쿠즈네초비 (Desulfotomaculum kuznetsovii) 및 라크노클로스트리디움 피토퍼멘탄스 (Lachnoclostridium phytofermentans) 또는 이들의 기능적으로 동등한 동족체 또는 유도체로 이루어진 군으로부터 선택된 HydA 단백질의 아미노산 서열을 포함한다. 바람직하게는, 상기 HydA 단백질은 클라미도모나스 레인하티 (Chlamydomonas reinhardtii), 볼복스 카르테리 (Volvox carteri), 지아디아 람블리아 (Giardia lamblia), 엔타모에바 누탈리 (Entamoeba nuttalli), 일로박터 폴리트러퍼스 (Ilyobacter polytrophus), 트리코모나스 바지날리스 (Trichomonas vaginalis), 메가스파에라 마이크로누시포미스 (Megasphaera micronuciformis), 베일로넬라 파르불라 (Veillonella parvula), 베일로넬라 아티피카 (Veillonella atypica), 및 펩토클로스트리디움 비퍼멘탄스 (Peptoclostridium bifermentans), 및 이들의 기능적으로 동등한 동족체로 이루어진 군으로부터 선택된다. 보다 바람직하게는, 상기 HydA 단백질은 클라미도모나스 레인하티 (Chlamydomonas reinhardtii) 또는 이의 기능적으로 동등한 동족체 또는 유도체로부터 유래된다.

바람직하게는, 상기 적어도 하나의 조립 단백질은 HydEF 및/또는 HydG로 이루어진 군으로부터의 단백질을 포함한다. 보다 바람직하게는, 상기 외인성 핵산 서열은 조립 단백질 HydEF 및 HydG 모두를 암호화하는 서열들을 포함한다. 특히 바람직한 실시양태에서, 상기 HydEF 및 HydG 단백질은 클라미도모나스 레인하티 (Chlamydomonas reinhardtii) 또는 이의 기능적으로 동등한 동족체 또는 유도체로부터의 HydEF 및 HydG 단백질의 아미노산 서열을 포함한다.

따라서, 바람직한 실시양태에서, 본 발명은 다음의 단계를 포함하는 수소 가스의 제조 방법을 제공한다:

- 클라미도모나스 레인하티 (Chlamydomonas reinhardtii) 폴리펩타이드 HydEF, HydG 및 HydA를 암호화하는 핵산 서열을 포함하는 하나 이상의 재조합 폴리뉴클레오티드를 포함하는 숙주 세포를 제공하는 단계로서,

o 여기서 상기 핵산 서열은 핵산 서열의 발현을 가능하게 하는 프로모터에 작동 가능하게 연결되고,

o 여기서 상기 핵산 서열은 이종 숙주에서의 발현에 최적화된 코돈임; 및

- 상기 숙주 세포를 폴리뉴클레오티드의 발현에 영향을 미치는 조건 하에서 적합한 배양 배지에서 배양하는 단계.

- 클라미도모나스 레인하티 (Chlamydomonas reinhardtii) 폴리펩타이드 HydEF, HydG 및 HydA를 암호화는 핵산 서열을 포함하는 하나 이상의 폴리뉴클레오티드를 제공하는 단계로서, 여기서 상기 핵산 서열은 핵산 서열의 발현을 가능하게 하는 프로모터에 작동 가능하게 연결되고, 여기서 상기 핵산 서열은 이종 숙주 세포에서의 발현에 최적화된 코돈임;

- 숙주 세포를 제공하는 단계;

- 상기 숙주 세포를 상기 폴리뉴클레오타이드(들)로 형질전환 또는 형질주입하는 단계;

- 세포 배양 배지를 제공하는 단계; 및

또 다른 측면에서, 본 발명은 다음의 단계를 포함하는 이종 숙주 세포에서 클라미도모나스 레인하티 (Chlamydomonas reinhardtii)의 수소-생성 Fe-Fe 수소화효소의 발현을 극대화하는 방법을 제공한다:

- 클라미도모나스 레인하티 폴리펩타이드 HydEF, HydG 및 HydA를 암호화하는 핵산 서열을 포함하는 폴리뉴클레오티드를 제공하는 단계로서, 여기서 상기 핵산 서열은 프로모터에 작동 가능하게 연결되고 이종 숙주 세포에서 상기 핵산 서열의 발현에 최적화된 코돈임;

- 이종 숙주 세포를 제공하는 단계;

- 세포 배양 배지를 제공하는 단계; 및

바람직하게는, 상기 이종 숙주 세포는 대장균 세포이고, 상기 핵산 서열은 대장균에서의 발현에 최적화된 코돈이다. 바람직하게는, 상기 폴리뉴클레오티드의 프로모터는 대장균에서 상기 폴리뉴클레오티드의 발현을 위한 것이다.

상기 측면 중 어느 하나의 바람직한 실시양태에서, 상기 재조합 폴리뉴클레오티드는 페레독신 NADP 환원효소 및 페레독신, 또는 이들의 기능적으로 동등한 동족체 또는 유도체를 암호화하는 핵산 서열을 포함한다.

바람직하게는, 상기 FNR의 공급원은 페레독신을 환원시키기 위한 환원제로서 NADPH를 이용하는 페레독신 환원효소를 포함하는 플라빈이다. 보다 바람직하게는, 상기 페레독신 단백질은 클라미도모나스 레인하티 (Chlamydomonas reinhardtii)로부터 유래된 것이고, 상기 FNR은 클라미도모나스 레인하티 (Chlamydomonas reinhardtii)로부터의 페로독신을 환원시킬 수 있는 임의의 FNR이다. 특히 바람직한 실시양태에서, 상기 FNR 및 페로독신 단백질은 클라미도모나스 레인하티 (Chlamydomonas reinhardtii) 또는 이의 기능적으로 동등한 동족체 또는 유도체로부터의 아미노산 서열을 포함한다.

상기 숙주 세포는 재조합 단백질의 발현에 사용하기에 적합한 임의의 미생물일 수 있다. 특정 실시양태에서, 상기 숙주 세포는 에쉬리키아 콜라이 (Escherichia coli), 바실러스 서브틸리스 (Bacillus subtilis), 락토바실러스 속 (Lactobacillus sp.) 또는 스트렙토코커스 속 (Streptococcus sp.)으로 이루어진 군으로부터 선택된다. 바람직한 실시양태에서, 상기 미생물은 대장균 (E coli)의 균주 (strain)이다.

특정 실시양태에서, 상기 숙주 세포는 부분적으로 또는 완전히 불활성화 되고/되거나 생존 불가능 (non-viable) 할 수 있다.

본 명세서에서 사용되는 바와 같이, HydEF, HydG, HydA, 페레독신 NADP 환원효소 및 페레독신을 암호화하는 핵산 서열의 조합은 또한 수소 생성 유전자 클러스터 (hydrogen producing gene cluster, HPGC)로 지칭될 수 있다.

일 실시양태에서, 상기 방법들은 유전적으로 변형된 숙주 세포를 이용하거나, 미생물 또는 숙주 세포를 변형시키거나, 또는 미생물 또는 숙주 세포를 포스포프룩토키나아제 (phosphofructokinase), 피루브산 키나아제 (pyruvate kinase), 글리세레이트 뮤테이즈 (glycerate mutase), 6-포스포글루코네이트 탈수소효소 (6-phosphogluconoate dehydratase) 및 2-케토-3-디옥시-6-포스포글루코네이트 알도라제 (2-keto-3-deoxy-6-phosphogluconate aldolase)로 이루어진 군으로부터 선택되는 하나 이상의 내인성 숙주 세포 단백질의 활성 또는 수준을 감소 또는 억제하는 작용제 (agent)와 접촉시키는 단계를 추가로 포함할 수 있다.

상기 포스포프룩토키나아제 (phosphofructokinase), 피루브산 키나아제 (pyruvate kinase), 글리세레이트 뮤테이즈 (glycerate mutase), 6-포스포글루코네이트 탈수소효소 (6-phosphogluconoate dehydratase) 및 2-케토-3-디옥시-6-포스포글루코네이트 알도라제 (2-keto-3-deoxy-6-phosphogluconate aldolase) 중 하나 이상의 활성 또는 수준을 감소 또는 억제하기 위한 작용제는 하나 이상의 단밸직의 활성 또는 수준을 감소시킬 수 있는 저분자, 펩타이드, 항체, 간섭 RNA, 예를 들어 안티센스 RNA, 마이크로 RNA, shRNA, siRNA로부터 선택될 수 있다.

바람직한 실시양태에서, 상기 방법은 상기 미생물 또는 숙주 세포를 유전적으로 변형하는 작용제와 접촉시키거나 관련시키는 것을 포함하며, 이는 하나 이상의 pfkA, pps, gpmA/gpmM, gapA, edd 및 eda (각각 포스포프룩토키나아제, 피루브산 키나아제, 글리세레이트 뮤테이즈, 글리세르알데히드-3-인산 탈수소효소, 6-포스포글루코노에이트 탈수효소 및 2-케토-3-디옥시-6-포스포글루코네이트 알도라제를 암호화함)의 수준 또는 활성이 부분적으로 또는 완전히 감소된다. 예를 들어, 상기 작용제는 유전자의 일부 또는 전부를 결실시키기 위해 CRISPR-Cas9 또는 다른 게놈-편집 시스템 (예컨대, 람다 레드 재조합효소)과 조합하여 사용하기 위한 gRNA 분자를 포함할 수 있다.

또 다른 실시양태에서, 상기 방법은 5탄당 인산 경로의 하나 이상의 단백질의 수준이나 활성을 증가시키기 위해 상기 미생물 또는 숙주 세포를 유전적으로 변형시키거나 변형된 것을 추가로 포함한다. 바람직하게는, 상기 하나 이상의 단백질은 포스포글루코뮤타제 (phosphoglucomutase), 글루코스-6-인산탈수소효소 (glucose-6-phosphate dehydrogenase), 6-포스포글루코노락토나제 (6-phosphogluconolactonase), 6-포스포글루코네이트 탈수소효소 (6-phosphogluconate dehydrogenase), 트랜스케톨라아제 (transketolase) 및 트랜스알돌라아제 (transaldolase)로 이루어진 군으로부터 선택된다. 이들 유전자는 각각 유전자 pgm, zwf, pgl, gnd, tktB 또는 tktA, 및 talA 또는 talB에 의해 암호화된다. 특히 바람직한 실시양태에서, 상기 단백질은 글루코스-6-인산 탈수소효소 (glucose-6-phosphate dehydrogenase)이다.

바람직하게는, 상기 방법은 미생물에 의해 생성된 단백질의 수준이 같은 균주의 야생형 미생물에 비해 증가되도록, 5탄당 인산 경로의 하나 이상의 단백질을 암호화하는 유전자를 과발현하기 위한 핵산 서열을 포함하도록 상기 미생물 또는 숙주 세포를 변형시키는 단계를 포함한다. 대안적인 실시양태에서, 상기 단백질의 증가된 수준 또는 활성은 상기 단백질의 증가된 활성을 도입 또는 하나 이상의 점 돌연변이에 의해 이루어진다.

바람직한 실시양태에서, 상기 글루코스-6-인산 탈수소효소 (glucose-6-phosphate dehydrogenase)를 암호화하는 유전자 zwf가 과발현된다. 다른 실시양태에서, 상기 6-포스포글루코네이트 탈수소효소 (6-phosphogluconate dehydrogenase)를 암호화하는 유전자 gnd가 과발현된다. 또 다른 실시양태에서, 상기 6-포스포글루코노락토나제 (6-phosphogluconolactonase)를 암호화하는 유전자 pgl가 과발현된다. 또 다른 실시양태에서, 상기 글리세르알데하이드-3-인산 탈수소효소 (glyceraldehyde-3-phosphate dehydrogenase)를 암호화하는 유전자 gapA가 과발현된다. 과발현은 pgm, zwf, pgl, gnd, tktB 또는 tktA, 및 talA 또는 talB 중 하나 이상의 프로모터 서열의 변형에 의해 선택적으로 이루어질 수 있다.

특정 실시양태에서, 상기 pgm, zwf, pgl, gnd, tktB 또는 tktA, 및 talA 또는 talB 중 하나 이상에 대한 내인성 프로모터는 상기 유전자의 발현을 증가시키기 위한 외인성 프로모터로 대체된다. 특정 실시양태에서, 상기 pgm, zwf, pgl, gnd, tktB 또는 tktA, 및 talA 또는 talB 중 하나 이상에 대한 내인성 프로모터는 상기 미생물에서 상이한 유전자의 발현을 조절하는 외인성 프로모터로 대체된다. 대안적인 실시양태에서, 상기 pgm, zwf, pgl, gnd, tktB 또는 tktA, 및 talA 또는 talB 중 하나 이상에 대한 내인성 프로모터는 외인성 프로모터로 대체된다. 상기 외인성 프로모터는 비-동족 (non-cognate) 미생물에서 상동 유전자의 발현을 조절하거나 비-동족 미생물에서 비-상동 단백질의 발현을 조절할 수 있다.

특히 바람직한 실시양태에서, 상기 pgm, zwf, pgl, gnd, tktB 또는 tktA, 및 talA 또는 talB 중 하나 이상에 대한 내인성 프로모터는 osmY 프로모터, gapA 프로모터, nirB 프로모터 및 nar 프로모터로 이루어진 군으로부터 선택되는 프로모터로 대체된다.

포스포글루코뮤타제, 글루코스-6-인산 탈수소효소, 6-포스포글루코노락토나제, 6-글루코포스포네이트 탈수소효소, 트랜스케톨라아제 및 트랜스알돌라아제의 과발현 및 증가된 수준 또는 활성은 상기 단백질을 암호화하는 내인성 유전자를 상동 단백질을 암호화하는 외인성 유전자로 대체함으로써 달성될 수 있다.

또 다른 실시양태에서, 상기 재조합 미생물 또는 숙주 세포는 에너지 소비를 위해 수크로스를 대사하도록 변형된다. 미생물이 대장균인 실시양태에서, 상기 미생물은 바람직하게는 수크로스를 대사하는 대장균 균주로부터 각각 수크로스 가수분해효소 및 수크로스 투과효소를 암호화하는 cscA 및 cscB 유전자를 발현하도록 유전적으로 변형된다. 또한, 상기 대장균 미생물은 내인성 대장균 포스포글루코뮤타제 (pgm) 또는 자일로스 이소머라아제 (xylose isomerase, xylA)의 수준 또는 활성을 증가시키도록 유전적으로 변형될 수 있다. 상기 유전자 변형은 내인성 유전자의 발현을 증가시키기 위한 것일 수 있고 (예를 들어, 프로모터 영역의 변형에 의해) 또는 유전자를 암호화하는 외인성 핵산의 도입 및 발현에 의한 것일 수 있다.

숙주 세포가 대장균인 실시양태에서, 상기 대장균 미생물은 외인성 핵산 서열을 발현할 수 있는 대장균의 임의의 균주일 수 있다. 특정 바람직한 실시양태에서, 상기 대장균 균주는 임의의 K12 유래 또는 W 유래 균주로부터 선택된다. 특정 실시양태에서, 상기 대장균 균주는 DH5α (DH5 alpha)로 이루어진 군으로부터 선택된다.

다른 실시양태에서, 본 명세서에 기재된 방법은 본 명세서에 기재된 수소 생성 유전자 클러스터 (HPGC)의 발현을 가능하게 하여 미생물에 의한 수소의 생산을 증가시키기 위한 최적화된 조건에서 미생물 또는 숙주 세포를 배양하는 단계를 추가로 포함한다. 일 실시예서, 상기 방법은 혐기성 조건 하에서 숙주 세포를 배양하는 것을 포함한다. 당업자는 환원제로서 중성 가스의 첨가를 포함하여 혐기성 조건에서 세포를 배양하는 방법에 익숙할 것이다.

또한, 상기 배양 조건은 배양 배지에 제2철 (ferric, 철 III) 또는 제1철 (ferrous, 철 II)의 첨가를 포함할 수 있다. 바람직한 실시양태에서, 제1철 (Fe II)은 적어도 약 20 μM 이상, 바람직하게는 약 50 μM 이하의 농도로 배양 배지에 첨가된다.

배양 조건은 바람직하게는 37 ℃ 이하, 보다 바람직하게는 약 35 ℃ 미만, 약 32 ℃ 미만, 가장 바람직하게는 약 30 ℃ 미만에서 수행된다.

본 발명은 또한 분자 수소 생성 시스템에 사용하기 위한 다양한 핵산 구조체 또는 폴리뉴클레오티드를 제공한다.

하나의 실시양태에서, 본 발명은 폴리펩타이드 HydEF, HydG 및 HydA를 암호화하는 뉴클레오티드 서열을 포함하는 핵산 구조체 또는 폴리뉴클레오티드를 제공하며, 여기서 상기 핵산 서열은 핵산 서열의 발현을 가능하게 하는 프로모터에 작동 가능하게 연결되고, 여기서 상기 핵산 서열은 이종 숙주에서의 발현을 위해 최적화된 코돈이다. 바람직하게는, 상기 핵산 서열은 대장균에서의 발현을 위해 최적화된 코돈이다. 바람직하게는, 상기 HydEF 및 HydG 폴리펩티드는 클라미도모나스 레인하티 (Chlamydomonas reinhardtii)로부터 유래된다.

바람직한 실시양태에서, 본 발명의 상기 핵산 구조체에서 HydA 단백질을 암호화하는 핵산은, 클라미도모나스 레인하티 (Chlamydomonas reinhardtii), 볼복스 카르테리 (Volvox carteri), 지아디아 람블리아 (Giardia lamblia), 엔타모에바 누탈리 (Entamoeba nuttalli), 일로박터 폴리트러퍼스 (Ilyobacter polytrophus), 트리코모나스 바지날리스 (Trichomonas vaginalis), 메가스파에라 마이크로누시포미스 (Megasphaera micronuciformis), 베일로넬라 파르불라 (Veillonella parvula), 베일로넬라 아티피카 (Veillonella atypica), 펩토클로스트리디움 비퍼멘탄스 (Peptoclostridium bifermentans), 클로스트리디움 아르부스티 (Clostridium arbusti), 슈도플라보니프랙터 카필로수스 (Pseudoflavonifractor capillosus), 래크노클로스트리디움 시트로니아에 (Lachnoclostridium citroniae), 래크노클로스트리디움 클로스트리디오폼 (Lachnoclostridium clostridioforme), 펠로시누스 페르멘탄스 (Pelosinus fermentans), 써모데술포비브리오 아일랜디쿠스 (Thermodesulfovibrio islandicus), 수테텔라 와즈워텐시스 (Sutterella wadsworthensis), 클로스트리디움 베이예린키이 (Clostridium beijerinckii), 퓨조박테리움 울서란스 (Fusobacterium ulcerans), 클로스트리디움 타이로부티리쿰 (Clostridium tyrobutyricum), 클로스트리디움 퍼프린젠스 (Clostridium perfringens), 세토박테리움 소메레 (Cetobacterium somerae), 클로스트리디움 베이예린키이 (Clostridium beijerinckii), 클로스트리디움 콜리카니스 (Clostridium colicanis), 클로스트리디움 인테스티날레 (Clostridium intestinale), 클로스트리디움 차우보에이 (Clostridium chauvoei), 셀룰로모나스 피미 (Cellulomonas fimi), 루미니클로스트리디움 써모셀럼 (Ruminiclostridium thermocellum), 네글레이아 그루베리 (Naegleria gruberi), 클로렐라 바리아빌리스 (Chlorella variabilis), 퍼비도박테리움 노도섬 (Fervidobacterium nodosum), 써모토가 페트로필라 (Thermotoga petrophila), 써모토가 레틴게 (Thermotoga lettingae), 티오마이크로스피라 펠로필라 (Thiomicrospira pelophila), 칼다트리박테리움 칼리포르니엔스 (Caldatribacterium californiense), 푸소박테리움 네크로포룸 (Fusobacterium necrophorum), 옴니트로푸스 포디네 (Omnitrophus fodinae), 신트로포써무스 리포칼리두스 (Syntrophothermus lipocalidus), 암모니펙스 데겐시 (Ammonifex degensii), 디설포토마큘럼 하이드로써멀 (Desulfotomaculum hydrothermale), 푸소박테리움 모르티페룸 (Fusobacterium mortiferum), 디설포토마큘럼 쿠즈네초비 (Desulfotomaculum kuznetsovii) 및 라크노클로스트리디움 피토퍼멘탄스 (Lachnoclostridium phytofermentans) 또는 이들의 기능적으로 동등한 동족체 또는 유도체로 이루어진 군으로부터 선택된 유기체로부터의 HydA 단백질의 아미노산 서열을 암호화한다. 바람직하게는, 상기 HydA 단백질은 클라미도모나스 레인하티 (Chlamydomonas reinhardtii), 볼복스 카르테리 (Volvox carteri), 지아디아 람블리아 (Giardia lamblia), 엔타모에바 누탈리 (Entamoeba nuttalli), 일로박터 폴리트러퍼스 (Ilyobacter polytrophus), 트리코모나스 바지날리스 (Trichomonas vaginalis), 메가스파에라 마이크로누시포미스 (Megasphaera micronuciformis), 베일로넬라 파르불라 (Veillonella parvula), 베일로넬라 아티피카 (Veillonella atypica), 및 펩토클로스트리디움 비퍼멘탄스 (Peptoclostridium bifermentans), 및 이들의 기능적으로 동등한 동족체로 이루어진 군으로부터 선택된다. 보다 바람직하게는, 상기 HydA 단백질은 클라미도모나스 레인하티 (Chlamydomonas reinhardtii) 또는 이의 기능적으로 동등한 동족체 또는 유도체로부터 유래된다.

본 발명은 또한 상기 수소 생성 유전자 클러스터 (HPGC)를 암호화하는 핵산 서열을 포함하는 폴리뉴클레오티드를 제공하며, 여기서 HPGC는 HydEF, HydG, HydA, 페레독신 NADP 환원효소 및 페레독신을 암호화하는 유전자를 포함한다. 바람직하게는, 상기 핵산은 페레독신을 환원시키기 위한 환원제로서 NADPH를 이용하는 페레독신 환원효소를 포함하는 플라빈인 FNR을 암호화한다. 보다 바람직하게는, 상기 핵산은 클라미도모나스 레인하티 (Chlamydomonas reinhardtii)로부터의 페레독신 단백질을 암호화하고, 클라미도모나스 레인하티 (Chlamydomonas reinhardtii)로부터의 페로독신을 환원시킬 수 있는 임의의 FNR인 FNR을 암호화한다. 특히 바람직한 실시양태에서, 상기 폴리뉴클레오티드는 클라미도모나스 레인하티 (Chlamydomonas reinhardtii) 또는 이의 기능적으로 동등한 동족체 또는 유도체로부터의 FNR 및 페로독신 단백질을 암호화하는 핵산을 포함한다.

특히 바람직한 실시양태에서, 상기 HPGC를 포함하는 폴리뉴클레오티드의 서열은 서열번호 10 또는 30 내지 40에 제시된 뉴클레오티드 서열을 포함하거나 구성되거나, 또는 본질적으로 구성된다.

본 발명은 또한 수소 제조 시스템에 사용되거나 사용을 위한 본 명세서와 기재된 바와 같은 미생물을 제공한다. 따라서, 본 발명은 다음을 포함하는 수소를 생산하기 위한 시스템을 제공한다:

- 본 명세서에 기재된 것과 같은 재조합 미생물의 배양물 또는 집단;

- 미생물에 의한 수소 생산을 가능하게 하는 하나 이상의 단백질의 발현을 유도하기 위해 재조합 미생물에 의해 사용되는 공급원료.

선택적으로, 상기 시스템은 또한 재조합 미생물에 의해 생성된 수소를 저장 또는 전달하기 위한 수단을 포함한다.

바람직하게는, 상기 공급원료는 글루코스 또는 수크로스 또는 임의의 다른 탄수화물 공급원과 같은 탄수화물-기반 공급원료다.

본 발명은 또한, 본 명세서에 기재된 바와 같은 수소 생성 시스템을 포함하는 용기, 본 발명의 수소 생성 미생물의 현탁액을 포함하는 상기 시스템, 상기 재조합 미생물에 의해 사용될 수 있는 탄소 공급원을 제공하기 위한 공급원료 및 상기 현탁액으로부터 수소 가스를 분리 또는 추출하기 위한 수단을 포함하는 수소 생산용 생물반응기 (bioreactor)를 제공한다.

본 발명은 또한 전기 생산 시스템에 사용되거나 사용을 위한 본 명세서와 기재된 바와 같은 미생물을 제공한다. 따라서, 본 발명은 다음을 포함하는 수소로부터 전기를 생산하기 위한 시스템 또는 장치를 제공한다:

- 본 명세서에 기재된 것과 같은 재조합 미생물의 배양 또는 집단;

- 미생물에 의한 수소 생산을 가능하게 하는 하나 이상의 단백질의 발현을 유도하기 위해 재조합 미생물에 의해 사용되는 공급원료;

- 수소 연료 전지;

- 재조합 미생물에 의해 생성된 수소를 수소 연료 전지로 전달하기 위한 수단.

본 발명은 또한 본 명세서에 기재된 바와 같은 재조합 미생물을 포함하는 시스템 또는 장치를 작동하는 단계, 또는 본 명세서에 기재된 방법에 따라 생성된 수소를 이용하는 단계를 포함하는 전기 생산 방법을 제공한다.

본 발명은 또한 수소로부터 전기를 생산하는 시스템 또는 장치에서, 본 명세서에 기재된 바와 같은 재조합 미생물의 용도를 제공한다.

문맥상 달리 요구하는 경우를 제외하고, 본 명세서에 사용된 바와 같이 용어 "포함하다"와 "포함하는", "포함한" 및 "포함된"과 같은 용어의 변형은 추가 첨가제, 성분, 정수 또는 단계를 제외하도록 의도되지 않는다.

본 발명의 추가적인 측면 및 선행 단락에서 설명된 측면들의 추가적인 실시양태는 첨부된 도면을 참조하여 예시로서 제공된 다음 설명으로부터 명백해질 것이다.

도 1 : 수소 생성 유전자 클러스터 (HPGC)를 발현하는 야생형 및 돌연변이 균주에서의 수소 생산. 50 mL 대장균 배양물에 20 mM 글루코스를 첨가한 후 H₂ 가스 생성. 수소 생성 유전자 클러스터 (HPGC)가 없는 DH5α는 이러한 조건에서 수소를 생성하지 않음. 플라스미드 pHPGC를 갖는 4개의 균주 DH5α; pHPGC가 있는 DH5α Δpfk; pHPGC가 있는 DH5α ΔgpmA; 및 플라스미드 pH1-HEFG (petF-FNR이 없는 pHPGC)가 있는 DH5α는 글루코스 첨가 후 빠르게 수소 축적을 시작함. 가스 크로마토그래피로 측정한 기체상의 수소 농도.
도 2: 수소 생성 유전자 클러스터를 발현하는 야생형 및 돌연변이 균주에서 총 유기산 발효 생성물 (숙신산 + 피브루산 + 젖산)의 축적. HPGC를 이용한 수소 생산을 위한 글루코스 첨가 후 유기산 축적.
도 3: 본 발명의 미생물을 포함하는 예시적인 장치의 개략도
도 4: pHPGC를 포함하는 야생형 대장균 DH5α (대조군)에 비해 pHPGC를 포함하는 다양한 재조합 미생물의 수소 생산 속도. gpmM, ΔgpmA를 제거하여 당분해 경로의 하부를 통해 글루코스로부터 탄소의 흐름을 감소시키도록 유전적으로 변형된 대장균에 의한 수소 생산 속도 (L/h). gpmA와 gpmM이 제거됨에 따라 수소 생산 속도가 증가하였음. gnd와 zwf의 증가된 발현은 또한 수소 생산 속도를 향상시켰음.
도 5: pHPGC를 포함하는 야생형 대장균 DH5α (대조군)에 대한 pHPGC를 포함하는 다양한 재조합 미생물에 의해 생성된 이산화탄소에 대한 수소의 비율. Zwf, Gp::zwf의 발현을 증가시키거나, pfk활성, Δpfk을 감소시키면서 CO₂에 대한 수소의 비율이 증가하여 5탄당 인산 경로를 통한 플럭스가 증가됨. gnd는 zwf에 의해 암호화되는 단백질의 다운스트림에 있는 단백질을 암호화하므로, 이 돌연변이에서 gnd, Gp::gnd의 활성 증가는 야생형 (wt) DH5와 비교하여 H₂ 대 CO₂ 비율에 큰 영향을 미치지 않음.
도 6: 변형된 DH5α cscAB에 의한 수소 제조 시 수크로스의 활용. HPGC 균주가 가진 DH5α cscAB는 수크로스를 사용하여 HPGC를 가진 양성대조군 W 균주와 같은 수소를 만들 수 있음. HPGC를 가진 야생형 DH5α는 수크로스를 사용할 수 없으며 수크로스가 이 균주에 공급될 때 수소가 검출되지 않음.

본 명세서에 개시되고 정의된 본 발명은 본문 또는 도면으로부터 언급되거나 명백한 개별 특징들 중 둘 이상의 모든 대안적인 조합으로 확장된다는 것을 이해할 것이다. 이러한 상이한 조합들은 모두 본 발명의 다양한 대안적 측면을 구성한다.

본 발명의 특정 실시예들에 대해 상세히 언급하기로 한다. 본 발명은 실시예와 함께 설명될 것이지만, 본 발명의 이러한 실시예로 제한하려는 의도가 아님을 이해할 것이다. 반대로, 본 발명은 청구범위에 의해 정의된 본 발명의 범위 내에 포함될 수 있는 모든 대안, 변형 및 등가물을 포함하도록 의도된다.

당업자는 본 발명의 실시에 사용될 수 있는 본 명세서에 기재된 것과 유사하거나 동등한 많은 방법 및 재료를 인식할 것이다. 본 발명은 기술된 방법 및 재료에 결코 제한되지 않는다. 본 명세서에 개시되고 정의된 본 발명은 본문 또는 도면으로부터 언급되거나 명백한 개별 특징들 중 둘 이상의 모든 대안적인 조합으로 확장된다는 것으로 이해될 것이다. 이러한 상이한 조합들은 모두 본 발명의 다양한 대안적 측면을 구성한다.

본 명세서에 언급된 모든 특허 및 간행물은 그 전체가 참조로 포함된다.

본 명세서를 해석하기 위한 목적으로, 단수로 사용된 용어는 복수도 포함하고 그 반대의 경우도 마찬가지이다.

미생물은 일반적으로 수소화효소로 알려진 부류의 효소를 사용하여 분자 수소를 합성할 수 있다. 수소를 생성하는 이러한 효소의 능력을 활용하기 위해, 연구자들은 이종 발현 시스템에서 다양한 미생물 및 조류로부터 수소화효소를 발현시키기 위해 노력해왔다. 일반적으로, 이러한 접근법은 조류 및 '극한 (extremophile) 미생물'로부터 다양한 수소화효소를 스크리닝하는 것과 관련되어 있다. 그러나, 이러한 유형의 접근법을 사용하여 충분한 양의 수소를 생성하려는 노력은 이종 유기체에서 발현될 때 이러한 수소화효소와 이들의 동족 성숙 단백질, 그리고 생성된 Fe-Fe 수소화효소 복합체의 불안정성으로 인해 방해를 받았다.

이러한 한계를 해결하기 위해, 이 분야의 다른 사람들은 이종 유기체에서 수소화효소를 발현할 때 비동족 유기체로부터 성숙 단백질을 공동 발현시키려고 노력했다. 그러나, 이 접근법은 일반적으로 상용 시스템에서 사용하기에 충분한 수준의 수소를 얻는 어려움을 극복하지 못했다.

다른 이들은 예를 들어, Fe-Fe 수소화효소보다는 Ni-Fe 수소화효소를 발현하는 것과 같이 발현되는 수소화효소의 유형에 초점을 맞추려고 한다. 이러한 시스템은 시험관 내에서 기능적이며, NADPH 의존성 Ni-Fe 수소화효소 및 5탄당 인산 경로 효소로부터 상업적으로 이용 가능한 효소의 혼합물만을 사용하여 수소를 생산하는 데 효과적인 것으로 입증되었다. 그러나 이러한 시스템은 추가 효소를 제공하는 비용으로 인해 상업적으로 실행 가능한 것이 입증되지 않았다. 또한, 수소 생산 속도가 상업적인 생산에 비해 너무 느렸다.

본 발명자들은 이종 숙주 세포에서 발현되는 조류 유전자로부터 분자 수소의 생산을 극대화하기 위한 새로운 접근법을 규명하였다. 본 발명자들이 채택한 접근법은 다양한 미생물로부터 Fe-Fe 수소화효소 복합체의 안정적인 생산을 가능하게 한다. 더욱이, 본 발명자들은 이러한 접근법이 시간이 지남에 따라 증가된 수소 생산 속도 및 수율 (투입당 생산량)을 제공한다고 믿는다. 본 발명자들의 접근법은 생물학적 수소의 생성을 위한 이전의 최적화되지 않은 접근법에 비해 주요한 발전을 나타낸다.

수소 생성 유전자 클러스터

본 발명은 본 명세서에 기재된 바와 같은 미생물에 그 미생물에서 수소를 생산하는데 필요한 분자 기계의 성분을 암호화하는 다양한 핵산 서열을 제공하는 것을 포함한다. 또한, 본 발명은 이러한 핵산 서열을 포함하는 유전적으로 변형된 미생물을 제공한다.

특히, 본 발명은 HydEF, HydG 및 HydA 단백질을 암호화하는 핵산 서열 (재조합 폴리뉴클레오티드 포함)을 갖는 숙주 세포의 제공을 포함한다. 바람직한 실시양태에서, 숙주 세포에는 또한 페레독신 NADP 환원효소 (Ferredoxin NADP reductase, FNR) 및 페레독신 (petF)을 암호화하는 핵산이 제공된다. 수소는 미생물이 HydA를 암호화하는 핵산 서열을 발현하도록 변형되고, 상기 미생물이 내인성 페로독신을 포함하는, 본 명세서에 기재된 바와 같은 미생물에 의해 생성될 수 있음이 이해될 것이다.

더욱이, 수소화효소의 성숙은 아자디티올레이트 브릿지 (azadithiolate bridge)를 포함하는 [2Fe]-하위 모방체와 같은 저분자를 사용하여 달성될 수 있다. 이러한 인자들은, 예를 들어, Esselborn 외, (2013) Nat Chem Biol 9 (10):607-609 및 Berggren 외, (2013) Nature, 499:66-69에 기술되어 있으며, 이들의 내용은 참조에 의해 본 명세서에 통합된다.

그러나, 바람직한 실시양태에서, 상기 미생물은 바람직하게 본 명세서에서 정의된 바와 같은 HPGC의 성분을 발현하도록 변형된다.

본 명세서에 사용된 바와 같이, 수소 생성 유전자 클러스터 (hydrogen producing gene cluster, HPGC)는 바람직하게는 HydA, HydEF, HydG, 페레독신 NADP 환원효소 및 페레독신을 암호화하는 핵산 서열을 포함하며, 여기서 HydA는 Fe-Fe 수소화효소 (바람직하게는, A1 서브클래스)를 의미하고 HydEF 및 HydG는 활성 FeFe-수소화효소의 형성에 필요한 단백질의 성숙 및 조립 복합체를 의미한다.

본 발명에서 사용된 HydA는 철 (iron) 수소화효소 또는 철 수소화효소 HydA1 또는 Hyd1로도 알려진 임의의 Fe-Fe-수소화효소 단백질 HydA를 의미한다. 이 단백질은 유전자 hyd1에 의해 암호화된다.

당업자는 주어진 수소화효소가 Ni-Fe 수소화효소와 구별되는 Fe-Fe 수소화효소 (A1 클래스 포함)인지 여부를 결정하는 방법을 포함하여 다양한 수소화효소를 분류하는 방법에 익숙할 것이다. 이러한 방법은 예를 들어 Søndergaard 외, (2016) Scientific Reports, 6:34212에 설명되어 있다.

HydA 단백질은 클라미도모나스 레인하티 (Chlamydomonas reinhardtii), 볼복스 카르테리 (Volvox carteri), 지아디아 람블리아 (Giardia lamblia), 엔타모에바 누탈리 (Entamoeba nuttalli), 일로박터 폴리트러퍼스 (Ilyobacter polytrophus), 트리코모나스 바지날리스 (Trichomonas vaginalis), 메가스파에라 마이크로누시포미스 (Megasphaera micronuciformis), 베일로넬라 파르불라 (Veillonella parvula), 베일로넬라 아티피카 (Veillonella atypica), 펩토클로스트리디움 비퍼멘탄스 (Peptoclostridium bifermentans), 클로스트리디움 아르부스티 (Clostridium arbusti), 슈도플라보니프랙터 카필로수스 (Pseudoflavonifractor capillosus), 래크노클로스트리디움 시트로니아에 (Lachnoclostridium citroniae), 래크노클로스트리디움 클로스트리디오폼 (Lachnoclostridium clostridioforme), 펠로시누스 페르멘탄스 (Pelosinus fermentans), 써모데술포비브리오 아일랜디쿠스 (Thermodesulfovibrio islandicus), 수테텔라 와즈워텐시스 (Sutterella wadsworthensis), 클로스트리디움 베이예린키이 (Clostridium beijerinckii), 퓨조박테리움 울서란스 (Fusobacterium ulcerans), 클로스트리디움 타이로부티리쿰 (Clostridium tyrobutyricum), 클로스트리디움 퍼프린젠스 (Clostridium perfringens), 세토박테리움 소메레 (Cetobacterium somerae), 클로스트리디움 베이예린키이 (Clostridium beijerinckii), 클로스트리디움 콜리카니스 (Clostridium colicanis), 클로스트리디움 인테스티날레 (Clostridium intestinale), 클로스트리디움 차우보에이 (Clostridium chauvoei), 셀룰로모나스 피미 (Cellulomonas fimi), 루미니클로스트리디움 써모셀럼 (Ruminiclostridium thermocellum), 네글레이아 그루베리 (Naegleria gruberi), 클로렐라 바리아빌리스 (Chlorella variabilis), 퍼비도박테리움 노도섬 (Fervidobacterium nodosum), 써모토가 페트로필라 (Thermotoga petrophila), 써모토가 레틴게 (Thermotoga lettingae), 티오마이크로스피라 펠로필라 (Thiomicrospira pelophila), 칼다트리박테리움 칼리포르니엔스 (Caldatribacterium californiense), 푸소박테리움 네크로포룸 (Fusobacterium necrophorum), 옴니트로푸스 포디네 (Omnitrophus fodinae), 신트로포써무스 리포칼리두스 (Syntrophothermus lipocalidus), 암모니펙스 데겐시 (Ammonifex degensii), 디설포토마큘럼 하이드로써멀 (Desulfotomaculum hydrothermale), 푸소박테리움 모르티페룸 (Fusobacterium mortiferum), 디설포토마큘럼 쿠즈네초비 (Desulfotomaculum kuznetsovii) 및 라크노클로스트리디움 피토퍼멘탄스 (Lachnoclostridium phytofermentans) 또는 이들의 기능적으로 동등한 (equivalent) 동족체 또는 유도체로 이루어진 군으로부터 선택된 미생물의 HydA 단백질일 수 있다.

바람직하게는, 상기 HydA 단백질은 클라미도모나스 레인하티 (Chlamydomonas reinhardtii), 볼복스 카르테리 (Volvox carteri), 지아디아 람블리아 (Giardia lamblia), 엔타모에바 누탈리 (Entamoeba nuttalli), 일로박터 폴리트러퍼스 (Ilyobacter polytrophus), 트리코모나스 바지날리스 (Trichomonas vaginalis), 메가스파에라 마이크로누시포미스 (Megasphaera micronuciformis), 베일로넬라 파르불라 (Veillonella parvula), 베일로넬라 아티피카 (Veillonella atypica), 펩토클로스트리디움 비퍼멘탄스 (Peptoclostridium bifermentans) 및 이들의 기능적으로 동등한 동족체로 이루어진 군으로부터 선택된다. 보다 바람직하게는, 상기 HydA 단백질은 클라미도모나스 레인하티 (Chlamydomonas reinhardtii) 또는 이의 기능적으로 동등한 동족체 또는 유도체로부터 유래된다.

HydA에 대한 클라미도모나스 레인하티 단백질 서열의 예시적인 서열은UnitProt 등록번호 (accession number) Q9FYU1에서 제공되고, 상기 단백질을 암호화하는 예시적인 핵산 서열은 등록번호 AJ308413, CAC83731.1 (EBI) 및 XP_001693376.1.에서 찾을 수 있다.

HydA를 암호화하는 예시적인 핵산 서열은 서열번호 6에 제시된다. hydA의 발현을 가능하게 하는 예시적인 프로모터는 서열번호 5에 제시된다.

볼복스 카르테리, 지아디아 람블리아, 엔타모에바 누탈리, 일로박터 폴리트러퍼스, 트리코모나스 바지날리스, 메가스파에라 마이크로누시포미스, 베일로넬라 파르불라, 베일로넬라 아티피카, 및 펩토클로스트리디움 비퍼멘탄스로부터의 HydA에 대한 서열 정보를 제공하는 예시적인 등록번호는 각각 XP002956049, XP001709915, XP008860420, WP013388849 (및 XP002948483), XP001330775, WP006942403, WP004697562, WP005375825 및 WP021432477이 포함된다.

볼복스 카르테리, 지아디아 람블리아, 엔타모에바 누탈리, 일로박터 폴리트러퍼스, 트리코모나스 바지날리스, 메가스파에라 마이크로누시포미스, 베일로넬라 파르불라, 베일로넬라 아티피카, 및 펩토클로스트리디움 비퍼멘탄스로부터의 HydA를 암호화하는 예시적인 코돈 최적화 핵산 서열 (제한 부위 포함)은 서열번호 18 내지 27에 제시된다.

본 명세서에서 사용된 HydEF는 바람직하게는 클라미도모나스 레인하티 Fe-수소화효소 조립 단백질 HydEF를 의미하며, 또한 철 수소화효소 조립 단백질 HydEF라고도 지칭한다. 이 단백질은 유전자 hydEF에 의해 암호화된다. HydEF에 대한 클라미도모나스 레인하티 단백질 서열의 예시적인 서열은 UniProt 등록번호 Q6PSL5에 제공되고, 상기 단백질을 암호화하는 예시적인 핵산 서열은 등록번호 DS496119, EDP05198.1 (EBI) 및 XP_001691465.1에서 찾을 수 있다.

HydEF를 암호화하는 예시적인 핵산 서열은 서열번호 2에 제공된다. hydEF의 발현을 가능하게 하는 예시적인 프로모터는 서열번호 1에 제공된다.

본 명세서에 사용된 HydG는 클라미도모나스 레인하티 Fe-수소화효소 조립 단백질 HydG를 의미하며, 또한 철 수소화효소 조립 단백질 HydG라고도 지칭한다. 이 단백질은 유전자 hydG에 의해 암호화된다. HydG에 대한 클라미도모나스 레인하티 단백질 서열의 예시적인 서열은 UniProt 등록번호 Q6PSL4에 제공되고, 상기 단백질을 암호화하는 예시적인 핵산 서열은 등록번호 DS496119, EDP05052.1 (EBI) 및 XP_001691319.1에서 찾을 수 있다.

HydG를 암호화하는 예시적인 핵산 서열은 서열번호 4에 제공된다. hydG의 발현을 가능하게 하는 예시적인 프로모터는 서열번호 3에 제공된다.

본 명세서에 사용된 페레독신은 petF 유전자에 의해 암호화된 클라미도모나스 레인하티 페레독신 단백질을 의미한다. 페레독신에 대한 클라미도모나스 레인하티 단백질 서열의 예시적인 서열은 UniProt 등록번호 A8IV40에 제공되고, 상기 단백질을 암호화하는 예시적인 핵산 서열은 등록번호 DS496124, EDP03827.1 (EBI) 및 XP_001692808.1에서 찾을 수 있다.

페레독신을 암호화하는 예시적인 핵산 서열은 서열번호 8에 제공된다. petF의 발현을 가능하게 하는 예시적인 프로모터는 서열번호 7에 제공된다.

본 명세서에서 사용된 클라미도모나스 레인하티 페레독신 NADP 환원효소 (ferredoxin NADP reductase, FNR)는 EC:1.18.1.2를 의미한다. 상기 단백질은 유전자 petH 또는 fnr1에 의해 암호화된다. FNR에 대한 클라미도모나스 레인하티 단백질 서열의 예시적인 서열은 UniProt 등록번호 A8J6Y8 및 P53991에 제공되고, 상기 단백질을 암호화하는 예시적인 핵산 서열은 등록번호 DS496140, EDP00292.1 (EBI) 및 XP_001697352.1에서 찾을 수 있다.

FNR을 암호화하는 예시적인 핵산 서열은 서열번호 9에 제공된다.

바람직한 실시양태에서, 상기 HydEF, HydG, HydA, 페레독신 및 FNR 단백질을 암호화하는 핵산 서열은 단일 폴리뉴클레오티드 구조체로 제공된다. 일 실시예에서, 상기 폴리뉴클레오티드는 서열번호 10에 제시된 핵산 서열을 갖는다.

5탄당 인산 경로로 글루코스의 산화 전환

본 발명자들은 당분해 (glycolytic) 경로로부터 5탄당 인산 경로를 분리하는 것이 탄수화물을 수소로 최적의 전환을 시킬 수 있다는 것을 발견하였다. 따라서, 바람직한 실시양태에서, 본 발명의 미생물은 포스포프룩토키나아제 (phosphofructokinase), 피루브산 키나아제 (pyruvate kinase), 글리세레이트 뮤테이즈 (glycerate mutase), 6-포스포글루코네이트 탈수소효소 (6-phosphogluconoate dehydratase) 및 2-케토-3-디옥시-6-포스포글루코네이트 알도라제 (2-keto-3-deoxy-6-phosphogluconate aldolase)를 암호화하는 하나 이상의 내인성 유전자의 발현을 감소 또는 결실시키도록 추가로 변형된다. 이 단백질들은 각각 유전자 pfkA, pps, gpmA, gpmM, gapA, edd 및 eda에 의해 암호화된다.

또한, 본 발명의 방법은 포스포프룩토키나아제, 피루브산 키나아제, 글리세레이트 뮤테이즈, 6-포스포글루코네이트 탈수소효소 및 2-케토-3-디옥시-6-포스포글루코네이트 알도라제 중 하나 이상의 단백질의 활성 또는 수준을 억제하기 위한 하나 이상의 작용제와 미생물을 접촉시키는 단계를 포함한다.

본 명세서에 사용된 바와 같이, PFK로도 알려진 포스포프룩토키나아제 (E.C. 2.7.1.11 및 E.C. 2.7.1.105)는 해당과정 (glycolysis)에서 과당 6-인산을 인산화하는 키나아제 효소이다. 포스포프룩토키나아제는 당분해 경로의 핵심 조절 단계인 과당-6-인산이 과당-1,6-이인산염 (fructose-1,6-diphosphate)으로의 인산화를 촉매한다.

본 명세서에 사용된 피루브산 키나아제 (E.C. 2.7.1.40)는 pps 유전자에 의해 암호화되는 효소로서, 포스포엔올피루브산 (phosphoenolpyruvate, PEP)에서 아데노신 이인산 (adenosine diphosphate, ADP)으로의 포스페이트 그룹의 전이를 촉매하여 한 분자의 피루브산과 한 분자의 ATP를 생성한다.

본 명세서에 사용된 글리세레이트 뮤테이즈는 2,3-비스포스포글리세레이트 (bisphosphoglyerate)-의존성 (dPGM, GpmA) 또는 보조 인자-비의존성 (iPGM, GpmM) 포스포글리세레이트 뮤테이즈 중 하나를 지칭할 수 있다. 2,3- 비스포스포글리세레이트-의존성 포스포글리세레이트 뮤테이즈는 gpmA 유전자에 의해 암호화되며, 2-포스포-D-글리세레이트 ↔ 3-포스포-D-글리세레이트 반응을 촉매한다. 2,3-비스포스포글리세레이트-비의존성 포스포글리세레이트 뮤테이즈 (gpmC; pgmI; gpmI 또는 yibO라고도 함)는 gpmM 유전자에 의해 암호화되며 동일한 반응을 촉매한다. iPGM 효소는 특이적 활성이 현저히 낮다. 따라서, 바람직하게는 pgmA는 본 발명의 방법에 따라 결실 또는 억제를 위해 표적화된다.

본 명세서에 사용된 6-포스포글루코네이트 탈수소효소 (E.C. 4.2.1.12)는 6-포스포-D-글루코네이트 ↔ 2-디하이드로-3-디옥시-6-포스포-D-글루코네이트 + H₂O 반응을 촉매하는 효소이다. 일반적으로 사용되는 다른 명칭으로는 6-포스포글루코네이트 디하이드라타아제 (6-phosphogluconate dehydratase), 6-포스포글루코산 디하이드라아제 (6-phosphogluconic dehydrase), 글루코네이트-6-포스페이트 디하이드라타아제 (gluconate-6-phosphate dehydratase), 글루코네이트 6-포스페이트 디하이드라타아제 (gluconate 6-phosphate dehydratase), 6-포스포글로루네이트 디하이드라아제 (6-phosphogluconate dehydrase) 및 6-포스포-D-글루코네이트 하이드로-리아제 (6-phospho-D-gluconate hydro-lyase) 등이 있다.

본 명세서에 사용된 바와 같이, 일반적으로 KDPG 알도라제로 알려진 2-케토-3-디옥시-6-포스포글루코네이트 알도라제 (E.C. 4.1.2.14)는 2-디하이드로-3-디옥시-D-글루코네이트 6-인산 ↔ 피루브산 + D-글리세르알데하이드 3-인산 반응을 촉매하는 효소이다.

포스포프룩토키나아제, 피루브산 키나아제, 글리세레이트 뮤테이즈, 6-포스포글루코네이트 탈수소효소 및 2-케토-3-디옥시-6-포스포글루코네이트 알도라제 중 임의의 하나 이상이 본 발명의 미생물 또는 숙주 세포를 단백질의 수준 또는 활성이 감소 또는 억제시키는 임의의 작용제와 접촉시킴으로써 억제될 수 있음이 이해될 것이다. 상기 억제는 직접적이거나 간접적일 수 있다. 상기 억제는 부분적이거나 완전할 수 있다.

상기 억제제는 바람직하게는 하나 이상의 단백질의 활성 또는 수준을 감소시킬 수 있는 저분자, 펩타이드, 항체, 간섭 RNA, 예를 들어 안티센스 RNA, 마이크로RNA, shRNA, siRNA 중에서 선택된다.

바람직한 실시양태에서, 상기 미생물 또는 숙주 세포는 유전자 pfkA, pps, gpmA, gpmM, gapA, edd 및 eda 중 하나 이상의 발현을 완전히 결실시키거나 부분적으로 감소시키도록 유전적으로 변형된다.

당업자는 유전자 발현을 부분적으로 또는 완전히 감소시키기 위해 유전자 서열을 결실 또는 변형시키는 다양한 기술에 익숙할 것이다. 특정 실시양태에서, 유전자 변형은 CRISPR-Cas9 시스템의 사용에 의한 것이다. 사용할 수 있는 다른 게놈 편집 기술로는 람다 레드 재조합 효소 시스템 (lambda red recombinase system), 무작위 돌연변이 생성 및 선택, 다중 자동 게놈 엔지니어링 (Multiplex Automated Genome Engineering, MAGE) 등이 있다. 일 실시예에서, CRISPR-Cas9 및 람다 레드 재조합 효소의 조합은 Reisch CR 및 Prather KL, (2015) The no-SCAR (Scarless Cas9 Assisted Recombineering) system for genome editing in Escherichia coli, Sci Rep. 14(5): 15096 에서 개략적으로 설명된 바와 같이 사용될 수 있다.

상기 pfkA, pps, gpmA, gpmM, gapA, edd 및 eda 유전자 중 임의의 하나 이상의 감소된 발현은 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90% 감소된 발현 또는 100% 감소된 발현일 수 있다.

상기 결실되거나 발현이 감소된 유전자는 바람직하게는 pfk 또는 gpmA이다. 다른 실시양태에서, pfk 및 gpmA 또는 pfk 및 gpmM은 모두 결실된다. 또한, edd 및 eda는 모두 결실될 수 있다. 대안적인 실시양태에서, edd 및 eda와 조합된 gpmM 및/또는 gpmA는 결실된다. 또 다른 실시양태에서, pfk, edd-eda 및 gpmA 또는 gpmM은 결실된다.

글루코스의 산화를 5탄당 인산 경로로 더욱 유도하고, 수소의 생성 속도 및 수율을 극대화하기 위해, 본 발명은 또한 다양한 내인성 유전자의 증가된 발현 또는 활성 (또는 이들이 암호화하는 단백질의 억제)을 고려한다.

따라서, 바람직한 실시양태에서, 본 발명의 미생물은 포스포글루코뮤타제 (phosphoglucomutase), 글루코스-6-인산 탈수소효소 (glucose-6-phosphate dehydrogenase), 6-포스포글루코노락토나제 (6-phosphogluconolactonase), 6-글루코포스포네이트 탈수소효소 NAD 키나아제 (6-glucophosphonate dehydrogenase NAD kinase) 및 가용성 피리딘 뉴클레오티드 트랜스히드로게나아제 (pyridine nucleotide transhydrogenase)를 암호화하는 유전자 중 하나 이상의 수준 또는 활성을 증가시키도록 추가로 변형된다. 이들 단백질은 각각 pgm, zwf, pgl, gnd, yfjB 및 sthA 유전자에 의해 암호화된다. 더욱이, 본 발명의 방법은 포스포글루코뮤타제, 글루코스-6-인산 탈수소효소, 6-포스포글루코노락토나제 및 6-포스포글루코네이트 탈수소효소 중 하나 이상의 단백질의 발현을 증가시키는 것을 포함한다.

본 명세서에서 사용된 포스포글루코뮤타제 (PGM) (E.C. 5.3.1.9)는 글루코스-포스페이트 이소머라제 (glucose-phosphate isomerase), 포스포글루코스 이소모라제/포스포글루코이소머라제 (phosphoglucose isomerase/phosphoglucoisomerase, PGI) 또는 포스포헥소스 이소머라제 (phosphohexose isomerase, PHI)로도 알려져 있으며, 글루코스-6-포스페이트 (glucose-6-phosphate, G6P) 및 프룩토오스-6-포스페이트 (fructose-6-phosphate, F6P)을 상호 전환시켜 당분해 효소 (글루코스-6-포스페이트 이소머라제)로서 기능하는 효소이다. 상기 반응은 가역적이므로 그 방향은 G6P및 F6P 농도에 의해 결정된다.

특정 실시양태에서, PGM의 수준 또는 활성은 내인성 pgm 유전자의 발현을 증가, 예를 들어 유전자의 발현 증가를 가능하게 하는 프로모터를 도입함으로써 증가된다.

바람직한 실시양태에서, 대장균에서 pgm 유전자의 프로모터는 대장균으로부터의 gapA 프로모터로 대체된다. 예시적인 gapA 프로모터 (gapAp) 5'-3'은 서열번호 13에 제시되어 있다.

본 명세서에서 사용된 글루코스-6-인산 탈수소효소 (E.C. 1.1.1.49) 는 G6PD로도 알려져 있으며, D-글루코스 6-인산 + NADP+ ↔ 6-포스포-D-글루코노-1,5-락톤 + NADPH + H+의 화학 반응을 촉매하는 효소이다. G6PD는 G6P를 6-포스포글루코노-δ-락톤으로 전환하고, 5탄당 인산 경로의 속도 제한 효소이다. 따라서, G6PD의 조절은 나머지 5탄당 인산 경로의 활성에 대한 다운스트림 결과를 갖는다. 글루코스-6-인산 탈수소효소는 이의 기질 G6P에 의해 자극된다. 대장균에서 zwf 유전자는 글루코스-6-인산 1-탈수소효소를 암호화한다. 대장균 G6PD 단백질의 예시적인 아미노산 서열은 Uniprot 등록번호 POAC53에서 찾을 수 있고, 예시적인 핵산 서열은 등록번호 M55005, NP_416366.1 및 NC_000913.3에서 찾을 수 있다. 자이모모나스 모빌리스 (Zymomonas mobilis)의 동족 단백질은 zwf에 의해 암호화되며, 이의 예시적인 핵산 서열은 본 명세서의 서열번호 16에 제시되어 있다.

특정 실시양태에서, G6PD의 수준 또는 활성은 내인성 zwf 유전자의 발현을 증가시킴으로써, 예를 들어 유전자의 증가된 발현을 가능하게 하는 프로모터를 도입함으로써 증가된다. 특정 실시양태에서, 대장균 zwf 프로모터는 osmY 프로모터 (osmYp)로 대체된다. 예시적인 osmY 프로모터 (osmYp) 서열은 서열번호 12에 제시되어 있다. 대안적인 실시양태에서, 대장균 zwf 프로모터는 서열번호 13에 제시된 바와 같이 대장균 gapA 프로모터로 대체된다.

바람직한 실시양태에서, G6PD의 수준 또는 활성은 대장균의 zwf 유전자를 자이모모나스 모빌리스의 zwf 유전자로 대체 또는 보충함으로써 증가된다. 추가적인 실시양태에서, 대장균의 zwf 유전자는 임의의 그람 음성 통성 (facultative) 박테리아로부터 zwf 유전자로 대체되거나 보충된다.

본 명세서에서 6-포스포글루코노락토나제 (E.C. 3.1.1.31)는 6PGL 또는 PGLS로도 알려져 있으며, 5탄당 인산 경로의 산화 단계에서 6-포스포글루코노락톤을 6-포스포글루콘산 (또는 6-포스포-D-글루코네이트 + H⁺)으로 가수분해를 촉매하는 효소이다. 6-포스포글루코노락토나제는 6-포스포글루코노락톤을 6-포스포글루콘산으로 전환하는 것을 촉매하고, 이는 모두 5탄당 인산 경로의 산화 단계에서 중간체이며, 여기서 글루코스는 리불로스 5-인산으로 전환된다. 5탄당 인산 경로의 산화 단계는 CO2를 방출하고 NADP+로부터 2당량의 NADPH를 생성한다. 최종 생성물인 리불로스 5-인산은 뉴클레오티드, ATP 및 코엔자임 A를 포함한 생체 분자를 합성하기 위해 5탄당 인산 경로의 비-산화 단계동안 유기체에 의해 추가로 처리된다. 5탄당 인산 경로에서 6PGL 보다 앞서는 효소인 글루코스-6-인산 탈수소효소는 6-포스포글루코노락톤의 δ-이소머를 독점적으로 형성한다. 예시적인 대장균 6PGL 서열은 Uniprot 등록번호 P52697에서 찾을 수 있고, 예시적인 핵산 서열은 등록번호 U27192, NP_415288.1 및 NC_000913.3에서 찾을 수 있다.

특정 실시양태에서, PGL의 수준 또는 활성은 내인성 pgl 유전자의 발현을 증가시킴으로써, 예를 들어 상기 유전자의 발현 증가를 가능하게 하는 프로모터를 도입함으로써 증가한다.

바람직한 실시양태에서, 대장균에서 pgl 유전자의 프로모터는 대장균으로부터의 gapA 프로모터로 대체된다. 예시적인 gapA 프로모터 (gapAp) 5'-3'은 서열번호 13에 제시되어 있다.

본 명세서에서 사용된, GAPDH로도 알려져 있고 덜 일반적으로 G3PDH로 알려진 글리세르알데히드-3-인산 탈수소효소 (E.C. 1.2.1.12)는 대장균의 gapA 유전자에 의해 암호화된다. 상기 단백질은 보조인자 NAD를 사용하여 글리세르알데하이드 3-포스페이트 (glyceraldehyde 3-phosphate, G3P)의 1,3-비스포스포글리세레이트로 (1,3-bisphosphoglycerate, BPG)로의 산화적 인산화를 촉매한다. 첫 번째 반응 단계는 G3P와 시스테인 잔기 사이에 헤미아세탈 중간체의 형성을 포함하며, 이 헤미아세탈 중간체는 티오에스테르 (thioester)로 산화되며, NAD는 NADH로 환원된다. 환원된 NADH는 두번째 NAD와 교환되고, 티오에스테르는 친핵성 무기 인산염에 의해 공격을 받아 BPG를 생성한다. 대장균 GapA 단백질의 예시적인 아미노산 서열은 Uniprot 등록번호 POA9B2에서 찾을 수 있고, 예시적인 핵산 서열은 등록번호 X02662, NP_416293.1 및 NC_000913.3에서 찾을 수 있다. 클로스트리듐 아세토부틸리쿰 (Clostridium aceteobutylicum)의 동족 단백질은 gapC에 의해 암호화되며, 이의 예시적인 핵산 서열은 본 명세서에서 서열번호 15에 제시되어 있다.

특정 실시양태에서, GAPDH의 수준 또는 활성은 내인성 gapA 유전자의 발현을 감소 또는 제거하거나, 유전자를 결실시키거나 유전자의 발현을 감소시키기 위한 프로모터를 변경함으로써 감소된다.

바람직한 실시양태에서, 대장균의 gapA 유전자는 클로스트리듐 아세토부틸리쿰의 gapC 유전자로 대체된다.

본 명세서에서 사용된, 6-글루코포스포네이트 탈수소효소, 탈카르복실화로도 지칭되는 6-포스포글루코네이트 탈수소효소 (E.C. 1.1.1.44)는 NADP의 NADPH로의 환원과 함께 6-포스포글루코네이트의 리불로스 5-인산 및 CO₂로의 산화적 탈카르복실화를 촉매하는 효소이다. 대장균에서, 6-글루코포스포네이트 탈수소효소는 gnd 유전자에 의해 암호화된다. 대장균 6-글루코포스포네이트 탈수소효소의 예시적인 아미노산 서열은 UniProt 등록번호 P00350에서 찾을 수 있고, 핵산 서열은 등록번호 K02072, NP_416533.1 및 NC_000913.3에서 찾을 수 있다. 코리네박테리움 글루타미쿰의 동족 단백질은 gnd에 의해 암호화되며, 이의 예시적인 핵산 서열은 본 명세서의 서열번호 14에 제시되어 있다.

특정 실시양태에서, 6-글루코포스포네이트 탈수소효소의 수준 또는 활성은 내인성 gnd 유전자의 발현을 증가시킴으로써, 예를 들어 유전자의 발현 증가를 가능하게 하는 프로모터를 도입함으로써 증가된다. 특정 실시양태에서, 상기 미생물이 대장균인 경우, 대장균에서 gnd 유전자의 프로모터는 대장균의 gapA 프로모터로 대체된다. 예시적인 gapA 프로모터 (gapAp) 5'-3'은 서열번호 13에 제시되어 있다. 대안적인 실시양태에서, 상기 대장균 gnd 프로모터는 osmY 프로모터 (osmYp)로 대체된다. 예시적인 osmY 프로모터 (osmYp) 서열은 서열번호 12에 제시되어 있다.

특히 바람직한 실시양태에서, 상기 pgm, zwf, pgl, gnd, tktB 또는 tktA, 및 talA 또는 talB 중 하나 이상에 대한 내인성 프로모터는 osmY 프로모터, gapA 프로모터, nirB 프로모터 및 nar 프로모터로 이루어진 군으로부터 선택되는 프로모터로 대체된다.

바람직한 실시양태에서, 상기 미생물 (예컨대, 대장균)로부터의 gnd 유전자는 코리네박테리움 글루타미쿰의 gnd 유전자로 대체된다.

특히 바람직한 실시양태에서, 상기 pgm, zwf, pgl, gnd, tktB 또는 tktA, 및 talA 또는 talB 중 하나 이상에 대한 내인성 프로모터는 osmY 프로모터, gapA 프로모터, nirB 프로모터 및 nar 프로모터로 이루어진 군으로부터 선택되는 프로모터로 대체된다. 바람직하게는, 상기 osmY, gapA, nirB 및/또는 nar 프로모터는 유기체의 내인성 프로모터이다. 보다 바람직하게는, 상기 미생물이 대장균인 경우, osmY, gapA, nirB 및/또는 nar 프로모터는 대장균으로부터 유래된다.

수크로스 대사 유전자

대부분의 대장균 균주는 탄소 공급원으로서 수크로스를 이용할 수 없기 때문에, 본 발명의 미생물 및 방법은 또한 수크로스의 대사를 가능하게 하는 숙주 미생물의 변형을 포함한다. 특정 실시양태에서, 이것은 수크로스를 대사할 수 있는 대장균 균주에서 확인된 유전자 클러스터, cscRAKB를 발현하도록 미생물을 변형함으로써 달성될 수 있다.

따라서, 바람직한 실시양태에서, 본 발명의 방법은 숙주 미생물에 수크로스 가수분해효소 (cscA 유전자에 의해 암호화됨) 및 수크로스 투과효소 (cscB 유전자에 의해 암호화됨)를 암호화하는 핵산 서열의 발현을 가능하게 하는 재조합 폴리뉴클레오티드를 제공하는 단계를 추가로 포함한다. 추가 실시양태에서, 상기 방법은 또한 조절 단백질 CscR 및 CscK (각각 cscR 및 cscK 유전자에 의해 암호화됨)를 암호화하는 재조합 폴리뉴클레오티드를 미생물에 제공하는 것을 포함한다.

본 명세서에서 사용되는 수크로스 가수분해효소 (sucrose hydrolase)는 수크로스-6-인산 가수분해효소를 의미하며, cscA 유전자에 의해 암호화되는 수크로스 또는 인버타제 (E.C. 3.2.1.26)로도 지칭된다. 수크로스 가수분해효소의 예시적인 아미노산 서열은 UniProt 등록번호 P40714로 제공되며, 예시적인 뉴클레오티드 서열은 등록번호 X81461로 제공된다.

본 명세서에서 사용되는 수크로스 투과효소 (sucrose permease)는 cscB 유전자에 의해 암호화되는 단백질을 의미한다. 수크로스 투과효소는 수크로스 수송 단백질로도 알려져 있으며, 예시적인 아미노산 서열은 UniProt 등록번호 P3000에서 찾을 수 있다. 수크로스 투과효소를 암호화하는 예시적인 뉴클레오티드 서열은 등록번호 X63740 또는 X81461에서 찾을 수 있다.

또한, 대장균 미생물은 내인성 대장균 포스포글루코뮤타제 (pgm) 또는 자일로스 이소머라아제 (xylose isomerase, xylA)의 수준 또는 활성을 증가시키기도록 유전적으로 변형될 수 있다. 상기 유전적 변형은 내인성 유전자의 발현을 증가시키기 위한 것일 수 있고 (예를 들어, 프로모터 영역의 변형에 의해), 유전자를 암호화하는 외인성 핵산의 도입 및 발현에 의한 것일 수 있다.

다른 실시양태에서, 상기 미생물은 류코노스톡 메센테로이데스 (Leuconostoc mesenteroides)로부터 수크로스 포스포릴라아제를 발현하도록 변형된다.

핵산

"단리된" 핵산 분자는 핵산을 암호화하는 폴리펩타이드의 천연 공급원에서 일반적으로 결합되는 적어도 하나의 오염 핵산 분자와 식별되고 분리된 핵산 분자이다. 단리된 핵산 분자는 자연에서 발견되는 형태나 환경과는 다르다. 따라서 단리된 핵산 분자는 천연 세포에 존재하는 핵산 분자와 구별된다. 그러나, 단리된 핵산 분자는, 예를 들어 핵산 분자가 천연 세포와는 다른 염색체 위치에 있는, 일반적으로 핵산을 발현하는 세포에 함유된 핵산 분자를 포함한다.

본 명세서에서 "핵산 분자"와 "폴리뉴클레오티드"라는 용어는 상호 교환적으로 사용되며, 임의의 길이의 뉴클레오티드의 중합체 형태, 디옥시리보뉴클레오티드 또는 리보뉴클레오티드 또는 이들의 유사체를 의미한다. 폴리뉴클레오티드의 비제한적인 예로는 유전자, 유전자 단편, 메신저 RNA (mRNA), cDNA, 재조합 폴리뉴클레오티드, 플라스미드, 벡터, 임의의 서열의 단리된 DNA, 임의의 서열의 단리된 RNA, 핵산 프로브 및 프라이머가 있다. 선택된 폴리펩타이드를 암호화하는 핵산 서열은 적절한 조절 서열의 제어 하에 놓였을 때 생체 내에서 전사되고 (DNA의 경우) 폴리펩타이드로 번역되는 핵산 분자이다. 코딩 서열의 경계는 5' (아미노) 말단의 시작 코돈과 3' (카르복시) 말단의 번역 종결 코돈에 의해 결정된다. 전사 종결 서열은 코딩 서열의 3' 에 위치할 수 있다.

본 발명의 폴리뉴클레오티드는 Sambrook 외 (1989, Molecular Cloning―a laboratory manual; Cold Spring Harbor Press)에 예로서 기술된 바와 같이 당업계에 잘 알려진 방법에 따라 합성될 수 있다.

본 명세서에 사용된 "최적화된 코돈"은 숙주 미생물에서 유전자의 코돈 사용과 유사하도록 DNA 서열을 최적화하는 것을 의미한다. 바람직한 실시양태에서, 서열에서의 코돈 사용은 고도로 발현된 대장균 유전자의 코돈 사용과 유사하도록 최적화된다.

본 발명의 폴리뉴클레오티드 분자는 삽입된 서열에 작동 가능하게 연결된 제어 서열을 포함하여 폴리펩타이드의 발현을 가능하게 하는 발현 카세트의 형태로 제공될 수 있다. 이러한 발현 카세트는, 차례로, 전형적으로 벡터 (예를 들어, 플라스미드 또는 재조합 벡터) 내에 제공된다. 적합한 벡터는 충분한 양의 유전 정보를 전달할 수 있고, 본 발명의 폴리펩타이드의 발현을 허용하는 임의의 벡터일 수 있다.

따라서 본 발명은 이러한 폴리뉴클레오티드 서열을 포함하는 발현 벡터를 포함한다. 발현 벡터는 분자 생물학 분야에서 일상적으로 구성되며 원하는 폴리펩타이드의 발현을 허용하기 위해 필요한, 예를 들어 플라스미드 DNA 및 적절한 개시제, 프로모터, 인핸서 및 기타 요소들의 사용을 포함할 수 있다. 다른 적합한 벡터들은 당업자에게 자명할 것이다. 이와 관련하여 참고할 추가적인 예로서 Sambrook 외가 언급된다.

따라서, 본 발명의 폴리펩타이드는 이러한 벡터를 세포에 전달하고, 벡터로부터의 전사가 일어나도록 함으로써 제공될 수 있다. 당업자는 형질전환 기술 등을 포함하여 이러한 발현 벡터를 세포에 전달하기 위한 표준 기술에 익숙할 것이다.

상기 벡터는 플라스미드일 수 있다. 특정 실시양태에서, 상기 플라스미드는 높은 복제수 플라스미드 또는 낮은 복제수 플라스미드이다. 벡터는 당업계에 잘 알려져 있으며 클로닝 벡터, 발현 벡터 등을 포함할 수 있다. 클로닝 벡터는 숙주 세포에서 자율적으로 복제하거나 게놈에 통합될 수 있는 재조합 핵산 구조체이며, 벡터가 결정 가능한 방식으로 절단될 수 있고 새로운 재조합 벡터가 숙주 세포에서 복제하는 능력을 유지하도록 원하는 DNA 서열이 결합될 수 있는 하나 이상의 엔도뉴클레아제 제한 부위로 특징지어진다. 플라스미드의 경우, 플라스미드가 숙주 박테리아 내에서 복제수가 증가함에 따라 원하는 서열의 복제가 여러 번 또는 숙주가 유사분열로 번식하기 전에 숙주당 단 한 번만 발생할 수 있다. 파지의 경우, 복제는 용균성 단계에서 능동적으로 또는 용원성 단계에서 수동적으로 발생할 수 있다. 발현 벡터는 원하는 DNA 서열이 조절 서열과 작동 가능하게 결합되고 RNA 전사체로 발현될 수 있도록 제한 및 결찰에 의해 삽입될 수 있는 재조합 핵산 구조체이다. 벡터들은 벡터와 함께 형질전환되거나 형질주입되지 않은 세포의 식별에 사용하기에 적합한 하나 이상의 마커 서열을 추가로 포함할 수 있다. 예를 들어, 마커는 항생제 또는 다른 화합물에 대한 저항성 또는 감도를 증가 또는 감소시키는 단백질을 암호화하는 유전자, 당업계에 알려진 표준 분석 (예를 들어, β-갈락토시다아제, 루시페레이스 또는 알칼리성 인산가수분해효소)에 의해 활성이 검출 가능한 폴리펩타이드 또는 효소를 암호화하는 유전자, 가시적으로 형질전환 또는 형질주입된 세포, 숙주, 콜로니 또는 플라크 (예: 녹색 형광 단백질과 같은 형광 단백질)의 표현형에 영향을 미치는 유전자를 포함한다. 바람직한 벡터는 작동 가능하게 연결된 DNA 세그먼트에 존재하는 구조적 유전자 생성물의 자율적인 복제 및 발현이 가능한 벡터이다.

본 명세서에서 사용되는 코딩 서열 및 조절 서열은 조절 서열의 영향 또는 제어 하에 코딩서열의 발현 또는 전사를 두는 방식으로 공유 연결될 때, "작동 가능하게" 연결되거나 연결된 것으로 언급된다. 코딩 서열이 기능적 단백질로 번역되는 것이 바람직할 경우, 두 DNA 서열은 5' 조절 서열에서 프로모터의 유도로 코딩 서열의 전사를 초래하고, 두 DNA 서열 간의 연결 특성이 (1) 프레임 이동 돌연변이의 도입을 일으키지 않거나, (2) 코딩 서열의 전사를 지시하는 프로모터 영역의 능력을 방해하거나, 또는 (3) 해당 RNA 전사체가 단백질로 번역되는 능력을 방해한다. 따라서, 프로모터 영역은 생성된 전사체가 원하는 단백질 또는 폴리펩타이드로 번역될 수 있도록 해당 DNA 서열의 전사를 수행할 수 있는 경우에 프로모터 영역이 암호화 서열에 작동 가능하게 결합되거나 연결될 것이다.

유전자 발현에 필요한 조절 서열의 정확한 특성은 종 또는 세포 유형에 따라 다를 수 있지만, 필요에 따라 TATA 박스, 캡핑 시퀀스, CAAT 시퀀스 등과 같은 각각 전사 및 번역의 개시와 관련된 5' 비-전사 및 5' 비-번역 서열을 일반적으로 포함해야 한다. 특히, 이러한 5' 비-전사 조절 서열은 작동 가능하게 연결된 유전자의 전사 조절을 위한 프로모터 서열을 포함하는 프로모터 영역을 포함할 것이다.

조절 서열은 또한 원하는 대로 인핸서 서열 또는 업스트림 활성제 서열을 포함할 수 있다. 본 발명의 벡터는 선택적으로 5' 리더 또는 신호 서열을 포함할 수 있다. 적절한 벡터의 선택 및 설계는 당업자의 능력 및 재량에 속한다.

"프로모터"는 폴리펩타이드를 암호화하는 폴리뉴클레오티드의 전사를 개시하고 조절하는 뉴클레오티드 서열이다. 프로모터는 유도성 프로모터 (프로모터에 작동 가능하게 연결된 폴리뉴클레오티드 서열의 발현이 분석물, 보조 인자, 조절 단백질 등에 의해 유도되는 경우), 억제성 프로모터 (프로모터에 작동 가능하게 연결된 폴리뉴클레오티드 서열의 발현이 분석물, 보조 인자, 조절 단백질 등에 의해 억제되는 경우) 및 구성적 프로모터를 포함할 수 있다. "프로모터" 또는 "제어 요소"라는 용어는 전장 프로모터 영역 및 이들 영역의 기능적 (예를 들어, 전사 또는 번역을 제어하는) 단편을 포함하는 것으로 의도된다.

본 발명의 핵산은 바람직하게는 본 명세서에 기재된 바와 같이 수소 생산을 가능하게 하는 적합한 조건 하에 배양될 때 대상 효소가 세포에서 발현되도록 프로모터에 작동 가능하게 연결된다. 프로모터는 개별 박테리아 세포 종에 대해 특이적일 수 있다. 프로모터는 세포에서 관찰되는 전형적인 발현 수준 이상으로 유전자의 발현을 증가시키는 이종 프로모터일 수 있다. 프로모터는 유도성 프로모터일 수 있다.

본 발명에 따른 폴리뉴클레오티드, 발현 카세트 또는 벡터는 신호 펩타이드 서열을 추가로 포함할 수 있다. 신호 펩타이드 서열은 일반적으로 프로모터와의 작동 가능한 연결로 삽입되어 신호 펩타이드가 발현되고, 또한 프로모터와의 작동 가능한 연결에서 코딩 서열에 의해 암호화된 폴리펩타이드의 분비를 촉진한다. 어떤 실시양태에서든, 본 명세서에 설명된 예시적인 발현 카세트, 벡터 또는 서열이 신호 펩타이드 서열을 포함하지 않도록 추가로 변형될 수 있음이 추가로 이해될 수 있다.

임의의 적절한 발현 벡터 (예를 들어, Pouwels 외, Cloning Vectors: Laboratory Manual(Elsvier, N.Y.: 1985)에 기재된 바와 같음) 및 상응하는 적합한 숙주는 재조합 폴리펩타이드의 생산에 사용될 수 있다. 발현 숙주는 에스케리키아 (Escherichia), 바실러스 (Bacillus), 슈도모나스 (Pseudomonas), 살모넬라 (Salmonella), 숙주 세포계 등의 박테리아 종을 포함하지만 이에 제한되지 않는다. 당업자는 발현 숙주의 선택이 생성되는 폴리펩타이드의 유형에 영향을 미친다는 것을 알고 있다.

일부 실시양태에서, 세포는 관심 분자를 생산하거나 생산을 변경, 선택적으로 증가시키도록 조작되거나 선택된다 (예를 들어, 본 명세서에 설명된 바와 같이). 일부 실시양태에서, 세포는 하나 이상의 유전자 (예를 들어, 본 명세서에 설명된 바와 같이 하나 이상의 조절 또는 경쟁 대사 유전자)의 결실 또는 돌연변이를 포함한다. 다른 실시예에서, 결실되거나 돌연변이된 하나 이상의 유전자는 경쟁 경로에 있다. 돌연변이는 단일 또는 다중 점 돌연변이, 추가, 부분 내부 결실, N-말단 또는 C-말단 결실 (절단) 또는 완전한 결실일 수 있으며, 이 모든 것은 유전자(들)로 암호화된 아미노산 서열에 영향을 미칠 수 있다.

결실 또는 돌연변이는 당업계의 표준적인 방법을 사용하여 이루어질 수 있다. 돌연변이는 비-무작위, 부분 무작위 또는 무작위, 또는 이러한 돌연변이의 조합일 수 있다. 예를 들어, 부분적으로 무작위적인 돌연변이의 경우, 돌연변이는 돌연변이가 생성될 폴리펩타이드를 암호화하는 핵산 분자의 특정 부분에 국한될 수 있다.

미생물의 배양 및 변형

특히 바람직한 실시양태에서, 본 명세서에 기재된 바와 같은 미생물 또는 숙주 세포의 배양은 초기에 바이오매스를 생성하기 위해 호기성 조건 하에서 수행된 후, HPGC의 발현동안 혐기생활 (anaerobiosis)을 유도하기 위해 혐기성 조건으로 전달된다. 당업자는 중성 가스 (예컨, N₂) 또는 환원제의 첨가를 포함하여 혐기생활 생성 기술에 익숙할 것이다. 그러나, 혐기생활은 산화성 탄소 공급원의 존재 하에서 밀폐된 용기 내에서 단순히 미생물을 배양하는 것만으로 달성될 수 있음이 이해될 것이다.

또한, 미생물 또는 숙주세포의 배양은 바람직하게는 배양 배지에 제2철 (철 III) 또는 제1철 (철 II) 염을 포함하여 수행된다. 바람직하게는, 제2철 (철 III) 또는 제1철 (철 II) 염은 배지에 적어도 약 5 μM, 적어도 약 10 μM, 적어도 약 20 μM 또는 적어도 약 30 μM 또는 그 이상의 최종 농도로 제공된다. 바람직하게는, 배양 배지에 제공된 제2철 (철 III) 또는 제1철 (철 II) 염의 최종 농도는 약 20 μM 이상이다.

당업자는 재조합 단백질의 생산을 위한 재조합 숙주 세포의 배양이 유기체에서 단백질의 성장 및 발현에 최적인 온도에서 수행될 것임을 이해할 것이다. 예를 들어, 대장균 및 관련 박테리아 유기체의 성장을 위한 최적 온도는 약 37 ℃이고, 재조합 단백질을 생산하기 위한 효모의 성장 온도는 약 30-32 ℃이다. 그러나, 본 발명자들은 배양 온도가 감소하면 대장균과 같은 박테리아 발현 시스템을 사용할 때 기능적인 수소화효소의 발현이 더욱 향상될 수 있음을 발견하였다. 따라서, 미생물 또는 숙주세포가 대장균인 바람직한 실시양태에서, 배양 온도는 약 30 ℃ 이하이다. 상기 온도는 약 10 ℃ 내지 약 30 ℃일 수 있고, 바람직하게는 적어도 약 15 ℃일 수 있다. 특정 실시양태에서, 온도는 약 20 ℃ 내지 약 30 ℃이다. 특히 바람직한 실시양태에서, 온도는 약 20 ℃ (예를 들어, 18 ℃, 19 ℃, 20 ℃, 21 ℃, 22 ℃)이다.

"유전적으로 조작된" 또는 "유전적으로 변형된"은 임의의 재조합 DNA 또는 RNA 기술에 의해 변형된 모든 세포를 의미한다. 즉, 세포는 재조합된 폴리뉴클레오티드 분자와 함께 형질주입, 형질전환 또는 형질도입되어 세포가 원하는 단백질의 발현을 일으키도록 변형된다. 숙주 세포를 유전적으로 조작하기 위한 방법 및 벡터는 당업계에 잘 알려져 있으며, 예를 들어 다양한 기술들이 Current Protocols in Molecular Biology, Ausubel et al., eds. (Wiley & Sons, New York, 1988, and quarterly updates)에 설명되어 있다. 유전자 공학 기술에는 발현 벡터, 표적 상동 재조합 및 유전자 활성화 (예를 들어, 미국 특허번호 제5,272,071호 참조) 및 조작된 전사 인자에 의한 트랜스-활성화 (예를 들어, Segal et al., 1999, Proc Natl Acad Sci USA 96(6):2758-63 참조)를 포함하지만 이에 제한되지 않는다.

특정 실시양태에서, 본 명세서에 기재된 유전자 변형은 유전자 발현 또는 기능의 증가를 초래하고, 유전자의 증폭, 과잉 생산, 과발현, 활성화, 향상, 첨가 또는 상향 조절로 지칭될 수 있다. 보다 구체적으로, 본 명세서에서 논의된 효소 또는 다른 단백질의 작용 (또는 활성) 증가에 대한 언급은 일반적으로 효소 또는 단백질의 발현 및/또는 기능성 (생물학적 활성)을 증가시키고, 효소의 더 높은 활성 (예를 들어, 특정 활성 또는 생체 내 효소 활성), 효소의 억제 또는 분해 감소, 및 효소의 과발현을 포함한다. 예를 들어, 유전자 복제수를 증가시키거나, 발현 수준을 증가시키거나, 유전공학이나 고전적인 돌연변이 유발에 의해 유전자를 변형시켜 효소의 생물학적 활성을 증가시킬 수 있다. 이러한 변형 중 일부의 조합도 가능하다.

본 명세서에서 사용된 용어 "외인성 폴리뉴클레오티드"는 주어진 유기체에서 자연적으로 생성되는 폴리뉴클레오티드로부터 유래되지 않은 폴리뉴클레오티드를 의미하기 위한 것이다. 외인성 폴리뉴클레오티드는 다른 유기체에 존재하는 폴리뉴클레오티드로부터 유래될 수 있다. 본 발명에 따르면, 대장균 세포는 세포가 수소를 생성할 수 있도록 하는 하나 이상의 효소를 암호화하는 하나 이상의 외인성 폴리뉴클레오티드를 포함하는 핵산 구조체로 유전적으로 변형될 수 있다.

외인성 폴리뉴클레오티드는 이종 (heterologous) 또는 상동 (homologous)일 수 있다. "이종"이라는 용어는 언급된 종 이외의 근원에서 유래된 분자 또는 활성을 의미하며, "상동"은 숙주 미생물 유기체로부터 유래된 분자 또는 활성을 의미한다. 따라서, 본 발명의 핵산 분자의 외인성 발현은 이종 또는 상동의 핵산 분자 중 하나 또는 모두를 사용함으로써 이루어질 수 있다.

외인성 폴리뉴클레오티드는 하나 이상의 발현 구조체 (플라스미드 벡터)로 제공될 수 있다.

미생물을 형질전환시키는 방법은 당업계에 잘 알려져 있으며, 전기천공법, 염화칼슘- 또는 리튬 아세테이트- 기반 방법 등의 비제한적인 예를 포함할 수 있다.

당업자는 관련 구조체의 성공적인 형질전환을 확인하는 방법뿐만 아니라, 형질전환체가 암호화된 단백질에 의해 제공되는 관련 효소 활성을 가지고 있는지 여부를 결정하는 방법에 익숙할 것이다. 예를 들어, 포스포프룩토키나아제 활성 (따라서 암호화된 단백질의 올바른 단백질 접힘을 추론)은 시판되는 효소 분석 키트를 사용하여 추론할 수 있다.

유사하게, 당업자는 관련 단백질의 활성 수준 또는 관련 유전자의 발현 수준의 억제 또는 결실을 확인하기 위한 표준 기술에 익숙할 것이다. 성공적인 유전자 변형, 삭제 또는 대체는 표준 시퀀싱 기술을 사용하여 확인할 수 있다. 세포를 억제제와 접촉시킨 후 단백질 활성의 성공적인 억제는 예를 들어 시판되는 효소 분석 키트를 사용하여 관련 단백질의 활성을 평가함으로써 평가할 수 있다.

또한, 당업자는 재조합 미생물에서 폴리뉴클레오티드의 발현을 유도하는데 필요한 일반적인 배양 기술에 익숙할 것이며, 이에 따라 필요한 경우 HPGC의 단백질 생산을 유도하여 수소를 생산할 수 있을 것이다. 일부 실시예에서, 재조합 미생물의 액체 배양물은 글루코스가 보충된 혐기성 조건 하에 성장된다.

성공적인 형질전환은 또한 세포 내로 형질전환될 벡터의 플라스미드에 선택 마커 유전자를 포함시킴으로써 결정될 수 있다. 본 명세서에 사용된 용어 "선택 마커 유전자"는 선택적 배양 배지에서 성장한 숙주 세포의 생존 및/또는 성장에 필요한 단백질을 암호화하는 유전 물질을 의미한다. 대장균을 포함한 미생물에 사용할 전형적인 선택 마커 유전자는 당업자에게 잘 알려져 있다.

수소 생성의 측정은 실시예에 설명된 것을 포함하는 임의의 적합한 방법에 의해 수행될 수 있다. 한 가지 간단한 예로서, 수소 생성은 배양에서 기포의 생성을 관찰함으로써 간단히 측정할 수 있다. 다른 예에서, 수소 생성의 생산 및 정량화는 가스 기포를 샘플링하고 열전도율 또는 질량분석법에 의한 검출과 함께 가스 크로마토그래피에 의한 가스 조성을 분석함으로써 이루어진다. 다른 예에서는, 당업자에게 알려진 클락형 (Clark-type) 전극, 또는 수소 생성을 검출하기 위한 임의의 다른 적절한 방법이 사용될 수 있다.

본 발명의 임의의 실시양태에서, 상기 미생물, 바람직하게는 대장균 미생물은 수소 생산을 유도하기 전에 일정 기간 동안 저장될 수 있다. 예를 들어, 특정 실시양태에서, 본 발명의 미생물 또는 본 명세서에 기재된 방법은 수소를 생성할 수 있는 재조합 미생물을 생성하기 위해 필요한 폴리뉴클레오티드로 미생물의 형질전환을 수반할 수 있다. 그 다음, 미생물은 수소 생산에 필요할 때까지 미생물의 저장에 적합한 조건 (예를 들어, 4 ℃, -20 ℃ 또는 -80 ℃의 적절한 완충액에서) 하에 수확되고 저장될 수 있다. 또한 미생물은 추가 사용을 위해 필요할 때까지 동결건조될 수 있음이 이해될 것이다. 또한, 미생물은 HPGC의 발현을 가능하게 하는 조건 하에 성장한 다음 수확하고, 필요한 경우 저장한 다음, 박테리아의 수소 생산을 개시하기 위해 글루코스가 보충된 적절한 용액에 재현탁될 수 있음을 이해할 것이다.

일부 실시예에서, 생산되고 HPGC를 발현한 배양된 박테리아는 수소를 생산하기 위해 등삼투 (isoosmotic) 조건 하에 글루코스를 수확하고 공급한다.

특정 실시양태에서, 박테리아는 표준 기술을 사용하여 예를 들어 칼슘알지네이트 비드에 캡슐화되고, 수소를 생산하기 위해 등삼투성 배지에서 글루코스를 공급받는다. 당업자는 Inotech Encapsulator IE-50R (Encap Bio Systems Inc) 또는 Encapsulator B-390/B-395 pro (Buchi)와 같은 장치 또는 관련 시스템을 사용하여 바이오-캡슐화를 위한 표준 매뉴얼 및 메커니즘 기술 및 장비에 익숙할 것이다. 다른 방법은 예를 들어, Heidebach, et al., (2012) Critical Reviews in Food Science and Nutrition, 52: 291-311; Mart

n et al., (2015) Innovative Food Science & Emerging Technologies 27:15-25에서 설명되며, 전체 내용이 본 명세서에 참조로 포함된다.

다른 실시예에서, 재조합 미생물은 본 발명에 따라 수소를 생산할 수 있기 위해 생존가능 (즉, 재생산, "성장" 또는 세포 수 증가 가능)할 필요가 없다. 예를 들어, 임의의 실시양태에서, 상기 방법은 본 명세서에 기재된 바와 같은 재조합 미생물을 제공하거나 생성하고, 수소를 생성하는데 필요한 단백질 (예를 들어, HPGC에 의해 암호화되는 단백질)의 발현을 유도하기에 충분한 시간 및 조건 하에서 미생물을 배양하고 그 다음 미생물을 불활성화시키는 것을 포함한다. 바람직하게는, 불활성화된 미생물은 온전하게 남아있지만, 이것이 필수적인 요건은 아님을 이해할 것이다.

이어서, 본 발명의 불활성화된 재조합 미생물을 이용하여, 예를 들어 본 명세서에 기재된 바와 같이 수소를 생성할 수 있다.

당업자는 세포가 온전한 상태로 유지되지만 여전히 수소를 생산하는데 사용될 수 있도록 (즉, 세포에 의해 발현된 HPGC 및 다른 단백질부터) 미생물을 비활성화하는 방법에 익숙할 것이다. 불활성화는 감마선 조사 또는 항생제 (미토마이신 또는 이와 유사한 것과 같은) 처리에 의해 수행될 수 있다.

임의의 실시양태에서, 미생물의 적어도 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% 또는 100%가 불활성화된다.

시스템 및 장치

본 발명은 또한 본 발명의 미생물을 포함하는 시스템 및 장치, 또는 수소를 생산하기 위한 본 명세서에 기재된 방법을 포함하는 반응기 시스템을 제공한다.

바람직한 실시양태에서, 본 발명은 미생물에 의해 생성된 수소 가스를 포집하기 위한 수소 가스 포집 시스템을 추가로 포함한다. 수소 가스 포집 시스템은 생성된 수소 가스를 포집하여 선택적으로 저장하여 사용할 수 있도록 반응기 시스템에 포함될 수 있다. 대안적으로, 생성된 수소 가스는 예를 들어, 수소 연료 동력 장치와 같은 사용 지점으로 유도될 수 있다.

일부 실시양태에서, 수소 가스 포집 유닛은 반응기 시스템에서 생성된 수소 가스의 흐름을 저장 용기로 또는 직접 사용 지점으로 유도하기 위한 하나 이상의 수소 가스 도관을 포함한다. 다른 실시양태에서, 수소 가스 도관은 선택적으로 스윕 가스의 소스에 연결되며, 여기서 수소 가스는 스윕 가스를 사용하여 수집된다. 예시적인 스윕 가스는 질소이다. 예를 들어, 수소 가스가 초기에 생산됨에 따라, 스윕 가스가 수소 가스 도관에 도입되어 저장 용기 또는 수소 가스 사용 지점 방향으로 흐를 수 있다. 추가 실시양태에서, 수소 포집 시스템은 반응기 시스템으로부터 수소를 포집하기 위한 용기를 포함할 수 있다. 또 다른 실시양태에서, 포집 시스템은 수소의 통과를 위한 도관을 더 포함할 수 있다. 도관 및/또는 용기는 반응 챔버로부터 수소 가스의 유출을 위해 제공된 채널과 가스 흐름 연통될 수 있다.

연료전지는 연료의 에너지를 직접 전기화학 및 열에너지로 변환하는 전기 화학 장치이다. 일반적으로, 연료전지는 전해질을 통해 전기적으로 연결된 산화전극과 환원전극으로 구성된다. 예를 들어, 수소와 같은 연료는 산화전극에 공급되어 전기촉매의 도움으로 산화된다. 환원전극에서는 산소 (또는 공기)와 같은 산화제의 환원이 발생한다. 전극에서 발생하는 전기화학적 반응은 전류를 생성하고 그에 따라 전기 에너지를 생성한다. 일반적으로 추가 전기를 제공하거나 다른 목적으로 사용할 수 있는 열에너지도 생성된다. 현재 연료전지에 사용되는 가장 일반적인 전기화학적 반응은 수소와 산소가 반응하여 물을 생성하는 반응이다. 분자 수소 자체는 산화되는 산화전극에 공급될 수 있으며, 생성된 전자는 외부 회로를 통해 산화제가 환원되는 환원전극으로 전달된다. 중간 전해질을 통과하는 이온 흐름은 전하 중성을 유지한다.

본 발명의 연료전지는 수소의 공급원이 본 발명의 재조합 미생물로부터 유래하는 연료로서 수소를 이용한다.

일반적으로, 수소는 연료원 내에 적어도 약 2% 부피, 바람직하게는 적어도 약 5%, 더욱 바람직하게는 적어도 약 10% 부피, 예를 들어 약 25%, 50%, 75% 또는 90%의 부피로 존재한다. 연료 가스의 일부를 형성하기 위해 불활성 가스를 사용하는 경우, 일반적으로 적어도 약 10%, 예컨대 적어도 약 25%, 50% 또는 75%, 가장 바람직하게는 적어도 약 80% 이상의 부피로 존재한다.

일반적으로, 연료 공급원은 기체 또는 액체 형태로 연료 공급원의 선택적으로 가압된 용기로부터 공급된다. 연료 공급원은 선택적으로 밸브를 포함할 수 있는 입구를 통해 전극에 공급된다. 사용된 연료 또는 폐연료원이 연료전지를 나갈 수 있는 배출구도 제공된다.

산화제는 일반적으로 산소를 포함하지만, 다른 적절한 산화제가 사용될 수 있다. 상기 산화제 공급원은 통상적으로 상기 산화제를 포함하는 기체 형태로 환원전극에 산화제를 공급하며, 일부 실시양태에서는 상기 산화제가 액체 형태로 제공될 수 있다. 일반적으로, 산화제 공급원은 불활성 기체를 포함하지만, 순수한 형태의 산화제가 사용될 수도 있다. 예를 들어, 질소, 헬륨, 네온 또는 아르곤과 같은 하나 이상의 기체를 산소와 혼합하여 사용할 수 있다. 산화제 공급원은 선택적으로 추가 성분, 예를 들어 대체 산화제 또는 기타 첨가제를 포함할 수 있다. 적절한 산화제 공급원의 예는 공기이다.

일반적으로, 산소는 산화제 공급원 내에 적어도 약 2% 부피, 바람직하게는 적어도 약 5%, 더욱 바람직하게는 적어도 약 10%의 부피로 존재한다.

일반적으로, 산화제 공급원은 기체 또는 액체 형태의 산화제 공급원의 선택적으로 가압된 용기로부터 공급된다. 산화제 공급원은 선택적으로 밸브를 포함하는 입구를 통해 전극에 공급된다. 사용되거나 폐기된 산화제 공급원이 연료전지를 나갈 수 있는 배출구도 제공된다.

산화전극은 임의의 도전재로 이루어질 수 있으며, 예를 들어 스테인리스강, 황동 또는 탄소, 흑연일 수 있다. 산화전극의 표면은, 적어도 부분적으로, 촉매의 흡착을 용이하게 하는 다른 물질로 코팅될 수 있다. 촉매가 흡착되는 표면은 수소화효소의 변성을 유발하지 않는 재질로 되어있다. 적합한 표면 재료의 예로는 연마된 흑연 표면 또는 탄소 천 또는 탄소 스펀지와 같은 높은 표면적을 가진 재료를 들 수 있다. 표면이 거칠거나 표면적이 높은 소재가 일반적으로 선호된다.

환원전극은 산화제가 그 표면에서 환원될 수 있도록 하는 임의의 적합한 도전재로 이루어질 수 있다. 예를 들어, 기존의 연료 전지에서 환원전극을 형성하기 위해 사용되는 물질들이 사용될 수 있다. 원하는 경우, 전기촉매는 환원전극에 존재할 수 있다. 이러한 전기촉매는, 예를 들어 양극 자체에 코팅 또는 흡착될 수 있고, 환원전극을 둘러싸는 용액에 존재할 수 있다. 적합한 전기촉매는 백금과 같은 기존의 연료 전지에 사용되는 것을 포함한다. 생물학적 촉매는 이러한 목적, 특히 본 명세서에 기재된 효소 및 보조 단백질의 조합을 위해 사용될 수 있다.

본 발명의 연료전지는 통상 적어도 약 25 ℃, 보다 바람직하게는 적어도 약 3O ℃의 온도에서 작동된다. 연료전지는 약 35 ℃ 내지 약 65 ℃의 온도, 예컨대 약 40 ℃ 내지 약 50 ℃의 온도에서 작동되는 것이 바람직하다. 온도가 높을수록 반응 속도가 증가하고 산화 전류가 높아진다.

연료전지는 전술한 바와 같이, 전기 회로에서 전류를 발생시키기 위해, 전술한 조건 하에서 작동될 수 있다. 연료전지는 산화전극에 수소를 공급하고 환원전극에 산화제를 공급함으로써 작동된다. 본 발명의 연료전지는 양극의 표면적 cm² 당 적어도 약 0.5 mA 이상, 전형적으로 적어도 0.8 mA, 1 mA 또는 1.5 mA의 전류밀도를 생성할 수 있다. 예를 들어, 본 발명의 연료전지는 양극의 표면적 cm² 당 적어도 약 3 mA와 같이 적어도 약 2mA의 전류를 생성할 수 있다.

실시예

실시예 1

재료 및 방법

박테리아 균주 및 플라스미드

야생형 (DH5α) 에쉬리키아 콜라이 (Escherichia coli) NEB 5-알파 (CP017100.1, (Anton and Raleigh, 2016))는 DH5α의 즉각적인 fhuA2 유도체이자 K-12의 유도체로서, 뉴 잉글랜드 바이오랩 (New England Biolabs)에서 구입하여 Lubia-Bertani (LB)와 1.5% 한천이 함유된 플레이트에 유지하였다. 필요에 따라 항생제 클로로암페니콜 (chloramphenicol, Cam) 30 mg L^-1과 황산 카나마이신 (kanamycin sulfate, Kan) 50 mg L^-1이 포함되었다. DH5α의 돌연변이 균주는 CRISPR/Cas9 방법을 사용하여 구성되었다 (Reisch and Prather, 2015). 플라스미드 pHPGC (Cam^R)는 표준 바이오브릭 (Biobrick) 조립 방법, 제한 분해 및 결찰법을 사용하여 구성되었다. 생성된 플라스미드는 표준 절차에 의해 WT 및 돌연변이 균주로 형질변환되었다. 수소 생산에 사용되는 균주 및 플라스미드는 표 2에 나열되어있다. HPGC의 다양한 구성 요소 및 이종 프로모터의 서열 및 유전자 서열이 표 1에 나와 있다. 수소 생산에 사용된 야생형 및 돌연변이 균주의 게놈 서열을 나노포어 (Nanopore) 시퀀싱 기술을 사용하여 확인하였다.

발효

Cam을 포함하는 100 mL의 SOC (Super Optimal broth with Catabolite repression, SOC) 배지의 사전 배양물에 대장균 DH5α, DH5α-HPGC, ΔpfkA-HPGC 또는 ΔgpmA-HPGC (서열번호 10 및 30-40에 명시된 HPGC 구조체 사용)의 단일 콜로니를 접종하였다. 사전 배양물을 37 ℃에서 약 OD₆₀₀ 2 (1.6x10⁹ 세포)까지 밤새 배양하고, 멸균 여과된 (0.2 μm) 20 mM D-글루코스, 1 mM 산화철 및 Cam (30 mg L^-1)을 첨가하여 2 L의 SOC 배지 (pH 7)에 접종하였다.

발효기 (Eppendorf, BioFlow 120 및 BioFlo^®/CelliGen^® 115 발효기/생물반응기)의 도움으로 1 M 수산화나트륨을 적정하여 37 ℃로 온도를 제어하고, pH를 7로 유지한 상태에서 100 rpm의 교반 속도로 세포는 OD₆₀₀ 0.6 (4.8x10⁸ 세포)로 혐기적으로 성장하였다. 세포 성장이 OD₆₀₀ 0.6 (4.8x10⁸ 세포)에 도달했을 때, 배양 온도는 유도 전에 18 ℃로 감소하였다. 세포는 멸균 여과된 이소프로필-b-D-티오갈락토피라노사이드 (IPTG, 1 mM) 및 1 mM 황산철로 유도되었다. 유도 중 발효 파라미터는 위와 같았으며, 세포는 밤새 대략 OD₆₀₀ 2 (1.6x10⁹ 세포)로 성장하였다. 이어서, 18 ℃에서 15분동안 4650 rcf의 원심 분리에 의해 세포를 수확하였다. 세포 펠렛을 1 mM 소듐 디티오나이트를 함유하는 1x PBS pH 7.4 (10 mM) 또는 1x PBS (약 50 mM) pH 8.0에서 3회 세척하여 4 ℃에서 보관하였다.

바이오수소 반응기

발효를 통해 얻은 DH5α, DH5α-HGPC, ΔpfkA-HGPC 또는 ΔgpmA-HGPC의 세포 펠렛을 20 OD₆₀₀에 있는 1 x PBS (10 mM) pH 7.4 또는 1x PBS (약 50 mM) pH 8.0 에서 선택적으로 1 mM 디티오나이트와 함께 재현탁하고 (최종 부피 50 mL), 수소 생산을 테스트 및 측정하기 위해 100 mL 측면-원뿔형 플라스크에 넣었다. 플라스크는 현탁된 세포 내로 돌출된 pH 프로브가 있는 고무 마개로 밀봉되었다. 플라스크의 측면은 기체 부피를 측정하도록 설계된 맞춤 장치에 연결되었다. 테플론 코팅 마그네틱 바를 원뿔형 플라스크 내부에 배치하고 플라스크를 마그네틱 교반기 플레이트 위에 배치하였다. D-글루코스 (최종 농도 20 mM)를 첨가하여 박테리아 수소 형성을 개시하기 전에 원뿔형 플라스크의 헤드 스페이스를 100% 질소 가스 3 부피로 퍼징하였다. 실험은 약 22 ℃의 상온에서 수행되었다.

수소, 이산화탄소 및 pH측정

헤드스페이스 가스 샘플 (5 μL)과 pH 측정은 각각 시작 시 (D-글루코스 첨가 직후)와 가스 생산이 거의 중단될 때까지 약 15-20분마다 생체수소 반응기에서 채취 및 기록되었다. 가스 샘플은 시마즈 넥시스 (Shimadzu Nexis), GC-2030 컬럼 (Restek, ShinCarbon ST Micropacked GC Column, Cat. # 19808)과 하기의 GC 방법을 이용하여 분석되었다: SPL1 온도 100 ℃, 컬럼 유량 6 mL.min-1, DTCD 온도 180℃, 오븐 온도 40 ℃를 3분 동안 유지한 다음 15 ℃.min-1에서 170 ℃로 유지하고 170 ℃에서 2분 동안 유지. 캐리어 가스는 아르곤이었다. 컬럼 사양, 신카본 ST, 100/120 메쉬, 2 m, 1/16인치 OD, 1.0 mm).

가스 표준 (20% 수소, 20% 질소, 20% 일산화탄소 및 20% 이산화탄소 [제품번호: PGS402470D]; 아르곤 밸런스 가스와 10% 수소, 10% 질소, 10% 일산화탄소 및 10% 이산화탄소 [제품번호: PGS402469D]; 및 아르곤 밸런스 가스와 50% 산소 [제품번호: PGS402471D2])를 사용하여 수소와 이산화탄소의 % 농도를 측정하였다. 실험 중 원뿔형 측면 플라스크로의 공기 누출을 모니터링하기 위해 산소와 질소 가스도 측정되었다. 가스 표준은 BOC Australia에서 제공했다.

NMR 분석

각 시료에 대하여 세포배양 700 μL를 20,018 rcf에서 2분간 원심분리하여 펠렛화하였다. 상등액을 15 mL 팔콘 튜브 (600 μL)에 수집한 후 -80 ℃에서 냉동하였다. 그런 다음 샘플을 동결 건조하고 산화중수소 (800 μL)에 다시 재현탁하였다. 재현탁액을 NMR 튜브 (Norell Sample Vault Series, 표준 벽면, 폐쇄 캡, 파라미터 700 MHz 주파수, 직경 x L 5 mm x 178 mm, mfr no. Norell, SVCP-5-178-96PK)에 넣었다. 모든 NMR 스펙트럼은 5mm BBFO 스마트프로브가 장착된 Bruker AVIIIHD 400 MHz NMR 분광계에서 298K로 기록되었다. 스펙트럼은 Topspin 3.5. 1H 스펙트럼을 사용하여 64K 데이터 포인트에서 8013 Hz (20.0 ppm)의 스펙트럼 폭으로 처리하고 분석하였다.

결과

대장균의 DH5α-HPGC, ΔpkA-HPGC, ΔgpmA-HPGC 또는 DH5α-H1-HEGF (petF 및 FNR이 없는 HPGC) 균주는 글루코스를 첨가한 후 2시간 이내에 상당한 양의 가스를 생성하였다. 수소 생산의 중단은 글루코스의 완전한 소비와 관련이 있다. ΔgpmA-HGPC (예를 들어, 서열번호 10)는 글루코스 1몰 당 수소 0.95몰을 생성했고, ΔpfkA-HGPC는 글루코스 1몰 당 수소 0.85몰을 생성했으며, DH5α-H1-HEFG는 글루코스 1몰 당 수소 0.45몰을 생성하였다.

수소 가스의 최대 생산 속도는 22 ℃에서 균주를 포함하는 HPGC의 경우와 유사하며 시간당 200 OD₆₀₀에서 L 세포당 3.6 +/- 0.06 L의 수소 가스이다. DH5α 및 DH5α-H1-HEFG에 대한 이러한 조건에서 검출 가능한 수소가 없는 HPGC가 없는 균주의 경우 속도가 더 낮았고 시간당 200 OD600에서 L 세포당 ~ 1.2 L의 수소 가스를 제공했으며 이는 petF-FNR이 부족했다.

충분히 완충되지 않아 pH가 5 미만으로 떨어지면 수소 생산이 중단된다. pH의 감소는 유기산 락테이트, 숙시네이트, 피루베이트 및 아세테이트의 생성에 기인하며, ΔpfkA 및 ΔgpmA 돌연변이는 유기산의 생성을 감소시켰다 (도 2).

실시예 2: 당분해 경로의 하부를 표적으로 한 수소 생산 속도

당분해 경로의 하부를 통해 글루코스로부터 탄소의 흐름을 감소시킨다는 증거가 도 4에 나타나있다. gpmM 또는 gpmA 유전자의 삭제는 수소 생산 속도를 향상시킨다.

gnd 및 zwf의 발현 증가는 또한 도 4와 같이 예상외로 수소 생산 속도를 향상시켰다.

도 5는 또한 5탄당 인산 경로 (Pentose Phosphate pathway, PPP)를 통해 글루코스로부터 탄소의 흐름 (flux)을 증가시키면 H₂ 대 CO₂의 비율이 증가한다는 증거를 제공한다. 글루코스의 모든 탄소가 5탄당 인산 경로를 통해 CO₂로 대사되고 생성된 환원제가 H₂를 만드는 데 사용될 경우, 혐기성 조건에서 이론상 최대 비율은 2:1이다. 글루코스가 당분해 과정을 거치면 혐기성 조건에서 비율은 1:1이다. PPP를 통한 흐름의 증가는 글루코스로 만들어진 H₂의 전반적인 수율을 향상시킬 것이다.

PPP를 통한 대사의 증가는 zwf 및/또는 gnd의 활성 및/또는 발현을 증가시킴으로써 달성될 수 있다. 대안적으로 이는 또한 pfk의 활성 (Δpfk의 경우)을 감소시켜 6개의 탄소를 가진 중간체가 있는 당분해 구간에서 3개의 탄소를 가진 중간체가 있는 당분해 구간로의 흐름을 감소시킴으로써 달성될 수 있다. 도 5에 표시된 데이터는 zwf의 발현 증가 또는 pfk 활성 감소가 수소 대 CO₂의 비율을 증가시켜 5탄당 인산 경로를 통한 흐름을 증가시킨다는 것을 보여준다. gnd는 zwf에 의해 암호화되는 효소에 비해 대사 경로에서 하류에 있는 효소를 암호화하므로, 이 돌연변이에서 gnd의 활성 증가는 wt DH5α에 비해 H₂ 대 CO₂ 비율에는 큰 영향을 미치지 않는다.

본 명세서에 개시되고 정의된 본 발명은 본문 또는 도면에서 언급되거나 명백한 개별 특징들 중 둘 이상의 모든 대안적 조합으로 확장된다는 것이 이해될 것이다. 이러한 상이한 조합들 모두 본 발명의 다양한 대안적 측면을 구성한다.

SEQUENCE LISTING <110> Macquarie University <120> Recombinant microorganisms and process <130> 53115999SCH <150> 2020900990 <151> 2020-03-31 <160> 40 <170> PatentIn version 3.5 <210> 1 <211> 46 <212> DNA <213> Chlamydomonas reinhardtii <400> 1 ctagagggct ttacacttta tgcttccggc tcgtatgttg tgtgga 46 <210> 2 <211> 3478 <212> DNA <213> Chlamydomonas reinhardtii <400> 2 aagaaggaga tatacatatg gctcatagtt taagcgcaca ttcccgtcag gccggagatc 60 gcaaactggg cgcaggtgcg gcatctagcc gcccatcatg tccttctcgc cgcattgtcc 120 gcgtggcggc ccatgcttct gcgtccaagg cgactcccga tgtacctgtt gacgatcttc 180 ctcctgcgca tgcccgtgca gcagtagcgg ccgctaaccg tcgtgcgcgc gctatggcat 240 cagcggaggc cgcggcagag accctgggcg atttcctggg cttagggaag ggggggcttt 300 cgccgggcgc aaccgccaac cttgatcgtg agcaagtatt aggtgtgttg gaggcggtct 360 ggcgtcgtgg agaccttaat ctggagcgtg cgttgtacag ccatgccaat gcggtgacta 420 acaaatactg tggtgggggg gtctactatc gcggccttgt ggagttcagt aatatttgcc 480 aaaacgattg ctcatattgt gggattcgca acaatcaaaa agaagtttgg cgctatacta 540 tgccggttga agaggtggtc gaggtagcta agtgggcgct tgaaaacggc attcgcaaca 600 ttatgttgca agggggtgaa ttaaagacag agcaacgctt agcctacttg gaggcatgcg 660 tccgtgcgat tcgcgaggag acaacgcagt tagaccttga aatgcgcgca cgtgccgcga 720 gtacgacaac agcggaagcg gcagccagtg cacaggcaga cgccgaagct aaacgcggcg 780 agccagaatt gggtgtggtc gtatccttaa gcgtcggaga acttcctatg gaacagtatg 840 agcgtttgtt ccgcgccggc gcccgtcgct atctgatccg cattgaaacc tcgaatcccg 900 acctgtacgc ggcacttcac ccggagccga tgtcctggca cgcgcgtgta gaatgcctgc 960 gcaacctgaa gaaagctggg tatatgttgg gcacaggagt gatggtcggc ttgccgggac 1020 aaaccttaca cgacctggct ggggatgtca tgttctttcg cgacattaaa gcggacatga 1080 tcggtatggg ccccttcatt acgcagcctg ggacgcctgc aactgataag tggaccgcgc 1140 tgtatccgaa cgccaataag aacagccaca tgaaatctat gttcgatctg accactgcta 1200 tgaatgcact tgtacgtatt acgatgggga acgtaaatat cagtgctacg actgcattac 1260 aagcgattat ccccactgga cgtgaaattg cgcttgagcg cggcgcaaat gttgtcatgc 1320 ctattttaac gcctactcag tatcgcgagt cctatcagtt atatgagggt aagccctgca 1380 ttacggatac tgctgttcag tgtcgtcgtt gcctggacat gcgtttgcac tccgttggca 1440 aaacgtctgc ggccggagtt tggggcgatc ctgcttcgtt cttgcatccc atcgttggcg 1500 tcccagtccc gcacgacttg tcatcacctg ctttggccgc tgctgcaagt gcggattttc 1560 acgaggttgg cgcaggtccc tggaacccca tccgactaga gcgtctggtt gaagtgccgg 1620 accgttaccc tgaccccgat aaccacggac gcaaaaaggc aggagccggg aaaggaggca 1680 aggcgcatga ctctcacgac gatggcgatc acgacgacca ccaccaccac cacggagctg 1740 cccccgcggg tgcagcggct ggaaagggta ccggtgcagc tgcaattggt ggcggagcgg 1800 gggctagccg tcaacgcgta gcaggggctg ctgccgcctc tgctcgtctg tgtgcgggag 1860 ctcgccgcgc tggccgtgtt gtcgcgtcgc cattgcgccc agctgccgct tgccgtggtg 1920 tggccgtcaa ggccgcagct gctgctgcgg gtgaagacgc tggtgctggt acgtctggcg 1980 taggttcaaa tattgttacg tctcccggaa tcgctagcac tacggcacat ggtgttcctc 2040 gtatcaatat tggggtgttc ggcgtgatga atgcaggaaa gtctacactt gtgaatgctc 2100 tggcgcaaca ggaagcatgc attgttgact caacccccgg cacgaccgca gatgtaaaaa 2160 cagttttgct tgagcttcat gcccttggac cagccaagtt gctggacaca gccggattag 2220 acgaagtcgg tggacttggg gataaaaagc gccgtaaagc cctgaatacg ctgaaggagt 2280 gcgatgttgc tgtgctggtt gttgacactg atacggcagc cgccgcaatc aaatcgggac 2340 gccttgctga agccctggaa tgggaatcga aagtaatgga acaggcacac aagtataatg 2400 tcagtcctgt actgcttctg aatgtaaaat cacgcgggct gcctgaagcg caggcagcta 2460 gcatgcttga ggcggtcgct ggtatgcttg acccatccaa gcaaatccct cgtatgtcgc 2520 tggatttagc gtccaccccc ctgcacgagc gtagtacgat tacgtctgca ttcgtcaagg 2580 aaggagcagt gcgcagttca cgctatgggg ctcctctgcc ggggtgtttg ccccgttggt 2640 ctcttggacg caacgcccgc ttactgatgg taatcccgat ggatgccgaa accccaggtg 2700 gacgtcttct tcgtcctcaa gcgcaagtta tggaggaagc aatccgccat tgggctaccg 2760 tgctttccgt acgcctggat ttagacgccg cacgtggcaa attggggccc gaggcctgtg 2820 agatggagcg tcagcgtttc gacggggtaa ttgctatgat ggaacgtaat gacggaccca 2880 ccctggtggt gacagattct caagcgatcg atgttgtaca cccttggacc ctggaccgct 2940 catcaggacg tccgttggtt ccaattacta cctttagcat cgctatggcg taccaacaaa 3000 acggcggacg tttggacccg tttgtggaag gattggaagc attggagacg ttacaagatg 3060 gggatcgcgt tcttatttcg gaagcgtgta atcataaccg tatcacctcc gcttgcaacg 3120 acattggaat ggtgcagatc cctaacaagc tggaggcagc acttggcggg aaaaagttac 3180 aaatcgaaca tgcgtttggt cgcgagtttc ccgagcttga gagtgggggt atggatggat 3240 tgaagttagc gatccattgt ggagggtgta tgatcgacgc tcagaaaatg cagcagcgta 3300 tgaaagactt gcatgaggct ggggtgccgg tcactaatta tggggtgttt ttctcttggg 3360 cagcttggcc cgacgccctt cgtcgcgcat tggaaccgtg gggagtggag ccaccggtag 3420 gtactcctgc tacccccgca gccgcgcctg ctacggcagc gtccggggta taatacta 3478 <210> 3 <211> 46 <212> DNA <213> Chlamydomonas reinhardtii <400> 3 ctagagggct ttacacttta tgcttccggc tcgtatgttg tgtgga 46 <210> 4 <211> 1850 <212> DNA <213> Chlamydomonas reinhardtii <400> 4 aagaaggaga tatacatatg tcggtccccc tacagtgcaa tgcaggccgt cttttggcgg 60 gccagcgccc ctgcggcgtc cgcgcgcgtc tgaaccgccg tgtatgtgtt ccagtgaccg 120 cacacggcaa agcatctgcc acgcgcgaat acgctggtga ctttcttcca gggaccacta 180 ttagtcatgc gtggtccgtg gagcgtgaaa ctcatcaccg ttatcgtaat ccggccgagt 240 ggattaacga ggctgccatc cacaaggcgc ttgaaacgtc aaaggctgat gctcaggacg 300 caggacgcgt gcgtgagatt ttggcgaagg ctaaggaaaa ggcttttgtt actgaacatg 360 cgcctgtaaa tgcggaaagt aaatccgaat ttgtacaagg gcttaccttg gaggagtgcg 420 ccaccttaat taacgttgat tctaataatg tcgagttgat gaatgaaatc ttcgacactg 480 cgcttgctat caaagaacgt atctacggga accgcgtcgt gctgttcgcg cccttgtaca 540 ttgctaatca ttgtatgaac acttgcactt attgtgcgtt tcgctcagcc aataagggca 600 tggaacgctc tattctgaca gacgatgacc tgcgtgaaga agttgccgcc ttgcaacgtc 660 aaggtcatcg ccgcatttta gcccttactg gagaacatcc taaatacact ttcgacaatt 720 tcttgcatgc agtcaatgta atcgcttccg tgaagacaga gcctgaaggg tccattcgcc 780 gtatcaatgt cgaaatccca ccacttagtg tctcagacat gcgccgcctt aagaatacag 840 attcagttgg cacgttcgtt ctgtttcaag agacatatca ccgcgacaca ttcaaggtaa 900 tgcatccgtc aggtccaaag agcgactttg attttcgcgt cttgacccag gaccgcgcca 960 tgcgcgcagg cttggacgat gttggtattg gtgctttatt cgggttatat gattaccgtt 1020 atgaagtttg cgccatgtta atgcatagcg agcatttgga acgtgagtac aacgcaggac 1080 cacatactat ctctgttccc cgtatgcgcc ccgcggacgg aagcgagctt agtatcgcgc 1140 ctccttatcc tgttaatgat gctgatttta tgaaattagt tgcggtcctt cgtattgctg 1200 taccatacac aggtatgatc cttagcactc gtgaatcacc agaaatgcgc tcggcgcttc 1260 tgaagtgtgg gatgagtcaa atgagtgccg gctcgcgcac tgatgtagga gcctatcaca 1320 aagatcacac gttaagtaca gaggcgaatt tgagtaagtt agctgggcag tttaccttgc 1380 aggatgaacg tccaactaat gagattgtta agtggctgat ggaggagggc tatgtcccgt 1440 cttggtgcac agcttgttac cgtcaaggtc gtacgggcga agacttcatg aacatctgta 1500 aggctggtga cattcacgat ttctgtcatc ccaatagtct gcttacgctt caagagtacc 1560 ttatggatta tgcagatcca gaccttcgta agaaaggcga gcaagtaatt gcccgtgaga 1620 tgggaccgga cgcctctgag ccgttatcgg cgcaaagccg taagcgcctt gaacgcaaga 1680 tgaaacaagt attggagggg gagcacgatg tatatcttta accaggcatc aaataaaacg 1740 aaaggctcag tcgaaagact gggcctttcg ttttatctgt tgtttgtcgg tgaacgctct 1800 ctactagagt cacactggct caccttcggg tgggcctttc tgcgtttata 1850 <210> 5 <211> 46 <212> DNA <213> Chlamydomonas reinhardtii <400> 5 ctagagggct ttacacttta tgcttccggc tcgtatgttg tgtgga 46 <210> 6 <211> 1642 <212> DNA <213> Chlamydomonas reinhardtii <400> 6 aagaaggaga tatacatatg tccgcattag tacttaagcc ctgtgcggca gtatccatcc 60 gtggctcctc gtgtcgcgca cgccaagtag ccccacgcgc tccgcttgca gctagcacgg 120 ttcgtgtcgc tcttgcaacc ctggaggcac cagcgcgtcg tttaggaaac gtcgcctgtg 180 ccgcagcggc accggccgca gaggcaccct tgtctcacgt ccagcaagca ctggccgaac 240 tggcaaagcc caaagatgac cccacgcgta agcacgtttg cgttcaagtc gctcccgcag 300 tgcgtgtcgc tattgctgaa accttagggc ttgcgccggg cgctacgaca ccgaaacaat 360 tagcagaagg cctgcgtcgc ttgggctttg acgaggtttt cgatacgctg ttcggggccg 420 acttgacgat catggaagag ggctcagaac ttttgcaccg tctgacggag cacttggaag 480 cacacccgca ctctgatgag ccgctgccta tgtttaccag ctgctgtcct ggttggatcg 540 cgatgctgga gaaatcatac ccagacctta tcccttatgt aagttcttgc aaatcccctc 600 aaatgatgct ggctgctatg gtcaaatcgt atctggcgga aaaaaagggg attgcaccta 660 aagatatggt tatggtaagc attatgccat gcacacgcaa gcagagtgag gcggatcgtg 720 attggttttg tgtcgacgcg gacccaacac ttcgccaatt ggaccatgtg atcacgaccg 780 tagagctggg gaatattttc aaagagcgtg ggatcaacct tgcggaatta cccgaggggg 840 agtgggacaa cccaatgggg gtaggctccg gtgctggagt actttttggc accactggag 900 gggtaatgga ggcggcgctg cgtactgcat acgaattatt tactggaacc cccttacccc 960 gcctttcgct ttcggaggtg cgcggcatgg atggcattaa agagactaac atcacgatgg 1020 taccggcccc tggcagcaag tttgaagaac tgttaaagca ccgcgcggca gcgcgtgccg 1080 aggctgctgc acacggaaca cctggtccct tggcctggga cggcggcgca gggttcacct 1140 cggaggacgg gcgtgggggt atcactcttc gtgtggcggt agctaatggc ttgggaaacg 1200 ccaaaaagtt gatcacaaag atgcaggcgg gagaggcgaa gtatgacttt gtagaaatca 1260 tggcgtgtcc agcgggatgc gttgggggcg gcgggcagcc acgttccacc gataaagcaa 1320 ttacccagaa gcgccaggct gcactttaca atctggacga gaagtcgact ctgcgccgct 1380 cccatgaaaa cccgtctatc cgtgagttat acgacactta tttgggtgag cccttagggc 1440 acaaagcaca cgaactttta catactcact atgtagctgg cggggtcgag gagaaggatg 1500 agaaaaagtg accaggcatc aaataaaacg aaaggctcag tcgaaagact gggcctttcg 1560 ttttatctgt tgtttgtcgg tgaacgctct ctactagagt cacactggct caccttcggg 1620 tgggcctttc tgcgtttata ta 1642 <210> 7 <211> 46 <212> DNA <213> Chlamydomonas reinhardtii <400> 7 ctagagggct ttacacttta tgcttccggc tcgtatgttg tgtgga 46 <210> 8 <211> 392 <212> DNA <213> Chlamydomonas reinhardtii <400> 8 aagaaggaga tatacatatg gcgatgcgtt ccacatttgc tgcgcgtgtc ggtgccaaac 60 cggcagtgcg tggggcgcgt cccgcgtcgc gtatgtcttg catggcctat aaggttacac 120 tgaaaacgcc atcaggcgat aaaacaatcg aatgtccggc ggacacctat atcctggatg 180 ctgcggagga agccgggctg gaccttccct atagttgccg tgcgggcgcc tgttcatcct 240 gtgctggcaa agtggcagct ggaacggtag atcaatctga tcagtccttt ctggatgacg 300 ctcagatggg gaacggattc gtcctgacat gtgtcgcgta tcctacaagc gactgcacta 360 tccaaactca ccaagaggag gctttatatt aa 392 <210> 9 <211> 1189 <212> DNA <213> Chlamydomonas reinhardtii <400> 9 aagaaggaga tatacatatg caaactgttc gcgctccagc agcttcaggt gttgccacac 60 gtgtcgcagg tcgtcgtatg tgtcgtccgg ttgcggcgac gaaggcttcc acggctgtta 120 ccacagacat gtcgaagcgc actgttccaa ccaagttaga ggaaggtgaa atgccgttga 180 acacgtacag taataaagct ccgttcaagg caaaggttcg ttccgtggaa aaaatcacag 240 gaccaaaagc cacaggtgag acgtgccaca tcattattga aaccgagggg aagatcccgt 300 tttgggaggg acaatcgtac ggtgtaattc cgccggggac caagatcaac tctaagggaa 360 aagaagtgcc tcatggtact cgtctttatt cgattgcttc tagtcgttac ggagatgact 420 tcgatggtca aacggcatcg ctgtgtgttc gccgcgcggt atacgtcgat ccagagactg 480 gaaaggagga ccccgcgaaa aaaggactgt gtagtaactt tttgtgtgat gccacaccag 540 gcacggaaat ttccatgaca gggcccacag gaaaagtatt gcttctgcca gcagacgcga 600 acgcgccatt aatctgtgtc gcaacgggga ctggaatcgc gccttttcgc tcattctggc 660 gccgttgctt catcgagaat gtcccaagtt ataagttcac tggccttttc tggttgttta 720 tgggtgtcgc taactctgat gctaaattgt acgatgagga actgcaagct atcgcaaaag 780 cgtatccggg acaattccgc ctggactatg ccttgtctcg tgaacaaaat aatcgcaagg 840 gcgggaaaat gtacatccaa gataaggttg aagagtatgc cgacgaaatt ttcgatttat 900 tggataatgg ggcgcacatg tacttctgcg ggttaaaggg gatgatgcca ggcatccaag 960 atatgttaga acgcgttgca aaagaaaagg ggctgaacta cgaagagtgg gtcgaggggt 1020 taaagcacaa gaatcaatgg catgttgaag tctactaacc aggcatcaaa taaaacgaaa 1080 ggctcagtcg aaagactggg cctttcgttt tatctgttgt ttgtcggtga acgctctcta 1140 ctagagtcac actggctcac cttcgggtgg gcctttctgc gtttatata 1189 <210> 10 <211> 8735 <212> DNA <213> Artificial Sequence <220> <223> Exemplary HPGC (hydrogen producing gene cluster) with HydA from Chlamydomonas reinhardtii <400> 10 ctagagggct ttacacttta tgcttccggc tcgtatgttg tgtggaaaga aggagatata 60 catatggcga tgcgttccac atttgctgcg cgtgtcggtg ccaaaccggc agtgcgtggg 120 gcgcgtcccg cgtcgcgtat gtcttgcatg gcctataagg ttacactgaa aacgccatca 180 ggcgataaaa caatcgaatg tccggcggac acctatatcc tggatgctgc ggaggaagcc 240 gggctggacc ttccctatag ttgccgtgcg ggcgcctgtt catcctgtgc tggcaaagtg 300 gcagctggaa cggtagatca atctgatcag tcctttctgg atgacgctca gatggggaac 360 ggattcgtcc tgacatgtgt cgcgtatcct acaagcgact gcactatcca aactcaccaa 420 gaggaggctt tatattaaaa gaaggagata tacatatgca aactgttcgc gctccagcag 480 cttcaggtgt tgccacacgt gtcgcaggtc gtcgtatgtg tcgtccggtt gcggcgacga 540 aggcttccac ggctgttacc acagacatgt cgaagcgcac tgttccaacc aagttagagg 600 aaggtgaaat gccgttgaac acgtacagta ataaagctcc gttcaaggca aaggttcgtt 660 ccgtggaaaa aatcacagga ccaaaagcca caggtgagac gtgccacatc attattgaaa 720 ccgaggggaa gatcccgttt tgggagggac aatcgtacgg tgtaattccg ccggggacca 780 agatcaactc taagggaaaa gaagtgcctc atggtactcg tctttattcg attgcttcta 840 gtcgttacgg agatgacttc gatggtcaaa cggcatcgct gtgtgttcgc cgcgcggtat 900 acgtcgatcc agagactgga aaggaggacc ccgcgaaaaa aggactgtgt agtaactttt 960 tgtgtgatgc cacaccaggc acggaaattt ccatgacagg gcccacagga aaagtattgc 1020 ttctgccagc agacgcgaac gcgccattaa tctgtgtcgc aacggggact ggaatcgcgc 1080 cttttcgctc attctggcgc cgttgcttca tcgagaatgt cccaagttat aagttcactg 1140 gccttttctg gttgtttatg ggtgtcgcta actctgatgc taaattgtac gatgaggaac 1200 tgcaagctat cgcaaaagcg tatccgggac aattccgcct ggactatgcc ttgtctcgtg 1260 aacaaaataa tcgcaagggc gggaaaatgt acatccaaga taaggttgaa gagtatgccg 1320 acgaaatttt cgatttattg gataatgggg cgcacatgta cttctgcggg ttaaagggga 1380 tgatgccagg catccaagat atgttagaac gcgttgcaaa agaaaagggg ctgaactacg 1440 aagagtgggt cgaggggtta aagcacaaga atcaatggca tgttgaagtc tactaaccag 1500 gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta tctgttgttt 1560 gtcggtgaac gctctctact agagtcacac tggctcacct tcgggtgggc ctttctgcgt 1620 ttatatacta gagggcttta cactttatgc ttccggctcg tatgttgtgt ggaaagaagg 1680 agatatacat atgtccgcat tagtacttaa gccctgtgcg gcagtatcca tccgtggctc 1740 ctcgtgtcgc gcacgccaag tagccccacg cgctccgctt gcagctagca cggttcgtgt 1800 cgctcttgca accctggagg caccagcgcg tcgtttagga aacgtcgcct gtgccgcagc 1860 ggcaccggcc gcagaggcac ccttgtctca cgtccagcaa gcactggccg aactggcaaa 1920 gcccaaagat gaccccacgc gtaagcacgt ttgcgttcaa gtcgctcccg cagtgcgtgt 1980 cgctattgct gaaaccttag ggcttgcgcc gggcgctacg acaccgaaac aattagcaga 2040 aggcctgcgt cgcttgggct ttgacgaggt tttcgatacg ctgttcgggg ccgacttgac 2100 gatcatggaa gagggctcag aacttttgca ccgtctgacg gagcacttgg aagcacaccc 2160 gcactctgat gagccgctgc ctatgtttac cagctgctgt cctggttgga tcgcgatgct 2220 ggagaaatca tacccagacc ttatccctta tgtaagttct tgcaaatccc ctcaaatgat 2280 gctggctgct atggtcaaat cgtatctggc ggaaaaaaag gggattgcac ctaaagatat 2340 ggttatggta agcattatgc catgcacacg caagcagagt gaggcggatc gtgattggtt 2400 ttgtgtcgac gcggacccaa cacttcgcca attggaccat gtgatcacga ccgtagagct 2460 ggggaatatt ttcaaagagc gtgggatcaa ccttgcggaa ttacccgagg gggagtggga 2520 caacccaatg ggggtaggct ccggtgctgg agtacttttt ggcaccactg gaggggtaat 2580 ggaggcggcg ctgcgtactg catacgaatt atttactgga acccccttac cccgcctttc 2640 gctttcggag gtgcgcggca tggatggcat taaagagact aacatcacga tggtaccggc 2700 ccctggcagc aagtttgaag aactgttaaa gcaccgcgcg gcagcgcgtg ccgaggctgc 2760 tgcacacgga acacctggtc ccttggcctg ggacggcggc gcagggttca cctcggagga 2820 cgggcgtggg ggtatcactc ttcgtgtggc ggtagctaat ggcttgggaa acgccaaaaa 2880 gttgatcaca aagatgcagg cgggagaggc gaagtatgac tttgtagaaa tcatggcgtg 2940 tccagcggga tgcgttgggg gcggcgggca gccacgttcc accgataaag caattaccca 3000 gaagcgccag gctgcacttt acaatctgga cgagaagtcg actctgcgcc gctcccatga 3060 aaacccgtct atccgtgagt tatacgacac ttatttgggt gagcccttag ggcacaaagc 3120 acacgaactt ttacatactc actatgtagc tggcggggtc gaggagaagg atgagaaaaa 3180 gtgaccaggc atcaaataaa acgaaaggct cagtcgaaag actgggcctt tcgttttatc 3240 tgttgtttgt cggtgaacgc tctctactag agtcacactg gctcaccttc gggtgggcct 3300 ttctgcgttt atatactaga gggctttaca ctttatgctt ccggctcgta tgttgtgtgg 3360 aaagaaggag atatacatat ggctcatagt ttaagcgcac attcccgtca ggccggagat 3420 cgcaaactgg gcgcaggtgc ggcatctagc cgcccatcat gtccttctcg ccgcattgtc 3480 cgcgtggcgg cccatgcttc tgcgtccaag gcgactcccg atgtacctgt tgacgatctt 3540 cctcctgcgc atgcccgtgc agcagtagcg gccgctaacc gtcgtgcgcg cgctatggca 3600 tcagcggagg ccgcggcaga gaccctgggc gatttcctgg gcttagggaa gggggggctt 3660 tcgccgggcg caaccgccaa ccttgatcgt gagcaagtat taggtgtgtt ggaggcggtc 3720 tggcgtcgtg gagaccttaa tctggagcgt gcgttgtaca gccatgccaa tgcggtgact 3780 aacaaatact gtggtggggg ggtctactat cgcggccttg tggagttcag taatatttgc 3840 caaaacgatt gctcatattg tgggattcgc aacaatcaaa aagaagtttg gcgctatact 3900 atgccggttg aagaggtggt cgaggtagct aagtgggcgc ttgaaaacgg cattcgcaac 3960 attatgttgc aagggggtga attaaagaca gagcaacgct tagcctactt ggaggcatgc 4020 gtccgtgcga ttcgcgagga gacaacgcag ttagaccttg aaatgcgcgc acgtgccgcg 4080 agtacgacaa cagcggaagc ggcagccagt gcacaggcag acgccgaagc taaacgcggc 4140 gagccagaat tgggtgtggt cgtatcctta agcgtcggag aacttcctat ggaacagtat 4200 gagcgtttgt tccgcgccgg cgcccgtcgc tatctgatcc gcattgaaac ctcgaatccc 4260 gacctgtacg cggcacttca cccggagccg atgtcctggc acgcgcgtgt agaatgcctg 4320 cgcaacctga agaaagctgg gtatatgttg ggcacaggag tgatggtcgg cttgccggga 4380 caaaccttac acgacctggc tggggatgtc atgttctttc gcgacattaa agcggacatg 4440 atcggtatgg gccccttcat tacgcagcct gggacgcctg caactgataa gtggaccgcg 4500 ctgtatccga acgccaataa gaacagccac atgaaatcta tgttcgatct gaccactgct 4560 atgaatgcac ttgtacgtat tacgatgggg aacgtaaata tcagtgctac gactgcatta 4620 caagcgatta tccccactgg acgtgaaatt gcgcttgagc gcggcgcaaa tgttgtcatg 4680 cctattttaa cgcctactca gtatcgcgag tcctatcagt tatatgaggg taagccctgc 4740 attacggata ctgctgttca gtgtcgtcgt tgcctggaca tgcgtttgca ctccgttggc 4800 aaaacgtctg cggccggagt ttggggcgat cctgcttcgt tcttgcatcc catcgttggc 4860 gtcccagtcc cgcacgactt gtcatcacct gctttggccg ctgctgcaag tgcggatttt 4920 cacgaggttg gcgcaggtcc ctggaacccc atccgactag agcgtctggt tgaagtgccg 4980 gaccgttacc ctgaccccga taaccacgga cgcaaaaagg caggagccgg gaaaggaggc 5040 aaggcgcatg actctcacga cgatggcgat cacgacgacc accaccacca ccacggagct 5100 gcccccgcgg gtgcagcggc tggaaagggt accggtgcag ctgcaattgg tggcggagcg 5160 ggggctagcc gtcaacgcgt agcaggggct gctgccgcct ctgctcgtct gtgtgcggga 5220 gctcgccgcg ctggccgtgt tgtcgcgtcg ccattgcgcc cagctgccgc ttgccgtggt 5280 gtggccgtca aggccgcagc tgctgctgcg ggtgaagacg ctggtgctgg tacgtctggc 5340 gtaggttcaa atattgttac gtctcccgga atcgctagca ctacggcaca tggtgttcct 5400 cgtatcaata ttggggtgtt cggcgtgatg aatgcaggaa agtctacact tgtgaatgct 5460 ctggcgcaac aggaagcatg cattgttgac tcaacccccg gcacgaccgc agatgtaaaa 5520 acagttttgc ttgagcttca tgcccttgga ccagccaagt tgctggacac agccggatta 5580 gacgaagtcg gtggacttgg ggataaaaag cgccgtaaag ccctgaatac gctgaaggag 5640 tgcgatgttg ctgtgctggt tgttgacact gatacggcag ccgccgcaat caaatcggga 5700 cgccttgctg aagccctgga atgggaatcg aaagtaatgg aacaggcaca caagtataat 5760 gtcagtcctg tactgcttct gaatgtaaaa tcacgcgggc tgcctgaagc gcaggcagct 5820 agcatgcttg aggcggtcgc tggtatgctt gacccatcca agcaaatccc tcgtatgtcg 5880 ctggatttag cgtccacccc cctgcacgag cgtagtacga ttacgtctgc attcgtcaag 5940 gaaggagcag tgcgcagttc acgctatggg gctcctctgc cggggtgttt gccccgttgg 6000 tctcttggac gcaacgcccg cttactgatg gtaatcccga tggatgccga aaccccaggt 6060 ggacgtcttc ttcgtcctca agcgcaagtt atggaggaag caatccgcca ttgggctacc 6120 gtgctttccg tacgcctgga tttagacgcc gcacgtggca aattggggcc cgaggcctgt 6180 gagatggagc gtcagcgttt cgacggggta attgctatga tggaacgtaa tgacggaccc 6240 accctggtgg tgacagattc tcaagcgatc gatgttgtac acccttggac cctggaccgc 6300 tcatcaggac gtccgttggt tccaattact acctttagca tcgctatggc gtaccaacaa 6360 aacggcggac gtttggaccc gtttgtggaa ggattggaag cattggagac gttacaagat 6420 ggggatcgcg ttcttatttc ggaagcgtgt aatcataacc gtatcacctc cgcttgcaac 6480 gacattggaa tggtgcagat ccctaacaag ctggaggcag cacttggcgg gaaaaagtta 6540 caaatcgaac atgcgtttgg tcgcgagttt cccgagcttg agagtggggg tatggatgga 6600 ttgaagttag cgatccattg tggagggtgt atgatcgacg ctcagaaaat gcagcagcgt 6660 atgaaagact tgcatgaggc tggggtgccg gtcactaatt atggggtgtt tttctcttgg 6720 gcagcttggc ccgacgccct tcgtcgcgca ttggaaccgt ggggagtgga gccaccggta 6780 ggtactcctg ctacccccgc agccgcgcct gctacggcag cgtccggggt ataatactac 6840 tagagggctt tacactttat gcttccggct cgtatgttgt gtggaaagaa ggagatatac 6900 atatgtcggt ccccctacag tgcaatgcag gccgtctttt ggcgggccag cgcccctgcg 6960 gcgtccgcgc gcgtctgaac cgccgtgtat gtgttccagt gaccgcacac ggcaaagcat 7020 ctgccacgcg cgaatacgct ggtgactttc ttccagggac cactattagt catgcgtggt 7080 ccgtggagcg tgaaactcat caccgttatc gtaatccggc cgagtggatt aacgaggctg 7140 ccatccacaa ggcgcttgaa acgtcaaagg ctgatgctca ggacgcagga cgcgtgcgtg 7200 agattttggc gaaggctaag gaaaaggctt ttgttactga acatgcgcct gtaaatgcgg 7260 aaagtaaatc cgaatttgta caagggctta ccttggagga gtgcgccacc ttaattaacg 7320 ttgattctaa taatgtcgag ttgatgaatg aaatcttcga cactgcgctt gctatcaaag 7380 aacgtatcta cgggaaccgc gtcgtgctgt tcgcgccctt gtacattgct aatcattgta 7440 tgaacacttg cacttattgt gcgtttcgct cagccaataa gggcatggaa cgctctattc 7500 tgacagacga tgacctgcgt gaagaagttg ccgccttgca acgtcaaggt catcgccgca 7560 ttttagccct tactggagaa catcctaaat acactttcga caatttcttg catgcagtca 7620 atgtaatcgc ttccgtgaag acagagcctg aagggtccat tcgccgtatc aatgtcgaaa 7680 tcccaccact tagtgtctca gacatgcgcc gccttaagaa tacagattca gttggcacgt 7740 tcgttctgtt tcaagagaca tatcaccgcg acacattcaa ggtaatgcat ccgtcaggtc 7800 caaagagcga ctttgatttt cgcgtcttga cccaggaccg cgccatgcgc gcaggcttgg 7860 acgatgttgg tattggtgct ttattcgggt tatatgatta ccgttatgaa gtttgcgcca 7920 tgttaatgca tagcgagcat ttggaacgtg agtacaacgc aggaccacat actatctctg 7980 ttccccgtat gcgccccgcg gacggaagcg agcttagtat cgcgcctcct tatcctgtta 8040 atgatgctga ttttatgaaa ttagttgcgg tccttcgtat tgctgtacca tacacaggta 8100 tgatccttag cactcgtgaa tcaccagaaa tgcgctcggc gcttctgaag tgtgggatga 8160 gtcaaatgag tgccggctcg cgcactgatg taggagccta tcacaaagat cacacgttaa 8220 gtacagaggc gaatttgagt aagttagctg ggcagtttac cttgcaggat gaacgtccaa 8280 ctaatgagat tgttaagtgg ctgatggagg agggctatgt cccgtcttgg tgcacagctt 8340 gttaccgtca aggtcgtacg ggcgaagact tcatgaacat ctgtaaggct ggtgacattc 8400 acgatttctg tcatcccaat agtctgctta cgcttcaaga gtaccttatg gattatgcag 8460 atccagacct tcgtaagaaa ggcgagcaag taattgcccg tgagatggga ccggacgcct 8520 ctgagccgtt atcggcgcaa agccgtaagc gccttgaacg caagatgaaa caagtattgg 8580 agggggagca cgatgtatat ctttaaccag gcatcaaata aaacgaaagg ctcagtcgaa 8640 agactgggcc tttcgtttta tctgttgttt gtcggtgaac gctctctact agagtcacac 8700 tggctcacct tcgggtgggc ctttctgcgt ttata 8735 <210> 11 <211> 2070 <212> DNA <213> Artificial Sequence <220> <223> pSB1C3 plasmid <400> 11 tactagtagc ggccgctgca gtccggcaaa aaagggcaag gtgtcaccac cctgcccttt 60 ttctttaaaa ccgaaaagat tacttcgcgt tatgcaggct tcctcgctca ctgactcgct 120 gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt 180 atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc 240 caggaaccgt aaaaaggccg cgttgctggc gtttttccac aggctccgcc cccctgacga 300 gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata 360 ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac 420 cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg 480 taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc 540 cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag 600 acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt 660 aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta gaagaacagt 720 atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg 780 atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac 840 gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca 900 gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac 960 ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac 1020 ttggtctgac agctcgaggc ttggattctc accaataaaa aacgcccggc ggcaaccgag 1080 cgttctgaac aaatccagat ggagttctga ggtcattact ggatctatca acaggagtcc 1140 aagcgagctc gatatcaaat tacgccccgc cctgccactc atcgcagtac tgttgtaatt 1200 cattaagcat tctgccgaca tggaagccat cacaaacggc atgatgaacc tgaatcgcca 1260 gcggcatcag caccttgtcg ccttgcgtat aatatttgcc catggtgaaa acgggggcga 1320 agaagttgtc catattggcc acgtttaaat caaaactggt gaaactcacc cagggattgg 1380 ctgagacgaa aaacatattc tcaataaacc ctttagggaa ataggccagg ttttcaccgt 1440 aacacgccac atcttgcgaa tatatgtgta gaaactgccg gaaatcgtcg tggtattcac 1500 tccagagcga tgaaaacgtt tcagtttgct catggaaaac ggtgtaacaa gggtgaacac 1560 tatcccatat caccagctca ccgtctttca ttgccatacg aaattccgga tgagcattca 1620 tcaggcgggc aagaatgtga ataaaggccg gataaaactt gtgcttattt ttctttacgg 1680 tctttaaaaa ggccgtaata tccagctgaa cggtctggtt ataggtacat tgagcaactg 1740 actgaaatgc ctcaaaatgt tctttacgat gccattggga tatatcaacg gtggtatatc 1800 cagtgatttt tttctccatt ttagcttcct tagctcctga aaatctcgat aactcaaaaa 1860 atacgcccgg tagtgatctt atttcattat ggtgaaagtt ggaacctctt acgtgcccga 1920 tcaactcgag tgccacctga cgtctaagaa accattatta tcatgacatt aacctataaa 1980 aataggcgta tcacgaggca gaatttcaga taaaaaaaat ccttagcttt cgctaaggat 2040 gatttctgga attcgcggcc gcttctagag 2070 <210> 12 <211> 87 <212> DNA <213> E. coli <400> 12 ttgttaaata tagatcacaa ttttgaaacc gctcgggata tcagcgaaaa cataagcaaa 60 agtgaatgtt ttaagaacat tccgtaa 87 <210> 13 <211> 215 <212> DNA <213> E. coli <400> 13 atattccacc agctatttgt tagtgaataa aaggttgcct gtaaaattac aaaaacctta 60 cgcagcgtca agcggaatcg tgtcaatcat tgcgacaaat caatcctgtg cctaagcatt 120 acgcgactga ctcgcctcac tcttcctttg ggcttgagac cacatggggt cggcgccccg 180 aattttaaag ggcaattacg ataaaaatgt gattt 215 <210> 14 <211> 1452 <212> DNA <213> Corynebacterium glutamicum <400> 14 agcctctacc tcgctgcggt cgccagacca ctctgtatgg aacgaaccgt ctttgtcgat 60 gcgtttgtat gtgtgggcac caaaaaaatc gcgctgccct tggattaacg ctgctggaag 120 gcgctcggcg cgtaatgagt cgtaataact aagactacta gcaaagacgg gaatcggcaa 180 ccccagttgg gtggcggtca caatgacgcg gcgccagcta tcgattaagt ccccaagctc 240 ggatttaaag taaggatcta acagcaacga ctctaactct gcgttcgcgt catacgcttc 300 aacgatgcga tttaaaaatt tagcgcggat gatacaaccg ccgcgccaaa tagtcgctaa 360 atcacggggg tctacatccc agttgttctc atcagaaccg gctttaattt cgtcgaaacc 420 ttgtgcgtag gctaccaact tagatgcgta aagcgcacga cggacatcct cgacaaattg 480 agccttatct acgccaagcg cttcaaggtc tgtcagtacc ccagcgggaa gattgccctg 540 ggcggcagca cgttgtgaag ttgcaccgga cagggcacgg gcaaatacgg cctcgccaat 600 tccggtggtt gcaattccca aatccagagc cgcttttact gtccagcgtc ctgtaccttt 660 ttgccccgcc gcatccacga taacatcaat caacggcttg cctgtctctg cgtcgacctg 720 agataaaacc tcagccgtaa tttcgatcaa gtaggagtca agatcaccag cattccactc 780 cttaaatacc tcggcaattt cggccggctg cattccagcc gcatagcgca gcaggtgata 840 cgcttcccca attacttgca tatcggcgta ctcaatgccg ttatgtacca tcttgacgaa 900 gtgtcctgct ccgtctggcc cgatatgcgt aacacaaggg gtaccatcca cgttggcagc 960 aattgactca agcaaagggc ccaagctttc ataactcttc gcaggacctc ccggcataat 1020 agaaggtccg ttcaaggccc cttcttctcc gccggaaatg cccgcaccca caaagtgcag 1080 tccacgggca ctgatctctt tttcgcggcg gatggtatcc gtatacagag cgttgccacc 1140 atcgataatg atgtcgcctt cgtccattgc gtctgctaat tgattgatga cggcatctgt 1200 agcgttgccg gcctggacca tgatgatggc gcgacggggc ttctctaaac tcgctacaaa 1260 ctcctcgacc gttgcggagg gaataaaatt tccctcgctg ccatgatccg cgatcaactt 1320 atccgttttg tcggtactgc ggttatagac tgcaacggtg ttgccgttac gggcaaaatt 1380 gcgggcaagg tttgagccca taaccgcaag cccaacaacg ccaatttgag ccagattatc 1440 accgtttgtc at 1452 <210> 15 <211> 1005 <212> DNA <213> Clostridium acetobutylicum <400> 15 atggcgaaga ttgcaatcaa tggctttggg cgtattggcc gccttgcgct tcgtcgcatt 60 ctggaagtac cgggtctgga agttgtggcg attaatgatc tgaccgatgc aaagatgctg 120 gcacatttgt ttaaatacga ttcttcgcaa ggacgcttca acggggagat tgaggtgaaa 180 gaaggcgcgt ttgtcgtcaa cggcaaagaa gtcaaggtat tcgccgaggc cgatccagaa 240 aagttgccgt ggggagacct gggcattgat gtggtccttg agtgtacggg ctttttcact 300 aagaaagaga aggccgaggc acacgtccgt gcaggggcga agaaggtcgt gatctctgct 360 ccagctggga atgatcttaa aaccattgta ttcaacgtca acaatgaaga tctggacggg 420 acggaaacgg tcatctcggg tgccagctgc acgacgaatt gtctggctcc aatggcaaaa 480 gtcttaaatg acaagtttgg cattgagaaa ggattcatga caactattca tgcgtttacc 540 aacgaccaga atacgttaga tgggccgcac cgtaaaggag acctgcgtcg tgcacgtgcc 600 gcggccgttt ccatcatccc aaattcaaca ggtgccgcaa aagctatctc gcaagttatc 660 ccggatctgg ctggtaaatt agatggaaat gcacaacgtg taccggtgcc taccggttcc 720 atcactgagc tggtctcagt cctgaagaaa aaggtaacgg tagaagagat taatgcagcg 780 atgaaagaag cagccgatga gtcttttggg tacaccgaag atcccattgt atccgcggac 840 gtcgtgggaa ttaactacgg ttctttgttt gacgcaactc tgactaaaat tgtagacgtg 900 aatgggtctc aattggttaa gaccgctgca tggtatgata atgagatgag ttacacttct 960 cagctggtac gcacacttgc atatttcgcc aagattgcta aatag 1005 <210> 16 <211> 1455 <212> DNA <213> Zymomonas mobilis <400> 16 gtcataccag gtcactccgt cacgttctgc caatgcgata gcggtagacg gtccccaggt 60 tcccgatacg taagtcttag gtttcataga gttagctttc cacccctcac gaattccgtc 120 aatccagacc cactgggcct caacttcgtc acggcgtaca aacagagtgg cgtctccctc 180 aatcaggtca agcatcagac gctcataggc gatacggcgt ttgcggtcct taaaaacatc 240 agtcaacgac aagtccagcc acacctcgcg catgtgggct ccgttacggt ccaatccggg 300 ctctttcacc atcatcgaga tttgaatagt ctcgtccggt tgtaagacga tgcgtaactt 360 attaggttgc aagatgccgc cactcgaact gaagatagag tgcggtacag gtttgaactg 420 taccacgatt tcggagcgac gggccggcaa gcgtttaccc gtacggatgt aaaatggaac 480 accctgccaa cgccaattgt ccacatgggc tttaattgct acgaaagttt cagtatcact 540 tggttgccct aactcgtcga tgtatcctgc aacttccttt ccgccagaga cccccgcccc 600 gtactgcccg gttacggtgt gggtaaacac cgtatcattg ttgatagggc gcaaagcgcg 660 gaatacttta accttctcat cacgcacagc attggcctcc atgtgtgcgg ggggctccat 720 tgcgaccaac gctacaagct gaagaatatg actctgaacc atgtcacgca gggagccact 780 accgtcgaag taaccaatgc gcccttcaag tccgactgtt tccgcgaccg aaatctgtac 840 gtggtcaatc cccttgctat tccaaagggg ctcgaacaat gcgttcccaa aacgcaaggt 900 caaaagattc tgcaccgttt ctttgcccaa atagtggtcg atgcggtaaa cttgcttctc 960 tgagaatacc ttcagtacag catcgttaat atggtcgctg gaggcaaggt cttgtcccag 1020 gggtttttcc aatgccaaac gtgaggttgg ccccgctaat cccgcctgct ttaatccagc 1080 aatggcgcct tcaaaaagtg aaggcgccgt acttaagtaa attgcgatgc ctttttctac 1140 gggaccacac agatccgcta atttgccgaa ctgggtgggg tcggtgatgt ccacggtagc 1200 gtaaaaaagc ttatttaaaa acttcgcttt agcatcgtca ttcaaacggt cagaggccac 1260 gaaacggtcc agcgctttct ccgcaaagtc acggaatccg tcagtatcat actcggaacg 1320 cgaggtgcat acgatacgca agtcgtccgc cagtaagccg tctgcatcaa gcccataaag 1380 gctaggcagc aacatgcgtt ggcttaaatc cccggtgcta ccgaacagaa tcattgttga 1440 cacagtattg gtcat 1455 <210> 17 <211> 1506 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised nucleic acid sequence encoding HydA from Chlamydomonas reinhardtii, 5' - 3' <400> 17 cccgggatgt ccgcattagt tctgaagcca tgtgcggcgg tcagtatccg cggaagcagc 60 tgccgcgccc gtcaagtcgc gccgcgcgcg ccgttagcag cgtctacagt tcgtgttgca 120 ttagcaacac ttgaagctcc tgcgcgtcgc ctgggcaacg tcgcttgtgc agcagcggct 180 ccggcggcgg aggccccttt gagccacgtc caacaagcct tagctgaatt ggccaaaccg 240 aaagatgacc ccacacgcaa gcatgtttgt gtgcaagtcg ccccagcggt ccgcgtcgct 300 attgccgaaa cacttggact tgctcccggt gccacgaccc cgaagcaatt ggcggagggc 360 ttacgccgtc tgggtttcga cgaagtattc gacacgcttt tcggggcaga tttgacaatt 420 atggaagaag ggtcagagtt gttgcatcgt ttaacggaac atttggaggc tcaccctcac 480 tctgacgaac cgttgcccat gtttacctcg tgttgtccgg gttggattgc gatgcttgag 540 aaatcgtacc cggatttaat tccttatgtg tcctcgtgca aatctcctca aatgatgtta 600 gccgcgatgg tgaagtcata tcttgccgaa aagaagggca tcgcacctaa agacatggtg 660 atggtgtcaa tcatgccttg cacccgtaag cagtccgagg ccgatcgcga ctggttttgt 720 gtggatgctg accctacatt acgccagtta gatcatgtta ttacaaccgt agagttgggt 780 aacatcttta aggagcgtgg tatcaatttg gctgagttac cggaaggtga atgggacaac 840 ccgatggggg tgggttcggg agccggagta ttatttggga ccactggcgg cgtaatggag 900 gcagcattac gtacggccta cgaactgttc acaggtaccc cgctgcctcg cctgagtttg 960 agcgaggtgc gtggtatgga cggtattaag gaaacgaaca tcacaatggt tcctgctccc 1020 ggttcaaaat tcgaggaact gttgaagcat cgcgctgccg cacgtgcaga agcagccgca 1080 cacggtactc ctggtccact tgcctgggac ggcggggccg gatttacttc agaagacggt 1140 cgtggtggaa ttactttacg tgtcgctgtt gcgaatgggc tgggtaacgc taaaaagtta 1200 attacaaaaa tgcaggccgg agaggcaaaa tatgatttcg tagagattat ggcctgtccc 1260 gctggttgcg taggaggtgg gggccagccc cgttcaactg acaaagctat cacgcagaaa 1320 cgtcaagcgg cattatacaa tctggatgaa aaatcaacgc ttcgccgttc acatgagaat 1380 ccatcaatcc gtgaattgta cgatacttat ttaggtgagc ctctggggca taaggcacac 1440 gaacttctgc atactcatta cgtcgcgggt ggagttgagg agaaggatga aaagaagtag 1500 ggatcc 1506 <210> 18 <211> 1266 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised nucleic acid sequence encoding HydA (Hyd1) from Volvox carteri, 5' - 3' <400> 18 cccgggatgt acgtttgcgt cgcacaagtt acgttacatg attgcttagc atgctcaggg 60 tgcatcacat ctgcggaaac ggttttgctt cagcaacagt ccggggatga gttcttatcc 120 cgcttggcag acccgcacac tactgtcgta gttaccgtct cgccccaatc gcgcacagct 180 ttggcggctt actatggatt atgcccgtct caggctcttg cccgccttgt gggctggttg 240 aagtggcttg gggttcgcgc cgtatgggat ctgacaacag cccgcgatct tgtattgttg 300 gaagaggcag ctgagttcat gaaccgttgg gtctgcatgt atgttagcgc cgggcctctt 360 ccggtcatgg gcagttcatg tcctggcaca ggctgggttt gttatgctga aaagacgcac 420 gggacgcgtg tattacccta tttgagcacc acccgttcac cccaaggagc aatgggtggc 480 ttggtaaagt ccctggtggc agcagcttgg ggcgttactc cagggtcttt gtaccacgtc 540 acaattatgc cgtgttatga caagaaattg gaagcatctc gcgatgaatt aaccacaacg 600 gcgacaacta ctaccgctgc ggggacagac gcggctggag caggtgccgc cgtaggcggg 660 cctctgcctg aagtgatggt ccgtcatgca accgcagcgc ctgatccgtt gcttccgggc 720 gtggtaccag ccgacgacca gctgtactcc cttccacatg gctccagctc gggtggatac 780 gcggacttcg ttttccgcac tgccgcgcgc gagttgtggg gggtagaagt tccgccagga 840 cctttaccat ggcgtactcg tcgtaacgcc gacttacagc ctcgtgttgg tgccccaggc 900 caatctctgg tcgttgcgcg tgtgtatgga ttccgcaata ttcagacact tttacagcag 960 cttaagcgtg gacgctgccc ttatcattat gtggaagtca tggcttgtcc tagcgggtgt 1020 ttgaacggag gaggacaaat caaaccgggg ccaggggtaa cgccgcaaca attaattgaa 1080 caattggagc ttttgtatga cgttgcggca cgttctccag cagacaaccc ggcggtagca 1140 gctttatatg gctcttggtt aggcggtcgt ccaggggcac cccccgctcg tcaactgtta 1200 catacgacat ttcgcgagcg cgaaaagact gtaactgccg caaccgtcac gaattggtag 1260 ggatcc 1266 <210> 19 <211> 1437 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised nucleic acid sequence encoding HydA (Hyd1) from Giardia lamblia 5' - 3' <400> 19 cccgggatgc ctccaaaacc ccaacacgat gtaacaggcg tggactccaa taacgcgatc 60 atgattgatt acgcaaagtg cattggctgc aacatgtgca tcaaagcatg cgacgtgcaa 120 ggtattggtg tttacaagca gaacgaaaaa ccgaagtacc cgcctatcgt gaagctgagc 180 accctgttta atagcgattg tatcggctgc ggtcaatgtg caacgatttg tccggtggac 240 gcgattgctc caaagaacaa tctggaaatt tacaaaggcg aatctgcttc caaaaaagtt 300 cgtgtggcgt tgatcgcgcc aagcactcgc gtggcgtttg gagatgtctt cgggctgccg 360 atcggtacaa ataccattta ctccctgatt cgcatgctga agcaatatct gggtttcgat 420 tatgtgttcg acgtgaattt cggcgcagat gaaaccaccg tcatcgacac ccaagagctg 480 ttgcacttca aacacgaggg ccgtggtccg gtgttcacca gctgctgccc ggcgtgggtt 540 aacctctgtg aaatgaagta cccggagctg ctgccccagg ttagcaccgc taaatcttgt 600 gttgcaatgg tagcgaccct tgtaaaaaga cgttgggttc aagaacattt aatcccgaag 660 ggtattgtag acagcgttga cgatgtctac gtggctgata ttatgccgtg taccgcgaaa 720 aaggatgaaa gcatgcgtcc acaactgaac cgcgatgtgg acatctgcct gacggtgcgt 780 gaagttgcgg agcacctgta ttttctgcac ggcgcgcgct tgacgctgga ggaagtcgag 840 gcggatgcgt tggttttgcg tccgggccgt agcacgcaga aaaagtggga ctttgacgct 900 ccgtttaaca ccgtgtctgg tggctcccat atctttggta agaccggtgg cgttgccgag 960 acgtgtctcc gtttcatcag ctatatgaaa aagtcgccga tagaaaacgt taaggaggaa 1020 ttgctgaaag agttcaagac gccgggtcag ctggtgcaaa ccgttaagct ggtcagctgc 1080 gagatcgccg gtgagactta tcgtgccctg attgcgcatg gcggttcagc aatcaatgcc 1140 gccgcgcgta tggtgctcaa taaagaggtg gagtgcgacg ttgttgagca gatggcctgt 1200 ccgggtggct gccagaacgg tggaggcatg ccgaagatca agggtaaaaa agaggcagtt 1260 ttgacgcgtg cgtctacctt ggacatcctg gacggtaaag agcgctttgc gagcgcgggc 1320 gagaacaaaa ctctgtgggg tttcaacggc tgcttaaccg aacacgaagc gcacgagttg 1380 cttcacaccc attatcagca tcgcccggtg gaatcgctgc tgccgcagta gggatcc 1437 <210> 20 <211> 1419 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised nucleic acid sequence encoding HydA (Hyd1) from Entamoeba nuttalli, 5' - 3' <400> 20 cccgggatgc ctccaaaacc ctcacacact gtaacaggcc acgaccacaa ccacagcatc 60 cagtttgact ggagcaagtg tatgggctgc ggtatgtgtg caaccaaatg caccttcggc 120 gtattggtta agcagccgcc gaagatcccg ccatttgtcc agccgaaccg tgaaaaactg 180 agccaagaga acaccgataa aacgcgtgtc ctgatcgatg aaagcgagtg caccggctgc 240 ggtcaatgct ctctggtgtg caactttgga tctatcaccc cgatcgacca cctcgttgac 300 accttcaaag caaaggaggc gggcaaaaaa ctcgtggcca tgattgcccc gagcactcgc 360 cttggtgtcg ctgaggctat gggtatgccg attggctcca ccgctatggc gcagctggtg 420 cattgtctgc gtctgattgg ttttgactac gtttttgacg tggacgcggg tgcggataag 480 acgaccatgg acgattacgc ggaagttatc gaaatgaaaa aggagggtaa gggtccggcg 540 atcaccagct gctgcccggc gtggattgag ctggtggaga aagaatatcc ggatttgatc 600 ccgaacgtgt ccactgcgcg tagcccgatc ggctgcttgg ccggttgcat caaacgtggt 660 tgggcaaaag atgttggcat cgcggtagag gatttgtaca ccgtgggtat catgccttgt 720 attgcgaaga agacggaatc ccaacgtcag caaattcatc aagattacga cgcaagctgt 780 acgtctaacg agattgcggc gtacttcaag aagcacctgc caccggaaga gtgcaaattc 840 acccaggagc gcgaggaagc tctggcaaag actgaggacg gccaatgtga tctgccgttc 900 cgtcgcatta gcggtggctc caacattttt ggtaagaccg gcggggtgtg tgaaaccgtg 960 ttgcgggtga ttgcgcgtaa tgcgggtgtt gactggaata cgtgcaccgt taacaaagag 1020 gaaacattca aacacgccgc tagcggttcg accatgacca atctgagtgt tgacatcggc 1080 ggaactataa tcaccggggc agtttgccat ggtggttatg caatccgtca tgcctgcgaa 1140 ctgattcgca aaggtgaact gaaagtcgac gttgttgaga tgatggcctg tgttggcggc 1200 tgcctgggcg gtgctggcca gcctaagatc ccgccggcga agaagctgga aatggataag 1260 cgcagagtga tgttagatat tctggaccag caaacggaca ttcgtgcagc gaatgaaaac 1320 accgacgtgc taggctggat tgataaacac ttcgaccacc agggtgcgca tcaacatctg 1380 cacacctatt tcaccccgcg ttatcagaat tagggatcc 1419 <210> 21 <211> 1413 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised nucleic acid sequence encoding HydA (Hyd1) from Ilyobacter,polytrophus 5' - 3' <400> 21 cccgggatga agaacaaaac agtatcaaat gataaaatag acaataaact gaactgctcc 60 gaaaacctgg aaaaccgtac catcgacaaa agcttctaca ccttttcacg tgataccagc 120 aagtgcatta agtgctacaa gtgcgtgaaa gtttgcaagg acactcaggg catttccgtt 180 tttcaggttg aggaggacgg cacggtgggc atcaaagagg agaatatggc ggccaccttg 240 tgtatcagct gtggtcaatg tattaaagtg tgcaccgcag gtgcgctgaa ggagaaatcc 300 aacatctctc tgttgaagga gcagttaaat aacccgaata agcacgttgt cgcgcagctg 360 tctccaagct tcaaacacac cattggtgat ggcttcggca tcagctcggg taccgatact 420 tccccgaaaa tcatcagcgc tctgaaagaa attggtttct ctaaggtttt cagtaccggt 480 ttcgccagcg acgtgaatat cgttgagacc agcgcggatc tgaaaaaacg cctagatgaa 540 aacggtccgt tcccggtgtt cacctccacg tgcacgggtt ggattaacta tgcggaaaag 600 ttttgtccgg agttcctggg gctgctctct ccgtgcaaaa gcccgcaaca gatcctgggt 660 agcctgagca agtcctacta cgaagagagc attgacatca gcagagaaaa tatctttagc 720 gtggcgctga tgccttgcat cgccaaaaag gatgaagcta atcgttttga catgaaggac 780 gaatatggta acaaagatgt ggacctggtc ctgaccgtga atgaagttgc tagccttttg 840 aacaaaaagg gcattgattt aaacaattac tctaagttcg gtacttttga taagccgatg 900 aaatccgaca ctggttcttc gcgtattaag gcggttacgg gtggcctggc agaggctatc 960 ctgcgcaaca ccgcacacat gatcggtgaa gatccgtttt ctgtagacct gaagaagctg 1020 cgtggtatgg atggtattaa gctcacgagc gtggttctgg gcgggaaaaa attaaacatt 1080 gcggtcgtga acggcatcaa gaacgtgccg gttattctgg acatgattaa agatggcatt 1140 accgagttcc acttggtcga ggttatggcc tgtccgggtg gctgcgtcgg cggcggtggt 1200 atcccgttgt cagaagaccc ggacattatc caaaaacgcg cagagaaaat ctactcgtac 1260 gacgcgagca gcgaaattcg ttgtagctgg gaaaacccag atgttaaaac cctgtatagc 1320 gagtacctga aggagccgct gggagaggag tctcaacgtt tgtttcattt tcattataaa 1380 aaccgccgta ccaaacgtat cttctaggga tcc 1413 <210> 22 <211> 1506 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised nucleic acid sequence encoding HydA (Hyd1) from Volvox carteri, 5' - 3' <400> 22 cccgggatga gtgctatgct atcttcatta acaaattctc gcttgggcgc ttacgtgccg 60 caagtggcgg taagccgtta tggttccaag ccggtctacg tcccgtgcgt gccgtttcgt 120 aagtgcacct cggcggtgcc agtgccggtt aagacggtgc aagaaggtaa ttcggtcaga 180 cttatgccag cggcggcggc tccggcgggt gcggcagcgg acccacattg gaaacaagca 240 tttgcagagc ttgataaacc gaaagccgaa cgtaaagtta tgatcgcaca ggttgctccg 300 gcggtgcgcg ttgccatctc cgagagcttt ggtctggcac cgggggctac cactccgggt 360 cagctggccg agtccctgcg ttgtctgggt tttgatatgg tgttcgacac cttgtacggc 420 gcggacctga ccattatgga agagggcact gagttgctgt cccgtctgca agcgcaattg 480 gaagcccacc cgcatagcga agaaccgctg ccgatgttta ccagctgctg tccgggctgg 540 atcgccctgt tggagaagag ctatccggaa ttaattccgt atgtgtctag ctgcaagtct 600 ccgcagatga tgttaggcgc tatggtgaag acctatctgg cagagaagaa aggcatctct 660 ccgagcgaca tctccatggt ttcgattatg ccgtgtgtga ggaagcaagg tgaagcggac 720 cgtgattggt tttgcagcgg cggcgccggc gttcgtgatg tggaccacgt tattaccacg 780 gcggagctag gcaacatcct gaaagaacgt aatatcaacc tccccgaact gccggaaggc 840 ggttgggatg agccgctggg ttcgggtagc ggtgcgggcg tcgttttcgg tacaaccggt 900 ggtgttatgg aagcggcgct gcgcaccgcg tacgagttgg ttacccagca accgctgcct 960 cgtttgaatc tgagtgaggt tcgcggtatg gacggcatta aagaaaccga aatcaagatg 1020 gttccgcctc cgggtagcaa attcgccgag cttgttgccg cacgtgcagc ggcgaaggct 1080 atggatgaag cggccgcgag cgcaggcgcg attaagtggg atggtggcag caacttcacc 1140 gcggacgacg gtgctaaggg catcaccctg cgcgtggccg tggctaatgg tctgggaaac 1200 gcgaaaaagc tgctgacgaa aatgcagacc ggtgagtgca aatacgactt cgtggaaatt 1260 atggcatgtc cgtctgggtg cgttggtggt ggtggtcagc cgcgcagcac cgataaacag 1320 gtggcggtca aacgtcagca ggcactgtac gaccttgacg agcgcgcaac gatccgtcgt 1380 agccacgaga acccggctgt ccaaaaagcg tacgaagatt tcctgggcga gccgaacagc 1440 cacaaagcgc acgatctgtt gcacacccat tatgttccgg gtggcgttga cacggagtag 1500 ggatcc 1506 <210> 23 <211> 1419 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised nucleic acid sequence encoding HydA (Hyd1) from Trichomonas vaginalis, 5' - 3' <400> 23 cccgggatgc tagcgtcaag tgcaacagct atgaaaggct tcgccaatag cctccgtatg 60 aaagattaca gcagcaccgg tattaacttc gacatgacta agtgcattaa ctgccaaagc 120 tgcgttcgcg cctgcacgaa catcgctggc caaaacgtct tgaagagctt gacggtgaac 180 ggcaagtccg ttgtgcagac cgttaccggt aaaccgctgg cggagaccaa ctgcatcagc 240 tgcggtcaat gtacccttgg ctgcccgaag ttcaccatct tcgaggcgga cgccatcaat 300 ccagttaaag aggtcttgac caagaaaaac ggtcgtattg ccgtgtgtca gattgctccg 360 gcgattcgta tcaacatggc tgaagctctg ggcgttccgg ctggtacgat ctccttgggt 420 aaggtggtga ccgcgctgaa acgtctgggt tttgactacg ttttcgatac caatttcgct 480 gccgatatga ccatcgtgga ggaagcgacc gaactggttc aacgtttgtc tgacaaaaac 540 gcagtgctgc ctatgtttac ttcatgctgt ccagcgtggg ttaattacgt agagaaatcc 600 gatccgagct tgatcccgca tctgagctct tgtcgtagcc cgatgagcat gctgagcagc 660 gttatcaaga acgtctttcc gaaaaagatt ggtacgaccg cagacaaaat ctacaatgtg 720 gcgatcatgc cgtgcaccgc gaagaaggac gaaattcagc gcagccaatt taccatgaag 780 gatggtaaac aagagacagg tgcggtgctg acttctcgtg aactcgcgaa aatgattaag 840 gaggcgaaga tcaacttcaa agagctgccg gatacgccgt gtgataactt ttattctgaa 900 gcatcgggcg gcggtgcgat cttttgtgca accggcggcg tgatggaagc cgcggtgcgc 960 agcgcgtata agttcctgac gaagaaagag ctggcaccga ttgacctgca agacgttcgc 1020 ggtgttgcga gcggcgttaa actggcggag gtggatattg ctggtaccaa agtaaaagtg 1080 gcggttgcgc acggcattaa gaacgccatg accctgatta agaagatcaa atcgggtgaa 1140 gagcagttta aagacgttaa gttcgtggaa gtgatggcat gtccgggtgg ctgcgtggtt 1200 ggtggtggca gcccgaaggc taagaccaag aaagctgtcc aggcacgatt gaatgcaacg 1260 tactccattg acaaaagctc caaacacaga acttctcagg acaacccgca gttgttacag 1320 ctgtataaag aatcgtttga aggtaaattc ggtggtcatg tcgcgcacca cctgctgcac 1380 acccattata agaatcgtaa agtaaatccg tagggatcc 1419 <210> 24 <211> 1470 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised nucleic acid sequence encoding HydA (Hyd1) from Megasphaera micronuciformis, 5' - 3' <400> 24 cccgggatga aggctgtaga gggatttgaa tcaaaatata aattttacga caagcgcgtg 60 ccgattgcgg acgacaaccc agctgtgcac tttgacgaaa cgaaatgcaa aaattgtacc 120 ctttgccgtc gtgcgtgtga aactacgcaa accgtgctgg actattacag cctggaacgc 180 accggcgatg ttccggtttg tgttcactgc ggtcaatgtg caaatgcctg cccgtttggt 240 gccatgatgg aagttgatga tacgaactta gtcaaagctg cgatcgcgga cccggataag 300 gtggtggttt tccaaacggc accggcggta cgtgtggcca ttgcggaaga gttcggtgcg 360 gaggcgggta cattcgcaca gggtaaaatg atttcagcgt tgagagccct gggtggcgac 420 tacgtgttcg acaccaactt tggcgctgac atgaccatca tggaagaaac ttccgagctg 480 gtgcgtcgta ttaccactgg taacttcgca atgccgcagt ttaccagctg ctgcccggcg 540 tgggttgagt ttgctgagac cttctacgca gaatacatcc cgcatctgtc cagcgcgaag 600 agcccgattc tgatgcaaaa caccacggaa aaaatctggt ttgccgagaa ggcgggcatc 660 gatccgaaga agatggtgac ggtttgcgtt accccgtgta ccgctaaaaa agccgagatc 720 aagcgcaaag aattgaatgc tgcggctgag tactggcata ttgatggctt aaaggactcc 780 gacatttgca tcacgacccg tgaactggca cgttggctga aagcggagaa cattgacttc 840 aataccctgg atgatggtat ttttgatagc cacctgggcg aggcgagcgg tggtggcatc 900 atcttcggca gcaccggtgg tgtcatggag tccgcactgc gcagcgcgta ttacttctat 960 accggtaaac cgatgccagc ggagtatata ccgtatgaac cggtgcgtgg cttggacggc 1020 gttaaagagg cgaccatcga cttcagcggt atctctctgc atgtcgcagt cgtgagcggt 1080 ctcggcaatg cgcgtcgttt tctggataaa attatggcgg acggcacctt caaagattac 1140 acctttatcg agttcatggc gtgccagggt ggctgcatca acggtggtgg ccaaccgaag 1200 gttaagatgc ctctggttca gaaaaccaac caggctcgca tgaatagctt gtacaaacgt 1260 gattcggagg tttcgattaa ggccgcctgg gaaaaccccg aaatccagga actctacagc 1320 gacttctacg gccagccgct gtctgagcgc tctgagaagt atattcacac cttctttgag 1380 gataagtccg gcaacctggg tgaaggtggt gctgtgaccc cgcaaacgaa cccattgtct 1440 ccgaagtata agccgattga atagggatcc 1470 <210> 25 <211> 1482 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised nucleic acid sequence encoding HydA (Hyd1) from Veillonella parvula, 5' - 3' <400> 25 cccgggatgt caaaatatca atttttagat agaagggtcc cgattgagga cggtaacatc 60 gctctggttc aggatttgac taagtgcaaa aattgtagcc tgtgtcgtaa agcttgcgcg 120 gtcgatatgg gcgtctttga ctactatgat ctgaccacga atggtgacca cccgatttgc 180 atccactgcg gtcaatgtgc gtccatctgc ccattcgatt ctattaatga acgcagcgag 240 atcgatgaag ttaaggcggc gattgcggac ccgaacaaaa tcgtcatctt ccagaccgca 300 ccggctgtgc gtgtgggtct tggcgaggag ttcggcttgg aggcgggtac ctttgtggaa 360 ggcaagatgg ttgcagccct gagaaagctg ggcggtgact acattctgga caccaacttt 420 ggtgcggaca tgaccatcat ggaagaggcg tccgagttgc tggaacgtgt tatcaactcg 480 gatgctgttc tgccgcaatt taccagctgt tgtccggcgt gggttaagtt cgcggagaca 540 ttctacccgg agttcctgcc taacctgagc accgcgaagt ccccgattgc catgcaggca 600 ccgacccaga aaacctattt cgccgaaaaa atgggtctgg acgcgaagca gattgtggcg 660 gtggccgtaa ctccgtgtac tgccaagaaa tttgagattc gccgtgacga aatgaacagc 720 agcgcagagt attggaatac cccagaaatg cgtgataccg attactgcat caccacgcgt 780 gagctggcaa agtggctgcg cgcagaagaa atcaactttg acgacctcga ggacagcgca 840 tttgatccgc tgatgggtga ggctagcggt ggcggtatta tttttggcaa caccggcggc 900 gttatggaag ctgccatgcg cgcggcgtat aaaatggcaa ccggtgaaga tgccccccaa 960 acccttatcc cattcgaggc catcagaggc atggatggtg cgcgcgaagc tgatgttgtg 1020 atcggtgaca agaccctgca cgttgcggcg gtgcatggta cgggcaattt acgtaaattc 1080 attgagcgca tgcgtgcgga gaacatccac tacgacttca tcgaggtgat ggcatgccgt 1140 ggtgggtgca tcggcggcgg tggccaaccg cgtgttaaat tgccgatggc cgacaaagcg 1200 cgcgaagctc gtatcgcgtc tctatacacc cgtgacgcag aagtgactgt aaaggccgcg 1260 tgcgataatc cggatattca gaaattatat gcagagtttt tcgacggcaa accgatgagc 1320 cataaagcac atcacatgct gcataccacg ttcgtgaatc gtagcgaaga tttgggtccg 1380 aacggtgcgt gcaccccggc gacgtgcccg accagtgttc cgaacctgaa aaaggctgct 1440 gaagcggcga aggcggcggc tgaagttaac tcttagggat cc 1482 <210> 26 <211> 1443 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised nucleic acid sequence encoding HydA (Hyd1) from Veillonella atypica, 5' - 3' <400> 26 cccgggatgt cacaatttga atttatagat aaaagggtcc ctattgcgct cgacaacccg 60 agcatctatc acgatatctc caaatgcaaa aactgcacct tatgccgtcg tgcgtgcgcc 120 gacgtgatga gcgttctgga ctactacgat ctggaagcga ccggtgacgt gccagtttgt 180 attcattgtg gacaatgtgc agcggcgtgc ccgtttgact cgatgcatgc aaaaagcgaa 240 ttggataagg tgaaggtggc tattgccgat ccggataaaa tcgtcgttat tcagaccgct 300 ccggctgtac gcgtgtcgat tggcgagggt ttcggctttg aaccgggtac gtttctcgag 360 ggcaaaatgg ttagcgcgct gcgtaaactg ggtgccgact acgtggtcga cacgaacttc 420 ggcgcggatc tgaccattat ggaggaggcg tctgaattgg ttgatcgtct gaagaacggt 480 ggcacgatcc cgcaattcac cagttgctgc ccggcttggg ttcgttttgc ggaaatctac 540 ttcccggagt tgatcccaaa tctgtctagc acccgtagct gcatcgcaat ggaggccgct 600 atgattaaaa cctatttcgc tgagaaaaag ggtattaacc cggcgaatat cgtgtccgtc 660 tccgttaatc cgtgtactgc gaagaaggct gagacaaagc gcgtggaaga aaatgctgcc 720 gcgcgttatt acgacgacga atcccttggc atggataccg acatcagcat taccaccaga 780 gaatttatcc gttggctgaa cgacgaaggc gtggacttcg agtccctgga ggacagccag 840 tttgatgatc ttatcggtat ggaaactggc gcgtctatca tttttggtaa taccggtggc 900 gttatggagg ctgctatgag aacggcgtac aaactgatta cggataagga gccgccaccg 960 tatgcactga cccacctgga ggatgtgcgc ggtatgaacg gtgtgaaaga ggcgacggtt 1020 cagctgggtg atgacgtgac tctgagcgtt gcggtggttc acggcggtaa gaacacccgt 1080 gattttttga atgcgctgaa ggagaacggc aagcactatg acttcatcga agtcatggca 1140 tgtccgggtg ggtgcattgg tggcggtggc caaccgcgta ccaaactgcc gcaggcggtt 1200 aagaccaaag aggcgcgtat cggcggtctg tacaaggcgg acgaagaata taagtacgtt 1260 gccagctatg aatcaccgga aatccaagag ttgtacaaga acttcttggg agaacctctg 1320 ggtcacaaag cacatgaatt gctgcatacc cacttcaccg atcgcagcgc acagttaggc 1380 gaccgcaaag atgttgtccc ggagacctgt ccgaccagcc cgaaatacaa gggttaggga 1440 tcc 1443 <210> 27 <211> 1413 <212> DNA <213> Artificial Sequence <220> <223> Codon optimised nucleic acid sequence encoding HydA (Hyd1) from Peptoclostridium bifermentans, 5' - 3' <400> 27 cccgggatga agcacctatt tacagaaaaa gtagttccga tcgagctgga taacccgtcc 60 attcagattg actttgataa gtgcatcaag tgcggtctgt gtaaacgcgt ttgtgaaaac 120 gagattggtg ttaatggtta tttcgacctg gagaagaccg gtgacatcgc catctgcatc 180 aactgcggcc aatgtgttca ggcatgtcca aaaaaggcga tcacccaggt tatcgatgtg 240 gatcgcgtga aggaagcgat caacgatccg gaaaagattg ttatcttcag cacagcgcca 300 gctgtgcgtg tcgcactggg cgaagaattt aacctggaag aaggcgcgta tgttgaggac 360 aaaatggtgg acgccctgcg taaactgggt ggagattacg tttttgacgt tacctttggc 420 gccgatatga ccatcatgga agaggcgaac gaacttgttt ctcgtatcaa aaacggcaaa 480 ggcaaaaccc cgcaatttac cagctgctgc ccgtcctggg ttaagttcgc ggaaacgttc 540 tatccggagt tgattccgaa tctgtctacc acgaaatctc cgattggcat tcagggtgct 600 gtcatcaaga cctatttcgc acagaaagca aatatcgacc cggagaaaat cgtgaacgta 660 accattactc cgtgcaccgc taagaagtac gaaattgacc gtccggagat gaatgcgagc 720 gcaaaataca acaaaagcga aaatatgaga gataatgaca tcatcctcac cactaaggag 780 ctggcgcagt ggctccgtga cgaagagatc gacttcaacg ctttggaggg ctcgaaattt 840 gacaacatct tgggcttggg tagcggtgcg ggcattatct tcggtaatag cggtggtgtg 900 atggaagccg cggtgcgcac ggtctacaat atcctcaccc atgagaaccc acataaagaa 960 ctgctgcact ttaatccggt tcgtggtctg gaagacgtga aggaggctac ccttaccatt 1020 ggcgatacca ccctgcgcct ggcagcggtg caaggcacgg cgaacgtgcg tacgttgatc 1080 gaaaagctga aatccggtga ggtggagtac gacttcatag aggtaatgac ttgcaaaggt 1140 ggttgtattg gtggcgctgg tcaaccgaag atgaaagcgc gtattagcaa tgagatgcgt 1200 ctcaagcgca ttgagggtct gtacgataag gacaagcaca ttgcggtcaa atgcagctat 1260 gaaaacccgg atgtcatcaa cgtgtacaag gagttcttca aacaaccgct gagccattta 1320 tcccacgagt tgctgcacac cacctttgaa agcaagcacg atatgttggg tctgaaggat 1380 gacaacaacg tttcggatat tggctaggga tcc 1413 <210> 28 <211> 83 <212> DNA <213> E. coli <400> 28 ggtaaatttg atgtacatca aatggatccc cttgctgaat cgttaaggta ggcggtaata 60 gaaaagaaat cgaggcaaaa atg 83 <210> 29 <211> 52 <212> DNA <213> E. coli <400> 29 ctcttgatcg ttatcaaatc ccaatactgt gttagagagt ataatgccct ta 52 <210> 30 <211> 8797 <212> DNA <213> Artificial Sequence <220> <223> Exemplary HPGC (hydrogen producing gene cluster) with alternative codon optimised nucleic acid sequence encoding HydA from Chlamydomonas reinhardtii, 5' - 3' <400> 30 ctagagggct ttacacttta tgcttccggc tcgtatgttg tgtggaaaga aggagatata 60 catatggcga tgcgttccac atttgctgcg cgtgtcggtg ccaaaccggc agtgcgtggg 120 gcgcgtcccg cgtcgcgtat gtcttgcatg gcctataagg ttacactgaa aacgccatca 180 ggcgataaaa caatcgaatg tccggcggac acctatatcc tggatgctgc ggaggaagcc 240 gggctggacc ttccctatag ttgccgtgcg ggcgcctgtt catcctgtgc tggcaaagtg 300 gcagctggaa cggtagatca atctgatcag tcctttctgg atgacgctca gatggggaac 360 ggattcgtcc tgacatgtgt cgcgtatcct acaagcgact gcactatcca aactcaccaa 420 gaggaggctt tatattaaaa gaaggagata tacatatgca aactgttcgc gctccagcag 480 cttcaggtgt tgccacacgt gtcgcaggtc gtcgtatgtg tcgtccggtt gcggcgacga 540 aggcttccac ggctgttacc acagacatgt cgaagcgcac tgttccaacc aagttagagg 600 aaggtgaaat gccgttgaac acgtacagta ataaagctcc gttcaaggca aaggttcgtt 660 ccgtggaaaa aatcacagga ccaaaagcca caggtgagac gtgccacatc attattgaaa 720 ccgaggggaa gatcccgttt tgggagggac aatcgtacgg tgtaattccg ccggggacca 780 agatcaactc taagggaaaa gaagtgcctc atggtactcg tctttattcg attgcttcta 840 gtcgttacgg agatgacttc gatggtcaaa cggcatcgct gtgtgttcgc cgcgcggtat 900 acgtcgatcc agagactgga aaggaggacc ccgcgaaaaa aggactgtgt agtaactttt 960 tgtgtgatgc cacaccaggc acggaaattt ccatgacagg gcccacagga aaagtattgc 1020 ttctgccagc agacgcgaac gcgccattaa tctgtgtcgc aacggggact ggaatcgcgc 1080 cttttcgctc attctggcgc cgttgcttca tcgagaatgt cccaagttat aagttcactg 1140 gccttttctg gttgtttatg ggtgtcgcta actctgatgc taaattgtac gatgaggaac 1200 tgcaagctat cgcaaaagcg tatccgggac aattccgcct ggactatgcc ttgtctcgtg 1260 aacaaaataa tcgcaagggc gggaaaatgt acatccaaga taaggttgaa gagtatgccg 1320 acgaaatttt cgatttattg gataatgggg cgcacatgta cttctgcggg ttaaagggga 1380 tgatgccagg catccaagat atgttagaac gcgttgcaaa agaaaagggg ctgaactacg 1440 aagagtgggt cgaggggtta aagcacaaga atcaatggca tgttgaagtc tactaaccag 1500 gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta tctgttgttt 1560 gtcggtgaac gctctctact agagtcacac tggctcacct tcgggtgggc ctttctgcgt 1620 ttatatacta gagggcttta cactttatgc ttccggctcg tatgttgtgt ggaaagaagg 1680 agatatacat atgtccgcat tagtacttaa gcccgggatg tccgcattag ttctgaagcc 1740 atgtgcggcg gtcagtatcc gcggaagcag ctgccgcgcc cgtcaagtcg cgccgcgcgc 1800 gccgttagca gcgtctacag ttcgtgttgc attagcaaca cttgaagctc ctgcgcgtcg 1860 cctgggcaac gtcgcttgtg cagcagcggc tccggcggcg gaggcccctt tgagccacgt 1920 ccaacaagcc ttagctgaat tggccaaacc gaaagatgac cccacacgca agcatgtttg 1980 tgtgcaagtc gccccagcgg tccgcgtcgc tattgccgaa acacttggac ttgctcccgg 2040 tgccacgacc ccgaagcaat tggcggaggg cttacgccgt ctgggtttcg acgaagtatt 2100 cgacacgctt ttcggggcag atttgacaat tatggaagaa gggtcagagt tgttgcatcg 2160 tttaacggaa catttggagg ctcaccctca ctctgacgaa ccgttgccca tgtttacctc 2220 gtgttgtccg ggttggattg cgatgcttga gaaatcgtac ccggatttaa ttccttatgt 2280 gtcctcgtgc aaatctcctc aaatgatgtt agccgcgatg gtgaagtcat atcttgccga 2340 aaagaagggc atcgcaccta aagacatggt gatggtgtca atcatgcctt gcacccgtaa 2400 gcagtccgag gccgatcgcg actggttttg tgtggatgct gaccctacat tacgccagtt 2460 agatcatgtt attacaaccg tagagttggg taacatcttt aaggagcgtg gtatcaattt 2520 ggctgagtta ccggaaggtg aatgggacaa cccgatgggg gtgggttcgg gagccggagt 2580 attatttggg accactggcg gcgtaatgga ggcagcatta cgtacggcct acgaactgtt 2640 cacaggtacc ccgctgcctc gcctgagttt gagcgaggtg cgtggtatgg acggtattaa 2700 ggaaacgaac atcacaatgg ttcctgctcc cggttcaaaa ttcgaggaac tgttgaagca 2760 tcgcgctgcc gcacgtgcag aagcagccgc acacggtact cctggtccac ttgcctggga 2820 cggcggggcc ggatttactt cagaagacgg tcgtggtgga attactttac gtgtcgctgt 2880 tgcgaatggg ctgggtaacg ctaaaaagtt aattacaaaa atgcaggccg gagaggcaaa 2940 atatgatttc gtagagatta tggcctgtcc cgctggttgc gtaggaggtg ggggccagcc 3000 ccgttcaact gacaaagcta tcacgcagaa acgtcaagcg gcattataca atctggatga 3060 aaaatcaacg cttcgccgtt cacatgagaa tccatcaatc cgtgaattgt acgatactta 3120 tttaggtgag cctctggggc ataaggcaca cgaacttctg catactcatt acgtcgcggg 3180 tggagttgag gagaaggatg aaaagaagta gggatccggg tcgaggagaa ggatgagaaa 3240 aagtgaccag gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta 3300 tctgttgttt gtcggtgaac gctctctact agagtcacac tggctcacct tcgggtgggc 3360 ctttctgcgt ttatatacta gagggcttta cactttatgc ttccggctcg tatgttgtgt 3420 ggaaagaagg agatatacat atggctcata gtttaagcgc acattcccgt caggccggag 3480 atcgcaaact gggcgcaggt gcggcatcta gccgcccatc atgtccttct cgccgcattg 3540 tccgcgtggc ggcccatgct tctgcgtcca aggcgactcc cgatgtacct gttgacgatc 3600 ttcctcctgc gcatgcccgt gcagcagtag cggccgctaa ccgtcgtgcg cgcgctatgg 3660 catcagcgga ggccgcggca gagaccctgg gcgatttcct gggcttaggg aagggggggc 3720 tttcgccggg cgcaaccgcc aaccttgatc gtgagcaagt attaggtgtg ttggaggcgg 3780 tctggcgtcg tggagacctt aatctggagc gtgcgttgta cagccatgcc aatgcggtga 3840 ctaacaaata ctgtggtggg ggggtctact atcgcggcct tgtggagttc agtaatattt 3900 gccaaaacga ttgctcatat tgtgggattc gcaacaatca aaaagaagtt tggcgctata 3960 ctatgccggt tgaagaggtg gtcgaggtag ctaagtgggc gcttgaaaac ggcattcgca 4020 acattatgtt gcaagggggt gaattaaaga cagagcaacg cttagcctac ttggaggcat 4080 gcgtccgtgc gattcgcgag gagacaacgc agttagacct tgaaatgcgc gcacgtgccg 4140 cgagtacgac aacagcggaa gcggcagcca gtgcacaggc agacgccgaa gctaaacgcg 4200 gcgagccaga attgggtgtg gtcgtatcct taagcgtcgg agaacttcct atggaacagt 4260 atgagcgttt gttccgcgcc ggcgcccgtc gctatctgat ccgcattgaa acctcgaatc 4320 ccgacctgta cgcggcactt cacccggagc cgatgtcctg gcacgcgcgt gtagaatgcc 4380 tgcgcaacct gaagaaagct gggtatatgt tgggcacagg agtgatggtc ggcttgccgg 4440 gacaaacctt acacgacctg gctggggatg tcatgttctt tcgcgacatt aaagcggaca 4500 tgatcggtat gggccccttc attacgcagc ctgggacgcc tgcaactgat aagtggaccg 4560 cgctgtatcc gaacgccaat aagaacagcc acatgaaatc tatgttcgat ctgaccactg 4620 ctatgaatgc acttgtacgt attacgatgg ggaacgtaaa tatcagtgct acgactgcat 4680 tacaagcgat tatccccact ggacgtgaaa ttgcgcttga gcgcggcgca aatgttgtca 4740 tgcctatttt aacgcctact cagtatcgcg agtcctatca gttatatgag ggtaagccct 4800 gcattacgga tactgctgtt cagtgtcgtc gttgcctgga catgcgtttg cactccgttg 4860 gcaaaacgtc tgcggccgga gtttggggcg atcctgcttc gttcttgcat cccatcgttg 4920 gcgtcccagt cccgcacgac ttgtcatcac ctgctttggc cgctgctgca agtgcggatt 4980 ttcacgaggt tggcgcaggt ccctggaacc ccatccgact agagcgtctg gttgaagtgc 5040 cggaccgtta ccctgacccc gataaccacg gacgcaaaaa ggcaggagcc gggaaaggag 5100 gcaaggcgca tgactctcac gacgatggcg atcacgacga ccaccaccac caccacggag 5160 ctgcccccgc gggtgcagcg gctggaaagg gtaccggtgc agctgcaatt ggtggcggag 5220 cgggggctag ccgtcaacgc gtagcagggg ctgctgccgc ctctgctcgt ctgtgtgcgg 5280 gagctcgccg cgctggccgt gttgtcgcgt cgccattgcg cccagctgcc gcttgccgtg 5340 gtgtggccgt caaggccgca gctgctgctg cgggtgaaga cgctggtgct ggtacgtctg 5400 gcgtaggttc aaatattgtt acgtctcccg gaatcgctag cactacggca catggtgttc 5460 ctcgtatcaa tattggggtg ttcggcgtga tgaatgcagg aaagtctaca cttgtgaatg 5520 ctctggcgca acaggaagca tgcattgttg actcaacccc cggcacgacc gcagatgtaa 5580 aaacagtttt gcttgagctt catgcccttg gaccagccaa gttgctggac acagccggat 5640 tagacgaagt cggtggactt ggggataaaa agcgccgtaa agccctgaat acgctgaagg 5700 agtgcgatgt tgctgtgctg gttgttgaca ctgatacggc agccgccgca atcaaatcgg 5760 gacgccttgc tgaagccctg gaatgggaat cgaaagtaat ggaacaggca cacaagtata 5820 atgtcagtcc tgtactgctt ctgaatgtaa aatcacgcgg gctgcctgaa gcgcaggcag 5880 ctagcatgct tgaggcggtc gctggtatgc ttgacccatc caagcaaatc cctcgtatgt 5940 cgctggattt agcgtccacc cccctgcacg agcgtagtac gattacgtct gcattcgtca 6000 aggaaggagc agtgcgcagt tcacgctatg gggctcctct gccggggtgt ttgccccgtt 6060 ggtctcttgg acgcaacgcc cgcttactga tggtaatccc gatggatgcc gaaaccccag 6120 gtggacgtct tcttcgtcct caagcgcaag ttatggagga agcaatccgc cattgggcta 6180 ccgtgctttc cgtacgcctg gatttagacg ccgcacgtgg caaattgggg cccgaggcct 6240 gtgagatgga gcgtcagcgt ttcgacgggg taattgctat gatggaacgt aatgacggac 6300 ccaccctggt ggtgacagat tctcaagcga tcgatgttgt acacccttgg accctggacc 6360 gctcatcagg acgtccgttg gttccaatta ctacctttag catcgctatg gcgtaccaac 6420 aaaacggcgg acgtttggac ccgtttgtgg aaggattgga agcattggag acgttacaag 6480 atggggatcg cgttcttatt tcggaagcgt gtaatcataa ccgtatcacc tccgcttgca 6540 acgacattgg aatggtgcag atccctaaca agctggaggc agcacttggc gggaaaaagt 6600 tacaaatcga acatgcgttt ggtcgcgagt ttcccgagct tgagagtggg ggtatggatg 6660 gattgaagtt agcgatccat tgtggagggt gtatgatcga cgctcagaaa atgcagcagc 6720 gtatgaaaga cttgcatgag gctggggtgc cggtcactaa ttatggggtg tttttctctt 6780 gggcagcttg gcccgacgcc cttcgtcgcg cattggaacc gtggggagtg gagccaccgg 6840 taggtactcc tgctaccccc gcagccgcgc ctgctacggc agcgtccggg gtataatact 6900 actagagggc tttacacttt atgcttccgg ctcgtatgtt gtgtggaaag aaggagatat 6960 acatatgtcg gtccccctac agtgcaatgc aggccgtctt ttggcgggcc agcgcccctg 7020 cggcgtccgc gcgcgtctga accgccgtgt atgtgttcca gtgaccgcac acggcaaagc 7080 atctgccacg cgcgaatacg ctggtgactt tcttccaggg accactatta gtcatgcgtg 7140 gtccgtggag cgtgaaactc atcaccgtta tcgtaatccg gccgagtgga ttaacgaggc 7200 tgccatccac aaggcgcttg aaacgtcaaa ggctgatgct caggacgcag gacgcgtgcg 7260 tgagattttg gcgaaggcta aggaaaaggc ttttgttact gaacatgcgc ctgtaaatgc 7320 ggaaagtaaa tccgaatttg tacaagggct taccttggag gagtgcgcca ccttaattaa 7380 cgttgattct aataatgtcg agttgatgaa tgaaatcttc gacactgcgc ttgctatcaa 7440 agaacgtatc tacgggaacc gcgtcgtgct gttcgcgccc ttgtacattg ctaatcattg 7500 tatgaacact tgcacttatt gtgcgtttcg ctcagccaat aagggcatgg aacgctctat 7560 tctgacagac gatgacctgc gtgaagaagt tgccgccttg caacgtcaag gtcatcgccg 7620 cattttagcc cttactggag aacatcctaa atacactttc gacaatttct tgcatgcagt 7680 caatgtaatc gcttccgtga agacagagcc tgaagggtcc attcgccgta tcaatgtcga 7740 aatcccacca cttagtgtct cagacatgcg ccgccttaag aatacagatt cagttggcac 7800 gttcgttctg tttcaagaga catatcaccg cgacacattc aaggtaatgc atccgtcagg 7860 tccaaagagc gactttgatt ttcgcgtctt gacccaggac cgcgccatgc gcgcaggctt 7920 ggacgatgtt ggtattggtg ctttattcgg gttatatgat taccgttatg aagtttgcgc 7980 catgttaatg catagcgagc atttggaacg tgagtacaac gcaggaccac atactatctc 8040 tgttccccgt atgcgccccg cggacggaag cgagcttagt atcgcgcctc cttatcctgt 8100 taatgatgct gattttatga aattagttgc ggtccttcgt attgctgtac catacacagg 8160 tatgatcctt agcactcgtg aatcaccaga aatgcgctcg gcgcttctga agtgtgggat 8220 gagtcaaatg agtgccggct cgcgcactga tgtaggagcc tatcacaaag atcacacgtt 8280 aagtacagag gcgaatttga gtaagttagc tgggcagttt accttgcagg atgaacgtcc 8340 aactaatgag attgttaagt ggctgatgga ggagggctat gtcccgtctt ggtgcacagc 8400 ttgttaccgt caaggtcgta cgggcgaaga cttcatgaac atctgtaagg ctggtgacat 8460 tcacgatttc tgtcatccca atagtctgct tacgcttcaa gagtacctta tggattatgc 8520 agatccagac cttcgtaaga aaggcgagca agtaattgcc cgtgagatgg gaccggacgc 8580 ctctgagccg ttatcggcgc aaagccgtaa gcgccttgaa cgcaagatga aacaagtatt 8640 ggagggggag cacgatgtat atctttaacc aggcatcaaa taaaacgaaa ggctcagtcg 8700 aaagactggg cctttcgttt tatctgttgt ttgtcggtga acgctctcta ctagagtcac 8760 actggctcac cttcgggtgg gcctttctgc gtttata 8797 <210> 31 <211> 8557 <212> DNA <213> Artificial Sequence <220> <223> Exemplary HPGC (hydrogen producing gene cluster) with codon optimised nucleic acid sequence encoding HydA (Hyd1) from Volvox carteri, 5' - 3' <400> 31 ctagagggct ttacacttta tgcttccggc tcgtatgttg tgtggaaaga aggagatata 60 catatggcga tgcgttccac atttgctgcg cgtgtcggtg ccaaaccggc agtgcgtggg 120 gcgcgtcccg cgtcgcgtat gtcttgcatg gcctataagg ttacactgaa aacgccatca 180 ggcgataaaa caatcgaatg tccggcggac acctatatcc tggatgctgc ggaggaagcc 240 gggctggacc ttccctatag ttgccgtgcg ggcgcctgtt catcctgtgc tggcaaagtg 300 gcagctggaa cggtagatca atctgatcag tcctttctgg atgacgctca gatggggaac 360 ggattcgtcc tgacatgtgt cgcgtatcct acaagcgact gcactatcca aactcaccaa 420 gaggaggctt tatattaaaa gaaggagata tacatatgca aactgttcgc gctccagcag 480 cttcaggtgt tgccacacgt gtcgcaggtc gtcgtatgtg tcgtccggtt gcggcgacga 540 aggcttccac ggctgttacc acagacatgt cgaagcgcac tgttccaacc aagttagagg 600 aaggtgaaat gccgttgaac acgtacagta ataaagctcc gttcaaggca aaggttcgtt 660 ccgtggaaaa aatcacagga ccaaaagcca caggtgagac gtgccacatc attattgaaa 720 ccgaggggaa gatcccgttt tgggagggac aatcgtacgg tgtaattccg ccggggacca 780 agatcaactc taagggaaaa gaagtgcctc atggtactcg tctttattcg attgcttcta 840 gtcgttacgg agatgacttc gatggtcaaa cggcatcgct gtgtgttcgc cgcgcggtat 900 acgtcgatcc agagactgga aaggaggacc ccgcgaaaaa aggactgtgt agtaactttt 960 tgtgtgatgc cacaccaggc acggaaattt ccatgacagg gcccacagga aaagtattgc 1020 ttctgccagc agacgcgaac gcgccattaa tctgtgtcgc aacggggact ggaatcgcgc 1080 cttttcgctc attctggcgc cgttgcttca tcgagaatgt cccaagttat aagttcactg 1140 gccttttctg gttgtttatg ggtgtcgcta actctgatgc taaattgtac gatgaggaac 1200 tgcaagctat cgcaaaagcg tatccgggac aattccgcct ggactatgcc ttgtctcgtg 1260 aacaaaataa tcgcaagggc gggaaaatgt acatccaaga taaggttgaa gagtatgccg 1320 acgaaatttt cgatttattg gataatgggg cgcacatgta cttctgcggg ttaaagggga 1380 tgatgccagg catccaagat atgttagaac gcgttgcaaa agaaaagggg ctgaactacg 1440 aagagtgggt cgaggggtta aagcacaaga atcaatggca tgttgaagtc tactaaccag 1500 gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta tctgttgttt 1560 gtcggtgaac gctctctact agagtcacac tggctcacct tcgggtgggc ctttctgcgt 1620 ttatatacta gagggcttta cactttatgc ttccggctcg tatgttgtgt ggaaagaagg 1680 agatatacat atgtccgcat tagtacttaa gcccgggatg tacgtttgcg tcgcacaagt 1740 tacgttacat gattgcttag catgctcagg gtgcatcaca tctgcggaaa cggttttgct 1800 tcagcaacag tccggggatg agttcttatc ccgcttggca gacccgcaca ctactgtcgt 1860 agttaccgtc tcgccccaat cgcgcacagc tttggcggct tactatggat tatgcccgtc 1920 tcaggctctt gcccgccttg tgggctggtt gaagtggctt ggggttcgcg ccgtatggga 1980 tctgacaaca gcccgcgatc ttgtattgtt ggaagaggca gctgagttca tgaaccgttg 2040 ggtctgcatg tatgttagcg ccgggcctct tccggtcatg ggcagttcat gtcctggcac 2100 aggctgggtt tgttatgctg aaaagacgca cgggacgcgt gtattaccct atttgagcac 2160 cacccgttca ccccaaggag caatgggtgg cttggtaaag tccctggtgg cagcagcttg 2220 gggcgttact ccagggtctt tgtaccacgt cacaattatg ccgtgttatg acaagaaatt 2280 ggaagcatct cgcgatgaat taaccacaac ggcgacaact actaccgctg cggggacaga 2340 cgcggctgga gcaggtgccg ccgtaggcgg gcctctgcct gaagtgatgg tccgtcatgc 2400 aaccgcagcg cctgatccgt tgcttccggg cgtggtacca gccgacgacc agctgtactc 2460 ccttccacat ggctccagct cgggtggata cgcggacttc gttttccgca ctgccgcgcg 2520 cgagttgtgg ggggtagaag ttccgccagg acctttacca tggcgtactc gtcgtaacgc 2580 cgacttacag cctcgtgttg gtgccccagg ccaatctctg gtcgttgcgc gtgtgtatgg 2640 attccgcaat attcagacac ttttacagca gcttaagcgt ggacgctgcc cttatcatta 2700 tgtggaagtc atggcttgtc ctagcgggtg tttgaacgga ggaggacaaa tcaaaccggg 2760 gccaggggta acgccgcaac aattaattga acaattggag cttttgtatg acgttgcggc 2820 acgttctcca gcagacaacc cggcggtagc agctttatat ggctcttggt taggcggtcg 2880 tccaggggca ccccccgctc gtcaactgtt acatacgaca tttcgcgagc gcgaaaagac 2940 tgtaactgcc gcaaccgtca cgaattggta gggatccggg tcgaggagaa ggatgagaaa 3000 aagtgaccag gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta 3060 tctgttgttt gtcggtgaac gctctctact agagtcacac tggctcacct tcgggtgggc 3120 ctttctgcgt ttatatacta gagggcttta cactttatgc ttccggctcg tatgttgtgt 3180 ggaaagaagg agatatacat atggctcata gtttaagcgc acattcccgt caggccggag 3240 atcgcaaact gggcgcaggt gcggcatcta gccgcccatc atgtccttct cgccgcattg 3300 tccgcgtggc ggcccatgct tctgcgtcca aggcgactcc cgatgtacct gttgacgatc 3360 ttcctcctgc gcatgcccgt gcagcagtag cggccgctaa ccgtcgtgcg cgcgctatgg 3420 catcagcgga ggccgcggca gagaccctgg gcgatttcct gggcttaggg aagggggggc 3480 tttcgccggg cgcaaccgcc aaccttgatc gtgagcaagt attaggtgtg ttggaggcgg 3540 tctggcgtcg tggagacctt aatctggagc gtgcgttgta cagccatgcc aatgcggtga 3600 ctaacaaata ctgtggtggg ggggtctact atcgcggcct tgtggagttc agtaatattt 3660 gccaaaacga ttgctcatat tgtgggattc gcaacaatca aaaagaagtt tggcgctata 3720 ctatgccggt tgaagaggtg gtcgaggtag ctaagtgggc gcttgaaaac ggcattcgca 3780 acattatgtt gcaagggggt gaattaaaga cagagcaacg cttagcctac ttggaggcat 3840 gcgtccgtgc gattcgcgag gagacaacgc agttagacct tgaaatgcgc gcacgtgccg 3900 cgagtacgac aacagcggaa gcggcagcca gtgcacaggc agacgccgaa gctaaacgcg 3960 gcgagccaga attgggtgtg gtcgtatcct taagcgtcgg agaacttcct atggaacagt 4020 atgagcgttt gttccgcgcc ggcgcccgtc gctatctgat ccgcattgaa acctcgaatc 4080 ccgacctgta cgcggcactt cacccggagc cgatgtcctg gcacgcgcgt gtagaatgcc 4140 tgcgcaacct gaagaaagct gggtatatgt tgggcacagg agtgatggtc ggcttgccgg 4200 gacaaacctt acacgacctg gctggggatg tcatgttctt tcgcgacatt aaagcggaca 4260 tgatcggtat gggccccttc attacgcagc ctgggacgcc tgcaactgat aagtggaccg 4320 cgctgtatcc gaacgccaat aagaacagcc acatgaaatc tatgttcgat ctgaccactg 4380 ctatgaatgc acttgtacgt attacgatgg ggaacgtaaa tatcagtgct acgactgcat 4440 tacaagcgat tatccccact ggacgtgaaa ttgcgcttga gcgcggcgca aatgttgtca 4500 tgcctatttt aacgcctact cagtatcgcg agtcctatca gttatatgag ggtaagccct 4560 gcattacgga tactgctgtt cagtgtcgtc gttgcctgga catgcgtttg cactccgttg 4620 gcaaaacgtc tgcggccgga gtttggggcg atcctgcttc gttcttgcat cccatcgttg 4680 gcgtcccagt cccgcacgac ttgtcatcac ctgctttggc cgctgctgca agtgcggatt 4740 ttcacgaggt tggcgcaggt ccctggaacc ccatccgact agagcgtctg gttgaagtgc 4800 cggaccgtta ccctgacccc gataaccacg gacgcaaaaa ggcaggagcc gggaaaggag 4860 gcaaggcgca tgactctcac gacgatggcg atcacgacga ccaccaccac caccacggag 4920 ctgcccccgc gggtgcagcg gctggaaagg gtaccggtgc agctgcaatt ggtggcggag 4980 cgggggctag ccgtcaacgc gtagcagggg ctgctgccgc ctctgctcgt ctgtgtgcgg 5040 gagctcgccg cgctggccgt gttgtcgcgt cgccattgcg cccagctgcc gcttgccgtg 5100 gtgtggccgt caaggccgca gctgctgctg cgggtgaaga cgctggtgct ggtacgtctg 5160 gcgtaggttc aaatattgtt acgtctcccg gaatcgctag cactacggca catggtgttc 5220 ctcgtatcaa tattggggtg ttcggcgtga tgaatgcagg aaagtctaca cttgtgaatg 5280 ctctggcgca acaggaagca tgcattgttg actcaacccc cggcacgacc gcagatgtaa 5340 aaacagtttt gcttgagctt catgcccttg gaccagccaa gttgctggac acagccggat 5400 tagacgaagt cggtggactt ggggataaaa agcgccgtaa agccctgaat acgctgaagg 5460 agtgcgatgt tgctgtgctg gttgttgaca ctgatacggc agccgccgca atcaaatcgg 5520 gacgccttgc tgaagccctg gaatgggaat cgaaagtaat ggaacaggca cacaagtata 5580 atgtcagtcc tgtactgctt ctgaatgtaa aatcacgcgg gctgcctgaa gcgcaggcag 5640 ctagcatgct tgaggcggtc gctggtatgc ttgacccatc caagcaaatc cctcgtatgt 5700 cgctggattt agcgtccacc cccctgcacg agcgtagtac gattacgtct gcattcgtca 5760 aggaaggagc agtgcgcagt tcacgctatg gggctcctct gccggggtgt ttgccccgtt 5820 ggtctcttgg acgcaacgcc cgcttactga tggtaatccc gatggatgcc gaaaccccag 5880 gtggacgtct tcttcgtcct caagcgcaag ttatggagga agcaatccgc cattgggcta 5940 ccgtgctttc cgtacgcctg gatttagacg ccgcacgtgg caaattgggg cccgaggcct 6000 gtgagatgga gcgtcagcgt ttcgacgggg taattgctat gatggaacgt aatgacggac 6060 ccaccctggt ggtgacagat tctcaagcga tcgatgttgt acacccttgg accctggacc 6120 gctcatcagg acgtccgttg gttccaatta ctacctttag catcgctatg gcgtaccaac 6180 aaaacggcgg acgtttggac ccgtttgtgg aaggattgga agcattggag acgttacaag 6240 atggggatcg cgttcttatt tcggaagcgt gtaatcataa ccgtatcacc tccgcttgca 6300 acgacattgg aatggtgcag atccctaaca agctggaggc agcacttggc gggaaaaagt 6360 tacaaatcga acatgcgttt ggtcgcgagt ttcccgagct tgagagtggg ggtatggatg 6420 gattgaagtt agcgatccat tgtggagggt gtatgatcga cgctcagaaa atgcagcagc 6480 gtatgaaaga cttgcatgag gctggggtgc cggtcactaa ttatggggtg tttttctctt 6540 gggcagcttg gcccgacgcc cttcgtcgcg cattggaacc gtggggagtg gagccaccgg 6600 taggtactcc tgctaccccc gcagccgcgc ctgctacggc agcgtccggg gtataatact 6660 actagagggc tttacacttt atgcttccgg ctcgtatgtt gtgtggaaag aaggagatat 6720 acatatgtcg gtccccctac agtgcaatgc aggccgtctt ttggcgggcc agcgcccctg 6780 cggcgtccgc gcgcgtctga accgccgtgt atgtgttcca gtgaccgcac acggcaaagc 6840 atctgccacg cgcgaatacg ctggtgactt tcttccaggg accactatta gtcatgcgtg 6900 gtccgtggag cgtgaaactc atcaccgtta tcgtaatccg gccgagtgga ttaacgaggc 6960 tgccatccac aaggcgcttg aaacgtcaaa ggctgatgct caggacgcag gacgcgtgcg 7020 tgagattttg gcgaaggcta aggaaaaggc ttttgttact gaacatgcgc ctgtaaatgc 7080 ggaaagtaaa tccgaatttg tacaagggct taccttggag gagtgcgcca ccttaattaa 7140 cgttgattct aataatgtcg agttgatgaa tgaaatcttc gacactgcgc ttgctatcaa 7200 agaacgtatc tacgggaacc gcgtcgtgct gttcgcgccc ttgtacattg ctaatcattg 7260 tatgaacact tgcacttatt gtgcgtttcg ctcagccaat aagggcatgg aacgctctat 7320 tctgacagac gatgacctgc gtgaagaagt tgccgccttg caacgtcaag gtcatcgccg 7380 cattttagcc cttactggag aacatcctaa atacactttc gacaatttct tgcatgcagt 7440 caatgtaatc gcttccgtga agacagagcc tgaagggtcc attcgccgta tcaatgtcga 7500 aatcccacca cttagtgtct cagacatgcg ccgccttaag aatacagatt cagttggcac 7560 gttcgttctg tttcaagaga catatcaccg cgacacattc aaggtaatgc atccgtcagg 7620 tccaaagagc gactttgatt ttcgcgtctt gacccaggac cgcgccatgc gcgcaggctt 7680 ggacgatgtt ggtattggtg ctttattcgg gttatatgat taccgttatg aagtttgcgc 7740 catgttaatg catagcgagc atttggaacg tgagtacaac gcaggaccac atactatctc 7800 tgttccccgt atgcgccccg cggacggaag cgagcttagt atcgcgcctc cttatcctgt 7860 taatgatgct gattttatga aattagttgc ggtccttcgt attgctgtac catacacagg 7920 tatgatcctt agcactcgtg aatcaccaga aatgcgctcg gcgcttctga agtgtgggat 7980 gagtcaaatg agtgccggct cgcgcactga tgtaggagcc tatcacaaag atcacacgtt 8040 aagtacagag gcgaatttga gtaagttagc tgggcagttt accttgcagg atgaacgtcc 8100 aactaatgag attgttaagt ggctgatgga ggagggctat gtcccgtctt ggtgcacagc 8160 ttgttaccgt caaggtcgta cgggcgaaga cttcatgaac atctgtaagg ctggtgacat 8220 tcacgatttc tgtcatccca atagtctgct tacgcttcaa gagtacctta tggattatgc 8280 agatccagac cttcgtaaga aaggcgagca agtaattgcc cgtgagatgg gaccggacgc 8340 ctctgagccg ttatcggcgc aaagccgtaa gcgccttgaa cgcaagatga aacaagtatt 8400 ggagggggag cacgatgtat atctttaacc aggcatcaaa taaaacgaaa ggctcagtcg 8460 aaagactggg cctttcgttt tatctgttgt ttgtcggtga acgctctcta ctagagtcac 8520 actggctcac cttcgggtgg gcctttctgc gtttata 8557 <210> 32 <211> 8728 <212> DNA <213> Artificial Sequence <220> <223> Exemplary HPGC (hydrogen producing gene cluster) with codon optimised nucleic acid sequence encoding HydA (Hyd1) from Giardia lamblia 5' - 3' <400> 32 ctagagggct ttacacttta tgcttccggc tcgtatgttg tgtggaaaga aggagatata 60 catatggcga tgcgttccac atttgctgcg cgtgtcggtg ccaaaccggc agtgcgtggg 120 gcgcgtcccg cgtcgcgtat gtcttgcatg gcctataagg ttacactgaa aacgccatca 180 ggcgataaaa caatcgaatg tccggcggac acctatatcc tggatgctgc ggaggaagcc 240 gggctggacc ttccctatag ttgccgtgcg ggcgcctgtt catcctgtgc tggcaaagtg 300 gcagctggaa cggtagatca atctgatcag tcctttctgg atgacgctca gatggggaac 360 ggattcgtcc tgacatgtgt cgcgtatcct acaagcgact gcactatcca aactcaccaa 420 gaggaggctt tatattaaaa gaaggagata tacatatgca aactgttcgc gctccagcag 480 cttcaggtgt tgccacacgt gtcgcaggtc gtcgtatgtg tcgtccggtt gcggcgacga 540 aggcttccac ggctgttacc acagacatgt cgaagcgcac tgttccaacc aagttagagg 600 aaggtgaaat gccgttgaac acgtacagta ataaagctcc gttcaaggca aaggttcgtt 660 ccgtggaaaa aatcacagga ccaaaagcca caggtgagac gtgccacatc attattgaaa 720 ccgaggggaa gatcccgttt tgggagggac aatcgtacgg tgtaattccg ccggggacca 780 agatcaactc taagggaaaa gaagtgcctc atggtactcg tctttattcg attgcttcta 840 gtcgttacgg agatgacttc gatggtcaaa cggcatcgct gtgtgttcgc cgcgcggtat 900 acgtcgatcc agagactgga aaggaggacc ccgcgaaaaa aggactgtgt agtaactttt 960 tgtgtgatgc cacaccaggc acggaaattt ccatgacagg gcccacagga aaagtattgc 1020 ttctgccagc agacgcgaac gcgccattaa tctgtgtcgc aacggggact ggaatcgcgc 1080 cttttcgctc attctggcgc cgttgcttca tcgagaatgt cccaagttat aagttcactg 1140 gccttttctg gttgtttatg ggtgtcgcta actctgatgc taaattgtac gatgaggaac 1200 tgcaagctat cgcaaaagcg tatccgggac aattccgcct ggactatgcc ttgtctcgtg 1260 aacaaaataa tcgcaagggc gggaaaatgt acatccaaga taaggttgaa gagtatgccg 1320 acgaaatttt cgatttattg gataatgggg cgcacatgta cttctgcggg ttaaagggga 1380 tgatgccagg catccaagat atgttagaac gcgttgcaaa agaaaagggg ctgaactacg 1440 aagagtgggt cgaggggtta aagcacaaga atcaatggca tgttgaagtc tactaaccag 1500 gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta tctgttgttt 1560 gtcggtgaac gctctctact agagtcacac tggctcacct tcgggtgggc ctttctgcgt 1620 ttatatacta gagggcttta cactttatgc ttccggctcg tatgttgtgt ggaaagaagg 1680 agatatacat atgtccgcat tagtacttaa gcccgggatg cctccaaaac cccaacacga 1740 tgtaacaggc gtggactcca ataacgcgat catgattgat tacgcaaagt gcattggctg 1800 caacatgtgc atcaaagcat gcgacgtgca aggtattggt gtttacaagc agaacgaaaa 1860 accgaagtac ccgcctatcg tgaagctgag caccctgttt aatagcgatt gtatcggctg 1920 cggtcaatgt gcaacgattt gtccggtgga cgcgattgct ccaaagaaca atctggaaat 1980 ttacaaaggc gaatctgctt ccaaaaaagt tcgtgtggcg ttgatcgcgc caagcactcg 2040 cgtggcgttt ggagatgtct tcgggctgcc gatcggtaca aataccattt actccctgat 2100 tcgcatgctg aagcaatatc tgggtttcga ttatgtgttc gacgtgaatt tcggcgcaga 2160 tgaaaccacc gtcatcgaca cccaagagct gttgcacttc aaacacgagg gccgtggtcc 2220 ggtgttcacc agctgctgcc cggcgtgggt taacctctgt gaaatgaagt acccggagct 2280 gctgccccag gttagcaccg ctaaatcttg tgttgcaatg gtagcgaccc ttgtaaaaag 2340 acgttgggtt caagaacatt taatcccgaa gggtattgta gacagcgttg acgatgtcta 2400 cgtggctgat attatgccgt gtaccgcgaa aaaggatgaa agcatgcgtc cacaactgaa 2460 ccgcgatgtg gacatctgcc tgacggtgcg tgaagttgcg gagcacctgt attttctgca 2520 cggcgcgcgc ttgacgctgg aggaagtcga ggcggatgcg ttggttttgc gtccgggccg 2580 tagcacgcag aaaaagtggg actttgacgc tccgtttaac accgtgtctg gtggctccca 2640 tatctttggt aagaccggtg gcgttgccga gacgtgtctc cgtttcatca gctatatgaa 2700 aaagtcgccg atagaaaacg ttaaggagga attgctgaaa gagttcaaga cgccgggtca 2760 gctggtgcaa accgttaagc tggtcagctg cgagatcgcc ggtgagactt atcgtgccct 2820 gattgcgcat ggcggttcag caatcaatgc cgccgcgcgt atggtgctca ataaagaggt 2880 ggagtgcgac gttgttgagc agatggcctg tccgggtggc tgccagaacg gtggaggcat 2940 gccgaagatc aagggtaaaa aagaggcagt tttgacgcgt gcgtctacct tggacatcct 3000 ggacggtaaa gagcgctttg cgagcgcggg cgagaacaaa actctgtggg gtttcaacgg 3060 ctgcttaacc gaacacgaag cgcacgagtt gcttcacacc cattatcagc atcgcccggt 3120 ggaatcgctg ctgccgcagt agggatccgg gtcgaggaga aggatgagaa aaagtgacca 3180 ggcatcaaat aaaacgaaag gctcagtcga aagactgggc ctttcgtttt atctgttgtt 3240 tgtcggtgaa cgctctctac tagagtcaca ctggctcacc ttcgggtggg cctttctgcg 3300 tttatatact agagggcttt acactttatg cttccggctc gtatgttgtg tggaaagaag 3360 gagatataca tatggctcat agtttaagcg cacattcccg tcaggccgga gatcgcaaac 3420 tgggcgcagg tgcggcatct agccgcccat catgtccttc tcgccgcatt gtccgcgtgg 3480 cggcccatgc ttctgcgtcc aaggcgactc ccgatgtacc tgttgacgat cttcctcctg 3540 cgcatgcccg tgcagcagta gcggccgcta accgtcgtgc gcgcgctatg gcatcagcgg 3600 aggccgcggc agagaccctg ggcgatttcc tgggcttagg gaaggggggg ctttcgccgg 3660 gcgcaaccgc caaccttgat cgtgagcaag tattaggtgt gttggaggcg gtctggcgtc 3720 gtggagacct taatctggag cgtgcgttgt acagccatgc caatgcggtg actaacaaat 3780 actgtggtgg gggggtctac tatcgcggcc ttgtggagtt cagtaatatt tgccaaaacg 3840 attgctcata ttgtgggatt cgcaacaatc aaaaagaagt ttggcgctat actatgccgg 3900 ttgaagaggt ggtcgaggta gctaagtggg cgcttgaaaa cggcattcgc aacattatgt 3960 tgcaaggggg tgaattaaag acagagcaac gcttagccta cttggaggca tgcgtccgtg 4020 cgattcgcga ggagacaacg cagttagacc ttgaaatgcg cgcacgtgcc gcgagtacga 4080 caacagcgga agcggcagcc agtgcacagg cagacgccga agctaaacgc ggcgagccag 4140 aattgggtgt ggtcgtatcc ttaagcgtcg gagaacttcc tatggaacag tatgagcgtt 4200 tgttccgcgc cggcgcccgt cgctatctga tccgcattga aacctcgaat cccgacctgt 4260 acgcggcact tcacccggag ccgatgtcct ggcacgcgcg tgtagaatgc ctgcgcaacc 4320 tgaagaaagc tgggtatatg ttgggcacag gagtgatggt cggcttgccg ggacaaacct 4380 tacacgacct ggctggggat gtcatgttct ttcgcgacat taaagcggac atgatcggta 4440 tgggcccctt cattacgcag cctgggacgc ctgcaactga taagtggacc gcgctgtatc 4500 cgaacgccaa taagaacagc cacatgaaat ctatgttcga tctgaccact gctatgaatg 4560 cacttgtacg tattacgatg gggaacgtaa atatcagtgc tacgactgca ttacaagcga 4620 ttatccccac tggacgtgaa attgcgcttg agcgcggcgc aaatgttgtc atgcctattt 4680 taacgcctac tcagtatcgc gagtcctatc agttatatga gggtaagccc tgcattacgg 4740 atactgctgt tcagtgtcgt cgttgcctgg acatgcgttt gcactccgtt ggcaaaacgt 4800 ctgcggccgg agtttggggc gatcctgctt cgttcttgca tcccatcgtt ggcgtcccag 4860 tcccgcacga cttgtcatca cctgctttgg ccgctgctgc aagtgcggat tttcacgagg 4920 ttggcgcagg tccctggaac cccatccgac tagagcgtct ggttgaagtg ccggaccgtt 4980 accctgaccc cgataaccac ggacgcaaaa aggcaggagc cgggaaagga ggcaaggcgc 5040 atgactctca cgacgatggc gatcacgacg accaccacca ccaccacgga gctgcccccg 5100 cgggtgcagc ggctggaaag ggtaccggtg cagctgcaat tggtggcgga gcgggggcta 5160 gccgtcaacg cgtagcaggg gctgctgccg cctctgctcg tctgtgtgcg ggagctcgcc 5220 gcgctggccg tgttgtcgcg tcgccattgc gcccagctgc cgcttgccgt ggtgtggccg 5280 tcaaggccgc agctgctgct gcgggtgaag acgctggtgc tggtacgtct ggcgtaggtt 5340 caaatattgt tacgtctccc ggaatcgcta gcactacggc acatggtgtt cctcgtatca 5400 atattggggt gttcggcgtg atgaatgcag gaaagtctac acttgtgaat gctctggcgc 5460 aacaggaagc atgcattgtt gactcaaccc ccggcacgac cgcagatgta aaaacagttt 5520 tgcttgagct tcatgccctt ggaccagcca agttgctgga cacagccgga ttagacgaag 5580 tcggtggact tggggataaa aagcgccgta aagccctgaa tacgctgaag gagtgcgatg 5640 ttgctgtgct ggttgttgac actgatacgg cagccgccgc aatcaaatcg ggacgccttg 5700 ctgaagccct ggaatgggaa tcgaaagtaa tggaacaggc acacaagtat aatgtcagtc 5760 ctgtactgct tctgaatgta aaatcacgcg ggctgcctga agcgcaggca gctagcatgc 5820 ttgaggcggt cgctggtatg cttgacccat ccaagcaaat ccctcgtatg tcgctggatt 5880 tagcgtccac ccccctgcac gagcgtagta cgattacgtc tgcattcgtc aaggaaggag 5940 cagtgcgcag ttcacgctat ggggctcctc tgccggggtg tttgccccgt tggtctcttg 6000 gacgcaacgc ccgcttactg atggtaatcc cgatggatgc cgaaacccca ggtggacgtc 6060 ttcttcgtcc tcaagcgcaa gttatggagg aagcaatccg ccattgggct accgtgcttt 6120 ccgtacgcct ggatttagac gccgcacgtg gcaaattggg gcccgaggcc tgtgagatgg 6180 agcgtcagcg tttcgacggg gtaattgcta tgatggaacg taatgacgga cccaccctgg 6240 tggtgacaga ttctcaagcg atcgatgttg tacacccttg gaccctggac cgctcatcag 6300 gacgtccgtt ggttccaatt actaccttta gcatcgctat ggcgtaccaa caaaacggcg 6360 gacgtttgga cccgtttgtg gaaggattgg aagcattgga gacgttacaa gatggggatc 6420 gcgttcttat ttcggaagcg tgtaatcata accgtatcac ctccgcttgc aacgacattg 6480 gaatggtgca gatccctaac aagctggagg cagcacttgg cgggaaaaag ttacaaatcg 6540 aacatgcgtt tggtcgcgag tttcccgagc ttgagagtgg gggtatggat ggattgaagt 6600 tagcgatcca ttgtggaggg tgtatgatcg acgctcagaa aatgcagcag cgtatgaaag 6660 acttgcatga ggctggggtg ccggtcacta attatggggt gtttttctct tgggcagctt 6720 ggcccgacgc ccttcgtcgc gcattggaac cgtggggagt ggagccaccg gtaggtactc 6780 ctgctacccc cgcagccgcg cctgctacgg cagcgtccgg ggtataatac tactagaggg 6840 ctttacactt tatgcttccg gctcgtatgt tgtgtggaaa gaaggagata tacatatgtc 6900 ggtcccccta cagtgcaatg caggccgtct tttggcgggc cagcgcccct gcggcgtccg 6960 cgcgcgtctg aaccgccgtg tatgtgttcc agtgaccgca cacggcaaag catctgccac 7020 gcgcgaatac gctggtgact ttcttccagg gaccactatt agtcatgcgt ggtccgtgga 7080 gcgtgaaact catcaccgtt atcgtaatcc ggccgagtgg attaacgagg ctgccatcca 7140 caaggcgctt gaaacgtcaa aggctgatgc tcaggacgca ggacgcgtgc gtgagatttt 7200 ggcgaaggct aaggaaaagg cttttgttac tgaacatgcg cctgtaaatg cggaaagtaa 7260 atccgaattt gtacaagggc ttaccttgga ggagtgcgcc accttaatta acgttgattc 7320 taataatgtc gagttgatga atgaaatctt cgacactgcg cttgctatca aagaacgtat 7380 ctacgggaac cgcgtcgtgc tgttcgcgcc cttgtacatt gctaatcatt gtatgaacac 7440 ttgcacttat tgtgcgtttc gctcagccaa taagggcatg gaacgctcta ttctgacaga 7500 cgatgacctg cgtgaagaag ttgccgcctt gcaacgtcaa ggtcatcgcc gcattttagc 7560 ccttactgga gaacatccta aatacacttt cgacaatttc ttgcatgcag tcaatgtaat 7620 cgcttccgtg aagacagagc ctgaagggtc cattcgccgt atcaatgtcg aaatcccacc 7680 acttagtgtc tcagacatgc gccgccttaa gaatacagat tcagttggca cgttcgttct 7740 gtttcaagag acatatcacc gcgacacatt caaggtaatg catccgtcag gtccaaagag 7800 cgactttgat tttcgcgtct tgacccagga ccgcgccatg cgcgcaggct tggacgatgt 7860 tggtattggt gctttattcg ggttatatga ttaccgttat gaagtttgcg ccatgttaat 7920 gcatagcgag catttggaac gtgagtacaa cgcaggacca catactatct ctgttccccg 7980 tatgcgcccc gcggacggaa gcgagcttag tatcgcgcct ccttatcctg ttaatgatgc 8040 tgattttatg aaattagttg cggtccttcg tattgctgta ccatacacag gtatgatcct 8100 tagcactcgt gaatcaccag aaatgcgctc ggcgcttctg aagtgtggga tgagtcaaat 8160 gagtgccggc tcgcgcactg atgtaggagc ctatcacaaa gatcacacgt taagtacaga 8220 ggcgaatttg agtaagttag ctgggcagtt taccttgcag gatgaacgtc caactaatga 8280 gattgttaag tggctgatgg aggagggcta tgtcccgtct tggtgcacag cttgttaccg 8340 tcaaggtcgt acgggcgaag acttcatgaa catctgtaag gctggtgaca ttcacgattt 8400 ctgtcatccc aatagtctgc ttacgcttca agagtacctt atggattatg cagatccaga 8460 ccttcgtaag aaaggcgagc aagtaattgc ccgtgagatg ggaccggacg cctctgagcc 8520 gttatcggcg caaagccgta agcgccttga acgcaagatg aaacaagtat tggaggggga 8580 gcacgatgta tatctttaac caggcatcaa ataaaacgaa aggctcagtc gaaagactgg 8640 gcctttcgtt ttatctgttg tttgtcggtg aacgctctct actagagtca cactggctca 8700 ccttcgggtg ggcctttctg cgtttata 8728 <210> 33 <211> 8710 <212> DNA <213> Artificial Sequence <220> <223> Exemplary HPGC (hydrogen producing gene cluster) with codon optimised nucleic acid sequence encoding HydA (Hyd1) from Entamoeba nuttalli, 5' - 3' <400> 33 ctagagggct ttacacttta tgcttccggc tcgtatgttg tgtggaaaga aggagatata 60 catatggcga tgcgttccac atttgctgcg cgtgtcggtg ccaaaccggc agtgcgtggg 120 gcgcgtcccg cgtcgcgtat gtcttgcatg gcctataagg ttacactgaa aacgccatca 180 ggcgataaaa caatcgaatg tccggcggac acctatatcc tggatgctgc ggaggaagcc 240 gggctggacc ttccctatag ttgccgtgcg ggcgcctgtt catcctgtgc tggcaaagtg 300 gcagctggaa cggtagatca atctgatcag tcctttctgg atgacgctca gatggggaac 360 ggattcgtcc tgacatgtgt cgcgtatcct acaagcgact gcactatcca aactcaccaa 420 gaggaggctt tatattaaaa gaaggagata tacatatgca aactgttcgc gctccagcag 480 cttcaggtgt tgccacacgt gtcgcaggtc gtcgtatgtg tcgtccggtt gcggcgacga 540 aggcttccac ggctgttacc acagacatgt cgaagcgcac tgttccaacc aagttagagg 600 aaggtgaaat gccgttgaac acgtacagta ataaagctcc gttcaaggca aaggttcgtt 660 ccgtggaaaa aatcacagga ccaaaagcca caggtgagac gtgccacatc attattgaaa 720 ccgaggggaa gatcccgttt tgggagggac aatcgtacgg tgtaattccg ccggggacca 780 agatcaactc taagggaaaa gaagtgcctc atggtactcg tctttattcg attgcttcta 840 gtcgttacgg agatgacttc gatggtcaaa cggcatcgct gtgtgttcgc cgcgcggtat 900 acgtcgatcc agagactgga aaggaggacc ccgcgaaaaa aggactgtgt agtaactttt 960 tgtgtgatgc cacaccaggc acggaaattt ccatgacagg gcccacagga aaagtattgc 1020 ttctgccagc agacgcgaac gcgccattaa tctgtgtcgc aacggggact ggaatcgcgc 1080 cttttcgctc attctggcgc cgttgcttca tcgagaatgt cccaagttat aagttcactg 1140 gccttttctg gttgtttatg ggtgtcgcta actctgatgc taaattgtac gatgaggaac 1200 tgcaagctat cgcaaaagcg tatccgggac aattccgcct ggactatgcc ttgtctcgtg 1260 aacaaaataa tcgcaagggc gggaaaatgt acatccaaga taaggttgaa gagtatgccg 1320 acgaaatttt cgatttattg gataatgggg cgcacatgta cttctgcggg ttaaagggga 1380 tgatgccagg catccaagat atgttagaac gcgttgcaaa agaaaagggg ctgaactacg 1440 aagagtgggt cgaggggtta aagcacaaga atcaatggca tgttgaagtc tactaaccag 1500 gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta tctgttgttt 1560 gtcggtgaac gctctctact agagtcacac tggctcacct tcgggtgggc ctttctgcgt 1620 ttatatacta gagggcttta cactttatgc ttccggctcg tatgttgtgt ggaaagaagg 1680 agatatacat atgtccgcat tagtacttaa gcccgggatg cctccaaaac cctcacacac 1740 tgtaacaggc cacgaccaca accacagcat ccagtttgac tggagcaagt gtatgggctg 1800 cggtatgtgt gcaaccaaat gcaccttcgg cgtattggtt aagcagccgc cgaagatccc 1860 gccatttgtc cagccgaacc gtgaaaaact gagccaagag aacaccgata aaacgcgtgt 1920 cctgatcgat gaaagcgagt gcaccggctg cggtcaatgc tctctggtgt gcaactttgg 1980 atctatcacc ccgatcgacc acctcgttga caccttcaaa gcaaaggagg cgggcaaaaa 2040 actcgtggcc atgattgccc cgagcactcg ccttggtgtc gctgaggcta tgggtatgcc 2100 gattggctcc accgctatgg cgcagctggt gcattgtctg cgtctgattg gttttgacta 2160 cgtttttgac gtggacgcgg gtgcggataa gacgaccatg gacgattacg cggaagttat 2220 cgaaatgaaa aaggagggta agggtccggc gatcaccagc tgctgcccgg cgtggattga 2280 gctggtggag aaagaatatc cggatttgat cccgaacgtg tccactgcgc gtagcccgat 2340 cggctgcttg gccggttgca tcaaacgtgg ttgggcaaaa gatgttggca tcgcggtaga 2400 ggatttgtac accgtgggta tcatgccttg tattgcgaag aagacggaat cccaacgtca 2460 gcaaattcat caagattacg acgcaagctg tacgtctaac gagattgcgg cgtacttcaa 2520 gaagcacctg ccaccggaag agtgcaaatt cacccaggag cgcgaggaag ctctggcaaa 2580 gactgaggac ggccaatgtg atctgccgtt ccgtcgcatt agcggtggct ccaacatttt 2640 tggtaagacc ggcggggtgt gtgaaaccgt gttgcgggtg attgcgcgta atgcgggtgt 2700 tgactggaat acgtgcaccg ttaacaaaga ggaaacattc aaacacgccg ctagcggttc 2760 gaccatgacc aatctgagtg ttgacatcgg cggaactata atcaccgggg cagtttgcca 2820 tggtggttat gcaatccgtc atgcctgcga actgattcgc aaaggtgaac tgaaagtcga 2880 cgttgttgag atgatggcct gtgttggcgg ctgcctgggc ggtgctggcc agcctaagat 2940 cccgccggcg aagaagctgg aaatggataa gcgcagagtg atgttagata ttctggacca 3000 gcaaacggac attcgtgcag cgaatgaaaa caccgacgtg ctaggctgga ttgataaaca 3060 cttcgaccac cagggtgcgc atcaacatct gcacacctat ttcaccccgc gttatcagaa 3120 ttagggatcc gggtcgagga gaaggatgag aaaaagtgac caggcatcaa ataaaacgaa 3180 aggctcagtc gaaagactgg gcctttcgtt ttatctgttg tttgtcggtg aacgctctct 3240 actagagtca cactggctca ccttcgggtg ggcctttctg cgtttatata ctagagggct 3300 ttacacttta tgcttccggc tcgtatgttg tgtggaaaga aggagatata catatggctc 3360 atagtttaag cgcacattcc cgtcaggccg gagatcgcaa actgggcgca ggtgcggcat 3420 ctagccgccc atcatgtcct tctcgccgca ttgtccgcgt ggcggcccat gcttctgcgt 3480 ccaaggcgac tcccgatgta cctgttgacg atcttcctcc tgcgcatgcc cgtgcagcag 3540 tagcggccgc taaccgtcgt gcgcgcgcta tggcatcagc ggaggccgcg gcagagaccc 3600 tgggcgattt cctgggctta gggaaggggg ggctttcgcc gggcgcaacc gccaaccttg 3660 atcgtgagca agtattaggt gtgttggagg cggtctggcg tcgtggagac cttaatctgg 3720 agcgtgcgtt gtacagccat gccaatgcgg tgactaacaa atactgtggt gggggggtct 3780 actatcgcgg ccttgtggag ttcagtaata tttgccaaaa cgattgctca tattgtggga 3840 ttcgcaacaa tcaaaaagaa gtttggcgct atactatgcc ggttgaagag gtggtcgagg 3900 tagctaagtg ggcgcttgaa aacggcattc gcaacattat gttgcaaggg ggtgaattaa 3960 agacagagca acgcttagcc tacttggagg catgcgtccg tgcgattcgc gaggagacaa 4020 cgcagttaga ccttgaaatg cgcgcacgtg ccgcgagtac gacaacagcg gaagcggcag 4080 ccagtgcaca ggcagacgcc gaagctaaac gcggcgagcc agaattgggt gtggtcgtat 4140 ccttaagcgt cggagaactt cctatggaac agtatgagcg tttgttccgc gccggcgccc 4200 gtcgctatct gatccgcatt gaaacctcga atcccgacct gtacgcggca cttcacccgg 4260 agccgatgtc ctggcacgcg cgtgtagaat gcctgcgcaa cctgaagaaa gctgggtata 4320 tgttgggcac aggagtgatg gtcggcttgc cgggacaaac cttacacgac ctggctgggg 4380 atgtcatgtt ctttcgcgac attaaagcgg acatgatcgg tatgggcccc ttcattacgc 4440 agcctgggac gcctgcaact gataagtgga ccgcgctgta tccgaacgcc aataagaaca 4500 gccacatgaa atctatgttc gatctgacca ctgctatgaa tgcacttgta cgtattacga 4560 tggggaacgt aaatatcagt gctacgactg cattacaagc gattatcccc actggacgtg 4620 aaattgcgct tgagcgcggc gcaaatgttg tcatgcctat tttaacgcct actcagtatc 4680 gcgagtccta tcagttatat gagggtaagc cctgcattac ggatactgct gttcagtgtc 4740 gtcgttgcct ggacatgcgt ttgcactccg ttggcaaaac gtctgcggcc ggagtttggg 4800 gcgatcctgc ttcgttcttg catcccatcg ttggcgtccc agtcccgcac gacttgtcat 4860 cacctgcttt ggccgctgct gcaagtgcgg attttcacga ggttggcgca ggtccctgga 4920 accccatccg actagagcgt ctggttgaag tgccggaccg ttaccctgac cccgataacc 4980 acggacgcaa aaaggcagga gccgggaaag gaggcaaggc gcatgactct cacgacgatg 5040 gcgatcacga cgaccaccac caccaccacg gagctgcccc cgcgggtgca gcggctggaa 5100 agggtaccgg tgcagctgca attggtggcg gagcgggggc tagccgtcaa cgcgtagcag 5160 gggctgctgc cgcctctgct cgtctgtgtg cgggagctcg ccgcgctggc cgtgttgtcg 5220 cgtcgccatt gcgcccagct gccgcttgcc gtggtgtggc cgtcaaggcc gcagctgctg 5280 ctgcgggtga agacgctggt gctggtacgt ctggcgtagg ttcaaatatt gttacgtctc 5340 ccggaatcgc tagcactacg gcacatggtg ttcctcgtat caatattggg gtgttcggcg 5400 tgatgaatgc aggaaagtct acacttgtga atgctctggc gcaacaggaa gcatgcattg 5460 ttgactcaac ccccggcacg accgcagatg taaaaacagt tttgcttgag cttcatgccc 5520 ttggaccagc caagttgctg gacacagccg gattagacga agtcggtgga cttggggata 5580 aaaagcgccg taaagccctg aatacgctga aggagtgcga tgttgctgtg ctggttgttg 5640 acactgatac ggcagccgcc gcaatcaaat cgggacgcct tgctgaagcc ctggaatggg 5700 aatcgaaagt aatggaacag gcacacaagt ataatgtcag tcctgtactg cttctgaatg 5760 taaaatcacg cgggctgcct gaagcgcagg cagctagcat gcttgaggcg gtcgctggta 5820 tgcttgaccc atccaagcaa atccctcgta tgtcgctgga tttagcgtcc acccccctgc 5880 acgagcgtag tacgattacg tctgcattcg tcaaggaagg agcagtgcgc agttcacgct 5940 atggggctcc tctgccgggg tgtttgcccc gttggtctct tggacgcaac gcccgcttac 6000 tgatggtaat cccgatggat gccgaaaccc caggtggacg tcttcttcgt cctcaagcgc 6060 aagttatgga ggaagcaatc cgccattggg ctaccgtgct ttccgtacgc ctggatttag 6120 acgccgcacg tggcaaattg gggcccgagg cctgtgagat ggagcgtcag cgtttcgacg 6180 gggtaattgc tatgatggaa cgtaatgacg gacccaccct ggtggtgaca gattctcaag 6240 cgatcgatgt tgtacaccct tggaccctgg accgctcatc aggacgtccg ttggttccaa 6300 ttactacctt tagcatcgct atggcgtacc aacaaaacgg cggacgtttg gacccgtttg 6360 tggaaggatt ggaagcattg gagacgttac aagatgggga tcgcgttctt atttcggaag 6420 cgtgtaatca taaccgtatc acctccgctt gcaacgacat tggaatggtg cagatcccta 6480 acaagctgga ggcagcactt ggcgggaaaa agttacaaat cgaacatgcg tttggtcgcg 6540 agtttcccga gcttgagagt gggggtatgg atggattgaa gttagcgatc cattgtggag 6600 ggtgtatgat cgacgctcag aaaatgcagc agcgtatgaa agacttgcat gaggctgggg 6660 tgccggtcac taattatggg gtgtttttct cttgggcagc ttggcccgac gcccttcgtc 6720 gcgcattgga accgtgggga gtggagccac cggtaggtac tcctgctacc cccgcagccg 6780 cgcctgctac ggcagcgtcc ggggtataat actactagag ggctttacac tttatgcttc 6840 cggctcgtat gttgtgtgga aagaaggaga tatacatatg tcggtccccc tacagtgcaa 6900 tgcaggccgt cttttggcgg gccagcgccc ctgcggcgtc cgcgcgcgtc tgaaccgccg 6960 tgtatgtgtt ccagtgaccg cacacggcaa agcatctgcc acgcgcgaat acgctggtga 7020 ctttcttcca gggaccacta ttagtcatgc gtggtccgtg gagcgtgaaa ctcatcaccg 7080 ttatcgtaat ccggccgagt ggattaacga ggctgccatc cacaaggcgc ttgaaacgtc 7140 aaaggctgat gctcaggacg caggacgcgt gcgtgagatt ttggcgaagg ctaaggaaaa 7200 ggcttttgtt actgaacatg cgcctgtaaa tgcggaaagt aaatccgaat ttgtacaagg 7260 gcttaccttg gaggagtgcg ccaccttaat taacgttgat tctaataatg tcgagttgat 7320 gaatgaaatc ttcgacactg cgcttgctat caaagaacgt atctacggga accgcgtcgt 7380 gctgttcgcg cccttgtaca ttgctaatca ttgtatgaac acttgcactt attgtgcgtt 7440 tcgctcagcc aataagggca tggaacgctc tattctgaca gacgatgacc tgcgtgaaga 7500 agttgccgcc ttgcaacgtc aaggtcatcg ccgcatttta gcccttactg gagaacatcc 7560 taaatacact ttcgacaatt tcttgcatgc agtcaatgta atcgcttccg tgaagacaga 7620 gcctgaaggg tccattcgcc gtatcaatgt cgaaatccca ccacttagtg tctcagacat 7680 gcgccgcctt aagaatacag attcagttgg cacgttcgtt ctgtttcaag agacatatca 7740 ccgcgacaca ttcaaggtaa tgcatccgtc aggtccaaag agcgactttg attttcgcgt 7800 cttgacccag gaccgcgcca tgcgcgcagg cttggacgat gttggtattg gtgctttatt 7860 cgggttatat gattaccgtt atgaagtttg cgccatgtta atgcatagcg agcatttgga 7920 acgtgagtac aacgcaggac cacatactat ctctgttccc cgtatgcgcc ccgcggacgg 7980 aagcgagctt agtatcgcgc ctccttatcc tgttaatgat gctgatttta tgaaattagt 8040 tgcggtcctt cgtattgctg taccatacac aggtatgatc cttagcactc gtgaatcacc 8100 agaaatgcgc tcggcgcttc tgaagtgtgg gatgagtcaa atgagtgccg gctcgcgcac 8160 tgatgtagga gcctatcaca aagatcacac gttaagtaca gaggcgaatt tgagtaagtt 8220 agctgggcag tttaccttgc aggatgaacg tccaactaat gagattgtta agtggctgat 8280 ggaggagggc tatgtcccgt cttggtgcac agcttgttac cgtcaaggtc gtacgggcga 8340 agacttcatg aacatctgta aggctggtga cattcacgat ttctgtcatc ccaatagtct 8400 gcttacgctt caagagtacc ttatggatta tgcagatcca gaccttcgta agaaaggcga 8460 gcaagtaatt gcccgtgaga tgggaccgga cgcctctgag ccgttatcgg cgcaaagccg 8520 taagcgcctt gaacgcaaga tgaaacaagt attggagggg gagcacgatg tatatcttta 8580 accaggcatc aaataaaacg aaaggctcag tcgaaagact gggcctttcg ttttatctgt 8640 tgtttgtcgg tgaacgctct ctactagagt cacactggct caccttcggg tgggcctttc 8700 tgcgtttata 8710 <210> 34 <211> 8704 <212> DNA <213> Artificial Sequence <220> <223> Exemplary HPGC (hydrogen producing gene cluster) with codon optimised nucleic acid sequence encoding HydA (Hyd1) from Ilyobacter,polytrophus 5' - 3' <400> 34 ctagagggct ttacacttta tgcttccggc tcgtatgttg tgtggaaaga aggagatata 60 catatggcga tgcgttccac atttgctgcg cgtgtcggtg ccaaaccggc agtgcgtggg 120 gcgcgtcccg cgtcgcgtat gtcttgcatg gcctataagg ttacactgaa aacgccatca 180 ggcgataaaa caatcgaatg tccggcggac acctatatcc tggatgctgc ggaggaagcc 240 gggctggacc ttccctatag ttgccgtgcg ggcgcctgtt catcctgtgc tggcaaagtg 300 gcagctggaa cggtagatca atctgatcag tcctttctgg atgacgctca gatggggaac 360 ggattcgtcc tgacatgtgt cgcgtatcct acaagcgact gcactatcca aactcaccaa 420 gaggaggctt tatattaaaa gaaggagata tacatatgca aactgttcgc gctccagcag 480 cttcaggtgt tgccacacgt gtcgcaggtc gtcgtatgtg tcgtccggtt gcggcgacga 540 aggcttccac ggctgttacc acagacatgt cgaagcgcac tgttccaacc aagttagagg 600 aaggtgaaat gccgttgaac acgtacagta ataaagctcc gttcaaggca aaggttcgtt 660 ccgtggaaaa aatcacagga ccaaaagcca caggtgagac gtgccacatc attattgaaa 720 ccgaggggaa gatcccgttt tgggagggac aatcgtacgg tgtaattccg ccggggacca 780 agatcaactc taagggaaaa gaagtgcctc atggtactcg tctttattcg attgcttcta 840 gtcgttacgg agatgacttc gatggtcaaa cggcatcgct gtgtgttcgc cgcgcggtat 900 acgtcgatcc agagactgga aaggaggacc ccgcgaaaaa aggactgtgt agtaactttt 960 tgtgtgatgc cacaccaggc acggaaattt ccatgacagg gcccacagga aaagtattgc 1020 ttctgccagc agacgcgaac gcgccattaa tctgtgtcgc aacggggact ggaatcgcgc 1080 cttttcgctc attctggcgc cgttgcttca tcgagaatgt cccaagttat aagttcactg 1140 gccttttctg gttgtttatg ggtgtcgcta actctgatgc taaattgtac gatgaggaac 1200 tgcaagctat cgcaaaagcg tatccgggac aattccgcct ggactatgcc ttgtctcgtg 1260 aacaaaataa tcgcaagggc gggaaaatgt acatccaaga taaggttgaa gagtatgccg 1320 acgaaatttt cgatttattg gataatgggg cgcacatgta cttctgcggg ttaaagggga 1380 tgatgccagg catccaagat atgttagaac gcgttgcaaa agaaaagggg ctgaactacg 1440 aagagtgggt cgaggggtta aagcacaaga atcaatggca tgttgaagtc tactaaccag 1500 gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta tctgttgttt 1560 gtcggtgaac gctctctact agagtcacac tggctcacct tcgggtgggc ctttctgcgt 1620 ttatatacta gagggcttta cactttatgc ttccggctcg tatgttgtgt ggaaagaagg 1680 agatatacat atgtccgcat tagtacttaa gcccgggatg aagaacaaaa cagtatcaaa 1740 tgataaaata gacaataaac tgaactgctc cgaaaacctg gaaaaccgta ccatcgacaa 1800 aagcttctac accttttcac gtgataccag caagtgcatt aagtgctaca agtgcgtgaa 1860 agtttgcaag gacactcagg gcatttccgt ttttcaggtt gaggaggacg gcacggtggg 1920 catcaaagag gagaatatgg cggccacctt gtgtatcagc tgtggtcaat gtattaaagt 1980 gtgcaccgca ggtgcgctga aggagaaatc caacatctct ctgttgaagg agcagttaaa 2040 taacccgaat aagcacgttg tcgcgcagct gtctccaagc ttcaaacaca ccattggtga 2100 tggcttcggc atcagctcgg gtaccgatac ttccccgaaa atcatcagcg ctctgaaaga 2160 aattggtttc tctaaggttt tcagtaccgg tttcgccagc gacgtgaata tcgttgagac 2220 cagcgcggat ctgaaaaaac gcctagatga aaacggtccg ttcccggtgt tcacctccac 2280 gtgcacgggt tggattaact atgcggaaaa gttttgtccg gagttcctgg ggctgctctc 2340 tccgtgcaaa agcccgcaac agatcctggg tagcctgagc aagtcctact acgaagagag 2400 cattgacatc agcagagaaa atatctttag cgtggcgctg atgccttgca tcgccaaaaa 2460 ggatgaagct aatcgttttg acatgaagga cgaatatggt aacaaagatg tggacctggt 2520 cctgaccgtg aatgaagttg ctagcctttt gaacaaaaag ggcattgatt taaacaatta 2580 ctctaagttc ggtacttttg ataagccgat gaaatccgac actggttctt cgcgtattaa 2640 ggcggttacg ggtggcctgg cagaggctat cctgcgcaac accgcacaca tgatcggtga 2700 agatccgttt tctgtagacc tgaagaagct gcgtggtatg gatggtatta agctcacgag 2760 cgtggttctg ggcgggaaaa aattaaacat tgcggtcgtg aacggcatca agaacgtgcc 2820 ggttattctg gacatgatta aagatggcat taccgagttc cacttggtcg aggttatggc 2880 ctgtccgggt ggctgcgtcg gcggcggtgg tatcccgttg tcagaagacc cggacattat 2940 ccaaaaacgc gcagagaaaa tctactcgta cgacgcgagc agcgaaattc gttgtagctg 3000 ggaaaaccca gatgttaaaa ccctgtatag cgagtacctg aaggagccgc tgggagagga 3060 gtctcaacgt ttgtttcatt ttcattataa aaaccgccgt accaaacgta tcttctaggg 3120 atccgggtcg aggagaagga tgagaaaaag tgaccaggca tcaaataaaa cgaaaggctc 3180 agtcgaaaga ctgggccttt cgttttatct gttgtttgtc ggtgaacgct ctctactaga 3240 gtcacactgg ctcaccttcg ggtgggcctt tctgcgttta tatactagag ggctttacac 3300 tttatgcttc cggctcgtat gttgtgtgga aagaaggaga tatacatatg gctcatagtt 3360 taagcgcaca ttcccgtcag gccggagatc gcaaactggg cgcaggtgcg gcatctagcc 3420 gcccatcatg tccttctcgc cgcattgtcc gcgtggcggc ccatgcttct gcgtccaagg 3480 cgactcccga tgtacctgtt gacgatcttc ctcctgcgca tgcccgtgca gcagtagcgg 3540 ccgctaaccg tcgtgcgcgc gctatggcat cagcggaggc cgcggcagag accctgggcg 3600 atttcctggg cttagggaag ggggggcttt cgccgggcgc aaccgccaac cttgatcgtg 3660 agcaagtatt aggtgtgttg gaggcggtct ggcgtcgtgg agaccttaat ctggagcgtg 3720 cgttgtacag ccatgccaat gcggtgacta acaaatactg tggtgggggg gtctactatc 3780 gcggccttgt ggagttcagt aatatttgcc aaaacgattg ctcatattgt gggattcgca 3840 acaatcaaaa agaagtttgg cgctatacta tgccggttga agaggtggtc gaggtagcta 3900 agtgggcgct tgaaaacggc attcgcaaca ttatgttgca agggggtgaa ttaaagacag 3960 agcaacgctt agcctacttg gaggcatgcg tccgtgcgat tcgcgaggag acaacgcagt 4020 tagaccttga aatgcgcgca cgtgccgcga gtacgacaac agcggaagcg gcagccagtg 4080 cacaggcaga cgccgaagct aaacgcggcg agccagaatt gggtgtggtc gtatccttaa 4140 gcgtcggaga acttcctatg gaacagtatg agcgtttgtt ccgcgccggc gcccgtcgct 4200 atctgatccg cattgaaacc tcgaatcccg acctgtacgc ggcacttcac ccggagccga 4260 tgtcctggca cgcgcgtgta gaatgcctgc gcaacctgaa gaaagctggg tatatgttgg 4320 gcacaggagt gatggtcggc ttgccgggac aaaccttaca cgacctggct ggggatgtca 4380 tgttctttcg cgacattaaa gcggacatga tcggtatggg ccccttcatt acgcagcctg 4440 ggacgcctgc aactgataag tggaccgcgc tgtatccgaa cgccaataag aacagccaca 4500 tgaaatctat gttcgatctg accactgcta tgaatgcact tgtacgtatt acgatgggga 4560 acgtaaatat cagtgctacg actgcattac aagcgattat ccccactgga cgtgaaattg 4620 cgcttgagcg cggcgcaaat gttgtcatgc ctattttaac gcctactcag tatcgcgagt 4680 cctatcagtt atatgagggt aagccctgca ttacggatac tgctgttcag tgtcgtcgtt 4740 gcctggacat gcgtttgcac tccgttggca aaacgtctgc ggccggagtt tggggcgatc 4800 ctgcttcgtt cttgcatccc atcgttggcg tcccagtccc gcacgacttg tcatcacctg 4860 ctttggccgc tgctgcaagt gcggattttc acgaggttgg cgcaggtccc tggaacccca 4920 tccgactaga gcgtctggtt gaagtgccgg accgttaccc tgaccccgat aaccacggac 4980 gcaaaaaggc aggagccggg aaaggaggca aggcgcatga ctctcacgac gatggcgatc 5040 acgacgacca ccaccaccac cacggagctg cccccgcggg tgcagcggct ggaaagggta 5100 ccggtgcagc tgcaattggt ggcggagcgg gggctagccg tcaacgcgta gcaggggctg 5160 ctgccgcctc tgctcgtctg tgtgcgggag ctcgccgcgc tggccgtgtt gtcgcgtcgc 5220 cattgcgccc agctgccgct tgccgtggtg tggccgtcaa ggccgcagct gctgctgcgg 5280 gtgaagacgc tggtgctggt acgtctggcg taggttcaaa tattgttacg tctcccggaa 5340 tcgctagcac tacggcacat ggtgttcctc gtatcaatat tggggtgttc ggcgtgatga 5400 atgcaggaaa gtctacactt gtgaatgctc tggcgcaaca ggaagcatgc attgttgact 5460 caacccccgg cacgaccgca gatgtaaaaa cagttttgct tgagcttcat gcccttggac 5520 cagccaagtt gctggacaca gccggattag acgaagtcgg tggacttggg gataaaaagc 5580 gccgtaaagc cctgaatacg ctgaaggagt gcgatgttgc tgtgctggtt gttgacactg 5640 atacggcagc cgccgcaatc aaatcgggac gccttgctga agccctggaa tgggaatcga 5700 aagtaatgga acaggcacac aagtataatg tcagtcctgt actgcttctg aatgtaaaat 5760 cacgcgggct gcctgaagcg caggcagcta gcatgcttga ggcggtcgct ggtatgcttg 5820 acccatccaa gcaaatccct cgtatgtcgc tggatttagc gtccaccccc ctgcacgagc 5880 gtagtacgat tacgtctgca ttcgtcaagg aaggagcagt gcgcagttca cgctatgggg 5940 ctcctctgcc ggggtgtttg ccccgttggt ctcttggacg caacgcccgc ttactgatgg 6000 taatcccgat ggatgccgaa accccaggtg gacgtcttct tcgtcctcaa gcgcaagtta 6060 tggaggaagc aatccgccat tgggctaccg tgctttccgt acgcctggat ttagacgccg 6120 cacgtggcaa attggggccc gaggcctgtg agatggagcg tcagcgtttc gacggggtaa 6180 ttgctatgat ggaacgtaat gacggaccca ccctggtggt gacagattct caagcgatcg 6240 atgttgtaca cccttggacc ctggaccgct catcaggacg tccgttggtt ccaattacta 6300 cctttagcat cgctatggcg taccaacaaa acggcggacg tttggacccg tttgtggaag 6360 gattggaagc attggagacg ttacaagatg gggatcgcgt tcttatttcg gaagcgtgta 6420 atcataaccg tatcacctcc gcttgcaacg acattggaat ggtgcagatc cctaacaagc 6480 tggaggcagc acttggcggg aaaaagttac aaatcgaaca tgcgtttggt cgcgagtttc 6540 ccgagcttga gagtgggggt atggatggat tgaagttagc gatccattgt ggagggtgta 6600 tgatcgacgc tcagaaaatg cagcagcgta tgaaagactt gcatgaggct ggggtgccgg 6660 tcactaatta tggggtgttt ttctcttggg cagcttggcc cgacgccctt cgtcgcgcat 6720 tggaaccgtg gggagtggag ccaccggtag gtactcctgc tacccccgca gccgcgcctg 6780 ctacggcagc gtccggggta taatactact agagggcttt acactttatg cttccggctc 6840 gtatgttgtg tggaaagaag gagatataca tatgtcggtc cccctacagt gcaatgcagg 6900 ccgtcttttg gcgggccagc gcccctgcgg cgtccgcgcg cgtctgaacc gccgtgtatg 6960 tgttccagtg accgcacacg gcaaagcatc tgccacgcgc gaatacgctg gtgactttct 7020 tccagggacc actattagtc atgcgtggtc cgtggagcgt gaaactcatc accgttatcg 7080 taatccggcc gagtggatta acgaggctgc catccacaag gcgcttgaaa cgtcaaaggc 7140 tgatgctcag gacgcaggac gcgtgcgtga gattttggcg aaggctaagg aaaaggcttt 7200 tgttactgaa catgcgcctg taaatgcgga aagtaaatcc gaatttgtac aagggcttac 7260 cttggaggag tgcgccacct taattaacgt tgattctaat aatgtcgagt tgatgaatga 7320 aatcttcgac actgcgcttg ctatcaaaga acgtatctac gggaaccgcg tcgtgctgtt 7380 cgcgcccttg tacattgcta atcattgtat gaacacttgc acttattgtg cgtttcgctc 7440 agccaataag ggcatggaac gctctattct gacagacgat gacctgcgtg aagaagttgc 7500 cgccttgcaa cgtcaaggtc atcgccgcat tttagccctt actggagaac atcctaaata 7560 cactttcgac aatttcttgc atgcagtcaa tgtaatcgct tccgtgaaga cagagcctga 7620 agggtccatt cgccgtatca atgtcgaaat cccaccactt agtgtctcag acatgcgccg 7680 ccttaagaat acagattcag ttggcacgtt cgttctgttt caagagacat atcaccgcga 7740 cacattcaag gtaatgcatc cgtcaggtcc aaagagcgac tttgattttc gcgtcttgac 7800 ccaggaccgc gccatgcgcg caggcttgga cgatgttggt attggtgctt tattcgggtt 7860 atatgattac cgttatgaag tttgcgccat gttaatgcat agcgagcatt tggaacgtga 7920 gtacaacgca ggaccacata ctatctctgt tccccgtatg cgccccgcgg acggaagcga 7980 gcttagtatc gcgcctcctt atcctgttaa tgatgctgat tttatgaaat tagttgcggt 8040 ccttcgtatt gctgtaccat acacaggtat gatccttagc actcgtgaat caccagaaat 8100 gcgctcggcg cttctgaagt gtgggatgag tcaaatgagt gccggctcgc gcactgatgt 8160 aggagcctat cacaaagatc acacgttaag tacagaggcg aatttgagta agttagctgg 8220 gcagtttacc ttgcaggatg aacgtccaac taatgagatt gttaagtggc tgatggagga 8280 gggctatgtc ccgtcttggt gcacagcttg ttaccgtcaa ggtcgtacgg gcgaagactt 8340 catgaacatc tgtaaggctg gtgacattca cgatttctgt catcccaata gtctgcttac 8400 gcttcaagag taccttatgg attatgcaga tccagacctt cgtaagaaag gcgagcaagt 8460 aattgcccgt gagatgggac cggacgcctc tgagccgtta tcggcgcaaa gccgtaagcg 8520 ccttgaacgc aagatgaaac aagtattgga gggggagcac gatgtatatc tttaaccagg 8580 catcaaataa aacgaaaggc tcagtcgaaa gactgggcct ttcgttttat ctgttgtttg 8640 tcggtgaacg ctctctacta gagtcacact ggctcacctt cgggtgggcc tttctgcgtt 8700 tata 8704 <210> 35 <211> 8797 <212> DNA <213> Artificial Sequence <220> <223> Exemplary HPGC (hydrogen producing gene cluster) with codon optimised nucleic acid sequence encoding HydA (Hyd1) from Volvox carteri, 5' - 3' <400> 35 ctagagggct ttacacttta tgcttccggc tcgtatgttg tgtggaaaga aggagatata 60 catatggcga tgcgttccac atttgctgcg cgtgtcggtg ccaaaccggc agtgcgtggg 120 gcgcgtcccg cgtcgcgtat gtcttgcatg gcctataagg ttacactgaa aacgccatca 180 ggcgataaaa caatcgaatg tccggcggac acctatatcc tggatgctgc ggaggaagcc 240 gggctggacc ttccctatag ttgccgtgcg ggcgcctgtt catcctgtgc tggcaaagtg 300 gcagctggaa cggtagatca atctgatcag tcctttctgg atgacgctca gatggggaac 360 ggattcgtcc tgacatgtgt cgcgtatcct acaagcgact gcactatcca aactcaccaa 420 gaggaggctt tatattaaaa gaaggagata tacatatgca aactgttcgc gctccagcag 480 cttcaggtgt tgccacacgt gtcgcaggtc gtcgtatgtg tcgtccggtt gcggcgacga 540 aggcttccac ggctgttacc acagacatgt cgaagcgcac tgttccaacc aagttagagg 600 aaggtgaaat gccgttgaac acgtacagta ataaagctcc gttcaaggca aaggttcgtt 660 ccgtggaaaa aatcacagga ccaaaagcca caggtgagac gtgccacatc attattgaaa 720 ccgaggggaa gatcccgttt tgggagggac aatcgtacgg tgtaattccg ccggggacca 780 agatcaactc taagggaaaa gaagtgcctc atggtactcg tctttattcg attgcttcta 840 gtcgttacgg agatgacttc gatggtcaaa cggcatcgct gtgtgttcgc cgcgcggtat 900 acgtcgatcc agagactgga aaggaggacc ccgcgaaaaa aggactgtgt agtaactttt 960 tgtgtgatgc cacaccaggc acggaaattt ccatgacagg gcccacagga aaagtattgc 1020 ttctgccagc agacgcgaac gcgccattaa tctgtgtcgc aacggggact ggaatcgcgc 1080 cttttcgctc attctggcgc cgttgcttca tcgagaatgt cccaagttat aagttcactg 1140 gccttttctg gttgtttatg ggtgtcgcta actctgatgc taaattgtac gatgaggaac 1200 tgcaagctat cgcaaaagcg tatccgggac aattccgcct ggactatgcc ttgtctcgtg 1260 aacaaaataa tcgcaagggc gggaaaatgt acatccaaga taaggttgaa gagtatgccg 1320 acgaaatttt cgatttattg gataatgggg cgcacatgta cttctgcggg ttaaagggga 1380 tgatgccagg catccaagat atgttagaac gcgttgcaaa agaaaagggg ctgaactacg 1440 aagagtgggt cgaggggtta aagcacaaga atcaatggca tgttgaagtc tactaaccag 1500 gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta tctgttgttt 1560 gtcggtgaac gctctctact agagtcacac tggctcacct tcgggtgggc ctttctgcgt 1620 ttatatacta gagggcttta cactttatgc ttccggctcg tatgttgtgt ggaaagaagg 1680 agatatacat atgtccgcat tagtacttaa gcccgggatg agtgctatgc tatcttcatt 1740 aacaaattct cgcttgggcg cttacgtgcc gcaagtggcg gtaagccgtt atggttccaa 1800 gccggtctac gtcccgtgcg tgccgtttcg taagtgcacc tcggcggtgc cagtgccggt 1860 taagacggtg caagaaggta attcggtcag acttatgcca gcggcggcgg ctccggcggg 1920 tgcggcagcg gacccacatt ggaaacaagc atttgcagag cttgataaac cgaaagccga 1980 acgtaaagtt atgatcgcac aggttgctcc ggcggtgcgc gttgccatct ccgagagctt 2040 tggtctggca ccgggggcta ccactccggg tcagctggcc gagtccctgc gttgtctggg 2100 ttttgatatg gtgttcgaca ccttgtacgg cgcggacctg accattatgg aagagggcac 2160 tgagttgctg tcccgtctgc aagcgcaatt ggaagcccac ccgcatagcg aagaaccgct 2220 gccgatgttt accagctgct gtccgggctg gatcgccctg ttggagaaga gctatccgga 2280 attaattccg tatgtgtcta gctgcaagtc tccgcagatg atgttaggcg ctatggtgaa 2340 gacctatctg gcagagaaga aaggcatctc tccgagcgac atctccatgg tttcgattat 2400 gccgtgtgtg aggaagcaag gtgaagcgga ccgtgattgg ttttgcagcg gcggcgccgg 2460 cgttcgtgat gtggaccacg ttattaccac ggcggagcta ggcaacatcc tgaaagaacg 2520 taatatcaac ctccccgaac tgccggaagg cggttgggat gagccgctgg gttcgggtag 2580 cggtgcgggc gtcgttttcg gtacaaccgg tggtgttatg gaagcggcgc tgcgcaccgc 2640 gtacgagttg gttacccagc aaccgctgcc tcgtttgaat ctgagtgagg ttcgcggtat 2700 ggacggcatt aaagaaaccg aaatcaagat ggttccgcct ccgggtagca aattcgccga 2760 gcttgttgcc gcacgtgcag cggcgaaggc tatggatgaa gcggccgcga gcgcaggcgc 2820 gattaagtgg gatggtggca gcaacttcac cgcggacgac ggtgctaagg gcatcaccct 2880 gcgcgtggcc gtggctaatg gtctgggaaa cgcgaaaaag ctgctgacga aaatgcagac 2940 cggtgagtgc aaatacgact tcgtggaaat tatggcatgt ccgtctgggt gcgttggtgg 3000 tggtggtcag ccgcgcagca ccgataaaca ggtggcggtc aaacgtcagc aggcactgta 3060 cgaccttgac gagcgcgcaa cgatccgtcg tagccacgag aacccggctg tccaaaaagc 3120 gtacgaagat ttcctgggcg agccgaacag ccacaaagcg cacgatctgt tgcacaccca 3180 ttatgttccg ggtggcgttg acacggagta gggatccggg tcgaggagaa ggatgagaaa 3240 aagtgaccag gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta 3300 tctgttgttt gtcggtgaac gctctctact agagtcacac tggctcacct tcgggtgggc 3360 ctttctgcgt ttatatacta gagggcttta cactttatgc ttccggctcg tatgttgtgt 3420 ggaaagaagg agatatacat atggctcata gtttaagcgc acattcccgt caggccggag 3480 atcgcaaact gggcgcaggt gcggcatcta gccgcccatc atgtccttct cgccgcattg 3540 tccgcgtggc ggcccatgct tctgcgtcca aggcgactcc cgatgtacct gttgacgatc 3600 ttcctcctgc gcatgcccgt gcagcagtag cggccgctaa ccgtcgtgcg cgcgctatgg 3660 catcagcgga ggccgcggca gagaccctgg gcgatttcct gggcttaggg aagggggggc 3720 tttcgccggg cgcaaccgcc aaccttgatc gtgagcaagt attaggtgtg ttggaggcgg 3780 tctggcgtcg tggagacctt aatctggagc gtgcgttgta cagccatgcc aatgcggtga 3840 ctaacaaata ctgtggtggg ggggtctact atcgcggcct tgtggagttc agtaatattt 3900 gccaaaacga ttgctcatat tgtgggattc gcaacaatca aaaagaagtt tggcgctata 3960 ctatgccggt tgaagaggtg gtcgaggtag ctaagtgggc gcttgaaaac ggcattcgca 4020 acattatgtt gcaagggggt gaattaaaga cagagcaacg cttagcctac ttggaggcat 4080 gcgtccgtgc gattcgcgag gagacaacgc agttagacct tgaaatgcgc gcacgtgccg 4140 cgagtacgac aacagcggaa gcggcagcca gtgcacaggc agacgccgaa gctaaacgcg 4200 gcgagccaga attgggtgtg gtcgtatcct taagcgtcgg agaacttcct atggaacagt 4260 atgagcgttt gttccgcgcc ggcgcccgtc gctatctgat ccgcattgaa acctcgaatc 4320 ccgacctgta cgcggcactt cacccggagc cgatgtcctg gcacgcgcgt gtagaatgcc 4380 tgcgcaacct gaagaaagct gggtatatgt tgggcacagg agtgatggtc ggcttgccgg 4440 gacaaacctt acacgacctg gctggggatg tcatgttctt tcgcgacatt aaagcggaca 4500 tgatcggtat gggccccttc attacgcagc ctgggacgcc tgcaactgat aagtggaccg 4560 cgctgtatcc gaacgccaat aagaacagcc acatgaaatc tatgttcgat ctgaccactg 4620 ctatgaatgc acttgtacgt attacgatgg ggaacgtaaa tatcagtgct acgactgcat 4680 tacaagcgat tatccccact ggacgtgaaa ttgcgcttga gcgcggcgca aatgttgtca 4740 tgcctatttt aacgcctact cagtatcgcg agtcctatca gttatatgag ggtaagccct 4800 gcattacgga tactgctgtt cagtgtcgtc gttgcctgga catgcgtttg cactccgttg 4860 gcaaaacgtc tgcggccgga gtttggggcg atcctgcttc gttcttgcat cccatcgttg 4920 gcgtcccagt cccgcacgac ttgtcatcac ctgctttggc cgctgctgca agtgcggatt 4980 ttcacgaggt tggcgcaggt ccctggaacc ccatccgact agagcgtctg gttgaagtgc 5040 cggaccgtta ccctgacccc gataaccacg gacgcaaaaa ggcaggagcc gggaaaggag 5100 gcaaggcgca tgactctcac gacgatggcg atcacgacga ccaccaccac caccacggag 5160 ctgcccccgc gggtgcagcg gctggaaagg gtaccggtgc agctgcaatt ggtggcggag 5220 cgggggctag ccgtcaacgc gtagcagggg ctgctgccgc ctctgctcgt ctgtgtgcgg 5280 gagctcgccg cgctggccgt gttgtcgcgt cgccattgcg cccagctgcc gcttgccgtg 5340 gtgtggccgt caaggccgca gctgctgctg cgggtgaaga cgctggtgct ggtacgtctg 5400 gcgtaggttc aaatattgtt acgtctcccg gaatcgctag cactacggca catggtgttc 5460 ctcgtatcaa tattggggtg ttcggcgtga tgaatgcagg aaagtctaca cttgtgaatg 5520 ctctggcgca acaggaagca tgcattgttg actcaacccc cggcacgacc gcagatgtaa 5580 aaacagtttt gcttgagctt catgcccttg gaccagccaa gttgctggac acagccggat 5640 tagacgaagt cggtggactt ggggataaaa agcgccgtaa agccctgaat acgctgaagg 5700 agtgcgatgt tgctgtgctg gttgttgaca ctgatacggc agccgccgca atcaaatcgg 5760 gacgccttgc tgaagccctg gaatgggaat cgaaagtaat ggaacaggca cacaagtata 5820 atgtcagtcc tgtactgctt ctgaatgtaa aatcacgcgg gctgcctgaa gcgcaggcag 5880 ctagcatgct tgaggcggtc gctggtatgc ttgacccatc caagcaaatc cctcgtatgt 5940 cgctggattt agcgtccacc cccctgcacg agcgtagtac gattacgtct gcattcgtca 6000 aggaaggagc agtgcgcagt tcacgctatg gggctcctct gccggggtgt ttgccccgtt 6060 ggtctcttgg acgcaacgcc cgcttactga tggtaatccc gatggatgcc gaaaccccag 6120 gtggacgtct tcttcgtcct caagcgcaag ttatggagga agcaatccgc cattgggcta 6180 ccgtgctttc cgtacgcctg gatttagacg ccgcacgtgg caaattgggg cccgaggcct 6240 gtgagatgga gcgtcagcgt ttcgacgggg taattgctat gatggaacgt aatgacggac 6300 ccaccctggt ggtgacagat tctcaagcga tcgatgttgt acacccttgg accctggacc 6360 gctcatcagg acgtccgttg gttccaatta ctacctttag catcgctatg gcgtaccaac 6420 aaaacggcgg acgtttggac ccgtttgtgg aaggattgga agcattggag acgttacaag 6480 atggggatcg cgttcttatt tcggaagcgt gtaatcataa ccgtatcacc tccgcttgca 6540 acgacattgg aatggtgcag atccctaaca agctggaggc agcacttggc gggaaaaagt 6600 tacaaatcga acatgcgttt ggtcgcgagt ttcccgagct tgagagtggg ggtatggatg 6660 gattgaagtt agcgatccat tgtggagggt gtatgatcga cgctcagaaa atgcagcagc 6720 gtatgaaaga cttgcatgag gctggggtgc cggtcactaa ttatggggtg tttttctctt 6780 gggcagcttg gcccgacgcc cttcgtcgcg cattggaacc gtggggagtg gagccaccgg 6840 taggtactcc tgctaccccc gcagccgcgc ctgctacggc agcgtccggg gtataatact 6900 actagagggc tttacacttt atgcttccgg ctcgtatgtt gtgtggaaag aaggagatat 6960 acatatgtcg gtccccctac agtgcaatgc aggccgtctt ttggcgggcc agcgcccctg 7020 cggcgtccgc gcgcgtctga accgccgtgt atgtgttcca gtgaccgcac acggcaaagc 7080 atctgccacg cgcgaatacg ctggtgactt tcttccaggg accactatta gtcatgcgtg 7140 gtccgtggag cgtgaaactc atcaccgtta tcgtaatccg gccgagtgga ttaacgaggc 7200 tgccatccac aaggcgcttg aaacgtcaaa ggctgatgct caggacgcag gacgcgtgcg 7260 tgagattttg gcgaaggcta aggaaaaggc ttttgttact gaacatgcgc ctgtaaatgc 7320 ggaaagtaaa tccgaatttg tacaagggct taccttggag gagtgcgcca ccttaattaa 7380 cgttgattct aataatgtcg agttgatgaa tgaaatcttc gacactgcgc ttgctatcaa 7440 agaacgtatc tacgggaacc gcgtcgtgct gttcgcgccc ttgtacattg ctaatcattg 7500 tatgaacact tgcacttatt gtgcgtttcg ctcagccaat aagggcatgg aacgctctat 7560 tctgacagac gatgacctgc gtgaagaagt tgccgccttg caacgtcaag gtcatcgccg 7620 cattttagcc cttactggag aacatcctaa atacactttc gacaatttct tgcatgcagt 7680 caatgtaatc gcttccgtga agacagagcc tgaagggtcc attcgccgta tcaatgtcga 7740 aatcccacca cttagtgtct cagacatgcg ccgccttaag aatacagatt cagttggcac 7800 gttcgttctg tttcaagaga catatcaccg cgacacattc aaggtaatgc atccgtcagg 7860 tccaaagagc gactttgatt ttcgcgtctt gacccaggac cgcgccatgc gcgcaggctt 7920 ggacgatgtt ggtattggtg ctttattcgg gttatatgat taccgttatg aagtttgcgc 7980 catgttaatg catagcgagc atttggaacg tgagtacaac gcaggaccac atactatctc 8040 tgttccccgt atgcgccccg cggacggaag cgagcttagt atcgcgcctc cttatcctgt 8100 taatgatgct gattttatga aattagttgc ggtccttcgt attgctgtac catacacagg 8160 tatgatcctt agcactcgtg aatcaccaga aatgcgctcg gcgcttctga agtgtgggat 8220 gagtcaaatg agtgccggct cgcgcactga tgtaggagcc tatcacaaag atcacacgtt 8280 aagtacagag gcgaatttga gtaagttagc tgggcagttt accttgcagg atgaacgtcc 8340 aactaatgag attgttaagt ggctgatgga ggagggctat gtcccgtctt ggtgcacagc 8400 ttgttaccgt caaggtcgta cgggcgaaga cttcatgaac atctgtaagg ctggtgacat 8460 tcacgatttc tgtcatccca atagtctgct tacgcttcaa gagtacctta tggattatgc 8520 agatccagac cttcgtaaga aaggcgagca agtaattgcc cgtgagatgg gaccggacgc 8580 ctctgagccg ttatcggcgc aaagccgtaa gcgccttgaa cgcaagatga aacaagtatt 8640 ggagggggag cacgatgtat atctttaacc aggcatcaaa taaaacgaaa ggctcagtcg 8700 aaagactggg cctttcgttt tatctgttgt ttgtcggtga acgctctcta ctagagtcac 8760 actggctcac cttcgggtgg gcctttctgc gtttata 8797 <210> 36 <211> 8710 <212> DNA <213> Artificial Sequence <220> <223> Exemplary HPGC (hydrogen producing gene cluster) with codon optimised nucleic acid sequence encoding HydA (Hyd1) from Trichomonas vaginalis, 5' - 3' <400> 36 ctagagggct ttacacttta tgcttccggc tcgtatgttg tgtggaaaga aggagatata 60 catatggcga tgcgttccac atttgctgcg cgtgtcggtg ccaaaccggc agtgcgtggg 120 gcgcgtcccg cgtcgcgtat gtcttgcatg gcctataagg ttacactgaa aacgccatca 180 ggcgataaaa caatcgaatg tccggcggac acctatatcc tggatgctgc ggaggaagcc 240 gggctggacc ttccctatag ttgccgtgcg ggcgcctgtt catcctgtgc tggcaaagtg 300 gcagctggaa cggtagatca atctgatcag tcctttctgg atgacgctca gatggggaac 360 ggattcgtcc tgacatgtgt cgcgtatcct acaagcgact gcactatcca aactcaccaa 420 gaggaggctt tatattaaaa gaaggagata tacatatgca aactgttcgc gctccagcag 480 cttcaggtgt tgccacacgt gtcgcaggtc gtcgtatgtg tcgtccggtt gcggcgacga 540 aggcttccac ggctgttacc acagacatgt cgaagcgcac tgttccaacc aagttagagg 600 aaggtgaaat gccgttgaac acgtacagta ataaagctcc gttcaaggca aaggttcgtt 660 ccgtggaaaa aatcacagga ccaaaagcca caggtgagac gtgccacatc attattgaaa 720 ccgaggggaa gatcccgttt tgggagggac aatcgtacgg tgtaattccg ccggggacca 780 agatcaactc taagggaaaa gaagtgcctc atggtactcg tctttattcg attgcttcta 840 gtcgttacgg agatgacttc gatggtcaaa cggcatcgct gtgtgttcgc cgcgcggtat 900 acgtcgatcc agagactgga aaggaggacc ccgcgaaaaa aggactgtgt agtaactttt 960 tgtgtgatgc cacaccaggc acggaaattt ccatgacagg gcccacagga aaagtattgc 1020 ttctgccagc agacgcgaac gcgccattaa tctgtgtcgc aacggggact ggaatcgcgc 1080 cttttcgctc attctggcgc cgttgcttca tcgagaatgt cccaagttat aagttcactg 1140 gccttttctg gttgtttatg ggtgtcgcta actctgatgc taaattgtac gatgaggaac 1200 tgcaagctat cgcaaaagcg tatccgggac aattccgcct ggactatgcc ttgtctcgtg 1260 aacaaaataa tcgcaagggc gggaaaatgt acatccaaga taaggttgaa gagtatgccg 1320 acgaaatttt cgatttattg gataatgggg cgcacatgta cttctgcggg ttaaagggga 1380 tgatgccagg catccaagat atgttagaac gcgttgcaaa agaaaagggg ctgaactacg 1440 aagagtgggt cgaggggtta aagcacaaga atcaatggca tgttgaagtc tactaaccag 1500 gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta tctgttgttt 1560 gtcggtgaac gctctctact agagtcacac tggctcacct tcgggtgggc ctttctgcgt 1620 ttatatacta gagggcttta cactttatgc ttccggctcg tatgttgtgt ggaaagaagg 1680 agatatacat atgtccgcat tagtacttaa gcccgggatg ctagcgtcaa gtgcaacagc 1740 tatgaaaggc ttcgccaata gcctccgtat gaaagattac agcagcaccg gtattaactt 1800 cgacatgact aagtgcatta actgccaaag ctgcgttcgc gcctgcacga acatcgctgg 1860 ccaaaacgtc ttgaagagct tgacggtgaa cggcaagtcc gttgtgcaga ccgttaccgg 1920 taaaccgctg gcggagacca actgcatcag ctgcggtcaa tgtacccttg gctgcccgaa 1980 gttcaccatc ttcgaggcgg acgccatcaa tccagttaaa gaggtcttga ccaagaaaaa 2040 cggtcgtatt gccgtgtgtc agattgctcc ggcgattcgt atcaacatgg ctgaagctct 2100 gggcgttccg gctggtacga tctccttggg taaggtggtg accgcgctga aacgtctggg 2160 ttttgactac gttttcgata ccaatttcgc tgccgatatg accatcgtgg aggaagcgac 2220 cgaactggtt caacgtttgt ctgacaaaaa cgcagtgctg cctatgttta cttcatgctg 2280 tccagcgtgg gttaattacg tagagaaatc cgatccgagc ttgatcccgc atctgagctc 2340 ttgtcgtagc ccgatgagca tgctgagcag cgttatcaag aacgtctttc cgaaaaagat 2400 tggtacgacc gcagacaaaa tctacaatgt ggcgatcatg ccgtgcaccg cgaagaagga 2460 cgaaattcag cgcagccaat ttaccatgaa ggatggtaaa caagagacag gtgcggtgct 2520 gacttctcgt gaactcgcga aaatgattaa ggaggcgaag atcaacttca aagagctgcc 2580 ggatacgccg tgtgataact tttattctga agcatcgggc ggcggtgcga tcttttgtgc 2640 aaccggcggc gtgatggaag ccgcggtgcg cagcgcgtat aagttcctga cgaagaaaga 2700 gctggcaccg attgacctgc aagacgttcg cggtgttgcg agcggcgtta aactggcgga 2760 ggtggatatt gctggtacca aagtaaaagt ggcggttgcg cacggcatta agaacgccat 2820 gaccctgatt aagaagatca aatcgggtga agagcagttt aaagacgtta agttcgtgga 2880 agtgatggca tgtccgggtg gctgcgtggt tggtggtggc agcccgaagg ctaagaccaa 2940 gaaagctgtc caggcacgat tgaatgcaac gtactccatt gacaaaagct ccaaacacag 3000 aacttctcag gacaacccgc agttgttaca gctgtataaa gaatcgtttg aaggtaaatt 3060 cggtggtcat gtcgcgcacc acctgctgca cacccattat aagaatcgta aagtaaatcc 3120 gtagggatcc gggtcgagga gaaggatgag aaaaagtgac caggcatcaa ataaaacgaa 3180 aggctcagtc gaaagactgg gcctttcgtt ttatctgttg tttgtcggtg aacgctctct 3240 actagagtca cactggctca ccttcgggtg ggcctttctg cgtttatata ctagagggct 3300 ttacacttta tgcttccggc tcgtatgttg tgtggaaaga aggagatata catatggctc 3360 atagtttaag cgcacattcc cgtcaggccg gagatcgcaa actgggcgca ggtgcggcat 3420 ctagccgccc atcatgtcct tctcgccgca ttgtccgcgt ggcggcccat gcttctgcgt 3480 ccaaggcgac tcccgatgta cctgttgacg atcttcctcc tgcgcatgcc cgtgcagcag 3540 tagcggccgc taaccgtcgt gcgcgcgcta tggcatcagc ggaggccgcg gcagagaccc 3600 tgggcgattt cctgggctta gggaaggggg ggctttcgcc gggcgcaacc gccaaccttg 3660 atcgtgagca agtattaggt gtgttggagg cggtctggcg tcgtggagac cttaatctgg 3720 agcgtgcgtt gtacagccat gccaatgcgg tgactaacaa atactgtggt gggggggtct 3780 actatcgcgg ccttgtggag ttcagtaata tttgccaaaa cgattgctca tattgtggga 3840 ttcgcaacaa tcaaaaagaa gtttggcgct atactatgcc ggttgaagag gtggtcgagg 3900 tagctaagtg ggcgcttgaa aacggcattc gcaacattat gttgcaaggg ggtgaattaa 3960 agacagagca acgcttagcc tacttggagg catgcgtccg tgcgattcgc gaggagacaa 4020 cgcagttaga ccttgaaatg cgcgcacgtg ccgcgagtac gacaacagcg gaagcggcag 4080 ccagtgcaca ggcagacgcc gaagctaaac gcggcgagcc agaattgggt gtggtcgtat 4140 ccttaagcgt cggagaactt cctatggaac agtatgagcg tttgttccgc gccggcgccc 4200 gtcgctatct gatccgcatt gaaacctcga atcccgacct gtacgcggca cttcacccgg 4260 agccgatgtc ctggcacgcg cgtgtagaat gcctgcgcaa cctgaagaaa gctgggtata 4320 tgttgggcac aggagtgatg gtcggcttgc cgggacaaac cttacacgac ctggctgggg 4380 atgtcatgtt ctttcgcgac attaaagcgg acatgatcgg tatgggcccc ttcattacgc 4440 agcctgggac gcctgcaact gataagtgga ccgcgctgta tccgaacgcc aataagaaca 4500 gccacatgaa atctatgttc gatctgacca ctgctatgaa tgcacttgta cgtattacga 4560 tggggaacgt aaatatcagt gctacgactg cattacaagc gattatcccc actggacgtg 4620 aaattgcgct tgagcgcggc gcaaatgttg tcatgcctat tttaacgcct actcagtatc 4680 gcgagtccta tcagttatat gagggtaagc cctgcattac ggatactgct gttcagtgtc 4740 gtcgttgcct ggacatgcgt ttgcactccg ttggcaaaac gtctgcggcc ggagtttggg 4800 gcgatcctgc ttcgttcttg catcccatcg ttggcgtccc agtcccgcac gacttgtcat 4860 cacctgcttt ggccgctgct gcaagtgcgg attttcacga ggttggcgca ggtccctgga 4920 accccatccg actagagcgt ctggttgaag tgccggaccg ttaccctgac cccgataacc 4980 acggacgcaa aaaggcagga gccgggaaag gaggcaaggc gcatgactct cacgacgatg 5040 gcgatcacga cgaccaccac caccaccacg gagctgcccc cgcgggtgca gcggctggaa 5100 agggtaccgg tgcagctgca attggtggcg gagcgggggc tagccgtcaa cgcgtagcag 5160 gggctgctgc cgcctctgct cgtctgtgtg cgggagctcg ccgcgctggc cgtgttgtcg 5220 cgtcgccatt gcgcccagct gccgcttgcc gtggtgtggc cgtcaaggcc gcagctgctg 5280 ctgcgggtga agacgctggt gctggtacgt ctggcgtagg ttcaaatatt gttacgtctc 5340 ccggaatcgc tagcactacg gcacatggtg ttcctcgtat caatattggg gtgttcggcg 5400 tgatgaatgc aggaaagtct acacttgtga atgctctggc gcaacaggaa gcatgcattg 5460 ttgactcaac ccccggcacg accgcagatg taaaaacagt tttgcttgag cttcatgccc 5520 ttggaccagc caagttgctg gacacagccg gattagacga agtcggtgga cttggggata 5580 aaaagcgccg taaagccctg aatacgctga aggagtgcga tgttgctgtg ctggttgttg 5640 acactgatac ggcagccgcc gcaatcaaat cgggacgcct tgctgaagcc ctggaatggg 5700 aatcgaaagt aatggaacag gcacacaagt ataatgtcag tcctgtactg cttctgaatg 5760 taaaatcacg cgggctgcct gaagcgcagg cagctagcat gcttgaggcg gtcgctggta 5820 tgcttgaccc atccaagcaa atccctcgta tgtcgctgga tttagcgtcc acccccctgc 5880 acgagcgtag tacgattacg tctgcattcg tcaaggaagg agcagtgcgc agttcacgct 5940 atggggctcc tctgccgggg tgtttgcccc gttggtctct tggacgcaac gcccgcttac 6000 tgatggtaat cccgatggat gccgaaaccc caggtggacg tcttcttcgt cctcaagcgc 6060 aagttatgga ggaagcaatc cgccattggg ctaccgtgct ttccgtacgc ctggatttag 6120 acgccgcacg tggcaaattg gggcccgagg cctgtgagat ggagcgtcag cgtttcgacg 6180 gggtaattgc tatgatggaa cgtaatgacg gacccaccct ggtggtgaca gattctcaag 6240 cgatcgatgt tgtacaccct tggaccctgg accgctcatc aggacgtccg ttggttccaa 6300 ttactacctt tagcatcgct atggcgtacc aacaaaacgg cggacgtttg gacccgtttg 6360 tggaaggatt ggaagcattg gagacgttac aagatgggga tcgcgttctt atttcggaag 6420 cgtgtaatca taaccgtatc acctccgctt gcaacgacat tggaatggtg cagatcccta 6480 acaagctgga ggcagcactt ggcgggaaaa agttacaaat cgaacatgcg tttggtcgcg 6540 agtttcccga gcttgagagt gggggtatgg atggattgaa gttagcgatc cattgtggag 6600 ggtgtatgat cgacgctcag aaaatgcagc agcgtatgaa agacttgcat gaggctgggg 6660 tgccggtcac taattatggg gtgtttttct cttgggcagc ttggcccgac gcccttcgtc 6720 gcgcattgga accgtgggga gtggagccac cggtaggtac tcctgctacc cccgcagccg 6780 cgcctgctac ggcagcgtcc ggggtataat actactagag ggctttacac tttatgcttc 6840 cggctcgtat gttgtgtgga aagaaggaga tatacatatg tcggtccccc tacagtgcaa 6900 tgcaggccgt cttttggcgg gccagcgccc ctgcggcgtc cgcgcgcgtc tgaaccgccg 6960 tgtatgtgtt ccagtgaccg cacacggcaa agcatctgcc acgcgcgaat acgctggtga 7020 ctttcttcca gggaccacta ttagtcatgc gtggtccgtg gagcgtgaaa ctcatcaccg 7080 ttatcgtaat ccggccgagt ggattaacga ggctgccatc cacaaggcgc ttgaaacgtc 7140 aaaggctgat gctcaggacg caggacgcgt gcgtgagatt ttggcgaagg ctaaggaaaa 7200 ggcttttgtt actgaacatg cgcctgtaaa tgcggaaagt aaatccgaat ttgtacaagg 7260 gcttaccttg gaggagtgcg ccaccttaat taacgttgat tctaataatg tcgagttgat 7320 gaatgaaatc ttcgacactg cgcttgctat caaagaacgt atctacggga accgcgtcgt 7380 gctgttcgcg cccttgtaca ttgctaatca ttgtatgaac acttgcactt attgtgcgtt 7440 tcgctcagcc aataagggca tggaacgctc tattctgaca gacgatgacc tgcgtgaaga 7500 agttgccgcc ttgcaacgtc aaggtcatcg ccgcatttta gcccttactg gagaacatcc 7560 taaatacact ttcgacaatt tcttgcatgc agtcaatgta atcgcttccg tgaagacaga 7620 gcctgaaggg tccattcgcc gtatcaatgt cgaaatccca ccacttagtg tctcagacat 7680 gcgccgcctt aagaatacag attcagttgg cacgttcgtt ctgtttcaag agacatatca 7740 ccgcgacaca ttcaaggtaa tgcatccgtc aggtccaaag agcgactttg attttcgcgt 7800 cttgacccag gaccgcgcca tgcgcgcagg cttggacgat gttggtattg gtgctttatt 7860 cgggttatat gattaccgtt atgaagtttg cgccatgtta atgcatagcg agcatttgga 7920 acgtgagtac aacgcaggac cacatactat ctctgttccc cgtatgcgcc ccgcggacgg 7980 aagcgagctt agtatcgcgc ctccttatcc tgttaatgat gctgatttta tgaaattagt 8040 tgcggtcctt cgtattgctg taccatacac aggtatgatc cttagcactc gtgaatcacc 8100 agaaatgcgc tcggcgcttc tgaagtgtgg gatgagtcaa atgagtgccg gctcgcgcac 8160 tgatgtagga gcctatcaca aagatcacac gttaagtaca gaggcgaatt tgagtaagtt 8220 agctgggcag tttaccttgc aggatgaacg tccaactaat gagattgtta agtggctgat 8280 ggaggagggc tatgtcccgt cttggtgcac agcttgttac cgtcaaggtc gtacgggcga 8340 agacttcatg aacatctgta aggctggtga cattcacgat ttctgtcatc ccaatagtct 8400 gcttacgctt caagagtacc ttatggatta tgcagatcca gaccttcgta agaaaggcga 8460 gcaagtaatt gcccgtgaga tgggaccgga cgcctctgag ccgttatcgg cgcaaagccg 8520 taagcgcctt gaacgcaaga tgaaacaagt attggagggg gagcacgatg tatatcttta 8580 accaggcatc aaataaaacg aaaggctcag tcgaaagact gggcctttcg ttttatctgt 8640 tgtttgtcgg tgaacgctct ctactagagt cacactggct caccttcggg tgggcctttc 8700 tgcgtttata 8710 <210> 37 <211> 8761 <212> DNA <213> Artificial Sequence <220> <223> Exemplary HPGC (hydrogen producing gene cluster) with codon optimised nucleic acid sequence encoding HydA (Hyd1) from Megasphaera micronuciformis, 5' - 3' <400> 37 ctagagggct ttacacttta tgcttccggc tcgtatgttg tgtggaaaga aggagatata 60 catatggcga tgcgttccac atttgctgcg cgtgtcggtg ccaaaccggc agtgcgtggg 120 gcgcgtcccg cgtcgcgtat gtcttgcatg gcctataagg ttacactgaa aacgccatca 180 ggcgataaaa caatcgaatg tccggcggac acctatatcc tggatgctgc ggaggaagcc 240 gggctggacc ttccctatag ttgccgtgcg ggcgcctgtt catcctgtgc tggcaaagtg 300 gcagctggaa cggtagatca atctgatcag tcctttctgg atgacgctca gatggggaac 360 ggattcgtcc tgacatgtgt cgcgtatcct acaagcgact gcactatcca aactcaccaa 420 gaggaggctt tatattaaaa gaaggagata tacatatgca aactgttcgc gctccagcag 480 cttcaggtgt tgccacacgt gtcgcaggtc gtcgtatgtg tcgtccggtt gcggcgacga 540 aggcttccac ggctgttacc acagacatgt cgaagcgcac tgttccaacc aagttagagg 600 aaggtgaaat gccgttgaac acgtacagta ataaagctcc gttcaaggca aaggttcgtt 660 ccgtggaaaa aatcacagga ccaaaagcca caggtgagac gtgccacatc attattgaaa 720 ccgaggggaa gatcccgttt tgggagggac aatcgtacgg tgtaattccg ccggggacca 780 agatcaactc taagggaaaa gaagtgcctc atggtactcg tctttattcg attgcttcta 840 gtcgttacgg agatgacttc gatggtcaaa cggcatcgct gtgtgttcgc cgcgcggtat 900 acgtcgatcc agagactgga aaggaggacc ccgcgaaaaa aggactgtgt agtaactttt 960 tgtgtgatgc cacaccaggc acggaaattt ccatgacagg gcccacagga aaagtattgc 1020 ttctgccagc agacgcgaac gcgccattaa tctgtgtcgc aacggggact ggaatcgcgc 1080 cttttcgctc attctggcgc cgttgcttca tcgagaatgt cccaagttat aagttcactg 1140 gccttttctg gttgtttatg ggtgtcgcta actctgatgc taaattgtac gatgaggaac 1200 tgcaagctat cgcaaaagcg tatccgggac aattccgcct ggactatgcc ttgtctcgtg 1260 aacaaaataa tcgcaagggc gggaaaatgt acatccaaga taaggttgaa gagtatgccg 1320 acgaaatttt cgatttattg gataatgggg cgcacatgta cttctgcggg ttaaagggga 1380 tgatgccagg catccaagat atgttagaac gcgttgcaaa agaaaagggg ctgaactacg 1440 aagagtgggt cgaggggtta aagcacaaga atcaatggca tgttgaagtc tactaaccag 1500 gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta tctgttgttt 1560 gtcggtgaac gctctctact agagtcacac tggctcacct tcgggtgggc ctttctgcgt 1620 ttatatacta gagggcttta cactttatgc ttccggctcg tatgttgtgt ggaaagaagg 1680 agatatacat atgtccgcat tagtacttaa gcccgggatg aaggctgtag agggatttga 1740 atcaaaatat aaattttacg acaagcgcgt gccgattgcg gacgacaacc cagctgtgca 1800 ctttgacgaa acgaaatgca aaaattgtac cctttgccgt cgtgcgtgtg aaactacgca 1860 aaccgtgctg gactattaca gcctggaacg caccggcgat gttccggttt gtgttcactg 1920 cggtcaatgt gcaaatgcct gcccgtttgg tgccatgatg gaagttgatg atacgaactt 1980 agtcaaagct gcgatcgcgg acccggataa ggtggtggtt ttccaaacgg caccggcggt 2040 acgtgtggcc attgcggaag agttcggtgc ggaggcgggt acattcgcac agggtaaaat 2100 gatttcagcg ttgagagccc tgggtggcga ctacgtgttc gacaccaact ttggcgctga 2160 catgaccatc atggaagaaa cttccgagct ggtgcgtcgt attaccactg gtaacttcgc 2220 aatgccgcag tttaccagct gctgcccggc gtgggttgag tttgctgaga ccttctacgc 2280 agaatacatc ccgcatctgt ccagcgcgaa gagcccgatt ctgatgcaaa acaccacgga 2340 aaaaatctgg tttgccgaga aggcgggcat cgatccgaag aagatggtga cggtttgcgt 2400 taccccgtgt accgctaaaa aagccgagat caagcgcaaa gaattgaatg ctgcggctga 2460 gtactggcat attgatggct taaaggactc cgacatttgc atcacgaccc gtgaactggc 2520 acgttggctg aaagcggaga acattgactt caataccctg gatgatggta tttttgatag 2580 ccacctgggc gaggcgagcg gtggtggcat catcttcggc agcaccggtg gtgtcatgga 2640 gtccgcactg cgcagcgcgt attacttcta taccggtaaa ccgatgccag cggagtatat 2700 accgtatgaa ccggtgcgtg gcttggacgg cgttaaagag gcgaccatcg acttcagcgg 2760 tatctctctg catgtcgcag tcgtgagcgg tctcggcaat gcgcgtcgtt ttctggataa 2820 aattatggcg gacggcacct tcaaagatta cacctttatc gagttcatgg cgtgccaggg 2880 tggctgcatc aacggtggtg gccaaccgaa ggttaagatg cctctggttc agaaaaccaa 2940 ccaggctcgc atgaatagct tgtacaaacg tgattcggag gtttcgatta aggccgcctg 3000 ggaaaacccc gaaatccagg aactctacag cgacttctac ggccagccgc tgtctgagcg 3060 ctctgagaag tatattcaca ccttctttga ggataagtcc ggcaacctgg gtgaaggtgg 3120 tgctgtgacc ccgcaaacga acccattgtc tccgaagtat aagccgattg aatagggatc 3180 cgggtcgagg agaaggatga gaaaaagtga ccaggcatca aataaaacga aaggctcagt 3240 cgaaagactg ggcctttcgt tttatctgtt gtttgtcggt gaacgctctc tactagagtc 3300 acactggctc accttcgggt gggcctttct gcgtttatat actagagggc tttacacttt 3360 atgcttccgg ctcgtatgtt gtgtggaaag aaggagatat acatatggct catagtttaa 3420 gcgcacattc ccgtcaggcc ggagatcgca aactgggcgc aggtgcggca tctagccgcc 3480 catcatgtcc ttctcgccgc attgtccgcg tggcggccca tgcttctgcg tccaaggcga 3540 ctcccgatgt acctgttgac gatcttcctc ctgcgcatgc ccgtgcagca gtagcggccg 3600 ctaaccgtcg tgcgcgcgct atggcatcag cggaggccgc ggcagagacc ctgggcgatt 3660 tcctgggctt agggaagggg gggctttcgc cgggcgcaac cgccaacctt gatcgtgagc 3720 aagtattagg tgtgttggag gcggtctggc gtcgtggaga ccttaatctg gagcgtgcgt 3780 tgtacagcca tgccaatgcg gtgactaaca aatactgtgg tgggggggtc tactatcgcg 3840 gccttgtgga gttcagtaat atttgccaaa acgattgctc atattgtggg attcgcaaca 3900 atcaaaaaga agtttggcgc tatactatgc cggttgaaga ggtggtcgag gtagctaagt 3960 gggcgcttga aaacggcatt cgcaacatta tgttgcaagg gggtgaatta aagacagagc 4020 aacgcttagc ctacttggag gcatgcgtcc gtgcgattcg cgaggagaca acgcagttag 4080 accttgaaat gcgcgcacgt gccgcgagta cgacaacagc ggaagcggca gccagtgcac 4140 aggcagacgc cgaagctaaa cgcggcgagc cagaattggg tgtggtcgta tccttaagcg 4200 tcggagaact tcctatggaa cagtatgagc gtttgttccg cgccggcgcc cgtcgctatc 4260 tgatccgcat tgaaacctcg aatcccgacc tgtacgcggc acttcacccg gagccgatgt 4320 cctggcacgc gcgtgtagaa tgcctgcgca acctgaagaa agctgggtat atgttgggca 4380 caggagtgat ggtcggcttg ccgggacaaa ccttacacga cctggctggg gatgtcatgt 4440 tctttcgcga cattaaagcg gacatgatcg gtatgggccc cttcattacg cagcctggga 4500 cgcctgcaac tgataagtgg accgcgctgt atccgaacgc caataagaac agccacatga 4560 aatctatgtt cgatctgacc actgctatga atgcacttgt acgtattacg atggggaacg 4620 taaatatcag tgctacgact gcattacaag cgattatccc cactggacgt gaaattgcgc 4680 ttgagcgcgg cgcaaatgtt gtcatgccta ttttaacgcc tactcagtat cgcgagtcct 4740 atcagttata tgagggtaag ccctgcatta cggatactgc tgttcagtgt cgtcgttgcc 4800 tggacatgcg tttgcactcc gttggcaaaa cgtctgcggc cggagtttgg ggcgatcctg 4860 cttcgttctt gcatcccatc gttggcgtcc cagtcccgca cgacttgtca tcacctgctt 4920 tggccgctgc tgcaagtgcg gattttcacg aggttggcgc aggtccctgg aaccccatcc 4980 gactagagcg tctggttgaa gtgccggacc gttaccctga ccccgataac cacggacgca 5040 aaaaggcagg agccgggaaa ggaggcaagg cgcatgactc tcacgacgat ggcgatcacg 5100 acgaccacca ccaccaccac ggagctgccc ccgcgggtgc agcggctgga aagggtaccg 5160 gtgcagctgc aattggtggc ggagcggggg ctagccgtca acgcgtagca ggggctgctg 5220 ccgcctctgc tcgtctgtgt gcgggagctc gccgcgctgg ccgtgttgtc gcgtcgccat 5280 tgcgcccagc tgccgcttgc cgtggtgtgg ccgtcaaggc cgcagctgct gctgcgggtg 5340 aagacgctgg tgctggtacg tctggcgtag gttcaaatat tgttacgtct cccggaatcg 5400 ctagcactac ggcacatggt gttcctcgta tcaatattgg ggtgttcggc gtgatgaatg 5460 caggaaagtc tacacttgtg aatgctctgg cgcaacagga agcatgcatt gttgactcaa 5520 cccccggcac gaccgcagat gtaaaaacag ttttgcttga gcttcatgcc cttggaccag 5580 ccaagttgct ggacacagcc ggattagacg aagtcggtgg acttggggat aaaaagcgcc 5640 gtaaagccct gaatacgctg aaggagtgcg atgttgctgt gctggttgtt gacactgata 5700 cggcagccgc cgcaatcaaa tcgggacgcc ttgctgaagc cctggaatgg gaatcgaaag 5760 taatggaaca ggcacacaag tataatgtca gtcctgtact gcttctgaat gtaaaatcac 5820 gcgggctgcc tgaagcgcag gcagctagca tgcttgaggc ggtcgctggt atgcttgacc 5880 catccaagca aatccctcgt atgtcgctgg atttagcgtc cacccccctg cacgagcgta 5940 gtacgattac gtctgcattc gtcaaggaag gagcagtgcg cagttcacgc tatggggctc 6000 ctctgccggg gtgtttgccc cgttggtctc ttggacgcaa cgcccgctta ctgatggtaa 6060 tcccgatgga tgccgaaacc ccaggtggac gtcttcttcg tcctcaagcg caagttatgg 6120 aggaagcaat ccgccattgg gctaccgtgc tttccgtacg cctggattta gacgccgcac 6180 gtggcaaatt ggggcccgag gcctgtgaga tggagcgtca gcgtttcgac ggggtaattg 6240 ctatgatgga acgtaatgac ggacccaccc tggtggtgac agattctcaa gcgatcgatg 6300 ttgtacaccc ttggaccctg gaccgctcat caggacgtcc gttggttcca attactacct 6360 ttagcatcgc tatggcgtac caacaaaacg gcggacgttt ggacccgttt gtggaaggat 6420 tggaagcatt ggagacgtta caagatgggg atcgcgttct tatttcggaa gcgtgtaatc 6480 ataaccgtat cacctccgct tgcaacgaca ttggaatggt gcagatccct aacaagctgg 6540 aggcagcact tggcgggaaa aagttacaaa tcgaacatgc gtttggtcgc gagtttcccg 6600 agcttgagag tgggggtatg gatggattga agttagcgat ccattgtgga gggtgtatga 6660 tcgacgctca gaaaatgcag cagcgtatga aagacttgca tgaggctggg gtgccggtca 6720 ctaattatgg ggtgtttttc tcttgggcag cttggcccga cgcccttcgt cgcgcattgg 6780 aaccgtgggg agtggagcca ccggtaggta ctcctgctac ccccgcagcc gcgcctgcta 6840 cggcagcgtc cggggtataa tactactaga gggctttaca ctttatgctt ccggctcgta 6900 tgttgtgtgg aaagaaggag atatacatat gtcggtcccc ctacagtgca atgcaggccg 6960 tcttttggcg ggccagcgcc cctgcggcgt ccgcgcgcgt ctgaaccgcc gtgtatgtgt 7020 tccagtgacc gcacacggca aagcatctgc cacgcgcgaa tacgctggtg actttcttcc 7080 agggaccact attagtcatg cgtggtccgt ggagcgtgaa actcatcacc gttatcgtaa 7140 tccggccgag tggattaacg aggctgccat ccacaaggcg cttgaaacgt caaaggctga 7200 tgctcaggac gcaggacgcg tgcgtgagat tttggcgaag gctaaggaaa aggcttttgt 7260 tactgaacat gcgcctgtaa atgcggaaag taaatccgaa tttgtacaag ggcttacctt 7320 ggaggagtgc gccaccttaa ttaacgttga ttctaataat gtcgagttga tgaatgaaat 7380 cttcgacact gcgcttgcta tcaaagaacg tatctacggg aaccgcgtcg tgctgttcgc 7440 gcccttgtac attgctaatc attgtatgaa cacttgcact tattgtgcgt ttcgctcagc 7500 caataagggc atggaacgct ctattctgac agacgatgac ctgcgtgaag aagttgccgc 7560 cttgcaacgt caaggtcatc gccgcatttt agcccttact ggagaacatc ctaaatacac 7620 tttcgacaat ttcttgcatg cagtcaatgt aatcgcttcc gtgaagacag agcctgaagg 7680 gtccattcgc cgtatcaatg tcgaaatccc accacttagt gtctcagaca tgcgccgcct 7740 taagaataca gattcagttg gcacgttcgt tctgtttcaa gagacatatc accgcgacac 7800 attcaaggta atgcatccgt caggtccaaa gagcgacttt gattttcgcg tcttgaccca 7860 ggaccgcgcc atgcgcgcag gcttggacga tgttggtatt ggtgctttat tcgggttata 7920 tgattaccgt tatgaagttt gcgccatgtt aatgcatagc gagcatttgg aacgtgagta 7980 caacgcagga ccacatacta tctctgttcc ccgtatgcgc cccgcggacg gaagcgagct 8040 tagtatcgcg cctccttatc ctgttaatga tgctgatttt atgaaattag ttgcggtcct 8100 tcgtattgct gtaccataca caggtatgat ccttagcact cgtgaatcac cagaaatgcg 8160 ctcggcgctt ctgaagtgtg ggatgagtca aatgagtgcc ggctcgcgca ctgatgtagg 8220 agcctatcac aaagatcaca cgttaagtac agaggcgaat ttgagtaagt tagctgggca 8280 gtttaccttg caggatgaac gtccaactaa tgagattgtt aagtggctga tggaggaggg 8340 ctatgtcccg tcttggtgca cagcttgtta ccgtcaaggt cgtacgggcg aagacttcat 8400 gaacatctgt aaggctggtg acattcacga tttctgtcat cccaatagtc tgcttacgct 8460 tcaagagtac cttatggatt atgcagatcc agaccttcgt aagaaaggcg agcaagtaat 8520 tgcccgtgag atgggaccgg acgcctctga gccgttatcg gcgcaaagcc gtaagcgcct 8580 tgaacgcaag atgaaacaag tattggaggg ggagcacgat gtatatcttt aaccaggcat 8640 caaataaaac gaaaggctca gtcgaaagac tgggcctttc gttttatctg ttgtttgtcg 8700 gtgaacgctc tctactagag tcacactggc tcaccttcgg gtgggccttt ctgcgtttat 8760 a 8761 <210> 38 <211> 8773 <212> DNA <213> Artificial Sequence <220> <223> Exemplary HPGC (hydrogen producing gene cluster) with codon optimised nucleic acid sequence encoding HydA (Hyd1) from Veillonella parvula, 5' - 3' <400> 38 ctagagggct ttacacttta tgcttccggc tcgtatgttg tgtggaaaga aggagatata 60 catatggcga tgcgttccac atttgctgcg cgtgtcggtg ccaaaccggc agtgcgtggg 120 gcgcgtcccg cgtcgcgtat gtcttgcatg gcctataagg ttacactgaa aacgccatca 180 ggcgataaaa caatcgaatg tccggcggac acctatatcc tggatgctgc ggaggaagcc 240 gggctggacc ttccctatag ttgccgtgcg ggcgcctgtt catcctgtgc tggcaaagtg 300 gcagctggaa cggtagatca atctgatcag tcctttctgg atgacgctca gatggggaac 360 ggattcgtcc tgacatgtgt cgcgtatcct acaagcgact gcactatcca aactcaccaa 420 gaggaggctt tatattaaaa gaaggagata tacatatgca aactgttcgc gctccagcag 480 cttcaggtgt tgccacacgt gtcgcaggtc gtcgtatgtg tcgtccggtt gcggcgacga 540 aggcttccac ggctgttacc acagacatgt cgaagcgcac tgttccaacc aagttagagg 600 aaggtgaaat gccgttgaac acgtacagta ataaagctcc gttcaaggca aaggttcgtt 660 ccgtggaaaa aatcacagga ccaaaagcca caggtgagac gtgccacatc attattgaaa 720 ccgaggggaa gatcccgttt tgggagggac aatcgtacgg tgtaattccg ccggggacca 780 agatcaactc taagggaaaa gaagtgcctc atggtactcg tctttattcg attgcttcta 840 gtcgttacgg agatgacttc gatggtcaaa cggcatcgct gtgtgttcgc cgcgcggtat 900 acgtcgatcc agagactgga aaggaggacc ccgcgaaaaa aggactgtgt agtaactttt 960 tgtgtgatgc cacaccaggc acggaaattt ccatgacagg gcccacagga aaagtattgc 1020 ttctgccagc agacgcgaac gcgccattaa tctgtgtcgc aacggggact ggaatcgcgc 1080 cttttcgctc attctggcgc cgttgcttca tcgagaatgt cccaagttat aagttcactg 1140 gccttttctg gttgtttatg ggtgtcgcta actctgatgc taaattgtac gatgaggaac 1200 tgcaagctat cgcaaaagcg tatccgggac aattccgcct ggactatgcc ttgtctcgtg 1260 aacaaaataa tcgcaagggc gggaaaatgt acatccaaga taaggttgaa gagtatgccg 1320 acgaaatttt cgatttattg gataatgggg cgcacatgta cttctgcggg ttaaagggga 1380 tgatgccagg catccaagat atgttagaac gcgttgcaaa agaaaagggg ctgaactacg 1440 aagagtgggt cgaggggtta aagcacaaga atcaatggca tgttgaagtc tactaaccag 1500 gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta tctgttgttt 1560 gtcggtgaac gctctctact agagtcacac tggctcacct tcgggtgggc ctttctgcgt 1620 ttatatacta gagggcttta cactttatgc ttccggctcg tatgttgtgt ggaaagaagg 1680 agatatacat atgtccgcat tagtacttaa gcccgggatg tcaaaatatc aatttttaga 1740 tagaagggtc ccgattgagg acggtaacat cgctctggtt caggatttga ctaagtgcaa 1800 aaattgtagc ctgtgtcgta aagcttgcgc ggtcgatatg ggcgtctttg actactatga 1860 tctgaccacg aatggtgacc acccgatttg catccactgc ggtcaatgtg cgtccatctg 1920 cccattcgat tctattaatg aacgcagcga gatcgatgaa gttaaggcgg cgattgcgga 1980 cccgaacaaa atcgtcatct tccagaccgc accggctgtg cgtgtgggtc ttggcgagga 2040 gttcggcttg gaggcgggta cctttgtgga aggcaagatg gttgcagccc tgagaaagct 2100 gggcggtgac tacattctgg acaccaactt tggtgcggac atgaccatca tggaagaggc 2160 gtccgagttg ctggaacgtg ttatcaactc ggatgctgtt ctgccgcaat ttaccagctg 2220 ttgtccggcg tgggttaagt tcgcggagac attctacccg gagttcctgc ctaacctgag 2280 caccgcgaag tccccgattg ccatgcaggc accgacccag aaaacctatt tcgccgaaaa 2340 aatgggtctg gacgcgaagc agattgtggc ggtggccgta actccgtgta ctgccaagaa 2400 atttgagatt cgccgtgacg aaatgaacag cagcgcagag tattggaata ccccagaaat 2460 gcgtgatacc gattactgca tcaccacgcg tgagctggca aagtggctgc gcgcagaaga 2520 aatcaacttt gacgacctcg aggacagcgc atttgatccg ctgatgggtg aggctagcgg 2580 tggcggtatt atttttggca acaccggcgg cgttatggaa gctgccatgc gcgcggcgta 2640 taaaatggca accggtgaag atgcccccca aacccttatc ccattcgagg ccatcagagg 2700 catggatggt gcgcgcgaag ctgatgttgt gatcggtgac aagaccctgc acgttgcggc 2760 ggtgcatggt acgggcaatt tacgtaaatt cattgagcgc atgcgtgcgg agaacatcca 2820 ctacgacttc atcgaggtga tggcatgccg tggtgggtgc atcggcggcg gtggccaacc 2880 gcgtgttaaa ttgccgatgg ccgacaaagc gcgcgaagct cgtatcgcgt ctctatacac 2940 ccgtgacgca gaagtgactg taaaggccgc gtgcgataat ccggatattc agaaattata 3000 tgcagagttt ttcgacggca aaccgatgag ccataaagca catcacatgc tgcataccac 3060 gttcgtgaat cgtagcgaag atttgggtcc gaacggtgcg tgcaccccgg cgacgtgccc 3120 gaccagtgtt ccgaacctga aaaaggctgc tgaagcggcg aaggcggcgg ctgaagttaa 3180 ctcttaggga tccgggtcga ggagaaggat gagaaaaagt gaccaggcat caaataaaac 3240 gaaaggctca gtcgaaagac tgggcctttc gttttatctg ttgtttgtcg gtgaacgctc 3300 tctactagag tcacactggc tcaccttcgg gtgggccttt ctgcgtttat atactagagg 3360 gctttacact ttatgcttcc ggctcgtatg ttgtgtggaa agaaggagat atacatatgg 3420 ctcatagttt aagcgcacat tcccgtcagg ccggagatcg caaactgggc gcaggtgcgg 3480 catctagccg cccatcatgt ccttctcgcc gcattgtccg cgtggcggcc catgcttctg 3540 cgtccaaggc gactcccgat gtacctgttg acgatcttcc tcctgcgcat gcccgtgcag 3600 cagtagcggc cgctaaccgt cgtgcgcgcg ctatggcatc agcggaggcc gcggcagaga 3660 ccctgggcga tttcctgggc ttagggaagg gggggctttc gccgggcgca accgccaacc 3720 ttgatcgtga gcaagtatta ggtgtgttgg aggcggtctg gcgtcgtgga gaccttaatc 3780 tggagcgtgc gttgtacagc catgccaatg cggtgactaa caaatactgt ggtggggggg 3840 tctactatcg cggccttgtg gagttcagta atatttgcca aaacgattgc tcatattgtg 3900 ggattcgcaa caatcaaaaa gaagtttggc gctatactat gccggttgaa gaggtggtcg 3960 aggtagctaa gtgggcgctt gaaaacggca ttcgcaacat tatgttgcaa gggggtgaat 4020 taaagacaga gcaacgctta gcctacttgg aggcatgcgt ccgtgcgatt cgcgaggaga 4080 caacgcagtt agaccttgaa atgcgcgcac gtgccgcgag tacgacaaca gcggaagcgg 4140 cagccagtgc acaggcagac gccgaagcta aacgcggcga gccagaattg ggtgtggtcg 4200 tatccttaag cgtcggagaa cttcctatgg aacagtatga gcgtttgttc cgcgccggcg 4260 cccgtcgcta tctgatccgc attgaaacct cgaatcccga cctgtacgcg gcacttcacc 4320 cggagccgat gtcctggcac gcgcgtgtag aatgcctgcg caacctgaag aaagctgggt 4380 atatgttggg cacaggagtg atggtcggct tgccgggaca aaccttacac gacctggctg 4440 gggatgtcat gttctttcgc gacattaaag cggacatgat cggtatgggc cccttcatta 4500 cgcagcctgg gacgcctgca actgataagt ggaccgcgct gtatccgaac gccaataaga 4560 acagccacat gaaatctatg ttcgatctga ccactgctat gaatgcactt gtacgtatta 4620 cgatggggaa cgtaaatatc agtgctacga ctgcattaca agcgattatc cccactggac 4680 gtgaaattgc gcttgagcgc ggcgcaaatg ttgtcatgcc tattttaacg cctactcagt 4740 atcgcgagtc ctatcagtta tatgagggta agccctgcat tacggatact gctgttcagt 4800 gtcgtcgttg cctggacatg cgtttgcact ccgttggcaa aacgtctgcg gccggagttt 4860 ggggcgatcc tgcttcgttc ttgcatccca tcgttggcgt cccagtcccg cacgacttgt 4920 catcacctgc tttggccgct gctgcaagtg cggattttca cgaggttggc gcaggtccct 4980 ggaaccccat ccgactagag cgtctggttg aagtgccgga ccgttaccct gaccccgata 5040 accacggacg caaaaaggca ggagccggga aaggaggcaa ggcgcatgac tctcacgacg 5100 atggcgatca cgacgaccac caccaccacc acggagctgc ccccgcgggt gcagcggctg 5160 gaaagggtac cggtgcagct gcaattggtg gcggagcggg ggctagccgt caacgcgtag 5220 caggggctgc tgccgcctct gctcgtctgt gtgcgggagc tcgccgcgct ggccgtgttg 5280 tcgcgtcgcc attgcgccca gctgccgctt gccgtggtgt ggccgtcaag gccgcagctg 5340 ctgctgcggg tgaagacgct ggtgctggta cgtctggcgt aggttcaaat attgttacgt 5400 ctcccggaat cgctagcact acggcacatg gtgttcctcg tatcaatatt ggggtgttcg 5460 gcgtgatgaa tgcaggaaag tctacacttg tgaatgctct ggcgcaacag gaagcatgca 5520 ttgttgactc aacccccggc acgaccgcag atgtaaaaac agttttgctt gagcttcatg 5580 cccttggacc agccaagttg ctggacacag ccggattaga cgaagtcggt ggacttgggg 5640 ataaaaagcg ccgtaaagcc ctgaatacgc tgaaggagtg cgatgttgct gtgctggttg 5700 ttgacactga tacggcagcc gccgcaatca aatcgggacg ccttgctgaa gccctggaat 5760 gggaatcgaa agtaatggaa caggcacaca agtataatgt cagtcctgta ctgcttctga 5820 atgtaaaatc acgcgggctg cctgaagcgc aggcagctag catgcttgag gcggtcgctg 5880 gtatgcttga cccatccaag caaatccctc gtatgtcgct ggatttagcg tccacccccc 5940 tgcacgagcg tagtacgatt acgtctgcat tcgtcaagga aggagcagtg cgcagttcac 6000 gctatggggc tcctctgccg gggtgtttgc cccgttggtc tcttggacgc aacgcccgct 6060 tactgatggt aatcccgatg gatgccgaaa ccccaggtgg acgtcttctt cgtcctcaag 6120 cgcaagttat ggaggaagca atccgccatt gggctaccgt gctttccgta cgcctggatt 6180 tagacgccgc acgtggcaaa ttggggcccg aggcctgtga gatggagcgt cagcgtttcg 6240 acggggtaat tgctatgatg gaacgtaatg acggacccac cctggtggtg acagattctc 6300 aagcgatcga tgttgtacac ccttggaccc tggaccgctc atcaggacgt ccgttggttc 6360 caattactac ctttagcatc gctatggcgt accaacaaaa cggcggacgt ttggacccgt 6420 ttgtggaagg attggaagca ttggagacgt tacaagatgg ggatcgcgtt cttatttcgg 6480 aagcgtgtaa tcataaccgt atcacctccg cttgcaacga cattggaatg gtgcagatcc 6540 ctaacaagct ggaggcagca cttggcggga aaaagttaca aatcgaacat gcgtttggtc 6600 gcgagtttcc cgagcttgag agtgggggta tggatggatt gaagttagcg atccattgtg 6660 gagggtgtat gatcgacgct cagaaaatgc agcagcgtat gaaagacttg catgaggctg 6720 gggtgccggt cactaattat ggggtgtttt tctcttgggc agcttggccc gacgcccttc 6780 gtcgcgcatt ggaaccgtgg ggagtggagc caccggtagg tactcctgct acccccgcag 6840 ccgcgcctgc tacggcagcg tccggggtat aatactacta gagggcttta cactttatgc 6900 ttccggctcg tatgttgtgt ggaaagaagg agatatacat atgtcggtcc ccctacagtg 6960 caatgcaggc cgtcttttgg cgggccagcg cccctgcggc gtccgcgcgc gtctgaaccg 7020 ccgtgtatgt gttccagtga ccgcacacgg caaagcatct gccacgcgcg aatacgctgg 7080 tgactttctt ccagggacca ctattagtca tgcgtggtcc gtggagcgtg aaactcatca 7140 ccgttatcgt aatccggccg agtggattaa cgaggctgcc atccacaagg cgcttgaaac 7200 gtcaaaggct gatgctcagg acgcaggacg cgtgcgtgag attttggcga aggctaagga 7260 aaaggctttt gttactgaac atgcgcctgt aaatgcggaa agtaaatccg aatttgtaca 7320 agggcttacc ttggaggagt gcgccacctt aattaacgtt gattctaata atgtcgagtt 7380 gatgaatgaa atcttcgaca ctgcgcttgc tatcaaagaa cgtatctacg ggaaccgcgt 7440 cgtgctgttc gcgcccttgt acattgctaa tcattgtatg aacacttgca cttattgtgc 7500 gtttcgctca gccaataagg gcatggaacg ctctattctg acagacgatg acctgcgtga 7560 agaagttgcc gccttgcaac gtcaaggtca tcgccgcatt ttagccctta ctggagaaca 7620 tcctaaatac actttcgaca atttcttgca tgcagtcaat gtaatcgctt ccgtgaagac 7680 agagcctgaa gggtccattc gccgtatcaa tgtcgaaatc ccaccactta gtgtctcaga 7740 catgcgccgc cttaagaata cagattcagt tggcacgttc gttctgtttc aagagacata 7800 tcaccgcgac acattcaagg taatgcatcc gtcaggtcca aagagcgact ttgattttcg 7860 cgtcttgacc caggaccgcg ccatgcgcgc aggcttggac gatgttggta ttggtgcttt 7920 attcgggtta tatgattacc gttatgaagt ttgcgccatg ttaatgcata gcgagcattt 7980 ggaacgtgag tacaacgcag gaccacatac tatctctgtt ccccgtatgc gccccgcgga 8040 cggaagcgag cttagtatcg cgcctcctta tcctgttaat gatgctgatt ttatgaaatt 8100 agttgcggtc cttcgtattg ctgtaccata cacaggtatg atccttagca ctcgtgaatc 8160 accagaaatg cgctcggcgc ttctgaagtg tgggatgagt caaatgagtg ccggctcgcg 8220 cactgatgta ggagcctatc acaaagatca cacgttaagt acagaggcga atttgagtaa 8280 gttagctggg cagtttacct tgcaggatga acgtccaact aatgagattg ttaagtggct 8340 gatggaggag ggctatgtcc cgtcttggtg cacagcttgt taccgtcaag gtcgtacggg 8400 cgaagacttc atgaacatct gtaaggctgg tgacattcac gatttctgtc atcccaatag 8460 tctgcttacg cttcaagagt accttatgga ttatgcagat ccagaccttc gtaagaaagg 8520 cgagcaagta attgcccgtg agatgggacc ggacgcctct gagccgttat cggcgcaaag 8580 ccgtaagcgc cttgaacgca agatgaaaca agtattggag ggggagcacg atgtatatct 8640 ttaaccaggc atcaaataaa acgaaaggct cagtcgaaag actgggcctt tcgttttatc 8700 tgttgtttgt cggtgaacgc tctctactag agtcacactg gctcaccttc gggtgggcct 8760 ttctgcgttt ata 8773 <210> 39 <211> 8734 <212> DNA <213> Artificial Sequence <220> <223> Exemplary HPGC (hydrogen producing gene cluster) with codon optimised nucleic acid sequence encoding HydA (Hyd1) from Veillonella atypica, 5' - 3' <400> 39 ctagagggct ttacacttta tgcttccggc tcgtatgttg tgtggaaaga aggagatata 60 catatggcga tgcgttccac atttgctgcg cgtgtcggtg ccaaaccggc agtgcgtggg 120 gcgcgtcccg cgtcgcgtat gtcttgcatg gcctataagg ttacactgaa aacgccatca 180 ggcgataaaa caatcgaatg tccggcggac acctatatcc tggatgctgc ggaggaagcc 240 gggctggacc ttccctatag ttgccgtgcg ggcgcctgtt catcctgtgc tggcaaagtg 300 gcagctggaa cggtagatca atctgatcag tcctttctgg atgacgctca gatggggaac 360 ggattcgtcc tgacatgtgt cgcgtatcct acaagcgact gcactatcca aactcaccaa 420 gaggaggctt tatattaaaa gaaggagata tacatatgca aactgttcgc gctccagcag 480 cttcaggtgt tgccacacgt gtcgcaggtc gtcgtatgtg tcgtccggtt gcggcgacga 540 aggcttccac ggctgttacc acagacatgt cgaagcgcac tgttccaacc aagttagagg 600 aaggtgaaat gccgttgaac acgtacagta ataaagctcc gttcaaggca aaggttcgtt 660 ccgtggaaaa aatcacagga ccaaaagcca caggtgagac gtgccacatc attattgaaa 720 ccgaggggaa gatcccgttt tgggagggac aatcgtacgg tgtaattccg ccggggacca 780 agatcaactc taagggaaaa gaagtgcctc atggtactcg tctttattcg attgcttcta 840 gtcgttacgg agatgacttc gatggtcaaa cggcatcgct gtgtgttcgc cgcgcggtat 900 acgtcgatcc agagactgga aaggaggacc ccgcgaaaaa aggactgtgt agtaactttt 960 tgtgtgatgc cacaccaggc acggaaattt ccatgacagg gcccacagga aaagtattgc 1020 ttctgccagc agacgcgaac gcgccattaa tctgtgtcgc aacggggact ggaatcgcgc 1080 cttttcgctc attctggcgc cgttgcttca tcgagaatgt cccaagttat aagttcactg 1140 gccttttctg gttgtttatg ggtgtcgcta actctgatgc taaattgtac gatgaggaac 1200 tgcaagctat cgcaaaagcg tatccgggac aattccgcct ggactatgcc ttgtctcgtg 1260 aacaaaataa tcgcaagggc gggaaaatgt acatccaaga taaggttgaa gagtatgccg 1320 acgaaatttt cgatttattg gataatgggg cgcacatgta cttctgcggg ttaaagggga 1380 tgatgccagg catccaagat atgttagaac gcgttgcaaa agaaaagggg ctgaactacg 1440 aagagtgggt cgaggggtta aagcacaaga atcaatggca tgttgaagtc tactaaccag 1500 gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta tctgttgttt 1560 gtcggtgaac gctctctact agagtcacac tggctcacct tcgggtgggc ctttctgcgt 1620 ttatatacta gagggcttta cactttatgc ttccggctcg tatgttgtgt ggaaagaagg 1680 agatatacat atgtccgcat tagtacttaa gcccgggatg tcacaatttg aatttataga 1740 taaaagggtc cctattgcgc tcgacaaccc gagcatctat cacgatatct ccaaatgcaa 1800 aaactgcacc ttatgccgtc gtgcgtgcgc cgacgtgatg agcgttctgg actactacga 1860 tctggaagcg accggtgacg tgccagtttg tattcattgt ggacaatgtg cagcggcgtg 1920 cccgtttgac tcgatgcatg caaaaagcga attggataag gtgaaggtgg ctattgccga 1980 tccggataaa atcgtcgtta ttcagaccgc tccggctgta cgcgtgtcga ttggcgaggg 2040 tttcggcttt gaaccgggta cgtttctcga gggcaaaatg gttagcgcgc tgcgtaaact 2100 gggtgccgac tacgtggtcg acacgaactt cggcgcggat ctgaccatta tggaggaggc 2160 gtctgaattg gttgatcgtc tgaagaacgg tggcacgatc ccgcaattca ccagttgctg 2220 cccggcttgg gttcgttttg cggaaatcta cttcccggag ttgatcccaa atctgtctag 2280 cacccgtagc tgcatcgcaa tggaggccgc tatgattaaa acctatttcg ctgagaaaaa 2340 gggtattaac ccggcgaata tcgtgtccgt ctccgttaat ccgtgtactg cgaagaaggc 2400 tgagacaaag cgcgtggaag aaaatgctgc cgcgcgttat tacgacgacg aatcccttgg 2460 catggatacc gacatcagca ttaccaccag agaatttatc cgttggctga acgacgaagg 2520 cgtggacttc gagtccctgg aggacagcca gtttgatgat cttatcggta tggaaactgg 2580 cgcgtctatc atttttggta ataccggtgg cgttatggag gctgctatga gaacggcgta 2640 caaactgatt acggataagg agccgccacc gtatgcactg acccacctgg aggatgtgcg 2700 cggtatgaac ggtgtgaaag aggcgacggt tcagctgggt gatgacgtga ctctgagcgt 2760 tgcggtggtt cacggcggta agaacacccg tgattttttg aatgcgctga aggagaacgg 2820 caagcactat gacttcatcg aagtcatggc atgtccgggt gggtgcattg gtggcggtgg 2880 ccaaccgcgt accaaactgc cgcaggcggt taagaccaaa gaggcgcgta tcggcggtct 2940 gtacaaggcg gacgaagaat ataagtacgt tgccagctat gaatcaccgg aaatccaaga 3000 gttgtacaag aacttcttgg gagaacctct gggtcacaaa gcacatgaat tgctgcatac 3060 ccacttcacc gatcgcagcg cacagttagg cgaccgcaaa gatgttgtcc cggagacctg 3120 tccgaccagc ccgaaataca agggttaggg atccgggtcg aggagaagga tgagaaaaag 3180 tgaccaggca tcaaataaaa cgaaaggctc agtcgaaaga ctgggccttt cgttttatct 3240 gttgtttgtc ggtgaacgct ctctactaga gtcacactgg ctcaccttcg ggtgggcctt 3300 tctgcgttta tatactagag ggctttacac tttatgcttc cggctcgtat gttgtgtgga 3360 aagaaggaga tatacatatg gctcatagtt taagcgcaca ttcccgtcag gccggagatc 3420 gcaaactggg cgcaggtgcg gcatctagcc gcccatcatg tccttctcgc cgcattgtcc 3480 gcgtggcggc ccatgcttct gcgtccaagg cgactcccga tgtacctgtt gacgatcttc 3540 ctcctgcgca tgcccgtgca gcagtagcgg ccgctaaccg tcgtgcgcgc gctatggcat 3600 cagcggaggc cgcggcagag accctgggcg atttcctggg cttagggaag ggggggcttt 3660 cgccgggcgc aaccgccaac cttgatcgtg agcaagtatt aggtgtgttg gaggcggtct 3720 ggcgtcgtgg agaccttaat ctggagcgtg cgttgtacag ccatgccaat gcggtgacta 3780 acaaatactg tggtgggggg gtctactatc gcggccttgt ggagttcagt aatatttgcc 3840 aaaacgattg ctcatattgt gggattcgca acaatcaaaa agaagtttgg cgctatacta 3900 tgccggttga agaggtggtc gaggtagcta agtgggcgct tgaaaacggc attcgcaaca 3960 ttatgttgca agggggtgaa ttaaagacag agcaacgctt agcctacttg gaggcatgcg 4020 tccgtgcgat tcgcgaggag acaacgcagt tagaccttga aatgcgcgca cgtgccgcga 4080 gtacgacaac agcggaagcg gcagccagtg cacaggcaga cgccgaagct aaacgcggcg 4140 agccagaatt gggtgtggtc gtatccttaa gcgtcggaga acttcctatg gaacagtatg 4200 agcgtttgtt ccgcgccggc gcccgtcgct atctgatccg cattgaaacc tcgaatcccg 4260 acctgtacgc ggcacttcac ccggagccga tgtcctggca cgcgcgtgta gaatgcctgc 4320 gcaacctgaa gaaagctggg tatatgttgg gcacaggagt gatggtcggc ttgccgggac 4380 aaaccttaca cgacctggct ggggatgtca tgttctttcg cgacattaaa gcggacatga 4440 tcggtatggg ccccttcatt acgcagcctg ggacgcctgc aactgataag tggaccgcgc 4500 tgtatccgaa cgccaataag aacagccaca tgaaatctat gttcgatctg accactgcta 4560 tgaatgcact tgtacgtatt acgatgggga acgtaaatat cagtgctacg actgcattac 4620 aagcgattat ccccactgga cgtgaaattg cgcttgagcg cggcgcaaat gttgtcatgc 4680 ctattttaac gcctactcag tatcgcgagt cctatcagtt atatgagggt aagccctgca 4740 ttacggatac tgctgttcag tgtcgtcgtt gcctggacat gcgtttgcac tccgttggca 4800 aaacgtctgc ggccggagtt tggggcgatc ctgcttcgtt cttgcatccc atcgttggcg 4860 tcccagtccc gcacgacttg tcatcacctg ctttggccgc tgctgcaagt gcggattttc 4920 acgaggttgg cgcaggtccc tggaacccca tccgactaga gcgtctggtt gaagtgccgg 4980 accgttaccc tgaccccgat aaccacggac gcaaaaaggc aggagccggg aaaggaggca 5040 aggcgcatga ctctcacgac gatggcgatc acgacgacca ccaccaccac cacggagctg 5100 cccccgcggg tgcagcggct ggaaagggta ccggtgcagc tgcaattggt ggcggagcgg 5160 gggctagccg tcaacgcgta gcaggggctg ctgccgcctc tgctcgtctg tgtgcgggag 5220 ctcgccgcgc tggccgtgtt gtcgcgtcgc cattgcgccc agctgccgct tgccgtggtg 5280 tggccgtcaa ggccgcagct gctgctgcgg gtgaagacgc tggtgctggt acgtctggcg 5340 taggttcaaa tattgttacg tctcccggaa tcgctagcac tacggcacat ggtgttcctc 5400 gtatcaatat tggggtgttc ggcgtgatga atgcaggaaa gtctacactt gtgaatgctc 5460 tggcgcaaca ggaagcatgc attgttgact caacccccgg cacgaccgca gatgtaaaaa 5520 cagttttgct tgagcttcat gcccttggac cagccaagtt gctggacaca gccggattag 5580 acgaagtcgg tggacttggg gataaaaagc gccgtaaagc cctgaatacg ctgaaggagt 5640 gcgatgttgc tgtgctggtt gttgacactg atacggcagc cgccgcaatc aaatcgggac 5700 gccttgctga agccctggaa tgggaatcga aagtaatgga acaggcacac aagtataatg 5760 tcagtcctgt actgcttctg aatgtaaaat cacgcgggct gcctgaagcg caggcagcta 5820 gcatgcttga ggcggtcgct ggtatgcttg acccatccaa gcaaatccct cgtatgtcgc 5880 tggatttagc gtccaccccc ctgcacgagc gtagtacgat tacgtctgca ttcgtcaagg 5940 aaggagcagt gcgcagttca cgctatgggg ctcctctgcc ggggtgtttg ccccgttggt 6000 ctcttggacg caacgcccgc ttactgatgg taatcccgat ggatgccgaa accccaggtg 6060 gacgtcttct tcgtcctcaa gcgcaagtta tggaggaagc aatccgccat tgggctaccg 6120 tgctttccgt acgcctggat ttagacgccg cacgtggcaa attggggccc gaggcctgtg 6180 agatggagcg tcagcgtttc gacggggtaa ttgctatgat ggaacgtaat gacggaccca 6240 ccctggtggt gacagattct caagcgatcg atgttgtaca cccttggacc ctggaccgct 6300 catcaggacg tccgttggtt ccaattacta cctttagcat cgctatggcg taccaacaaa 6360 acggcggacg tttggacccg tttgtggaag gattggaagc attggagacg ttacaagatg 6420 gggatcgcgt tcttatttcg gaagcgtgta atcataaccg tatcacctcc gcttgcaacg 6480 acattggaat ggtgcagatc cctaacaagc tggaggcagc acttggcggg aaaaagttac 6540 aaatcgaaca tgcgtttggt cgcgagtttc ccgagcttga gagtgggggt atggatggat 6600 tgaagttagc gatccattgt ggagggtgta tgatcgacgc tcagaaaatg cagcagcgta 6660 tgaaagactt gcatgaggct ggggtgccgg tcactaatta tggggtgttt ttctcttggg 6720 cagcttggcc cgacgccctt cgtcgcgcat tggaaccgtg gggagtggag ccaccggtag 6780 gtactcctgc tacccccgca gccgcgcctg ctacggcagc gtccggggta taatactact 6840 agagggcttt acactttatg cttccggctc gtatgttgtg tggaaagaag gagatataca 6900 tatgtcggtc cccctacagt gcaatgcagg ccgtcttttg gcgggccagc gcccctgcgg 6960 cgtccgcgcg cgtctgaacc gccgtgtatg tgttccagtg accgcacacg gcaaagcatc 7020 tgccacgcgc gaatacgctg gtgactttct tccagggacc actattagtc atgcgtggtc 7080 cgtggagcgt gaaactcatc accgttatcg taatccggcc gagtggatta acgaggctgc 7140 catccacaag gcgcttgaaa cgtcaaaggc tgatgctcag gacgcaggac gcgtgcgtga 7200 gattttggcg aaggctaagg aaaaggcttt tgttactgaa catgcgcctg taaatgcgga 7260 aagtaaatcc gaatttgtac aagggcttac cttggaggag tgcgccacct taattaacgt 7320 tgattctaat aatgtcgagt tgatgaatga aatcttcgac actgcgcttg ctatcaaaga 7380 acgtatctac gggaaccgcg tcgtgctgtt cgcgcccttg tacattgcta atcattgtat 7440 gaacacttgc acttattgtg cgtttcgctc agccaataag ggcatggaac gctctattct 7500 gacagacgat gacctgcgtg aagaagttgc cgccttgcaa cgtcaaggtc atcgccgcat 7560 tttagccctt actggagaac atcctaaata cactttcgac aatttcttgc atgcagtcaa 7620 tgtaatcgct tccgtgaaga cagagcctga agggtccatt cgccgtatca atgtcgaaat 7680 cccaccactt agtgtctcag acatgcgccg ccttaagaat acagattcag ttggcacgtt 7740 cgttctgttt caagagacat atcaccgcga cacattcaag gtaatgcatc cgtcaggtcc 7800 aaagagcgac tttgattttc gcgtcttgac ccaggaccgc gccatgcgcg caggcttgga 7860 cgatgttggt attggtgctt tattcgggtt atatgattac cgttatgaag tttgcgccat 7920 gttaatgcat agcgagcatt tggaacgtga gtacaacgca ggaccacata ctatctctgt 7980 tccccgtatg cgccccgcgg acggaagcga gcttagtatc gcgcctcctt atcctgttaa 8040 tgatgctgat tttatgaaat tagttgcggt ccttcgtatt gctgtaccat acacaggtat 8100 gatccttagc actcgtgaat caccagaaat gcgctcggcg cttctgaagt gtgggatgag 8160 tcaaatgagt gccggctcgc gcactgatgt aggagcctat cacaaagatc acacgttaag 8220 tacagaggcg aatttgagta agttagctgg gcagtttacc ttgcaggatg aacgtccaac 8280 taatgagatt gttaagtggc tgatggagga gggctatgtc ccgtcttggt gcacagcttg 8340 ttaccgtcaa ggtcgtacgg gcgaagactt catgaacatc tgtaaggctg gtgacattca 8400 cgatttctgt catcccaata gtctgcttac gcttcaagag taccttatgg attatgcaga 8460 tccagacctt cgtaagaaag gcgagcaagt aattgcccgt gagatgggac cggacgcctc 8520 tgagccgtta tcggcgcaaa gccgtaagcg ccttgaacgc aagatgaaac aagtattgga 8580 gggggagcac gatgtatatc tttaaccagg catcaaataa aacgaaaggc tcagtcgaaa 8640 gactgggcct ttcgttttat ctgttgtttg tcggtgaacg ctctctacta gagtcacact 8700 ggctcacctt cgggtgggcc tttctgcgtt tata 8734 <210> 40 <211> 8704 <212> DNA <213> Artificial Sequence <220> <223> Exemplary HPGC (hydrogen producing gene cluster) with codon optimised nucleic acid sequence encoding HydA (Hyd1) from Peptoclostridium bifermentans, 5' - 3' <400> 40 ctagagggct ttacacttta tgcttccggc tcgtatgttg tgtggaaaga aggagatata 60 catatggcga tgcgttccac atttgctgcg cgtgtcggtg ccaaaccggc agtgcgtggg 120 gcgcgtcccg cgtcgcgtat gtcttgcatg gcctataagg ttacactgaa aacgccatca 180 ggcgataaaa caatcgaatg tccggcggac acctatatcc tggatgctgc ggaggaagcc 240 gggctggacc ttccctatag ttgccgtgcg ggcgcctgtt catcctgtgc tggcaaagtg 300 gcagctggaa cggtagatca atctgatcag tcctttctgg atgacgctca gatggggaac 360 ggattcgtcc tgacatgtgt cgcgtatcct acaagcgact gcactatcca aactcaccaa 420 gaggaggctt tatattaaaa gaaggagata tacatatgca aactgttcgc gctccagcag 480 cttcaggtgt tgccacacgt gtcgcaggtc gtcgtatgtg tcgtccggtt gcggcgacga 540 aggcttccac ggctgttacc acagacatgt cgaagcgcac tgttccaacc aagttagagg 600 aaggtgaaat gccgttgaac acgtacagta ataaagctcc gttcaaggca aaggttcgtt 660 ccgtggaaaa aatcacagga ccaaaagcca caggtgagac gtgccacatc attattgaaa 720 ccgaggggaa gatcccgttt tgggagggac aatcgtacgg tgtaattccg ccggggacca 780 agatcaactc taagggaaaa gaagtgcctc atggtactcg tctttattcg attgcttcta 840 gtcgttacgg agatgacttc gatggtcaaa cggcatcgct gtgtgttcgc cgcgcggtat 900 acgtcgatcc agagactgga aaggaggacc ccgcgaaaaa aggactgtgt agtaactttt 960 tgtgtgatgc cacaccaggc acggaaattt ccatgacagg gcccacagga aaagtattgc 1020 ttctgccagc agacgcgaac gcgccattaa tctgtgtcgc aacggggact ggaatcgcgc 1080 cttttcgctc attctggcgc cgttgcttca tcgagaatgt cccaagttat aagttcactg 1140 gccttttctg gttgtttatg ggtgtcgcta actctgatgc taaattgtac gatgaggaac 1200 tgcaagctat cgcaaaagcg tatccgggac aattccgcct ggactatgcc ttgtctcgtg 1260 aacaaaataa tcgcaagggc gggaaaatgt acatccaaga taaggttgaa gagtatgccg 1320 acgaaatttt cgatttattg gataatgggg cgcacatgta cttctgcggg ttaaagggga 1380 tgatgccagg catccaagat atgttagaac gcgttgcaaa agaaaagggg ctgaactacg 1440 aagagtgggt cgaggggtta aagcacaaga atcaatggca tgttgaagtc tactaaccag 1500 gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta tctgttgttt 1560 gtcggtgaac gctctctact agagtcacac tggctcacct tcgggtgggc ctttctgcgt 1620 ttatatacta gagggcttta cactttatgc ttccggctcg tatgttgtgt ggaaagaagg 1680 agatatacat atgtccgcat tagtacttaa gcccgggatg aagcacctat ttacagaaaa 1740 agtagttccg atcgagctgg ataacccgtc cattcagatt gactttgata agtgcatcaa 1800 gtgcggtctg tgtaaacgcg tttgtgaaaa cgagattggt gttaatggtt atttcgacct 1860 ggagaagacc ggtgacatcg ccatctgcat caactgcggc caatgtgttc aggcatgtcc 1920 aaaaaaggcg atcacccagg ttatcgatgt ggatcgcgtg aaggaagcga tcaacgatcc 1980 ggaaaagatt gttatcttca gcacagcgcc agctgtgcgt gtcgcactgg gcgaagaatt 2040 taacctggaa gaaggcgcgt atgttgagga caaaatggtg gacgccctgc gtaaactggg 2100 tggagattac gtttttgacg ttacctttgg cgccgatatg accatcatgg aagaggcgaa 2160 cgaacttgtt tctcgtatca aaaacggcaa aggcaaaacc ccgcaattta ccagctgctg 2220 cccgtcctgg gttaagttcg cggaaacgtt ctatccggag ttgattccga atctgtctac 2280 cacgaaatct ccgattggca ttcagggtgc tgtcatcaag acctatttcg cacagaaagc 2340 aaatatcgac ccggagaaaa tcgtgaacgt aaccattact ccgtgcaccg ctaagaagta 2400 cgaaattgac cgtccggaga tgaatgcgag cgcaaaatac aacaaaagcg aaaatatgag 2460 agataatgac atcatcctca ccactaagga gctggcgcag tggctccgtg acgaagagat 2520 cgacttcaac gctttggagg gctcgaaatt tgacaacatc ttgggcttgg gtagcggtgc 2580 gggcattatc ttcggtaata gcggtggtgt gatggaagcc gcggtgcgca cggtctacaa 2640 tatcctcacc catgagaacc cacataaaga actgctgcac tttaatccgg ttcgtggtct 2700 ggaagacgtg aaggaggcta cccttaccat tggcgatacc accctgcgcc tggcagcggt 2760 gcaaggcacg gcgaacgtgc gtacgttgat cgaaaagctg aaatccggtg aggtggagta 2820 cgacttcata gaggtaatga cttgcaaagg tggttgtatt ggtggcgctg gtcaaccgaa 2880 gatgaaagcg cgtattagca atgagatgcg tctcaagcgc attgagggtc tgtacgataa 2940 ggacaagcac attgcggtca aatgcagcta tgaaaacccg gatgtcatca acgtgtacaa 3000 ggagttcttc aaacaaccgc tgagccattt atcccacgag ttgctgcaca ccacctttga 3060 aagcaagcac gatatgttgg gtctgaagga tgacaacaac gtttcggata ttggctaggg 3120 atccgggtcg aggagaagga tgagaaaaag tgaccaggca tcaaataaaa cgaaaggctc 3180 agtcgaaaga ctgggccttt cgttttatct gttgtttgtc ggtgaacgct ctctactaga 3240 gtcacactgg ctcaccttcg ggtgggcctt tctgcgttta tatactagag ggctttacac 3300 tttatgcttc cggctcgtat gttgtgtgga aagaaggaga tatacatatg gctcatagtt 3360 taagcgcaca ttcccgtcag gccggagatc gcaaactggg cgcaggtgcg gcatctagcc 3420 gcccatcatg tccttctcgc cgcattgtcc gcgtggcggc ccatgcttct gcgtccaagg 3480 cgactcccga tgtacctgtt gacgatcttc ctcctgcgca tgcccgtgca gcagtagcgg 3540 ccgctaaccg tcgtgcgcgc gctatggcat cagcggaggc cgcggcagag accctgggcg 3600 atttcctggg cttagggaag ggggggcttt cgccgggcgc aaccgccaac cttgatcgtg 3660 agcaagtatt aggtgtgttg gaggcggtct ggcgtcgtgg agaccttaat ctggagcgtg 3720 cgttgtacag ccatgccaat gcggtgacta acaaatactg tggtgggggg gtctactatc 3780 gcggccttgt ggagttcagt aatatttgcc aaaacgattg ctcatattgt gggattcgca 3840 acaatcaaaa agaagtttgg cgctatacta tgccggttga agaggtggtc gaggtagcta 3900 agtgggcgct tgaaaacggc attcgcaaca ttatgttgca agggggtgaa ttaaagacag 3960 agcaacgctt agcctacttg gaggcatgcg tccgtgcgat tcgcgaggag acaacgcagt 4020 tagaccttga aatgcgcgca cgtgccgcga gtacgacaac agcggaagcg gcagccagtg 4080 cacaggcaga cgccgaagct aaacgcggcg agccagaatt gggtgtggtc gtatccttaa 4140 gcgtcggaga acttcctatg gaacagtatg agcgtttgtt ccgcgccggc gcccgtcgct 4200 atctgatccg cattgaaacc tcgaatcccg acctgtacgc ggcacttcac ccggagccga 4260 tgtcctggca cgcgcgtgta gaatgcctgc gcaacctgaa gaaagctggg tatatgttgg 4320 gcacaggagt gatggtcggc ttgccgggac aaaccttaca cgacctggct ggggatgtca 4380 tgttctttcg cgacattaaa gcggacatga tcggtatggg ccccttcatt acgcagcctg 4440 ggacgcctgc aactgataag tggaccgcgc tgtatccgaa cgccaataag aacagccaca 4500 tgaaatctat gttcgatctg accactgcta tgaatgcact tgtacgtatt acgatgggga 4560 acgtaaatat cagtgctacg actgcattac aagcgattat ccccactgga cgtgaaattg 4620 cgcttgagcg cggcgcaaat gttgtcatgc ctattttaac gcctactcag tatcgcgagt 4680 cctatcagtt atatgagggt aagccctgca ttacggatac tgctgttcag tgtcgtcgtt 4740 gcctggacat gcgtttgcac tccgttggca aaacgtctgc ggccggagtt tggggcgatc 4800 ctgcttcgtt cttgcatccc atcgttggcg tcccagtccc gcacgacttg tcatcacctg 4860 ctttggccgc tgctgcaagt gcggattttc acgaggttgg cgcaggtccc tggaacccca 4920 tccgactaga gcgtctggtt gaagtgccgg accgttaccc tgaccccgat aaccacggac 4980 gcaaaaaggc aggagccggg aaaggaggca aggcgcatga ctctcacgac gatggcgatc 5040 acgacgacca ccaccaccac cacggagctg cccccgcggg tgcagcggct ggaaagggta 5100 ccggtgcagc tgcaattggt ggcggagcgg gggctagccg tcaacgcgta gcaggggctg 5160 ctgccgcctc tgctcgtctg tgtgcgggag ctcgccgcgc tggccgtgtt gtcgcgtcgc 5220 cattgcgccc agctgccgct tgccgtggtg tggccgtcaa ggccgcagct gctgctgcgg 5280 gtgaagacgc tggtgctggt acgtctggcg taggttcaaa tattgttacg tctcccggaa 5340 tcgctagcac tacggcacat ggtgttcctc gtatcaatat tggggtgttc ggcgtgatga 5400 atgcaggaaa gtctacactt gtgaatgctc tggcgcaaca ggaagcatgc attgttgact 5460 caacccccgg cacgaccgca gatgtaaaaa cagttttgct tgagcttcat gcccttggac 5520 cagccaagtt gctggacaca gccggattag acgaagtcgg tggacttggg gataaaaagc 5580 gccgtaaagc cctgaatacg ctgaaggagt gcgatgttgc tgtgctggtt gttgacactg 5640 atacggcagc cgccgcaatc aaatcgggac gccttgctga agccctggaa tgggaatcga 5700 aagtaatgga acaggcacac aagtataatg tcagtcctgt actgcttctg aatgtaaaat 5760 cacgcgggct gcctgaagcg caggcagcta gcatgcttga ggcggtcgct ggtatgcttg 5820 acccatccaa gcaaatccct cgtatgtcgc tggatttagc gtccaccccc ctgcacgagc 5880 gtagtacgat tacgtctgca ttcgtcaagg aaggagcagt gcgcagttca cgctatgggg 5940 ctcctctgcc ggggtgtttg ccccgttggt ctcttggacg caacgcccgc ttactgatgg 6000 taatcccgat ggatgccgaa accccaggtg gacgtcttct tcgtcctcaa gcgcaagtta 6060 tggaggaagc aatccgccat tgggctaccg tgctttccgt acgcctggat ttagacgccg 6120 cacgtggcaa attggggccc gaggcctgtg agatggagcg tcagcgtttc gacggggtaa 6180 ttgctatgat ggaacgtaat gacggaccca ccctggtggt gacagattct caagcgatcg 6240 atgttgtaca cccttggacc ctggaccgct catcaggacg tccgttggtt ccaattacta 6300 cctttagcat cgctatggcg taccaacaaa acggcggacg tttggacccg tttgtggaag 6360 gattggaagc attggagacg ttacaagatg gggatcgcgt tcttatttcg gaagcgtgta 6420 atcataaccg tatcacctcc gcttgcaacg acattggaat ggtgcagatc cctaacaagc 6480 tggaggcagc acttggcggg aaaaagttac aaatcgaaca tgcgtttggt cgcgagtttc 6540 ccgagcttga gagtgggggt atggatggat tgaagttagc gatccattgt ggagggtgta 6600 tgatcgacgc tcagaaaatg cagcagcgta tgaaagactt gcatgaggct ggggtgccgg 6660 tcactaatta tggggtgttt ttctcttggg cagcttggcc cgacgccctt cgtcgcgcat 6720 tggaaccgtg gggagtggag ccaccggtag gtactcctgc tacccccgca gccgcgcctg 6780 ctacggcagc gtccggggta taatactact agagggcttt acactttatg cttccggctc 6840 gtatgttgtg tggaaagaag gagatataca tatgtcggtc cccctacagt gcaatgcagg 6900 ccgtcttttg gcgggccagc gcccctgcgg cgtccgcgcg cgtctgaacc gccgtgtatg 6960 tgttccagtg accgcacacg gcaaagcatc tgccacgcgc gaatacgctg gtgactttct 7020 tccagggacc actattagtc atgcgtggtc cgtggagcgt gaaactcatc accgttatcg 7080 taatccggcc gagtggatta acgaggctgc catccacaag gcgcttgaaa cgtcaaaggc 7140 tgatgctcag gacgcaggac gcgtgcgtga gattttggcg aaggctaagg aaaaggcttt 7200 tgttactgaa catgcgcctg taaatgcgga aagtaaatcc gaatttgtac aagggcttac 7260 cttggaggag tgcgccacct taattaacgt tgattctaat aatgtcgagt tgatgaatga 7320 aatcttcgac actgcgcttg ctatcaaaga acgtatctac gggaaccgcg tcgtgctgtt 7380 cgcgcccttg tacattgcta atcattgtat gaacacttgc acttattgtg cgtttcgctc 7440 agccaataag ggcatggaac gctctattct gacagacgat gacctgcgtg aagaagttgc 7500 cgccttgcaa cgtcaaggtc atcgccgcat tttagccctt actggagaac atcctaaata 7560 cactttcgac aatttcttgc atgcagtcaa tgtaatcgct tccgtgaaga cagagcctga 7620 agggtccatt cgccgtatca atgtcgaaat cccaccactt agtgtctcag acatgcgccg 7680 ccttaagaat acagattcag ttggcacgtt cgttctgttt caagagacat atcaccgcga 7740 cacattcaag gtaatgcatc cgtcaggtcc aaagagcgac tttgattttc gcgtcttgac 7800 ccaggaccgc gccatgcgcg caggcttgga cgatgttggt attggtgctt tattcgggtt 7860 atatgattac cgttatgaag tttgcgccat gttaatgcat agcgagcatt tggaacgtga 7920 gtacaacgca ggaccacata ctatctctgt tccccgtatg cgccccgcgg acggaagcga 7980 gcttagtatc gcgcctcctt atcctgttaa tgatgctgat tttatgaaat tagttgcggt 8040 ccttcgtatt gctgtaccat acacaggtat gatccttagc actcgtgaat caccagaaat 8100 gcgctcggcg cttctgaagt gtgggatgag tcaaatgagt gccggctcgc gcactgatgt 8160 aggagcctat cacaaagatc acacgttaag tacagaggcg aatttgagta agttagctgg 8220 gcagtttacc ttgcaggatg aacgtccaac taatgagatt gttaagtggc tgatggagga 8280 gggctatgtc ccgtcttggt gcacagcttg ttaccgtcaa ggtcgtacgg gcgaagactt 8340 catgaacatc tgtaaggctg gtgacattca cgatttctgt catcccaata gtctgcttac 8400 gcttcaagag taccttatgg attatgcaga tccagacctt cgtaagaaag gcgagcaagt 8460 aattgcccgt gagatgggac cggacgcctc tgagccgtta tcggcgcaaa gccgtaagcg 8520 ccttgaacgc aagatgaaac aagtattgga gggggagcac gatgtatatc tttaaccagg 8580 catcaaataa aacgaaaggc tcagtcgaaa gactgggcct ttcgttttat ctgttgtttg 8640 tcggtgaacg ctctctacta gagtcacact ggctcacctt cgggtgggcc tttctgcgtt 8700 tata 8704

Claims

수소 가스를 생산하기 위한 다음을 포함하는 재조합 미생물:
- 미생물이 수소를 생산할 수 있도록 하는 하나 이상의 단백질을 암호화하는 외인성 핵산 서열,
- 여기서 하나 이상의 단백질은 Fe-Fe 의존성 수소화효소, 바람직하게는 HydA를 포함,
- 여기서 핵산 서열은 미생물에서 핵산 서열의 발현을 가능하게 하기 위한 하나 이상의 촉진제와 작동 가능하게 연결, 및
- 여기서 미생물 또는 세포는 5탄당 인산 경로를 통한 탄소의 이용을 촉진하는 유전자 변형을 포함함.
제1항에 있어서, 상기 핵산 서열은 단백질 페레독신 NADP 환원효소 (ferredoxin NADP reductase, FNR) 및 페레독신을 암호화하는 것인, 재조합 미생물.
제1항 또는 제2항에 있어서, 상기 핵산 서열은 수소화효소의 성숙 및 활성화를 가능하게 하는 적어도 하나의 조립 단백질을 암호화하는 것인, 재조합 미생물.
제1항 내지 제3항 중 어느 한 항에 있어서, 상기 5탄당 인산 경로를 통한 탄소의 이용을 촉진하는 유전자 변형은 포스포프룩토키나아제 (phosphofructokinase), 피루브산 키나아제 (pyruvate kinase), 글리세레이트 뮤테이즈 (glycerate mutase), 6-포스포글루코네이트 탈수소효소 (6-phosphogluconoate dehydratase) 및 2-케토-3-디옥시-6-포스포글루코네이트 알도라제 (2-keto-3-deoxy-6-phosphogluconate aldolase)로부터 선택된 미생물의 하나 이상의 내인성 단백질의 활성 또는 수준을 감소시키거나 억제하는 것인, 재조합 미생물.
제1항 내지 제4항 중 어느 한 항에 있어서, 상기 5탄당 인산 경로를 통한 탄소의 이용을 촉진하는 유전자 변형은 5탄당 인산 경로의 하나 이상의 단백질 및 NADPH 조절 단백질의 수준 또는 활성을 증가시키고, 여기서 유전자 변형은 a) 하나 이상의 단백질을 암호화하는 유전자의 프로모터 영역의 변형, 또는 b) 하나 이상의 단백질을 암호화하는 내인성 유전자를 이종 유전자 서열로 대체하는 것인, 재조합 미생물.
제2항 내지 제5항 중 어느 한 항에 있어서, 상기 FNR 및 페레독신 단백질은 클라미도모나스 레인하티 (Chlamydomonas reinhardtii)로부터 유래되거나 또는 클라미도모나스 레인하티 (Chlamydomonas reinhardtii)로부터 FNR 및 페로독신 단백질의 기능적으로 동등한 동족체 또는 유도체인 것인, 재조합 미생물.
제3항 내지 제6항 중 어느 한 항에 있어서, 상기 적어도 하나의 조립 단백질은 HydEF 및 HydG 또는 이들의 기능적으로 동등한 동족체 또는 유도체로부터 선택되는 것인, 재조합 미생물.
제7항에 있어서, 상기 핵산 서열은 클라미도모나스 레인하티 (Chlamydomonas reinhardtii)로부터의 HydEF 및 HydG, 또는 클라미도모나스 레인하티 (Chlamydomonas reinhardtii)부터의 HydEF, HydG 단백질의 기능적으로 동등한 동족체 또는 유도체를 암호화하는 것인, 재조합 미생물.
제1항 내지 제8항 중 어느 한 항에 있어서, 상기 Fe-Fe 의존성 수소화효소는 클라미도모나스 레인하티 (Chlamydomonas reinhardtii), 볼복스 카르테리 (Volvox carteri), 지아디아 람블리아 (Giardia lamblia), 엔타모에바 누탈리 (Entamoeba nuttalli), 일로박터 폴리트러포스 (Ilyobacter polytrophus), 트리코모나스 바지날리스 (Trichomonas vaginalis), 메가스파에라 마이크로누시포미스 (Megasphaera micronuciformis), 베일로넬라 파르불라 (Veillonella parvula), 베일로넬라 아티피카 (Veillonella atypica) 및 펩토클로스트리디움 비퍼멘탄스 (Peptoclostridium bifermentans)로 이루어진 군으로부터 선택된 미생물로부터의 HydA 단백질 또는 이의 기능적으로 동등한 동족체 또는 유도체인 것인, 재조합 미생물.
제9항에 있어서, 상기 HydA 단백질, 또는 이의 기능적으로 동등한 동족체 또는 그 유도체는 클라미도모나스 레인하티 (Chlamydomonas reinhardtii)로부터 유래된 것인, 재조합 미생물.
제1항 내지 제10항 중 어느 한 항에 있어서, 상기 미생물은 에쉬리키아 콜라이 (Escherichia coli, E coli)의 균주인, 재조합 미생물.
제1항 내지 제11항 중 어느 한 항에 있어서, 상기 외인성 핵산 서열은 단일 폴리뉴클레오티드 구조체로 제공되는 것인, 재조합 미생물.
제1항 내지 제12항 중 어느 한 항에 있어서, 상기 외인성 핵산 서열은 상기 미생물에서 최적화된 발현을 제공하도록 최적화된 코돈인 것인, 재조합 미생물.
세포가 수소를 생산할 수 있게 하는 단백질을 암호화하는 외인성 핵산을 포함하는 E coli 세포로서, 상기 단백질은 폴리펩타이드 HydEF, HydG, HydA, 페레독신 및 FNR로 포함하거나 구성되거나 또는 본질적으로 구성되며,
여기서 상기 HydEF, HydG, 페레독신 및 FNR은 클라미도모나스 레인하티 (Chlamydomonas reinhardtii)로부터 유래되거나, 클라미도모나스 레인하티 (Chlamydomonas reinhardtii)로부터의 HydEF, HydG, 페레독신 및 FNR의 기능적으로 동등한 동족체 또는 유도체이고,
여기서 a) 상기 세포는 포스포프룩토키나아제 (phosphofructokinase), 피루브산 키나아제 (pyruvate kinase), 글리세레이트 뮤테이즈 (glycerate mutase), 6-포스포글루코네이트 탈수소효소 (6-phosphogluconoate dehydratase) 및 2-케토-3-디옥시-6-포스포글루코네이트 알도라제 (2-keto-3-deoxy-6-phosphogluconate aldolase)로 이루어진 군으로부터 선택된 하나 이상의 내인성 단백질의 활성 또는 수준을 감소 또는 억제하는 유전적 변형을 포함하고, 및/또는 b) 상기 세포는 5탄당 인산 경로의 하나 이상의 단백질 및 NADPH 조절 단백질의 수준 또는 활성을 증가시키는 유전자 변형을 포함하는, E coli 세포.
제14항에 있어서, 상기 HydA 단백질은 클라미도모나스 레인하티 (Chlamydomonas reinhardtii), 볼복스 카르테리 (Volvox carteri), 지아디아 람블리아 (Giardia lamblia), 엔타모에바 누탈리 (Entamoeba nuttalli), 일로박터 폴리트러퍼스 (Ilyobacter polytrophus), 트리코모나스 바지날리스 (Trichomonas vaginalis), 메가스파에라 마이크로누시포미스 (Megasphaera micronuciformis), 베일로넬라 파르불라 (Veillonella parvula), 베일로넬라 아티피카 (Veillonella atypica) 및 펩토클로스트리디움 비퍼멘탄스 (Peptoclostridium bifermentans)로 이루어진 군으로부터 선택된 미생물로부터의 HydA 단백질 또는 이의 기능적으로 동등한 동족체 또는 유도체인, E coli 세포.
상기 청구항들 중 어느 한 항의 재조합 미생물 또는 세포로서, 여기서 상기 미생물 또는 세포 미생물은 포스포프룩토키나아제, 피루브산 키나아제, 글리세레이트 뮤테이즈, 6-포스포글루코네이트 탈수소효소 및 2-케토-3-디옥시-6-포스포글루코네이트 알도라제를 각각 암호화하는 유전자 pfkA, pps, gpmA/gpmM, edd 및 eda 중 하나 이상에 해당하는 핵산 서열을 부분적으로 또는 완전히 절제하는 유전자 변형을 포함하는 재조합 미생물 또는 세포.
제16항에 있어서, 상기 유전자 변형은 상기 유전자에 부분적인 기능 상실 돌연변이를 초래하는 것인, 재조합 미생물 또는 세포.
제16항 또는 제17항에 있어서, 상기 유전자 변형은 포스포프룩토키나아제 및/또는 글리세레이트 뮤테이즈의 활성을 감소 또는 억제하는 것인, 재조합 미생물 또는 세포.
제5항 또는 제14항에 있어서, 상기 5탄당 인산 경로의 하나 이상의 단백질 및 NADPH 조절 단백질은 포스포글루코뮤타제 (phosphoglucomutase), 글루코스-6-인산 탈수소효소 (glucose-6-phosphate dehydrogenase), 6-포스포글루코노락토나제 (6-phosphogluconolactonase), 글리세르알데하이드-3-인산 탈수소효소 (glyceraldehyde-3-phosphate dehydrogenase), 6-포스포글루코네이트 탈수소효소 (6-phosphogluconate dehydrogenase), 트랜스케톨라아제 (transketolase), 트랜스알돌라아제 (transaldolase), NAD키나아제 (NAD kinase) 및 가용성 피리딘 뉴클레오티드 트랜스히드로게나아제 (soluble pyridine nucleotide transhydrogenase)로 이루어진 군으로부터 선택되는 것인, 재조합 미생물 또는 세포.
제5항에 있어서, 상기 하나 이상의 단백질을 암호화하는 유전자의 프로모터 영역은 gapA 또는 osmYp 프로모터로 대체된 것인, 재조합 미생물 또는 세포.
제20항에 있어서, 상기 글루코스-6-인산 탈수소효소를 암호화하는 zwf 유전자의 프로모터가 gapA 또는 osmY 프로모터 또는 혐기성으로 유도된 nar 또는 nirB 프로모터로 대체된 것인, 재조합 미생물 또는 세포.
제20항 또는 제21항에 있어서, 상기 6-포스포글루코네이트 탈수소효소를 암호화하는 gnd 유전자의 프로모터가 gapA 또는 osmY 프로모터로 대체된 것인, 재조합 미생물 또는 세포.
제20항 내지 제22항 중 어느 한 항에 있어서, 상기 포스포글루코뮤타제를 암호화하는 pgi 유전자의 프로모터가 gapA 또는 osmY 프로모터로 대체된 것인, 재조합 미생물 또는 세포.
제20항 내지 제23항 중 어느 한 항에 있어서, 상기 6-포스포글루코노락토나제를 암호화하는 유전자 pgl의 프로모터가 gapA 또는 osmY 프로모터로 대체된 것인, 재조합 미생물 또는 세포.
제19항에 있어서, 상기 글루코스-6-인산 탈수소효소를 암호화하는 유전자 (zwf)가 자이고모나스 모빌리스 (Zygomonas mobilis)의 zwf 유전자로 대체된 것인, 재조합 미생물 또는 세포.
제19항에 있어서, 상기 6-포스포글루코네이트 탈수소효소를 암호화하는 유전자 (gnd)가 코리네박테리움 글루타미쿰 (Corynebacterium glutamicum)의 gnd 유전자로 대체된 것인, 재조합 미생물 또는 세포.
제19항에 있어서, 상기 글리세르알데하이드-3-인산 탈수소효소를 암호화하는 유전자 (gapA)가 클로스트리듐 아세토부틸리쿰 (Clostridium aceteobutylicum)의 gapC 유전자로 대체된 것인, 재조합 미생물 또는 세포.
제1항 내지 제27항 중 어느 한 항에 있어서, 상기 재조합 미생물은 에너지 소비를 위해 미생물 또는 세포가 수크로스를 대사할 수 있도록 하는 하나 이상의 단백질을 암호화하는 핵산 구조체를 포함하고, 바람직하게는 상기 핵산 구조체가 각각 수크로스 가수분해효소, 수크로스 투과효소 및 수크로스 포스포릴라아제를 암호화하는 유전자 cscA, cscB 및 sp 유전자를 포함하는 것인, 재조합 미생물 또는 세포.
제1항 내지 제28항 중 어느 한 항의 세포를 제공하는 단계;
세포가 수소 가스를 생산할 수 있도록 하기 위한 적절한 배양 배지 및 적절한 조건 하에서 상기 세포를 배양하는 단계;를 포함하는 수소 가스를 생산하는 방법.
제29항에 있어서, 상기 세포 배양이 혐기성 조건 하에 있는, 방법.
제29항 또는 제30항에 있어서, 상기 배양은 수소화효소의 성숙을 가능하게 하는 하나 이상의 인자와 세포를 접촉시키는 단계를 포함하는, 방법.
제29항 내지 제31항 중 어느 한 항에 있어서, 상기 배양은 제2철 (철 III) 또는 제1철 (철 II)을 바람직하게는 약 20 μM 이상의 농도로 배양 배지에 보충하는 것을 포함하는, 방법.
제29항 내지 제32항 중 어느 한 항에 있어서, 상기 배양은 약 37 ℃ 이하, 보다 바람직하게는 약 35 ℃ 미만, 약 32 ℃ 미만, 약 30 ℃ 미만, 약 25 ℃ 미만, 약 20 ℃ 미만, 바람직하게는 약 10 ℃ 이상에서 수행되는, 방법.
제1항 내지 제28항 중 어느 한 항의 미생물 또는 세포를 포함하는, 수소 가스로부터 전기를 생산하는 장치.