KR102121886B1 - 재조합 미생물 및 이의 용도 - Google Patents

재조합 미생물 및 이의 용도 Download PDF

Info

Publication number
KR102121886B1
KR102121886B1 KR1020197023252A KR20197023252A KR102121886B1 KR 102121886 B1 KR102121886 B1 KR 102121886B1 KR 1020197023252 A KR1020197023252 A KR 1020197023252A KR 20197023252 A KR20197023252 A KR 20197023252A KR 102121886 B1 KR102121886 B1 KR 102121886B1
Authority
KR
South Korea
Prior art keywords
seq
gly
microorganism
clostridium
ile
Prior art date
Application number
KR1020197023252A
Other languages
English (en)
Other versions
KR20190097292A (ko
Inventor
션 데니스 심슨
마이클 퀩케
마이클 ??케
풍민 류
웬디 이팅 첸
Original Assignee
란자테크 뉴질랜드 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 란자테크 뉴질랜드 리미티드 filed Critical 란자테크 뉴질랜드 리미티드
Publication of KR20190097292A publication Critical patent/KR20190097292A/ko
Application granted granted Critical
Publication of KR102121886B1 publication Critical patent/KR102121886B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/24Preparation of oxygen-containing organic compounds containing a carbonyl group
    • C12P7/26Ketones
    • C12P7/28Acetone-containing products
    • C12P7/30Acetone-containing products produced from substrate containing inorganic compounds other than water
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0006Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1025Acyltransferases (2.3)
    • C12N9/1029Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/13Transferases (2.) transferring sulfur containing groups (2.8)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y101/00Oxidoreductases acting on the CH-OH group of donors (1.1)
    • C12Y101/01Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
    • C12Y101/01001Alcohol dehydrogenase (1.1.1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y101/00Oxidoreductases acting on the CH-OH group of donors (1.1)
    • C12Y101/01Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
    • C12Y101/01002Alcohol dehydrogenase (NADP+) (1.1.1.2), i.e. aldehyde reductase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y203/00Acyltransferases (2.3)
    • C12Y203/01Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
    • C12Y203/01009Acetyl-CoA C-acetyltransferase (2.3.1.9)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y401/00Carbon-carbon lyases (4.1)
    • C12Y401/01Carboxy-lyases (4.1.1)
    • C12Y401/01004Acetoacetate decarboxylase (4.1.1.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y401/00Carbon-carbon lyases (4.1)
    • C12Y401/01Carboxy-lyases (4.1.1)
    • C12Y401/01074Indolepyruvate decarboxylase (4.1.1.74)
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/10Biofuels, e.g. bio-diesel
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P20/00Technologies relating to chemical industry
    • Y02P20/10Process efficiency
    • Y02P20/133Renewable energy sources, e.g. sunlight

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Inorganic Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

본 발명은 그 중에서도 특히 CO를 포함하는 기질의 미생물 발효에 의한 아세톤, 이소프로판올 및/또는 아세톤 및/또는 이소프로판올의 전구체의 제조 방법, 상기 방법에서 유전적으로 변형된 미생물의 용도, 유전적으로 변형된 미생물 제조에 적합한 핵산, 및 신규한 알콜 데하이드로게나제 및 상기를 코딩하는 핵산을 제공한다.

Description

재조합 미생물 및 이의 용도{RECOMBINANT MICROORGANISMS AND USES THEREFOR}
본 발명은 일산화탄소를 포함하는 기질의 미생물 발효에 의한 아세톤, 이소프로판올 및/또는 아세톤 및/또는 이소프로판올의 전구체의 제조 방법 및 상기 방법에서 유전적으로 변형된 미생물의 용도에 관한 것이다.
일부 미생물, 예컨대, 클로스트리디움 아세토부틸리쿰(Clostridium acetobutylicum) 또는 클로스트리디움 베이예린키이(Clostridium beijerinckii)는 부탄올 발효 동안 주요 부산물로서 아세톤 또는 이소프로판올을 생산하는 것으로 알려져 있다(ABE 또는 IBE 발효) (문헌 [George HA, Johnson JL, Moore WEC, Hoideman LV, Chen JS: Acetone, isopropanol, and butanol production by Clostridium beijerinckii (syn. Clostridium butylicum) and Clostridium aurantibutyricum. Appl Environ Microbiol 45: 1160-1163]). 그러나, 이러한 유기체는 모두 당 또는 전분 기반 기질에 의존한다. 아세트산 생성 유기체, 예컨대, 밀접한 관계가 있는 미생물, 클로스트리디움 오토에타노게눔(Clostridium autoethanogenum), C. 륭달리이(C. ljungdahlii), 및 C. 라그스달레이(C. ragsdalei)는 유일의 에너지 및 탄소 공급원으로서 CO 또는 CO2/H2 함유 가스 상에서 화학 자가 영양 방식으로 성장할 수 있고, 생성물, 예컨대, 아세테이트, 에탄올, 또는 2,3-부탄디올은 합성하지만, 아세톤도 이소프로판올도 합성하지 못한다(문헌 [Munasinghe PC, Khanal SK: Biomass-derived syngas fermentation into biofuels: Opportunities and challenges. Bioresource Technol 2010, 5013-22]).
최근, 100 L 파일롯 규모의 발효기 중에서의 클로스트리디움 라그스달레이(Clostridium ragsdalei)(클로스트리디움 균주 P11)에 관한 연구에서 이소프로판올이 지팽이풀 유래의 합성 가스로부터 생산되었다는 것이 보고되었다 (문헌 [Kundiyana DK, Huhnke RL, Wilkins MR: Syngas fermentation in a 100-L pilot scale fermentor: Design and process considerations. J Biosci Bioeng 2010, 109: 492-498]). 그러나, 같은 실험실의 관련 연구에서 상기와 같은 결과는 20% 아세톤을 함유하는 세정 혼합물을 통과시키기 때문에 사용된 합성 가스 중에 오염 물질이 존재하는 것에 기인하는 것으로 밝혀졌다(문헌 [Ramachandriya KD: Effect of biomass generated producer gas, methane and physical parameters on producer gas fermentations by Clostridium strain P11. Masters thesis, Oklahoma State University 2009]). 저자들은 또한 이소프로판올 생산은 아세톤보다는 프로피온산 환원의 결과일 수 있다고 언급하였다. 본 발명의 발명자들에 의해 클로스트리디움 라그스달레이(클로스트리디움 균주 P11) 및 C. 오토에타노게눔(C. autoethanogenum) 및 C. 륭달리이 또한 이용하여 수행된 실험을 통해서는 아세톤, 이소프로판올, 또는 프로피온산 생산이 밝혀지지 않았다.
화학적 생성물, 예컨대, 아세톤 및 이소프로판올 생산에 적합한 다수의 탄수화물 공급 원료 비용은 인간 식량 또는 동물 사료로서의 이의 가치에 영향을 받고, 상기의 것을 생산하기 위해 전분 또는 수크로스 생산 작물을 재배하는 것은 모든 지역에서 경제적으로 지속이 불가능하다. 그러므로, 저비용 및/또는 보다 풍부한 탄소 자원을 유용한 화학적 생성물, 예컨대, 아세톤 및 이소프로판올로 전환시키는 기술을 개발하는 것이 관심의 대상이 된다.
CO는 유기 물질, 예컨대, 석탄 또는 오일 및 오일 유래 생성물의 불완전 연소의 에너지가 풍부한 주된 유리 부산물이다. 예를 들어, 호주의 철강 산업을 통해서는 매년 500,000톤이 넘는 CO가 생산되고 대기로 방출되고 있다고 보고되었다.
본 발명의 목적은 선행 기술의 단점들 중 하나 이상을 극복하거나, 적어도 대중에게 유용한 선택을 제공하고자 하는 것이다.
본 발명의 요약
본 발명은 일반적으로 그 중에서도 특히 CO를 포함하는 기질의 미생물 발효에 의한 아세톤, 이소프로판올 및/또는 아세톤 및/또는 이소프로판올의 전구체의 제조 방법, 상기 방법에서 유전적으로 변형된 미생물의 용도, 유전적으로 변형된 미생물 제조에 적합한 핵산, 및 신규한 알콜 데하이드로게나제 및 상기를 코딩하는 핵산을 제공한다.
제1 측면에서, 본 발명은 CO를 포함하는 기질의 발효에 의해 아세톤, 이소프로판올 및/또는 아세톤 및/또는 이소프로판올의 전구체를 생산할 수 있는 카복시도트로픽 아세트산 생성 재조합 미생물을 제공한다.
한 특정 실시양태에서, 미생물은 재조합 미생물 유래의 기원이 되는 모체 미생물에는 천연적으로 존재하지 않는 이소프로판올 생합성 경로 중의 하나 이상의 효소를 발현하도록 적합화된다. 또 다른 실시양태에서, 미생물은 재조합 미생물 유래의 기원이 되는 모체 미생물에 천연적으로 존재하는 이소프로판올 생합성 경로 중의 하나 이상의 효소를 과다발현하도록 적합화된다.
한 특정 실시양태에서, 미생물은 재조합 미생물 유래의 기원이 되는 모체 미생물에는 천연적으로 존재하지 않는 아세톤 생합성 경로 중의 하나 이상의 효소를 발현하도록 적합화된다. 또 다른 실시양태에서, 미생물은 재조합 미생물 유래의 기원이 되는 모체 미생물에 천연적으로 존재하는 아세톤 생합성 경로 중의 하나 이상의 효소를 과다발현하도록 적합화된다.
한 특정 실시양태에서, 미생물은 재조합 미생물 유래의 기원이 되는 모체 미생물에는 천연적으로 존재하지 않는 아세톤에서 이소프로판올로의 전환에 관여하는 하나 이상의 효소를 발현하도록 적합화된다. 또 다른 실시양태에서, 미생물은 재조합 미생물 유래의 기원이 되는 모체 미생물에 천연적으로 존재하는 아세톤에서 이소프로판올로의 전환에 관여하는 하나 이상의 효소를 과다발현하도록 적합화된다.
한 실시양태에서, 모체 미생물은 CO를 포함하는 기질을 발효시켜 아세톤을 생산할 수는 있지만, 아세톤에서 이소프로판올로 전환시키지는 못하고, 재조합 미생물은 아세톤에서 이소프로판올로의 전환에 관여하는 하나 이상의 효소를 발현하도록 적합화된다.
또 다른 실시양태에서, 모체 미생물은 아세톤에서 이소프로판올로 전환시킬 수는 있지만, CO를 포함하는 기질을 발효시키지 못하므로 아세톤을 생산할 수 없고, 재조합 미생물은 아세톤 생합성 경로 중의 하나 이상의 효소를 발현하도록 적합화된다.
한 실시양태에서, 모체 미생물은 CO를 포함하는 기질을 발효시키지 못하므로 아세톤 및 이소프로판올을 생산할 수 없고, 재조합 미생물은 아세톤 생합성 경로 중의 하나 이상의 효소, 및 아세톤에서 이소프로판올로의 전환에 관여하는 하나 이상의 효소를 발현하도록 적합화된다.
한 실시양태에서 이소프로판올 및/또는 아세톤 생합성 경로 중의 하나 이상의 효소는
아세틸-코엔자임 A 아세틸트랜스퍼라제(티올라제; ThlA; E.C. 2.3.1.9);
아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 A(CoA 트랜스퍼라제; CtfA; EC 2.8.3.9);
아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 B(CoA 트랜스퍼라제; CtfB; EC 2.8.3.9);
아세토아세테이트 데카복실라제(Adc; EC 4.1.1.4);
알파-케토이소발레레이트 데카복실라제(데카복실라제; KivD; EC4.1.1.74); 및
이의 임의의 하나 이상의 기능적 등가 변이체로 구성된 군으로부터 선택된다.
한 실시양태에서, 아세틸-코엔자임 A 아세틸트랜스퍼라제(티올라제; ThlA)는 C. 아세토부틸리쿰으로부터 유래된 것이다.
한 실시양태에서, 효소 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 A(CoA 트랜스퍼라제; CtfA), 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 B(CoA 트랜스퍼라제; CtfB) 및 아세토아세테이트 데카복실라제(Adc)는 C. 베이예린키이(C. beijerinckii)로부터 유래된 것이다.
한 실시양태에서, 알파-케토이소발레레이트 데카복실라제(데카복실라제; KivD)는 락토코커스 락티스(Lactococcus lactis)로부터 유래된 것이다.
한 실시양태에서, 아세톤에서 이소프로판올로의 전환에 관여하는 하나 이상의 효소는
알콜 데하이드로게나제(Adh; EC 1.1.1.2);
알콜 데하이드로게나제(Adh2; EC 1.1.1.1) 및
이의 기능적 등가 변이체로 구성된 군으로부터 선택된다.
한 실시양태에서, 알콜 데하이드로게나제(Adh)는 C. 오토에타노게눔, C. 륭달리이, 및/또는 C. 라그스달레이로부터 유래된 것이다. 한 실시양태에서, 알콜 데하이드로게나제는 서열 번호 1의 아미노산 서열을 가지거나, 또는 이의 기능적 등가 변이체이다. 한 실시양태에서, 기능적 등가 변이체는 서열 번호 1과 대략 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 가진다.
한 실시양태에서, 알콜 데하이드로게나제(Adh2)는 S. 세레비지아에(S. cerevisiae)로부터 유래된 것이다.
한 실시양태에서, 미생물은 모체 미생물에 고유한 하나 이상의 핵산의 발현을 증가시키도록 적합화된 하나 이상의 외인성 핵산을 포함하고, 여기서, 하나 이상의 핵산은 본원에서 앞서 언급된 효소들 중 하나 이상을 코딩한다.
한 실시양태에서, 발현을 증가시키도록 적합화된 하나 이상의 외인성 핵산은 조절 요소이다. 한 실시양태에서, 조절 요소는 프로모터이다. 한 실시양태에서, 프로모터는 구성적 프로모터이다. 한 실시양태에서, 프로모터는 우드-륭달(Wood-Ljungdahl) 유전자 클러스터 또는 포스포트랜스아세틸라제/아세테이트 키나제 오페론 프로모터를 포함하는 군으로부터 선택된다. 한 실시양태에서, 프로모터는 서열 번호 22 또는 서열 번호 77의 서열을 가지거나, 또는 이의 기능적 등가 변이체이다.
한 실시양태에서, 미생물은 본원에서 앞서 언급된 효소들 중 하나 이상을 코딩하고, 그를 발현하도록 적합화된 하나 이상의 외인성 핵산을 포함한다. 한 실시양태에서, 미생물은 2가지 이상의 효소를 코딩하고, 그를 발현하도록 적합화된 하나 이상의 외인성 핵산을 포함한다. 다른 실시양태에서, 미생물은 3, 4, 5 또는 6가지의 효소를 코딩하고, 그를 발현하도록 적합화된 하나 이상의 외인성 핵산을 포함한다.
한 특정 실시양태에서, 미생물은 아세틸-코엔자임 A 아세틸트랜스퍼라제(티올라제; ThlA; E.C. 2.3.1.9), 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 A(CoA 트랜스퍼라제; CtfA; EC 2.8.3.9), 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 B(CoA 트랜스퍼라제; CtfB; EC 2.8.3.9), 및 아세토아세테이트 데카복실라제(Adc; EC 4.1.1.4) 또는 이의 임의의 하나 이상의 기능적 등가 변이체 각각을 코딩하는 하나 이상의 외인성 핵산을 포함한다.
한 특정 실시양태에서, 미생물은 알콜 데하이드로게나제(Adh; EC 1.1.1.2) 또는 이의 기능적 등가 변이체를 코딩하는 하나 이상의 외인성 핵산을 포함한다.
한 특정 실시양태에서, 미생물은 아세틸-코엔자임 A 아세틸트랜스퍼라제(티올라제; ThlA; E.C. 2.3.1.9), 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 A(CoA 트랜스퍼라제; CtfA; EC 2.8.3.9), 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 B(CoA 트랜스퍼라제; CtfB; EC 2.8.3.9), 아세토아세테이트 데카복실라제(Adc; EC 4.1.1.4), 및 알콜 데하이드로게나제(Adh; EC 1.1.1.2), 또는 이의 임의의 하나 이상의 기능적 등가 변이체 각각을 코딩하는 하나 이상의 외인성 핵산을 포함한다.
한 특정 실시양태에서, 미생물은 알파-케토이소발레레이트 데카복실라제(데카복실라제; KivD; EC4.1.1.74), 및 알콜 데하이드로게나제(Adh2; EC 1.1.1.1), 또는 이의 임의의 하나 이상의 기능적 등가 변이체 각각을 코딩하는 하나 이상의 외인성 핵산을 포함한다.
한 특정 실시양태에서, 미생물은 아세틸-코엔자임 A 아세틸트랜스퍼라제(티올라제; ThlA; E.C. 2.3.1.9), 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 A(CoA 트랜스퍼라제; CtfA; EC 2.8.3.9), 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 B(CoA 트랜스퍼라제; CtfB; EC 2.8.3.9), 및 알파-케토이소발레레이트 데카복실라제(데카복실라제; KivD; EC4.1.1.74), 또는 이의 임의의 하나 이상의 기능적 등가 변이체 각각을 코딩하는 하나 이상의 외인성 핵산을 포함한다.
한 특정 실시양태에서, 미생물은 알파-케토이소발레레이트 데카복실라제(데카복실라제; KivD; EC4.1.1.74), 또는 이의 기능적 등가 변이체를 코딩하는 하나 이상의 외인성 핵산을 포함한다.
한 특정 실시양태에서, 미생물은 아세틸-코엔자임 A 아세틸트랜스퍼라제(티올라제; ThlA; E.C. 2.3.1.9), 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 A(CoA 트랜스퍼라제; CtfA; EC 2.8.3.9), 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 B(CoA 트랜스퍼라제; CtfB; EC 2.8.3.9), 아세토아세테이트 데카복실라제(Adc; EC 4.1.1.4), 및 알콜 데하이드로게나제(Adh2; EC 1.1.1.1), 또는 이의 임의의 하나 이상의 기능적 등가 변이체 각각을 코딩하는 하나 이상의 외인성 핵산을 포함한다.
또 다른 특정 실시양태에서, 미생물은 아세틸-코엔자임 A 아세틸트랜스퍼라제(티올라제; ThlA; E.C. 2.3.1.9), 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 A(CoA 트랜스퍼라제; CtfA; EC 2.8.3.9), 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 B(CoA 트랜스퍼라제; CtfB; EC 2.8.3.9), 아세토아세테이트 데카복실라제(Adc; EC 4.1.1.4), 알파-케토이소발레레이트 데카복실라제(데카복실라제; KivD; EC4.1.1.74), 및 알콜 데하이드로게나제(Adh2; EC 1.1.1.1), 또는 이의 임의의 하나 이상의 기능적 등가 변이체 각각을 코딩하는 하나 이상의 외인성 핵산을 포함한다.
한 실시양태에서, 아세틸-코엔자임 A 아세틸트랜스퍼라제(티올라제; ThlA)를 코딩하는 핵산은 서열 번호 18의 서열, 또는 이의 기능적 등가 변이체를 포함한다. 한 실시양태에서, 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 A(CoA 트랜스퍼라제; CtfA)를 코딩하는 핵산은 서열 번호 19의 서열, 또는 이의 기능적 등가 변이체를 포함한다. 한 실시양태에서, 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 B(CoA 트랜스퍼라제; CtfB)를 코딩하는 핵산은 서열 번호 20의 서열, 또는 이의 기능적 등가 변이체를 포함한다. 한 실시양태에서, 아세토아세테이트 데카복실라제(Adc)를 코딩하는 핵산은 서열 번호 21의 서열, 또는 이의 기능적 등가 변이체를 포함한다. 한 실시양태에서, 알파-케토이소발레레이트 데카복실라제(데카복실라제; KivD)를 코딩하는 핵산은 서열 번호 71의 서열, 또는 이의 기능적 등가 변이체를 포함한다. 한 실시양태에서, 알콜 데하이드로게나제(Adh)를 코딩하는 핵산은 서열 번호 2, 서열 번호 3, 또는 서열 번호 4의 서열, 또는 이의 어느 하나의 기능적 등가 변이체를 포함한다. 한 실시양태에서, 알콜 데하이드로게나제(Adh)를 코딩하는 핵산의 기능적 등가 변이체는 서열 번호 2, 3 또는 4와 대략 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 가진다. 한 실시양태에서, 알콜 데하이드로게나제(Adh2)를 코딩하는 핵산은 서열 번호 75의 서열, 또는 이의 기능적 등가 변이체를 포함한다.
한 실시양태에서, 하나 이상의 외인성 핵산은 핵산 구성물(construct) 또는 벡터이고, 한 특정 실시양태에서는 임의 조합된, 본원에서 앞서 언급된 효소들 중 하나 이상을 코딩하는 플라스미드이다.
한 실시양태에서, 외인성 핵산은 발현 플라스미드이다. 한 특정 실시양태에서, 발현 플라스미드는 서열 번호 46, 48, 83, 84, 95, 98 또는 101의 뉴클레오티드 서열을 가진다.
한 실시양태에서, 모체 미생물은 클로스트리디움 오토에타노게눔, 클로스트리디움 륭달리이, 클로스트리디움 라그스달레이, 클로스트리디움 카복시디보란스(Clostridium carboxidivorans), 클로스트리디움 드라케이(Clostridium drakei), 클로스트리디움 스카톨로게네스(Clostridium scatologenes), 부티리박테리움 리모숨(Butyribacterium limosum), 부티리박테리움 메틸로트로피쿰(Butyribacterium methylotrophicum), 아세토박테리움 우디이(Acetobacterium woodii), 알칼리바큘룸 박키이(Alkalibaculum bacchii), 블라우티아 프로덕타(Blautia producta), 유박테리움 리모숨(Eubacterium limosum), 모어렐라 써모아세티카(Moorella thermoacetica), 모어렐라 써모오토트로피카(Moorella thermoautotrophica), 옥소박터 펜니기이(Oxobacter pfennigii), 및 써모아내로박터 키우비(Thermoanaerobacter kiuvi)를 포함하는 군으로부터 선택되는 카복시도트로픽 아세트산 생성 박테리아으로부터 선택된다.
한 실시양태에서, 모체 미생물은 클로스트리디움 오토에타노게눔 또는 클로스트리디움 륭달리이이다. 한 특정 실시양태에서, 미생물은 클로스트리디움 오토에타노게눔 DSM23693이다. 또 다른 특정 실시양태에서, 미생물은 클로스트리디움 륭달리이 DSM13528(또는 ATCC55383)이다.
한 실시양태에서, 모체 미생물에는 ThlA, CtfA, CtfB, Adc, KivD, Adh 및 Adh2를 코딩하는 하나 이상의 유전자가 존재하지 않는다. 한 특정 실시양태에서, 모체 미생물에는 Adh를 코딩하는 유전자가 존재하지 않는다. 또 다른 특정 실시양태에서, 모체 미생물에는 ThlA, CtfA, CtfB, 및 Adc 및 KivD를 코딩하는 각각의 유전자가 존재하지 않는다.
제2 측면에서, 본 발명은 서열 번호 1의 아미노산 서열을 가지는 알콜 데하이드로게나제(Adh), 또는 이의 어느 하나의 기능적 등가 변이체를 제공한다.
한 특정 실시양태에서, 알콜 데하이드로게나제(Adh)의 기능적 등가 변이체는 서열 번호 1과 대략 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 가진다.
제3 측면에서, 본 발명은 서열 번호 1의 Adh를 코딩하는 핵산, 이의 기능적 등가 변이체를 제공한다.
제4 측면에서, 본 발명은
서열 번호 2
서열 번호 3
서열 번호 4; 및
이의 어느 하나의 기능적 등가 변이체로 이루어진 군으로부터 선택되는 서열을 가지는 핵산을 제공한다.
한 특정 실시양태에서, 서열 번호 2, 3 또는 4의 기능적 등가 변이체는 서열 번호 2, 3 또는 4와 대략 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 가지는 핵산이다.
제5 측면에서, 본 발명은 서열 번호 2, 3 또는 4의 핵산, 이의 어느 하나에 상보적인 핵산, 또는 이의 어느 하나의 기능적 등가 변이체 중 적어도 일부에 하이브리드화할 수 핵산을 제공한다.
제6 측면에서, 본 발명은 서열 번호 5; 서열 번호 6; 서열 번호 7; 서열 번호 8; 서열 번호 9; 서열 번호 10; 서열 번호 11; 서열 번호 12; 서열 번호 13; 서열 번호 14; 서열 번호 15; 서열 번호 16; 서열 번호 17; 서열 번호 18; 서열 번호 23; 서열 번호 24; 서열 번호 25; 서열 번호 26; 서열 번호 27; 서열 번호 28; 서열 번호 29; 서열 번호 30; 서열 번호 31; 서열 번호 32; 서열 번호 33; 서열 번호 64; 서열 번호 65; 서열 번호 66; 서열 번호 67; 서열 번호 68; 서열 번호 69; 서열 번호 70; 서열 번호 71; 서열 번호 85; 서열 번호 86; 서열 번호 87; 서열 번호 88; 서열 번호 89; 서열 번호 90; 서열 번호 91; 서열 번호 92; 서열 번호 93; 서열 번호 94; 서열 번호 96; 서열 번호 97; 서열 번호 99; 서열 번호 100으로 이루어진 군으로부터 선택되는 핵산을 제공한다.
제7 측면에서, 본 발명은 미생물에서 발현되었을 때, 미생물이 CO를 포함하는 기질의 발효에 의해 아세톤, 이소프로판올 및/또는 아세톤 및/또는 이소프로판올의 전구체를 생산하도록 하는 하나 이상의 효소를 코딩하는 핵산을 제공한다.
한 실시양태에서, 핵산은 미생물에서 발현되었을 때, 미생물이 CO를 포함하는 기질의 발효에 의해 아세톤, 이소프로판올 및/또는 아세톤 및/또는 이소프로판올의 전구체를 생산하도록 하는 2 이상의 효소를 코딩한다.
한 실시양태에서, 본 발명의 핵산은 3, 4, 5 또는 6가지의 상기 효소를 코딩한다.
한 실시양태에서, 효소는 아세틸-코엔자임 A 아세틸트랜스퍼라제(티올라제; ThlA), 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 A(CoA 트랜스퍼라제; CtfA), 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 B(CoA 트랜스퍼라제; CtfB), 아세토아세테이트 데카복실라제(Adc), 알파-케토이소발레레이트 데카복실라제(데카복실라제; KivD), 알콜 데하이드로게나제(Adh2), 알콜 데하이드로게나제(Adh) 및 이의 임의의 하나 이상의 기능적 등가 변이체로부터 선택된다.
한 실시양태에서, 핵산은 임의 순서로 아세틸 코엔자임 A 아세틸트랜스퍼라제(티올라제; ThlA), 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 A(CoA 트랜스퍼라제; CtfA), 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 B(CoA 트랜스퍼라제; CtfB), 및 아세토아세테이트 데카복실라제(Adc) 또는 이의 임의의 하나 이상의 기능적 등가 변이체 각각을 코딩하는 핵산 서열을 포함한다.
한 실시양태에서, 핵산은 알콜 데하이드로게나제(Adh) 또는 이의 기능적 등가 변이체를 코딩하는 핵산 서열을 포함한다.
한 실시양태에서, 핵산은 임의 순서로 아세틸 코엔자임 A 아세틸트랜스퍼라제(티올라제; ThlA), 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 A(CoA 트랜스퍼라제; CtfA), 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 B(CoA 트랜스퍼라제; CtfB), 아세토아세테이트 데카복실라제(Adc), 및 알콜 데하이드로게나제(Adh) 또는 이의 임의의 하나 이상의 기능적 등가 변이체 각각을 코딩하는 핵산 서열을 포함한다.
한 실시양태에서, 핵산은 임의 순서로 알파-케토이소발레레이트 데카복실라제(데카복실라제; KivD), 알콜 데하이드로게나제(Adh2), 또는 이의 임의의 하나 이상의 기능적 등가 변이체 각각을 코딩하는 핵산 서열을 포함한다.
한 실시양태에서, 핵산은 임의 순서로 아세틸 코엔자임 A 아세틸트랜스퍼라제(티올라제; ThlA), 아세토아세틸-CoA.아세테이트 코엔자임 A 트랜스퍼라제 A(CoA 트랜스퍼라제; CtfA), 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 B(CoA 트랜스퍼라제; CtfB), 알파-케토이소발레레이트 데카복실라제(데카복실라제; KivD), 또는 이의 임의의 하나 이상의 기능적 등가 변이체 각각을 코딩하는 핵산 서열을 포함한다.
한 실시양태에서, 핵산은 임의 순서로 알파-케토이소발레레이트 데카복실라제(데카복실라제; KivD), 또는 이의 임의의 하나 이상의 기능적 등가 변이체 각각을 코딩하는 핵산 서열을 포함한다.
한 실시양태에서, 핵산은 임의 순서로 아세틸-코엔자임 A 아세틸트랜스퍼라제(티올라제; ThlA), 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 A(CoA 트랜스퍼라제; CtfA), 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 B(CoA 트랜스퍼라제; CtfB), 아세토아세테이트 데카복실라제(Adc), 알콜 데하이드로게나제(Adh2), 또는 이의 임의의 하나 이상의 기능적 등가 변이체 각각을 코딩하는 핵산 서열을 포함한다.
한 실시양태에서, 핵산은 임의 순서로 아세틸-코엔자임 A 아세틸트랜스퍼라제(티올라제; ThlA), 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 A(CoA 트랜스퍼라제; CtfA), 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 B(CoA 트랜스퍼라제; CtfB), 아세토아세테이트 데카복실라제(Adc), 알파-케토이소발레레이트 데카복실라제(데카복실라제; KivD), 알콜 데하이드로게나제(Adh2), 또는 이의 임의의 하나 이상의 기능적 등가 변이체 각각을 코딩하는 핵산 서열을 포함한다.
한 실시양태에서, 핵산은 서열 번호 42의 서열을 가지는 아세틸-코엔자임 A 아세틸트랜스퍼라제(티올라제; ThlA), 또는 이의 기능적 등가 변이체를 코딩한다.
한 실시양태에서, 핵산은 서열 번호 43의 서열을 가지는 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 A(CoA 트랜스퍼라제; CtfA), 또는 이의 기능적 등가 변이체를 코딩한다.
한 실시양태에서, 핵산은 서열 번호 43 및 서열 번호 44의 서열을 가지는 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 B(CoA 트랜스퍼라제; CtfB), 또는 이의 기능적 등가 변이체를 코딩한다.
한 실시양태에서, 핵산은 서열 번호 45의 서열을 가지는 아세토아세테이트 데카복실라제(Adc), 또는 이의 기능적 등가 변이체를 코딩한다.
한 실시양태에서, 핵산은 서열 번호 38 및 서열 번호 40의 서열을 가지는 알콜 데하이드로게나제(Adh)를 코딩한다. 한 특정 실시양태에서, 핵산은 서열 번호 1의 서열을 가지는 알콜 데하이드로게나제(Adh), 또는 이의 기능적 등가 변이체를 코딩한다. 한 특정 실시양태에서, 알콜 데하이드로게나제(Adh)의 기능적 등가 변이체는 서열 번호 1과 대략 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 가진다.
한 실시양태에서, 핵산은 서열 번호 73의 서열을 가지는 알파-케토이소발레레이트 데카복실라제(데카복실라제; KivD), 또는 이의 기능적 등가 변이체를 코딩한다.
한 실시양태에서, 핵산은 서열 번호 75의 서열을 가지는 알콜 데하이드로게나제(Adh2), 또는 이의 기능적 등가 변이체를 코딩한다.
한 실시양태에서, 아세틸-코엔자임 A 아세틸트랜스퍼라제(티올라제; ThlA)를 코딩하는 핵산 서열은 서열 번호 18을 포함하거나, 또는 이의 기능적 등가 변이체이다.
한 실시양태에서, 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 A(CoA 트랜스퍼라제; CtfA)를 코딩하는 핵산 서열은 서열 번호 19를 포함하거나, 또는 이의 기능적 등가 변이체이다.
한 실시양태에서, 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 B(CoA 트랜스퍼라제; CtfB)를 코딩하는 핵산 서열은 서열 번호 20, 또는 이의 기능적 등가 변이체를 포함한다.
한 실시양태에서, 아세토아세테이트 데카복실라제(Adc)를 코딩하는 핵산 서열은 서열 번호 21을 포함하거나, 또는 이의 기능적 등가 변이체이다.
한 실시양태에서, 알콜 데하이드로게나제(Adh)를 코딩하는 핵산 서열은 서열 번호 39 또는 41을 포함한다. 한 특정 실시양태에서, 알콜 데하이드로게나제(Adh)를 코딩하는 핵산 서열은 서열 번호 2, 서열 번호 3, 또는 서열 번호 4를 포함하거나, 또는 이의 어느 하나의 기능적 등가 변이체이다. 한 실시양태에서, 서열 번호 2, 서열 번호 3, 또는 서열 번호 4의 기능적 등가 변이체는 서열 번호 2, 3 또는 4와 대략 83%, 84%, 85%, 86%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 가진다.
한 실시양태에서, 알파-케토이소발레레이트 데카복실라제(데카복실라제; KivD)를 코딩하는 핵산 서열은 서열 번호 72 또는 76을 포함하거나, 또는 이의 기능적 등가 변이체이다.
한 실시양태에서, 알콜 데하이드로게나제(Adh2)를 코딩하는 핵산 서열은 서열 번호 74 또는 77을 포함하거나, 또는 이의 기능적 등가 변이체이다.
한 실시양태에서, 본 발명의 핵산은 프로모터를 추가로 포함한다. 한 실시양태에서, 프로모터는 이의 제어하에 유전자의 구성적 발현이 이루어질 수 있도록 한다. 특정 실시양태에서, 우드-륭달 클러스터 프로모터가 사용된다. 또 다른 특정 실시양태에서, 포스포트랜스아세틸라제/아세테이트 키나제 오페론 프로모터가 사용된다. 한 특정 실시양태에서, 프로모터는 C. 오토에타노게눔으로부터의 것이다. 한 특정 실시양태에서, 프로모터는 서열 번호 22, 서열 번호 79의 서열을 가지거나, 또는 이의 기능적 등가 변이체이다.
제8 측면에서, 본 발명은 제7 측면의 하나 이상의 핵산을 포함하는 핵산 구성물 또는 벡터를 제공한다.
한 특정 실시양태에서, 핵산 구성물 또는 벡터는 발현 구성물 또는 벡터이다. 한 특정 실시양태에서, 발현 구성물 또는 벡터는 플라스미드이다. 한 특정 실시양태에서, 발현 플라스미드는 서열 번호 46, 47, 48, 83, 84, 95, 98 또는 101의 뉴클레오티드 서열을 가진다.
제9 측면에서, 본 발명은 제7측면의 핵산 또는 제8 측면의 구성물 중 임의의 하나 이상을 포함하는 숙주 유기체를 제공한다.
제10 측면에서, 본 발명은 본 발명의 제8 측면에서 언급된 발현 구성물 또는 벡터 및 메틸화 구성물 또는 벡터를 포함하는 조성물을 제공한다.
바람직하게, 조성물은 본 발명의 제1 측면에 따른 재조합 미생물을 제조할 수 있다.
한 특정 실시양태에서, 발현 구성물/벡터 및/또는 메틸화 구성물/벡터는 플라스미드이다.
제11 측면에서, 본 발명은
a. (i) 본 발명의 제8 측면의 발현 구성물/벡터 및 (ii) 메틸트랜스퍼라제 유전자를 포함하는 메틸화 구성물/벡터를 셔틀 미생물 내로 도입시키는 단계;
b. 메틸트랜스퍼라제 유전자를 발현시키는 단계;
c. 셔틀 미생물로부터 하나 이상의 구성물/벡터를 단리시키는 단계; 및
d. 적어도 발현 구성물/벡터를 목적 미생물 내로 도입시키는 단계를 포함하는, 본 발명의 재조합 미생물을 제조하는 방법을 제공한다.
한 실시양태에서, B단계의 메틸트랜스퍼라제 유전자 둘 모두는 항시(constitutively) 발현된다. 또 다른 실시양태에서, B단계의 메틸트랜스퍼라제 유전자의 발현은 유도적으로 이루어진다.
한 실시양태에서, 메틸화 구성물/벡터 및 발현 구성물/벡터, 둘 모두는 C단계에서 단리된다. 또 다른 실시양태에서, 오직 발현 구성물/벡터만이 C단계에서 단리된다.
한 실시양태에서, 오직 발현 구성물/벡터만이 목적 미생물 내로 도입된다. 또 다른 실시양태에서, 발현 구성물/벡터 및 메틸화 구성물/벡터, 둘 모두는 목적 미생물 내로 도입된다.
관련된 측면에서, 본 발명은
a. 시험관내에서 본 발명의 제8 측면의 발현 구성물/벡터를 메틸트랜스퍼라제에 의해 메틸화시키는 단계;
b. 발현 구성물/벡터를 목적 미생물 내로 도입시키는 단계를 포함하는, 본 발명의 재조합 미생물을 제조하는 방법을 제공한다.
추가의 관련된 측면에서, 본 발명은
a. 메틸트랜스퍼라제 유전자를 셔틀 미생물의 게놈 내로 도입시키는 단계;
b. 본 발명의 제8 측면의 발현 구성물/벡터를 셔틀 미생물 내로 도입시키는 단계;
c. 셔틀 미생물로부터 하나 이상의 구성물/벡터를 단리시키는 단계; 및
d. 적어도 발현 구성물/벡터를 목적 미생물 내로 도입시키는 단계를 포함하는, 본 발명의 재조합 미생물을 제조하는 방법을 제공한다.
제12 측면에서, 본 발명은 본 발명의 제1 측면은 재조합 미생물을 사용하여 CO를 포함하는 기질을 발효시키는 단계를 포함하는, 미생물 발효에 의해 아세톤, 이소프로판올, 및/또는 아세톤 및/또는 이소프로판올의 전구체를 제조하는 방법을 제공한다.
한 실시양태에서, 본 방법은
(a) 본 발명의 제1 측면의 하나 이상의 미생물의 배양물을 함유하는 바이오반응기에 CO를 포함하는 기질을 제공하는 단계;
(b) 바이오반응기에서 배양물을 혐기적으로 발효시켜 아세톤, 이소프로판올, 및/또는 아세톤 및/또는 이소프로판올의 전구체를 제조하는 단계를 포함한다.
한 실시양태에서, 본 방법은
(a) 산업 공정의 결과로서 생산되는 CO 함유 가스를 상기 가스가 대기로 방출되기 이전에 포획하는 단계;
(b) 본 발명의 제1 측면의 하나 이상의 미생물의 배양물을 함유하는 배양물에 의한 CO 함유 가스의 혐기성 발효를 통해 아세톤, 이소프로판올, 및/또는 아세톤 및/또는 이소프로판올의 전구체를 제조하는 단계를 포함한다.
상기 방법 측면의 특정 실시양태에서, 미생물을 수성 배양 배지 중에 유지시킨다.
상기 방법 측면의 특정 실시양태에서, 기질 발효는 바이오반응기에서 이루어진다.
바람직하게, CO를 포함하는 기질은 CO를 포함하는 가스 기질이다. 한 실시양태에서, 기질은 산업 폐가스를 포함한다. 특정 실시양태에서, 가스는 제철소 폐가스 또는 합성 가스이다.
한 실시양태에서, 기질은 전형적으로는 대부분 CO를 함유할 것이며, 예컨대, 적어도 약 20부피% 내지 약 100부피%의 CO, 20% 내지 70부피%의 CO, 30부피% 내지 60부피%의 CO, 및 40부피% 내지 55부피%의 CO를 함유할 것이다. 특정 실시양태에서, 기질은 약 25부피%, 또는 약 30부피%, 또는 약 35부피%, 또는 약 40부피%, 또는 약 45부피%, 또는 약 50부피% CO, 또는 약 55부피% CO, 또는 약 60부피% CO를 포함한다.
특정 실시양태에서, 본 방법은 발효 브로쓰, 발효 브로쓰로부터 아세톤, 이소프로판올, 및/또는 아세톤 및/또는 이소프로판올의 전구체 중 하나 이상을 회수하는 단계를 추가로 포함한다.
제13 측면에서, 본 발명은 제6 측면의 방법에 의해 제조된 때, 아세톤, 이소프로판올, 및 아세톤 및/또는 이소프로판올의 전구체 중 하나 이상을 제공할 수 있다.
또 다른 측면에서, 본 발명은 카복시도트로픽 아세트산 생성 모체 미생물을 하나 이상의 외인성 핵산으로 형질전환시켜 상기 미생물이 CO를 포함하는 기질의 발효에 의해 아세톤, 이소프로판올 및/또는 아세톤 및/또는 이소프로판올의 전구체를 생산할 수 있도록 하는 단계를 포함하며, 여기서, 모체 미생물은 CO를 포함하는 기질의 발효에 의해 아세톤, 이소프로판올 및/또는 이의 전구체를 생산하지 못하는 것인 것인, 본 발명의 제1 측면의 미생물을 제조하는 방법을 제공한다.
한 특정 실시양태에서, 모체 미생물을 모체 미생물에는 천연적으로 존재하지 않는 이소프로판올 생합성 경로 중의 하나 이상의 효소를 발현하도록 적합화된 하나 이상의 외인성 핵산으로 형질전환시킨다. 또 다른 실시양태에서, 모체 미생물을 모체 미생물에 천연적으로 존재하는 이소프로판올 생합성 경로 중의 하나 이상의 효소를 과다발현하도록 적합화된 하나 이상의 핵산으로 형질전환시킨다.
한 특정 실시양태에서, 모체 미생물을 모체 미생물에는 천연적으로 존재하지 않는 아세톤 생합성 경로 중의 하나 이상의 효소를 발현하도록 적합화된 하나 이상의 외인성 핵산으로 형질전환시킨다. 또 다른 실시양태에서, 모체 미생물을 모체 미생물에 천연적으로 존재하는 아세톤 생합성 경로 중의 하나 이상의 효소를 과다발현하도록 적합화된 하나 이상의 핵산으로 형질전환시킨다.
한 특정 실시양태에서, 모체 미생물을 모체 미생물에는 천연적으로 존재하지 않는 아세톤에서 이소프로판올로의 전환에 관여하는 하나 이상의 효소를 발현하도록 적합화된 하나 이상의 핵산으로 형질전환시킨다. 또 다른 실시양태에서, 모체 미생물을 모체 미생물에 천연적으로 존재하는 아세톤에서 이소프로판올로의 전환에 관여하는 하나 이상의 효소를 과다발현하도록 적합화된 하나 이상의 핵산으로 형질전환시킨다.
특정 실시양태에서, 하나 이상의 효소는 본원에서 앞서 기술된 것과 같다.
또 다른 측면에서, 본 발명은 아세톤을 생산할 수 있고, 아세토락테이트를 아세톤으로 전환시키도록 적합화된 하나 이상의 효소를 코딩하는 하나 이상의 외인성 핵산을 포함하는 재조합 미생물로서, 여기서, 재조합 미생물은 아세톤이 아닌, 아세토락테이트를 생산할 수 있는 모체 미생물로부터 유래된 것인, 재조합 미생물을 제공한다. 한 실시양태에서, 하나 이상의 효소는 KivD 또는 이의 기능적 등가 변이체를 포함한다.
또 다른 측면에서, 본 발명은 아세톤을 생산할 수 있고, 각각의 효소 thlA, ctfA, ctfB 및 kivD 또는 이의 임의의 하나 이상의 기능적 등가 변이체를 코딩하는 하나 이상의 외인성 핵산을 포함하는 재조합 미생물로서, 여기서, 재조합 미생물은 아세토락테이트, 아세토아세틸-CoA 및 아세톤을 생산할 수 없는 모체 미생물로부터 유래된 것인, 재조합 미생물을 제공한다.
또 다른 측면에서, 본 발명은 아세톤을 생산할 수 있고, 각각의 효소 ctfA, ctfB 및 kivD 또는 이의 임의의 하나 이상의 기능적 등가 변이체를 코딩하는 하나 이상의 외인성 핵산을 포함하는 재조합 미생물로서, 여기서, 재조합 미생물은 아세토락테이트 및 아세톤을 생산할 수 없는 모체 미생물로부터 유래된 것인, 재조합 미생물을 제공한다.
본 발명은 또한 광범위하게는 본 출원의 명세서에서 개별적으로 또는 집합적으로 언급되거나 명시된 부분들, 요소들 및 특징들 중 둘 이상의 임의의 또는 모든 조합으로 상기 부분들, 요소들 및 특징들로 구성되는 것이라고 할 수 있고, 본 발명과 관련된 분야에서 공지된 등가물을 가지는 특정 정수가 본원에서 언급되는 경우, 이러한 공지된 등가물은 마치 개별적으로 기재되는 것처럼 본원에 포함되는 것으로 간주된다.
이의 모든 신규한 측면에서 고려되어야 하는 본 발명의 이들 및 다른 측면은 첨부된 도면과 관련하여 단지 예로서 제공된 하기 설명으로부터 명백해질 것이다 :
도 1은 C. 오토에타노게눔(CAU), C. 륭달리이(CD), 및 C. 라그스달레이(CRA)의 신규한 알콜 데하이드로게나제와, C. 베이예린키이 균주 NRRL-B593의 2차 알콜 데하이드로게나제의 아미노산 정렬을 보여주는 것이다.
도 2는 전형적인 발효 런(run) 동안의 클로스트리디움 오토에타노게눔 DSM23693의 신규한 알콜 데하이드로게나제 유전자의 발현 뿐만 아니라, 우드-륭달 오페론 프로모터, F1F0 ATP아제 오페론 프로모터, Rnf 복합체 오페론 프로모터, 및 피루베이트:페레독신 옥시도리덕타제 프로모터에 의해 제어되는 유전자의 발현을 보여주는 것이다. 관심의 대상이 되는 200개 초과 유전자의 mRNA 수준을 비교하였다.
도 3은 아세톤 발현 플라스미드 pMTL85147-thlA-ctfA-ctfB-adc를 보여주는 것이다.
도 4는 플라스미드 pMTL85147-thlA-ctfA-ctfB-adc를 보유하는 조작된 C. 오토에타노게눔 및 C. 륭달리이에서 CO 또는 CO/H2 함유 가스로부터의 아세톤 및 이소프로판올 생산 경로를 보여주는 것이다.
도 5는 아세톤 발현 플라스미드 pMTL85147-thlA-ctfA-ctfB-adc의 서열 분석 결과를 보여주는 것이다.
도 6은 디자인된 메틸화 플라스미드를 도시한 것이다.
도 7은 형질전환된 C. 오토에타노게눔 DSM23693 및 C. 륭달리이 DSM13528로부터 단리된 플라스미드의 PCR로부터의 ctfAB-adc(2.2 kb)의 검출을 보여주는 것이다. 래더 = 1 KB + DNA 래더 (인비트로겐(Invitrogen)); 1= 비주형 대조군; 2= C. 오토에타노게눔으로부터 단리된 플라스미드; 3= C. 륭달리이로부터 단리된 플라스미드; 4= 원래의 pMTL85147-thlA-ctfAB-adc(양성 대조군).
도 8은 제철소 가스 상에서의 C. 오토에타노게눔 DSM23693 + pMTL85147-thlA-ctfAB-adc를 이용한 성장 실험 결과를 보여주는 것이다.
도 9는 제철소 가스 상에서의 C. 륭달리이 DSM13528 + pMTL85147-thlA-ctfAB-adc를 이용한 성장 실험 결과를 보여주는 것이다.
도 10은 C. 오토에타노게눔 DSM13528 + pMTL85147-thlA-ctfAB-adc(상단) 및 C. 륭달리이 DSM13528 + pMTL85147-thlA-ctfAB-adc(하단)를 이용한 제철소 가스로부터의 아세톤 생산을 확인하는 GC 결과를 보여주는 것이다.
도 11은 C. 오토에타노게눔 DSM23693 + pMTL85147-thlA-ctf AB-adc를 이용한 합성 가스로부터의 아세톤 생산을 확인하는 GC 결과를 보여주는 것이다.
도 12는 C. 오토에타노게눔 DSM23693의 배양물에 대한 아세톤의 독성을 보여주는 것이다.
도 13은 C. 오토에타노게눔 DSM23693의 배양물에 대한 이소프로판올의 독성을 보여주는 것이다.
도 14는 서열 번호 1: C. 오토에타노게눔, C. 륭달리이 및 C. 라그스달레이로부터의 신규한 알콜 데하이드로게나제의 아미노산 서열을 보여주는 것이다.
도 15는 서열 번호 2: C. 오토에타노게눔으로부터의 신규한 알콜 데하이드로게나제 유전자의 핵산 서열을 보여주는 것이다.
도 16은 서열 번호 3: C. 륭달리이로부터의 신규한 알콜 데하이드로게나제 유전자의 핵산 서열을 보여주는 것이다.
도 17은 서열 번호 4: C. 라그스달레이로부터의 신규한 알콜 데하이드로게나제 유전자의 핵산 서열을 보여주는 것이다.
도 18은 서열 번호 18: C. 아세토부틸리쿰 ATCC824로부터의 티올라제 유전자(thlA)의 핵산 서열을 보여주는 것이다.
도 19는 서열 번호 19: C. 베이예린키이 NCIMB8052로부터의 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 A(ctfA) 유전자의 핵산 서열을 보여주는 것이다.
도 20은 서열 번호 20: C. 베이예린키이 NCIMB8052로부터의 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 B(ctfB) 유전자의 핵산 서열을 보여주는 것이다.
도 21은 서열 번호 21: C. 베이예린키이 NCIMB8052로부터의 아세토아세테이트 데카복실라제(adc) 유전자의 핵산 서열을 보여주는 것이다.
도 22는 서열 번호 22: C. 오토에타노게눔으로부터의 우드-륭달 클러스터 프로모터(PWL)의 핵산 서열을 보여주는 것이다.
도 23은 서열 번호 34: 디자인된 II형 메틸트랜스퍼라제 유전자의 아미노산 서열을 보여주는 것이다.
도 24는 서열 번호 35: 디자인된 II형 메틸트랜스퍼라제 유전자의 핵산 서열을 보여주는 것이다.
도 25는 서열 번호 38: 클로스트리디움 베이예린키이 NRRL B-593으로부터의 NADP 의존성 알콜 데하이드로게나제의 아미노산 서열을 보여주는 것이다.
도 26은 서열 번호 39: 클로스트리디움 베이예린키이 NRRL B-593으로부터의 NADP 의존성 알콜 데하이드로게나제의 핵산 서열을 보여주는 것이다.
도 27은 서열 번호 40: 써모아내로박터 브로키(Thermoanaerobacter brockii) ATCC 53556으로부터의 NADP 의존성 알콜 데하이드로게나제의 아미노산 서열을 보여주는 것이다.
도 28은 서열 번호 41: 써모아내로박터 브로키로부터의 알콜 데하이드로게나제의 핵산 서열을 보여주는 것이다.
도 29는 서열 번호 42: C. 아세토부틸리쿰 ATCC824로부터의 티올라제 ThlA의 아미노산 서열을 보여주는 것이다.
도 30은 서열 번호 43: C. 베이예린키이 NCIMB8052로부터의 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 A CtfA의 아미노산 서열을 보여주는 것이다.
도 31은 서열 번호 44: C. 베이예린키이 NCIMB8052로부터의 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 A CtfB의 아미노산 서열을 보여주는 것이다.
도 32는 서열 번호 45: C. 베이예린키이 NCIMB8052로부터의 아세토아세테이트 데카복실라제의 아미노산 서열을 보여주는 것이다.
도 33은 서열 번호 46: 신규한 알콜 데하이드로게나제 pMTL85147-thlA-ctfAB-adc를 함유하는 발현 플라스미드의 핵산 서열을 보여주는 것이다.
도 34는 서열 번호 47: C. 베이예린키이의 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 A(ctfA), 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 B(ctfB), 및 아세토아세테이트 데카복실라제(adc) 오페론의 핵산 서열을 보여주는 것이다.
도 35는 서열 번호 48: 신규한 알콜 데하이드로게나제 pMTL85147-thlA-ctfAB-adc-adh를 함유하는 발현 플라스미드의 핵산 서열을 보여주는 것이다.
도 36은 서열 번호 49: 디자인된 메틸화 플라스미드의 핵산 서열을 보여주는 것이다.
도 37은 서열 번호 50: lac 프로모터의 핵산 서열을 보여주는 것이다.
도 38은 서열 번호 51: 클로스트리디움 오토에타노게눔 F1F0 ATP아제 오페론 프로모터 영역의 핵산 서열을 보여주는 것이다.
도 39는 서열 번호 52: 클로스트리디움 오토에타노게눔 Rnf 복합체 오페론 프로모터 영역의 핵산 서열을 보여주는 것이다.
도 40은 서열 번호 53: 클로스트리디움 오토에타노게눔 피루베이트.-페레독신 옥시도리덕타제 프로모터 영역의 핵산 서열을 보여주는 것이다.
도 41은 신규한 알콜 데하이드로게나제 pMTL85147-thlA-ctfA-ctfB-adc-adh를 함유하는 발현 플라스미드의 서열 분석 결과를 보여주는 것이다.
도 42는 대조군 플라스미드(pMTL85147), 아세톤 발현 플라스미드 (pMTL85147-thlA-ctfA-ctfB-adc), 및 신규한 알콜 데하이드로게나제를 포함하는 아세톤 발현 플라스미드(pMTL85147-thlA-ctfA-ctfB-adc-adh)를 보유하는 E. 콜라이(E. coli) XL-1 블루(Blue) MRF' Kan을 이용한 아세톤 및 이소프로판올 생산 결과를 보여주는 것이다.
도 43은 신규한 알콜 데하이드로게나제 pMTL85147-thlA-ctfA-ctfB-adc-adh를 함유하는 발현 플라스미드를 보여주는 것이다.
도 44는 서열 번호 56: C. 륭달리이로부터의 우드-륭달 클러스터 프로모터(PWL)의 핵산 서열을 보여주는 것이다.
도 45는 서열 번호 57: C. 라그스달레이로부터의 우드-륭달 클러스터 프로모터(PWL)의 핵산 서열을 보여주는 것이다.
도 46은 서열 번호 58: 클로스트리디움 륭달리이 F1F0 ATP아제 오페론 프로모터 영역의 핵산 서열을 보여주는 것이다.
도 47은 서열 번호 59: 클로스트리디움 라그스달레이 F1F0 ATP아제 오페론 프로모터 영역의 핵산 서열을 보여주는 것이다.
도 48은 서열 번호 60: 클로스트리디움 륭달리이 Rnf 복합체 오페론 프로모터 영역의 핵산 서열을 보여주는 것이다.
도 49는 서열 번호 61: 클로스트리디움 라그스달레이 Rnf 복합체 오페론 프로모터 영역의 핵산 서열을 보여주는 것이다.
도 50은 서열 번호 62: 클로스트리디움 륭달리이 피루베이트:페레독신 옥시도리덕타제 프로모터 영역의 핵산 서열을 보여주는 것이다.
도 51은 서열 번호 63: 클로스트리디움 라그스달레이 피루베이트:페레독신 옥시도리덕타제 프로모터 영역의 핵산 서열을 보여주는 것이다.
도 52는 플라스미드 pMTL85147-thlA-ctfAB-adc를 보유하는 클로스트리디움 오토에타노게눔에서의 이종성 유전자 thlA, ctfA, ctfB, 및 adc에 대한 프로브 증폭을 확인하기 위한 qRT-PCR 증폭 플롯을 보여주는 것이다.
도 53은 플라스미드 pMTL85147-thlA-ctfAB-adc를 보유하는 클로스트리디움 륭달리이에서의 이종성 유전자 thlA, ctfA, ctfB, 및 adc에 대한 프로브 증폭을 확인하기 위한 qRT-PCR 증폭 플롯을 보여주는 것이다.
도 54는 서열 번호 73: 락토코커스 락티스 KF147로부터의 알파-케토이소발레레이트 데카복실라제 KivD의 아미노산 서열, 및 서열 번호 72: 알파-케토산 데카복실라제(kivd)의 핵산 서열을 보여주는 것이다.
도 55는 서열 번호 76: 알파-케토산 데카복실라제(kivd)의 코돈 최적화된 서열, 서열 번호 75: 사카로마이세스 세레비지아에(Saccharomyces cerevisiae)로부터의 알콜 데하이드로게나제 Adh2의 아미노산 서열 및 서열 번호 74: 알콜 데하이드로게나제(adh2)의 핵산 서열을 보여주는 것이다.
도 56은 서열 번호 78: NdeI 및 KpnI 측면에 위치하는, 리보솜 결합 부위와 함께 스페이서 서열을 포함하는 코돈 최적화된 알파-케토산 데카복실라제(kivd) 및 알콜 데하이드로게나제(Adh2)의 합성 오페론 및 서열 번호 77: 알콜 데하이드로게나제(Adh2)의 코돈 최적화된 서열을 보여주는 것이다.
도 57은 서열 번호 82: E. 콜라이-클로스트리디움 셔틀 벡터 pMTL 85245의 핵산 서열, 및 서열 번호 79: C. 오토에타노게눔으로부터의 포스포트랜스아세틸라제 아세테이트 키나제 프로모터의 핵산 서열을 보여주는 것이다.
도 58은 서열 번호 83: 발현 플라스미드 pMTL85245-kivd-adh2의 핵산 서열을 보여주는 것이다.
도 59는 서열 번호 84: 발현 플라스미드 pMTL85245-kivd의 핵산 서열을 보여주는 것이다.
도 60은 서열 번호 93: 발현 플라스미드 pMTL85245-P-thl-ctfAB-P-kivd의 핵산 서열을 보여주는 것이다.
도 61은 서열 번호 98: 발현 플라스미드 pMTL83147-thlA-ctfAB-adc-adh2의 핵산 서열을 보여주는 것이다.
도 62는 서열 번호 101: 발현 플라스미드 pMTL83147-thlA-ctfAB-adc-P-kivd -adh2의 핵산 서열을 보여주는 것이다.
도 63은 아세톤 발현 플라스미드 pMTL85245-kivd-adh2를 보여주는 것이다.
도 64는 아세톤 발현 플라스미드 pMTL85245-kivd를 보여주는 것이다.
도 65는 대조군 균주로서 C. 오토에타노게눔 DSM23693(상단) 및 C. 오토에타노게눔 DSM23693 + pMTL85245-kivd-adh2(하단)를 이용한 CO 함유 제철소 가스로부터의 아세톤 및 이소프로판올 생산을 확인하는 GC 결과를 보여주는 것이다.
도 66은 C. 오토에타노게눔 DSM23693 + pMTL85245-kivd를 이용한 CO 함유 제철소 가스로부터의 아세톤 및 이소프로판올 생산을 확인하는 GC 결과를 보여주는 것이다.
도 67은 아세톤 발현 플라스미드 pMTL85147-thlA-ctfA-ctfB-adc-P-kivd를 보여주는 것이다.
도 68은 아세톤 발현 플라스미드 pMTL83147-thlA-ctfA-ctfB-adc-adh를 보여주는 것이다.
도 69는 아세톤 발현 플라스미드 pMTL83147-thlA-ctfA-ctfB-adc-P-kivd-adh를 보여주는 것이다.
도 70은 C. 오토에타노게눔 DSM23693(상단) 및 C. 오토에타노게눔 DSM23693 + pMTL85245-Pwl-thlA-ctfAB-kivd를 이용한 CO 함유 제철소 가스로부터의 아세톤 및 이소프로판올 생산을 확인하는 GC 결과를 보여주는 것이다.
도 71은 C. 오토에타노게눔 DSM23693 + pMTL83147-thlA-ctfAB-adc-adh2를 이용한 CO 함유 제철소 가스로부터의 아세톤 및 이소프로판올 생산을 확인하는 GC 결과를 보여주는 것이다.
도 72는 C. 오토에타노게눔 DSM23693 + pMTL83147-thlA-ctfAB-adc-P-kivd-adh2를 이용한 CO 함유 제철소 가스로부터의 아세톤 및 이소프로판올 생산을 확인하는 GC 결과를 보여주는 것이다.
도 73은 E. 콜라이 및 C. 오토에타노게눔에서 이종 발현된, 클로스트리디움 경로 유전자 및 L. 락티스로부터의 코돈 최적화된 알파-케토산 데카복실라제 Kivd 및 S. 세레비지아에로부터의 알콜 데하이드로게나제 Adh2의 유전자 조합물을 테스트한 것을 보여준다.
도 74는 기질로서 CO 함유 제철소 가스를 C. 오토에타노게눔 DSM23693의 안정한 연속 배양물 내로 공급하였을 때의 고농도 및 높은 속도에서의 아세톤에서 이소프로판올로의 완전한 전환을 보여주는 것이다.
본 발명의 상세한 설명
하기 설명은 일반적인 용어로 제공된, 바람직한 실시양태를 포함하는 본 발명의 설명이다. 본 발명은 본 발명을 뒷받침하는 실험 데이터, 본 발명의 다양한 측면의 구체적인 일례 및 본 발명을 실시하는 수단을 제공하는, 본원에서 "실시예 "라는 표제하에 제공된 하기 개시내용으로부터 추가로 설명된다.
CO를 포함하는 기질의 미생물 발효에 의한 아세톤 및/또는 이소프로판올 제조에 관해서는 앞서 보고된 바 없다. 본 발명의 발명자들은 이에 (그 중에서도 특히) 유전적 변형을 통해 탄소 및 에너지 공급원으로서 CO를 사용할 수 있는 카복시도트로픽 아세트산 생성 박테리아 종에서 아세톤 및/또는 이소프로판올을 제조하는 것을 입증하였다. 본 발명자들은 또한 놀랍게도 밀접하게 관련된 카복시도트로픽 아세트산 생성 종인, C. 오토에타노게눔, C. 륭달리이, 및 C. 라그스달레이에 의한 CO 함유 가스의 존재하에서의 아세톤에서 이소프로판올로의 천연의 효소적 전환도 입증할 수 있었다. C. 오토에타노게눔을 이용한 일반 발효 런 동안 고수준으로 항시 발현된 것으로 나타났으며, 고농도 및 고비율로 아세톤을 이소프로판올로 전환시킬 수 있는 신규한 알콜 데하이드로게나제를 확인하게 되었다. 본 발명자들은 또한 놀랍게도 C. 오토에타노게눔에서 아세톤 및 이소프로판올에 대한 활성을 부여하는 두 유전자를 발견하게 되었다. 락토코커스 락티스로부터의 알파-케토산 데카복실라제(Kivd), 및 사카로마이세스 세레비지아에로부터의 알콜 데하이드로게나제(Adh2)인 이 두 유전자는 아세톤 또는 이소프로판올 또는 이의 전구체 중 어느 것에 대한 활성을 부여한다고는 보고된 바 없으며, 차라리 아미노산 전구체를 분지쇄 알콜로 전환시키는 것에 대해서는 보고된 바 있다. 본 발명자들은 여러 상이한 유전자 및 효소 조합을 사용하여 C. 오토에타노게눔에서 CO로부터 아세톤 및 이소프로판올을 제조하는 것을 입증하였다.
따라서, 본 발명은 예를 들어, CO를 포함하는 기질의 미생물 발효에 의한 아세톤, 이소프로판올 및/또는 아세톤 및/또는 이소프로판올의 전구체의 제조 방법, 상기 방법에서 유전적으로 변형된 미생물의 용도, 유전적으로 변형된 미생물 제조에 적합한 핵산, 및 신규한 알콜 데하이드로게나제 및 상기를 코딩하는 핵산을 제공한다.
본원에서 의미하는 바, "발효 브로쓰"는 적어도 영양 배지 및 박테리아 세포를 포함하는 배양 배지이다.
본원에서 의미하는 바, 셔틀 미생물은 메틸트랜스퍼라제 효소를 발현하고, 목적 미생물과 구별되는 미생물이다.
본원에서 의미하는 바, 목적 미생물은 발현 구성물/벡터 상에 포함된 유전자를 발현하고, 셔틀 미생물과 구별되는 미생물이다.
"주 발효 생성물"이라는 용어는 최고 농도 및/또는 수율로 생산되는 한 발효 생성물을 의미하는 것으로 한다.
발효 공정과 관련하여 사용될 때, 효율을 증가시키는," "증가된 효율" 등의 용어는 발효를 촉매화시키는 미생물의 성장 속도, 상승된 아세톤 및/또는 이소프로판올 농도에서 성장 및/또는 생성물 생산 속도, 기질 소비량당 원하는 생성물의 생산량, 원하는 생성물의 생산 속도 또는 생산 수준, 및 발효의 다른 부산물에 대한, 생산된 원하는 생성물의 상대적인 비율 중 하나 이상을 증가시키는 것을 포함하나, 이에 한정되지 않는다.
"일산화탄소를 포함하는 기질"이라는 어구 및 유사 용어는 일산화탄소가 예를 들어, 성장 및/또는 발효를 위해 하나 이상의 박테리아 균주에 의해 이용될 수 있는 임의의 기질을 포함하는 것으로 이해되어야 한다.
"일산화탄소를 포함하는 가스 기질"이라는 어구 및 유사 어구 및 용어는 일정 수준의 일산화탄소를 함유하는 임의의 가스를 포함한다. 특정 실시양태에서, 기질은 적어도 약 20부피% 내지 약 100부피%의 CO, 20부피% 내지 70부피%의 CO, 30부피% 내지 60부피%의 CO, 및 40부피% 내지 55부피%의 CO를 함유한다. 특정 실시양태에서, 기질은 약 25부피%, 또는 약 30부피%, 또는 약 35부피%, 또는 약 40부피%, 또는 약 45부피%, 또는 약 50부피% CO, 또는 약 55부피%의 CO, 또는 약 60부피%의 CO를 포함한다.
상기 기질이 임의의 수소를 함유할 필요는 없지만, H2의 존재는 본 발명의 방법에 따른 생성물 형성에 유해하지 않아야 한다. 특정 실시양태에서, 수소의 존재는 알콜 생산의 전체 효율을 개선시킨다. 예를 들어, 특정 실시양태에서, 기질은대략 2:1, 또는 1:1, 또는 1:2의 비로 H2:CO를 포함할 수 있다. 한 실시양태에서 기질은 약 30부피% 이하의 H2, 20부피% 이하의 H2, 약 15부피% 이하의 H2, 또는 약 10부피% 이하의 H2를 포함한다. 다른 실시양태에서, 기질 스트림은 저농도의 H2, 예를 들어, 5% 미만, 또는 4% 미만, 또는 3% 미만, 또는 2% 미만, 또는 1% 미만의 H2를 포함하거나, 실질적으로 수소를 포함하지 않는다. 기질은 또한 약간의 CO2, 예를 들어, 예컨대, 약 1부피% 내지 약 80부피%의 CO2, 또는 1부피% 내지 약 30부피%의 CO2를 함유할 수 있다. 한 실시양태에서 기질은 약 20부피% 이하의 CO2를 포함한다. 특정 실시양태에서, 기질은 약 15부피% 이하의 CO2, 약 10부피% 이하의 CO2, 약 5부피% 이하의 CO2를 포함하거나, 또는 실질적으로 CO2를 포함하지 않는다.
하기 설명에서, 본 발명의 실시양태는 "CO를 함유하는 가스 기질"을 전달하고 발효시키는 관점에서 기술된다. 그러나, 상기 가스 기질이 대안적 형태로 제공될 수 있다는 것을 이해하여야 한다. 예를 들어, CO를 함유하는 가스 기질은 액체에 용해되어 제공될 수 있다. 본질적으로, 액체는 일산화탄소 함유 가스로 포화된 후, 상기 액체는 바이오반응기에 첨가된다. 이는 표준 방법을 이용함으로써 달성될 수 있다. 예를 들어, 미세기포 분산물 발생기(문헌 [Hensirisak et. al. Scale-up of microbubble dispersion generator for aerobic fermentation; Applied Biochemistry and Biotechnology Volume 101, Number 3/October, 2002])가 사용될 수 있다. 추가의 일례로, CO를 함유하는 가스 기질은 고체 지지체 상에 흡착될 수 있다. 이러한 대안적 방법은 "CO를 함유하는 기질"이라는 용어 등의 이용에 의해 포함된다.
본 발명의 특정 실시양태에서, CO 함유 가스 기질은 산업 배기 가스 또는 폐가스이다. "산업 폐가스 또는 배기 가스"는 산업 공정에 의해 생산된 CO를 포함하는 임의의 가스를 포함하고, 철 금속 생성물 제조, 비철 생성물 제조, 석유 정련 공정, 석탄의 가스화, 바이오물질의 가스화, 전력 생산, 카본 블랙 생산 및 코크스 제조의 결과로서 생산된 가스를 포함하는 것으로 넓게 해석되어야 한다. 추가의 일례가 본원 어디에서나 제공될 수 있다.
문맥이 달리 요구하지 않는 한, 본원에서 사용되는 바, "발효시키는," "발효 공정" 또는 "발효 반응"이라는 어구 등은 상기 공정의 성장 단계 및 생성물 생합성 기 단계 둘 모두를 포함하는 것으로 한다. 본원에 더 기재되어 있는 바와 같이, 일부 실시양태에서, 바이오반응기는 제1 성장 반응기 및 제2 발효 반응기를 포함할 수 있다. 따라서, 금속 또는 조성물을 발효 반응에 첨가하는 것은 이들 반응기들 중 하나 또는 그 둘 모두에 첨가하는 것을 포함하는 것으로 이해하여야 한다.
용어 "바이오반응기"라는 용어는 연속 교반 탱크 반응기(CSTR: Continuous Stirred Tank Reactor), 고정화된 세포 반응기(ICR: Immobilized Cell Reactor), 삼상층 반응기(TBR: Trickle Bed Reactor), 기포 컬럼, 가스 리프트 발효기, 정적 (Static) 혼합기, 또는 가스 액체 접촉에 적합한 다른 베쓸 또는 다른 장치를 비롯한, 하나 이상의 베쓸 및/또는 탑 또는 배관으로 구성된 발효 장치를 포함한다. 일부 실시양태에서, 바이오반응기는 제1 성장 반응기 및 제2 발효 반응기를 포함할 수 있다. 따라서, 기질을 바이오반응기 또는 발효 반응에 첨가한다는 것이 언급될 때, 이것은 적절한 경우 이들 반응기들 중 하나 또는 둘 모두에 첨가한다는 것을 포함하는 것으로 이해되어야 한다.
"외인성 핵산"은 이 핵산이 도입되는 미생물의 외부로부터 유래된 핵산이다. 외인성 핵산은 이 핵산이 도입될 미생물, 및 상기 핵산이 도입될 유기체와 상이한 미생물의 균주 또는 종을 포함하나, 이에 한정되지 않는 임의의 적절한 공급원으로부터 유래될 수 있거나, 인공적으로 또는 재조합적으로 생성될 수 있다. 한 실시양태에서, 외인성 핵산은 이 핵산이 도입될 미생물 내에 천연적으로 존재하는 핵산 서열을 나타내고, (예를 들어, 서열(예컨대, 유전자)의 카피 수를 증가시킴으로써, 또는 발현을 증가시키는 강력한 또는 구성적 프로모터를 도입시킴으로써) 특정 유전자의 발현을 증가시키거나 특정 유전자를 과다발현하기 위해 도입된다. 또 다른 실시양태에서, 외인성 핵산은 이 핵산이 도입될 미생물 내에 천연적으로 존재하지 않는 핵산 서열을 나타내고, 상기 미생물 내에 천연적으로 존재하지 않는 생성물을 발현시킬 수 있거나, 또는 (예를 들어, 조절 요소, 예컨대, 프로모터가 도입되는 경우) 상기 미생물에 고유한 유전자의 발현을 증가시킬 수 있다. 외인성 핵산은 이 핵산이 도입될 미생물의 게놈 내로 통합되거나 염색체외 상태로 유지되도록 적합화될 수 있다.
본 발명은 본원에서 구체적으로 예시된 서열로부터 변경된 서열을 가지지만, 단, 실질적으로 동일한 기능을 수행하는 핵산을 사용하여 본 발명을 실시할 수 있다는 것을 이해하여야 한다. 단백질 또는 펩티드를 코딩하는 핵산 서열의 경우, 이는 코딩된 단백질 또는 펩티드가 실질적으로 동일한 기능을 가진다는 것을 의미한다. 프로모터 서열을 나타내는 핵산 서열의 경우, 변이체 서열은 하나 이상의 유전자의 발현을 촉진시킬 수 있는 능력을 가질 것이다. 이러한 핵산은 본원에서 "기능적 등가 변이체"로서 지칭될 수 있다. 예를 들어, 핵산의 기능적 등가 변이체는 대립형질 변이체, 유전자의 단편, 돌연변이(결실, 삽입, 뉴클레오티드 치환 등) 및/또는 다형성을 포함하는 유전자 등을 포함한다. 다른 미생물로부터의 상동성 유전자도 또한 본원에서 구체적으로 예시된 서열의 기능적 등가 변이체의 예로서 간주될 수 있다. 이들은 종, 예컨대, 클로스트리디움 아세토부틸리쿰, 클로스트리디움 베이예린키이, C. 사카로부틸리쿰(C. saccharobutylicum) 및 C. 사카로퍼부틸아세토니쿰(C. saccharoperbutylacetonicum) 내의 상동성 유전자를 포함하고, 이들의 세부설명은 웹사이트, 예컨대, 진뱅크(Genbank) 또는 NCBI에서 공개적으로 입수가능하다. 사카로마이세스 세레비지아에 및 락토코커스 락티스로부터 유래된 유전자일 경우, 상동성 유전자는 예를 들어, 스타필로코쿠스 에피더미디스(Staphylococcus epidermidis)(예를 들어, NP_765765.1, EGG67352.1, ZP_04826144.1, ZP_04797999.1), 바실러스 세레우스(Bacillus cereus)(예를 들어, ZP_04273468.1, ZP_04317620.1) 및 바실러스 투린지엔시스(Bacillus thuringiensis)(예를 들어, YP_003664720.1)에서 살펴볼 수 있다. 또한, "기능적 등가 변이체"라는 어구는 특정 유기체를 위한 코돈 최적화의 결과로서 변경된 서열을 가지는 핵산을 포함하는 것으로 해석되어야 한다. 본원에서 핵산의 "기능적 등가 변이체"는 바람직하게는 확인된 핵산과 적어도 대략 70%, 바람직하게는 대략 80%, 더욱 바람직하게는 대략 85%, 바람직하게는 대략 90%, 바람직하게는 대략 95%이상의 핵산 서열 동일성을 가질 것이다
본원에서 구체적으로 예시된 아미노산 서열로부터 변경된 서열을 가지는 폴리펩티드를 사용하여 본 발명을 실시할 수 있다는 것도 이해하여야 한다. 이들 변이체는 본원에서 "기능적 등가 변이체"로 지칭될 수 있다. 단백질 또는 펩티드의 기능적 등가 변이체는 확인된 단백질 또는 펩티드와 적어도 40%, 바람직하게 50%, 바람직하게 60%, 바람직하게 70%, 바람직하게 75%, 바람직하게 80%, 바람직하게 85%, 바람직하게 90%, 바람직하게 95% 이상의 아미노산 동일성을 공유하고, 관심의 대상이 되는 펩티드 또는 단백질과 실질적으로 동일한 기능을 가지는 단백질 또는 펩티드를 포함한다. 이러한 변이체는 단백질 또는 펩티드의 단편을 이의 범위 내에 포함하는데, 여기서, 상기 단편은 폴리펩티드의 절단된 형태를 포함하고, 여기서, 결실은 1 내지 5개, 1 내지 10개, 1 내지 15개, 1 내지 20개, 1 내지 25개의 아미노산일 수 있고, 폴리펩티드의 말단에서 잔기 1 부터 25까지에 걸쳐 있을 수 있고, 여기서, 결실은 상기 영역 내의 임의의 길이의 결실일 수 있거나; 또는 내부 위치에 존재할 수 있다. 또한, 본원에서 특정 폴리펩티드의 기능적 등가 변이체는 예를 들어, 이전 단락에서 예시된 바와 같이 박테리아의 다른 종 내의 상동성 유전자에 의해 발현된 폴리펩티드를 포함하는 것으로 해석되어야 한다.
본원에서 사용되는 바, "실질적으로 동일한 기능"은 핵산 또는 폴리펩티드가 이의 변이체인 것인 이의 핵산 또는 폴리펩티드의 기능을 수행할 수 있다는 것을 의미하는 것으로 한다. 예를 들어, 본 발명의 효소의 변이체는 상기 효소와 동일한 반응을 촉매화시킬 수 있을 것이다. 그러나, 상기 변이체가 이의 폴리펩티드 또는 핵산과 동일한 수준의 활성을 가진다는 것을 의미하는 것으로 해석되지 않아야 한다.
공지된 임의의 여러 방법들을 사용하여 기능적 등가 변이체가 이의 변이체인 것인 이의 핵산 또는 폴리펩티드와 실질적으로 동일한 기능을 가지는지 여부를 평가할 수 있다. 그러나, 일례로, 문헌 [Wiesenborn et al. [Thiolase from Clostridium acetobutylicum ATCC 824 and Its Role in the Synthesis of Acids and Solvents. Appl Environ Microbiol. 1988, 54: 2717-2722]), [Wiesenborn et al. [Coenzyme A transferase from Clostridium acetobutylicum ATCC 824 and its role in the uptake of acids. Appl Environ Microbiol. 1989, 55:323-9.]], [Peterson and Bennet [Purification of acetoacetate decarboxylase from Clostridium acetobutylicum ATCC 824 and cloning of the acetoacetate decarboxylase gene in Escherichia coli. Appl Environ Microbiol.. 1990 56: 3491-3498]], [Ismail et al. [Purification and characterization of a primary-secondary alcohol dehydrogenase from two strains of Clostridium beijerinckii. J Bacteriol 1993, 175: 5097-5105]], [de la Plaza et al. [Biochemical and molecular characterization of a-ketoisovalerate decarboxylase, an enzyme involved in the formation of aldehydes from amino acids by Lactococcus lactis. FEMS Microbiol Lett. 2004 238: 367-374] 또는 [Khorkin et al. [NADP-dependent bacterial alcohol dehydrogenases: crystal structure, cofactor- binding and cofactor specificity of the ADHs of Clostridium beijerinckii and Thermoanaerobacter brockii. J Mol Biol. 1998, 22: 278(5): 967-981]에 개요된 방법을 사용하여 효소 활성을 평가할 수 있다.
본 발명과 관련하여 사용될 때, "과다발현하다," "과다발현" 및 유사 용어 및 어구는 동일한 조건하에서 모체 미생물의 단백질 발현 수준과 비교하여 하나 이상의 단백질 발현의 임의 증가를 포함하는 것으로 넓게 해석되어야 한다. 이는 단백질이 임의의 특정 수준으로 발현된다는 것을 의미하는 것으로 이해되어서는 안 된다.
"모체(parental) 미생물"은 본 발명의 재조합 미생물을 발생시키기 위해 사용되는 미생물이다. 모체 미생물은 자연에서 발생하는 미생물(즉, 야생형 미생물), 또는 이미 변형되어 있지만 본 발명의 대상인 하나 이상의 효소를 발현하거나 과다발현하지 않는 미생물일 수 있다. 따라서, 본 발명의 재조합 미생물은 모체 미생물에서 발현되거나 과다발현되지 않는 하나 이상의 효소를 발현하거나 과다발현하도록 변형되어 있다.
"핵산 "구성물" 또는 "벡터"라는 용어 및 유사한 용어는 유전 물질을 세포 내로 전달하기 위한 비히클로서 사용되기에 적합한 임의의 핵산(DNA 및 RNA 포함)을 포함하는 것으로 넓게 해석되어야 한다. 상기 용어들은 플라스미드, 바이러스(박테리오파지 포함), 코스미드 및 인공 염색체를 포함하는 것으로 해석되어야 한다. 구성물 또는 벡터는 하나 이상의 조절 요소, 복제 기점, 다중클로닝 부위 및/또는 선별가능한 마커를 포함할 수 있다. 한 특정 실시양태에서, 구성물 또는 벡터는 이 구성물 또는 벡터에 의해 코딩된 하나 이상의 유전자가 발현될 수 있도록 적합화된다. 핵산 구성물 또는 벡터는 네이키드 핵산 뿐만 아니라, 세포로의 전달을 용이하게 하는 하나 이상의 작용제와 함께 제제화된 핵산(예를 들어, 리포솜에 컨쥬게이트된 핵산, 핵산이 함유된 유기체)도 포함한다.
"이소프로판올 생합성 경로"는 예를 들어, 도 4에 개요되어 있는 바와 같이, CO 또는 CO/H2에서 이소프로판올로 대사될 수 있도록 하는 효소 경로이다.
"아세톤 생합성 경로"는 예를 들어, 도 4에 개요되어 있는 바와 같이, CO 또는 CO/H2에서 아세톤으로 대사될 수 있도록 하는 효소 경로이다.
아세톤의 "전구체"로는 아세틸-CoA, 아세토아세틸-CoA, 아세토아세테이트, 아세틸-포스페이트 및 아세트산을 포함한다.
이소프로판올의 "전구체"로는 아세틸-CoA, 아세토아세틸-CoA, 아세토아세테이트, 아세톤, 아세틸-포스페이트 및 아세트산을 포함한다.
"알콜 데하이드로게나제"라고 언급하는 것은 케톤(예컨대, 아세톤)을 2차 알콜로 전환시킬 수 있거나, 또는 그 반대의 경우인 것인 알콜 데하이드로게나제를 포함하는 것으로 해석되어야 한다. 상기 알콜 데하이드로게나제는 2차 알콜 데하이드로게나제 및 1차 알콜 데하이드로게나제를 포함한다. "2차 알콜 데하이드로게나제"는 케톤(예컨대, 아세톤)을 2차 알콜(예컨대, 이소프로판올)로 전환시킬 수 있거나, 또는 그 반대의 경우인 것인 것이다. "1차 알콜 데하이드로게나제"는 알데히드를 1차 알콜로 전환시킬 수 있거나, 또는 그 반대의 경우인 것인 것이다; 그러나, 다수의 1차 알콜 데하이드로게나제는 또한 케톤을 2차 알콜로 전환시킬 수 있거나, 또는 그 반대의 경우도 가능하다. 이러한 알콜 데하이드로게나제는 또한 "1차-2차 알콜 데하이드로게나제"로 지칭될 수 있다.
본원에서 앞서 논의된 바와 같이, 본 발명은 CO를 포함하는 기질의 발효에 의해 아세톤, 이소프로판올 및/또는 아세톤 및/또는 이소프로판올의 전구체를 생산할 수 있는 재조합 미생물을 제공한다.
한 특정 실시양태에서, 미생물은 모체 미생물에는 천연적으로 존재하지 않는 이소프로판올 생합성 경로 중의 하나 이상의 효소를 발현하도록 적합화된다. 또 다른 실시양태에서, 미생물은 모체 미생물에 천연적으로 존재하는 이소프로판올 생합성 경로 중의 하나 이상의 효소를 과다발현하도록 적합화된다.
한 특정 실시양태에서, 미생물은 모체 미생물에는 천연적으로 존재하지 않는 아세톤 생합성 경로 중의 하나 이상의 효소를 발현하도록 적합화된다. 또 다른 실시양태에서, 미생물은 모체 미생물에 천연적으로 존재하는 아세톤 생합성 경로 중의 하나 이상의 효소를 과다발현하도록 적합화된다.
한 특정 실시양태에서, 미생물은 모체 미생물에는 천연적으로 존재하지 않는 아세톤에서 이소프로판올로의 전환에 관여하는 하나 이상의 효소를 발현하도록 적합화된다. 또 다른 실시양태에서, 미생물은 모체 미생물에 천연적으로 존재하는 아세톤에서 이소프로판올로의 전환에 관여하는 하나 이상의 효소를 과다발현하도록 적합화된다.
한 실시양태에서, 모체 미생물 CO를 포함하는 기질을 발효시켜 아세톤을 생산할 수는 있지만, 아세톤에서 이소프로판올로 전환시키지는 못하고, 재조합 미생물은 아세톤에서 이소프로판올로의 전환에 관여하는 하나 이상의 효소를 발현하도록 적합화된다.
또 다른 실시양태에서, 모체 미생물은 아세톤에서 이소프로판올로 전환시킬 수는 있지만, CO를 포함하는 기질을 발효시키지 못하므로 아세톤을 생산할 수 없고, 재조합 미생물은 아세톤 생합성 경로 중의 하나 이상의 효소를 발현하도록 적합화된다.
한 실시양태에서, 모체 미생물은 CO를 포함하는 기질을 발효시키지 못하므로 아세톤 및 이소프로판올을 생산할 수 없고, 재조합 미생물은 아세톤 생합성 경로 중의 하나 이상의 효소, 및 아세톤에서 이소프로판올로의 전환에 관여하는 하나 이상의 효소를 발현하도록 적합화된다.
미생물은 예를 들어, (보다 강력한 프로모터 또는 구성적 프로모터를 도입하여 유전자의 발현을 구동시킴으로써) 미생물 내의 천연 유전자의 발현을 증가시키거나, 특정 효소를 코딩하고, 그를 발현하도록 적합화된 외인성 핵산을 도입시킴으로써 상기 효소를 코딩하는 유전자의 카피 수를 증가시키거나, 모체 미생물에는 천연적으로 존재하지 않는 효소를 코딩하고, 그를 발현하도록 적합화된 외인성 핵산을 도입시킴으로써 이루어지는 방법을 비롯한, 임의 개수의 재조합 방법에 의해 하나 이상의 효소를 발현시키거나, 과다발현시키도록 적합화될 수 있다.
특정 실시양태에서, 모체 미생물은 모체 미생물에 고유한 하나 이상의 유전자의 발현 증가 또는 과다발현 및 모체 미생물에 고유하지 않은 하나 이상의 유전자의 도입의 조합을 제공할 수 있도록 형질전환될 수 있다. 예를 들어, 아세톤 생합성 경로 중의 효소를 코딩하는 하나 이상의 유전자는 모체 미생물에 고유한 것일 수 있지만, 아세톤에서 이소프로판올로의 전환에 관여하는 효소를 코딩하는 하나 이상의 유전자는 포함하지 않을 수 있거나, 또는 그 반대의 경우일 수 있다. 미생물은 아세톤 생합성 경로 중의 효소를 코딩하는 하나 이상의 천연 유전자를 과다발현하고, 아세톤에서 이소프로판올로의 전환에 관여하는 효소를 코딩하는 유전자를 도입하도록 조작될 수 있거나, 또는 그 반대의 경우일 수 있다. 유사하게, 미생물은 아세톤 생합성 경로(및/또는 아세톤에서 이소프로판올로의 전환) 중의 하나 이상의 효소를 과다발현하고, 같은 경로에 관여하는 효소를 코딩하는 하나 이상의 유전자를 도입하도록 조작될 수 있거나, 또는 그 반대의 경우일 수 있다. 당업자는 본 발명에서 사용하기 위한 다양한 다른 조합도 이해할 것이다.
한 실시양태에서, 아세톤 생합성 경로 중의 하나 이상의 효소는
아세틸-코엔자임 A 아세틸트랜스퍼라제(티올라제; ThlA; E.C. 2.3.1.9);
아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 A(CoA 트랜스퍼라제; CtfA; EC 2.8.3.9);
아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 B(CoA 트랜스퍼라제; CtfB; EC 2.8.3.9);
아세토아세테이트 데카복실라제(Adc; EC 4.1.1.4);
알파-케토이소발레레이트 데카복실라제(데카복실라제; KivD; EC4.1.1.74); 및
이의 임의의 하나 이상의 기능적 등가 변이체로 이루어진 군으로부터 선택되는:
단지 일례로서, 각 펩티드에 대한 서열 정보는 본원 하기 표 6 또는 표 18에 제공되어 있다.
본 발명의 미생물에서 사용되는 효소는 상이한 속 및 종의 박테리아, 또는 다른 유기체를 비롯한, 임의의 적절한 공급원으로부터 유래된 것일 수 있다. 그러나, 한 실시양태에서, 아세틸-코엔자임 A 아세틸트랜스퍼라제(티올라제; ThlA)는 C. 아세토부틸리쿰으로부터 유래된 것이다. 한 실시양태에서, 아세틸-코엔자임 A 아세틸트랜스퍼라제는 본원 하기 표 6에서 예시된 아미노산 서열을 가지거나, 또는 이의 기능적 등가 변이체이다.
한 실시양태에서, 효소 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 A(CoA 트랜스퍼라제; CtfA), 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 B(CoA 트랜스퍼라제; CtfB) 및 아세토아세테이트 데카복실라제(Adc)는 C. 베이예린키이로부터 유래된 것이다.
한 실시양태에서, 효소 알파-케토이소발레레이트 데카복실라제(데카복실라제; KivD)는 L. 락티스(L. lactis)로부터 유래된 것이다.
한 실시양태에서, 각 효소는 본원 하기 표 6 또는 18에서 예시된 아미노산 서열을 가지거나, 또는 이의 기능적 등가 변이체이다.
한 실시양태에서, 아세톤에서 이소프로판올로의 전환에 관여하는 하나 이상의 효소는
알콜 데하이드로게나제(Adh; EC 1.1.1.2);
알콜 데하이드로게나제(Adh2; EC 1.1.1.1); 및
이의 기능적 등가 변이체로 이루어진 군으로부터 선택된다.
또한, 본 발명에서 사용되는 알콜 데하이드로게나제 효소는 상이한 속 및 종의 박테리아(예를 들어, 본원 하기 표 13에서 예시된 박테리아 종)을 비롯한 임의의 적절한 공급원으로부터 유래된 것이다. 그러나, 한 특정 실시양태에서, 알콜 데하이드로게나제(Adh)는 C. 오토에타노게눔, C. 륭달리이, 및/또는 C. 라그스달레이로부터 유래된 것이다. 한 실시양태에서, 알콜 데하이드로게나제는 서열 번호 1의 아미노산 서열을 가지거나, 또는 이의 기능적 등가 변이체이다. 한 실시양태에서, 기능적 등가 변이체는 서열 번호 1과 대략 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 가진다.
한 실시양태에서, 알콜 데하이드로게나제(Adh2)는 S. 세레비지아에로부터 유래된 것이다.
한 실시양태에서, 미생물은 모체 미생물에 고유한 하나 이상의 핵산의 발현을 증가시키도록 적합화된 하나 이상의 외인성 핵산을 포함하고, 여기서, 하나 이상의 핵산은 본원에서 앞서 언급된 효소들 중 하나 이상을 코딩한다. 한 실시양태에서, 발현을 증가시키도록 적합화된 하나 이상의 외인성 핵산은 조절 요소이다. 한 실시양태에서, 조절 요소는 프로모터이다. 한 실시양태에서, 프로모터는 바람직하게는 적절한 발효 조건하에서 고도로 활성인 구성적 프로모터이다. 유도성 프로모터 또한 사용될 수 있다. 바람직한 실시양태에서, 프로모터는 우드-륭달 유전자 클러스터 또는 포스포트랜스아세틸라제/아세테이트 키나제 오페론 프로모터를 포함하는 군으로부터 선택된다. 한 실시양태에서, 프로모터는 서열 번호 22 또는 77의 서열을 가지거나, 또는 이의 기능적 등가 변이체이다. 또 다른 실시양태에서, 우드-륭달 클러스터 프로모터(PWL)(서열 번호 56 또는 57), F1F0-ATP아제 오페론의 프로모터 영역(서열 번호 51, 58 또는 59), Rnf 복합체 오페론 프로모터 영역(서열 번호 52, 60 또는 61), 또는 피루베이트:페레독신 옥시도리덕타제(서열 번호 53, 62 또는 63) 프로모터 영역이 사용될 수 있다. 적절한 발현 조건하에서 바람직하게 고수준의 발현을 지시할 수 있는 다른 프로모터가 예시된 실시양태에 대한 대안으로서 효과적일 것이라는 것을 당업자는 이해할 것이다.
한 실시양태에서, 미생물은 본원에서 앞서 언급된 효소들 중 하나 이상을 코딩하고, 그를 발현하도록 적합화된 하나 이상의 외인성 핵산을 포함한다. 한 실시양태에서, 미생물은 2가지 이상의 효소를 코딩하고, 그를 발현하도록 적합화된 하나 이상의 외인성 핵산을 포함한다. 다른 실시양태에서, 미생물은 3, 4, 5 또는 6가지의 효소를 코딩하고, 그를 발현하도록 적합화된 하나 이상의 외인성 핵산을 포함한다.
한 특정 실시양태에서, 미생물은 아세틸-코엔자임 A 아세틸트랜스퍼라제(티올라제; ThlA; E.C. 2.3.1.9), 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 A(CoA 트랜스퍼라제; CtfA; EC 2.8.3.9), 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 B(CoA 트랜스퍼라제; CtfB; EC 2.8.3.9), 및 아세토아세테이트 데카복실라제(Adc; EC 4.1.1.4), 또는 이의 임의의 하나 이상의 기능적 등가 변이체 각각을 코딩하는 하나 이상의 외인성 핵산을 포함한다.
한 특정 실시양태에서, 미생물은 알콜 데하이드로게나제(Adh; EC 1.1.1.2) 또는 이의 기능적 등가 변이체를 코딩하는 하나 이상의 외인성 핵산을 포함한다.
한 특정 실시양태에서, 미생물은 아세틸-코엔자임 A 아세틸트랜스퍼라제(티올라제; ThlA; E.C. 2.3.1.9), 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 A(CoA 트랜스퍼라제; CtfA; EC 2.8.3.9), 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 B(CoA 트랜스퍼라제; CtfB; EC 2.8.3.9), 아세토아세테이트 데카복실라제(Adc; EC 4.1.1.4), 및 알콜 데하이드로게나제(Adh; EC 1.1.1.2), 또는 이의 임의의 하나 이상의 기능적 등가 변이체 각각을 코딩하는 하나 이상의 외인성 핵산을 포함한다.
한 특정 실시양태에서, 미생물은 알파-케토이소발레레이트 데카복실라제(데카복실라제; KivD; EC4.1.1.74), 및 알콜 데하이드로게나제(Adh2; EC 1.1.1.1), 또는 이의 임의의 하나 이상의 기능적 등가 변이체 각각을 코딩하는 하나 이상의 외인성 핵산을 포함한다.
한 특정 실시양태에서, 미생물은 아세틸-코엔자임 A 아세틸트랜스퍼라제(티올라제; ThlA; E.C. 2.3.1.9), 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 A(CoA 트랜스퍼라제; CtfA; EC 2.8.3.9), 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 B(CoA 트랜스퍼라제; CtfB; EC 2.8.3.9), 및 알파-케토이소발레레이트 데카복실라제(데카복실라제; KivD; EC4.1.1.74), 또는 이의 임의의 하나 이상의 기능적 등가 변이체 각각을 코딩하는 하나 이상의 외인성 핵산을 포함한다.
한 특정 실시양태에서, 미생물은 알파-케토이소발레레이트 데카복실라제(데카복실라제; KivD; EC4.1.1.74), 또는 이의 임의의 하나 이상의 기능적 등가 변이체를 코딩하는 하나 이상의 외인성 핵산을 포함한다.
한 특정 실시양태에서, 미생물은 아세틸-코엔자임 A 아세틸트랜스퍼라제(티올라제; ThlA; E.C. 2.3.1.9), 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 A(CoA 트랜스퍼라제; CtfA; EC 2.8.3.9), 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 B(CoA 트랜스퍼라제; CtfB; EC 2.8.3.9), 아세토아세테이트 데카복실라제(Adc; EC 4.1.1.4), 및 알콜 데하이드로게나제(Adh2; EC 1.1.1.1), 또는 이의 임의의 하나 이상의 기능적 등가 변이체 각각을 코딩하는 하나 이상의 외인성 핵산을 포함한다.
또 다른 특정 실시양태에서, 미생물은 아세틸-코엔자임 A 아세틸트랜스퍼라제(티올라제; ThlA; E.C. 2.3.1.9), 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 A(CoA 트랜스퍼라제; CtfA; EC 2.8.3.9), 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 B(CoA 트랜스퍼라제; CtfB; EC 2.8.3.9), 아세토아세테이트 데카복실라제(Adc; EC 4.1.1.4), 알파-케토이소발레레이트 데카복실라제(데카복실라제; KivD; EC4.1.1.74), 및 알콜 데하이드로게나제(Adh2; EC 1.1.1.1), 또는 이의 임의의 하나 이상의 기능적 등가 변이체 각각을 코딩하는 하나 이상의 외인성 핵산을 포함한다.
한 실시양태에서, 아세틸-코엔자임 A 아세틸트랜스퍼라제(티올라제; ThlA)는 서열 번호 18을 포함하는 핵산, 또는 이의 기능적 등가 변이체에 의해 코딩된다. 한 실시양태에서, 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 A(CoA 트랜스퍼라제; CtfA)는 서열 번호 19를 포함하는 핵산, 또는 이의 기능적 등가 변이체에 의해 코딩된다. 한 실시양태에서, 아세토아세틸-Co A:아세테이트 코엔자임 A 트랜스퍼라제 B(CoA 트랜스퍼라제; CtfB)는 서열 번호 20을 포함하는 핵산, 또는 이의 기능적 등가 변이체에 의해 코딩된다. 한 실시양태에서, 아세토아세테이트 데카복실라제(Adc)는 서열 번호 21을 포함하는 핵산, 또는 이의 기능적 등가 변이체에 의해 코딩된다. 한 실시양태에서, 알파-케토이소발레레이트 데카복실라제(데카복실라제; KivD)는 서열 번호 72 또는 76을 포함하는 핵산, 또는 이의 어느 하나의 기능적 등가 변이체에 의해 코딩된다. 한 실시양태에서, 알콜 데하이드로게나제(Adh)는 서열 번호 2, 서열 번호 3, 또는 서열 번호 4를 포함하는 핵산, 또는 이의 어느 하나의 기능적 등가 변이체에 의해 코딩된다. 한 실시양태에서, 알콜 데하이드로게나제(Adh2)는 서열 번호 74 또는 77을 포함하는 핵산, 또는 이의 어느 하나의 기능적 등가 변이체에 의해 코딩된다.
미생물은 하나 이상의 외인성 핵산을 포함할 수 있다. 모체 미생물을 2개 이상의 유전 요소(예컨대, 유전자 또는 조절 요소(예를 들어, 프로모터))로 형질전환시키는 것이 바람직할 경우, 이는 하나 이상의 외인성 핵산 상에 포함될 수 있다.
한 실시양태에서, 하나 이상의 외인성 핵산은 핵산 구성물 또는 벡터이고, 한 특정 실시양태에서는 임의 조합된, 본원에서 앞서 언급된 효소들 중 하나 이상을 코딩하는 플라스미드이다. 한 특정 실시양태에서, 구성물은 각각의 ThlA, CtfA, CtfB, 및 Adc, 및 임의적으로, Adh를 코딩한다. 또 다른 실시양태에서, 하나 이상의 외인성 핵산은 핵산 구성물 또는 벡터이고, 한 특정 실시양태에서는 Adh, 및 임의적으로 ThlA, CtfA, CtfB, 및/또는 Adc를 코딩하는 플라스미드이다. 한 특정 실시양태에서, 구성물은 ThlA, CtfA, CtfB, Adc 및 Adh 모두를 코딩한다. 벡터는 또한 본 명세서의 다른 곳의 설명으로부터 자명한 바와 같이, 대체 효소 조합을 코딩하는 효소의 다른 조합을 포함할 수 있다. 한 특정 실시양태에서, 벡터는 임의 순서로 1, 2, 3 또는 4개의 서열 번호 19, 20, 21 및 22의 핵산 서열 또는 이의 어느 하나의 기능적 등가 변이체를 포함한다. 또 다른 실시양태에서, 벡터는 임의 순서로 서열 번호 2, 3 및/또는 4, 또는 이의 어느 하나의 기능적 등가 변이체를 포함한다. 한 실시양태에서, 벡터는 임의 순서로 1, 2, 3 또는 4개의 서열 번호 19, 20, 21 및 22의 서열 또는 이의 어느 하나의 기능적 등가 변이체를 포함하고, 서열 번호 2, 3 또는 4의 서열, 또는 이의 어느 하나의 기능적 등가 변이체를 포함한다.
또 다른 실시양태에서, 벡터는 단독으로, 또는 서열 번호 19, 20, 21, 22, 2, 3, 및 4로 제시되는 핵산 중 하나 이상과 조합된, 서열 번호 72, 76, 74, 77 중 하나 이상을 포함한다.
외인성 핵산은 모체 미생물의 형질전환시 염색체외 상태로 유지될 수 있거나, 모체 미생물의 게놈 내로 통합될 수 있다. 따라서, 외인성 핵산은 통합을 지원하도록(예를 들어, 상동성 재조합 및 숙주 게놈 내로의 표적화된 통합이 이루어질 수 있도록 하는 영역), 또는 염색체외 구성물의 발현 및 복제를 지원하도록(예를 들어, 복제 기점, 프로모터 및 다른 조절 요소 또는 서열) 적합화된 추가의 뉴클레오티드 서열을 포함할 수 있다.
한 실시양태에서, 본원에서 앞서 언급된 하나 이상의 효소를 코딩하는 외인성 핵산은 외인성 핵산에 의해 코딩되는 하나 이상의 효소의 발현을 촉진시키도록 적합화된 프로모터를 추가로 포함할 수 있다. 한 실시양태에서, 프로모터는 바람직하게는 적절한 발효 조건하에서 고도로 활성인 구성적 프로모터이다. 유도성 프로모터 또한 사용될 수 있다. 바람직한 실시양태에서, 프로모터는 우드-륭달 유전자 클러스터 및 포스포트랜스아세틸라제/아세테이트 키나제 프로모터를 포함하는 군으로부터 선택된다. 한 실시양태에서, 프로모터는 서열 번호 22, 서열 번호 77의 서열을 가지거나, 또는 이의 어느 하나의 기능적 등가 변이체이다. 또 다른 실시양태에서, 우드-륭달 클러스터 프로모터(PWL)(서열 번호 56 또는 57), F1F0-ATP아제 오페론의 프로모터 영역(서열 번호 51, 58 또는 59), Rnf 복합체 오페론 프로모터 영역(서열 번호 52, 60 또는 61), 또는 피루베이트:페레독신 옥시도리덕타제(서열 번호 53, 62 또는 63) 프로모터 영역이 사용될 수 있다. 적절한 발현 조건하에서 바람직하게 고수준의 발현을 지시할 수 있는 다른 프로모터가 예시된 실시양태에 대한 대안으로서 효과적일 것이라는 것을 당업자는 이해할 것이다.
한 실시양태에서, 외인성 핵산은 발현 플라스미드이다. 한 특정 실시양태에서, 발현 플라스미드는 서열 번호 46, 48, 83, 84, 95, 98, 또는 101의 뉴클레오티드 서열을 가진다.
한 실시양태에서, 모체 미생물은 카복시도트로픽 아세트산 생성 박테리아 군으로부터 선택된다. 특정 실시양태에서, 미생물은 클로스트리디움 오토에타노게눔, 클로스트리디움 륭달리이, 클로스트리디움 라그스달레이, 클로스트리디움 카복시디보란스, 클로스트리디움 드라케이, 클로스트리디움 스카톨로게네스, 클로스트리디움 코스카티이(Clostridium coskatii), 부티리박테리움 리모숨, 부티리박테리움 메틸로트로피쿰, 아세토박테리움 우디이, 알칼리바큘룸 박키이, 블라우티아 프로덕타, 유박테리움 리모숨, 모어렐라 써모아세티카, 모어렐라 써모오토트로피카, 옥소박터 펜니기이, 및 써모아내로박터 키우비를 포함하는 군으로부터 선택된다.
한 특정 실시양태에서, 모체 미생물은 C. 오토에타노게눔 종, C. 륭달리이 종, 및 C. 라그스달레이 종 및 관련된 단리물을 포함하는, 에탄올 생성, 아세트산 생성 클로스트리디아(Clostridia) 클러스터로부터 선택된다. 이는 균주 C. 오토에타노게눔 JAI-1T(DSM10061)(문헌 [Abrini J, Naveau H, Nyns E-J: Clostridium autoethanogenum, sp. nov., an anaerobic bacterium that produces ethanol from carbon monoxide. Arch Microbiol 1994, 4: 345-351]), C. 오토에타노게눔 LBS1560 (DSM19630)(문헌 [Simpson SD, Forster RL, Tran PT, Rowe MJ, Warner IL: Novel bacteria and methods thereof. 국제 특허 WO/2009/064200(2009)]), C. 오토에타노게눔 LBS1561(DSM23693), C. 륭달리이 PETCT(DSM13528 = ATCC 55383)(문헌 [Tanner RS, Miller LM, Yang D: Clostridium ljungdahlii sp. nov., an Acetogenic Species in Clostridial rRNA Homology Group I. Int J Syst Bacterid 1993, 43: 232-236]), C. 륭달리이 ERI-2(ATCC 55380)(문헌 [Gaddy JL: Clostridium stain which produces acetic acid from waste gases. 미국 특허, 5,593,886(1997)]), C. 륭달리이 C-01(ATCC 55988)(문헌 [Gaddy JL, Clausen EC, Ko C-W: Microbial process for the preparation of acetic acid as well as solvent for its extraction from fermentation broth. 미국 특허 6,368,819(2002)]), C. 륭달리이 O-52(ATCC 55989)(문헌 [Gaddy JL, Clausen EC, Ko C-W: Microbial process for the preparation of acetic acid as well as solvent for its extraction from fermentation broth. 미국 특허 6,368,819(2002)]), C. 라그스달레이 P11T(ATCC BAA-622)(문헌 [Huhnke RL, Lewis RS, Tanner RS: Isolation and Characterization of novel Clostridial Species. 국제 특허 WO 2008/028055(2008)]), 관련된 단리물, 예컨대, "C. 코스카티이(C. coskatii)"(문헌 [Zahn et al. - Novel ethanologenic species Clostridium coskatii (미국 특허 출원 번호 US20110229947)]), 또는 돌연변이화된 균주, 예컨대, C. 륭달리이 OTA-1(문헌 [Tirado-Acevedo O. Production of Bioethanol from Synthesis Gas Using Clostridium ljungdahlii. PhD thesis, North Carolina State University, 2010])을 포함하나, 이에 한정되지 않는다. 이들 균주들은 클로스트리디움 rRNA 클러스터 I 내의 서브클러스터를 형성하고, 이의 16S rRNA 유전자는 약 30%의 유사한 낮은 GC 함량을 가지면서 99% 초과로 동일하다. 그러나, DNA-DNA 재결합 및 DNA 핑거프린팅 실험을 통해서는 이들 균주들이 상이한 종에 속하는 것으로 나타났다(문헌 [Huhnke RL, Lewis RS, Tanner RS: Isolation and Characterization of novel Clostridial Species. 국제 특허 WO 2008/028055(2008)]).
이 클러스터의 모든 종들은 형태 및 크기가 유사하고(대수적으로 성장하는 세포는 0.5-0.7 x 3-5 ㎛이다), 중온성을 나타내고(최적의 성장 온도는 30-37℃이다), 엄격하게 혐기성이다(문헌 [Tanner RS, Miller LM, Yang D: Clostridium ljungdahlii sp. nov., an Acetogenic Species in Clostridial rRNA Homology Group I. Int J Syst Bacteriol 1993, 43: 232-236]; [Abrini J, Naveau H, Nyns E-J: Clostridium autoethanogenum, sp. nov., an anaerobic bacterium that produces ethanol from carbon monoxide. Arch Microbiol 1994, 4: 345-351]; [Huhnke RL, Lewis RS, Tanner RS: Isolation and Characterization of novel Clostridial Species. 국제 특허 WO 2008/028055(2008)]). 또한, 이들은 모두 동일한 주요 계통발생적 특징, 예컨대, 동일한 pH 범위(pH 4-7.5, 최적의 초기 pH는 5.5-6이다), 유사한 성장 속도로 CO 함유 가스 상에서 강한 독립 영양 성장, 및 주 발효 최종 생성물로서 에탄올 및 아세트산과 유사한 대사적 프로파일, 및 특정 조건하에서 형성된 소량의 2,3-부탄디올 및 락트산인 특성을 공유한다(문헌 [Tanner RS, Miller LM, Yang D: Clostridium ljungdahlii sp. nov., an Acetogenic Species in Clostridial rRNA Homology Group I. Int J Syst Bacteriol 1993, 43: 232-236]; [Abrini J, Naveau H, Nyns E-J: Clostridium autoethanogenum, sp. nov., an anaerobic bacterium that produces ethanol from carbon monoxide. Arch Microbiol 1994, 4: 345-351]; [Huhnke RL, Lewis RS, Tanner RS: Isolation and Characterization of novel Clostridial Species. 국제 특허 WO 2008/028055(2008)]). 인돌 생산 또한 3개의 종 모두에서 관찰되었다. 그러나, 상기 종들은 다양한 당(예컨대, 람노스, 아라비노스), 산(예컨대, 글루코네이트, 시트레이트), 아미노산(예컨대, 아르기닌, 히스티딘), 또는 다른 기질(예컨대, 베타인, 부탄올)의 기질 이용에서 구별된다. 또한, 상기 종들 중 일부는 특정 비타민(예컨대, 티아민, 비오틴)에 대해 영양요구체인 것으로 밝혀졌지만, 다른 나머지는 그러하지 않았다.
한 실시양태에서, 모체 균주는 이의 단독 탄소 및 에너지 공급원으로서 CO를 사용한다.
한 실시양태에서 모체 미생물은 클로스트리디움 오토에타노게눔 또는 클로스트리디움 륭달리이이다. 한 특정 실시양태에서, 미생물은 클로스트리디움 오토에타노게눔 DSM23693이다. 또 다른 특정 실시양태에서, 미생물은 클로스트리디움 륭달리이 DSM13528(또는 ATCC55383)이다.
한 실시양태에서, 모체 미생물에는 ThlA, CtfA, CtfB, Adc, KivD, Adh 및 Adh2를 코딩하는 하나 이상의 유전자가 존재하지 않는다. 한 특정 실시양태에서, 모체 미생물에는 Adh를 코딩하는 유전자가 존재하지 않는다. 또 다른 특정 실시양태에서, 모체 미생물에는 ThlA, CtfA, CtfB, Adc, 및 KivD를 코딩하는 각각의 유전자가 존재하지 않는다.
본 발명자들은 신규한 Adh 단백질을 확인하게 되었다. 따라서, 본 발명은 서열 번호 1의 아미노산 서열을 가지는 알콜 데하이드로게나제(Adh), 또는 이의 어느 하나의 기능적 등가 변이체를 제공한다. 한 특정 실시양태에서, 알콜 데하이드로게나제(Adh)의 기능적 등가 변이체는 서열 번호 1과 대략 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 가진다.
추가로, 본 발명은 서열 번호 1의 Adh를 코딩하는 핵산, 또는 이의 기능적 등가 변이체를 제공한다. 당업자는 본원에서 제공하는 아미노산 서열, 및 그 안의 유전자 코드 및 축퇴성과 관련하여 상기 핵산에 대해 쉽게 이해할 것이다. 그러나, 일례로, 서열 번호 1의 Adh를 코딩하는 핵산은 서열 번호 2, 3 또는 4의 핵산, 또는 이의 기능적 등가 변이체를 포함한다. 한 특정 실시양태에서, 서열 번호 2, 3 또는 4의 기능적 등가 변이체는 서열 번호 2, 3 또는 4와 대략 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 가지는 핵산이다.
본 발명은 또한 서열 번호 2, 3 또는 4의 핵산, 이의 어느 하나에 상보적인 핵산, 또는 이의 어느 하나의 기능적 등가 변이체 중 적어도 일부에 하이브리드화할 수 핵산을 제공한다. 상기 핵산은 바람직하게는 엄격한 하이브리드화 조건하에서 서열 번호 2, 3 또는 4의 핵산, 이의 어느 하나에 상보적인 핵산, 또는 이의 어느 하나의 기능적 등가 변이체에 하이브리드화할 수 있을 것이다. "엄격한 하이브리드화 조건"이란 핵산이 예컨대, 문헌 [Sambrook et al, Molecular Cloning: A Laboratory Manual (1989), Cold Spring Harbor Laboratory Press, New York, USA]에기술된 것과 같은 표준 하이브리드화 조건하에서 표적 주형에 하이브리드화할 수 있다는 것을 의미한다. 이러한 핵산의 최소 크기는 주어진 핵산과 이 핵산에 하이브리드화하도록 디자인된 상보적인 서열 사이에 안정한 하이브리드를 형성할 수 있는 크기라는 것을 이해할 것이다. 따라서, 상기 크기는 핵산 조성, 및 상기 핵산과 이의 상보적인 서열 사이의 상동성(%) 뿐만 아니라, 이용되는 하이브리드화 조건(예를 들어, 온도 및 염 농도)에 따라 달라진다. 한 실시양태에서, 핵산 길이는 10개 이상의 뉴클레오티드 길이, 15개 이상의 뉴클레오티드 길이, 20개 이상의 뉴클레오티드 길이, 25개 이상의 뉴클레오티드 길이, 또는 30개 이상의 뉴클레오티드 길이이다.
본 발명자들은 또한 본원 하기의 실시예 섹션에서 설명되는 바와 같이, 프로브 및 프라이머로서 유용한 다수의 신규한 핵산도 확인하게 되었다. 예를 들어, 서열 번호 5; 서열 번호 6; 서열 번호 7; 서열 번호 8; 서열 번호 9; 서열 번호 10; 서열 번호 11; 서열 번호 12; 서열 번호 13; 서열 번호 14; 서열 번호 15; 서열 번호 16; 서열 번호 17; 서열 번호 18; 서열 번호 23; 서열 번호 24; 서열 번호 25; 서열 번호 26; 서열 번호 27; 서열 번호 28; 서열 번호 29; 서열 번호 30; 서열 번호 31; 서열 번호 32; 서열 번호 33; 서열 번호 64; 서열 번호 65; 서열 번호 66; 서열 번호 67; 서열 번호 68; 서열 번호 69; 서열 번호 70; 서열 번호 71; 서열 번호 85; 서열 번호 86; 서열 번호 87; 서열 번호 88; 서열 번호 89; 서열 번호 90; 서열 번호 91; 서열 번호 92; 서열 번호 93; 서열 번호 94; 서열 번호 96; 서열 번호 97; 서열 번호 99; 서열 번호 100이 그러하다.
본 발명은 또한 본 발명의 재조합 미생물 제조에서의 핵산 및 핵산 구성물의 용도를 제공한다.
한 실시양태에서, 핵산은 미생물에서 발현되었을 때, 미생물이 CO를 포함하는 기질의 발효에 의해 아세톤, 이소프로판올 및/또는 아세톤 및/또는 이소프로판올의 전구체를 생산할 수 있도록 하는 효소 중 하나 이상을 코딩하는 서열을 포함한다. 한 특정 실시양태에서, 본 발명은 미생물에서 발현되었을 때, 미생물이 CO를 포함하는 기질의 발효에 의해 아세톤, 이소프로판올 및/또는 아세톤 및/또는 이소프로판올의 전구체를 생산할 수 있도록 하는 2가지 이상의 효소를 코딩하는 핵산을 제공한다. 한 실시양태에서, 본 발명의 핵산은 3, 4, 5 또는 6가지의 상기 효소를 코딩한다.
한 특정 실시양태에서, 효소는 아세틸-코엔자임 A 아세틸트랜스퍼라제(티올라제; ThlA), 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 A(CoA 트랜스퍼라제; CtfA), 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 B(CoA 트랜스퍼라제; CtfB), 아세토아세테이트 데카복실라제(Adc), 케토이소발레레이트 데카복실라제(데카복실라제; KivD), 알콜 데하이드로게나제(Adh), 알콜 데하이드로게나제(Adh2), 및 이의 임의의 하나 이상의 기능적 등가 변이체로부터 선택된다.
한 실시양태에서, 본 발명의 핵산은 임의 순서로 아세틸-코엔자임 A 아세틸트랜스퍼라제(티올라제; ThlA), 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 A(CoA 트랜스퍼라제; CtfA), 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 B(CoA 트랜스퍼라제; CtfB), 및 아세토아세테이트 데카복실라제(Adc) 또는 이의 임의의 하나 이상의 기능적 등가 변이체 각각을 코딩하는 핵산 서열을 포함한다.
한 실시양태에서, 본 발명의 핵산은 임의 순서로 아세틸-코엔자임 A 아세틸트랜스퍼라제(티올라제; ThlA), 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 A(CoA 트랜스퍼라제; CtfA), 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 B(CoA 트랜스퍼라제; CtfB), 아세토아세테이트 데카복실라제(Adc), 및 알콜 데하이드로게나제(Adh) 또는 이의 임의의 하나 이상의 기능적 등가 변이체 각각을 코딩하는 핵산 서열을 포함한다.
한 실시양태에서, 본 발명의 핵산은 임의 순서로 알파-케토이소발레레이트 데카복실라제(데카복실라제; KivD), 및 알콜 데하이드로게나제(Adh2), 또는 이의 임의의 하나 이상의 기능적 등가 변이체 각각을 코딩하는 핵산 서열을 포함한다.
한 실시양태에서, 본 발명의 핵산은 임의 순서로 아세틸-코엔자임 A 아세틸트랜스퍼라제(티올라제; ThlA), 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 A(CoA 트랜스퍼라제; CtfA), 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 B(CoA 트랜스퍼라제; CtfB), 및 알파-케토이소발레레이트 데카복실라제(데카복실라제; KivD), 또는 이의 임의의 하나 이상의 기능적 등가 변이체 각각을 코딩하는 핵산 서열을 포함한다.
한 실시양태에서, 본 발명의 핵산은 알파-케토이소발레레이트 데카복실라제(데카복실라제; KivD), 또는 이의 기능적 등가 변이체를 코딩하는 핵산을 포함한다.
한 실시양태에서, 본 발명의 핵산은 임의 순서로 아세틸-코엔자임 A 아세틸트랜스퍼라제(티올라제; ThlA), 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 A(CoA 트랜스퍼라제; CtfA), 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 B(CoA 트랜스퍼라제; CtfB), 아세토아세테이트 데카복실라제(Adc), 및 알콜 데하이드로게나제(Adh2), 또는 이의 임의의 하나 이상의 기능적 등가 변이체 각각을 코딩하는 핵산을 포함한다.
또 다른 실시양태에서, 본 발명의 핵산은 임의 순서로 아세틸-코엔자임 A 아세틸트랜스퍼라제(티올라제; ThlA), 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 A(CoA 트랜스퍼라제), 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 B(CoA 트랜스퍼라제; CtfB), 아세토아세테이트 데카복실라제(Adc), 알파-케토이소발레레이트 데카복실라제(데카복실라제; KivD), 및 알콜 데하이드로게나제(Adh2), 또는 이의 임의의 하나 이상의 기능적 등가 변이체 각각을 코딩하는 핵산을 포함한다.
상기의 각각의 효소를 코딩하는 예시적인 아미노산 서열 및 핵산 서열은 본원 어디에나 기술되어 있는 바와 같이, 진뱅크(GenBank)에 제공되어 있다(특히, 본원 하기의 표 6 및 18에서 제공되는 예를 참조할 수 있다). 그러나, 당업자는 본원, 진뱅크 및 다른 데이터베이스에 포함되어 있는 정보, 및 유전자 코드와 관련하여 효소를 코딩하는 대안적 핵산 서열, 또는 기능적 등가 변이체를 쉽게 이해할 것이다.
한 실시양태에서, 아세틸-코엔자임 A 아세틸트랜스퍼라제(티올라제; ThlA)는 서열 번호 42의 서열, 또는 이의 기능적 등가 변이체를 가진다. 한 실시양태에서, 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 A(CoA 트랜스퍼라제; CtfA)는 서열 번호 43의 서열, 또는 이의 기능적 등가 변이체를 가진다. 한 실시양태에서, 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 B(CoA 트랜스퍼라제; CtfB)는 서열 번호 44의 서열, 또는 이의 기능적 등가 변이체를 가진다. 한 실시양태에서, 아세토아세테이트 데카복실라제(Adc)는 서열 번호 45의 서열, 또는 이의 기능적 등가 변이체를 가진다. 한 실시양태에서, 알파-케토이소발레레이트 데카복실라제(데카복실라제; KivD)는 서열 번호 73의 서열, 또는 이의 기능적 등가 변이체를 가진다. 한 실시양태에서, 알콜 데하이드로게나제(Adh)는 서열 번호 38 및 서열 번호 40의 서열을 가진다. 한 특정 실시양태에서, 알콜 데하이드로게나제(Adh)는 서열 번호 1의 서열, 또는 이의 기능적 등가 변이체를 가진다. 한 특정 실시양태에서, 알콜 데하이드로게나제(Adh)의 기능적 등가 변이체는 서열 번호 1과 대략 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 가진다. 한 실시양태에서, 알콜 데하이드로게나제(Adh2)는 서열 번호 75의 서열, 또는 이의 기능적 등가 변이체를 가진다
한 실시양태에서, 아세틸-코엔자임 A 아세틸트랜스퍼라제(티올라제; ThlA)를 코딩하는 핵산 서열은 서열 번호 18을 포함하거나, 또는 이의 기능적 등가 변이체이다. 한 실시양태에서, 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 A(CoA 트랜스퍼라제; CtfA)를 코딩하는 핵산 서열은 서열 번호 19를 포함하거나, 또는 이의 기능적 등가 변이체이다. 한 실시양태에서, 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 B(CoA 트랜스퍼라제; CtfB)를 코딩하는 핵산 서열은 서열 번호 20을 포함하거나, 또는 이의 기능적 등가 변이체이다. 한 실시양태에서, 아세토아세테이트 데카복실라제(Adc)를 코딩하는 핵산 서열은 서열 번호 21ㅇㄹ 포함하거나, 또는 이의 기능적 등가 변이체이다. 한 실시양태에서, 알파-케토이소발레레이트 데카복실라제(데카복실라제; KivD)를 코딩하는 핵산 서열은 서열 번호 72 또는 76을 포함하거나, 또는 이의 어느 하나의 기능적 등가 변이체이다. 한 실시양태에서, 알콜 데하이드로게나제(Adh2)를 코딩하는 핵산 서열은 서열 번호 74 또는 77을 포함하거나, 또는 이의 어느 하나의 기능적 등가 변이체이다. 한 실시양태에서, 알콜 데하이드로게나제(Adh)를 코딩하는 핵산 서열은 서열 번호 39 또는 서열 번호 41을 포함하거나, 또는 이의 어느 하나의 기능적 등가 변이체이다. 한 특정 실시양태에서, 알콜 데하이드로게나제(Adh)를 코딩하는 핵산 서열은 서열 번호 2, 서열 번호 3, 또는 서열 번호 4를 포함하거나, 또는 이의 어느 하나의 기능적 등가 변이체이다. 한 실시양태에서, 서열 번호 2, 서열 번호 3, 또는 서열 번호 4의 기능적 등가 변이체는 서열 번호 2, 3 또는 4와 대략 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 가진다.
한 실시양태에서, 본 발명의 핵산은 프로모터를 추가로 포함할 것이다. 한 실시양태에서, 프로모터는 이의 제어하에 유전자의 구성적 발현이 이루어질 수 있도록 한다. 그러나, 유도성 프로모터 또한 사용될 수 있다. 당업자는 본 발명에서의 프로모터의 용도를 쉽게 이해할 것이다. 바람직하게, 프로모터는 적절한 발효 조건하에서 고수준의 발현을 지시할 수 있다. 특정 실시양태에서, 우드-륭달 클러스터 프로모터가 사용된다. 또 다른 실시양태에서, 포스포트랜스아세틸라제/아세테이트 키나제 프로모터가 사용된다. 또 다른 실시양태에서, 피루베이트:페레독신 옥시도리덕타제 프로모터, Rnf 복합체 오페론 프로모터 또는 ATP 신타제 오페론 프로모터가 사용된다. 한 특정 실시양태에서, 프로모터는 C. 오토에타노게눔으로부터의 것이다. 한 특정 실시양태에서, 프로모터는 서열 번호 22, 서열 번호 79의 서열을 가지거나, 또는 이의 어느 하나의 기능적 등가 변이체이다. 다른 실시양태에서, 프로모터는 서열 번호 56, 57, 51, 58, 59, 52, 60, 61, 53, 62 또는 63의 서열을 가지거나, 또는 이의 어느 하나의 기능적 등가 변이체이다.
본 발명의 핵산은 모체 미생물의 형질전환시 염색체외 상태로 유지될 수 있거나, 미생물의 게놈 내로의 통합을 위해 적합화될 수 있다. 따라서, 본 발명의 핵산은 통합을 지원하도록(예를 들어, 상동성 재조합 및 숙주 게놈 내로의 표적화된 통합이 이루어질 수 있도록 하는 영역), 또는 염색체외 구성물의 안정한 발현 및 복제를 지원하도록(예를 들어, 복제 기점, 프로모터 및 다른 조절 서열) 적합화된 추가의 뉴클레오티드 서열을 포함할 수 있다.
한 실시양태에서, 핵산은 핵산 구성물 또는 벡터이다. 한 특정 실시양태에서, 핵산 구성물 또는 벡터는 발현 구성물 또는 벡터이지만, 그러나, 다른 구성물 및 벡터, 예컨대, 클로닝에 사용된 것도 본 발명에 포함된다. 한 특정 실시양태에서, 발현 구성물 또는 벡터는 플라스미드이다. 한 특정 실시양태에서, 발현 플라스미드는 서열 번호 46, 48, 83, 84, 95, 98 또는 101의 뉴클레오티드 서열을 가진다.
본 발명의 발현 구성물/벡터는 프로모터 이외에도 임의 개수의 조절 요소 뿐만 아니라, 원하는 경우, 추가 단백질의 발현에 적합한 추가의 유전자도 포함할 수 있다는 것을 이해할 것이다. 한 실시양태에서 발현 구성물/벡터는 한 프로모터를 포함한다. 또 다른 실시양태에서, 발현 구성물/벡터는 2개 이상의 프로모터를 포함한다. 한 특정 실시양태에서, 발현 구성물/벡터는 발현시키고자 하는 한 유전자에 대한 한 프로모터를 포함한다. 한 실시양태에서, 발현 구성물/벡터는 하나 이상의 리보솜 결합 부위, 바람직하게, 발현시키고자 하는 한 유전자에 대한 리보솜 결합 부위를 포함한다.
본원에 기술된 핵산 서열 및 구성물/벡터 서열은 표준 링커 뉴클레오티드, 예컨대, 리보솜 결합 부위 및/또는 제한 부위에 필요한 것을 포함할 수 있다는 것을 당업자는 이해할 것이다. 상기와 같은 링커 서열은 필요한 것으로서 해석되지 않아야 하며, 정의되는 서열에 대한 제한은 두지 않는다.
본 발명의 발현 구성물/벡터를 비롯한, 핵산 및 핵산 구성물은 임의 개수의 당업계의 표준 기법을 사용하여 구성될 수 있다. 예를 들어, 화학적 합성법 또는 재조합 기법이 사용될 수 있다. 그러한 기법은 예를 들어, 문헌 [Sambrook et al (Molecular Cloning: A laboratory manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989)]에 기술되어 있다. 추가의 예시적인 기법은 본원 하기의 실시예 섹션에 기술되어 있다. 본질적으로, 개별 유전자 및 조절 요소는 상기 유전자가 발현되어 원하는 단백질을 형성할 수 있도록 작동가능하게 서로 연결될 것이다. 본 발명에서 사용하기에 적합한 벡터에 대해서 당업계의 숙련가는 이해하고 있을 것이다. 그러나, 일례로, 하기 벡터가 적합할 수 있다: pMTL80000 벡터s, pIMP1, pJIR750, 및 본원 하기의 실시예 섹션에 예시되어 있는 플라스미드.
본 발명의 핵산은 RNA, DNA, 또는 cDNA를 비롯한, 임의의 적절한 형태일 수 있다는 것을 이해하여야 한다.
본 발명은 또한 본원에 기술된 핵산 중 임의의 하나 이상을 포함하는 숙주 유기체, 특히, 바이러스, 박테리아, 및 효모를 비롯한, 미생물을 제공한다.
하나 이상의 외인성 핵산은 네이키드 핵산으로서 모체 미생물에 전달될 수 있거나, 또는 형질전환 과정을 용이하게 하는 하나 이상의 작용제와 함께 제제화될 수 있다(예를 들어, 리포솜에 컨쥬게이트된 핵산, 핵산이 함유된 유기체). 하나 이상의 핵산은 적절하게 DNA, RNA, 또는 이의 조합일 수 있다. 특정 실시양태에서 제한 효소가 사용될 수 있다; 예를 들어, 문헌 [Murray, N.E. et al. (2000) Microbial. Molec. Biol. Rev. 64, 412])를 참조할 수 있다.
본 발명의 미생물은 임의 개수의, 당업계에 공지된 재조합 미생물을 제조하는 기법을 사용하여 모체 미생물 및 하나 이상의 외인성 핵산으로부터 제조될 수 있다. 단지 일례로서, (형질도입 또는 형질감염을 비롯한) 형질전환은 전기천공, 초음파처리, 폴리에틸렌 글리콜 매개 형질전환, 화학적 또는 천연 능력, 또는 컨쥬게이션에 의해 달성될 수 있다. 적합한 형질전환 기법은 예를 들어, 문헌 [Sambrook J, Fritsch EF, Maniatis T: Molecular Cloning: A laboratory Manual, Cold Spring Harbour Labrotary Press, Cold Spring Harbour, 1989]에 기술되어 있다.
특정 실시양태에서, 형질전환시키고자 하는 미생물에서 활성을 띠는 제한 시스템에 기인하여, 미생물 내로 도입시키고자 하는 핵산을 메틸화시키는 것이 필요하다. 이는 하기 기술되는 것, 및 본원 하기의 실시예 섹션에서 추가로 예시되는 것을 비롯한, 다양한 기법을 사용하여 수행될 수 있다.
일례로, 한 실시양태에서, 본 발명의 재조합 미생물은 하기 단계:
(i) 본원에 기술된 발현 구성물/벡터 및 (ii) 메틸트랜스퍼라제 유전자를 포함하는 메틸화 구성물/벡터를 셔틀 미생물 내로 도입시키는 단계;
메틸트랜스퍼라제 유전자를 발현시키는 단계;
셔틀 미생물로부터 하나 이상의 구성물/벡터를 단리시키는 단계; 및
하나 이상의 구성물/벡터를 목적 미생물 내로 도입시키는 단계를 포함하는 방법에 의해 제조된다.
한 실시양태에서, B단계의 메틸트랜스퍼라제 유전자는 항시 발현된다. 또 다른 실시양태에서, B단계의 메틸트랜스퍼라제 유전자의 발현은 유도적으로 이루어진다.
셔틀 미생물은 미생물, 바람직하게, 발현 구성물/벡터를 구성한 핵산 서열의 메틸화를 촉진시키는 제한 음성 미생물이다. 특정 실시양태에서, 셔틀 미생물은 제한 음성 E. 콜라이, 바실러스 섭틸리스(Bacillus subtillis), 또는 락토코커스 락티스이다.
메틸화 구성물/벡터는 메틸트랜스퍼라제를 코딩하는 핵산 서열을 포함한다.
일단 발현 구성물/벡터 및 메틸화 구성물/벡터가 셔틀 미생물 내로 도입되고 나면, 메틸화 구성물/벡터 상에 존재하는 메틸트랜스퍼라제 유전자가 유도된다. 비록 본 발명의 한 특정 실시양태에서는 메틸화 구성물/벡터가 (바람직하게는 서열 번호 50에 의해 코딩되는) 유도성 lac 프로모터를 포함하고, 락토스 또는 이의 유사체, 더욱 바람직하게는, 이소프로필-β-D-티오-갈락토시드(IPTG) 첨가에 의해 유도되기는 하지만, 유도는 임의의 적합한 프로모터 시스템에 의해 이루어질 수 있다. 다른 적합한 프로모터로는 ara, tet, 또는 T7 시스템을 포함한다. 본 발명의 추가의 실시양태에서, 메틸화 구성물/벡터 프로모터는 구성적 프로모터이다.
특정 실시양태에서, 메틸화 구성물/벡터는 메틸화 구성물/벡터 상에 존재하는 임의의 유전자가 셔틀 미생물 중에서 발현될 수 있도록 하기 위해 셔틀 미생물의 아이덴티티에 특이적인 복제 기점을 가진다. 바람직하게, 발현 구성물/벡터는 발현 구성물/벡터 상에 존재하는 임의의 유전자가 목적 미생물 중에서 발현될 수 있도록 하기 위해 목적 미생물의 아이덴티티에 특이적인 복제 기점을 가진다.
메틸트랜스퍼라제 효소가 발현되면, 발현 구성물/벡터 상에 존재하는 메틸화된다. 이어서, 다수의 공지 방법들 중 어느 하나에 따라 셔틀 미생물로부터 발현 구성물/벡터를 단리시킬 수 있다. 단지 일례로, 하기 기술되는 실시예 섹션에 기술되어 있는 방법을 사용하여 발현 구성물/벡터를 단리시킬 수 있다.
한 특정 실시양태에서, 구성물/벡터, 둘 모두가 동시에 단리된다.
발현 구성물/벡터는 임의 개수의 공지 방법을 사용하여 목적 미생물 내로 도입할 수 있다. 그러나, 일례로, 하기 실시예 섹션에 기술되어 있는 방법이 사용될 수 있다. 발현 구성물/벡터가 메틸화되기 때문에, 발현 구성물/벡터 상에 존재하는 핵산 서열은 목적 미생물 내로 도입될 수 있고, 성공적으로 발현될 수 있다.
메틸트랜스퍼라제 유전자는 셔틀 미생물 내로 도입되어 과다발현될 수 있을 것으로 예상된다. 따라서, 한 실시양태에서, 공지된 방법을 사용하여 생성된 메틸트랜스퍼라제 효소를 수집할 수 있고, 시험관내에서 이를 사용하여 발현 플라스미드를 메틸화시킬 수 있다. 이어서, 발현 구성물/벡터를 발현을 위해 목적 미생물 내로 도입할 수 있다. 또 다른 실시양태에서, 메틸트랜스퍼라제 유전자를 셔틀 미생물의 게놈 내로 도입한 후, 발현 구성물/벡터를 셔틀 미생물 내로 도입하고, 셔틀 미생물로부터 하나 이상의 구성물/벡터를 단리시킨 후, 발현 구성물/벡터를 목적 미생물 내로 도입할 수 있다.
상기 정의된 바와 같은 발현 구성물/벡터 및 메틸화 구성물/벡터를 조합하여 조성물을 제공할 수 있을 것으로 예상된다. 이러한 조성물은 본 발명의 재조합 미생물을 제조하기 위해 제한 장벽 기전을 회피하는 데 특히 유용성을 가진다.
한 특정 실시양태에서, 발현 구성물/벡터 및/또는 메틸화 구성물/벡터는 플라스미드이다.
당업계의 숙련가는 본 발명의 미생물을 제조하는 데 있어서 다수의 적합한 메틸트랜스퍼라제의 용도를 이해할 것이다. 그러나, 일례로, 바실러스 섭틸리스 파지 φT1 메틸트랜스퍼라제 및 본원 하기의 실시예에 기술되어 있는 메틸트랜스퍼라제가 사용될 수 있다. 한 실시양태에서, 메틸트랜스퍼라제는 서열 번호 34의 아미노산 서열을 가지거나, 또는 이의 기능적 등가 변이체이다. 적합한 메틸트랜스퍼라제를 코딩하는 핵산은 원하는 메틸트랜스퍼라제의 서열, 및 유전자 코드와 관련하여 쉽게 이해될 것이다. 한 실시양태에서, 메틸트랜스퍼라제를 코딩하는 핵산은 본원 하기 실시예에 기술되어 있는 바와 같다(예를 들어, 서열 번호 35의 핵산이거나, 또는 이의 기능적 등가 변이체이다).
메틸트랜스퍼라제 유전자가 발현될 수 있도록 적합화된 임의 개수의 구성물/벡터를 사용하여 메틸화 구성물/벡터를 제조할 수 있다. 그러나, 일례로, 하기 실시예 섹션에서 기술되는 플라스미드가 사용될 수 있다. 한 특정 실시양태에서, 플라스미드는 서열 번호 49의 서열을 가진다.
본 발명은 본 발명의 재조합 미생물을 사용하여 CO를 포함하는 기질을 발효시키는 단계를 포함하는, 미생물 발효에 의해 하나 이상의 바람직한 생성물(아세톤, 이소프로판올, 및/또는 또는 아세톤 및/또는 이소프로판올의 전구체)을 제조하는 방법을 제공한다. 본 발명의 발명을 사용하여 산업 공정으로부터 발생되는 대기 중의 총 탄소 방출량을 감소시킬 수 있다.
바람직하게, 발효는 바이오반응기에서 본 발명의 재조합 미생물을 사용하여 기질을 혐기적으로 발효시켜 하나 이상의 생성물을 제조하는 단계를 포함한다.
한 실시양태에서, 본 발명은
(a) 본 발명의 하나 이상의 미생물의 배양물을 함유하는 바이오반응기에 CO를 포함하는 기질을 제공하는 단계; 및
(b) 바이오반응기에서 배양물을 혐기적으로 발효시켜 하나 이상의 생성물을 제조하는 단계를 포함한다.
한 실시양태에서, 본 방법은
(a) 산업 공정의 결과로서 생산되는 CO 함유 가스를 상기 가스가 대기로 방출되기 이전에 포획하는 단계;
(b) 본 발명의 하나 이상의 미생물의 배양물을 함유하는 배양물에 의한 CO 함유 가스의 혐기성 발효를 통해 하나 이상의 생성물을 제조하는 단계를 포함한다.
본 발명의 실시양태에서, 미생물에 의해 발효되는 가스 기질은 CO를 함유하는 가스 기질이다. 가스 기질은 산업 공정의 부산물로서 수득되거나, 일부 다른 공급원, 예컨대, 자동차 배기 연기로부터 수득된 CO 함유 폐가스일 수 있다. 특정 실시양태에서, 산업 공정은 철 금속 생성물 제조, 예컨대, 제철, 비철 생성물 제조, 석유 정련 공정, 석탄의 가스화, 전력 생산, 카본 블랙 생산, 암모니아 생산, 메탄올 생산 및 코크스 제조로 이루어진 군으로부터 선택된다. 이러한 실시양태에서, CO 함유 가스는 대기 내로 방출되기 전에 임의의 편리한 방법을 사용함으로써 산업 공정으로부터 포획될 수 있다. CO는 합성가스(일산화탄소 및 수소를 포함하는 가스)의 구성성분일 수 있다. 산업 공정으로부터 생산되는 CO는 보통 연소되어 CO2를 생산하는 바, 이에, 본 발명은 CO2 온실 가스 방출을 감소시키는 데, 및 바이오연료로서 사용될 부탄올을 생산하는 데 있어서 특히 유용하다. 가스 CO 함유 기질의 조성에 따라, 상기 기질을 발효에 도입하기 전에 임의의 원치 않는 불순물, 예컨대, 분진 입자를 제거하도록 상기 기질을 처리하는 것이 바람직할 수도 있다. 예를 들어, 공지된 방법을 사용하여 상기 가스 기질을 여과하거나 세정할 수 있다.
박테리아의 성장 및 CO에서 하나 이상의 생성물(들)이 생성되도록 CO 함유 기질 가스 이외에 적합한 액체 영양 배지를 바이오반응기에 공급할 필요가 있다는 것을 이해할 것이다. 기질 및 배지는 연속식, 회분식, 또는 유가식으로 바이오반응기에 공급될 수 있다. 영양 배지는 사용된 미생물의 성장을 허용하기에 충분한 비타민 및 광물을 함유할 것이다. CO를 사용하여 부탄올을 생산하기 위한 발효에 적합한 혐기 배지는 당업계에 공지되어 있다. 예를 들어, 적합한 배지는 문헌 [Biebel (2001)]에 기술되어 있다. 본 발명의 한 실시양태에서, 상기 배지는 본원 하기의 실시예 섹션에 기술되어 있는 것과 같다.
발효는 바람직하게는 하나 이상의 생성물(들)로의 CO의 발효가 일어나기에 적절한 조건하에서 수행되어야 한다. 고려되어야 하는 반응 조건으로는 압력, 온도, 가스 유속, 액체 유속, 배지 pH, 배지 산화환원 전위, 교반 속도(연속 교반 탱크 반응기를 이용하는 경우), 접종 수준, 액상 중의 CO가 한정되지 않도록 보장하기 위한 최대 가스 기질 농도, 및 생성물 억제를 피하기 위한 최대 생성물 농도를 포함한다.
또한, 기질 스트림의 CO 농도(또는 가스 기질 중의 CO 분압)를 증가시켜 CO 가 기질인 발효 반응의 효율을 증가시키는 것이 종종 바람직할 수 있다. 증가된 압력에서의 작동은 CO가 가스상으로부터 액상(여기서, CO는 하나 이상의 생성물의 생산을 위한 탄소 공급원으로서 미생물에 의해 섭취될 수 있다)으로 전달되는 속도를 현저하게 증가시킬 수 있다. 이는 바이오반응기가 대기압보다 오히려 승압에서 유지될 때 (바이오반응기 내의 액체 부피를 유입 가스 유속으로 나눈 값으로서 정의되는) 체류 시간이 감소될 수 있다는 것을 의미한다. 최적 반응 조건은 부분적으로는 사용된 본 발명의 특정 미생물에 따라 달라질 것이다. 그러나, 일반적으로는 주변 압력보다 더 높은 압력에서 발효를 수행하는 것이 바람직하다. 또한, 하나 이상의 생성물(들)로의 CO의 주어진 전환 속도가 부분적으로는 기질 체류 시간의 함수이고, 결국 원하는 체류 시간 달성이 바이오반응기의 필요한 부피를 나타내기 때문에, 가압된 시스템을 사용하는 것이 필요한 바이오반응기의 부피를 크게 감소시킬 수 있고, 결과적으로 발효 장치의 자본 비용을 크게 감소시킬 수 있다. 미국 특허 번호 제5,593,886호에 제공된 예에 따르면, 반응기 부피는 반응기 작동 압력의 증가에 비례하여 감소될 수 있으며, 즉, 10 대기압에서 작동되는 바이오반응기는 1 대기압에서 작동되는 바이오반응기의 10분의 1 부피만을 필요로 한다.
일례로, 승압에서 에탄올로의 가스의 발효를 수행하는 것에 관한 이점은 기술되어 있다. 예를 들어, WO 02/08438에는 30 psig 및 75 psig 압력하에 에탄올로의 가스의 발효를 수행하여 각각 150 g/ℓ/일 및 369 g/ℓ/일의 에탄올 생산성을 수득한 것이 기술되어 있다. 그러나 , 대기압에서 유사한 배지 및 유입 가스 조성물을 사용하여 수행한 예시적 발효는 1일 1 ℓ당 10배 내지 20배 더 적은 에탄올을 생산하는 것으로 밝혀졌다 .
또한, CO 함유 가스 기질 도입 속도는 예컨대, 액상 중의 CO가 한정되지 않도록 보장하기 위한 것이 바람직하다. CO 제한 조건의 결과는 에탄올 생성물이 배양물에 의해 소비되는 것일 수 있다는 이유에서 그러하다.
발효 반응을 공급하는 데에 사용되는 가스 스트림의 조성이 상기 반응의 효율 및/또는 비용에 상당한 영향을 미칠 수 있다. 예를 들어, O2는 혐기성 발효 공정의 효율을 감소시킬 수 있다. 발효 전 또는 그 후에 발효 공정의 단계에서 원치 않는 또는 불필요한 가스의 프로세싱은 이러한 단계에 대한 부담을 증가시킬 수 있다(예컨대, 가스 스트림이 바이오반응기에 들어가기 전에 압축되는 경우, 발효에서 필요하지 않은 가스를 압축하기 위해 불필요한 에너지가 사용될 수 있다). 따라서, 원치 않는 성분을 제거하고 바람직한 성분의 농도를 증가시키기 위해 기질 스트림, 특히 산업 공급원으로부터 유래된 기질 스트림을 처리하는 것이 바람직할 수 있다.
특정 실시양태에서, 본 발명의 박테리아의 배양물은 수성 배양 배지에서 유지된다. 바람직하게는, 상기 수성 배양 배지는 최소 혐기성 미생물 성장 배지이다. 적합한 배지는 당업계에 공지되어 있고, 예를 들어, 미국 특허 제5,173,429호 및 제5,593,886호, 및 WO 02/08438에 기술되어 있고, 본원 하기 실시예 섹션에 기술되어 있는 바와 같다.
아세톤, 이소프로판올, 또는 아세톤 및/또는 이소프로판올 및/또는 하나 이상의 다른 생성물을 함유하는 혼합된 스트림은 당업계에 공지된 방법, 예컨대, 분별 증류 또는 증발, 투과증발, 가스 스트립핑, 및 예를 들어, 액체-액체 추출을 비롯한, 추출 발효에 의해 발효 브로쓰로부터 회수될 수 있다.
본 발명의 특정 바람직한 실시양태에서, 하나 이상의 생성물은 발효 브로쓰의 일부를 바이오반응기로부터 연속적으로 제거하고, (편리하게는 여과를 통해) 미생물 세포를 상기 브로쓰으로부터 분리하고, 하나 이상의 생성물을 브로쓰로부터 회수함으로써 발효 브로쓰으로부터 회수된다. 알콜은 편리하게는 예를 들어, 증류에 의해 회수될 수 있다. 아세톤은 은 편리하게는 예를 들어, 증류에 의해 회수될 수 있다. 임의의 산은 예를 들어, 활성탄 상에의 흡착에 의해 회수될 수 있다. 분리된 미생물 세포는 바람직하게는 발효 바이오반응기로 복귀된다. 임의의 알콜(들) 및 산(들)이 제거된 후 남아있는 무세포 투과액도 바람직하게는 발효 바이오반응기로 복귀된다. 영양 배지가 바이오반응기로 복귀되기 전에 상기 영양 배지를 보충하기 위해 추가 영양분(예컨대, 비타민 B)을 상기 무세포 투과액에 첨가할 수 있다.
또한, 아세트산이 활성탄에 흡착되는 것을 증진시키기 위해 상기 기술된 바와 같이 브로쓰의 pH를 조절한 경우, 상기 pH는 바이오반응기로 복귀되기 전에 발효 바이오반응기 내의 발효 브로쓰의 pH와 유사한 pH로 재조절되어야 한다.
실시예 :
본 발명은 이제 하기의 비제한적인 실시예를 참고하여 더욱 상세하게 설명될 것이다.
미생물 및 성장 조건
아세토박테리움 우디이 DSM1030, 클로스트리디움 아세티쿰(Clostridium aceticum) DSM1496, C. 오토에타노게눔 DSM23693, C. 카복시디보란스(C. carboxidivorans) DSM15243, 및 C. 륭달리이 DSM13528을 DSMZ(독일의 미생물 세포 배양 기관(The German Collection of Microorganisms and Cell Cultures: 독일 38124 브라운슈바이크 인호펜슈트라세 7베))로부터 입수하였다.
C. 라그스달레이 ATCC BAA-622는 아메리칸 타입 컬쳐 콜렉션(American Type Culture Collection: 미국 버지니아주 20108 마나사스)으로부터 입수하였다.
C. 아세토부틸리쿰 ATCC824, C. 베이예린키이 NRRL-B593, 및 C. 베이예린키이 NCIMB8052는 (David Jones) 교수(오타고 대학)로부터 입수하였고, 이는 또한 각각 수탁 번호 ATCC824/DSM792, DSM6423, 및 ATCC51743하에 공공의 균주 수집소인 DSMZ 및 ATCC로부터도 입수할 수 있었다.
에스케리키아 콜라이(Escherichia coli) DH5α-T1R은 인비트로겐(미국 캘리포니아주 92008 칼즈배드)로부터 입수하였고, 에스케리키아 콜라이 XL1-블루 MRF' Kan 및 ABLE K는 스트라테이진(Stratagene: 미국 캘리포니아주 CA 95051-7201 산타클라라)으로부터 입수하였다. 에스케리키아 콜라이 JW3350-2는 더 콜라이 제네틱 스톡 센터(CGSC: The Coli Genetic Stock Center: 미국 코네티컷주 06520-8103 뉴 헤이븐)로부터 입수하였다.
프럭토스(종속 영양 성장), 또는 헤드스페이스에 30 psi CO 함유 제철소 가스(뉴질랜드 글렌브룩 뉴질랜드 스틸(New Zealand Steel) 부지로부터 수집; 조성: 44% CO, 32% N2, 22% CO2, 2% H2)(독립 영양 성장)를 포함하는 세럼 병 중 50 ml 부피의 액체 배지 중에서 E. 콜라이를 호기성 및 혐기성 조건, 둘 모두하에 배양하였고, 동시에 다른 균주들은 모두 엄격하게 혐기적으로 성장시켰다.
표 2-4에 제시된 제법에 따라 표준 혐기성 기법(문헌 [Hungate RE: A roll tube method for cultivation of strict anaerobes, in Norris JR and Ribbons DW (eds.), Methods in Microbiology, vol. 3B. Academic Press, New York, 1969: 117-132]; [Wolfe RS: Microbial formation of methane. Adv Microb Physiol 1971, 6: 107-146])을 사용하여 배지를 제조하였다. 고체 배지의 경우, 1.2% 박토 아가(BD: Bacto agar, 미국 뉴저지주 07417 프랑크톤 레이크스)를 첨가하였다.
균주 모두를 37℃에서 성장시키되, 단, A. 우디이(A. woodii), C. 아세티쿰, 및 C. 라그스달레이는 30℃에서 성장시켰다.
<표 2>
Figure 112019080913904-pat00001
<표 3>
Figure 112019080913904-pat00002
루리아 베르타니 배지 LB(Luria Bertani)(E. 콜라이)
배지 성분 배지 1.0 ℓ당 농도
트립톤 10 g
효모 추출물 5 g
NaCl 10 g
<표 5>
Figure 112019080913904-pat00003
하기 기술되는 바와 같이, 단일 에너지 공급원 및 탄소 공급원으로서 CO 함유 제철소 가스를 이용하여 37℃에서 1.5 ℓ 바이오반응기 중에서 C. 오토에타노게눔 DSM23693을 이용한 발효를 수행하였다. 1 ℓ당 MgCl, CaCl2(0.5 mM), KCl (2 mM), H3PO4(5 mM), Fe(100 μM), Ni, Zn (5 μM), Mn, B, W, Mo, Se(2 μM)를 함유하는 한정 배지를 사용하였으며, 이를 배양물 성장을 위해 제조하였다. 배지를 바이오반응기로 옮겨 놓고, 121℃에서 45분 동안 오토클레이빙하였다. 오토클레이빙한 후, 배지를 티아민, 판토테네이트(0.05 mg), 비오틴(0.02 mg)으로 보충하고, 3 mM 시스테인-HCl로 환원시켰다. 혐기성 상태를 달성하기 위해, 0.2 ㎛ 필터를 통해 질소를 상기 반응기 베쓸에 살포하였다. 접종하기 전, 반응기에 연속 공급하면서, 가스를 CO 함유 제철소 가스로 바꾸었다. 교반을 200 rpm에서 350으로 증가시키면서, 초기 가스 유량은 80 ml/min로 설정하고, 중간 대수증식기 동안 200 ml/min으로 증가시켰다. Na2S를 0.25 ml/hr로 바이오반응기 내로 투여하였다. 일단 OD600이 0.5에 도달하고 나면, 바이오반응기를 1.0 ml/min 속도(희석율 0.96 d-1)의 연속 모드로 변환시켰다. 배지 시료를 채취하여 바이오매스 및 대사산물을 측정하고, 정기적으로 유입 및 유출 가수의 헤드스페이스 분석을 수행하였다.
대사산물 분석
35℃에서 작동하는 RID(시차 굴절률 검출기: Refractive Index Detector)가 장착된 애질런트 1100 시리즈 HPLC 시스템(Agilent 1100 Series HPLC system) 및 60℃에서 보관된 올테스 IOA-2000 오개닉 애시드 칼럼(Alltech IOA-2000 Organic acid column)(150 x 6.5 mm, 입자 크기 5 ㎛)을 사용하여 아세톤, 이소프로판올 및 다른 대사산물의 HPLC 분석을 수행하였다. 유속 0.7 ml/min의 이동상으로서 약간 산성화된 물(0.005 M H2SO4)을 사용하였다. 단백질 및 다른 세포 잔류물을 제거하기 위해, 400 ㎕ 시료를 100 ㎕의 2%(w/v) 5-술포살리실산과 혼합하고, 3 min 동안 14,000 x g로 원심분리하여 침전된 잔류물을 분리시켰다. 이어서, 10 ㎕의 상청액을 분석용 HPLC 내로 주입하였다.
슈펠코(Supelco) PDMS 100 1 cm 섬유가 장착된 애질런트 6890N 헤드스페이스 GC, 올테크 EC-1000(30 m x 0.25 mm x 0.25 ㎛) 칼럼, 및 불꽃 이온화 검출기(FID: flame ionization detector)를 이용하여 아세톤, 이소프로판올 및 다른 대사산물의 GC 분석을 수행하였다. 5 ml 시료를 헝게이트(Hungate) 튜브로 옮겨 놓고, 수조에서 40℃로 가열하고, 정확하게 5 min 동안 섬유에 노출시켰다. 주입기를 250℃로 유지시키고, 유속이 1 ml/min로 일정하게 유지되는 헬륨을 운반 가스로서 사용하였다. 오븐 프로그램은 40℃에서 5 min 동안이고, 이어서, 200℃까지 10℃/min로 승온시켰다. 이어서, 50℃/min 속도로 온도를 220℃까지 추가로 승온시킨 후, 상기 온도에서 5 min 동안 유지시키고, 이후 온도를 50℃/min 속도로 40℃로 하강시키고, 최종적으로 1 min 동안 유지시켰다. 40 ml/min 수소, 450 ml/min 대기 및 15 ml/min 보조(make up) 가스로서 질소를 이용하면서 FID를 250℃로 유지시켰다.
헤드스페이스 분석
2개의 채널이 설치된 베리안(Varian) CP-4900 마이크로 GC 상에서 측정하였다. 채널 1은 70℃에서 200 kPa 아르곤 및 백플러쉬 시간 4.2 s로 전개되는 10 m 몰-시브(Mol-sieve) 칼럼인 반면, 채널 2는 90℃에서 150 kPa 헬륨하에, 및 백플러쉬없이 전개되는 10 m PPQ 칼럼이었다. 두 채널 모두의 주입 온도는 70℃였다. 전개 시간을 120 s로 설정하였는데, 관심의 대상이 되는 피크는 모두 보통 100 s 이전에 용리되는 것이었다.
클로스트리디움 경로를 이용하여 이루어지는 아세톤 생산을 위한 C. 오토에타노게눔 및 C. 륭달리이의 유전자 변형
C. 오토에타노게눔 및 C. 륭달리이는 천연적으로 아세톤을 생산할 수 없는 바, 이에 다른 클로스트리디움 종에 존재하는 아세톤 생합성 경로를 상기 두 유기체 모두에 도입하였다(도 4). 클로스트리디움 아세톤 생합성 경로에서 아세틸-CoA로부터 아세토아세틸-CoA로의 제1 단계는 아세틸-코엔자임 A 아세틸트랜스퍼라제 또는 티올라제에 의해 촉매화시키는 것이다. 이어서, 아세토아세틸-CoA에서 아세톤으로의 전환은 특수 효소 세트, 아세테이트/부티레이트-아세토아세테이트 CoA-트랜스퍼라제 복합체 및 아세토아세테이트 데카복실라제에 의해 촉매화되는데, 이는 C. 아세토부틸리쿰 및 C. 베이예린키이와 같은 소수의 유기체에서 발견될 수 있다(하기 표 6).
<표 6>
Figure 112019080913904-pat00004
각 효소를 코딩하는 C. 아세토부틸리쿰의 유전자는 2개의 오페론으로 나뉘는 반면, C. 베이예린키이의 유전자는 공통 오페론을 형성하는데, 본 발명자(들)은 이것이 이점을 제공할 것이라고 믿었다. C. 아세토부틸리쿰으로부터의 티올라제를 코딩하는 유전자 및 효소 아세테이트/부티레이트-아세토아세테이트 CoA-트랜스퍼라제 서브유니트 A, 아세테이트/부티레이트-아세토아세테이트 CoA-트랜스퍼라제 서브유니트 B 및 아세토아세테이트 데카복실라제를 코딩하는 오페론을 강력한 천연 C. 오토에타노게눔 프로모터의 제어하에 합성 오페론으로 조립하였다(도 3). 아세톤 생산을 위해 상기 구성물을 사용하여 상기 두 유기체 모두를 유전적으로 조작하였다. 재조합 균주를 제조하기 위해, 신규한 메틸트랜스퍼라제를 사용하여 구성물을 메틸화시키고, 이어서, (본원 하기에서 기술되는) C. 오토에타노게눔 DSM23693 및 C. 륭달리이 DSM13528을 형질전환시키고, 그에서 발현시켰다. 아세톤 생산은 상이한 산업 가스 스트림(제철소 폐가스, 합성 가스) 상에서 나타났다.
클로스트리디움 아세톤 경로 유전자를 포함하는 발현 플라스미드 구성 :
본 발명에서는 표준 재조합 DNA 및 분자 클로닝 기법을 사용하였다(문헌 [Sambrook J, Fritsch EF, Maniatis T: Molecular Cloning: A laboratory Manual, Cold Spring Harbour Labrotary Press, Cold Spring Harbour, 1989]; [Ausubel FM, Brent R, Kingston RE, Moore DD, Seidman JG, Smith JA, Struhl K: Current protocols in molecular biology. John Wiley & Sons, Ltd., Hoboken, 1987]). 아세톤 생합성 유전자의 DNA 서열은 하기 표 7에 제시되어 있다. 표적 유전자의 발현을 위해 C. 오토에타노게눔의 우드-륭달 클러스터 프로모터(CO 데하이드로게나제 유전자 acsA의 상류쪽의 것)를 사용하였다(표 7).
클로스트리디움 아세톤 발현 플라스미드에 사용된 서열
설명 공급원 서열 번호
티올라제(thlA) 클로스트리디움 아세토부틸리쿰 ATCC 824;
NC_003030.1; GI: 1119056
18
아세토아세틸-CoA:아세테이트
코엔자임 A 트랜스퍼라제 A
(ctfA), 아세토아세틸-CoA:아세테이트 코엔자임 A 트랜스퍼라제 B (ctfB), 및 아세토아세테이트 데카복실라제 (adc) 오페론
클로스트리디움 베이예린키이 NCIMB 8052;
NC_009617; 영역: 4,400,524-4,402,656;
GI: 5294994, GI: 5294995, 및 GI: 5294996 포함
47
우드-륭달 클러스터 프로모터(P wL) 클로스트리디움 오토에타노게눔 DSM10061 22
(Bertram and Duerre)에 의한 변형된 방법(문헌 [Conjugal transfer and expression of streptococcal transposons in Clostridium acetobutylicum. Arch Microbiol 1989, 151: 551-557])을 사용하여 클로스트리디움 아세토부틸리쿰 ATCC824, C. 베이예린키이 NCIMB8052 및 C. 오토에타노게눔 DSM10061로부터의 게놈 DNA를 단리시켰다. 밤새도록 배양된 100 ml 배양무을 수거하고(6,000 x g, 15 min, 4℃), 인산칼륨 완충제(10 mM, pH 7.5)으로 세척하고, 1.9 ml STE 완충제(50 mM 트리스-HCl, 1 mM EDTA, 200 mM 수크로스; pH 8.0) 중에 현탁시켰다. 300 ㎕ 리소자임 (~100,000 U)을 첨가하고, 혼합물을 37℃에서 30 min 동안 인큐베이션시킨 후, 280 ㎕의 10% (w/v) SDS 용액을 첨가하고, 10 min 동안 추가로 한번 더 인큐베이션시켰다. 240 ㎕의 EDTA 용액(0.5 M, pH 8), 20 ㎕ 트리스-HCl(1 M, pH 7.5), 및 10 ㎕ RN아제 A를 첨가하여 실온에서 RNA를 분해하였다. 이어서, 100 ㎕ 프로테이나제 K(0.5 U)를 첨가하고, 37℃에서 1-3 h 동안 단백질 분해시켰다. 마지막으로, 600 ㎕의 과염소산나트륨 (5 M)을 첨가한 후, 페놀-클로로포름 추출 및 이소프로판올 침전을 수행하였다. 분광광도법으로 DNA 정량 및 정질을 검사하였다.
하기 표 8의 올리고뉴클레오티드과 함께, i프루프 하이 피델리티 DNA 폴리머라제(iProof High Fidelity DNA Polymerase)(바이오-래드 라보라토리즈(Bio-Rad Labratories: 미국 캘리포니아주 94547 허큘리스)) 및 하기 프로그램: 98℃에서 30초 동안 초기 변성에 이어, 변성(98℃에서 10초 동안), 어닐링(50-62℃에서 30-120초 동안) 및 신장(72℃에서 45초 동안)을 32회 사이클을 진행시킨 후, 최종 연장 단계(72℃에서 10분 동안)인 것을 이용하여 PCR에 의해 아세톤 생합성 유전자 및 우드-륭달 클러스터 프로모터를 증폭시켰다.
<표 8>
Figure 112019080913904-pat00005
NotI NdeI 제한 부위 및 균주 DH5α-T1R을 이용하여 우드-륭달 클러스터(PWL)의 증폭된 573 bp 프로모터 영역을 E. 콜라이-클로스트리디움 셔틀 벡터 pMTL 85141(FJ797651.1; Nigel Minton, 영국 노팅엄 대학) [Heap JT, Pennington OJ, Cartman ST, Minton NP. A modular system for Clostridium shuttle plasmids. J Microbiol Methods. 2009, 78: 79-85]로 클로닝하였다. 생성된 플라스미드 pMTL85147 및 티올라제 유전자의 1,194 bp PCR 생성물, 둘 모두를 NdeIEcoRI로 절단하였다. 결찰물을 E. 콜라이 XL1-블루 MRF' Kan으로 형질전환시켜 플라스미드 pMTL85147-thlA를 수득하였다. 이어서, KpnIBamHI 및 E. 콜라이 ABLE K를 사용하여 C. 베이예린키이 NCIMB 8052로부터의 ctfA-ctfB-adc 오페론의 증폭된 2,177 bp PCR 단편을 상기 벡터로 클로닝하여 플라스미드 pMTL85147-thlA-ctfA-ctfB-adc를 수득하였다. 하기 표 9에 제시된 올리고뉴클레오티드를 사용하여 생성된 플라스미드 pMTL85147-thlA-ctfAB-adc의 삽입체를 완전하게 서열 분석하고, 그 결과를 통해 아세톤 생합성 유전자 및 프로모터 영역에는 돌연변이가 없음을 확인하였다(도 5).
<표 9>
Figure 112019080913904-pat00006
클로스트리디움 아세톤 경로 유전자를 이용한 E. 콜라이에서의 아세톤 생산 :
구성된 플라스미드의 기능성을 확인하기 위해, 밤새도록 배양된, 플라스미드 pMTL85147-thlA-ctfA-ctfB-adc를 보유하는 E. 콜라이 ABLE K의 배양물 5 ml로부터의 대사 프로파일을 GC 및 HPLC를 이용하여 수득하고, 아세톤 생산에 대하여 확인하였다.
이에 대해 추가로 조사하기 위해, 플라스미드 pMTL 85147(음성 대조군) 또는 발현 플라스미드 pMTL 85147-thlA-ctfA-ctfB-adc를 보유하는 E. 콜라이 XL-1 블루 MRF' Kan과, 25 ㎍/ml 클로람페니콜을 함유하는 SD-8 최소 배지를 이용하여 상세한 성장 실험을 3중으로 수행하였다(도 42). 음성 대조군에서는 아세톤 생산이 관찰되지 않은 반면, 아세톤 플라스미드를 보유하는 균주의 경우, 평균 최대 아세톤 생산량은 75.05 mg/L이고, 평균 건조 바이오매스 양은 1.44 g/L인 것으로 측정되었다.
클로스트리디움 아세톤 경로 유전자를 이용한 발현 플라스미드의 메틸화 :
C. 오토에타노게눔, C. 라그스달레이 및 C. 륭달리이로부터의 메틸트랜스퍼라제 유전자로부터 디자인된 합성된 하이브리드 II형 메틸트랜스퍼라제 유전자(서열 번호 35)를 이용하여 E. 콜라이에서의 생체내 아세톤 발현 플라스미드 pMTL85147-thlA-ctfA-ctfB-adc 메틸화를 수행하였다. 메틸트랜스퍼라제(서열 번호 34)를 합성하고, 벡터 pGS20(ATG:바이오신세틱스 게엠베하(biosynthetics GmbH: 독일 메르자우센)) 중 유도성 lac 프로모터와 융합시켰다(도 6; 서열 번호 49).
발현 플라스미드 및 메틸화 플라스미드, 둘 모두를 제한 음성 E. 콜라이 XL1-블루 MRF' Kan의 같은 세포 내로 형질전환시켰는데, 이는 이의 화합성인 그람-(-) 복제 기점이기 때문에 가능한 것이었다(발현 플라스미드에서 많은 카피수의 ColE1 및 메틸화 플라스미드에서 적은 카피수의 p15A). 1 mM IPTG를 첨가하여 생체내 메틸화를 유도하고, 퀴아젠 플라스미드 미디 키트(QIAGEN Plasmid Midi Kit)(퀴아젠 게엠베하(QIAGEN GmbH: 독일 힐덴))를 사용하여 메틸화된 플라스미드를 단리시켰다. C. 오토에타노게눔 DSM23693 및 C. 륭달리이 DSM 13528을 이용한 형질전환 실험을 위해 생성된 믹스를 사용하였지만, 오직 풍부한(카피수가 많은) 발현 플라스미드만이 Gram-(+) 복제 기점(repL)을 가졌고, 이로써 클로스트리디아에서의 복제가 가능하였다.
C. 오토에타노게눔 및 C. 륭달리이에서의 메틸화된 아세톤 발현 플라스미드의 형질전환:
C. 오토에타노게눔 DSM23693 및 C. 륭달리이 DSM 13528의 적격 세포를 제조하기 위해, 50 ml 배양물(탄소 공급원으로서 제철소 가스 및 프럭토스를 포함하는 PETC 배지(표 2); 37℃)을 연속 3일 동안 새 배지로 계대배양하였다. 상기 세포를 사용하여 OD600 nm = 0.05로, 40 mM DL-트레오닌 함유 50 ml PETC 배지에 접종하였다. 배양물의 OD600 nm이 0.4에 도달하였을 때, 세포를 혐기성 챔버로 옮겨 놓고, 4,700 x g 및 4℃에서 수거하였다. 배양물을 빙냉 전기천공용 완충제(270 mM 수크로스, 1 mM MgCl2, 7 mM 인산나트륨, pH 7.4)로 2회에 걸쳐 세척하고, 마지막으로 500 ㎕ 부피의 새 전기천공용 완충제 중에 현탁시켰다. ~1 ㎍의 메틸화된 플라스미드 믹스를 함유하는 0.4 cm 전극 간극을 가지는 사전 냉각된 전기천공 큐벳 내로 상기 혼합물을 옮겨 놓았다. C. 오토에타노게눔과 비교하여 C. 륭달리이의 게놈 중에서 추가의 I형 제한 시스템이 확인되었는 바, 5 ㎕의 I형 제한 억제제(에피센터 바이오테크놀로지스(EPICENTRE Biotechnologies: 미국 위스콘신 53713 매디슨))를 플라스미드 믹스에 첨가하였으며, 이를 통해 C. 륭달리이의 형질전환율은 2-10배 증가하였다. 세포를 플라스미드, 및 제한 억제제와 혼합하고, 하기: 2.5 kV, 600 Ω, 및 25 μF인 설정하의 진 펄서 X셀(Gene pulser Xcell) 전기천공 시스템(바이오-래드)을 이용하여 즉시 펄싱하였다. 시간 상수는 3.7-5.1 ms였다. 재생시키기 위해, 배양물을 5 ml의 전문 재생 배지(표 10) 내로 옮겨 놓았고, 이를 통해 세포 회수량을 증가하였고, 튜브 홀더가 장착된 스펙트로닉 헬리오스 엡실론 분광광도계(Spectronic Helios Epsilon Spectrophotometer)(써모 피셔 사이언티픽 인코퍼레이티드(Thermo Fisher Scientific Inc.: 미국 매사추세츠주 02454 월섬))를 이용하여 600 nm의 파 장에서 모니터링하였다. 일단 성장한 것이 관찰되며(2배가 되고 나면), 세포를 수거하고, 200 ㎕ 새 배지에 현탁시키고, (100%(v/v) 디메틸푸란(DMF) 중에 용해된) 15 ㎍/ml 티암페니콜 및 헤드스페이스 중의 30 psi 제철소 가스를 포함하는 선별 PETC 플레이트 상에 플레이팅시켰다. 4-6일 경과 후 50-200개의 콜로니가 가시화되었으며, 이를 사용하여 (DMF 중) 15 ㎍/ml 티암페니콜, 및 탄소 공급원으로서 프럭토스 및 30 psi 제철소 가스를 함유하는 2 ml PETC 배지에 접종하였다. 성장이 이루어졌을 때, 배양물을 5 ml로 규모를 확장하고, 후에 각각 (DMF 중) 15 ㎍/ml 티암페니콜, 및 단독 탄소 공급원으로서 헤드스페이스 중의 30 psi 제철소 가스를 함유하는 50 ml PETC 배지로 규모를 확장하였다.
<표 10>
Figure 112019080913904-pat00007
클로스트리디움 아세톤 경로 유전자를 이용한, C. 오토에타노게눔 및 C. 륭달리이의 아세톤 플라스미드로의 성공적인 형질전환 확인 :
DNA 전달을 검증하기 위해, 지피(Zyppy) 플라스미드 미니 프렙 키트(지모 리서치(Zymo Research: 미국 캘리포니아주 92614 어바인))를 사용하여 10 ml 부피의 배양물로부터 플라스미드 미니 프렙을 수행하였다. 클로스트리디움 엑소뉴클레아제 활성으로 인해 제한 분해에는 단리된 플라스미드의 정질이 충분하지 못했기 때문에(문헌 [Burchhardt G and Diirre P, Isolation and characterization of DNase-deficient mutants of Clostridium acetobutylicum. Curr Microbiol 1990, 21: 307-311]), 프라이머 ctf-adc-cbei-KpnI-F(서열 번호 25) 및 ctf-adc-cbei-BamHI-R(서열 번호 26)을 이용하고 주형으로서 단리된 플라스미드를 사용함으로써 플라스미드의 존재를 확인하였다(도 7). 하기 조건: 94℃에서 2분 동안 초기 변성에 이어, 변성(94℃에서 20초 동안), 어닐링(55℃에서 20초 동안) 및 신장(72℃에서 135초 동안)을 35회 사이클을 진행시킨 후, 최종 연장 단계(72℃에서 5분 동안)인 것과 함께, iNtRON 맥시마이즈 프리믹스 PCR 키트(iNtRON Maximise Premix PCR kit)(인트론 바이오 테크놀로지스(Intron Bio Technologies))를 사용하여 PCR을 수행하였다.
클론의 아이덴티티를 확인하기 위해, 상기 제시된 프로토콜을 사용하여 각 C. 오토에타노게눔 DSM23693 및 C. 륭달리이 DSM13528의 50 ml 배양물로부터 게놈 DNA를 단리시켰다. 하기 조건: 94℃에서 2분 동안 초기 변성에 이어, 변성(94℃에서 20초 동안), 어닐링(55℃에서 20초 동안) 및 신장(72℃에서 60초 동안)을 35회 사이클을 진행시킨 후, 최종 연장 단계(72℃에서 5분 동안)인 것과 함께, 올리고뉴클레오티드 fD1(서열 번호 36: CCGAATTCGTCGACAACAGAGTTTGATCCTGGCTCAG) 및 rP2(서열 번호 37: CCCGGGATCCAAGCTTACGGCTACCTTGTTACGACTT)(문헌 [Weisberg WG, Barns SM, Pelletier BA and Lane DJ, 16S ribosomal amplification for phylogenetic study. J Bacteriol 1990, 173: 697-703]) 및 iNtRON 맥시마이즈 프리믹스 PCR 키트(인트론 바이오 테크놀로지스: 대한민국 경기도 성남 중원 상대원)를 사용하여 16s rRNA 유전자에 대한 PCR을 수행하였다. 수득된 서열 모두 C. 오토에타노게눔(Y18178, GI7271109) 및 각 C. 륭달리이(CP001666.1; GI:300433347)의 16s rRNA 유전자(rrsA)에 대해 >99.9%의 동일성을 가졌다.
C. 오토에타노게눔 및 C. 륭달리이에서 클로스트리디움 아세톤 경로 유전자를 이용한 CO 및 CO 2 /H 2 로부터의 아세톤 생산:
고무 마개, 및 단독 에너지 및 탄소 공급원으로서 헤드스페이스 중의 30 psi 제철소 가스(뉴질랜드 글렌브룩 뉴질랜드 스틸 부지로부터 수집; 조성: 44% CO, 32% N2, 22% CO2, 2% H2)를 포함하는 1 ℓ 쇼트(Schott) 병 중 250 ml PETC 배지(표 2; 프럭토스 및 효모 추출물 무함유) 중에서 플라스미드 pMTL85147-thlA-ctfAB-adc를 보유하는 형질전환된 C. 오토에타노게눔 DSM23693 및 C. 륭달리이 DSM 13528을 이용하여 성장 실험을 수행하였다. HPLC 및 GC 분석을 이용하여 상기 두 균주 모두에 대해 아세톤 생산을 확인하였다. 쇼트 병 중에서 C. 오토에타노게눔 DSM23693(도 8 및 10) 및 C. 륭달리이 DSM 13528(도 9 및 10), 둘 모두에 대해 48시간 경과 후, 아세톤 농도는 약 0.3 g/ℓ(6.5 mM)로 달성되었다. 이어서, 적절한 조건을 사용하여, 생산된 아세톤을 추가로 이소프로판올로 전환시킬 수 있었다. C. 오토에타노게눔 DSM23693(도 11)을 포함하는 세럼 병 중 50 ml PETC 배지(표 2; 프럭토스 및 효모 추출물 무함유) 중에서 단독 에너지 및 탄소 공급원으로서 30 psi 바이오매스 합성 가스(레인지 퓨얼즈 인코퍼레이티드(Range Fuels Inc.: 미국 콜로라도주 브룸필드; 조성: 29% CO, 45% H2, 13% CH4, 12% CO2, 1% N2) 상에서는 153 mg/ml의 아세톤이 생산된 것이 입증되었다.
C. 오토에타노게눔에서의 클로스트리디움 아세톤 경로 유전자를 이용한 이종 발현:
C. 오토에타노게눔 및 C. 륭달리이에서의 도입된 유전자 thlA, ctfA, ctfB, 및 adc의 성공적인 발현을 통해 아세톤 생산을 유도하는 것을 확인하기 위해 qRT-PCR 실험을 수행하였다. 모든 유전자에 대한 신호를 성공적으로 검출할 수 있었다(도 52 및 53).
플라스미드 pMTL85147을 보유하는 각 C. 오토에타노게눔 및 C. 륭달리이의 50 ml 배양물을 원심분리(6,000 x g, 5 min, 4℃)에 의해 수거하고, 액체 질소 중에서 급속 냉동시키고, RNA 추출시까지 -80℃에서 보관하였다. 퓨어링크™ RNA 미니 키트(PureLink™ RNA Mini Kit)(인비트로겐: 미국 캘리포니아주 칼즈배드)를 사용하여 전체 RNA를 단리시키고, 100 ㎕의 RN아제 무함유 물 중에서 용리시켰다. DN아제 I(로슈 어플라이드 사이언스(Roche Applied Science: 미국 인디애나주 인디애나폴리스)) 처리 후, 이어서 수퍼스크립트 III 역전사효소 키트(Superscript III Reverse Transcriptase Kit)(인비트로겐: 미국 캘리포니아주 칼즈배드)를 사용하여 역전사 단계를 수행하였다. 애질런트 애널라이저 2100(Agilent Bioanalyzer 2100)(애질런트 테크놀로지스(Agilent Technologies: 미국 캘리포니아주 산타클라라)), 큐비트 형광계(Qubit Fluorometer)(인비트로겐: 미국 캘리포니아주 칼즈배드)를 사용하고, 겔 전기영동에 의해 RNA를 체크하였다. 모든 프라이머 쌍에 대하여 비RT 대조군을 수행하였다. 25 ng의 cDNA 주형, 67 nM의 각 프라이머(하기 표 17), 및 1x iQ SYBR 그린 수퍼믹스(Green Supermix)(바이오-래드 라보라토리즈: 미국 캘리포니아주 94547 칼즈배드)를 이용하여 총 반응 부피를 15 ㎕로 하여 MyiQ 싱글 컬러 검출 시스템(MyiQ Single Colour Detection System)(바이오-래드 라보라토리즈: 미국 캘리포니아주 94547 칼즈배드)를 이용함으로써 2중으로 모든 qRT-PCR 반응을 수행하였다. 반응 조건은 95℃에서 3 min 동안, 이어서, 95℃에서 15 s 동안, 55℃에서 15 s 동안 및 72℃에서 30 s 동안으로 40회 사이클을 진행시키는 것이었다. 프라이머 이량체화 또는 증폭 인공물을 검출하기 위해, qPCR(1℃/s로 58℃ 내지 95℃ 38회 사이클) 완료 후 즉시 용융 곡선 분석을 수행하였다. 정규화시키기 위해 각 cDNA 시료에 대하여 두 하우스키핑 유전자(구아닐레이트 키나제 및 포르메이트 테트라하이드로폴레이트 리가제)를 포함시켰다. 상대적인 발현 소프트웨어 툴(REST®: Relative Expression Software Tool) 2008 V2.0.7(38)을 사용하여 상대적인 유전자 발현 유도를 수행하였다. 4 로그 단위에 걸친 cDNA 희석액 시리즈를 사용하여 표준 곡선을 작성하고, 얻은 증폭 효율을 이용하여 mRNA의 농도를 계산하였다.
<표 17>
Figure 112019080913904-pat00008
C. 오토에타노게눔, C. 륭달리이, 및 C. 라그스달레이에 의한 아세톤에서 이소프로판올로의 전환:
알콜 데하이드로게나제의 작용에 의해 아세톤을 이소프로판올로 추가로 전환시킬 수 있다. 그러나, 단지 소수의 미생물만이, 예컨대, C. 베이예린키이 NRRL-B593이 이소프로판올을 생산하는 것으로 기술되고 있으며, 아세톤→이소프로판올 전환 효소는 자연 상태에서는 매우 드물다. 지금까지 단 2개의 2차 알콜 데하이드로게나제만이 확인되었으며, 현재까지는 C. 베이예린키이 NRRL-B593(문헌 [Ismaiel AA, Zhu CX, Colby GD, Chen JS: Purification and characterization of a primary-secondary alcohol dehydrogenase from two strains of Clostridium beijerinckii. J Bacteriol 1993, 175: 5097-5105])(서열 번호 38-39) 및 써모아내로박터 브로키(문헌 [Peretz M and Burstein Y: Amino acid sequence of alcohol dehydrogenase from the thermophilic bacterium Thermoanaerobium brockii. Biochemistry. 1989, 28:6549-6555])(서열 번호 40-41)가 기술된 바 있다.
그러므로, 미생물 - 아세트산 생성 박테리아, 아세톤 및 이소프로판올 생산 클로스트리디아 및 E. 콜라이로 이루어진 콜렉션을 아세톤을 이소프로판올로 전환시킬 수 있는 이의 능력에 대해 테스트하였다(하기 표 11).
<표 11>
Figure 112019080913904-pat00009
종속 영양 탄소 공급원 및 30 psi 제철소 가스를 함유하는 50 ml의 적절한 배지 중에 OD600 nm = 0.1로 모든 배양물을 접종하였다. 아세톤 첨가 전에 배양물을 배가시켰다 (OD600 nm = 0.2). 아세토 첨가 직후 및 다시 성장 종료시에 시료를 채취하고, HPLC 및 GC에 의해 분석하였다(이어서, 광학 밀도를 측정하였다). 결과는 표 11에 요약되어 있다. 블랭크 배지는 음성 대조군으로서 사용된다.
예상대로, 이소프로판올 생산 균주 C. 베이예린키이 NRRL-B593(문헌 [George HA, Johnson JL, Moore WEC, Holdeman LV, Chen JS: Acetone, isopropanol, and butanol production by Clostridium beijerinckii (syn. Clostridium butylicum) and Clostridium aurantibutyricum. Appl Environ Microbiol 45: 1160-1163])은 이의 알콜 데하이드로게나제 작용에 의해 외부에서 첨가된 아세톤을 이소프로판올로 환원시킬 수 있는 능력을 가졌다. 아세톤 생산 C. 아세토부틸리쿰 ATCC-824와 같이, 상기 효소가 없는 C. 베이예린키이, NRCIMB8052인 다른 균주는 아세톤을 이소프로판올로 전환시키지 못했다. 이는 또한 E. 콜라이에 대해서도 상기와 같다.
놀랍게도, 클로스트리디움 rRNA 상동성 I군 내에서 서브클러스터를 형성하는, 3가지 카복시도트로픽 아세트산 생성 박테리아, C. 오토에타노게눔, C. 륭달리이, 및 C. 라그스달레이는 아세톤을 이소프로판올로 전환시킬 수 있는 것 또한 발견되었으며, 반면, 테스트된 다른 모든 아세트산 생성 박테리아는 아세톤을 사용하지 못했다(표 11). 이어서, 상이한 농도를 사용함으로써 C. 오토에타노게눔에 의한 상이한 양의 아세톤에서 이소프로판올로의 전환을 테스트하였다(하기 표 12).
<표 12>
Figure 112019080913904-pat00010
C. 오토에타노게눔 DSM23693을 이용하여 반응기 연구를 수행함으로써 고속으로 진행되는 아세톤에서 이소프로판올로의 효과적인 전환을 입증하였다. 상기 기술된 바와 같이 반응기를 설정하였다. 일단 연속 모드로 바이오매스 및 대사산물 생산이 안정해지고 나면, 아세톤을 바이오반응기 및 공급 배지, 둘 모두에 첨가하였다. 아세톤을 특정 수준으로 반응기 내로 스파이킹한 후, 이를 연속 공급으로 수득하였다. 먼저, 1 g/L 아세톤을 첨가하고, 일단 대사산물 농도가 안정화되고 나면, 농도를 5 g/ℓ, 15 g/ℓ, 및 제2 실험에서는 20 g/ℓ로 증가시켰다. 심지어 20 g/ℓ인 고농도에서도 배양물을 고속으로 모든 아세톤을 이소프로판올로 전환시켰는데, 이로써 확인된 1차:2차 알콜 데하이드로게나제가 고도로 효과적이라는 것이 입증되었다(도 74).
C. 오토에타노게눔, C. 륭달리이, 및 C. 라그스달레이에서의 신규한 알콜 데하이드로게나제 확인:
C. 오토에타노게눔에 의한 아세톤에서 이소프로판올로의 전환이 효소적으로 구동되는지를 확인하기 위해, (Ismaiel) 등(문헌 [Ismaiel AA, Zhu CX, Colby GD, Chen JS: Purification and characterization of a primary-secondary alcohol dehydrogenase from two strains of Clostridium beijerinckii. J Bacteriol 1993, 175: 5097-5105]에 따라 C. 오토에타노게눔 23693, C. 베이예린키이 NRRL-B593, 및 C. 카복시디보란스 DSM15243의 조 추출물을 이용하여 효소 검정법을 수행하였다. 후기 대수증식기 배양물의 초음파 처리 및 리소자임 처리에 의해 조 추출물(100,000 U/ml)을 수득하였다. 세포 파편을 원심분리에 의해 제거하고, 환원제 호환성인 피어스 BCA 단백질 검정법(써모 피셔 사이언티픽 인코퍼레이티드: 미국 매사추세츠주 02454 월섬)을 사용하여 단백질 농도를 측정하였다. 상기 검정용 혼합물(1 ml)은 50 mM 트리스 완충제 (pH 7.5), 1 mM 디티오트레이톨 (DTT), 및 0.2 mM NAD(P)H를 함유하였다. (물에서 10배 희석된 희석액으로부터의) 10 mM의 기질인 아세톤을 첨가함으로써 반응을 개시한 후, 파장 365 nm에서 스펙트라맥스 M2(Spectramax M2)(몰레큘라 디바이시즈 인코퍼레이티드(Molecular Devices, Inc.: 미국 캘리포니아주 94089-1136 서니베일)를 이용하여 분광광도법을 실시하였다. 조 추출물 및 각각의 아세톤 대신 H2O를 음성 대조군으로 사용하였다. C. 베이예린키이 및 C. 오토에타노게눔, 둘 모두의 조 추출물 및 (NADH가 아닌) NADPH의 경우에는 효소 활성을 검출할 수 있었지만, C. 카복시디보란스 DSM15243의 조 추출물 또는 (NADPH 및 NADH 둘 모두가 아닌) H2O의 경우에는 검출할 수 없었다. 이는 C. 오토에타노게눔에 의한 아세톤에서 이소프로판올로의 전환은 효소적으로 구동되고, NADH의 경우, 어떤 활성도 검출되지 않았던 바, 효소는 NADPH 의존성인 것으로 보인다는 것을 입증한다.
서열 분석하고, 주의하여 분석함으로써 3가지 균주 C. 오토에타노게눔, C. 륭달리이, 및 C. 라그스달레이(도 1; 서열 번호 1-4) 모두에서 신규한 알콜 데하이드로게나제 유전자/효소를 확인하였다. 3가지 종 모두의 아미노산 서열은 동일하며, C. 베이예린키이 NRRL-B593(87%) 및 T. 브로키(T. brockii) ATCC 53556(76%)의 1차-2차 알콜 데하이드로게나제와 일부 상동성을 공유하는 것으로 밝혀졌다(하기 표 13). 잘 기술되어 있는 C. 베이예린키이 NRRL-B593의 2차 알콜 데하이드로게나제와 비교하였을 때(문헌 [Ismaiel AA, Zhu CX, Colby GD, Chen JS: Purification and characterization of a primary-secondary alcohol dehydrogenase from two strains of Clostridium beijerinckii. J Bacteriol 1993, 175: 5097-5105]), 총 49개의 아미노산 교환이 있었던 것으로 밝혀졌다. 단백질의 촉매 중심 중 4개의 아미노산이 보존되지만, 촉매 도메인 중의 다른 아미노산은 보존되지 않는다(도 1). 모티프 검색을 통해 신규한 알콜 데하이드로게나제 유전자/효소는 아연 및 NAD(P)H 의존성인 것으로 예측되었다. 신규한 알콜 데하이드로게나제를 코딩하는 각 유전자는 3종의 C. 오토에타노게눔, C. 륭달리이, 및 C. 라그스달레이 내에서 98% 동일한 것으로 밝혀졌고, 단, C. 베이예린키이로부터 유래된 것과는 단지 82% 동일하고, T. 브로키로부터 유래된 것과는 72% 동일한 것으로 밝혀졌다(하기 표 14).
<표 13>
Figure 112019080913904-pat00011
<표 14>
Figure 112019080913904-pat00012
C. 오토에타노게눔으로부터의 신규한 알콜 데하이드로게나제의 발현 연구
유전자 과다발현을 위해 잠재적인 프로모터 영역을 확인함과 동시에, 신규한 알콜 데하이드로게나제를 코딩하는 유전자가 C. 오토에타노게눔을 이용한 일반 발효 동안 활성을 띠는지 여부를 확인하기 위해, 250개 초과의 유전자에 대한 qRT-PCR 연구를 수행하였다.
전 성장 기간(4일) 동안에 걸쳐 상기 기술된 바와 같이, 전형적인 1.5 ℓ 유가식 발효 런로부터 시료를 채취하였다. 원심분리(6,000 x g, 5 min, 4℃)에 의해 시료를 수거하고, 세포 펠릿을 액체 질소 중에서 급속 냉각시키고, 사용시까지 -80℃에서 보관하였다. 세포 펠릿을 얼음 상에서 해동시키고, 100 ㎕의 리소자임 용액 (50,000 U 리소자임, 0.5 ㎕ 10% SDS, 10 mM 트리스-HCl, 0.1 mM EDTA; pH 8) 중에 현탁시켜 RNA를 단리시켰다. 5 min 후, (10 ㎕의 2-머캅토에탄올을 함유하는) 350 ㎕의 용해 완충제를 첨가하였다. 18-21 게이지 바늘을 통해 5회 통과시킴으로써 세포 현탁액을 기계적으로 파괴시켰다. 이어서, RNA를 퓨어링크™ RNA 미니 키트(인비트로겐: 미국 캘리포니아주 92008 칼즈배즈)를 사용하여 단리시키고, 100 ㎕의 RN아제 무함유 물 중에서 용리시켰다. PCR 및 겔 전기영동을 통해 RNA를 체크하고, 분광광도법으로 정량화하고, 필요할 경우, DN아제 I(로슈)로 처리하였다. 이어서 수퍼스크립트 III 역전사효소 키트(인비트로겐: 미국 캘리포니아주 92008 칼즈배드)를 사용하여 역전사 단계를 수행하였다. 25 ng의 cDNA 주형, 67 nM의 각 프라이머(하기 표 15), 및 1x iQ SYBR 그린 수퍼믹스(바이오-래드 라보라토리즈: 미국 캘리포니아주 94547 칼즈배드)를 이용하여 총 반응 부피를 15 ㎕로 하여 MyiQ 싱글 컬러 실시간 PCR 검출 시스템(MyiQ Single Colour Real-Time PCR Detection System)(바이오-래드 라보라토리즈: 미국 캘리포니아주 94547 칼즈배드)에서 RT-PCR 반응을 수행하였다. 구아닐레이트 키나제(GnK) 및 포르메이트 테트라하이드로폴레이트 리가제(FoT4L)를 하우스키핑 유전자로서 사용하였고, 비주형 대조군을 포함하였다. 반응 조건은 95℃에서 3 min 동안, 이어서, 95℃에서 15 s 동안, 55℃에서 15 s 동안 및 72℃에서 30 s 동안으로 40회 사이클을 진행시키는 것이었다. 프라이머 이량체화 또는 다른 증폭 인공물을 검출하기 위해, qRT PCR(1℃/s로 58℃ 내지 95℃ 38회 사이클) 완료 후 즉시 용융 곡선 분석을 수행하였다. 바이오래드 iQ5 2.0 소프트웨어에 의해 계산된 바와 같은 PCR 기준선 감산 곡선 피트 방법에 기초하여 역치 주기(Ct) 값의 형태로 발현 수준에 대한 데이터를 컴퓨팅하였다. 상대적인 발현 소프트웨어 툴(REST®) 2008 V2.0.7을 사용하여 원시 Ct 값을 추가로 분석하였다.
<표 15>
Figure 112019080913904-pat00013
qRT-PCR 연구 결과를 통해 신규한 알콜 데하이드로게나제를 코딩하는 유전자는 전 성장 기간 동안에 걸쳐 상대적으로 일정한 수준으로 발현되고, 성장 종료시에만 오직 중단된다는 것이 밝혀졌다(도 2). 모든 부분의 대사로부터 선택된 200개 초과의 유전자와 비교하였을 때, 알콜 데하이드로게나제 유전자는 상위 50개의 발현된 유전자에 속하였다. 분석된 모든 유전자 중 최고의 유전자 발현은 우드-륭달 오페론 유전자인 것으로 나타났는데, mRNA 수준은 알콜 데하이드로게나제 유전자보다 10배 초과로 더 높았다(도 2). 그러므로, 비록 미생물에 고유한 알콜 데하이드로게나제 유전자의 과다발현인 경우에는, 보조인자가 충분히 이용될 수 있도록 하기 위해서 추가의 유전자 변형이 필요할 수 있기는 하지만, 각 프로모터(서열 번호 22) 영역은 유전자, 예컨대, 아세톤 생합성 효소에 대한 유전자, 및 알콜 데하이드로게나제 유전자를 과다발현시키는 것이 이상적이다. 예를 들어, NADPH 풀을 증가시키기 위한 추가의 유전자, 예컨대, 트랜스하이드로게나제의 (과다) 발현, 경쟁 NADPH 소비 반응 제거, 또는 보조 인자 요구를 NADH로 바꾸는 단백질 조작을 포함할 수 있다. 유전자 과다발현을 위해 확인된 다른 유용한 프로모터 영역으로는 F1F0-ATP아제 오페론의 프로모터 영역(서열 번호 51), Rnf 복합체 오페론(서열 번호 52), 및 피루베이트:페레독신 옥시도리덕타제(서열 번호 53)를 포함한다.
클로스트리디움 아세톤 유전자를 함유하는 발현 플라스미드를 이용한 C. 오토에타노게눔 및 C. 륭달리이에 의한 CO 및 CO 2 /H 2 로부터의 이소프로판올 생산
아세톤 발현 플라스미드 pMTL85147-thlA-ctfAB-adc를 보유하는 C. 오토에타노게눔 DSM23693 및 C. 륭달리이 DSM 13528 재조합 균주의 250 ml 쇼트 병 배양물은 아세톤을 생산하는 것으로 나타났지만, 이소프로판올은 검출되지 않았다(도 8 + 9). 이는 성장 종료시 환원력의 부족에 기인하거나, CO가 헤드스페이스로부터 고갈되고, 유가식 또는 연속 발효 공정에서와 같이 일정하게 공급되지 않는 쇼트 병 중에서의 주어진 정적 조건에 기인하는 것일 수 있다. 환원 등가물, 예컨대, NAD(P)H 또는 페레독신은 CO로부터 발생되지만, 에탄올 생산을 위해 또한 소비되기도 하는데, 이는 이미 대수증식기 및 조기의 제자리 성장 동안 일어나는 것이다. 이 시점에서 이소프로판올 생산을 위한 전구체로서 요구되는, 생산된 아세톤의 농도는 여전히 상대적으로 낮다.
그러므로, 48 h 동안의 성장 후, 두 배양물 모두를 30 psi의 새 제철소 가스로 다시 가스처리하였다. 바이오매스는 더 이상 증가하지 않은 반면, 생성된 아세토 중 일부는 24시간 이내에 이소프로판올로 전환되었다(하기 표 16).
<표 16>
Figure 112019080913904-pat00014
CO를 일정하게 공급하는 발효 시스템에는 CO 또는 CO/H2로부터 이소프로판올을 연속적으로 생산하는데 충분한 환원력이 존재하며, 아세톤 발현 플라스미드 pMTL85147-thlA-ctfAB-adc를 보유하는 C. 오토에타노게눔 DSM23693을 이용하여 각 발효 런에서 아세톤 및 이소프로탄올, 둘 모두가 생산되었다.
신규한 알콜 데하이드로게나제 클로닝
신규한 알콜 데하이드로게나제를 아세톤 발현 플라스미드로 클로닝하고, 유전자 과다발현을 위해 우드-륭달 프로모터의 제어하에 놓이게 하고, E. 콜라이에서 기능성에 대해 테스트하였다.
올리고뉴클레오티드 SecAdh-SalI-F(서열 번호 54: TATTTGTCGACTTAGGAGGTTCTATTATGAAAGG) 및 SecAdh-XhoI-R(서열 번호 55: AAAACTCGAGACATTTTTTTAATGCGACAG)을 사용하여 단리된 C. 오토에타노게눔 DSM10061 염색체 DNA로부터 알콜 데하이드로게나제를 증폭시켰다. SalIXhoI, 및 E. 콜라이 XL-1 블루 MRF' Kan을 사용하여 1,129 bp PCR 단편을 플라스미드 pMTL85147-thlA-ctfAB-adc로 클로닝하였다. 표 9에 제시된 올리고뉴클레오티드를 사용하여 생성된 플라스미드 pMTL85147-thlA-ctfA-ctfB-adc-adh(서열 번호 48; 도 43)를 완전하게 서열 분석하고, 이소프로판올 생합성 유전자 및 프로모터 영역에는 돌연변이가 없음을 확인하였다(도 41).
E. 콜라이에서 C. 오토에타노게눔으로부터의 신규한 알콜 데하이드로게나제를 이용한 이소프로판올 생산
C. 오토에타노게눔으로부터의 신규한 알콜 데하이드로게나제의 기능성에 대해 추가로 테스트하기 위해, 클로람페니콜을 포함하는 100 ml SD-8 최소 배지 중 (플라스미드 pMTL 85147-thlA-ctfA-ctfB-adc를 보유하는) 아세톤 생합성 유전자만을 발현, 및 (플라스미드 pMTL85147-thlA-ctfA-ctfB-adc-adh를 보유하는) 아세톤 생합성 유전자 + 신규한 알콜 데하이드로게나제를 발현하는 E. 콜라이 XL-1 블루 MRF' Kan을 사용하여 성장 실험을 수행하였다(도 42).
아세톤 플라스미드를 보유하는 균주의 경우에는 어떤 이소프로판올도 검출되지 않은 반면, C. 오토에타노게눔으로부터의 신규한 알콜 데하이드로게나제를 추가로 발현하는 균주의 경우, 32.7 mg/L 이소프로판올의 평균 최대치가 측정되었다.
C. 오토에타노게눔에서 아세톤 또는 이소프로판올에 대한 신규한 활성을 부여하는 락토코커스 락티스 및 사카로마이세스 세레비지아에로부터의 유전자 확인
클로스트리디움 아세톤 및 이소프로판올 경로 이외에도, C. 오토에타노게눔에서 아세톤 및 이소프로판올 생산에 대한 활성을 부여하는 2가지 효소, 락토코커스 락티스로부터의 알파-케토이소발레레이트 데카복실라제(KivD) 및 사카로마이세스 세레비지아에로부터의 알콜 데하이드로게나제(Adh2)(표 18)가 확인되었다. 상기 두 효소가 아세톤 또는 이소프로판올 생산에 관여한다거나, 또는 클로스트리디움 아세톤 및 이소프로판올 경로에서 임의의 전구체에 대해 촉매 작용을 한다고 보고된 바는 없었다. E. 콜라이(문헌 [Atsumi et al., 2008. Non-fermentative pathways for synthesis of branched-chain higher alcohols as biofuels. Nature, 451: 86-90]) 또는 다른 유기체, 예컨대, 코리네박테리움 글루타미쿰(Corynebacterium glutamicum)(문헌 [Blombach et al., 2011. Corynebacterium glutamicum tailored for efficient Isobutanol production. Appl. Environ. Microbiol. 77: 3300-10]) 또는 클로스트리디움 셀룰로리티쿰(Clostridium cellulolyticum)(문헌 [Higashide W., et al. 2011. Metabolic Engineering of Clostridium cellulolyticum for Production of Isobutanol from Cellulose. Appl. Environ. Microbiol. 77: 2727-33])에서 상기 단백질의 이종성 발현을 통해 아미노산 전구체로부터 분지쇄 고급 알콜, 예컨대, 이소부탄올, 1-부탄올, 2-메틸-1-부탄올, 3-메틸-1-부탄올 및 2-페닐에탄올이 생산되었지만, 아세톤 및 이소부탄올은 보고된 바 없었다. 그러나, 놀랍게도 C. 오토에타노게눔에서 단독으로, 또는 락토코커스 락티스로부터의 코돈 최적화된 알파-케토이소발레레이트 데카복실라제(KivD)와 사카로마이세스 세레비지아에로부터의 알콜 데하이드로게나제(Adh2)와 조합된 락토코커스 락티스로부터의 코돈 최적화된 알파-케토이소발레레이트 데카복실라제(KivD)의 발현으로 아세톤 및 이소프로판올이 생산되었다.
<표 18>
Figure 112019080913904-pat00015
락토코커스 락티스로부터의 알파-케토이소발레레이트 데카복실라제(KivD) 및 사카로마이세스 세레비지아에로부터의 알콜 데하이드로게나제(Adh2)를 포함하는 발현 플라스미드의 구성
L. 락티스로부터의 알파-케토이소발레레이트 데카복실라제(데카복실라제; KivD), 및 S. 세레비지아에로부터의 알콜 데하이드로게나제(Adh2)(표 18)를 ATG:바이오신세틱스 게엠베하(독일 메르자우센)에 의해 코돈 최적화하고, 추가의 서브클로닝을 위해 NdeIKpnI 제한 부위 측면에 배치되었다. 표적 유전자의 발현을 위해 C. 오토에타노게눔의 포스포트랜스아세틸라제/아세테이트 키나제 오페론 프로모터를 사용하였다. 사용된 DNA 서열 모두 하기 표 19에 제시되어 있다.
락토코커스 락티스로부터의 알파-케토이소발레레이트 데카복실라제(KivD) 및 사카로마이세스 세레비지아에로부터의 알콜 데하이드로게나제(Adh2)를 포함하는 발현 플라스미드에 사용된 서열
설명 공급원 서열 번호
알파-케토이소발레레이트 데카복실라제(KivD) 및
알콜 데하이드로게나제(Adh2)
코돈 최적화 76-78
포스포트랜스아세틸라제/아세테이트 키나제 오페론 프로모터 영역 C. 오토에타노게눔 DSM10061 79
프라이머 Ppta-ack-NotI-F(서열 번호 80: GAGCGGCCGCAATATGATATTTATGTCC) 및 Ppta-ack-NdeI-R(서열 번호 81: TTCCATATGTTTCATGTTCATTTCCTCC)을 사용하여 포스포트랜스아세틸라제-아세테이트 키나제 오페론의 프로모터 영역(Ppta-ack)을 증폭시키고, NotINdeI 제한 부위 및 균주 XL1-블루 MRF' Kan를 사용하여 E. 콜라이-클로스트리디움 셔틀 벡터 pMTL 85141(FJ797651.1; Nigel Minton, 영국 노팅엄 대학)로 클로닝하였다(문헌 [Heap JT, Pennington OJ, Cartman ST, Minton NP. A modular system for Clostridium shuttle plasmids. J Microbiol Methods. 2009, 78: 79-85]]). 이어서, FseIPmeI 제한 부위 및 균주 XL1-블루 MRF' Kan을 사용하여 생성된 플라스미드 pMTL.85145 중의 항생제 내성 유전자를 pMTL 82254(FJ797646.1; Nigel Minton, 영국 노팅엄 대학)로부터의 에리트로마이신 내성 유전자로 치환하였다(문헌 [Heap JT, Pennington OJ, Cartman ST, Minton NP. A modular system for Clostridium shuttle plasmids. J Microbiol Methods. 2009, 78: 79-85]).
생성된 플라스미드 pMTL.85245(서열 번호 80), 및 데카복실라제 및 알콜 데하이드로게나제(Adh2) 유전자 클러스터의 2,746 bp 코돈 최적화된 생성물 둘 모두를 NdeIKpnI로 절단하였다. 결찰물을 E. 콜라이 XL1-블루 MRF' Kan으로 형질전환시켜 플라스미드 pMTL.85245-kivd-adh2(서열 번호 83; 도 63)를 수득하였다. 하기 표 20에 제시된 올리고뉴클레오티드를 사용하여 생성된 플라스미드 pMTL85245-kivd-adh의 삽입체를 완전하게 서열 분석하고, 그 결과를 통해 유전자 및 프로모터 영역에는 돌연변이가 없음을 확인하였다.
프라이머 쌍 M13 역방향(서열 번호 57: CAGGAAACAGCTATGAC) 및 Adh_seqR1(서열 번호 85; 표 16)을 사용하여 kivD 유전자를 단독으로 증폭시켰다. NdeIEcoRI 제한 부위 및 균주 E. 콜라이 XL1-블루 MRF' Kan을 사용하여 KivD의 2,635 bp PCR 단편을 E. 콜라이-클로스트리디움 셔틀 벡터 pMTL 85245로 클로닝하여 플라스미드 pMTL85245-kivd(서열 번호 84; 도 64)를 수득하였다. 표 20에 제시된 올리고뉴클레오티드를 사용하여 생성된 플라스미드 pMTL85245-kivd의 삽입체를 완전하게 서열 분석하고, 그 결과를 통해 아세톤 생합성 유전자에는 돌연변이가 없음을 확인하였다.
<표 20>
Figure 112019080913904-pat00016
아세톤 및 이소프로판올 생산을 위한, C. 오토에타노게눔에서의 락토코커스 락티스로부터의 알파-케토이소발레레이트 데카복실라제(KivD) 및 사카로마이세스 세레비지아에로부터의 알콜 데하이드로게나제(Adh2)에 대한 코돈 최적화된 유전자의 발현
구성된 발현 플라스미드 pMTL85245-kivd-adh2 및 pMTL85245-kivd를 E. 콜라이로 형질전환시키고, C. 오토에타노게눔 DSM23693에서의 형질전환을 위해 제조하였는데, 이는 상기 기술된 바와 같이 수행하였다. 상기 두 플라스미드를 보유하는 E. 콜라이에서는 아세톤도 이소프로판올도 검출되지 않았지만(그러나, 문헌에 기술되어 있는 바와 같이, 고급 분지쇄 알콜, 예컨대, 이소프로판은 예외), C. 오토에타노게눔의 경우, 아세톤 및 이소프로판올, 둘 모두가 검출되었다. 세럼 병 실험에서, 두 발현 플라스미드 모두의 CO 함유 제철소 가스로부터의 이소프로판올 최고 농도는 0.050-0.064 g/L였다(도 65 및 66).
클로스트리디움 경로 유전자, 및 락토코커스 락티스로부터의 알파-케토이소발레레이트 데카복실라제(KivD) 및 사카로마이세스 세레비지아에로부터의 알콜 데하이드로게나제(Adh2)의 조합을 이용한 아세톤 및 이소프로판올 생산
임의의 특정 이론으로 제한하고자 하지 않으면서, 본 발명자들은 락토코커스 락티스로부터의 코돈 최적화된 알파-케토산 데카복실라제 Kivd가 클로스트리디움 아세토아세테이트 데카복실라제와 같이 아세토아세테이트에서 아세톤으로 전환시키는 활성을 가지는 반면, 사카로마이세스 세레비지아에로부터의 코돈 최적화된 알콜 데하이드로게나제 Adh2는 확인된 신규한 1차:2차 알콜 데하이드로게나제 또는 클로스트리디움 베이예린키이로부터의 1차:2차 알콜 데하이드로게나제와 같이 아세톤에서 이소프로판올로 전환시키는 활성을 가진다고 믿었다. 이러한 가설을 테스트하기 위해, 클로스트리디움 아세톤/이소프로판올 경로 유전자, 및 락토코커스 락티스로부터의 알파-케토산 데카복실라제 Kivd 및 사카로마이세스 세레비지아에로부터의 알콜 데하이드로게나제 Adh2의 여러 조합물을 생성하고, E. 콜라이 및 C. 오토에타노게눔 내에서 테스트하고, 아세톤 및 이소프로판올 생산에 대해 입증하였다.
상이한 유전자 조합물을 가지는 발현 플라스미드의 구성
구성된 발현 플라스미드 pMTL85147-thlA-ctfA-ctfB-adc, pMTL85245-kivd-adh2 및 pMTL85245-kivd에 기초하여 새로운 조합물을 구성하였다.
올리고뉴클레오티드 P-thl-ctfAB_F2(서열 번호 93: ATCTTCTGCAGGGCCGCAGATAGTCATAATAGTTCCAG) 및 P-thl-ctfAB_R2(서열 번호 94: AGG GTGCGGCCGCGATTCATATATCCATAATCTTTAAGTTATC)를 사용하여 플라스미드 pMTL85147-thlA-ctfA-ctfB-adc로부터 3,122bp PWL-thlA-ctfAB 단편을 증폭시켰다. PstINotI 제한 부위 및 균주 E. 콜라이 XL1-블루 MRF' Kan을 사용하여 증폭된 단편을 플라스미드 pMTL 85245-kivd로 클로닝하여 플라스미드 pMTL85245-PWL-thlA-ctfAB-kivd(서열 번호 95; 도 67)를 수득하였다. 표 9 및 20에 제시된 올리고뉴클레오티드를 사용하여 생성된 플라스미드 pMTL85245-PWL-thlA-ctfAB-kivd의 삽입체를 완전하게 서열 분석하고, 플라스미드에는 돌연변이가 없음을 확인하였다. 프라이머 쌍 adh_F(서열 번호 96: ACGTTGGATCCAGGAGGAACAAAGATGAGTATACC) 및 P-kivd-adh_R(서열 번호 97: AGCGTCCATGGCCTTATTTACTTGTATCTACAACATATC)을 사용하여 플라스미드 pMTL85245-kivd-adh2로부터 Adh2 유전자를 증폭시켰다. BamHINcoI 제한 부위 및 균주 E. 콜라이 XL1-블루 MRF' Kan을 사용하여 1,084 bp PCR 단편을 플라스미드 pMTL85147-thlA-ctfAB-adc로 클로닝하여 플라스미드 pMTL85147-thlA-ctfAB-adc-adh2(서열 번호 98; 도 68)를 수득하였다. 생성된 플라스미드 pMTL85147-thlA-ctfAB-adc-adh2 및 pMTL83151(FJ797647.1; Nigel Minton, 영국 노팅엄 대학)(문헌 [Heap JT, Pennington OJ, Cartman ST, Minton NP. A modular system for Clostridium shuttle plasmids. J Microbiol Methods. 2009, 78: 79-85])로부터의 repL 유전자의 1,625 bp 단편 둘 모두를 FseIAscI로 절단하였다. 결찰시켜 플라스미드 pMTL83147-thlA-ctfAB-adc-adh2를 수득하였다. 표 9 및 20에 제시된 올리고뉴클레오티드를 사용하여 생성된 플라스미드 pMTL83147-thlA-ctfAB-adc-adh2의 삽입체를 완전하게 서열 분석하고, 그 결과를 통해 단편에는 돌연변이가 없음을 확인하였다.
올리고뉴클레오티드 P-kivd-adh_F(서열 번호 99: ATATTGGATCCACAGCTATGACCGCGGCCGCAATATG) 및 P-kivd-adh_R(서열 번호 100: AGCGTCCATGGCCTTATTTACTTGTATCTACAACATATC)을 사용하여 플라스미드 pMTL85245-kivd-adh2로부터의 Ppta-ack-kivd-adh2의 3,266 bp PCR 단편을 증폭시킨 후, BamHINcoI 제한 부위 및 균주 E. 콜라이 XL1-블루 MRF' Kan을 사용하여 플라스미드 pMTL85147-thlA-ctfAB-adc로 클로닝하여 플라스미드 pMTL83147-thlA-ctfAB-adc-Ppta.ack-kivd-adh2(서열 번호 101; 도 69)를 수득하였다. 생성된 플라스미드 pMTL83147-thlA-ctfAB-adc-Ppta.ack-kivd-adh2 및 pMTL83151(FJ797647.1; Nigel Minton, 영국 노팅엄 대학)[Heap JT, Pennington OJ, Cartman ST, Minton NP. A modular system for Clostridium shuttle plasmids. J Microbiol Methods. 2009, 78: 79-85]로부터의 1,625 bp 단편 둘 모두를 FseIAscI로 절단하였다. 결찰시켜 플라스미드 pMTL83147-thlA-ctfAB-adc-Ppta-ack-kivd-adh2를 수득하였다. 표 9에 제시된 올리고뉴클레오티드를 사용하여 생성된 플라스미드 pMTL83147-thlA-ctfAB-adc-Ppta.ack-kivd-adh2의 삽입체를 완전하게 서열 분석하고, 그 결과를 통해 플라스미드에는 돌연변이가 없음을 확인하였다.
상이한 유전자 조합물을 사용한, C. 오토에타노게눔에서의 아세톤 및 이소프로판올 생산
상기 기술된 바와 같이, C. 오토에타노게눔, C. 라그스달레이 및 C. 륭달리이로부터의 메틸트랜스퍼라제 유전자로부터 디자인되고, C. 오토에타노게눔 DSM23693으로 형질전환되 합성된 하이브리드 II형 메틸트랜스퍼라제 유전자(서열 번호 35)를 사용하여 새로 구성된 발현 플라스미드 pMTL85147-thlA-ctfA-ctfB-adc, pMTL83147-thlA-ctfAB-adc-adh2 및 pMTL83147-thlA-ctfAB-adc-Ppta-ack-kivd-adh2의 메틸화를 생체내 E. 콜라이에서 수행하였다.
단독 기질로서 당(E. 콜라이) 또는 CO 함유 제철소 가스(C. 오토에타노게눔)를 이용하는 세러 병 실험을 사용하여 E. 콜라이 및 C. 오토에타노게눔 DSM23693에서 모든 플라스미드 구성물을 테스트하였다. 테스트된 모든 조합물의 경우, 아세톤 및 이소프로판올 생산은 C. 오토에타노게눔에서 이종 발현되었을 때, 측정된 반면, 소수 조합물의 경우, E. 콜라이에서 아세톤 생산만이 일어났고, 이소프로판올 생산을 위해서는 알콜 데하이드로게나제 유전자가 필요하였다(하기 표 21). 제시된 결과는, E. 콜라이 뿐만 아니라, C. 오토에타노게눔 둘 모두에서 락토코커스 락티스로부터의 코돈 최적화된 알파-케토산 데카복실라제 Kivd가 클로스트리디움 아세토아세테이트 데카복실라제를 치환할 수 있고, 아세토아세테이트에서 아세톤으로의 전환을 촉매화시킬 수 있다는 것을 나타낸다(도 4). C. 오토에타노게눔에서, 아세톤 및 이소프로판올 생산은 심지어 유일의 이종성 유전자로서 데카복실라제를 발현할 때에만 일어났는데, 이는 CoA-트랜스퍼라제 활성을 나타내는 것이다. 도 4는 제안된 경로를 도시한 것이고, 표 21의 CO로부터의 아세톤 및 이소프로판올 형성 및 도 73은 E. 콜라이 및 C. 오토에타노게눔에서 테스트된 L. 락티스로부터의 알파-케토산 데카복실라제 Kivd 및 S. 세레비지아에로부터의 알콜 데하이드로게나제 Adh2에 대한 코돈 최적화된 유전자, 및 클로스트리디움 경로 유전자의 조합물에 대해 개략적으로 설명한 것이다.
C. 오토에타노게눔 DSM23693, 및 플라스미드 pMTL85245-PWL-thlA-ctfAB-kivd, pMTL83147-thlA-ctfAB-adc-adh2 및 pMTL83147-thlA-ctfAB-adc-Ppta-ack-kivd-adh2를 이용한 CO 함유 제철소 가스로부터의 아세톤 및 이소프로판올 생산은 각각 도 70, 71 및 72에 제시되어 있다.
<표 21>
Figure 112019080913904-pat00017
아세토겐에서 아세톤 및 이소프로판올에 대한 내성 및 아세테이트의 해독 작용
여러 대사산물, 예컨대, 알콜(에탄올 및 부탄올) 또는 산(아세트산 및 부티르산)은 고농도에서는 박테리아에 독성을 띠고, 따라서, 이의 생물공학적 생산을 제한하는 것으로 알려져 있다(문헌 [Alsaker KV, Parades C, Papoutsakis ET: Metabolite stress and tolerance in the production of biofuels and chemicals - systems analysis of butanol, butyrate, and Acetate Stresses in the Anaerobe Clostridium acetobutylicum. Biotechnoi Bioeng, 2009, 105: 1131-1147]). 아세톤 및 이소프로판올이 배양물에 대해 독성 효과를 가지는지 여부를 알아보기 위해, 상이한 농도의 아세톤(도 12) 및 이소프로판올(도 13)을 클로스트리디움 오토에타노게눔 DSM23693 성장 배양물에 첨가하여 세럼 병 중 50 ml PETC 배지(표 2) 중에서 성장 실험을 수행하였다. 5% 아세톤 또는 이소프로판올만큼 높은 농도로의 존재하에서 세포 성장이 가시화되었다(단, 성장 속도는 단지 약간 억제되었다).
한편, 고농도의 유리 또는 비해리형 아세트산은 막 구배에 대한 유해 효과로 인해 가장 혐기성인 박테리아(아세트산 생성 박테리아 포함)에 대해 해로운 것으로 알려져 있다(문헌 [Warnecke T, Gill RT: Organic acid toxicity, tolerance, and production in Escherichia coli biorefining applications. Microb Cell Fact, 2005, 4: 25]; [Koepke M, Diirre P: Biochemical production of biobutanol, in Luque R, Campelo J, Clark JH (Eds.): Handbook of biofuel production - Processes and technologies, Woodhead Publishing, Camebridge, 2010: 221-257]). 그러나, 아세트산 생성 박테리아는 기질 수준의 인산화로부터 ATP를 획득하기 위해서는 아세트산을 생산할 필요가 있고(문헌 [Drake HL, Kuesel K, Matthies C: Acetogenic Prokaryotes. In Dworkin M, Falkow S, Rosenberg E, Schleifer KH, Stackebrandt E (eds.): The Prokaryotes, 3rd Edition, Volume 2, Springer, New York, 2006: 354-420]), 따라서, 공지된 아세트산 생성 종들은 모두 아세트산을 생산한다(문헌 [Drake HL, Kuesel K, Matthies C: Acetogenic Prokaryotes. In Dworkin M, Falkow S, Rosenberg E, Schleifer KH, Stackebrandt E (eds.): The Prokaryotes, 3rd Edition, Volume 2, Springer, New York, 2006: 354-420]). 알데히드 페레독신 옥시도리덕타제(AOR)를 통해 이루어지는 아세트산에서 다른 생성물, 예컨대, 에탄올로의 전환, 또는 포스포트랜스아세틸라제/아세테이트 키나제(Pta/Ack) 또는 AMP-의존성 아세틸-CoA 신타제(Acs)를 통해 다시 아세틸-CoA로의 전환은은 바람직하지 못한데, 그 이유는 환원된 페레독신 또는 ATP 형태의 에너지를 필요로 하기 때문이다(문헌 [Wolfe AJ: The acetate switch. Microbiol Mol Biol Rev, 2005, 69: 12-50]). 본 발명은 에너지를 요구하지 않는, 신규한 모드의 아세트산 생성 박테리아에서의 아세트산 해독 작용을 제시한다. 아세트산은 아세틸-코엔자임 A 아세틸트랜스퍼라제, 아세토아세틸-CoA:아세테이트/부티레이트 코엔자임 A 트랜스퍼라제 A, 아세토아세틸-CoA:아세테이트/부티레이트 코엔자임 A 트랜스퍼라제 B로 이루어진 아세토아세틸-CoA:아세테이트/부티레이트 코엔자임 A 트랜스퍼라제 시스템로 통해 아세틸-CoA로 다시 리사이클링할 수 있다. 이러한 반응은 아세토아세틸-CoA에서 아세토아세테이트로의 전환을 구동시킨 후, 이어서 아세톤으로 탈카르복실화시킨 후, 이소프로판올로 환원시킬 수 있다(도 4).
본 발명은 당업자가 과도한 실험 없이 본 발명을 실시할 수 있도록 특정 바람직한 실시양태들과 관련하여 본원에 기술되었다. 그러나, 당업계의 숙련가는 본 발명의 범주를 벗어나지 않으면서 많은 구성 성분들 및 파라미터들이 일정한 정도까지 변경되거나 변형될 수 있거나, 공지된 등가물로 치환될 수 있다는 것을 용이하게 인식할 것이다. 이러한 변형 및 등가물은 마치 개별적으로 기술된 것처럼 본원에 포함된다는 것을 이해하여야 한다. 표제, 제목 등은 당업자에 의한 본 명세서의 이해를 향상시키기 위해 제공된 것이며, 본 발명의 범주를 한정하기 위한 것으로 판독되지 않아야 한다.
상기 및 하기에서 인용된 모든 출원들, 특허들 및 공개문헌들의 전체 개시내용은 존재하는 경우, 본원에 참고로 포함된다. 그러나, 본 명세서에서 임의의 출원, 특허 및 공개문헌의 언급은 이들이 전세계 임의의 국가에서 유효한 종래기술을 구성하거나 통상의 일반적인 지식의 일부를 형성한다는 것을 인정하거나 임의의 형태로 암시하는 것이 아니고, 이러한 인정 또는 암시로서 해석되어서는 안 된다.
문맥상 달리 요구하지 않는 한, 본 명세서 및 하기 임의의 청구항 전체에서 "포함한다," "포함하는"이라는 단어 등은 배타적인 의미와 반대로 포괄적인 의미, 즉, "~를 포함하나, 이에 한정되지 않는"의 의미로 간주되어야 한다.
SEQUENCE LISTING <110> Lanzatech New Zealand Limited Koepke, Michael Chen, Wendy Liew, Fungmin Simpson, Sean <120> Recombinant microorganisms and methods of use thereof <130> 509018PCTPR <150> US 61/446,832 <151> 2011-02-25 <160> 101 <170> PatentIn version 3.5 <210> 1 <211> 351 <212> PRT <213> clostridium autoethanogenum <400> 1 Met Lys Gly Phe Ala Met Leu Gly Ile Asn Lys Leu Gly Trp Ile Glu 1 5 10 15 Lys Lys Asn Pro Val Pro Gly Pro Tyr Asp Ala Ile Val His Pro Leu 20 25 30 Ala Val Ser Pro Cys Thr Ser Asp Ile His Thr Val Phe Glu Gly Ala 35 40 45 Leu Gly Asn Arg Glu Asn Met Ile Leu Gly His Glu Ala Val Gly Glu 50 55 60 Ile Ala Glu Val Gly Ser Glu Val Lys Asp Phe Lys Val Gly Asp Arg 65 70 75 80 Val Ile Val Pro Cys Thr Thr Pro Asp Trp Arg Ser Leu Glu Val Gln 85 90 95 Ala Gly Phe Gln Gln His Ser Asn Gly Met Leu Ala Gly Trp Lys Phe 100 105 110 Ser Asn Phe Lys Asp Gly Val Phe Ala Asp Tyr Phe His Val Asn Asp 115 120 125 Ala Asp Met Asn Leu Ala Ile Leu Pro Asp Glu Ile Pro Leu Glu Ser 130 135 140 Ala Val Met Met Thr Asp Met Met Thr Thr Gly Phe His Gly Ala Glu 145 150 155 160 Leu Ala Asp Ile Lys Met Gly Ser Ser Val Val Val Ile Gly Ile Gly 165 170 175 Ala Val Gly Leu Met Gly Ile Ala Gly Ser Lys Leu Arg Gly Ala Gly 180 185 190 Arg Ile Ile Gly Val Gly Ser Arg Pro Val Cys Val Glu Thr Ala Lys 195 200 205 Phe Tyr Gly Ala Thr Asp Ile Val Asn Tyr Lys Asn Gly Asp Ile Val 210 215 220 Glu Gln Ile Met Asp Leu Thr His Gly Lys Gly Val Asp Arg Val Ile 225 230 235 240 Met Ala Gly Gly Gly Ala Glu Thr Leu Ala Gln Ala Val Thr Met Val 245 250 255 Lys Pro Gly Gly Val Ile Ser Asn Ile Asn Tyr His Gly Ser Gly Asp 260 265 270 Thr Leu Pro Ile Pro Arg Val Gln Trp Gly Cys Gly Met Ala His Lys 275 280 285 Thr Ile Arg Gly Gly Leu Cys Pro Gly Gly Arg Leu Arg Met Glu Met 290 295 300 Leu Arg Asp Leu Val Leu Tyr Lys Arg Val Asp Leu Ser Lys Leu Val 305 310 315 320 Thr His Val Phe Asp Gly Ala Glu Asn Ile Glu Lys Ala Leu Leu Leu 325 330 335 Met Lys Asn Lys Pro Lys Asp Leu Ile Lys Ser Val Val Thr Phe 340 345 350 <210> 2 <211> 1056 <212> DNA <213> clostridium autoethanogenum <400> 2 atgaaaggtt ttgcaatgtt aggtattaac aaattaggat ggattgaaaa gaaaaaccca 60 gtgccaggtc cttatgatgc gattgtacat cctctagctg tatccccatg tacatcagat 120 atacatacgg tttttgaagg agcacttggt aatagggaaa atatgatttt aggccatgaa 180 gctgtaggtg aaatagccga agttggcagc gaagttaaag attttaaagt tggcgataga 240 gttatcgtac catgcacaac acctgactgg agatctttag aagtccaagc tggttttcag 300 cagcattcaa acggtatgct tgcaggatgg aagttttcca attttaaaga cggtgtattt 360 gcagattact ttcatgtaaa cgatgcagat atgaatcttg ccatactccc agatgaaata 420 cctttagaaa gtgcagttat gatgacagac atgatgacta ctggttttca tggagcagaa 480 cttgcagaca taaaaatggg ctccagcgtt gtagtaattg gtataggagc tgttggatta 540 atgggaatag ccggttccaa acttcgagga gcaggcagaa ttatcggtgt tggaagcaga 600 cctgtttgtg ttgaaacagc taaattttat ggagcaactg atattgtaaa ttataaaaat 660 ggtgatatag ttgaacaaat catggactta actcatggta aaggtgtaga ccgtgtaatc 720 atggcaggcg gtggtgctga aacactagca caagcagtaa ctatggttaa acctggcggc 780 gtaatttcta acatcaacta ccatggaagc ggtgatactt taccaatacc tcgtgttcaa 840 tggggctgcg gcatggctca caaaactata agaggaggat tatgccccgg cggacgtctt 900 agaatggaaa tgctaagaga tcttgttcta tataaacgtg ttgatttgag taaacttgtt 960 actcatgtat ttgatggtgc agaaaatatt gaaaaggccc ttttgcttat gaaaaataag 1020 ccaaaagatt taattaaatc agtagttaca ttctaa 1056 <210> 3 <211> 1056 <212> DNA <213> clostridium ljundahlii <400> 3 atgaaaggtt ttgcaatgtt aggtattaac aaattaggat ggattgaaaa gaaaaaccca 60 gtgccaggtc cttatgatgc gattgtacat cctctagctg tatccccatg tacatcagat 120 atacatacgg tttttgaagg agcacttggt aatagggaaa atatgatttt aggccatgaa 180 gctgtaggtg aaatagccga agttggcagc gaagttaaag attttaaagt tggcgataga 240 gttatcgtac catgcacaac acctgactgg agatctttag aagtccaagc tggttttcag 300 cagcattcaa acggtatgct tgcaggatgg aagttttcca attttaaaga tggtgtattt 360 gcagattact ttcatgtaaa cgatgcagat atgaatcttg ccatactccc agatgaaata 420 cctttagaaa gtgcagttat gatgacagac atgatgacta ctggttttca tggagcagaa 480 cttgcagaca taaaaatggg ctccagcgtt gtagtaattg gtataggagc tgttggatta 540 atgggaatag ccggttccaa acttcgagga gcaggcagaa ttatcggtgt tggaagcaga 600 cctgtttgtg ttgaaacagc taaattttat ggagcaactg atattgtaaa ttataaaaat 660 ggtgatatag ttgaacaaat catggactta actcatggta aaggtgtaga ccgtgtaatc 720 atggcaggcg gtggtgctga aacactagca caagcagtaa ctatggttaa acctggcggc 780 gtaatttcta acatcaacta ccatggaagc ggtgatactt taccaatacc tcgtgttcaa 840 tggggctgcg gcatggctca caaaactata agaggaggat tatgccccgg cggacgtctt 900 agaatggaaa tgctaagaga tcttgttcta tataaacgtg ttgatttgag taaacttgtt 960 actcatgtat ttgatggtgc agaaaatatt gaaaaggccc ttttgcttat gaaaaataag 1020 ccaaaagatt taattaaatc agtagttaca ttctaa 1056 <210> 4 <211> 1056 <212> DNA <213> clostridium ragsdalei <400> 4 atgaaaggtt ttgcaatgtt aggtattaac aagttaggat ggattgaaaa gaaaaaccca 60 gtaccaggtc cttatgatgc gattgtacat cctctagctg tatccccatg tacatcagat 120 atacatacgg tttttgaagg agcacttggt aatagggaaa atatgatttt aggtcacgaa 180 gctgtaggtg aaatagctga agttggcagt gaagttaaag attttaaagt tggcgataga 240 gttatcgtac catgcacaac acctgactgg agatccttag aagtccaagc tggttttcaa 300 cagcattcaa acggtatgct tgcaggatgg aagttttcca attttaaaga cggtgtattt 360 gcagattact ttcatgtaaa cgatgcagat atgaatcttg caatacttcc agatgaaata 420 cctttagaaa gtgcagttat gatgacagac atgatgacta ctggttttca tggggcagaa 480 cttgctgaca taaaaatggg ttccagtgtt gtcgtaattg gtataggagc tgttggatta 540 atgggaatag ccggttccaa acttcgagga gcaggtagaa ttatcggtgt tggaagcaga 600 cccgtttgtg ttgaaacagc taaattttat ggagcaactg atattgtaaa ttataaaaat 660 ggtgatatag ttgaacaaat aatggactta actcatggta aaggtgtaga ccgtgtaatc 720 atggcaggcg gtggtgctga aacactagca caagcagtaa ctatggttaa acctggcggc 780 gtaatttcta acatcaacta ccatggaagc ggtgatactt tgccaatacc tcgtgttcaa 840 tggggctgcg gcatggctca caaaactata agaggagggt tatgtcccgg cggacgtctt 900 agaatggaaa tgctaagaga ccttgttcta tataaacgtg ttgatttgag caaacttgtt 960 actcatgtat ttgatggtgc agaaaatatt gaaaaggccc ttttgcttat gaaaaataag 1020 ccaaaagatt taattaaatc agtagttaca ttctaa 1056 <210> 5 <211> 20 <212> DNA <213> Synthetic <400> 5 tcaggacctt ctggaactgg 20 <210> 6 <211> 20 <212> DNA <213> synthetic primer <400> 6 acctcccctt ttcttggaga 20 <210> 7 <211> 20 <212> DNA <213> synthetic primer <400> 7 caggtttcgg tgctgaccta 20 <210> 8 <211> 20 <212> DNA <213> synthetic primer <400> 8 aactccgccg ttgtatttca 20 <210> 9 <211> 25 <212> DNA <213> synthetic primer <400> 9 acaagatggg gtcgaaacag tttgg 25 <210> 10 <211> 25 <212> DNA <213> synthetic primer <400> 10 tggcactgga cttactctac atggg 25 <210> 11 <211> 30 <212> DNA <213> synthetic primer <400> 11 tatttccgaa gatgatattg aattgtatgg 30 <210> 12 <211> 24 <212> DNA <213> synthetic primer <400> 12 tccagcaggt gttgggttta tagc 24 <210> 13 <211> 22 <212> DNA <213> synthetic primer <400> 13 agctgcaact cctggtggag gc 22 <210> 14 <211> 27 <212> DNA <213> synthetic primer <400> 14 gccttttacc ttttcgtcat actgtgc 27 <210> 15 <211> 29 <212> DNA <213> synthetic primer <400> 15 gcttacatta gtaagagttg gagcaaacg 29 <210> 16 <211> 29 <212> DNA <213> synthetic primer <400> 16 acttgtcctg tgatatatct gctggtagc 29 <210> 17 <211> 26 <212> DNA <213> synthetic primer <400> 17 ggtccttatg atgcgattgt acatcc 26 <210> 18 <211> 26 <212> DNA <213> synthetic primer <400> 18 gctatttcac ctacagcttc atggcc 26 <210> 19 <211> 654 <212> DNA <213> Clostridium beijerinckii <400> 19 atgaataaat tagtaaaatt aacagattta aagcgcattt tcaaagatgg catgacaatt 60 atggttgggg gttttttaga ttgtggaact cctgaaaata ttatagatat gctagttgat 120 ttaaatataa aaaatctgac tattataagc aatgatacag cttttcctaa taaaggaata 180 ggaaaactta ttgtaaatgg tcaagtttct aaagtaattg cttcacatat tggaactaat 240 cctgaaactg gaaaaaaaat gagctctgga gaacttaaag ttgagctttc cccacaagga 300 acactgattg aaagaattcg tgcagctgga tctggactcg gaggtgtatt aactccaact 360 ggacttggaa ctatcgttga agaaggtaag aaaaaagtta ctatcgatgg caaagaatat 420 ctattagaac ttcctttatc tgctgatgtt tcattaataa aaggtagcat tgtagatgaa 480 tttggaaata ccttctatag ggctgctact aaaaatttca atccatatat ggcaatggct 540 gcaaaaacag ttatagttga agcagaaaat ttagttaaat gtgaagattt aaaaagagat 600 gccataatga ctcctggcgt attagtagat tatatcgtta aggaggcggc ttaa 654 <210> 20 <211> 666 <212> DNA <213> Clostridium beijerinckii <400> 20 ttgattgtag ataaagtttt agcaaaagag ataattgcca aaagagttgc aaaagaacta 60 aaaaaagacc aactcgtaaa ccttggaata ggacttccaa ctttagtagc aaattatgta 120 ccaaaagaaa tgaacattac ttttgaatca gaaaatggca tggttggtat ggcacaaatg 180 gcatcatcag gtgaaaatga cccagatata ataaatgctg gcggggaata tgtaacatta 240 ttacctcaag gttcattttt tgatagttca atgtctttcg cactaatacg aggaggacat 300 gttgatgttg ctgttcttgg tgctctagaa gttgatgaaa aaggtaattt agctaactgg 360 attgttccaa ataaaattgt cccaggtatg ggtggcgcta tggatttagc aataggcgca 420 aaaaaaataa tagtggcaat gcaacataca ggaaaaagta aacctaaaat cgttaaaaaa 480 tgtactctcc cacttactgc taaggctcaa gtggatttaa ttgtcacaga actttgtgta 540 attgatgtaa caaatgacgg cttactttta aaagaaattc ataaagatac aactattgat 600 gaaattaaat ttttaacaga tgcagattta attattccag ataacttaaa gattatggat 660 atatga 666 <210> 21 <211> 741 <212> DNA <213> clostridium beijerinckii <400> 21 atgttagaaa gtgaagtatc taaacaaatt acaactccac ttgctgctcc agcgtttcct 60 agaggaccat ataggtttca caatagagaa tatctaaaca ttatttatcg aactgattta 120 gatgctcttc gaaaaatagt accagagcca cttgaattag atagagcata tgttagattt 180 gaaatgatgg ctatgcctga tacaaccgga ctaggctcat atacagaatg tggtcaagct 240 attccagtaa aatataatgg tgttaagggt gactacttgc atatgatgta tctagataat 300 gaacctgcta ttgctgttgg aagagaaagt agcgcttatc caaaaaagct tggctatcca 360 aagctatttg ttgattcaga tactttagtt gggacactta aatatggtac attaccagta 420 gctactgcaa caatgggata taagcacgag cctctagatc ttaaagaagc ctatgctcaa 480 attgcaagac ccaattttat gctaaaaatc attcaaggtt acgatggtaa gccaagaatt 540 tgtgaactaa tatgtgcaga aaatactgat ataactattc acggtgcttg gactggaagt 600 gcacgtctac aattatttag ccatgcacta gctcctcttg ctgatttacc tgtattagag 660 attgtatcag catctcatat cctcacagat ttaactcttg gaacacctaa ggttgtacat 720 gattatcttt cagtaaaata a 741 <210> 22 <211> 558 <212> DNA <213> Clostridium autoethanogenum <400> 22 agatagtcat aatagttcca gaatagttca atttagaaat tagactaaac ttcaaaatgt 60 ttgttaaata tataccaaac tagtatagat attttttaaa tactggactt aaacagtagt 120 aatttgccta aaaaattttt tcaatttttt ttaaaaaatc cttttcaagt tgtacattgt 180 tatggtaata tgtaattgaa gaagttatgt agtaatattg taaacgtttc ttgatttttt 240 tacatccatg tagtgcttaa aaaaccaaaa tatgtcacat gcaattgtat atttcaaata 300 acaatattta ttttctcgtt aaattcacaa ataatttatt aataatatca ataaccaaga 360 ttatacttaa atggatgttt attttttaac acttttatag taaatatatt tattttatgt 420 agtaaaaagg ttataattat aattgtattt attacaatta attaaaataa aaaatagggt 480 tttaggtaaa attaagttat tttaagaagt aattacaata aaaattgaag ttatttcttt 540 aaggagggaa ttattaaa 558 <210> 23 <211> 26 <212> DNA <213> synthetic primer <400> 23 gttcatatga aagaagttgt aatagc 26 <210> 24 <211> 25 <212> DNA <213> synthetic primer <400> 24 caagaattcc tagcactttt ctagc 25 <210> 25 <211> 26 <212> DNA <213> synthetic primer <400> 25 ctaggtacca gggagatatt aaaatg 26 <210> 26 <211> 26 <212> DNA <213> synthetic primer <400> 26 cgtggatcct ctatattgct tttatt 26 <210> 27 <211> 29 <212> DNA <213> synthetic primer <400> 27 aagcggccgc agatagtcat aatagttcc 29 <210> 28 <211> 29 <212> DNA <213> synthetic primer <400> 28 ttccatatga ataattccct ccttaaagc 29 <210> 29 <211> 20 <212> DNA <213> synthetic primer <400> 29 cagaggatgt taatgaagtc 20 <210> 30 <211> 18 <212> DNA <213> synthetic primer <400> 30 ctgtgcagca gtacttgt 18 <210> 31 <211> 15 <212> DNA <213> synthetic primer <400> 31 gcaatgatac agctt 15 <210> 32 <211> 19 <212> DNA <213> synthetic primer <400> 32 aaccttggaa taggacttc 19 <210> 33 <211> 20 <212> DNA <213> synthetic primer <400> 33 tgtgaactaa tatgtgcaga 20 <210> 34 <211> 601 <212> PRT <213> synthetic protein <400> 34 Met Phe Pro Cys Asn Ala Tyr Ile Glu Tyr Gly Asp Lys Asn Met Asn 1 5 10 15 Ser Phe Ile Glu Asp Val Glu Gln Ile Tyr Asn Phe Ile Lys Lys Asn 20 25 30 Ile Asp Val Glu Glu Lys Met His Phe Ile Glu Thr Tyr Lys Gln Lys 35 40 45 Ser Asn Met Lys Lys Glu Ile Ser Phe Ser Glu Glu Tyr Tyr Lys Gln 50 55 60 Lys Ile Met Asn Gly Lys Asn Gly Val Val Tyr Thr Pro Pro Glu Met 65 70 75 80 Ala Ala Phe Met Val Lys Asn Leu Ile Asn Val Asn Asp Val Ile Gly 85 90 95 Asn Pro Phe Ile Lys Ile Ile Asp Pro Ser Cys Gly Ser Gly Asn Leu 100 105 110 Ile Cys Lys Cys Phe Leu Tyr Leu Asn Arg Ile Phe Ile Lys Asn Ile 115 120 125 Glu Val Ile Asn Ser Lys Asn Asn Leu Asn Leu Lys Leu Glu Asp Ile 130 135 140 Ser Tyr His Ile Val Arg Asn Asn Leu Phe Gly Phe Asp Ile Asp Glu 145 150 155 160 Thr Ala Ile Lys Val Leu Lys Ile Asp Leu Phe Leu Ile Ser Asn Gln 165 170 175 Phe Ser Glu Lys Asn Phe Gln Val Lys Asp Phe Leu Val Glu Asn Ile 180 185 190 Asp Arg Lys Tyr Asp Val Phe Ile Gly Asn Pro Pro Tyr Ile Gly His 195 200 205 Lys Ser Val Asp Ser Ser Tyr Ser Tyr Val Leu Arg Lys Ile Tyr Gly 210 215 220 Ser Ile Tyr Arg Asp Lys Gly Asp Ile Ser Tyr Cys Phe Phe Gln Lys 225 230 235 240 Ser Leu Lys Cys Leu Lys Glu Gly Gly Lys Leu Val Phe Val Thr Ser 245 250 255 Arg Tyr Phe Cys Glu Ser Cys Ser Gly Lys Glu Leu Arg Lys Phe Leu 260 265 270 Ile Glu Asn Thr Ser Ile Tyr Lys Ile Ile Asp Phe Tyr Gly Ile Arg 275 280 285 Pro Phe Lys Arg Val Gly Ile Asp Pro Met Ile Ile Phe Leu Val Arg 290 295 300 Thr Lys Asn Trp Asn Asn Asn Ile Glu Ile Ile Arg Pro Asn Lys Ile 305 310 315 320 Glu Lys Asn Glu Lys Asn Lys Phe Leu Asp Ser Leu Phe Leu Asp Lys 325 330 335 Ser Glu Lys Cys Lys Lys Phe Ser Ile Ser Gln Lys Ser Ile Asn Asn 340 345 350 Asp Gly Trp Val Phe Val Asp Glu Val Glu Lys Asn Ile Ile Asp Lys 355 360 365 Ile Lys Glu Lys Ser Lys Phe Ile Leu Lys Asp Ile Cys His Ser Cys 370 375 380 Gln Gly Ile Ile Thr Gly Cys Asp Arg Ala Phe Ile Val Asp Arg Asp 385 390 395 400 Ile Ile Asn Ser Arg Lys Ile Glu Leu Arg Leu Ile Lys Pro Trp Ile 405 410 415 Lys Ser Ser His Ile Arg Lys Asn Glu Val Ile Lys Gly Glu Lys Phe 420 425 430 Ile Ile Tyr Ser Asn Leu Ile Glu Asn Glu Thr Glu Cys Pro Asn Ala 435 440 445 Ile Lys Tyr Ile Glu Gln Tyr Lys Lys Arg Leu Met Glu Arg Arg Glu 450 455 460 Cys Lys Lys Gly Thr Arg Lys Trp Tyr Glu Leu Gln Trp Gly Arg Lys 465 470 475 480 Pro Glu Ile Phe Glu Glu Lys Lys Ile Val Phe Pro Tyr Lys Ser Cys 485 490 495 Asp Asn Arg Phe Ala Leu Asp Lys Gly Ser Tyr Phe Ser Ala Asp Ile 500 505 510 Tyr Ser Leu Val Leu Lys Lys Asn Val Pro Phe Thr Tyr Glu Ile Leu 515 520 525 Leu Asn Ile Leu Asn Ser Pro Leu Tyr Glu Phe Tyr Phe Lys Thr Phe 530 535 540 Ala Lys Lys Leu Gly Glu Asn Leu Tyr Glu Tyr Tyr Pro Asn Asn Leu 545 550 555 560 Met Lys Leu Cys Ile Pro Ser Ile Asp Phe Gly Gly Glu Asn Asn Ile 565 570 575 Glu Lys Lys Leu Tyr Asp Phe Phe Gly Leu Thr Asp Lys Glu Ile Glu 580 585 590 Ile Val Glu Lys Ile Lys Asp Asn Cys 595 600 <210> 35 <211> 1806 <212> DNA <213> synthetic gene <400> 35 atgtttccgt gcaatgccta tatcgaatat ggtgataaaa atatgaacag ctttatcgaa 60 gatgtggaac agatctacaa cttcattaaa aagaacattg atgtggaaga aaagatgcat 120 ttcattgaaa cctataaaca gaaaagcaac atgaagaaag agattagctt tagcgaagaa 180 tactataaac agaagattat gaacggcaaa aatggcgttg tgtacacccc gccggaaatg 240 gcggccttta tggttaaaaa tctgatcaac gttaacgatg ttattggcaa tccgtttatt 300 aaaatcattg acccgagctg cggtagcggc aatctgattt gcaaatgttt tctgtatctg 360 aatcgcatct ttattaagaa cattgaggtg attaacagca aaaataacct gaatctgaaa 420 ctggaagaca tcagctacca catcgttcgc aacaatctgt ttggcttcga tattgacgaa 480 accgcgatca aagtgctgaa aattgatctg tttctgatca gcaaccaatt tagcgagaaa 540 aatttccagg ttaaagactt tctggtggaa aatattgatc gcaaatatga cgtgttcatt 600 ggtaatccgc cgtatatcgg tcacaaaagc gtggacagca gctacagcta cgtgctgcgc 660 aaaatctacg gcagcatcta ccgcgacaaa ggcgatatca gctattgttt ctttcagaag 720 agcctgaaat gtctgaagga aggtggcaaa ctggtgtttg tgaccagccg ctacttctgc 780 gagagctgca gcggtaaaga actgcgtaaa ttcctgatcg aaaacacgag catttacaag 840 atcattgatt tttacggcat ccgcccgttc aaacgcgtgg gtatcgatcc gatgattatt 900 tttctggttc gtacgaagaa ctggaacaat aacattgaaa ttattcgccc gaacaagatt 960 gaaaagaacg aaaagaacaa attcctggat agcctgttcc tggacaaaag cgaaaagtgt 1020 aaaaagttta gcattagcca gaaaagcatt aataacgatg gctgggtttt cgtggacgaa 1080 gtggagaaaa acattatcga caaaatcaaa gagaaaagca agttcattct gaaagatatt 1140 tgccatagct gtcaaggcat tatcaccggt tgtgatcgcg cctttattgt ggaccgtgat 1200 atcatcaata gccgtaagat cgaactgcgt ctgattaaac cgtggattaa aagcagccat 1260 atccgtaaga atgaagttat taagggcgaa aaattcatca tctatagcaa cctgattgag 1320 aatgaaaccg agtgtccgaa tgcgattaaa tatatcgaac agtacaagaa acgtctgatg 1380 gagcgccgcg aatgcaaaaa gggcacgcgt aagtggtatg aactgcaatg gggccgtaaa 1440 ccggaaatct tcgaagaaaa gaaaattgtt ttcccgtata aaagctgtga caatcgtttt 1500 gcactggata agggtagcta ttttagcgca gacatttata gcctggttct gaagaaaaat 1560 gtgccgttca cctatgagat cctgctgaat atcctgaata gcccgctgta cgagttttac 1620 tttaagacct tcgcgaaaaa gctgggcgag aatctgtacg agtactatcc gaacaacctg 1680 atgaagctgt gcatcccgag catcgatttc ggcggtgaga acaatattga gaaaaagctg 1740 tatgatttct ttggtctgac ggataaagaa attgagattg tggagaagat caaagataac 1800 tgctaa 1806 <210> 36 <211> 37 <212> DNA <213> synthetic primer <400> 36 ccgaattcgt cgacaacaga gtttgatcct ggctcag 37 <210> 37 <211> 37 <212> DNA <213> synthetic primer <400> 37 cccgggatcc aagcttacgg ctaccttgtt acgactt 37 <210> 38 <211> 351 <212> PRT <213> Clostridium beijerinckii <400> 38 Met Lys Gly Phe Ala Met Leu Gly Ile Asn Lys Leu Gly Trp Ile Glu 1 5 10 15 Lys Glu Arg Pro Val Ala Gly Ser Tyr Asp Ala Ile Val Arg Pro Leu 20 25 30 Ala Val Ser Pro Cys Thr Ser Asp Ile His Thr Val Phe Glu Gly Ala 35 40 45 Leu Gly Asp Arg Lys Asn Met Ile Leu Gly His Glu Ala Val Gly Glu 50 55 60 Val Val Glu Val Gly Ser Glu Val Lys Asp Phe Lys Pro Gly Asp Arg 65 70 75 80 Val Ile Val Pro Cys Thr Thr Pro Asp Trp Arg Ser Leu Glu Val Gln 85 90 95 Ala Gly Phe Gln Gln His Ser Asn Gly Met Leu Ala Gly Trp Lys Phe 100 105 110 Ser Asn Phe Lys Asp Gly Val Phe Gly Glu Tyr Phe His Val Asn Asp 115 120 125 Ala Asp Met Asn Leu Ala Ile Leu Pro Lys Asp Met Pro Leu Glu Asn 130 135 140 Ala Val Met Ile Thr Asp Met Met Thr Thr Gly Phe His Gly Ala Glu 145 150 155 160 Leu Ala Asp Ile Gln Met Gly Ser Ser Val Val Val Ile Gly Ile Gly 165 170 175 Ala Val Gly Leu Met Gly Ile Ala Gly Ala Lys Leu Arg Gly Ala Gly 180 185 190 Arg Ile Ile Gly Val Gly Ser Arg Pro Ile Cys Val Glu Ala Ala Lys 195 200 205 Phe Tyr Gly Ala Thr Asp Ile Leu Asn Tyr Lys Asn Gly His Ile Val 210 215 220 Asp Gln Val Met Lys Leu Thr Asn Gly Lys Gly Val Asp Arg Val Ile 225 230 235 240 Met Ala Gly Gly Gly Ser Glu Thr Leu Ser Gln Ala Val Ser Met Val 245 250 255 Lys Pro Gly Gly Ile Ile Ser Asn Ile Asn Tyr His Gly Ser Gly Asp 260 265 270 Ala Leu Leu Ile Pro Arg Val Glu Trp Gly Cys Gly Met Ala His Lys 275 280 285 Thr Ile Lys Gly Gly Leu Cys Pro Gly Gly Arg Leu Arg Ala Glu Met 290 295 300 Leu Arg Asp Met Val Val Tyr Asn Arg Val Asp Leu Ser Lys Leu Val 305 310 315 320 Thr His Val Tyr His Gly Phe Asp His Ile Glu Glu Ala Leu Leu Leu 325 330 335 Met Lys Asp Lys Pro Lys Asp Leu Ile Lys Ala Val Val Ile Leu 340 345 350 <210> 39 <211> 1056 <212> DNA <213> Clostridium beijerinckii <400> 39 atgaaaggtt ttgcaatgct aggtattaat aagttaggat ggatcgaaaa agaaaggcca 60 gttgcgggtt catatgatgc tattgtacgc ccattagcag tatctccgtg tacatcagat 120 atacatactg tttttgaggg agctcttgga gataggaaga atatgatttt agggcatgaa 180 gctgtaggtg aagttgttga agtaggaagt gaagtgaagg attttaaacc tggtgacaga 240 gttatagttc cttgtacaac tccagattgg agatctttgg aagttcaagc tggttttcaa 300 cagcactcaa acggtatgct cgcaggatgg aaattttcaa atttcaagga tggagttttt 360 ggtgaatatt ttcatgtaaa tgatgcggat atgaatcttg cgattctacc taaagacatg 420 ccattagaaa atgctgttat gataacagat atgatgacta ctggatttca tggagcagaa 480 cttgcagata ttcaaatggg ttcaagtgtt gtggtaattg gcattggagc tgttggctta 540 atgggaatag caggtgctaa attacgtgga gcaggtagaa taattggagt ggggagcagg 600 ccgatttgtg ttgaggctgc aaaattttat ggagcaacag atattctaaa ttataaaaat 660 ggtcatatag ttgatcaagt tatgaaatta acgaatggaa aaggcgttga ccgcgtaatt 720 atggcaggcg gtggttctga aacattatcc caagcagtat ctatggttaa accaggagga 780 ataatttcta atataaatta tcatggaagt ggagatgctt tactaatacc acgtgtagaa 840 tggggatgtg gaatggctca caagactata aaaggaggtc tttgtcctgg gggacgtttg 900 agagcagaaa tgttaagaga tatggtagta tataatcgtg ttgatctaag taaattagtt 960 acacatgtat atcatggatt tgatcacata gaagaagcac tgttattaat gaaagacaag 1020 ccaaaagact taattaaagc agtagttata ttataa 1056 <210> 40 <211> 352 <212> PRT <213> Thermoanaerobacter brockii <400> 40 Met Lys Gly Phe Ala Met Leu Ser Ile Gly Lys Val Gly Trp Ile Glu 1 5 10 15 Lys Glu Lys Pro Ala Pro Gly Pro Phe Asp Ala Ile Val Arg Pro Leu 20 25 30 Ala Val Ala Pro Cys Thr Ser Asp Ile His Thr Val Phe Glu Gly Ala 35 40 45 Ile Gly Glu Arg His Asn Met Ile Leu Gly His Glu Ala Val Gly Glu 50 55 60 Val Val Glu Val Gly Ser Glu Val Lys Asp Phe Lys Pro Gly Asp Arg 65 70 75 80 Val Val Val Pro Ala Ile Thr Pro Asp Trp Arg Thr Ser Glu Val Gln 85 90 95 Arg Gly Tyr His Gln His Ser Gly Gly Met Leu Ala Gly Trp Lys Phe 100 105 110 Ser Asn Val Lys Asp Gly Val Phe Gly Glu Phe Phe His Val Asn Asp 115 120 125 Ala Asp Met Asn Leu Ala His Leu Pro Lys Glu Ile Pro Leu Glu Ala 130 135 140 Ala Val Met Ile Pro Asp Met Met Thr Thr Gly Phe His Gly Ala Glu 145 150 155 160 Leu Ala Asp Ile Glu Leu Gly Ala Thr Val Ala Val Leu Gly Ile Gly 165 170 175 Pro Val Gly Leu Met Ala Val Ala Gly Ala Lys Leu Arg Gly Ala Gly 180 185 190 Arg Ile Ile Ala Val Gly Ser Arg Pro Val Cys Val Asp Ala Ala Lys 195 200 205 Tyr Tyr Gly Ala Thr Asp Ile Val Asn Tyr Lys Asp Gly Pro Ile Glu 210 215 220 Ser Gln Ile Met Asn Leu Thr Glu Gly Lys Gly Val Asp Ala Ala Ile 225 230 235 240 Ile Ala Gly Gly Asn Ala Asp Ile Met Ala Thr Ala Val Lys Ile Val 245 250 255 Lys Pro Gly Gly Thr Ile Ala Asn Val Asn Tyr Phe Gly Glu Gly Glu 260 265 270 Val Leu Pro Val Pro Arg Leu Glu Trp Gly Cys Gly Met Ala His Lys 275 280 285 Thr Ile Lys Gly Gly Leu Cys Pro Gly Gly Arg Leu Arg Met Glu Arg 290 295 300 Leu Ile Asp Leu Val Phe Tyr Lys Arg Val Asp Pro Ser Lys Leu Val 305 310 315 320 Thr His Val Phe Arg Gly Phe Asp Asn Ile Glu Lys Ala Phe Met Leu 325 330 335 Met Lys Asp Lys Pro Lys Asp Leu Ile Lys Pro Val Val Ile Leu Ala 340 345 350 <210> 41 <211> 1056 <212> DNA <213> Thermoanaerobacter brockii <400> 41 atgaaaggtt ttgcaatgct aggtattaat aagttaggat ggatcgaaaa agaaaggcca 60 gttgcgggtt catatgatgc tattgtacgc ccattagcag tatctccgtg tacatcagat 120 atacatactg tttttgaggg agctcttgga gataggaaga atatgatttt agggcatgaa 180 gctgtaggtg aagttgttga agtaggaagt gaagtgaagg attttaaacc tggtgacaga 240 gttatagttc cttgtacaac tccagattgg agatctttgg aagttcaagc tggttttcaa 300 cagcactcaa acggtatgct cgcaggatgg aaattttcaa atttcaagga tggagttttt 360 ggtgaatatt ttcatgtaaa tgatgcggat atgaatcttg cgattctacc taaagacatg 420 ccattagaaa atgctgttat gataacagat atgatgacta ctggatttca tggagcagaa 480 cttgcagata ttcaaatggg ttcaagtgtt gtggtaattg gcattggagc tgttggctta 540 atgggaatag caggtgctaa attacgtgga gcaggtagaa taattggagt ggggagcagg 600 ccgatttgtg ttgaggctgc aaaattttat ggagcaacag atattctaaa ttataaaaat 660 ggtcatatag ttgatcaagt tatgaaatta acgaatggaa aaggcgttga ccgcgtaatt 720 atggcaggcg gtggttctga aacattatcc caagcagtat ctatggttaa accaggagga 780 ataatttcta atataaatta tcatggaagt ggagatgctt tactaatacc acgtgtagaa 840 tggggatgtg gaatggctca caagactata aaaggaggtc tttgtcctgg gggacgtttg 900 agagcagaaa tgttaagaga tatggtagta tataatcgtg ttgatctaag taaattagtt 960 acacatgtat atcatggatt tgatcacata gaagaagcac tgttattaat gaaagacaag 1020 ccaaaagact taattaaagc agtagttata ttataa 1056 <210> 42 <211> 392 <212> PRT <213> Clostiridum acetobutylicum <400> 42 Met Lys Glu Val Val Ile Ala Ser Ala Val Arg Thr Ala Ile Gly Ser 1 5 10 15 Tyr Gly Lys Ser Leu Lys Asp Val Pro Ala Val Asp Leu Gly Ala Thr 20 25 30 Ala Ile Lys Glu Ala Val Lys Lys Ala Gly Ile Lys Pro Glu Asp Val 35 40 45 Asn Glu Val Ile Leu Gly Asn Val Leu Gln Ala Gly Leu Gly Gln Asn 50 55 60 Pro Ala Arg Gln Ala Ser Phe Lys Ala Gly Leu Pro Val Glu Ile Pro 65 70 75 80 Ala Met Thr Ile Asn Lys Val Cys Gly Ser Gly Leu Arg Thr Val Ser 85 90 95 Leu Ala Ala Gln Ile Ile Lys Ala Gly Asp Ala Asp Val Ile Ile Ala 100 105 110 Gly Gly Met Glu Asn Met Ser Arg Ala Pro Tyr Leu Ala Asn Asn Ala 115 120 125 Arg Trp Gly Tyr Arg Met Gly Asn Ala Lys Phe Val Asp Glu Met Ile 130 135 140 Thr Asp Gly Leu Trp Asp Ala Phe Asn Asp Tyr His Met Gly Ile Thr 145 150 155 160 Ala Glu Asn Ile Ala Glu Arg Trp Asn Ile Ser Arg Glu Glu Gln Asp 165 170 175 Glu Phe Ala Leu Ala Ser Gln Lys Lys Ala Glu Glu Ala Ile Lys Ser 180 185 190 Gly Gln Phe Lys Asp Glu Ile Val Pro Val Val Ile Lys Gly Arg Lys 195 200 205 Gly Glu Thr Val Val Asp Thr Asp Glu His Pro Arg Phe Gly Ser Thr 210 215 220 Ile Glu Gly Leu Ala Lys Leu Lys Pro Ala Phe Lys Lys Asp Gly Thr 225 230 235 240 Val Thr Ala Gly Asn Ala Ser Gly Leu Asn Asp Cys Ala Ala Val Leu 245 250 255 Val Ile Met Ser Ala Glu Lys Ala Lys Glu Leu Gly Val Lys Pro Leu 260 265 270 Ala Lys Ile Val Ser Tyr Gly Ser Ala Gly Val Asp Pro Ala Ile Met 275 280 285 Gly Tyr Gly Pro Phe Tyr Ala Thr Lys Ala Ala Ile Glu Lys Ala Gly 290 295 300 Trp Thr Val Asp Glu Leu Asp Leu Ile Glu Ser Asn Glu Ala Phe Ala 305 310 315 320 Ala Gln Ser Leu Ala Val Ala Lys Asp Leu Lys Phe Asp Met Asn Lys 325 330 335 Val Asn Val Asn Gly Gly Ala Ile Ala Leu Gly His Pro Ile Gly Ala 340 345 350 Ser Gly Ala Arg Ile Leu Val Thr Leu Val His Ala Met Gln Lys Arg 355 360 365 Asp Ala Lys Lys Gly Leu Ala Thr Leu Cys Ile Gly Gly Gly Gln Gly 370 375 380 Thr Ala Ile Leu Leu Glu Lys Cys 385 390 <210> 43 <211> 217 <212> PRT <213> Clostridium beijerinckii <400> 43 Met Asn Lys Leu Val Lys Leu Thr Asp Leu Lys Arg Ile Phe Lys Asp 1 5 10 15 Gly Met Thr Ile Met Val Gly Gly Phe Leu Asp Cys Gly Thr Pro Glu 20 25 30 Asn Ile Ile Asp Met Leu Val Asp Leu Asn Ile Lys Asn Leu Thr Ile 35 40 45 Ile Ser Asn Asp Thr Ala Phe Pro Asn Lys Gly Ile Gly Lys Leu Ile 50 55 60 Val Asn Gly Gln Val Ser Lys Val Ile Ala Ser His Ile Gly Thr Asn 65 70 75 80 Pro Glu Thr Gly Lys Lys Met Ser Ser Gly Glu Leu Lys Val Glu Leu 85 90 95 Ser Pro Gln Gly Thr Leu Ile Glu Arg Ile Arg Ala Ala Gly Ser Gly 100 105 110 Leu Gly Gly Val Leu Thr Pro Thr Gly Leu Gly Thr Ile Val Glu Glu 115 120 125 Gly Lys Lys Lys Val Thr Ile Asp Gly Lys Glu Tyr Leu Leu Glu Leu 130 135 140 Pro Leu Ser Ala Asp Val Ser Leu Ile Lys Gly Ser Ile Val Asp Glu 145 150 155 160 Phe Gly Asn Thr Phe Tyr Arg Ala Ala Thr Lys Asn Phe Asn Pro Tyr 165 170 175 Met Ala Met Ala Ala Lys Thr Val Ile Val Glu Ala Glu Asn Leu Val 180 185 190 Lys Cys Glu Asp Leu Lys Arg Asp Ala Ile Met Thr Pro Gly Val Leu 195 200 205 Val Asp Tyr Ile Val Lys Glu Ala Ala 210 215 <210> 44 <211> 221 <212> PRT <213> clostridium beijerinckii <400> 44 Leu Ile Val Asp Lys Val Leu Ala Lys Glu Ile Ile Ala Lys Arg Val 1 5 10 15 Ala Lys Glu Leu Lys Lys Asp Gln Leu Val Asn Leu Gly Ile Gly Leu 20 25 30 Pro Thr Leu Val Ala Asn Tyr Val Pro Lys Glu Met Asn Ile Thr Phe 35 40 45 Glu Ser Glu Asn Gly Met Val Gly Met Ala Gln Met Ala Ser Ser Gly 50 55 60 Glu Asn Asp Pro Asp Ile Ile Asn Ala Gly Gly Glu Tyr Val Thr Leu 65 70 75 80 Leu Pro Gln Gly Ser Phe Phe Asp Ser Ser Met Ser Phe Ala Leu Ile 85 90 95 Arg Gly Gly His Val Asp Val Ala Val Leu Gly Ala Leu Glu Val Asp 100 105 110 Glu Lys Gly Asn Leu Ala Asn Trp Ile Val Pro Asn Lys Ile Val Pro 115 120 125 Gly Met Gly Gly Ala Met Asp Leu Ala Ile Gly Ala Lys Lys Ile Ile 130 135 140 Val Ala Met Gln His Thr Gly Lys Ser Lys Pro Lys Ile Val Lys Lys 145 150 155 160 Cys Thr Leu Pro Leu Thr Ala Lys Ala Gln Val Asp Leu Ile Val Thr 165 170 175 Glu Leu Cys Val Ile Asp Val Thr Asn Asp Gly Leu Leu Leu Lys Glu 180 185 190 Ile His Lys Asp Thr Thr Ile Asp Glu Ile Lys Phe Leu Thr Asp Ala 195 200 205 Asp Leu Ile Ile Pro Asp Asn Leu Lys Ile Met Asp Ile 210 215 220 <210> 45 <211> 246 <212> PRT <213> clostridium beijerinckii <400> 45 Met Leu Glu Ser Glu Val Ser Lys Gln Ile Thr Thr Pro Leu Ala Ala 1 5 10 15 Pro Ala Phe Pro Arg Gly Pro Tyr Arg Phe His Asn Arg Glu Tyr Leu 20 25 30 Asn Ile Ile Tyr Arg Thr Asp Leu Asp Ala Leu Arg Lys Ile Val Pro 35 40 45 Glu Pro Leu Glu Leu Asp Arg Ala Tyr Val Arg Phe Glu Met Met Ala 50 55 60 Met Pro Asp Thr Thr Gly Leu Gly Ser Tyr Thr Glu Cys Gly Gln Ala 65 70 75 80 Ile Pro Val Lys Tyr Asn Gly Val Lys Gly Asp Tyr Leu His Met Met 85 90 95 Tyr Leu Asp Asn Glu Pro Ala Ile Ala Val Gly Arg Glu Ser Ser Ala 100 105 110 Tyr Pro Lys Lys Leu Gly Tyr Pro Lys Leu Phe Val Asp Ser Asp Thr 115 120 125 Leu Val Gly Thr Leu Lys Tyr Gly Thr Leu Pro Val Ala Thr Ala Thr 130 135 140 Met Gly Tyr Lys His Glu Pro Leu Asp Leu Lys Glu Ala Tyr Ala Gln 145 150 155 160 Ile Ala Arg Pro Asn Phe Met Leu Lys Ile Ile Gln Gly Tyr Asp Gly 165 170 175 Lys Pro Arg Ile Cys Glu Leu Ile Cys Ala Glu Asn Thr Asp Ile Thr 180 185 190 Ile His Gly Ala Trp Thr Gly Ser Ala Arg Leu Gln Leu Phe Ser His 195 200 205 Ala Leu Ala Pro Leu Ala Asp Leu Pro Val Leu Glu Ile Val Ser Ala 210 215 220 Ser His Ile Leu Thr Asp Leu Thr Leu Gly Thr Pro Lys Val Val His 225 230 235 240 Asp Tyr Leu Ser Val Lys 245 <210> 46 <211> 6832 <212> DNA <213> synthetic plasmid <400> 46 tgaaagaaag atatggaaca gtctataaag gctctcagag gctcatagac gaagaaagtg 60 gagaagtcat agaggtagac aagttatacc gtaaacaaac gtctggtaac ttcgtaaagg 120 catatatagt gcaattaata agtatgttag atatgattgg cggaaaaaaa cttaaaatcg 180 ttaactatat cctagataat gtccacttaa gtaacaatac aatgatagct acaacaagag 240 aaatagcaaa agctacagga acaagtctac aaacagtaat aacaacactt aaaatcttag 300 aagaaggaaa tattataaaa agaaaaactg gagtattaat gttaaaccct gaactactaa 360 tgagaggcga cgaccaaaaa caaaaatacc tcttactcga atttgggaac tttgagcaag 420 aggcaaatga aatagattga cctcccaata acaccacgta gttattggga ggtcaatcta 480 tgaaatgcga ttaagggccg gccagtgggc aagttgaaaa attcacaaaa atgtggtata 540 atatctttgt tcattagagc gataaacttg aatttgagag ggaacttaga tggtatttga 600 aaaaattgat aaaaatagtt ggaacagaaa agagtatttt gaccactact ttgcaagtgt 660 accttgtacc tacagcatga ccgttaaagt ggatatcaca caaataaagg aaaagggaat 720 gaaactatat cctgcaatgc tttattatat tgcaatgatt gtaaaccgcc attcagagtt 780 taggacggca atcaatcaag atggtgaatt ggggatatat gatgagatga taccaagcta 840 tacaatattt cacaatgata ctgaaacatt ttccagcctt tggactgagt gtaagtctga 900 ctttaaatca tttttagcag attatgaaag tgatacgcaa cggtatggaa acaatcatag 960 aatggaagga aagccaaatg ctccggaaaa catttttaat gtatctatga taccgtggtc 1020 aaccttcgat ggctttaatc tgaatttgca gaaaggatat gattatttga ttcctatttt 1080 tactatgggg aaatattata aagaagataa caaaattata cttcctttgg caattcaagt 1140 tcatcacgca gtatgtgacg gatttcacat ttgccgtttt gtaaacgaat tgcaggaatt 1200 gataaatagt taacttcagg tttgtctgta actaaaaaca agtatttaag caaaaacatc 1260 gtagaaatac ggtgtttttt gttaccctaa gtttaaactc ctttttgata atctcatgac 1320 caaaatccct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa 1380 aggatcttct tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc 1440 accgctacca gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt 1500 aactggcttc agcagagcgc agataccaaa tactgttctt ctagtgtagc cgtagttagg 1560 ccaccacttc aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc 1620 agtggctgct gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt 1680 accggataag gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga 1740 gcgaacgacc tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct 1800 tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg 1860 cacgagggag cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca 1920 cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa 1980 cgccagcaac gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt 2040 ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga 2100 taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga 2160 gcgcccaata cgcagggccc cctgcaggat aaaaaaattg tagataaatt ttataaaata 2220 gttttatcta caattttttt atcaggaaac agctatgacc gcggccgcag atagtcataa 2280 tagttccaga atagttcaat ttagaaatta gactaaactt caaaatgttt gttaaatata 2340 taccaaacta gtatagatat tttttaaata ctggacttaa acagtagtaa tttgcctaaa 2400 aaattttttc aatttttttt aaaaaatcct tttcaagttg tacattgtta tggtaatatg 2460 taattgaaga agttatgtag taatattgta aacgtttctt gattttttta catccatgta 2520 gtgcttaaaa aaccaaaata tgtcacatgc aattgtatat ttcaaataac aatatttatt 2580 ttctcgttaa attcacaaat aatttattaa taatatcaat aaccaagatt atacttaaat 2640 ggatgtttat tttttaacac ttttatagta aatatattta ttttatgtag taaaaaggtt 2700 ataattataa ttgtatttat tacaattaat taaaataaaa aatagggttt taggtaaaat 2760 taagttattt taagaagtaa ttacaataaa aattgaagtt atttctttaa ggagggaatt 2820 attcatatga aagaagttgt aatagctagt gcagtaagaa cagcgattgg atcttatgga 2880 aagtctctta aggatgtacc agcagtagat ttaggagcta cagctataaa ggaagcagtt 2940 aaaaaagcag gaataaaacc agaggatgtt aatgaagtca ttttaggaaa tgttcttcaa 3000 gcaggtttag gacagaatcc agcaagacag gcatctttta aagcaggatt accagttgaa 3060 attccagcta tgactattaa taaggtttgt ggttcaggac ttagaacagt tagcttagca 3120 gcacaaatta taaaagcagg agatgctgac gtaataatag caggtggtat ggaaaatatg 3180 tctagagctc cttacttagc gaataacgct agatggggat atagaatggg aaacgctaaa 3240 tttgttgatg aaatgatcac tgacggattg tgggatgcat ttaatgatta ccacatggga 3300 ataacagcag aaaacatagc tgagagatgg aacatttcaa gagaagaaca agatgagttt 3360 gctcttgcat cacaaaaaaa agctgaagaa gctataaaat caggtcaatt taaagatgaa 3420 atagttcctg tagtaattaa aggcagaaag ggagaaactg tagttgatac agatgagcac 3480 cctagatttg gatcaactat agaaggactt gcaaaattaa aacctgcctt caaaaaagat 3540 ggaacagtta cagctggtaa tgcatcagga ttaaatgact gtgcagcagt acttgtaatc 3600 atgagtgcag aaaaagctaa agagcttgga gtaaaaccac ttgctaagat agtttcttat 3660 ggttcagcag gagttgaccc agcaataatg ggatatggac ctttctatgc aacaaaagca 3720 gctattgaaa aagcaggttg gacagttgat gaattagatt taatagaatc aaatgaagct 3780 tttgcagctc aaagtttagc agtagcaaaa gatttaaaat ttgatatgaa taaagtaaat 3840 gtaaatggag gagctattgc ccttggtcat ccaattggag catcaggtgc aagaatactc 3900 gttactcttg tacacgcaat gcaaaaaaga gatgcaaaaa aaggcttagc aactttatgt 3960 ataggtggcg gacaaggaac agcaatattg ctagaaaagt gctaggaatt cgagctcggt 4020 accagggaga tattaaaatg aataaattag taaaattaac agatttaaag cgcattttca 4080 aagatggcat gacaattatg gttgggggtt ttttagattg tggaactcct gaaaatatta 4140 tagatatgct agttgattta aatataaaaa atctgactat tataagcaat gatacagctt 4200 ttcctaataa aggaatagga aaacttattg taaatggtca agtttctaaa gtaattgctt 4260 cacatattgg aactaatcct gaaactggaa aaaaaatgag ctctggagaa cttaaagttg 4320 agctttcccc acaaggaaca ctgattgaaa gaattcgtgc agctggatct ggactcggag 4380 gtgtattaac tccaactgga cttggaacta tcgttgaaga aggtaagaaa aaagttacta 4440 tcgatggcaa agaatatcta ttagaacttc ctttatctgc tgatgtttca ttaataaaag 4500 gtagcattgt agatgaattt ggaaatacct tctatagggc tgctactaaa aatttcaatc 4560 catatatggc aatggctgca aaaacagtta tagttgaagc agaaaattta gttaaatgtg 4620 aagatttaaa aagagatgcc ataatgactc ctggcgtatt agtagattat atcgttaagg 4680 aggcggctta attgattgta gataaagttt tagcaaaaga gataattgcc aaaagagttg 4740 caaaagaact aaaaaaagac caactcgtaa accttggaat aggacttcca actttagtag 4800 caaattatgt accaaaagaa atgaacatta cttttgaatc agaaaatggc atggttggta 4860 tggcacaaat ggcatcatca ggtgaaaatg acccagatat aataaatgct ggcggggaat 4920 atgtaacatt attacctcaa ggttcatttt ttgatagttc aatgtctttc gcactaatac 4980 gaggaggaca tgttgatgtt gctgttcttg gtgctctaga agttgatgaa aaaggtaatt 5040 tagctaactg gattgttcca aataaaattg tcccaggtat gggtggcgct atggatttag 5100 caataggcgc aaaaaaaata atagtggcaa tgcaacatac aggaaaaagt aaacctaaaa 5160 tcgttaaaaa atgtactctc ccacttactg ctaaggctca agtggattta attgtcacag 5220 aactttgtgt aattgatgta acaaatgacg gcttactttt aaaagaaatt cataaagata 5280 caactattga tgaaattaaa tttttaacag atgcagattt aattattcca gataacttaa 5340 agattatgga tatatgaatc attctatttt aaatatataa ctttaaaaat cttatgtatt 5400 aaaaactaag aaaagaggtt gattgtttta tgttagaaag tgaagtatct aaacaaatta 5460 caactccact tgctgctcca gcgtttccta gaggaccata taggtttcac aatagagaat 5520 atctaaacat tatttatcga actgatttag atgctcttcg aaaaatagta ccagagccac 5580 ttgaattaga tagagcatat gttagatttg aaatgatggc tatgcctgat acaaccggac 5640 taggctcata tacagaatgt ggtcaagcta ttccagtaaa atataatggt gttaagggtg 5700 actacttgca tatgatgtat ctagataatg aacctgctat tgctgttgga agagaaagta 5760 gcgcttatcc aaaaaagctt ggctatccaa agctatttgt tgattcagat actttagttg 5820 ggacacttaa atatggtaca ttaccagtag ctactgcaac aatgggatat aagcacgagc 5880 ctctagatct taaagaagcc tatgctcaaa ttgcaagacc caattttatg ctaaaaatca 5940 ttcaaggtta cgatggtaag ccaagaattt gtgaactaat atgtgcagaa aatactgata 6000 taactattca cggtgcttgg actggaagtg cacgtctaca attatttagc catgcactag 6060 ctcctcttgc tgatttacct gtattagaga ttgtatcagc atctcatatc ctcacagatt 6120 taactcttgg aacacctaag gttgtacatg attatctttc agtaaaataa aagcaatata 6180 gaggatcctc tagagtcgac gtcacgcgtc catggagatc tcgaggcctg cagacatgca 6240 agcttggcac tggccgtcgt tttacaacgt cgtgactggg aaaaccctgg cgttacccaa 6300 cttaatcgcc ttgcagcaca tccccctttc gccagctggc gtaatagcga agaggcccgc 6360 accgatcgcc cttcccaaca gttgcgcagc ctgaatggcg aatggcgcta gcataaaaat 6420 aagaagcctg catttgcagg cttcttattt ttatggcgcg ccgcattcac ttcttttcta 6480 tataaatatg agcgaagcga ataagcgtcg gaaaagcagc aaaaagtttc ctttttgctg 6540 ttggagcatg ggggttcagg gggtgcagta tctgacgtca atgccgagcg aaagcgagcc 6600 gaagggtagc atttacgtta gataaccccc tgatatgctc cgacgcttta tatagaaaag 6660 aagattcaac taggtaaaat cttaatatag gttgagatga taaggtttat aaggaatttg 6720 tttgttctaa tttttcactc attttgttct aatttctttt aacaaatgtt cttttttttt 6780 tagaacagtt atgatatagt tagaatagtt taaaataagg agtgagaaaa ag 6832 <210> 47 <211> 2133 <212> DNA <213> Clostridium beijerinckii <400> 47 atgaataaat tagtaaaatt aacagattta aagcgcattt tcaaagatgg catgacaatt 60 atggttgggg gttttttaga ttgtggaact cctgaaaata ttatagatat gctagttgat 120 ttaaatataa aaaatctgac tattataagc aatgatacag cttttcctaa taaaggaata 180 ggaaaactta ttgtaaatgg tcaagtttct aaagtaattg cttcacatat tggaactaat 240 cctgaaactg gaaaaaaaat gagctctgga gaacttaaag ttgagctttc cccacaagga 300 acactgattg aaagaattcg tgcagctgga tctggactcg gaggtgtatt aactccaact 360 ggacttggaa ctatcgttga agaaggtaag aaaaaagtta ctatcgatgg caaagaatat 420 ctattagaac ttcctttatc tgctgatgtt tcattaataa aaggtagcat tgtagatgaa 480 tttggaaata ccttctatag ggctgctact aaaaatttca atccatatat ggcaatggct 540 gcaaaaacag ttatagttga agcagaaaat ttagttaaat gtgaagattt aaaaagagat 600 gccataatga ctcctggcgt attagtagat tatatcgtta aggaggcggc ttaattgatt 660 gtagataaag ttttagcaaa agagataatt gccaaaagag ttgcaaaaga actaaaaaaa 720 gaccaactcg taaaccttgg aataggactt ccaactttag tagcaaatta tgtaccaaaa 780 gaaatgaaca ttacttttga atcagaaaat ggcatggttg gtatggcaca aatggcatca 840 tcaggtgaaa atgacccaga tataataaat gctggcgggg aatatgtaac attattacct 900 caaggttcat tttttgatag ttcaatgtct ttcgcactaa tacgaggagg acatgttgat 960 gttgctgttc ttggtgctct agaagttgat gaaaaaggta atttagctaa ctggattgtt 1020 ccaaataaaa ttgtcccagg tatgggtggc gctatggatt tagcaatagg cgcaaaaaaa 1080 ataatagtgg caatgcaaca tacaggaaaa agtaaaccta aaatcgttaa aaaatgtact 1140 ctcccactta ctgctaaggc tcaagtggat ttaattgtca cagaactttg tgtaattgat 1200 gtaacaaatg acggcttact tttaaaagaa attcataaag atacaactat tgatgaaatt 1260 aaatttttaa cagatgcaga tttaattatt ccagataact taaagattat ggatatatga 1320 atcattctat tttaaatata taactttaaa aatcttatgt attaaaaact aagaaaagag 1380 gttgattgtt ttatgttaga aagtgaagta tctaaacaaa ttacaactcc acttgctgct 1440 ccagcgtttc ctagaggacc atataggttt cacaatagag aatatctaaa cattatttat 1500 cgaactgatt tagatgctct tcgaaaaata gtaccagagc cacttgaatt agatagagca 1560 tatgttagat ttgaaatgat ggctatgcct gatacaaccg gactaggctc atatacagaa 1620 tgtggtcaag ctattccagt aaaatataat ggtgttaagg gtgactactt gcatatgatg 1680 tatctagata atgaacctgc tattgctgtt ggaagagaaa gtagcgctta tccaaaaaag 1740 cttggctatc caaagctatt tgttgattca gatactttag ttgggacact taaatatggt 1800 acattaccag tagctactgc aacaatggga tataagcacg agcctctaga tcttaaagaa 1860 gcctatgctc aaattgcaag acccaatttt atgctaaaaa tcattcaagg ttacgatggt 1920 aagccaagaa tttgtgaact aatatgtgca gaaaatactg atataactat tcacggtgct 1980 tggactggaa gtgcacgtct acaattattt agccatgcac tagctcctct tgctgattta 2040 cctgtattag agattgtatc agcatctcat atcctcacag atttaactct tggaacacct 2100 aaggttgtac atgattatct ttcagtaaaa taa 2133 <210> 48 <211> 7922 <212> DNA <213> synthetic plasmid <400> 48 atgaaagaaa gatatggaac agtctataaa ggctctcaga ggctcataga cgaagaaagt 60 ggagaagtca tagaggtaga caagttatac cgtaaacaaa cgtctggtaa cttcgtaaag 120 gcatatatag tgcaattaat aagtatgtta gatatgattg gcggaaaaaa acttaaaatc 180 gttaactata tcctagataa tgtccactta agtaacaata caatgatagc tacaacaaga 240 gaaatagcaa aagctacagg aacaagtcta caaacagtaa taacaacact taaaatctta 300 gaagaaggaa atattataaa aagaaaaact ggagtattaa tgttaaaccc tgaactacta 360 atgagaggcg acgaccaaaa acaaaaatac ctcttactcg aatttgggaa ctttgagcaa 420 gaggcaaatg aaatagattg acctcccaat aacaccacgt agttattggg aggtcaatct 480 atgaaatgcg attaagggcc ggccagtggg caagttgaaa aattcacaaa aatgtggtat 540 aatatctttg ttcattagag cgataaactt gaatttgaga gggaacttag atggtatttg 600 aaaaaattga taaaaatagt tggaacagaa aagagtattt tgaccactac tttgcaagtg 660 taccttgtac ctacagcatg accgttaaag tggatatcac acaaataaag gaaaagggaa 720 tgaaactata tcctgcaatg ctttattata ttgcaatgat tgtaaaccgc cattcagagt 780 ttaggacggc aatcaatcaa gatggtgaat tggggatata tgatgagatg ataccaagct 840 atacaatatt tcacaatgat actgaaacat tttccagcct ttggactgag tgtaagtctg 900 actttaaatc atttttagca gattatgaaa gtgatacgca acggtatgga aacaatcata 960 gaatggaagg aaagccaaat gctccggaaa acatttttaa tgtatctatg ataccgtggt 1020 caaccttcga tggctttaat ctgaatttgc agaaaggata tgattatttg attcctattt 1080 ttactatggg gaaatattat aaagaagata acaaaattat acttcctttg gcaattcaag 1140 ttcatcacgc agtatgtgac ggatttcaca tttgccgttt tgtaaacgaa ttgcaggaat 1200 tgataaatag ttaacttcag gtttgtctgt aactaaaaac aagtatttaa gcaaaaacat 1260 cgtagaaata cggtgttttt tgttacccta agtttaaact cctttttgat aatctcatga 1320 ccaaaatccc ttaacgtgag ttttcgttcc actgagcgtc agaccccgta gaaaagatca 1380 aaggatcttc ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac 1440 caccgctacc agcggtggtt tgtttgccgg atcaagagct accaactctt tttccgaagg 1500 taactggctt cagcagagcg cagataccaa atactgttct tctagtgtag ccgtagttag 1560 gccaccactt caagaactct gtagcaccgc ctacatacct cgctctgcta atcctgttac 1620 cagtggctgc tgccagtggc gataagtcgt gtcttaccgg gttggactca agacgatagt 1680 taccggataa ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag cccagcttgg 1740 agcgaacgac ctacaccgaa ctgagatacc tacagcgtga gctatgagaa agcgccacgc 1800 ttcccgaagg gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga acaggagagc 1860 gcacgaggga gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc 1920 acctctgact tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc ctatggaaaa 1980 acgccagcaa cgcggccttt ttacggttcc tggccttttg ctggcctttt gctcacatgt 2040 tctttcctgc gttatcccct gattctgtgg ataaccgtat taccgccttt gagtgagctg 2100 ataccgctcg ccgcagccga acgaccgagc gcagcgagtc agtgagcgag gaagcggaag 2160 agcgcccaat acgcagggcc ccctgcagga taaaaaaatt gtagataaat tttataaaat 2220 agttttatct acaatttttt tatcaggaaa cagctatgac cgcggccgca gatagtcata 2280 atagttccag aatagttcaa tttagaaatt agactaaact tcaaaatgtt tgttaaatat 2340 ataccaaact agtatagata ttttttaaat actggactta aacagtagta atttgcctaa 2400 aaaatttttt caattttttt taaaaaatcc ttttcaagtt gtacattgtt atggtaatat 2460 gtaattgaag aagttatgta gtaatattgt aaacgtttct tgattttttt acatccatgt 2520 agtgcttaaa aaaccaaaat atgtcacatg caattgtata tttcaaataa caatatttat 2580 tttctcgtta aattcacaaa taatttatta ataatatcaa taaccaagat tatacttaaa 2640 tggatgttta ttttttaaca cttttatagt aaatatattt attttatgta gtaaaaaggt 2700 tataattata attgtattta ttacaattaa ttaaaataaa aaatagggtt ttaggtaaaa 2760 ttaagttatt ttaagaagta attacaataa aaattgaagt tatttcttta aggagggaat 2820 tattcatatg aaagaagttg taatagctag tgcagtaaga acagcgattg gatcttatgg 2880 aaagtctctt aaggatgtac cagcagtaga tttaggagct acagctataa aggaagcagt 2940 taaaaaagca ggaataaaac cagaggatgt taatgaagtc attttaggaa atgttcttca 3000 agcaggttta ggacagaatc cagcaagaca ggcatctttt aaagcaggat taccagttga 3060 aattccagct atgactatta ataaggtttg tggttcagga cttagaacag ttagcttagc 3120 agcacaaatt ataaaagcag gagatgctga cgtaataata gcaggtggta tggaaaatat 3180 gtctagagct ccttacttag cgaataacgc tagatgggga tatagaatgg gaaacgctaa 3240 atttgttgat gaaatgatca ctgacggatt gtgggatgca tttaatgatt accacatggg 3300 aataacagca gaaaacatag ctgagagatg gaacatttca agagaagaac aagatgagtt 3360 tgctcttgca tcacaaaaaa aagctgaaga agctataaaa tcaggtcaat ttaaagatga 3420 aatagttcct gtagtaatta aaggcagaaa gggagaaact gtagttgata cagatgagca 3480 ccctagattt ggatcaacta tagaaggact tgcaaaatta aaacctgcct tcaaaaaaga 3540 tggaacagtt acagctggta atgcatcagg attaaatgac tgtgcagcag tacttgtaat 3600 catgagtgca gaaaaagcta aagagcttgg agtaaaacca cttgctaaga tagtttctta 3660 tggttcagca ggagttgacc cagcaataat gggatatgga cctttctatg caacaaaagc 3720 agctattgaa aaagcaggtt ggacagttga tgaattagat ttaatagaat caaatgaagc 3780 ttttgcagct caaagtttag cagtagcaaa agatttaaaa tttgatatga ataaagtaaa 3840 tgtaaatgga ggagctattg cccttggtca tccaattgga gcatcaggtg caagaatact 3900 cgttactctt gtacacgcaa tgcaaaaaag agatgcaaaa aaaggcttag caactttatg 3960 tataggtggc ggacaaggaa cagcaatatt gctagaaaag tgctaggaat tcgagctcgg 4020 taccagggag atattaaaat gaataaatta gtaaaattaa cagatttaaa gcgcattttc 4080 aaagatggca tgacaattat ggttgggggt tttttagatt gtggaactcc tgaaaatatt 4140 atagatatgc tagttgattt aaatataaaa aatctgacta ttataagcaa tgatacagct 4200 tttcctaata aaggaatagg aaaacttatt gtaaatggtc aagtttctaa agtaattgct 4260 tcacatattg gaactaatcc tgaaactgga aaaaaaatga gctctggaga acttaaagtt 4320 gagctttccc cacaaggaac actgattgaa agaattcgtg cagctggatc tggactcgga 4380 ggtgtattaa ctccaactgg acttggaact atcgttgaag aaggtaagaa aaaagttact 4440 atcgatggca aagaatatct attagaactt cctttatctg ctgatgtttc attaataaaa 4500 ggtagcattg tagatgaatt tggaaatacc ttctataggg ctgctactaa aaatttcaat 4560 ccatatatgg caatggctgc aaaaacagtt atagttgaag cagaaaattt agttaaatgt 4620 gaagatttaa aaagagatgc cataatgact cctggcgtat tagtagatta tatcgttaag 4680 gaggcggctt aattgattgt agataaagtt ttagcaaaag agataattgc caaaagagtt 4740 gcaaaagaac taaaaaaaga ccaactcgta aaccttggaa taggacttcc aactttagta 4800 gcaaattatg taccaaaaga aatgaacatt acttttgaat cagaaaatgg catggttggt 4860 atggcacaaa tggcatcatc aggtgaaaat gacccagata taataaatgc tggcggggaa 4920 tatgtaacat tattacctca aggttcattt tttgatagtt caatgtcttt cgcactaata 4980 cgaggaggac atgttgatgt tgctgttctt ggtgctctag aagttgatga aaaaggtaat 5040 ttagctaact ggattgttcc aaataaaatt gtcccaggta tgggtggcgc tatggattta 5100 gcaataggcg caaaaaaaat aatagtggca atgcaacata caggaaaaag taaacctaaa 5160 atcgttaaaa aatgtactct cccacttact gctaaggctc aagtggattt aattgtcaca 5220 gaactttgtg taattgatgt aacaaatgac ggcttacttt taaaagaaat tcataaagat 5280 acaactattg atgaaattaa atttttaaca gatgcagatt taattattcc agataactta 5340 aagattatgg atatatgaat cattctattt taaatatata actttaaaaa tcttatgtat 5400 taaaaactaa gaaaagaggt tgattgtttt atgttagaaa gtgaagtatc taaacaaatt 5460 acaactccac ttgctgctcc agcgtttcct agaggaccat ataggtttca caatagagaa 5520 tatctaaaca ttatttatcg aactgattta gatgctcttc gaaaaatagt accagagcca 5580 cttgaattag atagagcata tgttagattt gaaatgatgg ctatgcctga tacaaccgga 5640 ctaggctcat atacagaatg tggtcaagct attccagtaa aatataatgg tgttaagggt 5700 gactacttgc atatgatgta tctagataat gaacctgcta ttgctgttgg aagagaaagt 5760 agcgcttatc caaaaaagct tggctatcca aagctatttg ttgattcaga tactttagtt 5820 gggacactta aatatggtac attaccagta gctactgcaa caatgggata taagcacgag 5880 cctctagatc ttaaagaagc ctatgctcaa attgcaagac ccaattttat gctaaaaatc 5940 attcaaggtt acgatggtaa gccaagaatt tgtgaactaa tatgtgcaga aaatactgat 6000 ataactattc acggtgcttg gactggaagt gcacgtctac aattatttag ccatgcacta 6060 gctcctcttg ctgatttacc tgtattagag attgtatcag catctcatat cctcacagat 6120 ttaactcttg gaacacctaa ggttgtacat gattatcttt cagtaaaata aaagcaatat 6180 agaggatcct ctagagtcga cttaggaggt tctattatga aaggttttgc aatgttaggt 6240 attaacaaat taggatggat tgaaaagaaa aacccagtgc caggtcctta tgatgcgatt 6300 gtacatcctc tagctgtatc cccatgtaca tcagatatac atacggtttt tgaaggagca 6360 cttggtaata gggaaaatat gattttaggc catgaagctg taggtgaaat agccgaagtt 6420 ggcagcgaag ttaaagattt taaagttggc gatagagtta tcgtaccatg cacaacacct 6480 gactggagat ctttagaagt ccaagctggt tttcagcagc attcaaacgg tatgcttgca 6540 ggatggaagt tttccaattt taaagatggt gtatttgcag attactttca tgtaaacgat 6600 gcagatatga atcttgccat actcccagat gaaatacctt tagaaagtgc agttatgatg 6660 acagacatga tgactactgg ttttcatgga gcagaacttg cagacataaa aatgggctcc 6720 agcgttgtag taattggtat aggagctgtt ggattaatgg gaatagccgg ttccaaactt 6780 cgaggagcag gcagaattat cggtgttgga agcagacctg tttgtgttga aacagctaaa 6840 ttttatggag caactgatat tgtaaattat aaaaatggtg atatagttga acaaatcatg 6900 gacttaactc atggtaaagg tgtagaccgt gtaatcatgg caggcggtgg tgctgaaaca 6960 ctagcacaag cagtaactat ggttaaacct ggcggcgtaa tttctaacat caactaccat 7020 ggaagcggtg atactttacc aatacctcgt gttcaatggg gctgcggcat ggctcacaaa 7080 actataagag gaggattatg ccccggcgga cgtcttagaa tggaaatgct aagagatctt 7140 gttctatata aacgtgttga tttgagtaaa cttgttactc atgtatttga tggtgcagaa 7200 aatattgaaa aggccctttt gcttatgaaa aataagccaa aagatttaat taaatcagta 7260 gttacattct aaaaattcat ataaaaaaac tgtcgcatta aaaaaatgtc tcgaggcctg 7320 cagacatgca agcttggcac tggccgtcgt tttacaacgt cgtgactggg aaaaccctgg 7380 cgttacccaa cttaatcgcc ttgcagcaca tccccctttc gccagctggc gtaatagcga 7440 agaggcccgc accgatcgcc cttcccaaca gttgcgcagc ctgaatggcg aatggcgcta 7500 gcataaaaat aagaagcctg catttgcagg cttcttattt ttatggcgcg ccgcattcac 7560 ttcttttcta tataaatatg agcgaagcga ataagcgtcg gaaaagcagc aaaaagtttc 7620 ctttttgctg ttggagcatg ggggttcagg gggtgcagta tctgacgtca atgccgagcg 7680 aaagcgagcc gaagggtagc atttacgtta gataaccccc tgatatgctc cgacgcttta 7740 tatagaaaag aagattcaac taggtaaaat cttaatatag gttgagatga taaggtttat 7800 aaggaatttg tttgttctaa tttttcactc attttgttct aatttctttt aacaaatgtt 7860 cttttttttt tagaacagtt atgatatagt tagaatagtt taaaataagg agtgagaaaa 7920 ag 7922 <210> 49 <211> 4709 <212> DNA <213> synthetic plasmid <400> 49 gtttgccacc tgacgtctaa gaaaaggaat attcagcaat ttgcccgtgc cgaagaaagg 60 cccacccgtg aaggtgagcc agtgagttga ttgctacgta attagttagt tagcccttag 120 tgactcgtaa tacgactcac tatagggctc gaggcggccg cgcaacgcaa ttaatgtgag 180 ttagctcact cattaggcac cccaggcttt acactttatg cttccggctc gtatgttgtg 240 tggaattgtg agcggataac aatttcacac aggaaacaca tatgtttccg tgcaatgcct 300 atatcgaata tggtgataaa aatatgaaca gctttatcga agatgtggaa cagatctaca 360 acttcattaa aaagaacatt gatgtggaag aaaagatgca tttcattgaa acctataaac 420 agaaaagcaa catgaagaaa gagattagct ttagcgaaga atactataaa cagaagatta 480 tgaacggcaa aaatggcgtt gtgtacaccc cgccggaaat ggcggccttt atggttaaaa 540 atctgatcaa cgttaacgat gttattggca atccgtttat taaaatcatt gacccgagct 600 gcggtagcgg caatctgatt tgcaaatgtt ttctgtatct gaatcgcatc tttattaaga 660 acattgaggt gattaacagc aaaaataacc tgaatctgaa actggaagac atcagctacc 720 acatcgttcg caacaatctg tttggcttcg atattgacga aaccgcgatc aaagtgctga 780 aaattgatct gtttctgatc agcaaccaat ttagcgagaa aaatttccag gttaaagact 840 ttctggtgga aaatattgat cgcaaatatg acgtgttcat tggtaatccg ccgtatatcg 900 gtcacaaaag cgtggacagc agctacagct acgtgctgcg caaaatctac ggcagcatct 960 accgcgacaa aggcgatatc agctattgtt tctttcagaa gagcctgaaa tgtctgaagg 1020 aaggtggcaa actggtgttt gtgaccagcc gctacttctg cgagagctgc agcggtaaag 1080 aactgcgtaa attcctgatc gaaaacacga gcatttacaa gatcattgat ttttacggca 1140 tccgcccgtt caaacgcgtg ggtatcgatc cgatgattat ttttctggtt cgtacgaaga 1200 actggaacaa taacattgaa attattcgcc cgaacaagat tgaaaagaac gaaaagaaca 1260 aattcctgga tagcctgttc ctggacaaaa gcgaaaagtg taaaaagttt agcattagcc 1320 agaaaagcat taataacgat ggctgggttt tcgtggacga agtggagaaa aacattatcg 1380 acaaaatcaa agagaaaagc aagttcattc tgaaagatat ttgccatagc tgtcaaggca 1440 ttatcaccgg ttgtgatcgc gcctttattg tggaccgtga tatcatcaat agccgtaaga 1500 tcgaactgcg tctgattaaa ccgtggatta aaagcagcca tatccgtaag aatgaagtta 1560 ttaagggcga aaaattcatc atctatagca acctgattga gaatgaaacc gagtgtccga 1620 atgcgattaa atatatcgaa cagtacaaga aacgtctgat ggagcgccgc gaatgcaaaa 1680 agggcacgcg taagtggtat gaactgcaat ggggccgtaa accggaaatc ttcgaagaaa 1740 agaaaattgt tttcccgtat aaaagctgtg acaatcgttt tgcactggat aagggtagct 1800 attttagcgc agacatttat agcctggttc tgaagaaaaa tgtgccgttc acctatgaga 1860 tcctgctgaa tatcctgaat agcccgctgt acgagtttta ctttaagacc ttcgcgaaaa 1920 agctgggcga gaatctgtac gagtactatc cgaacaacct gatgaagctg tgcatcccga 1980 gcatcgattt cggcggtgag aacaatattg agaaaaagct gtatgatttc tttggtctga 2040 cggataaaga aattgagatt gtggagaaga tcaaagataa ctgctaagaa ttcgatatca 2100 cccgggaact agtctgcagc cctttagtga gggttaattg gagtcactaa gggttagtta 2160 gttagattag cagaaagtca aaagcctccg accggaggct tttgactaaa acttcccttg 2220 gggttatcat tggggctcac tcaaaggcgg taatcagata aaaaaaatcc ttagctttcg 2280 ctaaggatga tttctgctag agatggaata gactggatgg aggcggataa agttgcagga 2340 ccacttctgc gctcggccct tccggctggc tggtttattg ctgataaatc tggagccggt 2400 gagcgtgggt ctcgcggtat cattgcagca ctggggccag atggtaagcc ctcccgtatc 2460 gtagttatct acacgacggg gagtcaggca actatggatg aacgaaatag acagatcgct 2520 gagataggtg cctcactgat taagcattgg taactgtcag accaagttta ctcatatata 2580 ctttagattg atttaaaact tcatttttaa tttaaaagga tctaggtgaa gatccttttt 2640 gataatctca tgaccaaaat cccttaacgt gagttttcgt tccactgagc gtcagacccc 2700 ttaataagat gatcttcttg agatcgtttt ggtctgcgcg taatctcttg ctctgaaaac 2760 gaaaaaaccg ccttgcaggg cggtttttcg aaggttctct gagctaccaa ctctttgaac 2820 cgaggtaact ggcttggagg agcgcagtca ccaaaacttg tcctttcagt ttagccttaa 2880 ccggcgcatg acttcaagac taactcctct aaatcaatta ccagtggctg ctgccagtgg 2940 tgcttttgca tgtctttccg ggttggactc aagacgatag ttaccggata aggcgcagcg 3000 gtcggactga acggggggtt cgtgcataca gtccagcttg gagcgaactg cctacccgga 3060 actgagtgtc aggcgtggaa tgagacaaac gcggccataa cagcggaatg acaccggtaa 3120 accgaaaggc aggaacagga gagcgcacga gggagccgcc aggggaaacg cctggtatct 3180 ttatagtcct gtcgggtttc gccaccactg atttgagcgt cagatttcgt gatgcttgtc 3240 aggggggcgg agcctatgga aaaacggctt tgccgcggcc ctctcacttc cctgttaagt 3300 atcttcctgg catcttccag gaaatctccg ccccgttcgt aagccatttc cgctcgccgc 3360 agtcgaacga ccgagcgtag cgagtcagtg agcgaggaag cggaatatat cctgtatcac 3420 atattctgct gacgcaccgg tgcagccttt tttctcctgc cacatgaagc acttcactga 3480 caccctcatc agtgccaaca tagtaagcca gtatacactc cgctagcgct gaggtctgcc 3540 tcgtgaagaa ggtgttgctg actcatacca ggcctgaatc gccccatcat ccagccagaa 3600 agtgagggag ccacggttga tgagagcttt gttgtaggtg gaccagttgg tgattttgaa 3660 cttttgcttt gccacggaac ggtctgcgtt gtcgggaaga tgcgtgatct gatccttcaa 3720 ctcagcaaaa gttcgattta ttcaacaaag ccacgttgtg tctcaaaatc tctgatgtta 3780 cattgcacaa gataaaaata tatcatcatg aacaataaaa ctgtctgctt acataaacag 3840 taatacaagg ggtgtttact agaggttgat cgggcacgta agaggttcca actttcacca 3900 taatgaaata agatcactac cgggcgtatt ttttgagtta tcgagatttt caggagctaa 3960 ggaagctaaa atggagaaaa aaatcacggg atataccacc gttgatatat cccaatggca 4020 tcgtaaagaa cattttgagg catttcagtc agttgctcaa tgtacctata accagaccgt 4080 tcagctggat attacggcct ttttaaagac cgtaaagaaa aataagcaca agttttatcc 4140 ggcctttatt cacattcttg cccgcctgat gaacgctcac ccggagtttc gtatggccat 4200 gaaagacggt gagctggtga tctgggatag tgttcaccct tgttacaccg ttttccatga 4260 gcaaactgaa acgttttcgt ccctctggag tgaataccac gacgatttcc ggcagtttct 4320 ccacatatat tcgcaagatg tggcgtgtta cggtgaaaac ctggcctatt tccctaaagg 4380 gtttattgag aatatgtttt ttgtctcagc caatccctgg gtgagtttca ccagttttga 4440 tttaaacgtg gccaatatgg acaacttctt cgcccccgtt ttcacgatgg gcaaatatta 4500 tacgcaaggc gacaaggtgc tgatgccgct ggcgatccag gttcatcatg ccgtttgtga 4560 tggcttccat gtcggccgca tgcttaatga attacaacag tactgtgatg agtggcaggg 4620 cggggcgtaa taatactagc tccggcaaaa aaacgggcaa ggtgtcacca ccctgccctt 4680 tttctttaaa accgaaaaga ttacttcgc 4709 <210> 50 <211> 128 <212> DNA <213> e.coli <400> 50 gcggccgcgc aacgcaatta atgtgagtta gctcactcat taggcacccc aggctttaca 60 ctttatgctt ccggctcgta tgttgtgtgg aattgtgagc ggataacaat ttcacacagg 120 aaacacat 128 <210> 51 <211> 560 <212> DNA <213> Clostridium autoethanogenum <400> 51 ttataagaaa tcctaaggaa tatgatgtaa tgagtaaagc tataaatcct tatggagatg 60 gcaaggcagc ttatagaata acagaagcta ttttacaata ttttgattta gcaaaaggta 120 catatagtga gtttaaatca aattaaaaag ttataatttt caattttcat tctttttaaa 180 ggagattagc atacatttta tcataattat acagacaata tagtaatata tgatgttaaa 240 atatcaatat atggttaaaa atctgtatat tttttcccat tttaattatt tgtactataa 300 tattacactg agtgtattgt atatttaaaa aatatttggt acaattagtt agttaaataa 360 attctaaatt gtaaattatc agaatcctta ttaaggaaat acatagattt aaggagaaat 420 cataaaaagg tgtaatataa actggctaaa attgagcaaa aattgagcaa ttaagacttt 480 ttgattgtat ctttttatat atttaaggta tataatctta tttatattgg gggaacttga 540 tgaataaaca tattctagac 560 <210> 52 <211> 297 <212> DNA <213> Clostridium autoethanogenum <400> 52 taattttttg tgtcaataat ttttgttata ttattttaat taaatttttc acatgtataa 60 ttaaaagtaa gatagatatt ctaatgtact tacttaggta gaaaaacatg tatacaaaat 120 taaaaaacta ttataacaca tagtatcaat attgaaggta atactgttca atatcgatac 180 agataaaaaa atatataata cagaagaaaa aattataaat ttgtggtata atataaagta 240 tagtaattta agtttaaacc tcgtgaaaac gctaacaaat aataggaggt gtattat 297 <210> 53 <211> 599 <212> DNA <213> Clostridium autoethanogenum <400> 53 atagtataac tttaaaaaac tgtcttaaaa agttgttata taaaaaatgt tgacaattaa 60 acagctattt agtgcaaaac aaccataaaa atttaaaaaa taccataaat tacttgaaaa 120 atagttgata ataatgtaga gttataaaca aaggtgaaaa gcattacttg tattcttttt 180 tatatattat tataaattaa aatgaagctg tattagaaaa aatacacacc tgtaatataa 240 aattttaaat taatttttaa ttttttcaaa atgtatttta catgtttaga attttgatgt 300 atattaaaat agtagaatac ataagatact taatttaatt aaagatagtt aagtactttt 360 caatgtgctt ttttagatgt ttaatacaaa tctttaattg taaaagaaat gctgtactat 420 ttactgtact agtgacggga ttaaactgta ttaattataa ataaaaaata agtacagttg 480 tttaaaatta tattttgtat taaatctaat agtacgatgt aagttatttt atactattgc 540 tagtttaata aaaagattta attatatact tgaaaaggag aggaattttt atgcgtaaa 599 <210> 54 <211> 34 <212> DNA <213> Clostridium autoethanogenum <400> 54 tatttgtcga cttaggaggt tctattatga aagg 34 <210> 55 <211> 30 <212> DNA <213> Clostridium autoethanogenum <400> 55 aaaactcgag acattttttt aatgcgacag 30 <210> 56 <211> 560 <212> DNA <213> Clostridium ljungdahlii <400> 56 agatagtcat aatagttcca gaatagttta atttagcatt tggattaaat tcccatatgt 60 ttgttaaata tataccaaac tagtatagat atttttaaaa tactgtactt aaacagtagt 120 aatttacgta aaaaaatttt ttgatttttt taaaaaagtc cttttcaagt tgtacattat 180 tatggtaata tgtaattgaa gaagttgtgt agtaatattg taaacgtttc ttaatttatt 240 ttcatccatg tagtgcttaa aaaaccaaaa tatgtcacac gcaattgcat atttcaaaca 300 ataatattta ttttctcgtt aaattcacaa ataatttatt aataatatca ataaccaaga 360 ttatacttaa atggatgttt attttttaac attttttata gtaaatatat ttattttatg 420 tagtaaaaag gttataatta taattgtatt tattacaatt aattaaaata aaaaaatagg 480 gttttaggta aaattaagtt attttaagaa gtaattacaa caaaaattga agttatttct 540 ttaaggaggg aattattaaa 560 <210> 57 <211> 557 <212> DNA <213> Clostridium ragsdalei <400> 57 agatagtcat aatagttcca gaatagttta attttgaaat tggagtaaac ttccaaatgt 60 ttgttaaata tataccaaac tagtatagat attttttaaa tactagactt aaacagtaga 120 aatttgccta aaaaattttt tagtttttta aaaaaatcct tttcaagttg tacgttatta 180 tggtaatatg taattgaaga agttatgtaa taatattgta aacgtttctt aattttttta 240 catccatgta atgcttaaaa gaccaaaata tgtcacatgt aattgtatat ttcacataat 300 aatatttatt ttcttattaa attcacaaat aatttattaa taatatcaat aaccaagatt 360 atacttaaat ggatgtttat tttttaacat tttttatggt aaatatattt attttatgta 420 gtaaaaaggt tataattata attgtattta ttacaattaa ttaaaataaa aaatagggtt 480 ttaggtaaaa ttaagttatt ttaagaagta attacaacaa aaattgaagt tatttcttta 540 aggagggaat tattaaa 557 <210> 58 <211> 536 <212> DNA <213> Clostridium ljungdahlii <400> 58 ttataagaaa tcctaaggaa tatgatgtaa tgagtaaagc tataaatcct tatggagatg 60 gcaaggcagc ttatagaata acagaagcta ttttacaata ttttgattta gcaaaaggta 120 catatagtga gtttaaatca aattaaaaag ttataatttt caattttcat tctttttaaa 180 ggagattagc atacatttta tcataattat acagacaata tagtaatata tgatgttaaa 240 atatcaatat atggttaaaa atctgtatat tttttcccat tttaattatt tgtactataa 300 tattacactg agtgtattgt atatttaaaa aatatttggt acaattagtt agttaaataa 360 attctaaatt gtaaattatc agaatcctta ttaaggaaat acatagattt aaggagaaat 420 cataaaaagg tgtaatataa actggctaaa attgagcaaa aattgagcaa ttaagacttt 480 ttgattgtat ctttttatat atttaaggta tataatctta tttatattgg gggaac 536 <210> 59 <211> 549 <212> DNA <213> Clostridium ragsdalei <400> 59 ttataagaaa tcctaaggaa tatgatgtaa tgagtaaagc tataaatcct tatggagatg 60 gcaaggcagc ttatagaata acagaagcta ttttacaata ttttgattta gcaaaaggta 120 catatagtga gtttaaatca aattaaaaag ttataatttt gaattttcat tctttttaaa 180 ggagattagc atacatttta tcataattat acagacaata tagtaatata tgatgttaaa 240 atatcaatat atggttaaaa aactgtatat tttttcccat tttaattatt tgtactataa 300 tattacactg agtgtattgt atatttaaaa aatatttggt acaattagtt agttaaataa 360 attctaaatt ataaattatc agaaacctta ttaaggaaat acatagattt agggagaaat 420 aataaaaagg tgtaatataa actggctaaa gttgagtaat taagactttt aggttgtatc 480 tttttatata tttaaggtat ataatcttag ttatataggg ggaacttgat gaataaacat 540 attctagac 549 <210> 60 <211> 298 <212> DNA <213> Clostridium ljungdahlii <400> 60 taattttttg tgtcaataat ttttgttata ttattttaat taaatttttc acatgtataa 60 ttaaaagtaa gatagatatt ctaatgtact tacttaggta gaaaaacatg tatacaaaat 120 taaaaaacta ttataacaca tagtatcaat attgaaggta atactgttca atatcgatac 180 agataaaaaa aatatataat acagaagaaa aaattataaa tttgtggtat aatataaagt 240 atagtaattt aagtttaaac ctcgtgaaaa cgctaacaaa taataggagg tgtattat 298 <210> 61 <211> 300 <212> DNA <213> Clostridium ragsdalei <400> 61 taatttttta tatcaataat ttttattata ttattttaat taaatttttc acatgtataa 60 ttaaaagtaa gatagagata gttaggatat tttagtgcat ttatttagat aaaaaatatg 120 tatacaagat tagaaaaaaa ttataacaca taatagttgc attgaaggta atactgttca 180 atatcgatac agataaaaaa atttataata cagaagaaaa aaatataaat ttgtggtata 240 atataaaata taataattta gatttacacc ccgtgaaaac gctaacaaat aaatagggag 300 <210> 62 <211> 590 <212> DNA <213> Clostridium ljungdahlii <400> 62 atagtataac tttaaaaaac tgtcttaaaa agttgttata taaaaaatgt tgacaattaa 60 acagctattt agtgcaaaac aaccataaaa atttaaaaaa taccataaat tacttgaaaa 120 atagttgata ataatgtaga gttataaaca aaggtgaaaa gcattacttg tattcttttt 180 tatatattat tataaattaa aatgaagctg tattagaaaa aatacacacc tgtaatataa 240 aattttaaat taatttttaa ttttttcaaa atgtatttta catgtttaga attttgatgt 300 atattaaaat agtagaatac ataagatact taatttaatt aaagatagtt aagtactttt 360 caatgtgctt ttttagatgt ttaatacaaa tctttaattg taaaagaaat gctgtactat 420 ttactgtact agtgacggga ttaaactgta ttaattataa ataaaaaata agtacagttg 480 tttaaaatta tattttgtat taaatctaat agtacgatgt aagttatttt atactattgc 540 tagtttaata aaaagattta attatatact tgaaaaggag aggaattttt 590 <210> 63 <211> 600 <212> DNA <213> Clostridium ragsdalei <400> 63 atagaataac ttaaaaaaac tgtcttaaaa agctgttata taaaaaaatg ttaacaatta 60 aacagctatt tagtgcaaaa caaccataaa aatttaaaaa ataccataaa ttacttgaaa 120 aatagtagag aataatgtag agttataaac gaaggtgaaa agcattactt gtattccttt 180 ttacagacta ttataaatta agataaagct gtattaggaa aaatgcacac ctgtaatata 240 aggttttaaa ttaattttta attttcccaa aatgtatttt acatgtttag aattttgatg 300 tatattaaaa tagtagaata cataagatac ttaatttaat aaagatagtt aagtactttt 360 caatgtactt ttttagatat ttaatacaag tttttaattg taaaaaaatg ctgtgctatt 420 tactgtacta atggtagtac tatatctgta ttaattgtat gtaaaaagta agtatagtta 480 tttaagatta tgttttgtat taaatctaaa tagtacaatg taggttatgt tatactattg 540 ctagtttaat aaaaagattt aattatatac ttgaaaagga gaggaatttt tatgcgtaaa 600 <210> 64 <211> 25 <212> DNA <213> synthetic primer <400> 64 ttgatgaaat gatcactgac ggatt 25 <210> 65 <211> 25 <212> DNA <213> synthetic primer <400> 65 gaaatgttcc atctctcagc tatgt 25 <210> 66 <211> 25 <212> DNA <213> synthetic primer <400> 66 ctaatacgag gaggacatgt tgatg 25 <210> 67 <211> 25 <212> DNA <213> synthetic primer <400> 67 cacccatacc tgggacaatt ttatt 25 <210> 68 <211> 25 <212> DNA <213> synthetic primer <400> 68 gggctgctac taaaaatttc aatcc 25 <210> 69 <211> 25 <212> DNA <213> synthetic primer <400> 69 caggagtcat tatggcatct ctttt 25 <210> 70 <211> 25 <212> DNA <213> synthetic primer <400> 70 tagtaccaga gccacttgaa ttaga 25 <210> 71 <211> 25 <212> DNA <213> synthetic primer <400> 71 ggaatagctt gaccacattc tgtat 25 <210> 72 <211> 1647 <212> DNA <213> Lactococcus lactis <400> 72 atgtatacag taggagatta cctattagac cgattacacg agttaggaat tgaagaaatt 60 tttggagtcc ctggagacta taacttacaa tttttagatc aaattatttc ccacaaggat 120 atgaaatggg tcggaaatgc taatgaatta aatgcttcat atatggctga tggctatgct 180 cgtactaaaa aagctgccgc atttcttaca acctttggag taggtgaatt gagtgcagtt 240 aatggattag caggaagtta cgccgaaaat ttaccagtag tagaaatagt gggatcacct 300 acatcaaaag ttcaaaatga aggaaaattt gttcatcata cgctggctga cggtgatttt 360 aaacacttta tgaaaatgca cgaacctgtt acagcagctc gaactttact gacagcagaa 420 aatgcaaccg ttgaaattga ccgagtactt tctgcactat taaaagaaag aaaacctgtc 480 tatatcaact taccagttga tgttgctgct gcaaaagcag agaaaccctc actccctttg 540 aaaaaggaaa actcaacttc aaatacaagt gaccaagaaa ttttgaacaa aattcaagaa 600 agcttgaaaa atgccaaaaa accaatcgtg attacaggac atgaaataat tagttttggc 660 ttagaaaaaa cagtcactca atttatttca aagacaaaac tacctattac gacattaaac 720 tttggtaaaa gttcagttga tgaagccctc ccttcatttt taggaatcta taatggtaca 780 ctctcagagc ctaatcttaa agaattcgtg gaatcagccg acttcatctt gatgcttgga 840 gttaaactca cagactcttc aacaggagcc ttcactcatc atttaaatga aaataaaatg 900 atttcactga atatagatga aggaaaaata tttaacgaaa gaatccaaaa ttttgatttt 960 gaatccctca tctcctctct cttagaccta agcgaaatag aatacaaagg aaaatatatc 1020 gataaaaagc aagaagactt tgttccatca aatgcgcttt tatcacaaga ccgcctatgg 1080 caagcagttg aaaacctaac tcaaagcaat gaaacaatcg ttgctgaaca agggacatca 1140 ttctttggcg cttcatcaat tttcttaaaa tcaaagagtc attttattgg tcaaccctta 1200 tggggatcaa ttggatatac attcccagca gcattaggaa gccaaattgc agataaagaa 1260 agcagacacc ttttatttat tggtgatggt tcacttcaac ttacagtgca agaattagga 1320 ttagcaatca gagaaaaaat taatccaatt tgctttatta tcaataatga tggttataca 1380 gtcgaaagag aaattcatgg accaaatcaa agctacaatg atattccaat gtggaattac 1440 tcaaaattac cagaatcgtt tggagcaaca gaagatcgag tagtctcaaa aatcgttaga 1500 actgaaaatg aatttgtgtc tgtcatgaaa gaagctcaag cagatccaaa tagaatgtac 1560 tggattgagt taattttggc aaaagaaggt gcaccaaaag tactgaaaaa aatgggcaaa 1620 ctatttgctg aacaaaataa atcataa 1647 <210> 73 <211> 548 <212> PRT <213> Lactococcus lactis <400> 73 Met Tyr Thr Val Gly Asp Tyr Leu Leu Asp Arg Leu His Glu Leu Gly 1 5 10 15 Ile Glu Glu Ile Phe Gly Val Pro Gly Asp Tyr Asn Leu Gln Phe Leu 20 25 30 Asp Gln Ile Ile Ser His Lys Asp Met Lys Trp Val Gly Asn Ala Asn 35 40 45 Glu Leu Asn Ala Ser Tyr Met Ala Asp Gly Tyr Ala Arg Thr Lys Lys 50 55 60 Ala Ala Ala Phe Leu Thr Thr Phe Gly Val Gly Glu Leu Ser Ala Val 65 70 75 80 Asn Gly Leu Ala Gly Ser Tyr Ala Glu Asn Leu Pro Val Val Glu Ile 85 90 95 Val Gly Ser Pro Thr Ser Lys Val Gln Asn Glu Gly Lys Phe Val His 100 105 110 His Thr Leu Ala Asp Gly Asp Phe Lys His Phe Met Lys Met His Glu 115 120 125 Pro Val Thr Ala Ala Arg Thr Leu Leu Thr Ala Glu Asn Ala Thr Val 130 135 140 Glu Ile Asp Arg Val Leu Ser Ala Leu Leu Lys Glu Arg Lys Pro Val 145 150 155 160 Tyr Ile Asn Leu Pro Val Asp Val Ala Ala Ala Lys Ala Glu Lys Pro 165 170 175 Ser Leu Pro Leu Lys Lys Glu Asn Ser Thr Ser Asn Thr Ser Asp Gln 180 185 190 Glu Ile Leu Asn Lys Ile Gln Glu Ser Leu Lys Asn Ala Lys Lys Pro 195 200 205 Ile Val Ile Thr Gly His Glu Ile Ile Ser Phe Gly Leu Glu Lys Thr 210 215 220 Val Thr Gln Phe Ile Ser Lys Thr Lys Leu Pro Ile Thr Thr Leu Asn 225 230 235 240 Phe Gly Lys Ser Ser Val Asp Glu Ala Leu Pro Ser Phe Leu Gly Ile 245 250 255 Tyr Asn Gly Thr Leu Ser Glu Pro Asn Leu Lys Glu Phe Val Glu Ser 260 265 270 Ala Asp Phe Ile Leu Met Leu Gly Val Lys Leu Thr Asp Ser Ser Thr 275 280 285 Gly Ala Phe Thr His His Leu Asn Glu Asn Lys Met Ile Ser Leu Asn 290 295 300 Ile Asp Glu Gly Lys Ile Phe Asn Glu Arg Ile Gln Asn Phe Asp Phe 305 310 315 320 Glu Ser Leu Ile Ser Ser Leu Leu Asp Leu Ser Glu Ile Glu Tyr Lys 325 330 335 Gly Lys Tyr Ile Asp Lys Lys Gln Glu Asp Phe Val Pro Ser Asn Ala 340 345 350 Leu Leu Ser Gln Asp Arg Leu Trp Gln Ala Val Glu Asn Leu Thr Gln 355 360 365 Ser Asn Glu Thr Ile Val Ala Glu Gln Gly Thr Ser Phe Phe Gly Ala 370 375 380 Ser Ser Ile Phe Leu Lys Ser Lys Ser His Phe Ile Gly Gln Pro Leu 385 390 395 400 Trp Gly Ser Ile Gly Tyr Thr Phe Pro Ala Ala Leu Gly Ser Gln Ile 405 410 415 Ala Asp Lys Glu Ser Arg His Leu Leu Phe Ile Gly Asp Gly Ser Leu 420 425 430 Gln Leu Thr Val Gln Glu Leu Gly Leu Ala Ile Arg Glu Lys Ile Asn 435 440 445 Pro Ile Cys Phe Ile Ile Asn Asn Asp Gly Tyr Thr Val Glu Arg Glu 450 455 460 Ile His Gly Pro Asn Gln Ser Tyr Asn Asp Ile Pro Met Trp Asn Tyr 465 470 475 480 Ser Lys Leu Pro Glu Ser Phe Gly Ala Thr Glu Asp Arg Val Val Ser 485 490 495 Lys Ile Val Arg Thr Glu Asn Glu Phe Val Ser Val Met Lys Glu Ala 500 505 510 Gln Ala Asp Pro Asn Arg Met Tyr Trp Ile Glu Leu Ile Leu Ala Lys 515 520 525 Glu Gly Ala Pro Lys Val Leu Lys Lys Met Gly Lys Leu Phe Ala Glu 530 535 540 Gln Asn Lys Ser 545 <210> 74 <211> 2094 <212> DNA <213> Sacchromyces cerevisiae <400> 74 atgtctattc cagaaactca aaaagccatt atcttctacg aatccaacgg caagttggag 60 cataaggata tcccagttcc aaagccaaag cccaacgaat tgttaatcaa cgtcaagtac 120 tctggtgtct gccacaccga tttgcacgct tggcatggtg actggccatt gccaactaag 180 ttaccattag ttggtggtca cgaaggtgcc ggtgtcgttg tcggcatggg tgaaaacgtt 240 aagggctgga agatcggtga ctacgccggt atcaaatggt tgaacggttc ttgtatggcc 300 tgtgaatact gtgaattggg taacgaatcc aactgtcctc acgctgactt gtctggttac 360 acccacgacg gttctttcca agaatacgct accgctgacg ctgttcaagc cgctcacatt 420 cctcaaggta ctgacttggc tgaagtcgcg ccaatcttgt gtgctggtat caccgtatac 480 aaggctttga agtctgccaa cttgagagca ggccactggg cggccatttc tggtgctgct 540 ggtggtctag gttctttggc tgttcaatat gctaaggcga tgggttacag agtcttaggt 600 attgatggtg gtccaggaaa ggaagaattg tttacctcgc tcggtggtga agtattcatc 660 gacttcacca aagagaagga cattgttagc gcagtcgtta aggctaccaa cggcggtgcc 720 cacggtatca tcaatgtttc cgtttccgaa gccgctatcg aagcttctac cagatactgt 780 agggcgaacg gtactgttgt cttggttggt ttgccagccg gtgcaaagtg ctcctctgat 840 gtcttcaacc acgttgtcaa gtctatctcc attgtcggct cttacgtggg gaacagagct 900 gataccagag aagccttaga tttctttgcc agaggtctag tcaagtctcc aataaaggta 960 gttggcttat ccagtttacc agaaatttac gaaaagatgg agaagggcca aattgctggt 1020 agatacgttg ttgacacttc taaataaatg tctattccag aaactcaaaa agccattatc 1080 ttctacgaat ccaacggcaa gttggagcat aaggatatcc cagttccaaa gccaaagccc 1140 aacgaattgt taatcaacgt caagtactct ggtgtctgcc acaccgattt gcacgcttgg 1200 catggtgact ggccattgcc aactaagtta ccattagttg gtggtcacga aggtgccggt 1260 gtcgttgtcg gcatgggtga aaacgttaag ggctggaaga tcggtgacta cgccggtatc 1320 aaatggttga acggttcttg tatggcctgt gaatactgtg aattgggtaa cgaatccaac 1380 tgtcctcacg ctgacttgtc tggttacacc cacgacggtt ctttccaaga atacgctacc 1440 gctgacgctg ttcaagccgc tcacattcct caaggtactg acttggctga agtcgcgcca 1500 atcttgtgtg ctggtatcac cgtatacaag gctttgaagt ctgccaactt gagagcaggc 1560 cactgggcgg ccatttctgg tgctgctggt ggtctaggtt ctttggctgt tcaatatgct 1620 aaggcgatgg gttacagagt cttaggtatt gatggtggtc caggaaagga agaattgttt 1680 acctcgctcg gtggtgaagt attcatcgac ttcaccaaag agaaggacat tgttagcgca 1740 gtcgttaagg ctaccaacgg cggtgcccac ggtatcatca atgtttccgt ttccgaagcc 1800 gctatcgaag cttctaccag atactgtagg gcgaacggta ctgttgtctt ggttggtttg 1860 ccagccggtg caaagtgctc ctctgatgtc ttcaaccacg ttgtcaagtc tatctccatt 1920 gtcggctctt acgtggggaa cagagctgat accagagaag ccttagattt ctttgccaga 1980 ggtctagtca agtctccaat aaaggtagtt ggcttatcca gtttaccaga aatttacgaa 2040 aagatggaga agggccaaat tgctggtaga tacgttgttg acacttctaa ataa 2094 <210> 75 <211> 348 <212> PRT <213> Saccharomyces cerevisiae <400> 75 Met Ser Ile Pro Glu Thr Gln Lys Ala Ile Ile Phe Tyr Glu Ser Asn 1 5 10 15 Gly Lys Leu Glu His Lys Asp Ile Pro Val Pro Lys Pro Lys Pro Asn 20 25 30 Glu Leu Leu Ile Asn Val Lys Tyr Ser Gly Val Cys His Thr Asp Leu 35 40 45 His Ala Trp His Gly Asp Trp Pro Leu Pro Thr Lys Leu Pro Leu Val 50 55 60 Gly Gly His Glu Gly Ala Gly Val Val Val Gly Met Gly Glu Asn Val 65 70 75 80 Lys Gly Trp Lys Ile Gly Asp Tyr Ala Gly Ile Lys Trp Leu Asn Gly 85 90 95 Ser Cys Met Ala Cys Glu Tyr Cys Glu Leu Gly Asn Glu Ser Asn Cys 100 105 110 Pro His Ala Asp Leu Ser Gly Tyr Thr His Asp Gly Ser Phe Gln Glu 115 120 125 Tyr Ala Thr Ala Asp Ala Val Gln Ala Ala His Ile Pro Gln Gly Thr 130 135 140 Asp Leu Ala Glu Val Ala Pro Ile Leu Cys Ala Gly Ile Thr Val Tyr 145 150 155 160 Lys Ala Leu Lys Ser Ala Asn Leu Arg Ala Gly His Trp Ala Ala Ile 165 170 175 Ser Gly Ala Ala Gly Gly Leu Gly Ser Leu Ala Val Gln Tyr Ala Lys 180 185 190 Ala Met Gly Tyr Arg Val Leu Gly Ile Asp Gly Gly Pro Gly Lys Glu 195 200 205 Glu Leu Phe Thr Ser Leu Gly Gly Glu Val Phe Ile Asp Phe Thr Lys 210 215 220 Glu Lys Asp Ile Val Ser Ala Val Val Lys Ala Thr Asn Gly Gly Ala 225 230 235 240 His Gly Ile Ile Asn Val Ser Val Ser Glu Ala Ala Ile Glu Ala Ser 245 250 255 Thr Arg Tyr Cys Arg Ala Asn Gly Thr Val Val Leu Val Gly Leu Pro 260 265 270 Ala Gly Ala Lys Cys Ser Ser Asp Val Phe Asn His Val Val Lys Ser 275 280 285 Ile Ser Ile Val Gly Ser Tyr Val Gly Asn Arg Ala Asp Thr Arg Glu 290 295 300 Ala Leu Asp Phe Phe Ala Arg Gly Leu Val Lys Ser Pro Ile Lys Val 305 310 315 320 Val Gly Leu Ser Ser Leu Pro Glu Ile Tyr Glu Lys Met Glu Lys Gly 325 330 335 Gln Ile Ala Gly Arg Tyr Val Val Asp Thr Ser Lys 340 345 <210> 76 <211> 1650 <212> DNA <213> Lactococcus lactis <400> 76 catatgtata cagtaggaga ttacctatta gaccgattac acgagttagg aattgaagaa 60 atttttggag tccctggaga ctataactta caatttttag atcaaattat ttcccacaag 120 gatatgaaat gggtcggaaa tgctaatgaa ttaaatgctt catatatggc tgatggctat 180 gctcgtacta aaaaagctgc cgcatttctt acaacctttg gagtaggtga attgagtgca 240 gttaatggat tagcaggaag ttacgccgaa aatttaccag tagtagaaat agtgggatca 300 cctacatcaa aagttcaaaa tgaaggaaaa tttgttcatc atacgctggc tgacggtgat 360 tttaaacact ttatgaaaat gcacgaacct gttacagcag ctcgaacttt actgacagca 420 gaaaatgcaa ccgttgaaat tgaccgagta ctttctgcac tattaaaaga aagaaaacct 480 gtctatatca acttaccagt tgatgttgct gctgcaaaag cagagaaacc ctcactccct 540 ttgaaaaagg aaaactcaac ttcaaataca agtgaccaag aaattttgaa caaaattcaa 600 gaaagcttga aaaatgccaa aaaaccaatc gtgattacag gacatgaaat aattagtttt 660 ggcttagaaa aaacagtcac tcaatttatt tcaaagacaa aactacctat tacgacatta 720 aactttggta aaagttcagt tgatgaagcc ctcccttcat ttttaggaat ctataatggt 780 acactctcag agcctaatct taaagaattc gtggaatcag ccgacttcat cttgatgctt 840 ggagttaaac tcacagactc ttcaacagga gccttcactc atcatttaaa tgaaaataaa 900 atgatttcac tgaatataga tgaaggaaaa atatttaacg aaagaatcca aaattttgat 960 tttgaatccc tcatctcctc tctcttagac ctaagcgaaa tagaatacaa aggaaaatat 1020 atcgataaaa agcaagaaga ctttgttcca tcaaatgcgc ttttatcaca agaccgccta 1080 tggcaagcag ttgaaaacct aactcaaagc aatgaaacaa tcgttgctga acaagggaca 1140 tcattctttg gcgcttcatc aattttctta aaatcaaaga gtcattttat tggtcaaccc 1200 ttatggggat caattggata tacattccca gcagcattag gaagccaaat tgcagataaa 1260 gaaagcagac accttttatt tattggtgat ggttcacttc aacttacagt gcaagaatta 1320 ggattagcaa tcagagaaaa aattaatcca atttgcttta ttatcaataa tgatggttat 1380 acagtcgaaa gagaaattca tggaccaaat caaagctaca atgatattcc aatgtggaat 1440 tactcaaaat taccagaatc gtttggagca acagaagatc gagtagtctc aaaaatcgtt 1500 agaactgaaa atgaatttgt gtctgtcatg aaagaagctc aagcagatcc aaatagaatg 1560 tactggattg agttaatttt ggcaaaagaa ggtgcaccaa aagtactgaa aaaaatgggc 1620 aaactatttg ctgaacaaaa taaatcataa 1650 <210> 77 <211> 1047 <212> DNA <213> Saccharomyces cerevisiae <400> 77 atgtctattc cagaaactca aaaagccatt atcttctacg aatccaacgg caagttggag 60 cataaggata tcccagttcc aaagccaaag cccaacgaat tgttaatcaa cgtcaagtac 120 tctggtgtct gccacaccga tttgcacgct tggcatggtg actggccatt gccaactaag 180 ttaccattag ttggtggtca cgaaggtgcc ggtgtcgttg tcggcatggg tgaaaacgtt 240 aagggctgga agatcggtga ctacgccggt atcaaatggt tgaacggttc ttgtatggcc 300 tgtgaatact gtgaattggg taacgaatcc aactgtcctc acgctgactt gtctggttac 360 acccacgacg gttctttcca agaatacgct accgctgacg ctgttcaagc cgctcacatt 420 cctcaaggta ctgacttggc tgaagtcgcg ccaatcttgt gtgctggtat caccgtatac 480 aaggctttga agtctgccaa cttgagagca ggccactggg cggccatttc tggtgctgct 540 ggtggtctag gttctttggc tgttcaatat gctaaggcga tgggttacag agtcttaggt 600 attgatggtg gtccaggaaa ggaagaattg tttacctcgc tcggtggtga agtattcatc 660 gacttcacca aagagaagga cattgttagc gcagtcgtta aggctaccaa cggcggtgcc 720 cacggtatca tcaatgtttc cgtttccgaa gccgctatcg aagcttctac cagatactgt 780 agggcgaacg gtactgttgt cttggttggt ttgccagccg gtgcaaagtg ctcctctgat 840 gtcttcaacc acgttgtcaa gtctatctcc attgtcggct cttacgtggg gaacagagct 900 gataccagag aagccttaga tttctttgcc agaggtctag tcaagtctcc aataaaggta 960 gttggcttat ccagtttacc agaaatttac gaaaagatgg agaagggcca aattgctggt 1020 agatacgttg ttgacacttc taaataa 1047 <210> 78 <211> 2744 <212> DNA <213> Synthetic nucleic acid <400> 78 catatgtata cagtaggaga ttacctatta gaccgattac acgagttagg aattgaagaa 60 atttttggag tccctggaga ctataactta caatttttag atcaaattat ttcccacaag 120 gatatgaaat gggtcggaaa tgctaatgaa ttaaatgctt catatatggc tgatggctat 180 gctcgtacta aaaaagctgc cgcatttctt acaacctttg gagtaggtga attgagtgca 240 gttaatggat tagcaggaag ttacgccgaa aatttaccag tagtagaaat agtgggatca 300 cctacatcaa aagttcaaaa tgaaggaaaa tttgttcatc atacgctggc tgacggtgat 360 tttaaacact ttatgaaaat gcacgaacct gttacagcag ctcgaacttt actgacagca 420 gaaaatgcaa ccgttgaaat tgaccgagta ctttctgcac tattaaaaga aagaaaacct 480 gtctatatca acttaccagt tgatgttgct gctgcaaaag cagagaaacc ctcactccct 540 ttgaaaaagg aaaactcaac ttcaaataca agtgaccaag aaattttgaa caaaattcaa 600 gaaagcttga aaaatgccaa aaaaccaatc gtgattacag gacatgaaat aattagtttt 660 ggcttagaaa aaacagtcac tcaatttatt tcaaagacaa aactacctat tacgacatta 720 aactttggta aaagttcagt tgatgaagcc ctcccttcat ttttaggaat ctataatggt 780 acactctcag agcctaatct taaagaattc gtggaatcag ccgacttcat cttgatgctt 840 ggagttaaac tcacagactc ttcaacagga gccttcactc atcatttaaa tgaaaataaa 900 atgatttcac tgaatataga tgaaggaaaa atatttaacg aaagaatcca aaattttgat 960 tttgaatccc tcatctcctc tctcttagac ctaagcgaaa tagaatacaa aggaaaatat 1020 atcgataaaa agcaagaaga ctttgttcca tcaaatgcgc ttttatcaca agaccgccta 1080 tggcaagcag ttgaaaacct aactcaaagc aatgaaacaa tcgttgctga acaagggaca 1140 tcattctttg gcgcttcatc aattttctta aaatcaaaga gtcattttat tggtcaaccc 1200 ttatggggat caattggata tacattccca gcagcattag gaagccaaat tgcagataaa 1260 gaaagcagac accttttatt tattggtgat ggttcacttc aacttacagt gcaagaatta 1320 ggattagcaa tcagagaaaa aattaatcca atttgcttta ttatcaataa tgatggttat 1380 acagtcgaaa gagaaattca tggaccaaat caaagctaca atgatattcc aatgtggaat 1440 tactcaaaat taccagaatc gtttggagca acagaagatc gagtagtctc aaaaatcgtt 1500 agaactgaaa atgaatttgt gtctgtcatg aaagaagctc aagcagatcc aaatagaatg 1560 tactggattg agttaatttt ggcaaaagaa ggtgcaccaa aagtactgaa aaaaatgggc 1620 aaactatttg ctgaacaaaa taaatcataa gaattcaaaa aaaaaaaaaa aaaaaaaaaa 1680 aaaaaaaaaa aatgtctatt ccagaaactc aaaaagccat tatcttctac gaatccaacg 1740 gcaagttgga gcataaggat atcccagttc caaagccaaa gcccaacgaa ttgttaatca 1800 acgtcaagta ctctggtgtc tgccacaccg atttgcacgc ttggcatggt gactggccat 1860 tgccaactaa gttaccatta gttggtggtc acgaaggtgc cggtgtcgtt gtcggcatgg 1920 gtgaaaacgt taagggctgg aagatcggtg actacgccgg tatcaaatgg ttgaacggtt 1980 cttgtatggc ctgtgaatac tgtgaattgg gtaacgaatc caactgtcct cacgctgact 2040 tgtctggtta cacccacgac ggttctttcc aagaatacgc taccgctgac gctgttcaag 2100 ccgctcacat tcctcaaggt actgacttgg ctgaagtcgc gccaatcttg tgtgctggta 2160 tcaccgtata caaggctttg aagtctgcca acttgagagc aggccactgg gcggccattt 2220 ctggtgctgc tggtggtcta ggttctttgg ctgttcaata tgctaaggcg atgggttaca 2280 gagtcttagg tattgatggt ggtccaggaa aggaagaatt gtttacctcg ctcggtggtg 2340 aagtattcat cgacttcacc aaagagaagg acattgttag cgcagtcgtt aaggctacca 2400 acggcggtgc ccacggtatc atcaatgttt ccgtttccga agccgctatc gaagcttcta 2460 ccagatactg tagggcgaac ggtactgttg tcttggttgg tttgccagcc ggtgcaaagt 2520 gctcctctga tgtcttcaac cacgttgtca agtctatctc cattgtcggc tcttacgtgg 2580 ggaacagagc tgataccaga gaagccttag atttctttgc cagaggtcta gtcaagtctc 2640 caataaaggt agttggctta tccagtttac cagaaattta cgaaaagatg gagaagggcc 2700 aaattgctgg tagatacgtt gttgacactt ctaaataagg tacc 2744 <210> 79 <211> 479 <212> DNA <213> Clostridium autoethanogenum <400> 79 aatatgatat ttatgtccat tgtgaaaggg attatattca actattattc cagttacgtt 60 catagaaatt ttcctttcta aaatatttta ttccatgtca agaactctgt ttatttcatt 120 aaagaactat aagtacaaag tataaggcat ttgaaaaaat aggctagtat attgattgat 180 tatttatttt aaaatgccta agtgaaatat atacatatta taacaataaa ataagtatta 240 gtgtaggatt tttaaataga gtatctattt tcagattaaa tttttgatta tttgatttac 300 attatataat attgagtaaa gtattgacta gcaaaatttt ttgatacttt aatttgtgaa 360 atttcttatc aaaagttata tttttgaata atttttattg aaaaatacaa ctaaaaagga 420 ttatagtata agtgtgtgta attttgtgtt aaatttaaag ggaggaaatg aacatgaaa 479 <210> 80 <211> 28 <212> DNA <213> Synthetic primer <400> 80 gagcggccgc aatatgatat ttatgtcc 28 <210> 81 <211> 28 <212> DNA <213> Synthetic primer <400> 81 ttccatatgt ttcatgttca tttcctcc 28 <210> 82 <211> 3552 <212> DNA <213> Synthetic nucleic acid <400> 82 aaactccttt ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga 60 gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta 120 atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa 180 gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact 240 gttcttctag tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca 300 tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt 360 accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg 420 ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag 480 cgtgagctat gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta 540 agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat 600 ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg 660 tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc 720 ttttgctggc cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac 780 cgtattaccg cctttgagtg agctgatacc gctcgccgca gccgaacgac cgagcgcagc 840 gagtcagtga gcgaggaagc ggaagagcgc ccaatacgca gggccccctg caggataaaa 900 aaattgtaga taaattttat aaaatagttt tatctacaat ttttttatca ggaaacagct 960 atgaccgcgg ccgcaatatg atatttatgt ccattgtgaa agggattata ttcaactatt 1020 attccagtta cgttcataga aattttcctt tctaaaatat tttattccat gtcaagaact 1080 ctgtttattt cattaaagaa ctataagtac aaagtataag gcatttgaaa aaataggcta 1140 gtatattgat tgattattta ttttaaaatg cctaagtgaa atatatacat attataacaa 1200 taaaataagt attagtgtag gatttttaaa tagagtatct attttcagat taaatttttg 1260 attatttgat ttacattata taatattgag taaagtattg actagcaaaa ttttttgata 1320 ctttaatttg tgaaatttct tatcaaaagt tatatttttg aataattttt attgaaaaat 1380 acaactaaaa aggattatag tataagtgtg tgtaattttg tgttaaattt aaagggagga 1440 aatgaacatg aaacatatgg tgaccatgat tacgaattcg agctcggtac ccggggatcc 1500 tctagagtcg acgtcacgcg tccatggaga tctcgaggcc tgcagacatg caagcttggc 1560 actggccgtc gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg 1620 ccttgcagca catccccctt tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg 1680 cccttcccaa cagttgcgca gcctgaatgg cgaatggcgc tagcataaaa ataagaagcc 1740 tgcatttgca ggcttcttat ttttatggcg cgccgcattc acttcttttc tatataaata 1800 tgagcgaagc gaataagcgt cggaaaagca gcaaaaagtt tcctttttgc tgttggagca 1860 tgggggttca gggggtgcag tatctgacgt caatgccgag cgaaagcgag ccgaagggta 1920 gcatttacgt tagataaccc cctgatatgc tccgacgctt tatatagaaa agaagattca 1980 actaggtaaa atcttaatat aggttgagat gataaggttt ataaggaatt tgtttgttct 2040 aatttttcac tcattttgtt ctaatttctt ttaacaaatg ttcttttttt tttagaacag 2100 ttatgatata gttagaatag tttaaaataa ggagtgagaa aaagatgaaa gaaagatatg 2160 gaacagtcta taaaggctct cagaggctca tagacgaaga aagtggagaa gtcatagagg 2220 tagacaagtt ataccgtaaa caaacgtctg gtaacttcgt aaaggcatat atagtgcaat 2280 taataagtat gttagatatg attggcggaa aaaaacttaa aatcgttaac tatatcctag 2340 ataatgtcca cttaagtaac aatacaatga tagctacaac aagagaaata gcaaaagcta 2400 caggaacaag tctacaaaca gtaataacaa cacttaaaat cttagaagaa ggaaatatta 2460 taaaaagaaa aactggagta ttaatgttaa accctgaact actaatgaga ggcgacgacc 2520 aaaaacaaaa atacctctta ctcgaatttg ggaactttga gcaagaggca aatgaaatag 2580 attgacctcc caataacacc acgtagttat tgggaggtca atctatgaaa tgcgattaag 2640 ggccggccga agcaaactta agagtgtgtt gatagtgcag tatcttaaaa ttttgtataa 2700 taggaattga agttaaatta gatgctaaaa atttgtaatt aagaaggagt gattacatga 2760 acaaaaatat aaaatattct caaaactttt taacgagtga aaaagtactc aaccaaataa 2820 taaaacaatt gaatttaaaa gaaaccgata ccgtttacga aattggaaca ggtaaagggc 2880 atttaacgac gaaactggct aaaataagta aacaggtaac gtctattgaa ttagacagtc 2940 atctattcaa cttatcgtca gaaaaattaa aactgaatac tcgtgtcact ttaattcacc 3000 aagatattct acagtttcaa ttccctaaca aacagaggta taaaattgtt gggagtattc 3060 cttaccattt aagcacacaa attattaaaa aagtggtttt tgaaagccat gcgtctgaca 3120 tctatctgat tgttgaagaa ggattctaca agcgtacctt ggatattcac cgaacactag 3180 ggttgctctt gcacactcaa gtctcgattc agcaattgct taagctgcca gcggaatgct 3240 ttcatcctaa accaaaagta aacagtgtct taataaaact tacccgccat accacagatg 3300 ttccagataa atattggaag ctatatacgt actttgtttc aaaatgggtc aatcgagaat 3360 atcgtcaact gtttactaaa aatcagtttc atcaagcaat gaaacacgcc aaagtaaaca 3420 atttaagtac cgttacttat gagcaagtat tgtctatttt taatagttat ctattattta 3480 acgggaggaa ataattctat gagtcgcttt tgtaaatttg gaaagttaca cgttactaaa 3540 gggaatgtgt tt 3552 <210> 83 <211> 6263 <212> DNA <213> Synthetic nucleic acid <400> 83 aaactccttt ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga 60 gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta 120 atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa 180 gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact 240 gttcttctag tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca 300 tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt 360 accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg 420 ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag 480 cgtgagctat gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta 540 agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat 600 ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg 660 tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc 720 ttttgctggc cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac 780 cgtattaccg cctttgagtg agctgatacc gctcgccgca gccgaacgac cgagcgcagc 840 gagtcagtga gcgaggaagc ggaagagcgc ccaatacgca gggccccctg caggataaaa 900 aaattgtaga taaattttat aaaatagttt tatctacaat ttttttatca ggaaacagct 960 atgaccgcgg ccgcaatatg atatttatgt ccattgtgaa agggattata ttcaactatt 1020 attccagtta cgttcataga aattttcctt tctaaaatat tttattccat gtcaagaact 1080 ctgtttattt cattaaagaa ctataagtac aaagtataag gcatttgaaa aaataggcta 1140 gtatattgat tgattattta ttttaaaatg cctaagtgaa atatatacat attataacaa 1200 taaaataagt attagtgtag gatttttaaa tagagtatct attttcagat taaatttttg 1260 attatttgat ttacattata taatattgag taaagtattg actagcaaaa ttttttgata 1320 ctttaatttg tgaaatttct tatcaaaagt tatatttttg aataattttt attgaaaaat 1380 acaactaaaa aggattatag tataagtgtg tgtaattttg tgttaaattt aaagggagga 1440 aatgaacatg aaacatatgt atacagttgg tgattattta cttgatagat tacatgaact 1500 tggaatagaa gaaatttttg gtgtaccagg tgattacaat cttcaattct tagatcaaat 1560 aatatcacat aaggatatga aatgggttgg taatgctaat gaattaaatg catcatatat 1620 ggcagacgga tatgcaagaa ctaaaaaggc agcagcattt cttactacat ttggtgttgg 1680 tgaattaagt gcagtaaatg gattagctgg aagttacgca gaaaacttac cagttgttga 1740 aatagttgga tctcctacta gtaaagtaca aaatgaaggt aaatttgtac atcacactct 1800 tgcagatggt gattttaagc attttatgaa aatgcatgaa cctgttacag ctgcaagaac 1860 acttcttaca gctgaaaacg ctactgtaga aattgataga gttttatctg ctttacttaa 1920 agaaagaaag ccagtatata ttaaccttcc agtagatgta gcagcagcaa aagctgagaa 1980 accttcatta ccacttaaaa aggaaaattc aacatcaaat acatctgatc aagagatatt 2040 aaataaaatt caggaaagtc ttaaaaatgc aaagaaacct atagtaataa ctggacatga 2100 aataattagt tttggattag aaaagacagt tacacagttt ataagtaaaa ctaagcttcc 2160 aattacaact ttaaattttg gaaagagttc agtagatgag gcacttccat cattcttagg 2220 aatttataat ggaacattat ctgaacctaa tcttaaagaa tttgtagaga gtgctgattt 2280 tatattaatg ttaggtgtaa aacttactga tagtagtact ggtgcattta ctcatcatct 2340 taacgaaaat aagatgatat cattaaatat agacgaaggt aaaatattca atgaaagaat 2400 acagaacttt gattttgaat cacttatatc atcattactt gatttatcag agatagaata 2460 caaaggaaaa tatatagata aaaagcaaga agattttgtt ccatctaatg ctcttctttc 2520 tcaagataga ctttggcaag cagttgagaa tcttacacag tctaatgaaa ctatagttgc 2580 tgagcaagga acatcatttt tcggtgcatc aagtatattt ttaaaatcta aaagtcactt 2640 tattggacaa cctctttggg gttctattgg atatactttt ccagcagctt taggaagtca 2700 aatagctgat aaagaaagta gacatttatt atttattggt gacggttcac ttcagcttac 2760 agtacaagaa ttaggattag ctataagaga gaagataaat cctatttgtt tcataataaa 2820 caatgatgga tatactgtag aaagagaaat tcacggacca aatcagtcat ataatgatat 2880 tccaatgtgg aattattcaa agttacctga atctttcggt gctactgaag atagagtagt 2940 ttctaaaatt gttagaacag agaacgaatt tgtatctgtt atgaaagaag ctcaggctga 3000 ccctaataga atgtattgga ttgaattaat tttagcaaaa gaaggtgctc ctaaagtact 3060 taagaaaatg ggaaaattat ttgcagaaca aaataagtca taagaattcc cataataaag 3120 aaagaatttt aaataaagga ggaacaaaga tgagtatacc agaaacacaa aaagcaatta 3180 tattttatga gtcaaatgga aaattagagc ataaagatat acctgtacca aaaccaaaac 3240 caaacgaact tcttataaat gttaagtatt ctggtgtttg tcatactgat cttcatgcat 3300 ggcatggtga ttggcctctt ccaactaaat tacctcttgt aggtggtcat gaaggtgctg 3360 gtgtagttgt aggtatgggt gaaaatgtta aaggttggaa aataggtgat tatgctggaa 3420 ttaaatggct taatggatct tgtatggcat gcgagtattg tgaattagga aatgaaagta 3480 attgtccaca tgctgactta agtggttata ctcatgatgg atcttttcaa gaatatgcta 3540 ctgcagatgc agttcaggct gcacacattc cacagggaac tgatcttgct gaagtagctc 3600 ctatattatg cgctggaatt acagtataca aagcattaaa aagtgctaat cttagagcag 3660 gacactgggc agctataagt ggtgctgcag gtggtttagg atctttagca gttcaatatg 3720 ctaaagctat gggatataga gtattaggaa tagacggtgg tccaggaaaa gaagagttat 3780 ttacatcatt aggtggtgaa gtttttatag atttcacaaa ggaaaaagat attgtttcag 3840 ctgtagtaaa ggcaactaat ggtggtgcac acggaattat aaatgtttca gtatctgaag 3900 cagcaataga agcaagtact agatattgta gagcaaacgg aacagtagtt ttagttggac 3960 ttccagctgg tgcaaagtgt tcatctgacg tatttaacca tgtagtaaag agtatttcaa 4020 tagttggatc ttacgtaggt aatagagctg atacaagaga agctttagat ttctttgcaa 4080 gaggtttagt taagagtcct ataaaagtag taggactttc atcacttcct gaaatttatg 4140 aaaagatgga aaagggacaa atagctggta gatatgttgt agatacaagt aaataaggta 4200 cccggggatc ctctagagtc gacgtcacgc gtccatggag atctcgaggc ctgcagacat 4260 gcaagcttgg cactggccgt cgttttacaa cgtcgtgact gggaaaaccc tggcgttacc 4320 caacttaatc gccttgcagc acatccccct ttcgccagct ggcgtaatag cgaagaggcc 4380 cgcaccgatc gcccttccca acagttgcgc agcctgaatg gcgaatggcg ctagcataaa 4440 aataagaagc ctgcatttgc aggcttctta tttttatggc gcgccgcatt cacttctttt 4500 ctatataaat atgagcgaag cgaataagcg tcggaaaagc agcaaaaagt ttcctttttg 4560 ctgttggagc atgggggttc agggggtgca gtatctgacg tcaatgccga gcgaaagcga 4620 gccgaagggt agcatttacg ttagataacc ccctgatatg ctccgacgct ttatatagaa 4680 aagaagattc aactaggtaa aatcttaata taggttgaga tgataaggtt tataaggaat 4740 ttgtttgttc taatttttca ctcattttgt tctaatttct tttaacaaat gttctttttt 4800 ttttagaaca gttatgatat agttagaata gtttaaaata aggagtgaga aaaagatgaa 4860 agaaagatat ggaacagtct ataaaggctc tcagaggctc atagacgaag aaagtggaga 4920 agtcatagag gtagacaagt tataccgtaa acaaacgtct ggtaacttcg taaaggcata 4980 tatagtgcaa ttaataagta tgttagatat gattggcgga aaaaaactta aaatcgttaa 5040 ctatatccta gataatgtcc acttaagtaa caatacaatg atagctacaa caagagaaat 5100 agcaaaagct acaggaacaa gtctacaaac agtaataaca acacttaaaa tcttagaaga 5160 aggaaatatt ataaaaagaa aaactggagt attaatgtta aaccctgaac tactaatgag 5220 aggcgacgac caaaaacaaa aatacctctt actcgaattt gggaactttg agcaagaggc 5280 aaatgaaata gattgacctc ccaataacac cacgtagtta ttgggaggtc aatctatgaa 5340 atgcgattaa gggccggccg aagcaaactt aagagtgtgt tgatagtgca gtatcttaaa 5400 attttgtata ataggaattg aagttaaatt agatgctaaa aatttgtaat taagaaggag 5460 tgattacatg aacaaaaata taaaatattc tcaaaacttt ttaacgagtg aaaaagtact 5520 caaccaaata ataaaacaat tgaatttaaa agaaaccgat accgtttacg aaattggaac 5580 aggtaaaggg catttaacga cgaaactggc taaaataagt aaacaggtaa cgtctattga 5640 attagacagt catctattca acttatcgtc agaaaaatta aaactgaata ctcgtgtcac 5700 tttaattcac caagatattc tacagtttca attccctaac aaacagaggt ataaaattgt 5760 tgggagtatt ccttaccatt taagcacaca aattattaaa aaagtggttt ttgaaagcca 5820 tgcgtctgac atctatctga ttgttgaaga aggattctac aagcgtacct tggatattca 5880 ccgaacacta gggttgctct tgcacactca agtctcgatt cagcaattgc ttaagctgcc 5940 agcggaatgc tttcatccta aaccaaaagt aaacagtgtc ttaataaaac ttacccgcca 6000 taccacagat gttccagata aatattggaa gctatatacg tactttgttt caaaatgggt 6060 caatcgagaa tatcgtcaac tgtttactaa aaatcagttt catcaagcaa tgaaacacgc 6120 caaagtaaac aatttaagta ccgttactta tgagcaagta ttgtctattt ttaatagtta 6180 tctattattt aacgggagga aataattcta tgagtcgctt ttgtaaattt ggaaagttac 6240 acgttactaa agggaatgtg ttt 6263 <210> 84 <211> 4630 <212> DNA <213> Synthetic nucleic acid <400> 84 aaactccttt ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga 60 gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta 120 atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa 180 gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact 240 gttcttctag tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca 300 tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt 360 accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg 420 ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag 480 cgtgagctat gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta 540 agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat 600 ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg 660 tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc 720 ttttgctggc cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac 780 cgtattaccg cctttgagtg agctgatacc gctcgccgca gccgaacgac cgagcgcagc 840 gagtcagtga gcgaggaagc ggaagagcgc ccaatacgca gggccccctg caggataaaa 900 aaattgtaga taaattttat aaaatagttt tatctacaat ttttttatca ggaaacagct 960 atgaccgcgg ccgcaatatg atatttatgt ccattgtgaa agggattata ttcaactatt 1020 attccagtta cgttcataga aattttcctt tctaaaatat tttattccat gtcaagaact 1080 ctgtttattt cattaaagaa ctataagtac aaagtataag gcatttgaaa aaataggcta 1140 gtatattgat tgattattta ttttaaaatg cctaagtgaa atatatacat attataacaa 1200 taaaataagt attagtgtag gatttttaaa tagagtatct attttcagat taaatttttg 1260 attatttgat ttacattata taatattgag taaagtattg actagcaaaa ttttttgata 1320 ctttaatttg tgaaatttct tatcaaaagt tatatttttg aataattttt attgaaaaat 1380 acaactaaaa aggattatag tataagtgtg tgtaattttg tgttaaattt aaagggagga 1440 aatgaacatg aaacatatgt atacagttgg tgattattta cttgatagat tacatgaact 1500 tggaatagaa gaaatttttg gtgtaccagg tgattacaat cttcaattct tagatcaaat 1560 aatatcacat aaggatatga aatgggttgg taatgctaat gaattaaatg catcatatat 1620 ggcagacgga tatgcaagaa ctaaaaaggc agcagcattt cttactacat ttggtgttgg 1680 tgaattaagt gcagtaaatg gattagctgg aagttacgca gaaaacttac cagttgttga 1740 aatagttgga tctcctacta gtaaagtaca aaatgaaggt aaatttgtac atcacactct 1800 tgcagatggt gattttaagc attttatgaa aatgcatgaa cctgttacag ctgcaagaac 1860 acttcttaca gctgaaaacg ctactgtaga aattgataga gttttatctg ctttacttaa 1920 agaaagaaag ccagtatata ttaaccttcc agtagatgta gcagcagcaa aagctgagaa 1980 accttcatta ccacttaaaa aggaaaattc aacatcaaat acatctgatc aagagatatt 2040 aaataaaatt caggaaagtc ttaaaaatgc aaagaaacct atagtaataa ctggacatga 2100 aataattagt tttggattag aaaagacagt tacacagttt ataagtaaaa ctaagcttcc 2160 aattacaact ttaaattttg gaaagagttc agtagatgag gcacttccat cattcttagg 2220 aatttataat ggaacattat ctgaacctaa tcttaaagaa tttgtagaga gtgctgattt 2280 tatattaatg ttaggtgtaa aacttactga tagtagtact ggtgcattta ctcatcatct 2340 taacgaaaat aagatgatat cattaaatat agacgaaggt aaaatattca atgaaagaat 2400 acagaacttt gattttgaat cacttatatc atcattactt gatttatcag agatagaata 2460 caaaggaaaa tatatagata aaaagcaaga agattttgtt ccatctaatg ctcttctttc 2520 tcaagataga ctttggcaag cagttgagaa tcttacacag tctaatgaaa ctatagttgc 2580 tgagcaagga acatcatttt tcggtgcatc aagtatattt ttaaaatcta aaagtcactt 2640 tattggacaa cctctttggg gttctattgg atatactttt ccagcagctt taggaagtca 2700 aatagctgat aaagaaagta gacatttatt atttattggt gacggttcac ttcagcttac 2760 agtacaagaa ttaggattag ctataagaga gaagataaat cctatttgtt tcataataaa 2820 caatgatgga tatactgtag aaagagaaat tcacggacca aatcagtcat ataatgatat 2880 tccaatgtgg aattattcaa agttacctga atctttcggt gctactgaag atagagtagt 2940 ttctaaaatt gttagaacag agaacgaatt tgtatctgtt atgaaagaag ctcaggctga 3000 ccctaataga atgtattgga ttgaattaat tttagcaaaa gaaggtgctc ctaaagtact 3060 taagaaaatg ggaaaattat ttgcagaaca aaataagtca taagaatttg tttgttctaa 3120 tttttcactc attttgttct aatttctttt aacaaatgtt cttttttttt tagaacagtt 3180 atgatatagt tagaatagtt taaaataagg agtgagaaaa agatgaaaga aagatatgga 3240 acagtctata aaggctctca gaggctcata gacgaagaaa gtggagaagt catagaggta 3300 gacaagttat accgtaaaca aacgtctggt aacttcgtaa aggcatatat agtgcaatta 3360 ataagtatgt tagatatgat tggcggaaaa aaacttaaaa tcgttaacta tatcctagat 3420 aatgtccact taagtaacaa tacaatgata gctacaacaa gagaaatagc aaaagctaca 3480 ggaacaagtc tacaaacagt aataacaaca cttaaaatct tagaagaagg aaatattata 3540 aaaagaaaaa ctggagtatt aatgttaaac cctgaactac taatgagagg cgacgaccaa 3600 aaacaaaaat acctcttact cgaatttggg aactttgagc aagaggcaaa tgaaatagat 3660 tgacctccca ataacaccac gtagttattg ggaggtcaat ctatgaaatg cgattaaggg 3720 ccggccgaag caaacttaag agtgtgttga tagtgcagta tcttaaaatt ttgtataata 3780 ggaattgaag ttaaattaga tgctaaaaat ttgtaattaa gaaggagtga ttacatgaac 3840 aaaaatataa aatattctca aaacttttta acgagtgaaa aagtactcaa ccaaataata 3900 aaacaattga atttaaaaga aaccgatacc gtttacgaaa ttggaacagg taaagggcat 3960 ttaacgacga aactggctaa aataagtaaa caggtaacgt ctattgaatt agacagtcat 4020 ctattcaact tatcgtcaga aaaattaaaa ctgaatactc gtgtcacttt aattcaccaa 4080 gatattctac agtttcaatt ccctaacaaa cagaggtata aaattgttgg gagtattcct 4140 taccatttaa gcacacaaat tattaaaaaa gtggtttttg aaagccatgc gtctgacatc 4200 tatctgattg ttgaagaagg attctacaag cgtaccttgg atattcaccg aacactaggg 4260 ttgctcttgc acactcaagt ctcgattcag caattgctta agctgccagc ggaatgcttt 4320 catcctaaac caaaagtaaa cagtgtctta ataaaactta cccgccatac cacagatgtt 4380 ccagataaat attggaagct atatacgtac tttgtttcaa aatgggtcaa tcgagaatat 4440 cgtcaactgt ttactaaaaa tcagtttcat caagcaatga aacacgccaa agtaaacaat 4500 ttaagtaccg ttacttatga gcaagtattg tctattttta atagttatct attatttaac 4560 gggaggaaat aattctatga gtcgcttttg taaatttgga aagttacacg ttactaaagg 4620 gaatgtgttt 4630 <210> 85 <211> 23 <212> DNA <213> Synthetic primer <400> 85 tcagttccct gtggaatgtg tgc 23 <210> 86 <211> 22 <212> DNA <213> Synthetic primer <400> 86 tcagtagcac cgaaagattc ag 22 <210> 87 <211> 21 <212> DNA <213> Synthetic primer <400> 87 agtgcctcat ctactgaact c 21 <210> 88 <211> 36 <212> DNA <213> Synthetic primer <400> 88 attagtttaa acacgccagc aacgcggcct ttttac 36 <210> 89 <211> 27 <212> DNA <213> Synthetic primer <400> 89 tcctattcca aggtttacga gttggtc 27 <210> 90 <211> 27 <212> DNA <213> Synthetic primer <400> 90 acccccaacc ataattgtca tgccatc 27 <210> 91 <211> 27 <212> DNA <213> Synthetic primer <400> 91 tgcaagagca aactcatctt gttcttc 27 <210> 92 <211> 43 <212> DNA <213> Synthetic primer <400> 92 agggtgcggc cgcgattcat atatccataa tctttaagtt atc 43 <210> 93 <211> 38 <212> DNA <213> Synthetic primer <400> 93 atcttctgca gggccgcaga tagtcataat agttccag 38 <210> 94 <211> 43 <212> DNA <213> Synthetic primer <400> 94 agggtgcggc cgcgattcat atatccataa tctttaagtt atc 43 <210> 95 <211> 7655 <212> DNA <213> Synthetic nucleic acid <400> 95 aaactccttt ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga 60 gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta 120 atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa 180 gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact 240 gttcttctag tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca 300 tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt 360 accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg 420 ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag 480 cgtgagctat gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta 540 agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat 600 ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg 660 tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc 720 ttttgctggc cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac 780 cgtattaccg cctttgagtg agctgatacc gctcgccgca gccgaacgac cgagcgcagc 840 gagtcagtga gcgaggaagc ggaagagcgc ccaatacgca gggccccctg cagggccgca 900 gatagtcata atagttccag aatagttcaa tttagaaatt agactaaact tcaaaatgtt 960 tgttaaatat ataccaaact agtatagata ttttttaaat actggactta aacagtagta 1020 atttgcctaa aaaatttttt caattttttt taaaaaatcc ttttcaagtt gtacattgtt 1080 atggtaatat gtaattgaag aagttatgta gtaatattgt aaacgtttct tgattttttt 1140 acatccatgt agtgcttaaa aaaccaaaat atgtcacatg caattgtata tttcaaataa 1200 caatatttat tttctcgtta aattcacaaa taatttatta ataatatcaa taaccaagat 1260 tatacttaaa tggatgttta ttttttaaca cttttatagt aaatatattt attttatgta 1320 gtaaaaaggt tataattata attgtattta ttacaattaa ttaaaataaa aaatagggtt 1380 ttaggtaaaa ttaagttatt ttaagaagta attacaataa aaattgaagt tatttcttta 1440 aggagggaat tattcatatg aaagaagttg taatagctag tgcagtaaga acagcgattg 1500 gatcttatgg aaagtctctt aaggatgtac cagcagtaga tttaggagct acagctataa 1560 aggaagcagt taaaaaagca ggaataaaac cagaggatgt taatgaagtc attttaggaa 1620 atgttcttca agcaggttta ggacagaatc cagcaagaca ggcatctttt aaagcaggat 1680 taccagttga aattccagct atgactatta ataaggtttg tggttcagga cttagaacag 1740 ttagcttagc agcacaaatt ataaaagcag gagatgctga cgtaataata gcaggtggta 1800 tggaaaatat gtctagagct ccttacttag cgaataacgc tagatgggga tatagaatgg 1860 gaaacgctaa atttgttgat gaaatgatca ctgacggatt gtgggatgca tttaatgatt 1920 accacatggg aataacagca gaaaacatag ctgagagatg gaacatttca agagaagaac 1980 aagatgagtt tgctcttgca tcacaaaaaa aagctgaaga agctataaaa tcaggtcaat 2040 ttaaagatga aatagttcct gtagtaatta aaggcagaaa gggagaaact gtagttgata 2100 cagatgagca ccctagattt ggatcaacta tagaaggact tgcaaaatta aaacctgcct 2160 tcaaaaaaga tggaacagtt acagctggta atgcatcagg attaaatgac tgtgcagcag 2220 tacttgtaat catgagtgca gaaaaagcta aagagcttgg agtaaaacca cttgctaaga 2280 tagtttctta tggttcagca ggagttgacc cagcaataat gggatatgga cctttctatg 2340 caacaaaagc agctattgaa aaagcaggtt ggacagttga tgaattagat ttaatagaat 2400 caaatgaagc ttttgcagct caaagtttag cagtagcaaa agatttaaaa tttgatatga 2460 ataaagtaaa tgtaaatgga ggagctattg cccttggtca tccaattgga gcatcaggtg 2520 caagaatact cgttactctt gtacacgcaa tgcaaaaaag agatgcaaaa aaaggcttag 2580 caactttatg tataggtggc ggacaaggaa cagcaatatt gctagaaaag tgctaggaat 2640 tcgagctcgg taccagggag atattaaaat gaataaatta gtaaaattaa cagatttaaa 2700 gcgcattttc aaagatggca tgacaattat ggttgggggt tttttagatt gtggaactcc 2760 tgaaaatatt atagatatgc tagttgattt aaatataaaa aatctgacta ttataagcaa 2820 tgatacagct tttcctaata aaggaatagg aaaacttatt gtaaatggtc aagtttctaa 2880 agtaattgct tcacatattg gaactaatcc tgaaactgga aaaaaaatga gctctggaga 2940 acttaaagtt gagctttccc cacaaggaac actgattgaa agaattcgtg cagctggatc 3000 tggactcgga ggtgtattaa ctccaactgg acttggaact atcgttgaag aaggtaagaa 3060 aaaagttact atcgatggca aagaatatct attagaactt cctttatctg ctgatgtttc 3120 attaataaaa ggtagcattg tagatgaatt tggaaatacc ttctataggg ctgctactaa 3180 aaatttcaat ccatatatgg caatggctgc aaaaacagtt atagttgaag cagaaaattt 3240 agttaaatgt gaagatttaa aaagagatgc cataatgact cctggcgtat tagtagatta 3300 tatcgttaag gaggcggctt aattgattgt agataaagtt ttagcaaaag agataattgc 3360 caaaagagtt gcaaaagaac taaaaaaaga ccaactcgta aaccttggaa taggacttcc 3420 aactttagta gcaaattatg taccaaaaga aatgaacatt acttttgaat cagaaaatgg 3480 catggttggt atggcacaaa tggcatcatc aggtgaaaat gacccagata taataaatgc 3540 tggcggggaa tatgtaacat tattacctca aggttcattt tttgatagtt caatgtcttt 3600 cgcactaata cgaggaggac atgttgatgt tgctgttctt ggtgctctag aagttgatga 3660 aaaaggtaat ttagctaact ggattgttcc aaataaaatt gtcccaggta tgggtggcgc 3720 tatggattta gcaataggcg caaaaaaaat aatagtggca atgcaacata caggaaaaag 3780 taaacctaaa atcgttaaaa aatgtactct cccacttact gctaaggctc aagtggattt 3840 aattgtcaca gaactttgtg taattgatgt aacaaatgac ggcttacttt taaaagaaat 3900 tcataaagat acaactattg atgaaattaa atttttaaca gatgcagatt taattattcc 3960 agataactta aagattatgg atatatgaat cgcggccgca atatgatatt tatgtccatt 4020 gtgaaaggga ttatattcaa ctattattcc agttacgttc atagaaattt tcctttctaa 4080 aatattttat tccatgtcaa gaactctgtt tatttcatta aagaactata agtacaaagt 4140 ataaggcatt tgaaaaaata ggctagtata ttgattgatt atttatttta aaatgcctaa 4200 gtgaaatata tacatattat aacaataaaa taagtattag tgtaggattt ttaaatagag 4260 tatctatttt cagattaaat ttttgattat ttgatttaca ttatataata ttgagtaaag 4320 tattgactag caaaattttt tgatacttta atttgtgaaa tttcttatca aaagttatat 4380 ttttgaataa tttttattga aaaatacaac taaaaaggat tatagtataa gtgtgtgtaa 4440 ttttgtgtta aatttaaagg gaggaaatga acatgaaaca tatgtataca gttggtgatt 4500 atttacttga tagattacat gaacttggaa tagaagaaat ttttggtgta ccaggtgatt 4560 acaatcttca attcttagat caaataatat cacataagga tatgaaatgg gttggtaatg 4620 ctaatgaatt aaatgcatca tatatggcag acggatatgc aagaactaaa aaggcagcag 4680 catttcttac tacatttggt gttggtgaat taagtgcagt aaatggatta gctggaagtt 4740 acgcagaaaa cttaccagtt gttgaaatag ttggatctcc tactagtaaa gtacaaaatg 4800 aaggtaaatt tgtacatcac actcttgcag atggtgattt taagcatttt atgaaaatgc 4860 atgaacctgt tacagctgca agaacacttc ttacagctga aaacgctact gtagaaattg 4920 atagagtttt atctgcttta cttaaagaaa gaaagccagt atatattaac cttccagtag 4980 atgtagcagc agcaaaagct gagaaacctt cattaccact taaaaaggaa aattcaacat 5040 caaatacatc tgatcaagag atattaaata aaattcagga aagtcttaaa aatgcaaaga 5100 aacctatagt aataactgga catgaaataa ttagttttgg attagaaaag acagttacac 5160 agtttataag taaaactaag cttccaatta caactttaaa ttttggaaag agttcagtag 5220 atgaggcact tccatcattc ttaggaattt ataatggaac attatctgaa cctaatctta 5280 aagaatttgt agagagtgct gattttatat taatgttagg tgtaaaactt actgatagta 5340 gtactggtgc atttactcat catcttaacg aaaataagat gatatcatta aatatagacg 5400 aaggtaaaat attcaatgaa agaatacaga actttgattt tgaatcactt atatcatcat 5460 tacttgattt atcagagata gaatacaaag gaaaatatat agataaaaag caagaagatt 5520 ttgttccatc taatgctctt ctttctcaag atagactttg gcaagcagtt gagaatctta 5580 cacagtctaa tgaaactata gttgctgagc aaggaacatc atttttcggt gcatcaagta 5640 tatttttaaa atctaaaagt cactttattg gacaacctct ttggggttct attggatata 5700 cttttccagc agctttagga agtcaaatag ctgataaaga aagtagacat ttattattta 5760 ttggtgacgg ttcacttcag cttacagtac aagaattagg attagctata agagagaaga 5820 taaatcctat ttgtttcata ataaacaatg atggatatac tgtagaaaga gaaattcacg 5880 gaccaaatca gtcatataat gatattccaa tgtggaatta ttcaaagtta cctgaatctt 5940 tcggtgctac tgaagataga gtagtttcta aaattgttag aacagagaac gaatttgtat 6000 ctgttatgaa agaagctcag gctgacccta atagaatgta ttggattgaa ttaattttag 6060 caaaagaagg tgctcctaaa gtacttaaga aaatgggaaa attatttgca gaacaaaata 6120 agtcataaga atttgtttgt tctaattttt cactcatttt gttctaattt cttttaacaa 6180 atgttctttt ttttttagaa cagttatgat atagttagaa tagtttaaaa taaggagtga 6240 gaaaaagatg aaagaaagat atggaacagt ctataaaggc tctcagaggc tcatagacga 6300 agaaagtgga gaagtcatag aggtagacaa gttataccgt aaacaaacgt ctggtaactt 6360 cgtaaaggca tatatagtgc aattaataag tatgttagat atgattggcg gaaaaaaact 6420 taaaatcgtt aactatatcc tagataatgt ccacttaagt aacaatacaa tgatagctac 6480 aacaagagaa atagcaaaag ctacaggaac aagtctacaa acagtaataa caacacttaa 6540 aatcttagaa gaaggaaata ttataaaaag aaaaactgga gtattaatgt taaaccctga 6600 actactaatg agaggcgacg accaaaaaca aaaatacctc ttactcgaat ttgggaactt 6660 tgagcaagag gcaaatgaaa tagattgacc tcccaataac accacgtagt tattgggagg 6720 tcaatctatg aaatgcgatt aagggccggc cgaagcaaac ttaagagtgt gttgatagtg 6780 cagtatctta aaattttgta taataggaat tgaagttaaa ttagatgcta aaaatttgta 6840 attaagaagg agtgattaca tgaacaaaaa tataaaatat tctcaaaact ttttaacgag 6900 tgaaaaagta ctcaaccaaa taataaaaca attgaattta aaagaaaccg ataccgttta 6960 cgaaattgga acaggtaaag ggcatttaac gacgaaactg gctaaaataa gtaaacaggt 7020 aacgtctatt gaattagaca gtcatctatt caacttatcg tcagaaaaat taaaactgaa 7080 tactcgtgtc actttaattc accaagatat tctacagttt caattcccta acaaacagag 7140 gtataaaatt gttgggagta ttccttacca tttaagcaca caaattatta aaaaagtggt 7200 ttttgaaagc catgcgtctg acatctatct gattgttgaa gaaggattct acaagcgtac 7260 cttggatatt caccgaacac tagggttgct cttgcacact caagtctcga ttcagcaatt 7320 gcttaagctg ccagcggaat gctttcatcc taaaccaaaa gtaaacagtg tcttaataaa 7380 acttacccgc cataccacag atgttccaga taaatattgg aagctatata cgtactttgt 7440 ttcaaaatgg gtcaatcgag aatatcgtca actgtttact aaaaatcagt ttcatcaagc 7500 aatgaaacac gccaaagtaa acaatttaag taccgttact tatgagcaag tattgtctat 7560 ttttaatagt tatctattat ttaacgggag gaaataattc tatgagtcgc ttttgtaaat 7620 ttggaaagtt acacgttact aaagggaatg tgttt 7655 <210> 96 <211> 35 <212> DNA <213> Synthetic primer <400> 96 acgttggatc caggaggaac aaagatgagt atacc 35 <210> 97 <211> 39 <212> DNA <213> Synthetic primer <400> 97 agcgtccatg gccttattta cttgtatcta caacatatc 39 <210> 98 <211> 8621 <212> DNA <213> Synthetic nucleic acid <400> 98 ccagtgggca agttgaaaaa ttcacaaaaa tgtggtataa tatctttgtt cattagagcg 60 ataaacttga atttgagagg gaacttagat ggtatttgaa aaaattgata aaaatagttg 120 gaacagaaaa gagtattttg accactactt tgcaagtgta ccttgtacct acagcatgac 180 cgttaaagtg gatatcacac aaataaagga aaagggaatg aaactatatc ctgcaatgct 240 ttattatatt gcaatgattg taaaccgcca ttcagagttt aggacggcaa tcaatcaaga 300 tggtgaattg gggatatatg atgagatgat accaagctat acaatatttc acaatgatac 360 tgaaacattt tccagccttt ggactgagtg taagtctgac tttaaatcat ttttagcaga 420 ttatgaaagt gatacgcaac ggtatggaaa caatcataga atggaaggaa agccaaatgc 480 tccggaaaac atttttaatg tatctatgat accgtggtca accttcgatg gctttaatct 540 gaatttgcag aaaggatatg attatttgat tcctattttt actatgggga aatattataa 600 agaagataac aaaattatac ttcctttggc aattcaagtt catcacgcag tatgtgacgg 660 atttcacatt tgccgttttg taaacgaatt gcaggaattg ataaatagtt aacttcaggt 720 ttgtctgtaa ctaaaaacaa gtatttaagc aaaaacatcg tagaaatacg gtgttttttg 780 ttaccctaag tttaaactcc tttttgataa tctcatgacc aaaatccctt aacgtgagtt 840 ttcgttccac tgagcgtcag accccgtaga aaagatcaaa ggatcttctt gagatccttt 900 ttttctgcgc gtaatctgct gcttgcaaac aaaaaaacca ccgctaccag cggtggtttg 960 tttgccggat caagagctac caactctttt tccgaaggta actggcttca gcagagcgca 1020 gataccaaat actgttcttc tagtgtagcc gtagttaggc caccacttca agaactctgt 1080 agcaccgcct acatacctcg ctctgctaat cctgttacca gtggctgctg ccagtggcga 1140 taagtcgtgt cttaccgggt tggactcaag acgatagtta ccggataagg cgcagcggtc 1200 gggctgaacg gggggttcgt gcacacagcc cagcttggag cgaacgacct acaccgaact 1260 gagataccta cagcgtgagc tatgagaaag cgccacgctt cccgaaggga gaaaggcgga 1320 caggtatccg gtaagcggca gggtcggaac aggagagcgc acgagggagc ttccaggggg 1380 aaacgcctgg tatctttata gtcctgtcgg gtttcgccac ctctgacttg agcgtcgatt 1440 tttgtgatgc tcgtcagggg ggcggagcct atggaaaaac gccagcaacg cggccttttt 1500 acggttcctg gccttttgct ggccttttgc tcacatgttc tttcctgcgt tatcccctga 1560 ttctgtggat aaccgtatta ccgcctttga gtgagctgat accgctcgcc gcagccgaac 1620 gaccgagcgc agcgagtcag tgagcgagga agcggaagag cgcccaatac gcagggcccc 1680 ctgcaggata aaaaaattgt agataaattt tataaaatag ttttatctac aattttttta 1740 tcaggaaaca gctatgaccg cggccgcaga tagtcataat agttccagaa tagttcaatt 1800 tagaaattag actaaacttc aaaatgtttg ttaaatatat accaaactag tatagatatt 1860 ttttaaatac tggacttaaa cagtagtaat ttgcctaaaa aattttttca atttttttta 1920 aaaaatcctt ttcaagttgt acattgttat ggtaatatgt aattgaagaa gttatgtagt 1980 aatattgtaa acgtttcttg atttttttac atccatgtag tgcttaaaaa accaaaatat 2040 gtcacatgca attgtatatt tcaaataaca atatttattt tctcgttaaa ttcacaaata 2100 atttattaat aatatcaata accaagatta tacttaaatg gatgtttatt ttttaacact 2160 tttatagtaa atatatttat tttatgtagt aaaaaggtta taattataat tgtatttatt 2220 acaattaatt aaaataaaaa atagggtttt aggtaaaatt aagttatttt aagaagtaat 2280 tacaataaaa attgaagtta tttctttaag gagggaatta ttcatatgaa agaagttgta 2340 atagctagtg cagtaagaac agcgattgga tcttatggaa agtctcttaa ggatgtacca 2400 gcagtagatt taggagctac agctataaag gaagcagtta aaaaagcagg aataaaacca 2460 gaggatgtta atgaagtcat tttaggaaat gttcttcaag caggtttagg acagaatcca 2520 gcaagacagg catcttttaa agcaggatta ccagttgaaa ttccagctat gactattaat 2580 aaggtttgtg gttcaggact tagaacagtt agcttagcag cacaaattat aaaagcagga 2640 gatgctgacg taataatagc aggtggtatg gaaaatatgt ctagagctcc ttacttagcg 2700 aataacgcta gatggggata tagaatggga aacgctaaat ttgttgatga aatgatcact 2760 gacggattgt gggatgcatt taatgattac cacatgggaa taacagcaga aaacatagct 2820 gagagatgga acatttcaag agaagaacaa gatgagtttg ctcttgcatc acaaaaaaaa 2880 gctgaagaag ctataaaatc aggtcaattt aaagatgaaa tagttcctgt agtaattaaa 2940 ggcagaaagg gagaaactgt agttgataca gatgagcacc ctagatttgg atcaactata 3000 gaaggacttg caaaattaaa acctgccttc aaaaaagatg gaacagttac agctggtaat 3060 gcatcaggat taaatgactg tgcagcagta cttgtaatca tgagtgcaga aaaagctaaa 3120 gagcttggag taaaaccact tgctaagata gtttcttatg gttcagcagg agttgaccca 3180 gcaataatgg gatatggacc tttctatgca acaaaagcag ctattgaaaa agcaggttgg 3240 acagttgatg aattagattt aatagaatca aatgaagctt ttgcagctca aagtttagca 3300 gtagcaaaag atttaaaatt tgatatgaat aaagtaaatg taaatggagg agctattgcc 3360 cttggtcatc caattggagc atcaggtgca agaatactcg ttactcttgt acacgcaatg 3420 caaaaaagag atgcaaaaaa aggcttagca actttatgta taggtggcgg acaaggaaca 3480 gcaatattgc tagaaaagtg ctaggaattc gagctcggta ccagggagat attaaaatga 3540 ataaattagt aaaattaaca gatttaaagc gcattttcaa agatggcatg acaattatgg 3600 ttgggggttt tttagattgt ggaactcctg aaaatattat agatatgcta gttgatttaa 3660 atataaaaaa tctgactatt ataagcaatg atacagcttt tcctaataaa ggaataggaa 3720 aacttattgt aaatggtcaa gtttctaaag taattgcttc acatattgga actaatcctg 3780 aaactggaaa aaaaatgagc tctggagaac ttaaagttga gctttcccca caaggaacac 3840 tgattgaaag aattcgtgca gctggatctg gactcggagg tgtattaact ccaactggac 3900 ttggaactat cgttgaagaa ggtaagaaaa aagttactat cgatggcaaa gaatatctat 3960 tagaacttcc tttatctgct gatgtttcat taataaaagg tagcattgta gatgaatttg 4020 gaaatacctt ctatagggct gctactaaaa atttcaatcc atatatggca atggctgcaa 4080 aaacagttat agttgaagca gaaaatttag ttaaatgtga agatttaaaa agagatgcca 4140 taatgactcc tggcgtatta gtagattata tcgttaagga ggcggcttaa ttgattgtag 4200 ataaagtttt agcaaaagag ataattgcca aaagagttgc aaaagaacta aaaaaagacc 4260 aactcgtaaa ccttggaata ggacttccaa ctttagtagc aaattatgta ccaaaagaaa 4320 tgaacattac ttttgaatca gaaaatggca tggttggtat ggcacaaatg gcatcatcag 4380 gtgaaaatga cccagatata ataaatgctg gcggggaata tgtaacatta ttacctcaag 4440 gttcattttt tgatagttca atgtctttcg cactaatacg aggaggacat gttgatgttg 4500 ctgttcttgg tgctctagaa gttgatgaaa aaggtaattt agctaactgg attgttccaa 4560 ataaaattgt cccaggtatg ggtggcgcta tggatttagc aataggcgca aaaaaaataa 4620 tagtggcaat gcaacataca ggaaaaagta aacctaaaat cgttaaaaaa tgtactctcc 4680 cacttactgc taaggctcaa gtggatttaa ttgtcacaga actttgtgta attgatgtaa 4740 caaatgacgg cttactttta aaagaaattc ataaagatac aactattgat gaaattaaat 4800 ttttaacaga tgcagattta attattccag ataacttaaa gattatggat atatgaatca 4860 ttctatttta aatatataac tttaaaaatc ttatgtatta aaaactaaga aaagaggttg 4920 attgttttat gttagaaagt gaagtatcta aacaaattac aactccactt gctgctccag 4980 cgtttcctag aggaccatat aggtttcaca atagagaata tctaaacatt atttatcgaa 5040 ctgatttaga tgctcttcga aaaatagtac cagagccact tgaattagat agagcatatg 5100 ttagatttga aatgatggct atgcctgata caaccggact aggctcatat acagaatgtg 5160 gtcaagctat tccagtaaaa tataatggtg ttaagggtga ctacttgcat atgatgtatc 5220 tagataatga acctgctatt gctgttggaa gagaaagtag cgcttatcca aaaaagcttg 5280 gctatccaaa gctatttgtt gattcagata ctttagttgg gacacttaaa tatggtacat 5340 taccagtagc tactgcaaca atgggatata agcacgagcc tctagatctt aaagaagcct 5400 atgctcaaat tgcaagaccc aattttatgc taaaaatcat tcaaggttac gatggtaagc 5460 caagaatttg tgaactaata tgtgcagaaa atactgatat aactattcac ggtgcttgga 5520 ctggaagtgc acgtctacaa ttatttagcc atgcactagc tcctcttgct gatttacctg 5580 tattagagat tgtatcagca tctcatatcc tcacagattt aactcttgga acacctaagg 5640 ttgtacatga ttatctttca gtaaaataaa agcaatatag aggatccagg aggaacaaag 5700 atgagtatac cagaaacaca aaaagcaatt atattttatg agtcaaatgg aaaattagag 5760 cataaagata tacctgtacc aaaaccaaaa ccaaacgaac ttcttataaa tgttaagtat 5820 tctggtgttt gtcatactga tcttcatgca tggcatggtg attggcctct tccaactaaa 5880 ttacctcttg taggtggtca tgaaggtgct ggtgtagttg taggtatggg tgaaaatgtt 5940 aaaggttgga aaataggtga ttatgctgga attaaatggc ttaatggatc ttgtatggca 6000 tgcgagtatt gtgaattagg aaatgaaagt aattgtccac atgctgactt aagtggttat 6060 actcatgatg gatcttttca agaatatgct actgcagatg cagttcaggc tgcacacatt 6120 ccacagggaa ctgatcttgc tgaagtagct cctatattat gcgctggaat tacagtatac 6180 aaagcattaa aaagtgctaa tcttagagca ggacactggg cagctataag tggtgctgca 6240 ggtggtttag gatctttagc agttcaatat gctaaagcta tgggatatag agtattagga 6300 atagacggtg gtccaggaaa agaagagtta tttacatcat taggtggtga agtttttata 6360 gatttcacaa aggaaaaaga tattgtttca gctgtagtaa aggcaactaa tggtggtgca 6420 cacggaatta taaatgtttc agtatctgaa gcagcaatag aagcaagtac tagatattgt 6480 agagcaaacg gaacagtagt tttagttgga cttccagctg gtgcaaagtg ttcatctgac 6540 gtatttaacc atgtagtaaa gagtatttca atagttggat cttacgtagg taatagagct 6600 gatacaagag aagctttaga tttctttgca agaggtttag ttaagagtcc tataaaagta 6660 gtaggacttt catcacttcc tgaaatttat gaaaagatgg aaaagggaca aatagctggt 6720 agatatgttg tagatacaag taaataaggc catggagatc tcgaggcctg cagacatgca 6780 agcttggcac tggccgtcgt tttacaacgt cgtgactggg aaaaccctgg cgttacccaa 6840 cttaatcgcc ttgcagcaca tccccctttc gccagctggc gtaatagcga agaggcccgc 6900 accgatcgcc cttcccaaca gttgcgcagc ctgaatggcg aatggcgcta gcataaaaat 6960 aagaagcctg catttgcagg cttcttattt ttatggcgcg ccgccattat ttttttgaac 7020 aattgacaat tcatttctta ttttttatta agtgatagtc aaaaggcata acagtgctga 7080 atagaaagaa atttacagaa aagaaaatta tagaatttag tatgattaat tatactcatt 7140 tatgaatgtt taattgaata caaaaaaaaa tacttgttat gtattcaatt acgggttaaa 7200 atatagacaa gttgaaaaat ttaataaaaa aataagtcct cagctcttat atattaagct 7260 accaacttag tatataagcc aaaacttaaa tgtgctacca acacatcaag ccgttagaga 7320 actctatcta tagcaatatt tcaaatgtac cgacatacaa gagaaacatt aactatatat 7380 attcaattta tgagattatc ttaacagata taaatgtaaa ttgcaataag taagatttag 7440 aagtttatag cctttgtgta ttggaagcag tacgcaaagg cttttttatt tgataaaaat 7500 tagaagtata tttatttttt cataattaat ttatgaaaat gaaagggggt gagcaaagtg 7560 acagaggaaa gcagtatctt atcaaataac aaggtattag caatatcatt attgacttta 7620 gcagtaaaca ttatgacttt tatagtgctt gtagctaagt agtacgaaag ggggagcttt 7680 aaaaagctcc ttggaataca tagaattcat aaattaattt atgaaaagaa gggcgtatat 7740 gaaaacttgt aaaaattgca aagagtttat taaagatact gaaatatgca aaatacattc 7800 gttgatgatt catgataaaa cagtagcaac ctattgcagt aaatacaatg agtcaagatg 7860 tttacataaa gggaaagtcc aatgtattaa ttgttcaaag atgaaccgat atggatggtg 7920 tgccataaaa atgagatgtt ttacagagga agaacagaaa aaagaacgta catgcattaa 7980 atattatgca aggagcttta aaaaagctca tgtaaagaag agtaaaaaga aaaaataatt 8040 tatttattaa tttaatattg agagtgccga cacagtatgc actaaaaaat atatctgtgg 8100 tgtagtgagc cgatacaaaa ggatagtcac tcgcattttc ataatacatc ttatgttatg 8160 attatgtgtc ggtgggactt cacgacgaaa acccacaata aaaaaagagt tcggggtagg 8220 gttaagcata gttgaggcaa ctaaacaatc aagctaggat atgcagtagc agaccgtaag 8280 gtcgttgttt aggtgtgttg taatacatac gctattaaga tgtaaaaata cggataccaa 8340 tgaagggaaa agtataattt ttggatgtag tttgtttgtt catctatggg caaactacgt 8400 ccaaagccgt ttccaaatct gctaaaaagt atatcctttc taaaatcaaa gtcaagtatg 8460 aaatcataaa taaagtttaa ttttgaagtt attatgatat tatgtttttc tattaaaata 8520 aattaagtat atagaatagt ttaataatag tatatactta atgtgataag tgtctgacag 8580 tgtcacagaa aggatgattg ttatggatta taagcggccg g 8621 <210> 99 <211> 37 <212> DNA <213> Synthetic primer <400> 99 atattggatc cacagctatg accgcggccg caatatg 37 <210> 100 <211> 39 <212> DNA <213> Synthetic primer <400> 100 agcgtccatg gccttattta cttgtatcta caacatatc 39 <210> 101 <211> 10803 <212> DNA <213> Synthetic nucleic acid <400> 101 ccagtgggca agttgaaaaa ttcacaaaaa tgtggtataa tatctttgtt cattagagcg 60 ataaacttga atttgagagg gaacttagat ggtatttgaa aaaattgata aaaatagttg 120 gaacagaaaa gagtattttg accactactt tgcaagtgta ccttgtacct acagcatgac 180 cgttaaagtg gatatcacac aaataaagga aaagggaatg aaactatatc ctgcaatgct 240 ttattatatt gcaatgattg taaaccgcca ttcagagttt aggacggcaa tcaatcaaga 300 tggtgaattg gggatatatg atgagatgat accaagctat acaatatttc acaatgatac 360 tgaaacattt tccagccttt ggactgagtg taagtctgac tttaaatcat ttttagcaga 420 ttatgaaagt gatacgcaac ggtatggaaa caatcataga atggaaggaa agccaaatgc 480 tccggaaaac atttttaatg tatctatgat accgtggtca accttcgatg gctttaatct 540 gaatttgcag aaaggatatg attatttgat tcctattttt actatgggga aatattataa 600 agaagataac aaaattatac ttcctttggc aattcaagtt catcacgcag tatgtgacgg 660 atttcacatt tgccgttttg taaacgaatt gcaggaattg ataaatagtt aacttcaggt 720 ttgtctgtaa ctaaaaacaa gtatttaagc aaaaacatcg tagaaatacg gtgttttttg 780 ttaccctaag tttaaactcc tttttgataa tctcatgacc aaaatccctt aacgtgagtt 840 ttcgttccac tgagcgtcag accccgtaga aaagatcaaa ggatcttctt gagatccttt 900 ttttctgcgc gtaatctgct gcttgcaaac aaaaaaacca ccgctaccag cggtggtttg 960 tttgccggat caagagctac caactctttt tccgaaggta actggcttca gcagagcgca 1020 gataccaaat actgttcttc tagtgtagcc gtagttaggc caccacttca agaactctgt 1080 agcaccgcct acatacctcg ctctgctaat cctgttacca gtggctgctg ccagtggcga 1140 taagtcgtgt cttaccgggt tggactcaag acgatagtta ccggataagg cgcagcggtc 1200 gggctgaacg gggggttcgt gcacacagcc cagcttggag cgaacgacct acaccgaact 1260 gagataccta cagcgtgagc tatgagaaag cgccacgctt cccgaaggga gaaaggcgga 1320 caggtatccg gtaagcggca gggtcggaac aggagagcgc acgagggagc ttccaggggg 1380 aaacgcctgg tatctttata gtcctgtcgg gtttcgccac ctctgacttg agcgtcgatt 1440 tttgtgatgc tcgtcagggg ggcggagcct atggaaaaac gccagcaacg cggccttttt 1500 acggttcctg gccttttgct ggccttttgc tcacatgttc tttcctgcgt tatcccctga 1560 ttctgtggat aaccgtatta ccgcctttga gtgagctgat accgctcgcc gcagccgaac 1620 gaccgagcgc agcgagtcag tgagcgagga agcggaagag cgcccaatac gcagggcccc 1680 ctgcaggata aaaaaattgt agataaattt tataaaatag ttttatctac aattttttta 1740 tcaggaaaca gctatgaccg cggccgcaga tagtcataat agttccagaa tagttcaatt 1800 tagaaattag actaaacttc aaaatgtttg ttaaatatat accaaactag tatagatatt 1860 ttttaaatac tggacttaaa cagtagtaat ttgcctaaaa aattttttca atttttttta 1920 aaaaatcctt ttcaagttgt acattgttat ggtaatatgt aattgaagaa gttatgtagt 1980 aatattgtaa acgtttcttg atttttttac atccatgtag tgcttaaaaa accaaaatat 2040 gtcacatgca attgtatatt tcaaataaca atatttattt tctcgttaaa ttcacaaata 2100 atttattaat aatatcaata accaagatta tacttaaatg gatgtttatt ttttaacact 2160 tttatagtaa atatatttat tttatgtagt aaaaaggtta taattataat tgtatttatt 2220 acaattaatt aaaataaaaa atagggtttt aggtaaaatt aagttatttt aagaagtaat 2280 tacaataaaa attgaagtta tttctttaag gagggaatta ttcatatgaa agaagttgta 2340 atagctagtg cagtaagaac agcgattgga tcttatggaa agtctcttaa ggatgtacca 2400 gcagtagatt taggagctac agctataaag gaagcagtta aaaaagcagg aataaaacca 2460 gaggatgtta atgaagtcat tttaggaaat gttcttcaag caggtttagg acagaatcca 2520 gcaagacagg catcttttaa agcaggatta ccagttgaaa ttccagctat gactattaat 2580 aaggtttgtg gttcaggact tagaacagtt agcttagcag cacaaattat aaaagcagga 2640 gatgctgacg taataatagc aggtggtatg gaaaatatgt ctagagctcc ttacttagcg 2700 aataacgcta gatggggata tagaatggga aacgctaaat ttgttgatga aatgatcact 2760 gacggattgt gggatgcatt taatgattac cacatgggaa taacagcaga aaacatagct 2820 gagagatgga acatttcaag agaagaacaa gatgagtttg ctcttgcatc acaaaaaaaa 2880 gctgaagaag ctataaaatc aggtcaattt aaagatgaaa tagttcctgt agtaattaaa 2940 ggcagaaagg gagaaactgt agttgataca gatgagcacc ctagatttgg atcaactata 3000 gaaggacttg caaaattaaa acctgccttc aaaaaagatg gaacagttac agctggtaat 3060 gcatcaggat taaatgactg tgcagcagta cttgtaatca tgagtgcaga aaaagctaaa 3120 gagcttggag taaaaccact tgctaagata gtttcttatg gttcagcagg agttgaccca 3180 gcaataatgg gatatggacc tttctatgca acaaaagcag ctattgaaaa agcaggttgg 3240 acagttgatg aattagattt aatagaatca aatgaagctt ttgcagctca aagtttagca 3300 gtagcaaaag atttaaaatt tgatatgaat aaagtaaatg taaatggagg agctattgcc 3360 cttggtcatc caattggagc atcaggtgca agaatactcg ttactcttgt acacgcaatg 3420 caaaaaagag atgcaaaaaa aggcttagca actttatgta taggtggcgg acaaggaaca 3480 gcaatattgc tagaaaagtg ctaggaattc gagctcggta ccagggagat attaaaatga 3540 ataaattagt aaaattaaca gatttaaagc gcattttcaa agatggcatg acaattatgg 3600 ttgggggttt tttagattgt ggaactcctg aaaatattat agatatgcta gttgatttaa 3660 atataaaaaa tctgactatt ataagcaatg atacagcttt tcctaataaa ggaataggaa 3720 aacttattgt aaatggtcaa gtttctaaag taattgcttc acatattgga actaatcctg 3780 aaactggaaa aaaaatgagc tctggagaac ttaaagttga gctttcccca caaggaacac 3840 tgattgaaag aattcgtgca gctggatctg gactcggagg tgtattaact ccaactggac 3900 ttggaactat cgttgaagaa ggtaagaaaa aagttactat cgatggcaaa gaatatctat 3960 tagaacttcc tttatctgct gatgtttcat taataaaagg tagcattgta gatgaatttg 4020 gaaatacctt ctatagggct gctactaaaa atttcaatcc atatatggca atggctgcaa 4080 aaacagttat agttgaagca gaaaatttag ttaaatgtga agatttaaaa agagatgcca 4140 taatgactcc tggcgtatta gtagattata tcgttaagga ggcggcttaa ttgattgtag 4200 ataaagtttt agcaaaagag ataattgcca aaagagttgc aaaagaacta aaaaaagacc 4260 aactcgtaaa ccttggaata ggacttccaa ctttagtagc aaattatgta ccaaaagaaa 4320 tgaacattac ttttgaatca gaaaatggca tggttggtat ggcacaaatg gcatcatcag 4380 gtgaaaatga cccagatata ataaatgctg gcggggaata tgtaacatta ttacctcaag 4440 gttcattttt tgatagttca atgtctttcg cactaatacg aggaggacat gttgatgttg 4500 ctgttcttgg tgctctagaa gttgatgaaa aaggtaattt agctaactgg attgttccaa 4560 ataaaattgt cccaggtatg ggtggcgcta tggatttagc aataggcgca aaaaaaataa 4620 tagtggcaat gcaacataca ggaaaaagta aacctaaaat cgttaaaaaa tgtactctcc 4680 cacttactgc taaggctcaa gtggatttaa ttgtcacaga actttgtgta attgatgtaa 4740 caaatgacgg cttactttta aaagaaattc ataaagatac aactattgat gaaattaaat 4800 ttttaacaga tgcagattta attattccag ataacttaaa gattatggat atatgaatca 4860 ttctatttta aatatataac tttaaaaatc ttatgtatta aaaactaaga aaagaggttg 4920 attgttttat gttagaaagt gaagtatcta aacaaattac aactccactt gctgctccag 4980 cgtttcctag aggaccatat aggtttcaca atagagaata tctaaacatt atttatcgaa 5040 ctgatttaga tgctcttcga aaaatagtac cagagccact tgaattagat agagcatatg 5100 ttagatttga aatgatggct atgcctgata caaccggact aggctcatat acagaatgtg 5160 gtcaagctat tccagtaaaa tataatggtg ttaagggtga ctacttgcat atgatgtatc 5220 tagataatga acctgctatt gctgttggaa gagaaagtag cgcttatcca aaaaagcttg 5280 gctatccaaa gctatttgtt gattcagata ctttagttgg gacacttaaa tatggtacat 5340 taccagtagc tactgcaaca atgggatata agcacgagcc tctagatctt aaagaagcct 5400 atgctcaaat tgcaagaccc aattttatgc taaaaatcat tcaaggttac gatggtaagc 5460 caagaatttg tgaactaata tgtgcagaaa atactgatat aactattcac ggtgcttgga 5520 ctggaagtgc acgtctacaa ttatttagcc atgcactagc tcctcttgct gatttacctg 5580 tattagagat tgtatcagca tctcatatcc tcacagattt aactcttgga acacctaagg 5640 ttgtacatga ttatctttca gtaaaataaa agcaatatag aggatccaca gctatgaccg 5700 cggccgcaat atgatattta tgtccattgt gaaagggatt atattcaact attattccag 5760 ttacgttcat agaaattttc ctttctaaaa tattttattc catgtcaaga actctgttta 5820 tttcattaaa gaactataag tacaaagtat aaggcatttg aaaaaatagg ctagtatatt 5880 gattgattat ttattttaaa atgcctaagt gaaatatata catattataa caataaaata 5940 agtattagtg taggattttt aaatagagta tctattttca gattaaattt ttgattattt 6000 gatttacatt atataatatt gagtaaagta ttgactagca aaattttttg atactttaat 6060 ttgtgaaatt tcttatcaaa agttatattt ttgaataatt tttattgaaa aatacaacta 6120 aaaaggatta tagtataagt gtgtgtaatt ttgtgttaaa tttaaaggga ggaaatgaac 6180 atgaaacata tgtatacagt tggtgattat ttacttgata gattacatga acttggaata 6240 gaagaaattt ttggtgtacc aggtgattac aatcttcaat tcttagatca aataatatca 6300 cataaggata tgaaatgggt tggtaatgct aatgaattaa atgcatcata tatggcagac 6360 ggatatgcaa gaactaaaaa ggcagcagca tttcttacta catttggtgt tggtgaatta 6420 agtgcagtaa atggattagc tggaagttac gcagaaaact taccagttgt tgaaatagtt 6480 ggatctccta ctagtaaagt acaaaatgaa ggtaaatttg tacatcacac tcttgcagat 6540 ggtgatttta agcattttat gaaaatgcat gaacctgtta cagctgcaag aacacttctt 6600 acagctgaaa acgctactgt agaaattgat agagttttat ctgctttact taaagaaaga 6660 aagccagtat atattaacct tccagtagat gtagcagcag caaaagctga gaaaccttca 6720 ttaccactta aaaaggaaaa ttcaacatca aatacatctg atcaagagat attaaataaa 6780 attcaggaaa gtcttaaaaa tgcaaagaaa cctatagtaa taactggaca tgaaataatt 6840 agttttggat tagaaaagac agttacacag tttataagta aaactaagct tccaattaca 6900 actttaaatt ttggaaagag ttcagtagat gaggcacttc catcattctt aggaatttat 6960 aatggaacat tatctgaacc taatcttaaa gaatttgtag agagtgctga ttttatatta 7020 atgttaggtg taaaacttac tgatagtagt actggtgcat ttactcatca tcttaacgaa 7080 aataagatga tatcattaaa tatagacgaa ggtaaaatat tcaatgaaag aatacagaac 7140 tttgattttg aatcacttat atcatcatta cttgatttat cagagataga atacaaagga 7200 aaatatatag ataaaaagca agaagatttt gttccatcta atgctcttct ttctcaagat 7260 agactttggc aagcagttga gaatcttaca cagtctaatg aaactatagt tgctgagcaa 7320 ggaacatcat ttttcggtgc atcaagtata tttttaaaat ctaaaagtca ctttattgga 7380 caacctcttt ggggttctat tggatatact tttccagcag ctttaggaag tcaaatagct 7440 gataaagaaa gtagacattt attatttatt ggtgacggtt cacttcagct tacagtacaa 7500 gaattaggat tagctataag agagaagata aatcctattt gtttcataat aaacaatgat 7560 ggatatactg tagaaagaga aattcacgga ccaaatcagt catataatga tattccaatg 7620 tggaattatt caaagttacc tgaatctttc ggtgctactg aagatagagt agtttctaaa 7680 attgttagaa cagagaacga atttgtatct gttatgaaag aagctcaggc tgaccctaat 7740 agaatgtatt ggattgaatt aattttagca aaagaaggtg ctcctaaagt acttaagaaa 7800 atgggaaaat tatttgcaga acaaaataag tcataagaat tcccataata aagaaagaat 7860 tttaaataaa ggaggaacaa agatgagtat accagaaaca caaaaagcaa ttatatttta 7920 tgagtcaaat ggaaaattag agcataaaga tatacctgta ccaaaaccaa aaccaaacga 7980 acttcttata aatgttaagt attctggtgt ttgtcatact gatcttcatg catggcatgg 8040 tgattggcct cttccaacta aattacctct tgtaggtggt catgaaggtg ctggtgtagt 8100 tgtaggtatg ggtgaaaatg ttaaaggttg gaaaataggt gattatgctg gaattaaatg 8160 gcttaatgga tcttgtatgg catgcgagta ttgtgaatta ggaaatgaaa gtaattgtcc 8220 acatgctgac ttaagtggtt atactcatga tggatctttt caagaatatg ctactgcaga 8280 tgcagttcag gctgcacaca ttccacaggg aactgatctt gctgaagtag ctcctatatt 8340 atgcgctgga attacagtat acaaagcatt aaaaagtgct aatcttagag caggacactg 8400 ggcagctata agtggtgctg caggtggttt aggatcttta gcagttcaat atgctaaagc 8460 tatgggatat agagtattag gaatagacgg tggtccagga aaagaagagt tatttacatc 8520 attaggtggt gaagttttta tagatttcac aaaggaaaaa gatattgttt cagctgtagt 8580 aaaggcaact aatggtggtg cacacggaat tataaatgtt tcagtatctg aagcagcaat 8640 agaagcaagt actagatatt gtagagcaaa cggaacagta gttttagttg gacttccagc 8700 tggtgcaaag tgttcatctg acgtatttaa ccatgtagta aagagtattt caatagttgg 8760 atcttacgta ggtaatagag ctgatacaag agaagcttta gatttctttg caagaggttt 8820 agttaagagt cctataaaag tagtaggact ttcatcactt cctgaaattt atgaaaagat 8880 ggaaaaggga caaatagctg gtagatatgt tgtagataca agtaaataag gccatggaga 8940 tctcgaggcc tgcagacatg caagcttggc actggccgtc gttttacaac gtcgtgactg 9000 ggaaaaccct ggcgttaccc aacttaatcg ccttgcagca catccccctt tcgccagctg 9060 gcgtaatagc gaagaggccc gcaccgatcg cccttcccaa cagttgcgca gcctgaatgg 9120 cgaatggcgc tagcataaaa ataagaagcc tgcatttgca ggcttcttat ttttatggcg 9180 cgccgccatt atttttttga acaattgaca attcatttct tattttttat taagtgatag 9240 tcaaaaggca taacagtgct gaatagaaag aaatttacag aaaagaaaat tatagaattt 9300 agtatgatta attatactca tttatgaatg tttaattgaa tacaaaaaaa aatacttgtt 9360 atgtattcaa ttacgggtta aaatatagac aagttgaaaa atttaataaa aaaataagtc 9420 ctcagctctt atatattaag ctaccaactt agtatataag ccaaaactta aatgtgctac 9480 caacacatca agccgttaga gaactctatc tatagcaata tttcaaatgt accgacatac 9540 aagagaaaca ttaactatat atattcaatt tatgagatta tcttaacaga tataaatgta 9600 aattgcaata agtaagattt agaagtttat agcctttgtg tattggaagc agtacgcaaa 9660 ggctttttta tttgataaaa attagaagta tatttatttt ttcataatta atttatgaaa 9720 atgaaagggg gtgagcaaag tgacagagga aagcagtatc ttatcaaata acaaggtatt 9780 agcaatatca ttattgactt tagcagtaaa cattatgact tttatagtgc ttgtagctaa 9840 gtagtacgaa agggggagct ttaaaaagct ccttggaata catagaattc ataaattaat 9900 ttatgaaaag aagggcgtat atgaaaactt gtaaaaattg caaagagttt attaaagata 9960 ctgaaatatg caaaatacat tcgttgatga ttcatgataa aacagtagca acctattgca 10020 gtaaatacaa tgagtcaaga tgtttacata aagggaaagt ccaatgtatt aattgttcaa 10080 agatgaaccg atatggatgg tgtgccataa aaatgagatg ttttacagag gaagaacaga 10140 aaaaagaacg tacatgcatt aaatattatg caaggagctt taaaaaagct catgtaaaga 10200 agagtaaaaa gaaaaaataa tttatttatt aatttaatat tgagagtgcc gacacagtat 10260 gcactaaaaa atatatctgt ggtgtagtga gccgatacaa aaggatagtc actcgcattt 10320 tcataataca tcttatgtta tgattatgtg tcggtgggac ttcacgacga aaacccacaa 10380 taaaaaaaga gttcggggta gggttaagca tagttgaggc aactaaacaa tcaagctagg 10440 atatgcagta gcagaccgta aggtcgttgt ttaggtgtgt tgtaatacat acgctattaa 10500 gatgtaaaaa tacggatacc aatgaaggga aaagtataat ttttggatgt agtttgtttg 10560 ttcatctatg ggcaaactac gtccaaagcc gtttccaaat ctgctaaaaa gtatatcctt 10620 tctaaaatca aagtcaagta tgaaatcata aataaagttt aattttgaag ttattatgat 10680 attatgtttt tctattaaaa taaattaagt atatagaata gtttaataat agtatatact 10740 taatgtgata agtgtctgac agtgtcacag aaaggatgat tgttatggat tataagcggc 10800 cgg 10803

Claims (23)

  1. CO, CO2 및 H2 중 하나 이상을 포함하는 가스상 기질의 존재하에 재조합 미생물을 배양하여 아세톤을 생산하는 단계를 포함하는 아세톤의 제조 방법으로서, 상기 재조합 미생물은 외인성 티올라제 EC 2.3.1.9, 외인성 CoA 트랜스퍼라제 EC 2.8.3.9, 및 외인성 데카복실라제 EC 4.1.1.4 또는 EC 4.1.1.74를 포함하고, 클로스트리디움 오토에타노게눔(Clostridium autoethanogenum), 클로스트리디움 륭달리이(Clostridium ljungdahlii) 및 클로스트리디움 라그스달레이(Clostridium ragsdalei)로 이루어진 군으로부터 선택되는 모체 미생물로부터 유래된 것인 제조 방법.
  2. 제1항에 있어서, 모체 미생물이 천연에 존재하는 미생물이거나 이미 변형된 미생물인 것인 제조 방법.
  3. 제2항에 있어서, 모체 미생물이 알콜 데하이드로게나제를 코딩하는 유전자가 결여된 것인 제조 방법.
  4. 제1항에 있어서, 모체 미생물이 클로스트리디움 오토에타노게눔인 것인 제조 방법.
  5. 제1항에 있어서, 티올라제가 클로스트리디움 아세토부틸리쿰(Clostridium acetobutylicum) ThlA 또는 클로스트리디움 베이예린키이(Clostridium beijerinckii) ThlA인 것인 제조 방법.
  6. 제1항에 있어서, CoA 트랜스퍼라제가 클로스트리디움 아세토부틸리쿰 CtfA 및 CtfB 또는 클로스트리디움 베이예린키이 CtfA 및 CtfB인 것인 제조 방법.
  7. 제1항에 있어서, 데카복실라제가 아세토아세테이트 데카복실라제 EC 4.1.1.4인 것인 제조 방법.
  8. 제7항에 있어서, 아세토아세테이트 데카복실라제가 클로스트리디움 아세토부틸리쿰 Adc 또는 클로스트리디움 베이예린키이 Adc인 것인 제조 방법.
  9. 제1항에 있어서, 데카복실라제가 알파-케토이소발레레이트 데카복실라제 EC 4.1.1.74인 것인 제조 방법.
  10. 제9항에 있어서, 알파-케토이소발레레이트 데카복실라제가 락토코커스 락티스 KivD인 것인 제조 방법.
  11. 제1항에 있어서, 가스상 기질이 20 내지 70%의 CO를 포함하는 것인 제조 방법.
  12. 제1항에 있어서, 가스상 기질이 철 금속 생성물 제조, 비철 생성물 제조, 석유 정련 공정, 석탄의 가스화, 바이오물질의 가스화, 전력 생산, 카본 블랙 생산 및 코크스 제조로 이루어진 군으로부터 선택되는 산업 공정으로부터 유래된 것인 제조 방법.
  13. 제1항에 있어서, 가스상 기질이 합성 가스(syngas)인 것인 제조 방법.
  14. 외인성 티올라제 EC 2.3.1.9, 외인성 CoA 트랜스퍼라제 EC 2.8.3.9, 및 외인성 데카복실라제 EC 4.1.1.4 또는 EC 4.1.1.74를 포함하는 아세톤을 생산하기 위한 재조합 미생물로서, 재조합 미생물이 클로스트리디움 오토에타노게눔, 클로스트리디움 륭달리이 및 클로스트리디움 라그스달레이로 이루어진 군으로부터 선택되는 모체 미생물로부터 유래된 것이고, 모체 미생물이 천연에 존재하는 미생물이거나 이미 변형된 미생물인 것인 재조합 미생물.
  15. 삭제
  16. 제14항에 있어서, 모체 미생물이 알콜 데하이드로게나제를 코딩하는 유전자가 결여된 것인 재조합 미생물.
  17. 제14항에 있어서, 모체 미생물이 클로스트리디움 오토에타노게눔인 것인 재조합 미생물.
  18. 제14항에 있어서, 티올라제가 클로스트리디움 아세토부틸리쿰 ThlA 또는 클로스트리디움 베이예린키이 ThlA인 것인 재조합 미생물.
  19. 제14항에 있어서, CoA 트랜스퍼라제가 클로스트리디움 아세토부틸리쿰 CtfA 및 CtfB 또는 클로스트리디움 베이예린키이 CtfA 및 CtfB인 것인 재조합 미생물.
  20. 제14항에 있어서, 데카복실라제가 아세토아세테이트 데카복실라제 EC 4.1.1.4인 재조합 미생물.
  21. 제20항에 있어서, 아세토아세테이트 데카복실라제가 클로스트리디움 아세토부틸리쿰 Adc 또는 클로스트리디움 베이예린키이 Adc인 것인 재조합 미생물.
  22. 제14항에 있어서, 데카복실라제가 알파-케토이소발레레이트 데카복실라제 EC 4.1.1.74인 것인 재조합 미생물.
  23. 제22항에 있어서, 알파-케토이소발레레이트 데카복실라제가 락토코커스 락티스 KivD인 것인 재조합 미생물.
KR1020197023252A 2011-02-25 2012-02-24 재조합 미생물 및 이의 용도 KR102121886B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161446832P 2011-02-25 2011-02-25
US61/446,832 2011-02-25
PCT/NZ2012/000022 WO2012115527A2 (en) 2011-02-25 2012-02-24 Recombinant microorganisms and uses therefor

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020137025077A Division KR102015672B1 (ko) 2011-02-25 2012-02-24 재조합 미생물 및 이의 용도

Publications (2)

Publication Number Publication Date
KR20190097292A KR20190097292A (ko) 2019-08-20
KR102121886B1 true KR102121886B1 (ko) 2020-06-15

Family

ID=46721376

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020137025077A KR102015672B1 (ko) 2011-02-25 2012-02-24 재조합 미생물 및 이의 용도
KR1020197023252A KR102121886B1 (ko) 2011-02-25 2012-02-24 재조합 미생물 및 이의 용도

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020137025077A KR102015672B1 (ko) 2011-02-25 2012-02-24 재조합 미생물 및 이의 용도

Country Status (13)

Country Link
EP (2) EP3401405A1 (ko)
JP (1) JP6199747B2 (ko)
KR (2) KR102015672B1 (ko)
CN (2) CN108486169B (ko)
AU (1) AU2012221176B2 (ko)
BR (1) BR112013021524A2 (ko)
CA (2) CA2825267C (ko)
DK (1) DK2678432T3 (ko)
ES (1) ES2702621T3 (ko)
MY (2) MY168208A (ko)
PL (1) PL2678432T4 (ko)
TW (1) TWI541348B (ko)
WO (1) WO2012115527A2 (ko)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2834351B1 (en) * 2012-04-05 2019-03-27 LanzaTech New Zealand Limited Enzyme-altered metabolite activity
US20130316364A1 (en) 2012-05-23 2013-11-28 Lanzatech New Zealand Limited Selection Method and Recombinant Microorganisms and uses Therefor
US9994878B2 (en) 2012-05-30 2018-06-12 Lanzatech New Zealand Limited Recombinant microorganisms and uses therefor
US20130323820A1 (en) 2012-06-01 2013-12-05 Lanzatech New Zealand Limited Recombinant microorganisms and uses therefor
CN113186144A (zh) 2012-06-08 2021-07-30 朗泽科技新西兰有限公司 重组微生物和其用途
US9347076B2 (en) 2012-06-21 2016-05-24 Lanzatech New Zealand Limited Recombinant microorganisms that make biodiesel
EP3004362A4 (en) * 2013-06-05 2017-01-11 Lanzatech New Zealand Limited Recombinant microorganisms exhibiting increased flux through a fermentation pathway
CA2924976C (en) * 2013-09-22 2018-05-15 Lanzatech New Zealand Limited Methods for increasing the production of products derived from acetolactate
BR112016012634A2 (pt) * 2013-12-03 2017-09-26 Lanzatech New Zealand Ltd bactéria carboxidotrófica acetogênica recombinante, e, métodos para produzir acetona e mek
CA2936251C (en) 2014-01-28 2017-11-07 Lanzatech New Zealand Limited Method of producing a recombinant microorganism
JP2017531441A (ja) 2014-10-22 2017-10-26 ランザテク・ニュージーランド・リミテッド ガス試験装置及び方法
CN110066718B (zh) 2014-10-22 2022-09-20 朗泽科技新西兰有限公司 多阶段系统和用于将co转化成乙醇的多阶段生物学方法
US10590406B2 (en) 2014-12-08 2020-03-17 Lanzatech New Zealand Limited Recombinant microorganisms exhibiting increased flux through a fermentation pathway
EP3262153A4 (en) 2015-02-23 2018-07-04 Lanzatech New Zealand Limited Recombinant acetogenic bacterium for the conversion of methane to products
KR20210037002A (ko) * 2015-10-13 2021-04-05 란자테크 뉴질랜드 리미티드 에너지-생성 발효 경로를 포함하는 유전자 조작된 박테리아
ES2909579T3 (es) 2015-12-03 2022-05-09 Lanzatech Nz Inc Arginina como única fuente de nitrógeno para microorganismos fijadores de C1
US10358661B2 (en) 2015-12-28 2019-07-23 Lanzatech New Zealand Limited Microorganism with modified hydrogenase activity
ES2955708T3 (es) 2016-02-01 2023-12-05 Lanzatech Nz Inc Proceso integrado de fermentación y electrólisis
SG11201807025SA (en) 2016-02-26 2018-09-27 Lanzatech New Zealand Ltd Crispr/cas systems for c-1 fixing bacteria
EA201892627A1 (ru) 2016-05-14 2019-04-30 Ланцатек, Инк. Микроорганизм с модифицированной активностью альдегид:ферредоксин оксидоредуктазы и связанные способы
ES2926336T3 (es) 2017-09-08 2022-10-25 Lanzatech Inc Proceso para la producción de metabolitos utilizando sustratos que contienen C1 ricos en hidrógeno
EA202091884A1 (ru) 2018-02-12 2020-10-16 Ланцатек, Инк. Способ повышения эффективности конверсии углерода
EP3781668B1 (en) 2018-04-20 2023-10-04 Lanzatech, Inc. Fermentation process for producing ethanol
JP7280951B2 (ja) 2018-11-19 2023-05-24 ランザテク,インコーポレイテッド 発酵とガス化との統合
BR112021015449A2 (pt) 2019-02-08 2021-10-05 Lanzatech, Inc. Métodos para recuperar produto a partir de um caldo de fermentação e para recuperar produto a partir de uma corrente enriquecida com produto
WO2020188033A1 (en) 2019-03-20 2020-09-24 Global Bioenergies Improved means and methods for producing isobutene from acetyl-coa
SG11202111976TA (en) 2019-07-11 2021-11-29 Lanzatech Inc Methods for optimizing gas utilization
CN111057686B (zh) * 2019-12-23 2021-05-04 浙江大学 一种醇脱氢酶突变体及应用
MY197253A (en) * 2020-06-06 2023-06-08 Lanzatech Inc Microorganism with knock-in at acetolactate decarboxylase gene locus
CA3193192A1 (en) * 2020-09-25 2022-03-31 Lanzatech, Inc. Recombinant microorganisms and uses therefor
CA3195088C (en) 2021-02-08 2024-04-23 Fungmin Liew Recombinant microorganisms and their use in the production of 3-hydroxypropionate [3-hp]
CN114561416B (zh) * 2022-04-27 2022-07-15 深圳中科翎碳生物科技有限公司 利用电能固定co2及合成异丙醇的工程菌及构建方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009131040A1 (ja) 2008-04-25 2009-10-29 財団法人地球環境産業技術研究機構 イソプロパノール生産能を有するコリネ型細菌の形質転換体
WO2010121849A1 (de) 2009-04-23 2010-10-28 Evonik Degussa Gmbh Zellen und verfahren zur herstellung von aceton

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5173429A (en) 1990-11-09 1992-12-22 The Board Of Trustees Of The University Of Arkansas Clostridiumm ljungdahlii, an anaerobic ethanol and acetate producing microorganism
US5593886A (en) 1992-10-30 1997-01-14 Gaddy; James L. Clostridium stain which produces acetic acid from waste gases
UA72220C2 (uk) 1998-09-08 2005-02-15 Байоенджініерінг Рісорсиз, Інк. Незмішувана з водою суміш розчинник/співрозчинник для екстрагування оцтової кислоти, спосіб одержання оцтової кислоти (варіанти), спосіб анаеробного мікробного бродіння для одержання оцтової кислоти (варіанти), модифікований розчинник та спосіб його одержання
BR0112251B1 (pt) 2000-07-25 2013-04-09 mÉtodos contÍnuos para produÇço de etanol a partir da fermentaÇço bacteriana anaeràbica de um substrato gasoso.
NZ566406A (en) * 2005-10-26 2012-04-27 Butamax Advanced Biofuels Llc Fermentive production of four carbon alcohols
NZ546496A (en) * 2006-04-07 2008-09-26 Lanzatech New Zealand Ltd Gas treatment process
US7704723B2 (en) 2006-08-31 2010-04-27 The Board Of Regents For Oklahoma State University Isolation and characterization of novel clostridial species
CN101903530A (zh) * 2007-10-12 2010-12-01 加利福尼亚大学董事会 被改造以产生异丙醇的微生物
EP2217696B1 (en) 2007-11-13 2015-09-16 Lanzatech New Zealand Limited Novel bacteria and methods of use thereof
WO2009113878A1 (en) * 2008-03-12 2009-09-17 Lanzatech New Zealand Limited Microbial alcohol production process
EP2373781A4 (en) * 2008-12-16 2012-10-10 Genomatica Inc MICRO-ORGANISMS AND METHODS OF CONVERTING SYNGAS AND OTHER CARBON RESOURCES IN USEFUL PRODUCTS
NZ712586A (en) * 2009-08-21 2017-06-30 Lallemand Hungary Liquidity Man Llc Production of propanols, alcohols, and polyols in consolidated bioprocessing organisms
US8143037B2 (en) 2010-03-19 2012-03-27 Coskata, Inc. Ethanologenic Clostridium species, Clostridium coskatii

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009131040A1 (ja) 2008-04-25 2009-10-29 財団法人地球環境産業技術研究機構 イソプロパノール生産能を有するコリネ型細菌の形質転換体
WO2010121849A1 (de) 2009-04-23 2010-10-28 Evonik Degussa Gmbh Zellen und verfahren zur herstellung von aceton

Also Published As

Publication number Publication date
EP3401405A1 (en) 2018-11-14
MY168208A (en) 2018-10-15
CA2995872A1 (en) 2012-08-30
EP2678432B1 (en) 2018-08-01
NZ614459A (en) 2015-09-25
CA2825267A1 (en) 2012-08-30
ES2702621T3 (es) 2019-03-04
DK2678432T3 (en) 2018-11-26
CN108486169A (zh) 2018-09-04
TW201309795A (zh) 2013-03-01
WO2012115527A3 (en) 2013-01-10
KR102015672B1 (ko) 2019-08-29
CA2825267C (en) 2018-04-03
EP2678432A4 (en) 2016-06-22
MY193665A (en) 2022-10-24
CA2995872C (en) 2019-09-17
PL2678432T3 (pl) 2019-05-31
AU2012221176A1 (en) 2013-05-09
AU2012221176B2 (en) 2015-03-19
TWI541348B (zh) 2016-07-11
CN103502435B (zh) 2018-05-18
CN108486169B (zh) 2022-08-12
JP2014506478A (ja) 2014-03-17
PL2678432T4 (pl) 2019-05-31
EP2678432A2 (en) 2014-01-01
KR20140012106A (ko) 2014-01-29
BR112013021524A2 (pt) 2017-06-13
JP6199747B2 (ja) 2017-09-20
CN103502435A (zh) 2014-01-08
WO2012115527A2 (en) 2012-08-30
KR20190097292A (ko) 2019-08-20

Similar Documents

Publication Publication Date Title
KR102121886B1 (ko) 재조합 미생물 및 이의 용도
DK2855662T3 (en) RECOMBINANT MICROORGANISMS AND APPLICATIONS THEREOF
KR102098849B1 (ko) 재조합 미생물 및 이의 용도
DK2630247T3 (en) PREPARATION OF BUTANOL FROM CARBON MONOXIDE BY A RECOMBINANT MICROORGANISM
KR102079275B1 (ko) 재조합 미생물 및 그에 대한 용도
KR101511639B1 (ko) 재조합 미생물 및 이의 사용 방법
US9365868B2 (en) Fermentation process for producing isopropanol using a recombinant microorganism
US9834795B2 (en) Recombinant microorganisms and uses therefor
KR102290728B1 (ko) Nadph 의존적 효소를 포함하는 재조합 미생물 및 이의 생산방법
TW201233798A (en) Recombinant microorganisms and methods of use thereof
KR20160018568A (ko) 발효 경로를 통한 플럭스의 증가를 나타내는 재조합 미생물
US11746361B2 (en) Metabolic engineering for simultaneous consumption of Xylose and glucose for production of chemicals from second generation sugars
KR102079274B1 (ko) 효소 변경된 대사 산물의 활성
KR102308556B1 (ko) 변경된 일산화탄소 탈수소효소(codh) 활성을 가지는 유전자 조작된 박테리아
KR102320074B1 (ko) 재조합 미생물의 생산 방법
US20040067555A1 (en) Recombinant hosts suitable for simultaneous saccharification and fermentation
NZ614459B2 (en) Recombinant microorganisms and uses therefor
JP2013042701A (ja) 2−プロパノールを生産するように操作された微生物

Legal Events

Date Code Title Description
A107 Divisional application of patent
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right