KR20160046329A - 아세트산 전환이 개선된 글리세롤 및 아세트산 전환 효모 세포 - Google Patents
아세트산 전환이 개선된 글리세롤 및 아세트산 전환 효모 세포 Download PDFInfo
- Publication number
- KR20160046329A KR20160046329A KR1020167005191A KR20167005191A KR20160046329A KR 20160046329 A KR20160046329 A KR 20160046329A KR 1020167005191 A KR1020167005191 A KR 1020167005191A KR 20167005191 A KR20167005191 A KR 20167005191A KR 20160046329 A KR20160046329 A KR 20160046329A
- Authority
- KR
- South Korea
- Prior art keywords
- seq
- ala
- leu
- gly
- val
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/02—Preparation of oxygen-containing organic compounds containing a hydroxy group
- C12P7/04—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
- C12P7/06—Ethanol, i.e. non-beverage
- C12P7/08—Ethanol, i.e. non-beverage produced as by-product or from waste or cellulosic material substrate
- C12P7/10—Ethanol, i.e. non-beverage produced as by-product or from waste or cellulosic material substrate substrate containing cellulosic material
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
- C12N1/14—Fungi; Culture media therefor
- C12N1/16—Yeasts; Culture media therefor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0006—Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0008—Oxidoreductases (1.) acting on the aldehyde or oxo group of donors (1.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1205—Phosphotransferases with an alcohol group as acceptor (2.7.1), e.g. protein kinases
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/48—Hydrolases (3) acting on peptide bonds (3.4)
- C12N9/50—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
- C12N9/52—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from bacteria or Archaea
- C12N9/54—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from bacteria or Archaea bacteria being Bacillus
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/93—Ligases (6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/02—Preparation of oxygen-containing organic compounds containing a hydroxy group
- C12P7/04—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
- C12P7/06—Ethanol, i.e. non-beverage
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y101/00—Oxidoreductases acting on the CH-OH group of donors (1.1)
- C12Y101/01—Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
- C12Y101/01006—Glycerol dehydrogenase (1.1.1.6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y102/00—Oxidoreductases acting on the aldehyde or oxo group of donors (1.2)
- C12Y102/01—Oxidoreductases acting on the aldehyde or oxo group of donors (1.2) with NAD+ or NADP+ as acceptor (1.2.1)
- C12Y102/0101—Acetaldehyde dehydrogenase (acetylating) (1.2.1.10)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y207/00—Transferases transferring phosphorus-containing groups (2.7)
- C12Y207/01—Phosphotransferases with an alcohol group as acceptor (2.7.1)
- C12Y207/01028—Triokinase (2.7.1.28)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y207/00—Transferases transferring phosphorus-containing groups (2.7)
- C12Y207/01—Phosphotransferases with an alcohol group as acceptor (2.7.1)
- C12Y207/01029—Glycerone kinase (2.7.1.29), i.e. dihydroxyacetone kinase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y602/00—Ligases forming carbon-sulfur bonds (6.2)
- C12Y602/01—Acid-Thiol Ligases (6.2.1)
- C12Y602/01001—Acetate-CoA ligase (6.2.1.1)
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E50/00—Technologies for the production of fuel of non-fossil origin
- Y02E50/10—Biofuels, e.g. bio-diesel
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Medicinal Chemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Mycology (AREA)
- Tropical Medicine & Parasitology (AREA)
- Botany (AREA)
- Virology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
a) NAD+-의존적 아세틸화 아세트알데하이드 데하이드로게나제(dehydrogenase)(E.C. 1.2.1.10)를 암호화하는 하나 이상의 뉴클레오타이드 서열;
b) 아세틸-CoA 신세타제(synthetase)(E.C. 6.2.1.1)를 암호화하는 하나 이상의 뉴클레오타이드 서열;
c) 글리세롤 데하이드로게나제(E.C. 1.1.1.6)를 암호화하는 하나 이상의 뉴클레오타이드 서열; 및
d) 다이하이드록시아세톤 키나제(kinase)(E.C. 2.7.1.28 또는 E.C. 2.7.1.29)를 암호화하는 하나 이상의 뉴클레오타이드 서열
을 포함하는, 유전적으로 변형된 세포.
b) 아세틸-CoA 신세타제(synthetase)(E.C. 6.2.1.1)를 암호화하는 하나 이상의 뉴클레오타이드 서열;
c) 글리세롤 데하이드로게나제(E.C. 1.1.1.6)를 암호화하는 하나 이상의 뉴클레오타이드 서열; 및
d) 다이하이드록시아세톤 키나제(kinase)(E.C. 2.7.1.28 또는 E.C. 2.7.1.29)를 암호화하는 하나 이상의 뉴클레오타이드 서열
을 포함하는, 유전적으로 변형된 세포.
Description
본 발명은 미생물, 예컨대, 효모에서의 대사 조작에 관한 것이다. 구체적으로, 본 발명은 아세트산 전환이 개선된 글리세롤 및 아세트산 전환 효모 세포에 관한 것이다. 또한, 본 발명은 효모 세포가 발효 생성물, 예컨대, 에탄올을 생성하는 방법에 관한 것이다.
제2 세대 바이오에탄올은 예를 들면, 에탄올로 발효되기 위해 자유 단량체성 당, 예컨대, 헥소스 및 펜토스로 가수분해되는 식물 바이오매스(biomass)의 리그노셀룰로스성 분획으로부터 생성된다. 바이오매스의 전처리 및 가수분해 동안 당 방출과 별도로, 일부 독성 부산물들이 형성된다. 예를 들면, 푸르푸랄(furfural) 및 HMF는 이 생성물들 중 2종이다. 이들이 형성되는 양은 여러 전처리 파라미터들, 예컨대, 온도, 압력 및 전처리 시간에 의해 좌우된다. 리그노셀룰로스성 가수분해물은 다량의 아세트산도 함유하는데, 이 아세트산은 미생물, 예컨대, 효모의 발효 성능의 강력한 억제제이다.
글리세롤은 에탄올로의 당 발효 동안의 주요 부산물이고, 주로 혐기성 조건 하에서 생합성 동안 형성된 과량의 NADH를 소비하기 위한 재산화 반응의 결과물로서 형성된다(van Dijken and Scheffers, 1986). 그 결과, 산업적 발효 동안 효모 세포에 의해 소비된 당의 약 5% 내지 10%는 글리세롤로 전환된다. 이 폴리올의 양을 낮추는 것은 에탄올 수율을 증가시킬 것으로 기대되는 경로로서 간주된다. 이것은 유가식(fed-batch) 과정 동안 공급률을 조절하거나, 보다 더 적은 글리세롤을 생성하는 균주를 선택함으로써 달성될 수 있었다.
그러나, 문헌에는 가수분해물 중의 당의 발효에 대한 아세트산의 억제 효과를 감소시키는 데에 도움을 줄 수 있을 뿐만 아니라, 예를 들면, 효모의 유전적 조작으로 글리세롤 생성에 관여하는 유전자를 결실시킬 때 환원산화 균형 문제를 (부분적으로) 해결하는 여러 상이한 방법들이 보고되어 있다.
문헌(Sonderegger et al., 2004)은 자일로스(xylose)-발효 사카로마이세스 세레비지애(Saccharomyces cerevisiae) 균주에서의 포스포트랜스아세틸라제(phosphotransacetylase) 및 아세트알데하이드 데하이드로게나제(dehydrogenase)의 이종 발현을 개시하였다. 이로써, 상기 문헌의 저자들(Sonderegger et al.)은 천연 포스포케톨라제(phosphoketolase)와 더불어 상기 특정 균주에서 자일로스 활용을 위해 사용되는 자일로스 리덕타제(reductase) 및 자일리톨 데하이드로게나제의 이종 발현에 의해 생성된 NADH의 순(net) 재산화를 수행할 수 있는 기능성 포스포케톨라제 경로를 생성하였다.
문헌(Guadalupe et al., 2009)에는 부산물인 글리세롤의 생성이 내생성(endogenous) NAD-의존적 글리세롤 3-포스페이트 데하이드로게나제 유전자(GPD1 및 GPD2)의 파괴에 의해 제거되어 있는 사카로마이세스 세레비지애가 기재되어 있다. 아세틸화 NAD-의존적 아세트알데하이드 데하이드로게나제를 암호화하는 에스케리키아 콜라이(Escherichia coli) mhpF 유전자의 발현은 아세트산을 배지에 보충함으로써 혐기성 조건 하에서 생장하는 gpd1gpd2 이중 결실 균주의 능력을 회복시켰다.
문헌(Yu et al., 2010)의 저자들은 (GCY1에 의해 암호화된) 글리세롤 데하이드로게나제, 다이하이드록시아세톤 키나제(kinase)(DAK1) 및 글리세롤 섭취 단백질(GUP1)의 동시적인 과다발현으로 글리세롤로부터의 개선된 에탄올 생성을 위해 대사적으로 조작된 사카로마이세스 세레비지애 균주를 구축하였다. 동일한 연구진에 의한 후속 보고서(Yu et al., 2011)에는 각각 알코올 데하이드로게나제 및 피루베이트 데카복실라제(decarboxylase)를 암호화하는 ADH1 및 PDC1의 추가 과다발현이 발효 조건 하에서 생장률 및 글리세롤 소비의 증가를 야기함으로써 최종 에탄올 수율을 다소 증가시켰다고 기재되어 있다.
문헌(Lee and Dasilva, 2006)은 특히 에스케리키아 콜라이 mgs 및 gldA 유전자의 발현을 도입함으로써 글리세롤로부터 1,2-프로판다이올을 생성하도록 조작된 효모 사카로마이세스 세레비지애를 개시한다.
문헌(Guadelupe et al.)(및 또한 국제 특허출원 공개 제WO 2011/010923호)에 기재된 기술은 바이오매스 당 및 상기 언급된 아세트산을 예를 들면, 에탄올로 발효시키는 동안 가수분해물의 아세트산 함량을 감소시키기 위한 해법을 제공한다.
아세트산을 전환시키는 능력의 추가 향상은 가외의 NADH 생성 경로를 도입함으로써, 예를 들면, 글리세롤 소비 경로를 추가로 (과다)발현시킴으로써 잠재적으로 가능하다. 상기 언급된 GUP1, GCY1 및 DAK1 유전자(Yu et al, 2010)를 (예를 들면, 문헌(Medina et al., 2009)에 기재된 바와 같이) 혐기성 아세트산 전환 경로를 발현하는 효모 균주 내로 도입할 때, 아세트산 전환은 환원산화 균형을 유지하여 가수분해물의 더 증가된 해독 및 보다 더 높은 에탄올 수율을 이끌어내기 위해 증가되어야 한다. 그러나, (GCY1에 의해 암호화된) 효모 글리세롤 데하이드로게나제가 보조인자로서 NADP+를 사용함으로써 불충분한 보조인자 재생으로 인한 보조인자 불균형을 초래하기 때문에, 상기 문헌의 저자들(Yu et al.)의 해법은 효과가 없다. 대안적 글리세롤데하이드로게나제(에스케리키아 콜라이로부터의 gldA)가 아세트산 환원 경로와 함께 시험되었고 혐기성 생장(발효) 조건 하에서 아세트산의 전환을 실제로 향상시켰다(국제 특허출원 공개 제WO 2013/081456호).
본 발명의 목적은 헥소스(글루코스, 프럭토스, 갈락토스 등) 및 펜토스, 예컨대, 자일로스를 발효시키는 그들의 능력을 보유하면서 아세트산 또는 아세테이트로부터 에탄올을 생성할 수 있는 효모들뿐만 아니라, 이 균주들이 에탄올 및/또는 다른 발효 생성물의 생성을 위해 사용되는 방법도 제공하는 것이다. 본 발명의 목적은 헥소스(글루코스, 프럭토스, 갈락토스 등) 및 펜토스, 예컨대, 자일로스를 발효시키는 그들의 능력을 보유하면서 글리세롤 및/또는 글리세롤 및 아세트산으로부터 에탄올을 생성할 수 있는 세포들, 예를 들면, 효모 세포들을 제공하는 것이다. 또 다른 목적은 발효 생성물의 생성(수율, 생성률 또는 둘다)을 증가시키는 것이다.
상기 목적들 중 하나 이상은
a) NAD+-의존적 아세틸화 아세트알데하이드 데하이드로게나제(E.C. 1.2.1.10)를 암호화하는 하나 이상의 뉴클레오타이드 서열;
b) 동종 또는 이종 아세틸-CoA 신세타제(synthetase)(E.C. 6.2.1.1)를 암호화하는 하나 이상의 뉴클레오타이드 서열;
c) 이종 글리세롤 데하이드로게나제(E.C. 1.1.1.6)를 암호화하는 하나 이상의 뉴클레오타이드 서열; 및
d) 동종 또는 이종 다이하이드록시아세톤 키나제(E.C. 2.7.1.28 또는 E.C. 2.7.1.29)를 암호화하는 하나 이상의 뉴클레오타이드 서열
을 포함하는, 유전적으로 변형된 효모 세포를 제공하는 본 발명에 따라 달성된다.
한 실시양태에서, 세포는 글리세롤 3-포스페이트 포스포하이드롤라제(phosphohydrolase)를 암호화하고/하거나 글리세롤 3-포스페이트 데하이드로게나제 유전자를 암호화하는 하나 이상의 내생성 뉴클레오타이드 서열의 결실 또는 파괴를 가진다.
상기 목적들 중 하나 이상은 본 발명에 따라 달성된다.
본 발명에 따라 개선된 발효 생성물(에탄올) 생성이 달성될 수 있다는 것은 실시예로부터 명확하다.
도 1은 에탄올로의 글리세롤 및 아세트산(아세테이트)의 전환에 관여하는 효소 반응의 개략도이다. 아세테이트는 먼저 효모 효소 Acs(각각 유전자 ACS1 및 ACS2에 의해 암호화된 Acs1 및/또는 Acs2)를 통해 아세틸-CoA로 전환된다. 그 다음, 아세틸-CoA는 mhpF 유전자를 통해 아세트알데하이드로 전환되거나, 에스케리키아 콜라이로부터의 이기능성 adhE 효소(또는 동일한 전환을 촉진하는 유사한 효소)를 통해 에탄올로 직접 전환된다. 외부로부터 첨가된 글리세롤을 전환시키는 글리세롤 소비 경로의 도입 시, 가외의 NADH 유동이 발생된다. 글리세롤의 세포내 생성 및 이 효소들에 의한 NADH의 활용을 피하기 위해 GPD1 및 GPD2 유전자의 결실은 임의적이다.
소비된 당(글루코스 및/또는 다른 당)을 기준으로 한 에탄올 수율은 글리세롤 생성의 제거, 및 배지(및 항상 리그노셀룰로스성 가수분해물)에 존재하는 아세테이트/아세트산 및 외부로부터 배지(또는 가수분해물)에 첨가된 글리세롤로부터의 에탄올 생성으로 인해 증가한다.
도 2는 균주 구축 방법을 개략적으로 표시한다. PCR을 이용하여 선별 마커를 포함하는, INT(삽입) 플랭크(flank) 및 발현 카세트(CAS)를 증폭하고 효모 내로 전달한다. 연결제들(도 1에서 각각 5, a, b, c 및 3으로서 표시됨) 사이에 재조합이 일어남으로써 효모 게놈 내의 원하는 위치(이 경우, INT1)에서 상기 경로가 삽입될 것이다. 관심있는 유전자들의 수는 실시예에 기재된 바와 같이 증가될 수 있다. 별개의 발현 카세트들의 재조합 및 수용자 세포의 게놈 내로의 삽입을 용이하게 하기 위해 유일무이한 연결제들이 사용되었다.
도 3은 스크리닝 결과를 보여준다. 잔류 아세트산 농도가 잔류 아세테이트 농도의 함수로서 작도되어 있다.
도 4는 잔류 아세트산 농도가 잔류 아세테이트 농도의 함수로서 작도되어 있다. 잔류 아세테이트 및 글리세롤 농도뿐만 아니라 글리세롤 및 아세테이트로부터의 에탄올 생성에 근거할 때 가장 우수한 성능을 가진 150개의 균주들은 짙은 회색으로 표시되어 있다.
도 5a 및 5b는 새로 생성된 형질전환체들(R1 내지 R8) 및 기준 균주들(RN1069, RN1189 및 YD01247)의 재스크리닝 결과를 보여준다. 형질전환마다 8개의 독립적인 형질전환체들을 선택하였다. 마찬가지로, 기준 균주들을 8배 접종하였다. 상부 패널에는 72시간의 항온처리 후 잔류 아세트산(아세테이트) 농도가 표시되어 있다. 하부 패널에는 잔류 글리세롤 농도가 작도되어 있다.
도 6은 스크리닝의 결과를 보여준다. 기준 균주 RN1189를 포함하는 총 2592개의 균주들을 스크리닝하였다. 기준 균주 RN1189를 27회 포함시켰다. 다른 균주들(총 2592개)에 비해 기준 균주 RN1189의 성능이 도면 하부에 표시되어 있다. 균주들은 전술된 바와 같이 순위가 매겨져 있는데, 이때 보다 더 우수한 성능의 균주는 보다 더 밝은 색채로 표시되어 있다(그리고 그래프의 하부 좌측 모서리에 더 가깝다). 보다 덜 우수한 성능의 균주는 보다 더 짙은 색채로 표시되어 있고; 색채의 변화는 점진적이다. 예외적으로, 기준 균주 RN1189는 가장 짙은 색채로 표시되어 있다.
도 7은 스크리닝의 결과를 보여준다. 가장 우수한 성능의 균주들 중 상위 5종의 균주들이 여기에 표시되어 있다: 1)은 YD01247을 나타내고, 2)는 YD01248이고, 3)은 YD01249이고, 4)는 YD01250이다. 균주 5는 명명되지 않았고 더 시험되지도 않았다.
서열목록의 간단한 설명
서열번호 1: adhE 에스케리키아 콜라이 이기능성 아세트알데하이드-CoA/알코올 데하이드로게나제(단백질);
서열번호 2: acdH 락토바실러스 플란타룸(Lactobacillus plantarum) 아세트알데하이드 데하이드로게나제(단백질);
서열번호 3: eutE 에스케리키아 콜라이 에탄올아민 활용 단백질(단백질);
서열번호 4: Lin1129 리스테리아 이노쿠아(Listeria innocua) 알데하이드 데하이드로게나제(단백질);
서열번호 5: adhE 스타필로코커스 아우레우스(Staphylococcus aureus) 이기능성 아세트알데하이드-CoA/알코올 데하이드로게나제(단백질);
서열번호 6: ACS2 사카로마이세스 세레비지애 아세틸-CoA 리가제(ligase)(단백질);
서열번호 7: gldA 에스케리키아 콜라이 글리세롤 데하이드로게나제(단백질);
서열번호 8: gldA 클렙시엘라 뉴모니애(Klebsiella pneumoniae) 글리세롤 데하이드로게나제(단백질);
서열번호 9: gldA 엔테로코커스 애로게네스(Enterococcus aerogenes) 글리세롤 데하이드로게나제(단백질);
서열번호 10: gldA 예르시니아 알도배(Yersinia aldovae) 글리세롤 데하이드로게나제(단백질);
서열번호 11: DAK1 사카로마이세스 세레비지애 다이하이드록시아세톤 키나제(단백질);
서열번호 12: dhaK 클렙시엘라 뉴모니애 다이하이드록시아세톤 키나제(단백질);
서열번호 13: DAK1 야로위아 리포라이티카(Yarrowia lipolytica) 다이하이드록시아세톤 키나제(단백질);
서열번호 14: DAK1 쉬조사카로마이세스 폼베(Schizosaccharomyces pombe) 다이하이드록시아세톤 키나제(단백질);
서열번호 15: TDH3-프로모터를 함유하는 단편;
서열번호 16: TDH1-프로모터를 함유하는 단편;
서열번호 17: PGK1-터미네이터를 함유하는 단편;
서열번호 18: PGK1-프로모터를 함유하는 단편;
서열번호 19: PRE3-프로모터를 함유하는 단편;
서열번호 20: PGI1-터미네이터를 함유하는 단편;
서열번호 21: ENO1-프로모터를 함유하는 단편;
서열번호 22: ACT1-프로모터를 함유하는 단편;
서열번호 23: CYC1-터미네이터를 함유하는 단편;
서열번호 24: TPI1-프로모터를 함유하는 단편;
서열번호 25: ATG7-프로모터를 함유하는 단편;
서열번호 26: ENO1-터미네이터를 함유하는 단편;
서열번호 27: kanMX 마커 및 플랭킹 영역의 서열;
서열번호 28: 유전자 파괴 카세트 GPD1::hphMX의 서열;
서열번호 29: 유전자 파괴 카세트 GPD2::natMX의 서열;
서열번호 30: 정방향 프라이머 5' INT1 단편(INT5-f);
서열번호 31: 역방향 프라이머 5' INT1 단편(INT5-r);
서열번호 32: 정방향 프라이머 발현 카세트 1(con5-f);
서열번호 33: 역방향 프라이머 발현 카세트 1(conA-r);
서열번호 34: 정방향 프라이머 마커(conA-f);
서열번호 35: 역방향 프라이머 마커(conB-r);
서열번호 36: 정방향 프라이머 발현 카세트 2(conB-f);
서열번호 37: 역방향 프라이머 발현 카세트 2(conC-r);
서열번호 38: 정방향 프라이머 발현 카세트 3(conC-f);
서열번호 39: 역방향 프라이머 발현 카세트 3(conD-r);
서열번호 40: 정방향 프라이머 발현 카세트 4(conD-f);
서열번호 41: 역방향 프라이머 발현 카세트 4(con3-r);
서열번호 42: 정방향 프라이머 3' INT1 단편(INT3-f);
서열번호 43: 역방향 프라이머 3' INT1 단편(INT3-r);
서열번호 44: 플라스미드 p5Abbn의 서열;
서열번호 45: 플라스미드 pBCbbn의 서열;
서열번호 46: 플라스미드 pCDbbn의 서열;
서열번호 47: 플라스미드 pD3bbn의 서열;
서열번호 48: 사카로마이세스 세레비지애에서의 발현을 위해 최적화된 adhE(에스케리키아 콜라이) DNA 서열 코돈-쌍을 함유하는 서열;
서열번호 49: 사카로마이세스 세레비지애에서의 발현을 위해 최적화된 acdH(락토바실러스 플란타룸) DNA 서열 코돈-쌍을 함유하는 서열;
서열번호 50: 사카로마이세스 세레비지애에서의 발현을 위해 최적화된 eutE(에스케리키아 콜라이) DNA 서열 코돈-쌍을 함유하는 서열;
서열번호 51: 사카로마이세스 세레비지애에서의 발현을 위해 최적화된 Lin1129(리스테리아 이노쿠아) DNA 서열 코돈-쌍을 함유하는 서열;
서열번호 52: 사카로마이세스 세레비지애에서의 발현을 위해 최적화된 adhE(스타필로코커스 아우레우스) DNA 서열 코돈-쌍을 함유하는 서열;
서열번호 53: 사카로마이세스 세레비지애에서의 발현을 위해 최적화된 ACS2(사카로마이세스 세레비지애) DNA 서열 코돈-쌍을 함유하는 서열;
서열번호 54: 사카로마이세스 세레비지애에서의 발현을 위해 최적화된 gldA(에스케리키아 콜라이) DNA 서열 코돈-쌍을 함유하는 서열;
서열번호 55: 사카로마이세스 세레비지애에서의 발현을 위해 최적화된 gldA(클렙시엘라 뉴모니애) DNA 서열 코돈-쌍을 함유하는 서열;
서열번호 56: 사카로마이세스 세레비지애에서의 발현을 위해 최적화된 gldA(엔테로코커스 애로게네스) DNA 서열 코돈-쌍을 함유하는 서열;
서열번호 57: 사카로마이세스 세레비지애에서의 발현을 위해 최적화된 gldA(예르시니아 알도배) DNA 서열 코돈-쌍을 함유하는 서열;
서열번호 58: 사카로마이세스 세레비지애서의 발현을 위해 최적화된 DAK1(사카로마이세스 세레비지애) DNA 서열 코돈-쌍을 함유하는 서열;
서열번호 59: 사카로마이세스 세레비지애에서의 발현을 위해 최적화된 dhaK(클렙시엘라 뉴모니애) DNA 서열 코돈-쌍을 함유하는 서열;
서열번호 60: 사카로마이세스 세레비지애에서의 발현을 위해 최적화된 DAK1(야로위아 리포라이티카) DNA 서열 코돈-쌍을 함유하는 서열;
서열번호 61: 사카로마이세스 세레비지애에서의 발현을 위해 최적화된 DAK1(쉬조사카로마이세스 폼베) DNA 서열 코돈-쌍을 함유하는 서열.
소비된 당(글루코스 및/또는 다른 당)을 기준으로 한 에탄올 수율은 글리세롤 생성의 제거, 및 배지(및 항상 리그노셀룰로스성 가수분해물)에 존재하는 아세테이트/아세트산 및 외부로부터 배지(또는 가수분해물)에 첨가된 글리세롤로부터의 에탄올 생성으로 인해 증가한다.
도 2는 균주 구축 방법을 개략적으로 표시한다. PCR을 이용하여 선별 마커를 포함하는, INT(삽입) 플랭크(flank) 및 발현 카세트(CAS)를 증폭하고 효모 내로 전달한다. 연결제들(도 1에서 각각 5, a, b, c 및 3으로서 표시됨) 사이에 재조합이 일어남으로써 효모 게놈 내의 원하는 위치(이 경우, INT1)에서 상기 경로가 삽입될 것이다. 관심있는 유전자들의 수는 실시예에 기재된 바와 같이 증가될 수 있다. 별개의 발현 카세트들의 재조합 및 수용자 세포의 게놈 내로의 삽입을 용이하게 하기 위해 유일무이한 연결제들이 사용되었다.
도 3은 스크리닝 결과를 보여준다. 잔류 아세트산 농도가 잔류 아세테이트 농도의 함수로서 작도되어 있다.
도 4는 잔류 아세트산 농도가 잔류 아세테이트 농도의 함수로서 작도되어 있다. 잔류 아세테이트 및 글리세롤 농도뿐만 아니라 글리세롤 및 아세테이트로부터의 에탄올 생성에 근거할 때 가장 우수한 성능을 가진 150개의 균주들은 짙은 회색으로 표시되어 있다.
도 5a 및 5b는 새로 생성된 형질전환체들(R1 내지 R8) 및 기준 균주들(RN1069, RN1189 및 YD01247)의 재스크리닝 결과를 보여준다. 형질전환마다 8개의 독립적인 형질전환체들을 선택하였다. 마찬가지로, 기준 균주들을 8배 접종하였다. 상부 패널에는 72시간의 항온처리 후 잔류 아세트산(아세테이트) 농도가 표시되어 있다. 하부 패널에는 잔류 글리세롤 농도가 작도되어 있다.
도 6은 스크리닝의 결과를 보여준다. 기준 균주 RN1189를 포함하는 총 2592개의 균주들을 스크리닝하였다. 기준 균주 RN1189를 27회 포함시켰다. 다른 균주들(총 2592개)에 비해 기준 균주 RN1189의 성능이 도면 하부에 표시되어 있다. 균주들은 전술된 바와 같이 순위가 매겨져 있는데, 이때 보다 더 우수한 성능의 균주는 보다 더 밝은 색채로 표시되어 있다(그리고 그래프의 하부 좌측 모서리에 더 가깝다). 보다 덜 우수한 성능의 균주는 보다 더 짙은 색채로 표시되어 있고; 색채의 변화는 점진적이다. 예외적으로, 기준 균주 RN1189는 가장 짙은 색채로 표시되어 있다.
도 7은 스크리닝의 결과를 보여준다. 가장 우수한 성능의 균주들 중 상위 5종의 균주들이 여기에 표시되어 있다: 1)은 YD01247을 나타내고, 2)는 YD01248이고, 3)은 YD01249이고, 4)는 YD01250이다. 균주 5는 명명되지 않았고 더 시험되지도 않았다.
서열목록의 간단한 설명
서열번호 1: adhE 에스케리키아 콜라이 이기능성 아세트알데하이드-CoA/알코올 데하이드로게나제(단백질);
서열번호 2: acdH 락토바실러스 플란타룸(Lactobacillus plantarum) 아세트알데하이드 데하이드로게나제(단백질);
서열번호 3: eutE 에스케리키아 콜라이 에탄올아민 활용 단백질(단백질);
서열번호 4: Lin1129 리스테리아 이노쿠아(Listeria innocua) 알데하이드 데하이드로게나제(단백질);
서열번호 5: adhE 스타필로코커스 아우레우스(Staphylococcus aureus) 이기능성 아세트알데하이드-CoA/알코올 데하이드로게나제(단백질);
서열번호 6: ACS2 사카로마이세스 세레비지애 아세틸-CoA 리가제(ligase)(단백질);
서열번호 7: gldA 에스케리키아 콜라이 글리세롤 데하이드로게나제(단백질);
서열번호 8: gldA 클렙시엘라 뉴모니애(Klebsiella pneumoniae) 글리세롤 데하이드로게나제(단백질);
서열번호 9: gldA 엔테로코커스 애로게네스(Enterococcus aerogenes) 글리세롤 데하이드로게나제(단백질);
서열번호 10: gldA 예르시니아 알도배(Yersinia aldovae) 글리세롤 데하이드로게나제(단백질);
서열번호 11: DAK1 사카로마이세스 세레비지애 다이하이드록시아세톤 키나제(단백질);
서열번호 12: dhaK 클렙시엘라 뉴모니애 다이하이드록시아세톤 키나제(단백질);
서열번호 13: DAK1 야로위아 리포라이티카(Yarrowia lipolytica) 다이하이드록시아세톤 키나제(단백질);
서열번호 14: DAK1 쉬조사카로마이세스 폼베(Schizosaccharomyces pombe) 다이하이드록시아세톤 키나제(단백질);
서열번호 15: TDH3-프로모터를 함유하는 단편;
서열번호 16: TDH1-프로모터를 함유하는 단편;
서열번호 17: PGK1-터미네이터를 함유하는 단편;
서열번호 18: PGK1-프로모터를 함유하는 단편;
서열번호 19: PRE3-프로모터를 함유하는 단편;
서열번호 20: PGI1-터미네이터를 함유하는 단편;
서열번호 21: ENO1-프로모터를 함유하는 단편;
서열번호 22: ACT1-프로모터를 함유하는 단편;
서열번호 23: CYC1-터미네이터를 함유하는 단편;
서열번호 24: TPI1-프로모터를 함유하는 단편;
서열번호 25: ATG7-프로모터를 함유하는 단편;
서열번호 26: ENO1-터미네이터를 함유하는 단편;
서열번호 27: kanMX 마커 및 플랭킹 영역의 서열;
서열번호 28: 유전자 파괴 카세트 GPD1::hphMX의 서열;
서열번호 29: 유전자 파괴 카세트 GPD2::natMX의 서열;
서열번호 30: 정방향 프라이머 5' INT1 단편(INT5-f);
서열번호 31: 역방향 프라이머 5' INT1 단편(INT5-r);
서열번호 32: 정방향 프라이머 발현 카세트 1(con5-f);
서열번호 33: 역방향 프라이머 발현 카세트 1(conA-r);
서열번호 34: 정방향 프라이머 마커(conA-f);
서열번호 35: 역방향 프라이머 마커(conB-r);
서열번호 36: 정방향 프라이머 발현 카세트 2(conB-f);
서열번호 37: 역방향 프라이머 발현 카세트 2(conC-r);
서열번호 38: 정방향 프라이머 발현 카세트 3(conC-f);
서열번호 39: 역방향 프라이머 발현 카세트 3(conD-r);
서열번호 40: 정방향 프라이머 발현 카세트 4(conD-f);
서열번호 41: 역방향 프라이머 발현 카세트 4(con3-r);
서열번호 42: 정방향 프라이머 3' INT1 단편(INT3-f);
서열번호 43: 역방향 프라이머 3' INT1 단편(INT3-r);
서열번호 44: 플라스미드 p5Abbn의 서열;
서열번호 45: 플라스미드 pBCbbn의 서열;
서열번호 46: 플라스미드 pCDbbn의 서열;
서열번호 47: 플라스미드 pD3bbn의 서열;
서열번호 48: 사카로마이세스 세레비지애에서의 발현을 위해 최적화된 adhE(에스케리키아 콜라이) DNA 서열 코돈-쌍을 함유하는 서열;
서열번호 49: 사카로마이세스 세레비지애에서의 발현을 위해 최적화된 acdH(락토바실러스 플란타룸) DNA 서열 코돈-쌍을 함유하는 서열;
서열번호 50: 사카로마이세스 세레비지애에서의 발현을 위해 최적화된 eutE(에스케리키아 콜라이) DNA 서열 코돈-쌍을 함유하는 서열;
서열번호 51: 사카로마이세스 세레비지애에서의 발현을 위해 최적화된 Lin1129(리스테리아 이노쿠아) DNA 서열 코돈-쌍을 함유하는 서열;
서열번호 52: 사카로마이세스 세레비지애에서의 발현을 위해 최적화된 adhE(스타필로코커스 아우레우스) DNA 서열 코돈-쌍을 함유하는 서열;
서열번호 53: 사카로마이세스 세레비지애에서의 발현을 위해 최적화된 ACS2(사카로마이세스 세레비지애) DNA 서열 코돈-쌍을 함유하는 서열;
서열번호 54: 사카로마이세스 세레비지애에서의 발현을 위해 최적화된 gldA(에스케리키아 콜라이) DNA 서열 코돈-쌍을 함유하는 서열;
서열번호 55: 사카로마이세스 세레비지애에서의 발현을 위해 최적화된 gldA(클렙시엘라 뉴모니애) DNA 서열 코돈-쌍을 함유하는 서열;
서열번호 56: 사카로마이세스 세레비지애에서의 발현을 위해 최적화된 gldA(엔테로코커스 애로게네스) DNA 서열 코돈-쌍을 함유하는 서열;
서열번호 57: 사카로마이세스 세레비지애에서의 발현을 위해 최적화된 gldA(예르시니아 알도배) DNA 서열 코돈-쌍을 함유하는 서열;
서열번호 58: 사카로마이세스 세레비지애서의 발현을 위해 최적화된 DAK1(사카로마이세스 세레비지애) DNA 서열 코돈-쌍을 함유하는 서열;
서열번호 59: 사카로마이세스 세레비지애에서의 발현을 위해 최적화된 dhaK(클렙시엘라 뉴모니애) DNA 서열 코돈-쌍을 함유하는 서열;
서열번호 60: 사카로마이세스 세레비지애에서의 발현을 위해 최적화된 DAK1(야로위아 리포라이티카) DNA 서열 코돈-쌍을 함유하는 서열;
서열번호 61: 사카로마이세스 세레비지애에서의 발현을 위해 최적화된 DAK1(쉬조사카로마이세스 폼베) DNA 서열 코돈-쌍을 함유하는 서열.
사카로마이세스 세레비지애는 혐기성 조건 하에서 당, 예컨대, 글루코스로부터 에탄올을 생성한다. 이 과정은 환원산화-중성 과정이다. 그러나, 효모가 생장할 때, 과량의 NADH가 생성된다. 환원산화 균형을 회복하기 위해, 효모는 글리세롤을 생성할 것이다. 이 과정 동안, NADH는 NAD+로 다시 전환된다. 에탄올 산업은 글리세롤을 원치 않는 부산물로서 간주한다. 혐기성 조건 하에서의 글리세롤 형성의 누락은 에탄올 산업에서 오랫동안 추구되고 있는 희망사항이다. 전술된 바와 같이, 탄소 유동을 글리세롤 형성으로부터 에탄올 쪽으로 다시 향하게 하여 에탄올 수율을 증가시키기 위한 몇 차례 시도들이 여러 상이한 연구진들에 의해 이루어 졌다.
글리세롤 형성을 방지하기 위한 가장 직접적인 조치는 글리세롤의 생합성에 관여하는 단백질을 암호화하는 유전자를 결실시키는 것일 것이다. 그러나, GPD1 및 GPD2 유전자가 파괴되어 있을 때, 효모는 그의 환원산화 균형을 회복할 수 없기 때문에 혐기성 조건 하에서 생장할 수 없다. 문헌(Medina et al., 2009)은 NADH-의존적 아세틸-CoA 데하이드로게나제 유전자(예컨대, 상기 문헌(Medina et al.)에 기재된 에스케리키아 콜라이 mhpF 유전자)의 도입 시, 아세트산이 발효 배지 내로 공급되는 한, 혐기성 조건 하에서 생장하는 gpd1gpd2 이중 결실 균주의 능력이 회복된다는 것을 입증하였다. 아세트산은 ACS1/ACS2 유전자 생성물을 통해 아세틸-CoA로 전환된다. 아세틸-CoA는 아세트알데하이드로 전환된 후, mhpF 및 ADH1 유전자 생성물을 통해 에탄올로 전환된다(Medina et al., 2009). 이 방식으로, 원치 않는 부산물(글리세롤)의 형성이 제거됨으로써 에탄올 수율이 증가된다.
아세트산은 종종 가수분해물, 특히 아세트산의 pKa(pKa HAc 약 4.76)에 가깝거나 이 pKa보다 더 낮은 pH를 가진 가수분해물에 존재하는 가장 독한 화합물인 것으로 간주되기 때문에, 가수분해물에서 아세테이트(아세트산) 농도를 더 감소시키는 것이 요구된다. 효모의 혐기성 아세테이트 전환력을 증가시키는 한 방법은 글리세롤 전환 경로를 도입하는 것이다. gpd1gpd2 세포가 스스로 글리세롤을 생성하지 않기 때문에, 외부로부터 첨가된 글리세롤을 전환시키는 글리세롤 경로의 도입에 의해 훨씬 더 많은 NADH가 생성됨으로써, 효모 세포가 환원산화 균형을 유지하기 위해 보다 더 많은 아세트산을 전환시키게 한다(도 1 및 국제 특허출원 공개 제WO 2013/081456호 참조).
글리세롤은 바이오정련(biorefineries)에서 충분히 많은 양으로 사용될 수 있다. 이를 목적으로, 에탄올로의 독성 아세트산의 전환을 더 증가시키기 위해 에스케리키아 콜라이로부터의 유전자 gldA 및 사카로마이세스 세레비지애로부터의 DAK1을 과다발현시켰다(국제 특허출원 공개 제WO 2013/081456호). 실제로, 보다 더 높은 에탄올 수율이 수득되었다.
속도 및 양 둘다의 관점에서 글리세롤 및 아세트산의 혐기성 (공-)전환을 훨씬 더 개선하기 위해, 대안적 유전자 조합물을 시험하였다. 경로 내의 다수의 효소들, 즉 글리세롤 데하이드로게나제, 다이하이드록시아세톤 키나제 및 아세트알데하이드 데하이드로게나제에 대해, 혐기성 조건 하에서 글리세롤 및 아세트산을 펜토스 및 헥소스 당 다음에 에탄올로 전환시키는 효모 균주의 능력을 더 향상시킬 수 있는 다수의 대안적 유전자들을 시험하였다.
따라서, 본 발명은
a) NAD+-의존적 아세틸화 아세트알데하이드 데하이드로게나제(E.C. 1.2.1.10)를 암호화하는 하나 이상의 뉴클레오타이드 서열;
b) 아세틸-CoA 신세타제(E.C. 6.2.1.1)를 암호화하는 하나 이상의 뉴클레오타이드 서열;
c) 글리세롤 데하이드로게나제(E.C. 1.1.1.6)를 암호화하는 하나 이상의 뉴클레오타이드 서열; 및
d) 다이하이드록시아세톤 키나제(E.C. 2.7.1.28 또는 E.C. 2.7.1.29)를 암호화하는 하나 이상의 뉴클레오타이드 서열
을 포함하는, 유전적으로 변형된 효모 세포를 제공한다.
본 발명의 실시양태들은 이하에 기재되어 있다. 하기 항들은 특히 상기 특징들 a) 내지 d)가 상세히 기재되어 있는 본 발명의 여러 실시양태들을 기술한다.
제1항:
a) NAD+-의존적 아세틸화 아세트알데하이드 데하이드로게나제(E.C. 1.2.1.10)를 암호화하는 하나 이상의 뉴클레오타이드 서열;
b) 아세틸-CoA 신세타제(E.C. 6.2.1.1)를 암호화하는 하나 이상의 뉴클레오타이드 서열;
c) 글리세롤 데하이드로게나제(E.C. 1.1.1.6)를 암호화하는 하나 이상의 뉴클레오타이드 서열; 및
d) 다이하이드록시아세톤 키나제(E.C. 2.7.1.28 또는 E.C. 2.7.1.29)를 암호화하는 하나 이상의 뉴클레오타이드 서열
을 포함하는, 유전적으로 변형된 세포.
제1a항:
a) 이종 NAD+-의존적 아세틸화 아세트알데하이드 데하이드로게나제(E.C. 1.2.1.10)를 암호화하는 하나 이상의 뉴클레오타이드 서열;
b) 동종 또는 이종 아세틸-CoA 신세타제(E.C. 6.2.1.1)를 암호화하는 하나 이상의 뉴클레오타이드 서열;
c) 이종 글리세롤 데하이드로게나제(E.C. 1.1.1.6)를 암호화하는 하나 이상의 뉴클레오타이드 서열; 및
d) 동종 또는 이종 다이하이드록시아세톤 키나제(E.C. 2.7.1.28 또는 E.C. 2.7.1.29)를 암호화하는 하나 이상의 뉴클레오타이드 서열
을 포함하는, 유전적으로 변형된 세포.
제2항:
제1항에 있어서,
글리세롤 3-포스페이트 포스포하이드롤라제(GPP1, GPP2)를 암호화하고/하거나 글리세롤 3-포스페이트 데하이드로게나제 유전자(GPD1, GPD2)를 암호화하는 하나 이상의 내생성 뉴클레오타이드 서열의 결실 또는 파괴를 포함하는 세포.
제3항:
제1항 또는 제2항에 있어서,
b)가 서열번호 6, 또는 서열번호 6과 60% 이상의 서열 동일성을 가진 서열번호 6의 기능성 상동체(homologue)로 표시되는 동종 또는 이종 아세틸-CoA 신세타제(E.C. 6.2.1.1)를 암호화하는 하나 이상의 이종 뉴클레오타이드 서열인, 세포.
제4항:
제3항에 있어서,
c)가 서열번호 7, 또는 서열번호 7과 60% 이상의 서열 동일성을 가진 서열번호 7의 기능성 상동체로 표시되는 이종 글리세롤 데하이드로게나제(E.C. 1.1.1.6)를 암호화하는 하나 이상의 뉴클레오타이드 서열; 및/또는 서열번호 9, 또는 서열번호 9와 60% 이상의 서열 동일성을 가진 서열번호 9의 기능성 상동체로 표시되는 이종 글리세롤 데하이드로게나제(E.C. 1.1.1.6)를 암호화하는 하나 이상의 뉴클레오타이드 서열인, 세포.
제5항:
제4항에 있어서,
c)가 서열번호 7, 또는 서열번호 7과 60% 이상의 서열 동일성을 가진 서열번호 7의 기능성 상동체로 표시되는 이종 글리세롤 데하이드로게나제(E.C. 1.1.1.6)를 암호화하는 하나 이상의 뉴클레오타이드 서열인, 세포.
제6항:
제1항 내지 제5항 중 어느 한 항에 있어서,
d)가 서열번호 11, 또는 서열번호 11과 60% 이상의 서열 동일성을 가진 서열번호 11의 기능성 상동체로 표시되는 동종 또는 이종 다이하이드록시아세톤 키나제(E.C. 2.7.1.28 또는 E.C. 2.7.1.29)를 암호화하는 하나 이상의 뉴클레오타이드 서열; 및/또는 서열번호 13, 또는 서열번호 13과 60% 이상의 서열 동일성을 가진 서열번호 13의 기능성 상동체로 표시되는 동종 또는 이종 다이하이드록시아세톤 키나제(E.C. 2.7.1.28 또는 E.C. 2.7.1.29)를 암호화하는 하나 이상의 뉴클레오타이드 서열인, 세포.
제7항:
제6항에 있어서,
d)가 서열번호 13, 또는 서열번호 13과 60% 이상의 서열 동일성을 가진 서열번호 13의 기능성 상동체로 표시되는 동종 또는 이종 다이하이드록시아세톤 키나제(E.C. 2.7.1.28 또는 E.C. 2.7.1.29)를 암호화하는 하나 이상의 뉴클레오타이드 서열인, 세포.
제8항:
제1항 내지 제7항 중 어느 한 항에 있어서,
a)가 서열번호 1, 또는 서열번호 1과 60% 이상의 서열 동일성을 가진 서열번호 1의 기능성 상동체로 표시되는 이종 NAD+-의존적 아세틸화 아세트알데하이드 데하이드로게나제를 암호화하는 하나 이상의 뉴클레오타이드 서열; 및/또는 서열번호 2, 또는 서열번호 2와 60% 이상의 서열 동일성을 가진 서열번호 2의 기능성 상동체로 표시되는 이종 NAD+-의존적 아세틸화 아세트알데하이드 데하이드로게나제를 암호화하는 하나 이상의 뉴클레오타이드 서열; 및/또는 서열번호 3, 또는 서열번호 3과 60% 이상의 서열 동일성을 가진 서열번호 3의 기능성 상동체로 표시되는 이종 NAD+-의존적 아세틸화 아세트알데하이드 데하이드로게나제를 암호화하는 하나 이상의 뉴클레오타이드 서열인, 세포.
제9항:
제8항에 있어서,
a)가 서열번호 1, 또는 서열번호 1과 60% 이상의 서열 동일성을 가진 서열번호 1의 기능성 상동체로 표시되는 이종 NAD+-의존적 아세틸화 아세트알데하이드 데하이드로게나제(E.C. 1.2.1.10)를 암호화하는 하나 이상의 뉴클레오타이드 서열; 및/또는 서열번호 2, 또는 서열번호 2와 60% 이상의 서열 동일성을 가진 서열번호 2의 기능성 상동체로 표시되는 이종 NAD+-의존적 아세틸화 아세트알데하이드 데하이드로게나제(E.C. 1.2.1.10)를 암호화하는 하나 이상의 뉴클레오타이드 서열인, 세포.
제10항:
제9항에 있어서,
a)가 서열번호 2, 또는 서열번호 2와 60% 이상의 서열 동일성을 가진 서열번호 2의 기능성 상동체로 표시되는 이종 NAD+-의존적 아세틸화 아세트알데하이드 데하이드로게나제를 암호화하는 하나 이상의 뉴클레오타이드 서열인, 세포.
제11항:
제1항 내지 제10항 중 어느 한 항에 있어서,
a)가 서열번호 3, 또는 서열번호 3과 60% 이상의 서열 동일성을 가진 서열번호 3의 기능성 상동체로 표시되는 이종 NAD+-의존적 아세틸화 아세트알데하이드 데하이드로게나제(E.C. 1.2.1.10)를 암호화하는 하나 이상의 뉴클레오타이드 서열이고;
b)가 서열번호 6, 또는 서열번호 6과 60% 이상의 서열 동일성을 가진 서열번호 6의 기능성 상동체로 표시되는 동종 또는 이종 아세틸-CoA 신세타제(E.C. 6.2.1.1)를 암호화하는 하나 이상의 뉴클레오타이드 서열이고;
c)가 서열번호 7, 또는 서열번호 7과 60% 이상의 서열 동일성을 가진 서열번호 7의 기능성 상동체로 표시되는 이종 글리세롤 데하이드로게나제(E.C. 1.1.1.6)를 암호화하는 하나 이상의 뉴클레오타이드 서열이고;
d)가 서열번호 11, 또는 서열번호 11과 60% 이상의 서열 동일성을 가진 서열번호 11의 기능성 상동체로 표시되는 동종 또는 이종 다이하이드록시아세톤 키나제(E.C. 2.7.1.28 또는 E.C. 2.7.1.29)를 암호화하는 하나 이상의 뉴클레오타이드 서열인, 세포.
제12항:
제1항 내지 제10항 중 어느 한 항에 있어서,
a)가 서열번호 2, 또는 서열번호 2와 60% 이상의 서열 동일성을 가진 서열번호 2의 기능성 상동체로 표시되는 이종 NAD+-의존적 아세틸화 아세트알데하이드 데하이드로게나제(E.C. 1.2.1.10)를 암호화하는 하나 이상의 뉴클레오타이드 서열이고;
b)가 서열번호 6, 또는 서열번호 6과 60% 이상의 서열 동일성을 가진 서열번호 6의 기능성 상동체로 표시되는 동종 또는 이종 아세틸-CoA 신세타제(E.C. 6.2.1.1)를 암호화하는 하나 이상의 뉴클레오타이드 서열이고;
c)가 서열번호 9, 또는 서열번호 9와 60% 이상의 서열 동일성을 가진 서열번호 9의 기능성 상동체로 표시되는 이종 글리세롤 3-포스페이트 데하이드로게나제(E.C. 1.1.1.8)를 암호화하는 하나 이상의 뉴클레오타이드 서열이고;
d)가 서열번호 11, 또는 서열번호 11과 60% 이상의 서열 동일성을 가진 서열번호 11의 기능성 상동체로 표시되는 동종 또는 이종 다이하이드록시아세톤 키나제(E.C. 2.7.1.28 또는 E.C. 2.7.1.29)를 암호화하는 하나 이상의 뉴클레오타이드 서열인, 세포.
제13항:
제1항 내지 제10항 중 어느 한 항에 있어서,
a)가 서열번호 2, 또는 서열번호 2와 60% 이상의 서열 동일성을 가진 서열번호 2의 기능성 상동체로 표시되는 이종 NAD+-의존적 아세틸화 아세트알데하이드 데하이드로게나제(E.C. 1.2.1.10)를 암호화하는 하나 이상의 뉴클레오타이드 서열이고;
b)가 서열번호 6, 또는 서열번호 6과 60% 이상의 서열 동일성을 가진 서열번호 6의 기능성 상동체로 표시되는 동종 또는 이종 아세틸-CoA 신세타제(E.C. 6.2.1.1)를 암호화하는 하나 이상의 뉴클레오타이드 서열이고;
c)가 서열번호 7, 또는 서열번호 7과 60% 이상의 서열 동일성을 가진 서열번호 7의 기능성 상동체로 표시되는 이종 글리세롤 3-포스페이트 데하이드로게나제(E.C. 1.1.1.8)를 암호화하는 하나 이상의 뉴클레오타이드 서열이고;
d)가 서열번호 13, 또는 서열번호 13과 60% 이상의 서열 동일성을 가진 서열번호 13의 기능성 상동체로 표시되는 동종 또는 이종 다이하이드록시아세톤 키나제(E.C. 2.7.1.28 또는 E.C. 2.7.1.29)를 암호화하는 하나 이상의 뉴클레오타이드 서열인, 세포.
제14항:
제1항 내지 제10항 중 어느 한 항에 있어서,
a)가 서열번호 1, 또는 서열번호 1과 60% 이상의 서열 동일성을 가진 서열번호 1의 기능성 상동체로 표시되는 이종 NAD+-의존적 아세틸화 아세트알데하이드 데하이드로게나제(E.C. 1.2.1.10)를 암호화하는 하나 이상의 뉴클레오타이드 서열이고;
b)가 서열번호 6, 또는 서열번호 6과 60% 이상의 서열 동일성을 가진 서열번호 6의 기능성 상동체로 표시되는 동종 또는 이종 아세틸-CoA 신세타제(E.C. 6.2.1.1)를 암호화하는 하나 이상의 뉴클레오타이드 서열이고;
c)가 서열번호 7, 또는 서열번호 7과 60% 이상의 서열 동일성을 가진 서열번호 7의 기능성 상동체로 표시되는 이종 글리세롤 3-포스페이트 데하이드로게나제(E.C. 1.1.1.8)를 암호화하는 하나 이상의 뉴클레오타이드 서열이고;
d)가 서열번호 13, 또는 서열번호 13과 60% 이상의 서열 동일성을 가진 서열번호 13의 기능성 상동체로 표시되는 동종 또는 이종 다이하이드록시아세톤 키나제(E.C. 2.7.1.28 또는 E.C. 2.7.1.29)를 암호화하는 하나 이상의 뉴클레오타이드 서열인, 세포.
본 발명에 따른 세포는 숙주 세포의 변형, 예를 들면, 폴리뉴클레오타이드, 예를 들면, 상기 특징 a) 내지 d)에 상응하는 뉴클레오타이드의 도입 및/또는 단백질의 발현에 의해 제조될 수 있다.
상기 폴리뉴클레오타이드 또는 단백질은 숙주 세포의 게놈에 대한 동종성 또는 이종성을 가질 수 있다. 숙주 세포에 대한 용어 "이종"은 폴리뉴클레오타이드가 숙주 세포의 게놈에 천연적으로 존재하지 않거나 폴리펩타이드가 그 세포에 의해 천연적으로 생성되지 않는다는 것을 의미한다. 숙주 세포에 대한 용어 "동종"은 폴리뉴클레오타이드가 숙주 세포의 게놈에 천연적으로 존재하거나 폴리펩타이드가 그 세포에 의해 천연적으로 생성된다는 것을 의미한다. 동종 단백질 발현은 예를 들면, 상이한 프로모터의 조절 하에서의 과다발현 또는 발현일 수 있다. 이종 단백질 발현은 숙주 세포에서 천연적으로 생성되지 않는 단백질의 발현을 포함한다.
본 발명에 따른 세포는 도 1에 예시되어 있다. 도 1은 에탄올로의 글리세롤 및 아세트산(아세테이트)의 전환에 관여하는 효소 반응들의 개략도를 제공한다. 아세테이트는 먼저 효모 효소 Acs(각각 유전자 ACS1 및 ACS2에 의해 암호화된 Acs1 및/또는 Acs2)를 통해 아세틸-CoA로 전환된다. 그 다음, 아세틸-CoA는 mhpF 유전자를 통해 아세트알데하이드로 전환되거나, 에스케리키아 콜라이로부터의 이기능성 adhE 효소(또는 동일한 전환을 촉진하는 유사한 효소)를 통해 에탄올로 직접 전환된다. 외부로부터 첨가된 글리세롤을 전환시키는 글리세롤 소비 경로의 도입 시, 가외의 NADH 유동이 생성된다. 도 1 및 제2항에 표시되어 있는 바와 같이, GPD1 및 GPD2 유전자는 글리세롤의 세포내 생성 및 이 효소들에 의한 NADH의 활용을 피하기 위해 결실될 수 있다.
소비된 당(글루코스 또는 다른 당)을 기준으로 한 에탄올 수율은 글리세롤 생성의 제거, 및 배지(및 항상 리그노셀룰로스성 가수분해물)에 존재하는 아세테이트/아세트산 및 외부로부터 배지(또는 가수분해물)에 첨가된 글리세롤로부터의 에탄올 생성으로 인해 증가한다.
본 명세서 및 첨부된 청구범위 전체에서 용어 "포함한다" 및 "포괄한다", 및 어미변화, 예컨대, "포함하고", "포함하는", "포괄하고" 및 "포괄하는"은 포괄적으로 해석되어야 한다. 즉, 이 용어들은 문맥이 허용하는 경우 구체적으로 언급되지 않은 다른 요소 또는 정수의 가능한 포함을 전달하기 위한 것이다. 단수형 용어는 본원에서 그 단수형 용어의 하나 이상(즉, 하나 또는 적어도 하나)의 문법적 목적어를 지칭하기 위해 사용된다. 예를 들면, "한 요소"는 하나의 요소 또는 하나 초과의 요소를 지칭할 수 있다.
"기능성 폴리펩타이드"는 본원에서 "폴리펩타이드 기능" 또는 "폴리펩타이드"로서도 표기된다. "기능성 폴리펩타이드 폴리뉴클레오타이드"는 본원에서 "기능성 폴리펩타이드"를 암호화하는 폴리뉴클레오타이드이다. 또한, 본 발명은 이러한 폴리펩타이드를 암호화하는 폴리뉴클레오타이드; 상기 폴리펩타이드를 암호화하는 폴리뉴클레오타이드를 포함하는 핵산 구축물; 및 (효모) 세포에서 이종 폴리펩타이드의 기능적 발현을 위한 벡터로서, 상기 세포에서 작용하는 프로모터에 작동가능하게 연결되어 있고 상기 세포(의 세포질)에서 "기능적" 효소 활성을 가진 폴리펩타이드를 암호화하는 이종 핵산 서열을 포함하는 발현 벡터에 관한 것이다. 본원에서 "기능성" 폴리펩타이드는 "기능적" 활성 이외의 하나 이상의 대안적 및/또는 추가적 활성을 가질 수 있다.
본원에서 언급된 E.C. 코드는 "기능"을 명확히 하기 위해 사용될 뿐, 결코 "기능"을 한정하는 것으로서 간주되어서는 안 된다.
본원에서 효소를 암호화하는 임의의 외생성(exogenous) 유전자는 임의의 서열번호 X와 50%, 60%, 65%, 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100%의 아미노산 서열 동일성을 가진 아미노산 서열을 암호화하는 뉴클레오타이드 서열을 포함하는데, 이때 서열번호 X는 본원의 서열목록 내의 단백질 서열들, 특히 서열번호 1 내지 서열번호 14 중 임의의 단백질 서열이다. 효소를 암호화하는 외생성 유전자는 임의의 서열번호 X, 특히 서열번호 1 내지 서열번호 14 중 임의의 서열번호의 아미노산 서열에 비해 1개 또는 여러 개의 치환, 삽입 및/또는 결실을 가진 아미노산 서열을 암호화하는 뉴클레오타이드 서열을 포함할 수도 있다. 바람직하게는, 아미노산 서열은 서열번호 X, 특히 서열번호 1 내지 서열번호 14에 비해 420개, 380개, 300개, 250개, 200개, 150개, 100개, 75개, 50개, 40개, 30개, 20개, 10개, 9개, 8개, 7개, 6개, 5개, 4개, 3개, 2개 또는 1개 이하의 아미노산 치환, 삽입 및/또는 결실을 가진다.
본원에서 효소를 암호화하는 임의의 외생성 유전자는 임의의 서열번호 Y와 40%, 50%, 60%, 65%, 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 95%, 96%, 97%, 98%, 99% 이상 또는 100%의 뉴클레오타이드(DNA) 서열 동일성을 가진 뉴클레오타이드 서열을 포함하는데, 이때 서열번호 Y는 본원의 서열목록 내의 뉴클레오타이드(DNA) 서열들, 특히 서열번호 48 내지 서열번호 61 중 임의의 서열이다.
제1항의 특징 a) 내지 d)는 지금부터 이하에 보다 더 상세히 기재될 것이다.
특징 a): NAD+-의존적 아세틸화 아세트알데하이드 데하이드로게나제를 암호화하는 하나 이상의 뉴클레오타이드 서열:
본 발명의 세포는 아세틸-CoA를 아세트알데하이드로 환원시키는 능력을 가진 효소를 암호화하는 외생성 유전자를 포함하는데, 이 유전자는 아세틸-CoA(및/또는 아세트산)를 에탄올로 전환시키는 능력을 세포에게 부여한다. 아세틸-CoA를 아세트알데하이드로 환원시키는 능력을 가진 효소는 본원에서 하기 반응들을 촉진하는 이기능성 효소로서 이해된다(adhE):
아세트알데하이드 + NADH ↔ 에탄올 + NAD + (1)
및/또는
NAD + + 보조효소 A + 아세트알데하이드 ↔ NADH + 아세틸- CoA (2)
따라서, 상기 효소는 에탄올로의 아세트알데하이드의 전환(및 아세트알데하이드로의 에탄올의 전환)을 촉진하고 아세트알데하이드 데하이드로게나제(NAD+-의존적)로서도 지칭된다. 상기 효소는 아세틸-CoA로의 보조효소 A 및 아세트알데하이드의 전환(및 보조효소 A 및 아세트알데하이드로의 아세틸-CoA의 전환)도 촉진하고 아세트알데하이드 데하이드로게나제로서도 지칭되는 이기능성 효소이다. 이 효소는 아세틸-보조효소 A가 생장 배지에 존재하는 아세테이트로부터 생성될 때 NADH의 재산화를 허용하고, 이로써 글리세롤 합성이 환원산화 보조인자 균형을 위해 더 이상 요구되지 않는다. NADH-의존적 아세틸화 아세트알데하이드 데하이드로게나제(E.C. 1.2.1.10)를 암호화하는 핵산 서열은 원칙적으로 상기 데하이드로게나제를 암호화하는 핵산 서열을 포함하는 임의의 유기체로부터 유래할 수 있다.
아세트알데하이드로의 아세틸-보조효소 A의 NADH-의존적 환원을 촉진할 수 있는 공지된 NAD+-의존적 아세틸화 아세트알데하이드 데하이드로게나제는 일반적으로 3종의 NADH-의존적 아세틸화 아세트알데하이드 데하이드로게나제 기능성 상동체들로 나누어질 수 있다:
1) 아세트알데하이드로의 아세틸-보조효소 A의 가역적 전환 및 에탄올로의 아세트알데하이드의 후속 가역적 전환을 촉진하는 이기능성 단백질. 이러한 종류의 단백질의 일례는 에스케리키아 콜라이 내의 AdhE 단백질(진뱅크 번호: NP-415757)이다. AdhE는 유전자 융합의 진화적 생성물인 듯하다. AdhE 단백질의 NH2-말단 영역은 알데하이드:NADH 옥시도리덕타제(oxidoreductases)와 고도의 상동성을 가지는 반면, COOH-말단 영역은 Fe2 +-의존적 에탄올:NADH 옥시도리덕타제의 패밀리와 상동성을 가진다(Membrillo-Hernandez et al., (2000) J. Biol. Chem. 275: 33869-33875). 에스케리키아 콜라이 AdhE는 금속 촉매에 의해 산화되므로 산소에 민감하다(Tamarit et al. (1998) J. Biol. Chem. 273:3027-32).
2) 엄격 또는 임의 혐기성 미생물에서 아세트알데하이드로의 아세틸-보조효소 A의 가역적 전환을 촉진하되 알코올 데하이드로게나제 활성을 보유하지 않는 단백질. 이러한 종류의 단백질의 일례는 클로스트리듐 클루이베리(Clostridium kluyveri)에서 보고되어 있다(Smith et al. (1980) Arch. Biochem. Biophys. 203: 663-675). 아세틸화 아세트알데하이드 데하이드로게나제는 클로스트리듐 클루이베리 DSM 555(진뱅크 번호: EDK33116)의 게놈에서 해독되어 있다. 상동성 단백질 AcdH는 락토바실러스 플란타룸(진뱅크 번호: NP-784141)의 게놈에서 확인되어 있다. 이러한 종류의 단백질의 또 다른 예는 클로스트리듐 베이제린키이(Clostridium beijerinckii) NRRL B593(Toth et al. (1999) Appl. Environ. Microbiol. 65: 4973-4980, 진뱅크 번호: AAD31841)에서의 상기 유전자 생성물이다.
3) 4-하이드록시-2-케토발레레이트 이화작용에 관여하는 이기능성 알돌라제(aldolase)-데하이드로게나제 복합체의 일부인 단백질. 이러한 이기능성 효소는 많은 세균 종들에서의 페놀, 톨루에이트, 나프탈렌, 바이페닐 및 다른 방향족 화합물들의 분해에서의 중간체인 카테콜의 메타-절단 경로의 최종 2개 단계들을 촉진한다(Powlowski and Shingler (1994) Biodegradation 5, 219-236). 4-하이드록시-2-케토발레레이트는 먼저 4-하이드록시-2-케토발레레이트 알돌라제에 의해 피루베이트 및 아세트알데하이드로 전환되고, 그 후 아세트알데하이드는 아세트알데하이드 데하이드로게나제에 의해 아세틸-CoA로 전환된다. 이러한 종류의 아세틸화 아세트알데하이드 데하이드로게나제의 일례는 슈도모나스(Pseudomonas) 종 CF600(진뱅크 번호: CAA43226)에서의 DmpF 단백질이다(Shingler et al. (1992) J. Bacteriol. 174:71 1-24). 에스케리키아 콜라이 MphF 단백질(Ferrandez et al. (1997) J. Bacteriol. 179: 2573- 2581, 진뱅크 번호: NP-414885)은 슈도모나스 종 CF600에서의 DmpF 단백질과 상동성을 가진다.
적합한 핵산 서열은 특히 에스케리키아, 특히 에스케리키아 콜라이; 마이코박테리움(Mycobacterium), 특히 마이코박테리움 마리눔(Mycobacterium marinum), 마이코박테리움 울세란스(Mycobacterium ulcerans), 마이코박테리움 튜버큘로시스(Mycobacterium tuberculosis); 카복시도써머스(Carboxydothermus), 특히 카복시도써머스 하이드로게노포르만스(Carboxydothermus hydrogenoformans); 엔타모에바(Entamoeba), 특히 엔타모에바 히스톨라이티카(Entamoeba histolytica); 시겔라(Shigella), 특히 시겔라 손네이(Shigella sonnei); 부르크홀데리아(Burkholderia), 특히 부르크홀데리아 슈도말레이(Burkholderia pseudomallei); 클렙시엘라(Klebsiella), 특히 클렙시엘라 뉴모니애(Klebsiella pneumoniae); 아조토박터(Azotobacter), 특히 아조토박터 우이넬란디이(Azotobacter uinelandii); 아조아르커스(Azoarcus) 종; 쿠프리아우이더스(Cupriauidus), 특히 쿠프리아우이더스 타이와넨시스(Cupriauidus taiwanensis); 슈도모나스, 특히 슈도모나스 종 CF600; 및 펠로마쿨룸(Pelomaculum), 특히 펠로토마쿨룸 써모프로피오니쿰(Pelotomaculum thermopropionicum)으로 구성된 군으로부터 선택된 유기체에서 발견될 수 있다. 바람직하게는, NADH-의존적 아세틸화 아세트알데하이드 데하이드로게나제를 암호화하는 핵산 서열은 에스케리키아, 보다 바람직하게는 에스케리키아 콜라이로부터 유래한다.
에스케리키아 콜라이로부터의 mhpF 유전자 또는 이의 기능성 상동체가 특히 적합하다. 이 유전자는 문헌(Ferrandez et al. (1997) J. Bacteriol. 179:2573-2581)에 기재되어 있다. 우수한 결과는 에스케리키아 콜라이로부터의 mhpF 유전자가 도입되어 있는 사카로마이세스 세레비지애를 사용하였을 때 수득되었다.
추가 유리한 실시양태에서, (아세틸화) 아세트알데하이드 데하이드로게나제를 암호화하는 핵산 서열은 특히, 슈도모나스 종 CF600으로부터의 슈도모나스 dmpF로부터 유래한다.
원칙적으로, NAD+-의존적 아세틸화 아세트알데하이드 데하이드로게나제를 암호화하는 핵산 서열은 야생형 핵산 서열일 수 있다. 바람직한 핵산 서열은 국제 특허출원 공개 제WO 2011/010923호의 서열번호 2 또는 서열번호 29, 또는 국제 특허출원 공개 제WO 2011/010923호의 서열번호 2 또는 서열번호 29의 기능성 상동체로 표시되는 NAD+-의존적 아세틸화 아세트알데하이드 데하이드로게나제를 암호화한다. 특히, 핵산 서열은 국제 특허출원 공개 제WO 2011/010923호의 서열번호 1 또는 서열번호 28, 또는 국제 특허출원 공개 제WO 2011/010923호의 서열번호 1 또는 서열번호 28의 기능성 상동체에 따른 서열을 포함한다.
추가로, 아세틸화 아세트알데하이드 데하이드로게나제(또는 이러한 활성을 암호화하는 핵산 서열)는 예를 들면, 에스케리키아 콜라이 adhE, 엔타모에바 히스톨라이티카 adh2, 스타필로코커스 아우레우스 adhE, 피로마이세스(Piromyces) 종.E2 adhE, 클로스트리듐 클루이베리 EDK33116, 락토바실러스 플란타룸 acdH 및 슈도모나스 푸티다(Pseudomonas putida) YP 001268189로 구성된 군으로부터 선택될 수 있다. 이 효소들의 서열, 이 효소들을 암호화하는 핵산 서열, 및 이 핵산 서열을 숙주 세포 내로 도입하는 방법에 대해서는 국제 특허출원 공개 제WO 2009/1013159호, 특히 실시예 3, 표 1(제26면) 및 이 표에서 언급된 서열번호(상기 공개공보의 표 1 및 상기 표에서 언급된 서열번호로 표시된 서열은 본원에 참고로 도입됨)를 참조한다.
바람직한 실시양태에서, 세포가 아세트알데하이드 데하이드로게나제 활성을 구비한 세포로 하여금 에탄올로의 아세틸-CoA의 전환을 완결할 수 있게 하는 내생성 알코올 데하이드로게나제 활성을 가진다는 것도 이해된다. 숙주 세포가 아세트알데하이드 데하이드로게나제 활성을 구비한 세포로 하여금 (아세틸-CoA를 통한) 에탄올로의 아세트산의 전환을 완결할 수 있게 하는 내생성 아세틸-CoA 신세타제를 가지는 것도 바람직하다.
아세트알데하이드 데하이드로게나제 활성을 가진 효소를 암호화하는 외생성 유전자는 바람직하게는 서열번호 1 내지 서열번호 5, 바람직하게는 서열번호 1 내지 서열번호 3 중 임의의 서열번호, 보다 바람직하게는 서열번호 1 또는 서열번호 2와 40%, 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 99% 이상의 아미노산 서열 동일성을 가진 아미노산 서열을 암호화하는 뉴클레오타이드 서열을 포함한다. 아세트알데하이드 데하이드로게나제 활성을 가진 효소를 암호화하는 외생성 유전자는 서열번호 1 내지 서열번호 5, 바람직하게는 서열번호 1 내지 서열번호 3 중 임의의 서열번호, 보다 바람직하게는 서열번호 1 또는 서열번호 2의 아미노산 서열에 비해 1개 또는 여러 개의 치환, 삽입 및/또는 결실을 가진 아미노산 서열을 암호화하는 뉴클레오타이드 서열을 포함할 수도 수 있다. 바람직하게는, 아미노산 서열은 각각 서열번호 1 내지 서열번호 5, 바람직하게는 각각 서열번호 1 내지 서열번호 3, 보다 바람직하게는 각각 서열번호 1 또는 서열번호 2에 비해 420개, 380개, 300개, 250개, 200개, 150개, 100개, 75개, 50개, 40개, 30개, 20개, 10개 또는 5개 이하의 아미노산 치환, 삽입 및/또는 결실을 가진다.
본원에서 아세트알데하이드 데하이드로게나제를 가진 효소를 암호화하는 외생성 유전자는 임의의 서열번호 Y와 40%, 50%, 60%, 65%, 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 95%, 96%, 97%, 98%, 99% 이상 또는 100%의 뉴클레오타이드(DNA) 서열 동일성을 가진 뉴클레오타이드 서열을 포함하는데, 이때 서열번호 Y는 뉴클레오타이드(DNA) 서열 48 내지 52 중 임의의 뉴클레오타이드 서열이다.
본 발명의 세포에서의 발현에 적합할 수 있는 adhE 효소의 공급원일 수 있는 일부 유기체들이 표 1에 언급되어 있다.
[표 1]
적합한 효소의 예는 에스케리키아 콜라이의 adhE, 락토바실러스 플란타룸의 acdH, 에스케리키아 콜라이의 eutE, 리스테리아 이노쿠아의 Lin1129 및 스타필로코커스 아우레우스의 adhE이다. 하기 실시예에서 시험되는 적합한 대안적 알코올/아세트알데하이드 데하이드로게나제를 제공하는 이 효소들의 BLAST에 대해서는 하기 표 2(a) 내지 2(e)를 참조한다.
[표 2(a)]
[표 2(b)]
[표 2(c)]
[표 2(d)]
[표 2(e)]
특징 b): 아세틸-CoA 신세타제(E.C. 6.2.1.1)를 암호화하는 하나 이상의 뉴클레오타이드 서열
(아세테이트-CoA 리가제(ligase) 및 아세틸 활성화 효소로서도 공지된) 아세틸-CoA 신세타제는 하기 표시된 바와 같이 아세테이트, 보조효소 A(CoA) 및 ATP로부터 아세틸-CoA를 형성하는 것을 촉진하는, 원핵생물 및 진핵생물 둘다에서 발견되는 편재하는 효소이다[PMID: 15316652]:
ATP + 아세테이트 + CoA = AMP + 다이포스페이트 + 아세틸-CoA (4)
이 효소의 활성은 많은 중요한 생합성 및 이화작용 과정들에서의 핵심 중간체인 아세틸-CoA의 요구된 수준을 유지하는 데에 매우 중요하다. 이것은 이 유기체들에서 아세틸-CoA로의 아세테이트의 활성화를 위한 유일한 경로이기 때문에 진핵 종에서 특히 중요하다(일부 원핵 종들은 아세테이트 키나제/포스포트랜스아세틸라제 또는 ADP 형성 아세틸-CoA 신타제로 아세테이트를 활성화시킬 수도 있다). 진핵생물은 전형적으로 아세틸-CoA 신타제의 두 동형체들(isoforms), 즉 생합성 과정에 관여하는 세포질 형태 및 주로 에너지 발생에 관여하는 미토콘드리아 형태를 가진다.
이 효소의 진핵생물(예를 들면, 효소) 형태 및 세균(예를 들면, 살모넬라) 형태의 결정 구조가 확인되어 있다. 효모 효소는 삼량체인 반면, 세균 효소는 단량체이다. 그러나, 삼량체 계면에 포함된 잔기가 다른 서열들에서 잘 보존되어 있지 않기 때문에, 효모 단백질의 삼량체 상태는 이 유기체에 유일무이할 수 있다. 두 효소들의 올리고머 상태에서의 차이에도 불구하고, 단량체의 구조는 거의 동일하다. 2개의 평행한 베타 시트를 함유하는 큰 N-말단 도메인(약 500개 잔기들)에 이어서, 나선을 가진 3-가닥 베타 시트를 함유하는 작은(약 110개의 잔기들) C-말단 도메인이 존재한다. 활성 부위는 도메인 계면에 존재하는데, 이때 그의 함량은 C-말단 도메인의 배향을 결정한다.
세포가 효모 세포일 때, 내생성 ACS가 본 발명에 따라 바람직하고 한 실시양태에서 효모 세포에서 과다발현된다.
적합한 예는 표 3에 나열되어 있다. 표 3의 상부에는 실시예에서 사용되고 BLAST에서 검색된 ACS2가 언급되어 있다.
[표 3]
ACS 활성을 가진 효소를 암호화하는 외생성 유전자는 바람직하게는 서열번호 6과 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 99% 이상의 아미노산 서열 동일성을 가진 아미노산 서열을 암호화하는 뉴클레오타이드 서열을 포함한다. ACS 활성을 가진 효소를 암호화하는 외생성 유전자는 서열번호 6의 아미노산 서열에 비해 1개 또는 여러 개의 치환, 삽입 및/또는 결실을 가진 아미노산 서열을 암호화하는 뉴클레오타이드 서열을 포함할 수도 있다. 바람직하게는, 아미노산 서열은 서열번호 6에 비해 420개, 380개, 300개, 250개, 200개, 150개, 100개, 75개, 50개, 40개, 30개, 20개, 10개 또는 5개 이하의 아미노산 치환, 삽입 및/또는 결실을 가진다.
본원에서 ACS 활성을 가진 효소를 암호화하는 외생성 유전자는 서열번호 53과 40%, 50%, 60%, 65%, 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 95%, 96%, 97%, 98%, 99% 이상 또는 100%의 뉴클레오타이드(DNA) 서열 동일성을 가진 뉴클레오타이드 서열을 포함한다.
특징 c): 특징 c)에 따라, 세포는 글리세롤 데하이드로게나제(E.C. 1.1.1.6)를 암호화하는 하나 이상의 뉴클레오타이드 서열을 포함한다. 글리세롤 데하이드로게나제(EC 1.1.1.6)는 하기 화학반응을 촉진하는 효소이다:
글리세롤 + NAD+ ↔ 글리세론 + NADH + H+ (5)
따라서, 이 효소의 두 기질들은 글리세롤 및 NAD+인 반면, 그의 3개 생성물들은 글리세론, NADH 및 H+이다. 글리세론 및 다이하이드록시아세톤은 본원에서 동의어이다.
이 효소는 옥시도리덕타제, 특히 수용자로서 NAD+ 또는 NADP+와 함께 공여자의 CH-OH 기에 작용하는 옥시도리덕타제의 패밀리에 속한다. 이 효소 부류의 체계적 명칭은 글리세롤:NAD+ 2-옥시도리덕타제이다. 흔히 사용되는 다른 명칭은 글리세린 데하이드로게나제 및 NAD+-연결된 글리세롤 데하이드로게나제이다. 이 효소는 글리세롤지질 대사에 참여한다. 구조 연구는 상기 효소가 단백질의 두 도메인들 사이에 놓여있는 활성 부위를 가진 아연-의존적 효소임을 보여주었다.
적합한 글리세롤 데하이드로게나제의 예는 표 4(a) 내지 4(d)에 나열되어 있다. 각각의 표의 상부에는 실시예에서 사용되고 BLAST에서 검색된 gldA가 언급되어 있다.
[표 4(a)]
[표 4(b)]
[표 4(c)]
[표 4(d)]
gldA 활성을 가진 효소를 암호화하는 외생성 유전자는 바람직하게는 서열번호 7 내지 서열번호 10 중 임의의 서열번호, 바람직하게는 서열번호 7 또는 서열번호 9와 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 99% 이상의 아미노산 서열 동일성을 가진 아미노산 서열을 암호화하는 뉴클레오타이드 서열을 포함한다. 아세트알데하이드 데하이드로게나제 활성을 가진 효소를 암호화하는 외생성 유전자는 서열번호 7 내지 서열번호 10 중 임의의 서열번호, 바람직하게는 서열번호 7 또는 서열번호 9의 아미노산 서열에 비해 1개 또는 여러 개의 치환, 삽입 및/또는 결실을 가진 아미노산 서열을 암호화하는 뉴클레오타이드 서열을 포함할 수도 있다. 바람직하게는, 아미노산 서열은 각각 서열번호 7, 서열번호 8, 서열번호 9 또는 서열번호 10, 바람직하게는 각각 서열번호 7 또는 서열번호 9에 비해 300개, 250개, 200개, 150개, 100개, 75개, 50개, 40개, 30개, 20개, 10개 또는 5개 이하의 아미노산 치환, 삽입 및/또는 결실을 가진다.
본원에서 gldA 활성을 가진 효소를 암호화하는 외생성 유전자는 서열번호 54 내지 서열번호 57 중 임의의 서열번호와 40%, 50%, 60%, 65%, 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 95%, 96%, 97%, 98%, 99% 이상 또는 100%의 뉴클레오타이드(DNA) 서열 동일성을 가진 뉴클레오타이드 서열을 포함한다.
특징 d): 다이하이드록시아세톤 키나제(E.C. 2.7.1.28 또는 E.C. 2.7.1.29)를 암호화하는 하나 이상의 이종 뉴클레오타이드 서열. 다이하이드록시아세톤 키나제 효소는 하기 반응들에 관여한다:
이 패밀리는 에스케리키아 콜라이에서와 같이 인단백질보다는 오히려 ATP(EC 2.7.1.29 또는 EC 2.7.1.28)를 포스페이트 공여자로서 사용하는 다이하이드록시아세톤 키나제(글리세론 키나제로서도 지칭됨)의 단일 쇄 형태의 예들로 구성된다. 이 형태는 에스케리키아 콜라이 효소의 K 서브유닛 및 L 서브유닛과 상동한 분리가능한 도메인들을 가지고, 효모 및 다른 진핵생물, 및 시트로박터 프레운디이(Citrobacter freundii)를 비롯한 일부 세균들에서 발견된다. 토마토로부터 유래한 구성원은 다이하이드록시아세톤, 3,4-다이하이드록시-2-부탄온, 및 일부 다른 알도스들 및 케토스들을 인산화시키는 것으로 밝혀졌다. 포유동물로부터 유래한 구성원은 다이하이드록시아세톤의 인산화 및 리보뉴클레오사이드 다이포스페이트-X 화합물들(이들 중에서 FAD가 가장 우수한 기질임)의 분할을 촉진하는 것으로 밝혀졌다. 효모에는 다이하이드록시아세톤 키나제의 두 이소자임들(isozymes)(Dak1 및 Dak2)이 존재한다. 세포가 효모 세포일 때, 내생성 DAK가 본 발명에 따라 바람직하고 한 실시양태에서 효모 세포에서 과다발현된다.
적합한 다이하이드록시아세톤 키나제의 예는 하기 표 5(a) 내지 5(d)에 나열되어 있다. 각각의 표의 상부에는 실시예에서 사용되고 BLAST에서 검색된 DAK가 언급되어 있다.
[표 5(a)]
[표 5(b)]
[표 5(c)]
[표 5(d)]
DAK 활성을 가진 효소를 암호화하는 외생성 유전자는 바람직하게는 서열번호 11 내지 서열번호 14 중 임의의 서열번호, 바람직하게는 서열번호 11 또는 서열번호 13과 40%, 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 99% 이상의 아미노산 서열 동일성을 가진 아미노산 서열을 암호화하는 뉴클레오타이드 서열을 포함한다. 아세트알데하이드 데하이드로게나제 활성을 가진 효소를 암호화하는 외생성 유전자는 서열번호 11 내지 서열번호 14 중 임의의 서열번호, 바람직하게는 서열번호 11 또는 서열번호 13의 아미노산 서열에 비해 1개 또는 여러 개의 치환, 삽입 및/또는 결실을 가진 아미노산 서열을 암호화하는 뉴클레오타이드 서열을 포함할 수도 있다. 바람직하게는, 아미노산 서열은 각각 서열번호 11, 서열번호 12, 서열번호 13 또는 서열번호 14, 바람직하게는 각각 서열번호 11 또는 서열번호 13에 비해 420개, 380개, 300개, 250개, 200개, 150개, 100개, 75개, 50개, 40개, 30개, 20개, 10개 또는 5개 이하의 아미노산 치환, 삽입 및/또는 결실을 가진다.
본원에서 DAK 활성을 가진 효소를 암호화하는 외생성 유전자는 서열번호 58 내지 서열번호 61 중 임의의 서열번호와 40%, 50%, 60%, 65%, 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 95%, 96%, 97%, 98%, 99% 이상 또는 100%의 뉴클레오타이드(DNA) 서열 동일성을 가진 뉴클레오타이드 서열을 포함한다.
한 실시양태에서, 세포는 글리세롤 3-포스페이트 포스포하이드롤라제를 암호화하고/하거나 글리세롤 3-포스페이트 데하이드로게나제 유전자를 암호화하는 하나 이상의 내생성 뉴클레오타이드 서열의 결실 또는 파괴를 포함한다.
본원에서 NADH-의존적 글리세롤 합성을 위해 필요한 효소 활성이 세포에서 감소되어 있거나 결실되어 있다. 이 효소 활성의 감소 또는 결실은 상기 효소가 야생형에서의 발현 수준보다 상당히 더 낮은 수준으로 발현되도록 또는 유전자가 감소된 활성을 가진 폴리펩타이드를 암호화하도록 NAD-의존적 글리세롤 3-포스페이트 데하이드로게나제 활성(GPD)을 암호화하는 하나 이상의 유전자 또는 글리세롤포스페이트 포스파타제 활성(GPP)을 암호화하는 하나 이상의 유전자를 변형시킴으로써 달성될 수 있다.
이러한 변형은 통상적으로 공지된 생명공학적 기법을 이용함으로써 수행될 수 있고, 특히 GPD 및/또는 GPP를 암호화하는 구조 유전자의 프로모터 영역 또는 암호화 영역의 하나 이상의 넉-아웃(knock-out) 돌연변이 또는 부위-지정된(site-directed) 돌연변이유발을 포함할 수 있다. 대안적으로, 글리세롤 생성이 결여된 효모 균주는 무작위 돌연변이유발에 이은 감소된 또는 부재하는 GPD 및/또는 GPP 활성을 가진 균주의 선별에 의해 수득될 수 있다. 사카로마이세스 세레비지애 GPD1, GPD2, GPP1 및 GPP2 유전자는 국제 특허출원 공개 제WO 2011/010923호에 제시되어 있고, 이 출원의 서열번호 24 내지 서열번호 27에 개시되어 있다.
바람직하게는, GPD를 암호화하는 하나 이상의 유전자 또는 GPP를 암호화하는 하나 이상의 유전자가 전체적으로 결실되거나, 그의 활성에 필수적인 효소의 일부를 암호화하는 상기 유전자의 적어도 일부가 결실된다. 특히, 우수한 결과는 GPD1 유전자 및 GPD2 유전자의 개방 판독 프레임(open reading frames)이 불활성화되어 있는 사카로마이세스 세레비지애 세포에 의해 달성되었다. 구조 유전자(표적 유전자)의 불활성화는 결실될 숙주 세포 게놈의 영역을 플랭킹하는 서열과 동일한 DNA 서열에 의해 플랭킹된 선별 마커 유전자로 구성된 DNA 단편을 합성적으로 합성하거나 다른 방식으로 구축함으로써 당업자에 의해 달성될 수 있다. 구체적으로, 우수한 결과는 마커 유전자 kanMX 및 hphMX4의 삽입에 의한 사카로마이세스 세레비지애 내의 GPD1 및 GPD2 유전자의 불활성화에 의해 수득되었다. 그 후, 이 DNA 단편은 숙주 세포 내로 형질전환된다. 우성 마커 유전자를 발현하는 형질전환된 세포를, 결실되도록 디자인된 영역의 정확한 치환에 대해 예를 들면, 진단 중합효소 연쇄 반응 또는 서던 혼성화(southern hybridization)로 확인한다.
따라서, 본 발명의 세포에서 특정 글리세롤 3-포스페이트 포스포하이드롤라제 및/또는 글리세롤 3-포스페이트 데하이드로게나제 유전자가 감소된다. 본 발명의 세포에서 특정 글리세롤포스페이트 데하이드로게나제 활성은 특정 활성에서의 감소를 야기하는 유전적 변형을 제외하고 유전적으로 동일한 균주에 비해 바람직하게는 혐기성 조건 하에서 0.8배, 0.5배, 0.3배, 0.1배, 0.05배 또는 0.01배 이상까지 감소된다. 글리세롤포스페이트 데하이드로게나제 활성은 문헌(Overkamp et al., 2002, Yeast 19:509-520)에 기재된 바와 같이 측정될 수 있다.
바람직하게는, 유전적 변형은 세포의 게놈에서 특정 글리세롤포스페이트 데하이드로게나제를 암호화하는 유전자의 각각의 내생성 카피의 발현을 감소시키거나 불활성화시킨다. 주어진 세포는 이배수성(diploidy), 다배수성(polyploidy) 또는 이수배수성(aneuploidy)의 결과로서 1개의 동일한 아미노산 서열을 가진 특정 글리세롤포스페이트 데하이드로게나제를 암호화하는 유전자의 다수의 카피들을 포함할 수 있다. 이러한 경우, 바람직하게는 글리세롤포스페이트 데하이드로게나제를 암호화하는 특정 유전자의 각각의 카피의 발현이 감소되거나 불활성화된다. 대안적으로, 세포는 아미노산 서열에서 상이하고 상이한 유전자에 의해 각각 암호화되는, 글리세롤포스페이트 데하이드로게나제 활성을 가진 여러 상이한 (동종)효소들을 함유할 수 있다. 이러한 경우, 본 발명의 일부 실시양태들에서, 일부 종류의 동종효소들만이 감소되거나 불활성화되는 반면, 다른 종류의 동종효소들은 영향을 받지 않은 상태로 남아있는 것이 바람직할 수 있다. 그러나, 바람직하게는, 글리세롤포스페이트 데하이드로게나제 활성을 가진 (동종)효소를 암호화하는 유전자의 모든 카피들의 발현이 감소되거나 불활성화된다.
바람직하게는, 글리세롤포스페이트 데하이드로게나제 활성을 암호화하는 유전자는 이 유전자의 적어도 일부의 결실 또는 이 유전자의 파괴에 의해 불활성되므로, 이러한 상황에서 용어 유전자는 암호화 서열의 상류 또는 하류에 있는 임의의 비-암호화 서열도 포함하고, 이러한 서열의 (부분적) 결실 또는 불활성화는 숙주 세포에서 글리세롤포스페이트 데하이드로게나제 활성의 발현을 감소시킨다.
본 발명의 세포에서 감소되거나 불활성화될 활성을 가진 글리세롤포스페이트 데하이드로게나제를 암호화하는 바람직한 유전자는 아미노산 서열 GPD1 및 다른 종에서의 그의 오르톨로그(orthologues)를 암호화하는, 문헌(van den Berg and Steensma, 1997, Yeast 13:551-559)에 기재된 사카로마이세스 세레비지애 GPD1이다.
사카로마이세스(Saccharomyces), 나우모보자이나(Naumovozyna), 칸디다 반데르왈토자이마(Candida Vanderwaltozyma) 및 자이고사카로마이세스(Zygosaccharomyces) 속에 속하는, 글리세롤포스페이트 데하이드로게나제 활성을 가진 효소를 포함하는 유기체(숙주)의 적합한 예는 표 6에 제공되어 있다.
[표 6]
그러나, 예를 들면, 사카로마이세스, 칸디다 및 자이고사카로마이세스의 일부 균주들에서 글리세롤포스페이트 데하이드로게나제를 암호화하는 제2 유전자, 즉 GPD2가 활성을 나타낸다(예를 들면, 상기 문헌(Overkamp et al., 2002) 참조). 따라서, 본 발명의 세포에서 감소되거나 불활성화될 활성을 가진 글리세롤포스페이트 데하이드로게나제를 암호화하는 또 다른 바람직한 유전자는 아미노산 서열 GPD2 및 다른 종에서의 그의 오르톨로그를 암호화하는, 상기 문헌(Overkamp et al., 2002)에 기재된 사카로마이세스 세레비지애 GPD2이다.
(자이고)사카로마이세스 및 칸디다 속에 속하는, 글리세롤포스페이트 데하이드로게나제 활성을 가진 효소를 포함하는 유기체(숙주)의 적합한 예는 표 7에 제공되어 있다.
[표 7]
한 실시양태에서, 세포는 효모이고, 이때 효모 세포의 게놈은 GPD1, GPD2, GPP1 및 GPP2로 구성된 군으로부터 선택된 하나 이상의 유전자 내의 돌연변이를 포함하고, 이 돌연변이는 효모 세포의 상응하는 야생형 효모 유전자에 비해 상기 유전자들 중 하나 이상의 완전한 결실일 수 있는 넉-아웃 돌연변이일 수 있다.
본원의 효소 활성이 본 발명의 형질전환된 숙주 세포에서 충분한 수준으로 활성화된 형태로 발현될 가능성을 증가시키기 위해, 이 효소 및 본 발명의 다른 효소(하기 참조)를 암호화하는 뉴클레오타이드 서열은 바람직하게는 그의 코돈 사용빈도를 해당 숙주 세포의 코돈 사용빈도에 맞추어져 최적화된다. 효소를 암호화하는 뉴클레오타이드 서열이 숙주 세포의 코돈 사용빈도에 맞추어진 정도는 코돈 맞춤(adaptiveness) 지수(CAI)로서 표현될 수 있다. 코돈 맞춤 지수는 본원에서 유전자의 코돈 사용빈도가 특정 숙주 세포 또는 유기체에서 고도로 발현되는 유전자의 코돈 사용빈도에 상대적으로 맞추어진 정도의 측정치로서 정의된다. 각각의 코돈이 상대적으로 맞추어진 정도(w)는 동일한 아미노산에 대한 가장 풍부한 코돈의 사용빈도에 대한 각각의 코돈의 사용빈도의 비이다. CAI 지수는 이 상대적으로 맞추어진 정도 값의 기하 평균으로서 정의된다. 동일한 의미가 아닌 코돈들 및 종결 코돈들(유전적 코드에 의해 좌우됨)은 배제된다. CAI 값은 0 내지 1이고, 이때 보다 더 높은 값은 가장 풍부한 코돈의 보다 더 높은 비율을 표시한다(문헌(Sharp and Li, 1987, Nucleic Acids Research 15: 1281-1295) 참조; 문헌(Jansen et al., 2003, Nucleic Acids Res. 31(8):2242-51) 또한 참조). 맞추어진 뉴클레오타이드 서열은 바람직하게는 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8 또는 0.9 이상의 CAI를 가진다. 해당 진균 숙주 세포, 예를 들면, 사카로마이세스 세레비지애 세포에서의 발현을 위해 코돈 최적화된 서열이 가장 바람직하다.
균주 구축
본원의 실시예에서 이용된 균주 구축 방법은 국제 특허출원 제PCT/EP2013/056623호에 기재되어 있다. 상기 특허출원에는 관심있는 다양한 유전자들로부터의 발현 카세트들이 한 경로로 조합되어 효모의 형질전환 시 이 효모 게놈의 특정 좌위 내에 삽입되도록 이 발현 카세트들을 구축할 수 있게 하는 기법이 기재되어 있다.
실시예에서 이용된 균주 구축 방법의 개요는 도 2에 제공되어 있다. 도 2는 균주 구축 방식의 개략적 표시를 보여준다. PCR을 이용하여 선별 마커를 포함하는, INT(삽입) 플랭크 및 발현 카세트(CAS)를 증폭하고 효모 내로 전달한다. (도 2에서 각각 5, a, b, c 및 3으로서 표시된) 연결제들 사이에서 재조합이 일어남으로써, 효모 게놈 내의 원하는 위치(이 경우, INT1)에서 경로가 삽입될 것이다. 관심있는 유전자의 수는 실시예에 기재된 바와 같이 증가될 수 있다. 유일무이한 연결제를 사용하여 별개의 발현 카세트들의 재조합 및 수용자 세포의 게놈 내로의 삽입을 용이하게 하였다. 선행기술에 따른 임의의 다른 균주 구축 방법이 본 발명의 균주를 구축하는 데에 동등하게 이용될 수 있다.
상동성
및 동일성
아미노산 또는 뉴클레오타이드 서열은 일정 수준의 유사성을 나타낼 때 상동성을 가진다고 주장된다. 상동한 2개의 서열들은 공통된 진화 기원을 시사한다. 2개의 상동성 서열들이 밀접하게 관련되어 있는지 아니면 보다 더 멀리 관련되어 있는지는 각각 높은 또는 낮은 "퍼센트 동일성" 또는 "퍼센트 유사성"에 의해 표시된다. 논쟁의 여지가 있지만, "퍼센트 동일성" 또는 "퍼센트 유사성"을 표시하기 위해, "상동성 수준" 또는 "퍼센트 상동성"이 종종 상호교환적으로 사용된다.
수학적 알고리즘을 사용하여 서열들의 비교 및 2개의 서열들 사이의 퍼센트 동일성의 측정을 달성할 수 있다. 당업자는 여러 상이한 컴퓨터 프로그램들이 2개의 서열들을 정렬하고 2개의 서열들 사이의 상동성을 측정하는 데에 이용될 수 있다는 사실을 인식할 것이다(Kruskal, J. B. (1983) An overview of sequence comparison In D. Sankoff and J. B. Kruskal, (ed.), Time warps, string edits and macromolecules: the theory and practice of sequence comparison, pp. 1-44 Addison Wesley). 2개의 서열들의 정렬을 위한 니들만(Needleman) 및 분슈(Wunsch) 알고리즘을 이용하여 2개의 아미노산 서열들 사이의 퍼센트 동일성을 측정할 수 있다(Needleman, S. B. and Wunsch, C. D. (1970) J. Mol. Biol. 48, 443-453). 상기 알고리즘은 아미노산 서열뿐만 아니라 뉴클레오타이드 서열도 정렬한다. 니들만-분슈 알고리즘은 컴퓨터 프로그램 NEEDLE에서 실행되어 왔다. 본 발명의 목적을 위해, EMBOSS 팩키지로부터의 NEEDLE 프로그램을 사용하였다(버전 2.8.0 이상, EMBOSS: The European Molecular Biology Open Software Suite (2000) Rice,P. Longden,I. and Bleasby,A. Trends in Genetics 16, (6) pp276-277, http://emboss.bioinformatics.nl/). 단백질 서열의 경우, EBLOSUM62가 치환 매트릭스를 위해 사용된다. 뉴클레오타이드 서열의 경우, EDNAFULL이 사용된다. 다른 매트릭스들도 특정될 수 있다. 아미노산 서열들의 정렬을 위해 사용된 임의적 파라미터는 10의 갭(gap)-개방 벌점 및 0.5의 갭 연장 벌점이다. 당업자는 모든 이들 상이한 파라미터들이 약간 상이한 결과를 제공할 것이지만 상이한 알고리즘을 사용할 때 2개의 서열들의 전체 백분율 동일성이 유의하게 변경되지 않는다는 것을 인식할 것이다.
전체적인
상동성
정의
상동성 또는 동일성은 임의의 갭 또는 연장을 포함하는 총 정렬된 영역에 걸쳐 2개의 전체 서열들 사이의 동일한 일치(matches)의 백분율이다. 2개의 정렬된 서열들 사이의 상동성 또는 동일성은 다음과 같이 계산된다: 갭을 포함하는 정렬의 총 길이로 나누어진, 두 서열들에서 동일한 아미노산을 보이는 정렬에서의 상응하는 위치의 수. 본원에서 정의된 동일성은 NEEDLE로부터 수득될 수 있고 프로그램의 출력물에서 "동일성"으로서 표지된다.
가장 긴 동일성 정의
2개의 정렬된 서열들 사이의 상동성 또는 동일성은 다음과 같이 계산된다: 정렬에서의 갭의 총수의 차감 후 정렬의 총 길이로 나누어진, 두 서열들에서 동일한 아미노산을 보이는 정렬에서의 상응하는 위치의 수. 본원에서 정의된 동일성은 NOBRIEF 옵션을 사용함으로써 NEEDLE로부터 수득될 수 있고 프로그램의 출력물에서 "가장 긴 동일성"으로서 표지된다.
본원에 기재된 본 발명의 다양한 실시양태들은 교차조합될 수 있다.
본 발명의 추가 실시양태
한 실시양태에서, 효모 세포는 NAD+-의존적 알코올 데하이드로게나제 활성(EC 1.1.1.1)을 암호화하는 하나 이상의 핵산 서열을 포함한다. 이 효소는 에탄올로의 아세트알데하이드의 전환을 촉진한다. 효모 세포는 사카로마이세스 세레비지애(ADH1-5)와 마찬가지로 이러한 데하이드로게나제를 암호화하는 유전자를 천연적으로 포함할 수 있거나(문헌(Lutstorf and Megnet. 1968 Arch. Biochem. Biophys. 126:933-944), 또는 문헌(Ciriacy, 1975, Mutat. Res. 29:315-326) 참조), 숙주 세포는 이 활성을 암호화하는 하나 이상의 이종 유전자(들)를 구비할 수 있다. 예를 들면, 사카로마이세스 세레비지애의 ADH1-5 유전자들 중 임의의 유전자 또는 각각의 유전자, 또는 이의 기능성 상동체는 본 발명에 따른 세포 내로 도입될 수 있다.
한 실시양태에서, 효모 세포는 사카로마이세타세애(Saccharomycetaceae), 특히 사카로마이세스, 예컨대, 사카로마이세스 세레비지애; 클루이베로마이세스, 예컨대, 클루이베로마이세스 마르시아누스(Kluyveromyces marxianus); 피키아(Pichia), 예컨대, 피키아 스티피티스(Pichia stipitis) 또는 피키아 안구스타(Pichia angusta); 자이고사카로마이세스, 예컨대, 자이고사카로마이세스 바일리이(Zygosaccharomyces bailii); 브레타노마이세스(Brettanomyces), 예컨대, 브레타노마이세스 인터메디우스(Brettanomyces intermedius); 이사첸키아(Issatchenkia), 예컨대, 이사첸키아 오리엔탈리스(Issatchenkia orientalis); 및 한세눌라(Hansenula)로 구성된 군으로부터 선택된다.
한 실시양태에서, 세포는 원핵세포이다. 한 실시양태에서, 세포는 클로스트리듐(Clostridium), 자이모모나스(Zymomonas), 써모박터(Thermobacter), 에스케리키아(Escherichia), 락토바실러스(Lactobacillus), 게오바실러스(Geobacillus) 및 바실러스(Bacillus)로 구성된 목록으로부터 선택된다.
본 발명은 발효 생성물, 바람직하게는 에탄올의 제조를 위한 본 발명에 따른 효모 세포의 용도에 관한 것이기도 하다. 본 발명은 아세테이트 및 발효가능한 탄수화물, 특히 글루코스, 프럭토스, 수크로스, 말토스, 자일로스, 아라비노스, 갈락토스 및 만노스로 구성된 군으로부터 선택된 탄수화물로부터 발효 생성물을 제조하는 단계를 포함하는, 발효 생성물을 제조하는 방법도 제공하는데, 상기 제조는 본 발명에 따른 효모 세포를 사용함으로써 혐기성 조건 하에서 수행된다. 한 실시양태에서, 상기 제조는 0.7 이하, 구체적으로 적어도 0.004 내지 0.5, 보다 구체적으로 0.05 내지 0.3의 몰비로 아세테이트 및 탄수화물을 포함하는 발효 배지에서 수행된다. 발효 생성물의 제조의 한 실시양태에서, 탄수화물의 적어도 일부 및 아세테이트의 적어도 일부는 리그노셀룰로스, 셀룰로스, 헤미셀룰로스 및 펙틴으로 구성된 군으로부터 선택된 폴리사카라이드의 가수분해에 의해 수득되었다. 리그노셀룰로스는 바람직하게는 가수분해되어 발효가능한 탄수화물 및 아세테이트를 제공하는 리그노셀룰로스성 바이오매스이다.
한 실시양태에서, 리그노셀룰로스성 또는 헤미셀룰로스성 물질은 효소 조성물과 접촉되는데, 이때 하나 이상의 당이 생성되고, 생성된 당은 발효되어 발효 생성물을 제공하고, 발효는 본 발명에 따른 효모 세포에 의해 수행된다.
본 발명의 발효 생성물은 임의의 유용한 생성물일 수 있다. 한 실시양태에서, 상기 발효 생성물은 에탄올, n-부탄올, 이소부탄올, 락트산, 3-하이드록시-프로피온산, 아크릴산, 아세트산, 석신산, 아디프산, 푸마르산, 말산, 이타콘산, 말레산, 시트르산, 아디프산, 아미노산, 예컨대, 라이신, 메티오닌, 트립토판, 쓰레오닌 및 아스파르트산, 1,3-프로판-다이올, 에틸렌, 글리세롤, β-락탐 항생제 및 세팔로스포린, 비타민, 약제, 동물 사료 보충제, 특수 화학물질, 화학적 공급원료, 플라스틱, 용매, 바이오연료 및 바이오가스 또는 유기 중합체를 비롯한 연료, 및 산업용 효소, 예컨대, 프로테아제(protease), 셀룰라제(cellulase), 아밀라제(amylase), 글루카나제(glucanase), 락타제(lactase), 리파제(lipase), 라이아제(lyase), 옥시도리덕타제(oxidoreductases), 트랜스퍼라제(transferase) 또는 자일라나제(xylanase)로 구성된 군으로부터 생성물이다.
한 실시양태에서, 발효 생성물은 에탄올, 부탄올, 락트산, 플라스틱, 유기산, 용매, 동물 사료 보충제, 약제, 비타민, 아미노산, 효소 및 화학적 공급원료 중 하나 이상일 수 있다.
바람직한 실시양태에서, 세포는 혐기성 조건 하에서 생장된다. 혐기성 생장 조건은 본원에서 혐기성 조건 또는 산소가 한정된 조건이다. 혐기성은 본원에서 산소의 부재 하에서 또는 실질적으로 산소가 소비되지 않는, 바람직하게는 약 5 mmol/ℓ/시간, 약 2.5 mmol/ℓ/시간 또는 약 1 mmol/ℓ/시간 미만의 산소가 소비되는 조건 하에서 실시되는 생장 과정으로서 정의되고, 이때 유기 분자는 전자 공여자 및 전자 수용자 둘다로서 작용한다.
산소-한정된 생장 과정은 산소 소비가 기체로부터 액체로의 산소 전달에 의해 한정되는 과정이다. 산소 한정의 정도는 유입 기체 유동의 양 및 조성뿐만 아니라 이용된 발효 장치의 실제 혼합/질량 전달 성질에 의해 결정된다. 바람직하게는, 산소-한정된 조건 하에서의 과정에서, 산소 소비의 속도는 약 5.5 mmol/ℓ/시간 이상, 보다 바람직하게는 약 6 mmol/ℓ/시간 이상, 예컨대, 7 mmol/ℓ/시간 이상이다. 본 발명의 방법은 발효 생성물의 회수를 포함한다. 발효 동안, 아세트산이 존재할 때, 아세트산/아세테이트의 비는 pH에 의해 좌우될 것이다. 단계 d)에서 아세테이트의 농도는 효모 균주가 그의 최종 사용에서 충족시키는 농도와 유사하게 선택될 수 있다(예를 들면, 발효 생성물로의 리그노셀룰로스성 가수분해물의 발효에서 이러한 가수분해물은 1 내지 10 g/ℓ의 아세테이트, 예를 들면, 2 g/ℓ의 아세테이트를 함유할 수 있다).
유리하게는, 본 발명에 따라 에탄올이 생성될 때, 에탄올은 0.04:1 미만, 특히 0.02:1 미만, 바람직하게는 0.01:1 미만의 글리세롤:에탄올의 몰비로 생성된다. 적어도 일부 실시양태들(NADH-의존적 글리세롤 합성이 감소되지만 완전히 억제되지 않는 경우)에서 일부 글리세롤이 예를 들면, 0.001:1 이상의 글리세롤 대 에탄올의 비로 부산물로서 생성될 수 있지만, 글리세롤 생성은 존재하지 않을(검출불가능할) 수 있다.
본 발명은 NADH-의존적 반응을 통해 아세트산을 에탄올로 환원시킴으로써 NADH를 재산화시킬 수 있도록 재조합 효모 세포, 특히 사카로마이세스 세레비지애를 제공함으로써 글리세롤 생성의 완전한 제거 또는 적어도 그의 상당한 감소를 가능하게 한다.
이것은 글리세롤 생성이 피해지거나 적어도 감소된다는 점에서 유리할 뿐만 아니라, NADH의 재산화에서 형성된 생성물도 원하는 생성물, 즉 에탄올이기 때문에 본 발명의 방법이 (전환된 공급원료, 즉 에탄올로 전환된 탄수화물 + 아세트산의 중량%로서 측정된) 증가된 생성물 수율도 제공할 수 있다는 점에서도 유리하다. 아세트산이 일반적으로 리그노셀룰로스성 가수분해물에서 상당한 양으로 사용될 수 있기 때문에, 이것은 본 발명이 발효가능한 탄수화물을 위한 공급원으로서 리그노셀룰로스성 바이오매스를 사용하는 에탄올의 제조에 특히 유리하게 만든다. 추가로, 상당한 양의 아세테이트를 함유할 수 있는 탄수화물 공급원은 사탕무 당밀(이의 가수분해물), 및 (예를 들면, 옥수수 건식 제분 과정, 옥수수 습식 제분 과정, 또는 예를 들면, 찌꺼기 재활용을 이용하는 전분 폐기물 과정으로부터의 폐기물을 함유하는) 전분을 포함한다.
추가 바람직한 실시양태에서, 본 발명의 숙주 세포는 a) 자일로스를 자일룰로스로 이성질체화하는 능력; 및 b) L-아라비노스를 D-자일룰로스 5-포스페이트로 전환시키는 능력 중 하나 이상을 가진다. a)의 경우, 효모 세포는 바람직하게는 자일로스를 자일룰로스로 이성질체화하는 능력을 효모 세포에게 부여하는 유전자인 기능성 외생성 자일로스 이소머라제(isomerase) 유전자를 가진다. b)의 경우, 효모 세포는 바람직하게는 L-아라비노스를 D-자일룰로스 5-포스페이트로 이성질체화하여 전환시키는 능력을 효모 세포에게 함께 부여하는 유전자들인, L-아라비노스 이소머라제, L-리불로키나제(ribulokinase) 및 L-리불로스-5-포스페이트 4-에피머라제(epimerase)를 암호화하는 기능성 외생성 유전자들을 가진다.
진균 숙주 세포는 예를 들면, 국제 특허출원 공개 제WO 03/0624430호 및 제WO 06/009434호에 기재된 바와 같이 자일로스를 자일룰로스로 이성질체화하는 능력을 가진다. 자일로스를 자일룰로스로 이성질체화하는 능력은 바람직하게는 자일로스 이소머라제를 암호화하는 뉴클레오타이드 서열을 포함하는 핵산 구축물을 사용한 형질전환에 의해 효모 세포에게 부여된다. 바람직하게는, 이로써 효모 세포는 자일로스를 자일룰로스로 직접 이성질체화하는 능력을 획득한다. 보다 바람직하게는, 이로써 효모 세포는 자일룰로스로의 자일로스의 직접적인 이성질체화(및 자일룰로스의 추가 대사)를 통해 단독 에너지 및/또는 탄소 공급원인 자일로스 상에서 호기성 및/또는 혐기성 조건 하에서 생장하는 능력을 획득한다. 본원에서 자일룰로스로의 자일로스의 직접적인 이성질체화는 각각 자일로스 리덕타제 및 자일리톨 데하이드로게나제에 의해 촉진된 자일리톨 중간체를 통한 자일룰로스로의 자일로스의 2 단계 전환과 대조적으로 자일로스 이소머라제에 의해 촉진된 단일 반응에서 일어난다는 것이 이해된다.
자일로스를 자일룰로스로 직접 이성질체화하는 능력을 본 발명의 효모 세포에게 부여하는 데에 성공적으로 사용될 수 있는 여러 자일로스 이소머라제들(및 이들의 아미노산 및 암호화 뉴클레오타이드 서열들)이 당분야에서 기재되어 있다. 이들은 피로마이세스(Piromyces) 종, 및 네오칼리마스틱스(Neocallimastix), 캐코마이세스(Caecomyces), 피로마이세스 또는 루미노마이세스(Ruminomyces)(국제 특허출원 공개 제WO 03/0624430호), 사일라마이세스 애버렌시스(Cyllamyces aberensis)(미국 특허출원 공개 제20060234364호) 또는 오르피노마이세스(Orpinomyces)(Madhavan et al., 2008, DOI 10.1007/s00253008-1794-6)에 속하는 다른 혐기성 진균의 자일로스 이소머라제; 예를 들면, 박테로이데스 쎄타이오타오마이크론(B. thetaiotaomicron)(국제 특허출원 공개 제WO 06/009434호), 박테로이데스 프라길리스(B. fragilis) 및 박테로이데스 유니포르미스(B. uniformis)(국제 특허출원 공개 제WO 09/109633호)를 포함하는 박테로이데스(Bacteroides) 세균 속의 자일로스 이소머라제; 혐기성 세균 클로스트리듐 파이토퍼멘탄스(Clostridium phytofermentans)(Brat et al., 2009, Appl. Environ. Microbiol. 75:2304-2311)의 자일로스 이소머라제; 및 클로스트리듐 디피사일(Clostridium difficile), 시오나 인테스티날레스(Ciona intestinales) 및 푸소박테리움 모르티페룸(Fusobacterium mortiferum)(국제 특허출원 공개 제WO 10/074577호)의 자일로스 이소머라제를 포함한다.
진균 숙주 세포는 예를 들면, 문헌(Wisselink et al., 2007, Appl. Environ. Microbiol. doi:10.1128/AEM.00177-07) 및 유럽 특허 제1 499 708호에 기재된 바와 같이 L-아라비노스를 D-자일룰로스 5-포스페이트로 전환시키는 능력을 가진다. L-아라비노스를 D-자일룰로스 5-포스페이트로 전환시키는 능력은 바람직하게는 a) 아라비노스 이소머라제; b) 리불로키나제, 바람직하게는 L-리불로키나제 자일로스 이소머라제; 및 c) 리불로스-5-P-4-에피머라제, 바람직하게는 L-리불로스-5-P-4-에피머라제를 암호화하는 뉴클레오타이드 서열을 포함하는 핵산 구축물(들)을 사용한 형질전환에 의해 효모 세포에게 부여된다. 바람직하게는, 본 발명의 효모 세포에서 L-아라비노스를 D-자일룰로스 5-포스페이트로 전환시키는 능력은 후속 반응인 1) 리불로스로의 아라비노스의 이성질체화; 2) 리불로스 5-포스페이트로의 리불로스의 인산화; 및 3) D-자일룰로스 5-포스페이트로의 리불로스 5-포스페이트의 에피머화를 통해 L-아라비노스를 D-자일룰로스 5-포스페이트로 전환시키는 능력이다. 아라비노스 이소머라제, 리불로키나제 및 리불로스-5-P-4-에피머라제를 암호화하는 적합한 뉴클레오타이드 서열은 바실러스 서브틸리스(Bacillus subtilis), 에스케리키아 콜라이(예를 들면, 유럽 특허 제1 499 708호 참조), 락토바실리(Lactobacilli), 예를 들면, 에스케리키아 콜라이(예를 들면, 상기 문헌(Wisselink et al.); 및 국제 특허출원 공개 제WO 2008/041840호 참조), 또는 클라비박터(Clavibacter), 아쓰로박터(Arthrobacter) 및 그라멜라(Gramella)의 종, 바람직하게는 클라비박터 미시가넨시스(Clavibacter michiganensis), 아쓰로박터 아우레센스(Arthrobacter aurescens) 및 그라멜라 포르세티이(Gramella forsetii)(국제 특허출원 공개 제WO 2009/011591호 참조)로부터 수득될 수 있다.
본 발명의 형질전환된 세포는 바람직하게는 자일로스로부터 이성질체화된 자일룰로스가 피루베이트로 대사될 수 있도록 자일룰로스 키나제 활성을 추가로 포함한다. 바람직하게는, 효모 세포는 내생성 자일룰로스 키나제 활성을 함유한다. 보다 바람직하게는, 본 발명의 세포는 특정 자일룰로스 키나제 활성을 증가시키는 유전적 변형을 포함한다. 바람직하게는, 유전적 변형은 예를 들면, 자일룰로스 키나제를 암호화하는 뉴클레오타이드 서열의 과다발현에 의한 자일룰로스 키나제의 과다발현을 야기한다. 자일룰로스 키나제를 암호화하는 유전자는 효모 세포에 대한 내생성을 가질 수 있거나 효모 세포에 대한 이종성을 가지는 자일룰로스 키나제일 수 있다. 본 발명의 효모 세포에서 자일룰로스 키나제의 과다발현을 위해 사용될 수 있는 뉴클레오타이드 서열은 예를 들면, 문헌(Deng and Ho, 1990, Appl. Biochem. Biotechnol. 24-25: 193-199)에 기재된 바와 같이 사카로마이세스 세레비지애로부터의 자일룰로스 키나제 유전자(XKS1)이다. 또 다른 바람직한 자일룰로스 키나제는 피로마이세스로부터의 자일룰로스 키나제(xylB; 국제 특허출원 공개 제WO 03/0624430호 참조)와 관련된 자일로스 키나제이다. 이 피로마이세스 자일룰로스 키나제는 실제로 모든 공지된 진핵 키나제들, 예컨대, 효모 키나제보다 원핵 키나제와 더 관련되어 있다. 진핵 자일룰로스 키나제는 자일룰로스를 포함하는 넓은 기질 범위를 가진 비특이적 당 키나제로서 표시되어 왔다. 대조적으로, 피로마이세스 키나제와 가장 밀접하게 관련되어 있는 원핵 자일룰로스 키나제는 자일룰로스에 대한 보다 더 높은 특이성, 즉 보다 더 좁은 기질 범위를 가진 키나제인 것으로서 표시되어 왔다. 본 발명의 효모 세포에서, 과다발현될 자일룰로스 키나제는 과다발현을 야기하는 유전적 변형을 제외하고 유전적으로 동일한 균주에 비해 1.1배, 1.2배, 1.5배, 2배, 5배, 10배 또는 20배 이상까지 과다발현된다. 과다발현의 이 수준은 효소 활성의 정상 상태 수준, 효소 단백질의 정상 상태 수준 및 효소를 암호화하는 전사체의 정상 상태 수준에 적용될 수 있다는 것을 이해해야 한다.
본 발명의 세포는 바람직하게는 국제 특허출원 공개 제WO 06/009434호에 기재된 바와 같이 펜토스 포스페이트 경로의 유동을 증가시키는 유전적 변형을 추가로 포함한다. 한 실시양태에서, 유전적 변형은 (비-산화적 부분) 펜토스 포스페이트 경로의 하나 이상의 효소의 과다발현을 포함한다. 바람직하게는, 효소는 리불로스-5-포스페이트 이소머라제, 리불로스-5-포스페이트 3-에피머라제, 트랜스케톨라제(transketolase) 및 트랜스알돌라제(transaldolase)를 암호화하는 효소들로 구성된 군으로부터 선택된다.
본 발명의 추가 바람직한 세포는 효모 세포에서 비특이적 알도스 리덕타제 활성을 감소시키는 유전적 변형을 포함한다. 바람직하게는 비특이적 알도스 리덕타제 활성은 비특이적 알도스 리덕타제를 암호화하는 유전자의 발현을 감소시키거나 이러한 유전자를 불활성화시키는 하나 이상의 유전적 변형에 의해 숙주 세포에서 감소된다. 바람직하게는, 유전적 변형은 효모 세포의 게놈에서 자일로스, 자일룰로스 및 아라비노스를 비롯한 알도펜토스를 환원시킬 수 있는 비특이적 알도스 리덕타제를 암호화하는 유전자의 각각의 내생성 카피의 발현을 감소시키거나 불활성화시킨다. 주어진 세포는 이배수성, 다배수성 또는 이수배수성의 결과로서 비특이적 알도스 리덕타제를 암호화하는 유전자의 다수의 카피들을 포함할 수 있고/있거나, 세포는 아미노산 서열에서 상이하고 상이한 유전자에 의해 각각 암호화되는 알도스 리덕타제 활성을 가진 여러 상이한 (동종)효소들을 함유할 수 있다. 또한, 이러한 경우, 바람직하게는 비특이적 알도스 리덕타제를 암호화하는 각각의 유전자의 발현이 감소되거나 불활성화된다. 바람직하게는, 유전자는 유전자의 적어도 일부의 결실 또는 유전자의 파괴에 의해 불활성화되므로, 이 상황에서 용어 유전자는 암호화 서열의 상류 또는 하류에 있는 임의의 비-암호화 서열도 포함하고, 이러한 서열의 (부분적) 결실 또는 불활성화는 숙주 세포에서 비특이적 알도스 리덕타제 활성의 발현을 감소시킨다. 본 발명의 효모 세포에서 감소될 활성을 가진 알도스 리덕타제를 암호화하는 뉴클레오타이드 서열 및 이러한 알도스 리덕타제의 아미노산 서열은 국제 특허출원 공개 제WO 06/009434호에 기재되어 있고, 예를 들면, 사카로마이세스 세레비지애의 (비특이적) 알도스 리덕타제 유전자인 GRE3 유전자(Traff et al., 2001, Appl. Environm. Microbiol. 67: 5668-5674) 및 다른 종에서의 이의 오르톨로그를 포함한다.
한 실시양태에서, 본 발명에 따른 효모 세포는 (a) 효모 세포 내로의 자일로스 및/또는 아라비노스의 증가된 수송; (b) 이화생성물 억제에 대한 감소된 민감성; (c) 에탄올, 삼투성 또는 유기산에 대한 증가된 내성; 및 (d) 부산물의 감소된 생성으로 구성된 군으로부터 선택된 특성들 중 하나 이상을 발생시키는 추가 유전적 변형을 포함할 수 있다. 부산물은 원하는 발효 생성물 이외의 탄소 함유 분자를 의미하는 것으로서 이해되고, 예를 들면, 자일리톨, 아라비니톨, 글리세롤 및/또는 아세트산을 포함한다. 본원에 기재된 임의의 유전적 변형은 고전적인 돌연변이유발 및 원하는 돌연변이체에 대한 스크리닝 및/또는 선별에 의해, 또는 단순히 원하는 특성을 가진 자연발생적 돌연변이체에 대한 스크리닝 및/또는 선별에 의해 도입될 수 있다. 대안적으로, 유전적 변형은 내생성 유전자의 과다발현 및/또는 내생성 유전자의 불활성화로 구성될 수 있다. 효모 세포 내로의 아라비노스 및/또는 자일로스의 증가된 수송을 위해 과다발현이 요구되는 유전자는 바람직하게는 헥소스 또는 펜토스 수송제를 암호화하는 유전자들로부터 선택된다. 사카로마이세스 세레비지애 및 다른 효모에서, 이 유전자들은 HXT1, HXT2, HXT3, HXT4, HXT5, HXT7 및 GAL2를 포함하고, 이들 중 HXT7, HXT5 및 GAL2가 가장 바람직하다(문헌(Sedlack and Ho, Yeast 2004; 21: 671-684) 참조). 효모에서의 발현을 위한 또 다른 바람직한 수송제는 피키아 스티피티스 SUT1 유전자에 의해 암호화된 글루코스 수송제이다(Katahira et al., 2008, Enzyme Microb. Technol. 43: 115-119). 유사하게, 다른 종에서의 이 수송제 유전자들의 오르톨로그들도 과다발현될 수 있다. 본 발명의 효모 세포에서 과다발현될 수 있는 다른 유전자는 해당 효소 및/또는 에탄올생성 효소, 예컨대, 알코올 데하이드로게나제를 암호화하는 유전자를 포함한다. 불활성화를 위한 바람직한 내생성 유전자는 헥소스 키나제 유전자, 예를 들면, 사카로마이세스 세레비지애 HXK2 유전자(문헌(Diderich et al., 2001, Appl. Environ. Microbiol. 67: 1587-1593) 참조); 사카로마이세스 세레비지애 MIG1 또는 MIG2 유전자; 글리세롤 대사에 관여하는 효소를 암호화하는 유전자, 예컨대, 사카로마이세스 세레비지애 글리세롤포스페이트 데하이드로게나제 1 및/또는 2 유전자; 또는 다른 종에서의 이 유전자들의 (혼성화) 오르톨로그들을 포함한다. 자일로스 발효를 위한 숙주 세포의 다른 바람직한 추가 변형은 문헌(van Maris et al., 2006, Antonie van Leeuwenhoek 90:391-418), 및 국제 특허출원 공개 제WO 2006/009434호, 제WO 2005/023998호, 제WO 2005/111214호 및 제WO 2005/091733호에 기재되어 있다. 가능한 한, 본원에 기재된 본 발명의 효모 세포의 유전적 변형들 중 임의의 유전적 변형은 바람직하게는 자가-클로닝 유전적 변형에 의해 도입되거나 변경된다.
본 발명에 따른 바람직한 숙주 세포는 바람직하게는 혐기성 조건, 즉 혐기성 발효 과정에 대해 본원에서 이하에 정의된 조건 하에서 탄소/에너지 공급원, 바람직하게는 단독 탄소/에너지 공급원인, 자일로스 및 아라비노스 중 하나 이상 상에서 생장하는 능력을 가진다. 바람직하게는, 숙주 세포는 탄소/에너지 공급원인 자일로스 상에서 생장할 때 본질적으로 자일리톨을 생성하지 않는다. 예를 들면, 생성된 자일리톨은 검출 한계 미만 또는, 예를 들면, 몰 기준으로 소비된 탄소의 5%, 2%, 1%, 0.5% 또는 0.3% 미만이다. 바람직하게는, 효모 세포는 탄소/에너지 공급원인 아라비노스 상에서 생장할 때 본질적으로 아라비니톨을 생성하지 않는다. 예를 들면, 생성된 아라비니톨은 검출 한계 미만 또는, 예를 들면, 몰 기준으로 소비된 탄소의 5%, 2%, 1%, 0.5% 또는 0.3% 미만이다.
본 발명의 바람직한 세포는 호기성 조건 하에서 0.01, 0.02, 0.05, 0.1, 0.2, 0.25 또는 0.3 h-1 이상의 속도 또는, 보다 바람직하게는, 혐기성 조건 하에서 0.005, 0.01, 0.02, 0.05, 0.08, 0.1, 0.12, 0.15 또는 0.2 h-1 이상의 속도로 헥소스, 펜토스, 글리세롤, 아세트산 및 이들의 조합물 중 하나 이상 상에서 생장하는 능력을 가진다. 따라서, 바람직하게는, 숙주 세포는 호기성 조건 하에서 0.01, 0.02, 0.05, 0.1, 0.2, 0.25 또는 0.3 h-1 이상의 속도 또는, 보다 바람직하게는, 혐기성 조건 하에서 0.005, 0.01, 0.02, 0.05, 0.08, 0.1, 0.12, 0.15 또는 0.2 h-1 이상의 속도로 단독 탄소/에너지 공급원인, 자일로스 및 아라비노스 중 하나 이상 상에서 생장하는 능력을 가진다. 보다 바람직하게는, 숙주 세포는 호기성 조건 하에서 0.01, 0.02, 0.05, 0.1, 0.2, 0.25 또는 0.3 h-1 이상의 속도 또는, 보다 바람직하게는, 혐기성 조건 하에서 0.005, 0.01, 0.02, 0.05, 0.08, 0.1, 0.12, 0.15 또는 0.2 h-1 이상의 속도로 단독 탄소/에너지 공급원인, 헥소스(예를 들면, 글루코스)와 자일로스 및 아라비노스 중 하나 이상의 혼합물(1:1 중량비) 상에서 생장하는 능력을 가진다. 가장 바람직하게는, 숙주 세포는 호기성 조건 하에서 0.01, 0.02, 0.05, 0.1, 0.2, 0.25 또는 0.3 h-1 이상의 속도 또는, 보다 바람직하게는, 혐기성 조건 하에서 0.005, 0.01, 0.02, 0.05, 0.08, 0.1, 0.12, 0.15 또는 0.2 h-1 이상의 속도로 단독 탄소/에너지 공급원인, 헥소스(예를 들면, 글루코스), 자일로스 및 아라비노스 중 하나 이상 및 글리세롤의 혼합물(1:1:1 중량비) 상에서 생장하는 능력을 가진다.
작물 당으로부터 바이오에탄올을 생성하기 위해 다양한 유기체들을 도입하자는 제안이 수년에 걸쳐 제기되어 왔다. 그러나, 사실상 모든 주요 바이오에탄올 생성 과정들은 에탄올 생산자로서 사카로마이세스 속의 효모를 계속 사용하고 있다. 이것은 산업 공정에 있어서 사카로마이세스 종들의 많은 매력적인 특징들, 즉 높은 산, 에탄올 및 삼투압 내성, 혐기성 생장 능력, 및 그의 높은 알코올 발효 능력 때문이다. 숙주 세포로서 바람직한 효모 종은 사카로마이세스 세레비지애, 사카로마이세스 불데리(S. bulderi), 사카로마이세스 바르네티(S. barnetti), 사카로마이세스 엑시구우스(S. exiguus), 사카로마이세스 우바룸(S. uvarum), 사카로마이세스 다이아스타티커스(S. diastaticus), 클루이베로마이세스 락티스(K. lactis), 클루이베로마이세스 마르시아누스(K. marxianus) 또는 클루이베로마이세스 프라길리스(K. fragilis)를 포함한다.
본 발명의 효모 세포는 식물 바이오매스, 셀룰로스, 헤미셀룰로스, 펙틴, 람노스, 갈락토스, 프럭토스, 말토스, 말토덱스트린, 리보스, 리불로스, 전분 또는 전분 유도체, 수크로스, 락토스 및 글리세롤을 예를 들면, 발효가능한 당으로 전환시킬 수 있다. 따라서, 본 발명의 세포는 하나 이상의 효소, 예컨대, 셀룰라제(엔도셀룰라제 또는 엑소셀룰라제); 셀룰로스를 글루코스 단량체로 전환시키고 헤미셀룰로스를 자일로스 및 아라비노스 단량체로 전환시키는데 필요한 헤미셀룰라제(엔도자일라나제, 엑소자일라나제 또는 아라비나제); 펙틴을 글루쿠론산 및 갈락투론산으로 전환시킬 수 있는 펙티나제; 또는 전분을 글루코스 단량체로 전환시킬 수 있는 아밀라제를 발현할 수 있다.
효모 세포는 바람직하게는 피루베이트를 원하는 발효 생성물, 예컨대, 에탄올, 부탄올, 락트산, 3-하이드록시-프로피온산, 아크릴산, 아세트산, 석신산, 시트르산, 푸마르산, 말산, 이타콘산, 아미노산, 1,3-프로판-다이올, 에틸렌, 글리세롤, β-락탐 항생제 또는 세팔로스포린으로 전환시키는 데에 요구되는 효소 활성을 추가로 포함한다.
본 발명의 바람직한 세포는 알코올 발효, 바람직하게는 혐기성 알코올 발효를 천연적으로 수행할 수 있는 세포이다. 본 발명의 세포는 바람직하게는 에탄올에 대한 높은 내성, 낮은 pH에 대한 높은 내성(즉, 약 5, 약 4, 약 3 또는 약 2.5보다 더 낮은 pH에서 생장할 수 있음) 및 유기산, 예컨대, 락트산, 아세트산 또는 포름산 및/또는 당 분해 생성물, 예컨대, 푸르푸랄 및 하이드록시-메틸푸르푸랄에 대한 높은 내성, 및/또는 고온에 대한 높은 내성을 가진다.
본 발명의 세포의 상기 특성들 또는 활성들 중 임의의 특성 또는 활성은 효모 세포에 천연적으로 존재할 수 있거나 유전적 변형에 의해 도입될 수 있거나 변형될 수 있다.
본 발명의 세포는 에탄올의 생성에 적합한 세포일 수 있다. 그러나, 본 발명의 세포는 에탄올 이외의 발효 생성물의 생성에 적합할 수 있다. 이러한 비-에탄올성 발효 생성물은 원칙적으로 진핵 미생물, 예컨대, 효모 또는 사상 진균에 의해 생성될 수 있는 임의의 벌크 또는 미세한 화학물질을 포함한다.
발효 과정은 바람직하게는 효모 세포에 최적인 온도에서 실시된다. 따라서, 대부분의 효모들 또는 진균 숙주 세포들의 경우, 발효 과정은 약 42℃ 미만, 바람직하게는 약 38℃ 미만의 온도에서 수행된다. 효모 또는 사상 진균 숙주 세포의 경우, 발효 과정은 바람직하게는 약 35℃, 약 33℃, 약 30℃ 또는 약 28℃보다 더 낮은 온도, 및 약 20℃, 약 22℃ 또는 약 25℃보다 더 높은 온도에서 수행된다.
상기 과정에서 자일로스 및/또는 글루코스 상에서의 에탄올 수율은 바람직하게는 약 50%, 약 60%, 약 70%, 약 80%, 약 90%, 약 95% 또는 약 98% 이상이다. 에탄올 수율은 본원에서 이론상 최대 수율의 백분율로서 정의된다.
본 발명은 발효 생성물을 제조하는 방법에 관한 것이기도 하다.
발효 과정은 회분식, 유가식 또는 연속식 모드로 수행될 수 있다. 별개의 가수분해 및 발효(SHF) 과정 또는 동시적인 당화 및 발효(SSF) 과정도 적용될 수 있다. 이 발효 과정 모드들의 조합도 최적 생산성을 위해 가능할 수 있다.
본 발명에 따른 발효 과정은 호기성 조건 및 혐기성 조건 하에서 실시될 수 있다. 바람직하게는, 상기 과정은 미호기성 또는 산소-한정된 조건 하에서 수행된다.
혐기성 발효 과정은 본원에서 산소의 부재 하에서 또는 실질적으로 산소가 소비되지 않는, 바람직하게는 약 5 mmol/ℓ/시간, 약 2.5 mmol/ℓ/시간 또는 약 1 mmol/ℓ/시간 미만의 산소가 소비되는 조건 하에서 실시되는 발효 과정으로서 정의되고, 이때 유기 분자는 전자 공여자 및 전자 수용자 둘다로서 작용한다.
산소-한정된 발효 과정은 산소 소비가 기체로부터 액체로의 산소 전달에 의해 한정되는 과정이다. 산소 한정의 정도는 유입하는 기체 유동의 양 및 조성뿐만 아니라 이용되는 발효 장치의 실제 혼합/질량 전달 성질에 의해 결정된다. 바람직하게는, 산소-한정된 조건 하에서의 과정에서 산소 소비의 속도는 약 5.5 mmol/ℓ/시간 이상, 보다 바람직하게는 약 6 mmol/ℓ/시간 이상, 예컨대, 7 mmol/ℓ/시간 이상이다. 본 발명의 방법은 발효 생성물의 회수를 포함한다.
발효 생성물의 회수를 위해 기존 기술이 이용된다. 상이한 발효 생성물들에 대해 상이한 회수 과정들이 적절하다. 수성 혼합물로부터 에탄올을 회수하는 기존 방법들은 공통적으로 분획화 및 흡착 기법을 이용한다. 예를 들면, 증류관을 이용하여 수성 혼합물 중의 에탄올을 함유하는 발효된 생성물을 가공함으로써 농축된 에탄올 함유 혼합물을 생성한 후, 이 혼합물을 분획화(예를 들면, 분획 증류 또는 다른 유사 기법)로 처리할 수 있다. 그 다음, 가장 높은 농도의 에탄올을 함유하는 분획을 흡착제에 통과시켜 모두는 아닐지라도 대부분의 남은 물을 에탄올로부터 제거할 수 있다.
본 명세서에서 인용된 모든 특허들 및 참고문헌들은 전체로서 본원에 참고로 도입된다.
하기 실시예는 예시 목적을 위해 제공될 뿐, 본 발명의 범위를 어떠한 방식으로든 한정하기 위한 것이 아니다.
실시예
속도 및 양 둘다의 관점에서 글리세롤 및 아세트산의 혐기성 (공-)전환을 개선하기 위해, 대안적 유전자 조합물을 시험하였다. 경로 내의 다수의 효소들, 즉 글리세롤 데하이드로게나제, 다이하이드록시아세톤 키나제 및 아세트알데하이드 데하이드로게나제에 대해, 혐기성 조건 하에서 글리세롤 및 아세트산을 펜토스 및 헥소스 당 다음에 에탄올로 전환시키는 효모 균주의 능력을 더 향상시킬 수 있는 다수의 대안적 유전자들을 시험하였다
선택된 효소 후보들은 하기 표 8에 제공되어 있다.
[표 8]
사카로마이세스 세레비지애에서의 최적 발현을 위해 국제 특허출원 공개 제WO 2008/000632호에 기재된 바와 같이 상기 유전자들을 코돈-쌍 최적화하였다. 단백질 서열의 서열번호는 표 8에 표시되어 있다.
유전자들의 4개 카테고리들을 정의하였다: A) 서열번호 1 내지 서열번호 5로 구성된 AADH-군; B) 서열번호 6으로 구성된 ACS-군; C) 서열번호 7 내지 서열번호 10으로 구성된 GLD-군; 및 D) 서열번호 11 내지 서열번호 14로 구성된 DAK-군.
각각의 유전자가 높은 수준 및 중간/낮은 수준에서 발현될 수 있게 하는 발현 구축물을 제조하였다.
군 A의 경우, TDH3-프로모터 및 TDH1-프로모터를 선택하였다(각각 서열번호 15 및 서열번호 16). 이 유전자들의 터미네이터는 모든 경우들에서 PGK1-터미네이터(서열번호 17)이었다.
군 B의 경우, PGK1-프로모터 및 PRE3-프로모터를 선택하였다(각각 서열번호 18 및 서열번호 19). 이 유전자들의 터미네이터는 모든 경우들에서 PGI1-터미네이터(서열번호 20)이었다.
군 C의 경우, ENO1-프로모터 및 ACT1-프로모터를 선택하였다(각각 서열번호 21 및 서열번호 22). 이 유전자들의 터미네이터는 모든 경우들에서 CYC1-터미네이터(서열번호 23)이었다.
군 D의 경우, TPI1-프로모터 및 ATG7-프로모터를 선택하였다(각각 서열번호 24 및 서열번호 25). 이 유전자들의 터미네이터는 모든 경우들에서 ENO1-터미네이터(서열번호 26)이었다.
표 9에 표시된 바와 같이 총 28개의 상이한 발현 카세트들이 조립되었다.
[표 9]
도 2에 나타낸 바와 같이, 각각의 플랭크에서 연결제를 가진 프라이머를 사용하여 조립된 발현 카세트들(ASS)을 PCR로 증폭하였다. PCR 생성물은 CAS로서 표기되어 있다. 도 2에 나타낸 바와 같이, CAS 요소들은 삽입 플랭크 및/또는 또 다른 CAS 및/또는 선별 마커와 부분적으로 중첩되어, 컴피턴트(competent) 효모 세포 내로의 도입 시 형질전환 컴피턴트 효모 균주의 게놈 내로의 유전 요소들의 재조합을 가능하게 한다.
다원적(multifactorial) 경로 디자인에서, 국제 특허출원 제PCT/EP2013/056623호에 기재된 기술을 이용하여 4개의 카테고리들(군 A, B, C 및 D)의 개별 구성원들의 모든 가능한 조합물들을 조합하였다. 발현 카세트들의 모든 1280개의 상이한 가능한 조합물들을 생성하고 사용하여 gpd1gpd2 이중 결실 균주인 균주 RN1069를 형질전환시켰다(재료 및 방법 참조).
도 2에 나타낸 바와 같이, 원하는 경로가 재조합에 의해 그들의 게놈 내로 성공적으로 삽입되어 있는 효모 형질전환체들의 선택을 가능하게 하기 위해 항생제 내성 마커를 다원적 경로 디자인에 포함시켰다. 선별 마커의 서열은 서열번호 27로서 제공되어 있다.
추가로, 도 2에서 5'-INT1 및 3'-INT1로서 표기된 2개의 삽입 플랭크들을 형질전환 혼합물에 포함시켰다. 이 2개의 플랭킹 영역들의 서열들은 숙주 균주의 게놈 DNA를 주형으로서 사용하고 INT1의 5'-플랭크를 위한 프라이머 조합물 서열번호 30 및 서열번호 31(도 2) 및 3'-INT1 플랭크를 위한 프라이머 조합물 서열번호 42 및 서열번호 43(도 2)을 사용하는 PCR 반응에서 생성된다.
재료 및 방법
일반적인 분자생물학 기법
달리 표시되어 있지 않은 한, 이용된 방법은 표준 생화학적 기법이다. 적합한 일반적인 방법론 교재의 예에는 문헌(Sambrook et al., Molecular Cloning, a Laboratory Manual (1989)) 및 문헌(Ausubel et al., Current Protocols in Molecular Biology (1995), John Wiley & Sons, Inc.)이 포함된다.
배지
실험에서 사용된 배지는 실시예에 표시된 바와 같이 당으로 보충된 YEP 배지(10 g/ℓ 효모 추출물, 20 g/ℓ 펩톤) 또는 고체 YNB 배지(6.7 g/ℓ 효모 질소 베이스, 15 g/ℓ 한천)이었다. 고체 YEP 배지의 경우, 멸균 전에 15 g/ℓ의 한천을 액체 배지에 첨가하였다.
혐기성 스크리닝 실험에서 광물 배지를 사용하였다. 광물 배지의 조성은 문헌(Verduyn et al., Yeast (1992), Volume 8, 501-517)에 기재되어 있다. 그러나, 황산암모늄의 사용이 생략되었고, 그 대신에 질소 공급원으로서 우레아(2.3 g/ℓ)를 사용하였다. 추가로, 에르고스테롤(0.01 g/ℓ), 트윈80(0.42 g/ℓ) 및 당(표시된 바와 같음)을 첨가하였다.
(DNA 구축물의 삽입에 의한) 균주 RN1069의 형질전환체는 히스티딘 영양요구성 균주이다.
균주
실험에서 사용된 균주는 RN1041 및 RN1069이었다. RN1041은 국제 특허출원 공개 제WO 2012/067510호에 기재되어 있다. 이 균주는 하기 유전형을 가진다:
MAT a, ura3-52, leu2-112, his3::loxP, gre3::loxP, loxP-pTPI1::TAL1, loxP-pTPI1::RKI1, loxP-pTPI1-TKL1, loxP-pTPI1-RPE1, 델타::pADH1-XKS1-tCYC1-LEU2, 델타::URA3-pTPI1-xylA-tCYC1
MAT a = 교배형 a
각각 URA3, LEU2 및 HIS3 유전자에서 ura3 -52, leu2 -112 및 HIS3::loxP 돌연변이. ura3 -52 돌연변이는 피로마이세스 xylA 과다발현 구축물 상의 URA3 유전자에 의해 보완되고; leu2-112 돌연변이는 XKS1 과다발현 구축물 상의 LEU2 유전자에 의해 보완된다. HIS3 유전자의 결실은 히스티딘 영양요구성을 야기한다. 이러한 이유로, RN1041은 생장을 위해 배지에서 히스티딘을 필요로 한다.
gre3::loxP는 알도스 리덕타제를 암호화하는 GRE3 유전자의 결실이다. loxP 부위는 마커 제거 후 게놈에 남는다.
본원에 기재된 실험에서 loxP-pTPI1은 TPI1 유전자의 프로모터에 의한 천연 프로모터의 치환에 의한 비-산화적 펜토스 포스페이트 경로의 유전자의 과다발현을 표시한다. 강한 항시성 TPI1 프로모터의 상류에 존재하는 loxP 부위는 마커 제거 후 게놈에 남는다(Kuyper et al, FEMS Yeast Research 5 (2005) 925-934).
델타::는 Ty1 레트로트랜스포존(retrotransposon)의 긴 말단 반복부 상에서의 재조합 후 구축물의 염색체 삽입을 의미한다.
균주 RN1001은 균주 RN1041의 모균주, 즉 HIS3 유전자의 결실 전의 균주이다.
균주 RN1069는 RN1041로부터 유래한다: GPD1 및 GPD2 유전자가 유전자 치환에 의해 파괴되었다. 이를 위해, GPD1 또는 GPD2의 개방 판독 프레임(ORF) 바로 옆의 서열과 상동한 서열에 의해 플랭킹된 우성 항생제 내성 마커를 PCR로 구축하고 사용하여 균주 RN1041을 형질전환시켰다. 이 유전자 파괴 카세트들은 각각 서열번호 28 및 서열번호 29로서 서열목록에 포함되었다. 균주 RN1069의 구축은 국제 특허출원 공개 제WO 2013/081456호에도 상세히 기재되어 있다. 균주 RN1069의 유전형은 다음과 같다:
MAT a, ura3-52, leu2-112, his3::loxP, gre3::loxP, loxP-pTPI1::TAL1, loxP-pTPI1::RKI1, loxP-pTPI1-TKL1, loxP-pTPI1-RPE1, 델타::pADH1-XKS1-tCYC1-LEU2, 델타::URA3-pTPI1-xylA-tCYC1 gpd1::hphMX, gpd2::natMX.
균주 RN1189를 기준 균주로서 사용하였다. 균주 RN1189는 국제 특허출원 공개 제WO 2013/081456호에 기재되어 있다. 요약하건대, 균주 RN1189는 균주 RN1069를 플라스미드 pRN977로 형질전환시킴으로써 구축되었다. 플라스미드 pRN977은 2μ 플라스미드이고 하기 특징을 함유한다: 형질전환체의 선별을 위한 HIS3 유전자, 에스케리키아 콜라이에서의 선별을 위한 앰피실린 내성 마커, PGK1-프로모터 및 ADH1-터미네이터의 조절 하에 있는 에스케리키아 콜라이 adhE 유전자, TPI1-프로모터 및 PGI1-터미네이터의 조절 하에 있는 사카로마이세스 세레비지애 DAK1 유전자, 및 ACT1-프로모터 및 CYC1-터미네이터의 조절 하에 있는 에스케리키아 콜라이 gldA 유전자. 모든 프로모터들 및 터미네이터들은 사카로마이세스 세레비지애로부터 유래한다.
균주 구축
균주 구축 방법은 국제 특허출원 제PCT/EP2013/056623호에 기재되어 있다. 상기 특허출원에는 효모의 형질전환 시 관심있는 다양한 유전자들로부터의 발현 카세트들이 한 경로로 조합되고 이 효모 게놈의 특정 좌위 내로 삽입되도록 이 발현 카세트들을 구축할 수 있게 하는 기법이 기재되어 있다. 개략도가 도 2에 제시되어 있다.
먼저, 효모 게놈 내의 삽입 부위를 선택한다(예를 들면, INT1). 연결제에 의해 플랭킹된, 삽입 좌위의 상류 및 하류 부분의 약 500 bp DNA 단편을, PCR을 이용하여 증폭한다. 이 연결제는 효모(예를 들면, 사카로마이세스 세레비지애) 내로의 형질전환 시 경로의 정확한 생체내 재조합을 가능하게 하는 50 bp 서열이다. 도 2에 표시되어 있는 바와 같이, 각각의 플랭크에서 상이한 연결제를 도입하는 PCR로 관심있는 유전자 및 선별 내성 마커(예를 들면, kanMX)를 생성한다. DNA 단편을 사용한 효모 세포의 형질전환 시, 생체내 재조합 및 게놈 내로의 삽입이 원하는 위치에서 일어난다. 상동성 재조합을 허용하는 연결제들이 불변 상태로 유지되는 한, 경로로부터의 하나 이상의 유전자가 (또) 다른 유전자(들) 또는 유전 요소(들)로 치환될 수 있기 때문에, 이 기법은 경로 조정(tuning)을 가능하게 한다(국제 특허출원 제PCT/EP2013/056623호).
발현 카세트 구축
개방 판독 프레임(ORF), 프로모터 서열 및 터미네이터를 DNA 2.0(미국 캘리포니아주 94025 멘로 파크 소재)에서 합성하였다. 이 유전 요소들의 서열은 서열번호 1 내지 서열번호 26으로서 나열되어 있다. 문헌(Engler et al., 2011) 및 이 문헌에서 인용된 참고문헌에 기재된 바와 같이 골든 게이트(Golden Gate) 기술을 이용하여 프로모터, ORF 및 터미네이터 서열을 조립하였다. 조립된 발현 카세트를 BsaI에 의해 분해된 골격 벡터 내로 라이게이션시켰다: 군 A(표 2)를 p5Abbn(서열번호 44) 내로 라이게이션시켰고, 군 B(표 2)를 pBCbbn(서열번호 45) 내로 라이게이션시켰고, 군 C(표 2)를 pCDbbn(서열번호 46) 내로 라이게이션시켰고, 군 D(표 2)를 pD3bbn(서열번호 47) 내로 라이게이션시켰다.
발현 카세트 증폭
전술된 바와 같이 생성된 조립된 발현 카세트("발현 카세트 구축" 단락), 삽입 플랭크 및 선별 마커를, 서열번호 30 내지 서열번호 43으로서 기재된 프라이머(하기 참조)를 사용하여 PCR로 증폭하였다. 효모에서의 선별을 위한 G418 내성 마커인 kanMX 마커를 이 마커가 함유된 플라스미드로부터 증폭하였다. 마커의 서열은 서열번호 27로서 기재되어 있다.
서열번호 30 및 서열번호 31(5'-INT1 플랭크), 및 서열번호 42 및 서열번호 43(3'-INT1 플랭크)을 사용하여 INT1 플랭크를 균주 CEN.PK113-7D로부터의 게놈 DNA로부터 증폭하였다.
[표 10]
효모 세포의 형질전환
문헌(Schiestl and Gietz, Current Genetics (1989), Volume 16, 339-346)에 기재된 방법에 따라 효모 형질전환을 수행하였다.
마이크로플레이트에서의 혐기성 생장 실험
평저 NUNC 마이크로플레이트(MTP)에서 생장 실험을 수행하였다. 275 ㎕의 배지를 각각의 웰에 충전시켰다. 배지의 조성은 다음과 같았다:
광물 배지(문헌(Verduyn et al., 1992)에 근거함, 황산암모늄 대신에 우레아);
2% 글루코스;
2% 자일로스;
1% 글리세롤;
2 g/ℓ 아세트산; 및
200 ㎍/㎖ 히스티딘(his3::loxP인 균주 RN1069 및 유도체의 경우) pH 4.5.
모든 MTP들을 알루미늄 밀봉재로 밀봉하였다. 그 다음, MTP를 혐기성 항온처리기(인포르스(Infors)) 내에 배치하였다. 48시간의 생장 후, 혐기성 인포르스로부터 MTP들을 제거하였다. 그 다음, 플레이트를 마이크로플레이트 원심분리기 내에서 2750 rpm에서 10분 동안 회전시켰다. 그 다음, 150 ㎕의 상청액을 NMR 분석에 적합한 MTP로 옮겼다.
NMR 분석
샘플에서 글루코스, 자일로스, 글리세롤, 아세트산 및 에탄올을 정량하기 위해, 150 ㎕의 샘플을 적합한 바이알 내로 정확히 옮긴다. 그 후, D2O 중의 말레산(20 g/ℓ), EDTA(40 g/ℓ) 및 미량의 DSS(4,4-다이메틸-4-실라펜탄-1-설폰산)를 함유하는 100 ㎕의 내부 표준 용액, 및 450 ㎕의 D2O를 첨가한다. 27℃의 온도에서 수압(3 Hz에 상응하는 동력)을 이용한 펄스 프로그램을 이용하여 냉동-프로브를 갖춘 브루커 아반스(Bruker Avance) III 700 MHz 상에서 1D 1H NMR 스펙트럼을 기록한다.
하기 신호에 근거하여 분석물 농도를 계산한다(DSS를 기준으로 한 δ):
실시예
1
효모 형질전환체의 전체 조합 어레이의 구축
균주의 전체 조합 어레이를 전술된 바와 같이 구축하였다. 이를 위해, 균주 RN1069를 유전자들의 모든 1280개 혼합물들로 형질전환시켰다(상기 참조). 20 g 글루코스/ℓ 및 200 ㎍ G418/㎖을 함유하는 YEP 한천 상에 형질전환 혼합물을 플레이팅하였다.
각각의 형질전환에 대해, 2개의 독립적인 형질전환체들을 선별하고 마이크로플레이트 내의 YEPD 한천으로 옮겼다(웰당 1개 콜로니). 각각의 마이크로플레이트 상에서 기준 균주도 접종시켰다: RN1189.
실시예 2
생장 실험 및 결과의 분석
선택된 콜로니 및 균주의 어레이(실시예 1)를 재료 및 방법에 기재된 실험 설정에서 시험하였다.
요약하건대, YEPD 한천을 가진 마이크로플레이트 내의 균주를 사용하여, 마이크로플레이트 내에서 200 ㎍ 히스티딘/㎖, 2% 글루코스, 2% 자일로스, 1% 글리세롤 및 2 g/ℓ 아세트산을 함유하는 275 ㎕의 광물 배지를 접종하였다. 배지의 pH를 아세트산의 pKa보다 더 낮은 4.5로 설정하였다. 마이크로플레이트를 밀봉하고 혐기성 조건 하에서 48시간 동안 항온처리하였다. 세포를 원심분리로 회전시키고 상청액을 NMR로 분석하였다. 상위 150개의 결과들이 하기 표 11에 제공되어 있다.
[표 11]
도 3에서, 발효액 중의 잔류 아세트산 농도는 잔류 글리세롤 농도의 함수로서 작도되어 있다. 결과는 잔류 글리세롤 농도와 잔류 아세트산 농도 사이에 강한 상관관계가 존재한다는 것을 명확히 보여준다: 발효 후 잔류 글리세롤 농도가 낮을수록, 잔류 아세트산 농도가 낮아진다. 이것은 국제 특허출원 공개 제WO 2013/081456호에서 이미 밝혀진 바와 같이 두 경로들이 서로 연결되어 있다는 것을 시사한다.
균주들 중 하나는 거의 모든 아세트산을 소비하였고(도 3에서 하부 좌측 모서리의 데이터 점) 다른 형질전환체들을 능가하였다. 이 균주는 YD01247로서 명명되었다.
기준 균주 RN1189를 포함하는 총 2592개의 균주들을 스크리닝하였다. 기준 균주 RN1189는 27회 포함되었다. 다른 균주들에 비해 기준 균주 RN1189의 성능(총 2592개)은 도 6에 표시되어 있다. 균주들은 전술된 바와 같이 순위가 매겨져 있는데, 이때 보다 더 우수한 성능의 균주는 보다 더 밝은 색채로 표시되어 있다(그리고 그래프의 하부 좌측 모서리에 더 가깝다). 보다 덜 우수한 성능의 균주들은 보다 더 짙은 색채로 표시되어 있고, 색채의 변화는 점진적이다. 예외는 기준 균주인 RN1189가 가장 짙은 색채로 표시되어 있다는 것이다.
발현 카세트들의 가장 우수한 조합물을 평가하기 위해, NMR 데이터를 이용하여 계산을 수행하였다. 생성된 에탄올의 총량으로부터 자일로스 및 글루코스로부터 생성된 에탄올의 이론상 양을 차감함으로써 1) 배지에 남겨진 잔류 아세트산 농도, 2) 배지에 남겨진 잔류 글리세롤 농도, 및 3) 글리세롤 및 아세트산으로부터 생성된 에탄올의 양에 대해 모든 균주들에게 점수를 부여하였다.
상기 3개의 점수들을 더하여 모든 샘플들의 순위를 매겼다(표 11). 이 마지막 점수에 근거한 가장 우수한 150개의 균주들이 가시화되었고 도 4에도 표시되어 있다.
가장 우수한 150개의 균주들로부터, 군 A, B, C 및 D(상기 참조)에 속하는 발현 카세트들 중 어떤 발현 카세트가 과다발현되었는지를 확인하였다. 표 11 및 12를 참조한다.
[표 12]
관찰결과는 다음과 같다:
a) 일반적으로, (보다 더) 약한 프로모터에 비해 강한 프로모터를 보유하는 발현 카세트가 150개의 균주들에서 과다발현되기 때문에 (보다 더) 약한 프로모터의 사용보다 강한 프로모터의 사용이 더 빈번하게 카운팅되고;
b) CAS2 및 CAS3이 AADH-군에서 과다발현되고;
c) CAS11 및 CAS12가 거의 동등하게 잘 발현되고;
d) 발현 카세트 CAS15 및 CAS16도 잘 발현되지만, CAS13 및 CAS14가 GLD-군에서 약간 과다발현되는 듯하고;
e) CAS21 및 CAS23도 상위 150개의 균주들에서 잘 발현되지만, CAS23이 DAK-군에서 과다발현되고;
f) 시험된 모든 발현 카세트들(CAS)이 상위 150개의 균주들에서 발현되는데, 이것은 다수의 해법들이 존재한다는 것을 시사한다.
그러나, 발현 카세트들의 많은 조합물들이 기준 균주 RN1189에 비해 증가된 글리세롤 및 아세트산 전환으로 인한 개선된 에탄올 수율을 이끌어내었다. 이것은 발현 카세트들의 많은 다른 조합물들이 글리세롤, 아세트산 및 발효가능한 당으로 구성된 혼합물에서 글리세롤 및 아세트산 둘다를 에탄올로 전환시키기 위한 해결책을 제공할 수 있다는 것을 시사한다. 스크리닝에서 가장 우수한 균주인 균주 YD01247(도 3 및 4)이 이의 일례이다: 이 균주는 발현 카세트 CAS01, CAS12, CAS13 및 CAS23으로 구성된다.
다수의 균주들이 모든 사용가능한 아세트산을 거의 소비하였다. 이 균주들은 ℓ당 3 내지 4 g의 글리세롤을 소비할 수 있었다.
실시예 3
발현 카세트들의 가장 우수한 조합물의 재시험
다원적 디자인에서, 발현 카세트들의 가장 우수한 조합물(실시예 2)을 재시험하였다. 균주 YD01247에서 ACS2 유전자의 발현이 약한 프로모터를 가진 구축물(즉, CAS12)의 조절 하에 있었기 때문에, 이 발현 카세트는 실시예 2의 상위 150개 균주들에서 과다발현되지 않았지만 실험 디자인에서도 함께 사용되었다.
균주 RN1069를 군 A, B, C 및 D로부터 선택된 발현 카세트들의 8개 조합물들로 형질전환시켰다(표 13).
[표 13]
형질전환 후, 세포를 20 g 글루코스/ℓ 및 200 ㎍ G418/㎖로 보충된 YEP 한천 상에 스프레딩하였다. R2(이 경우, 3개의 형질전환체들만이 수득되었음)를 제외하고 형질전환당 8개의 독립적인 콜로니들을 사용하여 20 g 글루코스/ℓ 및 200 ㎍ G418/㎖로 보충된 YEP 한천으로 충전된 마이크로플레이트를 접종하였다. 기준 균주로서 RN1069, RN1189 및 YD01247도 8배로 포함되었다. YEPD 한천 및 G418을 가진 마이크로플레이트 내의 균주를 사용하여 마이크로플레이트 내에서 200 ㎍ 히스티딘/㎖, 2% 글루코스, 2% 자일로스, 1% 글리세롤 및 2 g/ℓ 아세트산을 함유하는 275 ㎕의 광물 배지를 삼중으로 접종하였다. 배지의 pH를 아세트산의 pKa보다 더 낮은 4.5로 설정하였다. 마이크로플레이트를 밀봉하고 혐기성 조건 하에서 항온처리하였다. 3개의 상이한 시간 간격에서, 즉 24시간, 48시간 및 72시간 후, 시점당 1개의 플레이트를 혐기성 진탕기로부터 회수하였다. 세포를 원심분리로 회전시키고 상청액을 NMR로 분석하였다. 72시간의 항온처리 후 NMR 결과, 특히 글리세롤 및 아세트산의 잔류 농도가 도 5에 표시되어 있다.
기준 균주들 중 하나인 균주 RN1069에서 잔류 아세트산 농도는 예상된 바와 같이 여전히 2.0 g/ℓ에 가깝다. 마찬가지로, 이 균주도 글리세롤을 소비하지 않았다.
개념 증명 균주 RN1189(국제 특허출원 공개 제WO 2013/081456호)는 ℓ당 평균 0.9 g의 아세트산 및 ℓ당 평균 1.5 g의 글리세롤을 소비하였다.
기준 균주 YD01247은 모든 균주들 중 가장 잘 수행하였다: 잔류 아세트산 농도는 단지 ℓ당 0.2 g이었고(90%의 아세트산이 소비됨) 잔류 글리세롤 농도는 단지 ℓ당 5.5 g이었다.
(R2를 제외한) 재구축된 형질전환체의 잔류 아세트산 농도는 ℓ당 0.3 내지 0.6 g이었고 잔류 글리세롤 농도는 6.6 내지 7.0 g이었다.
형질전환 R2는 형질전환체를 거의 제공하지 않았을 뿐만 아니라, 결과에서 큰 퍼짐(spread)도 관찰되었다. 따라서, 이 결과들은 해석되지 않았다.
결론적으로, R2를 제외한 시험된 발현 카세트들의 모든 조합물들이 혐기성 글리세롤 및 아세트산 전환의 관점에서 기준 균주 RN1189에 비해 성능을 개선하였다.
실시예 4
선별된 형질전환체를 사용한 혐기성 진탕 플라스크 실험
형질전환체의 선별의 성능을 진탕 플라스크에서 시험하였다. 이를 위해, 실시예 2에서 생성된 표 14의 균주들의 예비배양물을 제조하였다.
[표 14]
균주 YD01247, YD01248, YD01249 및 YD01250은 각각 숫자 1, 2, 3 및 4로서 도 7에 표시되어 있다. 균주 YD01251은 글리세롤 및 아세트산 소비의 관점에서 중간 수준으로 잘 수행하는 균주이다.
ℓ당 약 20 g의 글루코스, 약 20 g의 자일로스, 약 10 g의 글리세롤, 약 200 mg의 히스티딘 및 약 2 g의 아세트산(HAc)을 함유하는 25 ㎖의 광물 배지(재료 및 방법에 기재됨)(pH 4.5)로 100 ㎖의 진탕 플라스크를 충전시켰다. 0.5의 초기 OD600을 달성하기 위해 필요한 양으로 예비배양물로부터의 세척된 세포를 사용하여 상기 진탕 플라스크를 이중으로 접종하였다. 발효 동안 혐기성 조건을 달성하기 위해 상기 플라스크를 워터락(waterlock)으로 폐쇄하였다. 항온처리를 32℃ 및 100 rpm에서 수행하였다. 96시간 후, 발효를 종결하고 세포를 원심분리로 회전시켰다. 상청액을 NMR로 분석하였다. 결과는 표 15에 표시되어 있다.
[표 15]
예상된 바와 같이 균주 CEN.PK113-7D만이 글루코스를 발효시킨다. 소비된 당에 근거하여 계산된 에탄올 수율은 진탕 플라스크 발효에서 통상적으로 발견되는 에탄올 수율과 일치하는 0.44이다. 이론상 최대 에탄올 수율은 당의 g당 0.51 g의 에탄올에 이른다.
원칙적으로, 균주 RN1069는 글루코스 및 자일로스 둘다를 발효시킬 수 있다. 그러나, 이 균주는 혐기성 조건 하에서 보조인자 재생을 불가능하게 하는, GPD1 및 GPD2 둘다의 결실을 가진다. 하지만, 이 균주는 글루코스 및 자일로스를 부분적으로 전환시키는데, 이것은 아마도 실험의 초기에 배지 중의 용해된 산소뿐만 아니라 일부 잔류 산소도 진탕 플라스크의 상부 공간에서 사용가능하여 실험의 초기에 일부 보조인자 재활용을 가능하게 하였기 때문이다. 하지만, 에탄올 수율은 낮다(소비된 당의 g당 0.39 g의 에탄올).
플라스미드로부터 AADH, GLD 및 DAK를 발현하는 형질전환된 균주(RN1189), 또는 게놈 내에 삽입된 구축물로부터 AADH, ACS, GLD 및 DAK를 발현하는 형질전환된 균주(YD01247 내지 YD01251)는 소비된 당을 기준으로 한 증가된 에탄올 수율을 보여준다. 0.48 내지 0.50의 에탄올 수율이 달성된다. 이 보다 더 높은 값들은 에탄올로의 글리세롤 및 아세트산의 혐기성 전환 및/또는 글리세롤 생성의 부재로 인해 달성되었다.
균주 YD01247은 다른 YD 균주들보다 자일로스를 덜 소비하였다. 그러나, 이 균주는 실시예 2 및 3에서 이미 밝혀진 바와 같이 거의 모든 아세트산을 소비하였다. 이 균주는 대부분의 글리세롤도 소비하였다. 이 균주는 가장 높은 에탄올 수율을 보여주었다.
다른 YD 균주들도 균주 RN1189에 비해 개선된 성능을 보여준다: 보다 더 많은 글리세롤 및 아세트산이 소비됨으로써 보다 더 높은 에탄올 역가를 이끌어내었다.
이 실험들은 발현 카세트들의 다양한 대안적 조합물들이 혐기성 글리세롤 및 아세트산 전환의 관점에서 기준 균주 RN1189에 비해 성능을 개선함으로써, 모든 경우들에서 보다 더 높은 에탄올 역가 및 일부 경우들에서 보다 더 높은 에탄올 수율을 이끌어내었다는 것을 보여준다.
참고문헌
<110> DSM IP Assets B.V.
<120> GLYCEROL AND ACETIC ACID CONVERTING YEAST CELLS WITH IMPROVED ACETIC ACID CONVERSION
<130> 29960-WO-PCT
<140> PCT/EP2014/068324
<141> 2014-08-29
<150> EP 13182222.3
<151> 2013-08-29
<160> 61
<170> BiSSAP 1.2
<210> 1
<211> 891
<212> PRT
<213> Escherichia coli
<400> 1
Met Ala Val Thr Asn Val Ala Glu Leu Asn Ala Leu Val Glu Arg Val
1 5 10 15
Lys Lys Ala Gln Arg Glu Tyr Ala Ser Phe Thr Gln Glu Gln Val Asp
20 25 30
Lys Ile Phe Arg Ala Ala Ala Leu Ala Ala Ala Asp Ala Arg Ile Pro
35 40 45
Leu Ala Lys Met Ala Val Ala Glu Ser Gly Met Gly Ile Val Glu Asp
50 55 60
Lys Val Ile Lys Asn His Phe Ala Ser Glu Tyr Ile Tyr Asn Ala Tyr
65 70 75 80
Lys Asp Glu Lys Thr Cys Gly Val Leu Ser Glu Asp Asp Thr Phe Gly
85 90 95
Thr Ile Thr Ile Ala Glu Pro Ile Gly Ile Ile Cys Gly Ile Val Pro
100 105 110
Thr Thr Asn Pro Thr Ser Thr Ala Ile Phe Lys Ser Leu Ile Ser Leu
115 120 125
Lys Thr Arg Asn Ala Ile Ile Phe Ser Pro His Pro Arg Ala Lys Asp
130 135 140
Ala Thr Asn Lys Ala Ala Asp Ile Val Leu Gln Ala Ala Ile Ala Ala
145 150 155 160
Gly Ala Pro Lys Asp Leu Ile Gly Trp Ile Asp Gln Pro Ser Val Glu
165 170 175
Leu Ser Asn Ala Leu Met His His Pro Asp Ile Asn Leu Ile Leu Ala
180 185 190
Thr Gly Gly Pro Gly Met Val Lys Ala Ala Tyr Ser Ser Gly Lys Pro
195 200 205
Ala Ile Gly Val Gly Ala Gly Asn Thr Pro Val Val Ile Asp Glu Thr
210 215 220
Ala Asp Ile Lys Arg Ala Val Ala Ser Val Leu Met Ser Lys Thr Phe
225 230 235 240
Asp Asn Gly Val Ile Cys Ala Ser Glu Gln Ser Val Val Val Val Asp
245 250 255
Ser Val Tyr Asp Ala Val Arg Glu Arg Phe Ala Thr His Gly Gly Tyr
260 265 270
Leu Leu Gln Gly Lys Glu Leu Lys Ala Val Gln Asp Val Ile Leu Lys
275 280 285
Asn Gly Ala Leu Asn Ala Ala Ile Val Gly Gln Pro Ala Tyr Lys Ile
290 295 300
Ala Glu Leu Ala Gly Phe Ser Val Pro Glu Asn Thr Lys Ile Leu Ile
305 310 315 320
Gly Glu Val Thr Val Val Asp Glu Ser Glu Pro Phe Ala His Glu Lys
325 330 335
Leu Ser Pro Thr Leu Ala Met Tyr Arg Ala Lys Asp Phe Glu Asp Ala
340 345 350
Val Glu Lys Ala Glu Lys Leu Val Ala Met Gly Gly Ile Gly His Thr
355 360 365
Ser Cys Leu Tyr Thr Asp Gln Asp Asn Gln Pro Ala Arg Val Ser Tyr
370 375 380
Phe Gly Gln Lys Met Lys Thr Ala Arg Ile Leu Ile Asn Thr Pro Ala
385 390 395 400
Ser Gln Gly Gly Ile Gly Asp Leu Tyr Asn Phe Lys Leu Ala Pro Ser
405 410 415
Leu Thr Leu Gly Cys Gly Ser Trp Gly Gly Asn Ser Ile Ser Glu Asn
420 425 430
Val Gly Pro Lys His Leu Ile Asn Lys Lys Thr Val Ala Lys Arg Ala
435 440 445
Glu Asn Met Leu Trp His Lys Leu Pro Lys Ser Ile Tyr Phe Arg Arg
450 455 460
Gly Ser Leu Pro Ile Ala Leu Asp Glu Val Ile Thr Asp Gly His Lys
465 470 475 480
Arg Ala Leu Ile Val Thr Asp Arg Phe Leu Phe Asn Asn Gly Tyr Ala
485 490 495
Asp Gln Ile Thr Ser Val Leu Lys Ala Ala Gly Val Glu Thr Glu Val
500 505 510
Phe Phe Glu Val Glu Ala Asp Pro Thr Leu Ser Ile Val Arg Lys Gly
515 520 525
Ala Glu Leu Ala Asn Ser Phe Lys Pro Asp Val Ile Ile Ala Leu Gly
530 535 540
Gly Gly Ser Pro Met Asp Ala Ala Lys Ile Met Trp Val Met Tyr Glu
545 550 555 560
His Pro Glu Thr His Phe Glu Glu Leu Ala Leu Arg Phe Met Asp Ile
565 570 575
Arg Lys Arg Ile Tyr Lys Phe Pro Lys Met Gly Val Lys Ala Lys Met
580 585 590
Ile Ala Val Thr Thr Thr Ser Gly Thr Gly Ser Glu Val Thr Pro Phe
595 600 605
Ala Val Val Thr Asp Asp Ala Thr Gly Gln Lys Tyr Pro Leu Ala Asp
610 615 620
Tyr Ala Leu Thr Pro Asp Met Ala Ile Val Asp Ala Asn Leu Val Met
625 630 635 640
Asp Met Pro Lys Ser Leu Cys Ala Phe Gly Gly Leu Asp Ala Val Thr
645 650 655
His Ala Met Glu Ala Tyr Val Ser Val Leu Ala Ser Glu Phe Ser Asp
660 665 670
Gly Gln Ala Leu Gln Ala Leu Lys Leu Leu Lys Glu Tyr Leu Pro Ala
675 680 685
Ser Tyr His Glu Gly Ser Lys Asn Pro Val Ala Arg Glu Arg Val His
690 695 700
Ser Ala Ala Thr Ile Ala Gly Ile Ala Phe Ala Asn Ala Phe Leu Gly
705 710 715 720
Val Cys His Ser Met Ala His Lys Leu Gly Ser Gln Phe His Ile Pro
725 730 735
His Gly Leu Ala Asn Ala Leu Leu Ile Cys Asn Val Ile Arg Tyr Asn
740 745 750
Ala Asn Asp Asn Pro Thr Lys Gln Thr Ala Phe Ser Gln Tyr Asp Arg
755 760 765
Pro Gln Ala Arg Arg Arg Tyr Ala Glu Ile Ala Asp His Leu Gly Leu
770 775 780
Ser Ala Pro Gly Asp Arg Thr Ala Ala Lys Ile Glu Lys Leu Leu Ala
785 790 795 800
Trp Leu Glu Thr Leu Lys Ala Glu Leu Gly Ile Pro Lys Ser Ile Arg
805 810 815
Glu Ala Gly Val Gln Glu Ala Asp Phe Leu Ala Asn Val Asp Lys Leu
820 825 830
Ser Glu Asp Ala Phe Asp Asp Gln Cys Thr Gly Ala Asn Pro Arg Tyr
835 840 845
Pro Leu Ile Ser Glu Leu Lys Gln Ile Leu Leu Asp Thr Tyr Tyr Gly
850 855 860
Arg Asp Tyr Val Glu Gly Glu Thr Ala Ala Lys Lys Glu Ala Ala Pro
865 870 875 880
Ala Lys Ala Glu Lys Lys Ala Lys Lys Ser Ala
885 890
<210> 2
<211> 455
<212> PRT
<213> Lactobacillus plantarum
<400> 2
Met Leu Lys Glu Met Glu Glu Thr Thr Val Ser Arg Ser Ile Asp Arg
1 5 10 15
Leu Val Leu Asn Ala Ser Leu Ala Ala Asn Arg Leu Glu Val Met Asp
20 25 30
Gln Ser Gln Val Asp Gln Ala Val Ala Ala Met Ala Arg Ala Ala His
35 40 45
Ala Ala Arg Gly Met Leu Ala Ala Met Ala Val Glu Glu Thr Gly Arg
50 55 60
Gly Asn Tyr Arg Asp Lys Val Ala Lys Asn Asp Phe Ala Ala Lys Asn
65 70 75 80
Val Tyr Asn Tyr Ile Lys Asp Asp Lys Thr Val Gly Ile Ile Asn Asp
85 90 95
Asp Pro Val Ser Gly Val Met Lys Val Ala Glu Pro Val Gly Ile Ile
100 105 110
Ala Gly Val Thr Pro Val Thr Asn Pro Thr Ser Thr Val Ile Phe Asn
115 120 125
Ala Met Leu Ala Leu Lys Thr Arg Asn Pro Ile Ile Phe Gly Phe His
130 135 140
Pro Phe Ala Gln Lys Ser Cys Val Glu Thr Gly Arg Ile Ile Arg Asp
145 150 155 160
Ala Ala Ile Ala Ser Gly Ala Pro Lys Asp Trp Ile Gln Trp Ile Lys
165 170 175
Thr Pro Ser Leu Glu Ala Thr Asn Thr Leu Met Asn His Pro Gly Val
180 185 190
Ala Thr Ile Ile Ala Thr Gly Gly Ala Gly Met Val Lys Thr Ala Tyr
195 200 205
Ser Thr Gly Lys Pro Ala Leu Gly Val Gly Pro Gly Asn Val Pro Cys
210 215 220
Phe Ile Glu Gln Thr Ala Asp Ile Gln Gln Ala Val Ser Asp Val Val
225 230 235 240
Thr Ser Lys Ser Phe Asp Asn Gly Met Ile Cys Ala Ser Glu Ser Asn
245 250 255
Leu Ile Val Ala Asp Gln Ile Tyr Asp Gln Val Lys Arg Glu Leu Ser
260 265 270
His Asn Gly Val Tyr Phe Val Gly Thr Glu Asn Phe Lys Ala Leu Glu
275 280 285
Ala Thr Val Met Asn Leu Asp Lys Gln Ala Val Asp Pro Lys Val Ala
290 295 300
Gly Gln Thr Pro Trp Gln Ile Ala Gln Trp Ala Gly Phe Asp Val Pro
305 310 315 320
Ser Asp Thr Lys Val Leu Ala Val Glu Leu Pro Ser Ile Gly Gly Asp
325 330 335
Gln Val Leu Ser Arg Glu Lys Leu Ser Pro Val Leu Ala Val Val His
340 345 350
Ala Lys Asp Thr Glu Ala Gly Phe Asn Leu Met Lys Arg Ser Leu Ala
355 360 365
Leu Gly Gly Leu Gly His Thr Ala Ala Leu His Thr Thr Asp Glu Ala
370 375 380
Val Met Asn Lys Phe Ala Leu Glu Met Thr Ala Cys Arg Ala Leu Ile
385 390 395 400
Asn Val Pro Ser Ser Gln Gly Ala Ile Gly Tyr Lys Tyr Asp Asn Val
405 410 415
Ala Pro Ser Leu Thr Leu Gly Cys Gly Thr Trp Gly His Asn Ser Ile
420 425 430
Ser His Asn Leu Glu Asp Trp Asp Leu Leu Asn Ile Lys Thr Val Ala
435 440 445
Lys Arg Leu Thr Lys Ile Arg
450 455
<210> 3
<211> 467
<212> PRT
<213> Escherichia coli
<400> 3
Met Asn Gln Gln Asp Ile Glu Gln Val Val Lys Ala Val Leu Leu Lys
1 5 10 15
Met Gln Ser Ser Asp Thr Pro Ser Ala Ala Val His Glu Met Gly Val
20 25 30
Phe Ala Ser Leu Asp Asp Ala Val Ala Ala Ala Lys Val Ala Gln Gln
35 40 45
Gly Leu Lys Ser Val Ala Met Arg Gln Leu Ala Ile Ala Ala Ile Arg
50 55 60
Glu Ala Gly Glu Lys His Ala Arg Asp Leu Ala Glu Leu Ala Val Ser
65 70 75 80
Glu Thr Gly Met Gly Arg Val Glu Asp Lys Phe Ala Lys Asn Val Ala
85 90 95
Gln Ala Arg Gly Thr Pro Gly Val Glu Cys Leu Ser Pro Gln Val Leu
100 105 110
Thr Gly Asp Asn Gly Leu Thr Leu Ile Glu Asn Ala Pro Trp Gly Val
115 120 125
Val Ala Ser Val Thr Pro Ser Thr Asn Pro Ala Ala Thr Val Ile Asn
130 135 140
Asn Ala Ile Ser Leu Ile Ala Ala Gly Asn Ser Val Ile Phe Ala Pro
145 150 155 160
His Pro Ala Ala Lys Lys Val Ser Gln Arg Ala Ile Thr Leu Leu Asn
165 170 175
Gln Ala Ile Val Ala Ala Gly Gly Pro Glu Asn Leu Leu Val Thr Val
180 185 190
Ala Asn Pro Asp Ile Glu Thr Ala Gln Arg Leu Phe Lys Phe Pro Gly
195 200 205
Ile Gly Leu Leu Val Val Thr Gly Gly Glu Ala Val Val Glu Ala Ala
210 215 220
Arg Lys His Thr Asn Lys Arg Leu Ile Ala Ala Gly Ala Gly Asn Pro
225 230 235 240
Pro Val Val Val Asp Glu Thr Ala Asp Leu Ala Arg Ala Ala Gln Ser
245 250 255
Ile Val Lys Gly Ala Ser Phe Asp Asn Asn Ile Ile Cys Ala Asp Glu
260 265 270
Lys Val Leu Ile Val Val Asp Ser Val Ala Asp Glu Leu Met Arg Leu
275 280 285
Met Glu Gly Gln His Ala Val Lys Leu Thr Ala Glu Gln Ala Gln Gln
290 295 300
Leu Gln Pro Val Leu Leu Lys Asn Ile Asp Glu Arg Gly Lys Gly Thr
305 310 315 320
Val Ser Arg Asp Trp Val Gly Arg Asp Ala Gly Lys Ile Ala Ala Ala
325 330 335
Ile Gly Leu Lys Val Pro Gln Glu Thr Arg Leu Leu Phe Val Glu Thr
340 345 350
Thr Ala Glu His Pro Phe Ala Val Thr Glu Leu Met Met Pro Val Leu
355 360 365
Pro Val Val Arg Val Ala Asn Val Ala Asp Ala Ile Ala Leu Ala Val
370 375 380
Lys Leu Glu Gly Gly Cys His His Thr Ala Ala Met His Ser Arg Asn
385 390 395 400
Ile Glu Asn Met Asn Gln Met Ala Asn Ala Ile Asp Thr Ser Ile Phe
405 410 415
Val Lys Asn Gly Pro Cys Ile Ala Gly Leu Gly Leu Gly Gly Glu Gly
420 425 430
Trp Thr Thr Met Thr Ile Thr Thr Pro Thr Gly Glu Gly Val Thr Ser
435 440 445
Ala Arg Thr Phe Val Arg Leu Arg Arg Cys Val Leu Val Asp Ala Phe
450 455 460
Arg Ile Val
465
<210> 4
<211> 469
<212> PRT
<213> Listeria innocua
<400> 4
Met Glu Ser Leu Glu Leu Glu Gln Leu Val Lys Lys Val Leu Leu Glu
1 5 10 15
Lys Leu Ala Glu Gln Lys Glu Val Pro Thr Lys Thr Thr Thr Gln Gly
20 25 30
Ala Lys Ser Gly Val Phe Asp Thr Val Asp Glu Ala Val Gln Ala Ala
35 40 45
Val Ile Ala Gln Asn Cys Tyr Lys Glu Lys Ser Leu Glu Glu Arg Arg
50 55 60
Asn Val Val Lys Ala Ile Arg Glu Ala Leu Tyr Pro Glu Ile Glu Thr
65 70 75 80
Ile Ala Thr Arg Ala Val Ala Glu Thr Gly Met Gly Asn Val Thr Asp
85 90 95
Lys Ile Leu Lys Asn Thr Leu Ala Ile Glu Lys Thr Pro Gly Val Glu
100 105 110
Asp Leu Tyr Thr Glu Val Ala Thr Gly Asp Asn Gly Met Thr Leu Tyr
115 120 125
Glu Leu Ser Pro Tyr Gly Val Ile Gly Ala Val Ala Pro Ser Thr Asn
130 135 140
Pro Thr Glu Thr Leu Ile Cys Asn Ser Ile Gly Met Leu Ala Ala Gly
145 150 155 160
Asn Ala Val Phe Tyr Ser Pro His Pro Gly Ala Lys Asn Ile Ser Leu
165 170 175
Trp Leu Ile Glu Lys Leu Asn Thr Ile Val Arg Asp Ser Cys Gly Ile
180 185 190
Asp Asn Leu Ile Val Thr Val Ala Lys Pro Ser Ile Gln Ala Ala Gln
195 200 205
Glu Met Met Asn His Pro Lys Val Pro Leu Leu Val Ile Thr Gly Gly
210 215 220
Pro Gly Val Val Leu Gln Ala Met Gln Ser Gly Lys Lys Val Ile Gly
225 230 235 240
Ala Gly Ala Gly Asn Pro Pro Ser Ile Val Asp Glu Thr Ala Asn Ile
245 250 255
Glu Lys Ala Ala Ala Asp Ile Val Asp Gly Ala Ser Phe Asp His Asn
260 265 270
Ile Leu Cys Ile Ala Glu Lys Ser Val Val Ala Val Asp Ser Ile Ala
275 280 285
Asp Phe Leu Leu Phe Gln Met Glu Lys Asn Gly Ala Leu His Val Thr
290 295 300
Asn Pro Ser Asp Ile Gln Lys Leu Glu Lys Val Ala Val Thr Asp Lys
305 310 315 320
Gly Val Thr Asn Lys Lys Leu Val Gly Lys Ser Ala Thr Glu Ile Leu
325 330 335
Lys Glu Ala Gly Ile Ala Cys Asp Phe Thr Pro Arg Leu Ile Ile Val
340 345 350
Glu Thr Glu Lys Ser His Pro Phe Ala Thr Val Glu Leu Leu Met Pro
355 360 365
Ile Val Pro Val Val Arg Val Pro Asp Phe Asp Glu Ala Leu Glu Val
370 375 380
Ala Ile Glu Leu Glu Gln Gly Leu His His Thr Ala Thr Met His Ser
385 390 395 400
Gln Asn Ile Ser Arg Leu Asn Lys Ala Ala Arg Asp Met Gln Thr Ser
405 410 415
Ile Phe Val Lys Asn Gly Pro Ser Phe Ala Gly Leu Gly Phe Arg Gly
420 425 430
Glu Gly Ser Thr Thr Phe Thr Ile Ala Thr Pro Thr Gly Glu Gly Thr
435 440 445
Thr Thr Ala Arg His Phe Ala Arg Arg Arg Arg Cys Val Leu Thr Asp
450 455 460
Gly Phe Ser Ile Arg
465
<210> 5
<211> 869
<212> PRT
<213> Staphylococcus aureus
<400> 5
Met Leu Thr Ile Pro Glu Lys Glu Asn Arg Gly Ser Lys Glu Gln Glu
1 5 10 15
Val Ala Ile Met Ile Asp Ala Leu Ala Asp Lys Gly Lys Lys Ala Leu
20 25 30
Glu Ala Leu Ser Lys Lys Ser Gln Glu Glu Ile Asp His Ile Val His
35 40 45
Gln Met Ser Leu Ala Ala Val Asp Gln His Met Val Leu Ala Lys Leu
50 55 60
Ala His Glu Glu Thr Gly Arg Gly Ile Tyr Glu Asp Lys Ala Ile Lys
65 70 75 80
Asn Leu Tyr Ala Ser Glu Tyr Ile Trp Asn Ser Ile Lys Asp Asn Lys
85 90 95
Thr Val Gly Ile Ile Gly Glu Asp Lys Glu Lys Gly Leu Thr Tyr Val
100 105 110
Ala Glu Pro Ile Gly Val Ile Cys Gly Val Thr Pro Thr Thr Asn Pro
115 120 125
Thr Ser Thr Thr Ile Phe Lys Ala Met Ile Ala Ile Lys Thr Gly Asn
130 135 140
Pro Ile Ile Phe Ala Phe His Pro Ser Ala Gln Glu Ser Ser Lys Arg
145 150 155 160
Ala Ala Glu Val Val Leu Glu Ala Ala Met Lys Ala Gly Ala Pro Lys
165 170 175
Asp Ile Ile Gln Trp Ile Glu Val Pro Ser Ile Glu Ala Thr Lys Gln
180 185 190
Leu Met Asn His Lys Gly Ile Ala Leu Val Leu Ala Thr Gly Gly Ser
195 200 205
Gly Met Val Lys Ser Ala Tyr Ser Thr Gly Lys Pro Ala Leu Gly Val
210 215 220
Gly Pro Gly Asn Val Pro Ser Tyr Ile Glu Lys Thr Ala His Ile Lys
225 230 235 240
Arg Ala Val Asn Asp Ile Ile Gly Ser Lys Thr Phe Asp Asn Gly Met
245 250 255
Ile Cys Ala Ser Glu Gln Val Val Val Ile Asp Lys Glu Ile Tyr Lys
260 265 270
Asp Val Thr Asn Glu Phe Lys Ala His Gln Ala Tyr Phe Val Lys Lys
275 280 285
Asp Glu Leu Gln Arg Leu Glu Asn Ala Ile Met Asn Glu Gln Lys Thr
290 295 300
Gly Ile Lys Pro Asp Ile Val Gly Lys Ser Ala Val Glu Ile Ala Glu
305 310 315 320
Leu Ala Gly Ile Pro Val Pro Glu Asn Thr Lys Leu Ile Ile Ala Glu
325 330 335
Ile Ser Gly Val Gly Ser Asp Tyr Pro Leu Ser Arg Glu Lys Leu Ser
340 345 350
Pro Val Leu Ala Leu Val Lys Ala Gln Ser Thr Lys Gln Ala Phe Gln
355 360 365
Ile Cys Glu Asp Thr Leu His Phe Gly Gly Leu Gly His Thr Ala Val
370 375 380
Ile His Thr Glu Asp Glu Thr Leu Gln Lys Asp Phe Gly Leu Arg Met
385 390 395 400
Lys Ala Cys Arg Val Leu Val Asn Thr Pro Ser Ala Val Gly Gly Ile
405 410 415
Gly Asp Met Tyr Asn Glu Leu Ile Pro Ser Leu Thr Leu Gly Cys Gly
420 425 430
Ser Tyr Gly Arg Asn Ser Ile Ser His Asn Val Ser Ala Thr Asp Leu
435 440 445
Leu Asn Ile Lys Thr Ile Ala Lys Arg Arg Asn Asn Thr Gln Ile Phe
450 455 460
Lys Val Pro Ala Gln Ile Tyr Phe Glu Glu Asn Ala Ile Met Ser Leu
465 470 475 480
Thr Thr Met Asp Lys Ile Glu Lys Val Met Ile Val Cys Asp Pro Gly
485 490 495
Met Val Glu Phe Gly Tyr Thr Lys Thr Val Glu Asn Val Leu Arg Gln
500 505 510
Arg Thr Glu Gln Pro Gln Ile Lys Ile Phe Ser Glu Val Glu Pro Asn
515 520 525
Pro Ser Thr Asn Thr Val Tyr Lys Gly Leu Glu Met Met Val Asp Phe
530 535 540
Gln Pro Asp Thr Ile Ile Ala Leu Gly Gly Gly Ser Ala Met Asp Ala
545 550 555 560
Ala Lys Ala Met Trp Met Phe Phe Glu His Pro Glu Thr Ser Phe Phe
565 570 575
Gly Ala Lys Gln Lys Phe Leu Asp Ile Gly Lys Arg Thr Tyr Lys Ile
580 585 590
Gly Met Pro Glu Asn Ala Thr Phe Ile Cys Ile Pro Thr Thr Ser Gly
595 600 605
Thr Gly Ser Glu Val Thr Pro Phe Ala Val Ile Thr Asp Ser Glu Thr
610 615 620
Asn Val Lys Tyr Pro Leu Ala Asp Phe Ala Leu Thr Pro Asp Val Ala
625 630 635 640
Ile Ile Asp Pro Gln Phe Val Met Ser Val Pro Lys Ser Val Thr Ala
645 650 655
Asp Thr Gly Met Asp Val Leu Thr His Ala Met Glu Ser Tyr Val Ser
660 665 670
Val Met Ala Ser Asp Tyr Thr Arg Gly Leu Ser Leu Gln Ala Ile Lys
675 680 685
Leu Thr Phe Glu Tyr Leu Lys Ser Ser Val Glu Lys Gly Asp Lys Val
690 695 700
Ser Arg Glu Lys Met His Asn Ala Ser Thr Leu Ala Gly Met Ala Phe
705 710 715 720
Ala Asn Ala Phe Leu Gly Ile Ala His Ser Ile Ala His Lys Ile Gly
725 730 735
Gly Glu Tyr Gly Ile Pro His Gly Arg Ala Asn Ala Ile Leu Leu Pro
740 745 750
His Ile Ile Arg Tyr Asn Ala Lys Asp Pro Gln Lys His Ala Leu Phe
755 760 765
Pro Lys Tyr Glu Phe Phe Arg Ala Asp Thr Asp Tyr Ala Asp Ile Ala
770 775 780
Lys Phe Leu Gly Leu Lys Gly Asn Thr Thr Glu Ala Leu Val Glu Ser
785 790 795 800
Leu Ala Lys Ala Val Tyr Glu Leu Gly Gln Ser Val Gly Ile Glu Met
805 810 815
Asn Leu Lys Ser Gln Gly Val Ser Glu Glu Glu Leu Asn Glu Ser Ile
820 825 830
Asp Arg Met Ala Glu Leu Ala Phe Glu Asp Gln Cys Thr Thr Ala Asn
835 840 845
Pro Lys Glu Ala Leu Ile Ser Glu Ile Lys Asp Ile Ile Gln Thr Ser
850 855 860
Tyr Asp Tyr Lys Gln
865
<210> 6
<211> 683
<212> PRT
<213> Saccharomyces cerevisiae
<400> 6
Met Thr Ile Lys Glu His Lys Val Val Tyr Glu Ala His Asn Val Lys
1 5 10 15
Ala Leu Lys Ala Pro Gln His Phe Tyr Asn Ser Gln Pro Gly Lys Gly
20 25 30
Tyr Val Thr Asp Met Gln His Tyr Gln Glu Met Tyr Gln Gln Ser Ile
35 40 45
Asn Glu Pro Glu Lys Phe Phe Asp Lys Met Ala Lys Glu Tyr Leu His
50 55 60
Trp Asp Ala Pro Tyr Thr Lys Val Gln Ser Gly Ser Leu Asn Asn Gly
65 70 75 80
Asp Val Ala Trp Phe Leu Asn Gly Lys Leu Asn Ala Ser Tyr Asn Cys
85 90 95
Val Asp Arg His Ala Phe Ala Asn Pro Asp Lys Pro Ala Leu Ile Tyr
100 105 110
Glu Ala Asp Asp Glu Ser Asp Asn Lys Ile Ile Thr Phe Gly Glu Leu
115 120 125
Leu Arg Lys Val Ser Gln Ile Ala Gly Val Leu Lys Ser Trp Gly Val
130 135 140
Lys Lys Gly Asp Thr Val Ala Ile Tyr Leu Pro Met Ile Pro Glu Ala
145 150 155 160
Val Ile Ala Met Leu Ala Val Ala Arg Ile Gly Ala Ile His Ser Val
165 170 175
Val Phe Ala Gly Phe Ser Ala Gly Ser Leu Lys Asp Arg Val Val Asp
180 185 190
Ala Asn Ser Lys Val Val Ile Thr Cys Asp Glu Gly Lys Arg Gly Gly
195 200 205
Lys Thr Ile Asn Thr Lys Lys Ile Val Asp Glu Gly Leu Asn Gly Val
210 215 220
Asp Leu Val Ser Arg Ile Leu Val Phe Gln Arg Thr Gly Thr Glu Gly
225 230 235 240
Ile Pro Met Lys Ala Gly Arg Asp Tyr Trp Trp His Glu Glu Ala Ala
245 250 255
Lys Gln Arg Thr Tyr Leu Pro Pro Val Ser Cys Asp Ala Glu Asp Pro
260 265 270
Leu Phe Leu Leu Tyr Thr Ser Gly Ser Thr Gly Ser Pro Lys Gly Val
275 280 285
Val His Thr Thr Gly Gly Tyr Leu Leu Gly Ala Ala Leu Thr Thr Arg
290 295 300
Tyr Val Phe Asp Ile His Pro Glu Asp Val Leu Phe Thr Ala Gly Asp
305 310 315 320
Val Gly Trp Ile Thr Gly His Thr Tyr Ala Leu Tyr Gly Pro Leu Thr
325 330 335
Leu Gly Thr Ala Ser Ile Ile Phe Glu Ser Thr Pro Ala Tyr Pro Asp
340 345 350
Tyr Gly Arg Tyr Trp Arg Ile Ile Gln Arg His Lys Ala Thr His Phe
355 360 365
Tyr Val Ala Pro Thr Ala Leu Arg Leu Ile Lys Arg Val Gly Glu Ala
370 375 380
Glu Ile Ala Lys Tyr Asp Thr Ser Ser Leu Arg Val Leu Gly Ser Val
385 390 395 400
Gly Glu Pro Ile Ser Pro Asp Leu Trp Glu Trp Tyr His Glu Lys Val
405 410 415
Gly Asn Lys Asn Cys Val Ile Cys Asp Thr Met Trp Gln Thr Glu Ser
420 425 430
Gly Ser His Leu Ile Ala Pro Leu Ala Gly Ala Val Pro Thr Lys Pro
435 440 445
Gly Ser Ala Thr Val Pro Phe Phe Gly Ile Asn Ala Cys Ile Ile Asp
450 455 460
Pro Val Thr Gly Val Glu Leu Glu Gly Asn Asp Val Glu Gly Val Leu
465 470 475 480
Ala Val Lys Ser Pro Trp Pro Ser Met Ala Arg Ser Val Trp Asn His
485 490 495
His Asp Arg Tyr Met Asp Thr Tyr Leu Lys Pro Tyr Pro Gly His Tyr
500 505 510
Phe Thr Gly Asp Gly Ala Gly Arg Asp His Asp Gly Tyr Tyr Trp Ile
515 520 525
Arg Gly Arg Val Asp Asp Val Val Asn Val Ser Gly His Arg Leu Ser
530 535 540
Thr Ser Glu Ile Glu Ala Ser Ile Ser Asn His Glu Asn Val Ser Glu
545 550 555 560
Ala Ala Val Val Gly Ile Pro Asp Glu Leu Thr Gly Gln Thr Val Val
565 570 575
Ala Tyr Val Ser Leu Lys Asp Gly Tyr Leu Gln Asn Asn Ala Thr Glu
580 585 590
Gly Asp Ala Glu His Ile Thr Pro Asp Asn Leu Arg Arg Glu Leu Ile
595 600 605
Leu Gln Val Arg Gly Glu Ile Gly Pro Phe Ala Ser Pro Lys Thr Ile
610 615 620
Ile Leu Val Arg Asp Leu Pro Arg Thr Arg Ser Gly Lys Ile Met Arg
625 630 635 640
Arg Val Leu Arg Lys Val Ala Ser Asn Glu Ala Glu Gln Leu Gly Asp
645 650 655
Leu Thr Thr Leu Ala Asn Pro Glu Val Val Pro Ala Ile Ile Ser Ala
660 665 670
Val Glu Asn Gln Phe Phe Ser Gln Lys Lys Lys
675 680
<210> 7
<211> 367
<212> PRT
<213> Escherichia coli
<400> 7
Met Asp Arg Ile Ile Gln Ser Pro Gly Lys Tyr Ile Gln Gly Ala Asp
1 5 10 15
Val Ile Asn Arg Leu Gly Glu Tyr Leu Lys Pro Leu Ala Glu Arg Trp
20 25 30
Leu Val Val Gly Asp Lys Phe Val Leu Gly Phe Ala Gln Ser Thr Val
35 40 45
Glu Lys Ser Phe Lys Asp Ala Gly Leu Val Val Glu Ile Ala Pro Phe
50 55 60
Gly Gly Glu Cys Ser Gln Asn Glu Ile Asp Arg Leu Arg Gly Ile Ala
65 70 75 80
Glu Thr Ala Gln Cys Gly Ala Ile Leu Gly Ile Gly Gly Gly Lys Thr
85 90 95
Leu Asp Thr Ala Lys Ala Leu Ala His Phe Met Gly Val Pro Val Ala
100 105 110
Ile Ala Pro Thr Ile Ala Ser Thr Asp Ala Pro Cys Ser Ala Leu Ser
115 120 125
Val Ile Tyr Thr Asp Glu Gly Glu Phe Asp Arg Tyr Leu Leu Leu Pro
130 135 140
Asn Asn Pro Asn Met Val Ile Val Asp Thr Lys Ile Val Ala Gly Ala
145 150 155 160
Pro Ala Arg Leu Leu Ala Ala Gly Ile Gly Asp Ala Leu Ala Thr Trp
165 170 175
Phe Glu Ala Arg Ala Cys Ser Arg Ser Gly Ala Thr Thr Met Ala Gly
180 185 190
Gly Lys Cys Thr Gln Ala Ala Leu Ala Leu Ala Glu Leu Cys Tyr Asn
195 200 205
Thr Leu Leu Glu Glu Gly Glu Lys Ala Met Leu Ala Ala Glu Gln His
210 215 220
Val Val Thr Pro Ala Leu Glu Arg Val Ile Glu Ala Asn Thr Tyr Leu
225 230 235 240
Ser Gly Val Gly Phe Glu Ser Gly Gly Leu Ala Ala Ala His Ala Val
245 250 255
His Asn Gly Leu Thr Ala Ile Pro Asp Ala His His Tyr Tyr His Gly
260 265 270
Glu Lys Val Ala Phe Gly Thr Leu Thr Gln Leu Val Leu Glu Asn Ala
275 280 285
Pro Val Glu Glu Ile Glu Thr Val Ala Ala Leu Ser His Ala Val Gly
290 295 300
Leu Pro Ile Thr Leu Ala Gln Leu Asp Ile Lys Glu Asp Val Pro Ala
305 310 315 320
Lys Met Arg Ile Val Ala Glu Ala Ala Cys Ala Glu Gly Glu Thr Ile
325 330 335
His Asn Met Pro Gly Gly Ala Thr Pro Asp Gln Val Tyr Ala Ala Leu
340 345 350
Leu Val Ala Asp Gln Tyr Gly Gln Arg Phe Leu Gln Glu Trp Glu
355 360 365
<210> 8
<211> 365
<212> PRT
<213> Klebsiella pneumoniae
<400> 8
Met Leu Lys Val Ile Gln Ser Pro Ala Lys Tyr Leu Gln Gly Pro Asp
1 5 10 15
Ala Ala Val Leu Phe Gly Gln Tyr Ala Lys Asn Leu Ala Glu Ser Phe
20 25 30
Phe Val Ile Ala Asp Asp Phe Val Met Lys Leu Ala Gly Glu Lys Val
35 40 45
Val Asn Gly Leu Gln Ser His Asp Ile Arg Cys His Ala Glu Arg Phe
50 55 60
Asn Gly Glu Cys Ser His Ala Glu Ile Asn Arg Leu Met Ala Ile Leu
65 70 75 80
Gln Lys Gln Gly Cys Arg Gly Val Val Gly Ile Gly Gly Gly Lys Thr
85 90 95
Leu Asp Thr Ala Lys Ala Ile Gly Tyr Tyr Gln Lys Leu Pro Val Val
100 105 110
Val Ile Pro Thr Ile Ala Ser Thr Asp Ala Pro Thr Ser Ala Leu Ser
115 120 125
Val Ile Tyr Thr Glu Ala Gly Glu Phe Glu Glu Tyr Leu Ile Tyr Pro
130 135 140
Lys Asn Pro Asp Met Val Val Met Asp Thr Ala Ile Ile Ala Lys Ala
145 150 155 160
Pro Val Arg Leu Leu Val Ser Gly Met Gly Asp Ala Leu Ser Thr Trp
165 170 175
Phe Glu Ala Lys Ala Cys Tyr Asp Ala Arg Ala Thr Ser Met Ala Gly
180 185 190
Gly Gln Ser Thr Glu Ala Ala Leu Ser Leu Ala Arg Leu Cys Tyr Asp
195 200 205
Thr Leu Leu Ala Glu Gly Glu Lys Ala Arg Leu Ala Ala Gln Ala Gly
210 215 220
Val Val Thr Glu Ala Leu Glu Arg Ile Ile Glu Ala Asn Thr Tyr Leu
225 230 235 240
Ser Gly Ile Gly Phe Glu Ser Ser Gly Leu Ala Ala Ala His Ala Ile
245 250 255
His Asn Gly Phe Thr Ile Leu Glu Glu Cys His His Leu Tyr His Gly
260 265 270
Glu Lys Val Ala Phe Gly Thr Leu Ala Gln Leu Val Leu Gln Asn Ser
275 280 285
Pro Met Asp Glu Ile Glu Thr Val Leu Gly Phe Cys Gln Arg Val Gly
290 295 300
Leu Pro Val Thr Leu Ala Gln Met Gly Val Lys Glu Gly Ile Asp Ala
305 310 315 320
Lys Ile Ala Ala Val Ala Lys Ala Thr Cys Ala Glu Gly Glu Thr Ile
325 330 335
His Asn Met Pro Phe Ala Val Thr Pro Glu Ser Val His Ala Ala Ile
340 345 350
Leu Thr Ala Asp Leu Leu Gly Gln Gln Trp Leu Ala Arg
355 360 365
<210> 9
<211> 367
<212> PRT
<213> Enterobacter aerogenes
<400> 9
Met Asp Arg Ile Ile Gln Ser Pro Gly Lys Tyr Ile Gln Gly Ala Gly
1 5 10 15
Ala Ile Lys Arg Leu Gly Glu Tyr Leu Lys Pro Leu Ala Glu Arg Trp
20 25 30
Leu Ile Ile Gly Asp Lys Phe Val Leu Gly Phe Ala Glu Glu Gln Leu
35 40 45
Arg Thr Ser Leu Gly Gly Ala Gly Leu Val Ala Glu Ile Ala Pro Phe
50 55 60
Gly Gly Glu Cys Ser Gln Asn Glu Ile Asn Arg Leu Arg Asp Ile Ala
65 70 75 80
Ser Ser Ala Gln Cys His Ala Val Leu Gly Ile Gly Gly Gly Lys Thr
85 90 95
Leu Asp Thr Ala Lys Ala Leu Ala His Tyr Met His Leu Pro Val Val
100 105 110
Val Ala Pro Thr Ile Ala Ser Thr Asp Ala Pro Cys Ser Ala Leu Ser
115 120 125
Val Ile Tyr Thr Asp Asp Gly Glu Phe Glu Ser Tyr Leu Met Leu Pro
130 135 140
His Asn Pro Asn Met Val Val Val Asp Thr Gln Ile Val Ala Ala Ala
145 150 155 160
Pro Ala Arg Leu Leu Ala Ala Gly Ile Gly Asp Ala Leu Ala Thr Trp
165 170 175
Phe Glu Ala Arg Ala Cys Ser Arg Ser Gly Ala Thr Thr Met Ala Gly
180 185 190
Gly Lys Cys Thr Gln Ala Ala Leu Ala Leu Ala Glu Leu Cys Tyr Asn
195 200 205
Thr Leu Val Glu Glu Gly Glu Lys Ala Met Leu Ala Ala Glu Gln His
210 215 220
Val Val Thr Pro Ala Leu Glu Arg Val Ile Glu Ala Asn Thr Tyr Leu
225 230 235 240
Ser Gly Val Gly Phe Glu Ser Gly Gly Leu Ala Ala Ala His Ala Ile
245 250 255
His Asn Gly Leu Thr Ala Ile Pro Asp Ala His His Phe Tyr His Gly
260 265 270
Glu Lys Val Ala Phe Gly Thr Leu Thr Gln Leu Val Leu Glu Asn Ala
275 280 285
Pro Val Glu Glu Ile Glu Thr Ala Ala Ala Leu Cys His Ser Val Gly
290 295 300
Leu Pro Ile Thr Leu Ala Gln Leu Asp Ile Lys Gly Asp Ile Pro Ala
305 310 315 320
Lys Met Arg Thr Val Ala Glu Ala Ala Cys Ala Glu Gly Glu Thr Ile
325 330 335
His Asn Met Pro Gly Gly Ala Cys Ala Asp Gln Val Tyr Ala Ala Leu
340 345 350
Leu Val Ala Asp Gln Tyr Gly Gln Arg Phe Leu Gln Glu Trp Glu
355 360 365
<210> 10
<211> 364
<212> PRT
<213> Yersinia aldovae
<400> 10
Met Leu Lys Val Ile Gln Ser Pro Ser Lys Tyr Ile Gln Gly Ala Asn
1 5 10 15
Ala Leu Gln Ser Ile Gly Glu Phe Ala Lys Leu Leu Ala Asn Asn Tyr
20 25 30
Phe Ile Ile Ala Asp Asp Phe Val Met Lys Leu Thr Ala Asp Thr Val
35 40 45
Gly Thr Ser Leu Gln Thr Cys Glu Leu Lys Ser His Phe Ser Arg Phe
50 55 60
Asn Gly Glu Cys Ser Arg Gln Glu Ile Glu Arg Leu Thr Val Glu Leu
65 70 75 80
Lys Lys Tyr Gly Cys Asn Gly Val Ile Gly Ile Gly Gly Gly Lys Thr
85 90 95
Leu Asp Thr Ala Lys Ala Ile Ala His Tyr Gln His Ile Pro Val Val
100 105 110
Val Val Pro Thr Ile Ala Ser Thr Asp Ala Pro Thr Ser Ala Leu Ser
115 120 125
Val Ile Tyr Thr Glu Gln Gly Glu Phe Ala Glu Tyr Leu Ile Tyr Pro
130 135 140
Lys Asn Pro Asp Ile Val Leu Met Asp Thr Thr Ile Ile Ala Lys Ala
145 150 155 160
Pro Val Arg Leu Leu Val Ala Gly Met Gly Asp Ala Leu Ser Thr Tyr
165 170 175
Phe Glu Ala Gln Ala Cys Phe Asp Ala Lys Ala Ile Ser Met Ala Gly
180 185 190
Gly Ala Ser Thr Leu Ala Ala Ile Thr Leu Ala Arg Leu Cys Tyr Glu
195 200 205
Thr Leu Leu Ala Glu Gly Tyr Lys Ala Lys Leu Ala Val Glu Ala Gly
210 215 220
Val Val Thr Glu Ala Val Glu Arg Ile Ile Glu Ala Asn Thr Tyr Leu
225 230 235 240
Ser Gly Ile Gly Phe Glu Ser Ser Gly Leu Ala Ala Ala His Ala Ile
245 250 255
His Asn Gly Phe Thr Val Leu Glu Glu Cys His His Leu Tyr His Gly
260 265 270
Glu Lys Val Ala Phe Gly Thr Leu Thr Gln Leu Val Leu Gln Asn Ser
275 280 285
Ser Met Glu Glu Ile Glu Thr Val Leu Ser Phe Cys Gln Gln Leu Gly
290 295 300
Leu Pro Ile Thr Leu Ala Glu Met Gly Val Thr Gln Asp Leu Glu Cys
305 310 315 320
Lys Ile Arg Ala Val Ala Gln Ala Ser Cys Ala Glu Gly Glu Thr Ile
325 330 335
His Asn Met Pro Phe Lys Val Thr Ala Asp Ser Val Tyr Ala Ala Ile
340 345 350
Ile Val Ala Asp Arg Leu Gly Gln Ala Phe Leu Asn
355 360
<210> 11
<211> 584
<212> PRT
<213> Saccharomyces cerevisiae
<400> 11
Met Ser Ala Lys Ser Phe Glu Val Thr Asp Pro Val Asn Ser Ser Leu
1 5 10 15
Lys Gly Phe Ala Leu Ala Asn Pro Ser Ile Thr Leu Val Pro Glu Glu
20 25 30
Lys Ile Leu Phe Arg Lys Thr Asp Ser Asp Lys Ile Ala Leu Ile Ser
35 40 45
Gly Gly Gly Ser Gly His Glu Pro Thr His Ala Gly Phe Ile Gly Lys
50 55 60
Gly Met Leu Ser Gly Ala Val Val Gly Glu Ile Phe Ala Ser Pro Ser
65 70 75 80
Thr Lys Gln Ile Leu Asn Ala Ile Arg Leu Val Asn Glu Asn Ala Ser
85 90 95
Gly Val Leu Leu Ile Val Lys Asn Tyr Thr Gly Asp Val Leu His Phe
100 105 110
Gly Leu Ser Ala Glu Arg Ala Arg Ala Leu Gly Ile Asn Cys Arg Val
115 120 125
Ala Val Ile Gly Asp Asp Val Ala Val Gly Arg Glu Lys Gly Gly Met
130 135 140
Val Gly Arg Arg Ala Leu Ala Gly Thr Val Leu Val His Lys Ile Val
145 150 155 160
Gly Ala Phe Ala Glu Glu Tyr Ser Ser Lys Tyr Gly Leu Asp Gly Thr
165 170 175
Ala Lys Val Ala Lys Ile Ile Asn Asp Asn Leu Val Thr Ile Gly Ser
180 185 190
Ser Leu Asp His Cys Lys Val Pro Gly Arg Lys Phe Glu Ser Glu Leu
195 200 205
Asn Glu Lys Gln Met Glu Leu Gly Met Gly Ile His Asn Glu Pro Gly
210 215 220
Val Lys Val Leu Asp Pro Ile Pro Ser Thr Glu Asp Leu Ile Ser Lys
225 230 235 240
Tyr Met Leu Pro Lys Leu Leu Asp Pro Asn Asp Lys Asp Arg Ala Phe
245 250 255
Val Lys Phe Asp Glu Asp Asp Glu Val Val Leu Leu Val Asn Asn Leu
260 265 270
Gly Gly Val Ser Asn Phe Val Ile Ser Ser Ile Thr Ser Lys Thr Thr
275 280 285
Asp Phe Leu Lys Glu Asn Tyr Asn Ile Thr Pro Val Gln Thr Ile Ala
290 295 300
Gly Thr Leu Met Thr Ser Phe Asn Gly Asn Gly Phe Ser Ile Thr Leu
305 310 315 320
Leu Asn Ala Thr Lys Ala Thr Lys Ala Leu Gln Ser Asp Phe Glu Glu
325 330 335
Ile Lys Ser Val Leu Asp Leu Leu Asn Ala Phe Thr Asn Ala Pro Gly
340 345 350
Trp Pro Ile Ala Asp Phe Glu Lys Thr Ser Ala Pro Ser Val Asn Asp
355 360 365
Asp Leu Leu His Asn Glu Val Thr Ala Lys Ala Val Gly Thr Tyr Asp
370 375 380
Phe Asp Lys Phe Ala Glu Trp Met Lys Ser Gly Ala Glu Gln Val Ile
385 390 395 400
Lys Ser Glu Pro His Ile Thr Glu Leu Asp Asn Gln Val Gly Asp Gly
405 410 415
Asp Cys Gly Tyr Thr Leu Val Ala Gly Val Lys Gly Ile Thr Glu Asn
420 425 430
Leu Asp Lys Leu Ser Lys Asp Ser Leu Ser Gln Ala Val Ala Gln Ile
435 440 445
Ser Asp Phe Ile Glu Gly Ser Met Gly Gly Thr Ser Gly Gly Leu Tyr
450 455 460
Ser Ile Leu Leu Ser Gly Phe Ser His Gly Leu Ile Gln Val Cys Lys
465 470 475 480
Ser Lys Asp Glu Pro Val Thr Lys Glu Ile Val Ala Lys Ser Leu Gly
485 490 495
Ile Ala Leu Asp Thr Leu Tyr Lys Tyr Thr Lys Ala Arg Lys Gly Ser
500 505 510
Ser Thr Met Ile Asp Ala Leu Glu Pro Phe Val Lys Glu Phe Thr Ala
515 520 525
Ser Lys Asp Phe Asn Lys Ala Val Lys Ala Ala Glu Glu Gly Ala Lys
530 535 540
Ser Thr Ala Thr Phe Glu Ala Lys Phe Gly Arg Ala Ser Tyr Val Gly
545 550 555 560
Asp Ser Ser Gln Val Glu Asp Pro Gly Ala Val Gly Leu Cys Glu Phe
565 570 575
Leu Lys Gly Val Gln Ser Ala Leu
580
<210> 12
<211> 356
<212> PRT
<213> Klebsiella pneumoniae
<400> 12
Met Lys Lys Leu Ile Asn Arg Val Glu Asp Val Leu Asn Glu Gln Leu
1 5 10 15
Gln Gly Leu Ala Lys Ala His Pro Gln Leu Thr Leu His Gln Asp Pro
20 25 30
Leu Tyr Val Thr Arg Thr Asp Ala Pro Val Ala Gly Lys Val Ala Leu
35 40 45
Leu Ser Gly Gly Gly Ser Gly His Glu Pro Met His Cys Gly Tyr Ile
50 55 60
Gly Gln Gly Met Leu Ser Gly Ala Cys Pro Gly Glu Ile Phe Thr Ser
65 70 75 80
Pro Thr Pro Asp Lys Met Phe Glu Cys Ala Met Gln Ile Asp Gly Gly
85 90 95
Glu Gly Val Leu Leu Ile Ile Lys Asn Tyr Thr Gly Asp Ile Leu Asn
100 105 110
Phe Glu Thr Ala Thr Glu Leu Leu His Glu Ser Gly Ile Lys Val Thr
115 120 125
Thr Val Val Val Asp Asp Asp Val Ala Val Lys Asp Ser Leu Tyr Thr
130 135 140
Ala Gly Arg Arg Gly Val Ala Asn Thr Val Leu Ile Glu Lys Leu Val
145 150 155 160
Gly Ala Ala Ala Glu Arg Gly Asp Ser Leu Glu Ala Cys Ala Glu Leu
165 170 175
Gly Arg Arg Leu Asn Asn Leu Gly His Ser Ile Gly Ile Ala Leu Gly
180 185 190
Ala Cys Thr Val Pro Ala Ala Gly Gln Pro Ser Phe Thr Leu Lys Asp
195 200 205
Asp Glu Met Glu Phe Gly Val Gly Ile His Gly Glu Pro Gly Ile Asp
210 215 220
Arg Arg Arg Phe Ser Ser Leu Asp Gln Thr Val Asp Glu Met Phe Asp
225 230 235 240
Thr Leu Leu Glu Asn Gly Ala Tyr Ser Arg Thr Leu Arg Gln Trp Asp
245 250 255
Thr Val Lys Gly Ala Trp Gln Glu Val Lys Gln Ser Lys Thr Ala Leu
260 265 270
Gln Asn Gly Asp Arg Val Ile Ala Leu Val Asn Asn Leu Gly Ala Thr
275 280 285
Pro Leu Ser Glu Leu Tyr Gly Val Tyr His Arg Leu Ala Gln Arg Cys
290 295 300
Glu Ala Ser Gly Ile Ile Ile Glu Arg Asn Leu Ile Gly Ser Tyr Cys
305 310 315 320
Thr Ser Leu Asp Met Ser Gly Phe Ser Ile Thr Leu Leu Lys Val Asp
325 330 335
Asp Glu Thr Leu Thr Leu Trp Asp Ala Pro Val His Thr Pro Ala Leu
340 345 350
Asn Trp Gly Asn
355
<210> 13
<211> 572
<212> PRT
<213> Yarrowia lipolytica
<400> 13
Met Thr Thr Lys Gln Phe Gln Phe Asp Ser Asp Pro Leu Asn Ser Ala
1 5 10 15
Leu Ala Ala Thr Ala Glu Ala Ser Gly Leu Ala Tyr Leu Pro Lys Ser
20 25 30
Lys Val Ile Tyr Tyr Pro Leu Thr Asn Asp Lys Val Thr Leu Ile Ser
35 40 45
Gly Gly Gly Ala Gly His Glu Pro Ala Gln Thr Gly Phe Val Gly Pro
50 55 60
Gly Leu Leu Asp Ala Ala Val Ser Gly Gln Ile Phe Ala Ser Pro Ser
65 70 75 80
Thr Lys Gln Ile Ile Ala Gly Val Asn Ala Val Lys Ser Gln Arg Gly
85 90 95
Ser Ile Ile Ile Val Met Asn Tyr Thr Gly Asp Val Ile His Phe Gly
100 105 110
Met Ala Ala Glu Gln Leu Arg Ser Arg Tyr Asp Tyr His Ala Glu Leu
115 120 125
Val Ser Ile Gly Asp Asp Ile Ser Val Asn Lys Lys Ala Gly Arg Arg
130 135 140
Gly Leu Ala Gly Thr Val Leu Val His Lys Ile Ala Gly His Leu Ala
145 150 155 160
Arg Asp Gly Trp Asp Val Gly Val Leu Ala Glu Ala Leu Arg Thr Thr
165 170 175
Ala Ala Asn Leu Ala Thr Val Ala Ala Ser Leu Glu His Cys Thr Val
180 185 190
Pro Gly Arg Lys Phe Glu Thr Glu Leu Ala Ala Asp Glu Met Glu Ile
195 200 205
Gly Met Gly Ile His Asn Glu Pro Gly Val Lys Thr Ile Lys Ile Gly
210 215 220
Lys Val Glu Ser Leu Leu Asp Glu Leu Val Asp Lys Phe Glu Pro Ser
225 230 235 240
Lys Gln Asp Phe Val Pro Phe Asn Lys Gly Asp Glu Val Val Leu Leu
245 250 255
Val Asn Ser Leu Gly Gly Val Ser Ser Leu Glu Leu His Ala Ile Ala
260 265 270
Asn Ile Ala Gln Thr Lys Phe Glu Lys Val Leu Gly Val Lys Thr Val
275 280 285
Arg Leu Ile Val Gly Asn Phe Met Ala Ala Phe Asn Gly Pro Gly Phe
290 295 300
Ser Leu Thr Leu Leu Asn Val Thr Thr Thr Ala Lys Lys Gly Asn Phe
305 310 315 320
Asp Val Leu Gly Ala Leu Asp Ala Pro Val Ser Thr Ala Ala Trp Pro
325 330 335
Ser Leu Gln Gln Lys Asp Lys Pro Ala Asn Gly Gly Val Gln Glu Glu
340 345 350
Lys Glu Thr Asp Ser Asp Lys Pro Ala Glu Pro Thr Gly Ile Lys Ala
355 360 365
Asp Gly Lys Leu Phe Lys Ala Met Ile Glu Ser Ala Val Asp Asp Leu
370 375 380
Lys Lys Glu Glu Pro Gln Ile Thr Lys Tyr Asp Thr Ile Ala Gly Asp
385 390 395 400
Gly Asp Cys Gly Glu Thr Leu Leu Ala Gly Gly Asp Gly Ile Leu Asp
405 410 415
Ala Ile Lys Asn Lys Lys Ile Asp Leu Asp Asp Ala Ala Gly Val Ala
420 425 430
Asp Ile Ser His Ile Val Glu Asn Ser Met Gly Gly Thr Ser Gly Gly
435 440 445
Leu Tyr Ser Ile Phe Phe Ser Gly Leu Val Val Gly Ile Lys Glu Thr
450 455 460
Lys Ala Lys Glu Leu Ser Val Asp Val Phe Ala Lys Ala Cys Glu Thr
465 470 475 480
Ala Leu Glu Thr Leu Ser Lys Tyr Thr Gln Ala Arg Val Gly Asp Arg
485 490 495
Thr Leu Met Asp Ala Leu Val Pro Phe Val Glu Thr Leu Ser Lys Thr
500 505 510
Lys Asp Phe Ala Lys Ala Val Glu Ala Ala Arg Lys Gly Ala Asp Glu
515 520 525
Thr Ser Lys Leu Pro Ala Asn Phe Gly Arg Ala Ser Tyr Val Asn Glu
530 535 540
Glu Gly Leu Glu Asn Ile Pro Asp Pro Gly Ala Leu Gly Leu Ala Val
545 550 555 560
Ile Phe Glu Gly Leu Leu Lys Ala Trp Glu Lys Lys
565 570
<210> 14
<211> 580
<212> PRT
<213> Schizosaccharomyces pombe
<400> 14
Met Asp Lys His Phe Ile Asn Asp Pro Glu Val Leu Val Leu Asp Gly
1 5 10 15
Leu Lys Ser Leu Ala Asp Met Asn Lys Thr Leu Thr Val His Glu Glu
20 25 30
Gly Lys Phe Ile Tyr Phe His Asp Tyr Asn Lys Lys Asn Val Ser Val
35 40 45
Ile Ser Gly Gly Gly Ala Gly His Glu Pro Thr His Ser Ser Phe Val
50 55 60
Gly Lys Gly Met Leu Thr Ala Ala Val Ser Gly Ser Ile Phe Ala Ser
65 70 75 80
Pro Ser Ser Lys Gln Ile Tyr Thr Gly Ile Lys Gln Val Glu Ser Glu
85 90 95
Ala Gly Thr Leu Val Ile Cys Lys Asn Tyr Thr Gly Asp Ile Leu His
100 105 110
Phe Gly Met Ala Leu Glu Lys Gln Arg Thr Ala Gly Lys Lys Ala Glu
115 120 125
Leu Ile Ala Val Ala Asp Asp Val Ser Val Gly Arg Lys Lys Ser Gly
130 135 140
Lys Val Gly Arg Arg Gly Leu Ser Gly Thr Val Leu Val His Lys Ile
145 150 155 160
Ala Gly Ala Ala Ala Ala Arg Gly Leu Pro Leu Glu Ala Val Thr Thr
165 170 175
Ile Ala Lys Ala Ala Ile Asp Asn Leu Val Ser Ile Gly Ala Ser Leu
180 185 190
Ala His Val His Val Pro Gly His Glu Pro Ile Ala Lys Glu Asp Glu
195 200 205
Met Lys His Asp Glu Met Glu Leu Gly Met Gly Ile His Asn Glu Pro
210 215 220
Gly Cys Lys Arg Ile Ser Pro Ile Pro Ser Ile Asp Asp Leu Ile Ala
225 230 235 240
Gln Met Leu Lys Gln Met Leu Asp Gln Ser Asp Lys Asp Arg Ala Tyr
245 250 255
Val Lys Ile Glu Gly Asp Asp Glu Val Val Leu Leu Met Asn Asn Leu
260 265 270
Gly Gly Leu Ser Met Leu Glu Phe Ser Ala Ile Ser His Lys Val Lys
275 280 285
Glu Ala Leu Ala Lys Glu Tyr Lys Ile Asn Pro Val Arg Ile Phe Ala
290 295 300
Gly Pro Phe Thr Thr Ser Leu Asn Gly Leu Gly Phe Gly Ile Thr Leu
305 310 315 320
Leu Arg Thr Thr Asp Arg Val Lys Val Glu Gly Glu Glu Tyr Ser Leu
325 330 335
Val Asp Leu Ile Asp Gln Pro Val Glu Ala Ile Gly Trp Pro Leu Cys
340 345 350
Gln Pro Ser Asp Leu Lys Ser Lys Asn Lys Ile Gly Asn Val Ser Ile
355 360 365
Glu Glu Gly Gln Lys Asp Val Lys Ser Pro Val Thr Val Asp Lys Glu
370 375 380
Lys Val Arg Gln Ala Ile Val Asn Ser Met Glu Asn Leu Ile Lys Ala
385 390 395 400
Glu Pro Lys Ile Thr Lys Phe Asp Thr Met Ala Gly Asp Gly Asp Cys
405 410 415
Gly Thr Thr Leu Lys Arg Gly Ala Glu Gly Val Leu Lys Phe Val Lys
420 425 430
Ser Asp Lys Phe Ser Asp Asp Pro Ile Arg Ile Val Arg Asp Ile Ala
435 440 445
Asp Val Ile Glu Asp Asn Met Asp Gly Thr Ser Gly Ala Leu Tyr Ala
450 455 460
Ile Phe Phe His Gly Phe Ala Lys Gly Met Lys Asp Thr Leu Glu Lys
465 470 475 480
Ser Lys Asp Ile Ser Ser Lys Thr Trp Ala Ala Gly Leu Lys Val Ala
485 490 495
Leu Asp Thr Leu Phe Lys Tyr Thr Pro Ala Arg Pro Gly Asp Ser Thr
500 505 510
Met Cys Asp Ala Leu Val Pro Phe Val Glu Thr Phe Val Lys Thr Asn
515 520 525
Asp Leu Asn Ala Ala Val Glu Glu Ala Arg Lys Gly Ala Asp Ala Thr
530 535 540
Ala Asp Met Gln Ala Lys Leu Gly Arg Ala Val Tyr Val Gly Asp Asp
545 550 555 560
Val Lys Val Pro Asp Ala Gly Ala Leu Gly Val Val Ala Ile Val Glu
565 570 575
Gly Phe Thr Lys
580
<210> 15
<211> 621
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..621
<223> /organism="Artificial Sequence"
/note="Fragment containing the TDH3-promoter"
/mol_type="unassigned DNA"
<400> 15
ggtctcggtg cttagtcaaa aaattagcct tttaattctg ctgtaacccg tacatgccca 60
aaataggggg cgggttacac agaatatata acatcgtagg tgtctgggtg aacagtttat 120
tcctggcatc cactaaatat aatggagccc gctttttaag ctggcatcca gaaaaaaaaa 180
gaatcccagc accaaaatat tgttttcttc accaaccatc agttcatagg tccattctct 240
tagcgcaact acagagaaca ggggcacaaa caggcaaaaa acgggcacaa cctcaatgga 300
gtgatgcaac ctgcctggag taaatgatga cacaaggcaa ttgacccacg catgtatcta 360
tctcattttc ttacaccttc tattaccttc tgctctctct gatttggaaa aagctgaaaa 420
aaaaggttga aaccagttcc ctgaaattat tcccctactt gactaataag tatataaaga 480
cggtaggtat tgattgtaat tctgtaaatc tatttcttaa acttcttaaa ttctactttt 540
atagttagtc ttttttttag ttttaaaaca ccaagaactt agtttcgaat aaacacacat 600
aaacaaacaa aatgggagac c 621
<210> 16
<211> 620
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..620
<223> /organism="Artificial Sequence"
/note="Fragment containing the TDH1-promoter"
/mol_type="unassigned DNA"
<400> 16
ggtctcggtg ccagcgccag tagggttgtt gagcttagta aaaatgtgcg caccacaagc 60
ctacagactc cacgtcacat gaaaccacac cgtggggcct tgttgcgcta ggaataggat 120
atgcgacgaa gacgcttctg cttagtaacc acaccacatt ttcagggggt cgatctgctt 180
gcttccttta ctgtcacgag cggcccataa tcgcgctttt tttttaaaag gcgcgagaca 240
gcaaacagga agctcgggtt tcaaccttcg gagtggtcgc agatctggag actggatctt 300
tacaatacag taaggcaagc caccatctgc ttcttaggtg catgcgacgg tatccacgtg 360
cagaacaaca tagtctgaag aaggggggga ggagcatgtt cattctctgt agcagtaaga 420
gcttggtgat aatgaccaaa actggagtct cgaaatcata taaatagaca atatattttc 480
acacaatgag atttgtagta cagttctatt ctctctcttg cataaataag aaattcatca 540
agaacttggt ttgatatttc accaacacac acaaaaaaca gtacttcact aaatttacac 600
acaaaacaaa atgggagacc 620
<210> 17
<211> 321
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..321
<223> /organism="Artificial Sequence"
/note="Fragment containing the PGK1-terminator"
/mol_type="unassigned DNA"
<400> 17
ggtctcgtaa attgaattga attgaaatcg atagatcaat ttttttcttt tctctttccc 60
catcctttac gctaaaataa tagtttattt tattttttga atatttttta tttatatacg 120
tatatataga ctattattta tcttttaatg attattaaga tttttattaa aaaaaattac 180
gctcctcttt taatgccttt atgcagtttt ttttcccatt cgatatttct atgttcgggt 240
tcagcgtatt ttaagtttaa taactcgaaa attctgcgtt cgttaaagct ttcgagaagg 300
atattatttc cctcggagac c 321
<210> 18
<211> 621
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..621
<223> /organism="Artificial Sequence"
/note="Fragment containing the PGK1-promoter"
/mol_type="unassigned DNA"
<400> 18
ggtctcggtg cgggccagaa aaaggaagtg tttccctcct tcttgaattg atgttaccct 60
cataaagcac gtggcctctt atcgagaaag aaattaccgt cgctcgtgat ttgtttgcaa 120
aaagaacaaa actgaaaaaa cccagacacg ctcgacttcc tgtcttccta ttgattgcag 180
cttccaattt cgtcacacaa caaggtccta gcgacggctc acaggttttg taacaagcaa 240
tcgaaggttc tggaatggcg ggaaagggtt tagtaccaca tgctatgatg cccactgtga 300
tctccagagc aaagttcgtt cgatcgtact gttactctct ctctttcaaa cagaattgtc 360
cgaatcgtgt gacaacaaca gcctgttctc acacactctt ttcttctaac caagggggtg 420
gtttagttta gtagaacctc gtgaaactta catttacata tatataaact tgcataaatt 480
ggtcaatgca agaaatacat atttggtctt ttctaattcg tagtttttca agttcttaga 540
tgctttcttt ttctcttttt tacagatcat caaggaagta attatctact ttttacaaca 600
aatataaaac aatgggagac c 621
<210> 19
<211> 621
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..621
<223> /organism="Artificial Sequence"
/note="Fragment containing the PRE3-promoter"
/mol_type="unassigned DNA"
<400> 19
ggtctcggtg ccaaacatta atttgttctg catactttga acctttcaga aaataaaaaa 60
cattacgcgc atacttaccc tgctcgcgaa gaagagtaac actaacgcat tctatgggca 120
attgaagaca gtattcagta caagacatag tccgtttcct tgagtcaatt cctatagcat 180
tatgaactag ccgcctttaa gagtgccaag ctgttcaaca ccgatcattt ttgatgattt 240
ggcgtttttg ttatattgat agatttcttt tgaattttgt cattttcact tttccactcg 300
caacggaatc cggtggcaaa aaagggaaaa gcattgaaat gcaatcttta acagtatttt 360
aaacaagttg cgacacggtg tacaattacg ataagaattg ctacttcaaa gtacacacag 420
aaagttaaca tgaatggaat tcaagtggac atcaatcgtt tgaaaaaggg cgaagtcagt 480
ttaggtacct caatgtatgt atataagaat ttttcctccc actttattgt ttctaaaagt 540
tcaatgaagt aaagtctcaa ttggccttat tactaactaa taggtatctt ataatcacct 600
aataaaatag aatgggagac c 621
<210> 20
<211> 322
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..322
<223> /organism="Artificial Sequence"
/note="Fragment containing the PGI1-terminator"
/mol_type="unassigned DNA"
<400> 20
ggtctcgtaa aacaaatcgc tcttaaatat atacctaaag aacattaaag ctatattata 60
agcaaagata cgtaaatttt gcttatatta ttatacacat atcatatttc tatattttta 120
agatttggtt atataatgta cgtaatgcaa aggaaataaa ttttatacat tattgaacag 180
cgtccaagta actacattat gtgcactaat agtttagcgt cgtgaagact ttattgtgtc 240
gcgaaaagta aaaattttaa aaattagagc accttgaact tgcgaaaaag gttctcatca 300
actgtttaaa acctcggaga cc 322
<210> 21
<211> 621
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..621
<223> /organism="Artificial Sequence"
/note="Fragment containing the ENO1-promoter"
/mol_type="unassigned DNA"
<400> 21
ggtctcggtg cccgcggaac cgccagatat tcattacttg acgcaaaagc gtttgaaata 60
atgacgaaaa agaaggaaga aaaaaaaaga aaaataccgc ttctaggcgg gttatctact 120
gatccgagct tccactagga tagcacccaa acacctgcat atttggacga cctttactta 180
caccaccaaa aaccactttc gcctctcccg cccctgataa cgtccactaa ttgagcgatt 240
acctgagcgg tcctcttttg tttgcagcat gagacttgca tactgcaaat cgtaagtagc 300
aacgtgtcaa ggtcaaaact gtatggaaac cttgtcacct cacttaattc tagctagcct 360
accctgcaag tcaagaggtg tccgtgattc ctagccacct caaggtatgc ctctccccgg 420
aaactgtggc cttttctggc acacatgatc tccacgattt caacatataa atagcttttg 480
ataatggcaa tattaatcaa atttatttta cttctttctt gtaacatctc tcttgtaatc 540
ccttattcct tctagctatt tttcataaaa aaccaagcaa ctgcttatca acacacaaac 600
actaaatcaa aatgggagac c 621
<210> 22
<211> 621
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..621
<223> /organism="Artificial Sequence"
/note="Fragment containing the ACT1-promoter"
/mol_type="unassigned DNA"
<400> 22
ggtctcggtg caacatatat acacaattac agtaacaata acaagaggac agatactacc 60
aaaatgtgtg gggaagcggg taagctgcca cagcaattaa tgcacaacat ttaacctaca 120
ttcttcctta tcggatcctc aaaaccctta aaaacatatg cctcacccta acatattttc 180
caattaaccc tcaatatttc tctgtcaccc ggcctctatt ttccattttc ttctttaccc 240
gccacgcgtt tttttctttc aaattttttt cttctttctt ctttttcttc cacgtcctct 300
tgcataaata aataaaccgt tttgaaacca aactcgcctc tctctctcct ttttgaaata 360
tttttgggtt tgtttgatcc tttccttccc aatctctctt gtttaatata tattcattta 420
tatcacgctc tctttttatc ttcctttttt tcctctctct tgtattcttc cttccccttt 480
ctactcaaac caagaagaaa aagaaaaggt caatctttgt taaagaatag gatcttctac 540
tacatcagct tttagatttt tcacgcttac tgcttttttc ttcccaagat cgaaaattta 600
ctgaattaac aatgggagac c 621
<210> 23
<211> 322
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..322
<223> /organism="Artificial Sequence"
/note="Fragment containing the CYC1-terminator"
/mol_type="unassigned DNA"
<400> 23
ggtctcgtaa aacaggcccc ttttcctttg tcgatatcat gtaattagtt atgtcacgct 60
tacattcacg ccctcccccc acatccgctc taaccgaaaa ggaaggagtt agacaacctg 120
aagtctaggt ccctatttat ttttttatag ttatgttagt attaagaacg ttatttatat 180
ttcaaatttt tctttttttt ctgtacaaac gcgtgtacgc atgtaacatt atactgaaaa 240
ccttgcttga gaaggttttg ggacgctcga aggctttaat ttgcaagctt cgcagtttac 300
actctcatcg tcctcggaga cc 322
<210> 24
<211> 621
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..621
<223> /organism="Artificial Sequence"
/note="Fragment containing the TPI1-promoter"
/mol_type="unassigned DNA"
<400> 24
ggtctcggtg cgacacctaa ctacatagtg tttaaagatt acggatattt aacttactta 60
gaataatgcc atttttttga gttataataa tcctacgtta gtgtgagcgg gatttaaact 120
gtgaggacct taatacattc agacacttct gcggtatcac cctacttatt cccttcgaga 180
ttatatctag gaacccatca ggttggtgga agattacccg ttctaagact tttcagcttc 240
ctctattgat gttacacctg gacacccctt ttctggcatc cagtttttaa tcttcagtgg 300
catgtgagat tctccgaaat taattaaagc aatcacacaa ttctctcgga taccacctcg 360
gttgaaactg acaggtggtt tgttacgcat gctaatgcaa aggagcctat atacctttgg 420
ctcggctgct gtaacaggga atataaaggg cagcataatt taggagttta gtgaacttgc 480
aacatttact attttccctt cttacgtaaa tatttttctt tttaattcta aatcaatctt 540
tttcaatttt ttgtttgtat tcttttcttg cttaaatcta taactacaaa aaacacatac 600
ataaactaaa aatgggagac c 621
<210> 25
<211> 348
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..348
<223> /organism="Artificial Sequence"
/note="Fragment containing the ATG7-promoter"
/mol_type="unassigned DNA"
<400> 25
ggtctcggtg caaaaacacc aaagaatgga gagtagtata tactcttaac aaacactagc 60
atttcagttt atctatatac atatatatgg atgtaaaatg tactttatgg aagaacaagc 120
caccacatgt tgaaaactag ataggcaagc aagatttttc atttgtagag ctcttacgca 180
agatttttaa acttccgctt ttttaatcca tgagattcct ttggacaccc tttccggcac 240
ggcaaaacaa aaaaattaag ggaactcatt attttacgat gctacttaga taactaaagt 300
tcattatatt tcaacaaata taagataatc aagaataaat gggagacc 348
<210> 26
<211> 322
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..322
<223> /organism="Artificial Sequence"
/note="Fragment containing the ENO1-terminator"
/mol_type="unassigned DNA"
<400> 26
ggtctcgtaa aagcttttga ttaagccttc tagtccaaaa aacacgtttt tttgtcattt 60
atttcatttt cttagaatag tttagtttat tcattttata gtcacgaatg ttttatgatt 120
ctatataggg ttgcaaacaa gcatttttca ttttatgtta aaacaatttc aggtttacct 180
tttattctgc ttgtggtgac gcgtgtatcc gcccgctctt ttggtcaccc atgtatttaa 240
ttgcataaat aattcttaaa agtggagcta gtctatttct atttacatac ctctcatttc 300
tcatttcctc ccctcggaga cc 322
<210> 27
<211> 1674
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..1674
<223> /organism="Artificial Sequence"
/note="Sequence of the kanMX marker and flanking regions"
/mol_type="unassigned DNA"
<400> 27
ttgcccatcg aacgtacaag tactcctctg ttctctcctt cctttgcttt cttcgtacgc 60
tgcaggtcga cgaattctac cgttcgtata atgtatgcta tacgaagtta tagatctgtt 120
tagcttgcct cgtccccgcc gggtcacccg gccagcgaca tggaggccca gaataccctc 180
cttgacagtc ttgacgtgcg cagctcaggg gcatgatgtg actgtcgccc gtacatttag 240
cccatacatc cccatgtata atcatttgca tccatacatt ttgatggccg cacggcgcga 300
agcaaaaatt acggctcctc gctgcagacc tgcgagcagg gaaacgctcc cctcacagac 360
gcgttgaatt gtccccacgc cgcgcccctg tagagaaata taaaaggtta ggatttgcca 420
ctgaggttct tctttcatat acttcctttt aaaatcttgc taggatacag ttctcacatc 480
acatccgaac ataaacaacc atgggtaagg aaaagactca cgtttcgagg ccgcgattaa 540
attccaacat ggatgctgat ttatatgggt ataaatgggc tcgcgataat gtcgggcaat 600
caggtgcgac aatctatcga ttgtatggga agcccgatgc gccagagttg tttctgaaac 660
atggcaaagg tagcgttgcc aatgatgtta cagatgagat ggtcagacta aactggctga 720
cggaatttat gcctcttccg accatcaagc attttatccg tactcctgat gatgcatggt 780
tactcaccac tgcgatcccc ggcaaaacag cattccaggt attagaagaa tatcctgatt 840
caggtgaaaa tattgttgat gcgctggcag tgttcctgcg ccggttgcat tcgattcctg 900
tttgtaattg tccttttaac agcgatcgcg tatttcgtct cgctcaggcg caatcacgaa 960
tgaataacgg tttggttgat gcgagtgatt ttgatgacga gcgtaatggc tggcctgttg 1020
aacaagtctg gaaagaaatg cataagcttt tgccattctc accggattca gtcgtcactc 1080
atggtgattt ctcacttgat aaccttattt ttgacgaggg gaaattaata ggttgtattg 1140
atgttggacg agtcggaatc gcagaccgat accaggatct tgccatccta tggaactgcc 1200
tcggtgagtt ttctccttca ttacagaaac ggctttttca aaaatatggt attgataatc 1260
ctgatatgaa taaattgcag tttcatttga tgctcgatga gtttttctaa tcagtactga 1320
caataaaaag attcttgttt tcaagaactt gtcatttgta tagttttttt atattgtagt 1380
tgttctattt taatcaaatg ttagcgtgat ttatattttt tttcgcctcg acatcatctg 1440
cccagatgcg aagttaagtg cgcagaaagt aatatcatgc gtcaatcgta tgtgaatgct 1500
ggtcgctata ctgctgtcga ttcgatacta acgccgccat ccagtgtcga aaacgagctc 1560
ataacttcgt ataatgtatg ctatacgaac ggtagaattc gatatcagat ccactagtgg 1620
cctacggatc gatgtacaca accgactgca cccaaacgaa cacaaatctt agca 1674
<210> 28
<211> 2569
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..2569
<223> /organism="Artificial Sequence"
/note="Sequence of gene disruption cassette GPD1::hphMX"
/mol_type="unassigned DNA"
<400> 28
aagcttggta cccgccttgc ttctctcccc ttccttttct ttttccagtt ttccctattt 60
tgtccctttt tccgcacaac aagtatcaga atgggttcat caaatctatc caacctaatt 120
cgcacgtaga ctggcttggt attggcagtt tcgtagttat atatatacta ccatgagtga 180
aactgttacg ttaccttaaa ttctttctcc ctttaatttt cttttatctt actctcctac 240
ataagacatc aagaaacaat tgtatattgt acaccccccc cctccacaaa cacaaatatt 300
gataatataa agatgtctgc tgctgctgat agattaaact taacttccgg ccacttgaat 360
gctggtctag taacggccgc cagtgtgctg gaattcgccc ttaatccgga gctcgtacgt 420
tcgaacttaa ggcctcgtcc ccgccgggtc acccggccag cgacatggag gcccagaata 480
ccctccttga cagtcttgac gtgcgcagct caggggcatg atgtgactgt cgcccgtaca 540
tttagcccat acatccccat gtataatcat ttgcatccat acattttgat ggccgcacgg 600
cgcgaagcaa aaattacggc tcctcgctgc agacctgcga gcagggaaac gctcccctca 660
cagacgcgtg aattgtcccc acgccgcgcc cctgtagaga aatataaaag gttaggattt 720
gccactgagg ttcttctttc atatacttcc ttttaaaatc ttgctaggat acagttctca 780
catcacatcc gaacataaac aaccatgggt aaaaagcctg aactcaccgc gacgtctgtc 840
gagaagtttc tgatcgaaaa gttcgacagc gtctccgacc tgatgcagct ctcggagggc 900
gaagaatctc gtgctttcag cttcgatgta ggagggcgtg gatatgtcct gcgggtaaat 960
agctgcgccg atggtttcta caaagatcgt tatgtttatc ggcactttgc atcggccgcg 1020
ctcccgattc cggaagtgct tgacattggg gaattcagcg agagcctgac ctattgcatc 1080
tcccgccgtg cacagggtgt cacgttgcaa gacctgcctg aaaccgaact gcccgctgtt 1140
ctgcagccgg tcgcggaggc catggatgcg atcgctgcgg ccgatcttag ccagacgagc 1200
gggttcggcc cattcggacc gcaaggaatc ggtcaataca ctacatggcg tgatttcata 1260
tgcgcgattg ctgatcccca tgtgtatcac tggcaaactg tgatggacga caccgtcagt 1320
gcgtccgtcg cgcaggctct cgatgagctg atgctttggg ccgaggactg ccccgaagtc 1380
cggcacctcg tgcacgcgga tttcggctcc aacaatgtcc tgacggacaa tggccgcata 1440
acagcggtca ttgactggag cgaggcgatg ttcggggatt cccaatacga ggtcgccaac 1500
atcttcttct ggaggccgtg gttggcttgt atggagcagc agacgcgcta cttcgagcgg 1560
aggcatccgg agcttgcagg atcgccgcgg ctccgggcgt atatgctccg cattggtctt 1620
gaccaactct atcagagctt ggttgacggc aatttcgatg atgcagcttg ggcgcagggt 1680
cgatgcgacg caatcgtccg atccggagcc gggactgtcg ggcgtacaca aatcgcccgc 1740
agaagcgcgg ccgtctggac cgatggctgt gtagaagtac tcgccgatag tggaaaccga 1800
cgccccagca ctcgtccgag ggcaaaggaa taatcagtac tgacaataaa aagattcttg 1860
ttttcaagaa cttgtcattt gtatagtttt tttatattgt agttgttcta ttttaatcaa 1920
atgttagcgt gatttatatt ttttttcgcc tcgacatcat ctgcccagat gcgaagttaa 1980
gtgcgcagaa agtaatatca tgcgtcaatc gtatgtgaat gctggtcgct atactgctgt 2040
cgattcgata ctaacgccgc catccagtgt cgacggatcc taggtgtacg agttgttgaa 2100
tggccaatcc gctcaaggtt taattacctg caaagaagtt cacgaatggt tggaaacatg 2160
tggctctgtc gaagacttcc cattatttga agccgtatac caaatcgttt acaacaacta 2220
cccaatgaag aacctgccgg acatgattga agaattagat ctacatgaag attagattta 2280
ttggagaaag ataacatatc atactttccc ccactttttt cgaggctctt ctatatcata 2340
ttcataaatt agcattatgt catttctcat aactacttta tcacgttaga aattacttat 2400
tattattaaa ttaatacaaa atttagtaac caaataaata taaataaata tgtatattta 2460
aattttaaaa aaaaaatcct atagagcaaa aggattttcc attataatat tagctgtaca 2520
cctcttccgc attttttgag ggtggttaca acaccactcg gtaccatgg 2569
<210> 29
<211> 2069
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..2069
<223> /organism="Artificial Sequence"
/note="Sequence of gene disruption cassette GPD2:: natMX;"
/mol_type="unassigned DNA"
<400> 29
ggtaccagat cttttgcggc gaggtgccga tgggttgctg aggggaagag tgtttagctt 60
acggacctat tgccattgtt attccgatta atctattgtt cagcagctct tctctaccct 120
gtcattctag tatttttttt tttttttttt ggttttactt ttttttcttc ttgccttttt 180
ttcttgttac tttttttcta gttttttttc cttccactaa gctttttcct tgatttatcc 240
ttgggttctt ctttctactc ctttagattt tttttttata tattaatttt taagtttatg 300
tattttggta gattcaattc tctttccctt tccttttcct tcgctcccct tccttatcaa 360
tgcttgctgt cagaagatta acaagataca cattccttaa ggcctcgtcc ccgccgggtc 420
acccggccag cgacatggag gcccagaata ccctccttga cagtcttgac gtgcgcagct 480
caggggcatg atgtgactgt cgcccgtaca tttagcccat acatccccat gtataatcat 540
ttgcatccat acattttgat ggccgcacgg cgcgaagcaa aaattacggc tcctcgctgc 600
agacctgcga gcagggaaac gctcccctca cagacgcgtt gaattgtccc cacgccgcgc 660
ccctgtagag aaatataaaa ggttaggatt tgccactgag gttcttcttt catatacttc 720
cttttaaaat cttgctagga tacagttctc acatcacatc cgaacataaa caaccatgta 780
aaatgaccac tcttgacgac acggcttacc ggtaccgcac cagtgtcccg ggggacgccg 840
aggccatcga ggcactggat gggtccttca ccaccgacac cgtcttccgc gtcaccgcca 900
ccggggacgg cttcaccctg cgggaggtgc cggtggaccc gcccctgacc aaggtgttcc 960
ccgacgacga atcggacgac gaatcggacg ccggggagga cggcgacccg gactcccgga 1020
cgttcgtcgc gtacggggac gacggcgacc tggcgggctt cgtggtcgtc tcgtactccg 1080
gctggaaccg ccggctgacc gtcgaggaca tcgaggtcgc cccggagcac cgggggcacg 1140
gggtcgggcg cgcgttgatg gggctcgcga cggagttcgc ccgcgagcgg ggcgccgggc 1200
acctctggct ggaggtcacc aacgtcaacg caccggcgat ccacgcgtac cggcggatgg 1260
ggttcaccct ctgcggcctg gacaccgccc tgtacgacgg caccgcctcg gacggcgagc 1320
aggcgctcta catgagcatg ccctgcccct agtactgaca ataaaaagat tcttgttttc 1380
aagaacttgt catttgtata gtttttttat attgtagttg ttctatttta atcaaatgtt 1440
agcgtgattt atattttttt tcgcctcgac atcatctgcc cagatgcgaa gttaagtgcg 1500
cagaaagtaa tatcatgcgt caatcgtatg tgaatgctgg tcgctatact gctgtcgatt 1560
cgatactaac gccgccatcc agtgtcgacg gatcctaggt gtacagggcc caaaagggcg 1620
aattctgcag atatccatca cactggcggc cgctcgagat agtctacaac aacgtccgca 1680
tggaagacct accggagatg attgaagagc tagacatcga tgacgaatag acactctccc 1740
cccccctccc cctctgatct ttcctgttgc ctctttttcc cccaaccaat ttatcattat 1800
acacaagttc tacaactact actagtaaca ttactacagt tattataatt ttctattctc 1860
tttttcttta agaatctatc attaacgtta atttctatat atacataact accattatac 1920
acgctattat cgtttacata tcacatcacc gttaatgaaa gatacgacac cctgtacact 1980
aacacaatta aataatcgcc ataacctttt ctgttatcta tagcccttaa agctgtttct 2040
tcgagctttt tcactgcaga tctccatgg 2069
<210> 30
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..19
<223> /organism="Artificial Sequence"
/note="Forward primer 5’ INT1 fragment (INT5-f)"
/mol_type="unassigned DNA"
<400> 30
cggcattatt gtgtatggc 19
<210> 31
<211> 73
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..73
<223> /organism="Artificial Sequence"
/note="Reverse primer 5’ INT1 fragment (INT5-r)"
/mol_type="unassigned DNA"
<400> 31
aaacgcctgt gggtgtggta ctggatatgc aaagcgattg gaagtcgctt agggtttcaa 60
agatccatac ttc 73
<210> 32
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..22
<223> /organism="Artificial Sequence"
/note="Forward primer expression cassette 1 (con5-f)"
/mol_type="unassigned DNA"
<400> 32
aagcgacttc caatcgcttt gc 22
<210> 33
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..21
<223> /organism="Artificial Sequence"
/note="Reverse primer expression cassette 1 (conA-r)"
/mol_type="unassigned DNA"
<400> 33
aaagcaaagg aaggagagaa c 21
<210> 34
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..20
<223> /organism="Artificial Sequence"
/note="Forward primer marker (conA-f)"
/mol_type="unassigned DNA"
<400> 34
ttgcccatcg aacgtacaag 20
<210> 35
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..23
<223> /organism="Artificial Sequence"
/note="Reverse primer marker (conB-r)"
/mol_type="unassigned DNA"
<400> 35
tgctaagatt tgtgttcgtt tgg 23
<210> 36
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..20
<223> /organism="Artificial Sequence"
/note="Forward primer expression cassette 2 (conB-f)"
/mol_type="unassigned DNA"
<400> 36
cggatcgatg tacacaaccg 20
<210> 37
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..23
<223> /organism="Artificial Sequence"
/note="Reverse primer expression cassette 2 (conC-r)"
/mol_type="unassigned DNA"
<400> 37
caacaggagg cggatggata tac 23
<210> 38
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..21
<223> /organism="Artificial Sequence"
/note="Forward primer expression cassette 3 (conC-f)"
/mol_type="unassigned DNA"
<400> 38
acgctttccg gcatcttcca g 21
<210> 39
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..20
<223> /organism="Artificial Sequence"
/note="Reverse primer expression cassette 3 (conD-r)"
/mol_type="unassigned DNA"
<400> 39
gcggaatatt ggcggaacgg 20
<210> 40
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..22
<223> /organism="Artificial Sequence"
/note="Forward primer expression cassette 4 (conD-f)"
/mol_type="unassigned DNA"
<400> 40
aacgttgtcc aggtttgtat cc 22
<210> 41
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..24
<223> /organism="Artificial Sequence"
/note="Reverse primer expression cassette 4 (con3-r)"
/mol_type="unassigned DNA"
<400> 41
acttagtatg gtctgttgga aagg 24
<210> 42
<211> 90
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..90
<223> /organism="Artificial Sequence"
/note="Forward primer 3’ INT1 fragment (INT3-f)"
/mol_type="unassigned DNA"
<400> 42
agaaagcctg tatgcgaagc cacaatcctt tccaacagac catactaagt attttatttt 60
acttttttta gaatgacctg ttcccgacac 90
<210> 43
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..24
<223> /organism="Artificial Sequence"
/note="Reverse primer 3’ INT1 fragment (INT3-r)"
/mol_type="unassigned DNA"
<400> 43
cacaagctta ttcttccaaa aatc 24
<210> 44
<211> 3506
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..3506
<223> /organism="Artificial Sequence"
/note="Sequence of plasmid p5Abbn"
/mol_type="unassigned DNA"
<400> 44
tagaaaaact catcgagcat caaatgaaac tgcaatttat tcatatcagg attatcaata 60
ccatattttt gaaaaagccg tttctgtaat gaaggagaaa actcaccgag gcagttccat 120
aggatggcaa gatcctggta tcggtctgcg attccgactc gtccaacatc aatacaacct 180
attaatttcc cctcgtcaaa aataaggtta tcaagtgaga aatcaccatg agtgacgact 240
gaatccggtg agaatggcaa aagtttatgc atttctttcc agacttgttc aacaggccag 300
ccattacgct cgtcatcaaa atcactcgca tcaaccaaac cgttattcat tcgtgattgc 360
gcctgagcga ggcgaaatac gcgatcgctg ttaaaaggac aattacaaac aggaatcgag 420
tgcaaccggc gcaggaacac tgccagcgca tcaacaatat tttcacctga atcaggatat 480
tcttctaata cctggaacgc tgtttttccg gggatcgcag tggtgagtaa ccatgcatca 540
tcaggagtac ggataaaatg cttgatggtc ggaagtggca taaattccgt cagccagttt 600
agtctgacca tctcatctgt aacatcattg gcaacgctac ctttgccatg tttcagaaac 660
aactctggcg catcgggctt cccatacaag cgatagattg tcgcacctga ttgcccgaca 720
ttatcgcgag cccatttata cccatataaa tcagcatcca tgttggaatt taatcgcggc 780
ctcgacgttt cccgttgaat atggctcata ttcttccttt ttcaatatta ttgaagcatt 840
tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa 900
ataggggtca gtgttacaac caattaacca attctgaaca ttatcgcgag cccatttata 960
cctgaatatg gctcataaca ccccttgttt gcctggcggc agtagcgcgg tggtcccacc 1020
tgaccccatg ccgaactcag aagtgaaacg ccgtagcgcc gatggtagtg tggggactcc 1080
ccatgcgaga gtagggaact gccaggcatc aaataaaacg aaaggctcag tcgaaagact 1140
gggcctttcg cccgggctaa ttagggggtg tcgcccttat tcgactctat agtgaagttc 1200
ctattctcta gaaagtatag gaacttctga agtggggaag cgacttccaa tcgctttgca 1260
tatccagtac cacacccaca ggcgtttgtg cggagaccgg cttactaaaa gccagataac 1320
agtatgcata tttgcgcgct gatttttgcg gtataagaat atatactgat atgtataccc 1380
gaagtatgtc aaaaagaggt atgctatgaa gcagcgtatt acagtgacag ttgacagcga 1440
cagctatcag ttgctcaagg catatatgat gtcaatatct ccggtctggt aagcacaacc 1500
atgcagaatg aagcccgtcg tctgcgtgcc gaacgctgga aagcggaaaa tcaggaaggg 1560
atggctgagg tcgcccggtt tattgaaatg aacggctctt ttgctgacga gaacaggggc 1620
tggtgaaatg cagtttaagg tttacaccta taaaagagag agccgttatc gtctgtttgt 1680
ggatgtacag agtgatatta ttgacacgcc cgggcgacgg atggtgatcc ccctggccag 1740
tgcacgtctg ctgtcagata aagtctcccg tgaactttac ccggtggtgc atatcgggga 1800
tgaaagctgg cgcatgatga ccaccgatat ggccagtgtg ccggtttccg ttatcgggga 1860
agaagtggct gatctcagcc accgcgaaaa tgacatcaaa aacgccatta acctgatgtt 1920
ctggggaata taaggtctcg cctcttgccc atcgaacgta caagtactcc tctgttctct 1980
ccttcctttg ctttaaaatg aagtgaagtt cctatacttt ctagagaata ggaacttcta 2040
tagtgagtcg aataagggcg acacaaaatt tattctaaat gcataataaa tactgataac 2100
atcttatagt ttgtattata ttttgtatta tcgttgacat gtataatttt gatatcaaaa 2160
actgattttc cctttattat tttcgagatt tattttctta attctcttta acaaactaga 2220
aatattgtat atacaaaaaa tcataaataa tagatgaata gtttaattat aggtgttcat 2280
caatcgaaaa agcaacgtat cttatttaaa gtgcgttgct tttttctcat ttataaggtt 2340
aaataattct catatatcaa gcaaagtgac aggcgccctt aaatattctg acaaatgctc 2400
tttccctaaa ctccccccat aaaaaaaccc gccgaagcgg gtttttacgt tatttgcgga 2460
ttaacgatta ctcgttatca gaaccgccca gggggcccga gcttaagact ggccgtcgtt 2520
ttacaacaca gaaagagttt gtagaaacgc aaaaaggcca tccgtcaggg gccttctgct 2580
tagtttgatg cctggcagtt ccctactctc gccttccgct tcctcgctca ctgactcgct 2640
gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt 2700
atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc 2760
caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga 2820
gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata 2880
ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac 2940
cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg 3000
taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc 3060
cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag 3120
acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt 3180
aggcggtgct acagagttct tgaagtggtg ggctaactac ggctacacta gaagaacagt 3240
atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg 3300
atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac 3360
gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca 3420
gtggaacgac gcgcgcgtaa ctcacgttaa gggattttgg tcatgagctt gcgccgtccc 3480
gtcaagtcag cgtaatgctc tgcttt 3506
<210> 45
<211> 3506
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..3506
<223> /organism="Artificial Sequence"
/note="Sequence of plasmid pBCbbn"
/mol_type="unassigned DNA"
<400> 45
tagaaaaact catcgagcat caaatgaaac tgcaatttat tcatatcagg attatcaata 60
ccatattttt gaaaaagccg tttctgtaat gaaggagaaa actcaccgag gcagttccat 120
aggatggcaa gatcctggta tcggtctgcg attccgactc gtccaacatc aatacaacct 180
attaatttcc cctcgtcaaa aataaggtta tcaagtgaga aatcaccatg agtgacgact 240
gaatccggtg agaatggcaa aagtttatgc atttctttcc agacttgttc aacaggccag 300
ccattacgct cgtcatcaaa atcactcgca tcaaccaaac cgttattcat tcgtgattgc 360
gcctgagcga ggcgaaatac gcgatcgctg ttaaaaggac aattacaaac aggaatcgag 420
tgcaaccggc gcaggaacac tgccagcgca tcaacaatat tttcacctga atcaggatat 480
tcttctaata cctggaacgc tgtttttccg gggatcgcag tggtgagtaa ccatgcatca 540
tcaggagtac ggataaaatg cttgatggtc ggaagtggca taaattccgt cagccagttt 600
agtctgacca tctcatctgt aacatcattg gcaacgctac ctttgccatg tttcagaaac 660
aactctggcg catcgggctt cccatacaag cgatagattg tcgcacctga ttgcccgaca 720
ttatcgcgag cccatttata cccatataaa tcagcatcca tgttggaatt taatcgcggc 780
ctcgacgttt cccgttgaat atggctcata ttcttccttt ttcaatatta ttgaagcatt 840
tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa 900
ataggggtca gtgttacaac caattaacca attctgaaca ttatcgcgag cccatttata 960
cctgaatatg gctcataaca ccccttgttt gcctggcggc agtagcgcgg tggtcccacc 1020
tgaccccatg ccgaactcag aagtgaaacg ccgtagcgcc gatggtagtg tggggactcc 1080
ccatgcgaga gtagggaact gccaggcatc aaataaaacg aaaggctcag tcgaaagact 1140
gggcctttcg cccgggctaa ttagggggtg tcgcccttat tcgactctat agtgaagttc 1200
ctattctcta gaaagtatag gaacttctga agtggggcgg atcgatgtac acaaccgact 1260
gcacccaaac gaacacaaat cttagcagtg cggagaccgg cttactaaaa gccagataac 1320
agtatgcata tttgcgcgct gatttttgcg gtataagaat atatactgat atgtataccc 1380
gaagtatgtc aaaaagaggt atgctatgaa gcagcgtatt acagtgacag ttgacagcga 1440
cagctatcag ttgctcaagg catatatgat gtcaatatct ccggtctggt aagcacaacc 1500
atgcagaatg aagcccgtcg tctgcgtgcc gaacgctgga aagcggaaaa tcaggaaggg 1560
atggctgagg tcgcccggtt tattgaaatg aacggctctt ttgctgacga gaacaggggc 1620
tggtgaaatg cagtttaagg tttacaccta taaaagagag agccgttatc gtctgtttgt 1680
ggatgtacag agtgatatta ttgacacgcc cgggcgacgg atggtgatcc ccctggccag 1740
tgcacgtctg ctgtcagata aagtctcccg tgaactttac ccggtggtgc atatcgggga 1800
tgaaagctgg cgcatgatga ccaccgatat ggccagtgtg ccggtttccg ttatcgggga 1860
agaagtggct gatctcagcc accgcgaaaa tgacatcaaa aacgccatta acctgatgtt 1920
ctggggaata taaggtctcg cctcacgctt tccggcatct tccagaccac agtatatcca 1980
tccgcctcct gttgaaaatg aagtgaagtt cctatacttt ctagagaata ggaacttcta 2040
tagtgagtcg aataagggcg acacaaaatt tattctaaat gcataataaa tactgataac 2100
atcttatagt ttgtattata ttttgtatta tcgttgacat gtataatttt gatatcaaaa 2160
actgattttc cctttattat tttcgagatt tattttctta attctcttta acaaactaga 2220
aatattgtat atacaaaaaa tcataaataa tagatgaata gtttaattat aggtgttcat 2280
caatcgaaaa agcaacgtat cttatttaaa gtgcgttgct tttttctcat ttataaggtt 2340
aaataattct catatatcaa gcaaagtgac aggcgccctt aaatattctg acaaatgctc 2400
tttccctaaa ctccccccat aaaaaaaccc gccgaagcgg gtttttacgt tatttgcgga 2460
ttaacgatta ctcgttatca gaaccgccca gggggcccga gcttaagact ggccgtcgtt 2520
ttacaacaca gaaagagttt gtagaaacgc aaaaaggcca tccgtcaggg gccttctgct 2580
tagtttgatg cctggcagtt ccctactctc gccttccgct tcctcgctca ctgactcgct 2640
gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt 2700
atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc 2760
caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga 2820
gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata 2880
ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac 2940
cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg 3000
taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc 3060
cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag 3120
acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt 3180
aggcggtgct acagagttct tgaagtggtg ggctaactac ggctacacta gaagaacagt 3240
atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg 3300
atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac 3360
gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca 3420
gtggaacgac gcgcgcgtaa ctcacgttaa gggattttgg tcatgagctt gcgccgtccc 3480
gtcaagtcag cgtaatgctc tgcttt 3506
<210> 46
<211> 3506
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..3506
<223> /organism="Artificial Sequence"
/note="Sequence of plasmid pCDbbn"
/mol_type="unassigned DNA"
<400> 46
tagaaaaact catcgagcat caaatgaaac tgcaatttat tcatatcagg attatcaata 60
ccatattttt gaaaaagccg tttctgtaat gaaggagaaa actcaccgag gcagttccat 120
aggatggcaa gatcctggta tcggtctgcg attccgactc gtccaacatc aatacaacct 180
attaatttcc cctcgtcaaa aataaggtta tcaagtgaga aatcaccatg agtgacgact 240
gaatccggtg agaatggcaa aagtttatgc atttctttcc agacttgttc aacaggccag 300
ccattacgct cgtcatcaaa atcactcgca tcaaccaaac cgttattcat tcgtgattgc 360
gcctgagcga ggcgaaatac gcgatcgctg ttaaaaggac aattacaaac aggaatcgag 420
tgcaaccggc gcaggaacac tgccagcgca tcaacaatat tttcacctga atcaggatat 480
tcttctaata cctggaacgc tgtttttccg gggatcgcag tggtgagtaa ccatgcatca 540
tcaggagtac ggataaaatg cttgatggtc ggaagtggca taaattccgt cagccagttt 600
agtctgacca tctcatctgt aacatcattg gcaacgctac ctttgccatg tttcagaaac 660
aactctggcg catcgggctt cccatacaag cgatagattg tcgcacctga ttgcccgaca 720
ttatcgcgag cccatttata cccatataaa tcagcatcca tgttggaatt taatcgcggc 780
ctcgacgttt cccgttgaat atggctcata ttcttccttt ttcaatatta ttgaagcatt 840
tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa 900
ataggggtca gtgttacaac caattaacca attctgaaca ttatcgcgag cccatttata 960
cctgaatatg gctcataaca ccccttgttt gcctggcggc agtagcgcgg tggtcccacc 1020
tgaccccatg ccgaactcag aagtgaaacg ccgtagcgcc gatggtagtg tggggactcc 1080
ccatgcgaga gtagggaact gccaggcatc aaataaaacg aaaggctcag tcgaaagact 1140
gggcctttcg cccgggctaa ttagggggtg tcgcccttat tcgactctat agtgaagttc 1200
ctattctcta gaaagtatag gaacttctga agtggggacg ctttccggca tcttccagac 1260
cacagtatat ccatccgcct cctgttggtg cggagaccgg cttactaaaa gccagataac 1320
agtatgcata tttgcgcgct gatttttgcg gtataagaat atatactgat atgtataccc 1380
gaagtatgtc aaaaagaggt atgctatgaa gcagcgtatt acagtgacag ttgacagcga 1440
cagctatcag ttgctcaagg catatatgat gtcaatatct ccggtctggt aagcacaacc 1500
atgcagaatg aagcccgtcg tctgcgtgcc gaacgctgga aagcggaaaa tcaggaaggg 1560
atggctgagg tcgcccggtt tattgaaatg aacggctctt ttgctgacga gaacaggggc 1620
tggtgaaatg cagtttaagg tttacaccta taaaagagag agccgttatc gtctgtttgt 1680
ggatgtacag agtgatatta ttgacacgcc cgggcgacgg atggtgatcc ccctggccag 1740
tgcacgtctg ctgtcagata aagtctcccg tgaactttac ccggtggtgc atatcgggga 1800
tgaaagctgg cgcatgatga ccaccgatat ggccagtgtg ccggtttccg ttatcgggga 1860
agaagtggct gatctcagcc accgcgaaaa tgacatcaaa aacgccatta acctgatgtt 1920
ctggggaata taaggtctcg cctcaacgtt gtccaggttt gtatccacgt gtgtccgttc 1980
cgccaatatt ccgcaaaatg aagtgaagtt cctatacttt ctagagaata ggaacttcta 2040
tagtgagtcg aataagggcg acacaaaatt tattctaaat gcataataaa tactgataac 2100
atcttatagt ttgtattata ttttgtatta tcgttgacat gtataatttt gatatcaaaa 2160
actgattttc cctttattat tttcgagatt tattttctta attctcttta acaaactaga 2220
aatattgtat atacaaaaaa tcataaataa tagatgaata gtttaattat aggtgttcat 2280
caatcgaaaa agcaacgtat cttatttaaa gtgcgttgct tttttctcat ttataaggtt 2340
aaataattct catatatcaa gcaaagtgac aggcgccctt aaatattctg acaaatgctc 2400
tttccctaaa ctccccccat aaaaaaaccc gccgaagcgg gtttttacgt tatttgcgga 2460
ttaacgatta ctcgttatca gaaccgccca gggggcccga gcttaagact ggccgtcgtt 2520
ttacaacaca gaaagagttt gtagaaacgc aaaaaggcca tccgtcaggg gccttctgct 2580
tagtttgatg cctggcagtt ccctactctc gccttccgct tcctcgctca ctgactcgct 2640
gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt 2700
atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc 2760
caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga 2820
gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata 2880
ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac 2940
cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg 3000
taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc 3060
cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag 3120
acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt 3180
aggcggtgct acagagttct tgaagtggtg ggctaactac ggctacacta gaagaacagt 3240
atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg 3300
atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac 3360
gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca 3420
gtggaacgac gcgcgcgtaa ctcacgttaa gggattttgg tcatgagctt gcgccgtccc 3480
gtcaagtcag cgtaatgctc tgcttt 3506
<210> 47
<211> 3506
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..3506
<223> /organism="Artificial Sequence"
/note="Sequence of plasmid pD3bbn"
/mol_type="unassigned DNA"
<400> 47
tagaaaaact catcgagcat caaatgaaac tgcaatttat tcatatcagg attatcaata 60
ccatattttt gaaaaagccg tttctgtaat gaaggagaaa actcaccgag gcagttccat 120
aggatggcaa gatcctggta tcggtctgcg attccgactc gtccaacatc aatacaacct 180
attaatttcc cctcgtcaaa aataaggtta tcaagtgaga aatcaccatg agtgacgact 240
gaatccggtg agaatggcaa aagtttatgc atttctttcc agacttgttc aacaggccag 300
ccattacgct cgtcatcaaa atcactcgca tcaaccaaac cgttattcat tcgtgattgc 360
gcctgagcga ggcgaaatac gcgatcgctg ttaaaaggac aattacaaac aggaatcgag 420
tgcaaccggc gcaggaacac tgccagcgca tcaacaatat tttcacctga atcaggatat 480
tcttctaata cctggaacgc tgtttttccg gggatcgcag tggtgagtaa ccatgcatca 540
tcaggagtac ggataaaatg cttgatggtc ggaagtggca taaattccgt cagccagttt 600
agtctgacca tctcatctgt aacatcattg gcaacgctac ctttgccatg tttcagaaac 660
aactctggcg catcgggctt cccatacaag cgatagattg tcgcacctga ttgcccgaca 720
ttatcgcgag cccatttata cccatataaa tcagcatcca tgttggaatt taatcgcggc 780
ctcgacgttt cccgttgaat atggctcata ttcttccttt ttcaatatta ttgaagcatt 840
tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa 900
ataggggtca gtgttacaac caattaacca attctgaaca ttatcgcgag cccatttata 960
cctgaatatg gctcataaca ccccttgttt gcctggcggc agtagcgcgg tggtcccacc 1020
tgaccccatg ccgaactcag aagtgaaacg ccgtagcgcc gatggtagtg tggggactcc 1080
ccatgcgaga gtagggaact gccaggcatc aaataaaacg aaaggctcag tcgaaagact 1140
gggcctttcg cccgggctaa ttagggggtg tcgcccttat tcgactctat agtgaagttc 1200
ctattctcta gaaagtatag gaacttctga agtggggacg ctttccggca tcttccagac 1260
cacagtatat ccatccgcct cctgttggtg cggagaccgg cttactaaaa gccagataac 1320
agtatgcata tttgcgcgct gatttttgcg gtataagaat atatactgat atgtataccc 1380
gaagtatgtc aaaaagaggt atgctatgaa gcagcgtatt acagtgacag ttgacagcga 1440
cagctatcag ttgctcaagg catatatgat gtcaatatct ccggtctggt aagcacaacc 1500
atgcagaatg aagcccgtcg tctgcgtgcc gaacgctgga aagcggaaaa tcaggaaggg 1560
atggctgagg tcgcccggtt tattgaaatg aacggctctt ttgctgacga gaacaggggc 1620
tggtgaaatg cagtttaagg tttacaccta taaaagagag agccgttatc gtctgtttgt 1680
ggatgtacag agtgatatta ttgacacgcc cgggcgacgg atggtgatcc ccctggccag 1740
tgcacgtctg ctgtcagata aagtctcccg tgaactttac ccggtggtgc atatcgggga 1800
tgaaagctgg cgcatgatga ccaccgatat ggccagtgtg ccggtttccg ttatcgggga 1860
agaagtggct gatctcagcc accgcgaaaa tgacatcaaa aacgccatta acctgatgtt 1920
ctggggaata taaggtctcg cctcaacgtt gtccaggttt gtatccacgt gtgtccgttc 1980
cgccaatatt ccgcaaaatg aagtgaagtt cctatacttt ctagagaata ggaacttcta 2040
tagtgagtcg aataagggcg acacaaaatt tattctaaat gcataataaa tactgataac 2100
atcttatagt ttgtattata ttttgtatta tcgttgacat gtataatttt gatatcaaaa 2160
actgattttc cctttattat tttcgagatt tattttctta attctcttta acaaactaga 2220
aatattgtat atacaaaaaa tcataaataa tagatgaata gtttaattat aggtgttcat 2280
caatcgaaaa agcaacgtat cttatttaaa gtgcgttgct tttttctcat ttataaggtt 2340
aaataattct catatatcaa gcaaagtgac aggcgccctt aaatattctg acaaatgctc 2400
tttccctaaa ctccccccat aaaaaaaccc gccgaagcgg gtttttacgt tatttgcgga 2460
ttaacgatta ctcgttatca gaaccgccca gggggcccga gcttaagact ggccgtcgtt 2520
ttacaacaca gaaagagttt gtagaaacgc aaaaaggcca tccgtcaggg gccttctgct 2580
tagtttgatg cctggcagtt ccctactctc gccttccgct tcctcgctca ctgactcgct 2640
gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt 2700
atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc 2760
caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga 2820
gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata 2880
ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac 2940
cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg 3000
taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc 3060
cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag 3120
acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt 3180
aggcggtgct acagagttct tgaagtggtg ggctaactac ggctacacta gaagaacagt 3240
atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg 3300
atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac 3360
gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca 3420
gtggaacgac gcgcgcgtaa ctcacgttaa gggattttgg tcatgagctt gcgccgtccc 3480
gtcaagtcag cgtaatgctc tgcttt 3506
<210> 48
<211> 2692
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..2692
<223> /organism="Artificial Sequence"
/note="Sequence containing the adhE (E.coli) DNA sequence
codon-pair optimized for expression in S. cerevisiae"
/mol_type="unassigned DNA"
<400> 48
ggtctcgaat ggccgttact aacgtcgctg aattgaacgc tttggttgaa agagtcaaga 60
aggctcaaag agaatacgct tctttcaccc aagaacaagt cgacaagatc ttcagagccg 120
ccgccttggc tgctgctgac gctagaattc cattagctaa gatggctgtt gctgaatctg 180
gtatgggtat tgtcgaagat aaggttatta agaaccattt cgcttctgaa tacatctaca 240
acgcctacaa ggacgaaaag acttgtggtg tcttgtctga agatgacact ttcggtacta 300
tcactatcgc tgaaccaatc ggtatcatct gtggtatcgt tccaaccact aacccaactt 360
ctaccgccat cttcaaatcc ttgatctctt taaagaccag aaacgctatt atcttctctc 420
ctcacccacg tgccaaggat gctaccaaca aggctgctga tattgtcttg caagctgcta 480
ttgctgctgg tgctccaaag gacttgatcg gttggatcga ccaaccatct gtcgaattat 540
ccaatgcttt gatgcaccac ccagatatca acttgatctt ggctaccggt ggtccaggta 600
tggttaaggc tgcttactct tccggtaagc cagctattgg tgtcggtgct ggtaacactc 660
ctgttgttat cgatgaaact gctgacatca aaagagctgt tgcctccgtc ttgatgtcca 720
agactttcga caacggtgtc atctgtgctt ctgaacaatc tgttgttgtt gtcgattccg 780
tctacgacgc tgttagagaa cgttttgcta cccacggtgg ttacttgttg caaggtaagg 840
aattgaaggc tgtccaagat gtcatcttga agaacggtgc tttgaatgct gccattgtcg 900
gtcaaccagc ttacaagatt gccgaattgg ctggtttctc cgttccagaa aacaccaaga 960
ttttgattgg tgaagtcacc gttgttgacg aatccgaacc atttgctcac gaaaagttgt 1020
ctccaacctt ggctatgtac agagccaagg acttcgaaga tgccgtcgaa aaagctgaaa 1080
agttggttgc tatgggtggc attggtcaca cctcttgttt gtacactgac caagacaacc 1140
aacctgccag agtctcttac ttcggtcaaa agatgaaaac tgctagaatc ttaatcaaca 1200
ctccagcttc ccaaggtggt attggtgatt tgtacaactt caagttggcc ccatctttga 1260
ctttaggttg tggttcttgg ggtggtaact ccatctctga aaacgttggt ccaaagcact 1320
tgatcaacaa gaaaactgtt gctaagagag ctgaaaacat gttgtggcac aagttaccaa 1380
aatccatcta cttcagaaga ggttctttgc caattgcctt ggacgaagtc attaccgacg 1440
gtcacaagag agccttgatt gttaccgata gattcttgtt caacaacggt tacgctgacc 1500
aaatcacttc tgttttgaag gccgccggtg ttgaaactga agttttcttc gaagtcgaag 1560
ctgatccaac tttgtctatc gttagaaagg gtgctgaatt ggctaactct ttcaagcctg 1620
atgttatcat tgctttgggt ggtggttctc caatggacgc tgccaagatc atgtgggtta 1680
tgtacgaaca tccagaaacc catttcgaag aattggcttt aagattcatg gatatcagaa 1740
agagaatcta caagttccca aagatgggtg ttaaggccaa aatgattgct gtcaccacca 1800
cctccggtac tggttctgaa gttaccccat ttgctgtcgt caccgatgac gctactggtc 1860
aaaagtaccc attggctgat tacgctttga ccccagacat ggctatcgtt gatgctaact 1920
tggttatgga catgccaaag tctttgtgtg ccttcggtgg tctagacgct gtcacccacg 1980
ctatggaagc ttacgtttcc gtcttggctt ccgaattttc tgacggtcaa gctttacaag 2040
ctttgaaatt gttgaaagaa tacttgccag cctcctacca cgaaggttct aagaacccag 2100
ttgctagaga aagagttcac tctgctgcca ccattgctgg tattgccttt gctaacgctt 2160
tcttgggtgt ctgtcactcc atggctcaca agttgggttc tcaattccac atcccacacg 2220
gtttggccaa cgctttgttg atctgtaacg tcattagata caacgctaac gacaacccaa 2280
ccaagcaaac tgccttctcc caatacgata gaccacaagc tagacgtcgt tatgctgaaa 2340
tcgctgacca cttgggttta tctgctccag gtgatcgtac tgccgccaag attgaaaagt 2400
tattggcttg gttagaaact ttaaaggctg aactaggtat tccaaagtct atcagagaag 2460
ctggtgtcca agaagctgac ttcttagcca acgttgacaa attgtccgaa gatgctttcg 2520
acgaccaatg taccggtgct aacccaagat acccattgat ctccgaattg aagcaaattt 2580
tgttggacac ctactacggt agagactacg ttgaaggtga aactgccgct aagaaggaag 2640
ctgctccagc taaggctgaa aagaaggcta agaaatcggc ataaaggaga cc 2692
<210> 49
<211> 1384
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..1384
<223> /organism="Artificial Sequence"
/note="Sequence containing the acdH (L. plantarum) DNA sequence
codon-pair optimized for expression in S. cerevisiae"
/mol_type="unassigned DNA"
<400> 49
ggtctcgaat gttgaaggaa atggaagaaa ctactgtttc tcgttccatt gacagattgg 60
ttttgaatgc ctccttggct gccaacagat tggaagtcat ggaccaatct caagttgacc 120
aagctgttgc cgctatggcc agagccgctc acgctgctcg tggtatgttg gctgctatgg 180
ctgtcgaaga aaccggtaga ggtaactaca gagacaaggt tgccaaaaac gattttgctg 240
ccaagaacgt ctacaactac atcaaggatg acaagactgt cggtatcatc aacgatgacc 300
ctgtttctgg tgtcatgaag gtcgctgaac ctgttggtat cattgccggt gttaccccag 360
tcaccaaccc aacttccact gtcatcttca acgctatgtt agctttgaaa accagaaacc 420
caattatctt tggtttccac ccattcgctc aaaagtcttg tgttgaaact ggtagaatca 480
tcagagatgc tgctattgct tctggtgctc caaaggactg gatccaatgg atcaagaccc 540
catctttgga agctaccaac actttgatga accatccagg tgttgccact atcattgcta 600
ccggtggtgc cggtatggtc aagaccgctt actccactgg taagccagct ttaggtgtcg 660
gtccaggtaa cgtcccatgt ttcattgaac aaaccgctga tatccaacaa gctgtttccg 720
atgtcgttac ctccaagtct ttcgataacg gtatgatctg tgcttctgaa tccaacttga 780
ttgttgctga ccaaatctac gaccaagtca agagagaatt gtctcacaac ggtgtctact 840
tcgttggtac tgaaaacttc aaggctctag aagctactgt tatgaacttg gacaagcaag 900
ctgtcgatcc aaaggttgcc ggtcaaaccc catggcaaat tgcccaatgg gctggtttcg 960
atgtcccatc tgacaccaag gttttagctg ttgaattgcc atccattggt ggtgaccaag 1020
tcttgtccag agaaaagttg tctccagttt tggctgtcgt tcacgctaag gacactgaag 1080
ctggtttcaa cttgatgaag agatctttgg ctttgggtgg tttaggtcac accgccgctt 1140
tgcacaccac tgacgaagct gtcatgaaca aattcgcttt ggaaatgacc gcttgtagag 1200
ctttgatcaa cgttccatct tctcaaggtg ccattggtta caaatacgac aatgttgctc 1260
catctttgac tttgggttgt ggtacttggg gtcacaactc catctctcac aacttggaag 1320
attgggactt gttgaacatc aagactgttg ctaagagatt aaccaaaata agataaagga 1380
gacc 1384
<210> 50
<211> 1420
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..1420
<223> /organism="Artificial Sequence"
/note="Sequence containing the eutE (E. coli) DNA sequence
codon-pair optimized for expression in S. cerevisiae"
/mol_type="unassigned DNA"
<400> 50
ggtctcgaat gaaccaacaa gatattgaac aagttgtcaa ggctgttcta ttgaagatgc 60
aatcttctga cactccatct gctgccgtcc acgaaatggg tgttttcgct tctttggacg 120
atgctgttgc tgctgctaag gttgctcaac aaggtttgaa atccgttgcc atgagacaat 180
tggccattgc tgccattaga gaagctggtg aaaagcatgc ccgtgacttg gctgaattgg 240
ctgtctctga aaccggtatg ggtagagttg aagataaatt cgctaagaac gttgctcaag 300
ctcgtggtac tccaggtgtc gaatgtttgt ctcctcaagt cttgaccggt gacaacggtt 360
tgactttgat tgaaaacgct ccatggggtg ttgttgcttc cgttactcca tctactaatc 420
cagctgccac cgtcatcaac aatgctatct ctttgatcgc tgccggtaac tccgttatct 480
ttgctccaca cccagctgct aagaaagtct ctcaaagagc catcactttg ttgaaccaag 540
ccatcgttgc cgctggtggt ccagaaaact tgttggtcac tgttgctaac ccagatatcg 600
aaaccgctca aagattattc aagttcccag gtatcggtct attagtcgtt accggtggtg 660
aggctgttgt cgaagctgct agaaagcaca ctaacaagag attgattgct gctggtgctg 720
gtaacccacc tgttgttgtc gatgaaaccg ctgatttggc cagagctgct caatccattg 780
tcaagggtgc ttctttcgac aacaacatca tctgtgctga tgaaaaggtt ttgatcgttg 840
ttgactccgt tgctgacgaa ttgatgagat tgatggaagg tcaacatgcc gtcaagttga 900
ccgctgaaca agctcaacaa ttgcaaccag tcttgttgaa gaacattgac gaaagaggta 960
agggtactgt ttccagagac tgggttggta gagatgctgg taagatcgct gctgccatcg 1020
gtttgaaggt tccacaagaa accagattat tgttcgtcga aaccactgct gaacacccat 1080
tcgctgtcac tgaattaatg atgccagtct tgccagttgt ccgtgttgcc aacgttgccg 1140
acgctattgc tttggctgtc aaattggaag gtggttgtca ccacactgct gctatgcact 1200
ccagaaacat tgaaaacatg aaccaaatgg ctaacgccat tgacacttcc atcttcgtca 1260
agaacggtcc atgtatcgct ggtttgggtt taggtggtga aggttggacc accatgacca 1320
tcactacccc aaccggtgaa ggtgtcactt ctgccagaac ctttgtcaga ttaagaagat 1380
gtgtcttggt cgacgctttc agaattgtgt aaaggagacc 1420
<210> 51
<211> 1426
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..1426
<223> /organism="Artificial Sequence"
/note="Sequence containing the Lin1129 (L.innocua) DNA sequence
codon-pair optimized for expression in S. cerevisiae"
/mol_type="unassigned DNA"
<400> 51
ggtctcgaat ggaatctttg gaattggaac aattggtcaa gaaggtctta ttggaaaaat 60
tggctgaaca aaaggaagtt ccaaccaaga ccaccaccca aggtgctaaa tccggtgtct 120
ttgacactgt cgatgaagct gtccaagctg ctgtcatcgc tcaaaactgt tacaaggaaa 180
aatccttgga agaaagaaga aacgttgtca aggccatcag agaagctttg tacccagaaa 240
tcgaaactat cgctaccaga gctgttgctg aaactggtat gggtaatgtc actgacaaga 300
ttttgaagaa cactttggcc attgaaaaga ccccaggtgt tgaagatttg tacactgaag 360
ttgccactgg tgacaacggt atgactttat acgaattgtc tccatacggt gtcatcggtg 420
ccgttgcccc atctaccaac ccaaccgaaa ctttgatttg taactctatc ggtatgttgg 480
ctgctggtaa tgctgttttc tactctccac acccaggtgc taagaacatc tctttatggt 540
tgattgaaaa gttgaacacc attgtcagag actcttgtgg tattgacaac ttgattgtca 600
ctgttgccaa gccatccatc caagccgctc aagaaatgat gaaccaccca aaggttccat 660
tattggtcat caccggtggt cctggtgttg ttttgcaagc tatgcaatct ggtaagaagg 720
ttatcggtgc tggtgccggt aacccaccat ccattgtcga cgaaactgcc aacatcgaaa 780
aggctgctgc tgatatcgtt gacggtgctt ctttcgacca caacatccta tgtattgctg 840
aaaaatccgt tgttgccgtc gattccattg ctgatttctt gttgttccaa atggaaaaga 900
acggtgcttt gcacgtcacc aacccatctg acatccaaaa attggaaaag gttgccgtta 960
ctgacaaggg tgtcaccaac aagaaattgg ttggtaagtc tgctactgaa attttgaagg 1020
aagctggtat tgcttgtgat ttcaccccaa gattaatcat cgtcgaaact gaaaagtccc 1080
accctttcgc taccgttgaa ttgttgatgc caatcgttcc agttgtcaga gttccagatt 1140
tcgacgaagc tttggaagtt gctatcgaat tagaacaagg tttgcaccac accgctacca 1200
tgcactctca aaacatctcc agattgaaca aggctgctag agacatgcaa acctccatct 1260
tcgttaagaa cggtccatct ttcgctggtt taggtttcag aggtgaaggt tccaccactt 1320
tcaccattgc tactccaact ggtgaaggca ccactactgc cagacatttt gctcgtcgta 1380
gaagatgtgt cttgactgat ggtttctcta tacgctaaag gagacc 1426
<210> 52
<211> 2626
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..2626
<223> /organism="Artificial Sequence"
/note="Sequence containing the adhE (S. aureus) DNA sequence
codon-pair optimized for expression in S. cerevisiae"
/mol_type="unassigned DNA"
<400> 52
ggtctcgaat gttgaccatt ccagaaaagg aaaacagagg ttccaaggaa caagaagttg 60
ctattatgat tgacgctttg gctgacaaag gtaagaaggc tttggaagct ctatccaaga 120
agtcccaaga agaaattgac cacattgtcc accaaatgtc tttggccgct gttgaccaac 180
acatggtctt ggctaagttg gctcacgaag aaactggtag aggtatctac gaagataagg 240
ccatcaagaa cttgtacgct tctgaataca tctggaactc catcaaggac aacaagactg 300
tcggtatcat cggtgaagat aaagaaaagg gtttgactta cgttgctgaa ccaattggtg 360
ttatctgtgg tgtcacccca actaccaacc caacctctac caccattttc aaggctatga 420
ttgccattaa gactggtaac cctatcatct ttgctttcca cccatctgct caagaatctt 480
ccaagagagc tgctgaagtt gttttggaag ccgctatgaa ggccggtgct ccaaaggata 540
tcatccaatg gattgaagtt ccatccatcg aagccactaa gcaattgatg aaccacaagg 600
gtattgcttt agttttagcc actggtggtt ccggtatggt caagtccgct tactccaccg 660
gtaagccagc cttgggtgtt ggtccaggta acgtcccatc ctacattgag aaaaccgctc 720
acattaagcg tgctgttaac gacatcattg gttctaagac tttcgacaat ggtatgatct 780
gtgcttctga acaagttgtt gttatcgaca aggaaatcta caaggatgtc accaacgaat 840
tcaaggctca tcaagcttac ttcgtcaaga aggacgaatt gcaaagatta gaaaatgcta 900
tcatgaacga acaaaagacc ggtatcaaac cagacattgt cggtaagtct gctgttgaaa 960
ttgctgaatt ggccggtatt ccagtcccag aaaacaccaa gttgatcatt gctgaaattt 1020
ctggtgtcgg ttctgactac ccattgtcta gagaaaagtt gtctccagtc ttggctttgg 1080
ttaaggctca atccaccaag caagctttcc aaatctgtga agatactttg cacttcggtg 1140
gtttgggtca taccgctgtc attcacactg aagatgaaac tttgcaaaaa gatttcggtc 1200
taagaatgaa ggcctgtaga gtcttggtca acactccatc cgctgttggt ggtattggtg 1260
acatgtacaa cgaattgatt ccatctttga ctttgggttg tggttcttac ggtagaaact 1320
ccatctctca caacgtttct gctaccgact tgttgaacat caagaccatt gccaagagaa 1380
gaaacaacac tcaaatcttc aaggttccag ctcaaatcta ctttgaagaa aacgccatca 1440
tgtccttgac caccatggac aagatcgaaa aggtcatgat cgtttgtgac ccaggtatgg 1500
ttgaattcgg ttacaccaag accgttgaaa acgtcttaag acaaagaact gaacaaccac 1560
aaatcaaaat tttctccgaa gtcgaaccaa acccatccac taacaccgtt tacaagggtt 1620
tagaaatgat ggtcgatttc caaccagata ccattattgc tttgggtggt ggttctgcca 1680
tggacgctgc taaggccatg tggatgttct tcgaacatcc agaaacttct ttcttcggtg 1740
ccaagcaaaa gttcttggat atcggtaagc gtacctacaa gattggtatg ccagaaaacg 1800
ctactttcat ctgtatccca actacttccg gtactggttc cgaagtcact ccatttgctg 1860
ttatcactga ttctgaaacc aacgtcaagt acccattggc tgacttcgct ttgaccccag 1920
atgttgctat catcgaccca caattcgtca tgtccgttcc aaaatctgtc actgctgaca 1980
ccggtatgga cgttttgacc cacgctatgg aatcttacgt ttccgttatg gcctccgatt 2040
acaccagagg tttatctttg caagctatca aattgacttt cgaatactta aaatcttctg 2100
tcgaaaaagg tgacaaggtt tccagagaaa agatgcacaa cgcttctact ttggctggta 2160
tggcctttgc caacgctttc ttgggtatcg ctcactctat tgctcacaag atcggtggtg 2220
aatacggtat cccacatggt agagctaacg ctatcttatt gcctcacatc atccgttaca 2280
acgctaagga ccctcaaaag cacgctttgt tcccaaagta cgaattcttc agagctgaca 2340
ctgactacgc tgatatcgct aagttcttag gtttgaaggg taacactact gaagctttgg 2400
tcgaatcttt ggccaaggct gtttacgaat tgggtcaatc tgttggtatc gaaatgaact 2460
tgaaatctca aggtgtctct gaagaagaat tgaacgaatc tattgacaga atggccgaat 2520
tggctttcga agatcaatgt accaccgcca acccaaagga agctttgatc tctgaaatca 2580
aggatattat ccaaacttct tacgattaca agcaataaag gagacc 2626
<210> 53
<211> 2068
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..2068
<223> /organism="Artificial Sequence"
/note="Sequence containing the ACS2 (S. cerevisiae) DNA sequence
codon-pair optimized for expression in S. cerevisiae"
/mol_type="unassigned DNA"
<400> 53
ggtctcgaat gaccatcaag gaacacaagg ttgtctacga agctcacaac gtcaaggctt 60
tgaaagctcc tcaacatttc tacaactctc aaccaggtaa gggttacgtt accgatatgc 120
aacactacca agaaatgtac caacaatcca tcaacgaacc agaaaaattc ttcgacaaga 180
tggctaagga atacttgcac tgggatgctc catacaccaa ggttcaatcc ggttccttga 240
acaacggtga tgtcgcttgg ttcttgaacg gtaaattgaa tgcttcctac aactgtgtcg 300
atcgtcacgc tttcgctaac ccagacaaac cagctttgat ttacgaagct gatgacgaat 360
ctgacaacaa gatcatcact ttcggtgaac tattaagaaa ggtttctcaa atcgctggtg 420
tcttgaaatc ctggggtgtt aagaagggtg acactgttgc catctacttg ccaatgatcc 480
cagaagctgt tattgctatg ttggctgtcg ccagaattgg tgccattcac tctgttgttt 540
tcgctggttt ctctgccggt tctttgaagg acagagtcgt tgacgctaac tctaaggttg 600
tcatcacttg tgacgaaggt aagagaggtg gtaagaccat taacactaag aagattgtcg 660
acgaaggttt gaacggtgtt gatttggttt ccagaatctt ggttttccaa agaaccggta 720
ctgaaggtat tccaatgaag gctggtagag actactggtg gcatgaagaa gccgctaagc 780
aaagaactta cctaccacct gtttcctgtg atgctgaaga tccattgttt ttgttgtaca 840
cctctggttc taccggttct ccaaagggtg ttgtccacac taccggtggt tacttgttgg 900
gtgctgcttt gaccaccaga tacgtctttg acatccaccc tgaagatgtc ttattcactg 960
ctggtgacgt cggttggatc actggtcata cctacgcttt gtacggtcca ttgactttag 1020
gtactgcttc tatcatcttc gaatccaccc cagcttaccc agactacggt agatactgga 1080
gaatcattca aagacacaag gccacccact tctacgtcgc cccaactgcc ttgagattaa 1140
tcaagagagt tggtgaagct gaaattgcta aatacgatac ctcttctttg agagtcttag 1200
gttctgtcgg tgaaccaatt tctccagact tatgggaatg gtatcacgaa aaggttggta 1260
acaagaactg tgtcatctgt gacaccatgt ggcaaactga atctggttct cacttgattg 1320
ctccattggc tggtgctgtt ccaactaagc caggttccgc taccgttcca ttcttcggta 1380
tcaacgcttg tatcattgac ccagtcactg gtgtcgaatt ggaaggtaac gatgttgaag 1440
gtgtcttggc cgtcaagtct ccatggccat ccatggctag atctgtctgg aaccaccacg 1500
atcgttacat ggacacctac ttgaaaccat acccaggtca ctacttcacc ggtgatggtg 1560
ccggtcgtga ccacgatggt tactactgga tcagaggtcg tgttgatgac gttgttaacg 1620
tttctggtca cagattgtcc acttctgaaa tcgaagcctc catctccaac catgaaaacg 1680
tttccgaagc tgctgtcgtt ggtattccag acgaattgac cggtcaaact gttgttgctt 1740
acgtttcttt aaaggacggt tacttgcaaa acaacgccac tgaaggtgac gctgaacaca 1800
tcactccaga taacttaaga agagaattga ttttgcaagt tcgtggtgaa attggtccat 1860
ttgcttcccc aaagaccatc attttggtta gagacttgcc aagaaccaga tctggtaaga 1920
tcatgagaag agtcttgaga aaggttgcct ccaatgaggc tgaacaattg ggtgacttga 1980
ctactttggc caacccagaa gtcgtcccag ctatcatttc tgctgtcgaa aaccaattct 2040
tctcccaaaa gaagaaataa aggagacc 2068
<210> 54
<211> 1120
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..1120
<223> /organism="Artificial Sequence"
/note="Sequence containing the gldA (E. coli) DNA sequence
codon-pair optimized for expression in S. cerevisiae"
/mol_type="unassigned DNA"
<400> 54
ggtctcgaat ggacagaatc atccaatctc caggtaagta catccaaggt gctgatgtta 60
tcaacagatt aggtgaatac ttgaagccat tggctgaaag atggttagtc gtcggtgaca 120
aattcgtttt gggtttcgct caatccaccg tcgaaaagtc tttcaaggat gctggtttgg 180
ttgttgaaat cgctccattc ggtggtgaat gttctcaaaa tgaaattgac cgtttgagag 240
gtattgctga aactgctcaa tgtggtgcca tcttgggtat tggtggtggt aagactttgg 300
acactgccaa ggctttggcc cacttcatgg gtgttccagt tgccattgct ccaaccattg 360
cttctaccga tgctccatgt tctgctttgt ccgttatcta caccgacgaa ggtgaatttg 420
accgttactt gttgttgcca aacaacccaa acatggtcat tgtcgacacc aagatcgttg 480
ccggtgctcc agccagatta ttggctgccg gtatcggtga tgctttggct acctggttcg 540
aagccagagc ttgttccaga tctggtgcta ctaccatggc cggtggtaaa tgtactcaag 600
ctgctttagc tttggctgaa ttgtgttaca acactttgtt ggaagaaggc gaaaaggcta 660
tgttggctgc tgaacaacac gttgttactc cagctttgga aagagtcatt gaagccaaca 720
cctacttgtc cggtgttgga ttcgaatctg gtggtttagc tgccgctcat gccgtccaca 780
acggtttgac tgccatccca gatgctcacc actactacca cggtgaaaag gttgctttcg 840
gtactttgac tcaattagtc ttggaaaacg ctccagtcga agaaatcgaa accgttgctg 900
ctctatccca cgctgtcggt ttgcctatca ctttggctca attggacatc aaggaagatg 960
tcccagctaa gatgagaatt gttgctgaag ctgcttgtgc tgaaggtgaa accattcaca 1020
acatgccagg tggtgccacc ccagaccaag tctacgctgc tttgttggtt gctgaccaat 1080
acggtcaaag attcttgcaa gaatgggagt aaaggagacc 1120
<210> 55
<211> 1114
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..1114
<223> /organism="Artificial Sequence"
/note="Sequence containing the gldA (K. pneumoniae) DNA sequence
codon-pair optimized for expression in S. cerevisiae"
/mol_type="unassigned DNA"
<400> 55
ggtctcgaat gttgaaggtt atccaatctc cagccaaata cttgcaaggt ccagatgctg 60
ctgtcttatt cggtcaatac gccaagaact tggctgaatc tttcttcgtt atcgctgatg 120
actttgtcat gaaattggct ggtgaaaaag ttgttaacgg tctacaatct cacgacatca 180
gatgtcatgc tgaaagattc aacggtgaat gttcccacgc tgaaatcaac cgtttgatgg 240
ctatcttaca aaagcaaggt tgtagaggtg ttgtcggtat cggtggtggt aagactttgg 300
ataccgctaa ggccatcggt tactaccaaa agttgccagt tgttgtcatt ccaaccattg 360
cttccactga cgctccaact tctgccttgt ccgtcatcta cactgaagct ggtgaattcg 420
aagaatactt gatctaccca aagaacccag acatggttgt tatggacacc gccattatcg 480
ccaaggctcc agtcagattg ttggtttccg gtatgggtga tgctttgtct acctggttcg 540
aagccaaggc ttgttacgac gctagagcta cctccatggc cggtggtcaa tctaccgaag 600
ctgctttgtc cttggctaga ttatgttacg acactttatt ggctgaaggc gaaaaggcca 660
gattagctgc tcaagctggt gttgtcactg aagccttgga aagaatcatt gaagctaaca 720
cctacttgtc tggtattggt ttcgaatctt ctggtttggc tgctgctcac gctattcaca 780
acggtttcac catcttggaa gaatgtcacc acttgtacca tggtgaaaag gttgctttcg 840
gtactttggc tcaattagtc ttgcaaaact ctccaatgga cgaaatcgaa accgttttgg 900
gtttctgtca aagagttggt ttgcctgtca ctttggccca aatgggtgtc aaggaaggta 960
ttgatgctaa gattgctgct gttgccaagg ctacctgtgc tgaaggtgaa accattcaca 1020
acatgccatt tgctgtcact ccagaatccg tccacgctgc catcttgact gctgatttgt 1080
tgggtcaaca atggttggct cgataaagga gacc 1114
<210> 56
<211> 1120
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..1120
<223> /organism="Artificial Sequence"
/note="Sequence containing the gldA (E. aerogenes) DNA sequence
codon-pair optimized for expression in S. cerevisiae"
/mol_type="unassigned DNA"
<400> 56
ggtctcgaat ggacagaatc atccaatctc caggtaagta catccaaggt gctggtgcca 60
tcaagagatt aggtgaatac ttgaagccat tggctgaaag atggttaatc attggtgaca 120
agttcgtctt gggttttgct gaagaacaat tgagaacctc tttgggtggt gccggtttgg 180
ttgctgaaat tgctccattc ggtggtgaat gttcccaaaa cgaaatcaac agattaagag 240
acattgcttc ttctgctcaa tgtcacgctg tcttgggtat tggtggtggt aagactttgg 300
acaccgctaa ggctttggcc cactacatgc atttgccagt tgttgttgct ccaaccattg 360
cttccaccga tgctccatgt tctgctttgt ctgtcatcta caccgatgac ggtgaattcg 420
aatcctactt gatgttgcct cacaacccaa acatggttgt tgtcgacact caaatcgttg 480
ctgctgcccc agccagattg ttggccgctg gtatcggtga tgctttggcc acctggttcg 540
aagccagagc ttgttcccgt tctggtgcta ccaccatggc tggtggtaaa tgtacccaag 600
ccgctttggc tttggctgaa ttgtgttaca acactttagt cgaagagggt gaaaaagcca 660
tgttagctgc tgaacaacac gttgtcactc cagctttgga acgtgtcatt gaagctaaca 720
cctacttgtc cggtgttgga ttcgaatctg gtggtttggc tgctgctcac gctattcaca 780
acggtttgac tgccatccca gatgctcacc acttctacca tggtgaaaag gttgccttcg 840
gtactttgac tcaattggtt ttggaaaacg ctccagtcga agaaattgaa actgctgctg 900
ctttgtgtca ctccgttggt ttgccaatca ctttggctca attggatatc aagggtgaca 960
tcccagccaa gatgagaact gttgctgaag ctgcttgtgc cgaaggtgaa accattcaca 1020
acatgccagg tggtgcttgt gctgaccaag tctacgctgc tctattagtc gccgaccaat 1080
acggtcaaag attcttgcaa gaatgggagt aaaggagacc 1120
<210> 57
<211> 1111
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..1111
<223> /organism="Artificial Sequence"
/note="Sequence containing the gldA (Y. aldovae) DNA sequence
codon-pair optimized for expression in S. cerevisiae"
/mol_type="unassigned DNA"
<400> 57
ggtctcgaat gttgaaggtc atccaatctc catctaagta catccaaggt gccaacgctt 60
tgcaatccat tggtgaattt gccaagttgt tggctaacaa ctacttcatc attgctgatg 120
actttgtcat gaaattgact gctgacaccg ttggtacttc tttgcaaacc tgtgaattga 180
aatctcactt ctccagattc aacggtgaat gttccagaca agaaatcgaa agattgaccg 240
tcgaattgaa gaaatacggt tgtaatggtg tcatcggtat cggtggtggt aagactttgg 300
acaccgctaa ggccattgct cactaccaac acatcccagt tgttgttgtc ccaaccattg 360
cttctaccga tgctccaact tctgctttgt ccgtcatcta cactgaacaa ggtgaattcg 420
ctgaatactt gatctaccca aagaacccag acattgtctt gatggacacc accatcattg 480
ccaaggctcc agtcagattg ttggttgctg gtatgggtga tgctctatcc acctacttcg 540
aagctcaagc ctgtttcgat gccaaggcca tctccatggc tggtggtgct tccactttgg 600
ctgccatcac tttggccaga ttatgttacg aaactttatt ggctgaaggt tacaaggcca 660
agttggctgt tgaagctggt gttgtcactg aagctgtcga acgtattatt gaagctaaca 720
cctacttgtc tggtattggt ttcgaatctt ctggtttggc tgctgctcat gccatccaca 780
acggtttcac cgttttggaa gaatgtcacc acttgtacca tggtgaaaag gttgctttcg 840
gtactttgac tcaattggtt ttgcaaaact cttccatgga agaaattgaa accgtcttgt 900
ctttctgtca acaattaggt ttgccaatca ctttagctga aatgggtgtc actcaagatt 960
tggaatgtaa gatcagagct gttgctcaag cttcttgtgc tgaaggtgaa accattcaca 1020
acatgccatt caaggttacc gctgactctg tttacgccgc tatcatcgtt gctgacagat 1080
taggtcaagc tttcctcaac taaaggagac c 1111
<210> 58
<211> 1111
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..1111
<223> /organism="Artificial Sequence"
/note="Sequence containing the DAK1 (S. cerevisiae) DNA sequence
codon-pair optimized for expression in S. cerevisiae"
/mol_type="unassigned DNA"
<400> 58
ggtctcgaat gttgaaggtc atccaatctc catctaagta catccaaggt gccaacgctt 60
tgcaatccat tggtgaattt gccaagttgt tggctaacaa ctacttcatc attgctgatg 120
actttgtcat gaaattgact gctgacaccg ttggtacttc tttgcaaacc tgtgaattga 180
aatctcactt ctccagattc aacggtgaat gttccagaca agaaatcgaa agattgaccg 240
tcgaattgaa gaaatacggt tgtaatggtg tcatcggtat cggtggtggt aagactttgg 300
acaccgctaa ggccattgct cactaccaac acatcccagt tgttgttgtc ccaaccattg 360
cttctaccga tgctccaact tctgctttgt ccgtcatcta cactgaacaa ggtgaattcg 420
ctgaatactt gatctaccca aagaacccag acattgtctt gatggacacc accatcattg 480
ccaaggctcc agtcagattg ttggttgctg gtatgggtga tgctctatcc acctacttcg 540
aagctcaagc ctgtttcgat gccaaggcca tctccatggc tggtggtgct tccactttgg 600
ctgccatcac tttggccaga ttatgttacg aaactttatt ggctgaaggt tacaaggcca 660
agttggctgt tgaagctggt gttgtcactg aagctgtcga acgtattatt gaagctaaca 720
cctacttgtc tggtattggt ttcgaatctt ctggtttggc tgctgctcat gccatccaca 780
acggtttcac cgttttggaa gaatgtcacc acttgtacca tggtgaaaag gttgctttcg 840
gtactttgac tcaattggtt ttgcaaaact cttccatgga agaaattgaa accgtcttgt 900
ctttctgtca acaattaggt ttgccaatca ctttagctga aatgggtgtc actcaagatt 960
tggaatgtaa gatcagagct gttgctcaag cttcttgtgc tgaaggtgaa accattcaca 1020
acatgccatt caaggttacc gctgactctg tttacgccgc tatcatcgtt gctgacagat 1080
taggtcaagc tttcctcaac taaaggagac c 1111
<210> 59
<211> 1771
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..1771
<223> /organism="Artificial Sequence"
/note="Sequence containing the dhaK (K. pneumoniae) DNA sequence
codon-pair optimized for expression in S. cerevisiae"
/mol_type="unassigned DNA"
<400> 59
ggtctcgaat gtccgctaaa tctttcgaag ttaccgaccc agtcaactct tctttgaagg 60
gttttgcttt ggccaaccca tccattactt tggtcccaga agaaaagatc ttattcagaa 120
agactgactc tgacaaaatt gctttgatct ccggtggtgg ttccggtcac gaaccaaccc 180
acgctggttt catcggtaag ggtatgttgt ccggtgctgt cgttggtgaa atctttgctt 240
ctccatccac caagcaaatc ttgaatgcta tcagattagt caacgaaaac gcttctggtg 300
tcttgttgat tgtcaagaac tacactggtg acgtcttgca tttcggttta tctgctgaaa 360
gagctagagc tttgggtatt aactgtagag ttgccgtcat cggtgacgat gttgctgtcg 420
gtcgtgaaaa gggtggtatg gttggtagac gtgctttggc tggtactgtc ttggttcaca 480
agattgttgg tgctttcgct gaagaatact cctccaagta cggtttagat ggtactgcta 540
aggttgccaa gatcatcaac gacaacttgg ttaccatcgg ttcttctttg gaccactgta 600
aggttccagg tagaaagttc gaatctgaat tgaacgaaaa gcaaatggaa ttgggtatgg 660
gtatccacaa cgaaccaggt gttaaggtct tggacccaat tccatccact gaagatttga 720
tttccaaata catgttgcca aagttgctag acccaaacga caaggacaga gctttcgtta 780
agttcgatga agatgacgaa gttgttttgt tggtcaacaa cttgggtggt gtttctaact 840
tcgtcatctc ttctattacc tccaagacca ccgatttctt aaaggaaaac tacaacatca 900
ctccagtcca aaccattgcc ggtactttga tgacctcttt caacggtaac ggtttctcca 960
tcaccttgtt gaatgccacc aaagctacca aggctttgca atctgatttc gaagaaatca 1020
aatccgtctt agatttgttg aacgccttca ccaacgcccc aggttggcca attgctgact 1080
tcgaaaagac ctctgctcca tctgttaacg atgacttgtt gcacaacgaa gttactgcca 1140
aggccgtcgg tacttacgat ttcgacaaat tcgctgaatg gatgaagtct ggtgctgaac 1200
aagtcatcaa atctgaacca cacatcactg aattggacaa ccaagttggt gatggtgact 1260
gtggttacac tttggttgct ggtgtcaagg gtatcactga aaacttggac aaattgtcca 1320
aggactcttt gtctcaagct gttgctcaaa tttctgattt cattgaaggt tccatgggtg 1380
gtacttctgg tggtttgtac tccatcttgt tgtctggttt ctcccacggt ttgatccaag 1440
tttgtaagtc caaggatgaa cctgtcacca aggaaattgt tgccaagtct ctaggtattg 1500
ctttggacac tttatacaag tacaccaagg ccagaaaggg ttcttccacc atgatcgatg 1560
ctttggaacc atttgtcaag gaattcactg cttctaagga cttcaacaag gctgttaagg 1620
ctgctgaaga aggtgccaag tccactgcta ctttcgaagc taagttcggt agagcttctt 1680
acgttggtga ctcttctcaa gttgaagatc caggtgctgt tggtttatgt gaattcttga 1740
agggtgtcca atctgcgctt taaaggagac c 1771
<210> 60
<211> 1735
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..1735
<223> /organism="Artificial Sequence"
/note="Sequence containing the DAK1 (Y. lipolytica) DNA sequence
codon-pair optimized for expression in S. cerevisiae"
/mol_type="unassigned DNA"
<400> 60
ggtctcgaat gactaccaag caattccaat tcgactctga cccattgaac tctgctttgg 60
ccgctactgc tgaagcttct ggtttagctt acttgccaaa gtccaaggtc atctactacc 120
cattgactaa cgacaaggtt actttgatct ccggtggtgg tgctggtcac gaaccagctc 180
aaactggttt cgttggtcct ggtttgttgg atgctgccgt ttccggtcaa atcttcgctt 240
ccccatccac caagcaaatc atcgctggtg tcaatgctgt caaatctcaa agaggttcca 300
ttatcatcgt catgaactac actggtgatg tcattcactt cggtatggct gctgaacaat 360
taagatccag atacgactac catgctgaat tggtttccat cggtgatgac atttctgtca 420
acaagaaggc tggtagaaga ggtctagctg gtactgtttt ggttcacaag attgccggtc 480
acttggctcg tgacggttgg gatgtcggtg ttttggccga agctttgaga accactgctg 540
ctaacttggc cactgttgct gcttccttgg aacactgtac cgtcccaggt agaaagttcg 600
aaactgaatt ggccgctgac gaaatggaaa tcggtatggg tattcacaat gaaccaggtg 660
tcaaaaccat caagatcggt aaggttgaat ctttattgga cgaattagtc gacaaatttg 720
aaccttctaa gcaagatttc gttccattca acaaaggtga cgaagttgtc ttgttggtca 780
actctttggg tggtgtttct tctttggaat tgcatgccat tgctaacatt gcccaaacca 840
aattcgaaaa ggttttgggt gtcaagaccg tcagattgat tgttggtaac ttcatggctg 900
ctttcaacgg tccaggtttc tctttgacct tgttgaacgt taccactacc gctaagaagg 960
gtaactttga cgtcttgggt gccttggatg ccccagtttc caccgctgct tggccatctt 1020
tgcaacaaaa ggataaacca gctaacggtg gtgttcaaga agaaaaggaa actgactctg 1080
acaagccagc tgaaccaacc ggtatcaagg ctgatggtaa attattcaag gctatgattg 1140
aatctgctgt cgatgacttg aagaaggaag aaccacaaat caccaagtac gacactattg 1200
ctggtgacgg tgactgtggt gaaactctat tagctggtgg tgatggtatc ttggatgcta 1260
tcaagaacaa gaagatcgac ttggacgatg ctgctggtgt tgctgatatc tctcacattg 1320
ttgaaaactc tatgggtggt acttctggtg gtttatactc catcttcttc tctggtttgg 1380
ttgttggtat taaggaaacc aaggccaagg aattgtccgt cgacgtcttt gccaaggcct 1440
gtgaaactgc cttggaaact ttatccaagt acacccaagc tcgtgtcggt gacagaacct 1500
tgatggatgc tttggttcca ttcgttgaaa ctttgtctaa gaccaaggat ttcgctaagg 1560
ctgtcgaagc tgctagaaag ggtgccgacg aaacctccaa attgccagcc aacttcggta 1620
gagcttctta cgttaacgaa gaaggtttgg aaaacattcc agacccaggt gctttgggtt 1680
tggccgttat cttcgaaggt ttattgaagg cttgggaaaa gaaataaagg agacc 1735
<210> 61
<211> 1759
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..1759
<223> /organism="Artificial Sequence"
/note="Sequence containing the DAK1 (S. pombe) DNA sequence
codon-pair optimized for expression in S. cerevisiae"
/mol_type="unassigned DNA"
<400> 61
ggtctcgaat ggacaagcac ttcatcaacg acccagaagt cttagtcttg gacggtttga 60
aatctttggc tgacatgaac aagactttga ccgtccacga agaaggtaag ttcatctact 120
tccacgacta caacaagaag aacgtttccg ttatctccgg tggtggtgct ggtcatgaac 180
caactcactc ttctttcgtc ggtaagggta tgttgactgc tgctgtttcc ggttccatct 240
ttgcctctcc atcttccaag caaatctaca ccggtatcaa gcaagtcgaa tctgaagctg 300
gtactttggt tatctgtaag aactacactg gtgatatctt gcacttcggt atggctttgg 360
aaaagcaaag aactgctggt aagaaggctg aattgattgc cgttgctgac gatgtctctg 420
tcggtagaaa gaagtctggt aaggttggta gaagaggttt atctggtact gtcttggttc 480
acaagattgc tggtgctgct gctgcccgtg gtttgccatt agaagctgtc accaccattg 540
ccaaggctgc cattgacaac ttagtctcta tcggtgcttc cttggctcat gttcacgttc 600
caggtcacga accaattgct aaggaagatg aaatgaagca cgatgaaatg gaattgggta 660
tgggtatcca caacgaacct ggttgtaaga gaatctctcc aatcccatcc attgatgact 720
tgattgctca aatgttgaaa caaatgttgg accaatctga caaggatcgt gcttacgtca 780
aaatcgaagg tgacgacgaa gttgtcttgt tgatgaacaa cttgggtggt ctatccatgt 840
tggaattctc tgccatttct cacaaggtca aggaagcttt agctaaggaa tacaagatta 900
accctgttag aatcttcgct ggtccattca ccacctcttt gaatggtcta ggtttcggta 960
tcactttgtt gagaaccact gacagagtca aggttgaagg tgaagaatac tctttggttg 1020
atttgattga ccaaccagtt gaagctattg gttggccatt gtgtcaacca tctgatttga 1080
aatccaagaa caagattggt aacgtttcca ttgaagaagg tcaaaaggac gttaaatctc 1140
cagttaccgt tgacaaggaa aaggttcgtc aagctatcgt caactccatg gaaaacttaa 1200
tcaaggctga accaaagatc accaaattcg acaccatggc tggtgatggt gactgtggta 1260
ctaccttgaa gagaggtgct gaaggtgtct tgaaattcgt caaatctgat aaattctctg 1320
atgacccaat cagaatcgtt agagatatcg ctgatgttat tgaagataac atggacggta 1380
cttctggtgc tttgtacgcc atcttcttcc acggtttcgc caagggtatg aaggacacct 1440
tggaaaagtc caaagatatc tcctccaaga cctgggctgc tggtttgaag gttgctttgg 1500
acactttatt caaatacact ccagccagac caggtgactc taccatgtgt gacgctttgg 1560
ttccattcgt tgaaactttt gtcaagacca acgacttgaa cgctgccgtc gaagaagcta 1620
gaaagggtgc tgatgctact gctgacatgc aagccaagtt gggtagagct gtctacgtcg 1680
gtgatgacgt caaggttcca gatgctggtg ccttgggtgt tgttgccatt gtcgaaggtt 1740
ttacgaagta aaggagacc 1759
Claims (30)
- a) NAD+-의존적 아세틸화 아세트알데하이드 데하이드로게나제(E.C. 1.2.1.10)를 암호화하는 하나 이상의 뉴클레오타이드 서열;
b) 아세틸-CoA 신세타제(E.C. 6.2.1.1)를 암호화하는 하나 이상의 뉴클레오타이드 서열;
c) 글리세롤 데하이드로게나제(E.C. 1.1.1.6)를 암호화하는 하나 이상의 뉴클레오타이드 서열; 및
d) 다이하이드록시아세톤 키나제(E.C. 2.7.1.28 또는 E.C. 2.7.1.29)를 암호화하는 하나 이상의 뉴클레오타이드 서열
을 포함하는, 유전적으로 변형된 세포. - 제1항에 있어서,
글리세롤 3-포스페이트 포스포하이드롤라제를 암호화하고/하거나 글리세롤 3-포스페이트 데하이드로게나제 유전자를 암호화하는 하나 이상의 내생성 뉴클레오타이드 서열의 결실 또는 파괴를 포함하는 세포. - 제2항에 있어서,
c)가 서열번호 7, 또는 서열번호 7과 60% 이상의 서열 동일성을 가진 서열번호 7의 기능성 상동체로 표시되는 이종 글리세롤 데하이드로게나제(E.C. 1.1.1.6)를 암호화하는 하나 이상의 뉴클레오타이드 서열; 및/또는 서열번호 9, 또는 서열번호 9와 60% 이상의 서열 동일성을 가진 서열번호 9의 기능성 상동체로 표시되는 이종 글리세롤 데하이드로게나제(E.C. 1.1.1.6)를 암호화하는 하나 이상의 뉴클레오타이드 서열인, 세포. - 제3항에 있어서,
c)가 서열번호 7, 또는 서열번호 7과 60% 이상의 서열 동일성을 가진 서열번호 7의 기능성 상동체로 표시되는 이종 글리세롤 데하이드로게나제(E.C. 1.1.1.6)를 암호화하는 하나 이상의 뉴클레오타이드 서열인, 세포. - 제1항 내지 제4항 중 어느 한 항에 있어서,
d)가 서열번호 11, 또는 서열번호 11과 40% 이상의 서열 동일성을 가진 서열번호 11의 기능성 상동체로 표시되는 다이하이드록시아세톤 키나제(E.C. 2.7.1.28 또는 E.C. 2.7.1.29)를 암호화하는 하나 이상의 이종 뉴클레오타이드 서열; 및/또는 서열번호 13, 또는 서열번호 13과 40% 이상의 서열 동일성을 가진 서열번호 13의 기능성 상동체로 표시되는 다이하이드록시아세톤 키나제(E.C. 2.7.1.28 또는 E.C. 2.7.1.29)를 암호화하는 하나 이상의 뉴클레오타이드 서열인, 세포. - 제5항에 있어서,
d)가 서열번호 13, 또는 서열번호 13과 40% 이상의 서열 동일성을 가진 서열번호 13의 기능성 상동체로 표시되는 다이하이드록시아세톤 키나제(E.C. 2.7.1.28 또는 E.C. 2.7.1.29)를 암호화하는 하나 이상의 뉴클레오타이드 서열인, 세포. - 제1항 내지 제6항 중 어느 한 항에 있어서,
a)가 서열번호 1, 또는 서열번호 1과 60% 이상의 서열 동일성을 가진 서열번호 1의 기능성 상동체로 표시되는 이종 NAD+-의존적 아세틸화 아세트알데하이드 데하이드로게나제를 암호화하는 하나 이상의 뉴클레오타이드 서열; 서열번호 2, 또는 서열번호 2와 60% 이상의 서열 동일성을 가진 서열번호 2의 기능성 상동체로 표시되는 이종 NAD+-의존적 아세틸화 아세트알데하이드 데하이드로게나제를 암호화하는 하나 이상의 뉴클레오타이드 서열; 및/또는 서열번호 3, 또는 서열번호 3과 60% 이상의 서열 동일성을 가진 서열번호 3의 기능성 상동체로 표시되는 이종 NAD+-의존적 아세틸화 아세트알데하이드 데하이드로게나제를 암호화하는 하나 이상의 뉴클레오타이드 서열인, 세포. - 제7항에 있어서,
a)가 서열번호 1, 또는 서열번호 1과 60% 이상의 서열 동일성을 가진 서열번호 1의 기능성 상동체로 표시되는 이종 NAD+-의존적 아세틸화 아세트알데하이드 데하이드로게나제를 암호화하는 하나 이상의 뉴클레오타이드 서열; 및/또는 서열번호 2, 또는 서열번호 2와 60% 이상의 서열 동일성을 가진 서열번호 2의 기능성 상동체로 표시되는 이종 NAD+-의존적 아세틸화 아세트알데하이드 데하이드로게나제를 암호화하는 하나 이상의 뉴클레오타이드 서열인, 세포. - 제8항에 있어서,
a)가 서열번호 2, 또는 서열번호 2와 60% 이상의 서열 동일성을 가진 서열번호 2의 기능성 상동체로 표시되는 이종 NAD+-의존적 아세틸화 아세트알데하이드 데하이드로게나제를 암호화하는 하나 이상의 뉴클레오타이드 서열인, 세포. - 제1항 내지 제9항 중 어느 한 항에 있어서,
b)가 서열번호 6, 또는 서열번호 6과 60% 이상의 서열 동일성을 가진 서열번호 6의 기능성 상동체로 표시되는 동종 또는 이종 아세틸-CoA 신세타제(E.C. 6.2.1.1)를 암호화하는 하나 이상의 뉴클레오타이드 서열인, 세포. - 제1항 내지 제10항 중 어느 한 항에 있어서,
a)가 서열번호 3, 또는 서열번호 3과 60% 이상의 서열 동일성을 가진 서열번호 3의 기능성 상동체로 표시되는 NAD+-의존적 아세틸화 아세트알데하이드 데하이드로게나제를 암호화하는 하나 이상의 뉴클레오타이드 서열이고;
b)가 서열번호 6, 또는 서열번호 6과 60% 이상의 서열 동일성을 가진 서열번호 6의 기능성 상동체로 표시되는 동종 또는 이종 아세틸-CoA 신세타제(E.C. 6.2.1.1)를 암호화하는 하나 이상의 뉴클레오타이드 서열이고;
c)가 서열번호 7, 또는 서열번호 7과 60% 이상의 서열 동일성을 가진 서열번호 7의 기능성 상동체로 표시되는 글리세롤 데하이드로게나제(E.C. 1.1.1.6)를 암호화하는 하나 이상의 뉴클레오타이드 서열이고;
d)가 서열번호 11, 또는 서열번호 11과 40% 이상의 서열 동일성을 가진 서열번호 11의 기능성 상동체로 표시되는 동종 또는 이종 다이하이드록시아세톤 키나제(E.C. 2.7.1.28 또는 E.C. 2.7.1.29)를 암호화하는 하나 이상의 뉴클레오타이드 서열인, 세포. - 제1항 내지 제10항 중 어느 한 항에 있어서,
a)가 서열번호 2, 또는 서열번호 2와 60% 이상의 서열 동일성을 가진 서열번호 2의 기능성 상동체로 표시되는 NAD+-의존적 아세틸화 아세트알데하이드 데하이드로게나제를 암호화하는 하나 이상의 뉴클레오타이드 서열이고;
b)가 서열번호 6, 또는 서열번호 6과 60% 이상의 서열 동일성을 가진 서열번호 6의 기능성 상동체로 표시되는 동종 또는 이종 아세틸-CoA 신세타제(E.C. 6.2.1.1)를 암호화하는 하나 이상의 뉴클레오타이드 서열이고;
c)가 서열번호 9, 또는 서열번호 9와 60% 이상의 서열 동일성을 가진 서열번호 9의 기능성 상동체로 표시되는 글리세롤 데하이드로게나제(E.C. 1.1.1.6)를 암호화하는 하나 이상의 뉴클레오타이드 서열이고;
d)가 서열번호 11, 또는 서열번호 11과 40% 이상의 서열 동일성을 가진 서열번호 11의 기능성 상동체로 표시되는 동종 또는 이종 다이하이드록시아세톤 키나제(E.C. 2.7.1.28 또는 E.C. 2.7.1.29)를 암호화하는 하나 이상의 뉴클레오타이드 서열인, 세포. - 제1항 내지 제10항 중 어느 한 항에 있어서,
a)가 서열번호 2, 또는 서열번호 2와 60% 이상의 서열 동일성을 가진 서열번호 2의 기능성 상동체로 표시되는 NAD+-의존적 아세틸화 아세트알데하이드 데하이드로게나제를 암호화하는 하나 이상의 이종 뉴클레오타이드 서열이고;
b)가 서열번호 6, 또는 서열번호 6과 60% 이상의 서열 동일성을 가진 서열번호 6의 기능성 상동체로 표시되는 동종 또는 이종 아세틸-CoA 신세타제(E.C. 6.2.1.1)를 암호화하는 하나 이상의 뉴클레오타이드 서열이고;
c)가 서열번호 7, 또는 서열번호 7과 60% 이상의 서열 동일성을 가진 서열번호 7의 기능성 상동체로 표시되는 글리세롤 데하이드로게나제(E.C. 1.1.1.6)를 암호화하는 하나 이상의 뉴클레오타이드 서열이고;
d)가 서열번호 13, 또는 서열번호 13과 40% 이상의 서열 동일성을 가진 서열번호 13의 기능성 상동체로 표시되는 동종 또는 이종 다이하이드록시아세톤 키나제(E.C. 2.7.1.28 또는 E.C. 2.7.1.29)를 암호화하는 하나 이상의 뉴클레오타이드 서열인, 세포. - 제1항 내지 제10항 중 어느 한 항에 있어서,
a)가 서열번호 1, 또는 서열번호 1과 60% 이상의 서열 동일성을 가진 서열번호 1의 기능성 상동체로 표시되는 NAD+-의존적 아세틸화 아세트알데하이드 데하이드로게나제를 암호화하는 하나 이상의 뉴클레오타이드 서열이고;
b)가 서열번호 6, 또는 서열번호 6과 60% 이상의 서열 동일성을 가진 서열번호 6의 기능성 상동체로 표시되는 동종 또는 이종 아세틸-CoA 신세타제(E.C. 6.2.1.1)를 암호화하는 하나 이상의 뉴클레오타이드 서열이고;
c)가 서열번호 7, 또는 서열번호 7과 60% 이상의 서열 동일성을 가진 서열번호 7의 기능성 상동체로 표시되는 글리세롤 데하이드로게나제(E.C. 1.1.1.6)를 암호화하는 하나 이상의 이종 뉴클레오타이드 서열이고;
d)가 서열번호 13, 또는 서열번호 13과 40% 이상의 서열 동일성을 가진 서열번호 13의 기능성 상동체로 표시되는 동종 또는 이종 다이하이드록시아세톤 키나제(E.C. 2.7.1.28 또는 E.C. 2.7.1.29)를 암호화하는 하나 이상의 뉴클레오타이드 서열인, 세포. - 제1항 내지 제14항 중 어느 한 항에 있어서,
효모 세포인 세포. - 제15항에 있어서,
효모 세포에서 글리세롤 3-포스페이트 포스포하이드롤라제를 암호화하는 모든 내생성 뉴클레오타이드 서열 및 글리세롤 3-포스페이트 데하이드로게나제를 암호화하는 모든 내생성 뉴클레오타이드 서열이 결실되어 있는, 세포. - 제16항에 있어서,
효모 세포가 NADH-의존적 글리세롤 3-포스페이트 데하이드로게나제를 암호화하는 유전자를 갖지 않는, 세포. - 제15항 내지 제17항 중 어느 한 항에 있어서,
사카로마이세타세애(Saccharomycetaceae)로 구성된 목록, 특히 사카로마이세스(Saccharomyces), 예컨대, 사카로마이세스 세레비지애(Saccharomyces cerevisiae); 클루이베로마이세스(Kluyveromyces), 예컨대, 클루이베로마이세스 마르시아누스(Kluyveromyces marxianus), 피키아(Pichia), 예컨대, 피키아 스티피티스(Pichia stipitis) 또는 피키아 안구스타(Pichia angusta); 자이고사카로마이세스(Zygosaccharomyces), 예컨대, 자이고사카로마이세스 바일리이(Zygosaccharomyces bailii); 브레타노마이세스(Brettanomyces), 예컨대, 브레타노마이세스 인터메디우스(Brettanomyces intermedius); 이사첸키아(Issatchenkia), 예컨대, 이사첸키아 오리엔탈리스(Issatchenkia orientalis); 및 한세눌라(Hansenula)로 구성된 군으로부터 선택된 효모 세포. - 제1항 내지 제14항 중 어느 한 항에 있어서,
원핵세포인 세포. - 제19항에 있어서,
클로스트리듐(Clostridium), 자이모모나스(Zymomonas), 써모박터(Thermobacter), 에스케리키아(Escherichia), 락토바실러스(Lactobacillus), 게오바실러스(Geobacillus) 및 바실러스(Bacillus)로 구성된 목록으로부터 선택된 세포. - 서열번호 1 내지 서열번호 14 중 임의의 서열번호로 표시된 폴리펩타이드를 암호화하는 폴리뉴클레오타이드.
- 제21항의 폴리뉴클레오타이드를 하나 이상 포함하는 핵산 구축물.
- 제22항의 핵산 구축물로 형질전환된 숙주 세포.
- 에탄올의 제조를 위한 제1항 내지 제20항 및 제24항 중 어느 한 항에 따른 세포의 용도.
- 제18항 내지 제20항 중 어느 한 항에 따른 효모 세포를 사용하여 혐기성 조건 하에서 아세테이트 및 발효가능한 탄수화물, 특히 글루코스, 프럭토스, 수크로스, 말토스, 자일로스, 아라비노스, 갈락토스 및 만노스로 구성된 군으로부터 선택된 탄수화물로부터 발효 생성물을 제조하는 단계를 포함하는, 발효 생성물의 제조 방법.
- 제25항에 있어서,
0.7 이하, 특히 0.004 이상 내지 0.5, 보다 특히 0.05 내지 0.3의 몰비로 아세테이트 및 탄수화물을 포함하는 발효 배지에서 수행하는, 제조 방법. - 제25항 또는 제26항에 있어서,
리그노셀룰로스, 셀룰로스, 헤미셀룰로스 및 펙틴으로 구성된 군으로부터 선택된 폴리사카라이드의 가수분해에 의해 탄수화물의 적어도 일부 및 아세테이트의 적어도 일부를 수득하는, 제조 방법. - 제27항에 있어서,
리그노셀룰로스가, 가수분해되어 발효가능한 탄수화물 및 아세테이트를 제공하는 리그노셀룰로스성 바이오매스인, 제조 방법. - 제28항에 있어서,
리그노셀룰로스성 또는 헤미셀룰로스성 물질을 효소 조성물과 접촉하고, 이때 하나 이상의 당이 생성되고, 생성된 당이 발효되어 발효 생성물을 제공하고, 제1항 내지 제18항 중 어느 한 항에 따른 형질전환된 숙주 세포를 사용하여 발효를 수행하는, 제조 방법. - 제29항에 있어서,
발효 생성물이 에탄올, 부탄올, 락트산, 플라스틱, 유기산, 용매, 동물 사료 보충제, 약제, 비타민, 아미노산, 효소 및 화학적 공급원료 중 하나 이상인, 제조 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP13182222 | 2013-08-29 | ||
EP13182222.3 | 2013-08-29 | ||
PCT/EP2014/068324 WO2015028582A2 (en) | 2013-08-29 | 2014-08-29 | Glycerol and acetic acid converting yeast cells with improved acetic acid conversion |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20160046329A true KR20160046329A (ko) | 2016-04-28 |
Family
ID=49036504
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020167005191A KR20160046329A (ko) | 2013-08-29 | 2014-08-29 | 아세트산 전환이 개선된 글리세롤 및 아세트산 전환 효모 세포 |
Country Status (10)
Country | Link |
---|---|
US (2) | US10450588B2 (ko) |
EP (2) | EP3039130B1 (ko) |
KR (1) | KR20160046329A (ko) |
CN (1) | CN105492599A (ko) |
AR (1) | AR097480A1 (ko) |
BR (1) | BR112016004092A2 (ko) |
DK (1) | DK3039130T3 (ko) |
MY (1) | MY173141A (ko) |
PL (1) | PL3039130T3 (ko) |
WO (1) | WO2015028582A2 (ko) |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AR097480A1 (es) * | 2013-08-29 | 2016-03-16 | Dsm Ip Assets Bv | Células de levadura convertidoras de glicerol y ácido acético con una conversión de ácido acético mejorada |
MY188314A (en) | 2014-12-19 | 2021-11-28 | Dsm Ip Assets Bv | Fermentation process with improved glycerol and acetic acid conversion |
PL3298133T3 (pl) | 2015-05-22 | 2020-03-31 | Dsm Ip Assets B.V. | Komórki drożdży zużywające octan |
US11136600B2 (en) | 2015-10-06 | 2021-10-05 | Dsm Ip Assets B.V. | Eukaryotic cell with increased production of fermentation product |
JP6447583B2 (ja) * | 2016-06-24 | 2019-01-09 | トヨタ自動車株式会社 | 組換え酵母、及びそれを用いたエタノールの製造方法 |
CA3045739A1 (en) | 2016-12-20 | 2018-06-28 | Dsm Ip Assets B.V. | Improved yeast strains for ethanol production |
CN117925431A (zh) | 2016-12-23 | 2024-04-26 | 帝斯曼知识产权资产管理有限公司 | 改进的无甘油的乙醇生产 |
WO2018172328A1 (en) * | 2017-03-21 | 2018-09-27 | Dsm Ip Assets B.V. | Improved glycerol free ethanol production |
CN110678545B (zh) * | 2017-04-17 | 2023-10-10 | 丹尼斯科美国公司 | 减少酵母中乙酸产生的选择的乙酰辅酶a合酶 |
US11414683B2 (en) * | 2017-09-26 | 2022-08-16 | Dsm Ip Assets B.V. | Acetic acid consuming strain |
WO2019063542A1 (en) * | 2017-09-29 | 2019-04-04 | Dsm Ip Assets B.V. | IMPROVED ETHANOL PRODUCTION WITHOUT GLYCEROL |
US20210047660A1 (en) * | 2018-03-06 | 2021-02-18 | Danisco Us Inc. | Compositions and methods for increasing ethanol production by yeast using gcy1 and dak1 |
WO2019185737A1 (en) * | 2018-03-27 | 2019-10-03 | Basf Se | Xylose metabolizing yeast |
JP7078900B2 (ja) | 2018-10-05 | 2022-06-01 | トヨタ自動車株式会社 | 形質転換酵母及びこれを用いたエタノールの製造方法 |
US20220228176A1 (en) * | 2018-11-13 | 2022-07-21 | Lallemand Hungary Liquidity Management Llc | Synergistic bacterial and yeast combinations |
EP4132425A1 (en) * | 2020-04-06 | 2023-02-15 | Edwards Lifesciences Corporation | Prosthetic heart valve delivery apparatus |
EP4139463A1 (en) * | 2020-04-22 | 2023-03-01 | Plant Response, Inc. | Selective media for detection of zygosaccharomyces |
BR112023006130A2 (pt) | 2020-10-05 | 2023-05-09 | Dsm Ip Assets Bv | Célula de levedura saccharomyces e processo de fermentação usando a mesma |
EP4370689A1 (en) | 2021-07-12 | 2024-05-22 | Danisco Us Inc | Recombinant yeast cell |
WO2023285279A1 (en) | 2021-07-12 | 2023-01-19 | Dsm Ip Assets B.V. | Recombinant yeast cell |
EP4370692A1 (en) | 2021-07-12 | 2024-05-22 | Danisco Us Inc | Recombinant yeast cell |
CN117940570A (zh) | 2021-07-12 | 2024-04-26 | 丹尼斯科美国公司 | 重组酵母细胞 |
EP4370690A1 (en) | 2021-07-12 | 2024-05-22 | Danisco Us Inc | Recombinant yeast cell |
WO2023285297A1 (en) | 2021-07-12 | 2023-01-19 | Dsm Ip Assets B.V. | Recombinant yeast cell |
WO2023079048A1 (en) | 2021-11-04 | 2023-05-11 | Dsm Ip Assets B.V. | Process for the production of ethanol and recombinant yeast cell |
WO2023079050A1 (en) | 2021-11-04 | 2023-05-11 | Dsm Ip Assets B.V. | Recombinant yeast cell |
WO2023079049A1 (en) | 2021-11-04 | 2023-05-11 | Dsm Ip Assets B.V. | Variant polypeptide and recombinant yeast cell |
EP4365192A1 (en) | 2022-11-04 | 2024-05-08 | DSM IP Assets B.V. | Microbial production of growth factors |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003062443A2 (en) | 2001-11-08 | 2003-07-31 | Antex Pharma, Inc. | Novel substituted alkane compounds and uses thereof |
SE0202090D0 (sv) | 2002-05-08 | 2002-07-04 | Forskarpatent I Syd Ab | A modifierd yeast consuming L-arabinose |
PL2338895T3 (pl) | 2003-05-02 | 2013-11-29 | Cargill Inc | Genetycznie modyfikowane gatunki drożdży i sposoby fermentacji z użyciem genetycznie modyfikowanych drożdży |
SE0302421D0 (sv) | 2003-09-11 | 2003-09-11 | Forskarpatent I Syd Ab | Construction of new xylose utilizing Saccharomyces cerevisiae strain |
SE0400815D0 (sv) | 2004-03-26 | 2004-03-26 | Forskarpatent I Syd Ab | Traits in recombinant xylose-growing saccharomyces cerevisiae strains using genome-wide transcription analysis |
SE0401303D0 (sv) | 2004-05-19 | 2004-05-19 | Forskarpatent I Syd Ab | Ethanol productivities of microbial strains in fermentation of dilute-acid hydrolyzates depend on their furan reduction capacities |
CN101914462B (zh) | 2004-07-16 | 2013-04-24 | Dsm知识产权资产有限公司 | 发酵木糖的真核细胞的代谢工程 |
JP5250850B2 (ja) | 2006-06-29 | 2013-07-31 | ディーエスエム アイピー アセッツ ビー.ブイ. | 改善されたポリペプチド発現を達成する方法 |
MX2009003501A (es) | 2006-10-02 | 2009-04-16 | Dsm Ip Assets Bv | Ingenieria metabolica de celulas eucariotas que fermentan arabinosa. |
CN101595218A (zh) * | 2006-10-31 | 2009-12-02 | 帝斯曼知识产权资产管理有限公司 | 在真核细胞中生产丁醇 |
EP2171038A2 (en) | 2007-07-19 | 2010-04-07 | Royal Nedalco B.V. | Novel arabinose-fermenting eukaryotic cells |
CN101939433B (zh) | 2007-07-23 | 2015-05-20 | 帝斯曼知识产权资产管理有限公司 | 酵母中生产乙酰-CoA的酶 |
FR2927202A1 (fr) | 2008-02-04 | 2009-08-07 | France Telecom | Ponderation en puissance d'un signal multiporteuse a la reception dans un systeme de communication. |
EP2250262B1 (en) | 2008-03-07 | 2015-07-29 | DSM IP Assets B.V. | A pentose sugar fermenting cell |
JP2012506716A (ja) | 2008-10-28 | 2012-03-22 | ウィリアム マーシュ ライス ユニバーシティ | グリセロールを化学物質に変換するための微好気性培養 |
ES2672348T3 (es) | 2008-12-24 | 2018-06-14 | Dsm Ip Assets B.V. | Genes de la isomerasa de xilosa y su uso en la fermentación de azúcares pentosas |
EP2277989A1 (en) * | 2009-07-24 | 2011-01-26 | Technische Universiteit Delft | Fermentative glycerol-free ethanol production |
WO2011149353A1 (en) * | 2010-05-27 | 2011-12-01 | C5 Yeast Company B.V. | Yeast strains engineered to produce ethanol from acetic acid and glycerol |
DK2663645T3 (da) | 2010-11-18 | 2015-03-23 | Dsm Ip Assets Bv | Gærstammer, der er modificeret til produktion af ethanol fra glycerol |
EP2785849B1 (en) | 2011-11-30 | 2017-09-27 | DSM IP Assets B.V. | Yeast strains engineered to produce ethanol from acetic acid and glycerol |
DK2831238T3 (en) | 2012-03-27 | 2018-04-03 | Dsm Ip Assets Bv | CLONING PROCEDURE |
CA2889890C (en) * | 2012-11-09 | 2023-03-28 | Lallemand Hungary Liquidity Management Llc | Method for acetate consumption during ethanolic fermentation of cellulosic feedstocks |
AR097480A1 (es) * | 2013-08-29 | 2016-03-16 | Dsm Ip Assets Bv | Células de levadura convertidoras de glicerol y ácido acético con una conversión de ácido acético mejorada |
-
2014
- 2014-08-27 AR ARP140103222A patent/AR097480A1/es unknown
- 2014-08-29 PL PL14790001T patent/PL3039130T3/pl unknown
- 2014-08-29 WO PCT/EP2014/068324 patent/WO2015028582A2/en active Application Filing
- 2014-08-29 KR KR1020167005191A patent/KR20160046329A/ko not_active Application Discontinuation
- 2014-08-29 MY MYPI2016700306A patent/MY173141A/en unknown
- 2014-08-29 US US14/914,612 patent/US10450588B2/en active Active
- 2014-08-29 CN CN201480047282.9A patent/CN105492599A/zh active Pending
- 2014-08-29 EP EP14790001.3A patent/EP3039130B1/en active Active
- 2014-08-29 BR BR112016004092A patent/BR112016004092A2/pt not_active Application Discontinuation
- 2014-08-29 EP EP18199757.8A patent/EP3467104A3/en active Pending
- 2014-08-29 DK DK14790001.3T patent/DK3039130T3/en active
-
2019
- 2019-07-12 US US16/509,700 patent/US11753659B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
BR112016004092A2 (pt) | 2017-10-17 |
CN105492599A (zh) | 2016-04-13 |
EP3039130A2 (en) | 2016-07-06 |
DK3039130T3 (en) | 2019-04-01 |
WO2015028582A2 (en) | 2015-03-05 |
US20160208291A1 (en) | 2016-07-21 |
AR097480A1 (es) | 2016-03-16 |
PL3039130T3 (pl) | 2019-05-31 |
WO2015028582A3 (en) | 2015-05-21 |
EP3467104A3 (en) | 2019-05-08 |
US20190330664A1 (en) | 2019-10-31 |
MY173141A (en) | 2019-12-31 |
US10450588B2 (en) | 2019-10-22 |
EP3467104A2 (en) | 2019-04-10 |
US11753659B2 (en) | 2023-09-12 |
EP3039130B1 (en) | 2018-12-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20160046329A (ko) | 아세트산 전환이 개선된 글리세롤 및 아세트산 전환 효모 세포 | |
AU2009221104B2 (en) | A pentose sugar fermenting cell | |
EP2367928B1 (en) | Xylose isomerase genes and their use in fermentation of pentose sugars | |
US20150184203A1 (en) | Novel arabinose-fermenting eukaryotic cells | |
WO2009109631A9 (en) | A pentose sugar fermenting cell | |
US20110189728A1 (en) | Pentose sugar fermenting cell | |
EP2739729B1 (en) | A pentose sugar fermenting cell | |
DK2697252T3 (en) | Configurations and methods for increased ethanol production from biomass | |
WO2009109630A1 (en) | A pentose sugar fermenting cell | |
WO2012125027A1 (en) | Yeast strains that ferment uronic acids | |
EP2546336A1 (en) | Yeast strains that consume uronic acids and produce fermentation products such as ethanol | |
EP2554668A1 (en) | A pentose sugar fermenting cell |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
WITN | Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid |