KR20160046329A

KR20160046329A - 아세트산 전환이 개선된 글리세롤 및 아세트산 전환 효모 세포

Info

Publication number: KR20160046329A
Application number: KR1020167005191A
Authority: KR
Inventors: 폴 클라센; 바우터 빌렘 안토니우스 하르트만
Original assignee: 디에스엠 아이피 어셋츠 비.브이.
Priority date: 2013-08-29
Filing date: 2014-08-29
Publication date: 2016-04-28
Also published as: BR112016004092A2; CN105492599A; EP3039130A2; DK3039130T3; WO2015028582A2; US20160208291A1; AR097480A1; PL3039130T3; WO2015028582A3; EP3467104A3; US20190330664A1; MY173141A; US10450588B2; EP3467104A2; US11753659B2; EP3039130B1

Abstract

a) NAD⁺-의존적 아세틸화 아세트알데하이드 데하이드로게나제(dehydrogenase)(E.C. 1.2.1.10)를 암호화하는 하나 이상의 뉴클레오타이드 서열;
b) 아세틸-CoA 신세타제(synthetase)(E.C. 6.2.1.1)를 암호화하는 하나 이상의 뉴클레오타이드 서열;
c) 글리세롤 데하이드로게나제(E.C. 1.1.1.6)를 암호화하는 하나 이상의 뉴클레오타이드 서열; 및
d) 다이하이드록시아세톤 키나제(kinase)(E.C. 2.7.1.28 또는 E.C. 2.7.1.29)를 암호화하는 하나 이상의 뉴클레오타이드 서열
을 포함하는, 유전적으로 변형된 세포.

Description

아세트산 전환이 개선된 글리세롤 및 아세트산 전환 효모 세포{GLYCEROL AND ACETIC ACID CONVERTING YEAST CELLS WITH IMPROVED ACETIC ACID CONVERSION}

본 발명은 미생물, 예컨대, 효모에서의 대사 조작에 관한 것이다. 구체적으로, 본 발명은 아세트산 전환이 개선된 글리세롤 및 아세트산 전환 효모 세포에 관한 것이다. 또한, 본 발명은 효모 세포가 발효 생성물, 예컨대, 에탄올을 생성하는 방법에 관한 것이다.

제2 세대 바이오에탄올은 예를 들면, 에탄올로 발효되기 위해 자유 단량체성 당, 예컨대, 헥소스 및 펜토스로 가수분해되는 식물 바이오매스(biomass)의 리그노셀룰로스성 분획으로부터 생성된다. 바이오매스의 전처리 및 가수분해 동안 당 방출과 별도로, 일부 독성 부산물들이 형성된다. 예를 들면, 푸르푸랄(furfural) 및 HMF는 이 생성물들 중 2종이다. 이들이 형성되는 양은 여러 전처리 파라미터들, 예컨대, 온도, 압력 및 전처리 시간에 의해 좌우된다. 리그노셀룰로스성 가수분해물은 다량의 아세트산도 함유하는데, 이 아세트산은 미생물, 예컨대, 효모의 발효 성능의 강력한 억제제이다.

글리세롤은 에탄올로의 당 발효 동안의 주요 부산물이고, 주로 혐기성 조건 하에서 생합성 동안 형성된 과량의 NADH를 소비하기 위한 재산화 반응의 결과물로서 형성된다(van Dijken and Scheffers, 1986). 그 결과, 산업적 발효 동안 효모 세포에 의해 소비된 당의 약 5% 내지 10%는 글리세롤로 전환된다. 이 폴리올의 양을 낮추는 것은 에탄올 수율을 증가시킬 것으로 기대되는 경로로서 간주된다. 이것은 유가식(fed-batch) 과정 동안 공급률을 조절하거나, 보다 더 적은 글리세롤을 생성하는 균주를 선택함으로써 달성될 수 있었다.

그러나, 문헌에는 가수분해물 중의 당의 발효에 대한 아세트산의 억제 효과를 감소시키는 데에 도움을 줄 수 있을 뿐만 아니라, 예를 들면, 효모의 유전적 조작으로 글리세롤 생성에 관여하는 유전자를 결실시킬 때 환원산화 균형 문제를 (부분적으로) 해결하는 여러 상이한 방법들이 보고되어 있다.

문헌(Sonderegger et al., 2004)은 자일로스(xylose)-발효 사카로마이세스 세레비지애(Saccharomyces cerevisiae) 균주에서의 포스포트랜스아세틸라제(phosphotransacetylase) 및 아세트알데하이드 데하이드로게나제(dehydrogenase)의 이종 발현을 개시하였다. 이로써, 상기 문헌의 저자들(Sonderegger et al.)은 천연 포스포케톨라제(phosphoketolase)와 더불어 상기 특정 균주에서 자일로스 활용을 위해 사용되는 자일로스 리덕타제(reductase) 및 자일리톨 데하이드로게나제의 이종 발현에 의해 생성된 NADH의 순(net) 재산화를 수행할 수 있는 기능성 포스포케톨라제 경로를 생성하였다.

문헌(Guadalupe et al., 2009)에는 부산물인 글리세롤의 생성이 내생성(endogenous) NAD-의존적 글리세롤 3-포스페이트 데하이드로게나제 유전자(GPD1 및 GPD2)의 파괴에 의해 제거되어 있는 사카로마이세스 세레비지애가 기재되어 있다. 아세틸화 NAD-의존적 아세트알데하이드 데하이드로게나제를 암호화하는 에스케리키아 콜라이(Escherichia coli) mhpF 유전자의 발현은 아세트산을 배지에 보충함으로써 혐기성 조건 하에서 생장하는 gpd1gpd2 이중 결실 균주의 능력을 회복시켰다.

문헌(Yu et al., 2010)의 저자들은 (GCY1에 의해 암호화된) 글리세롤 데하이드로게나제, 다이하이드록시아세톤 키나제(kinase)(DAK1) 및 글리세롤 섭취 단백질(GUP1)의 동시적인 과다발현으로 글리세롤로부터의 개선된 에탄올 생성을 위해 대사적으로 조작된 사카로마이세스 세레비지애 균주를 구축하였다. 동일한 연구진에 의한 후속 보고서(Yu et al., 2011)에는 각각 알코올 데하이드로게나제 및 피루베이트 데카복실라제(decarboxylase)를 암호화하는 ADH1 및 PDC1의 추가 과다발현이 발효 조건 하에서 생장률 및 글리세롤 소비의 증가를 야기함으로써 최종 에탄올 수율을 다소 증가시켰다고 기재되어 있다.

문헌(Lee and Dasilva, 2006)은 특히 에스케리키아 콜라이 mgs 및 gldA 유전자의 발현을 도입함으로써 글리세롤로부터 1,2-프로판다이올을 생성하도록 조작된 효모 사카로마이세스 세레비지애를 개시한다.

문헌(Guadelupe et al.)(및 또한 국제 특허출원 공개 제WO 2011/010923호)에 기재된 기술은 바이오매스 당 및 상기 언급된 아세트산을 예를 들면, 에탄올로 발효시키는 동안 가수분해물의 아세트산 함량을 감소시키기 위한 해법을 제공한다.

아세트산을 전환시키는 능력의 추가 향상은 가외의 NADH 생성 경로를 도입함으로써, 예를 들면, 글리세롤 소비 경로를 추가로 (과다)발현시킴으로써 잠재적으로 가능하다. 상기 언급된 GUP1, GCY1 및 DAK1 유전자(Yu et al, 2010)를 (예를 들면, 문헌(Medina et al., 2009)에 기재된 바와 같이) 혐기성 아세트산 전환 경로를 발현하는 효모 균주 내로 도입할 때, 아세트산 전환은 환원산화 균형을 유지하여 가수분해물의 더 증가된 해독 및 보다 더 높은 에탄올 수율을 이끌어내기 위해 증가되어야 한다. 그러나, (GCY1에 의해 암호화된) 효모 글리세롤 데하이드로게나제가 보조인자로서 NADP⁺를 사용함으로써 불충분한 보조인자 재생으로 인한 보조인자 불균형을 초래하기 때문에, 상기 문헌의 저자들(Yu et al.)의 해법은 효과가 없다. 대안적 글리세롤데하이드로게나제(에스케리키아 콜라이로부터의 gldA)가 아세트산 환원 경로와 함께 시험되었고 혐기성 생장(발효) 조건 하에서 아세트산의 전환을 실제로 향상시켰다(국제 특허출원 공개 제WO 2013/081456호).

본 발명의 목적은 헥소스(글루코스, 프럭토스, 갈락토스 등) 및 펜토스, 예컨대, 자일로스를 발효시키는 그들의 능력을 보유하면서 아세트산 또는 아세테이트로부터 에탄올을 생성할 수 있는 효모들뿐만 아니라, 이 균주들이 에탄올 및/또는 다른 발효 생성물의 생성을 위해 사용되는 방법도 제공하는 것이다. 본 발명의 목적은 헥소스(글루코스, 프럭토스, 갈락토스 등) 및 펜토스, 예컨대, 자일로스를 발효시키는 그들의 능력을 보유하면서 글리세롤 및/또는 글리세롤 및 아세트산으로부터 에탄올을 생성할 수 있는 세포들, 예를 들면, 효모 세포들을 제공하는 것이다. 또 다른 목적은 발효 생성물의 생성(수율, 생성률 또는 둘다)을 증가시키는 것이다.

상기 목적들 중 하나 이상은

a) NAD⁺-의존적 아세틸화 아세트알데하이드 데하이드로게나제(E.C. 1.2.1.10)를 암호화하는 하나 이상의 뉴클레오타이드 서열;

b) 동종 또는 이종 아세틸-CoA 신세타제(synthetase)(E.C. 6.2.1.1)를 암호화하는 하나 이상의 뉴클레오타이드 서열;

c) 이종 글리세롤 데하이드로게나제(E.C. 1.1.1.6)를 암호화하는 하나 이상의 뉴클레오타이드 서열; 및

d) 동종 또는 이종 다이하이드록시아세톤 키나제(E.C. 2.7.1.28 또는 E.C. 2.7.1.29)를 암호화하는 하나 이상의 뉴클레오타이드 서열

을 포함하는, 유전적으로 변형된 효모 세포를 제공하는 본 발명에 따라 달성된다.

한 실시양태에서, 세포는 글리세롤 3-포스페이트 포스포하이드롤라제(phosphohydrolase)를 암호화하고/하거나 글리세롤 3-포스페이트 데하이드로게나제 유전자를 암호화하는 하나 이상의 내생성 뉴클레오타이드 서열의 결실 또는 파괴를 가진다.

상기 목적들 중 하나 이상은 본 발명에 따라 달성된다.

본 발명에 따라 개선된 발효 생성물(에탄올) 생성이 달성될 수 있다는 것은 실시예로부터 명확하다.

도 1은 에탄올로의 글리세롤 및 아세트산(아세테이트)의 전환에 관여하는 효소 반응의 개략도이다. 아세테이트는 먼저 효모 효소 Acs(각각 유전자 ACS1 및 ACS2에 의해 암호화된 Acs1 및/또는 Acs2)를 통해 아세틸-CoA로 전환된다. 그 다음, 아세틸-CoA는 mhpF 유전자를 통해 아세트알데하이드로 전환되거나, 에스케리키아 콜라이로부터의 이기능성 adhE 효소(또는 동일한 전환을 촉진하는 유사한 효소)를 통해 에탄올로 직접 전환된다. 외부로부터 첨가된 글리세롤을 전환시키는 글리세롤 소비 경로의 도입 시, 가외의 NADH 유동이 발생된다. 글리세롤의 세포내 생성 및 이 효소들에 의한 NADH의 활용을 피하기 위해 GPD1 및 GPD2 유전자의 결실은 임의적이다.
소비된 당(글루코스 및/또는 다른 당)을 기준으로 한 에탄올 수율은 글리세롤 생성의 제거, 및 배지(및 항상 리그노셀룰로스성 가수분해물)에 존재하는 아세테이트/아세트산 및 외부로부터 배지(또는 가수분해물)에 첨가된 글리세롤로부터의 에탄올 생성으로 인해 증가한다.
도 2는 균주 구축 방법을 개략적으로 표시한다. PCR을 이용하여 선별 마커를 포함하는, INT(삽입) 플랭크(flank) 및 발현 카세트(CAS)를 증폭하고 효모 내로 전달한다. 연결제들(도 1에서 각각 5, a, b, c 및 3으로서 표시됨) 사이에 재조합이 일어남으로써 효모 게놈 내의 원하는 위치(이 경우, INT1)에서 상기 경로가 삽입될 것이다. 관심있는 유전자들의 수는 실시예에 기재된 바와 같이 증가될 수 있다. 별개의 발현 카세트들의 재조합 및 수용자 세포의 게놈 내로의 삽입을 용이하게 하기 위해 유일무이한 연결제들이 사용되었다.
도 3은 스크리닝 결과를 보여준다. 잔류 아세트산 농도가 잔류 아세테이트 농도의 함수로서 작도되어 있다.
도 4는 잔류 아세트산 농도가 잔류 아세테이트 농도의 함수로서 작도되어 있다. 잔류 아세테이트 및 글리세롤 농도뿐만 아니라 글리세롤 및 아세테이트로부터의 에탄올 생성에 근거할 때 가장 우수한 성능을 가진 150개의 균주들은 짙은 회색으로 표시되어 있다.
도 5a 및 5b는 새로 생성된 형질전환체들(R1 내지 R8) 및 기준 균주들(RN1069, RN1189 및 YD01247)의 재스크리닝 결과를 보여준다. 형질전환마다 8개의 독립적인 형질전환체들을 선택하였다. 마찬가지로, 기준 균주들을 8배 접종하였다. 상부 패널에는 72시간의 항온처리 후 잔류 아세트산(아세테이트) 농도가 표시되어 있다. 하부 패널에는 잔류 글리세롤 농도가 작도되어 있다.
도 6은 스크리닝의 결과를 보여준다. 기준 균주 RN1189를 포함하는 총 2592개의 균주들을 스크리닝하였다. 기준 균주 RN1189를 27회 포함시켰다. 다른 균주들(총 2592개)에 비해 기준 균주 RN1189의 성능이 도면 하부에 표시되어 있다. 균주들은 전술된 바와 같이 순위가 매겨져 있는데, 이때 보다 더 우수한 성능의 균주는 보다 더 밝은 색채로 표시되어 있다(그리고 그래프의 하부 좌측 모서리에 더 가깝다). 보다 덜 우수한 성능의 균주는 보다 더 짙은 색채로 표시되어 있고; 색채의 변화는 점진적이다. 예외적으로, 기준 균주 RN1189는 가장 짙은 색채로 표시되어 있다.
도 7은 스크리닝의 결과를 보여준다. 가장 우수한 성능의 균주들 중 상위 5종의 균주들이 여기에 표시되어 있다: 1)은 YD01247을 나타내고, 2)는 YD01248이고, 3)은 YD01249이고, 4)는 YD01250이다. 균주 5는 명명되지 않았고 더 시험되지도 않았다.
서열목록의 간단한 설명
서열번호 1: adhE 에스케리키아 콜라이 이기능성 아세트알데하이드-CoA/알코올 데하이드로게나제(단백질);
서열번호 2: acdH 락토바실러스 플란타룸(Lactobacillus plantarum) 아세트알데하이드 데하이드로게나제(단백질);
서열번호 3: eutE 에스케리키아 콜라이 에탄올아민 활용 단백질(단백질);
서열번호 4: Lin1129 리스테리아 이노쿠아(Listeria innocua) 알데하이드 데하이드로게나제(단백질);
서열번호 5: adhE 스타필로코커스 아우레우스(Staphylococcus aureus) 이기능성 아세트알데하이드-CoA/알코올 데하이드로게나제(단백질);
서열번호 6: ACS2 사카로마이세스 세레비지애 아세틸-CoA 리가제(ligase)(단백질);
서열번호 7: gldA 에스케리키아 콜라이 글리세롤 데하이드로게나제(단백질);
서열번호 8: gldA 클렙시엘라 뉴모니애(Klebsiella pneumoniae) 글리세롤 데하이드로게나제(단백질);
서열번호 9: gldA 엔테로코커스 애로게네스(Enterococcus aerogenes) 글리세롤 데하이드로게나제(단백질);
서열번호 10: gldA 예르시니아 알도배(Yersinia aldovae) 글리세롤 데하이드로게나제(단백질);
서열번호 11: DAK1 사카로마이세스 세레비지애 다이하이드록시아세톤 키나제(단백질);
서열번호 12: dhaK 클렙시엘라 뉴모니애 다이하이드록시아세톤 키나제(단백질);
서열번호 13: DAK1 야로위아 리포라이티카(Yarrowia lipolytica) 다이하이드록시아세톤 키나제(단백질);
서열번호 14: DAK1 쉬조사카로마이세스 폼베(Schizosaccharomyces pombe) 다이하이드록시아세톤 키나제(단백질);
서열번호 15: TDH3-프로모터를 함유하는 단편;
서열번호 16: TDH1-프로모터를 함유하는 단편;
서열번호 17: PGK1-터미네이터를 함유하는 단편;
서열번호 18: PGK1-프로모터를 함유하는 단편;
서열번호 19: PRE3-프로모터를 함유하는 단편;
서열번호 20: PGI1-터미네이터를 함유하는 단편;
서열번호 21: ENO1-프로모터를 함유하는 단편;
서열번호 22: ACT1-프로모터를 함유하는 단편;
서열번호 23: CYC1-터미네이터를 함유하는 단편;
서열번호 24: TPI1-프로모터를 함유하는 단편;
서열번호 25: ATG7-프로모터를 함유하는 단편;
서열번호 26: ENO1-터미네이터를 함유하는 단편;
서열번호 27: kanMX 마커 및 플랭킹 영역의 서열;
서열번호 28: 유전자 파괴 카세트 GPD1::hphMX의 서열;
서열번호 29: 유전자 파괴 카세트 GPD2::natMX의 서열;
서열번호 30: 정방향 프라이머 5' INT1 단편(INT5-f);
서열번호 31: 역방향 프라이머 5' INT1 단편(INT5-r);
서열번호 32: 정방향 프라이머 발현 카세트 1(con5-f);
서열번호 33: 역방향 프라이머 발현 카세트 1(conA-r);
서열번호 34: 정방향 프라이머 마커(conA-f);
서열번호 35: 역방향 프라이머 마커(conB-r);
서열번호 36: 정방향 프라이머 발현 카세트 2(conB-f);
서열번호 37: 역방향 프라이머 발현 카세트 2(conC-r);
서열번호 38: 정방향 프라이머 발현 카세트 3(conC-f);
서열번호 39: 역방향 프라이머 발현 카세트 3(conD-r);
서열번호 40: 정방향 프라이머 발현 카세트 4(conD-f);
서열번호 41: 역방향 프라이머 발현 카세트 4(con3-r);
서열번호 42: 정방향 프라이머 3' INT1 단편(INT3-f);
서열번호 43: 역방향 프라이머 3' INT1 단편(INT3-r);
서열번호 44: 플라스미드 p5Abbn의 서열;
서열번호 45: 플라스미드 pBCbbn의 서열;
서열번호 46: 플라스미드 pCDbbn의 서열;
서열번호 47: 플라스미드 pD3bbn의 서열;
서열번호 48: 사카로마이세스 세레비지애에서의 발현을 위해 최적화된 adhE(에스케리키아 콜라이) DNA 서열 코돈-쌍을 함유하는 서열;
서열번호 49: 사카로마이세스 세레비지애에서의 발현을 위해 최적화된 acdH(락토바실러스 플란타룸) DNA 서열 코돈-쌍을 함유하는 서열;
서열번호 50: 사카로마이세스 세레비지애에서의 발현을 위해 최적화된 eutE(에스케리키아 콜라이) DNA 서열 코돈-쌍을 함유하는 서열;
서열번호 51: 사카로마이세스 세레비지애에서의 발현을 위해 최적화된 Lin1129(리스테리아 이노쿠아) DNA 서열 코돈-쌍을 함유하는 서열;
서열번호 52: 사카로마이세스 세레비지애에서의 발현을 위해 최적화된 adhE(스타필로코커스 아우레우스) DNA 서열 코돈-쌍을 함유하는 서열;
서열번호 53: 사카로마이세스 세레비지애에서의 발현을 위해 최적화된 ACS2(사카로마이세스 세레비지애) DNA 서열 코돈-쌍을 함유하는 서열;
서열번호 54: 사카로마이세스 세레비지애에서의 발현을 위해 최적화된 gldA(에스케리키아 콜라이) DNA 서열 코돈-쌍을 함유하는 서열;
서열번호 55: 사카로마이세스 세레비지애에서의 발현을 위해 최적화된 gldA(클렙시엘라 뉴모니애) DNA 서열 코돈-쌍을 함유하는 서열;
서열번호 56: 사카로마이세스 세레비지애에서의 발현을 위해 최적화된 gldA(엔테로코커스 애로게네스) DNA 서열 코돈-쌍을 함유하는 서열;
서열번호 57: 사카로마이세스 세레비지애에서의 발현을 위해 최적화된 gldA(예르시니아 알도배) DNA 서열 코돈-쌍을 함유하는 서열;
서열번호 58: 사카로마이세스 세레비지애서의 발현을 위해 최적화된 DAK1(사카로마이세스 세레비지애) DNA 서열 코돈-쌍을 함유하는 서열;
서열번호 59: 사카로마이세스 세레비지애에서의 발현을 위해 최적화된 dhaK(클렙시엘라 뉴모니애) DNA 서열 코돈-쌍을 함유하는 서열;
서열번호 60: 사카로마이세스 세레비지애에서의 발현을 위해 최적화된 DAK1(야로위아 리포라이티카) DNA 서열 코돈-쌍을 함유하는 서열;
서열번호 61: 사카로마이세스 세레비지애에서의 발현을 위해 최적화된 DAK1(쉬조사카로마이세스 폼베) DNA 서열 코돈-쌍을 함유하는 서열.

사카로마이세스 세레비지애는 혐기성 조건 하에서 당, 예컨대, 글루코스로부터 에탄올을 생성한다. 이 과정은 환원산화-중성 과정이다. 그러나, 효모가 생장할 때, 과량의 NADH가 생성된다. 환원산화 균형을 회복하기 위해, 효모는 글리세롤을 생성할 것이다. 이 과정 동안, NADH는 NAD⁺로 다시 전환된다. 에탄올 산업은 글리세롤을 원치 않는 부산물로서 간주한다. 혐기성 조건 하에서의 글리세롤 형성의 누락은 에탄올 산업에서 오랫동안 추구되고 있는 희망사항이다. 전술된 바와 같이, 탄소 유동을 글리세롤 형성으로부터 에탄올 쪽으로 다시 향하게 하여 에탄올 수율을 증가시키기 위한 몇 차례 시도들이 여러 상이한 연구진들에 의해 이루어 졌다.

글리세롤 형성을 방지하기 위한 가장 직접적인 조치는 글리세롤의 생합성에 관여하는 단백질을 암호화하는 유전자를 결실시키는 것일 것이다. 그러나, GPD1 및 GPD2 유전자가 파괴되어 있을 때, 효모는 그의 환원산화 균형을 회복할 수 없기 때문에 혐기성 조건 하에서 생장할 수 없다. 문헌(Medina et al., 2009)은 NADH-의존적 아세틸-CoA 데하이드로게나제 유전자(예컨대, 상기 문헌(Medina et al.)에 기재된 에스케리키아 콜라이 mhpF 유전자)의 도입 시, 아세트산이 발효 배지 내로 공급되는 한, 혐기성 조건 하에서 생장하는 gpd1gpd2 이중 결실 균주의 능력이 회복된다는 것을 입증하였다. 아세트산은 ACS1/ACS2 유전자 생성물을 통해 아세틸-CoA로 전환된다. 아세틸-CoA는 아세트알데하이드로 전환된 후, mhpF 및 ADH1 유전자 생성물을 통해 에탄올로 전환된다(Medina et al., 2009). 이 방식으로, 원치 않는 부산물(글리세롤)의 형성이 제거됨으로써 에탄올 수율이 증가된다.

아세트산은 종종 가수분해물, 특히 아세트산의 pKa(pKa HAc 약 4.76)에 가깝거나 이 pKa보다 더 낮은 pH를 가진 가수분해물에 존재하는 가장 독한 화합물인 것으로 간주되기 때문에, 가수분해물에서 아세테이트(아세트산) 농도를 더 감소시키는 것이 요구된다. 효모의 혐기성 아세테이트 전환력을 증가시키는 한 방법은 글리세롤 전환 경로를 도입하는 것이다. gpd1gpd2 세포가 스스로 글리세롤을 생성하지 않기 때문에, 외부로부터 첨가된 글리세롤을 전환시키는 글리세롤 경로의 도입에 의해 훨씬 더 많은 NADH가 생성됨으로써, 효모 세포가 환원산화 균형을 유지하기 위해 보다 더 많은 아세트산을 전환시키게 한다(도 1 및 국제 특허출원 공개 제WO 2013/081456호 참조).

글리세롤은 바이오정련(biorefineries)에서 충분히 많은 양으로 사용될 수 있다. 이를 목적으로, 에탄올로의 독성 아세트산의 전환을 더 증가시키기 위해 에스케리키아 콜라이로부터의 유전자 gldA 및 사카로마이세스 세레비지애로부터의 DAK1을 과다발현시켰다(국제 특허출원 공개 제WO 2013/081456호). 실제로, 보다 더 높은 에탄올 수율이 수득되었다.

속도 및 양 둘다의 관점에서 글리세롤 및 아세트산의 혐기성 (공-)전환을 훨씬 더 개선하기 위해, 대안적 유전자 조합물을 시험하였다. 경로 내의 다수의 효소들, 즉 글리세롤 데하이드로게나제, 다이하이드록시아세톤 키나제 및 아세트알데하이드 데하이드로게나제에 대해, 혐기성 조건 하에서 글리세롤 및 아세트산을 펜토스 및 헥소스 당 다음에 에탄올로 전환시키는 효모 균주의 능력을 더 향상시킬 수 있는 다수의 대안적 유전자들을 시험하였다.

따라서, 본 발명은

b) 아세틸-CoA 신세타제(E.C. 6.2.1.1)를 암호화하는 하나 이상의 뉴클레오타이드 서열;

c) 글리세롤 데하이드로게나제(E.C. 1.1.1.6)를 암호화하는 하나 이상의 뉴클레오타이드 서열; 및

d) 다이하이드록시아세톤 키나제(E.C. 2.7.1.28 또는 E.C. 2.7.1.29)를 암호화하는 하나 이상의 뉴클레오타이드 서열

을 포함하는, 유전적으로 변형된 효모 세포를 제공한다.

본 발명의 실시양태들은 이하에 기재되어 있다. 하기 항들은 특히 상기 특징들 a) 내지 d)가 상세히 기재되어 있는 본 발명의 여러 실시양태들을 기술한다.

제1항:

을 포함하는, 유전적으로 변형된 세포.

제1a항:

a) 이종 NAD⁺-의존적 아세틸화 아세트알데하이드 데하이드로게나제(E.C. 1.2.1.10)를 암호화하는 하나 이상의 뉴클레오타이드 서열;

b) 동종 또는 이종 아세틸-CoA 신세타제(E.C. 6.2.1.1)를 암호화하는 하나 이상의 뉴클레오타이드 서열;

을 포함하는, 유전적으로 변형된 세포.

제2항:

제1항에 있어서,

글리세롤 3-포스페이트 포스포하이드롤라제(GPP1, GPP2)를 암호화하고/하거나 글리세롤 3-포스페이트 데하이드로게나제 유전자(GPD1, GPD2)를 암호화하는 하나 이상의 내생성 뉴클레오타이드 서열의 결실 또는 파괴를 포함하는 세포.

제3항:

제1항 또는 제2항에 있어서,

b)가 서열번호 6, 또는 서열번호 6과 60% 이상의 서열 동일성을 가진 서열번호 6의 기능성 상동체(homologue)로 표시되는 동종 또는 이종 아세틸-CoA 신세타제(E.C. 6.2.1.1)를 암호화하는 하나 이상의 이종 뉴클레오타이드 서열인, 세포.

제4항:

제3항에 있어서,

c)가 서열번호 7, 또는 서열번호 7과 60% 이상의 서열 동일성을 가진 서열번호 7의 기능성 상동체로 표시되는 이종 글리세롤 데하이드로게나제(E.C. 1.1.1.6)를 암호화하는 하나 이상의 뉴클레오타이드 서열; 및/또는 서열번호 9, 또는 서열번호 9와 60% 이상의 서열 동일성을 가진 서열번호 9의 기능성 상동체로 표시되는 이종 글리세롤 데하이드로게나제(E.C. 1.1.1.6)를 암호화하는 하나 이상의 뉴클레오타이드 서열인, 세포.

제5항:

제4항에 있어서,

c)가 서열번호 7, 또는 서열번호 7과 60% 이상의 서열 동일성을 가진 서열번호 7의 기능성 상동체로 표시되는 이종 글리세롤 데하이드로게나제(E.C. 1.1.1.6)를 암호화하는 하나 이상의 뉴클레오타이드 서열인, 세포.

제6항:

제1항 내지 제5항 중 어느 한 항에 있어서,

d)가 서열번호 11, 또는 서열번호 11과 60% 이상의 서열 동일성을 가진 서열번호 11의 기능성 상동체로 표시되는 동종 또는 이종 다이하이드록시아세톤 키나제(E.C. 2.7.1.28 또는 E.C. 2.7.1.29)를 암호화하는 하나 이상의 뉴클레오타이드 서열; 및/또는 서열번호 13, 또는 서열번호 13과 60% 이상의 서열 동일성을 가진 서열번호 13의 기능성 상동체로 표시되는 동종 또는 이종 다이하이드록시아세톤 키나제(E.C. 2.7.1.28 또는 E.C. 2.7.1.29)를 암호화하는 하나 이상의 뉴클레오타이드 서열인, 세포.

제7항:

제6항에 있어서,

d)가 서열번호 13, 또는 서열번호 13과 60% 이상의 서열 동일성을 가진 서열번호 13의 기능성 상동체로 표시되는 동종 또는 이종 다이하이드록시아세톤 키나제(E.C. 2.7.1.28 또는 E.C. 2.7.1.29)를 암호화하는 하나 이상의 뉴클레오타이드 서열인, 세포.

제8항:

제1항 내지 제7항 중 어느 한 항에 있어서,

a)가 서열번호 1, 또는 서열번호 1과 60% 이상의 서열 동일성을 가진 서열번호 1의 기능성 상동체로 표시되는 이종 NAD⁺-의존적 아세틸화 아세트알데하이드 데하이드로게나제를 암호화하는 하나 이상의 뉴클레오타이드 서열; 및/또는 서열번호 2, 또는 서열번호 2와 60% 이상의 서열 동일성을 가진 서열번호 2의 기능성 상동체로 표시되는 이종 NAD⁺-의존적 아세틸화 아세트알데하이드 데하이드로게나제를 암호화하는 하나 이상의 뉴클레오타이드 서열; 및/또는 서열번호 3, 또는 서열번호 3과 60% 이상의 서열 동일성을 가진 서열번호 3의 기능성 상동체로 표시되는 이종 NAD⁺-의존적 아세틸화 아세트알데하이드 데하이드로게나제를 암호화하는 하나 이상의 뉴클레오타이드 서열인, 세포.

제9항:

제8항에 있어서,

a)가 서열번호 1, 또는 서열번호 1과 60% 이상의 서열 동일성을 가진 서열번호 1의 기능성 상동체로 표시되는 이종 NAD⁺-의존적 아세틸화 아세트알데하이드 데하이드로게나제(E.C. 1.2.1.10)를 암호화하는 하나 이상의 뉴클레오타이드 서열; 및/또는 서열번호 2, 또는 서열번호 2와 60% 이상의 서열 동일성을 가진 서열번호 2의 기능성 상동체로 표시되는 이종 NAD⁺-의존적 아세틸화 아세트알데하이드 데하이드로게나제(E.C. 1.2.1.10)를 암호화하는 하나 이상의 뉴클레오타이드 서열인, 세포.

제10항:

제9항에 있어서,

a)가 서열번호 2, 또는 서열번호 2와 60% 이상의 서열 동일성을 가진 서열번호 2의 기능성 상동체로 표시되는 이종 NAD⁺-의존적 아세틸화 아세트알데하이드 데하이드로게나제를 암호화하는 하나 이상의 뉴클레오타이드 서열인, 세포.

제11항:

제1항 내지 제10항 중 어느 한 항에 있어서,

a)가 서열번호 3, 또는 서열번호 3과 60% 이상의 서열 동일성을 가진 서열번호 3의 기능성 상동체로 표시되는 이종 NAD⁺-의존적 아세틸화 아세트알데하이드 데하이드로게나제(E.C. 1.2.1.10)를 암호화하는 하나 이상의 뉴클레오타이드 서열이고;

b)가 서열번호 6, 또는 서열번호 6과 60% 이상의 서열 동일성을 가진 서열번호 6의 기능성 상동체로 표시되는 동종 또는 이종 아세틸-CoA 신세타제(E.C. 6.2.1.1)를 암호화하는 하나 이상의 뉴클레오타이드 서열이고;

c)가 서열번호 7, 또는 서열번호 7과 60% 이상의 서열 동일성을 가진 서열번호 7의 기능성 상동체로 표시되는 이종 글리세롤 데하이드로게나제(E.C. 1.1.1.6)를 암호화하는 하나 이상의 뉴클레오타이드 서열이고;

d)가 서열번호 11, 또는 서열번호 11과 60% 이상의 서열 동일성을 가진 서열번호 11의 기능성 상동체로 표시되는 동종 또는 이종 다이하이드록시아세톤 키나제(E.C. 2.7.1.28 또는 E.C. 2.7.1.29)를 암호화하는 하나 이상의 뉴클레오타이드 서열인, 세포.

제12항:

제1항 내지 제10항 중 어느 한 항에 있어서,

a)가 서열번호 2, 또는 서열번호 2와 60% 이상의 서열 동일성을 가진 서열번호 2의 기능성 상동체로 표시되는 이종 NAD⁺-의존적 아세틸화 아세트알데하이드 데하이드로게나제(E.C. 1.2.1.10)를 암호화하는 하나 이상의 뉴클레오타이드 서열이고;

c)가 서열번호 9, 또는 서열번호 9와 60% 이상의 서열 동일성을 가진 서열번호 9의 기능성 상동체로 표시되는 이종 글리세롤 3-포스페이트 데하이드로게나제(E.C. 1.1.1.8)를 암호화하는 하나 이상의 뉴클레오타이드 서열이고;

제13항:

제1항 내지 제10항 중 어느 한 항에 있어서,

c)가 서열번호 7, 또는 서열번호 7과 60% 이상의 서열 동일성을 가진 서열번호 7의 기능성 상동체로 표시되는 이종 글리세롤 3-포스페이트 데하이드로게나제(E.C. 1.1.1.8)를 암호화하는 하나 이상의 뉴클레오타이드 서열이고;

제14항:

제1항 내지 제10항 중 어느 한 항에 있어서,

a)가 서열번호 1, 또는 서열번호 1과 60% 이상의 서열 동일성을 가진 서열번호 1의 기능성 상동체로 표시되는 이종 NAD⁺-의존적 아세틸화 아세트알데하이드 데하이드로게나제(E.C. 1.2.1.10)를 암호화하는 하나 이상의 뉴클레오타이드 서열이고;

본 발명에 따른 세포는 숙주 세포의 변형, 예를 들면, 폴리뉴클레오타이드, 예를 들면, 상기 특징 a) 내지 d)에 상응하는 뉴클레오타이드의 도입 및/또는 단백질의 발현에 의해 제조될 수 있다.

상기 폴리뉴클레오타이드 또는 단백질은 숙주 세포의 게놈에 대한 동종성 또는 이종성을 가질 수 있다. 숙주 세포에 대한 용어 "이종"은 폴리뉴클레오타이드가 숙주 세포의 게놈에 천연적으로 존재하지 않거나 폴리펩타이드가 그 세포에 의해 천연적으로 생성되지 않는다는 것을 의미한다. 숙주 세포에 대한 용어 "동종"은 폴리뉴클레오타이드가 숙주 세포의 게놈에 천연적으로 존재하거나 폴리펩타이드가 그 세포에 의해 천연적으로 생성된다는 것을 의미한다. 동종 단백질 발현은 예를 들면, 상이한 프로모터의 조절 하에서의 과다발현 또는 발현일 수 있다. 이종 단백질 발현은 숙주 세포에서 천연적으로 생성되지 않는 단백질의 발현을 포함한다.

본 발명에 따른 세포는 도 1에 예시되어 있다. 도 1은 에탄올로의 글리세롤 및 아세트산(아세테이트)의 전환에 관여하는 효소 반응들의 개략도를 제공한다. 아세테이트는 먼저 효모 효소 Acs(각각 유전자 ACS1 및 ACS2에 의해 암호화된 Acs1 및/또는 Acs2)를 통해 아세틸-CoA로 전환된다. 그 다음, 아세틸-CoA는 mhpF 유전자를 통해 아세트알데하이드로 전환되거나, 에스케리키아 콜라이로부터의 이기능성 adhE 효소(또는 동일한 전환을 촉진하는 유사한 효소)를 통해 에탄올로 직접 전환된다. 외부로부터 첨가된 글리세롤을 전환시키는 글리세롤 소비 경로의 도입 시, 가외의 NADH 유동이 생성된다. 도 1 및 제2항에 표시되어 있는 바와 같이, GPD1 및 GPD2 유전자는 글리세롤의 세포내 생성 및 이 효소들에 의한 NADH의 활용을 피하기 위해 결실될 수 있다.

소비된 당(글루코스 또는 다른 당)을 기준으로 한 에탄올 수율은 글리세롤 생성의 제거, 및 배지(및 항상 리그노셀룰로스성 가수분해물)에 존재하는 아세테이트/아세트산 및 외부로부터 배지(또는 가수분해물)에 첨가된 글리세롤로부터의 에탄올 생성으로 인해 증가한다.

본 명세서 및 첨부된 청구범위 전체에서 용어 "포함한다" 및 "포괄한다", 및 어미변화, 예컨대, "포함하고", "포함하는", "포괄하고" 및 "포괄하는"은 포괄적으로 해석되어야 한다. 즉, 이 용어들은 문맥이 허용하는 경우 구체적으로 언급되지 않은 다른 요소 또는 정수의 가능한 포함을 전달하기 위한 것이다. 단수형 용어는 본원에서 그 단수형 용어의 하나 이상(즉, 하나 또는 적어도 하나)의 문법적 목적어를 지칭하기 위해 사용된다. 예를 들면, "한 요소"는 하나의 요소 또는 하나 초과의 요소를 지칭할 수 있다.

"기능성 폴리펩타이드"는 본원에서 "폴리펩타이드 기능" 또는 "폴리펩타이드"로서도 표기된다. "기능성 폴리펩타이드 폴리뉴클레오타이드"는 본원에서 "기능성 폴리펩타이드"를 암호화하는 폴리뉴클레오타이드이다. 또한, 본 발명은 이러한 폴리펩타이드를 암호화하는 폴리뉴클레오타이드; 상기 폴리펩타이드를 암호화하는 폴리뉴클레오타이드를 포함하는 핵산 구축물; 및 (효모) 세포에서 이종 폴리펩타이드의 기능적 발현을 위한 벡터로서, 상기 세포에서 작용하는 프로모터에 작동가능하게 연결되어 있고 상기 세포(의 세포질)에서 "기능적" 효소 활성을 가진 폴리펩타이드를 암호화하는 이종 핵산 서열을 포함하는 발현 벡터에 관한 것이다. 본원에서 "기능성" 폴리펩타이드는 "기능적" 활성 이외의 하나 이상의 대안적 및/또는 추가적 활성을 가질 수 있다.

본원에서 언급된 E.C. 코드는 "기능"을 명확히 하기 위해 사용될 뿐, 결코 "기능"을 한정하는 것으로서 간주되어서는 안 된다.

본원에서 효소를 암호화하는 임의의 외생성(exogenous) 유전자는 임의의 서열번호 X와 50%, 60%, 65%, 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 또는 100%의 아미노산 서열 동일성을 가진 아미노산 서열을 암호화하는 뉴클레오타이드 서열을 포함하는데, 이때 서열번호 X는 본원의 서열목록 내의 단백질 서열들, 특히 서열번호 1 내지 서열번호 14 중 임의의 단백질 서열이다. 효소를 암호화하는 외생성 유전자는 임의의 서열번호 X, 특히 서열번호 1 내지 서열번호 14 중 임의의 서열번호의 아미노산 서열에 비해 1개 또는 여러 개의 치환, 삽입 및/또는 결실을 가진 아미노산 서열을 암호화하는 뉴클레오타이드 서열을 포함할 수도 있다. 바람직하게는, 아미노산 서열은 서열번호 X, 특히 서열번호 1 내지 서열번호 14에 비해 420개, 380개, 300개, 250개, 200개, 150개, 100개, 75개, 50개, 40개, 30개, 20개, 10개, 9개, 8개, 7개, 6개, 5개, 4개, 3개, 2개 또는 1개 이하의 아미노산 치환, 삽입 및/또는 결실을 가진다.

본원에서 효소를 암호화하는 임의의 외생성 유전자는 임의의 서열번호 Y와 40%, 50%, 60%, 65%, 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 95%, 96%, 97%, 98%, 99% 이상 또는 100%의 뉴클레오타이드(DNA) 서열 동일성을 가진 뉴클레오타이드 서열을 포함하는데, 이때 서열번호 Y는 본원의 서열목록 내의 뉴클레오타이드(DNA) 서열들, 특히 서열번호 48 내지 서열번호 61 중 임의의 서열이다.

제1항의 특징 a) 내지 d)는 지금부터 이하에 보다 더 상세히 기재될 것이다.

특징 a): NAD⁺-의존적 아세틸화 아세트알데하이드 데하이드로게나제를 암호화하는 하나 이상의 뉴클레오타이드 서열:

본 발명의 세포는 아세틸-CoA를 아세트알데하이드로 환원시키는 능력을 가진 효소를 암호화하는 외생성 유전자를 포함하는데, 이 유전자는 아세틸-CoA(및/또는 아세트산)를 에탄올로 전환시키는 능력을 세포에게 부여한다. 아세틸-CoA를 아세트알데하이드로 환원시키는 능력을 가진 효소는 본원에서 하기 반응들을 촉진하는 이기능성 효소로서 이해된다(adhE):

아세트알데하이드 + NADH ↔ 에탄올 + NAD ⁺ (1)

및/또는

NAD ⁺ + 보조효소 A + 아세트알데하이드 ↔ NADH + 아세틸- CoA (2)

따라서, 상기 효소는 에탄올로의 아세트알데하이드의 전환(및 아세트알데하이드로의 에탄올의 전환)을 촉진하고 아세트알데하이드 데하이드로게나제(NAD⁺-의존적)로서도 지칭된다. 상기 효소는 아세틸-CoA로의 보조효소 A 및 아세트알데하이드의 전환(및 보조효소 A 및 아세트알데하이드로의 아세틸-CoA의 전환)도 촉진하고 아세트알데하이드 데하이드로게나제로서도 지칭되는 이기능성 효소이다. 이 효소는 아세틸-보조효소 A가 생장 배지에 존재하는 아세테이트로부터 생성될 때 NADH의 재산화를 허용하고, 이로써 글리세롤 합성이 환원산화 보조인자 균형을 위해 더 이상 요구되지 않는다. NADH-의존적 아세틸화 아세트알데하이드 데하이드로게나제(E.C. 1.2.1.10)를 암호화하는 핵산 서열은 원칙적으로 상기 데하이드로게나제를 암호화하는 핵산 서열을 포함하는 임의의 유기체로부터 유래할 수 있다.

아세트알데하이드로의 아세틸-보조효소 A의 NADH-의존적 환원을 촉진할 수 있는 공지된 NAD⁺-의존적 아세틸화 아세트알데하이드 데하이드로게나제는 일반적으로 3종의 NADH-의존적 아세틸화 아세트알데하이드 데하이드로게나제 기능성 상동체들로 나누어질 수 있다:

1) 아세트알데하이드로의 아세틸-보조효소 A의 가역적 전환 및 에탄올로의 아세트알데하이드의 후속 가역적 전환을 촉진하는 이기능성 단백질. 이러한 종류의 단백질의 일례는 에스케리키아 콜라이 내의 AdhE 단백질(진뱅크 번호: NP-415757)이다. AdhE는 유전자 융합의 진화적 생성물인 듯하다. AdhE 단백질의 NH₂-말단 영역은 알데하이드:NADH 옥시도리덕타제(oxidoreductases)와 고도의 상동성을 가지는 반면, COOH-말단 영역은 Fe² ⁺-의존적 에탄올:NADH 옥시도리덕타제의 패밀리와 상동성을 가진다(Membrillo-Hernandez et al., (2000) J. Biol. Chem. 275: 33869-33875). 에스케리키아 콜라이 AdhE는 금속 촉매에 의해 산화되므로 산소에 민감하다(Tamarit et al. (1998) J. Biol. Chem. 273:3027-32).

2) 엄격 또는 임의 혐기성 미생물에서 아세트알데하이드로의 아세틸-보조효소 A의 가역적 전환을 촉진하되 알코올 데하이드로게나제 활성을 보유하지 않는 단백질. 이러한 종류의 단백질의 일례는 클로스트리듐 클루이베리(Clostridium kluyveri)에서 보고되어 있다(Smith et al. (1980) Arch. Biochem. Biophys. 203: 663-675). 아세틸화 아세트알데하이드 데하이드로게나제는 클로스트리듐 클루이베리 DSM 555(진뱅크 번호: EDK33116)의 게놈에서 해독되어 있다. 상동성 단백질 AcdH는 락토바실러스 플란타룸(진뱅크 번호: NP-784141)의 게놈에서 확인되어 있다. 이러한 종류의 단백질의 또 다른 예는 클로스트리듐 베이제린키이(Clostridium beijerinckii) NRRL B593(Toth et al. (1999) Appl. Environ. Microbiol. 65: 4973-4980, 진뱅크 번호: AAD31841)에서의 상기 유전자 생성물이다.

3) 4-하이드록시-2-케토발레레이트 이화작용에 관여하는 이기능성 알돌라제(aldolase)-데하이드로게나제 복합체의 일부인 단백질. 이러한 이기능성 효소는 많은 세균 종들에서의 페놀, 톨루에이트, 나프탈렌, 바이페닐 및 다른 방향족 화합물들의 분해에서의 중간체인 카테콜의 메타-절단 경로의 최종 2개 단계들을 촉진한다(Powlowski and Shingler (1994) Biodegradation 5, 219-236). 4-하이드록시-2-케토발레레이트는 먼저 4-하이드록시-2-케토발레레이트 알돌라제에 의해 피루베이트 및 아세트알데하이드로 전환되고, 그 후 아세트알데하이드는 아세트알데하이드 데하이드로게나제에 의해 아세틸-CoA로 전환된다. 이러한 종류의 아세틸화 아세트알데하이드 데하이드로게나제의 일례는 슈도모나스(Pseudomonas) 종 CF600(진뱅크 번호: CAA43226)에서의 DmpF 단백질이다(Shingler et al. (1992) J. Bacteriol. 174:71 1-24). 에스케리키아 콜라이 MphF 단백질(Ferrandez et al. (1997) J. Bacteriol. 179: 2573- 2581, 진뱅크 번호: NP-414885)은 슈도모나스 종 CF600에서의 DmpF 단백질과 상동성을 가진다.

적합한 핵산 서열은 특히 에스케리키아, 특히 에스케리키아 콜라이; 마이코박테리움(Mycobacterium), 특히 마이코박테리움 마리눔(Mycobacterium marinum), 마이코박테리움 울세란스(Mycobacterium ulcerans), 마이코박테리움 튜버큘로시스(Mycobacterium tuberculosis); 카복시도써머스(Carboxydothermus), 특히 카복시도써머스 하이드로게노포르만스(Carboxydothermus hydrogenoformans); 엔타모에바(Entamoeba), 특히 엔타모에바 히스톨라이티카(Entamoeba histolytica); 시겔라(Shigella), 특히 시겔라 손네이(Shigella sonnei); 부르크홀데리아(Burkholderia), 특히 부르크홀데리아 슈도말레이(Burkholderia pseudomallei); 클렙시엘라(Klebsiella), 특히 클렙시엘라 뉴모니애(Klebsiella pneumoniae); 아조토박터(Azotobacter), 특히 아조토박터 우이넬란디이(Azotobacter uinelandii); 아조아르커스(Azoarcus) 종; 쿠프리아우이더스(Cupriauidus), 특히 쿠프리아우이더스 타이와넨시스(Cupriauidus taiwanensis); 슈도모나스, 특히 슈도모나스 종 CF600; 및 펠로마쿨룸(Pelomaculum), 특히 펠로토마쿨룸 써모프로피오니쿰(Pelotomaculum thermopropionicum)으로 구성된 군으로부터 선택된 유기체에서 발견될 수 있다. 바람직하게는, NADH-의존적 아세틸화 아세트알데하이드 데하이드로게나제를 암호화하는 핵산 서열은 에스케리키아, 보다 바람직하게는 에스케리키아 콜라이로부터 유래한다.

에스케리키아 콜라이로부터의 mhpF 유전자 또는 이의 기능성 상동체가 특히 적합하다. 이 유전자는 문헌(Ferrandez et al. (1997) J. Bacteriol. 179:2573-2581)에 기재되어 있다. 우수한 결과는 에스케리키아 콜라이로부터의 mhpF 유전자가 도입되어 있는 사카로마이세스 세레비지애를 사용하였을 때 수득되었다.

추가 유리한 실시양태에서, (아세틸화) 아세트알데하이드 데하이드로게나제를 암호화하는 핵산 서열은 특히, 슈도모나스 종 CF600으로부터의 슈도모나스 dmpF로부터 유래한다.

원칙적으로, NAD⁺-의존적 아세틸화 아세트알데하이드 데하이드로게나제를 암호화하는 핵산 서열은 야생형 핵산 서열일 수 있다. 바람직한 핵산 서열은 국제 특허출원 공개 제WO 2011/010923호의 서열번호 2 또는 서열번호 29, 또는 국제 특허출원 공개 제WO 2011/010923호의 서열번호 2 또는 서열번호 29의 기능성 상동체로 표시되는 NAD⁺-의존적 아세틸화 아세트알데하이드 데하이드로게나제를 암호화한다. 특히, 핵산 서열은 국제 특허출원 공개 제WO 2011/010923호의 서열번호 1 또는 서열번호 28, 또는 국제 특허출원 공개 제WO 2011/010923호의 서열번호 1 또는 서열번호 28의 기능성 상동체에 따른 서열을 포함한다.

추가로, 아세틸화 아세트알데하이드 데하이드로게나제(또는 이러한 활성을 암호화하는 핵산 서열)는 예를 들면, 에스케리키아 콜라이 adhE, 엔타모에바 히스톨라이티카 adh2, 스타필로코커스 아우레우스 adhE, 피로마이세스(Piromyces) 종.E2 adhE, 클로스트리듐 클루이베리 EDK33116, 락토바실러스 플란타룸 acdH 및 슈도모나스 푸티다(Pseudomonas putida) YP 001268189로 구성된 군으로부터 선택될 수 있다. 이 효소들의 서열, 이 효소들을 암호화하는 핵산 서열, 및 이 핵산 서열을 숙주 세포 내로 도입하는 방법에 대해서는 국제 특허출원 공개 제WO 2009/1013159호, 특히 실시예 3, 표 1(제26면) 및 이 표에서 언급된 서열번호(상기 공개공보의 표 1 및 상기 표에서 언급된 서열번호로 표시된 서열은 본원에 참고로 도입됨)를 참조한다.

바람직한 실시양태에서, 세포가 아세트알데하이드 데하이드로게나제 활성을 구비한 세포로 하여금 에탄올로의 아세틸-CoA의 전환을 완결할 수 있게 하는 내생성 알코올 데하이드로게나제 활성을 가진다는 것도 이해된다. 숙주 세포가 아세트알데하이드 데하이드로게나제 활성을 구비한 세포로 하여금 (아세틸-CoA를 통한) 에탄올로의 아세트산의 전환을 완결할 수 있게 하는 내생성 아세틸-CoA 신세타제를 가지는 것도 바람직하다.

아세트알데하이드 데하이드로게나제 활성을 가진 효소를 암호화하는 외생성 유전자는 바람직하게는 서열번호 1 내지 서열번호 5, 바람직하게는 서열번호 1 내지 서열번호 3 중 임의의 서열번호, 보다 바람직하게는 서열번호 1 또는 서열번호 2와 40%, 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 99% 이상의 아미노산 서열 동일성을 가진 아미노산 서열을 암호화하는 뉴클레오타이드 서열을 포함한다. 아세트알데하이드 데하이드로게나제 활성을 가진 효소를 암호화하는 외생성 유전자는 서열번호 1 내지 서열번호 5, 바람직하게는 서열번호 1 내지 서열번호 3 중 임의의 서열번호, 보다 바람직하게는 서열번호 1 또는 서열번호 2의 아미노산 서열에 비해 1개 또는 여러 개의 치환, 삽입 및/또는 결실을 가진 아미노산 서열을 암호화하는 뉴클레오타이드 서열을 포함할 수도 수 있다. 바람직하게는, 아미노산 서열은 각각 서열번호 1 내지 서열번호 5, 바람직하게는 각각 서열번호 1 내지 서열번호 3, 보다 바람직하게는 각각 서열번호 1 또는 서열번호 2에 비해 420개, 380개, 300개, 250개, 200개, 150개, 100개, 75개, 50개, 40개, 30개, 20개, 10개 또는 5개 이하의 아미노산 치환, 삽입 및/또는 결실을 가진다.

본원에서 아세트알데하이드 데하이드로게나제를 가진 효소를 암호화하는 외생성 유전자는 임의의 서열번호 Y와 40%, 50%, 60%, 65%, 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 95%, 96%, 97%, 98%, 99% 이상 또는 100%의 뉴클레오타이드(DNA) 서열 동일성을 가진 뉴클레오타이드 서열을 포함하는데, 이때 서열번호 Y는 뉴클레오타이드(DNA) 서열 48 내지 52 중 임의의 뉴클레오타이드 서열이다.

본 발명의 세포에서의 발현에 적합할 수 있는 adhE 효소의 공급원일 수 있는 일부 유기체들이 표 1에 언급되어 있다.

[표 1]

적합한 효소의 예는 에스케리키아 콜라이의 adhE, 락토바실러스 플란타룸의 acdH, 에스케리키아 콜라이의 eutE, 리스테리아 이노쿠아의 Lin1129 및 스타필로코커스 아우레우스의 adhE이다. 하기 실시예에서 시험되는 적합한 대안적 알코올/아세트알데하이드 데하이드로게나제를 제공하는 이 효소들의 BLAST에 대해서는 하기 표 2(a) 내지 2(e)를 참조한다.

[표 2(a)]

[표 2(b)]

[표 2(c)]

[표 2(d)]

[표 2(e)]

특징 b): 아세틸-CoA 신세타제(E.C. 6.2.1.1)를 암호화하는 하나 이상의 뉴클레오타이드 서열

(아세테이트-CoA 리가제(ligase) 및 아세틸 활성화 효소로서도 공지된) 아세틸-CoA 신세타제는 하기 표시된 바와 같이 아세테이트, 보조효소 A(CoA) 및 ATP로부터 아세틸-CoA를 형성하는 것을 촉진하는, 원핵생물 및 진핵생물 둘다에서 발견되는 편재하는 효소이다[PMID: 15316652]:

ATP + 아세테이트 + CoA = AMP + 다이포스페이트 + 아세틸-CoA (4)

이 효소의 활성은 많은 중요한 생합성 및 이화작용 과정들에서의 핵심 중간체인 아세틸-CoA의 요구된 수준을 유지하는 데에 매우 중요하다. 이것은 이 유기체들에서 아세틸-CoA로의 아세테이트의 활성화를 위한 유일한 경로이기 때문에 진핵 종에서 특히 중요하다(일부 원핵 종들은 아세테이트 키나제/포스포트랜스아세틸라제 또는 ADP 형성 아세틸-CoA 신타제로 아세테이트를 활성화시킬 수도 있다). 진핵생물은 전형적으로 아세틸-CoA 신타제의 두 동형체들(isoforms), 즉 생합성 과정에 관여하는 세포질 형태 및 주로 에너지 발생에 관여하는 미토콘드리아 형태를 가진다.

이 효소의 진핵생물(예를 들면, 효소) 형태 및 세균(예를 들면, 살모넬라) 형태의 결정 구조가 확인되어 있다. 효모 효소는 삼량체인 반면, 세균 효소는 단량체이다. 그러나, 삼량체 계면에 포함된 잔기가 다른 서열들에서 잘 보존되어 있지 않기 때문에, 효모 단백질의 삼량체 상태는 이 유기체에 유일무이할 수 있다. 두 효소들의 올리고머 상태에서의 차이에도 불구하고, 단량체의 구조는 거의 동일하다. 2개의 평행한 베타 시트를 함유하는 큰 N-말단 도메인(약 500개 잔기들)에 이어서, 나선을 가진 3-가닥 베타 시트를 함유하는 작은(약 110개의 잔기들) C-말단 도메인이 존재한다. 활성 부위는 도메인 계면에 존재하는데, 이때 그의 함량은 C-말단 도메인의 배향을 결정한다.

세포가 효모 세포일 때, 내생성 ACS가 본 발명에 따라 바람직하고 한 실시양태에서 효모 세포에서 과다발현된다.

적합한 예는 표 3에 나열되어 있다. 표 3의 상부에는 실시예에서 사용되고 BLAST에서 검색된 ACS2가 언급되어 있다.

[표 3]

ACS 활성을 가진 효소를 암호화하는 외생성 유전자는 바람직하게는 서열번호 6과 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 99% 이상의 아미노산 서열 동일성을 가진 아미노산 서열을 암호화하는 뉴클레오타이드 서열을 포함한다. ACS 활성을 가진 효소를 암호화하는 외생성 유전자는 서열번호 6의 아미노산 서열에 비해 1개 또는 여러 개의 치환, 삽입 및/또는 결실을 가진 아미노산 서열을 암호화하는 뉴클레오타이드 서열을 포함할 수도 있다. 바람직하게는, 아미노산 서열은 서열번호 6에 비해 420개, 380개, 300개, 250개, 200개, 150개, 100개, 75개, 50개, 40개, 30개, 20개, 10개 또는 5개 이하의 아미노산 치환, 삽입 및/또는 결실을 가진다.

본원에서 ACS 활성을 가진 효소를 암호화하는 외생성 유전자는 서열번호 53과 40%, 50%, 60%, 65%, 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 95%, 96%, 97%, 98%, 99% 이상 또는 100%의 뉴클레오타이드(DNA) 서열 동일성을 가진 뉴클레오타이드 서열을 포함한다.

특징 c): 특징 c)에 따라, 세포는 글리세롤 데하이드로게나제(E.C. 1.1.1.6)를 암호화하는 하나 이상의 뉴클레오타이드 서열을 포함한다. 글리세롤 데하이드로게나제(EC 1.1.1.6)는 하기 화학반응을 촉진하는 효소이다:

글리세롤 + NAD⁺ ↔ 글리세론 + NADH + H⁺ (5)

따라서, 이 효소의 두 기질들은 글리세롤 및 NAD⁺인 반면, 그의 3개 생성물들은 글리세론, NADH 및 H⁺이다. 글리세론 및 다이하이드록시아세톤은 본원에서 동의어이다.

이 효소는 옥시도리덕타제, 특히 수용자로서 NAD⁺ 또는 NADP⁺와 함께 공여자의 CH-OH 기에 작용하는 옥시도리덕타제의 패밀리에 속한다. 이 효소 부류의 체계적 명칭은 글리세롤:NAD⁺ 2-옥시도리덕타제이다. 흔히 사용되는 다른 명칭은 글리세린 데하이드로게나제 및 NAD⁺-연결된 글리세롤 데하이드로게나제이다. 이 효소는 글리세롤지질 대사에 참여한다. 구조 연구는 상기 효소가 단백질의 두 도메인들 사이에 놓여있는 활성 부위를 가진 아연-의존적 효소임을 보여주었다.

적합한 글리세롤 데하이드로게나제의 예는 표 4(a) 내지 4(d)에 나열되어 있다. 각각의 표의 상부에는 실시예에서 사용되고 BLAST에서 검색된 gldA가 언급되어 있다.

[표 4(a)]

[표 4(b)]

[표 4(c)]

[표 4(d)]

gldA 활성을 가진 효소를 암호화하는 외생성 유전자는 바람직하게는 서열번호 7 내지 서열번호 10 중 임의의 서열번호, 바람직하게는 서열번호 7 또는 서열번호 9와 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 99% 이상의 아미노산 서열 동일성을 가진 아미노산 서열을 암호화하는 뉴클레오타이드 서열을 포함한다. 아세트알데하이드 데하이드로게나제 활성을 가진 효소를 암호화하는 외생성 유전자는 서열번호 7 내지 서열번호 10 중 임의의 서열번호, 바람직하게는 서열번호 7 또는 서열번호 9의 아미노산 서열에 비해 1개 또는 여러 개의 치환, 삽입 및/또는 결실을 가진 아미노산 서열을 암호화하는 뉴클레오타이드 서열을 포함할 수도 있다. 바람직하게는, 아미노산 서열은 각각 서열번호 7, 서열번호 8, 서열번호 9 또는 서열번호 10, 바람직하게는 각각 서열번호 7 또는 서열번호 9에 비해 300개, 250개, 200개, 150개, 100개, 75개, 50개, 40개, 30개, 20개, 10개 또는 5개 이하의 아미노산 치환, 삽입 및/또는 결실을 가진다.

본원에서 gldA 활성을 가진 효소를 암호화하는 외생성 유전자는 서열번호 54 내지 서열번호 57 중 임의의 서열번호와 40%, 50%, 60%, 65%, 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 95%, 96%, 97%, 98%, 99% 이상 또는 100%의 뉴클레오타이드(DNA) 서열 동일성을 가진 뉴클레오타이드 서열을 포함한다.

특징 d): 다이하이드록시아세톤 키나제(E.C. 2.7.1.28 또는 E.C. 2.7.1.29)를 암호화하는 하나 이상의 이종 뉴클레오타이드 서열. 다이하이드록시아세톤 키나제 효소는 하기 반응들에 관여한다:

이 패밀리는 에스케리키아 콜라이에서와 같이 인단백질보다는 오히려 ATP(EC 2.7.1.29 또는 EC 2.7.1.28)를 포스페이트 공여자로서 사용하는 다이하이드록시아세톤 키나제(글리세론 키나제로서도 지칭됨)의 단일 쇄 형태의 예들로 구성된다. 이 형태는 에스케리키아 콜라이 효소의 K 서브유닛 및 L 서브유닛과 상동한 분리가능한 도메인들을 가지고, 효모 및 다른 진핵생물, 및 시트로박터 프레운디이(Citrobacter freundii)를 비롯한 일부 세균들에서 발견된다. 토마토로부터 유래한 구성원은 다이하이드록시아세톤, 3,4-다이하이드록시-2-부탄온, 및 일부 다른 알도스들 및 케토스들을 인산화시키는 것으로 밝혀졌다. 포유동물로부터 유래한 구성원은 다이하이드록시아세톤의 인산화 및 리보뉴클레오사이드 다이포스페이트-X 화합물들(이들 중에서 FAD가 가장 우수한 기질임)의 분할을 촉진하는 것으로 밝혀졌다. 효모에는 다이하이드록시아세톤 키나제의 두 이소자임들(isozymes)(Dak1 및 Dak2)이 존재한다. 세포가 효모 세포일 때, 내생성 DAK가 본 발명에 따라 바람직하고 한 실시양태에서 효모 세포에서 과다발현된다.

적합한 다이하이드록시아세톤 키나제의 예는 하기 표 5(a) 내지 5(d)에 나열되어 있다. 각각의 표의 상부에는 실시예에서 사용되고 BLAST에서 검색된 DAK가 언급되어 있다.

[표 5(a)]

[표 5(b)]

[표 5(c)]

[표 5(d)]

DAK 활성을 가진 효소를 암호화하는 외생성 유전자는 바람직하게는 서열번호 11 내지 서열번호 14 중 임의의 서열번호, 바람직하게는 서열번호 11 또는 서열번호 13과 40%, 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 99% 이상의 아미노산 서열 동일성을 가진 아미노산 서열을 암호화하는 뉴클레오타이드 서열을 포함한다. 아세트알데하이드 데하이드로게나제 활성을 가진 효소를 암호화하는 외생성 유전자는 서열번호 11 내지 서열번호 14 중 임의의 서열번호, 바람직하게는 서열번호 11 또는 서열번호 13의 아미노산 서열에 비해 1개 또는 여러 개의 치환, 삽입 및/또는 결실을 가진 아미노산 서열을 암호화하는 뉴클레오타이드 서열을 포함할 수도 있다. 바람직하게는, 아미노산 서열은 각각 서열번호 11, 서열번호 12, 서열번호 13 또는 서열번호 14, 바람직하게는 각각 서열번호 11 또는 서열번호 13에 비해 420개, 380개, 300개, 250개, 200개, 150개, 100개, 75개, 50개, 40개, 30개, 20개, 10개 또는 5개 이하의 아미노산 치환, 삽입 및/또는 결실을 가진다.

본원에서 DAK 활성을 가진 효소를 암호화하는 외생성 유전자는 서열번호 58 내지 서열번호 61 중 임의의 서열번호와 40%, 50%, 60%, 65%, 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 95%, 96%, 97%, 98%, 99% 이상 또는 100%의 뉴클레오타이드(DNA) 서열 동일성을 가진 뉴클레오타이드 서열을 포함한다.

한 실시양태에서, 세포는 글리세롤 3-포스페이트 포스포하이드롤라제를 암호화하고/하거나 글리세롤 3-포스페이트 데하이드로게나제 유전자를 암호화하는 하나 이상의 내생성 뉴클레오타이드 서열의 결실 또는 파괴를 포함한다.

본원에서 NADH-의존적 글리세롤 합성을 위해 필요한 효소 활성이 세포에서 감소되어 있거나 결실되어 있다. 이 효소 활성의 감소 또는 결실은 상기 효소가 야생형에서의 발현 수준보다 상당히 더 낮은 수준으로 발현되도록 또는 유전자가 감소된 활성을 가진 폴리펩타이드를 암호화하도록 NAD-의존적 글리세롤 3-포스페이트 데하이드로게나제 활성(GPD)을 암호화하는 하나 이상의 유전자 또는 글리세롤포스페이트 포스파타제 활성(GPP)을 암호화하는 하나 이상의 유전자를 변형시킴으로써 달성될 수 있다.

이러한 변형은 통상적으로 공지된 생명공학적 기법을 이용함으로써 수행될 수 있고, 특히 GPD 및/또는 GPP를 암호화하는 구조 유전자의 프로모터 영역 또는 암호화 영역의 하나 이상의 넉-아웃(knock-out) 돌연변이 또는 부위-지정된(site-directed) 돌연변이유발을 포함할 수 있다. 대안적으로, 글리세롤 생성이 결여된 효모 균주는 무작위 돌연변이유발에 이은 감소된 또는 부재하는 GPD 및/또는 GPP 활성을 가진 균주의 선별에 의해 수득될 수 있다. 사카로마이세스 세레비지애 GPD1, GPD2, GPP1 및 GPP2 유전자는 국제 특허출원 공개 제WO 2011/010923호에 제시되어 있고, 이 출원의 서열번호 24 내지 서열번호 27에 개시되어 있다.

바람직하게는, GPD를 암호화하는 하나 이상의 유전자 또는 GPP를 암호화하는 하나 이상의 유전자가 전체적으로 결실되거나, 그의 활성에 필수적인 효소의 일부를 암호화하는 상기 유전자의 적어도 일부가 결실된다. 특히, 우수한 결과는 GPD1 유전자 및 GPD2 유전자의 개방 판독 프레임(open reading frames)이 불활성화되어 있는 사카로마이세스 세레비지애 세포에 의해 달성되었다. 구조 유전자(표적 유전자)의 불활성화는 결실될 숙주 세포 게놈의 영역을 플랭킹하는 서열과 동일한 DNA 서열에 의해 플랭킹된 선별 마커 유전자로 구성된 DNA 단편을 합성적으로 합성하거나 다른 방식으로 구축함으로써 당업자에 의해 달성될 수 있다. 구체적으로, 우수한 결과는 마커 유전자 kanMX 및 hphMX4의 삽입에 의한 사카로마이세스 세레비지애 내의 GPD1 및 GPD2 유전자의 불활성화에 의해 수득되었다. 그 후, 이 DNA 단편은 숙주 세포 내로 형질전환된다. 우성 마커 유전자를 발현하는 형질전환된 세포를, 결실되도록 디자인된 영역의 정확한 치환에 대해 예를 들면, 진단 중합효소 연쇄 반응 또는 서던 혼성화(southern hybridization)로 확인한다.

따라서, 본 발명의 세포에서 특정 글리세롤 3-포스페이트 포스포하이드롤라제 및/또는 글리세롤 3-포스페이트 데하이드로게나제 유전자가 감소된다. 본 발명의 세포에서 특정 글리세롤포스페이트 데하이드로게나제 활성은 특정 활성에서의 감소를 야기하는 유전적 변형을 제외하고 유전적으로 동일한 균주에 비해 바람직하게는 혐기성 조건 하에서 0.8배, 0.5배, 0.3배, 0.1배, 0.05배 또는 0.01배 이상까지 감소된다. 글리세롤포스페이트 데하이드로게나제 활성은 문헌(Overkamp et al., 2002, Yeast 19:509-520)에 기재된 바와 같이 측정될 수 있다.

바람직하게는, 유전적 변형은 세포의 게놈에서 특정 글리세롤포스페이트 데하이드로게나제를 암호화하는 유전자의 각각의 내생성 카피의 발현을 감소시키거나 불활성화시킨다. 주어진 세포는 이배수성(diploidy), 다배수성(polyploidy) 또는 이수배수성(aneuploidy)의 결과로서 1개의 동일한 아미노산 서열을 가진 특정 글리세롤포스페이트 데하이드로게나제를 암호화하는 유전자의 다수의 카피들을 포함할 수 있다. 이러한 경우, 바람직하게는 글리세롤포스페이트 데하이드로게나제를 암호화하는 특정 유전자의 각각의 카피의 발현이 감소되거나 불활성화된다. 대안적으로, 세포는 아미노산 서열에서 상이하고 상이한 유전자에 의해 각각 암호화되는, 글리세롤포스페이트 데하이드로게나제 활성을 가진 여러 상이한 (동종)효소들을 함유할 수 있다. 이러한 경우, 본 발명의 일부 실시양태들에서, 일부 종류의 동종효소들만이 감소되거나 불활성화되는 반면, 다른 종류의 동종효소들은 영향을 받지 않은 상태로 남아있는 것이 바람직할 수 있다. 그러나, 바람직하게는, 글리세롤포스페이트 데하이드로게나제 활성을 가진 (동종)효소를 암호화하는 유전자의 모든 카피들의 발현이 감소되거나 불활성화된다.

바람직하게는, 글리세롤포스페이트 데하이드로게나제 활성을 암호화하는 유전자는 이 유전자의 적어도 일부의 결실 또는 이 유전자의 파괴에 의해 불활성되므로, 이러한 상황에서 용어 유전자는 암호화 서열의 상류 또는 하류에 있는 임의의 비-암호화 서열도 포함하고, 이러한 서열의 (부분적) 결실 또는 불활성화는 숙주 세포에서 글리세롤포스페이트 데하이드로게나제 활성의 발현을 감소시킨다.

본 발명의 세포에서 감소되거나 불활성화될 활성을 가진 글리세롤포스페이트 데하이드로게나제를 암호화하는 바람직한 유전자는 아미노산 서열 GPD1 및 다른 종에서의 그의 오르톨로그(orthologues)를 암호화하는, 문헌(van den Berg and Steensma, 1997, Yeast 13:551-559)에 기재된 사카로마이세스 세레비지애 GPD1이다.

사카로마이세스(Saccharomyces), 나우모보자이나(Naumovozyna), 칸디다 반데르왈토자이마(Candida Vanderwaltozyma) 및 자이고사카로마이세스(Zygosaccharomyces) 속에 속하는, 글리세롤포스페이트 데하이드로게나제 활성을 가진 효소를 포함하는 유기체(숙주)의 적합한 예는 표 6에 제공되어 있다.

[표 6]

그러나, 예를 들면, 사카로마이세스, 칸디다 및 자이고사카로마이세스의 일부 균주들에서 글리세롤포스페이트 데하이드로게나제를 암호화하는 제2 유전자, 즉 GPD2가 활성을 나타낸다(예를 들면, 상기 문헌(Overkamp et al., 2002) 참조). 따라서, 본 발명의 세포에서 감소되거나 불활성화될 활성을 가진 글리세롤포스페이트 데하이드로게나제를 암호화하는 또 다른 바람직한 유전자는 아미노산 서열 GPD2 및 다른 종에서의 그의 오르톨로그를 암호화하는, 상기 문헌(Overkamp et al., 2002)에 기재된 사카로마이세스 세레비지애 GPD2이다.

(자이고)사카로마이세스 및 칸디다 속에 속하는, 글리세롤포스페이트 데하이드로게나제 활성을 가진 효소를 포함하는 유기체(숙주)의 적합한 예는 표 7에 제공되어 있다.

[표 7]

한 실시양태에서, 세포는 효모이고, 이때 효모 세포의 게놈은 GPD1, GPD2, GPP1 및 GPP2로 구성된 군으로부터 선택된 하나 이상의 유전자 내의 돌연변이를 포함하고, 이 돌연변이는 효모 세포의 상응하는 야생형 효모 유전자에 비해 상기 유전자들 중 하나 이상의 완전한 결실일 수 있는 넉-아웃 돌연변이일 수 있다.

본원의 효소 활성이 본 발명의 형질전환된 숙주 세포에서 충분한 수준으로 활성화된 형태로 발현될 가능성을 증가시키기 위해, 이 효소 및 본 발명의 다른 효소(하기 참조)를 암호화하는 뉴클레오타이드 서열은 바람직하게는 그의 코돈 사용빈도를 해당 숙주 세포의 코돈 사용빈도에 맞추어져 최적화된다. 효소를 암호화하는 뉴클레오타이드 서열이 숙주 세포의 코돈 사용빈도에 맞추어진 정도는 코돈 맞춤(adaptiveness) 지수(CAI)로서 표현될 수 있다. 코돈 맞춤 지수는 본원에서 유전자의 코돈 사용빈도가 특정 숙주 세포 또는 유기체에서 고도로 발현되는 유전자의 코돈 사용빈도에 상대적으로 맞추어진 정도의 측정치로서 정의된다. 각각의 코돈이 상대적으로 맞추어진 정도(w)는 동일한 아미노산에 대한 가장 풍부한 코돈의 사용빈도에 대한 각각의 코돈의 사용빈도의 비이다. CAI 지수는 이 상대적으로 맞추어진 정도 값의 기하 평균으로서 정의된다. 동일한 의미가 아닌 코돈들 및 종결 코돈들(유전적 코드에 의해 좌우됨)은 배제된다. CAI 값은 0 내지 1이고, 이때 보다 더 높은 값은 가장 풍부한 코돈의 보다 더 높은 비율을 표시한다(문헌(Sharp and Li, 1987, Nucleic Acids Research 15: 1281-1295) 참조; 문헌(Jansen et al., 2003, Nucleic Acids Res. 31(8):2242-51) 또한 참조). 맞추어진 뉴클레오타이드 서열은 바람직하게는 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8 또는 0.9 이상의 CAI를 가진다. 해당 진균 숙주 세포, 예를 들면, 사카로마이세스 세레비지애 세포에서의 발현을 위해 코돈 최적화된 서열이 가장 바람직하다.

균주 구축

본원의 실시예에서 이용된 균주 구축 방법은 국제 특허출원 제PCT/EP2013/056623호에 기재되어 있다. 상기 특허출원에는 관심있는 다양한 유전자들로부터의 발현 카세트들이 한 경로로 조합되어 효모의 형질전환 시 이 효모 게놈의 특정 좌위 내에 삽입되도록 이 발현 카세트들을 구축할 수 있게 하는 기법이 기재되어 있다.

실시예에서 이용된 균주 구축 방법의 개요는 도 2에 제공되어 있다. 도 2는 균주 구축 방식의 개략적 표시를 보여준다. PCR을 이용하여 선별 마커를 포함하는, INT(삽입) 플랭크 및 발현 카세트(CAS)를 증폭하고 효모 내로 전달한다. (도 2에서 각각 5, a, b, c 및 3으로서 표시된) 연결제들 사이에서 재조합이 일어남으로써, 효모 게놈 내의 원하는 위치(이 경우, INT1)에서 경로가 삽입될 것이다. 관심있는 유전자의 수는 실시예에 기재된 바와 같이 증가될 수 있다. 유일무이한 연결제를 사용하여 별개의 발현 카세트들의 재조합 및 수용자 세포의 게놈 내로의 삽입을 용이하게 하였다. 선행기술에 따른 임의의 다른 균주 구축 방법이 본 발명의 균주를 구축하는 데에 동등하게 이용될 수 있다.

상동성 및 동일성

아미노산 또는 뉴클레오타이드 서열은 일정 수준의 유사성을 나타낼 때 상동성을 가진다고 주장된다. 상동한 2개의 서열들은 공통된 진화 기원을 시사한다. 2개의 상동성 서열들이 밀접하게 관련되어 있는지 아니면 보다 더 멀리 관련되어 있는지는 각각 높은 또는 낮은 "퍼센트 동일성" 또는 "퍼센트 유사성"에 의해 표시된다. 논쟁의 여지가 있지만, "퍼센트 동일성" 또는 "퍼센트 유사성"을 표시하기 위해, "상동성 수준" 또는 "퍼센트 상동성"이 종종 상호교환적으로 사용된다.

수학적 알고리즘을 사용하여 서열들의 비교 및 2개의 서열들 사이의 퍼센트 동일성의 측정을 달성할 수 있다. 당업자는 여러 상이한 컴퓨터 프로그램들이 2개의 서열들을 정렬하고 2개의 서열들 사이의 상동성을 측정하는 데에 이용될 수 있다는 사실을 인식할 것이다(Kruskal, J. B. (1983) An overview of sequence comparison In D. Sankoff and J. B. Kruskal, (ed.), Time warps, string edits and macromolecules: the theory and practice of sequence comparison, pp. 1-44 Addison Wesley). 2개의 서열들의 정렬을 위한 니들만(Needleman) 및 분슈(Wunsch) 알고리즘을 이용하여 2개의 아미노산 서열들 사이의 퍼센트 동일성을 측정할 수 있다(Needleman, S. B. and Wunsch, C. D. (1970) J. Mol. Biol. 48, 443-453). 상기 알고리즘은 아미노산 서열뿐만 아니라 뉴클레오타이드 서열도 정렬한다. 니들만-분슈 알고리즘은 컴퓨터 프로그램 NEEDLE에서 실행되어 왔다. 본 발명의 목적을 위해, EMBOSS 팩키지로부터의 NEEDLE 프로그램을 사용하였다(버전 2.8.0 이상, EMBOSS: The European Molecular Biology Open Software Suite (2000) Rice,P. Longden,I. and Bleasby,A. Trends in Genetics 16, (6) pp276-277, http://emboss.bioinformatics.nl/). 단백질 서열의 경우, EBLOSUM62가 치환 매트릭스를 위해 사용된다. 뉴클레오타이드 서열의 경우, EDNAFULL이 사용된다. 다른 매트릭스들도 특정될 수 있다. 아미노산 서열들의 정렬을 위해 사용된 임의적 파라미터는 10의 갭(gap)-개방 벌점 및 0.5의 갭 연장 벌점이다. 당업자는 모든 이들 상이한 파라미터들이 약간 상이한 결과를 제공할 것이지만 상이한 알고리즘을 사용할 때 2개의 서열들의 전체 백분율 동일성이 유의하게 변경되지 않는다는 것을 인식할 것이다.

전체적인 상동성 정의

상동성 또는 동일성은 임의의 갭 또는 연장을 포함하는 총 정렬된 영역에 걸쳐 2개의 전체 서열들 사이의 동일한 일치(matches)의 백분율이다. 2개의 정렬된 서열들 사이의 상동성 또는 동일성은 다음과 같이 계산된다: 갭을 포함하는 정렬의 총 길이로 나누어진, 두 서열들에서 동일한 아미노산을 보이는 정렬에서의 상응하는 위치의 수. 본원에서 정의된 동일성은 NEEDLE로부터 수득될 수 있고 프로그램의 출력물에서 "동일성"으로서 표지된다.

가장 긴 동일성 정의

2개의 정렬된 서열들 사이의 상동성 또는 동일성은 다음과 같이 계산된다: 정렬에서의 갭의 총수의 차감 후 정렬의 총 길이로 나누어진, 두 서열들에서 동일한 아미노산을 보이는 정렬에서의 상응하는 위치의 수. 본원에서 정의된 동일성은 NOBRIEF 옵션을 사용함으로써 NEEDLE로부터 수득될 수 있고 프로그램의 출력물에서 "가장 긴 동일성"으로서 표지된다.

본원에 기재된 본 발명의 다양한 실시양태들은 교차조합될 수 있다.

본 발명의 추가 실시양태

한 실시양태에서, 효모 세포는 NAD⁺-의존적 알코올 데하이드로게나제 활성(EC 1.1.1.1)을 암호화하는 하나 이상의 핵산 서열을 포함한다. 이 효소는 에탄올로의 아세트알데하이드의 전환을 촉진한다. 효모 세포는 사카로마이세스 세레비지애(ADH1-5)와 마찬가지로 이러한 데하이드로게나제를 암호화하는 유전자를 천연적으로 포함할 수 있거나(문헌(Lutstorf and Megnet. 1968 Arch. Biochem. Biophys. 126:933-944), 또는 문헌(Ciriacy, 1975, Mutat. Res. 29:315-326) 참조), 숙주 세포는 이 활성을 암호화하는 하나 이상의 이종 유전자(들)를 구비할 수 있다. 예를 들면, 사카로마이세스 세레비지애의 ADH1-5 유전자들 중 임의의 유전자 또는 각각의 유전자, 또는 이의 기능성 상동체는 본 발명에 따른 세포 내로 도입될 수 있다.

한 실시양태에서, 효모 세포는 사카로마이세타세애(Saccharomycetaceae), 특히 사카로마이세스, 예컨대, 사카로마이세스 세레비지애; 클루이베로마이세스, 예컨대, 클루이베로마이세스 마르시아누스(Kluyveromyces marxianus); 피키아(Pichia), 예컨대, 피키아 스티피티스(Pichia stipitis) 또는 피키아 안구스타(Pichia angusta); 자이고사카로마이세스, 예컨대, 자이고사카로마이세스 바일리이(Zygosaccharomyces bailii); 브레타노마이세스(Brettanomyces), 예컨대, 브레타노마이세스 인터메디우스(Brettanomyces intermedius); 이사첸키아(Issatchenkia), 예컨대, 이사첸키아 오리엔탈리스(Issatchenkia orientalis); 및 한세눌라(Hansenula)로 구성된 군으로부터 선택된다.

한 실시양태에서, 세포는 원핵세포이다. 한 실시양태에서, 세포는 클로스트리듐(Clostridium), 자이모모나스(Zymomonas), 써모박터(Thermobacter), 에스케리키아(Escherichia), 락토바실러스(Lactobacillus), 게오바실러스(Geobacillus) 및 바실러스(Bacillus)로 구성된 목록으로부터 선택된다.

본 발명은 발효 생성물, 바람직하게는 에탄올의 제조를 위한 본 발명에 따른 효모 세포의 용도에 관한 것이기도 하다. 본 발명은 아세테이트 및 발효가능한 탄수화물, 특히 글루코스, 프럭토스, 수크로스, 말토스, 자일로스, 아라비노스, 갈락토스 및 만노스로 구성된 군으로부터 선택된 탄수화물로부터 발효 생성물을 제조하는 단계를 포함하는, 발효 생성물을 제조하는 방법도 제공하는데, 상기 제조는 본 발명에 따른 효모 세포를 사용함으로써 혐기성 조건 하에서 수행된다. 한 실시양태에서, 상기 제조는 0.7 이하, 구체적으로 적어도 0.004 내지 0.5, 보다 구체적으로 0.05 내지 0.3의 몰비로 아세테이트 및 탄수화물을 포함하는 발효 배지에서 수행된다. 발효 생성물의 제조의 한 실시양태에서, 탄수화물의 적어도 일부 및 아세테이트의 적어도 일부는 리그노셀룰로스, 셀룰로스, 헤미셀룰로스 및 펙틴으로 구성된 군으로부터 선택된 폴리사카라이드의 가수분해에 의해 수득되었다. 리그노셀룰로스는 바람직하게는 가수분해되어 발효가능한 탄수화물 및 아세테이트를 제공하는 리그노셀룰로스성 바이오매스이다.

한 실시양태에서, 리그노셀룰로스성 또는 헤미셀룰로스성 물질은 효소 조성물과 접촉되는데, 이때 하나 이상의 당이 생성되고, 생성된 당은 발효되어 발효 생성물을 제공하고, 발효는 본 발명에 따른 효모 세포에 의해 수행된다.

본 발명의 발효 생성물은 임의의 유용한 생성물일 수 있다. 한 실시양태에서, 상기 발효 생성물은 에탄올, n-부탄올, 이소부탄올, 락트산, 3-하이드록시-프로피온산, 아크릴산, 아세트산, 석신산, 아디프산, 푸마르산, 말산, 이타콘산, 말레산, 시트르산, 아디프산, 아미노산, 예컨대, 라이신, 메티오닌, 트립토판, 쓰레오닌 및 아스파르트산, 1,3-프로판-다이올, 에틸렌, 글리세롤, β-락탐 항생제 및 세팔로스포린, 비타민, 약제, 동물 사료 보충제, 특수 화학물질, 화학적 공급원료, 플라스틱, 용매, 바이오연료 및 바이오가스 또는 유기 중합체를 비롯한 연료, 및 산업용 효소, 예컨대, 프로테아제(protease), 셀룰라제(cellulase), 아밀라제(amylase), 글루카나제(glucanase), 락타제(lactase), 리파제(lipase), 라이아제(lyase), 옥시도리덕타제(oxidoreductases), 트랜스퍼라제(transferase) 또는 자일라나제(xylanase)로 구성된 군으로부터 생성물이다.

한 실시양태에서, 발효 생성물은 에탄올, 부탄올, 락트산, 플라스틱, 유기산, 용매, 동물 사료 보충제, 약제, 비타민, 아미노산, 효소 및 화학적 공급원료 중 하나 이상일 수 있다.

바람직한 실시양태에서, 세포는 혐기성 조건 하에서 생장된다. 혐기성 생장 조건은 본원에서 혐기성 조건 또는 산소가 한정된 조건이다. 혐기성은 본원에서 산소의 부재 하에서 또는 실질적으로 산소가 소비되지 않는, 바람직하게는 약 5 mmol/ℓ/시간, 약 2.5 mmol/ℓ/시간 또는 약 1 mmol/ℓ/시간 미만의 산소가 소비되는 조건 하에서 실시되는 생장 과정으로서 정의되고, 이때 유기 분자는 전자 공여자 및 전자 수용자 둘다로서 작용한다.

산소-한정된 생장 과정은 산소 소비가 기체로부터 액체로의 산소 전달에 의해 한정되는 과정이다. 산소 한정의 정도는 유입 기체 유동의 양 및 조성뿐만 아니라 이용된 발효 장치의 실제 혼합/질량 전달 성질에 의해 결정된다. 바람직하게는, 산소-한정된 조건 하에서의 과정에서, 산소 소비의 속도는 약 5.5 mmol/ℓ/시간 이상, 보다 바람직하게는 약 6 mmol/ℓ/시간 이상, 예컨대, 7 mmol/ℓ/시간 이상이다. 본 발명의 방법은 발효 생성물의 회수를 포함한다. 발효 동안, 아세트산이 존재할 때, 아세트산/아세테이트의 비는 pH에 의해 좌우될 것이다. 단계 d)에서 아세테이트의 농도는 효모 균주가 그의 최종 사용에서 충족시키는 농도와 유사하게 선택될 수 있다(예를 들면, 발효 생성물로의 리그노셀룰로스성 가수분해물의 발효에서 이러한 가수분해물은 1 내지 10 g/ℓ의 아세테이트, 예를 들면, 2 g/ℓ의 아세테이트를 함유할 수 있다).

유리하게는, 본 발명에 따라 에탄올이 생성될 때, 에탄올은 0.04:1 미만, 특히 0.02:1 미만, 바람직하게는 0.01:1 미만의 글리세롤:에탄올의 몰비로 생성된다. 적어도 일부 실시양태들(NADH-의존적 글리세롤 합성이 감소되지만 완전히 억제되지 않는 경우)에서 일부 글리세롤이 예를 들면, 0.001:1 이상의 글리세롤 대 에탄올의 비로 부산물로서 생성될 수 있지만, 글리세롤 생성은 존재하지 않을(검출불가능할) 수 있다.

본 발명은 NADH-의존적 반응을 통해 아세트산을 에탄올로 환원시킴으로써 NADH를 재산화시킬 수 있도록 재조합 효모 세포, 특히 사카로마이세스 세레비지애를 제공함으로써 글리세롤 생성의 완전한 제거 또는 적어도 그의 상당한 감소를 가능하게 한다.

이것은 글리세롤 생성이 피해지거나 적어도 감소된다는 점에서 유리할 뿐만 아니라, NADH의 재산화에서 형성된 생성물도 원하는 생성물, 즉 에탄올이기 때문에 본 발명의 방법이 (전환된 공급원료, 즉 에탄올로 전환된 탄수화물 + 아세트산의 중량%로서 측정된) 증가된 생성물 수율도 제공할 수 있다는 점에서도 유리하다. 아세트산이 일반적으로 리그노셀룰로스성 가수분해물에서 상당한 양으로 사용될 수 있기 때문에, 이것은 본 발명이 발효가능한 탄수화물을 위한 공급원으로서 리그노셀룰로스성 바이오매스를 사용하는 에탄올의 제조에 특히 유리하게 만든다. 추가로, 상당한 양의 아세테이트를 함유할 수 있는 탄수화물 공급원은 사탕무 당밀(이의 가수분해물), 및 (예를 들면, 옥수수 건식 제분 과정, 옥수수 습식 제분 과정, 또는 예를 들면, 찌꺼기 재활용을 이용하는 전분 폐기물 과정으로부터의 폐기물을 함유하는) 전분을 포함한다.

추가 바람직한 실시양태에서, 본 발명의 숙주 세포는 a) 자일로스를 자일룰로스로 이성질체화하는 능력; 및 b) L-아라비노스를 D-자일룰로스 5-포스페이트로 전환시키는 능력 중 하나 이상을 가진다. a)의 경우, 효모 세포는 바람직하게는 자일로스를 자일룰로스로 이성질체화하는 능력을 효모 세포에게 부여하는 유전자인 기능성 외생성 자일로스 이소머라제(isomerase) 유전자를 가진다. b)의 경우, 효모 세포는 바람직하게는 L-아라비노스를 D-자일룰로스 5-포스페이트로 이성질체화하여 전환시키는 능력을 효모 세포에게 함께 부여하는 유전자들인, L-아라비노스 이소머라제, L-리불로키나제(ribulokinase) 및 L-리불로스-5-포스페이트 4-에피머라제(epimerase)를 암호화하는 기능성 외생성 유전자들을 가진다.

진균 숙주 세포는 예를 들면, 국제 특허출원 공개 제WO 03/0624430호 및 제WO 06/009434호에 기재된 바와 같이 자일로스를 자일룰로스로 이성질체화하는 능력을 가진다. 자일로스를 자일룰로스로 이성질체화하는 능력은 바람직하게는 자일로스 이소머라제를 암호화하는 뉴클레오타이드 서열을 포함하는 핵산 구축물을 사용한 형질전환에 의해 효모 세포에게 부여된다. 바람직하게는, 이로써 효모 세포는 자일로스를 자일룰로스로 직접 이성질체화하는 능력을 획득한다. 보다 바람직하게는, 이로써 효모 세포는 자일룰로스로의 자일로스의 직접적인 이성질체화(및 자일룰로스의 추가 대사)를 통해 단독 에너지 및/또는 탄소 공급원인 자일로스 상에서 호기성 및/또는 혐기성 조건 하에서 생장하는 능력을 획득한다. 본원에서 자일룰로스로의 자일로스의 직접적인 이성질체화는 각각 자일로스 리덕타제 및 자일리톨 데하이드로게나제에 의해 촉진된 자일리톨 중간체를 통한 자일룰로스로의 자일로스의 2 단계 전환과 대조적으로 자일로스 이소머라제에 의해 촉진된 단일 반응에서 일어난다는 것이 이해된다.

자일로스를 자일룰로스로 직접 이성질체화하는 능력을 본 발명의 효모 세포에게 부여하는 데에 성공적으로 사용될 수 있는 여러 자일로스 이소머라제들(및 이들의 아미노산 및 암호화 뉴클레오타이드 서열들)이 당분야에서 기재되어 있다. 이들은 피로마이세스(Piromyces) 종, 및 네오칼리마스틱스(Neocallimastix), 캐코마이세스(Caecomyces), 피로마이세스 또는 루미노마이세스(Ruminomyces)(국제 특허출원 공개 제WO 03/0624430호), 사일라마이세스 애버렌시스(Cyllamyces aberensis)(미국 특허출원 공개 제20060234364호) 또는 오르피노마이세스(Orpinomyces)(Madhavan et al., 2008, DOI 10.1007/s00253008-1794-6)에 속하는 다른 혐기성 진균의 자일로스 이소머라제; 예를 들면, 박테로이데스 쎄타이오타오마이크론(B. thetaiotaomicron)(국제 특허출원 공개 제WO 06/009434호), 박테로이데스 프라길리스(B. fragilis) 및 박테로이데스 유니포르미스(B. uniformis)(국제 특허출원 공개 제WO 09/109633호)를 포함하는 박테로이데스(Bacteroides) 세균 속의 자일로스 이소머라제; 혐기성 세균 클로스트리듐 파이토퍼멘탄스(Clostridium phytofermentans)(Brat et al., 2009, Appl. Environ. Microbiol. 75:2304-2311)의 자일로스 이소머라제; 및 클로스트리듐 디피사일(Clostridium difficile), 시오나 인테스티날레스(Ciona intestinales) 및 푸소박테리움 모르티페룸(Fusobacterium mortiferum)(국제 특허출원 공개 제WO 10/074577호)의 자일로스 이소머라제를 포함한다.

진균 숙주 세포는 예를 들면, 문헌(Wisselink et al., 2007, Appl. Environ. Microbiol. doi:10.1128/AEM.00177-07) 및 유럽 특허 제1 499 708호에 기재된 바와 같이 L-아라비노스를 D-자일룰로스 5-포스페이트로 전환시키는 능력을 가진다. L-아라비노스를 D-자일룰로스 5-포스페이트로 전환시키는 능력은 바람직하게는 a) 아라비노스 이소머라제; b) 리불로키나제, 바람직하게는 L-리불로키나제 자일로스 이소머라제; 및 c) 리불로스-5-P-4-에피머라제, 바람직하게는 L-리불로스-5-P-4-에피머라제를 암호화하는 뉴클레오타이드 서열을 포함하는 핵산 구축물(들)을 사용한 형질전환에 의해 효모 세포에게 부여된다. 바람직하게는, 본 발명의 효모 세포에서 L-아라비노스를 D-자일룰로스 5-포스페이트로 전환시키는 능력은 후속 반응인 1) 리불로스로의 아라비노스의 이성질체화; 2) 리불로스 5-포스페이트로의 리불로스의 인산화; 및 3) D-자일룰로스 5-포스페이트로의 리불로스 5-포스페이트의 에피머화를 통해 L-아라비노스를 D-자일룰로스 5-포스페이트로 전환시키는 능력이다. 아라비노스 이소머라제, 리불로키나제 및 리불로스-5-P-4-에피머라제를 암호화하는 적합한 뉴클레오타이드 서열은 바실러스 서브틸리스(Bacillus subtilis), 에스케리키아 콜라이(예를 들면, 유럽 특허 제1 499 708호 참조), 락토바실리(Lactobacilli), 예를 들면, 에스케리키아 콜라이(예를 들면, 상기 문헌(Wisselink et al.); 및 국제 특허출원 공개 제WO 2008/041840호 참조), 또는 클라비박터(Clavibacter), 아쓰로박터(Arthrobacter) 및 그라멜라(Gramella)의 종, 바람직하게는 클라비박터 미시가넨시스(Clavibacter michiganensis), 아쓰로박터 아우레센스(Arthrobacter aurescens) 및 그라멜라 포르세티이(Gramella forsetii)(국제 특허출원 공개 제WO 2009/011591호 참조)로부터 수득될 수 있다.

본 발명의 형질전환된 세포는 바람직하게는 자일로스로부터 이성질체화된 자일룰로스가 피루베이트로 대사될 수 있도록 자일룰로스 키나제 활성을 추가로 포함한다. 바람직하게는, 효모 세포는 내생성 자일룰로스 키나제 활성을 함유한다. 보다 바람직하게는, 본 발명의 세포는 특정 자일룰로스 키나제 활성을 증가시키는 유전적 변형을 포함한다. 바람직하게는, 유전적 변형은 예를 들면, 자일룰로스 키나제를 암호화하는 뉴클레오타이드 서열의 과다발현에 의한 자일룰로스 키나제의 과다발현을 야기한다. 자일룰로스 키나제를 암호화하는 유전자는 효모 세포에 대한 내생성을 가질 수 있거나 효모 세포에 대한 이종성을 가지는 자일룰로스 키나제일 수 있다. 본 발명의 효모 세포에서 자일룰로스 키나제의 과다발현을 위해 사용될 수 있는 뉴클레오타이드 서열은 예를 들면, 문헌(Deng and Ho, 1990, Appl. Biochem. Biotechnol. 24-25: 193-199)에 기재된 바와 같이 사카로마이세스 세레비지애로부터의 자일룰로스 키나제 유전자(XKS1)이다. 또 다른 바람직한 자일룰로스 키나제는 피로마이세스로부터의 자일룰로스 키나제(xylB; 국제 특허출원 공개 제WO 03/0624430호 참조)와 관련된 자일로스 키나제이다. 이 피로마이세스 자일룰로스 키나제는 실제로 모든 공지된 진핵 키나제들, 예컨대, 효모 키나제보다 원핵 키나제와 더 관련되어 있다. 진핵 자일룰로스 키나제는 자일룰로스를 포함하는 넓은 기질 범위를 가진 비특이적 당 키나제로서 표시되어 왔다. 대조적으로, 피로마이세스 키나제와 가장 밀접하게 관련되어 있는 원핵 자일룰로스 키나제는 자일룰로스에 대한 보다 더 높은 특이성, 즉 보다 더 좁은 기질 범위를 가진 키나제인 것으로서 표시되어 왔다. 본 발명의 효모 세포에서, 과다발현될 자일룰로스 키나제는 과다발현을 야기하는 유전적 변형을 제외하고 유전적으로 동일한 균주에 비해 1.1배, 1.2배, 1.5배, 2배, 5배, 10배 또는 20배 이상까지 과다발현된다. 과다발현의 이 수준은 효소 활성의 정상 상태 수준, 효소 단백질의 정상 상태 수준 및 효소를 암호화하는 전사체의 정상 상태 수준에 적용될 수 있다는 것을 이해해야 한다.

본 발명의 세포는 바람직하게는 국제 특허출원 공개 제WO 06/009434호에 기재된 바와 같이 펜토스 포스페이트 경로의 유동을 증가시키는 유전적 변형을 추가로 포함한다. 한 실시양태에서, 유전적 변형은 (비-산화적 부분) 펜토스 포스페이트 경로의 하나 이상의 효소의 과다발현을 포함한다. 바람직하게는, 효소는 리불로스-5-포스페이트 이소머라제, 리불로스-5-포스페이트 3-에피머라제, 트랜스케톨라제(transketolase) 및 트랜스알돌라제(transaldolase)를 암호화하는 효소들로 구성된 군으로부터 선택된다.

본 발명의 추가 바람직한 세포는 효모 세포에서 비특이적 알도스 리덕타제 활성을 감소시키는 유전적 변형을 포함한다. 바람직하게는 비특이적 알도스 리덕타제 활성은 비특이적 알도스 리덕타제를 암호화하는 유전자의 발현을 감소시키거나 이러한 유전자를 불활성화시키는 하나 이상의 유전적 변형에 의해 숙주 세포에서 감소된다. 바람직하게는, 유전적 변형은 효모 세포의 게놈에서 자일로스, 자일룰로스 및 아라비노스를 비롯한 알도펜토스를 환원시킬 수 있는 비특이적 알도스 리덕타제를 암호화하는 유전자의 각각의 내생성 카피의 발현을 감소시키거나 불활성화시킨다. 주어진 세포는 이배수성, 다배수성 또는 이수배수성의 결과로서 비특이적 알도스 리덕타제를 암호화하는 유전자의 다수의 카피들을 포함할 수 있고/있거나, 세포는 아미노산 서열에서 상이하고 상이한 유전자에 의해 각각 암호화되는 알도스 리덕타제 활성을 가진 여러 상이한 (동종)효소들을 함유할 수 있다. 또한, 이러한 경우, 바람직하게는 비특이적 알도스 리덕타제를 암호화하는 각각의 유전자의 발현이 감소되거나 불활성화된다. 바람직하게는, 유전자는 유전자의 적어도 일부의 결실 또는 유전자의 파괴에 의해 불활성화되므로, 이 상황에서 용어 유전자는 암호화 서열의 상류 또는 하류에 있는 임의의 비-암호화 서열도 포함하고, 이러한 서열의 (부분적) 결실 또는 불활성화는 숙주 세포에서 비특이적 알도스 리덕타제 활성의 발현을 감소시킨다. 본 발명의 효모 세포에서 감소될 활성을 가진 알도스 리덕타제를 암호화하는 뉴클레오타이드 서열 및 이러한 알도스 리덕타제의 아미노산 서열은 국제 특허출원 공개 제WO 06/009434호에 기재되어 있고, 예를 들면, 사카로마이세스 세레비지애의 (비특이적) 알도스 리덕타제 유전자인 GRE3 유전자(Traff et al., 2001, Appl. Environm. Microbiol. 67: 5668-5674) 및 다른 종에서의 이의 오르톨로그를 포함한다.

한 실시양태에서, 본 발명에 따른 효모 세포는 (a) 효모 세포 내로의 자일로스 및/또는 아라비노스의 증가된 수송; (b) 이화생성물 억제에 대한 감소된 민감성; (c) 에탄올, 삼투성 또는 유기산에 대한 증가된 내성; 및 (d) 부산물의 감소된 생성으로 구성된 군으로부터 선택된 특성들 중 하나 이상을 발생시키는 추가 유전적 변형을 포함할 수 있다. 부산물은 원하는 발효 생성물 이외의 탄소 함유 분자를 의미하는 것으로서 이해되고, 예를 들면, 자일리톨, 아라비니톨, 글리세롤 및/또는 아세트산을 포함한다. 본원에 기재된 임의의 유전적 변형은 고전적인 돌연변이유발 및 원하는 돌연변이체에 대한 스크리닝 및/또는 선별에 의해, 또는 단순히 원하는 특성을 가진 자연발생적 돌연변이체에 대한 스크리닝 및/또는 선별에 의해 도입될 수 있다. 대안적으로, 유전적 변형은 내생성 유전자의 과다발현 및/또는 내생성 유전자의 불활성화로 구성될 수 있다. 효모 세포 내로의 아라비노스 및/또는 자일로스의 증가된 수송을 위해 과다발현이 요구되는 유전자는 바람직하게는 헥소스 또는 펜토스 수송제를 암호화하는 유전자들로부터 선택된다. 사카로마이세스 세레비지애 및 다른 효모에서, 이 유전자들은 HXT1, HXT2, HXT3, HXT4, HXT5, HXT7 및 GAL2를 포함하고, 이들 중 HXT7, HXT5 및 GAL2가 가장 바람직하다(문헌(Sedlack and Ho, Yeast 2004; 21: 671-684) 참조). 효모에서의 발현을 위한 또 다른 바람직한 수송제는 피키아 스티피티스 SUT1 유전자에 의해 암호화된 글루코스 수송제이다(Katahira et al., 2008, Enzyme Microb. Technol. 43: 115-119). 유사하게, 다른 종에서의 이 수송제 유전자들의 오르톨로그들도 과다발현될 수 있다. 본 발명의 효모 세포에서 과다발현될 수 있는 다른 유전자는 해당 효소 및/또는 에탄올생성 효소, 예컨대, 알코올 데하이드로게나제를 암호화하는 유전자를 포함한다. 불활성화를 위한 바람직한 내생성 유전자는 헥소스 키나제 유전자, 예를 들면, 사카로마이세스 세레비지애 HXK2 유전자(문헌(Diderich et al., 2001, Appl. Environ. Microbiol. 67: 1587-1593) 참조); 사카로마이세스 세레비지애 MIG1 또는 MIG2 유전자; 글리세롤 대사에 관여하는 효소를 암호화하는 유전자, 예컨대, 사카로마이세스 세레비지애 글리세롤포스페이트 데하이드로게나제 1 및/또는 2 유전자; 또는 다른 종에서의 이 유전자들의 (혼성화) 오르톨로그들을 포함한다. 자일로스 발효를 위한 숙주 세포의 다른 바람직한 추가 변형은 문헌(van Maris et al., 2006, Antonie van Leeuwenhoek 90:391-418), 및 국제 특허출원 공개 제WO 2006/009434호, 제WO 2005/023998호, 제WO 2005/111214호 및 제WO 2005/091733호에 기재되어 있다. 가능한 한, 본원에 기재된 본 발명의 효모 세포의 유전적 변형들 중 임의의 유전적 변형은 바람직하게는 자가-클로닝 유전적 변형에 의해 도입되거나 변경된다.

본 발명에 따른 바람직한 숙주 세포는 바람직하게는 혐기성 조건, 즉 혐기성 발효 과정에 대해 본원에서 이하에 정의된 조건 하에서 탄소/에너지 공급원, 바람직하게는 단독 탄소/에너지 공급원인, 자일로스 및 아라비노스 중 하나 이상 상에서 생장하는 능력을 가진다. 바람직하게는, 숙주 세포는 탄소/에너지 공급원인 자일로스 상에서 생장할 때 본질적으로 자일리톨을 생성하지 않는다. 예를 들면, 생성된 자일리톨은 검출 한계 미만 또는, 예를 들면, 몰 기준으로 소비된 탄소의 5%, 2%, 1%, 0.5% 또는 0.3% 미만이다. 바람직하게는, 효모 세포는 탄소/에너지 공급원인 아라비노스 상에서 생장할 때 본질적으로 아라비니톨을 생성하지 않는다. 예를 들면, 생성된 아라비니톨은 검출 한계 미만 또는, 예를 들면, 몰 기준으로 소비된 탄소의 5%, 2%, 1%, 0.5% 또는 0.3% 미만이다.

본 발명의 바람직한 세포는 호기성 조건 하에서 0.01, 0.02, 0.05, 0.1, 0.2, 0.25 또는 0.3 h^-1 이상의 속도 또는, 보다 바람직하게는, 혐기성 조건 하에서 0.005, 0.01, 0.02, 0.05, 0.08, 0.1, 0.12, 0.15 또는 0.2 h^-1 이상의 속도로 헥소스, 펜토스, 글리세롤, 아세트산 및 이들의 조합물 중 하나 이상 상에서 생장하는 능력을 가진다. 따라서, 바람직하게는, 숙주 세포는 호기성 조건 하에서 0.01, 0.02, 0.05, 0.1, 0.2, 0.25 또는 0.3 h^-1 이상의 속도 또는, 보다 바람직하게는, 혐기성 조건 하에서 0.005, 0.01, 0.02, 0.05, 0.08, 0.1, 0.12, 0.15 또는 0.2 h^-1 이상의 속도로 단독 탄소/에너지 공급원인, 자일로스 및 아라비노스 중 하나 이상 상에서 생장하는 능력을 가진다. 보다 바람직하게는, 숙주 세포는 호기성 조건 하에서 0.01, 0.02, 0.05, 0.1, 0.2, 0.25 또는 0.3 h^-1 이상의 속도 또는, 보다 바람직하게는, 혐기성 조건 하에서 0.005, 0.01, 0.02, 0.05, 0.08, 0.1, 0.12, 0.15 또는 0.2 h^-1 이상의 속도로 단독 탄소/에너지 공급원인, 헥소스(예를 들면, 글루코스)와 자일로스 및 아라비노스 중 하나 이상의 혼합물(1:1 중량비) 상에서 생장하는 능력을 가진다. 가장 바람직하게는, 숙주 세포는 호기성 조건 하에서 0.01, 0.02, 0.05, 0.1, 0.2, 0.25 또는 0.3 h^-1 이상의 속도 또는, 보다 바람직하게는, 혐기성 조건 하에서 0.005, 0.01, 0.02, 0.05, 0.08, 0.1, 0.12, 0.15 또는 0.2 h^-1 이상의 속도로 단독 탄소/에너지 공급원인, 헥소스(예를 들면, 글루코스), 자일로스 및 아라비노스 중 하나 이상 및 글리세롤의 혼합물(1:1:1 중량비) 상에서 생장하는 능력을 가진다.

작물 당으로부터 바이오에탄올을 생성하기 위해 다양한 유기체들을 도입하자는 제안이 수년에 걸쳐 제기되어 왔다. 그러나, 사실상 모든 주요 바이오에탄올 생성 과정들은 에탄올 생산자로서 사카로마이세스 속의 효모를 계속 사용하고 있다. 이것은 산업 공정에 있어서 사카로마이세스 종들의 많은 매력적인 특징들, 즉 높은 산, 에탄올 및 삼투압 내성, 혐기성 생장 능력, 및 그의 높은 알코올 발효 능력 때문이다. 숙주 세포로서 바람직한 효모 종은 사카로마이세스 세레비지애, 사카로마이세스 불데리(S. bulderi), 사카로마이세스 바르네티(S. barnetti), 사카로마이세스 엑시구우스(S. exiguus), 사카로마이세스 우바룸(S. uvarum), 사카로마이세스 다이아스타티커스(S. diastaticus), 클루이베로마이세스 락티스(K. lactis), 클루이베로마이세스 마르시아누스(K. marxianus) 또는 클루이베로마이세스 프라길리스(K. fragilis)를 포함한다.

본 발명의 효모 세포는 식물 바이오매스, 셀룰로스, 헤미셀룰로스, 펙틴, 람노스, 갈락토스, 프럭토스, 말토스, 말토덱스트린, 리보스, 리불로스, 전분 또는 전분 유도체, 수크로스, 락토스 및 글리세롤을 예를 들면, 발효가능한 당으로 전환시킬 수 있다. 따라서, 본 발명의 세포는 하나 이상의 효소, 예컨대, 셀룰라제(엔도셀룰라제 또는 엑소셀룰라제); 셀룰로스를 글루코스 단량체로 전환시키고 헤미셀룰로스를 자일로스 및 아라비노스 단량체로 전환시키는데 필요한 헤미셀룰라제(엔도자일라나제, 엑소자일라나제 또는 아라비나제); 펙틴을 글루쿠론산 및 갈락투론산으로 전환시킬 수 있는 펙티나제; 또는 전분을 글루코스 단량체로 전환시킬 수 있는 아밀라제를 발현할 수 있다.

효모 세포는 바람직하게는 피루베이트를 원하는 발효 생성물, 예컨대, 에탄올, 부탄올, 락트산, 3-하이드록시-프로피온산, 아크릴산, 아세트산, 석신산, 시트르산, 푸마르산, 말산, 이타콘산, 아미노산, 1,3-프로판-다이올, 에틸렌, 글리세롤, β-락탐 항생제 또는 세팔로스포린으로 전환시키는 데에 요구되는 효소 활성을 추가로 포함한다.

본 발명의 바람직한 세포는 알코올 발효, 바람직하게는 혐기성 알코올 발효를 천연적으로 수행할 수 있는 세포이다. 본 발명의 세포는 바람직하게는 에탄올에 대한 높은 내성, 낮은 pH에 대한 높은 내성(즉, 약 5, 약 4, 약 3 또는 약 2.5보다 더 낮은 pH에서 생장할 수 있음) 및 유기산, 예컨대, 락트산, 아세트산 또는 포름산 및/또는 당 분해 생성물, 예컨대, 푸르푸랄 및 하이드록시-메틸푸르푸랄에 대한 높은 내성, 및/또는 고온에 대한 높은 내성을 가진다.

본 발명의 세포의 상기 특성들 또는 활성들 중 임의의 특성 또는 활성은 효모 세포에 천연적으로 존재할 수 있거나 유전적 변형에 의해 도입될 수 있거나 변형될 수 있다.

본 발명의 세포는 에탄올의 생성에 적합한 세포일 수 있다. 그러나, 본 발명의 세포는 에탄올 이외의 발효 생성물의 생성에 적합할 수 있다. 이러한 비-에탄올성 발효 생성물은 원칙적으로 진핵 미생물, 예컨대, 효모 또는 사상 진균에 의해 생성될 수 있는 임의의 벌크 또는 미세한 화학물질을 포함한다.

발효 과정은 바람직하게는 효모 세포에 최적인 온도에서 실시된다. 따라서, 대부분의 효모들 또는 진균 숙주 세포들의 경우, 발효 과정은 약 42℃ 미만, 바람직하게는 약 38℃ 미만의 온도에서 수행된다. 효모 또는 사상 진균 숙주 세포의 경우, 발효 과정은 바람직하게는 약 35℃, 약 33℃, 약 30℃ 또는 약 28℃보다 더 낮은 온도, 및 약 20℃, 약 22℃ 또는 약 25℃보다 더 높은 온도에서 수행된다.

상기 과정에서 자일로스 및/또는 글루코스 상에서의 에탄올 수율은 바람직하게는 약 50%, 약 60%, 약 70%, 약 80%, 약 90%, 약 95% 또는 약 98% 이상이다. 에탄올 수율은 본원에서 이론상 최대 수율의 백분율로서 정의된다.

본 발명은 발효 생성물을 제조하는 방법에 관한 것이기도 하다.

발효 과정은 회분식, 유가식 또는 연속식 모드로 수행될 수 있다. 별개의 가수분해 및 발효(SHF) 과정 또는 동시적인 당화 및 발효(SSF) 과정도 적용될 수 있다. 이 발효 과정 모드들의 조합도 최적 생산성을 위해 가능할 수 있다.

본 발명에 따른 발효 과정은 호기성 조건 및 혐기성 조건 하에서 실시될 수 있다. 바람직하게는, 상기 과정은 미호기성 또는 산소-한정된 조건 하에서 수행된다.

혐기성 발효 과정은 본원에서 산소의 부재 하에서 또는 실질적으로 산소가 소비되지 않는, 바람직하게는 약 5 mmol/ℓ/시간, 약 2.5 mmol/ℓ/시간 또는 약 1 mmol/ℓ/시간 미만의 산소가 소비되는 조건 하에서 실시되는 발효 과정으로서 정의되고, 이때 유기 분자는 전자 공여자 및 전자 수용자 둘다로서 작용한다.

산소-한정된 발효 과정은 산소 소비가 기체로부터 액체로의 산소 전달에 의해 한정되는 과정이다. 산소 한정의 정도는 유입하는 기체 유동의 양 및 조성뿐만 아니라 이용되는 발효 장치의 실제 혼합/질량 전달 성질에 의해 결정된다. 바람직하게는, 산소-한정된 조건 하에서의 과정에서 산소 소비의 속도는 약 5.5 mmol/ℓ/시간 이상, 보다 바람직하게는 약 6 mmol/ℓ/시간 이상, 예컨대, 7 mmol/ℓ/시간 이상이다. 본 발명의 방법은 발효 생성물의 회수를 포함한다.

발효 생성물의 회수를 위해 기존 기술이 이용된다. 상이한 발효 생성물들에 대해 상이한 회수 과정들이 적절하다. 수성 혼합물로부터 에탄올을 회수하는 기존 방법들은 공통적으로 분획화 및 흡착 기법을 이용한다. 예를 들면, 증류관을 이용하여 수성 혼합물 중의 에탄올을 함유하는 발효된 생성물을 가공함으로써 농축된 에탄올 함유 혼합물을 생성한 후, 이 혼합물을 분획화(예를 들면, 분획 증류 또는 다른 유사 기법)로 처리할 수 있다. 그 다음, 가장 높은 농도의 에탄올을 함유하는 분획을 흡착제에 통과시켜 모두는 아닐지라도 대부분의 남은 물을 에탄올로부터 제거할 수 있다.

본 명세서에서 인용된 모든 특허들 및 참고문헌들은 전체로서 본원에 참고로 도입된다.

하기 실시예는 예시 목적을 위해 제공될 뿐, 본 발명의 범위를 어떠한 방식으로든 한정하기 위한 것이 아니다.

실시예

속도 및 양 둘다의 관점에서 글리세롤 및 아세트산의 혐기성 (공-)전환을 개선하기 위해, 대안적 유전자 조합물을 시험하였다. 경로 내의 다수의 효소들, 즉 글리세롤 데하이드로게나제, 다이하이드록시아세톤 키나제 및 아세트알데하이드 데하이드로게나제에 대해, 혐기성 조건 하에서 글리세롤 및 아세트산을 펜토스 및 헥소스 당 다음에 에탄올로 전환시키는 효모 균주의 능력을 더 향상시킬 수 있는 다수의 대안적 유전자들을 시험하였다

선택된 효소 후보들은 하기 표 8에 제공되어 있다.

[표 8]

사카로마이세스 세레비지애에서의 최적 발현을 위해 국제 특허출원 공개 제WO 2008/000632호에 기재된 바와 같이 상기 유전자들을 코돈-쌍 최적화하였다. 단백질 서열의 서열번호는 표 8에 표시되어 있다.

유전자들의 4개 카테고리들을 정의하였다: A) 서열번호 1 내지 서열번호 5로 구성된 AADH-군; B) 서열번호 6으로 구성된 ACS-군; C) 서열번호 7 내지 서열번호 10으로 구성된 GLD-군; 및 D) 서열번호 11 내지 서열번호 14로 구성된 DAK-군.

각각의 유전자가 높은 수준 및 중간/낮은 수준에서 발현될 수 있게 하는 발현 구축물을 제조하였다.

군 A의 경우, TDH3-프로모터 및 TDH1-프로모터를 선택하였다(각각 서열번호 15 및 서열번호 16). 이 유전자들의 터미네이터는 모든 경우들에서 PGK1-터미네이터(서열번호 17)이었다.

군 B의 경우, PGK1-프로모터 및 PRE3-프로모터를 선택하였다(각각 서열번호 18 및 서열번호 19). 이 유전자들의 터미네이터는 모든 경우들에서 PGI1-터미네이터(서열번호 20)이었다.

군 C의 경우, ENO1-프로모터 및 ACT1-프로모터를 선택하였다(각각 서열번호 21 및 서열번호 22). 이 유전자들의 터미네이터는 모든 경우들에서 CYC1-터미네이터(서열번호 23)이었다.

군 D의 경우, TPI1-프로모터 및 ATG7-프로모터를 선택하였다(각각 서열번호 24 및 서열번호 25). 이 유전자들의 터미네이터는 모든 경우들에서 ENO1-터미네이터(서열번호 26)이었다.

표 9에 표시된 바와 같이 총 28개의 상이한 발현 카세트들이 조립되었다.

[표 9]

도 2에 나타낸 바와 같이, 각각의 플랭크에서 연결제를 가진 프라이머를 사용하여 조립된 발현 카세트들(ASS)을 PCR로 증폭하였다. PCR 생성물은 CAS로서 표기되어 있다. 도 2에 나타낸 바와 같이, CAS 요소들은 삽입 플랭크 및/또는 또 다른 CAS 및/또는 선별 마커와 부분적으로 중첩되어, 컴피턴트(competent) 효모 세포 내로의 도입 시 형질전환 컴피턴트 효모 균주의 게놈 내로의 유전 요소들의 재조합을 가능하게 한다.

다원적(multifactorial) 경로 디자인에서, 국제 특허출원 제PCT/EP2013/056623호에 기재된 기술을 이용하여 4개의 카테고리들(군 A, B, C 및 D)의 개별 구성원들의 모든 가능한 조합물들을 조합하였다. 발현 카세트들의 모든 1280개의 상이한 가능한 조합물들을 생성하고 사용하여 gpd1gpd2 이중 결실 균주인 균주 RN1069를 형질전환시켰다(재료 및 방법 참조).

도 2에 나타낸 바와 같이, 원하는 경로가 재조합에 의해 그들의 게놈 내로 성공적으로 삽입되어 있는 효모 형질전환체들의 선택을 가능하게 하기 위해 항생제 내성 마커를 다원적 경로 디자인에 포함시켰다. 선별 마커의 서열은 서열번호 27로서 제공되어 있다.

추가로, 도 2에서 5'-INT1 및 3'-INT1로서 표기된 2개의 삽입 플랭크들을 형질전환 혼합물에 포함시켰다. 이 2개의 플랭킹 영역들의 서열들은 숙주 균주의 게놈 DNA를 주형으로서 사용하고 INT1의 5'-플랭크를 위한 프라이머 조합물 서열번호 30 및 서열번호 31(도 2) 및 3'-INT1 플랭크를 위한 프라이머 조합물 서열번호 42 및 서열번호 43(도 2)을 사용하는 PCR 반응에서 생성된다.

재료 및 방법

일반적인 분자생물학 기법

달리 표시되어 있지 않은 한, 이용된 방법은 표준 생화학적 기법이다. 적합한 일반적인 방법론 교재의 예에는 문헌(Sambrook et al., Molecular Cloning, a Laboratory Manual (1989)) 및 문헌(Ausubel et al., Current Protocols in Molecular Biology (1995), John Wiley & Sons, Inc.)이 포함된다.

배지

실험에서 사용된 배지는 실시예에 표시된 바와 같이 당으로 보충된 YEP 배지(10 g/ℓ 효모 추출물, 20 g/ℓ 펩톤) 또는 고체 YNB 배지(6.7 g/ℓ 효모 질소 베이스, 15 g/ℓ 한천)이었다. 고체 YEP 배지의 경우, 멸균 전에 15 g/ℓ의 한천을 액체 배지에 첨가하였다.

혐기성 스크리닝 실험에서 광물 배지를 사용하였다. 광물 배지의 조성은 문헌(Verduyn et al., Yeast (1992), Volume 8, 501-517)에 기재되어 있다. 그러나, 황산암모늄의 사용이 생략되었고, 그 대신에 질소 공급원으로서 우레아(2.3 g/ℓ)를 사용하였다. 추가로, 에르고스테롤(0.01 g/ℓ), 트윈80(0.42 g/ℓ) 및 당(표시된 바와 같음)을 첨가하였다.

(DNA 구축물의 삽입에 의한) 균주 RN1069의 형질전환체는 히스티딘 영양요구성 균주이다.

균주

실험에서 사용된 균주는 RN1041 및 RN1069이었다. RN1041은 국제 특허출원 공개 제WO 2012/067510호에 기재되어 있다. 이 균주는 하기 유전형을 가진다:

MAT a, ura3-52, leu2-112, his3::loxP, gre3::loxP, loxP-pTPI1::TAL1, loxP-pTPI1::RKI1, loxP-pTPI1-TKL1, loxP-pTPI1-RPE1, 델타::pADH1-XKS1-tCYC1-LEU2, 델타::URA3-pTPI1-xylA-tCYC1

MAT a = 교배형 a

각각 URA3, LEU2 및 HIS3 유전자에서 ura3 -52, leu2 -112 및 HIS3::loxP 돌연변이. ura3 -52 돌연변이는 피로마이세스 xylA 과다발현 구축물 상의 URA3 유전자에 의해 보완되고; leu2-112 돌연변이는 XKS1 과다발현 구축물 상의 LEU2 유전자에 의해 보완된다. HIS3 유전자의 결실은 히스티딘 영양요구성을 야기한다. 이러한 이유로, RN1041은 생장을 위해 배지에서 히스티딘을 필요로 한다.

gre3::loxP는 알도스 리덕타제를 암호화하는 GRE3 유전자의 결실이다. loxP 부위는 마커 제거 후 게놈에 남는다.

본원에 기재된 실험에서 loxP-pTPI1은 TPI1 유전자의 프로모터에 의한 천연 프로모터의 치환에 의한 비-산화적 펜토스 포스페이트 경로의 유전자의 과다발현을 표시한다. 강한 항시성 TPI1 프로모터의 상류에 존재하는 loxP 부위는 마커 제거 후 게놈에 남는다(Kuyper et al, FEMS Yeast Research 5 (2005) 925-934).

델타::는 Ty1 레트로트랜스포존(retrotransposon)의 긴 말단 반복부 상에서의 재조합 후 구축물의 염색체 삽입을 의미한다.

균주 RN1001은 균주 RN1041의 모균주, 즉 HIS3 유전자의 결실 전의 균주이다.

균주 RN1069는 RN1041로부터 유래한다: GPD1 및 GPD2 유전자가 유전자 치환에 의해 파괴되었다. 이를 위해, GPD1 또는 GPD2의 개방 판독 프레임(ORF) 바로 옆의 서열과 상동한 서열에 의해 플랭킹된 우성 항생제 내성 마커를 PCR로 구축하고 사용하여 균주 RN1041을 형질전환시켰다. 이 유전자 파괴 카세트들은 각각 서열번호 28 및 서열번호 29로서 서열목록에 포함되었다. 균주 RN1069의 구축은 국제 특허출원 공개 제WO 2013/081456호에도 상세히 기재되어 있다. 균주 RN1069의 유전형은 다음과 같다:

MAT a, ura3-52, leu2-112, his3::loxP, gre3::loxP, loxP-pTPI1::TAL1, loxP-pTPI1::RKI1, loxP-pTPI1-TKL1, loxP-pTPI1-RPE1, 델타::pADH1-XKS1-tCYC1-LEU2, 델타::URA3-pTPI1-xylA-tCYC1 gpd1::hphMX, gpd2::natMX.

균주 RN1189를 기준 균주로서 사용하였다. 균주 RN1189는 국제 특허출원 공개 제WO 2013/081456호에 기재되어 있다. 요약하건대, 균주 RN1189는 균주 RN1069를 플라스미드 pRN977로 형질전환시킴으로써 구축되었다. 플라스미드 pRN977은 2μ 플라스미드이고 하기 특징을 함유한다: 형질전환체의 선별을 위한 HIS3 유전자, 에스케리키아 콜라이에서의 선별을 위한 앰피실린 내성 마커, PGK1-프로모터 및 ADH1-터미네이터의 조절 하에 있는 에스케리키아 콜라이 adhE 유전자, TPI1-프로모터 및 PGI1-터미네이터의 조절 하에 있는 사카로마이세스 세레비지애 DAK1 유전자, 및 ACT1-프로모터 및 CYC1-터미네이터의 조절 하에 있는 에스케리키아 콜라이 gldA 유전자. 모든 프로모터들 및 터미네이터들은 사카로마이세스 세레비지애로부터 유래한다.

균주 구축

균주 구축 방법은 국제 특허출원 제PCT/EP2013/056623호에 기재되어 있다. 상기 특허출원에는 효모의 형질전환 시 관심있는 다양한 유전자들로부터의 발현 카세트들이 한 경로로 조합되고 이 효모 게놈의 특정 좌위 내로 삽입되도록 이 발현 카세트들을 구축할 수 있게 하는 기법이 기재되어 있다. 개략도가 도 2에 제시되어 있다.

먼저, 효모 게놈 내의 삽입 부위를 선택한다(예를 들면, INT1). 연결제에 의해 플랭킹된, 삽입 좌위의 상류 및 하류 부분의 약 500 bp DNA 단편을, PCR을 이용하여 증폭한다. 이 연결제는 효모(예를 들면, 사카로마이세스 세레비지애) 내로의 형질전환 시 경로의 정확한 생체내 재조합을 가능하게 하는 50 bp 서열이다. 도 2에 표시되어 있는 바와 같이, 각각의 플랭크에서 상이한 연결제를 도입하는 PCR로 관심있는 유전자 및 선별 내성 마커(예를 들면, kanMX)를 생성한다. DNA 단편을 사용한 효모 세포의 형질전환 시, 생체내 재조합 및 게놈 내로의 삽입이 원하는 위치에서 일어난다. 상동성 재조합을 허용하는 연결제들이 불변 상태로 유지되는 한, 경로로부터의 하나 이상의 유전자가 (또) 다른 유전자(들) 또는 유전 요소(들)로 치환될 수 있기 때문에, 이 기법은 경로 조정(tuning)을 가능하게 한다(국제 특허출원 제PCT/EP2013/056623호).

발현 카세트 구축

개방 판독 프레임(ORF), 프로모터 서열 및 터미네이터를 DNA 2.0(미국 캘리포니아주 94025 멘로 파크 소재)에서 합성하였다. 이 유전 요소들의 서열은 서열번호 1 내지 서열번호 26으로서 나열되어 있다. 문헌(Engler et al., 2011) 및 이 문헌에서 인용된 참고문헌에 기재된 바와 같이 골든 게이트(Golden Gate) 기술을 이용하여 프로모터, ORF 및 터미네이터 서열을 조립하였다. 조립된 발현 카세트를 BsaI에 의해 분해된 골격 벡터 내로 라이게이션시켰다: 군 A(표 2)를 p5Abbn(서열번호 44) 내로 라이게이션시켰고, 군 B(표 2)를 pBCbbn(서열번호 45) 내로 라이게이션시켰고, 군 C(표 2)를 pCDbbn(서열번호 46) 내로 라이게이션시켰고, 군 D(표 2)를 pD3bbn(서열번호 47) 내로 라이게이션시켰다.

발현 카세트 증폭

전술된 바와 같이 생성된 조립된 발현 카세트("발현 카세트 구축" 단락), 삽입 플랭크 및 선별 마커를, 서열번호 30 내지 서열번호 43으로서 기재된 프라이머(하기 참조)를 사용하여 PCR로 증폭하였다. 효모에서의 선별을 위한 G418 내성 마커인 kanMX 마커를 이 마커가 함유된 플라스미드로부터 증폭하였다. 마커의 서열은 서열번호 27로서 기재되어 있다.

서열번호 30 및 서열번호 31(5'-INT1 플랭크), 및 서열번호 42 및 서열번호 43(3'-INT1 플랭크)을 사용하여 INT1 플랭크를 균주 CEN.PK113-7D로부터의 게놈 DNA로부터 증폭하였다.

[표 10]

효모 세포의 형질전환

문헌(Schiestl and Gietz, Current Genetics (1989), Volume 16, 339-346)에 기재된 방법에 따라 효모 형질전환을 수행하였다.

마이크로플레이트에서의 혐기성 생장 실험

평저 NUNC 마이크로플레이트(MTP)에서 생장 실험을 수행하였다. 275 ㎕의 배지를 각각의 웰에 충전시켰다. 배지의 조성은 다음과 같았다:

광물 배지(문헌(Verduyn et al., 1992)에 근거함, 황산암모늄 대신에 우레아);

2% 글루코스;

2% 자일로스;

1% 글리세롤;

2 g/ℓ 아세트산; 및

200 ㎍/㎖ 히스티딘(his3::loxP인 균주 RN1069 및 유도체의 경우) pH 4.5.

모든 MTP들을 알루미늄 밀봉재로 밀봉하였다. 그 다음, MTP를 혐기성 항온처리기(인포르스(Infors)) 내에 배치하였다. 48시간의 생장 후, 혐기성 인포르스로부터 MTP들을 제거하였다. 그 다음, 플레이트를 마이크로플레이트 원심분리기 내에서 2750 rpm에서 10분 동안 회전시켰다. 그 다음, 150 ㎕의 상청액을 NMR 분석에 적합한 MTP로 옮겼다.

NMR 분석

샘플에서 글루코스, 자일로스, 글리세롤, 아세트산 및 에탄올을 정량하기 위해, 150 ㎕의 샘플을 적합한 바이알 내로 정확히 옮긴다. 그 후, D₂O 중의 말레산(20 g/ℓ), EDTA(40 g/ℓ) 및 미량의 DSS(4,4-다이메틸-4-실라펜탄-1-설폰산)를 함유하는 100 ㎕의 내부 표준 용액, 및 450 ㎕의 D₂O를 첨가한다. 27℃의 온도에서 수압(3 Hz에 상응하는 동력)을 이용한 펄스 프로그램을 이용하여 냉동-프로브를 갖춘 브루커 아반스(Bruker Avance) III 700 MHz 상에서 1D ¹H NMR 스펙트럼을 기록한다.

하기 신호에 근거하여 분석물 농도를 계산한다(DSS를 기준으로 한 δ):

5.22 ppm에서 α-글루코스 피크(d, 0.38 H, J = 4 Hz),

5.18 ppm에서 α-자일로스 피크(d, 0.37 H, J = 4 Hz),

3.55 ppm에서 글리세롤 피크(dd, 2 H, J_1,2 = 6 Hz 및 J_1a,1b = 12 Hz)

1.91 ppm에서 아세트산 피크(s, 3 H)

1.17 ppm에서 에탄올 피크(t, 3 H, J = 7Hz)

표준물을 위한 신호 사용자:

6.05 ppm에서의 말레산 피크(s, 2H)

실시예 1

효모 형질전환체의 전체 조합 어레이의 구축

균주의 전체 조합 어레이를 전술된 바와 같이 구축하였다. 이를 위해, 균주 RN1069를 유전자들의 모든 1280개 혼합물들로 형질전환시켰다(상기 참조). 20 g 글루코스/ℓ 및 200 ㎍ G418/㎖을 함유하는 YEP 한천 상에 형질전환 혼합물을 플레이팅하였다.

각각의 형질전환에 대해, 2개의 독립적인 형질전환체들을 선별하고 마이크로플레이트 내의 YEPD 한천으로 옮겼다(웰당 1개 콜로니). 각각의 마이크로플레이트 상에서 기준 균주도 접종시켰다: RN1189.

실시예 2

생장 실험 및 결과의 분석

선택된 콜로니 및 균주의 어레이(실시예 1)를 재료 및 방법에 기재된 실험 설정에서 시험하였다.

요약하건대, YEPD 한천을 가진 마이크로플레이트 내의 균주를 사용하여, 마이크로플레이트 내에서 200 ㎍ 히스티딘/㎖, 2% 글루코스, 2% 자일로스, 1% 글리세롤 및 2 g/ℓ 아세트산을 함유하는 275 ㎕의 광물 배지를 접종하였다. 배지의 pH를 아세트산의 pKa보다 더 낮은 4.5로 설정하였다. 마이크로플레이트를 밀봉하고 혐기성 조건 하에서 48시간 동안 항온처리하였다. 세포를 원심분리로 회전시키고 상청액을 NMR로 분석하였다. 상위 150개의 결과들이 하기 표 11에 제공되어 있다.

[표 11]

도 3에서, 발효액 중의 잔류 아세트산 농도는 잔류 글리세롤 농도의 함수로서 작도되어 있다. 결과는 잔류 글리세롤 농도와 잔류 아세트산 농도 사이에 강한 상관관계가 존재한다는 것을 명확히 보여준다: 발효 후 잔류 글리세롤 농도가 낮을수록, 잔류 아세트산 농도가 낮아진다. 이것은 국제 특허출원 공개 제WO 2013/081456호에서 이미 밝혀진 바와 같이 두 경로들이 서로 연결되어 있다는 것을 시사한다.

균주들 중 하나는 거의 모든 아세트산을 소비하였고(도 3에서 하부 좌측 모서리의 데이터 점) 다른 형질전환체들을 능가하였다. 이 균주는 YD01247로서 명명되었다.

기준 균주 RN1189를 포함하는 총 2592개의 균주들을 스크리닝하였다. 기준 균주 RN1189는 27회 포함되었다. 다른 균주들에 비해 기준 균주 RN1189의 성능(총 2592개)은 도 6에 표시되어 있다. 균주들은 전술된 바와 같이 순위가 매겨져 있는데, 이때 보다 더 우수한 성능의 균주는 보다 더 밝은 색채로 표시되어 있다(그리고 그래프의 하부 좌측 모서리에 더 가깝다). 보다 덜 우수한 성능의 균주들은 보다 더 짙은 색채로 표시되어 있고, 색채의 변화는 점진적이다. 예외는 기준 균주인 RN1189가 가장 짙은 색채로 표시되어 있다는 것이다.

발현 카세트들의 가장 우수한 조합물을 평가하기 위해, NMR 데이터를 이용하여 계산을 수행하였다. 생성된 에탄올의 총량으로부터 자일로스 및 글루코스로부터 생성된 에탄올의 이론상 양을 차감함으로써 1) 배지에 남겨진 잔류 아세트산 농도, 2) 배지에 남겨진 잔류 글리세롤 농도, 및 3) 글리세롤 및 아세트산으로부터 생성된 에탄올의 양에 대해 모든 균주들에게 점수를 부여하였다.

상기 3개의 점수들을 더하여 모든 샘플들의 순위를 매겼다(표 11). 이 마지막 점수에 근거한 가장 우수한 150개의 균주들이 가시화되었고 도 4에도 표시되어 있다.

가장 우수한 150개의 균주들로부터, 군 A, B, C 및 D(상기 참조)에 속하는 발현 카세트들 중 어떤 발현 카세트가 과다발현되었는지를 확인하였다. 표 11 및 12를 참조한다.

[표 12]

관찰결과는 다음과 같다:

a) 일반적으로, (보다 더) 약한 프로모터에 비해 강한 프로모터를 보유하는 발현 카세트가 150개의 균주들에서 과다발현되기 때문에 (보다 더) 약한 프로모터의 사용보다 강한 프로모터의 사용이 더 빈번하게 카운팅되고;

b) CAS2 및 CAS3이 AADH-군에서 과다발현되고;

c) CAS11 및 CAS12가 거의 동등하게 잘 발현되고;

d) 발현 카세트 CAS15 및 CAS16도 잘 발현되지만, CAS13 및 CAS14가 GLD-군에서 약간 과다발현되는 듯하고;

e) CAS21 및 CAS23도 상위 150개의 균주들에서 잘 발현되지만, CAS23이 DAK-군에서 과다발현되고;

f) 시험된 모든 발현 카세트들(CAS)이 상위 150개의 균주들에서 발현되는데, 이것은 다수의 해법들이 존재한다는 것을 시사한다.

그러나, 발현 카세트들의 많은 조합물들이 기준 균주 RN1189에 비해 증가된 글리세롤 및 아세트산 전환으로 인한 개선된 에탄올 수율을 이끌어내었다. 이것은 발현 카세트들의 많은 다른 조합물들이 글리세롤, 아세트산 및 발효가능한 당으로 구성된 혼합물에서 글리세롤 및 아세트산 둘다를 에탄올로 전환시키기 위한 해결책을 제공할 수 있다는 것을 시사한다. 스크리닝에서 가장 우수한 균주인 균주 YD01247(도 3 및 4)이 이의 일례이다: 이 균주는 발현 카세트 CAS01, CAS12, CAS13 및 CAS23으로 구성된다.

다수의 균주들이 모든 사용가능한 아세트산을 거의 소비하였다. 이 균주들은 ℓ당 3 내지 4 g의 글리세롤을 소비할 수 있었다.

실시예 3

발현 카세트들의 가장 우수한 조합물의 재시험

다원적 디자인에서, 발현 카세트들의 가장 우수한 조합물(실시예 2)을 재시험하였다. 균주 YD01247에서 ACS2 유전자의 발현이 약한 프로모터를 가진 구축물(즉, CAS12)의 조절 하에 있었기 때문에, 이 발현 카세트는 실시예 2의 상위 150개 균주들에서 과다발현되지 않았지만 실험 디자인에서도 함께 사용되었다.

균주 RN1069를 군 A, B, C 및 D로부터 선택된 발현 카세트들의 8개 조합물들로 형질전환시켰다(표 13).

[표 13]

형질전환 후, 세포를 20 g 글루코스/ℓ 및 200 ㎍ G418/㎖로 보충된 YEP 한천 상에 스프레딩하였다. R2(이 경우, 3개의 형질전환체들만이 수득되었음)를 제외하고 형질전환당 8개의 독립적인 콜로니들을 사용하여 20 g 글루코스/ℓ 및 200 ㎍ G418/㎖로 보충된 YEP 한천으로 충전된 마이크로플레이트를 접종하였다. 기준 균주로서 RN1069, RN1189 및 YD01247도 8배로 포함되었다. YEPD 한천 및 G418을 가진 마이크로플레이트 내의 균주를 사용하여 마이크로플레이트 내에서 200 ㎍ 히스티딘/㎖, 2% 글루코스, 2% 자일로스, 1% 글리세롤 및 2 g/ℓ 아세트산을 함유하는 275 ㎕의 광물 배지를 삼중으로 접종하였다. 배지의 pH를 아세트산의 pKa보다 더 낮은 4.5로 설정하였다. 마이크로플레이트를 밀봉하고 혐기성 조건 하에서 항온처리하였다. 3개의 상이한 시간 간격에서, 즉 24시간, 48시간 및 72시간 후, 시점당 1개의 플레이트를 혐기성 진탕기로부터 회수하였다. 세포를 원심분리로 회전시키고 상청액을 NMR로 분석하였다. 72시간의 항온처리 후 NMR 결과, 특히 글리세롤 및 아세트산의 잔류 농도가 도 5에 표시되어 있다.

기준 균주들 중 하나인 균주 RN1069에서 잔류 아세트산 농도는 예상된 바와 같이 여전히 2.0 g/ℓ에 가깝다. 마찬가지로, 이 균주도 글리세롤을 소비하지 않았다.

개념 증명 균주 RN1189(국제 특허출원 공개 제WO 2013/081456호)는 ℓ당 평균 0.9 g의 아세트산 및 ℓ당 평균 1.5 g의 글리세롤을 소비하였다.

기준 균주 YD01247은 모든 균주들 중 가장 잘 수행하였다: 잔류 아세트산 농도는 단지 ℓ당 0.2 g이었고(90%의 아세트산이 소비됨) 잔류 글리세롤 농도는 단지 ℓ당 5.5 g이었다.

(R2를 제외한) 재구축된 형질전환체의 잔류 아세트산 농도는 ℓ당 0.3 내지 0.6 g이었고 잔류 글리세롤 농도는 6.6 내지 7.0 g이었다.

형질전환 R2는 형질전환체를 거의 제공하지 않았을 뿐만 아니라, 결과에서 큰 퍼짐(spread)도 관찰되었다. 따라서, 이 결과들은 해석되지 않았다.

결론적으로, R2를 제외한 시험된 발현 카세트들의 모든 조합물들이 혐기성 글리세롤 및 아세트산 전환의 관점에서 기준 균주 RN1189에 비해 성능을 개선하였다.

실시예 4

선별된 형질전환체를 사용한 혐기성 진탕 플라스크 실험

형질전환체의 선별의 성능을 진탕 플라스크에서 시험하였다. 이를 위해, 실시예 2에서 생성된 표 14의 균주들의 예비배양물을 제조하였다.

[표 14]

균주 YD01247, YD01248, YD01249 및 YD01250은 각각 숫자 1, 2, 3 및 4로서 도 7에 표시되어 있다. 균주 YD01251은 글리세롤 및 아세트산 소비의 관점에서 중간 수준으로 잘 수행하는 균주이다.

ℓ당 약 20 g의 글루코스, 약 20 g의 자일로스, 약 10 g의 글리세롤, 약 200 mg의 히스티딘 및 약 2 g의 아세트산(HAc)을 함유하는 25 ㎖의 광물 배지(재료 및 방법에 기재됨)(pH 4.5)로 100 ㎖의 진탕 플라스크를 충전시켰다. 0.5의 초기 OD600을 달성하기 위해 필요한 양으로 예비배양물로부터의 세척된 세포를 사용하여 상기 진탕 플라스크를 이중으로 접종하였다. 발효 동안 혐기성 조건을 달성하기 위해 상기 플라스크를 워터락(waterlock)으로 폐쇄하였다. 항온처리를 32℃ 및 100 rpm에서 수행하였다. 96시간 후, 발효를 종결하고 세포를 원심분리로 회전시켰다. 상청액을 NMR로 분석하였다. 결과는 표 15에 표시되어 있다.

[표 15]

예상된 바와 같이 균주 CEN.PK113-7D만이 글루코스를 발효시킨다. 소비된 당에 근거하여 계산된 에탄올 수율은 진탕 플라스크 발효에서 통상적으로 발견되는 에탄올 수율과 일치하는 0.44이다. 이론상 최대 에탄올 수율은 당의 g당 0.51 g의 에탄올에 이른다.

원칙적으로, 균주 RN1069는 글루코스 및 자일로스 둘다를 발효시킬 수 있다. 그러나, 이 균주는 혐기성 조건 하에서 보조인자 재생을 불가능하게 하는, GPD1 및 GPD2 둘다의 결실을 가진다. 하지만, 이 균주는 글루코스 및 자일로스를 부분적으로 전환시키는데, 이것은 아마도 실험의 초기에 배지 중의 용해된 산소뿐만 아니라 일부 잔류 산소도 진탕 플라스크의 상부 공간에서 사용가능하여 실험의 초기에 일부 보조인자 재활용을 가능하게 하였기 때문이다. 하지만, 에탄올 수율은 낮다(소비된 당의 g당 0.39 g의 에탄올).

플라스미드로부터 AADH, GLD 및 DAK를 발현하는 형질전환된 균주(RN1189), 또는 게놈 내에 삽입된 구축물로부터 AADH, ACS, GLD 및 DAK를 발현하는 형질전환된 균주(YD01247 내지 YD01251)는 소비된 당을 기준으로 한 증가된 에탄올 수율을 보여준다. 0.48 내지 0.50의 에탄올 수율이 달성된다. 이 보다 더 높은 값들은 에탄올로의 글리세롤 및 아세트산의 혐기성 전환 및/또는 글리세롤 생성의 부재로 인해 달성되었다.

균주 YD01247은 다른 YD 균주들보다 자일로스를 덜 소비하였다. 그러나, 이 균주는 실시예 2 및 3에서 이미 밝혀진 바와 같이 거의 모든 아세트산을 소비하였다. 이 균주는 대부분의 글리세롤도 소비하였다. 이 균주는 가장 높은 에탄올 수율을 보여주었다.

다른 YD 균주들도 균주 RN1189에 비해 개선된 성능을 보여준다: 보다 더 많은 글리세롤 및 아세트산이 소비됨으로써 보다 더 높은 에탄올 역가를 이끌어내었다.

이 실험들은 발현 카세트들의 다양한 대안적 조합물들이 혐기성 글리세롤 및 아세트산 전환의 관점에서 기준 균주 RN1189에 비해 성능을 개선함으로써, 모든 경우들에서 보다 더 높은 에탄올 역가 및 일부 경우들에서 보다 더 높은 에탄올 수율을 이끌어내었다는 것을 보여준다.

참고문헌

<110> DSM IP Assets B.V. <120> GLYCEROL AND ACETIC ACID CONVERTING YEAST CELLS WITH IMPROVED ACETIC ACID CONVERSION <130> 29960-WO-PCT <140> PCT/EP2014/068324 <141> 2014-08-29 <150> EP 13182222.3 <151> 2013-08-29 <160> 61 <170> BiSSAP 1.2 <210> 1 <211> 891 <212> PRT <213> Escherichia coli <400> 1 Met Ala Val Thr Asn Val Ala Glu Leu Asn Ala Leu Val Glu Arg Val 1 5 10 15 Lys Lys Ala Gln Arg Glu Tyr Ala Ser Phe Thr Gln Glu Gln Val Asp 20 25 30 Lys Ile Phe Arg Ala Ala Ala Leu Ala Ala Ala Asp Ala Arg Ile Pro 35 40 45 Leu Ala Lys Met Ala Val Ala Glu Ser Gly Met Gly Ile Val Glu Asp 50 55 60 Lys Val Ile Lys Asn His Phe Ala Ser Glu Tyr Ile Tyr Asn Ala Tyr 65 70 75 80 Lys Asp Glu Lys Thr Cys Gly Val Leu Ser Glu Asp Asp Thr Phe Gly 85 90 95 Thr Ile Thr Ile Ala Glu Pro Ile Gly Ile Ile Cys Gly Ile Val Pro 100 105 110 Thr Thr Asn Pro Thr Ser Thr Ala Ile Phe Lys Ser Leu Ile Ser Leu 115 120 125 Lys Thr Arg Asn Ala Ile Ile Phe Ser Pro His Pro Arg Ala Lys Asp 130 135 140 Ala Thr Asn Lys Ala Ala Asp Ile Val Leu Gln Ala Ala Ile Ala Ala 145 150 155 160 Gly Ala Pro Lys Asp Leu Ile Gly Trp Ile Asp Gln Pro Ser Val Glu 165 170 175 Leu Ser Asn Ala Leu Met His His Pro Asp Ile Asn Leu Ile Leu Ala 180 185 190 Thr Gly Gly Pro Gly Met Val Lys Ala Ala Tyr Ser Ser Gly Lys Pro 195 200 205 Ala Ile Gly Val Gly Ala Gly Asn Thr Pro Val Val Ile Asp Glu Thr 210 215 220 Ala Asp Ile Lys Arg Ala Val Ala Ser Val Leu Met Ser Lys Thr Phe 225 230 235 240 Asp Asn Gly Val Ile Cys Ala Ser Glu Gln Ser Val Val Val Val Asp 245 250 255 Ser Val Tyr Asp Ala Val Arg Glu Arg Phe Ala Thr His Gly Gly Tyr 260 265 270 Leu Leu Gln Gly Lys Glu Leu Lys Ala Val Gln Asp Val Ile Leu Lys 275 280 285 Asn Gly Ala Leu Asn Ala Ala Ile Val Gly Gln Pro Ala Tyr Lys Ile 290 295 300 Ala Glu Leu Ala Gly Phe Ser Val Pro Glu Asn Thr Lys Ile Leu Ile 305 310 315 320 Gly Glu Val Thr Val Val Asp Glu Ser Glu Pro Phe Ala His Glu Lys 325 330 335 Leu Ser Pro Thr Leu Ala Met Tyr Arg Ala Lys Asp Phe Glu Asp Ala 340 345 350 Val Glu Lys Ala Glu Lys Leu Val Ala Met Gly Gly Ile Gly His Thr 355 360 365 Ser Cys Leu Tyr Thr Asp Gln Asp Asn Gln Pro Ala Arg Val Ser Tyr 370 375 380 Phe Gly Gln Lys Met Lys Thr Ala Arg Ile Leu Ile Asn Thr Pro Ala 385 390 395 400 Ser Gln Gly Gly Ile Gly Asp Leu Tyr Asn Phe Lys Leu Ala Pro Ser 405 410 415 Leu Thr Leu Gly Cys Gly Ser Trp Gly Gly Asn Ser Ile Ser Glu Asn 420 425 430 Val Gly Pro Lys His Leu Ile Asn Lys Lys Thr Val Ala Lys Arg Ala 435 440 445 Glu Asn Met Leu Trp His Lys Leu Pro Lys Ser Ile Tyr Phe Arg Arg 450 455 460 Gly Ser Leu Pro Ile Ala Leu Asp Glu Val Ile Thr Asp Gly His Lys 465 470 475 480 Arg Ala Leu Ile Val Thr Asp Arg Phe Leu Phe Asn Asn Gly Tyr Ala 485 490 495 Asp Gln Ile Thr Ser Val Leu Lys Ala Ala Gly Val Glu Thr Glu Val 500 505 510 Phe Phe Glu Val Glu Ala Asp Pro Thr Leu Ser Ile Val Arg Lys Gly 515 520 525 Ala Glu Leu Ala Asn Ser Phe Lys Pro Asp Val Ile Ile Ala Leu Gly 530 535 540 Gly Gly Ser Pro Met Asp Ala Ala Lys Ile Met Trp Val Met Tyr Glu 545 550 555 560 His Pro Glu Thr His Phe Glu Glu Leu Ala Leu Arg Phe Met Asp Ile 565 570 575 Arg Lys Arg Ile Tyr Lys Phe Pro Lys Met Gly Val Lys Ala Lys Met 580 585 590 Ile Ala Val Thr Thr Thr Ser Gly Thr Gly Ser Glu Val Thr Pro Phe 595 600 605 Ala Val Val Thr Asp Asp Ala Thr Gly Gln Lys Tyr Pro Leu Ala Asp 610 615 620 Tyr Ala Leu Thr Pro Asp Met Ala Ile Val Asp Ala Asn Leu Val Met 625 630 635 640 Asp Met Pro Lys Ser Leu Cys Ala Phe Gly Gly Leu Asp Ala Val Thr 645 650 655 His Ala Met Glu Ala Tyr Val Ser Val Leu Ala Ser Glu Phe Ser Asp 660 665 670 Gly Gln Ala Leu Gln Ala Leu Lys Leu Leu Lys Glu Tyr Leu Pro Ala 675 680 685 Ser Tyr His Glu Gly Ser Lys Asn Pro Val Ala Arg Glu Arg Val His 690 695 700 Ser Ala Ala Thr Ile Ala Gly Ile Ala Phe Ala Asn Ala Phe Leu Gly 705 710 715 720 Val Cys His Ser Met Ala His Lys Leu Gly Ser Gln Phe His Ile Pro 725 730 735 His Gly Leu Ala Asn Ala Leu Leu Ile Cys Asn Val Ile Arg Tyr Asn 740 745 750 Ala Asn Asp Asn Pro Thr Lys Gln Thr Ala Phe Ser Gln Tyr Asp Arg 755 760 765 Pro Gln Ala Arg Arg Arg Tyr Ala Glu Ile Ala Asp His Leu Gly Leu 770 775 780 Ser Ala Pro Gly Asp Arg Thr Ala Ala Lys Ile Glu Lys Leu Leu Ala 785 790 795 800 Trp Leu Glu Thr Leu Lys Ala Glu Leu Gly Ile Pro Lys Ser Ile Arg 805 810 815 Glu Ala Gly Val Gln Glu Ala Asp Phe Leu Ala Asn Val Asp Lys Leu 820 825 830 Ser Glu Asp Ala Phe Asp Asp Gln Cys Thr Gly Ala Asn Pro Arg Tyr 835 840 845 Pro Leu Ile Ser Glu Leu Lys Gln Ile Leu Leu Asp Thr Tyr Tyr Gly 850 855 860 Arg Asp Tyr Val Glu Gly Glu Thr Ala Ala Lys Lys Glu Ala Ala Pro 865 870 875 880 Ala Lys Ala Glu Lys Lys Ala Lys Lys Ser Ala 885 890 <210> 2 <211> 455 <212> PRT <213> Lactobacillus plantarum <400> 2 Met Leu Lys Glu Met Glu Glu Thr Thr Val Ser Arg Ser Ile Asp Arg 1 5 10 15 Leu Val Leu Asn Ala Ser Leu Ala Ala Asn Arg Leu Glu Val Met Asp 20 25 30 Gln Ser Gln Val Asp Gln Ala Val Ala Ala Met Ala Arg Ala Ala His 35 40 45 Ala Ala Arg Gly Met Leu Ala Ala Met Ala Val Glu Glu Thr Gly Arg 50 55 60 Gly Asn Tyr Arg Asp Lys Val Ala Lys Asn Asp Phe Ala Ala Lys Asn 65 70 75 80 Val Tyr Asn Tyr Ile Lys Asp Asp Lys Thr Val Gly Ile Ile Asn Asp 85 90 95 Asp Pro Val Ser Gly Val Met Lys Val Ala Glu Pro Val Gly Ile Ile 100 105 110 Ala Gly Val Thr Pro Val Thr Asn Pro Thr Ser Thr Val Ile Phe Asn 115 120 125 Ala Met Leu Ala Leu Lys Thr Arg Asn Pro Ile Ile Phe Gly Phe His 130 135 140 Pro Phe Ala Gln Lys Ser Cys Val Glu Thr Gly Arg Ile Ile Arg Asp 145 150 155 160 Ala Ala Ile Ala Ser Gly Ala Pro Lys Asp Trp Ile Gln Trp Ile Lys 165 170 175 Thr Pro Ser Leu Glu Ala Thr Asn Thr Leu Met Asn His Pro Gly Val 180 185 190 Ala Thr Ile Ile Ala Thr Gly Gly Ala Gly Met Val Lys Thr Ala Tyr 195 200 205 Ser Thr Gly Lys Pro Ala Leu Gly Val Gly Pro Gly Asn Val Pro Cys 210 215 220 Phe Ile Glu Gln Thr Ala Asp Ile Gln Gln Ala Val Ser Asp Val Val 225 230 235 240 Thr Ser Lys Ser Phe Asp Asn Gly Met Ile Cys Ala Ser Glu Ser Asn 245 250 255 Leu Ile Val Ala Asp Gln Ile Tyr Asp Gln Val Lys Arg Glu Leu Ser 260 265 270 His Asn Gly Val Tyr Phe Val Gly Thr Glu Asn Phe Lys Ala Leu Glu 275 280 285 Ala Thr Val Met Asn Leu Asp Lys Gln Ala Val Asp Pro Lys Val Ala 290 295 300 Gly Gln Thr Pro Trp Gln Ile Ala Gln Trp Ala Gly Phe Asp Val Pro 305 310 315 320 Ser Asp Thr Lys Val Leu Ala Val Glu Leu Pro Ser Ile Gly Gly Asp 325 330 335 Gln Val Leu Ser Arg Glu Lys Leu Ser Pro Val Leu Ala Val Val His 340 345 350 Ala Lys Asp Thr Glu Ala Gly Phe Asn Leu Met Lys Arg Ser Leu Ala 355 360 365 Leu Gly Gly Leu Gly His Thr Ala Ala Leu His Thr Thr Asp Glu Ala 370 375 380 Val Met Asn Lys Phe Ala Leu Glu Met Thr Ala Cys Arg Ala Leu Ile 385 390 395 400 Asn Val Pro Ser Ser Gln Gly Ala Ile Gly Tyr Lys Tyr Asp Asn Val 405 410 415 Ala Pro Ser Leu Thr Leu Gly Cys Gly Thr Trp Gly His Asn Ser Ile 420 425 430 Ser His Asn Leu Glu Asp Trp Asp Leu Leu Asn Ile Lys Thr Val Ala 435 440 445 Lys Arg Leu Thr Lys Ile Arg 450 455 <210> 3 <211> 467 <212> PRT <213> Escherichia coli <400> 3 Met Asn Gln Gln Asp Ile Glu Gln Val Val Lys Ala Val Leu Leu Lys 1 5 10 15 Met Gln Ser Ser Asp Thr Pro Ser Ala Ala Val His Glu Met Gly Val 20 25 30 Phe Ala Ser Leu Asp Asp Ala Val Ala Ala Ala Lys Val Ala Gln Gln 35 40 45 Gly Leu Lys Ser Val Ala Met Arg Gln Leu Ala Ile Ala Ala Ile Arg 50 55 60 Glu Ala Gly Glu Lys His Ala Arg Asp Leu Ala Glu Leu Ala Val Ser 65 70 75 80 Glu Thr Gly Met Gly Arg Val Glu Asp Lys Phe Ala Lys Asn Val Ala 85 90 95 Gln Ala Arg Gly Thr Pro Gly Val Glu Cys Leu Ser Pro Gln Val Leu 100 105 110 Thr Gly Asp Asn Gly Leu Thr Leu Ile Glu Asn Ala Pro Trp Gly Val 115 120 125 Val Ala Ser Val Thr Pro Ser Thr Asn Pro Ala Ala Thr Val Ile Asn 130 135 140 Asn Ala Ile Ser Leu Ile Ala Ala Gly Asn Ser Val Ile Phe Ala Pro 145 150 155 160 His Pro Ala Ala Lys Lys Val Ser Gln Arg Ala Ile Thr Leu Leu Asn 165 170 175 Gln Ala Ile Val Ala Ala Gly Gly Pro Glu Asn Leu Leu Val Thr Val 180 185 190 Ala Asn Pro Asp Ile Glu Thr Ala Gln Arg Leu Phe Lys Phe Pro Gly 195 200 205 Ile Gly Leu Leu Val Val Thr Gly Gly Glu Ala Val Val Glu Ala Ala 210 215 220 Arg Lys His Thr Asn Lys Arg Leu Ile Ala Ala Gly Ala Gly Asn Pro 225 230 235 240 Pro Val Val Val Asp Glu Thr Ala Asp Leu Ala Arg Ala Ala Gln Ser 245 250 255 Ile Val Lys Gly Ala Ser Phe Asp Asn Asn Ile Ile Cys Ala Asp Glu 260 265 270 Lys Val Leu Ile Val Val Asp Ser Val Ala Asp Glu Leu Met Arg Leu 275 280 285 Met Glu Gly Gln His Ala Val Lys Leu Thr Ala Glu Gln Ala Gln Gln 290 295 300 Leu Gln Pro Val Leu Leu Lys Asn Ile Asp Glu Arg Gly Lys Gly Thr 305 310 315 320 Val Ser Arg Asp Trp Val Gly Arg Asp Ala Gly Lys Ile Ala Ala Ala 325 330 335 Ile Gly Leu Lys Val Pro Gln Glu Thr Arg Leu Leu Phe Val Glu Thr 340 345 350 Thr Ala Glu His Pro Phe Ala Val Thr Glu Leu Met Met Pro Val Leu 355 360 365 Pro Val Val Arg Val Ala Asn Val Ala Asp Ala Ile Ala Leu Ala Val 370 375 380 Lys Leu Glu Gly Gly Cys His His Thr Ala Ala Met His Ser Arg Asn 385 390 395 400 Ile Glu Asn Met Asn Gln Met Ala Asn Ala Ile Asp Thr Ser Ile Phe 405 410 415 Val Lys Asn Gly Pro Cys Ile Ala Gly Leu Gly Leu Gly Gly Glu Gly 420 425 430 Trp Thr Thr Met Thr Ile Thr Thr Pro Thr Gly Glu Gly Val Thr Ser 435 440 445 Ala Arg Thr Phe Val Arg Leu Arg Arg Cys Val Leu Val Asp Ala Phe 450 455 460 Arg Ile Val 465 <210> 4 <211> 469 <212> PRT <213> Listeria innocua <400> 4 Met Glu Ser Leu Glu Leu Glu Gln Leu Val Lys Lys Val Leu Leu Glu 1 5 10 15 Lys Leu Ala Glu Gln Lys Glu Val Pro Thr Lys Thr Thr Thr Gln Gly 20 25 30 Ala Lys Ser Gly Val Phe Asp Thr Val Asp Glu Ala Val Gln Ala Ala 35 40 45 Val Ile Ala Gln Asn Cys Tyr Lys Glu Lys Ser Leu Glu Glu Arg Arg 50 55 60 Asn Val Val Lys Ala Ile Arg Glu Ala Leu Tyr Pro Glu Ile Glu Thr 65 70 75 80 Ile Ala Thr Arg Ala Val Ala Glu Thr Gly Met Gly Asn Val Thr Asp 85 90 95 Lys Ile Leu Lys Asn Thr Leu Ala Ile Glu Lys Thr Pro Gly Val Glu 100 105 110 Asp Leu Tyr Thr Glu Val Ala Thr Gly Asp Asn Gly Met Thr Leu Tyr 115 120 125 Glu Leu Ser Pro Tyr Gly Val Ile Gly Ala Val Ala Pro Ser Thr Asn 130 135 140 Pro Thr Glu Thr Leu Ile Cys Asn Ser Ile Gly Met Leu Ala Ala Gly 145 150 155 160 Asn Ala Val Phe Tyr Ser Pro His Pro Gly Ala Lys Asn Ile Ser Leu 165 170 175 Trp Leu Ile Glu Lys Leu Asn Thr Ile Val Arg Asp Ser Cys Gly Ile 180 185 190 Asp Asn Leu Ile Val Thr Val Ala Lys Pro Ser Ile Gln Ala Ala Gln 195 200 205 Glu Met Met Asn His Pro Lys Val Pro Leu Leu Val Ile Thr Gly Gly 210 215 220 Pro Gly Val Val Leu Gln Ala Met Gln Ser Gly Lys Lys Val Ile Gly 225 230 235 240 Ala Gly Ala Gly Asn Pro Pro Ser Ile Val Asp Glu Thr Ala Asn Ile 245 250 255 Glu Lys Ala Ala Ala Asp Ile Val Asp Gly Ala Ser Phe Asp His Asn 260 265 270 Ile Leu Cys Ile Ala Glu Lys Ser Val Val Ala Val Asp Ser Ile Ala 275 280 285 Asp Phe Leu Leu Phe Gln Met Glu Lys Asn Gly Ala Leu His Val Thr 290 295 300 Asn Pro Ser Asp Ile Gln Lys Leu Glu Lys Val Ala Val Thr Asp Lys 305 310 315 320 Gly Val Thr Asn Lys Lys Leu Val Gly Lys Ser Ala Thr Glu Ile Leu 325 330 335 Lys Glu Ala Gly Ile Ala Cys Asp Phe Thr Pro Arg Leu Ile Ile Val 340 345 350 Glu Thr Glu Lys Ser His Pro Phe Ala Thr Val Glu Leu Leu Met Pro 355 360 365 Ile Val Pro Val Val Arg Val Pro Asp Phe Asp Glu Ala Leu Glu Val 370 375 380 Ala Ile Glu Leu Glu Gln Gly Leu His His Thr Ala Thr Met His Ser 385 390 395 400 Gln Asn Ile Ser Arg Leu Asn Lys Ala Ala Arg Asp Met Gln Thr Ser 405 410 415 Ile Phe Val Lys Asn Gly Pro Ser Phe Ala Gly Leu Gly Phe Arg Gly 420 425 430 Glu Gly Ser Thr Thr Phe Thr Ile Ala Thr Pro Thr Gly Glu Gly Thr 435 440 445 Thr Thr Ala Arg His Phe Ala Arg Arg Arg Arg Cys Val Leu Thr Asp 450 455 460 Gly Phe Ser Ile Arg 465 <210> 5 <211> 869 <212> PRT <213> Staphylococcus aureus <400> 5 Met Leu Thr Ile Pro Glu Lys Glu Asn Arg Gly Ser Lys Glu Gln Glu 1 5 10 15 Val Ala Ile Met Ile Asp Ala Leu Ala Asp Lys Gly Lys Lys Ala Leu 20 25 30 Glu Ala Leu Ser Lys Lys Ser Gln Glu Glu Ile Asp His Ile Val His 35 40 45 Gln Met Ser Leu Ala Ala Val Asp Gln His Met Val Leu Ala Lys Leu 50 55 60 Ala His Glu Glu Thr Gly Arg Gly Ile Tyr Glu Asp Lys Ala Ile Lys 65 70 75 80 Asn Leu Tyr Ala Ser Glu Tyr Ile Trp Asn Ser Ile Lys Asp Asn Lys 85 90 95 Thr Val Gly Ile Ile Gly Glu Asp Lys Glu Lys Gly Leu Thr Tyr Val 100 105 110 Ala Glu Pro Ile Gly Val Ile Cys Gly Val Thr Pro Thr Thr Asn Pro 115 120 125 Thr Ser Thr Thr Ile Phe Lys Ala Met Ile Ala Ile Lys Thr Gly Asn 130 135 140 Pro Ile Ile Phe Ala Phe His Pro Ser Ala Gln Glu Ser Ser Lys Arg 145 150 155 160 Ala Ala Glu Val Val Leu Glu Ala Ala Met Lys Ala Gly Ala Pro Lys 165 170 175 Asp Ile Ile Gln Trp Ile Glu Val Pro Ser Ile Glu Ala Thr Lys Gln 180 185 190 Leu Met Asn His Lys Gly Ile Ala Leu Val Leu Ala Thr Gly Gly Ser 195 200 205 Gly Met Val Lys Ser Ala Tyr Ser Thr Gly Lys Pro Ala Leu Gly Val 210 215 220 Gly Pro Gly Asn Val Pro Ser Tyr Ile Glu Lys Thr Ala His Ile Lys 225 230 235 240 Arg Ala Val Asn Asp Ile Ile Gly Ser Lys Thr Phe Asp Asn Gly Met 245 250 255 Ile Cys Ala Ser Glu Gln Val Val Val Ile Asp Lys Glu Ile Tyr Lys 260 265 270 Asp Val Thr Asn Glu Phe Lys Ala His Gln Ala Tyr Phe Val Lys Lys 275 280 285 Asp Glu Leu Gln Arg Leu Glu Asn Ala Ile Met Asn Glu Gln Lys Thr 290 295 300 Gly Ile Lys Pro Asp Ile Val Gly Lys Ser Ala Val Glu Ile Ala Glu 305 310 315 320 Leu Ala Gly Ile Pro Val Pro Glu Asn Thr Lys Leu Ile Ile Ala Glu 325 330 335 Ile Ser Gly Val Gly Ser Asp Tyr Pro Leu Ser Arg Glu Lys Leu Ser 340 345 350 Pro Val Leu Ala Leu Val Lys Ala Gln Ser Thr Lys Gln Ala Phe Gln 355 360 365 Ile Cys Glu Asp Thr Leu His Phe Gly Gly Leu Gly His Thr Ala Val 370 375 380 Ile His Thr Glu Asp Glu Thr Leu Gln Lys Asp Phe Gly Leu Arg Met 385 390 395 400 Lys Ala Cys Arg Val Leu Val Asn Thr Pro Ser Ala Val Gly Gly Ile 405 410 415 Gly Asp Met Tyr Asn Glu Leu Ile Pro Ser Leu Thr Leu Gly Cys Gly 420 425 430 Ser Tyr Gly Arg Asn Ser Ile Ser His Asn Val Ser Ala Thr Asp Leu 435 440 445 Leu Asn Ile Lys Thr Ile Ala Lys Arg Arg Asn Asn Thr Gln Ile Phe 450 455 460 Lys Val Pro Ala Gln Ile Tyr Phe Glu Glu Asn Ala Ile Met Ser Leu 465 470 475 480 Thr Thr Met Asp Lys Ile Glu Lys Val Met Ile Val Cys Asp Pro Gly 485 490 495 Met Val Glu Phe Gly Tyr Thr Lys Thr Val Glu Asn Val Leu Arg Gln 500 505 510 Arg Thr Glu Gln Pro Gln Ile Lys Ile Phe Ser Glu Val Glu Pro Asn 515 520 525 Pro Ser Thr Asn Thr Val Tyr Lys Gly Leu Glu Met Met Val Asp Phe 530 535 540 Gln Pro Asp Thr Ile Ile Ala Leu Gly Gly Gly Ser Ala Met Asp Ala 545 550 555 560 Ala Lys Ala Met Trp Met Phe Phe Glu His Pro Glu Thr Ser Phe Phe 565 570 575 Gly Ala Lys Gln Lys Phe Leu Asp Ile Gly Lys Arg Thr Tyr Lys Ile 580 585 590 Gly Met Pro Glu Asn Ala Thr Phe Ile Cys Ile Pro Thr Thr Ser Gly 595 600 605 Thr Gly Ser Glu Val Thr Pro Phe Ala Val Ile Thr Asp Ser Glu Thr 610 615 620 Asn Val Lys Tyr Pro Leu Ala Asp Phe Ala Leu Thr Pro Asp Val Ala 625 630 635 640 Ile Ile Asp Pro Gln Phe Val Met Ser Val Pro Lys Ser Val Thr Ala 645 650 655 Asp Thr Gly Met Asp Val Leu Thr His Ala Met Glu Ser Tyr Val Ser 660 665 670 Val Met Ala Ser Asp Tyr Thr Arg Gly Leu Ser Leu Gln Ala Ile Lys 675 680 685 Leu Thr Phe Glu Tyr Leu Lys Ser Ser Val Glu Lys Gly Asp Lys Val 690 695 700 Ser Arg Glu Lys Met His Asn Ala Ser Thr Leu Ala Gly Met Ala Phe 705 710 715 720 Ala Asn Ala Phe Leu Gly Ile Ala His Ser Ile Ala His Lys Ile Gly 725 730 735 Gly Glu Tyr Gly Ile Pro His Gly Arg Ala Asn Ala Ile Leu Leu Pro 740 745 750 His Ile Ile Arg Tyr Asn Ala Lys Asp Pro Gln Lys His Ala Leu Phe 755 760 765 Pro Lys Tyr Glu Phe Phe Arg Ala Asp Thr Asp Tyr Ala Asp Ile Ala 770 775 780 Lys Phe Leu Gly Leu Lys Gly Asn Thr Thr Glu Ala Leu Val Glu Ser 785 790 795 800 Leu Ala Lys Ala Val Tyr Glu Leu Gly Gln Ser Val Gly Ile Glu Met 805 810 815 Asn Leu Lys Ser Gln Gly Val Ser Glu Glu Glu Leu Asn Glu Ser Ile 820 825 830 Asp Arg Met Ala Glu Leu Ala Phe Glu Asp Gln Cys Thr Thr Ala Asn 835 840 845 Pro Lys Glu Ala Leu Ile Ser Glu Ile Lys Asp Ile Ile Gln Thr Ser 850 855 860 Tyr Asp Tyr Lys Gln 865 <210> 6 <211> 683 <212> PRT <213> Saccharomyces cerevisiae <400> 6 Met Thr Ile Lys Glu His Lys Val Val Tyr Glu Ala His Asn Val Lys 1 5 10 15 Ala Leu Lys Ala Pro Gln His Phe Tyr Asn Ser Gln Pro Gly Lys Gly 20 25 30 Tyr Val Thr Asp Met Gln His Tyr Gln Glu Met Tyr Gln Gln Ser Ile 35 40 45 Asn Glu Pro Glu Lys Phe Phe Asp Lys Met Ala Lys Glu Tyr Leu His 50 55 60 Trp Asp Ala Pro Tyr Thr Lys Val Gln Ser Gly Ser Leu Asn Asn Gly 65 70 75 80 Asp Val Ala Trp Phe Leu Asn Gly Lys Leu Asn Ala Ser Tyr Asn Cys 85 90 95 Val Asp Arg His Ala Phe Ala Asn Pro Asp Lys Pro Ala Leu Ile Tyr 100 105 110 Glu Ala Asp Asp Glu Ser Asp Asn Lys Ile Ile Thr Phe Gly Glu Leu 115 120 125 Leu Arg Lys Val Ser Gln Ile Ala Gly Val Leu Lys Ser Trp Gly Val 130 135 140 Lys Lys Gly Asp Thr Val Ala Ile Tyr Leu Pro Met Ile Pro Glu Ala 145 150 155 160 Val Ile Ala Met Leu Ala Val Ala Arg Ile Gly Ala Ile His Ser Val 165 170 175 Val Phe Ala Gly Phe Ser Ala Gly Ser Leu Lys Asp Arg Val Val Asp 180 185 190 Ala Asn Ser Lys Val Val Ile Thr Cys Asp Glu Gly Lys Arg Gly Gly 195 200 205 Lys Thr Ile Asn Thr Lys Lys Ile Val Asp Glu Gly Leu Asn Gly Val 210 215 220 Asp Leu Val Ser Arg Ile Leu Val Phe Gln Arg Thr Gly Thr Glu Gly 225 230 235 240 Ile Pro Met Lys Ala Gly Arg Asp Tyr Trp Trp His Glu Glu Ala Ala 245 250 255 Lys Gln Arg Thr Tyr Leu Pro Pro Val Ser Cys Asp Ala Glu Asp Pro 260 265 270 Leu Phe Leu Leu Tyr Thr Ser Gly Ser Thr Gly Ser Pro Lys Gly Val 275 280 285 Val His Thr Thr Gly Gly Tyr Leu Leu Gly Ala Ala Leu Thr Thr Arg 290 295 300 Tyr Val Phe Asp Ile His Pro Glu Asp Val Leu Phe Thr Ala Gly Asp 305 310 315 320 Val Gly Trp Ile Thr Gly His Thr Tyr Ala Leu Tyr Gly Pro Leu Thr 325 330 335 Leu Gly Thr Ala Ser Ile Ile Phe Glu Ser Thr Pro Ala Tyr Pro Asp 340 345 350 Tyr Gly Arg Tyr Trp Arg Ile Ile Gln Arg His Lys Ala Thr His Phe 355 360 365 Tyr Val Ala Pro Thr Ala Leu Arg Leu Ile Lys Arg Val Gly Glu Ala 370 375 380 Glu Ile Ala Lys Tyr Asp Thr Ser Ser Leu Arg Val Leu Gly Ser Val 385 390 395 400 Gly Glu Pro Ile Ser Pro Asp Leu Trp Glu Trp Tyr His Glu Lys Val 405 410 415 Gly Asn Lys Asn Cys Val Ile Cys Asp Thr Met Trp Gln Thr Glu Ser 420 425 430 Gly Ser His Leu Ile Ala Pro Leu Ala Gly Ala Val Pro Thr Lys Pro 435 440 445 Gly Ser Ala Thr Val Pro Phe Phe Gly Ile Asn Ala Cys Ile Ile Asp 450 455 460 Pro Val Thr Gly Val Glu Leu Glu Gly Asn Asp Val Glu Gly Val Leu 465 470 475 480 Ala Val Lys Ser Pro Trp Pro Ser Met Ala Arg Ser Val Trp Asn His 485 490 495 His Asp Arg Tyr Met Asp Thr Tyr Leu Lys Pro Tyr Pro Gly His Tyr 500 505 510 Phe Thr Gly Asp Gly Ala Gly Arg Asp His Asp Gly Tyr Tyr Trp Ile 515 520 525 Arg Gly Arg Val Asp Asp Val Val Asn Val Ser Gly His Arg Leu Ser 530 535 540 Thr Ser Glu Ile Glu Ala Ser Ile Ser Asn His Glu Asn Val Ser Glu 545 550 555 560 Ala Ala Val Val Gly Ile Pro Asp Glu Leu Thr Gly Gln Thr Val Val 565 570 575 Ala Tyr Val Ser Leu Lys Asp Gly Tyr Leu Gln Asn Asn Ala Thr Glu 580 585 590 Gly Asp Ala Glu His Ile Thr Pro Asp Asn Leu Arg Arg Glu Leu Ile 595 600 605 Leu Gln Val Arg Gly Glu Ile Gly Pro Phe Ala Ser Pro Lys Thr Ile 610 615 620 Ile Leu Val Arg Asp Leu Pro Arg Thr Arg Ser Gly Lys Ile Met Arg 625 630 635 640 Arg Val Leu Arg Lys Val Ala Ser Asn Glu Ala Glu Gln Leu Gly Asp 645 650 655 Leu Thr Thr Leu Ala Asn Pro Glu Val Val Pro Ala Ile Ile Ser Ala 660 665 670 Val Glu Asn Gln Phe Phe Ser Gln Lys Lys Lys 675 680 <210> 7 <211> 367 <212> PRT <213> Escherichia coli <400> 7 Met Asp Arg Ile Ile Gln Ser Pro Gly Lys Tyr Ile Gln Gly Ala Asp 1 5 10 15 Val Ile Asn Arg Leu Gly Glu Tyr Leu Lys Pro Leu Ala Glu Arg Trp 20 25 30 Leu Val Val Gly Asp Lys Phe Val Leu Gly Phe Ala Gln Ser Thr Val 35 40 45 Glu Lys Ser Phe Lys Asp Ala Gly Leu Val Val Glu Ile Ala Pro Phe 50 55 60 Gly Gly Glu Cys Ser Gln Asn Glu Ile Asp Arg Leu Arg Gly Ile Ala 65 70 75 80 Glu Thr Ala Gln Cys Gly Ala Ile Leu Gly Ile Gly Gly Gly Lys Thr 85 90 95 Leu Asp Thr Ala Lys Ala Leu Ala His Phe Met Gly Val Pro Val Ala 100 105 110 Ile Ala Pro Thr Ile Ala Ser Thr Asp Ala Pro Cys Ser Ala Leu Ser 115 120 125 Val Ile Tyr Thr Asp Glu Gly Glu Phe Asp Arg Tyr Leu Leu Leu Pro 130 135 140 Asn Asn Pro Asn Met Val Ile Val Asp Thr Lys Ile Val Ala Gly Ala 145 150 155 160 Pro Ala Arg Leu Leu Ala Ala Gly Ile Gly Asp Ala Leu Ala Thr Trp 165 170 175 Phe Glu Ala Arg Ala Cys Ser Arg Ser Gly Ala Thr Thr Met Ala Gly 180 185 190 Gly Lys Cys Thr Gln Ala Ala Leu Ala Leu Ala Glu Leu Cys Tyr Asn 195 200 205 Thr Leu Leu Glu Glu Gly Glu Lys Ala Met Leu Ala Ala Glu Gln His 210 215 220 Val Val Thr Pro Ala Leu Glu Arg Val Ile Glu Ala Asn Thr Tyr Leu 225 230 235 240 Ser Gly Val Gly Phe Glu Ser Gly Gly Leu Ala Ala Ala His Ala Val 245 250 255 His Asn Gly Leu Thr Ala Ile Pro Asp Ala His His Tyr Tyr His Gly 260 265 270 Glu Lys Val Ala Phe Gly Thr Leu Thr Gln Leu Val Leu Glu Asn Ala 275 280 285 Pro Val Glu Glu Ile Glu Thr Val Ala Ala Leu Ser His Ala Val Gly 290 295 300 Leu Pro Ile Thr Leu Ala Gln Leu Asp Ile Lys Glu Asp Val Pro Ala 305 310 315 320 Lys Met Arg Ile Val Ala Glu Ala Ala Cys Ala Glu Gly Glu Thr Ile 325 330 335 His Asn Met Pro Gly Gly Ala Thr Pro Asp Gln Val Tyr Ala Ala Leu 340 345 350 Leu Val Ala Asp Gln Tyr Gly Gln Arg Phe Leu Gln Glu Trp Glu 355 360 365 <210> 8 <211> 365 <212> PRT <213> Klebsiella pneumoniae <400> 8 Met Leu Lys Val Ile Gln Ser Pro Ala Lys Tyr Leu Gln Gly Pro Asp 1 5 10 15 Ala Ala Val Leu Phe Gly Gln Tyr Ala Lys Asn Leu Ala Glu Ser Phe 20 25 30 Phe Val Ile Ala Asp Asp Phe Val Met Lys Leu Ala Gly Glu Lys Val 35 40 45 Val Asn Gly Leu Gln Ser His Asp Ile Arg Cys His Ala Glu Arg Phe 50 55 60 Asn Gly Glu Cys Ser His Ala Glu Ile Asn Arg Leu Met Ala Ile Leu 65 70 75 80 Gln Lys Gln Gly Cys Arg Gly Val Val Gly Ile Gly Gly Gly Lys Thr 85 90 95 Leu Asp Thr Ala Lys Ala Ile Gly Tyr Tyr Gln Lys Leu Pro Val Val 100 105 110 Val Ile Pro Thr Ile Ala Ser Thr Asp Ala Pro Thr Ser Ala Leu Ser 115 120 125 Val Ile Tyr Thr Glu Ala Gly Glu Phe Glu Glu Tyr Leu Ile Tyr Pro 130 135 140 Lys Asn Pro Asp Met Val Val Met Asp Thr Ala Ile Ile Ala Lys Ala 145 150 155 160 Pro Val Arg Leu Leu Val Ser Gly Met Gly Asp Ala Leu Ser Thr Trp 165 170 175 Phe Glu Ala Lys Ala Cys Tyr Asp Ala Arg Ala Thr Ser Met Ala Gly 180 185 190 Gly Gln Ser Thr Glu Ala Ala Leu Ser Leu Ala Arg Leu Cys Tyr Asp 195 200 205 Thr Leu Leu Ala Glu Gly Glu Lys Ala Arg Leu Ala Ala Gln Ala Gly 210 215 220 Val Val Thr Glu Ala Leu Glu Arg Ile Ile Glu Ala Asn Thr Tyr Leu 225 230 235 240 Ser Gly Ile Gly Phe Glu Ser Ser Gly Leu Ala Ala Ala His Ala Ile 245 250 255 His Asn Gly Phe Thr Ile Leu Glu Glu Cys His His Leu Tyr His Gly 260 265 270 Glu Lys Val Ala Phe Gly Thr Leu Ala Gln Leu Val Leu Gln Asn Ser 275 280 285 Pro Met Asp Glu Ile Glu Thr Val Leu Gly Phe Cys Gln Arg Val Gly 290 295 300 Leu Pro Val Thr Leu Ala Gln Met Gly Val Lys Glu Gly Ile Asp Ala 305 310 315 320 Lys Ile Ala Ala Val Ala Lys Ala Thr Cys Ala Glu Gly Glu Thr Ile 325 330 335 His Asn Met Pro Phe Ala Val Thr Pro Glu Ser Val His Ala Ala Ile 340 345 350 Leu Thr Ala Asp Leu Leu Gly Gln Gln Trp Leu Ala Arg 355 360 365 <210> 9 <211> 367 <212> PRT <213> Enterobacter aerogenes <400> 9 Met Asp Arg Ile Ile Gln Ser Pro Gly Lys Tyr Ile Gln Gly Ala Gly 1 5 10 15 Ala Ile Lys Arg Leu Gly Glu Tyr Leu Lys Pro Leu Ala Glu Arg Trp 20 25 30 Leu Ile Ile Gly Asp Lys Phe Val Leu Gly Phe Ala Glu Glu Gln Leu 35 40 45 Arg Thr Ser Leu Gly Gly Ala Gly Leu Val Ala Glu Ile Ala Pro Phe 50 55 60 Gly Gly Glu Cys Ser Gln Asn Glu Ile Asn Arg Leu Arg Asp Ile Ala 65 70 75 80 Ser Ser Ala Gln Cys His Ala Val Leu Gly Ile Gly Gly Gly Lys Thr 85 90 95 Leu Asp Thr Ala Lys Ala Leu Ala His Tyr Met His Leu Pro Val Val 100 105 110 Val Ala Pro Thr Ile Ala Ser Thr Asp Ala Pro Cys Ser Ala Leu Ser 115 120 125 Val Ile Tyr Thr Asp Asp Gly Glu Phe Glu Ser Tyr Leu Met Leu Pro 130 135 140 His Asn Pro Asn Met Val Val Val Asp Thr Gln Ile Val Ala Ala Ala 145 150 155 160 Pro Ala Arg Leu Leu Ala Ala Gly Ile Gly Asp Ala Leu Ala Thr Trp 165 170 175 Phe Glu Ala Arg Ala Cys Ser Arg Ser Gly Ala Thr Thr Met Ala Gly 180 185 190 Gly Lys Cys Thr Gln Ala Ala Leu Ala Leu Ala Glu Leu Cys Tyr Asn 195 200 205 Thr Leu Val Glu Glu Gly Glu Lys Ala Met Leu Ala Ala Glu Gln His 210 215 220 Val Val Thr Pro Ala Leu Glu Arg Val Ile Glu Ala Asn Thr Tyr Leu 225 230 235 240 Ser Gly Val Gly Phe Glu Ser Gly Gly Leu Ala Ala Ala His Ala Ile 245 250 255 His Asn Gly Leu Thr Ala Ile Pro Asp Ala His His Phe Tyr His Gly 260 265 270 Glu Lys Val Ala Phe Gly Thr Leu Thr Gln Leu Val Leu Glu Asn Ala 275 280 285 Pro Val Glu Glu Ile Glu Thr Ala Ala Ala Leu Cys His Ser Val Gly 290 295 300 Leu Pro Ile Thr Leu Ala Gln Leu Asp Ile Lys Gly Asp Ile Pro Ala 305 310 315 320 Lys Met Arg Thr Val Ala Glu Ala Ala Cys Ala Glu Gly Glu Thr Ile 325 330 335 His Asn Met Pro Gly Gly Ala Cys Ala Asp Gln Val Tyr Ala Ala Leu 340 345 350 Leu Val Ala Asp Gln Tyr Gly Gln Arg Phe Leu Gln Glu Trp Glu 355 360 365 <210> 10 <211> 364 <212> PRT <213> Yersinia aldovae <400> 10 Met Leu Lys Val Ile Gln Ser Pro Ser Lys Tyr Ile Gln Gly Ala Asn 1 5 10 15 Ala Leu Gln Ser Ile Gly Glu Phe Ala Lys Leu Leu Ala Asn Asn Tyr 20 25 30 Phe Ile Ile Ala Asp Asp Phe Val Met Lys Leu Thr Ala Asp Thr Val 35 40 45 Gly Thr Ser Leu Gln Thr Cys Glu Leu Lys Ser His Phe Ser Arg Phe 50 55 60 Asn Gly Glu Cys Ser Arg Gln Glu Ile Glu Arg Leu Thr Val Glu Leu 65 70 75 80 Lys Lys Tyr Gly Cys Asn Gly Val Ile Gly Ile Gly Gly Gly Lys Thr 85 90 95 Leu Asp Thr Ala Lys Ala Ile Ala His Tyr Gln His Ile Pro Val Val 100 105 110 Val Val Pro Thr Ile Ala Ser Thr Asp Ala Pro Thr Ser Ala Leu Ser 115 120 125 Val Ile Tyr Thr Glu Gln Gly Glu Phe Ala Glu Tyr Leu Ile Tyr Pro 130 135 140 Lys Asn Pro Asp Ile Val Leu Met Asp Thr Thr Ile Ile Ala Lys Ala 145 150 155 160 Pro Val Arg Leu Leu Val Ala Gly Met Gly Asp Ala Leu Ser Thr Tyr 165 170 175 Phe Glu Ala Gln Ala Cys Phe Asp Ala Lys Ala Ile Ser Met Ala Gly 180 185 190 Gly Ala Ser Thr Leu Ala Ala Ile Thr Leu Ala Arg Leu Cys Tyr Glu 195 200 205 Thr Leu Leu Ala Glu Gly Tyr Lys Ala Lys Leu Ala Val Glu Ala Gly 210 215 220 Val Val Thr Glu Ala Val Glu Arg Ile Ile Glu Ala Asn Thr Tyr Leu 225 230 235 240 Ser Gly Ile Gly Phe Glu Ser Ser Gly Leu Ala Ala Ala His Ala Ile 245 250 255 His Asn Gly Phe Thr Val Leu Glu Glu Cys His His Leu Tyr His Gly 260 265 270 Glu Lys Val Ala Phe Gly Thr Leu Thr Gln Leu Val Leu Gln Asn Ser 275 280 285 Ser Met Glu Glu Ile Glu Thr Val Leu Ser Phe Cys Gln Gln Leu Gly 290 295 300 Leu Pro Ile Thr Leu Ala Glu Met Gly Val Thr Gln Asp Leu Glu Cys 305 310 315 320 Lys Ile Arg Ala Val Ala Gln Ala Ser Cys Ala Glu Gly Glu Thr Ile 325 330 335 His Asn Met Pro Phe Lys Val Thr Ala Asp Ser Val Tyr Ala Ala Ile 340 345 350 Ile Val Ala Asp Arg Leu Gly Gln Ala Phe Leu Asn 355 360 <210> 11 <211> 584 <212> PRT <213> Saccharomyces cerevisiae <400> 11 Met Ser Ala Lys Ser Phe Glu Val Thr Asp Pro Val Asn Ser Ser Leu 1 5 10 15 Lys Gly Phe Ala Leu Ala Asn Pro Ser Ile Thr Leu Val Pro Glu Glu 20 25 30 Lys Ile Leu Phe Arg Lys Thr Asp Ser Asp Lys Ile Ala Leu Ile Ser 35 40 45 Gly Gly Gly Ser Gly His Glu Pro Thr His Ala Gly Phe Ile Gly Lys 50 55 60 Gly Met Leu Ser Gly Ala Val Val Gly Glu Ile Phe Ala Ser Pro Ser 65 70 75 80 Thr Lys Gln Ile Leu Asn Ala Ile Arg Leu Val Asn Glu Asn Ala Ser 85 90 95 Gly Val Leu Leu Ile Val Lys Asn Tyr Thr Gly Asp Val Leu His Phe 100 105 110 Gly Leu Ser Ala Glu Arg Ala Arg Ala Leu Gly Ile Asn Cys Arg Val 115 120 125 Ala Val Ile Gly Asp Asp Val Ala Val Gly Arg Glu Lys Gly Gly Met 130 135 140 Val Gly Arg Arg Ala Leu Ala Gly Thr Val Leu Val His Lys Ile Val 145 150 155 160 Gly Ala Phe Ala Glu Glu Tyr Ser Ser Lys Tyr Gly Leu Asp Gly Thr 165 170 175 Ala Lys Val Ala Lys Ile Ile Asn Asp Asn Leu Val Thr Ile Gly Ser 180 185 190 Ser Leu Asp His Cys Lys Val Pro Gly Arg Lys Phe Glu Ser Glu Leu 195 200 205 Asn Glu Lys Gln Met Glu Leu Gly Met Gly Ile His Asn Glu Pro Gly 210 215 220 Val Lys Val Leu Asp Pro Ile Pro Ser Thr Glu Asp Leu Ile Ser Lys 225 230 235 240 Tyr Met Leu Pro Lys Leu Leu Asp Pro Asn Asp Lys Asp Arg Ala Phe 245 250 255 Val Lys Phe Asp Glu Asp Asp Glu Val Val Leu Leu Val Asn Asn Leu 260 265 270 Gly Gly Val Ser Asn Phe Val Ile Ser Ser Ile Thr Ser Lys Thr Thr 275 280 285 Asp Phe Leu Lys Glu Asn Tyr Asn Ile Thr Pro Val Gln Thr Ile Ala 290 295 300 Gly Thr Leu Met Thr Ser Phe Asn Gly Asn Gly Phe Ser Ile Thr Leu 305 310 315 320 Leu Asn Ala Thr Lys Ala Thr Lys Ala Leu Gln Ser Asp Phe Glu Glu 325 330 335 Ile Lys Ser Val Leu Asp Leu Leu Asn Ala Phe Thr Asn Ala Pro Gly 340 345 350 Trp Pro Ile Ala Asp Phe Glu Lys Thr Ser Ala Pro Ser Val Asn Asp 355 360 365 Asp Leu Leu His Asn Glu Val Thr Ala Lys Ala Val Gly Thr Tyr Asp 370 375 380 Phe Asp Lys Phe Ala Glu Trp Met Lys Ser Gly Ala Glu Gln Val Ile 385 390 395 400 Lys Ser Glu Pro His Ile Thr Glu Leu Asp Asn Gln Val Gly Asp Gly 405 410 415 Asp Cys Gly Tyr Thr Leu Val Ala Gly Val Lys Gly Ile Thr Glu Asn 420 425 430 Leu Asp Lys Leu Ser Lys Asp Ser Leu Ser Gln Ala Val Ala Gln Ile 435 440 445 Ser Asp Phe Ile Glu Gly Ser Met Gly Gly Thr Ser Gly Gly Leu Tyr 450 455 460 Ser Ile Leu Leu Ser Gly Phe Ser His Gly Leu Ile Gln Val Cys Lys 465 470 475 480 Ser Lys Asp Glu Pro Val Thr Lys Glu Ile Val Ala Lys Ser Leu Gly 485 490 495 Ile Ala Leu Asp Thr Leu Tyr Lys Tyr Thr Lys Ala Arg Lys Gly Ser 500 505 510 Ser Thr Met Ile Asp Ala Leu Glu Pro Phe Val Lys Glu Phe Thr Ala 515 520 525 Ser Lys Asp Phe Asn Lys Ala Val Lys Ala Ala Glu Glu Gly Ala Lys 530 535 540 Ser Thr Ala Thr Phe Glu Ala Lys Phe Gly Arg Ala Ser Tyr Val Gly 545 550 555 560 Asp Ser Ser Gln Val Glu Asp Pro Gly Ala Val Gly Leu Cys Glu Phe 565 570 575 Leu Lys Gly Val Gln Ser Ala Leu 580 <210> 12 <211> 356 <212> PRT <213> Klebsiella pneumoniae <400> 12 Met Lys Lys Leu Ile Asn Arg Val Glu Asp Val Leu Asn Glu Gln Leu 1 5 10 15 Gln Gly Leu Ala Lys Ala His Pro Gln Leu Thr Leu His Gln Asp Pro 20 25 30 Leu Tyr Val Thr Arg Thr Asp Ala Pro Val Ala Gly Lys Val Ala Leu 35 40 45 Leu Ser Gly Gly Gly Ser Gly His Glu Pro Met His Cys Gly Tyr Ile 50 55 60 Gly Gln Gly Met Leu Ser Gly Ala Cys Pro Gly Glu Ile Phe Thr Ser 65 70 75 80 Pro Thr Pro Asp Lys Met Phe Glu Cys Ala Met Gln Ile Asp Gly Gly 85 90 95 Glu Gly Val Leu Leu Ile Ile Lys Asn Tyr Thr Gly Asp Ile Leu Asn 100 105 110 Phe Glu Thr Ala Thr Glu Leu Leu His Glu Ser Gly Ile Lys Val Thr 115 120 125 Thr Val Val Val Asp Asp Asp Val Ala Val Lys Asp Ser Leu Tyr Thr 130 135 140 Ala Gly Arg Arg Gly Val Ala Asn Thr Val Leu Ile Glu Lys Leu Val 145 150 155 160 Gly Ala Ala Ala Glu Arg Gly Asp Ser Leu Glu Ala Cys Ala Glu Leu 165 170 175 Gly Arg Arg Leu Asn Asn Leu Gly His Ser Ile Gly Ile Ala Leu Gly 180 185 190 Ala Cys Thr Val Pro Ala Ala Gly Gln Pro Ser Phe Thr Leu Lys Asp 195 200 205 Asp Glu Met Glu Phe Gly Val Gly Ile His Gly Glu Pro Gly Ile Asp 210 215 220 Arg Arg Arg Phe Ser Ser Leu Asp Gln Thr Val Asp Glu Met Phe Asp 225 230 235 240 Thr Leu Leu Glu Asn Gly Ala Tyr Ser Arg Thr Leu Arg Gln Trp Asp 245 250 255 Thr Val Lys Gly Ala Trp Gln Glu Val Lys Gln Ser Lys Thr Ala Leu 260 265 270 Gln Asn Gly Asp Arg Val Ile Ala Leu Val Asn Asn Leu Gly Ala Thr 275 280 285 Pro Leu Ser Glu Leu Tyr Gly Val Tyr His Arg Leu Ala Gln Arg Cys 290 295 300 Glu Ala Ser Gly Ile Ile Ile Glu Arg Asn Leu Ile Gly Ser Tyr Cys 305 310 315 320 Thr Ser Leu Asp Met Ser Gly Phe Ser Ile Thr Leu Leu Lys Val Asp 325 330 335 Asp Glu Thr Leu Thr Leu Trp Asp Ala Pro Val His Thr Pro Ala Leu 340 345 350 Asn Trp Gly Asn 355 <210> 13 <211> 572 <212> PRT <213> Yarrowia lipolytica <400> 13 Met Thr Thr Lys Gln Phe Gln Phe Asp Ser Asp Pro Leu Asn Ser Ala 1 5 10 15 Leu Ala Ala Thr Ala Glu Ala Ser Gly Leu Ala Tyr Leu Pro Lys Ser 20 25 30 Lys Val Ile Tyr Tyr Pro Leu Thr Asn Asp Lys Val Thr Leu Ile Ser 35 40 45 Gly Gly Gly Ala Gly His Glu Pro Ala Gln Thr Gly Phe Val Gly Pro 50 55 60 Gly Leu Leu Asp Ala Ala Val Ser Gly Gln Ile Phe Ala Ser Pro Ser 65 70 75 80 Thr Lys Gln Ile Ile Ala Gly Val Asn Ala Val Lys Ser Gln Arg Gly 85 90 95 Ser Ile Ile Ile Val Met Asn Tyr Thr Gly Asp Val Ile His Phe Gly 100 105 110 Met Ala Ala Glu Gln Leu Arg Ser Arg Tyr Asp Tyr His Ala Glu Leu 115 120 125 Val Ser Ile Gly Asp Asp Ile Ser Val Asn Lys Lys Ala Gly Arg Arg 130 135 140 Gly Leu Ala Gly Thr Val Leu Val His Lys Ile Ala Gly His Leu Ala 145 150 155 160 Arg Asp Gly Trp Asp Val Gly Val Leu Ala Glu Ala Leu Arg Thr Thr 165 170 175 Ala Ala Asn Leu Ala Thr Val Ala Ala Ser Leu Glu His Cys Thr Val 180 185 190 Pro Gly Arg Lys Phe Glu Thr Glu Leu Ala Ala Asp Glu Met Glu Ile 195 200 205 Gly Met Gly Ile His Asn Glu Pro Gly Val Lys Thr Ile Lys Ile Gly 210 215 220 Lys Val Glu Ser Leu Leu Asp Glu Leu Val Asp Lys Phe Glu Pro Ser 225 230 235 240 Lys Gln Asp Phe Val Pro Phe Asn Lys Gly Asp Glu Val Val Leu Leu 245 250 255 Val Asn Ser Leu Gly Gly Val Ser Ser Leu Glu Leu His Ala Ile Ala 260 265 270 Asn Ile Ala Gln Thr Lys Phe Glu Lys Val Leu Gly Val Lys Thr Val 275 280 285 Arg Leu Ile Val Gly Asn Phe Met Ala Ala Phe Asn Gly Pro Gly Phe 290 295 300 Ser Leu Thr Leu Leu Asn Val Thr Thr Thr Ala Lys Lys Gly Asn Phe 305 310 315 320 Asp Val Leu Gly Ala Leu Asp Ala Pro Val Ser Thr Ala Ala Trp Pro 325 330 335 Ser Leu Gln Gln Lys Asp Lys Pro Ala Asn Gly Gly Val Gln Glu Glu 340 345 350 Lys Glu Thr Asp Ser Asp Lys Pro Ala Glu Pro Thr Gly Ile Lys Ala 355 360 365 Asp Gly Lys Leu Phe Lys Ala Met Ile Glu Ser Ala Val Asp Asp Leu 370 375 380 Lys Lys Glu Glu Pro Gln Ile Thr Lys Tyr Asp Thr Ile Ala Gly Asp 385 390 395 400 Gly Asp Cys Gly Glu Thr Leu Leu Ala Gly Gly Asp Gly Ile Leu Asp 405 410 415 Ala Ile Lys Asn Lys Lys Ile Asp Leu Asp Asp Ala Ala Gly Val Ala 420 425 430 Asp Ile Ser His Ile Val Glu Asn Ser Met Gly Gly Thr Ser Gly Gly 435 440 445 Leu Tyr Ser Ile Phe Phe Ser Gly Leu Val Val Gly Ile Lys Glu Thr 450 455 460 Lys Ala Lys Glu Leu Ser Val Asp Val Phe Ala Lys Ala Cys Glu Thr 465 470 475 480 Ala Leu Glu Thr Leu Ser Lys Tyr Thr Gln Ala Arg Val Gly Asp Arg 485 490 495 Thr Leu Met Asp Ala Leu Val Pro Phe Val Glu Thr Leu Ser Lys Thr 500 505 510 Lys Asp Phe Ala Lys Ala Val Glu Ala Ala Arg Lys Gly Ala Asp Glu 515 520 525 Thr Ser Lys Leu Pro Ala Asn Phe Gly Arg Ala Ser Tyr Val Asn Glu 530 535 540 Glu Gly Leu Glu Asn Ile Pro Asp Pro Gly Ala Leu Gly Leu Ala Val 545 550 555 560 Ile Phe Glu Gly Leu Leu Lys Ala Trp Glu Lys Lys 565 570 <210> 14 <211> 580 <212> PRT <213> Schizosaccharomyces pombe <400> 14 Met Asp Lys His Phe Ile Asn Asp Pro Glu Val Leu Val Leu Asp Gly 1 5 10 15 Leu Lys Ser Leu Ala Asp Met Asn Lys Thr Leu Thr Val His Glu Glu 20 25 30 Gly Lys Phe Ile Tyr Phe His Asp Tyr Asn Lys Lys Asn Val Ser Val 35 40 45 Ile Ser Gly Gly Gly Ala Gly His Glu Pro Thr His Ser Ser Phe Val 50 55 60 Gly Lys Gly Met Leu Thr Ala Ala Val Ser Gly Ser Ile Phe Ala Ser 65 70 75 80 Pro Ser Ser Lys Gln Ile Tyr Thr Gly Ile Lys Gln Val Glu Ser Glu 85 90 95 Ala Gly Thr Leu Val Ile Cys Lys Asn Tyr Thr Gly Asp Ile Leu His 100 105 110 Phe Gly Met Ala Leu Glu Lys Gln Arg Thr Ala Gly Lys Lys Ala Glu 115 120 125 Leu Ile Ala Val Ala Asp Asp Val Ser Val Gly Arg Lys Lys Ser Gly 130 135 140 Lys Val Gly Arg Arg Gly Leu Ser Gly Thr Val Leu Val His Lys Ile 145 150 155 160 Ala Gly Ala Ala Ala Ala Arg Gly Leu Pro Leu Glu Ala Val Thr Thr 165 170 175 Ile Ala Lys Ala Ala Ile Asp Asn Leu Val Ser Ile Gly Ala Ser Leu 180 185 190 Ala His Val His Val Pro Gly His Glu Pro Ile Ala Lys Glu Asp Glu 195 200 205 Met Lys His Asp Glu Met Glu Leu Gly Met Gly Ile His Asn Glu Pro 210 215 220 Gly Cys Lys Arg Ile Ser Pro Ile Pro Ser Ile Asp Asp Leu Ile Ala 225 230 235 240 Gln Met Leu Lys Gln Met Leu Asp Gln Ser Asp Lys Asp Arg Ala Tyr 245 250 255 Val Lys Ile Glu Gly Asp Asp Glu Val Val Leu Leu Met Asn Asn Leu 260 265 270 Gly Gly Leu Ser Met Leu Glu Phe Ser Ala Ile Ser His Lys Val Lys 275 280 285 Glu Ala Leu Ala Lys Glu Tyr Lys Ile Asn Pro Val Arg Ile Phe Ala 290 295 300 Gly Pro Phe Thr Thr Ser Leu Asn Gly Leu Gly Phe Gly Ile Thr Leu 305 310 315 320 Leu Arg Thr Thr Asp Arg Val Lys Val Glu Gly Glu Glu Tyr Ser Leu 325 330 335 Val Asp Leu Ile Asp Gln Pro Val Glu Ala Ile Gly Trp Pro Leu Cys 340 345 350 Gln Pro Ser Asp Leu Lys Ser Lys Asn Lys Ile Gly Asn Val Ser Ile 355 360 365 Glu Glu Gly Gln Lys Asp Val Lys Ser Pro Val Thr Val Asp Lys Glu 370 375 380 Lys Val Arg Gln Ala Ile Val Asn Ser Met Glu Asn Leu Ile Lys Ala 385 390 395 400 Glu Pro Lys Ile Thr Lys Phe Asp Thr Met Ala Gly Asp Gly Asp Cys 405 410 415 Gly Thr Thr Leu Lys Arg Gly Ala Glu Gly Val Leu Lys Phe Val Lys 420 425 430 Ser Asp Lys Phe Ser Asp Asp Pro Ile Arg Ile Val Arg Asp Ile Ala 435 440 445 Asp Val Ile Glu Asp Asn Met Asp Gly Thr Ser Gly Ala Leu Tyr Ala 450 455 460 Ile Phe Phe His Gly Phe Ala Lys Gly Met Lys Asp Thr Leu Glu Lys 465 470 475 480 Ser Lys Asp Ile Ser Ser Lys Thr Trp Ala Ala Gly Leu Lys Val Ala 485 490 495 Leu Asp Thr Leu Phe Lys Tyr Thr Pro Ala Arg Pro Gly Asp Ser Thr 500 505 510 Met Cys Asp Ala Leu Val Pro Phe Val Glu Thr Phe Val Lys Thr Asn 515 520 525 Asp Leu Asn Ala Ala Val Glu Glu Ala Arg Lys Gly Ala Asp Ala Thr 530 535 540 Ala Asp Met Gln Ala Lys Leu Gly Arg Ala Val Tyr Val Gly Asp Asp 545 550 555 560 Val Lys Val Pro Asp Ala Gly Ala Leu Gly Val Val Ala Ile Val Glu 565 570 575 Gly Phe Thr Lys 580 <210> 15 <211> 621 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..621 <223> /organism="Artificial Sequence" /note="Fragment containing the TDH3-promoter" /mol_type="unassigned DNA" <400> 15 ggtctcggtg cttagtcaaa aaattagcct tttaattctg ctgtaacccg tacatgccca 60 aaataggggg cgggttacac agaatatata acatcgtagg tgtctgggtg aacagtttat 120 tcctggcatc cactaaatat aatggagccc gctttttaag ctggcatcca gaaaaaaaaa 180 gaatcccagc accaaaatat tgttttcttc accaaccatc agttcatagg tccattctct 240 tagcgcaact acagagaaca ggggcacaaa caggcaaaaa acgggcacaa cctcaatgga 300 gtgatgcaac ctgcctggag taaatgatga cacaaggcaa ttgacccacg catgtatcta 360 tctcattttc ttacaccttc tattaccttc tgctctctct gatttggaaa aagctgaaaa 420 aaaaggttga aaccagttcc ctgaaattat tcccctactt gactaataag tatataaaga 480 cggtaggtat tgattgtaat tctgtaaatc tatttcttaa acttcttaaa ttctactttt 540 atagttagtc ttttttttag ttttaaaaca ccaagaactt agtttcgaat aaacacacat 600 aaacaaacaa aatgggagac c 621 <210> 16 <211> 620 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..620 <223> /organism="Artificial Sequence" /note="Fragment containing the TDH1-promoter" /mol_type="unassigned DNA" <400> 16 ggtctcggtg ccagcgccag tagggttgtt gagcttagta aaaatgtgcg caccacaagc 60 ctacagactc cacgtcacat gaaaccacac cgtggggcct tgttgcgcta ggaataggat 120 atgcgacgaa gacgcttctg cttagtaacc acaccacatt ttcagggggt cgatctgctt 180 gcttccttta ctgtcacgag cggcccataa tcgcgctttt tttttaaaag gcgcgagaca 240 gcaaacagga agctcgggtt tcaaccttcg gagtggtcgc agatctggag actggatctt 300 tacaatacag taaggcaagc caccatctgc ttcttaggtg catgcgacgg tatccacgtg 360 cagaacaaca tagtctgaag aaggggggga ggagcatgtt cattctctgt agcagtaaga 420 gcttggtgat aatgaccaaa actggagtct cgaaatcata taaatagaca atatattttc 480 acacaatgag atttgtagta cagttctatt ctctctcttg cataaataag aaattcatca 540 agaacttggt ttgatatttc accaacacac acaaaaaaca gtacttcact aaatttacac 600 acaaaacaaa atgggagacc 620 <210> 17 <211> 321 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..321 <223> /organism="Artificial Sequence" /note="Fragment containing the PGK1-terminator" /mol_type="unassigned DNA" <400> 17 ggtctcgtaa attgaattga attgaaatcg atagatcaat ttttttcttt tctctttccc 60 catcctttac gctaaaataa tagtttattt tattttttga atatttttta tttatatacg 120 tatatataga ctattattta tcttttaatg attattaaga tttttattaa aaaaaattac 180 gctcctcttt taatgccttt atgcagtttt ttttcccatt cgatatttct atgttcgggt 240 tcagcgtatt ttaagtttaa taactcgaaa attctgcgtt cgttaaagct ttcgagaagg 300 atattatttc cctcggagac c 321 <210> 18 <211> 621 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..621 <223> /organism="Artificial Sequence" /note="Fragment containing the PGK1-promoter" /mol_type="unassigned DNA" <400> 18 ggtctcggtg cgggccagaa aaaggaagtg tttccctcct tcttgaattg atgttaccct 60 cataaagcac gtggcctctt atcgagaaag aaattaccgt cgctcgtgat ttgtttgcaa 120 aaagaacaaa actgaaaaaa cccagacacg ctcgacttcc tgtcttccta ttgattgcag 180 cttccaattt cgtcacacaa caaggtccta gcgacggctc acaggttttg taacaagcaa 240 tcgaaggttc tggaatggcg ggaaagggtt tagtaccaca tgctatgatg cccactgtga 300 tctccagagc aaagttcgtt cgatcgtact gttactctct ctctttcaaa cagaattgtc 360 cgaatcgtgt gacaacaaca gcctgttctc acacactctt ttcttctaac caagggggtg 420 gtttagttta gtagaacctc gtgaaactta catttacata tatataaact tgcataaatt 480 ggtcaatgca agaaatacat atttggtctt ttctaattcg tagtttttca agttcttaga 540 tgctttcttt ttctcttttt tacagatcat caaggaagta attatctact ttttacaaca 600 aatataaaac aatgggagac c 621 <210> 19 <211> 621 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..621 <223> /organism="Artificial Sequence" /note="Fragment containing the PRE3-promoter" /mol_type="unassigned DNA" <400> 19 ggtctcggtg ccaaacatta atttgttctg catactttga acctttcaga aaataaaaaa 60 cattacgcgc atacttaccc tgctcgcgaa gaagagtaac actaacgcat tctatgggca 120 attgaagaca gtattcagta caagacatag tccgtttcct tgagtcaatt cctatagcat 180 tatgaactag ccgcctttaa gagtgccaag ctgttcaaca ccgatcattt ttgatgattt 240 ggcgtttttg ttatattgat agatttcttt tgaattttgt cattttcact tttccactcg 300 caacggaatc cggtggcaaa aaagggaaaa gcattgaaat gcaatcttta acagtatttt 360 aaacaagttg cgacacggtg tacaattacg ataagaattg ctacttcaaa gtacacacag 420 aaagttaaca tgaatggaat tcaagtggac atcaatcgtt tgaaaaaggg cgaagtcagt 480 ttaggtacct caatgtatgt atataagaat ttttcctccc actttattgt ttctaaaagt 540 tcaatgaagt aaagtctcaa ttggccttat tactaactaa taggtatctt ataatcacct 600 aataaaatag aatgggagac c 621 <210> 20 <211> 322 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..322 <223> /organism="Artificial Sequence" /note="Fragment containing the PGI1-terminator" /mol_type="unassigned DNA" <400> 20 ggtctcgtaa aacaaatcgc tcttaaatat atacctaaag aacattaaag ctatattata 60 agcaaagata cgtaaatttt gcttatatta ttatacacat atcatatttc tatattttta 120 agatttggtt atataatgta cgtaatgcaa aggaaataaa ttttatacat tattgaacag 180 cgtccaagta actacattat gtgcactaat agtttagcgt cgtgaagact ttattgtgtc 240 gcgaaaagta aaaattttaa aaattagagc accttgaact tgcgaaaaag gttctcatca 300 actgtttaaa acctcggaga cc 322 <210> 21 <211> 621 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..621 <223> /organism="Artificial Sequence" /note="Fragment containing the ENO1-promoter" /mol_type="unassigned DNA" <400> 21 ggtctcggtg cccgcggaac cgccagatat tcattacttg acgcaaaagc gtttgaaata 60 atgacgaaaa agaaggaaga aaaaaaaaga aaaataccgc ttctaggcgg gttatctact 120 gatccgagct tccactagga tagcacccaa acacctgcat atttggacga cctttactta 180 caccaccaaa aaccactttc gcctctcccg cccctgataa cgtccactaa ttgagcgatt 240 acctgagcgg tcctcttttg tttgcagcat gagacttgca tactgcaaat cgtaagtagc 300 aacgtgtcaa ggtcaaaact gtatggaaac cttgtcacct cacttaattc tagctagcct 360 accctgcaag tcaagaggtg tccgtgattc ctagccacct caaggtatgc ctctccccgg 420 aaactgtggc cttttctggc acacatgatc tccacgattt caacatataa atagcttttg 480 ataatggcaa tattaatcaa atttatttta cttctttctt gtaacatctc tcttgtaatc 540 ccttattcct tctagctatt tttcataaaa aaccaagcaa ctgcttatca acacacaaac 600 actaaatcaa aatgggagac c 621 <210> 22 <211> 621 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..621 <223> /organism="Artificial Sequence" /note="Fragment containing the ACT1-promoter" /mol_type="unassigned DNA" <400> 22 ggtctcggtg caacatatat acacaattac agtaacaata acaagaggac agatactacc 60 aaaatgtgtg gggaagcggg taagctgcca cagcaattaa tgcacaacat ttaacctaca 120 ttcttcctta tcggatcctc aaaaccctta aaaacatatg cctcacccta acatattttc 180 caattaaccc tcaatatttc tctgtcaccc ggcctctatt ttccattttc ttctttaccc 240 gccacgcgtt tttttctttc aaattttttt cttctttctt ctttttcttc cacgtcctct 300 tgcataaata aataaaccgt tttgaaacca aactcgcctc tctctctcct ttttgaaata 360 tttttgggtt tgtttgatcc tttccttccc aatctctctt gtttaatata tattcattta 420 tatcacgctc tctttttatc ttcctttttt tcctctctct tgtattcttc cttccccttt 480 ctactcaaac caagaagaaa aagaaaaggt caatctttgt taaagaatag gatcttctac 540 tacatcagct tttagatttt tcacgcttac tgcttttttc ttcccaagat cgaaaattta 600 ctgaattaac aatgggagac c 621 <210> 23 <211> 322 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..322 <223> /organism="Artificial Sequence" /note="Fragment containing the CYC1-terminator" /mol_type="unassigned DNA" <400> 23 ggtctcgtaa aacaggcccc ttttcctttg tcgatatcat gtaattagtt atgtcacgct 60 tacattcacg ccctcccccc acatccgctc taaccgaaaa ggaaggagtt agacaacctg 120 aagtctaggt ccctatttat ttttttatag ttatgttagt attaagaacg ttatttatat 180 ttcaaatttt tctttttttt ctgtacaaac gcgtgtacgc atgtaacatt atactgaaaa 240 ccttgcttga gaaggttttg ggacgctcga aggctttaat ttgcaagctt cgcagtttac 300 actctcatcg tcctcggaga cc 322 <210> 24 <211> 621 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..621 <223> /organism="Artificial Sequence" /note="Fragment containing the TPI1-promoter" /mol_type="unassigned DNA" <400> 24 ggtctcggtg cgacacctaa ctacatagtg tttaaagatt acggatattt aacttactta 60 gaataatgcc atttttttga gttataataa tcctacgtta gtgtgagcgg gatttaaact 120 gtgaggacct taatacattc agacacttct gcggtatcac cctacttatt cccttcgaga 180 ttatatctag gaacccatca ggttggtgga agattacccg ttctaagact tttcagcttc 240 ctctattgat gttacacctg gacacccctt ttctggcatc cagtttttaa tcttcagtgg 300 catgtgagat tctccgaaat taattaaagc aatcacacaa ttctctcgga taccacctcg 360 gttgaaactg acaggtggtt tgttacgcat gctaatgcaa aggagcctat atacctttgg 420 ctcggctgct gtaacaggga atataaaggg cagcataatt taggagttta gtgaacttgc 480 aacatttact attttccctt cttacgtaaa tatttttctt tttaattcta aatcaatctt 540 tttcaatttt ttgtttgtat tcttttcttg cttaaatcta taactacaaa aaacacatac 600 ataaactaaa aatgggagac c 621 <210> 25 <211> 348 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..348 <223> /organism="Artificial Sequence" /note="Fragment containing the ATG7-promoter" /mol_type="unassigned DNA" <400> 25 ggtctcggtg caaaaacacc aaagaatgga gagtagtata tactcttaac aaacactagc 60 atttcagttt atctatatac atatatatgg atgtaaaatg tactttatgg aagaacaagc 120 caccacatgt tgaaaactag ataggcaagc aagatttttc atttgtagag ctcttacgca 180 agatttttaa acttccgctt ttttaatcca tgagattcct ttggacaccc tttccggcac 240 ggcaaaacaa aaaaattaag ggaactcatt attttacgat gctacttaga taactaaagt 300 tcattatatt tcaacaaata taagataatc aagaataaat gggagacc 348 <210> 26 <211> 322 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..322 <223> /organism="Artificial Sequence" /note="Fragment containing the ENO1-terminator" /mol_type="unassigned DNA" <400> 26 ggtctcgtaa aagcttttga ttaagccttc tagtccaaaa aacacgtttt tttgtcattt 60 atttcatttt cttagaatag tttagtttat tcattttata gtcacgaatg ttttatgatt 120 ctatataggg ttgcaaacaa gcatttttca ttttatgtta aaacaatttc aggtttacct 180 tttattctgc ttgtggtgac gcgtgtatcc gcccgctctt ttggtcaccc atgtatttaa 240 ttgcataaat aattcttaaa agtggagcta gtctatttct atttacatac ctctcatttc 300 tcatttcctc ccctcggaga cc 322 <210> 27 <211> 1674 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..1674 <223> /organism="Artificial Sequence" /note="Sequence of the kanMX marker and flanking regions" /mol_type="unassigned DNA" <400> 27 ttgcccatcg aacgtacaag tactcctctg ttctctcctt cctttgcttt cttcgtacgc 60 tgcaggtcga cgaattctac cgttcgtata atgtatgcta tacgaagtta tagatctgtt 120 tagcttgcct cgtccccgcc gggtcacccg gccagcgaca tggaggccca gaataccctc 180 cttgacagtc ttgacgtgcg cagctcaggg gcatgatgtg actgtcgccc gtacatttag 240 cccatacatc cccatgtata atcatttgca tccatacatt ttgatggccg cacggcgcga 300 agcaaaaatt acggctcctc gctgcagacc tgcgagcagg gaaacgctcc cctcacagac 360 gcgttgaatt gtccccacgc cgcgcccctg tagagaaata taaaaggtta ggatttgcca 420 ctgaggttct tctttcatat acttcctttt aaaatcttgc taggatacag ttctcacatc 480 acatccgaac ataaacaacc atgggtaagg aaaagactca cgtttcgagg ccgcgattaa 540 attccaacat ggatgctgat ttatatgggt ataaatgggc tcgcgataat gtcgggcaat 600 caggtgcgac aatctatcga ttgtatggga agcccgatgc gccagagttg tttctgaaac 660 atggcaaagg tagcgttgcc aatgatgtta cagatgagat ggtcagacta aactggctga 720 cggaatttat gcctcttccg accatcaagc attttatccg tactcctgat gatgcatggt 780 tactcaccac tgcgatcccc ggcaaaacag cattccaggt attagaagaa tatcctgatt 840 caggtgaaaa tattgttgat gcgctggcag tgttcctgcg ccggttgcat tcgattcctg 900 tttgtaattg tccttttaac agcgatcgcg tatttcgtct cgctcaggcg caatcacgaa 960 tgaataacgg tttggttgat gcgagtgatt ttgatgacga gcgtaatggc tggcctgttg 1020 aacaagtctg gaaagaaatg cataagcttt tgccattctc accggattca gtcgtcactc 1080 atggtgattt ctcacttgat aaccttattt ttgacgaggg gaaattaata ggttgtattg 1140 atgttggacg agtcggaatc gcagaccgat accaggatct tgccatccta tggaactgcc 1200 tcggtgagtt ttctccttca ttacagaaac ggctttttca aaaatatggt attgataatc 1260 ctgatatgaa taaattgcag tttcatttga tgctcgatga gtttttctaa tcagtactga 1320 caataaaaag attcttgttt tcaagaactt gtcatttgta tagttttttt atattgtagt 1380 tgttctattt taatcaaatg ttagcgtgat ttatattttt tttcgcctcg acatcatctg 1440 cccagatgcg aagttaagtg cgcagaaagt aatatcatgc gtcaatcgta tgtgaatgct 1500 ggtcgctata ctgctgtcga ttcgatacta acgccgccat ccagtgtcga aaacgagctc 1560 ataacttcgt ataatgtatg ctatacgaac ggtagaattc gatatcagat ccactagtgg 1620 cctacggatc gatgtacaca accgactgca cccaaacgaa cacaaatctt agca 1674 <210> 28 <211> 2569 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..2569 <223> /organism="Artificial Sequence" /note="Sequence of gene disruption cassette GPD1::hphMX" /mol_type="unassigned DNA" <400> 28 aagcttggta cccgccttgc ttctctcccc ttccttttct ttttccagtt ttccctattt 60 tgtccctttt tccgcacaac aagtatcaga atgggttcat caaatctatc caacctaatt 120 cgcacgtaga ctggcttggt attggcagtt tcgtagttat atatatacta ccatgagtga 180 aactgttacg ttaccttaaa ttctttctcc ctttaatttt cttttatctt actctcctac 240 ataagacatc aagaaacaat tgtatattgt acaccccccc cctccacaaa cacaaatatt 300 gataatataa agatgtctgc tgctgctgat agattaaact taacttccgg ccacttgaat 360 gctggtctag taacggccgc cagtgtgctg gaattcgccc ttaatccgga gctcgtacgt 420 tcgaacttaa ggcctcgtcc ccgccgggtc acccggccag cgacatggag gcccagaata 480 ccctccttga cagtcttgac gtgcgcagct caggggcatg atgtgactgt cgcccgtaca 540 tttagcccat acatccccat gtataatcat ttgcatccat acattttgat ggccgcacgg 600 cgcgaagcaa aaattacggc tcctcgctgc agacctgcga gcagggaaac gctcccctca 660 cagacgcgtg aattgtcccc acgccgcgcc cctgtagaga aatataaaag gttaggattt 720 gccactgagg ttcttctttc atatacttcc ttttaaaatc ttgctaggat acagttctca 780 catcacatcc gaacataaac aaccatgggt aaaaagcctg aactcaccgc gacgtctgtc 840 gagaagtttc tgatcgaaaa gttcgacagc gtctccgacc tgatgcagct ctcggagggc 900 gaagaatctc gtgctttcag cttcgatgta ggagggcgtg gatatgtcct gcgggtaaat 960 agctgcgccg atggtttcta caaagatcgt tatgtttatc ggcactttgc atcggccgcg 1020 ctcccgattc cggaagtgct tgacattggg gaattcagcg agagcctgac ctattgcatc 1080 tcccgccgtg cacagggtgt cacgttgcaa gacctgcctg aaaccgaact gcccgctgtt 1140 ctgcagccgg tcgcggaggc catggatgcg atcgctgcgg ccgatcttag ccagacgagc 1200 gggttcggcc cattcggacc gcaaggaatc ggtcaataca ctacatggcg tgatttcata 1260 tgcgcgattg ctgatcccca tgtgtatcac tggcaaactg tgatggacga caccgtcagt 1320 gcgtccgtcg cgcaggctct cgatgagctg atgctttggg ccgaggactg ccccgaagtc 1380 cggcacctcg tgcacgcgga tttcggctcc aacaatgtcc tgacggacaa tggccgcata 1440 acagcggtca ttgactggag cgaggcgatg ttcggggatt cccaatacga ggtcgccaac 1500 atcttcttct ggaggccgtg gttggcttgt atggagcagc agacgcgcta cttcgagcgg 1560 aggcatccgg agcttgcagg atcgccgcgg ctccgggcgt atatgctccg cattggtctt 1620 gaccaactct atcagagctt ggttgacggc aatttcgatg atgcagcttg ggcgcagggt 1680 cgatgcgacg caatcgtccg atccggagcc gggactgtcg ggcgtacaca aatcgcccgc 1740 agaagcgcgg ccgtctggac cgatggctgt gtagaagtac tcgccgatag tggaaaccga 1800 cgccccagca ctcgtccgag ggcaaaggaa taatcagtac tgacaataaa aagattcttg 1860 ttttcaagaa cttgtcattt gtatagtttt tttatattgt agttgttcta ttttaatcaa 1920 atgttagcgt gatttatatt ttttttcgcc tcgacatcat ctgcccagat gcgaagttaa 1980 gtgcgcagaa agtaatatca tgcgtcaatc gtatgtgaat gctggtcgct atactgctgt 2040 cgattcgata ctaacgccgc catccagtgt cgacggatcc taggtgtacg agttgttgaa 2100 tggccaatcc gctcaaggtt taattacctg caaagaagtt cacgaatggt tggaaacatg 2160 tggctctgtc gaagacttcc cattatttga agccgtatac caaatcgttt acaacaacta 2220 cccaatgaag aacctgccgg acatgattga agaattagat ctacatgaag attagattta 2280 ttggagaaag ataacatatc atactttccc ccactttttt cgaggctctt ctatatcata 2340 ttcataaatt agcattatgt catttctcat aactacttta tcacgttaga aattacttat 2400 tattattaaa ttaatacaaa atttagtaac caaataaata taaataaata tgtatattta 2460 aattttaaaa aaaaaatcct atagagcaaa aggattttcc attataatat tagctgtaca 2520 cctcttccgc attttttgag ggtggttaca acaccactcg gtaccatgg 2569 <210> 29 <211> 2069 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..2069 <223> /organism="Artificial Sequence" /note="Sequence of gene disruption cassette GPD2:: natMX;" /mol_type="unassigned DNA" <400> 29 ggtaccagat cttttgcggc gaggtgccga tgggttgctg aggggaagag tgtttagctt 60 acggacctat tgccattgtt attccgatta atctattgtt cagcagctct tctctaccct 120 gtcattctag tatttttttt tttttttttt ggttttactt ttttttcttc ttgccttttt 180 ttcttgttac tttttttcta gttttttttc cttccactaa gctttttcct tgatttatcc 240 ttgggttctt ctttctactc ctttagattt tttttttata tattaatttt taagtttatg 300 tattttggta gattcaattc tctttccctt tccttttcct tcgctcccct tccttatcaa 360 tgcttgctgt cagaagatta acaagataca cattccttaa ggcctcgtcc ccgccgggtc 420 acccggccag cgacatggag gcccagaata ccctccttga cagtcttgac gtgcgcagct 480 caggggcatg atgtgactgt cgcccgtaca tttagcccat acatccccat gtataatcat 540 ttgcatccat acattttgat ggccgcacgg cgcgaagcaa aaattacggc tcctcgctgc 600 agacctgcga gcagggaaac gctcccctca cagacgcgtt gaattgtccc cacgccgcgc 660 ccctgtagag aaatataaaa ggttaggatt tgccactgag gttcttcttt catatacttc 720 cttttaaaat cttgctagga tacagttctc acatcacatc cgaacataaa caaccatgta 780 aaatgaccac tcttgacgac acggcttacc ggtaccgcac cagtgtcccg ggggacgccg 840 aggccatcga ggcactggat gggtccttca ccaccgacac cgtcttccgc gtcaccgcca 900 ccggggacgg cttcaccctg cgggaggtgc cggtggaccc gcccctgacc aaggtgttcc 960 ccgacgacga atcggacgac gaatcggacg ccggggagga cggcgacccg gactcccgga 1020 cgttcgtcgc gtacggggac gacggcgacc tggcgggctt cgtggtcgtc tcgtactccg 1080 gctggaaccg ccggctgacc gtcgaggaca tcgaggtcgc cccggagcac cgggggcacg 1140 gggtcgggcg cgcgttgatg gggctcgcga cggagttcgc ccgcgagcgg ggcgccgggc 1200 acctctggct ggaggtcacc aacgtcaacg caccggcgat ccacgcgtac cggcggatgg 1260 ggttcaccct ctgcggcctg gacaccgccc tgtacgacgg caccgcctcg gacggcgagc 1320 aggcgctcta catgagcatg ccctgcccct agtactgaca ataaaaagat tcttgttttc 1380 aagaacttgt catttgtata gtttttttat attgtagttg ttctatttta atcaaatgtt 1440 agcgtgattt atattttttt tcgcctcgac atcatctgcc cagatgcgaa gttaagtgcg 1500 cagaaagtaa tatcatgcgt caatcgtatg tgaatgctgg tcgctatact gctgtcgatt 1560 cgatactaac gccgccatcc agtgtcgacg gatcctaggt gtacagggcc caaaagggcg 1620 aattctgcag atatccatca cactggcggc cgctcgagat agtctacaac aacgtccgca 1680 tggaagacct accggagatg attgaagagc tagacatcga tgacgaatag acactctccc 1740 cccccctccc cctctgatct ttcctgttgc ctctttttcc cccaaccaat ttatcattat 1800 acacaagttc tacaactact actagtaaca ttactacagt tattataatt ttctattctc 1860 tttttcttta agaatctatc attaacgtta atttctatat atacataact accattatac 1920 acgctattat cgtttacata tcacatcacc gttaatgaaa gatacgacac cctgtacact 1980 aacacaatta aataatcgcc ataacctttt ctgttatcta tagcccttaa agctgtttct 2040 tcgagctttt tcactgcaga tctccatgg 2069 <210> 30 <211> 19 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..19 <223> /organism="Artificial Sequence" /note="Forward primer 5’ INT1 fragment (INT5-f)" /mol_type="unassigned DNA" <400> 30 cggcattatt gtgtatggc 19 <210> 31 <211> 73 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..73 <223> /organism="Artificial Sequence" /note="Reverse primer 5’ INT1 fragment (INT5-r)" /mol_type="unassigned DNA" <400> 31 aaacgcctgt gggtgtggta ctggatatgc aaagcgattg gaagtcgctt agggtttcaa 60 agatccatac ttc 73 <210> 32 <211> 22 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..22 <223> /organism="Artificial Sequence" /note="Forward primer expression cassette 1 (con5-f)" /mol_type="unassigned DNA" <400> 32 aagcgacttc caatcgcttt gc 22 <210> 33 <211> 21 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..21 <223> /organism="Artificial Sequence" /note="Reverse primer expression cassette 1 (conA-r)" /mol_type="unassigned DNA" <400> 33 aaagcaaagg aaggagagaa c 21 <210> 34 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..20 <223> /organism="Artificial Sequence" /note="Forward primer marker (conA-f)" /mol_type="unassigned DNA" <400> 34 ttgcccatcg aacgtacaag 20 <210> 35 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..23 <223> /organism="Artificial Sequence" /note="Reverse primer marker (conB-r)" /mol_type="unassigned DNA" <400> 35 tgctaagatt tgtgttcgtt tgg 23 <210> 36 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..20 <223> /organism="Artificial Sequence" /note="Forward primer expression cassette 2 (conB-f)" /mol_type="unassigned DNA" <400> 36 cggatcgatg tacacaaccg 20 <210> 37 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..23 <223> /organism="Artificial Sequence" /note="Reverse primer expression cassette 2 (conC-r)" /mol_type="unassigned DNA" <400> 37 caacaggagg cggatggata tac 23 <210> 38 <211> 21 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..21 <223> /organism="Artificial Sequence" /note="Forward primer expression cassette 3 (conC-f)" /mol_type="unassigned DNA" <400> 38 acgctttccg gcatcttcca g 21 <210> 39 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..20 <223> /organism="Artificial Sequence" /note="Reverse primer expression cassette 3 (conD-r)" /mol_type="unassigned DNA" <400> 39 gcggaatatt ggcggaacgg 20 <210> 40 <211> 22 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..22 <223> /organism="Artificial Sequence" /note="Forward primer expression cassette 4 (conD-f)" /mol_type="unassigned DNA" <400> 40 aacgttgtcc aggtttgtat cc 22 <210> 41 <211> 24 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..24 <223> /organism="Artificial Sequence" /note="Reverse primer expression cassette 4 (con3-r)" /mol_type="unassigned DNA" <400> 41 acttagtatg gtctgttgga aagg 24 <210> 42 <211> 90 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..90 <223> /organism="Artificial Sequence" /note="Forward primer 3’ INT1 fragment (INT3-f)" /mol_type="unassigned DNA" <400> 42 agaaagcctg tatgcgaagc cacaatcctt tccaacagac catactaagt attttatttt 60 acttttttta gaatgacctg ttcccgacac 90 <210> 43 <211> 24 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..24 <223> /organism="Artificial Sequence" /note="Reverse primer 3’ INT1 fragment (INT3-r)" /mol_type="unassigned DNA" <400> 43 cacaagctta ttcttccaaa aatc 24 <210> 44 <211> 3506 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..3506 <223> /organism="Artificial Sequence" /note="Sequence of plasmid p5Abbn" /mol_type="unassigned DNA" <400> 44 tagaaaaact catcgagcat caaatgaaac tgcaatttat tcatatcagg attatcaata 60 ccatattttt gaaaaagccg tttctgtaat gaaggagaaa actcaccgag gcagttccat 120 aggatggcaa gatcctggta tcggtctgcg attccgactc gtccaacatc aatacaacct 180 attaatttcc cctcgtcaaa aataaggtta tcaagtgaga aatcaccatg agtgacgact 240 gaatccggtg agaatggcaa aagtttatgc atttctttcc agacttgttc aacaggccag 300 ccattacgct cgtcatcaaa atcactcgca tcaaccaaac cgttattcat tcgtgattgc 360 gcctgagcga ggcgaaatac gcgatcgctg ttaaaaggac aattacaaac aggaatcgag 420 tgcaaccggc gcaggaacac tgccagcgca tcaacaatat tttcacctga atcaggatat 480 tcttctaata cctggaacgc tgtttttccg gggatcgcag tggtgagtaa ccatgcatca 540 tcaggagtac ggataaaatg cttgatggtc ggaagtggca taaattccgt cagccagttt 600 agtctgacca tctcatctgt aacatcattg gcaacgctac ctttgccatg tttcagaaac 660 aactctggcg catcgggctt cccatacaag cgatagattg tcgcacctga ttgcccgaca 720 ttatcgcgag cccatttata cccatataaa tcagcatcca tgttggaatt taatcgcggc 780 ctcgacgttt cccgttgaat atggctcata ttcttccttt ttcaatatta ttgaagcatt 840 tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa 900 ataggggtca gtgttacaac caattaacca attctgaaca ttatcgcgag cccatttata 960 cctgaatatg gctcataaca ccccttgttt gcctggcggc agtagcgcgg tggtcccacc 1020 tgaccccatg ccgaactcag aagtgaaacg ccgtagcgcc gatggtagtg tggggactcc 1080 ccatgcgaga gtagggaact gccaggcatc aaataaaacg aaaggctcag tcgaaagact 1140 gggcctttcg cccgggctaa ttagggggtg tcgcccttat tcgactctat agtgaagttc 1200 ctattctcta gaaagtatag gaacttctga agtggggaag cgacttccaa tcgctttgca 1260 tatccagtac cacacccaca ggcgtttgtg cggagaccgg cttactaaaa gccagataac 1320 agtatgcata tttgcgcgct gatttttgcg gtataagaat atatactgat atgtataccc 1380 gaagtatgtc aaaaagaggt atgctatgaa gcagcgtatt acagtgacag ttgacagcga 1440 cagctatcag ttgctcaagg catatatgat gtcaatatct ccggtctggt aagcacaacc 1500 atgcagaatg aagcccgtcg tctgcgtgcc gaacgctgga aagcggaaaa tcaggaaggg 1560 atggctgagg tcgcccggtt tattgaaatg aacggctctt ttgctgacga gaacaggggc 1620 tggtgaaatg cagtttaagg tttacaccta taaaagagag agccgttatc gtctgtttgt 1680 ggatgtacag agtgatatta ttgacacgcc cgggcgacgg atggtgatcc ccctggccag 1740 tgcacgtctg ctgtcagata aagtctcccg tgaactttac ccggtggtgc atatcgggga 1800 tgaaagctgg cgcatgatga ccaccgatat ggccagtgtg ccggtttccg ttatcgggga 1860 agaagtggct gatctcagcc accgcgaaaa tgacatcaaa aacgccatta acctgatgtt 1920 ctggggaata taaggtctcg cctcttgccc atcgaacgta caagtactcc tctgttctct 1980 ccttcctttg ctttaaaatg aagtgaagtt cctatacttt ctagagaata ggaacttcta 2040 tagtgagtcg aataagggcg acacaaaatt tattctaaat gcataataaa tactgataac 2100 atcttatagt ttgtattata ttttgtatta tcgttgacat gtataatttt gatatcaaaa 2160 actgattttc cctttattat tttcgagatt tattttctta attctcttta acaaactaga 2220 aatattgtat atacaaaaaa tcataaataa tagatgaata gtttaattat aggtgttcat 2280 caatcgaaaa agcaacgtat cttatttaaa gtgcgttgct tttttctcat ttataaggtt 2340 aaataattct catatatcaa gcaaagtgac aggcgccctt aaatattctg acaaatgctc 2400 tttccctaaa ctccccccat aaaaaaaccc gccgaagcgg gtttttacgt tatttgcgga 2460 ttaacgatta ctcgttatca gaaccgccca gggggcccga gcttaagact ggccgtcgtt 2520 ttacaacaca gaaagagttt gtagaaacgc aaaaaggcca tccgtcaggg gccttctgct 2580 tagtttgatg cctggcagtt ccctactctc gccttccgct tcctcgctca ctgactcgct 2640 gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt 2700 atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc 2760 caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga 2820 gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata 2880 ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac 2940 cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg 3000 taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc 3060 cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag 3120 acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt 3180 aggcggtgct acagagttct tgaagtggtg ggctaactac ggctacacta gaagaacagt 3240 atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg 3300 atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac 3360 gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca 3420 gtggaacgac gcgcgcgtaa ctcacgttaa gggattttgg tcatgagctt gcgccgtccc 3480 gtcaagtcag cgtaatgctc tgcttt 3506 <210> 45 <211> 3506 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..3506 <223> /organism="Artificial Sequence" /note="Sequence of plasmid pBCbbn" /mol_type="unassigned DNA" <400> 45 tagaaaaact catcgagcat caaatgaaac tgcaatttat tcatatcagg attatcaata 60 ccatattttt gaaaaagccg tttctgtaat gaaggagaaa actcaccgag gcagttccat 120 aggatggcaa gatcctggta tcggtctgcg attccgactc gtccaacatc aatacaacct 180 attaatttcc cctcgtcaaa aataaggtta tcaagtgaga aatcaccatg agtgacgact 240 gaatccggtg agaatggcaa aagtttatgc atttctttcc agacttgttc aacaggccag 300 ccattacgct cgtcatcaaa atcactcgca tcaaccaaac cgttattcat tcgtgattgc 360 gcctgagcga ggcgaaatac gcgatcgctg ttaaaaggac aattacaaac aggaatcgag 420 tgcaaccggc gcaggaacac tgccagcgca tcaacaatat tttcacctga atcaggatat 480 tcttctaata cctggaacgc tgtttttccg gggatcgcag tggtgagtaa ccatgcatca 540 tcaggagtac ggataaaatg cttgatggtc ggaagtggca taaattccgt cagccagttt 600 agtctgacca tctcatctgt aacatcattg gcaacgctac ctttgccatg tttcagaaac 660 aactctggcg catcgggctt cccatacaag cgatagattg tcgcacctga ttgcccgaca 720 ttatcgcgag cccatttata cccatataaa tcagcatcca tgttggaatt taatcgcggc 780 ctcgacgttt cccgttgaat atggctcata ttcttccttt ttcaatatta ttgaagcatt 840 tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa 900 ataggggtca gtgttacaac caattaacca attctgaaca ttatcgcgag cccatttata 960 cctgaatatg gctcataaca ccccttgttt gcctggcggc agtagcgcgg tggtcccacc 1020 tgaccccatg ccgaactcag aagtgaaacg ccgtagcgcc gatggtagtg tggggactcc 1080 ccatgcgaga gtagggaact gccaggcatc aaataaaacg aaaggctcag tcgaaagact 1140 gggcctttcg cccgggctaa ttagggggtg tcgcccttat tcgactctat agtgaagttc 1200 ctattctcta gaaagtatag gaacttctga agtggggcgg atcgatgtac acaaccgact 1260 gcacccaaac gaacacaaat cttagcagtg cggagaccgg cttactaaaa gccagataac 1320 agtatgcata tttgcgcgct gatttttgcg gtataagaat atatactgat atgtataccc 1380 gaagtatgtc aaaaagaggt atgctatgaa gcagcgtatt acagtgacag ttgacagcga 1440 cagctatcag ttgctcaagg catatatgat gtcaatatct ccggtctggt aagcacaacc 1500 atgcagaatg aagcccgtcg tctgcgtgcc gaacgctgga aagcggaaaa tcaggaaggg 1560 atggctgagg tcgcccggtt tattgaaatg aacggctctt ttgctgacga gaacaggggc 1620 tggtgaaatg cagtttaagg tttacaccta taaaagagag agccgttatc gtctgtttgt 1680 ggatgtacag agtgatatta ttgacacgcc cgggcgacgg atggtgatcc ccctggccag 1740 tgcacgtctg ctgtcagata aagtctcccg tgaactttac ccggtggtgc atatcgggga 1800 tgaaagctgg cgcatgatga ccaccgatat ggccagtgtg ccggtttccg ttatcgggga 1860 agaagtggct gatctcagcc accgcgaaaa tgacatcaaa aacgccatta acctgatgtt 1920 ctggggaata taaggtctcg cctcacgctt tccggcatct tccagaccac agtatatcca 1980 tccgcctcct gttgaaaatg aagtgaagtt cctatacttt ctagagaata ggaacttcta 2040 tagtgagtcg aataagggcg acacaaaatt tattctaaat gcataataaa tactgataac 2100 atcttatagt ttgtattata ttttgtatta tcgttgacat gtataatttt gatatcaaaa 2160 actgattttc cctttattat tttcgagatt tattttctta attctcttta acaaactaga 2220 aatattgtat atacaaaaaa tcataaataa tagatgaata gtttaattat aggtgttcat 2280 caatcgaaaa agcaacgtat cttatttaaa gtgcgttgct tttttctcat ttataaggtt 2340 aaataattct catatatcaa gcaaagtgac aggcgccctt aaatattctg acaaatgctc 2400 tttccctaaa ctccccccat aaaaaaaccc gccgaagcgg gtttttacgt tatttgcgga 2460 ttaacgatta ctcgttatca gaaccgccca gggggcccga gcttaagact ggccgtcgtt 2520 ttacaacaca gaaagagttt gtagaaacgc aaaaaggcca tccgtcaggg gccttctgct 2580 tagtttgatg cctggcagtt ccctactctc gccttccgct tcctcgctca ctgactcgct 2640 gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt 2700 atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc 2760 caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga 2820 gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata 2880 ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac 2940 cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg 3000 taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc 3060 cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag 3120 acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt 3180 aggcggtgct acagagttct tgaagtggtg ggctaactac ggctacacta gaagaacagt 3240 atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg 3300 atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac 3360 gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca 3420 gtggaacgac gcgcgcgtaa ctcacgttaa gggattttgg tcatgagctt gcgccgtccc 3480 gtcaagtcag cgtaatgctc tgcttt 3506 <210> 46 <211> 3506 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..3506 <223> /organism="Artificial Sequence" /note="Sequence of plasmid pCDbbn" /mol_type="unassigned DNA" <400> 46 tagaaaaact catcgagcat caaatgaaac tgcaatttat tcatatcagg attatcaata 60 ccatattttt gaaaaagccg tttctgtaat gaaggagaaa actcaccgag gcagttccat 120 aggatggcaa gatcctggta tcggtctgcg attccgactc gtccaacatc aatacaacct 180 attaatttcc cctcgtcaaa aataaggtta tcaagtgaga aatcaccatg agtgacgact 240 gaatccggtg agaatggcaa aagtttatgc atttctttcc agacttgttc aacaggccag 300 ccattacgct cgtcatcaaa atcactcgca tcaaccaaac cgttattcat tcgtgattgc 360 gcctgagcga ggcgaaatac gcgatcgctg ttaaaaggac aattacaaac aggaatcgag 420 tgcaaccggc gcaggaacac tgccagcgca tcaacaatat tttcacctga atcaggatat 480 tcttctaata cctggaacgc tgtttttccg gggatcgcag tggtgagtaa ccatgcatca 540 tcaggagtac ggataaaatg cttgatggtc ggaagtggca taaattccgt cagccagttt 600 agtctgacca tctcatctgt aacatcattg gcaacgctac ctttgccatg tttcagaaac 660 aactctggcg catcgggctt cccatacaag cgatagattg tcgcacctga ttgcccgaca 720 ttatcgcgag cccatttata cccatataaa tcagcatcca tgttggaatt taatcgcggc 780 ctcgacgttt cccgttgaat atggctcata ttcttccttt ttcaatatta ttgaagcatt 840 tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa 900 ataggggtca gtgttacaac caattaacca attctgaaca ttatcgcgag cccatttata 960 cctgaatatg gctcataaca ccccttgttt gcctggcggc agtagcgcgg tggtcccacc 1020 tgaccccatg ccgaactcag aagtgaaacg ccgtagcgcc gatggtagtg tggggactcc 1080 ccatgcgaga gtagggaact gccaggcatc aaataaaacg aaaggctcag tcgaaagact 1140 gggcctttcg cccgggctaa ttagggggtg tcgcccttat tcgactctat agtgaagttc 1200 ctattctcta gaaagtatag gaacttctga agtggggacg ctttccggca tcttccagac 1260 cacagtatat ccatccgcct cctgttggtg cggagaccgg cttactaaaa gccagataac 1320 agtatgcata tttgcgcgct gatttttgcg gtataagaat atatactgat atgtataccc 1380 gaagtatgtc aaaaagaggt atgctatgaa gcagcgtatt acagtgacag ttgacagcga 1440 cagctatcag ttgctcaagg catatatgat gtcaatatct ccggtctggt aagcacaacc 1500 atgcagaatg aagcccgtcg tctgcgtgcc gaacgctgga aagcggaaaa tcaggaaggg 1560 atggctgagg tcgcccggtt tattgaaatg aacggctctt ttgctgacga gaacaggggc 1620 tggtgaaatg cagtttaagg tttacaccta taaaagagag agccgttatc gtctgtttgt 1680 ggatgtacag agtgatatta ttgacacgcc cgggcgacgg atggtgatcc ccctggccag 1740 tgcacgtctg ctgtcagata aagtctcccg tgaactttac ccggtggtgc atatcgggga 1800 tgaaagctgg cgcatgatga ccaccgatat ggccagtgtg ccggtttccg ttatcgggga 1860 agaagtggct gatctcagcc accgcgaaaa tgacatcaaa aacgccatta acctgatgtt 1920 ctggggaata taaggtctcg cctcaacgtt gtccaggttt gtatccacgt gtgtccgttc 1980 cgccaatatt ccgcaaaatg aagtgaagtt cctatacttt ctagagaata ggaacttcta 2040 tagtgagtcg aataagggcg acacaaaatt tattctaaat gcataataaa tactgataac 2100 atcttatagt ttgtattata ttttgtatta tcgttgacat gtataatttt gatatcaaaa 2160 actgattttc cctttattat tttcgagatt tattttctta attctcttta acaaactaga 2220 aatattgtat atacaaaaaa tcataaataa tagatgaata gtttaattat aggtgttcat 2280 caatcgaaaa agcaacgtat cttatttaaa gtgcgttgct tttttctcat ttataaggtt 2340 aaataattct catatatcaa gcaaagtgac aggcgccctt aaatattctg acaaatgctc 2400 tttccctaaa ctccccccat aaaaaaaccc gccgaagcgg gtttttacgt tatttgcgga 2460 ttaacgatta ctcgttatca gaaccgccca gggggcccga gcttaagact ggccgtcgtt 2520 ttacaacaca gaaagagttt gtagaaacgc aaaaaggcca tccgtcaggg gccttctgct 2580 tagtttgatg cctggcagtt ccctactctc gccttccgct tcctcgctca ctgactcgct 2640 gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt 2700 atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc 2760 caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga 2820 gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata 2880 ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac 2940 cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg 3000 taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc 3060 cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag 3120 acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt 3180 aggcggtgct acagagttct tgaagtggtg ggctaactac ggctacacta gaagaacagt 3240 atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg 3300 atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac 3360 gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca 3420 gtggaacgac gcgcgcgtaa ctcacgttaa gggattttgg tcatgagctt gcgccgtccc 3480 gtcaagtcag cgtaatgctc tgcttt 3506 <210> 47 <211> 3506 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..3506 <223> /organism="Artificial Sequence" /note="Sequence of plasmid pD3bbn" /mol_type="unassigned DNA" <400> 47 tagaaaaact catcgagcat caaatgaaac tgcaatttat tcatatcagg attatcaata 60 ccatattttt gaaaaagccg tttctgtaat gaaggagaaa actcaccgag gcagttccat 120 aggatggcaa gatcctggta tcggtctgcg attccgactc gtccaacatc aatacaacct 180 attaatttcc cctcgtcaaa aataaggtta tcaagtgaga aatcaccatg agtgacgact 240 gaatccggtg agaatggcaa aagtttatgc atttctttcc agacttgttc aacaggccag 300 ccattacgct cgtcatcaaa atcactcgca tcaaccaaac cgttattcat tcgtgattgc 360 gcctgagcga ggcgaaatac gcgatcgctg ttaaaaggac aattacaaac aggaatcgag 420 tgcaaccggc gcaggaacac tgccagcgca tcaacaatat tttcacctga atcaggatat 480 tcttctaata cctggaacgc tgtttttccg gggatcgcag tggtgagtaa ccatgcatca 540 tcaggagtac ggataaaatg cttgatggtc ggaagtggca taaattccgt cagccagttt 600 agtctgacca tctcatctgt aacatcattg gcaacgctac ctttgccatg tttcagaaac 660 aactctggcg catcgggctt cccatacaag cgatagattg tcgcacctga ttgcccgaca 720 ttatcgcgag cccatttata cccatataaa tcagcatcca tgttggaatt taatcgcggc 780 ctcgacgttt cccgttgaat atggctcata ttcttccttt ttcaatatta ttgaagcatt 840 tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa 900 ataggggtca gtgttacaac caattaacca attctgaaca ttatcgcgag cccatttata 960 cctgaatatg gctcataaca ccccttgttt gcctggcggc agtagcgcgg tggtcccacc 1020 tgaccccatg ccgaactcag aagtgaaacg ccgtagcgcc gatggtagtg tggggactcc 1080 ccatgcgaga gtagggaact gccaggcatc aaataaaacg aaaggctcag tcgaaagact 1140 gggcctttcg cccgggctaa ttagggggtg tcgcccttat tcgactctat agtgaagttc 1200 ctattctcta gaaagtatag gaacttctga agtggggacg ctttccggca tcttccagac 1260 cacagtatat ccatccgcct cctgttggtg cggagaccgg cttactaaaa gccagataac 1320 agtatgcata tttgcgcgct gatttttgcg gtataagaat atatactgat atgtataccc 1380 gaagtatgtc aaaaagaggt atgctatgaa gcagcgtatt acagtgacag ttgacagcga 1440 cagctatcag ttgctcaagg catatatgat gtcaatatct ccggtctggt aagcacaacc 1500 atgcagaatg aagcccgtcg tctgcgtgcc gaacgctgga aagcggaaaa tcaggaaggg 1560 atggctgagg tcgcccggtt tattgaaatg aacggctctt ttgctgacga gaacaggggc 1620 tggtgaaatg cagtttaagg tttacaccta taaaagagag agccgttatc gtctgtttgt 1680 ggatgtacag agtgatatta ttgacacgcc cgggcgacgg atggtgatcc ccctggccag 1740 tgcacgtctg ctgtcagata aagtctcccg tgaactttac ccggtggtgc atatcgggga 1800 tgaaagctgg cgcatgatga ccaccgatat ggccagtgtg ccggtttccg ttatcgggga 1860 agaagtggct gatctcagcc accgcgaaaa tgacatcaaa aacgccatta acctgatgtt 1920 ctggggaata taaggtctcg cctcaacgtt gtccaggttt gtatccacgt gtgtccgttc 1980 cgccaatatt ccgcaaaatg aagtgaagtt cctatacttt ctagagaata ggaacttcta 2040 tagtgagtcg aataagggcg acacaaaatt tattctaaat gcataataaa tactgataac 2100 atcttatagt ttgtattata ttttgtatta tcgttgacat gtataatttt gatatcaaaa 2160 actgattttc cctttattat tttcgagatt tattttctta attctcttta acaaactaga 2220 aatattgtat atacaaaaaa tcataaataa tagatgaata gtttaattat aggtgttcat 2280 caatcgaaaa agcaacgtat cttatttaaa gtgcgttgct tttttctcat ttataaggtt 2340 aaataattct catatatcaa gcaaagtgac aggcgccctt aaatattctg acaaatgctc 2400 tttccctaaa ctccccccat aaaaaaaccc gccgaagcgg gtttttacgt tatttgcgga 2460 ttaacgatta ctcgttatca gaaccgccca gggggcccga gcttaagact ggccgtcgtt 2520 ttacaacaca gaaagagttt gtagaaacgc aaaaaggcca tccgtcaggg gccttctgct 2580 tagtttgatg cctggcagtt ccctactctc gccttccgct tcctcgctca ctgactcgct 2640 gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt 2700 atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc 2760 caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga 2820 gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata 2880 ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac 2940 cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg 3000 taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc 3060 cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag 3120 acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt 3180 aggcggtgct acagagttct tgaagtggtg ggctaactac ggctacacta gaagaacagt 3240 atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg 3300 atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac 3360 gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca 3420 gtggaacgac gcgcgcgtaa ctcacgttaa gggattttgg tcatgagctt gcgccgtccc 3480 gtcaagtcag cgtaatgctc tgcttt 3506 <210> 48 <211> 2692 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..2692 <223> /organism="Artificial Sequence" /note="Sequence containing the adhE (E.coli) DNA sequence codon-pair optimized for expression in S. cerevisiae" /mol_type="unassigned DNA" <400> 48 ggtctcgaat ggccgttact aacgtcgctg aattgaacgc tttggttgaa agagtcaaga 60 aggctcaaag agaatacgct tctttcaccc aagaacaagt cgacaagatc ttcagagccg 120 ccgccttggc tgctgctgac gctagaattc cattagctaa gatggctgtt gctgaatctg 180 gtatgggtat tgtcgaagat aaggttatta agaaccattt cgcttctgaa tacatctaca 240 acgcctacaa ggacgaaaag acttgtggtg tcttgtctga agatgacact ttcggtacta 300 tcactatcgc tgaaccaatc ggtatcatct gtggtatcgt tccaaccact aacccaactt 360 ctaccgccat cttcaaatcc ttgatctctt taaagaccag aaacgctatt atcttctctc 420 ctcacccacg tgccaaggat gctaccaaca aggctgctga tattgtcttg caagctgcta 480 ttgctgctgg tgctccaaag gacttgatcg gttggatcga ccaaccatct gtcgaattat 540 ccaatgcttt gatgcaccac ccagatatca acttgatctt ggctaccggt ggtccaggta 600 tggttaaggc tgcttactct tccggtaagc cagctattgg tgtcggtgct ggtaacactc 660 ctgttgttat cgatgaaact gctgacatca aaagagctgt tgcctccgtc ttgatgtcca 720 agactttcga caacggtgtc atctgtgctt ctgaacaatc tgttgttgtt gtcgattccg 780 tctacgacgc tgttagagaa cgttttgcta cccacggtgg ttacttgttg caaggtaagg 840 aattgaaggc tgtccaagat gtcatcttga agaacggtgc tttgaatgct gccattgtcg 900 gtcaaccagc ttacaagatt gccgaattgg ctggtttctc cgttccagaa aacaccaaga 960 ttttgattgg tgaagtcacc gttgttgacg aatccgaacc atttgctcac gaaaagttgt 1020 ctccaacctt ggctatgtac agagccaagg acttcgaaga tgccgtcgaa aaagctgaaa 1080 agttggttgc tatgggtggc attggtcaca cctcttgttt gtacactgac caagacaacc 1140 aacctgccag agtctcttac ttcggtcaaa agatgaaaac tgctagaatc ttaatcaaca 1200 ctccagcttc ccaaggtggt attggtgatt tgtacaactt caagttggcc ccatctttga 1260 ctttaggttg tggttcttgg ggtggtaact ccatctctga aaacgttggt ccaaagcact 1320 tgatcaacaa gaaaactgtt gctaagagag ctgaaaacat gttgtggcac aagttaccaa 1380 aatccatcta cttcagaaga ggttctttgc caattgcctt ggacgaagtc attaccgacg 1440 gtcacaagag agccttgatt gttaccgata gattcttgtt caacaacggt tacgctgacc 1500 aaatcacttc tgttttgaag gccgccggtg ttgaaactga agttttcttc gaagtcgaag 1560 ctgatccaac tttgtctatc gttagaaagg gtgctgaatt ggctaactct ttcaagcctg 1620 atgttatcat tgctttgggt ggtggttctc caatggacgc tgccaagatc atgtgggtta 1680 tgtacgaaca tccagaaacc catttcgaag aattggcttt aagattcatg gatatcagaa 1740 agagaatcta caagttccca aagatgggtg ttaaggccaa aatgattgct gtcaccacca 1800 cctccggtac tggttctgaa gttaccccat ttgctgtcgt caccgatgac gctactggtc 1860 aaaagtaccc attggctgat tacgctttga ccccagacat ggctatcgtt gatgctaact 1920 tggttatgga catgccaaag tctttgtgtg ccttcggtgg tctagacgct gtcacccacg 1980 ctatggaagc ttacgtttcc gtcttggctt ccgaattttc tgacggtcaa gctttacaag 2040 ctttgaaatt gttgaaagaa tacttgccag cctcctacca cgaaggttct aagaacccag 2100 ttgctagaga aagagttcac tctgctgcca ccattgctgg tattgccttt gctaacgctt 2160 tcttgggtgt ctgtcactcc atggctcaca agttgggttc tcaattccac atcccacacg 2220 gtttggccaa cgctttgttg atctgtaacg tcattagata caacgctaac gacaacccaa 2280 ccaagcaaac tgccttctcc caatacgata gaccacaagc tagacgtcgt tatgctgaaa 2340 tcgctgacca cttgggttta tctgctccag gtgatcgtac tgccgccaag attgaaaagt 2400 tattggcttg gttagaaact ttaaaggctg aactaggtat tccaaagtct atcagagaag 2460 ctggtgtcca agaagctgac ttcttagcca acgttgacaa attgtccgaa gatgctttcg 2520 acgaccaatg taccggtgct aacccaagat acccattgat ctccgaattg aagcaaattt 2580 tgttggacac ctactacggt agagactacg ttgaaggtga aactgccgct aagaaggaag 2640 ctgctccagc taaggctgaa aagaaggcta agaaatcggc ataaaggaga cc 2692 <210> 49 <211> 1384 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..1384 <223> /organism="Artificial Sequence" /note="Sequence containing the acdH (L. plantarum) DNA sequence codon-pair optimized for expression in S. cerevisiae" /mol_type="unassigned DNA" <400> 49 ggtctcgaat gttgaaggaa atggaagaaa ctactgtttc tcgttccatt gacagattgg 60 ttttgaatgc ctccttggct gccaacagat tggaagtcat ggaccaatct caagttgacc 120 aagctgttgc cgctatggcc agagccgctc acgctgctcg tggtatgttg gctgctatgg 180 ctgtcgaaga aaccggtaga ggtaactaca gagacaaggt tgccaaaaac gattttgctg 240 ccaagaacgt ctacaactac atcaaggatg acaagactgt cggtatcatc aacgatgacc 300 ctgtttctgg tgtcatgaag gtcgctgaac ctgttggtat cattgccggt gttaccccag 360 tcaccaaccc aacttccact gtcatcttca acgctatgtt agctttgaaa accagaaacc 420 caattatctt tggtttccac ccattcgctc aaaagtcttg tgttgaaact ggtagaatca 480 tcagagatgc tgctattgct tctggtgctc caaaggactg gatccaatgg atcaagaccc 540 catctttgga agctaccaac actttgatga accatccagg tgttgccact atcattgcta 600 ccggtggtgc cggtatggtc aagaccgctt actccactgg taagccagct ttaggtgtcg 660 gtccaggtaa cgtcccatgt ttcattgaac aaaccgctga tatccaacaa gctgtttccg 720 atgtcgttac ctccaagtct ttcgataacg gtatgatctg tgcttctgaa tccaacttga 780 ttgttgctga ccaaatctac gaccaagtca agagagaatt gtctcacaac ggtgtctact 840 tcgttggtac tgaaaacttc aaggctctag aagctactgt tatgaacttg gacaagcaag 900 ctgtcgatcc aaaggttgcc ggtcaaaccc catggcaaat tgcccaatgg gctggtttcg 960 atgtcccatc tgacaccaag gttttagctg ttgaattgcc atccattggt ggtgaccaag 1020 tcttgtccag agaaaagttg tctccagttt tggctgtcgt tcacgctaag gacactgaag 1080 ctggtttcaa cttgatgaag agatctttgg ctttgggtgg tttaggtcac accgccgctt 1140 tgcacaccac tgacgaagct gtcatgaaca aattcgcttt ggaaatgacc gcttgtagag 1200 ctttgatcaa cgttccatct tctcaaggtg ccattggtta caaatacgac aatgttgctc 1260 catctttgac tttgggttgt ggtacttggg gtcacaactc catctctcac aacttggaag 1320 attgggactt gttgaacatc aagactgttg ctaagagatt aaccaaaata agataaagga 1380 gacc 1384 <210> 50 <211> 1420 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..1420 <223> /organism="Artificial Sequence" /note="Sequence containing the eutE (E. coli) DNA sequence codon-pair optimized for expression in S. cerevisiae" /mol_type="unassigned DNA" <400> 50 ggtctcgaat gaaccaacaa gatattgaac aagttgtcaa ggctgttcta ttgaagatgc 60 aatcttctga cactccatct gctgccgtcc acgaaatggg tgttttcgct tctttggacg 120 atgctgttgc tgctgctaag gttgctcaac aaggtttgaa atccgttgcc atgagacaat 180 tggccattgc tgccattaga gaagctggtg aaaagcatgc ccgtgacttg gctgaattgg 240 ctgtctctga aaccggtatg ggtagagttg aagataaatt cgctaagaac gttgctcaag 300 ctcgtggtac tccaggtgtc gaatgtttgt ctcctcaagt cttgaccggt gacaacggtt 360 tgactttgat tgaaaacgct ccatggggtg ttgttgcttc cgttactcca tctactaatc 420 cagctgccac cgtcatcaac aatgctatct ctttgatcgc tgccggtaac tccgttatct 480 ttgctccaca cccagctgct aagaaagtct ctcaaagagc catcactttg ttgaaccaag 540 ccatcgttgc cgctggtggt ccagaaaact tgttggtcac tgttgctaac ccagatatcg 600 aaaccgctca aagattattc aagttcccag gtatcggtct attagtcgtt accggtggtg 660 aggctgttgt cgaagctgct agaaagcaca ctaacaagag attgattgct gctggtgctg 720 gtaacccacc tgttgttgtc gatgaaaccg ctgatttggc cagagctgct caatccattg 780 tcaagggtgc ttctttcgac aacaacatca tctgtgctga tgaaaaggtt ttgatcgttg 840 ttgactccgt tgctgacgaa ttgatgagat tgatggaagg tcaacatgcc gtcaagttga 900 ccgctgaaca agctcaacaa ttgcaaccag tcttgttgaa gaacattgac gaaagaggta 960 agggtactgt ttccagagac tgggttggta gagatgctgg taagatcgct gctgccatcg 1020 gtttgaaggt tccacaagaa accagattat tgttcgtcga aaccactgct gaacacccat 1080 tcgctgtcac tgaattaatg atgccagtct tgccagttgt ccgtgttgcc aacgttgccg 1140 acgctattgc tttggctgtc aaattggaag gtggttgtca ccacactgct gctatgcact 1200 ccagaaacat tgaaaacatg aaccaaatgg ctaacgccat tgacacttcc atcttcgtca 1260 agaacggtcc atgtatcgct ggtttgggtt taggtggtga aggttggacc accatgacca 1320 tcactacccc aaccggtgaa ggtgtcactt ctgccagaac ctttgtcaga ttaagaagat 1380 gtgtcttggt cgacgctttc agaattgtgt aaaggagacc 1420 <210> 51 <211> 1426 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..1426 <223> /organism="Artificial Sequence" /note="Sequence containing the Lin1129 (L.innocua) DNA sequence codon-pair optimized for expression in S. cerevisiae" /mol_type="unassigned DNA" <400> 51 ggtctcgaat ggaatctttg gaattggaac aattggtcaa gaaggtctta ttggaaaaat 60 tggctgaaca aaaggaagtt ccaaccaaga ccaccaccca aggtgctaaa tccggtgtct 120 ttgacactgt cgatgaagct gtccaagctg ctgtcatcgc tcaaaactgt tacaaggaaa 180 aatccttgga agaaagaaga aacgttgtca aggccatcag agaagctttg tacccagaaa 240 tcgaaactat cgctaccaga gctgttgctg aaactggtat gggtaatgtc actgacaaga 300 ttttgaagaa cactttggcc attgaaaaga ccccaggtgt tgaagatttg tacactgaag 360 ttgccactgg tgacaacggt atgactttat acgaattgtc tccatacggt gtcatcggtg 420 ccgttgcccc atctaccaac ccaaccgaaa ctttgatttg taactctatc ggtatgttgg 480 ctgctggtaa tgctgttttc tactctccac acccaggtgc taagaacatc tctttatggt 540 tgattgaaaa gttgaacacc attgtcagag actcttgtgg tattgacaac ttgattgtca 600 ctgttgccaa gccatccatc caagccgctc aagaaatgat gaaccaccca aaggttccat 660 tattggtcat caccggtggt cctggtgttg ttttgcaagc tatgcaatct ggtaagaagg 720 ttatcggtgc tggtgccggt aacccaccat ccattgtcga cgaaactgcc aacatcgaaa 780 aggctgctgc tgatatcgtt gacggtgctt ctttcgacca caacatccta tgtattgctg 840 aaaaatccgt tgttgccgtc gattccattg ctgatttctt gttgttccaa atggaaaaga 900 acggtgcttt gcacgtcacc aacccatctg acatccaaaa attggaaaag gttgccgtta 960 ctgacaaggg tgtcaccaac aagaaattgg ttggtaagtc tgctactgaa attttgaagg 1020 aagctggtat tgcttgtgat ttcaccccaa gattaatcat cgtcgaaact gaaaagtccc 1080 accctttcgc taccgttgaa ttgttgatgc caatcgttcc agttgtcaga gttccagatt 1140 tcgacgaagc tttggaagtt gctatcgaat tagaacaagg tttgcaccac accgctacca 1200 tgcactctca aaacatctcc agattgaaca aggctgctag agacatgcaa acctccatct 1260 tcgttaagaa cggtccatct ttcgctggtt taggtttcag aggtgaaggt tccaccactt 1320 tcaccattgc tactccaact ggtgaaggca ccactactgc cagacatttt gctcgtcgta 1380 gaagatgtgt cttgactgat ggtttctcta tacgctaaag gagacc 1426 <210> 52 <211> 2626 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..2626 <223> /organism="Artificial Sequence" /note="Sequence containing the adhE (S. aureus) DNA sequence codon-pair optimized for expression in S. cerevisiae" /mol_type="unassigned DNA" <400> 52 ggtctcgaat gttgaccatt ccagaaaagg aaaacagagg ttccaaggaa caagaagttg 60 ctattatgat tgacgctttg gctgacaaag gtaagaaggc tttggaagct ctatccaaga 120 agtcccaaga agaaattgac cacattgtcc accaaatgtc tttggccgct gttgaccaac 180 acatggtctt ggctaagttg gctcacgaag aaactggtag aggtatctac gaagataagg 240 ccatcaagaa cttgtacgct tctgaataca tctggaactc catcaaggac aacaagactg 300 tcggtatcat cggtgaagat aaagaaaagg gtttgactta cgttgctgaa ccaattggtg 360 ttatctgtgg tgtcacccca actaccaacc caacctctac caccattttc aaggctatga 420 ttgccattaa gactggtaac cctatcatct ttgctttcca cccatctgct caagaatctt 480 ccaagagagc tgctgaagtt gttttggaag ccgctatgaa ggccggtgct ccaaaggata 540 tcatccaatg gattgaagtt ccatccatcg aagccactaa gcaattgatg aaccacaagg 600 gtattgcttt agttttagcc actggtggtt ccggtatggt caagtccgct tactccaccg 660 gtaagccagc cttgggtgtt ggtccaggta acgtcccatc ctacattgag aaaaccgctc 720 acattaagcg tgctgttaac gacatcattg gttctaagac tttcgacaat ggtatgatct 780 gtgcttctga acaagttgtt gttatcgaca aggaaatcta caaggatgtc accaacgaat 840 tcaaggctca tcaagcttac ttcgtcaaga aggacgaatt gcaaagatta gaaaatgcta 900 tcatgaacga acaaaagacc ggtatcaaac cagacattgt cggtaagtct gctgttgaaa 960 ttgctgaatt ggccggtatt ccagtcccag aaaacaccaa gttgatcatt gctgaaattt 1020 ctggtgtcgg ttctgactac ccattgtcta gagaaaagtt gtctccagtc ttggctttgg 1080 ttaaggctca atccaccaag caagctttcc aaatctgtga agatactttg cacttcggtg 1140 gtttgggtca taccgctgtc attcacactg aagatgaaac tttgcaaaaa gatttcggtc 1200 taagaatgaa ggcctgtaga gtcttggtca acactccatc cgctgttggt ggtattggtg 1260 acatgtacaa cgaattgatt ccatctttga ctttgggttg tggttcttac ggtagaaact 1320 ccatctctca caacgtttct gctaccgact tgttgaacat caagaccatt gccaagagaa 1380 gaaacaacac tcaaatcttc aaggttccag ctcaaatcta ctttgaagaa aacgccatca 1440 tgtccttgac caccatggac aagatcgaaa aggtcatgat cgtttgtgac ccaggtatgg 1500 ttgaattcgg ttacaccaag accgttgaaa acgtcttaag acaaagaact gaacaaccac 1560 aaatcaaaat tttctccgaa gtcgaaccaa acccatccac taacaccgtt tacaagggtt 1620 tagaaatgat ggtcgatttc caaccagata ccattattgc tttgggtggt ggttctgcca 1680 tggacgctgc taaggccatg tggatgttct tcgaacatcc agaaacttct ttcttcggtg 1740 ccaagcaaaa gttcttggat atcggtaagc gtacctacaa gattggtatg ccagaaaacg 1800 ctactttcat ctgtatccca actacttccg gtactggttc cgaagtcact ccatttgctg 1860 ttatcactga ttctgaaacc aacgtcaagt acccattggc tgacttcgct ttgaccccag 1920 atgttgctat catcgaccca caattcgtca tgtccgttcc aaaatctgtc actgctgaca 1980 ccggtatgga cgttttgacc cacgctatgg aatcttacgt ttccgttatg gcctccgatt 2040 acaccagagg tttatctttg caagctatca aattgacttt cgaatactta aaatcttctg 2100 tcgaaaaagg tgacaaggtt tccagagaaa agatgcacaa cgcttctact ttggctggta 2160 tggcctttgc caacgctttc ttgggtatcg ctcactctat tgctcacaag atcggtggtg 2220 aatacggtat cccacatggt agagctaacg ctatcttatt gcctcacatc atccgttaca 2280 acgctaagga ccctcaaaag cacgctttgt tcccaaagta cgaattcttc agagctgaca 2340 ctgactacgc tgatatcgct aagttcttag gtttgaaggg taacactact gaagctttgg 2400 tcgaatcttt ggccaaggct gtttacgaat tgggtcaatc tgttggtatc gaaatgaact 2460 tgaaatctca aggtgtctct gaagaagaat tgaacgaatc tattgacaga atggccgaat 2520 tggctttcga agatcaatgt accaccgcca acccaaagga agctttgatc tctgaaatca 2580 aggatattat ccaaacttct tacgattaca agcaataaag gagacc 2626 <210> 53 <211> 2068 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..2068 <223> /organism="Artificial Sequence" /note="Sequence containing the ACS2 (S. cerevisiae) DNA sequence codon-pair optimized for expression in S. cerevisiae" /mol_type="unassigned DNA" <400> 53 ggtctcgaat gaccatcaag gaacacaagg ttgtctacga agctcacaac gtcaaggctt 60 tgaaagctcc tcaacatttc tacaactctc aaccaggtaa gggttacgtt accgatatgc 120 aacactacca agaaatgtac caacaatcca tcaacgaacc agaaaaattc ttcgacaaga 180 tggctaagga atacttgcac tgggatgctc catacaccaa ggttcaatcc ggttccttga 240 acaacggtga tgtcgcttgg ttcttgaacg gtaaattgaa tgcttcctac aactgtgtcg 300 atcgtcacgc tttcgctaac ccagacaaac cagctttgat ttacgaagct gatgacgaat 360 ctgacaacaa gatcatcact ttcggtgaac tattaagaaa ggtttctcaa atcgctggtg 420 tcttgaaatc ctggggtgtt aagaagggtg acactgttgc catctacttg ccaatgatcc 480 cagaagctgt tattgctatg ttggctgtcg ccagaattgg tgccattcac tctgttgttt 540 tcgctggttt ctctgccggt tctttgaagg acagagtcgt tgacgctaac tctaaggttg 600 tcatcacttg tgacgaaggt aagagaggtg gtaagaccat taacactaag aagattgtcg 660 acgaaggttt gaacggtgtt gatttggttt ccagaatctt ggttttccaa agaaccggta 720 ctgaaggtat tccaatgaag gctggtagag actactggtg gcatgaagaa gccgctaagc 780 aaagaactta cctaccacct gtttcctgtg atgctgaaga tccattgttt ttgttgtaca 840 cctctggttc taccggttct ccaaagggtg ttgtccacac taccggtggt tacttgttgg 900 gtgctgcttt gaccaccaga tacgtctttg acatccaccc tgaagatgtc ttattcactg 960 ctggtgacgt cggttggatc actggtcata cctacgcttt gtacggtcca ttgactttag 1020 gtactgcttc tatcatcttc gaatccaccc cagcttaccc agactacggt agatactgga 1080 gaatcattca aagacacaag gccacccact tctacgtcgc cccaactgcc ttgagattaa 1140 tcaagagagt tggtgaagct gaaattgcta aatacgatac ctcttctttg agagtcttag 1200 gttctgtcgg tgaaccaatt tctccagact tatgggaatg gtatcacgaa aaggttggta 1260 acaagaactg tgtcatctgt gacaccatgt ggcaaactga atctggttct cacttgattg 1320 ctccattggc tggtgctgtt ccaactaagc caggttccgc taccgttcca ttcttcggta 1380 tcaacgcttg tatcattgac ccagtcactg gtgtcgaatt ggaaggtaac gatgttgaag 1440 gtgtcttggc cgtcaagtct ccatggccat ccatggctag atctgtctgg aaccaccacg 1500 atcgttacat ggacacctac ttgaaaccat acccaggtca ctacttcacc ggtgatggtg 1560 ccggtcgtga ccacgatggt tactactgga tcagaggtcg tgttgatgac gttgttaacg 1620 tttctggtca cagattgtcc acttctgaaa tcgaagcctc catctccaac catgaaaacg 1680 tttccgaagc tgctgtcgtt ggtattccag acgaattgac cggtcaaact gttgttgctt 1740 acgtttcttt aaaggacggt tacttgcaaa acaacgccac tgaaggtgac gctgaacaca 1800 tcactccaga taacttaaga agagaattga ttttgcaagt tcgtggtgaa attggtccat 1860 ttgcttcccc aaagaccatc attttggtta gagacttgcc aagaaccaga tctggtaaga 1920 tcatgagaag agtcttgaga aaggttgcct ccaatgaggc tgaacaattg ggtgacttga 1980 ctactttggc caacccagaa gtcgtcccag ctatcatttc tgctgtcgaa aaccaattct 2040 tctcccaaaa gaagaaataa aggagacc 2068 <210> 54 <211> 1120 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..1120 <223> /organism="Artificial Sequence" /note="Sequence containing the gldA (E. coli) DNA sequence codon-pair optimized for expression in S. cerevisiae" /mol_type="unassigned DNA" <400> 54 ggtctcgaat ggacagaatc atccaatctc caggtaagta catccaaggt gctgatgtta 60 tcaacagatt aggtgaatac ttgaagccat tggctgaaag atggttagtc gtcggtgaca 120 aattcgtttt gggtttcgct caatccaccg tcgaaaagtc tttcaaggat gctggtttgg 180 ttgttgaaat cgctccattc ggtggtgaat gttctcaaaa tgaaattgac cgtttgagag 240 gtattgctga aactgctcaa tgtggtgcca tcttgggtat tggtggtggt aagactttgg 300 acactgccaa ggctttggcc cacttcatgg gtgttccagt tgccattgct ccaaccattg 360 cttctaccga tgctccatgt tctgctttgt ccgttatcta caccgacgaa ggtgaatttg 420 accgttactt gttgttgcca aacaacccaa acatggtcat tgtcgacacc aagatcgttg 480 ccggtgctcc agccagatta ttggctgccg gtatcggtga tgctttggct acctggttcg 540 aagccagagc ttgttccaga tctggtgcta ctaccatggc cggtggtaaa tgtactcaag 600 ctgctttagc tttggctgaa ttgtgttaca acactttgtt ggaagaaggc gaaaaggcta 660 tgttggctgc tgaacaacac gttgttactc cagctttgga aagagtcatt gaagccaaca 720 cctacttgtc cggtgttgga ttcgaatctg gtggtttagc tgccgctcat gccgtccaca 780 acggtttgac tgccatccca gatgctcacc actactacca cggtgaaaag gttgctttcg 840 gtactttgac tcaattagtc ttggaaaacg ctccagtcga agaaatcgaa accgttgctg 900 ctctatccca cgctgtcggt ttgcctatca ctttggctca attggacatc aaggaagatg 960 tcccagctaa gatgagaatt gttgctgaag ctgcttgtgc tgaaggtgaa accattcaca 1020 acatgccagg tggtgccacc ccagaccaag tctacgctgc tttgttggtt gctgaccaat 1080 acggtcaaag attcttgcaa gaatgggagt aaaggagacc 1120 <210> 55 <211> 1114 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..1114 <223> /organism="Artificial Sequence" /note="Sequence containing the gldA (K. pneumoniae) DNA sequence codon-pair optimized for expression in S. cerevisiae" /mol_type="unassigned DNA" <400> 55 ggtctcgaat gttgaaggtt atccaatctc cagccaaata cttgcaaggt ccagatgctg 60 ctgtcttatt cggtcaatac gccaagaact tggctgaatc tttcttcgtt atcgctgatg 120 actttgtcat gaaattggct ggtgaaaaag ttgttaacgg tctacaatct cacgacatca 180 gatgtcatgc tgaaagattc aacggtgaat gttcccacgc tgaaatcaac cgtttgatgg 240 ctatcttaca aaagcaaggt tgtagaggtg ttgtcggtat cggtggtggt aagactttgg 300 ataccgctaa ggccatcggt tactaccaaa agttgccagt tgttgtcatt ccaaccattg 360 cttccactga cgctccaact tctgccttgt ccgtcatcta cactgaagct ggtgaattcg 420 aagaatactt gatctaccca aagaacccag acatggttgt tatggacacc gccattatcg 480 ccaaggctcc agtcagattg ttggtttccg gtatgggtga tgctttgtct acctggttcg 540 aagccaaggc ttgttacgac gctagagcta cctccatggc cggtggtcaa tctaccgaag 600 ctgctttgtc cttggctaga ttatgttacg acactttatt ggctgaaggc gaaaaggcca 660 gattagctgc tcaagctggt gttgtcactg aagccttgga aagaatcatt gaagctaaca 720 cctacttgtc tggtattggt ttcgaatctt ctggtttggc tgctgctcac gctattcaca 780 acggtttcac catcttggaa gaatgtcacc acttgtacca tggtgaaaag gttgctttcg 840 gtactttggc tcaattagtc ttgcaaaact ctccaatgga cgaaatcgaa accgttttgg 900 gtttctgtca aagagttggt ttgcctgtca ctttggccca aatgggtgtc aaggaaggta 960 ttgatgctaa gattgctgct gttgccaagg ctacctgtgc tgaaggtgaa accattcaca 1020 acatgccatt tgctgtcact ccagaatccg tccacgctgc catcttgact gctgatttgt 1080 tgggtcaaca atggttggct cgataaagga gacc 1114 <210> 56 <211> 1120 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..1120 <223> /organism="Artificial Sequence" /note="Sequence containing the gldA (E. aerogenes) DNA sequence codon-pair optimized for expression in S. cerevisiae" /mol_type="unassigned DNA" <400> 56 ggtctcgaat ggacagaatc atccaatctc caggtaagta catccaaggt gctggtgcca 60 tcaagagatt aggtgaatac ttgaagccat tggctgaaag atggttaatc attggtgaca 120 agttcgtctt gggttttgct gaagaacaat tgagaacctc tttgggtggt gccggtttgg 180 ttgctgaaat tgctccattc ggtggtgaat gttcccaaaa cgaaatcaac agattaagag 240 acattgcttc ttctgctcaa tgtcacgctg tcttgggtat tggtggtggt aagactttgg 300 acaccgctaa ggctttggcc cactacatgc atttgccagt tgttgttgct ccaaccattg 360 cttccaccga tgctccatgt tctgctttgt ctgtcatcta caccgatgac ggtgaattcg 420 aatcctactt gatgttgcct cacaacccaa acatggttgt tgtcgacact caaatcgttg 480 ctgctgcccc agccagattg ttggccgctg gtatcggtga tgctttggcc acctggttcg 540 aagccagagc ttgttcccgt tctggtgcta ccaccatggc tggtggtaaa tgtacccaag 600 ccgctttggc tttggctgaa ttgtgttaca acactttagt cgaagagggt gaaaaagcca 660 tgttagctgc tgaacaacac gttgtcactc cagctttgga acgtgtcatt gaagctaaca 720 cctacttgtc cggtgttgga ttcgaatctg gtggtttggc tgctgctcac gctattcaca 780 acggtttgac tgccatccca gatgctcacc acttctacca tggtgaaaag gttgccttcg 840 gtactttgac tcaattggtt ttggaaaacg ctccagtcga agaaattgaa actgctgctg 900 ctttgtgtca ctccgttggt ttgccaatca ctttggctca attggatatc aagggtgaca 960 tcccagccaa gatgagaact gttgctgaag ctgcttgtgc cgaaggtgaa accattcaca 1020 acatgccagg tggtgcttgt gctgaccaag tctacgctgc tctattagtc gccgaccaat 1080 acggtcaaag attcttgcaa gaatgggagt aaaggagacc 1120 <210> 57 <211> 1111 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..1111 <223> /organism="Artificial Sequence" /note="Sequence containing the gldA (Y. aldovae) DNA sequence codon-pair optimized for expression in S. cerevisiae" /mol_type="unassigned DNA" <400> 57 ggtctcgaat gttgaaggtc atccaatctc catctaagta catccaaggt gccaacgctt 60 tgcaatccat tggtgaattt gccaagttgt tggctaacaa ctacttcatc attgctgatg 120 actttgtcat gaaattgact gctgacaccg ttggtacttc tttgcaaacc tgtgaattga 180 aatctcactt ctccagattc aacggtgaat gttccagaca agaaatcgaa agattgaccg 240 tcgaattgaa gaaatacggt tgtaatggtg tcatcggtat cggtggtggt aagactttgg 300 acaccgctaa ggccattgct cactaccaac acatcccagt tgttgttgtc ccaaccattg 360 cttctaccga tgctccaact tctgctttgt ccgtcatcta cactgaacaa ggtgaattcg 420 ctgaatactt gatctaccca aagaacccag acattgtctt gatggacacc accatcattg 480 ccaaggctcc agtcagattg ttggttgctg gtatgggtga tgctctatcc acctacttcg 540 aagctcaagc ctgtttcgat gccaaggcca tctccatggc tggtggtgct tccactttgg 600 ctgccatcac tttggccaga ttatgttacg aaactttatt ggctgaaggt tacaaggcca 660 agttggctgt tgaagctggt gttgtcactg aagctgtcga acgtattatt gaagctaaca 720 cctacttgtc tggtattggt ttcgaatctt ctggtttggc tgctgctcat gccatccaca 780 acggtttcac cgttttggaa gaatgtcacc acttgtacca tggtgaaaag gttgctttcg 840 gtactttgac tcaattggtt ttgcaaaact cttccatgga agaaattgaa accgtcttgt 900 ctttctgtca acaattaggt ttgccaatca ctttagctga aatgggtgtc actcaagatt 960 tggaatgtaa gatcagagct gttgctcaag cttcttgtgc tgaaggtgaa accattcaca 1020 acatgccatt caaggttacc gctgactctg tttacgccgc tatcatcgtt gctgacagat 1080 taggtcaagc tttcctcaac taaaggagac c 1111 <210> 58 <211> 1111 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..1111 <223> /organism="Artificial Sequence" /note="Sequence containing the DAK1 (S. cerevisiae) DNA sequence codon-pair optimized for expression in S. cerevisiae" /mol_type="unassigned DNA" <400> 58 ggtctcgaat gttgaaggtc atccaatctc catctaagta catccaaggt gccaacgctt 60 tgcaatccat tggtgaattt gccaagttgt tggctaacaa ctacttcatc attgctgatg 120 actttgtcat gaaattgact gctgacaccg ttggtacttc tttgcaaacc tgtgaattga 180 aatctcactt ctccagattc aacggtgaat gttccagaca agaaatcgaa agattgaccg 240 tcgaattgaa gaaatacggt tgtaatggtg tcatcggtat cggtggtggt aagactttgg 300 acaccgctaa ggccattgct cactaccaac acatcccagt tgttgttgtc ccaaccattg 360 cttctaccga tgctccaact tctgctttgt ccgtcatcta cactgaacaa ggtgaattcg 420 ctgaatactt gatctaccca aagaacccag acattgtctt gatggacacc accatcattg 480 ccaaggctcc agtcagattg ttggttgctg gtatgggtga tgctctatcc acctacttcg 540 aagctcaagc ctgtttcgat gccaaggcca tctccatggc tggtggtgct tccactttgg 600 ctgccatcac tttggccaga ttatgttacg aaactttatt ggctgaaggt tacaaggcca 660 agttggctgt tgaagctggt gttgtcactg aagctgtcga acgtattatt gaagctaaca 720 cctacttgtc tggtattggt ttcgaatctt ctggtttggc tgctgctcat gccatccaca 780 acggtttcac cgttttggaa gaatgtcacc acttgtacca tggtgaaaag gttgctttcg 840 gtactttgac tcaattggtt ttgcaaaact cttccatgga agaaattgaa accgtcttgt 900 ctttctgtca acaattaggt ttgccaatca ctttagctga aatgggtgtc actcaagatt 960 tggaatgtaa gatcagagct gttgctcaag cttcttgtgc tgaaggtgaa accattcaca 1020 acatgccatt caaggttacc gctgactctg tttacgccgc tatcatcgtt gctgacagat 1080 taggtcaagc tttcctcaac taaaggagac c 1111 <210> 59 <211> 1771 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..1771 <223> /organism="Artificial Sequence" /note="Sequence containing the dhaK (K. pneumoniae) DNA sequence codon-pair optimized for expression in S. cerevisiae" /mol_type="unassigned DNA" <400> 59 ggtctcgaat gtccgctaaa tctttcgaag ttaccgaccc agtcaactct tctttgaagg 60 gttttgcttt ggccaaccca tccattactt tggtcccaga agaaaagatc ttattcagaa 120 agactgactc tgacaaaatt gctttgatct ccggtggtgg ttccggtcac gaaccaaccc 180 acgctggttt catcggtaag ggtatgttgt ccggtgctgt cgttggtgaa atctttgctt 240 ctccatccac caagcaaatc ttgaatgcta tcagattagt caacgaaaac gcttctggtg 300 tcttgttgat tgtcaagaac tacactggtg acgtcttgca tttcggttta tctgctgaaa 360 gagctagagc tttgggtatt aactgtagag ttgccgtcat cggtgacgat gttgctgtcg 420 gtcgtgaaaa gggtggtatg gttggtagac gtgctttggc tggtactgtc ttggttcaca 480 agattgttgg tgctttcgct gaagaatact cctccaagta cggtttagat ggtactgcta 540 aggttgccaa gatcatcaac gacaacttgg ttaccatcgg ttcttctttg gaccactgta 600 aggttccagg tagaaagttc gaatctgaat tgaacgaaaa gcaaatggaa ttgggtatgg 660 gtatccacaa cgaaccaggt gttaaggtct tggacccaat tccatccact gaagatttga 720 tttccaaata catgttgcca aagttgctag acccaaacga caaggacaga gctttcgtta 780 agttcgatga agatgacgaa gttgttttgt tggtcaacaa cttgggtggt gtttctaact 840 tcgtcatctc ttctattacc tccaagacca ccgatttctt aaaggaaaac tacaacatca 900 ctccagtcca aaccattgcc ggtactttga tgacctcttt caacggtaac ggtttctcca 960 tcaccttgtt gaatgccacc aaagctacca aggctttgca atctgatttc gaagaaatca 1020 aatccgtctt agatttgttg aacgccttca ccaacgcccc aggttggcca attgctgact 1080 tcgaaaagac ctctgctcca tctgttaacg atgacttgtt gcacaacgaa gttactgcca 1140 aggccgtcgg tacttacgat ttcgacaaat tcgctgaatg gatgaagtct ggtgctgaac 1200 aagtcatcaa atctgaacca cacatcactg aattggacaa ccaagttggt gatggtgact 1260 gtggttacac tttggttgct ggtgtcaagg gtatcactga aaacttggac aaattgtcca 1320 aggactcttt gtctcaagct gttgctcaaa tttctgattt cattgaaggt tccatgggtg 1380 gtacttctgg tggtttgtac tccatcttgt tgtctggttt ctcccacggt ttgatccaag 1440 tttgtaagtc caaggatgaa cctgtcacca aggaaattgt tgccaagtct ctaggtattg 1500 ctttggacac tttatacaag tacaccaagg ccagaaaggg ttcttccacc atgatcgatg 1560 ctttggaacc atttgtcaag gaattcactg cttctaagga cttcaacaag gctgttaagg 1620 ctgctgaaga aggtgccaag tccactgcta ctttcgaagc taagttcggt agagcttctt 1680 acgttggtga ctcttctcaa gttgaagatc caggtgctgt tggtttatgt gaattcttga 1740 agggtgtcca atctgcgctt taaaggagac c 1771 <210> 60 <211> 1735 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..1735 <223> /organism="Artificial Sequence" /note="Sequence containing the DAK1 (Y. lipolytica) DNA sequence codon-pair optimized for expression in S. cerevisiae" /mol_type="unassigned DNA" <400> 60 ggtctcgaat gactaccaag caattccaat tcgactctga cccattgaac tctgctttgg 60 ccgctactgc tgaagcttct ggtttagctt acttgccaaa gtccaaggtc atctactacc 120 cattgactaa cgacaaggtt actttgatct ccggtggtgg tgctggtcac gaaccagctc 180 aaactggttt cgttggtcct ggtttgttgg atgctgccgt ttccggtcaa atcttcgctt 240 ccccatccac caagcaaatc atcgctggtg tcaatgctgt caaatctcaa agaggttcca 300 ttatcatcgt catgaactac actggtgatg tcattcactt cggtatggct gctgaacaat 360 taagatccag atacgactac catgctgaat tggtttccat cggtgatgac atttctgtca 420 acaagaaggc tggtagaaga ggtctagctg gtactgtttt ggttcacaag attgccggtc 480 acttggctcg tgacggttgg gatgtcggtg ttttggccga agctttgaga accactgctg 540 ctaacttggc cactgttgct gcttccttgg aacactgtac cgtcccaggt agaaagttcg 600 aaactgaatt ggccgctgac gaaatggaaa tcggtatggg tattcacaat gaaccaggtg 660 tcaaaaccat caagatcggt aaggttgaat ctttattgga cgaattagtc gacaaatttg 720 aaccttctaa gcaagatttc gttccattca acaaaggtga cgaagttgtc ttgttggtca 780 actctttggg tggtgtttct tctttggaat tgcatgccat tgctaacatt gcccaaacca 840 aattcgaaaa ggttttgggt gtcaagaccg tcagattgat tgttggtaac ttcatggctg 900 ctttcaacgg tccaggtttc tctttgacct tgttgaacgt taccactacc gctaagaagg 960 gtaactttga cgtcttgggt gccttggatg ccccagtttc caccgctgct tggccatctt 1020 tgcaacaaaa ggataaacca gctaacggtg gtgttcaaga agaaaaggaa actgactctg 1080 acaagccagc tgaaccaacc ggtatcaagg ctgatggtaa attattcaag gctatgattg 1140 aatctgctgt cgatgacttg aagaaggaag aaccacaaat caccaagtac gacactattg 1200 ctggtgacgg tgactgtggt gaaactctat tagctggtgg tgatggtatc ttggatgcta 1260 tcaagaacaa gaagatcgac ttggacgatg ctgctggtgt tgctgatatc tctcacattg 1320 ttgaaaactc tatgggtggt acttctggtg gtttatactc catcttcttc tctggtttgg 1380 ttgttggtat taaggaaacc aaggccaagg aattgtccgt cgacgtcttt gccaaggcct 1440 gtgaaactgc cttggaaact ttatccaagt acacccaagc tcgtgtcggt gacagaacct 1500 tgatggatgc tttggttcca ttcgttgaaa ctttgtctaa gaccaaggat ttcgctaagg 1560 ctgtcgaagc tgctagaaag ggtgccgacg aaacctccaa attgccagcc aacttcggta 1620 gagcttctta cgttaacgaa gaaggtttgg aaaacattcc agacccaggt gctttgggtt 1680 tggccgttat cttcgaaggt ttattgaagg cttgggaaaa gaaataaagg agacc 1735 <210> 61 <211> 1759 <212> DNA <213> Artificial Sequence <220> <221> source <222> 1..1759 <223> /organism="Artificial Sequence" /note="Sequence containing the DAK1 (S. pombe) DNA sequence codon-pair optimized for expression in S. cerevisiae" /mol_type="unassigned DNA" <400> 61 ggtctcgaat ggacaagcac ttcatcaacg acccagaagt cttagtcttg gacggtttga 60 aatctttggc tgacatgaac aagactttga ccgtccacga agaaggtaag ttcatctact 120 tccacgacta caacaagaag aacgtttccg ttatctccgg tggtggtgct ggtcatgaac 180 caactcactc ttctttcgtc ggtaagggta tgttgactgc tgctgtttcc ggttccatct 240 ttgcctctcc atcttccaag caaatctaca ccggtatcaa gcaagtcgaa tctgaagctg 300 gtactttggt tatctgtaag aactacactg gtgatatctt gcacttcggt atggctttgg 360 aaaagcaaag aactgctggt aagaaggctg aattgattgc cgttgctgac gatgtctctg 420 tcggtagaaa gaagtctggt aaggttggta gaagaggttt atctggtact gtcttggttc 480 acaagattgc tggtgctgct gctgcccgtg gtttgccatt agaagctgtc accaccattg 540 ccaaggctgc cattgacaac ttagtctcta tcggtgcttc cttggctcat gttcacgttc 600 caggtcacga accaattgct aaggaagatg aaatgaagca cgatgaaatg gaattgggta 660 tgggtatcca caacgaacct ggttgtaaga gaatctctcc aatcccatcc attgatgact 720 tgattgctca aatgttgaaa caaatgttgg accaatctga caaggatcgt gcttacgtca 780 aaatcgaagg tgacgacgaa gttgtcttgt tgatgaacaa cttgggtggt ctatccatgt 840 tggaattctc tgccatttct cacaaggtca aggaagcttt agctaaggaa tacaagatta 900 accctgttag aatcttcgct ggtccattca ccacctcttt gaatggtcta ggtttcggta 960 tcactttgtt gagaaccact gacagagtca aggttgaagg tgaagaatac tctttggttg 1020 atttgattga ccaaccagtt gaagctattg gttggccatt gtgtcaacca tctgatttga 1080 aatccaagaa caagattggt aacgtttcca ttgaagaagg tcaaaaggac gttaaatctc 1140 cagttaccgt tgacaaggaa aaggttcgtc aagctatcgt caactccatg gaaaacttaa 1200 tcaaggctga accaaagatc accaaattcg acaccatggc tggtgatggt gactgtggta 1260 ctaccttgaa gagaggtgct gaaggtgtct tgaaattcgt caaatctgat aaattctctg 1320 atgacccaat cagaatcgtt agagatatcg ctgatgttat tgaagataac atggacggta 1380 cttctggtgc tttgtacgcc atcttcttcc acggtttcgc caagggtatg aaggacacct 1440 tggaaaagtc caaagatatc tcctccaaga cctgggctgc tggtttgaag gttgctttgg 1500 acactttatt caaatacact ccagccagac caggtgactc taccatgtgt gacgctttgg 1560 ttccattcgt tgaaactttt gtcaagacca acgacttgaa cgctgccgtc gaagaagcta 1620 gaaagggtgc tgatgctact gctgacatgc aagccaagtt gggtagagct gtctacgtcg 1680 gtgatgacgt caaggttcca gatgctggtg ccttgggtgt tgttgccatt gtcgaaggtt 1740 ttacgaagta aaggagacc 1759

Claims

a) NAD⁺-의존적 아세틸화 아세트알데하이드 데하이드로게나제(E.C. 1.2.1.10)를 암호화하는 하나 이상의 뉴클레오타이드 서열;
b) 아세틸-CoA 신세타제(E.C. 6.2.1.1)를 암호화하는 하나 이상의 뉴클레오타이드 서열;
c) 글리세롤 데하이드로게나제(E.C. 1.1.1.6)를 암호화하는 하나 이상의 뉴클레오타이드 서열; 및
d) 다이하이드록시아세톤 키나제(E.C. 2.7.1.28 또는 E.C. 2.7.1.29)를 암호화하는 하나 이상의 뉴클레오타이드 서열
을 포함하는, 유전적으로 변형된 세포.
제1항에 있어서,
글리세롤 3-포스페이트 포스포하이드롤라제를 암호화하고/하거나 글리세롤 3-포스페이트 데하이드로게나제 유전자를 암호화하는 하나 이상의 내생성 뉴클레오타이드 서열의 결실 또는 파괴를 포함하는 세포.
제2항에 있어서,
c)가 서열번호 7, 또는 서열번호 7과 60% 이상의 서열 동일성을 가진 서열번호 7의 기능성 상동체로 표시되는 이종 글리세롤 데하이드로게나제(E.C. 1.1.1.6)를 암호화하는 하나 이상의 뉴클레오타이드 서열; 및/또는 서열번호 9, 또는 서열번호 9와 60% 이상의 서열 동일성을 가진 서열번호 9의 기능성 상동체로 표시되는 이종 글리세롤 데하이드로게나제(E.C. 1.1.1.6)를 암호화하는 하나 이상의 뉴클레오타이드 서열인, 세포.
제3항에 있어서,
c)가 서열번호 7, 또는 서열번호 7과 60% 이상의 서열 동일성을 가진 서열번호 7의 기능성 상동체로 표시되는 이종 글리세롤 데하이드로게나제(E.C. 1.1.1.6)를 암호화하는 하나 이상의 뉴클레오타이드 서열인, 세포.
제1항 내지 제4항 중 어느 한 항에 있어서,
d)가 서열번호 11, 또는 서열번호 11과 40% 이상의 서열 동일성을 가진 서열번호 11의 기능성 상동체로 표시되는 다이하이드록시아세톤 키나제(E.C. 2.7.1.28 또는 E.C. 2.7.1.29)를 암호화하는 하나 이상의 이종 뉴클레오타이드 서열; 및/또는 서열번호 13, 또는 서열번호 13과 40% 이상의 서열 동일성을 가진 서열번호 13의 기능성 상동체로 표시되는 다이하이드록시아세톤 키나제(E.C. 2.7.1.28 또는 E.C. 2.7.1.29)를 암호화하는 하나 이상의 뉴클레오타이드 서열인, 세포.
제5항에 있어서,
d)가 서열번호 13, 또는 서열번호 13과 40% 이상의 서열 동일성을 가진 서열번호 13의 기능성 상동체로 표시되는 다이하이드록시아세톤 키나제(E.C. 2.7.1.28 또는 E.C. 2.7.1.29)를 암호화하는 하나 이상의 뉴클레오타이드 서열인, 세포.
제1항 내지 제6항 중 어느 한 항에 있어서,
a)가 서열번호 1, 또는 서열번호 1과 60% 이상의 서열 동일성을 가진 서열번호 1의 기능성 상동체로 표시되는 이종 NAD⁺-의존적 아세틸화 아세트알데하이드 데하이드로게나제를 암호화하는 하나 이상의 뉴클레오타이드 서열; 서열번호 2, 또는 서열번호 2와 60% 이상의 서열 동일성을 가진 서열번호 2의 기능성 상동체로 표시되는 이종 NAD⁺-의존적 아세틸화 아세트알데하이드 데하이드로게나제를 암호화하는 하나 이상의 뉴클레오타이드 서열; 및/또는 서열번호 3, 또는 서열번호 3과 60% 이상의 서열 동일성을 가진 서열번호 3의 기능성 상동체로 표시되는 이종 NAD⁺-의존적 아세틸화 아세트알데하이드 데하이드로게나제를 암호화하는 하나 이상의 뉴클레오타이드 서열인, 세포.
제7항에 있어서,
a)가 서열번호 1, 또는 서열번호 1과 60% 이상의 서열 동일성을 가진 서열번호 1의 기능성 상동체로 표시되는 이종 NAD⁺-의존적 아세틸화 아세트알데하이드 데하이드로게나제를 암호화하는 하나 이상의 뉴클레오타이드 서열; 및/또는 서열번호 2, 또는 서열번호 2와 60% 이상의 서열 동일성을 가진 서열번호 2의 기능성 상동체로 표시되는 이종 NAD⁺-의존적 아세틸화 아세트알데하이드 데하이드로게나제를 암호화하는 하나 이상의 뉴클레오타이드 서열인, 세포.
제8항에 있어서,
a)가 서열번호 2, 또는 서열번호 2와 60% 이상의 서열 동일성을 가진 서열번호 2의 기능성 상동체로 표시되는 이종 NAD⁺-의존적 아세틸화 아세트알데하이드 데하이드로게나제를 암호화하는 하나 이상의 뉴클레오타이드 서열인, 세포.
제1항 내지 제9항 중 어느 한 항에 있어서,
b)가 서열번호 6, 또는 서열번호 6과 60% 이상의 서열 동일성을 가진 서열번호 6의 기능성 상동체로 표시되는 동종 또는 이종 아세틸-CoA 신세타제(E.C. 6.2.1.1)를 암호화하는 하나 이상의 뉴클레오타이드 서열인, 세포.
제1항 내지 제10항 중 어느 한 항에 있어서,
a)가 서열번호 3, 또는 서열번호 3과 60% 이상의 서열 동일성을 가진 서열번호 3의 기능성 상동체로 표시되는 NAD⁺-의존적 아세틸화 아세트알데하이드 데하이드로게나제를 암호화하는 하나 이상의 뉴클레오타이드 서열이고;
b)가 서열번호 6, 또는 서열번호 6과 60% 이상의 서열 동일성을 가진 서열번호 6의 기능성 상동체로 표시되는 동종 또는 이종 아세틸-CoA 신세타제(E.C. 6.2.1.1)를 암호화하는 하나 이상의 뉴클레오타이드 서열이고;
c)가 서열번호 7, 또는 서열번호 7과 60% 이상의 서열 동일성을 가진 서열번호 7의 기능성 상동체로 표시되는 글리세롤 데하이드로게나제(E.C. 1.1.1.6)를 암호화하는 하나 이상의 뉴클레오타이드 서열이고;
d)가 서열번호 11, 또는 서열번호 11과 40% 이상의 서열 동일성을 가진 서열번호 11의 기능성 상동체로 표시되는 동종 또는 이종 다이하이드록시아세톤 키나제(E.C. 2.7.1.28 또는 E.C. 2.7.1.29)를 암호화하는 하나 이상의 뉴클레오타이드 서열인, 세포.
제1항 내지 제10항 중 어느 한 항에 있어서,
a)가 서열번호 2, 또는 서열번호 2와 60% 이상의 서열 동일성을 가진 서열번호 2의 기능성 상동체로 표시되는 NAD⁺-의존적 아세틸화 아세트알데하이드 데하이드로게나제를 암호화하는 하나 이상의 뉴클레오타이드 서열이고;
b)가 서열번호 6, 또는 서열번호 6과 60% 이상의 서열 동일성을 가진 서열번호 6의 기능성 상동체로 표시되는 동종 또는 이종 아세틸-CoA 신세타제(E.C. 6.2.1.1)를 암호화하는 하나 이상의 뉴클레오타이드 서열이고;
c)가 서열번호 9, 또는 서열번호 9와 60% 이상의 서열 동일성을 가진 서열번호 9의 기능성 상동체로 표시되는 글리세롤 데하이드로게나제(E.C. 1.1.1.6)를 암호화하는 하나 이상의 뉴클레오타이드 서열이고;
d)가 서열번호 11, 또는 서열번호 11과 40% 이상의 서열 동일성을 가진 서열번호 11의 기능성 상동체로 표시되는 동종 또는 이종 다이하이드록시아세톤 키나제(E.C. 2.7.1.28 또는 E.C. 2.7.1.29)를 암호화하는 하나 이상의 뉴클레오타이드 서열인, 세포.
제1항 내지 제10항 중 어느 한 항에 있어서,
a)가 서열번호 2, 또는 서열번호 2와 60% 이상의 서열 동일성을 가진 서열번호 2의 기능성 상동체로 표시되는 NAD⁺-의존적 아세틸화 아세트알데하이드 데하이드로게나제를 암호화하는 하나 이상의 이종 뉴클레오타이드 서열이고;
b)가 서열번호 6, 또는 서열번호 6과 60% 이상의 서열 동일성을 가진 서열번호 6의 기능성 상동체로 표시되는 동종 또는 이종 아세틸-CoA 신세타제(E.C. 6.2.1.1)를 암호화하는 하나 이상의 뉴클레오타이드 서열이고;
c)가 서열번호 7, 또는 서열번호 7과 60% 이상의 서열 동일성을 가진 서열번호 7의 기능성 상동체로 표시되는 글리세롤 데하이드로게나제(E.C. 1.1.1.6)를 암호화하는 하나 이상의 뉴클레오타이드 서열이고;
d)가 서열번호 13, 또는 서열번호 13과 40% 이상의 서열 동일성을 가진 서열번호 13의 기능성 상동체로 표시되는 동종 또는 이종 다이하이드록시아세톤 키나제(E.C. 2.7.1.28 또는 E.C. 2.7.1.29)를 암호화하는 하나 이상의 뉴클레오타이드 서열인, 세포.
제1항 내지 제10항 중 어느 한 항에 있어서,
a)가 서열번호 1, 또는 서열번호 1과 60% 이상의 서열 동일성을 가진 서열번호 1의 기능성 상동체로 표시되는 NAD⁺-의존적 아세틸화 아세트알데하이드 데하이드로게나제를 암호화하는 하나 이상의 뉴클레오타이드 서열이고;
b)가 서열번호 6, 또는 서열번호 6과 60% 이상의 서열 동일성을 가진 서열번호 6의 기능성 상동체로 표시되는 동종 또는 이종 아세틸-CoA 신세타제(E.C. 6.2.1.1)를 암호화하는 하나 이상의 뉴클레오타이드 서열이고;
c)가 서열번호 7, 또는 서열번호 7과 60% 이상의 서열 동일성을 가진 서열번호 7의 기능성 상동체로 표시되는 글리세롤 데하이드로게나제(E.C. 1.1.1.6)를 암호화하는 하나 이상의 이종 뉴클레오타이드 서열이고;
d)가 서열번호 13, 또는 서열번호 13과 40% 이상의 서열 동일성을 가진 서열번호 13의 기능성 상동체로 표시되는 동종 또는 이종 다이하이드록시아세톤 키나제(E.C. 2.7.1.28 또는 E.C. 2.7.1.29)를 암호화하는 하나 이상의 뉴클레오타이드 서열인, 세포.
제1항 내지 제14항 중 어느 한 항에 있어서,
효모 세포인 세포.
제15항에 있어서,
효모 세포에서 글리세롤 3-포스페이트 포스포하이드롤라제를 암호화하는 모든 내생성 뉴클레오타이드 서열 및 글리세롤 3-포스페이트 데하이드로게나제를 암호화하는 모든 내생성 뉴클레오타이드 서열이 결실되어 있는, 세포.
제16항에 있어서,
효모 세포가 NADH-의존적 글리세롤 3-포스페이트 데하이드로게나제를 암호화하는 유전자를 갖지 않는, 세포.
제15항 내지 제17항 중 어느 한 항에 있어서,
사카로마이세타세애(Saccharomycetaceae)로 구성된 목록, 특히 사카로마이세스(Saccharomyces), 예컨대, 사카로마이세스 세레비지애(Saccharomyces cerevisiae); 클루이베로마이세스(Kluyveromyces), 예컨대, 클루이베로마이세스 마르시아누스(Kluyveromyces marxianus), 피키아(Pichia), 예컨대, 피키아 스티피티스(Pichia stipitis) 또는 피키아 안구스타(Pichia angusta); 자이고사카로마이세스(Zygosaccharomyces), 예컨대, 자이고사카로마이세스 바일리이(Zygosaccharomyces bailii); 브레타노마이세스(Brettanomyces), 예컨대, 브레타노마이세스 인터메디우스(Brettanomyces intermedius); 이사첸키아(Issatchenkia), 예컨대, 이사첸키아 오리엔탈리스(Issatchenkia orientalis); 및 한세눌라(Hansenula)로 구성된 군으로부터 선택된 효모 세포.
제1항 내지 제14항 중 어느 한 항에 있어서,
원핵세포인 세포.
제19항에 있어서,
클로스트리듐(Clostridium), 자이모모나스(Zymomonas), 써모박터(Thermobacter), 에스케리키아(Escherichia), 락토바실러스(Lactobacillus), 게오바실러스(Geobacillus) 및 바실러스(Bacillus)로 구성된 목록으로부터 선택된 세포.
서열번호 1 내지 서열번호 14 중 임의의 서열번호로 표시된 폴리펩타이드를 암호화하는 폴리뉴클레오타이드.
제21항의 폴리뉴클레오타이드를 하나 이상 포함하는 핵산 구축물.
제22항의 핵산 구축물로 형질전환된 숙주 세포.
에탄올의 제조를 위한 제1항 내지 제20항 및 제24항 중 어느 한 항에 따른 세포의 용도.
제18항 내지 제20항 중 어느 한 항에 따른 효모 세포를 사용하여 혐기성 조건 하에서 아세테이트 및 발효가능한 탄수화물, 특히 글루코스, 프럭토스, 수크로스, 말토스, 자일로스, 아라비노스, 갈락토스 및 만노스로 구성된 군으로부터 선택된 탄수화물로부터 발효 생성물을 제조하는 단계를 포함하는, 발효 생성물의 제조 방법.
제25항에 있어서,
0.7 이하, 특히 0.004 이상 내지 0.5, 보다 특히 0.05 내지 0.3의 몰비로 아세테이트 및 탄수화물을 포함하는 발효 배지에서 수행하는, 제조 방법.
제25항 또는 제26항에 있어서,
리그노셀룰로스, 셀룰로스, 헤미셀룰로스 및 펙틴으로 구성된 군으로부터 선택된 폴리사카라이드의 가수분해에 의해 탄수화물의 적어도 일부 및 아세테이트의 적어도 일부를 수득하는, 제조 방법.
제27항에 있어서,
리그노셀룰로스가, 가수분해되어 발효가능한 탄수화물 및 아세테이트를 제공하는 리그노셀룰로스성 바이오매스인, 제조 방법.
제28항에 있어서,
리그노셀룰로스성 또는 헤미셀룰로스성 물질을 효소 조성물과 접촉하고, 이때 하나 이상의 당이 생성되고, 생성된 당이 발효되어 발효 생성물을 제공하고, 제1항 내지 제18항 중 어느 한 항에 따른 형질전환된 숙주 세포를 사용하여 발효를 수행하는, 제조 방법.
제29항에 있어서,
발효 생성물이 에탄올, 부탄올, 락트산, 플라스틱, 유기산, 용매, 동물 사료 보충제, 약제, 비타민, 아미노산, 효소 및 화학적 공급원료 중 하나 이상인, 제조 방법.