KR20110011675A - 4 탄소 알코올의 생산을 위해 개선된 효모 균주 - Google Patents
4 탄소 알코올의 생산을 위해 개선된 효모 균주 Download PDFInfo
- Publication number
- KR20110011675A KR20110011675A KR1020107027769A KR20107027769A KR20110011675A KR 20110011675 A KR20110011675 A KR 20110011675A KR 1020107027769 A KR1020107027769 A KR 1020107027769A KR 20107027769 A KR20107027769 A KR 20107027769A KR 20110011675 A KR20110011675 A KR 20110011675A
- Authority
- KR
- South Korea
- Prior art keywords
- leu
- ala
- val
- gly
- ile
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/02—Preparation of oxygen-containing organic compounds containing a hydroxy group
- C12P7/04—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
- C12P7/16—Butanols
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
- C12N1/14—Fungi; Culture media therefor
- C12N1/16—Yeasts; Culture media therefor
- C12N1/18—Baker's yeast; Brewer's yeast
- C12N1/185—Saccharomyces isolates
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12R—INDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
- C12R2001/00—Microorganisms ; Processes using microorganisms
- C12R2001/645—Fungi ; Processes using fungi
- C12R2001/85—Saccharomyces
- C12R2001/865—Saccharomyces cerevisiae
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E50/00—Technologies for the production of fuel of non-fossil origin
- Y02E50/10—Biofuels, e.g. bio-diesel
Abstract
아미노산 기아에 대한 일반 제어 반응이 감소된 효모 세포는 성장 배지 내의 부탄올에 대해 증가된 내성을 가진다는 것을 발견하였다. 반응에 관련된 유전자인 GCN 유전자를 유전적으로 개질하여 암호화된 단백질의 활성을 제거함으로써 반응의 감소를 조작하였다. 조작된 부탄올 생합성 경로 및 아미노산 기아에 대한 일반 제어 반응에 관련된 유전자의 유전적 개질을 가지며 부탄올 내성이 증가된 효모 균주는 부탄올의 생산에 있어서 유용하다.
Description
본 출원은 2008년 5월 12일자 출원되어 현재 계류중인 미국 출원 제61/052286호 및 제61/052289호에 대한 우선권을 주장한다.
본 발명은 미생물학 및 유전공학 분야에 관한 것이다. 더욱 구체적으로, 부탄올에 대한 반응에 관련된 효모 유전자를 동정하였다. 동정된 유전자의 발현이 감소된 효모 균주에서는 부탄올 존재하의 성장 수율(growth yield)이 개선되는 것을 발견하였다.
부탄올은 연료 첨가제, 플라스틱 산업에서의 공급 원료 화학물질, 및 식품 및 향미료 산업에서의 식용 등급 추출제로서 유용한 산업용 화학물질이다. 매년 4.5 내지 5.4 테라그램(100 내지 120억 파운드)의 부탄올이 석유화학적 수단에 의해 생산되며 이 범용 화학물질의 수요는 증가할 것으로 보인다.
부탄올의 화학적 합성 방법이 공지되어 있으나, 이들 공정은 석유화학물질 유래의 출발 물질을 사용하며, 일반적으로 비용이 많이 들고, 환경친화적이지 못하다. 발효에 의해 부탄올을 생산하는 방법 또한 공지되어 있으며, 그 중에 가장 많이 쓰이는 공정은 ABE 공정이라고 지칭되는 것으로서 아세톤, 1-부탄올 및 에탄올의 혼합물을 생산한다(Blaschek et al., 미국 특허 제6,358,717호). 클로스트리디움 아세토부틸리쿰(Clostridium acetobutylicum)에 의한 아세톤-부탄올-에탄올(ABE) 발효는 가장 오래된 공지의 산업적 발효 중의 하나이며, 이들 용매의 생산을 담당하는 경로 및 유전자가 보고되어 있다(Girbal et al., Trends in Biotechnology 16:11-16 (1998)). 효모 발효의 부산물로서 아이소부탄올이 생물학적으로 생성된다. 이 그룹의 진균에 의한 불완전한 아미노산 대사작용의 결과로서 형성되는 것은 "퓨젤유(fusel oil)" 성분이다. 아이소부탄올은 L-발린의 이화작용으로부터 특이적으로 생성된다. L-발린의 아민 그룹이 질소 공급원으로서 수거된 후에, 생성된 a-케토산은 소위 에를리히 경로(Ehrlich pathway)의 효소들에 의해 탈탄산화되고 환원되어 아이소부탄올이 된다(Dickinson et al., J. Biol. Chem. 273(40):25752-25756 (1998)). 음료 발효 과정에서 얻어지는 퓨젤유 및/또는 그의 성분의 수율은 통상적으로 낮다.
또한, 1-부탄올 생합성 경로(Donaldson et al., 동시계류중이며 공유인 미국 특허출원공개 제20080182308호), 2-부탄올 생합성 경로(Donaldson et al., 동시계류중이며 공유인 미국 특허출원공개 제US 20070259410A1호 및 제US 2007-0292927호) 및 아이소부탄올 생합성 경로(Maggio-Hall et al., 동시계류중이며 공유인 미국 특허출원공개 제US 20070092957)를 발현하는 재조합 미생물 생산 숙주가 기술된 바 있다.
부탄올 생산을 위한 발효에 사용되는 숙주 미생물에 대한 부탄올 독성으로 인해 부탄올의 생물학적 생산이 제한되는 것으로 생각되고 있다. 화학적 돌연변이 유발(Jain et al. 미국 특허 제5,192,673호; 및 Blaschek et al. 미국 특허 제6,358,717호), 스트레스 반응 단백질을 발현시키는 것과 같은 특정 부류의 유전자의 과발현(Papoutsakis et al. 미국 특허 제6,960,465호; 및 Tomas et al., Appl. Environ. Microbiol. 69(8):4951-4965 (2003)), 및 연쇄적 강화(serial enrichment)(Quratulain et al., Folia Microbiologica (Prague) 40(5):467-471 (1995); 및 Soucaille et al., Current Microbiology 14(5):295-299 (1987))에 의해 1-부탄올에 대한 내성을 가진 클로스트리디움 균주가 분리되었다. 락토코커스 락티스(Lactococcus lactis) 및 락토바실러스 파라카세이(Lactobacillus paracasei)에서 2 개의 스트레스 반응성 단백질 GroESL을 과발현시키면 0.5% 부피/부피(v/v)[0.4% 중량/부피(w/v)] 1-부탄올의 존재하에 성장할 수 있는 균주가 생성된다는 것이 문헌( Desmond et al., Appl. Environ. Microbiol. 70(10):5929-5936 (2004))에 보고되었다. 또한, 하구 퇴적물(estuary sediment)(Sardessai et al., Current Science 82(6):622-623 (2002)) 및 활성 슬러지(activated sludge)(Bieszkiewicz et al., Acta Microbiologica Polonica 36(3):259-265 (1987))로부터 분리된 1-부탄올 내성 균주가 문헌에 기술된 바 있다. 미생물 컨소시엄(microbial consortia)(동시계류중이며 공유인 미국 특허공개 제20070259411호, 제20080124774호 및 제20080138870호)으로부터, 또는 돌연변이체 스크리닝(동시계류중이며 공유인 미국 특허출원 제12/330530호, 제12/330531호 및 제12/330534호)에 의해 부탄올 내성 박테리아 균주가 분리되었다.
부탄올에 대해 더욱 강한 내성을 지닌 부탄올 생산 효모 균주와 더불어, 이들 화학물질에 더욱 강한 내성을 지니며 부탄올을 생산하도록 조작된 효모 숙주 균주를 사용하여 부탄올을 생산하는 방법이 여전히 필요하다.
본 발명은, 부탄올을 생산하며 아미노산 기아(amino acid starvation)에 대한 일반 제어 반응(general control response)에 있어서 반응의 감소를 유발하는 유전적 개질을 포함하는 재조합 효모 숙주를 제공한다. 이러한 세포는 유전적 개질을 하지 않은 세포에 비해 부탄올에 대한 내성이 강하다. 아미노산 기아에 대한 일반 제어 반응에 있어서의 반응의 감소는 반응에 영향을 미치는 내인성 유전자의 돌연변이를 통해 달성할 수 있다. 본 발명의 숙주 세포는 자연적으로 부탄올을 생산할 수도 있고, 조작된 경로를 통해 부탄올을 생산하도록 조작될 수도 있다.
따라서 본 발명은 부탄올을 생산하는 재조합 효모 숙주 세포를 제공하며,여기에서 효모 세포는 아미노산 기아에 대한 일반 제어 반응에서 반응을 감소시키는 적어도 하나의 유전적 개질을 포함한다.
한 구현예에서 본 발명의 효모 세포는 Gcn1p, Gcn2p, Gcn3p, Gcn4p, Gcn5p 및 Gcn20p로부터 선택된 단백질을 암호화하는 유전자에 유전적 개질을 포함한다.
다른 구현예에서 효모 세포는 하기의 경로들로 구성된 그룹으로부터 선택된 재조합 생합성 경로를 포함한다:
a) 1-부탄올 생합성 경로;
b) 2-부탄올 생합성 경로; 및
c) 아이소부탄올 생합성 경로.
다른 구현예에서 본 발명은 하기의 단계들을 특징으로 하여 부탄올을 생산하는 방법을 제공한다:
(a) 1) 부탄올을 생산하며
2) 아미노산 기아에 대한 일반 제어 반응에서 반응을 감소시키는 적어도 하나의 유전적 개질을 포함하는
재조합 효모 숙주 세포를 제공하는 단계; 및
(b) 부탄올이 생산되는 조건하에 단계 (a)의 균주를 배양하는 단계.
도면의 간단한 설명 및 서열 설명
본 발명의 다양한 구현예는 하기의 상세한 설명, 도면 및 첨부된 서열 설명으로부터 더욱 완전하게 이해될 수 있으며, 이들은 본 출원의 일부를 형성한다.
<도 1>
도 1은 상이한 농도의 아이소부탄올을 함유하는 YVCM 내에서의 성장에 있어서 8 시간(A) 및 24 시간(B) 시점에서 야생형, 돌연변이체 GCN2 및 돌연변이체 GCN4 균주의 분획 성장 수율(fractional growth yield)을 나타낸다.
<도 2>
도 2는 상이한 농도의 아이소부탄올을 함유하는 YPD 내에서의 성장에 있어서 7 시간(A) 및 23 시간(B) 시점에서 야생형, 돌연변이체 GCN2 및 돌연변이체 GCN4 균주의 분획 성장 수율을 나타낸다.
본 발명은 하기의 상세한 설명 및 첨부된 서열 설명으로부터 더욱 완전하게 이해될 수 있으며, 이들은 본 출원의 일부를 형성한다.
하기의 서열들은 37 C.F.R. 1.821-1.825("뉴클레오티드 서열 및/또는 아미노산 서열 개시를 포함하는 특허출원에 관한 요건 - 서열 규정")을 따르며 세계지적재산권기구(WIPO: World Intellectual Property Organization) 표준 ST.25(1998), 및 EPO 및 PCT의 서열 목록 요건(규정 5.2 및 49.5(a-bis), 및 시행세칙의 섹션 208 및 부칙 C)에 부합한다. 뉴클레오티드 및 아미노산 서열 데이터에 사용된 기호 및 체제는 37 C.F.R. §1.822에 제시된 규정을 준수한다.
[표 1]
[표 2]
[표 3]
[표 4]
서열번호 76은 실시예 2에 기술된 GPD 프로모터의 뉴클레오티드 서열이다.
서열번호 77은 실시예 2에 기술된 CYC1 터미네이터의 뉴클레오티드 서열이다.
서열번호 78은 실시예 2에 기술된 FBA 프로모터의 뉴클레오티드 서열이다.
서열번호 79는 실시예 2에 기술된 ADH1 프로모터의 뉴클레오티드 서열이다.
서열번호 80은 실시예 2에 기술된 ADH1 터미네이터의 뉴클레오티드 서열이다.
서열번호 81은 실시예 2에 기술된 GPM 프로모터의 뉴클레오티드 서열이다.
서열번호 82-137은 본 명세서에 기술된 실시예에서 사용된 올리고뉴클레오티드 클로닝, 스크리닝 또는 서열분석 프라이머의 뉴클레오티드 서열이다.
서열번호 138은 "URA3 반복" 단편의 뉴클레오티드 서열이다.
서열번호 139 및 140은 gcn2 결실에 대한 DNA 단편을 증폭하기 위해 사용된 PCR 프라이머의 뉴클레오티드 서열이다.
서열번호 141 및 142는 gcn4 결실에 대한 DNA 단편을 증폭하기 위해 사용된 PCR 프라이머의 뉴클레오티드 서열이다.
서열번호 143 및 144는 "URA3 반복" 단편에서 URA3+ : 양 옆의 직접 반복에 경계를 이루는 프라이머 결합 서열이다.
서열번호 145 및 146은 "URA3 반복" 단편에서 프로모터 및 코딩 서열의 양 옆에 있는 직접 반복 서열이다.
서열번호 147은 "URA3 반복" 단편의 프로모터 서열이다.
서열번호 148은 "URA3 반복" 단편의 URA3 코딩 서열이다.
본 발명의 다양한 구현예는 하기의 상세한 설명, 도면 및 첨부된 서열 설명으로부터 더욱 완전하게 이해될 수 있으며, 이들은 본 출원의 일부를 형성한다.
<도 1>
도 1은 상이한 농도의 아이소부탄올을 함유하는 YVCM 내에서의 성장에 있어서 8 시간(A) 및 24 시간(B) 시점에서 야생형, 돌연변이체 GCN2 및 돌연변이체 GCN4 균주의 분획 성장 수율(fractional growth yield)을 나타낸다.
<도 2>
도 2는 상이한 농도의 아이소부탄올을 함유하는 YPD 내에서의 성장에 있어서 7 시간(A) 및 23 시간(B) 시점에서 야생형, 돌연변이체 GCN2 및 돌연변이체 GCN4 균주의 분획 성장 수율을 나타낸다.
본 발명은 하기의 상세한 설명 및 첨부된 서열 설명으로부터 더욱 완전하게 이해될 수 있으며, 이들은 본 출원의 일부를 형성한다.
하기의 서열들은 37 C.F.R. 1.821-1.825("뉴클레오티드 서열 및/또는 아미노산 서열 개시를 포함하는 특허출원에 관한 요건 - 서열 규정")을 따르며 세계지적재산권기구(WIPO: World Intellectual Property Organization) 표준 ST.25(1998), 및 EPO 및 PCT의 서열 목록 요건(규정 5.2 및 49.5(a-bis), 및 시행세칙의 섹션 208 및 부칙 C)에 부합한다. 뉴클레오티드 및 아미노산 서열 데이터에 사용된 기호 및 체제는 37 C.F.R. §1.822에 제시된 규정을 준수한다.
[표 1]
[표 2]
[표 3]
[표 4]
서열번호 76은 실시예 2에 기술된 GPD 프로모터의 뉴클레오티드 서열이다.
서열번호 77은 실시예 2에 기술된 CYC1 터미네이터의 뉴클레오티드 서열이다.
서열번호 78은 실시예 2에 기술된 FBA 프로모터의 뉴클레오티드 서열이다.
서열번호 79는 실시예 2에 기술된 ADH1 프로모터의 뉴클레오티드 서열이다.
서열번호 80은 실시예 2에 기술된 ADH1 터미네이터의 뉴클레오티드 서열이다.
서열번호 81은 실시예 2에 기술된 GPM 프로모터의 뉴클레오티드 서열이다.
서열번호 82-137은 본 명세서에 기술된 실시예에서 사용된 올리고뉴클레오티드 클로닝, 스크리닝 또는 서열분석 프라이머의 뉴클레오티드 서열이다.
서열번호 138은 "URA3 반복" 단편의 뉴클레오티드 서열이다.
서열번호 139 및 140은 gcn2 결실에 대한 DNA 단편을 증폭하기 위해 사용된 PCR 프라이머의 뉴클레오티드 서열이다.
서열번호 141 및 142는 gcn4 결실에 대한 DNA 단편을 증폭하기 위해 사용된 PCR 프라이머의 뉴클레오티드 서열이다.
서열번호 143 및 144는 "URA3 반복" 단편에서 URA3+ : 양 옆의 직접 반복에 경계를 이루는 프라이머 결합 서열이다.
서열번호 145 및 146은 "URA3 반복" 단편에서 프로모터 및 코딩 서열의 양 옆에 있는 직접 반복 서열이다.
서열번호 147은 "URA3 반복" 단편의 프로모터 서열이다.
서열번호 148은 "URA3 반복" 단편의 URA3 코딩 서열이다.
본 발명은, 부탄올을 생산하며 아미노산 기아에 대한 일반 제어 반응에서 반응의 감소를 유발하는 유전적 개질을 포함하는 재조합 효모 숙주를 제공한다. 이러한 세포는 유전적 개질을 하지 않은 세포에 비해 부탄올에 대한 내성이 강하다. 본 발명의 내성 효모 균주는 아미노산 기아에 대한 일반 제어 반응의 감소를 유발하는 적어도 하나의 유전적 개질을 가진다. 반응에 영향을 미치는 내인성 유전자의 돌연변이를 통해 상기의 반응 감소를 달성할 수 있다.
본 발명의 숙주 세포는 천연적으로 부탄올을 생산할 수도 있고, 조작된 경로를 통해 부탄올을 생산하도록 조작될 수도 있다.
본 균주를 사용하여 생산된 부탄올은 화석 연료의 대체 에너지원으로 사용될 수 있다. 발효에 의한 부탄올의 생산은 통상적인 석유화학적 합성에 비해 적은 오염 물질을 발생시킨다.
명세서 및 청구범위를 설명하기 위해 하기의 약어 및 정의를 사용한다.
본 명세서에 사용되는 바와 같이, "포함하다", "포함하는", "함유하다", "함유하는", "갖는다", "갖는", "포함되어 있다" 또는 "포함되어 있는" 이라는 용어 또는 이들의 임의의 다른 변형은 배타적이지 않은 포함을 커버하고자 한다. 예를 들어, 요소들의 목록을 포함하는 조성물, 혼합물, 공정, 방법, 용품, 또는 장치는 반드시 그러한 요소만으로 제한되지는 않고, 명확하게 열거되지 않거나 그러한 조성물, 혼합물, 공정, 방법, 용품, 또는 장치에 내재적인 다른 요소를 포함할 수도 있다. 더욱이, 명백히 반대로 기술되지 않는다면, "또는"은 포괄적인 '또는'을 말하며, 배타적인 '또는'을 말하는 것은 아니다. 예를 들어, 조건 A 또는 B는 하기 중 어느 하나에 의해 만족된다: A는 참(또는 존재함)이고 B는 거짓(또는 존재하지 않음), A는 거짓(또는 존재하지 않음)이고 B는 참(또는 존재함), A 및 B 모두가 참(또는 존재함).
또한, 본 발명의 요소 또는 성분 앞의 부정 관사 ("a" 및 "an")는 요소 또는 성분의 경우 (즉, 존재)의 수에 관해서는 비제한적인 것으로 의도된다. 따라서, 부정 관사 ("a" 및 "an")는 하나 또는 적어도 하나를 포함하는 것으로 파악되어야 하며, 당해 요소 또는 성분의 단수형은 그 수가 명백하게 단수임을 의미하는 것이 아니라면 복수형도 포함한다.
본 명세서에서 사용된 용어 "발명" 또는 "본 발명"은 비한정적 용어로서 특정 발명의 단일 구현예를 지칭하기 위한 것이 아니고 명세서 및 청구범위에 기술된 모든 가능한 구현예를 포함한다.
본 명세서에서 사용된 바와 같이, 채용된 발명의 성분 또는 반응물의 분량을 수정하는 용어 "약"은, 예를 들어, 현실에서 농축물을 제조하거나 용액을 사용함에 있어서의 통상적 측정 및 액체 취급 과정; 이들 과정에서의 우발적인 오차; 조성물을 제조하거나 방법을 실행하기 위해 채용된 성분의 제조, 공급원 또는 순도의 차이; 등을 통해 발생할 수 있는 숫자상의 분량 편차를 지칭한다. 용어 "약"은 또한 특정 초기 혼합물로부터 유발되는 조성물에 대한 상이한 평형 조건으로 인해 달라지는 양을 포함한다. 용어 "약"에 의한 수정 여부를 불문하고, 청구범위는 분량의 균등물을 포함한다. 한 구현예에서, 용어 "약"은 보고된 수치의 10% 이내, 바람직하게는 보고된 수치의 5% 이내를 의미한다.
본 명세서에서 사용된 용어 "부탄올"은 1-부탄올, 2-부탄올, 아이소부탄올, 또는 그의 혼합물을 지칭한다.
용어 "부탄올 내성 효모 균주" 및 "내성"은, 본 발명의 개질된 효모 균주를 기술하기 위해 사용되는 경우에, 그것이 유래된 모균주에 비해 부탄올 존재하에서의 성장이 더 우수한 개질 효모를 지칭한다.
용어 "부탄올 생합성 경로"는 1-부탄올, 2-부탄올 또는 아이소부탄올을 생산하는 효소 경로를 지칭한다.
용어 "1-부탄올 생합성 경로"는 아세틸-조효소 A(아세틸-CoA)로부터 1-부탄올을 생산하는 효소 경로를 지칭한다.
용어 "2-부탄올 생합성 경로"는 파이루베이트로부터 2-부탄올을 생산하는 효소 경로를 지칭한다.
용어 "아이소부탄올 생합성 경로"는 파이루베이트로부터 아이소부탄올을 생산하는 효소 경로를 지칭한다.
용어 "아세틸-CoA 아세틸트랜스페라제"는 2 분자의 아세틸-CoA가 아세토아세틸-CoA 및 조효소 A(CoA)로 전환되는 것을 촉매하는 효소를 지칭한다. 바람직한 아세틸-CoA 아세틸트랜스페라제는 단쇄 아실-CoA 및 아세틸-CoA에 대한 기질 선호도(정방향 반응)를 가지며 E.C. 2.3.1.9 [Enzyme Nomenclature 1992, Academic Press, San Diego]로 분류되는 아세틸-CoA 아세틸트랜스페라제이지만, 더 넓은 기질 범위를 가진 효소(E.C. 2.3.1.16)도 마찬가지로 기능할 것이다. 아세틸-CoA 아세틸트랜스페라제는 다수의 공급원, 예를 들어 에스체리키아 콜라이(Escherichia coli)(젠뱅크(GenBank) 번호: NP_416728, NC_000913; NCBI(국립생물공학정보센터(National Center for Biotechnology Information)) 아미노산 서열, NCBI 뉴클레오티드 서열), 클로스트리디움 아세토부틸리쿰 (젠뱅크 번호: NP_349476.1 (서열번호 2), NC_003030; NP_149242 (서열번호 4), NC_001988), 바실러스 서브틸리스(젠뱅크 번호: NP_390297, NC_000964), 및 사카로마이세스 세레비시아(젠뱅크 번호: NP_015297, NC_001148 (서열번호 39))로부터 이용가능하다.
용어 "3-하이드록시부티릴-CoA 데하이드로게나제"는 아세토아세틸-CoA로부터 3-하이드록시부티릴-CoA로의 전환을 촉매하는 효소를 지칭한다. 3-하이드록시부티릴-CoA 데하이드로게나제는 환원형 니코틴아미드 아데닌 다이뉴클레오티드(NADH)-의존성일 수 있고, (S)-3-하이드록시부티릴-CoA 또는 (R)-3-하이드록시부티릴-CoA에 대한 기질 선호도를 가지며, E.C. 1.1.1.35 및 E.C. 1.1.1.30으로 각각 분류된다. 또한, 3-하이드록시부티릴-CoA 데하이드로게나제는 환원형 니코틴아미드 아데닌 다이뉴클레오티드 포스페이트(NADPH)-의존성일 수 있고, (S)-3-하이드록시부티릴-CoA 또는 (R)-3-하이드록시부티릴-CoA에 대한 기질 선호도를 가지며, E.C. 1.1.1.157 및 E.C. 1.1.1.36으로 각각 분류된다. 3-하이드록시부티릴-CoA 데하이드로게나제는 다수의 공급원, 예를 들어, 씨. 아세토부틸리쿰(젠뱅크 번호: NP_349314 (서열번호 6), NC_003030), 비. 서브틸리스(젠뱅크 번호: AAB09614, U29084), 랄스토니아 유트로파(Ralstonia eutropha)(젠뱅크 번호: ZP_0017144, NZ_AADY01000001, 알칼리게네스 유트로퍼스(Alcaligenes eutrophus)(젠뱅크 번호: YP_294481, NC_007347), 및 에이. 유트로퍼스(젠뱅크 번호: P14697, J04987)로부터 이용가능하다.
용어 "크로토나제"는 3-하이드록시부티릴-CoA로부터 크로토닐-CoA 및 H2O로의 전환을 촉매하는 효소를 지칭한다. 크로토나제는 (S)-3-하이드록시부티릴-CoA 또는 (R)-3-하이드록시부티릴-CoA에 대한 기질 선호도를 가질 수 있으며 E.C. 4.2.1.17 및 E.C. 4.2.1.55로 각각 분류된다. 크로토나제는 다수의 공급원, 예를 들어, 이. 콜라이(젠뱅크 번호: NP_415911 (서열번호 8), NC_000913), 씨. 아세토부틸리쿰(젠뱅크 번호: NP_349318, NC_003030), 비. 서브틸리스(젠뱅크 번호: CAB13705, Z99113), 및 에어로모나스 카비아(Aeromonas caviae)(젠뱅크 번호: BAA21816, D88825)으로부터 이용가능하다.
트랜스-에노일 CoA 리덕타제라고도 하는 용어 "부티릴-CoA 데하이드로게나제"는 크로토닐-CoA로부터 부티릴-CoA로의 전환을 촉매하는 효소를 지칭한다. 부티릴-CoA 데하이드로게나제는 NADH-의존성 또는 NADPH-의존성일 수 있으며, E.C. 1.3.1.44 및 E.C. 1.3.1.38로 각각 분류된다. 부티릴-CoA 데하이드로게나제는 다수의 공급원, 예를 들어, 씨. 아세토부틸리쿰(젠뱅크 번호: NP_347102 (서열번호 10), NC_003030), 유글레나 그라실리스(Euglena gracilis)(젠뱅크 번호: Q5EU90, AY741582), 스트렙토마이세스 콜리너스(Streptomyces collinus)(젠뱅크 번호: AAA92890, U37135), 및 스트렙토마이세스 코엘리컬러(Streptomyces coelicolor)(젠뱅크 번호: CAA22721, AL939127)로부터 이용가능하다.
용어 "부티르알데히드 데하이드로게나제"는 NADH 또는 NADPH를 보조인자로 사용하여 부티릴-CoA로부터 부티르알데히드로의 전환을 촉매하는 효소를 지칭한다. NADH를 선호하는 부티르알데히드 데하이드로게나제는 E.C. 1.2.1.57로서 공지되어 있으며, 예를 들어 클로스트리디움 베이어린키(젠뱅크 번호: AAD31841 (서열번호 12), AF157306) 및 씨. 아세토부틸리쿰(젠뱅크 번호: NP_149325, NC_001988)로부터 이용가능하다.
용어 "1-부탄올 데하이드로게나제"는 부티르알데히드로부터 1-부탄올로의 전환을 촉매하는 효소를 지칭한다. 1-부탄올 데하이드로게나제는 알코올 데하이드로게나제의 넓은 패밀리의 서브셋이다. 1-부탄올 데하이드로게나제는 NADH- 또는 NADPH-의존성일 수 있다. 1-부탄올 데하이드로게나제는, 예를 들어, 씨. 아세토부틸리쿰(젠뱅크 번호: NP_149325, NC_001988; NP_349891 (서열번호 14), NC_003030; 및 NP_349892 (서열번호 16), NC_003030) 및 이. 콜라이(젠뱅크 번호: NP_417484, NC_000913)로부터 이용가능하다.
"아세토하이드록시산 신타제"로도 공지된 용어 "아세토락테이트 신타제"는, 2 분자의 피루브산을 1 분자의 알파-아세토락테이트로 전환시키는 것을 촉매하는 효소 활성을 가진 폴리펩티드(또는 폴리펩티드들)을 지칭한다. EC 2.2.1.6 [이전에는 4.1.3.18]으로 공지된 아세토락테이트 신타제(Enzyme Nomenclature 1992, Academic Press, San Diego)는 그의 활성에 있어서 보조인자 티아민 파이로포스페이트에 의존성일 수 있다. 적합한 아세토락테이트 신타제 효소는 다수의 공급원, 예를 들어, 바실러스 서브틸리스(젠뱅크 번호: AAA22222 NCBI (국립생물공학정보센터) 아미노산 서열(서열번호 42), L04470 NCBI 뉴클레오티드 서열(서열번호 41)), 클렙시엘라 테리게나(Klebsiella terrigena)(젠뱅크 번호: AAA25055, L04507), 및 클렙시엘라 뉴모니아(젠뱅크 번호: AAA25079(서열번호 20), M73842(서열번호 19)로부터 이용가능하다.
용어 "아세토락테이트 데카복실라제"는 알파-아세토락테이트로부터 아세토인으로의 전환을 촉매하는 효소 활성을 가진 폴리펩티드(또는 폴리펩티드들)을 지칭한다. 아세토락테이트 데카복실라제는 EC 4.1.1.5로서 공지되어 있으며, 예를 들어 바실러스 서브틸리스(젠뱅크 번호: AAA22223, L04470), 클렙시엘라 테리게나(젠뱅크 번호: AAA25054, L04507) 및 클렙시엘라 뉴모니아(서열번호 18(아미노산) 서열번호 17(뉴클레오티드))로부터 이용가능하다.
용어 "부탄다이올 데하이드로게나제"는 "아세토인 리덕타제"로도 공지되어 있으며, 아세토인으로부터 2,3-부탄다이올로의 전환을 촉매하는 효소 활성을 가진 폴리펩티드(또는 폴리펩티드들)을 지칭한다. 부탄다이올 데하이드로게나제는 알코올 데하이드로게나제의 넓은 패밀리의 서브셋이다. 부탄다이올 데하이드로게나제 효소는 알코올 산물 중에 R- 또는 S-입체화학의 생성에 대한 특이성을 가질 수 있다. S-특이적 부탄다이올 데하이드로게나제는 EC 1.1.1.76으로서 공지되어 있으며, 예를 들어 클렙시엘라 뉴모니아(젠뱅크 번호: BBA13085 (서열번호 22), D86412로부터 이용가능하다. R-특이적 부탄다이올 데하이드로게나제는 EC 1.1.1.4로서 공지되어 있으며, 예를 들어 바실러스 세레우스(Bacillus cereus)(젠뱅크 번호 NP_830481, NC_004722; AAP07682, AE017000), 및 락토코커스 락티스(젠뱅크 번호 AAK04995, AE006323)로부터 이용가능하다.
용어 "부탄다이올 데하이드라타제"는 "다이올 데하이드라타제" 또는 "프로판다이올 데하이드라타제"로도 공지되어 있으며, 2,3-부탄다이올로부터 2-부타논(메틸 에틸 케톤(MEK)이라고도 함)으로의 전환을 촉매하는 효소 활성을 가진 폴리펩티드(또는 폴리펩티드들)을 지칭한다. 부탄다이올 데하이드라타제는 보조인자 아데노실 코발라민을 이용할 수 있다. 아데노실 코발라민-의존성 효소는 EC 4.2.1.28로서 공지되어 있으며, 예를 들어 클렙시엘라 옥시토카(젠뱅크 번호: BAA08099(알파 서브유닛)(서열번호 24), BAA08100(베타 서브유닛)(서열번호 26) 및 BBA08101(감마 서브유닛)(서열번호 28), (3 개 서브유닛 모두가 활성을 위해 필요함에 유의), D45071)로부터 이용가능하다.
용어 "2-부탄올 데하이드로게나제"는 2-부타논으로부터 2-부탄올로의 전환을 촉매하는 효소 활성을 가진 폴리펩티드(또는 폴리펩티드들)를 지칭한다. 2-부탄올 데하이드로게나제는 알코올 데하이드로게나제의 넓은 패밀리의 서브셋이다. 2-부탄올 데하이드로게나제는 NADH- 또는 NADPH-의존성일 수 있다. NADH-의존성 효소는 EC 1.1.1.1로서 공지되어 있으며, 예를 들어 로도코커스 루버(젠뱅크 번호: CAD36475(서열번호 30), AJ491307(서열번호 29))로부터 이용가능하다. NADPH-의존성 효소는 EC 1.1.1.2로서 공지되어 있으며, 예를 들어 파이로코커스 푸리오서스(Pyrococcus furiosus)(젠뱅크 번호: AAC25556, AF013169)로부터 이용가능하다.
용어 "아세토하이드록시산 아이소머로리덕타제" 또는 "아세토하이드록시산 리덕토아이소머라제"는 NADPH(환원형 니코틴아미드 아데닌 다이뉴클레오티드 포스페이트)를 전자 공여체로 사용하여 아세토락테이트로부터 2,3-다이하이드록시아이소발레레이트로의 전환을 촉매하는 효소를 지칭한다. 바람직한 아세토하이드록시산 아이소머로리덕타제는 EC 번호 1.1.1.86으로 공지되어 있으며, 그 서열은 에스체리키아 콜라이(젠뱅크 번호: NP_418222(서열번호 32), NC_000913(서열번호 31)), 사카로마이세스 세레비시아(젠뱅크 번호: NP_013459(서열번호 44), NC_001144(서열번호 43)), 메타노코커스 마리팔루디스(Methanococcus maripaludis)(젠뱅크 번호: CAF30210, BX957220), 및 바실러스 서브틸리스(젠뱅크 번호: CAB14789 (서열번호 46), Z99118 (서열번호 45))를 포함하나 이에 한정되지 않는 다양한 미생물로부터 이용가능하다.
용어 "아세토하이드록시산 데하이드라타제" 또는 "다이하이드록시산 데하이드라타제"는 2,3-다이하이드록시아이소발레레이트로부터 α-케토아이소발레레이트로의 전환을 촉매하는 효소를 지칭한다. 바람직한 아세토하이드록시산 데하이드라타제는 EC 번호 4.2.1.9로 공지되어 있다. 이들 효소는 이.콜라이 (젠뱅크 번호: YP_026248(서열번호 34), NC_000913(서열번호 33)), 에스. 세레비시아(젠뱅크 번호: NP_012550(서열번호 48), NC_001142(서열번호 47)), 엠. 마리팔루디스(젠뱅크 번호: CAF29874, BX957219) 및 비. 서브틸리스(젠뱅크 번호: CAB14105, Z99115)를 포함하나 이에 한정되지 않는 다양한 미생물로부터 이용가능하다.
용어 "분지쇄 α-케토산 데카복실라제"는 α-케토아이소발레레이트로부터 아이소부티르알데히드 및 CO2로의 전환을 촉매하는 효소를 지칭한다. 바람직한 분지쇄 α-케토산 데카복실라제는 EC 번호 4.1.1.72로 공지되어 있으며, 락토코커스 락티스(젠뱅크 번호: AAS49166, AY548760; CAG34226 (서열번호 36), AJ746364, 살모넬라 티피무리움(Salmonella typhimurium)(젠뱅크 번호: NP_461346, NC_003197), 및 클로스트리디움 아세토부틸리쿰(젠뱅크 번호: NP_149189, NC_001988)을 포함하나 이에 한정되지 않는 다수의 공급원으로부터 이용가능하다.
용어 "분지쇄 알코올 데하이드로게나제"는 아이소부티르알데히드로부터 아이소부탄올로의 전환을 촉매하는 효소를 지칭한다. 바람직한 분지쇄 알코올 데하이드로게나제는 EC 번호 1.1.1.265로 공지되어 있으나, 다른 알코올 데하이드로게나제(구체적으로는, EC 1.1.1.1 또는 1.1.1.2)로 분류될 수도 있다. 이들 효소는 NADH(환원형 니코틴아미드 아데닌 다이뉴클레오티드) 및/또는 NADPH를 전자 공여체로 이용하며, 에스. 세레비시아(젠뱅크 번호: NP_010656, NC_001136; NP_014051, NC_001145), 이. 콜라이(젠뱅크 번호: NP_417484 (서열번호 38), NC_000913 (서열번호 37)), 및 씨. 아세토부틸리쿰(젠뱅크 번호: NP_349892, NC_003030)을 포함하나 이에 한정되지 않는 다수의 공급원으로부터 이용가능하다.
용어 "유전자"는, 특이적 단백질로서 발현이 가능하고 코딩 서열의 전방(5' 비-코딩 서열) 및 후방(3' 비-코딩 서열)에 있는 조절 서열을 임의로 포함하는 핵산 단편을 지칭한다. "천연 유전자(native gene)"는 자기 자신의 조절 서열을 동반하여 자연에서 발견되는 유전자를 지칭한다. "융합 유전자(Chimeric gene)"는, 자연에서 함께 발견되지 않는 조절 및 코딩 서열을 포함하는, 천연 유전자가 아닌 임의의 유전자를 지칭한다. 따라서, 융합 유전자는 상이한 공급원으로부터 유래된 조절 서열 및 코딩 서열, 또는 동일한 공급원으로부터 유래되나 자연에서 발견되는 것과는 상이한 방법으로 배열된 조절 서열 및 코딩 서열을 포함할 수 있다. "내인성 유전자"는 유기체의 게놈 내에서 자연적인 위치에 있는 천연 유전자를 지칭한다. "외래" 유전자는 숙주 유기체 내에서 정상적으로 발견되는 것이 아니라 유전자 전달에 의해 숙주 유기체 내로 도입된 유전자를 지칭한다. 외래 유전자는 비-천연 유기체 내로 삽입된 천연 유전자, 또는 융합 유전자를 포함할 수 있다. "형질전환 유전자(transgene)"는 형질전환 과정에 의해 게놈 내로 도입된 유전자이다.
본 명세서에서 사용된 용어 "코딩 서열"은 특이적 아미노산 서열을 코딩하는 DNA 서열을 지칭한다. "적합한 조절 서열"은 코딩 서열의 업스트림(5' 비-코딩 서열), 내부, 또는 다운스트림(3' 비-코딩 서열)에 위치하여 전사, RNA 프로세싱 또는 안정성, 또는 연계 코딩 서열의 번역에 영향을 미치는 뉴클레오티드 서열을 지칭한다. 조절 서열은 프로모터, 번역 리더 서열(translation leader sequence), 인트론, 폴리아데닐화 인식 서열, RNA 프로세싱 부위, 효과기(effector) 결합 부위 및 스템-루프 구조(stem-loop structure)를 포함할 수 있다.
용어 "프로모터"는 코딩 서열 또는 기능성 RNA의 발현을 제어할 수 있는 DNA 서열을 지칭한다. 일반적으로, 코딩 서열은 프로모터 서열에 대해 3' 쪽에 위치한다. 프로모터는, 천연 유전자로부터 그 전체가 유래될 수도 있고, 자연에서 발견되는 상이한 프로모터로부터 유래된 상이한 요소로 구성될 수도 있으며, 심지어 합성 DNA 분절을 포함할 수도 있다. 상이한 프로모터는 상이한 조직 또는 세포 유형에서, 또는 상이한 발생 단계에서, 또는 상이한 환경적 또는 생리학적 조건에 반응하여 유전자의 발현을 유도할 수 있음을 당업자는 이해할 것이다. 대부분의 시간에 대부분의 세포 유형에서 유전자의 발현을 유발하는 프로모터를 통상적으로 "구성성(constitutive) 프로모터"라고 지칭한다. 또한, 대부분의 경우에 조절 서열의 정확한 경계는 완벽하게 정의되지 않았으므로, 상이한 길이의 DNA 단편이 동일한 프로모터 활성을 가질 수 있음이 인정된다.
용어 "작동적으로 연결된(operably linked)"은, 하나의 기능이 다른 하나에 의해 영향을 받도록 단일 핵산 단편상에서 핵산 서열들이 연계됨을 지칭한다. 예를 들어, 프로모터가 코딩 서열의 발현에 영향을 미칠 수 있는 경우에, 프로모터는 그 코딩 서열에 작동적으로 연결된다(즉, 코딩 서열은 프로모터의 전사 제어하에 있다). 코딩 서열은 센스(sense) 또는 안티센스(antisense) 배향으로 조절 서열에 작동적으로 연결될 수 있다.
본 명세서에서 사용된 용어 "발현"은, 본 발명의 핵산 단편으로부터 유래된 센스(mRNA) 또는 안티센스 RNA의 전사 및 안정한 축적을 지칭한다. 발현은 mRNA로부터 폴리펩티드로의 번역을 지칭할 수도 있다.
본 명세서에서 사용된 용어 "형질전환"은 숙주 유기체 내로 핵산 단편을 전달하여 유전적으로 안정한 유전을 유발함을 지칭한다. 형질전환 핵산 단편을 포함하는 숙주 유기체는 "형질변환(transgenic)" 또는 "재조합" 또는 "형질전환" 유기체라고 지칭된다.
용어 "플라스미드" 및 "벡터"는, 세포의 중요 대사작용의 일부가 아닌 유전자를 종종 운반하며 통상적으로 원형의 이중 가닥 DNA 단편의 형태인 염색체 밖의 요소를 지칭한다. 이러한 요소는 임의의 공급원으로부터 유래된 선형 또는 원형의 단일 또는 이중 가닥 DNA 또는 RNA인 자가복제 서열(autonomously replicating sequence), 게놈 통합성 서열(genome integrating sequence), 파아지 또는 뉴클레오티드 서열일 수 있으며, 여기에 다수의 뉴클레오티드 서열이 결합 또는 재조합되어 적절한 3' 비번역 서열과 함께 선택된 유전자 산물의 DNA 서열 및 프로모터 단편을 세포 내로 도입할 수 있는 독특한 작제물이 만들어져왔다. "형질전환 벡터"는, 외래 유전자를 포함하고 외래 유전자에 부가하여 특정 숙주 세포의 형질전환을 촉진하는 요소들을 가진 특이적 벡터를 지칭한다.
본 명세서에서 사용된 용어 "코돈 축중성(codon degeneracy)"은 암호화된 폴리펩티드의 아미노산 서열에 영향을 주지 않으면서 뉴클레오티드 서열의 변이를 허용하는 유전 암호의 성질을 지칭한다. 주어진 아미노산을 특정하기 위한 뉴클레오티드 코돈의 사용에 있어서 특정 숙주 세포에서 나타나는 "코돈-바이어스(codon-bias)가 당업자에게 주지되어 있다. 그러므로, 숙주 세포 내의 발현을 개선하기 위한 유전자를 합성할 경우에는, 그의 코돈 사용 빈도가 숙주 세포가 선호하는 코돈의 사용 빈도에 근접하도록 유전자를 고안하는 것이 바람직하다.
다양한 숙주의 형질전환을 위한 핵산 분자의 코딩 영역 또는 유전자에 관련된 용어 "코돈-최적화"는, DNA에 의해 암호화되는 폴리펩티드를 변경하지 않으면서 숙주 유기체의 통상적 코돈 이용을 반영하도록 핵산 분자의 코딩 영역 또는 유전자 내의 코돈을 변경함을 지칭한다.
"탄소 기질"은, 효모의 에너지원으로서 유용한 탄소 함유 화합물을 의미하며, 단당류, 예를 들어 포도당 및 과당, 올리고당류, 예를 들어 락토스 또는 수크로스, 다당류, 예를 들어 전분 또는 셀룰로오스 또는 그 혼합물 및 재생가능한 원료(renewable feedstock)로부터의 미정제 혼합물, 예를 들어 유청 투과액(cheese whey permeate), 옥수수 침지수(cornsteep liquor), 사탕무우 당밀(sugar beet molasses) 및 보리 맥아(barley malt)를 포함할 수 있으나 이에 한정되지 않는다.
본 명세서에서 "아미노산 기아에 대한 일반 제어 반응에서 반응이 감소된 세포"는, 아미노산이 붙지 않은 tRNA(uncharged tRNA)를 아미노산 생합성 유전자의 전사 유도를 위한 신호로서 감지하지 않는 세포, 및/또는 아미노산 생합성 유전자의 전사 유도에 의해 아미노산 기아에 반응하지 않는 세포를 지칭한다(Hinnebusch (2005) Ann. Rev. Microbiol. 59:407-450).
본 명세서에서 사용된 "분리된 핵산 단편" 또는 "분리된 핵산 분자"는 호환적으로 사용되며, 합성, 비자연적 또는 변경된 뉴클레오티드 염기를 임의로 포함하는 단일- 또는 이중-가닥 RNA 또는 DNA 중합체를 의미한다. DNA의 중합체 형태인 분리된 핵산 단편은 cDNA, 게놈 DNA 또는 합성 DNA의 하나 이상의 분절로 이루어질 수 있다.
온도 및 용액 이온 강도의 적절한 조건하에 핵산 단편의 단일-가닥 형태가 다른 핵산 단편에 어닐링(annealing)될 수 있는 경우에, 핵산 단편은 다른 핵산 단편, 예를 들어 cDNA, 게놈 DNA 또는 RNA 분자에 "혼성가능(hybridizable)"하다. 혼성화 및 세척 조건은 주지되어 있으며 문헌(Sambrook, J., Fritsch, E. F. and Maniatis, T. Molecular Cloning: A Laboratory Manual, 2nd ed., Cold Spring Harbor Laboratory: Cold Spring Harbor, NY (1989)), 특히 이에 수록된 제11장 및 표 11.1에 예시되어 있다(원용에 의해 그 전체 내용이 본 명세서에 포함됨). 온도 및 이온 강도 조건은 혼성화의 "엄격성(stringency)"을 결정한다. 엄격성 조건을 조정하여, 중간 정도로 유사한 단편(예를 들어 관계가 먼 유기체로부터의 상동 서열) 내지 고도로 유사한 단편(예를 들어 밀접하게 관련된 유기체로부터의 기능성 효소를 중복시키는 유전자)을 스크리닝할 수 있다. 혼성화후 세척은 엄격성 조건을 결정한다. 한 세트의 바람직한 조건에서는, 실온에서 15 분 동안 6X SSC, 0.5% SDS로 시작하여 45℃에서 30 분 동안 2X SSC, 0.5% SDS로 반복하고, 50℃에서 30 분 동안 0.2X SSC, 0.5% SDS로 2회 반복하는 일련의 세척을 사용한다. 더욱 바람직한 세트의 엄격성 조건에서는 더 높은 온도를 사용하며, 0.2X SSC, 0.5% SDS 내에서의 최종 2회 30 분 세척의 온도를 60℃까지 증가시킨다는 점을 제외하고는 세척이 상기와 동일하다. 다른 바람직한 세트의 높은 엄격성 조건에서는 65℃에서 0.1X SSC, 0.1% SDS 내에서의 2회 최종 세척을 사용한다. 추가의 세트에서 엄격성 조건은, 예를 들어 0.1X SSC, 0.1% SDS, 65℃에서의 혼성화 및 2X SSC, 0.1% SDS에 의한 세척 후에 0.1X SSC, 0.1% SDS에 의한 세척을 포함한다.
혼성화의 엄격성에 따라 염기 사이의 불일치가 가능하지만, 혼성화를 위해서는 2 개의 핵산이 상보적 서열을 포함해야 한다. 혼성화되는 핵산에 대해 적절한 엄격성은, 당업계에 주지된 변수인 핵산의 길이 및 상보성의 정도에 의존한다. 2 개 뉴클레오티드 서열 사이의 유사성 또는 상동성의 정도가 클수록, 이들 서열을 가진 핵산의 혼성체의 Tm 수치가 커진다. 핵산 혼성화의 상대적 안정성(높은 Tm에 상응함)은 하기의 순서로 감소한다: RNA:RNA, DNA:RNA, DNA:DNA. 길이가 100 뉴클레오티드를 초과하는 혼성체에 대하여 Tm을 계산하는 수학식이 유도되었다(Sambrook et al., supra, 9.50-9.51). 더 짧은 핵산, 즉, 올리고뉴클레오티드의 혼성화에 있어서는 불일치의 위치가 더욱 중요해지며 올리고뉴클레오티드의 길이가 그의 특이성을 결정한다(Sambrook et al., supra, 11.7-11.8). 한 구현예에서는 혼성가능한 핵산의 길이가 적어도 약 10 뉴클레오티드이다. 바람직하게는 혼성가능한 핵산의 최소 길이가 적어도 약 15 뉴클레오티드이고; 더욱 바람직하게는 적어도 약 20 뉴클레오티드이며; 가장 바람직하게는 길이가 적어도 약 30 뉴클레오티드이다. 또한, 탐침의 길이와 같은 인자에 따라 필요한 경우에 온도 및 세척 용액 염 농도를 조정할 수 있음을 당업자는 인식할 것이다.
용어 "상보적"은, 서로 혼성화될 수 있는 뉴클레오티드 염기 사이의 관계를 기술하기 위해 사용된다. 예를 들어, DNA에 있어서 아데노신은 티민에 상보적이고 사이토신은 구아닌에 상보적이다.
당업계에 공지된 바와 같이, 용어 "동일성 백분율"은 2 개 이상의 폴리펩티드 서열 또는 2 개 이상의 폴리뉴클레오티드 서열 사이의 관계로서, 서열들을 비교함으로써 결정된다. 당업계에서 "동일성"은 또한 폴리펩티드 또는 폴리뉴클레오티드 서열 사이의 서열 관련성의 정도를 의미하며, 경우에 따라 이러한 서열의 스트링(string) 사이의 일치에 의해 결정된다. "동일성" 및 "유사성"은, 하기의 문헌에 기술된 것들을 포함하나 이에 한정되지 않는 공지 방법을 통해 용이하게 계산할 수 있다: 1.) 계산 분자생물학(Computational Molecular Biology)(Lesk, A. M., Ed.) 옥스포드 대학교: 뉴욕(1988); 2.) 생물전산학(Biocomputing): 정보학 및 게놈 프로젝트(Informatics and Genome Projects)(Smith, D. W., Ed.) 아카데믹: 뉴욕(1993); 3.) 서열 데이터의 전산 분석, 제1부(Computer Analysis of Sequence Data, Part I)(Griffin, A. M., and Griffin, H. G., Eds.) 휴머니아(Humania): 뉴저지(1994); 4.) 분자생물학에서의 서열 분석(Sequence Analysis in Molecular Biology)(von Heinje, G., Ed.) 아카데믹(1987); 및 5.) 서열 분석 프라이머(Sequence Analysis Primer)(Gribskov, M. and Devereux, J., Eds.) 스톡턴(Stockton): NY (1991).
동일성을 결정하는 바람직한 방법은 시험 서열 사이에 최상의 일치를 부여하도록 고안된다. 동일성 및 유사성을 결정하는 방법은 공중에게 이용가능한 컴퓨터 프로그램에 명시되어 있다. 레이저진(LASERGENE) 생물정보학 계산 모음(bioinformatics computing suite)(위스콘신주 메디슨 소재의 디엔에이스타 인코포레이티드(DNASTAR Inc.))의 멕얼라인(등록상표)(MegAlign™) 프로그램을 사용하여 서열 정렬 및 동일성 백분율 계산을 수행할 수 있다. 몇가지 종류의 알고리듬, 예를 들어 클러스탈 V로 분류된 정렬 방법(Higgins and Sharp, CABIOS. 5:151-153 (1989); Higgins, D.G. et al., Comput. Appl. Biosci., 8:189-191 (1992))에 상응하고 레이저진 생물정보학 계산 모음의 멕얼라인(등록상표) 프로그램(디엔에이스타 인코포레이티드)에서 찾을 수 있는 "클러스탈 V 정렬 방법"을 포함하는 "클러스탈(Clustal) 정렬 방법"을 사용하여 서열의 다중 정렬을 수행할 수 있다. 다중 정렬에 있어서 내정값은 GAP PENALTY=10 및 GAP LENGTH PENALTY=10에 상응한다. 클러스탈 방법을 사용하는 단백질 서열의 동일성 백분율 계산 및 짝 정렬(pairwise alignment)에 있어서 내정 지표는 KTUPLE=1, GAP PENALTY=3, WINDOW=5 및 DIAGONALS SAVED=5이다. 핵산에 있어서 이들 지표는 KTUPLE=2, GAP PENALTY=5, WINDOW=4 및 DIAGONALS SAVED=4이다. 클러스탈 V 프로그램을 사용하여 서열들을 정렬한 후에, 동일한 프로그램 내의 "서열 거리" 표를 보면 "동일성 백분율"을 얻을 수 있다. 부가적으로 "클러스탈 W 정렬 방법"이 이용가능하며, 이는 클러스탈 W로 분류된 정렬 방법(Higgins and Sharp, CABIOS. 5:151-153 (1989); Higgins, D.G. et al., Comput. Appl. Biosci. 8:189-191(1992))에 상응하고 레이저진 생물정보학 계산 모음(디엔에이스타 인코포레이티드)의 멕얼라인(등록상표) v6.1 프로그램에서 찾을 수 있다. 다중 정렬을 위한 내정 지표(GAP PENALTY=10, GAP LENGTH PENALTY=0.2, Delay Divergen Seqs(%)=30, DNA Transition Weight=0.5, Protein Weight Matrix=Gonnet Series, DNA Weight Matrix=IUB ). 클러스탈 W 프로그램을 사용하여 서열들을 정렬한 후에, 동일한 프로그램 내의 "서열 거리" 표를 보면 "동일성 백분율"을 얻을 수 있다.
동일하거나 유사한 기능 또는 활성을 가진 폴리펩티드를 다른 종으로부터 동정함에 있어서 여러 수준의 서열 동일성이 유용하다는 것이 당업자에게 주지되어 있다. 동일성 백분율의 유용한 예는 하기의 것들을 포함하나 이에 한정되지 않는다: 70%, 75%, 80%, 85%, 90% 또는 95%, 또는 70% 내지 100% 범위의 임의의 정수 백분율, 예를 들어 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%가 본 발명을 기술함에 있어서 유용할 수 있다. 적합한 핵산 단편은 상기 동일성을 가진 폴리펩티드를 암호화하며, 통상적으로 적어도 약 250 개 아미노산, 바람직하게는 적어도 300 개 아미노산, 그리고 가장 바람직하게는 적어도 약 348 개 아미노산을 가진 폴리펩티드를 암호화한다.
용어 "서열 분석 소프트웨어"는, 뉴클레오티드 또는 아미노산 서열의 분석에 유용한 임의의 컴퓨터 알고리듬 또는 소프트웨어 프로그램을 지칭한다. "서열 분석 소프트웨어"는 상업적으로 이용가능하거나 독립적으로 개발할 수 있다. 통상적인 서열 분석 소프트웨어는 하기의 것들을 포함하나 이에 한정되지 않는다: 1.) GCG 프로그램 모음(위스콘신 패키지 버전 9.0, 위스콘신주 메디슨 소재의 제네틱스 컴퓨터 그룹(GCG: Genetics Computer Group)); 2.) BLASTP, BLASTN, BLASTX (Altschul et al., J. Mol. Biol., 215:403-410 (1990)); 3.) 디엔에이스타(위스콘신주 메디슨 소재의 디엔에이스타 인코포레이티드); 4.) 시퀀처(Sequencher)(미시간주 앤아버 소재의 젠 코드 코포레이션(Gene Codes Corporation)); 및 5.) 스미스-워터만 알고리듬(W. R. Pearson, Comput. Methods Genome Res., [Proc. Int. Symp.] (1994), Meeting Date 1992, 111-20. Editor(s): Suhai, Sandor. Plenum: New York, NY)을 포함하는 FASTA 프로그램. 본 출원과 관련하여, 서열 분석 소프트웨어를 분석에 이용하는 경우에, 달리 특정하지 않는 한, 분석 결과는 인용된 프로그램의 "내정값"에 기초한다는 것을 이해하여야 한다. 본 명세서에서 사용된 "내정값"은 최초 초기화할 때에 소프트웨어에 원래 로딩된 임의의 수치 또는 지표 세트를 의미한다.
아미노산 또는 뉴클레오티드 서열의 "상당한 부분"은, 당업자가 서열의 수동 평가 또는 BLAST(Altschul, S. F., et al., J. Mol. Biol., 215:403-410 (1993))와 같은 알고리듬을 사용하는 컴퓨터-자동화 서열 비교 및 동정에 의해 폴리펩티드 또는 유전자를 추정상으로 동정하기에 충분한 폴리펩티드의 아미노산 서열 또는 유전자의 뉴클레오티드 서열을 포함하는 부분이다. 일반적으로, 폴리펩티드 또는 핵산 서열을 공지의 단백질 또는 유전자와 상동적인 것으로 추정상 동정하기 위해서는 10 개 이상 연속되는 아미노산 또는 30 개 이상의 뉴클레오티드의 서열이 필요하다. 더욱이, 뉴클레오티드 서열에 있어서는, 서열-의존적인 유전자 동정(예를 들어, 서던 혼성화(Southern hybridization)) 및 분리(예를 들어, 박테리아 콜로니 또는 박테리오파아지 플라크의 제자리 혼성화(in situ hybridization)) 방법에 20-30 개의 연속된 뉴클레오티드를 포함하는 유전자 특이적 올리고뉴클레오티드 탐침이 사용될 수 있다. 또한, 12-15 염기의 짧은 올리고뉴클레오티드를 PCR에서 증폭 프라이머로 사용하여, 프라이머를 포함하는 특정 핵산 단편을 수득할 수 있다. 따라서, 뉴클레오티드 서열의 "상당한 부분"은, 서열을 포함하는 핵산 단편을 특이적으로 동정 및/또는 분리하기에 충분한 서열을 포함한다. 본 명세서는, 특정 알코올 데하이드로게나제 단백질을 암호화하는 뉴클레오티드 및 아미노산의 완전한 서열을 교시한다. 본 명세서에 보고된 서열의 유익성을 가지고, 당업자는 개시된 서열의 전체 또는 상당 부분을 당업계에 공지된 목적으로 사용할 수 있게 되었다. 따라서 본 발명은, 첨부하는 서열 목록에 보고된 완전 서열과 더불어 상기 정의된 서열들의 상당한 부분을 포함한다.
암호화된 단백질의 기능적 특성에 영향을 주지 않으면서, 화학적으로 균등한 아미노산이 주어진 부위에서 치환되는 아미노산 서열 또는 코딩 영역 내의 변경이 흔하다는 사실이 당업계에 주지되어 있으므로, 본 발명은 구체적으로 예시된 서열을 초과하는 범위를 포함한다. 본 발명의 목적상, 치환은 하기 5 개 그룹 중 하나 내에서의 교환으로 정의된다:
1. 작은 지방족의, 비극성 또는 약한 극성 잔기: Ala, Ser, Thr (Pro, Gly);
2. 극성의, 음성 하전된 잔기 및 그의 아미드: Asp, Asn, Glu, Gln;
3. 극성의, 양성 하전된 잔기: His, Arg, Lys;
4. 큰 지방족인, 비극성 잔기: Met, Leu, Ile, Val (Cys); 및
5. 큰 방향족 잔기: Phe, Tyr, Trp.
따라서, 소수성 아미노산인 아미노산 알라닌에 대한 코돈은 소수성이 좀 더 낮은 다른 잔기(예를 들어, 글리신) 또는 소수성이 좀 더 높은 잔기(예를 들어, 발린, 류신 또는 아이소류신)를 암호화하는 코돈으로 치환될 수 있다. 마찬가지로, 음성 하전된 하나의 잔기로 다른 하나를 치환하거나(예를 들어 글루탐산을 아스파르트산으로) 양성 하전된 하나의 잔기로 다른 하나를 치환하는(예를 들어, 알지닌을 라이신으로) 변화도 기능적으로 균등한 산물을 생성시킬 수 있을 것으로 예상된다. 많은 경우에, 단백질 분자의 N-말단 및 C-말단 부분의 변경을 유발하는 뉴클레오티드 변화도 단백질의 활성을 변경하지 않을 것으로 예상된다. 따라서 상기의 코돈 변이를 수반하는 코딩 영역, 및 상기의 아미노산 변이를 수반하는 단백질은 본 발명에 포함된다.
여기서 사용된 표준 재조합 DNA 및 분자 클로닝 기술은 당업계에 주지된 것으로서 문헌(Sambrook, J., Fritsch, E. F. and Maniatis, T. Molecular Cloning: A Laboratory Manual, 2nd ed.; Cold Spring Harbor Laboratory: Cold Spring Harbor, New York, 1989 (이하 "Maniatis"로 약칭함); 및 Silhavy, T. J., Bennan, M. L. and Enquist, L. W. Experiments with Gene Fusions; Cold Spring Harbor Laboratory: Cold Spring Harbor, New York, 1984; 및 Ausubel, F. M. et al., Current Protocols in Molecular Biology; Greene Publishing and Wiley-Interscience, 1987)에 기술되어 있다. 여기서 사용된 부가적 방법들은 효소학 방법론 문헌(Methods in Enzymology, Volume 194, Guide to Yeast Genetics and Molecular and Cell Biology(Part A, 2004, Christine Guthrie and Gerald R. Fink (Eds.), Elsevier Academic Press, San Diego, CA)에 있다.
효모에서의 부탄올 내성 조작을 위한 일반 제어 반응 표적 유전자
본 발명은, 사카로마이세스 세레비시아에서 아미노산 기아에 대한 일반 제어 반응에 관련된 유전자의 발현을 감소시키면 부탄올에 대한 세포의 내성이 증가한다는 발견에 관한 것이다. 효모에서의 아미노산 기아에 대한 일반 제어 반응은, 아미노산이 붙지 않은 tRNA의 존재를 감지하고 아미노산 생합성 유전자의 전사를 유도함으로써 반응하는 복잡한 시스템이다. 문헌(Hinebusch (2005) Ann. Rev. Microbiol. 59: 407-450)에 개관된 이 제어 시스템은, 돌연변이가 일어날 경우에 광범위한 아미노산 길항제 및 유사체에 대한 감도를 부여하는 유전자들을 포함하며; 아미노산 기아에 반응하지 않는 돌연변이체 표현형에 있어서, 이들 유전자를 비억제성 일반 제어(general control non-depressible) 또는 GCN이라고 부른다.
예를 들어 GCN2는, 아미노산이 붙지 않은 tRNA를 감지하고 카르복시-말단 도메인인 하나의 Gcn2p 도메인을 통해 리보솜에 결합하는 단백질(Gcn2p)을 암호화한다. HisRS라고 명명된(히스티딜-tRNA 신테타제 유사) Gcn2p의 제2 내부 도메인에 의해 아미노산이 붙지 않은 tRNA가 감지된다. 아미노산이 붙지 않은 tRNA가 HRS 도메인에 이렇게 결합하면, GDP에 연계된 진핵세포 개시 인자 2(eIF2~GDP)를 또 다른 Gcn2p 도메인(PK)이 인산화(kinasing)하여 eIF2-P~GDP를 생성시킨다. 그 다음에는, eIF2-P~GDP가 GCN4 암호화 mRNA의 번역을 자극하고 Gcn4p(GCN4 암호화 단백질)는 아미노산 생합성에 관련된 다수의 유전자의 발현을 활성화시킨다.
번역의 개시는 개시 인자 eIF2의 활성화 형태를 필요로 한다: eIF2~GTP. 이 활성화 형태는 개시 tRNA인 fmet-tRNA를 리보솜에 제공한다. eIF2-fmet-tRNA~GTP가 리보솜에 결합하면서 번역이 정상적으로 시작되며, 여기서 궁극적으로 eIF2~GDP가 방출된다. 이 형태의 개시 인자는 비활성이므로 GDP를 GTP로 교환하여 eIF2-GTP를 생성시킴으로써 활성화되어야 한다. Gcn2p의 키나제가 활성화되면 eIF2~GDP를 장악하여 eIF2~P를 생산한다. 이 형태의 eIF2~P는 구아닌 교환 인자 eIF2B가 하기 반응을 촉매하지 못하도록 차단한다: eIF2~GDP +GTP ->eIF2~GTP +GDP. 따라서, 아미노산 생합성 유전자의 전사활성 인자인 Gcn4p의 번역이 증가되어 있는 동안, 대부분의 번역 개시는 지연된다.
사카로마이세스 세레비시아에서 아미노산 기아 시스템에 대한 일반 제어 반응에 관련된 부가적인 GCN 유전자 암호화 단백질은 하기의 것들을 포함한다:
Gcn1p: Gcn2p 키나제 활성의 양성 조절 인자
Gcn3p: 번역 개시 인자 eIF2B의 알파 서브유닛, GCN4 발현의 양성 조절 인자
Gcn5p: 히스톤 H2B 및 H3의 N-말단 라이신을 아세틸화하는 히스톤 아세틸트랜스페라제; ADA 및 SAGA 히스톤 아세틸트랜스페라제 복합체의 촉매 서브유닛
Gcn6p: GCN4 전사의 양성 조절 인자
Gcn7p: GCN4 전사의 양성 조절 인자
Gcn8p: 불확실한 역할
Gcn9p: 불확실한 역할
Gcn20p: Gcn1p와 복합체를 형성하는, Gcn2p 키나제 활성의 양성 조절 인자
사카로마이세스 세레비시아 Gcn1-5p 및 Gcn20p 단백질 및 그의 코딩 영역의 서열번호를 표 4에 제공한다. 야로위아 리폴리티카 및 칸디다 알비칸스의 GCN 유전자에 대한 대표적인 코딩 영역 및 단백질 또한 표 4에 제공한다.
효모에서 아미노산 기아에 대한 일반 제어 반응에 관련된 단백질의 발현을 감소시키거나 제거하는 돌연변이는 반응을 감소시키고 부탄올 내성에 의외의 증가를 제공할 것이다. 따라서 본 효모 숙주는 아미노산 기아에 대한 일반 제어 반응에 관련된 적어도 하나의 단백질의 활성을 감소시키는 유전적 개질을 가진다. 아미노산 기아에 대한 일반 제어 반응을 감소시키는 유전적 개질을 위해 적합한 유전자는 Gcn1p, Gcn2p, Gcn3p, Gcn4p, Gcn5p, Gcn6p, Gcn7p, Gcn8p, Gcn9p 및 Gcn20p를 암호화하는 유전자를 포함한다. 이들 단백질의 예는 표 4에 서열번호 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72 및 74로서 제공된다. 이들 단백질에 대해 적어도 약 80%, 85%, 90%, 95% 또는 그 이상의 서열 동일성을 가지며 GCN 활성을 보유하는 단백질을 암호화하는 유전자는 아미노산 기아에 대한 일반 제어 반응을 감소시키는 유전적 개질의 표적이 될 수 있다. 더욱 적합한 표적은 Gcn1p, Gcn2p, Gcn3p, Gcn4p, Gcn5p 및 Gcn20p를 암호화하는 유전자이다. 가장 적합한 표적은 Gcn2p 및 Gcn4p를 암호화하는 유전자이다.
Gcn1p, Gcn2p, Gcn3p, Gcn4p, Gcn5p, Gcn6p, Gcn7p, Gcn8p, Gcn9p 또는 Gcn20p 단백질을 암호화하는 것으로 동정된 임의의 효모 유전자, 또는 아미노산 기아에 대한 일반 제어 반응에 관련된 단백질을 암호화하는 다른 유전자는, 부탄올 내성이 증가된 본 발명의 균주를 창출하기 위한 상응하는 효모 균주에서의 개질을 위한 표적 유전자이다. 본 발명의 방법을 사용하여 GCN 시스템을 가진 임의의 유형의 효모를 부탄올 내성에 대해 조작할 수 있다. 사카로마이세스, 야로위아, 칸디다 및 한세눌라(Hansenula)를 포함하는 효모 속은 GCN 시스템을 보유하며(Bode et al. (199) J. Basic. Microbiol. 30(1):31-5), 내성을 제공하기 위한 개질의 표적인 사카로마이세스 세레비시아, 야로위아 리폴리티카 및 칸디다 알비칸스의 GCN 유전자의 예를 표 4에 열거한다. 사카로마이세스 세레비시아의 GCN 암호화 단백질의 예는 서열번호 50, 52, 54, 56, 58 및 60을 포함한다. 야로위아 리폴리티카의 GCN 암호화 단백질의 예는 서열번호 62, 64, 66 및 68을 포함한다. 칸디다 알비칸스의 GCN 암호화 단백질의 예는 서열번호 70, 72 및 74를 포함한다. 또한, 사상균(mold) 뉴로스포라 크라사(Neurospora crassa)에서 GCN2 및 GCN4의 상동체가 발견되었다(Paluh et al. (1988) Proc. Natl. Acad. Sci. U S A 85(11):3728-3732).
당업자에게 주지된 생물정보학 데이터베이스 및 문헌에 다른 GCN 시스템 표적 유전자가 동정되어 있을 수 있다. 또한, 본 명세서에 기술되거나 당업계에 열거된 서열을 사용하여 다른 상동체를 자연에서 동정할 수 있다. 예를 들어, 본 명세서에 기술된 각각의 GCN 핵산 단편을 사용하여 동일하거나 다른 효모로부터 상동 단백질을 암호화하는 유전자를 분리할 수 있다. 서열-의존성 프로토콜을 사용하는 상동 유전자의 분리는 당업계에 주지되어 있다. 서열-의존성 프로토콜의 예는 하기의 것들을 포함하나 이에 한정되지 않는다: 1.) 핵산 혼성화 방법; 2.) DNA 및 RNA 증폭 방법, 예를 들어 핵산 증폭 기술의 다양한 용도[예를 들어, 중합효소 연쇄반응(PCR: polymerase chain reaction), 미국 특허 제4,683,202호(Mullis et al.); 리가제 연쇄반응(LCR: ligase chain reaction)(Tabor, S. et al., Proc. Acad. Sci. USA 82:1074 (1985)); 또는 가닥 대체 증폭(SDA: strand displacement amplification)(Walker, et al., Proc. Natl. Acad. Sci. U.S.A., 89:392 (1992))]; 및 3.) 상보성에 의한 스크리닝 및 라이브러리 구축 방법.
예를 들어, 본 핵산 단편의 전부 또는 일부를 DNA 혼성화 탐침으로 사용하여 임의의 목적하는 효모 라이브러리를 당업자에게 주지된 방법론으로 스크리닝함으로써, 본 명세서에 기술된 GCN 유전자와 유사한 단백질 또는 폴리펩티드를 암호화하는 유전자를 직접 분리할 수 있다. 개시된 핵산 서열에 기초한 특이적 올리고뉴클레오티드 탐침은 당업계에 공지된 방법(Maniatis, supra)에 의해 고안되고 합성될 수 있다. 또한, 전체 서열을 직접 사용하여, 당업자에게 공지된 방법(예를 들어 무작위 프라이머 DNA 표지화(random primers DNA labeling), 새김눈 번역(nick translation) 또는 종단 표지화(end-labeling) 기술)에 의해 DNA 탐침을 합성하거나, 이용가능한 시험관내 전사 시스템을 사용하여 RNA 탐침을 합성할 수 있다. 또한, 특이적 프라이머를 고안하고 사용하여 본 서열의 일부(또는 전체 길이)를 증폭할 수 있다. 생성된 증폭 산물을 증폭 반응중에 직접 표지화하거나 증폭 반응후에 표지화하여, 적절한 엄격성 조건하에 전체 길이 DNA 단편을 분리하기 위한 탐침으로 사용할 수 있다. 문헌(Paluh et al., ibid.)에 기술된 GCN 기능에 대한 상보성 선택(complementation selection)에 의해 설명되는 바와 같이 기능적 선택을 사용하여 이종 유전자도 동정할 수 있다.
통상적으로, PCR 유형의 증폭 기술에서는 프라이머들이 상이한 서열을 가지며 서로에 대해 상보적이지 않다. 목적하는 시험 조건에 따라, 표적 핵산의 효율적이면서도 충실한 복제를 제공하도록 프라이머의 서열을 고안해야 한다. PCR 프라이머 고안 방법은 일반적인 것으로서 당업계에 주지되어 있다(Thein and Wallace, "The use of oligonucleotides as specific hybridization probes in the Diagnosis of Genetic Disorders", in Human Genetic Diseases: A Practical Approach, K. E. Davis Ed., (1986) pp 33-50, IRL: Herndon, VA; 및 Rychlik, W., In Methods in Molecular Biology, White, B. A. Ed., (1993) Vol. 15, pp 31-39, PCR Protocols: Current Methods and Applications. Humania: Totowa, NJ).
일반적으로, 기술된 서열의 2 개 짧은 분절을 중합효소 연쇄반응 프로토콜에 사용하여 DNA 또는 RNA로부터 상동 유전자를 암호화하는 더 긴 핵산 단편을 증폭할 수 있다. 중합효소 연쇄반응을 클로닝된 핵산 단편의 라이브러리 상에서 수행할 수도 있으며, 여기에서 한 프라이머의 서열은 기술된 핵산 단편으로부터 유래되고, 다른 프라이머의 서열은 미생물 유전자를 암호화하는 mRNA 전구체의 3' 말단의 폴리아데닐산 구역의 존재를 이용한다.
대안적으로, 제2 프라이머 서열은 클로닝 벡터로부터 유래된 서열에 기초할 수 있다. 예를 들어, 당업자는 전사체 내의 단일 지점 및 3' 또는 5' 말단 사이의 영역의 카피를 증폭하는 PCR을 이용함으로써 RACE 프로토콜(Frohman et al., PNAS USA 85:8998 (1988))에 따라 cDNA를 생성시킬 수 있다. 본 서열로부터 3' 및 5' 방향으로 배향된 프라이머를 고안할 수 있다. 상업적으로 이용가능한 3' RACE 또는 5' RACE 시스템(예를 들어, 메릴랜드주 게이더스버그 소재의 BRL)을 사용하여 특이적 3' 또는 5' cDNA 단편을 분리할 수 있다(Ohara et al., PNAS USA 86:5673 (1989); Loh et al., Science 243:217 (1989)).
대안적으로, 상동체의 동정을 위한 혼성화 시약으로서, 기술된 GCN 서열을 채용할 수 있다. 핵산 혼성화 시험의 기본 구성요소는 탐침, 관심의 대상인 유전자 또는 유전자 단편을 함유하는 것으로 추정되는 시료, 및 특이적 혼성화 방법을 포함한다. 통상적으로 탐침은, 검출하고자 하는 핵산 서열에 상보적인 단일-가닥 핵산 서열이다. 탐침은 검출하고자 하는 핵산 서열에 "혼성가능"하다. 탐침의 길이는 5 염기 내지 수만 염기 범위에서 변동될 수 있으며, 실행하고자 하는 구체적 시험에 의존한다. 통상적으로 약 15 염기 내지 약 30 염기의 탐침 길이가 적합하다. 검출하고자 하는 핵산 서열에는 탐침 분자의 일부만이 상보적일 필요가 있다. 또한, 탐침 및 표적 서열 사이의 상보성이 완벽할 필요는 없다. 불완전하게 상보적인 분자 사이에도 혼성화가 일어나며, 이 경우에 혼성화 영역 내의 어떤 분획의 염기들은 적절한 상보적 염기와 대합하지 않는다.
혼성화 방법은 잘 정립되어 있다. 통상적으로, 핵산 혼성화가 가능한 조건하에 탐침 및 시료를 혼합해야 한다. 이는 적절한 농도 및 온도 조건하에 무기 또는 유기염의 존재하에 탐침 및 시료를 접촉시킴을 포함한다. 탐침 및 시료 핵산 사이에 임의의 가능한 혼성화가 일어날 수 있도록 충분히 긴 시간 동안 탐침 및 시료 핵산을 접촉시켜야 한다. 혼합물 내의 탐침 또는 표적의 농도는 혼성화가 일어나기 위해 필요한 시간을 결정한다. 탐침 또는 표적의 농도가 높을수록, 필요한 혼성화 인큐베이션 시간은 짧아진다. 임의로, 무질서 유발제(chaotropic agent)를 첨가할 수 있다. 무질서 유발제는 뉴클레아제 활성을 저해함으로써 핵산을 안정화시킨다. 또한, 무질서 유발제는 짧은 올리고뉴클레오티드 탐침의 민감하고 엄격한 혼성화를 실온에서 가능하게 한다(Van Ness and Chen, Nucl. Acids Res. 19:5143-5151 (1991)). 적합한 무질서 유발제는 특히, 구아니디늄 클로라이드, 구아니디늄 티오시아네이트, 소듐 티오시아네이트, 리튬 테트라클로로아세테이트, 소듐 퍼클로레이트, 루비듐 테트라클로로아세테이트, 포타슘 요오다이드 및 세슘 트라이플루오로아세테이트를 포함한다. 통상적으로, 무질서 유발제는 약 3 M의 최종 농도로 존재한다. 필요한 경우, 혼성화 혼합물에 포름아미드를 통상 30-50%(v/v)로 첨가할 수 있다.
다양한 혼성화 용액을 채용할 수 있다. 통상적으로, 이들은 약 20 내지 60 부피%, 바람직하게는 30%의 극성 유기용매를 함유한다. 일반적인 혼성화 용액은 약 30-50% v/v 포름아미드, 약 0.15 내지 1 M 소듐 클로라이드, 약 0.05 내지 0.1 M 완충제(예를 들어, 소듐 시트레이트, 트리스-HCl, PIPES 또는 HEPES(약 6-9의 pH 범위)), 약 0.05 내지 0.2% 세제(detergent)(예를 들어, 소듐 도데실설페이트), 또는 0.5-20 mM 범위의 EDTA, FICOLL(파마시아 인코포레이티드(Pharmacia Inc.))(약 300-500 kdal), 폴리비닐피롤리돈(약 250-500 kdal) 및 혈청 알부민을 채용한다. 통상적인 혼성화 용액에는, 약 0.1 내지 5 ㎎/㎖의 표지되지 않은 담체 핵산, 단편화된 핵 DNA(예를 들어, 송아지 흉선 또는 연어 정자 DNA, 또는 효모 RNA), 및 임의로 약 0.5 내지 2% wt/vol 글리신도 포함된다. 다양한 극성 수용성 또는 팽윤성 약제(예를 들어, 폴리에틸렌 글리콜), 음이온성 중합체(예를 들어, 폴리아크릴레이트 또는 폴리메틸아크릴레이트) 및 음이온성 당류 중합체(saccharidic polymer)(예를 들어, 덱스트란 설페이트)를 포함하는 부피 배제 약제(volume exclusion agent)와 같은 다른 첨가제도 포함될 수 있다.
핵산 혼성화는 다양한 에세이 체제에 적응시킬 수 있다. 가장 적합한 것 중의 하나는 샌드위치 에세이(sandwich assay) 체제이다. 샌드위치 에세이는 비변성(non-denaturing) 조건하에서의 혼성화에 특히 적응가능하다. 샌드위치-유형 에세이의 주요 구성요소는 고체 지지체이다. 고체 지지체에는, 서열의 일부에 대해 상보적이고 표지되지 않은 핵산 탐침이 흡착되거나 공유적으로 결합되어 고정화된다.
대안적으로, GCN 서열이 주지되어 있고 진균 게놈의 서열분석이 보편화되어 있으므로(10 개는 완성되고, 다른 71 개에는 전체 게놈 산탄식 접근방법(whole genome shotgun approach)을 적용하여 취합중에 있으며, 다른 42 개는 진행중임), 당업자에게 주지된 생물정보학적 접근방법만을 사용하여 서열 유사성을 기초로 적합한 GCN 시스템 표적 유전자를 동정할 수 있다.
부탄올 내성을 위한 효모 내의 일반 제어 반응 유전자의 유전적 개질
표적 유전자의 유전적 개질을 위한 다수의 방법이 당업자에게 공지되어 있으며, 본 발명의 효모 균주를 창출하기 위해 사용될 수 있다. 표적 단백질의 발현을 감소시키거나 제거하기 위해 사용될 수 있는 개질은, Gcnp를 암호화하는 유전자의 일부 또는 전체 유전자를 결실시키는 개질, 단백질이 발현되지 않거나 낮은 수준으로 발현되도록 GCN 유전자 내에(프로모터 또는 코딩 영역 내에) DNA 단편을 삽입하는 개질, 기능성 단백질이 발현되지 않도록 정지 코돈 또는 해독틀 이동(frame shift)을 가하는 돌연변이를 GCn 코딩 영역에 도입하는 개질, 및 비기능성 또는 효소 활성이 낮은 단백질이 발현되도록 아미노산을 변경하는 하나 이상의 돌연변이를 GCN 코딩 영역에 도입하는 개질을 포함하나 이에 한정되지 않는 교란(disruption)이다. 또한, GCN 유전자의 발현은 안티센스 RNA 또는 간섭 RNA의 발현에 의해 차단될 수 있으며, 동시억제(cosuppression)를 유발하는 작제물을 도입할 수 있다. 또한, 풍부한 코돈을 희귀 코돈으로 치환하여 발현을 감소시킨 GCN 유전자를 합성하고, 상응하는 내인성 GCN 유전자를 이 유전자로 치환할 수 있다. 이러한 유전자는 동일한 폴리펩티드를 낮은 속도로 생산한다. 또한, 전사체의 합성 또는 안정성은 돌연변이에 의해 저감될 수 있다. 마찬가지로, mRNA로부터 단백질이 번역되는 효율을 돌연변이에 의해 조정할 수 있다. 당업자는 Gcn 단백질을 암호화하는 공지 서열을 이용하여 이들 방법 모두를 용이하게 실행할 수 있다. 효모 GCN 서열은 공중에게 이용가능하며, 대표적인 서열들을 표 4에 열거한다. 당업자는 부탄올 내성을 증가시키기 위한 목적으로 GCN 유전자의 발현을 제거하거나 감소시키는 구체적인 개질 전략을 선택할 수 있다.
일부 개질 과정에서는 GCN 코딩 서열을 둘러싼 DNA 서열도 유용하며, NCBI(국립생물공학정보센터)가 주관한 게놈 프로젝트의 게놈 프로젝트 ID9518에 의해 편성된 완전 게놈 서열에서 고유번호 GOPID #13838로 사카로마이세스 세레비시아와 같은 효모에 대해 이용가능하다. 효모 게놈 서열의 부가적 예는 야로위아 리폴리티카, GOPIC #13837, 및 GPID #10771, #10701 및 #16373으로 포함된 칸디다 알비칸스의 서열을 포함한다. 공중에게 이용가능한 데이터베이스에서 당업자는 다른 효모 게놈 서열들을 용이하게 발견할 수 있다.
특히, GCN 코딩 서열을 둘러싼 DNA 서열은 상동성 재조합을 사용하는 개질 방법에 있어서 유용하다. 예를 들어, 이 방법에서 GCN 유전자 양 옆의 서열들은 선택가능한 표지자 유전자와 경계를 이루며 위치하여, 표지자 유전자가 GCN 유전자를 대체하는 상동성 재조합을 매개한다. 또한, 부분적 GCN 유전자 서열, 및 선택가능한 표지자 유전자와 경계를 이루는 GCN 양 옆의 서열을 사용하여, 표지자 유전자가 표적 GCN 유전자의 일부를 대체하는 상동성 재조합을 매개할 수 있다. 부가적으로, 선택가능한 표지자가 부위-특이적 재조합 부위와 경계를 이룸으로써, 상응하는 부위-특이적 재조합효소의 발현에 이어서 내성 유전자가 GCN 유전자로부터 삭제되어 후자를 재활성화시키지 못한다. 부위-특이적 재조합의 결과로서, Gcn 단백질의 발현을 방해하는 재조합 부위가 생성된다. 당업자에게 주지된 바와 같이, 상동성 재조합 벡터를 작제함으로써, 선택가능한 표지자의 삭제 후에 GCN 유전자에 결실이 생기게 할 수도 있다.
유사분열 재조합(mitotic recombination)을 사용하여 결실이 생기게 할 수 있다(Wach et al. (1994) Yeast 10:1793-1808). 이 방법은, 표적 DNA 서열과 경계를 이루며 20 bp만큼 짧을 수 있는 선택가능한 표지자를 게놈 영역 사이에 포함하는 DNA 단편의 제조에 관한 것이다. 표지자 유전자의 말단에 혼성화되고 효모 게놈에 재결합할 수 있는 게놈 영역을 포함하는 올리고뉴클레오티드를 프라이머로 사용하여, 선택가능한 표지자 유전자의 PCR 증폭에 의해 이 DNA 단편을 제조할 수 있다. 선형의 DNA 단편은 효모 내에 효율적으로 형질전환되고 게놈 내에 재조합됨으로써, 표적 DNA 서열의 결실을 포함하는 유전자 대체를 유발한다(Methods in Enzymology, v194, pp 281-301 (1991)).
또한, 프로모터 대체 방법을 사용하여 내인성 전사 제어 요소를 교체함으로써 문헌(Mnaimneh et al. (2004) Cell 118(1):31-44)에 기술된 바와 같이 발현을 조정하는 또 다른 수단을 가능하게 할 수 있다.
본 발명의 개질된 효모 균주의 부탄올 내성
아미노산 기아에 대한 일반 제어 반응에 있어서 반응이 감소되도록 유전적으로 개질된 본 발명의 효모 균주에서는 부탄올에 대한 내성이 개선된다. 반응이 감소된 균주의 내성은, 모균주(유전적 개질 전의)의 성장에 해로운 부탄올 농도에서 그들의 성장을 에세이함으로써 평가할 수 있다. 개선된 내성은 1-부탄올, 아이소부탄올 및 2-부탄올을 포함하는 부탄올 화합물에 대한 것이다. 저해 화학물질 및 그의 농도, 성장 조건, 성장 기간 및 유전적으로 개질된 구체적 균주에 따라 관찰된 내성의 크기가 달라질 것이다. 예를 들어, 본 명세서의 실시예 1에 나타낸 바와 같이, 히스티딘 및 류신 이외의 아미노산이 결여된 배지 내에서 8 시간 동안 1% - 2%의 아이소부탄올 내에서의 성장에 있어서 개선된 내성이 관찰되었다. 이 배지에서 세포는, 히스티딘 및 류신을 함유하는 완전 배지(rich medium)의 경우에 비해 더 많은 생합성 요구량을 가진다. 본 발명의 효모 균주의 개선된 부탄올 내성을 입증하기 위한 다른 조건은, 생합성 요구량이 완전 배지 조건에서보다 높은 조건, 예를 들어 다른 아미노산, 뉴클레오티드 또는 지방산과 같은 임의의 대사 산물의 결여를 포함한다. 부가적으로 저해제의 존재, 삼투 불균형(osmotic imbalance) 또는 다른 비이상적 성장 조건은, 개선된 부탄올 내성을 입증하기 위한 조건을 제공할 수 있다.
부탄올 생합성 경로
본 발명에서는, 상기한 바와 같이, 부탄올 생합성 경로가 발현되도록 조작된 효모 세포에 증가된 부탄올 내성을 부여하는 유전적 개질을 조작하였다. 각 유전적 개질은 다른 것에 앞서 일어날 수 있다.
부탄올 생합성 경로는 1-부탄올, 2-부탄올, 또는 아이소부탄올 생합성 경로일 수 있다. 증가된 부탄올 내성을 위한 아미노산 기아에 대한 일반 제어 반응의 개질 및 부탄올의 생산에 있어서 특히 적합한 효모 숙주는 사카로마이세스, 칸디다, 한세눌라 및 야로위아 속의 구성원들을 포함하나 이에 한정되지 않는다. 바람직한 숙주는 사카로마이세스 세레비시아, 칸디다 알비칸스 및 야로위아 리폴리티카를 포함한다.
1-부탄올 생합성 경로
1-부탄올을 생산하는 생합성 경로는, 원용에 의해 본 명세서에 포함된 동시계류중이며 공유인 미국 특허출원공개 제0080182308호(Donaldson et al.)에 기술되어 있다. 이 생합성 경로는 하기와 같은 기질로부터 산물로의 전환을 포함한다:
a) 예를 들어, 서열번호 1, 3 또는 39로 제공된 유전자에 의해 암호화되는 서열번호 2, 4 또는 40과 같은 단백질 서열을 가진 아세틸-CoA 아세틸트랜스페라제가 촉매하는, 아세틸-CoA로부터 아세토아세틸-CoA로의 전환;
b) 예를 들어, 서열번호 5로 제공된 유전자에 의해 암호화되는 서열번호 6과 같은 단백질 서열을 가진 3-하이드록시부티릴-CoA 데하이드로게나제가 촉매하는, 아세토아세틸-CoA로부터 3-하이드록시부티릴-CoA로의 전환;
c) 예를 들어, 서열번호 7로 제공된 유전자에 의해 암호화되는 서열번호 8과 같은 단백질 서열을 가진 크로토나제가 촉매하는 3-하이드록시부티릴-CoA로부터 크로토닐-CoA로의 전환;
d) 예를 들어, 서열번호 9로 제공된 유전자에 의해 암호화되는 서열번호 10과 같은 단백질 서열을 가진 부티릴-CoA 데하이드로게나제가 촉매하는, 크로토닐-CoA로부터 부티릴-CoA로의 전환;
e) 예를 들어, 서열번호 11로 제공된 유전자에 의해 암호화되는 서열번호 12와 같은 단백질 서열을 가진 부티르알데히드 데하이드로게나제가 촉매하는, 부티릴-CoA로부터 부티르알데히드로의 전환; 및
f) 예를 들어, 서열번호 13 또는 15로 제공된 유전자에 의해 암호화되는 서열번호 14 또는 16과 같은 단백질 서열을 가진 1-부탄올 데하이드로게나제가 촉매하는, 부티르알데히드로부터 1-부탄올로의 전환.
이 경로는 ATP를 필요로 하지 않으며 NAD+ 및/또는 NADP+를 생성시키므로, 이는 아세틸-CoA를 생성시키는 중심적 대사 경로와 균형을 이룬다.
2-부탄올 생합성 경로
2-부탄올을 생산하는 생합성 경로는, 각각 원용에 의해 본 명세서에 포함된 동시계류중이며 공유인 미국 특허출원공개 제20070259410호 및 제20070292927호(Donaldson et al.)에 기술되어 있다. 2-부탄올 생합성의 한가지 경로는 하기와 같은 기질로부터 산물로의 전환을 포함한다:
a) 예를 들어, 서열번호 19로 제공된 유전자에 의해 암호화되는 서열번호 20과 같은 단백질 서열을 가진 아세토락테이트 신타제가 촉매하는, 파이루베이트로부터 알파-아세토락테이트로의 전환;
b) 예를 들어, 서열번호 17로 제공된 유전자에 의해 암호화되는 서열번호 18과 같은 단백질 서열을 가진 아세토락테이트 데카복실라제가 촉매하는, 알파-아세토락테이트로부터 아세토인으로의 전환;
c) 예를 들어, 서열번호 21로 제공된 유전자에 의해 암호화되는 서열번호 22와 같은 단백질 서열을 가진 부탄다이올 데하이드로게나제가 촉매하는, 아세토인으로부터 2,3-부탄다이올로의 전환;
d) 예를 들어, 서열번호 23, 25, 또는 27로 제공된 유전자에 의해 암호화되는 서열번호 24, 26, 또는 28과 같은 단백질 서열을 가진 부탄다이올 데하이드라타제가 촉매하는, 2,3-부탄다이올로부터 2-부타논으로의 전환; 및
e) 예를 들어, 서열번호 29로 제공된 유전자에 의해 암호화되는 서열번호 30과 같은 단백질 서열을 가진 2-부탄올 데하이드로게나제가 촉매하는, 2-부타논으로부터 2-부탄올로의 전환.
아이소부탄올 생합성 경로
아이소부탄올을 생산하는 생합성 경로는, 원용에 의해 본 명세서에 포함된 동시계류중이며 공유인 미국 특허출원공개 제20070092957호(Maggio-Hall et al.)에 기술되어 있다. 아이소부탄올 생합성의 한가지 경로는 하기와 같은 기질로부터 산물로의 전환을 포함한다:
a) 예를 들어, 서열번호 19 또는 41로 제공된 유전자에 의해 암호화되는 서열번호 20 또는 42와 같은 단백질 서열을 가진 아세토락테이트 신타제가 촉매하는, 파이루베이트로부터 아세토락테이트로의 전환;
b) 예를 들어, 서열번호 31, 43 또는 45로 제공된 유전자에 의해 암호화되는 서열번호 32, 44 또는 46과 같은 단백질 서열을 가진 아세토하이드록시산 아이소머로리덕타제가 촉매하는, 아세토락테이트로부터 2,3-다이하이드록시아이소발레레이트로의 전환;
c) 예를 들어, 서열번호 33으로 제공된 유전자에 의해 암호화되는 서열번호 34와 같은 단백질 서열을 가진 아세토하이드록시산 데하이드라타제; 또는 서열번호 47로 제공된 유전자에 의해 암호화되는 서열번호 48과 같은 단백질 서열을 가진 다이하이드록시산 데하이드라타제가 촉매하는, 2,3-다이하이드록시아이소발레레이트로부터 α-케토아이소발레레이트로의 전환;
d) 예를 들어, 서열번호 35로 제공된 유전자에 의해 암호화되는 서열번호 36과 같은 단백질 서열을 가진 분지쇄 케토산 데카복실라제가 촉매하는, α-케토아이소발레레이트로부터 아이소부티르알데히드로의 전환; 및
e) 예를 들어, 서열번호 37로 제공된 유전자에 의해 암호화되는 서열번호 38과 같은 단백질 서열을 가진 분지쇄 알코올 데하이드로게나제가 촉매하는, 아이소부티르알데히드로부터 아이소부탄올로의 전환.
부탄올을 생산하는 효모 균주의 작제
본 명세서에 기술된 바와 같이 부탄올 내성을 위해 유전적으로 개질된 임의의 효모 균주는, 부가적으로 부탄올 생합성 경로가 혼입되도록 당업자에게 주지된 방법에 의해 유전적으로 개질된다(내성을 위한 개질 전 또는 후에). 당업자에게 주지되고 상기 기술된 것들과 같은 통상적으로 사용되는 방법에 의해 동정되고 수득될 수 있는 상기의 효소 활성을 암호화하는 유전자 또는 상동체를 효모 숙주 내에 도입한다. 사용할 수 있는 경로 효소에 대한 대표적인 코딩 및 아미노산 서열들이 표 1, 2 및 3에 서열번호 1-48로 제공된다.
효모에서의 유전자 발현 방법은 당업계에 공지되어 있다; 구체적으로, 형질전환, 세포 성장, 유전자 발현, 갭 수선 재조합(gap repair recombination) 등을 포함하는 기초적 효모 분자생물학 프로토콜은 문헌(Methods in Enzymology, Volume 194, Guide to Yeast Genetics and Molecular and Cell Biology, Part A, 2004, Christine Guthrie and Gerald R. Fink (Eds.), Elsevier Academic Press, San Diego, CA)에 기술되어 있다. 효모에서의 유전자 발현은 통상적으로 프로모터, 그 뒤에 이어진 관심의 대상인 코딩 영역, 및 전사 터미네이터(terminator)를 필요로 하며, 이들 모두는 작동적으로 연결되어 발현 카세트를 제공한다. 구성성 프로모터 FBA, GPD 및 GPM, 및 유도성 프로모터 GAL1, GAL10 및 CUP1을 포함하나 이에 한정되지 않는 다수의 효모 프로모터를 사용하여, 부탄올 생합성 경로를 암호화하는 유전자의 발현 카세트를 작제할 수 있다. 적합한 전사 터미네이터는 FBAt, GPDt, GPMt, ERG10t 및 GAL1t를 포함하나 이에 한정되지 않는다. 예를 들어, 실시예 2에 기술된 바와 같이, 적합한 프로모터, 전사 터미네이터, 및 1-부탄올 또는 아이소부탄올 생합성 경로의 유전자를 이. 콜라이-효모 셔틀 벡터에 클로닝할 수 있다.
효모에서 통상적으로 사용되는 플라스미드는 셔틀 벡터 pRS423, pRS424, pRS425 및 pRS426 (메릴랜드주 락빌 소재의 아메리칸 타입 컬쳐 콜렉션(American Type Culture Collection))으로서, 이들은 이. 콜라이 복제 기원(예를 들어, pMB1), 효모 2μ 복제 기원, 및 영양 선택(nutritional selection)을 위한 표지자를 포함한다. 이들 4 가지 벡터를 위한 선택 표지자는 His3(벡터 pRS423), Trp1 (벡터 pRS424), Leu2 (벡터 pRS425) 및 Ura3 (벡터 pRS426)이다. 이들 벡터는 이. 콜라이 및 효모 균주 모두에서 균주 증식을 허용한다. 유전자 클로닝 및 발현을 위한 통상적 숙주는 효모 반수체(haploid) 균주 BY4741(MAT a his3 Δ1 leu2 Δ0 met15 Δ0 ura3 Δ0) (알라바마주 헌츠빌 소재의 리서치 제네틱스(Research Genetics), 또한 ATCC 201388로부터 이용가능함) 및 배수체(diploid) 균주 BY4743(MATa/alpha his3Δ1/his3Δ1 leu2Δ0/leu2Δ0 lys2Δ0/LYS2 MET15/met15Δ0 ura3Δ0/ura3Δ0) (알라바마주 헌츠빌 소재의 리서치 제네틱스, 또한 ATCC 201390으로부터 이용가능함)을 포함한다. 이. 콜라이에서의 표준 분자 클로닝 기술 또는 효모에서의 갭 수선 재조합 방법에 의해, 부탄올 생합성 경로 효소를 암호화하는 유전자를 위한 발현 벡터를 작제할 수 있다.
갭 수선 클로닝 접근방법은 효모에서의 고효율 상동성 재조합을 이용한다. 통상적으로, 효모 벡터 DNA를 분해하여(예를 들어, 그의 다중 클로닝 부위에서) 그의 서열 내에 "갭"을 만든다. 서로, 및 벡터 DNA의 5' 및 3' 말단과 서열상 중복되는 ≥ 21 bp 서열을 5' 및 3' 말단 모두에 포함하는, 관심의 대상인 다수의 삽입 DNA가 생성된다. 예를 들어, "유전자 X'를 위한 효모 발현 벡터를 작제하기 위해서는, 발현 카세트를 위한 효모 프로모터 및 효모 터미네이터를 선택한다. 프로모터 및 터미네이터는 효모 게놈 DNA로부터 증폭되고, 유전자 X는 그의 공급원 유기체로부터 PCR 증폭되거나 유전자 X 서열을 포함하는 클로닝 벡터로부터 수득된다. 선형화된 벡터의 5' 말단 및 프로모터 서열의 사이, 프로모터 및 유전자 X의 사이, 유전자 X 및 터미네이터 서열의 사이, 및 터미네이터 및 선형화된 벡터의 3' 말단 사이에는 적어도 21 bp의 중복 서열이 있다. 그 다음에 "갭이 있는" 벡터 및 삽입 DNA를 효모 균주에 동시-형질전환시키고, 플라스미드상의 영양 선택 표지자의 상보성을 허용하는 적절한 화합물 혼합물을 함유하는 배지상에 평판배양한다. 선택된 세포로부터 제조된 플라스미드 DNA를 사용하는 PCR 맵핑에 의해 정확한 삽입 조합의 존재를 확인할 수 있다. 그 다음에는, 효모로부터 분리된 플라스미드 DNA(통상적으로 농도가 낮음)를 이. 콜라이 균주, 예를 들어, TOP10에 형질전환시킨 후, 미니 프렙(mini prep) 및 제한효소 맵핑(restriction mapping)으로 플라스미드 작제물을 추가로 확인할 수 있다. 마지막으로, 서열 분석에 의해 작제물을 확인할 수 있다. 양성 플라스미드의 효모 형질전환체를 성장시켜, 관심의 대상인 유전자에 의해 발현되는 효소들의 활성을 조사하는 효소 에세이를 수행한다.
발효 배지
본 발명의 발효 배지는 적합한 탄소 기질을 함유해야 한다. 적합한 기질은 단당류, 예를 들어 포도당 및 과당, 올리고당류, 예를 들어 락토스 또는 수크로스, 다당류, 예를 들어 전분 또는 셀룰로오스 또는 그 혼합물 및 재생가능한 원료로부터의 미정제 혼합물, 예를 들어 유청 투과액, 옥수수 침지수, 사탕무우 당밀 및 보리 맥아를 포함할 수 있으나 이에 한정되지 않는다. 또한, 탄소 기질은 1-탄소 기질, 예를 들어, 이산화탄소, 또는 중요 생화학적 중간체로의 대사적 전환이 입증된 메탄올일 수도 있다. 메탄올 자화유기체(methylotrophic organism)는 또한, 1 탄소 및 2 탄소 기질에 부가하여 다수의 다른 탄소 함유 화합물, 예를 들어 메틸아민, 글루코사민 및 다양한 아미노산을 대사 활성에 이용하는 것으로 공지되어 있다. 예를 들어, 메탄올 자화효모는 메틸아민으로부터의 탄소를 이용하여 트레할로스 또는 글리세롤을 형성하는 것으로 공지되어 있다(Bellion et al., Microb. Growth C1 Compd., [Int. Symp.], 7th (1993), 415-32. Editor(s): Murrell, J. Collin; Kelly, Don P. Publisher: Intercept, Andover, UK). 마찬가지로, 다양한 종의 칸디다는 알라닌 또는 올레산을 대사작용한다(Sulter et al., Arch. Microbiol. 153:485-489 (1990)). 그러므로, 본 발명에 이용되는 탄소 공급원은 광범위한 탄소 함유 기질을 포함할 수 있으며 유기체의 선택에 의해서만 한정되는 것으로 생각된다.
상기 언급한 탄소 기질 및 그 혼합물 모두가 본 발명에 적합한 것으로 생각되지만, 바람직한 탄소 기질은 포도당, 과당 및 수크로스이다.
적절한 탄소 공급원에 부가하여, 발효 배지는 적합한 무기물, 염, 보조인자, 완충제, 및 배양물의 성장 및 부탄올 생산에 필요한 효소 경로의 촉진에 적합한, 당업자에게 공지된 다른 성분들을 함유해야 한다.
배양 조건
통상적으로 세포는 약 20℃ 내지 약 37℃ 범위의 온도에서 적절한 배지 내에 성장시킨다. 본 발명에서 적합한 성장 배지는, 효모 질소 베이스(yeast nitrogen base), 암모늄 설페이트, 및 탄소/에너지 공급원으로서의 덱스트로스를 포함하는 브로스(broth) 또는 대부분의 사카로마이세스 세레비시아 균주의 성장을 위한 최적 비율로 펩톤, 효모 추출물 및 덱스트로스를 블렌딩한 YPD 배지와 같이 상업적으로 제조된 통상적인 배지이다. 그밖에 정의되거나 합성된 성장 배지도 사용할 수 있으며, 특정 미생물의 성장에 적절한 배지는 미생물학 또는 발효과학 분야의 당업자에게 공지되어 있다.
발효에 있어서 적합한 pH 범위는 pH 3.0 내지 pH 7.5이며, 여기서 초기 조건으로서 바람직한 범위는 pH 4.5.0 내지 pH 6.5 이다.
발효는 유산소 또는 무산소 조건하에서 수행될 수 있으며, 여기서 유산소 또는 미량산소(microaerobic) 조건이 바람직하다.
당업계에 공지된 다수의 방법, 예를 들어, 고속액체 크로마토그래피(HPLC: high performance liquid chromatography) 또는 기체 크로마토그래피(GC: gas chromatography)를 사용하여 발효 배지 내에 생성된 부탄올의 양을 결정할 수 있다.
발효 배지로부터 부탄올을 분리하는 방법
생물생산된 부탄올은 당업계에 공지된 방법을 사용하여 발효 배지로부터 분리할 수 있다. 예를 들어, 원심분리, 여과, 경사분리(decantation) 등에 의해 발효 배지로부터 고체를 제거할 수 있다. 그 다음에, 증류, 액-액 추출 또는 막-기제의 분리와 같은 방법을 사용하여, 상기와 같이 고체를 제거하기 위해 처리한 발효 배지로부터 부탄올을 분리할 수 있다. 부탄올과 물은 비등점이 낮은 공비 혼합물(azeotropic mixture)을 형성하므로, 증류를 이용하면 혼합물을 그의 공비 조성까지만 분리할 수 있다. 다른 분리 방법과 조합하여 증류를 사용하여 공비점 부근의 분리를 달성할 수 있다. 부탄올의 분리 및 정제를 위하여 증류와 조합하여 사용할 수 있는 방법은 경사분리, 액-액 추출, 흡착 및 막-기제의 기술을 포함하나 이에 한정되지 않는다. 또한, 동반물질(entrainer)을 사용하는 공비 증류를 이용하여 부탄올을 분리할 수 있다(예를 들어, Doherty and Malone, Conceptual Design of Distillation Systems, McGraw Hill, New York, 2001).
부탄올-물 혼합물은 불균질 공비 혼합물을 형성하므로, 경사분리와 조합하여 증류를 이용함으로써 부탄올을 분리 정제할 수 있다. 이 방법에서는 부탄올을 함유하는 발효 브로스를 공비 조성 부근까지 증류한다. 그 다음에, 공비 혼합물을 응축시키고 경사분리에 의해 발효 배지로부터 부탄올을 분리한다. 경사분리된 수성상은 제1 증류 컬럼에 환류되어 돌아갈 수 있다. 부탄올이 풍부한 경사분리 유기상을 제2 증류 컬럼에서 증류에 의해 추가로 정제할 수 있다.
증류와 조합한 액-액 추출을 사용하여 발효 배지로부터 부탄올을 분리할 수도 있다. 이 방법에서는 적합한 용매로 액-액 추출하여 발효 브로스로부터 부탄올을 추출한다. 그 후에 부탄올-함유 유기상을 증류하여 용매로부터 부탄올을 분리한다.
흡착과 조합한 증류를 사용하여 발효 배지로부터 부탄올을 분리할 수도 있다. 이 방법에서는, 부탄올을 함유하는 발효 브로스를 공비 조성 부근까지 증류한 후에 분자체와 같은 흡착제를 사용하여 잔류하는 물을 제거한다(Aden et al. Lignocellulosic Biomass to Ethanol Process Design and Economics Utilizing Co-Current Dilute Acid Prehydrolysis and Enzymatic Hydrolysis for Corn Stover, Report NREL/TP-510-32438, National Renewable Energy Laboratory, June 2002).
또한, 투과증발(pervaporation)과 조합한 증류를 사용하여 발효 배지로부터 부탄올을 분리 정제할 수도 있다. 이 방법에서는, 부탄올을 함유하는 발효 브로스를 공비 조성 부근까지 증류한 후에 친수성 막을 통한 투과증발에 의해 잔류하는 물을 제거한다(Guo et al., J. Membr. Sci. 245, 199-210 (2004)).
실시예
본 발명은 하기 실시예에서 추가로 정의된다. 이들 실시예는 본 발명의 바람직한 구현예를 나타내는 한편, 단지 예시로 주어짐을 이해해야 한다. 당업자라면, 상기 논의 및 이러한 실시예로부터 본 발명의 본질적인 특징을 확인할 수 있으며, 본 발명의 사상 및 범주를 벗어나지 않고서도 본 발명을 다양하게 변경하고 수정하여 본 발명을 다양한 용도 및 조건에 적합하게 할 수 있다.
일반 방법
본 실시예들에서 사용된 표준 재조합 DNA 및 분자 클로닝 기술은 당업계에 주지된 것으로서 문헌(Sambrook, J., Fritsch, E. F. and Maniatis, T. Molecular Cloning: A Laboratory Manual; Cold Spring Harbor Laboratory Press: Cold Spring Harbor, NY (1989) (Maniatis); 및 T. J. Silhavy, M. L. Bennan, and L. W. Enquist, Experiments with Gene Fusions, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (1984); 및 Ausubel, F. M. et al., Current Protocols in Molecular Biology, pub. by Greene Publishing Assoc. and Wiley-Interscience (1987))에 기술되어 있다.
박테리아 배양물의 유지 및 성장을 위해 적합한 재료 및 방법은 당업계에 주지되어 있다. 하기 실시예에서 사용하기에 적합한 기술들은 문헌(Manual of Methods for General Bacteriology, Phillipp Gerhardt, R. G. E. Murray, Ralph N. Costilow, Eugene W. Nester, Willis A. Wood, Noel R. Krieg and G. Briggs Phillips, eds, American Society for Microbiology, Washington, DC. (1994); 또는 Thomas D. Brock, Biotechnology: A Textbook of Industrial Microbiology, Second Edition, Sinauer Associates, Inc., Sunderland, MA (1989))에 정리된 바와 같이 찾을 수 있다. 다르게 특정하지 않는 한, 박테리아 세포의 성장 및 유지를 위해 사용된 모든 시약, 제한효소 및 재료는 알드리치 케미컬즈(Aldrich Chemicals)(위스콘신주 밀워키 소재), BD 다이아그노스틱 시스템즈(BD Diagnostic Systems)(메릴랜드주 스파크 소재), 라이프 테크놀로지스(Life Technologies)(메릴랜드주 락빌 소재), 또는 시그마 케미컬 컴퍼니(Sigma Chemical Company)(미주리주 세인트루이스 소재)로부터 입수하였다.
다르게 표시하지 않는 한, 미생물 균주는 버지니아주 메너서스 소재의 아메리칸 타입 컬쳐 콜렉션(ATCC)으로부터 입수하였다.
배양 배지로부터 아이소부탄올 농도를 결정하는 방법
배양 배지 내의 아이소부탄올 농도는 당업계에 공지된 다수의 방법으로 결정할 수 있다. 예를 들어, 구체적인 고속액체 크로마토그래피(HPLC) 방법에서는, 굴절률(RI: refractive index) 검출기와 함께, 워터스 코퍼레이션(Waters Corporation)(메사추세츠주 밀포드 소재)으로부터 구입한 쇼덱스(Shodex) SH-G 가드 컬럼을 동반하는 쇼덱스SH-1011 컬럼을 사용한다. 0.01 M H2SO4를 이동상으로 사용하여 50℃의 컬럼 온도 및 0.5 ㎖/min의 유속으로 크로마토그래피 분리를 수행한다. 기술된 조건하에서 아이소부탄올은 46.6 min의 체류시간을 나타낸다. 대안적으로, 기체 크로마토그래피(GC) 방법이 이용가능하다. 예를 들어, 구체적인 GC 방법에서는 불꽃 이온화 검출기(FID: flame ionization detector)와 함께 HP-이노왁스(INNOWax) 컬럼(30 m x 0.53 ㎜ id,1 ㎛ 필름 두께, 델라웨어주 윌밍톤 소재의 애질런트 테크놀로지스(Agilent Technologies))을 이용한다. 운반 기체로는, 150℃에서 측정할 때 유속이 4.5 ㎖/min인 헬륨을 일정한 헤드 압력(head pressure)으로 사용하고; 주입기 스플릿(injector split)은 200℃에서 1:25이며; 오븐 온도는 45℃에서 1 min, 10℃/min으로 45℃에서 220℃까지 상승, 및 220℃에서 5 min이고; 26 ㎖/min 헬륨 보충 기체를 동반하는 240℃에서의 FID 검출을 채용한다. 아이소부탄올의 체류시간은 4.5 min이다.
약어의 의미는 하기와 같다: "s"는 초(들)를 의미하고, "min"은 분(들)을 의미하며 , "h"는 시간(들)을 의미하고, "psi"는 평방 인치당 파운드를 의미하며, "㎚"는 나노미터를 의미하고, "d"는 일(들)을 의미하며, "㎕"는 마이크로리터(들)를 의미하고, "㎖"는 밀리리터(들)를 의미하며, "L"는 리터(들)를 의미하고, "㎜"는 밀리미터(들)를 의미하며, "㎚"는 나노미터를 의미하고, "mM"은 밀리몰 농도를 의미하며, "㎛"은 마이크로몰 농도를 의미하고, "M"은 몰 농도를 의미하며, "mmol"은 밀리몰(들)을 의미하고, "μmol"은 마이크로몰(들)을 의미하며, "g"은 그램(들)을 의미하고, "㎍"은 마이크로그램(들)을 의미하며 "ng"은 나노그램(들)을 의미하고, "PCR"은 중합효소 연쇄반응을 의미하며, "OD"는 광학 밀도를 의미하고, "OD600"은 600 ㎚의 파장에서 측정한 광학 밀도를 의미하며, "kDa"는 킬로달톤을 의미하고, "g"는 중력 상수를 의미하며, "bp"는 염기쌍(들)을 의미하고, "kbp"는 킬로염기쌍(들)을 의미하며, "% w/v"는 중량/부피 백분율을 의미하고, % v/v"는 부피/부피 백분율을 의미하며, "HPLC"는 고속액체 크로마토그래피를 의미하고, "GC"는 기체 크로마토그래피를 의미한다. 용어 "몰 선택성"은 소모된 당 기질의 몰 당 생성된 산물의 몰 수이며, 백분율로 보고한다.
실시예 1
gcn2 및 gcn4 돌연변이체에서의 부탄올 내성
배수체 a/α 사카로마이세스 세레비시아 균주 BY4743의 GCN2 유전자 및 GCN4 유전자 결실 돌연변이체 (Brachmann et al., Yeast 14:115-132 (1998))는 거의 완전하고 질서있는 결실 균주 콜렉션(nearly complete, ordered deletion strain collection)으로서 이용가능하다(Giaever et al. Nature 418, 387-391 (2002); Saccharomyces Genome Deletion Project). GCN2 유전자 및 GCN4 유전자 결실 돌연변이체 세포를 30℃에서 250 rpm으로 진탕하면서 YPD 또는 YVCM 배지(하기의 제조법) 내의 YPD 플레이트 상에서 14 ㎖ 팔콘(Falcon) 튜브 내에 단일 콜로니로부터 밤새 성장시켰다. 밤새 배양물을 동일한 배지로 1:100 (2 ㎖ 대 200 ㎖) 희석하고, 1 배증(doubling)이 일어날 때까지 60 분마다 성장을 관찰하였다. 그 시점에서 배양물을 25 ㎖ 시료로 나누어 독립적인 125 ㎖ 플라스틱 플라스크에 분주하였다. 양성 대조군으로 사용할 하나의 플라스크를 제외하고 각 배양물의 모든 플라스크에 0.5% 내지 2% w/v 범위의 시험농도(challenging concentration)로 아이소부탄올을 첨가하였다. 대조군 및 시험 배양물을 30℃ 물 중탕조에서 진탕중에 인큐베이션하면서 약 1 시간 기준으로 흡광도를 관찰하였다.
사용된 2 가지의 배지는, 효모 추출물 10 g, 펩톤 20 g, 및 덱스트로스 20 g을 리터당 함유하는 완전 배지 YPD; 및, 아미노산은 없고 암모늄 설페이트가 있는 효모 질소 베이스 6.67g, 덱스트로스 20 g, L-히스티딘 20 ㎎, L-류신 30 ㎎, 우라실 20 ㎎을 리터당 함유하는 정의된 합성 배지 YVCM이었다.
아이소부탄올을 함유하는 YVCM 내에서의 성장에서 8 및 24 hr 시점을 사용하여 분획 성장 수율을 결정하였고 그 결과를 도 1에 제공한다. 합성 배지에서 성장시킨 GCN2 및 GCN4 결실 라인(line)은 모두 모균주에 비해서 8 hr 아이소부탄올 시험에 대한 내성이 대체로 강했다. 누적된 장점은 밤새 인큐베이션 후에 사라졌다. 내성의 증가는 1-2 % 아이소부탄올 농도 범위에 걸쳐 관찰되었다.
아이소부탄올을 함유하는 YPD 내에서의 성장에서 7 및 23 hr 시점을 사용하여 분획 성장 수율을 결정하였고 그 결과를 도 2에 제공한다. 이 조건하에서 짧은 시점에서는 내성의 증가가 관찰되지 않았고, 상이한 아이소부탄올 농도에서의 GCN2 및 GCN4 돌연변이체에서 미약한 개선이 관찰되었다.
실시예 2
사카로마이세스 세레비시아에서 아이소부탄올 경로 유전자의 발현
사카로마이세스 세레비시아에서 아이소부탄올 경로 유전자를 발현시키기 위하여, 다수의 이. 콜라이-효모 셔틀 벡터를 작제하였다. PCR 접근방법(Yu, et al. Fungal Genet. Biol. 41:973-981(2004))을 사용하여 효모 프로모터 및 터미네이터와 유전자를 융합시켰다. 구체적으로, GPD 프로모터(서열번호 76) 및 CYC1 터미네이터(서열번호 77)를 바실러스 서브틸리스의 alsS 유전자(서열번호 41)에 융합시켰고, FBA 프로모터(서열번호 78) 및 CYC1 터미네이터를 에스. 세레비시아의 ILV5 유전자(서열번호 43)에 융합시켰으며 , ADH1 프로모터(서열번호 79) 및 ADH1 터미네이터(서열번호 80)를 에스. 세레비시아의 ILV3 유전자(서열번호 47)에 융합시켰고, GPM 프로모터(서열번호 81) 및 ADH1 터미네이터를 락토코커스 락티스의 kivD 유전자(서열번호 35)에 융합시켰다. 표 5에 제공된 프라이머는 pRS400 계열의 이. 콜라이-효모 셔틀 벡터(Christianson et al. Gene 110:119-122 (1992))에 프로모터/유전자/터미네이터 산물을 클로닝하고 작제물 사이에 프로모터를 교환하기 위한 제한효소 부위를 포함하도록 고안되었다. ILV5 및 ILV3(각각 서열번호 92 및 104로 제공된, 각각 N138 및 N155)의 5' 말단에 대한 프라이머에 의해 새로운 개시 코돈이 생성됨으로써 이들 효소의 미토콘드리아 표적화가 제거되었다.
먼저, TOPO 클로닝 반응(인비트로젠(Invitrogen))에 의해 모든 융합 PCR 산물을 pCR4-블런트(blunt)에 클로닝하고, 표 5에 제공된 서열분석 프라이머 및 M13 정방향 및 역방향 프라이머(인비트로젠)를 사용하여 서열을 확인하였다. 2 개의 부가적 프로모터(CUP1 및 GAL1)를 TOPO 반응에 의해 pCR4-블런트에 클로닝하고 서열분석으로 확인하였다; 프라이머 서열은 표 5에 나타낸다. 작제된 플라스미드는 표 6에 기술한다. 플라스미드를 사카로마이세스 세레비시아 BY4743(ATCC 201390) 또는 YJR148w(ATCC 4036939)에 형질전환시켜 효소 특이적 활성을 평가하였다. 효소 활성을 결정하기 위하여, 발현 플라스미드(들)의 선택을 위해 필요한 임의의 대사산물(들)이 결여된 합성 완전 배지 내에서 배양물을 OD600 1.0까지 성장시키고(Methods in Yeast Genetics, 2005, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, pp. 201-202) , 원심분리로 수확하여(4℃에서 8 min 동안 2600 x g) 완충제로 세척하고, 다시 원심분리한 후에 -80℃에서 냉동시켰다. 세포를 해동시켜 20 mM 트리스-HCl, pH 8.0에 최종 부피 2 ㎖로 재현탁한 후에, 1.2 g의 유리 비드(0.5 ㎜ 크기)가 있는 비드 비터(bead beater)를 사용하여 파쇄하였다. 각 시료를 총 3 분간 고속으로 처리하였다(각 1 분의 비팅(beating) 후에 빙상 인큐베이션을 하면서). 추출물을 원심분리하여(4℃에서 10 min 동안 20,000 x g) 세포 잔해를 제거하였다.
문헌(Bauerle et al.,Biochim. Biophys. Acta 92(1):142-149 (1964))에 기술된 방법을 사용하여 세포가 없는 추출물 내의 아세토락테이트 신타제 활성을 측정한다. 문헌 (Arfin and Umbarger, J. Biol. Chem. 244(5):1118-1127 (1969))에 기술된 방법을 사용하여 세포가 없는 추출물 내의 아세토하이드록시산 리덕토아이소머라제 활성을 측정한다. 문헌(Flint et al., J. Biol. Chem. 268(20):14732-14742 (1993))에 기술된 방법을 사용하여 세포가 없는 추출물 내의 아세토하이드록시산 데하이드라타제 활성을 측정한다. 푸르팔드(등록상표)(Purpald®) 시약(알드리치, 카탈로그 번호 162892)을 사용하여 알데히드 반응 산물을 검출하고 정량한 점을 제외하고는, 문헌(Smit et al., Appl. Microbiol. Biotechnol. 64:396-402 (2003))에 기술된 방법을 사용하여 세포가 없는 추출물 내의 분지쇄 케토산 데카복실라제 활성을 측정한다.
[표 5]
[표 6]
실시예 3(예견(PROPHETIC))
사카로마이세스 세레비시아 내성 균주를 사용하는 아이소부탄올의 생산
본 연구의 개시 균주는 BY4741(Brachmann, et al. Yeast. 14: 115-132 (1998)) 및 그의 Δbat2 유도체, YJR148W BY4741, MATa his3delta1 leu2delta0 met15delta0 ura3delta0 deltaTWT2의 유전자형으로 ATCC(# 406939)로부터 이용가능한 교배형 a(6939)이다. bat2는 세포질 분지쇄 아미노산 아미노트랜스페라제를 암호화하며, URA3의 결실과 조합된 bat2의 결실은 우라실의 부재하에 성장을 허용하므로 URA3 삽입의 존재에 대한 선택으로 사용된다.
먼저 ATCC 균주 # 406939를 사용하여 ΔGCN2 및 ΔGCN4 유도체를 제조한다. 결실의 표적인 서열을 대체하는 양 옆의 직접 반복 서열과 함께 URA3+가 게놈에 통합된 GCN 삽입-결실 대립유전자를 위한 선택가능 표지자로서 URA3+ 대립유전자를 사용하는 효모에 통상적으로 사용되는 유전자 대체 전략에 의해 이를 수행할 수 있다. 이어서, URA3+ 기능을 반대 선택(select against)하는 플루오로-오로트산(FOA: fluoro-orotic acid) 내성 요구에 의해 직접 반복 사이의 재조합 사건을 선택한다.
URA3 발현을 위한 유전자 및 양 옆의 직접 반복을 포함하는 DNA 단편("URA3 반복" 단편; 서열번호 138)은 하기의 것들을 포함한다(위치 번호는 서열번호 138의 "URA3 반복" 단편 내의 위치를 나타낸다):
1) URA3+ : 양 옆의 직접 반복에 경계를 이루는 프라이머 결합 서열: gcattgcggattacgtattctaatg (위치 1-25; 서열번호 143) 및 gatgatacaacgagttagccaaggtg (서열번호 144의 위치 1449-1474);
2) 프로모터 및 코딩 서열의 양 옆에 있는 직접 반복 서열: ttcagcccgcggaacgccagcaaatcaccacccatgcgcatgatactgagtcttgtacacgctgggcttccagtg (서열번호 145의 위치 26-100) 및 ttcagcccgcggaacgccagcaaatcaccacccatgcgcatgatactgagtcttgtacacgctgggcttccagtg (서열번호 146의 위치 1375-1449)
3) 프로모터 서열:
ttttttattcttttttttgatttcggtttctttgaaatttttttgattcggtaatctccgaacagaaggaagaacgaaggaaggagcacagacttagattggtatatatacgcatatgtagtgttgaagaaacatgaaattgcccagtattcttaacccaactgcacagaacaaaaacctgcaggaaacgaagataaatc (서열번호 147의 위치 149-348) 및
4) 코딩 영역:
atgtcgaaagctacatataaggaacgtgctgctactcatcctagtcctgttgctgccaagctatttaatatcatgcacgaaaagcaaacaaacttgtgtgcttcattggatgttcgtaccaccaaggaattactggagttagttgaagcattaggtcccaaaatttgtttactaaaaacacatgtggatatcttgactgatttttccatggagggcacagttaagccgctaaaggcattatccgccaagtacaattttttactcttcgaagacagaaaatttgctgacattggtaatacagtcaaattgcagtactctgcgggtgtatacagaatagcagaatgggcagacattacgaatgcacacggtgtggtgggcccaggtattgttagcggtttgaagcaggcggcagaagaagtaacaaaggaacctagaggccttttgatgttagcagaattgtcatgcaagggctccctatctactggagaatatactaagggtactgttgacattgcgaagagcgacaaagattttgttatcggctttattgctcaaagagacatgggtggaagagatgaaggttacgattggttgattatgacacccggtgtgggtttagatgacaagggagacgcattgggtcaacagtatagaaccgtggatgatgtggtctctacaggatctgacattattattgttggaagaggactatttgcaaagggaagggatgctaaggtagagggtgaacgttacagaaaagcaggctgggaagcatatttgagaagatgcggccagcaaaactaa (서열번호 148의 위치 349-1152).
GCN2 코딩 영역의 100 bp 업스트림에 있는 50 bp 서열, 상기의 URA3 반복 단편, 및 GCN2 코딩 영역의 100 bp 다운스트림에 있는 50 bp 서열을 포함하는 DNA 단편을 PCR을 사용하여 제조한다. 5' 프라이머는 GCN2의 업스트림에 있는 50 bp의 서열 및 상기 (1)의 위치 1-25 프라이머 결합 서열을 포함하는 융합 서열이다: 50 (GCN2 5' 양 옆의 서열 )+ 5'ura3 프라이머 (I) (서열번호::139). 3' 프라이머는 GCN2의 다운스트림에 있는 50 bp의 서열의 상보서열(complement) 및 위치 1449-1474 프라이머 결합 서열의 상보서열을 포함하는 융합 서열이다: 50 (GCN2 3' 양 옆의 서열의 역상보서열(reverse compl)) + 3'ura3 프라이머(역상보서열)(II)(서열번호 :140).
PCR 반응은 50 ㎕ 반응 혼합물로서, 1 ㎕의 주형(template) DNA (총 50 ng), 1 ㎕의 각 프라이머(20 μM), 25 ㎕의 2X 타카라 엑스(TaKaRa Ex) Taq 프리믹스(premix), 22 ㎕의 물을 함유한다. 주형은, "URA3 반복"이 다중-클로닝 부위에 삽입된 pUC19(Yanisch-Perron et al. (1985) Gene, 33:103-119) 유도체인 pUC19- URA3 반복이다. 사용된 PCR 조건은 하기와 같다:
94℃ 1 min, 이어서 30 주기의 94℃ 20 sec, 55℃ 20 sec 및 72℃ 2 min, 이어서 72℃에서 7 min . 연장 시간은 kb 당 1 min이다.
생성된 PCR 산물, ΔGCN2::URA3+ 단편을 퀴아젠(Qiagen) PCR 정제 키트를 사용하여 정제한다.
유사한 DNA 단편을 상기와 같이 제조하되, GCN4 코딩 영역의 업스트림 및 다운스트림에 있는 서열들을 포함하는 프라이머를 사용한다: 50 (GCN4 5' 양 옆의 서열) + 5'ura3 프라이머(III)(서열번호 141) 및 50 (GCN4 3' 양 옆의 서열의 역상보서열) + 3'ura3 프라이머(역상보서열)(GCN4)(IV)(서열번호 142).
생성된 PCR 산물, ΔGCN4::URA3+ 단편을 퀴아젠 PCR 정제 키트를 사용하여 정제한다.
PCR 산물을 사용하여 균주 ATCC #406939를 형질전환시킨다. 우라실 부재하의 성장에 대해 통합체(integrant)를 선택한다. "URA3 반복"의 삽입 및 GCN2 또는 GCN4의 결실을 동반하는 통합 균주(integrant strain)를 하기와 같이 각각 명명한다:
DYW1: MATa his3delta1 leu2delta0 met15delta0 ura3delta0 deltaTWT2 Δgcn2::URA3+ 및
DYW2: MATa his3delta1 leu2delta0 met15delta0 ura3delta0 deltaTWT2 Δgcn4::URA3+. URA3+ 대립유전자의 제거를 선택하는 5-FOA 선택을 사용하여, 직접 반복 사이에 재조합을 동반하는 균주를 수득하고 하기와 같이 명명한다:
DYW3: MATa his3delta1 leu2delta0 met15delta0 ura3delta0 deltaTWT2 Δgcn2 및
DYW4: MATa his3delta1 leu2delta0 met15delta0 ura3delta0 deltaTWT2 Δgcn4
플라스미드 pRS423::CUP1-alsS+FBA-ILV3 및 pHR81::FBA-ILV5+GPM-kivD(실시예 2에 기술함)를 사카로마이세스 세레비시아 DYW3 및 DYW4에 형질전환시켜 균주 DYW3(Δgcn2)/pRS423::CUP1-alsS+FBA-ILV3/ pHR81::FBA-ILV5+ GPM-kivD 및 DYW4(Δgcn4)/pRS423::CUP1-alsS+FBA-ILV3/ pHR81::FBA-ILV5+ GPM-kivD를 생성시킨다. 벡터 pRS423 및 pHR81(실시예 2에 기술함)을 사카로마이세스 세레비시아(ATCC 균주 # 406939) [균주 406939(GCN2+ GCN4+)/pRS423/pHR81]에 형질전환 시킴으로써 대조군 균주를 생성시킨다. 플라스미드의 유지를 보장하기 위하여 2% 포도당 또는 수크로스를 포함하나 우라실 및 히스티딘은 결여된 표준 에스. 세레비시아 합성 완전 배지(Methods in Yeast Genetics, 2005, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, pp. 201-202)에서 균주들을 유지한다.
아이소부탄올의 생산을 위하여, 우라실, 히스티딘 및 류신이 결여된 합성 완전 배지에 세포를 이전한다. 배지에서 류신을 제거하는 것은, leu2-d 대립유전자의 전사 불량에 기인하는 pHR81-기제 플라스미드의 카피 수 증가를 촉발시키기 위한 것이다(Erhart and Hollenberg, J. Bacteriol. 156:625-635 (1983)). 이노바(Innova)4000 인큐베이터(뉴저지주 에디슨 소재의 뉴 브룬스위크 사이언티픽(New Brunswick Scientific)) 내에서, 50 ㎖의 배지를 포함하는 175 ㎖ 용량 플라스크 내에 30℃ 및 200 rpm으로 유산소 배양물을 성장시킨다. 45 ㎖의 배지를 60 ㎖ 혈청 바이알에 가하고 접종 후에 권축 마개(crimped cap)로 밀봉하여 30℃에 유지함으로써 저산소 배양물을 제조한다. 필요에 따라 시료 채취 및 유도물질(inducer) 첨가를 위해 멸균 주사기를 사용한다. 접종으로부터 대략 24 h 후에, 유도물질 CuSO4 를 최종 농도 0.03 mM로 첨가한다. 각 균주에 대해 CuSO4를 첨가하지 않은 대조군 배양물도 제조한다. 일반 방법 섹션에 기술된 바와 같이, CuSO4 첨가 후 18 또는 19 h 및 35 h에 HPLC (굴절률 검출기(RI)가 있는 쇼덱스 슈가(Sugar) SH1011 컬럼(뉴욕 소재의 쇼와 덴코 아메리카 인코포레이티드(Showa Denko America, Inc.)) 및 GC (불꽃 이온화 검출기(FID)가 있는 베리안(Varian) CP-WAX 58(FFAP) CB, 0.25 ㎜ X 0.2 ㎛ X 25 m (캘리포니아주 팔로 알토 소재의 베리안 인코포레이티드(Varian, Inc.))로 배양물 상등액의 아이소부탄올 함량을 분석한다. 돌연변이체 gcn 대립유전자의 존재에 의해 아이소부탄올의 생산이 증진된다. 일반적으로, GCN 돌연변이체는 광학 밀도 단위당 더 높은 수준의 아이소부탄올을 생산한다.
SEQUENCE LISTING
<110> E.I. du Pont de Nemours and Co.
<120> Improved yeast strain for production of four carbon alcohols
<130> CL4132
<160> 148
<170> PatentIn version 3.4
<210> 1
<211> 1179
<212> DNA
<213> Clostridium acetobutylicum
<400> 1
atgaaagaag ttgtaatagc tagtgcagta agaacagcga ttggatctta tggaaagtct 60
cttaaggatg taccagcagt agatttagga gctacagcta taaaggaagc agttaaaaaa 120
gcaggaataa aaccagagga tgttaatgaa gtcattttag gaaatgttct tcaagcaggt 180
ttaggacaga atccagcaag acaggcatct tttaaagcag gattaccagt tgaaattcca 240
gctatgacta ttaataaggt ttgtggttca ggacttagaa cagttagctt agcagcacaa 300
attataaaag caggagatgc tgacgtaata atagcaggtg gtatggaaaa tatgtctaga 360
gctccttact tagcgaataa cgctagatgg ggatatagaa tgggaaacgc taaatttgtt 420
gatgaaatga tcactgacgg attgtgggat gcatttaatg attaccacat gggaataaca 480
gcagaaaaca tagctgagag atggaacatt tcaagagaag aacaagatga gtttgctctt 540
gcatcacaaa aaaaagctga agaagctata aaatcaggtc aatttaaaga tgaaatagtt 600
cctgtagtaa ttaaaggcag aaagggagaa actgtagttg atacagatga gcaccctaga 660
tttggatcaa ctatagaagg acttgcaaaa ttaaaacctg ccttcaaaaa agatggaaca 720
gttacagctg gtaatgcatc aggattaaat gactgtgcag cagtacttgt aatcatgagt 780
gcagaaaaag ctaaagagct tggagtaaaa ccacttgcta agatagtttc ttatggttca 840
gcaggagttg acccagcaat aatgggatat ggacctttct atgcaacaaa agcagctatt 900
gaaaaagcag gttggacagt tgatgaatta gatttaatag aatcaaatga agcttttgca 960
gctcaaagtt tagcagtagc aaaagattta aaatttgata tgaataaagt aaatgtaaat 1020
ggaggagcta ttgcccttgg tcatccaatt ggagcatcag gtgcaagaat actcgttact 1080
cttgtacacg caatgcaaaa aagagatgca aaaaaaggct tagcaacttt atgtataggt 1140
ggcggacaag gaacagcaat attgctagaa aagtgctag 1179
<210> 2
<211> 392
<212> PRT
<213> Clostridium acetobutylicum
<400> 2
Met Lys Glu Val Val Ile Ala Ser Ala Val Arg Thr Ala Ile Gly Ser
1 5 10 15
Tyr Gly Lys Ser Leu Lys Asp Val Pro Ala Val Asp Leu Gly Ala Thr
20 25 30
Ala Ile Lys Glu Ala Val Lys Lys Ala Gly Ile Lys Pro Glu Asp Val
35 40 45
Asn Glu Val Ile Leu Gly Asn Val Leu Gln Ala Gly Leu Gly Gln Asn
50 55 60
Pro Ala Arg Gln Ala Ser Phe Lys Ala Gly Leu Pro Val Glu Ile Pro
65 70 75 80
Ala Met Thr Ile Asn Lys Val Cys Gly Ser Gly Leu Arg Thr Val Ser
85 90 95
Leu Ala Ala Gln Ile Ile Lys Ala Gly Asp Ala Asp Val Ile Ile Ala
100 105 110
Gly Gly Met Glu Asn Met Ser Arg Ala Pro Tyr Leu Ala Asn Asn Ala
115 120 125
Arg Trp Gly Tyr Arg Met Gly Asn Ala Lys Phe Val Asp Glu Met Ile
130 135 140
Thr Asp Gly Leu Trp Asp Ala Phe Asn Asp Tyr His Met Gly Ile Thr
145 150 155 160
Ala Glu Asn Ile Ala Glu Arg Trp Asn Ile Ser Arg Glu Glu Gln Asp
165 170 175
Glu Phe Ala Leu Ala Ser Gln Lys Lys Ala Glu Glu Ala Ile Lys Ser
180 185 190
Gly Gln Phe Lys Asp Glu Ile Val Pro Val Val Ile Lys Gly Arg Lys
195 200 205
Gly Glu Thr Val Val Asp Thr Asp Glu His Pro Arg Phe Gly Ser Thr
210 215 220
Ile Glu Gly Leu Ala Lys Leu Lys Pro Ala Phe Lys Lys Asp Gly Thr
225 230 235 240
Val Thr Ala Gly Asn Ala Ser Gly Leu Asn Asp Cys Ala Ala Val Leu
245 250 255
Val Ile Met Ser Ala Glu Lys Ala Lys Glu Leu Gly Val Lys Pro Leu
260 265 270
Ala Lys Ile Val Ser Tyr Gly Ser Ala Gly Val Asp Pro Ala Ile Met
275 280 285
Gly Tyr Gly Pro Phe Tyr Ala Thr Lys Ala Ala Ile Glu Lys Ala Gly
290 295 300
Trp Thr Val Asp Glu Leu Asp Leu Ile Glu Ser Asn Glu Ala Phe Ala
305 310 315 320
Ala Gln Ser Leu Ala Val Ala Lys Asp Leu Lys Phe Asp Met Asn Lys
325 330 335
Val Asn Val Asn Gly Gly Ala Ile Ala Leu Gly His Pro Ile Gly Ala
340 345 350
Ser Gly Ala Arg Ile Leu Val Thr Leu Val His Ala Met Gln Lys Arg
355 360 365
Asp Ala Lys Lys Gly Leu Ala Thr Leu Cys Ile Gly Gly Gly Gln Gly
370 375 380
Thr Ala Ile Leu Leu Glu Lys Cys
385 390
<210> 3
<211> 1179
<212> DNA
<213> Clostridium acetobutylicum
<400> 3
atgagagatg tagtaatagt aagtgctgta agaactgcaa taggagcata tggaaaaaca 60
ttaaaggatg tacctgcaac agagttagga gctatagtaa taaaggaagc tgtaagaaga 120
gctaatataa atccaaatga gattaatgaa gttatttttg gaaatgtact tcaagctgga 180
ttaggccaaa acccagcaag acaagcagca gtaaaagcag gattaccttt agaaacacct 240
gcgtttacaa tcaataaggt ttgtggttca ggtttaagat ctataagttt agcagctcaa 300
attataaaag ctggagatgc tgataccatt gtagtaggtg gtatggaaaa tatgtctaga 360
tcaccatatt tgattaacaa tcagagatgg ggtcaaagaa tgggagatag tgaattagtt 420
gatgaaatga taaaggatgg tttgtgggat gcatttaatg gatatcatat gggagtaact 480
gcagaaaata ttgcagaaca atggaatata acaagagaag agcaagatga attttcactt 540
atgtcacaac aaaaagctga aaaagccatt aaaaatggag aatttaagga tgaaatagtt 600
cctgtattaa taaagactaa aaaaggtgaa atagtctttg atcaagatga atttcctaga 660
ttcggaaaca ctattgaagc attaagaaaa cttaaaccta ttttcaagga aaatggtact 720
gttacagcag gtaatgcatc cggattaaat gatggagctg cagcactagt aataatgagc 780
gctgataaag ctaacgctct cggaataaaa ccacttgcta agattacttc ttacggatca 840
tatggggtag atccatcaat aatgggatat ggagcttttt atgcaactaa agctgcctta 900
gataaaatta atttaaaacc tgaagactta gatttaattg aagctaacga ggcatatgct 960
tctcaaagta tagcagtaac tagagattta aatttagata tgagtaaagt taatgttaat 1020
ggtggagcta tagcacttgg acatccaata ggtgcatctg gtgcacgtat tttagtaaca 1080
ttactatacg ctatgcaaaa aagagattca aaaaaaggtc ttgctactct atgtattggt 1140
ggaggtcagg gaacagctct cgtagttgaa agagactaa 1179
<210> 4
<211> 392
<212> PRT
<213> Clostridium acetobutylicum
<400> 4
Met Arg Asp Val Val Ile Val Ser Ala Val Arg Thr Ala Ile Gly Ala
1 5 10 15
Tyr Gly Lys Thr Leu Lys Asp Val Pro Ala Thr Glu Leu Gly Ala Ile
20 25 30
Val Ile Lys Glu Ala Val Arg Arg Ala Asn Ile Asn Pro Asn Glu Ile
35 40 45
Asn Glu Val Ile Phe Gly Asn Val Leu Gln Ala Gly Leu Gly Gln Asn
50 55 60
Pro Ala Arg Gln Ala Ala Val Lys Ala Gly Leu Pro Leu Glu Thr Pro
65 70 75 80
Ala Phe Thr Ile Asn Lys Val Cys Gly Ser Gly Leu Arg Ser Ile Ser
85 90 95
Leu Ala Ala Gln Ile Ile Lys Ala Gly Asp Ala Asp Thr Ile Val Val
100 105 110
Gly Gly Met Glu Asn Met Ser Arg Ser Pro Tyr Leu Ile Asn Asn Gln
115 120 125
Arg Trp Gly Gln Arg Met Gly Asp Ser Glu Leu Val Asp Glu Met Ile
130 135 140
Lys Asp Gly Leu Trp Asp Ala Phe Asn Gly Tyr His Met Gly Val Thr
145 150 155 160
Ala Glu Asn Ile Ala Glu Gln Trp Asn Ile Thr Arg Glu Glu Gln Asp
165 170 175
Glu Phe Ser Leu Met Ser Gln Gln Lys Ala Glu Lys Ala Ile Lys Asn
180 185 190
Gly Glu Phe Lys Asp Glu Ile Val Pro Val Leu Ile Lys Thr Lys Lys
195 200 205
Gly Glu Ile Val Phe Asp Gln Asp Glu Phe Pro Arg Phe Gly Asn Thr
210 215 220
Ile Glu Ala Leu Arg Lys Leu Lys Pro Ile Phe Lys Glu Asn Gly Thr
225 230 235 240
Val Thr Ala Gly Asn Ala Ser Gly Leu Asn Asp Gly Ala Ala Ala Leu
245 250 255
Val Ile Met Ser Ala Asp Lys Ala Asn Ala Leu Gly Ile Lys Pro Leu
260 265 270
Ala Lys Ile Thr Ser Tyr Gly Ser Tyr Gly Val Asp Pro Ser Ile Met
275 280 285
Gly Tyr Gly Ala Phe Tyr Ala Thr Lys Ala Ala Leu Asp Lys Ile Asn
290 295 300
Leu Lys Pro Glu Asp Leu Asp Leu Ile Glu Ala Asn Glu Ala Tyr Ala
305 310 315 320
Ser Gln Ser Ile Ala Val Thr Arg Asp Leu Asn Leu Asp Met Ser Lys
325 330 335
Val Asn Val Asn Gly Gly Ala Ile Ala Leu Gly His Pro Ile Gly Ala
340 345 350
Ser Gly Ala Arg Ile Leu Val Thr Leu Leu Tyr Ala Met Gln Lys Arg
355 360 365
Asp Ser Lys Lys Gly Leu Ala Thr Leu Cys Ile Gly Gly Gly Gln Gly
370 375 380
Thr Ala Leu Val Val Glu Arg Asp
385 390
<210> 5
<211> 849
<212> DNA
<213> Clostridium acetobutylicum
<400> 5
atgaaaaagg tatgtgttat aggtgcaggt actatgggtt caggaattgc tcaggcattt 60
gcagctaaag gatttgaagt agtattaaga gatattaaag atgaatttgt tgatagagga 120
ttagatttta tcaataaaaa tctttctaaa ttagttaaaa aaggaaagat agaagaagct 180
actaaagttg aaatcttaac tagaatttcc ggaacagttg accttaatat ggcagctgat 240
tgcgatttag ttatagaagc agctgttgaa agaatggata ttaaaaagca gatttttgct 300
gacttagaca atatatgcaa gccagaaaca attcttgcat caaatacatc atcactttca 360
ataacagaag tggcatcagc aactaaaaga cctgataagg ttataggtat gcatttcttt 420
aatccagctc ctgttatgaa gcttgtagag gtaataagag gaatagctac atcacaagaa 480
acttttgatg cagttaaaga gacatctata gcaataggaa aagatcctgt agaagtagca 540
gaagcaccag gatttgttgt aaatagaata ttaataccaa tgattaatga agcagttggt 600
atattagcag aaggaatagc ttcagtagaa gacatagata aagctatgaa acttggagct 660
aatcacccaa tgggaccatt agaattaggt gattttatag gtcttgatat atgtcttgct 720
ataatggatg ttttatactc agaaactgga gattctaagt atagaccaca tacattactt 780
aagaagtatg taagagcagg atggcttgga agaaaatcag gaaaaggttt ctacgattat 840
tcaaaataa 849
<210> 6
<211> 282
<212> PRT
<213> Clostridium acetobutylicum
<400> 6
Met Lys Lys Val Cys Val Ile Gly Ala Gly Thr Met Gly Ser Gly Ile
1 5 10 15
Ala Gln Ala Phe Ala Ala Lys Gly Phe Glu Val Val Leu Arg Asp Ile
20 25 30
Lys Asp Glu Phe Val Asp Arg Gly Leu Asp Phe Ile Asn Lys Asn Leu
35 40 45
Ser Lys Leu Val Lys Lys Gly Lys Ile Glu Glu Ala Thr Lys Val Glu
50 55 60
Ile Leu Thr Arg Ile Ser Gly Thr Val Asp Leu Asn Met Ala Ala Asp
65 70 75 80
Cys Asp Leu Val Ile Glu Ala Ala Val Glu Arg Met Asp Ile Lys Lys
85 90 95
Gln Ile Phe Ala Asp Leu Asp Asn Ile Cys Lys Pro Glu Thr Ile Leu
100 105 110
Ala Ser Asn Thr Ser Ser Leu Ser Ile Thr Glu Val Ala Ser Ala Thr
115 120 125
Lys Arg Pro Asp Lys Val Ile Gly Met His Phe Phe Asn Pro Ala Pro
130 135 140
Val Met Lys Leu Val Glu Val Ile Arg Gly Ile Ala Thr Ser Gln Glu
145 150 155 160
Thr Phe Asp Ala Val Lys Glu Thr Ser Ile Ala Ile Gly Lys Asp Pro
165 170 175
Val Glu Val Ala Glu Ala Pro Gly Phe Val Val Asn Arg Ile Leu Ile
180 185 190
Pro Met Ile Asn Glu Ala Val Gly Ile Leu Ala Glu Gly Ile Ala Ser
195 200 205
Val Glu Asp Ile Asp Lys Ala Met Lys Leu Gly Ala Asn His Pro Met
210 215 220
Gly Pro Leu Glu Leu Gly Asp Phe Ile Gly Leu Asp Ile Cys Leu Ala
225 230 235 240
Ile Met Asp Val Leu Tyr Ser Glu Thr Gly Asp Ser Lys Tyr Arg Pro
245 250 255
His Thr Leu Leu Lys Lys Tyr Val Arg Ala Gly Trp Leu Gly Arg Lys
260 265 270
Ser Gly Lys Gly Phe Tyr Asp Tyr Ser Lys
275 280
<210> 7
<211> 786
<212> DNA
<213> Clostridium acetobutylicum
<400> 7
atggaactaa acaatgtcat ccttgaaaag gaaggtaaag ttgctgtagt taccattaac 60
agacctaaag cattaaatgc gttaaatagt gatacactaa aagaaatgga ttatgttata 120
ggtgaaattg aaaatgatag cgaagtactt gcagtaattt taactggagc aggagaaaaa 180
tcatttgtag caggagcaga tatttctgag atgaaggaaa tgaataccat tgaaggtaga 240
aaattcggga tacttggaaa taaagtgttt agaagattag aacttcttga aaagcctgta 300
atagcagctg ttaatggttt tgctttagga ggcggatgcg aaatagctat gtcttgtgat 360
ataagaatag cttcaagcaa cgcaagattt ggtcaaccag aagtaggtct cggaataaca 420
cctggttttg gtggtacaca aagactttca agattagttg gaatgggcat ggcaaagcag 480
cttatattta ctgcacaaaa tataaaggca gatgaagcat taagaatcgg acttgtaaat 540
aaggtagtag aacctagtga attaatgaat acagcaaaag aaattgcaaa caaaattgtg 600
agcaatgctc cagtagctgt taagttaagc aaacaggcta ttaatagagg aatgcagtgt 660
gatattgata ctgctttagc atttgaatca gaagcatttg gagaatgctt ttcaacagag 720
gatcaaaagg atgcaatgac agctttcata gagaaaagaa aaattgaagg cttcaaaaat 780
agatag 786
<210> 8
<211> 261
<212> PRT
<213> Clostridium acetobutylicum
<400> 8
Met Glu Leu Asn Asn Val Ile Leu Glu Lys Glu Gly Lys Val Ala Val
1 5 10 15
Val Thr Ile Asn Arg Pro Lys Ala Leu Asn Ala Leu Asn Ser Asp Thr
20 25 30
Leu Lys Glu Met Asp Tyr Val Ile Gly Glu Ile Glu Asn Asp Ser Glu
35 40 45
Val Leu Ala Val Ile Leu Thr Gly Ala Gly Glu Lys Ser Phe Val Ala
50 55 60
Gly Ala Asp Ile Ser Glu Met Lys Glu Met Asn Thr Ile Glu Gly Arg
65 70 75 80
Lys Phe Gly Ile Leu Gly Asn Lys Val Phe Arg Arg Leu Glu Leu Leu
85 90 95
Glu Lys Pro Val Ile Ala Ala Val Asn Gly Phe Ala Leu Gly Gly Gly
100 105 110
Cys Glu Ile Ala Met Ser Cys Asp Ile Arg Ile Ala Ser Ser Asn Ala
115 120 125
Arg Phe Gly Gln Pro Glu Val Gly Leu Gly Ile Thr Pro Gly Phe Gly
130 135 140
Gly Thr Gln Arg Leu Ser Arg Leu Val Gly Met Gly Met Ala Lys Gln
145 150 155 160
Leu Ile Phe Thr Ala Gln Asn Ile Lys Ala Asp Glu Ala Leu Arg Ile
165 170 175
Gly Leu Val Asn Lys Val Val Glu Pro Ser Glu Leu Met Asn Thr Ala
180 185 190
Lys Glu Ile Ala Asn Lys Ile Val Ser Asn Ala Pro Val Ala Val Lys
195 200 205
Leu Ser Lys Gln Ala Ile Asn Arg Gly Met Gln Cys Asp Ile Asp Thr
210 215 220
Ala Leu Ala Phe Glu Ser Glu Ala Phe Gly Glu Cys Phe Ser Thr Glu
225 230 235 240
Asp Gln Lys Asp Ala Met Thr Ala Phe Ile Glu Lys Arg Lys Ile Glu
245 250 255
Gly Phe Lys Asn Arg
260
<210> 9
<211> 1197
<212> DNA
<213> Clostridium acetobutylicum
<400> 9
atgatagtaa aagcaaagtt tgtaaaagga tttatcagag atgtacatcc ttatggttgc 60
agaagggaag tactaaatca aatagattat tgtaagaagg ctattgggtt taggggacca 120
aagaaggttt taattgttgg agcctcatct gggtttggtc ttgctactag aatttcagtt 180
gcatttggag gtccagaagc tcacacaatt ggagtatcct atgaaacagg agctacagat 240
agaagaatag gaacagcggg atggtataat aacatatttt ttaaagaatt tgctaaaaaa 300
aaaggattag ttgcaaaaaa cttcattgag gatgcctttt ctaatgaaac caaagataaa 360
gttattaagt atataaagga tgaatttggt aaaatagatt tatttgttta tagtttagct 420
gcgcctagga gaaaggacta taaaactgga aatgtttata cttcaagaat aaaaacaatt 480
ttaggagatt ttgagggacc gactattgat gttgaaagag acgagattac tttaaaaaag 540
gttagtagtg ctagcattga agaaattgaa gaaactagaa aggtaatggg tggagaggat 600
tggcaagagt ggtgtgaaga gctgctttat gaagattgtt tttcggataa agcaactacc 660
atagcatact cgtatatagg atccccaaga acctacaaga tatatagaga aggtactata 720
ggaatagcta aaaaggatct tgaagataag gctaagctta taaatgaaaa acttaacaga 780
gttataggtg gtagagcctt tgtgtctgtg aataaagcat tagttacaaa agcaagtgca 840
tatattccaa cttttcctct ttatgcagct attttatata aggtcatgaa agaaaaaaat 900
attcatgaaa attgtattat gcaaattgag agaatgtttt ctgaaaaaat atattcaaat 960
gaaaaaatac aatttgatga caagggaaga ttaaggatgg acgatttaga gcttagaaaa 1020
gacgttcaag acgaagttga tagaatatgg agtaatatta ctcctgaaaa ttttaaggaa 1080
ttatctgatt ataagggata caaaaaagaa ttcatgaact taaacggttt tgatctagat 1140
ggggttgatt atagtaaaga cctggatata gaattattaa gaaaattaga accttaa 1197
<210> 10
<211> 398
<212> PRT
<213> Clostridium acetobutylicum
<400> 10
Met Ile Val Lys Ala Lys Phe Val Lys Gly Phe Ile Arg Asp Val His
1 5 10 15
Pro Tyr Gly Cys Arg Arg Glu Val Leu Asn Gln Ile Asp Tyr Cys Lys
20 25 30
Lys Ala Ile Gly Phe Arg Gly Pro Lys Lys Val Leu Ile Val Gly Ala
35 40 45
Ser Ser Gly Phe Gly Leu Ala Thr Arg Ile Ser Val Ala Phe Gly Gly
50 55 60
Pro Glu Ala His Thr Ile Gly Val Ser Tyr Glu Thr Gly Ala Thr Asp
65 70 75 80
Arg Arg Ile Gly Thr Ala Gly Trp Tyr Asn Asn Ile Phe Phe Lys Glu
85 90 95
Phe Ala Lys Lys Lys Gly Leu Val Ala Lys Asn Phe Ile Glu Asp Ala
100 105 110
Phe Ser Asn Glu Thr Lys Asp Lys Val Ile Lys Tyr Ile Lys Asp Glu
115 120 125
Phe Gly Lys Ile Asp Leu Phe Val Tyr Ser Leu Ala Ala Pro Arg Arg
130 135 140
Lys Asp Tyr Lys Thr Gly Asn Val Tyr Thr Ser Arg Ile Lys Thr Ile
145 150 155 160
Leu Gly Asp Phe Glu Gly Pro Thr Ile Asp Val Glu Arg Asp Glu Ile
165 170 175
Thr Leu Lys Lys Val Ser Ser Ala Ser Ile Glu Glu Ile Glu Glu Thr
180 185 190
Arg Lys Val Met Gly Gly Glu Asp Trp Gln Glu Trp Cys Glu Glu Leu
195 200 205
Leu Tyr Glu Asp Cys Phe Ser Asp Lys Ala Thr Thr Ile Ala Tyr Ser
210 215 220
Tyr Ile Gly Ser Pro Arg Thr Tyr Lys Ile Tyr Arg Glu Gly Thr Ile
225 230 235 240
Gly Ile Ala Lys Lys Asp Leu Glu Asp Lys Ala Lys Leu Ile Asn Glu
245 250 255
Lys Leu Asn Arg Val Ile Gly Gly Arg Ala Phe Val Ser Val Asn Lys
260 265 270
Ala Leu Val Thr Lys Ala Ser Ala Tyr Ile Pro Thr Phe Pro Leu Tyr
275 280 285
Ala Ala Ile Leu Tyr Lys Val Met Lys Glu Lys Asn Ile His Glu Asn
290 295 300
Cys Ile Met Gln Ile Glu Arg Met Phe Ser Glu Lys Ile Tyr Ser Asn
305 310 315 320
Glu Lys Ile Gln Phe Asp Asp Lys Gly Arg Leu Arg Met Asp Asp Leu
325 330 335
Glu Leu Arg Lys Asp Val Gln Asp Glu Val Asp Arg Ile Trp Ser Asn
340 345 350
Ile Thr Pro Glu Asn Phe Lys Glu Leu Ser Asp Tyr Lys Gly Tyr Lys
355 360 365
Lys Glu Phe Met Asn Leu Asn Gly Phe Asp Leu Asp Gly Val Asp Tyr
370 375 380
Ser Lys Asp Leu Asp Ile Glu Leu Leu Arg Lys Leu Glu Pro
385 390 395
<210> 11
<211> 1407
<212> DNA
<213> Clostridium beijerinckii
<400> 11
atgaataaag acacactaat acctacaact aaagatttaa aagtaaaaac aaatggtgaa 60
aacattaatt taaagaacta caaggataat tcttcatgtt tcggagtatt cgaaaatgtt 120
gaaaatgcta taagcagcgc tgtacacgca caaaagatat tatcccttca ttatacaaaa 180
gagcaaagag aaaaaatcat aactgagata agaaaggccg cattacaaaa taaagaggtc 240
ttggctacaa tgattctaga agaaacacat atgggaagat atgaggataa aatattaaaa 300
catgaattgg tagctaaata tactcctggt acagaagatt taactactac tgcttggtca 360
ggtgataatg gtcttacagt tgtagaaatg tctccatatg gtgttatagg tgcaataact 420
ccttctacga atccaactga aactgtaata tgtaatagca taggcatgat agctgctgga 480
aatgctgtag tatttaacgg acacccatgc gctaaaaaat gtgttgcctt tgctgttgaa 540
atgataaata aggcaattat ttcatgtggc ggtcctgaaa atctagtaac aactataaaa 600
aatccaacta tggagtctct agatgcaatt attaagcatc cttcaataaa acttctttgc 660
ggaactgggg gtccaggaat ggtaaaaacc ctcttaaatt ctggtaagaa agctataggt 720
gctggtgctg gaaatccacc agttattgta gatgatactg ctgatataga aaaggctggt 780
aggagcatca ttgaaggctg ttcttttgat aataatttac cttgtattgc agaaaaagaa 840
gtatttgttt ttgagaatgt tgcagatgat ttaatatcta acatgctaaa aaataatgct 900
gtaattataa atgaagatca agtatcaaaa ttaatagatt tagtattaca aaaaaataat 960
gaaactcaag aatactttat aaacaaaaaa tgggtaggaa aagatgcaaa attattctta 1020
gatgaaatag atgttgagtc tccttcaaat gttaaatgca taatctgcga agtaaatgca 1080
aatcatccat ttgttatgac agaactcatg atgccaatat tgccaattgt aagagttaaa 1140
gatatagatg aagctattaa atatgcaaag atagcagaac aaaatagaaa acatagtgcc 1200
tatatttatt ctaaaaatat agacaaccta aatagatttg aaagagaaat agatactact 1260
atttttgtaa agaatgctaa atcttttgct ggtgttggtt atgaagcaga aggatttaca 1320
actttcacta ttgctggatc tactggtgag ggaataacct ctgcaaggaa ttttacaaga 1380
caaagaagat gtgtacttgc cggctaa 1407
<210> 12
<211> 468
<212> PRT
<213> Clostridium beijerinckii
<400> 12
Met Asn Lys Asp Thr Leu Ile Pro Thr Thr Lys Asp Leu Lys Val Lys
1 5 10 15
Thr Asn Gly Glu Asn Ile Asn Leu Lys Asn Tyr Lys Asp Asn Ser Ser
20 25 30
Cys Phe Gly Val Phe Glu Asn Val Glu Asn Ala Ile Ser Ser Ala Val
35 40 45
His Ala Gln Lys Ile Leu Ser Leu His Tyr Thr Lys Glu Gln Arg Glu
50 55 60
Lys Ile Ile Thr Glu Ile Arg Lys Ala Ala Leu Gln Asn Lys Glu Val
65 70 75 80
Leu Ala Thr Met Ile Leu Glu Glu Thr His Met Gly Arg Tyr Glu Asp
85 90 95
Lys Ile Leu Lys His Glu Leu Val Ala Lys Tyr Thr Pro Gly Thr Glu
100 105 110
Asp Leu Thr Thr Thr Ala Trp Ser Gly Asp Asn Gly Leu Thr Val Val
115 120 125
Glu Met Ser Pro Tyr Gly Val Ile Gly Ala Ile Thr Pro Ser Thr Asn
130 135 140
Pro Thr Glu Thr Val Ile Cys Asn Ser Ile Gly Met Ile Ala Ala Gly
145 150 155 160
Asn Ala Val Val Phe Asn Gly His Pro Cys Ala Lys Lys Cys Val Ala
165 170 175
Phe Ala Val Glu Met Ile Asn Lys Ala Ile Ile Ser Cys Gly Gly Pro
180 185 190
Glu Asn Leu Val Thr Thr Ile Lys Asn Pro Thr Met Glu Ser Leu Asp
195 200 205
Ala Ile Ile Lys His Pro Ser Ile Lys Leu Leu Cys Gly Thr Gly Gly
210 215 220
Pro Gly Met Val Lys Thr Leu Leu Asn Ser Gly Lys Lys Ala Ile Gly
225 230 235 240
Ala Gly Ala Gly Asn Pro Pro Val Ile Val Asp Asp Thr Ala Asp Ile
245 250 255
Glu Lys Ala Gly Arg Ser Ile Ile Glu Gly Cys Ser Phe Asp Asn Asn
260 265 270
Leu Pro Cys Ile Ala Glu Lys Glu Val Phe Val Phe Glu Asn Val Ala
275 280 285
Asp Asp Leu Ile Ser Asn Met Leu Lys Asn Asn Ala Val Ile Ile Asn
290 295 300
Glu Asp Gln Val Ser Lys Leu Ile Asp Leu Val Leu Gln Lys Asn Asn
305 310 315 320
Glu Thr Gln Glu Tyr Phe Ile Asn Lys Lys Trp Val Gly Lys Asp Ala
325 330 335
Lys Leu Phe Leu Asp Glu Ile Asp Val Glu Ser Pro Ser Asn Val Lys
340 345 350
Cys Ile Ile Cys Glu Val Asn Ala Asn His Pro Phe Val Met Thr Glu
355 360 365
Leu Met Met Pro Ile Leu Pro Ile Val Arg Val Lys Asp Ile Asp Glu
370 375 380
Ala Ile Lys Tyr Ala Lys Ile Ala Glu Gln Asn Arg Lys His Ser Ala
385 390 395 400
Tyr Ile Tyr Ser Lys Asn Ile Asp Asn Leu Asn Arg Phe Glu Arg Glu
405 410 415
Ile Asp Thr Thr Ile Phe Val Lys Asn Ala Lys Ser Phe Ala Gly Val
420 425 430
Gly Tyr Glu Ala Glu Gly Phe Thr Thr Phe Thr Ile Ala Gly Ser Thr
435 440 445
Gly Glu Gly Ile Thr Ser Ala Arg Asn Phe Thr Arg Gln Arg Arg Cys
450 455 460
Val Leu Ala Gly
465
<210> 13
<211> 1215
<212> DNA
<213> Clostridium acetobutylicum
<400> 13
atggttgatt tcgaatattc aataccaact agaatttttt tcggtaaaga taagataaat 60
gtacttggaa gagagcttaa aaaatatggt tctaaagtgc ttatagttta tggtggagga 120
agtataaaga gaaatggaat atatgataaa gctgtaagta tacttgaaaa aaacagtatt 180
aaattttatg aacttgcagg agtagagcca aatccaagag taactacagt tgaaaaagga 240
gttaaaatat gtagagaaaa tggagttgaa gtagtactag ctataggtgg aggaagtgca 300
atagattgcg caaaggttat agcagcagca tgtgaatatg atggaaatcc atgggatatt 360
gtgttagatg gctcaaaaat aaaaagggtg cttcctatag ctagtatatt aaccattgct 420
gcaacaggat cagaaatgga tacgtgggca gtaataaata atatggatac aaacgaaaaa 480
ctaattgcgg cacatccaga tatggctcct aagttttcta tattagatcc aacgtatacg 540
tataccgtac ctaccaatca aacagcagca ggaacagctg atattatgag tcatatattt 600
gaggtgtatt ttagtaatac aaaaacagca tatttgcagg atagaatggc agaagcgtta 660
ttaagaactt gtattaaata tggaggaata gctcttgaga agccggatga ttatgaggca 720
agagccaatc taatgtgggc ttcaagtctt gcgataaatg gacttttaac atatggtaaa 780
gacactaatt ggagtgtaca cttaatggaa catgaattaa gtgcttatta cgacataaca 840
cacggcgtag ggcttgcaat tttaacacct aattggatgg agtatatttt aaataatgat 900
acagtgtaca agtttgttga atatggtgta aatgtttggg gaatagacaa agaaaaaaat 960
cactatgaca tagcacatca agcaatacaa aaaacaagag attactttgt aaatgtacta 1020
ggtttaccat ctagactgag agatgttgga attgaagaag aaaaattgga cataatggca 1080
aaggaatcag taaagcttac aggaggaacc ataggaaacc taagaccagt aaacgcctcc 1140
gaagtcctac aaatattcaa aaaatctgtg taaaacgcct ccgaagtcct acaaatattc 1200
aaaaaatctg tgtaa 1215
<210> 14
<211> 390
<212> PRT
<213> Clostridium acetobutylicum
<400> 14
Met Val Asp Phe Glu Tyr Ser Ile Pro Thr Arg Ile Phe Phe Gly Lys
1 5 10 15
Asp Lys Ile Asn Val Leu Gly Arg Glu Leu Lys Lys Tyr Gly Ser Lys
20 25 30
Val Leu Ile Val Tyr Gly Gly Gly Ser Ile Lys Arg Asn Gly Ile Tyr
35 40 45
Asp Lys Ala Val Ser Ile Leu Glu Lys Asn Ser Ile Lys Phe Tyr Glu
50 55 60
Leu Ala Gly Val Glu Pro Asn Pro Arg Val Thr Thr Val Glu Lys Gly
65 70 75 80
Val Lys Ile Cys Arg Glu Asn Gly Val Glu Val Val Leu Ala Ile Gly
85 90 95
Gly Gly Ser Ala Ile Asp Cys Ala Lys Val Ile Ala Ala Ala Cys Glu
100 105 110
Tyr Asp Gly Asn Pro Trp Asp Ile Val Leu Asp Gly Ser Lys Ile Lys
115 120 125
Arg Val Leu Pro Ile Ala Ser Ile Leu Thr Ile Ala Ala Thr Gly Ser
130 135 140
Glu Met Asp Thr Trp Ala Val Ile Asn Asn Met Asp Thr Asn Glu Lys
145 150 155 160
Leu Ile Ala Ala His Pro Asp Met Ala Pro Lys Phe Ser Ile Leu Asp
165 170 175
Pro Thr Tyr Thr Tyr Thr Val Pro Thr Asn Gln Thr Ala Ala Gly Thr
180 185 190
Ala Asp Ile Met Ser His Ile Phe Glu Val Tyr Phe Ser Asn Thr Lys
195 200 205
Thr Ala Tyr Leu Gln Asp Arg Met Ala Glu Ala Leu Leu Arg Thr Cys
210 215 220
Ile Lys Tyr Gly Gly Ile Ala Leu Glu Lys Pro Asp Asp Tyr Glu Ala
225 230 235 240
Arg Ala Asn Leu Met Trp Ala Ser Ser Leu Ala Ile Asn Gly Leu Leu
245 250 255
Thr Tyr Gly Lys Asp Thr Asn Trp Ser Val His Leu Met Glu His Glu
260 265 270
Leu Ser Ala Tyr Tyr Asp Ile Thr His Gly Val Gly Leu Ala Ile Leu
275 280 285
Thr Pro Asn Trp Met Glu Tyr Ile Leu Asn Asn Asp Thr Val Tyr Lys
290 295 300
Phe Val Glu Tyr Gly Val Asn Val Trp Gly Ile Asp Lys Glu Lys Asn
305 310 315 320
His Tyr Asp Ile Ala His Gln Ala Ile Gln Lys Thr Arg Asp Tyr Phe
325 330 335
Val Asn Val Leu Gly Leu Pro Ser Arg Leu Arg Asp Val Gly Ile Glu
340 345 350
Glu Glu Lys Leu Asp Ile Met Ala Lys Glu Ser Val Lys Leu Thr Gly
355 360 365
Gly Thr Ile Gly Asn Leu Arg Pro Val Asn Ala Ser Glu Val Leu Gln
370 375 380
Ile Phe Lys Lys Ser Val
385 390
<210> 15
<211> 1170
<212> DNA
<213> Clostridium acetobutylicum
<400> 15
atgctaagtt ttgattattc aataccaact aaagtttttt ttggaaaagg aaaaatagac 60
gtaattggag aagaaattaa gaaatatggc tcaagagtgc ttatagttta tggcggagga 120
agtataaaaa ggaacggtat atatgataga gcaacagcta tattaaaaga aaacaatata 180
gctttctatg aactttcagg agtagagcca aatcctagga taacaacagt aaaaaaaggc 240
atagaaatat gtagagaaaa taatgtggat ttagtattag caataggggg aggaagtgca 300
atagactgtt ctaaggtaat tgcagctgga gtttattatg atggcgatac atgggacatg 360
gttaaagatc catctaaaat aactaaagtt cttccaattg caagtatact tactctttca 420
gcaacagggt ctgaaatgga tcaaattgca gtaatttcaa atatggagac taatgaaaag 480
cttggagtag gacatgatga tatgagacct aaattttcag tgttagatcc tacatatact 540
tttacagtac ctaaaaatca aacagcagcg ggaacagctg acattatgag tcacaccttt 600
gaatcttact ttagtggtgt tgaaggtgct tatgtgcagg acggtatagc agaagcaatc 660
ttaagaacat gtataaagta tggaaaaata gcaatggaga agactgatga ttacgaggct 720
agagctaatt tgatgtgggc ttcaagttta gctataaatg gtctattatc acttggtaag 780
gatagaaaat ggagttgtca tcctatggaa cacgagttaa gtgcatatta tgatataaca 840
catggtgtag gacttgcaat tttaacacct aattggatgg aatatattct aaatgacgat 900
acacttcata aatttgtttc ttatggaata aatgtttggg gaatagacaa gaacaaagat 960
aactatgaaa tagcacgaga ggctattaaa aatacgagag aatactttaa ttcattgggt 1020
attccttcaa agcttagaga agttggaata ggaaaagata aactagaact aatggcaaag 1080
caagctgtta gaaattctgg aggaacaata ggaagtttaa gaccaataaa tgcagaggat 1140
gttcttgaga tatttaaaaa atcttattaa 1170
<210> 16
<211> 389
<212> PRT
<213> Clostridium acetobutylicum
<400> 16
Met Leu Ser Phe Asp Tyr Ser Ile Pro Thr Lys Val Phe Phe Gly Lys
1 5 10 15
Gly Lys Ile Asp Val Ile Gly Glu Glu Ile Lys Lys Tyr Gly Ser Arg
20 25 30
Val Leu Ile Val Tyr Gly Gly Gly Ser Ile Lys Arg Asn Gly Ile Tyr
35 40 45
Asp Arg Ala Thr Ala Ile Leu Lys Glu Asn Asn Ile Ala Phe Tyr Glu
50 55 60
Leu Ser Gly Val Glu Pro Asn Pro Arg Ile Thr Thr Val Lys Lys Gly
65 70 75 80
Ile Glu Ile Cys Arg Glu Asn Asn Val Asp Leu Val Leu Ala Ile Gly
85 90 95
Gly Gly Ser Ala Ile Asp Cys Ser Lys Val Ile Ala Ala Gly Val Tyr
100 105 110
Tyr Asp Gly Asp Thr Trp Asp Met Val Lys Asp Pro Ser Lys Ile Thr
115 120 125
Lys Val Leu Pro Ile Ala Ser Ile Leu Thr Leu Ser Ala Thr Gly Ser
130 135 140
Glu Met Asp Gln Ile Ala Val Ile Ser Asn Met Glu Thr Asn Glu Lys
145 150 155 160
Leu Gly Val Gly His Asp Asp Met Arg Pro Lys Phe Ser Val Leu Asp
165 170 175
Pro Thr Tyr Thr Phe Thr Val Pro Lys Asn Gln Thr Ala Ala Gly Thr
180 185 190
Ala Asp Ile Met Ser His Thr Phe Glu Ser Tyr Phe Ser Gly Val Glu
195 200 205
Gly Ala Tyr Val Gln Asp Gly Ile Ala Glu Ala Ile Leu Arg Thr Cys
210 215 220
Ile Lys Tyr Gly Lys Ile Ala Met Glu Lys Thr Asp Asp Tyr Glu Ala
225 230 235 240
Arg Ala Asn Leu Met Trp Ala Ser Ser Leu Ala Ile Asn Gly Leu Leu
245 250 255
Ser Leu Gly Lys Asp Arg Lys Trp Ser Cys His Pro Met Glu His Glu
260 265 270
Leu Ser Ala Tyr Tyr Asp Ile Thr His Gly Val Gly Leu Ala Ile Leu
275 280 285
Thr Pro Asn Trp Met Glu Tyr Ile Leu Asn Asp Asp Thr Leu His Lys
290 295 300
Phe Val Ser Tyr Gly Ile Asn Val Trp Gly Ile Asp Lys Asn Lys Asp
305 310 315 320
Asn Tyr Glu Ile Ala Arg Glu Ala Ile Lys Asn Thr Arg Glu Tyr Phe
325 330 335
Asn Ser Leu Gly Ile Pro Ser Lys Leu Arg Glu Val Gly Ile Gly Lys
340 345 350
Asp Lys Leu Glu Leu Met Ala Lys Gln Ala Val Arg Asn Ser Gly Gly
355 360 365
Thr Ile Gly Ser Leu Arg Pro Ile Asn Ala Glu Asp Val Leu Glu Ile
370 375 380
Phe Lys Lys Ser Tyr
385
<210> 17
<211> 780
<212> DNA
<213> Klebsiella pneumoniae
<400> 17
atgaatcatt ctgctgaatg cacctgcgaa gagagtctat gcgaaaccct gcgggcgttt 60
tccgcgcagc atcccgagag cgtgctctat cagacatcgc tcatgagcgc cctgctgagc 120
ggggtttacg aaggcagcac caccatcgcg gacctgctga aacacggcga tttcggcctc 180
ggcaccttta atgagctgga cggggagctg atcgccttca gcagtcaggt ctatcagctg 240
cgcgccgacg gcagcgcgcg caaagcccag ccggagcaga aaacgccgtt cgcggtgatg 300
acctggttcc agccgcagta ccggaaaacc tttgaccatc cggtgagccg ccagcagctg 360
cacgaggtga tcgaccagca aatcccctct gacaacctgt tctgcgccct gcgcatcgac 420
ggccatttcc gccatgccca tacccgcacc gtgccgcgcc agacgccgcc gtaccgggcg 480
atgaccgacg tcctcgacga tcagccggtg ttccgcttta accagcgcga aggggtgctg 540
gtcggcttcc ggaccccgca gcatatgcag gggatcaacg tcgccgggta tcacgagcac 600
tttattaccg atgaccgcaa aggcggcggt cacctgctgg attaccagct cgaccatggg 660
gtgctgacct tcggcgaaat tcacaagctg atgatcgacc tgcccgccga cagcgcgttc 720
ctgcaggcta atctgcatcc cgataatctc gatgccgcca tccgttccgt agaaagttaa 780
<210> 18
<211> 259
<212> PRT
<213> Klebsiella pneumoniae
<400> 18
Met Asn His Ser Ala Glu Cys Thr Cys Glu Glu Ser Leu Cys Glu Thr
1 5 10 15
Leu Arg Ala Phe Ser Ala Gln His Pro Glu Ser Val Leu Tyr Gln Thr
20 25 30
Ser Leu Met Ser Ala Leu Leu Ser Gly Val Tyr Glu Gly Ser Thr Thr
35 40 45
Ile Ala Asp Leu Leu Lys His Gly Asp Phe Gly Leu Gly Thr Phe Asn
50 55 60
Glu Leu Asp Gly Glu Leu Ile Ala Phe Ser Ser Gln Val Tyr Gln Leu
65 70 75 80
Arg Ala Asp Gly Ser Ala Arg Lys Ala Gln Pro Glu Gln Lys Thr Pro
85 90 95
Phe Ala Val Met Thr Trp Phe Gln Pro Gln Tyr Arg Lys Thr Phe Asp
100 105 110
His Pro Val Ser Arg Gln Gln Leu His Glu Val Ile Asp Gln Gln Ile
115 120 125
Pro Ser Asp Asn Leu Phe Cys Ala Leu Arg Ile Asp Gly His Phe Arg
130 135 140
His Ala His Thr Arg Thr Val Pro Arg Gln Thr Pro Pro Tyr Arg Ala
145 150 155 160
Met Thr Asp Val Leu Asp Asp Gln Pro Val Phe Arg Phe Asn Gln Arg
165 170 175
Glu Gly Val Leu Val Gly Phe Arg Thr Pro Gln His Met Gln Gly Ile
180 185 190
Asn Val Ala Gly Tyr His Glu His Phe Ile Thr Asp Asp Arg Lys Gly
195 200 205
Gly Gly His Leu Leu Asp Tyr Gln Leu Asp His Gly Val Leu Thr Phe
210 215 220
Gly Glu Ile His Lys Leu Met Ile Asp Leu Pro Ala Asp Ser Ala Phe
225 230 235 240
Leu Gln Ala Asn Leu His Pro Asp Asn Leu Asp Ala Ala Ile Arg Ser
245 250 255
Val Glu Ser
<210> 19
<211> 1680
<212> DNA
<213> Klebsiella pneumoniae
<400> 19
atggacaaac agtatccggt acgccagtgg gcgcacggcg ccgatctcgt cgtcagtcag 60
ctggaagctc agggagtacg ccaggtgttc ggcatccccg gcgccaaaat tgacaaggtc 120
ttcgactcac tgctggattc ctcgattcgc attattccgg tacgccacga agccaacgcc 180
gcgtttatgg ccgccgccgt cggacgcatt accggcaaag cgggcgtggc gctggtcacc 240
tccggtccgg gctgttccaa cctgatcacc ggcatggcca ccgcgaacag cgaaggcgac 300
ccggtggtgg ccctgggcgg cgcggtaaaa cgcgccgata aagcgaagca ggtccaccag 360
agtatggata cggtggcgat gttcagcccg gtcaccaaat acgccgtcga ggtgacggcg 420
ccggatgcgc tggcggaagt ggtctccaac gccttccgcg ccgccgagca gggccggccg 480
ggcagcgcgt tcgttagcct gccgcaggat gtggtcgatg gcccggtcag cggcaaagtg 540
ctgccggcca gcggggcccc gcagatgggc gccgcgccgg atgatgccat cgaccaggtg 600
gcgaagctta tcgcccaggc gaagaacccg atcttcctgc tcggcctgat ggccagccag 660
ccggaaaaca gcaaggcgct gcgccgtttg ctggagacca gccatattcc agtcaccagc 720
acctatcagg ccgccggagc ggtgaatcag gataacttct ctcgcttcgc cggccgggtt 780
gggctgttta acaaccaggc cggggaccgt ctgctgcagc tcgccgacct ggtgatctgc 840
atcggctaca gcccggtgga atacgaaccg gcgatgtgga acagcggcaa cgcgacgctg 900
gtgcacatcg acgtgctgcc cgcctatgaa gagcgcaact acaccccgga tgtcgagctg 960
gtgggcgata tcgccggcac tctcaacaag ctggcgcaaa atatcgatca tcggctggtg 1020
ctctccccgc aggcggcgga gatcctccgc gaccgccagc accagcgcga gctgctggac 1080
cgccgcggcg cgcagctgaa ccagtttgcc ctgcatccgc tgcgcatcgt tcgcgccatg 1140
caggacatcg tcaacagcga cgtcacgttg accgtggaca tgggcagctt ccatatctgg 1200
attgcccgct acctgtacag cttccgcgcc cgtcaggtga tgatctccaa cggccagcag 1260
accatgggcg tcgccctgcc ctgggctatc ggcgcctggc tggtcaatcc tgagcgaaaa 1320
gtggtctccg tctccggcga cggcggcttc ctgcagtcga gcatggagct ggagaccgcc 1380
gtccgcctga aagccaacgt actgcacctg atctgggtcg ataacggcta caacatggtg 1440
gccattcagg aagagaaaaa ataccagcgc ctgtccggcg tcgagttcgg gccgatggat 1500
tttaaagcct atgccgaatc cttcggcgcg aaagggtttg ccgtggaaag cgccgaggcg 1560
ctggagccga ccctgcacgc ggcgatggac gtcgacggcc cggcggtggt ggccattccg 1620
gtggattatc gcgataaccc gctgctgatg ggccagctgc atctgagtca gattctgtaa 1680
<210> 20
<211> 559
<212> PRT
<213> Klebsiella pneumoniae
<400> 20
Met Asp Lys Gln Tyr Pro Val Arg Gln Trp Ala His Gly Ala Asp Leu
1 5 10 15
Val Val Ser Gln Leu Glu Ala Gln Gly Val Arg Gln Val Phe Gly Ile
20 25 30
Pro Gly Ala Lys Ile Asp Lys Val Phe Asp Ser Leu Leu Asp Ser Ser
35 40 45
Ile Arg Ile Ile Pro Val Arg His Glu Ala Asn Ala Ala Phe Met Ala
50 55 60
Ala Ala Val Gly Arg Ile Thr Gly Lys Ala Gly Val Ala Leu Val Thr
65 70 75 80
Ser Gly Pro Gly Cys Ser Asn Leu Ile Thr Gly Met Ala Thr Ala Asn
85 90 95
Ser Glu Gly Asp Pro Val Val Ala Leu Gly Gly Ala Val Lys Arg Ala
100 105 110
Asp Lys Ala Lys Gln Val His Gln Ser Met Asp Thr Val Ala Met Phe
115 120 125
Ser Pro Val Thr Lys Tyr Ala Val Glu Val Thr Ala Pro Asp Ala Leu
130 135 140
Ala Glu Val Val Ser Asn Ala Phe Arg Ala Ala Glu Gln Gly Arg Pro
145 150 155 160
Gly Ser Ala Phe Val Ser Leu Pro Gln Asp Val Val Asp Gly Pro Val
165 170 175
Ser Gly Lys Val Leu Pro Ala Ser Gly Ala Pro Gln Met Gly Ala Ala
180 185 190
Pro Asp Asp Ala Ile Asp Gln Val Ala Lys Leu Ile Ala Gln Ala Lys
195 200 205
Asn Pro Ile Phe Leu Leu Gly Leu Met Ala Ser Gln Pro Glu Asn Ser
210 215 220
Lys Ala Leu Arg Arg Leu Leu Glu Thr Ser His Ile Pro Val Thr Ser
225 230 235 240
Thr Tyr Gln Ala Ala Gly Ala Val Asn Gln Asp Asn Phe Ser Arg Phe
245 250 255
Ala Gly Arg Val Gly Leu Phe Asn Asn Gln Ala Gly Asp Arg Leu Leu
260 265 270
Gln Leu Ala Asp Leu Val Ile Cys Ile Gly Tyr Ser Pro Val Glu Tyr
275 280 285
Glu Pro Ala Met Trp Asn Ser Gly Asn Ala Thr Leu Val His Ile Asp
290 295 300
Val Leu Pro Ala Tyr Glu Glu Arg Asn Tyr Thr Pro Asp Val Glu Leu
305 310 315 320
Val Gly Asp Ile Ala Gly Thr Leu Asn Lys Leu Ala Gln Asn Ile Asp
325 330 335
His Arg Leu Val Leu Ser Pro Gln Ala Ala Glu Ile Leu Arg Asp Arg
340 345 350
Gln His Gln Arg Glu Leu Leu Asp Arg Arg Gly Ala Gln Leu Asn Gln
355 360 365
Phe Ala Leu His Pro Leu Arg Ile Val Arg Ala Met Gln Asp Ile Val
370 375 380
Asn Ser Asp Val Thr Leu Thr Val Asp Met Gly Ser Phe His Ile Trp
385 390 395 400
Ile Ala Arg Tyr Leu Tyr Ser Phe Arg Ala Arg Gln Val Met Ile Ser
405 410 415
Asn Gly Gln Gln Thr Met Gly Val Ala Leu Pro Trp Ala Ile Gly Ala
420 425 430
Trp Leu Val Asn Pro Glu Arg Lys Val Val Ser Val Ser Gly Asp Gly
435 440 445
Gly Phe Leu Gln Ser Ser Met Glu Leu Glu Thr Ala Val Arg Leu Lys
450 455 460
Ala Asn Val Leu His Leu Ile Trp Val Asp Asn Gly Tyr Asn Met Val
465 470 475 480
Ala Ile Gln Glu Glu Lys Lys Tyr Gln Arg Leu Ser Gly Val Glu Phe
485 490 495
Gly Pro Met Asp Phe Lys Ala Tyr Ala Glu Ser Phe Gly Ala Lys Gly
500 505 510
Phe Ala Val Glu Ser Ala Glu Ala Leu Glu Pro Thr Leu His Ala Ala
515 520 525
Met Asp Val Asp Gly Pro Ala Val Val Ala Ile Pro Val Asp Tyr Arg
530 535 540
Asp Asn Pro Leu Leu Met Gly Gln Leu His Leu Ser Gln Ile Leu
545 550 555
<210> 21
<211> 771
<212> DNA
<213> Klebsiella pneumoniae
<400> 21
atgaaaaaag tcgcacttgt taccggcgcc ggccagggga ttggtaaagc tatcgccctt 60
cgtctggtga aggatggatt tgccgtggcc attgccgatt ataacgacgc caccgccaaa 120
gcggtcgcct cggaaatcaa ccaggccggc ggacacgccg tggcggtgaa agtggatgtc 180
tccgaccgcg atcaggtatt tgccgccgtt gaacaggcgc gcaaaacgct gggcggcttc 240
gacgtcatcg tcaataacgc cggtgtggca ccgtctacgc cgatcgagtc cattaccccg 300
gagattgtcg acaaagtcta caacatcaac gtcaaagggg tgatctgggg tattcaggcg 360
gcggtcgagg cctttaagaa agaggggcac ggcgggaaaa tcatcaacgc ctgttcccag 420
gccggccacg tcggcaaccc ggagctggcg gtgtatagct ccagtaaatt cgcggtacgc 480
ggcttaaccc agaccgccgc tcgcgacctc gcgccgctgg gcatcacggt caacggctac 540
tgcccgggga ttgtcaaaac gccaatgtgg gccgaaattg accgccaggt gtccgaagcc 600
gccggtaaac cgctgggcta cggtaccgcc gagttcgcca aacgcatcac tctcggtcgt 660
ctgtccgagc cggaagatgt cgccgcctgc gtctcctatc ttgccagccc ggattctgat 720
tacatgaccg gtcagtcgtt gctgatcgac ggcgggatgg tatttaacta a 771
<210> 22
<211> 256
<212> PRT
<213> Klebsiella pneumoniae
<400> 22
Met Lys Lys Val Ala Leu Val Thr Gly Ala Gly Gln Gly Ile Gly Lys
1 5 10 15
Ala Ile Ala Leu Arg Leu Val Lys Asp Gly Phe Ala Val Ala Ile Ala
20 25 30
Asp Tyr Asn Asp Ala Thr Ala Lys Ala Val Ala Ser Glu Ile Asn Gln
35 40 45
Ala Gly Gly His Ala Val Ala Val Lys Val Asp Val Ser Asp Arg Asp
50 55 60
Gln Val Phe Ala Ala Val Glu Gln Ala Arg Lys Thr Leu Gly Gly Phe
65 70 75 80
Asp Val Ile Val Asn Asn Ala Gly Val Ala Pro Ser Thr Pro Ile Glu
85 90 95
Ser Ile Thr Pro Glu Ile Val Asp Lys Val Tyr Asn Ile Asn Val Lys
100 105 110
Gly Val Ile Trp Gly Ile Gln Ala Ala Val Glu Ala Phe Lys Lys Glu
115 120 125
Gly His Gly Gly Lys Ile Ile Asn Ala Cys Ser Gln Ala Gly His Val
130 135 140
Gly Asn Pro Glu Leu Ala Val Tyr Ser Ser Ser Lys Phe Ala Val Arg
145 150 155 160
Gly Leu Thr Gln Thr Ala Ala Arg Asp Leu Ala Pro Leu Gly Ile Thr
165 170 175
Val Asn Gly Tyr Cys Pro Gly Ile Val Lys Thr Pro Met Trp Ala Glu
180 185 190
Ile Asp Arg Gln Val Ser Glu Ala Ala Gly Lys Pro Leu Gly Tyr Gly
195 200 205
Thr Ala Glu Phe Ala Lys Arg Ile Thr Leu Gly Arg Leu Ser Glu Pro
210 215 220
Glu Asp Val Ala Ala Cys Val Ser Tyr Leu Ala Ser Pro Asp Ser Asp
225 230 235 240
Tyr Met Thr Gly Gln Ser Leu Leu Ile Asp Gly Gly Met Val Phe Asn
245 250 255
<210> 23
<211> 1665
<212> DNA
<213> Klebsiella oxytoca
<400> 23
atgagatcga aaagatttga agcactggcg aaacgccctg tgaatcagga cggcttcgtt 60
aaggagtgga tcgaagaagg ctttatcgcg atggaaagcc cgaacgaccc aaaaccgtcg 120
attaaaatcg ttaacggcgc ggtgaccgag ctggacggga aaccggtaag cgattttgac 180
ctgatcgacc actttatcgc ccgctacggt atcaacctga accgcgccga agaagtgatg 240
gcgatggatt cggtcaagct ggccaacatg ctgtgcgatc cgaacgttaa acgcagcgaa 300
atcgtcccgc tgaccaccgc gatgacgccg gcgaaaattg tcgaagtggt ttcgcatatg 360
aacgtcgtcg agatgatgat ggcgatgcag aaaatgcgcg cccgccgcac cccgtcccag 420
caggcgcacg tcaccaacgt caaagataac ccggtacaga ttgccgccga cgccgccgaa 480
ggggcatggc gcggatttga cgaacaggaa accaccgttg cggtagcgcg ctatgcgccg 540
ttcaacgcca tcgcgctgct ggtgggctcg caggtaggcc gtccgggcgt gctgacgcag 600
tgctcgctgg aagaagccac cgagctgaag ctcggcatgc tgggccacac ctgctacgcc 660
gaaaccatct ccgtctacgg caccgagccg gtctttaccg acggcgacga cacgccgtgg 720
tcgaagggct tcctcgcctc gtcctacgcc tctcgcgggc tgaaaatgcg ctttacctcc 780
ggctccggct cggaagtgca gatgggctac gccgaaggca aatccatgct ttatctggaa 840
gcgcgctgca tctacatcac caaagccgcg ggcgtacagg gtctgcaaaa cggttccgta 900
agctgcatcg gcgtgccgtc tgcggtgcct tccggcattc gcgcggtgct ggcggaaaac 960
ctgatctgtt cgtcgctgga tctggagtgc gcctccagca acgaccagac cttcacccac 1020
tccgatatgc gtcgtaccgc gcgcctgctg atgcagttcc tgccgggcac cgactttatc 1080
tcctccggtt attccgcggt gccgaactac gacaacatgt tcgccggctc caacgaagat 1140
gccgaagact ttgacgacta caacgtcatc cagcgcgacc tgaaggtgga cggcggtttg 1200
cgtccggttc gcgaagagga cgtcatcgcc atccgtaaca aagccgcccg cgcgctgcag 1260
gccgtgtttg ccggaatggg gctgccgccg attaccgatg aagaagttga agccgcgacc 1320
tacgcccacg gttcgaaaga tatgccggag cgcaacatcg tcgaagacat caagttcgcc 1380
caggaaatca tcaataaaaa ccgcaacggt ctggaagtgg tgaaagcgct ggcgcagggc 1440
ggattcaccg acgtggccca ggacatgctc aacatccaga aagctaagct gaccggggac 1500
tacctgcata cctccgcgat tatcgtcggc gacgggcagg tgctgtcagc cgtcaacgac 1560
gtcaacgact atgccggtcc ggcaacgggc tatcgcctgc agggcgaacg ctgggaagag 1620
attaaaaaca tccctggcgc tcttgatccc aacgagattg attaa 1665
<210> 24
<211> 554
<212> PRT
<213> Klebsiella oxytoca
<400> 24
Met Arg Ser Lys Arg Phe Glu Ala Leu Ala Lys Arg Pro Val Asn Gln
1 5 10 15
Asp Gly Phe Val Lys Glu Trp Ile Glu Glu Gly Phe Ile Ala Met Glu
20 25 30
Ser Pro Asn Asp Pro Lys Pro Ser Ile Lys Ile Val Asn Gly Ala Val
35 40 45
Thr Glu Leu Asp Gly Lys Pro Val Ser Asp Phe Asp Leu Ile Asp His
50 55 60
Phe Ile Ala Arg Tyr Gly Ile Asn Leu Asn Arg Ala Glu Glu Val Met
65 70 75 80
Ala Met Asp Ser Val Lys Leu Ala Asn Met Leu Cys Asp Pro Asn Val
85 90 95
Lys Arg Ser Glu Ile Val Pro Leu Thr Thr Ala Met Thr Pro Ala Lys
100 105 110
Ile Val Glu Val Val Ser His Met Asn Val Val Glu Met Met Met Ala
115 120 125
Met Gln Lys Met Arg Ala Arg Arg Thr Pro Ser Gln Gln Ala His Val
130 135 140
Thr Asn Val Lys Asp Asn Pro Val Gln Ile Ala Ala Asp Ala Ala Glu
145 150 155 160
Gly Ala Trp Arg Gly Phe Asp Glu Gln Glu Thr Thr Val Ala Val Ala
165 170 175
Arg Tyr Ala Pro Phe Asn Ala Ile Ala Leu Leu Val Gly Ser Gln Val
180 185 190
Gly Arg Pro Gly Val Leu Thr Gln Cys Ser Leu Glu Glu Ala Thr Glu
195 200 205
Leu Lys Leu Gly Met Leu Gly His Thr Cys Tyr Ala Glu Thr Ile Ser
210 215 220
Val Tyr Gly Thr Glu Pro Val Phe Thr Asp Gly Asp Asp Thr Pro Trp
225 230 235 240
Ser Lys Gly Phe Leu Ala Ser Ser Tyr Ala Ser Arg Gly Leu Lys Met
245 250 255
Arg Phe Thr Ser Gly Ser Gly Ser Glu Val Gln Met Gly Tyr Ala Glu
260 265 270
Gly Lys Ser Met Leu Tyr Leu Glu Ala Arg Cys Ile Tyr Ile Thr Lys
275 280 285
Ala Ala Gly Val Gln Gly Leu Gln Asn Gly Ser Val Ser Cys Ile Gly
290 295 300
Val Pro Ser Ala Val Pro Ser Gly Ile Arg Ala Val Leu Ala Glu Asn
305 310 315 320
Leu Ile Cys Ser Ser Leu Asp Leu Glu Cys Ala Ser Ser Asn Asp Gln
325 330 335
Thr Phe Thr His Ser Asp Met Arg Arg Thr Ala Arg Leu Leu Met Gln
340 345 350
Phe Leu Pro Gly Thr Asp Phe Ile Ser Ser Gly Tyr Ser Ala Val Pro
355 360 365
Asn Tyr Asp Asn Met Phe Ala Gly Ser Asn Glu Asp Ala Glu Asp Phe
370 375 380
Asp Asp Tyr Asn Val Ile Gln Arg Asp Leu Lys Val Asp Gly Gly Leu
385 390 395 400
Arg Pro Val Arg Glu Glu Asp Val Ile Ala Ile Arg Asn Lys Ala Ala
405 410 415
Arg Ala Leu Gln Ala Val Phe Ala Gly Met Gly Leu Pro Pro Ile Thr
420 425 430
Asp Glu Glu Val Glu Ala Ala Thr Tyr Ala His Gly Ser Lys Asp Met
435 440 445
Pro Glu Arg Asn Ile Val Glu Asp Ile Lys Phe Ala Gln Glu Ile Ile
450 455 460
Asn Lys Asn Arg Asn Gly Leu Glu Val Val Lys Ala Leu Ala Gln Gly
465 470 475 480
Gly Phe Thr Asp Val Ala Gln Asp Met Leu Asn Ile Gln Lys Ala Lys
485 490 495
Leu Thr Gly Asp Tyr Leu His Thr Ser Ala Ile Ile Val Gly Asp Gly
500 505 510
Gln Val Leu Ser Ala Val Asn Asp Val Asn Asp Tyr Ala Gly Pro Ala
515 520 525
Thr Gly Tyr Arg Leu Gln Gly Glu Arg Trp Glu Glu Ile Lys Asn Ile
530 535 540
Pro Gly Ala Leu Asp Pro Asn Glu Ile Asp
545 550
<210> 25
<211> 675
<212> DNA
<213> Klebsiella oxytoca
<400> 25
atggaaatta atgaaaaatt gctgcgccag ataattgaag acgtgctcag cgagatgaag 60
ggcagcgata aaccggtctc gtttaatgcg ccggcggcct ccgcggcgcc ccaggccacg 120
ccgcccgccg gcgacggctt cctgacggaa gtgggcgaag cgcgtcaggg aacccagcag 180
gacgaagtga ttatcgccgt cggcccggct ttcggcctgg cgcagaccgt caatatcgtc 240
ggcatcccgc ataagagcat tttgcgcgaa gtcattgccg gtattgaaga agaaggcatt 300
aaggcgcgcg tgattcgctg ctttaaatcc tccgacgtgg ccttcgtcgc cgttgaaggt 360
aatcgcctga gcggctccgg catctctatc ggcatccagt cgaaaggcac cacggtgatc 420
caccagcagg ggctgccgcc gctctctaac ctggagctgt tcccgcaggc gccgctgctg 480
accctggaaa cctatcgcca gatcggcaaa aacgccgccc gctatgcgaa acgcgaatcg 540
ccgcagccgg tcccgacgct gaatgaccag atggcgcggc cgaagtacca ggcgaaatcg 600
gccattttgc acattaaaga gaccaagtac gtggtgacgg gcaaaaaccc gcaggaactg 660
cgcgtggcgc tttga 675
<210> 26
<211> 224
<212> PRT
<213> Klebsiella oxytoca
<400> 26
Met Glu Ile Asn Glu Lys Leu Leu Arg Gln Ile Ile Glu Asp Val Leu
1 5 10 15
Ser Glu Met Lys Gly Ser Asp Lys Pro Val Ser Phe Asn Ala Pro Ala
20 25 30
Ala Ser Ala Ala Pro Gln Ala Thr Pro Pro Ala Gly Asp Gly Phe Leu
35 40 45
Thr Glu Val Gly Glu Ala Arg Gln Gly Thr Gln Gln Asp Glu Val Ile
50 55 60
Ile Ala Val Gly Pro Ala Phe Gly Leu Ala Gln Thr Val Asn Ile Val
65 70 75 80
Gly Ile Pro His Lys Ser Ile Leu Arg Glu Val Ile Ala Gly Ile Glu
85 90 95
Glu Glu Gly Ile Lys Ala Arg Val Ile Arg Cys Phe Lys Ser Ser Asp
100 105 110
Val Ala Phe Val Ala Val Glu Gly Asn Arg Leu Ser Gly Ser Gly Ile
115 120 125
Ser Ile Gly Ile Gln Ser Lys Gly Thr Thr Val Ile His Gln Gln Gly
130 135 140
Leu Pro Pro Leu Ser Asn Leu Glu Leu Phe Pro Gln Ala Pro Leu Leu
145 150 155 160
Thr Leu Glu Thr Tyr Arg Gln Ile Gly Lys Asn Ala Ala Arg Tyr Ala
165 170 175
Lys Arg Glu Ser Pro Gln Pro Val Pro Thr Leu Asn Asp Gln Met Ala
180 185 190
Arg Pro Lys Tyr Gln Ala Lys Ser Ala Ile Leu His Ile Lys Glu Thr
195 200 205
Lys Tyr Val Val Thr Gly Lys Asn Pro Gln Glu Leu Arg Val Ala Leu
210 215 220
<210> 27
<211> 522
<212> DNA
<213> Klebsiella oxytoca
<400> 27
atgaataccg acgcaattga atcgatggta cgcgacgtat tgagccgcat gaacagcctg 60
cagggcgagg cgcctgcggc ggctccggcg gctggcggcg cgtcccgtag cgccagggtc 120
agcgactacc cgctggcgaa caagcacccg gaatgggtga aaaccgccac caataaaacg 180
ctggacgact ttacgctgga aaacgtgctg agcaataaag tcaccgccca ggatatgcgt 240
attaccccgg aaaccctgcg cttacaggct tctattgcca aagacgcggg ccgcgaccgg 300
ctggcgatga acttcgagcg cgccgccgag ctgaccgcgg taccggacga tcgcattctt 360
gaaatctaca acgccctccg cccctatcgc tcgacgaaag aggagctgct ggcgatcgcc 420
gacgatctcg aaagccgcta tcaggcgaag atttgcgccg ctttcgttcg cgaagcggcc 480
acgctgtacg tcgagcgtaa aaaactcaaa ggcgacgatt aa 522
<210> 28
<211> 173
<212> PRT
<213> Klebsiella oxytoca
<400> 28
Met Asn Thr Asp Ala Ile Glu Ser Met Val Arg Asp Val Leu Ser Arg
1 5 10 15
Met Asn Ser Leu Gln Gly Glu Ala Pro Ala Ala Ala Pro Ala Ala Gly
20 25 30
Gly Ala Ser Arg Ser Ala Arg Val Ser Asp Tyr Pro Leu Ala Asn Lys
35 40 45
His Pro Glu Trp Val Lys Thr Ala Thr Asn Lys Thr Leu Asp Asp Phe
50 55 60
Thr Leu Glu Asn Val Leu Ser Asn Lys Val Thr Ala Gln Asp Met Arg
65 70 75 80
Ile Thr Pro Glu Thr Leu Arg Leu Gln Ala Ser Ile Ala Lys Asp Ala
85 90 95
Gly Arg Asp Arg Leu Ala Met Asn Phe Glu Arg Ala Ala Glu Leu Thr
100 105 110
Ala Val Pro Asp Asp Arg Ile Leu Glu Ile Tyr Asn Ala Leu Arg Pro
115 120 125
Tyr Arg Ser Thr Lys Glu Glu Leu Leu Ala Ile Ala Asp Asp Leu Glu
130 135 140
Ser Arg Tyr Gln Ala Lys Ile Cys Ala Ala Phe Val Arg Glu Ala Ala
145 150 155 160
Thr Leu Tyr Val Glu Arg Lys Lys Leu Lys Gly Asp Asp
165 170
<210> 29
<211> 1041
<212> DNA
<213> Rhodococcus ruber
<400> 29
atgaaagccc tccagtacac cgagatcggc tccgagccgg tcgtcgtcga cgtccccacc 60
ccggcgcccg ggccgggtga gatcctgctg aaggtcaccg cggccggctt gtgccactcg 120
gacatcttcg tgatggacat gccggcagag cagtacatct acggtcttcc cctcaccctc 180
ggccacgagg gcgtcggcac cgtcgccgaa ctcggcgccg gcgtcaccgg attcgagacg 240
ggggacgccg tcgccgtgta cgggccgtgg gggtgcggtg cgtgccacgc gtgcgcgcgc 300
ggccgggaga actactgcac ccgcgccgcc gagctgggca tcaccccgcc cggtctcggc 360
tcgcccgggt cgatggccga gtacatgatc gtcgactcgg cgcgccacct cgtcccgatc 420
ggggacctcg accccgtcgc ggcggttccg ctcaccgacg cgggcctgac gccgtaccac 480
gcgatctcgc gggtcctgcc cctgctggga cccggctcga ccgcggtcgt catcggggtc 540
ggcggactcg ggcacgtcgg catccagatc ctgcgcgccg tcagcgcggc ccgcgtgatc 600
gccgtcgatc tcgacgacga ccgactcgcg ctcgcccgcg aggtcggcgc cgacgcggcg 660
gtgaagtcgg gcgccggggc ggcggacgcg atccgggagc tgaccggcgg tgagggcgcg 720
acggcggtgt tcgacttcgt cggcgcccag tcgacgatcg acacggcgca gcaggtggtc 780
gcgatcgacg ggcacatctc ggtggtcggc atccatgccg gcgcccacgc caaggtcggc 840
ttcttcatga tcccgttcgg cgcgtccgtc gtgacgccgt actggggcac gcggtccgag 900
ctgatggacg tcgtggacct ggcccgtgcc ggccggctcg acatccacac cgagacgttc 960
accctcgacg agggacccac ggcctaccgg cggctacgcg agggcagcat ccgcggccgc 1020
ggggtggtcg tcccgggctg a 1041
<210> 30
<211> 346
<212> PRT
<213> Rhodococcus ruber
<400> 30
Met Lys Ala Leu Gln Tyr Thr Glu Ile Gly Ser Glu Pro Val Val Val
1 5 10 15
Asp Val Pro Thr Pro Ala Pro Gly Pro Gly Glu Ile Leu Leu Lys Val
20 25 30
Thr Ala Ala Gly Leu Cys His Ser Asp Ile Phe Val Met Asp Met Pro
35 40 45
Ala Glu Gln Tyr Ile Tyr Gly Leu Pro Leu Thr Leu Gly His Glu Gly
50 55 60
Val Gly Thr Val Ala Glu Leu Gly Ala Gly Val Thr Gly Phe Glu Thr
65 70 75 80
Gly Asp Ala Val Ala Val Tyr Gly Pro Trp Gly Cys Gly Ala Cys His
85 90 95
Ala Cys Ala Arg Gly Arg Glu Asn Tyr Cys Thr Arg Ala Ala Glu Leu
100 105 110
Gly Ile Thr Pro Pro Gly Leu Gly Ser Pro Gly Ser Met Ala Glu Tyr
115 120 125
Met Ile Val Asp Ser Ala Arg His Leu Val Pro Ile Gly Asp Leu Asp
130 135 140
Pro Val Ala Ala Val Pro Leu Thr Asp Ala Gly Leu Thr Pro Tyr His
145 150 155 160
Ala Ile Ser Arg Val Leu Pro Leu Leu Gly Pro Gly Ser Thr Ala Val
165 170 175
Val Ile Gly Val Gly Gly Leu Gly His Val Gly Ile Gln Ile Leu Arg
180 185 190
Ala Val Ser Ala Ala Arg Val Ile Ala Val Asp Leu Asp Asp Asp Arg
195 200 205
Leu Ala Leu Ala Arg Glu Val Gly Ala Asp Ala Ala Val Lys Ser Gly
210 215 220
Ala Gly Ala Ala Asp Ala Ile Arg Glu Leu Thr Gly Gly Glu Gly Ala
225 230 235 240
Thr Ala Val Phe Asp Phe Val Gly Ala Gln Ser Thr Ile Asp Thr Ala
245 250 255
Gln Gln Val Val Ala Ile Asp Gly His Ile Ser Val Val Gly Ile His
260 265 270
Ala Gly Ala His Ala Lys Val Gly Phe Phe Met Ile Pro Phe Gly Ala
275 280 285
Ser Val Val Thr Pro Tyr Trp Gly Thr Arg Ser Glu Leu Met Asp Val
290 295 300
Val Asp Leu Ala Arg Ala Gly Arg Leu Asp Ile His Thr Glu Thr Phe
305 310 315 320
Thr Leu Asp Glu Gly Pro Thr Ala Tyr Arg Arg Leu Arg Glu Gly Ser
325 330 335
Ile Arg Gly Arg Gly Val Val Val Pro Gly
340 345
<210> 31
<211> 1476
<212> DNA
<213> Escherichia coli
<400> 31
atggctaact acttcaatac actgaatctg cgccagcagc tggcacagct gggcaaatgt 60
cgctttatgg gccgcgatga attcgccgat ggcgcgagct accttcaggg taaaaaagta 120
gtcatcgtcg gctgtggcgc acagggtctg aaccagggcc tgaacatgcg tgattctggt 180
ctcgatatct cctacgctct gcgtaaagaa gcgattgccg agaagcgcgc gtcctggcgt 240
aaagcgaccg aaaatggttt taaagtgggt acttacgaag aactgatccc acaggcggat 300
ctggtgatta acctgacgcc ggacaagcag cactctgatg tagtgcgcac cgtacagcca 360
ctgatgaaag acggcgcggc gctgggctac tcgcacggtt tcaacatcgt cgaagtgggc 420
gagcagatcc gtaaagatat caccgtagtg atggttgcgc cgaaatgccc aggcaccgaa 480
gtgcgtgaag agtacaaacg tgggttcggc gtaccgacgc tgattgccgt tcacccggaa 540
aacgatccga aaggcgaagg catggcgatt gccaaagcct gggcggctgc aaccggtggt 600
caccgtgcgg gtgtgctgga atcgtccttc gttgcggaag tgaaatctga cctgatgggc 660
gagcaaacca tcctgtgcgg tatgttgcag gctggctctc tgctgtgctt cgacaagctg 720
gtggaagaag gtaccgatcc agcatacgca gaaaaactga ttcagttcgg ttgggaaacc 780
atcaccgaag cactgaaaca gggcggcatc accctgatga tggaccgtct ctctaacccg 840
gcgaaactgc gtgcttatgc gctttctgaa cagctgaaag agatcatggc acccctgttc 900
cagaaacata tggacgacat catctccggc gaattctctt ccggtatgat ggcggactgg 960
gccaacgatg ataagaaact gctgacctgg cgtgaagaga ccggcaaaac cgcgtttgaa 1020
accgcgccgc agtatgaagg caaaatcggc gagcaggagt acttcgataa aggcgtactg 1080
atgattgcga tggtgaaagc gggcgttgaa ctggcgttcg aaaccatggt cgattccggc 1140
atcattgaag agtctgcata ttatgaatca ctgcacgagc tgccgctgat tgccaacacc 1200
atcgcccgta agcgtctgta cgaaatgaac gtggttatct ctgataccgc tgagtacggt 1260
aactatctgt tctcttacgc ttgtgtgccg ttgctgaaac cgtttatggc agagctgcaa 1320
ccgggcgacc tgggtaaagc tattccggaa ggcgcggtag ataacgggca actgcgtgat 1380
gtgaacgaag cgattcgcag ccatgcgatt gagcaggtag gtaagaaact gcgcggctat 1440
atgacagata tgaaacgtat tgctgttgcg ggttaa 1476
<210> 32
<211> 491
<212> PRT
<213> Escherichia coli
<400> 32
Met Ala Asn Tyr Phe Asn Thr Leu Asn Leu Arg Gln Gln Leu Ala Gln
1 5 10 15
Leu Gly Lys Cys Arg Phe Met Gly Arg Asp Glu Phe Ala Asp Gly Ala
20 25 30
Ser Tyr Leu Gln Gly Lys Lys Val Val Ile Val Gly Cys Gly Ala Gln
35 40 45
Gly Leu Asn Gln Gly Leu Asn Met Arg Asp Ser Gly Leu Asp Ile Ser
50 55 60
Tyr Ala Leu Arg Lys Glu Ala Ile Ala Glu Lys Arg Ala Ser Trp Arg
65 70 75 80
Lys Ala Thr Glu Asn Gly Phe Lys Val Gly Thr Tyr Glu Glu Leu Ile
85 90 95
Pro Gln Ala Asp Leu Val Ile Asn Leu Thr Pro Asp Lys Gln His Ser
100 105 110
Asp Val Val Arg Thr Val Gln Pro Leu Met Lys Asp Gly Ala Ala Leu
115 120 125
Gly Tyr Ser His Gly Phe Asn Ile Val Glu Val Gly Glu Gln Ile Arg
130 135 140
Lys Asp Ile Thr Val Val Met Val Ala Pro Lys Cys Pro Gly Thr Glu
145 150 155 160
Val Arg Glu Glu Tyr Lys Arg Gly Phe Gly Val Pro Thr Leu Ile Ala
165 170 175
Val His Pro Glu Asn Asp Pro Lys Gly Glu Gly Met Ala Ile Ala Lys
180 185 190
Ala Trp Ala Ala Ala Thr Gly Gly His Arg Ala Gly Val Leu Glu Ser
195 200 205
Ser Phe Val Ala Glu Val Lys Ser Asp Leu Met Gly Glu Gln Thr Ile
210 215 220
Leu Cys Gly Met Leu Gln Ala Gly Ser Leu Leu Cys Phe Asp Lys Leu
225 230 235 240
Val Glu Glu Gly Thr Asp Pro Ala Tyr Ala Glu Lys Leu Ile Gln Phe
245 250 255
Gly Trp Glu Thr Ile Thr Glu Ala Leu Lys Gln Gly Gly Ile Thr Leu
260 265 270
Met Met Asp Arg Leu Ser Asn Pro Ala Lys Leu Arg Ala Tyr Ala Leu
275 280 285
Ser Glu Gln Leu Lys Glu Ile Met Ala Pro Leu Phe Gln Lys His Met
290 295 300
Asp Asp Ile Ile Ser Gly Glu Phe Ser Ser Gly Met Met Ala Asp Trp
305 310 315 320
Ala Asn Asp Asp Lys Lys Leu Leu Thr Trp Arg Glu Glu Thr Gly Lys
325 330 335
Thr Ala Phe Glu Thr Ala Pro Gln Tyr Glu Gly Lys Ile Gly Glu Gln
340 345 350
Glu Tyr Phe Asp Lys Gly Val Leu Met Ile Ala Met Val Lys Ala Gly
355 360 365
Val Glu Leu Ala Phe Glu Thr Met Val Asp Ser Gly Ile Ile Glu Glu
370 375 380
Ser Ala Tyr Tyr Glu Ser Leu His Glu Leu Pro Leu Ile Ala Asn Thr
385 390 395 400
Ile Ala Arg Lys Arg Leu Tyr Glu Met Asn Val Val Ile Ser Asp Thr
405 410 415
Ala Glu Tyr Gly Asn Tyr Leu Phe Ser Tyr Ala Cys Val Pro Leu Leu
420 425 430
Lys Pro Phe Met Ala Glu Leu Gln Pro Gly Asp Leu Gly Lys Ala Ile
435 440 445
Pro Glu Gly Ala Val Asp Asn Gly Gln Leu Arg Asp Val Asn Glu Ala
450 455 460
Ile Arg Ser His Ala Ile Glu Gln Val Gly Lys Lys Leu Arg Gly Tyr
465 470 475 480
Met Thr Asp Met Lys Arg Ile Ala Val Ala Gly
485 490
<210> 33
<211> 1851
<212> DNA
<213> Escherichia coli
<400> 33
atgcctaagt accgttccgc caccaccact catggtcgta atatggcggg tgctcgtgcg 60
ctgtggcgcg ccaccggaat gaccgacgcc gatttcggta agccgattat cgcggttgtg 120
aactcgttca cccaatttgt accgggtcac gtccatctgc gcgatctcgg taaactggtc 180
gccgaacaaa ttgaagcggc tggcggcgtt gccaaagagt tcaacaccat tgcggtggat 240
gatgggattg ccatgggcca cggggggatg ctttattcac tgccatctcg cgaactgatc 300
gctgattccg ttgagtatat ggtcaacgcc cactgcgccg acgccatggt ctgcatctct 360
aactgcgaca aaatcacccc ggggatgctg atggcttccc tgcgcctgaa tattccggtg 420
atctttgttt ccggcggccc gatggaggcc gggaaaacca aactttccga tcagatcatc 480
aagctcgatc tggttgatgc gatgatccag ggcgcagacc cgaaagtatc tgactcccag 540
agcgatcagg ttgaacgttc cgcgtgtccg acctgcggtt cctgctccgg gatgtttacc 600
gctaactcaa tgaactgcct gaccgaagcg ctgggcctgt cgcagccggg caacggctcg 660
ctgctggcaa cccacgccga ccgtaagcag ctgttcctta atgctggtaa acgcattgtt 720
gaattgacca aacgttatta cgagcaaaac gacgaaagtg cactgccgcg taatatcgcc 780
agtaaggcgg cgtttgaaaa cgccatgacg ctggatatcg cgatgggtgg atcgactaac 840
accgtacttc acctgctggc ggcggcgcag gaagcggaaa tcgacttcac catgagtgat 900
atcgataagc tttcccgcaa ggttccacag ctgtgtaaag ttgcgccgag cacccagaaa 960
taccatatgg aagatgttca ccgtgctggt ggtgttatcg gtattctcgg cgaactggat 1020
cgcgcggggt tactgaaccg tgatgtgaaa aacgtacttg gcctgacgtt gccgcaaacg 1080
ctggaacaat acgacgttat gctgacccag gatgacgcgg taaaaaatat gttccgcgca 1140
ggtcctgcag gcattcgtac cacacaggca ttctcgcaag attgccgttg ggatacgctg 1200
gacgacgatc gcgccaatgg ctgtatccgc tcgctggaac acgcctacag caaagacggc 1260
ggcctggcgg tgctctacgg taactttgcg gaaaacggct gcatcgtgaa aacggcaggc 1320
gtcgatgaca gcatcctcaa attcaccggc ccggcgaaag tgtacgaaag ccaggacgat 1380
gcggtagaag cgattctcgg cggtaaagtt gtcgccggag atgtggtagt aattcgctat 1440
gaaggcccga aaggcggtcc ggggatgcag gaaatgctct acccaaccag cttcctgaaa 1500
tcaatgggtc tcggcaaagc ctgtgcgctg atcaccgacg gtcgtttctc tggtggcacc 1560
tctggtcttt ccatcggcca cgtctcaccg gaagcggcaa gcggcggcag cattggcctg 1620
attgaagatg gtgacctgat cgctatcgac atcccgaacc gtggcattca gttacaggta 1680
agcgatgccg aactggcggc gcgtcgtgaa gcgcaggacg ctcgaggtga caaagcctgg 1740
acgccgaaaa atcgtgaacg tcaggtctcc tttgccctgc gtgcttatgc cagcctggca 1800
accagcgccg acaaaggcgc ggtgcgcgat aaatcgaaac tggggggtta a 1851
<210> 34
<211> 616
<212> PRT
<213> Escherichia coli
<400> 34
Met Pro Lys Tyr Arg Ser Ala Thr Thr Thr His Gly Arg Asn Met Ala
1 5 10 15
Gly Ala Arg Ala Leu Trp Arg Ala Thr Gly Met Thr Asp Ala Asp Phe
20 25 30
Gly Lys Pro Ile Ile Ala Val Val Asn Ser Phe Thr Gln Phe Val Pro
35 40 45
Gly His Val His Leu Arg Asp Leu Gly Lys Leu Val Ala Glu Gln Ile
50 55 60
Glu Ala Ala Gly Gly Val Ala Lys Glu Phe Asn Thr Ile Ala Val Asp
65 70 75 80
Asp Gly Ile Ala Met Gly His Gly Gly Met Leu Tyr Ser Leu Pro Ser
85 90 95
Arg Glu Leu Ile Ala Asp Ser Val Glu Tyr Met Val Asn Ala His Cys
100 105 110
Ala Asp Ala Met Val Cys Ile Ser Asn Cys Asp Lys Ile Thr Pro Gly
115 120 125
Met Leu Met Ala Ser Leu Arg Leu Asn Ile Pro Val Ile Phe Val Ser
130 135 140
Gly Gly Pro Met Glu Ala Gly Lys Thr Lys Leu Ser Asp Gln Ile Ile
145 150 155 160
Lys Leu Asp Leu Val Asp Ala Met Ile Gln Gly Ala Asp Pro Lys Val
165 170 175
Ser Asp Ser Gln Ser Asp Gln Val Glu Arg Ser Ala Cys Pro Thr Cys
180 185 190
Gly Ser Cys Ser Gly Met Phe Thr Ala Asn Ser Met Asn Cys Leu Thr
195 200 205
Glu Ala Leu Gly Leu Ser Gln Pro Gly Asn Gly Ser Leu Leu Ala Thr
210 215 220
His Ala Asp Arg Lys Gln Leu Phe Leu Asn Ala Gly Lys Arg Ile Val
225 230 235 240
Glu Leu Thr Lys Arg Tyr Tyr Glu Gln Asn Asp Glu Ser Ala Leu Pro
245 250 255
Arg Asn Ile Ala Ser Lys Ala Ala Phe Glu Asn Ala Met Thr Leu Asp
260 265 270
Ile Ala Met Gly Gly Ser Thr Asn Thr Val Leu His Leu Leu Ala Ala
275 280 285
Ala Gln Glu Ala Glu Ile Asp Phe Thr Met Ser Asp Ile Asp Lys Leu
290 295 300
Ser Arg Lys Val Pro Gln Leu Cys Lys Val Ala Pro Ser Thr Gln Lys
305 310 315 320
Tyr His Met Glu Asp Val His Arg Ala Gly Gly Val Ile Gly Ile Leu
325 330 335
Gly Glu Leu Asp Arg Ala Gly Leu Leu Asn Arg Asp Val Lys Asn Val
340 345 350
Leu Gly Leu Thr Leu Pro Gln Thr Leu Glu Gln Tyr Asp Val Met Leu
355 360 365
Thr Gln Asp Asp Ala Val Lys Asn Met Phe Arg Ala Gly Pro Ala Gly
370 375 380
Ile Arg Thr Thr Gln Ala Phe Ser Gln Asp Cys Arg Trp Asp Thr Leu
385 390 395 400
Asp Asp Asp Arg Ala Asn Gly Cys Ile Arg Ser Leu Glu His Ala Tyr
405 410 415
Ser Lys Asp Gly Gly Leu Ala Val Leu Tyr Gly Asn Phe Ala Glu Asn
420 425 430
Gly Cys Ile Val Lys Thr Ala Gly Val Asp Asp Ser Ile Leu Lys Phe
435 440 445
Thr Gly Pro Ala Lys Val Tyr Glu Ser Gln Asp Asp Ala Val Glu Ala
450 455 460
Ile Leu Gly Gly Lys Val Val Ala Gly Asp Val Val Val Ile Arg Tyr
465 470 475 480
Glu Gly Pro Lys Gly Gly Pro Gly Met Gln Glu Met Leu Tyr Pro Thr
485 490 495
Ser Phe Leu Lys Ser Met Gly Leu Gly Lys Ala Cys Ala Leu Ile Thr
500 505 510
Asp Gly Arg Phe Ser Gly Gly Thr Ser Gly Leu Ser Ile Gly His Val
515 520 525
Ser Pro Glu Ala Ala Ser Gly Gly Ser Ile Gly Leu Ile Glu Asp Gly
530 535 540
Asp Leu Ile Ala Ile Asp Ile Pro Asn Arg Gly Ile Gln Leu Gln Val
545 550 555 560
Ser Asp Ala Glu Leu Ala Ala Arg Arg Glu Ala Gln Asp Ala Arg Gly
565 570 575
Asp Lys Ala Trp Thr Pro Lys Asn Arg Glu Arg Gln Val Ser Phe Ala
580 585 590
Leu Arg Ala Tyr Ala Ser Leu Ala Thr Ser Ala Asp Lys Gly Ala Val
595 600 605
Arg Asp Lys Ser Lys Leu Gly Gly
610 615
<210> 35
<211> 1662
<212> DNA
<213> Lactococcus lactis
<400> 35
tctagacata tgtatactgt gggggattac ctgctggatc gcctgcacga actggggatt 60
gaagaaattt tcggtgtgcc aggcgattat aacctgcagt tcctggacca gattatctcg 120
cacaaagata tgaagtgggt cggtaacgcc aacgaactga acgcgagcta tatggcagat 180
ggttatgccc gtaccaaaaa agctgctgcg tttctgacga cctttggcgt tggcgaactg 240
agcgccgtca acggactggc aggaagctac gccgagaacc tgccagttgt cgaaattgtt 300
gggtcgccta cttctaaggt tcagaatgaa ggcaaatttg tgcaccatac tctggctgat 360
ggggatttta aacattttat gaaaatgcat gaaccggtta ctgcggcccg cacgctgctg 420
acagcagaga atgctacggt tgagatcgac cgcgtcctgt ctgcgctgct gaaagagcgc 480
aagccggtat atatcaatct gcctgtcgat gttgccgcag cgaaagccga aaagccgtcg 540
ctgccactga aaaaagaaaa cagcacctcc aatacatcgg accaggaaat tctgaataaa 600
atccaggaat cactgaagaa tgcgaagaaa ccgatcgtca tcaccggaca tgagatcatc 660
tcttttggcc tggaaaaaac ggtcacgcag ttcatttcta agaccaaact gcctatcacc 720
accctgaact tcggcaaatc tagcgtcgat gaagcgctgc cgagttttct gggtatctat 780
aatggtaccc tgtccgaacc gaacctgaaa gaattcgtcg aaagcgcgga ctttatcctg 840
atgctgggcg tgaaactgac ggatagctcc acaggcgcat ttacccacca tctgaacgag 900
aataaaatga tttccctgaa tatcgacgaa ggcaaaatct ttaacgagcg catccagaac 960
ttcgattttg aatctctgat tagttcgctg ctggatctgt ccgaaattga gtataaaggt 1020
aaatatattg ataaaaaaca ggaggatttt gtgccgtcta atgcgctgct gagtcaggat 1080
cgtctgtggc aagccgtaga aaacctgaca cagtctaatg aaacgattgt tgcggaacag 1140
ggaacttcat ttttcggcgc ctcatccatt tttctgaaat ccaaaagcca tttcattggc 1200
caaccgctgt gggggagtat tggttatacc tttccggcgg cgctgggttc acagattgca 1260
gataaggaat cacgccatct gctgtttatt ggtgacggca gcctgcagct gactgtccag 1320
gaactggggc tggcgatccg tgaaaaaatc aatccgattt gctttatcat caataacgac 1380
ggctacaccg tcgaacgcga aattcatgga ccgaatcaaa gttacaatga catcccgatg 1440
tggaactata gcaaactgcc ggaatccttt ggcgcgacag aggatcgcgt ggtgagtaaa 1500
attgtgcgta cggaaaacga atttgtgtcg gttatgaaag aagcgcaggc tgacccgaat 1560
cgcatgtatt ggattgaact gatcctggca aaagaaggcg caccgaaagt tctgaaaaag 1620
atggggaaac tgtttgcgga gcaaaataaa agctaaggat cc 1662
<210> 36
<211> 548
<212> PRT
<213> Lactococcus lactis
<400> 36
Met Tyr Thr Val Gly Asp Tyr Leu Leu Asp Arg Leu His Glu Leu Gly
1 5 10 15
Ile Glu Glu Ile Phe Gly Val Pro Gly Asp Tyr Asn Leu Gln Phe Leu
20 25 30
Asp Gln Ile Ile Ser His Lys Asp Met Lys Trp Val Gly Asn Ala Asn
35 40 45
Glu Leu Asn Ala Ser Tyr Met Ala Asp Gly Tyr Ala Arg Thr Lys Lys
50 55 60
Ala Ala Ala Phe Leu Thr Thr Phe Gly Val Gly Glu Leu Ser Ala Val
65 70 75 80
Asn Gly Leu Ala Gly Ser Tyr Ala Glu Asn Leu Pro Val Val Glu Ile
85 90 95
Val Gly Ser Pro Thr Ser Lys Val Gln Asn Glu Gly Lys Phe Val His
100 105 110
His Thr Leu Ala Asp Gly Asp Phe Lys His Phe Met Lys Met His Glu
115 120 125
Pro Val Thr Ala Ala Arg Thr Leu Leu Thr Ala Glu Asn Ala Thr Val
130 135 140
Glu Ile Asp Arg Val Leu Ser Ala Leu Leu Lys Glu Arg Lys Pro Val
145 150 155 160
Tyr Ile Asn Leu Pro Val Asp Val Ala Ala Ala Lys Ala Glu Lys Pro
165 170 175
Ser Leu Pro Leu Lys Lys Glu Asn Ser Thr Ser Asn Thr Ser Asp Gln
180 185 190
Glu Ile Leu Asn Lys Ile Gln Glu Ser Leu Lys Asn Ala Lys Lys Pro
195 200 205
Ile Val Ile Thr Gly His Glu Ile Ile Ser Phe Gly Leu Glu Lys Thr
210 215 220
Val Thr Gln Phe Ile Ser Lys Thr Lys Leu Pro Ile Thr Thr Leu Asn
225 230 235 240
Phe Gly Lys Ser Ser Val Asp Glu Ala Leu Pro Ser Phe Leu Gly Ile
245 250 255
Tyr Asn Gly Thr Leu Ser Glu Pro Asn Leu Lys Glu Phe Val Glu Ser
260 265 270
Ala Asp Phe Ile Leu Met Leu Gly Val Lys Leu Thr Asp Ser Ser Thr
275 280 285
Gly Ala Phe Thr His His Leu Asn Glu Asn Lys Met Ile Ser Leu Asn
290 295 300
Ile Asp Glu Gly Lys Ile Phe Asn Glu Arg Ile Gln Asn Phe Asp Phe
305 310 315 320
Glu Ser Leu Ile Ser Ser Leu Leu Asp Leu Ser Glu Ile Glu Tyr Lys
325 330 335
Gly Lys Tyr Ile Asp Lys Lys Gln Glu Asp Phe Val Pro Ser Asn Ala
340 345 350
Leu Leu Ser Gln Asp Arg Leu Trp Gln Ala Val Glu Asn Leu Thr Gln
355 360 365
Ser Asn Glu Thr Ile Val Ala Glu Gln Gly Thr Ser Phe Phe Gly Ala
370 375 380
Ser Ser Ile Phe Leu Lys Ser Lys Ser His Phe Ile Gly Gln Pro Leu
385 390 395 400
Trp Gly Ser Ile Gly Tyr Thr Phe Pro Ala Ala Leu Gly Ser Gln Ile
405 410 415
Ala Asp Lys Glu Ser Arg His Leu Leu Phe Ile Gly Asp Gly Ser Leu
420 425 430
Gln Leu Thr Val Gln Glu Leu Gly Leu Ala Ile Arg Glu Lys Ile Asn
435 440 445
Pro Ile Cys Phe Ile Ile Asn Asn Asp Gly Tyr Thr Val Glu Arg Glu
450 455 460
Ile His Gly Pro Asn Gln Ser Tyr Asn Asp Ile Pro Met Trp Asn Tyr
465 470 475 480
Ser Lys Leu Pro Glu Ser Phe Gly Ala Thr Glu Asp Arg Val Val Ser
485 490 495
Lys Ile Val Arg Thr Glu Asn Glu Phe Val Ser Val Met Lys Glu Ala
500 505 510
Gln Ala Asp Pro Asn Arg Met Tyr Trp Ile Glu Leu Ile Leu Ala Lys
515 520 525
Glu Gly Ala Pro Lys Val Leu Lys Lys Met Gly Lys Leu Phe Ala Glu
530 535 540
Gln Asn Lys Ser
545
<210> 37
<211> 1164
<212> DNA
<213> Escherichia coli
<400> 37
atgaacaact ttaatctgca caccccaacc cgcattctgt ttggtaaagg cgcaatcgct 60
ggtttacgcg aacaaattcc tcacgatgct cgcgtattga ttacctacgg cggcggcagc 120
gtgaaaaaaa ccggcgttct cgatcaagtt ctggatgccc tgaaaggcat ggacgtgctg 180
gaatttggcg gtattgagcc aaacccggct tatgaaacgc tgatgaacgc cgtgaaactg 240
gttcgcgaac agaaagtgac tttcctgctg gcggttggcg gcggttctgt actggacggc 300
accaaattta tcgccgcagc ggctaactat ccggaaaata tcgatccgtg gcacattctg 360
caaacgggcg gtaaagagat taaaagcgcc atcccgatgg gctgtgtgct gacgctgcca 420
gcaaccggtt cagaatccaa cgcaggcgcg gtgatctccc gtaaaaccac aggcgacaag 480
caggcgttcc attctgccca tgttcagccg gtatttgccg tgctcgatcc ggtttatacc 540
tacaccctgc cgccgcgtca ggtggctaac ggcgtagtgg acgcctttgt acacaccgtg 600
gaacagtatg ttaccaaacc ggttgatgcc aaaattcagg accgtttcgc agaaggcatt 660
ttgctgacgc taatcgaaga tggtccgaaa gccctgaaag agccagaaaa ctacgatgtg 720
cgcgccaacg tcatgtgggc ggcgactcag gcgctgaacg gtttgattgg cgctggcgta 780
ccgcaggact gggcaacgca tatgctgggc cacgaactga ctgcgatgca cggtctggat 840
cacgcgcaaa cactggctat cgtcctgcct gcactgtgga atgaaaaacg cgataccaag 900
cgcgctaagc tgctgcaata tgctgaacgc gtctggaaca tcactgaagg ttccgatgat 960
gagcgtattg acgccgcgat tgccgcaacc cgcaatttct ttgagcaatt aggcgtgccg 1020
acccacctct ccgactacgg tctggacggc agctccatcc cggctttgct gaaaaaactg 1080
gaagagcacg gcatgaccca actgggcgaa aatcatgaca ttacgttgga tgtcagccgc 1140
cgtatatacg aagccgcccg ctaa 1164
<210> 38
<211> 387
<212> PRT
<213> Escherichia coli
<400> 38
Met Asn Asn Phe Asn Leu His Thr Pro Thr Arg Ile Leu Phe Gly Lys
1 5 10 15
Gly Ala Ile Ala Gly Leu Arg Glu Gln Ile Pro His Asp Ala Arg Val
20 25 30
Leu Ile Thr Tyr Gly Gly Gly Ser Val Lys Lys Thr Gly Val Leu Asp
35 40 45
Gln Val Leu Asp Ala Leu Lys Gly Met Asp Val Leu Glu Phe Gly Gly
50 55 60
Ile Glu Pro Asn Pro Ala Tyr Glu Thr Leu Met Asn Ala Val Lys Leu
65 70 75 80
Val Arg Glu Gln Lys Val Thr Phe Leu Leu Ala Val Gly Gly Gly Ser
85 90 95
Val Leu Asp Gly Thr Lys Phe Ile Ala Ala Ala Ala Asn Tyr Pro Glu
100 105 110
Asn Ile Asp Pro Trp His Ile Leu Gln Thr Gly Gly Lys Glu Ile Lys
115 120 125
Ser Ala Ile Pro Met Gly Cys Val Leu Thr Leu Pro Ala Thr Gly Ser
130 135 140
Glu Ser Asn Ala Gly Ala Val Ile Ser Arg Lys Thr Thr Gly Asp Lys
145 150 155 160
Gln Ala Phe His Ser Ala His Val Gln Pro Val Phe Ala Val Leu Asp
165 170 175
Pro Val Tyr Thr Tyr Thr Leu Pro Pro Arg Gln Val Ala Asn Gly Val
180 185 190
Val Asp Ala Phe Val His Thr Val Glu Gln Tyr Val Thr Lys Pro Val
195 200 205
Asp Ala Lys Ile Gln Asp Arg Phe Ala Glu Gly Ile Leu Leu Thr Leu
210 215 220
Ile Glu Asp Gly Pro Lys Ala Leu Lys Glu Pro Glu Asn Tyr Asp Val
225 230 235 240
Arg Ala Asn Val Met Trp Ala Ala Thr Gln Ala Leu Asn Gly Leu Ile
245 250 255
Gly Ala Gly Val Pro Gln Asp Trp Ala Thr His Met Leu Gly His Glu
260 265 270
Leu Thr Ala Met His Gly Leu Asp His Ala Gln Thr Leu Ala Ile Val
275 280 285
Leu Pro Ala Leu Trp Asn Glu Lys Arg Asp Thr Lys Arg Ala Lys Leu
290 295 300
Leu Gln Tyr Ala Glu Arg Val Trp Asn Ile Thr Glu Gly Ser Asp Asp
305 310 315 320
Glu Arg Ile Asp Ala Ala Ile Ala Ala Thr Arg Asn Phe Phe Glu Gln
325 330 335
Leu Gly Val Pro Thr His Leu Ser Asp Tyr Gly Leu Asp Gly Ser Ser
340 345 350
Ile Pro Ala Leu Leu Lys Lys Leu Glu Glu His Gly Met Thr Gln Leu
355 360 365
Gly Glu Asn His Asp Ile Thr Leu Asp Val Ser Arg Arg Ile Tyr Glu
370 375 380
Ala Ala Arg
385
<210> 39
<211> 1197
<212> DNA
<213> Saccharomyces cerevisiae
<400> 39
atgtctcaga acgtttacat tgtatcgact gccagaaccc caattggttc attccagggt 60
tctctatcct ccaagacagc agtggaattg ggtgctgttg ctttaaaagg cgccttggct 120
aaggttccag aattggatgc atccaaggat tttgacgaaa ttatttttgg taacgttctt 180
tctgccaatt tgggccaagc tccggccaga caagttgctt tggctgccgg tttgagtaat 240
catatcgttg caagcacagt taacaaggtc tgtgcatccg ctatgaaggc aatcattttg 300
ggtgctcaat ccatcaaatg tggtaatgct gatgttgtcg tagctggtgg ttgtgaatct 360
atgactaacg caccatacta catgccagca gcccgtgcgg gtgccaaatt tggccaaact 420
gttcttgttg atggtgtcga aagagatggg ttgaacgatg cgtacgatgg tctagccatg 480
ggtgtacacg cagaaaagtg tgcccgtgat tgggatatta ctagagaaca acaagacaat 540
tttgccatcg aatcctacca aaaatctcaa aaatctcaaa aggaaggtaa attcgacaat 600
gaaattgtac ctgttaccat taagggattt agaggtaagc ctgatactca agtcacgaag 660
gacgaggaac ctgctagatt acacgttgaa aaattgagat ctgcaaggac tgttttccaa 720
aaagaaaacg gtactgttac tgccgctaac gcttctccaa tcaacgatgg tgctgcagcc 780
gtcatcttgg tttccgaaaa agttttgaag gaaaagaatt tgaagccttt ggctattatc 840
aaaggttggg gtgaggccgc tcatcaacca gctgatttta catgggctcc atctcttgca 900
gttccaaagg ctttgaaaca tgctggcatc gaagacatca attctgttga ttactttgaa 960
ttcaatgaag ccttttcggt tgtcggtttg gtgaacacta agattttgaa gctagaccca 1020
tctaaggtta atgtatatgg tggtgctgtt gctctaggtc acccattggg ttgttctggt 1080
gctagagtgg ttgttacact gctatccatc ttacagcaag aaggaggtaa gatcggtgtt 1140
gccgccattt gtaatggtgg tggtggtgct tcctctattg tcattgaaaa gatatga 1197
<210> 40
<211> 398
<212> PRT
<213> Saccharomyces cerevisiae
<400> 40
Met Ser Gln Asn Val Tyr Ile Val Ser Thr Ala Arg Thr Pro Ile Gly
1 5 10 15
Ser Phe Gln Gly Ser Leu Ser Ser Lys Thr Ala Val Glu Leu Gly Ala
20 25 30
Val Ala Leu Lys Gly Ala Leu Ala Lys Val Pro Glu Leu Asp Ala Ser
35 40 45
Lys Asp Phe Asp Glu Ile Ile Phe Gly Asn Val Leu Ser Ala Asn Leu
50 55 60
Gly Gln Ala Pro Ala Arg Gln Val Ala Leu Ala Ala Gly Leu Ser Asn
65 70 75 80
His Ile Val Ala Ser Thr Val Asn Lys Val Cys Ala Ser Ala Met Lys
85 90 95
Ala Ile Ile Leu Gly Ala Gln Ser Ile Lys Cys Gly Asn Ala Asp Val
100 105 110
Val Val Ala Gly Gly Cys Glu Ser Met Thr Asn Ala Pro Tyr Tyr Met
115 120 125
Pro Ala Ala Arg Ala Gly Ala Lys Phe Gly Gln Thr Val Leu Val Asp
130 135 140
Gly Val Glu Arg Asp Gly Leu Asn Asp Ala Tyr Asp Gly Leu Ala Met
145 150 155 160
Gly Val His Ala Glu Lys Cys Ala Arg Asp Trp Asp Ile Thr Arg Glu
165 170 175
Gln Gln Asp Asn Phe Ala Ile Glu Ser Tyr Gln Lys Ser Gln Lys Ser
180 185 190
Gln Lys Glu Gly Lys Phe Asp Asn Glu Ile Val Pro Val Thr Ile Lys
195 200 205
Gly Phe Arg Gly Lys Pro Asp Thr Gln Val Thr Lys Asp Glu Glu Pro
210 215 220
Ala Arg Leu His Val Glu Lys Leu Arg Ser Ala Arg Thr Val Phe Gln
225 230 235 240
Lys Glu Asn Gly Thr Val Thr Ala Ala Asn Ala Ser Pro Ile Asn Asp
245 250 255
Gly Ala Ala Ala Val Ile Leu Val Ser Glu Lys Val Leu Lys Glu Lys
260 265 270
Asn Leu Lys Pro Leu Ala Ile Ile Lys Gly Trp Gly Glu Ala Ala His
275 280 285
Gln Pro Ala Asp Phe Thr Trp Ala Pro Ser Leu Ala Val Pro Lys Ala
290 295 300
Leu Lys His Ala Gly Ile Glu Asp Ile Asn Ser Val Asp Tyr Phe Glu
305 310 315 320
Phe Asn Glu Ala Phe Ser Val Val Gly Leu Val Asn Thr Lys Ile Leu
325 330 335
Lys Leu Asp Pro Ser Lys Val Asn Val Tyr Gly Gly Ala Val Ala Leu
340 345 350
Gly His Pro Leu Gly Cys Ser Gly Ala Arg Val Val Val Thr Leu Leu
355 360 365
Ser Ile Leu Gln Gln Glu Gly Gly Lys Ile Gly Val Ala Ala Ile Cys
370 375 380
Asn Gly Gly Gly Gly Ala Ser Ser Ile Val Ile Glu Lys Ile
385 390 395
<210> 41
<211> 1716
<212> DNA
<213> Bacillus subtilis
<400> 41
atgttgacaa aagcaacaaa agaacaaaaa tcccttgtga aaaacagagg ggcggagctt 60
gttgttgatt gcttagtgga gcaaggtgtc acacatgtat ttggcattcc aggtgcaaaa 120
attgatgcgg tatttgacgc tttacaagat aaaggacctg aaattatcgt tgcccggcac 180
gaacaaaacg cagcattcat ggcccaagca gtcggccgtt taactggaaa accgggagtc 240
gtgttagtca catcaggacc gggtgcctct aacttggcaa caggcctgct gacagcgaac 300
actgaaggag accctgtcgt tgcgcttgct ggaaacgtga tccgtgcaga tcgtttaaaa 360
cggacacatc aatctttgga taatgcggcg ctattccagc cgattacaaa atacagtgta 420
gaagttcaag atgtaaaaaa tataccggaa gctgttacaa atgcatttag gatagcgtca 480
gcagggcagg ctggggccgc ttttgtgagc tttccgcaag atgttgtgaa tgaagtcaca 540
aatacgaaaa acgtgcgtgc tgttgcagcg ccaaaactcg gtcctgcagc agatgatgca 600
atcagtgcgg ccatagcaaa aatccaaaca gcaaaacttc ctgtcgtttt ggtcggcatg 660
aaaggcggaa gaccggaagc aattaaagcg gttcgcaagc ttttgaaaaa ggttcagctt 720
ccatttgttg aaacatatca agctgccggt accctttcta gagatttaga ggatcaatat 780
tttggccgta tcggtttgtt ccgcaaccag cctggcgatt tactgctaga gcaggcagat 840
gttgttctga cgatcggcta tgacccgatt gaatatgatc cgaaattctg gaatatcaat 900
ggagaccgga caattatcca tttagacgag attatcgctg acattgatca tgcttaccag 960
cctgatcttg aattgatcgg tgacattccg tccacgatca atcatatcga acacgatgct 1020
gtgaaagtgg aatttgcaga gcgtgagcag aaaatccttt ctgatttaaa acaatatatg 1080
catgaaggtg agcaggtgcc tgcagattgg aaatcagaca gagcgcaccc tcttgaaatc 1140
gttaaagagt tgcgtaatgc agtcgatgat catgttacag taacttgcga tatcggttcg 1200
cacgccattt ggatgtcacg ttatttccgc agctacgagc cgttaacatt aatgatcagt 1260
aacggtatgc aaacactcgg cgttgcgctt ccttgggcaa tcggcgcttc attggtgaaa 1320
ccgggagaaa aagtggtttc tgtctctggt gacggcggtt tcttattctc agcaatggaa 1380
ttagagacag cagttcgact aaaagcacca attgtacaca ttgtatggaa cgacagcaca 1440
tatgacatgg ttgcattcca gcaattgaaa aaatataacc gtacatctgc ggtcgatttc 1500
ggaaatatcg atatcgtgaa atatgcggaa agcttcggag caactggctt gcgcgtagaa 1560
tcaccagacc agctggcaga tgttctgcgt caaggcatga acgctgaagg tcctgtcatc 1620
atcgatgtcc cggttgacta cagtgataac attaatttag caagtgacaa gcttccgaaa 1680
gaattcgggg aactcatgaa aacgaaagct ctctag 1716
<210> 42
<211> 571
<212> PRT
<213> Bacillus subtilis
<400> 42
Met Leu Thr Lys Ala Thr Lys Glu Gln Lys Ser Leu Val Lys Asn Arg
1 5 10 15
Gly Ala Glu Leu Val Val Asp Cys Leu Val Glu Gln Gly Val Thr His
20 25 30
Val Phe Gly Ile Pro Gly Ala Lys Ile Asp Ala Val Phe Asp Ala Leu
35 40 45
Gln Asp Lys Gly Pro Glu Ile Ile Val Ala Arg His Glu Gln Asn Ala
50 55 60
Ala Phe Met Ala Gln Ala Val Gly Arg Leu Thr Gly Lys Pro Gly Val
65 70 75 80
Val Leu Val Thr Ser Gly Pro Gly Ala Ser Asn Leu Ala Thr Gly Leu
85 90 95
Leu Thr Ala Asn Thr Glu Gly Asp Pro Val Val Ala Leu Ala Gly Asn
100 105 110
Val Ile Arg Ala Asp Arg Leu Lys Arg Thr His Gln Ser Leu Asp Asn
115 120 125
Ala Ala Leu Phe Gln Pro Ile Thr Lys Tyr Ser Val Glu Val Gln Asp
130 135 140
Val Lys Asn Ile Pro Glu Ala Val Thr Asn Ala Phe Arg Ile Ala Ser
145 150 155 160
Ala Gly Gln Ala Gly Ala Ala Phe Val Ser Phe Pro Gln Asp Val Val
165 170 175
Asn Glu Val Thr Asn Thr Lys Asn Val Arg Ala Val Ala Ala Pro Lys
180 185 190
Leu Gly Pro Ala Ala Asp Asp Ala Ile Ser Ala Ala Ile Ala Lys Ile
195 200 205
Gln Thr Ala Lys Leu Pro Val Val Leu Val Gly Met Lys Gly Gly Arg
210 215 220
Pro Glu Ala Ile Lys Ala Val Arg Lys Leu Leu Lys Lys Val Gln Leu
225 230 235 240
Pro Phe Val Glu Thr Tyr Gln Ala Ala Gly Thr Leu Ser Arg Asp Leu
245 250 255
Glu Asp Gln Tyr Phe Gly Arg Ile Gly Leu Phe Arg Asn Gln Pro Gly
260 265 270
Asp Leu Leu Leu Glu Gln Ala Asp Val Val Leu Thr Ile Gly Tyr Asp
275 280 285
Pro Ile Glu Tyr Asp Pro Lys Phe Trp Asn Ile Asn Gly Asp Arg Thr
290 295 300
Ile Ile His Leu Asp Glu Ile Ile Ala Asp Ile Asp His Ala Tyr Gln
305 310 315 320
Pro Asp Leu Glu Leu Ile Gly Asp Ile Pro Ser Thr Ile Asn His Ile
325 330 335
Glu His Asp Ala Val Lys Val Glu Phe Ala Glu Arg Glu Gln Lys Ile
340 345 350
Leu Ser Asp Leu Lys Gln Tyr Met His Glu Gly Glu Gln Val Pro Ala
355 360 365
Asp Trp Lys Ser Asp Arg Ala His Pro Leu Glu Ile Val Lys Glu Leu
370 375 380
Arg Asn Ala Val Asp Asp His Val Thr Val Thr Cys Asp Ile Gly Ser
385 390 395 400
His Ala Ile Trp Met Ser Arg Tyr Phe Arg Ser Tyr Glu Pro Leu Thr
405 410 415
Leu Met Ile Ser Asn Gly Met Gln Thr Leu Gly Val Ala Leu Pro Trp
420 425 430
Ala Ile Gly Ala Ser Leu Val Lys Pro Gly Glu Lys Val Val Ser Val
435 440 445
Ser Gly Asp Gly Gly Phe Leu Phe Ser Ala Met Glu Leu Glu Thr Ala
450 455 460
Val Arg Leu Lys Ala Pro Ile Val His Ile Val Trp Asn Asp Ser Thr
465 470 475 480
Tyr Asp Met Val Ala Phe Gln Gln Leu Lys Lys Tyr Asn Arg Thr Ser
485 490 495
Ala Val Asp Phe Gly Asn Ile Asp Ile Val Lys Tyr Ala Glu Ser Phe
500 505 510
Gly Ala Thr Gly Leu Arg Val Glu Ser Pro Asp Gln Leu Ala Asp Val
515 520 525
Leu Arg Gln Gly Met Asn Ala Glu Gly Pro Val Ile Ile Asp Val Pro
530 535 540
Val Asp Tyr Ser Asp Asn Ile Asn Leu Ala Ser Asp Lys Leu Pro Lys
545 550 555 560
Glu Phe Gly Glu Leu Met Lys Thr Lys Ala Leu
565 570
<210> 43
<211> 1188
<212> DNA
<213> Saccharomyces cerevisiae
<400> 43
atgttgagaa ctcaagccgc cagattgatc tgcaactccc gtgtcatcac tgctaagaga 60
acctttgctt tggccacccg tgctgctgct tacagcagac cagctgcccg tttcgttaag 120
ccaatgatca ctacccgtgg tttgaagcaa atcaacttcg gtggtactgt tgaaaccgtc 180
tacgaaagag ctgactggcc aagagaaaag ttgttggact acttcaagaa cgacactttt 240
gctttgatcg gttacggttc ccaaggttac ggtcaaggtt tgaacttgag agacaacggt 300
ttgaacgtta tcattggtgt ccgtaaagat ggtgcttctt ggaaggctgc catcgaagac 360
ggttgggttc caggcaagaa cttgttcact gttgaagatg ctatcaagag aggtagttac 420
gttatgaact tgttgtccga tgccgctcaa tcagaaacct ggcctgctat caagccattg 480
ttgaccaagg gtaagacttt gtacttctcc cacggtttct ccccagtctt caaggacttg 540
actcacgttg aaccaccaaa ggacttagat gttatcttgg ttgctccaaa gggttccggt 600
agaactgtca gatctttgtt caaggaaggt cgtggtatta actcttctta cgccgtctgg 660
aacgatgtca ccggtaaggc tcacgaaaag gcccaagctt tggccgttgc cattggttcc 720
ggttacgttt accaaaccac tttcgaaaga gaagtcaact ctgacttgta cggtgaaaga 780
ggttgtttaa tgggtggtat ccacggtatg ttcttggctc aatacgacgt cttgagagaa 840
aacggtcact ccccatctga agctttcaac gaaaccgtcg aagaagctac ccaatctcta 900
tacccattga tcggtaagta cggtatggat tacatgtacg atgcttgttc caccaccgcc 960
agaagaggtg ctttggactg gtacccaatc ttcaagaatg ctttgaagcc tgttttccaa 1020
gacttgtacg aatctaccaa gaacggtacc gaaaccaaga gatctttgga attcaactct 1080
caacctgact acagagaaaa gctagaaaag gaattagaca ccatcagaaa catggaaatc 1140
tggaaggttg gtaaggaagt cagaaagttg agaccagaaa accaataa 1188
<210> 44
<211> 395
<212> PRT
<213> Saccharomyces cerevisiae
<400> 44
Met Leu Arg Thr Gln Ala Ala Arg Leu Ile Cys Asn Ser Arg Val Ile
1 5 10 15
Thr Ala Lys Arg Thr Phe Ala Leu Ala Thr Arg Ala Ala Ala Tyr Ser
20 25 30
Arg Pro Ala Ala Arg Phe Val Lys Pro Met Ile Thr Thr Arg Gly Leu
35 40 45
Lys Gln Ile Asn Phe Gly Gly Thr Val Glu Thr Val Tyr Glu Arg Ala
50 55 60
Asp Trp Pro Arg Glu Lys Leu Leu Asp Tyr Phe Lys Asn Asp Thr Phe
65 70 75 80
Ala Leu Ile Gly Tyr Gly Ser Gln Gly Tyr Gly Gln Gly Leu Asn Leu
85 90 95
Arg Asp Asn Gly Leu Asn Val Ile Ile Gly Val Arg Lys Asp Gly Ala
100 105 110
Ser Trp Lys Ala Ala Ile Glu Asp Gly Trp Val Pro Gly Lys Asn Leu
115 120 125
Phe Thr Val Glu Asp Ala Ile Lys Arg Gly Ser Tyr Val Met Asn Leu
130 135 140
Leu Ser Asp Ala Ala Gln Ser Glu Thr Trp Pro Ala Ile Lys Pro Leu
145 150 155 160
Leu Thr Lys Gly Lys Thr Leu Tyr Phe Ser His Gly Phe Ser Pro Val
165 170 175
Phe Lys Asp Leu Thr His Val Glu Pro Pro Lys Asp Leu Asp Val Ile
180 185 190
Leu Val Ala Pro Lys Gly Ser Gly Arg Thr Val Arg Ser Leu Phe Lys
195 200 205
Glu Gly Arg Gly Ile Asn Ser Ser Tyr Ala Val Trp Asn Asp Val Thr
210 215 220
Gly Lys Ala His Glu Lys Ala Gln Ala Leu Ala Val Ala Ile Gly Ser
225 230 235 240
Gly Tyr Val Tyr Gln Thr Thr Phe Glu Arg Glu Val Asn Ser Asp Leu
245 250 255
Tyr Gly Glu Arg Gly Cys Leu Met Gly Gly Ile His Gly Met Phe Leu
260 265 270
Ala Gln Tyr Asp Val Leu Arg Glu Asn Gly His Ser Pro Ser Glu Ala
275 280 285
Phe Asn Glu Thr Val Glu Glu Ala Thr Gln Ser Leu Tyr Pro Leu Ile
290 295 300
Gly Lys Tyr Gly Met Asp Tyr Met Tyr Asp Ala Cys Ser Thr Thr Ala
305 310 315 320
Arg Arg Gly Ala Leu Asp Trp Tyr Pro Ile Phe Lys Asn Ala Leu Lys
325 330 335
Pro Val Phe Gln Asp Leu Tyr Glu Ser Thr Lys Asn Gly Thr Glu Thr
340 345 350
Lys Arg Ser Leu Glu Phe Asn Ser Gln Pro Asp Tyr Arg Glu Lys Leu
355 360 365
Glu Lys Glu Leu Asp Thr Ile Arg Asn Met Glu Ile Trp Lys Val Gly
370 375 380
Lys Glu Val Arg Lys Leu Arg Pro Glu Asn Gln
385 390 395
<210> 45
<211> 1476
<212> DNA
<213> Bacillus subtilis
<400> 45
atggctaact acttcaatac actgaatctg cgccagcagc tggcacagct gggcaaatgt 60
cgctttatgg gccgcgatga attcgccgat ggcgcgagct accttcaggg taaaaaagta 120
gtcatcgtcg gctgtggcgc acagggtctg aaccagggcc tgaacatgcg tgattctggt 180
ctcgatatct cctacgctct gcgtaaagaa gcgattgccg agaagcgcgc gtcctggcgt 240
aaagcgaccg aaaatggttt taaagtgggt acttacgaag aactgatccc acaggcggat 300
ctggtgatta acctgacgcc ggacaagcag cactctgatg tagtgcgcac cgtacagcca 360
ctgatgaaag acggcgcggc gctgggctac tcgcacggtt tcaacatcgt cgaagtgggc 420
gagcagatcc gtaaagatat caccgtagtg atggttgcgc cgaaatgccc aggcaccgaa 480
gtgcgtgaag agtacaaacg tgggttcggc gtaccgacgc tgattgccgt tcacccggaa 540
aacgatccga aaggcgaagg catggcgatt gccaaagcct gggcggctgc aaccggtggt 600
caccgtgcgg gtgtgctgga atcgtccttc gttgcggaag tgaaatctga cctgatgggc 660
gagcaaacca tcctgtgcgg tatgttgcag gctggctctc tgctgtgctt cgacaagctg 720
gtggaagaag gtaccgatcc agcatacgca gaaaaactga ttcagttcgg ttgggaaacc 780
atcaccgaag cactgaaaca gggcggcatc accctgatga tggaccgtct ctctaacccg 840
gcgaaactgc gtgcttatgc gctttctgaa cagctgaaag agatcatggc acccctgttc 900
cagaaacata tggacgacat catctccggc gaattctctt ccggtatgat ggcggactgg 960
gccaacgatg ataagaaact gctgacctgg cgtgaagaga ccggcaaaac cgcgtttgaa 1020
accgcgccgc agtatgaagg caaaatcggc gagcaggagt acttcgataa aggcgtactg 1080
atgattgcga tggtgaaagc gggcgttgaa ctggcgttcg aaaccatggt cgattccggc 1140
atcattgaag agtctgcata ttatgaatca ctgcacgagc tgccgctgat tgccaacacc 1200
atcgcccgta agcgtctgta cgaaatgaac gtggttatct ctgataccgc tgagtacggt 1260
aactatctgt tctcttacgc ttgtgtgccg ttgctgaaac cgtttatggc agagctgcaa 1320
ccgggcgacc tgggtaaagc tattccggaa ggcgcggtag ataacgggca actgcgtgat 1380
gtgaacgaag cgattcgcag ccatgcgatt gagcaggtag gtaagaaact gcgcggctat 1440
atgacagata tgaaacgtat tgctgttgcg ggttaa 1476
<210> 46
<211> 342
<212> PRT
<213> Bacillus subtilis
<400> 46
Met Val Lys Val Tyr Tyr Asn Gly Asp Ile Lys Glu Asn Val Leu Ala
1 5 10 15
Gly Lys Thr Val Ala Val Ile Gly Tyr Gly Ser Gln Gly His Ala His
20 25 30
Ala Leu Asn Leu Lys Glu Ser Gly Val Asp Val Ile Val Gly Val Arg
35 40 45
Gln Gly Lys Ser Phe Thr Gln Ala Gln Glu Asp Gly His Lys Val Phe
50 55 60
Ser Val Lys Glu Ala Ala Ala Gln Ala Glu Ile Ile Met Val Leu Leu
65 70 75 80
Pro Asp Glu Gln Gln Gln Lys Val Tyr Glu Ala Glu Ile Lys Asp Glu
85 90 95
Leu Thr Ala Gly Lys Ser Leu Val Phe Ala His Gly Phe Asn Val His
100 105 110
Phe His Gln Ile Val Pro Pro Ala Asp Val Asp Val Phe Leu Val Ala
115 120 125
Pro Lys Gly Pro Gly His Leu Val Arg Arg Thr Tyr Glu Gln Gly Ala
130 135 140
Gly Val Pro Ala Leu Phe Ala Ile Tyr Gln Asp Val Thr Gly Glu Ala
145 150 155 160
Arg Asp Lys Ala Leu Ala Tyr Ala Lys Gly Ile Gly Gly Ala Arg Ala
165 170 175
Gly Val Leu Glu Thr Thr Phe Lys Glu Glu Thr Glu Thr Asp Leu Phe
180 185 190
Gly Glu Gln Ala Val Leu Cys Gly Gly Leu Ser Ala Leu Val Lys Ala
195 200 205
Gly Phe Glu Thr Leu Thr Glu Ala Gly Tyr Gln Pro Glu Leu Ala Tyr
210 215 220
Phe Glu Cys Leu His Glu Leu Lys Leu Ile Val Asp Leu Met Tyr Glu
225 230 235 240
Glu Gly Leu Ala Gly Met Arg Tyr Ser Ile Ser Asp Thr Ala Gln Trp
245 250 255
Gly Asp Phe Val Ser Gly Pro Arg Val Val Asp Ala Lys Val Lys Glu
260 265 270
Ser Met Lys Glu Val Leu Lys Asp Ile Gln Asn Gly Thr Phe Ala Lys
275 280 285
Glu Trp Ile Val Glu Asn Gln Val Asn Arg Pro Arg Phe Asn Ala Ile
290 295 300
Asn Ala Ser Glu Asn Glu His Gln Ile Glu Val Val Gly Arg Lys Leu
305 310 315 320
Arg Glu Met Met Pro Phe Val Lys Gln Gly Lys Lys Lys Glu Ala Val
325 330 335
Val Ser Val Ala Gln Asn
340
<210> 47
<211> 1758
<212> DNA
<213> Saccharomyces cerevisiae
<400> 47
atgggcttgt taacgaaagt tgctacatct agacaattct ctacaacgag atgcgttgca 60
aagaagctca acaagtactc gtatatcatc actgaaccta agggccaagg tgcgtcccag 120
gccatgcttt atgccaccgg tttcaagaag gaagatttca agaagcctca agtcggggtt 180
ggttcctgtt ggtggtccgg taacccatgt aacatgcatc tattggactt gaataacaga 240
tgttctcaat ccattgaaaa agcgggtttg aaagctatgc agttcaacac catcggtgtt 300
tcagacggta tctctatggg tactaaaggt atgagatact cgttacaaag tagagaaatc 360
attgcagact cctttgaaac catcatgatg gcacaacact acgatgctaa catcgccatc 420
ccatcatgtg acaaaaacat gcccggtgtc atgatggcca tgggtagaca taacagacct 480
tccatcatgg tatatggtgg tactatcttg cccggtcatc caacatgtgg ttcttcgaag 540
atctctaaaa acatcgatat cgtctctgcg ttccaatcct acggtgaata tatttccaag 600
caattcactg aagaagaaag agaagatgtt gtggaacatg catgcccagg tcctggttct 660
tgtggtggta tgtatactgc caacacaatg gcttctgccg ctgaagtgct aggtttgacc 720
attccaaact cctcttcctt cccagccgtt tccaaggaga agttagctga gtgtgacaac 780
attggtgaat acatcaagaa gacaatggaa ttgggtattt tacctcgtga tatcctcaca 840
aaagaggctt ttgaaaacgc cattacttat gtcgttgcaa ccggtgggtc cactaatgct 900
gttttgcatt tggtggctgt tgctcactct gcgggtgtca agttgtcacc agatgatttc 960
caaagaatca gtgatactac accattgatc ggtgacttca aaccttctgg taaatacgtc 1020
atggccgatt tgattaacgt tggtggtacc caatctgtga ttaagtatct atatgaaaac 1080
aacatgttgc acggtaacac aatgactgtt accggtgaca ctttggcaga acgtgcaaag 1140
aaagcaccaa gcctacctga aggacaagag attattaagc cactctccca cccaatcaag 1200
gccaacggtc acttgcaaat tctgtacggt tcattggcac caggtggagc tgtgggtaaa 1260
attaccggta aggaaggtac ttacttcaag ggtagagcac gtgtgttcga agaggaaggt 1320
gcctttattg aagccttgga aagaggtgaa atcaagaagg gtgaaaaaac cgttgttgtt 1380
atcagatatg aaggtccaag aggtgcacca ggtatgcctg aaatgctaaa gccttcctct 1440
gctctgatgg gttacggttt gggtaaagat gttgcattgt tgactgatgg tagattctct 1500
ggtggttctc acgggttctt aatcggccac attgttcccg aagccgctga aggtggtcct 1560
atcgggttgg tcagagacgg cgatgagatt atcattgatg ctgataataa caagattgac 1620
ctattagtct ctgataagga aatggctcaa cgtaaacaaa gttgggttgc acctccacct 1680
cgttacacaa gaggtactct atccaagtat gctaagttgg tttccaacgc ttccaacggt 1740
tgtgttttag atgcttga 1758
<210> 48
<211> 585
<212> PRT
<213> Saccharomyces cerevisiae
<400> 48
Met Gly Leu Leu Thr Lys Val Ala Thr Ser Arg Gln Phe Ser Thr Thr
1 5 10 15
Arg Cys Val Ala Lys Lys Leu Asn Lys Tyr Ser Tyr Ile Ile Thr Glu
20 25 30
Pro Lys Gly Gln Gly Ala Ser Gln Ala Met Leu Tyr Ala Thr Gly Phe
35 40 45
Lys Lys Glu Asp Phe Lys Lys Pro Gln Val Gly Val Gly Ser Cys Trp
50 55 60
Trp Ser Gly Asn Pro Cys Asn Met His Leu Leu Asp Leu Asn Asn Arg
65 70 75 80
Cys Ser Gln Ser Ile Glu Lys Ala Gly Leu Lys Ala Met Gln Phe Asn
85 90 95
Thr Ile Gly Val Ser Asp Gly Ile Ser Met Gly Thr Lys Gly Met Arg
100 105 110
Tyr Ser Leu Gln Ser Arg Glu Ile Ile Ala Asp Ser Phe Glu Thr Ile
115 120 125
Met Met Ala Gln His Tyr Asp Ala Asn Ile Ala Ile Pro Ser Cys Asp
130 135 140
Lys Asn Met Pro Gly Val Met Met Ala Met Gly Arg His Asn Arg Pro
145 150 155 160
Ser Ile Met Val Tyr Gly Gly Thr Ile Leu Pro Gly His Pro Thr Cys
165 170 175
Gly Ser Ser Lys Ile Ser Lys Asn Ile Asp Ile Val Ser Ala Phe Gln
180 185 190
Ser Tyr Gly Glu Tyr Ile Ser Lys Gln Phe Thr Glu Glu Glu Arg Glu
195 200 205
Asp Val Val Glu His Ala Cys Pro Gly Pro Gly Ser Cys Gly Gly Met
210 215 220
Tyr Thr Ala Asn Thr Met Ala Ser Ala Ala Glu Val Leu Gly Leu Thr
225 230 235 240
Ile Pro Asn Ser Ser Ser Phe Pro Ala Val Ser Lys Glu Lys Leu Ala
245 250 255
Glu Cys Asp Asn Ile Gly Glu Tyr Ile Lys Lys Thr Met Glu Leu Gly
260 265 270
Ile Leu Pro Arg Asp Ile Leu Thr Lys Glu Ala Phe Glu Asn Ala Ile
275 280 285
Thr Tyr Val Val Ala Thr Gly Gly Ser Thr Asn Ala Val Leu His Leu
290 295 300
Val Ala Val Ala His Ser Ala Gly Val Lys Leu Ser Pro Asp Asp Phe
305 310 315 320
Gln Arg Ile Ser Asp Thr Thr Pro Leu Ile Gly Asp Phe Lys Pro Ser
325 330 335
Gly Lys Tyr Val Met Ala Asp Leu Ile Asn Val Gly Gly Thr Gln Ser
340 345 350
Val Ile Lys Tyr Leu Tyr Glu Asn Asn Met Leu His Gly Asn Thr Met
355 360 365
Thr Val Thr Gly Asp Thr Leu Ala Glu Arg Ala Lys Lys Ala Pro Ser
370 375 380
Leu Pro Glu Gly Gln Glu Ile Ile Lys Pro Leu Ser His Pro Ile Lys
385 390 395 400
Ala Asn Gly His Leu Gln Ile Leu Tyr Gly Ser Leu Ala Pro Gly Gly
405 410 415
Ala Val Gly Lys Ile Thr Gly Lys Glu Gly Thr Tyr Phe Lys Gly Arg
420 425 430
Ala Arg Val Phe Glu Glu Glu Gly Ala Phe Ile Glu Ala Leu Glu Arg
435 440 445
Gly Glu Ile Lys Lys Gly Glu Lys Thr Val Val Val Ile Arg Tyr Glu
450 455 460
Gly Pro Arg Gly Ala Pro Gly Met Pro Glu Met Leu Lys Pro Ser Ser
465 470 475 480
Ala Leu Met Gly Tyr Gly Leu Gly Lys Asp Val Ala Leu Leu Thr Asp
485 490 495
Gly Arg Phe Ser Gly Gly Ser His Gly Phe Leu Ile Gly His Ile Val
500 505 510
Pro Glu Ala Ala Glu Gly Gly Pro Ile Gly Leu Val Arg Asp Gly Asp
515 520 525
Glu Ile Ile Ile Asp Ala Asp Asn Asn Lys Ile Asp Leu Leu Val Ser
530 535 540
Asp Lys Glu Met Ala Gln Arg Lys Gln Ser Trp Val Ala Pro Pro Pro
545 550 555 560
Arg Tyr Thr Arg Gly Thr Leu Ser Lys Tyr Ala Lys Leu Val Ser Asn
565 570 575
Ala Ser Asn Gly Cys Val Leu Asp Ala
580 585
<210> 49
<211> 8019
<212> DNA
<213> Saccharomyces cerevisiae
<400> 49
atgacagcta tcttaaactg ggaagatata tcccctgttt tagagaaagg cacccgcgaa 60
tcacacgtgt ctaaaagagt tccctttttg caagatatat cacaattagt tcgtcaagaa 120
acattggaaa aacctcaatt atctgaaatt gctttcgttt tattgaatac cttcacgatt 180
tacgaagaca ataggtctaa aagtttggta acttcaatat tgcttgacat cttaaatcta 240
gagccatgtc tcctagaaaa ctttatccga ttcatttccg acgtggtcat cagtaatccg 300
gctaccaaag cagtcgctga ttaccttaat ttgttagatt ggattaattc tttcttgatt 360
tttgtgtcgc ataattctaa tttatttgaa gagtacattc caaaattgtt ggtcgcccat 420
tcttatgcaa cgttcggtgt ggaaactatt cttgacaatc aagaagaagg caagaaatcc 480
caagataagc agaaccagca tagaaagaga attcgttatt gcattttcca aacaacggtc 540
aaagcattcc ttaagtgctt gaaggataat gacgacagta tttccttcat gaagatttca 600
attaaaactg tactggagag ctactctaag ctgaagataa ccagtgttgg agtagttatg 660
ataatgggtg cactaactca ggctgcactt cagttattat cgaggcaacc agctctgcac 720
tccgttttaa aggaaaattc tgcagagaaa tattgcgaat atttgggcaa agaagtgttt 780
ttaggcaaaa acccaccatc ttccttttgc ttagagattg gtttgaagcc atttttaaaa 840
gaatttgttt cacaagagtt attcattaag tttttcatcc ctaatattga aaaagcagtt 900
ttaagatctc ctgaggttgg tttttcgatt ttatctgagt tatatgctgg tgtttctcct 960
gaaaaagtaa atctcttaaa tgcctttgct tcctcgaaac tgattaatca atacttctcg 1020
tcatttaaaa gctcaaaaga ggtagttaga tccgtctcgc ttcagtctat gataatctta 1080
ttgagaaaaa tttccaatac tgacactacc ttggaagatt tgaccaagct tattgacgaa 1140
atatttaaga acatcaaatc gaacttaaat gcagattaca aatcacttat ttccaaaatt 1200
ctcatagaaa tacccttaac gcactatgag gtttcagaaa aaatctgcaa agggctgtcc 1260
ccatatattg gtaaagaagg taatgaagca gccttgactc taatgcttaa cgcttttttt 1320
gttcattatt ttagtctggg caaacctatt gaagacttgg ataaaattat atcagctggt 1380
tttgcagata aaaaacctgc tttgaaaaaa tgctggtttg ccgcattttt gaacaattcc 1440
aatgctgcct ctgaagaggt gattttaaac tttatagacg gttgtttgga atttgtgaaa 1500
gactccatca tacattatca gactcacggg catgcatgta ttctagcatc aattgaattt 1560
acaaacaaaa ttttggcatt ggacaatact gagctaaatg atcgtgttat gcagctcata 1620
gaaacccttc ctgaaaattc ttcgataggt gatgctatct taactgctgc attatcaaca 1680
gagctatcca tcgaaaaccg tattcatgct gttaatttac tacaagaatt gttctacaag 1740
aaacccgaat ttattgggtt tagcgtgatt gatgcaattg aaaggagaat gcgtgtccaa 1800
gaattaatac ctcaacaaaa tacatccttt aaatatgtca cttctgtact actggccatt 1860
acgtctgagt tacctgacaa ggaagcctcg ataaaggtat taatcaatgc tctggtcata 1920
gcgcaatgga atattttcaa cattaagaat ggctgggctg gtttagtttt acgtgcaagg 1980
cttgatccag ctgaagttgt caaagaacat gctagcgtta tcatggagaa gattcttgaa 2040
atcacaggta gttgtgaatg gatagataca atttatggtg catgcggttt gcaagcagct 2100
gcctatgcag catttattca gcctaatgag ttcacaccga tcctttgtaa gactatcgaa 2160
gcagatttaa ccgcggatga tttctcacgt ttatctgaag aggacttcga aatttttgca 2220
ggagaggaag gtgttctggt ggttgacgtc ctggaagaaa gcatgaataa gaaactttcc 2280
aataaaaatt ctaaagagta cgaaactcta atgtgggaac aaaaaataag gaaggagcaa 2340
gccaaaaaga atgtgaaaaa actttcaaaa gaggaacaag agctcgttaa tgaacagtta 2400
gcgaaagaat ctgcagttag atcacacgtt tcggaaattt ccactcgttt aaagcgtggt 2460
attagattgg tatctgaact ttccaaagct gcttgcttag tccaaaatgg catcgctact 2520
tggttcccct tggcagtcac aaagcttttg tacctatgct cggaaccaaa tatttcaaag 2580
ctaacagagg atgtaaataa tgtgttcttg cagctttctc aaaatgtctc cgagagatta 2640
ggtaatatca gacttttctt aggtttggcg actttgcgtg tgcacaatgc taatggcatc 2700
tcgcaagatt atttacaaga accactggtt gaattactta caagagttct ttttaggatc 2760
aagttcgtct ccaaccaagc agcaatagat tccatcagtt tgacatatat tttaccattg 2820
ttgattaatg ttttagaaaa gggtaaggcg attgcattaa agaatgcgga caagcctgtt 2880
gttaaggctg agtttgttga agaagatgaa gaagaagaac atctgttact ggccatggaa 2940
attatttctg tacacgctga agcttttgag gatccttcca ttccgagaat ttccattgtt 3000
gaagtgttac tatctcttct atctttaccc tcaaaagcga agattgctaa agattgtttc 3060
aacgctctgt gccaaagcat atctgttgca ccaaatcaag aagaccttga tatgatacta 3120
tcaaatttac tatcaccaaa tcaatttgtc cgttcaacaa tattagaaac tcttgataac 3180
gaattcgaat tagaaccttt tatgaaatat tcacctgaag ttttcatttg cagatttgat 3240
tcggatcctt ccaaccgcga gattgcagat ttcatttggg agttcaacaa atttgtagtc 3300
aacgatgaat tactaaaaag cttattccca ctattcaatc aggatgatag tggcttgaga 3360
ttatttgcgg caaacgcgta cgcatttggt gcggtaagtc tgtttacctc tgaagagaac 3420
tcctcgaaag attacttaaa tgatttgctg aacttttata aagaaaaggc aaagccattg 3480
gagccaattc ttgatcaatt tggcttggtt cttgtttctg cgagtgaaca aaaagatcca 3540
tggcaaggaa gaagtaccgt tgctattaca ttaaaaatca tggctaaggc tttttctgca 3600
gaggatgata ctgtcgttaa cattataaaa tttttggtcg atgatggagg tctagtagac 3660
agagagccta ttgttcgtca agaaatgaaa gaagctggtg ttgaattaat tacgttacat 3720
ggctcacaaa actcgaagga tttaattcct atatttgaag aagcattaag ctccagtacg 3780
gacagtgcct taaaagagaa cgttattatt ttgtatggta cattagcaag acatttacag 3840
caaagtgatg caaggattca cacgatcatt gaaagattgc tttcaacttt ggatactcct 3900
tctgcggata ttcaacaggc tgtgtcggct tgtatagcac cactagtttt ccagttcaaa 3960
caaaaagttg gtgattactt gggtatccta atggagaaac tgctgaatcc aactgttgct 4020
tcttctatgc ggaaaggtgc cgcttggggt atcgctggtt tagtgaaagg ttacggtatc 4080
tcggctctct cggagtttga cattattcgc aacctcatcg aagctgcaga agataaaaag 4140
gagccaaaaa gacgtgaatc tgttggcttc tgctttcaat atttgtctga atctctagga 4200
aagttttttg aaccatatgt gatagaaatt cttccaaata ttttaaagaa tttaggggat 4260
gctgttcctg aagttagaga tgcaaccgct cgtgccacta aggctataat ggcgcatact 4320
acaggttacg gtgttaaaaa gttaattcca gttgctgttt ctaatttgga tgaaattgct 4380
tggagaacta agaggggctc tgttcaattg ttgggtaata tggcttattt agatcctact 4440
caattgtcag cttctttgtc caccattgtc ccagaaattg ttggtgtatt gaacgactct 4500
cacaaagagg tgcgtaaggc cgctgatgaa tccttgaaaa gattcggtga agttatcaga 4560
aatccggaaa ttcagaaatt ggtgcccgta cttttgcaag ctatcggtga tccaacaaaa 4620
tacactgaag aggccttgga ttcgttaatt caaacacaat ttgtccatta tattgatggt 4680
ccttcactag cactaattat tcatattatt catcgtggta tgcatgatag atctgccaac 4740
attaagagga aagcatgtaa gatcgtgggc aatatggcca ttttggttga taccaaagat 4800
ctcatcccat atttacaaca gctgatagat gaagtggaga ttgctatggt ggatccagtt 4860
ccaaatacta gagccacagc agcacgtgct ttgggtgctt tggtagaaag gttaggtgaa 4920
gagcaattcc cagatttgat tcctcgtcta ctagatacct taagtgacga atcaaaatct 4980
ggtgatcgtc tcggttctgc tcaagctcta gctgaagtta ttagtggctt gggcttgacc 5040
aagttggatg agatgttacc aaccatttta gctggtgtaa ccaattttcg tgcttatatc 5100
agggaaggat tcatgccttt gctgcttttc cttcctgttt gttttggatc acaatttgct 5160
ccatacatta atcagattat tcagcctatt ctttccggat tggccgataa tgatgaaaat 5220
attcgcgata ctgctttgaa ggctggtaaa ttaattgtca aaaactacgc tacaaaggcc 5280
gttgatttgt tgttgcctga attagaaagg ggtatgttcg atgaaaatga cagaattcgc 5340
ttatcttctg ttcaattaac cggagaacta ttgttccaag ttactggtat ttcctccagg 5400
aacgaatttt ctgaggaaga tggtgatcat aatggtgaat tctctggtaa attggtcgat 5460
gtacttggcc aagaccgtcg tgatagaatt ttagccgcat tatttgtatg caggaacgac 5520
acttctggta tcgtacgtgc tacgacggtt gacatttgga aggcattggt tccaaatact 5580
ccaagagctg tgaaagagat ccttccaaca ttgactggta tgatagtcac tcacttggct 5640
tcatcatcca atgtattacg caacattgct gctcagacct taggtgatct tgtccgtcgt 5700
gtaggtggta atgctttgtc ccaactgtta ccaagtttgg aggaatcttt gatagaaaca 5760
tcaaactcag attcgagaca aggtgtttgt attgctcttt atgagttaat tgaatcggct 5820
tctacggaaa cgatatcaca gttccaatct accatcgtta acattattcg tacggcatta 5880
attgatgagt cggctactgt cagagaagcg gctgcattat cttttgatgt attccaagat 5940
gttgtaggaa aaactgctgt tgatgaagtt ttaccatatt tgttgcatat gcttgaatct 6000
tctgataatt ctgactttgc tttgttaggt ttacaagaaa ttatgtcgaa gaagtccgac 6060
gtaatcttcc caattttaat tccaacccta ttagcccctc caatagacgc cttcagggct 6120
tctgctttag gttctttggc ggaagttgct ggctcagcct tatacaagcg tttatcaatt 6180
ataatcaacg cactagtgga tgcaatcata ggtacttctg aagatgaatc gaccaagggt 6240
gcattagaac ttgcattaga cagggtattc ttatctgtga atgatgacga aggtcttcac 6300
ccattacttc aacagattat gtcactacta aagagtgata atatagagaa acgcatagct 6360
gttttagaac gtttgccaaa tttcttcgat aagactgttc ttgattttga tgtctatatt 6420
ccgaactttg tctctcacgc aattttatca ttagatgatg aagatcaaag ggttgttaat 6480
ggtaacttca atgctttgtc tactttgttg aagaaggttg ataagcccac cttagaaaaa 6540
ttagttaagc ctgctaaaca gtcattggca ttaacaggca ggcaaggtca agatgtcgct 6600
gcatttaagc ttccaagagg ccctaactgt gttttgccta ttttcttgca tggtttgatg 6660
tatggttcga atgatgaaag ggaagaatct gcattagcca ttgctgacgt tgtttcgaag 6720
acccctgccg ctaacttgaa gccatttgtg agcgtaatta ctggtccatt aattcgtgtc 6780
gtgggtgaaa gatttagtag tgatatcaaa gcagcaattt tatttgcact taatgtgcta 6840
ttcattaaga ttccaatgtt cttgaggcct tttatccctc aattacaaag aacatttgtt 6900
aaatccttgt ctgacgctac caatgaaacg ttacgtctcc gcgccgcaaa ggctcttggt 6960
gccctgattg aacatcagcc tcgtgttgac cctctagtca ttgaactggt gacaggtgcc 7020
aagcaagcca cagatgaagg tgtcaagact gcgatgctta aagctttact ggaagttatt 7080
atgaaggctg gttccaaatt aaacgaaaat tctaagacaa acattgtcaa tttagttgag 7140
gaagaaatgt tgggtagcaa tgacaaattg gcagttgctt acgctaaatt aatcggatcg 7200
ttatcagaga ttttgtcgaa cgacgaagcc cacaagatat tgcaagacaa ggttttgaat 7260
gcagatctag atggagaaac cggtaagttt gctattctga ctttgaattc ctttttgaaa 7320
gatgcaccaa cacatatatt caatacgggc ttgatagacg aatttgtaag ttacattttg 7380
aatgcaatcc gttcccctga tgtttacttc ggagaaaatg gtaccattgc tgctggtaaa 7440
ttacttttat tagaaggaga aaagaggtct ccatttgtta aaaaggatgc tgcagaacca 7500
ttcaaaattg gcgatgaaaa catcaatctg ttaattaatg agttgagcaa agctgtctta 7560
caaccagcca gtaattctac ggatgtaaga aggttggcct tggtggttat aagaacacta 7620
gccagattca aatttgacga gtgcattaag caatacttcg atgtagtagg accatctgta 7680
ttttcttgct tgcgtgatcc tgttatccca attaagctcg cagcagaaaa agcatattta 7740
gctttgttca aattggttga agaagatgac atgcatactt tcaacgagtg gtttgctaaa 7800
atttcagatc gcggtaacag catcgaaact gtcacaggta ctacaattca attacggtct 7860
gttggggact ataccaagag ggttggtaaa aggttagcaa atgtcgaaag agaaaggatt 7920
gctgccggag gagacgcgga aacaatgttt agtgacagat ttgaagatga aagagaaata 7980
tgggctgtcg gaggtgttga attaaccact gatatttga 8019
<210> 50
<211> 2672
<212> PRT
<213> Saccharomyces cerevisiae
<400> 50
Met Thr Ala Ile Leu Asn Trp Glu Asp Ile Ser Pro Val Leu Glu Lys
1 5 10 15
Gly Thr Arg Glu Ser His Val Ser Lys Arg Val Pro Phe Leu Gln Asp
20 25 30
Ile Ser Gln Leu Val Arg Gln Glu Thr Leu Glu Lys Pro Gln Leu Ser
35 40 45
Glu Ile Ala Phe Val Leu Leu Asn Thr Phe Thr Ile Tyr Glu Asp Asn
50 55 60
Arg Ser Lys Ser Leu Val Thr Ser Ile Leu Leu Asp Ile Leu Asn Leu
65 70 75 80
Glu Pro Cys Leu Leu Glu Asn Phe Ile Arg Phe Ile Ser Asp Val Val
85 90 95
Ile Ser Asn Pro Ala Thr Lys Ala Val Ala Asp Tyr Leu Asn Leu Leu
100 105 110
Asp Trp Ile Asn Ser Phe Leu Ile Phe Val Ser His Asn Ser Asn Leu
115 120 125
Phe Glu Glu Tyr Ile Pro Lys Leu Leu Val Ala His Ser Tyr Ala Thr
130 135 140
Phe Gly Val Glu Thr Ile Leu Asp Asn Gln Glu Glu Gly Lys Lys Ser
145 150 155 160
Gln Asp Lys Gln Asn Gln His Arg Lys Arg Ile Arg Tyr Cys Ile Phe
165 170 175
Gln Thr Thr Val Lys Ala Phe Leu Lys Cys Leu Lys Asp Asn Asp Asp
180 185 190
Ser Ile Ser Phe Met Lys Ile Ser Ile Lys Thr Val Leu Glu Ser Tyr
195 200 205
Ser Lys Leu Lys Ile Thr Ser Val Gly Val Val Met Ile Met Gly Ala
210 215 220
Leu Thr Gln Ala Ala Leu Gln Leu Leu Ser Arg Gln Pro Ala Leu His
225 230 235 240
Ser Val Leu Lys Glu Asn Ser Ala Glu Lys Tyr Cys Glu Tyr Leu Gly
245 250 255
Lys Glu Val Phe Leu Gly Lys Asn Pro Pro Ser Ser Phe Cys Leu Glu
260 265 270
Ile Gly Leu Lys Pro Phe Leu Lys Glu Phe Val Ser Gln Glu Leu Phe
275 280 285
Ile Lys Phe Phe Ile Pro Asn Ile Glu Lys Ala Val Leu Arg Ser Pro
290 295 300
Glu Val Gly Phe Ser Ile Leu Ser Glu Leu Tyr Ala Gly Val Ser Pro
305 310 315 320
Glu Lys Val Asn Leu Leu Asn Ala Phe Ala Ser Ser Lys Leu Ile Asn
325 330 335
Gln Tyr Phe Ser Ser Phe Lys Ser Ser Lys Glu Val Val Arg Ser Val
340 345 350
Ser Leu Gln Ser Met Ile Ile Leu Leu Arg Lys Ile Ser Asn Thr Asp
355 360 365
Thr Thr Leu Glu Asp Leu Thr Lys Leu Ile Asp Glu Ile Phe Lys Asn
370 375 380
Ile Lys Ser Asn Leu Asn Ala Asp Tyr Lys Ser Leu Ile Ser Lys Ile
385 390 395 400
Leu Ile Glu Ile Pro Leu Thr His Tyr Glu Val Ser Glu Lys Ile Cys
405 410 415
Lys Gly Leu Ser Pro Tyr Ile Gly Lys Glu Gly Asn Glu Ala Ala Leu
420 425 430
Thr Leu Met Leu Asn Ala Phe Phe Val His Tyr Phe Ser Leu Gly Lys
435 440 445
Pro Ile Glu Asp Leu Asp Lys Ile Ile Ser Ala Gly Phe Ala Asp Lys
450 455 460
Lys Pro Ala Leu Lys Lys Cys Trp Phe Ala Ala Phe Leu Asn Asn Ser
465 470 475 480
Asn Ala Ala Ser Glu Glu Val Ile Leu Asn Phe Ile Asp Gly Cys Leu
485 490 495
Glu Phe Val Lys Asp Ser Ile Ile His Tyr Gln Thr His Gly His Ala
500 505 510
Cys Ile Leu Ala Ser Ile Glu Phe Thr Asn Lys Ile Leu Ala Leu Asp
515 520 525
Asn Thr Glu Leu Asn Asp Arg Val Met Gln Leu Ile Glu Thr Leu Pro
530 535 540
Glu Asn Ser Ser Ile Gly Asp Ala Ile Leu Thr Ala Ala Leu Ser Thr
545 550 555 560
Glu Leu Ser Ile Glu Asn Arg Ile His Ala Val Asn Leu Leu Gln Glu
565 570 575
Leu Phe Tyr Lys Lys Pro Glu Phe Ile Gly Phe Ser Val Ile Asp Ala
580 585 590
Ile Glu Arg Arg Met Arg Val Gln Glu Leu Ile Pro Gln Gln Asn Thr
595 600 605
Ser Phe Lys Tyr Val Thr Ser Val Leu Leu Ala Ile Thr Ser Glu Leu
610 615 620
Pro Asp Lys Glu Ala Ser Ile Lys Val Leu Ile Asn Ala Leu Val Ile
625 630 635 640
Ala Gln Trp Asn Ile Phe Asn Ile Lys Asn Gly Trp Ala Gly Leu Val
645 650 655
Leu Arg Ala Arg Leu Asp Pro Ala Glu Val Val Lys Glu His Ala Ser
660 665 670
Val Ile Met Glu Lys Ile Leu Glu Ile Thr Gly Ser Cys Glu Trp Ile
675 680 685
Asp Thr Ile Tyr Gly Ala Cys Gly Leu Gln Ala Ala Ala Tyr Ala Ala
690 695 700
Phe Ile Gln Pro Asn Glu Phe Thr Pro Ile Leu Cys Lys Thr Ile Glu
705 710 715 720
Ala Asp Leu Thr Ala Asp Asp Phe Ser Arg Leu Ser Glu Glu Asp Phe
725 730 735
Glu Ile Phe Ala Gly Glu Glu Gly Val Leu Val Val Asp Val Leu Glu
740 745 750
Glu Ser Met Asn Lys Lys Leu Ser Asn Lys Asn Ser Lys Glu Tyr Glu
755 760 765
Thr Leu Met Trp Glu Gln Lys Ile Arg Lys Glu Gln Ala Lys Lys Asn
770 775 780
Val Lys Lys Leu Ser Lys Glu Glu Gln Glu Leu Val Asn Glu Gln Leu
785 790 795 800
Ala Lys Glu Ser Ala Val Arg Ser His Val Ser Glu Ile Ser Thr Arg
805 810 815
Leu Lys Arg Gly Ile Arg Leu Val Ser Glu Leu Ser Lys Ala Ala Cys
820 825 830
Leu Val Gln Asn Gly Ile Ala Thr Trp Phe Pro Leu Ala Val Thr Lys
835 840 845
Leu Leu Tyr Leu Cys Ser Glu Pro Asn Ile Ser Lys Leu Thr Glu Asp
850 855 860
Val Asn Asn Val Phe Leu Gln Leu Ser Gln Asn Val Ser Glu Arg Leu
865 870 875 880
Gly Asn Ile Arg Leu Phe Leu Gly Leu Ala Thr Leu Arg Val His Asn
885 890 895
Ala Asn Gly Ile Ser Gln Asp Tyr Leu Gln Glu Pro Leu Val Glu Leu
900 905 910
Leu Thr Arg Val Leu Phe Arg Ile Lys Phe Val Ser Asn Gln Ala Ala
915 920 925
Ile Asp Ser Ile Ser Leu Thr Tyr Ile Leu Pro Leu Leu Ile Asn Val
930 935 940
Leu Glu Lys Gly Lys Ala Ile Ala Leu Lys Asn Ala Asp Lys Pro Val
945 950 955 960
Val Lys Ala Glu Phe Val Glu Glu Asp Glu Glu Glu Glu His Leu Leu
965 970 975
Leu Ala Met Glu Ile Ile Ser Val His Ala Glu Ala Phe Glu Asp Pro
980 985 990
Ser Ile Pro Arg Ile Ser Ile Val Glu Val Leu Leu Ser Leu Leu Ser
995 1000 1005
Leu Pro Ser Lys Ala Lys Ile Ala Lys Asp Cys Phe Asn Ala Leu
1010 1015 1020
Cys Gln Ser Ile Ser Val Ala Pro Asn Gln Glu Asp Leu Asp Met
1025 1030 1035
Ile Leu Ser Asn Leu Leu Ser Pro Asn Gln Phe Val Arg Ser Thr
1040 1045 1050
Ile Leu Glu Thr Leu Asp Asn Glu Phe Glu Leu Glu Pro Phe Met
1055 1060 1065
Lys Tyr Ser Pro Glu Val Phe Ile Cys Arg Phe Asp Ser Asp Pro
1070 1075 1080
Ser Asn Arg Glu Ile Ala Asp Phe Ile Trp Glu Phe Asn Lys Phe
1085 1090 1095
Val Val Asn Asp Glu Leu Leu Lys Ser Leu Phe Pro Leu Phe Asn
1100 1105 1110
Gln Asp Asp Ser Gly Leu Arg Leu Phe Ala Ala Asn Ala Tyr Ala
1115 1120 1125
Phe Gly Ala Val Ser Leu Phe Thr Ser Glu Glu Asn Ser Ser Lys
1130 1135 1140
Asp Tyr Leu Asn Asp Leu Leu Asn Phe Tyr Lys Glu Lys Ala Lys
1145 1150 1155
Pro Leu Glu Pro Ile Leu Asp Gln Phe Gly Leu Val Leu Val Ser
1160 1165 1170
Ala Ser Glu Gln Lys Asp Pro Trp Gln Gly Arg Ser Thr Val Ala
1175 1180 1185
Ile Thr Leu Lys Ile Met Ala Lys Ala Phe Ser Ala Glu Asp Asp
1190 1195 1200
Thr Val Val Asn Ile Ile Lys Phe Leu Val Asp Asp Gly Gly Leu
1205 1210 1215
Val Asp Arg Glu Pro Ile Val Arg Gln Glu Met Lys Glu Ala Gly
1220 1225 1230
Val Glu Leu Ile Thr Leu His Gly Ser Gln Asn Ser Lys Asp Leu
1235 1240 1245
Ile Pro Ile Phe Glu Glu Ala Leu Ser Ser Ser Thr Asp Ser Ala
1250 1255 1260
Leu Lys Glu Asn Val Ile Ile Leu Tyr Gly Thr Leu Ala Arg His
1265 1270 1275
Leu Gln Gln Ser Asp Ala Arg Ile His Thr Ile Ile Glu Arg Leu
1280 1285 1290
Leu Ser Thr Leu Asp Thr Pro Ser Ala Asp Ile Gln Gln Ala Val
1295 1300 1305
Ser Ala Cys Ile Ala Pro Leu Val Phe Gln Phe Lys Gln Lys Val
1310 1315 1320
Gly Asp Tyr Leu Gly Ile Leu Met Glu Lys Leu Leu Asn Pro Thr
1325 1330 1335
Val Ala Ser Ser Met Arg Lys Gly Ala Ala Trp Gly Ile Ala Gly
1340 1345 1350
Leu Val Lys Gly Tyr Gly Ile Ser Ala Leu Ser Glu Phe Asp Ile
1355 1360 1365
Ile Arg Asn Leu Ile Glu Ala Ala Glu Asp Lys Lys Glu Pro Lys
1370 1375 1380
Arg Arg Glu Ser Val Gly Phe Cys Phe Gln Tyr Leu Ser Glu Ser
1385 1390 1395
Leu Gly Lys Phe Phe Glu Pro Tyr Val Ile Glu Ile Leu Pro Asn
1400 1405 1410
Ile Leu Lys Asn Leu Gly Asp Ala Val Pro Glu Val Arg Asp Ala
1415 1420 1425
Thr Ala Arg Ala Thr Lys Ala Ile Met Ala His Thr Thr Gly Tyr
1430 1435 1440
Gly Val Lys Lys Leu Ile Pro Val Ala Val Ser Asn Leu Asp Glu
1445 1450 1455
Ile Ala Trp Arg Thr Lys Arg Gly Ser Val Gln Leu Leu Gly Asn
1460 1465 1470
Met Ala Tyr Leu Asp Pro Thr Gln Leu Ser Ala Ser Leu Ser Thr
1475 1480 1485
Ile Val Pro Glu Ile Val Gly Val Leu Asn Asp Ser His Lys Glu
1490 1495 1500
Val Arg Lys Ala Ala Asp Glu Ser Leu Lys Arg Phe Gly Glu Val
1505 1510 1515
Ile Arg Asn Pro Glu Ile Gln Lys Leu Val Pro Val Leu Leu Gln
1520 1525 1530
Ala Ile Gly Asp Pro Thr Lys Tyr Thr Glu Glu Ala Leu Asp Ser
1535 1540 1545
Leu Ile Gln Thr Gln Phe Val His Tyr Ile Asp Gly Pro Ser Leu
1550 1555 1560
Ala Leu Ile Ile His Ile Ile His Arg Gly Met His Asp Arg Ser
1565 1570 1575
Ala Asn Ile Lys Arg Lys Ala Cys Lys Ile Val Gly Asn Met Ala
1580 1585 1590
Ile Leu Val Asp Thr Lys Asp Leu Ile Pro Tyr Leu Gln Gln Leu
1595 1600 1605
Ile Asp Glu Val Glu Ile Ala Met Val Asp Pro Val Pro Asn Thr
1610 1615 1620
Arg Ala Thr Ala Ala Arg Ala Leu Gly Ala Leu Val Glu Arg Leu
1625 1630 1635
Gly Glu Glu Gln Phe Pro Asp Leu Ile Pro Arg Leu Leu Asp Thr
1640 1645 1650
Leu Ser Asp Glu Ser Lys Ser Gly Asp Arg Leu Gly Ser Ala Gln
1655 1660 1665
Ala Leu Ala Glu Val Ile Ser Gly Leu Gly Leu Thr Lys Leu Asp
1670 1675 1680
Glu Met Leu Pro Thr Ile Leu Ala Gly Val Thr Asn Phe Arg Ala
1685 1690 1695
Tyr Ile Arg Glu Gly Phe Met Pro Leu Leu Leu Phe Leu Pro Val
1700 1705 1710
Cys Phe Gly Ser Gln Phe Ala Pro Tyr Ile Asn Gln Ile Ile Gln
1715 1720 1725
Pro Ile Leu Ser Gly Leu Ala Asp Asn Asp Glu Asn Ile Arg Asp
1730 1735 1740
Thr Ala Leu Lys Ala Gly Lys Leu Ile Val Lys Asn Tyr Ala Thr
1745 1750 1755
Lys Ala Val Asp Leu Leu Leu Pro Glu Leu Glu Arg Gly Met Phe
1760 1765 1770
Asp Glu Asn Asp Arg Ile Arg Leu Ser Ser Val Gln Leu Thr Gly
1775 1780 1785
Glu Leu Leu Phe Gln Val Thr Gly Ile Ser Ser Arg Asn Glu Phe
1790 1795 1800
Ser Glu Glu Asp Gly Asp His Asn Gly Glu Phe Ser Gly Lys Leu
1805 1810 1815
Val Asp Val Leu Gly Gln Asp Arg Arg Asp Arg Ile Leu Ala Ala
1820 1825 1830
Leu Phe Val Cys Arg Asn Asp Thr Ser Gly Ile Val Arg Ala Thr
1835 1840 1845
Thr Val Asp Ile Trp Lys Ala Leu Val Pro Asn Thr Pro Arg Ala
1850 1855 1860
Val Lys Glu Ile Leu Pro Thr Leu Thr Gly Met Ile Val Thr His
1865 1870 1875
Leu Ala Ser Ser Ser Asn Val Leu Arg Asn Ile Ala Ala Gln Thr
1880 1885 1890
Leu Gly Asp Leu Val Arg Arg Val Gly Gly Asn Ala Leu Ser Gln
1895 1900 1905
Leu Leu Pro Ser Leu Glu Glu Ser Leu Ile Glu Thr Ser Asn Ser
1910 1915 1920
Asp Ser Arg Gln Gly Val Cys Ile Ala Leu Tyr Glu Leu Ile Glu
1925 1930 1935
Ser Ala Ser Thr Glu Thr Ile Ser Gln Phe Gln Ser Thr Ile Val
1940 1945 1950
Asn Ile Ile Arg Thr Ala Leu Ile Asp Glu Ser Ala Thr Val Arg
1955 1960 1965
Glu Ala Ala Ala Leu Ser Phe Asp Val Phe Gln Asp Val Val Gly
1970 1975 1980
Lys Thr Ala Val Asp Glu Val Leu Pro Tyr Leu Leu His Met Leu
1985 1990 1995
Glu Ser Ser Asp Asn Ser Asp Phe Ala Leu Leu Gly Leu Gln Glu
2000 2005 2010
Ile Met Ser Lys Lys Ser Asp Val Ile Phe Pro Ile Leu Ile Pro
2015 2020 2025
Thr Leu Leu Ala Pro Pro Ile Asp Ala Phe Arg Ala Ser Ala Leu
2030 2035 2040
Gly Ser Leu Ala Glu Val Ala Gly Ser Ala Leu Tyr Lys Arg Leu
2045 2050 2055
Ser Ile Ile Ile Asn Ala Leu Val Asp Ala Ile Ile Gly Thr Ser
2060 2065 2070
Glu Asp Glu Ser Thr Lys Gly Ala Leu Glu Leu Ala Leu Asp Arg
2075 2080 2085
Val Phe Leu Ser Val Asn Asp Asp Glu Gly Leu His Pro Leu Leu
2090 2095 2100
Gln Gln Ile Met Ser Leu Leu Lys Ser Asp Asn Ile Glu Lys Arg
2105 2110 2115
Ile Ala Val Leu Glu Arg Leu Pro Asn Phe Phe Asp Lys Thr Val
2120 2125 2130
Leu Asp Phe Asp Val Tyr Ile Pro Asn Phe Val Ser His Ala Ile
2135 2140 2145
Leu Ser Leu Asp Asp Glu Asp Gln Arg Val Val Asn Gly Asn Phe
2150 2155 2160
Asn Ala Leu Ser Thr Leu Leu Lys Lys Val Asp Lys Pro Thr Leu
2165 2170 2175
Glu Lys Leu Val Lys Pro Ala Lys Gln Ser Leu Ala Leu Thr Gly
2180 2185 2190
Arg Gln Gly Gln Asp Val Ala Ala Phe Lys Leu Pro Arg Gly Pro
2195 2200 2205
Asn Cys Val Leu Pro Ile Phe Leu His Gly Leu Met Tyr Gly Ser
2210 2215 2220
Asn Asp Glu Arg Glu Glu Ser Ala Leu Ala Ile Ala Asp Val Val
2225 2230 2235
Ser Lys Thr Pro Ala Ala Asn Leu Lys Pro Phe Val Ser Val Ile
2240 2245 2250
Thr Gly Pro Leu Ile Arg Val Val Gly Glu Arg Phe Ser Ser Asp
2255 2260 2265
Ile Lys Ala Ala Ile Leu Phe Ala Leu Asn Val Leu Phe Ile Lys
2270 2275 2280
Ile Pro Met Phe Leu Arg Pro Phe Ile Pro Gln Leu Gln Arg Thr
2285 2290 2295
Phe Val Lys Ser Leu Ser Asp Ala Thr Asn Glu Thr Leu Arg Leu
2300 2305 2310
Arg Ala Ala Lys Ala Leu Gly Ala Leu Ile Glu His Gln Pro Arg
2315 2320 2325
Val Asp Pro Leu Val Ile Glu Leu Val Thr Gly Ala Lys Gln Ala
2330 2335 2340
Thr Asp Glu Gly Val Lys Thr Ala Met Leu Lys Ala Leu Leu Glu
2345 2350 2355
Val Ile Met Lys Ala Gly Ser Lys Leu Asn Glu Asn Ser Lys Thr
2360 2365 2370
Asn Ile Val Asn Leu Val Glu Glu Glu Met Leu Gly Ser Asn Asp
2375 2380 2385
Lys Leu Ala Val Ala Tyr Ala Lys Leu Ile Gly Ser Leu Ser Glu
2390 2395 2400
Ile Leu Ser Asn Asp Glu Ala His Lys Ile Leu Gln Asp Lys Val
2405 2410 2415
Leu Asn Ala Asp Leu Asp Gly Glu Thr Gly Lys Phe Ala Ile Leu
2420 2425 2430
Thr Leu Asn Ser Phe Leu Lys Asp Ala Pro Thr His Ile Phe Asn
2435 2440 2445
Thr Gly Leu Ile Asp Glu Phe Val Ser Tyr Ile Leu Asn Ala Ile
2450 2455 2460
Arg Ser Pro Asp Val Tyr Phe Gly Glu Asn Gly Thr Ile Ala Ala
2465 2470 2475
Gly Lys Leu Leu Leu Leu Glu Gly Glu Lys Arg Ser Pro Phe Val
2480 2485 2490
Lys Lys Asp Ala Ala Glu Pro Phe Lys Ile Gly Asp Glu Asn Ile
2495 2500 2505
Asn Leu Leu Ile Asn Glu Leu Ser Lys Ala Val Leu Gln Pro Ala
2510 2515 2520
Ser Asn Ser Thr Asp Val Arg Arg Leu Ala Leu Val Val Ile Arg
2525 2530 2535
Thr Leu Ala Arg Phe Lys Phe Asp Glu Cys Ile Lys Gln Tyr Phe
2540 2545 2550
Asp Val Val Gly Pro Ser Val Phe Ser Cys Leu Arg Asp Pro Val
2555 2560 2565
Ile Pro Ile Lys Leu Ala Ala Glu Lys Ala Tyr Leu Ala Leu Phe
2570 2575 2580
Lys Leu Val Glu Glu Asp Asp Met His Thr Phe Asn Glu Trp Phe
2585 2590 2595
Ala Lys Ile Ser Asp Arg Gly Asn Ser Ile Glu Thr Val Thr Gly
2600 2605 2610
Thr Thr Ile Gln Leu Arg Ser Val Gly Asp Tyr Thr Lys Arg Val
2615 2620 2625
Gly Lys Arg Leu Ala Asn Val Glu Arg Glu Arg Ile Ala Ala Gly
2630 2635 2640
Gly Asp Ala Glu Thr Met Phe Ser Asp Arg Phe Glu Asp Glu Arg
2645 2650 2655
Glu Ile Trp Ala Val Gly Gly Val Glu Leu Thr Thr Asp Ile
2660 2665 2670
<210> 51
<211> 4980
<212> DNA
<213> Saccharomyces cerevisiae
<400> 51
atgtcattga gtcatctcac tttagatcaa tattatgaaa tacagtgcaa cgaacttgaa 60
gcgatacgtt ccatttatat ggatgacttt actgacttaa ctaaaagaaa gtctagctgg 120
gataagcagc cacagattat attcgaaatt acgcttcgat ctgttgacaa agagccggtt 180
gaatcttcta taacattaca ttttgcgatg accccaatgt atccttatac cgctccagaa 240
atagaattca aaaatgtaca aaatgtaatg gatagtcaat tgcaaatgct gaaaagtgaa 300
tttaagaaaa tccacaacac ctcccgaggc caagagatta tatttgaaat tacatctttt 360
actcaagaaa aactggacga atttcaaaat gtggtaaata cacagtcctt ggaagatgat 420
cgattacaaa gaatcaaaga aactaaagaa caattagaaa aggaagaaag agaaaaacaa 480
caggaaacaa taaaaaaaag atcagatgag cagcgaagga tagatgaaat tgttcaaaga 540
gagttggaga aaagacaaga tgatgatgat gatttgctat tcaacagaac aacccagtta 600
gatttacaac caccttcaga atgggttgca tcaggtgaag ctattgtctt ttcaaaaact 660
ataaaggcaa aattgcctaa taactcaatg ttcaagttta aagcagttgt aaatcctaag 720
ccaataaaac tgacatcaga tatatttagt ttttccaaac aatttcttgt gaagccttat 780
ataccaccag aatctccgtt ggcagatttt ttaatgtctt ctgaaatgat ggaaaatttc 840
tactatttgc tatctgaaat tgaattggat aatagctatt tcaacacaag taatggaaaa 900
aaagaaatag caaatttaga gaaagagtta gagacggtgt tgaaagctaa gcatgacaat 960
gtgaatcgat tgttcggtta tacggtggag cgcatgggga gaaataatgc aacgtttgtt 1020
tggaaaataa gactcttgac agagtactgt aactactatc cattgggaga tttgatacaa 1080
tctgttggat ttgttaactt agcaacagcg cgtatttgga tgattagatt gcttgaagga 1140
ttggaggcca tacacaaatt gggaattgtt cataaatgta tcaacttaga aaccgtgatc 1200
ctggtgaagg atgcagattt tggaagcact attcccaagt tagttcactc cacttatggc 1260
tacactgttt tgaatatgct atcgagatat ccaaataaaa atggttcttc ggttgagtta 1320
tctccaagta catggatagc ccctgagttg ttgaaattca ataacgccaa acctcaaaga 1380
ttaactgata tttggcaact tggtgttttg tttatccaga taatcagtgg atctgatata 1440
gtgatgaatt ttgaaacgcc tcaagaattc ctagattcaa caagtatgga tgaaacttta 1500
tatgatcttc tttcgaaaat gcttaataac gatccgaaga aaagattagg aacattagaa 1560
ctactgccca tgaaattctt aaggaccaat attgactcta caatcaatcg atttaactta 1620
gtttccgaaa gtgtcaattc taattccttg gagttaactc ctggagatac cataaccgtt 1680
cggggcaatg gaggtagaac actttcacaa tcgagtatac gaagaagatc atttaatgtt 1740
ggttccagat tctcttctat aaatcctgca acgcgatcac gatatgcttc tgactttgaa 1800
gagattgcag ttttaggcca gggcgcattt ggacaagttg tcaaggcacg taatgctctc 1860
gatagcagat actatgcgat caagaagatt agacatacag aagaaaagtt atctactata 1920
ttgagtgaag taatgctgtt agcaagctta aatcatcaat atgttgtgcg ttactatgct 1980
gcatggttag aagaagacag tatggatgaa aacgtttttg aatcaactga tgaagaaagt 2040
gacttgagcg aatcttcctc tgattttgag gaaaatgatt tattagatca aagcagtatt 2100
tttaaaaata gaacaaatca cgatttggat aatagtaact gggatttcat atcggggtca 2160
ggatatccgg atattgtctt tgaaaatagt tctcgtgatg atgaaaatga agatctagac 2220
catgatactt cctcgacttc ctcgagcgaa agtcaagatg atactgataa agaatcaaag 2280
agtatccaga acgttccaag aaggaggaat tttgtaaaac cgatgactgc tgttaagaag 2340
aaaagtacgc tttttattca aatggagtac tgtgaaaata gaacgctata tgatttgatc 2400
cattctgaaa atttaaatca acaacgtgat gaatattgga ggttatttcg acaaattttg 2460
gaagcactga gttatataca ttcccagggt atcattcata gggatctgaa gccaatgaat 2520
atttttatag atgaatcgag aaatgttaaa atcggtgatt ttgggttagc taagaacgtc 2580
catagatctc tggatatact taagctagat tcacagaatt tgccaggcag ctcagataat 2640
ttaacatccg ccattggtac agcaatgtat gttgctactg aagttttaga tggtacaggt 2700
cactataatg aaaagattga tatgtattca cttggaatca ttttttttga aatgatctat 2760
cctttcagta caggtatgga gagagttaat attttgaaaa agttacgatc agtgtcgata 2820
gaatttcctc ctgatttcga cgataataag atgaaagttg aaaagaaaat tataaggtta 2880
ctcatagacc atgatcccaa taaaaggcct ggtgctagga cattattaaa tagtggttgg 2940
cttcctgtga agcatcagga tgaagtaatc aaagaggctt taaaaagttt gtcgaatcct 3000
tcatcccctt ggcaacagca agttcgagaa agtttattta accaatctta cagtctaaca 3060
aatgatattc tatttgataa ctcagttcca acatccactc ctttcgcaaa cattctcagg 3120
tcccaaatga cagaagaggt agttaaaatt ttcaggaaac atggaggaat tgaaaataat 3180
gctcctccga ggatttttcc aaaggccccc atatacggta cgcagaatgt atatgaagtg 3240
cttgacaagg gcggtaccgt cttgcagtta caatatgatt taacttatcc tatggctagg 3300
tatctatcta aaaatccaag tctgatttct aagcaatata ggatgcagca cgtttaccga 3360
cctcctgatc attcaaggtc aagtttggaa cctagaaagt ttggtgagat tgacttcgac 3420
ataatttcaa aatcttcctc agagtcagga ttttatgatg cagaaagctt gaaaattatc 3480
gatgaaatat taaccgtatt tcctgtattt gagaaaacaa acactttttt catattaaat 3540
catgctgata ttttggagag tgttttcaac tttacaaata ttgataaagc ccaaaggcct 3600
ctagtttcac gaatgttgtc gcaagtaggc tttgcaaggt ccttcaagga agtaaagaat 3660
gaactaaagg cgcaactgaa catatcttct acggcattga atgatttgga gttatttgat 3720
tttagactgg acttcgaagc agccaaaaaa cgcctgtata aattgatgat tgatagtccg 3780
catctaaaaa aaattgagga ctctttgtcc catatatcaa aggttctcag ttacctaaaa 3840
cccttagaag ttgcaagaaa tgttgtgata tctcctttga gtaactacaa tagcgctttt 3900
tacaaaggag gtatcatgtt tcatgcagtt tatgacgatg gatcctcacg taatatgata 3960
gctgctggag ggaggtatga cactttgata tccttttttg ccagaccatc aggaaaaaag 4020
agcagcaata ctcgtaaggc tgtaggtttc aacttagcgt gggaaacaat attcggtata 4080
gcccaaaact atttcaaact cgcttctgga aataggataa agaagagaaa taggtttttg 4140
aaagatacag ctgttgattg gaagccaagc aggtgtgatg tattgatatc gagtttttcg 4200
aactctttgt tggacacaat cggggttaca atactgaata cattgtggaa gcaaaacatt 4260
aaagcggata tgttaaggga ttgttcctcg gtggatgatg tcgttactgg cgctcaacag 4320
gatggtatag actggatttt gctgattaag caacaagcgt atccactaac caatcacaag 4380
agaaagtaca agccattaaa aataaaaaaa ttgagcacta atgttgacat agatttagat 4440
cttgatgagt ttttaacctt gtaccaacaa gaaactggta ataaatcttt gatcaacgat 4500
agtctcactt tgggcgataa ggctgatgaa tttaaaagat gggatgaaaa cagcagtgcc 4560
ggtagtagtc aagaaggtga catagatgat gttgttgctg gttcgactaa taatcaaaag 4620
gtaatttatg ttccaaacat ggctacaaga tctaagaaag ctaataaaag ggaaaagtgg 4680
gtttatgagg atgcagccag aaattcttcg aatatgatat tacacaattt atccaatgca 4740
ccaattatca ctgttgatgc cttaagagat gaaactttag aaataatctc aattacttct 4800
ttggctcaga aggaagaatg gctgagaaaa gtttttgggt caggtaataa ctcgactcct 4860
agaagctttg ccacgagcat ttataataac ctctccaaag aggctcataa agggaatagg 4920
tgggcaatat tatactgcca caaaaccgga aaatcatctg ttatcgattt acagaggtag 4980
<210> 52
<211> 1659
<212> PRT
<213> Saccharomyces cerevisiae
<400> 52
Met Ser Leu Ser His Leu Thr Leu Asp Gln Tyr Tyr Glu Ile Gln Cys
1 5 10 15
Asn Glu Leu Glu Ala Ile Arg Ser Ile Tyr Met Asp Asp Phe Thr Asp
20 25 30
Leu Thr Lys Arg Lys Ser Ser Trp Asp Lys Gln Pro Gln Ile Ile Phe
35 40 45
Glu Ile Thr Leu Arg Ser Val Asp Lys Glu Pro Val Glu Ser Ser Ile
50 55 60
Thr Leu His Phe Ala Met Thr Pro Met Tyr Pro Tyr Thr Ala Pro Glu
65 70 75 80
Ile Glu Phe Lys Asn Val Gln Asn Val Met Asp Ser Gln Leu Gln Met
85 90 95
Leu Lys Ser Glu Phe Lys Lys Ile His Asn Thr Ser Arg Gly Gln Glu
100 105 110
Ile Ile Phe Glu Ile Thr Ser Phe Thr Gln Glu Lys Leu Asp Glu Phe
115 120 125
Gln Asn Val Val Asn Thr Gln Ser Leu Glu Asp Asp Arg Leu Gln Arg
130 135 140
Ile Lys Glu Thr Lys Glu Gln Leu Glu Lys Glu Glu Arg Glu Lys Gln
145 150 155 160
Gln Glu Thr Ile Lys Lys Arg Ser Asp Glu Gln Arg Arg Ile Asp Glu
165 170 175
Ile Val Gln Arg Glu Leu Glu Lys Arg Gln Asp Asp Asp Asp Asp Leu
180 185 190
Leu Phe Asn Arg Thr Thr Gln Leu Asp Leu Gln Pro Pro Ser Glu Trp
195 200 205
Val Ala Ser Gly Glu Ala Ile Val Phe Ser Lys Thr Ile Lys Ala Lys
210 215 220
Leu Pro Asn Asn Ser Met Phe Lys Phe Lys Ala Val Val Asn Pro Lys
225 230 235 240
Pro Ile Lys Leu Thr Ser Asp Ile Phe Ser Phe Ser Lys Gln Phe Leu
245 250 255
Val Lys Pro Tyr Ile Pro Pro Glu Ser Pro Leu Ala Asp Phe Leu Met
260 265 270
Ser Ser Glu Met Met Glu Asn Phe Tyr Tyr Leu Leu Ser Glu Ile Glu
275 280 285
Leu Asp Asn Ser Tyr Phe Asn Thr Ser Asn Gly Lys Lys Glu Ile Ala
290 295 300
Asn Leu Glu Lys Glu Leu Glu Thr Val Leu Lys Ala Lys His Asp Asn
305 310 315 320
Val Asn Arg Leu Phe Gly Tyr Thr Val Glu Arg Met Gly Arg Asn Asn
325 330 335
Ala Thr Phe Val Trp Lys Ile Arg Leu Leu Thr Glu Tyr Cys Asn Tyr
340 345 350
Tyr Pro Leu Gly Asp Leu Ile Gln Ser Val Gly Phe Val Asn Leu Ala
355 360 365
Thr Ala Arg Ile Trp Met Ile Arg Leu Leu Glu Gly Leu Glu Ala Ile
370 375 380
His Lys Leu Gly Ile Val His Lys Cys Ile Asn Leu Glu Thr Val Ile
385 390 395 400
Leu Val Lys Asp Ala Asp Phe Gly Ser Thr Ile Pro Lys Leu Val His
405 410 415
Ser Thr Tyr Gly Tyr Thr Val Leu Asn Met Leu Ser Arg Tyr Pro Asn
420 425 430
Lys Asn Gly Ser Ser Val Glu Leu Ser Pro Ser Thr Trp Ile Ala Pro
435 440 445
Glu Leu Leu Lys Phe Asn Asn Ala Lys Pro Gln Arg Leu Thr Asp Ile
450 455 460
Trp Gln Leu Gly Val Leu Phe Ile Gln Ile Ile Ser Gly Ser Asp Ile
465 470 475 480
Val Met Asn Phe Glu Thr Pro Gln Glu Phe Leu Asp Ser Thr Ser Met
485 490 495
Asp Glu Thr Leu Tyr Asp Leu Leu Ser Lys Met Leu Asn Asn Asp Pro
500 505 510
Lys Lys Arg Leu Gly Thr Leu Glu Leu Leu Pro Met Lys Phe Leu Arg
515 520 525
Thr Asn Ile Asp Ser Thr Ile Asn Arg Phe Asn Leu Val Ser Glu Ser
530 535 540
Val Asn Ser Asn Ser Leu Glu Leu Thr Pro Gly Asp Thr Ile Thr Val
545 550 555 560
Arg Gly Asn Gly Gly Arg Thr Leu Ser Gln Ser Ser Ile Arg Arg Arg
565 570 575
Ser Phe Asn Val Gly Ser Arg Phe Ser Ser Ile Asn Pro Ala Thr Arg
580 585 590
Ser Arg Tyr Ala Ser Asp Phe Glu Glu Ile Ala Val Leu Gly Gln Gly
595 600 605
Ala Phe Gly Gln Val Val Lys Ala Arg Asn Ala Leu Asp Ser Arg Tyr
610 615 620
Tyr Ala Ile Lys Lys Ile Arg His Thr Glu Glu Lys Leu Ser Thr Ile
625 630 635 640
Leu Ser Glu Val Met Leu Leu Ala Ser Leu Asn His Gln Tyr Val Val
645 650 655
Arg Tyr Tyr Ala Ala Trp Leu Glu Glu Asp Ser Met Asp Glu Asn Val
660 665 670
Phe Glu Ser Thr Asp Glu Glu Ser Asp Leu Ser Glu Ser Ser Ser Asp
675 680 685
Phe Glu Glu Asn Asp Leu Leu Asp Gln Ser Ser Ile Phe Lys Asn Arg
690 695 700
Thr Asn His Asp Leu Asp Asn Ser Asn Trp Asp Phe Ile Ser Gly Ser
705 710 715 720
Gly Tyr Pro Asp Ile Val Phe Glu Asn Ser Ser Arg Asp Asp Glu Asn
725 730 735
Glu Asp Leu Asp His Asp Thr Ser Ser Thr Ser Ser Ser Glu Ser Gln
740 745 750
Asp Asp Thr Asp Lys Glu Ser Lys Ser Ile Gln Asn Val Pro Arg Arg
755 760 765
Arg Asn Phe Val Lys Pro Met Thr Ala Val Lys Lys Lys Ser Thr Leu
770 775 780
Phe Ile Gln Met Glu Tyr Cys Glu Asn Arg Thr Leu Tyr Asp Leu Ile
785 790 795 800
His Ser Glu Asn Leu Asn Gln Gln Arg Asp Glu Tyr Trp Arg Leu Phe
805 810 815
Arg Gln Ile Leu Glu Ala Leu Ser Tyr Ile His Ser Gln Gly Ile Ile
820 825 830
His Arg Asp Leu Lys Pro Met Asn Ile Phe Ile Asp Glu Ser Arg Asn
835 840 845
Val Lys Ile Gly Asp Phe Gly Leu Ala Lys Asn Val His Arg Ser Leu
850 855 860
Asp Ile Leu Lys Leu Asp Ser Gln Asn Leu Pro Gly Ser Ser Asp Asn
865 870 875 880
Leu Thr Ser Ala Ile Gly Thr Ala Met Tyr Val Ala Thr Glu Val Leu
885 890 895
Asp Gly Thr Gly His Tyr Asn Glu Lys Ile Asp Met Tyr Ser Leu Gly
900 905 910
Ile Ile Phe Phe Glu Met Ile Tyr Pro Phe Ser Thr Gly Met Glu Arg
915 920 925
Val Asn Ile Leu Lys Lys Leu Arg Ser Val Ser Ile Glu Phe Pro Pro
930 935 940
Asp Phe Asp Asp Asn Lys Met Lys Val Glu Lys Lys Ile Ile Arg Leu
945 950 955 960
Leu Ile Asp His Asp Pro Asn Lys Arg Pro Gly Ala Arg Thr Leu Leu
965 970 975
Asn Ser Gly Trp Leu Pro Val Lys His Gln Asp Glu Val Ile Lys Glu
980 985 990
Ala Leu Lys Ser Leu Ser Asn Pro Ser Ser Pro Trp Gln Gln Gln Val
995 1000 1005
Arg Glu Ser Leu Phe Asn Gln Ser Tyr Ser Leu Thr Asn Asp Ile
1010 1015 1020
Leu Phe Asp Asn Ser Val Pro Thr Ser Thr Pro Phe Ala Asn Ile
1025 1030 1035
Leu Arg Ser Gln Met Thr Glu Glu Val Val Lys Ile Phe Arg Lys
1040 1045 1050
His Gly Gly Ile Glu Asn Asn Ala Pro Pro Arg Ile Phe Pro Lys
1055 1060 1065
Ala Pro Ile Tyr Gly Thr Gln Asn Val Tyr Glu Val Leu Asp Lys
1070 1075 1080
Gly Gly Thr Val Leu Gln Leu Gln Tyr Asp Leu Thr Tyr Pro Met
1085 1090 1095
Ala Arg Tyr Leu Ser Lys Asn Pro Ser Leu Ile Ser Lys Gln Tyr
1100 1105 1110
Arg Met Gln His Val Tyr Arg Pro Pro Asp His Ser Arg Ser Ser
1115 1120 1125
Leu Glu Pro Arg Lys Phe Gly Glu Ile Asp Phe Asp Ile Ile Ser
1130 1135 1140
Lys Ser Ser Ser Glu Ser Gly Phe Tyr Asp Ala Glu Ser Leu Lys
1145 1150 1155
Ile Ile Asp Glu Ile Leu Thr Val Phe Pro Val Phe Glu Lys Thr
1160 1165 1170
Asn Thr Phe Phe Ile Leu Asn His Ala Asp Ile Leu Glu Ser Val
1175 1180 1185
Phe Asn Phe Thr Asn Ile Asp Lys Ala Gln Arg Pro Leu Val Ser
1190 1195 1200
Arg Met Leu Ser Gln Val Gly Phe Ala Arg Ser Phe Lys Glu Val
1205 1210 1215
Lys Asn Glu Leu Lys Ala Gln Leu Asn Ile Ser Ser Thr Ala Leu
1220 1225 1230
Asn Asp Leu Glu Leu Phe Asp Phe Arg Leu Asp Phe Glu Ala Ala
1235 1240 1245
Lys Lys Arg Leu Tyr Lys Leu Met Ile Asp Ser Pro His Leu Lys
1250 1255 1260
Lys Ile Glu Asp Ser Leu Ser His Ile Ser Lys Val Leu Ser Tyr
1265 1270 1275
Leu Lys Pro Leu Glu Val Ala Arg Asn Val Val Ile Ser Pro Leu
1280 1285 1290
Ser Asn Tyr Asn Ser Ala Phe Tyr Lys Gly Gly Ile Met Phe His
1295 1300 1305
Ala Val Tyr Asp Asp Gly Ser Ser Arg Asn Met Ile Ala Ala Gly
1310 1315 1320
Gly Arg Tyr Asp Thr Leu Ile Ser Phe Phe Ala Arg Pro Ser Gly
1325 1330 1335
Lys Lys Ser Ser Asn Thr Arg Lys Ala Val Gly Phe Asn Leu Ala
1340 1345 1350
Trp Glu Thr Ile Phe Gly Ile Ala Gln Asn Tyr Phe Lys Leu Ala
1355 1360 1365
Ser Gly Asn Arg Ile Lys Lys Arg Asn Arg Phe Leu Lys Asp Thr
1370 1375 1380
Ala Val Asp Trp Lys Pro Ser Arg Cys Asp Val Leu Ile Ser Ser
1385 1390 1395
Phe Ser Asn Ser Leu Leu Asp Thr Ile Gly Val Thr Ile Leu Asn
1400 1405 1410
Thr Leu Trp Lys Gln Asn Ile Lys Ala Asp Met Leu Arg Asp Cys
1415 1420 1425
Ser Ser Val Asp Asp Val Val Thr Gly Ala Gln Gln Asp Gly Ile
1430 1435 1440
Asp Trp Ile Leu Leu Ile Lys Gln Gln Ala Tyr Pro Leu Thr Asn
1445 1450 1455
His Lys Arg Lys Tyr Lys Pro Leu Lys Ile Lys Lys Leu Ser Thr
1460 1465 1470
Asn Val Asp Ile Asp Leu Asp Leu Asp Glu Phe Leu Thr Leu Tyr
1475 1480 1485
Gln Gln Glu Thr Gly Asn Lys Ser Leu Ile Asn Asp Ser Leu Thr
1490 1495 1500
Leu Gly Asp Lys Ala Asp Glu Phe Lys Arg Trp Asp Glu Asn Ser
1505 1510 1515
Ser Ala Gly Ser Ser Gln Glu Gly Asp Ile Asp Asp Val Val Ala
1520 1525 1530
Gly Ser Thr Asn Asn Gln Lys Val Ile Tyr Val Pro Asn Met Ala
1535 1540 1545
Thr Arg Ser Lys Lys Ala Asn Lys Arg Glu Lys Trp Val Tyr Glu
1550 1555 1560
Asp Ala Ala Arg Asn Ser Ser Asn Met Ile Leu His Asn Leu Ser
1565 1570 1575
Asn Ala Pro Ile Ile Thr Val Asp Ala Leu Arg Asp Glu Thr Leu
1580 1585 1590
Glu Ile Ile Ser Ile Thr Ser Leu Ala Gln Lys Glu Glu Trp Leu
1595 1600 1605
Arg Lys Val Phe Gly Ser Gly Asn Asn Ser Thr Pro Arg Ser Phe
1610 1615 1620
Ala Thr Ser Ile Tyr Asn Asn Leu Ser Lys Glu Ala His Lys Gly
1625 1630 1635
Asn Arg Trp Ala Ile Leu Tyr Cys His Lys Thr Gly Lys Ser Ser
1640 1645 1650
Val Ile Asp Leu Gln Arg
1655
<210> 53
<211> 918
<212> DNA
<213> Saccharomyces cerevisiae
<400> 53
atgtcggagt ttaatattac agaaacttat ctaaggtttt tagaagaaga tactgagatg 60
acaatgccga ttgctgccat tgaagcattg gtcacgctat taagaataaa aacaccagaa 120
acagcggcag aaatgattaa tacaataaaa agctccacgg aagaacttat taaatccatt 180
ccgaactcag tttccctgag agccggttgt gatattttca tgagatttgt cttaagaaat 240
cttcatttat acggtgattg ggaaaactgt aaacaacatt tgattgaaaa tggccagctt 300
tttgtatcga gagccaaaaa atcgcgtaac aagattgcag aaataggggt ggatttcata 360
gctgatgatg atatcatctt ggtacatggt tattcgagag cagtattttc tttattaaat 420
catgcagcaa ataagtttat taggttcaga tgtgtggtga cagaatcaag acctagcaaa 480
caagggaacc agctatatac tttacttgaa caaaagggca tacccgtgac tcttattgtc 540
gatagcgcgg ttggagcggt aatcgataag gttgacaaag tgttcgttgg tgctgagggt 600
gttgctgaat caggtggtat tataaatctc gtgggtacct attcagtggg tgttttagca 660
cataatgcaa gaaaaccatt ctatgtggtc actgaaagtc acaaatttgt tcgtatgttt 720
ccattgtctt cagatgatct acctatggcc ggccctcctt tggatttcac acgtcgtacg 780
gacgatctag aagatgcatt gcgtgggccc acgatcgact ataccgccca agaatacatt 840
actgcattga ttacagattt aggggtcctc actccaagtg ccgtttcaga agagttaatc 900
aagatgtggt atgattaa 918
<210> 54
<211> 305
<212> PRT
<213> Saccharomyces cerevisiae
<400> 54
Met Ser Glu Phe Asn Ile Thr Glu Thr Tyr Leu Arg Phe Leu Glu Glu
1 5 10 15
Asp Thr Glu Met Thr Met Pro Ile Ala Ala Ile Glu Ala Leu Val Thr
20 25 30
Leu Leu Arg Ile Lys Thr Pro Glu Thr Ala Ala Glu Met Ile Asn Thr
35 40 45
Ile Lys Ser Ser Thr Glu Glu Leu Ile Lys Ser Ile Pro Asn Ser Val
50 55 60
Ser Leu Arg Ala Gly Cys Asp Ile Phe Met Arg Phe Val Leu Arg Asn
65 70 75 80
Leu His Leu Tyr Gly Asp Trp Glu Asn Cys Lys Gln His Leu Ile Glu
85 90 95
Asn Gly Gln Leu Phe Val Ser Arg Ala Lys Lys Ser Arg Asn Lys Ile
100 105 110
Ala Glu Ile Gly Val Asp Phe Ile Ala Asp Asp Asp Ile Ile Leu Val
115 120 125
His Gly Tyr Ser Arg Ala Val Phe Ser Leu Leu Asn His Ala Ala Asn
130 135 140
Lys Phe Ile Arg Phe Arg Cys Val Val Thr Glu Ser Arg Pro Ser Lys
145 150 155 160
Gln Gly Asn Gln Leu Tyr Thr Leu Leu Glu Gln Lys Gly Ile Pro Val
165 170 175
Thr Leu Ile Val Asp Ser Ala Val Gly Ala Val Ile Asp Lys Val Asp
180 185 190
Lys Val Phe Val Gly Ala Glu Gly Val Ala Glu Ser Gly Gly Ile Ile
195 200 205
Asn Leu Val Gly Thr Tyr Ser Val Gly Val Leu Ala His Asn Ala Arg
210 215 220
Lys Pro Phe Tyr Val Val Thr Glu Ser His Lys Phe Val Arg Met Phe
225 230 235 240
Pro Leu Ser Ser Asp Asp Leu Pro Met Ala Gly Pro Pro Leu Asp Phe
245 250 255
Thr Arg Arg Thr Asp Asp Leu Glu Asp Ala Leu Arg Gly Pro Thr Ile
260 265 270
Asp Tyr Thr Ala Gln Glu Tyr Ile Thr Ala Leu Ile Thr Asp Leu Gly
275 280 285
Val Leu Thr Pro Ser Ala Val Ser Glu Glu Leu Ile Lys Met Trp Tyr
290 295 300
Asp
305
<210> 55
<211> 846
<212> DNA
<213> Sacharomyces cerevisiae
<400> 55
atgtccgaat atcagccaag tttatttgct ttaaatccaa tgggtttctc accattggat 60
ggttctaaat caaccaacga aaatgtatct gcttccactt ctactgccaa accaatggtt 120
ggccaattga tttttgataa attcatcaag actgaagagg atccaattat caaacaggat 180
accccttcga accttgattt tgattttgct cttccacaaa cggcaactgc acctgatgcc 240
aagaccgttt tgccaattcc ggagctagat gacgctgtag tggaatcttt cttttcgtca 300
agcactgatt caactccaat gtttgagtat gaaaacctag aagacaactc taaagaatgg 360
acatccttgt ttgacaatga cattccagtt accactgacg atgtttcatt ggctgataag 420
gcaattgaat ccactgaaga agtttctctg gtaccatcca atctggaagt ctcgacaact 480
tcattcttac ccactcctgt tctagaagat gctaaactga ctcaaacaag aaaggttaag 540
aaaccaaatt cagtcgttaa gaagtcacat catgttggaa aggatgacga atcgagactg 600
gatcatctag gtgttgttgc ttacaaccgc aaacagcgtt cgattccact ttctccaatt 660
gtgcccgaat ccagtgatcc tgctgctcta aaacgtgcta gaaacactga agccgccagg 720
cgttctcgtg cgagaaagtt gcaaagaatg aaacaacttg aagacaaggt tgaagaattg 780
ctttcgaaaa attatcactt ggaaaatgag gttgccagat taaagaaatt agttggcgaa 840
cgctga 846
<210> 56
<211> 281
<212> PRT
<213> Saccharomyces cerevisiae
<400> 56
Met Ser Glu Tyr Gln Pro Ser Leu Phe Ala Leu Asn Pro Met Gly Phe
1 5 10 15
Ser Pro Leu Asp Gly Ser Lys Ser Thr Asn Glu Asn Val Ser Ala Ser
20 25 30
Thr Ser Thr Ala Lys Pro Met Val Gly Gln Leu Ile Phe Asp Lys Phe
35 40 45
Ile Lys Thr Glu Glu Asp Pro Ile Ile Lys Gln Asp Thr Pro Ser Asn
50 55 60
Leu Asp Phe Asp Phe Ala Leu Pro Gln Thr Ala Thr Ala Pro Asp Ala
65 70 75 80
Lys Thr Val Leu Pro Ile Pro Glu Leu Asp Asp Ala Val Val Glu Ser
85 90 95
Phe Phe Ser Ser Ser Thr Asp Ser Thr Pro Met Phe Glu Tyr Glu Asn
100 105 110
Leu Glu Asp Asn Ser Lys Glu Trp Thr Ser Leu Phe Asp Asn Asp Ile
115 120 125
Pro Val Thr Thr Asp Asp Val Ser Leu Ala Asp Lys Ala Ile Glu Ser
130 135 140
Thr Glu Glu Val Ser Leu Val Pro Ser Asn Leu Glu Val Ser Thr Thr
145 150 155 160
Ser Phe Leu Pro Thr Pro Val Leu Glu Asp Ala Lys Leu Thr Gln Thr
165 170 175
Arg Lys Val Lys Lys Pro Asn Ser Val Val Lys Lys Ser His His Val
180 185 190
Gly Lys Asp Asp Glu Ser Arg Leu Asp His Leu Gly Val Val Ala Tyr
195 200 205
Asn Arg Lys Gln Arg Ser Ile Pro Leu Ser Pro Ile Val Pro Glu Ser
210 215 220
Ser Asp Pro Ala Ala Leu Lys Arg Ala Arg Asn Thr Glu Ala Ala Arg
225 230 235 240
Arg Ser Arg Ala Arg Lys Leu Gln Arg Met Lys Gln Leu Glu Asp Lys
245 250 255
Val Glu Glu Leu Leu Ser Lys Asn Tyr His Leu Glu Asn Glu Val Ala
260 265 270
Arg Leu Lys Lys Leu Val Gly Glu Arg
275 280
<210> 57
<211> 1320
<212> DNA
<213> Saccharomyces cerevisiae
<400> 57
atggtcacaa aacatcagat tgaagaggat cacttggatg gagctacgac ggatcccgaa 60
gttaaacggg taaaattaga aaacaacgtt gaagaaatac aacctgagca ggctgagacc 120
aataaacaag agggcaccga taaagagaat aaaggaaagt tcgagaaaga aactgagaga 180
ataggaggat ctgaagtggt tacagatgtg gaaaaaggaa ttgtcaaatt tgaatttgat 240
ggtgttgaat acacattcaa agagagaccc agtgtcgtag aggaaaatga aggtaaaatt 300
gagtttaggg tggtgaataa tgataatact aaagaaaaca tgatggtcct aactggatta 360
aaaaacattt ttcaaaagca attaccaaaa atgcccaaag aatacattgc caggttagtc 420
tatgatcgaa gtcatctttc catggctgtc attaggaagc cattgactgt cgtaggtggc 480
ataacatatc gacctttcga taagagagaa ttcgcagaaa ttgttttctg tgccatcagt 540
tcgacggaac aggtacgcgg ttatggtgcg catctaatga atcacttaaa agactatgtt 600
agaaatacct cgaacataaa atattttttg acatatgcag ataattacgc tattggatac 660
tttaaaaagc aaggcttcac taaagaaatc acgttggata aaagtatatg gatgggatat 720
attaaagatt atgaaggtgg tacgctgatg caatgttcta tgttaccaag aatacgatat 780
ttggacgcag gtaagattct attattacaa gaagcggccc tgcgaagaaa aataagaacg 840
atttcgaaat cgcatattgt aaggcctggt ttagagcaat tcaaagactt aaacaatatc 900
aaaccgattg atccaatgac tattcctggc ttgaaagaag ccggctggac tcccgagatg 960
gatgcgttgg cacaacgtcc caagcgtggt ccacacgatg cagcaataca gaatatactc 1020
acagagctac aaaatcatgc agcagcttgg cccttcttac aacccgttaa taaagaggag 1080
gtccccgact attatgattt tatcaaagag ccaatggact tgagcaccat ggaaataaaa 1140
ttagagagca acaaatatca gaagatggaa gacttcatat atgatgccag attggtgttt 1200
aacaattgcc gaatgtacaa tggcgagaat acgtcgtatt acaagtatgc taataggcta 1260
gagaaattct tcaataataa agtaaaagaa atacctgaat attctcacct tattgattaa 1320
<210> 58
<211> 439
<212> PRT
<213> Saccharomyces cerevisiae
<400> 58
Met Val Thr Lys His Gln Ile Glu Glu Asp His Leu Asp Gly Ala Thr
1 5 10 15
Thr Asp Pro Glu Val Lys Arg Val Lys Leu Glu Asn Asn Val Glu Glu
20 25 30
Ile Gln Pro Glu Gln Ala Glu Thr Asn Lys Gln Glu Gly Thr Asp Lys
35 40 45
Glu Asn Lys Gly Lys Phe Glu Lys Glu Thr Glu Arg Ile Gly Gly Ser
50 55 60
Glu Val Val Thr Asp Val Glu Lys Gly Ile Val Lys Phe Glu Phe Asp
65 70 75 80
Gly Val Glu Tyr Thr Phe Lys Glu Arg Pro Ser Val Val Glu Glu Asn
85 90 95
Glu Gly Lys Ile Glu Phe Arg Val Val Asn Asn Asp Asn Thr Lys Glu
100 105 110
Asn Met Met Val Leu Thr Gly Leu Lys Asn Ile Phe Gln Lys Gln Leu
115 120 125
Pro Lys Met Pro Lys Glu Tyr Ile Ala Arg Leu Val Tyr Asp Arg Ser
130 135 140
His Leu Ser Met Ala Val Ile Arg Lys Pro Leu Thr Val Val Gly Gly
145 150 155 160
Ile Thr Tyr Arg Pro Phe Asp Lys Arg Glu Phe Ala Glu Ile Val Phe
165 170 175
Cys Ala Ile Ser Ser Thr Glu Gln Val Arg Gly Tyr Gly Ala His Leu
180 185 190
Met Asn His Leu Lys Asp Tyr Val Arg Asn Thr Ser Asn Ile Lys Tyr
195 200 205
Phe Leu Thr Tyr Ala Asp Asn Tyr Ala Ile Gly Tyr Phe Lys Lys Gln
210 215 220
Gly Phe Thr Lys Glu Ile Thr Leu Asp Lys Ser Ile Trp Met Gly Tyr
225 230 235 240
Ile Lys Asp Tyr Glu Gly Gly Thr Leu Met Gln Cys Ser Met Leu Pro
245 250 255
Arg Ile Arg Tyr Leu Asp Ala Gly Lys Ile Leu Leu Leu Gln Glu Ala
260 265 270
Ala Leu Arg Arg Lys Ile Arg Thr Ile Ser Lys Ser His Ile Val Arg
275 280 285
Pro Gly Leu Glu Gln Phe Lys Asp Leu Asn Asn Ile Lys Pro Ile Asp
290 295 300
Pro Met Thr Ile Pro Gly Leu Lys Glu Ala Gly Trp Thr Pro Glu Met
305 310 315 320
Asp Ala Leu Ala Gln Arg Pro Lys Arg Gly Pro His Asp Ala Ala Ile
325 330 335
Gln Asn Ile Leu Thr Glu Leu Gln Asn His Ala Ala Ala Trp Pro Phe
340 345 350
Leu Gln Pro Val Asn Lys Glu Glu Val Pro Asp Tyr Tyr Asp Phe Ile
355 360 365
Lys Glu Pro Met Asp Leu Ser Thr Met Glu Ile Lys Leu Glu Ser Asn
370 375 380
Lys Tyr Gln Lys Met Glu Asp Phe Ile Tyr Asp Ala Arg Leu Val Phe
385 390 395 400
Asn Asn Cys Arg Met Tyr Asn Gly Glu Asn Thr Ser Tyr Tyr Lys Tyr
405 410 415
Ala Asn Arg Leu Glu Lys Phe Phe Asn Asn Lys Val Lys Glu Ile Pro
420 425 430
Glu Tyr Ser His Leu Ile Asp
435
<210> 59
<211> 2259
<212> DNA
<213> Saccharomyces cerevisiae
<400> 59
atggcaagca tcggttcgca agtgagaaaa gctgcttcta gtattgaccc tatcgtcacg 60
gattacgcag tgggctactt taaccacttg tccggaataa cttttgatgc tgttcaaagt 120
aagcaggtag atttgtccac tgaagtgcaa tttgtgtccg atttattgat tgatgcgggt 180
gcgtcaaagg ctaaagttaa agaactatcg gaaagtattt tgaagcaatt gactactcaa 240
ctaaaggaga acgaagccaa attggaattg accggtgata cgtccaagag attacttgat 300
attaatgtct taaagagtca taacagtaaa tccgatatca acgtctcatt aagcatgctg 360
ggtgtgaacg gtgacatcga acatactggt agaaagatgg aaacaagagt tgatttgaaa 420
aaactggcca aggctgaaca aaagatcgca aagaaagtcg ccaagagaaa taacaaattt 480
gttaaatacg aggcttctaa attgatcaat gaccaaaagg aggaggatta cgattctttc 540
tttttgcaaa tcaacccttt agaattcggt tcatccgctg gtaaatccaa ggatatccat 600
attgacactt tcgacttgta cgttggtgac ggtcaaagaa ttttgtccaa cgcccaattg 660
actctaagtt ttggtcacag atatggtctt gtgggccaaa atggtattgg taaatctact 720
ttgttaaggg ctctatctag aagagagctg aacgtcccca aacatgtttc gattttacac 780
gtggaacaag agttaagagg tgatgataca aaggctttac aaagtgtgct ggatgcagac 840
gtttggagaa aacaactatt aagtgaagaa gccaagatca atgaaagatt aaaggaaatg 900
gatgtattaa gacaggaatt cgaagaagac agtttagaag ttaaaaaatt ggacaatgaa 960
agagaagact tggataacca tttgatacag atttctgaca aattagtcga tatggaatct 1020
gacaaggctg aagctagggc agcatcaatc ttatatggtt tggggttcag tacggaggca 1080
cagcaacaac ccactaattc cttttccggt ggttggagaa tgagattgtc cttggcaaga 1140
gccttattct gtcaaccaga tcttttgttg ttagatgaac cttccaatat gttggatgtg 1200
ccatccatcg cttatttagc agagtatttg aaaacatatc caaatacagt tttgacagtt 1260
tctcacgacc gtgcattctt gaatgaagtg gctacagata tcatttatca acacaacgaa 1320
agactagact attacagagg ccaagatttc gatacctttt acaccacaaa ggaggaacgt 1380
agaaagaatg ctcaacgtga gtatgataac caaatggttt acagaaagca cttgcaagag 1440
tttattgaca aatacagata caatgctgcc aaatcacagg aagctcaatc aagaattaag 1500
aaattggaaa aattgcccgt tttggagcca cctgaacaag acaaaaccat tgatttcaaa 1560
ttccctgaat gtgataaatt gtctccacca attatccaat tgcaagacgt ttcctttggt 1620
tatgatgaaa acaacctatt attgaaagat gttaacctgg acgttcaaat ggattccaga 1680
attgcccttg taggtgccaa tggttgtggt aagactacac tgttgaagat tatgatggag 1740
cagttaagac cactaaaagg ctttgtatca agaaacccaa gattacgtat aggctacttc 1800
actcaacatc atgtggattc tatggatttg accacgtctg cagtggactg gatgtccaaa 1860
tccttcccag gtaaaactga tgaagagtat agacgtcatc taggttcatt tggtatcact 1920
ggtaccctgg gtctacaaaa gatgcaatta ttatccggtg gtcaaaaatc tcgtgtagca 1980
ttcgctgcat tgtgtttaaa taatccacac attttggttc tggatgaacc ttctaaccat 2040
ttggatacca ctggtctaga cgctttggta gaagccttga aaaatttcaa cggtggtgtc 2100
ttaatggttt cccatgatat ctctgttatt gactctgttt gtaaagagat ttgggtttca 2160
gagcaaggta ctgtcaagag gttcgaaggt acaatttacg actatagaga ttacatcttg 2220
cagtctgctg atgctgcagg tgtggttaaa aagcattga 2259
<210> 60
<211> 752
<212> PRT
<213> Saccharomyces cerevisiae
<400> 60
Met Ala Ser Ile Gly Ser Gln Val Arg Lys Ala Ala Ser Ser Ile Asp
1 5 10 15
Pro Ile Val Thr Asp Tyr Ala Val Gly Tyr Phe Asn His Leu Ser Gly
20 25 30
Ile Thr Phe Asp Ala Val Gln Ser Lys Gln Val Asp Leu Ser Thr Glu
35 40 45
Val Gln Phe Val Ser Asp Leu Leu Ile Asp Ala Gly Ala Ser Lys Ala
50 55 60
Lys Val Lys Glu Leu Ser Glu Ser Ile Leu Lys Gln Leu Thr Thr Gln
65 70 75 80
Leu Lys Glu Asn Glu Ala Lys Leu Glu Leu Thr Gly Asp Thr Ser Lys
85 90 95
Arg Leu Leu Asp Ile Asn Val Leu Lys Ser His Asn Ser Lys Ser Asp
100 105 110
Ile Asn Val Ser Leu Ser Met Leu Gly Val Asn Gly Asp Ile Glu His
115 120 125
Thr Gly Arg Lys Met Glu Thr Arg Val Asp Leu Lys Lys Leu Ala Lys
130 135 140
Ala Glu Gln Lys Ile Ala Lys Lys Val Ala Lys Arg Asn Asn Lys Phe
145 150 155 160
Val Lys Tyr Glu Ala Ser Lys Leu Ile Asn Asp Gln Lys Glu Glu Asp
165 170 175
Tyr Asp Ser Phe Phe Leu Gln Ile Asn Pro Leu Glu Phe Gly Ser Ser
180 185 190
Ala Gly Lys Ser Lys Asp Ile His Ile Asp Thr Phe Asp Leu Tyr Val
195 200 205
Gly Asp Gly Gln Arg Ile Leu Ser Asn Ala Gln Leu Thr Leu Ser Phe
210 215 220
Gly His Arg Tyr Gly Leu Val Gly Gln Asn Gly Ile Gly Lys Ser Thr
225 230 235 240
Leu Leu Arg Ala Leu Ser Arg Arg Glu Leu Asn Val Pro Lys His Val
245 250 255
Ser Ile Leu His Val Glu Gln Glu Leu Arg Gly Asp Asp Thr Lys Ala
260 265 270
Leu Gln Ser Val Leu Asp Ala Asp Val Trp Arg Lys Gln Leu Leu Ser
275 280 285
Glu Glu Ala Lys Ile Asn Glu Arg Leu Lys Glu Met Asp Val Leu Arg
290 295 300
Gln Glu Phe Glu Glu Asp Ser Leu Glu Val Lys Lys Leu Asp Asn Glu
305 310 315 320
Arg Glu Asp Leu Asp Asn His Leu Ile Gln Ile Ser Asp Lys Leu Val
325 330 335
Asp Met Glu Ser Asp Lys Ala Glu Ala Arg Ala Ala Ser Ile Leu Tyr
340 345 350
Gly Leu Gly Phe Ser Thr Glu Ala Gln Gln Gln Pro Thr Asn Ser Phe
355 360 365
Ser Gly Gly Trp Arg Met Arg Leu Ser Leu Ala Arg Ala Leu Phe Cys
370 375 380
Gln Pro Asp Leu Leu Leu Leu Asp Glu Pro Ser Asn Met Leu Asp Val
385 390 395 400
Pro Ser Ile Ala Tyr Leu Ala Glu Tyr Leu Lys Thr Tyr Pro Asn Thr
405 410 415
Val Leu Thr Val Ser His Asp Arg Ala Phe Leu Asn Glu Val Ala Thr
420 425 430
Asp Ile Ile Tyr Gln His Asn Glu Arg Leu Asp Tyr Tyr Arg Gly Gln
435 440 445
Asp Phe Asp Thr Phe Tyr Thr Thr Lys Glu Glu Arg Arg Lys Asn Ala
450 455 460
Gln Arg Glu Tyr Asp Asn Gln Met Val Tyr Arg Lys His Leu Gln Glu
465 470 475 480
Phe Ile Asp Lys Tyr Arg Tyr Asn Ala Ala Lys Ser Gln Glu Ala Gln
485 490 495
Ser Arg Ile Lys Lys Leu Glu Lys Leu Pro Val Leu Glu Pro Pro Glu
500 505 510
Gln Asp Lys Thr Ile Asp Phe Lys Phe Pro Glu Cys Asp Lys Leu Ser
515 520 525
Pro Pro Ile Ile Gln Leu Gln Asp Val Ser Phe Gly Tyr Asp Glu Asn
530 535 540
Asn Leu Leu Leu Lys Asp Val Asn Leu Asp Val Gln Met Asp Ser Arg
545 550 555 560
Ile Ala Leu Val Gly Ala Asn Gly Cys Gly Lys Thr Thr Leu Leu Lys
565 570 575
Ile Met Met Glu Gln Leu Arg Pro Leu Lys Gly Phe Val Ser Arg Asn
580 585 590
Pro Arg Leu Arg Ile Gly Tyr Phe Thr Gln His His Val Asp Ser Met
595 600 605
Asp Leu Thr Thr Ser Ala Val Asp Trp Met Ser Lys Ser Phe Pro Gly
610 615 620
Lys Thr Asp Glu Glu Tyr Arg Arg His Leu Gly Ser Phe Gly Ile Thr
625 630 635 640
Gly Thr Leu Gly Leu Gln Lys Met Gln Leu Leu Ser Gly Gly Gln Lys
645 650 655
Ser Arg Val Ala Phe Ala Ala Leu Cys Leu Asn Asn Pro His Ile Leu
660 665 670
Val Leu Asp Glu Pro Ser Asn His Leu Asp Thr Thr Gly Leu Asp Ala
675 680 685
Leu Val Glu Ala Leu Lys Asn Phe Asn Gly Gly Val Leu Met Val Ser
690 695 700
His Asp Ile Ser Val Ile Asp Ser Val Cys Lys Glu Ile Trp Val Ser
705 710 715 720
Glu Gln Gly Thr Val Lys Arg Phe Glu Gly Thr Ile Tyr Asp Tyr Arg
725 730 735
Asp Tyr Ile Leu Gln Ser Ala Asp Ala Ala Gly Val Val Lys Lys His
740 745 750
<210> 61
<211> 7575
<212> DNA
<213> Yarrowia lipolytica
<400> 61
atgatacgcg gtgtgatcag gctggatcgt gatctacttc cgtgtccatt atcacatcat 60
gtcatcgtct tctcatctgg atcaatgtca tccaccaaag accggctgga gttttggaag 120
gaacagcaaa tgctcctgtc ctctcccgac tcccttccgt ctatcctcag tgctcttttt 180
cagactattc cacactactc cgaccacgta tcgagggacg tggtagtcga cacgtggaaa 240
ctgctgctaa aggaacaccc tgccgccctt caaaaggttg tgcccgtgct cgccaagcag 300
tttgccatct acaaaaagtc ctccacaaac aacctcatgg tgctgctgga gtggaccaac 360
tactttgtgt ccttctccct gaccaacgcc gggtccgagc tcaacgactt tgtcttcaag 420
gacctcattt ccatgcaggc cgagctcgtg gacctgtgct cagcatgcaa ccgggagcga 480
atggccaaga gcgctctgag gcagacccga gccgcgtttg cagcctgcat cacagctaac 540
ggagctctga ccaaactgct gaacgtatgc cttccaggca cccccacgtc tacggctctg 600
ctgggctgtc tagcatctgc atgcgctgaa aatgctcctc aaacttttga gcagctggat 660
ctttcagcct actcgcagtt ttacggcgcc aacgtgcttg gcgccaaggt tctgccctgc 720
aaaaacgcca ccaaacagtt ttgcacggga tactttggca acctgtctcg tgaccaaaag 780
tccaaggtcg cggctgatat ctttgatgcc accaagaagt cgattctgag gtctcccgag 840
tctgttctcg agtacgcaat tcccctgttg ctagagagtc tcgataaaga cgatgagtca 900
gcaaagaagc tggttgacgg catttccgct tccctggtca catgtctcaa gtcttccaat 960
cagctcactc gagatggagc tgtcacatgc atcggagtgg cctgtgctat ctctcacgag 1020
accctctact ccgagttggc caagactgtg tctaaggtga ctgtgttgga gcaaaaagtg 1080
gcctatggaa acgctattgc tggctgtcac gtgaccgatc cttctctgtc tgccgccctt 1140
gctcctgtgg ttaccaagga gaagaacgag attgccctga ctgctctgtc gcgtgccttt 1200
ttggtccact tttcccctga tcaggctaag actctctctt ctggactgtc tgactccaac 1260
gctggcgtcg tcaagacctg ggttctacag ctggtcaact tcccccaaca cgctgagcac 1320
gtgacaggtg agctggagaa gattctcgct tcttccacca tcgtcaaggg tgcgatttct 1380
ggtcttggag ctgtttacct gctcaccaag gctggaaaag ctgtaaaatc tgacaaggct 1440
ctggaactgg ctctatctcc tcgagtgtac accaaactca gtgcaggcga atttgtcact 1500
ggtttcaagg ctctggagtc gctgttcaag gaggttaacc ctgacaatgc ccccgacttt 1560
ggtaagacca tcttcttcta tgcttatggc gactccgagg tcaaggtgga cgttgactgc 1620
tctagattgg ttggtcccgc tctgaggagc aattactcgg atggtctggc tggggctgtc 1680
atttctggaa tttctgacac ccacgtcagc gagagaaagt actccaagtt gctttactcg 1740
ctgtttagtg ccgagaacaa ctgcgacaag gctcttgtcg atgggctaga ggtactgtgt 1800
ggcgtcggac tgtggattga gtccgttctg ggagcatctc gagatccccg aaagttgttg 1860
ttggacaatg agaagcatgt caagtcgatt ctgtcttcgg ctacctcctc caacctctat 1920
cctaccatcg ctacagtctg tttcattgct cctgacgtct ttgctggtga ggttgccgag 1980
cagttcactg tttcgaacct ctcctgtgtc accactgagg ccgtgaccat cttcaacact 2040
cccgctgacg aactggcttt cgatatcaag cgaacggagc gtgtggctca caaaaactcc 2100
aaggaatacc aggacaagct gtgggaagaa aacctcaaga aggagctcca aaagaagaag 2160
ggtgttgtcg aaaagccaaa gtacaccaag gaggaacaaa tcaaggtaga cgaacagatg 2220
aagaaggagg cagaaattag aacggaggtc accgcagtcg cagatcacgt gacccggctc 2280
atgggcatca tttccgccct ctccaaggag gccatgacgg ttgataacgg caaagaaacg 2340
tggtttggac cggccatgac gctcatgctc gagctcctca gacaccccaa cgtggatgtg 2400
ctttgttcca gtcacgtgac caagactctc acggacatgt cttggatcac caacgacaag 2460
ctgggttcca ttagaccctt cctggccgtc tgcctgctca gaatgtatgg taatcacgtg 2520
agcgaggacc tccagaagga gtcacgtgac tctctcatca cgcgggtgct gtacaagatt 2580
cattctgtgg ccatgtcttc tcctcttgac gctatttctc tgattttcgt gcttcccatt 2640
gtcttgtttg tgctcaagaa ccagtctcgt gacaaggacg tggctgagga gcaaacgcat 2700
cttgccattg agattgtcac ttgtcacacc tctgcttttg ccgacgtgat tactcctcga 2760
tctgaaatca tgagcgccct cattcagctc atgaagagca ctcccaccaa ggccaagctt 2820
gctcgtgagt gtctgtactc tgtggttgag cacgtggctc tgacaattac gaaacccgaa 2880
gagcacgtgt tgctgagtaa cctgttcact ggagacactg gtgttcgtca tgctattctg 2940
gaggctgttg acgctcatct cactcttgat gactcctctc ctgaactcta cgtgacctgt 3000
ttcgatgtgg acgacgtgaa ccgagaactt gccgagcaga tttactccga gaacaagctc 3060
tgcaagccct cttcttctgt tcttctcccc ttcctggctg ctgagtcgtc ttctctgcgc 3120
ctgtcttcgg cacgtgccta tgctgccact gccgaagctg actcctacaa ccagctcatg 3180
gcctacatta tcgaggcttc tgtgcccatt cctcctaccc tggaccagta cggaaagccc 3240
aagaagggcg agtctgcacg tgaccagtgg gaagctcgat gcggagctgg tctagctgtt 3300
cacgagatgg cacctggcat gtctcccgag catgtgattt cgttcattga gttccttgtc 3360
gaaaccggct actctgatgt caactctgac gtccgacagg agttcaatga tgccggtctg 3420
gctcttgttg atcagcatgg cctcaagaac gttgaggagc tgatgaagat cattcagaac 3480
cgactcaaca aggcgtctaa cggctccgag agcgatgacc acgtgatttc gtcttgtgtt 3540
gttctgtatg gtgctctggc ccgccacctg gaatcttcag attcccgtct gcctgtcatc 3600
tacgaccgaa tgttggttgc tctagatact ccttctgagt ctgtgcagtt ccgagtctcc 3660
gaatgtcttt ctggactggt cagcaagatg gacaagaagg ctagagatgg ctacttggac 3720
cagctcaccg agaagcttct ttctgactct tctctcgcca ttcgacgagg agcagcatat 3780
ggtattgctg gtctcgttag aggaggcgga attgcttcca ttggagagac tgatctcatg 3840
cgaaccctga cagatgctat ggagaacaag aagtcgtctg ccgcccgtca gagtgcccag 3900
tttgtggtcg agactctgtc gatggcactc cagcgacact ttgagcccta tgccctgcag 3960
ctcatgcctc tggtgcttgc tgctcttggt gatcccgttt tcgaggtccg agaagctacc 4020
aacgatgctt ctcgtcaggt tatgaagcac accactgcct acggagtgac caaactcatt 4080
cccatggcca ttgaaaacct caacctcact gcttggcgat ctaagagagg agctgtggaa 4140
ttgctcggta acatggccta cctgtccccc catgaactgt ccaccaacct gtcgctaatt 4200
gtccccgaga ttgtggcggt gctcaacgat acgcacaagg aggtgcgggc cgcggctaac 4260
agctctctca accggtttgg tcacgtgatt tccaaccccg agattcaggc tcttgttccc 4320
aagctcattg gtgccattgc cgagcctgag aagaccgagg ttgctctgga cggtctgctc 4380
aagacccagt ttgtgcatta cattgacgct ccctccctcg ctctcattag tcacgtgctc 4440
cagcgtggtc ttggagaccg atccgccgca gtcaagaaga aggcttgtca gattgttggc 4500
aacatggcca ttttgacttc ggctcaggac attgcacctt acttgcccga gctgactgtt 4560
tccctggaga ccgccatggt cgatcccgta cctggcactc gtgctactgc tgcccgggct 4620
ctgggttctc ttgtcgagaa gctgggcgag cctgcgttcc ctgatctggt ccctcgactt 4680
ctttccactc tcagagacga gtctcgagct ggagaccacc ttggtgctgc ccagggtctg 4740
tctgaggttg tgtgcggtct gggtcttcga aagctggaag aaattctgcc tcaggtgatc 4800
aaatcctgcg cttcccccaa gaatcacatt cgagctgctt tcatgccgct gatgatcttc 4860
ctgcctgcca cctttggcaa ctcgctgacc ccttacctgt cccagatcat tcctgtgatt 4920
ctttctggac ttgccgatga tgttgattcc gtcagagacg cttccctcaa ggctggtcgg 4980
ctcctggtgt ccaacttctc cagcaagtct gttgacctgc tgttgcccga gcttctcgtc 5040
ggcatgtctg actccaacca ccgaattcga cttgcctcgg ttgaactcat gggagaccta 5100
ctcttccagc tcactggtct caccaagaac gagcttgatg agtctgatga tgtcaacgca 5160
ggccaggccc tgctctcgtt gctgggacaa cagactcgag acactgttct ggccaacttg 5220
tttgtttgtc gagcagatac ctctggacag gtgcgacttg cgtcgatcga aatctggaaa 5280
gcgctggtgg ccaacacccc tcgaactgtc aaggagattc ttcccgagct caccaaccag 5340
gtggttaccc ggctggcttc tcgggaccac gagcagcgag aaatcgccgc ctccaccctc 5400
ggagaactcg tccgacgagt ctcggactcc ctgcagcagc ttctccctac tctgcagacc 5460
aacctcgaca actccgactc tgaccagaaa cagggtatct gcattgctct caaggagctc 5520
atcgtctcct cctctagaga ccagctggac gcccataaga cgaccgttgt tcacattctg 5580
cacgagactc tgaccgactc gtcacgcgat gtgcgttccg ctgccgcctc tgcgttcgat 5640
gcctacaacg agattatggg aaactcggct gtcgacgaca ttctccccaa gctgctgttg 5700
ctgctcaagg agcgtcccga ggctgctctg gcggctctca aggacatcat gcaatcgcga 5760
gccaactcga ttttccccgt tgtgctgccc aagctgctgt ctcagcctat ttccgtcttc 5820
aacgccgagg ccctcgcttc tctggctcct gttgctggcc agaccctgct gcgacgactt 5880
ccccaggtgg ttggcaacct tgtgtccgcc attatcagcg cgcgtgatca gaaggacgac 5940
gaacgagcgt ctgctttgtt tgactctctt gtctccattt tcctgtcggt gtctgacgaa 6000
ggaatccatt cactcatgca gcagctcaag tccatggcca aggacgagga ctcggccgtg 6060
cgaacactgc tgttcgagac cctcacaccc tttttcaagg acacccagtt ggatctttct 6120
gcttactaca ttgactgggc tgagctgtgt atctatggtc ttgacgacga gtctgtttct 6180
tctgctgcca agagcgctct ggagactctg gtcaagaatc tgtccaagga ggagttggaa 6240
accctctcca agcctgctta ttccgctctc gccaacacct ccatccccct ggccggtatc 6300
aatgtgccca agggacccgc ctgtattctc cccatcttcg tgcagggtct catgtacggt 6360
acttcggacc agcgagaggc ctctgccaac ggtatgggat gcattgtaga gcgagttgac 6420
gcgtcgctgc tcaagttgca cgttacccag atcacaggtc ccctcattcg aaccattgga 6480
gaacggttcc cggcctctgt caaggtggct atcgttacaa ctctcaacct gctcctcaag 6540
aactgctctg ctttcctcaa gcctttcctg ccccagcttc agagaacctt tgccaagtgt 6600
ctcagtgata ccggctctga gcgactgcga aacgaggctg ccgaggccct gggtaccctg 6660
attaccctgc agtcccgagt ggatcctctg gtcagcgagc tcgttaccgg agtcaaaaac 6720
tccaccgacg agggcgtcac caacgcaatg ttcaaggctc tgcagggcgt cgtgtccaag 6780
gccggcggcc agatgagcca acagtcacgg gatctcgttt ttaacctcgc cgatgaggtc 6840
acgggactcg acaagcatgt gttggccaag atgcttggag gtctagctaa ggtcggagac 6900
gcttctgtgg tctatgaggt gtcccagaag gtcaacaaca gcgagtttgg cgcctatgtg 6960
ctgaatgagc tgcttgtggc ccaggctggc gatgaacgtg tgtctacacg tgacctcccc 7020
gatgattcgc ctgattacgt cacttctacg ctcgagttga tgaagtccga gacacctgca 7080
gtttccgatg ctgccactct agcctgtgga aagctgctgc tggctttcgg tggcctgccg 7140
tttgagatca caaagattct gttgactcag ctggctcaga acatcactgc accggcctct 7200
tcgtcttccg acactcgacg tctggcactg gtggtgcttc gtactgttgc tagacagcag 7260
catgcgctta ccaagcccca cgtgactctt cttgctactt ccacgtttgc gtgtgtgcga 7320
gaaatggtca ttcctatcaa gcttgctgct gagaaggcgt ggttggctct gttcgacctg 7380
gttactggtt ccacagagtt tgacaagtgg tttggagagg tgcagtcgga gctgcccaac 7440
aacggacggt ctattggcga ctacactaag cgtgttgcca tgagactggc ccaggctgag 7500
cgagagcgac tggaggaggg aggagacgac atggagagtg ataagcggga ggacgaggcg 7560
gagatttggg agtag 7575
<210> 62
<211> 2524
<212> PRT
<213> Yarrowia lipolytica
<400> 62
Met Ile Arg Gly Val Ile Arg Leu Asp Arg Asp Leu Leu Pro Cys Pro
1 5 10 15
Leu Ser His His Val Ile Val Phe Ser Ser Gly Ser Met Ser Ser Thr
20 25 30
Lys Asp Arg Leu Glu Phe Trp Lys Glu Gln Gln Met Leu Leu Ser Ser
35 40 45
Pro Asp Ser Leu Pro Ser Ile Leu Ser Ala Leu Phe Gln Thr Ile Pro
50 55 60
His Tyr Ser Asp His Val Ser Arg Asp Val Val Val Asp Thr Trp Lys
65 70 75 80
Leu Leu Leu Lys Glu His Pro Ala Ala Leu Gln Lys Val Val Pro Val
85 90 95
Leu Ala Lys Gln Phe Ala Ile Tyr Lys Lys Ser Ser Thr Asn Asn Leu
100 105 110
Met Val Leu Leu Glu Trp Thr Asn Tyr Phe Val Ser Phe Ser Leu Thr
115 120 125
Asn Ala Gly Ser Glu Leu Asn Asp Phe Val Phe Lys Asp Leu Ile Ser
130 135 140
Met Gln Ala Glu Leu Val Asp Leu Cys Ser Ala Cys Asn Arg Glu Arg
145 150 155 160
Met Ala Lys Ser Ala Leu Arg Gln Thr Arg Ala Ala Phe Ala Ala Cys
165 170 175
Ile Thr Ala Asn Gly Ala Leu Thr Lys Leu Leu Asn Val Cys Leu Pro
180 185 190
Gly Thr Pro Thr Ser Thr Ala Leu Leu Gly Cys Leu Ala Ser Ala Cys
195 200 205
Ala Glu Asn Ala Pro Gln Thr Phe Glu Gln Leu Asp Leu Ser Ala Tyr
210 215 220
Ser Gln Phe Tyr Gly Ala Asn Val Leu Gly Ala Lys Val Leu Pro Cys
225 230 235 240
Lys Asn Ala Thr Lys Gln Phe Cys Thr Gly Tyr Phe Gly Asn Leu Ser
245 250 255
Arg Asp Gln Lys Ser Lys Val Ala Ala Asp Ile Phe Asp Ala Thr Lys
260 265 270
Lys Ser Ile Leu Arg Ser Pro Glu Ser Val Leu Glu Tyr Ala Ile Pro
275 280 285
Leu Leu Leu Glu Ser Leu Asp Lys Asp Asp Glu Ser Ala Lys Lys Leu
290 295 300
Val Asp Gly Ile Ser Ala Ser Leu Val Thr Cys Leu Lys Ser Ser Asn
305 310 315 320
Gln Leu Thr Arg Asp Gly Ala Val Thr Cys Ile Gly Val Ala Cys Ala
325 330 335
Ile Ser His Glu Thr Leu Tyr Ser Glu Leu Ala Lys Thr Val Ser Lys
340 345 350
Val Thr Val Leu Glu Gln Lys Val Ala Tyr Gly Asn Ala Ile Ala Gly
355 360 365
Cys His Val Thr Asp Pro Ser Leu Ser Ala Ala Leu Ala Pro Val Val
370 375 380
Thr Lys Glu Lys Asn Glu Ile Ala Leu Thr Ala Leu Ser Arg Ala Phe
385 390 395 400
Leu Val His Phe Ser Pro Asp Gln Ala Lys Thr Leu Ser Ser Gly Leu
405 410 415
Ser Asp Ser Asn Ala Gly Val Val Lys Thr Trp Val Leu Gln Leu Val
420 425 430
Asn Phe Pro Gln His Ala Glu His Val Thr Gly Glu Leu Glu Lys Ile
435 440 445
Leu Ala Ser Ser Thr Ile Val Lys Gly Ala Ile Ser Gly Leu Gly Ala
450 455 460
Val Tyr Leu Leu Thr Lys Ala Gly Lys Ala Val Lys Ser Asp Lys Ala
465 470 475 480
Leu Glu Leu Ala Leu Ser Pro Arg Val Tyr Thr Lys Leu Ser Ala Gly
485 490 495
Glu Phe Val Thr Gly Phe Lys Ala Leu Glu Ser Leu Phe Lys Glu Val
500 505 510
Asn Pro Asp Asn Ala Pro Asp Phe Gly Lys Thr Ile Phe Phe Tyr Ala
515 520 525
Tyr Gly Asp Ser Glu Val Lys Val Asp Val Asp Cys Ser Arg Leu Val
530 535 540
Gly Pro Ala Leu Arg Ser Asn Tyr Ser Asp Gly Leu Ala Gly Ala Val
545 550 555 560
Ile Ser Gly Ile Ser Asp Thr His Val Ser Glu Arg Lys Tyr Ser Lys
565 570 575
Leu Leu Tyr Ser Leu Phe Ser Ala Glu Asn Asn Cys Asp Lys Ala Leu
580 585 590
Val Asp Gly Leu Glu Val Leu Cys Gly Val Gly Leu Trp Ile Glu Ser
595 600 605
Val Leu Gly Ala Ser Arg Asp Pro Arg Lys Leu Leu Leu Asp Asn Glu
610 615 620
Lys His Val Lys Ser Ile Leu Ser Ser Ala Thr Ser Ser Asn Leu Tyr
625 630 635 640
Pro Thr Ile Ala Thr Val Cys Phe Ile Ala Pro Asp Val Phe Ala Gly
645 650 655
Glu Val Ala Glu Gln Phe Thr Val Ser Asn Leu Ser Cys Val Thr Thr
660 665 670
Glu Ala Val Thr Ile Phe Asn Thr Pro Ala Asp Glu Leu Ala Phe Asp
675 680 685
Ile Lys Arg Thr Glu Arg Val Ala His Lys Asn Ser Lys Glu Tyr Gln
690 695 700
Asp Lys Leu Trp Glu Glu Asn Leu Lys Lys Glu Leu Gln Lys Lys Lys
705 710 715 720
Gly Val Val Glu Lys Pro Lys Tyr Thr Lys Glu Glu Gln Ile Lys Val
725 730 735
Asp Glu Gln Met Lys Lys Glu Ala Glu Ile Arg Thr Glu Val Thr Ala
740 745 750
Val Ala Asp His Val Thr Arg Leu Met Gly Ile Ile Ser Ala Leu Ser
755 760 765
Lys Glu Ala Met Thr Val Asp Asn Gly Lys Glu Thr Trp Phe Gly Pro
770 775 780
Ala Met Thr Leu Met Leu Glu Leu Leu Arg His Pro Asn Val Asp Val
785 790 795 800
Leu Cys Ser Ser His Val Thr Lys Thr Leu Thr Asp Met Ser Trp Ile
805 810 815
Thr Asn Asp Lys Leu Gly Ser Ile Arg Pro Phe Leu Ala Val Cys Leu
820 825 830
Leu Arg Met Tyr Gly Asn His Val Ser Glu Asp Leu Gln Lys Glu Ser
835 840 845
Arg Asp Ser Leu Ile Thr Arg Val Leu Tyr Lys Ile His Ser Val Ala
850 855 860
Met Ser Ser Pro Leu Asp Ala Ile Ser Leu Ile Phe Val Leu Pro Ile
865 870 875 880
Val Leu Phe Val Leu Lys Asn Gln Ser Arg Asp Lys Asp Val Ala Glu
885 890 895
Glu Gln Thr His Leu Ala Ile Glu Ile Val Thr Cys His Thr Ser Ala
900 905 910
Phe Ala Asp Val Ile Thr Pro Arg Ser Glu Ile Met Ser Ala Leu Ile
915 920 925
Gln Leu Met Lys Ser Thr Pro Thr Lys Ala Lys Leu Ala Arg Glu Cys
930 935 940
Leu Tyr Ser Val Val Glu His Val Ala Leu Thr Ile Thr Lys Pro Glu
945 950 955 960
Glu His Val Leu Leu Ser Asn Leu Phe Thr Gly Asp Thr Gly Val Arg
965 970 975
His Ala Ile Leu Glu Ala Val Asp Ala His Leu Thr Leu Asp Asp Ser
980 985 990
Ser Pro Glu Leu Tyr Val Thr Cys Phe Asp Val Asp Asp Val Asn Arg
995 1000 1005
Glu Leu Ala Glu Gln Ile Tyr Ser Glu Asn Lys Leu Cys Lys Pro
1010 1015 1020
Ser Ser Ser Val Leu Leu Pro Phe Leu Ala Ala Glu Ser Ser Ser
1025 1030 1035
Leu Arg Leu Ser Ser Ala Arg Ala Tyr Ala Ala Thr Ala Glu Ala
1040 1045 1050
Asp Ser Tyr Asn Gln Leu Met Ala Tyr Ile Ile Glu Ala Ser Val
1055 1060 1065
Pro Ile Pro Pro Thr Leu Asp Gln Tyr Gly Lys Pro Lys Lys Gly
1070 1075 1080
Glu Ser Ala Arg Asp Gln Trp Glu Ala Arg Cys Gly Ala Gly Leu
1085 1090 1095
Ala Val His Glu Met Ala Pro Gly Met Ser Pro Glu His Val Ile
1100 1105 1110
Ser Phe Ile Glu Phe Leu Val Glu Thr Gly Tyr Ser Asp Val Asn
1115 1120 1125
Ser Asp Val Arg Gln Glu Phe Asn Asp Ala Gly Leu Ala Leu Val
1130 1135 1140
Asp Gln His Gly Leu Lys Asn Val Glu Glu Leu Met Lys Ile Ile
1145 1150 1155
Gln Asn Arg Leu Asn Lys Ala Ser Asn Gly Ser Glu Ser Asp Asp
1160 1165 1170
His Val Ile Ser Ser Cys Val Val Leu Tyr Gly Ala Leu Ala Arg
1175 1180 1185
His Leu Glu Ser Ser Asp Ser Arg Leu Pro Val Ile Tyr Asp Arg
1190 1195 1200
Met Leu Val Ala Leu Asp Thr Pro Ser Glu Ser Val Gln Phe Arg
1205 1210 1215
Val Ser Glu Cys Leu Ser Gly Leu Val Ser Lys Met Asp Lys Lys
1220 1225 1230
Ala Arg Asp Gly Tyr Leu Asp Gln Leu Thr Glu Lys Leu Leu Ser
1235 1240 1245
Asp Ser Ser Leu Ala Ile Arg Arg Gly Ala Ala Tyr Gly Ile Ala
1250 1255 1260
Gly Leu Val Arg Gly Gly Gly Ile Ala Ser Ile Gly Glu Thr Asp
1265 1270 1275
Leu Met Arg Thr Leu Thr Asp Ala Met Glu Asn Lys Lys Ser Ser
1280 1285 1290
Ala Ala Arg Gln Ser Ala Gln Phe Val Val Glu Thr Leu Ser Met
1295 1300 1305
Ala Leu Gln Arg His Phe Glu Pro Tyr Ala Leu Gln Leu Met Pro
1310 1315 1320
Leu Val Leu Ala Ala Leu Gly Asp Pro Val Phe Glu Val Arg Glu
1325 1330 1335
Ala Thr Asn Asp Ala Ser Arg Gln Val Met Lys His Thr Thr Ala
1340 1345 1350
Tyr Gly Val Thr Lys Leu Ile Pro Met Ala Ile Glu Asn Leu Asn
1355 1360 1365
Leu Thr Ala Trp Arg Ser Lys Arg Gly Ala Val Glu Leu Leu Gly
1370 1375 1380
Asn Met Ala Tyr Leu Ser Pro His Glu Leu Ser Thr Asn Leu Ser
1385 1390 1395
Leu Ile Val Pro Glu Ile Val Ala Val Leu Asn Asp Thr His Lys
1400 1405 1410
Glu Val Arg Ala Ala Ala Asn Ser Ser Leu Asn Arg Phe Gly His
1415 1420 1425
Val Ile Ser Asn Pro Glu Ile Gln Ala Leu Val Pro Lys Leu Ile
1430 1435 1440
Gly Ala Ile Ala Glu Pro Glu Lys Thr Glu Val Ala Leu Asp Gly
1445 1450 1455
Leu Leu Lys Thr Gln Phe Val His Tyr Ile Asp Ala Pro Ser Leu
1460 1465 1470
Ala Leu Ile Ser His Val Leu Gln Arg Gly Leu Gly Asp Arg Ser
1475 1480 1485
Ala Ala Val Lys Lys Lys Ala Cys Gln Ile Val Gly Asn Met Ala
1490 1495 1500
Ile Leu Thr Ser Ala Gln Asp Ile Ala Pro Tyr Leu Pro Glu Leu
1505 1510 1515
Thr Val Ser Leu Glu Thr Ala Met Val Asp Pro Val Pro Gly Thr
1520 1525 1530
Arg Ala Thr Ala Ala Arg Ala Leu Gly Ser Leu Val Glu Lys Leu
1535 1540 1545
Gly Glu Pro Ala Phe Pro Asp Leu Val Pro Arg Leu Leu Ser Thr
1550 1555 1560
Leu Arg Asp Glu Ser Arg Ala Gly Asp His Leu Gly Ala Ala Gln
1565 1570 1575
Gly Leu Ser Glu Val Val Cys Gly Leu Gly Leu Arg Lys Leu Glu
1580 1585 1590
Glu Ile Leu Pro Gln Val Ile Lys Ser Cys Ala Ser Pro Lys Asn
1595 1600 1605
His Ile Arg Ala Ala Phe Met Pro Leu Met Ile Phe Leu Pro Ala
1610 1615 1620
Thr Phe Gly Asn Ser Leu Thr Pro Tyr Leu Ser Gln Ile Ile Pro
1625 1630 1635
Val Ile Leu Ser Gly Leu Ala Asp Asp Val Asp Ser Val Arg Asp
1640 1645 1650
Ala Ser Leu Lys Ala Gly Arg Leu Leu Val Ser Asn Phe Ser Ser
1655 1660 1665
Lys Ser Val Asp Leu Leu Leu Pro Glu Leu Leu Val Gly Met Ser
1670 1675 1680
Asp Ser Asn His Arg Ile Arg Leu Ala Ser Val Glu Leu Met Gly
1685 1690 1695
Asp Leu Leu Phe Gln Leu Thr Gly Leu Thr Lys Asn Glu Leu Asp
1700 1705 1710
Glu Ser Asp Asp Val Asn Ala Gly Gln Ala Leu Leu Ser Leu Leu
1715 1720 1725
Gly Gln Gln Thr Arg Asp Thr Val Leu Ala Asn Leu Phe Val Cys
1730 1735 1740
Arg Ala Asp Thr Ser Gly Gln Val Arg Leu Ala Ser Ile Glu Ile
1745 1750 1755
Trp Lys Ala Leu Val Ala Asn Thr Pro Arg Thr Val Lys Glu Ile
1760 1765 1770
Leu Pro Glu Leu Thr Asn Gln Val Val Thr Arg Leu Ala Ser Arg
1775 1780 1785
Asp His Glu Gln Arg Glu Ile Ala Ala Ser Thr Leu Gly Glu Leu
1790 1795 1800
Val Arg Arg Val Ser Asp Ser Leu Gln Gln Leu Leu Pro Thr Leu
1805 1810 1815
Gln Thr Asn Leu Asp Asn Ser Asp Ser Asp Gln Lys Gln Gly Ile
1820 1825 1830
Cys Ile Ala Leu Lys Glu Leu Ile Val Ser Ser Ser Arg Asp Gln
1835 1840 1845
Leu Asp Ala His Lys Thr Thr Val Val His Ile Leu His Glu Thr
1850 1855 1860
Leu Thr Asp Ser Ser Arg Asp Val Arg Ser Ala Ala Ala Ser Ala
1865 1870 1875
Phe Asp Ala Tyr Asn Glu Ile Met Gly Asn Ser Ala Val Asp Asp
1880 1885 1890
Ile Leu Pro Lys Leu Leu Leu Leu Leu Lys Glu Arg Pro Glu Ala
1895 1900 1905
Ala Leu Ala Ala Leu Lys Asp Ile Met Gln Ser Arg Ala Asn Ser
1910 1915 1920
Ile Phe Pro Val Val Leu Pro Lys Leu Leu Ser Gln Pro Ile Ser
1925 1930 1935
Val Phe Asn Ala Glu Ala Leu Ala Ser Leu Ala Pro Val Ala Gly
1940 1945 1950
Gln Thr Leu Leu Arg Arg Leu Pro Gln Val Val Gly Asn Leu Val
1955 1960 1965
Ser Ala Ile Ile Ser Ala Arg Asp Gln Lys Asp Asp Glu Arg Ala
1970 1975 1980
Ser Ala Leu Phe Asp Ser Leu Val Ser Ile Phe Leu Ser Val Ser
1985 1990 1995
Asp Glu Gly Ile His Ser Leu Met Gln Gln Leu Lys Ser Met Ala
2000 2005 2010
Lys Asp Glu Asp Ser Ala Val Arg Thr Leu Leu Phe Glu Thr Leu
2015 2020 2025
Thr Pro Phe Phe Lys Asp Thr Gln Leu Asp Leu Ser Ala Tyr Tyr
2030 2035 2040
Ile Asp Trp Ala Glu Leu Cys Ile Tyr Gly Leu Asp Asp Glu Ser
2045 2050 2055
Val Ser Ser Ala Ala Lys Ser Ala Leu Glu Thr Leu Val Lys Asn
2060 2065 2070
Leu Ser Lys Glu Glu Leu Glu Thr Leu Ser Lys Pro Ala Tyr Ser
2075 2080 2085
Ala Leu Ala Asn Thr Ser Ile Pro Leu Ala Gly Ile Asn Val Pro
2090 2095 2100
Lys Gly Pro Ala Cys Ile Leu Pro Ile Phe Val Gln Gly Leu Met
2105 2110 2115
Tyr Gly Thr Ser Asp Gln Arg Glu Ala Ser Ala Asn Gly Met Gly
2120 2125 2130
Cys Ile Val Glu Arg Val Asp Ala Ser Leu Leu Lys Leu His Val
2135 2140 2145
Thr Gln Ile Thr Gly Pro Leu Ile Arg Thr Ile Gly Glu Arg Phe
2150 2155 2160
Pro Ala Ser Val Lys Val Ala Ile Val Thr Thr Leu Asn Leu Leu
2165 2170 2175
Leu Lys Asn Cys Ser Ala Phe Leu Lys Pro Phe Leu Pro Gln Leu
2180 2185 2190
Gln Arg Thr Phe Ala Lys Cys Leu Ser Asp Thr Gly Ser Glu Arg
2195 2200 2205
Leu Arg Asn Glu Ala Ala Glu Ala Leu Gly Thr Leu Ile Thr Leu
2210 2215 2220
Gln Ser Arg Val Asp Pro Leu Val Ser Glu Leu Val Thr Gly Val
2225 2230 2235
Lys Asn Ser Thr Asp Glu Gly Val Thr Asn Ala Met Phe Lys Ala
2240 2245 2250
Leu Gln Gly Val Val Ser Lys Ala Gly Gly Gln Met Ser Gln Gln
2255 2260 2265
Ser Arg Asp Leu Val Phe Asn Leu Ala Asp Glu Val Thr Gly Leu
2270 2275 2280
Asp Lys His Val Leu Ala Lys Met Leu Gly Gly Leu Ala Lys Val
2285 2290 2295
Gly Asp Ala Ser Val Val Tyr Glu Val Ser Gln Lys Val Asn Asn
2300 2305 2310
Ser Glu Phe Gly Ala Tyr Val Leu Asn Glu Leu Leu Val Ala Gln
2315 2320 2325
Ala Gly Asp Glu Arg Val Ser Thr Arg Asp Leu Pro Asp Asp Ser
2330 2335 2340
Pro Asp Tyr Val Thr Ser Thr Leu Glu Leu Met Lys Ser Glu Thr
2345 2350 2355
Pro Ala Val Ser Asp Ala Ala Thr Leu Ala Cys Gly Lys Leu Leu
2360 2365 2370
Leu Ala Phe Gly Gly Leu Pro Phe Glu Ile Thr Lys Ile Leu Leu
2375 2380 2385
Thr Gln Leu Ala Gln Asn Ile Thr Ala Pro Ala Ser Ser Ser Ser
2390 2395 2400
Asp Thr Arg Arg Leu Ala Leu Val Val Leu Arg Thr Val Ala Arg
2405 2410 2415
Gln Gln His Ala Leu Thr Lys Pro His Val Thr Leu Leu Ala Thr
2420 2425 2430
Ser Thr Phe Ala Cys Val Arg Glu Met Val Ile Pro Ile Lys Leu
2435 2440 2445
Ala Ala Glu Lys Ala Trp Leu Ala Leu Phe Asp Leu Val Thr Gly
2450 2455 2460
Ser Thr Glu Phe Asp Lys Trp Phe Gly Glu Val Gln Ser Glu Leu
2465 2470 2475
Pro Asn Asn Gly Arg Ser Ile Gly Asp Tyr Thr Lys Arg Val Ala
2480 2485 2490
Met Arg Leu Ala Gln Ala Glu Arg Glu Arg Leu Glu Glu Gly Gly
2495 2500 2505
Asp Asp Met Glu Ser Asp Lys Arg Glu Asp Glu Ala Glu Ile Trp
2510 2515 2520
Glu
<210> 63
<211> 4926
<212> DNA
<213> Yarrowia lipolytica
<400> 63
atggagttac aggaactgca agaaaacgag gcggaggctt tgaaggccat ctacatggac 60
gattttgttg acaccacaaa gtcatctgca tggaacaaaa cgccttcgcc atcatttgag 120
attcacatgc gatcgaccga cccggacgcc gaagatgccc tatccagttt aacgctccag 180
gtcgagctca cgagtaccta ccccaaaacg gtccctgtta ttcgcatcaa aaaccccaaa 240
aacattttag catcacaggt ggccaagtta gagaagtgga tcgccgccac ctgcaaggag 300
ctcattggcg cagagatgat cttcgaggtc acctcgtata tccaggagcg actggaggat 360
tttcaacaga aggtgtccac cgccagtctg gaggaggagc ggcagatgaa gatcgagaag 420
caacaggagc agctacgaaa gcaaaagagc gacgaggcca aaaagcggga acaggaaaac 480
gcggaggaag acagagtgct agagatgatg gttgtggagg agctcaagcg acgcaaacag 540
cgggatgatg aagcgcaaaa ggcgcttact gcggagcgac aattgtcaaa cggcggccca 600
gtcatggccg attgcattga gtttgacaga ataacaacaa tctcgcgagc aggacaccca 660
gcaatcagtt tcagaagagt aggaggacaa atacccgtgc gagggtactc ttttggtaac 720
aattttttgg tgcggcccgt gacagaccca ccaaccgaca tatccctgct tctcacagaa 780
gttagacttc agggcacata ctggatccag gcagagggaa agaagatgat tcaactactc 840
gagtctgact tggacaactt gagaaagttt cgacacgaaa acgtcatcag tctctacgac 900
cacaagttcc aacgatgtcc agatacttcc ggatggacgc tatacctact ttccgaatat 960
tctcctggag gaactgtgtc tgatctgctt gataccgtgg gtaccgtgag tctcaaagtg 1020
acacgagtat gggctattca actactcgaa gccctggagg ctatccacaa ggctggattg 1080
gttcacaaga gtgtcaatgt ggacactgtg gtcctttttc gaaacgcaga aattggagaa 1140
acagtggtca agttgggata cactgttttt ggtcaacgtc ttaacgaaat gaattcggcg 1200
tgcacatttg atatgactgc ctctgtttca tcgatacaac acgacagtga tgcttggtca 1260
cctcctgagc tagtgcagca gagtggaaac aagcagacgc gtaagacaga cgtgtgggct 1320
ctgggtgtga tgcttcttca gaccttcatg ggtaagcagg tgacgtcaga gtattacgga 1380
cctacagatg tgatcaacag tctggatctg ggagattccc tggaagagtt ccttcgaaaa 1440
atgttcatgc cttctcccaa gaaacgtctt tctgcatttg agctcttgcc ttgtgaattc 1500
cttcgaactg gtgtcgactc gccagtgaag ttggcgtgtg cttccagcag tggtggaaaa 1560
cgaggtcgag gaagaagcat gtctacggat ggacgacctc accgggattc catgagtggt 1620
ctttccatgt ctcgatatgc tcaggacttc gaggaaacgg ttttgttagg acgaggtggc 1680
tatggtgtcg ttgtgaaggc tcgcaacaag ttggatggcc gtttctacgc catcaagcga 1740
gttcaacata cagcagacaa gttgacttcc attctaacag aggtcatgct gctgtctcgt 1800
ctcaataatc agtacgtggt tcgatacttt gctgcgtggt tggaagagtc ctacgactat 1860
caggatgagt ctgccatcga ggactacgat tcagaggagg agtggagcga aagtgtttct 1920
agagttgaaa catctgtcag cgcgtttcct gcccgtctca acggctcata cgaccaagat 1980
acgtttgacg agctctccat gaacgcctcg gtggacttca tctccaactc cctgcatcga 2040
gagtatcctg agattgaatt cggagtcagt tcagaggatg atgaagaccg cgagagtgac 2100
gatagcgaca gcgaagacga gacttcttcg gggagcgtat caacatcttc tcccatcaac 2160
agcagacaca aaactaccgt caagactctc gttggaaagg ctgctctggc tgagctgcgt 2220
gactctcctc gacacaagca agacaagtct ctggtaaaat ccaccctatt cattcaaatg 2280
gaatattgtg agaagcacac tttggcggat ttgatcaagc agaacctctc atctaaacct 2340
gaagactgct ggcgattgtt tggccagatt cttgatgctc tgagccacat tcattctcag 2400
ggcatcatcc atcgagatct caagcctatg aacattttca ttgactcatc tggtaatgtc 2460
aaggtcggag attttggact ggccaagaat atccatactg gaacttctct ggttggtgcc 2520
ggtgcaggaa ctggtgggag ctcgtctcag tacacaggtg aggatatgac aggcgacatc 2580
ggtactacgc tgtacgtcgc caatgaggta ttagccacag gcggggaggc caattacaac 2640
gagaaagttg acatgtactc tttgggtatc atctttttcg agatggtgtt ccccatgaac 2700
actgcgatgg agcgtgtcta cattcttcga gacttgcgca accctaaggt catcttccct 2760
ccagcgtttg aggcttctaa gtacaacgaa cctcgtaaga tcattcgaag cttgctcgac 2820
catgacccca gcaagagacc ttctgcccaa caactcttgg cctcaggcat tttgccgatt 2880
cctaataagg acaagactat caaggaggtg attcgaagct tggtagaccc ctcgcccagt 2940
tcgccatggc tttctcaagt gtgtcgggct ctgttctcac gacctctcaa gacagcgcag 3000
gtgtttcttt acgaccgtgc aatcgctggt gagggcagta aatcggactc tcgcgattct 3060
cttctccagg ctcagatgat tgagcaaatc gaggcaactt tcagaaacca cggtgccatc 3120
aaggtcaaca atcgaccatt gctatttccg aagtctctca tatacaagtc cccaaatgtg 3180
gtgtcagtac tcgatcaagc gggtacaatt cttcagttgc ccttcgacct gacactccct 3240
catgctcgaa tgcttgccaa gggtcagact tactaccata agtctttctg ctgtgattat 3300
gtctatcgag cagatgagaa caatgtcgtt agccatcccc gccggtttgg agagattgac 3360
tttgacattg taacccagga ttctacggac ttgcctctgt atgacgccga ggctatccga 3420
gtactcgacc aggtgatcca gttgttccca tcttttaaaa acaacaacgt cgtcatttac 3480
attaaccatt gggatatcct gcagactatt ttggattcat gtcgtattgg gcaagcccag 3540
agagctgttg ctcttcggct tctggacgag accggacagg cccctgctcg ccaggttgtc 3600
aaggaagagc ttcgaaccaa gtactctgtc ggtgccaccg ctttggatga tttggaatca 3660
tttggattcc gagacgacat cgacaaggcc gaacaacgtc ttcgtaagat gatcgagggc 3720
agcgagcata ccactcggct gacagagtca ttcttgtgga ttcgaaaggt ttctacctat 3780
ctgaaacgtt ttggctgtac ccgtcgtgtc tacgttgctc cattgagtaa ttacaacgag 3840
gacttctacc gcagcggtct gatgtttcag gctgtcgttg aggataccgc tccacagaag 3900
cgcacgtcca ttctagctgt tggtggacga tatgaccgac tgattactcg gttcagacac 3960
gagtcattgg atcgaggagt tccccgcacg catgctgtcg gcttcaacct tgcttgggaa 4020
tcaatcttcg actccatgaa ggcctacaga gatgccttga tgaaaaagca aaagaagaag 4080
ggcacggttc aggttctcag cacatccact tcgtcatctg ctctcgagtt gcaacgttgg 4140
tacccctctc gttgtgatgc tctcgttacg tccttcaata gtaacacatt gcgcactgtt 4200
tgtctagatg ttttgaagga cttgtgggga gcaggtattc gagctgactt gtgccgagat 4260
tgttcatcat cggaggaact tgttgcgcgg gctcagagtg aaggtatcaa ttggatcatc 4320
atcgtcaagc agcatagtgg ctactcttct gctgcggccg cgtacaagcc ccttcgtgtc 4380
aagaatgttg cgcggaacga cgacactgat attgatagag atggaatcgt cggtcatatg 4440
atgactgagt tgaatgagcg gggtggatct tacagcaaca caaacgccct ggcaccccct 4500
tctctgtctg tgcctcacga cccatcgcct ccagcttcca ttgtggatac tagcgatatc 4560
tatgccacca acaaggtgtc tgtgatcacg aatgagtgga acaagagtaa gtcctccaag 4620
agaaccaacc agtggaacga cgaggaggaa cgtgcgttga gacacacgcg ttcgctggta 4680
cacgacatcc aggaggctcc cattttcaca atcgatgtca aggaagatat acttgacgcc 4740
atttctgtga cttctctggc atcgtttgat gaatggcgtc gaaaggtgat tggtatccag 4800
ccttcacata agccttacct ggcaaagatc tacaaccagc tggtcaagct gaaggaaaca 4860
cgatctacgg ctttactgta ttcacctaaa gcagacaagt tgattcttta caatctgagg 4920
aagtga 4926
<210> 64
<211> 1641
<212> PRT
<213> Yarrowia lipolytica
<400> 64
Met Glu Leu Gln Glu Leu Gln Glu Asn Glu Ala Glu Ala Leu Lys Ala
1 5 10 15
Ile Tyr Met Asp Asp Phe Val Asp Thr Thr Lys Ser Ser Ala Trp Asn
20 25 30
Lys Thr Pro Ser Pro Ser Phe Glu Ile His Met Arg Ser Thr Asp Pro
35 40 45
Asp Ala Glu Asp Ala Leu Ser Ser Leu Thr Leu Gln Val Glu Leu Thr
50 55 60
Ser Thr Tyr Pro Lys Thr Val Pro Val Ile Arg Ile Lys Asn Pro Lys
65 70 75 80
Asn Ile Leu Ala Ser Gln Val Ala Lys Leu Glu Lys Trp Ile Ala Ala
85 90 95
Thr Cys Lys Glu Leu Ile Gly Ala Glu Met Ile Phe Glu Val Thr Ser
100 105 110
Tyr Ile Gln Glu Arg Leu Glu Asp Phe Gln Gln Lys Val Ser Thr Ala
115 120 125
Ser Leu Glu Glu Glu Arg Gln Met Lys Ile Glu Lys Gln Gln Glu Gln
130 135 140
Leu Arg Lys Gln Lys Ser Asp Glu Ala Lys Lys Arg Glu Gln Glu Asn
145 150 155 160
Ala Glu Glu Asp Arg Val Leu Glu Met Met Val Val Glu Glu Leu Lys
165 170 175
Arg Arg Lys Gln Arg Asp Asp Glu Ala Gln Lys Ala Leu Thr Ala Glu
180 185 190
Arg Gln Leu Ser Asn Gly Gly Pro Val Met Ala Asp Cys Ile Glu Phe
195 200 205
Asp Arg Ile Thr Thr Ile Ser Arg Ala Gly His Pro Ala Ile Ser Phe
210 215 220
Arg Arg Val Gly Gly Gln Ile Pro Val Arg Gly Tyr Ser Phe Gly Asn
225 230 235 240
Asn Phe Leu Val Arg Pro Val Thr Asp Pro Pro Thr Asp Ile Ser Leu
245 250 255
Leu Leu Thr Glu Val Arg Leu Gln Gly Thr Tyr Trp Ile Gln Ala Glu
260 265 270
Gly Lys Lys Met Ile Gln Leu Leu Glu Ser Asp Leu Asp Asn Leu Arg
275 280 285
Lys Phe Arg His Glu Asn Val Ile Ser Leu Tyr Asp His Lys Phe Gln
290 295 300
Arg Cys Pro Asp Thr Ser Gly Trp Thr Leu Tyr Leu Leu Ser Glu Tyr
305 310 315 320
Ser Pro Gly Gly Thr Val Ser Asp Leu Leu Asp Thr Val Gly Thr Val
325 330 335
Ser Leu Lys Val Thr Arg Val Trp Ala Ile Gln Leu Leu Glu Ala Leu
340 345 350
Glu Ala Ile His Lys Ala Gly Leu Val His Lys Ser Val Asn Val Asp
355 360 365
Thr Val Val Leu Phe Arg Asn Ala Glu Ile Gly Glu Thr Val Val Lys
370 375 380
Leu Gly Tyr Thr Val Phe Gly Gln Arg Leu Asn Glu Met Asn Ser Ala
385 390 395 400
Cys Thr Phe Asp Met Thr Ala Ser Val Ser Ser Ile Gln His Asp Ser
405 410 415
Asp Ala Trp Ser Pro Pro Glu Leu Val Gln Gln Ser Gly Asn Lys Gln
420 425 430
Thr Arg Lys Thr Asp Val Trp Ala Leu Gly Val Met Leu Leu Gln Thr
435 440 445
Phe Met Gly Lys Gln Val Thr Ser Glu Tyr Tyr Gly Pro Thr Asp Val
450 455 460
Ile Asn Ser Leu Asp Leu Gly Asp Ser Leu Glu Glu Phe Leu Arg Lys
465 470 475 480
Met Phe Met Pro Ser Pro Lys Lys Arg Leu Ser Ala Phe Glu Leu Leu
485 490 495
Pro Cys Glu Phe Leu Arg Thr Gly Val Asp Ser Pro Val Lys Leu Ala
500 505 510
Cys Ala Ser Ser Ser Gly Gly Lys Arg Gly Arg Gly Arg Ser Met Ser
515 520 525
Thr Asp Gly Arg Pro His Arg Asp Ser Met Ser Gly Leu Ser Met Ser
530 535 540
Arg Tyr Ala Gln Asp Phe Glu Glu Thr Val Leu Leu Gly Arg Gly Gly
545 550 555 560
Tyr Gly Val Val Val Lys Ala Arg Asn Lys Leu Asp Gly Arg Phe Tyr
565 570 575
Ala Ile Lys Arg Val Gln His Thr Ala Asp Lys Leu Thr Ser Ile Leu
580 585 590
Thr Glu Val Met Leu Leu Ser Arg Leu Asn Asn Gln Tyr Val Val Arg
595 600 605
Tyr Phe Ala Ala Trp Leu Glu Glu Ser Tyr Asp Tyr Gln Asp Glu Ser
610 615 620
Ala Ile Glu Asp Tyr Asp Ser Glu Glu Glu Trp Ser Glu Ser Val Ser
625 630 635 640
Arg Val Glu Thr Ser Val Ser Ala Phe Pro Ala Arg Leu Asn Gly Ser
645 650 655
Tyr Asp Gln Asp Thr Phe Asp Glu Leu Ser Met Asn Ala Ser Val Asp
660 665 670
Phe Ile Ser Asn Ser Leu His Arg Glu Tyr Pro Glu Ile Glu Phe Gly
675 680 685
Val Ser Ser Glu Asp Asp Glu Asp Arg Glu Ser Asp Asp Ser Asp Ser
690 695 700
Glu Asp Glu Thr Ser Ser Gly Ser Val Ser Thr Ser Ser Pro Ile Asn
705 710 715 720
Ser Arg His Lys Thr Thr Val Lys Thr Leu Val Gly Lys Ala Ala Leu
725 730 735
Ala Glu Leu Arg Asp Ser Pro Arg His Lys Gln Asp Lys Ser Leu Val
740 745 750
Lys Ser Thr Leu Phe Ile Gln Met Glu Tyr Cys Glu Lys His Thr Leu
755 760 765
Ala Asp Leu Ile Lys Gln Asn Leu Ser Ser Lys Pro Glu Asp Cys Trp
770 775 780
Arg Leu Phe Gly Gln Ile Leu Asp Ala Leu Ser His Ile His Ser Gln
785 790 795 800
Gly Ile Ile His Arg Asp Leu Lys Pro Met Asn Ile Phe Ile Asp Ser
805 810 815
Ser Gly Asn Val Lys Val Gly Asp Phe Gly Leu Ala Lys Asn Ile His
820 825 830
Thr Gly Thr Ser Leu Val Gly Ala Gly Ala Gly Thr Gly Gly Ser Ser
835 840 845
Ser Gln Tyr Thr Gly Glu Asp Met Thr Gly Asp Ile Gly Thr Thr Leu
850 855 860
Tyr Val Ala Asn Glu Val Leu Ala Thr Gly Gly Glu Ala Asn Tyr Asn
865 870 875 880
Glu Lys Val Asp Met Tyr Ser Leu Gly Ile Ile Phe Phe Glu Met Val
885 890 895
Phe Pro Met Asn Thr Ala Met Glu Arg Val Tyr Ile Leu Arg Asp Leu
900 905 910
Arg Asn Pro Lys Val Ile Phe Pro Pro Ala Phe Glu Ala Ser Lys Tyr
915 920 925
Asn Glu Pro Arg Lys Ile Ile Arg Ser Leu Leu Asp His Asp Pro Ser
930 935 940
Lys Arg Pro Ser Ala Gln Gln Leu Leu Ala Ser Gly Ile Leu Pro Ile
945 950 955 960
Pro Asn Lys Asp Lys Thr Ile Lys Glu Val Ile Arg Ser Leu Val Asp
965 970 975
Pro Ser Pro Ser Ser Pro Trp Leu Ser Gln Val Cys Arg Ala Leu Phe
980 985 990
Ser Arg Pro Leu Lys Thr Ala Gln Val Phe Leu Tyr Asp Arg Ala Ile
995 1000 1005
Ala Gly Glu Gly Ser Lys Ser Asp Ser Arg Asp Ser Leu Leu Gln
1010 1015 1020
Ala Gln Met Ile Glu Gln Ile Glu Ala Thr Phe Arg Asn His Gly
1025 1030 1035
Ala Ile Lys Val Asn Asn Arg Pro Leu Leu Phe Pro Lys Ser Leu
1040 1045 1050
Ile Tyr Lys Ser Pro Asn Val Val Ser Val Leu Asp Gln Ala Gly
1055 1060 1065
Thr Ile Leu Gln Leu Pro Phe Asp Leu Thr Leu Pro His Ala Arg
1070 1075 1080
Met Leu Ala Lys Gly Gln Thr Tyr Tyr His Lys Ser Phe Cys Cys
1085 1090 1095
Asp Tyr Val Tyr Arg Ala Asp Glu Asn Asn Val Val Ser His Pro
1100 1105 1110
Arg Arg Phe Gly Glu Ile Asp Phe Asp Ile Val Thr Gln Asp Ser
1115 1120 1125
Thr Asp Leu Pro Leu Tyr Asp Ala Glu Ala Ile Arg Val Leu Asp
1130 1135 1140
Gln Val Ile Gln Leu Phe Pro Ser Phe Lys Asn Asn Asn Val Val
1145 1150 1155
Ile Tyr Ile Asn His Trp Asp Ile Leu Gln Thr Ile Leu Asp Ser
1160 1165 1170
Cys Arg Ile Gly Gln Ala Gln Arg Ala Val Ala Leu Arg Leu Leu
1175 1180 1185
Asp Glu Thr Gly Gln Ala Pro Ala Arg Gln Val Val Lys Glu Glu
1190 1195 1200
Leu Arg Thr Lys Tyr Ser Val Gly Ala Thr Ala Leu Asp Asp Leu
1205 1210 1215
Glu Ser Phe Gly Phe Arg Asp Asp Ile Asp Lys Ala Glu Gln Arg
1220 1225 1230
Leu Arg Lys Met Ile Glu Gly Ser Glu His Thr Thr Arg Leu Thr
1235 1240 1245
Glu Ser Phe Leu Trp Ile Arg Lys Val Ser Thr Tyr Leu Lys Arg
1250 1255 1260
Phe Gly Cys Thr Arg Arg Val Tyr Val Ala Pro Leu Ser Asn Tyr
1265 1270 1275
Asn Glu Asp Phe Tyr Arg Ser Gly Leu Met Phe Gln Ala Val Val
1280 1285 1290
Glu Asp Thr Ala Pro Gln Lys Arg Thr Ser Ile Leu Ala Val Gly
1295 1300 1305
Gly Arg Tyr Asp Arg Leu Ile Thr Arg Phe Arg His Glu Ser Leu
1310 1315 1320
Asp Arg Gly Val Pro Arg Thr His Ala Val Gly Phe Asn Leu Ala
1325 1330 1335
Trp Glu Ser Ile Phe Asp Ser Met Lys Ala Tyr Arg Asp Ala Leu
1340 1345 1350
Met Lys Lys Gln Lys Lys Lys Gly Thr Val Gln Val Leu Ser Thr
1355 1360 1365
Ser Thr Ser Ser Ser Ala Leu Glu Leu Gln Arg Trp Tyr Pro Ser
1370 1375 1380
Arg Cys Asp Ala Leu Val Thr Ser Phe Asn Ser Asn Thr Leu Arg
1385 1390 1395
Thr Val Cys Leu Asp Val Leu Lys Asp Leu Trp Gly Ala Gly Ile
1400 1405 1410
Arg Ala Asp Leu Cys Arg Asp Cys Ser Ser Ser Glu Glu Leu Val
1415 1420 1425
Ala Arg Ala Gln Ser Glu Gly Ile Asn Trp Ile Ile Ile Val Lys
1430 1435 1440
Gln His Ser Gly Tyr Ser Ser Ala Ala Ala Ala Tyr Lys Pro Leu
1445 1450 1455
Arg Val Lys Asn Val Ala Arg Asn Asp Asp Thr Asp Ile Asp Arg
1460 1465 1470
Asp Gly Ile Val Gly His Met Met Thr Glu Leu Asn Glu Arg Gly
1475 1480 1485
Gly Ser Tyr Ser Asn Thr Asn Ala Leu Ala Pro Pro Ser Leu Ser
1490 1495 1500
Val Pro His Asp Pro Ser Pro Pro Ala Ser Ile Val Asp Thr Ser
1505 1510 1515
Asp Ile Tyr Ala Thr Asn Lys Val Ser Val Ile Thr Asn Glu Trp
1520 1525 1530
Asn Lys Ser Lys Ser Ser Lys Arg Thr Asn Gln Trp Asn Asp Glu
1535 1540 1545
Glu Glu Arg Ala Leu Arg His Thr Arg Ser Leu Val His Asp Ile
1550 1555 1560
Gln Glu Ala Pro Ile Phe Thr Ile Asp Val Lys Glu Asp Ile Leu
1565 1570 1575
Asp Ala Ile Ser Val Thr Ser Leu Ala Ser Phe Asp Glu Trp Arg
1580 1585 1590
Arg Lys Val Ile Gly Ile Gln Pro Ser His Lys Pro Tyr Leu Ala
1595 1600 1605
Lys Ile Tyr Asn Gln Leu Val Lys Leu Lys Glu Thr Arg Ser Thr
1610 1615 1620
Ala Leu Leu Tyr Ser Pro Lys Ala Asp Lys Leu Ile Leu Tyr Asn
1625 1630 1635
Leu Arg Lys
1640
<210> 65
<211> 924
<212> DNA
<213> Yarrowia lipolytica
<400> 65
atggccaaat tcgacatcaa agagacatat ctgcgctttc tgcgggacga ccccgacatc 60
accatgcctg tcgcggccat tgaggccctg gtccagctgc tcagtgagac cgaaaccagc 120
acatcagccg agctgattca gactctcaag gaggcgagcg cggagctcaa gacgtctgtg 180
gacaactcta tgtcgctttc tgcaggctgt gatctgttta tgcgatttgt gttgcgaaat 240
atccgggaat atggcgactg ggaggcctgc aagggccatt tggtaaagaa cggaaggctg 300
tttgccgagc gaagtaaggc tgctcgaaag accatttcgg aaaagggtct agcatttgtg 360
cgggatgacg atgtcattct ggtccactct ttctcgcgaa cggtactggc ccttctggaa 420
catgctgcta agaacttggt gcgtttcaga gtgtttgtca cagaggctgc tcctagtgat 480
cagggtaagc gaatggccaa ggcattgagg gagagaggca ttcccgtgag tctaattgtg 540
gacaacgccg tcggatctgt gattgacgag gtgtccaagg tgttttgtgg tgccgaggga 600
gtggcggagt ctggaggagt catcaaccac gtcggatcat atcagattgc cgtgctagcc 660
aagaacgcaa ataagccctt ctacgtggtc accgagagtc acaagtttgt gcgaatcttc 720
cctctggccc aggccgatct gccagacacc aaaaagatgt tccacttcac tgttgaggag 780
cccgaggagc agaatgccga caagggtctg tcgccagtcg tcgactttac gcctcacgat 840
tacatcactg cacttatcac agatctggga gttctcactc caagtggcgt ttctgaggag 900
ctgattaaaa tgtggtatga gtaa 924
<210> 66
<211> 307
<212> PRT
<213> Yarrowia lipolytica
<400> 66
Met Ala Lys Phe Asp Ile Lys Glu Thr Tyr Leu Arg Phe Leu Arg Asp
1 5 10 15
Asp Pro Asp Ile Thr Met Pro Val Ala Ala Ile Glu Ala Leu Val Gln
20 25 30
Leu Leu Ser Glu Thr Glu Thr Ser Thr Ser Ala Glu Leu Ile Gln Thr
35 40 45
Leu Lys Glu Ala Ser Ala Glu Leu Lys Thr Ser Val Asp Asn Ser Met
50 55 60
Ser Leu Ser Ala Gly Cys Asp Leu Phe Met Arg Phe Val Leu Arg Asn
65 70 75 80
Ile Arg Glu Tyr Gly Asp Trp Glu Ala Cys Lys Gly His Leu Val Lys
85 90 95
Asn Gly Arg Leu Phe Ala Glu Arg Ser Lys Ala Ala Arg Lys Thr Ile
100 105 110
Ser Glu Lys Gly Leu Ala Phe Val Arg Asp Asp Asp Val Ile Leu Val
115 120 125
His Ser Phe Ser Arg Thr Val Leu Ala Leu Leu Glu His Ala Ala Lys
130 135 140
Asn Leu Val Arg Phe Arg Val Phe Val Thr Glu Ala Ala Pro Ser Asp
145 150 155 160
Gln Gly Lys Arg Met Ala Lys Ala Leu Arg Glu Arg Gly Ile Pro Val
165 170 175
Ser Leu Ile Val Asp Asn Ala Val Gly Ser Val Ile Asp Glu Val Ser
180 185 190
Lys Val Phe Cys Gly Ala Glu Gly Val Ala Glu Ser Gly Gly Val Ile
195 200 205
Asn His Val Gly Ser Tyr Gln Ile Ala Val Leu Ala Lys Asn Ala Asn
210 215 220
Lys Pro Phe Tyr Val Val Thr Glu Ser His Lys Phe Val Arg Ile Phe
225 230 235 240
Pro Leu Ala Gln Ala Asp Leu Pro Asp Thr Lys Lys Met Phe His Phe
245 250 255
Thr Val Glu Glu Pro Glu Glu Gln Asn Ala Asp Lys Gly Leu Ser Pro
260 265 270
Val Val Asp Phe Thr Pro His Asp Tyr Ile Thr Ala Leu Ile Thr Asp
275 280 285
Leu Gly Val Leu Thr Pro Ser Gly Val Ser Glu Glu Leu Ile Lys Met
290 295 300
Trp Tyr Glu
305
<210> 67
<211> 1395
<212> DNA
<213> Yarrowia lipolytica
<400> 67
atggattcgg atactgagtc agtgaaacga agaaagtcct ccgggtccga aagcgagtcg 60
agcgtgcgag atccgaaacg aaccaagatt gaagatgagg atttccagga gaacggcata 120
gacgatgagg atgaggagga ggaagaggag gaagctaagg acgaagggga tgaagacgac 180
gaagaaaaag gagaggacga cgaggaggac gatgaagaaa aagaaggcga ggatggagaa 240
ggagaggaag aagacgaaga ggaggatgag gagaagaagc gagaggagga ggagaagtac 300
gttaccagct tcaactttga tggtgtggaa tacaagtaca aagagcgacc agcagtgatt 360
gaggagcgtg aaggaaagat tgaatttcgt gttgtcaaca acgataactc caaggaaaac 420
ctcatgatcc tgacaggtct caagaacatt ttccagaaac agctgcccaa aatgcctcga 480
gagtacattg cccgactagt gtacgacaga agtcatgtgt caatggcagt tgttagaaag 540
cctctcacgg tggtcggagg aattacattt cggccgttcg atacccggaa gtttgctgaa 600
atcgtcttct gtgccatcag tagtacagag caggtccgag gatacggagc gcacttgatg 660
aaccatttga aggactacgt taaggctaca tcgcctgtga tgtactttct gacatacgcc 720
gataactatg ccattggata cttcaagaag cagggtttct ccaaggagat ctccctcgac 780
agatcggtgt ggatgggata catcaaggat tacgagggag gtactctcat gcagtgctcc 840
atgctgccac gaatcagata ccttgacgtc aacaagattc ttctgctaca gaaggcactg 900
attcacaaga agatccgggc catctccaag agtcatgttg tgcgaaaagg cctcgaccac 960
tttcgtgatt cgaccacgcc agtggacccc atgacgatcc cgggcttgaa ggaggctgga 1020
tggacacctg agatggacga gttggctaga cgaccaaagc gaggtcctca ttttgcagtc 1080
atgcagcacg tgctgtcaga gttgcagaac cacgcttctg cttggccgtt tgcccaggct 1140
gttaaccgag acgaggtgcc cgactactat gaggtcatta aggagcccat ggatctctca 1200
acgatggagc aacgtctcga agctgactct tacaagacca tggaggagtt tgtgtatgac 1260
gctcggttgg tgttcaataa ctgtcgtgct tacaacaacg agacgacgac ttactataag 1320
aatgccaaca agctagagaa gttcatggtg gccaaaatca aagagatccc tgagtactct 1380
catttggtgg agtaa 1395
<210> 68
<211> 464
<212> PRT
<213> Yarrowia lipolytica
<400> 68
Met Asp Ser Asp Thr Glu Ser Val Lys Arg Arg Lys Ser Ser Gly Ser
1 5 10 15
Glu Ser Glu Ser Ser Val Arg Asp Pro Lys Arg Thr Lys Ile Glu Asp
20 25 30
Glu Asp Phe Gln Glu Asn Gly Ile Asp Asp Glu Asp Glu Glu Glu Glu
35 40 45
Glu Glu Glu Ala Lys Asp Glu Gly Asp Glu Asp Asp Glu Glu Lys Gly
50 55 60
Glu Asp Asp Glu Glu Asp Asp Glu Glu Lys Glu Gly Glu Asp Gly Glu
65 70 75 80
Gly Glu Glu Glu Asp Glu Glu Glu Asp Glu Glu Lys Lys Arg Glu Glu
85 90 95
Glu Glu Lys Tyr Val Thr Ser Phe Asn Phe Asp Gly Val Glu Tyr Lys
100 105 110
Tyr Lys Glu Arg Pro Ala Val Ile Glu Glu Arg Glu Gly Lys Ile Glu
115 120 125
Phe Arg Val Val Asn Asn Asp Asn Ser Lys Glu Asn Leu Met Ile Leu
130 135 140
Thr Gly Leu Lys Asn Ile Phe Gln Lys Gln Leu Pro Lys Met Pro Arg
145 150 155 160
Glu Tyr Ile Ala Arg Leu Val Tyr Asp Arg Ser His Val Ser Met Ala
165 170 175
Val Val Arg Lys Pro Leu Thr Val Val Gly Gly Ile Thr Phe Arg Pro
180 185 190
Phe Asp Thr Arg Lys Phe Ala Glu Ile Val Phe Cys Ala Ile Ser Ser
195 200 205
Thr Glu Gln Val Arg Gly Tyr Gly Ala His Leu Met Asn His Leu Lys
210 215 220
Asp Tyr Val Lys Ala Thr Ser Pro Val Met Tyr Phe Leu Thr Tyr Ala
225 230 235 240
Asp Asn Tyr Ala Ile Gly Tyr Phe Lys Lys Gln Gly Phe Ser Lys Glu
245 250 255
Ile Ser Leu Asp Arg Ser Val Trp Met Gly Tyr Ile Lys Asp Tyr Glu
260 265 270
Gly Gly Thr Leu Met Gln Cys Ser Met Leu Pro Arg Ile Arg Tyr Leu
275 280 285
Asp Val Asn Lys Ile Leu Leu Leu Gln Lys Ala Leu Ile His Lys Lys
290 295 300
Ile Arg Ala Ile Ser Lys Ser His Val Val Arg Lys Gly Leu Asp His
305 310 315 320
Phe Arg Asp Ser Thr Thr Pro Val Asp Pro Met Thr Ile Pro Gly Leu
325 330 335
Lys Glu Ala Gly Trp Thr Pro Glu Met Asp Glu Leu Ala Arg Arg Pro
340 345 350
Lys Arg Gly Pro His Phe Ala Val Met Gln His Val Leu Ser Glu Leu
355 360 365
Gln Asn His Ala Ser Ala Trp Pro Phe Ala Gln Ala Val Asn Arg Asp
370 375 380
Glu Val Pro Asp Tyr Tyr Glu Val Ile Lys Glu Pro Met Asp Leu Ser
385 390 395 400
Thr Met Glu Gln Arg Leu Glu Ala Asp Ser Tyr Lys Thr Met Glu Glu
405 410 415
Phe Val Tyr Asp Ala Arg Leu Val Phe Asn Asn Cys Arg Ala Tyr Asn
420 425 430
Asn Glu Thr Thr Thr Tyr Tyr Lys Asn Ala Asn Lys Leu Glu Lys Phe
435 440 445
Met Val Ala Lys Ile Lys Glu Ile Pro Glu Tyr Ser His Leu Val Glu
450 455 460
<210> 69
<211> 5295
<212> DNA
<213> Candida albicans
<400> 69
atgccagaaa catcaattac tctggattta gaacatagac aacaagatga aattagtagt 60
atatcatcaa tttatggtga tatctttaaa gatattactc caacgggttt agtttggaat 120
aaaaaaccca gtccgcattt ccaagtattt ttatcatcgt caaataatcc tgatcgaccg 180
actgtttcca ttacattaga tatagaattc actcctactt atcctttatc acctccaaaa 240
gtaaaactac taaatgctcg taatttattg aaaattaata ttgctaaatt agaaaagaaa 300
tgtaaagatt taatcaaaga atatcccgaa caagaagttt ctttcacgat aatttccgaa 360
ttgattttca tgttagatga aatacaaaca acaactgaaa aagtattatc attagaagaa 420
gaaagagaat taagattaag aaatgaaaga agggcattag aagaaaaaga ggcgaaacag 480
aagaaggatg aagaattggc tcgaaagaaa caaaataaag aattgaatga acaaattcaa 540
aaaattcaag gtgaatttga tgatgatttt actgatgatc aagatttaga tatgtcaact 600
actaatgata ataataattc attaatccca cttgataaag atcaattttt catttttgaa 660
aatgccatgg aagcaaccat tcctaataca agacggaaat ttaagtttcg agcaatactg 720
ggattcataa gatataatca aaagggggtt ttcaattcaa ttggatccca atatattgtt 780
aaaccattta ttgataatga aatccggaat aaaattgaaa ataaaggttc tgatttggca 840
ttcttattaa cagtgattga tttaaccaat gaatattggc aaactgacaa ggggaagcga 900
gaaattcaag atttagaatc ggaattacaa tcaattatga gtataaatca tagtaatata 960
ttaaaattaa ttggatttca aatagataaa acaaatgttt ggagagtaag attgttaacg 1020
gaattttctc cagttagtga aacattatat gatattctcc ctactgccga atttattaat 1080
tgggcattag caagaacttg gcttattcaa ttattaccag caatggaata tcttcataat 1140
gccggattca tccataaact tatatgtccc atgaccatag ttatatttca agagaaggac 1200
caattgtatt atcaaaattc aactaatgaa ttattaagta atagtattgg tggtggtggt 1260
ggtggtgggg aagactcatt aaccatcagt gctaaaaaag tgttgaaatt atgtcatcct 1320
tcatatgggt atcgtttatt agagatgatt ctgttacatc caaatgaggg agaaacatta 1380
gatcgatctc cacaagtaaa tccaccagca tggttagcac cagaattgaa aacttctggg 1440
tatcattaca aatctgatat ttgggattta ggagtacttt tcttaagagt aatgttagga 1500
tttgatattt taaacaccac ataccataca cctagtgatt ttataaataa attttccgtt 1560
aaagattttg ttggagcaga agaatatgct tcattagtgt atgatgtatt atcgaaaatg 1620
ttacaagtta aattatcaaa acgaccatct cctttggaat taaatgccgt aaaattttta 1680
cgagatggtc ccataatttc aaaattacaa tcggaaacta acttatcacg aatgaaaaaa 1740
aatgtcgaaa ctgatttggt atcatcaacc aatacaagac atgttcaaat acaaggacat 1800
gaacaggatt cgactgcaac aacaaaacat ttgaatattt atcatcaaaa tatttcacgc 1860
agacggttat ctaaccagaa tactcaacat ccatattttg gtgaaaattc tagtcttatc 1920
atgccttcag ggtcacaacg aaatatgggg agatacgcca gagattttga agaaattggg 1980
aaattgggtc gtggtggatt tggtgaagtt gttaaagcta gaagtagaat ggaagggata 2040
ttttatgctg tgaaaaaaat taaacatcga gctgataaat tggattcttt attaagtgaa 2100
gttttatctt tagctagatt gaaccatcaa tatattgttc gttattatgg tacttgggtt 2160
gaagaattag aagatacatc tgcgattcca tccaatagca catctgctat tgcgagcgat 2220
gacgaagagg aggaagagga ggaagatgac acagaaggcg actttggtga tgatgatctt 2280
gaactgacat tttcaagtcg tgttggtcgt tcatcatctg tgttacctag ttatgataac 2340
tcatttcaag tcgattacat ttcaacatct tttgacccta ggatagaatt tgatgaaagt 2400
tcagaagaag atgaccaaaa tgaagatgat gatccgtttg tgtttgccaa ttcaactgat 2460
gatatctcaa ataatgaaac agaagatcgt tccaaaagtg attcgaaaga agtttctgtt 2520
aaaaaaccaa aagatgttgt taactcctct aaaaatgcat caccgaaatc aatattatat 2580
atacaaatgg agttttgtga aaataatacc cttctcaatc ttattgaaca aggattacct 2640
aataaccctg atgaatattg gagacttttc cgacaattac ttgaagcagt ttcatatatt 2700
catcgtgaag gatttattca tcgtgattta aaaccaatga atattttcat tgatagatcc 2760
aataatatta aagttgggga tttcggatta gctaaaaatt cacaattttc ttcagttgtt 2820
ctgacgaata atcaagtgga agctaaagat aatgaattat ctaccgtggt gggaacatta 2880
ttttatactg ccaatgaagt ggccacgggt caatacgatg aaaaagttga tatgtattca 2940
cttggaataa ttttctttga aatgtgttat cctcttgcca cgggtatgca aagagctaaa 3000
acattaaatg atttacgatt gaaatcagtt gaattcccta caaatttcat tgctagtaaa 3060
tataaaactg aaaaaaaaat tattcgatta ttattagatc atgatcctaa aattcgtcct 3120
agtgcagcac aacttttaca aagtggttgg ttacccgttg aacatcaaga tcaagttatt 3180
caagaagcat taaaatcttt agctgatcca gcatctcctt ggcaacaaca agttcgtgaa 3240
gcattgttca atcaaccgta tctgcttgct aaagatttaa tgtttgataa acaaaatgaa 3300
cataattccc ataataagca tgttgaattg gatacttcga atgattattt attatttgat 3360
aaaatcatga aagaattgac caagattttc actaatcatg gagccattga gaatttaaat 3420
acaaatttag ttttaccaaa ggcaccttca caatcaagag aattagttta tgattttttg 3480
gatagaagtg gtgcagtttt aactttacct tatgatttga ctttaccaac agcaagattt 3540
ttaagtaaaa ccgatatgac aattcctaaa acttttcgac acgaatttgt ctatcgacct 3600
aatgttcgag gtattggtat acctgatcgt tatagtgccg ttaattttga tatagccggt 3660
ggactggaag ttaacaaggc aacacttttc gctcatgatg ctgaatgttt aaaagtgatt 3720
gatgaaattg tcaatacttt accatgtttt aaaaatacca ttattgttat taatcattat 3780
gatattttgg atgctgttgt ttcattttct tttggtaata ttggaattga tgataagaaa 3840
aaattagata tttttggagt attatcacaa ttgggaattg ataaatcacc cgatgaaata 3900
aaacgttact tgagggaaga ttttcaagta ccacatactg ttactaaaga tcttgttgaa 3960
aatttcaatt ttacatgtga agtggaacgg gcaagacaaa aattacaaaa attaatggtt 4020
gattctcccc cattattaaa agttgaacga gcatatactt atttaattga agtggttaaa 4080
attttgaaac acacgaatat taaaacatca atgattttca atccattgag taattataat 4140
agtaaatatt atatccatgg aataatgttt caagcagttt ttaaacctga tagatccaaa 4200
cgttatacta gagtagttac tggtggacga tatgattcat taattgaatc tttttcaaat 4260
gtcaccacaa caactaaaca aatcactcct catggtgttg gattttcatt gactactagt 4320
ttacttttca ttcttatgaa aacattaatt tctcgaggga aatctaaatt ggatcttgta 4380
aataaatgga agggcaatcg atgtaaagta cttataagtt ctactcaaca acaattttta 4440
agtcaagtgg gatatcaatt agtttctaaa ttttggaata aaaacataag tgctgatata 4500
acatcagttg cagcaaagac tcaagatgaa atattccaaa atggtaattc agaaggggct 4560
atatggatag ttataatacg actgttacct acaacaattg ggaattcatt ctcatctttg 4620
aatggtggta gtggtggtag tagtagtagt actactacta ctagcactag cattagaaga 4680
agtaaaaaat ctggatctgg atttaaacct ttgaaattga gaaatataat tactggtaaa 4740
gatattgatt tagattatga tgaagtgata gattatttgg tgactgaatt attagaagat 4800
tcagaacatg aagaaaatga tcaagataat ggtacgatga caaactcaac aacattactt 4860
acatcatcat cattatcttc taaaacaaat caagaagaag aattattaaa tggaccaatt 4920
gattcagttg aaattgatca aaaaatcatt gttgttaaaa atgatgctcc tcgtagtagg 4980
aaaaataaac gagataaatg ggaatcagaa aatgatgcta aattagctgg acaacaatgt 5040
ataaaaaatt taagtggtgg acctgttgtt gttattgatg ctagagatga aatattagat 5100
atgattagta ttacttcaat tcatcaacaa gatgaatgga ttagaaaagt ggtttataca 5160
actaataatt tcccaaaaag ttttgctatg aatatttata atactttgat taaagaattt 5220
aataaaggtt caatttggtg tattttggtg tcttcaagaa ctcaacatac aactattgtt 5280
gatctacgtc gataa 5295
<210> 70
<211> 1764
<212> PRT
<213> Candida albicans
<400> 70
Met Pro Glu Thr Ser Ile Thr Ser Asp Leu Glu His Arg Gln Gln Asp
1 5 10 15
Glu Ile Ser Ser Ile Ser Ser Ile Tyr Gly Asp Ile Phe Lys Asp Ile
20 25 30
Thr Pro Thr Gly Leu Val Trp Asn Lys Lys Pro Ser Pro His Phe Gln
35 40 45
Val Phe Leu Ser Ser Ser Asn Asn Pro Asp Arg Pro Thr Val Ser Ile
50 55 60
Thr Leu Asp Ile Glu Phe Thr Pro Thr Tyr Pro Leu Ser Pro Pro Lys
65 70 75 80
Val Lys Leu Leu Asn Ala Arg Asn Leu Leu Lys Ile Asn Ile Ala Lys
85 90 95
Leu Glu Lys Lys Cys Lys Asp Leu Ile Lys Glu Tyr Pro Glu Gln Glu
100 105 110
Val Ser Phe Thr Ile Ile Ser Glu Leu Ile Phe Met Leu Asp Glu Ile
115 120 125
Gln Thr Thr Thr Glu Lys Val Leu Ser Leu Glu Glu Glu Arg Glu Leu
130 135 140
Arg Leu Arg Asn Glu Arg Arg Ala Leu Glu Glu Lys Glu Ala Lys Gln
145 150 155 160
Lys Lys Asp Glu Glu Leu Ala Arg Lys Lys Gln Asn Lys Glu Leu Asn
165 170 175
Glu Gln Ile Gln Lys Ile Gln Gly Glu Phe Asp Asp Asp Phe Thr Asp
180 185 190
Asp Gln Asp Leu Asp Met Ser Thr Thr Asn Asp Asn Asn Asn Ser Leu
195 200 205
Ile Pro Leu Asp Lys Asp Gln Phe Phe Ile Phe Glu Asn Ala Met Glu
210 215 220
Ala Thr Ile Pro Asn Thr Arg Arg Lys Phe Lys Phe Arg Ala Ile Ser
225 230 235 240
Gly Phe Ile Arg Tyr Asn Gln Lys Gly Val Phe Asn Ser Ile Gly Ser
245 250 255
Gln Tyr Ile Val Lys Pro Phe Ile Asp Asn Glu Ile Arg Asn Lys Ile
260 265 270
Glu Asn Lys Gly Ser Asp Leu Ala Phe Leu Leu Thr Val Ile Asp Leu
275 280 285
Thr Asn Glu Tyr Trp Gln Thr Asp Lys Gly Lys Arg Glu Ile Gln Asp
290 295 300
Leu Glu Ser Glu Leu Gln Ser Ile Met Ser Ile Asn His Ser Asn Ile
305 310 315 320
Leu Lys Leu Ile Gly Phe Gln Ile Asp Lys Thr Asn Val Trp Arg Val
325 330 335
Arg Leu Leu Thr Glu Phe Ser Pro Val Ser Glu Thr Leu Tyr Asp Ile
340 345 350
Leu Pro Thr Ala Glu Phe Ile Asn Trp Ala Leu Ala Arg Thr Trp Leu
355 360 365
Ile Gln Leu Leu Pro Ala Met Glu Tyr Leu His Asn Ala Gly Phe Ile
370 375 380
His Lys Leu Ile Cys Pro Met Thr Ile Val Ile Phe Gln Glu Lys Asp
385 390 395 400
Gln Leu Tyr Tyr Gln Asn Ser Thr Asn Glu Leu Leu Ser Asn Ser Ile
405 410 415
Gly Gly Gly Gly Gly Gly Gly Glu Asp Ser Leu Thr Ile Ser Ala Lys
420 425 430
Lys Val Leu Lys Leu Cys His Pro Ser Tyr Gly Tyr Arg Leu Leu Glu
435 440 445
Met Ile Ser Leu His Pro Asn Glu Gly Glu Thr Leu Asp Arg Ser Pro
450 455 460
Gln Val Asn Pro Pro Ala Trp Leu Ala Pro Glu Leu Lys Thr Ser Gly
465 470 475 480
Tyr His Tyr Lys Ser Asp Ile Trp Asp Leu Gly Val Leu Phe Leu Arg
485 490 495
Val Met Leu Gly Phe Asp Ile Leu Asn Thr Thr Tyr His Thr Pro Ser
500 505 510
Asp Phe Ile Asn Lys Phe Ser Val Lys Asp Phe Val Gly Ala Glu Glu
515 520 525
Tyr Ala Ser Leu Val Tyr Asp Val Leu Ser Lys Met Leu Gln Val Lys
530 535 540
Leu Ser Lys Arg Pro Ser Pro Leu Glu Leu Asn Ala Val Lys Phe Leu
545 550 555 560
Arg Asp Gly Pro Ile Ile Ser Lys Leu Gln Ser Glu Thr Asn Leu Ser
565 570 575
Arg Met Lys Lys Asn Val Glu Thr Asp Leu Val Ser Ser Thr Asn Thr
580 585 590
Arg His Val Gln Ile Gln Gly His Glu Gln Asp Ser Thr Ala Thr Thr
595 600 605
Lys His Leu Asn Ile Tyr His Gln Asn Ile Ser Arg Arg Arg Leu Ser
610 615 620
Asn Gln Asn Thr Gln His Pro Tyr Phe Gly Glu Asn Ser Ser Leu Ile
625 630 635 640
Met Pro Ser Gly Ser Gln Arg Asn Met Gly Arg Tyr Ala Arg Asp Phe
645 650 655
Glu Glu Ile Gly Lys Leu Gly Arg Gly Gly Phe Gly Glu Val Val Lys
660 665 670
Ala Arg Ser Arg Met Glu Gly Ile Phe Tyr Ala Val Lys Lys Ile Lys
675 680 685
His Arg Ala Asp Lys Leu Asp Ser Leu Leu Ser Glu Val Leu Ser Leu
690 695 700
Ala Arg Leu Asn His Gln Tyr Ile Val Arg Tyr Tyr Gly Thr Trp Val
705 710 715 720
Glu Glu Leu Glu Asp Thr Ser Ala Ile Pro Ser Asn Ser Thr Ser Ala
725 730 735
Ile Ala Ser Asp Asp Glu Glu Glu Glu Glu Glu Glu Asp Asp Thr Glu
740 745 750
Gly Asp Phe Gly Asp Asp Asp Leu Glu Ser Thr Phe Ser Ser Arg Val
755 760 765
Gly Arg Ser Ser Ser Val Leu Pro Ser Tyr Asp Asn Ser Phe Gln Val
770 775 780
Asp Tyr Ile Ser Thr Ser Phe Asp Pro Arg Ile Glu Phe Asp Glu Ser
785 790 795 800
Ser Glu Glu Asp Asp Gln Asn Glu Asp Asp Asp Pro Phe Val Phe Ala
805 810 815
Asn Ser Thr Asp Asp Ile Ser Asn Asn Glu Thr Glu Asp Arg Ser Lys
820 825 830
Ser Asp Ser Lys Glu Val Ser Val Lys Lys Pro Lys Asp Val Val Asn
835 840 845
Ser Ser Lys Asn Ala Ser Pro Lys Ser Ile Leu Tyr Ile Gln Met Glu
850 855 860
Phe Cys Glu Asn Asn Thr Leu Leu Asn Leu Ile Glu Gln Gly Leu Pro
865 870 875 880
Asn Asn Pro Asp Glu Tyr Trp Arg Leu Phe Arg Gln Leu Leu Glu Ala
885 890 895
Val Ser Tyr Ile His Arg Glu Gly Phe Ile His Arg Asp Leu Lys Pro
900 905 910
Met Asn Ile Phe Ile Asp Arg Ser Asn Asn Ile Lys Val Gly Asp Phe
915 920 925
Gly Leu Ala Lys Asn Ser Gln Phe Ser Ser Val Val Ser Thr Asn Asn
930 935 940
Gln Val Glu Ala Lys Asp Asn Glu Leu Ser Thr Val Val Gly Thr Leu
945 950 955 960
Phe Tyr Thr Ala Asn Glu Val Ala Thr Gly Gln Tyr Asp Glu Lys Val
965 970 975
Asp Met Tyr Ser Leu Gly Ile Ile Phe Phe Glu Met Cys Tyr Pro Leu
980 985 990
Ala Thr Gly Met Gln Arg Ala Lys Thr Leu Asn Asp Leu Arg Leu Lys
995 1000 1005
Ser Val Glu Phe Pro Thr Asn Phe Ile Ala Ser Lys Tyr Lys Thr
1010 1015 1020
Glu Lys Lys Ile Ile Arg Leu Leu Leu Asp His Asp Pro Lys Ile
1025 1030 1035
Arg Pro Ser Ala Ala Gln Leu Leu Gln Ser Gly Trp Leu Pro Val
1040 1045 1050
Glu His Gln Asp Gln Val Ile Gln Glu Ala Leu Lys Ser Leu Ala
1055 1060 1065
Asp Pro Ala Ser Pro Trp Gln Gln Gln Val Arg Glu Ala Leu Phe
1070 1075 1080
Asn Gln Pro Tyr Ser Leu Ala Lys Asp Leu Met Phe Asp Lys Gln
1085 1090 1095
Asn Glu His Asn Ser His Asn Lys His Val Glu Leu Asp Thr Ser
1100 1105 1110
Asn Asp Tyr Leu Leu Phe Asp Lys Ile Met Lys Glu Leu Thr Lys
1115 1120 1125
Ile Phe Thr Asn His Gly Ala Ile Glu Asn Leu Asn Thr Asn Leu
1130 1135 1140
Val Leu Pro Lys Ala Pro Ser Gln Ser Arg Glu Leu Val Tyr Asp
1145 1150 1155
Phe Leu Asp Arg Ser Gly Ala Val Leu Thr Leu Pro Tyr Asp Leu
1160 1165 1170
Thr Leu Pro Thr Ala Arg Phe Leu Ser Lys Thr Asp Met Thr Ile
1175 1180 1185
Pro Lys Thr Phe Arg His Glu Phe Val Tyr Arg Pro Asn Val Arg
1190 1195 1200
Gly Ile Gly Ile Pro Asp Arg Tyr Ser Ala Val Asn Phe Asp Ile
1205 1210 1215
Ala Gly Gly Ser Glu Val Asn Lys Ala Thr Leu Phe Ala His Asp
1220 1225 1230
Ala Glu Cys Leu Lys Val Ile Asp Glu Ile Val Asn Thr Leu Pro
1235 1240 1245
Cys Phe Lys Asn Thr Ile Ile Val Ile Asn His Tyr Asp Ile Leu
1250 1255 1260
Asp Ala Val Val Ser Phe Ser Phe Gly Asn Ile Gly Ile Asp Asp
1265 1270 1275
Lys Lys Lys Leu Asp Ile Phe Gly Val Leu Ser Gln Leu Gly Ile
1280 1285 1290
Asp Lys Ser Pro Asp Glu Ile Lys Arg Tyr Leu Arg Glu Asp Phe
1295 1300 1305
Gln Val Pro His Thr Val Thr Lys Asp Leu Val Glu Asn Phe Asn
1310 1315 1320
Phe Thr Cys Glu Val Glu Arg Ala Arg Gln Lys Leu Gln Lys Leu
1325 1330 1335
Met Val Asp Ser Pro Pro Leu Leu Lys Val Glu Arg Ala Tyr Thr
1340 1345 1350
Tyr Leu Ile Glu Val Val Lys Ile Leu Lys His Thr Asn Ile Lys
1355 1360 1365
Thr Ser Met Ile Phe Asn Pro Leu Ser Asn Tyr Asn Ser Lys Tyr
1370 1375 1380
Tyr Ile His Gly Ile Met Phe Gln Ala Val Phe Lys Pro Asp Arg
1385 1390 1395
Ser Lys Arg Tyr Thr Arg Val Val Thr Gly Gly Arg Tyr Asp Ser
1400 1405 1410
Leu Ile Glu Ser Phe Ser Asn Val Thr Thr Thr Thr Lys Gln Ile
1415 1420 1425
Thr Pro His Gly Val Gly Phe Ser Leu Thr Thr Ser Leu Leu Phe
1430 1435 1440
Ile Leu Met Lys Thr Leu Ile Ser Arg Gly Lys Ser Lys Leu Asp
1445 1450 1455
Leu Val Asn Lys Trp Lys Gly Asn Arg Cys Lys Val Leu Ile Ser
1460 1465 1470
Ser Thr Gln Gln Gln Phe Leu Ser Gln Val Gly Tyr Gln Leu Val
1475 1480 1485
Ser Lys Phe Trp Asn Lys Asn Ile Ser Ala Asp Ile Thr Ser Val
1490 1495 1500
Ala Ala Lys Thr Gln Asp Glu Ile Phe Gln Asn Gly Asn Ser Glu
1505 1510 1515
Gly Ala Ile Trp Ile Val Ile Ile Arg Ser Leu Pro Thr Thr Ile
1520 1525 1530
Gly Asn Ser Phe Ser Ser Leu Asn Gly Gly Ser Gly Gly Ser Ser
1535 1540 1545
Ser Ser Thr Thr Thr Thr Ser Thr Ser Ile Arg Arg Ser Lys Lys
1550 1555 1560
Ser Gly Ser Gly Phe Lys Pro Leu Lys Leu Arg Asn Ile Ile Thr
1565 1570 1575
Gly Lys Asp Ile Asp Leu Asp Tyr Asp Glu Val Ile Asp Tyr Leu
1580 1585 1590
Val Thr Glu Leu Leu Glu Asp Ser Glu His Glu Glu Asn Asp Gln
1595 1600 1605
Asp Asn Gly Thr Met Thr Asn Ser Thr Thr Leu Leu Thr Ser Ser
1610 1615 1620
Ser Leu Ser Ser Lys Thr Asn Gln Glu Glu Glu Leu Leu Asn Gly
1625 1630 1635
Pro Ile Asp Ser Val Glu Ile Asp Gln Lys Ile Ile Val Val Lys
1640 1645 1650
Asn Asp Ala Pro Arg Ser Arg Lys Asn Lys Arg Asp Lys Trp Glu
1655 1660 1665
Ser Glu Asn Asp Ala Lys Leu Ala Gly Gln Gln Cys Ile Lys Asn
1670 1675 1680
Leu Ser Gly Gly Pro Val Val Val Ile Asp Ala Arg Asp Glu Ile
1685 1690 1695
Leu Asp Met Ile Ser Ile Thr Ser Ile His Gln Gln Asp Glu Trp
1700 1705 1710
Ile Arg Lys Val Val Tyr Thr Thr Asn Asn Phe Pro Lys Ser Phe
1715 1720 1725
Ala Met Asn Ile Tyr Asn Thr Leu Ile Lys Glu Phe Asn Lys Gly
1730 1735 1740
Ser Ile Trp Cys Ile Leu Val Ser Ser Arg Thr Gln His Thr Thr
1745 1750 1755
Ile Val Asp Leu Arg Arg
1760
<210> 71
<211> 936
<212> DNA
<213> Candida albicans
<400> 71
atggctgatt ttgacattaa ggaaacgtat cttaagtttt tagaagaaga caaagatatg 60
actatgccta tcgcggcaat tgagtcactt gtgtcaatgt taaaagcaaa gtcaccatca 120
acttcctccg aattaatcaa tttagtttcg aaaaatattg atttattaaa gtcttcaatt 180
cccaacaata tttctctttc tgctgggtgt gatttattta tgagatttgt gttgagaaac 240
actaatgtat attctgattg ggagtcattt tcacagaatc ttgttgagaa tggagaattg 300
tttgttcaac gtgctaagga atcaagactt aaactggcag aatacggtgt tccatttatc 360
aaggatgacg atgtaatatt agttcattca tattcacgtg tcgtttacag tctattgttg 420
aaggctaaac aggagaagct aattcgattc aaagttttgg ttaccgagag tagaccaaca 480
ggaaatggat actacatggc taggaaattg aaagaggcag acataccggt tgaggttatt 540
gtagataacg cagtgggata tgttttgcat aaagtagaca aaatcttggt tggtgccgaa 600
ggggtcgctg aaagtggtgg agtaataaat cacattggaa cgtatcaaat tggctgttta 660
gctaaagtca acaataagcc tttctatgtc gtgaccgagt ctcacaaatt tgtcagattg 720
tttcccttgg cacctaatga cctacctaac agcattagtc atttcgatta tgacgaaaac 780
agaaccgaag agctcaacca cagtggacaa gaacttttcg aaaccaggtt tgttgatttc 840
acacctcatg aatacattac tgctttgata acagatttgg gagtattgac tccatctgca 900
gtcagtgaag agttgataaa aatatggtac gattga 936
<210> 72
<211> 311
<212> PRT
<213> Candida albicans
<400> 72
Met Ala Asp Phe Asp Ile Lys Glu Thr Tyr Leu Lys Phe Leu Glu Glu
1 5 10 15
Asp Lys Asp Met Thr Met Pro Ile Ala Ala Ile Glu Ser Leu Val Ser
20 25 30
Met Leu Lys Ala Lys Ser Pro Ser Thr Ser Ser Glu Leu Ile Asn Leu
35 40 45
Val Ser Lys Asn Ile Asp Leu Leu Lys Ser Ser Ile Pro Asn Asn Ile
50 55 60
Ser Leu Ser Ala Gly Cys Asp Leu Phe Met Arg Phe Val Leu Arg Asn
65 70 75 80
Thr Asn Val Tyr Ser Asp Trp Glu Ser Phe Ser Gln Asn Leu Val Glu
85 90 95
Asn Gly Glu Leu Phe Val Gln Arg Ala Lys Glu Ser Arg Leu Lys Ser
100 105 110
Ala Glu Tyr Gly Val Pro Phe Ile Lys Asp Asp Asp Val Ile Leu Val
115 120 125
His Ser Tyr Ser Arg Val Val Tyr Ser Leu Leu Leu Lys Ala Lys Gln
130 135 140
Glu Lys Leu Ile Arg Phe Lys Val Leu Val Thr Glu Ser Arg Pro Thr
145 150 155 160
Gly Asn Gly Tyr Tyr Met Ala Arg Lys Leu Lys Glu Ala Asp Ile Pro
165 170 175
Val Glu Val Ile Val Asp Asn Ala Val Gly Tyr Val Leu His Lys Val
180 185 190
Asp Lys Ile Leu Val Gly Ala Glu Gly Val Ala Glu Ser Gly Gly Val
195 200 205
Ile Asn His Ile Gly Thr Tyr Gln Ile Gly Cys Leu Ala Lys Val Asn
210 215 220
Asn Lys Pro Phe Tyr Val Val Thr Glu Ser His Lys Phe Val Arg Leu
225 230 235 240
Phe Pro Leu Ala Pro Asn Asp Leu Pro Asn Ser Ile Ser His Phe Asp
245 250 255
Tyr Asp Glu Asn Arg Thr Glu Glu Leu Asn His Ser Gly Gln Glu Leu
260 265 270
Phe Glu Thr Arg Phe Val Asp Phe Thr Pro His Glu Tyr Ile Thr Ala
275 280 285
Leu Ile Thr Asp Leu Gly Val Leu Thr Pro Ser Ala Val Ser Glu Glu
290 295 300
Leu Ile Lys Ile Trp Tyr Asp
305 310
<210> 73
<211> 1350
<212> DNA
<213> Candida albicans
<400> 73
atggttgaca gaaaaagaac tgcagcaata cgtgccgagg atgatgatga agaaaatgac 60
aatgttcctt tacagaaaaa agtgaaaata gaagcaaagc agaaagaaga agaggaagat 120
ggtgataagt caggagccac ggaaaccaaa tctgaggtga aacaagaatc aaaagaagaa 180
actactcaaa aggaaaataa tgaagaggac gaggaagagg aagaagagga agatgacgaa 240
gaagccgaag aagagaagaa aagaataacc aatttcaatt ttgatggcga aatttacaca 300
ttcaaggaaa gaccttcggt aattgaagaa aaagaaggca aaatagagtt tcgtgtggtg 360
aataatgaca atagtcgaga aaacttgatt gtgctaaccg ggttaaagaa tattttccaa 420
aagcaactac ccaagatgcc tcgtgaatat atctcgcgtt tggtgtatga tcgatcacat 480
ttgtcaatgg cagttgtgag aaagccatta actgtggtag gtgggatcac ataccgtcca 540
tttaacaacc gtggatttgc cgaaattgtg ttttgtgcta tctcgtcaac tgaacaagtg 600
cgtgggtatg gtgcacattt gatgaatcat ttgaaagact atgtgagggc aacatctcca 660
atcaaatatt tcttgacgta tgcagataac tatgctattg ggtatttcaa aaagcagggt 720
ttcacgaagg aaatatcatt agataaatcg gtgtggatgg ggtacatcaa ggattacgaa 780
ggtggtacat tgatgcagtg ctcgatgtta ccgtcaatat taaggtacct tgatctgggt 840
aaaatattac ttttgcaaaa agctgctatt gaaagaaaaa tacggtctag atctaaatca 900
aaaatagtga gaccgggttt gcaagttttt aaaaccaata agaatgtgac attagacccc 960
aaagatatcc ctggattagc agaggcaggg tggctggaag aaatggataa attagcacaa 1020
aaaccgaaaa gaggaccaca ttataacttt atggttacgc tattcagtga aattcagaac 1080
cacccttctg cttggccatt tgcagtggca gtcaacaaag aagaagtacc agattattat 1140
cgagttattg aacatccaat tgatttggca acaatagaac aaaaattgga aaacaacttg 1200
tatttaaaat ttactgattt tgtggatgat ctaaaactaa tgttcaacaa ttgtcgagct 1260
tataattcgg aaaccacaac atattataaa aacgcaaata aactagaaaa gtttatgaat 1320
aataaattga aagactgtag ttttgtatag 1350
<210> 74
<211> 449
<212> PRT
<213> Candida albicans
<400> 74
Met Val Asp Arg Lys Arg Thr Ala Ala Ile Arg Ala Glu Asp Asp Asp
1 5 10 15
Glu Glu Asn Asp Asn Val Pro Leu Gln Lys Lys Val Lys Ile Glu Ala
20 25 30
Lys Gln Lys Glu Glu Glu Glu Asp Gly Asp Lys Ser Gly Ala Thr Glu
35 40 45
Thr Lys Ser Glu Val Lys Gln Glu Ser Lys Glu Glu Thr Thr Gln Lys
50 55 60
Glu Asn Asn Glu Glu Asp Glu Glu Glu Glu Glu Glu Glu Asp Asp Glu
65 70 75 80
Glu Ala Glu Glu Glu Lys Lys Arg Ile Thr Asn Phe Asn Phe Asp Gly
85 90 95
Glu Ile Tyr Thr Phe Lys Glu Arg Pro Ser Val Ile Glu Glu Lys Glu
100 105 110
Gly Lys Ile Glu Phe Arg Val Val Asn Asn Asp Asn Ser Arg Glu Asn
115 120 125
Leu Ile Val Leu Thr Gly Leu Lys Asn Ile Phe Gln Lys Gln Leu Pro
130 135 140
Lys Met Pro Arg Glu Tyr Ile Ser Arg Leu Val Tyr Asp Arg Ser His
145 150 155 160
Leu Ser Met Ala Val Val Arg Lys Pro Leu Thr Val Val Gly Gly Ile
165 170 175
Thr Tyr Arg Pro Phe Asn Asn Arg Gly Phe Ala Glu Ile Val Phe Cys
180 185 190
Ala Ile Ser Ser Thr Glu Gln Val Arg Gly Tyr Gly Ala His Leu Met
195 200 205
Asn His Leu Lys Asp Tyr Val Arg Ala Thr Ser Pro Ile Lys Tyr Phe
210 215 220
Leu Thr Tyr Ala Asp Asn Tyr Ala Ile Gly Tyr Phe Lys Lys Gln Gly
225 230 235 240
Phe Thr Lys Glu Ile Ser Leu Asp Lys Ser Val Trp Met Gly Tyr Ile
245 250 255
Lys Asp Tyr Glu Gly Gly Thr Leu Met Gln Cys Ser Met Leu Pro Ser
260 265 270
Ile Leu Arg Tyr Leu Asp Ser Gly Lys Ile Leu Leu Leu Gln Lys Ala
275 280 285
Ala Ile Glu Arg Lys Ile Arg Ser Arg Ser Lys Ser Lys Ile Val Arg
290 295 300
Pro Gly Leu Gln Val Phe Lys Thr Asn Lys Asn Val Thr Leu Asp Pro
305 310 315 320
Lys Asp Ile Pro Gly Leu Ala Glu Ala Gly Trp Ser Glu Glu Met Asp
325 330 335
Lys Leu Ala Gln Lys Pro Lys Arg Gly Pro His Tyr Asn Phe Met Val
340 345 350
Thr Leu Phe Ser Glu Ile Gln Asn His Pro Ser Ala Trp Pro Phe Ala
355 360 365
Val Ala Val Asn Lys Glu Glu Val Pro Asp Tyr Tyr Arg Val Ile Glu
370 375 380
His Pro Ile Asp Leu Ala Thr Ile Glu Gln Lys Leu Glu Asn Asn Leu
385 390 395 400
Tyr Leu Lys Phe Thr Asp Phe Val Asp Asp Leu Lys Leu Met Phe Asn
405 410 415
Asn Cys Arg Ala Tyr Asn Ser Glu Thr Thr Thr Tyr Tyr Lys Asn Ala
420 425 430
Asn Lys Leu Glu Lys Phe Met Asn Asn Lys Leu Lys Asp Cys Ser Phe
435 440 445
Val
<210> 75
<211> 1350
<212> DNA
<213> Candida albicans
<400> 75
atggttgaca gaaaaagaac tgcagcaata cgtgccgagg atgatgatga agaaaatgac 60
aatgttcctt tacagaaaaa agtgaaaata gaagcaaagc agaaagaaga agaggaagat 120
ggtgataagt caggagccac ggaaaccaaa tctgaggtga aacaagaatc aaaagaagaa 180
actactcaaa aggaaaataa tgaagaggac gaggaagagg aagaagagga agatgacgaa 240
gaagccgaag aagagaagaa aagaataacc aatttcaatt ttgatggcga aatttacaca 300
ttcaaggaaa gaccttcggt aattgaagaa aaagaaggca aaatagagtt tcgtgtggtg 360
aataatgaca atagtcgaga aaacttgatt gtgctaaccg ggttaaagaa tattttccaa 420
aagcaactac ccaagatgcc tcgtgaatat atctcgcgtt tggtgtatga tcgatcacat 480
ttgtcaatgg cagttgtgag aaagccatta actgtggtag gtgggatcac ataccgtcca 540
tttaacaacc gtggatttgc cgaaattgtg ttttgtgcta tctcgtcaac tgaacaagtg 600
cgtgggtatg gtgcacattt gatgaatcat ttgaaagact atgtgagggc aacatctcca 660
atcaaatatt tcttgacgta tgcagataac tatgctattg ggtatttcaa aaagcagggt 720
ttcacgaagg aaatatcatt agataaatcg gtgtggatgg ggtacatcaa ggattacgaa 780
ggtggtacat tgatgcagtg ctcgatgtta ccgtcaatat taaggtacct tgatctgggt 840
aaaatattac ttttgcaaaa agctgctatt gaaagaaaaa tacggtctag atctaaatca 900
aaaatagtga gaccgggttt gcaagttttt aaaaccaata agaatgtgac attagacccc 960
aaagatatcc ctggattagc agaggcaggg tggctggaag aaatggataa attagcacaa 1020
aaaccgaaaa gaggaccaca ttataacttt atggttacgc tattcagtga aattcagaac 1080
cacccttctg cttggccatt tgcagtggca gtcaacaaag aagaagtacc agattattat 1140
cgagttattg aacatccaat tgatttggca acaatagaac aaaaattgga aaacaacttg 1200
tatttaaaat ttactgattt tgtggatgat ctaaaactaa tgttcaacaa ttgtcgagct 1260
tataattcgg aaaccacaac atattataaa aacgcaaata aactagaaaa gtttatgaat 1320
aataaattga aagactgtag ttttgtatag 1350
<210> 76
<211> 672
<212> DNA
<213> Saccharomyces cerevisiae
<400> 76
agttcgagtt tatcattatc aatactgcca tttcaaagaa tacgtaaata attaatagta 60
gtgattttcc taactttatt tagtcaaaaa attagccttt taattctgct gtaacccgta 120
catgcccaaa atagggggcg ggttacacag aatatataac atcgtaggtg tctgggtgaa 180
cagtttattc ctggcatcca ctaaatataa tggagcccgc tttttaagct ggcatccaga 240
aaaaaaaaga atcccagcac caaaatattg ttttcttcac caaccatcag ttcataggtc 300
cattctctta gcgcaactac agagaacagg ggcacaaaca ggcaaaaaac gggcacaacc 360
tcaatggagt gatgcaacct gcctggagta aatgatgaca caaggcaatt gacccacgca 420
tgtatctatc tcattttctt acaccttcta ttaccttctg ctctctctga tttggaaaaa 480
gctgaaaaaa aaggttgaaa ccagttccct gaaattattc ccctacttga ctaataagta 540
tataaagacg gtaggtattg attgtaattc tgtaaatcta tttcttaaac ttcttaaatt 600
ctacttttat agttagtctt ttttttagtt ttaaaacacc aagaacttag tttcgaataa 660
acacacataa ac 672
<210> 77
<211> 270
<212> DNA
<213> Saccharomyces cerevisiae
<400> 77
gacctcgagt catgtaatta gttatgtcac gcttacattc acgccctccc cccacatccg 60
ctctaaccga aaaggaagga gttagacaac ctgaagtcta ggtccctatt tattttttta 120
tagttatgtt agtattaaga acgttattta tatttcaaat ttttcttttt tttctgtaca 180
gacgcgtgta cgcatgtaac attatactga aaaccttgct tgagaaggtt ttgggacgct 240
cgaaggcttt aatttgcggc cggtacccaa 270
<210> 78
<211> 643
<212> DNA
<213> Saccharomyces cerevisiae
<400> 78
gaaatgaata acaatactga cagtactaaa taattgccta cttggcttca catacgttgc 60
atacgtcgat atagataata atgataatga cagcaggatt atcgtaatac gtaatagttg 120
aaaatctcaa aaatgtgtgg gtcattacgt aaataatgat aggaatggga ttcttctatt 180
tttccttttt ccattctagc agccgtcggg aaaacgtggc atcctctctt tcgggctcaa 240
ttggagtcac gctgccgtga gcatcctctc tttccatatc taacaactga gcacgtaacc 300
aatggaaaag catgagctta gcgttgctcc aaaaaagtat tggatggtta ataccatttg 360
tctgttctct tctgactttg actcctcaaa aaaaaaaaat ctacaatcaa cagatcgctt 420
caattacgcc ctcacaaaaa cttttttcct tcttcttcgc ccacgttaaa ttttatccct 480
catgttgtct aacggatttc tgcacttgat ttattataaa aagacaaaga cataatactt 540
ctctatcaat ttcagttatt gttcttcctt gcgttattct tctgttcttc tttttctttt 600
gtcatatata accataacca agtaatacat attcaaatct aga 643
<210> 79
<211> 760
<212> DNA
<213> Saccharomyces cerevisiae
<400> 79
tcttttccga tttttttcta aaccgtggaa tatttcggat atccttttgt tgtttccggg 60
tgtacaatat ggacttcctc ttttctggca accaaaccca tacatcggga ttcctataat 120
accttcgttg gtctccctaa catgtaggtg gcggagggga gatatacaat agaacagata 180
ccagacaaga cataatgggc taaacaagac tacaccaatt acactgcctc attgatggtg 240
gtacataacg aactaatact gtagccctag acttgatagc catcatcata tcgaagtttc 300
actacccttt ttccatttgc catctattga agtaataata ggcgcatgca acttcttttc 360
tttttttttc ttttctctct cccccgttgt tgtctcacca tatccgcaat gacaaaaaaa 420
tgatggaaga cactaaagga aaaaattaac gacaaagaca gcaccaacag atgtcgttgt 480
tccagagctg atgaggggta tctcgaagca cacgaaactt tttccttcct tcattcacgc 540
acactactct ctaatgagca acggtatacg gccttccttc cagttacttg aatttgaaat 600
aaaaaaaagt ttgctgtctt gctatcaagt ataaatagac ctgcaattat taatcttttg 660
tttcctcgtc attgttctcg ttccctttct tccttgtttc tttttctgca caatatttca 720
agctatacca agcatacaat caactatctc atatacaatg 760
<210> 80
<211> 316
<212> DNA
<213> Saccharomyces cerevisiae
<400> 80
gagtaagcga atttcttatg atttatgatt tttattatta aataagttat aaaaaaaata 60
agtgtataca aattttaaag tgactcttag gttttaaaac gaaaattctt attcttgagt 120
aactctttcc tgtaggtcag gttgctttct caggtatagc atgaggtcgc tcttattgac 180
cacacctcta ccggcatgcc gagcaaatgc ctgcaaatcg ctccccattt cacccaattg 240
tagatatgct aactccagca atgagttgat gaatctcggt gtgtatttta tgtcctcaga 300
ggacaacacc tgtggt 316
<210> 81
<211> 753
<212> DNA
<213> Saccharomyces cerevisiae
<400> 81
gcatgcttgc atttagtcgt gcaatgtatg actttaagat ttgtgagcag gaagaaaagg 60
gagaatcttc taacgataaa cccttgaaaa actgggtaga ctacgctatg ttgagttgct 120
acgcaggctg cacaattaca cgagaatgct cccgcctagg atttaaggct aagggacgtg 180
caatgcagac gacagatcta aatgaccgtg tcggtgaagt gttcgccaaa cttttcggtt 240
aacacatgca gtgatgcacg cgcgatggtg ctaagttaca tatatatata tatagccata 300
gtgatgtcta agtaaccttt atggtatatt tcttaatgtg gaaagatact agcgcgcgca 360
cccacacaca agcttcgtct tttcttgaag aaaagaggaa gctcgctaaa tgggattcca 420
ctttccgttc cctgccagct gatggaaaaa ggttagtgga acgatgaaga ataaaaagag 480
agatccactg aggtgaaatt tcagctgaca gcgagtttca tgatcgtgat gaacaatggt 540
aacgagttgt ggctgttgcc agggagggtg gttctcaact tttaatgtat ggccaaatcg 600
ctacttgggt ttgttatata acaaagaaga aataatgaac tgattctctt cctccttctt 660
gtcctttctt aattctgttg taattacctt cctttgtaat tttttttgta attattcttc 720
ttaataatcc aaacaaacac acatattaca ata 753
<210> 82
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer N98SeqF1
<400> 82
cgtgttagtc acatcaggac 20
<210> 83
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer N98SeqF2
<400> 83
ggccatagca aaaatccaaa cagc 24
<210> 84
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer N98SeqF3
<400> 84
ccacgatcaa tcatatcgaa cacg 24
<210> 85
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer N98SeqF4
<400> 85
ggtttctgtc tctggtgacg 20
<210> 86
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer N99SeqR1
<400> 86
gtctggtgat tctacgcgca ag 22
<210> 87
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer N99SeqR2
<400> 87
catcgactgc attacgcaac tc 22
<210> 88
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer N99SeqR3
<400> 88
cgatcgtcag aacaacatct gc 22
<210> 89
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer N99SeqR4
<400> 89
ccttcagtgt tcgctgtcag 20
<210> 90
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer N136
<400> 90
ccgcggatag atctgaaatg aataacaata ctgaca 36
<210> 91
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer N137
<400> 91
taccaccgaa gttgatttgc ttcaacatcc tcagctctag atttgaatat gtattacttg 60
gttat 65
<210> 92
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer N138
<400> 92
atgttgaagc aaatcaactt cggtggta 28
<210> 93
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer N139
<400> 93
ttattggttt tctggtctca ac 22
<210> 94
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer N140
<400> 94
aagttgagac cagaaaacca ataattaatt aatcatgtaa ttagttatgt cacgctt 57
<210> 95
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer N141
<400> 95
gcggccgccc gcaaattaaa gccttcgagc 30
<210> 96
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer N142
<400> 96
ggatccgcat gcttgcattt agtcgtgc 28
<210> 97
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> N143
<400> 97
caggtaatcc cccacagtat acatcctcag ctattgtaat atgtgtgttt gtttgg 56
<210> 98
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer N144
<400> 98
atgtatactg tgggggatta cc 22
<210> 99
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer N145
<400> 99
ttagctttta ttttgctccg ca 22
<210> 100
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer N146
<400> 100
tttgcggagc aaaataaaag ctaattaatt aagagtaagc gaatttctta tgattta 57
<210> 101
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer N147
<400> 101
actagtacca caggtgttgt cctctgag 28
<210> 102
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer N151
<400> 102
ctagagagct ttcgttttca tg 22
<210> 103
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer N152
<400> 103
ctcatgaaaa cgaaagctct ctagttaatt aatcatgtaa ttagttatgt cacgctt 57
<210> 104
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer N155
<400> 104
atggcaaaga agctcaacaa gtact 25
<210> 105
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer N156
<400> 105
tcaagcatct aaaacacaac cg 22
<210> 106
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer N157
<400> 106
aacggttgtg ttttagatgc ttgattaatt aagagtaagc gaatttctta tgattta 57
<210> 107
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer N158
<400> 107
ggatcctttt ctggcaacca aacccata 28
<210> 108
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer N159
<400> 108
cgagtacttg ttgagcttct ttgccatcct cagcgagata gttgattgta tgcttg 56
<210> 109
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer N160SeqF1
<400> 109
gaaaacgtgg catcctctc 19
<210> 110
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer N160SeqF2
<400> 110
gctgactggc caagagaaa 19
<210> 111
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer N160SeqF3
<400> 111
tgtacttctc ccacggtttc 20
<210> 112
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer N160SeqF4
<400> 112
agctacccaa tctctatacc ca 22
<210> 113
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer N160SeqF5
<400> 113
cctgaagtct aggtccctat tt 22
<210> 114
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> N160SeqR1
<400> 114
gcgtgaatgt aagcgtgac 19
<210> 115
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer N160SeqR2
<400> 115
cgtcgtattg agccaagaac 20
<210> 116
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer N160SeqR3
<400> 116
gcatcggaca acaagttcat 20
<210> 117
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer N160SeqR4
<400> 117
tcgttcttga agtagtccaa ca 22
<210> 118
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer N160SeqR5
<400> 118
tgagcccgaa agagaggat 19
<210> 119
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer N161SeqF1
<400> 119
acggtatacg gccttcctt 19
<210> 120
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer N161SeqF2
<400> 120
gggtttgaaa gctatgcagt 20
<210> 121
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer N161SeqF3
<400> 121
ggtggtatgt atactgccaa ca 22
<210> 122
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer N161SeqF4
<400> 122
ggtggtaccc aatctgtgat ta 22
<210> 123
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer N161SeqF5
<400> 123
cggtttgggt aaagatgttg 20
<210> 124
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer N161SeqF6
<400> 124
aaacgaaaat tcttattctt ga 22
<210> 125
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer N161SeqR1
<400> 125
tcgttttaaa acctaagagt ca 22
<210> 126
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer N161SeqR2
<400> 126
ccaaaccgta acccatcag 19
<210> 127
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer N161SeqR3
<400> 127
cacagattgg gtaccacca 19
<210> 128
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer N161Seqr4
<400> 128
accacaagaa ccaggacctg 20
<210> 129
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer N161SeqR5
<400> 129
catagctttc aaacccgct 19
<210> 130
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer N161SeqR6
<400> 130
cgtataccgt tgctcattag ag 22
<210> 131
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer N162
<400> 131
atgttgacaa aagcaacaaa aga 23
<210> 132
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer N189
<400> 132
atccgcggat agatctagtt cgagtttatc attatcaa 38
<210> 133
<211> 53
<212> DNA
<213> Artificial Sequemce
<220>
<223> Primer N190.1
<400> 133
ttcttttgtt gcttttgtca acatcctcag cgtttatgtg tgtttattcg aaa 53
<210> 134
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer N176
<400> 134
atccgcggat agatctatta gaagccgccg agcgggcg 38
<210> 135
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer N177
<400> 135
atcctcagct tttctccttg acgttaaagt a 31
<210> 136
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer N191
<400> 136
atccgcggat agatctccca ttaccgacat ttgggcgc 38
<210> 137
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer N192
<400> 137
atcctcagcg atgattgatt gattgattgt a 31
<210> 138
<211> 1474
<212> DNA
<213> artificial sequence
<220>
<223> constructed URA3 gene bounded by repeats
<400> 138
gcattgcgga ttacgtattc taatgttcag cccgcggaac gccagcaaat caccacccat 60
gcgcatgata ctgagtcttg tacacgctgg gcttccagtg tactgagagt gcaccatacc 120
acagcttttc aattcaattc atcatttttt ttttattctt ttttttgatt tcggtttctt 180
tgaaattttt ttgattcggt aatctccgaa cagaaggaag aacgaaggaa ggagcacaga 240
cttagattgg tatatatacg catatgtagt gttgaagaaa catgaaattg cccagtattc 300
ttaacccaac tgcacagaac aaaaacctgc aggaaacgaa gataaatcat gtcgaaagct 360
acatataagg aacgtgctgc tactcatcct agtcctgttg ctgccaagct atttaatatc 420
atgcacgaaa agcaaacaaa cttgtgtgct tcattggatg ttcgtaccac caaggaatta 480
ctggagttag ttgaagcatt aggtcccaaa atttgtttac taaaaacaca tgtggatatc 540
ttgactgatt tttccatgga gggcacagtt aagccgctaa aggcattatc cgccaagtac 600
aattttttac tcttcgaaga cagaaaattt gctgacattg gtaatacagt caaattgcag 660
tactctgcgg gtgtatacag aatagcagaa tgggcagaca ttacgaatgc acacggtgtg 720
gtgggcccag gtattgttag cggtttgaag caggcggcag aagaagtaac aaaggaacct 780
agaggccttt tgatgttagc agaattgtca tgcaagggct ccctatctac tggagaatat 840
actaagggta ctgttgacat tgcgaagagc gacaaagatt ttgttatcgg ctttattgct 900
caaagagaca tgggtggaag agatgaaggt tacgattggt tgattatgac acccggtgtg 960
ggtttagatg acaagggaga cgcattgggt caacagtata gaaccgtgga tgatgtggtc 1020
tctacaggat ctgacattat tattgttgga agaggactat ttgcaaaggg aagggatgct 1080
aaggtagagg gtgaacgtta cagaaaagca ggctgggaag catatttgag aagatgcggc 1140
cagcaaaact aaaaaactgt attataagta aatgcatgta tactaaactc acaaattaga 1200
gcttcaattt aattatatca gttattaccc tatgcggtgt gaaataccgc acagatgcgt 1260
aaggagaaaa taccgcatca ggaaattgta aacgttaata ttttgttaaa attcgcgtta 1320
aatttttgtt aaatcagctc attttttaac caataggccg aaatcggcaa aatcttcagc 1380
ccgcggaacg ccagcaaatc accacccatg cgcatgatac tgagtcttgt acacgctggg 1440
cttccagtga tgatacaacg agttagccaa ggtg 1474
<210> 139
<211> 75
<212> DNA
<213> artificial sequence
<220>
<223> synthetic primer
<400> 139
ctttacattg ttggaaagcc tcgttgtctt ttaagatttt ataagcattg gcattgcgga 60
ttacgtattc taatg 75
<210> 140
<211> 76
<212> DNA
<213> artificial sequence
<220>
<223> synthetic primer
<400> 140
tgaattagat gaatcagcta gcctaaatat agtatctaag acattgtata caccttggct 60
aactcgttgt atcatc 76
<210> 141
<211> 75
<212> DNA
<213> artificial sequence
<220>
<223> synthetic primer
<400> 141
ataaaaattt ccctatacta tcattaatta aatcattatt attactaaag gcattgcgga 60
ttacgtattc taatg 75
<210> 142
<211> 76
<212> DNA
<213> artificial sequence
<220>
<223> synthetic primer
<400> 142
aaattggcat aaaaaagatt aaattcttat ctaagtgaat gtatctattt caccttggct 60
aactcgttgt atcatc 76
<210> 143
<211> 25
<212> DNA
<213> artificial sequence
<220>
<223> primer binding sequence
<400> 143
gcattgcgga ttacgtattc taatg 25
<210> 144
<211> 26
<212> DNA
<213> artificial sequence
<220>
<223> primer binding sequence
<400> 144
gatgatacaa cgagttagcc aaggtg 26
<210> 145
<211> 75
<212> DNA
<213> artificial sequence
<220>
<223> direct repeat sequence
<400> 145
ttcagcccgc ggaacgccag caaatcacca cccatgcgca tgatactgag tcttgtacac 60
gctgggcttc cagtg 75
<210> 146
<211> 75
<212> DNA
<213> artificial sequence
<220>
<223> direct repeat sequence
<400> 146
ttcagcccgc ggaacgccag caaatcacca cccatgcgca tgatactgag tcttgtacac 60
gctgggcttc cagtg 75
<210> 147
<211> 200
<212> DNA
<213> artificial sequence
<220>
<223> promoter to express URA3
<400> 147
ttttttattc ttttttttga tttcggtttc tttgaaattt ttttgattcg gtaatctccg 60
aacagaagga agaacgaagg aaggagcaca gacttagatt ggtatatata cgcatatgta 120
gtgttgaaga aacatgaaat tgcccagtat tcttaaccca actgcacaga acaaaaacct 180
gcaggaaacg aagataaatc 200
<210> 148
<211> 804
<212> DNA
<213> artificial sequence
<220>
<223> coding region for URA3
<400> 148
atgtcgaaag ctacatataa ggaacgtgct gctactcatc ctagtcctgt tgctgccaag 60
ctatttaata tcatgcacga aaagcaaaca aacttgtgtg cttcattgga tgttcgtacc 120
accaaggaat tactggagtt agttgaagca ttaggtccca aaatttgttt actaaaaaca 180
catgtggata tcttgactga tttttccatg gagggcacag ttaagccgct aaaggcatta 240
tccgccaagt acaatttttt actcttcgaa gacagaaaat ttgctgacat tggtaataca 300
gtcaaattgc agtactctgc gggtgtatac agaatagcag aatgggcaga cattacgaat 360
gcacacggtg tggtgggccc aggtattgtt agcggtttga agcaggcggc agaagaagta 420
acaaaggaac ctagaggcct tttgatgtta gcagaattgt catgcaaggg ctccctatct 480
actggagaat atactaaggg tactgttgac attgcgaaga gcgacaaaga ttttgttatc 540
ggctttattg ctcaaagaga catgggtgga agagatgaag gttacgattg gttgattatg 600
acacccggtg tgggtttaga tgacaaggga gacgcattgg gtcaacagta tagaaccgtg 660
gatgatgtgg tctctacagg atctgacatt attattgttg gaagaggact atttgcaaag 720
ggaagggatg ctaaggtaga gggtgaacgt tacagaaaag caggctggga agcatatttg 780
agaagatgcg gccagcaaaa ctaa 804
Claims (13)
- 하기의 특징을 가진 재조합 효모 숙주 세포:
a) 탄소 기질을 함유하는 배지 내에서 성장할 때 부탄올을 생산하는 효모 숙주; 및
b) 아미노산 기아(amino acid starvation)에 대한 일반 제어 반응(general control response)에서 반응을 감소시키는 적어도 하나의 유전적 개질을 포함하는 효모 숙주 세포. - 제1항에 있어서, 하기의 것들로 구성된 그룹으로부터 선택된 재조합 생합성 경로를 포함하는 효모 세포:
a) 1-부탄올 생합성 경로;
b) 2-부탄올 생합성 경로; 및
c) 아이소부탄올 생합성 경로. - 제1항에 있어서, 적어도 하나의 유전적 개질이 Gcn1p, Gcn2p, Gcn3p, Gcn4p, Gcn5p, Gcn6p, Gcn7p, Gcn8p, Gcn9p 및 Gcn20p로 구성된 그룹으로부터 선택된 단백질의 생산을 감소시키는 효모 세포.
- 제3항에 있어서, 적어도 하나의 유전적 개질이 Gcn1p, Gcn2p, Gcn3p, Gcn4p, Gcn5p, Gcn6p, Gcn7p, Gcn8p, Gcn9p 및 Gcn20p로 구성된 그룹으로부터 선택된 단백질을 암호화하는 내인성 유전자 내에서의 교란(disruption)인 효모 세포.
- 제1항에 있어서, 세포가 사카로마이세스(Saccharomyces), 칸디다(Candida), 야로위아(Yarowia) 및 한세눌라(Hansenula)로 구성된 그룹으로부터 선택된 속(genus)의 구성원인 효모 세포.
- 제1항에 있어서, 세포가 Gcn1p, Gcn2p, Gcn3p, Gcn4p, Gcn5p 및 Gcn20p로 구성된 그룹으로부터 선택된 단백질을 암호화하는 내인성 유전자 내에서의 교란을 포함하는 사카로마이세스 세레비시아(Saccharomyces cerevisiae)인 효모.
- 제1항에 있어서, 세포가 Gcn1p, Gcn2p, Gcn3p 및 Gcn5p로 구성된 그룹으로부터 선택된 단백질을 암호화하는 내인성 유전자 내에서의 교란을 포함하는 야로위아 리폴리티카(Yarrowia lipolytica)인 효모.
- 제1항에 있어서, 세포가 Gcn2p, Gcn3p 및 Gcn5p로 구성된 그룹으로부터 선택된 단백질을 암호화하는 내인성 유전자 내에서의 교란을 포함하는 칸디다 알비칸스(Candida albicans)인 효모.
- 제2항에 있어서, 아이소부탄올 생합성 경로가 하기의 것들을 포함하는 재조합 효모 세포:
a) 아세토락테이트 신타제(acetolactate synthase)를 암호화하는 적어도 하나의 유전자;
b) 아세토하이드록시산 아이소머로리덕타제(acetohydroxy acid isomeroreductase)를 암호화하는 적어도 하나의 유전자 작제물;
c) 아세토하이드록시산 데하이드라타제(acetohydroxy acid dehydratase)를 암호화하는 적어도 하나의 유전자;
d) 분지쇄 케토산 데카복실라제(branched-chain keto acid decarboxylase)를 암호화하는 적어도 하나의 유전자; 및
e) 분지쇄 알코올 데하이드로게나제(branched-chain alcohol dehydrogenase)를 암호화하는 적어도 하나의 유전자. - 하기의 단계를 포함하여 재조합 효모 세포로부터 부탄올을 생산하는 방법:
(a) 1) 부탄올을 생산하며;
2) 아미노산 기아에 대한 일반 제어 반응에서 반응을 감소시키는 적어도 하나의 유전적 개질을 포함하는
재조합 효모 숙주 세포를 제공하는 단계; 및
(b) 부탄올이 생산되는 조건하에 단계 (a)의 균주를 배양하는 단계. - 제10항에 있어서, 재조합 효모 숙주 세포가 하기의 것들로 구성된 그룹으로부터 선택된 재조합 생합성 경로를 포함하는 방법:
a) 1-부탄올 생합성 경로;
b) 2-부탄올 생합성 경로; 및
c) 아이소부탄올 생합성 경로. - 제11항에 있어서, 아이소부탄올 생합성 경로가 하기의 것들을 포함하는 방법:
a) 아세토락테이트 신타제를 암호화하는 적어도 하나의 유전자;
b) 아세토하이드록시산 아이소머로리덕타제를 암호화하는 적어도 하나의 유전자;
c) 아세토하이드록시산 데하이드라타제를 암호화하는 적어도 하나의 유전자;
d) 분지쇄 케토산 데카복실라제를 암호화하는 적어도 하나의 유전자; 및
e) 분지쇄 알코올 데하이드로게나제를 암호화하는 적어도 하나의 유전자. - 제10항에 있어서, 적어도 하나의 유전적 개질이 Gcn1p, Gcn2p, Gcn3p, Gcn4p, Gcn5p, Gcn6p, Gcn7p, Gcn8p, Gcn9p 및 Gcn20p로 구성된 그룹으로부터 선택된 단백질의 생산을 감소시키는 방법.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US5228908P | 2008-05-12 | 2008-05-12 | |
US5228608P | 2008-05-12 | 2008-05-12 | |
US61/052,286 | 2008-05-12 | ||
US61/052,289 | 2008-05-12 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20110011675A true KR20110011675A (ko) | 2011-02-08 |
Family
ID=40852207
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020107027769A KR20110011675A (ko) | 2008-05-12 | 2009-05-08 | 4 탄소 알코올의 생산을 위해 개선된 효모 균주 |
Country Status (10)
Country | Link |
---|---|
US (2) | US8389252B2 (ko) |
EP (1) | EP2276837A1 (ko) |
KR (1) | KR20110011675A (ko) |
AU (1) | AU2009246622B2 (ko) |
BR (1) | BRPI0907704A2 (ko) |
CA (1) | CA2724304A1 (ko) |
MX (1) | MX2010012191A (ko) |
NZ (1) | NZ588170A (ko) |
WO (1) | WO2009140159A1 (ko) |
ZA (1) | ZA201006984B (ko) |
Families Citing this family (45)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8945899B2 (en) | 2007-12-20 | 2015-02-03 | Butamax Advanced Biofuels Llc | Ketol-acid reductoisomerase using NADH |
ES2426070T3 (es) | 2007-04-18 | 2013-10-21 | Butamax (Tm) Advanced Biofuels Llc | Producción fermentativa de isobutanol utilizando enzimas cetol-ácido reductoisomerasas muy activas |
US8188250B2 (en) * | 2008-04-28 | 2012-05-29 | Butamax(Tm) Advanced Biofuels Llc | Butanol dehydrogenase enzyme from the bacterium Achromobacter xylosoxidans |
US8906666B2 (en) | 2008-05-22 | 2014-12-09 | Butamax Advanced Biofuels Llc | Engineering resistance to aliphatic alcohols |
BRPI0913552B1 (pt) | 2008-09-29 | 2020-09-29 | Butamax Advanced Biofuels Llc | Método para produção de isobutanol e método para conversão de 2,3-dihidroxi isovalerato |
EP2449120A4 (en) | 2009-04-01 | 2013-11-20 | Xylofuel Llc | PROCESS FOR PRODUCING ORGANIC COMPOUNDS FROM SYNTHETIC GASES |
EP2519628A2 (en) | 2009-12-29 | 2012-11-07 | Butamax (TM) Advanced Biofuels LLC | Alcohol dehydrogenases (adh) useful for fermentive production of lower alkyl alcohols |
MX2012008738A (es) * | 2010-01-29 | 2012-08-31 | Genomatica Inc | Microorganismos y metodos para la biosintesis de p-toluato y tereftalato. |
KR20130027063A (ko) | 2010-02-17 | 2013-03-14 | 부타맥스 어드밴스드 바이오퓨얼스 엘엘씨 | Fe-s 클러스터 요구성 단백질의 활성 향상 |
WO2012033832A2 (en) | 2010-09-07 | 2012-03-15 | Butamax(Tm) Advanced Biofuels Llc | Integration of a polynucleotide encoding a polypeptide that catalyzes pyruvate to acetolactate conversion |
AU2012230737B2 (en) | 2011-03-24 | 2017-02-23 | Butamax (Tm) Advanced Biofuels Llc | Host cells and methods for production of isobutanol |
MY161761A (en) * | 2011-06-17 | 2017-05-15 | Invista Tech Sarl | Methods of making nylon intermediates from glycerol |
JP6058650B2 (ja) | 2011-06-17 | 2017-01-11 | インビスタ テクノロジーズ エス.アー.エール.エル. | 廃棄流中のモノマー含有量を増大させるためのヒドロラーゼの使用 |
CN104011216A (zh) | 2011-06-30 | 2014-08-27 | 英威达技术有限责任公司 | 用于生产尼龙-7、尼龙-7,7和聚酯的生物转化工艺 |
AU2012286640B2 (en) | 2011-07-28 | 2016-09-01 | Butamax Advanced Biofuels Llc | Keto-isovalerate decarboxylase enzymes and methods of use thereof |
US9102960B2 (en) | 2011-12-16 | 2015-08-11 | Invista North America S.á.r.l. | Methods of producing 6-carbon chemicals via CoA-dependent carbon chain elongation associated with carbon storage |
US9102958B2 (en) | 2011-12-16 | 2015-08-11 | Invista North America S.á.r.l. | Methods of producing 6-carbon chemicals via CoA-dependent carbon chain elongation associated with carbon storage |
EP2798072A2 (en) | 2011-12-30 | 2014-11-05 | Butamax Advanced Biofuels LLC | Fermentative production of alcohols |
US9689004B2 (en) | 2012-03-23 | 2017-06-27 | Butamax Advanced Biofuels Llc | Acetate supplemention of medium for butanologens |
CA2873109A1 (en) | 2012-05-11 | 2013-11-28 | Butamax Advanced Biofuels Llc | Ketol-acid reductoisomerase enzymes and methods of use |
WO2014031831A1 (en) | 2012-08-22 | 2014-02-27 | Butamax Advanced Biofuels Llc | Production of fermentation products |
WO2014047421A1 (en) | 2012-09-21 | 2014-03-27 | Butamax(Tm) Advanced Biofuels Llc | Production of renewable hydrocarbon compositions |
EP2900811B1 (en) | 2012-09-26 | 2018-12-19 | Butamax Advanced Biofuels LLC | Polypeptides with ketol-acid reductoisomerase activity |
US9273330B2 (en) | 2012-10-03 | 2016-03-01 | Butamax Advanced Biofuels Llc | Butanol tolerance in microorganisms |
BR112015013413A2 (pt) | 2012-12-14 | 2017-11-14 | Invista Tech Sarl | método para biosintetizar um produto e hospedeiro recombinante |
WO2014106107A2 (en) | 2012-12-28 | 2014-07-03 | Butamax (Tm) Advanced Biofuels Llc | Dhad variants for butanol production |
CN105026569A (zh) | 2012-12-31 | 2015-11-04 | 英威达技术有限责任公司 | 通过丙酮酸和琥珀酸半醛羟醛缩合生产7-碳化学物的方法 |
CN105408487A (zh) | 2012-12-31 | 2016-03-16 | 英威达技术有限责任公司 | 通过甲酯保护的碳链延伸生产7碳化学物的方法 |
US9580733B2 (en) | 2012-12-31 | 2017-02-28 | Invista North America S.A.R.L. | Methods of producing 6-carbon chemicals via methyl-ester shielded carbon chain elongation |
US9637764B2 (en) | 2012-12-31 | 2017-05-02 | Invista North America S.A.R.L. | Methods of producing 7-carbon chemicals via carbon chain elongation associated with cyclohexane carboxylate synthesis |
EP2938732A1 (en) | 2012-12-31 | 2015-11-04 | Invista Technologies S.à.r.l. | Methods of producing 7-carbon chemicals from long chain fatty acids via oxidative cleavage |
WO2014105796A2 (en) | 2012-12-31 | 2014-07-03 | Invista North America S.A.R.L. | Methods of producing 7-carbon chemicals via aromatic compounds |
US9580731B2 (en) | 2012-12-31 | 2017-02-28 | Invista North America S.A.R.L. | Methods of producing 7-carbon chemicals via c1 carbon chain elongation associated with coenzyme B synthesis |
AU2014236545B2 (en) | 2013-03-14 | 2018-03-01 | Agrivida, Inc. | Use of dimerization domains for temperature regulation of enzyme activity |
AU2014244216A1 (en) | 2013-03-14 | 2015-09-24 | E.I. Du Pont De Nemours And Company | Glycerol 3- phosphate dehydrogenase for butanol production |
WO2014151190A1 (en) | 2013-03-15 | 2014-09-25 | Butamax Advanced Biofuels Llc | Dhad variants and methods of screening |
WO2014144210A2 (en) | 2013-03-15 | 2014-09-18 | Butamax Advanced Biofuels Llc | Competitive growth and/or production advantage for butanologen microorganism |
US9663759B2 (en) | 2013-07-03 | 2017-05-30 | Butamax Advanced Biofuels Llc | Partial adaptation for butanol production |
BR112016026461A2 (pt) | 2014-05-15 | 2017-12-12 | Invista Tech Sarl | métodos de produção de produtos químicos com 6 carbonos com uso de 2,6-diaminopimelato como precursor para 2-aminopimelato |
CN106795537A (zh) | 2014-06-16 | 2017-05-31 | 英威达技术有限责任公司 | 用于生物合成化合物的方法、试剂和细胞 |
BR112016029471A2 (pt) | 2014-06-16 | 2017-10-24 | Invista Tech Sarl | método para biosintetizar éster de metil glutarato em um hospedeiro recombinante, método para preparar glutarato, célula hospedeira recombinante, hospedeiro recombinante, produto bioderivado, produto de base biológica ou produto derivado de fermentação e método para aumentar a atividade de um polipeptídeo tendo atividade carboxilato reductase sobre um ácido dicarboxílico c4-c8 substituído ou não-substituído |
BR112016029375A2 (pt) | 2014-06-16 | 2017-10-17 | Invista Tech Sarl | métodos, reagentes e células para biossintetizar compostos |
CN106795530A (zh) | 2014-06-16 | 2017-05-31 | 英威达技术有限责任公司 | 用于生物合成化合物的方法、试剂和细胞 |
WO2016025425A1 (en) | 2014-08-11 | 2016-02-18 | Butamax Advanced Biofuels Llc | Yeast preparations and methods of making the same |
WO2021062082A1 (en) * | 2019-09-25 | 2021-04-01 | The Trustees Of Princeton University | System and method for increased alcohol tolerance and production in yeast |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5192673A (en) * | 1990-04-30 | 1993-03-09 | Michigan Biotechnology Institute | Mutant strain of C. acetobutylicum and process for making butanol |
CA2289968C (en) * | 1997-05-14 | 2004-01-06 | The Board Of Trustees Of The University Of Illinois | A method of producing butanol using a mutant strain of clostridium beijerinckii |
US6960465B1 (en) * | 2001-06-27 | 2005-11-01 | Northwestern University | Increased cell resistance to toxic organic substances |
TWI221341B (en) * | 2003-09-18 | 2004-09-21 | Ind Tech Res Inst | Method and material for forming active layer of thin film transistor |
US9297028B2 (en) * | 2005-09-29 | 2016-03-29 | Butamax Advanced Biofuels Llc | Fermentive production of four carbon alcohols |
JP5276986B2 (ja) * | 2005-10-26 | 2013-08-28 | ビュータマックス・アドバンスド・バイオフューエルズ・エルエルシー | 四炭素アルコールの発酵性生産 |
US8962298B2 (en) * | 2006-05-02 | 2015-02-24 | Butamax Advanced Biofuels Llc | Recombinant host cell comprising a diol dehydratase |
US8828704B2 (en) | 2006-05-02 | 2014-09-09 | Butamax Advanced Biofuels Llc | Fermentive production of four carbon alcohols |
US7659104B2 (en) * | 2006-05-05 | 2010-02-09 | E.I. Du Pont De Nemours And Company | Solvent tolerant microorganisms and methods of isolation |
US7541173B2 (en) * | 2006-06-15 | 2009-06-02 | E.I. Du Pont De Nemours And Company | Solvent tolerant microorganisms and methods of isolation |
US8017364B2 (en) * | 2006-12-12 | 2011-09-13 | Butamax(Tm) Advanced Biofuels Llc | Solvent tolerant microorganisms |
WO2009076480A2 (en) * | 2007-12-10 | 2009-06-18 | Synthetic Genomics, Inc. | Methylbutanol as an advanced biofuel |
US8518678B2 (en) * | 2007-12-21 | 2013-08-27 | Butamax(Tm) Advanced Biofuels Llc | Strain comprising increased expression of a CFA coding region for butanol production |
US8372612B2 (en) * | 2007-12-21 | 2013-02-12 | Butamax(Tm) Advanced Biofuels Llc | Production of four carbon alcohols using improved strain |
US20090162911A1 (en) * | 2007-12-21 | 2009-06-25 | E.I. Du Pont De Nemours And Company | Strain for butanol production |
-
2009
- 2009-05-05 US US12/435,530 patent/US8389252B2/en active Active
- 2009-05-08 MX MX2010012191A patent/MX2010012191A/es active IP Right Grant
- 2009-05-08 KR KR1020107027769A patent/KR20110011675A/ko not_active Application Discontinuation
- 2009-05-08 CA CA2724304A patent/CA2724304A1/en not_active Abandoned
- 2009-05-08 WO PCT/US2009/043275 patent/WO2009140159A1/en active Application Filing
- 2009-05-08 AU AU2009246622A patent/AU2009246622B2/en not_active Ceased
- 2009-05-08 NZ NZ588170A patent/NZ588170A/xx not_active IP Right Cessation
- 2009-05-08 EP EP09747244A patent/EP2276837A1/en not_active Withdrawn
- 2009-05-08 BR BRPI0907704A patent/BRPI0907704A2/pt not_active IP Right Cessation
-
2010
- 2010-09-30 ZA ZA2010/06984A patent/ZA201006984B/en unknown
-
2013
- 2013-02-01 US US13/756,841 patent/US8940511B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US8389252B2 (en) | 2013-03-05 |
NZ588170A (en) | 2012-11-30 |
AU2009246622B2 (en) | 2014-12-04 |
MX2010012191A (es) | 2010-12-01 |
BRPI0907704A2 (pt) | 2018-08-07 |
US20130130342A1 (en) | 2013-05-23 |
CA2724304A1 (en) | 2009-11-19 |
US20090280546A1 (en) | 2009-11-12 |
ZA201006984B (en) | 2013-01-30 |
WO2009140159A1 (en) | 2009-11-19 |
EP2276837A1 (en) | 2011-01-26 |
AU2009246622A1 (en) | 2009-11-19 |
US8940511B2 (en) | 2015-01-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20110011675A (ko) | 4 탄소 알코올의 생산을 위해 개선된 효모 균주 | |
US8795992B2 (en) | Yeast with increased butanol tolerance involving cell wall integrity pathway | |
US8455225B2 (en) | Yeast with increased butanol tolerance involving high osmolarity/glycerol response pathway | |
JP5804946B2 (ja) | 酵母における異種性Fe−S酵素活性の増大 | |
US9388392B2 (en) | Ketol-acid reductoisomerase enzymes and methods of use | |
US9404117B2 (en) | Increased production of isobutanol in yeast with reduced mitochondrial amino acid biosynthesis | |
US8557562B2 (en) | Yeast with increased butanol tolerance involving filamentous growth response | |
JP6407869B2 (ja) | ケトール酸レダクトイソメラーゼ活性を有するポリペプチド | |
US9273330B2 (en) | Butanol tolerance in microorganisms | |
US9580705B2 (en) | DHAD variants and methods of screening | |
US20140186911A1 (en) | Recombinant host cells and methods for producing butanol | |
KR20130027551A (ko) | 부탄올 생산을 위한 효모 생산 배양물 | |
US20160138050A1 (en) | Yeast with increased butanol tolerance involving cell wall proteins |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application |