KR20210019496A - 미생물, 및 정밀 화학물질의 생산 - Google Patents
미생물, 및 정밀 화학물질의 생산 Download PDFInfo
- Publication number
- KR20210019496A KR20210019496A KR1020217000327A KR20217000327A KR20210019496A KR 20210019496 A KR20210019496 A KR 20210019496A KR 1020217000327 A KR1020217000327 A KR 1020217000327A KR 20217000327 A KR20217000327 A KR 20217000327A KR 20210019496 A KR20210019496 A KR 20210019496A
- Authority
- KR
- South Korea
- Prior art keywords
- seq
- production
- gene
- microorganism
- itaconic acid
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/93—Ligases (6)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/37—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
- C07K14/39—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from yeasts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/88—Lyases (4.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/90—Isomerases (5.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/40—Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
- C12P7/44—Polycarboxylic acids
- C12P7/46—Dicarboxylic acids having four or less carbon atoms, e.g. fumaric acid, maleic acid
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y401/00—Carbon-carbon lyases (4.1)
- C12Y401/01—Carboxy-lyases (4.1.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y503/00—Intramolecular oxidoreductases (5.3)
- C12Y503/03—Intramolecular oxidoreductases (5.3) transposing C=C bonds (5.3.3)
- C12Y503/03007—Aconitate DELTA-isomerase (5.3.3.7)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y602/00—Ligases forming carbon-sulfur bonds (6.2)
- C12Y602/01—Acid-Thiol Ligases (6.2.1)
- C12Y602/01001—Acetate-CoA ligase (6.2.1.1)
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Mycology (AREA)
- Medicinal Chemistry (AREA)
- Biophysics (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
본 발명은 정밀 화학물질, 특히 이타코네이트 또는 이타콘산의 발효적 생산에 관한 것이다. 본 발명은 생산 미생물, 발효 조성물 및 배지, 상기 산물의 생산에 유용한 단백질, 및 이러한 단백질의 발현을 위한 핵산, 및 정밀 화학물질의 생산 방법에 관한 것이다.
Description
본 발명은 정밀 화학물질, 특히 이타코네이트 또는 이타콘산의 발효적 생산에 관한 것이다. 본 발명은 생산 미생물, 발효 조성물 및 배지, 상기 산물의 생산에 유용한 단백질, 및 이러한 단백질의 발현을 위한 핵산, 및 정밀 화학물질의 생산 방법에 관한 것이다.
메틸렌숙신산, 메틸렌 부탄디오산, 프로필렌디카르복실산 또는 2-프로펜-1,2-디카르복실산으로도 불리는 이타콘산은 다양한 산물, 예를 들어 아크릴 섬유 및 고무에 대한 필수 전구체이거나, 또는 예를 들어 부직 섬유, 종이 및 콘크리트 페인트에서 결합제 및 사이징제로서 사용된다. 이타콘산 에스테르는 추가의 원자재 및 특수 화학물질을 위한 중간체로서 사용될 수 있다. 지금까지 이타콘산의 생산을 위해 산업적으로 이용된 주요 생산 미생물은 사상균인 아스퍼길루스 테레우스(Aspergillus terreus) (에이. 테레우스(A. terreus))이다. 에이. 테레우스에서 높은 역가의 이타콘산이 달성되었지만, 유기체는 이타콘산 생산에 최적인 배지에서 불량한 성장을 나타내고, 전단 응력에 의해 불리한 영향을 받아서, 통상적인 교반-탱크 생물반응기에서의 발효를 불가능하게 한다. 에이. 테레우스를 유전적으로 최적화하려는 시도는 기껏해야 결정적이지 않은 결과를 제공하였다 (예를 들어 WO2016069849 참고).
야로위아 리폴리티카(Yarrowia lipolytica) (WO2016069849), 에스케리키아 콜라이(Escherichia coli) (US2010285546), 사카로마이세스 세레비지아에(Saccharomyces cerevisiae) (WO2015181312)를 비롯하여 이타콘산 생산을 위해 수많은 대안적인 미생물을 시험하였다. [Geiser et al. (Fungal Biology and Biotechnology 2014, 1:2)]에서는 다양한 우스틸라기노마이세테스(Ustilaginomycetes)를 이타콘산 생산을 위해 시험하였고, 대부분의 시험한 미생물은 또한 말레이트와 같은 부산물을 훨씬 더 많은 양으로 생산하여, 이타콘산의 예상된 생산 수율을 감소시키는 것으로 확인되었다. 이타콘산 생산 과정이 크렙스(Krebs) 사이클에 의존하는 것으로 믿어지기 때문에, 부산물로서 말레이트의 형성은 특히 불리하며, 따라서 말레이트의 손실은 이타콘산 생산의 효율을 감소시킬 것이다. 시험한 다른 우스틸라기노마이세테스는 우스틸라고 시노돈티스(Ustilago cynodontis)와 같은 평범한 식물 병원체이며, 이는 특별한 생물학적 안전성 대비를 필요로 하여 산업상 적용가능성을 감소시킨다. 또한, 모든 생산은 산업적 규모의 발효를 위해 고가의 성분인 효모 추출물을 비롯한 복합 배지에 의존하였다. WO2009106627A2는 슈도지마(Pseudozyma), 칸디다(Candida) 및 토룰롭시스(Torulopsis) 속의 효모를 사용하여 이타콘산을 생산하는 생산 방법을 기재한다. 그러나, 이 문헌은 허용될 수 없을 정도로 낮은 생산율 (0.25 g/(l h)) 및 수율 (37.5% w/w 이타콘산:글루코스)을 보고한다. 마찬가지로, 문헌 WO2016103140은 무엇보다도 분류학상 우스틸라기노마이세테스 강의 다양한 구성원에 의한 이타코네이트의 생산을 기재한다. 상기 문헌은 거의 7일 배양 후에 수득된 이타코네이트의 농도가 항상 10 g/l보다 훨씬 낮았고, 시험한 대부분의 균주의 경우 이타코네이트 생산이 수득될 수 없었거나 또는 말레이트와 같은 유의한 부산물이 수득되었음을 보고한다 (도 13).
따라서, 산업적 규모의 이타콘산 생산의 개선된 공정, 및 이러한 개선된 공정에 필요한 물질, 예를 들어 생산 미생물, 상기 생산 미생물에 의해 발현된 단백질, 및 이러한 단백질 발현을 위한 핵산, 및 이타콘산 생산에 대해 최적화된 배지를 포함하는 발효 조성물, 및 각각의 이타콘산 생산 숙주에 대한 필요성이 남아있다.
따라서, 본 발명은 이타콘산 생산 숙주 미생물로서, 여기서 미생물은 ip 로커스의 외부에서 미생물의 게놈에 통합된 적어도 1개의 이종성 발현 카세트를 포함하며, 여기서 발현 카세트는 하기를 포함하는 것인 이타콘산 생산 숙주 미생물을 제공한다:
a) 기능성 프로모터의 작동가능한 제어 하의 이종성 RIA1 유전자, 및/또는
b) 이종성 기능성 프로모터의 작동가능한 제어 하의 RIA1 유전자.
본 발명을 기재하기 위한 추가의 방식에서, 이타콘산 생산 숙주 미생물이 제공되며, 여기서 숙주는
- RIA1 유전자의 발현을 위한 및/또는
- ADI1, MTT1 및 TAD1로 이루어진 군으로부터 선택된 적어도 2개의 유전자의 발현을 위한
발현 카세트를 포함하는 재조합 미생물이고,
여기서 상기 발현 카세트는 통합 부위에서 미생물의 게놈에 통합되며, 여기서 통합 부위는
a) 좌측 경계 유전자와 우측 경계 유전자 사이에 위치하며, 여기서 좌측 및 우측 경계 유전자의 각각의 번역 개시 코돈의 각각의 제1 뉴클레오티드는 상응하는 야생형 미생물에서 최대 51600개 뉴클레오티드에 의해 분리되어 있고,
여기서 좌측 경계 유전자는 아세틸-CoA 신테타제 활성을 갖는 단백질을 코딩하고,
여기서 우측 경계 유전자는 서열식별번호(SEQ ID NO.): 25와 적어도 21% 동일성을 갖는 아미노산 서열로 이루어진 단백질을 코딩하고/거나,
b) 서열식별번호: 3, 서열식별번호: 5, 서열식별번호: 7, 서열식별번호: 9, 서열식별번호: 11, 서열식별번호: 13, 서열식별번호: 15, 서열식별번호: 17, 서열식별번호: 19, 서열식별번호: 21, 서열식별번호: 23, 서열식별번호: 25 중 임의의 것과 적어도 30% 서열 동일성을 갖는 아미노산 서열로 번역되는 오픈 리딩 프레임의 가장 가까운 경계의 51600개 이하의 뉴클레오티드에 위치하고/거나,
c) 서열식별번호: 3, 서열식별번호: 5, 서열식별번호: 7, 서열식별번호: 9, 서열식별번호: 11, 서열식별번호: 13, 서열식별번호: 15, 서열식별번호: 17, 서열식별번호: 19, 서열식별번호: 21, 서열식별번호: 23, 서열식별번호: 25 중 임의의 것과 적어도 30% 서열 동일성을 갖는 아미노산 서열로 번역되는 오픈 리딩 프레임 내에 위치하거나 또는 그를 대체한다.
본 발명의 이타콘산 생산 숙주 미생물을 기재하기 위한 추가의 방식에서, 생산 숙주는 재조합 미생물이며, 이는
a) 이타콘산 생산을 위한 활성 이타콘산 대사 경로를 포함하고,
b) 여기서
i) 단백질 서열인 서열식별번호: 3, 서열식별번호: 5, 서열식별번호: 7, 서열식별번호: 9, 서열식별번호: 11, 서열식별번호: 13, 서열식별번호: 15, 서열식별번호: 17, 서열식별번호: 19, 서열식별번호: 21, 서열식별번호: 23 또는 서열식별번호: 25 중 임의의 것과 적어도 30% 서열 동일성을 갖는 단백질을 코딩하고/거나,
ii) 적어도 낮은 엄격도 조건 하에 상기 단백질 서열을 코딩하는 핵산 서열과 혼성화하는 상보성 가닥인
적어도 1개의 유전자가 불활성화된 것이다.
추가의 실시양태에서, 본 발명은 ip 로커스의 외부에서 통합을 위해 강한 구성적으로 활성인 프로모터에 작동가능하게 연결된 RIA1 유전자를 포함하는 통합 벡터를 제공한다. 본 발명에 따라 미생물이 본 발명의 통합 벡터로 형질전환된 것인 생산 숙주 미생물이 상응하게 제공된다.
본 발명은 하기를 포함하는, 이타콘산 생산 숙주 미생물을 변경시키는 방법을 추가로 제공한다:
- RIA1 유전자의 발현을 위한 및/또는
- ADI1, MTT1 및 TAD1로 이루어진 군으로부터 선택된 적어도 2개의 유전자의 발현을 위한
적어도 1개의 발현 카세트를 ip 로커스 이외의 통합 부위에서 미생물의 게놈에 통합시키는 것.
본 발명에 따라, 하기를 포함하는, 재조합 이타콘산 생산 숙주 미생물을 수득하는 방법이 또한 제공된다:
a) 모 미생물을 배양하고,
b) 임의의 순서로 및/또는 동시에 하기를 수행하고:
- 필요한 경우: 미생물에서 활성 이타콘산 경로를 수득하기 위해 미생물에게 임의의 이종성 ADI1, MTT1 및 TAD1 유전자를 제공하기 위한 하나 이상의 형질전환,
- 구성적으로 활성인 프로모터의 제어 하의 RIA1 유전자의 적어도 하나의 통합, 여기서 통합이 ip-로커스에 있지 않음,
-
i) 단백질 서열인 서열식별번호: 3, 서열식별번호: 5, 서열식별번호: 7, 서열식별번호: 9, 서열식별번호: 11, 서열식별번호: 13, 서열식별번호: 15, 서열식별번호: 17, 서열식별번호: 19, 서열식별번호: 21, 서열식별번호: 23 또는 서열식별번호: 25 중 임의의 것과 적어도 30% 서열 동일성을 갖는 단백질을 코딩하고/거나,
ii) 적어도 낮은 엄격도 조건 하에 상기 단백질 서열을 코딩하는 핵산 서열과 혼성화하는 상보성 가닥인
적어도 1개의 유전자의 불활성화;
c) 단계 b)로부터 생성된 재조합 이타콘산 생산 숙주 미생물을 단리하는 것.
본 발명은 하기 단계를 포함하는, 이타콘산 생산을 위한 생산 방법을 또한 제공하며:
a) 이타콘산을 생산하기 위해 생산 숙주 미생물을 발효시키는 단계; 및
b) 단계 (a)에서 생산된 이타콘산을 회수하는 단계,
여기서 미생물은 본 발명에 따른 미생물이거나 또는 본 발명에 따라 수득되거나 또는 수득가능하다.
바람직하게는, 생산 방법은 회분식 발효, 유가 배양식 발효 또는 연속 발효이다. 또한 바람직하게는, 8일의 유가 배양식 발효 후에 발효 배지 내 이타콘산 대 말산의 농도 비는 적어도 15:1이다.
도 1. r2cat에 의해 생성된 신테니 플롯. 피. 츠쿠바엔시스(P. tsukubaensis) H488의 스캐폴드가 유. 마이디스(U. maydis) 521의 게놈 서열 상에 맵핑된다.
도 2. pUC-IP-URA3 플라스미드의 구축. PtURA3의 좌측 및 우측 플랭킹 영역을 각각의 제한 부위의 상보화에 의해 증폭시켰다. XbaI & BglII 및 BglII & EcoRI 소화된 단편을 XbaI & EcoRI-절단된 pUCBM21 플라스미드에 라이게이션시켰다.
도 3. PtURA3 결실 플라스미드 pUC-DK-URA3의 구축. BglII를 이용하여 pUC-IP-URA3을 선형화시켰다. 히그로마이신 선택 마커 (히그로마이신 내성 유전자 HygB, HSP70 프로모터 및 HSP70 종결자로 이루어짐)를 BamHI 소화시키고, 선형화된 pUC-IP-URA3 플라스미드에 라이게이션시켰다. 이는 BamHI 및 BglII가 상용성 점착성 단부를 생성하기 때문에 가능하였다.
도 4. LacZ-리포터 유전자 과다발현 플라스미드의 구축을 위한 클로닝 전략. 각각의 프로모터 서열 (* 각각의 유전자의 상류 영역의 대략 1,050 bp 길이의 서열) 및 LacZ 리포터 유전자의 ORF (β 갈락토시다제)를 중첩-PCR 과정에서 함께 융합시켰다. 5'-단부를 KpnI-로 상보화시키고, 3'-단부를 PstI-제한 부위로 상보화시켰다. NsiI 및 PstI 생성된 단부의 상용성으로 인해 융합 산물을 KpnI & NsiI 소화된 pPTT-플라스미드에 라이게이션시켜, 하기 LacZ 과다발현 플라스미드를 생성하였다: pPTT pActin LacZ; pPPT pGAPDH LacZ; pPPT pHSP70 LacZ; pPPT pTEF1 LacZ.
도 5. 피. 츠쿠바엔시스 H488 LacZ-형질전환체의 β-갈락토시다제 활성 [U mg-1 총 단백질]. LacZ 리포터 유전자를 pActin, pGAPDH, pHSP70, pTEF1 또는 pUmHSP70 (기준) 프로모터 각각의 제어 하에 과다발현하였다. 세포를 3 ml YPD (완전) 배지에서 2일 동안 배양하였다.
도 6. 피. 츠쿠바엔시스 H488 LacZ-형질전환체의 β-갈락토시다제 활성 [U mg-1 총 단백질]. LacZ 리포터 유전자를 pActin, pGAPDH, pHSP70, pTEF1 또는 pUmHSP70 (기준) 프로모터 각각의 제어 하에 과다발현하였다. 세포를 2 g l-1 질소 공급원 및 0.2 g l-1 포스페이트 공급원을 갖는 3 ml MG-IT 최소 배지에서 4일 동안 배양하였다.
도 7. 피. 츠쿠바엔시스 M15 LacZ-형질전환체의 β-갈락토시다제 활성 [U mg-1 총 단백질]. LacZ 리포터 유전자를 pActin, pGAPDH, pHSP70, pTEF1 또는 pUmHSP70 (기준) 프로모터 각각의 제어 하에 과다발현하였다. 세포를 3 ml YPD (완전) 배지에서 2일 동안 배양하였다.
도 8. 피. 츠쿠바엔시스 M15 LacZ-형질전환체의 β-갈락토시다제 활성 [U mg-1 총 단백질]. LacZ 리포터 유전자를 pActin, pGAPDH, pHSP70, pTEF1 또는 pUmHSP70 (기준) 프로모터 각각의 제어 하에 과다발현하였다. 세포를 2 g l-1 질소 공급원 및 0.2 g l-1 포스페이트 공급원을 갖는 3 ml MG-IT 최소 배지에서 4일 동안 배양하였다.
도 9. 피. 츠쿠바엔시스 H488에서 이타콘산의 생산을 위한 유전자 클러스터. 클러스터는 스캐폴드 19 상에 위치하였고, 이타콘산 합성에 필요한 단지 5가지 유전자로 이루어졌다: RIA1 (이타콘산의 조절인자), MTT1 (미토콘드리아 TCA 수송인자), ADI1 (아코니테이트-Δ-이소머라제), ITP1 (이타코네이트 수송 단백질), TAD1 (트랜스-아코니테이트 데카르복실라제).
도 10. 유. 마이디스와의 서열 유사성으로 인해 피. 츠쿠바엔시스에서 이타콘산 생산을 위해 제안된 경로. 시스-아코니테이트는 MTT1에 의해 미토콘드리아로부터 시토졸로 수송되며, 여기서 이는 아코니테이트-Δ-이소머라제 (ADI1)에 의해 트랜스-아코니테이트로 전환되고, 트랜스-아코니테이트 데카르복실라제 (TAD1)에 의해 최종 산물 ITA로 추가로 탈카르복실화된다. 이어서, ITA는 ITP1에 의해 세포 환경으로 분비된다. 유전자 ADI1, ITP1, MTT1 및 TAD1은 RIA1 활성에 의해 상향조절된다. 모든 유전자는 스캐폴드 19 상에 위치하는 클러스터에서 조직화된다. 시스-아코니테이트는 ITA 생산 진균 에이. 테레우스에서 시스-아코니테이트 데카르복실라제 (AtCAD1)에 의해 이타코네이트로 직접적으로 전환된다 (회색 화살표로 표시함).
도 11은 숙시네이트 데히드로게나제의 철-황 단백질 서브유닛의 단백질 서열의 다중 정렬이다. 최상단의 아미노산 서열의 철자만이 완전히 기재되고; 다른 모든 아미노산 서열의 경우에는 각각의 위치에서 상단 서열의 각각의 아미노산과 상이한 아미노산만이 주어지며, 점은 각각의 위치에서 상단 서열의 각각의 아미노산이 존재함을 나타낸다. 정렬된 단백질은 다음과 같다:
하단 서열 "SEQ048"은 슈도지마 츠쿠바엔시스의 서열식별번호: 48에 따른 서열이다.
도 12. 야생형 균주 H488 (상단)에서 영향을 받은 영역과 비교한 피. 츠쿠바엔시스 균주 HR12 (하단)에서 RIA1-과다발현 플라스미드 pPTT-pActin-RIA1의 통합의 게놈 로커스. 녹색 막대는 그 사이에서 이종성 재조합 사건이 일어나야 했던 ORF를 표시한다.
도 13. 피. 츠쿠바엔시스에서 ITA 생산을 담당하는 본래의 유전자의 과다발현을 위해 생성된 플라스미드.
도 14. 피. 츠쿠바엔시스 기준 균주 H488, M15 및 M15-CAD
도 15. 3 ml MG-IA 배지에서 10일 배양 후에 피. 츠쿠바엔시스 H488 ADI1-과다발현 형질전환체의 이타콘산 및 말산 생산.
도 16. 3 ml MG-IA 배지에서 10일 배양 후에 피. 츠쿠바엔시스 M15 ADI1-과다발현 형질전환체의 이타콘산 및 말산 생산.
도 17. 피. 츠쿠바엔시스 기준 균주 H488, M15 및 M15-CAD.
도 18. 3 ml MG-IA 배지에서 10일 배양 후에 피. 츠쿠바엔시스 H488 ITP1-과다발현 형질전환체의 이타콘산 및 말산 생산.
도 19. 3 ml MG-IA 배지에서 10일 배양 후에 피. 츠쿠바엔시스 M15 ITP1-과다발현 형질전환체의 이타콘산 및 말산 생산.
도 20. 피. 츠쿠바엔시스 기준 균주 H488, M15 및 M15-CAD.
도 21. 3 ml MG-IA 배지에서 10일 배양 후에 피. 츠쿠바엔시스 H488 MTT1-과다발현 형질전환체의 이타콘산 및 말산 생산.
도 22. 3 ml MG-IA 배지에서 10일 배양 후에 피. 츠쿠바엔시스 M15 MTT1-과다발현 형질전환체의 이타콘산 및 말산 생산.
도 23. 피. 츠쿠바엔시스 기준 균주 H488, M15 및 M15-CAD.
도 24. 3 ml MG-IA 배지에서 10일 배양 후에 피. 츠쿠바엔시스 H488 TAD1-과다발현 형질전환체의 이타콘산 및 말산 생산.
도 25. 3 ml MG-IA 배지에서 10일 배양 후에 피. 츠쿠바엔시스 M15 MTT1-과다발현 형질전환체의 이타콘산 및 말산 생산.
도 26. 피. 츠쿠바엔시스 기준 균주 H488, M15 및 M15-CAD.
도 27. 3 ml MG-IA 배지에서 10일 배양 후에 피. 츠쿠바엔시스 H488 RIA1-과다발현 형질전환체의 이타콘산 및 말산 생산.
도 28. 3 ml MG-IA 배지에서 10일 배양 후에 피. 츠쿠바엔시스 M15 RIA1-과다발현 형질전환체의 이타콘산 및 말산 생산.
도 29. 50 ml MG-IA 최소 배지 (N: 2 g l-1, P: 0.1 g l-1, C: 15 % w/v, pH-조절 없음)에서 8일 진탕 플라스크 배양 과정에 걸쳐 선택된 6가지 RIA1-과다발현 형질전환체에 대한 ITA 및 MA 생산 (g l-1) 및 성장 (OD600)의 진행.
도 30. 단독 탄소 공급원으로서 10 % (w/v) 글루코스 (기준), 수크로스, D-크실로스 또는 10 % v/v 글리세롤을 사용하여 MG-IA 최소 배지 (N: 4 g l-1, P: 1.0 g l-1)에서 피. 츠쿠바엔시스 HR12의 성장 (OD600) 패턴. 세포를 30℃ 및 220 rpm에서 7일 동안 배플형 플라스크에서 성장시켰다. 3.3 g l-1 CaCO3를 사용하여 배지를 완충시켰다.
도 31. 단독 탄소 공급원으로서 10 % (w/v) 글루코스 (기준), 수크로스, D-크실로스 또는 10 % v/v 글리세롤을 사용하여 MG-IA 최소 배지 (N: 4 g l-1, P: 1.0 g l-1)에서 피. 츠쿠바엔시스 HR12의 이타콘산 생산. 세포를 30℃ 및 220 rpm에서 7일 동안 배플형 플라스크에서 성장시켰다. 3.3 g l-1 CaCO3를 사용하여 배지를 완충시켰다.
도 32. H488과 비교하여 피. 츠쿠바엔시스 HR12에서 이타콘산 클러스터 유전자의 상대적인 전사에 대한 정량적인 실시간 PCR의 결과. OD600 = 2-3에 도달할 때까지 MG-IA 최소 배지에서 세포를 성장시켰다. 신장 인자 1 (EF1) 및 유비퀴틴 접합 효소 (UBC6)를 기준 유전자로서 사용하였다. HR12의 발현 수준을 H488 발현 수준에 대해 정규화하였다. n = 2, 오차 막대는 표준 편차를 나타낸다.
도 33. 강한 본래의 액틴 프로모터의 제어 하의 에이. 테레우스 CAD1 유전자의 과다발현을 위한 플라스미드.
도 34. 피. 츠쿠바엔시스 기준 균주 H488, M15 및 M15-CAD.
도 35. 3 ml MG-IA 배지에서 10일 배양 후에 피. 츠쿠바엔시스 H488 AtCAD1-과다발현 형질전환체의 이타콘산 및 말산 생산.
도 36. 3 ml MG-IA 배지에서 10일 배양 후에 피. 츠쿠바엔시스 M15 AtCAD1-과다발현 형질전환체의 이타콘산 및 말산 생산.
도 37. 피. 츠쿠바엔시스에서 본래의 아코니타제 코딩 유전자 ACO1 (Pseudog3035, 천연 발생 인트론이 없음) 및 ACO2 (Pseudog2814)의 과다발현을 위한 플라스미드 pPTT.Cbx.oACO1-Ex 및 pPTT.Cbx.oACO2.
도 38. ACO1 및 ACO2를 과다발현하는 피. 츠쿠바엔시스 HR12 형질전환체의 스크리닝. 3 ml MG-IA 생산 배지를 갖는 웰 배양물에서 세포를 30℃ 및 220 rpm에서 6일 동안 배양하였다. 대략 20 mg CaCO3 / 웰에 의해 배지를 완충시켰다. 오차 막대는 2가지 별도의 배양에 대한 표준 편차를 나타낸다.
도 39. YPD 배지에서 사전 배양되고 신선한 50 ml YPD 배지로 옮긴 피. 츠쿠바엔시스 H488의 세포 성장 (OD600). 배양 1일째에 배양물에 20 g l-1 글루코스를 공급하였다 (화살표로 표시됨). 500 ml-배플형 플라스크에서 30℃, 220 rpm에서 시작 OD600 = 1에서 세포를 성장시켰다.
도 40. MG 배지에서 사전 배양되고 50 ml MG 배지로 옮긴 피. 츠쿠바엔시스 H488의 세포 성장 (OD600). 효모 세포를 두번째로 50 ml YPD 배지로 옮겼다 (우측 그래프). 500 ml-배플형 플라스크에서 30℃, 220 rpm에서 시작 OD600 = 1에서 세포를 성장시켰다.
도 41. YPD 배지에서 사전 배양되고 50 ml MG 배지로 옮긴 피. 츠쿠바엔시스의 세포 성장 (OD600). 500 ml-배플형 플라스크에서 30℃, 220 rpm에서 시작 OD600 = 1에서 세포를 성장시켰다.
도 42. MG 배지에서 사전 배양되고 50 ml MG 배지로 옮긴 피. 츠쿠바엔시스 H488의 세포 성장 (OD600). 10 % (v/v) 신선한 YPD 배지 또는 1 X 비타민 용액을 첨가하여 세포 성장을 유도하였다. 500 ml-배플형 플라스크에서 30℃, 220 rpm에서 시작 OD600 = 1에서 세포를 성장시켰다.
도 43. 다양한 양의 (NH4)2SO4 및 KH2PO4 / K2HPO4 x 3 H2O를 갖는 MG-T 배지에서 피. 츠쿠바엔시스 H488의 성장 및 유기산 생산 거동. 세포를 YPD 배지에서 1일 동안 사전 배양하고, 50 ml의 MG-T 배지로 옮겼다. 500 ml-배플형 플라스크에서 30℃, 220 rpm에서 시작 OD600 = 1에서 세포를 성장시켰고, 3.3 g l-1 CaCO3를 사용하여 배지를 완충시켰다.
도 44. 다양한 양의 NaNO3 및 KH2PO4 / K2HPO4 x 3 H2O를 갖는 MG-IA 배지에서 피. 츠쿠바엔시스 H488의 성장 (OD600) 및 유기산 생산 (g l-1) 거동. 세포를 YPD 배지에서 1일 동안 사전 배양하고, 50 ml의 MG-IA 배지로 옮겼다. 500 ml-배플형 플라스크에서 30℃, 220 rpm에서 시작 OD600 = 1에서 세포를 성장시켰고, 3.3 g l-1 CaCO3를 사용하여 배지를 완충시켰다.
도 45. 2/0.1 또는 5/0.1의 N/P-비 (N = NaNO3, P = KH2PO4 / K2HPO4 x 3 H2O)를 갖는 MG-IA 배지에서 피. 츠쿠바엔시스 M15의 성장 (OD600) 및 유기산 생산 (g l-1) 거동. 세포를 YPD 배지에서 1일 동안 사전 배양하고, 50 ml의 MG-IA 배지로 옮겼다. 500 ml-배플형 플라스크에서 30℃, 220 rpm에서 시작 OD600 = 1에서 세포를 성장시켰고, 3.3 g l-1 CaCO3를 사용하여 배지를 완충시켰다.
도 46. 다양한 N/P-비 (N = NaNO3, P = KH2PO4 / K2HPO4 x 3 H2O)를 갖는 MG-IA 배지에서 3 ml-웰 배양물 중에서 피. 츠쿠바엔시스 M15의 이타콘산 및 말산 생산 (g l-1). 세포를 YPD 배지에서 1일 동안 사전 배양하고, 3 ml의 MG-IA 배지로 옮겼다. 30℃, 220 rpm에서 세포를 인큐베이션하고, CaCO3를 사용하여 배지를 완충시켰다.
도 47. 2/0.1 또는 1/0.1의 N/P-비 (N = NaNO3, P = KH2PO4 / K2HPO4 x 3 H2O)를 갖는 MG-IA 배지에서 피. 츠쿠바엔시스 M15-CAD의 성장 (OD600) 및 유기산 생산 (g l-1) 거동. 세포를 YPD 배지에서 1일 동안 사전 배양하고, 50 ml의 MG-IA 배지로 옮겼다. 500 ml-배플형 플라스크에서 30℃, 220 rpm에서 시작 OD600 = 1에서 세포를 성장시켰고, 3.3 g l-1 CaCO3를 사용하여 배지를 완충시켰다.
도 48. 5/0.1 또는 5/1의 N/P-비 (N = NaNO3, P = KH2PO4 / K2HPO4 x 3 H2O)를 갖는 MG-IA 배지에서 피. 츠쿠바엔시스 M15-CAD의 성장 (OD600) 및 유기산 생산 (g l-1) 거동. 세포를 YPD 배지에서 1일 동안 사전 배양하고, 50 ml의 MG-IA 배지로 옮겼다. 500 ml-배플형 플라스크에서 30℃, 220 rpm에서 시작 OD600 = 1에서 세포를 성장시켰고, 3.3 g l-1 CaCO3를 사용하여 배지를 완충시켰다.
도 49. 다양한 N/P-비 (N = NaNO3, P = KH2PO4 / K2HPO4 x 3 H2O)를 갖는 MG-IA 배지에서 3 ml-웰 배양물 중에서 피. 츠쿠바엔시스 HR12의 이타콘산 및 말산 생산 (g l-1). 세포를 YPD 배지에서 1일 동안 사전 배양하고, 3 ml의 MG-IA 배지로 옮겼다. 30℃, 220 rpm에서 세포를 인큐베이션하고, CaCO3를 사용하여 배지를 완충시켰다.
도 50. N-공급원으로서 NaNO3 (기준), NH4Cl 또는 NH4NO3를 사용하여 MG-IA 최소 배지 (N: 4 g l-1, P: 1.0 g l-1)에서 피. 츠쿠바엔시스 HR12의 성장 (OD600) 패턴. 세포를 30℃ 및 220 rpm에서 7일 동안 배플형 플라스크에서 성장시켰다. 3.3 g l-1 CaCO3를 사용하여 배지를 완충시켰다.
도 51. N-공급원으로서 NaNO3 (기준), NH4Cl 또는 NH4NO3를 사용하여 MG-IA 최소 배지 (N: 4 g l-1, P: 1.0 g l-1)에서 피. 츠쿠바엔시스 HR12의 이타콘산 생산 (g l-1). 세포를 30℃ 및 220 rpm에서 7일 동안 배플형 플라스크에서 성장시켰다. 3.3 g l-1 CaCO3를 사용하여 배지를 완충시켰다.
도 52. ITA 생산 배지 MG-IA - N/P: 2/0.1 g l-1 (NaNO3)에서 피. 츠쿠바엔시스 M15-CAD의 600 ml 생물반응기 배양. 30℃, pH = 5.5, pO2 = 55 %, 및 150 g l-1의 초기 글루코스 농도에서 8일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다.
도 53. ITA 생산 배지 MG-IA - N/P: 5/0.1 g l-1 (NaNO3)에서 피. 츠쿠바엔시스 M15-CAD의 600 ml 생물반응기 배양. 30℃, pH = 5.5, pO2 = 55 %, 및 150 g l-1의 초기 글루코스 농도에서 8일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다.
도 54. ITA 생산 배지 MG-IA - N/P: 4/1 g l-1 (NaNO3)에서 피. 츠쿠바엔시스 M15-CAD의 600 ml 생물반응기 배양. 30℃, pH = 5.5, pO2 = 55 % 및 150 g l-1의 초기 글루코스 농도에서 6일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다.
도 55. ITA 생산 배지 MG-IA - N/P: 2/0.1 g l-1 (NaNO3)에서 피. 츠쿠바엔시스 M15-CAD의 600 ml 생물반응기 배양. 30℃, pH = 7.0, pO2 = 55 % 및 150 g l-1의 초기 글루코스 농도에서 6일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다.
도 56. ITA 생산 배지 MG-IA - N/P: 2/0.1 g l-1 (NaNO3)에서 피. 츠쿠바엔시스 M15-CAD의 600 ml 생물반응기 배양. 30℃, pH = 5.5, pO2 = 90 % 및 150 g l-1의 초기 글루코스 농도에서 6일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다.
도 57. ITA 생산 배지 MG-IA - N/P: 2/0.1 g l-1 (NaNO3)에서 피. 츠쿠바엔시스 M15-CAD의 600 ml 생물반응기 배양. 30℃, pH 대략 5.5 (4 g l-1 CaCO3에 의해 조정됨), pO2 = 55 % 및 150 g l-1의 초기 글루코스 농도에서 6일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다.
도 58. ITA 생산 배지 MG-IA - N/P: 2/0.1 g l-1 (NaNO3)에서 피. 츠쿠바엔시스 HR12의 600 ml 생물반응기 배양. 30℃, pH = 5.5, pO2 = 55 % 및 150 g l-1의 초기 글루코스 농도에서 5일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다.
도 59. ITA 생산 배지 MG-IA - N/P: 4/1 g l-1 (NaNO3)에서 피. 츠쿠바엔시스 HR12의 600 ml 생물반응기 배양. 30℃, pH = 5.5, pO2 = 55 % 및 150 g l-1의 초기 글루코스 농도에서 5일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다.
도 60. ITA 생산 배지 MG-IA - N/P: 4/1 g l-1 (NaNO3)에서 피. 츠쿠바엔시스 HR12의 600 ml 생물반응기 배양. 30℃, pH = 5.5, pO2 = 55 % 및 150 g l-1의 초기 글루코스 농도에서 10일 동안 세포를 배양하였다. 5일째에 100 g l-1 글루코스를 공급하였다. 글루코스 소모를 24시간마다 모니터링하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다.
도 61. ITA 생산 배지 MG-IA - N/P: 4/1 g l-1 (NaNO3)에서 피. 츠쿠바엔시스 HR12의 600 ml 생물반응기 배양. 30℃, pH = 5.5, pO2 = 55 % 및 75 g l-1의 초기 글루코스 농도에서 10일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하고, 대략 75 g l-1로 재조정하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다.
도 62. ITA 생산 배지 MG-IA - N/P: 5.5/1 g l-1 (NaNO3)에서 피. 츠쿠바엔시스 HR12의 600 ml 생물반응기 배양. 30℃, pH = 5.5, pO2 = 55 % 및 75 g l-1의 초기 글루코스 농도에서 8일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하고, 대략 75 g l-1로 재조정하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다.
도 63. ITA 생산 배지 MG-IA - N/P: 8/1 g l-1 (NaNO3)에서 피. 츠쿠바엔시스 HR12의 600 ml 생물반응기 배양. 30℃, pH = 5.5, pO2 = 55 % 및 75 g l-1의 초기 글루코스 농도에서 7일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하고, 대략 75 g l-1로 재조정하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다.
도 64. ITA 생산 배지 MG-IA - N/P: 8/1 g l-1 (NaNO3) & 1.75 X 미네랄 염; 미량 원소; 티아민, FeCl3에서 피. 츠쿠바엔시스 HR12의 600 ml 생물반응기 배양. 30℃, pH = 5.5, pO2 = 55 % 및 75 g l-1의 초기 글루코스 농도에서 7일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하고, 대략 75 g l-1로 재조정하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다.
도 65. ITA 생산 배지 MG-IA - N/P: 4/1 g l-1 (NH4Cl)에서 피. 츠쿠바엔시스 HR12의 600 ml 생물반응기 배양. 30℃, pH = 5.5, pO2 = 55 % 및 75 g l-1의 초기 글루코스 농도에서 8일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하고, 대략 75 g l-1로 재조정하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다.
도 66. ITA 생산 배지 MG-IA - N/P: 4/1 g l-1 (NaNO3)에서 피. 츠쿠바엔시스 HR12의 600 ml 생물반응기 배양. 30℃, pH = 5.5 -> 4.0 (1일째) (검은색 화살표로 표시함), pO2 = 55 % 및 75 g l-1의 초기 글루코스 농도에서 8일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하고, 대략 75 g l-1로 재조정하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다.
도 67. ITA 생산 배지 MG-IA - N/P: 4/1 g l-1 (NaNO3)에서 피. 츠쿠바엔시스 HR12의 600 ml 생물반응기 배양. 30℃, pH = 5.5 -> 4.0 (1일째) (검은색 화살표로 표시함), pO2 = 55 % 및 75 g l-1의 초기 글루코스 농도에서 8일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하고, 대략 75 g l-1로 재조정하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다. 7일째에 1 g l-1 N-공급원을 공급하였다 (점선 화살표로 표시함).
도 68. ITA 생산 배지 MG-IA - N/P: 5/1 g l-1 (NaNO3)에서 피. 츠쿠바엔시스 HR12의 600 ml 생물반응기 배양. 30℃, pH = 5.5 -> 4.0 (1일째) -> 3.5 (2일째) (검은색 화살표로 표시함), pO2 = 55 % 및 75 g l-1의 초기 글루코스 농도에서 7일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하고, 대략 75 g l-1로 재조정하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다.
도 69. ITA 생산 배지 MG-IA - N/P: 5/1 g l-1 (NaNO3)에서 피. 츠쿠바엔시스 HR12의 600 ml 생물반응기 배양. 30℃, pH = 5.5 -> 4.0 (1일째) -> 3.5 (2일째) -> 3.0 (3일째) (검은색 화살표로 표시함), pO2 = 55 % 및 75 g l-1의 초기 글루코스 농도에서 7일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하고, 대략 75 g l-1로 재조정하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다.
도 70. 600 ml 생물반응기에서 ITA 생산 배지 MG-IA - N/P: 6/1 g l-1 (NaNO3)에서 피. 츠쿠바엔시스 HR12의 반연속식 배양. 30℃, pH = 5.5 -> 4.0 (1일째) (검은색 화살표로 표시함), pO2 = 55 % 및 75 g l-1의 초기 글루코스 농도에서 14일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하고, 대략 75 g l-1로 재조정하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다. 7일째에 배양물 브로쓰의 50 %를 신선한 배지로 교체하였다 (점선 화살표로 표시함).
도 71. 600 ml 생물반응기에서 ITA 생산 배지 MG-IA - N/P: 6/1 g l-1 (NaNO3)에서 피. 츠쿠바엔시스 HR12의 반연속식 배양. - 손실에 대해 조정함 - 30℃, pH = 5.5 -> 4.0 (1일째) (검은색 화살표로 표시함), pO2 = 55 % 및 75 g l-1의 초기 글루코스 농도에서 14일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하고, 대략 75 g l-1로 재조정하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다. 7일째에 배양물 브로쓰의 50 %를 신선한 배지로 교체하였다 (점선 화살표로 표시함).
도 72. RIA1 아미노산 서열의 다중 정렬. 최상단의 아미노산 서열의 철자만이 완전히 기재되고; 다른 모든 아미노산 서열의 경우에는 각각의 위치에서 상단 서열의 각각의 아미노산과 상이한 아미노산만이 주어지며, 점은 각각의 위치에서 상단 서열의 각각의 아미노산이 존재함을 나타낸다. 정렬된 단백질은 다음과 같다: "WO2015140314": WO2015140314A1의 서열식별번호: 16; 유니프롯(Uniprot) 항목 A0A0U2WFX7 / RIA1_USTMD; 유니프롯 항목 A0A0D1CU52 / A0A0D1CU52_USTMA; 유니프롯 항목 R9P2W9 / R9P2W9_PSEHS; "SEQ36": 서열식별번호: 36; "SEQ35": 서열식별번호: 35; "SEQ37": 서열식별번호: 37; "SEQ48": 서열식별번호: 48.
도 2. pUC-IP-URA3 플라스미드의 구축. PtURA3의 좌측 및 우측 플랭킹 영역을 각각의 제한 부위의 상보화에 의해 증폭시켰다. XbaI & BglII 및 BglII & EcoRI 소화된 단편을 XbaI & EcoRI-절단된 pUCBM21 플라스미드에 라이게이션시켰다.
도 3. PtURA3 결실 플라스미드 pUC-DK-URA3의 구축. BglII를 이용하여 pUC-IP-URA3을 선형화시켰다. 히그로마이신 선택 마커 (히그로마이신 내성 유전자 HygB, HSP70 프로모터 및 HSP70 종결자로 이루어짐)를 BamHI 소화시키고, 선형화된 pUC-IP-URA3 플라스미드에 라이게이션시켰다. 이는 BamHI 및 BglII가 상용성 점착성 단부를 생성하기 때문에 가능하였다.
도 4. LacZ-리포터 유전자 과다발현 플라스미드의 구축을 위한 클로닝 전략. 각각의 프로모터 서열 (* 각각의 유전자의 상류 영역의 대략 1,050 bp 길이의 서열) 및 LacZ 리포터 유전자의 ORF (β 갈락토시다제)를 중첩-PCR 과정에서 함께 융합시켰다. 5'-단부를 KpnI-로 상보화시키고, 3'-단부를 PstI-제한 부위로 상보화시켰다. NsiI 및 PstI 생성된 단부의 상용성으로 인해 융합 산물을 KpnI & NsiI 소화된 pPTT-플라스미드에 라이게이션시켜, 하기 LacZ 과다발현 플라스미드를 생성하였다: pPTT pActin LacZ; pPPT pGAPDH LacZ; pPPT pHSP70 LacZ; pPPT pTEF1 LacZ.
도 5. 피. 츠쿠바엔시스 H488 LacZ-형질전환체의 β-갈락토시다제 활성 [U mg-1 총 단백질]. LacZ 리포터 유전자를 pActin, pGAPDH, pHSP70, pTEF1 또는 pUmHSP70 (기준) 프로모터 각각의 제어 하에 과다발현하였다. 세포를 3 ml YPD (완전) 배지에서 2일 동안 배양하였다.
도 6. 피. 츠쿠바엔시스 H488 LacZ-형질전환체의 β-갈락토시다제 활성 [U mg-1 총 단백질]. LacZ 리포터 유전자를 pActin, pGAPDH, pHSP70, pTEF1 또는 pUmHSP70 (기준) 프로모터 각각의 제어 하에 과다발현하였다. 세포를 2 g l-1 질소 공급원 및 0.2 g l-1 포스페이트 공급원을 갖는 3 ml MG-IT 최소 배지에서 4일 동안 배양하였다.
도 7. 피. 츠쿠바엔시스 M15 LacZ-형질전환체의 β-갈락토시다제 활성 [U mg-1 총 단백질]. LacZ 리포터 유전자를 pActin, pGAPDH, pHSP70, pTEF1 또는 pUmHSP70 (기준) 프로모터 각각의 제어 하에 과다발현하였다. 세포를 3 ml YPD (완전) 배지에서 2일 동안 배양하였다.
도 8. 피. 츠쿠바엔시스 M15 LacZ-형질전환체의 β-갈락토시다제 활성 [U mg-1 총 단백질]. LacZ 리포터 유전자를 pActin, pGAPDH, pHSP70, pTEF1 또는 pUmHSP70 (기준) 프로모터 각각의 제어 하에 과다발현하였다. 세포를 2 g l-1 질소 공급원 및 0.2 g l-1 포스페이트 공급원을 갖는 3 ml MG-IT 최소 배지에서 4일 동안 배양하였다.
도 9. 피. 츠쿠바엔시스 H488에서 이타콘산의 생산을 위한 유전자 클러스터. 클러스터는 스캐폴드 19 상에 위치하였고, 이타콘산 합성에 필요한 단지 5가지 유전자로 이루어졌다: RIA1 (이타콘산의 조절인자), MTT1 (미토콘드리아 TCA 수송인자), ADI1 (아코니테이트-Δ-이소머라제), ITP1 (이타코네이트 수송 단백질), TAD1 (트랜스-아코니테이트 데카르복실라제).
도 10. 유. 마이디스와의 서열 유사성으로 인해 피. 츠쿠바엔시스에서 이타콘산 생산을 위해 제안된 경로. 시스-아코니테이트는 MTT1에 의해 미토콘드리아로부터 시토졸로 수송되며, 여기서 이는 아코니테이트-Δ-이소머라제 (ADI1)에 의해 트랜스-아코니테이트로 전환되고, 트랜스-아코니테이트 데카르복실라제 (TAD1)에 의해 최종 산물 ITA로 추가로 탈카르복실화된다. 이어서, ITA는 ITP1에 의해 세포 환경으로 분비된다. 유전자 ADI1, ITP1, MTT1 및 TAD1은 RIA1 활성에 의해 상향조절된다. 모든 유전자는 스캐폴드 19 상에 위치하는 클러스터에서 조직화된다. 시스-아코니테이트는 ITA 생산 진균 에이. 테레우스에서 시스-아코니테이트 데카르복실라제 (AtCAD1)에 의해 이타코네이트로 직접적으로 전환된다 (회색 화살표로 표시함).
도 11은 숙시네이트 데히드로게나제의 철-황 단백질 서브유닛의 단백질 서열의 다중 정렬이다. 최상단의 아미노산 서열의 철자만이 완전히 기재되고; 다른 모든 아미노산 서열의 경우에는 각각의 위치에서 상단 서열의 각각의 아미노산과 상이한 아미노산만이 주어지며, 점은 각각의 위치에서 상단 서열의 각각의 아미노산이 존재함을 나타낸다. 정렬된 단백질은 다음과 같다:
하단 서열 "SEQ048"은 슈도지마 츠쿠바엔시스의 서열식별번호: 48에 따른 서열이다.
도 12. 야생형 균주 H488 (상단)에서 영향을 받은 영역과 비교한 피. 츠쿠바엔시스 균주 HR12 (하단)에서 RIA1-과다발현 플라스미드 pPTT-pActin-RIA1의 통합의 게놈 로커스. 녹색 막대는 그 사이에서 이종성 재조합 사건이 일어나야 했던 ORF를 표시한다.
도 13. 피. 츠쿠바엔시스에서 ITA 생산을 담당하는 본래의 유전자의 과다발현을 위해 생성된 플라스미드.
도 14. 피. 츠쿠바엔시스 기준 균주 H488, M15 및 M15-CAD
도 15. 3 ml MG-IA 배지에서 10일 배양 후에 피. 츠쿠바엔시스 H488 ADI1-과다발현 형질전환체의 이타콘산 및 말산 생산.
도 16. 3 ml MG-IA 배지에서 10일 배양 후에 피. 츠쿠바엔시스 M15 ADI1-과다발현 형질전환체의 이타콘산 및 말산 생산.
도 17. 피. 츠쿠바엔시스 기준 균주 H488, M15 및 M15-CAD.
도 18. 3 ml MG-IA 배지에서 10일 배양 후에 피. 츠쿠바엔시스 H488 ITP1-과다발현 형질전환체의 이타콘산 및 말산 생산.
도 19. 3 ml MG-IA 배지에서 10일 배양 후에 피. 츠쿠바엔시스 M15 ITP1-과다발현 형질전환체의 이타콘산 및 말산 생산.
도 20. 피. 츠쿠바엔시스 기준 균주 H488, M15 및 M15-CAD.
도 21. 3 ml MG-IA 배지에서 10일 배양 후에 피. 츠쿠바엔시스 H488 MTT1-과다발현 형질전환체의 이타콘산 및 말산 생산.
도 22. 3 ml MG-IA 배지에서 10일 배양 후에 피. 츠쿠바엔시스 M15 MTT1-과다발현 형질전환체의 이타콘산 및 말산 생산.
도 23. 피. 츠쿠바엔시스 기준 균주 H488, M15 및 M15-CAD.
도 24. 3 ml MG-IA 배지에서 10일 배양 후에 피. 츠쿠바엔시스 H488 TAD1-과다발현 형질전환체의 이타콘산 및 말산 생산.
도 25. 3 ml MG-IA 배지에서 10일 배양 후에 피. 츠쿠바엔시스 M15 MTT1-과다발현 형질전환체의 이타콘산 및 말산 생산.
도 26. 피. 츠쿠바엔시스 기준 균주 H488, M15 및 M15-CAD.
도 27. 3 ml MG-IA 배지에서 10일 배양 후에 피. 츠쿠바엔시스 H488 RIA1-과다발현 형질전환체의 이타콘산 및 말산 생산.
도 28. 3 ml MG-IA 배지에서 10일 배양 후에 피. 츠쿠바엔시스 M15 RIA1-과다발현 형질전환체의 이타콘산 및 말산 생산.
도 29. 50 ml MG-IA 최소 배지 (N: 2 g l-1, P: 0.1 g l-1, C: 15 % w/v, pH-조절 없음)에서 8일 진탕 플라스크 배양 과정에 걸쳐 선택된 6가지 RIA1-과다발현 형질전환체에 대한 ITA 및 MA 생산 (g l-1) 및 성장 (OD600)의 진행.
도 30. 단독 탄소 공급원으로서 10 % (w/v) 글루코스 (기준), 수크로스, D-크실로스 또는 10 % v/v 글리세롤을 사용하여 MG-IA 최소 배지 (N: 4 g l-1, P: 1.0 g l-1)에서 피. 츠쿠바엔시스 HR12의 성장 (OD600) 패턴. 세포를 30℃ 및 220 rpm에서 7일 동안 배플형 플라스크에서 성장시켰다. 3.3 g l-1 CaCO3를 사용하여 배지를 완충시켰다.
도 31. 단독 탄소 공급원으로서 10 % (w/v) 글루코스 (기준), 수크로스, D-크실로스 또는 10 % v/v 글리세롤을 사용하여 MG-IA 최소 배지 (N: 4 g l-1, P: 1.0 g l-1)에서 피. 츠쿠바엔시스 HR12의 이타콘산 생산. 세포를 30℃ 및 220 rpm에서 7일 동안 배플형 플라스크에서 성장시켰다. 3.3 g l-1 CaCO3를 사용하여 배지를 완충시켰다.
도 32. H488과 비교하여 피. 츠쿠바엔시스 HR12에서 이타콘산 클러스터 유전자의 상대적인 전사에 대한 정량적인 실시간 PCR의 결과. OD600 = 2-3에 도달할 때까지 MG-IA 최소 배지에서 세포를 성장시켰다. 신장 인자 1 (EF1) 및 유비퀴틴 접합 효소 (UBC6)를 기준 유전자로서 사용하였다. HR12의 발현 수준을 H488 발현 수준에 대해 정규화하였다. n = 2, 오차 막대는 표준 편차를 나타낸다.
도 33. 강한 본래의 액틴 프로모터의 제어 하의 에이. 테레우스 CAD1 유전자의 과다발현을 위한 플라스미드.
도 34. 피. 츠쿠바엔시스 기준 균주 H488, M15 및 M15-CAD.
도 35. 3 ml MG-IA 배지에서 10일 배양 후에 피. 츠쿠바엔시스 H488 AtCAD1-과다발현 형질전환체의 이타콘산 및 말산 생산.
도 36. 3 ml MG-IA 배지에서 10일 배양 후에 피. 츠쿠바엔시스 M15 AtCAD1-과다발현 형질전환체의 이타콘산 및 말산 생산.
도 37. 피. 츠쿠바엔시스에서 본래의 아코니타제 코딩 유전자 ACO1 (Pseudog3035, 천연 발생 인트론이 없음) 및 ACO2 (Pseudog2814)의 과다발현을 위한 플라스미드 pPTT.Cbx.oACO1-Ex 및 pPTT.Cbx.oACO2.
도 38. ACO1 및 ACO2를 과다발현하는 피. 츠쿠바엔시스 HR12 형질전환체의 스크리닝. 3 ml MG-IA 생산 배지를 갖는 웰 배양물에서 세포를 30℃ 및 220 rpm에서 6일 동안 배양하였다. 대략 20 mg CaCO3 / 웰에 의해 배지를 완충시켰다. 오차 막대는 2가지 별도의 배양에 대한 표준 편차를 나타낸다.
도 39. YPD 배지에서 사전 배양되고 신선한 50 ml YPD 배지로 옮긴 피. 츠쿠바엔시스 H488의 세포 성장 (OD600). 배양 1일째에 배양물에 20 g l-1 글루코스를 공급하였다 (화살표로 표시됨). 500 ml-배플형 플라스크에서 30℃, 220 rpm에서 시작 OD600 = 1에서 세포를 성장시켰다.
도 40. MG 배지에서 사전 배양되고 50 ml MG 배지로 옮긴 피. 츠쿠바엔시스 H488의 세포 성장 (OD600). 효모 세포를 두번째로 50 ml YPD 배지로 옮겼다 (우측 그래프). 500 ml-배플형 플라스크에서 30℃, 220 rpm에서 시작 OD600 = 1에서 세포를 성장시켰다.
도 41. YPD 배지에서 사전 배양되고 50 ml MG 배지로 옮긴 피. 츠쿠바엔시스의 세포 성장 (OD600). 500 ml-배플형 플라스크에서 30℃, 220 rpm에서 시작 OD600 = 1에서 세포를 성장시켰다.
도 42. MG 배지에서 사전 배양되고 50 ml MG 배지로 옮긴 피. 츠쿠바엔시스 H488의 세포 성장 (OD600). 10 % (v/v) 신선한 YPD 배지 또는 1 X 비타민 용액을 첨가하여 세포 성장을 유도하였다. 500 ml-배플형 플라스크에서 30℃, 220 rpm에서 시작 OD600 = 1에서 세포를 성장시켰다.
도 43. 다양한 양의 (NH4)2SO4 및 KH2PO4 / K2HPO4 x 3 H2O를 갖는 MG-T 배지에서 피. 츠쿠바엔시스 H488의 성장 및 유기산 생산 거동. 세포를 YPD 배지에서 1일 동안 사전 배양하고, 50 ml의 MG-T 배지로 옮겼다. 500 ml-배플형 플라스크에서 30℃, 220 rpm에서 시작 OD600 = 1에서 세포를 성장시켰고, 3.3 g l-1 CaCO3를 사용하여 배지를 완충시켰다.
도 44. 다양한 양의 NaNO3 및 KH2PO4 / K2HPO4 x 3 H2O를 갖는 MG-IA 배지에서 피. 츠쿠바엔시스 H488의 성장 (OD600) 및 유기산 생산 (g l-1) 거동. 세포를 YPD 배지에서 1일 동안 사전 배양하고, 50 ml의 MG-IA 배지로 옮겼다. 500 ml-배플형 플라스크에서 30℃, 220 rpm에서 시작 OD600 = 1에서 세포를 성장시켰고, 3.3 g l-1 CaCO3를 사용하여 배지를 완충시켰다.
도 45. 2/0.1 또는 5/0.1의 N/P-비 (N = NaNO3, P = KH2PO4 / K2HPO4 x 3 H2O)를 갖는 MG-IA 배지에서 피. 츠쿠바엔시스 M15의 성장 (OD600) 및 유기산 생산 (g l-1) 거동. 세포를 YPD 배지에서 1일 동안 사전 배양하고, 50 ml의 MG-IA 배지로 옮겼다. 500 ml-배플형 플라스크에서 30℃, 220 rpm에서 시작 OD600 = 1에서 세포를 성장시켰고, 3.3 g l-1 CaCO3를 사용하여 배지를 완충시켰다.
도 46. 다양한 N/P-비 (N = NaNO3, P = KH2PO4 / K2HPO4 x 3 H2O)를 갖는 MG-IA 배지에서 3 ml-웰 배양물 중에서 피. 츠쿠바엔시스 M15의 이타콘산 및 말산 생산 (g l-1). 세포를 YPD 배지에서 1일 동안 사전 배양하고, 3 ml의 MG-IA 배지로 옮겼다. 30℃, 220 rpm에서 세포를 인큐베이션하고, CaCO3를 사용하여 배지를 완충시켰다.
도 47. 2/0.1 또는 1/0.1의 N/P-비 (N = NaNO3, P = KH2PO4 / K2HPO4 x 3 H2O)를 갖는 MG-IA 배지에서 피. 츠쿠바엔시스 M15-CAD의 성장 (OD600) 및 유기산 생산 (g l-1) 거동. 세포를 YPD 배지에서 1일 동안 사전 배양하고, 50 ml의 MG-IA 배지로 옮겼다. 500 ml-배플형 플라스크에서 30℃, 220 rpm에서 시작 OD600 = 1에서 세포를 성장시켰고, 3.3 g l-1 CaCO3를 사용하여 배지를 완충시켰다.
도 48. 5/0.1 또는 5/1의 N/P-비 (N = NaNO3, P = KH2PO4 / K2HPO4 x 3 H2O)를 갖는 MG-IA 배지에서 피. 츠쿠바엔시스 M15-CAD의 성장 (OD600) 및 유기산 생산 (g l-1) 거동. 세포를 YPD 배지에서 1일 동안 사전 배양하고, 50 ml의 MG-IA 배지로 옮겼다. 500 ml-배플형 플라스크에서 30℃, 220 rpm에서 시작 OD600 = 1에서 세포를 성장시켰고, 3.3 g l-1 CaCO3를 사용하여 배지를 완충시켰다.
도 49. 다양한 N/P-비 (N = NaNO3, P = KH2PO4 / K2HPO4 x 3 H2O)를 갖는 MG-IA 배지에서 3 ml-웰 배양물 중에서 피. 츠쿠바엔시스 HR12의 이타콘산 및 말산 생산 (g l-1). 세포를 YPD 배지에서 1일 동안 사전 배양하고, 3 ml의 MG-IA 배지로 옮겼다. 30℃, 220 rpm에서 세포를 인큐베이션하고, CaCO3를 사용하여 배지를 완충시켰다.
도 50. N-공급원으로서 NaNO3 (기준), NH4Cl 또는 NH4NO3를 사용하여 MG-IA 최소 배지 (N: 4 g l-1, P: 1.0 g l-1)에서 피. 츠쿠바엔시스 HR12의 성장 (OD600) 패턴. 세포를 30℃ 및 220 rpm에서 7일 동안 배플형 플라스크에서 성장시켰다. 3.3 g l-1 CaCO3를 사용하여 배지를 완충시켰다.
도 51. N-공급원으로서 NaNO3 (기준), NH4Cl 또는 NH4NO3를 사용하여 MG-IA 최소 배지 (N: 4 g l-1, P: 1.0 g l-1)에서 피. 츠쿠바엔시스 HR12의 이타콘산 생산 (g l-1). 세포를 30℃ 및 220 rpm에서 7일 동안 배플형 플라스크에서 성장시켰다. 3.3 g l-1 CaCO3를 사용하여 배지를 완충시켰다.
도 52. ITA 생산 배지 MG-IA - N/P: 2/0.1 g l-1 (NaNO3)에서 피. 츠쿠바엔시스 M15-CAD의 600 ml 생물반응기 배양. 30℃, pH = 5.5, pO2 = 55 %, 및 150 g l-1의 초기 글루코스 농도에서 8일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다.
도 53. ITA 생산 배지 MG-IA - N/P: 5/0.1 g l-1 (NaNO3)에서 피. 츠쿠바엔시스 M15-CAD의 600 ml 생물반응기 배양. 30℃, pH = 5.5, pO2 = 55 %, 및 150 g l-1의 초기 글루코스 농도에서 8일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다.
도 54. ITA 생산 배지 MG-IA - N/P: 4/1 g l-1 (NaNO3)에서 피. 츠쿠바엔시스 M15-CAD의 600 ml 생물반응기 배양. 30℃, pH = 5.5, pO2 = 55 % 및 150 g l-1의 초기 글루코스 농도에서 6일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다.
도 55. ITA 생산 배지 MG-IA - N/P: 2/0.1 g l-1 (NaNO3)에서 피. 츠쿠바엔시스 M15-CAD의 600 ml 생물반응기 배양. 30℃, pH = 7.0, pO2 = 55 % 및 150 g l-1의 초기 글루코스 농도에서 6일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다.
도 56. ITA 생산 배지 MG-IA - N/P: 2/0.1 g l-1 (NaNO3)에서 피. 츠쿠바엔시스 M15-CAD의 600 ml 생물반응기 배양. 30℃, pH = 5.5, pO2 = 90 % 및 150 g l-1의 초기 글루코스 농도에서 6일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다.
도 57. ITA 생산 배지 MG-IA - N/P: 2/0.1 g l-1 (NaNO3)에서 피. 츠쿠바엔시스 M15-CAD의 600 ml 생물반응기 배양. 30℃, pH 대략 5.5 (4 g l-1 CaCO3에 의해 조정됨), pO2 = 55 % 및 150 g l-1의 초기 글루코스 농도에서 6일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다.
도 58. ITA 생산 배지 MG-IA - N/P: 2/0.1 g l-1 (NaNO3)에서 피. 츠쿠바엔시스 HR12의 600 ml 생물반응기 배양. 30℃, pH = 5.5, pO2 = 55 % 및 150 g l-1의 초기 글루코스 농도에서 5일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다.
도 59. ITA 생산 배지 MG-IA - N/P: 4/1 g l-1 (NaNO3)에서 피. 츠쿠바엔시스 HR12의 600 ml 생물반응기 배양. 30℃, pH = 5.5, pO2 = 55 % 및 150 g l-1의 초기 글루코스 농도에서 5일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다.
도 60. ITA 생산 배지 MG-IA - N/P: 4/1 g l-1 (NaNO3)에서 피. 츠쿠바엔시스 HR12의 600 ml 생물반응기 배양. 30℃, pH = 5.5, pO2 = 55 % 및 150 g l-1의 초기 글루코스 농도에서 10일 동안 세포를 배양하였다. 5일째에 100 g l-1 글루코스를 공급하였다. 글루코스 소모를 24시간마다 모니터링하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다.
도 61. ITA 생산 배지 MG-IA - N/P: 4/1 g l-1 (NaNO3)에서 피. 츠쿠바엔시스 HR12의 600 ml 생물반응기 배양. 30℃, pH = 5.5, pO2 = 55 % 및 75 g l-1의 초기 글루코스 농도에서 10일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하고, 대략 75 g l-1로 재조정하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다.
도 62. ITA 생산 배지 MG-IA - N/P: 5.5/1 g l-1 (NaNO3)에서 피. 츠쿠바엔시스 HR12의 600 ml 생물반응기 배양. 30℃, pH = 5.5, pO2 = 55 % 및 75 g l-1의 초기 글루코스 농도에서 8일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하고, 대략 75 g l-1로 재조정하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다.
도 63. ITA 생산 배지 MG-IA - N/P: 8/1 g l-1 (NaNO3)에서 피. 츠쿠바엔시스 HR12의 600 ml 생물반응기 배양. 30℃, pH = 5.5, pO2 = 55 % 및 75 g l-1의 초기 글루코스 농도에서 7일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하고, 대략 75 g l-1로 재조정하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다.
도 64. ITA 생산 배지 MG-IA - N/P: 8/1 g l-1 (NaNO3) & 1.75 X 미네랄 염; 미량 원소; 티아민, FeCl3에서 피. 츠쿠바엔시스 HR12의 600 ml 생물반응기 배양. 30℃, pH = 5.5, pO2 = 55 % 및 75 g l-1의 초기 글루코스 농도에서 7일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하고, 대략 75 g l-1로 재조정하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다.
도 65. ITA 생산 배지 MG-IA - N/P: 4/1 g l-1 (NH4Cl)에서 피. 츠쿠바엔시스 HR12의 600 ml 생물반응기 배양. 30℃, pH = 5.5, pO2 = 55 % 및 75 g l-1의 초기 글루코스 농도에서 8일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하고, 대략 75 g l-1로 재조정하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다.
도 66. ITA 생산 배지 MG-IA - N/P: 4/1 g l-1 (NaNO3)에서 피. 츠쿠바엔시스 HR12의 600 ml 생물반응기 배양. 30℃, pH = 5.5 -> 4.0 (1일째) (검은색 화살표로 표시함), pO2 = 55 % 및 75 g l-1의 초기 글루코스 농도에서 8일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하고, 대략 75 g l-1로 재조정하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다.
도 67. ITA 생산 배지 MG-IA - N/P: 4/1 g l-1 (NaNO3)에서 피. 츠쿠바엔시스 HR12의 600 ml 생물반응기 배양. 30℃, pH = 5.5 -> 4.0 (1일째) (검은색 화살표로 표시함), pO2 = 55 % 및 75 g l-1의 초기 글루코스 농도에서 8일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하고, 대략 75 g l-1로 재조정하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다. 7일째에 1 g l-1 N-공급원을 공급하였다 (점선 화살표로 표시함).
도 68. ITA 생산 배지 MG-IA - N/P: 5/1 g l-1 (NaNO3)에서 피. 츠쿠바엔시스 HR12의 600 ml 생물반응기 배양. 30℃, pH = 5.5 -> 4.0 (1일째) -> 3.5 (2일째) (검은색 화살표로 표시함), pO2 = 55 % 및 75 g l-1의 초기 글루코스 농도에서 7일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하고, 대략 75 g l-1로 재조정하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다.
도 69. ITA 생산 배지 MG-IA - N/P: 5/1 g l-1 (NaNO3)에서 피. 츠쿠바엔시스 HR12의 600 ml 생물반응기 배양. 30℃, pH = 5.5 -> 4.0 (1일째) -> 3.5 (2일째) -> 3.0 (3일째) (검은색 화살표로 표시함), pO2 = 55 % 및 75 g l-1의 초기 글루코스 농도에서 7일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하고, 대략 75 g l-1로 재조정하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다.
도 70. 600 ml 생물반응기에서 ITA 생산 배지 MG-IA - N/P: 6/1 g l-1 (NaNO3)에서 피. 츠쿠바엔시스 HR12의 반연속식 배양. 30℃, pH = 5.5 -> 4.0 (1일째) (검은색 화살표로 표시함), pO2 = 55 % 및 75 g l-1의 초기 글루코스 농도에서 14일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하고, 대략 75 g l-1로 재조정하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다. 7일째에 배양물 브로쓰의 50 %를 신선한 배지로 교체하였다 (점선 화살표로 표시함).
도 71. 600 ml 생물반응기에서 ITA 생산 배지 MG-IA - N/P: 6/1 g l-1 (NaNO3)에서 피. 츠쿠바엔시스 HR12의 반연속식 배양. - 손실에 대해 조정함 - 30℃, pH = 5.5 -> 4.0 (1일째) (검은색 화살표로 표시함), pO2 = 55 % 및 75 g l-1의 초기 글루코스 농도에서 14일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하고, 대략 75 g l-1로 재조정하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다. 7일째에 배양물 브로쓰의 50 %를 신선한 배지로 교체하였다 (점선 화살표로 표시함).
도 72. RIA1 아미노산 서열의 다중 정렬. 최상단의 아미노산 서열의 철자만이 완전히 기재되고; 다른 모든 아미노산 서열의 경우에는 각각의 위치에서 상단 서열의 각각의 아미노산과 상이한 아미노산만이 주어지며, 점은 각각의 위치에서 상단 서열의 각각의 아미노산이 존재함을 나타낸다. 정렬된 단백질은 다음과 같다: "WO2015140314": WO2015140314A1의 서열식별번호: 16; 유니프롯(Uniprot) 항목 A0A0U2WFX7 / RIA1_USTMD; 유니프롯 항목 A0A0D1CU52 / A0A0D1CU52_USTMA; 유니프롯 항목 R9P2W9 / R9P2W9_PSEHS; "SEQ36": 서열식별번호: 36; "SEQ35": 서열식별번호: 35; "SEQ37": 서열식별번호: 37; "SEQ48": 서열식별번호: 48.
본 발명은 이후에 더욱 상세하게 기재된다. 상세한 설명에서는 기술적인 미생물학 분야에서 통상의 기술자에 의해 다루어진다. 상세한 설명은 이해하려는 마음으로 해석되어야 한다. 임의의 기술적 사실 또는 교시내용에 대한 임의의 다른 한정된 설명과 마찬가지로 본 발명의 설명이 어떠한 수단에 의해서도 총망라된 것이 아님을 이해해야 한다. 특히, 본 발명의 임의의 특별한 교시내용 또는 예시의 특색은 본 발명의 임의의 다른 교시내용의 임의적인 부분인 것으로 이해되어야 한다.
달리 정의되지 않는다면, (기술적 및 과학적 용어를 비롯하여) 본원에서 사용된 모든 용어들은 발효 분야에서 통상의 경험을 가진 생명공학자인 관련 기술분야의 통상의 기술자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다. 모든 용어들은 명세서 및 관련 분야의 맥락에서 그들의 의미와 일치하는 의미를 갖는 것으로 해석되어야 하고, 본원에서 달리 명확하게 정의되지 않는다면 이상화되거나 지나치게 형식적인 의미로 해석되어서는 안된다. 간결함 및/또는 명료함을 위해 널리 공지된 물질, 방법, 기능 또는 구축은 본원에서 상세하게 기재되지 않는다.
본원에서 사용된 바와 같이, 용어 "약"은 측정가능한 값, 예컨대 질량, 농도, 시간, 온도 등의 양과 관련하여 사용되는 경우 명시된 양의 0.1%, 0.25%, 0.5%, 0.75%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19% 또는 20%의 변동을 포함하는 것을 의미한다. 달리 나타내지 않는다면, 명세서에서 모든 수치 값은 용어 "약"에 의해 수식되는 것으로 이해되어야 한다.
본원에서 사용된 바와 같이, 용어 "및/또는"은 연관되어 나열된 항목들 중 하나 이상의 임의의 모든 조합, 뿐만 아니라 대안적으로 ("또는") 해석되는 경우 조합의 결여를 포함하는 것으로 의도된다.
본원에서 사용된 바와 같이, 용어 "포함하다" 및 그의 문법적 변형은 명시된 특색, 단계, 작업, 요소 및/또는 성분의 존재를 명시하지만, 하나 이상의 다른 특색, 단계, 작업, 요소, 성분 및/또는 이들의 그룹의 존재 또는 추가를 배제하지 않는다. 조성물 또는 방법에서 파라미터 범위의 정의와 관련하여, 이러한 용어는 각각의 조성물 또는 방법이 파라미터 값의 최대치 초과 및 파라미터 값의 최소치 미만을 포함하지 않는다는 것을 의미한다. 예를 들어, 발효에 유용한 배지인 경우 0.01-0.1 %(v/v)의 복합 배지 성분을 포함하는 발효 배지에서, 복합 배지 성분의 총 농도는 0.01 %(v/v) 이상 및 0.1 %(v/v) 이하이다. 본원에서 사용된 바와 같이, 용어 "포함하는"은 또한 용어 "로 이루어진"을 포함한다.
본원에서 사용된 바와 같이, 용어 "로 본질적으로 이루어진" (및 그의 문법적 변형)은 본 발명의 조성물 및 방법에 적용될 때, 추가의 성분이 조성물/방법을 실질적으로 변경시키지 않는 한, 조성물/방법이 추가의 성분을 함유할 수 있음을 의미한다. 용어 "실질적으로 변경시키다"는 조성물/방법에 적용될 때, 조성물/방법의 효율을 적어도 약 20% 이상 증가시키거나 감소시키는 것을 지칭한다. 예를 들어, 생산 숙주 미생물의 게놈에 통합된 또는 상기 게놈에서 불활성화된 발현 카세트가 미생물의 이타코네이트 생산율을 적어도 50% 증가시키거나 감소시키는 경우, 이는 미생물을 "실질적으로 변경시킨다".
본 발명에 따른 미생물의 "게놈"은, 비록 자율적으로 복제하더라도 미생물 종의 정의에서 구성적이지 않은 유리 바이러스 및 유리 플라스미드와 같은 별도의 분자를 제외하고, 복제하고 유전가능한 유전 물질 (전형적으로 및 바람직하게는 DNA)의 총체이다.
본원에서 사용된 바와 같이, 용어 "발현" 또는 "유전자 발현"은 유전자 산물, 바람직하게는 단백질 또는 기능적 RNA의 합성 과정을 지칭하며, 일반적으로 DNA 전사, 임의적으로 RNA 가공, 및 단백질 발현의 경우에는, RNA 번역의 단계를 이용한다. 용어 "발현 카세트" (및 그의 문법적 또는 어의적 변형)는 이 세그먼트의 발현을 위해 준비된 핵산 세그먼트 ("서열"로도 지칭됨)를 포함하는 핵산, 바람직하게는 DNA의 세그먼트를 지칭한다. 발현 카세트는 또한 숙주 세포에서 상기 핵산 세그먼트의 증강된 발현을 가능하게 하는 요소를 포함할 수 있다. 이들 요소에는 인핸서, 반응 요소, 종결자 서열, 폴리아데닐화 서열 등이 포함될 수 있다.
본 발명에 따라, "프로모터"는 숙주 세포에서 전사를 개시할 수 있는 연속적인 핵산 구획이다. 프로모터는 증식가능한 조건 하에 각각의 미생물에서 상응하는 유전자의 전사를 일으키는데 충분한 경우에 "기능적"이다. 적합한 프로모터는 유도성 또는 억제성 또는 구성적으로 활성일 수 있으며, 여기서 유도성 및 억제성 프로모터의 경우에는 전사 수준이 환경적 또는 화학적 조건에 따라 달라지고, 구성적 프로모터는 발효 동안에 대부분의 조건 하에 활성이다. 또한, 프로모터는 본래의 리보솜 결합 부위를 적절하게 선택된 상이한 리보솜 결합 부위로 대체함으로써 변경될 수 있다. 바람직한 프로모터는 다음과 같다:
가장 바람직하게는, 본 발명에 따른 강한 구성적으로 활성인 프로모터는 pACTIN 프로모터이고, 서열식별번호: 74에 따른 서열과 적어도 96%의 서열 동일성을 갖는다. 이 프로모터는 유리하게는 슈도지마에서 다양한 단백질의 특히 광범위한 발현을 가능하게 하고, 실시예에서 추가로 기재된다.
용어 "혼성화"는, 폴리뉴클레오티드가 낮은, 중간, 높은 또는 매우 높은 엄격도 조건 하에 표지된 핵산 프로브, 또는 그의 전장 상보성 가닥, 또는 이들의 하위 서열에 어닐링하는 ("혼성화하는") 것을 나타낸다. 혼성화가 일어나게 하기 위해, 핵산 분자는 일반적으로 열적으로 또는 화학적으로 변성되어, 이중 가닥을 2개의 단일 가닥으로 용융시키고/거나, 단일 표준 핵산으로부터 헤어핀 또는 다른 이차 구조를 제거한다. 이러한 혼성체의 형성 또는 용융은 다양한 파라미터, 예를 들어 온도에 따라 좌우된다. 온도의 증가는 용융을 우세하게 하는 반면에, 온도의 감소는 혼성화를 우세하게 한다. 그러나, 이러한 혼성체 형성 과정은 적용된 온도 변화를 선형 방식으로 따르지 않고: 혼성화 과정은 동적이고, 이미 형성된 뉴클레오티드 쌍은 또한 인접한 뉴클레오티드의 쌍 형성을 지원한다. 따라서, 양호한 근사에 의해, 혼성화는 예-또는-아니오 과정이고, 기본적으로 혼성화와 비혼성화 사이의 경계를 정의하는 온도가 있다. 이 온도는 용융 온도 (Tm)이다. Tm은 주어진 뉴클레오티드 서열의 모든 분자의 50%가 이중 가닥으로 혼성화하고 50%가 단일 가닥으로 존재하는 섭씨 온도이다.
용융 온도 (Tm)는 분석된 핵산 서열의 물리적 성질에 따라 좌우되고, 따라서 2개의 별개의 서열 사이의 관계를 나타낼 수 있다. 그러나, 용융 온도 (Tm)는 또한 서열과 직접적으로 관련이 없는 다양한 다른 파라미터에 의해 영향을 받으며, 혼성화 실험의 적용 조건이 고려되어야 한다. 예를 들어, 염 (예를 들어 1가 양이온)의 증가는 더 높은 Tm을 초래한다.
주어진 혼성화 조건에 대한 Tm은 물리적인 혼성화 실험을 수행함으로써 결정될 수 있지만, Tm은 또한 DNA 서열의 주어진 쌍에 대해 인 실리코로 추정될 수 있다. 이 실시양태에서, [Meinkoth and Wahl (Anal. Biochem., 138:267-284, 1984)]의 방정식은 50개 이상의 염기 길이를 갖는 스트레치에 대해 이용된다:
Tm = 81.5℃ + 16.6 (log M) + 0.41 (% GC) - 0.61 (% 포름) - 500/L
M은 1가 양이온의 몰농도이고, % GC는 DNA 스트레치에서 구아노신 및 시토신 뉴클레오티드의 백분율이고, % 포름은 혼성화 용액 중에서 포름아미드의 백분율이고, L은 염기 쌍에서 혼성체의 길이이다. 상기 방정식은 0.01 내지 0.4 M 범위의 염 및 30% 내지 75% 범위의 % GC에 대한 것이다.
Tm 초과는 완벽하게 매칭된 프로브에 대한 온도이지만, Tm은 1%의 미스매칭 마다 약 1℃만큼 감소된다 (Bonner et al., J. Mol. Biol. 81: 123-135, 1973):
Tm = [ 81.5℃ + 16.6(log M) + 0.41 (%GC) - 0.61 (%포름아미드) - 500/L ] - %비-동일성
이 방정식은 35개 이상의 뉴클레오티드를 갖는 프로브에 유용하고, 과학적 방법 문헌에서 (예를 들어: ["Recombinant DNA Principles and Methodologies", James Greene, Chapter "Biochemistry of Nucleic acids", Paul S. Miller, page 55; 1998, CRC Press]), 여러 특허 출원에서 (예를 들어: US 7026149), 및 또한 상업적 회사의 데이터 시트에서 (예를 들어 www.genomics.agilent.com으로부터의 "Equations for Calculating Tm") 널리 참고된다.
용어 "낮은 엄격도 조건"은 적어도 100개 뉴클레오티드 길이인 프로브에 대해, 5X SSPE, 0.3% SDS, 200 마이크로그램/ml 전단된 및 변성된 연어 정자 DNA, 및 25% 포름아미드 중에서 42℃에서 사전 혼성화 및 혼성화, 이후에 12 내지 24시간 동안 표준 서던 블롯팅 절차를 의미한다. 최종적으로 담체 물질을 50℃에서 매회 15분 동안 0.2X SSC, 0.2% SDS를 사용하여 3회 세척한다.
용어 "중간 엄격도 조건"은 적어도 100개 뉴클레오티드 길이인 프로브에 대해, 5X SSPE, 0.3% SDS, 200 마이크로그램/ml 전단된 및 변성된 연어 정자 DNA, 및 35% 포름아미드 중에서 42℃에서 사전 혼성화 및 혼성화, 이후에 12 내지 24시간 동안 표준 서던 블롯팅 절차를 의미한다. 최종적으로 담체 물질을 55℃에서 매회 15분 동안 0.2X SSC, 0.2% SDS를 사용하여 3회 세척한다.
용어 "중간-높은 엄격도 조건"은 적어도 100개 뉴클레오티드 길이인 프로브에 대해, 5X SSPE, 0.3% SDS, 200 마이크로그램/ml 전단된 및 변성된 연어 정자 DNA, 및 35% 포름아미드 중에서 42℃에서 사전 혼성화 및 혼성화, 이후에 12 내지 24시간 동안 표준 서던 블롯팅 절차를 의미한다. 최종적으로 담체 물질을 60℃에서 매회 15분 동안 0.2X SSC, 0.2% SDS를 사용하여 3회 세척한다.
용어 "높은 엄격도 조건"은 적어도 100개 뉴클레오티드 길이인 프로브에 대해, 5X SSPE, 0.3% SDS, 200 마이크로그램/ml 전단된 및 변성된 연어 정자 DNA, 및 50% 포름아미드 중에서 42℃에서 사전 혼성화 및 혼성화, 이후에 12 내지 24시간 동안 표준 서던 블롯팅 절차를 의미한다. 최종적으로 담체 물질을 65℃에서 매회 15분 동안 0.2X SSC, 0.2% SDS를 사용하여 3회 세척한다.
용어 "매우 높은 엄격도 조건"은 적어도 100개 뉴클레오티드 길이인 프로브에 대해, 5X SSPE, 0.3% SDS, 200 마이크로그램/ml 전단된 및 변성된 연어 정자 DNA, 및 50% 포름아미드 중에서 42℃에서 사전 혼성화 및 혼성화, 이후에 12 내지 24시간 동안 표준 서던 블롯팅 절차를 의미한다. 최종적으로 담체 물질을 70℃에서 매회 15분 동안 0.2X SSC, 0.2% SDS를 사용하여 3회 세척한다.
용어 "서열 동일성"은 각각 2개의 아미노산 서열 또는 2개의 핵산 서열 사이에서 최대 허용 편차에 대한 수치적 지표를 나타내며, 여기서 1개의 서열 ("벤치마크 서열"로도 지칭됨)은 공지된 것이고, 다른 서열은 벤치마크 서열과 비교되어야 하는 것이다. 편차는 먼저 비교될 2개의 서열을 정렬시킨 다음, 각각 동일한 아미노산 또는 뉴클레오티드의 개수를 카운팅하고, 정렬에 따라 이 서열에서의 모든 갭을 포함하는 벤치마크 서열의 총 길이로 나눔으로써 결정된다. 정렬은 하기 파라미터에 의해 니들만-운쉬-알고리즘(Needleman-Wunsch-algorithm)을 이용하여 수행된다 (Needleman, Saul B. & Wunsch, Christian D. (1970): "A general method applicable to the search for similarities in the amino acid sequence of two proteins"; Journal of Molecular Biology. 48 (3): 443-453):
- 아미노산 정렬의 경우: 10의 갭 오픈 패널티, 0.5의 갭 확장 패널티, EBLOSUM62 (BLOSUM62의 EMBOSS 버전) 치환 매트릭스
- 핵산 정렬의 경우: 10의 갭 오픈 패널티, 0.5의 갭 확장 패널티, EDNAFULL (NCBI NUC4.4의 EMBOSS 버전) 치환 매트릭스
예를 들어, 벤치마크 서열 GATCTGA (7개 뉴클레오티드)에 대한 시험 서열 AAGATACTG (9개 뉴클레오티드)의 정렬은 다음과 같을 것이다:
따라서, 6개의 동일한 위치 ("GAT" 및 "CTG")가 있고, 벤치마크 서열 길이는 정렬로 인해 1개 위치만큼 증가되고, 이에 따라 서열 동일성은 6 / (7 + 1) * 100 = 75%이다.
아미노산이 본 발명에 따른 서열에서 변화될 수 있는 경우, 이러한 변화는 바람직하게는 보존적 돌연변이이다. 아미노산에 대한 표준 한 글자 암호를 이용하여, 아미노산 A는 아미노산 S로 보존적으로 대체가능하고; 아미노산 D는 아미노산 E, N으로 보존적으로 교환가능하고; 아미노산 E는 아미노산 D, K, Q로 보존적으로 교환가능하고; 아미노산 F는 아미노산 W, Y로 보존적으로 교환가능하고; 아미노산 H는 아미노산 N, Y로 보존적으로 교환가능하고; 아미노산 I는 아미노산 L, M, V로 보존적으로 교환가능하고; 아미노산 K는 아미노산 E, Q, R로 보존적으로 교환가능하고; 아미노산 L은 아미노산 I, M, V로 보존적으로 교환가능하고; 아미노산 M은 아미노산 I, L, V로 보존적으로 교환가능하고; 아미노산 N은 아미노산 D, H, S로 보존적으로 교환가능하고; 아미노산 Q는 아미노산 E, K, R로 보존적으로 교환가능하고; 아미노산 R은 아미노산 K, Q로 보존적으로 교환가능하고; 아미노산 S는 아미노산 A, N, T로 보존적으로 교환가능하고; 아미노산 T는 아미노산 S로 보존적으로 교환가능하고; 아미노산 V는 아미노산 I, L, M으로 보존적으로 교환가능하고; 아미노산 W는 아미노산 F, Y로 보존적으로 교환가능하고; 아미노산 Y는 아미노산 F, H, W로 보존적으로 대체가능하다. 특히 바람직한 대체는 아미노산에 대한 표준 세 글자 암호를 이용하여 Ala<->Glu, Ala<->Gly, Ala<->Pro, Ala<->Ser, Ala<->Thr, Ala<->Val, Arg<->Lys, Asn<->Ser, Asp<->Asn, Asp<->Glu, Asp<->Gly, Gly<->Ser, Leu<->lle, Leu<->Val, Phe<->Tyr, Ser<->Thr 및 Val<->lle이다.
용어 "야생형" 미생물은 미생물의 비교를 위해 본원에서 사용되며, 구체적인 비교를 위해 문제의 특색이 없는 미생물을 지칭한다. 전형적으로, 이러한 미생물은 문제의 미생물이 유래되었거나 또는 유래될 수 있는 조상 균주이다. 예를 들어, "상응하는 야생형 미생물에서 N개 뉴클레오티드에 의해 분리된 유전자 A와 B 사이에 삽입물을 포함하는 생산 숙주 미생물"과 같은 표현은 다음과 같이 해석되어야 한다: "야생형 미생물"은 야생형 미생물의 관련 핵산 (전형적으로 그의 염색 성질과 관계없이 "염색체"로 지칭됨)에서 유전자 A와 B를 연결하는 서열을 제외하고는 생산 숙주 미생물과 동일한 미생물이며, 이에 따라 유전자 A가 유전자 B의 5' 위치에 있는 경우에, 상기 야생형 미생물에서 유전자 A의 3' 경계 (즉, 정지 코돈) 및 유전자 B의 5' 경계 (즉, 개시 코돈)는 N개 뉴클레오티드에 의해 분리되어 있다.
유니프롯 항목은 2018-03-01 자정 CET 현재의 각각의 서열을 기준으로 한다.
본 발명의 특정한 측면이 그의 실시양태를 참고하여 이후에 기재될 것이지만, 청구항에 의해 정의되는 본 개시내용의 개념 및 범위를 벗어나지 않고 형태 및 상세한 내용에서 다양한 변화가 그 안에서 이루어질 수 있음을 이해한다.
본 발명은 이타콘산 및/또는 그의 염의 생산에 관한 것이다. 본 명세서에서 이타콘산이 언급되는 경우에는 언제나, 이러한 언급이 기술적으로 모두 합리적이라면 이타코네이트에도 (반대의 경우에도) 적용된다.
본 발명은 이타콘산 생산 숙주 미생물을 제공한다. 본 발명의 목적을 위해, 생산 숙주 미생물은 바람직하게는 바시디오마이코타(Basidiomycota) 문에 속한다. 상기 기재된 바와 같이, 이 미생물 문은 과거에 수많은 시도에도 불구하고 이타콘산의 생산을 위해 산업적으로 사용된 적이 없다. 본 발명은 상기 언급된 선행 기술에서의 믿음과는 대조적으로 이타콘산의 생산에 수반되는 모든 유전자를 과다발현하는 것이 충분하지 않고/거나 필요하지 않다는 발견에 기초한다. 대신에, 본 발명은 RIA1 유전자의 발현을 위한 발현 카세트의 게놈으로의 안정한 통합을 특징으로 하는 변형된 미생물을 제공하고/거나, 이타콘산 생산을 위해 불활성화되어야 하는 바시디오마이코타 문의 미생물에 일반적으로 존재하는 유전자를 제안한다. 바람직하게는, 이러한 불활성화는 RIA1 유전자의 발현을 위한 발현 카세트의 통합에 의해 수행된다. 이에 따라, 본 발명은 원치않는 부산물, 특히 말레이트의 높은 생산율을 동시에 허용할 필요없이 이타콘산의 높은 생산율을 달성하는 분류학상 분지의 미생물의 발효에 이용가능하다.
본 발명에 따라, 이타콘산 생산 숙주 미생물은 대안적으로 "생산 숙주", "숙주 미생물", "생산 미생물" 등으로 명명된다. 용어 "생산 숙주 미생물" 및 그의 상응하는 용어상의 변형은 예를 들어 복제 동안에 발생하는 돌연변이로 인해 또는 예를 들어 추가의 형질전환으로 인해 모 세포와 동일하지 않은 모 세포의 임의의 자손을 포함한다.
본 발명에 따른 생산 숙주 미생물은 이타콘산의 생산을 위한 활성 대사 경로를 포함한다. 본 발명에 따른 숙주 미생물은 자연적으로, 즉, 심지어 기능성 프로모터의 제어 하의 RIA1 유전자를 포함하는 적어도 1개의 발현 카세트가 미생물의 게놈에 통합되기 전에도, 이러한 활성 이타콘산 경로를 포함할 수 있다. 그러나, 본 발명은 또한 하기에 기재되는 바와 같이 활성 이타콘산 경로를 자연적으로 포함하지 않는 이러한 미생물을 기반으로 하여 이타콘산 생산 숙주 미생물을 수득하는 방법을 제공한다.
본 발명의 측면에 따라, 생산 숙주 미생물은 발현 카세트를 포함한다. 발현 카세트는 기능성 프로모터의 작동가능한 제어 하의 RIA1 유전자를 포함한다.
바람직하게는, 발현 카세트에서 RIA1 유전자는 RIA1 유전자에 작동가능하게 연결된 프로모터의 관점에서 이종성이다. 본 발명의 목적을 위해 이종성 서열은 (a) 비-숙주 서열, (b) 1개 이상의 염기 또는 아미노산 (적용가능한 경우)의 (ba) 삽입, (bb) 대체 및/또는 (bc) 결실에 의해 변경된 서열, (c) 상이한 숙주 세포 균주로부터의 서열, 또는 (d) 숙주 세포의 상이한 게놈 위치로부터의 상동성 서열 중 임의의 것이고; 예를 들어, 핵산 서열의 인공적인 복제물은 본원에서 이종성으로 고려된다. "상동성" 서열은 동일한 유전적 공급원 또는 종에서 발견되는 서열이며, 즉, 이는 숙주 세포의 관련 종에서 천연 발생하고, 동일한 또는 유사한 기능을 수행한다. 따라서, 바람직하게는 본 발명에 따른 발현 카세트에서 RIA1 유전자는, 야생형 생산 숙주 미생물이 발현된 RIA1 유전자를 천연적으로 포함하는 경우에, 상기 야생형 생산 숙주 미생물에서의 RIA1 유전자에 작동가능하게 연결된 임의의 프로모터와는 상이한 프로모터에 작동가능하게 연결된다. 이러한 방식으로 본 발명은 이타콘산 발효 과정의 필요에 따라 RIA1 유전자의 발현에 선택적으로 영향을 미칠 수 있다. 이후의 기재는 이러한 특히 바람직한 발현 카세트의 예시 및 설명을 제공한다.
RIA1 유전자는 바람직하게는 생산 숙주 미생물의 관점에서 이종성이다. 바람직하게는, RIA1 유전자 서열은 별도의 유전적 공급원 또는 종으로부터 유래된다.
발현 카세트는 ip 로커스의 외부에서 통합된다. 문헌 WO 2015/140314 A1은 RIA1의 과다발현이 이타콘산 생산을 증가시킨다고 개시하고 있지만, 생산율이 본 발명에 따른 것보다 낮게 유지되었다. WO 2015/140314 A1에 따라 통합 부위로서 사용된 ip 로커스는 [Loubradou et al., "A homologue of the transcriptional repressor Ssn6p antagonizes cAMP signalling in Ustilago maydis", Molecular microbiology. 2001, 719-30]에 추가로 기재되어 있다. 이 통합 부위를 피함으로써, 본 발명에 따라 기술적으로 실현가능한 이타콘산 생산율이 수득된다. 의심의 여지를 없애기 위해, 통합은 적어도 (a) 통합된 핵산이 예를 들어 상동성 재조합에 의해 발생할 때 ip 로커스의 (가능하게는 말단절단된 또는 다소 돌연변이된) 복제물에 의해 양측에서 플랭킹되는 경우에, 또는 (b) 미생물이 상응하는 야생형 균주에서 ip 로커스를 포함하거나 중첩하는 위치에서 통합된 핵산을 함유하는 경우에, ip 로커스의 외부가 아니라 그에서 또는 그 안에서 일어난 것으로 고려되며; 이는 예를 들어 대체 통합에 의해 발생한다. 바시디오마이세테스(basidiomycetes) 및 프라이머에서 ip 로커스를 확인하는 방법, 이렇게 확인된 ip 로커스에 구축물을 부위-특이적으로 통합시키기 위한 벡터 및 방법은 [Zambanini et al., Metabolic Engineering Communications 2017, 12-21], 특히 14-16 페이지에 기재되어 있다.
본 발명에 따라, ip 로커스는 숙시네이트 데히드로게나제의 철-황 단백질 서브유닛을 코딩하는 유전자의 발현을 담당하는 영역이다. 이러한 유전자 서열은 [Broomfield and Hargreaves, Current Genetics 1992, 117-121] 및 특히 상기 공보의 도 2에서 우스틸라고 마이디스(Ustilago maydis)에 대해 기재되어 있다. ip 로커스에 대한 추가의 설명에 대한 상기 공보 및 특히 상기 도 2는 본원에 참고로 포함된다. 본 발명이 ip 로커스 및 그에 따라 숙시네이트 데히드로게나제의 상응하는 철-황 단백질 서브유닛의 기능과는 관련이 없다는 것을 주목하는 것이 중요하며; 본 발명자들은 이타콘산의 생산이 본원에 기재된 적어도 1개의 발현 카세트를 각각의 미생물의 ip 로커스 외부에서 통합시킴으로써 개선된다는 것을 발견하였다. 바람직하게는, 미생물의 ip 로커스는 본원에 기재된 발현 카세트를 함유하지 않고, 보다 더 바람직하게는 ip 로커스는 이종성 유전자 서열을 함유하지 않는다.
바람직하게는, ip 로커스는 숙시네이트 데히드로게나제의 철-황 단백질 서브유닛을 코딩하는 미생물의 유전가능한 유전 물질의 로커스이다. 추정 폴리펩티드가 숙시네이트 데히드로게나제의 철-황 단백질 서브유닛의 기능을 전달하는지 여부는 예를 들어 재구성에 의해, 즉, 하기 단계를 포함하는 방법에 의해 시험될 수 있다:
1. 시험 미생물에서 숙시네이트 데히드로게나제의 철-황 단백질 서브유닛을 코딩하는 모든 유전자를 불활성화시켜, 시험 유기체의 표현형을 카르복신 내성에서 카르복신 민감성으로 변화시킴; 이에 대한 설명은 상기 공보 [Broomfield and Hargreaves]에서 확인됨;
2. 시험 미생물에서 추정 폴리펩티드를 발현함;
3. 단계 2에서 수득한 시험 유기체에서 카르복신 내성을 측정함; 카르복신 내성이 재구성된 경우에는, 그럴듯한 다른 설명이 없이도 추정 폴리펩티드가 숙시네이트 데히드로게나제의 철-황 단백질 서브유닛의 기능을 전달할 가능성이 가장 높다.
따라서, 좁은 의미에서 본 발명에 따른 ip 로커스는 그의 변형이 카르복신 민감성을 유도하는 로커스이며, 여기서 숙시네이트 데히드로게나제의 철-황 단백질 서브유닛의 발현은 카르복신 내성의 재구성을 유도한다. 바람직하게는, ip 로커스는 P32420 (SDHB_USTMA), R9NZ36 (R9NZ36_PSEHS), M9MBS9 (M9MBS9_PSEA3), I2G708 (I2G708_USTH4) 및 V5F1L5 (V5F1L5_KALBG)로 이루어진 군으로부터 선택된 유니프롯 항목에 따라 아미노산 서열과 적어도 약 10% 서열 동일성을 갖는, 보다 더 바람직하게는 P32420 (SDHB_USTMA), R9NZ36 (R9NZ36_PSEHS), M9MBS9 (M9MBS9_PSEA3), I2G708 (I2G708_USTH4) 및 V5F1L5 (V5F1L5_KALBG)로 이루어진 군으로부터 선택된 유니프롯 항목에 따른 아미노산 서열과 적어도 20%, 또는 보다 더 바람직하게는 적어도 30%, 또는 보다 더 바람직하게는 적어도 40%, 또는 보다 더 바람직하게는 적어도 50%, 또는 보다 더 바람직하게는 적어도 60%, 또는 보다 더 바람직하게는 적어도 70%, 또는 보다 더 바람직하게는 적어도 80%, 또는 보다 더 바람직하게는 적어도 90%, 또는 보다 더 바람직하게는 적어도 94%, 또는 보다 더 바람직하게는 적어도 98% 서열 동일성을 갖는 폴리펩티드를 코딩하는 유전자이다. 미생물이 우스틸라고 속인 경우, 아미노산 서열 동일성은 바람직하게는 유니프롯 항목 P32420 (SDHB_USTMA)에 대해 비교함으로써 결정되고; 미생물이 칼마노지마(Kalmanozyma) 속인 경우, 아미노산 서열 동일성은 바람직하게는 유니프롯 항목 V5F1L5 (V5F1L5_KALBG)에 대해 비교함으로써 결정되고; 미생물이 슈도지마 속인 경우, 아미노산 서열 동일성은 바람직하게는 서열식별번호: 48에 대해 비교함으로써 결정된다. 보다 더 바람직하게는, ip 로커스는 서열식별번호: 48에 따른 아미노산 서열과 적어도 10% 서열 동일성을 갖는, 보다 더 바람직하게는 서열식별번호: 48에 다른 아미노산 서열과 적어도 20%, 또는 보다 더 바람직하게는 적어도 30%, 또는 보다 더 바람직하게는 적어도 40%, 또는 보다 더 바람직하게는 적어도 50%, 또는 보다 더 바람직하게는 적어도 60%, 또는 보다 더 바람직하게는 적어도 70%, 또는 보다 더 바람직하게는 적어도 80%, 또는 보다 더 바람직하게는 적어도 90%, 또는 보다 더 바람직하게는 적어도 94%, 또는 보다 더 바람직하게는 적어도 98% 서열 동일성을 갖는 폴리펩티드를 코딩하는 유전자이다.
따라서, 더욱 바람직한 더욱 넓은 의미에서 본 발명에 따른 ip 로커스는 숙시네이트 데히드로게나제의 철-황 단백질 서브유닛을 코딩하는 유전자를 포함하고, 서열식별번호: 50 (숙시네이트 데히드로게나제의 철-황 서브유닛을 코딩하는 유. 마이디스인 EMBL 항목 Z11738.1의 코딩 영역임)과 적어도 75%, 보다 더 바람직하게는 적어도 50% 서열 동일성을 갖는 핵산 서열로 이루어지는 ip 로커스이다. 특히, 미생물이 슈도지마 속인 경우에는, ip 로커스가 바람직하게는 서열식별번호: 51 (서열식별번호: 50에 따른 서열에 대한 슈도지마 츠쿠바엔시스의 등가물임)과 적어도 75%, 보다 더 바람직하게는 적어도 50% 서열 동일성을 갖는 핵산 서열로 이루어진다.
보다 더 바람직하게는, 본 발명에 따라 적어도 1개의 및 가장 바람직하게는 모든 발현 카세트는, 숙시네이트 데히드로게나제의 철-황 단백질 서브유닛을 코딩하는 유전자를 포함하고, 서열식별번호: 52 (EMBL 항목 Z11738.1의 서열임)와 적어도 75%, 보다 더 바람직하게는 적어도 50% 서열 동일성을 갖는 핵산 서열로 이루어지는 ip 로커스의 외부에서 통합된다. 특히, 미생물이 슈도지마 속인 경우, 바람직하게는 본 발명에 따라 적어도 1개의 및 가장 바람직하게는 모든 발현 카세트가, 숙시네이트 데히드로게나제의 철-황 단백질 서브유닛을 코딩하는 유전자를 포함하고, 서열식별번호: 53과 적어도 75%, 보다 더 바람직하게는 적어도 50% 서열 동일성을 갖는 핵산 서열로 이루어진 ip 로커스의 외부에서 통합된다.
본 발명에 따라 적어도 1개의 및 바람직하게는 모든 발현 카세트가 제1 경계 영역 및 제2 경계 영역에 의해 정의되는 서열 영역의 외부에서 통합될 때 특히 바람직하며, 여기서 제1 경계 영역은 서열식별번호: 54와 적어도 50% 서열 동일성을 갖는 핵산으로 이루어지고, 제2 경계 영역은 서열식별번호: 55와 적어도 50% 서열 동일성을 갖는 핵산 서열로 이루어진다. 제1 및 제2 경계 영역은 바람직하게는 야생형 미생물에서 적어도 약 800 내지 5000개 뉴클레오티드, 더욱 바람직하게는 880 내지 약 2000개 뉴클레오티드 및 가장 바람직하게는 적어도 1100 내지 2000개 뉴클레오티드에 의해 떨어져 있다. 서열 서열식별번호: 54 및 55는 슈도지마 츠쿠바엔시스의 서열식별번호: 53에 따른 서열에 인접한 좌측 및 우측 경계 서열이다. 가장 바람직하게는, 본 발명에 따른 모든 발현 카세트는 서열식별번호: 56에 따른 서열과 적어도 50% 서열 동일성을 갖는 핵산 서열의 외부에서 통합된다.
본 발명에 따라 (a) RIA1 유전자의 발현을 위한 및/또는 (b) ADI1, MTT1 및 TAD1로 이루어진 군으로부터 선택된 적어도 2개의 유전자의 발현을 위한 발현 카세트를 포함하는 재조합 이타콘산 생산 숙주 미생물이 제공된다. 본 발명에 따른 숙주 미생물과 같이 활성 이타콘산 대사 경로를 갖는 미생물은 (적어도 이타콘산 생산 조건 하에) 일반적으로 MTT1 미토콘드리아 트리카르복실레이트 수송인자 유전자, ADI1 아코니테이트 델타-이소머라제 유전자, TAD1 트랜스-아코니테이트 데카르복실라제 유전자 및 ITP1 이타코네이트 수송 단백질 유전자를 발현할 것이다. 바람직하게는 본 발명의 미생물은 (적어도 이타콘산 생산 조건 하에) RIA1 전사 조절인자 유전자를 또한 발현할 것이다. 본원에 기재된 바와 같이, 본 발명에 따른 RIA1 유전자 산물은 ADI1 유전자, MTT1 유전자, TAD1 유전자 및/또는 ITP1 유전자의 발현을 증가시키고, 이에 따라 유리하게는 낮은 말레이트 생산과 함께 높은 이타콘산 생산율이 유도된다. 임의적으로, 미생물은 (적어도 이타콘산 생산 조건 하에) 예를 들어 아스퍼길루스 테레우스로부터인 것으로 공지된 CAD1 시스-아코니테이트 데카르복실라제 유전자를 발현할 수 있으며, 여기서 이러한 CAD1 발현은 ADI1 및/또는 TAD1의 발현과 동시에 발생할 수 있거나 또는 그를 대신할 수 있다.
본 발명에 따른 미생물의 종이 이미 활성 이타콘산 경로를 포함하는 경우에는, 본원에 기재된 위치에서 미생물의 게놈에 통합된 RIA1 유전자의 발현을 위한 1개 이상의 발현 카세트만을 갖는 것이 가능하지만 반드시 바람직한 것은 아니다. 그러나, 미생물은 RIA1 유전자, 및 ADI1, ITP1, MTT1 및 TAD1 유전자 중 1개 이상을 위한 이종성 발현 카세트를 포함할 수 있다. 특히, 야생형 바시디오마이세테스가 이종성 RIA1 유전자 발현 카세트의 발현에 의해 발현이 유도되지 않는 ADI1, ITP1, MTT1 및/또는 TAD1 유전자를 포함하는 경우에는, 바람직하게는 본원에 기재된 부위에서 미생물의 게놈으로부터 유래된 각각의 ADI1, ITP1, MTT1 및/또는 TAD1 유전자의 발현 카세트를 미생물의 게놈에 안정하게 통합시키는 방식으로 도입하는 것이 바람직하며, 이러한 유전자는 RIA1 유전자에 의해 유도될 수 있다. 이러한 방식으로 이종성 RIA1 발현 카세트 (바람직하게는 기능성 프로모터의 제어 하의 이종성 RIA1 유전자를 포함함)의 효과가 유리하게 달성되고, 이는 유리한 이타콘산 생산율 및/또는 무시할만한 말레이트 부산물을 용이하게 한다.
발현 카세트는
a) 좌측 경계 유전자와 우측 경계 유전자 사이에 위치하며, 여기서 좌측 및 우측 경계 유전자의 각각의 번역 개시 코돈의 각각의 제1 뉴클레오티드는 상응하는 야생형 미생물에서 최대 51600개 뉴클레오티드에 의해 분리되어 있고,
여기서 좌측 경계 유전자는 아세틸-CoA 신테타제 활성을 갖는 단백질을 코딩하고,
여기서 우측 경계 유전자는 서열식별번호: 25와 적어도 21% 동일성을 갖는 아미노산 서열로 이루어진 단백질을 코딩하고/거나,
b) 서열식별번호: 3, 서열식별번호: 5, 서열식별번호: 7, 서열식별번호: 9, 서열식별번호: 11, 서열식별번호: 13, 서열식별번호: 15, 서열식별번호: 17, 서열식별번호: 19, 서열식별번호: 21, 서열식별번호: 23, 서열식별번호: 25 중 임의의 것과 적어도 30% 서열 동일성을 갖는 아미노산 서열로 번역되는 오픈 리딩 프레임의 가장 가까운 경계의 6500개 이하의 뉴클레오티드에 위치하고/거나,
c) 서열식별번호: 3, 서열식별번호: 5, 서열식별번호: 7, 서열식별번호: 9, 서열식별번호: 11, 서열식별번호: 13, 서열식별번호: 15, 서열식별번호: 17, 서열식별번호: 19, 서열식별번호: 21, 서열식별번호: 23, 서열식별번호: 25 또는 그의 엑손 중 임의의 것과 적어도 30% 서열 동일성을 갖는 아미노산 서열로 번역되는 오픈 리딩 프레임 내에 위치하거나 또는 그를 대체하는
통합 부위에서 미생물의 게놈에 통합된다.
실시예에 제시된 바와 같이, 본 발명은 ip 로커스의 외부에 있는 통합 부위를 확인하고, 이는 발현 카세트의 안정한 통합을 가능하게 하고, 부산물로서 말레이트의 실질적인 형성을 허용하지 않고 높은 이타콘산 생산율을 가능하게 한다.
본 발명을 설명하는 한 방식에 따라, 통합 부위는 아세틸-CoA 신테타제를 갖는 단백질을 코딩하는 좌측 경계 유전자와 서열식별번호: 25와 적어도 21% 동일성을 갖는 아미노산 서열로 이루어진 단백질을 코딩하는 오픈 리딩 프레임인 우측 경계 유전자 사이에 위치한다. 원형 게놈의 경우, 용어 "사이"는 야생형 게놈에서 좌측 및 우측 경계 유전자를 연결하는 더 짧은, 즉, 1개 이상의 발현 카세트의 통합이 없는 핵산 세그먼트를 지칭하는 것으로 이해해야 한다. 야생형 바시디오마이세테스에서, 좌측 및 우측 경계 유전자는 전형적으로 최대 51600개 뉴클레오티드, 바람직하게는 적어도 25800개 및 최대 51600개 뉴클레오티드, 보다 더 바람직하게는 적어도 28000개 및 최대 42200개 뉴클레오티드, 및 보다 더 바람직하게는 적어도 35000개 및 최대 42100개 뉴클레오티드에 의해 분리되어 있다.
본 발명을 설명하는 또 다른 방식에 따라, 통합 부위는 서열식별번호: 3, 서열식별번호: 5, 서열식별번호: 7, 서열식별번호: 9, 서열식별번호: 11, 서열식별번호: 13, 서열식별번호: 15, 서열식별번호: 17, 서열식별번호: 19, 서열식별번호: 21, 서열식별번호: 23, 서열식별번호: 25 또는 이들 임의의 서열의 엑손 중 임의의 것과 적어도 30% 서열 동일성을 갖는 아미노산 서열로 번역되는 오픈 리딩 프레임의 가장 가까운 경계의 6500개 이하의 뉴클레오티드에 위치한다. 실시예에 제시된 바와 같이, 이들 오픈 리딩 프레임은 본 발명에 따른 발현 카세트의 삽입에 적합한 위치에서 발견될 수 있다. 상기 언급된 서열은 임의의 생물학적 기능과는 무관하게 본 발명에 따른 삽입 부위의 위치를 설명하기 위해서만 제공되는 것으로 이해한다. 예를 들어 슈도지마 츠쿠바엔시스의 게놈에서 상기 언급된 서열이 상기 제공된 순서로 발생한다는 것을 주목한다. 이는 다른 바시디오마이세테스에서 상응하는 서열을 확인하는 것을 가능하게 한다.
바람직하게는, 통합 부위는 서열식별번호: 4, 서열식별번호: 6, 서열식별번호: 8, 서열식별번호: 10, 서열식별번호: 12, 서열식별번호: 14, 서열식별번호: 16, 서열식별번호: 18, 서열식별번호: 20, 서열식별번호: 22, 서열식별번호: 24, 서열식별번호: 26 중 임의의 것과 적어도 30% 서열 동일성을 갖는 임의의 핵산 서열의 가장 가까운 경계의 6500개 이하의 뉴클레오티드에 위치한다. 이들 핵산 서열은 특히 바람직한 야생형의 생산 숙주 미생물 슈도지마 츠쿠바엔시스에서 특히 바람직한 통합 부위에서 발견되었고; 이들은 각각의 아미노산 서열 서열식별번호: 3, 서열식별번호: 5, 서열식별번호: 7, 서열식별번호: 9, 서열식별번호: 11, 서열식별번호: 13, 서열식별번호: 15, 서열식별번호: 17, 서열식별번호: 19, 서열식별번호: 21, 서열식별번호: 23, 서열식별번호: 25에 상응한다. 따라서, 통합 부위는 서열식별번호: 4, 서열식별번호: 6, 서열식별번호: 8, 서열식별번호: 10, 서열식별번호: 12, 서열식별번호: 14, 서열식별번호: 16, 서열식별번호: 18, 서열식별번호: 20, 서열식별번호: 22, 서열식별번호: 24, 서열식별번호: 26 중 임의의 것과 적어도 30% 서열 동일성을 갖는 임의의 핵산 표적 서열의 가장 가까운 경계의 바람직하게는 6500개 이하의 뉴클레오티드, 바람직하게는 5500개 이하의 뉴클레오티드, 보다 더 바람직하게는 2800개 이하의 뉴클레오티드에 위치하며, 여기서 각각의 표적 서열은 적어도 가설적으로 각각 서열식별번호: 3, 서열식별번호: 5, 서열식별번호: 7, 서열식별번호: 9, 서열식별번호: 11, 서열식별번호: 13, 서열식별번호: 15, 서열식별번호: 17, 서열식별번호: 19, 서열식별번호: 21, 서열식별번호: 23 또는 서열식별번호: 25와 적어도 30% 동일성을 갖는 아미노산으로 번역된다.
보다 더 바람직하게는, 통합 부위는 서열식별번호: 19, 서열식별번호: 15 및/또는 서열식별번호: 29 중 임의의 것과 적어도 30% 서열 동일성을 갖는 아미노산 서열로 번역되는 오픈 리딩 프레임의 가장 가까운 경계의 6500개 이하의 뉴클레오티드, 바람직하게는 5500개 이하의 뉴클레오티드, 보다 더 바람직하게는 2800개 이하의 뉴클레오티드에 위치한다. 이들 아미노산 서열은 본 발명에 따라 크렙스 주기에 영향을 미치는 것과 연관된 대사 기능을 발휘하는 것으로 예상된다. 본 발명에 따른 1개 이상의 발현 카세트를 통합시킴으로써, 각각의 표적 폴리펩티드는 크렙스 주기에 의한 그들의 영향이 제거되도록 불활성화되거나 또는 하향조절된다.
본 발명을 설명하는 또 다른 방식에 따라, 발현 카세트는 서열식별번호: 3, 서열식별번호: 5, 서열식별번호: 7, 서열식별번호: 9, 서열식별번호: 11, 서열식별번호: 13, 서열식별번호: 15, 서열식별번호: 17, 서열식별번호: 19, 서열식별번호: 21, 서열식별번호: 23, 서열식별번호: 25 중 임의의 것과 적어도 30% 서열 동일성을 갖는 아미노산 서열로 번역되는 오픈 리딩 프레임 내에 통합되거나 또는 그를 대체한다. 상기 나타낸 아미노산 서열은 상기 기재된 대안 b)에 따른 뉴클레오티드 서열로부터 유래된다. 다시, 상기 언급된 서열은 임의의 생물학적 기능과는 무관하게 본 발명에 따른 삽입 부위의 위치를 설명하기 위해서만 주어지는 것으로 이해하며; 상응하는 야생형 미생물이 상기 언급된 임의의 서열을 갖는 폴리펩티드를 생산할 필요조차도 없다. 바람직하게는 상응하는 야생형 미생물에서 각각의 오픈 리딩 프레임은 적어도 6500개 뉴클레오티드 길이를 갖는다.
다시, 바람직하게는 적어도 1개의 발현 카세트가 서열식별번호: 4, 서열식별번호: 6, 서열식별번호: 8, 서열식별번호: 10, 서열식별번호: 12, 서열식별번호: 14, 서열식별번호: 16, 서열식별번호: 18, 서열식별번호: 20, 서열식별번호: 22, 서열식별번호: 24, 서열식별번호: 26 중 임의의 것과 적어도 30% 서열 동일성을 갖는 표적 핵산 서열 내에 통합되거나 또는 그를 대체하며, 여기서 표적 핵산 서열은 적어도 가설적으로 각각 서열식별번호: 3, 서열식별번호: 5, 서열식별번호: 7, 서열식별번호: 9, 서열식별번호: 11, 서열식별번호: 13, 서열식별번호: 15, 서열식별번호: 17, 서열식별번호: 19, 서열식별번호: 21, 서열식별번호: 23, 서열식별번호: 25와 적어도 30% 서열 동일성을 갖는 아미노산 서열로 번역된다. 그리고, 보다 더 바람직하게는, 적어도 1개의 발현 카세트가 각각 서열식별번호: 20, 서열식별번호: 16 및/또는 서열식별번호: 30 중 임의의 것과 적어도 30% 서열 동일성을 갖는 표적 핵산 서열 내에 통합되거나 또는 그를 대체하며, 여기서 표적 핵산 서열은 적어도 가설적으로 각각 서열식별번호: 19, 서열식별번호: 15 및/또는 서열식별번호: 29와 적어도 30% 서열 동일성을 갖는 아미노산 서열로 번역된다.
본 발명에 따른 미생물이 동일한 또는 상이한 로커스에 삽입된 2개 이상의 발현 카세트를 포함할 수 있는 것으로 이해해야 한다. 예를 들어, RIA1 발현을 위한 2개의 발현 카세트를 포함하는 한 예시적인 통합은 동일한 로커스에 통합된다. 본 발명에 따라, 발현 카세트 중 어느 것도 ip 로커스에 통합되지 않는 것이 바람직하다. 추가로 바람직하게는, 각각 RIA1, ADI1, MTT1 및 TAD1 유전자의 발현을 위한 본 발명에 따른 모든 발현 카세트는 상기 기재된 대안 a) 내지 c) 중 임의의 것에 주어진 부위에서 통합된다.
본 발명의 한 측면에 따른 재조합 이타콘산 생산 숙주 미생물은
a) 이타콘산 생산을 위한 활성 이타콘산 대사 경로를 포함하고, 바람직하게는
b)
i) 단백질 서열인 서열식별번호: 3, 서열식별번호: 5, 서열식별번호: 7, 서열식별번호: 9, 서열식별번호: 11, 서열식별번호: 13, 서열식별번호: 15, 서열식별번호: 17, 서열식별번호: 19, 서열식별번호: 21, 서열식별번호: 23 또는 서열식별번호: 25 중 임의의 것과 적어도 30% 서열 동일성을 갖는 단백질을 코딩하고/거나
ii) 적어도 낮은 엄격도 조건 하에 상기 단백질 서열을 코딩하는 핵산 서열과 혼성화하는 상보성 가닥인
적어도 1개의 유전자가 불활성화된 것이다.
실시예에 제시된 바와 같이, 바시디오마이세테스에서 RIA1 발현을 위한 플라스미드의 단순한 존재는 상응하는 야생형 균주와 비교하여 이타콘산 생산율을 확실하게 증가시키지 않는다. 하기 실시예는 qPCR에 의해 측정시 RIA1 발현에서의 중간 정도의 증가조차도 부산물로서 말레이트의 유의한 형성없이 유의하게 개선된 이타콘산 생산율을 유도할 수 있음을 보여주기 때문에, 이는 더욱 더 놀라운 것이다. 본 발명을 이종성 RIA1 유전자가 ip 로커스에서 우스틸라기노마이세테스의 게놈에 통합된 선행 기술과 비교하면 (예를 들어, [Zambanini et al., Biotechnol Biofuels, 2017, 10:131, employing constructs that integrate into the ip locus of U. vetiveriae strain TZ1; integration specificity is described by Geiser et al., Microbial Biotechnology 2016, 116-126], 122 페이지 참고), 본 발명의 실시예와 비교하여 명백히 낮은 이타콘산 생산율이 관찰되었고, 최적화된 조건 하에서도 원치않는 말레이트가 대략 1:1 - 3:1 비의 말레이트 (g/l):이타코네이트 (g/l)로 생산되었다.
따라서, 각각 서열식별번호: 3, 서열식별번호: 5, 서열식별번호: 7, 서열식별번호: 9, 서열식별번호: 11, 서열식별번호: 13, 서열식별번호: 15, 서열식별번호: 17, 서열식별번호: 19, 서열식별번호: 21, 서열식별번호: 23 또는 서열식별번호: 25와 적어도 30% 서열 동일성을 갖는 단백질을 코딩하는 적어도 1개, 더욱 바람직하게는 2개 이상의 유전자의 불활성화가 상기 언급된 이점을 수득하는데 유용하다는 것이 본 발명의 교시내용이다. 이러한 교시내용을 기재하는 또 다른 방식은, 적어도 1개, 더욱 바람직하게는 2개 이상의 유전자의 불활성화가 유리하며, 1개 이상의 유전자 각각이 적어도 낮은 엄격도 조건 하에 상기 언급된 임의의 서열을 코딩하는 핵산 서열과 혼성화하는 핵산 서열을 포함하거나 또는 그로 이루어진다는 것이다.
본원에 기재된 바와 같이, 불활성화는 바람직하게는 RIA1 유전자의 발현을 위한 및/또는 ADI1, MTT1 및 TAD1로 이루어진 군으로부터 선택된 적어도 2개의 유전자의 발현을 위한 발현 카세트의 통합에 의해 또는 그의 결과로서 수행된다.
본 발명에 따라, 불활성화된 적어도 1개의 유전자는 바람직하게는 그의 상보성 가닥이 적어도 중간 엄격도 조건 하에, 보다 더 바람직하게는 적어도 높은 엄격도 조건 하에, 보다 더 바람직하게는 매우 높은 엄격도 조건 하에 단백질 서열인 서열식별번호: 3, 서열식별번호: 5, 서열식별번호: 7, 서열식별번호: 9, 서열식별번호: 11, 서열식별번호: 13, 서열식별번호: 15, 서열식별번호: 17, 서열식별번호: 19, 서열식별번호: 21, 서열식별번호: 23 또는 서열식별번호: 25 중 임의의 것을 코딩하는 핵산 서열과 혼성화하는 서열을 포함하거나 또는 그로 이루어진다. 또한, 본 발명에 따라, 불활성화된 적어도 1개의 유전자는 바람직하게는 단백질 서열인 서열식별번호: 3, 서열식별번호: 5, 서열식별번호: 7, 서열식별번호: 9, 서열식별번호: 11, 서열식별번호: 13, 서열식별번호: 15, 서열식별번호: 17, 서열식별번호: 19, 서열식별번호: 21, 서열식별번호: 23 또는 서열식별번호: 25 중 임의의 것과 적어도 약 45% 서열 동일성, 보다 더 바람직하게는 적어도 60% 서열 동일성, 보다 더 바람직하게는 적어도 75% 서열 동일성, 보다 더 바람직하게는 적어도 85% 서열 동일성, 보다 더 바람직하게는 적어도 90% 서열 동일성, 보다 더 바람직하게는 적어도 91% 서열 동일성, 보다 더 바람직하게는 적어도 95% 서열 동일성, 보다 더 바람직하게는 적어도 98% 서열 동일성을 갖는 단백질을 코딩하는 서열을 포함하거나 또는 그로 이루어진다. 본 발명에 따라, 바람직한 유기체는 RIA1 유전자의 발현을 위한 및/또는 ADI1, MTT1 및 TAD1로 이루어진 군으로부터 선택된 적어도 2개의 유전자의 발현을 위한 적어도 1개의 발현 카세트를 포함하며, 여기서 발현 카세트 중 적어도 1개는 통합 부위에서 미생물의 게놈에 통합되며, 여기서 통합 부위는 서열식별번호: 3, 서열식별번호: 5, 서열식별번호: 7, 서열식별번호: 9, 서열식별번호: 11, 서열식별번호: 13, 서열식별번호: 15, 서열식별번호: 17, 서열식별번호: 19, 서열식별번호: 21, 서열식별번호: 23, 서열식별번호: 25 중 임의의 것과 적어도 45%, 보다 더 바람직하게는 적어도 60%, 보다 더 바람직하게는 적어도 75%, 보다 더 바람직하게는 적어도 85%, 보다 더 바람직하게는 적어도 90%, 보다 더 바람직하게는 적어도 91%, 보다 더 바람직하게는 적어도 95%, 보다 더 바람직하게는 적어도 98% 서열 동일성을 갖는 아미노산 서열로 번역되는 오픈 리딩 프레임의 가장 가까운 경계의 6500개 이하의 뉴클레오티드, 바람직하게는 5500개 이하의 뉴클레오티드, 보다 더 바람직하게는 2800개 이하의 뉴클레오티드에 위치하고/거나, 서열식별번호: 3, 서열식별번호: 5, 서열식별번호: 7, 서열식별번호: 9, 서열식별번호: 11, 서열식별번호: 13, 서열식별번호: 15, 서열식별번호: 17, 서열식별번호: 19, 서열식별번호: 21, 서열식별번호: 23, 서열식별번호: 25 중 임의의 것과 적어도 45%, 보다 더 바람직하게는 적어도 60%, 보다 더 바람직하게는 적어도 75%, 보다 더 바람직하게는 적어도 85%, 보다 더 바람직하게는 적어도 90%, 보다 더 바람직하게는 적어도 91%, 보다 더 바람직하게는 적어도 95%, 보다 더 바람직하게는 적어도 98% 서열 동일성을 갖는 아미노산 서열로 번역되는 오픈 리딩 프레임 내에 위치하거나 또는 그를 대체한다. 각각의 경우에, 상기 기재된 바와 같이 불활성화 통합은 서열 서열식별번호: 19, 서열식별번호: 15 및/또는 서열식별번호: 29 중 하나 이상, 및 완전한 길이에 걸쳐 상기 서열과 적어도 45%, 보다 더 바람직하게는 적어도 60%, 보다 더 바람직하게는 적어도 75%, 보다 더 바람직하게는 적어도 85%, 보다 더 바람직하게는 적어도 90%, 보다 더 바람직하게는 적어도 91%, 보다 더 바람직하게는 적어도 95%, 보다 더 바람직하게는 적어도 98% 서열 동일성을 갖는 각각의 서열에서 또는 그 안에서 바람직하다.
본 발명에 따른 바람직한 생산 숙주 미생물은 동일한 조건 하에 배양된 상응하는 야생형 균주와 비교하여 특징적인 유전자 발현 수준을 나타낸다.
a) RIA1 유전자의 발현 수준은 적어도 50배 증가하고/거나,
b) ADI1, MTT1 및 TAD1로 이루어진 군으로부터 선택된 적어도 2개의 유전자의 발현 수준은 적어도 1000배 증가하고/거나,
c) ITP1 유전자의 발현 수준은 최대 500배 증가한다.
본 발명에 따라 발현 수준은 실시예에서 추가로 설명되는 바와 같이 상응하는 mRNA에 대해 표준 qPCR 프로토콜을 이용하여 측정된다. 실시예에 의해 입증되는 바와 같이, RIA1 유전자 발현이 야생형 균주와 비교하여 50-1000, 보다 더 바람직하게는 100-900배만큼 조금 증가하여도 본 발명의 이점, 특히 높은 이타콘산 생산율, 및 발효 부산물로서 말레이트의 매우 낮은 생산 또는 심지어 생산되지 않음을 달성할 수 있다. 또한, RIA1 유전자 발현의 이러한 증가는 ADI1, MTT1 및/또는 TAD1의 발현 수준을 적어도 1000배 증가시킨다. 바람직하게는, ADI1, MTT1 및 TAD1로 이루어진 군으로부터 선택된 적어도 2개의 유전자의 발현 수준은 1050-6000배 증가하고, 보다 더 바람직하게는 ADI1 및 TAD1의 발현 수준은 1000-4100배 증가하고, MTT1의 발현 수준은 2000-5500배 증가한다.
또한, 바람직하게는, ITP1 유전자의 발현 수준은 최대 500배, 더욱 바람직하게는 0-300배, 보다 더 바람직하게는 최대 200배 증가한다. 이것이 발효 동안에 이타콘산이 발효 배지로 방출되도록 야생형 균주가 이미 활성 이타콘산 대사 경로를 나타내는 미생물에만 적용된다는 것을 이해해야 한다. 이 파라미터는 이타콘산 생산 숙주 미생물의 선택에 특히 유리하며, 이는 높은 수준의 ITP1 유전자 발현을 이미 나타내는 이들 미생물이 발효 배지로 이타콘산 방출을 증가시키기 위해 임의의 추가의 유전적 개입을 필요로 하지 않기 때문이며, 따라서 재조합 ITP1 유전자 과다발현을 위한 발현 카세트를 도입시킴으로써 원치않는 부작용의 위험을 감소시킨다.
본 발명에 따라, 생산 숙주 미생물은 바람직하게는 분류학상 우스틸라기노마이세테스(Ustilaginomycetes) 강, 보다 더 바람직하게는 우스틸라기날레스(Ustilaginales) 목, 보다 더 바람직하게는 우스틸라기나세아에(Ustilaginaceae) 과, 보다 더 바람직하게는 아노말로마이세스(Anomalomyces), 안트라코시스티스(Anthracocystis), 브로멜리아고(Bromeliago), 신트라크티아(Cintractia), 더마토소루스(Dermatosorus), 디르크메이아(Dirkmeia), 에리오코르텍스(Eriocortex), 파리시아(Farysia), 프란츠페트라키아(Franzpetrakia), 김노신트라크티아(Gymnocintractia), 헤테로톨리포스포리움(Heterotolyposporium), 칼마노지마(Kalmanozyma), 랑도니아(Langdonia), 류코신트라크티아(Leucocintractia), 마칼피노마이세스(Macalpinomyces), 멜라노시키움(Melanopsichium), 모에스지오마이세스(Moesziomyces), 모레아우아(Moreaua), 마이코시린크스(Mycosyrinx), 파르불라고(Parvulago), 페리클라디움(Pericladium), 포르탈리아(Portalia), 슈도지마(Pseudozyma), 레스티오스포리움(Restiosporium), 쉬조넬라(Schizonella), 쉬바시아(Shivasia), 스포리소리움(Sporisorium), 스테고신트라크티아(Stegocintractia), 톨리포스포리움(Tolyposporium), 트란츠쉘리엘라(Tranzscheliella), 트리코신트라크티아(Trichocintractia), 트리오디오마이세스(Triodiomyces), 투비소루스(Tubisorus), 우스틸라고(Ustilago), 웹스다네아(Websdanea) 중 임의의 속에 속하고, 가장 바람직하게는 슈도지마 속에 속한다. 슈도지마 미생물 및 특히 슈도지마 츠쿠바엔시스의 유용성은, 우스틸라고 속의 미생물을 사용하여 더 많은 양의 이타콘산을 달성할 수 있음을 나타내는 (Zambanini et al. 2017의 표 3 참고) 선행 기술 조사의 발견 (Zambanini et al. 2017, op. cit.)을 고려할 때 놀라운 것이다.
추가로 바람직하게는, 본 발명에 따라, 생산 숙주 미생물은 아스퍼길루스 테레우스 시스-아코니테이트 데카르복실라제 (CAD1) 유전자에 대한 기능적 오르토로그도 어떠한 유. 마이디스 클러스터 유전자 CYP3 및 RDO1도 발현하지 않는다. 이들 유전자는 이타콘산 대사에 수반되는 것으로 생각되며; 이들 유전자의 강한 발현은 이타콘산 생산을 감소시킬 수 있다.
추가로 바람직하게는, 본 발명에 따라, 생산 숙주 미생물은 비상동성 단부 결합을 위한 ku70 및 ku80 단백질의 기능적 오르토로그를 발현하지 않는다. 이러한 방식으로, 생산 숙주 미생물은 원치않는 자발적 재조합에 대해 특히 안정화되고, 특히 생산 숙주 미생물은 본 발명에 따른 1개 초과의 발현 카세트를 포함한다.
본 발명의 목적을 위해, RIA1 유전자는 RIA1 폴리펩티드를 코딩하는 핵산 서열인 것으로 이해된다. 상응하게는, ITP1, ADI1, MTT1 또는 TAD1 유전자 각각은 ITP1, ADI1, MTT1 또는 TAD1 단백질 각각을 코딩하는 핵산인 것으로 이해된다.
본 발명에 따라, RIA1 단백질은 기능적 정의에 따라 RIA1 단백질을 발현하지 않는 상응하는 균주와 비교하여 상응하는 ITP1, ADI1, MTT1 또는 TAD1 mRNA 각각의 정량적인 PCR에 의해 측정시 임의의 유전자 ITP1, ADI1, MTT1 및 TAD1의 발현을 적어도 10배 증가시킬 수 있는 단백질이다. 구조적 정의에 따라, RIA1 폴리펩티드는 바람직하게는 MatGat 프로그램을 이용하고 하기 파라미터를 적용하여 측정시 완전한 서열 서열식별번호: 35와 적어도 46% 아미노산 서열 동일성을 갖는다: BLOSUM62 매트릭스, 갭 오픈 패널티 12, 갭 확장 패널티 2. 보다 더 바람직하게는, RIA1 폴리펩티드는 바로 위에 기재된 바와 같이 서열식별번호: 35와 적어도 55% 아미노산 서열 동일성, 보다 더 바람직하게는 적어도 57% 아미노산 서열 동일성을 갖는다. 이러한 RIA1 단백질은 본원의 실시예에 기재된 슈도지마 츠쿠바엔시스의 RIA1 폴리펩티드에 구조적으로 밀접하게 상응하며, 이는 이러한 단백질의 이점을 추가로 나타낸다. 추가로 바람직하게는, RIA1 단백질의 아미노산 서열 서열식별번호: 35와의 서열 유사성은 적어도 62%, 보다 더 바람직하게는 적어도 64% 및 보다 더 바람직하게는 적어도 70%이다.
슈도지마 속, 가장 바람직하게는 슈도지마 츠쿠바엔시스에서 발견되는 것에 상응하는 RIA1 폴리펩티드가 특히 바람직하다. 특히, 바람직한 RIA1 폴리펩티드는 서열식별번호: 36의 완전한 서열과 적어도 41%, 보다 더 바람직하게는 적어도 57%, 보다 더 바람직하게는 적어도 70%, 보다 더 바람직하게는 적어도 73%, 보다 더 바람직하게는 적어도 80%, 보다 더 바람직하게는 적어도 85%, 보다 더 바람직하게는 적어도 90%, 보다 더 바람직하게는 적어도 92%, 보다 더 바람직하게는 적어도 95%, 보다 더 바람직하게는 적어도 98% 서열 동일성을 갖는다. 이러한 RIA1 폴리펩티드는 실시예에서 추가로 기재되는 유리한 RIA1 폴리펩티드에 상응한다. 또한 바람직하게는, RIA1 폴리펩티드와 서열식별번호: 36의 아미노산 서열의 서열 유사성은 적어도 46%, 보다 더 바람직하게는 적어도 59%, 보다 더 바람직하게는 적어도 70%, 보다 더 바람직하게는 적어도 73%, 보다 더 바람직하게는 적어도 85%, 보다 더 바람직하게는 적어도 90%, 보다 더 바람직하게는 적어도 92%, 보다 더 바람직하게는 적어도 95%, 보다 더 바람직하게는 적어도 98%이다.
상기 임의의 기능적 및/또는 구조적 정의에 따른 RIA1 폴리펩티드가 서열식별번호: 38, 서열식별번호: 39, 서열식별번호: 40, 서열식별번호: 41, 서열식별번호: 42, 서열식별번호: 43, 서열식별번호: 44, 서열식별번호: 45 및 서열식별번호: 46 각각에 상응하는 상응하는 적어도 1개, 보다 더 바람직하게는 적어도 2개, 보다 더 바람직하게는 적어도 3개, 보다 더 바람직하게는 적어도 4개, 보다 더 바람직하게는 적어도 5개, 보다 더 바람직하게는 적어도 6개, 보다 더 바람직하게는 적어도 7개, 보다 더 바람직하게는 적어도 8개 및 가장 바람직하게는 모든 9개의 모티프를 포함할 때 특히 바람직하다. 바람직하게는, RIA1 폴리펩티드는 최대 2개, 보다 더 바람직하게는 최대 1개의 아미노산 교환을 갖는 각각의 서열 모티프를 함유하고; 이 외에도 모티프가 서열식별번호: 38 내지 서열식별번호: 47에 따른 서열과 비교하여 결실 또는 삽입을 포함하지 않는 것이 바람직하다. 보다 더 바람직하게는, 서열 모티프에서 유일한 차이는 서열식별번호: 38 대신에 RIA1 폴리펩티드가 정확한 서열 서열식별번호: 47을 포함한다는 것이다. 가장 바람직하게는, 본 발명에 따른 RIA1 폴리펩티드 서열은 서열식별번호: 47, 서열식별번호: 39, 서열식별번호: 40, 서열식별번호: 41, 서열식별번호: 42, 서열식별번호: 43, 서열식별번호: 44, 서열식별번호: 45 및 서열식별번호: 46의 모든 모티프를 포함하며, 여기서 RIA1 폴리펩티드의 모티프와 상기 언급된 서열 모티프 사이의 전체 차이는 최대 1개 아미노산 교환 및 가장 바람직하게는 0개 아미노산 교환이다.
구조적 정의에 따라, ITP1 폴리펩티드는 바람직하게는 MatGat 프로그램을 이용하고 하기 파라미터를 적용하여 측정시 완전한 서열 서열식별번호: 33과 적어도 52% 아미노산 서열 동일성을 갖는다: BLOSUM62 매트릭스, 갭 오픈 패널티 12, 갭 확장 패널티 2. 이러한 ITP1 단백질은 본원의 실시예에 기재된 슈도지마 츠쿠바엔시스의 ITP1 폴리펩티드에 구조적으로 밀접하게 상응하며, 이는 이러한 단백질의 추가의 이점을 나타낸다. 추가로 바람직하게는, ITP1 단백질의 아미노산 서열 서열식별번호: 33과의 서열 유사성은 적어도 60%, 보다 더 바람직하게는 적어도 83% 및 보다 더 바람직하게는 적어도 87%이다.
슈도지마 속, 가장 바람직하게는 슈도지마 츠쿠바엔시스에서 발견되는 것들에 상응하는 ITP1 폴리펩티드가 특히 바람직하다. 특히, 바람직한 ITP1 폴리펩티드는 서열식별번호: 33의 완전한 서열과 적어도 52%, 보다 더 바람직하게는 적어도 70%, 보다 더 바람직하게는 적어도 76%, 보다 더 바람직하게는 적어도 79%, 보다 더 바람직하게는 적어도 85%, 보다 더 바람직하게는 적어도 90%, 보다 더 바람직하게는 적어도 92%, 보다 더 바람직하게는 적어도 95%, 보다 더 바람직하게는 적어도 98% 서열 동일성을 갖는다. 이러한 ITP1 폴리펩티드는 실시예에 추가로 기재된 유리한 ITP1 폴리펩티드에 상응한다.
구조적 정의에 따라, ADI1 폴리펩티드는 바람직하게는 MatGat 프로그램을 이용하고 하기 파라미터에 적용하여 측정시 완전한 서열 서열식별번호: 32와 적어도 63% 아미노산 서열 동일성을 갖는다: BLOSUM62 매트릭스, 갭 오픈 패널티 12, 갭 확장 패널티 2. 이러한 ADI1 단백질은 본원의 실시예에 기재된 바와 같이 슈도지마 츠쿠바엔시스의 ADI1 폴리펩티드에 구조적으로 밀접하게 상응하며, 이는 이러한 단백질의 추가의 이점을 나타낸다. 추가로 바람직하게는, ADI1 단백질의 아미노산 서열 서열식별번호: 32과의 서열 유사성은 적어도 74%, 보다 더 바람직하게는 적어도 85% 및 보다 더 바람직하게는 적어도 98%이다.
슈도지마 속, 가장 바람직하게는 슈도지마 츠쿠바엔시스에서 발견되는 것에 상응하는 ADI1 폴리펩티드가 특히 바람직하다. 특히, 바람직한 ADI1 폴리펩티드는 서열식별번호: 32의 완전한 서열과 적어도 63%, 보다 더 바람직하게는 적어도 70%, 보다 더 바람직하게는 적어도 78%, 보다 더 바람직하게는 적어도 85%, 보다 더 바람직하게는 적어도 90%, 보다 더 바람직하게는 적어도 92%, 보다 더 바람직하게는 적어도 95%, 보다 더 바람직하게는 적어도 98% 서열 동일성을 갖는다. 이러한 ADI1 폴리펩티드는 실시예에서 추가로 기재되는 유리한 ADI1 폴리펩티드에 상응한다.
구조적 정의에 따라, MTT1 폴리펩티드는 바람직하게는 MatGat 프로그램을 이용하고 하기 파라미터에 적용하여 측정시 완전한 서열 서열식별번호: 34와 적어도 53% 아미노산 서열 동일성을 갖는다: BLOSUM62 매트릭스, 갭 오픈 패널티 12, 갭 확장 패널티 2. 이러한 MTT1 단백질은 본원의 실시예에 기재된 슈도지마 츠쿠바엔시스의 MTT1 폴리펩티드에 구조적으로 밀접하게 상응하며, 이는 이러한 단백질의 추가의 이점을 나타낸다. 추가로 바람직하게는, MTT1 단백질의 아미노산 서열 서열식별번호: 34와의 서열 유사성은 적어도 59%이다.
슈도지마 속, 가장 바람직하게는 슈도지마 츠쿠바엔시스에서 발견되는 것들에 상응하는 MTT1 폴리펩티드가 특히 바람직하다. 특히, 바람직한 MTT1 폴리펩티드는 서열식별번호: 34의 완전한 서열과 적어도 53%, 보다 더 바람직하게는 적어도 57%, 보다 더 바람직하게는 적어도 70%, 보다 더 바람직하게는 적어도 78%, 보다 더 바람직하게는 적어도 85%, 보다 더 바람직하게는 적어도 90%, 보다 더 바람직하게는 적어도 92%, 보다 더 바람직하게는 적어도 95%, 보다 더 바람직하게는 적어도 98% 서열 동일성을 갖는다. 이러한 MTT1 폴리펩티드는 실시예에 추가로 기재된 유리한 MTT1 폴리펩티드에 상응한다.
구조적 정의에 따라, TAD1 폴리펩티드는 바람직하게는 MatGat 프로그램을 이용하고 하기 파라미터에 적용하여 측정시 완전한 서열 서열식별번호: 31과 적어도 84% 아미노산 서열 동일성을 갖는다: BLOSUM62 매트릭스, 갭 오픈 패널티 12, 갭 확장 패널티 2. 이러한 TAD1 단백질은 본원의 실시예에 기재된 슈도지마 츠쿠바엔시스의 TAD1 폴리펩티드에 구조적으로 밀접하게 상응하며, 이는 이러한 단백질의 추가의 이점을 나타낸다. 추가로 바람직하게는, TAD1 단백질의 아미노산 서열 서열식별번호: 31과의 서열 유사성은 적어도 82%, 보다 더 바람직하게는 적어도 92% 및 보다 더 바람직하게는 적어도 94%이다.
슈도지마 속, 가장 바람직하게는 슈도지마 츠쿠바엔시스에서 발견되는 것들에 상응하는 TAD1 폴리펩티드가 특히 바람직하다. 특히, 바람직한 TAD1 폴리펩티드는 서열식별번호: 31의 완전한 서열과 적어도 84%, 보다 더 바람직하게는 적어도 85%, 보다 더 바람직하게는 적어도 90%, 보다 더 바람직하게는 적어도 92%, 보다 더 바람직하게는 적어도 95%, 보다 더 바람직하게는 적어도 98% 서열 동일성을 갖는다. 이러한 TAD1 폴리펩티드는 실시예에서 추가로 기재되는 유리한 TAD1 폴리펩티드에 상응한다.
본 발명에 따른 특히 유리한 생산 숙주 미생물은
a) 적어도 9.5 g 이타콘산 /(l d)의 생산율로 및/또는
b) 적어도 25 % (w/w 글루코스)의 수율로
글루코스를 이타콘산으로 전환시키는데 유용하다.
바람직하게는 생산율은 발효, 바람직하게는 8일의 유가 배양식 발효 후에 발효 브로쓰로부터 회수된 이타콘산의 총량을 최종 발효 브로쓰 부피 및 발효 지속시간으로 나누어서 측정된다.
본 발명은 또한 ip 로커스의 외부에서 통합을 위해 강한 구성적으로 활성인 프로모터에 작동가능하게 연결된 RIA1 유전자를 포함하는 통합 벡터를 제공한다. 이러한 통합 벡터는 RIA1 발현 카세트 (강한 구성적으로 활성인 프로모터에 작동가능하게 연결된 RIA1 유전자를 포함함)를 선택된 특이적 통합 부위에 특이적으로 확실하게 통합시키기 위해 바람직하게는 상기 언급된 강, 목, 과, 속 또는 종의 바시디오마이세테스를 형질전환시킬 때 상기 언급된 본 발명의 이점이 달성될 수 있다. 본 발명에 따른 바람직한 프로모터는 액틴 프로모터, HSP70 프로모터, TEF 프로모터, GPD 프로모터 및 GLC 프로모터이고, 본원에 기재된 액틴 프로모터가 가장 바람직하다.
상응하게, 본 발명은 하기를 포함하는, 이타콘산 생산 숙주 미생물을 변경시키는 방법을 제공한다:
- RIA1 유전자의 발현을 위한 및/또는
- ADI1, MTT1 및 TAD1로 이루어진 군으로부터 선택된 적어도 2개의 유전자의 발현을 위한
적어도 1개의 발현 카세트를 ip 로커스 이외의 통합 부위에서 미생물의 게놈에 통합시키는 것.
특이적인 통합에서 적어도 1개의 발현 카세트의 통합에 의해 이 방법은 관련 기술분야의 통상의 기술자가 야생형 바시디오마이세테스를 본 발명에 따른 이타콘산 생산 숙주 미생물로 전환시킬 수 있게 하여, 본원에 기재된 이점을 수반한다.
상기 방법에서, 통합 부위는 바람직하게는
a) 좌측 경계 유전자와 우측 경계 유전자 사이에 위치하며, 여기서 좌측 및 우측 경계 유전자의 번역 개시 코돈의 아데닌은 상응하는 야생형 미생물에서 최대 51600개 뉴클레오티드에 의해 분리되어 있고,
여기서 좌측 경계 유전자는 아세틸-CoA 신테타제 활성을 갖는 단백질을 코딩하고,
여기서 우측 경계 유전자는 서열식별번호: 25와 적어도 21% 동일성을 갖는 아미노산 서열로 이루어지는 단백질을 코딩하고/거나,
b) 서열식별번호: 3, 서열식별번호: 5, 서열식별번호: 7, 서열식별번호: 9, 서열식별번호: 11, 서열식별번호: 13, 서열식별번호: 15, 서열식별번호: 17, 서열식별번호: 19, 서열식별번호: 21, 서열식별번호: 23, 서열식별번호: 25 중 임의의 것과 적어도 30% 서열 동일성을 갖는 아미노산 서열로 번역되는 오픈 리딩 프레임의 가장 가까운 경계의 6500개 이하의 뉴클레오티드에 위치하고/거나,
c) 서열식별번호: 3, 서열식별번호: 5, 서열식별번호: 7, 서열식별번호: 9, 서열식별번호: 11, 서열식별번호: 13, 서열식별번호: 15, 서열식별번호: 17, 서열식별번호: 19, 서열식별번호: 21, 서열식별번호: 23, 서열식별번호: 25 중 임의의 것과 적어도 30% 서열 동일성을 갖는 아미노산 서열으로 번역되는 오픈 리딩 프레임 내에 위치하거나 또는 그를 대체한다.
바람직한 통합 부위 및 각각의 이점은 상기 기재되었고 본원에서 추가로 상세하게 설명된다.
바람직하게는, 상기 방법은
i) 단백질 서열인 서열식별번호: 3, 서열식별번호: 5, 서열식별번호: 7, 서열식별번호: 9, 서열식별번호: 11, 서열식별번호: 13, 서열식별번호: 15, 서열식별번호: 17, 서열식별번호: 19, 서열식별번호: 21, 서열식별번호: 23 또는 서열식별번호: 25 중 임의의 것과 적어도 30% 서열 동일성을 갖는 단백질을 코딩하고/거나
ii) 적어도 낮은 엄격도 조건 하에 상기 단백질 서열을 코딩하는 핵산 서열과 혼성화하는 상보성 가닥인
적어도 1개의 유전자를 불활성화시키도록 수행된다.
다시, 이러한 불활성화 및 바람직한 불활성화의 이점은 상기 기재되었고 본원에서 추가로 기재된다.
따라서, 상기 방법은 ip 로커스의 외부에서 통합되는 적어도 1개의 발현 카세트를 포함하지 않는 대조군 미생물에 비해 증가된 이타콘산 생산율을 갖는 미생물을 유도한다.
본 발명은 또한 하기를 포함하는, 재조합 이타콘산 생산 숙주 미생물을 수득하는 방법을 또한 제공한다:
a) 모 미생물을 배양하고,
b) 임의의 순서로 및/또는 동시에 하기를 수행하고:
- 필요한 경우: 미생물에서 활성 이타콘산 경로를 수득하기 위해 미생물에게 임의의 이종성 ADI1, MTT1 및 TAD1 유전자를 제공하기 위한 하나 이상의 형질전환,
- 구성적으로 활성인 프로모터의 제어 하의 RIA1 유전자의 적어도 하나의 통합, 여기서 통합이 ip-로커스에 있지 않음,
-
i) 단백질 서열인 서열식별번호: 3, 서열식별번호: 5, 서열식별번호: 7, 서열식별번호: 9, 서열식별번호: 11, 서열식별번호: 13, 서열식별번호: 15, 서열식별번호: 17, 서열식별번호: 19, 서열식별번호: 21, 서열식별번호: 23 또는 서열식별번호: 25 중 임의의 것과 적어도 30% 서열 동일성을 갖는 단백질을 코딩하고/거나
ii) 적어도 낮은 엄격도 조건 하에 상기 단백질 서열을 코딩하는 핵산 서열과 혼성화하는 상보성 가닥인
적어도 1개의 유전자의 불활성화,
c) 단계 b)로부터 생성된 재조합 이타콘산 생산 숙주 미생물을 단리하는 것.
본 발명이 하기를 포함하는, 이타콘산의 생산 방법을 제공하는 것이 특히 유익하며:
a) 이타콘산을 수득하기 위해 생산 숙주 미생물을 발효시키고,
b) 단계 (a)에서 생산된 이타콘산을 회수하는 것,
여기서 미생물은 본 발명에 따른 미생물이고, 바람직하게는 이타콘산 생산 숙주 미생물의 상기 언급된 임의의 변경 방법에 따라 수득되거나 또는 수득가능하고/거나, 본 발명에 따른 통합 벡터를 사용하여 형질전환에 의해 수득가능하거나 또는 수득된다.
발효 공정은 바람직하게는 액침 발효이고, 또한 바람직하게는 회분식 발효, 유가 배양식 발효 또는 연속 발효이다. 유가 배양식 발효가 특히 바람직하고, 그에 사용되는 특히 유용한 발효 방법 및 물질은 하기 실시예에 기재된다.
발효는 바람직하게는 최대 0.1 %(v/v)의 복합 배지 성분을 포함하는 최소 배지에서 시작되고, 최대 5.5의 pH를 갖는다. 실시예에 제시된 바와 같이, 이러한 최소 배지는 특히 원치않는 말레이트 부산물의 양을 감소시키는 것을 지원하고, 생산 숙주 미생물에서 이타콘산의 생산율 및 수율을 증가시킬 수 있다. 본 발명에 따라, 복합 배지 성분은 옥수수 침지 분말, 옥수수 침지액, 옥수수 전분, 옥수수 가공 부산물, 대두 가공 부산물, 당밀, 효모 추출물, 효모 자가용해물 및 소비된 발효 브로쓰이다. 바람직하게는, 최소 배지는 0.1 %(v/v) 초과의 정의되지 않은 배지 성분을 포함하지 않는다. 가장 바람직하게는, 발효를 시작하기 위한 및/또는 유가 배양식 발효 동안에 첨가하기 위한 최소 배지는 0.1 % (v/v) 초과의 각각의 옥수수 침지 분말, 옥수수 침지액, 옥수수 전분, 옥수수 가공 부산물, 대두 가공 부산물, 당밀, 효모 추출물, 효모 자가용해물 또는 소비된 발효 브로쓰를 포함하지 않고, 보다 더 바람직하게는 총 0.1 %(v/v) 초과의 옥수수 침지 분말, 옥수수 침지액, 옥수수 전분, 옥수수 가공 부산물, 대두 가공 부산물, 당밀, 효모 추출물, 효모 자가용해물 및 소비된 발효 브로쓰를 포함하지 않고, 가장 바람직하게는 옥수수 침지 분말, 옥수수 침지액, 옥수수 전분, 옥수수 가공 부산물, 대두 가공 부산물, 당밀, 효모 추출물, 효모 자가용해물 및 소비된 발효 브로쓰를 포함하지 않는다. 의심의 여지를 없애기 위해, 숙주 미생물 및 발효 브로쓰로 방출된 물질은 발효 배지의 복합 배지 성분이 아니다.
바람직한 경우 본 발명에 따른 발효 과정은 바람직하게는 상기 기재된 바와 같이 최소 배지인 배지의 pH가 발효 동안에 최대 5, 보다 더 바람직하게는 최대 4,5 및 보다 더 바람직하게는 3-4이도록 수행되었다. pH를 4 미만으로 낮추는 것은 건조 세포 중량 (DCW)의 정지를 유도하거나, 또는 이타콘산의 생산율 및 수율을 손상시키지 않으면서 적어도 유의한 성장 지연을 유도하고, 놀랍게도 말레이트 부산물 형성의 원치않는 증가를 유도하지 않는다.
배지는 바람직하게는 폴리알콜성 탄소 공급원을 포함하고, 발효 동안에 탄소 공급원의 농도가 3시간 초과 동안 10 g/l 미만으로 떨어지지 않는다. 실시예에 의해 제시된 바와 같이, 이러한 발효 조건은 발효 부산물로서 말레이트의 무시할만한 형성과 함께 유리하게는 이타콘산의 높은 생산율 및 수율을 야기한다. 바람직한 폴리알콜성 탄소 공급원은 글루코스, 프룩토스, 크실로스, 아라비노스, 락토스, 수크로스, 셀로비오스, 말토스, 글리세롤 및 에틸렌 글리콜이다.
특히 바람직하게는, 발효 배지 내 이타콘산 대 말산의 농도 비는 발효 (회분식 또는 유가 배양식 발효) 종료 시 적어도 15:1, 바람직하게는 적어도 20:1 및 보다 더 바람직하게는 적어도 100:1이다. 본 발명에 따라, 말산의 형성은 원치않는 것이다. 지금까지 우스틸라기노마이세테스에서 이타콘산을 발효에 의해 생산하고자 한 이전의 모든 시도는 말산의 공동-생산을 재현적으로 피할 수 없었으며, 몇몇 경우에는 형성된 말산의 양이 심지어 이타콘산보다 훨씬 더 높았다. 말산이 크렙스 주기의 성분이기 때문에, 미생물에 의해 생산된 말산의 감소 및 바람직하게는 미생물에 의해 배지로 분비된 말산의 감소가 유익하며; 따라서 말산의 손실은 미생물이 이타콘산을 높은 수율로 발효에 의해 생산하는 능력을 감소시킨다.
단계 a)에서 발효 방법은 바람직하게는 호기성 또는 미세호기성 조건 하에 있다. 일시적인 미세호기성 조건을 이용하여 이타콘산을 발효에 의해 생산하고자 한 이전의 시도에도 불구하고 호기성 조건이 유익하다는 것은 특히 놀라운 것이었다 (WO2009-1006627).
실시예
이 단락에서, 약어 "ITA"는 이타콘산 및/또는 이타코네이트를 지칭하고, "MA"는 말산/말레이트를 지칭하고, "AKG"는 알파-케토글루타르산/알파-케토글루타레이트를 지칭한다.
균주, 배지 및 성장 조건
피. 츠쿠바엔시스 균주 H488 (CBS422.96, 야생형, [Kawamura, D., Saito, O., Matsui, H., and Morita, K. (1983). Producing of itaconic acid by yeasts: III Culture identification of itaconic acid producing strains. Shizuoka-Ken Kogyo Shikenjo Hokoku 27, 77-88]), M15 (H488의 UV-돌연변이체) 및 새로 구축된 RIA1 과다발현 형질전환체 HR12 (H488-pPTT.pActin.RIA1, 본 발명) 뿐만 아니라 클로닝 에스케리키아 콜라이 균주 DH10b를 사용하였다. 배양을 위해, 12-웰 플레이트 (3-ml 마이크로-웰), 250-ml 진탕 플라스크, 500-ml 배플형 플라스크 또는 600-ml 생물반응기 (멀티포어스(Multifors), 인포어스 에이치티(INFORS HT), 독일)를 사용하였다.
효모 세포를 -80℃ 냉동-보존 (에머스(emers))으로부터 완전 배지 YPD 또는 선택 배지 (YM-Hyg, YM-Cbx)를 함유하는 한천 플레이트 상에 스트리킹하고, 30℃에서 2-3일 동안 성장시켰다. 액체 배지에서의 배양을 30℃ 및 220 rpm에서 수행하였다. 이타콘산 생산 MG-IA의 경우 균주를 50 ml 완전 배지 YPD에서 또는 최소 배지에서 성장시켰다. 사전 배양을 위해, 50 ml의 액체 YPD 배지 (500-ml 배플형 플라스크에서)를 효모 세포로 접종하고, 25-30의 OD600 (울트라스펙(Ultrospec) 2000 광도계, 파마시아 바이오텍(Pharmacia Biotech))에 도달할 때까지 1-2일 동안 성장시켰다. 세포를 원심분리 (3,500 g, 실온 (RT)에서 5분)에 의해 수확하고, 2 ml dH2O (오토클레이빙됨) 중에서 재현탁시켰다. 후속 액체 배양물을 시작 OD600 = 1을 수득하기 위해 필요한 세포 현탁액의 양으로 접종시켰다. 형질전환체에 대한 스크리닝의 경우, 세포를 3-ml (MG-IA) 마이크로-웰 배양물에서 성장시켰다. 웰을 한천 플레이트로부터의 세포 물질로 직접 접종시키고, 웰 플레이트를 접착성 막으로 밀봉하였다. 진탕 플라스크 및 웰 플레이트에서의 배양을 위해 3.3 g l-1 CaCO3를 사용하여 배지의 pH를 5.0-5.5로 일정하게 유재하였다. 생물반응기에서의 성장 조건에 대해서는 표 1을 참고한다. 배양물의 샘플링을 24시간마다 수행하였다.
에스케리키아 콜라이를 액체 LB-배지에서 37℃ 및 220 rpm에서 배양하였다. 세포를 37℃에서 고체 LB-배지를 함유하는 암피실린 (원액: 10 mg ml-1, 최종 농도: 100 μg ml-1) 상에서 성장시켜, 형질전환체를 보유하는 플라스미드를 선택하였다.
배지 및 용액
MG-IA
N 공급원: 1 g l-1 NaNO3 또는 NH4Cl (특정한 실험에서 농도는 1-8 g l-1로부터 선택됨)
P 공급원: 0.1 g l-1 KH2PO4/K2HPO4 x 3 H2O (특정한 실험에서 농도는 0.1-3.0 g l-1로부터 선택됨)
미네랄 염: 0.7 g l-1 MgSO4 x 7 H2O, 0.5 g l-1 NaCl, 0.5 g l-1 K2SO4 0.4 g l-1 CaCl2 x 2 H2O
미량 원소: 0.5 mg l-1 H3BO3, 0.04 mg l-1 CuSO4 x 5 H2O, 0.1 mg l-1 KI, 0.4 mg l-1 MnSO4 x 4 H2O, 0.2 mg l-1 Na2MoO4 x 2 H2O, 0.4 mg l-1 ZnSO4 x 7 H2O
철: 6 mg l-1 FeCl3 x 6 H2O (에탄올 중 원액)
티아민: 0.4 mg l-1 티아민-HCl
탄소 공급원: 150 mg l-1 글루코스, 발효 동안에 매일 조정됨
YPD
효모 추출물 10 g l-1
펩톤 (카세인) 20 g l-1
글루코스 20 g l-1
YM
효모 추출물 3 g l-1
펩톤 (카세인) 2.5 g l-1
맥아 추출물 3 g l-1
글루코스 5 g l-1
피. 츠쿠바엔시스 형질전환체를 함유하는 플라스미드의 선택을 위해 히그로마이신 B (100 μg ml-1) 및 카르복신 (25 μg ml-1)을 사용하였다.
LB (Sambrook et al., 1989)
박토-펩톤 10 g l-1
효모 추출물 5 g l-1
NaCl 10 g l-1
YEPSlight
효모 추출물 10 g l-1
펩톤 (카세인) 4 g l-1
수크로스 4g l-1
Reg-배지
펩톤 20 g l-1
수크로스 20 g l-1
소르비톨 1 M
한천 20 g l-1
SCS
소르비톨 1 M
시트르산나트륨 20 mM pH 5.8
STC
소르비톨 1 M
Tris/HCl 10 mM pH 7.5
CaCl2 0.1 M
1 x 미네랄-염 용액
3 g l-1 (NH4)2SO4
1 g l-1 KH2PO4
0.16 g l-1 K2HPO4 x 3 H2O
0.7 g l-1 MgSO4 x 7 H2O
0.5 g l-1 NaCl
0.4 g l-1 Ca(NO3)2 x 4 H2O
PBS
8.0 g l-1 NaCl
0.2 g l-1 KCl
1.78 g l-1 Na2HPO4 x 2 H2O
0.27 g l-1 KH2PO4
일반적인 기술:
샘플링
웰-플레이트 및 진탕 플라스크에서 배양물 실험의 경우에 배양물의 샘플링은 200 - 1,000 μl의 배양물 브로쓰를 직접적으로 제거함으로써 24시간마다 수행하였다. 생물반응기 배양물은 (멸균성을 유지하기 위해) 2개의 삼방향 밸브를 통해 20 ml의 배양물 브로쓰를 제거함으로써 24시간마다 샘플링하였다. 처음 5 ml의 브로쓰는 폐기하였다 (샘플링 튜브에서 잠재적으로 축적되는 죽은 세포를 피하기 위해). 나머지 15 ml의 배양물 브로쓰는 이전에 칭량된 15-ml 팔콘 튜브에 수집하였다.
광학 밀도 (OD600)
람다 = 600 nm의 파장에서 광학 밀도를 측정하여 세포 성장을 추적하였다. 세포를 3,500 g, RT에서 5분 동안 원심분리에 의해 펠렛화하였다. 펠렛을 1 x 미네랄-염 용액으로 세척하였다. 세척 단계 이후에 세포를 재현탁시키고, 1 x 미네랄-염 용액으로 희석하였다. 측정은 울트라스펙 2000 광도계 (파마시아 바이오텍)에 의해 1.5 ml 일회용 큐벳 (층 두께: 10 mm)에서 수행하였다.
건조-세포 중량 (DCW)
건조-세포 중량을 생물반응기에서 성장한 세포 배양물에 대해서만 측정하였다. 10 ml의 배양물 브로쓰를 이전에 칭량된 15-ml 팔콘 튜브에서 펠렛화하였다 (3,500 g, RT에서 10분). 펠렛을 10 ml dH2O로 세척하고, 다시 펠렛화하였다 (3,500 g, RT에서 10분). 상청액을 제거하였다. 이어서, 펠렛을 100℃에서 12시간 동안 건조시키고, 칭량하여 최종적으로 DCW를 측정하였다.
글루코스 효소 검정
배양물 배지 중에서 글루코스 농도는 효소 검정 키트 글루코스 UV 시험 (알-바이오팜 아게(R-Biopharm AG))의 도움으로 효소 검정을 수행함으로써 측정되었다. 이는 제조자의 프로토콜에 따라 수행되었다.
현미경검사
세포를 원심분리하고, 100 μl 고정 용액 (PBS 중 4.5 % v/v 포름알데히드, (Sambrook et al., 1989)에 따른 PBS) 중에서 재현탁시켰다. 가시화는 빛 및 400 X 배율의 위상차 현미경검사를 통해 수행하였다.
DNAse 처리
DNAse 처리는 하기 반응 혼합물을 사용하여 표준 프로토콜에 따라 수행하였다:
샘플 HR12_1 및 H488_1의 DNaseI-재처리
DNase I - RNase 무함유 - EURx (로보클론(Roboklon), E1345)
반응 혼합물:
32/38 μl RNA (HR12/H488)
5 μl 10x DNaseI-완충제
1 μl 리보록(Ribolock) 리보뉴클레아제 억제제
11.5/5.5 μl H2O
0.5 μl DNaseI 37℃에서 15분
뉴클레오스핀(NucleoSpin)® RNA 클린-업 XS - 마쉐리-나겔(Macherey-Nagel)에 의한 RNA의 정제
15+10 μl H2O에 의한 용해 (2-단계)
11.5 μl의 최대 가능한 양으로 cDNA-합성
11.5 μl RNA
1 μl 무작위 육합체
4 μl 5x 버퍼
2 μl dNTP
0.5 μl 리보록 40 U/μl
1 μl RT
RT없이 RT-조절을 위해 및 단지 10 μl의 총 부피
제제 2: 10 μl- 반응 혼합물
2.5/5.5 μl RNA (HR12_2/H488_2)
3.0/0 μl H2O
0.5 μl 무작위 육합체
2 μl 5x 완충제
1 μl dNTP
0.5 μl 리보록 20 U/μl
0.5 μl RT
RT-PCR
이중 측정으로서 각각의 cDNA, 단일 측정으로서 RNA 및 H2O-대조군에 의한 PCR
10 μl- 반응 혼합물:
5 μl PCR-SYBR 그린 마스터믹스
1.2 μl 프라이머믹스 (각각 2.5 pmol/μl)
1 μl cDNA/RNA/H2O
2.8 μl H2O
96-웰 플레이트에서 판독
뚜껑-온도: 105℃
프로토콜
1: 8:00 동안 95.0℃
2: 0:15 동안 95.0℃
3: 0:30 동안 58.0℃
플레이트 판독
4: 0:10 동안 72.0℃
플레이트 판독
5: GOTO 2, 39회 더
6: 2:00 동안 72.0℃
7: 용융 곡선 60.0℃ 내지 95.0℃: 증분 0.5℃ 0:04
플레이트 판독
8: 0:01 동안 20.0℃
정량화
단계 3
분석 모드: 형광
Cq 측정: 회귀법
기준선 방법:
SYBR: 자동 계산됨
실시예 1: 프로모터 특징규명
각각의 4가지 유전자 TEF3, HSP70, 액틴 및 글리세르알데히드 3-포스페이트 데히드로게나제에 대해, 바로 상류 영역으로부터 대략 1,050 bp 길이의 서열을 증폭시켰다. 5'-단부를 KpnI-제한 부위로 상보화시켰고, 3'-단부를 LacZ-ORF의 처음 20 bp로 상보화시켰다. 이와 병행하여, 5'-단부를 프로모터 서열 중 하나의 마지막 20 bp로 상보화시키고 3'-단부를 PstI 제한 부위로 상보화시키면서, 에스케리키아 (이.) 콜라이로부터의 LacZ 유전자를 코딩하는 β-갈락토시다제의 ORF를 증폭시켰다. 단편 둘 다를 제2 폴리머라제 연쇄 반응 (PCR) 동안에 함께 융합시켰다. 이는 제1 PCR에서 생성된 2개의 단편의 상동성 중첩 단부로 인해 가능하였다. 중첩-PCR 산물을 KpnI & PstI에 의해 소화시키고, 선형화된 pPTT 플라스미드에 라이게이션시켰다 (상기 플라스미드는 KpnI 및 NsiI 소화되었다. NsiI에 의해 생성된 단부는 PstI에 의해 생성된 단부와 상용성이다).
생성된 LacZ 리포터 유전자 과다발현 플라스미드, pPTT-pActin-LacZ; pPPT-pGAPDH-LacZ; pPPT-pHSP70-LacZ & pPPT-pTEF1-LacZ 각각을 피. 츠쿠바엔시스 H488 및 M15 내로 형질전환시켰다. 유. 마이디스로부터의 HSP70 프로모터 (pUmHSP70)는 음성으로 작용하였다 (데이터는 제시되지 않음). 수득된 형질전환체를 YPD 완전 배지에서 2일 동안 또는 MG-IT (최소 배지)에서 4일 동안 배양하였다. 세포를 수확하고, 기계적으로 용해시키고, 추출하고, Miller (1972)에 따라 β-갈락토시다제 활성에 대해 시험하였다. 기질로서 ONPG (o-니트로페닐-β-D갈락토피라노시드)에 의한 세포 무함유 추출물의 흡광도를 420 nm에서 30분 동안 측정하였다. 총 단백질 함량을 측정하기 위해, 브래드포드(Bradford) 단백질 검정 (Bradford, 1976)을 수행하였다.
대부분의 형질전환체는 완전 배지에서 뿐만 아니라 최소 배지에서도 상승된 β-갈락토시다제 활성을 나타내었다. 시험한 모든 프로모터의 활성 범위는 상당히 높았다. pHSP70 및 pTEF1 형질전환체는 유. 마이디스로부터의 HSP70 프로모터에 비해 더 낮게 수행된 반면에, pActin은 모든 시나리오에서 상승된 효소 활성을 나타낸 유일한 시험한 프로모터였다 (도 5 - 도 8 참고). 프로모터 활성에서 이러한 차이의 이유는 여전히 명확하지 않다.
pActin의 제어 하에 전반적으로 비교적 높은 활성으로 인해, 이 프로모터는 후속 과다발현 분석에서 사용되었다.
실시예 2: 과다발현 균주의 생성
이타콘산-과다생산 균주 피. 츠쿠바엔시스 HR12를 전체 원형 플라스미드 pPTT-pActin-RIA1의 이종성 도입에 의해 생성하였다.
강한 구성적 Actin1 프로모터를 모든 과다발현 형질전환체에 대해 사용하였다. 본래의 프로모터 서열 및 오픈 리딩 프레임 (ORF) 서열 (과다발현될 유전자)은 서열 표에 열거된 프라이머를 사용하여 폴리머라제 연쇄 반응 (PCR)에 의해 피. 츠쿠바엔시스 H488의 게놈 DNA로부터 유래되었다. 이어서, 프로모터 서열을 중첩-PCR에 의해 각각의 ORF에 융합시켰다. 2개의 엑손을 별도로 증폭시키고, 1회의 PCR 동안에 프로모터 및 2개의 엑손 단편을 동시에 융합시킴으로써 ACO1의 ORF를 클로닝시켰다. 이어서, 중첩 산물을 절단시키고, 절단되고 이전에 탈인산화시킨 그에 따른 플라스미드에 라이게이션시켰다 (사용된 제한 효소에 대해서는 도 4 참고).
실시예 3: 피. 츠쿠바엔시스의 형질전환
형질전환 프로토콜을 [Gillissen, B., Bergemann, J., Sandmann, C., Schroeer, B., Boelker, M., and Kahmann, R. (1992). A two-component regulatory system for self/non-self recognition in Ustilago maydis. Cell 68, 647- 657; 및 Schulz, B., Banuett, F., Dahl, M., Schlesinger, R., Schaefer, W., Martin, T., Herskowitz, I., and Kahmann, R. (1990)]에 따라 조정하였다. 그들의 조합이 병원성 발달을 프로그래밍하는 유. 마이디스의 b 대립유전자는 호메오도메인-관련 모티프를 함유하는 폴리펩티드를 코딩한다. [Cell 60, 295-306].
피. 츠쿠바엔시스의 형질전환을 위해, 신선하게 제조된 원형질체만을 사용하였다. 원형질체를 수득하기 위해, 피. 츠쿠바엔시스 세포를 30℃ 및 220 rpm에서 3 ml YM 배지에서 밤새 성장시켰다. 다음 날, 1 ml의 배양물을 50 ml YEPS 라이트 배지로 옮기고, 0.5의 OD600에 도달할 때까지 적어도 3시간 동안 30℃ 및 220 rpm에서 성장시켰다. 세포를 원심분리 (3,500 g, RT에서 5분)에 의해 수확하였다. 세포 펠렛을 20 ml SCS로 세척하고, 다시 펠렛화하고, 2 ml 글루카넥스(Glucanex)® (SCS 중 6 % w/v, 멸균 여과됨) 중에서 재현탁시켰다. 세포 벽의 효소적 용해를 위해, 세포의 50%가 원형질체 형태로 존재할 때까지 30-45분 동안 세포를 50 ml-팔콘 튜브 중에서 RT에서 부드럽게 진탕시키면서 인큐베이션하였다. 원형질체의 수확은 원심분리 (10분, 2,500 rpm, 4℃)에 의해 수행되었다. 펠렛을 20 ml SCS, 10 ml SCS 및 20 STC (빙온의 SCS & STC) 중에서 연속하여 세척하였다. 마지막 세척 단계 후에, 세포를 0.5 ml STC (빙온) 중에서 재현탁시키고, 최종적으로 1.5 ml-반응 튜브에 튜브당 80 μl의 부피로 분취하였다. 원형질체를 15 μg 이하의 원형 플라스미드 DNA (최대 부피: 10 μl)와 부드럽게 혼합하고, 얼음 상에서 10분 동안 인큐베이션하였다. 대조군으로서 DNA 대신에 10 μl의 dH2O를 사용하였다. 세포를 500 μl PEG4000 (STC 중 40 % w/v 폴리에틸렌 글리콜 4000, 멸균 여과됨)으로 덮고, 얼음 상에서 15분 동안 인큐베이션하였다. 그 동안에, 선택적 한천 플레이트를 제조하였다: Reg-배지를 액화시키고, 대략 50℃로 냉각시키고, 2배 농도의 히그로마이신 B (200 μg ml-1) 또는 카르복신 (50 μg ml-1)과 혼합하였다. 10 ml의 Reg-Hyg/ Reg-Cbx를 기본 한천으로 사용하였고, 상부-한천과 동일한 양의 Reg-배지 (마커 없음)로 덮었다. 원형질체를 부드럽게 플레이팅하고, 30℃에서 3-15일 동안 인큐베이션하였다. 형질전환 이후에 수득된 콜로니를 정제를 위해 선택적 플레이트 상에 스트리킹하였다. 이어서, 단일 콜로니를 이타콘산 생산에 대해 표현형에 의해 스크리닝하였다. 게놈 DNA를 적합한 후보로부터 단리하였다. 게놈 DNA를 PCR을 위한 주형으로 사용하여 각각의 과다발현 플라스미드의 통합에 대해 확인하였다. 이타콘산을 과다생산하는 균주 피. 츠쿠바엔시스 HR12를 그의 게놈 DNA를 시퀀싱함으로써 확인하였다.
시퀀싱은 강한 구성적 프로모터 pActin의 제어 하에 이타콘산을 위한 조절인자 유전자인 RIA1을 직렬 배향으로 벡터 백본의 일부와 2회 통합되었음을 나타내었다 (도 12 참고). 첫번째 카피는 82.2 %의 과다발현 플라스미드 (1,627 - 9,167 bp)로 이루어졌고, 두번째 카피는 85.1 % (1 - 7,804 bp)로 이루어졌다. 두 벡터 단편의 통합은 9개의 다른 ORF (Pseudog4087 - 4095)로 이루어진 대략 34 kbp 길이의 서열을 결실시키면서 Pseudog4086의 ORF에서 발생하였다.
피. 츠쿠바엔시스에서 ITA 생산을 담당하는 공지된 모든 본래의 유전자를 사용하여 각각의 과다발현 플라스미드를 생성하였다. Actin1 프로모터가 이전의 시험에서 전반적으로 가장 높은 관찰된 LacZ-활성을 입증하였기 때문에, 이 프로모터 서열을 ITA-클러스터 유전자 (이타콘산 대사 유전자 클러스터)의 과다발현 분석을 위해 사용하였다.
프로모터 활성에 대한 시험과 유사하게, 유전자를 pActin 서열과 융합시키면서, 동시에 프로모터-유전자 융합 산물의 5'- 및 3'-단부 둘 다에 제한 효소 부위를 부가하였다. 생성된 PCR 산물을 소화시키고, 이에 따라 선형화된 pPTT-플라스미드에 라이게이션시켰다 (도 4 참고). 생성된 플라스미드에 대해서는 도 13을 참고한다.
생성된 플라스미드 각각을 보디누스(Bodinus), 2011에 따라 피. 츠쿠바엔시스 H488 & M15 내로 형질전환시키고, 히그로마이신 B-함유 Reg-플레이트 상에 플레이팅하고, 30℃에서 3-10일 동안 배양하였다. 이어서, 형질전환체를 히그로마이신 B-함유 Reg 또는 YPD 고체 배지 상에 스트리킹하여, 순수한 단일 콜로니를 수득하였다. 이어서, 단일 콜로니를 3 ml-웰 배양물에서 ITA 생산에 대해 표현형에 의해 스크리닝하였다. 12-웰 플레이트의 각각의 웰에서, 스패츌라 팁 정도의 CaCO3 (대략 20 mg)를 첨가한 다음, 3 ml의 액체 MG-IA 최소 배지 (N: 1 g l-1; P: 0.1 g l-1; C: 15 % (w/v))로 충전하였다. 1 μl-접종 루프를 사용하여 각각의 웰을 단일 콜로니로 접종하였다. 웰 플레이트를 반투과성 막으로 밀봉하고, 30℃ 및 220 rpm에서 10일 동안 배양하였다. 3, 5, 7 및 9일째에 웰당 1 ml dH2O를 첨가하여 증발에 대해 보상하였다.
세포를 10일째에 원심분리 (4℃에서 15분 동안 18,000 g)에 의해 수확하였다. 생성된 말산 (MA) 및 이타콘산의 정량화를 위해 희석된 상청액 (1:200 - 1:2,000)의 이온 크로마토그래피를 수행하였다. ADI1의 과다발현은 기준 균주 H488, M15 및 M15-CAD와 비교하여 ITA 생산에서 약간의 증가를 갖는 총 4가지 형질전환체 (HA1, HA8, HA10 및 MA7)만을 생성하였다. 이들 4가지 형질전환체는 10일 배양 후에 0.2 - 1.0 g l-1 ITA를 생산하였다. 말산은 여전히 이들 돌연변이체에서 생산된 주요 유기산이었다 (도 14-도 16 참고).
이타콘산 수송인자 (ITP1)의 과다발현은 피. 츠쿠바엔시스 야생형 균주 H488에 대해 전혀 효과가 없었다. H488과 비교하여 유사한 양의 MA만이 검출되었고 ITA는 생산되지 않았다 (도 18 참고).
동일한 과다발현은 균주 M15에서 상이한 결과를 야기하였다. 시험한 12가지 형질전환체 중에서, 10가지는 증가된 수준의 ITA 생산을 나타내었다. 이들 중 3가지 MI8; MI9 및 MI11은 주요 산물로서 심지어 ITA를 분비하였다 (도 19 참고). 이들 3가지 형질전환체는 9.9 - 12.5 g l-1 ITA 및 6.7 - 9.0 g l-1 MA를 생산하였다. 동일한 수송 단백질인 ITP1을 과다발현하는데도 두 균주 사이에서 관찰된 차이점은 잠재적으로 ITA의 방출이 균주 M15에서 병목임을 의미할 수 있다.
H488에서 미토콘드리아 시스-아코니테이트 수송인자 MTT1을 과다발현함으로써, 1가지 형질전환체만이 증가된 수준의 ITA (0.8 g l-1 ITA, 5.3 g l-1 MA)를 나타내었다. 다른 돌연변이체들은 MA만을 생산하였다 (도 21 참고). 그러나, 동일한 과다발현은 균주 M15에서 상승된 ITA 생산율을 입증하는 몇몇 형질전환체를 야기하였고, 돌연변이체 MM8은 주요 유기산으로서 ITA (11.5 g l-1 ITA, 8.0 g l-1 MA)를 생산하였다 (도 22 참고).
아코니테이트-Δ-이소머라제 (ADI1)와 유사하게, TAD1을 과다발현함으로써, 균주 H488에서 뿐만 아니라 균주 M15에서 미미한 ITA 생산만이 (0.03 - 0.16 g l-1) 유도될 수 있었다 (도 24 & 도 25 참고).
2가지 효소 ADI1 및 TAD1의 과다발현에 의해 ITA 생산에서의 단지 적은 (있는 경우) 증가만이 달성될 수 있었다. 그러나, 상향조절된 수송인자 ITP1 및 MTT1의 도입은 보다 높은 형질전환체 생산을 야기하였다. 2가지 수송인자 중 하나를 과다발현함으로써 보다 높은 ITA 생산의 효과는 균주 M15에서 가장 현저하였다. 이는 미토콘드리아 외부로 증가된 시스-아코니테이트 수송 또는 ITA의 방출이 그 자체로 보다 높은 ITA 생산을 야기하지 않지만, 다른 인자가 이미 작용하고 있는 경우에는 증가된 ITA 합성에 결정적임을 의미할 수 있다.
피. 츠쿠바엔시스 H488 및 M15를 RIA1 유전자의 구성적으로 상향조절된 카피로 형질전환시킴으로써 ITA 합성에서 유의한 변화가 달성되었다. 모든 스크리닝된 형질전환체는 증가된 수준의 ITA를 나타내었다. 23가지 형질전환체 중 20가지가 주요 산물로서 ITA를 생산하였다 (도 27 & 도 28 참고). ITA 생산의 높은 유도에도 불구하고, 형질전환체들 사이에서 형성된 ITA의 범위는 상당하였다: H488 형질전환체의 경우 2.0 - 31.4 g l-1 및 M15 형질전환체의 경우 1.3 - 33.4 g l-1. 형질전환체 HR7, MR4 및 MR11만이 ITA에 비해 MA를 더 많이 분비하였다.
진탕 플라스크에서 생성된 형질전환체의 배양 및 이타콘산의 생산량의 정량화:
6가지 가장 높은 생산 형질전환체, HR8; HR10; HR12; MR1; MR2; MR8을 이후에 MG-IA 최소 배지를 갖는 진탕 플라스크에서 배양하여, 그들의 ITA 생산 능력을 추가로 특징규명하였다. 세포를 8일 동안 50 ml MG-IA 배지 (N: 2 g l-1, P: 0.1 g l-1, C: 15 % w/v)에서 배플형 진탕 플라스크에서 성장시켰다. 흥미롭게도, 형질전환체 HR12만이 스크리닝 이전과 비교하여 유사한 ITA 생산율을 나타내었다 (표 5 & 도 29 참고). 따라서, HR12는 추가의 연구를 위해 사용되는 주요 형질전환체이었다.
형질전환체 HR12의 특징규명
효모 세포가 탄소 공급원으로서 아세테이트 또는 에탄올에서만 성장할 수 있도록, 조효소 A (CoA)를 아세틸-CoA로 아세틸화시켜야 한다. Pseudog4086은 이 반응을 촉매하는 잠재성 아세틸-CoA 신테타제를 코딩한다 (AMP-형성). Pseudog4086은 플라스미드의 삽입에 의해 부분적으로 결실되었다. 에탄올/아세테이트 대사가 이 결실에 의해 영향을 받았는지를 확인하기 위해, 단독 탄소 공급원으로서 아세테이트 또는 에탄올을 갖는 최소 배지에서 세포를 성장시켰다 (표 6 참고).
야생형 및 HR12 사이에서 성장 거동의 검출가능한 차이는 없었다. Pseudog4086의 부분 결실에도 불구하고, 효모는 여전히 아세테이트 및 에탄올을 이용할 수 있다. 이러한 관찰은 Pseudog3222의 유전자 산물의 보상 효과에 의해 설명될 수 있다. 이 유전자는 잠재적으로 아세테이트-CoA 리가제를 코딩하고 (ADP-형성), 이는 또한 CoA의 아세틸화를 촉매한다.
또한, 피. 츠쿠바엔시스 HR12가 여전히 글루코스 이외의 다른 탄소 공급원에서 ITA를 성장시키고 생산할 수 있는지 여부는 불명확하다. 따라서, 효모 HR12를 탄소 공급원으로서 수크로스, 글리세롤 또는 D-크실로스를 갖는 액체 최소 배지에서 성장시켰다 (도 30 & 도 31 참고).
데이터는 시험한 모든 기질이 ITA의 성장 및 생산을 위해 효모에 의해 사용되고 있음을 명확하게 보여준다. 가장 높은 세포 밀도는 글리세롤 (OD600 = 45.6) 및 기준으로서 글루코스 (OD600 = 44.8)에 의해 달성되었다. 탄소 공급원으로서 수크로스를 사용한 경우, 가장 낮은 세포 밀도를 생성하였음에도 불구하고, 피. 츠쿠바엔시스 HR12는 7일 배양 후에 28.2 g l-1 ITA의 종점 농도로 가장 높은 양의 ITA를 생산하였다. 글루코스는 이타콘산으로 동등하게 빨리 전환되었지만, 24.2 g l-1의 보다 낮은 최종 농도에 도달하였다. 잠재적으로 지질체 또는 만노실에리트리톨 지질 (MEL)의 형태로 세포 성장 또는 저장을 위해 더 많은 탄소를 사용하였기 때문이다. 글리세롤에 의한 ITA의 생산은 초기에는 훨씬 느렸지만, 수크로스에 필적하는 양의 ITA (종점 농도: 26.2 g l-1)에 도달하였다. D-크실로스 상에서의 성장은 글리세롤의 경우와 마찬가지로 약간 지연되었지만, ITA 생산은 전반적으로 4일째에 16.6 g l-1로 가장 낮았고, 배양 종료 시 단지 17.5 g l-1이었다.
정량적인 실시간 PCR은 실제로 5가지 모든 ITA 클러스터 유전자가 야생형 H488과 비교하여 HR12에서 고도로 상향조절된다는 증거를 제공하였다 (도 32 및 표 6a).
과다발현된 RIA1 유전자는 H488과 비교하여 HR12에서 470배 더 높은 전사율을 나타내었다. 2가지 대사 효소 ADI1 및 TAD1 및 미토콘드리아 수송인자 MTT1을 코딩하는 유전자의 발현은 2,500 - 3,500배 증가로 더 훨씬 높았다. 이타코네이트 수송 단백질 (ITP1)의 발현은 약간만 증가된 것으로 보인다. 이는 전사가 HR12와 비교하여 H488에서 이미 비교적 높았기 때문이다 (데이터는 제시되지 않음).
데이터를 고려할 때, 분석한 모든 유전자의 발현 수준이 고도로 상향조절되었기 때문에, MTT1 또는 임의의 다른 ITA 클러스터 유전자를 추가로 과다발현하는 것이 불필요한 것으로 보였다.
예를 들어 아스퍼길루스 테레우스로부터의 시스-아코니테이트 데카르복실라제 유전자 (CAD)의 과다발현은 강한 본래의 프로모터에 의해 제어되었다.
도 10은 피. 츠쿠바엔시스 및 에이. 테레우스에서 이타콘산 생산을 위한 경로를 제시한다. 2가지 종 사이의 차이점은 시스-아코니테이트가 이타콘산으로 전환되는 방법이다. 피. 츠쿠바엔시스 시스-아코니테이트는 2-단계 과정으로 ITA로 대사되고, 트랜스-아코니테이트가 중간체이다. 이 과정이 에이. 테레우스에서는 단일-단계 반응이고, 효소 시스아코니테이트 데카르복실라제 (CAD1)에 의해 촉매된다. 피. 츠쿠바엔시스 형질전환체는 유. 마이디스 HSP70 프로모터의 제어 하에 AtCAD1 유전자의 추가의 카피에 의해 구축되었다. 그렇게 함으로써 ITA 과다생산 균주 M15-CAD가 생성되었다.
피. 츠쿠바엔시스에서 AtCAD1 유전자의 높은 전사를 보장하기 위해. 따라서, AtCAD1을 PCR 동안에 본래의 구성적 pActin 프로모터와 융합시켰고, 동시에 KpnI- (5'-단부) 및 NsiI-제한 부위 (3'-단부)를 부가하였다. 2,589 bp 길이의 앰플리콘을 KpnI- 및 NsiI 소화시키고, 이에 따라 선형화된 pPTT-플라스미드에 라이게이션시켜, pPPT-pActin-AtCAD1 플라스미드를 생성하였다 (도 33 참고).
원형 플라스미드를 피. 츠쿠바엔시스 H488 및 M15 내로 형질전환시켰다. 총 13가지 형질전환체 (균주 H488에서 4가지 형질전환체, M15에서 9가지)를 생성하였고, 그들의 ITA 생산 능력에 대해 스크리닝하였다 (도 35 & 도 36 참고).
모든 형질전환체는 여전히 주요 유기산으로서 말산을 생산하였다. 균주 H488에서 AtCAD1을 과다발현함으로써 ITA 생산의 유도는 관찰되지 않았다. 9가지 M15 형질전환체 중에서 7가지는 0.7 - 5.4 g l-1 범위의 더 많은 양의 ITA를 생산하였다. M15-CAD 형질전환체는 동일한 조건 하에 0.7 g l-1의 ITA 생산량으로 유사하게 거동한다.
강한 본래의 프로모터에 의해 제어되는 본래의 아코니타제 코딩 유전자의 과다발현
문제는, 하향조절된 ITA 대사 경로에 공급될 시스-아코니테이트를 더 많이 수득하기 위해, 형질전환체 HR12에서 ITA의 생산이 아코니타제를 추가로 과다발현함으로써 추가로 증가될 수 있는지 여부였다.
먼저 NCBI 데이터베이스에 대해 BLASTP 조사를 수행함으로써 각각의 효소를 확인하였다. 2가지 후보 유전자를 확인하였다: Pseudog3035, 이 유전자는 PtACO1로 명명됨, 및 Pseudog2814 - PtACO2.
ACO1 ORF가 인트론을 함유하지만, 상기 유전자는 인트론없이 증폭되었다. 상기 접근법은 상기 기재된 유전자에 대한 pActin 프로모터의 융합과 유사하였다: 먼저 2가지 엑손을 증폭시켰다. 제1 엑손은 pActin 프로모터 (21 bp)의 3'-서열에 의해 5'-단부에서 상보화되었고, 제2 엑손의 5'-서열 (20 bp)에 의해 3'-단부에서 상보화되었다. 따라서, 제2 엑손의 5'-단부는 제1 엑손의 3'-서열 (20 bp)에 의해 상보화되었다. 3가지 모든 단편, pActin (히그로마이신 B 내성 카세트에 의해 상보화됨)은 카르복신 내성 카세트를 보유한다.
본래의 ACO2 유전자는 인트론을 함유하지 않는다. 중첩-PCR의 도움으로, Pfl23II (5'-단부) 및 NsiI (3'-단부) 제한 부위를 또한 부가하면서 상기 유전자를 pActin 프로모터에 융합시켰다. 소화된 PCR 산물을 Pfl23II & NsiI 소화된 pPTT.Cbx-플라스미드에 라이게이션시켰다. 생성된 ACO1 & ACO2-과다발현 플라스미드 (도 37 참고)를 피. 츠쿠바엔시스 균주 HR12 내로 형질전환시켰다.
총 11가지 형질전환체가 수득되었다: 5가지 ACO1 및 6가지 ACO2 과다발현 형질전환체. 모든 형질전환체를 ITA 산 생산에 대해 스크리닝하였다. 1가지 형질전환체는 ITA의 증가된 생산을 나타내지 않았다. HR12ACO1-K5 및 HR12ACO2-K1은 균주 HR12와 동등한 양을 생산하였다. 다른 모든 형질전환체는 ITA를 적게 생산하였다.
피. 츠쿠바엔시스를 위한 최소 배지의 확인
가와무라(Kawamura) 등 (1981, 1982, 상기 참고)은 피. 츠쿠바엔시스의 배양을 위한 배지를 기재하였다. 이 배지는 피. 츠쿠바엔시스 야생형 H488에 의한 ITA의 생산을 위해 변형되었고, 원래 ITA 생산의 유도를 위한 필수 성분으로서 옥수수 침지액 (CSL)을 함유하였다. CSL이 다양한 조성을 갖는 복합 성분이기 때문에, 엄격한 표준화된 과정에는 바람직하지 않다. 따라서, 최소 배지에서 CSL을 대체하기 위한 성분을 찾을 필요가 있었다.
풍부한 YPD 배지에서 배양된 피. 츠쿠바엔시스 세포는 단일 세포 형태로 빠른 성장을 나타낸다. 배플형 플라스크에서 YPD 사전 배양물을 갖는 50 ml YPD 배양물에서 2일 배양 후에 이들은 OD600 = 68 이하의 세포 밀도에 도달할 수 있다. 효모 세포를 아스코마이세테스 친유성 효모에 대한 MG 최소 배지에서 사전 배양하고 (표 7 참고, [Mauersberger et al., 2001: Mauersberger, S., Wang, H.-J., Gaillardin, C., Barth, G., and Nicaud, J.-M. (2001). Insertional Mutagenesis in then-Alkane-Assimilating Yeast Yarrowia lipolytica: Generation of Tagged Mutations in Genes Involved in Hydrophobic Substrate Utilization. J. Bacteriol. 183, 5102-5109]에 따라 변형됨), 동일한 최소 배지로 옮긴 경우, 성장이 관찰되지 않았다. 성장이 없었던 날 1일 후에 효모를 YPD 배지로 옮겼던 경우에, 세포는 다시 급속한 성장을 나타내었고, 이는 세포가 여전히 생명력을 가졌음을 의미한다. 세포를 풍부한 배지 (YPD)에서 사전 배양하고, 임의의 YPD 배지를 전달하지 않고 MG 배지로 옮겼을 때, 세포 성장이 관찰될 수 있었다. 성장은 여전히 약간 지연되었다. 이는 미량의 특정 화합물이 세포를 최소 배지에서 성장시키는데 충분할 수 있음을 나타내었다.
MG 배지에서 성장이 유도될 수 있는지 관찰하기 위해, 피. 츠쿠바엔시스 H488 세포를 MG 배지에서 사전 배양하고, 신선한 MG 배지로 옮겼다. 세포 성장이 관찰되지 않은 날 1일 후에, 배지에 10 % (v/v) YPD 배지 또는 1 X의 복합 비타민 용액을 제공하였다 (도 42 & 표 8 참고). 두 경우 모두 세포 성장이 관찰되었다. 후속 배양에서 복합 용액에서 사용된 사용된 단일 비타민을 시험하였다. 8가지 비타민 중 2 가지인 이노시톨 및 티아민은 MG 배지에서 피. 츠쿠바엔시스 H488의 성장을 가능하게 하였다 (표 9 참고).
비타민으로서 이노시톨 또는 티아민만을 함유하는 MG 최소 배지를 사용하여, 피. 츠쿠바엔시스 H488을 5회 계대로 안정하게 성장시켰다. 효모 세포는 심지어 큰 세포내 지질체의 형태로 지질을 축적하였다 (데이터는 제시되지 않음). 그러나, MG-I 또는 MG-T 배지에서는 피. 츠쿠바엔시스 H488에 의한 유기산 생산이 검출될 수 없었다. MG-T를 일시적인 최소 배지로 사용하였다.
이타콘산 생산을 위한 배양 배지의 최적화
피. 츠쿠바엔시스 H488의 성장을 위한 최소 배지에 대한 기본 조성이 이 프로젝트에서 확인되었지만, ITA 생산을 보장하기 위해 배지의 질소 (N) 및 포스페이트 (P) 함량과 관련하여 그를 추가로 개발하는 것이 중요하였다. 상이한 N/P-비를 갖는 MG-T 배지를 시험함으로써, 성장 뿐만 아니라 유기산 생산이 상이한 N/P-비에 의해 크게 영향을 받았음이 명확하였다 (도 43 참고). 그럼에도 불구하고, 말산은 여전히 피. 츠쿠바엔시스 H488에 의해 분비되는 주요 산이었다.
MG-T의 조성은 탄소 공급원의 양으로 조정되었고, P- 및 N-공급원의 농도는 상이한 비를 시험하기 위한 변수로서 설정되었다. 또한, 술페이트 음이온이 ITA 정량화의 분석에서 교란하기 때문에, (NH4)2SO4를 NaNO3로 교체하였다. 이 배지는 MG-IA로 명명되었다 (표 10 참고).
피. 츠쿠바엔시스 H488은 이후에 50 ml MG-IA 배양물에서 배양하였다. 단지 소량의 ITA이긴 하지만, ITA가 피. 츠쿠바엔시스 야생형 H488에 의해 최소 배지에서 생산된 것은 처음이었다. 0.3 g l-1의 가장 높은 ITA 농도는 2/0.1 g l-1의 N/P-비에 의해 달성되었다. 동시에, 12.4 g l-1 MA가 분비되었다 (도 44 참고).
피. 츠쿠바엔시스 균주 M15를 동일한 배지에서 배양하였고, 2가지 N/P 비가 최상인 것으로 간주되었다 (N/P: 2 /0.1 - 5/0.1). MG-IA (N: 2 g l-1, P: 0.1 g l-1)에서 5일 배양 후에 균주 M15는 이미 유의한 양의 ITA (6.9 g l-1)를 분비하였지만, 말산을 더 많은 양으로 (9.5 g l-1) 합성하였다. 배양을 8일로 연장함으로써, ITA/MA 비가 티핑 포인트에 도달하였고, ITA가 주요 산으로 생성되었다: ITA: 14.8 g l-1, MA: 6.0 g l-1 (도 45 참고).
따라서, 피. 츠쿠바엔시스 M15를 ITA 생산을 위해 다양한 양의 N-공급원 (0.5-4.0 g l-1) 및 P-공급원 (0.1-2.0 g l-1)을 갖는 3 ml-웰 배양물에서 스크리닝하였다. 높은 양의 질소 및 낮은 포스페이트 농도에서 주로 MA가 합성되었지만, 낮은 내지 중간 질소 농도에서는 말레이트 생산이 크게 감소되었다. 보다 낮은 N-농도에서는 대신에 ITA가 주요 유기산이었다 (도 46 참고). 이들 결과는 질소 및 포스페이트 제한이 균주 M15에서 ITA 생산을 촉발시켰음을 나타낸다. N: 2 g l-1, P: 0.1 g l-1을 갖는 진탕 플라스크 배양물에서, 질소가 고갈되었을 때 ITA 합성이 또한 크게 증강되었고, 세포는 고정 성장기로 들었다 (도 45 참고).
후속적으로 ITA 과다생산 균주 피. 츠쿠바엔시스 M15-CAD를 2/0.1 및 1/0.1의 N/P 비를 갖는 MG-IA 배지에서 배양하였다. 8일 배양 후에, 균주 M15와 비교하여 ITA - 42.6 g l-1 (3.2 g l-1 MA)에서의 3배 증가가 달성되었다. 배양 종료 시, 초기 150 g l-1 중 20.9 g l-1의 글루코스가 남았고, 33 %의 수율 (g 이타코네이트/g 글루코스)이 수득되었다. 감소된 양의 질소 (1 g l-1)에 의해 보다 낮은 세포-밀도가 달성되었고, 이로 인해 25.1 g l-1의 보다 낮은 ITA 생산 및 단지 24 %의 수율이 수득되었다 (도 47 참고).
질소 양을 5 g l-1로 증가시키면 훨씬 더 높은 세포 밀도가 유도됨과 동시에 ITA 생산이 급격히 감소하였다: 15.5 g l-1 ITA가 0.1 g l-1 포스페이트-공급원에 의해 생성되었고 (MA: 2.9 g l-1; ITA-수율: 15 %), 24.1 g l-1 ITA가 1.0 g l-1 P-공급원에 의해 생성되었다 (MA: 0.5 g l-1; ITA-수율: 16 %) (도 48 참고).
기재된 모든 균주는 배지에서 질소 및 포스페이트 공급원 비와 분비된 이타콘산의 양 사이의 명확한 연관성을 보여준다. 상이한 과다발현 형질전환체의 스크리닝을 고려한다면, 형질전환체 HR12가 ITA 생산율과 관련하여 상이하게 거동한다는 것이 이미 명백하다. 피. 츠쿠바엔시스 M15와 마찬가지로 HR12를 3 ml-웰 배양물에서 스크리닝하여, 이 형질전환체가 특정한 양의 N- 및 P-공급원에 의존하는지 또한 시험하였다 (도 49 참고). 6일 인큐베이션 후에 형질전환체는 다량의 ITA: 16.3-24.4 g l-1 및 단지 적은 농도의 MA: 0.5-1.7 g l-1을 생산하였다. 이는 형질전환체 HR12의 상향조절된 RIA1 카피의 도입에 의해 분리 효과가 있는 것 같다. 이 형질전환체의 경우 ITA 생산을 유도하기 위해 필요한 N- 또는 P-공급원에 제한이 없다. 그러나, 더 높은 양의 질소 및 더 낮은 P-농도에서는 약간 더 높은 ITA-농도가 달성되었다. MA 농도 또한 이들 샘플에서 더 높았다.
질소 또는 포스페이트 제한 조건으로부터 ITA 합성의 성공적인 분리에도 불구하고, 상이한 N-공급원이 균주 HR12의 도움으로 ITA-생산에 영향을 미치는지가 여전히 불명확하였다. 피. 츠쿠바엔시스 HR12를 N-공급원으로서 NaNO3 (기준), NH4Cl 또는 NH4NO3를 갖는 MG-IA 배지에서 배양하여 잠재적인 관계에 대해 확인하였다. 생성된 [SO4]2--음이온 때문에 (NH4)2SO4는 바람직하지 않았다.
NH4Cl 및 NH4NO3에 의해 약간 더 빠른 성장이 관찰될 수 있었다. 세포 밀도는 NH4Cl에 의해 저하되었고, 7일 배양 후에 가장 낮은 것으로 관찰되었다. 그러나, 균주 HR12는 이 N-공급원에 의해 가장 높은 양의 ITA (7일째에 27.5 g l-1, MA&AKG: 0.18 g l-1)를 생산하였다. NaNO3에 의해 성장한 세포는 가장 높은 세포 밀도에 도달하였지만, 7일째에 더 적은 ITA: 24.2 g l-1, MA&AKG: 0.44 g l-1을 생산하였다. 성장 거동은 N 공급원으로서 NH4NO3에 의해 손상되지 않았지만, 형질전환체 HR12는 7일째에 상당히 적은 ITA: 13.2 g l-1, MA&AKG: 0.26 g l-1를 생산하였다.
NH4NO3에 의한 ITA 합성의 이러한 급격한 감소 거동은 놀라운 것이다. 이는 세포 덩어리의 양에 의해 설명될 수 없다. 생산된 세포의 양은 NaNO3과 NH4Cl 사이에 있다. 어느 것도 배지에 존재하는 질소의 상대적인 양을 결정하지 않는다: NNaNO3: 16.5 %, NNH4Cl: 26.2 %, NNH4NO3: 35.0 %.
NH4Cl의 경우에는, 세포 밀도와 ITA 생산 사이에 부정적인 상관관계가 있는 것으로 보인다. 이는 유익한 효과이며, 그러한 방식으로 더 많은 자원이 잠재적으로 세포 덩어리 대신에 ITA로 전환될 수 있기 때문이다. 따라서, MG-IA의 조성은 후속 배양에서 NaNO3를 NH4Cl로 대체함으로써 변화되었다 (관련 배양은 그에 따라 표시되었음).
발효기에서 가장 유망한 형질전환체의 배양 및 이타콘산의 생산량의 정량화
진탕 플라스크에서 효모의 배양은 작동상의 간편성 및 즉각적인 결과 제공 때문에 과학적으로 필수 불가결하다. 이 배양 방법의 주요 단점은 통기와 같이 특정한 영향을 미치는 변수의 제어가 없다는 것이다. 미생물이 더 큰 부피에서는 예상치 못한 방식으로 거동할 수 있기 때문에, 효모를 다량으로 (파일럿 플랜트 및 생산) 확실하게 배양할 수 있도록, 점진적인 규모 증가 공정이 필요하다.
ITA 생산이 진탕 플라스크 수준으로부터 확실하게 규모 증가될 수 있는지 여부 및 그렇다면 특정한 인자가 ITA 생산율에 어떠한 영향을 미치는지 여부에 대한 첫번째 효과를 얻기 위해, 피. 츠쿠바엔시스 균주 M15-CAD 및 HR12를 상이한 조건 하에 600 ml-생물반응기에서 배양하였다.
발효기 배양의 경우 세포를 글리세롤 원액 (25 % v/v) 형태로 YPD 플레이트에 스트리킹하였다. 이들 세포 (최대 4 주령)에 의해 50 ml YPD 배지를 접종하였고, OD600 = 25-35의 세포 밀도에 도달할 때까지 1 내지 2일 동안 30℃ 및 220 rpm에서 성장시켰다. 발효기에서 시작 OD600 = 1.0을 수득하기 위해 필요한 세포의 양을 3,500 g에서 5분 동안 원심분리에 의해 수확하였고, 3 ml 멸균 H2O 중에서 재현탁시켰다. 발효의 시작은 접종 시점이었다. 달리 명시하지 않는다면, 세포를 하기 조건 하에 배양하였다:
온도: 30℃
pH: 5.5 - 1 M HCl & 2.5-5.0 M NaOH의 첨가에 의해 일정하게 조정됨
통기: 55 % pO2 - 1 l min-1 공기 공급, 기포 형성의 경우에는 ≥ 400 rpm에서 동적 교반에 의해 조정됨, TEGO® 소포체 KS 911 (에보닉 인더스트리즈 아게(Evonik Industries AG))이 자동으로 첨가됨
N-공급원: NaNO3 (또는 그에 따라 표지된 발효에서는 NH4Cl)
20 ml의 배양물 브로쓰를 제거함으로써 24시간마다 샘플링을 수행하였다.
광학 밀도 (OD600) 및 건조 세포 중량을 측정함으로써 세포 성장을 결정하였다. UV-시험 키트 (알-바이오팜 아게, 독일)를 사용하여 글루코스 농도를 효소적으로 측정하였다. 유기산 농도의 측정을 이온 크로마토그래피에 의해 수행하였다. 추가로, 세포를 형태학적 변화 및 오염물의 잠재적인 존재에 대해 현미경으로 관찰하였다. 배양물의 제거로 인한 손실은 추후에 수율, 생산율 등의 계산을 위해 고려되었다.
600 ml 생물반응기에서 피. 츠쿠바엔시스 M15-CAD에 의한 이타콘산 생산
균주 M15-CAD를 2/0.1 또는 5/0.1 g l-1의 N/P-비를 갖는 600 ml MG-IA 배지에서 배양하였다. 진탕 플라스크 배양물과 비교하여, N/P-비에 의해 ITA 생산율에 대한 명확한 효과가 있었다. 단지 2 g l-1 N-공급원에 의해서는 세포 덩어리의 양이 비교적 적었지만, 30 g l-1까지 더 많은 양의 ITA가 생산되었다. 생물량 생산은 5 g l-1 N-공급원에 의해 배가되었지만, 보다 낮은 N-공급원과 비교하여 ITA 농도가 단지 1/3이었다.
두 배지 사이에서 큰 차이가 있을 뿐만 아니라, ITA 생산이 진탕 플라스크에 비해 발효기에서 유의하게 더 낮았다. 2 g l-1 N-공급원에 의해, 진탕 플라스크에서 42.6 g l-1 (3.2 g l-1 MA)와 비교하여, 발효기에서는 8일 배양 후에 30.5 g l-1 ITA (1.0 g l-1 MA)가 생산되었다. 이는 진탕 플라스크에서 생산되는 산의 72 %만을 구성한다. N-농도의 증가에 의해 상기 효과는 훨씬 더 상당해졌다. 8일 후에, 진탕 플라스크 배양의 농도의 58 %만이 달성되었다: 8.9 g l-1 ITA (0.3 g l-1 MA). 이는 이용가능한 질소가 더 많을수록 더 많은 생물량이 생성되고, 따라서 더 적은 탄소 공급원이 ITA로 전환되는 것으로 보인다.
N/P-비를 4 g l-1 N-공급원 및 1 g l-1 P-공급원으로 이동시키면, 4일 후에 최대 25.6 g l-1 DCW의 급속한 세포 성장이 유도되었다. 그 후에 세포는 종종 신속히 사망하였다. ITA 생산은 5/0.1의 N/P-비에 필적하였다: 6일 후에 10.9 g l-1 ITA (1.1 g l-1 MA).
배양하는 동안에 배지 (N/P-비: 2/0.1)의 pH를 pH = 7.0으로 증가시키는 것만으로도, 유기산 생산에서 급격한 변화가 관찰될 수 있었다. 효모 세포가 pH = 5.5에서의 이전의 발효와 유사한 성장 거동을 나타내었지만, 6일 후에는 단지 3.4 g l-1 ITA가 생산되었다. 배양 종료 시 MA가 6.9 g l-1로 생산된 주요 산이었기 때문에, 심지어 유기산의 비가 바뀌었다. 이러한 경우에 생산된 생물량의 양은 문제가 되지 않는 것으로 보인다. 글루코스 소모율 및 생물량 축적률은 pH = 5.5에서와 매우 유사하였다.
ITA의 용해도는 pH-값이 높을 수록 증가한다. 이는 ITA의 생산을 용이하게 해야 한다. TCA 주기에서 시스-아코니테이트 합성을 증가시킴으로써 잠재적으로 ITA를 증가시키기 위해, 발효 과정 동안에 용존 산소를 pO2 = 90 % (통기: 2 l min-1)로 증가시켰다. 이러한 아이디어는 전자 수송 사슬에서 NAD+ 및 FAD-재생을 보장하기 위해 산소를 충분히 공급하기 위한 것이었다. NAD+ 및 FAD 둘 다 TCA 주기를 유지하는데 필요한 필수적인 전자 운반체이다. 이렇게 함으로써, 전반적인 ITA 생산이 크게 감소하였다. 6일 후에는 단지 7.0 g l-1 ITA 및 0.8 g l-1 MA가 생산되었다. TCA 주기가 상승된 산소 공급에 의해 실제로 더욱 활성이지만, 생성된 시스-아코니테이트는 TCA 주기에서 ITA로 전환되는 대신에 단순히 사용되었음이 가능하다.
균주 M15-CAD에 의한 마지막 생물반응기 배양 동안에 pH-조절이 차단되었다. 대신에 4 g l-1 CaCO3를 사용하여 pH를 유지하였다. CaCO3는 강염기 (Ca(OH)2) 및 약산 (H2CO3)의 염이다. 이는 물에서 불용성이다. 산 (H2CO3보다 강함)이 배지에 존재하는 경우, 그의 음이온은 상응하는 Ca-산 염 및 H2CO3 (최종적으로 H2O & CO2)를 형성하면서 카르보네이트 음이온을 대체한다. 발효 과정에서 CaCO3의 양만이 5.5-6.0의 pH를 유지하기 위해 사용된다.
이렇게 함으로써, ITA 생산은 다시 크게 감소하였다. 6일 후에는 단지 15.5 g l-1 ITA 및 2.4 g l-1 MA가 형성되었다. 이것이 첫번째 발효와 매우 유사한 발효였다는 점을 고려하면, 이는 정말로 놀라운 효과이었다 (도 52 참고). 구별가능한 유일한 차이는 pH를 대략 5.5로 유지하기 위한 방법이었다. 다시, 필적하는 양의 세포 덩어리가 형성되었지만, 더 적은 글루코스가 소모되었다: 첫번째 경우에는 96 g l-1 및 완충제로서 CaCO3의 경우에는 85 g l-1. 글루코스 소모에서 이러한 차이는 생산된 ITA에서의 차이와 유사하였다: 26.6 g l-1 (6일째) - 15.5 g l-1. CaCO3의 사용은 여전히 알려지지 않은 이유로 산물 형성을 손상시키는 것으로 보인다.
요약하면, 피. 츠쿠바엔시스 균주 M15-CAD에 의한 ITA의 생산을 위해서는, 이용가능한 질소 및 포스페이트 공급을 제한하는 것이 중요하다. 이는 진탕 플라스크 및 더 큰 생물반응기에서의 생산의 경우에 해당하지만, 최적 N/P-비는 상이한 배양물 부피마다 다른 것처럼 보인다. 포스페이트 제한은 이 균주에서 ITA 생산을 유도하게 위해 필수적인 부분이다. 이용가능한 질소의 양 또한 결정적인 인자이며; N-과량인 경우에는, 대부분의 글루코스가 ITA 생산 대신에 생물량에 대해 사용될 것이다. 추가로, 억제 효과 및 경쟁하는 대사 경로를 최소화하기 위해 최적 산소 포화도 및 pH를 찾는 것 또한 중요하다.
600 ml 생물반응기에서 피. 츠쿠바엔시스 HR12에 의한 이타콘산 생산
이타콘산 과다생산 균주 피. 츠쿠바엔시스 HR12를 600 ml 생물반응기에서도 배양하였다. 먼저, 균주 M15-CAD에 대해 최상인 것으로 고려되는 조건이 적용되었다. 초기에 150 g l-1 글루코스, pH = 5.5, pO2 = 55 % 및 30℃의 온도를 이용하여 효모를 회분식 발효로 배양하였다. 초기 N 및 P-농도는 각각 2 g l-1/0.1 g l-1 및 4 g l-1/1 g l-1이었다.
HR12가 M15-CAD와는 상이하게 거동하는 것이 분명하다. 웰-배양물에서 이미 확인된 바와 같이, HR12는 특정한 N/P-비에 의존하지 않고 이타콘산을 생산한다. ITA는 시작부터 발효 종료까지 일정한 속도로 형성된다.
더 적은 양의 질소 및 포스페이트 (N/P: 2/0.1 g l-1)의 경우에, 5일 후에 단지 90 g l-1 글루코스를 소모하면서 41.6 g l-1의 ITA가 생산되었고, 말산은 생산되지 않았다 (도 58 참고). 이는 ITA에 대한 8.3 g l-1 d-1의 평균 생산율에 상응한다. 세포 성장은 신속하였다. 이는 3일째에 그의 최대치에 도달하였지만, 급속히 쇠퇴하였으며, 그럼에도 불구하고 ITA는 계속 생산되었다.
도 59는 초기 N- 및 P-농도 (4/1)의 증가가 ITA의 생산에 매우 유익하였음을 제시한다. 균주 M15-CAD에 의해 관찰된 높은 N-&P-농도의 급격한 억제 효과 대신에, ITA 생산율은 66 % 증가하였다. 13.8 g l-1 d-1의 평균 생산율로 총 68.8 g l-1 ITA가 5일 과정에 걸쳐 합성되었고, 검출가능한 양의 MA는 합성되지 않았다. 이는 2-3일째에 그의 최대치에 도달하였고, 그 후에 천천히 쇠퇴하였다. 소모된 글루코스 및 생성된 68.8 g l-1 ITA를 고려할 때, 46 % (g 이타코네이트/g 글루코스)의 수율이 달성되었다. 세포 성장은 심지어 더 많은 자원이 이용가능하였음에도 덜 강력하고 더욱 꾸준하였다.
후속 배양에서, 상기 기재된 발효 (N/P: 4/1 g l-1)를 총 10일 동안 5일째에 100 g l-1을 공급하여 유가 배양식 발효로 반복하였다 (도 60 참고). 이전의 배양과는 대조적으로, 유의하게 더 많은 생물량이 생성되었다. DCW는 3일째에 최대에 도달하였고, 5일 째까지 이 양이 유지되었다. 글루코스를 공급한 후에, 세포 양이 감소하였지만, 발효 종료까지 천천히 회복되었다. 5일째에 글루코스는 거의 완전히 소모되었고, 대략 60 g l-1 ITA가 형성되었다. 이는 이전의 배양과 일치한다. ITA 생산율은 전체 배양 기간 동안에 11.6 g l-1 d-1로 거의 일정하게 유지되었다. 처음 5일 동안에, 무시할만한 양의 MA 및 α-케토글루타르산 (AKG) (누적 1.6 g l-1)이 생산되었다. 이 양은 10일 후에 3.0 g l-1로 증가하였다. 거의 30 g l-1 글루코스가 배양물 브로쓰에 남아 있었다. 전체 115.6 g l-1 ITA가 28 % w/w의 수율로 생산되었다.
도 61로부터, 초기 글루코스 농도를 75 g l-1로 저하시키고 매일의 공급 간격을 도입하는 것이 세포 생물량에서의 급격한 증가를 유도하였음이 명백하다. 놀랍게도, DCW는 5일 후에 크게 감소하였고, 그 후에 일정하게 남아 있었다. 글루코스를 더욱 자주 적용함으로써, 39 %의 유망한 수율과 함께 전체 ITA 생산율이 9.9 g l-1 d-1로 미미하게 감소되었다.
질소 농도를 5.5 및 8.0 g l-1로 낮추었을 때 유사한 최종 결과가 나타났다. 다량의 세포 덩어리의 양 (DCW ≥ 30 g l-1)이 축적되었다 (도 62 & 도 63 참고). 이타콘산 생산 또한 약간 증가하였다. 7일 배양 후에, 두 배양 모두에서 대략 90 g l-1이 생산되었다. N-농도를 4에서 5.5 g l-1로 이동시킴으로써, 수율: 36 % w/w (이전에는 38 % w/w)을 또한 지속시키면서, 생산율이 9.9 g l-1 d-1에서 11.5 g l-1 d-1로 증강될 수 있었다. 8 g l-1 N-공급원에 의해 생산율이 훨씬 더 높았지만: 12.8 g l-1 d-1, ITA 수율은 32 % w/w로 감소하였다.
도 64에 도시된 발효의 경우, 글루코스에도 불구하고 모든 자원이 초기에 보다 많은 양으로 존재하였다: N/P-비: 8/1 & 1.75 X 양의 미네랄 염, 미량 원소 및 티아민. 이러한 방식으로 ITA 생산율은 13.4 g l-1 d1 (수율: 33 % w/w)로 증가되었다. 7일 후에 93.5 g l-1 ITA 및 1.4 g l-1 MA & AKG가 합성되었다.
NH4Cl이 진탕 플라스크에서 유익하게 시험되었기 때문에, 그의 사용을 생물반응기에서 또한 분석하였다 (도 65 참고). 8일 발효 후에, 90.3 g l-1 ITA 및 2.3 g l-1 MA & AKG가 생산되었다. 이는 이타콘산에 대해 11.3 g l-1 d-1의 생산율 및 41 % w/w의 수율에 상응한다. 간단히 N-공급원을 전환시킴으로서 생산율 및 수율이 증가하였다.
유기산의 하류 과정을 위해, 가능한 한 낮은 pH에서 이미 배양하는 것이 매우 유익하다. 따라서, 생산율에 대한 보다 낮은 pH-값의 효과를 분석하였다. 저하된 pH에 의해 생성된 스트레스를 온건하게 유지하기 위해, 발효 과정을 5.5의 pH에서 시작하였고, 1일째에 4.0으로 감소시켰다 (그리고 각각의 배양에 대해 2일 및 3일째에 점진적으로 3.5 및 3.0로 추가로 감소시켰다).
도 66은 세포 성장이 중성 pH와 비교하여 4.0의 pH에서 발효 과정에 걸쳐 훨씬 더 제한되었지만 매우 안정하였음을 제시한다. 세포 형태학을 고려할 때, 세포는 크기가 더 작은 것으로 보이고, 더욱 빈번하게 가성균사를 형성하였으며, 낮은 지질 저장 활성을 나타내었다. 임의의 지질체가 형성된 경우에는, 그들의 치수가 pH 5.5에서 성장한 세포에 비해 작았다. 지질 저장의 억제는, 지질 축적에 의한 단일-세포 밀도에서의 변화 때문에 배양 후기에 이들 효모 세포가 부유하지 않았다는 관찰에 의해 입증되었다.
이들 결과는 이후에 거의 동일한 발효에서 확인되었고, 차이점은 1 g l-1 NaNO3를 7일째에 공급하여 세포 생존력을 잠재적으로 유지하였다는 것이다 (도 67 참고). 세포 성장은 처음에는 매우 신속하였지만, pH를 감소시킨 후에는 저하되었다. pH 조정 이후에, 이전의 배양에서와 같이 유사한 안정한 성장 거동이 관찰될 수 있었다. 9일 후에 최종 농도는 98.1 g l-1 ITA (생산율: 10.9 g l-1 d-1, 수율: 40 % w/w) 및 누적 0.06 g l-1 MA & AKG이었다.
pH를 3.5 또는 심지어 3.0으로 추가로 감소시킴으로써, 세포 성장 및 ITA 생산 둘 다 유의한 방식으로 부정적인 영향을 받았다 (도 68 & 도 69 참고). 7일 후에 48.9 g l-1 및 62.9 g l-1 ITA가 각각 생산되었다 (두 경우 모두 0.5 g l-1 MA & AKG acc.). 비록 평균 생산율이 단지 7.0 내지 9.0 g l-1 d-1의 범위이었지만, 수율은 31-38 % w/w이었다. ITA 생산율이 1일째 동안에 보다 높은 pH에 의한 배양의 경우와 닮았다는 것을 고려해야 한다. 두 발효 모두에서, 4일째에 ITA 합성이 거의 멈추었다. 이는 글루코스 소모에서도 관찰되었다. 이는 효모 세포가 이전의 발효와 유사한 속도로 글루코스를 ITA로 전환시켰지만, pH를 감소시켰을 때 느려졌음을 나타낸다. 3.5 및 3.0의 pH에서, 세포는 장기간 동안 ITA 생산 또는 심지어 기본적인 세포 대사를 지속할 수 없었다.
지금까지, 피. 츠쿠바엔시스 HR12가 보다 단기간의 회분식 발효에서 강력한 이타콘산 생산자임이 입증되었다. 그러나, 더 큰 규모의 생산의 경우에는, 연속 또는 반연속식으로 배양하는 것이 종종 비용적으로 더욱 이익이고 더욱 실용적이다. 반연속식으로 발효시킴으로써, 특정한 시간 이후에 배양물 브로쓰의 많은 부분이 제거되고, 신선한 배지를 이용하여 초기 부피로 다시 충전하고, 추가로 배양한다. 이는 더 긴 배양 시간으로 인해 더 높은 효율의 이점을 갖는다. 기질을 완전히 전환시키는 것 또한 가능하다. 추가로, 설정을 덜 자주 수행해야 해서, 관련된 위험 (예를 들어 접종 실패)이 최소화된다.
균주 HR12가 적합한 후보인지를 연구하기 위해, 반연속식 발효를 수행하였다. 따라서, 효모를 6/1 (N-공급원: NH4Cl)의 N/P-비에서 pH = 4.0에서 7일 동안 배양하였다. 7일째에 배양물 브로쓰의 ½을 제거하였고, 신선한 배지로 보충하였다. 도 70에 제시된 바와 같이, HR12는 전체 14일 배양 동안에 ITA를 계속 생산하였다. 심지어 보충 후에도, 생산율이 안정한 것으로 보였다. 종료 시 112.0 g l-1 ITA (0.4 g l-1 MA & AKG)가 생산되었다. 배양물 대체에 의한 산물 손실을 고려하면, 이론적으로 160.4 g l-1 ITA가 11.5 g l-1 d-1의 속도 및 35 % w/w의 수율로 생산되었다 (도 71 참고).
표 1. 그들의 염색체, 게놈 크기, GC-함량, 코딩된 유전자의 개수 및 생성된 단백질의 개수와 관련하여 상이한 비통상적인 효모 및 사카로마이세스 세레비지아에의 게놈의 비교.
표 2. 유. 마이디스의 염색체와 비교하여 피. 츠쿠바엔시스의 상동성 스캐폴드 또는 스캐폴드의 부분(들)
표 3. 피. 츠쿠바엔시스에 대해 이용가능한 보고된 강한 이종성 및 본래의 프로모터 서열
표 4. 피. 츠쿠바엔시스 HR12에서 결실된 유전자에 대한 단백질 BLAST의 결과. *Pseudog4086은 부분적으로만 결실되었다.
표 5. 50 ml MG-IA 최소 배지 (N: 2 g l-1, P: 0.1 g l-1, C: 15 % w/v, pH-조절 없음)에서 8일 진탕 플라스크 배양 후에 6가지의 선택된 RIA1-과다발현 형질전환체의 ITA 및 MA 농도 및 ITA 생산율.
표 6은 도면 단락에서 재현된다.
표 6a: ITA 대사 유전자의 유도
표 7. 아스코마이세테스 친유성/친지성 효모의 성장을 위한 MG 최소 배지의 조성. 이 배지는 피. 츠쿠바엔시스에 의한 ITA 생산을 위해 사용되는 최소 배지의 개발을 위한 기본이었다.
표 8. 100 X 비타민 원액의 조성.
표 9. 상이한 비타민을 갖는 MG 배지에서 피. 츠쿠바엔시스 H488의 성장.
여기서:
표 10. 다양한 농도의 질소 및 포스페이트 공급원을 갖는 MG-IA 최소 배지의 조성.
표 11. 서열 모음
SEQUENCE LISTING
<110> BASF SE
<120> Itaconic acid production
<130> PF180378 (Rec 85746673)
<160> 77
<170> According Wipo Std 25
<210> 1
<211> 51574
<212> DNA
<213> Pseudozyma tsukubaensis
<220>
<223> preferred RIA1 expression cassette insertion region in Pse
udozyma tsukubaensis
<220>
<221> misc_feature
<222> (38477)..(38501)
<223> n means a or g or c or t/u
<400> 1
ccccctgact cgtcgctcac cgctaccacc tccgaagctg gtgtcaagaa cacgctgggt 60
gcaggtgacc gatcgtaccg cttcatggat gcgggcgctg cctttggtgg tcacgacgta 120
tttgacgaca ttccaggcga ggctcctaca gctcctggca cagctccacc ttcgcgcccc 180
atgtcgccag ccaatgcgct cgagcaaggc cgattgcgaa acaccgccgg cttgcccact 240
tcgtcgtctg gtcctgctcc gccttacata gcttcatctc gccgtgctgg cggcgtaagc 300
gagtcgtacg agctcactga tccgcccaac cgcatctaga caccccatgc attttcgttg 360
aaacagtgaa tcgtgctgtc ttctatctac tcaccacacc ctcattgcat tctcgttcct 420
tcaggcatct catcaaaatc attatccccg taacttagca ttctcggaca ctaactattc 480
atctctctct acatagcttc catcgcaatg aatcttgcat cttacccatc tggagctgtc 540
tatgagtgcc gatcgtgcct gccatgcaac tagcttgcgg atgcagtatg ccttgatccg 600
tgtcgtcgag gattgaaggt gtgaacatgc caacaacgca aacagagacg atcagaatgc 660
aagtacggaa tataatgaca ttatgacgcc aaatcgcagc gctacagacc agtggcggag 720
tggtcaatcg cgcgaggttt aagcgcgatg ctgattttat ttctcgtcct tcgggttcgt 780
gggttcgaac cccacctggt ctattcgagt ttttttttcc cttacttccc ttttcaaccg 840
tttcgtcatc accactcatt cgcattcttg ttgctacgca tggcacatga tgtatggtct 900
ccatctgaag ctgcaggggt atatgtattg cgtcatgaag ctgctttcga gttggaacgc 960
tgtgtgtgaa agtcgtaaat gatatcggcg gcagctttca tgccggcctg gttggggtgg 1020
tatgcgcatc tgtttttgaa gttccagaac gagccgtctg atacccaagg ctcttttgat 1080
ccgagtgcgt gcttgagctt gctctcttct gctagcggaa cgacatagac gttattcctc 1140
ccttccgctg ccttggcgta gagcgattga agctgttcgg ccatctcgat gtacttttgc 1200
acttgttgct gatcccaaca tacgtccctc cacgcttttg tatcgggtcc catcatggcg 1260
tggtattcga ccaggtagat cgtcgctttt ggatactttt tctggacgcc atcgatcaag 1320
gttgcgaatc tttgggagat ctcgtctggc gaagcgatgg tggggtgttc aaagtgctcc 1380
ttctcttctt tcgacaagac aaaatacgac aacaatctac cccaccatgt gttcttgaac 1440
gtcagaccga acatactccc gatgtagaac atgtcattgc ccccaccggt gatcgtgact 1500
atcgcatcgc tgccatcatc tccttcctta agttcgggaa gaagacttag ttgaggggcg 1560
tagactttct ttccagtatc ttgcggttcg gagatcaaat tgagtagcgt cgcacttgac 1620
accgaaaggt cgagaaattc atccgtgttg ttcgggtcga gattgagtct acgcgccaag 1680
tagttgggat agttgtttgc acttcgacca gcgtcagtgt ctacttgagg agggatgcct 1740
ggcccagcgg cgaacgatga gcccaacgcg atcaaccttg tcatttggac ttgttatggc 1800
acagtgttga tattgccaag atcgacgtcg aagatgcaat gatgaagcaa aacggagcga 1860
agtgcaaaca gggtctcgat aagatgaatt gacgagttca aaggaagggt tcccgatatg 1920
aagactaacg acttcatcgg caggcttcta gcggaaaccg gactggataa ggcgggcagc 1980
gtgtaggtgg gtctgtgcgt ttgcgtcaac cccgcatttc ctcggcaaag aaaaagcaag 2040
aaatttgaga aaaaggcggg aaaattgtaa cacaggctaa ggaccggttg tcggaggtca 2100
aattgaagcg ttgagccggt acgacctaga gaatggggaa actcatcacc agccgtgtca 2160
ttctcttttg ctgaggttgt gatcagattc tcatctacat agcttgtcgt tcgaagcaac 2220
cgggcactta ttctacctct atgcgtccat catgatgaat cttcgcgagg ctgtgtaccc 2280
atgggtacat ttgggcgaag aaaggacgtc gcacgaccga cagcctaaga agcatagcgc 2340
accaaagtaa cggttgaatg actgcaaatg tagagccgtg tcaagttcgc gatcatagcc 2400
gaagcgagtg agggatgtct cgagctatgt ggccggcatg ttctcagtgc cccgcaattt 2460
tttgtgtgtg ttcttgtggc acgagcaatc ggctcaaccg agtctgcagc aaaactgagc 2520
catttacccg tcgtggccga cttgaccgtg tgcgagccaa gagcaagccg aaaacgtgag 2580
tcttcgccga gtctcttcct tcctttgctt cactaacatc agtagccgtc actatagatc 2640
ccttatgagc agctagccgg cagattttgg ctgcgtttcc tccccaccat catcgcattc 2700
ctgcatcacc ttgcctactc cgtcacgatg ccctacacac caccacgttc gtcgcagcct 2760
cctaaaggtt taccctttga gctttcgctc tcgacgcatc ccggcgcgca gcacaaccga 2820
tcttcgctca cacccgtgtc gttcctcttg cgtgccgcgc tgattacgcc tcgcaaattg 2880
gcaatcactc atcctgaaaa gggctactca ttcacctacg agcaatgggc agcacgtact 2940
ctctcgctcg cctttgcact tcgcagcctt cccgccttca agattggtga tcgcgtcgct 3000
gttatctcgc ctaacgcacc tctgatcgca gacgctcact ggggtattcc tgctgttggt 3060
ggtatcatta cgccgatcaa cattcgaaac acgcccaagg aggtcgctta cgtcttggag 3120
cactcgggta gcactgtaat cttggtcgac cacgagttta cacacctcgt ccccgagaac 3180
cctggcccag gcatcaccgt catcgtcagc aaagattcgg gaggacaaga agctgacgat 3240
ccatacgaga aatttctcga tcgtggcttc ctcgaatggc agcgtgctga gcaggctgag 3300
ctcaaagcct acaagtctcg cactcgacct tctgctgaac caaagacggg atggaaactc 3360
atcgaggcgc ctcaagacga agaacaaccc atcgccctct gctacacctc gggtactact 3420
ggtcgaccca aaggtgtgct cactaaccac cgtggagcct acctttctgc cgtagccaac 3480
gcttttgaag cccacctcac gcaggatagc gtctatcttt gggttcttcc catgttccat 3540
gcttgtggat ggacgtaccc ttgggctgtt actgcttctc tcgctacgca tttcaccatt 3600
cgcaaggtcg acaacaccgt tatctgggac gcgttgctca atcacggcgt atcgcactac 3660
tgcggtgccc ctacagttca gatcggcctc gtcaaccatc ctaacgcacg caagctcaac 3720
cgtcgcgtga acgttgccgt cgcagcttcc gcacccaccg ccaacctcct cgccaagatg 3780
gagggtctaa acttgcaccc agtccacgta tacggcttga ccgaaacata cggtcctttc 3840
accaggaggt acttcgagcc cgaatgggcc aaactagatg ttgatgctcg agcacgaatg 3900
atggctcgcc aaggacactc ctacctcact tcagatgagg tacgtgtcgt tcgtactgct 3960
tcttccaccg acgcctctac acctgacctc gtcgatgttg agcgcaacgg tcaagaaacg 4020
ggcgaaatcg tcattcgagg aaacatggtc atggtaggct actacaacga tcccgccgcc 4080
acttccaaag ccgtcatgaa aggctggttc cacactggcg acctagccgt ccgtcaccct 4140
ggcggcgaaa tccaaatcct agaccgaggt aaagacatca tcatctccgg aggcgaaaac 4200
atctcctcgc tcatggttga acaggaactt gcctcccacc cttccgtcct cgaatgctgc 4260
gtcattgcac gaccgcacga aaagtggggc gaacgcggcc agtcgtttat cgtgctcaca 4320
gaacaggcga aagcgaaact caacttcgca gagataaaaa agaagggttc accggagaac 4380
aaggcgtttg ttgaagaggt gaaaaagcac tgcgtggaaa ggatgtccaa attcgccgta 4440
ccggaatggt tcgacgtagt ggacgaattg ccaaagacaa gcacgggcaa ggtgcagaag 4500
aacgtgctcc gagctaggtt cgctagtaag ttgtaaaagt agatcgtgtc gcgtggaatg 4560
agagcaatgg aagtgtcatc tattcttggt cgatgcaacg gtgcgatgtg tgtctcttgg 4620
atgcgtcggt aacgtgcttt tgacaacttc gagaagattc acccgacgac agagggtaat 4680
gcactgacaa gcgcatagca cggaggggca aagagctgcc tcaacagccc aatcctgtac 4740
gaccatacga gcaagagtga gacacgtctt cattgtttga cacgaagaag tttacggcaa 4800
ggaggtaact ttttttacgc cagagaagga tggttcgttt ggtggtggag ccgcgcttct 4860
ccgcacagcg agaagagggg cgtaggtgtg ggggaggaca gtccaagtcc aagtccaagg 4920
tgtcgcgtga aattgaccga ttttggcagg ttttgcggct ttgtgcagat cactttcaaa 4980
agccgccgcc gccgccgcct cctgcgccca gaacatgtgt ggagttttcg tttttcgctc 5040
gtgccacctt ttccttctct ttgtgtcgta cattacatcc actcaacctt ccttctcatc 5100
cttccacctt tcgttctctt atttctatcc ttctcaccat caccaccagc ttccacagcg 5160
tctatcggaa ccatgacttc catcctgcgc gacatccttt ccacctacgt cacaggtggt 5220
aaagacccct tccgcaacct ctcgtacgcc gctgtacccc tctccctcct cctcgctgcc 5280
ctccctcact ggtacaccat ctaccttgcc gaatcgaaca aagtccaagg aggatggagc 5340
aacgtcaacc cccgcttttg ggtccaaact ctcaccgcca aggctctcac caagaagttg 5400
accccgcttg aaaaccagat tttgaggggt caaagttgcc aagccaacgc gtttgagaac 5460
gtgccgctgt tcatcgccac cgttgtatgg gcgaacgtaa gcggcttgga gagggaaacg 5520
attaacaact ttgtagtggg atatctggta agcagggctg cgtacacggt gttgtatttg 5580
aagacggagg ggtatgcgaa cagttttgct aggacggcgg ttttccaagt gggaatcatc 5640
tggattatta ccgtttggat gaagggggct tttaggggtt tgccgctcgt caagtgagcg 5700
tatgatcgag gcgagaggag agggagctag gaaagaagga ttggcaaacc catagaagca 5760
cagagtggag agcgaacaag gggtccacac tcaagacgta acgccccgcg aatcagcccc 5820
acgcttcgct ctcactctcg ttcccctcct caaatctaca ctgacgatag ccaagcagca 5880
atcacacaaa agttcgaacg ttcgagtata agacagctat ccgtttgtgc acaacagcat 5940
ttgagttgcg atacatcttt ctcttgacaa gaaactaatc attgagcacg ggtgaaaaca 6000
cttagtaaga cagactcttc tccagaatcc tagccaagtg ttcgtggcca tcgctgccca 6060
tcacgtcacc gatacccgga gccaaatcca acaccctcct ctgtggaatg gttcctttta 6120
cgagggcctc cacatgttcc tgcccgtacc cgatcttagc cagacccctc ggcacgccca 6180
agtcggccaa gaaggacgcg atcctatcgt acacaagtgc accaacctcg gagtcgggca 6240
gacgagcgat atccgtagcc tccgcaccgc tgtcgtaacc cgcaaaaata gctgctacgt 6300
cacggtgacg gtcgggcgcc gaaggcgccg taaagtcaaa tactgcaggc ccagtcaaag 6360
cgaccgagat accgtggggt acgatgggat ggtccacctc gtaccccggg tgctggtatt 6420
taccaaattt cttgttcaac cccgaaatag ggtagctcat gccgtggcaa aggtggacgc 6480
cagcattacc gaatccaata ccagcaaacg tggaggccaa aagcatctgt ccacgggctt 6540
caaagtcggt tttgtccttc gcaacgcgcg ggaggtactt aacggtctgc ttgagcgccc 6600
agagggagaa aacgtccgag atggggttac gtccttggta agcgggacgt tggagcgggt 6660
ttgcggggcg aggcatgcgt tcgttgtacg ggatggcggt gtacgattcg agtgcgtgga 6720
acaacacatc caatcccgaa ctgatgtgga cggcggtagg gcaagtttcg gtgttgagag 6780
gatcaacaat acccaacagg ggacgaaggg ctcgggaggc aataccggtt ttggactcgg 6840
tagcggtatg atcaaagatg gctgtaccgg tggtttcgga tcccgtacca gcggtggtgg 6900
gaacgcaaag cagaggcttg agaaccttgt cgatgggggt accacgaccg ataggagcgt 6960
tgacgaattc gagcagatcg gcgtcagggt agcagctgaa aaggttggcg actttacacg 7020
tatccattac cgatccacca cccaccgcca aaaagtggga gaagtcctgt tcacgtgcga 7080
acctgatcgc tgcctcccaa ctcttctcat tcggctccac cctgacctga tcaaagatct 7140
cgtacttaac cccagccttc tctagtccat cgatactctg cttcatcgcg gtcagattcc 7200
tcaccgttgg atcggtgaaa acacccacct tcctcgcctt catattggcg aaatccatac 7260
cgacttcctt ggtgacacct tcaccgtacc taatgttgga agcggcaagt tcaaaggcgt 7320
attcgcgttc aacggcgtga tcgacgggag tggcgtatcc gcgtgcgttg gcaccaggtt 7380
gagcattgtg tttggcaatc atgttcattc cggcacgagc gaggttggct ccaccccgag 7440
caaccgagca tccgtgacag gggcatccac ctgcatgcga catgcgcatg aggttggcga 7500
tggagctacg ggaagctggg cctggtttgg gcattgttgc tgcgatgaat cttcactttg 7560
gggtcgatga agaggcagaa aaaaggaagg gtaatgatga agaagggaag agaaaggcaa 7620
acgaggcaag ggcgaaagag taaagtactt tggtgtgtgg agacgggaaa tgggggatgt 7680
cacgagaaca cgatccttgg agtgcagggc agacaaagac gagattccgg ggaatgggtt 7740
gccaggttgt aatgtagcgc agagaggtca tgcggggaag gggccgagtt gccgacagag 7800
taatcatccg ttcttgaagg cagtagagca cagtggtgtt atggcgatgc ataagcggta 7860
ctgtaattga cctttttatt cgcctttttc cgccttctcg ctttagccgg tgccggtggt 7920
gcacggttac gaaagagcga cagcagtcag tgacagcagg gcagaggcag agcgcgcgtc 7980
gaaaatagac atccacgacc acatacgaca aaagcggagt cgaaaacagc tcagacacac 8040
agagaggaag aacgagggct cgtgcggggc acagcacggg tctatcggtt cttccaccga 8100
agaaggatac atcttaaccc gcttctacag ctgcggagaa aagggtatat acgcacgtcc 8160
ttgttacaca cgacatcgat ggcaaccact cccgattctg acgagttgac gatcgtagcg 8220
atatgcacct gaaagctttc agtgctcctg cttgacagca tgcatgctcg gctgtcaaag 8280
agagcctcgt ccacatacaa agcgaccacg tcagtgaagg aaagatggta tgataaatga 8340
tttcgttgtg tggggggaat ttgcaagtga atggaactct ataacaggtc catcagatag 8400
tgtccgtgtt cgtaagcatc ctcgaccagc aagagatgcg tatatcagtt ttgttcgtgg 8460
tgagtatcac ccggtgtcat tgaaaacgag aaggccaaga ccagctcaaa gcaagctcaa 8520
ggcgaaagca agcaccgctc ctgctcctag agtcacaacc ccacccgtga ccatggacga 8580
tgccgaactc ttcgacccag cactgcttcc actaccaccc ttcttcgccg tactgctcgc 8640
actgctccca ttgttcgccg ccgtcacgtt cgcagcaccc gtcggcatct cctggaacaa 8700
tctatacagc gaaatgttgt acgacaacat ggcgtaatcc tcgtgcgaaa cattgggcat 8760
aaagttagcc gtctgcgtca cgggcagctt cccattcccc gtcaaactgg cgagcgattc 8820
aacaaagtga catcctcttt cgaggtggtt tgcgccttgc agagaagctt cgcatgcggt 8880
atcgccttga ccgttgtcga ggaggccgta gttgtagtgg acgttacgcg attcgaacgt 8940
ggtcaggagt tgctgtttgt tgttcttgac acggtcgcga gcgtagttgg ggacgccgga 9000
gccatcgagg ccgtacgccc agtcgtctgc ggtggaggcg cagctggtgt tggagttgtt 9060
gggacgagag gaggtgagcc agacgtaact gccggggttg ccgacccaaa agatgatgtt 9120
ggagtcgtag gcgtcgggtt tcttgacgac agagtagcgt tggaccattt gggcgcccat 9180
cgagtgaccg gccatgacga cggtgttgag ggcggggaag gtggttttgt cgaagagtgc 9240
atccatgaag gagtccataa cctgataaga cgagatggcg gtgttgccgg gtcctcgcga 9300
agccataccc gattgccact gcgatccgtg ccagtacagt tcgccagact ggatggcgcc 9360
cgctttggca tcatcggaat tcatccagca gggacccaag atcagcactt gatcttttcc 9420
aagtcttcca ctgtcatcgc ctgtagtcga tccgtccgca ctgctaccag cgctctgcgg 9480
gttggtctcg aacacattca acgcgttctg gatgagcgaa gtgtacttcc agcaatctct 9540
tggtttgcct ggcatgatca taacagctct cttgatcttg gtagcgtcaa atccttgggt 9600
ctggtagaaa ggcatcacag ctccaggtgc aacagcaaag gtgcggttga gcgtcatacc 9660
ttggatctcg ggtaatgctt gccagcctcc atcgacgctt ccgttgactg cggcttcagg 9720
agtgaaaggc acattggcgt tccaaggaag ctgcgtattg tccgggacaa tgttgtagcg 9780
gtaaagacct ccggtagcgt attggcctgc gatgtagggg agtgcattgg cagctttggc 9840
agcagcaaca ggatcggtga aagcttgttg atagatggct tcttgagaag cggtgctgcc 9900
gttagggttt ggggatgatt gtctgcggtt atggagcttg gaaggtcgat acgaggcgtg 9960
agaggaaggt tcggcgatga cggtcgaggc agaggcgagc aaggtgagag ccagcaccaa 10020
ggctgatgag gatgcttccg acttcatgat tggtggtcct tcttcctcag tgaggtgttg 10080
tgagagatgg cagaggtctt agttgtggtg acggtggtgg tgaggaaggg aagggaggat 10140
gaaaaagtaa ggaaagagta agaagcgacc tcggatgtgc cgctacgtca gatgagctct 10200
ctcatcattg gtgttcgata gaagcagaaa gggctgcaga agcaccaatg atcgtcaggg 10260
acaaacgtca caaagggcaa gaaaagaaat acaggcacgg gagccaagca tgcatgtctc 10320
tgcgccaaga tgcttctttc ttgtggtgct tctgttgctg attcttcgct cccctccttc 10380
gcctccgtgc ttttctactt cggctgctgc cgaggatcaa cggaggtgcc gcgaaagatg 10440
cagcgttggt tctgctgctt ctacgtctcc gaagcatctc atgcgatatg aaacaagaaa 10500
gcgagaaagg ggcatcagcg aaaacggaga agcgagaagt gaggaggcgg caaagacttt 10560
gctccattca gctgagctcg aaaacccggc actgttacac tgtaccaaat cacgctgcat 10620
gtgtggttgt gtgtgtgttt caactctgca tcacatgcac atctgcgctt gtctaagtca 10680
ctgtttgcga atgtggaatg ctgcgctgca gtgtctgtcc gagcttatcg tgagacttcc 10740
atcggaacct gtcactgttg ccagcagcag tgcagtagtg cagcagcgcg gtgaaatttt 10800
caaggagaga cgcgttccga caatcctctc ctctcctctc cctttgttcg gcagattcgg 10860
cgcgtactcc gctcccgtgc ctttgccata ttcaattctg tcggcacact tccgagatga 10920
tcggcatcga cagcaatcca aagctcgagc gcacaacttt gcagccgttt gaggcgactg 10980
acgatacaga cgttcacgca cagcatgatt gacaagtgag ctcggaagcg aagagaggca 11040
atgcagaatc gctgtctcga aagcaacacc aagaccggag aaaaacacgc tgcccagaag 11100
cttggcaatc tgcacatcgg tgaaagtaac actcagattt ctctcggcgc tgcaagcctc 11160
acttctctct tctttctttg tcccgattga atttcgattc cgtttccaat atttggtgat 11220
ctgagcttac atcgggcgga gaaagcaata caccatgctg agtgaagagc ttcactcgca 11280
gtcaacaggg ttaggagcaa cggcaccttt agcgccctga tccttagcgt cgagggtagc 11340
catgtcttcg tcgtcgagct caaagttgaa gacgtcggcg ttggaggcga tacgcgaagg 11400
tgtgtccgac ttgggaagag ggacgaagct gttaggacaa acgatgtgtg cacagcaaag 11460
aggtcagtac tcagataaaa agagagcttg agagaatgaa gcaggacacc gctgaactca 11520
ccctttctgc aacgaccatc ggatcaacac ttgcgaccag tccaccttgt gcttggcagc 11580
gatcttgagg agttcttcgt cgtccttgtg ctcgcctcga acgattggct gcaatacaca 11640
tcaaagaaat gcacagaatg tcagttgtct tccctcgcac agattacaat gaaagggaag 11700
agtgggagag agggagagta acatacgcag taagcctgga gaacaatgtt gtgcttcttg 11760
caaagctcaa cgatcggacg ctgctggcac caaggatgaa gttcgatctg gttgacagcg 11820
ggtgtctcgc cggcgtcgat gagttcttgg aggtgcttga gaccgctgtt gggatccatg 11880
caaaggaaga aggattctgg tcagcatcac ctaagccttg tagccaatga caattgatgg 11940
gagctactca ctagttgcta acgccgatag taacaacttt gccttcggac tgcaactcct 12000
tgagcgcttc ccagaggtgc ttgcgtccct cgggacccga agtaggcgtg tggatgagga 12060
agcagtcgac gtagcctgtg gttccagagt tactcgtttg ttgatcagca ttgcatctat 12120
catcgaatct ggaaaggtta aggagggaga cttaccatcg aggttaatct tcttcaccga 12180
ctcgcgcaac gactcgagcg tctcctcttt cgtcttggaa gggaagatca ccttggtcgt 12240
cacaaagata ccacgacgcg agacctgctc ctccttgcac cactgtcgaa cggcgtcgcc 12300
gactctaaga tagcaccaat gcgaaaagag tcaagagcaa aaccgtcagc atcgtctttc 12360
ctttcctcta agtcagctgg aaaagcggga agggccgcac tcactccttc tcattctcat 12420
agtactgcgc cgagtcaatg tgcctgtatc cagtcttgag agcggtagtt accgagttga 12480
cgcaaacatc cgaaggactc aggtagacgc cgaaacccaa aacgggcata tcgacgccat 12540
cgccgagcga gtaagttgac tgcagagtaa gcttcgacat cgtgcgtgct gctgtgcgat 12600
gtagtagtcg ggtggtaacg atacgaagaa tgatgtatga atgagaggag gaaaagaagt 12660
tcaggtggaa ggggaacaga aggtgtggag aagaagctca gcaagggccg tgcgtcaaaa 12720
ttggagaaga agattggacc ctgaaaatgc tgcacgagtt ggtcagctgc gagcaagggc 12780
gatcttggtc tgcatggcac gcgtcggaat gagattttcg cttgacgaga ggaccacctt 12840
tgacgctgag taggtcacac aacgttgatg gggcaagttc aagcttgtcg cagagcatgc 12900
ttcagtctct tgttcgtcct ccgaaacggc tagaaggatt cggtcgatgg gggaggaaac 12960
aaggcagcac gaaaggaaag gaccgatggc agtctaaatt gatactgaga aattagacga 13020
agcagaaatt gcgaaataaa ccggcacaaa aaaccacgaa aaatcatcat agaaaaagca 13080
tcacagcccc tgtcaaaccc taagttgacc ctcagcgata ctgacgagaa gtacgtcaac 13140
atggcgacta tctcaccatc aagcctgctt tggcttctcc ggcttcgctt caaccttggg 13200
ctgcggctgt gttggcggtg gcgtcgttgt cagcccacca tcaggtaaag gtaccaacgg 13260
atcgttcggg tcgaattgtc caccaccacc tcctgttgct gtctcaccgt caccgcggcc 13320
tcctgtttgt gctcctccgc tagtacctcc ttggacggcc gccggctttc ccttggttgc 13380
agccccattc ttgcccgcgc catcgttccc tcccgccttg ccgccgtcgt ccagatcagg 13440
ggccgggacc gtatgcagcg tgtacccgtc gcttcccttc aacgccatac agaagcgatg 13500
caagtcgaag ggaggttcgt ctagccaacc tttgacgagg tgtagggggc aatcggcgcg 13560
gactgcgaga gtgagcttgt tttcgcagta gtcttggaat tctgagatcg cagcttcgag 13620
ttcggggtct tcggaaaagg tgttatcggg aggattatcg gcagttgtgg tggtggtaga 13680
gcccaacgga cgaggtgtag taccgtgagt cgatgcgaca gggttgatgt ctggcttcgt 13740
ttcggagtcg ggaccaggga tccaaggatc attgggatcc gcgccgcctc tctgaccagc 13800
gtcgttagcc gtggtcgttc ctgatccagt cttcgtacct tcttgttgct tactttcgtc 13860
acgcttctgt aaagccacca accctgcatc ttccccttcg agccctatcg actccatctt 13920
cttatgcatc ttcttatgct tctttctacc taacttccca cttggcgcct tacccttacc 13980
cgcatgcaca cctcccaagc tcatactttt gaccccgttc ttctccctca cagcatcaca 14040
cctctgacac gtaggtagcg ccgtgtgaca ctggacatgc tccgtactct gaaacgccac 14100
cagcgtgtta caccaagcga tcgccttatt cgtattctcc ggatggtaga gcacaaccac 14160
gctatctccc atacccgtta agcgcttctt acttgcatcg tcggcattga tcgtattctt 14220
gcccttgggt tggattccgc gtggctttgt gggtggatcg ggcgagtcac ccatacaata 14280
ggtgaagttg cgaatggcga gccaaccgaa actgttggct tgcgcttgga gggggtcttg 14340
gacgacggtg tctgcttgtg cgcgataggc gttttgggtg agaaggaggg tgaaaaggga 14400
ggcgaagagg agggttagcg agggcggttt gggtatggat ggcatggcga acgagaccag 14460
acgaggacgg tgatggtgtg gtggtcagaa gcgaagcgcc aaactagagg aacgagcggg 14520
taaggagaag ggggataagg tgggccgtca aacaggctcc aaaccaatga gggtattcga 14580
gccgatgttt gagtcagaac aaagttgtga ggggcggata tgaagtcaat gtcaacccac 14640
ccaaccgttt caccgccacc gtgtccctcg cagcccatgc taccatacaa cttgctccat 14700
aaggcggtgg tcaccgcatt cgctgtagac gccacagcaa caacacgtcg gcctttccgc 14760
actttgcgcc gaaaagtctc cgaaccattc aattgaccga gcaaacacca ccttcttcac 14820
accgatacac tcgcacacac gttcacaaca acaagagttc gaaaaaaatg ccaaaggaat 14880
gtgtatgatc gcaagtgcta ctttgcaaca ggcaaaggag cgtaagaaga gtactgcctc 14940
tgataggagc tatactcatt tctacctctg tatgagctat actcttcgcc acctccctca 15000
agtctacctt gcttctgcag ctgtatctgg gtcattaccc tcctttgctg ctctttgagc 15060
ctctgtcttc gcgtcatgga atcccaaatg tgctgcgtca tggtatcgtt cgactcggtc 15120
tgtttgtgaa tggtttcggt cgaatcgtgg acacggggag tatcgaagag ctcgaaactt 15180
tcttcgaggc cgttggcgag ttcttcttcg agctgtcgag gacgaagctt cagctttggg 15240
tatcgacgaa gagagcgagg ttgatgagga gacgaaaggg acttgggaga gtgaggagtg 15300
ggaagggccg aaatgatggt tagaaagagc gtgaggaagg gtaggacgag aactgggact 15360
actgtgaaac gcatcgttgt tctttaaggg gcgaaagtgc gcccggcacg aggtactgaa 15420
gtgtccggtg gagcgagtgt atgtatagtg ttcatgcggg ttgctgcctc agtttcgggt 15480
cagaagcgga gtgtttttat ctacatcgag gacgatgcta aagtaaaaca agccggcggt 15540
aaaggatgca catcggcgaa cagccgcatt caaccacgcc gaagctttca tagcctctcg 15600
agcagaggtg atgacacaaa gctctgcaac atggccgatg acaacccgtg aaaggctgtg 15660
cacaaccgct ggtcaaagtg aaagggcttg ccgagcggta ccatgaagtt tgtgggtcat 15720
tcaacaaggc ggcaataccc acctccactg ttcgccgctc tcttgacgac agagaggaga 15780
gaatgccgac tccaagtcat tagttgaatt gccaaagcag gcacggtcat cacgacgtca 15840
ggggtagcaa tcaggtggga ataaggcaag gcgcacaatg atacgcagga ccctctatga 15900
taccaaccac tctattcgcc agccagtact tggcgtaggc gaacgtcagg caccacagtg 15960
accttcgacg ctggtcagtc tgggaagttt gctgatctct catgtgtcga cattgcgacg 16020
catagcctga tgctgagcac cgagttcgac cgtcctcgaa gccaaacgag ctgacgccca 16080
atgcgatttt ttcaaaatgt tagacatgca catacgacaa tttgcgattc gaaaaaatct 16140
cgccgacatc ggcggatcca acttcctgag cttacggagg agcggtccgg cgcgtccggt 16200
cttgcacctc tttcgcttga ccgcacagac gcattttgag tgcaaagctt gactcttccc 16260
ccgcaccgaa agcgctccac cgccggccta gtgacgcttt gtagaagaaa gcaggctcaa 16320
ctctgcgtgt gaccgctttg ggtttataag gttggtcggt caaacacact tcctctaagc 16380
tctctcgaac ctaaaccttc ttctcgtcga tacaaccttt catttgggac cacgggagca 16440
cgttgcctta tctccacatc gttcatcctc gctttcattc tcaggatcag tcgctcatcc 16500
tctttcctct cgataacctt ctcgctcaac agcaagactt tgaacaaaat ggcatccacc 16560
gacgtagcct gcgaaaagac cccctcgtcc tccgctttgg gacttttcaa cctctctggc 16620
aagaccgcat tgttgaccgg tggtactaga ggtattggtc aagcatgtgc cgttgcactt 16680
gctgaagctg gtgcatcggt catcctggcc gttagaccag gtaccgctcc tggcgctgat 16740
ggcaaccacc ctgccctctc ccccttgctt gctgtttccg accagacttc ctcgcagaag 16800
cactcgaccg tcgaagccga cctctccgat ctctcctcgg tcaagtctct cttcgaccgc 16860
gcgcttcccc tctccccttc aggcggcatc gacatcctcg tcaactgtgg aggcatccaa 16920
cgccgtcacc catccaccga cttccccgaa tccgattggg acgaagttct caacgtcaac 16980
ctcaaagctg tctggcttct ctcccaagct gctggtcgcc acatgatccc ccgccgctcc 17040
ggcaagatca tcaactttgg ttcgctgctt acattccaag gtggcctcac ggtcccagct 17100
tacgccagcg caaagggagc cgtaggccaa ctcacgaagg cacttagcaa cgaatgggca 17160
aaacacaacg ttcaagtcaa cggaattgct cccggctaca tcgcgaccga catgaacgaa 17220
aaattgcttg ccgacccaac gaggttgagg cagatcagcg agaggattcc tgcgggtagg 17280
tggggtgagg ccgctgattt taagggccca ttgctgtttt tggccagtca agcgagtcag 17340
tatgtcagtg gtgaaatgtt ggttgttgac ggtggatgga tgggtcgtta agcgcagctt 17400
ctaacagaaa aagtttgttt cgtatagagc atgtgttgaa gcagtcgcaa tcaaaaattg 17460
tatcgtgtcg tttcgtattg aggcccgatg atgtgtctgt ctgtgggtga agagcctgat 17520
tattgtagcc ggtgtgcggg tcaaaaagtg gggaaaaaag cgagccgcga ctgccccgca 17580
aagcgaagaa gagggagaga gagacgcgtt ctgccggtgt gtggctttct tttgccggac 17640
cgtcgacggc gaaacttgcg cagggtccat cttccggacc ctccgactcc acaacatcat 17700
ctcttcggac ccttgttcac tcttctcttt tcgaccatca tcaccattac cgtatccaca 17760
ttccagtcat ccatctactg cgaatatggt cgcttcaatc ggcaggctcc aaagcattgc 17820
ttccacctcc ttcctgcgca gcgctgcacg ctcatattcc tcaacgcgca atgtttcttc 17880
ctcatcagcc gactcacaaa tgcgaatgct catcgttggc tctccaggat caggcaaagg 17940
cactcaatcg acacgcctcc tgaaacacta ctctttttcg gtcctctccg caggcgacgt 18000
actgcgatcg cacatccaac gtggaaccga aataggccaa cgcgcagatg cagtcatcaa 18060
gcaaggcgga ttgatgccgg atcaggtcat gatggatctc gtaggagctg aagtcaaaac 18120
attagcgggg agcgactggc tgctggatgg attcccgaga acactggggc aagcagaaat 18180
gttggatgag atgttggagg accaagagaa agggttgagg ttggtggtga atctggatgt 18240
gcctgaagag gtgattttgg ataggatctt gcgtgagtca caaaccccat caaaccgcaa 18300
tcagatcgag tgcgagctta tacactgacc cgacatcgat gactgtactt gttcctggcg 18360
aacaacagaa cgatggacgc acttaccctc aggacgagtc tacaacctct ccttcaaccc 18420
tcccaaagtc gaaggcaaag acgacataac cggagaacca ctggtcaaga gggaagatga 18480
caacgtcgta cgtatcccct cctttcccct tccccgcctg ctgtttcatt tatcttacac 18540
tctctaactc ctcctcatcc ccgtcatcat gctacgccgt tgctactgca ggaaaccttc 18600
ggcaaacgcc tcaaaacatt ctacgcacaa accgaaccca tgctcgacca ctaccgtcgc 18660
aaaagcggct ccatcaccga gatcgattgc cgtaccgaaa caaacgctga tctcgcagca 18720
tcaggcaaga aggatctatt tgtcaacttg aagggcgaaa cttcgaaaca gatctggccg 18780
cacttggtca aaattgtaca cgagcgattt cccaacctaa aggcagcagc ggcggcgcag 18840
tgaatcgcag ataccacgtc agaagaccta agggaagcca aatacaaata cattccattt 18900
gcagaaaagc ggaaggcgat aaaaagttat ggtacaatgc gatacatgtt tgctattccg 18960
acggtgccgg tccttccggt tcttggttcc ttccgtatgg ttgttgatgc tcatgctcgt 19020
gcccctgctg atgctcatgc tcgtgttcgt gcggatgaaa cagatgcgcc aacgtcggat 19080
gatgctcctc tccatccgcc tctcccaccg tttgccccct cctccgcctc atctccgtcg 19140
tccgctgctt gaacccctcc accctatcct tcaacccctg gaactgttct agaaacacct 19200
tcagatgatg ctcaaactcc agattggcaa ctaccaactt cgccaccttt tcatactccg 19260
gattcgcaat ttgctggatc gccgcatgga ggttttgcaa cgctgtttcc gggtctgttt 19320
cctccccgtc tttacttttt gaggttcctt cggaggagtc ttgtggggca agatcggtcc 19380
ctgagagcga agaagacttc tgacgcgagt tgtagtagtg tcgcagggcg gggacgtcgg 19440
tcatggctgc agagatggct gtgtcgtgta agcgaagtac gcgaacagag tgttggaagg 19500
tgagcagggc ggcaagggcg agtttttgag gtgctgagac gagggtgtct tccacacgcg 19560
cggctgctcc gacgggcaat tggacttcag cagtgatgag accagagtcg gtaacaccag 19620
aagcattctt aaggatgaaa gaggggatgg cgagaggtac accgtcaggc gtgtcgagat 19680
ctcgttcgag ctcctctaga ggttcgggtg aagatgtgtg ccggtcgcgt gcaaaggtgg 19740
cttccatact ctttcgctct acttttgtcc gctctcctgt gtcattggat ccggcttcga 19800
ccatcttgaa cttctccctc ttgacgtcac tttcgctttt gcggtgagat cgcgttcgtg 19860
accgtcttcg ctttcgcatc gctgatgctc ctgctgtagc acctctcgtt tccacatcct 19920
caccttcctc ctccgcgtcc gcttgacgct gctcgcgctg catttgctcc ttcttcaacc 19980
gcctcttcct agccctctcc tctgctcgat cgaacaacct cgacgtggat tgcgttagca 20040
ttcgatgcag cactccacca aacgcatcct gaacaaccgc caacaagatc gtcaacacag 20100
caacacccat caaaccccat atgacaaaga tcgccctacc gatctgcgtc gtcggatgat 20160
agtctccata cccaatcgtg atcatggcga tgaagcagaa ccacattgca ccaccgtaac 20220
tccatctctc tgcataagta aaagcaacgg cgccgaggag ccagaaagca gcggtgacgg 20280
aggcggccag gacgagtttc atgcgtgcgg ccatgatggc ttcgtgtcgc gcgtgttctt 20340
cgtaggtgag gaagtcttgt tctgtgcgtt tttttgctgc tagaagttcg gtttgaaggg 20400
cgtggatttg gtgttgtaga gcggggtcgc cgacggttgc agttgctggc ttttctgctt 20460
ctgcgagttt gggttcgtca ttggaggcgg cgttgccgga ggaggcagca gtggtggtga 20520
tggaagacgc aacattgtcg gctggaggtg caccaccggc agcagcttgc ttctccatct 20580
gagccaaagc ttcagcgaat tcgttgttgt tgctatcgtc atccggcgaa ttactgacag 20640
cgttggagtt gggtccaaac gtgaacgtgc gaggcatgat cctccgtatt gcacggtcct 20700
gcctcttgtg ctctttaacc gcagcttttc gttctgctat tctcctacgt cgctcctttg 20760
tcctcgcgat gagggccgct tggaaagtct ctaggatcgt gctcctcgcc gaagatacga 20820
caagcgcaac gaggatgatt ccgattggcg catacaagat gaccaagact ttgccgcccg 20880
gacttgtcgg taccacatct ccaaaaccaa ccgtcaatac tgttgccgtc gaaaagtaca 20940
gcgcagtgat gaaatcgatc ttgatgaggt agacaaagat cagacttccc agcgacagat 21000
acagcagcag tcccatacct gccagcacca gtcccttttg cagctgtgtc aaccccgagc 21060
ctgcgtgctt gaaatccttt gtcctgacgt agtcggcaac caagctgatg gtgacgatcg 21120
tcgacgtgat ggtcgaagcg cagaccatcc agtaactggc actgagactg aggccgtcat 21180
gtttgggtcc atagatacca ccaaagacag ccaaggcgac gacattgatg atgtcgtgaa 21240
gagcgaaacc cgcaatggca agcgcaatac ttgctctcgg tttcaagaac tcgagaaatc 21300
gaaagatgat cgctgcgttg gccacgactg ccgcactaag cgagatggcg agtccaacgg 21360
ttaggatagg cggattatcg atgtatcgtt ccacaatacc gtctgcatcg atcttggcgt 21420
accatttgga cgtcaaacct ggcacttcga gtacgatgga gaaaggggcg agaagaccgg 21480
aaaagatcgg tgttttgcgc accctccatc cgtgacccag gtctgcactg tgcgctggtc 21540
catctccgct gtcatgtcga tgaaagtgat gatgagtgtt gtaatggaca gcatggccga 21600
agtgtggtac gtcagtgaca gtgaggaaag tctgaagagt gtttgtgttg ggtagacctc 21660
tatgtttgta tgcgggctgt gcaggtggtt tctctgacgg tggtgtaatg tcttttcgac 21720
gtcgaaacgg cgacctgtca cgacttgcag agtgattgtg actttgcaac gacttgagtg 21780
gtggaagatg cgaggtgata tgcgtgggtt gcaacgacga ggcagctggc aacaaagccg 21840
gtcgctcagc aggcgacaca gatgtttcgt ggtcggccat actgttgtat gttgttgtcg 21900
aatgtcgacg ctgctatgag caatttagca cttttgctga tgtatgtgtt gaaagcatcg 21960
caagaaggtg tttcagctgc gatttgcgaa ggtgtatcga tgatgttgtt ggtggtgtgg 22020
agatggtgtt acgaaatcaa gcaacgtgag aatccacaat tcgagcgcct cggcagcagc 22080
ggcggcaatt cgattgccgc gcttttccca cgcagggtcc aattaaagat aaatcggagc 22140
ttactttttt ggaatttcgc aagaatcggg gaaatttagt gcagcagaca gcggaacggc 22200
agagcccacg tgtttgcttt tcgaaaaaga actcgggatt tcgctgtacc tcgcctcgac 22260
atatccttat ccttatcaag tccccgctcc aagctatcaa ggttggaatc tagaacctgt 22320
ttgtaccttg cagcgcctat ctccatctga tacagacagt gagacagcga tagctctctt 22380
ctagcaagtg ccccaaaaag tcaatccagg cgaggctaaa gcagaattga agtacagaca 22440
cgatgcaagg aatcaccgac gcccgtgcaa cagcattggc aacgctgccc taacggttcc 22500
cgcatcatac agcacctgag ttgcctccct tggaagatcc atcgctccca aataagctag 22560
tctgtatcca tcgcctccca ggtgttgccc taccactcct tcgaagaaca accaaagctg 22620
cgaattttgt ggctcacgct ccgtcatcac atctctccac caagaatgtg ctggaaccat 22680
caagatgtgc ctctcccccg ctgttgtggc aacgcctaga tggaagagag tggaatgcgt 22740
ccgtcctcgt cttgcgggca gaagcctagt gattctgttg ggaagatttt gtcgaggtac 22800
atctttgttc acaccaagcc cactcttatc ctgcaagact tggactggcg gccagagatc 22860
ttcgccttct tccaagcttg atacatggtt catgcgcctg ttgtccctgt cactccatac 22920
aggcatcggc ttcattctgt gtgctaccat ttgacaagca atagtctggt gaatggcgtc 22980
gagtatctga ggctcgggtc ggtagataat ctcgtcgccc agaaagcggt gttgctcgct 23040
acggtcttcg aaattggccg gaacgagatg gtcgttctcg cagaggtgct tgaagaacgg 23100
aatgtcgagc gggtaagtca cgggttgact ccgatagtaa cccacctcca gaggtccata 23160
ctctcgacca tctcgcaact tgaccgcatc gagatggatt acgccggata attcctcgtt 23220
gactcgccag ccacttccgg cagtcaatga tccatctgtt agctcctttg taggagcgtg 23280
aaatggatat cctgcatacc acaacatgat ggctggatct tcgcgtccaa attgatcgat 23340
gagtgtctgg tatggggtgt gaccccatgc gattgcttcg tttgctcgag cgccccaagc 23400
accagaagcg gtgccaccaa ttgaagcttg acgctcggca gatggagagc cgaatgcgtc 23460
ggcagaaagt tgttcagatg tgcctggtgc tatgggctgt actgcagcag agtcagatcg 23520
ataatgaacg cttgttggat cgtcaagacg ggtaggaaag catcgtgctt ggctgaccac 23580
catctcctgc cagccatgca atcgagtgac aacactattg taggtagaca gacgggacgc 23640
acagacgaga cacgaacgac actcttgtcg gtctactgaa gcacaaagcg aagcagctgc 23700
acagtgatat acttgatcaa agacagtgat cacaatacat ttgcacaaga cgcacaacgc 23760
ccctaaggca gggtgaaagt gggctacgct gtactttcag gttcactttc aggttcgttc 23820
gaagcacaag gggtctgctt ctcaggcagc cagcagagcg aattgcagcg tccagcagca 23880
acgtcagaat cgaacggtag tggtccaggc aggtcgcata cgcaaggacg aaagtagcgc 23940
ctctttggtc tctttcgaca ggaaggcgcc acctagcaaa gccaccattg gctgtctatt 24000
ctctcctgcc ggttggatgc cttcatgaaa gacccaaaag tccaaattgg tagcttggcc 24060
atttgcgagc tgggtgtatg tctgataagg tagagtagtc atcatgatat gcctttttcc 24120
ttggttcgag acgatctcaa gatgataaac cttcgaaaag tccctctgat gcgcagagat 24180
ctgcgtcaag acagccttcc tgaggtcatc acgtagattg cgggtgagtg tcagccgacg 24240
gacctcttcg ctttggagct gcttgggtat gatatgagct ggtggccaca gaagctggcc 24300
ttccatcaga tcgtgatctg gactgacacg ctgtggggtt agtccgccaa acgacatgtg 24360
cgcccggatg gcgcgatgaa tgtcatccaa gatcttcggc tcgggtcgat aaactccgtg 24420
aaagtttcgg tagctagcct tgttcttgtc gccaaggacg aaatcttcga agttggcaaa 24480
aatgagctga tcgtactgat acaggtgacg gaggacggga atgtctagcg ggtaggcagc 24540
tatctggaac ttgtcctttc ccacttgaag cggaccaaac tgtcttccgt ctctcaatgc 24600
gaatcgtgga atcgtgtatc gaagagctcc atctcgcgag ggcgtagggg ctaccagctc 24660
actcactggc agcttagtgt cggggtgtac tgaataggtg ggttggggtg gaggttgagc 24720
tgtgacaagg acttgggcga aggatggctc tggagcgtgc ccaagaacgt gcccatgctg 24780
catcccaggg acgacttgga aagggtacat agggacgaga gcaacctggt ttccaacagc 24840
aggaggcgaa aacaagggtc gcatgcggga gtcgtaccaa gcaagtggct caataggctg 24900
cggactggga ggaagggctg cgtggtggta ttgcaactcc ggatcgtacc gctgggtggt 24960
atcgatcttg agtcgctcga gacgcgaaga aagatccggt ctgcctgatg aaaatagtct 25020
gtagtcggag tctccttcct cgctagagct ggttggggcg ccgatgcagc ccgctatcag 25080
cactgtgccg agtgctatgc tcagcggaag ttttggcatc ttgactctgc ctgacttgtg 25140
atggaaatga tgcttagtag ccttcgtctg gttggcgtag cagaaagcat ccttcttctg 25200
gaacgaatcc tctttttgtt ctgcgatgaa ccaaacgagg caaccctcag ccctgacttg 25260
actcgttgct cgaatttgcc cacgtcatct tcgagctgca gctgatctga gcggctgctc 25320
gacaggggct gctgcttcat tgaaggtgac aagtcgtcac cgtagatcgg agtagcaacc 25380
aaaaaggctg catttggtgg cgacttcttt gctttctgca agaacccact tagtcagtaa 25440
tttgtcgagc aaccgaagtc ggtggagcag ctcagtatgt tgtgacgttt tgggatgagg 25500
ggcccacccg acgatgccag tcaagcgaaa ccgggaggca aaagtgtgga acgtttcttc 25560
tgaatagcat agcgtcagca cagagcacgc ctttacacag atgagcgatc acggtgatga 25620
aaggcatgca ttcgaacgtc gaggacacgt ccttcaagct catagagtgt taattaaaga 25680
ggtaggtcaa gcatgagcga gttcgagaag ctgaggaaac gccggacgga tgagtccagc 25740
ttcaagcatg cttcttttcc ccgtccaagg tagaaatgtt ccgcccaaaa gcgccaactt 25800
tggcctactt gcgtattggc gcgctacagg gtctagactc tcagtgaaga tccagagatc 25860
ggagtcgata ggaagattgt tctcgcccag atagtcttca gggcgcacag ggattgcgag 25920
gacgtgtcta gctttgccat cgacttcaac ttccatgtga taaagctttg gcgtttgagc 25980
cgagtgagtt ttgagacggt tcctggtgga tgctcgcaca cctttgctca ttagggacga 26040
cttgacgtct agtccgttga tgatccagcg agatggagag actgatggca agaggaaatt 26100
accttgacga acgtcgggtg tttgcgcgtt gataggcttt ggtggaaggt ggctgccaaa 26160
aagatgatga cccaacttgt tcttgatagc cttgagcagc tcgggctctg gcctgaacac 26220
cgatcctctt actgcaagct tgttcccaac aagccgactt tcaaagttac ttggcacgta 26280
agctttcgat aagtataggt gtcggaactc agcggtgtcg agcggatatg tctgcagctt 26340
gaaagtgtac tctttcaacc tcacagctcg atcagccttc ttcgcgttgt gcgcattttg 26400
ttgaatcgga gccacctgca ggtgttccgc tggaccttga cttgggccag cttcgagtaa 26460
catgtcagct gcagcaggat agtggttgta gttcggctgt ttgacaatag gtctctgatc 26520
aacgatagat tgaatctggg tttgcgcccg cgaagaaggc accacatagg ttggtgcgac 26580
gtttgagaac gtgtctggcc cgggtcgcgg gatgcccgtc catatagatc tgtctgtagc 26640
atgcgtatac tggatcaaag ctgccacgaa aagcagcaag caagctgaga gcctcctcag 26700
cgtcattgtg aggctcgatg gttgtcgaga ggccaggatg acgatctgga tgaattgaca 26760
gaggtgctct gtagaggagt cggcaaggat gcgcacttta aatgggatac agtcctcgag 26820
gggtttaatt cagggaagat cgcttgacga ggccactcgc tctgtccctt cgtgttttga 26880
cctgctgacg tagcttcaac gtgccgggct atatgaaagt actggtggac tcgatctcga 26940
tgcagatgat atcaatgaag tgctcgagct tcatgcatag caatagtgga tccgacatcg 27000
atgcaatctg catgaatgaa gtgcctgagc ttcaattgct ttcattgtta taatatcagc 27060
actgacacgg cgttgtccag tgcagagtga ctatgatcac ctcagccaag agctcctcac 27120
aaggtgtgcg aagcccttac gatcacacgg cttttcgaac tatcgcctct agcgagtatc 27180
gaaaatgctt tcaagcttat cttgctaaaa ctggtgggtt gaaacaaacg taagtggatt 27240
gcacgaggag agataacgaa ccggggatgc cgagtggaca acaagccttc ttacgagcgc 27300
ctcgcactcg ctgtgaatgg ccaagaacgc caaggaagtc aaggacgtgg aagctctagt 27360
atgcttggaa aagccggctt catcgtctga gcagccatga gcggcatgtg ggcgtgtaca 27420
gggaggaaca tacctcccaa ggacgatttg cctgcctcca tccgtgaccc ttctcggagt 27480
cttcatgcct tcgaagaaga tccagaagtc cgagttgccc ggtgcccatg tctgctctat 27540
gaagtcacca ggtcggacag ggaacgttag aatatgcctg agttctccgc tcgaaggaag 27600
tgtagatgaa acagattggg tgcaaggtgt gaatgcgttc gaaaacgaga tgggatcgat 27660
cgacgtagac gatttgtgag tatctcttgg ggaatctcga gcccgttagg tacatctttg 27720
gagttcgtga cagctggcca aagatattca ccttgattga tctcgtgaga cagagggtcc 27780
atgtcaacgc gctcagggta gaagttgtag ttcttaagct gactccagat ccgttccttg 27840
atcgaagtta gcagagatgg ttcaggtcga aagatcattc cccggaattt caacgtttgg 27900
ccgtctagga acgtctcaaa gttggctggc tcaagatagt gcgaagtcgg cccactgtac 27960
aggtgctgga agaccggagt atcaagttga tatgtctgtg gaaggaaagt tttataatgg 28020
cgaagactcg cgacagctgc ataccgcgaa ggctgcaagg tagtcagagg ctcggcagtc 28080
aaaggctctg tcgagctggt tggatctgcg ttagaagcgc taccgtcgac cagctgagaa 28140
gtcagggtgg tagagtgagc ggctgtcgct gagtctctag cgacagaatt tccagctgcc 28200
gagccacttg ctgatgtact agcctgagat aggacatgat caggattggg aaacagctcg 28260
agtgttgttg tcgaggtctc cgactcgtca gtattgcccg ttgcctgcgt ggccgtagca 28320
aagatcgaca ggaggagaag aaaggctgct ggcagcatca gcctgaccat attgctcgac 28380
agatagattc tctgcagaac aacggctgga cacgtcgaca ctcgagagcc ctgactgatt 28440
gcaggtctcg attcagcgac gccttatgta gccatataca ccagattggc gtaagaacga 28500
gtacaaatgg gtcaagcatc gctacagctt tacttgcgct cacggtgtca atcttctgct 28560
tgatgacctc gtaaagagga caaggttcat tgcgcatgcg aaagtgaggc tgaaactccc 28620
acggatgtca cacacaaagg tgaagtccag gcaagtgaac tgctgttgca atgctgatgg 28680
tgactaggtg tcggcctgcg gtgtccacca ggaagctcgg agcagcctcg agatgcaggt 28740
ggcttgagaa agcttccaca tacgtgtaca tcggatatgg ccgtgattat tcacacagct 28800
gatgccagga ccgtggtagg agaagtgact tcacacaggc cttgaagaac accgaagcaa 28860
acattcagct caaagcattg aattgattga agaggttgaa tcaccggtgc ctatgcttca 28920
aagcacgctg cggctcgatc tacttgagct ctgaaaaagc aggtttgaag gctccgatag 28980
ctaagaaagg ctcttggatt ttcttcggaa gaaacgaagc acctaagaag gctaacggtc 29040
gcctgtacgc aagtccaaag cgcgctggtg cctggaacgc ctcgaagaaa agccacagat 29100
ctgaatcgat aagtcgatgt cggccgacga aggagccagg ctgcgctggt gtcatcatga 29160
tgtgcctaac gcgtccatcg acagacactc ccagcttgaa catattgggt cgttggactg 29220
tgtttgtgcc aagccggttg gtgatcaatt gacgaaagcg tttgccgagg gacttggccg 29280
ggaaatggag ccttccggac ccggtcttgt cctgtacagg cggccaaaga aaatcgcctt 29340
gcatcagctc aacgtcaccg ctgacgcgca aaaaccgcct ttctattgcc ttcagatgcc 29400
ccccgatcgt ctcacgagtt gcttctagga ccgctggctc cggacggtaa agcatgcctt 29460
ctgtgtggaa tccgtatttg gtcatgaacg tttcgaaatc gagtgggacc agatgatcat 29520
tgtcgtaaaa gtgacgcagg gaagtagtat ctaagggata agaacgcatt gcaaattctc 29580
ccaaaccatc aggagctctc cgtcgcccag ttttggtagg cttcaaggac tgcggatctg 29640
tggtctgtga tgtgcttgcg atgtctccag gaggtggagc attaagatcg aagactgctc 29700
tctggccgct acttgccgca tcaaccccag gtggagaatc tgtcgttcga tgctcgctca 29760
cttgtgggta cgaatgggac cagtgccgga cgcctgtctg cctgatgttt gtcaccggat 29820
agctcggttc ttgaggaatg ggctgacggg gtaagttttg cggctggttc tggacagtct 29880
gcagctcatc aattggaata cccatccatc gtggtctgcc tgctgcgagg acgcagcttg 29940
ttaccaaaac aatgtaagct actacgggct gcaccttcat gctgacgtga cgagaaagaa 30000
tgggttgtat ggccagatgg tgcgaagaag gagaaggaac aaaggttgga gattggcgat 30060
caattaataa aaccttcgag tagactttgt ggcttgtgga cgaaatgctg tgaaggagca 30120
cgcattgagc ggtacatggc tgatcacaaa ttcattgcgc gtttacttgt tcaaagctta 30180
acctctcttt gcagcatctt actcctccga atgaactacc tagtctacac tgcaaccaaa 30240
ggaatcgaag ctcgactcga ctcgctcaga agtggtacag tagaatgaga tgtcccacca 30300
actaatgtcg tcacgaaatt tgcggtgtca aagcggtgaa ctaagtaata gccttcgcat 30360
tcatatcttt gcgagctgta cataggctgc cgttcagctc gaagaatgtc ttcggcggat 30420
cactcaaaaa caattgcggc ggcatttgcg agcaatagaa gcagacatag aattgcttga 30480
ttaagatcaa agtatggctg gaagtagtga ataacactca acgatgtagg accggcaagg 30540
agaacctatc ctgagaagga tcacacctta cgcgacccaa acttgtaggc tgtcgtctct 30600
agtgcgctgt acgcagggct tcttcaaaag ctggtctgat ggtgtgtgca tcaccaagta 30660
ttttgctcgc atctgcagga agaaacgaag ctccaagaag ggccagcttc ttcctgtcgg 30720
catgctcgac tccttggaag aagagccaca tcctagaatg aaccggtctc gttggcagtg 30780
agatgtggta cgaagctggt acctgtatca tcagaatctt ccgttgaccc tcaggagacg 30840
gtaacgtcaa agtgaacatc ttgggttccg tgagcgtgtg ataaggccat ttctggtttg 30900
gcaagcggcg ataatggtac aacttgcgga ttggcacgtt cactgcccca tttaggtcga 30960
tttcagtggg tggccagagc cattggcctt cactaagacc accttgcaag gcgctcggct 31020
gccttctaaa gcttcgcagc gtagaccaga ttgtgttctg aatctcgtct agccttttgg 31080
gctctgggta gaagagaggt ccccaagcgt gcaagaatcg aaccgggttt tgggatctga 31140
ttcctccgcg attcttcaga aacttttcga agtcagcatc tctgacgtcg cgcgaatctt 31200
cgtacagatg cttgaattca tccatttcaa ctttttggaa gccttttggc tcaaagtctt 31260
tgttccctac cgggaagggt ccccagtttc gatcggtcct gaatgccgga atctcaggcc 31320
tatcctgact ctcttgaggc gtgctggtgc tggattctgc ttgatgaaac caaggcctag 31380
agtcgaaggc tgcagcaatg gtaccggtgt ctctgccaac ttgagagtga gggattatac 31440
cagcgttcga ctgctgctct gcttgtggca gggcatatct gctgtcgtgc tcccagacag 31500
gaagcatggc cctttgcggt atattccaat acggtcggtc ctccataggt cgagcacatg 31560
cagctggaag tgccgctagg aggcaaaggc ctgcaagcag acgcttgaga cacatggcaa 31620
ggggatagct ggctagtctg tacgtggtct tgcgggaagc gtgcaagaca agcagaaaca 31680
tcgggagggg tgaagcctat atagcgatta ctcactcact gtaccttctc aacccactgc 31740
gctggcacta gaggaggctt tgcattcgcg atcagcaatg cgaataagct cttgcaacga 31800
acgaaagatg tctcatctgc cacacgtgaa agacaatgca cggtatgatc cagcaccgta 31860
tcggcaacgg atgtgggcat tgacctggga ccccacatgg ttacgttgcg tgtgaattga 31920
caactctctc atatagcaca aatgacctca gcgagaacta cgtgcgatcc gtgacaccgg 31980
attgcatgcg attcagttgc atcaggtcag gcctgcgtat tgagcgtgtg cctcactcag 32040
gggctaaacg ctcatcaaat tgcggtccga gacgggcgtt ggcagctcaa ttagtgctac 32100
atgagtattg ctgtatagga gcgagcctgt ttggccctcc cacacagtgc ttttgcgaag 32160
caacgacgtc atttgaggca acaaaggtgg tctcaggtcc tgccgtgccc cacccacagc 32220
agcccatcac ctcttcaacg tgagctggca cagtcaaggt tcgcagattg ggaccgtcag 32280
aagccacaca gacatctgaa gaggtgggct tcaagactag ctttcgagag attgtgcatt 32340
gtctcgtacg aatggctatg ggtgataaga atgagcgcgt cgaaaggatg ggttggagac 32400
catgaaatat tgctgatcga atatcctcat gacagcgttg caatatcagc gtggctgaga 32460
gctcaacgag cgcagggcct cctcgaaagc cggacggatg gtcctagcat cgagaagaac 32520
ttgattggct tcatttggta ggaaggaagc accgagaaaa gcgatcttgc gttctcgtcc 32580
ttgctgtaca ccctgaaaga agaaccaaag ctgtgaatca ggtggatcaa aaggaaagga 32640
aatgtgatcg tgcgtccgac cttccatcat taggatctgc ttgtttgaaa aaatggaagg 32700
gacatcgagg tgaaatagtt ttgcatcggg aagcatgtgt ctgttccatc gctctgcagg 32760
cattcgacga tagcgttgaa ctagtagctg agcaggcaga ttgagtcctg cattgtttgc 32820
agctatctcg gtgggcggcc acagccattg gccctcactg agaccatctt gaagctgccg 32880
agcctgccta ccagcatttc gaagcgtgtc ccagatcgtg gcctggatct cgagtagtct 32940
ctgtggctct ggataataca agctgcctct ggtaggaaag gtatggcgcg acgcagcgtc 33000
cgcatctgta gccaagaaag tttgatagtc tgcatctctg acgttaggca aggcgtaaag 33060
atgctgaaag acattgatct tgacagggta gcccttcggc tcgaagcgtt cgtttccgat 33120
ggggaagggg ccccactttc tgtttgtgtg aaaagcaggg atctcgagcg tcgtgccata 33180
caggttccga ctcgaaccag cctcggacat cctgcgccaa ggctgaggac tgagattcgg 33240
aacagcttca ttgatgacaa cgaaacgact ctgggatggc agaggtatga ttgactgtgt 33300
gttccagtca aggttgcgct tcagttgctc ttccatcaac ggatcagcac cagcttcgag 33360
acggggttgg tttgtcgaag caggctggtg ttctgatggg ctcagggcgt atctactgtc 33420
atgctcccag acaggaagca tggctctttg cggtatgcca ccaaacgacg catcgtccat 33480
tgcttgcacc cagcctgccc aaaaggccat tattgatagt aggacgagca tccttagctg 33540
aagcaaaaaa tgcgtgatta tcggtcaccg tggtctcaga tgatgctcgc tgtgagcgtg 33600
aagaaagagt ccaacccttg ccaccacctt gacggaactc tccttggacg aggctcttac 33660
ggccgctgtc tttgcgcaac aggtccactg ctctgtttga gcaacgaaga tctcagaccg 33720
tccacgtcga cagcgcgatt ttgttcatgg caacgccctg aagtggctca gacaacgaac 33780
gcaaaagtcc catcaatcac gcacagtact gcccaccaac ggcgagcaca tgaaatcgaa 33840
actttaaaca cgaggcgtgc gaatcgagcg cggtttttgg ttcacatcgg tccgagcact 33900
gtgagagatg tggccgtgct tctggtctgc gaacgagtga ctgtcgtctg accaaacggc 33960
tgtctgtctg atggcttcaa tttctcagtg cctgcgtgaa caagttcact gagcggaacg 34020
atgatcactt tatttctacg caagccttta tggacgctgt gctctgtcca cgcacactgc 34080
gcaagccaag cttcgactca catgttgttg aacgcccaac aacaagtgcc gtttgacctc 34140
ttcgaaatga agtcaagtat cgttcaaaca gacagctagt ctctgaagac agcagagcag 34200
cagattgtag tgagagagga tgagcgcagg gtcacattac agctcggtag gctggagatc 34260
ggtatcgtag ctctgaattc aggtaatcag atgtgagtca cgggtgcttt acaaaaaagt 34320
agttcgcaaa ggaagggtgg cgagaaccgt agtgcccgag gctgagggac aactaggcta 34380
gatgattaaa aaccatggtc aggtctccac tatccagtaa gcgcttcgca ctgtcccttg 34440
gaaggaacat agcacccagg aaggccattc gctttctaaa acctcgacca ttgattggct 34500
ctctaccttc aaagaagaac cacaaattcg agcttgtcat tgtccgcgat gtgggagccc 34560
aattaccaac gcttgttggc atggctgcaa tgtgtcgcac ccgcccatca ggaagaagga 34620
cagcaaggtg atacaagctc gagaccttgc cttcgtgccg gttcctgtcc ttcaaagcct 34680
tatggatgcg aggattcaaa acgtctgccg gcatttgcag gtccccttcg ccctgccttc 34740
gctctacggg cggccacaag aattgtgcct cgcgcagatc gaaatttgga aacacccgct 34800
gagggggcaa ctcaaggtct cgaaggcgtc ctgtaaggcg ttgctgtatc gctcgcaaaa 34860
gctcaggctc cggtaaaaat gtcaagccat tgatgggtag tctgcctctt gaaacaaagc 34920
ctctgaagtt ggtcgggtat gtgtctgggt tggcgtgaag atgttgaaag ccttgccaat 34980
ggagcgggta tgactgcaat gcgaacattt tgtcgccgat gtcatagggg ccccatttgt 35040
agcctaaatg gtccgtgaag gagatggact cttttgcagc tggttgctgg cgaagactag 35100
acccggctcc aggagcaaat gcgttggtaa gctcgggatg atggcttgaa gtgcccacat 35160
gttcgtactc gctcatcgtg ccgatgtttt gtgctgtctg cggtgaagag gtcccggagc 35220
catcgctgct cgctgcagga ggacttggca tggattggtg gacagtaggc tgattatgcc 35280
agtactgcgg tgaagctgga cgaggaagtt gaggcggata gggtcgatag tcgtgctctt 35340
cccacgcagg aacgaattgt gagaatggta catttgagtt cctgggatcc attggagccg 35400
atagtaccaa gcctaccatg gatatcaagg tcaaatagaa gtagatccac gcttgaatca 35460
tcttggcaag aaagcaatgt ggaaaggtgc actcgaccgg tcttgtgtat cggtgctgtc 35520
tggtctgagt cagagtccgc catggcagta tttatgccct tgcaaaatgg gaaggctcgc 35580
atacttgagc ttgcagcaca acgatgtaag actgcttaac cctctgagct tgttgtcaga 35640
gtcgatcgat aacttagtac tcaacgcatg tcagaagcgg tgggcctcgc ttctcgtgtg 35700
caggatgcgc tcccgattcc gactaagccc acaagagacc tgttgtgctg attcccagac 35760
tcatttcgag gttgactttg atctttgtgt gcgaatcagg agcacttgca gcacttcaca 35820
ggcgtatcaa gggccggtgg gtgcccgagc aagaagacgt actgtccata attttgatca 35880
cacaagtgtc gcgatgaagt ccccgttgtg tggcaacttc atcaacattg agacaactgc 35940
tcgatcaagg ctgcggtcac aaagagcctt cttggctgca accttgccgc aaaaggggca 36000
ctcggtcctt tgttcgcctt cctcctagct agtacaaagg tcagcgctga tgcatgatac 36060
attgtgagcg tcgacggcag tcgctactgg ataccagacc gtgaagtcag gcaggtgtta 36120
tgagtgtcag ttgtagcaac aaagaatcgc atcgatagga gcacaattac ggtgtttgtt 36180
tgacgtcgga cctacatcat actaagtgga aagacagaga ctacattctc tgcaaataca 36240
agccgtggcg actaggtgtc acttggatga agggatcagg tggcgctgaa agggaggtgg 36300
taacatacag gcgcgaaccg cagtcgacga gctagaccag tgcgtcatga tctgtcaagc 36360
agcgaaagtt gaaattacct tggctctgag cagcgtttcg tgtgctgaac tcggcaaaaa 36420
catggcgcca agaaaggcca tggtcttttt gcctatcacg ttgcttgtca acctcttgcc 36480
tctgtaggat tggatcccat cgtgaagctt tctgccttcg tagaagagcc acagatctga 36540
gtctcctccc gtgctggttg tccagacctc ggtcacagct ggagtcatga tgatatgtct 36600
gtctccagcg gaagaaggaa ctgtaaactg atagatgttc ttggcacgca tcgtacgaaa 36660
gcgatttcca ggagcaacgg agatgcgatt cgacaggagt gcctcgggca tttgaagaac 36720
cgactttgtg tgggtcaaag gcggccatag gtacattccc tcgcggaaaa acttgttctt 36780
ggagtcgata ggcttcgcgc tgatcccttg atccgtaagc gtgttccaaa tggtcgatcg 36840
gatgtgctta agaacttctg gttcgggacg gaagctaatg ggccgcacct gcagtcggaa 36900
cggctggcct ggtacaggct cgtcgatggt cgctggaatc gtgccgtcgg gctggtagag 36960
gtgtttcagt cgctccattt ccaacgggta ccatatcagc tgaaacttct tggagttgag 37020
tttatacggt ccccagatga cgcctgagac atctttgaaa gcgggaatga tagctcgggt 37080
cctagtggta ccctccggac ctcgtcgagg acccgagatg gttctcccgg ctttctcctc 37140
ggcgtcaggc tcccaagagt ccgagctgct cgcctgacgt cgccagaagg gaggatggac 37200
agaaccgtcg cggtgaccca aacgctcagt cggcgacaaa tcaggagcag aggcgtgtcc 37260
ttggttgtca aatgtcggaa caccagtgac caccatggcc aacaagccga ggagcacaca 37320
tagctgcaca ggtctgtaca tactatcttt catgccgcag gacgaatgca aaccttgact 37380
tgagctacga gatgtgaaga ggagggtcac gcgatggagg gaaaggatga gaggatacga 37440
gacggtcgat caagaaaggc caatcagtat cagcttttat ggttttgaga ggcttcggtt 37500
tcttcttggc aatcgaagct caagcacaaa gtcgatcata cttccttcgc aggcttggaa 37560
agttcatgtg cagcgaagcc tcgcatcttc tgcttagaaa gttgtcacag cctcaagctc 37620
tggaacggag agcgacgtgg cctacggtac atggtcgtgc ggcggttgca gccaaagcga 37680
atgacatacg aggctgttgt cttggccata cacagaacgg taatcgagcc atagaagcga 37740
tcatcggttc cacctgctcg cgtgacccga gtatgacaat cagcctggga tcccagcact 37800
attcctgaat agcttcgtgg cgaaactcga gagctctcgt gcgcttagat cttcattagt 37860
gggcctgttc atcttggtat tgcaatccgt tcttaccaaa cagccagagg tcacctctcg 37920
atgctgaagc caagcggtct atgagcttca acatccgtct atgaggtcga ctcttgggac 37980
gcctcaagtt gccgagactc gcggaccggt cgggtttcgg accggaagtg cctaagggca 38040
atcggagttg gccgcactct cgacttgagt tcatcatctc acccacatac aatgctgcat 38100
ccgccttcaa agcctctcat gcccgtgtag ccacgcattc ctggtagtgt tgttgtcaca 38160
accaatgggc aatgggtcac cttgacaccc gtggtgggct gcatgactgc tttgcgacaa 38220
cgaccgaaaa atctgttgcg ttggcaagaa caaacacgct gcctgctttc gtctcttctg 38280
cacaaatctc agcccattcc cgcattcaag tgttgatgcc gagaggcgac cgctacgcag 38340
aacagagtcg atcaagttgc ccagcactgc cagcttcgaa aaagtgcttt gcgcaactac 38400
tgtacgagcg atacagaaat gaattaatgc gtcctcgtag tttcccgtcg cgacttggga 38460
agaaggaaag cttccannnn nnnnnnnnnn nnnnnnnnnn nggaaaaaaa aaaaaaaaaa 38520
gacacgatgg ctaaaggtgt caaaatgtgg ttgcaagaaa agcactggaa aaacaagtaa 38580
aaattaagaa aaaaaggtta tgtcaggaat cgagcagaag gtggccgaag aacaattaag 38640
ttagtaaagt aaaatactgt atcaacgaaa agacaaacaa aaaatgcaaa gcgaaaaatc 38700
ccaccataca gcccagcatg ctccctcgca accgagtcgt tgtaacagcc tatgagcctt 38760
caacgctgcc gatcgagggg ccttgtggac gcttgctgac tagtcgtgct cggttcgagt 38820
ctatcgcagg gatctgaagg atcgatagcg gctgtagact gatataaatg atacatttag 38880
ccctcggtag gctgctcttt ccctcacttg gtcatcggct tctaccccct tcctcgcttg 38940
caaaactcgc ctctattgag ctgagatgct ctctctccta cgtatcttcg gcatcagcgc 39000
ctgtgtcttc atctctcttg ctcatgcgat cgatccaagc aagttcgaca aacctcagga 39060
gaggtcgtgg ctagccgcaa agtcatttat cgagcttgct cacgaacata attctgtggg 39120
ctaccgagca gcctatcctg accatctcga gctcaactcc gaagacgcag aaagggcttg 39180
gaatttggct caacagccag gccatggacc tctgaacact tttggttccc gagagaccaa 39240
ggctcgcgct tgggcacttg cacggatccc gtttggccac gaagttattg ctccataccg 39300
catcggcgaa aagcaagctt atttgttttg ggaggttgaa cacaatagtc acaagctact 39360
tggcatggag ctttggccgc ctggaggaat attccctgcg ggccacgtga gcttcagcga 39420
attgatggca tcgctaccca agagaaacgt ggtcaacaaa ttcatgaaat ccttcagggg 39480
ttgaaggatc cgacgttttt ctctgttgtg ctcggctgca aacgctattt tcagtggctg 39540
gcgaaatctg gaccctgcat aaaataaggc tggaccctgc ataaacaaaa atttagttcc 39600
gacaaaagct taaacacggc atcatacata tttgtggcgg tttgaggagg agtgttgatg 39660
tgacacggat gttattgtgt tggtgcaacc ttatcaagcg aagtataaca tattcgtgtt 39720
gttgatgtca tacatatgca tagctagcta cttgttcgcc cctttccttc gctccttatc 39780
gaattgatct ttatttctaa taagttggcc gtctgtgaat atgagcgcct cagcatcgac 39840
tttgcctgtc tcataagggc aatcttgttt cttgtggggc tgtttctcga tctcgaaggg 39900
cgcgacgaga gactagtaac gctactgact tgaattgacc ttaaaagctg gccgcaatgt 39960
tgggccacgc acacatcaag ccccatccga tacgtgtctt gctgtccatg gatactcttg 40020
cattctgtca actcgcaggc accgaacaga atcaatttga gtgcagaact cggtagacag 40080
ggatttcttt gagtctgatg acgaagctct gtcatgggcg agagcgaacc aggaaccacg 40140
ccgcaaaatc ggtatctcga tggcttaaag ccgatgaata gaaggacttg catctctaga 40200
gcagactttc tgcggttgaa cccacacaaa gatcaagtcc agtggatcgg cccaccaaca 40260
tcggcgcaag cgcttcatat gagttgttgt aggatggcaa gattgagcgc aactggtttc 40320
ctctcctacg taacggcttt ccagtggcga ggcaacgctt ttgtcggaca tgcgttctgt 40380
acatcgacac accagacact cgcatgtcca taggtccctt ccttgtgagg agctgacatc 40440
tcacctgtgc gtggcttgac agaaggatac aacgagcaac cacgcttctt attgtctagc 40500
atcgagccca ctcaaatgct gtcacaatct tctgggttgg cctcaaggcc gcgttcttct 40560
ttatgtgaga tgtacctcct gcaactgctg ctggcatggt gataagcaaa gcatcggtgt 40620
tgtcaagctt gcacgatcgg tgttgatatg taggaagaca accagccgaa acaatgcgac 40680
gagcgccatc atagaaacaa ccgtctcaag ggtgcctctt tagccgcttt ggactgttgt 40740
cgcctgcttg caagctgcaa agccctttcc tgaaccgcct ctgatctgtc tttcgagctt 40800
ttgagacgat gtagcattag attgctgtct ggattgaagc cataaataga gtcaattaag 40860
tgaaaagtcc gactcacttc cttcacggca ccccaatcgt tttcccagct catcgcccag 40920
tcaagttgct ccgatggttc tctcgactcg cattatcatc catctattac tatccatttc 40980
cgtccttacg actgcgactt tcgctgtgag ccaaccaagt ctgacaagcg atgccaagaa 41040
gcactacaag caacaccata tcacgtatat cagggacagc ctattgccag cggtcatcga 41100
cccagagagc cgtgttgaat actactccca tctcgtatct ggaaaaccgc tggctccggg 41160
tcaagcgtac gaccattcaa agtcgctagg aaacggaccc atccacgtca cctacgaccg 41220
caagcatgaa aatgcatacg cgaccaccaa gattccgttc aattctgatg ttggccataa 41280
gtggggtatg aatgtacgtt tgaatgacgg cgcaggcaat gaagagcaca aagacatcta 41340
tgctttctgg cacaagccta tagggcatcg tccagttttg ctgcgactgg atgcctggcc 41400
agcccgtcag caggctcacc ctgccctttc ttgggaacaa gtcgaaggag tcatgcgggc 41460
tttacagcgc cgatcttagc ttccctgcct tgccgcagta ccaccacttc tttgtaccct 41520
acaaatcctc gctgatcctg tcgacaataa ccgtagctcc cgtcagattt ttgcttctga 41580
gcgtctttgt aacgtatgtc aaccgctttc taagcaacat gctgctatcc gagtcagtaa 41640
cacagctctt tgatctcaac ccaaaatcaa acagaagcga tattccaggc gtgtgcgaca 41700
aactctgtgt agaatgatga ctgttttcac gcaaacatat tcgttgagcc gacagtttgg 41760
ttctgacagg acgccacgag gccagtggca ggacatttca taaagcgagg acaacatcgg 41820
cttattgagg gtctgaacgt ccggcagctt caaacacgtg acagatagca gaatgggatc 41880
tggtattgct cccagatcta cacaaggtcg atgagataac tgagagaagt ctgttccttg 41940
cacttagata gtggtagacg ccgaaggccg aaggagagca agaaatcgct gtgaaccagt 42000
attatggcat gttgccaata tgttacagtc aaccgacggt agaccgattc atgtgggcgg 42060
tgtcaacgcc acaaagtacc gtcccgccta ccgccacaca gaacgtggca acggcagtgc 42120
taagaaccaa ataatgccga gaagccgcga agagccgaat tcaggggttg ctgggcaccc 42180
agtcggcatg gaaggacgag ccccaaaacg ccaagtgaga tgcatcgagc tacaatataa 42240
gcagcttgcg atctgcgatt ccagtgtcga ccggcaagca cgggcaatca caccgcctac 42300
tacaccaaga tgatgctctt ccgcttgttg ctcctgcttc tgggcgctgc cttggtttct 42360
gccttctttg aaagcgatta cgtcaatctc aaagggacag accgaagcat gtggctaaag 42420
atgcacgaac gattcgaccc ttccttcaag caaggtcttg cacgagaaca tatttcttct 42480
cctcgagtgg tcgccttcgg ccccgaatgg taccagtcgg ccttgcagca tgcacgcgac 42540
aagggagtgt tggttcttgg cgttcacagt cctctcacat cattgacggg gaacaagaag 42600
acgtattttg tcacgctgat ccattatgac gatggagttg ttgcacgtca gctccaattg 42660
catcctcaaa gcatggtggg tgcagtcttg tggaagcaca gtaaaggtca aaacaagatt 42720
gtttcgattg acaggttaat taggaagacg gagatgaact gggatccaga ggtactggaa 42780
agtgtcctac aacgcgagca ttgacaccaa catctcaaga agggagcgac cccgatcgga 42840
gctttcgtac gtattcccat cttgatcttc aggcgccgtt gtacgtgtcg attgtctttc 42900
tggctgatca gctttgtact catccttctt cacactgact caggattgaa cggctctctc 42960
ccacgatggt cttgtctcga cccttcggta cccacgtcaa cgcatgcaaa gtgggctcac 43020
tgagcacctt gcagtgaatt gaaagccaca aagttgcttc gcattgatgt ggccctggtg 43080
acaatagaga aataatgtgc tcttacattg caacgaatgt atgaaatcgt gttgtctgct 43140
cacaaacaac aacgatatat gaaacaagct catatgcaat ccggcatcgt tgcgcttgtg 43200
ttcaatgctg gctcggcgcg agtcttagca cacgtttacg aactgtagct gcccctttcg 43260
agcttctgtg actgtgcaaa gagcacagcg agctgcatag ttgcccacgt tagcacgact 43320
gttaagcgct attgttaccg gtgttgtccg atatcacacg attgcgacct gggcggcatt 43380
cagcgatgct cgtgggaagt cactggcaag actgaaagta ctcgagggcg agcttgaaag 43440
aggcgattgc gccagatgcc aaaaggcata taagctcgtc gatctttcac tcagattcaa 43500
gtctgaacgc atcaaattct cccacgggga atcagctctg tatctctcaa ggacttcaag 43560
atgaacgcct ttacagctcg tacgatctta tgcctcgtat tcatcctctc cgtccttgct 43620
gccagcgtct ccgctgcccc accactttca agcttcgatc gtaatatgat caacgagcac 43680
gaagctcagc aggagaggct gtacagagac agcgggtatg catggaaccg tccgcagcaa 43740
ttcgagtact ttgcagtacc caattttgaa cggaaggctt tagagctcgc tgatggacgt 43800
ttccgtcaca tcgggaccca aggaatcggt cctttcgcta gaaacgctgt ggagacttac 43860
tacttatcga gcttgattcg tcctggcacg cttcttggtc acgatatggg gcttggaccg 43920
ggaagaatag caagtgcgct ctggaaacac cataatggag aggccaaagt gttgggtgtc 43980
acaatcacgg agcaccagcc caatcttgat tggcaaatgt ccgcgctgcg cgacatcatc 44040
agtcgtcatt agtggatctt gcctcccctt ggctcttcgg acgagagtag aagcccaaag 44100
ggctgtggct ttcggttcga gcttgcatgg ttctgcgagc agtgccgctc tcggactcgt 44160
gcgaaaagct gcaaacagct aggtcgccag ccagatatcc gcttctttca gcccatgctg 44220
ccgtgtccaa cgccttttca atcatcacac ccactgtcat cctctctgcc cactacctct 44280
gtctcgctta tgctttcaca ctttcgagct cgtgtataga ctcccgtccc tggcattgcc 44340
tacaactcgc tgtgttgacc ttcgaaccaa gcctgctagc ctgaccaggc gaagggagtc 44400
gttacgtgta ccgaaatgca gacgaattta accatcgaat ttatacatta tttacagaaa 44460
agtatgtgat acttgctagc tagttgtttg tgagctgacg cacctatgcc gatcggttca 44520
ctgtctttgt ccatcattgt cgctgtgtgg gtcagctaca atggacgttg gagcccacct 44580
tcaggggcgc cagggccgca caaacgatgg gcgatatttg ttccgtctga ttggaaaccg 44640
acagtgggcc tgcattgctt cattcgccca cgtttgtgcc atggtcgccc ctagccatgg 44700
tcactctttc ggcgagcgtg ggcctcttga tggacatgct ttgctgactg agcaaagaag 44760
tatcgagagt gtggcaagaa catataagta ttcccataca tgttgcgtct acggcaaatc 44820
attgagtgca agatctgctt gtccgcatga gaagcctatc tcgcccttta ctcctgaaac 44880
cggatcaaga tgaccgccat cctccaacgc tatactcttc tggtcgtact cttcttatcc 44940
ttgacacttg gtgtatcagc gacgccggca tacaccctct ctaagaccga cggtgagatg 45000
ctcaaaaaag ctcagcttat gcaaatgagc cttcacaccg atcacggaga tagatggaag 45060
aacgttcagc ccgacatcga ctactcccac gtcaacaacc tccagtggga agcggcggcg 45120
gacggcaagg cgagaaaata tactcatgtc gaaactgtct cctctgtcct ccccttcaga 45180
agcaagaagg tctacttcta cagcctaatt catcctggat cccacttagg gcagatgatg 45240
agactgcaac acgatcaagt cgcaagcctc ctttggaagc acgagaagga cgagccgaag 45300
gtcattcaca ttgataccct gaaacacagg ccaggcgtga actggggcag tatgcaagac 45360
ctgagggagg tgctgcttat gcactgagca agcagatcat cggcatgccg ttgaacgata 45420
gaatcatccc atagatccac tcagctcaca agagcagctt ttgagctgcc tgagcgcgac 45480
ttgtttactt atgaagtctc tgctacacat caaaccgttt gactcttcaa ggagattgct 45540
cattcgctga agggtaatga cactgcatat acttctgatt tcactgttgc ttgcgtatcg 45600
tgctcttcct cacgaataga cacttcccga gcgtgtgttt cagaagagca atgtgtgagc 45660
ctcatttacc ttccagtgag ggcgtcgtga attaatgtag gatgggtttc gacccacata 45720
cacttccact aagacgttca tcaggctcga agcactgctt tgtgggcagg tgccagcggc 45780
acagagcgct agtggcactt aaaaggaaga cagtctgaga cggagttctc cggcaacagc 45840
tgagcgataa cagctgcctc ctcctcactt tcttctccct acgtgttact acacaagtca 45900
agaagcgcct tcgtcagcac gcaagcgacg ttcacacaat gatggtccta cccaggcagc 45960
tgctttgtct ctgtgtactc tcttttcgat taccatgctc gtagcagcag acagtagctc 46020
accggccacg gctaggcaag tggatgagca aggctttcct ttactgtcag agacggaata 46080
caacatgctc aagactgcta ggcttcgaca gcacaaagtc accttcaagc aaggctatca 46140
cgatcaagcc gcatcctttt accggcaagg aagtttccca aagcctgcac tacgttcgag 46200
tgtatatgct gttgaggacc tggaagctca agcactcagg gaggctaaga ccgaaggagt 46260
cacttacgtc ggcaaacaga aactatcgaa acagccagcc tggttgggcg gaagaaggca 46320
actctatttc tacagcgtag ttcggcctga aggtacctta gggaaacaga tgcgggtagg 46380
cgagaattct ggggagcaga gagccgcgag catgctctgg aaacacgaca ccaagacagg 46440
cgagacaagc ttggtgcaca tcgacgagat tccgtatcat gcagaccttg actggggact 46500
cagcaagttc agaaaggtgt tgtggcttca ctgaagcgca ttcccaatac aaagcgcctg 46560
gcaccggtcc cccgatcaat gcttcggctg cacaggtctc gactcacgcc gctttcctaa 46620
acaccgttac agcctcgttg ttctgcttac cagagagacc cctcttctat cccaagtgac 46680
gaccgatgtg acatacacag tagctaaagt gtgatgcatc ttcggtgact cgacgcaatt 46740
ttaattttat tggtagcttt gcagcagtac cgatgtgcag tctctcaagc accgattggc 46800
ttcctgattg tcgaaggtga gcacagaggg caagtacctc gactgaacga cgcgttgatg 46860
tctcgtgaca tccgaagtat ccactgcaac ggttgcagcg tttgtgagca ccctctctct 46920
caaccttcgt ttcaatagtc aacaacagct agatgagtgc tcagactttg tacgcatcct 46980
tgactctgct ttaggctcga gatcattaac gctttcgcac gaccacctca acgagactgt 47040
cgcacgatcg acttataata ctaccgttgc attgcggatg agtctgtcga gcaacattga 47100
ctcatttgat cgagtcaaca attcgcatct tctggtacaa gcgaccctat ctcatctcat 47160
tttagactct tggggaacac atagctgtcc aagaccggaa gcaacgctcg tgtcgctcct 47220
gtacggccgt caacaccttt gtgatcgctt tctacctgcg ttgattagtg cccgtttcgt 47280
gtcagagcat gtagactctc tccgcgttta ccgaagcaga atcgaagtgt acaaaatgcg 47340
cccctgacgg ctgagcgagt ctctgtcttg ttcccctcag aagctttgca ttcttgtctc 47400
ttcaactttc caacatggtc gtctctttga agcgtcttct cgacctcttc atcctctctg 47460
tccctcttgc catctgcgta gtctcagctg ggaattgggg cagcaagccc aagtcatata 47520
ctggcttcag gctccaagat gaatatgtaa gcaccgaagg acagctgaat cgcatcgaaa 47580
aagagatgct caaaactgcc agggacaagc acattcgccc tatctacgat cgtgctggca 47640
gcgagtggaa atctttcact ccggagccct ttcttcgaga ctacacacac atccctaggt 47700
tcaataccaa ggtgcttgat tccgccacta tgtatggggt cacgtatgta ggccaaaaag 47760
tgtttccagg cgcaaggagg cttcccctca accttgtgaa cggcagaact ggagtaggag 47820
gtgatcggga catctatttc tataccgtga tcccacccca caccgagctc ggacgcgaaa 47880
tgaagcttga cgaaagacgt cggatcgcga ccgtgctcta caagtggaat ccaagtgtta 47940
atgagtggac actgattcac gttgatgagc tccggaactt cgacaacttg aagtgggacc 48000
ttaaagggat aaattctctc aagtttgtct agatcgcaag cctttgcggt gacttttgct 48060
ttacgaggca tcgcccacct tcccgatcgg tagcgctccg tttctagatt tgagtctcat 48120
atacaatcat gtgacagttc tgggctttgt tccaaaagtg tgaagctcgc ttctctgttg 48180
ccttgagcgt gaaagctagc tctgtctagg aaggattgta ttgattgagg atgctaccgg 48240
ttgtgtactg ccggttgtgc tgagcgagaa gaacaggact agcaaggttg acctcatcaa 48300
cggaaccagc gacaagcctg acctatatca ttcggcggta tcaggggctg acaatgtaag 48360
gacgcccatc aatggtcgca atgaagctct agctgcacaa cagcccttga ctacctatcc 48420
accgctaaat gcagagagcc accatccagg agcgagttga ggtggggctc cgatattgta 48480
aagagagctg ctttgcaaac gagtaaatag tctgtaccaa atgtccgacg atactgttcg 48540
ctctctgaga agcccttgat gaccttcttg gcccgtcgcc gtttcctcca gacccaatct 48600
cgcagcatgc tggtcttttc gtcgaagcgg ctcttctgcc tctttatgtc tatgcttttg 48660
ctggtcaatc tcattgaagc agccggcagc tcgaaaggtg ctacagccgg tgacgccgcc 48720
agcgcttcag ccggcacgac tgacctcgcg gccaatgacg ctagacgcct caccaaagac 48780
gatctggaca tgcttttccg agcccgacaa gaacacgccg taccagtcta cacgaacgct 48840
ggagagaaat ggcttcccac actaacgtgc cttatctcgt ccagtaccca aacgctccca 48900
actttgaact tcgggcgctc gaaacagcac acgaatacgg agccaggtat gtcggaaagc 48960
ctgcagacaa tatatccact tcttggaacc gtatctgggg acgagtgagc aggccgcaga 49020
aagacacata ttttctcagc gtcattcatc ctcagcacaa gctcggacag gagatgggct 49080
tagccgataa caaacggatt gctactttgc tttggaagta caacaaggcg aaggatgaag 49140
caaagttggt gcatgtcgac gagctgaatt acgccaaagg cctgaagtgg gagcttgatc 49200
ctttgaaact agtcatccag catcactagt cccacatgaa aggcgagtag tctgaggcgg 49260
cagtctgcct cgacacaaac gctgctttgc ccaccttttg cagaactcgt ctaaagctcg 49320
ttcgcaagat ttctcctatt tcctttctct tcaacccaag atgtgttctt ccttttgtgg 49380
acatgatgaa cgacgtgggt ctgttcggaa gcgacaatgt ttcgtcttct ccataaccca 49440
ttcacactga aatatagcag ggggcagaat cacgatgtgt tgcacacaaa gtaggggggc 49500
gaaagtgata gttggaggcc cggttcctgt gggcatcggt ctggctttcc cactgttggc 49560
agcagacaaa gacaatcctc tcgtcgtcac gggcaaaagc gagcctctca gtagcagtgg 49620
gctaattttt tgtctatata tgataaagtg attcgccgag gatctagatg cggtcgacct 49680
tcccgtccat cacagaagct ccccattcca tacttccctg cctcagccca atcttccctc 49740
cagtcacgat tatctccgaa tgcaggttct ctctaaccgc ttcctcggcc ttttggccct 49800
cctcttctca cttgtcatcc tgggtgtcgc tgccacccgg cttagtgata aagaggaaga 49860
catgctcaat caggcacgaa gtccttacca gtctcccatc tacgaaaatg ctggtcatgc 49920
atggcagacc tggacacttt atcctaaact tcaggattac tcgcacatcc ctgactttga 49980
gcgtgatgct cttgaaatgg cttataggaa aggtgccatg cacatcagcg acaccatgga 50040
cgacaacgac atccgaaaca gggcatggcg ttctggtagc cacagtggta gcaagttggc 50100
cagagatgga catatctact tttacagtat tgttcctcct cgatcttaca tgggactcca 50160
gatgggactt cccgagaaaa accgggtcgc tagtctgctt tggaagcatg atccgggaac 50220
ggggcagacc aagttgattc atgttgacga acttcagcac tataagaacc tacagtggga 50280
catggataag ttggaagaca ttctcaggca tcactgagac agatcattgg ttcagatttg 50340
gcctgcgttg ctacccgttc tagcttctcc tcttagcgac gcacgagttc tttccgccat 50400
caaacaacgt ttcgttactt ctgcctccga gctagtcatt gttagtcaat cgctttccct 50460
gcaatcttag tctcattgac ctcctaatcc aggcctgagc gtttcagatc aaccggtgaa 50520
agcagccaag tagcgcgcgc acaatagtga aggatgttga caaacgcatt caattgcaac 50580
agtgcatgta acggttgttc ccaatcttgc ctaccggctc acctcttcca acaatggtcg 50640
atctgtagca ctctggagtg agcccactag agagacgcga tgaaggacgt gggctatgtt 50700
ggcggtagca ctgctactcc cgctcaacgc acgcccacta gctcaggatc agatgatcaa 50760
gggtgctttc tggtttggga cttgacgctc tgctttcaac cgtctttggt gccgttgaag 50820
cacctccagc tactagcttt gctttacgaa gaggtcaatt tgagtcagag gcatggtata 50880
taaggcccac ctcgaccttt tttccttctt gtcctctcaa gtcattccac cattcctcga 50940
tacttgtcgc agctcaagcg attcgtcaat atggttgcca ttcaccgccg tctcttcctt 51000
ctcctgctcc ttggcgtcat ctttgcaatg accgccaccg ccgccccacc ctacatcaat 51060
ccggacgaag agatgatcca acactctatc ggcaaacttg gcactgtcta cgccgattcg 51120
ggtgtcacat atgcaccggt caacgccgcg ggcaaatatc gcgtctacaa ctttgaagaa 51180
aaggcgtggg acatggctca cggtggcgca acctatgtcg gtacgcgtca acacttccga 51240
ggaggtcaaa agtatggtca accttggaag tatttctatt ccatcattcc tcctgacaca 51300
ccgttgggac gggagatggg cttgcctgac cacaaactcg cgacggtgct gtggaggtac 51360
gggaacggtc gaaagtcgat ggtggaactt caggaggcgg ataactatat gcatcattct 51420
gggttcaatt ggaacgggat gcaggagctg aaggatgtaa ttggacatca ctgaagctcg 51480
tctgttctgg actggtgatg gtctcgttgc ccgcgctctg acagctgtcg tcgaccagtg 51540
gttgggacgt ggatcgctcc cgcctctcaa gcaa 51574
<210> 2
<211> 18268
<212> DNA
<213> Pseudozyma tsukubaensis
<220>
<223> genomic itaconic acid metabolism gene cluster in Pseudozym
a tsukubaensis
<400> 2
ggctgagcgt tttactcgac agaatgcttg aaccaattct tcatcgacgc caactcgtaa 60
cgccagtttg cggcgatcaa ggtgtattgg gattggagaa gaccaaggat gatttagcgg 120
tagatctggg acaggataga gatcggagga ggaggaggaa atcgaaccag ataggtgacc 180
atagggacga atttcctttc tttttttttt ctctttcttt tttcttttct ttttcatttt 240
cttttttctt ttctttctct ttctcttacg gctgtgctca ctccgagcaa tcaatgtttg 300
tgttctcttt tacagtaaat gtgctcactt cggcggcatg cactaaacat gtcgcaagcg 360
gaagcttaac acgcagcctt aaatcttaca atatctagga tgccggtgtt cagtgtgtgc 420
cttttccttt tccgaacgtc aaaacggata ttgacagagc cagctgttcc ggagatgtgg 480
ttcttgtgta agctgcagat acccgggcaa aaggtacaag caggactgcc gggtaggttg 540
aaaggcgatc ccccttgttc ttaccgatgt caatattgat aagagccgat aagtgcaatc 600
acgcaatcag gtagcggatg gtcttgatgt ccgcttcacc aatctcccat tatttgaggc 660
agagccagag gagtacttct acgtccacgg ttaagttagt caagcggaga gctgatagtc 720
atgatcgttg gcgcacgccg aggctgagtt tagactctag atcatacatg attaacctca 780
atagaatgag ttatgcaaaa aaacgggtcc agagcctcgt cgattcaaga tcagcagtga 840
gccgattcaa gcacgaactg aagatcaggt gcaagataac tctgggccta ggacggtcga 900
aggcgcgaac aagcgaggtt tcgagtggac aagtacgaaa cgggggagga actagtccac 960
gatgatcgga tgcacatggg ttacagtcaa gaaggaggga gttcgcaaga agagcgtgat 1020
gcctacaatg tagccgaaac gaaagctatg tgtgtgttcg ggtgggggta aggagccaat 1080
tcgagagaaa gagagagaga gagagagaga gagagagaga gaggaaggga aagagagaga 1140
gagagagaga tggggaggaa ggcagccagg tcgcatcttc tgccctagga gcctgacgaa 1200
cagtatatca acgtatttac tctggttgga ttcaatgaga tagaccagca aatcctcagc 1260
tgttcgcaaa ataccatgta ctggcggagt gatactgaca tcacaacgat tgatttcctt 1320
gcggttggac aatcaaatta gactagtgac ctcgcttgtg tgcgcattag ctgctgcctc 1380
aagatagttt atcataagga attgtctcgg atgtccacgt tgatggtctt ttgcctcgtg 1440
cccgactggc ctttgtgtgc ctgatcttga tcaaagatct ccattcgcac caagaaaatt 1500
tgtacccgac atccgaatcc gaacgtgcag tctattatac acatttcgaa gatggcagct 1560
ttcctgttgc cttagtctct cgcaacgcgt tctcctgctt gctaggaacg cttgagctaa 1620
tttcaatggt tcttagaccc cgaaaagtcc tattaatatc cagtcttttg cgaaatcagt 1680
gtcaattttc acagacgaat cttgcaggcc tacttcattt cgcaacctac agcttcaaca 1740
agcaggtaca aagggttcac ctttatcgat acgtcggttg tataacgcag attttgccgg 1800
aatgactggt ccgatgtgtt tctatggtgt cgaggagcgc aaaaagctcg tcctgccatg 1860
cgtctgaacc gtgcgaatct tgaaccattg caacgagctc agctcggtcc catttttata 1920
tattcaaagc aatccactct gagccgaatg gtcccgtagt gtctcccctc ctgtccatca 1980
atctcgacga aaagaagcga caatgagcct ctcgaacagc aatcacaacg agcgccacaa 2040
cgacgacaac aacatcaatg acgatgattg tgctaacttc tttgagctga tggttcagcc 2100
tgcctcttct tcttcttacg gcccctactt tcccgaccca ggactggcgc ttccagcaat 2160
ttccgatgtc tcatcaacaa cagatacgcg actaccgtca cagctcggag tgaccccatt 2220
cagtcatcag acatcgccca tccgatccgc agatgaagga gagaagacga caacaaccgc 2280
atcatacaaa agaaagcatt ccgaggtgga gaaagaccgt cgaagaatca tctcaaacgg 2340
atttgcagtg agtttccctc ttcttctacc ataaagttca ggctggttga gctgaagtcg 2400
acgtttggca atatttgtgt agatcttgca gaacgtcctc cataacgact caacttccaa 2460
acccatctcg aaagcgaccc tacttcaaca agcgtgcgac gaaatccgtg aactgcgcaa 2520
aaaacttgat acgagcatta ccatcatctc ccgctatggt ctcgaaaatt tgtttcaggt 2580
ggctccaacc cccaattctt tgagcaatgc ttctcctccc aatggtacga gtagggctta 2640
ccctacctat tcgaacgacc tcggcccgga tcgtttccaa gactcgcggc gtagttccac 2700
ttcggcgacg agtgtgtctg gatctcaata taacaatggc gctgccgcta aggaggatgg 2760
aaacgagagg cgtaattcca acgtgaagag gagaagttct tacaccaaca gcatcaacag 2820
cagcttcgag tcatccgagg aggacactct gaatagcagt tgcgacaaca caagtgactt 2880
cgacgaaagc gttggcagca gcgaaagcga aagtgaaaca aacaacagga caagaaacag 2940
aaacagaacc aagagggcaa tggcaacagc aaagctcaaa gaccgagacc gcgccaaagc 3000
tcgaaccgca cccaagccac acagcaatcg cttatcgcct gcatccacta taacgccaag 3060
tgagatgagc agcagcttag ccagcccaaa cacctcttca caagagcata tccagcaagc 3120
catcttgtca ttgctcctcg aattgccgaa acatctggag aatgtgcaca agtcgaagcg 3180
tccttcctct cagcagccaa gcacacagat tgatcaaacc ggaaaccgga ctacgacggt 3240
aacgaagacc aggagacggc accgatgatc ttgatcaacc ctgcttgcct ccacttccgt 3300
tgtgtagata caaagtctga caaccctaat ctatgtgtat atgggcgtga tcccacttca 3360
tcgactacgt tcgtgcgtta ccgagagcgt tctgttgtga gatagtatga ttgctgtctt 3420
gacaaaggca tacgctcttc ggcctttttc tggtgtgtgt gcttgacaca aattcgggga 3480
tcatgctagg ctcggtggtg gccaaacact cacatacatg cagtggaggg tgggagacga 3540
atcaaagttt cccaacttgt gagtgagtcg ctaacgagct tcaagccgtg gccataagag 3600
gttcgattgc aagaaagcag taaaggcaat gtagagaagc gaaacaaggg cggaacgcaa 3660
gggagagtgc aaaaaggaac gaagatgctg gatcgcctcg gaggcgatca gcagcgaaga 3720
attgatacgc atgacggctg caggcatcga gctgagctgt gtctctgctt agtccacgcc 3780
tcaagcctag tgaacctagc actcatatca agcgctctgc atggctaatt cgttacagtg 3840
caaatctgaa cgcgaccaag cctggaagac ggatcatctt gtatgtacag aagaaattca 3900
aaccctaacg aagaacgcca aagccaacag gaatcaaaac tcgggaccgg cgagaagcca 3960
aactacctgt tcatacacgc taaaaatgac tcctccacta acgatgaggc gcatactacg 4020
tgatacggaa ccacgccaca gagctgctat gccctctgta ccgatggtgt cggtcaagca 4080
gtgccacgtg gatcggtagc gcgaagcgtc gatggcctgc atcctcgttt tgagaacgtc 4140
aaatggcatg gtcccataca cggcgacaac gccagatgta gcaccgatgg agaaagtggt 4200
caaccaattg acgaaggatg aacccttgcc ttgggctttg ggaatgaaat ctcgcatagc 4260
agagtatgta cctagtcgga tcgctgaggc cgagccttgg cgtagaatga ctggaaatac 4320
acctttgtag ataccgccaa acccttcttg tcggatgatc gaggcggttc cacggaagag 4380
accctgttcg tagcgtggtt tggcacgctt gccgtcgtcg atgagttttg tttctggtga 4440
aagcaataca gcgcaaggtc agtctgtctc gcccttcttt ggttctgttc tgcgagtttg 4500
cgtgggcact cactgatcgt ttcactcggt gtcacagcga atatggcttc cagcgtgcca 4560
gcgcccattc ctgcaatgta gttgctaccg ctcgataatt tcccctgcga aagatttcag 4620
tgtcagtcta tttcctaatg catccatgct aggggaaaac actcactgtt gatttgttct 4680
tgagcatatt tcgaaaattc tcaaaagcca aaaagcgaac accagccttg gaagcgttgc 4740
cgacaactac agccgaacaa ccacgaaaga gccctctagg cccttctttt tcaagtgttg 4800
atcggaaaac atccaatggt gaaagacgtt cacgattgcc gtgagtatct cgctgtgcga 4860
actgtgtaac tgtcttgaga tactcgatgg ggaaagtggc cactaaggaa gacaagaaga 4920
ttgtaaggta aaattactag caaaatggac gaggcgaaag cgatagaact cacctccttc 4980
aacagcgcct gcagtcgcac cggccagcac cgagactgaa ggagagatgt tgcgttgaac 5040
ggacggcatc ctagctgatt ttgttctttg ctgtttgtaa tcgggaaagg cgctgtcccc 5100
gctcaggaca agcagagagt gtttgggcct tatgaacctt tcagcgagga ccagctctct 5160
tactatttgt tttcagggtt ttccaagaga cacaggaaaa tagcctcctt actcaatcta 5220
tggtgttcga acccggtcgt ggccatatag gctacctatg caatcacaca agttattcgg 5280
cgctcagttg tggcgatcgg tctgagataa tttgctgagc tgcagctttt cgtgcagggc 5340
gacctcgtca cgctcatgct ttttcaagcc aagcactatc acgcttgact aggagtaccg 5400
tggtggtctc tcagaatgtt gtgtccaaac cacgtgttgt gcccgaacca gctatcaagt 5460
gctcgcacga ttcgcaaagg aaactatcga gctttgctca gcatattcag cgtgacaagc 5520
acgatgcctc atgtcaattc agctcaatct catgcaagac ctgcgacaga gagtgcgacc 5580
atggggagta aatgaacgtg accaagtaag tcagataaga gaccaggaag gcataaatct 5640
gccacctcca cgaggtgttt gagacctgat aggagcatga caaggagcag acaaaagcga 5700
acgagatcag gctttcacac agttgcacga gagattatga ggatttgaat ctgacgatat 5760
gattggaccg gcaaaatgtt gcgatgagca aaatggcact gtaaggatgt gaaagactgc 5820
tctcataggg ctgtggaatg cgtgccgcgg tagctagaca cagtgctgtc cggcatattg 5880
taatatagct cactttcctt cccttccgaa ccaagtggaa tgatgtgaga tctatcttta 5940
cctcttccca atgcgagcgc cagcgactga tatgccctat cgagcatctc cgcgctggtt 6000
ggagtgacgg gtgagatgat cggtatttca accgaagggt gccgatcagg catagtataa 6060
tagacgcggg cgtgtgcaat cagggctacg gaacgctcaa cgtgggcaat atctagcgaa 6120
cggggtgagt cgctttcggc ggctgtaagt ccaatctcga gaacgccact aggatgttcg 6180
atagagatgc gacgctgagg cgtgtaggga ggggtggtat cgccaggcga tgaagagagc 6240
gaaggagtgc gtgacgaaaa gatgtccgag accaccgttc caggtacata ggcggctccg 6300
gcggtgcaga tggcaccggt gacggcgtgt gcgttgtggc aagttttggg agtgaagtct 6360
gttggacaaa aaggaactga gaatcagcag ccgtcaatca ttcaacaagg tacggtcaat 6420
tcagcgttga gaacttacac cgtgccgtaa aagtggtgca attggaacct ggtccgatga 6480
gagacaattt gggcaccacg ctagaagaaa catcacccca gcccattcgt cgacctgcct 6540
ccaggcgtac acgttccagt cgagatagca aggcagtgtc cgcattgagc gtcgctgggg 6600
tctcgaaacc tgtgatacca acatcggctt gacgaacaaa aacaacaggg atggccgaat 6660
cgatgacgga tacctcgagt ccctcgattg agtcagtggc attgccagtt ggaagaagct 6720
tgcctgtgca tgcacccacg gtattaagga agcgtaagct gacgcgagcc gaaggacgct 6780
gcaagcccgt atcgtccaca tctttgtagt ggactcgacc atcttgaacc ggaatgagga 6840
gctcggatgc ctggttggag ttgagattaa agatgcgcac aaggcaggtg gtgtcggatg 6900
gatgaggctt gactagacct cgctcgatcg cgaaggcagc caccccgctc atcaaattgc 6960
cgcagttggg tgctgtgtcg acgatgcgct cattgatgcc aacttggcaa aagaggtagt 7020
caacatcgga gtgatcgctc tgtgcacttg gcgagactat ggccactttt gaagtcagag 7080
aattgccacc ccccataccg tcgatctgca gtggatgtcc ggaacccatg atggacagca 7140
gcgccgcatc acgagcgctt ggctcggatg gcaggtcact tgccaagagg tataagccac 7200
gactggtgcc agcgcggtaa attgtggtct caatgcctcg cagcatcgtg aagctgtcag 7260
tgtgactaac gacaaaagcc aataagatgg acggctaacc aaaacgtcgt tatatgatct 7320
ttcttcgcct gagttcttcg gtcgaggcca tggaagtacc tactatcctt ctgaaccact 7380
tgacacgtcc cgcaagagga ttcgacattc tcgattgacg taggtgtcaa attgtgcgtg 7440
aaccaccacc accacttcaa ggcacgaggg ctagacgtga gatttagact agtagacaat 7500
gagcctggct gggagaatgc gtgcaacgct gtcaaacagt gcatttgccg gcggtgtcct 7560
cagaagctgc acgcgatggt cacgctcctg aattgtgggt gagagcggac gtagcctgat 7620
ttaaaattta tctaaaggta ttattaatat taaaaatgag atacgttcaa cgatcagcag 7680
aagaatgctt ttggctatcg cagtttgtat cgaatttccc atcggcttta ttgaaattat 7740
aatacggtgt attatactgt tcagtacagt acagtagtac tgtacgtaaa tgaccatata 7800
ctgcgcccgc tcttacttag cactgctatt ttcaaagctt ttccaatgga acgacaggag 7860
acgttctctt gttgatcgac gctgaatttt gtttaccgac aatccgccta cgccgctgca 7920
gcaaggaatt tcacacagta gcgtagcatg aaccgtttcg tcggacggtg tcggatttcg 7980
aaatcgagaa cacggcggac aaggtgtcaa ttgctaacag cgtgcaaatc cgctgcacaa 8040
gaagagcgtg cccatgcttc ttggccctac atactgctct tatcgaccct tcggacatgc 8100
aaagggtcat cttctgcctg aagaacatgc ttcgtctgac ccaagaatgt acggcctgtc 8160
caggtcaggt actcgtctcc gatccaagga ggatgataag cttcgtggca ctaagcggtc 8220
ggttcgtctc acaaacgcca taccaccgcc tttgccgtgc attcccatag tggccttccg 8280
aagctcgacc acttcacatc ccaatgtagc tataaaatcc aagcttgaag agctcattac 8340
tgatgcctag gagtggcgtt tactgctcct tccttcgaag cgcccatcgg ccctcacttc 8400
cgtagacatg cttccacaga cacctgttcc agattaccgt ctcagcatga gatattcgac 8460
agacagcgtc gcagcatcgc aagcgttaac aacgcctgaa gcagctccaa gtatttccca 8520
tcacgcagac acgggcgagg ttcaacaggc gcatagcggc gatgacggcg cgctcgaaga 8580
gggcgcaatt gctcactcaa gtaaggaagg gtcacaacga gatcagcaaa cggagcttta 8640
ctgtgctttc acaaagggca ccaagctctt cgtcgtcttg tccgtgtcta tcgcgggctt 8700
tttctcgcca ttctccatca atatatatat ccctgcgttg cctcagatct cgaagctact 8760
acatacatcg gaaggtgagt gagacgattt ctcgtagaga cagtttccca gaagcagctc 8820
ctcatcatca tattttgtct tattgtagcg gctactaatg taacggtaac cgtctacatg 8880
atcgcacaag gcctctcgcc ggtcatctgg gcacctcttt cagatgtaag tccccatttt 8940
atgtgacgcc tgtctctgtt gtaagatgtt tccacaggat caatctctga aatttctcgc 9000
ctgtcaaatc ggcacgtaca ggtttttggc cgcagaccca tctacattgc aactttcctc 9060
gtttttttcg tcgccaatct tgggctttcg ttcaccaatg tctactggct cttggtcgtc 9120
ttgcgtatgg ttcaagccgc aggagcatgc agcgccatcg ctattggcgc aggaacgatt 9180
ggcgatgtta ccgagcgcaa ggaacgagga agttatatgg gctattatgc gcttgcccaa 9240
tatactggtc cagccatcgg gcccgtaatt ggaggtgcgc tttcgcaaag atgggattac 9300
cattctacct tcttcttcct cagtgccgtt tctggtgtct ttctgatctt catggccttc 9360
ttcttacttg aaacgcttcg tgttctagtg gggaacggaa gtgcacgcac attcggcatc 9420
tatcgcactt tagtgggacc cagactggtc aagtcgacgg caaattcgat gcgtccaagg 9480
atgaagagtc cgcttgaagg tcgactcgaa tttggattcc atcgtccatt tttggtgttt 9540
gcacgccccg agactagcct ggcaatcctg gctttttcga tggtgtatgc aacatactat 9600
ctatcgtctg cctctttgcc ttatctcttc aagcaagtat atggtctaca cgagctactc 9660
attggggtat gcttcgtgcc tagtggtgtt ggttgtgcct tgggcacggt gctcgctggc 9720
aagatcctcg attcggacta tcgacgcgcg ttagacaaga acaagtcggg tgtcaaggtt 9780
acgcgcgcac ggctgcagtc ggcctggatc tacttgccag gctatgcctc ctcgcttcta 9840
gcgtacggat ggtgtgttcg ggcgcatacc cacatcgccg ctcccatcct ttttcagttt 9900
acacgtaagt gagaattcaa tcttccgaat cgtggatcct gttcgtgtac agcagtgctg 9960
actctgcctt tcaattaatc tacgaaacag tcggcatgtt ttcaacaatg tacttcacca 10020
acatcaacac actcgttgtg gatctgtacc cgggcaaggc agctactgcc acagctgctg 10080
ttaacgtagg gcgttgctta ctcggcgctg tggctgtggc catcgtacaa ccaatgaccg 10140
atgctatggg cgctggatgg acattcacag tcggcgcgct ccttgctctg ttcatcggtc 10200
tgatttgcca gacactcatt cactttcatg gcgagaagtg ggcagctcgc aagcactctt 10260
gatttgattt ctacaatgct atcgctctgt tcaacatact gtggactcaa ttcacatgcc 10320
tctgaaatgc aaaatcatat cacccagctg gtcgttaaat tcttcagaaa ttacctggac 10380
tttgaaaatg ttcatcttca gtagcgggtt tctcattcag cagatctggc atgaaatgct 10440
ccggacctac ctgaatcggt cgcgaagcaa gaccatatga ctagggggtc cttcgtgtgt 10500
gcctcggggt tggtatgtac agtacatctg tcatgatcag atcaattttc atgataagag 10560
acgtttgcgc agcggcaacg gcacccttca cgtgatttgc acggtccatg gaacatgaac 10620
catgcgtgat ttgcacgcag acgaatctga gcgtcctctc accttcggcg acagcgactt 10680
ggtcacgcga acaaggcatg gtttcaacat cacaccacga ctgcctcgcc ttgttcgaaa 10740
ctgcttcaac actcagtatc actgtactga ggtgactggg gtcgcggttg aagatcaagg 10800
ccggcctggc aaattttgta taaaattgta aatgaaccag gcagtcatgt tgtcactcac 10860
ataggaagtt gtccttggag ccagaatcga ccaagttcct tacctcatca tctcactatg 10920
gcaccttctc tcaacgcgaa ctcaacagcc gatcggcgga acgccactgc tgcccctgac 10980
cttctatccg gcaataaagc cggtggtggc ctcaagcttt ccggattacc agacctctcc 11040
gactcggcag gcaccttgag cgacgtattt ggaacgccgg ccatgcgcct catctggtct 11100
gaccaaaatc gagttgcttg ctacctcgag atcgaggcag cgctcgccgt tgtccaagct 11160
gaactcggta tcatcccaaa gcacgccgct caggagatcg tcaaacactg ccgtgtagat 11220
gagatcgatt gggctctgta caagcaaaag accgaattga tcggctatcc tgtcttggga 11280
atcgtccagc agctggttgc caactgcaaa gatggcttgg gagagtactg tcattggggc 11340
gctacgacac aagatatcac cgacacagct accattatgc agattcgtca gtcgctcgcc 11400
ctcgttaagg agaagctgtg cagcatcgtt gcgagccttc ggtacttggc ggaaaagcac 11460
cgcaaccttc ccatggctgc gcgttcgaat ctcaagcaag ccgtgccaat aacttttggt 11520
ttcaagatgg cgcgcttctt ggccactttc cgccgacatc aggagcgtct ggccgagctc 11580
gagaagagaa catacacact agaattcggc ggtgcggcgg gcaacttgtc ctcgttaggc 11640
gaaaagggta ttgcgacgca cgatgcactc gccaagatgc ttgacctttc acccgctgac 11700
atcgcctggc ataccgaaca cgatcgcttt gcagaggtag gtgccttcct gggtcttctg 11760
acgggaacgc tagccaaact cgccacagac atcaaactca tgtcgcagac cgaggtgggt 11820
gaggtcgggg agccattcat ctcaaaccgt ggctcatcgt ccaccatgcc gcagaagaac 11880
aacccgattt cgtgcgtgta tattcatgcc tgtgccgcca atgtccgtca gggaactgct 11940
gcgctgttgg atgccatgca gtcggatcac gagcgtggca ctggaccttg ggagatcatc 12000
tgggttcaac tcccgctcat gatgaactgg tcggcagcgg ctctggccaa tgccgacttc 12060
attttgaagg gattgcaggt cttccccgat gccatggtcc gaaacctggc cttgtccaag 12120
ggcttgatcg tctccgaagc agtcatgatg gcgctcggcg acactctcgg ccgccagtac 12180
gcccatgacg ccgtctacga gtgctgtcga gcggcctttg agcataacag accgttgctt 12240
gatgttcttc tcgagaacca agaaatagct agcaagctga agcgtgccga gctagagagg 12300
ctttgcgagc cagccaatta tcttggacaa tgctcccaat ggatcgatcg tgtcttgcta 12360
cctccttcca cgtgaattaa gtagtgcgct tcagttcaac ttgttcaaat gctcaccgca 12420
tttgatgctt ctttgcttgc caacctttct tttaatgtag ctattgttta attgtatata 12480
ttacgggttc atttttgaag atgacggttc caaggcttca ctctcacgga ggcatgttac 12540
tcaccatcac cattacaagg ctgcgtcagc gaagtcaacc atcatcaaga cgatacaaaa 12600
ggtgggcatg gctcggcagc caccaccact acttctagtg caagtgcagc tgctacctct 12660
gctactgcag cggctcagga agccagccag accgccaaga cctcgacaga atgccactct 12720
cacgccgatg gctctcttca ctgcggctcg cactgaacag atctttggca tcggccacgg 12780
aatctagatt cgatttgagc cactaccaat caattacttc tgcaaaatgt atatagttcg 12840
cagcaacatt gacatggttc gaacaaacac aggaagcagt gcagaggcga acgtccttcg 12900
atactttctg cacagcgccg aaatccatga gcttgcccgt gatggaatga agatgaaaat 12960
aagactcaaa tgaagccaag caactcattt gcaggcgatg cactcactct ggaaagttat 13020
tgaccaacac atgaattgcc atgcgaatcg tggctgaaca agagtcgacg tgtcggaccg 13080
acgaaagact tgaaggtcac cagaggttgt ggttcagttt tctgttcaag cgctatatca 13140
caacttgcct gtggaattag actgttccac caatgttcca taggccatga ttgagtgtct 13200
gttccagcaa caatggatta gcttgtggaa cacgtttcaa acattgaaat tttttcgttg 13260
tgtcacaaat tttaatataa atgttgacgt cacatttgtt ttgccagaca gatgtacacg 13320
aaattccgac gaatatcccg gctggcgagg ttccagagtc tcggctgtcc aacattgcca 13380
aagatcgacg gaacgccgta acgaatgcgc ataaaaccgt tggcactaca gaaattccgg 13440
gaacacgctg accggatcaa acaacggctt ttgacccgtc ctcttgaagc tgtccaccta 13500
ctcatcagct ctggtctaag cttgctggaa tcttatgtag aggcatggct gcagtcagct 13560
ccggaacaag atcgtcaagg aagaagtttt gatcatcttt tgaggcctct ccctgaatct 13620
acttggaaag gacggcgtct attttggccg ggtctagcct cggaactcca aacaattgtt 13680
ctagagaaag aaaaaaataa aaaaatgtac aaattatact tcacgtttga agcctgtatt 13740
aagtgacccg taccctcatt tgtaccagag cagcggttag ccttgatcga ctgagcaata 13800
gcgccgaaat ggtggaaaag tgtgccgccc gtttgccgag tctggacgcg ctatcccgaa 13860
caattctctt tggtaagggt tggttgggct tttaaatgac gtttgaaggc cgtcgtcacc 13920
tcggacgttt tgtgggagta atgatggatg actctgttca ctcgcggtct tgtgtccttt 13980
cacggctccc ccgctgtggc tgaattctgg tacagggtgt tctgtaaccc aaccaaactg 14040
aagagtgttt tgtctttgac agcagactat gcaccataat gggatacttg acacgaaggg 14100
atataaaatg aaccacccta atcagcaaac acagcccaaa cagctcctac ttccgaacaa 14160
ttcgaacctc gagctaatcc acggctcaaa tcaagcgaga accaaccaac caagatgcct 14220
ttcgctcgaa ccctgctgct ctcggccata gtgggctcgg ctgccttgac cacagcagct 14280
cccgtttccc ctgcttgtca accagccctt cggcaatggg gtcaaatcac cttcaatgaa 14340
attgctctca gcataggcga cgacggcgat tttgtgattg gtgggccgaa tcccataaat 14400
tttgcagtcg ccacctgctc gaaggaatac catggtaaat acgaggttca gggcgaagcg 14460
taccttgtcg acgctacaga ctccagtcaa tgcctgactg cgagcaatct tgaccagcag 14520
aactcaacgt tctcattcca agattgtcgt tacaacggcg ctggagatat ctcggcctcg 14580
caattctttg catattacac tgactacgat gcagccaata ccctgaaagc gtacttcaac 14640
ggcgaaatcc ccagagtagt caatgccact cagcctccca tctacaatct caagagtcaa 14700
tatgataagc tgagctttga aggcagtctc gggaaattga tggtcgatta cacccccaac 14760
ctctcttcgg ttccttcggc ttcgctcgca ataccgaaag gataccttcc cgtgactgca 14820
cctccgcaga ctgatgatcc tgcgctgaag tgtggcactt atcaagtcgg ccagctccac 14880
ttcaacaatc tgacttcgag ctcgaatcag tataatgggc ctctgaatag cggatgggag 14940
gccgacccac acactaagga caagttcatc tttgaacagt gcgactactc accctcgggt 15000
attaaggttc aaaacgacgt tgtttatggt cgtctccgtc ctgcaaccga gcttcaagac 15060
tgcaaattcc aatgctatga gttcatgggt caaggggacg gaggttggat catgggtctc 15120
caagaacaac cctgcggata cgcgaccgct tcctccaaag aggccgccca ggagagcttc 15180
gacgtgatca agctcgacaa gtcggacaac acggttgaat gggtcacctt caagaacgga 15240
actcaaacca gcgtgtattc ggcctacact caagtcgact atgaccagga gtatgacgtg 15300
tctcaacaca tttggaaccc gctcgggatc ggctatattc agctctcccc ggacaatgca 15360
aacctgacca aatttccgcc tggtaaagtg agcttcgtcc ccaatgcgta agtcaaccag 15420
tcctcgcagt ccaagcttcc agtctctctc gctgcactca gtcatgcaaa taggatgcga 15480
cctcttatcc caagctccgc tttgagtaat tcttcgtatg ccttgttgca atatgcgagt 15540
aagttttgct gtgcctaatg ctgcggcact gagattatgt ttagttgact acgtctatcg 15600
agaaattctg gtggacttgg tcgcatgctt gatacgagta ggtaagtgta aagatgccga 15660
caagggatgc aatgccctag cattcattgc tggacctgga acggagtcct gttggagtgg 15720
cgccgactga attgcttcag tctgagcgct accattctgc gtccacaggc cgaaattcgc 15780
gtttcgggcc gagcgtgctt cgagacaccc cctttgctgg aaggagactg ttggttggac 15840
ccaacgaagc gtccgtcaag tttacctcgt ggatatactt tgcggaggca ctgcatagct 15900
tttgcatcaa ggcatcagct tgcttgggga gcaatggggc atcgaggcac agatcctgcc 15960
agacgaaacc accaaagagc tctttgcatt tggcgattgc cacgatagtt ccacctgggt 16020
gtttgcgcgc agcggttgcc aaagcgcaac caaaggcaga gcgggcagcg ttatcgtgtg 16080
agctcatacc ggcgaatcgc tccatcgcag ccatcagcac tgcgtcaaag gctggctgtg 16140
gtgcgtctaa caactgagtc aatcgttcac tcgcgtgtgc aaatccatgt agaagttgtg 16200
gctcaagttc agggcgtgcg gctgcctcag ccaacagtgc aatcacaatg tcctcgatgg 16260
agactcttcc agatgaatcg ctgacggtag ggatcggcaa atcatcaagc aaagtaagcc 16320
ggccttgggt gcactgtcct cgttcttgaa gctcaagctg tcgtaattcg taaaggaagc 16380
gggggttggg ctccacctgg ggtcgagaag atctgagttg ggctagggcg tcagccaaag 16440
agatcttttc ccagatgata cgtactgcca agacgagggt agcgctacgt gagacgcctt 16500
cgtagcagtg cactagcacc tttccgcccg tctggcatgc ttgctcgatc cattttgcag 16560
cgtcagcaaa gtaaggaaaa aggcgctcgc tagtgctgtc tctgacatac agatgccagt 16620
attggaattg gtcgggatgg aggtcttgaa cttcgcgagc cgcattgagg atgtgagtga 16680
tgccaagcga tttgaggcac tgcgcgtcag ctgcctctcg cacacctcca agataaaggc 16740
catccacgag aaaggatggc ggatctgaat agattttcag catgcgtgga acggcaatgg 16800
tggcaatgtg gatgaatgtg aactcctaat gcgcgaaccg aaggctttca aaagaggcgg 16860
tctctttatc gatcttgcag taccaagcac cctgctgtaa gacgagcgca gactgtatgt 16920
gagagcggac ggaagtaacg aagtgtcata caaggattgc atctaggagg aggttgatac 16980
ttcaactagc tcccattcac aagacagagt cacgttagat tctcgagcga gcgcacgatg 17040
tgagaacccg taagcgtgac acctgatgag aagtgacgca cgtgccaaca gcagtgaaca 17100
ttttcggcta aacgccaaaa gagcctggac tagatcaccg ggatcggcac cacatgtcat 17160
ttagaatgct tagaatgcgc aagggaaaat ctgtttgact ggcagccaag tcttctgaaa 17220
gtatagtgca tcactgtcac aggcgtcccg agtcagctgc ggaaaagtcg gactcaatct 17280
ctttcgatcc gaaacggatt ccacaccatt taggcggtgg tttttgggga atatcaacct 17340
gcttgctgaa acaagacggg tcttgctgga ttttgaggaa atgtcacagc agcagagtgc 17400
gatctgaatt tgctggaaat ttcaaaagtg gaggcagcac agcgcagcgc agacgcgtca 17460
aatttggatt gggtggaggg aatacaaatt ccaaccacag cggtggcaca gcggtggatg 17520
gtcggactga aattttgtat tgcccagatt tgggagacgg tcaacactgt tgtggtgcac 17580
ctcaccagat gaattgcaac aatttggcac gccatcctga gaaggcaggt tgcaacaaat 17640
ttttgaatat cagcatagca ggctgtaaca aaaaagacgg tctgtaacaa caataatatt 17700
cattttcaga tgacaggtag taacaagtgg aaggcgggct gtcaataaat ttttcaaatg 17760
ccttcatttc aagcatgacg gtctgtaagc cccagtatca atttggattc aaccaaaata 17820
gcagtttggc ataccagact gcttgaaaga tgacggtcta tcaatatctc tgtgcagttt 17880
aaatagagat gtgagagaat tctgttggtt gactgttgtt tgtcagcccc accacatccc 17940
aaccaaccat gttgtttaca acctgtcctg cctgcactta cacatattca accagcaaca 18000
tcaccaacca catttgcaaa gctcacaagg gtgtgtctgt gacagcagca gcagccaaag 18060
cttgtggatt ggttgcatgc ttgtgtggac agacgttgct caacaaggca gcgctggcac 18120
ggcaccaggg aataaggaaa tgccagcttg ctgtctccca gcctttgcaa ccatctccgt 18180
tggctgctgt tttaaatttg cagccatcag ccaccccgtt gctgttgccg ttgccatctc 18240
caatttcaag tccatcgact cccaccag 18268
<210> 3
<211> 283
<212> PRT
<213> Pseudozyma tsukubaensis
<220>
<223> Pseudog4085.t1
<400> 3
Met Thr Arg Leu Ile Ala Leu Gly Ser Ser Phe Ala Ala Gly Pro Gly
1 5 10 15
Ile Pro Pro Gln Val Asp Thr Asp Ala Gly Arg Ser Ala Asn Asn Tyr
20 25 30
Pro Asn Tyr Leu Ala Arg Arg Leu Asn Leu Asp Pro Asn Asn Thr Asp
35 40 45
Glu Phe Leu Asp Leu Ser Val Ser Ser Ala Thr Leu Leu Asn Leu Ile
50 55 60
Ser Glu Pro Gln Asp Thr Gly Lys Lys Val Tyr Ala Pro Gln Leu Ser
65 70 75 80
Leu Leu Pro Glu Leu Lys Glu Gly Asp Asp Gly Ser Asp Ala Ile Val
85 90 95
Thr Ile Thr Gly Gly Gly Asn Asp Met Phe Tyr Ile Gly Ser Met Phe
100 105 110
Gly Leu Thr Phe Lys Asn Thr Trp Trp Gly Arg Leu Leu Ser Tyr Phe
115 120 125
Val Leu Ser Lys Glu Glu Lys Glu His Phe Glu His Pro Thr Ile Ala
130 135 140
Ser Pro Asp Glu Ile Ser Gln Arg Phe Ala Thr Leu Ile Asp Gly Val
145 150 155 160
Gln Lys Lys Tyr Pro Lys Ala Thr Ile Tyr Leu Val Glu Tyr His Ala
165 170 175
Met Met Gly Pro Asp Thr Lys Ala Trp Arg Asp Val Cys Trp Asp Gln
180 185 190
Gln Gln Val Gln Lys Tyr Ile Glu Met Ala Glu Gln Leu Gln Ser Leu
195 200 205
Tyr Ala Lys Ala Ala Glu Gly Arg Asn Asn Val Tyr Val Val Pro Leu
210 215 220
Ala Glu Glu Ser Lys Leu Lys His Ala Leu Gly Ser Lys Glu Pro Trp
225 230 235 240
Val Ser Asp Gly Ser Phe Trp Asn Phe Lys Asn Arg Cys Ala Tyr His
245 250 255
Pro Asn Gln Ala Gly Met Lys Ala Ala Ala Asp Ile Ile Tyr Asp Phe
260 265 270
His Thr Gln Arg Ser Asn Ser Lys Ala Ala Ser
275 280
<210> 4
<211> 852
<212> DNA
<213> Pseudozyma tsukubaensis
<220>
<223> Pseudog4085.t1
<400> 4
atgacaaggt tgatcgcgtt gggctcatcg ttcgccgctg ggccaggcat ccctcctcaa 60
gtagacactg acgctggtcg aagtgcaaac aactatccca actacttggc gcgtagactc 120
aatctcgacc cgaacaacac ggatgaattt ctcgaccttt cggtgtcaag tgcgacgcta 180
ctcaatttga tctccgaacc gcaagatact ggaaagaaag tctacgcccc tcaactaagt 240
cttcttcccg aacttaagga aggagatgat ggcagcgatg cgatagtcac gatcaccggt 300
gggggcaatg acatgttcta catcgggagt atgttcggtc tgacgttcaa gaacacatgg 360
tggggtagat tgttgtcgta ttttgtcttg tcgaaagaag agaaggagca ctttgaacac 420
cccaccatcg cttcgccaga cgagatctcc caaagattcg caaccttgat cgatggcgtc 480
cagaaaaagt atccaaaagc gacgatctac ctggtcgaat accacgccat gatgggaccc 540
gatacaaaag cgtggaggga cgtatgttgg gatcagcaac aagtgcaaaa gtacatcgag 600
atggccgaac agcttcaatc gctctacgcc aaggcagcgg aagggaggaa taacgtctat 660
gtcgttccgc tagcagaaga gagcaagctc aagcacgcac tcggatcaaa agagccttgg 720
gtatcagacg gctcgttctg gaacttcaaa aacagatgcg cataccaccc caaccaggcc 780
ggcatgaaag ctgccgccga tatcatttac gactttcaca cacagcgttc caactcgaaa 840
gcagcttcat ga 852
<210> 5
<211> 767
<212> PRT
<213> Pseudozyma tsukubaensis
<220>
<223> Pseudog4086.t1
<400> 5
Met Pro Tyr Thr Pro Pro Arg Ser Ser Gln Pro Pro Lys Gly Leu Pro
1 5 10 15
Phe Glu Leu Ser Leu Ser Thr His Pro Gly Ala Gln His Asn Arg Ser
20 25 30
Ser Leu Thr Pro Val Ser Phe Leu Leu Arg Ala Ala Leu Ile Thr Pro
35 40 45
Arg Lys Leu Ala Ile Thr His Pro Glu Lys Gly Tyr Ser Phe Thr Tyr
50 55 60
Glu Gln Trp Ala Ala Arg Thr Leu Ser Leu Ala Phe Ala Leu Arg Ser
65 70 75 80
Leu Pro Ala Phe Lys Ile Gly Asp Arg Val Ala Val Ile Ser Pro Asn
85 90 95
Ala Pro Leu Ile Ala Asp Ala His Trp Gly Ile Pro Ala Val Gly Gly
100 105 110
Ile Ile Thr Pro Ile Asn Ile Arg Asn Thr Pro Lys Glu Val Ala Tyr
115 120 125
Val Leu Glu His Ser Gly Ser Thr Val Ile Leu Val Asp His Glu Phe
130 135 140
Thr His Leu Val Pro Glu Asn Pro Gly Pro Gly Ile Thr Val Ile Val
145 150 155 160
Ser Lys Asp Ser Gly Gly Gln Glu Ala Asp Asp Pro Tyr Glu Lys Phe
165 170 175
Leu Asp Arg Gly Phe Leu Glu Trp Gln Arg Ala Glu Gln Ala Glu Leu
180 185 190
Lys Ala Tyr Lys Ser Arg Thr Arg Pro Ser Ala Glu Pro Lys Thr Gly
195 200 205
Trp Lys Leu Ile Glu Ala Pro Gln Asp Glu Glu Gln Pro Ile Ala Leu
210 215 220
Cys Tyr Thr Ser Gly Thr Thr Gly Arg Pro Lys Gly Val Leu Thr Asn
225 230 235 240
His Arg Gly Ala Tyr Leu Ser Ala Val Ala Asn Ala Phe Glu Ala His
245 250 255
Leu Thr Gln Asp Ser Val Tyr Leu Trp Val Leu Pro Met Phe His Ala
260 265 270
Cys Gly Trp Thr Tyr Pro Trp Ala Val Thr Ala Ser Leu Ala Thr His
275 280 285
Phe Thr Ile Arg Lys Val Asp Asn Thr Val Ile Trp Asp Ala Leu Leu
290 295 300
Asn His Gly Val Ser His Tyr Cys Gly Ala Pro Thr Val Gln Ile Gly
305 310 315 320
Leu Val Asn His Pro Asn Ala Arg Lys Leu Asn Arg Arg Val Asn Val
325 330 335
Ala Val Ala Ala Ser Ala Pro Thr Ala Asn Leu Leu Ala Lys Met Glu
340 345 350
Gly Leu Asn Leu His Pro Val His Val Tyr Gly Leu Thr Glu Thr Tyr
355 360 365
Gly Pro Phe Thr Arg Arg Tyr Phe Glu Pro Glu Trp Ala Lys Leu Asp
370 375 380
Val Asp Ala Arg Ala Arg Met Met Ala Arg Gln Gly His Ser Tyr Leu
385 390 395 400
Thr Ser Asp Glu Val Arg Val Val Arg Thr Ala Ser Ser Thr Asp Ala
405 410 415
Ser Thr Pro Asp Leu Val Asp Val Glu Arg Asn Gly Gln Glu Thr Gly
420 425 430
Glu Ile Val Ile Arg Gly Asn Met Val Met Val Gly Tyr Tyr Asn Asp
435 440 445
Pro Ala Ala Thr Ser Lys Ala Val Met Lys Gly Trp Phe His Thr Gly
450 455 460
Asp Leu Ala Val Arg His Pro Gly Gly Glu Ile Gln Ile Leu Asp Arg
465 470 475 480
Gly Lys Asp Ile Ile Ile Ser Gly Gly Glu Asn Ile Ser Ser Leu Met
485 490 495
Val Glu Gln Glu Leu Ala Ser His Pro Ser Val Leu Glu Cys Cys Val
500 505 510
Ile Ala Arg Pro His Glu Lys Trp Gly Glu Arg Gly Gln Ser Phe Ile
515 520 525
Val Leu Thr Glu Gln Ala Lys Ala Lys Leu Asn Phe Ala Glu Ile Lys
530 535 540
Lys Lys Gly Ser Pro Glu Asn Lys Ala Phe Val Glu Glu Val Lys Lys
545 550 555 560
His Cys Val Glu Arg Met Ser Lys Phe Ala Val Pro Glu Trp Phe Asp
565 570 575
Val Val Asp Glu Leu Pro Lys Thr Ser Thr Gly Lys Val Gln Lys Asn
580 585 590
Val Leu Arg Ala Arg Phe Ala Thr Ser Thr Ala Ser Ile Gly Thr Met
595 600 605
Thr Ser Ile Leu Arg Asp Ile Leu Ser Thr Tyr Val Thr Gly Gly Lys
610 615 620
Asp Pro Phe Arg Asn Leu Ser Tyr Ala Ala Val Pro Leu Ser Leu Leu
625 630 635 640
Leu Ala Ala Leu Pro His Trp Tyr Thr Ile Tyr Leu Ala Glu Ser Asn
645 650 655
Lys Val Gln Gly Gly Trp Ser Asn Val Asn Pro Arg Phe Trp Val Gln
660 665 670
Thr Leu Thr Ala Lys Ala Leu Thr Lys Lys Leu Thr Pro Leu Glu Asn
675 680 685
Gln Ile Leu Arg Gly Gln Ser Cys Gln Ala Asn Ala Phe Glu Asn Val
690 695 700
Pro Leu Phe Ile Ala Thr Val Val Trp Ala Asn Val Ser Gly Leu Glu
705 710 715 720
Arg Glu Thr Ile Asn Asn Phe Val Val Gly Tyr Leu Pro Ser Ser Asn
725 730 735
His Thr Lys Val Arg Thr Phe Glu Tyr Lys Thr Ala Ile Arg Leu Cys
740 745 750
Thr Thr Ala Phe Glu Leu Arg Tyr Ile Phe Leu Leu Thr Arg Asn
755 760 765
<210> 6
<211> 3251
<212> DNA
<213> Pseudozyma tsukubaensis
<220>
<223> Pseudog4086.t1
<400> 6
atgccctaca caccaccacg ttcgtcgcag cctcctaaag gtttaccctt tgagctttcg 60
ctctcgacgc atcccggcgc gcagcacaac cgatcttcgc tcacacccgt gtcgttcctc 120
ttgcgtgccg cgctgattac gcctcgcaaa ttggcaatca ctcatcctga aaagggctac 180
tcattcacct acgagcaatg ggcagcacgt actctctcgc tcgcctttgc acttcgcagc 240
cttcccgcct tcaagattgg tgatcgcgtc gctgttatct cgcctaacgc acctctgatc 300
gcagacgctc actggggtat tcctgctgtt ggtggtatca ttacgccgat caacattcga 360
aacacgccca aggaggtcgc ttacgtcttg gagcactcgg gtagcactgt aatcttggtc 420
gaccacgagt ttacacacct cgtccccgag aaccctggcc caggcatcac cgtcatcgtc 480
agcaaagatt cgggaggaca agaagctgac gatccatacg agaaatttct cgatcgtggc 540
ttcctcgaat ggcagcgtgc tgagcaggct gagctcaaag cctacaagtc tcgcactcga 600
ccttctgctg aaccaaagac gggatggaaa ctcatcgagg cgcctcaaga cgaagaacaa 660
cccatcgccc tctgctacac ctcgggtact actggtcgac ccaaaggtgt gctcactaac 720
caccgtggag cctacctttc tgccgtagcc aacgcttttg aagcccacct cacgcaggat 780
agcgtctatc tttgggttct tcccatgttc catgcttgtg gatggacgta cccttgggct 840
gttactgctt ctctcgctac gcatttcacc attcgcaagg tcgacaacac cgttatctgg 900
gacgcgttgc tcaatcacgg cgtatcgcac tactgcggtg cccctacagt tcagatcggc 960
ctcgtcaacc atcctaacgc acgcaagctc aaccgtcgcg tgaacgttgc cgtcgcagct 1020
tccgcaccca ccgccaacct cctcgccaag atggagggtc taaacttgca cccagtccac 1080
gtatacggct tgaccgaaac atacggtcct ttcaccagga ggtacttcga gcccgaatgg 1140
gccaaactag atgttgatgc tcgagcacga atgatggctc gccaaggaca ctcctacctc 1200
acttcagatg aggtacgtgt cgttcgtact gcttcttcca ccgacgcctc tacacctgac 1260
ctcgtcgatg ttgagcgcaa cggtcaagaa acgggcgaaa tcgtcattcg aggaaacatg 1320
gtcatggtag gctactacaa cgatcccgcc gccacttcca aagccgtcat gaaaggctgg 1380
ttccacactg gcgacctagc cgtccgtcac cctggcggcg aaatccaaat cctagaccga 1440
ggtaaagaca tcatcatctc cggaggcgaa aacatctcct cgctcatggt tgaacaggaa 1500
cttgcctccc acccttccgt cctcgaatgc tgcgtcattg cacgaccgca cgaaaagtgg 1560
ggcgaacgcg gccagtcgtt tatcgtgctc acagaacagg cgaaagcgaa actcaacttc 1620
gcagagataa aaaagaaggg ttcaccggag aacaaggcgt ttgttgaaga ggtgaaaaag 1680
cactgcgtgg aaaggatgtc caaattcgcc gtaccggaat ggttcgacgt agtggacgaa 1740
ttgccaaaga caagcacggg caaggtgcag aagaacgtgc tccgagctag gttcgctagt 1800
aagttgtaaa agtagatcgt gtcgcgtgga atgagagcaa tggaagtgtc atctattctt 1860
ggtcgatgca acggtgcgat gtgtgtctct tggatgcgtc ggtaacgtgc ttttgacaac 1920
ttcgagaaga ttcacccgac gacagagggt aatgcactga caagcgcata gcacggaggg 1980
gcaaagagct gcctcaacag cccaatcctg tacgaccata cgagcaagag tgagacacgt 2040
cttcattgtt tgacacgaag aagtttacgg caaggaggta acttttttta cgccagagaa 2100
ggatggttcg tttggtggtg gagccgcgct tctccgcaca gcgagaagag gggcgtaggt 2160
gtgggggagg acagtccaag tccaagtcca aggtgtcgcg tgaaattgac cgattttggc 2220
aggttttgcg gctttgtgca gatcactttc aaaagccgcc gccgccgccg cctcctgcgc 2280
ccagaacatg tgtggagttt tcgtttttcg ctcgtgccac cttttccttc tctttgtgtc 2340
gtacattaca tccactcaac cttccttctc atccttccac ctttcgttct cttatttcta 2400
tccttctcac catcaccacc agcttccaca gcgtctatcg gaaccatgac ttccatcctg 2460
cgcgacatcc tttccaccta cgtcacaggt ggtaaagacc ccttccgcaa cctctcgtac 2520
gccgctgtac ccctctccct cctcctcgct gccctccctc actggtacac catctacctt 2580
gccgaatcga acaaagtcca aggaggatgg agcaacgtca acccccgctt ttgggtccaa 2640
actctcaccg ccaaggctct caccaagaag ttgaccccgc ttgaaaacca gattttgagg 2700
ggtcaaagtt gccaagccaa cgcgtttgag aacgtgccgc tgttcatcgc caccgttgta 2760
tgggcgaacg taagcggctt ggagagggaa acgattaaca actttgtagt gggatatctg 2820
gtaagcaggg ctgcgtacac ggtgttgtat ttgaagacgg aggggtatgc gaacagtttt 2880
gctaggacgg cggttttcca agtgggaatc atctggatta ttaccgtttg gatgaagggg 2940
gcttttaggg gtttgccgct cgtcaagtga gcgtatgatc gaggcgagag gagagggagc 3000
taggaaagaa ggattggcaa acccatagaa gcacagagtg gagagcgaac aaggggtcca 3060
cactcaagac gtaacgcccc gcgaatcagc cccacgcttc gctctcactc tcgttcccct 3120
cctcaaatct acactgacga tagccaagca gcaatcacac aaaagttcga acgttcgagt 3180
ataagacagc tatccgtttg tgcacaacag catttgagtt gcgatacatc tttctcttga 3240
caagaaacta a 3251
<210> 7
<211> 510
<212> PRT
<213> Pseudozyma tsukubaensis
<220>
<223> Pseudog4087.t1
<400> 7
Met Pro Lys Pro Gly Pro Ala Ser Arg Ser Ser Ile Ala Asn Leu Met
1 5 10 15
Arg Met Ser His Ala Gly Gly Cys Pro Cys His Gly Cys Ser Val Ala
20 25 30
Arg Gly Gly Ala Asn Leu Ala Arg Ala Gly Met Asn Met Ile Ala Lys
35 40 45
His Asn Ala Gln Pro Gly Ala Asn Ala Arg Gly Tyr Ala Thr Pro Val
50 55 60
Asp His Ala Val Glu Arg Glu Tyr Ala Phe Glu Leu Ala Ala Ser Asn
65 70 75 80
Ile Arg Tyr Gly Glu Gly Val Thr Lys Glu Val Gly Met Asp Phe Ala
85 90 95
Asn Met Lys Ala Arg Lys Val Gly Val Phe Thr Asp Pro Thr Val Arg
100 105 110
Asn Leu Thr Ala Met Lys Gln Ser Ile Asp Gly Leu Glu Lys Ala Gly
115 120 125
Val Lys Tyr Glu Ile Phe Asp Gln Val Arg Val Glu Pro Asn Glu Lys
130 135 140
Ser Trp Glu Ala Ala Ile Arg Phe Ala Arg Glu Gln Asp Phe Ser His
145 150 155 160
Phe Leu Ala Val Gly Gly Gly Ser Val Met Asp Thr Cys Lys Val Ala
165 170 175
Asn Leu Phe Ser Cys Tyr Pro Asp Ala Asp Leu Leu Glu Phe Val Asn
180 185 190
Ala Pro Ile Gly Arg Gly Thr Pro Ile Asp Lys Val Leu Lys Pro Leu
195 200 205
Leu Cys Val Pro Thr Thr Ala Gly Thr Gly Ser Glu Thr Thr Gly Thr
210 215 220
Ala Ile Phe Asp His Thr Ala Thr Glu Ser Lys Thr Gly Ile Ala Ser
225 230 235 240
Arg Ala Leu Arg Pro Leu Leu Gly Ile Val Asp Pro Leu Asn Thr Glu
245 250 255
Thr Cys Pro Thr Ala Val His Ile Ser Ser Gly Leu Asp Val Leu Phe
260 265 270
His Ala Leu Glu Ser Tyr Thr Ala Ile Pro Tyr Asn Glu Arg Met Pro
275 280 285
Arg Pro Ala Asn Pro Leu Gln Arg Pro Ala Tyr Gln Gly Arg Asn Pro
290 295 300
Ile Ser Asp Val Phe Ser Leu Trp Ala Leu Lys Gln Thr Val Lys Tyr
305 310 315 320
Leu Pro Arg Val Ala Lys Asp Lys Thr Asp Phe Glu Ala Arg Gly Gln
325 330 335
Met Leu Leu Ala Ser Thr Phe Ala Gly Ile Gly Phe Gly Asn Ala Gly
340 345 350
Val His Leu Cys His Gly Met Ser Tyr Pro Ile Ser Gly Leu Asn Lys
355 360 365
Lys Phe Gly Lys Tyr Gln His Pro Gly Tyr Glu Val Asp His Pro Ile
370 375 380
Val Pro His Gly Ile Ser Val Ala Leu Thr Gly Pro Ala Val Phe Asp
385 390 395 400
Phe Thr Ala Pro Ser Ala Pro Asp Arg His Arg Asp Val Ala Ala Ile
405 410 415
Phe Ala Gly Tyr Asp Ser Gly Ala Glu Ala Thr Asp Ile Ala Arg Leu
420 425 430
Pro Asp Ser Glu Val Gly Ala Leu Val Tyr Asp Arg Ile Ala Ser Phe
435 440 445
Leu Ala Asp Leu Gly Val Pro Arg Gly Leu Ala Lys Ile Gly Tyr Gly
450 455 460
Gln Glu His Val Glu Ala Leu Val Lys Gly Thr Ile Pro Gln Arg Arg
465 470 475 480
Val Leu Asp Leu Ala Pro Gly Ile Gly Asp Val Met Gly Ser Asp Gly
485 490 495
His Glu His Leu Ala Arg Ile Leu Glu Lys Ser Leu Ser Tyr
500 505 510
<210> 8
<211> 1533
<212> DNA
<213> Pseudozyma tsukubaensis
<220>
<223> Pseudog4087.t1
<400> 8
atgcccaaac caggcccagc ttcccgtagc tccatcgcca acctcatgcg catgtcgcat 60
gcaggtggat gcccctgtca cggatgctcg gttgctcggg gtggagccaa cctcgctcgt 120
gccggaatga acatgattgc caaacacaat gctcaacctg gtgccaacgc acgcggatac 180
gccactcccg tcgatcacgc cgttgaacgc gaatacgcct ttgaacttgc cgcttccaac 240
attaggtacg gtgaaggtgt caccaaggaa gtcggtatgg atttcgccaa tatgaaggcg 300
aggaaggtgg gtgttttcac cgatccaacg gtgaggaatc tgaccgcgat gaagcagagt 360
atcgatggac tagagaaggc tggggttaag tacgagatct ttgatcaggt cagggtggag 420
ccgaatgaga agagttggga ggcagcgatc aggttcgcac gtgaacagga cttctcccac 480
tttttggcgg tgggtggtgg atcggtaatg gatacgtgta aagtcgccaa ccttttcagc 540
tgctaccctg acgccgatct gctcgaattc gtcaacgctc ctatcggtcg tggtaccccc 600
atcgacaagg ttctcaagcc tctgctttgc gttcccacca ccgctggtac gggatccgaa 660
accaccggta cagccatctt tgatcatacc gctaccgagt ccaaaaccgg tattgcctcc 720
cgagcccttc gtcccctgtt gggtattgtt gatcctctca acaccgaaac ttgccctacc 780
gccgtccaca tcagttcggg attggatgtg ttgttccacg cactcgaatc gtacaccgcc 840
atcccgtaca acgaacgcat gcctcgcccc gcaaacccgc tccaacgtcc cgcttaccaa 900
ggacgtaacc ccatctcgga cgttttctcc ctctgggcgc tcaagcagac cgttaagtac 960
ctcccgcgcg ttgcgaagga caaaaccgac tttgaagccc gtggacagat gcttttggcc 1020
tccacgtttg ctggtattgg attcggtaat gctggcgtcc acctttgcca cggcatgagc 1080
taccctattt cggggttgaa caagaaattt ggtaaatacc agcacccggg gtacgaggtg 1140
gaccatccca tcgtacccca cggtatctcg gtcgctttga ctgggcctgc agtatttgac 1200
tttacggcgc cttcggcgcc cgaccgtcac cgtgacgtag cagctatttt tgcgggttac 1260
gacagcggtg cggaggctac ggatatcgct cgtctgcccg actccgaggt tggtgcactt 1320
gtgtacgata ggatcgcgtc cttcttggcc gacttgggcg tgccgagggg tctggctaag 1380
atcgggtacg ggcaggaaca tgtggaggcc ctcgtaaaag gaaccattcc acagaggagg 1440
gtgttggatt tggctccggg tatcggtgac gtgatgggca gcgatggcca cgaacacttg 1500
gctaggattc tggagaagag tctgtcttac taa 1533
<210> 9
<211> 513
<212> PRT
<213> Pseudozyma tsukubaensis
<220>
<223> Pseudog4088.t1
<400> 9
Met Lys Ser Glu Ala Ser Ser Ser Ala Leu Val Leu Ala Leu Thr Leu
1 5 10 15
Leu Ala Ser Ala Ser Thr Val Ile Ala Glu Pro Ser Ser His Ala Ser
20 25 30
Tyr Arg Pro Ser Lys Leu His Asn Arg Arg Gln Ser Ser Pro Asn Pro
35 40 45
Asn Gly Ser Thr Ala Ser Gln Glu Ala Ile Tyr Gln Gln Ala Phe Thr
50 55 60
Asp Pro Val Ala Ala Ala Lys Ala Ala Asn Ala Leu Pro Tyr Ile Ala
65 70 75 80
Gly Gln Tyr Ala Thr Gly Gly Leu Tyr Arg Tyr Asn Ile Val Pro Asp
85 90 95
Asn Thr Gln Leu Pro Trp Asn Ala Asn Val Pro Phe Thr Pro Glu Ala
100 105 110
Ala Val Asn Gly Ser Val Asp Gly Gly Trp Gln Ala Leu Pro Glu Ile
115 120 125
Gln Gly Met Thr Leu Asn Arg Thr Phe Ala Val Ala Pro Gly Ala Val
130 135 140
Met Pro Phe Tyr Gln Thr Gln Gly Phe Asp Ala Thr Lys Ile Lys Arg
145 150 155 160
Ala Val Met Ile Met Pro Gly Lys Pro Arg Asp Cys Trp Lys Tyr Thr
165 170 175
Ser Leu Ile Gln Asn Ala Leu Asn Val Phe Glu Thr Asn Pro Gln Ser
180 185 190
Ala Gly Ser Ser Ala Asp Gly Ser Thr Thr Gly Asp Asp Ser Gly Arg
195 200 205
Leu Gly Lys Asp Gln Val Leu Ile Leu Gly Pro Cys Trp Met Asn Ser
210 215 220
Asp Asp Ala Lys Ala Gly Ala Ile Gln Ser Gly Glu Leu Tyr Trp His
225 230 235 240
Gly Ser Gln Trp Gln Ser Gly Met Ala Ser Arg Gly Pro Gly Asn Thr
245 250 255
Ala Ile Ser Ser Tyr Gln Val Met Asp Ser Phe Met Asp Ala Leu Phe
260 265 270
Asp Lys Thr Thr Phe Pro Ala Leu Asn Thr Val Val Met Ala Gly His
275 280 285
Ser Met Gly Ala Gln Met Val Gln Arg Tyr Ser Val Val Lys Lys Pro
290 295 300
Asp Ala Tyr Asp Ser Asn Ile Ile Phe Trp Val Gly Asn Pro Gly Ser
305 310 315 320
Tyr Val Trp Leu Thr Ser Ser Arg Pro Asn Asn Ser Asn Thr Ser Cys
325 330 335
Ala Ser Thr Ala Asp Asp Trp Ala Tyr Gly Leu Asp Gly Ser Gly Val
340 345 350
Pro Asn Tyr Ala Arg Asp Arg Val Lys Asn Asn Lys Gln Gln Leu Leu
355 360 365
Thr Thr Phe Glu Ser Arg Asn Val His Tyr Asn Tyr Gly Leu Leu Asp
370 375 380
Asn Gly Gln Gly Asp Thr Ala Cys Glu Ala Ser Leu Gln Gly Ala Asn
385 390 395 400
His Leu Glu Arg Gly Cys His Phe Val Glu Ser Leu Ala Ser Leu Thr
405 410 415
Gly Asn Gly Lys Leu Pro Val Thr Gln Thr Ala Asn Phe Met Pro Asn
420 425 430
Val Ser His Glu Asp Tyr Ala Met Leu Ser Tyr Asn Ile Ser Leu Tyr
435 440 445
Arg Leu Phe Gln Glu Met Pro Thr Gly Ala Ala Asn Val Thr Ala Ala
450 455 460
Asn Asn Gly Ser Ser Ala Ser Ser Thr Ala Lys Lys Gly Gly Ser Gly
465 470 475 480
Ser Ser Ala Gly Ser Lys Ser Ser Ala Ser Ser Met Val Thr Gly Gly
485 490 495
Val Val Thr Leu Gly Ala Gly Ala Val Leu Ala Phe Ala Leu Ser Leu
500 505 510
Leu
<210> 10
<211> 1542
<212> DNA
<213> Pseudozyma tsukubaensis
<220>
<223> Pseudog4088.t1
<400> 10
atgaagtcgg aagcatcctc atcagccttg gtgctggctc tcaccttgct cgcctctgcc 60
tcgaccgtca tcgccgaacc ttcctctcac gcctcgtatc gaccttccaa gctccataac 120
cgcagacaat catccccaaa ccctaacggc agcaccgctt ctcaagaagc catctatcaa 180
caagctttca ccgatcctgt tgctgctgcc aaagctgcca atgcactccc ctacatcgca 240
ggccaatacg ctaccggagg tctttaccgc tacaacattg tcccggacaa tacgcagctt 300
ccttggaacg ccaatgtgcc tttcactcct gaagccgcag tcaacggaag cgtcgatgga 360
ggctggcaag cattacccga gatccaaggt atgacgctca accgcacctt tgctgttgca 420
cctggagctg tgatgccttt ctaccagacc caaggatttg acgctaccaa gatcaagaga 480
gctgttatga tcatgccagg caaaccaaga gattgctgga agtacacttc gctcatccag 540
aacgcgttga atgtgttcga gaccaacccg cagagcgctg gtagcagtgc ggacggatcg 600
actacaggcg atgacagtgg aagacttgga aaagatcaag tgctgatctt gggtccctgc 660
tggatgaatt ccgatgatgc caaagcgggc gccatccagt ctggcgaact gtactggcac 720
ggatcgcagt ggcaatcggg tatggcttcg cgaggacccg gcaacaccgc catctcgtct 780
tatcaggtta tggactcctt catggatgca ctcttcgaca aaaccacctt ccccgccctc 840
aacaccgtcg tcatggccgg tcactcgatg ggcgcccaaa tggtccaacg ctactctgtc 900
gtcaagaaac ccgacgccta cgactccaac atcatctttt gggtcggcaa ccccggcagt 960
tacgtctggc tcacctcctc tcgtcccaac aactccaaca ccagctgcgc ctccaccgca 1020
gacgactggg cgtacggcct cgatggctcc ggcgtcccca actacgctcg cgaccgtgtc 1080
aagaacaaca aacagcaact cctgaccacg ttcgaatcgc gtaacgtcca ctacaactac 1140
ggcctcctcg acaacggtca aggcgatacc gcatgcgaag cttctctgca aggcgcaaac 1200
cacctcgaaa gaggatgtca ctttgttgaa tcgctcgcca gtttgacggg gaatgggaag 1260
ctgcccgtga cgcagacggc taactttatg cccaatgttt cgcacgagga ttacgccatg 1320
ttgtcgtaca acatttcgct gtatagattg ttccaggaga tgccgacggg tgctgcgaac 1380
gtgacggcgg cgaacaatgg gagcagtgcg agcagtacgg cgaagaaggg tggtagtgga 1440
agcagtgctg ggtcgaagag ttcggcatcg tccatggtca cgggtggggt tgtgactcta 1500
ggagcaggag cggtgcttgc tttcgccttg agcttgcttt ga 1542
<210> 11
<211> 283
<212> PRT
<213> Pseudozyma tsukubaensis
<220>
<223> Pseudog4089.t1
<400> 11
Met Ser Lys Leu Thr Leu Gln Ser Thr Tyr Ser Leu Gly Asp Gly Val
1 5 10 15
Asp Met Pro Val Leu Gly Phe Gly Val Tyr Leu Ser Pro Ser Asp Val
20 25 30
Cys Val Asn Ser Val Thr Thr Ala Leu Lys Thr Gly Tyr Arg His Ile
35 40 45
Asp Ser Ala Gln Tyr Tyr Glu Asn Glu Lys Glu Val Gly Asp Ala Val
50 55 60
Arg Gln Trp Cys Lys Glu Glu Gln Val Ser Arg Arg Gly Ile Phe Val
65 70 75 80
Thr Thr Lys Val Ile Phe Pro Ser Lys Thr Lys Glu Glu Thr Leu Glu
85 90 95
Ser Leu Arg Glu Ser Val Lys Lys Ile Asn Leu Asp Gly Tyr Val Asp
100 105 110
Cys Phe Leu Ile His Thr Pro Thr Ser Gly Pro Glu Gly Arg Lys His
115 120 125
Leu Trp Glu Ala Leu Lys Glu Leu Gln Ser Glu Gly Lys Val Val Thr
130 135 140
Ile Gly Val Ser Asn Tyr Gly Leu Lys His Leu Gln Glu Leu Ile Asp
145 150 155 160
Ala Gly Glu Thr Pro Ala Val Asn Gln Ile Glu Leu His Pro Trp Cys
165 170 175
Gln Gln Arg Pro Ile Val Glu Leu Cys Lys Lys His Asn Ile Val Leu
180 185 190
Gln Ala Tyr Cys Pro Ile Val Arg Gly Glu His Lys Asp Asp Glu Glu
195 200 205
Leu Leu Lys Ile Ala Ala Lys His Lys Val Asp Trp Ser Gln Val Leu
210 215 220
Ile Arg Trp Ser Leu Gln Lys Gly Phe Val Pro Leu Pro Lys Ser Asp
225 230 235 240
Thr Pro Ser Arg Ile Ala Ser Asn Ala Asp Val Phe Asn Phe Glu Leu
245 250 255
Asp Asp Glu Asp Met Ala Thr Leu Asp Ala Lys Asp Gln Gly Ala Lys
260 265 270
Gly Ala Val Ala Pro Asn Pro Val Asp Cys Glu
275 280
<210> 12
<211> 1309
<212> DNA
<213> Pseudozyma tsukubaensis
<220>
<223> Pseudog4089.t1
<400> 12
atgtcgaagc ttactctgca gtcaacttac tcgctcggcg atggcgtcga tatgcccgtt 60
ttgggtttcg gcgtctacct gagtccttcg gatgtttgcg tcaactcggt aactaccgct 120
ctcaagactg gatacaggca cattgactcg gcgcagtact atgagaatga gaaggagtga 180
gtgcggccct tcccgctttt ccagctgact tagaggaaag gaaagacgat gctgacggtt 240
ttgctcttga ctcttttcgc attggtgcta tcttagagtc ggcgacgccg ttcgacagtg 300
gtgcaaggag gagcaggtct cgcgtcgtgg tatctttgtg acgaccaagg tgatcttccc 360
ttccaagacg aaagaggaga cgctcgagtc gttgcgcgag tcggtgaaga agattaacct 420
cgatggtaag tctccctcct taacctttcc agattcgatg atagatgcaa tgctgatcaa 480
caaacgagta actctggaac cacaggctac gtcgactgct tcctcatcca cacgcctact 540
tcgggtcccg agggacgcaa gcacctctgg gaagcgctca aggagttgca gtccgaaggc 600
aaagttgtta ctatcggcgt tagcaactag tgagtagctc ccatcaattg tcattggcta 660
caaggcttag gtgatgctga ccagaatcct tcttcctttg catggatccc aacagcggtc 720
tcaagcacct ccaagaactc atcgacgccg gcgagacacc cgctgtcaac cagatcgaac 780
ttcatccttg gtgccagcag cgtccgatcg ttgagctttg caagaagcac aacattgttc 840
tccaggctta ctgcgtatgt tactctccct ctctcccact cttccctttc attgtaatct 900
gtgcgaggga agacaactga cattctgtgc atttctttga tgtgtattgc agccaatcgt 960
tcgaggcgag cacaaggacg acgaagaact cctcaagatc gctgccaagc acaaggtgga 1020
ctggtcgcaa gtgttgatcc gatggtcgtt gcagaaaggg tgagttcagc ggtgtcctgc 1080
ttcattctct caagctctct ttttatctga gtactgacct ctttgctgtg cacacatcgt 1140
ttgtcctaac agcttcgtcc ctcttcccaa gtcggacaca ccttcgcgta tcgcctccaa 1200
cgccgacgtc ttcaactttg agctcgacga cgaagacatg gctaccctcg acgctaagga 1260
tcagggcgct aaaggtgccg ttgctcctaa ccctgttgac tgcgagtga 1309
<210> 13
<211> 428
<212> PRT
<213> Pseudozyma tsukubaensis
<220>
<223> Pseudog4090.t1
<400> 13
Met Pro Ser Ile Pro Lys Pro Pro Ser Leu Thr Leu Leu Phe Ala Ser
1 5 10 15
Leu Phe Thr Leu Leu Leu Thr Gln Asn Ala Tyr Arg Ala Gln Ala Asp
20 25 30
Thr Val Val Gln Asp Pro Leu Gln Ala Gln Ala Asn Ser Phe Gly Trp
35 40 45
Leu Ala Ile Arg Asn Phe Thr Tyr Cys Met Gly Asp Ser Pro Asp Pro
50 55 60
Pro Thr Lys Pro Arg Gly Ile Gln Pro Lys Gly Lys Asn Thr Ile Asn
65 70 75 80
Ala Asp Asp Ala Ser Lys Lys Arg Leu Thr Gly Met Gly Asp Ser Val
85 90 95
Val Val Leu Tyr His Pro Glu Asn Thr Asn Lys Ala Ile Ala Trp Cys
100 105 110
Asn Thr Leu Val Ala Phe Gln Ser Thr Glu His Val Gln Cys His Thr
115 120 125
Ala Leu Pro Thr Cys Gln Arg Cys Asp Ala Val Arg Glu Lys Asn Gly
130 135 140
Val Lys Ser Met Ser Leu Gly Gly Val His Ala Gly Lys Gly Lys Ala
145 150 155 160
Pro Ser Gly Lys Leu Gly Arg Lys Lys His Lys Lys Met His Lys Lys
165 170 175
Met Glu Ser Ile Gly Leu Glu Gly Glu Asp Ala Gly Leu Val Ala Leu
180 185 190
Gln Lys Arg Asp Glu Ser Lys Gln Gln Glu Gly Thr Lys Thr Gly Ser
195 200 205
Gly Thr Thr Thr Ala Asn Asp Ala Gly Gln Arg Gly Gly Ala Asp Pro
210 215 220
Asn Asp Pro Trp Ile Pro Gly Pro Asp Ser Glu Thr Lys Pro Asp Ile
225 230 235 240
Asn Pro Val Ala Ser Thr His Gly Thr Thr Pro Arg Pro Leu Gly Ser
245 250 255
Thr Thr Thr Thr Thr Ala Asp Asn Pro Pro Asp Asn Thr Phe Ser Glu
260 265 270
Asp Pro Glu Leu Glu Ala Ala Ile Ser Glu Phe Gln Asp Tyr Cys Glu
275 280 285
Asn Lys Leu Thr Leu Ala Val Arg Ala Asp Cys Pro Leu His Leu Val
290 295 300
Lys Gly Trp Leu Asp Glu Pro Pro Phe Asp Leu His Arg Phe Cys Met
305 310 315 320
Ala Leu Lys Gly Ser Asp Gly Tyr Thr Leu His Thr Val Pro Ala Pro
325 330 335
Asp Leu Asp Asp Gly Gly Lys Ala Gly Gly Asn Asp Gly Ala Gly Lys
340 345 350
Asn Gly Ala Ala Thr Lys Gly Lys Pro Ala Ala Val Gln Gly Gly Thr
355 360 365
Ser Gly Gly Ala Gln Thr Gly Gly Arg Gly Asp Gly Glu Thr Ala Thr
370 375 380
Gly Gly Gly Gly Gly Gln Phe Asp Pro Asn Asp Pro Leu Val Pro Leu
385 390 395 400
Pro Asp Gly Gly Leu Thr Thr Thr Pro Pro Pro Thr Gln Pro Gln Pro
405 410 415
Lys Val Glu Ala Lys Pro Glu Lys Pro Lys Gln Ala
420 425
<210> 14
<211> 1287
<212> DNA
<213> Pseudozyma tsukubaensis
<220>
<223> Pseudog4090.t1
<400> 14
atgccatcca tacccaaacc gccctcgcta accctcctct tcgcctccct tttcaccctc 60
cttctcaccc aaaacgccta tcgcgcacaa gcagacaccg tcgtccaaga ccccctccaa 120
gcgcaagcca acagtttcgg ttggctcgcc attcgcaact tcacctattg tatgggtgac 180
tcgcccgatc cacccacaaa gccacgcgga atccaaccca agggcaagaa tacgatcaat 240
gccgacgatg caagtaagaa gcgcttaacg ggtatgggag atagcgtggt tgtgctctac 300
catccggaga atacgaataa ggcgatcgct tggtgtaaca cgctggtggc gtttcagagt 360
acggagcatg tccagtgtca cacggcgcta cctacgtgtc agaggtgtga tgctgtgagg 420
gagaagaacg gggtcaaaag tatgagcttg ggaggtgtgc atgcgggtaa gggtaaggcg 480
ccaagtggga agttaggtag aaagaagcat aagaagatgc ataagaagat ggagtcgata 540
gggctcgaag gggaagatgc agggttggtg gctttacaga agcgtgacga aagtaagcaa 600
caagaaggta cgaagactgg atcaggaacg accacggcta acgacgctgg tcagagaggc 660
ggcgcggatc ccaatgatcc ttggatccct ggtcccgact ccgaaacgaa gccagacatc 720
aaccctgtcg catcgactca cggtactaca cctcgtccgt tgggctctac caccaccaca 780
actgccgata atcctcccga taacaccttt tccgaagacc ccgaactcga agctgcgatc 840
tcagaattcc aagactactg cgaaaacaag ctcactctcg cagtccgcgc cgattgcccc 900
ctacacctcg tcaaaggttg gctagacgaa cctcccttcg acttgcatcg cttctgtatg 960
gcgttgaagg gaagcgacgg gtacacgctg catacggtcc cggcccctga tctggacgac 1020
ggcggcaagg cgggagggaa cgatggcgcg ggcaagaatg gggctgcaac caagggaaag 1080
ccggcggccg tccaaggagg tactagcgga ggagcacaaa caggaggccg cggtgacggt 1140
gagacagcaa caggaggtgg tggtggacaa ttcgacccga acgatccgtt ggtaccttta 1200
cctgatggtg ggctgacaac gacgccaccg ccaacacagc cgcagcccaa ggttgaagcg 1260
aagccggaga agccaaagca ggcttga 1287
<210> 15
<211> 280
<212> PRT
<213> Pseudozyma tsukubaensis
<220>
<223> Pseudog4091.t1
<400> 15
Met Ala Ser Thr Asp Val Ala Cys Glu Lys Thr Pro Ser Ser Ser Ala
1 5 10 15
Leu Gly Leu Phe Asn Leu Ser Gly Lys Thr Ala Leu Leu Thr Gly Gly
20 25 30
Thr Arg Gly Ile Gly Gln Ala Cys Ala Val Ala Leu Ala Glu Ala Gly
35 40 45
Ala Ser Val Ile Leu Ala Val Arg Pro Gly Thr Ala Pro Gly Ala Asp
50 55 60
Gly Asn His Pro Ala Leu Ser Pro Leu Leu Ala Val Ser Asp Gln Thr
65 70 75 80
Ser Ser Gln Lys His Ser Thr Val Glu Ala Asp Leu Ser Asp Leu Ser
85 90 95
Ser Val Lys Ser Leu Phe Asp Arg Ala Leu Pro Leu Ser Pro Ser Gly
100 105 110
Gly Ile Asp Ile Leu Val Asn Cys Gly Gly Ile Gln Arg Arg His Pro
115 120 125
Ser Thr Asp Phe Pro Glu Ser Asp Trp Asp Glu Val Leu Asn Val Asn
130 135 140
Leu Lys Ala Val Trp Leu Leu Ser Gln Ala Ala Gly Arg His Met Ile
145 150 155 160
Pro Arg Arg Ser Gly Lys Ile Ile Asn Phe Gly Ser Leu Leu Thr Phe
165 170 175
Gln Gly Gly Leu Thr Val Pro Ala Tyr Ala Ser Ala Lys Gly Ala Val
180 185 190
Gly Gln Leu Thr Lys Ala Leu Ser Asn Glu Trp Ala Lys His Asn Val
195 200 205
Gln Val Asn Gly Ile Ala Pro Gly Tyr Ile Ala Thr Asp Met Asn Glu
210 215 220
Lys Leu Leu Ala Asp Pro Thr Arg Leu Arg Gln Ile Ser Glu Arg Ile
225 230 235 240
Pro Ala Gly Arg Trp Gly Glu Ala Ala Asp Phe Lys Gly Pro Leu Leu
245 250 255
Phe Leu Ala Ser Gln Ala Ser Gln Tyr Val Ser Gly Glu Met Leu Val
260 265 270
Val Asp Gly Gly Trp Met Gly Arg
275 280
<210> 16
<211> 843
<212> DNA
<213> Pseudozyma tsukubaensis
<220>
<223> Pseudog4091.t1
<400> 16
atggcatcca ccgacgtagc ctgcgaaaag accccctcgt cctccgcttt gggacttttc 60
aacctctctg gcaagaccgc attgttgacc ggtggtacta gaggtattgg tcaagcatgt 120
gccgttgcac ttgctgaagc tggtgcatcg gtcatcctgg ccgttagacc aggtaccgct 180
cctggcgctg atggcaacca ccctgccctc tcccccttgc ttgctgtttc cgaccagact 240
tcctcgcaga agcactcgac cgtcgaagcc gacctctccg atctctcctc ggtcaagtct 300
ctcttcgacc gcgcgcttcc cctctcccct tcaggcggca tcgacatcct cgtcaactgt 360
ggaggcatcc aacgccgtca cccatccacc gacttccccg aatccgattg ggacgaagtt 420
ctcaacgtca acctcaaagc tgtctggctt ctctcccaag ctgctggtcg ccacatgatc 480
ccccgccgct ccggcaagat catcaacttt ggttcgctgc ttacattcca aggtggcctc 540
acggtcccag cttacgccag cgcaaaggga gccgtaggcc aactcacgaa ggcacttagc 600
aacgaatggg caaaacacaa cgttcaagtc aacggaattg ctcccggcta catcgcgacc 660
gacatgaacg aaaaattgct tgccgaccca acgaggttga ggcagatcag cgagaggatt 720
cctgcgggta ggtggggtga ggccgctgat tttaagggcc cattgctgtt tttggccagt 780
caagcgagtc agtatgtcag tggtgaaatg ttggttgttg acggtggatg gatgggtcgt 840
taa 843
<210> 17
<211> 247
<212> PRT
<213> Pseudozyma tsukubaensis
<220>
<223> Pseudog4092.t1
<400> 17
Met Arg Met Leu Ile Val Gly Ser Pro Gly Ser Gly Lys Gly Thr Gln
1 5 10 15
Ser Thr Arg Leu Leu Lys His Tyr Ser Phe Ser Val Leu Ser Ala Gly
20 25 30
Asp Val Leu Arg Ser His Ile Gln Arg Gly Thr Glu Ile Gly Gln Arg
35 40 45
Ala Asp Ala Val Ile Lys Gln Gly Gly Leu Met Pro Asp Gln Val Met
50 55 60
Met Asp Leu Val Gly Ala Glu Val Lys Thr Leu Ala Gly Ser Asp Trp
65 70 75 80
Leu Leu Asp Gly Phe Pro Arg Thr Leu Gly Gln Ala Glu Met Leu Asp
85 90 95
Glu Met Leu Glu Asp Gln Glu Lys Gly Leu Arg Leu Val Val Asn Leu
100 105 110
Asp Val Pro Glu Glu Val Ile Leu Asp Arg Ile Leu Gln Arg Trp Thr
115 120 125
His Leu Pro Ser Gly Arg Val Tyr Asn Leu Ser Phe Asn Pro Pro Lys
130 135 140
Val Glu Gly Lys Asp Asp Ile Thr Gly Glu Pro Leu Val Lys Arg Glu
145 150 155 160
Asp Asp Asn Val Glu Thr Phe Gly Lys Arg Leu Lys Thr Phe Tyr Ala
165 170 175
Gln Thr Glu Pro Met Leu Asp His Tyr Arg Arg Lys Ser Gly Ser Ile
180 185 190
Thr Glu Ile Asp Cys Arg Thr Glu Thr Asn Ala Asp Leu Ala Ala Ser
195 200 205
Gly Lys Lys Asp Leu Phe Val Asn Leu Lys Gly Glu Thr Ser Lys Gln
210 215 220
Ile Trp Pro His Leu Val Lys Ile Val His Glu Arg Phe Pro Asn Leu
225 230 235 240
Lys Ala Ala Ala Ala Ala Gln
245
<210> 18
<211> 944
<212> DNA
<213> Pseudozyma tsukubaensis
<220>
<223> Pseudog4092.t1
<400> 18
atgcgaatgc tcatcgttgg ctctccagga tcaggcaaag gcactcaatc gacacgcctc 60
ctgaaacact actctttttc ggtcctctcc gcaggcgacg tactgcgatc gcacatccaa 120
cgtggaaccg aaataggcca acgcgcagat gcagtcatca agcaaggcgg attgatgccg 180
gatcaggtca tgatggatct cgtaggagct gaagtcaaaa cattagcggg gagcgactgg 240
ctgctggatg gattcccgag aacactgggg caagcagaaa tgttggatga gatgttggag 300
gaccaagaga aagggttgag gttggtggtg aatctggatg tgcctgaaga ggtgattttg 360
gataggatct tgcgtgagtc acaaacccca tcaaaccgca atcagatcga gtgcgagctt 420
atacactgac ccgacatcga tgactgtact tgttcctggc gaacaacaga acgatggacg 480
cacttaccct caggacgagt ctacaacctc tccttcaacc ctcccaaagt cgaaggcaaa 540
gacgacataa ccggagaacc actggtcaag agggaagatg acaacgtcgt acgtatcccc 600
tcctttcccc ttccccgcct gctgtttcat ttatcttaca ctctctaact cctcctcatc 660
cccgtcatca tgctacgccg ttgctactgc aggaaacctt cggcaaacgc ctcaaaacat 720
tctacgcaca aaccgaaccc atgctcgacc actaccgtcg caaaagcggc tccatcaccg 780
agatcgattg ccgtaccgaa acaaacgctg atctcgcagc atcaggcaag aaggatctat 840
ttgtcaactt gaagggcgaa acttcgaaac agatctggcc gcacttggtc aaaattgtac 900
acgagcgatt tcccaaccta aaggcagcag cggcggcgca gtga 944
<210> 19
<211> 975
<212> PRT
<213> Pseudozyma tsukubaensis
<220>
<223> Pseudog4093.t1
<400> 19
Met Ala Asp His Glu Thr Ser Val Ser Pro Ala Glu Arg Pro Ala Leu
1 5 10 15
Leu Pro Ala Ala Ser Ser Leu Gln Pro Thr His Ile Thr Ser His Leu
20 25 30
Pro Pro Leu Lys Ser Leu Gln Ser His Asn His Ser Ala Ser Arg Asp
35 40 45
Arg Ser Pro Phe Arg Arg Arg Lys Asp Ile Thr Pro Pro Ser Glu Lys
50 55 60
Pro Pro Ala Gln Pro Ala Tyr Lys His Arg Gly Leu Pro Asn Thr Asn
65 70 75 80
Thr Leu Gln Thr Phe Leu Thr Val Thr Asp Val Pro His Phe Gly His
85 90 95
Ala Val His Tyr Asn Thr His His His Phe His Arg His Asp Ser Gly
100 105 110
Asp Gly Pro Ala His Ser Ala Asp Leu Gly His Gly Trp Arg Val Arg
115 120 125
Lys Thr Pro Ile Phe Ser Gly Leu Leu Ala Pro Phe Ser Ile Val Leu
130 135 140
Glu Val Pro Gly Leu Thr Ser Lys Trp Tyr Ala Lys Ile Asp Ala Asp
145 150 155 160
Gly Ile Val Glu Arg Tyr Ile Asp Asn Pro Pro Ile Leu Thr Val Gly
165 170 175
Leu Ala Ile Ser Leu Ser Ala Ala Val Val Ala Asn Ala Ala Ile Ile
180 185 190
Phe Arg Phe Leu Glu Phe Leu Lys Pro Arg Ala Ser Ile Ala Leu Ala
195 200 205
Ile Ala Gly Phe Ala Leu His Asp Ile Ile Asn Val Val Ala Leu Ala
210 215 220
Val Phe Gly Gly Ile Tyr Gly Pro Lys His Asp Gly Leu Ser Leu Ser
225 230 235 240
Ala Ser Tyr Trp Met Val Cys Ala Ser Thr Ile Thr Ser Thr Ile Val
245 250 255
Thr Ile Ser Leu Val Ala Asp Tyr Val Arg Thr Lys Asp Phe Lys His
260 265 270
Ala Gly Ser Gly Leu Thr Gln Leu Gln Lys Gly Leu Val Leu Ala Gly
275 280 285
Met Gly Leu Leu Leu Tyr Leu Ser Leu Gly Ser Leu Ile Phe Val Tyr
290 295 300
Leu Ile Lys Ile Asp Phe Ile Thr Ala Leu Tyr Phe Ser Thr Ala Thr
305 310 315 320
Val Leu Thr Val Gly Phe Gly Asp Val Val Pro Thr Ser Pro Gly Gly
325 330 335
Lys Val Leu Val Ile Leu Tyr Ala Pro Ile Gly Ile Ile Leu Val Ala
340 345 350
Leu Val Val Ser Ser Ala Arg Ser Thr Ile Leu Glu Thr Phe Gln Ala
355 360 365
Ala Leu Ile Ala Arg Thr Lys Glu Arg Arg Arg Arg Ile Ala Glu Arg
370 375 380
Lys Ala Ala Val Lys Glu His Lys Arg Gln Asp Arg Ala Ile Arg Arg
385 390 395 400
Ile Met Pro Arg Thr Phe Thr Phe Gly Pro Asn Ser Asn Ala Val Ser
405 410 415
Asn Ser Pro Asp Asp Asp Ser Asn Asn Asn Glu Phe Ala Glu Ala Leu
420 425 430
Ala Gln Met Glu Lys Gln Ala Ala Ala Gly Gly Ala Pro Pro Ala Asp
435 440 445
Asn Val Ala Ser Ser Ile Thr Thr Thr Ala Ala Ser Ser Gly Asn Ala
450 455 460
Ala Ser Asn Asp Glu Pro Lys Leu Ala Glu Ala Glu Lys Pro Ala Thr
465 470 475 480
Ala Thr Val Gly Asp Pro Ala Leu Gln His Gln Ile His Ala Leu Gln
485 490 495
Thr Glu Leu Leu Ala Ala Lys Lys Arg Thr Glu Gln Asp Phe Leu Thr
500 505 510
Tyr Glu Glu His Ala Arg His Glu Ala Ile Met Ala Ala Arg Met Lys
515 520 525
Leu Val Leu Ala Ala Ser Val Thr Ala Ala Phe Trp Leu Leu Gly Ala
530 535 540
Val Ala Phe Thr Tyr Ala Glu Arg Trp Ser Tyr Gly Gly Ala Met Trp
545 550 555 560
Phe Cys Phe Ile Ala Met Ile Thr Ile Gly Tyr Gly Asp Tyr His Pro
565 570 575
Thr Thr Gln Ile Gly Arg Ala Ile Phe Val Ile Trp Gly Leu Met Gly
580 585 590
Val Ala Val Leu Thr Ile Leu Leu Ala Val Val Gln Asp Ala Phe Gly
595 600 605
Gly Val Leu His Arg Met Leu Thr Gln Ser Thr Ser Arg Leu Phe Asp
610 615 620
Arg Ala Glu Glu Arg Ala Arg Lys Arg Arg Leu Lys Lys Glu Gln Met
625 630 635 640
Gln Arg Glu Gln Arg Gln Ala Asp Ala Glu Glu Glu Gly Glu Asp Val
645 650 655
Glu Thr Arg Gly Ala Thr Ala Gly Ala Ser Ala Met Arg Lys Arg Arg
660 665 670
Arg Ser Arg Thr Arg Ser His Arg Lys Ser Glu Ser Asp Val Lys Arg
675 680 685
Glu Lys Phe Lys Met Val Glu Ala Gly Ser Asn Asp Thr Gly Glu Arg
690 695 700
Thr Lys Val Glu Arg Lys Ser Met Glu Ala Thr Phe Ala Arg Asp Arg
705 710 715 720
His Thr Ser Ser Pro Glu Pro Leu Glu Glu Leu Glu Arg Asp Leu Asp
725 730 735
Thr Pro Asp Gly Val Pro Leu Ala Ile Pro Ser Phe Ile Leu Lys Asn
740 745 750
Ala Ser Gly Val Thr Asp Ser Gly Leu Ile Thr Ala Glu Val Gln Leu
755 760 765
Pro Val Gly Ala Ala Ala Arg Val Glu Asp Thr Leu Val Ser Ala Pro
770 775 780
Gln Lys Leu Ala Leu Ala Ala Leu Leu Thr Phe Gln His Ser Val Arg
785 790 795 800
Val Leu Arg Leu His Asp Thr Ala Ile Ser Ala Ala Met Thr Asp Val
805 810 815
Pro Ala Leu Arg His Tyr Tyr Asn Ser Arg Gln Lys Ser Ser Ser Leu
820 825 830
Ser Gly Thr Asp Leu Ala Pro Gln Asp Ser Ser Glu Gly Thr Ser Lys
835 840 845
Ser Lys Asp Gly Glu Glu Thr Asp Pro Glu Thr Ala Leu Gln Asn Leu
850 855 860
His Ala Ala Ile Gln Gln Ile Ala Asn Pro Glu Tyr Glu Lys Val Ala
865 870 875 880
Lys Leu Val Val Ala Asn Leu Glu Phe Glu His His Leu Lys Val Phe
885 890 895
Leu Glu Gln Phe Gln Gly Leu Lys Asp Arg Val Glu Gly Phe Lys Gln
900 905 910
Arg Thr Thr Glu Met Arg Arg Arg Arg Gly Gln Thr Val Gly Glu Ala
915 920 925
Asp Gly Glu Glu His His Pro Thr Leu Ala His Leu Phe His Pro His
930 935 940
Glu His Glu His Glu His Gln Gln Gly His Glu His Glu His Gln Gln
945 950 955 960
Pro Tyr Gly Arg Asn Gln Glu Pro Glu Gly Pro Ala Pro Ser Glu
965 970 975
<210> 20
<211> 2928
<212> DNA
<213> Pseudozyma tsukubaensis
<220>
<223> Pseudog4093.t1
<400> 20
atggccgacc acgaaacatc tgtgtcgcct gctgagcgac cggctttgtt gccagctgcc 60
tcgtcgttgc aacccacgca tatcacctcg catcttccac cactcaagtc gttgcaaagt 120
cacaatcact ctgcaagtcg tgacaggtcg ccgtttcgac gtcgaaaaga cattacacca 180
ccgtcagaga aaccacctgc acagcccgca tacaaacata gaggtctacc caacacaaac 240
actcttcaga ctttcctcac tgtcactgac gtaccacact tcggccatgc tgtccattac 300
aacactcatc atcactttca tcgacatgac agcggagatg gaccagcgca cagtgcagac 360
ctgggtcacg gatggagggt gcgcaaaaca ccgatctttt ccggtcttct cgcccctttc 420
tccatcgtac tcgaagtgcc aggtttgacg tccaaatggt acgccaagat cgatgcagac 480
ggtattgtgg aacgatacat cgataatccg cctatcctaa ccgttggact cgccatctcg 540
cttagtgcgg cagtcgtggc caacgcagcg atcatctttc gatttctcga gttcttgaaa 600
ccgagagcaa gtattgcgct tgccattgcg ggtttcgctc ttcacgacat catcaatgtc 660
gtcgccttgg ctgtctttgg tggtatctat ggacccaaac atgacggcct cagtctcagt 720
gccagttact ggatggtctg cgcttcgacc atcacgtcga cgatcgtcac catcagcttg 780
gttgccgact acgtcaggac aaaggatttc aagcacgcag gctcggggtt gacacagctg 840
caaaagggac tggtgctggc aggtatggga ctgctgctgt atctgtcgct gggaagtctg 900
atctttgtct acctcatcaa gatcgatttc atcactgcgc tgtacttttc gacggcaaca 960
gtattgacgg ttggttttgg agatgtggta ccgacaagtc cgggcggcaa agtcttggtc 1020
atcttgtatg cgccaatcgg aatcatcctc gttgcgcttg tcgtatcttc ggcgaggagc 1080
acgatcctag agactttcca agcggccctc atcgcgagga caaaggagcg acgtaggaga 1140
atagcagaac gaaaagctgc ggttaaagag cacaagaggc aggaccgtgc aatacggagg 1200
atcatgcctc gcacgttcac gtttggaccc aactccaacg ctgtcagtaa ttcgccggat 1260
gacgatagca acaacaacga attcgctgaa gctttggctc agatggagaa gcaagctgct 1320
gccggtggtg cacctccagc cgacaatgtt gcgtcttcca tcaccaccac tgctgcctcc 1380
tccggcaacg ccgcctccaa tgacgaaccc aaactcgcag aagcagaaaa gccagcaact 1440
gcaaccgtcg gcgaccccgc tctacaacac caaatccacg cccttcaaac cgaacttcta 1500
gcagcaaaaa aacgcacaga acaagacttc ctcacctacg aagaacacgc gcgacacgaa 1560
gccatcatgg ccgcacgcat gaaactcgtc ctggccgcct ccgtcaccgc tgctttctgg 1620
ctcctcggcg ccgttgcttt tacttatgca gagagatgga gttacggtgg tgcaatgtgg 1680
ttctgcttca tcgccatgat cacgattggg tatggagact atcatccgac gacgcagatc 1740
ggtagggcga tctttgtcat atggggtttg atgggtgttg ctgtgttgac gatcttgttg 1800
gcggttgttc aggatgcgtt tggtggagtg ctgcatcgaa tgctaacgca atccacgtcg 1860
aggttgttcg atcgagcaga ggagagggct aggaagaggc ggttgaagaa ggagcaaatg 1920
cagcgcgagc agcgtcaagc ggacgcggag gaggaaggtg aggatgtgga aacgagaggt 1980
gctacagcag gagcatcagc gatgcgaaag cgaagacggt cacgaacgcg atctcaccgc 2040
aaaagcgaaa gtgacgtcaa gagggagaag ttcaagatgg tcgaagccgg atccaatgac 2100
acaggagagc ggacaaaagt agagcgaaag agtatggaag ccacctttgc acgcgaccgg 2160
cacacatctt cacccgaacc tctagaggag ctcgaacgag atctcgacac gcctgacggt 2220
gtacctctcg ccatcccctc tttcatcctt aagaatgctt ctggtgttac cgactctggt 2280
ctcatcactg ctgaagtcca attgcccgtc ggagcagccg cgcgtgtgga agacaccctc 2340
gtctcagcac ctcaaaaact cgcccttgcc gccctgctca ccttccaaca ctctgttcgc 2400
gtacttcgct tacacgacac agccatctct gcagccatga ccgacgtccc cgccctgcga 2460
cactactaca actcgcgtca gaagtcttct tcgctctcag ggaccgatct tgccccacaa 2520
gactcctccg aaggaacctc aaaaagtaaa gacggggagg aaacagaccc ggaaacagcg 2580
ttgcaaaacc tccatgcggc gatccagcaa attgcgaatc cggagtatga aaaggtggcg 2640
aagttggtag ttgccaatct ggagtttgag catcatctga aggtgtttct agaacagttc 2700
caggggttga aggatagggt ggaggggttc aagcagcgga cgacggagat gaggcggagg 2760
agggggcaaa cggtgggaga ggcggatgga gaggagcatc atccgacgtt ggcgcatctg 2820
tttcatccgc acgaacacga gcatgagcat cagcaggggc acgagcatga gcatcaacaa 2880
ccatacggaa ggaaccaaga accggaagga ccggcaccgt cggaatag 2928
<210> 21
<211> 411
<212> PRT
<213> Pseudozyma tsukubaensis
<220>
<223> Pseudog4094.t1
<400> 21
Met Pro Lys Leu Pro Leu Ser Ile Ala Leu Gly Thr Val Leu Ile Ala
1 5 10 15
Gly Cys Ile Gly Ala Pro Thr Ser Ser Ser Glu Glu Gly Asp Ser Asp
20 25 30
Tyr Arg Leu Phe Ser Ser Gly Arg Pro Asp Leu Ser Ser Arg Leu Glu
35 40 45
Arg Leu Lys Ile Asp Thr Thr Gln Arg Tyr Asp Pro Glu Leu Gln Tyr
50 55 60
His His Ala Ala Leu Pro Pro Ser Pro Gln Pro Ile Glu Pro Leu Ala
65 70 75 80
Trp Tyr Asp Ser Arg Met Arg Pro Leu Phe Ser Pro Pro Ala Val Gly
85 90 95
Asn Gln Val Ala Leu Val Pro Met Tyr Pro Phe Gln Val Val Pro Gly
100 105 110
Met Gln His Gly His Val Leu Gly His Ala Pro Glu Pro Ser Phe Ala
115 120 125
Gln Val Leu Val Thr Ala Gln Pro Pro Pro Gln Pro Thr Tyr Ser Val
130 135 140
His Pro Asp Thr Lys Leu Pro Val Ser Glu Leu Val Ala Pro Thr Pro
145 150 155 160
Ser Arg Asp Gly Ala Leu Arg Tyr Thr Ile Pro Arg Phe Ala Leu Arg
165 170 175
Asp Gly Arg Gln Phe Gly Pro Leu Gln Val Gly Lys Asp Lys Phe Gln
180 185 190
Ile Ala Ala Tyr Pro Leu Asp Ile Pro Val Leu Arg His Leu Tyr Gln
195 200 205
Tyr Asp Gln Leu Ile Phe Ala Asn Phe Glu Asp Phe Val Leu Gly Asp
210 215 220
Lys Asn Lys Ala Ser Tyr Arg Asn Phe His Gly Val Tyr Arg Pro Glu
225 230 235 240
Pro Lys Ile Leu Asp Asp Ile His Arg Ala Ile Arg Ala His Met Ser
245 250 255
Phe Gly Gly Leu Thr Pro Gln Arg Val Ser Pro Asp His Asp Leu Met
260 265 270
Glu Gly Gln Leu Leu Trp Pro Pro Ala His Ile Ile Pro Lys Gln Leu
275 280 285
Gln Ser Glu Glu Val Arg Arg Leu Thr Leu Thr Arg Asn Leu Arg Asp
290 295 300
Asp Leu Arg Lys Ala Val Leu Thr Gln Ile Ser Ala His Gln Arg Asp
305 310 315 320
Phe Ser Lys Val Tyr His Leu Glu Ile Val Ser Asn Gln Gly Lys Arg
325 330 335
His Ile Met Met Thr Thr Leu Pro Tyr Gln Thr Tyr Thr Gln Leu Ala
340 345 350
Asn Gly Gln Ala Thr Asn Leu Asp Phe Trp Val Phe His Glu Gly Ile
355 360 365
Gln Pro Ala Gly Glu Asn Arg Gln Pro Met Val Ala Leu Leu Gly Gly
370 375 380
Ala Phe Leu Ser Lys Glu Thr Lys Glu Ala Leu Leu Ser Ser Leu Arg
385 390 395 400
Met Arg Pro Ala Trp Thr Thr Thr Val Arg Phe
405 410
<210> 22
<211> 1236
<212> DNA
<213> Pseudozyma tsukubaensis
<220>
<223> Pseudog4094.t1
<400> 22
atgccaaaac ttccgctgag catagcactc ggcacagtgc tgatagcggg ctgcatcggc 60
gccccaacca gctctagcga ggaaggagac tccgactaca gactattttc atcaggcaga 120
ccggatcttt cttcgcgtct cgagcgactc aagatcgata ccacccagcg gtacgatccg 180
gagttgcaat accaccacgc agcccttcct cccagtccgc agcctattga gccacttgct 240
tggtacgact cccgcatgcg acccttgttt tcgcctcctg ctgttggaaa ccaggttgct 300
ctcgtcccta tgtacccttt ccaagtcgtc cctgggatgc agcatgggca cgttcttggg 360
cacgctccag agccatcctt cgcccaagtc cttgtcacag ctcaacctcc accccaaccc 420
acctattcag tacaccccga cactaagctg ccagtgagtg agctggtagc ccctacgccc 480
tcgcgagatg gagctcttcg atacacgatt ccacgattcg cattgagaga cggaagacag 540
tttggtccgc ttcaagtggg aaaggacaag ttccagatag ctgcctaccc gctagacatt 600
cccgtcctcc gtcacctgta tcagtacgat cagctcattt ttgccaactt cgaagatttc 660
gtccttggcg acaagaacaa ggctagctac cgaaactttc acggagttta tcgacccgag 720
ccgaagatct tggatgacat tcatcgcgcc atccgggcgc acatgtcgtt tggcggacta 780
accccacagc gtgtcagtcc agatcacgat ctgatggaag gccagcttct gtggccacca 840
gctcatatca tacccaagca gctccaaagc gaagaggtcc gtcggctgac actcacccgc 900
aatctacgtg atgacctcag gaaggctgtc ttgacgcaga tctctgcgca tcagagggac 960
ttttcgaagg tttatcatct tgagatcgtc tcgaaccaag gaaaaaggca tatcatgatg 1020
actactctac cttatcagac atacacccag ctcgcaaatg gccaagctac caatttggac 1080
ttttgggtct ttcatgaagg catccaaccg gcaggagaga atagacagcc aatggtggct 1140
ttgctaggtg gcgccttcct gtcgaaagag accaaagagg cgctactttc gtccttgcgt 1200
atgcgacctg cctggaccac taccgttcga ttctga 1236
<210> 23
<211> 313
<212> PRT
<213> Pseudozyma tsukubaensis
<220>
<223> Pseudog4095.t1
<400> 23
Met Val Val Thr Gly Val Pro Thr Phe Asp Asn Gln Gly His Ala Ser
1 5 10 15
Ala Pro Asp Leu Ser Pro Thr Glu Arg Leu Gly His Arg Asp Gly Ser
20 25 30
Val His Pro Pro Phe Trp Arg Arg Gln Ala Ser Ser Ser Asp Ser Trp
35 40 45
Glu Pro Asp Ala Glu Glu Lys Ala Gly Arg Thr Ile Ser Gly Pro Arg
50 55 60
Arg Gly Pro Glu Gly Thr Thr Arg Thr Arg Ala Ile Ile Pro Ala Phe
65 70 75 80
Lys Asp Val Ser Gly Val Ile Trp Gly Pro Tyr Lys Leu Asn Ser Lys
85 90 95
Lys Phe Gln Leu Ile Trp Tyr Pro Leu Glu Met Glu Arg Leu Lys His
100 105 110
Leu Tyr Gln Pro Asp Gly Thr Ile Pro Ala Thr Ile Asp Glu Pro Val
115 120 125
Pro Gly Gln Pro Phe Arg Leu Gln Val Arg Pro Ile Ser Phe Arg Pro
130 135 140
Glu Pro Glu Val Leu Lys His Ile Arg Ser Thr Ile Trp Asn Thr Leu
145 150 155 160
Thr Asp Gln Gly Ile Ser Ala Lys Pro Ile Asp Ser Lys Asn Lys Phe
165 170 175
Phe Arg Glu Gly Met Tyr Leu Trp Pro Pro Leu Thr His Thr Lys Ser
180 185 190
Val Leu Gln Met Pro Glu Ala Leu Leu Ser Asn Arg Ile Ser Val Ala
195 200 205
Pro Gly Asn Arg Phe Arg Thr Met Arg Ala Lys Asn Ile Tyr Gln Phe
210 215 220
Thr Val Pro Ser Ser Ala Gly Asp Arg His Ile Ile Met Thr Pro Ala
225 230 235 240
Val Thr Glu Val Trp Thr Thr Ser Thr Gly Gly Asp Ser Asp Leu Trp
245 250 255
Leu Phe Tyr Glu Gly Arg Lys Leu His Asp Gly Ile Gln Ser Tyr Arg
260 265 270
Gly Lys Arg Leu Thr Ser Asn Val Ile Gly Lys Lys Thr Met Ala Phe
275 280 285
Leu Gly Ala Met Phe Leu Pro Ser Ser Ala His Glu Thr Leu Leu Arg
290 295 300
Ala Lys Val Ile Ser Thr Phe Ala Ala
305 310
<210> 24
<211> 942
<212> DNA
<213> Pseudozyma tsukubaensis
<220>
<223> Pseudog4095.t1
<400> 24
atggtggtca ctggtgttcc gacatttgac aaccaaggac acgcctctgc tcctgatttg 60
tcgccgactg agcgtttggg tcaccgcgac ggttctgtcc atcctccctt ctggcgacgt 120
caggcgagca gctcggactc ttgggagcct gacgccgagg agaaagccgg gagaaccatc 180
tcgggtcctc gacgaggtcc ggagggtacc actaggaccc gagctatcat tcccgctttc 240
aaagatgtct caggcgtcat ctggggaccg tataaactca actccaagaa gtttcagctg 300
atatggtacc cgttggaaat ggagcgactg aaacacctct accagcccga cggcacgatt 360
ccagcgacca tcgacgagcc tgtaccaggc cagccgttcc gactgcaggt gcggcccatt 420
agcttccgtc ccgaaccaga agttcttaag cacatccgat cgaccatttg gaacacgctt 480
acggatcaag ggatcagcgc gaagcctatc gactccaaga acaagttttt ccgcgaggga 540
atgtacctat ggccgccttt gacccacaca aagtcggttc ttcaaatgcc cgaggcactc 600
ctgtcgaatc gcatctccgt tgctcctgga aatcgctttc gtacgatgcg tgccaagaac 660
atctatcagt ttacagttcc ttcttccgct ggagacagac atatcatcat gactccagct 720
gtgaccgagg tctggacaac cagcacggga ggagactcag atctgtggct cttctacgaa 780
ggcagaaagc ttcacgatgg gatccaatcc tacagaggca agaggttgac aagcaacgtg 840
ataggcaaaa agaccatggc ctttcttggc gccatgtttt tgccgagttc agcacacgaa 900
acgctgctca gagccaaggt aatttcaact ttcgctgctt ga 942
<210> 25
<211> 164
<212> PRT
<213> Pseudozyma tsukubaensis
<220>
<223> Pseudog4096.t1
<400> 25
Met Met Leu Phe Arg Leu Leu Leu Leu Leu Leu Gly Ala Ala Leu Val
1 5 10 15
Ser Ala Phe Phe Glu Ser Asp Tyr Val Asn Leu Lys Gly Thr Asp Arg
20 25 30
Ser Met Trp Leu Lys Met His Glu Arg Phe Asp Pro Ser Phe Lys Gln
35 40 45
Gly Leu Ala Arg Glu His Ile Ser Ser Pro Arg Val Val Ala Phe Gly
50 55 60
Pro Glu Trp Tyr Gln Ser Ala Leu Gln His Ala Arg Asp Lys Gly Val
65 70 75 80
Leu Val Leu Gly Val His Ser Pro Leu Thr Ser Leu Thr Gly Asn Lys
85 90 95
Lys Thr Tyr Phe Val Thr Leu Ile His Tyr Asp Asp Gly Val Val Ala
100 105 110
Arg Gln Leu Gln Leu His Pro Gln Ser Met Val Gly Ala Val Leu Trp
115 120 125
Lys His Ser Lys Gly Gln Asn Lys Ile Val Ser Ile Asp Arg Leu Ile
130 135 140
Arg Lys Thr Glu Met Asn Trp Asp Pro Glu Val Leu Glu Ser Val Leu
145 150 155 160
Gln Arg Glu His
<210> 26
<211> 495
<212> DNA
<213> Pseudozyma tsukubaensis
<220>
<223> Pseudog4096.t1
<400> 26
atgatgctct tccgcttgtt gctcctgctt ctgggcgctg ccttggtttc tgccttcttt 60
gaaagcgatt acgtcaatct caaagggaca gaccgaagca tgtggctaaa gatgcacgaa 120
cgattcgacc cttccttcaa gcaaggtctt gcacgagaac atatttcttc tcctcgagtg 180
gtcgccttcg gccccgaatg gtaccagtcg gccttgcagc atgcacgcga caagggagtg 240
ttggttcttg gcgttcacag tcctctcaca tcattgacgg ggaacaagaa gacgtatttt 300
gtcacgctga tccattatga cgatggagtt gttgcacgtc agctccaatt gcatcctcaa 360
agcatggtgg gtgcagtctt gtggaagcac agtaaaggtc aaaacaagat tgtttcgatt 420
gacaggttaa ttaggaagac ggagatgaac tgggatccag aggtactgga aagtgtccta 480
caacgcgagc attga 495
<210> 27
<211> 185
<212> PRT
<213> Pseudozyma tsukubaensis
<220>
<223> Pseudog4097.t1
<400> 27
Met Gln Val Leu Ser Asn Arg Phe Leu Gly Leu Leu Ala Leu Leu Phe
1 5 10 15
Ser Leu Val Ile Leu Gly Val Ala Ala Thr Arg Leu Ser Asp Lys Glu
20 25 30
Glu Asp Met Leu Asn Gln Ala Arg Ser Pro Tyr Gln Ser Pro Ile Tyr
35 40 45
Glu Asn Ala Gly His Ala Trp Gln Thr Trp Thr Leu Tyr Pro Lys Leu
50 55 60
Gln Asp Tyr Ser His Ile Pro Asp Phe Glu Arg Asp Ala Leu Glu Met
65 70 75 80
Ala Tyr Arg Lys Gly Ala Met His Ile Ser Asp Thr Met Asp Asp Asn
85 90 95
Asp Ile Arg Asn Arg Ala Trp Arg Ser Gly Ser His Ser Gly Ser Lys
100 105 110
Leu Ala Arg Asp Gly His Ile Tyr Phe Tyr Ser Ile Val Pro Pro Arg
115 120 125
Ser Tyr Met Gly Leu Gln Met Gly Leu Pro Glu Lys Asn Arg Val Ala
130 135 140
Ser Leu Leu Trp Lys His Asp Pro Gly Thr Gly Gln Thr Lys Leu Ile
145 150 155 160
His Val Asp Glu Leu Gln His Tyr Lys Asn Leu Gln Trp Asp Met Asp
165 170 175
Lys Leu Glu Asp Ile Leu Arg His His
180 185
<210> 28
<211> 558
<212> DNA
<213> Pseudozyma tsukubaensis
<220>
<223> Pseudog4097.t1
<400> 28
atgcaggttc tctctaaccg cttcctcggc cttttggccc tcctcttctc acttgtcatc 60
ctgggtgtcg ctgccacccg gcttagtgat aaagaggaag acatgctcaa tcaggcacga 120
agtccttacc agtctcccat ctacgaaaat gctggtcatg catggcagac ctggacactt 180
tatcctaaac ttcaggatta ctcgcacatc cctgactttg agcgtgatgc tcttgaaatg 240
gcttatagga aaggtgccat gcacatcagc gacaccatgg acgacaacga catccgaaac 300
agggcatggc gttctggtag ccacagtggt agcaagttgg ccagagatgg acatatctac 360
ttttacagta ttgttcctcc tcgatcttac atgggactcc agatgggact tcccgagaaa 420
aaccgggtcg ctagtctgct ttggaagcat gatccgggaa cggggcagac caagttgatt 480
catgttgacg aacttcagca ctataagaac ctacagtggg acatggataa gttggaagac 540
attctcaggc atcactga 558
<210> 29
<211> 167
<212> PRT
<213> Pseudozyma tsukubaensis
<220>
<223> Pseudog4098.t1
<400> 29
Met Val Ala Ile His Arg Arg Leu Phe Leu Leu Leu Leu Leu Gly Val
1 5 10 15
Ile Phe Ala Met Thr Ala Thr Ala Ala Pro Pro Tyr Ile Asn Pro Asp
20 25 30
Glu Glu Met Ile Gln His Ser Ile Gly Lys Leu Gly Thr Val Tyr Ala
35 40 45
Asp Ser Gly Val Thr Tyr Ala Pro Val Asn Ala Ala Gly Lys Tyr Arg
50 55 60
Val Tyr Asn Phe Glu Glu Lys Ala Trp Asp Met Ala His Gly Gly Ala
65 70 75 80
Thr Tyr Val Gly Thr Arg Gln His Phe Arg Gly Gly Gln Lys Tyr Gly
85 90 95
Gln Pro Trp Lys Tyr Phe Tyr Ser Ile Ile Pro Pro Asp Thr Pro Leu
100 105 110
Gly Arg Glu Met Gly Leu Pro Asp His Lys Leu Ala Thr Val Leu Trp
115 120 125
Arg Tyr Gly Asn Gly Arg Lys Ser Met Val Glu Leu Gln Glu Ala Asp
130 135 140
Asn Tyr Met His His Ser Gly Phe Asn Trp Asn Gly Met Gln Glu Leu
145 150 155 160
Lys Asp Val Ile Gly His His
165
<210> 30
<211> 504
<212> DNA
<213> Pseudozyma tsukubaensis
<220>
<223> Pseudog4098.t1
<400> 30
atggttgcca ttcaccgccg tctcttcctt ctcctgctcc ttggcgtcat ctttgcaatg 60
accgccaccg ccgccccacc ctacatcaat ccggacgaag agatgatcca acactctatc 120
ggcaaacttg gcactgtcta cgccgattcg ggtgtcacat atgcaccggt caacgccgcg 180
ggcaaatatc gcgtctacaa ctttgaagaa aaggcgtggg acatggctca cggtggcgca 240
acctatgtcg gtacgcgtca acacttccga ggaggtcaaa agtatggtca accttggaag 300
tatttctatt ccatcattcc tcctgacaca ccgttgggac gggagatggg cttgcctgac 360
cacaaactcg cgacggtgct gtggaggtac gggaacggtc gaaagtcgat ggtggaactt 420
caggaggcgg ataactatat gcatcattct gggttcaatt ggaacgggat gcaggagctg 480
aaggatgtaa ttggacatca ctga 504
<210> 31
<211> 485
<212> PRT
<213> Pseudozyma tsukubaensis
<220>
<223> Pseudog6271.t1
<400> 31
Met Ala Pro Ser Leu Asn Ala Asn Ser Thr Ala Asp Arg Arg Asn Ala
1 5 10 15
Thr Ala Ala Pro Asp Leu Leu Ser Gly Asn Lys Ala Gly Gly Gly Leu
20 25 30
Lys Leu Ser Gly Leu Pro Asp Leu Ser Asp Ser Ala Gly Thr Leu Ser
35 40 45
Asp Val Phe Gly Thr Pro Ala Met Arg Leu Ile Trp Ser Asp Gln Asn
50 55 60
Arg Val Ala Cys Tyr Leu Glu Ile Glu Ala Ala Leu Ala Val Val Gln
65 70 75 80
Ala Glu Leu Gly Ile Ile Pro Lys His Ala Ala Gln Glu Ile Val Lys
85 90 95
His Cys Arg Val Asp Glu Ile Asp Trp Ala Leu Tyr Lys Gln Lys Thr
100 105 110
Glu Leu Ile Gly Tyr Pro Val Leu Gly Ile Val Gln Gln Leu Val Ala
115 120 125
Asn Cys Lys Asp Gly Leu Gly Glu Tyr Cys His Trp Gly Ala Thr Thr
130 135 140
Gln Asp Ile Thr Asp Thr Ala Thr Ile Met Gln Ile Arg Gln Ser Leu
145 150 155 160
Ala Leu Val Lys Glu Lys Leu Cys Ser Ile Val Ala Ser Leu Arg Tyr
165 170 175
Leu Ala Glu Lys His Arg Asn Leu Pro Met Ala Ala Arg Ser Asn Leu
180 185 190
Lys Gln Ala Val Pro Ile Thr Phe Gly Phe Lys Met Ala Arg Phe Leu
195 200 205
Ala Thr Phe Arg Arg His Gln Glu Arg Leu Ala Glu Leu Glu Lys Arg
210 215 220
Thr Tyr Thr Leu Glu Phe Gly Gly Ala Ala Gly Asn Leu Ser Ser Leu
225 230 235 240
Gly Glu Lys Gly Ile Ala Thr His Asp Ala Leu Ala Lys Met Leu Asp
245 250 255
Leu Ser Pro Ala Asp Ile Ala Trp His Thr Glu His Asp Arg Phe Ala
260 265 270
Glu Val Gly Ala Phe Leu Gly Leu Leu Thr Gly Thr Leu Ala Lys Leu
275 280 285
Ala Thr Asp Ile Lys Leu Met Ser Gln Thr Glu Val Gly Glu Val Gly
290 295 300
Glu Pro Phe Ile Ser Asn Arg Gly Ser Ser Ser Thr Met Pro Gln Lys
305 310 315 320
Asn Asn Pro Ile Ser Cys Val Tyr Ile His Ala Cys Ala Ala Asn Val
325 330 335
Arg Gln Gly Thr Ala Ala Leu Leu Asp Ala Met Gln Ser Asp His Glu
340 345 350
Arg Gly Thr Gly Pro Trp Glu Ile Ile Trp Val Gln Leu Pro Leu Met
355 360 365
Met Asn Trp Ser Ala Ala Ala Leu Ala Asn Ala Asp Phe Ile Leu Lys
370 375 380
Gly Leu Gln Val Phe Pro Asp Ala Met Val Arg Asn Leu Ala Leu Ser
385 390 395 400
Lys Gly Leu Ile Val Ser Glu Ala Val Met Met Ala Leu Gly Asp Thr
405 410 415
Leu Gly Arg Gln Tyr Ala His Asp Ala Val Tyr Glu Cys Cys Arg Ala
420 425 430
Ala Phe Glu His Asn Arg Pro Leu Leu Asp Val Leu Leu Glu Asn Gln
435 440 445
Glu Ile Ala Ser Lys Leu Lys Arg Ala Glu Leu Glu Arg Leu Cys Glu
450 455 460
Pro Ala Asn Tyr Leu Gly Gln Cys Ser Gln Trp Ile Asp Arg Val Leu
465 470 475 480
Leu Pro Pro Ser Thr
485
<210> 32
<211> 478
<212> PRT
<213> Pseudozyma tsukubaensis
<220>
<223> Pseudog6268.t1
<400> 32
Met Ser Asn Pro Leu Ala Gly Arg Val Lys Trp Phe Arg Arg Ile Pro
1 5 10 15
Ser Ile Leu Leu Ala Phe Val Val Ser His Thr Asp Ser Phe Thr Met
20 25 30
Leu Arg Gly Ile Glu Thr Thr Ile Tyr Arg Ala Gly Thr Ser Arg Gly
35 40 45
Leu Tyr Leu Leu Ala Ser Asp Leu Pro Ser Glu Pro Ser Ala Arg Asp
50 55 60
Ala Ala Leu Leu Ser Ile Met Gly Ser Gly His Pro Leu Gln Ile Asp
65 70 75 80
Gly Met Gly Gly Gly Asn Ser Leu Thr Ser Lys Val Ala Ile Val Ser
85 90 95
Pro Ser Ala Gln Ser Asp His Ser Asp Val Asp Tyr Leu Phe Cys Gln
100 105 110
Val Gly Ile Asn Glu Arg Ile Val Asp Thr Ala Pro Asn Cys Gly Asn
115 120 125
Leu Met Ser Gly Val Ala Ala Phe Ala Ile Glu Arg Gly Leu Val Lys
130 135 140
Pro His Pro Ser Asp Thr Thr Cys Leu Val Arg Ile Phe Asn Leu Asn
145 150 155 160
Ser Asn Gln Ala Ser Glu Leu Leu Ile Pro Val Gln Asp Gly Arg Val
165 170 175
His Tyr Lys Asp Val Asp Asp Thr Gly Leu Gln Arg Pro Ser Ala Arg
180 185 190
Val Ser Leu Arg Phe Leu Asn Thr Val Gly Ala Cys Thr Gly Lys Leu
195 200 205
Leu Pro Thr Gly Asn Ala Thr Asp Ser Ile Glu Gly Leu Glu Val Ser
210 215 220
Val Ile Asp Ser Ala Ile Pro Val Val Phe Val Arg Gln Ala Asp Val
225 230 235 240
Gly Ile Thr Gly Phe Glu Thr Pro Ala Thr Leu Asn Ala Asp Thr Ala
245 250 255
Leu Leu Ser Arg Leu Glu Arg Val Arg Leu Glu Ala Gly Arg Arg Met
260 265 270
Gly Trp Gly Asp Val Ser Ser Ser Val Val Pro Lys Leu Ser Leu Ile
275 280 285
Gly Pro Gly Ser Asn Cys Thr Thr Phe Thr Ala Arg Tyr Phe Thr Pro
290 295 300
Lys Thr Cys His Asn Ala His Ala Val Thr Gly Ala Ile Cys Thr Ala
305 310 315 320
Gly Ala Ala Tyr Val Pro Gly Thr Val Val Ser Asp Ile Phe Ser Ser
325 330 335
Arg Thr Pro Ser Leu Ser Ser Ser Pro Gly Asp Thr Thr Pro Pro Tyr
340 345 350
Thr Pro Gln Arg Arg Ile Ser Ile Glu His Pro Ser Gly Val Leu Glu
355 360 365
Ile Gly Leu Thr Ala Ala Glu Ser Asp Ser Pro Arg Ser Leu Asp Ile
370 375 380
Ala His Val Glu Arg Ser Val Ala Leu Ile Ala His Ala Arg Val Tyr
385 390 395 400
Tyr Thr Met Pro Asp Arg His Pro Ser Val Glu Ile Pro Ile Ile Ser
405 410 415
Pro Val Thr Pro Thr Ser Ala Glu Met Leu Asp Arg Ala Tyr Gln Ser
420 425 430
Leu Ala Leu Ala Leu Gly Arg Gly Lys Asp Arg Ser His Ile Ile Pro
435 440 445
Leu Gly Ser Glu Gly Lys Glu Ser Glu Leu Tyr Tyr Asn Met Pro Asp
450 455 460
Ser Thr Val Ser Ser Tyr Arg Gly Thr His Ser Thr Ala Leu
465 470 475
<210> 33
<211> 532
<212> PRT
<213> Pseudozyma tsukubaensis
<220>
<223> Pseudog6270.t1
<400> 33
Met Leu Pro Gln Thr Pro Val Pro Asp Tyr Arg Leu Ser Met Arg Tyr
1 5 10 15
Ser Thr Asp Ser Val Ala Ala Ser Gln Ala Leu Thr Thr Pro Glu Ala
20 25 30
Ala Pro Ser Ile Ser His His Ala Asp Thr Gly Glu Val Gln Gln Ala
35 40 45
His Ser Gly Asp Asp Gly Ala Leu Glu Glu Gly Ala Ile Ala His Ser
50 55 60
Ser Lys Glu Gly Ser Gln Arg Asp Gln Gln Thr Glu Leu Tyr Cys Ala
65 70 75 80
Phe Thr Lys Gly Thr Lys Leu Phe Val Val Leu Ser Val Ser Ile Ala
85 90 95
Gly Phe Phe Ser Pro Phe Ser Ile Asn Ile Tyr Ile Pro Ala Leu Pro
100 105 110
Gln Ile Ser Lys Leu Leu His Thr Ser Glu Ala Ala Thr Asn Val Thr
115 120 125
Val Thr Val Tyr Met Ile Ala Gln Gly Leu Ser Pro Val Ile Trp Ala
130 135 140
Pro Leu Ser Asp Val Phe Gly Arg Arg Pro Ile Tyr Ile Ala Thr Phe
145 150 155 160
Leu Val Phe Phe Val Ala Asn Leu Gly Leu Ser Phe Thr Asn Val Tyr
165 170 175
Trp Leu Leu Val Val Leu Arg Met Val Gln Ala Ala Gly Ala Cys Ser
180 185 190
Ala Ile Ala Ile Gly Ala Gly Thr Ile Gly Asp Val Thr Glu Arg Lys
195 200 205
Glu Arg Gly Ser Tyr Met Gly Tyr Tyr Ala Leu Ala Gln Tyr Thr Gly
210 215 220
Pro Ala Ile Gly Pro Val Ile Gly Gly Ala Leu Ser Gln Arg Trp Asp
225 230 235 240
Tyr His Ser Thr Phe Phe Phe Leu Ser Ala Val Ser Gly Val Phe Leu
245 250 255
Ile Phe Met Ala Phe Phe Leu Leu Glu Thr Leu Arg Val Leu Val Gly
260 265 270
Asn Gly Ser Ala Arg Thr Phe Gly Ile Tyr Arg Thr Leu Val Gly Pro
275 280 285
Arg Leu Val Lys Ser Thr Ala Asn Ser Met Arg Pro Arg Met Lys Ser
290 295 300
Pro Leu Glu Gly Arg Leu Glu Phe Gly Phe His Arg Pro Phe Leu Val
305 310 315 320
Phe Ala Arg Pro Glu Thr Ser Leu Ala Ile Leu Ala Phe Ser Met Val
325 330 335
Tyr Ala Thr Tyr Tyr Leu Ser Ser Ala Ser Leu Pro Tyr Leu Phe Lys
340 345 350
Gln Val Tyr Gly Leu His Glu Leu Leu Ile Gly Val Cys Phe Val Pro
355 360 365
Ser Gly Val Gly Cys Ala Leu Gly Thr Val Leu Ala Gly Lys Ile Leu
370 375 380
Asp Ser Asp Tyr Arg Arg Ala Leu Asp Lys Asn Lys Ser Gly Val Lys
385 390 395 400
Val Thr Arg Ala Arg Leu Gln Ser Ala Trp Ile Tyr Leu Pro Gly Tyr
405 410 415
Ala Ser Ser Leu Leu Ala Tyr Gly Trp Cys Val Arg Ala His Thr His
420 425 430
Ile Ala Ala Pro Ile Leu Phe Gln Phe Thr Leu Gly Met Phe Ser Thr
435 440 445
Met Tyr Phe Thr Asn Ile Asn Thr Leu Val Val Asp Leu Tyr Pro Gly
450 455 460
Lys Ala Ala Thr Ala Thr Ala Ala Val Asn Val Gly Arg Cys Leu Leu
465 470 475 480
Gly Ala Val Ala Val Ala Ile Val Gln Pro Met Thr Asp Ala Met Gly
485 490 495
Ala Gly Trp Thr Phe Thr Val Gly Ala Leu Leu Ala Leu Phe Ile Gly
500 505 510
Leu Ile Cys Gln Thr Leu Ile His Phe His Gly Glu Lys Trp Ala Ala
515 520 525
Arg Lys His Ser
530
<210> 34
<211> 191
<212> PRT
<213> Pseudozyma tsukubaensis
<220>
<223> Pseudog6267.t1
<400> 34
Met Pro Ser Val Gln Arg Asn Ile Ser Pro Ser Val Ser Val Leu Ala
1 5 10 15
Gly Ala Thr Ala Gly Ala Val Glu Gly Glu Thr Lys Leu Ile Asp Asp
20 25 30
Gly Lys Arg Ala Lys Pro Arg Tyr Glu Gln Gly Leu Phe Arg Gly Thr
35 40 45
Ala Ser Ile Ile Arg Gln Glu Gly Phe Gly Gly Ile Tyr Lys Gly Val
50 55 60
Phe Pro Val Ile Leu Arg Gln Gly Ser Ala Ser Ala Ile Arg Leu Gly
65 70 75 80
Thr Tyr Ser Ala Met Arg Asp Phe Ile Pro Lys Ala Gln Gly Lys Gly
85 90 95
Ser Ser Phe Val Asn Trp Leu Thr Thr Phe Ser Ile Gly Ala Thr Ser
100 105 110
Gly Val Val Ala Val Tyr Gly Thr Met Pro Phe Asp Val Leu Lys Thr
115 120 125
Arg Met Gln Ala Ile Asp Ala Ser Arg Tyr Arg Ser Thr Trp His Cys
130 135 140
Leu Thr Asp Thr Ile Gly Thr Glu Gly Ile Ala Ala Leu Trp Arg Gly
145 150 155 160
Ser Val Ser Arg Ser Met Arg Leu Ile Val Ser Gly Gly Val Ile Phe
165 170 175
Ser Val Tyr Glu Gln Val Val Trp Leu Leu Ala Gly Pro Glu Phe
180 185 190
<210> 35
<211> 348
<212> PRT
<213> artificial
<220>
<223> synthetic RIA1 sequence
<400> 35
Met Lys Met Ser Gly Ser Asn Ile Asp Asp Asp Asp Cys Ala Asn Met
1 5 10 15
Phe Asp Leu Met Ala Pro Pro Leu Ala Ser Ser Ser Cys Gly Pro Tyr
20 25 30
Phe Ser Thr Pro Asp Leu Ala Leu Pro Ser Ile Ser Pro Val Ser Thr
35 40 45
Asp Ala Asp Thr Thr Leu Pro Ser Pro Leu Gly Val Ala Pro Cys Thr
50 55 60
Tyr Ser Thr Cys Pro Ile Arg Asp Glu Gly Glu Thr Ser Thr Ser Val
65 70 75 80
Ser Gly Lys Arg Lys His Ser Glu Val Glu Lys Asp Arg Arg Arg Ser
85 90 95
Ile Ser Asn Gly Phe Ala Val Cys Leu Gln Asn Val Leu His Asn Asp
100 105 110
Ser Asn Cys Ala Lys Pro Ile Ser Lys Ser Val Leu Leu Gln Gln Ala
115 120 125
Cys Asp Glu Ile Arg Glu Leu Arg Lys Lys Leu Asp Ala Ser Thr Thr
130 135 140
Ile Ile Ser Arg Phe Gly Leu Glu Asn Leu Phe Pro Thr Pro Asn Ser
145 150 155 160
Ser His Ala Ser Pro Pro Asn Gly Ser Ser Arg Thr Tyr Pro Pro Tyr
165 170 175
Asn Asn Gly Pro Asp Phe Asp Thr Arg Arg Ala Ser Ser Thr Ser Thr
180 185 190
Pro Tyr Asn Asn Glu Lys Arg Glu Ala Asn Val Lys Arg Arg His Ser
195 200 205
Tyr His Asn Ser Trp Asn Ala Ser Asp Arg Ser Ser Asp Asp Asp Thr
210 215 220
Asn Ala Ser Cys Ser Ser Thr Ser His His Asp Asp Asp Thr Asp Ser
225 230 235 240
Ser Glu Ser Asp Ser Asp Phe Pro Asp Glu Thr Lys Asn Arg Thr Lys
245 250 255
Arg His Lys Ala Arg Ala Lys Lys Asp Arg Asp Arg Ala Lys Pro Arg
260 265 270
Tyr Lys Pro Lys Pro His Thr Asn Arg Pro Pro Pro Ser Ser Cys Ser
275 280 285
Asp Ser Ser Pro Ser Ser Pro Cys Pro Ser Pro Asn Arg Asn Ala Asp
290 295 300
Glu Leu Gln Gln Ala Ile Leu Ser Leu Leu Leu Glu Leu Pro His His
305 310 315 320
Leu Glu Asp Val His Asn Asp Lys Arg Ala Ser Gln Gln Pro Thr Asp
325 330 335
Pro Thr Gly Lys Thr Arg Asn Lys Lys Arg His Arg
340 345
<210> 36
<211> 393
<212> PRT
<213> Pseudozyma tsukubaensis
<220>
<223> Pseudog6266.t1
<400> 36
Met Ser Leu Ser Asn Ser Asn His Asn Glu Arg His Asn Asp Asp Asn
1 5 10 15
Asn Ile Asn Asp Asp Asp Cys Ala Asn Phe Phe Glu Leu Met Val Gln
20 25 30
Pro Ala Ser Ser Ser Ser Tyr Gly Pro Tyr Phe Pro Asp Pro Gly Leu
35 40 45
Ala Leu Pro Ala Ile Ser Asp Val Ser Ser Thr Thr Asp Thr Arg Leu
50 55 60
Pro Ser Gln Leu Gly Val Thr Pro Phe Ser His Gln Thr Ser Pro Ile
65 70 75 80
Arg Ser Ala Asp Glu Gly Glu Lys Thr Thr Thr Thr Ala Ser Tyr Lys
85 90 95
Arg Lys His Ser Glu Val Glu Lys Asp Arg Arg Arg Ile Ile Ser Asn
100 105 110
Gly Phe Ala Asn Val Leu His Asn Asp Ser Thr Ser Lys Pro Ile Ser
115 120 125
Lys Ala Thr Leu Leu Gln Gln Ala Cys Asp Glu Ile Arg Glu Leu Arg
130 135 140
Lys Lys Leu Asp Thr Ser Ile Thr Ile Ile Ser Arg Tyr Gly Leu Glu
145 150 155 160
Asn Leu Phe Gln Val Ala Pro Thr Pro Asn Ser Leu Ser Asn Ala Ser
165 170 175
Pro Pro Asn Gly Thr Ser Arg Ala Tyr Pro Thr Tyr Ser Asn Asp Leu
180 185 190
Gly Pro Asp Arg Phe Gln Asp Ser Arg Arg Ser Ser Thr Ser Ala Thr
195 200 205
Ser Val Ser Gly Ser Gln Tyr Asn Asn Gly Ala Ala Ala Lys Glu Asp
210 215 220
Gly Asn Glu Arg Arg Asn Ser Asn Val Lys Arg Arg Ser Ser Tyr Thr
225 230 235 240
Asn Ser Ile Asn Ser Ser Phe Glu Ser Ser Glu Glu Asp Thr Leu Asn
245 250 255
Ser Ser Cys Asp Asn Thr Ser Asp Phe Asp Glu Ser Val Gly Ser Ser
260 265 270
Glu Ser Glu Ser Glu Thr Asn Asn Arg Thr Arg Asn Arg Asn Arg Thr
275 280 285
Lys Arg Ala Met Ala Thr Ala Lys Leu Lys Asp Arg Asp Arg Ala Lys
290 295 300
Ala Arg Thr Ala Pro Lys Pro His Ser Asn Arg Leu Ser Pro Ala Ser
305 310 315 320
Thr Ile Thr Pro Ser Glu Met Ser Ser Ser Leu Ala Ser Pro Asn Thr
325 330 335
Ser Ser Gln Glu His Ile Gln Gln Ala Ile Leu Ser Leu Leu Leu Glu
340 345 350
Leu Pro Lys His Leu Glu Asn Val His Lys Ser Lys Arg Pro Ser Ser
355 360 365
Gln Gln Pro Ser Thr Gln Ile Asp Gln Thr Gly Asn Arg Thr Thr Thr
370 375 380
Val Thr Lys Thr Arg Arg Arg His Arg
385 390
<210> 37
<211> 288
<212> PRT
<213> artificial
<220>
<223> synthetic shortened RIA1 sequence
<400> 37
Met Ser Leu Ser Asn Ser Asn Ile Asn Asp Asp Asp Cys Ala Asn Phe
1 5 10 15
Phe Glu Leu Met Val Gln Pro Ala Ser Ser Ser Ser Tyr Tyr Phe Pro
20 25 30
Asp Pro Gly Leu Ala Leu Pro Ala Ile Ser Asp Val Ser Ser Thr Thr
35 40 45
Asp Thr Arg Leu Pro Ser Gln Leu Gly Val Thr Pro Phe His Gln Thr
50 55 60
Ser Pro Ile Lys Thr Thr Thr Thr Ala Ser Tyr Lys Arg Lys His Ser
65 70 75 80
Glu Val Glu Lys Asp Arg Arg Arg Ile Ile Ser Asn Gly Phe Ala Asn
85 90 95
Val Leu His Asn Asp Ser Thr Ser Lys Pro Ile Ser Lys Ala Thr Leu
100 105 110
Leu Gln Gln Ala Cys Asp Glu Ile Arg Glu Leu Arg Lys Lys Leu Asp
115 120 125
Thr Ser Ile Thr Ile Ile Ser Arg Tyr Gly Leu Glu Asn Leu Phe Pro
130 135 140
Asn Ser Ser Asn Ala Ser Pro Pro Asn Gly Thr Ser Arg Ala Tyr Pro
145 150 155 160
Arg Arg Asn Ser Asn Val Lys Arg Arg Ser Ser Tyr Thr Asn Ser Asn
165 170 175
Ser Ser Phe Glu Ser Ser Glu Glu Asp Ser Cys Asp Asn Thr Ser Asp
180 185 190
Phe Asp Glu Ser Val Gly Ser Ser Glu Ser Glu Ser Glu Thr Asn Asn
195 200 205
Asn Arg Thr Lys Arg Ala Met Ala Thr Ala Lys Lys Asp Arg Asp Arg
210 215 220
Ala Lys Ala Arg Thr Ala Pro Lys Pro Ala Ser Thr Ile Thr Pro Ser
225 230 235 240
Glu Met Ser Ser Ser Leu Ala Ser Pro Asn Thr Ser Ser Gln Ile Gln
245 250 255
Gln Ala Ile Leu Ser Leu Leu Leu Glu Leu Pro Lys His Leu Glu Asn
260 265 270
Val His Lys Ser Lys Arg Pro Ser Thr Lys Thr Arg Arg Arg His Arg
275 280 285
<210> 38
<211> 7
<212> PRT
<213> artificial
<220>
<223> 1st RIA1 motif
<400> 38
Ser Gly Lys Arg Lys His Ser
1 5
<210> 39
<211> 8
<212> PRT
<213> artificial
<220>
<223> 2nd RIA1 motif
<400> 39
Lys Arg Lys His Ser Glu Val Glu
1 5
<210> 40
<211> 8
<212> PRT
<213> artificial
<220>
<223> 3rd RIA1 motif
<400> 40
Lys Asp Arg Arg Arg Ser Ile Ser
1 5
<210> 41
<211> 6
<212> PRT
<213> artificial
<220>
<223> 4th RIA1 motif
<400> 41
Ile Ser Asn Gly Phe Ala
1 5
<210> 42
<211> 5
<212> PRT
<213> artificial
<220>
<223> 5th RIA1 motif
<400> 42
Asn Val Leu His Asn
1 5
<210> 43
<211> 6
<212> PRT
<213> artificial
<220>
<223> 6th RIA1 motif
<400> 43
Ser Lys Pro Ile Ser Lys
1 5
<210> 44
<211> 13
<212> PRT
<213> artificial
<220>
<223> 7th RIA1 motif
<400> 44
Leu Leu Gln Gln Ala Cys Asp Glu Ile Arg Glu Leu Arg
1 5 10
<210> 45
<211> 14
<212> PRT
<213> artificial
<220>
<223> 8th RIA1 motif
<400> 45
Gln Ala Cys Asp Glu Ile Arg Glu Leu Arg Lys Lys Leu Asp
1 5 10
<210> 46
<211> 12
<212> PRT
<213> artificial
<220>
<223> 9th RIA1 motif
<400> 46
Gln Gln Ala Ile Leu Ser Leu Leu Leu Glu Leu Pro
1 5 10
<210> 47
<211> 7
<212> PRT
<213> Pseudozyma tsukubaensis
<220>
<223> 1st RIA motif as found in P. tsukubaensis
<400> 47
Ser Tyr Lys Arg Lys His Ser
1 5
<210> 48
<211> 295
<212> PRT
<213> Pseudozyma tsukubaensis
<220>
<223> Pseudog4640.t1
<400> 48
Met Ser Leu Phe Asn Val Ser Asn Gly Leu Arg Ala Ala Leu Arg Pro
1 5 10 15
Ser Ile Ala Ser Ser Ser Arg Val Thr Ala Ala Phe Ser Thr Ser Ala
20 25 30
Ala Ala Arg Leu Ala Thr Pro Thr Asn Asp Ala Pro Gly Ser Gly Lys
35 40 45
Pro Gln His Leu Lys Gln Phe Lys Ile Tyr Arg Trp Asn Pro Asp Lys
50 55 60
Pro Ser Glu Lys Pro Arg Leu Gln Ser Tyr Thr Leu Asp Leu Asn Gln
65 70 75 80
Thr Gly Pro Met Val Leu Asp Ala Leu Ile Lys Ile Lys Asn Glu Ile
85 90 95
Asp Pro Thr Leu Thr Phe Arg Arg Ser Cys Arg Glu Gly Ile Cys Gly
100 105 110
Ser Cys Ala Met Asn Ile Asp Gly Val Asn Thr Leu Ala Cys Leu Cys
115 120 125
Arg Ile Asp Lys Ala Asn Asp Thr Lys Ile Tyr Pro Leu Pro His Met
130 135 140
Tyr Val Val Lys Asp Leu Val Pro Asp Leu Thr Gln Phe Tyr Lys Gln
145 150 155 160
Tyr Arg Ser Ile Glu Pro Phe Leu Lys Ser Asn Asn Thr Pro Ala Glu
165 170 175
Gly Glu His Leu Gln Ser Pro Glu Glu Arg Arg Arg Leu Asp Gly Leu
180 185 190
Tyr Glu Cys Ile Leu Cys Ala Cys Cys Ser Thr Ser Cys Pro Ser Tyr
195 200 205
Trp Trp Asn Gln Asp Glu Tyr Leu Gly Pro Ala Val Leu Met Gln Ala
210 215 220
Tyr Arg Trp Met Ala Asp Ser Arg Asp Asp Phe Gly Glu Glu Arg Arg
225 230 235 240
Gln Lys Leu Glu Asn Thr Phe Ser Leu Tyr Arg Cys His Thr Ile Met
245 250 255
Asn Cys Ser Arg Thr Cys Pro Lys Asn Leu Asn Pro Gly Lys Ala Ile
260 265 270
Ser Gln Ile Lys Lys Asp Met Ala Val Gly Ala Pro Lys Ala Ala Asp
275 280 285
Arg Pro Ile Met Ala Ser Ser
290 295
<210> 49
<211> 1974
<212> DNA
<213> Pseudozyma tsukubaensis
<220>
<223> Pseudog4640.t1
<400> 49
cgtgttgcat gaggttgctg gggaggcttc acggtctttc acaccgagac ttttgggagc 60
tgggaggcgc aaagaggacc ctgagcagga tgcgtagaaa cgcagtgtgg agcttggccg 120
agttccgcaa aaatgtcaaa atgttacatc ttcaaataag acatcgactg cacagcggga 180
gcttacggat gcgccgggtc tcttccggtc taacacgatg gtaaattgta caaaatcggc 240
aggaaacggc gttccgccaa atgcgatgag gcaaaggcgc gctgttgtca attatgtcag 300
cgacgagcga gacttggcgg gaaaaagatt ctaatttcgc acactcacac tgctgcctgg 360
caggcgcgcg taggcatgcc caatcagact cgatttgatt tcaaagccaa aagctcaaat 420
tgcagcagtc agccactgca cactgtgact gcgaaattca gctgaaaagc cgatacaggc 480
cgagttttag aggcagcaca ctgcgaagct gagaaaatga gctacgaacg tgttttggta 540
atcagccggc gtaacccaca ctgcactgca cgcttgagag ggtcagggtg tgtgtggcta 600
cagcagcagc agcggcagac ttcgagttcc aactctcccc gcacaagcga ccgcgagttc 660
cattcggtca gagttggcaa gtctctcgcg cgcacacctt gagttgattg aaagattgta 720
gccaacgcca tcttcattgc tgaacaccat caccaatacc tacattcgta ctcgcatcac 780
acattggtcg tcatgtcgct tttcaacgtc agcaacggtc ttcgtgccgc cctccgaccc 840
tccatcgcga gctcgtcccg cgttactgct gctttctcga catccgcagc tgcccgtctt 900
gccacgccca ccaacgatgc tcctggctct ggcaagcctc agcacttgaa gcagttcaag 960
atctaccgct ggaaccccga caagccttcc gagaagcctc gtctccagtc ctacactctt 1020
gaccttaacc agaccggccc aatggtgctc gatgccttga ttaagatcaa gaacgagatc 1080
gaccccactc ttactttccg tcgctcgtgc cgtgaaggta tctgcggttc ttgcgccatg 1140
aacatcgacg gtgtcaacac ccttgcttgt ctttgccgaa ttgacaaggc caacgacacc 1200
aagatctacc ccctccctca catgtacgtc gtcaaggacc ttgttcctga cttgacccag 1260
ttctacaagc agtaccgttc catcgagcct ttcctcaagt ccaacaacac ccctgctgag 1320
ggagagcacc ttcagtcgcc cgaggagcgt cgtcgtctcg acggtcttta cgagtgcatt 1380
ctctgcgctt gctgctccac gtcctgcccc tcctactggt ggaaccagga cgagtacctt 1440
ggtcccgccg tcctcatgca ggcttaccga tggatggccg actcccgtga tgactttggt 1500
gaggagcgaa gacagaagct cgagaacacc ttctcgctct accgttgcca caccatcatg 1560
aactgctcca ggacttgccc caagaacctt aacccaggca aggccatctc ccagatcaag 1620
aaggacatgg ctgtcggtgc ccccaaggct gccgaccgtc ccatcatggc ctcgtcttaa 1680
gaaaagtaaa aggcttcggt agttcggttt gtattcgacc cttgtttcat tctttcaatc 1740
tagtcatttc gcattgcaat tcgttgttgc tcgtgtgtgt tactcgtccg tcaatttcag 1800
gttggttctt cgcaattttt cactgtagga gagagatcga agcaatgtct cacagcaaga 1860
cgttcgacta ccatgctctg aagtcatgtg gatcccaggt gttaaatgat agaggtaacc 1920
aacaatatat tcacaacgaa aaggtgacaa tcttaggcat acaggttgaa gcgt 1974
<210> 50
<211> 888
<212> DNA
<213> Ustilago maydis
<220>
<223> coding region of Embl entry Z11738.1 (entry Z11738 is SEQ
ID NO. 52)
<400> 50
atgtcgctat tcaacgtcag caacggtctt cgtaccgctc tccgaccttc tgttgccagc 60
tcttcgcgcg ttgctgcctt ttccacaacc gccgctgccc gtctcgccac acccacctct 120
gacaacgttg gcagttcggg caagcctcag cacttgaagc agttcaagat ctaccgatgg 180
aaccctgaca agccctcgga gaagcctcgt ctgcagtcgt acacactgga cctcaaccag 240
accggtccaa tggttctcga cgcgctcatc aaaatcaaga acgaaattga ccctacgctc 300
accttccgtc gctcgtgccg tgagggtatc tgcggttcgt gcgctatgaa tattgacggt 360
gtcaacaccc tcgcctgcct ctgccggatc gacaagcaga atgacaccaa gatctacccc 420
ttgccgcaca tgtacattgt caaggacctc gtgccagact tgacccagtt ctacaagcag 480
taccgatcca tcgagccttt cctcaagtcc aacaacaccc cttctgaggg tgaacatctt 540
cagtcgcccg aggagcgtcg tcgactcgac ggtctgtacg agtgcattct gtgcgcgtgc 600
tgctccacat cctgcccctc ttactggtgg aatcaggacg agtaccttgg ccccgccgtg 660
ctcatgcagg cgtaccgatg gatggccgac tcgcgtgacg actttggtga ggagcgaaga 720
cagaagctcg agaacacctt ttcgctctac cgatgccaca ccatcatgaa ctgctccagg 780
acctgcccca agaacctcaa ccctggtaag gcaattgcac agatcaagaa ggacatggcc 840
gtcggcgcac ccaaggcttc cgagcgccct atcatggctt cgtcgtaa 888
<210> 51
<211> 1145
<212> DNA
<213> Pseudozyma tsukubaensis
<220>
<223> Pseudozyma tsukubaensis genomic sequence corresponding to
Embl entry Z11738 (entry Z11738 is SEQ ID NO. 52)
<400> 51
cagcggcaga cttcgagttc caactctccc cgcacaagcg accgcgagtt ccattcggtc 60
agagttggca agtctctcgc gcgcacacct tgagttgatt gaaagattgt agccaacgcc 120
atcttcattg ctgaacacca tcaccaatac ctacattcgt actcgcatca cacattggtc 180
gtcatgtcgc ttttcaacgt cagcaacggt cttcgtgccg ccctccgacc ctccatcgcg 240
agctcgtccc gcgttactgc tgctttctcg acatccgcag ctgcccgtct tgccacgccc 300
accaacgatg ctcctggctc tggcaagcct cagcacttga agcagttcaa gatctaccgc 360
tggaaccccg acaagccttc cgagaagcct cgtctccagt cctacactct tgaccttaac 420
cagaccggcc caatggtgct cgatgccttg attaagatca agaacgagat cgaccccact 480
cttactttcc gtcgctcgtg ccgtgaaggt atctgcggtt cttgcgccat gaacatcgac 540
ggtgtcaaca cccttgcttg tctttgccga attgacaagg ccaacgacac caagatctac 600
cccctccctc acatgtacgt cgtcaaggac cttgttcctg acttgaccca gttctacaag 660
cagtaccgtt ccatcgagcc tttcctcaag tccaacaaca cccctgctga gggagagcac 720
cttcagtcgc ccgaggagcg tcgtcgtctc gacggtcttt acgagtgcat tctctgcgct 780
tgctgctcca cgtcctgccc ctcctactgg tggaaccagg acgagtacct tggtcccgcc 840
gtcctcatgc aggcttaccg atggatggcc gactcccgtg atgactttgg tgaggagcga 900
agacagaagc tcgagaacac cttctcgctc taccgttgcc acaccatcat gaactgctcc 960
aggacttgcc ccaagaacct taacccaggc aaggccatct cccagatcaa gaaggacatg 1020
gctgtcggtg cccccaaggc tgccgaccgt cccatcatgg cctcgtctta agaaaagtaa 1080
aaggcttcgg tagttcggtt tgtattcgac ccttgtttca ttctttcaat ctagtcattt 1140
cgcat 1145
<210> 52
<211> 1145
<212> DNA
<213> Ustilago maydis
<220>
<223> Embl Z11738.1 (genomic sequence from U. maydis)
<400> 52
atcgtgctct acgactttgc acaccacaaa gtgtgcgggg agcaaaggac ccgatcttgg 60
tcgcgcgcaa agcagtcttg aacctgagag tgtgcgtgtc ttctgacgct tgcccttctg 120
tactttgctg tgacactacc accacatctg tcttggcttt ttgttcatac atccacaccg 180
accatgtcgc tattcaacgt cagcaacggt cttcgtaccg ctctccgacc ttctgttgcc 240
agctcttcgc gcgttgctgc cttttccaca accgccgctg cccgtctcgc cacacccacc 300
tctgacaacg ttggcagttc gggcaagcct cagcacttga agcagttcaa gatctaccga 360
tggaaccctg acaagccctc ggagaagcct cgtctgcagt cgtacacact ggacctcaac 420
cagaccggtc caatggttct cgacgcgctc atcaaaatca agaacgaaat tgaccctacg 480
ctcaccttcc gtcgctcgtg ccgtgagggt atctgcggtt cgtgcgctat gaatattgac 540
ggtgtcaaca ccctcgcctg cctctgccgg atcgacaagc agaatgacac caagatctac 600
cccttgccgc acatgtacat tgtcaaggac ctcgtgccag acttgaccca gttctacaag 660
cagtaccgat ccatcgagcc tttcctcaag tccaacaaca ccccttctga gggtgaacat 720
cttcagtcgc ccgaggagcg tcgtcgactc gacggtctgt acgagtgcat tctgtgcgcg 780
tgctgctcca catcctgccc ctcttactgg tggaatcagg acgagtacct tggccccgcc 840
gtgctcatgc aggcgtaccg atggatggcc gactcgcgtg acgactttgg tgaggagcga 900
agacagaagc tcgagaacac cttttcgctc taccgatgcc acaccatcat gaactgctcc 960
aggacctgcc ccaagaacct caaccctggt aaggcaattg cacagatcaa gaaggacatg 1020
gccgtcggcg cacccaaggc ttccgagcgc cctatcatgg cttcgtcgta atcttgatat 1080
atcatatcgt tctttcctca gcacttcttt tgtcaatttc aaaagtatct aattgcattc 1140
aactc 1145
<210> 53
<211> 1974
<212> DNA
<213> Pseudozyma tsukubaensis
<220>
<223> extended ip locus
<400> 53
cgtgttgcat gaggttgctg gggaggcttc acggtctttc acaccgagac ttttgggagc 60
tgggaggcgc aaagaggacc ctgagcagga tgcgtagaaa cgcagtgtgg agcttggccg 120
agttccgcaa aaatgtcaaa atgttacatc ttcaaataag acatcgactg cacagcggga 180
gcttacggat gcgccgggtc tcttccggtc taacacgatg gtaaattgta caaaatcggc 240
aggaaacggc gttccgccaa atgcgatgag gcaaaggcgc gctgttgtca attatgtcag 300
cgacgagcga gacttggcgg gaaaaagatt ctaatttcgc acactcacac tgctgcctgg 360
caggcgcgcg taggcatgcc caatcagact cgatttgatt tcaaagccaa aagctcaaat 420
tgcagcagtc agccactgca cactgtgact gcgaaattca gctgaaaagc cgatacaggc 480
cgagttttag aggcagcaca ctgcgaagct gagaaaatga gctacgaacg tgttttggta 540
atcagccggc gtaacccaca ctgcactgca cgcttgagag ggtcagggtg tgtgtggcta 600
cagcagcagc agcggcagac ttcgagttcc aactctcccc gcacaagcga ccgcgagttc 660
cattcggtca gagttggcaa gtctctcgcg cgcacacctt gagttgattg aaagattgta 720
gccaacgcca tcttcattgc tgaacaccat caccaatacc tacattcgta ctcgcatcac 780
acattggtcg tcatgtcgct tttcaacgtc agcaacggtc ttcgtgccgc cctccgaccc 840
tccatcgcga gctcgtcccg cgttactgct gctttctcga catccgcagc tgcccgtctt 900
gccacgccca ccaacgatgc tcctggctct ggcaagcctc agcacttgaa gcagttcaag 960
atctaccgct ggaaccccga caagccttcc gagaagcctc gtctccagtc ctacactctt 1020
gaccttaacc agaccggccc aatggtgctc gatgccttga ttaagatcaa gaacgagatc 1080
gaccccactc ttactttccg tcgctcgtgc cgtgaaggta tctgcggttc ttgcgccatg 1140
aacatcgacg gtgtcaacac ccttgcttgt ctttgccgaa ttgacaaggc caacgacacc 1200
aagatctacc ccctccctca catgtacgtc gtcaaggacc ttgttcctga cttgacccag 1260
ttctacaagc agtaccgttc catcgagcct ttcctcaagt ccaacaacac ccctgctgag 1320
ggagagcacc ttcagtcgcc cgaggagcgt cgtcgtctcg acggtcttta cgagtgcatt 1380
ctctgcgctt gctgctccac gtcctgcccc tcctactggt ggaaccagga cgagtacctt 1440
ggtcccgccg tcctcatgca ggcttaccga tggatggccg actcccgtga tgactttggt 1500
gaggagcgaa gacagaagct cgagaacacc ttctcgctct accgttgcca caccatcatg 1560
aactgctcca ggacttgccc caagaacctt aacccaggca aggccatctc ccagatcaag 1620
aaggacatgg ctgtcggtgc ccccaaggct gccgaccgtc ccatcatggc ctcgtcttaa 1680
gaaaagtaaa aggcttcggt agttcggttt gtattcgacc cttgtttcat tctttcaatc 1740
tagtcatttc gcattgcaat tcgttgttgc tcgtgtgtgt tactcgtccg tcaatttcag 1800
gttggttctt cgcaattttt cactgtagga gagagatcga agcaatgtct cacagcaaga 1860
cgttcgacta ccatgctctg aagtcatgtg gatcccaggt gttaaatgat agaggtaacc 1920
aacaatatat tcacaacgaa aaggtgacaa tcttaggcat acaggttgaa gcgt 1974
<210> 54
<211> 2001
<212> DNA
<213> Pseudozyma tsukubaensis
<220>
<223> upstream of SEQ ID NO 53
<400> 54
gcaaagtgga gtaagctgtg tttctcggat gccgggattc agaaagtggc gagaagaaca 60
ctcgtgctca aagcacatgg taacgttcgc tacgacgtcc tcactgtact tcgcaccctg 120
cactcctcat acccaagtcc tttgagcttc aagatgttag gcaccgtcac tagactggca 180
cgcgccgacc tgaagtcaag tcagctcacg ctagagcatt tcctcatgcg agctcgcact 240
ctttcgctct accgcaaata cctcagagct accagagaca ttccaaatcc gctcgctcga 300
tgggagacaa tccatttctt ccgggacgat gtccaccgct ttcgtcacga aacagatctg 360
gagaagatca aggacttgct tgtacagggc aaccgcttct tgaagcaaat gcaaggacag 420
atgactttgg cgggagcagc ttcggatggc aacgccaata agcttcgtgg cacacggcaa 480
ttgtgattgc tcaaaagctc aatcacaggc acagctttga ctcatcatgg cttagcccca 540
caccgcagct acgcaacgca cttgcgtcct acagctatat acctgaacgc cgcatcacag 600
caacacacaa gagcgacaca gagcagctag ccttaggcga ccagccttcg attcgttctc 660
tcgtcgaaag actgcaccag tctgctacat ttcatagatt ttcgcatgac ggcatcagcc 720
ccgggtcaca agcacggcga acgagcaaag gatcgaccat gctctcccgc tcaatacaat 780
atgccccgta cacttggctt cttggcagca gccagagccg aggcgtccat cagcacgatc 840
aaaggtcaat cagtctcagg accagcgaaa tattgcaaca ggaagcttca atttatgcct 900
ttacatcgtc tacatggtaa taccaaccca tcaaacagac tcgtcgagca gaacgtactc 960
tcgcgtgcta gccccaaatg tgagcgtgtc acccgatctg agctggtagt atctcgaagt 1020
aggaatctcc ttgtcgttga cgtaggagcc attactcgat tcgagatcga tcaagaaagg 1080
ctgtatacgc ttctttcggt ctccgaattc gttggttgtg atggtttggc ggtactgaag 1140
cacagcgtgc tgtttcgaac acgattcgtg atccagagga atgtcgacca ctgtacgatc 1200
tcgaccaaga aggaaacaag attgtgaagc gagatggagc acttgctgct ctttgccgtc 1260
tttgaaacag tagagacgcc atggcgtttt gggtttgcga gcttcaggtg gttcgtgata 1320
cttgagagcg acgccattga cggtatttga ttcggcggcg aggagtccag atggagcaaa 1380
gtttggagca tcttcgtcga atccttcctc gagagcgtga gaagcaggtg caggagggga 1440
tgcaggacgt ggcgagcgtg aagctacagg tcttgaagag gtggaagcgg ctggaattgg 1500
tgagcgtgag cgtgagcggc gagatggctc tttgtctttg cgagaggagc tctctcgagc 1560
ctctcgagcc tctcgatcat gtcgatcatg tcggcgatga cggtttgatg atgagtagtg 1620
gcgatgtgag cgatcatcgt ctcgcttccg attggagctg gagcgacggt cttcgtcgcg 1680
atgtcgtcga tgcctatcct catccctgtc atctcgatgc cttttggagc ttgagctcgc 1740
tcggtggctg tcgtctggat cctccttatg cctccttgat cctgaagaat gttctttgtc 1800
acccttattg tggctcgatc cgtgcctgtg cctgtcacgc tctgcgtctg catgttctcg 1860
atgtgagtgt gatctccttt cgcggtgttg atctcggtca tatctggagc tgcctgagcg 1920
attggaggat gatggcggga tgtctgcctt ctcagcaaca atgcgtcttg aggagccgga 1980
atcagctgct gagtccgaca t 2001
<210> 55
<211> 2000
<212> DNA
<213> Pseudozyma tsukubaensis
<220>
<223> downstream of SEQ ID NO 53
<400> 55
ttaccaagtg aagcagtcct caagcagatc gacatgtacg cctttcttca acatgtgcac 60
cgtctccacc ctgacgtcgt cgcataggct tggcggcccg caaagaccaa cagtcaagcc 120
tttgctctcc tgcaacattt gctcgttcaa gtgtccaaac atagcgccct tcaaactctc 180
cggtcggcct ccgaactggg acactgcgat cttggctccg ttggcgccgt ccgagaacaa 240
gtctgctcgg gcgtcaatat gctcgttgcg ctgctcttgc tgctgctttg gaatcatggc 300
aagctcgacg acttcgctcg taagctcgga cgaaggtgtg gagggttcgc cagcctgcga 360
ttcggattgc tggacgggca gcttctcctt gatcgaggcg gatgacgagg atcgagagta 420
aggcgtgctg gagatcgact tgtcagagtc agcttcgaca gcgcgcttcc ccccatcgac 480
ccgtccgtgc gaggtgacat agagatcgag agagaattgg cagcccttcc agctctcctg 540
tccctccatc tctttgatca gctctgcaaa cgcttcggca atcacagtca gcgtatctgt 600
aagtagatca aaacgacgtg ggtttttacg gagcgtcagc aagatgttcc cttgggataa 660
tttgagaacg gagcgagtct gagctacgga tacttacttt gttctcgaac gatccagata 720
agcttgcaag atttgagctt tttgttcgca gcactgccct tcactgcagc cacgaagagc 780
ggccagcagt aagtgatagc aatgccacca gcaaccagaa ctagatccgt agcatggtcg 840
atgttgggga tcacgccgaa aggtccttcg accagaacag ctacctttcc gttgtcatcc 900
gcgttcctgc cggccagctc aacatctttc tccgcaacct ctccgtgagt gtgagcattg 960
atgtggtggg cgagctttcg cgtaagacca gcctcggttt tgatgaccag atcgatgaag 1020
ccttgggtgg ggttttctgg ctgaacaccg acagagaaga cggtgaaagg atgctcgccg 1080
acccattgca agcgagggat tgtgatgcgg atgtcgtcgc cgccagcgat acctccgatc 1140
aagcgcggct ggttggcaag tcgcagcttc gatgcaggaa cagagataca caagcgagtg 1200
tactggctgt tcgagccata ggtgcggata tcgccagtgg cgcaagtgat gagcgaagat 1260
ccgcgaccgt tcattcgtgg ggacgagaac gagaggtaga tccggcttgc gagtcgagct 1320
acgcggtcga aagcccacac agcggccgcg atctctgtga gcacgacgaa catttggaac 1380
tgacatccga aagcattgag gagaggtgat ggtcagcatg tgtcgtcgta tcaaatcttt 1440
cagtgtacga gatgcatgtc gacatctgtc gaggtgtagt aaaagactta ccctgctcga 1500
tttgatcaag gagatgtgca ggtatgttcc cagaatagca aagaaagcca tagcgatgtg 1560
tagcatcaca aagatctgca aagaattgtc gttagcgtgt aaacatcaaa aagcaaaatg 1620
ccatggtcag cgtctactca aagatataca cgagtccaag acggatcact cacttcgtaa 1680
aagcgttgtc gcagagctcg aaccgaaaag aagaccagtc cgaacatcat actcaacgcc 1740
acaatacccc acgtaacata atcgtcctcg agcatctctg caactcctcc aggccgccta 1800
acgtaaatcg cagtccaagc cgaagcatga acaacaatgt gaagccagaa ccacctcgca 1860
atccacctgt gccacagcat aagactgttc atgttcaaac cggacatgat ggccaaagga 1920
gtccttttgc tcgccatcaa gatcaagagc ggaagttggg ccgttcccag aattgcagtt 1980
cgatcggcta agtgtcgagc 2000
<210> 56
<211> 5975
<212> DNA
<213> Pseudozyma tsukubaensis
<220>
<223> most extended ip locus
<400> 56
gcaaagtgga gtaagctgtg tttctcggat gccgggattc agaaagtggc gagaagaaca 60
ctcgtgctca aagcacatgg taacgttcgc tacgacgtcc tcactgtact tcgcaccctg 120
cactcctcat acccaagtcc tttgagcttc aagatgttag gcaccgtcac tagactggca 180
cgcgccgacc tgaagtcaag tcagctcacg ctagagcatt tcctcatgcg agctcgcact 240
ctttcgctct accgcaaata cctcagagct accagagaca ttccaaatcc gctcgctcga 300
tgggagacaa tccatttctt ccgggacgat gtccaccgct ttcgtcacga aacagatctg 360
gagaagatca aggacttgct tgtacagggc aaccgcttct tgaagcaaat gcaaggacag 420
atgactttgg cgggagcagc ttcggatggc aacgccaata agcttcgtgg cacacggcaa 480
ttgtgattgc tcaaaagctc aatcacaggc acagctttga ctcatcatgg cttagcccca 540
caccgcagct acgcaacgca cttgcgtcct acagctatat acctgaacgc cgcatcacag 600
caacacacaa gagcgacaca gagcagctag ccttaggcga ccagccttcg attcgttctc 660
tcgtcgaaag actgcaccag tctgctacat ttcatagatt ttcgcatgac ggcatcagcc 720
ccgggtcaca agcacggcga acgagcaaag gatcgaccat gctctcccgc tcaatacaat 780
atgccccgta cacttggctt cttggcagca gccagagccg aggcgtccat cagcacgatc 840
aaaggtcaat cagtctcagg accagcgaaa tattgcaaca ggaagcttca atttatgcct 900
ttacatcgtc tacatggtaa taccaaccca tcaaacagac tcgtcgagca gaacgtactc 960
tcgcgtgcta gccccaaatg tgagcgtgtc acccgatctg agctggtagt atctcgaagt 1020
aggaatctcc ttgtcgttga cgtaggagcc attactcgat tcgagatcga tcaagaaagg 1080
ctgtatacgc ttctttcggt ctccgaattc gttggttgtg atggtttggc ggtactgaag 1140
cacagcgtgc tgtttcgaac acgattcgtg atccagagga atgtcgacca ctgtacgatc 1200
tcgaccaaga aggaaacaag attgtgaagc gagatggagc acttgctgct ctttgccgtc 1260
tttgaaacag tagagacgcc atggcgtttt gggtttgcga gcttcaggtg gttcgtgata 1320
cttgagagcg acgccattga cggtatttga ttcggcggcg aggagtccag atggagcaaa 1380
gtttggagca tcttcgtcga atccttcctc gagagcgtga gaagcaggtg caggagggga 1440
tgcaggacgt ggcgagcgtg aagctacagg tcttgaagag gtggaagcgg ctggaattgg 1500
tgagcgtgag cgtgagcggc gagatggctc tttgtctttg cgagaggagc tctctcgagc 1560
ctctcgagcc tctcgatcat gtcgatcatg tcggcgatga cggtttgatg atgagtagtg 1620
gcgatgtgag cgatcatcgt ctcgcttccg attggagctg gagcgacggt cttcgtcgcg 1680
atgtcgtcga tgcctatcct catccctgtc atctcgatgc cttttggagc ttgagctcgc 1740
tcggtggctg tcgtctggat cctccttatg cctccttgat cctgaagaat gttctttgtc 1800
acccttattg tggctcgatc cgtgcctgtg cctgtcacgc tctgcgtctg catgttctcg 1860
atgtgagtgt gatctccttt cgcggtgttg atctcggtca tatctggagc tgcctgagcg 1920
attggaggat gatggcggga tgtctgcctt ctcagcaaca atgcgtcttg aggagccgga 1980
atcagctgct gagtccgaca tcgtgttgca tgaggttgct ggggaggctt cacggtcttt 2040
cacaccgaga cttttgggag ctgggaggcg caaagaggac cctgagcagg atgcgtagaa 2100
acgcagtgtg gagcttggcc gagttccgca aaaatgtcaa aatgttacat cttcaaataa 2160
gacatcgact gcacagcggg agcttacgga tgcgccgggt ctcttccggt ctaacacgat 2220
ggtaaattgt acaaaatcgg caggaaacgg cgttccgcca aatgcgatga ggcaaaggcg 2280
cgctgttgtc aattatgtca gcgacgagcg agacttggcg ggaaaaagat tctaatttcg 2340
cacactcaca ctgctgcctg gcaggcgcgc gtaggcatgc ccaatcagac tcgatttgat 2400
ttcaaagcca aaagctcaaa ttgcagcagt cagccactgc acactgtgac tgcgaaattc 2460
agctgaaaag ccgatacagg ccgagtttta gaggcagcac actgcgaagc tgagaaaatg 2520
agctacgaac gtgttttggt aatcagccgg cgtaacccac actgcactgc acgcttgaga 2580
gggtcagggt gtgtgtggct acagcagcag cagcggcaga cttcgagttc caactctccc 2640
cgcacaagcg accgcgagtt ccattcggtc agagttggca agtctctcgc gcgcacacct 2700
tgagttgatt gaaagattgt agccaacgcc atcttcattg ctgaacacca tcaccaatac 2760
ctacattcgt actcgcatca cacattggtc gtcatgtcgc ttttcaacgt cagcaacggt 2820
cttcgtgccg ccctccgacc ctccatcgcg agctcgtccc gcgttactgc tgctttctcg 2880
acatccgcag ctgcccgtct tgccacgccc accaacgatg ctcctggctc tggcaagcct 2940
cagcacttga agcagttcaa gatctaccgc tggaaccccg acaagccttc cgagaagcct 3000
cgtctccagt cctacactct tgaccttaac cagaccggcc caatggtgct cgatgccttg 3060
attaagatca agaacgagat cgaccccact cttactttcc gtcgctcgtg ccgtgaaggt 3120
atctgcggtt cttgcgccat gaacatcgac ggtgtcaaca cccttgcttg tctttgccga 3180
attgacaagg ccaacgacac caagatctac cccctccctc acatgtacgt cgtcaaggac 3240
cttgttcctg acttgaccca gttctacaag cagtaccgtt ccatcgagcc tttcctcaag 3300
tccaacaaca cccctgctga gggagagcac cttcagtcgc ccgaggagcg tcgtcgtctc 3360
gacggtcttt acgagtgcat tctctgcgct tgctgctcca cgtcctgccc ctcctactgg 3420
tggaaccagg acgagtacct tggtcccgcc gtcctcatgc aggcttaccg atggatggcc 3480
gactcccgtg atgactttgg tgaggagcga agacagaagc tcgagaacac cttctcgctc 3540
taccgttgcc acaccatcat gaactgctcc aggacttgcc ccaagaacct taacccaggc 3600
aaggccatct cccagatcaa gaaggacatg gctgtcggtg cccccaaggc tgccgaccgt 3660
cccatcatgg cctcgtctta agaaaagtaa aaggcttcgg tagttcggtt tgtattcgac 3720
ccttgtttca ttctttcaat ctagtcattt cgcattgcaa ttcgttgttg ctcgtgtgtg 3780
ttactcgtcc gtcaatttca ggttggttct tcgcaatttt tcactgtagg agagagatcg 3840
aagcaatgtc tcacagcaag acgttcgact accatgctct gaagtcatgt ggatcccagg 3900
tgttaaatga tagaggtaac caacaatata ttcacaacga aaaggtgaca atcttaggca 3960
tacaggttga agcgtttacc aagtgaagca gtcctcaagc agatcgacat gtacgccttt 4020
cttcaacatg tgcaccgtct ccaccctgac gtcgtcgcat aggcttggcg gcccgcaaag 4080
accaacagtc aagcctttgc tctcctgcaa catttgctcg ttcaagtgtc caaacatagc 4140
gcccttcaaa ctctccggtc ggcctccgaa ctgggacact gcgatcttgg ctccgttggc 4200
gccgtccgag aacaagtctg ctcgggcgtc aatatgctcg ttgcgctgct cttgctgctg 4260
ctttggaatc atggcaagct cgacgacttc gctcgtaagc tcggacgaag gtgtggaggg 4320
ttcgccagcc tgcgattcgg attgctggac gggcagcttc tccttgatcg aggcggatga 4380
cgaggatcga gagtaaggcg tgctggagat cgacttgtca gagtcagctt cgacagcgcg 4440
cttcccccca tcgacccgtc cgtgcgaggt gacatagaga tcgagagaga attggcagcc 4500
cttccagctc tcctgtccct ccatctcttt gatcagctct gcaaacgctt cggcaatcac 4560
agtcagcgta tctgtaagta gatcaaaacg acgtgggttt ttacggagcg tcagcaagat 4620
gttcccttgg gataatttga gaacggagcg agtctgagct acggatactt actttgttct 4680
cgaacgatcc agataagctt gcaagatttg agctttttgt tcgcagcact gcccttcact 4740
gcagccacga agagcggcca gcagtaagtg atagcaatgc caccagcaac cagaactaga 4800
tccgtagcat ggtcgatgtt ggggatcacg ccgaaaggtc cttcgaccag aacagctacc 4860
tttccgttgt catccgcgtt cctgccggcc agctcaacat ctttctccgc aacctctccg 4920
tgagtgtgag cattgatgtg gtgggcgagc tttcgcgtaa gaccagcctc ggttttgatg 4980
accagatcga tgaagccttg ggtggggttt tctggctgaa caccgacaga gaagacggtg 5040
aaaggatgct cgccgaccca ttgcaagcga gggattgtga tgcggatgtc gtcgccgcca 5100
gcgatacctc cgatcaagcg cggctggttg gcaagtcgca gcttcgatgc aggaacagag 5160
atacacaagc gagtgtactg gctgttcgag ccataggtgc ggatatcgcc agtggcgcaa 5220
gtgatgagcg aagatccgcg accgttcatt cgtggggacg agaacgagag gtagatccgg 5280
cttgcgagtc gagctacgcg gtcgaaagcc cacacagcgg ccgcgatctc tgtgagcacg 5340
acgaacattt ggaactgaca tccgaaagca ttgaggagag gtgatggtca gcatgtgtcg 5400
tcgtatcaaa tctttcagtg tacgagatgc atgtcgacat ctgtcgaggt gtagtaaaag 5460
acttaccctg ctcgatttga tcaaggagat gtgcaggtat gttcccagaa tagcaaagaa 5520
agccatagcg atgtgtagca tcacaaagat ctgcaaagaa ttgtcgttag cgtgtaaaca 5580
tcaaaaagca aaatgccatg gtcagcgtct actcaaagat atacacgagt ccaagacgga 5640
tcactcactt cgtaaaagcg ttgtcgcaga gctcgaaccg aaaagaagac cagtccgaac 5700
atcatactca acgccacaat accccacgta acataatcgt cctcgagcat ctctgcaact 5760
cctccaggcc gcctaacgta aatcgcagtc caagccgaag catgaacaac aatgtgaagc 5820
cagaaccacc tcgcaatcca cctgtgccac agcataagac tgttcatgtt caaaccggac 5880
atgatggcca aaggagtcct tttgctcgcc atcaagatca agagcggaag ttgggccgtt 5940
cccagaattg cagttcgatc ggctaagtgt cgagc 5975
<210> 57
<211> 1126
<212> DNA
<213> artificial
<220>
<223> (BsrGI)-pActin-olapACO1
<400> 57
atatatgtac aggcccgttc aacacaatgc gcctgcaatt tctatccccg ctttccacct 60
ctgtctccct cttcaaagtc acagagtctg ccatttgtat tcgagcatga aaaatgatga 120
cctcctttct tctcgttcaa tacagcggac atgaacaaga aaggggtggc ctgagccacc 180
aagttctaca cttgcagcca gacgtattca aaaatcgacg tggacgagtt gcgactcaac 240
atcctctgtg aattgcaatc gagtgagtga ttacgacctg tattcacgtc aaaatgcagg 300
tgtgacattt gaattttgaa atacatgagg caggctcgat ttgctccact caagtcgagt 360
ttgccaaatt caagaagcgc taatcggagc caaccgaccg accacaacca gccaaatcag 420
ccagccaagg cagagaagca gaagcaaagg cggtgcattg agaggtgagc cgtgtgctgt 480
gctgtgctct gctgtgctgt ctgtcaatgc ttgctgcgtg tgtttgtctc gcctctacag 540
cctgcccctc aagatgtgac cgattggaag gaaaggaagg tcacacgcag ttctggcatg 600
ccacgcacgc acagcccgaa attgcgatct caagagactg ccgacgccgc cgtccgccgt 660
tgagcgctct gcttgggtca aagcgtaagc gcttctcgaa ttcaaactca cagagttcca 720
agtctgcaca ggtcatctgt tcgtcctttt gagactgcct gactggctgg ctggaacgca 780
cgcacgcaca cttccgattc gacaccgccc gctgctgctg tcttctgcgc tcttgtgccc 840
ttcttctgta cttggccttt gcgtcgactt ctttgcttgc tcggcagtgc cgtctcatct 900
gccccaagtc aagctcagca gcacagcaca cacgcatcac cctctcggct tgggtttgcc 960
cctgttgcct gtctgtccac actcacacac atccctatcg cttgctcgac atcatcgctt 1020
acctcttccc caccacctcg tctttgacac ctttactttc tcaacccctc ttccaccacc 1080
aaccccccca ccacttactt tcaacatgct tccccttcgc gcactc 1126
<210> 58
<211> 3507
<212> DNA
<213> artificial
<220>
<223> (BsrGI)_pActin_ACO1_(NsiI)
<400> 58
atatatgtac aggcccgttc aacacaatgc gcctgcaatt tctatccccg ctttccacct 60
ctgtctccct cttcaaagtc acagagtctg ccatttgtat tcgagcatga aaaatgatga 120
cctcctttct tctcgttcaa tacagcggac atgaacaaga aaggggtggc ctgagccacc 180
aagttctaca cttgcagcca gacgtattca aaaatcgacg tggacgagtt gcgactcaac 240
atcctctgtg aattgcaatc gagtgagtga ttacgacctg tattcacgtc aaaatgcagg 300
tgtgacattt gaattttgaa atacatgagg caggctcgat ttgctccact caagtcgagt 360
ttgccaaatt caagaagcgc taatcggagc caaccgaccg accacaacca gccaaatcag 420
ccagccaagg cagagaagca gaagcaaagg cggtgcattg agaggtgagc cgtgtgctgt 480
gctgtgctct gctgtgctgt ctgtcaatgc ttgctgcgtg tgtttgtctc gcctctacag 540
cctgcccctc aagatgtgac cgattggaag gaaaggaagg tcacacgcag ttctggcatg 600
ccacgcacgc acagcccgaa attgcgatct caagagactg ccgacgccgc cgtccgccgt 660
tgagcgctct gcttgggtca aagcgtaagc gcttctcgaa ttcaaactca cagagttcca 720
agtctgcaca ggtcatctgt tcgtcctttt gagactgcct gactggctgg ctggaacgca 780
cgcacgcaca cttccgattc gacaccgccc gctgctgctg tcttctgcgc tcttgtgccc 840
ttcttctgta cttggccttt gcgtcgactt ctttgcttgc tcggcagtgc cgtctcatct 900
gccccaagtc aagctcagca gcacagcaca cacgcatcac cctctcggct tgggtttgcc 960
cctgttgcct gtctgtccac actcacacac atccctatcg cttgctcgac atcatcgctt 1020
acctcttccc caccacctcg tctttgacac ctttactttc tcaacccctc ttccaccacc 1080
aaccccccca ccacttactt tcaacatgct tccccttcgc gcactccgtt cttcctccct 1140
ccgggctgcc gccaaggctc ccctcgccag gggctatgcc accaccgtcg ccgaggaggc 1200
tgccgaaatc tcgccttccc tcttcgacaa gaaggttgag atgtccgttg tcgagtccgg 1260
caagggttac tacatcaact acaagcgtat cgaggacaac ctcaaggtcg ttcgatcccg 1320
cctcaaccga cctctttcgc tcgccgagaa gatcgtttac ggtcacttgg acaaccccca 1380
cgagcaggaa atcacccgtg gccagtccta cctcaagctc cgccctgacc gtgttgcttg 1440
ccaggatgcc accgcccaga tggccctcct ccaattcatg tcggctggtc ttcccaccgt 1500
cgccgtcccc tccaccgtcc actgtgatca ccttatcgag gctcaggtcg gcggtgccaa 1560
ggacttggcc cgtgctatcg agatcaacaa ggaggtttac gacttccttg ccactgccac 1620
tgccaagtac ggtcttggtt tctggaagcc cggatctggt atcatccacc agatcatcct 1680
tgagaactac gccttccccg gtggtctcat gatcggtacc gactcgcaca cccccaacgc 1740
cggtggtctc ggtatgatcg cctgtggtgt cggaggtgcc gacgctgtcg acgtcatggc 1800
tgacatcccc tgggagctca aggcccccaa ggtgatcggt gtcgagctca agggtaagct 1860
ctcgggctgg accaccccta aggatgttat cctcaaggtc gctggtgagc tcaccgttaa 1920
gggtggtacc ggtgccatca tcgagtacaa gggtgctggt gtcgactcgc tctcgtgcac 1980
tggtatggcc accatctgca acatgggtgc cgagattggt gctaccacct ccgtcttccc 2040
ttacaacgag cgcatgggtg actacctccg tgccaccaac cgttccgaca ttgctgacct 2100
cgccaagggc ttccagcgca accttcttcc cgactcgggt gccgagtacg actcgcacat 2160
cgagatcaac ctcgacaccc tcgagcccca catcaacggt cccttcaccc ccgatcttgc 2220
cacccccctc tccaagttcg ccgaggccgt caagaagaac gactggcccg aggagctcaa 2280
ggtttcgctc atcggttcgt gcaccaactc ctcgtacgag gacatgagcc gatccgcctc 2340
catcgctgag gaggctgccg cccacggcct caaggtcaag tcggccttca ccatcacccc 2400
cggttccgag cagattcgtg ctaccatcga gcgtgacggt cagatggccg ccctcgagaa 2460
cgctggtggt atggttcttg ccaacgcctg tggcccttgc attggtcagt gggaccgaaa 2520
ggacatcaag aagggtgaca agaactcgat catcacttct tacaaccgta acttcactgg 2580
tcgtaacgac gccaaccctg ctacccacgc tttcgtcgcc tcgcccgatc tcgttaccgc 2640
catggctttc gccggtaagc tcaccttcaa ccccatgacc gacagcctca agggtgctga 2700
cggcaaggag ttcaagttca ccgcccccag cggtaaggag ctccctcccc gcggctacga 2760
ccccggtaac aacacctacc aagacccccc caaggaccgc tcttcggttc aggtcgccat 2820
tgaccccaag tcggaccgtc tccagaggct cgagcccttc aagccctgga acggcaagaa 2880
ccccaccgac tgccccgtcc tcattaaggc tcagggcaag tgcaccactg accacatctc 2940
ggccggtggt ccttggctca agtaccgtgg tcaccttgag aacatctcga acaactgttt 3000
gattggtgcc atcaacgctg ccaacggcaa ggccaacgag gtccagaacg tcttctccgg 3060
cgagtggggc cccgttcccg ccactgccat ctcgtaccgt gagcagggca agccctgggt 3120
tgtcattggt gacgagaact acggtgaggg ttcgtcgcgt gagcacgccg ctcttgagcc 3180
ccgtttcctc ggtggttgcg ccgtcattgc ccgttcgttc gctcgtatcc accagaccaa 3240
cttgcgcaag cagggtatgc tcgccttcga gttcgccaac cccgctgact acgacaaggt 3300
tcgccccgat gaccttgttg acattctcgg tgttaccgag ctcgctgagg gctccaaggt 3360
ttcgctcctt gccaagcaca aggacggctc caaggatgag atccccctta cccacaccat 3420
gaacgacaat cagatctcgt ggttcaagca cggttcggcc ctcaacagga tggctgctgc 3480
cgccaagtcc gcctaaatgc attatat 3507
<210> 59
<211> 2702
<212> DNA
<213> artificial
<220>
<223> (KpnI)-pActin-ADI1-(NsiI)
<400> 59
atataggtac cggcccgttc aacacaatgc gcctgcaatt tctatccccg ctttccacct 60
ctgtctccct cttcaaagtc acagagtctg ccatttgtat tcgagcatga aaaatgatga 120
cctcctttct tctcgttcaa tacagcggac atgaacaaga aaggggtggc ctgagccacc 180
aagttctaca cttgcagcca gacgtattca aaaatcgacg tggacgagtt gcgactcaac 240
atcctctgtg aattgcaatc gagtgagtga ttacgacctg tattcacgtc aaaatgcagg 300
tgtgacattt gaattttgaa atacatgagg caggctcgat ttgctccact caagtcgagt 360
ttgccaaatt caagaagcgc taatcggagc caaccgaccg accacaacca gccaaatcag 420
ccagccaagg cagagaagca gaagcaaagg cggtgcattg agaggtgagc cgtgtgctgt 480
gctgtgctct gctgtgctgt ctgtcaatgc ttgctgcgtg tgtttgtctc gcctctacag 540
cctgcccctc aagatgtgac cgattggaag gaaaggaagg tcacacgcag ttctggcatg 600
ccacgcacgc acagcccgaa attgcgatct caagagactg ccgacgccgc cgtccgccgt 660
tgagcgctct gcttgggtca aagcgtaagc gcttctcgaa ttcaaactca cagagttcca 720
agtctgcaca ggtcatctgt tcgtcctttt gagactgcct gactggctgg ctggaacgca 780
cgcacgcaca cttccgattc gacaccgccc gctgctgctg tcttctgcgc tcttgtgccc 840
ttcttctgta cttggccttt gcgtcgactt ctttgcttgc tcggcagtgc cgtctcatct 900
gccccaagtc aagctcagca gcacagcaca cacgcatcac cctctcggct tgggtttgcc 960
cctgttgcct gtctgtccac actcacacac atccctatcg cttgctcgac atcatcgctt 1020
acctcttccc caccacctcg tctttgacac ctttactttc tcaacccctc ttccaccacc 1080
aaccccccca ccacttactt tcaacatgtc gaatcctctt gcgggacgtg tcaagtggtt 1140
cagaaggata gtaggtactt ccatggcctc gaccgaagaa ctcaggcgaa gaaagatcat 1200
ataacgacgt tttggttagc cgtccatctt attggctttt gtcgttagtc acactgacag 1260
cttcacgatg ctgcgaggca ttgagaccac aatttaccgc gctggcacca gtcgtggctt 1320
atacctcttg gcaagtgacc tgccatccga gccaagcgct cgtgatgcgg cgctgctgtc 1380
catcatgggt tccggacatc cactgcagat cgacggtatg gggggtggca attctctgac 1440
ttcaaaagtg gccatagtct cgccaagtgc acagagcgat cactccgatg ttgactacct 1500
cttttgccaa gttggcatca atgagcgcat cgtcgacaca gcacccaact gcggcaattt 1560
gatgagcggg gtggctgcct tcgcgatcga gcgaggtcta gtcaagcctc atccatccga 1620
caccacctgc cttgtgcgca tctttaatct caactccaac caggcatccg agctcctcat 1680
tccggttcaa gatggtcgag tccactacaa agatgtggac gatacgggct tgcagcgtcc 1740
ttcggctcgc gtcagcttac gcttccttaa taccgtgggt gcatgcacag gcaagcttct 1800
tccaactggc aatgccactg actcaatcga gggactcgag gtatccgtca tcgattcggc 1860
catccctgtt gtttttgttc gtcaagccga tgttggtatc acaggtttcg agaccccagc 1920
gacgctcaat gcggacactg ccttgctatc tcgactggaa cgtgtacgcc tggaggcagg 1980
tcgacgaatg ggctggggtg atgtttcttc tagcgtggtg cccaaattgt ctctcatcgg 2040
accaggttcc aattgcacca cttttacggc acggtgtaag ttctcaacgc tgaattgacc 2100
gtaccttgtt gaatgattga cggctgctga ttctcagttc ctttttgtcc aacagacttc 2160
actcccaaaa cttgccacaa cgcacacgcc gtcaccggtg ccatctgcac cgccggagcc 2220
gcctatgtac ctggaacggt ggtctcggac atcttttcgt cacgcactcc ttcgctctct 2280
tcatcgcctg gcgataccac ccctccctac acgcctcagc gtcgcatctc tatcgaacat 2340
cctagtggcg ttctcgagat tggacttaca gccgccgaaa gcgactcacc ccgttcgcta 2400
gatattgccc acgttgagcg ttccgtagcc ctgattgcac acgcccgcgt ctattatact 2460
atgcctgatc ggcacccttc ggttgaaata ccgatcatct cacccgtcac tccaaccagc 2520
gcggagatgc tcgatagggc atatcagtcg ctggcgctcg cattgggaag aggtaaagat 2580
agatctcaca tcattccact tggttcggaa gggaaggaaa gtgagctata ttacaatatg 2640
ccggacagca ctgtgtctag ctaccgcggc acgcattcca cagccctatg aatgcattat 2700
at 2702
<210> 60
<211> 2589
<212> DNA
<213> artificial
<220>
<223> (KpnI)-pActin-AtCAD1-(NsiI)
<400> 60
atataggtac cggcccgttc aacacaatgc gcctgcaatt tctatccccg ctttccacct 60
ctgtctccct cttcaaagtc acagagtctg ccatttgtat tcgagcatga aaaatgatga 120
cctcctttct tctcgttcaa tacagcggac atgaacaaga aaggggtggc ctgagccacc 180
aagttctaca cttgcagcca gacgtattca aaaatcgacg tggacgagtt gcgactcaac 240
atcctctgtg aattgcaatc gagtgagtga ttacgacctg tattcacgtc aaaatgcagg 300
tgtgacattt gaattttgaa atacatgagg caggctcgat ttgctccact caagtcgagt 360
ttgccaaatt caagaagcgc taatcggagc caaccgaccg accacaacca gccaaatcag 420
ccagccaagg cagagaagca gaagcaaagg cggtgcattg agaggtgagc cgtgtgctgt 480
gctgtgctct gctgtgctgt ctgtcaatgc ttgctgcgtg tgtttgtctc gcctctacag 540
cctgcccctc aagatgtgac cgattggaag gaaaggaagg tcacacgcag ttctggcatg 600
ccacgcacgc acagcccgaa attgcgatct caagagactg ccgacgccgc cgtccgccgt 660
tgagcgctct gcttgggtca aagcgtaagc gcttctcgaa ttcaaactca cagagttcca 720
agtctgcaca ggtcatctgt tcgtcctttt gagactgcct gactggctgg ctggaacgca 780
cgcacgcaca cttccgattc gacaccgccc gctgctgctg tcttctgcgc tcttgtgccc 840
ttcttctgta cttggccttt gcgtcgactt ctttgcttgc tcggcagtgc cgtctcatct 900
gccccaagtc aagctcagca gcacagcaca cacgcatcac cctctcggct tgggtttgcc 960
cctgttgcct gtctgtccac actcacacac atccctatcg cttgctcgac atcatcgctt 1020
acctcttccc caccacctcg tctttgacac ctttactttc tcaacccctc ttccaccacc 1080
aaccccccca ccacttactt tcaacatgac caagcaatct gcggacagca acgcaaagtc 1140
aggagttacg tccgaaatat gtcattgggc atccaacctg gccactgacg acatcccttc 1200
ggacgtatta gaaagagcaa aataccttat tctcgacggt attgcatgtg cctgggttgg 1260
tgcaagagtg ccttggtcag agaagtatgt tcaggcaacg atgagctttg agccgccggg 1320
ggcctgcagg gtgattggat atgggcagaa actggggcct gttgcagcag ccatgaccaa 1380
ttccgctttc atacaggcta cggagcttga cgactaccac agcgaagccc ccctacactc 1440
tgcaagcatt gtccttcctg cggtctttgc agcaagtgag gtcttagccg agcagggcaa 1500
aacaatttcc ggtatagatg ttattctagc cgccattgtg gggtttgaat ctggcccacg 1560
gatcggcaaa gcaatctacg gatcggacct cttgaacaac ggctggcatt gtggagctgt 1620
gtatggcgct ccagccggtg cgctggccac aggaaagctc ctcggtctaa ctccagactc 1680
catggaagat gctctcggaa ttgcgtgcac gcaagcctgt ggtttaatgt cggcgcaata 1740
cggaggcatg gtaaagcgtg tgcaacacgg attcgcagcg cgtaatggtc ttcttggggg 1800
actgttggcc catggtgggt acgaggcaat gaaaggtgtc ctggagagat cttacggcgg 1860
tttcctcaag atgttcacca agggcaacgg cagagagcct ccctacaaag aggaggaagt 1920
ggtggctggt ctcggttcat tctggcatac ctttactatt cgcatcaagc tctatgcctg 1980
ctgcggactt gtccatggtc cagtcgaggc tatcgaaaac cttcagggga gataccccga 2040
gctcttgaat agagccaacc tcagcaacat tcgccatgtt catgtacagc tttcaacggc 2100
ctcgaacagt cactgtggat ggataccaga ggagagaccc atcagttcaa tcgcagggca 2160
gatgagtgtc gcatacattc tcgccgtcca gctggtcgac cagcaatgtc ttttgtccca 2220
gttttctgag tttgatgaca acctggagag gccagaagtt tgggatctgg ccaggaaggt 2280
tacttcatct caaagcgaag agtttgatca agacggcaac tgtctcagtg cgggtcgcgt 2340
gaggattgag ttcaacgatg gttcttctat tacggaaagt gtcgagaagc ctcttggtgt 2400
caaagagccc atgccaaacg aacggattct ccacaaatac cgaacccttg ctggtagcgt 2460
gacggacgaa tcccgggtga aagagattga ggatcttgtc ctcggcctgg acaggctcac 2520
cgacattagc ccattgctgg agctgctgaa ttgccccgtg aaatcgccac tggtataaat 2580
gcattatat 2589
<210> 61
<211> 2971
<212> DNA
<213> artificial
<220>
<223> (KpnI)-pActin-ITP1-(NsiI)
<400> 61
atataggtac cggcccgttc aacacaatgc gcctgcaatt tctatccccg ctttccacct 60
ctgtctccct cttcaaagtc acagagtctg ccatttgtat tcgagcatga aaaatgatga 120
cctcctttct tctcgttcaa tacagcggac atgaacaaga aaggggtggc ctgagccacc 180
aagttctaca cttgcagcca gacgtattca aaaatcgacg tggacgagtt gcgactcaac 240
atcctctgtg aattgcaatc gagtgagtga ttacgacctg tattcacgtc aaaatgcagg 300
tgtgacattt gaattttgaa atacatgagg caggctcgat ttgctccact caagtcgagt 360
ttgccaaatt caagaagcgc taatcggagc caaccgaccg accacaacca gccaaatcag 420
ccagccaagg cagagaagca gaagcaaagg cggtgcattg agaggtgagc cgtgtgctgt 480
gctgtgctct gctgtgctgt ctgtcaatgc ttgctgcgtg tgtttgtctc gcctctacag 540
cctgcccctc aagatgtgac cgattggaag gaaaggaagg tcacacgcag ttctggcatg 600
ccacgcacgc acagcccgaa attgcgatct caagagactg ccgacgccgc cgtccgccgt 660
tgagcgctct gcttgggtca aagcgtaagc gcttctcgaa ttcaaactca cagagttcca 720
agtctgcaca ggtcatctgt tcgtcctttt gagactgcct gactggctgg ctggaacgca 780
cgcacgcaca cttccgattc gacaccgccc gctgctgctg tcttctgcgc tcttgtgccc 840
ttcttctgta cttggccttt gcgtcgactt ctttgcttgc tcggcagtgc cgtctcatct 900
gccccaagtc aagctcagca gcacagcaca cacgcatcac cctctcggct tgggtttgcc 960
cctgttgcct gtctgtccac actcacacac atccctatcg cttgctcgac atcatcgctt 1020
acctcttccc caccacctcg tctttgacac ctttactttc tcaacccctc ttccaccacc 1080
aaccccccca ccacttactt tcaacatgct tccacagaca cctgttccag attaccgtct 1140
cagcatgaga tattcgacag acagcgtcgc agcatcgcaa gcgttaacaa cgcctgaagc 1200
agctccaagt atttcccatc acgcagacac gggcgaggtt caacaggcgc atagcggcga 1260
tgacggcgcg ctcgaagagg gcgcaattgc tcactcaagt aaggaagggt cacaacgaga 1320
tcagcaaacg gagctttact gtgctttcac aaagggcacc aagctcttcg tcgtcttgtc 1380
cgtgtctatc gcgggctttt tctcgccatt ctccatcaat atatatatcc ctgcgttgcc 1440
tcagatctcg aagctactac atacatcgga aggtgagtga gacgatttct cgtagagaca 1500
gtttcccaga agcagctcct catcatcata ttttgtctta ttgtagcggc tactaatgta 1560
acggtaaccg tctacatgat cgcacaaggc ctctcgccgg tcatctgggc acctctttca 1620
gatgtaagtc cccattttat gtgacgcctg tctctgttgt aagatgtttc cacaggatca 1680
atctctgaaa tttctcgcct gtcaaatcgg cacgtacagg tttttggccg cagacccatc 1740
tacattgcaa ctttcctcgt ttttttcgtc gccaatcttg ggctttcgtt caccaatgtc 1800
tactggctct tggtcgtctt gcgtatggtt caagccgcag gagcatgcag cgccatcgct 1860
attggcgcag gaacgattgg cgatgttacc gagcgcaagg aacgaggaag ttatatgggc 1920
tattatgcgc ttgcccaata tactggtcca gccatcgggc ccgtaattgg aggtgcgctt 1980
tcgcaaagat gggattacca ttctaccttc ttcttcctca gtgccgtttc tggtgtcttt 2040
ctgatcttca tggccttctt cttacttgaa acgcttcgtg ttctagtggg gaacggaagt 2100
gcacgcacat tcggcatcta tcgcacttta gtgggaccca gactggtcaa gtcgacggca 2160
aattcgatgc gtccaaggat gaagagtccg cttgaaggtc gactcgaatt tggattccat 2220
cgtccatttt tggtgtttgc acgccccgag actagcctgg caatcctggc tttttcgatg 2280
gtgtatgcaa catactatct atcgtctgcc tctttgcctt atctcttcaa gcaagtatat 2340
ggtctacacg agctactcat tggggtatgc ttcgtgccta gtggtgttgg ttgtgccttg 2400
ggcacggtgc tcgctggcaa gatcctcgat tcggactatc gacgcgcgtt agacaagaac 2460
aagtcgggtg tcaaggttac gcgcgcacgg ctgcagtcgg cctggatcta cttgccaggc 2520
tatgcctcct cgcttctagc gtacggatgg tgtgttcggg cgcataccca catcgccgct 2580
cccatccttt ttcagtttac acgtaagtga gaattcaatc ttccgaatcg tggatcctgt 2640
tcgtgtacag cagtgctgac tctgcctttc aattaatcta cgaaacagtc ggcatgtttt 2700
caacaatgta cttcaccaac atcaacacac tcgttgtgga tctgtacccg ggcaaggcag 2760
ctactgccac agctgctgtt aacgtagggc gttgcttact cggcgctgtg gctgtggcca 2820
tcgtacaacc aatgaccgat gctatgggcg ctggatggac attcacagtc ggcgcgctcc 2880
ttgctctgtt catcggtctg atttgccaga cactcattca ctttcatggc gagaagtggg 2940
cagctcgcaa gcactcttga atgcattata t 2971
<210> 62
<211> 2234
<212> DNA
<213> artificial
<220>
<223> (KpnI)-pActin-MTT1-(SdaI)
<400> 62
atataggtac cggcccgttc aacacaatgc gcctgcaatt tctatccccg ctttccacct 60
ctgtctccct cttcaaagtc acagagtctg ccatttgtat tcgagcatga aaaatgatga 120
cctcctttct tctcgttcaa tacagcggac atgaacaaga aaggggtggc ctgagccacc 180
aagttctaca cttgcagcca gacgtattca aaaatcgacg tggacgagtt gcgactcaac 240
atcctctgtg aattgcaatc gagtgagtga ttacgacctg tattcacgtc aaaatgcagg 300
tgtgacattt gaattttgaa atacatgagg caggctcgat ttgctccact caagtcgagt 360
ttgccaaatt caagaagcgc taatcggagc caaccgaccg accacaacca gccaaatcag 420
ccagccaagg cagagaagca gaagcaaagg cggtgcattg agaggtgagc cgtgtgctgt 480
gctgtgctct gctgtgctgt ctgtcaatgc ttgctgcgtg tgtttgtctc gcctctacag 540
cctgcccctc aagatgtgac cgattggaag gaaaggaagg tcacacgcag ttctggcatg 600
ccacgcacgc acagcccgaa attgcgatct caagagactg ccgacgccgc cgtccgccgt 660
tgagcgctct gcttgggtca aagcgtaagc gcttctcgaa ttcaaactca cagagttcca 720
agtctgcaca ggtcatctgt tcgtcctttt gagactgcct gactggctgg ctggaacgca 780
cgcacgcaca cttccgattc gacaccgccc gctgctgctg tcttctgcgc tcttgtgccc 840
ttcttctgta cttggccttt gcgtcgactt ctttgcttgc tcggcagtgc cgtctcatct 900
gccccaagtc aagctcagca gcacagcaca cacgcatcac cctctcggct tgggtttgcc 960
cctgttgcct gtctgtccac actcacacac atccctatcg cttgctcgac atcatcgctt 1020
acctcttccc caccacctcg tctttgacac ctttactttc tcaacccctc ttccaccacc 1080
aaccccccca ccacttactt tcaacatgcc gtccgttcaa cgcaacatct ctccttcagt 1140
ctcggtgctg gccggtgcga ctgcaggcgc tgttgaagga ggtgagttct atcgctttcg 1200
cctcgtccat tttgctagta attttacctt acaatcttct tgtcttcctt agtggccact 1260
ttccccatcg agtatctcaa gacagttaca cagttcgcac agcgagatac tcacggcaat 1320
cgtgaacgtc tttcaccatt ggatgttttc cgatcaacac ttgaaaaaga agggcctaga 1380
gggctctttc gtggttgttc ggctgtagtt gtcggcaacg cttccaaggc tggtgttcgc 1440
tttttggctt ttgagaattt tcgaaatatg ctcaagaaca aatcaacagt gagtgttttc 1500
ccctagcatg gatgcattag gaaatagact gacactgaaa tctttcgcag gggaaattat 1560
cgagcggtag caactacatt gcaggaatgg gcgctggcac gctggaagcc atattcgctg 1620
tgacaccgag tgaaacgatc agtgagtgcc cacgcaaact cgcagaacag aaccaaagaa 1680
gggcgagaca gactgacctt gcgctgtatt gctttcacca gaaacaaaac tcatcgacga 1740
cggcaagcgt gccaaaccac gctacgaaca gggtctcttc cgtggaaccg cctcgatcat 1800
ccgacaagaa gggtttggcg gtatctacaa aggtgtattt ccagtcattc tacgccaagg 1860
ctcggcctca gcgatccgac taggtacata ctctgctatg cgagatttca ttcccaaagc 1920
ccaaggcaag ggttcatcct tcgtcaattg gttgaccact ttctccatcg gtgctacatc 1980
tggcgttgtc gccgtgtatg ggaccatgcc atttgacgtt ctcaaaacga ggatgcaggc 2040
catcgacgct tcgcgctacc gatccacgtg gcactgcttg accgacacca tcggtacaga 2100
gggcatagca gctctgtggc gtggttccgt atcacgtagt atgcgcctca tcgttagtgg 2160
aggagtcatt tttagcgtgt atgaacaggt agtttggctt ctcgccggtc ccgagttttg 2220
acctgcaggt atat 2234
<210> 63
<211> 1125
<212> DNA
<213> artificial
<220>
<223> (KpnI)-pActin-olapADI1
<400> 63
atataggtac cggcccgttc aacacaatgc gcctgcaatt tctatccccg ctttccacct 60
ctgtctccct cttcaaagtc acagagtctg ccatttgtat tcgagcatga aaaatgatga 120
cctcctttct tctcgttcaa tacagcggac atgaacaaga aaggggtggc ctgagccacc 180
aagttctaca cttgcagcca gacgtattca aaaatcgacg tggacgagtt gcgactcaac 240
atcctctgtg aattgcaatc gagtgagtga ttacgacctg tattcacgtc aaaatgcagg 300
tgtgacattt gaattttgaa atacatgagg caggctcgat ttgctccact caagtcgagt 360
ttgccaaatt caagaagcgc taatcggagc caaccgaccg accacaacca gccaaatcag 420
ccagccaagg cagagaagca gaagcaaagg cggtgcattg agaggtgagc cgtgtgctgt 480
gctgtgctct gctgtgctgt ctgtcaatgc ttgctgcgtg tgtttgtctc gcctctacag 540
cctgcccctc aagatgtgac cgattggaag gaaaggaagg tcacacgcag ttctggcatg 600
ccacgcacgc acagcccgaa attgcgatct caagagactg ccgacgccgc cgtccgccgt 660
tgagcgctct gcttgggtca aagcgtaagc gcttctcgaa ttcaaactca cagagttcca 720
agtctgcaca ggtcatctgt tcgtcctttt gagactgcct gactggctgg ctggaacgca 780
cgcacgcaca cttccgattc gacaccgccc gctgctgctg tcttctgcgc tcttgtgccc 840
ttcttctgta cttggccttt gcgtcgactt ctttgcttgc tcggcagtgc cgtctcatct 900
gccccaagtc aagctcagca gcacagcaca cacgcatcac cctctcggct tgggtttgcc 960
cctgttgcct gtctgtccac actcacacac atccctatcg cttgctcgac atcatcgctt 1020
acctcttccc caccacctcg tctttgacac ctttactttc tcaacccctc ttccaccacc 1080
aaccccccca ccacttactt tcaacatgtc gaatcctctt gcggg 1125
<210> 64
<211> 1125
<212> DNA
<213> artificial
<220>
<223> (KpnI)-pActin-olapAtCAD1
<400> 64
atataggtac cggcccgttc aacacaatgc gcctgcaatt tctatccccg ctttccacct 60
ctgtctccct cttcaaagtc acagagtctg ccatttgtat tcgagcatga aaaatgatga 120
cctcctttct tctcgttcaa tacagcggac atgaacaaga aaggggtggc ctgagccacc 180
aagttctaca cttgcagcca gacgtattca aaaatcgacg tggacgagtt gcgactcaac 240
atcctctgtg aattgcaatc gagtgagtga ttacgacctg tattcacgtc aaaatgcagg 300
tgtgacattt gaattttgaa atacatgagg caggctcgat ttgctccact caagtcgagt 360
ttgccaaatt caagaagcgc taatcggagc caaccgaccg accacaacca gccaaatcag 420
ccagccaagg cagagaagca gaagcaaagg cggtgcattg agaggtgagc cgtgtgctgt 480
gctgtgctct gctgtgctgt ctgtcaatgc ttgctgcgtg tgtttgtctc gcctctacag 540
cctgcccctc aagatgtgac cgattggaag gaaaggaagg tcacacgcag ttctggcatg 600
ccacgcacgc acagcccgaa attgcgatct caagagactg ccgacgccgc cgtccgccgt 660
tgagcgctct gcttgggtca aagcgtaagc gcttctcgaa ttcaaactca cagagttcca 720
agtctgcaca ggtcatctgt tcgtcctttt gagactgcct gactggctgg ctggaacgca 780
cgcacgcaca cttccgattc gacaccgccc gctgctgctg tcttctgcgc tcttgtgccc 840
ttcttctgta cttggccttt gcgtcgactt ctttgcttgc tcggcagtgc cgtctcatct 900
gccccaagtc aagctcagca gcacagcaca cacgcatcac cctctcggct tgggtttgcc 960
cctgttgcct gtctgtccac actcacacac atccctatcg cttgctcgac atcatcgctt 1020
acctcttccc caccacctcg tctttgacac ctttactttc tcaacccctc ttccaccacc 1080
aaccccccca ccacttactt tcaacatgac caagcaatct gcgga 1125
<210> 65
<211> 1125
<212> DNA
<213> artificial
<220>
<223> (KpnI)-pActin-olapITP1
<400> 65
atataggtac cggcccgttc aacacaatgc gcctgcaatt tctatccccg ctttccacct 60
ctgtctccct cttcaaagtc acagagtctg ccatttgtat tcgagcatga aaaatgatga 120
cctcctttct tctcgttcaa tacagcggac atgaacaaga aaggggtggc ctgagccacc 180
aagttctaca cttgcagcca gacgtattca aaaatcgacg tggacgagtt gcgactcaac 240
atcctctgtg aattgcaatc gagtgagtga ttacgacctg tattcacgtc aaaatgcagg 300
tgtgacattt gaattttgaa atacatgagg caggctcgat ttgctccact caagtcgagt 360
ttgccaaatt caagaagcgc taatcggagc caaccgaccg accacaacca gccaaatcag 420
ccagccaagg cagagaagca gaagcaaagg cggtgcattg agaggtgagc cgtgtgctgt 480
gctgtgctct gctgtgctgt ctgtcaatgc ttgctgcgtg tgtttgtctc gcctctacag 540
cctgcccctc aagatgtgac cgattggaag gaaaggaagg tcacacgcag ttctggcatg 600
ccacgcacgc acagcccgaa attgcgatct caagagactg ccgacgccgc cgtccgccgt 660
tgagcgctct gcttgggtca aagcgtaagc gcttctcgaa ttcaaactca cagagttcca 720
agtctgcaca ggtcatctgt tcgtcctttt gagactgcct gactggctgg ctggaacgca 780
cgcacgcaca cttccgattc gacaccgccc gctgctgctg tcttctgcgc tcttgtgccc 840
ttcttctgta cttggccttt gcgtcgactt ctttgcttgc tcggcagtgc cgtctcatct 900
gccccaagtc aagctcagca gcacagcaca cacgcatcac cctctcggct tgggtttgcc 960
cctgttgcct gtctgtccac actcacacac atccctatcg cttgctcgac atcatcgctt 1020
acctcttccc caccacctcg tctttgacac ctttactttc tcaacccctc ttccaccacc 1080
aaccccccca ccacttactt tcaacatgct tccacagaca cctgt 1125
<210> 66
<211> 1125
<212> DNA
<213> artificial
<220>
<223> (KpnI)-pActin-olapMTT1
<400> 66
atataggtac cggcccgttc aacacaatgc gcctgcaatt tctatccccg ctttccacct 60
ctgtctccct cttcaaagtc acagagtctg ccatttgtat tcgagcatga aaaatgatga 120
cctcctttct tctcgttcaa tacagcggac atgaacaaga aaggggtggc ctgagccacc 180
aagttctaca cttgcagcca gacgtattca aaaatcgacg tggacgagtt gcgactcaac 240
atcctctgtg aattgcaatc gagtgagtga ttacgacctg tattcacgtc aaaatgcagg 300
tgtgacattt gaattttgaa atacatgagg caggctcgat ttgctccact caagtcgagt 360
ttgccaaatt caagaagcgc taatcggagc caaccgaccg accacaacca gccaaatcag 420
ccagccaagg cagagaagca gaagcaaagg cggtgcattg agaggtgagc cgtgtgctgt 480
gctgtgctct gctgtgctgt ctgtcaatgc ttgctgcgtg tgtttgtctc gcctctacag 540
cctgcccctc aagatgtgac cgattggaag gaaaggaagg tcacacgcag ttctggcatg 600
ccacgcacgc acagcccgaa attgcgatct caagagactg ccgacgccgc cgtccgccgt 660
tgagcgctct gcttgggtca aagcgtaagc gcttctcgaa ttcaaactca cagagttcca 720
agtctgcaca ggtcatctgt tcgtcctttt gagactgcct gactggctgg ctggaacgca 780
cgcacgcaca cttccgattc gacaccgccc gctgctgctg tcttctgcgc tcttgtgccc 840
ttcttctgta cttggccttt gcgtcgactt ctttgcttgc tcggcagtgc cgtctcatct 900
gccccaagtc aagctcagca gcacagcaca cacgcatcac cctctcggct tgggtttgcc 960
cctgttgcct gtctgtccac actcacacac atccctatcg cttgctcgac atcatcgctt 1020
acctcttccc caccacctcg tctttgacac ctttactttc tcaacccctc ttccaccacc 1080
aaccccccca ccacttactt tcaacatgcc gtccgttcaa cgcaa 1125
<210> 67
<211> 1125
<212> DNA
<213> artificial
<220>
<223> (KpnI)-pActin-olapRIA1
<400> 67
atataggtac cggcccgttc aacacaatgc gcctgcaatt tctatccccg ctttccacct 60
ctgtctccct cttcaaagtc acagagtctg ccatttgtat tcgagcatga aaaatgatga 120
cctcctttct tctcgttcaa tacagcggac atgaacaaga aaggggtggc ctgagccacc 180
aagttctaca cttgcagcca gacgtattca aaaatcgacg tggacgagtt gcgactcaac 240
atcctctgtg aattgcaatc gagtgagtga ttacgacctg tattcacgtc aaaatgcagg 300
tgtgacattt gaattttgaa atacatgagg caggctcgat ttgctccact caagtcgagt 360
ttgccaaatt caagaagcgc taatcggagc caaccgaccg accacaacca gccaaatcag 420
ccagccaagg cagagaagca gaagcaaagg cggtgcattg agaggtgagc cgtgtgctgt 480
gctgtgctct gctgtgctgt ctgtcaatgc ttgctgcgtg tgtttgtctc gcctctacag 540
cctgcccctc aagatgtgac cgattggaag gaaaggaagg tcacacgcag ttctggcatg 600
ccacgcacgc acagcccgaa attgcgatct caagagactg ccgacgccgc cgtccgccgt 660
tgagcgctct gcttgggtca aagcgtaagc gcttctcgaa ttcaaactca cagagttcca 720
agtctgcaca ggtcatctgt tcgtcctttt gagactgcct gactggctgg ctggaacgca 780
cgcacgcaca cttccgattc gacaccgccc gctgctgctg tcttctgcgc tcttgtgccc 840
ttcttctgta cttggccttt gcgtcgactt ctttgcttgc tcggcagtgc cgtctcatct 900
gccccaagtc aagctcagca gcacagcaca cacgcatcac cctctcggct tgggtttgcc 960
cctgttgcct gtctgtccac actcacacac atccctatcg cttgctcgac atcatcgctt 1020
acctcttccc caccacctcg tctttgacac ctttactttc tcaacccctc ttccaccacc 1080
aaccccccca ccacttactt tcaacatgag cctctcgaac agcaa 1125
<210> 68
<211> 1125
<212> DNA
<213> artificial
<220>
<223> (KpnI)-pActin-olapTAD1
<400> 68
atataggtac cggcccgttc aacacaatgc gcctgcaatt tctatccccg ctttccacct 60
ctgtctccct cttcaaagtc acagagtctg ccatttgtat tcgagcatga aaaatgatga 120
cctcctttct tctcgttcaa tacagcggac atgaacaaga aaggggtggc ctgagccacc 180
aagttctaca cttgcagcca gacgtattca aaaatcgacg tggacgagtt gcgactcaac 240
atcctctgtg aattgcaatc gagtgagtga ttacgacctg tattcacgtc aaaatgcagg 300
tgtgacattt gaattttgaa atacatgagg caggctcgat ttgctccact caagtcgagt 360
ttgccaaatt caagaagcgc taatcggagc caaccgaccg accacaacca gccaaatcag 420
ccagccaagg cagagaagca gaagcaaagg cggtgcattg agaggtgagc cgtgtgctgt 480
gctgtgctct gctgtgctgt ctgtcaatgc ttgctgcgtg tgtttgtctc gcctctacag 540
cctgcccctc aagatgtgac cgattggaag gaaaggaagg tcacacgcag ttctggcatg 600
ccacgcacgc acagcccgaa attgcgatct caagagactg ccgacgccgc cgtccgccgt 660
tgagcgctct gcttgggtca aagcgtaagc gcttctcgaa ttcaaactca cagagttcca 720
agtctgcaca ggtcatctgt tcgtcctttt gagactgcct gactggctgg ctggaacgca 780
cgcacgcaca cttccgattc gacaccgccc gctgctgctg tcttctgcgc tcttgtgccc 840
ttcttctgta cttggccttt gcgtcgactt ctttgcttgc tcggcagtgc cgtctcatct 900
gccccaagtc aagctcagca gcacagcaca cacgcatcac cctctcggct tgggtttgcc 960
cctgttgcct gtctgtccac actcacacac atccctatcg cttgctcgac atcatcgctt 1020
acctcttccc caccacctcg tctttgacac ctttactttc tcaacccctc ttccaccacc 1080
aaccccccca ccacttactt tcaacatggc accttctctc aacgc 1125
<210> 69
<211> 2382
<212> DNA
<213> artificial
<220>
<223> (KpnI)-pActin-RIA1-(NsiI)
<400> 69
atataggtac cggcccgttc aacacaatgc gcctgcaatt tctatccccg ctttccacct 60
ctgtctccct cttcaaagtc acagagtctg ccatttgtat tcgagcatga aaaatgatga 120
cctcctttct tctcgttcaa tacagcggac atgaacaaga aaggggtggc ctgagccacc 180
aagttctaca cttgcagcca gacgtattca aaaatcgacg tggacgagtt gcgactcaac 240
atcctctgtg aattgcaatc gagtgagtga ttacgacctg tattcacgtc aaaatgcagg 300
tgtgacattt gaattttgaa atacatgagg caggctcgat ttgctccact caagtcgagt 360
ttgccaaatt caagaagcgc taatcggagc caaccgaccg accacaacca gccaaatcag 420
ccagccaagg cagagaagca gaagcaaagg cggtgcattg agaggtgagc cgtgtgctgt 480
gctgtgctct gctgtgctgt ctgtcaatgc ttgctgcgtg tgtttgtctc gcctctacag 540
cctgcccctc aagatgtgac cgattggaag gaaaggaagg tcacacgcag ttctggcatg 600
ccacgcacgc acagcccgaa attgcgatct caagagactg ccgacgccgc cgtccgccgt 660
tgagcgctct gcttgggtca aagcgtaagc gcttctcgaa ttcaaactca cagagttcca 720
agtctgcaca ggtcatctgt tcgtcctttt gagactgcct gactggctgg ctggaacgca 780
cgcacgcaca cttccgattc gacaccgccc gctgctgctg tcttctgcgc tcttgtgccc 840
ttcttctgta cttggccttt gcgtcgactt ctttgcttgc tcggcagtgc cgtctcatct 900
gccccaagtc aagctcagca gcacagcaca cacgcatcac cctctcggct tgggtttgcc 960
cctgttgcct gtctgtccac actcacacac atccctatcg cttgctcgac atcatcgctt 1020
acctcttccc caccacctcg tctttgacac ctttactttc tcaacccctc ttccaccacc 1080
aaccccccca ccacttactt tcaacatgag cctctcgaac agcaatcaca acgagcgcca 1140
caacgacgac aacaacatca atgacgatga ttgtgctaac ttctttgagc tgatggttca 1200
gcctgcctct tcttcttctt acggccccta ctttcccgac ccaggactgg cgcttccagc 1260
aatttccgat gtctcatcaa caacagatac gcgactaccg tcacagctcg gagtgacccc 1320
attcagtcat cagacatcgc ccatccgatc cgcagatgaa ggagagaaga cgacaacaac 1380
cgcatcatac aaaagaaagc attccgaggt ggagaaagac cgtcgaagaa tcatctcaaa 1440
cggatttgca gtgagtttcc ctcttcttct accataaagt tcaggctggt tgagctgaag 1500
tcgacgtttg gcaatatttg tgtagatctt gcagaacgtc ctccataacg actcaacttc 1560
caaacccatc tcgaaagcga ccctacttca acaagcgtgc gacgaaatcc gtgaactgcg 1620
caaaaaactt gatacgagca ttaccatcat ctcccgctat ggtctcgaaa atttgtttca 1680
ggtggctcca acccccaatt ctttgagcaa tgcttctcct cccaatggta cgagtagggc 1740
ttaccctacc tattcgaacg acctcggccc ggatcgtttc caagactcgc ggcgtagttc 1800
cacttcggcg acgagtgtgt ctggatctca atataacaat ggcgctgccg ctaaggagga 1860
tggaaacgag aggcgtaatt ccaacgtgaa gaggagaagt tcttacacca acagcatcaa 1920
cagcagcttc gagtcatccg aggaggacac tctgaatagc agttgcgaca acacaagtga 1980
cttcgacgaa agcgttggca gcagcgaaag cgaaagtgaa acaaacaaca ggacaagaaa 2040
cagaaacaga accaagaggg caatggcaac agcaaagctc aaagaccgag accgcgccaa 2100
agctcgaacc gcacccaagc cacacagcaa tcgcttatcg cctgcatcca ctataacgcc 2160
aagtgagatg agcagcagct tagccagccc aaacacctct tcacaagagc atatccagca 2220
agccatcttg tcattgctcc tcgaattgcc gaaacatctg gagaatgtgc acaagtcgaa 2280
gcgtccttcc tctcagcagc caagcacaca gattgatcaa accggaaacc ggactacgac 2340
ggtaacgaag accaggagac ggcaccgatg aatgcattat at 2382
<210> 70
<211> 2574
<212> DNA
<213> artificial
<220>
<223> (KpnI)-pActin-TAD1-(NsiI)
<400> 70
atataggtac cggcccgttc aacacaatgc gcctgcaatt tctatccccg ctttccacct 60
ctgtctccct cttcaaagtc acagagtctg ccatttgtat tcgagcatga aaaatgatga 120
cctcctttct tctcgttcaa tacagcggac atgaacaaga aaggggtggc ctgagccacc 180
aagttctaca cttgcagcca gacgtattca aaaatcgacg tggacgagtt gcgactcaac 240
atcctctgtg aattgcaatc gagtgagtga ttacgacctg tattcacgtc aaaatgcagg 300
tgtgacattt gaattttgaa atacatgagg caggctcgat ttgctccact caagtcgagt 360
ttgccaaatt caagaagcgc taatcggagc caaccgaccg accacaacca gccaaatcag 420
ccagccaagg cagagaagca gaagcaaagg cggtgcattg agaggtgagc cgtgtgctgt 480
gctgtgctct gctgtgctgt ctgtcaatgc ttgctgcgtg tgtttgtctc gcctctacag 540
cctgcccctc aagatgtgac cgattggaag gaaaggaagg tcacacgcag ttctggcatg 600
ccacgcacgc acagcccgaa attgcgatct caagagactg ccgacgccgc cgtccgccgt 660
tgagcgctct gcttgggtca aagcgtaagc gcttctcgaa ttcaaactca cagagttcca 720
agtctgcaca ggtcatctgt tcgtcctttt gagactgcct gactggctgg ctggaacgca 780
cgcacgcaca cttccgattc gacaccgccc gctgctgctg tcttctgcgc tcttgtgccc 840
ttcttctgta cttggccttt gcgtcgactt ctttgcttgc tcggcagtgc cgtctcatct 900
gccccaagtc aagctcagca gcacagcaca cacgcatcac cctctcggct tgggtttgcc 960
cctgttgcct gtctgtccac actcacacac atccctatcg cttgctcgac atcatcgctt 1020
acctcttccc caccacctcg tctttgacac ctttactttc tcaacccctc ttccaccacc 1080
aaccccccca ccacttactt tcaacatggc accttctctc aacgcgaact caacagccga 1140
tcggcggaac gccactgctg cccctgacct tctatccggc aataaagccg gtggtggcct 1200
caagctttcc ggattaccag acctctccga ctcggcaggc accttgagcg acgtatttgg 1260
aacgccggcc atgcgcctca tctggtctga ccaaaatcga gttgcttgct acctcgagat 1320
cgaggcagcg ctcgccgttg tccaagctga actcggtatc atcccaaagc acgccgctca 1380
ggagatcgtc aaacactgcc gtgtagatga gatcgattgg gctctgtaca agcaaaagac 1440
cgaattgatc ggctatcctg tcttgggaat cgtccagcag ctggttgcca actgcaaaga 1500
tggcttggga gagtactgtc attggggcgc tacgacacaa gatatcaccg acacagctac 1560
cattatgcag attcgtcagt cgctcgccct cgttaaggag aagctgtgca gcatcgttgc 1620
gagccttcgg tacttggcgg aaaagcaccg caaccttccc atggctgcgc gttcgaatct 1680
caagcaagcc gtgccaataa cttttggttt caagatggcg cgcttcttgg ccactttccg 1740
ccgacatcag gagcgtctgg ccgagctcga gaagagaaca tacacactag aattcggcgg 1800
tgcggcgggc aacttgtcct cgttaggcga aaagggtatt gcgacgcacg atgcactcgc 1860
caagatgctt gacctttcac ccgctgacat cgcctggcat accgaacacg atcgctttgc 1920
agaggtaggt gccttcctgg gtcttctgac gggaacgcta gccaaactcg ccacagacat 1980
caaactcatg tcgcagaccg aggtgggtga ggtcggggag ccattcatct caaaccgtgg 2040
ctcatcgtcc accatgccgc agaagaacaa cccgatttcg tgcgtgtata ttcatgcctg 2100
tgccgccaat gtccgtcagg gaactgctgc gctgttggat gccatgcagt cggatcacga 2160
gcgtggcact ggaccttggg agatcatctg ggttcaactc ccgctcatga tgaactggtc 2220
ggcagcggct ctggccaatg ccgacttcat tttgaaggga ttgcaggtct tccccgatgc 2280
catggtccga aacctggcct tgtccaaggg cttgatcgtc tccgaagcag tcatgatggc 2340
gctcggcgac actctcggcc gccagtacgc ccatgacgcc gtctacgagt gctgtcgagc 2400
ggcctttgag cataacagac cgttgcttga tgttcttctc gagaaccaag aaatagctag 2460
caagctgaag cgtgccgagc tagagaggct ttgcgagcca gccaattatc ttggacaatg 2520
ctcccaatgg atcgatcgtg tcttgctacc tccttccacg tgaatgcatt atat 2574
<210> 71
<211> 1123
<212> DNA
<213> artificial
<220>
<223> (Pfl23II)-pActin-olapACO2
<400> 71
atatacgtac gggcccgttc aacacaatgc gcctgcaatt tctatccccg ctttccacct 60
ctgtctccct cttcaaagtc acagagtctg ccatttgtat tcgagcatga aaaatgatga 120
cctcctttct tctcgttcaa tacagcggac atgaacaaga aaggggtggc ctgagccacc 180
aagttctaca cttgcagcca gacgtattca aaaatcgacg tggacgagtt gcgactcaac 240
atcctctgtg aattgcaatc gagtgagtga ttacgacctg tattcacgtc aaaatgcagg 300
tgtgacattt gaattttgaa atacatgagg caggctcgat ttgctccact caagtcgagt 360
ttgccaaatt caagaagcgc taatcggagc caaccgaccg accacaacca gccaaatcag 420
ccagccaagg cagagaagca gaagcaaagg cggtgcattg agaggtgagc cgtgtgctgt 480
gctgtgctct gctgtgctgt ctgtcaatgc ttgctgcgtg tgtttgtctc gcctctacag 540
cctgcccctc aagatgtgac cgattggaag gaaaggaagg tcacacgcag ttctggcatg 600
ccacgcacgc acagcccgaa attgcgatct caagagactg ccgacgccgc cgtccgccgt 660
tgagcgctct gcttgggtca aagcgtaagc gcttctcgaa ttcaaactca cagagttcca 720
agtctgcaca ggtcatctgt tcgtcctttt gagactgcct gactggctgg ctggaacgca 780
cgcacgcaca cttccgattc gacaccgccc gctgctgctg tcttctgcgc tcttgtgccc 840
ttcttctgta cttggccttt gcgtcgactt ctttgcttgc tcggcagtgc cgtctcatct 900
gccccaagtc aagctcagca gcacagcaca cacgcatcac cctctcggct tgggtttgcc 960
cctgttgcct gtctgtccac actcacacac atccctatcg cttgctcgac atcatcgctt 1020
acctcttccc caccacctcg tctttgacac ctttactttc tcaacccctc ttccaccacc 1080
aaccccccca ccacttactt tcaacatgat tgcctcgctc gct 1123
<210> 72
<211> 4269
<212> DNA
<213> artificial
<220>
<223> (Pfl23II)_pActin_ACO2_(NsiI)
<400> 72
atatacgtac gggcccgttc aacacaatgc gcctgcaatt tctatccccg ctttccacct 60
ctgtctccct cttcaaagtc acagagtctg ccatttgtat tcgagcatga aaaatgatga 120
cctcctttct tctcgttcaa tacagcggac atgaacaaga aaggggtggc ctgagccacc 180
aagttctaca cttgcagcca gacgtattca aaaatcgacg tggacgagtt gcgactcaac 240
atcctctgtg aattgcaatc gagtgagtga ttacgacctg tattcacgtc aaaatgcagg 300
tgtgacattt gaattttgaa atacatgagg caggctcgat ttgctccact caagtcgagt 360
ttgccaaatt caagaagcgc taatcggagc caaccgaccg accacaacca gccaaatcag 420
ccagccaagg cagagaagca gaagcaaagg cggtgcattg agaggtgagc cgtgtgctgt 480
gctgtgctct gctgtgctgt ctgtcaatgc ttgctgcgtg tgtttgtctc gcctctacag 540
cctgcccctc aagatgtgac cgattggaag gaaaggaagg tcacacgcag ttctggcatg 600
ccacgcacgc acagcccgaa attgcgatct caagagactg ccgacgccgc cgtccgccgt 660
tgagcgctct gcttgggtca aagcgtaagc gcttctcgaa ttcaaactca cagagttcca 720
agtctgcaca ggtcatctgt tcgtcctttt gagactgcct gactggctgg ctggaacgca 780
cgcacgcaca cttccgattc gacaccgccc gctgctgctg tcttctgcgc tcttgtgccc 840
ttcttctgta cttggccttt gcgtcgactt ctttgcttgc tcggcagtgc cgtctcatct 900
gccccaagtc aagctcagca gcacagcaca cacgcatcac cctctcggct tgggtttgcc 960
cctgttgcct gtctgtccac actcacacac atccctatcg cttgctcgac atcatcgctt 1020
acctcttccc caccacctcg tctttgacac ctttactttc tcaacccctc ttccaccacc 1080
aaccccccca ccacttactt tcaacatgat tgcctcgctc gctcgcgttc agaggggccg 1140
caatggcttc tctgccgctc acaaggccat cggtgccaag cgcaccctcg ccacccccgc 1200
tgctgatggt cgcgtcccta cattccaccc gtcgcgcgtt ccaccataca cagagttgct 1260
cgccaccctc gagaccgttc gtcaacagct caaccgtcct ctcacactct ccgaaaagat 1320
tctctactcg catcttcgca accccgagca ggacctcgct ggtgtcggtg ctgatgtttc 1380
ggctattcga ggcaaaaagt acctcaagct caagatcgac cgtttggcca tgcaggatgc 1440
ttccgcccag atggctttgc ttcagttcat gacttgcggt ttgccacgta ccgccattcc 1500
ttccagtgtt cactgcgacc atctcattca ggcgttcgag ggtgctgagg ccgatcttaa 1560
gcgttccatc gcttccaacc aggaggtctt tgctttcctc gaatcggctt ccaagaagta 1620
cggtatcgag ttctggggtc caggctccgg tatcattcac cagattgttc tcgagaacta 1680
cgcagcaccc ggtcttctca tgctcggtac cgactcgcac actcccaacg cttccggtct 1740
cggttgtctt gctatcggtg tcggaggtgc tgatgccgtc gatgctatga ccaacactcc 1800
ttgggagctc atggcaccca aggtgctcgg tgttcacctc aagggagagc tcagcccttg 1860
gtgcacgccc aaggatgtca ttcttcacct tgccggcaag ctgaccgttc gtggtggtac 1920
cggaaagatc gtcgaatact cgggtcccgg tctccagact cttcccgcca ctggtcttgc 1980
taccatgtcc aacatgggtg ctgaggttgg tgccactact tccgctttcc ccttcactcc 2040
tgccatggga tcctacctcg aggctactgg ccgtgctgaa gtcgctcgcg ctgccgagaa 2100
ggctgctggc caaggtttcc ttgctgctga cgaaggcgca gagtacgatg agcgtatcga 2160
gatcaacctt tccgacctcg agccttgcct caacggtccc ttcactcccg atctcagcac 2220
tcccctttcc gaattcgtca acaaggccaa gtccgacgct cgtgaccacc ccgtcgagct 2280
cagcgccgct ctcatcggct catgcaccaa ttcttcttac gccgacatgg ctcgttgcgc 2340
ttcgctcgcc cagcaggcca gggaccgcgg catgaaggtc aagtccagct tcgatgtcac 2400
tcccggttcc gagcaggttc gtgccactgt tgagcgcgat ggtattcagc aagtcttgac 2460
cgatgtcggc ggacgtgttc ttgccaacgc ttgcggtcct tgcatcggac aatggaaccg 2520
aaaggagctc cagggcgagg acaacgtcat cttgacctcg ttcaaccgaa acttccgtgg 2580
ccgtaacgat ggcaactcca agacttggaa cttgctcgca tcccccgaga ttgtcaccgc 2640
catggccttt gctggtcgtc tcgacttcaa ccctatgacc gacagcctca ctgctcccga 2700
tggcaagcct ttcaagttcg agcctcctca gtctgatgtt ttgcccgcca gcggttttgc 2760
tcagggtgac attgactacc ttcccgcccc catgcctgag cctcaacctg acactgaggt 2820
tctcatcagc cccacctccg cgcgtctcga gcacttggca cctttcgaca gccccttcgc 2880
cgctactgcc gctcagggca agtacgagct ccccaccatg cgttgtctcc tccgtatcaa 2940
gggcaagtgc acaaccgacc acatcagtgc cgctggtcct tggctcaagt acaagggtca 3000
cctttccaac ttggccgaga acaccctcat cggtgccacc aatgacgagt tcgacgctgt 3060
caacgtcgct caagactacg agactggcaa gaaagacacc atccccggcg tcgccaagat 3120
ctacaagtcg cgtcaacagc catggatgat ggtcgccgac cacaactacg gagaaggatc 3180
cgctcgtgag cacgccgcct tgcagcctcg attctacggt tgcaacctca tcgttgcccg 3240
cagcatcgct cgtattgctg agactaactt gcgcaagcag ggtgtcttga cgttgctctt 3300
cgagaacgag gacgactacc tcaggatcag ctcgggtgac cttgtcgaga cggtcaacct 3360
gacggatttg atcaagcccg gaggagattt ggctacccag gtcaagttga aggtgaccaa 3420
gttcgaggag gatggaaaga cggtgaagga gactttcgag ttgcccacca agcactcgtt 3480
gagtgccgct catttggact ggatcagggc tggttccgcg ctcaacctca tccgtgagca 3540
ggctgcttcc tctgctgctg ctggcggtat cgctggtggt gtctctggtg ccttcgccgc 3600
tgctgctggc gctgccaagt ctgccgcgtc taaggttgcc tcccttggtg gtgtccgtgg 3660
atacgctact gccgctaagc ctgccaccgg tggatcgcgc aaccccaacg atcccaacta 3720
cgtcccgccc gcagctgatc cccgtaccga atccattcgc aagatcgttt accccccttc 3780
ccccgtctca gccaaggaca aagccgcgca ctcggccacc tccgcctctg ccgtcctccc 3840
cttcggctct gcctcagaag agatccacag caccattacc cgcgcatggc tcctctacca 3900
acgcacacaa cgcgaatccc tcgctgcctc cctcaacgcc aaacaagctc gcctccgcga 3960
agcgctccaa gacctcaaag aaacagacga acgcctgtac gcagcagcaa cgtacaaagt 4020
tgcccccaac aaacgttccc ctaaggaaca ccgtaaactt gttgaacttg ggttggtaac 4080
gctgccaggt gcaacaccca agccggacgc tccgagcggt gctgaggcga ggaggctggt 4140
gaaggcggtt gcgggaggtg ctaggttgga ggggttgttc cctagggagt tgagggttcc 4200
gactatgacg cccggtagga aggtttggaa ctcgaacttt gagcctagtc agatttgaat 4260
gcattatat 4269
<210> 73
<211> 21820
<212> DNA
<213> artificial
<220>
<223> Vector_surroundings
<400> 73
tgtgtgaaag tcgtaaatga tatcggcggc agctttcatg ccggcctggt tggggtggta 60
tgcgcatctg tttttgaagt tccagaacga gccgtctgat acccaaggct cttttgatcc 120
gagtgcgtgc ttgagcttgc tctcttctgc tagcggaacg acatagacgt tattcctccc 180
ttccgctgcc ttggcgtaga gcgattgaag ctgttcggcc atctcgatgt acttttgcac 240
ttgttgctga tcccaacata cgtccctcca cgcttttgta tcgggtccca tcatggcgtg 300
gtattcgacc aggtagatcg tcgcttttgg atactttttc tggacgccat cgatcaaggt 360
tgcgaatctt tgggagatct cgtctggcga agcgatggtg gggtgttcaa agtgctcctt 420
ctcttctttc gacaagacaa aatacgacaa caatctaccc caccatgtgt tcttgaacgt 480
cagaccgaac atactcccga tgtagaacat gtcattgccc ccaccggtga tcgtgactat 540
cgcatcgctg ccatcatctc cttccttaag ttcgggaaga agacttagtt gaggggcgta 600
gactttcttt ccagtatctt gcggttcgga gatcaaattg agtagcgtcg cacttgacac 660
cgaaaggtcg agaaattcat ccgtgttgtt cgggtcgaga ttgagtctac gcgccaagta 720
gttgggatag ttgtttgcac ttcgaccagc gtcagtgtct acttgaggag ggatgcctgg 780
cccagcggcg aacgatgagc ccaacgcgat caaccttgtc atttggactt gttatggcac 840
agtgttgata ttgccaagat cgacgtcgaa gatgcaatga tgaagcaaaa cggagcgaag 900
tgcaaacagg gtctcgataa gatgaattga cgagttcaaa ggaagggttc ccgatatgaa 960
gactaacgac ttcatcggca ggcttctagc ggaaaccgga ctggataagg cgggcagcgt 1020
gtaggtgggt ctgtgcgttt gcgtcaaccc cgcatttcct cggcaaagaa aaagcaagaa 1080
atttgagaaa aaggcgggaa aattgtaaca caggctaagg accggttgtc ggaggtcaaa 1140
ttgaagcgtt gagccggtac gacctagaga atggggaaac tcatcaccag ccgtgtcatt 1200
ctcttttgct gaggttgtga tcagattctc atctacatag cttgtcgttc gaagcaaccg 1260
ggcacttatt ctacctctat gcgtccatca tgatgaatct tcgcgaggct gtgtacccat 1320
gggtacattt gggcgaagaa aggacgtcgc acgaccgaca gcctaagaag catagcgcac 1380
caaagtaacg gttgaatgac tgcaaatgta gagccgtgtc aagttcgcga tcatagccga 1440
agcgagtgag ggatgtctcg agctatgtgg ccggcatgtt ctcagtgccc cgcaattttt 1500
tgtgtgtgtt cttgtggcac gagcaatcgg ctcaaccgag tctgcagcaa aactgagcca 1560
tttacccgtc gtggccgact tgaccgtgtg cgagccaaga gcaagccgaa aacgtgagtc 1620
ttcgccgagt ctcttccttc ctttgcttca ctaacatcag tagccgtcac tatagatccc 1680
ttatgagcag ctagccggca gattttggct gcgtttcctc cccaccatca tcgcattcct 1740
gcatcacctt gcctactccg tcacgatgcc ctacacacca ccacgttcgt cgcagcctcc 1800
taaaggttta ccctttgagc tttcgctctc gacgcatccc ggcgcgcagc acaaccgatc 1860
ttcgctcaca cccgtgtcgt tcctcttgcg tgccgcgctg attacgcctc gcaaattggc 1920
aatcactcat cctgaaaagg gctactcatt cacctacgag caatgggcag cacgtactct 1980
ctcgctcgcc tttgcacttc gcagccttcc cgccttcaag attggtgatc gcgtcgctgt 2040
tatctcgcct aacgcacctc tgatcgcaga cgctcactgg ggtattcctg ctgttggtgg 2100
tatcattacg ccgatcaaca ttcgaaacac gcccaaggag gtcgcttacg tcttggagca 2160
ctcgggtagc actgtaatct tggtcgacca cgagtttaca cacctcgtcc ccgagaaccc 2220
tggcccaggc atcaccgtca tcgtcagcaa agattcggga ggacaagaag ctgacgatcc 2280
atacgagaaa tttctcgatc gtggcttcct cgaatggcag cgtgctgagc aggctgagct 2340
caaagcctac aagtctcgca ctcgaccttc tgctgaacca aagacgggat ggaaactcat 2400
cgaggcgcct caagacgaag aacaacccat cgccctctgc tacacctcgg gtactactgg 2460
tcgacccaaa ggtgtgctca ctaaccaccg tggagcctac ctttctgccg tagccaacgc 2520
ttttgaagcc cacctcacgc aggatagcgt ctatctttgg gttcttccca tgttccatgc 2580
ttgtggatgg acgtaccctt gggctgttac tgcttctctc gctacgcatt tcaccattcg 2640
caaggtcgac aacaccgtta tctgggacgc gttgctcaat cacggcgtat cgcactactg 2700
cggtgcccct acagttcaga tcggcctcgt caaccatcct aacgcacgca agctcaaccg 2760
tcgcgtgaac gttgccgtcg cagcttccgc acccaccgcc aacctcctcg ccaagatgga 2820
gggtctaaac ttgcacccag tccacgtata cggcttgacc gaaacatacg gtcctttcac 2880
caggaggtac ttcgagcccg aatgggccaa actagatgtt gatgctcgag cacgaatgat 2940
ggctcgccaa ggacactcct acctcacttc agatgaggta cgtgtcgttc gtactgcttc 3000
ttccaccgac gcctctacac ctgacctcgt cgatgttgag cgcaacggtc aagaaacggg 3060
cgaaatcgtc attcgaggaa acatggtcat ggtaggctac tacaacgatc ccgccgccac 3120
ttccaaagcc gtcatgaaag gctggttcca cactggcgac ctagccgtcc gtcaccctgg 3180
cggcgaaatc caaatcctag accgaggtaa agacatcatc atctccggag gcgaaaacat 3240
ctcctcgctc atggttgaac aggaacttgc ctcccaccct tccgtcctcg aatgctgcgt 3300
cattgcacga ccgcacgaaa agtggggcga acgcggccag tcgtttatcg tgctcacaga 3360
acaggcgaaa gcgaaactca acttcgcaga gataaaaaag aagggttcac cggagaacaa 3420
ggcgtttgtt gaagaggtga aaaagcactg cgtggaaagg atgtccaaat tcgccgtacc 3480
ggaatggttc gacgtagtgg acgaattgcc aaagacaagc acgggcaagg tgcagaagaa 3540
gggcgcaggg tcgatgcgac gcaatcgtcc gatccggagc cgggactgtc gggcgtacac 3600
aaatcgcccg cagaagcgcg gccgtctgga ccgatggctg tgtagaagta ctcgccgata 3660
gtggaaaccg acgccccagc actcgtccga gggcaaagga atagagtaga tgccgaccgg 3720
gatctgggca gcaccaagac acggaacttt caacagtcgt gagtaggtgg tgatctgcat 3780
gtccaaatcg tgaaacgtga atcacgaacc acgaatcgtg aatagccact ttgcgcgaaa 3840
atcactgaat gccgccaaac cgacgcgacg cgagttgcgt gaagtattcg tgattcacat 3900
tcacgattga cgattgtgag ttggtcgacg acattcgcta gccagaccaa cactcacgac 3960
tttttgaaga gcgttgcagg ttgagccaac tttctccctc actctttgct ttcttctcca 4020
tcacgctcat tccttttaag tgttcatccg gtatcattag cactatatca tagtgaaact 4080
cgcaacaacc cggtcttcgt cgcgaaagca accctccatc gctgctgcct cttgcagtga 4140
agaccgccac catgcagtct acgcagtcga agaccctaca cgtccagttc gtccattctg 4200
gtcctacaca ttgtatccac gcacccaagt ctgccaacgt ggagtaagtg aacctttttt 4260
tgtcctgtcg aggctcaacg tagatcacag gctgatcatc cacactcttc taccttttga 4320
cattacgcag tcgacttttt acaggaggag atgactacct cgtccgaatc ttacccaccc 4380
tgcctctctc cgacgtagag ccgcagctta tcgaagacgc cactgaagcg gtgacctcgc 4440
tcgatgctga cggccgcttc ctcgtcaccg cttccgaaga tggctctgta cgcctctacc 4500
gacaccaccc aatcgacgcg gaaggcaacc cagcatcacc aactgtgctt caatcgctgc 4560
tgcgccgcga agcttggctg caggtcgacg gatcccgggt accggcccgt tcaacacaat 4620
gcgcctgcaa tttctatccc cgctttccac ctctgtctcc ctcttcaaag tcacagagtc 4680
tgccatttgt attcgagcat gaaaaatgat gacctccttt cttctcgttc aatacagcgg 4740
acatgaacaa gaaaggggtg gcctgagcca ccaagttcta cacttgcagc cagacgtatt 4800
caaaaatcga cgtggacgag ttgcgactca acatcctctg tgaattgcaa tcgagtgagt 4860
gattacgacc tgtattcacg tcaaaatgca ggtgtgacat ttgaattttg aaatacatga 4920
ggcaggctcg atttgctcca ctcaagtcga gtttgccaaa ttcaagaagc gctaatcgga 4980
gccaaccgac cgaccacaac cagccaaatc agccagccaa ggcagagaag cagaagcaaa 5040
ggcggtgcat tgagaggtga gccgtgtgct gtgctgtgct ctgctgtgct gtctgtcaat 5100
gcttgctgcg tgtgtttgtc tcgcctctac agcctgcccc tcaagatgtg accgattgga 5160
aggaaaggaa ggtcacacgc agttctggca tgccacgcac gcacagcccg aaattgcgat 5220
ctcaagagac tgccgacgcc gccgtccgcc gttgagcgct ctgcttgggt caaagcgtaa 5280
gcgcttctcg aattcaaact cacagagttc caagtctgca caggtcatct gttcgtcctt 5340
ttgagactgc ctgactggct ggctggaacg cacgcacgca cacttccgat tcgacaccgc 5400
ccgctgctgc tgtcttctgc gctcttgtgc ccttcttctg tacttggcct ttgcgtcgac 5460
ttctttgctt gctcggcagt gccgtctcat ctgccccaag tcaagctcag cagcacagca 5520
cacacgcatc accctctcgg cttgggtttg cccctgttgc ctgtctgtcc acactcacac 5580
acatccctat cgcttgctcg acatcatcgc ttacctcttc cccaccacct cgtctttgac 5640
acctttactt tctcaacccc tcttccacca ccaacccccc caccacttac tttcaacatg 5700
agcctctcga acagcaatca caacgagcgc cacaacgacg acaacaacat caatgacgat 5760
gattgtgcta acttctttga gctgatggtt cagcctgcct cttcttcttc ttacggcccc 5820
tactttcccg acccaggact ggcgcttcca gcaatttccg atgtctcatc aacaacagat 5880
acgcgactac cgtcacagct cggagtgacc ccattcagtc atcagacatc gcccatccga 5940
tccgcagatg aaggagagaa gacgacaaca accgcatcat acaaaagaaa gcattccgag 6000
gtggagaaag accgtcgaag aatcatctca aacggatttg cagtgagttt ccctcttctt 6060
ctaccataaa gttcaggctg gttgagctga agtcgacgtt tggcaatatt tgtgtagatc 6120
ttgcagaacg tcctccataa cgactcaact tccaaaccca tctcgaaagc gaccctactt 6180
caacaagcgt gcgacgaaat ccgtgaactg cgcaaaaaac ttgatacgag cattaccatc 6240
atctcccgct atggtctcga aaatttgttt caggtggctc caacccccaa ttctttgagc 6300
aatgcttctc ctcccaatgg tacgagtagg gcttacccta cctattcgaa cgacctcggc 6360
ccggatcgtt tccaagactc gcggcgtagt tccacttcgg cgacgagtgt gtctggatct 6420
caatataaca atggcgctgc cgctaaggag gatggaaacg agaggcgtaa ttccaacgtg 6480
aagaggagaa gttcttacac caacagcatc aacagcagct tcgagtcatc cgaggaggac 6540
actctgaata gcagttgcga caacacaagt gacttcgacg aaagcgttgg cagcagcgaa 6600
agcgaaagtg aaacaaacaa caggacaaga aacagaaaca gaaccaagag ggcaatggca 6660
acagcaaagc tcaaagaccg agaccgcgcc aaagctcgaa ccgcacccaa gccacacagc 6720
aatcgcttat cgcctgcatc cactataacg ccaagtgaga tgagcagcag cttagccagc 6780
ccaaacacct cttcacaaga gcatatccag caagccatct tgtcattgct cctcgaattg 6840
ccgaaacatc tggagaatgt gcacaagtcg aagcgtcctt cctctcagca gccaagcaca 6900
cagattgatc aaaccggaaa ccggactacg acggtaacga agaccaggag acggcaccga 6960
tgaatgcata gtagatgccg accgggatct gggcagcacc aagacacgga acttcaacag 7020
tcgtgagtag gtggtgatct gcatgtccaa atcgtgaaac gtgaatcacg aaccacgaat 7080
cgtgaatagc cactttgcgc gaaaatcact gaatgccgcc aaaccgacgc gacgcgagtt 7140
gcgtgaagta ttcgtgattc acattcacga ttgacgattg tgagttggtc gacgacattc 7200
gctagccaga ccaacactca cgactttttg aagagcgttg caggctgagc caactttctc 7260
cctcactctt tgctttcttc tccatcacgc tcattccttt taagtgttca tccggtatca 7320
ttagcactat atcatagtga aactcgcaac aacccggtct tcgtcgcgaa agcaaccctc 7380
catcgctgct gcctcttgca gtgaagaccg ccaccatgca gtctacgcag tcgaagaccc 7440
tacacgtcca gttcgtccat tctggtccta cacattgtat ccacgcaccc aagtctgcca 7500
acgtggagta agtgaacctt tttttgtcct gtcgaggctc aacgtagatc acaggctgat 7560
catccacact cttctacctt ttgacattac gcagtcgact ttttacagga ggagatgact 7620
acctcgtccg aatcttaccc accctgcctc tctccgacgt agagccgcag cttatcgaag 7680
acgccactga agcggtgacc tcgctcgatg ctgacggccg cttcctcgtc accgcttccg 7740
aagatggctc tgtacgcctc taccgacacc acccaatcga cgcggaaggc aacccagcat 7800
caccaactgt gcttcaatcg ctgctgcgcc gcgaagcttg gctgcaggtc gacggatccc 7860
ggttatcgag ctcgaattcg ccctatagtg agtcgtatta caattcactg gccgtcgttt 7920
tacaacgtcg tgactgggaa aaccctggcg ttacccaact taatcgcctt gcagcacatc 7980
cccctttcgc cagctggcgt aatagcgaag aggcccgcac cgatcgccct tcccaacagt 8040
tgcgcagcct gaatggcgaa tggacgcgcc ctgtagcggc gcattaagcg cggcgggtgt 8100
ggtggttacg cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc 8160
tttcttccct tcctttctcg ccacgttcgc cggctttccc cgtcaagctc taaatcgggg 8220
gctcccttta gggttccgat ttagtgcttt acggcacctc gaccccaaaa aacttgatta 8280
gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt 8340
ggagtccacg ttctttaata gtggactctt gttccaaact ggaacaacac tcaaccctat 8400
ctcggtctat tcttttgatt tataagggat tttgccgatt tcggcctatt ggttaaaaaa 8460
tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa atattaacgc ttacaatttc 8520
ctgatgcggt attttctcct tacgcatctg tgcggtattt cacaccgcat atggtgcact 8580
ctcagtacaa tctgctctga tgccgcatag ttaagccagc cccgacaccc gccaacaccc 8640
gctgacgcgc cctgacgggc ttgtctgctc ccggcatccg cttacagaca agctgtgacc 8700
gtctccggga gctgcatgtg tcagaggttt tcaccgtcat caccgaaacg cgcgagacga 8760
aagggcctcg tgatacgcct atttttatag gttaatgtca tgataataat ggtttcttag 8820
acgtcaggtg gcacttttcg gggaaatgtg cgcggaaccc ctatttgttt atttttctaa 8880
atacattcaa atatgtatcc gctcatgaga caataaccct gataaatgct tcaataatat 8940
tgaaaaagga agagtatgag tattcaacat ttccgtgtcg cccttattcc cttttttgcg 9000
gcattttgcc ttcctgtttt tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa 9060
gatcagttgg gtgcacgagt gggttacatc gaactggatc tcaacagcgg taagatcctt 9120
gagagttttc gccccgaaga acgttttcca atgatgagca cttttaaagt tctgctatgt 9180
ggcgcggtat tatcccgtat tgacgccggg caagagcaac tcggtcgccg catacactat 9240
tctcagaatg acttggttga gtactcacca gtcacagaaa agcatcttac ggatggcatg 9300
acagtaagag aattatgcag tgctgccata accatgagtg ataacactgc ggccaactta 9360
cttctgacaa cgatcggagg accgaaggag ctaaccgctt ttttgcacaa catgggggat 9420
catgtaactc gccttgatcg ttgggaaccg gagctgaatg aagccatacc aaacgacgag 9480
cgtgacacca cgatgcctgt agcaatggca acaacgttgc gcaaactatt aactggcgaa 9540
ctacttactc tagcttcccg gcaacaatta atagactgga tggaggcgga taaagttgca 9600
ggaccacttc tgcgctcggc ccttccggct ggctggttta ttgctgataa atctggagcc 9660
ggtgagcgtg ggtctcgcgg tatcattgca gcactggggc cagatggtaa gccctcccgt 9720
atcgtagtta tctacacgac ggggagtcag gcaactatgg atgaacgaaa tagacagatc 9780
gctgagatag gtgcctcact gattaagcat tggtaactgt cagaccaagt ttactcatat 9840
atactttaga ttgatttaaa acttcatttt taatttaaaa ggatctaggt gaagatcctt 9900
tttgataatc tcatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac 9960
cccgtagaaa agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc 10020
ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca 10080
actctttttc cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgttcttcta 10140
gtgtagccgt agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct 10200
ctgctaatcc tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg 10260
gactcaagac gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc 10320
acacagccca gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta 10380
tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg 10440
gtcggaacag gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt 10500
cctgtcgggt ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg 10560
cggagcctat ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc cttttgctgg 10620
ccttttgctc acatgttctt tcctgcgtta tcccctgatt ctgtggataa ccgtattacc 10680
gcctttgagt gagctgatac cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg 10740
agcgaggaag cggaagagcg cccaatacgc aaaccgcctc tccccgcgcg ttggccgatt 10800
cattaatgca gctggcacga caggtttccc gactggaaag cgggcagtga gcgcaacgca 10860
attaatgtga gttagctcac tcattaggca ccccaggctt tacactttat gcttccggct 10920
cgtatgttgt gtggaattgt gagcggataa caatttcaca caggaaacca cagctatgac 10980
ctgattacgc caagctattt aggtgacact atagaatact caagcttgca tgcctgcagg 11040
tcgactctag aggatcctag ggataacagg gtaatctcga gtggcggcag atgtgagtcg 11100
tgtgctacaa aacgtgaatc gacacgcgca gggcggaacc aaaaaaaacc cccaccccgc 11160
tgtcaagttg acaaatcaac acatttgttc caagttcaaa tcgggaaatc aaaaattagg 11220
gccagatcag cgatcaggaa tggtaatcgg gtaacagagg tcgcaaaatc gtctagaaaa 11280
tggaagaaga acgtggtaac taccagcgag ttctgcaaac ttcaaaaaaa aaatctgggc 11340
acgatgaaag ttgagctaac gctgacgctc acaaatggcg tggctaaagg aagcgagaca 11400
atcggaaaat tgttctctcg ggcaccacaa agctgttgtt agtcgctgaa gaacaattcc 11460
aactgattcc gccgccttcc tattgcgtca gccttgtacc taagctgccg agtaacgtca 11520
ctcaacctct cttttcagac tgctttgctc cgcgaatact tttcttctat gcgctcaaga 11580
aaatgacaca gcacaccaag ctctgcaaac tttcttcgct aatctgacgc gaaatgtgag 11640
ccatttcttc tcgcctgcaa tggcaatgcg tctgtgcggc gatgagaatc acgatgccgg 11700
aatgggtggc tggaagttca tagagatgct gaattgttgg agcgacatgg tacataagca 11760
tgaatctgtc ctgatttcca ccctccgtct ttcatcaact ttctcgtctg acccttccgt 11820
tgccagatcc cgggggcaat gagatatgaa aaagcctgaa ctcaccgcga cgtctgtcga 11880
gaagtttctg atcgaaaagt tcgacagcgt ctccgacctg atgcagctct cggagggcga 11940
agaatctcgt gctttcagct tcgatgtagg agggcgtgga tatgtcctgc gggtaaatag 12000
ctgcgccgat ggtttctaca aagatcgtta tgtttatcgg cactttgcat cggccgcgct 12060
cccgattccg gaagtgcttg acattgggga attcagcgag agcctgacct attgcatctc 12120
ccgccgtgca cagggtgtca cgttgcaaga cctgcctgaa accgaactgc ccgctgttct 12180
gcagccggtc gcggaggcca tggatgcgat cgctgcggcc gatcttagcc agacgagcgg 12240
gttcggccca ttcggaccgc aaggaatcgg tcaatacact acatggcgtg atttcatatg 12300
cgcgattgct gatccccatg tgtatcactg gcaaactgtg atggacgaca ccgtcagtgc 12360
gtccgtcgcg caggctctcg atgagctgat gctttgggcc gaggactgcc ccgaagtccg 12420
gcacctcgtg cacgcggatt tcggctccaa caatgtcctg acggacaatg gccgcataac 12480
agcggtcatt gactggagcg aggcgatgtt cggggattcc caatacgagg tcgccaacat 12540
cttcttctgg aggccgtggt tggcttgtat ggagcagcag acgcgctact tcgagcggag 12600
gcatccggag cttgcaggat cgccgcggct ccgggcgtat atgctccgca ttggtcttga 12660
ccaactctat cagagcttgg ttgacggcaa tttcgatgat gcagcttggg cgcagggtcg 12720
atgcgacgca atcgtccgat ccggagccgg gactgtcggg cgtacacaaa tcgcccgcag 12780
aagcgcggcc gtctggaccg atggctgtgt agaagtactc gccgatagtg gaaaccgacg 12840
ccccagcact cgtccgaggg caaaggaata gagtagatgc cgaccgggat ctgggcagca 12900
ccaagacacg gaactttcaa cagtcgtgag taggtggtga tctgcatgtc caaatcgtga 12960
aacgtgaatc acgaaccacg aatcgtgaat agccactttg cgcgaaaatc actgaatgcc 13020
gccaaaccga cgcgacgcga gttgcgtgaa gtattcgtga ttcacattca cgattgacga 13080
ttgtgagttg gtcgacgaca ttcgctagcc agaccaacac tcacgacttt ttgaagagcg 13140
ttgcaggttg agccaacttt ctccctcact ctttgctttc ttctccatca cgctcattcc 13200
ttttaagtgt tcatccggta tcattagcac tatatcatag tgaaactcgc aacaacccgg 13260
tcttcgtcgc gaaagcaacc ctccatcgct gctgcctctt gcagtgaaga ccgccaccat 13320
gcagtctacg cagtcgaaga ccctacacgt ccagttcgtc cattctggtc ctacacattg 13380
tatccacgca cccaagtctg ccaacgtgga gtaagtgaac ctttttttgt cctgtcgagg 13440
ctcaacgtag atcacaggct gatcatccac actcttctac cttttgacat tacgcagtcg 13500
actttttaca ggaggagatg actacctcgt ccgaatctta cccaccctgc ctctctccga 13560
cgtagagccg cagcttatcg aagacgccac tgaagcggtg acctcgctcg atgctgacgg 13620
ccgcttcctc gtcaccgctt ccgaagatgg ctctgtacgc ctctaccgac accacccaat 13680
cgacgcggaa ggcaacccag catcaccaac tgtgcttcaa tcgctgctgc gccgcgaagc 13740
ttggctgcag gtcgacggat cccgggtacc ggcccgttca acacaatgcg cctgcaattt 13800
ctatccccgc tttccacctc tgtctccctc ttcaaagtca cagagtctgc catttgtatt 13860
cgagcatgaa aaatgatgac ctcctttctt ctcgttcaat acagcggaca tgaacaagaa 13920
aggggtggcc tgagccacca agttctacac ttgcagccag acgtattcaa aaatcgacgt 13980
ggacgagttg cgactcaaca tcctctgtga attgcaatcg agtgagtgat tacgacctgt 14040
attcacgtca aaatgcaggt gtgacatttg aattttgaaa tacatgaggc aggctcgatt 14100
tgctccactc aagtcgagtt tgccaaattc aagaagcgct aatcggagcc aaccgaccga 14160
ccacaaccag ccaaatcagc cagccaaggc agagaagcag aagcaaaggc ggtgcattga 14220
gaggtgagcc gtgtgctgtg ctgtgctctg ctgtgctgtc tgtcaatgct tgctgcgtgt 14280
gtttgtctcg cctctacagc ctgcccctca agatgtgacc gattggaagg aaaggaaggt 14340
cacacgcagt tctggcatgc cacgcacgca cagcccgaaa ttgcgatctc aagagactgc 14400
cgacgccgcc gtccgccgtt gagcgctctg cttgggtcaa agcgtaagcg cttctcgaat 14460
tcaaactcac agagttccaa gtctgcacag gtcatctgtt cgtccttttg agactgcctg 14520
actggctggc tggaacgcac gcacgcacac ttccgattcg acaccgcccg ctgctgctgt 14580
cttctgcgct cttgtgccct tcttctgtac ttggcctttg cgtcgacttc tttgcttgct 14640
cggcagtgcc gtctcatctg ccccaagtca agctcagcag cacagcacac acgcatcacc 14700
ctctcggctt gggtttgccc ctgttgcctg tctgtccaca ctcacacaca tccctatcgc 14760
ttgctcgaca tcatcgctta cctcttcccc accacctcgt ctttgacacc tttactttct 14820
caacccctct tccaccacca acccccccac cacttacttt caacatgagc ctctcgaaca 14880
gcaatcacaa cgagcgccac aacgacgaca acaacatcaa tgacgatgat tgtgctaact 14940
tctttgagct gatggttcag cctgcctctt cttcttctta cggcccctac tttcccgacc 15000
caggactggc gcttccagca atttccgatg tctcatcaac aacagatacg cgactaccgt 15060
cacagctcgg agtgacccca ttcagtcatc agacatcgcc catccgatcc gcagatgaag 15120
gagagaagac gacaacaacc gcatcataca aaagaaagca ttccgaggtg gagaaagacc 15180
gtcgaagaat catctcaaac ggatttgcag tgagtttccc tcttcttcta ccataaagtt 15240
caggctggtt gagctgaagt cgacgtttgg caatatttgt gtagatcttg cagaacgtcc 15300
tccataacga ctcaacttcc aaacccatct cgaaagcgac cctacttcaa caagcgtgcg 15360
acgaaatccg tgaactgcgc aaaaaacttg atacgagcat taccatcatc tcccgctatg 15420
gtctcgaaaa tttgtttcag gtggctccaa cccccaattc tttgagcaat gcttctcctc 15480
ccaatggtac gagtagggct taccctacct attcgaacga cctcggcccg gatcgtttcc 15540
aagactcgcg gcgtagttcc acttcggcga cgagtgtgtc tggatctcaa tataacaatg 15600
gcgctgccgc taaggaggat ggaaacgaga ggcgtaattc caacgtgaag aggagaagtt 15660
cttacaccaa cagcatcaac agcagcttcg agtcatccga ggaggacact ctgaatagca 15720
gttgcgacaa cacaagtgac ttcgacgaaa gcgttggcag cagcgaaagc gaaagtgaaa 15780
caaacaacag gacaagaaac agaaacagaa ccaagagggc aatggcaaca gcaaagctca 15840
aagaccgaga ccgcgccaaa gctcgaaccg cacccaagcc acacagcaat cgcttatcgc 15900
ctgcatccac tataacgcca agtgagatga gcagcagctt agccagccca aacacctctt 15960
cacaagagca tatccagcaa gccatcttgt cattgctcct cgaattgccg aaacatctgg 16020
agaatgtgca caagtcgaag cgtccttcct ctcagcagcc aagcacacag attgatcaaa 16080
ccggaaaccg gactacgacg gtaacgaaga ccaggagacg gcaccgatga atgcatagta 16140
gatgccgacc gggatctggg cagcaccaag acacggaact tcaacagtcg tgagtaggtg 16200
gtgatctgca tgtccaaatc gtgaaacgtg aatcacgaac cacgaatcgt gaatagccac 16260
tttgcgcgaa aatcactgaa tgccgccaaa ccgacgcgac gcgagttgcg tgaagtattc 16320
gtgattcaca ttcacgattg acgattgtga gttggtcgac gacattcgct agccagacca 16380
acactcacga ctttttgaag agcgttgcag gctgagccaa ctttctccct cactctttgc 16440
tttcttctcc atcacgctca ttccttttaa gtgttcatcc ggtatcatta gcactatatc 16500
atagtgaaac tcgcaacaac ccggtcttcg tcgcgaaagc aaccctccat cgctgctgcc 16560
tcttgcagtg aagaccgcca ccatgcagtc tacgcagtcg aagaccctac acgtccagtt 16620
cgtccattct ggtcctacac attgtatcca cgcacccaag tctgccaacg tggagtaagt 16680
gaaccttttt ttgtcctgtc gaggctcaac gtagatcaca ggctgatcat ccacactctt 16740
ctaccttttg acattacgca gtcgactttt tacaggagga gatgactacc tcgtccgaat 16800
cttacccacc ctgcctctct ccgacgtaga gccgcagctt atcgaagacg ccactgaagc 16860
ggtgacctcg ctcgatgctg acggccgctt cctcgtcacc gcttccgaag atggctctgt 16920
acgcctctac cgacaccacc caatcgacgc ggaaggcaac ccagcatcac caactgtgct 16980
tcaatcgctg ctgcgccgcg aagcttggct gcaggtcgac ggatcccggt tatcgagctc 17040
gaattcgccc tatagtgagt cgtattacaa ttcactggcc gtcgttttac aacgtcgtga 17100
ctgggaaaac cctggcgtta cccaacttaa tcgccttgca gcacatcccc ctttcgccag 17160
ctggcgtaat agcgaagagg cccgcaccga tcgcccttcc caacagttgc gcagcctgaa 17220
tggcgaatgg acgcgccctg tagcggcgca ttaagcgcgg cgggtgtggt ggttacgcgc 17280
agcgtgaccg ctacacttgc cagcgcccta gcgcccgctc ctttcgcttt cttcccttcc 17340
tttctcgcca cgttcgccgg ctttccccgt caagctctaa atcgggggct ccctttaggg 17400
ttccgattta gtgctttacg gcacctcgac cccaaaaaac ttgattaggg tgatggttca 17460
cgtagtgggc catcgccctg atagacggtt tttcgccctt tgacgttgga gtccacgttc 17520
tttaatagtg gactcttgtt ccaaactgga acaacactca accctatctc ggtctattct 17580
tttgatttat aagggatttt gccgatttcg gcctattggt taaaaaatga gctgatttaa 17640
caaaaattta acgcgaattt taacaaaata ttaacgctta caatttcctg atgcggtatt 17700
ttctccttac gcatctgtgc ggtatttcac accgcatatg gtgcactctc agtacaatct 17760
gctctgatgc cgcatagtta agccagcccc gacacccgcc aacacccgct gacgcgccct 17820
gacgggcttg tctgctcccg gcatccgctt acagacaagc tgtgaccgtc tccgggagct 17880
gcatgtgtca gaggttttca ccgtcatcac cgaaacgcgc gagacgaaag ggcctcgtga 17940
tacgcctatt tttataggtt aatgtcatga taataatggt ttcttagacg tcaggtggca 18000
cttttcgggg aaatgtgcgc ggaaccccta tttgtttatt tttctaaata cattcaaata 18060
tgtatccgct catgagacaa taaccctgat aaatgcttca ataatattga aaaaggaaga 18120
gtatgagtat tcaacatttc cgtgtcgccc ttattccctt ttttgcggca ttttgccttc 18180
ctgtttttgc tcacccagaa acgctggtga aagtaaaaga tgctgaagat cagttgggtg 18240
cacgagtggg ttacatcgaa ctggatctca acagcggtaa gatccttgag agttttcgcc 18300
ccgaagaacg ttttccaatg atgagcactt ttaaagttct gctatgtggc gcggtattat 18360
cccgtattga cgccgggcaa gagcaactcg gtcgccgcat acactattct cagaatgact 18420
tggttgagta ctcaccagtc acagaaaagc atcttacgga tggcatgaca gtaagagaat 18480
tatgcagtgc tgccataacc atgagtgata acactgcggc caacttactt ctgacaacga 18540
tcggaggacc gaaggagcta accgcttttt tgcacaacat gggggatcat gtaactcgcc 18600
ttgatcgttg ggaaccggag ctgaatgaag ccataccaaa cgacgagcgt gacaccacga 18660
tgcctgtagc aatggcaaca acgttgcgca aactattaac tggcgaacta cttactctag 18720
cttcccggca acaattaata gactggatgg aggcggataa agttgcagga ccacttctgc 18780
gctcggccct tccggctggc tggtttattg ctgataaatc tggagccggt gagcgtgggt 18840
ctcgcggtat cattgcagca ctggggccag atggtaagcc cgcccaggtc gcaatcgtgt 18900
gatatcggac aacaccggta acaatagcgc ttaacagtcg tgctaacgtg ggcaactatg 18960
cagctcgctg tgctctttgc acagtcacag aagctcgaaa ggggcagcta cagttcgtaa 19020
acgtgtgcta agactcgcgc cgagccagca ttgaacacaa gcgcaacgat gccggattgc 19080
atatgagctt gtttcatata tcgttgttgt ttgtgagcag acaacacgat ttcatacatt 19140
cgttgcaatg taagagcaca ttatttctct attgtcacca gggccacatc aatgcgaagc 19200
aactttgtgg ctttcaattc actgcaaggt gctcagtgag cccactttgc atgcgttgac 19260
gtgggtaccg aagggtcgag acaagaccat cgtgggagag agccgttcaa tcctgagtca 19320
gtgtgaagaa ggatgagtac aaagctgatc agccagaaag acaatcgaca cgtacaacgg 19380
cgcctgaaga tcaagatggg aatacgtacg aaagctccga tcggggtcgc tcccttcttg 19440
agatgttggt gtcaatgctc gcgttgtagg acactttcca gtacctctgg atcccagttc 19500
atctccgtct tcctaattaa cctgtcaatc gaaacaatct tgttttgacc tttactgtgc 19560
ttccacaaga ctgcacccac catgctttga ggatgcaatt ggagctgacg tgcaacaact 19620
ccatcgtcat aatggatcag cgtgacaaaa tacgtcttct tgttccccgt caatgatgtg 19680
agaggactgt gaacgccaag aaccaacact cccttgtcgc gtgcatgctg caaggccgac 19740
tggtaccatt cggggccgaa ggcgaccact cgaggagaag aaatatgttc tcgtgcaaga 19800
ccttgcttga aggaagggtc gaatcgttcg tgcatcttta gccacatgct tcggtctgtc 19860
cctttgagat tgacgtaatc gctttcaaag aaggcagaaa ccaaggcagc gcccagaagc 19920
aggagcaaca agcggaagag catcatcttg gtgtagtagg cggtgtgatt gcccgtgctt 19980
gccggtcgac actggaatcg cagatcgcaa gctgcttata ttgtagctcg atgcatctca 20040
cttggcgttt tggggctcgt ccttccatgc cgactgggtg cccagcaacc cctgaattcg 20100
gctcttcgcg gcttctcggc attatttggt tcttagcact gccgttgcca cgttctgtgt 20160
ggcggtaggc gggacggtac tttgtggcgt tgacaccgcc cacatgaatc ggtctaccgt 20220
cggttgactg taacatattg gcaacatgcc ataatactgg ttcacagcga tttcttgctc 20280
tccttcggcc ttcggcgtct accactatct aagtgcaagg aacagacttc tctcagttat 20340
ctcatcgacc ttgtgtagat ctgggagcaa taccagatcc cattctgcta tctgtcacgt 20400
gtttgaagct gccggacgtt cagaccctca ataagccgat gttgtcctcg ctttatgaaa 20460
tgtcctgcca ctggcctcgt ggcgtcctgt cagaaccaaa ctgtcggctc aacgaatatg 20520
tttgcgtgaa aacagtcatc attctacaca gagtttgtcg cacacgcctg gaatatcgct 20580
tctgtttgat tttgggttga gatcaaagag ctgtgttact gactcggata gcagcatgtt 20640
gcttagaaag cggttgacat acgttacaaa gacgctcaga agcaaaaatc tgacgggagc 20700
tacggttatt gtcgacagga tcagcgagga tttgtagggt acaaagaagt ggtggtactg 20760
cggcaaggca gggaagctaa gatcggcgct gtaaagcccg catgactcct tcgacttgtt 20820
cccaagaaag ggcagggtga gcctgctgac gggctggcca ggcatccagt cgcagcaaaa 20880
ctggacgatg ccctataggc ttgtgccaga aagcatagat gtctttgtgc tcttcattgc 20940
ctgcgccgtc attcaaacgt acattcatac cccacttatg gccaacatca gaattgaacg 21000
gaatcttggt ggtcgcgtat gcattttcat gcttgcggtc gtaggtgacg tggatgggtc 21060
cgtttcctag cgactttgaa tggtcgtacg cttgacccgg agccagcggt tttccagata 21120
cgagatggga gtagtattca acacggctct ctgggtcgat gaccgctggc aataggctgt 21180
ccctgatata cgtgatatgg tgttgcttgt agtgcttctt ggcatcgctt gtcagacttg 21240
gttggctcac agcgaaagtc gcagtcgtaa ggacggaaat ggatagtaat agatggatga 21300
taatgcgagt cgagagaacc atcggagcaa cttgactggg cgatgagctg ggaaaacgat 21360
tggggtgccg tgaaggaagt gagtcggact tttcacttaa ttgactctat ttatggcttc 21420
aatccagaca gcaatctaat gctacatcgt ctcaaaagct cgaaagacag atcagaggcg 21480
gttcaggaaa gggctttgca gcttgcaagc aggcgacaac agtccaaagc ggctaaagag 21540
gcacccttga gacggttgtt tctatgatgg cgctcgtcgc attgtttcgg ctggttgtct 21600
tcctacatat caacaccgat cgtgcaagct tgacaacacc gatgctttgc ttatcaccat 21660
gccagcagca gttgcaggag gtacatctca cataaagaag aacgcggcct tgaggccaac 21720
ccagaagatt gtgacagcat ttgagtgggc tcgatgctag acaataagaa gcgtggttgc 21780
tcgttgtatc cttctgtcaa gccacgcaca ggtgagatgt 21820
<210> 74
<211> 1097
<212> DNA
<213> artificial
<220>
<223> Actin promoter of P.tsukubaensis: last 4 nucleotides are s
tart codon + G of genomic DNA coding for Pseudog6713.t1
<400> 74
gcccgttcaa cacaatgcgc ctgcaatttc tatccccgct ttccacctct gtctccctct 60
tcaaagtcac agagtctgcc atttgtattc gagcatgaaa aatgatgacc tcctttcttc 120
tcgttcaata cagcggacat gaacaagaaa ggggtggcct gagccaccaa gttctacact 180
tgcagccaga cgtattcaaa aatcgacgtg gacgagttgc gactcaacat cctctgtgaa 240
ttgcaatcga gtgagtgatt acgacctgta ttcacgtcaa aatgcaggtg tgacatttga 300
attttgaaat acatgaggca ggctcgattt gctccactca agtcgagttt gccaaattca 360
agaagcgcta atcggagcca accgaccgac cacaaccagc caaatcagcc agccaaggca 420
gagaagcaga agcaaaggcg gtgcattgag aggtgagccg tgtgctgtgc tgtgctctgc 480
tgtgctgtct gtcaatgctt gctgcgtgtg tttgtctcgc ctctacagcc tgcccctcaa 540
gatgtgaccg attggaagga aaggaaggtc acacgcagtt ctggcatgcc acgcacgcac 600
agcccgaaat tgcgatctca agagactgcc gacgccgccg tccgccgttg agcgctctgc 660
ttgggtcaaa gcgtaagcgc ttctcgaatt caaactcaca gagttccaag tctgcacagg 720
tcatctgttc gtccttttga gactgcctga ctggctggct ggaacgcacg cacgcacact 780
tccgattcga caccgcccgc tgctgctgtc ttctgcgctc ttgtgccctt cttctgtact 840
tggcctttgc gtcgacttct ttgcttgctc ggcagtgccg tctcatctgc cccaagtcaa 900
gctcagcagc acagcacaca cgcatcaccc tctcggcttg ggtttgcccc tgttgcctgt 960
ctgtccacac tcacacacat ccctatcgct tgctcgacat catcgcttac ctcttcccca 1020
ccacctcgtc tttgacacct ttactttctc aacccctctt ccaccaccaa cccccccacc 1080
acttactttc aacatgg 1097
<210> 75
<211> 2042
<212> DNA
<213> Pseudozyma tsukubaensis
<220>
<223> Pseudog6713.t1 genomic DNA
<400> 75
atggagggtg agtactttac ttgatcagct tctcttcgcc atcccgtcat tcgccatccg 60
ccagccaaag tgtgggaaga cagccacacc gcaattcgcc cctcagccgg ccattgcttt 120
gatagcgacg aacccttgca atctttgatc gagtgcaaag cttaaagcgc cacttggcgg 180
atggatcaaa gcatcttcag acagtcttcg cgaccatgct cggcgtcgtc gcgaccaggt 240
tgcacacctt caactgacga acggctgacc taccatcgtc ggatcagctt ccgatcatgg 300
atacaagtta ggtgggaaag gcctcacgca tccgactgca tgagctattc gctccgtcat 360
tttttggcaa ttggatgcaa actcggcgat gcgcttgggc caactagaat gcgtcatcgg 420
aagatttgct tgtcaaccat gtgcacacgg cttgactgtt tcggcgaatg actacggatg 480
gctggatggc ttcgacggac ttgtgactga ccttcccata ccttgttgcg ctcctttctc 540
gcctcaaatc caattctgca atccacagac gaagtcgctg ctgtaagtag ctcattcgag 600
cttccacctc gcacggaacc aaaggcccta atgcgctcta atttcgcgag ggggatgcac 660
acacaggtag tattgtaaca gagcaacgag gctgacttct gaatgctgct ttgtcttgaa 720
tcacacaaat ttgcacggac gcttgctttc ttcgaacgct tttccgcttc gccctctgac 780
agctcgttat cgacaatggt tcgggaatgt gcaaaggtaa gtttctacaa atttgcttcc 840
caaaaggagc ttcaatagct ttgcagccgt tctttgaccg gcactgcgca gcaattcacc 900
ccaagcaccg tttctgacgc tttcttccat gcacttttct gctacatttc actttgtctc 960
gcacaacagc cggtttcgcc ggtgatgacg ctccccgagc tgtcttccct tccgttgtcg 1020
gtcgtccccg tcaccagggt gtcatggtcg gcatgggcca gaaggactcg tacgtcggtg 1080
acgaggctca gtccaagcgt ggtatcttga ccctcaagta ccccatcgag cacggtatcg 1140
ttaccaattg ggacgacatg gagaagatct ggcaccacac cttctacaac gagcttcgtg 1200
tcgcccctga ggagcacccc gttctcctta ccgaggctcc cctcaacccc aaggctaacc 1260
gtgagaagat gacccagatc cttttcgaga ccttcaacgc tcccgccttc tacgttgcta 1320
tccaggccgt tctctcgctc tacgcctccg gtcgtaccac cggtatcgtt ctcgactcgg 1380
gtgatggtgt tacccacacc gtgcccatct acgaaggtta ctcgcttccc cactcgatcc 1440
tccgtctcga ccttgccggt cgtgacttga ccgagtacct cgcccgtatc ttgaccgagc 1500
gtggttaccc cttcaccacc actgccgagc gcgaaatcgt tcgtgacatc aaggagaagc 1560
tctgctacgt cgccctcgac tttgagcagg agatgcttac cgctacccag tcttcggccc 1620
tcgagaagtc atacgagctt cctgacggac aggtgatcac cattggtaac gagcgattcc 1680
gtacccccga agttctcttc cagcccgcct tcctcggtct tgaggctgcc ggtatccacg 1740
agaccactta caactcgatc atgaagtgtg acttggacat ccgaaaggac ctctacggta 1800
acattgtcat gtcgggtggt accacgatgt acgccggtat ctcggaccgt atgcagaagg 1860
agatcaccgc tcttgccccc agctcgatga aggtcaagat tgttgctccc cctgagcgca 1920
agtactcggt ctggattggt ggatcgattc tcgcctcgct ctctaccttc cagcagatgt 1980
ggatctcgaa gcaggagtac gacgagtctg gaccttcgat cgtccaccgc aagtgcttct 2040
aa 2042
<210> 76
<211> 375
<212> PRT
<213> Pseudozyma tsukubaensis
<220>
<223> Pseudog6713.t1
<400> 76
Met Glu Asp Glu Val Ala Ala Leu Val Ile Asp Asn Gly Ser Gly Met
1 5 10 15
Cys Lys Ala Gly Phe Ala Gly Asp Asp Ala Pro Arg Ala Val Phe Pro
20 25 30
Ser Val Val Gly Arg Pro Arg His Gln Gly Val Met Val Gly Met Gly
35 40 45
Gln Lys Asp Ser Tyr Val Gly Asp Glu Ala Gln Ser Lys Arg Gly Ile
50 55 60
Leu Thr Leu Lys Tyr Pro Ile Glu His Gly Ile Val Thr Asn Trp Asp
65 70 75 80
Asp Met Glu Lys Ile Trp His His Thr Phe Tyr Asn Glu Leu Arg Val
85 90 95
Ala Pro Glu Glu His Pro Val Leu Leu Thr Glu Ala Pro Leu Asn Pro
100 105 110
Lys Ala Asn Arg Glu Lys Met Thr Gln Ile Leu Phe Glu Thr Phe Asn
115 120 125
Ala Pro Ala Phe Tyr Val Ala Ile Gln Ala Val Leu Ser Leu Tyr Ala
130 135 140
Ser Gly Arg Thr Thr Gly Ile Val Leu Asp Ser Gly Asp Gly Val Thr
145 150 155 160
His Thr Val Pro Ile Tyr Glu Gly Tyr Ser Leu Pro His Ser Ile Leu
165 170 175
Arg Leu Asp Leu Ala Gly Arg Asp Leu Thr Glu Tyr Leu Ala Arg Ile
180 185 190
Leu Thr Glu Arg Gly Tyr Pro Phe Thr Thr Thr Ala Glu Arg Glu Ile
195 200 205
Val Arg Asp Ile Lys Glu Lys Leu Cys Tyr Val Ala Leu Asp Phe Glu
210 215 220
Gln Glu Met Leu Thr Ala Thr Gln Ser Ser Ala Leu Glu Lys Ser Tyr
225 230 235 240
Glu Leu Pro Asp Gly Gln Val Ile Thr Ile Gly Asn Glu Arg Phe Arg
245 250 255
Thr Pro Glu Val Leu Phe Gln Pro Ala Phe Leu Gly Leu Glu Ala Ala
260 265 270
Gly Ile His Glu Thr Thr Tyr Asn Ser Ile Met Lys Cys Asp Leu Asp
275 280 285
Ile Arg Lys Asp Leu Tyr Gly Asn Ile Val Met Ser Gly Gly Thr Thr
290 295 300
Met Tyr Ala Gly Ile Ser Asp Arg Met Gln Lys Glu Ile Thr Ala Leu
305 310 315 320
Ala Pro Ser Ser Met Lys Val Lys Ile Val Ala Pro Pro Glu Arg Lys
325 330 335
Tyr Ser Val Trp Ile Gly Gly Ser Ile Leu Ala Ser Leu Ser Thr Phe
340 345 350
Gln Gln Met Trp Ile Ser Lys Gln Glu Tyr Asp Glu Ser Gly Pro Ser
355 360 365
Ile Val His Arg Lys Cys Phe
370 375
<210> 77
<211> 6327
<212> DNA
<213> Pseudozyma tsukubaensis
<220>
<223> P. tsukubaensis genomic region of Actin promoter and gene
<400> 77
atctccccaa tacaaatatt cataatcgtc atcatcacgg tcttgatcat gtatctgaaa 60
gctgcgaggg tggccgtaca aagaattggt gtccgtgggg atcatagtga gcaagcgaag 120
caacggactg aagttgttag accgtttcaa attctggacc ttagctcggt gatcggcaat 180
ccatattaga cacagcccga catcttctca aagccgtgcc ggtaccttgg ctgctcgatt 240
ggctgtttgt cgacattctt tccctccgcg gatagcattg ctttcgagtg acagaggtga 300
taccatacac tatcgcatcc cggccaattc ctcatactag gtgccgtgac ggtgccgtct 360
cggtgaaagt gaaatcaatc tcgctacgat gagtcggggt aagggttcaa gagatcgaac 420
accaggtcaa ctctcgcgaa ctgcgaactg caagtgtcag accctgatcc atccatccat 480
ccgtcgattc aaccgtccga ccacaagctg tcgtcatcag aacggagcaa tgcaagccgg 540
tttcccaccc tgcgttccct accagagata tagactggac acctcgtggc agctactgac 600
caacagcaac cacggcagta caagttcgat tcttgcttgg ttcaggcgga gagggcgcac 660
aggccagggt ttagaagaaa cgctgctgtc tcttgacgct tgacggagaa ggggcccgtt 720
caacacaatg cgcctgcaat ttctatcccc gctttccacc tctgtctccc tcttcaaagt 780
cacagagtct gccatttgta ttcgagcatg aaaaatgatg acctcctttc ttctcgttca 840
atacagcgga catgaacaag aaaggggtgg cctgagccac caagttctac acttgcagcc 900
agacgtattc aaaaatcgac gtggacgagt tgcgactcaa catcctctgt gaattgcaat 960
cgagtgagtg attacgacct gtattcacgt caaaatgcag gtgtgacatt tgaattttga 1020
aatacatgag gcaggctcga tttgctccac tcaagtcgag tttgccaaat tcaagaagcg 1080
ctaatcggag ccaaccgacc gaccacaacc agccaaatca gccagccaag gcagagaagc 1140
agaagcaaag gcggtgcatt gagaggtgag ccgtgtgctg tgctgtgctc tgctgtgctg 1200
tctgtcaatg cttgctgcgt gtgtttgtct cgcctctaca gcctgcccct caagatgtga 1260
ccgattggaa ggaaaggaag gtcacacgca gttctggcat gccacgcacg cacagcccga 1320
aattgcgatc tcaagagact gccgacgccg ccgtccgccg ttgagcgctc tgcttgggtc 1380
aaagcgtaag cgcttctcga attcaaactc acagagttcc aagtctgcac aggtcatctg 1440
ttcgtccttt tgagactgcc tgactggctg gctggaacgc acgcacgcac acttccgatt 1500
cgacaccgcc cgctgctgct gtcttctgcg ctcttgtgcc cttcttctgt acttggcctt 1560
tgcgtcgact tctttgcttg ctcggcagtg ccgtctcatc tgccccaagt caagctcagc 1620
agcacagcac acacgcatca ccctctcggc ttgggtttgc ccctgttgcc tgtctgtcca 1680
cactcacaca catccctatc gcttgctcga catcatcgct tacctcttcc ccaccacctc 1740
gtctttgaca cctttacttt ctcaacccct cttccaccac caaccccccc accacttact 1800
ttcaacatgg agggtgagta ctttacttga tcagcttctc ttcgccatcc cgtcattcgc 1860
catccgccag ccaaagtgtg ggaagacagc cacaccgcaa ttcgcccctc agccggccat 1920
tgctttgata gcgacgaacc cttgcaatct ttgatcgagt gcaaagctta aagcgccact 1980
tggcggatgg atcaaagcat cttcagacag tcttcgcgac catgctcggc gtcgtcgcga 2040
ccaggttgca caccttcaac tgacgaacgg ctgacctacc atcgtcggat cagcttccga 2100
tcatggatac aagttaggtg ggaaaggcct cacgcatccg actgcatgag ctattcgctc 2160
cgtcattttt tggcaattgg atgcaaactc ggcgatgcgc ttgggccaac tagaatgcgt 2220
catcggaaga tttgcttgtc aaccatgtgc acacggcttg actgtttcgg cgaatgacta 2280
cggatggctg gatggcttcg acggacttgt gactgacctt cccatacctt gttgcgctcc 2340
tttctcgcct caaatccaat tctgcaatcc acagacgaag tcgctgctgt aagtagctca 2400
ttcgagcttc cacctcgcac ggaaccaaag gccctaatgc gctctaattt cgcgaggggg 2460
atgcacacac aggtagtatt gtaacagagc aacgaggctg acttctgaat gctgctttgt 2520
cttgaatcac acaaatttgc acggacgctt gctttcttcg aacgcttttc cgcttcgccc 2580
tctgacagct cgttatcgac aatggttcgg gaatgtgcaa aggtaagttt ctacaaattt 2640
gcttcccaaa aggagcttca atagctttgc agccgttctt tgaccggcac tgcgcagcaa 2700
ttcaccccaa gcaccgtttc tgacgctttc ttccatgcac ttttctgcta catttcactt 2760
tgtctcgcac aacagccggt ttcgccggtg atgacgctcc ccgagctgtc ttcccttccg 2820
ttgtcggtcg tccccgtcac cagggtgtca tggtcggcat gggccagaag gactcgtacg 2880
tcggtgacga ggctcagtcc aagcgtggta tcttgaccct caagtacccc atcgagcacg 2940
gtatcgttac caattgggac gacatggaga agatctggca ccacaccttc tacaacgagc 3000
ttcgtgtcgc ccctgaggag caccccgttc tccttaccga ggctcccctc aaccccaagg 3060
ctaaccgtga gaagatgacc cagatccttt tcgagacctt caacgctccc gccttctacg 3120
ttgctatcca ggccgttctc tcgctctacg cctccggtcg taccaccggt atcgttctcg 3180
actcgggtga tggtgttacc cacaccgtgc ccatctacga aggttactcg cttccccact 3240
cgatcctccg tctcgacctt gccggtcgtg acttgaccga gtacctcgcc cgtatcttga 3300
ccgagcgtgg ttaccccttc accaccactg ccgagcgcga aatcgttcgt gacatcaagg 3360
agaagctctg ctacgtcgcc ctcgactttg agcaggagat gcttaccgct acccagtctt 3420
cggccctcga gaagtcatac gagcttcctg acggacaggt gatcaccatt ggtaacgagc 3480
gattccgtac ccccgaagtt ctcttccagc ccgccttcct cggtcttgag gctgccggta 3540
tccacgagac cacttacaac tcgatcatga agtgtgactt ggacatccga aaggacctct 3600
acggtaacat tgtcatgtcg ggtggtacca cgatgtacgc cggtatctcg gaccgtatgc 3660
agaaggagat caccgctctt gcccccagct cgatgaaggt caagattgtt gctccccctg 3720
agcgcaagta ctcggtctgg attggtggat cgattctcgc ctcgctctct accttccagc 3780
agatgtggat ctcgaagcag gagtacgacg agtctggacc ttcgatcgtc caccgcaagt 3840
gcttctaagc gagttgcatt tcgaaggcgc tctggttgtg ttactagcgg ccagcgggcc 3900
cgaatctgac tcgcatttga caacaacgac aacatcatca tcactgtact tcaaggcagt 3960
atgtagacgg gcctttgacg agcgcagtgg caccagcggg agagcgagta gaaggagacg 4020
gcagcagact tgttgtactt cttggaatcg tctctggctg gtgtgacacg cgagcggcag 4080
ggaaccattt ccatttcgcg tcttctatgt aggcttttgg ccaaaccttt tcctcctcac 4140
aaatgaaaga tatgataacg acctcacaga atcttggtgc atggaacgaa agctcgtgat 4200
tagcgctgac tgaacctgga tttggacctt gggtgtgaag actttcccgg gaaaccatgc 4260
gaagagcgtt tgagagactt gcgaatggct tcagtgatgc aagacgctat caatgcaaat 4320
cgaaccctgc tcatctgcga acgagaagag cacttaacct tgcctcacag agagtaggag 4380
aagcaggcac gacgaggaga aaggttgcat ctagccgtcg gacctgtcaa agatcggaat 4440
ccatcggggc aaaagcaacg ttgacatatt gagattcatt attttagatc ggctgtactg 4500
taaatcttgg ccttttggta ttcagctccg atcctctagc tctgcgtcgc tcgctggcaa 4560
cctcctgcgt gctccttcct tcttgtaatc cctcggctat gcctttccta gcgtctgcgc 4620
tgttgcaggc tagcatcgca cttgagattc cttgcatgga tttagcttgt cattgctttt 4680
tggcgcacgg atcgctacat tgctcatctg catcccgagg cgaatcggaa aaagaagcat 4740
ctgcaacggt ctagcgacga cgaaagaaga cggaaagagc gcttgcgagc tgaggttctg 4800
cctagacagt agcgagcgct acagacaatg aaaggagcgg aacgctgcaa ggcaagatca 4860
gaggtctgtg cgtgtgatgc tgcgggtcct gtgctaaatt cggcatgcta agttactact 4920
ttgtctcttt tgcctctcac gacatgaaag ggaaacccga aaacgaaaga ggaaagagag 4980
agacgacctg tcaacctacc tcttgctttc cccggtcttg gcagcgtgtt ggcatggatg 5040
acggtctgcg atcgaaatcg acgccgaggc cttctttcct ttctgtgcgt tcgaaagggc 5100
caaaagaggt atcgaattcg accgacacac cgaggcggag agcggataaa gggcgcattc 5160
cgaagaaaaa gttgctggca catgtgcaca ctcgcttggc gtttctcaaa gagtgctgca 5220
tcgaaatgca catgcattcc tgcatgactg cgttgctctg tctggtcttt gtgcgccttt 5280
ttgctaaaat cacattttac tcgcttgcac agacatccaa gaaaagacag gcatgtgtct 5340
gcgtccatat cggtggtcgc ttggcacatt tgctagacca ctttcctcgg ctgcttgtgt 5400
tgttactgcg cacacacagg cggcagatgg tatcaaaacg agcgcttcga atggcatcaa 5460
aagtgagaga aaaagcacag acagccacag agtgtaaaaa agaacgaact cgacccaagc 5520
tgcggggttg gcgagacatt ttggtctttt tgacaggcgc agcacgaggc tagtcaagtc 5580
cgttcaagtc aaaaagtgtt ggtgtcagac gcgagtgcca gccagccagc aagcaagcaa 5640
aagcgcgaat ttggacagcc acgctagaac aaagaaaggg cagcacaccg cgacactgca 5700
acaaagagag agagagagag agagaaaggc gtcggaaagc cccattcctg cgctgcgtgt 5760
gtgactgcgc ttggcgttct gtctcttgcg ctgctgctgc tcctcgtcct cattgacctc 5820
ttcgctagtg tattcctttg ttcatcttac tctccaaccc cttccttccc ttccttccct 5880
tccatcactt ccctcatcct cattctcaat acggccccct atctctctct tcctcaaaca 5940
aagcagcacg gttcttcctt tcaacccctc tcttttctga cattcagttc cctttctttg 6000
gctggtccat acaaaggtct ctcaggtacc cgacacatac acaaacgcac gcataccact 6060
tcgtttgctt tcccatctcc gtctcacaaa acgcatcctg caaatcccat atcaactgcc 6120
ttgcatcgtc atccaaactc tctttcgctc ccactcgatc aataatctct atctctccac 6180
tctcccttac cttcccaacc ctttggtccc tataccacct ccccacccac ttactgctgc 6240
tgcttcgtca atcacgttct ttgacagaac tctcaatcgc atacatctca ttgatcccca 6300
gcaacatttc aactctagac aacaaca 6327
Claims (21)
- 이타콘산 생산 숙주 미생물로서, 여기서 미생물은 ip 로커스의 외부에서 미생물의 게놈에 통합된 적어도 1개의 이종성 발현 카세트를 포함하며, 여기서 발현 카세트는 하기를 포함하는 것인 이타콘산 생산 숙주 미생물:
a) 기능성 프로모터의 작동가능한 제어 하의 이종성 RIA1 유전자, 및/또는
b) 이종성 기능성 프로모터의 작동가능한 제어 하의 RIA1 유전자. - 이타콘산 생산 숙주 미생물로서, 여기서 숙주는
- RIA1 유전자의 발현을 위한 및/또는
- ADI1, MTT1 및 TAD1로 이루어진 군으로부터 선택된 적어도 2개의 유전자의 발현을 위한
발현 카세트를 포함하는 재조합 미생물이고,
여기서 상기 발현 카세트는 통합 부위에서 미생물의 게놈에 통합되며, 여기서 통합 부위는
a) 좌측 경계 유전자와 우측 경계 유전자 사이에 위치하며, 여기서 좌측 및 우측 경계 유전자의 각각의 번역 개시 코돈의 각각의 제1 뉴클레오티드는 상응하는 야생형 미생물에서 최대 51600개 뉴클레오티드에 의해 분리되어 있고,
여기서 좌측 경계 유전자는 아세틸-CoA 신테타제 활성을 갖는 단백질을 코딩하고,
여기서 우측 경계 유전자는 서열식별번호: 25와 적어도 21% 동일성을 갖는 아미노산 서열로 이루어진 단백질을 코딩하고/거나,
b) 서열식별번호: 3, 서열식별번호: 5, 서열식별번호: 7, 서열식별번호: 9, 서열식별번호: 11, 서열식별번호: 13, 서열식별번호: 15, 서열식별번호: 17, 서열식별번호: 19, 서열식별번호: 21, 서열식별번호: 23, 서열식별번호: 25 중 임의의 것과 적어도 30% 서열 동일성을 갖는 아미노산 서열로 번역되는 오픈 리딩 프레임의 가장 가까운 경계의 51600개 이하의 뉴클레오티드에 위치하고/거나,
c) 서열식별번호: 3, 서열식별번호: 5, 서열식별번호: 7, 서열식별번호: 9, 서열식별번호: 11, 서열식별번호: 13, 서열식별번호: 15, 서열식별번호: 17, 서열식별번호: 19, 서열식별번호: 21, 서열식별번호: 23, 서열식별번호: 25 중 임의의 것과 적어도 30% 서열 동일성을 갖는 아미노산 서열로 번역되는 오픈 리딩 프레임 내에 위치하거나 또는 그를 대체하는 것인
이타콘산 생산 숙주 미생물. - 이타콘산 생산 숙주 미생물로서, 여기서 숙주는 재조합 미생물이며, 이는
a) 이타콘산 생산을 위한 활성 이타콘산 대사 경로를 포함하고,
b) 여기서
i) 단백질 서열인 서열식별번호: 3, 서열식별번호: 5, 서열식별번호: 7, 서열식별번호: 9, 서열식별번호: 11, 서열식별번호: 13, 서열식별번호: 15, 서열식별번호: 17, 서열식별번호: 19, 서열식별번호: 21, 서열식별번호: 23 또는 서열식별번호: 25 중 임의의 것과 적어도 30% 서열 동일성을 갖는 단백질을 코딩하고/거나
ii) 적어도 낮은 엄격도 조건 하에 상기 단백질 서열을 코딩하는 핵산 서열과 혼성화하는 상보성 가닥인
적어도 1개의 유전자가 불활성화된 것인
이타콘산 생산 숙주 미생물. - 제1항 내지 제3항 중 어느 한 항에 있어서, 동일한 조건 하에 배양된 상응하는 야생형 균주와 비교하여
a) RIA1 유전자의 발현 수준이 적어도 50배 증가하고/거나,
b) ADI1, MTT1 및 TAD1로 이루어진 군으로부터 선택된 적어도 2개의 유전자의 발현 수준이 적어도 1000배 증가하고/거나,
c) ITP1 유전자의 발현 수준이 최대 500배 증가한 것인
생산 숙주 미생물. - 제1항 내지 제4항 중 어느 한 항에 있어서, 미생물이 분류학상 우스틸라기노마이세테스(Ustilaginomycetes) 강, 보다 더 바람직하게는 우스틸라기날레스(Ustilaginales) 목, 보다 더 바람직하게는 우스틸라기나세아에(Ustilaginaceae) 과, 보다 더 바람직하게는 아노말로마이세스(Anomalomyces), 안트라코시스티스(Anthracocystis), 브로멜리아고(Bromeliago), 신트라크티아(Cintractia), 더마토소루스(Dermatosorus), 디르크메이아(Dirkmeia), 에리오코르텍스(Eriocortex), 파리시아(Farysia), 프란츠페트라키아(Franzpetrakia), 김노신트라크티아(Gymnocintractia), 헤테로톨리포스포리움(Heterotolyposporium), 칼마노지마(Kalmanozyma), 랑도니아(Langdonia), 류코신트라크티아(Leucocintractia), 마칼피노마이세스(Macalpinomyces), 멜라노시키움(Melanopsichium), 모에스지오마이세스(Moesziomyces), 모레아우아(Moreaua), 마이코시린크스(Mycosyrinx), 파르불라고(Parvulago), 페리클라디움(Pericladium), 포르탈리아(Portalia), 슈도지마(Pseudozyma), 레스티오스포리움(Restiosporium), 쉬조넬라(Schizonella), 쉬바시아(Shivasia), 스포리소리움(Sporisorium), 스테고신트라크티아(Stegocintractia), 톨리포스포리움(Tolyposporium), 트란츠쉘리엘라(Tranzscheliella), 트리코신트라크티아(Trichocintractia), 트리오디오마이세스(Triodiomyces), 투비소루스(Tubisorus), 우스틸라고(Ustilago), 웹스다네아(Websdanea) 중 임의의 속에 속하고, 가장 바람직하게는 슈도지마(Pseudozyma) 속에 속하는 것인 생산 숙주 미생물.
- 제1항 내지 제5항 중 어느 한 항에 있어서,
a) 적어도 9.5 g /(l d)의 생산율로 및/또는
b) 적어도 25 % (w/w 글루코스)의 수율로
글루코스를 이타콘산으로 전환시키기 위한
생산 숙주 미생물. - ip 로커스의 외부에서 통합을 위해 강한 구성적으로 활성인 프로모터에 작동가능하게 연결된 RIA1 유전자를 포함하는 통합 벡터.
- 제7항의 벡터로 형질전환된 생산 숙주 미생물.
- 하기를 포함하는, 이타콘산 생산 숙주 미생물을 변경시키는 방법:
- RIA1 유전자의 발현을 위한 및/또는
- ADI1, MTT1 및 TAD1로 이루어진 군으로부터 선택된 적어도 2개의 유전자의 발현을 위한
적어도 1개의 발현 카세트를 ip 로커스 이외의 통합 부위에서 미생물 게놈에 통합시키는 것. - 제9항에 있어서, 통합 부위가
a) 좌측 경계 유전자와 우측 경계 유전자 사이에 위치하며, 여기서 좌측 및 우측 경계 유전자의 번역 개시 코돈의 아데닌은 상응하는 야생형 미생물에서 최대 51600개 뉴클레오티드에 의해 분리되어 있고,
여기서 좌측 경계 유전자는 아세틸-CoA 신테타제 활성을 갖는 단백질을 코딩하고,
여기서 우측 경계 유전자는 서열식별번호: 25와 적어도 21% 동일성을 갖는 아미노산 서열로 이루어진 단백질을 코딩하고/거나,
b) 서열식별번호: 3, 서열식별번호: 5, 서열식별번호: 7, 서열식별번호: 9, 서열식별번호: 11, 서열식별번호: 13, 서열식별번호: 15, 서열식별번호: 17, 서열식별번호: 19, 서열식별번호: 21, 서열식별번호: 23, 서열식별번호: 25 중 임의의 것과 적어도 30% 서열 동일성을 갖는 아미노산 서열로 번역되는 오픈 리딩 프레임의 가장 가까운 경계의 6500개 이하의 뉴클레오티드에 위치하고/거나,
c) 서열식별번호: 3, 서열식별번호: 5, 서열식별번호: 7, 서열식별번호: 9, 서열식별번호: 11, 서열식별번호: 13, 서열식별번호: 15, 서열식별번호: 17, 서열식별번호: 19, 서열식별번호: 21, 서열식별번호: 23, 서열식별번호: 25 중 임의의 것과 적어도 30% 서열 동일성을 갖는 아미노산 서열로 번역되는 오픈 리딩 프레임 내에 위치하거나 또는 그를 대체하는 것인
방법. - 제9항 또는 제10항에 있어서, 단백질 서열인 서열식별번호: 19, 서열식별번호: 15 및/또는 서열식별번호: 29와 적어도 30% 서열 동일성을 갖는 단백질을 코딩하는 적어도 1개의 유전자가 불활성화된 것인 방법.
- 제9항 또는 제10항에 있어서, 미생물이 적어도 1개의 발현 카세트를 포함하지 않는 대조군 미생물에 비해 증가된 이타콘산 생산율을 갖는 것인 방법.
- 하기를 포함하는, 재조합 이타콘산 생산 숙주 미생물을 수득하는 방법:
a) 모 미생물을 배양하고,
b) 임의의 순서로 및/또는 동시에 하기를 수행하고:
- 필요한 경우: 미생물에서 활성 이타콘산 경로를 수득하기 위해 미생물에게 임의의 이종성 ADI1, MTT1 및 TAD1 유전자를 제공하기 위한 하나 이상의 형질전환,
- 구성적으로 활성인 프로모터의 제어 하의 RIA1 유전자의 적어도 하나의 통합, 여기서 통합이 ip-로커스에 있지 않음,
- i) 단백질 서열인 서열식별번호: 3, 서열식별번호: 5, 서열식별번호: 7, 서열식별번호: 9, 서열식별번호: 11, 서열식별번호: 13, 서열식별번호: 15, 서열식별번호: 17, 서열식별번호: 19, 서열식별번호: 21, 서열식별번호: 23 또는 서열식별번호: 25 중 임의의 것과 적어도 30% 서열 동일성을 갖는 단백질을 코딩하고/거나
ii) 적어도 낮은 엄격도 조건 하에 상기 단백질 서열을 코딩하는 핵산 서열과 혼성화하는 상보성 가닥인
적어도 1개의 유전자의 불활성화;
c) 단계 b)로부터 생성된 재조합 이타콘산 생산 숙주 미생물을 단리하는 것. - 하기를 포함하는 생산 방법으로서:
a) 이타콘산을 생산하도록 생산 숙주 미생물을 발효시키고,
b) 단계 (a)에서 생산된 이타콘산을 회수하는 것,
여기서 미생물은 제1항 내지 제6항 및 제8항 중 어느 한 항에 따른 미생물이거나, 또는 제9항 내지 제13항 중 어느 한 항에 따라 수득되거나 또는 수득가능한 것인
생산 방법. - 제14항에 있어서, 발효 공정이 액침 발효인 생산 방법.
- 제14항 내지 제16항 중 어느 한 항에 있어서, 생산 방법이 회분식 발효, 유가 배양식 발효 또는 연속 발효인 생산 방법.
- 제14항 내지 제16항 중 어느 한 항에 있어서, 발효가 최대 0.1 %(v/v)의 복합 배지 성분를 포함하는 최소 배지에서 시작되고, 최대 5.5의 pH를 갖는 것인 생산 방법.
- 제14항 내지 제17항 중 어느 한 항에 있어서, 발효 동안에 배지의 pH를 최대 4로 저하시키는 것을 포함하는 생산 방법.
- 제14항 내지 제18항 중 어느 한 항에 있어서,
배지가 폴리알콜성 탄소 공급원을 포함하고,
발효 동안에 탄소 공급원의 농도가 3시간 초과 동안 10 g/l 미만으로 떨어지지 않는 것인
생산 방법. - 제14항 내지 제19항 중 어느 한 항에 있어서, 배지 내 이타콘산 대 말산의 농도 비가 적어도 15:1인 생산 방법.
- 제14항 내지 제20항 중 어느 한 항에 있어서, 단계 a)에서의 발효 방법이 호기성 또는 미세호기성 조건 하에 있는 것인 생산 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP18176542 | 2018-06-07 | ||
EP18176542.1 | 2018-06-07 | ||
PCT/EP2019/063965 WO2019233853A1 (en) | 2018-06-07 | 2019-05-29 | Microorganisms and the production of fine chemicals |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20210019496A true KR20210019496A (ko) | 2021-02-22 |
Family
ID=62712747
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020217000327A KR20210019496A (ko) | 2018-06-07 | 2019-05-29 | 미생물, 및 정밀 화학물질의 생산 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20210230573A1 (ko) |
EP (1) | EP3802783A1 (ko) |
KR (1) | KR20210019496A (ko) |
CN (1) | CN112218941A (ko) |
WO (1) | WO2019233853A1 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118043472A (zh) | 2021-10-01 | 2024-05-14 | 巴斯夫欧洲公司 | 通过衣康酸生产郁金香素a的生化途径 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7026149B2 (en) | 2003-02-28 | 2006-04-11 | Ajinomoto Co., Inc. | Polynucleotides encoding polypeptides involved in the stress response to environmental changes in Methylophilus methylotrophus |
CN201064581Y (zh) | 2007-07-04 | 2008-05-28 | 程克勇 | 手动吸奶器 |
DE102008011854B4 (de) | 2008-02-28 | 2014-02-20 | Helmholtz-Zentrum Für Umweltforschung Gmbh - Ufz | Verfahren zur biotechnologischen Herstellung von Itaconsäure |
US8143036B2 (en) | 2009-05-11 | 2012-03-27 | Industrial Technology Research Institute | Genetically modified microorganisms for producing itaconic acid with high yields |
LU92409B1 (en) | 2014-03-21 | 2015-09-22 | Philipps Universit T Marburg | Means and methods for itaconic acid production |
US20170191091A1 (en) | 2014-05-29 | 2017-07-06 | Dsm Ip Assets B.V. | Recombinant cells producing itaconic acid and methyl esters thereof |
WO2016069849A1 (en) | 2014-10-30 | 2016-05-06 | Board Of Regents, The University Of Texas System | Engineered fungi for itaconic acid production |
EP3237628A1 (en) | 2014-12-23 | 2017-11-01 | BRAIN AG Biotechnology Research and Information Network AG | Process for the production of malate |
-
2019
- 2019-05-29 EP EP19726438.5A patent/EP3802783A1/en active Pending
- 2019-05-29 US US15/734,905 patent/US20210230573A1/en active Pending
- 2019-05-29 CN CN201980038079.8A patent/CN112218941A/zh active Pending
- 2019-05-29 KR KR1020217000327A patent/KR20210019496A/ko unknown
- 2019-05-29 WO PCT/EP2019/063965 patent/WO2019233853A1/en unknown
Also Published As
Publication number | Publication date |
---|---|
WO2019233853A1 (en) | 2019-12-12 |
CN112218941A (zh) | 2021-01-12 |
US20210230573A1 (en) | 2021-07-29 |
EP3802783A1 (en) | 2021-04-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2018203835B2 (en) | Recombinant dna constructs and methods for modulating expression of a target gene | |
DK2588616T3 (en) | PROCEDURE FOR MAKING A RELATIONSHIP OF INTEREST | |
CN104498493B (zh) | CRISPR/Cas9特异性敲除乙型肝炎病毒的方法以及用于特异性靶向HBV DNA的gRNA | |
Archambault et al. | Genetics of eukaryotic RNA polymerases I, II, and III | |
KR101511639B1 (ko) | 재조합 미생물 및 이의 사용 방법 | |
KR20200124702A (ko) | 신규한 cas9 오르소로그 | |
AU2010258955B2 (en) | Expression cassettes derived from maize | |
Yang et al. | A novel two-component system PdeK/PdeR regulates c-di-GMP turnover and virulence of Xanthomonas oryzae pv. oryzae | |
AU2016315655A1 (en) | Ochrobactrum-mediated transformation of plants | |
KR20130117753A (ko) | 포스포케톨라아제를 포함하는 재조합 숙주 세포 | |
CN1599751A (zh) | 分枝杆菌比较基因组学作为鉴定分枝杆菌病的诊断、预防或治疗靶的工具 | |
KR20100016170A (ko) | 이스트 발현 시스템 | |
KR20140015136A (ko) | 3-히드록시프로피온산 및 다른 생성물의 제조 방법 | |
CN113227364A (zh) | 用于产生熊去氧胆酸及其前体的细胞和方法 | |
KR20200111172A (ko) | 네페탈락톨 산화 환원 효소, 네페탈락톨 합성 효소, 및 네페탈락톤을 생산할 수 있는 미생물 | |
CN112852650B (zh) | 一种高产檀香烯和檀香醇的酿酒酵母工程菌及其构建方法与应用 | |
CN107208043A (zh) | 具有改进的光合活性的蓝细菌 | |
KR20210097723A (ko) | 발효에 의한 1,5-디아미노펜탄의 생산을 위한 조작된 생합성 경로 | |
KR20230078639A (ko) | 발효를 통한 4-아미노페닐에틸아민의 생산을 위해 조작된 생합성 경로 | |
AU2017381762A1 (en) | Methods of increasing specific plants traits by over-expressing polypeptides in a plant | |
KR20210019496A (ko) | 미생물, 및 정밀 화학물질의 생산 | |
Lee et al. | Cloning and characterization of two groESL operons of Rhodobacter sphaeroides: transcriptional regulation of the heat-induced groESL operon | |
WO2019243624A1 (en) | Production of benzylisoquinoline alkaloids in recombinant hosts | |
CN113166741A (zh) | Dna文库的多重确定性组装 | |
CN106119137B (zh) | 一种改善丝状真菌蛋白分泌能力的方法 |