KR20210019496A

KR20210019496A - 미생물, 및 정밀 화학물질의 생산

Info

Publication number: KR20210019496A
Application number: KR1020217000327A
Authority: KR
Inventors: 게롤트 바르트
Original assignee: 바스프 에스이
Priority date: 2018-06-07
Filing date: 2019-05-29
Publication date: 2021-02-22
Also published as: WO2019233853A1; CN112218941A; US20210230573A1; EP3802783A1

Abstract

본 발명은 정밀 화학물질, 특히 이타코네이트 또는 이타콘산의 발효적 생산에 관한 것이다. 본 발명은 생산 미생물, 발효 조성물 및 배지, 상기 산물의 생산에 유용한 단백질, 및 이러한 단백질의 발현을 위한 핵산, 및 정밀 화학물질의 생산 방법에 관한 것이다.

Description

미생물, 및 정밀 화학물질의 생산

메틸렌숙신산, 메틸렌 부탄디오산, 프로필렌디카르복실산 또는 2-프로펜-1,2-디카르복실산으로도 불리는 이타콘산은 다양한 산물, 예를 들어 아크릴 섬유 및 고무에 대한 필수 전구체이거나, 또는 예를 들어 부직 섬유, 종이 및 콘크리트 페인트에서 결합제 및 사이징제로서 사용된다. 이타콘산 에스테르는 추가의 원자재 및 특수 화학물질을 위한 중간체로서 사용될 수 있다. 지금까지 이타콘산의 생산을 위해 산업적으로 이용된 주요 생산 미생물은 사상균인 아스퍼길루스 테레우스(Aspergillus terreus) (에이. 테레우스(A. terreus))이다. 에이. 테레우스에서 높은 역가의 이타콘산이 달성되었지만, 유기체는 이타콘산 생산에 최적인 배지에서 불량한 성장을 나타내고, 전단 응력에 의해 불리한 영향을 받아서, 통상적인 교반-탱크 생물반응기에서의 발효를 불가능하게 한다. 에이. 테레우스를 유전적으로 최적화하려는 시도는 기껏해야 결정적이지 않은 결과를 제공하였다 (예를 들어 WO2016069849 참고).

야로위아 리폴리티카(Yarrowia lipolytica) (WO2016069849), 에스케리키아 콜라이(Escherichia coli) (US2010285546), 사카로마이세스 세레비지아에(Saccharomyces cerevisiae) (WO2015181312)를 비롯하여 이타콘산 생산을 위해 수많은 대안적인 미생물을 시험하였다. [Geiser et al. (Fungal Biology and Biotechnology 2014, 1:2)]에서는 다양한 우스틸라기노마이세테스(Ustilaginomycetes)를 이타콘산 생산을 위해 시험하였고, 대부분의 시험한 미생물은 또한 말레이트와 같은 부산물을 훨씬 더 많은 양으로 생산하여, 이타콘산의 예상된 생산 수율을 감소시키는 것으로 확인되었다. 이타콘산 생산 과정이 크렙스(Krebs) 사이클에 의존하는 것으로 믿어지기 때문에, 부산물로서 말레이트의 형성은 특히 불리하며, 따라서 말레이트의 손실은 이타콘산 생산의 효율을 감소시킬 것이다. 시험한 다른 우스틸라기노마이세테스는 우스틸라고 시노돈티스(Ustilago cynodontis)와 같은 평범한 식물 병원체이며, 이는 특별한 생물학적 안전성 대비를 필요로 하여 산업상 적용가능성을 감소시킨다. 또한, 모든 생산은 산업적 규모의 발효를 위해 고가의 성분인 효모 추출물을 비롯한 복합 배지에 의존하였다. WO2009106627A2는 슈도지마(Pseudozyma), 칸디다(Candida) 및 토룰롭시스(Torulopsis) 속의 효모를 사용하여 이타콘산을 생산하는 생산 방법을 기재한다. 그러나, 이 문헌은 허용될 수 없을 정도로 낮은 생산율 (0.25 g/(l h)) 및 수율 (37.5% w/w 이타콘산:글루코스)을 보고한다. 마찬가지로, 문헌 WO2016103140은 무엇보다도 분류학상 우스틸라기노마이세테스 강의 다양한 구성원에 의한 이타코네이트의 생산을 기재한다. 상기 문헌은 거의 7일 배양 후에 수득된 이타코네이트의 농도가 항상 10 g/l보다 훨씬 낮았고, 시험한 대부분의 균주의 경우 이타코네이트 생산이 수득될 수 없었거나 또는 말레이트와 같은 유의한 부산물이 수득되었음을 보고한다 (도 13).

따라서, 산업적 규모의 이타콘산 생산의 개선된 공정, 및 이러한 개선된 공정에 필요한 물질, 예를 들어 생산 미생물, 상기 생산 미생물에 의해 발현된 단백질, 및 이러한 단백질 발현을 위한 핵산, 및 이타콘산 생산에 대해 최적화된 배지를 포함하는 발효 조성물, 및 각각의 이타콘산 생산 숙주에 대한 필요성이 남아있다.

따라서, 본 발명은 이타콘산 생산 숙주 미생물로서, 여기서 미생물은 ip 로커스의 외부에서 미생물의 게놈에 통합된 적어도 1개의 이종성 발현 카세트를 포함하며, 여기서 발현 카세트는 하기를 포함하는 것인 이타콘산 생산 숙주 미생물을 제공한다:

a) 기능성 프로모터의 작동가능한 제어 하의 이종성 RIA1 유전자, 및/또는

b) 이종성 기능성 프로모터의 작동가능한 제어 하의 RIA1 유전자.

본 발명을 기재하기 위한 추가의 방식에서, 이타콘산 생산 숙주 미생물이 제공되며, 여기서 숙주는

- RIA1 유전자의 발현을 위한 및/또는

- ADI1, MTT1 및 TAD1로 이루어진 군으로부터 선택된 적어도 2개의 유전자의 발현을 위한

발현 카세트를 포함하는 재조합 미생물이고,

여기서 상기 발현 카세트는 통합 부위에서 미생물의 게놈에 통합되며, 여기서 통합 부위는

a) 좌측 경계 유전자와 우측 경계 유전자 사이에 위치하며, 여기서 좌측 및 우측 경계 유전자의 각각의 번역 개시 코돈의 각각의 제1 뉴클레오티드는 상응하는 야생형 미생물에서 최대 51600개 뉴클레오티드에 의해 분리되어 있고,

여기서 좌측 경계 유전자는 아세틸-CoA 신테타제 활성을 갖는 단백질을 코딩하고,

여기서 우측 경계 유전자는 서열식별번호(SEQ ID NO.): 25와 적어도 21% 동일성을 갖는 아미노산 서열로 이루어진 단백질을 코딩하고/거나,

b) 서열식별번호: 3, 서열식별번호: 5, 서열식별번호: 7, 서열식별번호: 9, 서열식별번호: 11, 서열식별번호: 13, 서열식별번호: 15, 서열식별번호: 17, 서열식별번호: 19, 서열식별번호: 21, 서열식별번호: 23, 서열식별번호: 25 중 임의의 것과 적어도 30% 서열 동일성을 갖는 아미노산 서열로 번역되는 오픈 리딩 프레임의 가장 가까운 경계의 51600개 이하의 뉴클레오티드에 위치하고/거나,

c) 서열식별번호: 3, 서열식별번호: 5, 서열식별번호: 7, 서열식별번호: 9, 서열식별번호: 11, 서열식별번호: 13, 서열식별번호: 15, 서열식별번호: 17, 서열식별번호: 19, 서열식별번호: 21, 서열식별번호: 23, 서열식별번호: 25 중 임의의 것과 적어도 30% 서열 동일성을 갖는 아미노산 서열로 번역되는 오픈 리딩 프레임 내에 위치하거나 또는 그를 대체한다.

본 발명의 이타콘산 생산 숙주 미생물을 기재하기 위한 추가의 방식에서, 생산 숙주는 재조합 미생물이며, 이는

a) 이타콘산 생산을 위한 활성 이타콘산 대사 경로를 포함하고,

b) 여기서

i) 단백질 서열인 서열식별번호: 3, 서열식별번호: 5, 서열식별번호: 7, 서열식별번호: 9, 서열식별번호: 11, 서열식별번호: 13, 서열식별번호: 15, 서열식별번호: 17, 서열식별번호: 19, 서열식별번호: 21, 서열식별번호: 23 또는 서열식별번호: 25 중 임의의 것과 적어도 30% 서열 동일성을 갖는 단백질을 코딩하고/거나,

ii) 적어도 낮은 엄격도 조건 하에 상기 단백질 서열을 코딩하는 핵산 서열과 혼성화하는 상보성 가닥인

적어도 1개의 유전자가 불활성화된 것이다.

추가의 실시양태에서, 본 발명은 ip 로커스의 외부에서 통합을 위해 강한 구성적으로 활성인 프로모터에 작동가능하게 연결된 RIA1 유전자를 포함하는 통합 벡터를 제공한다. 본 발명에 따라 미생물이 본 발명의 통합 벡터로 형질전환된 것인 생산 숙주 미생물이 상응하게 제공된다.

본 발명은 하기를 포함하는, 이타콘산 생산 숙주 미생물을 변경시키는 방법을 추가로 제공한다:

- RIA1 유전자의 발현을 위한 및/또는

적어도 1개의 발현 카세트를 ip 로커스 이외의 통합 부위에서 미생물의 게놈에 통합시키는 것.

본 발명에 따라, 하기를 포함하는, 재조합 이타콘산 생산 숙주 미생물을 수득하는 방법이 또한 제공된다:

a) 모 미생물을 배양하고,

b) 임의의 순서로 및/또는 동시에 하기를 수행하고:

- 필요한 경우: 미생물에서 활성 이타콘산 경로를 수득하기 위해 미생물에게 임의의 이종성 ADI1, MTT1 및 TAD1 유전자를 제공하기 위한 하나 이상의 형질전환,

- 구성적으로 활성인 프로모터의 제어 하의 RIA1 유전자의 적어도 하나의 통합, 여기서 통합이 ip-로커스에 있지 않음,

- i) 단백질 서열인 서열식별번호: 3, 서열식별번호: 5, 서열식별번호: 7, 서열식별번호: 9, 서열식별번호: 11, 서열식별번호: 13, 서열식별번호: 15, 서열식별번호: 17, 서열식별번호: 19, 서열식별번호: 21, 서열식별번호: 23 또는 서열식별번호: 25 중 임의의 것과 적어도 30% 서열 동일성을 갖는 단백질을 코딩하고/거나,

적어도 1개의 유전자의 불활성화;

c) 단계 b)로부터 생성된 재조합 이타콘산 생산 숙주 미생물을 단리하는 것.

본 발명은 하기 단계를 포함하는, 이타콘산 생산을 위한 생산 방법을 또한 제공하며:

a) 이타콘산을 생산하기 위해 생산 숙주 미생물을 발효시키는 단계; 및

b) 단계 (a)에서 생산된 이타콘산을 회수하는 단계,

여기서 미생물은 본 발명에 따른 미생물이거나 또는 본 발명에 따라 수득되거나 또는 수득가능하다.

바람직하게는, 생산 방법은 회분식 발효, 유가 배양식 발효 또는 연속 발효이다. 또한 바람직하게는, 8일의 유가 배양식 발효 후에 발효 배지 내 이타콘산 대 말산의 농도 비는 적어도 15:1이다.

도 1. r2cat에 의해 생성된 신테니 플롯. 피. 츠쿠바엔시스(P. tsukubaensis) H488의 스캐폴드가 유. 마이디스(U. maydis) 521의 게놈 서열 상에 맵핑된다.
도 2. pUC-IP-URA3 플라스미드의 구축. PtURA3의 좌측 및 우측 플랭킹 영역을 각각의 제한 부위의 상보화에 의해 증폭시켰다. XbaI & BglII 및 BglII & EcoRI 소화된 단편을 XbaI & EcoRI-절단된 pUCBM21 플라스미드에 라이게이션시켰다.
도 3. PtURA3 결실 플라스미드 pUC-DK-URA3의 구축. BglII를 이용하여 pUC-IP-URA3을 선형화시켰다. 히그로마이신 선택 마커 (히그로마이신 내성 유전자 HygB, HSP70 프로모터 및 HSP70 종결자로 이루어짐)를 BamHI 소화시키고, 선형화된 pUC-IP-URA3 플라스미드에 라이게이션시켰다. 이는 BamHI 및 BglII가 상용성 점착성 단부를 생성하기 때문에 가능하였다.
도 4. LacZ-리포터 유전자 과다발현 플라스미드의 구축을 위한 클로닝 전략. 각각의 프로모터 서열 (* 각각의 유전자의 상류 영역의 대략 1,050 bp 길이의 서열) 및 LacZ 리포터 유전자의 ORF (β 갈락토시다제)를 중첩-PCR 과정에서 함께 융합시켰다. 5'-단부를 KpnI-로 상보화시키고, 3'-단부를 PstI-제한 부위로 상보화시켰다. NsiI 및 PstI 생성된 단부의 상용성으로 인해 융합 산물을 KpnI & NsiI 소화된 pPTT-플라스미드에 라이게이션시켜, 하기 LacZ 과다발현 플라스미드를 생성하였다: pPTT pActin LacZ; pPPT pGAPDH LacZ; pPPT pHSP70 LacZ; pPPT pTEF1 LacZ.
도 5. 피. 츠쿠바엔시스 H488 LacZ-형질전환체의 β-갈락토시다제 활성 [U mg-1 총 단백질]. LacZ 리포터 유전자를 pActin, pGAPDH, pHSP70, pTEF1 또는 pUmHSP70 (기준) 프로모터 각각의 제어 하에 과다발현하였다. 세포를 3 ml YPD (완전) 배지에서 2일 동안 배양하였다.
도 6. 피. 츠쿠바엔시스 H488 LacZ-형질전환체의 β-갈락토시다제 활성 [U mg-1 총 단백질]. LacZ 리포터 유전자를 pActin, pGAPDH, pHSP70, pTEF1 또는 pUmHSP70 (기준) 프로모터 각각의 제어 하에 과다발현하였다. 세포를 2 g l-1 질소 공급원 및 0.2 g l-1 포스페이트 공급원을 갖는 3 ml MG-IT 최소 배지에서 4일 동안 배양하였다.
도 7. 피. 츠쿠바엔시스 M15 LacZ-형질전환체의 β-갈락토시다제 활성 [U mg-1 총 단백질]. LacZ 리포터 유전자를 pActin, pGAPDH, pHSP70, pTEF1 또는 pUmHSP70 (기준) 프로모터 각각의 제어 하에 과다발현하였다. 세포를 3 ml YPD (완전) 배지에서 2일 동안 배양하였다.
도 8. 피. 츠쿠바엔시스 M15 LacZ-형질전환체의 β-갈락토시다제 활성 [U mg-1 총 단백질]. LacZ 리포터 유전자를 pActin, pGAPDH, pHSP70, pTEF1 또는 pUmHSP70 (기준) 프로모터 각각의 제어 하에 과다발현하였다. 세포를 2 g l-1 질소 공급원 및 0.2 g l-1 포스페이트 공급원을 갖는 3 ml MG-IT 최소 배지에서 4일 동안 배양하였다.
도 9. 피. 츠쿠바엔시스 H488에서 이타콘산의 생산을 위한 유전자 클러스터. 클러스터는 스캐폴드 19 상에 위치하였고, 이타콘산 합성에 필요한 단지 5가지 유전자로 이루어졌다: RIA1 (이타콘산의 조절인자), MTT1 (미토콘드리아 TCA 수송인자), ADI1 (아코니테이트-Δ-이소머라제), ITP1 (이타코네이트 수송 단백질), TAD1 (트랜스-아코니테이트 데카르복실라제).
도 10. 유. 마이디스와의 서열 유사성으로 인해 피. 츠쿠바엔시스에서 이타콘산 생산을 위해 제안된 경로. 시스-아코니테이트는 MTT1에 의해 미토콘드리아로부터 시토졸로 수송되며, 여기서 이는 아코니테이트-Δ-이소머라제 (ADI1)에 의해 트랜스-아코니테이트로 전환되고, 트랜스-아코니테이트 데카르복실라제 (TAD1)에 의해 최종 산물 ITA로 추가로 탈카르복실화된다. 이어서, ITA는 ITP1에 의해 세포 환경으로 분비된다. 유전자 ADI1, ITP1, MTT1 및 TAD1은 RIA1 활성에 의해 상향조절된다. 모든 유전자는 스캐폴드 19 상에 위치하는 클러스터에서 조직화된다. 시스-아코니테이트는 ITA 생산 진균 에이. 테레우스에서 시스-아코니테이트 데카르복실라제 (AtCAD1)에 의해 이타코네이트로 직접적으로 전환된다 (회색 화살표로 표시함).
도 11은 숙시네이트 데히드로게나제의 철-황 단백질 서브유닛의 단백질 서열의 다중 정렬이다. 최상단의 아미노산 서열의 철자만이 완전히 기재되고; 다른 모든 아미노산 서열의 경우에는 각각의 위치에서 상단 서열의 각각의 아미노산과 상이한 아미노산만이 주어지며, 점은 각각의 위치에서 상단 서열의 각각의 아미노산이 존재함을 나타낸다. 정렬된 단백질은 다음과 같다:

하단 서열 "SEQ048"은 슈도지마 츠쿠바엔시스의 서열식별번호: 48에 따른 서열이다.
도 12. 야생형 균주 H488 (상단)에서 영향을 받은 영역과 비교한 피. 츠쿠바엔시스 균주 HR12 (하단)에서 RIA1-과다발현 플라스미드 pPTT-pActin-RIA1의 통합의 게놈 로커스. 녹색 막대는 그 사이에서 이종성 재조합 사건이 일어나야 했던 ORF를 표시한다.
도 13. 피. 츠쿠바엔시스에서 ITA 생산을 담당하는 본래의 유전자의 과다발현을 위해 생성된 플라스미드.
도 14. 피. 츠쿠바엔시스 기준 균주 H488, M15 및 M15-CAD
도 15. 3 ml MG-IA 배지에서 10일 배양 후에 피. 츠쿠바엔시스 H488 ADI1-과다발현 형질전환체의 이타콘산 및 말산 생산.
도 16. 3 ml MG-IA 배지에서 10일 배양 후에 피. 츠쿠바엔시스 M15 ADI1-과다발현 형질전환체의 이타콘산 및 말산 생산.
도 17. 피. 츠쿠바엔시스 기준 균주 H488, M15 및 M15-CAD.
도 18. 3 ml MG-IA 배지에서 10일 배양 후에 피. 츠쿠바엔시스 H488 ITP1-과다발현 형질전환체의 이타콘산 및 말산 생산.
도 19. 3 ml MG-IA 배지에서 10일 배양 후에 피. 츠쿠바엔시스 M15 ITP1-과다발현 형질전환체의 이타콘산 및 말산 생산.
도 20. 피. 츠쿠바엔시스 기준 균주 H488, M15 및 M15-CAD.
도 21. 3 ml MG-IA 배지에서 10일 배양 후에 피. 츠쿠바엔시스 H488 MTT1-과다발현 형질전환체의 이타콘산 및 말산 생산.
도 22. 3 ml MG-IA 배지에서 10일 배양 후에 피. 츠쿠바엔시스 M15 MTT1-과다발현 형질전환체의 이타콘산 및 말산 생산.
도 23. 피. 츠쿠바엔시스 기준 균주 H488, M15 및 M15-CAD.
도 24. 3 ml MG-IA 배지에서 10일 배양 후에 피. 츠쿠바엔시스 H488 TAD1-과다발현 형질전환체의 이타콘산 및 말산 생산.
도 25. 3 ml MG-IA 배지에서 10일 배양 후에 피. 츠쿠바엔시스 M15 MTT1-과다발현 형질전환체의 이타콘산 및 말산 생산.
도 26. 피. 츠쿠바엔시스 기준 균주 H488, M15 및 M15-CAD.
도 27. 3 ml MG-IA 배지에서 10일 배양 후에 피. 츠쿠바엔시스 H488 RIA1-과다발현 형질전환체의 이타콘산 및 말산 생산.
도 28. 3 ml MG-IA 배지에서 10일 배양 후에 피. 츠쿠바엔시스 M15 RIA1-과다발현 형질전환체의 이타콘산 및 말산 생산.
도 29. 50 ml MG-IA 최소 배지 (N: 2 g l-1, P: 0.1 g l-1, C: 15 % w/v, pH-조절 없음)에서 8일 진탕 플라스크 배양 과정에 걸쳐 선택된 6가지 RIA1-과다발현 형질전환체에 대한 ITA 및 MA 생산 (g l-1) 및 성장 (OD600)의 진행.
도 30. 단독 탄소 공급원으로서 10 % (w/v) 글루코스 (기준), 수크로스, D-크실로스 또는 10 % v/v 글리세롤을 사용하여 MG-IA 최소 배지 (N: 4 g l-1, P: 1.0 g l-1)에서 피. 츠쿠바엔시스 HR12의 성장 (OD600) 패턴. 세포를 30℃ 및 220 rpm에서 7일 동안 배플형 플라스크에서 성장시켰다. 3.3 g l-1 CaCO3를 사용하여 배지를 완충시켰다.
도 31. 단독 탄소 공급원으로서 10 % (w/v) 글루코스 (기준), 수크로스, D-크실로스 또는 10 % v/v 글리세롤을 사용하여 MG-IA 최소 배지 (N: 4 g l-1, P: 1.0 g l-1)에서 피. 츠쿠바엔시스 HR12의 이타콘산 생산. 세포를 30℃ 및 220 rpm에서 7일 동안 배플형 플라스크에서 성장시켰다. 3.3 g l-1 CaCO3를 사용하여 배지를 완충시켰다.
도 32. H488과 비교하여 피. 츠쿠바엔시스 HR12에서 이타콘산 클러스터 유전자의 상대적인 전사에 대한 정량적인 실시간 PCR의 결과. OD600 = 2-3에 도달할 때까지 MG-IA 최소 배지에서 세포를 성장시켰다. 신장 인자 1 (EF1) 및 유비퀴틴 접합 효소 (UBC6)를 기준 유전자로서 사용하였다. HR12의 발현 수준을 H488 발현 수준에 대해 정규화하였다. n = 2, 오차 막대는 표준 편차를 나타낸다.
도 33. 강한 본래의 액틴 프로모터의 제어 하의 에이. 테레우스 CAD1 유전자의 과다발현을 위한 플라스미드.
도 34. 피. 츠쿠바엔시스 기준 균주 H488, M15 및 M15-CAD.
도 35. 3 ml MG-IA 배지에서 10일 배양 후에 피. 츠쿠바엔시스 H488 AtCAD1-과다발현 형질전환체의 이타콘산 및 말산 생산.
도 36. 3 ml MG-IA 배지에서 10일 배양 후에 피. 츠쿠바엔시스 M15 AtCAD1-과다발현 형질전환체의 이타콘산 및 말산 생산.
도 37. 피. 츠쿠바엔시스에서 본래의 아코니타제 코딩 유전자 ACO1 (Pseudog3035, 천연 발생 인트론이 없음) 및 ACO2 (Pseudog2814)의 과다발현을 위한 플라스미드 pPTT.Cbx.oACO1-Ex 및 pPTT.Cbx.oACO2.
도 38. ACO1 및 ACO2를 과다발현하는 피. 츠쿠바엔시스 HR12 형질전환체의 스크리닝. 3 ml MG-IA 생산 배지를 갖는 웰 배양물에서 세포를 30℃ 및 220 rpm에서 6일 동안 배양하였다. 대략 20 mg CaCO3 / 웰에 의해 배지를 완충시켰다. 오차 막대는 2가지 별도의 배양에 대한 표준 편차를 나타낸다.
도 39. YPD 배지에서 사전 배양되고 신선한 50 ml YPD 배지로 옮긴 피. 츠쿠바엔시스 H488의 세포 성장 (OD600). 배양 1일째에 배양물에 20 g l-1 글루코스를 공급하였다 (화살표로 표시됨). 500 ml-배플형 플라스크에서 30℃, 220 rpm에서 시작 OD600 = 1에서 세포를 성장시켰다.
도 40. MG 배지에서 사전 배양되고 50 ml MG 배지로 옮긴 피. 츠쿠바엔시스 H488의 세포 성장 (OD600). 효모 세포를 두번째로 50 ml YPD 배지로 옮겼다 (우측 그래프). 500 ml-배플형 플라스크에서 30℃, 220 rpm에서 시작 OD600 = 1에서 세포를 성장시켰다.
도 41. YPD 배지에서 사전 배양되고 50 ml MG 배지로 옮긴 피. 츠쿠바엔시스의 세포 성장 (OD600). 500 ml-배플형 플라스크에서 30℃, 220 rpm에서 시작 OD600 = 1에서 세포를 성장시켰다.
도 42. MG 배지에서 사전 배양되고 50 ml MG 배지로 옮긴 피. 츠쿠바엔시스 H488의 세포 성장 (OD600). 10 % (v/v) 신선한 YPD 배지 또는 1 X 비타민 용액을 첨가하여 세포 성장을 유도하였다. 500 ml-배플형 플라스크에서 30℃, 220 rpm에서 시작 OD600 = 1에서 세포를 성장시켰다.
도 43. 다양한 양의 (NH4)2SO4 및 KH2PO4 / K2HPO4 x 3 H2O를 갖는 MG-T 배지에서 피. 츠쿠바엔시스 H488의 성장 및 유기산 생산 거동. 세포를 YPD 배지에서 1일 동안 사전 배양하고, 50 ml의 MG-T 배지로 옮겼다. 500 ml-배플형 플라스크에서 30℃, 220 rpm에서 시작 OD600 = 1에서 세포를 성장시켰고, 3.3 g l-1 CaCO3를 사용하여 배지를 완충시켰다.
도 44. 다양한 양의 NaNO3 및 KH2PO4 / K2HPO4 x 3 H2O를 갖는 MG-IA 배지에서 피. 츠쿠바엔시스 H488의 성장 (OD600) 및 유기산 생산 (g l-1) 거동. 세포를 YPD 배지에서 1일 동안 사전 배양하고, 50 ml의 MG-IA 배지로 옮겼다. 500 ml-배플형 플라스크에서 30℃, 220 rpm에서 시작 OD600 = 1에서 세포를 성장시켰고, 3.3 g l-1 CaCO3를 사용하여 배지를 완충시켰다.
도 45. 2/0.1 또는 5/0.1의 N/P-비 (N = NaNO3, P = KH2PO4 / K2HPO4 x 3 H2O)를 갖는 MG-IA 배지에서 피. 츠쿠바엔시스 M15의 성장 (OD600) 및 유기산 생산 (g l-1) 거동. 세포를 YPD 배지에서 1일 동안 사전 배양하고, 50 ml의 MG-IA 배지로 옮겼다. 500 ml-배플형 플라스크에서 30℃, 220 rpm에서 시작 OD600 = 1에서 세포를 성장시켰고, 3.3 g l-1 CaCO3를 사용하여 배지를 완충시켰다.
도 46. 다양한 N/P-비 (N = NaNO3, P = KH2PO4 / K2HPO4 x 3 H2O)를 갖는 MG-IA 배지에서 3 ml-웰 배양물 중에서 피. 츠쿠바엔시스 M15의 이타콘산 및 말산 생산 (g l-1). 세포를 YPD 배지에서 1일 동안 사전 배양하고, 3 ml의 MG-IA 배지로 옮겼다. 30℃, 220 rpm에서 세포를 인큐베이션하고, CaCO3를 사용하여 배지를 완충시켰다.
도 47. 2/0.1 또는 1/0.1의 N/P-비 (N = NaNO3, P = KH2PO4 / K2HPO4 x 3 H2O)를 갖는 MG-IA 배지에서 피. 츠쿠바엔시스 M15-CAD의 성장 (OD600) 및 유기산 생산 (g l-1) 거동. 세포를 YPD 배지에서 1일 동안 사전 배양하고, 50 ml의 MG-IA 배지로 옮겼다. 500 ml-배플형 플라스크에서 30℃, 220 rpm에서 시작 OD600 = 1에서 세포를 성장시켰고, 3.3 g l-1 CaCO3를 사용하여 배지를 완충시켰다.
도 48. 5/0.1 또는 5/1의 N/P-비 (N = NaNO3, P = KH2PO4 / K2HPO4 x 3 H2O)를 갖는 MG-IA 배지에서 피. 츠쿠바엔시스 M15-CAD의 성장 (OD600) 및 유기산 생산 (g l-1) 거동. 세포를 YPD 배지에서 1일 동안 사전 배양하고, 50 ml의 MG-IA 배지로 옮겼다. 500 ml-배플형 플라스크에서 30℃, 220 rpm에서 시작 OD600 = 1에서 세포를 성장시켰고, 3.3 g l-1 CaCO3를 사용하여 배지를 완충시켰다.
도 49. 다양한 N/P-비 (N = NaNO3, P = KH2PO4 / K2HPO4 x 3 H2O)를 갖는 MG-IA 배지에서 3 ml-웰 배양물 중에서 피. 츠쿠바엔시스 HR12의 이타콘산 및 말산 생산 (g l-1). 세포를 YPD 배지에서 1일 동안 사전 배양하고, 3 ml의 MG-IA 배지로 옮겼다. 30℃, 220 rpm에서 세포를 인큐베이션하고, CaCO3를 사용하여 배지를 완충시켰다.
도 50. N-공급원으로서 NaNO3 (기준), NH4Cl 또는 NH4NO3를 사용하여 MG-IA 최소 배지 (N: 4 g l-1, P: 1.0 g l-1)에서 피. 츠쿠바엔시스 HR12의 성장 (OD600) 패턴. 세포를 30℃ 및 220 rpm에서 7일 동안 배플형 플라스크에서 성장시켰다. 3.3 g l-1 CaCO3를 사용하여 배지를 완충시켰다.
도 51. N-공급원으로서 NaNO3 (기준), NH4Cl 또는 NH4NO3를 사용하여 MG-IA 최소 배지 (N: 4 g l-1, P: 1.0 g l-1)에서 피. 츠쿠바엔시스 HR12의 이타콘산 생산 (g l-1). 세포를 30℃ 및 220 rpm에서 7일 동안 배플형 플라스크에서 성장시켰다. 3.3 g l-1 CaCO3를 사용하여 배지를 완충시켰다.
도 52. ITA 생산 배지 MG-IA - N/P: 2/0.1 g l-1 (NaNO3)에서 피. 츠쿠바엔시스 M15-CAD의 600 ml 생물반응기 배양. 30℃, pH = 5.5, pO2 = 55 %, 및 150 g l-1의 초기 글루코스 농도에서 8일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다.
도 53. ITA 생산 배지 MG-IA - N/P: 5/0.1 g l-1 (NaNO3)에서 피. 츠쿠바엔시스 M15-CAD의 600 ml 생물반응기 배양. 30℃, pH = 5.5, pO2 = 55 %, 및 150 g l-1의 초기 글루코스 농도에서 8일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다.
도 54. ITA 생산 배지 MG-IA - N/P: 4/1 g l-1 (NaNO3)에서 피. 츠쿠바엔시스 M15-CAD의 600 ml 생물반응기 배양. 30℃, pH = 5.5, pO2 = 55 % 및 150 g l-1의 초기 글루코스 농도에서 6일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다.
도 55. ITA 생산 배지 MG-IA - N/P: 2/0.1 g l-1 (NaNO3)에서 피. 츠쿠바엔시스 M15-CAD의 600 ml 생물반응기 배양. 30℃, pH = 7.0, pO2 = 55 % 및 150 g l-1의 초기 글루코스 농도에서 6일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다.
도 56. ITA 생산 배지 MG-IA - N/P: 2/0.1 g l-1 (NaNO3)에서 피. 츠쿠바엔시스 M15-CAD의 600 ml 생물반응기 배양. 30℃, pH = 5.5, pO2 = 90 % 및 150 g l-1의 초기 글루코스 농도에서 6일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다.
도 57. ITA 생산 배지 MG-IA - N/P: 2/0.1 g l-1 (NaNO3)에서 피. 츠쿠바엔시스 M15-CAD의 600 ml 생물반응기 배양. 30℃, pH 대략 5.5 (4 g l-1 CaCO3에 의해 조정됨), pO2 = 55 % 및 150 g l-1의 초기 글루코스 농도에서 6일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다.
도 58. ITA 생산 배지 MG-IA - N/P: 2/0.1 g l-1 (NaNO3)에서 피. 츠쿠바엔시스 HR12의 600 ml 생물반응기 배양. 30℃, pH = 5.5, pO2 = 55 % 및 150 g l-1의 초기 글루코스 농도에서 5일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다.
도 59. ITA 생산 배지 MG-IA - N/P: 4/1 g l-1 (NaNO3)에서 피. 츠쿠바엔시스 HR12의 600 ml 생물반응기 배양. 30℃, pH = 5.5, pO2 = 55 % 및 150 g l-1의 초기 글루코스 농도에서 5일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다.
도 60. ITA 생산 배지 MG-IA - N/P: 4/1 g l-1 (NaNO3)에서 피. 츠쿠바엔시스 HR12의 600 ml 생물반응기 배양. 30℃, pH = 5.5, pO2 = 55 % 및 150 g l-1의 초기 글루코스 농도에서 10일 동안 세포를 배양하였다. 5일째에 100 g l-1 글루코스를 공급하였다. 글루코스 소모를 24시간마다 모니터링하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다.
도 61. ITA 생산 배지 MG-IA - N/P: 4/1 g l-1 (NaNO3)에서 피. 츠쿠바엔시스 HR12의 600 ml 생물반응기 배양. 30℃, pH = 5.5, pO2 = 55 % 및 75 g l-1의 초기 글루코스 농도에서 10일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하고, 대략 75 g l-1로 재조정하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다.
도 62. ITA 생산 배지 MG-IA - N/P: 5.5/1 g l-1 (NaNO3)에서 피. 츠쿠바엔시스 HR12의 600 ml 생물반응기 배양. 30℃, pH = 5.5, pO2 = 55 % 및 75 g l-1의 초기 글루코스 농도에서 8일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하고, 대략 75 g l-1로 재조정하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다.
도 63. ITA 생산 배지 MG-IA - N/P: 8/1 g l-1 (NaNO3)에서 피. 츠쿠바엔시스 HR12의 600 ml 생물반응기 배양. 30℃, pH = 5.5, pO2 = 55 % 및 75 g l-1의 초기 글루코스 농도에서 7일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하고, 대략 75 g l-1로 재조정하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다.
도 64. ITA 생산 배지 MG-IA - N/P: 8/1 g l-1 (NaNO3) & 1.75 X 미네랄 염; 미량 원소; 티아민, FeCl3에서 피. 츠쿠바엔시스 HR12의 600 ml 생물반응기 배양. 30℃, pH = 5.5, pO2 = 55 % 및 75 g l-1의 초기 글루코스 농도에서 7일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하고, 대략 75 g l-1로 재조정하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다.
도 65. ITA 생산 배지 MG-IA - N/P: 4/1 g l-1 (NH4Cl)에서 피. 츠쿠바엔시스 HR12의 600 ml 생물반응기 배양. 30℃, pH = 5.5, pO2 = 55 % 및 75 g l-1의 초기 글루코스 농도에서 8일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하고, 대략 75 g l-1로 재조정하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다.
도 66. ITA 생산 배지 MG-IA - N/P: 4/1 g l-1 (NaNO3)에서 피. 츠쿠바엔시스 HR12의 600 ml 생물반응기 배양. 30℃, pH = 5.5 -> 4.0 (1일째) (검은색 화살표로 표시함), pO2 = 55 % 및 75 g l-1의 초기 글루코스 농도에서 8일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하고, 대략 75 g l-1로 재조정하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다.
도 67. ITA 생산 배지 MG-IA - N/P: 4/1 g l-1 (NaNO3)에서 피. 츠쿠바엔시스 HR12의 600 ml 생물반응기 배양. 30℃, pH = 5.5 -> 4.0 (1일째) (검은색 화살표로 표시함), pO2 = 55 % 및 75 g l-1의 초기 글루코스 농도에서 8일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하고, 대략 75 g l-1로 재조정하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다. 7일째에 1 g l-1 N-공급원을 공급하였다 (점선 화살표로 표시함).
도 68. ITA 생산 배지 MG-IA - N/P: 5/1 g l-1 (NaNO3)에서 피. 츠쿠바엔시스 HR12의 600 ml 생물반응기 배양. 30℃, pH = 5.5 -> 4.0 (1일째) -> 3.5 (2일째) (검은색 화살표로 표시함), pO2 = 55 % 및 75 g l-1의 초기 글루코스 농도에서 7일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하고, 대략 75 g l-1로 재조정하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다.
도 69. ITA 생산 배지 MG-IA - N/P: 5/1 g l-1 (NaNO3)에서 피. 츠쿠바엔시스 HR12의 600 ml 생물반응기 배양. 30℃, pH = 5.5 -> 4.0 (1일째) -> 3.5 (2일째) -> 3.0 (3일째) (검은색 화살표로 표시함), pO2 = 55 % 및 75 g l-1의 초기 글루코스 농도에서 7일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하고, 대략 75 g l-1로 재조정하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다.
도 70. 600 ml 생물반응기에서 ITA 생산 배지 MG-IA - N/P: 6/1 g l-1 (NaNO3)에서 피. 츠쿠바엔시스 HR12의 반연속식 배양. 30℃, pH = 5.5 -> 4.0 (1일째) (검은색 화살표로 표시함), pO2 = 55 % 및 75 g l-1의 초기 글루코스 농도에서 14일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하고, 대략 75 g l-1로 재조정하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다. 7일째에 배양물 브로쓰의 50 %를 신선한 배지로 교체하였다 (점선 화살표로 표시함).
도 71. 600 ml 생물반응기에서 ITA 생산 배지 MG-IA - N/P: 6/1 g l-1 (NaNO3)에서 피. 츠쿠바엔시스 HR12의 반연속식 배양. - 손실에 대해 조정함 - 30℃, pH = 5.5 -> 4.0 (1일째) (검은색 화살표로 표시함), pO2 = 55 % 및 75 g l-1의 초기 글루코스 농도에서 14일 동안 세포를 배양하였다. 글루코스 소모를 24시간마다 모니터링하고, 대략 75 g l-1로 재조정하였다. 동일한 간격으로 유기산 (ITA & MA)의 생산량 뿐만 아니라 건조 세포 중량 (DCW)을 측정하였다. 7일째에 배양물 브로쓰의 50 %를 신선한 배지로 교체하였다 (점선 화살표로 표시함).
도 72. RIA1 아미노산 서열의 다중 정렬. 최상단의 아미노산 서열의 철자만이 완전히 기재되고; 다른 모든 아미노산 서열의 경우에는 각각의 위치에서 상단 서열의 각각의 아미노산과 상이한 아미노산만이 주어지며, 점은 각각의 위치에서 상단 서열의 각각의 아미노산이 존재함을 나타낸다. 정렬된 단백질은 다음과 같다: "WO2015140314": WO2015140314A1의 서열식별번호: 16; 유니프롯(Uniprot) 항목 A0A0U2WFX7 / RIA1_USTMD; 유니프롯 항목 A0A0D1CU52 / A0A0D1CU52_USTMA; 유니프롯 항목 R9P2W9 / R9P2W9_PSEHS; "SEQ36": 서열식별번호: 36; "SEQ35": 서열식별번호: 35; "SEQ37": 서열식별번호: 37; "SEQ48": 서열식별번호: 48.

본 발명은 이후에 더욱 상세하게 기재된다. 상세한 설명에서는 기술적인 미생물학 분야에서 통상의 기술자에 의해 다루어진다. 상세한 설명은 이해하려는 마음으로 해석되어야 한다. 임의의 기술적 사실 또는 교시내용에 대한 임의의 다른 한정된 설명과 마찬가지로 본 발명의 설명이 어떠한 수단에 의해서도 총망라된 것이 아님을 이해해야 한다. 특히, 본 발명의 임의의 특별한 교시내용 또는 예시의 특색은 본 발명의 임의의 다른 교시내용의 임의적인 부분인 것으로 이해되어야 한다.

달리 정의되지 않는다면, (기술적 및 과학적 용어를 비롯하여) 본원에서 사용된 모든 용어들은 발효 분야에서 통상의 경험을 가진 생명공학자인 관련 기술분야의 통상의 기술자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다. 모든 용어들은 명세서 및 관련 분야의 맥락에서 그들의 의미와 일치하는 의미를 갖는 것으로 해석되어야 하고, 본원에서 달리 명확하게 정의되지 않는다면 이상화되거나 지나치게 형식적인 의미로 해석되어서는 안된다. 간결함 및/또는 명료함을 위해 널리 공지된 물질, 방법, 기능 또는 구축은 본원에서 상세하게 기재되지 않는다.

본원에서 사용된 바와 같이, 용어 "약"은 측정가능한 값, 예컨대 질량, 농도, 시간, 온도 등의 양과 관련하여 사용되는 경우 명시된 양의 0.1%, 0.25%, 0.5%, 0.75%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19% 또는 20%의 변동을 포함하는 것을 의미한다. 달리 나타내지 않는다면, 명세서에서 모든 수치 값은 용어 "약"에 의해 수식되는 것으로 이해되어야 한다.

본원에서 사용된 바와 같이, 용어 "및/또는"은 연관되어 나열된 항목들 중 하나 이상의 임의의 모든 조합, 뿐만 아니라 대안적으로 ("또는") 해석되는 경우 조합의 결여를 포함하는 것으로 의도된다.

본원에서 사용된 바와 같이, 용어 "포함하다" 및 그의 문법적 변형은 명시된 특색, 단계, 작업, 요소 및/또는 성분의 존재를 명시하지만, 하나 이상의 다른 특색, 단계, 작업, 요소, 성분 및/또는 이들의 그룹의 존재 또는 추가를 배제하지 않는다. 조성물 또는 방법에서 파라미터 범위의 정의와 관련하여, 이러한 용어는 각각의 조성물 또는 방법이 파라미터 값의 최대치 초과 및 파라미터 값의 최소치 미만을 포함하지 않는다는 것을 의미한다. 예를 들어, 발효에 유용한 배지인 경우 0.01-0.1 %(v/v)의 복합 배지 성분을 포함하는 발효 배지에서, 복합 배지 성분의 총 농도는 0.01 %(v/v) 이상 및 0.1 %(v/v) 이하이다. 본원에서 사용된 바와 같이, 용어 "포함하는"은 또한 용어 "로 이루어진"을 포함한다.

본원에서 사용된 바와 같이, 용어 "로 본질적으로 이루어진" (및 그의 문법적 변형)은 본 발명의 조성물 및 방법에 적용될 때, 추가의 성분이 조성물/방법을 실질적으로 변경시키지 않는 한, 조성물/방법이 추가의 성분을 함유할 수 있음을 의미한다. 용어 "실질적으로 변경시키다"는 조성물/방법에 적용될 때, 조성물/방법의 효율을 적어도 약 20% 이상 증가시키거나 감소시키는 것을 지칭한다. 예를 들어, 생산 숙주 미생물의 게놈에 통합된 또는 상기 게놈에서 불활성화된 발현 카세트가 미생물의 이타코네이트 생산율을 적어도 50% 증가시키거나 감소시키는 경우, 이는 미생물을 "실질적으로 변경시킨다".

본 발명에 따른 미생물의 "게놈"은, 비록 자율적으로 복제하더라도 미생물 종의 정의에서 구성적이지 않은 유리 바이러스 및 유리 플라스미드와 같은 별도의 분자를 제외하고, 복제하고 유전가능한 유전 물질 (전형적으로 및 바람직하게는 DNA)의 총체이다.

본원에서 사용된 바와 같이, 용어 "발현" 또는 "유전자 발현"은 유전자 산물, 바람직하게는 단백질 또는 기능적 RNA의 합성 과정을 지칭하며, 일반적으로 DNA 전사, 임의적으로 RNA 가공, 및 단백질 발현의 경우에는, RNA 번역의 단계를 이용한다. 용어 "발현 카세트" (및 그의 문법적 또는 어의적 변형)는 이 세그먼트의 발현을 위해 준비된 핵산 세그먼트 ("서열"로도 지칭됨)를 포함하는 핵산, 바람직하게는 DNA의 세그먼트를 지칭한다. 발현 카세트는 또한 숙주 세포에서 상기 핵산 세그먼트의 증강된 발현을 가능하게 하는 요소를 포함할 수 있다. 이들 요소에는 인핸서, 반응 요소, 종결자 서열, 폴리아데닐화 서열 등이 포함될 수 있다.

본 발명에 따라, "프로모터"는 숙주 세포에서 전사를 개시할 수 있는 연속적인 핵산 구획이다. 프로모터는 증식가능한 조건 하에 각각의 미생물에서 상응하는 유전자의 전사를 일으키는데 충분한 경우에 "기능적"이다. 적합한 프로모터는 유도성 또는 억제성 또는 구성적으로 활성일 수 있으며, 여기서 유도성 및 억제성 프로모터의 경우에는 전사 수준이 환경적 또는 화학적 조건에 따라 달라지고, 구성적 프로모터는 발효 동안에 대부분의 조건 하에 활성이다. 또한, 프로모터는 본래의 리보솜 결합 부위를 적절하게 선택된 상이한 리보솜 결합 부위로 대체함으로써 변경될 수 있다. 바람직한 프로모터는 다음과 같다:

가장 바람직하게는, 본 발명에 따른 강한 구성적으로 활성인 프로모터는 pACTIN 프로모터이고, 서열식별번호: 74에 따른 서열과 적어도 96%의 서열 동일성을 갖는다. 이 프로모터는 유리하게는 슈도지마에서 다양한 단백질의 특히 광범위한 발현을 가능하게 하고, 실시예에서 추가로 기재된다.

용어 "혼성화"는, 폴리뉴클레오티드가 낮은, 중간, 높은 또는 매우 높은 엄격도 조건 하에 표지된 핵산 프로브, 또는 그의 전장 상보성 가닥, 또는 이들의 하위 서열에 어닐링하는 ("혼성화하는") 것을 나타낸다. 혼성화가 일어나게 하기 위해, 핵산 분자는 일반적으로 열적으로 또는 화학적으로 변성되어, 이중 가닥을 2개의 단일 가닥으로 용융시키고/거나, 단일 표준 핵산으로부터 헤어핀 또는 다른 이차 구조를 제거한다. 이러한 혼성체의 형성 또는 용융은 다양한 파라미터, 예를 들어 온도에 따라 좌우된다. 온도의 증가는 용융을 우세하게 하는 반면에, 온도의 감소는 혼성화를 우세하게 한다. 그러나, 이러한 혼성체 형성 과정은 적용된 온도 변화를 선형 방식으로 따르지 않고: 혼성화 과정은 동적이고, 이미 형성된 뉴클레오티드 쌍은 또한 인접한 뉴클레오티드의 쌍 형성을 지원한다. 따라서, 양호한 근사에 의해, 혼성화는 예-또는-아니오 과정이고, 기본적으로 혼성화와 비혼성화 사이의 경계를 정의하는 온도가 있다. 이 온도는 용융 온도 (Tm)이다. Tm은 주어진 뉴클레오티드 서열의 모든 분자의 50%가 이중 가닥으로 혼성화하고 50%가 단일 가닥으로 존재하는 섭씨 온도이다.

용융 온도 (Tm)는 분석된 핵산 서열의 물리적 성질에 따라 좌우되고, 따라서 2개의 별개의 서열 사이의 관계를 나타낼 수 있다. 그러나, 용융 온도 (Tm)는 또한 서열과 직접적으로 관련이 없는 다양한 다른 파라미터에 의해 영향을 받으며, 혼성화 실험의 적용 조건이 고려되어야 한다. 예를 들어, 염 (예를 들어 1가 양이온)의 증가는 더 높은 Tm을 초래한다.

주어진 혼성화 조건에 대한 Tm은 물리적인 혼성화 실험을 수행함으로써 결정될 수 있지만, Tm은 또한 DNA 서열의 주어진 쌍에 대해 인 실리코로 추정될 수 있다. 이 실시양태에서, [Meinkoth and Wahl (Anal. Biochem., 138:267-284, 1984)]의 방정식은 50개 이상의 염기 길이를 갖는 스트레치에 대해 이용된다:

Tm = 81.5℃ + 16.6 (log M) + 0.41 (% GC) - 0.61 (% 포름) - 500/L

M은 1가 양이온의 몰농도이고, % GC는 DNA 스트레치에서 구아노신 및 시토신 뉴클레오티드의 백분율이고, % 포름은 혼성화 용액 중에서 포름아미드의 백분율이고, L은 염기 쌍에서 혼성체의 길이이다. 상기 방정식은 0.01 내지 0.4 M 범위의 염 및 30% 내지 75% 범위의 % GC에 대한 것이다.

Tm 초과는 완벽하게 매칭된 프로브에 대한 온도이지만, Tm은 1%의 미스매칭 마다 약 1℃만큼 감소된다 (Bonner et al., J. Mol. Biol. 81: 123-135, 1973):

Tm = [ 81.5℃ + 16.6(log M) + 0.41 (%GC) - 0.61 (%포름아미드) - 500/L ] - %비-동일성

이 방정식은 35개 이상의 뉴클레오티드를 갖는 프로브에 유용하고, 과학적 방법 문헌에서 (예를 들어: ["Recombinant DNA Principles and Methodologies", James Greene, Chapter "Biochemistry of Nucleic acids", Paul S. Miller, page 55; 1998, CRC Press]), 여러 특허 출원에서 (예를 들어: US 7026149), 및 또한 상업적 회사의 데이터 시트에서 (예를 들어 www.genomics.agilent.com으로부터의 "Equations for Calculating Tm") 널리 참고된다.

용어 "낮은 엄격도 조건"은 적어도 100개 뉴클레오티드 길이인 프로브에 대해, 5X SSPE, 0.3% SDS, 200 마이크로그램/ml 전단된 및 변성된 연어 정자 DNA, 및 25% 포름아미드 중에서 42℃에서 사전 혼성화 및 혼성화, 이후에 12 내지 24시간 동안 표준 서던 블롯팅 절차를 의미한다. 최종적으로 담체 물질을 50℃에서 매회 15분 동안 0.2X SSC, 0.2% SDS를 사용하여 3회 세척한다.

용어 "중간 엄격도 조건"은 적어도 100개 뉴클레오티드 길이인 프로브에 대해, 5X SSPE, 0.3% SDS, 200 마이크로그램/ml 전단된 및 변성된 연어 정자 DNA, 및 35% 포름아미드 중에서 42℃에서 사전 혼성화 및 혼성화, 이후에 12 내지 24시간 동안 표준 서던 블롯팅 절차를 의미한다. 최종적으로 담체 물질을 55℃에서 매회 15분 동안 0.2X SSC, 0.2% SDS를 사용하여 3회 세척한다.

용어 "중간-높은 엄격도 조건"은 적어도 100개 뉴클레오티드 길이인 프로브에 대해, 5X SSPE, 0.3% SDS, 200 마이크로그램/ml 전단된 및 변성된 연어 정자 DNA, 및 35% 포름아미드 중에서 42℃에서 사전 혼성화 및 혼성화, 이후에 12 내지 24시간 동안 표준 서던 블롯팅 절차를 의미한다. 최종적으로 담체 물질을 60℃에서 매회 15분 동안 0.2X SSC, 0.2% SDS를 사용하여 3회 세척한다.

용어 "높은 엄격도 조건"은 적어도 100개 뉴클레오티드 길이인 프로브에 대해, 5X SSPE, 0.3% SDS, 200 마이크로그램/ml 전단된 및 변성된 연어 정자 DNA, 및 50% 포름아미드 중에서 42℃에서 사전 혼성화 및 혼성화, 이후에 12 내지 24시간 동안 표준 서던 블롯팅 절차를 의미한다. 최종적으로 담체 물질을 65℃에서 매회 15분 동안 0.2X SSC, 0.2% SDS를 사용하여 3회 세척한다.

용어 "매우 높은 엄격도 조건"은 적어도 100개 뉴클레오티드 길이인 프로브에 대해, 5X SSPE, 0.3% SDS, 200 마이크로그램/ml 전단된 및 변성된 연어 정자 DNA, 및 50% 포름아미드 중에서 42℃에서 사전 혼성화 및 혼성화, 이후에 12 내지 24시간 동안 표준 서던 블롯팅 절차를 의미한다. 최종적으로 담체 물질을 70℃에서 매회 15분 동안 0.2X SSC, 0.2% SDS를 사용하여 3회 세척한다.

용어 "서열 동일성"은 각각 2개의 아미노산 서열 또는 2개의 핵산 서열 사이에서 최대 허용 편차에 대한 수치적 지표를 나타내며, 여기서 1개의 서열 ("벤치마크 서열"로도 지칭됨)은 공지된 것이고, 다른 서열은 벤치마크 서열과 비교되어야 하는 것이다. 편차는 먼저 비교될 2개의 서열을 정렬시킨 다음, 각각 동일한 아미노산 또는 뉴클레오티드의 개수를 카운팅하고, 정렬에 따라 이 서열에서의 모든 갭을 포함하는 벤치마크 서열의 총 길이로 나눔으로써 결정된다. 정렬은 하기 파라미터에 의해 니들만-운쉬-알고리즘(Needleman-Wunsch-algorithm)을 이용하여 수행된다 (Needleman, Saul B. & Wunsch, Christian D. (1970): "A general method applicable to the search for similarities in the amino acid sequence of two proteins"; Journal of Molecular Biology. 48 (3): 443-453):

- 아미노산 정렬의 경우: 10의 갭 오픈 패널티, 0.5의 갭 확장 패널티, EBLOSUM62 (BLOSUM62의 EMBOSS 버전) 치환 매트릭스

- 핵산 정렬의 경우: 10의 갭 오픈 패널티, 0.5의 갭 확장 패널티, EDNAFULL (NCBI NUC4.4의 EMBOSS 버전) 치환 매트릭스

예를 들어, 벤치마크 서열 GATCTGA (7개 뉴클레오티드)에 대한 시험 서열 AAGATACTG (9개 뉴클레오티드)의 정렬은 다음과 같을 것이다:

따라서, 6개의 동일한 위치 ("GAT" 및 "CTG")가 있고, 벤치마크 서열 길이는 정렬로 인해 1개 위치만큼 증가되고, 이에 따라 서열 동일성은 6 / (7 + 1) * 100 = 75%이다.

아미노산이 본 발명에 따른 서열에서 변화될 수 있는 경우, 이러한 변화는 바람직하게는 보존적 돌연변이이다. 아미노산에 대한 표준 한 글자 암호를 이용하여, 아미노산 A는 아미노산 S로 보존적으로 대체가능하고; 아미노산 D는 아미노산 E, N으로 보존적으로 교환가능하고; 아미노산 E는 아미노산 D, K, Q로 보존적으로 교환가능하고; 아미노산 F는 아미노산 W, Y로 보존적으로 교환가능하고; 아미노산 H는 아미노산 N, Y로 보존적으로 교환가능하고; 아미노산 I는 아미노산 L, M, V로 보존적으로 교환가능하고; 아미노산 K는 아미노산 E, Q, R로 보존적으로 교환가능하고; 아미노산 L은 아미노산 I, M, V로 보존적으로 교환가능하고; 아미노산 M은 아미노산 I, L, V로 보존적으로 교환가능하고; 아미노산 N은 아미노산 D, H, S로 보존적으로 교환가능하고; 아미노산 Q는 아미노산 E, K, R로 보존적으로 교환가능하고; 아미노산 R은 아미노산 K, Q로 보존적으로 교환가능하고; 아미노산 S는 아미노산 A, N, T로 보존적으로 교환가능하고; 아미노산 T는 아미노산 S로 보존적으로 교환가능하고; 아미노산 V는 아미노산 I, L, M으로 보존적으로 교환가능하고; 아미노산 W는 아미노산 F, Y로 보존적으로 교환가능하고; 아미노산 Y는 아미노산 F, H, W로 보존적으로 대체가능하다. 특히 바람직한 대체는 아미노산에 대한 표준 세 글자 암호를 이용하여 Ala<->Glu, Ala<->Gly, Ala<->Pro, Ala<->Ser, Ala<->Thr, Ala<->Val, Arg<->Lys, Asn<->Ser, Asp<->Asn, Asp<->Glu, Asp<->Gly, Gly<->Ser, Leu<->lle, Leu<->Val, Phe<->Tyr, Ser<->Thr 및 Val<->lle이다.

용어 "야생형" 미생물은 미생물의 비교를 위해 본원에서 사용되며, 구체적인 비교를 위해 문제의 특색이 없는 미생물을 지칭한다. 전형적으로, 이러한 미생물은 문제의 미생물이 유래되었거나 또는 유래될 수 있는 조상 균주이다. 예를 들어, "상응하는 야생형 미생물에서 N개 뉴클레오티드에 의해 분리된 유전자 A와 B 사이에 삽입물을 포함하는 생산 숙주 미생물"과 같은 표현은 다음과 같이 해석되어야 한다: "야생형 미생물"은 야생형 미생물의 관련 핵산 (전형적으로 그의 염색 성질과 관계없이 "염색체"로 지칭됨)에서 유전자 A와 B를 연결하는 서열을 제외하고는 생산 숙주 미생물과 동일한 미생물이며, 이에 따라 유전자 A가 유전자 B의 5' 위치에 있는 경우에, 상기 야생형 미생물에서 유전자 A의 3' 경계 (즉, 정지 코돈) 및 유전자 B의 5' 경계 (즉, 개시 코돈)는 N개 뉴클레오티드에 의해 분리되어 있다.

유니프롯 항목은 2018-03-01 자정 CET 현재의 각각의 서열을 기준으로 한다.

본 발명의 특정한 측면이 그의 실시양태를 참고하여 이후에 기재될 것이지만, 청구항에 의해 정의되는 본 개시내용의 개념 및 범위를 벗어나지 않고 형태 및 상세한 내용에서 다양한 변화가 그 안에서 이루어질 수 있음을 이해한다.

본 발명은 이타콘산 및/또는 그의 염의 생산에 관한 것이다. 본 명세서에서 이타콘산이 언급되는 경우에는 언제나, 이러한 언급이 기술적으로 모두 합리적이라면 이타코네이트에도 (반대의 경우에도) 적용된다.

본 발명은 이타콘산 생산 숙주 미생물을 제공한다. 본 발명의 목적을 위해, 생산 숙주 미생물은 바람직하게는 바시디오마이코타(Basidiomycota) 문에 속한다. 상기 기재된 바와 같이, 이 미생물 문은 과거에 수많은 시도에도 불구하고 이타콘산의 생산을 위해 산업적으로 사용된 적이 없다. 본 발명은 상기 언급된 선행 기술에서의 믿음과는 대조적으로 이타콘산의 생산에 수반되는 모든 유전자를 과다발현하는 것이 충분하지 않고/거나 필요하지 않다는 발견에 기초한다. 대신에, 본 발명은 RIA1 유전자의 발현을 위한 발현 카세트의 게놈으로의 안정한 통합을 특징으로 하는 변형된 미생물을 제공하고/거나, 이타콘산 생산을 위해 불활성화되어야 하는 바시디오마이코타 문의 미생물에 일반적으로 존재하는 유전자를 제안한다. 바람직하게는, 이러한 불활성화는 RIA1 유전자의 발현을 위한 발현 카세트의 통합에 의해 수행된다. 이에 따라, 본 발명은 원치않는 부산물, 특히 말레이트의 높은 생산율을 동시에 허용할 필요없이 이타콘산의 높은 생산율을 달성하는 분류학상 분지의 미생물의 발효에 이용가능하다.

본 발명에 따라, 이타콘산 생산 숙주 미생물은 대안적으로 "생산 숙주", "숙주 미생물", "생산 미생물" 등으로 명명된다. 용어 "생산 숙주 미생물" 및 그의 상응하는 용어상의 변형은 예를 들어 복제 동안에 발생하는 돌연변이로 인해 또는 예를 들어 추가의 형질전환으로 인해 모 세포와 동일하지 않은 모 세포의 임의의 자손을 포함한다.

본 발명에 따른 생산 숙주 미생물은 이타콘산의 생산을 위한 활성 대사 경로를 포함한다. 본 발명에 따른 숙주 미생물은 자연적으로, 즉, 심지어 기능성 프로모터의 제어 하의 RIA1 유전자를 포함하는 적어도 1개의 발현 카세트가 미생물의 게놈에 통합되기 전에도, 이러한 활성 이타콘산 경로를 포함할 수 있다. 그러나, 본 발명은 또한 하기에 기재되는 바와 같이 활성 이타콘산 경로를 자연적으로 포함하지 않는 이러한 미생물을 기반으로 하여 이타콘산 생산 숙주 미생물을 수득하는 방법을 제공한다.

본 발명의 측면에 따라, 생산 숙주 미생물은 발현 카세트를 포함한다. 발현 카세트는 기능성 프로모터의 작동가능한 제어 하의 RIA1 유전자를 포함한다.

바람직하게는, 발현 카세트에서 RIA1 유전자는 RIA1 유전자에 작동가능하게 연결된 프로모터의 관점에서 이종성이다. 본 발명의 목적을 위해 이종성 서열은 (a) 비-숙주 서열, (b) 1개 이상의 염기 또는 아미노산 (적용가능한 경우)의 (ba) 삽입, (bb) 대체 및/또는 (bc) 결실에 의해 변경된 서열, (c) 상이한 숙주 세포 균주로부터의 서열, 또는 (d) 숙주 세포의 상이한 게놈 위치로부터의 상동성 서열 중 임의의 것이고; 예를 들어, 핵산 서열의 인공적인 복제물은 본원에서 이종성으로 고려된다. "상동성" 서열은 동일한 유전적 공급원 또는 종에서 발견되는 서열이며, 즉, 이는 숙주 세포의 관련 종에서 천연 발생하고, 동일한 또는 유사한 기능을 수행한다. 따라서, 바람직하게는 본 발명에 따른 발현 카세트에서 RIA1 유전자는, 야생형 생산 숙주 미생물이 발현된 RIA1 유전자를 천연적으로 포함하는 경우에, 상기 야생형 생산 숙주 미생물에서의 RIA1 유전자에 작동가능하게 연결된 임의의 프로모터와는 상이한 프로모터에 작동가능하게 연결된다. 이러한 방식으로 본 발명은 이타콘산 발효 과정의 필요에 따라 RIA1 유전자의 발현에 선택적으로 영향을 미칠 수 있다. 이후의 기재는 이러한 특히 바람직한 발현 카세트의 예시 및 설명을 제공한다.

RIA1 유전자는 바람직하게는 생산 숙주 미생물의 관점에서 이종성이다. 바람직하게는, RIA1 유전자 서열은 별도의 유전적 공급원 또는 종으로부터 유래된다.

발현 카세트는 ip 로커스의 외부에서 통합된다. 문헌 WO 2015/140314 A1은 RIA1의 과다발현이 이타콘산 생산을 증가시킨다고 개시하고 있지만, 생산율이 본 발명에 따른 것보다 낮게 유지되었다. WO 2015/140314 A1에 따라 통합 부위로서 사용된 ip 로커스는 [Loubradou et al., "A homologue of the transcriptional repressor Ssn6p antagonizes cAMP signalling in Ustilago maydis", Molecular microbiology. 2001, 719-30]에 추가로 기재되어 있다. 이 통합 부위를 피함으로써, 본 발명에 따라 기술적으로 실현가능한 이타콘산 생산율이 수득된다. 의심의 여지를 없애기 위해, 통합은 적어도 (a) 통합된 핵산이 예를 들어 상동성 재조합에 의해 발생할 때 ip 로커스의 (가능하게는 말단절단된 또는 다소 돌연변이된) 복제물에 의해 양측에서 플랭킹되는 경우에, 또는 (b) 미생물이 상응하는 야생형 균주에서 ip 로커스를 포함하거나 중첩하는 위치에서 통합된 핵산을 함유하는 경우에, ip 로커스의 외부가 아니라 그에서 또는 그 안에서 일어난 것으로 고려되며; 이는 예를 들어 대체 통합에 의해 발생한다. 바시디오마이세테스(basidiomycetes) 및 프라이머에서 ip 로커스를 확인하는 방법, 이렇게 확인된 ip 로커스에 구축물을 부위-특이적으로 통합시키기 위한 벡터 및 방법은 [Zambanini et al., Metabolic Engineering Communications 2017, 12-21], 특히 14-16 페이지에 기재되어 있다.

본 발명에 따라, ip 로커스는 숙시네이트 데히드로게나제의 철-황 단백질 서브유닛을 코딩하는 유전자의 발현을 담당하는 영역이다. 이러한 유전자 서열은 [Broomfield and Hargreaves, Current Genetics 1992, 117-121] 및 특히 상기 공보의 도 2에서 우스틸라고 마이디스(Ustilago maydis)에 대해 기재되어 있다. ip 로커스에 대한 추가의 설명에 대한 상기 공보 및 특히 상기 도 2는 본원에 참고로 포함된다. 본 발명이 ip 로커스 및 그에 따라 숙시네이트 데히드로게나제의 상응하는 철-황 단백질 서브유닛의 기능과는 관련이 없다는 것을 주목하는 것이 중요하며; 본 발명자들은 이타콘산의 생산이 본원에 기재된 적어도 1개의 발현 카세트를 각각의 미생물의 ip 로커스 외부에서 통합시킴으로써 개선된다는 것을 발견하였다. 바람직하게는, 미생물의 ip 로커스는 본원에 기재된 발현 카세트를 함유하지 않고, 보다 더 바람직하게는 ip 로커스는 이종성 유전자 서열을 함유하지 않는다.

바람직하게는, ip 로커스는 숙시네이트 데히드로게나제의 철-황 단백질 서브유닛을 코딩하는 미생물의 유전가능한 유전 물질의 로커스이다. 추정 폴리펩티드가 숙시네이트 데히드로게나제의 철-황 단백질 서브유닛의 기능을 전달하는지 여부는 예를 들어 재구성에 의해, 즉, 하기 단계를 포함하는 방법에 의해 시험될 수 있다:

1. 시험 미생물에서 숙시네이트 데히드로게나제의 철-황 단백질 서브유닛을 코딩하는 모든 유전자를 불활성화시켜, 시험 유기체의 표현형을 카르복신 내성에서 카르복신 민감성으로 변화시킴; 이에 대한 설명은 상기 공보 [Broomfield and Hargreaves]에서 확인됨;

2. 시험 미생물에서 추정 폴리펩티드를 발현함;

3. 단계 2에서 수득한 시험 유기체에서 카르복신 내성을 측정함; 카르복신 내성이 재구성된 경우에는, 그럴듯한 다른 설명이 없이도 추정 폴리펩티드가 숙시네이트 데히드로게나제의 철-황 단백질 서브유닛의 기능을 전달할 가능성이 가장 높다.

따라서, 좁은 의미에서 본 발명에 따른 ip 로커스는 그의 변형이 카르복신 민감성을 유도하는 로커스이며, 여기서 숙시네이트 데히드로게나제의 철-황 단백질 서브유닛의 발현은 카르복신 내성의 재구성을 유도한다. 바람직하게는, ip 로커스는 P32420 (SDHB_USTMA), R9NZ36 (R9NZ36_PSEHS), M9MBS9 (M9MBS9_PSEA3), I2G708 (I2G708_USTH4) 및 V5F1L5 (V5F1L5_KALBG)로 이루어진 군으로부터 선택된 유니프롯 항목에 따라 아미노산 서열과 적어도 약 10% 서열 동일성을 갖는, 보다 더 바람직하게는 P32420 (SDHB_USTMA), R9NZ36 (R9NZ36_PSEHS), M9MBS9 (M9MBS9_PSEA3), I2G708 (I2G708_USTH4) 및 V5F1L5 (V5F1L5_KALBG)로 이루어진 군으로부터 선택된 유니프롯 항목에 따른 아미노산 서열과 적어도 20%, 또는 보다 더 바람직하게는 적어도 30%, 또는 보다 더 바람직하게는 적어도 40%, 또는 보다 더 바람직하게는 적어도 50%, 또는 보다 더 바람직하게는 적어도 60%, 또는 보다 더 바람직하게는 적어도 70%, 또는 보다 더 바람직하게는 적어도 80%, 또는 보다 더 바람직하게는 적어도 90%, 또는 보다 더 바람직하게는 적어도 94%, 또는 보다 더 바람직하게는 적어도 98% 서열 동일성을 갖는 폴리펩티드를 코딩하는 유전자이다. 미생물이 우스틸라고 속인 경우, 아미노산 서열 동일성은 바람직하게는 유니프롯 항목 P32420 (SDHB_USTMA)에 대해 비교함으로써 결정되고; 미생물이 칼마노지마(Kalmanozyma) 속인 경우, 아미노산 서열 동일성은 바람직하게는 유니프롯 항목 V5F1L5 (V5F1L5_KALBG)에 대해 비교함으로써 결정되고; 미생물이 슈도지마 속인 경우, 아미노산 서열 동일성은 바람직하게는 서열식별번호: 48에 대해 비교함으로써 결정된다. 보다 더 바람직하게는, ip 로커스는 서열식별번호: 48에 따른 아미노산 서열과 적어도 10% 서열 동일성을 갖는, 보다 더 바람직하게는 서열식별번호: 48에 다른 아미노산 서열과 적어도 20%, 또는 보다 더 바람직하게는 적어도 30%, 또는 보다 더 바람직하게는 적어도 40%, 또는 보다 더 바람직하게는 적어도 50%, 또는 보다 더 바람직하게는 적어도 60%, 또는 보다 더 바람직하게는 적어도 70%, 또는 보다 더 바람직하게는 적어도 80%, 또는 보다 더 바람직하게는 적어도 90%, 또는 보다 더 바람직하게는 적어도 94%, 또는 보다 더 바람직하게는 적어도 98% 서열 동일성을 갖는 폴리펩티드를 코딩하는 유전자이다.

따라서, 더욱 바람직한 더욱 넓은 의미에서 본 발명에 따른 ip 로커스는 숙시네이트 데히드로게나제의 철-황 단백질 서브유닛을 코딩하는 유전자를 포함하고, 서열식별번호: 50 (숙시네이트 데히드로게나제의 철-황 서브유닛을 코딩하는 유. 마이디스인 EMBL 항목 Z11738.1의 코딩 영역임)과 적어도 75%, 보다 더 바람직하게는 적어도 50% 서열 동일성을 갖는 핵산 서열로 이루어지는 ip 로커스이다. 특히, 미생물이 슈도지마 속인 경우에는, ip 로커스가 바람직하게는 서열식별번호: 51 (서열식별번호: 50에 따른 서열에 대한 슈도지마 츠쿠바엔시스의 등가물임)과 적어도 75%, 보다 더 바람직하게는 적어도 50% 서열 동일성을 갖는 핵산 서열로 이루어진다.

보다 더 바람직하게는, 본 발명에 따라 적어도 1개의 및 가장 바람직하게는 모든 발현 카세트는, 숙시네이트 데히드로게나제의 철-황 단백질 서브유닛을 코딩하는 유전자를 포함하고, 서열식별번호: 52 (EMBL 항목 Z11738.1의 서열임)와 적어도 75%, 보다 더 바람직하게는 적어도 50% 서열 동일성을 갖는 핵산 서열로 이루어지는 ip 로커스의 외부에서 통합된다. 특히, 미생물이 슈도지마 속인 경우, 바람직하게는 본 발명에 따라 적어도 1개의 및 가장 바람직하게는 모든 발현 카세트가, 숙시네이트 데히드로게나제의 철-황 단백질 서브유닛을 코딩하는 유전자를 포함하고, 서열식별번호: 53과 적어도 75%, 보다 더 바람직하게는 적어도 50% 서열 동일성을 갖는 핵산 서열로 이루어진 ip 로커스의 외부에서 통합된다.

본 발명에 따라 적어도 1개의 및 바람직하게는 모든 발현 카세트가 제1 경계 영역 및 제2 경계 영역에 의해 정의되는 서열 영역의 외부에서 통합될 때 특히 바람직하며, 여기서 제1 경계 영역은 서열식별번호: 54와 적어도 50% 서열 동일성을 갖는 핵산으로 이루어지고, 제2 경계 영역은 서열식별번호: 55와 적어도 50% 서열 동일성을 갖는 핵산 서열로 이루어진다. 제1 및 제2 경계 영역은 바람직하게는 야생형 미생물에서 적어도 약 800 내지 5000개 뉴클레오티드, 더욱 바람직하게는 880 내지 약 2000개 뉴클레오티드 및 가장 바람직하게는 적어도 1100 내지 2000개 뉴클레오티드에 의해 떨어져 있다. 서열 서열식별번호: 54 및 55는 슈도지마 츠쿠바엔시스의 서열식별번호: 53에 따른 서열에 인접한 좌측 및 우측 경계 서열이다. 가장 바람직하게는, 본 발명에 따른 모든 발현 카세트는 서열식별번호: 56에 따른 서열과 적어도 50% 서열 동일성을 갖는 핵산 서열의 외부에서 통합된다.

본 발명에 따라 (a) RIA1 유전자의 발현을 위한 및/또는 (b) ADI1, MTT1 및 TAD1로 이루어진 군으로부터 선택된 적어도 2개의 유전자의 발현을 위한 발현 카세트를 포함하는 재조합 이타콘산 생산 숙주 미생물이 제공된다. 본 발명에 따른 숙주 미생물과 같이 활성 이타콘산 대사 경로를 갖는 미생물은 (적어도 이타콘산 생산 조건 하에) 일반적으로 MTT1 미토콘드리아 트리카르복실레이트 수송인자 유전자, ADI1 아코니테이트 델타-이소머라제 유전자, TAD1 트랜스-아코니테이트 데카르복실라제 유전자 및 ITP1 이타코네이트 수송 단백질 유전자를 발현할 것이다. 바람직하게는 본 발명의 미생물은 (적어도 이타콘산 생산 조건 하에) RIA1 전사 조절인자 유전자를 또한 발현할 것이다. 본원에 기재된 바와 같이, 본 발명에 따른 RIA1 유전자 산물은 ADI1 유전자, MTT1 유전자, TAD1 유전자 및/또는 ITP1 유전자의 발현을 증가시키고, 이에 따라 유리하게는 낮은 말레이트 생산과 함께 높은 이타콘산 생산율이 유도된다. 임의적으로, 미생물은 (적어도 이타콘산 생산 조건 하에) 예를 들어 아스퍼길루스 테레우스로부터인 것으로 공지된 CAD1 시스-아코니테이트 데카르복실라제 유전자를 발현할 수 있으며, 여기서 이러한 CAD1 발현은 ADI1 및/또는 TAD1의 발현과 동시에 발생할 수 있거나 또는 그를 대신할 수 있다.

본 발명에 따른 미생물의 종이 이미 활성 이타콘산 경로를 포함하는 경우에는, 본원에 기재된 위치에서 미생물의 게놈에 통합된 RIA1 유전자의 발현을 위한 1개 이상의 발현 카세트만을 갖는 것이 가능하지만 반드시 바람직한 것은 아니다. 그러나, 미생물은 RIA1 유전자, 및 ADI1, ITP1, MTT1 및 TAD1 유전자 중 1개 이상을 위한 이종성 발현 카세트를 포함할 수 있다. 특히, 야생형 바시디오마이세테스가 이종성 RIA1 유전자 발현 카세트의 발현에 의해 발현이 유도되지 않는 ADI1, ITP1, MTT1 및/또는 TAD1 유전자를 포함하는 경우에는, 바람직하게는 본원에 기재된 부위에서 미생물의 게놈으로부터 유래된 각각의 ADI1, ITP1, MTT1 및/또는 TAD1 유전자의 발현 카세트를 미생물의 게놈에 안정하게 통합시키는 방식으로 도입하는 것이 바람직하며, 이러한 유전자는 RIA1 유전자에 의해 유도될 수 있다. 이러한 방식으로 이종성 RIA1 발현 카세트 (바람직하게는 기능성 프로모터의 제어 하의 이종성 RIA1 유전자를 포함함)의 효과가 유리하게 달성되고, 이는 유리한 이타콘산 생산율 및/또는 무시할만한 말레이트 부산물을 용이하게 한다.

발현 카세트는

여기서 우측 경계 유전자는 서열식별번호: 25와 적어도 21% 동일성을 갖는 아미노산 서열로 이루어진 단백질을 코딩하고/거나,

b) 서열식별번호: 3, 서열식별번호: 5, 서열식별번호: 7, 서열식별번호: 9, 서열식별번호: 11, 서열식별번호: 13, 서열식별번호: 15, 서열식별번호: 17, 서열식별번호: 19, 서열식별번호: 21, 서열식별번호: 23, 서열식별번호: 25 중 임의의 것과 적어도 30% 서열 동일성을 갖는 아미노산 서열로 번역되는 오픈 리딩 프레임의 가장 가까운 경계의 6500개 이하의 뉴클레오티드에 위치하고/거나,

c) 서열식별번호: 3, 서열식별번호: 5, 서열식별번호: 7, 서열식별번호: 9, 서열식별번호: 11, 서열식별번호: 13, 서열식별번호: 15, 서열식별번호: 17, 서열식별번호: 19, 서열식별번호: 21, 서열식별번호: 23, 서열식별번호: 25 또는 그의 엑손 중 임의의 것과 적어도 30% 서열 동일성을 갖는 아미노산 서열로 번역되는 오픈 리딩 프레임 내에 위치하거나 또는 그를 대체하는

통합 부위에서 미생물의 게놈에 통합된다.

실시예에 제시된 바와 같이, 본 발명은 ip 로커스의 외부에 있는 통합 부위를 확인하고, 이는 발현 카세트의 안정한 통합을 가능하게 하고, 부산물로서 말레이트의 실질적인 형성을 허용하지 않고 높은 이타콘산 생산율을 가능하게 한다.

본 발명을 설명하는 한 방식에 따라, 통합 부위는 아세틸-CoA 신테타제를 갖는 단백질을 코딩하는 좌측 경계 유전자와 서열식별번호: 25와 적어도 21% 동일성을 갖는 아미노산 서열로 이루어진 단백질을 코딩하는 오픈 리딩 프레임인 우측 경계 유전자 사이에 위치한다. 원형 게놈의 경우, 용어 "사이"는 야생형 게놈에서 좌측 및 우측 경계 유전자를 연결하는 더 짧은, 즉, 1개 이상의 발현 카세트의 통합이 없는 핵산 세그먼트를 지칭하는 것으로 이해해야 한다. 야생형 바시디오마이세테스에서, 좌측 및 우측 경계 유전자는 전형적으로 최대 51600개 뉴클레오티드, 바람직하게는 적어도 25800개 및 최대 51600개 뉴클레오티드, 보다 더 바람직하게는 적어도 28000개 및 최대 42200개 뉴클레오티드, 및 보다 더 바람직하게는 적어도 35000개 및 최대 42100개 뉴클레오티드에 의해 분리되어 있다.

본 발명을 설명하는 또 다른 방식에 따라, 통합 부위는 서열식별번호: 3, 서열식별번호: 5, 서열식별번호: 7, 서열식별번호: 9, 서열식별번호: 11, 서열식별번호: 13, 서열식별번호: 15, 서열식별번호: 17, 서열식별번호: 19, 서열식별번호: 21, 서열식별번호: 23, 서열식별번호: 25 또는 이들 임의의 서열의 엑손 중 임의의 것과 적어도 30% 서열 동일성을 갖는 아미노산 서열로 번역되는 오픈 리딩 프레임의 가장 가까운 경계의 6500개 이하의 뉴클레오티드에 위치한다. 실시예에 제시된 바와 같이, 이들 오픈 리딩 프레임은 본 발명에 따른 발현 카세트의 삽입에 적합한 위치에서 발견될 수 있다. 상기 언급된 서열은 임의의 생물학적 기능과는 무관하게 본 발명에 따른 삽입 부위의 위치를 설명하기 위해서만 제공되는 것으로 이해한다. 예를 들어 슈도지마 츠쿠바엔시스의 게놈에서 상기 언급된 서열이 상기 제공된 순서로 발생한다는 것을 주목한다. 이는 다른 바시디오마이세테스에서 상응하는 서열을 확인하는 것을 가능하게 한다.

바람직하게는, 통합 부위는 서열식별번호: 4, 서열식별번호: 6, 서열식별번호: 8, 서열식별번호: 10, 서열식별번호: 12, 서열식별번호: 14, 서열식별번호: 16, 서열식별번호: 18, 서열식별번호: 20, 서열식별번호: 22, 서열식별번호: 24, 서열식별번호: 26 중 임의의 것과 적어도 30% 서열 동일성을 갖는 임의의 핵산 서열의 가장 가까운 경계의 6500개 이하의 뉴클레오티드에 위치한다. 이들 핵산 서열은 특히 바람직한 야생형의 생산 숙주 미생물 슈도지마 츠쿠바엔시스에서 특히 바람직한 통합 부위에서 발견되었고; 이들은 각각의 아미노산 서열 서열식별번호: 3, 서열식별번호: 5, 서열식별번호: 7, 서열식별번호: 9, 서열식별번호: 11, 서열식별번호: 13, 서열식별번호: 15, 서열식별번호: 17, 서열식별번호: 19, 서열식별번호: 21, 서열식별번호: 23, 서열식별번호: 25에 상응한다. 따라서, 통합 부위는 서열식별번호: 4, 서열식별번호: 6, 서열식별번호: 8, 서열식별번호: 10, 서열식별번호: 12, 서열식별번호: 14, 서열식별번호: 16, 서열식별번호: 18, 서열식별번호: 20, 서열식별번호: 22, 서열식별번호: 24, 서열식별번호: 26 중 임의의 것과 적어도 30% 서열 동일성을 갖는 임의의 핵산 표적 서열의 가장 가까운 경계의 바람직하게는 6500개 이하의 뉴클레오티드, 바람직하게는 5500개 이하의 뉴클레오티드, 보다 더 바람직하게는 2800개 이하의 뉴클레오티드에 위치하며, 여기서 각각의 표적 서열은 적어도 가설적으로 각각 서열식별번호: 3, 서열식별번호: 5, 서열식별번호: 7, 서열식별번호: 9, 서열식별번호: 11, 서열식별번호: 13, 서열식별번호: 15, 서열식별번호: 17, 서열식별번호: 19, 서열식별번호: 21, 서열식별번호: 23 또는 서열식별번호: 25와 적어도 30% 동일성을 갖는 아미노산으로 번역된다.

보다 더 바람직하게는, 통합 부위는 서열식별번호: 19, 서열식별번호: 15 및/또는 서열식별번호: 29 중 임의의 것과 적어도 30% 서열 동일성을 갖는 아미노산 서열로 번역되는 오픈 리딩 프레임의 가장 가까운 경계의 6500개 이하의 뉴클레오티드, 바람직하게는 5500개 이하의 뉴클레오티드, 보다 더 바람직하게는 2800개 이하의 뉴클레오티드에 위치한다. 이들 아미노산 서열은 본 발명에 따라 크렙스 주기에 영향을 미치는 것과 연관된 대사 기능을 발휘하는 것으로 예상된다. 본 발명에 따른 1개 이상의 발현 카세트를 통합시킴으로써, 각각의 표적 폴리펩티드는 크렙스 주기에 의한 그들의 영향이 제거되도록 불활성화되거나 또는 하향조절된다.

본 발명을 설명하는 또 다른 방식에 따라, 발현 카세트는 서열식별번호: 3, 서열식별번호: 5, 서열식별번호: 7, 서열식별번호: 9, 서열식별번호: 11, 서열식별번호: 13, 서열식별번호: 15, 서열식별번호: 17, 서열식별번호: 19, 서열식별번호: 21, 서열식별번호: 23, 서열식별번호: 25 중 임의의 것과 적어도 30% 서열 동일성을 갖는 아미노산 서열로 번역되는 오픈 리딩 프레임 내에 통합되거나 또는 그를 대체한다. 상기 나타낸 아미노산 서열은 상기 기재된 대안 b)에 따른 뉴클레오티드 서열로부터 유래된다. 다시, 상기 언급된 서열은 임의의 생물학적 기능과는 무관하게 본 발명에 따른 삽입 부위의 위치를 설명하기 위해서만 주어지는 것으로 이해하며; 상응하는 야생형 미생물이 상기 언급된 임의의 서열을 갖는 폴리펩티드를 생산할 필요조차도 없다. 바람직하게는 상응하는 야생형 미생물에서 각각의 오픈 리딩 프레임은 적어도 6500개 뉴클레오티드 길이를 갖는다.

다시, 바람직하게는 적어도 1개의 발현 카세트가 서열식별번호: 4, 서열식별번호: 6, 서열식별번호: 8, 서열식별번호: 10, 서열식별번호: 12, 서열식별번호: 14, 서열식별번호: 16, 서열식별번호: 18, 서열식별번호: 20, 서열식별번호: 22, 서열식별번호: 24, 서열식별번호: 26 중 임의의 것과 적어도 30% 서열 동일성을 갖는 표적 핵산 서열 내에 통합되거나 또는 그를 대체하며, 여기서 표적 핵산 서열은 적어도 가설적으로 각각 서열식별번호: 3, 서열식별번호: 5, 서열식별번호: 7, 서열식별번호: 9, 서열식별번호: 11, 서열식별번호: 13, 서열식별번호: 15, 서열식별번호: 17, 서열식별번호: 19, 서열식별번호: 21, 서열식별번호: 23, 서열식별번호: 25와 적어도 30% 서열 동일성을 갖는 아미노산 서열로 번역된다. 그리고, 보다 더 바람직하게는, 적어도 1개의 발현 카세트가 각각 서열식별번호: 20, 서열식별번호: 16 및/또는 서열식별번호: 30 중 임의의 것과 적어도 30% 서열 동일성을 갖는 표적 핵산 서열 내에 통합되거나 또는 그를 대체하며, 여기서 표적 핵산 서열은 적어도 가설적으로 각각 서열식별번호: 19, 서열식별번호: 15 및/또는 서열식별번호: 29와 적어도 30% 서열 동일성을 갖는 아미노산 서열로 번역된다.

본 발명에 따른 미생물이 동일한 또는 상이한 로커스에 삽입된 2개 이상의 발현 카세트를 포함할 수 있는 것으로 이해해야 한다. 예를 들어, RIA1 발현을 위한 2개의 발현 카세트를 포함하는 한 예시적인 통합은 동일한 로커스에 통합된다. 본 발명에 따라, 발현 카세트 중 어느 것도 ip 로커스에 통합되지 않는 것이 바람직하다. 추가로 바람직하게는, 각각 RIA1, ADI1, MTT1 및 TAD1 유전자의 발현을 위한 본 발명에 따른 모든 발현 카세트는 상기 기재된 대안 a) 내지 c) 중 임의의 것에 주어진 부위에서 통합된다.

본 발명의 한 측면에 따른 재조합 이타콘산 생산 숙주 미생물은

a) 이타콘산 생산을 위한 활성 이타콘산 대사 경로를 포함하고, 바람직하게는

b) i) 단백질 서열인 서열식별번호: 3, 서열식별번호: 5, 서열식별번호: 7, 서열식별번호: 9, 서열식별번호: 11, 서열식별번호: 13, 서열식별번호: 15, 서열식별번호: 17, 서열식별번호: 19, 서열식별번호: 21, 서열식별번호: 23 또는 서열식별번호: 25 중 임의의 것과 적어도 30% 서열 동일성을 갖는 단백질을 코딩하고/거나

적어도 1개의 유전자가 불활성화된 것이다.

실시예에 제시된 바와 같이, 바시디오마이세테스에서 RIA1 발현을 위한 플라스미드의 단순한 존재는 상응하는 야생형 균주와 비교하여 이타콘산 생산율을 확실하게 증가시키지 않는다. 하기 실시예는 qPCR에 의해 측정시 RIA1 발현에서의 중간 정도의 증가조차도 부산물로서 말레이트의 유의한 형성없이 유의하게 개선된 이타콘산 생산율을 유도할 수 있음을 보여주기 때문에, 이는 더욱 더 놀라운 것이다. 본 발명을 이종성 RIA1 유전자가 ip 로커스에서 우스틸라기노마이세테스의 게놈에 통합된 선행 기술과 비교하면 (예를 들어, [Zambanini et al., Biotechnol Biofuels, 2017, 10:131, employing constructs that integrate into the ip locus of U. vetiveriae strain TZ1; integration specificity is described by Geiser et al., Microbial Biotechnology 2016, 116-126], 122 페이지 참고), 본 발명의 실시예와 비교하여 명백히 낮은 이타콘산 생산율이 관찰되었고, 최적화된 조건 하에서도 원치않는 말레이트가 대략 1:1 - 3:1 비의 말레이트 (g/l):이타코네이트 (g/l)로 생산되었다.

따라서, 각각 서열식별번호: 3, 서열식별번호: 5, 서열식별번호: 7, 서열식별번호: 9, 서열식별번호: 11, 서열식별번호: 13, 서열식별번호: 15, 서열식별번호: 17, 서열식별번호: 19, 서열식별번호: 21, 서열식별번호: 23 또는 서열식별번호: 25와 적어도 30% 서열 동일성을 갖는 단백질을 코딩하는 적어도 1개, 더욱 바람직하게는 2개 이상의 유전자의 불활성화가 상기 언급된 이점을 수득하는데 유용하다는 것이 본 발명의 교시내용이다. 이러한 교시내용을 기재하는 또 다른 방식은, 적어도 1개, 더욱 바람직하게는 2개 이상의 유전자의 불활성화가 유리하며, 1개 이상의 유전자 각각이 적어도 낮은 엄격도 조건 하에 상기 언급된 임의의 서열을 코딩하는 핵산 서열과 혼성화하는 핵산 서열을 포함하거나 또는 그로 이루어진다는 것이다.

본원에 기재된 바와 같이, 불활성화는 바람직하게는 RIA1 유전자의 발현을 위한 및/또는 ADI1, MTT1 및 TAD1로 이루어진 군으로부터 선택된 적어도 2개의 유전자의 발현을 위한 발현 카세트의 통합에 의해 또는 그의 결과로서 수행된다.

본 발명에 따라, 불활성화된 적어도 1개의 유전자는 바람직하게는 그의 상보성 가닥이 적어도 중간 엄격도 조건 하에, 보다 더 바람직하게는 적어도 높은 엄격도 조건 하에, 보다 더 바람직하게는 매우 높은 엄격도 조건 하에 단백질 서열인 서열식별번호: 3, 서열식별번호: 5, 서열식별번호: 7, 서열식별번호: 9, 서열식별번호: 11, 서열식별번호: 13, 서열식별번호: 15, 서열식별번호: 17, 서열식별번호: 19, 서열식별번호: 21, 서열식별번호: 23 또는 서열식별번호: 25 중 임의의 것을 코딩하는 핵산 서열과 혼성화하는 서열을 포함하거나 또는 그로 이루어진다. 또한, 본 발명에 따라, 불활성화된 적어도 1개의 유전자는 바람직하게는 단백질 서열인 서열식별번호: 3, 서열식별번호: 5, 서열식별번호: 7, 서열식별번호: 9, 서열식별번호: 11, 서열식별번호: 13, 서열식별번호: 15, 서열식별번호: 17, 서열식별번호: 19, 서열식별번호: 21, 서열식별번호: 23 또는 서열식별번호: 25 중 임의의 것과 적어도 약 45% 서열 동일성, 보다 더 바람직하게는 적어도 60% 서열 동일성, 보다 더 바람직하게는 적어도 75% 서열 동일성, 보다 더 바람직하게는 적어도 85% 서열 동일성, 보다 더 바람직하게는 적어도 90% 서열 동일성, 보다 더 바람직하게는 적어도 91% 서열 동일성, 보다 더 바람직하게는 적어도 95% 서열 동일성, 보다 더 바람직하게는 적어도 98% 서열 동일성을 갖는 단백질을 코딩하는 서열을 포함하거나 또는 그로 이루어진다. 본 발명에 따라, 바람직한 유기체는 RIA1 유전자의 발현을 위한 및/또는 ADI1, MTT1 및 TAD1로 이루어진 군으로부터 선택된 적어도 2개의 유전자의 발현을 위한 적어도 1개의 발현 카세트를 포함하며, 여기서 발현 카세트 중 적어도 1개는 통합 부위에서 미생물의 게놈에 통합되며, 여기서 통합 부위는 서열식별번호: 3, 서열식별번호: 5, 서열식별번호: 7, 서열식별번호: 9, 서열식별번호: 11, 서열식별번호: 13, 서열식별번호: 15, 서열식별번호: 17, 서열식별번호: 19, 서열식별번호: 21, 서열식별번호: 23, 서열식별번호: 25 중 임의의 것과 적어도 45%, 보다 더 바람직하게는 적어도 60%, 보다 더 바람직하게는 적어도 75%, 보다 더 바람직하게는 적어도 85%, 보다 더 바람직하게는 적어도 90%, 보다 더 바람직하게는 적어도 91%, 보다 더 바람직하게는 적어도 95%, 보다 더 바람직하게는 적어도 98% 서열 동일성을 갖는 아미노산 서열로 번역되는 오픈 리딩 프레임의 가장 가까운 경계의 6500개 이하의 뉴클레오티드, 바람직하게는 5500개 이하의 뉴클레오티드, 보다 더 바람직하게는 2800개 이하의 뉴클레오티드에 위치하고/거나, 서열식별번호: 3, 서열식별번호: 5, 서열식별번호: 7, 서열식별번호: 9, 서열식별번호: 11, 서열식별번호: 13, 서열식별번호: 15, 서열식별번호: 17, 서열식별번호: 19, 서열식별번호: 21, 서열식별번호: 23, 서열식별번호: 25 중 임의의 것과 적어도 45%, 보다 더 바람직하게는 적어도 60%, 보다 더 바람직하게는 적어도 75%, 보다 더 바람직하게는 적어도 85%, 보다 더 바람직하게는 적어도 90%, 보다 더 바람직하게는 적어도 91%, 보다 더 바람직하게는 적어도 95%, 보다 더 바람직하게는 적어도 98% 서열 동일성을 갖는 아미노산 서열로 번역되는 오픈 리딩 프레임 내에 위치하거나 또는 그를 대체한다. 각각의 경우에, 상기 기재된 바와 같이 불활성화 통합은 서열 서열식별번호: 19, 서열식별번호: 15 및/또는 서열식별번호: 29 중 하나 이상, 및 완전한 길이에 걸쳐 상기 서열과 적어도 45%, 보다 더 바람직하게는 적어도 60%, 보다 더 바람직하게는 적어도 75%, 보다 더 바람직하게는 적어도 85%, 보다 더 바람직하게는 적어도 90%, 보다 더 바람직하게는 적어도 91%, 보다 더 바람직하게는 적어도 95%, 보다 더 바람직하게는 적어도 98% 서열 동일성을 갖는 각각의 서열에서 또는 그 안에서 바람직하다.

본 발명에 따른 바람직한 생산 숙주 미생물은 동일한 조건 하에 배양된 상응하는 야생형 균주와 비교하여 특징적인 유전자 발현 수준을 나타낸다.

a) RIA1 유전자의 발현 수준은 적어도 50배 증가하고/거나,

b) ADI1, MTT1 및 TAD1로 이루어진 군으로부터 선택된 적어도 2개의 유전자의 발현 수준은 적어도 1000배 증가하고/거나,

c) ITP1 유전자의 발현 수준은 최대 500배 증가한다.

본 발명에 따라 발현 수준은 실시예에서 추가로 설명되는 바와 같이 상응하는 mRNA에 대해 표준 qPCR 프로토콜을 이용하여 측정된다. 실시예에 의해 입증되는 바와 같이, RIA1 유전자 발현이 야생형 균주와 비교하여 50-1000, 보다 더 바람직하게는 100-900배만큼 조금 증가하여도 본 발명의 이점, 특히 높은 이타콘산 생산율, 및 발효 부산물로서 말레이트의 매우 낮은 생산 또는 심지어 생산되지 않음을 달성할 수 있다. 또한, RIA1 유전자 발현의 이러한 증가는 ADI1, MTT1 및/또는 TAD1의 발현 수준을 적어도 1000배 증가시킨다. 바람직하게는, ADI1, MTT1 및 TAD1로 이루어진 군으로부터 선택된 적어도 2개의 유전자의 발현 수준은 1050-6000배 증가하고, 보다 더 바람직하게는 ADI1 및 TAD1의 발현 수준은 1000-4100배 증가하고, MTT1의 발현 수준은 2000-5500배 증가한다.

또한, 바람직하게는, ITP1 유전자의 발현 수준은 최대 500배, 더욱 바람직하게는 0-300배, 보다 더 바람직하게는 최대 200배 증가한다. 이것이 발효 동안에 이타콘산이 발효 배지로 방출되도록 야생형 균주가 이미 활성 이타콘산 대사 경로를 나타내는 미생물에만 적용된다는 것을 이해해야 한다. 이 파라미터는 이타콘산 생산 숙주 미생물의 선택에 특히 유리하며, 이는 높은 수준의 ITP1 유전자 발현을 이미 나타내는 이들 미생물이 발효 배지로 이타콘산 방출을 증가시키기 위해 임의의 추가의 유전적 개입을 필요로 하지 않기 때문이며, 따라서 재조합 ITP1 유전자 과다발현을 위한 발현 카세트를 도입시킴으로써 원치않는 부작용의 위험을 감소시킨다.

본 발명에 따라, 생산 숙주 미생물은 바람직하게는 분류학상 우스틸라기노마이세테스(Ustilaginomycetes) 강, 보다 더 바람직하게는 우스틸라기날레스(Ustilaginales) 목, 보다 더 바람직하게는 우스틸라기나세아에(Ustilaginaceae) 과, 보다 더 바람직하게는 아노말로마이세스(Anomalomyces), 안트라코시스티스(Anthracocystis), 브로멜리아고(Bromeliago), 신트라크티아(Cintractia), 더마토소루스(Dermatosorus), 디르크메이아(Dirkmeia), 에리오코르텍스(Eriocortex), 파리시아(Farysia), 프란츠페트라키아(Franzpetrakia), 김노신트라크티아(Gymnocintractia), 헤테로톨리포스포리움(Heterotolyposporium), 칼마노지마(Kalmanozyma), 랑도니아(Langdonia), 류코신트라크티아(Leucocintractia), 마칼피노마이세스(Macalpinomyces), 멜라노시키움(Melanopsichium), 모에스지오마이세스(Moesziomyces), 모레아우아(Moreaua), 마이코시린크스(Mycosyrinx), 파르불라고(Parvulago), 페리클라디움(Pericladium), 포르탈리아(Portalia), 슈도지마(Pseudozyma), 레스티오스포리움(Restiosporium), 쉬조넬라(Schizonella), 쉬바시아(Shivasia), 스포리소리움(Sporisorium), 스테고신트라크티아(Stegocintractia), 톨리포스포리움(Tolyposporium), 트란츠쉘리엘라(Tranzscheliella), 트리코신트라크티아(Trichocintractia), 트리오디오마이세스(Triodiomyces), 투비소루스(Tubisorus), 우스틸라고(Ustilago), 웹스다네아(Websdanea) 중 임의의 속에 속하고, 가장 바람직하게는 슈도지마 속에 속한다. 슈도지마 미생물 및 특히 슈도지마 츠쿠바엔시스의 유용성은, 우스틸라고 속의 미생물을 사용하여 더 많은 양의 이타콘산을 달성할 수 있음을 나타내는 (Zambanini et al. 2017의 표 3 참고) 선행 기술 조사의 발견 (Zambanini et al. 2017, op. cit.)을 고려할 때 놀라운 것이다.

추가로 바람직하게는, 본 발명에 따라, 생산 숙주 미생물은 아스퍼길루스 테레우스 시스-아코니테이트 데카르복실라제 (CAD1) 유전자에 대한 기능적 오르토로그도 어떠한 유. 마이디스 클러스터 유전자 CYP3 및 RDO1도 발현하지 않는다. 이들 유전자는 이타콘산 대사에 수반되는 것으로 생각되며; 이들 유전자의 강한 발현은 이타콘산 생산을 감소시킬 수 있다.

추가로 바람직하게는, 본 발명에 따라, 생산 숙주 미생물은 비상동성 단부 결합을 위한 ku70 및 ku80 단백질의 기능적 오르토로그를 발현하지 않는다. 이러한 방식으로, 생산 숙주 미생물은 원치않는 자발적 재조합에 대해 특히 안정화되고, 특히 생산 숙주 미생물은 본 발명에 따른 1개 초과의 발현 카세트를 포함한다.

본 발명의 목적을 위해, RIA1 유전자는 RIA1 폴리펩티드를 코딩하는 핵산 서열인 것으로 이해된다. 상응하게는, ITP1, ADI1, MTT1 또는 TAD1 유전자 각각은 ITP1, ADI1, MTT1 또는 TAD1 단백질 각각을 코딩하는 핵산인 것으로 이해된다.

본 발명에 따라, RIA1 단백질은 기능적 정의에 따라 RIA1 단백질을 발현하지 않는 상응하는 균주와 비교하여 상응하는 ITP1, ADI1, MTT1 또는 TAD1 mRNA 각각의 정량적인 PCR에 의해 측정시 임의의 유전자 ITP1, ADI1, MTT1 및 TAD1의 발현을 적어도 10배 증가시킬 수 있는 단백질이다. 구조적 정의에 따라, RIA1 폴리펩티드는 바람직하게는 MatGat 프로그램을 이용하고 하기 파라미터를 적용하여 측정시 완전한 서열 서열식별번호: 35와 적어도 46% 아미노산 서열 동일성을 갖는다: BLOSUM62 매트릭스, 갭 오픈 패널티 12, 갭 확장 패널티 2. 보다 더 바람직하게는, RIA1 폴리펩티드는 바로 위에 기재된 바와 같이 서열식별번호: 35와 적어도 55% 아미노산 서열 동일성, 보다 더 바람직하게는 적어도 57% 아미노산 서열 동일성을 갖는다. 이러한 RIA1 단백질은 본원의 실시예에 기재된 슈도지마 츠쿠바엔시스의 RIA1 폴리펩티드에 구조적으로 밀접하게 상응하며, 이는 이러한 단백질의 이점을 추가로 나타낸다. 추가로 바람직하게는, RIA1 단백질의 아미노산 서열 서열식별번호: 35와의 서열 유사성은 적어도 62%, 보다 더 바람직하게는 적어도 64% 및 보다 더 바람직하게는 적어도 70%이다.

슈도지마 속, 가장 바람직하게는 슈도지마 츠쿠바엔시스에서 발견되는 것에 상응하는 RIA1 폴리펩티드가 특히 바람직하다. 특히, 바람직한 RIA1 폴리펩티드는 서열식별번호: 36의 완전한 서열과 적어도 41%, 보다 더 바람직하게는 적어도 57%, 보다 더 바람직하게는 적어도 70%, 보다 더 바람직하게는 적어도 73%, 보다 더 바람직하게는 적어도 80%, 보다 더 바람직하게는 적어도 85%, 보다 더 바람직하게는 적어도 90%, 보다 더 바람직하게는 적어도 92%, 보다 더 바람직하게는 적어도 95%, 보다 더 바람직하게는 적어도 98% 서열 동일성을 갖는다. 이러한 RIA1 폴리펩티드는 실시예에서 추가로 기재되는 유리한 RIA1 폴리펩티드에 상응한다. 또한 바람직하게는, RIA1 폴리펩티드와 서열식별번호: 36의 아미노산 서열의 서열 유사성은 적어도 46%, 보다 더 바람직하게는 적어도 59%, 보다 더 바람직하게는 적어도 70%, 보다 더 바람직하게는 적어도 73%, 보다 더 바람직하게는 적어도 85%, 보다 더 바람직하게는 적어도 90%, 보다 더 바람직하게는 적어도 92%, 보다 더 바람직하게는 적어도 95%, 보다 더 바람직하게는 적어도 98%이다.

상기 임의의 기능적 및/또는 구조적 정의에 따른 RIA1 폴리펩티드가 서열식별번호: 38, 서열식별번호: 39, 서열식별번호: 40, 서열식별번호: 41, 서열식별번호: 42, 서열식별번호: 43, 서열식별번호: 44, 서열식별번호: 45 및 서열식별번호: 46 각각에 상응하는 상응하는 적어도 1개, 보다 더 바람직하게는 적어도 2개, 보다 더 바람직하게는 적어도 3개, 보다 더 바람직하게는 적어도 4개, 보다 더 바람직하게는 적어도 5개, 보다 더 바람직하게는 적어도 6개, 보다 더 바람직하게는 적어도 7개, 보다 더 바람직하게는 적어도 8개 및 가장 바람직하게는 모든 9개의 모티프를 포함할 때 특히 바람직하다. 바람직하게는, RIA1 폴리펩티드는 최대 2개, 보다 더 바람직하게는 최대 1개의 아미노산 교환을 갖는 각각의 서열 모티프를 함유하고; 이 외에도 모티프가 서열식별번호: 38 내지 서열식별번호: 47에 따른 서열과 비교하여 결실 또는 삽입을 포함하지 않는 것이 바람직하다. 보다 더 바람직하게는, 서열 모티프에서 유일한 차이는 서열식별번호: 38 대신에 RIA1 폴리펩티드가 정확한 서열 서열식별번호: 47을 포함한다는 것이다. 가장 바람직하게는, 본 발명에 따른 RIA1 폴리펩티드 서열은 서열식별번호: 47, 서열식별번호: 39, 서열식별번호: 40, 서열식별번호: 41, 서열식별번호: 42, 서열식별번호: 43, 서열식별번호: 44, 서열식별번호: 45 및 서열식별번호: 46의 모든 모티프를 포함하며, 여기서 RIA1 폴리펩티드의 모티프와 상기 언급된 서열 모티프 사이의 전체 차이는 최대 1개 아미노산 교환 및 가장 바람직하게는 0개 아미노산 교환이다.

구조적 정의에 따라, ITP1 폴리펩티드는 바람직하게는 MatGat 프로그램을 이용하고 하기 파라미터를 적용하여 측정시 완전한 서열 서열식별번호: 33과 적어도 52% 아미노산 서열 동일성을 갖는다: BLOSUM62 매트릭스, 갭 오픈 패널티 12, 갭 확장 패널티 2. 이러한 ITP1 단백질은 본원의 실시예에 기재된 슈도지마 츠쿠바엔시스의 ITP1 폴리펩티드에 구조적으로 밀접하게 상응하며, 이는 이러한 단백질의 추가의 이점을 나타낸다. 추가로 바람직하게는, ITP1 단백질의 아미노산 서열 서열식별번호: 33과의 서열 유사성은 적어도 60%, 보다 더 바람직하게는 적어도 83% 및 보다 더 바람직하게는 적어도 87%이다.

슈도지마 속, 가장 바람직하게는 슈도지마 츠쿠바엔시스에서 발견되는 것들에 상응하는 ITP1 폴리펩티드가 특히 바람직하다. 특히, 바람직한 ITP1 폴리펩티드는 서열식별번호: 33의 완전한 서열과 적어도 52%, 보다 더 바람직하게는 적어도 70%, 보다 더 바람직하게는 적어도 76%, 보다 더 바람직하게는 적어도 79%, 보다 더 바람직하게는 적어도 85%, 보다 더 바람직하게는 적어도 90%, 보다 더 바람직하게는 적어도 92%, 보다 더 바람직하게는 적어도 95%, 보다 더 바람직하게는 적어도 98% 서열 동일성을 갖는다. 이러한 ITP1 폴리펩티드는 실시예에 추가로 기재된 유리한 ITP1 폴리펩티드에 상응한다.

구조적 정의에 따라, ADI1 폴리펩티드는 바람직하게는 MatGat 프로그램을 이용하고 하기 파라미터에 적용하여 측정시 완전한 서열 서열식별번호: 32와 적어도 63% 아미노산 서열 동일성을 갖는다: BLOSUM62 매트릭스, 갭 오픈 패널티 12, 갭 확장 패널티 2. 이러한 ADI1 단백질은 본원의 실시예에 기재된 바와 같이 슈도지마 츠쿠바엔시스의 ADI1 폴리펩티드에 구조적으로 밀접하게 상응하며, 이는 이러한 단백질의 추가의 이점을 나타낸다. 추가로 바람직하게는, ADI1 단백질의 아미노산 서열 서열식별번호: 32과의 서열 유사성은 적어도 74%, 보다 더 바람직하게는 적어도 85% 및 보다 더 바람직하게는 적어도 98%이다.

슈도지마 속, 가장 바람직하게는 슈도지마 츠쿠바엔시스에서 발견되는 것에 상응하는 ADI1 폴리펩티드가 특히 바람직하다. 특히, 바람직한 ADI1 폴리펩티드는 서열식별번호: 32의 완전한 서열과 적어도 63%, 보다 더 바람직하게는 적어도 70%, 보다 더 바람직하게는 적어도 78%, 보다 더 바람직하게는 적어도 85%, 보다 더 바람직하게는 적어도 90%, 보다 더 바람직하게는 적어도 92%, 보다 더 바람직하게는 적어도 95%, 보다 더 바람직하게는 적어도 98% 서열 동일성을 갖는다. 이러한 ADI1 폴리펩티드는 실시예에서 추가로 기재되는 유리한 ADI1 폴리펩티드에 상응한다.

구조적 정의에 따라, MTT1 폴리펩티드는 바람직하게는 MatGat 프로그램을 이용하고 하기 파라미터에 적용하여 측정시 완전한 서열 서열식별번호: 34와 적어도 53% 아미노산 서열 동일성을 갖는다: BLOSUM62 매트릭스, 갭 오픈 패널티 12, 갭 확장 패널티 2. 이러한 MTT1 단백질은 본원의 실시예에 기재된 슈도지마 츠쿠바엔시스의 MTT1 폴리펩티드에 구조적으로 밀접하게 상응하며, 이는 이러한 단백질의 추가의 이점을 나타낸다. 추가로 바람직하게는, MTT1 단백질의 아미노산 서열 서열식별번호: 34와의 서열 유사성은 적어도 59%이다.

슈도지마 속, 가장 바람직하게는 슈도지마 츠쿠바엔시스에서 발견되는 것들에 상응하는 MTT1 폴리펩티드가 특히 바람직하다. 특히, 바람직한 MTT1 폴리펩티드는 서열식별번호: 34의 완전한 서열과 적어도 53%, 보다 더 바람직하게는 적어도 57%, 보다 더 바람직하게는 적어도 70%, 보다 더 바람직하게는 적어도 78%, 보다 더 바람직하게는 적어도 85%, 보다 더 바람직하게는 적어도 90%, 보다 더 바람직하게는 적어도 92%, 보다 더 바람직하게는 적어도 95%, 보다 더 바람직하게는 적어도 98% 서열 동일성을 갖는다. 이러한 MTT1 폴리펩티드는 실시예에 추가로 기재된 유리한 MTT1 폴리펩티드에 상응한다.

구조적 정의에 따라, TAD1 폴리펩티드는 바람직하게는 MatGat 프로그램을 이용하고 하기 파라미터에 적용하여 측정시 완전한 서열 서열식별번호: 31과 적어도 84% 아미노산 서열 동일성을 갖는다: BLOSUM62 매트릭스, 갭 오픈 패널티 12, 갭 확장 패널티 2. 이러한 TAD1 단백질은 본원의 실시예에 기재된 슈도지마 츠쿠바엔시스의 TAD1 폴리펩티드에 구조적으로 밀접하게 상응하며, 이는 이러한 단백질의 추가의 이점을 나타낸다. 추가로 바람직하게는, TAD1 단백질의 아미노산 서열 서열식별번호: 31과의 서열 유사성은 적어도 82%, 보다 더 바람직하게는 적어도 92% 및 보다 더 바람직하게는 적어도 94%이다.

슈도지마 속, 가장 바람직하게는 슈도지마 츠쿠바엔시스에서 발견되는 것들에 상응하는 TAD1 폴리펩티드가 특히 바람직하다. 특히, 바람직한 TAD1 폴리펩티드는 서열식별번호: 31의 완전한 서열과 적어도 84%, 보다 더 바람직하게는 적어도 85%, 보다 더 바람직하게는 적어도 90%, 보다 더 바람직하게는 적어도 92%, 보다 더 바람직하게는 적어도 95%, 보다 더 바람직하게는 적어도 98% 서열 동일성을 갖는다. 이러한 TAD1 폴리펩티드는 실시예에서 추가로 기재되는 유리한 TAD1 폴리펩티드에 상응한다.

본 발명에 따른 특히 유리한 생산 숙주 미생물은

a) 적어도 9.5 g 이타콘산 /(l d)의 생산율로 및/또는

b) 적어도 25 % (w/w 글루코스)의 수율로

글루코스를 이타콘산으로 전환시키는데 유용하다.

바람직하게는 생산율은 발효, 바람직하게는 8일의 유가 배양식 발효 후에 발효 브로쓰로부터 회수된 이타콘산의 총량을 최종 발효 브로쓰 부피 및 발효 지속시간으로 나누어서 측정된다.

본 발명은 또한 ip 로커스의 외부에서 통합을 위해 강한 구성적으로 활성인 프로모터에 작동가능하게 연결된 RIA1 유전자를 포함하는 통합 벡터를 제공한다. 이러한 통합 벡터는 RIA1 발현 카세트 (강한 구성적으로 활성인 프로모터에 작동가능하게 연결된 RIA1 유전자를 포함함)를 선택된 특이적 통합 부위에 특이적으로 확실하게 통합시키기 위해 바람직하게는 상기 언급된 강, 목, 과, 속 또는 종의 바시디오마이세테스를 형질전환시킬 때 상기 언급된 본 발명의 이점이 달성될 수 있다. 본 발명에 따른 바람직한 프로모터는 액틴 프로모터, HSP70 프로모터, TEF 프로모터, GPD 프로모터 및 GLC 프로모터이고, 본원에 기재된 액틴 프로모터가 가장 바람직하다.

상응하게, 본 발명은 하기를 포함하는, 이타콘산 생산 숙주 미생물을 변경시키는 방법을 제공한다:

- RIA1 유전자의 발현을 위한 및/또는

특이적인 통합에서 적어도 1개의 발현 카세트의 통합에 의해 이 방법은 관련 기술분야의 통상의 기술자가 야생형 바시디오마이세테스를 본 발명에 따른 이타콘산 생산 숙주 미생물로 전환시킬 수 있게 하여, 본원에 기재된 이점을 수반한다.

상기 방법에서, 통합 부위는 바람직하게는

a) 좌측 경계 유전자와 우측 경계 유전자 사이에 위치하며, 여기서 좌측 및 우측 경계 유전자의 번역 개시 코돈의 아데닌은 상응하는 야생형 미생물에서 최대 51600개 뉴클레오티드에 의해 분리되어 있고,

여기서 우측 경계 유전자는 서열식별번호: 25와 적어도 21% 동일성을 갖는 아미노산 서열로 이루어지는 단백질을 코딩하고/거나,

c) 서열식별번호: 3, 서열식별번호: 5, 서열식별번호: 7, 서열식별번호: 9, 서열식별번호: 11, 서열식별번호: 13, 서열식별번호: 15, 서열식별번호: 17, 서열식별번호: 19, 서열식별번호: 21, 서열식별번호: 23, 서열식별번호: 25 중 임의의 것과 적어도 30% 서열 동일성을 갖는 아미노산 서열으로 번역되는 오픈 리딩 프레임 내에 위치하거나 또는 그를 대체한다.

바람직한 통합 부위 및 각각의 이점은 상기 기재되었고 본원에서 추가로 상세하게 설명된다.

바람직하게는, 상기 방법은

i) 단백질 서열인 서열식별번호: 3, 서열식별번호: 5, 서열식별번호: 7, 서열식별번호: 9, 서열식별번호: 11, 서열식별번호: 13, 서열식별번호: 15, 서열식별번호: 17, 서열식별번호: 19, 서열식별번호: 21, 서열식별번호: 23 또는 서열식별번호: 25 중 임의의 것과 적어도 30% 서열 동일성을 갖는 단백질을 코딩하고/거나

적어도 1개의 유전자를 불활성화시키도록 수행된다.

다시, 이러한 불활성화 및 바람직한 불활성화의 이점은 상기 기재되었고 본원에서 추가로 기재된다.

따라서, 상기 방법은 ip 로커스의 외부에서 통합되는 적어도 1개의 발현 카세트를 포함하지 않는 대조군 미생물에 비해 증가된 이타콘산 생산율을 갖는 미생물을 유도한다.

본 발명은 또한 하기를 포함하는, 재조합 이타콘산 생산 숙주 미생물을 수득하는 방법을 또한 제공한다:

a) 모 미생물을 배양하고,

b) 임의의 순서로 및/또는 동시에 하기를 수행하고:

- i) 단백질 서열인 서열식별번호: 3, 서열식별번호: 5, 서열식별번호: 7, 서열식별번호: 9, 서열식별번호: 11, 서열식별번호: 13, 서열식별번호: 15, 서열식별번호: 17, 서열식별번호: 19, 서열식별번호: 21, 서열식별번호: 23 또는 서열식별번호: 25 중 임의의 것과 적어도 30% 서열 동일성을 갖는 단백질을 코딩하고/거나

적어도 1개의 유전자의 불활성화,

본 발명이 하기를 포함하는, 이타콘산의 생산 방법을 제공하는 것이 특히 유익하며:

a) 이타콘산을 수득하기 위해 생산 숙주 미생물을 발효시키고,

b) 단계 (a)에서 생산된 이타콘산을 회수하는 것,

여기서 미생물은 본 발명에 따른 미생물이고, 바람직하게는 이타콘산 생산 숙주 미생물의 상기 언급된 임의의 변경 방법에 따라 수득되거나 또는 수득가능하고/거나, 본 발명에 따른 통합 벡터를 사용하여 형질전환에 의해 수득가능하거나 또는 수득된다.

발효 공정은 바람직하게는 액침 발효이고, 또한 바람직하게는 회분식 발효, 유가 배양식 발효 또는 연속 발효이다. 유가 배양식 발효가 특히 바람직하고, 그에 사용되는 특히 유용한 발효 방법 및 물질은 하기 실시예에 기재된다.

발효는 바람직하게는 최대 0.1 %(v/v)의 복합 배지 성분을 포함하는 최소 배지에서 시작되고, 최대 5.5의 pH를 갖는다. 실시예에 제시된 바와 같이, 이러한 최소 배지는 특히 원치않는 말레이트 부산물의 양을 감소시키는 것을 지원하고, 생산 숙주 미생물에서 이타콘산의 생산율 및 수율을 증가시킬 수 있다. 본 발명에 따라, 복합 배지 성분은 옥수수 침지 분말, 옥수수 침지액, 옥수수 전분, 옥수수 가공 부산물, 대두 가공 부산물, 당밀, 효모 추출물, 효모 자가용해물 및 소비된 발효 브로쓰이다. 바람직하게는, 최소 배지는 0.1 %(v/v) 초과의 정의되지 않은 배지 성분을 포함하지 않는다. 가장 바람직하게는, 발효를 시작하기 위한 및/또는 유가 배양식 발효 동안에 첨가하기 위한 최소 배지는 0.1 % (v/v) 초과의 각각의 옥수수 침지 분말, 옥수수 침지액, 옥수수 전분, 옥수수 가공 부산물, 대두 가공 부산물, 당밀, 효모 추출물, 효모 자가용해물 또는 소비된 발효 브로쓰를 포함하지 않고, 보다 더 바람직하게는 총 0.1 %(v/v) 초과의 옥수수 침지 분말, 옥수수 침지액, 옥수수 전분, 옥수수 가공 부산물, 대두 가공 부산물, 당밀, 효모 추출물, 효모 자가용해물 및 소비된 발효 브로쓰를 포함하지 않고, 가장 바람직하게는 옥수수 침지 분말, 옥수수 침지액, 옥수수 전분, 옥수수 가공 부산물, 대두 가공 부산물, 당밀, 효모 추출물, 효모 자가용해물 및 소비된 발효 브로쓰를 포함하지 않는다. 의심의 여지를 없애기 위해, 숙주 미생물 및 발효 브로쓰로 방출된 물질은 발효 배지의 복합 배지 성분이 아니다.

바람직한 경우 본 발명에 따른 발효 과정은 바람직하게는 상기 기재된 바와 같이 최소 배지인 배지의 pH가 발효 동안에 최대 5, 보다 더 바람직하게는 최대 4,5 및 보다 더 바람직하게는 3-4이도록 수행되었다. pH를 4 미만으로 낮추는 것은 건조 세포 중량 (DCW)의 정지를 유도하거나, 또는 이타콘산의 생산율 및 수율을 손상시키지 않으면서 적어도 유의한 성장 지연을 유도하고, 놀랍게도 말레이트 부산물 형성의 원치않는 증가를 유도하지 않는다.

배지는 바람직하게는 폴리알콜성 탄소 공급원을 포함하고, 발효 동안에 탄소 공급원의 농도가 3시간 초과 동안 10 g/l 미만으로 떨어지지 않는다. 실시예에 의해 제시된 바와 같이, 이러한 발효 조건은 발효 부산물로서 말레이트의 무시할만한 형성과 함께 유리하게는 이타콘산의 높은 생산율 및 수율을 야기한다. 바람직한 폴리알콜성 탄소 공급원은 글루코스, 프룩토스, 크실로스, 아라비노스, 락토스, 수크로스, 셀로비오스, 말토스, 글리세롤 및 에틸렌 글리콜이다.

특히 바람직하게는, 발효 배지 내 이타콘산 대 말산의 농도 비는 발효 (회분식 또는 유가 배양식 발효) 종료 시 적어도 15:1, 바람직하게는 적어도 20:1 및 보다 더 바람직하게는 적어도 100:1이다. 본 발명에 따라, 말산의 형성은 원치않는 것이다. 지금까지 우스틸라기노마이세테스에서 이타콘산을 발효에 의해 생산하고자 한 이전의 모든 시도는 말산의 공동-생산을 재현적으로 피할 수 없었으며, 몇몇 경우에는 형성된 말산의 양이 심지어 이타콘산보다 훨씬 더 높았다. 말산이 크렙스 주기의 성분이기 때문에, 미생물에 의해 생산된 말산의 감소 및 바람직하게는 미생물에 의해 배지로 분비된 말산의 감소가 유익하며; 따라서 말산의 손실은 미생물이 이타콘산을 높은 수율로 발효에 의해 생산하는 능력을 감소시킨다.

단계 a)에서 발효 방법은 바람직하게는 호기성 또는 미세호기성 조건 하에 있다. 일시적인 미세호기성 조건을 이용하여 이타콘산을 발효에 의해 생산하고자 한 이전의 시도에도 불구하고 호기성 조건이 유익하다는 것은 특히 놀라운 것이었다 (WO2009-1006627).

실시예

이 단락에서, 약어 "ITA"는 이타콘산 및/또는 이타코네이트를 지칭하고, "MA"는 말산/말레이트를 지칭하고, "AKG"는 알파-케토글루타르산/알파-케토글루타레이트를 지칭한다.

균주, 배지 및 성장 조건

피. 츠쿠바엔시스 균주 H488 (CBS422.96, 야생형, [Kawamura, D., Saito, O., Matsui, H., and Morita, K. (1983). Producing of itaconic acid by yeasts: III Culture identification of itaconic acid producing strains. Shizuoka-Ken Kogyo Shikenjo Hokoku 27, 77-88]), M15 (H488의 UV-돌연변이체) 및 새로 구축된 RIA1 과다발현 형질전환체 HR12 (H488-pPTT.pActin.RIA1, 본 발명) 뿐만 아니라 클로닝 에스케리키아 콜라이 균주 DH10b를 사용하였다. 배양을 위해, 12-웰 플레이트 (3-ml 마이크로-웰), 250-ml 진탕 플라스크, 500-ml 배플형 플라스크 또는 600-ml 생물반응기 (멀티포어스(Multifors), 인포어스 에이치티(INFORS HT), 독일)를 사용하였다.

효모 세포를 -80℃ 냉동-보존 (에머스(emers))으로부터 완전 배지 YPD 또는 선택 배지 (YM-Hyg, YM-Cbx)를 함유하는 한천 플레이트 상에 스트리킹하고, 30℃에서 2-3일 동안 성장시켰다. 액체 배지에서의 배양을 30℃ 및 220 rpm에서 수행하였다. 이타콘산 생산 MG-IA의 경우 균주를 50 ml 완전 배지 YPD에서 또는 최소 배지에서 성장시켰다. 사전 배양을 위해, 50 ml의 액체 YPD 배지 (500-ml 배플형 플라스크에서)를 효모 세포로 접종하고, 25-30의 OD600 (울트라스펙(Ultrospec) 2000 광도계, 파마시아 바이오텍(Pharmacia Biotech))에 도달할 때까지 1-2일 동안 성장시켰다. 세포를 원심분리 (3,500 g, 실온 (RT)에서 5분)에 의해 수확하고, 2 ml dH2O (오토클레이빙됨) 중에서 재현탁시켰다. 후속 액체 배양물을 시작 OD600 = 1을 수득하기 위해 필요한 세포 현탁액의 양으로 접종시켰다. 형질전환체에 대한 스크리닝의 경우, 세포를 3-ml (MG-IA) 마이크로-웰 배양물에서 성장시켰다. 웰을 한천 플레이트로부터의 세포 물질로 직접 접종시키고, 웰 플레이트를 접착성 막으로 밀봉하였다. 진탕 플라스크 및 웰 플레이트에서의 배양을 위해 3.3 g l-1 CaCO3를 사용하여 배지의 pH를 5.0-5.5로 일정하게 유재하였다. 생물반응기에서의 성장 조건에 대해서는 표 1을 참고한다. 배양물의 샘플링을 24시간마다 수행하였다.

에스케리키아 콜라이를 액체 LB-배지에서 37℃ 및 220 rpm에서 배양하였다. 세포를 37℃에서 고체 LB-배지를 함유하는 암피실린 (원액: 10 mg ml-1, 최종 농도: 100 μg ml-1) 상에서 성장시켜, 형질전환체를 보유하는 플라스미드를 선택하였다.

배지 및 용액

MG-IA

N 공급원: 1 g l-1 NaNO3 또는 NH4Cl (특정한 실험에서 농도는 1-8 g l-1로부터 선택됨)

P 공급원: 0.1 g l-1 KH2PO4/K2HPO4 x 3 H2O (특정한 실험에서 농도는 0.1-3.0 g l-1로부터 선택됨)

미네랄 염: 0.7 g l-1 MgSO4 x 7 H2O, 0.5 g l-1 NaCl, 0.5 g l-1 K2SO4 0.4 g l-1 CaCl2 x 2 H2O

미량 원소: 0.5 mg l-1 H3BO3, 0.04 mg l-1 CuSO4 x 5 H2O, 0.1 mg l-1 KI, 0.4 mg l-1 MnSO4 x 4 H2O, 0.2 mg l-1 Na2MoO4 x 2 H2O, 0.4 mg l-1 ZnSO4 x 7 H2O

철: 6 mg l-1 FeCl3 x 6 H2O (에탄올 중 원액)

티아민: 0.4 mg l-1 티아민-HCl

탄소 공급원: 150 mg l-1 글루코스, 발효 동안에 매일 조정됨

YPD

효모 추출물 10 g l-1

펩톤 (카세인) 20 g l-1

글루코스 20 g l-1

YM

효모 추출물 3 g l-1

펩톤 (카세인) 2.5 g l-1

맥아 추출물 3 g l-1

글루코스 5 g l-1

피. 츠쿠바엔시스 형질전환체를 함유하는 플라스미드의 선택을 위해 히그로마이신 B (100 μg ml-1) 및 카르복신 (25 μg ml-1)을 사용하였다.

LB (Sambrook et al., 1989)

박토-펩톤 10 g l-1

효모 추출물 5 g l-1

NaCl 10 g l-1

YEPSlight

효모 추출물 10 g l-1

펩톤 (카세인) 4 g l-1

수크로스 4g l-1

Reg-배지

펩톤 20 g l-1

수크로스 20 g l-1

소르비톨 1 M

한천 20 g l-1

SCS

소르비톨 1 M

시트르산나트륨 20 mM pH 5.8

STC

소르비톨 1 M

Tris/HCl 10 mM pH 7.5

CaCl2 0.1 M

1 x 미네랄-염 용액

3 g l-1 (NH4)2SO4

1 g l-1 KH2PO4

0.16 g l-1 K2HPO4 x 3 H2O

0.7 g l-1 MgSO4 x 7 H2O

0.5 g l-1 NaCl

0.4 g l-1 Ca(NO3)2 x 4 H2O

PBS

8.0 g l-1 NaCl

0.2 g l-1 KCl

1.78 g l-1 Na2HPO4 x 2 H2O

0.27 g l-1 KH2PO4

일반적인 기술:

샘플링

웰-플레이트 및 진탕 플라스크에서 배양물 실험의 경우에 배양물의 샘플링은 200 - 1,000 μl의 배양물 브로쓰를 직접적으로 제거함으로써 24시간마다 수행하였다. 생물반응기 배양물은 (멸균성을 유지하기 위해) 2개의 삼방향 밸브를 통해 20 ml의 배양물 브로쓰를 제거함으로써 24시간마다 샘플링하였다. 처음 5 ml의 브로쓰는 폐기하였다 (샘플링 튜브에서 잠재적으로 축적되는 죽은 세포를 피하기 위해). 나머지 15 ml의 배양물 브로쓰는 이전에 칭량된 15-ml 팔콘 튜브에 수집하였다.

광학 밀도 (OD600)

람다 = 600 nm의 파장에서 광학 밀도를 측정하여 세포 성장을 추적하였다. 세포를 3,500 g, RT에서 5분 동안 원심분리에 의해 펠렛화하였다. 펠렛을 1 x 미네랄-염 용액으로 세척하였다. 세척 단계 이후에 세포를 재현탁시키고, 1 x 미네랄-염 용액으로 희석하였다. 측정은 울트라스펙 2000 광도계 (파마시아 바이오텍)에 의해 1.5 ml 일회용 큐벳 (층 두께: 10 mm)에서 수행하였다.

건조-세포 중량 (DCW)

건조-세포 중량을 생물반응기에서 성장한 세포 배양물에 대해서만 측정하였다. 10 ml의 배양물 브로쓰를 이전에 칭량된 15-ml 팔콘 튜브에서 펠렛화하였다 (3,500 g, RT에서 10분). 펠렛을 10 ml dH2O로 세척하고, 다시 펠렛화하였다 (3,500 g, RT에서 10분). 상청액을 제거하였다. 이어서, 펠렛을 100℃에서 12시간 동안 건조시키고, 칭량하여 최종적으로 DCW를 측정하였다.

글루코스 효소 검정

배양물 배지 중에서 글루코스 농도는 효소 검정 키트 글루코스 UV 시험 (알-바이오팜 아게(R-Biopharm AG))의 도움으로 효소 검정을 수행함으로써 측정되었다. 이는 제조자의 프로토콜에 따라 수행되었다.

현미경검사

세포를 원심분리하고, 100 μl 고정 용액 (PBS 중 4.5 % v/v 포름알데히드, (Sambrook et al., 1989)에 따른 PBS) 중에서 재현탁시켰다. 가시화는 빛 및 400 X 배율의 위상차 현미경검사를 통해 수행하였다.

DNAse 처리

DNAse 처리는 하기 반응 혼합물을 사용하여 표준 프로토콜에 따라 수행하였다:

샘플 HR12_1 및 H488_1의 DNaseI-재처리

DNase I - RNase 무함유 - EURx (로보클론(Roboklon), E1345)

반응 혼합물:

32/38 μl RNA (HR12/H488)

5 μl 10x DNaseI-완충제

1 μl 리보록(Ribolock) 리보뉴클레아제 억제제

11.5/5.5 μl H2O

0.5 μl DNaseI 37℃에서 15분

뉴클레오스핀(NucleoSpin)^® RNA 클린-업 XS - 마쉐리-나겔(Macherey-Nagel)에 의한 RNA의 정제

15+10 μl H2O에 의한 용해 (2-단계)

11.5 μl의 최대 가능한 양으로 cDNA-합성

11.5 μl RNA

1 μl 무작위 육합체

4 μl 5x 버퍼

2 μl dNTP

0.5 μl 리보록 40 U/μl

1 μl RT

RT없이 RT-조절을 위해 및 단지 10 μl의 총 부피

제제 2: 10 μl- 반응 혼합물

2.5/5.5 μl RNA (HR12_2/H488_2)

3.0/0 μl H2O

0.5 μl 무작위 육합체

2 μl 5x 완충제

1 μl dNTP

0.5 μl 리보록 20 U/μl

0.5 μl RT

RT-PCR

이중 측정으로서 각각의 cDNA, 단일 측정으로서 RNA 및 H2O-대조군에 의한 PCR

10 μl- 반응 혼합물:

5 μl PCR-SYBR 그린 마스터믹스

1.2 μl 프라이머믹스 (각각 2.5 pmol/μl)

1 μl cDNA/RNA/H2O

2.8 μl H2O

96-웰 플레이트에서 판독

뚜껑-온도: 105℃

프로토콜

1: 8:00 동안 95.0℃

2: 0:15 동안 95.0℃

3: 0:30 동안 58.0℃

플레이트 판독

4: 0:10 동안 72.0℃

플레이트 판독

5: GOTO 2, 39회 더

6: 2:00 동안 72.0℃

7: 용융 곡선 60.0℃ 내지 95.0℃: 증분 0.5℃ 0:04

플레이트 판독

8: 0:01 동안 20.0℃

정량화

단계 3

분석 모드: 형광

Cq 측정: 회귀법

기준선 방법:

SYBR: 자동 계산됨

실시예 1: 프로모터 특징규명

각각의 4가지 유전자 TEF3, HSP70, 액틴 및 글리세르알데히드 3-포스페이트 데히드로게나제에 대해, 바로 상류 영역으로부터 대략 1,050 bp 길이의 서열을 증폭시켰다. 5'-단부를 KpnI-제한 부위로 상보화시켰고, 3'-단부를 LacZ-ORF의 처음 20 bp로 상보화시켰다. 이와 병행하여, 5'-단부를 프로모터 서열 중 하나의 마지막 20 bp로 상보화시키고 3'-단부를 PstI 제한 부위로 상보화시키면서, 에스케리키아 (이.) 콜라이로부터의 LacZ 유전자를 코딩하는 β-갈락토시다제의 ORF를 증폭시켰다. 단편 둘 다를 제2 폴리머라제 연쇄 반응 (PCR) 동안에 함께 융합시켰다. 이는 제1 PCR에서 생성된 2개의 단편의 상동성 중첩 단부로 인해 가능하였다. 중첩-PCR 산물을 KpnI & PstI에 의해 소화시키고, 선형화된 pPTT 플라스미드에 라이게이션시켰다 (상기 플라스미드는 KpnI 및 NsiI 소화되었다. NsiI에 의해 생성된 단부는 PstI에 의해 생성된 단부와 상용성이다).

생성된 LacZ 리포터 유전자 과다발현 플라스미드, pPTT-pActin-LacZ; pPPT-pGAPDH-LacZ; pPPT-pHSP70-LacZ & pPPT-pTEF1-LacZ 각각을 피. 츠쿠바엔시스 H488 및 M15 내로 형질전환시켰다. 유. 마이디스로부터의 HSP70 프로모터 (pUmHSP70)는 음성으로 작용하였다 (데이터는 제시되지 않음). 수득된 형질전환체를 YPD 완전 배지에서 2일 동안 또는 MG-IT (최소 배지)에서 4일 동안 배양하였다. 세포를 수확하고, 기계적으로 용해시키고, 추출하고, Miller (1972)에 따라 β-갈락토시다제 활성에 대해 시험하였다. 기질로서 ONPG (o-니트로페닐-β-D갈락토피라노시드)에 의한 세포 무함유 추출물의 흡광도를 420 nm에서 30분 동안 측정하였다. 총 단백질 함량을 측정하기 위해, 브래드포드(Bradford) 단백질 검정 (Bradford, 1976)을 수행하였다.

대부분의 형질전환체는 완전 배지에서 뿐만 아니라 최소 배지에서도 상승된 β-갈락토시다제 활성을 나타내었다. 시험한 모든 프로모터의 활성 범위는 상당히 높았다. pHSP70 및 pTEF1 형질전환체는 유. 마이디스로부터의 HSP70 프로모터에 비해 더 낮게 수행된 반면에, pActin은 모든 시나리오에서 상승된 효소 활성을 나타낸 유일한 시험한 프로모터였다 (도 5 - 도 8 참고). 프로모터 활성에서 이러한 차이의 이유는 여전히 명확하지 않다.

pActin의 제어 하에 전반적으로 비교적 높은 활성으로 인해, 이 프로모터는 후속 과다발현 분석에서 사용되었다.

실시예 2: 과다발현 균주의 생성

이타콘산-과다생산 균주 피. 츠쿠바엔시스 HR12를 전체 원형 플라스미드 pPTT-pActin-RIA1의 이종성 도입에 의해 생성하였다.

강한 구성적 Actin1 프로모터를 모든 과다발현 형질전환체에 대해 사용하였다. 본래의 프로모터 서열 및 오픈 리딩 프레임 (ORF) 서열 (과다발현될 유전자)은 서열 표에 열거된 프라이머를 사용하여 폴리머라제 연쇄 반응 (PCR)에 의해 피. 츠쿠바엔시스 H488의 게놈 DNA로부터 유래되었다. 이어서, 프로모터 서열을 중첩-PCR에 의해 각각의 ORF에 융합시켰다. 2개의 엑손을 별도로 증폭시키고, 1회의 PCR 동안에 프로모터 및 2개의 엑손 단편을 동시에 융합시킴으로써 ACO1의 ORF를 클로닝시켰다. 이어서, 중첩 산물을 절단시키고, 절단되고 이전에 탈인산화시킨 그에 따른 플라스미드에 라이게이션시켰다 (사용된 제한 효소에 대해서는 도 4 참고).

실시예 3: 피. 츠쿠바엔시스의 형질전환

형질전환 프로토콜을 [Gillissen, B., Bergemann, J., Sandmann, C., Schroeer, B., Boelker, M., and Kahmann, R. (1992). A two-component regulatory system for self/non-self recognition in Ustilago maydis. Cell 68, 647- 657; 및 Schulz, B., Banuett, F., Dahl, M., Schlesinger, R., Schaefer, W., Martin, T., Herskowitz, I., and Kahmann, R. (1990)]에 따라 조정하였다. 그들의 조합이 병원성 발달을 프로그래밍하는 유. 마이디스의 b 대립유전자는 호메오도메인-관련 모티프를 함유하는 폴리펩티드를 코딩한다. [Cell 60, 295-306].

피. 츠쿠바엔시스의 형질전환을 위해, 신선하게 제조된 원형질체만을 사용하였다. 원형질체를 수득하기 위해, 피. 츠쿠바엔시스 세포를 30℃ 및 220 rpm에서 3 ml YM 배지에서 밤새 성장시켰다. 다음 날, 1 ml의 배양물을 50 ml YEPS 라이트 배지로 옮기고, 0.5의 OD600에 도달할 때까지 적어도 3시간 동안 30℃ 및 220 rpm에서 성장시켰다. 세포를 원심분리 (3,500 g, RT에서 5분)에 의해 수확하였다. 세포 펠렛을 20 ml SCS로 세척하고, 다시 펠렛화하고, 2 ml 글루카넥스(Glucanex)^® (SCS 중 6 % w/v, 멸균 여과됨) 중에서 재현탁시켰다. 세포 벽의 효소적 용해를 위해, 세포의 50%가 원형질체 형태로 존재할 때까지 30-45분 동안 세포를 50 ml-팔콘 튜브 중에서 RT에서 부드럽게 진탕시키면서 인큐베이션하였다. 원형질체의 수확은 원심분리 (10분, 2,500 rpm, 4℃)에 의해 수행되었다. 펠렛을 20 ml SCS, 10 ml SCS 및 20 STC (빙온의 SCS & STC) 중에서 연속하여 세척하였다. 마지막 세척 단계 후에, 세포를 0.5 ml STC (빙온) 중에서 재현탁시키고, 최종적으로 1.5 ml-반응 튜브에 튜브당 80 μl의 부피로 분취하였다. 원형질체를 15 μg 이하의 원형 플라스미드 DNA (최대 부피: 10 μl)와 부드럽게 혼합하고, 얼음 상에서 10분 동안 인큐베이션하였다. 대조군으로서 DNA 대신에 10 μl의 dH2O를 사용하였다. 세포를 500 μl PEG4000 (STC 중 40 % w/v 폴리에틸렌 글리콜 4000, 멸균 여과됨)으로 덮고, 얼음 상에서 15분 동안 인큐베이션하였다. 그 동안에, 선택적 한천 플레이트를 제조하였다: Reg-배지를 액화시키고, 대략 50℃로 냉각시키고, 2배 농도의 히그로마이신 B (200 μg ml-1) 또는 카르복신 (50 μg ml-1)과 혼합하였다. 10 ml의 Reg-Hyg/ Reg-Cbx를 기본 한천으로 사용하였고, 상부-한천과 동일한 양의 Reg-배지 (마커 없음)로 덮었다. 원형질체를 부드럽게 플레이팅하고, 30℃에서 3-15일 동안 인큐베이션하였다. 형질전환 이후에 수득된 콜로니를 정제를 위해 선택적 플레이트 상에 스트리킹하였다. 이어서, 단일 콜로니를 이타콘산 생산에 대해 표현형에 의해 스크리닝하였다. 게놈 DNA를 적합한 후보로부터 단리하였다. 게놈 DNA를 PCR을 위한 주형으로 사용하여 각각의 과다발현 플라스미드의 통합에 대해 확인하였다. 이타콘산을 과다생산하는 균주 피. 츠쿠바엔시스 HR12를 그의 게놈 DNA를 시퀀싱함으로써 확인하였다.

시퀀싱은 강한 구성적 프로모터 pActin의 제어 하에 이타콘산을 위한 조절인자 유전자인 RIA1을 직렬 배향으로 벡터 백본의 일부와 2회 통합되었음을 나타내었다 (도 12 참고). 첫번째 카피는 82.2 %의 과다발현 플라스미드 (1,627 - 9,167 bp)로 이루어졌고, 두번째 카피는 85.1 % (1 - 7,804 bp)로 이루어졌다. 두 벡터 단편의 통합은 9개의 다른 ORF (Pseudog4087 - 4095)로 이루어진 대략 34 kbp 길이의 서열을 결실시키면서 Pseudog4086의 ORF에서 발생하였다.

피. 츠쿠바엔시스에서 ITA 생산을 담당하는 공지된 모든 본래의 유전자를 사용하여 각각의 과다발현 플라스미드를 생성하였다. Actin1 프로모터가 이전의 시험에서 전반적으로 가장 높은 관찰된 LacZ-활성을 입증하였기 때문에, 이 프로모터 서열을 ITA-클러스터 유전자 (이타콘산 대사 유전자 클러스터)의 과다발현 분석을 위해 사용하였다.

프로모터 활성에 대한 시험과 유사하게, 유전자를 pActin 서열과 융합시키면서, 동시에 프로모터-유전자 융합 산물의 5'- 및 3'-단부 둘 다에 제한 효소 부위를 부가하였다. 생성된 PCR 산물을 소화시키고, 이에 따라 선형화된 pPTT-플라스미드에 라이게이션시켰다 (도 4 참고). 생성된 플라스미드에 대해서는 도 13을 참고한다.

생성된 플라스미드 각각을 보디누스(Bodinus), 2011에 따라 피. 츠쿠바엔시스 H488 & M15 내로 형질전환시키고, 히그로마이신 B-함유 Reg-플레이트 상에 플레이팅하고, 30℃에서 3-10일 동안 배양하였다. 이어서, 형질전환체를 히그로마이신 B-함유 Reg 또는 YPD 고체 배지 상에 스트리킹하여, 순수한 단일 콜로니를 수득하였다. 이어서, 단일 콜로니를 3 ml-웰 배양물에서 ITA 생산에 대해 표현형에 의해 스크리닝하였다. 12-웰 플레이트의 각각의 웰에서, 스패츌라 팁 정도의 CaCO3 (대략 20 mg)를 첨가한 다음, 3 ml의 액체 MG-IA 최소 배지 (N: 1 g l-1; P: 0.1 g l-1; C: 15 % (w/v))로 충전하였다. 1 μl-접종 루프를 사용하여 각각의 웰을 단일 콜로니로 접종하였다. 웰 플레이트를 반투과성 막으로 밀봉하고, 30℃ 및 220 rpm에서 10일 동안 배양하였다. 3, 5, 7 및 9일째에 웰당 1 ml dH2O를 첨가하여 증발에 대해 보상하였다.

세포를 10일째에 원심분리 (4℃에서 15분 동안 18,000 g)에 의해 수확하였다. 생성된 말산 (MA) 및 이타콘산의 정량화를 위해 희석된 상청액 (1:200 - 1:2,000)의 이온 크로마토그래피를 수행하였다. ADI1의 과다발현은 기준 균주 H488, M15 및 M15-CAD와 비교하여 ITA 생산에서 약간의 증가를 갖는 총 4가지 형질전환체 (HA1, HA8, HA10 및 MA7)만을 생성하였다. 이들 4가지 형질전환체는 10일 배양 후에 0.2 - 1.0 g l-1 ITA를 생산하였다. 말산은 여전히 이들 돌연변이체에서 생산된 주요 유기산이었다 (도 14-도 16 참고).

이타콘산 수송인자 (ITP1)의 과다발현은 피. 츠쿠바엔시스 야생형 균주 H488에 대해 전혀 효과가 없었다. H488과 비교하여 유사한 양의 MA만이 검출되었고 ITA는 생산되지 않았다 (도 18 참고).

동일한 과다발현은 균주 M15에서 상이한 결과를 야기하였다. 시험한 12가지 형질전환체 중에서, 10가지는 증가된 수준의 ITA 생산을 나타내었다. 이들 중 3가지 MI8; MI9 및 MI11은 주요 산물로서 심지어 ITA를 분비하였다 (도 19 참고). 이들 3가지 형질전환체는 9.9 - 12.5 g l-1 ITA 및 6.7 - 9.0 g l-1 MA를 생산하였다. 동일한 수송 단백질인 ITP1을 과다발현하는데도 두 균주 사이에서 관찰된 차이점은 잠재적으로 ITA의 방출이 균주 M15에서 병목임을 의미할 수 있다.

H488에서 미토콘드리아 시스-아코니테이트 수송인자 MTT1을 과다발현함으로써, 1가지 형질전환체만이 증가된 수준의 ITA (0.8 g l-1 ITA, 5.3 g l-1 MA)를 나타내었다. 다른 돌연변이체들은 MA만을 생산하였다 (도 21 참고). 그러나, 동일한 과다발현은 균주 M15에서 상승된 ITA 생산율을 입증하는 몇몇 형질전환체를 야기하였고, 돌연변이체 MM8은 주요 유기산으로서 ITA (11.5 g l-1 ITA, 8.0 g l-1 MA)를 생산하였다 (도 22 참고).

아코니테이트-Δ-이소머라제 (ADI1)와 유사하게, TAD1을 과다발현함으로써, 균주 H488에서 뿐만 아니라 균주 M15에서 미미한 ITA 생산만이 (0.03 - 0.16 g l-1) 유도될 수 있었다 (도 24 & 도 25 참고).

2가지 효소 ADI1 및 TAD1의 과다발현에 의해 ITA 생산에서의 단지 적은 (있는 경우) 증가만이 달성될 수 있었다. 그러나, 상향조절된 수송인자 ITP1 및 MTT1의 도입은 보다 높은 형질전환체 생산을 야기하였다. 2가지 수송인자 중 하나를 과다발현함으로써 보다 높은 ITA 생산의 효과는 균주 M15에서 가장 현저하였다. 이는 미토콘드리아 외부로 증가된 시스-아코니테이트 수송 또는 ITA의 방출이 그 자체로 보다 높은 ITA 생산을 야기하지 않지만, 다른 인자가 이미 작용하고 있는 경우에는 증가된 ITA 합성에 결정적임을 의미할 수 있다.

피. 츠쿠바엔시스 H488 및 M15를 RIA1 유전자의 구성적으로 상향조절된 카피로 형질전환시킴으로써 ITA 합성에서 유의한 변화가 달성되었다. 모든 스크리닝된 형질전환체는 증가된 수준의 ITA를 나타내었다. 23가지 형질전환체 중 20가지가 주요 산물로서 ITA를 생산하였다 (도 27 & 도 28 참고). ITA 생산의 높은 유도에도 불구하고, 형질전환체들 사이에서 형성된 ITA의 범위는 상당하였다: H488 형질전환체의 경우 2.0 - 31.4 g l-1 및 M15 형질전환체의 경우 1.3 - 33.4 g l-1. 형질전환체 HR7, MR4 및 MR11만이 ITA에 비해 MA를 더 많이 분비하였다.

진탕 플라스크에서 생성된 형질전환체의 배양 및 이타콘산의 생산량의 정량화:

6가지 가장 높은 생산 형질전환체, HR8; HR10; HR12; MR1; MR2; MR8을 이후에 MG-IA 최소 배지를 갖는 진탕 플라스크에서 배양하여, 그들의 ITA 생산 능력을 추가로 특징규명하였다. 세포를 8일 동안 50 ml MG-IA 배지 (N: 2 g l-1, P: 0.1 g l-1, C: 15 % w/v)에서 배플형 진탕 플라스크에서 성장시켰다. 흥미롭게도, 형질전환체 HR12만이 스크리닝 이전과 비교하여 유사한 ITA 생산율을 나타내었다 (표 5 & 도 29 참고). 따라서, HR12는 추가의 연구를 위해 사용되는 주요 형질전환체이었다.

형질전환체 HR12의 특징규명

효모 세포가 탄소 공급원으로서 아세테이트 또는 에탄올에서만 성장할 수 있도록, 조효소 A (CoA)를 아세틸-CoA로 아세틸화시켜야 한다. Pseudog4086은 이 반응을 촉매하는 잠재성 아세틸-CoA 신테타제를 코딩한다 (AMP-형성). Pseudog4086은 플라스미드의 삽입에 의해 부분적으로 결실되었다. 에탄올/아세테이트 대사가 이 결실에 의해 영향을 받았는지를 확인하기 위해, 단독 탄소 공급원으로서 아세테이트 또는 에탄올을 갖는 최소 배지에서 세포를 성장시켰다 (표 6 참고).

야생형 및 HR12 사이에서 성장 거동의 검출가능한 차이는 없었다. Pseudog4086의 부분 결실에도 불구하고, 효모는 여전히 아세테이트 및 에탄올을 이용할 수 있다. 이러한 관찰은 Pseudog3222의 유전자 산물의 보상 효과에 의해 설명될 수 있다. 이 유전자는 잠재적으로 아세테이트-CoA 리가제를 코딩하고 (ADP-형성), 이는 또한 CoA의 아세틸화를 촉매한다.

또한, 피. 츠쿠바엔시스 HR12가 여전히 글루코스 이외의 다른 탄소 공급원에서 ITA를 성장시키고 생산할 수 있는지 여부는 불명확하다. 따라서, 효모 HR12를 탄소 공급원으로서 수크로스, 글리세롤 또는 D-크실로스를 갖는 액체 최소 배지에서 성장시켰다 (도 30 & 도 31 참고).

데이터는 시험한 모든 기질이 ITA의 성장 및 생산을 위해 효모에 의해 사용되고 있음을 명확하게 보여준다. 가장 높은 세포 밀도는 글리세롤 (OD600 = 45.6) 및 기준으로서 글루코스 (OD600 = 44.8)에 의해 달성되었다. 탄소 공급원으로서 수크로스를 사용한 경우, 가장 낮은 세포 밀도를 생성하였음에도 불구하고, 피. 츠쿠바엔시스 HR12는 7일 배양 후에 28.2 g l-1 ITA의 종점 농도로 가장 높은 양의 ITA를 생산하였다. 글루코스는 이타콘산으로 동등하게 빨리 전환되었지만, 24.2 g l-1의 보다 낮은 최종 농도에 도달하였다. 잠재적으로 지질체 또는 만노실에리트리톨 지질 (MEL)의 형태로 세포 성장 또는 저장을 위해 더 많은 탄소를 사용하였기 때문이다. 글리세롤에 의한 ITA의 생산은 초기에는 훨씬 느렸지만, 수크로스에 필적하는 양의 ITA (종점 농도: 26.2 g l-1)에 도달하였다. D-크실로스 상에서의 성장은 글리세롤의 경우와 마찬가지로 약간 지연되었지만, ITA 생산은 전반적으로 4일째에 16.6 g l-1로 가장 낮았고, 배양 종료 시 단지 17.5 g l-1이었다.

정량적인 실시간 PCR은 실제로 5가지 모든 ITA 클러스터 유전자가 야생형 H488과 비교하여 HR12에서 고도로 상향조절된다는 증거를 제공하였다 (도 32 및 표 6a).

과다발현된 RIA1 유전자는 H488과 비교하여 HR12에서 470배 더 높은 전사율을 나타내었다. 2가지 대사 효소 ADI1 및 TAD1 및 미토콘드리아 수송인자 MTT1을 코딩하는 유전자의 발현은 2,500 - 3,500배 증가로 더 훨씬 높았다. 이타코네이트 수송 단백질 (ITP1)의 발현은 약간만 증가된 것으로 보인다. 이는 전사가 HR12와 비교하여 H488에서 이미 비교적 높았기 때문이다 (데이터는 제시되지 않음).

데이터를 고려할 때, 분석한 모든 유전자의 발현 수준이 고도로 상향조절되었기 때문에, MTT1 또는 임의의 다른 ITA 클러스터 유전자를 추가로 과다발현하는 것이 불필요한 것으로 보였다.

예를 들어 아스퍼길루스 테레우스로부터의 시스-아코니테이트 데카르복실라제 유전자 (CAD)의 과다발현은 강한 본래의 프로모터에 의해 제어되었다.

도 10은 피. 츠쿠바엔시스 및 에이. 테레우스에서 이타콘산 생산을 위한 경로를 제시한다. 2가지 종 사이의 차이점은 시스-아코니테이트가 이타콘산으로 전환되는 방법이다. 피. 츠쿠바엔시스 시스-아코니테이트는 2-단계 과정으로 ITA로 대사되고, 트랜스-아코니테이트가 중간체이다. 이 과정이 에이. 테레우스에서는 단일-단계 반응이고, 효소 시스아코니테이트 데카르복실라제 (CAD1)에 의해 촉매된다. 피. 츠쿠바엔시스 형질전환체는 유. 마이디스 HSP70 프로모터의 제어 하에 AtCAD1 유전자의 추가의 카피에 의해 구축되었다. 그렇게 함으로써 ITA 과다생산 균주 M15-CAD가 생성되었다.

피. 츠쿠바엔시스에서 AtCAD1 유전자의 높은 전사를 보장하기 위해. 따라서, AtCAD1을 PCR 동안에 본래의 구성적 pActin 프로모터와 융합시켰고, 동시에 KpnI- (5'-단부) 및 NsiI-제한 부위 (3'-단부)를 부가하였다. 2,589 bp 길이의 앰플리콘을 KpnI- 및 NsiI 소화시키고, 이에 따라 선형화된 pPTT-플라스미드에 라이게이션시켜, pPPT-pActin-AtCAD1 플라스미드를 생성하였다 (도 33 참고).

원형 플라스미드를 피. 츠쿠바엔시스 H488 및 M15 내로 형질전환시켰다. 총 13가지 형질전환체 (균주 H488에서 4가지 형질전환체, M15에서 9가지)를 생성하였고, 그들의 ITA 생산 능력에 대해 스크리닝하였다 (도 35 & 도 36 참고).

모든 형질전환체는 여전히 주요 유기산으로서 말산을 생산하였다. 균주 H488에서 AtCAD1을 과다발현함으로써 ITA 생산의 유도는 관찰되지 않았다. 9가지 M15 형질전환체 중에서 7가지는 0.7 - 5.4 g l-1 범위의 더 많은 양의 ITA를 생산하였다. M15-CAD 형질전환체는 동일한 조건 하에 0.7 g l-1의 ITA 생산량으로 유사하게 거동한다.

강한 본래의 프로모터에 의해 제어되는 본래의 아코니타제 코딩 유전자의 과다발현

문제는, 하향조절된 ITA 대사 경로에 공급될 시스-아코니테이트를 더 많이 수득하기 위해, 형질전환체 HR12에서 ITA의 생산이 아코니타제를 추가로 과다발현함으로써 추가로 증가될 수 있는지 여부였다.

먼저 NCBI 데이터베이스에 대해 BLASTP 조사를 수행함으로써 각각의 효소를 확인하였다. 2가지 후보 유전자를 확인하였다: Pseudog3035, 이 유전자는 PtACO1로 명명됨, 및 Pseudog2814 - PtACO2.

ACO1 ORF가 인트론을 함유하지만, 상기 유전자는 인트론없이 증폭되었다. 상기 접근법은 상기 기재된 유전자에 대한 pActin 프로모터의 융합과 유사하였다: 먼저 2가지 엑손을 증폭시켰다. 제1 엑손은 pActin 프로모터 (21 bp)의 3'-서열에 의해 5'-단부에서 상보화되었고, 제2 엑손의 5'-서열 (20 bp)에 의해 3'-단부에서 상보화되었다. 따라서, 제2 엑손의 5'-단부는 제1 엑손의 3'-서열 (20 bp)에 의해 상보화되었다. 3가지 모든 단편, pActin (히그로마이신 B 내성 카세트에 의해 상보화됨)은 카르복신 내성 카세트를 보유한다.

본래의 ACO2 유전자는 인트론을 함유하지 않는다. 중첩-PCR의 도움으로, Pfl23II (5'-단부) 및 NsiI (3'-단부) 제한 부위를 또한 부가하면서 상기 유전자를 pActin 프로모터에 융합시켰다. 소화된 PCR 산물을 Pfl23II & NsiI 소화된 pPTT.Cbx-플라스미드에 라이게이션시켰다. 생성된 ACO1 & ACO2-과다발현 플라스미드 (도 37 참고)를 피. 츠쿠바엔시스 균주 HR12 내로 형질전환시켰다.

총 11가지 형질전환체가 수득되었다: 5가지 ACO1 및 6가지 ACO2 과다발현 형질전환체. 모든 형질전환체를 ITA 산 생산에 대해 스크리닝하였다. 1가지 형질전환체는 ITA의 증가된 생산을 나타내지 않았다. HR12ACO1-K5 및 HR12ACO2-K1은 균주 HR12와 동등한 양을 생산하였다. 다른 모든 형질전환체는 ITA를 적게 생산하였다.

피. 츠쿠바엔시스를 위한 최소 배지의 확인

가와무라(Kawamura) 등 (1981, 1982, 상기 참고)은 피. 츠쿠바엔시스의 배양을 위한 배지를 기재하였다. 이 배지는 피. 츠쿠바엔시스 야생형 H488에 의한 ITA의 생산을 위해 변형되었고, 원래 ITA 생산의 유도를 위한 필수 성분으로서 옥수수 침지액 (CSL)을 함유하였다. CSL이 다양한 조성을 갖는 복합 성분이기 때문에, 엄격한 표준화된 과정에는 바람직하지 않다. 따라서, 최소 배지에서 CSL을 대체하기 위한 성분을 찾을 필요가 있었다.

풍부한 YPD 배지에서 배양된 피. 츠쿠바엔시스 세포는 단일 세포 형태로 빠른 성장을 나타낸다. 배플형 플라스크에서 YPD 사전 배양물을 갖는 50 ml YPD 배양물에서 2일 배양 후에 이들은 OD600 = 68 이하의 세포 밀도에 도달할 수 있다. 효모 세포를 아스코마이세테스 친유성 효모에 대한 MG 최소 배지에서 사전 배양하고 (표 7 참고, [Mauersberger et al., 2001: Mauersberger, S., Wang, H.-J., Gaillardin, C., Barth, G., and Nicaud, J.-M. (2001). Insertional Mutagenesis in then-Alkane-Assimilating Yeast Yarrowia lipolytica: Generation of Tagged Mutations in Genes Involved in Hydrophobic Substrate Utilization. J. Bacteriol. 183, 5102-5109]에 따라 변형됨), 동일한 최소 배지로 옮긴 경우, 성장이 관찰되지 않았다. 성장이 없었던 날 1일 후에 효모를 YPD 배지로 옮겼던 경우에, 세포는 다시 급속한 성장을 나타내었고, 이는 세포가 여전히 생명력을 가졌음을 의미한다. 세포를 풍부한 배지 (YPD)에서 사전 배양하고, 임의의 YPD 배지를 전달하지 않고 MG 배지로 옮겼을 때, 세포 성장이 관찰될 수 있었다. 성장은 여전히 약간 지연되었다. 이는 미량의 특정 화합물이 세포를 최소 배지에서 성장시키는데 충분할 수 있음을 나타내었다.

MG 배지에서 성장이 유도될 수 있는지 관찰하기 위해, 피. 츠쿠바엔시스 H488 세포를 MG 배지에서 사전 배양하고, 신선한 MG 배지로 옮겼다. 세포 성장이 관찰되지 않은 날 1일 후에, 배지에 10 % (v/v) YPD 배지 또는 1 X의 복합 비타민 용액을 제공하였다 (도 42 & 표 8 참고). 두 경우 모두 세포 성장이 관찰되었다. 후속 배양에서 복합 용액에서 사용된 사용된 단일 비타민을 시험하였다. 8가지 비타민 중 2 가지인 이노시톨 및 티아민은 MG 배지에서 피. 츠쿠바엔시스 H488의 성장을 가능하게 하였다 (표 9 참고).

비타민으로서 이노시톨 또는 티아민만을 함유하는 MG 최소 배지를 사용하여, 피. 츠쿠바엔시스 H488을 5회 계대로 안정하게 성장시켰다. 효모 세포는 심지어 큰 세포내 지질체의 형태로 지질을 축적하였다 (데이터는 제시되지 않음). 그러나, MG-I 또는 MG-T 배지에서는 피. 츠쿠바엔시스 H488에 의한 유기산 생산이 검출될 수 없었다. MG-T를 일시적인 최소 배지로 사용하였다.

이타콘산 생산을 위한 배양 배지의 최적화

피. 츠쿠바엔시스 H488의 성장을 위한 최소 배지에 대한 기본 조성이 이 프로젝트에서 확인되었지만, ITA 생산을 보장하기 위해 배지의 질소 (N) 및 포스페이트 (P) 함량과 관련하여 그를 추가로 개발하는 것이 중요하였다. 상이한 N/P-비를 갖는 MG-T 배지를 시험함으로써, 성장 뿐만 아니라 유기산 생산이 상이한 N/P-비에 의해 크게 영향을 받았음이 명확하였다 (도 43 참고). 그럼에도 불구하고, 말산은 여전히 피. 츠쿠바엔시스 H488에 의해 분비되는 주요 산이었다.

MG-T의 조성은 탄소 공급원의 양으로 조정되었고, P- 및 N-공급원의 농도는 상이한 비를 시험하기 위한 변수로서 설정되었다. 또한, 술페이트 음이온이 ITA 정량화의 분석에서 교란하기 때문에, (NH4)2SO4를 NaNO3로 교체하였다. 이 배지는 MG-IA로 명명되었다 (표 10 참고).

피. 츠쿠바엔시스 H488은 이후에 50 ml MG-IA 배양물에서 배양하였다. 단지 소량의 ITA이긴 하지만, ITA가 피. 츠쿠바엔시스 야생형 H488에 의해 최소 배지에서 생산된 것은 처음이었다. 0.3 g l-1의 가장 높은 ITA 농도는 2/0.1 g l-1의 N/P-비에 의해 달성되었다. 동시에, 12.4 g l-1 MA가 분비되었다 (도 44 참고).

피. 츠쿠바엔시스 균주 M15를 동일한 배지에서 배양하였고, 2가지 N/P 비가 최상인 것으로 간주되었다 (N/P: 2 /0.1 - 5/0.1). MG-IA (N: 2 g l-1, P: 0.1 g l-1)에서 5일 배양 후에 균주 M15는 이미 유의한 양의 ITA (6.9 g l-1)를 분비하였지만, 말산을 더 많은 양으로 (9.5 g l-1) 합성하였다. 배양을 8일로 연장함으로써, ITA/MA 비가 티핑 포인트에 도달하였고, ITA가 주요 산으로 생성되었다: ITA: 14.8 g l-1, MA: 6.0 g l-1 (도 45 참고).

따라서, 피. 츠쿠바엔시스 M15를 ITA 생산을 위해 다양한 양의 N-공급원 (0.5-4.0 g l-1) 및 P-공급원 (0.1-2.0 g l-1)을 갖는 3 ml-웰 배양물에서 스크리닝하였다. 높은 양의 질소 및 낮은 포스페이트 농도에서 주로 MA가 합성되었지만, 낮은 내지 중간 질소 농도에서는 말레이트 생산이 크게 감소되었다. 보다 낮은 N-농도에서는 대신에 ITA가 주요 유기산이었다 (도 46 참고). 이들 결과는 질소 및 포스페이트 제한이 균주 M15에서 ITA 생산을 촉발시켰음을 나타낸다. N: 2 g l-1, P: 0.1 g l-1을 갖는 진탕 플라스크 배양물에서, 질소가 고갈되었을 때 ITA 합성이 또한 크게 증강되었고, 세포는 고정 성장기로 들었다 (도 45 참고).

후속적으로 ITA 과다생산 균주 피. 츠쿠바엔시스 M15-CAD를 2/0.1 및 1/0.1의 N/P 비를 갖는 MG-IA 배지에서 배양하였다. 8일 배양 후에, 균주 M15와 비교하여 ITA - 42.6 g l-1 (3.2 g l-1 MA)에서의 3배 증가가 달성되었다. 배양 종료 시, 초기 150 g l-1 중 20.9 g l-1의 글루코스가 남았고, 33 %의 수율 (g 이타코네이트/g 글루코스)이 수득되었다. 감소된 양의 질소 (1 g l-1)에 의해 보다 낮은 세포-밀도가 달성되었고, 이로 인해 25.1 g l-1의 보다 낮은 ITA 생산 및 단지 24 %의 수율이 수득되었다 (도 47 참고).

질소 양을 5 g l-1로 증가시키면 훨씬 더 높은 세포 밀도가 유도됨과 동시에 ITA 생산이 급격히 감소하였다: 15.5 g l-1 ITA가 0.1 g l-1 포스페이트-공급원에 의해 생성되었고 (MA: 2.9 g l-1; ITA-수율: 15 %), 24.1 g l-1 ITA가 1.0 g l-1 P-공급원에 의해 생성되었다 (MA: 0.5 g l-1; ITA-수율: 16 %) (도 48 참고).

기재된 모든 균주는 배지에서 질소 및 포스페이트 공급원 비와 분비된 이타콘산의 양 사이의 명확한 연관성을 보여준다. 상이한 과다발현 형질전환체의 스크리닝을 고려한다면, 형질전환체 HR12가 ITA 생산율과 관련하여 상이하게 거동한다는 것이 이미 명백하다. 피. 츠쿠바엔시스 M15와 마찬가지로 HR12를 3 ml-웰 배양물에서 스크리닝하여, 이 형질전환체가 특정한 양의 N- 및 P-공급원에 의존하는지 또한 시험하였다 (도 49 참고). 6일 인큐베이션 후에 형질전환체는 다량의 ITA: 16.3-24.4 g l-1 및 단지 적은 농도의 MA: 0.5-1.7 g l-1을 생산하였다. 이는 형질전환체 HR12의 상향조절된 RIA1 카피의 도입에 의해 분리 효과가 있는 것 같다. 이 형질전환체의 경우 ITA 생산을 유도하기 위해 필요한 N- 또는 P-공급원에 제한이 없다. 그러나, 더 높은 양의 질소 및 더 낮은 P-농도에서는 약간 더 높은 ITA-농도가 달성되었다. MA 농도 또한 이들 샘플에서 더 높았다.

질소 또는 포스페이트 제한 조건으로부터 ITA 합성의 성공적인 분리에도 불구하고, 상이한 N-공급원이 균주 HR12의 도움으로 ITA-생산에 영향을 미치는지가 여전히 불명확하였다. 피. 츠쿠바엔시스 HR12를 N-공급원으로서 NaNO3 (기준), NH4Cl 또는 NH4NO3를 갖는 MG-IA 배지에서 배양하여 잠재적인 관계에 대해 확인하였다. 생성된 [SO4]2--음이온 때문에 (NH4)2SO4는 바람직하지 않았다.

NH4Cl 및 NH4NO3에 의해 약간 더 빠른 성장이 관찰될 수 있었다. 세포 밀도는 NH4Cl에 의해 저하되었고, 7일 배양 후에 가장 낮은 것으로 관찰되었다. 그러나, 균주 HR12는 이 N-공급원에 의해 가장 높은 양의 ITA (7일째에 27.5 g l-1, MA&AKG: 0.18 g l-1)를 생산하였다. NaNO3에 의해 성장한 세포는 가장 높은 세포 밀도에 도달하였지만, 7일째에 더 적은 ITA: 24.2 g l-1, MA&AKG: 0.44 g l-1을 생산하였다. 성장 거동은 N 공급원으로서 NH4NO3에 의해 손상되지 않았지만, 형질전환체 HR12는 7일째에 상당히 적은 ITA: 13.2 g l-1, MA&AKG: 0.26 g l-1를 생산하였다.

NH4NO3에 의한 ITA 합성의 이러한 급격한 감소 거동은 놀라운 것이다. 이는 세포 덩어리의 양에 의해 설명될 수 없다. 생산된 세포의 양은 NaNO3과 NH4Cl 사이에 있다. 어느 것도 배지에 존재하는 질소의 상대적인 양을 결정하지 않는다: NNaNO3: 16.5 %, NNH4Cl: 26.2 %, NNH4NO3: 35.0 %.

NH4Cl의 경우에는, 세포 밀도와 ITA 생산 사이에 부정적인 상관관계가 있는 것으로 보인다. 이는 유익한 효과이며, 그러한 방식으로 더 많은 자원이 잠재적으로 세포 덩어리 대신에 ITA로 전환될 수 있기 때문이다. 따라서, MG-IA의 조성은 후속 배양에서 NaNO3를 NH4Cl로 대체함으로써 변화되었다 (관련 배양은 그에 따라 표시되었음).

발효기에서 가장 유망한 형질전환체의 배양 및 이타콘산의 생산량의 정량화

진탕 플라스크에서 효모의 배양은 작동상의 간편성 및 즉각적인 결과 제공 때문에 과학적으로 필수 불가결하다. 이 배양 방법의 주요 단점은 통기와 같이 특정한 영향을 미치는 변수의 제어가 없다는 것이다. 미생물이 더 큰 부피에서는 예상치 못한 방식으로 거동할 수 있기 때문에, 효모를 다량으로 (파일럿 플랜트 및 생산) 확실하게 배양할 수 있도록, 점진적인 규모 증가 공정이 필요하다.

ITA 생산이 진탕 플라스크 수준으로부터 확실하게 규모 증가될 수 있는지 여부 및 그렇다면 특정한 인자가 ITA 생산율에 어떠한 영향을 미치는지 여부에 대한 첫번째 효과를 얻기 위해, 피. 츠쿠바엔시스 균주 M15-CAD 및 HR12를 상이한 조건 하에 600 ml-생물반응기에서 배양하였다.

발효기 배양의 경우 세포를 글리세롤 원액 (25 % v/v) 형태로 YPD 플레이트에 스트리킹하였다. 이들 세포 (최대 4 주령)에 의해 50 ml YPD 배지를 접종하였고, OD600 = 25-35의 세포 밀도에 도달할 때까지 1 내지 2일 동안 30℃ 및 220 rpm에서 성장시켰다. 발효기에서 시작 OD600 = 1.0을 수득하기 위해 필요한 세포의 양을 3,500 g에서 5분 동안 원심분리에 의해 수확하였고, 3 ml 멸균 H2O 중에서 재현탁시켰다. 발효의 시작은 접종 시점이었다. 달리 명시하지 않는다면, 세포를 하기 조건 하에 배양하였다:

온도: 30℃

pH: 5.5 - 1 M HCl & 2.5-5.0 M NaOH의 첨가에 의해 일정하게 조정됨

통기: 55 % pO2 - 1 l min-1 공기 공급, 기포 형성의 경우에는 ≥ 400 rpm에서 동적 교반에 의해 조정됨, TEGO^® 소포체 KS 911 (에보닉 인더스트리즈 아게(Evonik Industries AG))이 자동으로 첨가됨

N-공급원: NaNO3 (또는 그에 따라 표지된 발효에서는 NH4Cl)

20 ml의 배양물 브로쓰를 제거함으로써 24시간마다 샘플링을 수행하였다.

광학 밀도 (OD600) 및 건조 세포 중량을 측정함으로써 세포 성장을 결정하였다. UV-시험 키트 (알-바이오팜 아게, 독일)를 사용하여 글루코스 농도를 효소적으로 측정하였다. 유기산 농도의 측정을 이온 크로마토그래피에 의해 수행하였다. 추가로, 세포를 형태학적 변화 및 오염물의 잠재적인 존재에 대해 현미경으로 관찰하였다. 배양물의 제거로 인한 손실은 추후에 수율, 생산율 등의 계산을 위해 고려되었다.

600 ml 생물반응기에서 피. 츠쿠바엔시스 M15-CAD에 의한 이타콘산 생산

균주 M15-CAD를 2/0.1 또는 5/0.1 g l-1의 N/P-비를 갖는 600 ml MG-IA 배지에서 배양하였다. 진탕 플라스크 배양물과 비교하여, N/P-비에 의해 ITA 생산율에 대한 명확한 효과가 있었다. 단지 2 g l-1 N-공급원에 의해서는 세포 덩어리의 양이 비교적 적었지만, 30 g l-1까지 더 많은 양의 ITA가 생산되었다. 생물량 생산은 5 g l-1 N-공급원에 의해 배가되었지만, 보다 낮은 N-공급원과 비교하여 ITA 농도가 단지 1/3이었다.

두 배지 사이에서 큰 차이가 있을 뿐만 아니라, ITA 생산이 진탕 플라스크에 비해 발효기에서 유의하게 더 낮았다. 2 g l-1 N-공급원에 의해, 진탕 플라스크에서 42.6 g l-1 (3.2 g l-1 MA)와 비교하여, 발효기에서는 8일 배양 후에 30.5 g l-1 ITA (1.0 g l-1 MA)가 생산되었다. 이는 진탕 플라스크에서 생산되는 산의 72 %만을 구성한다. N-농도의 증가에 의해 상기 효과는 훨씬 더 상당해졌다. 8일 후에, 진탕 플라스크 배양의 농도의 58 %만이 달성되었다: 8.9 g l-1 ITA (0.3 g l-1 MA). 이는 이용가능한 질소가 더 많을수록 더 많은 생물량이 생성되고, 따라서 더 적은 탄소 공급원이 ITA로 전환되는 것으로 보인다.

N/P-비를 4 g l-1 N-공급원 및 1 g l-1 P-공급원으로 이동시키면, 4일 후에 최대 25.6 g l-1 DCW의 급속한 세포 성장이 유도되었다. 그 후에 세포는 종종 신속히 사망하였다. ITA 생산은 5/0.1의 N/P-비에 필적하였다: 6일 후에 10.9 g l-1 ITA (1.1 g l-1 MA).

배양하는 동안에 배지 (N/P-비: 2/0.1)의 pH를 pH = 7.0으로 증가시키는 것만으로도, 유기산 생산에서 급격한 변화가 관찰될 수 있었다. 효모 세포가 pH = 5.5에서의 이전의 발효와 유사한 성장 거동을 나타내었지만, 6일 후에는 단지 3.4 g l-1 ITA가 생산되었다. 배양 종료 시 MA가 6.9 g l-1로 생산된 주요 산이었기 때문에, 심지어 유기산의 비가 바뀌었다. 이러한 경우에 생산된 생물량의 양은 문제가 되지 않는 것으로 보인다. 글루코스 소모율 및 생물량 축적률은 pH = 5.5에서와 매우 유사하였다.

ITA의 용해도는 pH-값이 높을 수록 증가한다. 이는 ITA의 생산을 용이하게 해야 한다. TCA 주기에서 시스-아코니테이트 합성을 증가시킴으로써 잠재적으로 ITA를 증가시키기 위해, 발효 과정 동안에 용존 산소를 pO2 = 90 % (통기: 2 l min-1)로 증가시켰다. 이러한 아이디어는 전자 수송 사슬에서 NAD+ 및 FAD-재생을 보장하기 위해 산소를 충분히 공급하기 위한 것이었다. NAD+ 및 FAD 둘 다 TCA 주기를 유지하는데 필요한 필수적인 전자 운반체이다. 이렇게 함으로써, 전반적인 ITA 생산이 크게 감소하였다. 6일 후에는 단지 7.0 g l-1 ITA 및 0.8 g l-1 MA가 생산되었다. TCA 주기가 상승된 산소 공급에 의해 실제로 더욱 활성이지만, 생성된 시스-아코니테이트는 TCA 주기에서 ITA로 전환되는 대신에 단순히 사용되었음이 가능하다.

균주 M15-CAD에 의한 마지막 생물반응기 배양 동안에 pH-조절이 차단되었다. 대신에 4 g l-1 CaCO3를 사용하여 pH를 유지하였다. CaCO3는 강염기 (Ca(OH)2) 및 약산 (H2CO3)의 염이다. 이는 물에서 불용성이다. 산 (H2CO3보다 강함)이 배지에 존재하는 경우, 그의 음이온은 상응하는 Ca-산 염 및 H2CO3 (최종적으로 H2O & CO2)를 형성하면서 카르보네이트 음이온을 대체한다. 발효 과정에서 CaCO3의 양만이 5.5-6.0의 pH를 유지하기 위해 사용된다.

이렇게 함으로써, ITA 생산은 다시 크게 감소하였다. 6일 후에는 단지 15.5 g l-1 ITA 및 2.4 g l-1 MA가 형성되었다. 이것이 첫번째 발효와 매우 유사한 발효였다는 점을 고려하면, 이는 정말로 놀라운 효과이었다 (도 52 참고). 구별가능한 유일한 차이는 pH를 대략 5.5로 유지하기 위한 방법이었다. 다시, 필적하는 양의 세포 덩어리가 형성되었지만, 더 적은 글루코스가 소모되었다: 첫번째 경우에는 96 g l-1 및 완충제로서 CaCO3의 경우에는 85 g l-1. 글루코스 소모에서 이러한 차이는 생산된 ITA에서의 차이와 유사하였다: 26.6 g l-1 (6일째) - 15.5 g l-1. CaCO3의 사용은 여전히 알려지지 않은 이유로 산물 형성을 손상시키는 것으로 보인다.

요약하면, 피. 츠쿠바엔시스 균주 M15-CAD에 의한 ITA의 생산을 위해서는, 이용가능한 질소 및 포스페이트 공급을 제한하는 것이 중요하다. 이는 진탕 플라스크 및 더 큰 생물반응기에서의 생산의 경우에 해당하지만, 최적 N/P-비는 상이한 배양물 부피마다 다른 것처럼 보인다. 포스페이트 제한은 이 균주에서 ITA 생산을 유도하게 위해 필수적인 부분이다. 이용가능한 질소의 양 또한 결정적인 인자이며; N-과량인 경우에는, 대부분의 글루코스가 ITA 생산 대신에 생물량에 대해 사용될 것이다. 추가로, 억제 효과 및 경쟁하는 대사 경로를 최소화하기 위해 최적 산소 포화도 및 pH를 찾는 것 또한 중요하다.

600 ml 생물반응기에서 피. 츠쿠바엔시스 HR12에 의한 이타콘산 생산

이타콘산 과다생산 균주 피. 츠쿠바엔시스 HR12를 600 ml 생물반응기에서도 배양하였다. 먼저, 균주 M15-CAD에 대해 최상인 것으로 고려되는 조건이 적용되었다. 초기에 150 g l-1 글루코스, pH = 5.5, pO2 = 55 % 및 30℃의 온도를 이용하여 효모를 회분식 발효로 배양하였다. 초기 N 및 P-농도는 각각 2 g l-1/0.1 g l-1 및 4 g l-1/1 g l-1이었다.

HR12가 M15-CAD와는 상이하게 거동하는 것이 분명하다. 웰-배양물에서 이미 확인된 바와 같이, HR12는 특정한 N/P-비에 의존하지 않고 이타콘산을 생산한다. ITA는 시작부터 발효 종료까지 일정한 속도로 형성된다.

더 적은 양의 질소 및 포스페이트 (N/P: 2/0.1 g l-1)의 경우에, 5일 후에 단지 90 g l-1 글루코스를 소모하면서 41.6 g l-1의 ITA가 생산되었고, 말산은 생산되지 않았다 (도 58 참고). 이는 ITA에 대한 8.3 g l-1 d-1의 평균 생산율에 상응한다. 세포 성장은 신속하였다. 이는 3일째에 그의 최대치에 도달하였지만, 급속히 쇠퇴하였으며, 그럼에도 불구하고 ITA는 계속 생산되었다.

도 59는 초기 N- 및 P-농도 (4/1)의 증가가 ITA의 생산에 매우 유익하였음을 제시한다. 균주 M15-CAD에 의해 관찰된 높은 N-&P-농도의 급격한 억제 효과 대신에, ITA 생산율은 66 % 증가하였다. 13.8 g l-1 d-1의 평균 생산율로 총 68.8 g l-1 ITA가 5일 과정에 걸쳐 합성되었고, 검출가능한 양의 MA는 합성되지 않았다. 이는 2-3일째에 그의 최대치에 도달하였고, 그 후에 천천히 쇠퇴하였다. 소모된 글루코스 및 생성된 68.8 g l-1 ITA를 고려할 때, 46 % (g 이타코네이트/g 글루코스)의 수율이 달성되었다. 세포 성장은 심지어 더 많은 자원이 이용가능하였음에도 덜 강력하고 더욱 꾸준하였다.

후속 배양에서, 상기 기재된 발효 (N/P: 4/1 g l-1)를 총 10일 동안 5일째에 100 g l-1을 공급하여 유가 배양식 발효로 반복하였다 (도 60 참고). 이전의 배양과는 대조적으로, 유의하게 더 많은 생물량이 생성되었다. DCW는 3일째에 최대에 도달하였고, 5일 째까지 이 양이 유지되었다. 글루코스를 공급한 후에, 세포 양이 감소하였지만, 발효 종료까지 천천히 회복되었다. 5일째에 글루코스는 거의 완전히 소모되었고, 대략 60 g l-1 ITA가 형성되었다. 이는 이전의 배양과 일치한다. ITA 생산율은 전체 배양 기간 동안에 11.6 g l-1 d-1로 거의 일정하게 유지되었다. 처음 5일 동안에, 무시할만한 양의 MA 및 α-케토글루타르산 (AKG) (누적 1.6 g l-1)이 생산되었다. 이 양은 10일 후에 3.0 g l-1로 증가하였다. 거의 30 g l-1 글루코스가 배양물 브로쓰에 남아 있었다. 전체 115.6 g l-1 ITA가 28 % w/w의 수율로 생산되었다.

도 61로부터, 초기 글루코스 농도를 75 g l-1로 저하시키고 매일의 공급 간격을 도입하는 것이 세포 생물량에서의 급격한 증가를 유도하였음이 명백하다. 놀랍게도, DCW는 5일 후에 크게 감소하였고, 그 후에 일정하게 남아 있었다. 글루코스를 더욱 자주 적용함으로써, 39 %의 유망한 수율과 함께 전체 ITA 생산율이 9.9 g l-1 d-1로 미미하게 감소되었다.

질소 농도를 5.5 및 8.0 g l-1로 낮추었을 때 유사한 최종 결과가 나타났다. 다량의 세포 덩어리의 양 (DCW ≥ 30 g l-1)이 축적되었다 (도 62 & 도 63 참고). 이타콘산 생산 또한 약간 증가하였다. 7일 배양 후에, 두 배양 모두에서 대략 90 g l-1이 생산되었다. N-농도를 4에서 5.5 g l-1로 이동시킴으로써, 수율: 36 % w/w (이전에는 38 % w/w)을 또한 지속시키면서, 생산율이 9.9 g l-1 d-1에서 11.5 g l-1 d-1로 증강될 수 있었다. 8 g l-1 N-공급원에 의해 생산율이 훨씬 더 높았지만: 12.8 g l-1 d-1, ITA 수율은 32 % w/w로 감소하였다.

도 64에 도시된 발효의 경우, 글루코스에도 불구하고 모든 자원이 초기에 보다 많은 양으로 존재하였다: N/P-비: 8/1 & 1.75 X 양의 미네랄 염, 미량 원소 및 티아민. 이러한 방식으로 ITA 생산율은 13.4 g l-1 d1 (수율: 33 % w/w)로 증가되었다. 7일 후에 93.5 g l-1 ITA 및 1.4 g l-1 MA & AKG가 합성되었다.

NH4Cl이 진탕 플라스크에서 유익하게 시험되었기 때문에, 그의 사용을 생물반응기에서 또한 분석하였다 (도 65 참고). 8일 발효 후에, 90.3 g l-1 ITA 및 2.3 g l-1 MA & AKG가 생산되었다. 이는 이타콘산에 대해 11.3 g l-1 d-1의 생산율 및 41 % w/w의 수율에 상응한다. 간단히 N-공급원을 전환시킴으로서 생산율 및 수율이 증가하였다.

유기산의 하류 과정을 위해, 가능한 한 낮은 pH에서 이미 배양하는 것이 매우 유익하다. 따라서, 생산율에 대한 보다 낮은 pH-값의 효과를 분석하였다. 저하된 pH에 의해 생성된 스트레스를 온건하게 유지하기 위해, 발효 과정을 5.5의 pH에서 시작하였고, 1일째에 4.0으로 감소시켰다 (그리고 각각의 배양에 대해 2일 및 3일째에 점진적으로 3.5 및 3.0로 추가로 감소시켰다).

도 66은 세포 성장이 중성 pH와 비교하여 4.0의 pH에서 발효 과정에 걸쳐 훨씬 더 제한되었지만 매우 안정하였음을 제시한다. 세포 형태학을 고려할 때, 세포는 크기가 더 작은 것으로 보이고, 더욱 빈번하게 가성균사를 형성하였으며, 낮은 지질 저장 활성을 나타내었다. 임의의 지질체가 형성된 경우에는, 그들의 치수가 pH 5.5에서 성장한 세포에 비해 작았다. 지질 저장의 억제는, 지질 축적에 의한 단일-세포 밀도에서의 변화 때문에 배양 후기에 이들 효모 세포가 부유하지 않았다는 관찰에 의해 입증되었다.

이들 결과는 이후에 거의 동일한 발효에서 확인되었고, 차이점은 1 g l-1 NaNO3를 7일째에 공급하여 세포 생존력을 잠재적으로 유지하였다는 것이다 (도 67 참고). 세포 성장은 처음에는 매우 신속하였지만, pH를 감소시킨 후에는 저하되었다. pH 조정 이후에, 이전의 배양에서와 같이 유사한 안정한 성장 거동이 관찰될 수 있었다. 9일 후에 최종 농도는 98.1 g l-1 ITA (생산율: 10.9 g l-1 d-1, 수율: 40 % w/w) 및 누적 0.06 g l-1 MA & AKG이었다.

pH를 3.5 또는 심지어 3.0으로 추가로 감소시킴으로써, 세포 성장 및 ITA 생산 둘 다 유의한 방식으로 부정적인 영향을 받았다 (도 68 & 도 69 참고). 7일 후에 48.9 g l-1 및 62.9 g l-1 ITA가 각각 생산되었다 (두 경우 모두 0.5 g l-1 MA & AKG acc.). 비록 평균 생산율이 단지 7.0 내지 9.0 g l-1 d-1의 범위이었지만, 수율은 31-38 % w/w이었다. ITA 생산율이 1일째 동안에 보다 높은 pH에 의한 배양의 경우와 닮았다는 것을 고려해야 한다. 두 발효 모두에서, 4일째에 ITA 합성이 거의 멈추었다. 이는 글루코스 소모에서도 관찰되었다. 이는 효모 세포가 이전의 발효와 유사한 속도로 글루코스를 ITA로 전환시켰지만, pH를 감소시켰을 때 느려졌음을 나타낸다. 3.5 및 3.0의 pH에서, 세포는 장기간 동안 ITA 생산 또는 심지어 기본적인 세포 대사를 지속할 수 없었다.

지금까지, 피. 츠쿠바엔시스 HR12가 보다 단기간의 회분식 발효에서 강력한 이타콘산 생산자임이 입증되었다. 그러나, 더 큰 규모의 생산의 경우에는, 연속 또는 반연속식으로 배양하는 것이 종종 비용적으로 더욱 이익이고 더욱 실용적이다. 반연속식으로 발효시킴으로써, 특정한 시간 이후에 배양물 브로쓰의 많은 부분이 제거되고, 신선한 배지를 이용하여 초기 부피로 다시 충전하고, 추가로 배양한다. 이는 더 긴 배양 시간으로 인해 더 높은 효율의 이점을 갖는다. 기질을 완전히 전환시키는 것 또한 가능하다. 추가로, 설정을 덜 자주 수행해야 해서, 관련된 위험 (예를 들어 접종 실패)이 최소화된다.

균주 HR12가 적합한 후보인지를 연구하기 위해, 반연속식 발효를 수행하였다. 따라서, 효모를 6/1 (N-공급원: NH4Cl)의 N/P-비에서 pH = 4.0에서 7일 동안 배양하였다. 7일째에 배양물 브로쓰의 ½을 제거하였고, 신선한 배지로 보충하였다. 도 70에 제시된 바와 같이, HR12는 전체 14일 배양 동안에 ITA를 계속 생산하였다. 심지어 보충 후에도, 생산율이 안정한 것으로 보였다. 종료 시 112.0 g l-1 ITA (0.4 g l-1 MA & AKG)가 생산되었다. 배양물 대체에 의한 산물 손실을 고려하면, 이론적으로 160.4 g l-1 ITA가 11.5 g l-1 d-1의 속도 및 35 % w/w의 수율로 생산되었다 (도 71 참고).

표 1. 그들의 염색체, 게놈 크기, GC-함량, 코딩된 유전자의 개수 및 생성된 단백질의 개수와 관련하여 상이한 비통상적인 효모 및 사카로마이세스 세레비지아에의 게놈의 비교.

표 2. 유. 마이디스의 염색체와 비교하여 피. 츠쿠바엔시스의 상동성 스캐폴드 또는 스캐폴드의 부분(들)

표 3. 피. 츠쿠바엔시스에 대해 이용가능한 보고된 강한 이종성 및 본래의 프로모터 서열

표 4. 피. 츠쿠바엔시스 HR12에서 결실된 유전자에 대한 단백질 BLAST의 결과. *Pseudog4086은 부분적으로만 결실되었다.

표 5. 50 ml MG-IA 최소 배지 (N: 2 g l-1, P: 0.1 g l-1, C: 15 % w/v, pH-조절 없음)에서 8일 진탕 플라스크 배양 후에 6가지의 선택된 RIA1-과다발현 형질전환체의 ITA 및 MA 농도 및 ITA 생산율.

표 6은 도면 단락에서 재현된다.

표 6a: ITA 대사 유전자의 유도

표 7. 아스코마이세테스 친유성/친지성 효모의 성장을 위한 MG 최소 배지의 조성. 이 배지는 피. 츠쿠바엔시스에 의한 ITA 생산을 위해 사용되는 최소 배지의 개발을 위한 기본이었다.

표 8. 100 X 비타민 원액의 조성.

표 9. 상이한 비타민을 갖는 MG 배지에서 피. 츠쿠바엔시스 H488의 성장.

여기서:

표 10. 다양한 농도의 질소 및 포스페이트 공급원을 갖는 MG-IA 최소 배지의 조성.

표 11. 서열 모음

SEQUENCE LISTING <110> BASF SE <120> Itaconic acid production <130> PF180378 (Rec 85746673) <160> 77 <170> According Wipo Std 25 <210> 1 <211> 51574 <212> DNA <213> Pseudozyma tsukubaensis <220> <223> preferred RIA1 expression cassette insertion region in Pse udozyma tsukubaensis <220> <221> misc_feature <222> (38477)..(38501) <223> n means a or g or c or t/u <400> 1 ccccctgact cgtcgctcac cgctaccacc tccgaagctg gtgtcaagaa cacgctgggt 60 gcaggtgacc gatcgtaccg cttcatggat gcgggcgctg cctttggtgg tcacgacgta 120 tttgacgaca ttccaggcga ggctcctaca gctcctggca cagctccacc ttcgcgcccc 180 atgtcgccag ccaatgcgct cgagcaaggc cgattgcgaa acaccgccgg cttgcccact 240 tcgtcgtctg gtcctgctcc gccttacata gcttcatctc gccgtgctgg cggcgtaagc 300 gagtcgtacg agctcactga tccgcccaac cgcatctaga caccccatgc attttcgttg 360 aaacagtgaa tcgtgctgtc ttctatctac tcaccacacc ctcattgcat tctcgttcct 420 tcaggcatct catcaaaatc attatccccg taacttagca ttctcggaca ctaactattc 480 atctctctct acatagcttc catcgcaatg aatcttgcat cttacccatc tggagctgtc 540 tatgagtgcc gatcgtgcct gccatgcaac tagcttgcgg atgcagtatg ccttgatccg 600 tgtcgtcgag gattgaaggt gtgaacatgc caacaacgca aacagagacg atcagaatgc 660 aagtacggaa tataatgaca ttatgacgcc aaatcgcagc gctacagacc agtggcggag 720 tggtcaatcg cgcgaggttt aagcgcgatg ctgattttat ttctcgtcct tcgggttcgt 780 gggttcgaac cccacctggt ctattcgagt ttttttttcc cttacttccc ttttcaaccg 840 tttcgtcatc accactcatt cgcattcttg ttgctacgca tggcacatga tgtatggtct 900 ccatctgaag ctgcaggggt atatgtattg cgtcatgaag ctgctttcga gttggaacgc 960 tgtgtgtgaa agtcgtaaat gatatcggcg gcagctttca tgccggcctg gttggggtgg 1020 tatgcgcatc tgtttttgaa gttccagaac gagccgtctg atacccaagg ctcttttgat 1080 ccgagtgcgt gcttgagctt gctctcttct gctagcggaa cgacatagac gttattcctc 1140 ccttccgctg ccttggcgta gagcgattga agctgttcgg ccatctcgat gtacttttgc 1200 acttgttgct gatcccaaca tacgtccctc cacgcttttg tatcgggtcc catcatggcg 1260 tggtattcga ccaggtagat cgtcgctttt ggatactttt tctggacgcc atcgatcaag 1320 gttgcgaatc tttgggagat ctcgtctggc gaagcgatgg tggggtgttc aaagtgctcc 1380 ttctcttctt tcgacaagac aaaatacgac aacaatctac cccaccatgt gttcttgaac 1440 gtcagaccga acatactccc gatgtagaac atgtcattgc ccccaccggt gatcgtgact 1500 atcgcatcgc tgccatcatc tccttcctta agttcgggaa gaagacttag ttgaggggcg 1560 tagactttct ttccagtatc ttgcggttcg gagatcaaat tgagtagcgt cgcacttgac 1620 accgaaaggt cgagaaattc atccgtgttg ttcgggtcga gattgagtct acgcgccaag 1680 tagttgggat agttgtttgc acttcgacca gcgtcagtgt ctacttgagg agggatgcct 1740 ggcccagcgg cgaacgatga gcccaacgcg atcaaccttg tcatttggac ttgttatggc 1800 acagtgttga tattgccaag atcgacgtcg aagatgcaat gatgaagcaa aacggagcga 1860 agtgcaaaca gggtctcgat aagatgaatt gacgagttca aaggaagggt tcccgatatg 1920 aagactaacg acttcatcgg caggcttcta gcggaaaccg gactggataa ggcgggcagc 1980 gtgtaggtgg gtctgtgcgt ttgcgtcaac cccgcatttc ctcggcaaag aaaaagcaag 2040 aaatttgaga aaaaggcggg aaaattgtaa cacaggctaa ggaccggttg tcggaggtca 2100 aattgaagcg ttgagccggt acgacctaga gaatggggaa actcatcacc agccgtgtca 2160 ttctcttttg ctgaggttgt gatcagattc tcatctacat agcttgtcgt tcgaagcaac 2220 cgggcactta ttctacctct atgcgtccat catgatgaat cttcgcgagg ctgtgtaccc 2280 atgggtacat ttgggcgaag aaaggacgtc gcacgaccga cagcctaaga agcatagcgc 2340 accaaagtaa cggttgaatg actgcaaatg tagagccgtg tcaagttcgc gatcatagcc 2400 gaagcgagtg agggatgtct cgagctatgt ggccggcatg ttctcagtgc cccgcaattt 2460 tttgtgtgtg ttcttgtggc acgagcaatc ggctcaaccg agtctgcagc aaaactgagc 2520 catttacccg tcgtggccga cttgaccgtg tgcgagccaa gagcaagccg aaaacgtgag 2580 tcttcgccga gtctcttcct tcctttgctt cactaacatc agtagccgtc actatagatc 2640 ccttatgagc agctagccgg cagattttgg ctgcgtttcc tccccaccat catcgcattc 2700 ctgcatcacc ttgcctactc cgtcacgatg ccctacacac caccacgttc gtcgcagcct 2760 cctaaaggtt taccctttga gctttcgctc tcgacgcatc ccggcgcgca gcacaaccga 2820 tcttcgctca cacccgtgtc gttcctcttg cgtgccgcgc tgattacgcc tcgcaaattg 2880 gcaatcactc atcctgaaaa gggctactca ttcacctacg agcaatgggc agcacgtact 2940 ctctcgctcg cctttgcact tcgcagcctt cccgccttca agattggtga tcgcgtcgct 3000 gttatctcgc ctaacgcacc tctgatcgca gacgctcact ggggtattcc tgctgttggt 3060 ggtatcatta cgccgatcaa cattcgaaac acgcccaagg aggtcgctta cgtcttggag 3120 cactcgggta gcactgtaat cttggtcgac cacgagttta cacacctcgt ccccgagaac 3180 cctggcccag gcatcaccgt catcgtcagc aaagattcgg gaggacaaga agctgacgat 3240 ccatacgaga aatttctcga tcgtggcttc ctcgaatggc agcgtgctga gcaggctgag 3300 ctcaaagcct acaagtctcg cactcgacct tctgctgaac caaagacggg atggaaactc 3360 atcgaggcgc ctcaagacga agaacaaccc atcgccctct gctacacctc gggtactact 3420 ggtcgaccca aaggtgtgct cactaaccac cgtggagcct acctttctgc cgtagccaac 3480 gcttttgaag cccacctcac gcaggatagc gtctatcttt gggttcttcc catgttccat 3540 gcttgtggat ggacgtaccc ttgggctgtt actgcttctc tcgctacgca tttcaccatt 3600 cgcaaggtcg acaacaccgt tatctgggac gcgttgctca atcacggcgt atcgcactac 3660 tgcggtgccc ctacagttca gatcggcctc gtcaaccatc ctaacgcacg caagctcaac 3720 cgtcgcgtga acgttgccgt cgcagcttcc gcacccaccg ccaacctcct cgccaagatg 3780 gagggtctaa acttgcaccc agtccacgta tacggcttga ccgaaacata cggtcctttc 3840 accaggaggt acttcgagcc cgaatgggcc aaactagatg ttgatgctcg agcacgaatg 3900 atggctcgcc aaggacactc ctacctcact tcagatgagg tacgtgtcgt tcgtactgct 3960 tcttccaccg acgcctctac acctgacctc gtcgatgttg agcgcaacgg tcaagaaacg 4020 ggcgaaatcg tcattcgagg aaacatggtc atggtaggct actacaacga tcccgccgcc 4080 acttccaaag ccgtcatgaa aggctggttc cacactggcg acctagccgt ccgtcaccct 4140 ggcggcgaaa tccaaatcct agaccgaggt aaagacatca tcatctccgg aggcgaaaac 4200 atctcctcgc tcatggttga acaggaactt gcctcccacc cttccgtcct cgaatgctgc 4260 gtcattgcac gaccgcacga aaagtggggc gaacgcggcc agtcgtttat cgtgctcaca 4320 gaacaggcga aagcgaaact caacttcgca gagataaaaa agaagggttc accggagaac 4380 aaggcgtttg ttgaagaggt gaaaaagcac tgcgtggaaa ggatgtccaa attcgccgta 4440 ccggaatggt tcgacgtagt ggacgaattg ccaaagacaa gcacgggcaa ggtgcagaag 4500 aacgtgctcc gagctaggtt cgctagtaag ttgtaaaagt agatcgtgtc gcgtggaatg 4560 agagcaatgg aagtgtcatc tattcttggt cgatgcaacg gtgcgatgtg tgtctcttgg 4620 atgcgtcggt aacgtgcttt tgacaacttc gagaagattc acccgacgac agagggtaat 4680 gcactgacaa gcgcatagca cggaggggca aagagctgcc tcaacagccc aatcctgtac 4740 gaccatacga gcaagagtga gacacgtctt cattgtttga cacgaagaag tttacggcaa 4800 ggaggtaact ttttttacgc cagagaagga tggttcgttt ggtggtggag ccgcgcttct 4860 ccgcacagcg agaagagggg cgtaggtgtg ggggaggaca gtccaagtcc aagtccaagg 4920 tgtcgcgtga aattgaccga ttttggcagg ttttgcggct ttgtgcagat cactttcaaa 4980 agccgccgcc gccgccgcct cctgcgccca gaacatgtgt ggagttttcg tttttcgctc 5040 gtgccacctt ttccttctct ttgtgtcgta cattacatcc actcaacctt ccttctcatc 5100 cttccacctt tcgttctctt atttctatcc ttctcaccat caccaccagc ttccacagcg 5160 tctatcggaa ccatgacttc catcctgcgc gacatccttt ccacctacgt cacaggtggt 5220 aaagacccct tccgcaacct ctcgtacgcc gctgtacccc tctccctcct cctcgctgcc 5280 ctccctcact ggtacaccat ctaccttgcc gaatcgaaca aagtccaagg aggatggagc 5340 aacgtcaacc cccgcttttg ggtccaaact ctcaccgcca aggctctcac caagaagttg 5400 accccgcttg aaaaccagat tttgaggggt caaagttgcc aagccaacgc gtttgagaac 5460 gtgccgctgt tcatcgccac cgttgtatgg gcgaacgtaa gcggcttgga gagggaaacg 5520 attaacaact ttgtagtggg atatctggta agcagggctg cgtacacggt gttgtatttg 5580 aagacggagg ggtatgcgaa cagttttgct aggacggcgg ttttccaagt gggaatcatc 5640 tggattatta ccgtttggat gaagggggct tttaggggtt tgccgctcgt caagtgagcg 5700 tatgatcgag gcgagaggag agggagctag gaaagaagga ttggcaaacc catagaagca 5760 cagagtggag agcgaacaag gggtccacac tcaagacgta acgccccgcg aatcagcccc 5820 acgcttcgct ctcactctcg ttcccctcct caaatctaca ctgacgatag ccaagcagca 5880 atcacacaaa agttcgaacg ttcgagtata agacagctat ccgtttgtgc acaacagcat 5940 ttgagttgcg atacatcttt ctcttgacaa gaaactaatc attgagcacg ggtgaaaaca 6000 cttagtaaga cagactcttc tccagaatcc tagccaagtg ttcgtggcca tcgctgccca 6060 tcacgtcacc gatacccgga gccaaatcca acaccctcct ctgtggaatg gttcctttta 6120 cgagggcctc cacatgttcc tgcccgtacc cgatcttagc cagacccctc ggcacgccca 6180 agtcggccaa gaaggacgcg atcctatcgt acacaagtgc accaacctcg gagtcgggca 6240 gacgagcgat atccgtagcc tccgcaccgc tgtcgtaacc cgcaaaaata gctgctacgt 6300 cacggtgacg gtcgggcgcc gaaggcgccg taaagtcaaa tactgcaggc ccagtcaaag 6360 cgaccgagat accgtggggt acgatgggat ggtccacctc gtaccccggg tgctggtatt 6420 taccaaattt cttgttcaac cccgaaatag ggtagctcat gccgtggcaa aggtggacgc 6480 cagcattacc gaatccaata ccagcaaacg tggaggccaa aagcatctgt ccacgggctt 6540 caaagtcggt tttgtccttc gcaacgcgcg ggaggtactt aacggtctgc ttgagcgccc 6600 agagggagaa aacgtccgag atggggttac gtccttggta agcgggacgt tggagcgggt 6660 ttgcggggcg aggcatgcgt tcgttgtacg ggatggcggt gtacgattcg agtgcgtgga 6720 acaacacatc caatcccgaa ctgatgtgga cggcggtagg gcaagtttcg gtgttgagag 6780 gatcaacaat acccaacagg ggacgaaggg ctcgggaggc aataccggtt ttggactcgg 6840 tagcggtatg atcaaagatg gctgtaccgg tggtttcgga tcccgtacca gcggtggtgg 6900 gaacgcaaag cagaggcttg agaaccttgt cgatgggggt accacgaccg ataggagcgt 6960 tgacgaattc gagcagatcg gcgtcagggt agcagctgaa aaggttggcg actttacacg 7020 tatccattac cgatccacca cccaccgcca aaaagtggga gaagtcctgt tcacgtgcga 7080 acctgatcgc tgcctcccaa ctcttctcat tcggctccac cctgacctga tcaaagatct 7140 cgtacttaac cccagccttc tctagtccat cgatactctg cttcatcgcg gtcagattcc 7200 tcaccgttgg atcggtgaaa acacccacct tcctcgcctt catattggcg aaatccatac 7260 cgacttcctt ggtgacacct tcaccgtacc taatgttgga agcggcaagt tcaaaggcgt 7320 attcgcgttc aacggcgtga tcgacgggag tggcgtatcc gcgtgcgttg gcaccaggtt 7380 gagcattgtg tttggcaatc atgttcattc cggcacgagc gaggttggct ccaccccgag 7440 caaccgagca tccgtgacag gggcatccac ctgcatgcga catgcgcatg aggttggcga 7500 tggagctacg ggaagctggg cctggtttgg gcattgttgc tgcgatgaat cttcactttg 7560 gggtcgatga agaggcagaa aaaaggaagg gtaatgatga agaagggaag agaaaggcaa 7620 acgaggcaag ggcgaaagag taaagtactt tggtgtgtgg agacgggaaa tgggggatgt 7680 cacgagaaca cgatccttgg agtgcagggc agacaaagac gagattccgg ggaatgggtt 7740 gccaggttgt aatgtagcgc agagaggtca tgcggggaag gggccgagtt gccgacagag 7800 taatcatccg ttcttgaagg cagtagagca cagtggtgtt atggcgatgc ataagcggta 7860 ctgtaattga cctttttatt cgcctttttc cgccttctcg ctttagccgg tgccggtggt 7920 gcacggttac gaaagagcga cagcagtcag tgacagcagg gcagaggcag agcgcgcgtc 7980 gaaaatagac atccacgacc acatacgaca aaagcggagt cgaaaacagc tcagacacac 8040 agagaggaag aacgagggct cgtgcggggc acagcacggg tctatcggtt cttccaccga 8100 agaaggatac atcttaaccc gcttctacag ctgcggagaa aagggtatat acgcacgtcc 8160 ttgttacaca cgacatcgat ggcaaccact cccgattctg acgagttgac gatcgtagcg 8220 atatgcacct gaaagctttc agtgctcctg cttgacagca tgcatgctcg gctgtcaaag 8280 agagcctcgt ccacatacaa agcgaccacg tcagtgaagg aaagatggta tgataaatga 8340 tttcgttgtg tggggggaat ttgcaagtga atggaactct ataacaggtc catcagatag 8400 tgtccgtgtt cgtaagcatc ctcgaccagc aagagatgcg tatatcagtt ttgttcgtgg 8460 tgagtatcac ccggtgtcat tgaaaacgag aaggccaaga ccagctcaaa gcaagctcaa 8520 ggcgaaagca agcaccgctc ctgctcctag agtcacaacc ccacccgtga ccatggacga 8580 tgccgaactc ttcgacccag cactgcttcc actaccaccc ttcttcgccg tactgctcgc 8640 actgctccca ttgttcgccg ccgtcacgtt cgcagcaccc gtcggcatct cctggaacaa 8700 tctatacagc gaaatgttgt acgacaacat ggcgtaatcc tcgtgcgaaa cattgggcat 8760 aaagttagcc gtctgcgtca cgggcagctt cccattcccc gtcaaactgg cgagcgattc 8820 aacaaagtga catcctcttt cgaggtggtt tgcgccttgc agagaagctt cgcatgcggt 8880 atcgccttga ccgttgtcga ggaggccgta gttgtagtgg acgttacgcg attcgaacgt 8940 ggtcaggagt tgctgtttgt tgttcttgac acggtcgcga gcgtagttgg ggacgccgga 9000 gccatcgagg ccgtacgccc agtcgtctgc ggtggaggcg cagctggtgt tggagttgtt 9060 gggacgagag gaggtgagcc agacgtaact gccggggttg ccgacccaaa agatgatgtt 9120 ggagtcgtag gcgtcgggtt tcttgacgac agagtagcgt tggaccattt gggcgcccat 9180 cgagtgaccg gccatgacga cggtgttgag ggcggggaag gtggttttgt cgaagagtgc 9240 atccatgaag gagtccataa cctgataaga cgagatggcg gtgttgccgg gtcctcgcga 9300 agccataccc gattgccact gcgatccgtg ccagtacagt tcgccagact ggatggcgcc 9360 cgctttggca tcatcggaat tcatccagca gggacccaag atcagcactt gatcttttcc 9420 aagtcttcca ctgtcatcgc ctgtagtcga tccgtccgca ctgctaccag cgctctgcgg 9480 gttggtctcg aacacattca acgcgttctg gatgagcgaa gtgtacttcc agcaatctct 9540 tggtttgcct ggcatgatca taacagctct cttgatcttg gtagcgtcaa atccttgggt 9600 ctggtagaaa ggcatcacag ctccaggtgc aacagcaaag gtgcggttga gcgtcatacc 9660 ttggatctcg ggtaatgctt gccagcctcc atcgacgctt ccgttgactg cggcttcagg 9720 agtgaaaggc acattggcgt tccaaggaag ctgcgtattg tccgggacaa tgttgtagcg 9780 gtaaagacct ccggtagcgt attggcctgc gatgtagggg agtgcattgg cagctttggc 9840 agcagcaaca ggatcggtga aagcttgttg atagatggct tcttgagaag cggtgctgcc 9900 gttagggttt ggggatgatt gtctgcggtt atggagcttg gaaggtcgat acgaggcgtg 9960 agaggaaggt tcggcgatga cggtcgaggc agaggcgagc aaggtgagag ccagcaccaa 10020 ggctgatgag gatgcttccg acttcatgat tggtggtcct tcttcctcag tgaggtgttg 10080 tgagagatgg cagaggtctt agttgtggtg acggtggtgg tgaggaaggg aagggaggat 10140 gaaaaagtaa ggaaagagta agaagcgacc tcggatgtgc cgctacgtca gatgagctct 10200 ctcatcattg gtgttcgata gaagcagaaa gggctgcaga agcaccaatg atcgtcaggg 10260 acaaacgtca caaagggcaa gaaaagaaat acaggcacgg gagccaagca tgcatgtctc 10320 tgcgccaaga tgcttctttc ttgtggtgct tctgttgctg attcttcgct cccctccttc 10380 gcctccgtgc ttttctactt cggctgctgc cgaggatcaa cggaggtgcc gcgaaagatg 10440 cagcgttggt tctgctgctt ctacgtctcc gaagcatctc atgcgatatg aaacaagaaa 10500 gcgagaaagg ggcatcagcg aaaacggaga agcgagaagt gaggaggcgg caaagacttt 10560 gctccattca gctgagctcg aaaacccggc actgttacac tgtaccaaat cacgctgcat 10620 gtgtggttgt gtgtgtgttt caactctgca tcacatgcac atctgcgctt gtctaagtca 10680 ctgtttgcga atgtggaatg ctgcgctgca gtgtctgtcc gagcttatcg tgagacttcc 10740 atcggaacct gtcactgttg ccagcagcag tgcagtagtg cagcagcgcg gtgaaatttt 10800 caaggagaga cgcgttccga caatcctctc ctctcctctc cctttgttcg gcagattcgg 10860 cgcgtactcc gctcccgtgc ctttgccata ttcaattctg tcggcacact tccgagatga 10920 tcggcatcga cagcaatcca aagctcgagc gcacaacttt gcagccgttt gaggcgactg 10980 acgatacaga cgttcacgca cagcatgatt gacaagtgag ctcggaagcg aagagaggca 11040 atgcagaatc gctgtctcga aagcaacacc aagaccggag aaaaacacgc tgcccagaag 11100 cttggcaatc tgcacatcgg tgaaagtaac actcagattt ctctcggcgc tgcaagcctc 11160 acttctctct tctttctttg tcccgattga atttcgattc cgtttccaat atttggtgat 11220 ctgagcttac atcgggcgga gaaagcaata caccatgctg agtgaagagc ttcactcgca 11280 gtcaacaggg ttaggagcaa cggcaccttt agcgccctga tccttagcgt cgagggtagc 11340 catgtcttcg tcgtcgagct caaagttgaa gacgtcggcg ttggaggcga tacgcgaagg 11400 tgtgtccgac ttgggaagag ggacgaagct gttaggacaa acgatgtgtg cacagcaaag 11460 aggtcagtac tcagataaaa agagagcttg agagaatgaa gcaggacacc gctgaactca 11520 ccctttctgc aacgaccatc ggatcaacac ttgcgaccag tccaccttgt gcttggcagc 11580 gatcttgagg agttcttcgt cgtccttgtg ctcgcctcga acgattggct gcaatacaca 11640 tcaaagaaat gcacagaatg tcagttgtct tccctcgcac agattacaat gaaagggaag 11700 agtgggagag agggagagta acatacgcag taagcctgga gaacaatgtt gtgcttcttg 11760 caaagctcaa cgatcggacg ctgctggcac caaggatgaa gttcgatctg gttgacagcg 11820 ggtgtctcgc cggcgtcgat gagttcttgg aggtgcttga gaccgctgtt gggatccatg 11880 caaaggaaga aggattctgg tcagcatcac ctaagccttg tagccaatga caattgatgg 11940 gagctactca ctagttgcta acgccgatag taacaacttt gccttcggac tgcaactcct 12000 tgagcgcttc ccagaggtgc ttgcgtccct cgggacccga agtaggcgtg tggatgagga 12060 agcagtcgac gtagcctgtg gttccagagt tactcgtttg ttgatcagca ttgcatctat 12120 catcgaatct ggaaaggtta aggagggaga cttaccatcg aggttaatct tcttcaccga 12180 ctcgcgcaac gactcgagcg tctcctcttt cgtcttggaa gggaagatca ccttggtcgt 12240 cacaaagata ccacgacgcg agacctgctc ctccttgcac cactgtcgaa cggcgtcgcc 12300 gactctaaga tagcaccaat gcgaaaagag tcaagagcaa aaccgtcagc atcgtctttc 12360 ctttcctcta agtcagctgg aaaagcggga agggccgcac tcactccttc tcattctcat 12420 agtactgcgc cgagtcaatg tgcctgtatc cagtcttgag agcggtagtt accgagttga 12480 cgcaaacatc cgaaggactc aggtagacgc cgaaacccaa aacgggcata tcgacgccat 12540 cgccgagcga gtaagttgac tgcagagtaa gcttcgacat cgtgcgtgct gctgtgcgat 12600 gtagtagtcg ggtggtaacg atacgaagaa tgatgtatga atgagaggag gaaaagaagt 12660 tcaggtggaa ggggaacaga aggtgtggag aagaagctca gcaagggccg tgcgtcaaaa 12720 ttggagaaga agattggacc ctgaaaatgc tgcacgagtt ggtcagctgc gagcaagggc 12780 gatcttggtc tgcatggcac gcgtcggaat gagattttcg cttgacgaga ggaccacctt 12840 tgacgctgag taggtcacac aacgttgatg gggcaagttc aagcttgtcg cagagcatgc 12900 ttcagtctct tgttcgtcct ccgaaacggc tagaaggatt cggtcgatgg gggaggaaac 12960 aaggcagcac gaaaggaaag gaccgatggc agtctaaatt gatactgaga aattagacga 13020 agcagaaatt gcgaaataaa ccggcacaaa aaaccacgaa aaatcatcat agaaaaagca 13080 tcacagcccc tgtcaaaccc taagttgacc ctcagcgata ctgacgagaa gtacgtcaac 13140 atggcgacta tctcaccatc aagcctgctt tggcttctcc ggcttcgctt caaccttggg 13200 ctgcggctgt gttggcggtg gcgtcgttgt cagcccacca tcaggtaaag gtaccaacgg 13260 atcgttcggg tcgaattgtc caccaccacc tcctgttgct gtctcaccgt caccgcggcc 13320 tcctgtttgt gctcctccgc tagtacctcc ttggacggcc gccggctttc ccttggttgc 13380 agccccattc ttgcccgcgc catcgttccc tcccgccttg ccgccgtcgt ccagatcagg 13440 ggccgggacc gtatgcagcg tgtacccgtc gcttcccttc aacgccatac agaagcgatg 13500 caagtcgaag ggaggttcgt ctagccaacc tttgacgagg tgtagggggc aatcggcgcg 13560 gactgcgaga gtgagcttgt tttcgcagta gtcttggaat tctgagatcg cagcttcgag 13620 ttcggggtct tcggaaaagg tgttatcggg aggattatcg gcagttgtgg tggtggtaga 13680 gcccaacgga cgaggtgtag taccgtgagt cgatgcgaca gggttgatgt ctggcttcgt 13740 ttcggagtcg ggaccaggga tccaaggatc attgggatcc gcgccgcctc tctgaccagc 13800 gtcgttagcc gtggtcgttc ctgatccagt cttcgtacct tcttgttgct tactttcgtc 13860 acgcttctgt aaagccacca accctgcatc ttccccttcg agccctatcg actccatctt 13920 cttatgcatc ttcttatgct tctttctacc taacttccca cttggcgcct tacccttacc 13980 cgcatgcaca cctcccaagc tcatactttt gaccccgttc ttctccctca cagcatcaca 14040 cctctgacac gtaggtagcg ccgtgtgaca ctggacatgc tccgtactct gaaacgccac 14100 cagcgtgtta caccaagcga tcgccttatt cgtattctcc ggatggtaga gcacaaccac 14160 gctatctccc atacccgtta agcgcttctt acttgcatcg tcggcattga tcgtattctt 14220 gcccttgggt tggattccgc gtggctttgt gggtggatcg ggcgagtcac ccatacaata 14280 ggtgaagttg cgaatggcga gccaaccgaa actgttggct tgcgcttgga gggggtcttg 14340 gacgacggtg tctgcttgtg cgcgataggc gttttgggtg agaaggaggg tgaaaaggga 14400 ggcgaagagg agggttagcg agggcggttt gggtatggat ggcatggcga acgagaccag 14460 acgaggacgg tgatggtgtg gtggtcagaa gcgaagcgcc aaactagagg aacgagcggg 14520 taaggagaag ggggataagg tgggccgtca aacaggctcc aaaccaatga gggtattcga 14580 gccgatgttt gagtcagaac aaagttgtga ggggcggata tgaagtcaat gtcaacccac 14640 ccaaccgttt caccgccacc gtgtccctcg cagcccatgc taccatacaa cttgctccat 14700 aaggcggtgg tcaccgcatt cgctgtagac gccacagcaa caacacgtcg gcctttccgc 14760 actttgcgcc gaaaagtctc cgaaccattc aattgaccga gcaaacacca ccttcttcac 14820 accgatacac tcgcacacac gttcacaaca acaagagttc gaaaaaaatg ccaaaggaat 14880 gtgtatgatc gcaagtgcta ctttgcaaca ggcaaaggag cgtaagaaga gtactgcctc 14940 tgataggagc tatactcatt tctacctctg tatgagctat actcttcgcc acctccctca 15000 agtctacctt gcttctgcag ctgtatctgg gtcattaccc tcctttgctg ctctttgagc 15060 ctctgtcttc gcgtcatgga atcccaaatg tgctgcgtca tggtatcgtt cgactcggtc 15120 tgtttgtgaa tggtttcggt cgaatcgtgg acacggggag tatcgaagag ctcgaaactt 15180 tcttcgaggc cgttggcgag ttcttcttcg agctgtcgag gacgaagctt cagctttggg 15240 tatcgacgaa gagagcgagg ttgatgagga gacgaaaggg acttgggaga gtgaggagtg 15300 ggaagggccg aaatgatggt tagaaagagc gtgaggaagg gtaggacgag aactgggact 15360 actgtgaaac gcatcgttgt tctttaaggg gcgaaagtgc gcccggcacg aggtactgaa 15420 gtgtccggtg gagcgagtgt atgtatagtg ttcatgcggg ttgctgcctc agtttcgggt 15480 cagaagcgga gtgtttttat ctacatcgag gacgatgcta aagtaaaaca agccggcggt 15540 aaaggatgca catcggcgaa cagccgcatt caaccacgcc gaagctttca tagcctctcg 15600 agcagaggtg atgacacaaa gctctgcaac atggccgatg acaacccgtg aaaggctgtg 15660 cacaaccgct ggtcaaagtg aaagggcttg ccgagcggta ccatgaagtt tgtgggtcat 15720 tcaacaaggc ggcaataccc acctccactg ttcgccgctc tcttgacgac agagaggaga 15780 gaatgccgac tccaagtcat tagttgaatt gccaaagcag gcacggtcat cacgacgtca 15840 ggggtagcaa tcaggtggga ataaggcaag gcgcacaatg atacgcagga ccctctatga 15900 taccaaccac tctattcgcc agccagtact tggcgtaggc gaacgtcagg caccacagtg 15960 accttcgacg ctggtcagtc tgggaagttt gctgatctct catgtgtcga cattgcgacg 16020 catagcctga tgctgagcac cgagttcgac cgtcctcgaa gccaaacgag ctgacgccca 16080 atgcgatttt ttcaaaatgt tagacatgca catacgacaa tttgcgattc gaaaaaatct 16140 cgccgacatc ggcggatcca acttcctgag cttacggagg agcggtccgg cgcgtccggt 16200 cttgcacctc tttcgcttga ccgcacagac gcattttgag tgcaaagctt gactcttccc 16260 ccgcaccgaa agcgctccac cgccggccta gtgacgcttt gtagaagaaa gcaggctcaa 16320 ctctgcgtgt gaccgctttg ggtttataag gttggtcggt caaacacact tcctctaagc 16380 tctctcgaac ctaaaccttc ttctcgtcga tacaaccttt catttgggac cacgggagca 16440 cgttgcctta tctccacatc gttcatcctc gctttcattc tcaggatcag tcgctcatcc 16500 tctttcctct cgataacctt ctcgctcaac agcaagactt tgaacaaaat ggcatccacc 16560 gacgtagcct gcgaaaagac cccctcgtcc tccgctttgg gacttttcaa cctctctggc 16620 aagaccgcat tgttgaccgg tggtactaga ggtattggtc aagcatgtgc cgttgcactt 16680 gctgaagctg gtgcatcggt catcctggcc gttagaccag gtaccgctcc tggcgctgat 16740 ggcaaccacc ctgccctctc ccccttgctt gctgtttccg accagacttc ctcgcagaag 16800 cactcgaccg tcgaagccga cctctccgat ctctcctcgg tcaagtctct cttcgaccgc 16860 gcgcttcccc tctccccttc aggcggcatc gacatcctcg tcaactgtgg aggcatccaa 16920 cgccgtcacc catccaccga cttccccgaa tccgattggg acgaagttct caacgtcaac 16980 ctcaaagctg tctggcttct ctcccaagct gctggtcgcc acatgatccc ccgccgctcc 17040 ggcaagatca tcaactttgg ttcgctgctt acattccaag gtggcctcac ggtcccagct 17100 tacgccagcg caaagggagc cgtaggccaa ctcacgaagg cacttagcaa cgaatgggca 17160 aaacacaacg ttcaagtcaa cggaattgct cccggctaca tcgcgaccga catgaacgaa 17220 aaattgcttg ccgacccaac gaggttgagg cagatcagcg agaggattcc tgcgggtagg 17280 tggggtgagg ccgctgattt taagggccca ttgctgtttt tggccagtca agcgagtcag 17340 tatgtcagtg gtgaaatgtt ggttgttgac ggtggatgga tgggtcgtta agcgcagctt 17400 ctaacagaaa aagtttgttt cgtatagagc atgtgttgaa gcagtcgcaa tcaaaaattg 17460 tatcgtgtcg tttcgtattg aggcccgatg atgtgtctgt ctgtgggtga agagcctgat 17520 tattgtagcc ggtgtgcggg tcaaaaagtg gggaaaaaag cgagccgcga ctgccccgca 17580 aagcgaagaa gagggagaga gagacgcgtt ctgccggtgt gtggctttct tttgccggac 17640 cgtcgacggc gaaacttgcg cagggtccat cttccggacc ctccgactcc acaacatcat 17700 ctcttcggac ccttgttcac tcttctcttt tcgaccatca tcaccattac cgtatccaca 17760 ttccagtcat ccatctactg cgaatatggt cgcttcaatc ggcaggctcc aaagcattgc 17820 ttccacctcc ttcctgcgca gcgctgcacg ctcatattcc tcaacgcgca atgtttcttc 17880 ctcatcagcc gactcacaaa tgcgaatgct catcgttggc tctccaggat caggcaaagg 17940 cactcaatcg acacgcctcc tgaaacacta ctctttttcg gtcctctccg caggcgacgt 18000 actgcgatcg cacatccaac gtggaaccga aataggccaa cgcgcagatg cagtcatcaa 18060 gcaaggcgga ttgatgccgg atcaggtcat gatggatctc gtaggagctg aagtcaaaac 18120 attagcgggg agcgactggc tgctggatgg attcccgaga acactggggc aagcagaaat 18180 gttggatgag atgttggagg accaagagaa agggttgagg ttggtggtga atctggatgt 18240 gcctgaagag gtgattttgg ataggatctt gcgtgagtca caaaccccat caaaccgcaa 18300 tcagatcgag tgcgagctta tacactgacc cgacatcgat gactgtactt gttcctggcg 18360 aacaacagaa cgatggacgc acttaccctc aggacgagtc tacaacctct ccttcaaccc 18420 tcccaaagtc gaaggcaaag acgacataac cggagaacca ctggtcaaga gggaagatga 18480 caacgtcgta cgtatcccct cctttcccct tccccgcctg ctgtttcatt tatcttacac 18540 tctctaactc ctcctcatcc ccgtcatcat gctacgccgt tgctactgca ggaaaccttc 18600 ggcaaacgcc tcaaaacatt ctacgcacaa accgaaccca tgctcgacca ctaccgtcgc 18660 aaaagcggct ccatcaccga gatcgattgc cgtaccgaaa caaacgctga tctcgcagca 18720 tcaggcaaga aggatctatt tgtcaacttg aagggcgaaa cttcgaaaca gatctggccg 18780 cacttggtca aaattgtaca cgagcgattt cccaacctaa aggcagcagc ggcggcgcag 18840 tgaatcgcag ataccacgtc agaagaccta agggaagcca aatacaaata cattccattt 18900 gcagaaaagc ggaaggcgat aaaaagttat ggtacaatgc gatacatgtt tgctattccg 18960 acggtgccgg tccttccggt tcttggttcc ttccgtatgg ttgttgatgc tcatgctcgt 19020 gcccctgctg atgctcatgc tcgtgttcgt gcggatgaaa cagatgcgcc aacgtcggat 19080 gatgctcctc tccatccgcc tctcccaccg tttgccccct cctccgcctc atctccgtcg 19140 tccgctgctt gaacccctcc accctatcct tcaacccctg gaactgttct agaaacacct 19200 tcagatgatg ctcaaactcc agattggcaa ctaccaactt cgccaccttt tcatactccg 19260 gattcgcaat ttgctggatc gccgcatgga ggttttgcaa cgctgtttcc gggtctgttt 19320 cctccccgtc tttacttttt gaggttcctt cggaggagtc ttgtggggca agatcggtcc 19380 ctgagagcga agaagacttc tgacgcgagt tgtagtagtg tcgcagggcg gggacgtcgg 19440 tcatggctgc agagatggct gtgtcgtgta agcgaagtac gcgaacagag tgttggaagg 19500 tgagcagggc ggcaagggcg agtttttgag gtgctgagac gagggtgtct tccacacgcg 19560 cggctgctcc gacgggcaat tggacttcag cagtgatgag accagagtcg gtaacaccag 19620 aagcattctt aaggatgaaa gaggggatgg cgagaggtac accgtcaggc gtgtcgagat 19680 ctcgttcgag ctcctctaga ggttcgggtg aagatgtgtg ccggtcgcgt gcaaaggtgg 19740 cttccatact ctttcgctct acttttgtcc gctctcctgt gtcattggat ccggcttcga 19800 ccatcttgaa cttctccctc ttgacgtcac tttcgctttt gcggtgagat cgcgttcgtg 19860 accgtcttcg ctttcgcatc gctgatgctc ctgctgtagc acctctcgtt tccacatcct 19920 caccttcctc ctccgcgtcc gcttgacgct gctcgcgctg catttgctcc ttcttcaacc 19980 gcctcttcct agccctctcc tctgctcgat cgaacaacct cgacgtggat tgcgttagca 20040 ttcgatgcag cactccacca aacgcatcct gaacaaccgc caacaagatc gtcaacacag 20100 caacacccat caaaccccat atgacaaaga tcgccctacc gatctgcgtc gtcggatgat 20160 agtctccata cccaatcgtg atcatggcga tgaagcagaa ccacattgca ccaccgtaac 20220 tccatctctc tgcataagta aaagcaacgg cgccgaggag ccagaaagca gcggtgacgg 20280 aggcggccag gacgagtttc atgcgtgcgg ccatgatggc ttcgtgtcgc gcgtgttctt 20340 cgtaggtgag gaagtcttgt tctgtgcgtt tttttgctgc tagaagttcg gtttgaaggg 20400 cgtggatttg gtgttgtaga gcggggtcgc cgacggttgc agttgctggc ttttctgctt 20460 ctgcgagttt gggttcgtca ttggaggcgg cgttgccgga ggaggcagca gtggtggtga 20520 tggaagacgc aacattgtcg gctggaggtg caccaccggc agcagcttgc ttctccatct 20580 gagccaaagc ttcagcgaat tcgttgttgt tgctatcgtc atccggcgaa ttactgacag 20640 cgttggagtt gggtccaaac gtgaacgtgc gaggcatgat cctccgtatt gcacggtcct 20700 gcctcttgtg ctctttaacc gcagcttttc gttctgctat tctcctacgt cgctcctttg 20760 tcctcgcgat gagggccgct tggaaagtct ctaggatcgt gctcctcgcc gaagatacga 20820 caagcgcaac gaggatgatt ccgattggcg catacaagat gaccaagact ttgccgcccg 20880 gacttgtcgg taccacatct ccaaaaccaa ccgtcaatac tgttgccgtc gaaaagtaca 20940 gcgcagtgat gaaatcgatc ttgatgaggt agacaaagat cagacttccc agcgacagat 21000 acagcagcag tcccatacct gccagcacca gtcccttttg cagctgtgtc aaccccgagc 21060 ctgcgtgctt gaaatccttt gtcctgacgt agtcggcaac caagctgatg gtgacgatcg 21120 tcgacgtgat ggtcgaagcg cagaccatcc agtaactggc actgagactg aggccgtcat 21180 gtttgggtcc atagatacca ccaaagacag ccaaggcgac gacattgatg atgtcgtgaa 21240 gagcgaaacc cgcaatggca agcgcaatac ttgctctcgg tttcaagaac tcgagaaatc 21300 gaaagatgat cgctgcgttg gccacgactg ccgcactaag cgagatggcg agtccaacgg 21360 ttaggatagg cggattatcg atgtatcgtt ccacaatacc gtctgcatcg atcttggcgt 21420 accatttgga cgtcaaacct ggcacttcga gtacgatgga gaaaggggcg agaagaccgg 21480 aaaagatcgg tgttttgcgc accctccatc cgtgacccag gtctgcactg tgcgctggtc 21540 catctccgct gtcatgtcga tgaaagtgat gatgagtgtt gtaatggaca gcatggccga 21600 agtgtggtac gtcagtgaca gtgaggaaag tctgaagagt gtttgtgttg ggtagacctc 21660 tatgtttgta tgcgggctgt gcaggtggtt tctctgacgg tggtgtaatg tcttttcgac 21720 gtcgaaacgg cgacctgtca cgacttgcag agtgattgtg actttgcaac gacttgagtg 21780 gtggaagatg cgaggtgata tgcgtgggtt gcaacgacga ggcagctggc aacaaagccg 21840 gtcgctcagc aggcgacaca gatgtttcgt ggtcggccat actgttgtat gttgttgtcg 21900 aatgtcgacg ctgctatgag caatttagca cttttgctga tgtatgtgtt gaaagcatcg 21960 caagaaggtg tttcagctgc gatttgcgaa ggtgtatcga tgatgttgtt ggtggtgtgg 22020 agatggtgtt acgaaatcaa gcaacgtgag aatccacaat tcgagcgcct cggcagcagc 22080 ggcggcaatt cgattgccgc gcttttccca cgcagggtcc aattaaagat aaatcggagc 22140 ttactttttt ggaatttcgc aagaatcggg gaaatttagt gcagcagaca gcggaacggc 22200 agagcccacg tgtttgcttt tcgaaaaaga actcgggatt tcgctgtacc tcgcctcgac 22260 atatccttat ccttatcaag tccccgctcc aagctatcaa ggttggaatc tagaacctgt 22320 ttgtaccttg cagcgcctat ctccatctga tacagacagt gagacagcga tagctctctt 22380 ctagcaagtg ccccaaaaag tcaatccagg cgaggctaaa gcagaattga agtacagaca 22440 cgatgcaagg aatcaccgac gcccgtgcaa cagcattggc aacgctgccc taacggttcc 22500 cgcatcatac agcacctgag ttgcctccct tggaagatcc atcgctccca aataagctag 22560 tctgtatcca tcgcctccca ggtgttgccc taccactcct tcgaagaaca accaaagctg 22620 cgaattttgt ggctcacgct ccgtcatcac atctctccac caagaatgtg ctggaaccat 22680 caagatgtgc ctctcccccg ctgttgtggc aacgcctaga tggaagagag tggaatgcgt 22740 ccgtcctcgt cttgcgggca gaagcctagt gattctgttg ggaagatttt gtcgaggtac 22800 atctttgttc acaccaagcc cactcttatc ctgcaagact tggactggcg gccagagatc 22860 ttcgccttct tccaagcttg atacatggtt catgcgcctg ttgtccctgt cactccatac 22920 aggcatcggc ttcattctgt gtgctaccat ttgacaagca atagtctggt gaatggcgtc 22980 gagtatctga ggctcgggtc ggtagataat ctcgtcgccc agaaagcggt gttgctcgct 23040 acggtcttcg aaattggccg gaacgagatg gtcgttctcg cagaggtgct tgaagaacgg 23100 aatgtcgagc gggtaagtca cgggttgact ccgatagtaa cccacctcca gaggtccata 23160 ctctcgacca tctcgcaact tgaccgcatc gagatggatt acgccggata attcctcgtt 23220 gactcgccag ccacttccgg cagtcaatga tccatctgtt agctcctttg taggagcgtg 23280 aaatggatat cctgcatacc acaacatgat ggctggatct tcgcgtccaa attgatcgat 23340 gagtgtctgg tatggggtgt gaccccatgc gattgcttcg tttgctcgag cgccccaagc 23400 accagaagcg gtgccaccaa ttgaagcttg acgctcggca gatggagagc cgaatgcgtc 23460 ggcagaaagt tgttcagatg tgcctggtgc tatgggctgt actgcagcag agtcagatcg 23520 ataatgaacg cttgttggat cgtcaagacg ggtaggaaag catcgtgctt ggctgaccac 23580 catctcctgc cagccatgca atcgagtgac aacactattg taggtagaca gacgggacgc 23640 acagacgaga cacgaacgac actcttgtcg gtctactgaa gcacaaagcg aagcagctgc 23700 acagtgatat acttgatcaa agacagtgat cacaatacat ttgcacaaga cgcacaacgc 23760 ccctaaggca gggtgaaagt gggctacgct gtactttcag gttcactttc aggttcgttc 23820 gaagcacaag gggtctgctt ctcaggcagc cagcagagcg aattgcagcg tccagcagca 23880 acgtcagaat cgaacggtag tggtccaggc aggtcgcata cgcaaggacg aaagtagcgc 23940 ctctttggtc tctttcgaca ggaaggcgcc acctagcaaa gccaccattg gctgtctatt 24000 ctctcctgcc ggttggatgc cttcatgaaa gacccaaaag tccaaattgg tagcttggcc 24060 atttgcgagc tgggtgtatg tctgataagg tagagtagtc atcatgatat gcctttttcc 24120 ttggttcgag acgatctcaa gatgataaac cttcgaaaag tccctctgat gcgcagagat 24180 ctgcgtcaag acagccttcc tgaggtcatc acgtagattg cgggtgagtg tcagccgacg 24240 gacctcttcg ctttggagct gcttgggtat gatatgagct ggtggccaca gaagctggcc 24300 ttccatcaga tcgtgatctg gactgacacg ctgtggggtt agtccgccaa acgacatgtg 24360 cgcccggatg gcgcgatgaa tgtcatccaa gatcttcggc tcgggtcgat aaactccgtg 24420 aaagtttcgg tagctagcct tgttcttgtc gccaaggacg aaatcttcga agttggcaaa 24480 aatgagctga tcgtactgat acaggtgacg gaggacggga atgtctagcg ggtaggcagc 24540 tatctggaac ttgtcctttc ccacttgaag cggaccaaac tgtcttccgt ctctcaatgc 24600 gaatcgtgga atcgtgtatc gaagagctcc atctcgcgag ggcgtagggg ctaccagctc 24660 actcactggc agcttagtgt cggggtgtac tgaataggtg ggttggggtg gaggttgagc 24720 tgtgacaagg acttgggcga aggatggctc tggagcgtgc ccaagaacgt gcccatgctg 24780 catcccaggg acgacttgga aagggtacat agggacgaga gcaacctggt ttccaacagc 24840 aggaggcgaa aacaagggtc gcatgcggga gtcgtaccaa gcaagtggct caataggctg 24900 cggactggga ggaagggctg cgtggtggta ttgcaactcc ggatcgtacc gctgggtggt 24960 atcgatcttg agtcgctcga gacgcgaaga aagatccggt ctgcctgatg aaaatagtct 25020 gtagtcggag tctccttcct cgctagagct ggttggggcg ccgatgcagc ccgctatcag 25080 cactgtgccg agtgctatgc tcagcggaag ttttggcatc ttgactctgc ctgacttgtg 25140 atggaaatga tgcttagtag ccttcgtctg gttggcgtag cagaaagcat ccttcttctg 25200 gaacgaatcc tctttttgtt ctgcgatgaa ccaaacgagg caaccctcag ccctgacttg 25260 actcgttgct cgaatttgcc cacgtcatct tcgagctgca gctgatctga gcggctgctc 25320 gacaggggct gctgcttcat tgaaggtgac aagtcgtcac cgtagatcgg agtagcaacc 25380 aaaaaggctg catttggtgg cgacttcttt gctttctgca agaacccact tagtcagtaa 25440 tttgtcgagc aaccgaagtc ggtggagcag ctcagtatgt tgtgacgttt tgggatgagg 25500 ggcccacccg acgatgccag tcaagcgaaa ccgggaggca aaagtgtgga acgtttcttc 25560 tgaatagcat agcgtcagca cagagcacgc ctttacacag atgagcgatc acggtgatga 25620 aaggcatgca ttcgaacgtc gaggacacgt ccttcaagct catagagtgt taattaaaga 25680 ggtaggtcaa gcatgagcga gttcgagaag ctgaggaaac gccggacgga tgagtccagc 25740 ttcaagcatg cttcttttcc ccgtccaagg tagaaatgtt ccgcccaaaa gcgccaactt 25800 tggcctactt gcgtattggc gcgctacagg gtctagactc tcagtgaaga tccagagatc 25860 ggagtcgata ggaagattgt tctcgcccag atagtcttca gggcgcacag ggattgcgag 25920 gacgtgtcta gctttgccat cgacttcaac ttccatgtga taaagctttg gcgtttgagc 25980 cgagtgagtt ttgagacggt tcctggtgga tgctcgcaca cctttgctca ttagggacga 26040 cttgacgtct agtccgttga tgatccagcg agatggagag actgatggca agaggaaatt 26100 accttgacga acgtcgggtg tttgcgcgtt gataggcttt ggtggaaggt ggctgccaaa 26160 aagatgatga cccaacttgt tcttgatagc cttgagcagc tcgggctctg gcctgaacac 26220 cgatcctctt actgcaagct tgttcccaac aagccgactt tcaaagttac ttggcacgta 26280 agctttcgat aagtataggt gtcggaactc agcggtgtcg agcggatatg tctgcagctt 26340 gaaagtgtac tctttcaacc tcacagctcg atcagccttc ttcgcgttgt gcgcattttg 26400 ttgaatcgga gccacctgca ggtgttccgc tggaccttga cttgggccag cttcgagtaa 26460 catgtcagct gcagcaggat agtggttgta gttcggctgt ttgacaatag gtctctgatc 26520 aacgatagat tgaatctggg tttgcgcccg cgaagaaggc accacatagg ttggtgcgac 26580 gtttgagaac gtgtctggcc cgggtcgcgg gatgcccgtc catatagatc tgtctgtagc 26640 atgcgtatac tggatcaaag ctgccacgaa aagcagcaag caagctgaga gcctcctcag 26700 cgtcattgtg aggctcgatg gttgtcgaga ggccaggatg acgatctgga tgaattgaca 26760 gaggtgctct gtagaggagt cggcaaggat gcgcacttta aatgggatac agtcctcgag 26820 gggtttaatt cagggaagat cgcttgacga ggccactcgc tctgtccctt cgtgttttga 26880 cctgctgacg tagcttcaac gtgccgggct atatgaaagt actggtggac tcgatctcga 26940 tgcagatgat atcaatgaag tgctcgagct tcatgcatag caatagtgga tccgacatcg 27000 atgcaatctg catgaatgaa gtgcctgagc ttcaattgct ttcattgtta taatatcagc 27060 actgacacgg cgttgtccag tgcagagtga ctatgatcac ctcagccaag agctcctcac 27120 aaggtgtgcg aagcccttac gatcacacgg cttttcgaac tatcgcctct agcgagtatc 27180 gaaaatgctt tcaagcttat cttgctaaaa ctggtgggtt gaaacaaacg taagtggatt 27240 gcacgaggag agataacgaa ccggggatgc cgagtggaca acaagccttc ttacgagcgc 27300 ctcgcactcg ctgtgaatgg ccaagaacgc caaggaagtc aaggacgtgg aagctctagt 27360 atgcttggaa aagccggctt catcgtctga gcagccatga gcggcatgtg ggcgtgtaca 27420 gggaggaaca tacctcccaa ggacgatttg cctgcctcca tccgtgaccc ttctcggagt 27480 cttcatgcct tcgaagaaga tccagaagtc cgagttgccc ggtgcccatg tctgctctat 27540 gaagtcacca ggtcggacag ggaacgttag aatatgcctg agttctccgc tcgaaggaag 27600 tgtagatgaa acagattggg tgcaaggtgt gaatgcgttc gaaaacgaga tgggatcgat 27660 cgacgtagac gatttgtgag tatctcttgg ggaatctcga gcccgttagg tacatctttg 27720 gagttcgtga cagctggcca aagatattca ccttgattga tctcgtgaga cagagggtcc 27780 atgtcaacgc gctcagggta gaagttgtag ttcttaagct gactccagat ccgttccttg 27840 atcgaagtta gcagagatgg ttcaggtcga aagatcattc cccggaattt caacgtttgg 27900 ccgtctagga acgtctcaaa gttggctggc tcaagatagt gcgaagtcgg cccactgtac 27960 aggtgctgga agaccggagt atcaagttga tatgtctgtg gaaggaaagt tttataatgg 28020 cgaagactcg cgacagctgc ataccgcgaa ggctgcaagg tagtcagagg ctcggcagtc 28080 aaaggctctg tcgagctggt tggatctgcg ttagaagcgc taccgtcgac cagctgagaa 28140 gtcagggtgg tagagtgagc ggctgtcgct gagtctctag cgacagaatt tccagctgcc 28200 gagccacttg ctgatgtact agcctgagat aggacatgat caggattggg aaacagctcg 28260 agtgttgttg tcgaggtctc cgactcgtca gtattgcccg ttgcctgcgt ggccgtagca 28320 aagatcgaca ggaggagaag aaaggctgct ggcagcatca gcctgaccat attgctcgac 28380 agatagattc tctgcagaac aacggctgga cacgtcgaca ctcgagagcc ctgactgatt 28440 gcaggtctcg attcagcgac gccttatgta gccatataca ccagattggc gtaagaacga 28500 gtacaaatgg gtcaagcatc gctacagctt tacttgcgct cacggtgtca atcttctgct 28560 tgatgacctc gtaaagagga caaggttcat tgcgcatgcg aaagtgaggc tgaaactccc 28620 acggatgtca cacacaaagg tgaagtccag gcaagtgaac tgctgttgca atgctgatgg 28680 tgactaggtg tcggcctgcg gtgtccacca ggaagctcgg agcagcctcg agatgcaggt 28740 ggcttgagaa agcttccaca tacgtgtaca tcggatatgg ccgtgattat tcacacagct 28800 gatgccagga ccgtggtagg agaagtgact tcacacaggc cttgaagaac accgaagcaa 28860 acattcagct caaagcattg aattgattga agaggttgaa tcaccggtgc ctatgcttca 28920 aagcacgctg cggctcgatc tacttgagct ctgaaaaagc aggtttgaag gctccgatag 28980 ctaagaaagg ctcttggatt ttcttcggaa gaaacgaagc acctaagaag gctaacggtc 29040 gcctgtacgc aagtccaaag cgcgctggtg cctggaacgc ctcgaagaaa agccacagat 29100 ctgaatcgat aagtcgatgt cggccgacga aggagccagg ctgcgctggt gtcatcatga 29160 tgtgcctaac gcgtccatcg acagacactc ccagcttgaa catattgggt cgttggactg 29220 tgtttgtgcc aagccggttg gtgatcaatt gacgaaagcg tttgccgagg gacttggccg 29280 ggaaatggag ccttccggac ccggtcttgt cctgtacagg cggccaaaga aaatcgcctt 29340 gcatcagctc aacgtcaccg ctgacgcgca aaaaccgcct ttctattgcc ttcagatgcc 29400 ccccgatcgt ctcacgagtt gcttctagga ccgctggctc cggacggtaa agcatgcctt 29460 ctgtgtggaa tccgtatttg gtcatgaacg tttcgaaatc gagtgggacc agatgatcat 29520 tgtcgtaaaa gtgacgcagg gaagtagtat ctaagggata agaacgcatt gcaaattctc 29580 ccaaaccatc aggagctctc cgtcgcccag ttttggtagg cttcaaggac tgcggatctg 29640 tggtctgtga tgtgcttgcg atgtctccag gaggtggagc attaagatcg aagactgctc 29700 tctggccgct acttgccgca tcaaccccag gtggagaatc tgtcgttcga tgctcgctca 29760 cttgtgggta cgaatgggac cagtgccgga cgcctgtctg cctgatgttt gtcaccggat 29820 agctcggttc ttgaggaatg ggctgacggg gtaagttttg cggctggttc tggacagtct 29880 gcagctcatc aattggaata cccatccatc gtggtctgcc tgctgcgagg acgcagcttg 29940 ttaccaaaac aatgtaagct actacgggct gcaccttcat gctgacgtga cgagaaagaa 30000 tgggttgtat ggccagatgg tgcgaagaag gagaaggaac aaaggttgga gattggcgat 30060 caattaataa aaccttcgag tagactttgt ggcttgtgga cgaaatgctg tgaaggagca 30120 cgcattgagc ggtacatggc tgatcacaaa ttcattgcgc gtttacttgt tcaaagctta 30180 acctctcttt gcagcatctt actcctccga atgaactacc tagtctacac tgcaaccaaa 30240 ggaatcgaag ctcgactcga ctcgctcaga agtggtacag tagaatgaga tgtcccacca 30300 actaatgtcg tcacgaaatt tgcggtgtca aagcggtgaa ctaagtaata gccttcgcat 30360 tcatatcttt gcgagctgta cataggctgc cgttcagctc gaagaatgtc ttcggcggat 30420 cactcaaaaa caattgcggc ggcatttgcg agcaatagaa gcagacatag aattgcttga 30480 ttaagatcaa agtatggctg gaagtagtga ataacactca acgatgtagg accggcaagg 30540 agaacctatc ctgagaagga tcacacctta cgcgacccaa acttgtaggc tgtcgtctct 30600 agtgcgctgt acgcagggct tcttcaaaag ctggtctgat ggtgtgtgca tcaccaagta 30660 ttttgctcgc atctgcagga agaaacgaag ctccaagaag ggccagcttc ttcctgtcgg 30720 catgctcgac tccttggaag aagagccaca tcctagaatg aaccggtctc gttggcagtg 30780 agatgtggta cgaagctggt acctgtatca tcagaatctt ccgttgaccc tcaggagacg 30840 gtaacgtcaa agtgaacatc ttgggttccg tgagcgtgtg ataaggccat ttctggtttg 30900 gcaagcggcg ataatggtac aacttgcgga ttggcacgtt cactgcccca tttaggtcga 30960 tttcagtggg tggccagagc cattggcctt cactaagacc accttgcaag gcgctcggct 31020 gccttctaaa gcttcgcagc gtagaccaga ttgtgttctg aatctcgtct agccttttgg 31080 gctctgggta gaagagaggt ccccaagcgt gcaagaatcg aaccgggttt tgggatctga 31140 ttcctccgcg attcttcaga aacttttcga agtcagcatc tctgacgtcg cgcgaatctt 31200 cgtacagatg cttgaattca tccatttcaa ctttttggaa gccttttggc tcaaagtctt 31260 tgttccctac cgggaagggt ccccagtttc gatcggtcct gaatgccgga atctcaggcc 31320 tatcctgact ctcttgaggc gtgctggtgc tggattctgc ttgatgaaac caaggcctag 31380 agtcgaaggc tgcagcaatg gtaccggtgt ctctgccaac ttgagagtga gggattatac 31440 cagcgttcga ctgctgctct gcttgtggca gggcatatct gctgtcgtgc tcccagacag 31500 gaagcatggc cctttgcggt atattccaat acggtcggtc ctccataggt cgagcacatg 31560 cagctggaag tgccgctagg aggcaaaggc ctgcaagcag acgcttgaga cacatggcaa 31620 ggggatagct ggctagtctg tacgtggtct tgcgggaagc gtgcaagaca agcagaaaca 31680 tcgggagggg tgaagcctat atagcgatta ctcactcact gtaccttctc aacccactgc 31740 gctggcacta gaggaggctt tgcattcgcg atcagcaatg cgaataagct cttgcaacga 31800 acgaaagatg tctcatctgc cacacgtgaa agacaatgca cggtatgatc cagcaccgta 31860 tcggcaacgg atgtgggcat tgacctggga ccccacatgg ttacgttgcg tgtgaattga 31920 caactctctc atatagcaca aatgacctca gcgagaacta cgtgcgatcc gtgacaccgg 31980 attgcatgcg attcagttgc atcaggtcag gcctgcgtat tgagcgtgtg cctcactcag 32040 gggctaaacg ctcatcaaat tgcggtccga gacgggcgtt ggcagctcaa ttagtgctac 32100 atgagtattg ctgtatagga gcgagcctgt ttggccctcc cacacagtgc ttttgcgaag 32160 caacgacgtc atttgaggca acaaaggtgg tctcaggtcc tgccgtgccc cacccacagc 32220 agcccatcac ctcttcaacg tgagctggca cagtcaaggt tcgcagattg ggaccgtcag 32280 aagccacaca gacatctgaa gaggtgggct tcaagactag ctttcgagag attgtgcatt 32340 gtctcgtacg aatggctatg ggtgataaga atgagcgcgt cgaaaggatg ggttggagac 32400 catgaaatat tgctgatcga atatcctcat gacagcgttg caatatcagc gtggctgaga 32460 gctcaacgag cgcagggcct cctcgaaagc cggacggatg gtcctagcat cgagaagaac 32520 ttgattggct tcatttggta ggaaggaagc accgagaaaa gcgatcttgc gttctcgtcc 32580 ttgctgtaca ccctgaaaga agaaccaaag ctgtgaatca ggtggatcaa aaggaaagga 32640 aatgtgatcg tgcgtccgac cttccatcat taggatctgc ttgtttgaaa aaatggaagg 32700 gacatcgagg tgaaatagtt ttgcatcggg aagcatgtgt ctgttccatc gctctgcagg 32760 cattcgacga tagcgttgaa ctagtagctg agcaggcaga ttgagtcctg cattgtttgc 32820 agctatctcg gtgggcggcc acagccattg gccctcactg agaccatctt gaagctgccg 32880 agcctgccta ccagcatttc gaagcgtgtc ccagatcgtg gcctggatct cgagtagtct 32940 ctgtggctct ggataataca agctgcctct ggtaggaaag gtatggcgcg acgcagcgtc 33000 cgcatctgta gccaagaaag tttgatagtc tgcatctctg acgttaggca aggcgtaaag 33060 atgctgaaag acattgatct tgacagggta gcccttcggc tcgaagcgtt cgtttccgat 33120 ggggaagggg ccccactttc tgtttgtgtg aaaagcaggg atctcgagcg tcgtgccata 33180 caggttccga ctcgaaccag cctcggacat cctgcgccaa ggctgaggac tgagattcgg 33240 aacagcttca ttgatgacaa cgaaacgact ctgggatggc agaggtatga ttgactgtgt 33300 gttccagtca aggttgcgct tcagttgctc ttccatcaac ggatcagcac cagcttcgag 33360 acggggttgg tttgtcgaag caggctggtg ttctgatggg ctcagggcgt atctactgtc 33420 atgctcccag acaggaagca tggctctttg cggtatgcca ccaaacgacg catcgtccat 33480 tgcttgcacc cagcctgccc aaaaggccat tattgatagt aggacgagca tccttagctg 33540 aagcaaaaaa tgcgtgatta tcggtcaccg tggtctcaga tgatgctcgc tgtgagcgtg 33600 aagaaagagt ccaacccttg ccaccacctt gacggaactc tccttggacg aggctcttac 33660 ggccgctgtc tttgcgcaac aggtccactg ctctgtttga gcaacgaaga tctcagaccg 33720 tccacgtcga cagcgcgatt ttgttcatgg caacgccctg aagtggctca gacaacgaac 33780 gcaaaagtcc catcaatcac gcacagtact gcccaccaac ggcgagcaca tgaaatcgaa 33840 actttaaaca cgaggcgtgc gaatcgagcg cggtttttgg ttcacatcgg tccgagcact 33900 gtgagagatg tggccgtgct tctggtctgc gaacgagtga ctgtcgtctg accaaacggc 33960 tgtctgtctg atggcttcaa tttctcagtg cctgcgtgaa caagttcact gagcggaacg 34020 atgatcactt tatttctacg caagccttta tggacgctgt gctctgtcca cgcacactgc 34080 gcaagccaag cttcgactca catgttgttg aacgcccaac aacaagtgcc gtttgacctc 34140 ttcgaaatga agtcaagtat cgttcaaaca gacagctagt ctctgaagac agcagagcag 34200 cagattgtag tgagagagga tgagcgcagg gtcacattac agctcggtag gctggagatc 34260 ggtatcgtag ctctgaattc aggtaatcag atgtgagtca cgggtgcttt acaaaaaagt 34320 agttcgcaaa ggaagggtgg cgagaaccgt agtgcccgag gctgagggac aactaggcta 34380 gatgattaaa aaccatggtc aggtctccac tatccagtaa gcgcttcgca ctgtcccttg 34440 gaaggaacat agcacccagg aaggccattc gctttctaaa acctcgacca ttgattggct 34500 ctctaccttc aaagaagaac cacaaattcg agcttgtcat tgtccgcgat gtgggagccc 34560 aattaccaac gcttgttggc atggctgcaa tgtgtcgcac ccgcccatca ggaagaagga 34620 cagcaaggtg atacaagctc gagaccttgc cttcgtgccg gttcctgtcc ttcaaagcct 34680 tatggatgcg aggattcaaa acgtctgccg gcatttgcag gtccccttcg ccctgccttc 34740 gctctacggg cggccacaag aattgtgcct cgcgcagatc gaaatttgga aacacccgct 34800 gagggggcaa ctcaaggtct cgaaggcgtc ctgtaaggcg ttgctgtatc gctcgcaaaa 34860 gctcaggctc cggtaaaaat gtcaagccat tgatgggtag tctgcctctt gaaacaaagc 34920 ctctgaagtt ggtcgggtat gtgtctgggt tggcgtgaag atgttgaaag ccttgccaat 34980 ggagcgggta tgactgcaat gcgaacattt tgtcgccgat gtcatagggg ccccatttgt 35040 agcctaaatg gtccgtgaag gagatggact cttttgcagc tggttgctgg cgaagactag 35100 acccggctcc aggagcaaat gcgttggtaa gctcgggatg atggcttgaa gtgcccacat 35160 gttcgtactc gctcatcgtg ccgatgtttt gtgctgtctg cggtgaagag gtcccggagc 35220 catcgctgct cgctgcagga ggacttggca tggattggtg gacagtaggc tgattatgcc 35280 agtactgcgg tgaagctgga cgaggaagtt gaggcggata gggtcgatag tcgtgctctt 35340 cccacgcagg aacgaattgt gagaatggta catttgagtt cctgggatcc attggagccg 35400 atagtaccaa gcctaccatg gatatcaagg tcaaatagaa gtagatccac gcttgaatca 35460 tcttggcaag aaagcaatgt ggaaaggtgc actcgaccgg tcttgtgtat cggtgctgtc 35520 tggtctgagt cagagtccgc catggcagta tttatgccct tgcaaaatgg gaaggctcgc 35580 atacttgagc ttgcagcaca acgatgtaag actgcttaac cctctgagct tgttgtcaga 35640 gtcgatcgat aacttagtac tcaacgcatg tcagaagcgg tgggcctcgc ttctcgtgtg 35700 caggatgcgc tcccgattcc gactaagccc acaagagacc tgttgtgctg attcccagac 35760 tcatttcgag gttgactttg atctttgtgt gcgaatcagg agcacttgca gcacttcaca 35820 ggcgtatcaa gggccggtgg gtgcccgagc aagaagacgt actgtccata attttgatca 35880 cacaagtgtc gcgatgaagt ccccgttgtg tggcaacttc atcaacattg agacaactgc 35940 tcgatcaagg ctgcggtcac aaagagcctt cttggctgca accttgccgc aaaaggggca 36000 ctcggtcctt tgttcgcctt cctcctagct agtacaaagg tcagcgctga tgcatgatac 36060 attgtgagcg tcgacggcag tcgctactgg ataccagacc gtgaagtcag gcaggtgtta 36120 tgagtgtcag ttgtagcaac aaagaatcgc atcgatagga gcacaattac ggtgtttgtt 36180 tgacgtcgga cctacatcat actaagtgga aagacagaga ctacattctc tgcaaataca 36240 agccgtggcg actaggtgtc acttggatga agggatcagg tggcgctgaa agggaggtgg 36300 taacatacag gcgcgaaccg cagtcgacga gctagaccag tgcgtcatga tctgtcaagc 36360 agcgaaagtt gaaattacct tggctctgag cagcgtttcg tgtgctgaac tcggcaaaaa 36420 catggcgcca agaaaggcca tggtcttttt gcctatcacg ttgcttgtca acctcttgcc 36480 tctgtaggat tggatcccat cgtgaagctt tctgccttcg tagaagagcc acagatctga 36540 gtctcctccc gtgctggttg tccagacctc ggtcacagct ggagtcatga tgatatgtct 36600 gtctccagcg gaagaaggaa ctgtaaactg atagatgttc ttggcacgca tcgtacgaaa 36660 gcgatttcca ggagcaacgg agatgcgatt cgacaggagt gcctcgggca tttgaagaac 36720 cgactttgtg tgggtcaaag gcggccatag gtacattccc tcgcggaaaa acttgttctt 36780 ggagtcgata ggcttcgcgc tgatcccttg atccgtaagc gtgttccaaa tggtcgatcg 36840 gatgtgctta agaacttctg gttcgggacg gaagctaatg ggccgcacct gcagtcggaa 36900 cggctggcct ggtacaggct cgtcgatggt cgctggaatc gtgccgtcgg gctggtagag 36960 gtgtttcagt cgctccattt ccaacgggta ccatatcagc tgaaacttct tggagttgag 37020 tttatacggt ccccagatga cgcctgagac atctttgaaa gcgggaatga tagctcgggt 37080 cctagtggta ccctccggac ctcgtcgagg acccgagatg gttctcccgg ctttctcctc 37140 ggcgtcaggc tcccaagagt ccgagctgct cgcctgacgt cgccagaagg gaggatggac 37200 agaaccgtcg cggtgaccca aacgctcagt cggcgacaaa tcaggagcag aggcgtgtcc 37260 ttggttgtca aatgtcggaa caccagtgac caccatggcc aacaagccga ggagcacaca 37320 tagctgcaca ggtctgtaca tactatcttt catgccgcag gacgaatgca aaccttgact 37380 tgagctacga gatgtgaaga ggagggtcac gcgatggagg gaaaggatga gaggatacga 37440 gacggtcgat caagaaaggc caatcagtat cagcttttat ggttttgaga ggcttcggtt 37500 tcttcttggc aatcgaagct caagcacaaa gtcgatcata cttccttcgc aggcttggaa 37560 agttcatgtg cagcgaagcc tcgcatcttc tgcttagaaa gttgtcacag cctcaagctc 37620 tggaacggag agcgacgtgg cctacggtac atggtcgtgc ggcggttgca gccaaagcga 37680 atgacatacg aggctgttgt cttggccata cacagaacgg taatcgagcc atagaagcga 37740 tcatcggttc cacctgctcg cgtgacccga gtatgacaat cagcctggga tcccagcact 37800 attcctgaat agcttcgtgg cgaaactcga gagctctcgt gcgcttagat cttcattagt 37860 gggcctgttc atcttggtat tgcaatccgt tcttaccaaa cagccagagg tcacctctcg 37920 atgctgaagc caagcggtct atgagcttca acatccgtct atgaggtcga ctcttgggac 37980 gcctcaagtt gccgagactc gcggaccggt cgggtttcgg accggaagtg cctaagggca 38040 atcggagttg gccgcactct cgacttgagt tcatcatctc acccacatac aatgctgcat 38100 ccgccttcaa agcctctcat gcccgtgtag ccacgcattc ctggtagtgt tgttgtcaca 38160 accaatgggc aatgggtcac cttgacaccc gtggtgggct gcatgactgc tttgcgacaa 38220 cgaccgaaaa atctgttgcg ttggcaagaa caaacacgct gcctgctttc gtctcttctg 38280 cacaaatctc agcccattcc cgcattcaag tgttgatgcc gagaggcgac cgctacgcag 38340 aacagagtcg atcaagttgc ccagcactgc cagcttcgaa aaagtgcttt gcgcaactac 38400 tgtacgagcg atacagaaat gaattaatgc gtcctcgtag tttcccgtcg cgacttggga 38460 agaaggaaag cttccannnn nnnnnnnnnn nnnnnnnnnn nggaaaaaaa aaaaaaaaaa 38520 gacacgatgg ctaaaggtgt caaaatgtgg ttgcaagaaa agcactggaa aaacaagtaa 38580 aaattaagaa aaaaaggtta tgtcaggaat cgagcagaag gtggccgaag aacaattaag 38640 ttagtaaagt aaaatactgt atcaacgaaa agacaaacaa aaaatgcaaa gcgaaaaatc 38700 ccaccataca gcccagcatg ctccctcgca accgagtcgt tgtaacagcc tatgagcctt 38760 caacgctgcc gatcgagggg ccttgtggac gcttgctgac tagtcgtgct cggttcgagt 38820 ctatcgcagg gatctgaagg atcgatagcg gctgtagact gatataaatg atacatttag 38880 ccctcggtag gctgctcttt ccctcacttg gtcatcggct tctaccccct tcctcgcttg 38940 caaaactcgc ctctattgag ctgagatgct ctctctccta cgtatcttcg gcatcagcgc 39000 ctgtgtcttc atctctcttg ctcatgcgat cgatccaagc aagttcgaca aacctcagga 39060 gaggtcgtgg ctagccgcaa agtcatttat cgagcttgct cacgaacata attctgtggg 39120 ctaccgagca gcctatcctg accatctcga gctcaactcc gaagacgcag aaagggcttg 39180 gaatttggct caacagccag gccatggacc tctgaacact tttggttccc gagagaccaa 39240 ggctcgcgct tgggcacttg cacggatccc gtttggccac gaagttattg ctccataccg 39300 catcggcgaa aagcaagctt atttgttttg ggaggttgaa cacaatagtc acaagctact 39360 tggcatggag ctttggccgc ctggaggaat attccctgcg ggccacgtga gcttcagcga 39420 attgatggca tcgctaccca agagaaacgt ggtcaacaaa ttcatgaaat ccttcagggg 39480 ttgaaggatc cgacgttttt ctctgttgtg ctcggctgca aacgctattt tcagtggctg 39540 gcgaaatctg gaccctgcat aaaataaggc tggaccctgc ataaacaaaa atttagttcc 39600 gacaaaagct taaacacggc atcatacata tttgtggcgg tttgaggagg agtgttgatg 39660 tgacacggat gttattgtgt tggtgcaacc ttatcaagcg aagtataaca tattcgtgtt 39720 gttgatgtca tacatatgca tagctagcta cttgttcgcc cctttccttc gctccttatc 39780 gaattgatct ttatttctaa taagttggcc gtctgtgaat atgagcgcct cagcatcgac 39840 tttgcctgtc tcataagggc aatcttgttt cttgtggggc tgtttctcga tctcgaaggg 39900 cgcgacgaga gactagtaac gctactgact tgaattgacc ttaaaagctg gccgcaatgt 39960 tgggccacgc acacatcaag ccccatccga tacgtgtctt gctgtccatg gatactcttg 40020 cattctgtca actcgcaggc accgaacaga atcaatttga gtgcagaact cggtagacag 40080 ggatttcttt gagtctgatg acgaagctct gtcatgggcg agagcgaacc aggaaccacg 40140 ccgcaaaatc ggtatctcga tggcttaaag ccgatgaata gaaggacttg catctctaga 40200 gcagactttc tgcggttgaa cccacacaaa gatcaagtcc agtggatcgg cccaccaaca 40260 tcggcgcaag cgcttcatat gagttgttgt aggatggcaa gattgagcgc aactggtttc 40320 ctctcctacg taacggcttt ccagtggcga ggcaacgctt ttgtcggaca tgcgttctgt 40380 acatcgacac accagacact cgcatgtcca taggtccctt ccttgtgagg agctgacatc 40440 tcacctgtgc gtggcttgac agaaggatac aacgagcaac cacgcttctt attgtctagc 40500 atcgagccca ctcaaatgct gtcacaatct tctgggttgg cctcaaggcc gcgttcttct 40560 ttatgtgaga tgtacctcct gcaactgctg ctggcatggt gataagcaaa gcatcggtgt 40620 tgtcaagctt gcacgatcgg tgttgatatg taggaagaca accagccgaa acaatgcgac 40680 gagcgccatc atagaaacaa ccgtctcaag ggtgcctctt tagccgcttt ggactgttgt 40740 cgcctgcttg caagctgcaa agccctttcc tgaaccgcct ctgatctgtc tttcgagctt 40800 ttgagacgat gtagcattag attgctgtct ggattgaagc cataaataga gtcaattaag 40860 tgaaaagtcc gactcacttc cttcacggca ccccaatcgt tttcccagct catcgcccag 40920 tcaagttgct ccgatggttc tctcgactcg cattatcatc catctattac tatccatttc 40980 cgtccttacg actgcgactt tcgctgtgag ccaaccaagt ctgacaagcg atgccaagaa 41040 gcactacaag caacaccata tcacgtatat cagggacagc ctattgccag cggtcatcga 41100 cccagagagc cgtgttgaat actactccca tctcgtatct ggaaaaccgc tggctccggg 41160 tcaagcgtac gaccattcaa agtcgctagg aaacggaccc atccacgtca cctacgaccg 41220 caagcatgaa aatgcatacg cgaccaccaa gattccgttc aattctgatg ttggccataa 41280 gtggggtatg aatgtacgtt tgaatgacgg cgcaggcaat gaagagcaca aagacatcta 41340 tgctttctgg cacaagccta tagggcatcg tccagttttg ctgcgactgg atgcctggcc 41400 agcccgtcag caggctcacc ctgccctttc ttgggaacaa gtcgaaggag tcatgcgggc 41460 tttacagcgc cgatcttagc ttccctgcct tgccgcagta ccaccacttc tttgtaccct 41520 acaaatcctc gctgatcctg tcgacaataa ccgtagctcc cgtcagattt ttgcttctga 41580 gcgtctttgt aacgtatgtc aaccgctttc taagcaacat gctgctatcc gagtcagtaa 41640 cacagctctt tgatctcaac ccaaaatcaa acagaagcga tattccaggc gtgtgcgaca 41700 aactctgtgt agaatgatga ctgttttcac gcaaacatat tcgttgagcc gacagtttgg 41760 ttctgacagg acgccacgag gccagtggca ggacatttca taaagcgagg acaacatcgg 41820 cttattgagg gtctgaacgt ccggcagctt caaacacgtg acagatagca gaatgggatc 41880 tggtattgct cccagatcta cacaaggtcg atgagataac tgagagaagt ctgttccttg 41940 cacttagata gtggtagacg ccgaaggccg aaggagagca agaaatcgct gtgaaccagt 42000 attatggcat gttgccaata tgttacagtc aaccgacggt agaccgattc atgtgggcgg 42060 tgtcaacgcc acaaagtacc gtcccgccta ccgccacaca gaacgtggca acggcagtgc 42120 taagaaccaa ataatgccga gaagccgcga agagccgaat tcaggggttg ctgggcaccc 42180 agtcggcatg gaaggacgag ccccaaaacg ccaagtgaga tgcatcgagc tacaatataa 42240 gcagcttgcg atctgcgatt ccagtgtcga ccggcaagca cgggcaatca caccgcctac 42300 tacaccaaga tgatgctctt ccgcttgttg ctcctgcttc tgggcgctgc cttggtttct 42360 gccttctttg aaagcgatta cgtcaatctc aaagggacag accgaagcat gtggctaaag 42420 atgcacgaac gattcgaccc ttccttcaag caaggtcttg cacgagaaca tatttcttct 42480 cctcgagtgg tcgccttcgg ccccgaatgg taccagtcgg ccttgcagca tgcacgcgac 42540 aagggagtgt tggttcttgg cgttcacagt cctctcacat cattgacggg gaacaagaag 42600 acgtattttg tcacgctgat ccattatgac gatggagttg ttgcacgtca gctccaattg 42660 catcctcaaa gcatggtggg tgcagtcttg tggaagcaca gtaaaggtca aaacaagatt 42720 gtttcgattg acaggttaat taggaagacg gagatgaact gggatccaga ggtactggaa 42780 agtgtcctac aacgcgagca ttgacaccaa catctcaaga agggagcgac cccgatcgga 42840 gctttcgtac gtattcccat cttgatcttc aggcgccgtt gtacgtgtcg attgtctttc 42900 tggctgatca gctttgtact catccttctt cacactgact caggattgaa cggctctctc 42960 ccacgatggt cttgtctcga cccttcggta cccacgtcaa cgcatgcaaa gtgggctcac 43020 tgagcacctt gcagtgaatt gaaagccaca aagttgcttc gcattgatgt ggccctggtg 43080 acaatagaga aataatgtgc tcttacattg caacgaatgt atgaaatcgt gttgtctgct 43140 cacaaacaac aacgatatat gaaacaagct catatgcaat ccggcatcgt tgcgcttgtg 43200 ttcaatgctg gctcggcgcg agtcttagca cacgtttacg aactgtagct gcccctttcg 43260 agcttctgtg actgtgcaaa gagcacagcg agctgcatag ttgcccacgt tagcacgact 43320 gttaagcgct attgttaccg gtgttgtccg atatcacacg attgcgacct gggcggcatt 43380 cagcgatgct cgtgggaagt cactggcaag actgaaagta ctcgagggcg agcttgaaag 43440 aggcgattgc gccagatgcc aaaaggcata taagctcgtc gatctttcac tcagattcaa 43500 gtctgaacgc atcaaattct cccacgggga atcagctctg tatctctcaa ggacttcaag 43560 atgaacgcct ttacagctcg tacgatctta tgcctcgtat tcatcctctc cgtccttgct 43620 gccagcgtct ccgctgcccc accactttca agcttcgatc gtaatatgat caacgagcac 43680 gaagctcagc aggagaggct gtacagagac agcgggtatg catggaaccg tccgcagcaa 43740 ttcgagtact ttgcagtacc caattttgaa cggaaggctt tagagctcgc tgatggacgt 43800 ttccgtcaca tcgggaccca aggaatcggt cctttcgcta gaaacgctgt ggagacttac 43860 tacttatcga gcttgattcg tcctggcacg cttcttggtc acgatatggg gcttggaccg 43920 ggaagaatag caagtgcgct ctggaaacac cataatggag aggccaaagt gttgggtgtc 43980 acaatcacgg agcaccagcc caatcttgat tggcaaatgt ccgcgctgcg cgacatcatc 44040 agtcgtcatt agtggatctt gcctcccctt ggctcttcgg acgagagtag aagcccaaag 44100 ggctgtggct ttcggttcga gcttgcatgg ttctgcgagc agtgccgctc tcggactcgt 44160 gcgaaaagct gcaaacagct aggtcgccag ccagatatcc gcttctttca gcccatgctg 44220 ccgtgtccaa cgccttttca atcatcacac ccactgtcat cctctctgcc cactacctct 44280 gtctcgctta tgctttcaca ctttcgagct cgtgtataga ctcccgtccc tggcattgcc 44340 tacaactcgc tgtgttgacc ttcgaaccaa gcctgctagc ctgaccaggc gaagggagtc 44400 gttacgtgta ccgaaatgca gacgaattta accatcgaat ttatacatta tttacagaaa 44460 agtatgtgat acttgctagc tagttgtttg tgagctgacg cacctatgcc gatcggttca 44520 ctgtctttgt ccatcattgt cgctgtgtgg gtcagctaca atggacgttg gagcccacct 44580 tcaggggcgc cagggccgca caaacgatgg gcgatatttg ttccgtctga ttggaaaccg 44640 acagtgggcc tgcattgctt cattcgccca cgtttgtgcc atggtcgccc ctagccatgg 44700 tcactctttc ggcgagcgtg ggcctcttga tggacatgct ttgctgactg agcaaagaag 44760 tatcgagagt gtggcaagaa catataagta ttcccataca tgttgcgtct acggcaaatc 44820 attgagtgca agatctgctt gtccgcatga gaagcctatc tcgcccttta ctcctgaaac 44880 cggatcaaga tgaccgccat cctccaacgc tatactcttc tggtcgtact cttcttatcc 44940 ttgacacttg gtgtatcagc gacgccggca tacaccctct ctaagaccga cggtgagatg 45000 ctcaaaaaag ctcagcttat gcaaatgagc cttcacaccg atcacggaga tagatggaag 45060 aacgttcagc ccgacatcga ctactcccac gtcaacaacc tccagtggga agcggcggcg 45120 gacggcaagg cgagaaaata tactcatgtc gaaactgtct cctctgtcct ccccttcaga 45180 agcaagaagg tctacttcta cagcctaatt catcctggat cccacttagg gcagatgatg 45240 agactgcaac acgatcaagt cgcaagcctc ctttggaagc acgagaagga cgagccgaag 45300 gtcattcaca ttgataccct gaaacacagg ccaggcgtga actggggcag tatgcaagac 45360 ctgagggagg tgctgcttat gcactgagca agcagatcat cggcatgccg ttgaacgata 45420 gaatcatccc atagatccac tcagctcaca agagcagctt ttgagctgcc tgagcgcgac 45480 ttgtttactt atgaagtctc tgctacacat caaaccgttt gactcttcaa ggagattgct 45540 cattcgctga agggtaatga cactgcatat acttctgatt tcactgttgc ttgcgtatcg 45600 tgctcttcct cacgaataga cacttcccga gcgtgtgttt cagaagagca atgtgtgagc 45660 ctcatttacc ttccagtgag ggcgtcgtga attaatgtag gatgggtttc gacccacata 45720 cacttccact aagacgttca tcaggctcga agcactgctt tgtgggcagg tgccagcggc 45780 acagagcgct agtggcactt aaaaggaaga cagtctgaga cggagttctc cggcaacagc 45840 tgagcgataa cagctgcctc ctcctcactt tcttctccct acgtgttact acacaagtca 45900 agaagcgcct tcgtcagcac gcaagcgacg ttcacacaat gatggtccta cccaggcagc 45960 tgctttgtct ctgtgtactc tcttttcgat taccatgctc gtagcagcag acagtagctc 46020 accggccacg gctaggcaag tggatgagca aggctttcct ttactgtcag agacggaata 46080 caacatgctc aagactgcta ggcttcgaca gcacaaagtc accttcaagc aaggctatca 46140 cgatcaagcc gcatcctttt accggcaagg aagtttccca aagcctgcac tacgttcgag 46200 tgtatatgct gttgaggacc tggaagctca agcactcagg gaggctaaga ccgaaggagt 46260 cacttacgtc ggcaaacaga aactatcgaa acagccagcc tggttgggcg gaagaaggca 46320 actctatttc tacagcgtag ttcggcctga aggtacctta gggaaacaga tgcgggtagg 46380 cgagaattct ggggagcaga gagccgcgag catgctctgg aaacacgaca ccaagacagg 46440 cgagacaagc ttggtgcaca tcgacgagat tccgtatcat gcagaccttg actggggact 46500 cagcaagttc agaaaggtgt tgtggcttca ctgaagcgca ttcccaatac aaagcgcctg 46560 gcaccggtcc cccgatcaat gcttcggctg cacaggtctc gactcacgcc gctttcctaa 46620 acaccgttac agcctcgttg ttctgcttac cagagagacc cctcttctat cccaagtgac 46680 gaccgatgtg acatacacag tagctaaagt gtgatgcatc ttcggtgact cgacgcaatt 46740 ttaattttat tggtagcttt gcagcagtac cgatgtgcag tctctcaagc accgattggc 46800 ttcctgattg tcgaaggtga gcacagaggg caagtacctc gactgaacga cgcgttgatg 46860 tctcgtgaca tccgaagtat ccactgcaac ggttgcagcg tttgtgagca ccctctctct 46920 caaccttcgt ttcaatagtc aacaacagct agatgagtgc tcagactttg tacgcatcct 46980 tgactctgct ttaggctcga gatcattaac gctttcgcac gaccacctca acgagactgt 47040 cgcacgatcg acttataata ctaccgttgc attgcggatg agtctgtcga gcaacattga 47100 ctcatttgat cgagtcaaca attcgcatct tctggtacaa gcgaccctat ctcatctcat 47160 tttagactct tggggaacac atagctgtcc aagaccggaa gcaacgctcg tgtcgctcct 47220 gtacggccgt caacaccttt gtgatcgctt tctacctgcg ttgattagtg cccgtttcgt 47280 gtcagagcat gtagactctc tccgcgttta ccgaagcaga atcgaagtgt acaaaatgcg 47340 cccctgacgg ctgagcgagt ctctgtcttg ttcccctcag aagctttgca ttcttgtctc 47400 ttcaactttc caacatggtc gtctctttga agcgtcttct cgacctcttc atcctctctg 47460 tccctcttgc catctgcgta gtctcagctg ggaattgggg cagcaagccc aagtcatata 47520 ctggcttcag gctccaagat gaatatgtaa gcaccgaagg acagctgaat cgcatcgaaa 47580 aagagatgct caaaactgcc agggacaagc acattcgccc tatctacgat cgtgctggca 47640 gcgagtggaa atctttcact ccggagccct ttcttcgaga ctacacacac atccctaggt 47700 tcaataccaa ggtgcttgat tccgccacta tgtatggggt cacgtatgta ggccaaaaag 47760 tgtttccagg cgcaaggagg cttcccctca accttgtgaa cggcagaact ggagtaggag 47820 gtgatcggga catctatttc tataccgtga tcccacccca caccgagctc ggacgcgaaa 47880 tgaagcttga cgaaagacgt cggatcgcga ccgtgctcta caagtggaat ccaagtgtta 47940 atgagtggac actgattcac gttgatgagc tccggaactt cgacaacttg aagtgggacc 48000 ttaaagggat aaattctctc aagtttgtct agatcgcaag cctttgcggt gacttttgct 48060 ttacgaggca tcgcccacct tcccgatcgg tagcgctccg tttctagatt tgagtctcat 48120 atacaatcat gtgacagttc tgggctttgt tccaaaagtg tgaagctcgc ttctctgttg 48180 ccttgagcgt gaaagctagc tctgtctagg aaggattgta ttgattgagg atgctaccgg 48240 ttgtgtactg ccggttgtgc tgagcgagaa gaacaggact agcaaggttg acctcatcaa 48300 cggaaccagc gacaagcctg acctatatca ttcggcggta tcaggggctg acaatgtaag 48360 gacgcccatc aatggtcgca atgaagctct agctgcacaa cagcccttga ctacctatcc 48420 accgctaaat gcagagagcc accatccagg agcgagttga ggtggggctc cgatattgta 48480 aagagagctg ctttgcaaac gagtaaatag tctgtaccaa atgtccgacg atactgttcg 48540 ctctctgaga agcccttgat gaccttcttg gcccgtcgcc gtttcctcca gacccaatct 48600 cgcagcatgc tggtcttttc gtcgaagcgg ctcttctgcc tctttatgtc tatgcttttg 48660 ctggtcaatc tcattgaagc agccggcagc tcgaaaggtg ctacagccgg tgacgccgcc 48720 agcgcttcag ccggcacgac tgacctcgcg gccaatgacg ctagacgcct caccaaagac 48780 gatctggaca tgcttttccg agcccgacaa gaacacgccg taccagtcta cacgaacgct 48840 ggagagaaat ggcttcccac actaacgtgc cttatctcgt ccagtaccca aacgctccca 48900 actttgaact tcgggcgctc gaaacagcac acgaatacgg agccaggtat gtcggaaagc 48960 ctgcagacaa tatatccact tcttggaacc gtatctgggg acgagtgagc aggccgcaga 49020 aagacacata ttttctcagc gtcattcatc ctcagcacaa gctcggacag gagatgggct 49080 tagccgataa caaacggatt gctactttgc tttggaagta caacaaggcg aaggatgaag 49140 caaagttggt gcatgtcgac gagctgaatt acgccaaagg cctgaagtgg gagcttgatc 49200 ctttgaaact agtcatccag catcactagt cccacatgaa aggcgagtag tctgaggcgg 49260 cagtctgcct cgacacaaac gctgctttgc ccaccttttg cagaactcgt ctaaagctcg 49320 ttcgcaagat ttctcctatt tcctttctct tcaacccaag atgtgttctt ccttttgtgg 49380 acatgatgaa cgacgtgggt ctgttcggaa gcgacaatgt ttcgtcttct ccataaccca 49440 ttcacactga aatatagcag ggggcagaat cacgatgtgt tgcacacaaa gtaggggggc 49500 gaaagtgata gttggaggcc cggttcctgt gggcatcggt ctggctttcc cactgttggc 49560 agcagacaaa gacaatcctc tcgtcgtcac gggcaaaagc gagcctctca gtagcagtgg 49620 gctaattttt tgtctatata tgataaagtg attcgccgag gatctagatg cggtcgacct 49680 tcccgtccat cacagaagct ccccattcca tacttccctg cctcagccca atcttccctc 49740 cagtcacgat tatctccgaa tgcaggttct ctctaaccgc ttcctcggcc ttttggccct 49800 cctcttctca cttgtcatcc tgggtgtcgc tgccacccgg cttagtgata aagaggaaga 49860 catgctcaat caggcacgaa gtccttacca gtctcccatc tacgaaaatg ctggtcatgc 49920 atggcagacc tggacacttt atcctaaact tcaggattac tcgcacatcc ctgactttga 49980 gcgtgatgct cttgaaatgg cttataggaa aggtgccatg cacatcagcg acaccatgga 50040 cgacaacgac atccgaaaca gggcatggcg ttctggtagc cacagtggta gcaagttggc 50100 cagagatgga catatctact tttacagtat tgttcctcct cgatcttaca tgggactcca 50160 gatgggactt cccgagaaaa accgggtcgc tagtctgctt tggaagcatg atccgggaac 50220 ggggcagacc aagttgattc atgttgacga acttcagcac tataagaacc tacagtggga 50280 catggataag ttggaagaca ttctcaggca tcactgagac agatcattgg ttcagatttg 50340 gcctgcgttg ctacccgttc tagcttctcc tcttagcgac gcacgagttc tttccgccat 50400 caaacaacgt ttcgttactt ctgcctccga gctagtcatt gttagtcaat cgctttccct 50460 gcaatcttag tctcattgac ctcctaatcc aggcctgagc gtttcagatc aaccggtgaa 50520 agcagccaag tagcgcgcgc acaatagtga aggatgttga caaacgcatt caattgcaac 50580 agtgcatgta acggttgttc ccaatcttgc ctaccggctc acctcttcca acaatggtcg 50640 atctgtagca ctctggagtg agcccactag agagacgcga tgaaggacgt gggctatgtt 50700 ggcggtagca ctgctactcc cgctcaacgc acgcccacta gctcaggatc agatgatcaa 50760 gggtgctttc tggtttggga cttgacgctc tgctttcaac cgtctttggt gccgttgaag 50820 cacctccagc tactagcttt gctttacgaa gaggtcaatt tgagtcagag gcatggtata 50880 taaggcccac ctcgaccttt tttccttctt gtcctctcaa gtcattccac cattcctcga 50940 tacttgtcgc agctcaagcg attcgtcaat atggttgcca ttcaccgccg tctcttcctt 51000 ctcctgctcc ttggcgtcat ctttgcaatg accgccaccg ccgccccacc ctacatcaat 51060 ccggacgaag agatgatcca acactctatc ggcaaacttg gcactgtcta cgccgattcg 51120 ggtgtcacat atgcaccggt caacgccgcg ggcaaatatc gcgtctacaa ctttgaagaa 51180 aaggcgtggg acatggctca cggtggcgca acctatgtcg gtacgcgtca acacttccga 51240 ggaggtcaaa agtatggtca accttggaag tatttctatt ccatcattcc tcctgacaca 51300 ccgttgggac gggagatggg cttgcctgac cacaaactcg cgacggtgct gtggaggtac 51360 gggaacggtc gaaagtcgat ggtggaactt caggaggcgg ataactatat gcatcattct 51420 gggttcaatt ggaacgggat gcaggagctg aaggatgtaa ttggacatca ctgaagctcg 51480 tctgttctgg actggtgatg gtctcgttgc ccgcgctctg acagctgtcg tcgaccagtg 51540 gttgggacgt ggatcgctcc cgcctctcaa gcaa 51574 <210> 2 <211> 18268 <212> DNA <213> Pseudozyma tsukubaensis <220> <223> genomic itaconic acid metabolism gene cluster in Pseudozym a tsukubaensis <400> 2 ggctgagcgt tttactcgac agaatgcttg aaccaattct tcatcgacgc caactcgtaa 60 cgccagtttg cggcgatcaa ggtgtattgg gattggagaa gaccaaggat gatttagcgg 120 tagatctggg acaggataga gatcggagga ggaggaggaa atcgaaccag ataggtgacc 180 atagggacga atttcctttc tttttttttt ctctttcttt tttcttttct ttttcatttt 240 cttttttctt ttctttctct ttctcttacg gctgtgctca ctccgagcaa tcaatgtttg 300 tgttctcttt tacagtaaat gtgctcactt cggcggcatg cactaaacat gtcgcaagcg 360 gaagcttaac acgcagcctt aaatcttaca atatctagga tgccggtgtt cagtgtgtgc 420 cttttccttt tccgaacgtc aaaacggata ttgacagagc cagctgttcc ggagatgtgg 480 ttcttgtgta agctgcagat acccgggcaa aaggtacaag caggactgcc gggtaggttg 540 aaaggcgatc ccccttgttc ttaccgatgt caatattgat aagagccgat aagtgcaatc 600 acgcaatcag gtagcggatg gtcttgatgt ccgcttcacc aatctcccat tatttgaggc 660 agagccagag gagtacttct acgtccacgg ttaagttagt caagcggaga gctgatagtc 720 atgatcgttg gcgcacgccg aggctgagtt tagactctag atcatacatg attaacctca 780 atagaatgag ttatgcaaaa aaacgggtcc agagcctcgt cgattcaaga tcagcagtga 840 gccgattcaa gcacgaactg aagatcaggt gcaagataac tctgggccta ggacggtcga 900 aggcgcgaac aagcgaggtt tcgagtggac aagtacgaaa cgggggagga actagtccac 960 gatgatcgga tgcacatggg ttacagtcaa gaaggaggga gttcgcaaga agagcgtgat 1020 gcctacaatg tagccgaaac gaaagctatg tgtgtgttcg ggtgggggta aggagccaat 1080 tcgagagaaa gagagagaga gagagagaga gagagagaga gaggaaggga aagagagaga 1140 gagagagaga tggggaggaa ggcagccagg tcgcatcttc tgccctagga gcctgacgaa 1200 cagtatatca acgtatttac tctggttgga ttcaatgaga tagaccagca aatcctcagc 1260 tgttcgcaaa ataccatgta ctggcggagt gatactgaca tcacaacgat tgatttcctt 1320 gcggttggac aatcaaatta gactagtgac ctcgcttgtg tgcgcattag ctgctgcctc 1380 aagatagttt atcataagga attgtctcgg atgtccacgt tgatggtctt ttgcctcgtg 1440 cccgactggc ctttgtgtgc ctgatcttga tcaaagatct ccattcgcac caagaaaatt 1500 tgtacccgac atccgaatcc gaacgtgcag tctattatac acatttcgaa gatggcagct 1560 ttcctgttgc cttagtctct cgcaacgcgt tctcctgctt gctaggaacg cttgagctaa 1620 tttcaatggt tcttagaccc cgaaaagtcc tattaatatc cagtcttttg cgaaatcagt 1680 gtcaattttc acagacgaat cttgcaggcc tacttcattt cgcaacctac agcttcaaca 1740 agcaggtaca aagggttcac ctttatcgat acgtcggttg tataacgcag attttgccgg 1800 aatgactggt ccgatgtgtt tctatggtgt cgaggagcgc aaaaagctcg tcctgccatg 1860 cgtctgaacc gtgcgaatct tgaaccattg caacgagctc agctcggtcc catttttata 1920 tattcaaagc aatccactct gagccgaatg gtcccgtagt gtctcccctc ctgtccatca 1980 atctcgacga aaagaagcga caatgagcct ctcgaacagc aatcacaacg agcgccacaa 2040 cgacgacaac aacatcaatg acgatgattg tgctaacttc tttgagctga tggttcagcc 2100 tgcctcttct tcttcttacg gcccctactt tcccgaccca ggactggcgc ttccagcaat 2160 ttccgatgtc tcatcaacaa cagatacgcg actaccgtca cagctcggag tgaccccatt 2220 cagtcatcag acatcgccca tccgatccgc agatgaagga gagaagacga caacaaccgc 2280 atcatacaaa agaaagcatt ccgaggtgga gaaagaccgt cgaagaatca tctcaaacgg 2340 atttgcagtg agtttccctc ttcttctacc ataaagttca ggctggttga gctgaagtcg 2400 acgtttggca atatttgtgt agatcttgca gaacgtcctc cataacgact caacttccaa 2460 acccatctcg aaagcgaccc tacttcaaca agcgtgcgac gaaatccgtg aactgcgcaa 2520 aaaacttgat acgagcatta ccatcatctc ccgctatggt ctcgaaaatt tgtttcaggt 2580 ggctccaacc cccaattctt tgagcaatgc ttctcctccc aatggtacga gtagggctta 2640 ccctacctat tcgaacgacc tcggcccgga tcgtttccaa gactcgcggc gtagttccac 2700 ttcggcgacg agtgtgtctg gatctcaata taacaatggc gctgccgcta aggaggatgg 2760 aaacgagagg cgtaattcca acgtgaagag gagaagttct tacaccaaca gcatcaacag 2820 cagcttcgag tcatccgagg aggacactct gaatagcagt tgcgacaaca caagtgactt 2880 cgacgaaagc gttggcagca gcgaaagcga aagtgaaaca aacaacagga caagaaacag 2940 aaacagaacc aagagggcaa tggcaacagc aaagctcaaa gaccgagacc gcgccaaagc 3000 tcgaaccgca cccaagccac acagcaatcg cttatcgcct gcatccacta taacgccaag 3060 tgagatgagc agcagcttag ccagcccaaa cacctcttca caagagcata tccagcaagc 3120 catcttgtca ttgctcctcg aattgccgaa acatctggag aatgtgcaca agtcgaagcg 3180 tccttcctct cagcagccaa gcacacagat tgatcaaacc ggaaaccgga ctacgacggt 3240 aacgaagacc aggagacggc accgatgatc ttgatcaacc ctgcttgcct ccacttccgt 3300 tgtgtagata caaagtctga caaccctaat ctatgtgtat atgggcgtga tcccacttca 3360 tcgactacgt tcgtgcgtta ccgagagcgt tctgttgtga gatagtatga ttgctgtctt 3420 gacaaaggca tacgctcttc ggcctttttc tggtgtgtgt gcttgacaca aattcgggga 3480 tcatgctagg ctcggtggtg gccaaacact cacatacatg cagtggaggg tgggagacga 3540 atcaaagttt cccaacttgt gagtgagtcg ctaacgagct tcaagccgtg gccataagag 3600 gttcgattgc aagaaagcag taaaggcaat gtagagaagc gaaacaaggg cggaacgcaa 3660 gggagagtgc aaaaaggaac gaagatgctg gatcgcctcg gaggcgatca gcagcgaaga 3720 attgatacgc atgacggctg caggcatcga gctgagctgt gtctctgctt agtccacgcc 3780 tcaagcctag tgaacctagc actcatatca agcgctctgc atggctaatt cgttacagtg 3840 caaatctgaa cgcgaccaag cctggaagac ggatcatctt gtatgtacag aagaaattca 3900 aaccctaacg aagaacgcca aagccaacag gaatcaaaac tcgggaccgg cgagaagcca 3960 aactacctgt tcatacacgc taaaaatgac tcctccacta acgatgaggc gcatactacg 4020 tgatacggaa ccacgccaca gagctgctat gccctctgta ccgatggtgt cggtcaagca 4080 gtgccacgtg gatcggtagc gcgaagcgtc gatggcctgc atcctcgttt tgagaacgtc 4140 aaatggcatg gtcccataca cggcgacaac gccagatgta gcaccgatgg agaaagtggt 4200 caaccaattg acgaaggatg aacccttgcc ttgggctttg ggaatgaaat ctcgcatagc 4260 agagtatgta cctagtcgga tcgctgaggc cgagccttgg cgtagaatga ctggaaatac 4320 acctttgtag ataccgccaa acccttcttg tcggatgatc gaggcggttc cacggaagag 4380 accctgttcg tagcgtggtt tggcacgctt gccgtcgtcg atgagttttg tttctggtga 4440 aagcaataca gcgcaaggtc agtctgtctc gcccttcttt ggttctgttc tgcgagtttg 4500 cgtgggcact cactgatcgt ttcactcggt gtcacagcga atatggcttc cagcgtgcca 4560 gcgcccattc ctgcaatgta gttgctaccg ctcgataatt tcccctgcga aagatttcag 4620 tgtcagtcta tttcctaatg catccatgct aggggaaaac actcactgtt gatttgttct 4680 tgagcatatt tcgaaaattc tcaaaagcca aaaagcgaac accagccttg gaagcgttgc 4740 cgacaactac agccgaacaa ccacgaaaga gccctctagg cccttctttt tcaagtgttg 4800 atcggaaaac atccaatggt gaaagacgtt cacgattgcc gtgagtatct cgctgtgcga 4860 actgtgtaac tgtcttgaga tactcgatgg ggaaagtggc cactaaggaa gacaagaaga 4920 ttgtaaggta aaattactag caaaatggac gaggcgaaag cgatagaact cacctccttc 4980 aacagcgcct gcagtcgcac cggccagcac cgagactgaa ggagagatgt tgcgttgaac 5040 ggacggcatc ctagctgatt ttgttctttg ctgtttgtaa tcgggaaagg cgctgtcccc 5100 gctcaggaca agcagagagt gtttgggcct tatgaacctt tcagcgagga ccagctctct 5160 tactatttgt tttcagggtt ttccaagaga cacaggaaaa tagcctcctt actcaatcta 5220 tggtgttcga acccggtcgt ggccatatag gctacctatg caatcacaca agttattcgg 5280 cgctcagttg tggcgatcgg tctgagataa tttgctgagc tgcagctttt cgtgcagggc 5340 gacctcgtca cgctcatgct ttttcaagcc aagcactatc acgcttgact aggagtaccg 5400 tggtggtctc tcagaatgtt gtgtccaaac cacgtgttgt gcccgaacca gctatcaagt 5460 gctcgcacga ttcgcaaagg aaactatcga gctttgctca gcatattcag cgtgacaagc 5520 acgatgcctc atgtcaattc agctcaatct catgcaagac ctgcgacaga gagtgcgacc 5580 atggggagta aatgaacgtg accaagtaag tcagataaga gaccaggaag gcataaatct 5640 gccacctcca cgaggtgttt gagacctgat aggagcatga caaggagcag acaaaagcga 5700 acgagatcag gctttcacac agttgcacga gagattatga ggatttgaat ctgacgatat 5760 gattggaccg gcaaaatgtt gcgatgagca aaatggcact gtaaggatgt gaaagactgc 5820 tctcataggg ctgtggaatg cgtgccgcgg tagctagaca cagtgctgtc cggcatattg 5880 taatatagct cactttcctt cccttccgaa ccaagtggaa tgatgtgaga tctatcttta 5940 cctcttccca atgcgagcgc cagcgactga tatgccctat cgagcatctc cgcgctggtt 6000 ggagtgacgg gtgagatgat cggtatttca accgaagggt gccgatcagg catagtataa 6060 tagacgcggg cgtgtgcaat cagggctacg gaacgctcaa cgtgggcaat atctagcgaa 6120 cggggtgagt cgctttcggc ggctgtaagt ccaatctcga gaacgccact aggatgttcg 6180 atagagatgc gacgctgagg cgtgtaggga ggggtggtat cgccaggcga tgaagagagc 6240 gaaggagtgc gtgacgaaaa gatgtccgag accaccgttc caggtacata ggcggctccg 6300 gcggtgcaga tggcaccggt gacggcgtgt gcgttgtggc aagttttggg agtgaagtct 6360 gttggacaaa aaggaactga gaatcagcag ccgtcaatca ttcaacaagg tacggtcaat 6420 tcagcgttga gaacttacac cgtgccgtaa aagtggtgca attggaacct ggtccgatga 6480 gagacaattt gggcaccacg ctagaagaaa catcacccca gcccattcgt cgacctgcct 6540 ccaggcgtac acgttccagt cgagatagca aggcagtgtc cgcattgagc gtcgctgggg 6600 tctcgaaacc tgtgatacca acatcggctt gacgaacaaa aacaacaggg atggccgaat 6660 cgatgacgga tacctcgagt ccctcgattg agtcagtggc attgccagtt ggaagaagct 6720 tgcctgtgca tgcacccacg gtattaagga agcgtaagct gacgcgagcc gaaggacgct 6780 gcaagcccgt atcgtccaca tctttgtagt ggactcgacc atcttgaacc ggaatgagga 6840 gctcggatgc ctggttggag ttgagattaa agatgcgcac aaggcaggtg gtgtcggatg 6900 gatgaggctt gactagacct cgctcgatcg cgaaggcagc caccccgctc atcaaattgc 6960 cgcagttggg tgctgtgtcg acgatgcgct cattgatgcc aacttggcaa aagaggtagt 7020 caacatcgga gtgatcgctc tgtgcacttg gcgagactat ggccactttt gaagtcagag 7080 aattgccacc ccccataccg tcgatctgca gtggatgtcc ggaacccatg atggacagca 7140 gcgccgcatc acgagcgctt ggctcggatg gcaggtcact tgccaagagg tataagccac 7200 gactggtgcc agcgcggtaa attgtggtct caatgcctcg cagcatcgtg aagctgtcag 7260 tgtgactaac gacaaaagcc aataagatgg acggctaacc aaaacgtcgt tatatgatct 7320 ttcttcgcct gagttcttcg gtcgaggcca tggaagtacc tactatcctt ctgaaccact 7380 tgacacgtcc cgcaagagga ttcgacattc tcgattgacg taggtgtcaa attgtgcgtg 7440 aaccaccacc accacttcaa ggcacgaggg ctagacgtga gatttagact agtagacaat 7500 gagcctggct gggagaatgc gtgcaacgct gtcaaacagt gcatttgccg gcggtgtcct 7560 cagaagctgc acgcgatggt cacgctcctg aattgtgggt gagagcggac gtagcctgat 7620 ttaaaattta tctaaaggta ttattaatat taaaaatgag atacgttcaa cgatcagcag 7680 aagaatgctt ttggctatcg cagtttgtat cgaatttccc atcggcttta ttgaaattat 7740 aatacggtgt attatactgt tcagtacagt acagtagtac tgtacgtaaa tgaccatata 7800 ctgcgcccgc tcttacttag cactgctatt ttcaaagctt ttccaatgga acgacaggag 7860 acgttctctt gttgatcgac gctgaatttt gtttaccgac aatccgccta cgccgctgca 7920 gcaaggaatt tcacacagta gcgtagcatg aaccgtttcg tcggacggtg tcggatttcg 7980 aaatcgagaa cacggcggac aaggtgtcaa ttgctaacag cgtgcaaatc cgctgcacaa 8040 gaagagcgtg cccatgcttc ttggccctac atactgctct tatcgaccct tcggacatgc 8100 aaagggtcat cttctgcctg aagaacatgc ttcgtctgac ccaagaatgt acggcctgtc 8160 caggtcaggt actcgtctcc gatccaagga ggatgataag cttcgtggca ctaagcggtc 8220 ggttcgtctc acaaacgcca taccaccgcc tttgccgtgc attcccatag tggccttccg 8280 aagctcgacc acttcacatc ccaatgtagc tataaaatcc aagcttgaag agctcattac 8340 tgatgcctag gagtggcgtt tactgctcct tccttcgaag cgcccatcgg ccctcacttc 8400 cgtagacatg cttccacaga cacctgttcc agattaccgt ctcagcatga gatattcgac 8460 agacagcgtc gcagcatcgc aagcgttaac aacgcctgaa gcagctccaa gtatttccca 8520 tcacgcagac acgggcgagg ttcaacaggc gcatagcggc gatgacggcg cgctcgaaga 8580 gggcgcaatt gctcactcaa gtaaggaagg gtcacaacga gatcagcaaa cggagcttta 8640 ctgtgctttc acaaagggca ccaagctctt cgtcgtcttg tccgtgtcta tcgcgggctt 8700 tttctcgcca ttctccatca atatatatat ccctgcgttg cctcagatct cgaagctact 8760 acatacatcg gaaggtgagt gagacgattt ctcgtagaga cagtttccca gaagcagctc 8820 ctcatcatca tattttgtct tattgtagcg gctactaatg taacggtaac cgtctacatg 8880 atcgcacaag gcctctcgcc ggtcatctgg gcacctcttt cagatgtaag tccccatttt 8940 atgtgacgcc tgtctctgtt gtaagatgtt tccacaggat caatctctga aatttctcgc 9000 ctgtcaaatc ggcacgtaca ggtttttggc cgcagaccca tctacattgc aactttcctc 9060 gtttttttcg tcgccaatct tgggctttcg ttcaccaatg tctactggct cttggtcgtc 9120 ttgcgtatgg ttcaagccgc aggagcatgc agcgccatcg ctattggcgc aggaacgatt 9180 ggcgatgtta ccgagcgcaa ggaacgagga agttatatgg gctattatgc gcttgcccaa 9240 tatactggtc cagccatcgg gcccgtaatt ggaggtgcgc tttcgcaaag atgggattac 9300 cattctacct tcttcttcct cagtgccgtt tctggtgtct ttctgatctt catggccttc 9360 ttcttacttg aaacgcttcg tgttctagtg gggaacggaa gtgcacgcac attcggcatc 9420 tatcgcactt tagtgggacc cagactggtc aagtcgacgg caaattcgat gcgtccaagg 9480 atgaagagtc cgcttgaagg tcgactcgaa tttggattcc atcgtccatt tttggtgttt 9540 gcacgccccg agactagcct ggcaatcctg gctttttcga tggtgtatgc aacatactat 9600 ctatcgtctg cctctttgcc ttatctcttc aagcaagtat atggtctaca cgagctactc 9660 attggggtat gcttcgtgcc tagtggtgtt ggttgtgcct tgggcacggt gctcgctggc 9720 aagatcctcg attcggacta tcgacgcgcg ttagacaaga acaagtcggg tgtcaaggtt 9780 acgcgcgcac ggctgcagtc ggcctggatc tacttgccag gctatgcctc ctcgcttcta 9840 gcgtacggat ggtgtgttcg ggcgcatacc cacatcgccg ctcccatcct ttttcagttt 9900 acacgtaagt gagaattcaa tcttccgaat cgtggatcct gttcgtgtac agcagtgctg 9960 actctgcctt tcaattaatc tacgaaacag tcggcatgtt ttcaacaatg tacttcacca 10020 acatcaacac actcgttgtg gatctgtacc cgggcaaggc agctactgcc acagctgctg 10080 ttaacgtagg gcgttgctta ctcggcgctg tggctgtggc catcgtacaa ccaatgaccg 10140 atgctatggg cgctggatgg acattcacag tcggcgcgct ccttgctctg ttcatcggtc 10200 tgatttgcca gacactcatt cactttcatg gcgagaagtg ggcagctcgc aagcactctt 10260 gatttgattt ctacaatgct atcgctctgt tcaacatact gtggactcaa ttcacatgcc 10320 tctgaaatgc aaaatcatat cacccagctg gtcgttaaat tcttcagaaa ttacctggac 10380 tttgaaaatg ttcatcttca gtagcgggtt tctcattcag cagatctggc atgaaatgct 10440 ccggacctac ctgaatcggt cgcgaagcaa gaccatatga ctagggggtc cttcgtgtgt 10500 gcctcggggt tggtatgtac agtacatctg tcatgatcag atcaattttc atgataagag 10560 acgtttgcgc agcggcaacg gcacccttca cgtgatttgc acggtccatg gaacatgaac 10620 catgcgtgat ttgcacgcag acgaatctga gcgtcctctc accttcggcg acagcgactt 10680 ggtcacgcga acaaggcatg gtttcaacat cacaccacga ctgcctcgcc ttgttcgaaa 10740 ctgcttcaac actcagtatc actgtactga ggtgactggg gtcgcggttg aagatcaagg 10800 ccggcctggc aaattttgta taaaattgta aatgaaccag gcagtcatgt tgtcactcac 10860 ataggaagtt gtccttggag ccagaatcga ccaagttcct tacctcatca tctcactatg 10920 gcaccttctc tcaacgcgaa ctcaacagcc gatcggcgga acgccactgc tgcccctgac 10980 cttctatccg gcaataaagc cggtggtggc ctcaagcttt ccggattacc agacctctcc 11040 gactcggcag gcaccttgag cgacgtattt ggaacgccgg ccatgcgcct catctggtct 11100 gaccaaaatc gagttgcttg ctacctcgag atcgaggcag cgctcgccgt tgtccaagct 11160 gaactcggta tcatcccaaa gcacgccgct caggagatcg tcaaacactg ccgtgtagat 11220 gagatcgatt gggctctgta caagcaaaag accgaattga tcggctatcc tgtcttggga 11280 atcgtccagc agctggttgc caactgcaaa gatggcttgg gagagtactg tcattggggc 11340 gctacgacac aagatatcac cgacacagct accattatgc agattcgtca gtcgctcgcc 11400 ctcgttaagg agaagctgtg cagcatcgtt gcgagccttc ggtacttggc ggaaaagcac 11460 cgcaaccttc ccatggctgc gcgttcgaat ctcaagcaag ccgtgccaat aacttttggt 11520 ttcaagatgg cgcgcttctt ggccactttc cgccgacatc aggagcgtct ggccgagctc 11580 gagaagagaa catacacact agaattcggc ggtgcggcgg gcaacttgtc ctcgttaggc 11640 gaaaagggta ttgcgacgca cgatgcactc gccaagatgc ttgacctttc acccgctgac 11700 atcgcctggc ataccgaaca cgatcgcttt gcagaggtag gtgccttcct gggtcttctg 11760 acgggaacgc tagccaaact cgccacagac atcaaactca tgtcgcagac cgaggtgggt 11820 gaggtcgggg agccattcat ctcaaaccgt ggctcatcgt ccaccatgcc gcagaagaac 11880 aacccgattt cgtgcgtgta tattcatgcc tgtgccgcca atgtccgtca gggaactgct 11940 gcgctgttgg atgccatgca gtcggatcac gagcgtggca ctggaccttg ggagatcatc 12000 tgggttcaac tcccgctcat gatgaactgg tcggcagcgg ctctggccaa tgccgacttc 12060 attttgaagg gattgcaggt cttccccgat gccatggtcc gaaacctggc cttgtccaag 12120 ggcttgatcg tctccgaagc agtcatgatg gcgctcggcg acactctcgg ccgccagtac 12180 gcccatgacg ccgtctacga gtgctgtcga gcggcctttg agcataacag accgttgctt 12240 gatgttcttc tcgagaacca agaaatagct agcaagctga agcgtgccga gctagagagg 12300 ctttgcgagc cagccaatta tcttggacaa tgctcccaat ggatcgatcg tgtcttgcta 12360 cctccttcca cgtgaattaa gtagtgcgct tcagttcaac ttgttcaaat gctcaccgca 12420 tttgatgctt ctttgcttgc caacctttct tttaatgtag ctattgttta attgtatata 12480 ttacgggttc atttttgaag atgacggttc caaggcttca ctctcacgga ggcatgttac 12540 tcaccatcac cattacaagg ctgcgtcagc gaagtcaacc atcatcaaga cgatacaaaa 12600 ggtgggcatg gctcggcagc caccaccact acttctagtg caagtgcagc tgctacctct 12660 gctactgcag cggctcagga agccagccag accgccaaga cctcgacaga atgccactct 12720 cacgccgatg gctctcttca ctgcggctcg cactgaacag atctttggca tcggccacgg 12780 aatctagatt cgatttgagc cactaccaat caattacttc tgcaaaatgt atatagttcg 12840 cagcaacatt gacatggttc gaacaaacac aggaagcagt gcagaggcga acgtccttcg 12900 atactttctg cacagcgccg aaatccatga gcttgcccgt gatggaatga agatgaaaat 12960 aagactcaaa tgaagccaag caactcattt gcaggcgatg cactcactct ggaaagttat 13020 tgaccaacac atgaattgcc atgcgaatcg tggctgaaca agagtcgacg tgtcggaccg 13080 acgaaagact tgaaggtcac cagaggttgt ggttcagttt tctgttcaag cgctatatca 13140 caacttgcct gtggaattag actgttccac caatgttcca taggccatga ttgagtgtct 13200 gttccagcaa caatggatta gcttgtggaa cacgtttcaa acattgaaat tttttcgttg 13260 tgtcacaaat tttaatataa atgttgacgt cacatttgtt ttgccagaca gatgtacacg 13320 aaattccgac gaatatcccg gctggcgagg ttccagagtc tcggctgtcc aacattgcca 13380 aagatcgacg gaacgccgta acgaatgcgc ataaaaccgt tggcactaca gaaattccgg 13440 gaacacgctg accggatcaa acaacggctt ttgacccgtc ctcttgaagc tgtccaccta 13500 ctcatcagct ctggtctaag cttgctggaa tcttatgtag aggcatggct gcagtcagct 13560 ccggaacaag atcgtcaagg aagaagtttt gatcatcttt tgaggcctct ccctgaatct 13620 acttggaaag gacggcgtct attttggccg ggtctagcct cggaactcca aacaattgtt 13680 ctagagaaag aaaaaaataa aaaaatgtac aaattatact tcacgtttga agcctgtatt 13740 aagtgacccg taccctcatt tgtaccagag cagcggttag ccttgatcga ctgagcaata 13800 gcgccgaaat ggtggaaaag tgtgccgccc gtttgccgag tctggacgcg ctatcccgaa 13860 caattctctt tggtaagggt tggttgggct tttaaatgac gtttgaaggc cgtcgtcacc 13920 tcggacgttt tgtgggagta atgatggatg actctgttca ctcgcggtct tgtgtccttt 13980 cacggctccc ccgctgtggc tgaattctgg tacagggtgt tctgtaaccc aaccaaactg 14040 aagagtgttt tgtctttgac agcagactat gcaccataat gggatacttg acacgaaggg 14100 atataaaatg aaccacccta atcagcaaac acagcccaaa cagctcctac ttccgaacaa 14160 ttcgaacctc gagctaatcc acggctcaaa tcaagcgaga accaaccaac caagatgcct 14220 ttcgctcgaa ccctgctgct ctcggccata gtgggctcgg ctgccttgac cacagcagct 14280 cccgtttccc ctgcttgtca accagccctt cggcaatggg gtcaaatcac cttcaatgaa 14340 attgctctca gcataggcga cgacggcgat tttgtgattg gtgggccgaa tcccataaat 14400 tttgcagtcg ccacctgctc gaaggaatac catggtaaat acgaggttca gggcgaagcg 14460 taccttgtcg acgctacaga ctccagtcaa tgcctgactg cgagcaatct tgaccagcag 14520 aactcaacgt tctcattcca agattgtcgt tacaacggcg ctggagatat ctcggcctcg 14580 caattctttg catattacac tgactacgat gcagccaata ccctgaaagc gtacttcaac 14640 ggcgaaatcc ccagagtagt caatgccact cagcctccca tctacaatct caagagtcaa 14700 tatgataagc tgagctttga aggcagtctc gggaaattga tggtcgatta cacccccaac 14760 ctctcttcgg ttccttcggc ttcgctcgca ataccgaaag gataccttcc cgtgactgca 14820 cctccgcaga ctgatgatcc tgcgctgaag tgtggcactt atcaagtcgg ccagctccac 14880 ttcaacaatc tgacttcgag ctcgaatcag tataatgggc ctctgaatag cggatgggag 14940 gccgacccac acactaagga caagttcatc tttgaacagt gcgactactc accctcgggt 15000 attaaggttc aaaacgacgt tgtttatggt cgtctccgtc ctgcaaccga gcttcaagac 15060 tgcaaattcc aatgctatga gttcatgggt caaggggacg gaggttggat catgggtctc 15120 caagaacaac cctgcggata cgcgaccgct tcctccaaag aggccgccca ggagagcttc 15180 gacgtgatca agctcgacaa gtcggacaac acggttgaat gggtcacctt caagaacgga 15240 actcaaacca gcgtgtattc ggcctacact caagtcgact atgaccagga gtatgacgtg 15300 tctcaacaca tttggaaccc gctcgggatc ggctatattc agctctcccc ggacaatgca 15360 aacctgacca aatttccgcc tggtaaagtg agcttcgtcc ccaatgcgta agtcaaccag 15420 tcctcgcagt ccaagcttcc agtctctctc gctgcactca gtcatgcaaa taggatgcga 15480 cctcttatcc caagctccgc tttgagtaat tcttcgtatg ccttgttgca atatgcgagt 15540 aagttttgct gtgcctaatg ctgcggcact gagattatgt ttagttgact acgtctatcg 15600 agaaattctg gtggacttgg tcgcatgctt gatacgagta ggtaagtgta aagatgccga 15660 caagggatgc aatgccctag cattcattgc tggacctgga acggagtcct gttggagtgg 15720 cgccgactga attgcttcag tctgagcgct accattctgc gtccacaggc cgaaattcgc 15780 gtttcgggcc gagcgtgctt cgagacaccc cctttgctgg aaggagactg ttggttggac 15840 ccaacgaagc gtccgtcaag tttacctcgt ggatatactt tgcggaggca ctgcatagct 15900 tttgcatcaa ggcatcagct tgcttgggga gcaatggggc atcgaggcac agatcctgcc 15960 agacgaaacc accaaagagc tctttgcatt tggcgattgc cacgatagtt ccacctgggt 16020 gtttgcgcgc agcggttgcc aaagcgcaac caaaggcaga gcgggcagcg ttatcgtgtg 16080 agctcatacc ggcgaatcgc tccatcgcag ccatcagcac tgcgtcaaag gctggctgtg 16140 gtgcgtctaa caactgagtc aatcgttcac tcgcgtgtgc aaatccatgt agaagttgtg 16200 gctcaagttc agggcgtgcg gctgcctcag ccaacagtgc aatcacaatg tcctcgatgg 16260 agactcttcc agatgaatcg ctgacggtag ggatcggcaa atcatcaagc aaagtaagcc 16320 ggccttgggt gcactgtcct cgttcttgaa gctcaagctg tcgtaattcg taaaggaagc 16380 gggggttggg ctccacctgg ggtcgagaag atctgagttg ggctagggcg tcagccaaag 16440 agatcttttc ccagatgata cgtactgcca agacgagggt agcgctacgt gagacgcctt 16500 cgtagcagtg cactagcacc tttccgcccg tctggcatgc ttgctcgatc cattttgcag 16560 cgtcagcaaa gtaaggaaaa aggcgctcgc tagtgctgtc tctgacatac agatgccagt 16620 attggaattg gtcgggatgg aggtcttgaa cttcgcgagc cgcattgagg atgtgagtga 16680 tgccaagcga tttgaggcac tgcgcgtcag ctgcctctcg cacacctcca agataaaggc 16740 catccacgag aaaggatggc ggatctgaat agattttcag catgcgtgga acggcaatgg 16800 tggcaatgtg gatgaatgtg aactcctaat gcgcgaaccg aaggctttca aaagaggcgg 16860 tctctttatc gatcttgcag taccaagcac cctgctgtaa gacgagcgca gactgtatgt 16920 gagagcggac ggaagtaacg aagtgtcata caaggattgc atctaggagg aggttgatac 16980 ttcaactagc tcccattcac aagacagagt cacgttagat tctcgagcga gcgcacgatg 17040 tgagaacccg taagcgtgac acctgatgag aagtgacgca cgtgccaaca gcagtgaaca 17100 ttttcggcta aacgccaaaa gagcctggac tagatcaccg ggatcggcac cacatgtcat 17160 ttagaatgct tagaatgcgc aagggaaaat ctgtttgact ggcagccaag tcttctgaaa 17220 gtatagtgca tcactgtcac aggcgtcccg agtcagctgc ggaaaagtcg gactcaatct 17280 ctttcgatcc gaaacggatt ccacaccatt taggcggtgg tttttgggga atatcaacct 17340 gcttgctgaa acaagacggg tcttgctgga ttttgaggaa atgtcacagc agcagagtgc 17400 gatctgaatt tgctggaaat ttcaaaagtg gaggcagcac agcgcagcgc agacgcgtca 17460 aatttggatt gggtggaggg aatacaaatt ccaaccacag cggtggcaca gcggtggatg 17520 gtcggactga aattttgtat tgcccagatt tgggagacgg tcaacactgt tgtggtgcac 17580 ctcaccagat gaattgcaac aatttggcac gccatcctga gaaggcaggt tgcaacaaat 17640 ttttgaatat cagcatagca ggctgtaaca aaaaagacgg tctgtaacaa caataatatt 17700 cattttcaga tgacaggtag taacaagtgg aaggcgggct gtcaataaat ttttcaaatg 17760 ccttcatttc aagcatgacg gtctgtaagc cccagtatca atttggattc aaccaaaata 17820 gcagtttggc ataccagact gcttgaaaga tgacggtcta tcaatatctc tgtgcagttt 17880 aaatagagat gtgagagaat tctgttggtt gactgttgtt tgtcagcccc accacatccc 17940 aaccaaccat gttgtttaca acctgtcctg cctgcactta cacatattca accagcaaca 18000 tcaccaacca catttgcaaa gctcacaagg gtgtgtctgt gacagcagca gcagccaaag 18060 cttgtggatt ggttgcatgc ttgtgtggac agacgttgct caacaaggca gcgctggcac 18120 ggcaccaggg aataaggaaa tgccagcttg ctgtctccca gcctttgcaa ccatctccgt 18180 tggctgctgt tttaaatttg cagccatcag ccaccccgtt gctgttgccg ttgccatctc 18240 caatttcaag tccatcgact cccaccag 18268 <210> 3 <211> 283 <212> PRT <213> Pseudozyma tsukubaensis <220> <223> Pseudog4085.t1 <400> 3 Met Thr Arg Leu Ile Ala Leu Gly Ser Ser Phe Ala Ala Gly Pro Gly 1 5 10 15 Ile Pro Pro Gln Val Asp Thr Asp Ala Gly Arg Ser Ala Asn Asn Tyr 20 25 30 Pro Asn Tyr Leu Ala Arg Arg Leu Asn Leu Asp Pro Asn Asn Thr Asp 35 40 45 Glu Phe Leu Asp Leu Ser Val Ser Ser Ala Thr Leu Leu Asn Leu Ile 50 55 60 Ser Glu Pro Gln Asp Thr Gly Lys Lys Val Tyr Ala Pro Gln Leu Ser 65 70 75 80 Leu Leu Pro Glu Leu Lys Glu Gly Asp Asp Gly Ser Asp Ala Ile Val 85 90 95 Thr Ile Thr Gly Gly Gly Asn Asp Met Phe Tyr Ile Gly Ser Met Phe 100 105 110 Gly Leu Thr Phe Lys Asn Thr Trp Trp Gly Arg Leu Leu Ser Tyr Phe 115 120 125 Val Leu Ser Lys Glu Glu Lys Glu His Phe Glu His Pro Thr Ile Ala 130 135 140 Ser Pro Asp Glu Ile Ser Gln Arg Phe Ala Thr Leu Ile Asp Gly Val 145 150 155 160 Gln Lys Lys Tyr Pro Lys Ala Thr Ile Tyr Leu Val Glu Tyr His Ala 165 170 175 Met Met Gly Pro Asp Thr Lys Ala Trp Arg Asp Val Cys Trp Asp Gln 180 185 190 Gln Gln Val Gln Lys Tyr Ile Glu Met Ala Glu Gln Leu Gln Ser Leu 195 200 205 Tyr Ala Lys Ala Ala Glu Gly Arg Asn Asn Val Tyr Val Val Pro Leu 210 215 220 Ala Glu Glu Ser Lys Leu Lys His Ala Leu Gly Ser Lys Glu Pro Trp 225 230 235 240 Val Ser Asp Gly Ser Phe Trp Asn Phe Lys Asn Arg Cys Ala Tyr His 245 250 255 Pro Asn Gln Ala Gly Met Lys Ala Ala Ala Asp Ile Ile Tyr Asp Phe 260 265 270 His Thr Gln Arg Ser Asn Ser Lys Ala Ala Ser 275 280 <210> 4 <211> 852 <212> DNA <213> Pseudozyma tsukubaensis <220> <223> Pseudog4085.t1 <400> 4 atgacaaggt tgatcgcgtt gggctcatcg ttcgccgctg ggccaggcat ccctcctcaa 60 gtagacactg acgctggtcg aagtgcaaac aactatccca actacttggc gcgtagactc 120 aatctcgacc cgaacaacac ggatgaattt ctcgaccttt cggtgtcaag tgcgacgcta 180 ctcaatttga tctccgaacc gcaagatact ggaaagaaag tctacgcccc tcaactaagt 240 cttcttcccg aacttaagga aggagatgat ggcagcgatg cgatagtcac gatcaccggt 300 gggggcaatg acatgttcta catcgggagt atgttcggtc tgacgttcaa gaacacatgg 360 tggggtagat tgttgtcgta ttttgtcttg tcgaaagaag agaaggagca ctttgaacac 420 cccaccatcg cttcgccaga cgagatctcc caaagattcg caaccttgat cgatggcgtc 480 cagaaaaagt atccaaaagc gacgatctac ctggtcgaat accacgccat gatgggaccc 540 gatacaaaag cgtggaggga cgtatgttgg gatcagcaac aagtgcaaaa gtacatcgag 600 atggccgaac agcttcaatc gctctacgcc aaggcagcgg aagggaggaa taacgtctat 660 gtcgttccgc tagcagaaga gagcaagctc aagcacgcac tcggatcaaa agagccttgg 720 gtatcagacg gctcgttctg gaacttcaaa aacagatgcg cataccaccc caaccaggcc 780 ggcatgaaag ctgccgccga tatcatttac gactttcaca cacagcgttc caactcgaaa 840 gcagcttcat ga 852 <210> 5 <211> 767 <212> PRT <213> Pseudozyma tsukubaensis <220> <223> Pseudog4086.t1 <400> 5 Met Pro Tyr Thr Pro Pro Arg Ser Ser Gln Pro Pro Lys Gly Leu Pro 1 5 10 15 Phe Glu Leu Ser Leu Ser Thr His Pro Gly Ala Gln His Asn Arg Ser 20 25 30 Ser Leu Thr Pro Val Ser Phe Leu Leu Arg Ala Ala Leu Ile Thr Pro 35 40 45 Arg Lys Leu Ala Ile Thr His Pro Glu Lys Gly Tyr Ser Phe Thr Tyr 50 55 60 Glu Gln Trp Ala Ala Arg Thr Leu Ser Leu Ala Phe Ala Leu Arg Ser 65 70 75 80 Leu Pro Ala Phe Lys Ile Gly Asp Arg Val Ala Val Ile Ser Pro Asn 85 90 95 Ala Pro Leu Ile Ala Asp Ala His Trp Gly Ile Pro Ala Val Gly Gly 100 105 110 Ile Ile Thr Pro Ile Asn Ile Arg Asn Thr Pro Lys Glu Val Ala Tyr 115 120 125 Val Leu Glu His Ser Gly Ser Thr Val Ile Leu Val Asp His Glu Phe 130 135 140 Thr His Leu Val Pro Glu Asn Pro Gly Pro Gly Ile Thr Val Ile Val 145 150 155 160 Ser Lys Asp Ser Gly Gly Gln Glu Ala Asp Asp Pro Tyr Glu Lys Phe 165 170 175 Leu Asp Arg Gly Phe Leu Glu Trp Gln Arg Ala Glu Gln Ala Glu Leu 180 185 190 Lys Ala Tyr Lys Ser Arg Thr Arg Pro Ser Ala Glu Pro Lys Thr Gly 195 200 205 Trp Lys Leu Ile Glu Ala Pro Gln Asp Glu Glu Gln Pro Ile Ala Leu 210 215 220 Cys Tyr Thr Ser Gly Thr Thr Gly Arg Pro Lys Gly Val Leu Thr Asn 225 230 235 240 His Arg Gly Ala Tyr Leu Ser Ala Val Ala Asn Ala Phe Glu Ala His 245 250 255 Leu Thr Gln Asp Ser Val Tyr Leu Trp Val Leu Pro Met Phe His Ala 260 265 270 Cys Gly Trp Thr Tyr Pro Trp Ala Val Thr Ala Ser Leu Ala Thr His 275 280 285 Phe Thr Ile Arg Lys Val Asp Asn Thr Val Ile Trp Asp Ala Leu Leu 290 295 300 Asn His Gly Val Ser His Tyr Cys Gly Ala Pro Thr Val Gln Ile Gly 305 310 315 320 Leu Val Asn His Pro Asn Ala Arg Lys Leu Asn Arg Arg Val Asn Val 325 330 335 Ala Val Ala Ala Ser Ala Pro Thr Ala Asn Leu Leu Ala Lys Met Glu 340 345 350 Gly Leu Asn Leu His Pro Val His Val Tyr Gly Leu Thr Glu Thr Tyr 355 360 365 Gly Pro Phe Thr Arg Arg Tyr Phe Glu Pro Glu Trp Ala Lys Leu Asp 370 375 380 Val Asp Ala Arg Ala Arg Met Met Ala Arg Gln Gly His Ser Tyr Leu 385 390 395 400 Thr Ser Asp Glu Val Arg Val Val Arg Thr Ala Ser Ser Thr Asp Ala 405 410 415 Ser Thr Pro Asp Leu Val Asp Val Glu Arg Asn Gly Gln Glu Thr Gly 420 425 430 Glu Ile Val Ile Arg Gly Asn Met Val Met Val Gly Tyr Tyr Asn Asp 435 440 445 Pro Ala Ala Thr Ser Lys Ala Val Met Lys Gly Trp Phe His Thr Gly 450 455 460 Asp Leu Ala Val Arg His Pro Gly Gly Glu Ile Gln Ile Leu Asp Arg 465 470 475 480 Gly Lys Asp Ile Ile Ile Ser Gly Gly Glu Asn Ile Ser Ser Leu Met 485 490 495 Val Glu Gln Glu Leu Ala Ser His Pro Ser Val Leu Glu Cys Cys Val 500 505 510 Ile Ala Arg Pro His Glu Lys Trp Gly Glu Arg Gly Gln Ser Phe Ile 515 520 525 Val Leu Thr Glu Gln Ala Lys Ala Lys Leu Asn Phe Ala Glu Ile Lys 530 535 540 Lys Lys Gly Ser Pro Glu Asn Lys Ala Phe Val Glu Glu Val Lys Lys 545 550 555 560 His Cys Val Glu Arg Met Ser Lys Phe Ala Val Pro Glu Trp Phe Asp 565 570 575 Val Val Asp Glu Leu Pro Lys Thr Ser Thr Gly Lys Val Gln Lys Asn 580 585 590 Val Leu Arg Ala Arg Phe Ala Thr Ser Thr Ala Ser Ile Gly Thr Met 595 600 605 Thr Ser Ile Leu Arg Asp Ile Leu Ser Thr Tyr Val Thr Gly Gly Lys 610 615 620 Asp Pro Phe Arg Asn Leu Ser Tyr Ala Ala Val Pro Leu Ser Leu Leu 625 630 635 640 Leu Ala Ala Leu Pro His Trp Tyr Thr Ile Tyr Leu Ala Glu Ser Asn 645 650 655 Lys Val Gln Gly Gly Trp Ser Asn Val Asn Pro Arg Phe Trp Val Gln 660 665 670 Thr Leu Thr Ala Lys Ala Leu Thr Lys Lys Leu Thr Pro Leu Glu Asn 675 680 685 Gln Ile Leu Arg Gly Gln Ser Cys Gln Ala Asn Ala Phe Glu Asn Val 690 695 700 Pro Leu Phe Ile Ala Thr Val Val Trp Ala Asn Val Ser Gly Leu Glu 705 710 715 720 Arg Glu Thr Ile Asn Asn Phe Val Val Gly Tyr Leu Pro Ser Ser Asn 725 730 735 His Thr Lys Val Arg Thr Phe Glu Tyr Lys Thr Ala Ile Arg Leu Cys 740 745 750 Thr Thr Ala Phe Glu Leu Arg Tyr Ile Phe Leu Leu Thr Arg Asn 755 760 765 <210> 6 <211> 3251 <212> DNA <213> Pseudozyma tsukubaensis <220> <223> Pseudog4086.t1 <400> 6 atgccctaca caccaccacg ttcgtcgcag cctcctaaag gtttaccctt tgagctttcg 60 ctctcgacgc atcccggcgc gcagcacaac cgatcttcgc tcacacccgt gtcgttcctc 120 ttgcgtgccg cgctgattac gcctcgcaaa ttggcaatca ctcatcctga aaagggctac 180 tcattcacct acgagcaatg ggcagcacgt actctctcgc tcgcctttgc acttcgcagc 240 cttcccgcct tcaagattgg tgatcgcgtc gctgttatct cgcctaacgc acctctgatc 300 gcagacgctc actggggtat tcctgctgtt ggtggtatca ttacgccgat caacattcga 360 aacacgccca aggaggtcgc ttacgtcttg gagcactcgg gtagcactgt aatcttggtc 420 gaccacgagt ttacacacct cgtccccgag aaccctggcc caggcatcac cgtcatcgtc 480 agcaaagatt cgggaggaca agaagctgac gatccatacg agaaatttct cgatcgtggc 540 ttcctcgaat ggcagcgtgc tgagcaggct gagctcaaag cctacaagtc tcgcactcga 600 ccttctgctg aaccaaagac gggatggaaa ctcatcgagg cgcctcaaga cgaagaacaa 660 cccatcgccc tctgctacac ctcgggtact actggtcgac ccaaaggtgt gctcactaac 720 caccgtggag cctacctttc tgccgtagcc aacgcttttg aagcccacct cacgcaggat 780 agcgtctatc tttgggttct tcccatgttc catgcttgtg gatggacgta cccttgggct 840 gttactgctt ctctcgctac gcatttcacc attcgcaagg tcgacaacac cgttatctgg 900 gacgcgttgc tcaatcacgg cgtatcgcac tactgcggtg cccctacagt tcagatcggc 960 ctcgtcaacc atcctaacgc acgcaagctc aaccgtcgcg tgaacgttgc cgtcgcagct 1020 tccgcaccca ccgccaacct cctcgccaag atggagggtc taaacttgca cccagtccac 1080 gtatacggct tgaccgaaac atacggtcct ttcaccagga ggtacttcga gcccgaatgg 1140 gccaaactag atgttgatgc tcgagcacga atgatggctc gccaaggaca ctcctacctc 1200 acttcagatg aggtacgtgt cgttcgtact gcttcttcca ccgacgcctc tacacctgac 1260 ctcgtcgatg ttgagcgcaa cggtcaagaa acgggcgaaa tcgtcattcg aggaaacatg 1320 gtcatggtag gctactacaa cgatcccgcc gccacttcca aagccgtcat gaaaggctgg 1380 ttccacactg gcgacctagc cgtccgtcac cctggcggcg aaatccaaat cctagaccga 1440 ggtaaagaca tcatcatctc cggaggcgaa aacatctcct cgctcatggt tgaacaggaa 1500 cttgcctccc acccttccgt cctcgaatgc tgcgtcattg cacgaccgca cgaaaagtgg 1560 ggcgaacgcg gccagtcgtt tatcgtgctc acagaacagg cgaaagcgaa actcaacttc 1620 gcagagataa aaaagaaggg ttcaccggag aacaaggcgt ttgttgaaga ggtgaaaaag 1680 cactgcgtgg aaaggatgtc caaattcgcc gtaccggaat ggttcgacgt agtggacgaa 1740 ttgccaaaga caagcacggg caaggtgcag aagaacgtgc tccgagctag gttcgctagt 1800 aagttgtaaa agtagatcgt gtcgcgtgga atgagagcaa tggaagtgtc atctattctt 1860 ggtcgatgca acggtgcgat gtgtgtctct tggatgcgtc ggtaacgtgc ttttgacaac 1920 ttcgagaaga ttcacccgac gacagagggt aatgcactga caagcgcata gcacggaggg 1980 gcaaagagct gcctcaacag cccaatcctg tacgaccata cgagcaagag tgagacacgt 2040 cttcattgtt tgacacgaag aagtttacgg caaggaggta acttttttta cgccagagaa 2100 ggatggttcg tttggtggtg gagccgcgct tctccgcaca gcgagaagag gggcgtaggt 2160 gtgggggagg acagtccaag tccaagtcca aggtgtcgcg tgaaattgac cgattttggc 2220 aggttttgcg gctttgtgca gatcactttc aaaagccgcc gccgccgccg cctcctgcgc 2280 ccagaacatg tgtggagttt tcgtttttcg ctcgtgccac cttttccttc tctttgtgtc 2340 gtacattaca tccactcaac cttccttctc atccttccac ctttcgttct cttatttcta 2400 tccttctcac catcaccacc agcttccaca gcgtctatcg gaaccatgac ttccatcctg 2460 cgcgacatcc tttccaccta cgtcacaggt ggtaaagacc ccttccgcaa cctctcgtac 2520 gccgctgtac ccctctccct cctcctcgct gccctccctc actggtacac catctacctt 2580 gccgaatcga acaaagtcca aggaggatgg agcaacgtca acccccgctt ttgggtccaa 2640 actctcaccg ccaaggctct caccaagaag ttgaccccgc ttgaaaacca gattttgagg 2700 ggtcaaagtt gccaagccaa cgcgtttgag aacgtgccgc tgttcatcgc caccgttgta 2760 tgggcgaacg taagcggctt ggagagggaa acgattaaca actttgtagt gggatatctg 2820 gtaagcaggg ctgcgtacac ggtgttgtat ttgaagacgg aggggtatgc gaacagtttt 2880 gctaggacgg cggttttcca agtgggaatc atctggatta ttaccgtttg gatgaagggg 2940 gcttttaggg gtttgccgct cgtcaagtga gcgtatgatc gaggcgagag gagagggagc 3000 taggaaagaa ggattggcaa acccatagaa gcacagagtg gagagcgaac aaggggtcca 3060 cactcaagac gtaacgcccc gcgaatcagc cccacgcttc gctctcactc tcgttcccct 3120 cctcaaatct acactgacga tagccaagca gcaatcacac aaaagttcga acgttcgagt 3180 ataagacagc tatccgtttg tgcacaacag catttgagtt gcgatacatc tttctcttga 3240 caagaaacta a 3251 <210> 7 <211> 510 <212> PRT <213> Pseudozyma tsukubaensis <220> <223> Pseudog4087.t1 <400> 7 Met Pro Lys Pro Gly Pro Ala Ser Arg Ser Ser Ile Ala Asn Leu Met 1 5 10 15 Arg Met Ser His Ala Gly Gly Cys Pro Cys His Gly Cys Ser Val Ala 20 25 30 Arg Gly Gly Ala Asn Leu Ala Arg Ala Gly Met Asn Met Ile Ala Lys 35 40 45 His Asn Ala Gln Pro Gly Ala Asn Ala Arg Gly Tyr Ala Thr Pro Val 50 55 60 Asp His Ala Val Glu Arg Glu Tyr Ala Phe Glu Leu Ala Ala Ser Asn 65 70 75 80 Ile Arg Tyr Gly Glu Gly Val Thr Lys Glu Val Gly Met Asp Phe Ala 85 90 95 Asn Met Lys Ala Arg Lys Val Gly Val Phe Thr Asp Pro Thr Val Arg 100 105 110 Asn Leu Thr Ala Met Lys Gln Ser Ile Asp Gly Leu Glu Lys Ala Gly 115 120 125 Val Lys Tyr Glu Ile Phe Asp Gln Val Arg Val Glu Pro Asn Glu Lys 130 135 140 Ser Trp Glu Ala Ala Ile Arg Phe Ala Arg Glu Gln Asp Phe Ser His 145 150 155 160 Phe Leu Ala Val Gly Gly Gly Ser Val Met Asp Thr Cys Lys Val Ala 165 170 175 Asn Leu Phe Ser Cys Tyr Pro Asp Ala Asp Leu Leu Glu Phe Val Asn 180 185 190 Ala Pro Ile Gly Arg Gly Thr Pro Ile Asp Lys Val Leu Lys Pro Leu 195 200 205 Leu Cys Val Pro Thr Thr Ala Gly Thr Gly Ser Glu Thr Thr Gly Thr 210 215 220 Ala Ile Phe Asp His Thr Ala Thr Glu Ser Lys Thr Gly Ile Ala Ser 225 230 235 240 Arg Ala Leu Arg Pro Leu Leu Gly Ile Val Asp Pro Leu Asn Thr Glu 245 250 255 Thr Cys Pro Thr Ala Val His Ile Ser Ser Gly Leu Asp Val Leu Phe 260 265 270 His Ala Leu Glu Ser Tyr Thr Ala Ile Pro Tyr Asn Glu Arg Met Pro 275 280 285 Arg Pro Ala Asn Pro Leu Gln Arg Pro Ala Tyr Gln Gly Arg Asn Pro 290 295 300 Ile Ser Asp Val Phe Ser Leu Trp Ala Leu Lys Gln Thr Val Lys Tyr 305 310 315 320 Leu Pro Arg Val Ala Lys Asp Lys Thr Asp Phe Glu Ala Arg Gly Gln 325 330 335 Met Leu Leu Ala Ser Thr Phe Ala Gly Ile Gly Phe Gly Asn Ala Gly 340 345 350 Val His Leu Cys His Gly Met Ser Tyr Pro Ile Ser Gly Leu Asn Lys 355 360 365 Lys Phe Gly Lys Tyr Gln His Pro Gly Tyr Glu Val Asp His Pro Ile 370 375 380 Val Pro His Gly Ile Ser Val Ala Leu Thr Gly Pro Ala Val Phe Asp 385 390 395 400 Phe Thr Ala Pro Ser Ala Pro Asp Arg His Arg Asp Val Ala Ala Ile 405 410 415 Phe Ala Gly Tyr Asp Ser Gly Ala Glu Ala Thr Asp Ile Ala Arg Leu 420 425 430 Pro Asp Ser Glu Val Gly Ala Leu Val Tyr Asp Arg Ile Ala Ser Phe 435 440 445 Leu Ala Asp Leu Gly Val Pro Arg Gly Leu Ala Lys Ile Gly Tyr Gly 450 455 460 Gln Glu His Val Glu Ala Leu Val Lys Gly Thr Ile Pro Gln Arg Arg 465 470 475 480 Val Leu Asp Leu Ala Pro Gly Ile Gly Asp Val Met Gly Ser Asp Gly 485 490 495 His Glu His Leu Ala Arg Ile Leu Glu Lys Ser Leu Ser Tyr 500 505 510 <210> 8 <211> 1533 <212> DNA <213> Pseudozyma tsukubaensis <220> <223> Pseudog4087.t1 <400> 8 atgcccaaac caggcccagc ttcccgtagc tccatcgcca acctcatgcg catgtcgcat 60 gcaggtggat gcccctgtca cggatgctcg gttgctcggg gtggagccaa cctcgctcgt 120 gccggaatga acatgattgc caaacacaat gctcaacctg gtgccaacgc acgcggatac 180 gccactcccg tcgatcacgc cgttgaacgc gaatacgcct ttgaacttgc cgcttccaac 240 attaggtacg gtgaaggtgt caccaaggaa gtcggtatgg atttcgccaa tatgaaggcg 300 aggaaggtgg gtgttttcac cgatccaacg gtgaggaatc tgaccgcgat gaagcagagt 360 atcgatggac tagagaaggc tggggttaag tacgagatct ttgatcaggt cagggtggag 420 ccgaatgaga agagttggga ggcagcgatc aggttcgcac gtgaacagga cttctcccac 480 tttttggcgg tgggtggtgg atcggtaatg gatacgtgta aagtcgccaa ccttttcagc 540 tgctaccctg acgccgatct gctcgaattc gtcaacgctc ctatcggtcg tggtaccccc 600 atcgacaagg ttctcaagcc tctgctttgc gttcccacca ccgctggtac gggatccgaa 660 accaccggta cagccatctt tgatcatacc gctaccgagt ccaaaaccgg tattgcctcc 720 cgagcccttc gtcccctgtt gggtattgtt gatcctctca acaccgaaac ttgccctacc 780 gccgtccaca tcagttcggg attggatgtg ttgttccacg cactcgaatc gtacaccgcc 840 atcccgtaca acgaacgcat gcctcgcccc gcaaacccgc tccaacgtcc cgcttaccaa 900 ggacgtaacc ccatctcgga cgttttctcc ctctgggcgc tcaagcagac cgttaagtac 960 ctcccgcgcg ttgcgaagga caaaaccgac tttgaagccc gtggacagat gcttttggcc 1020 tccacgtttg ctggtattgg attcggtaat gctggcgtcc acctttgcca cggcatgagc 1080 taccctattt cggggttgaa caagaaattt ggtaaatacc agcacccggg gtacgaggtg 1140 gaccatccca tcgtacccca cggtatctcg gtcgctttga ctgggcctgc agtatttgac 1200 tttacggcgc cttcggcgcc cgaccgtcac cgtgacgtag cagctatttt tgcgggttac 1260 gacagcggtg cggaggctac ggatatcgct cgtctgcccg actccgaggt tggtgcactt 1320 gtgtacgata ggatcgcgtc cttcttggcc gacttgggcg tgccgagggg tctggctaag 1380 atcgggtacg ggcaggaaca tgtggaggcc ctcgtaaaag gaaccattcc acagaggagg 1440 gtgttggatt tggctccggg tatcggtgac gtgatgggca gcgatggcca cgaacacttg 1500 gctaggattc tggagaagag tctgtcttac taa 1533 <210> 9 <211> 513 <212> PRT <213> Pseudozyma tsukubaensis <220> <223> Pseudog4088.t1 <400> 9 Met Lys Ser Glu Ala Ser Ser Ser Ala Leu Val Leu Ala Leu Thr Leu 1 5 10 15 Leu Ala Ser Ala Ser Thr Val Ile Ala Glu Pro Ser Ser His Ala Ser 20 25 30 Tyr Arg Pro Ser Lys Leu His Asn Arg Arg Gln Ser Ser Pro Asn Pro 35 40 45 Asn Gly Ser Thr Ala Ser Gln Glu Ala Ile Tyr Gln Gln Ala Phe Thr 50 55 60 Asp Pro Val Ala Ala Ala Lys Ala Ala Asn Ala Leu Pro Tyr Ile Ala 65 70 75 80 Gly Gln Tyr Ala Thr Gly Gly Leu Tyr Arg Tyr Asn Ile Val Pro Asp 85 90 95 Asn Thr Gln Leu Pro Trp Asn Ala Asn Val Pro Phe Thr Pro Glu Ala 100 105 110 Ala Val Asn Gly Ser Val Asp Gly Gly Trp Gln Ala Leu Pro Glu Ile 115 120 125 Gln Gly Met Thr Leu Asn Arg Thr Phe Ala Val Ala Pro Gly Ala Val 130 135 140 Met Pro Phe Tyr Gln Thr Gln Gly Phe Asp Ala Thr Lys Ile Lys Arg 145 150 155 160 Ala Val Met Ile Met Pro Gly Lys Pro Arg Asp Cys Trp Lys Tyr Thr 165 170 175 Ser Leu Ile Gln Asn Ala Leu Asn Val Phe Glu Thr Asn Pro Gln Ser 180 185 190 Ala Gly Ser Ser Ala Asp Gly Ser Thr Thr Gly Asp Asp Ser Gly Arg 195 200 205 Leu Gly Lys Asp Gln Val Leu Ile Leu Gly Pro Cys Trp Met Asn Ser 210 215 220 Asp Asp Ala Lys Ala Gly Ala Ile Gln Ser Gly Glu Leu Tyr Trp His 225 230 235 240 Gly Ser Gln Trp Gln Ser Gly Met Ala Ser Arg Gly Pro Gly Asn Thr 245 250 255 Ala Ile Ser Ser Tyr Gln Val Met Asp Ser Phe Met Asp Ala Leu Phe 260 265 270 Asp Lys Thr Thr Phe Pro Ala Leu Asn Thr Val Val Met Ala Gly His 275 280 285 Ser Met Gly Ala Gln Met Val Gln Arg Tyr Ser Val Val Lys Lys Pro 290 295 300 Asp Ala Tyr Asp Ser Asn Ile Ile Phe Trp Val Gly Asn Pro Gly Ser 305 310 315 320 Tyr Val Trp Leu Thr Ser Ser Arg Pro Asn Asn Ser Asn Thr Ser Cys 325 330 335 Ala Ser Thr Ala Asp Asp Trp Ala Tyr Gly Leu Asp Gly Ser Gly Val 340 345 350 Pro Asn Tyr Ala Arg Asp Arg Val Lys Asn Asn Lys Gln Gln Leu Leu 355 360 365 Thr Thr Phe Glu Ser Arg Asn Val His Tyr Asn Tyr Gly Leu Leu Asp 370 375 380 Asn Gly Gln Gly Asp Thr Ala Cys Glu Ala Ser Leu Gln Gly Ala Asn 385 390 395 400 His Leu Glu Arg Gly Cys His Phe Val Glu Ser Leu Ala Ser Leu Thr 405 410 415 Gly Asn Gly Lys Leu Pro Val Thr Gln Thr Ala Asn Phe Met Pro Asn 420 425 430 Val Ser His Glu Asp Tyr Ala Met Leu Ser Tyr Asn Ile Ser Leu Tyr 435 440 445 Arg Leu Phe Gln Glu Met Pro Thr Gly Ala Ala Asn Val Thr Ala Ala 450 455 460 Asn Asn Gly Ser Ser Ala Ser Ser Thr Ala Lys Lys Gly Gly Ser Gly 465 470 475 480 Ser Ser Ala Gly Ser Lys Ser Ser Ala Ser Ser Met Val Thr Gly Gly 485 490 495 Val Val Thr Leu Gly Ala Gly Ala Val Leu Ala Phe Ala Leu Ser Leu 500 505 510 Leu <210> 10 <211> 1542 <212> DNA <213> Pseudozyma tsukubaensis <220> <223> Pseudog4088.t1 <400> 10 atgaagtcgg aagcatcctc atcagccttg gtgctggctc tcaccttgct cgcctctgcc 60 tcgaccgtca tcgccgaacc ttcctctcac gcctcgtatc gaccttccaa gctccataac 120 cgcagacaat catccccaaa ccctaacggc agcaccgctt ctcaagaagc catctatcaa 180 caagctttca ccgatcctgt tgctgctgcc aaagctgcca atgcactccc ctacatcgca 240 ggccaatacg ctaccggagg tctttaccgc tacaacattg tcccggacaa tacgcagctt 300 ccttggaacg ccaatgtgcc tttcactcct gaagccgcag tcaacggaag cgtcgatgga 360 ggctggcaag cattacccga gatccaaggt atgacgctca accgcacctt tgctgttgca 420 cctggagctg tgatgccttt ctaccagacc caaggatttg acgctaccaa gatcaagaga 480 gctgttatga tcatgccagg caaaccaaga gattgctgga agtacacttc gctcatccag 540 aacgcgttga atgtgttcga gaccaacccg cagagcgctg gtagcagtgc ggacggatcg 600 actacaggcg atgacagtgg aagacttgga aaagatcaag tgctgatctt gggtccctgc 660 tggatgaatt ccgatgatgc caaagcgggc gccatccagt ctggcgaact gtactggcac 720 ggatcgcagt ggcaatcggg tatggcttcg cgaggacccg gcaacaccgc catctcgtct 780 tatcaggtta tggactcctt catggatgca ctcttcgaca aaaccacctt ccccgccctc 840 aacaccgtcg tcatggccgg tcactcgatg ggcgcccaaa tggtccaacg ctactctgtc 900 gtcaagaaac ccgacgccta cgactccaac atcatctttt gggtcggcaa ccccggcagt 960 tacgtctggc tcacctcctc tcgtcccaac aactccaaca ccagctgcgc ctccaccgca 1020 gacgactggg cgtacggcct cgatggctcc ggcgtcccca actacgctcg cgaccgtgtc 1080 aagaacaaca aacagcaact cctgaccacg ttcgaatcgc gtaacgtcca ctacaactac 1140 ggcctcctcg acaacggtca aggcgatacc gcatgcgaag cttctctgca aggcgcaaac 1200 cacctcgaaa gaggatgtca ctttgttgaa tcgctcgcca gtttgacggg gaatgggaag 1260 ctgcccgtga cgcagacggc taactttatg cccaatgttt cgcacgagga ttacgccatg 1320 ttgtcgtaca acatttcgct gtatagattg ttccaggaga tgccgacggg tgctgcgaac 1380 gtgacggcgg cgaacaatgg gagcagtgcg agcagtacgg cgaagaaggg tggtagtgga 1440 agcagtgctg ggtcgaagag ttcggcatcg tccatggtca cgggtggggt tgtgactcta 1500 ggagcaggag cggtgcttgc tttcgccttg agcttgcttt ga 1542 <210> 11 <211> 283 <212> PRT <213> Pseudozyma tsukubaensis <220> <223> Pseudog4089.t1 <400> 11 Met Ser Lys Leu Thr Leu Gln Ser Thr Tyr Ser Leu Gly Asp Gly Val 1 5 10 15 Asp Met Pro Val Leu Gly Phe Gly Val Tyr Leu Ser Pro Ser Asp Val 20 25 30 Cys Val Asn Ser Val Thr Thr Ala Leu Lys Thr Gly Tyr Arg His Ile 35 40 45 Asp Ser Ala Gln Tyr Tyr Glu Asn Glu Lys Glu Val Gly Asp Ala Val 50 55 60 Arg Gln Trp Cys Lys Glu Glu Gln Val Ser Arg Arg Gly Ile Phe Val 65 70 75 80 Thr Thr Lys Val Ile Phe Pro Ser Lys Thr Lys Glu Glu Thr Leu Glu 85 90 95 Ser Leu Arg Glu Ser Val Lys Lys Ile Asn Leu Asp Gly Tyr Val Asp 100 105 110 Cys Phe Leu Ile His Thr Pro Thr Ser Gly Pro Glu Gly Arg Lys His 115 120 125 Leu Trp Glu Ala Leu Lys Glu Leu Gln Ser Glu Gly Lys Val Val Thr 130 135 140 Ile Gly Val Ser Asn Tyr Gly Leu Lys His Leu Gln Glu Leu Ile Asp 145 150 155 160 Ala Gly Glu Thr Pro Ala Val Asn Gln Ile Glu Leu His Pro Trp Cys 165 170 175 Gln Gln Arg Pro Ile Val Glu Leu Cys Lys Lys His Asn Ile Val Leu 180 185 190 Gln Ala Tyr Cys Pro Ile Val Arg Gly Glu His Lys Asp Asp Glu Glu 195 200 205 Leu Leu Lys Ile Ala Ala Lys His Lys Val Asp Trp Ser Gln Val Leu 210 215 220 Ile Arg Trp Ser Leu Gln Lys Gly Phe Val Pro Leu Pro Lys Ser Asp 225 230 235 240 Thr Pro Ser Arg Ile Ala Ser Asn Ala Asp Val Phe Asn Phe Glu Leu 245 250 255 Asp Asp Glu Asp Met Ala Thr Leu Asp Ala Lys Asp Gln Gly Ala Lys 260 265 270 Gly Ala Val Ala Pro Asn Pro Val Asp Cys Glu 275 280 <210> 12 <211> 1309 <212> DNA <213> Pseudozyma tsukubaensis <220> <223> Pseudog4089.t1 <400> 12 atgtcgaagc ttactctgca gtcaacttac tcgctcggcg atggcgtcga tatgcccgtt 60 ttgggtttcg gcgtctacct gagtccttcg gatgtttgcg tcaactcggt aactaccgct 120 ctcaagactg gatacaggca cattgactcg gcgcagtact atgagaatga gaaggagtga 180 gtgcggccct tcccgctttt ccagctgact tagaggaaag gaaagacgat gctgacggtt 240 ttgctcttga ctcttttcgc attggtgcta tcttagagtc ggcgacgccg ttcgacagtg 300 gtgcaaggag gagcaggtct cgcgtcgtgg tatctttgtg acgaccaagg tgatcttccc 360 ttccaagacg aaagaggaga cgctcgagtc gttgcgcgag tcggtgaaga agattaacct 420 cgatggtaag tctccctcct taacctttcc agattcgatg atagatgcaa tgctgatcaa 480 caaacgagta actctggaac cacaggctac gtcgactgct tcctcatcca cacgcctact 540 tcgggtcccg agggacgcaa gcacctctgg gaagcgctca aggagttgca gtccgaaggc 600 aaagttgtta ctatcggcgt tagcaactag tgagtagctc ccatcaattg tcattggcta 660 caaggcttag gtgatgctga ccagaatcct tcttcctttg catggatccc aacagcggtc 720 tcaagcacct ccaagaactc atcgacgccg gcgagacacc cgctgtcaac cagatcgaac 780 ttcatccttg gtgccagcag cgtccgatcg ttgagctttg caagaagcac aacattgttc 840 tccaggctta ctgcgtatgt tactctccct ctctcccact cttccctttc attgtaatct 900 gtgcgaggga agacaactga cattctgtgc atttctttga tgtgtattgc agccaatcgt 960 tcgaggcgag cacaaggacg acgaagaact cctcaagatc gctgccaagc acaaggtgga 1020 ctggtcgcaa gtgttgatcc gatggtcgtt gcagaaaggg tgagttcagc ggtgtcctgc 1080 ttcattctct caagctctct ttttatctga gtactgacct ctttgctgtg cacacatcgt 1140 ttgtcctaac agcttcgtcc ctcttcccaa gtcggacaca ccttcgcgta tcgcctccaa 1200 cgccgacgtc ttcaactttg agctcgacga cgaagacatg gctaccctcg acgctaagga 1260 tcagggcgct aaaggtgccg ttgctcctaa ccctgttgac tgcgagtga 1309 <210> 13 <211> 428 <212> PRT <213> Pseudozyma tsukubaensis <220> <223> Pseudog4090.t1 <400> 13 Met Pro Ser Ile Pro Lys Pro Pro Ser Leu Thr Leu Leu Phe Ala Ser 1 5 10 15 Leu Phe Thr Leu Leu Leu Thr Gln Asn Ala Tyr Arg Ala Gln Ala Asp 20 25 30 Thr Val Val Gln Asp Pro Leu Gln Ala Gln Ala Asn Ser Phe Gly Trp 35 40 45 Leu Ala Ile Arg Asn Phe Thr Tyr Cys Met Gly Asp Ser Pro Asp Pro 50 55 60 Pro Thr Lys Pro Arg Gly Ile Gln Pro Lys Gly Lys Asn Thr Ile Asn 65 70 75 80 Ala Asp Asp Ala Ser Lys Lys Arg Leu Thr Gly Met Gly Asp Ser Val 85 90 95 Val Val Leu Tyr His Pro Glu Asn Thr Asn Lys Ala Ile Ala Trp Cys 100 105 110 Asn Thr Leu Val Ala Phe Gln Ser Thr Glu His Val Gln Cys His Thr 115 120 125 Ala Leu Pro Thr Cys Gln Arg Cys Asp Ala Val Arg Glu Lys Asn Gly 130 135 140 Val Lys Ser Met Ser Leu Gly Gly Val His Ala Gly Lys Gly Lys Ala 145 150 155 160 Pro Ser Gly Lys Leu Gly Arg Lys Lys His Lys Lys Met His Lys Lys 165 170 175 Met Glu Ser Ile Gly Leu Glu Gly Glu Asp Ala Gly Leu Val Ala Leu 180 185 190 Gln Lys Arg Asp Glu Ser Lys Gln Gln Glu Gly Thr Lys Thr Gly Ser 195 200 205 Gly Thr Thr Thr Ala Asn Asp Ala Gly Gln Arg Gly Gly Ala Asp Pro 210 215 220 Asn Asp Pro Trp Ile Pro Gly Pro Asp Ser Glu Thr Lys Pro Asp Ile 225 230 235 240 Asn Pro Val Ala Ser Thr His Gly Thr Thr Pro Arg Pro Leu Gly Ser 245 250 255 Thr Thr Thr Thr Thr Ala Asp Asn Pro Pro Asp Asn Thr Phe Ser Glu 260 265 270 Asp Pro Glu Leu Glu Ala Ala Ile Ser Glu Phe Gln Asp Tyr Cys Glu 275 280 285 Asn Lys Leu Thr Leu Ala Val Arg Ala Asp Cys Pro Leu His Leu Val 290 295 300 Lys Gly Trp Leu Asp Glu Pro Pro Phe Asp Leu His Arg Phe Cys Met 305 310 315 320 Ala Leu Lys Gly Ser Asp Gly Tyr Thr Leu His Thr Val Pro Ala Pro 325 330 335 Asp Leu Asp Asp Gly Gly Lys Ala Gly Gly Asn Asp Gly Ala Gly Lys 340 345 350 Asn Gly Ala Ala Thr Lys Gly Lys Pro Ala Ala Val Gln Gly Gly Thr 355 360 365 Ser Gly Gly Ala Gln Thr Gly Gly Arg Gly Asp Gly Glu Thr Ala Thr 370 375 380 Gly Gly Gly Gly Gly Gln Phe Asp Pro Asn Asp Pro Leu Val Pro Leu 385 390 395 400 Pro Asp Gly Gly Leu Thr Thr Thr Pro Pro Pro Thr Gln Pro Gln Pro 405 410 415 Lys Val Glu Ala Lys Pro Glu Lys Pro Lys Gln Ala 420 425 <210> 14 <211> 1287 <212> DNA <213> Pseudozyma tsukubaensis <220> <223> Pseudog4090.t1 <400> 14 atgccatcca tacccaaacc gccctcgcta accctcctct tcgcctccct tttcaccctc 60 cttctcaccc aaaacgccta tcgcgcacaa gcagacaccg tcgtccaaga ccccctccaa 120 gcgcaagcca acagtttcgg ttggctcgcc attcgcaact tcacctattg tatgggtgac 180 tcgcccgatc cacccacaaa gccacgcgga atccaaccca agggcaagaa tacgatcaat 240 gccgacgatg caagtaagaa gcgcttaacg ggtatgggag atagcgtggt tgtgctctac 300 catccggaga atacgaataa ggcgatcgct tggtgtaaca cgctggtggc gtttcagagt 360 acggagcatg tccagtgtca cacggcgcta cctacgtgtc agaggtgtga tgctgtgagg 420 gagaagaacg gggtcaaaag tatgagcttg ggaggtgtgc atgcgggtaa gggtaaggcg 480 ccaagtggga agttaggtag aaagaagcat aagaagatgc ataagaagat ggagtcgata 540 gggctcgaag gggaagatgc agggttggtg gctttacaga agcgtgacga aagtaagcaa 600 caagaaggta cgaagactgg atcaggaacg accacggcta acgacgctgg tcagagaggc 660 ggcgcggatc ccaatgatcc ttggatccct ggtcccgact ccgaaacgaa gccagacatc 720 aaccctgtcg catcgactca cggtactaca cctcgtccgt tgggctctac caccaccaca 780 actgccgata atcctcccga taacaccttt tccgaagacc ccgaactcga agctgcgatc 840 tcagaattcc aagactactg cgaaaacaag ctcactctcg cagtccgcgc cgattgcccc 900 ctacacctcg tcaaaggttg gctagacgaa cctcccttcg acttgcatcg cttctgtatg 960 gcgttgaagg gaagcgacgg gtacacgctg catacggtcc cggcccctga tctggacgac 1020 ggcggcaagg cgggagggaa cgatggcgcg ggcaagaatg gggctgcaac caagggaaag 1080 ccggcggccg tccaaggagg tactagcgga ggagcacaaa caggaggccg cggtgacggt 1140 gagacagcaa caggaggtgg tggtggacaa ttcgacccga acgatccgtt ggtaccttta 1200 cctgatggtg ggctgacaac gacgccaccg ccaacacagc cgcagcccaa ggttgaagcg 1260 aagccggaga agccaaagca ggcttga 1287 <210> 15 <211> 280 <212> PRT <213> Pseudozyma tsukubaensis <220> <223> Pseudog4091.t1 <400> 15 Met Ala Ser Thr Asp Val Ala Cys Glu Lys Thr Pro Ser Ser Ser Ala 1 5 10 15 Leu Gly Leu Phe Asn Leu Ser Gly Lys Thr Ala Leu Leu Thr Gly Gly 20 25 30 Thr Arg Gly Ile Gly Gln Ala Cys Ala Val Ala Leu Ala Glu Ala Gly 35 40 45 Ala Ser Val Ile Leu Ala Val Arg Pro Gly Thr Ala Pro Gly Ala Asp 50 55 60 Gly Asn His Pro Ala Leu Ser Pro Leu Leu Ala Val Ser Asp Gln Thr 65 70 75 80 Ser Ser Gln Lys His Ser Thr Val Glu Ala Asp Leu Ser Asp Leu Ser 85 90 95 Ser Val Lys Ser Leu Phe Asp Arg Ala Leu Pro Leu Ser Pro Ser Gly 100 105 110 Gly Ile Asp Ile Leu Val Asn Cys Gly Gly Ile Gln Arg Arg His Pro 115 120 125 Ser Thr Asp Phe Pro Glu Ser Asp Trp Asp Glu Val Leu Asn Val Asn 130 135 140 Leu Lys Ala Val Trp Leu Leu Ser Gln Ala Ala Gly Arg His Met Ile 145 150 155 160 Pro Arg Arg Ser Gly Lys Ile Ile Asn Phe Gly Ser Leu Leu Thr Phe 165 170 175 Gln Gly Gly Leu Thr Val Pro Ala Tyr Ala Ser Ala Lys Gly Ala Val 180 185 190 Gly Gln Leu Thr Lys Ala Leu Ser Asn Glu Trp Ala Lys His Asn Val 195 200 205 Gln Val Asn Gly Ile Ala Pro Gly Tyr Ile Ala Thr Asp Met Asn Glu 210 215 220 Lys Leu Leu Ala Asp Pro Thr Arg Leu Arg Gln Ile Ser Glu Arg Ile 225 230 235 240 Pro Ala Gly Arg Trp Gly Glu Ala Ala Asp Phe Lys Gly Pro Leu Leu 245 250 255 Phe Leu Ala Ser Gln Ala Ser Gln Tyr Val Ser Gly Glu Met Leu Val 260 265 270 Val Asp Gly Gly Trp Met Gly Arg 275 280 <210> 16 <211> 843 <212> DNA <213> Pseudozyma tsukubaensis <220> <223> Pseudog4091.t1 <400> 16 atggcatcca ccgacgtagc ctgcgaaaag accccctcgt cctccgcttt gggacttttc 60 aacctctctg gcaagaccgc attgttgacc ggtggtacta gaggtattgg tcaagcatgt 120 gccgttgcac ttgctgaagc tggtgcatcg gtcatcctgg ccgttagacc aggtaccgct 180 cctggcgctg atggcaacca ccctgccctc tcccccttgc ttgctgtttc cgaccagact 240 tcctcgcaga agcactcgac cgtcgaagcc gacctctccg atctctcctc ggtcaagtct 300 ctcttcgacc gcgcgcttcc cctctcccct tcaggcggca tcgacatcct cgtcaactgt 360 ggaggcatcc aacgccgtca cccatccacc gacttccccg aatccgattg ggacgaagtt 420 ctcaacgtca acctcaaagc tgtctggctt ctctcccaag ctgctggtcg ccacatgatc 480 ccccgccgct ccggcaagat catcaacttt ggttcgctgc ttacattcca aggtggcctc 540 acggtcccag cttacgccag cgcaaaggga gccgtaggcc aactcacgaa ggcacttagc 600 aacgaatggg caaaacacaa cgttcaagtc aacggaattg ctcccggcta catcgcgacc 660 gacatgaacg aaaaattgct tgccgaccca acgaggttga ggcagatcag cgagaggatt 720 cctgcgggta ggtggggtga ggccgctgat tttaagggcc cattgctgtt tttggccagt 780 caagcgagtc agtatgtcag tggtgaaatg ttggttgttg acggtggatg gatgggtcgt 840 taa 843 <210> 17 <211> 247 <212> PRT <213> Pseudozyma tsukubaensis <220> <223> Pseudog4092.t1 <400> 17 Met Arg Met Leu Ile Val Gly Ser Pro Gly Ser Gly Lys Gly Thr Gln 1 5 10 15 Ser Thr Arg Leu Leu Lys His Tyr Ser Phe Ser Val Leu Ser Ala Gly 20 25 30 Asp Val Leu Arg Ser His Ile Gln Arg Gly Thr Glu Ile Gly Gln Arg 35 40 45 Ala Asp Ala Val Ile Lys Gln Gly Gly Leu Met Pro Asp Gln Val Met 50 55 60 Met Asp Leu Val Gly Ala Glu Val Lys Thr Leu Ala Gly Ser Asp Trp 65 70 75 80 Leu Leu Asp Gly Phe Pro Arg Thr Leu Gly Gln Ala Glu Met Leu Asp 85 90 95 Glu Met Leu Glu Asp Gln Glu Lys Gly Leu Arg Leu Val Val Asn Leu 100 105 110 Asp Val Pro Glu Glu Val Ile Leu Asp Arg Ile Leu Gln Arg Trp Thr 115 120 125 His Leu Pro Ser Gly Arg Val Tyr Asn Leu Ser Phe Asn Pro Pro Lys 130 135 140 Val Glu Gly Lys Asp Asp Ile Thr Gly Glu Pro Leu Val Lys Arg Glu 145 150 155 160 Asp Asp Asn Val Glu Thr Phe Gly Lys Arg Leu Lys Thr Phe Tyr Ala 165 170 175 Gln Thr Glu Pro Met Leu Asp His Tyr Arg Arg Lys Ser Gly Ser Ile 180 185 190 Thr Glu Ile Asp Cys Arg Thr Glu Thr Asn Ala Asp Leu Ala Ala Ser 195 200 205 Gly Lys Lys Asp Leu Phe Val Asn Leu Lys Gly Glu Thr Ser Lys Gln 210 215 220 Ile Trp Pro His Leu Val Lys Ile Val His Glu Arg Phe Pro Asn Leu 225 230 235 240 Lys Ala Ala Ala Ala Ala Gln 245 <210> 18 <211> 944 <212> DNA <213> Pseudozyma tsukubaensis <220> <223> Pseudog4092.t1 <400> 18 atgcgaatgc tcatcgttgg ctctccagga tcaggcaaag gcactcaatc gacacgcctc 60 ctgaaacact actctttttc ggtcctctcc gcaggcgacg tactgcgatc gcacatccaa 120 cgtggaaccg aaataggcca acgcgcagat gcagtcatca agcaaggcgg attgatgccg 180 gatcaggtca tgatggatct cgtaggagct gaagtcaaaa cattagcggg gagcgactgg 240 ctgctggatg gattcccgag aacactgggg caagcagaaa tgttggatga gatgttggag 300 gaccaagaga aagggttgag gttggtggtg aatctggatg tgcctgaaga ggtgattttg 360 gataggatct tgcgtgagtc acaaacccca tcaaaccgca atcagatcga gtgcgagctt 420 atacactgac ccgacatcga tgactgtact tgttcctggc gaacaacaga acgatggacg 480 cacttaccct caggacgagt ctacaacctc tccttcaacc ctcccaaagt cgaaggcaaa 540 gacgacataa ccggagaacc actggtcaag agggaagatg acaacgtcgt acgtatcccc 600 tcctttcccc ttccccgcct gctgtttcat ttatcttaca ctctctaact cctcctcatc 660 cccgtcatca tgctacgccg ttgctactgc aggaaacctt cggcaaacgc ctcaaaacat 720 tctacgcaca aaccgaaccc atgctcgacc actaccgtcg caaaagcggc tccatcaccg 780 agatcgattg ccgtaccgaa acaaacgctg atctcgcagc atcaggcaag aaggatctat 840 ttgtcaactt gaagggcgaa acttcgaaac agatctggcc gcacttggtc aaaattgtac 900 acgagcgatt tcccaaccta aaggcagcag cggcggcgca gtga 944 <210> 19 <211> 975 <212> PRT <213> Pseudozyma tsukubaensis <220> <223> Pseudog4093.t1 <400> 19 Met Ala Asp His Glu Thr Ser Val Ser Pro Ala Glu Arg Pro Ala Leu 1 5 10 15 Leu Pro Ala Ala Ser Ser Leu Gln Pro Thr His Ile Thr Ser His Leu 20 25 30 Pro Pro Leu Lys Ser Leu Gln Ser His Asn His Ser Ala Ser Arg Asp 35 40 45 Arg Ser Pro Phe Arg Arg Arg Lys Asp Ile Thr Pro Pro Ser Glu Lys 50 55 60 Pro Pro Ala Gln Pro Ala Tyr Lys His Arg Gly Leu Pro Asn Thr Asn 65 70 75 80 Thr Leu Gln Thr Phe Leu Thr Val Thr Asp Val Pro His Phe Gly His 85 90 95 Ala Val His Tyr Asn Thr His His His Phe His Arg His Asp Ser Gly 100 105 110 Asp Gly Pro Ala His Ser Ala Asp Leu Gly His Gly Trp Arg Val Arg 115 120 125 Lys Thr Pro Ile Phe Ser Gly Leu Leu Ala Pro Phe Ser Ile Val Leu 130 135 140 Glu Val Pro Gly Leu Thr Ser Lys Trp Tyr Ala Lys Ile Asp Ala Asp 145 150 155 160 Gly Ile Val Glu Arg Tyr Ile Asp Asn Pro Pro Ile Leu Thr Val Gly 165 170 175 Leu Ala Ile Ser Leu Ser Ala Ala Val Val Ala Asn Ala Ala Ile Ile 180 185 190 Phe Arg Phe Leu Glu Phe Leu Lys Pro Arg Ala Ser Ile Ala Leu Ala 195 200 205 Ile Ala Gly Phe Ala Leu His Asp Ile Ile Asn Val Val Ala Leu Ala 210 215 220 Val Phe Gly Gly Ile Tyr Gly Pro Lys His Asp Gly Leu Ser Leu Ser 225 230 235 240 Ala Ser Tyr Trp Met Val Cys Ala Ser Thr Ile Thr Ser Thr Ile Val 245 250 255 Thr Ile Ser Leu Val Ala Asp Tyr Val Arg Thr Lys Asp Phe Lys His 260 265 270 Ala Gly Ser Gly Leu Thr Gln Leu Gln Lys Gly Leu Val Leu Ala Gly 275 280 285 Met Gly Leu Leu Leu Tyr Leu Ser Leu Gly Ser Leu Ile Phe Val Tyr 290 295 300 Leu Ile Lys Ile Asp Phe Ile Thr Ala Leu Tyr Phe Ser Thr Ala Thr 305 310 315 320 Val Leu Thr Val Gly Phe Gly Asp Val Val Pro Thr Ser Pro Gly Gly 325 330 335 Lys Val Leu Val Ile Leu Tyr Ala Pro Ile Gly Ile Ile Leu Val Ala 340 345 350 Leu Val Val Ser Ser Ala Arg Ser Thr Ile Leu Glu Thr Phe Gln Ala 355 360 365 Ala Leu Ile Ala Arg Thr Lys Glu Arg Arg Arg Arg Ile Ala Glu Arg 370 375 380 Lys Ala Ala Val Lys Glu His Lys Arg Gln Asp Arg Ala Ile Arg Arg 385 390 395 400 Ile Met Pro Arg Thr Phe Thr Phe Gly Pro Asn Ser Asn Ala Val Ser 405 410 415 Asn Ser Pro Asp Asp Asp Ser Asn Asn Asn Glu Phe Ala Glu Ala Leu 420 425 430 Ala Gln Met Glu Lys Gln Ala Ala Ala Gly Gly Ala Pro Pro Ala Asp 435 440 445 Asn Val Ala Ser Ser Ile Thr Thr Thr Ala Ala Ser Ser Gly Asn Ala 450 455 460 Ala Ser Asn Asp Glu Pro Lys Leu Ala Glu Ala Glu Lys Pro Ala Thr 465 470 475 480 Ala Thr Val Gly Asp Pro Ala Leu Gln His Gln Ile His Ala Leu Gln 485 490 495 Thr Glu Leu Leu Ala Ala Lys Lys Arg Thr Glu Gln Asp Phe Leu Thr 500 505 510 Tyr Glu Glu His Ala Arg His Glu Ala Ile Met Ala Ala Arg Met Lys 515 520 525 Leu Val Leu Ala Ala Ser Val Thr Ala Ala Phe Trp Leu Leu Gly Ala 530 535 540 Val Ala Phe Thr Tyr Ala Glu Arg Trp Ser Tyr Gly Gly Ala Met Trp 545 550 555 560 Phe Cys Phe Ile Ala Met Ile Thr Ile Gly Tyr Gly Asp Tyr His Pro 565 570 575 Thr Thr Gln Ile Gly Arg Ala Ile Phe Val Ile Trp Gly Leu Met Gly 580 585 590 Val Ala Val Leu Thr Ile Leu Leu Ala Val Val Gln Asp Ala Phe Gly 595 600 605 Gly Val Leu His Arg Met Leu Thr Gln Ser Thr Ser Arg Leu Phe Asp 610 615 620 Arg Ala Glu Glu Arg Ala Arg Lys Arg Arg Leu Lys Lys Glu Gln Met 625 630 635 640 Gln Arg Glu Gln Arg Gln Ala Asp Ala Glu Glu Glu Gly Glu Asp Val 645 650 655 Glu Thr Arg Gly Ala Thr Ala Gly Ala Ser Ala Met Arg Lys Arg Arg 660 665 670 Arg Ser Arg Thr Arg Ser His Arg Lys Ser Glu Ser Asp Val Lys Arg 675 680 685 Glu Lys Phe Lys Met Val Glu Ala Gly Ser Asn Asp Thr Gly Glu Arg 690 695 700 Thr Lys Val Glu Arg Lys Ser Met Glu Ala Thr Phe Ala Arg Asp Arg 705 710 715 720 His Thr Ser Ser Pro Glu Pro Leu Glu Glu Leu Glu Arg Asp Leu Asp 725 730 735 Thr Pro Asp Gly Val Pro Leu Ala Ile Pro Ser Phe Ile Leu Lys Asn 740 745 750 Ala Ser Gly Val Thr Asp Ser Gly Leu Ile Thr Ala Glu Val Gln Leu 755 760 765 Pro Val Gly Ala Ala Ala Arg Val Glu Asp Thr Leu Val Ser Ala Pro 770 775 780 Gln Lys Leu Ala Leu Ala Ala Leu Leu Thr Phe Gln His Ser Val Arg 785 790 795 800 Val Leu Arg Leu His Asp Thr Ala Ile Ser Ala Ala Met Thr Asp Val 805 810 815 Pro Ala Leu Arg His Tyr Tyr Asn Ser Arg Gln Lys Ser Ser Ser Leu 820 825 830 Ser Gly Thr Asp Leu Ala Pro Gln Asp Ser Ser Glu Gly Thr Ser Lys 835 840 845 Ser Lys Asp Gly Glu Glu Thr Asp Pro Glu Thr Ala Leu Gln Asn Leu 850 855 860 His Ala Ala Ile Gln Gln Ile Ala Asn Pro Glu Tyr Glu Lys Val Ala 865 870 875 880 Lys Leu Val Val Ala Asn Leu Glu Phe Glu His His Leu Lys Val Phe 885 890 895 Leu Glu Gln Phe Gln Gly Leu Lys Asp Arg Val Glu Gly Phe Lys Gln 900 905 910 Arg Thr Thr Glu Met Arg Arg Arg Arg Gly Gln Thr Val Gly Glu Ala 915 920 925 Asp Gly Glu Glu His His Pro Thr Leu Ala His Leu Phe His Pro His 930 935 940 Glu His Glu His Glu His Gln Gln Gly His Glu His Glu His Gln Gln 945 950 955 960 Pro Tyr Gly Arg Asn Gln Glu Pro Glu Gly Pro Ala Pro Ser Glu 965 970 975 <210> 20 <211> 2928 <212> DNA <213> Pseudozyma tsukubaensis <220> <223> Pseudog4093.t1 <400> 20 atggccgacc acgaaacatc tgtgtcgcct gctgagcgac cggctttgtt gccagctgcc 60 tcgtcgttgc aacccacgca tatcacctcg catcttccac cactcaagtc gttgcaaagt 120 cacaatcact ctgcaagtcg tgacaggtcg ccgtttcgac gtcgaaaaga cattacacca 180 ccgtcagaga aaccacctgc acagcccgca tacaaacata gaggtctacc caacacaaac 240 actcttcaga ctttcctcac tgtcactgac gtaccacact tcggccatgc tgtccattac 300 aacactcatc atcactttca tcgacatgac agcggagatg gaccagcgca cagtgcagac 360 ctgggtcacg gatggagggt gcgcaaaaca ccgatctttt ccggtcttct cgcccctttc 420 tccatcgtac tcgaagtgcc aggtttgacg tccaaatggt acgccaagat cgatgcagac 480 ggtattgtgg aacgatacat cgataatccg cctatcctaa ccgttggact cgccatctcg 540 cttagtgcgg cagtcgtggc caacgcagcg atcatctttc gatttctcga gttcttgaaa 600 ccgagagcaa gtattgcgct tgccattgcg ggtttcgctc ttcacgacat catcaatgtc 660 gtcgccttgg ctgtctttgg tggtatctat ggacccaaac atgacggcct cagtctcagt 720 gccagttact ggatggtctg cgcttcgacc atcacgtcga cgatcgtcac catcagcttg 780 gttgccgact acgtcaggac aaaggatttc aagcacgcag gctcggggtt gacacagctg 840 caaaagggac tggtgctggc aggtatggga ctgctgctgt atctgtcgct gggaagtctg 900 atctttgtct acctcatcaa gatcgatttc atcactgcgc tgtacttttc gacggcaaca 960 gtattgacgg ttggttttgg agatgtggta ccgacaagtc cgggcggcaa agtcttggtc 1020 atcttgtatg cgccaatcgg aatcatcctc gttgcgcttg tcgtatcttc ggcgaggagc 1080 acgatcctag agactttcca agcggccctc atcgcgagga caaaggagcg acgtaggaga 1140 atagcagaac gaaaagctgc ggttaaagag cacaagaggc aggaccgtgc aatacggagg 1200 atcatgcctc gcacgttcac gtttggaccc aactccaacg ctgtcagtaa ttcgccggat 1260 gacgatagca acaacaacga attcgctgaa gctttggctc agatggagaa gcaagctgct 1320 gccggtggtg cacctccagc cgacaatgtt gcgtcttcca tcaccaccac tgctgcctcc 1380 tccggcaacg ccgcctccaa tgacgaaccc aaactcgcag aagcagaaaa gccagcaact 1440 gcaaccgtcg gcgaccccgc tctacaacac caaatccacg cccttcaaac cgaacttcta 1500 gcagcaaaaa aacgcacaga acaagacttc ctcacctacg aagaacacgc gcgacacgaa 1560 gccatcatgg ccgcacgcat gaaactcgtc ctggccgcct ccgtcaccgc tgctttctgg 1620 ctcctcggcg ccgttgcttt tacttatgca gagagatgga gttacggtgg tgcaatgtgg 1680 ttctgcttca tcgccatgat cacgattggg tatggagact atcatccgac gacgcagatc 1740 ggtagggcga tctttgtcat atggggtttg atgggtgttg ctgtgttgac gatcttgttg 1800 gcggttgttc aggatgcgtt tggtggagtg ctgcatcgaa tgctaacgca atccacgtcg 1860 aggttgttcg atcgagcaga ggagagggct aggaagaggc ggttgaagaa ggagcaaatg 1920 cagcgcgagc agcgtcaagc ggacgcggag gaggaaggtg aggatgtgga aacgagaggt 1980 gctacagcag gagcatcagc gatgcgaaag cgaagacggt cacgaacgcg atctcaccgc 2040 aaaagcgaaa gtgacgtcaa gagggagaag ttcaagatgg tcgaagccgg atccaatgac 2100 acaggagagc ggacaaaagt agagcgaaag agtatggaag ccacctttgc acgcgaccgg 2160 cacacatctt cacccgaacc tctagaggag ctcgaacgag atctcgacac gcctgacggt 2220 gtacctctcg ccatcccctc tttcatcctt aagaatgctt ctggtgttac cgactctggt 2280 ctcatcactg ctgaagtcca attgcccgtc ggagcagccg cgcgtgtgga agacaccctc 2340 gtctcagcac ctcaaaaact cgcccttgcc gccctgctca ccttccaaca ctctgttcgc 2400 gtacttcgct tacacgacac agccatctct gcagccatga ccgacgtccc cgccctgcga 2460 cactactaca actcgcgtca gaagtcttct tcgctctcag ggaccgatct tgccccacaa 2520 gactcctccg aaggaacctc aaaaagtaaa gacggggagg aaacagaccc ggaaacagcg 2580 ttgcaaaacc tccatgcggc gatccagcaa attgcgaatc cggagtatga aaaggtggcg 2640 aagttggtag ttgccaatct ggagtttgag catcatctga aggtgtttct agaacagttc 2700 caggggttga aggatagggt ggaggggttc aagcagcgga cgacggagat gaggcggagg 2760 agggggcaaa cggtgggaga ggcggatgga gaggagcatc atccgacgtt ggcgcatctg 2820 tttcatccgc acgaacacga gcatgagcat cagcaggggc acgagcatga gcatcaacaa 2880 ccatacggaa ggaaccaaga accggaagga ccggcaccgt cggaatag 2928 <210> 21 <211> 411 <212> PRT <213> Pseudozyma tsukubaensis <220> <223> Pseudog4094.t1 <400> 21 Met Pro Lys Leu Pro Leu Ser Ile Ala Leu Gly Thr Val Leu Ile Ala 1 5 10 15 Gly Cys Ile Gly Ala Pro Thr Ser Ser Ser Glu Glu Gly Asp Ser Asp 20 25 30 Tyr Arg Leu Phe Ser Ser Gly Arg Pro Asp Leu Ser Ser Arg Leu Glu 35 40 45 Arg Leu Lys Ile Asp Thr Thr Gln Arg Tyr Asp Pro Glu Leu Gln Tyr 50 55 60 His His Ala Ala Leu Pro Pro Ser Pro Gln Pro Ile Glu Pro Leu Ala 65 70 75 80 Trp Tyr Asp Ser Arg Met Arg Pro Leu Phe Ser Pro Pro Ala Val Gly 85 90 95 Asn Gln Val Ala Leu Val Pro Met Tyr Pro Phe Gln Val Val Pro Gly 100 105 110 Met Gln His Gly His Val Leu Gly His Ala Pro Glu Pro Ser Phe Ala 115 120 125 Gln Val Leu Val Thr Ala Gln Pro Pro Pro Gln Pro Thr Tyr Ser Val 130 135 140 His Pro Asp Thr Lys Leu Pro Val Ser Glu Leu Val Ala Pro Thr Pro 145 150 155 160 Ser Arg Asp Gly Ala Leu Arg Tyr Thr Ile Pro Arg Phe Ala Leu Arg 165 170 175 Asp Gly Arg Gln Phe Gly Pro Leu Gln Val Gly Lys Asp Lys Phe Gln 180 185 190 Ile Ala Ala Tyr Pro Leu Asp Ile Pro Val Leu Arg His Leu Tyr Gln 195 200 205 Tyr Asp Gln Leu Ile Phe Ala Asn Phe Glu Asp Phe Val Leu Gly Asp 210 215 220 Lys Asn Lys Ala Ser Tyr Arg Asn Phe His Gly Val Tyr Arg Pro Glu 225 230 235 240 Pro Lys Ile Leu Asp Asp Ile His Arg Ala Ile Arg Ala His Met Ser 245 250 255 Phe Gly Gly Leu Thr Pro Gln Arg Val Ser Pro Asp His Asp Leu Met 260 265 270 Glu Gly Gln Leu Leu Trp Pro Pro Ala His Ile Ile Pro Lys Gln Leu 275 280 285 Gln Ser Glu Glu Val Arg Arg Leu Thr Leu Thr Arg Asn Leu Arg Asp 290 295 300 Asp Leu Arg Lys Ala Val Leu Thr Gln Ile Ser Ala His Gln Arg Asp 305 310 315 320 Phe Ser Lys Val Tyr His Leu Glu Ile Val Ser Asn Gln Gly Lys Arg 325 330 335 His Ile Met Met Thr Thr Leu Pro Tyr Gln Thr Tyr Thr Gln Leu Ala 340 345 350 Asn Gly Gln Ala Thr Asn Leu Asp Phe Trp Val Phe His Glu Gly Ile 355 360 365 Gln Pro Ala Gly Glu Asn Arg Gln Pro Met Val Ala Leu Leu Gly Gly 370 375 380 Ala Phe Leu Ser Lys Glu Thr Lys Glu Ala Leu Leu Ser Ser Leu Arg 385 390 395 400 Met Arg Pro Ala Trp Thr Thr Thr Val Arg Phe 405 410 <210> 22 <211> 1236 <212> DNA <213> Pseudozyma tsukubaensis <220> <223> Pseudog4094.t1 <400> 22 atgccaaaac ttccgctgag catagcactc ggcacagtgc tgatagcggg ctgcatcggc 60 gccccaacca gctctagcga ggaaggagac tccgactaca gactattttc atcaggcaga 120 ccggatcttt cttcgcgtct cgagcgactc aagatcgata ccacccagcg gtacgatccg 180 gagttgcaat accaccacgc agcccttcct cccagtccgc agcctattga gccacttgct 240 tggtacgact cccgcatgcg acccttgttt tcgcctcctg ctgttggaaa ccaggttgct 300 ctcgtcccta tgtacccttt ccaagtcgtc cctgggatgc agcatgggca cgttcttggg 360 cacgctccag agccatcctt cgcccaagtc cttgtcacag ctcaacctcc accccaaccc 420 acctattcag tacaccccga cactaagctg ccagtgagtg agctggtagc ccctacgccc 480 tcgcgagatg gagctcttcg atacacgatt ccacgattcg cattgagaga cggaagacag 540 tttggtccgc ttcaagtggg aaaggacaag ttccagatag ctgcctaccc gctagacatt 600 cccgtcctcc gtcacctgta tcagtacgat cagctcattt ttgccaactt cgaagatttc 660 gtccttggcg acaagaacaa ggctagctac cgaaactttc acggagttta tcgacccgag 720 ccgaagatct tggatgacat tcatcgcgcc atccgggcgc acatgtcgtt tggcggacta 780 accccacagc gtgtcagtcc agatcacgat ctgatggaag gccagcttct gtggccacca 840 gctcatatca tacccaagca gctccaaagc gaagaggtcc gtcggctgac actcacccgc 900 aatctacgtg atgacctcag gaaggctgtc ttgacgcaga tctctgcgca tcagagggac 960 ttttcgaagg tttatcatct tgagatcgtc tcgaaccaag gaaaaaggca tatcatgatg 1020 actactctac cttatcagac atacacccag ctcgcaaatg gccaagctac caatttggac 1080 ttttgggtct ttcatgaagg catccaaccg gcaggagaga atagacagcc aatggtggct 1140 ttgctaggtg gcgccttcct gtcgaaagag accaaagagg cgctactttc gtccttgcgt 1200 atgcgacctg cctggaccac taccgttcga ttctga 1236 <210> 23 <211> 313 <212> PRT <213> Pseudozyma tsukubaensis <220> <223> Pseudog4095.t1 <400> 23 Met Val Val Thr Gly Val Pro Thr Phe Asp Asn Gln Gly His Ala Ser 1 5 10 15 Ala Pro Asp Leu Ser Pro Thr Glu Arg Leu Gly His Arg Asp Gly Ser 20 25 30 Val His Pro Pro Phe Trp Arg Arg Gln Ala Ser Ser Ser Asp Ser Trp 35 40 45 Glu Pro Asp Ala Glu Glu Lys Ala Gly Arg Thr Ile Ser Gly Pro Arg 50 55 60 Arg Gly Pro Glu Gly Thr Thr Arg Thr Arg Ala Ile Ile Pro Ala Phe 65 70 75 80 Lys Asp Val Ser Gly Val Ile Trp Gly Pro Tyr Lys Leu Asn Ser Lys 85 90 95 Lys Phe Gln Leu Ile Trp Tyr Pro Leu Glu Met Glu Arg Leu Lys His 100 105 110 Leu Tyr Gln Pro Asp Gly Thr Ile Pro Ala Thr Ile Asp Glu Pro Val 115 120 125 Pro Gly Gln Pro Phe Arg Leu Gln Val Arg Pro Ile Ser Phe Arg Pro 130 135 140 Glu Pro Glu Val Leu Lys His Ile Arg Ser Thr Ile Trp Asn Thr Leu 145 150 155 160 Thr Asp Gln Gly Ile Ser Ala Lys Pro Ile Asp Ser Lys Asn Lys Phe 165 170 175 Phe Arg Glu Gly Met Tyr Leu Trp Pro Pro Leu Thr His Thr Lys Ser 180 185 190 Val Leu Gln Met Pro Glu Ala Leu Leu Ser Asn Arg Ile Ser Val Ala 195 200 205 Pro Gly Asn Arg Phe Arg Thr Met Arg Ala Lys Asn Ile Tyr Gln Phe 210 215 220 Thr Val Pro Ser Ser Ala Gly Asp Arg His Ile Ile Met Thr Pro Ala 225 230 235 240 Val Thr Glu Val Trp Thr Thr Ser Thr Gly Gly Asp Ser Asp Leu Trp 245 250 255 Leu Phe Tyr Glu Gly Arg Lys Leu His Asp Gly Ile Gln Ser Tyr Arg 260 265 270 Gly Lys Arg Leu Thr Ser Asn Val Ile Gly Lys Lys Thr Met Ala Phe 275 280 285 Leu Gly Ala Met Phe Leu Pro Ser Ser Ala His Glu Thr Leu Leu Arg 290 295 300 Ala Lys Val Ile Ser Thr Phe Ala Ala 305 310 <210> 24 <211> 942 <212> DNA <213> Pseudozyma tsukubaensis <220> <223> Pseudog4095.t1 <400> 24 atggtggtca ctggtgttcc gacatttgac aaccaaggac acgcctctgc tcctgatttg 60 tcgccgactg agcgtttggg tcaccgcgac ggttctgtcc atcctccctt ctggcgacgt 120 caggcgagca gctcggactc ttgggagcct gacgccgagg agaaagccgg gagaaccatc 180 tcgggtcctc gacgaggtcc ggagggtacc actaggaccc gagctatcat tcccgctttc 240 aaagatgtct caggcgtcat ctggggaccg tataaactca actccaagaa gtttcagctg 300 atatggtacc cgttggaaat ggagcgactg aaacacctct accagcccga cggcacgatt 360 ccagcgacca tcgacgagcc tgtaccaggc cagccgttcc gactgcaggt gcggcccatt 420 agcttccgtc ccgaaccaga agttcttaag cacatccgat cgaccatttg gaacacgctt 480 acggatcaag ggatcagcgc gaagcctatc gactccaaga acaagttttt ccgcgaggga 540 atgtacctat ggccgccttt gacccacaca aagtcggttc ttcaaatgcc cgaggcactc 600 ctgtcgaatc gcatctccgt tgctcctgga aatcgctttc gtacgatgcg tgccaagaac 660 atctatcagt ttacagttcc ttcttccgct ggagacagac atatcatcat gactccagct 720 gtgaccgagg tctggacaac cagcacggga ggagactcag atctgtggct cttctacgaa 780 ggcagaaagc ttcacgatgg gatccaatcc tacagaggca agaggttgac aagcaacgtg 840 ataggcaaaa agaccatggc ctttcttggc gccatgtttt tgccgagttc agcacacgaa 900 acgctgctca gagccaaggt aatttcaact ttcgctgctt ga 942 <210> 25 <211> 164 <212> PRT <213> Pseudozyma tsukubaensis <220> <223> Pseudog4096.t1 <400> 25 Met Met Leu Phe Arg Leu Leu Leu Leu Leu Leu Gly Ala Ala Leu Val 1 5 10 15 Ser Ala Phe Phe Glu Ser Asp Tyr Val Asn Leu Lys Gly Thr Asp Arg 20 25 30 Ser Met Trp Leu Lys Met His Glu Arg Phe Asp Pro Ser Phe Lys Gln 35 40 45 Gly Leu Ala Arg Glu His Ile Ser Ser Pro Arg Val Val Ala Phe Gly 50 55 60 Pro Glu Trp Tyr Gln Ser Ala Leu Gln His Ala Arg Asp Lys Gly Val 65 70 75 80 Leu Val Leu Gly Val His Ser Pro Leu Thr Ser Leu Thr Gly Asn Lys 85 90 95 Lys Thr Tyr Phe Val Thr Leu Ile His Tyr Asp Asp Gly Val Val Ala 100 105 110 Arg Gln Leu Gln Leu His Pro Gln Ser Met Val Gly Ala Val Leu Trp 115 120 125 Lys His Ser Lys Gly Gln Asn Lys Ile Val Ser Ile Asp Arg Leu Ile 130 135 140 Arg Lys Thr Glu Met Asn Trp Asp Pro Glu Val Leu Glu Ser Val Leu 145 150 155 160 Gln Arg Glu His <210> 26 <211> 495 <212> DNA <213> Pseudozyma tsukubaensis <220> <223> Pseudog4096.t1 <400> 26 atgatgctct tccgcttgtt gctcctgctt ctgggcgctg ccttggtttc tgccttcttt 60 gaaagcgatt acgtcaatct caaagggaca gaccgaagca tgtggctaaa gatgcacgaa 120 cgattcgacc cttccttcaa gcaaggtctt gcacgagaac atatttcttc tcctcgagtg 180 gtcgccttcg gccccgaatg gtaccagtcg gccttgcagc atgcacgcga caagggagtg 240 ttggttcttg gcgttcacag tcctctcaca tcattgacgg ggaacaagaa gacgtatttt 300 gtcacgctga tccattatga cgatggagtt gttgcacgtc agctccaatt gcatcctcaa 360 agcatggtgg gtgcagtctt gtggaagcac agtaaaggtc aaaacaagat tgtttcgatt 420 gacaggttaa ttaggaagac ggagatgaac tgggatccag aggtactgga aagtgtccta 480 caacgcgagc attga 495 <210> 27 <211> 185 <212> PRT <213> Pseudozyma tsukubaensis <220> <223> Pseudog4097.t1 <400> 27 Met Gln Val Leu Ser Asn Arg Phe Leu Gly Leu Leu Ala Leu Leu Phe 1 5 10 15 Ser Leu Val Ile Leu Gly Val Ala Ala Thr Arg Leu Ser Asp Lys Glu 20 25 30 Glu Asp Met Leu Asn Gln Ala Arg Ser Pro Tyr Gln Ser Pro Ile Tyr 35 40 45 Glu Asn Ala Gly His Ala Trp Gln Thr Trp Thr Leu Tyr Pro Lys Leu 50 55 60 Gln Asp Tyr Ser His Ile Pro Asp Phe Glu Arg Asp Ala Leu Glu Met 65 70 75 80 Ala Tyr Arg Lys Gly Ala Met His Ile Ser Asp Thr Met Asp Asp Asn 85 90 95 Asp Ile Arg Asn Arg Ala Trp Arg Ser Gly Ser His Ser Gly Ser Lys 100 105 110 Leu Ala Arg Asp Gly His Ile Tyr Phe Tyr Ser Ile Val Pro Pro Arg 115 120 125 Ser Tyr Met Gly Leu Gln Met Gly Leu Pro Glu Lys Asn Arg Val Ala 130 135 140 Ser Leu Leu Trp Lys His Asp Pro Gly Thr Gly Gln Thr Lys Leu Ile 145 150 155 160 His Val Asp Glu Leu Gln His Tyr Lys Asn Leu Gln Trp Asp Met Asp 165 170 175 Lys Leu Glu Asp Ile Leu Arg His His 180 185 <210> 28 <211> 558 <212> DNA <213> Pseudozyma tsukubaensis <220> <223> Pseudog4097.t1 <400> 28 atgcaggttc tctctaaccg cttcctcggc cttttggccc tcctcttctc acttgtcatc 60 ctgggtgtcg ctgccacccg gcttagtgat aaagaggaag acatgctcaa tcaggcacga 120 agtccttacc agtctcccat ctacgaaaat gctggtcatg catggcagac ctggacactt 180 tatcctaaac ttcaggatta ctcgcacatc cctgactttg agcgtgatgc tcttgaaatg 240 gcttatagga aaggtgccat gcacatcagc gacaccatgg acgacaacga catccgaaac 300 agggcatggc gttctggtag ccacagtggt agcaagttgg ccagagatgg acatatctac 360 ttttacagta ttgttcctcc tcgatcttac atgggactcc agatgggact tcccgagaaa 420 aaccgggtcg ctagtctgct ttggaagcat gatccgggaa cggggcagac caagttgatt 480 catgttgacg aacttcagca ctataagaac ctacagtggg acatggataa gttggaagac 540 attctcaggc atcactga 558 <210> 29 <211> 167 <212> PRT <213> Pseudozyma tsukubaensis <220> <223> Pseudog4098.t1 <400> 29 Met Val Ala Ile His Arg Arg Leu Phe Leu Leu Leu Leu Leu Gly Val 1 5 10 15 Ile Phe Ala Met Thr Ala Thr Ala Ala Pro Pro Tyr Ile Asn Pro Asp 20 25 30 Glu Glu Met Ile Gln His Ser Ile Gly Lys Leu Gly Thr Val Tyr Ala 35 40 45 Asp Ser Gly Val Thr Tyr Ala Pro Val Asn Ala Ala Gly Lys Tyr Arg 50 55 60 Val Tyr Asn Phe Glu Glu Lys Ala Trp Asp Met Ala His Gly Gly Ala 65 70 75 80 Thr Tyr Val Gly Thr Arg Gln His Phe Arg Gly Gly Gln Lys Tyr Gly 85 90 95 Gln Pro Trp Lys Tyr Phe Tyr Ser Ile Ile Pro Pro Asp Thr Pro Leu 100 105 110 Gly Arg Glu Met Gly Leu Pro Asp His Lys Leu Ala Thr Val Leu Trp 115 120 125 Arg Tyr Gly Asn Gly Arg Lys Ser Met Val Glu Leu Gln Glu Ala Asp 130 135 140 Asn Tyr Met His His Ser Gly Phe Asn Trp Asn Gly Met Gln Glu Leu 145 150 155 160 Lys Asp Val Ile Gly His His 165 <210> 30 <211> 504 <212> DNA <213> Pseudozyma tsukubaensis <220> <223> Pseudog4098.t1 <400> 30 atggttgcca ttcaccgccg tctcttcctt ctcctgctcc ttggcgtcat ctttgcaatg 60 accgccaccg ccgccccacc ctacatcaat ccggacgaag agatgatcca acactctatc 120 ggcaaacttg gcactgtcta cgccgattcg ggtgtcacat atgcaccggt caacgccgcg 180 ggcaaatatc gcgtctacaa ctttgaagaa aaggcgtggg acatggctca cggtggcgca 240 acctatgtcg gtacgcgtca acacttccga ggaggtcaaa agtatggtca accttggaag 300 tatttctatt ccatcattcc tcctgacaca ccgttgggac gggagatggg cttgcctgac 360 cacaaactcg cgacggtgct gtggaggtac gggaacggtc gaaagtcgat ggtggaactt 420 caggaggcgg ataactatat gcatcattct gggttcaatt ggaacgggat gcaggagctg 480 aaggatgtaa ttggacatca ctga 504 <210> 31 <211> 485 <212> PRT <213> Pseudozyma tsukubaensis <220> <223> Pseudog6271.t1 <400> 31 Met Ala Pro Ser Leu Asn Ala Asn Ser Thr Ala Asp Arg Arg Asn Ala 1 5 10 15 Thr Ala Ala Pro Asp Leu Leu Ser Gly Asn Lys Ala Gly Gly Gly Leu 20 25 30 Lys Leu Ser Gly Leu Pro Asp Leu Ser Asp Ser Ala Gly Thr Leu Ser 35 40 45 Asp Val Phe Gly Thr Pro Ala Met Arg Leu Ile Trp Ser Asp Gln Asn 50 55 60 Arg Val Ala Cys Tyr Leu Glu Ile Glu Ala Ala Leu Ala Val Val Gln 65 70 75 80 Ala Glu Leu Gly Ile Ile Pro Lys His Ala Ala Gln Glu Ile Val Lys 85 90 95 His Cys Arg Val Asp Glu Ile Asp Trp Ala Leu Tyr Lys Gln Lys Thr 100 105 110 Glu Leu Ile Gly Tyr Pro Val Leu Gly Ile Val Gln Gln Leu Val Ala 115 120 125 Asn Cys Lys Asp Gly Leu Gly Glu Tyr Cys His Trp Gly Ala Thr Thr 130 135 140 Gln Asp Ile Thr Asp Thr Ala Thr Ile Met Gln Ile Arg Gln Ser Leu 145 150 155 160 Ala Leu Val Lys Glu Lys Leu Cys Ser Ile Val Ala Ser Leu Arg Tyr 165 170 175 Leu Ala Glu Lys His Arg Asn Leu Pro Met Ala Ala Arg Ser Asn Leu 180 185 190 Lys Gln Ala Val Pro Ile Thr Phe Gly Phe Lys Met Ala Arg Phe Leu 195 200 205 Ala Thr Phe Arg Arg His Gln Glu Arg Leu Ala Glu Leu Glu Lys Arg 210 215 220 Thr Tyr Thr Leu Glu Phe Gly Gly Ala Ala Gly Asn Leu Ser Ser Leu 225 230 235 240 Gly Glu Lys Gly Ile Ala Thr His Asp Ala Leu Ala Lys Met Leu Asp 245 250 255 Leu Ser Pro Ala Asp Ile Ala Trp His Thr Glu His Asp Arg Phe Ala 260 265 270 Glu Val Gly Ala Phe Leu Gly Leu Leu Thr Gly Thr Leu Ala Lys Leu 275 280 285 Ala Thr Asp Ile Lys Leu Met Ser Gln Thr Glu Val Gly Glu Val Gly 290 295 300 Glu Pro Phe Ile Ser Asn Arg Gly Ser Ser Ser Thr Met Pro Gln Lys 305 310 315 320 Asn Asn Pro Ile Ser Cys Val Tyr Ile His Ala Cys Ala Ala Asn Val 325 330 335 Arg Gln Gly Thr Ala Ala Leu Leu Asp Ala Met Gln Ser Asp His Glu 340 345 350 Arg Gly Thr Gly Pro Trp Glu Ile Ile Trp Val Gln Leu Pro Leu Met 355 360 365 Met Asn Trp Ser Ala Ala Ala Leu Ala Asn Ala Asp Phe Ile Leu Lys 370 375 380 Gly Leu Gln Val Phe Pro Asp Ala Met Val Arg Asn Leu Ala Leu Ser 385 390 395 400 Lys Gly Leu Ile Val Ser Glu Ala Val Met Met Ala Leu Gly Asp Thr 405 410 415 Leu Gly Arg Gln Tyr Ala His Asp Ala Val Tyr Glu Cys Cys Arg Ala 420 425 430 Ala Phe Glu His Asn Arg Pro Leu Leu Asp Val Leu Leu Glu Asn Gln 435 440 445 Glu Ile Ala Ser Lys Leu Lys Arg Ala Glu Leu Glu Arg Leu Cys Glu 450 455 460 Pro Ala Asn Tyr Leu Gly Gln Cys Ser Gln Trp Ile Asp Arg Val Leu 465 470 475 480 Leu Pro Pro Ser Thr 485 <210> 32 <211> 478 <212> PRT <213> Pseudozyma tsukubaensis <220> <223> Pseudog6268.t1 <400> 32 Met Ser Asn Pro Leu Ala Gly Arg Val Lys Trp Phe Arg Arg Ile Pro 1 5 10 15 Ser Ile Leu Leu Ala Phe Val Val Ser His Thr Asp Ser Phe Thr Met 20 25 30 Leu Arg Gly Ile Glu Thr Thr Ile Tyr Arg Ala Gly Thr Ser Arg Gly 35 40 45 Leu Tyr Leu Leu Ala Ser Asp Leu Pro Ser Glu Pro Ser Ala Arg Asp 50 55 60 Ala Ala Leu Leu Ser Ile Met Gly Ser Gly His Pro Leu Gln Ile Asp 65 70 75 80 Gly Met Gly Gly Gly Asn Ser Leu Thr Ser Lys Val Ala Ile Val Ser 85 90 95 Pro Ser Ala Gln Ser Asp His Ser Asp Val Asp Tyr Leu Phe Cys Gln 100 105 110 Val Gly Ile Asn Glu Arg Ile Val Asp Thr Ala Pro Asn Cys Gly Asn 115 120 125 Leu Met Ser Gly Val Ala Ala Phe Ala Ile Glu Arg Gly Leu Val Lys 130 135 140 Pro His Pro Ser Asp Thr Thr Cys Leu Val Arg Ile Phe Asn Leu Asn 145 150 155 160 Ser Asn Gln Ala Ser Glu Leu Leu Ile Pro Val Gln Asp Gly Arg Val 165 170 175 His Tyr Lys Asp Val Asp Asp Thr Gly Leu Gln Arg Pro Ser Ala Arg 180 185 190 Val Ser Leu Arg Phe Leu Asn Thr Val Gly Ala Cys Thr Gly Lys Leu 195 200 205 Leu Pro Thr Gly Asn Ala Thr Asp Ser Ile Glu Gly Leu Glu Val Ser 210 215 220 Val Ile Asp Ser Ala Ile Pro Val Val Phe Val Arg Gln Ala Asp Val 225 230 235 240 Gly Ile Thr Gly Phe Glu Thr Pro Ala Thr Leu Asn Ala Asp Thr Ala 245 250 255 Leu Leu Ser Arg Leu Glu Arg Val Arg Leu Glu Ala Gly Arg Arg Met 260 265 270 Gly Trp Gly Asp Val Ser Ser Ser Val Val Pro Lys Leu Ser Leu Ile 275 280 285 Gly Pro Gly Ser Asn Cys Thr Thr Phe Thr Ala Arg Tyr Phe Thr Pro 290 295 300 Lys Thr Cys His Asn Ala His Ala Val Thr Gly Ala Ile Cys Thr Ala 305 310 315 320 Gly Ala Ala Tyr Val Pro Gly Thr Val Val Ser Asp Ile Phe Ser Ser 325 330 335 Arg Thr Pro Ser Leu Ser Ser Ser Pro Gly Asp Thr Thr Pro Pro Tyr 340 345 350 Thr Pro Gln Arg Arg Ile Ser Ile Glu His Pro Ser Gly Val Leu Glu 355 360 365 Ile Gly Leu Thr Ala Ala Glu Ser Asp Ser Pro Arg Ser Leu Asp Ile 370 375 380 Ala His Val Glu Arg Ser Val Ala Leu Ile Ala His Ala Arg Val Tyr 385 390 395 400 Tyr Thr Met Pro Asp Arg His Pro Ser Val Glu Ile Pro Ile Ile Ser 405 410 415 Pro Val Thr Pro Thr Ser Ala Glu Met Leu Asp Arg Ala Tyr Gln Ser 420 425 430 Leu Ala Leu Ala Leu Gly Arg Gly Lys Asp Arg Ser His Ile Ile Pro 435 440 445 Leu Gly Ser Glu Gly Lys Glu Ser Glu Leu Tyr Tyr Asn Met Pro Asp 450 455 460 Ser Thr Val Ser Ser Tyr Arg Gly Thr His Ser Thr Ala Leu 465 470 475 <210> 33 <211> 532 <212> PRT <213> Pseudozyma tsukubaensis <220> <223> Pseudog6270.t1 <400> 33 Met Leu Pro Gln Thr Pro Val Pro Asp Tyr Arg Leu Ser Met Arg Tyr 1 5 10 15 Ser Thr Asp Ser Val Ala Ala Ser Gln Ala Leu Thr Thr Pro Glu Ala 20 25 30 Ala Pro Ser Ile Ser His His Ala Asp Thr Gly Glu Val Gln Gln Ala 35 40 45 His Ser Gly Asp Asp Gly Ala Leu Glu Glu Gly Ala Ile Ala His Ser 50 55 60 Ser Lys Glu Gly Ser Gln Arg Asp Gln Gln Thr Glu Leu Tyr Cys Ala 65 70 75 80 Phe Thr Lys Gly Thr Lys Leu Phe Val Val Leu Ser Val Ser Ile Ala 85 90 95 Gly Phe Phe Ser Pro Phe Ser Ile Asn Ile Tyr Ile Pro Ala Leu Pro 100 105 110 Gln Ile Ser Lys Leu Leu His Thr Ser Glu Ala Ala Thr Asn Val Thr 115 120 125 Val Thr Val Tyr Met Ile Ala Gln Gly Leu Ser Pro Val Ile Trp Ala 130 135 140 Pro Leu Ser Asp Val Phe Gly Arg Arg Pro Ile Tyr Ile Ala Thr Phe 145 150 155 160 Leu Val Phe Phe Val Ala Asn Leu Gly Leu Ser Phe Thr Asn Val Tyr 165 170 175 Trp Leu Leu Val Val Leu Arg Met Val Gln Ala Ala Gly Ala Cys Ser 180 185 190 Ala Ile Ala Ile Gly Ala Gly Thr Ile Gly Asp Val Thr Glu Arg Lys 195 200 205 Glu Arg Gly Ser Tyr Met Gly Tyr Tyr Ala Leu Ala Gln Tyr Thr Gly 210 215 220 Pro Ala Ile Gly Pro Val Ile Gly Gly Ala Leu Ser Gln Arg Trp Asp 225 230 235 240 Tyr His Ser Thr Phe Phe Phe Leu Ser Ala Val Ser Gly Val Phe Leu 245 250 255 Ile Phe Met Ala Phe Phe Leu Leu Glu Thr Leu Arg Val Leu Val Gly 260 265 270 Asn Gly Ser Ala Arg Thr Phe Gly Ile Tyr Arg Thr Leu Val Gly Pro 275 280 285 Arg Leu Val Lys Ser Thr Ala Asn Ser Met Arg Pro Arg Met Lys Ser 290 295 300 Pro Leu Glu Gly Arg Leu Glu Phe Gly Phe His Arg Pro Phe Leu Val 305 310 315 320 Phe Ala Arg Pro Glu Thr Ser Leu Ala Ile Leu Ala Phe Ser Met Val 325 330 335 Tyr Ala Thr Tyr Tyr Leu Ser Ser Ala Ser Leu Pro Tyr Leu Phe Lys 340 345 350 Gln Val Tyr Gly Leu His Glu Leu Leu Ile Gly Val Cys Phe Val Pro 355 360 365 Ser Gly Val Gly Cys Ala Leu Gly Thr Val Leu Ala Gly Lys Ile Leu 370 375 380 Asp Ser Asp Tyr Arg Arg Ala Leu Asp Lys Asn Lys Ser Gly Val Lys 385 390 395 400 Val Thr Arg Ala Arg Leu Gln Ser Ala Trp Ile Tyr Leu Pro Gly Tyr 405 410 415 Ala Ser Ser Leu Leu Ala Tyr Gly Trp Cys Val Arg Ala His Thr His 420 425 430 Ile Ala Ala Pro Ile Leu Phe Gln Phe Thr Leu Gly Met Phe Ser Thr 435 440 445 Met Tyr Phe Thr Asn Ile Asn Thr Leu Val Val Asp Leu Tyr Pro Gly 450 455 460 Lys Ala Ala Thr Ala Thr Ala Ala Val Asn Val Gly Arg Cys Leu Leu 465 470 475 480 Gly Ala Val Ala Val Ala Ile Val Gln Pro Met Thr Asp Ala Met Gly 485 490 495 Ala Gly Trp Thr Phe Thr Val Gly Ala Leu Leu Ala Leu Phe Ile Gly 500 505 510 Leu Ile Cys Gln Thr Leu Ile His Phe His Gly Glu Lys Trp Ala Ala 515 520 525 Arg Lys His Ser 530 <210> 34 <211> 191 <212> PRT <213> Pseudozyma tsukubaensis <220> <223> Pseudog6267.t1 <400> 34 Met Pro Ser Val Gln Arg Asn Ile Ser Pro Ser Val Ser Val Leu Ala 1 5 10 15 Gly Ala Thr Ala Gly Ala Val Glu Gly Glu Thr Lys Leu Ile Asp Asp 20 25 30 Gly Lys Arg Ala Lys Pro Arg Tyr Glu Gln Gly Leu Phe Arg Gly Thr 35 40 45 Ala Ser Ile Ile Arg Gln Glu Gly Phe Gly Gly Ile Tyr Lys Gly Val 50 55 60 Phe Pro Val Ile Leu Arg Gln Gly Ser Ala Ser Ala Ile Arg Leu Gly 65 70 75 80 Thr Tyr Ser Ala Met Arg Asp Phe Ile Pro Lys Ala Gln Gly Lys Gly 85 90 95 Ser Ser Phe Val Asn Trp Leu Thr Thr Phe Ser Ile Gly Ala Thr Ser 100 105 110 Gly Val Val Ala Val Tyr Gly Thr Met Pro Phe Asp Val Leu Lys Thr 115 120 125 Arg Met Gln Ala Ile Asp Ala Ser Arg Tyr Arg Ser Thr Trp His Cys 130 135 140 Leu Thr Asp Thr Ile Gly Thr Glu Gly Ile Ala Ala Leu Trp Arg Gly 145 150 155 160 Ser Val Ser Arg Ser Met Arg Leu Ile Val Ser Gly Gly Val Ile Phe 165 170 175 Ser Val Tyr Glu Gln Val Val Trp Leu Leu Ala Gly Pro Glu Phe 180 185 190 <210> 35 <211> 348 <212> PRT <213> artificial <220> <223> synthetic RIA1 sequence <400> 35 Met Lys Met Ser Gly Ser Asn Ile Asp Asp Asp Asp Cys Ala Asn Met 1 5 10 15 Phe Asp Leu Met Ala Pro Pro Leu Ala Ser Ser Ser Cys Gly Pro Tyr 20 25 30 Phe Ser Thr Pro Asp Leu Ala Leu Pro Ser Ile Ser Pro Val Ser Thr 35 40 45 Asp Ala Asp Thr Thr Leu Pro Ser Pro Leu Gly Val Ala Pro Cys Thr 50 55 60 Tyr Ser Thr Cys Pro Ile Arg Asp Glu Gly Glu Thr Ser Thr Ser Val 65 70 75 80 Ser Gly Lys Arg Lys His Ser Glu Val Glu Lys Asp Arg Arg Arg Ser 85 90 95 Ile Ser Asn Gly Phe Ala Val Cys Leu Gln Asn Val Leu His Asn Asp 100 105 110 Ser Asn Cys Ala Lys Pro Ile Ser Lys Ser Val Leu Leu Gln Gln Ala 115 120 125 Cys Asp Glu Ile Arg Glu Leu Arg Lys Lys Leu Asp Ala Ser Thr Thr 130 135 140 Ile Ile Ser Arg Phe Gly Leu Glu Asn Leu Phe Pro Thr Pro Asn Ser 145 150 155 160 Ser His Ala Ser Pro Pro Asn Gly Ser Ser Arg Thr Tyr Pro Pro Tyr 165 170 175 Asn Asn Gly Pro Asp Phe Asp Thr Arg Arg Ala Ser Ser Thr Ser Thr 180 185 190 Pro Tyr Asn Asn Glu Lys Arg Glu Ala Asn Val Lys Arg Arg His Ser 195 200 205 Tyr His Asn Ser Trp Asn Ala Ser Asp Arg Ser Ser Asp Asp Asp Thr 210 215 220 Asn Ala Ser Cys Ser Ser Thr Ser His His Asp Asp Asp Thr Asp Ser 225 230 235 240 Ser Glu Ser Asp Ser Asp Phe Pro Asp Glu Thr Lys Asn Arg Thr Lys 245 250 255 Arg His Lys Ala Arg Ala Lys Lys Asp Arg Asp Arg Ala Lys Pro Arg 260 265 270 Tyr Lys Pro Lys Pro His Thr Asn Arg Pro Pro Pro Ser Ser Cys Ser 275 280 285 Asp Ser Ser Pro Ser Ser Pro Cys Pro Ser Pro Asn Arg Asn Ala Asp 290 295 300 Glu Leu Gln Gln Ala Ile Leu Ser Leu Leu Leu Glu Leu Pro His His 305 310 315 320 Leu Glu Asp Val His Asn Asp Lys Arg Ala Ser Gln Gln Pro Thr Asp 325 330 335 Pro Thr Gly Lys Thr Arg Asn Lys Lys Arg His Arg 340 345 <210> 36 <211> 393 <212> PRT <213> Pseudozyma tsukubaensis <220> <223> Pseudog6266.t1 <400> 36 Met Ser Leu Ser Asn Ser Asn His Asn Glu Arg His Asn Asp Asp Asn 1 5 10 15 Asn Ile Asn Asp Asp Asp Cys Ala Asn Phe Phe Glu Leu Met Val Gln 20 25 30 Pro Ala Ser Ser Ser Ser Tyr Gly Pro Tyr Phe Pro Asp Pro Gly Leu 35 40 45 Ala Leu Pro Ala Ile Ser Asp Val Ser Ser Thr Thr Asp Thr Arg Leu 50 55 60 Pro Ser Gln Leu Gly Val Thr Pro Phe Ser His Gln Thr Ser Pro Ile 65 70 75 80 Arg Ser Ala Asp Glu Gly Glu Lys Thr Thr Thr Thr Ala Ser Tyr Lys 85 90 95 Arg Lys His Ser Glu Val Glu Lys Asp Arg Arg Arg Ile Ile Ser Asn 100 105 110 Gly Phe Ala Asn Val Leu His Asn Asp Ser Thr Ser Lys Pro Ile Ser 115 120 125 Lys Ala Thr Leu Leu Gln Gln Ala Cys Asp Glu Ile Arg Glu Leu Arg 130 135 140 Lys Lys Leu Asp Thr Ser Ile Thr Ile Ile Ser Arg Tyr Gly Leu Glu 145 150 155 160 Asn Leu Phe Gln Val Ala Pro Thr Pro Asn Ser Leu Ser Asn Ala Ser 165 170 175 Pro Pro Asn Gly Thr Ser Arg Ala Tyr Pro Thr Tyr Ser Asn Asp Leu 180 185 190 Gly Pro Asp Arg Phe Gln Asp Ser Arg Arg Ser Ser Thr Ser Ala Thr 195 200 205 Ser Val Ser Gly Ser Gln Tyr Asn Asn Gly Ala Ala Ala Lys Glu Asp 210 215 220 Gly Asn Glu Arg Arg Asn Ser Asn Val Lys Arg Arg Ser Ser Tyr Thr 225 230 235 240 Asn Ser Ile Asn Ser Ser Phe Glu Ser Ser Glu Glu Asp Thr Leu Asn 245 250 255 Ser Ser Cys Asp Asn Thr Ser Asp Phe Asp Glu Ser Val Gly Ser Ser 260 265 270 Glu Ser Glu Ser Glu Thr Asn Asn Arg Thr Arg Asn Arg Asn Arg Thr 275 280 285 Lys Arg Ala Met Ala Thr Ala Lys Leu Lys Asp Arg Asp Arg Ala Lys 290 295 300 Ala Arg Thr Ala Pro Lys Pro His Ser Asn Arg Leu Ser Pro Ala Ser 305 310 315 320 Thr Ile Thr Pro Ser Glu Met Ser Ser Ser Leu Ala Ser Pro Asn Thr 325 330 335 Ser Ser Gln Glu His Ile Gln Gln Ala Ile Leu Ser Leu Leu Leu Glu 340 345 350 Leu Pro Lys His Leu Glu Asn Val His Lys Ser Lys Arg Pro Ser Ser 355 360 365 Gln Gln Pro Ser Thr Gln Ile Asp Gln Thr Gly Asn Arg Thr Thr Thr 370 375 380 Val Thr Lys Thr Arg Arg Arg His Arg 385 390 <210> 37 <211> 288 <212> PRT <213> artificial <220> <223> synthetic shortened RIA1 sequence <400> 37 Met Ser Leu Ser Asn Ser Asn Ile Asn Asp Asp Asp Cys Ala Asn Phe 1 5 10 15 Phe Glu Leu Met Val Gln Pro Ala Ser Ser Ser Ser Tyr Tyr Phe Pro 20 25 30 Asp Pro Gly Leu Ala Leu Pro Ala Ile Ser Asp Val Ser Ser Thr Thr 35 40 45 Asp Thr Arg Leu Pro Ser Gln Leu Gly Val Thr Pro Phe His Gln Thr 50 55 60 Ser Pro Ile Lys Thr Thr Thr Thr Ala Ser Tyr Lys Arg Lys His Ser 65 70 75 80 Glu Val Glu Lys Asp Arg Arg Arg Ile Ile Ser Asn Gly Phe Ala Asn 85 90 95 Val Leu His Asn Asp Ser Thr Ser Lys Pro Ile Ser Lys Ala Thr Leu 100 105 110 Leu Gln Gln Ala Cys Asp Glu Ile Arg Glu Leu Arg Lys Lys Leu Asp 115 120 125 Thr Ser Ile Thr Ile Ile Ser Arg Tyr Gly Leu Glu Asn Leu Phe Pro 130 135 140 Asn Ser Ser Asn Ala Ser Pro Pro Asn Gly Thr Ser Arg Ala Tyr Pro 145 150 155 160 Arg Arg Asn Ser Asn Val Lys Arg Arg Ser Ser Tyr Thr Asn Ser Asn 165 170 175 Ser Ser Phe Glu Ser Ser Glu Glu Asp Ser Cys Asp Asn Thr Ser Asp 180 185 190 Phe Asp Glu Ser Val Gly Ser Ser Glu Ser Glu Ser Glu Thr Asn Asn 195 200 205 Asn Arg Thr Lys Arg Ala Met Ala Thr Ala Lys Lys Asp Arg Asp Arg 210 215 220 Ala Lys Ala Arg Thr Ala Pro Lys Pro Ala Ser Thr Ile Thr Pro Ser 225 230 235 240 Glu Met Ser Ser Ser Leu Ala Ser Pro Asn Thr Ser Ser Gln Ile Gln 245 250 255 Gln Ala Ile Leu Ser Leu Leu Leu Glu Leu Pro Lys His Leu Glu Asn 260 265 270 Val His Lys Ser Lys Arg Pro Ser Thr Lys Thr Arg Arg Arg His Arg 275 280 285 <210> 38 <211> 7 <212> PRT <213> artificial <220> <223> 1st RIA1 motif <400> 38 Ser Gly Lys Arg Lys His Ser 1 5 <210> 39 <211> 8 <212> PRT <213> artificial <220> <223> 2nd RIA1 motif <400> 39 Lys Arg Lys His Ser Glu Val Glu 1 5 <210> 40 <211> 8 <212> PRT <213> artificial <220> <223> 3rd RIA1 motif <400> 40 Lys Asp Arg Arg Arg Ser Ile Ser 1 5 <210> 41 <211> 6 <212> PRT <213> artificial <220> <223> 4th RIA1 motif <400> 41 Ile Ser Asn Gly Phe Ala 1 5 <210> 42 <211> 5 <212> PRT <213> artificial <220> <223> 5th RIA1 motif <400> 42 Asn Val Leu His Asn 1 5 <210> 43 <211> 6 <212> PRT <213> artificial <220> <223> 6th RIA1 motif <400> 43 Ser Lys Pro Ile Ser Lys 1 5 <210> 44 <211> 13 <212> PRT <213> artificial <220> <223> 7th RIA1 motif <400> 44 Leu Leu Gln Gln Ala Cys Asp Glu Ile Arg Glu Leu Arg 1 5 10 <210> 45 <211> 14 <212> PRT <213> artificial <220> <223> 8th RIA1 motif <400> 45 Gln Ala Cys Asp Glu Ile Arg Glu Leu Arg Lys Lys Leu Asp 1 5 10 <210> 46 <211> 12 <212> PRT <213> artificial <220> <223> 9th RIA1 motif <400> 46 Gln Gln Ala Ile Leu Ser Leu Leu Leu Glu Leu Pro 1 5 10 <210> 47 <211> 7 <212> PRT <213> Pseudozyma tsukubaensis <220> <223> 1st RIA motif as found in P. tsukubaensis <400> 47 Ser Tyr Lys Arg Lys His Ser 1 5 <210> 48 <211> 295 <212> PRT <213> Pseudozyma tsukubaensis <220> <223> Pseudog4640.t1 <400> 48 Met Ser Leu Phe Asn Val Ser Asn Gly Leu Arg Ala Ala Leu Arg Pro 1 5 10 15 Ser Ile Ala Ser Ser Ser Arg Val Thr Ala Ala Phe Ser Thr Ser Ala 20 25 30 Ala Ala Arg Leu Ala Thr Pro Thr Asn Asp Ala Pro Gly Ser Gly Lys 35 40 45 Pro Gln His Leu Lys Gln Phe Lys Ile Tyr Arg Trp Asn Pro Asp Lys 50 55 60 Pro Ser Glu Lys Pro Arg Leu Gln Ser Tyr Thr Leu Asp Leu Asn Gln 65 70 75 80 Thr Gly Pro Met Val Leu Asp Ala Leu Ile Lys Ile Lys Asn Glu Ile 85 90 95 Asp Pro Thr Leu Thr Phe Arg Arg Ser Cys Arg Glu Gly Ile Cys Gly 100 105 110 Ser Cys Ala Met Asn Ile Asp Gly Val Asn Thr Leu Ala Cys Leu Cys 115 120 125 Arg Ile Asp Lys Ala Asn Asp Thr Lys Ile Tyr Pro Leu Pro His Met 130 135 140 Tyr Val Val Lys Asp Leu Val Pro Asp Leu Thr Gln Phe Tyr Lys Gln 145 150 155 160 Tyr Arg Ser Ile Glu Pro Phe Leu Lys Ser Asn Asn Thr Pro Ala Glu 165 170 175 Gly Glu His Leu Gln Ser Pro Glu Glu Arg Arg Arg Leu Asp Gly Leu 180 185 190 Tyr Glu Cys Ile Leu Cys Ala Cys Cys Ser Thr Ser Cys Pro Ser Tyr 195 200 205 Trp Trp Asn Gln Asp Glu Tyr Leu Gly Pro Ala Val Leu Met Gln Ala 210 215 220 Tyr Arg Trp Met Ala Asp Ser Arg Asp Asp Phe Gly Glu Glu Arg Arg 225 230 235 240 Gln Lys Leu Glu Asn Thr Phe Ser Leu Tyr Arg Cys His Thr Ile Met 245 250 255 Asn Cys Ser Arg Thr Cys Pro Lys Asn Leu Asn Pro Gly Lys Ala Ile 260 265 270 Ser Gln Ile Lys Lys Asp Met Ala Val Gly Ala Pro Lys Ala Ala Asp 275 280 285 Arg Pro Ile Met Ala Ser Ser 290 295 <210> 49 <211> 1974 <212> DNA <213> Pseudozyma tsukubaensis <220> <223> Pseudog4640.t1 <400> 49 cgtgttgcat gaggttgctg gggaggcttc acggtctttc acaccgagac ttttgggagc 60 tgggaggcgc aaagaggacc ctgagcagga tgcgtagaaa cgcagtgtgg agcttggccg 120 agttccgcaa aaatgtcaaa atgttacatc ttcaaataag acatcgactg cacagcggga 180 gcttacggat gcgccgggtc tcttccggtc taacacgatg gtaaattgta caaaatcggc 240 aggaaacggc gttccgccaa atgcgatgag gcaaaggcgc gctgttgtca attatgtcag 300 cgacgagcga gacttggcgg gaaaaagatt ctaatttcgc acactcacac tgctgcctgg 360 caggcgcgcg taggcatgcc caatcagact cgatttgatt tcaaagccaa aagctcaaat 420 tgcagcagtc agccactgca cactgtgact gcgaaattca gctgaaaagc cgatacaggc 480 cgagttttag aggcagcaca ctgcgaagct gagaaaatga gctacgaacg tgttttggta 540 atcagccggc gtaacccaca ctgcactgca cgcttgagag ggtcagggtg tgtgtggcta 600 cagcagcagc agcggcagac ttcgagttcc aactctcccc gcacaagcga ccgcgagttc 660 cattcggtca gagttggcaa gtctctcgcg cgcacacctt gagttgattg aaagattgta 720 gccaacgcca tcttcattgc tgaacaccat caccaatacc tacattcgta ctcgcatcac 780 acattggtcg tcatgtcgct tttcaacgtc agcaacggtc ttcgtgccgc cctccgaccc 840 tccatcgcga gctcgtcccg cgttactgct gctttctcga catccgcagc tgcccgtctt 900 gccacgccca ccaacgatgc tcctggctct ggcaagcctc agcacttgaa gcagttcaag 960 atctaccgct ggaaccccga caagccttcc gagaagcctc gtctccagtc ctacactctt 1020 gaccttaacc agaccggccc aatggtgctc gatgccttga ttaagatcaa gaacgagatc 1080 gaccccactc ttactttccg tcgctcgtgc cgtgaaggta tctgcggttc ttgcgccatg 1140 aacatcgacg gtgtcaacac ccttgcttgt ctttgccgaa ttgacaaggc caacgacacc 1200 aagatctacc ccctccctca catgtacgtc gtcaaggacc ttgttcctga cttgacccag 1260 ttctacaagc agtaccgttc catcgagcct ttcctcaagt ccaacaacac ccctgctgag 1320 ggagagcacc ttcagtcgcc cgaggagcgt cgtcgtctcg acggtcttta cgagtgcatt 1380 ctctgcgctt gctgctccac gtcctgcccc tcctactggt ggaaccagga cgagtacctt 1440 ggtcccgccg tcctcatgca ggcttaccga tggatggccg actcccgtga tgactttggt 1500 gaggagcgaa gacagaagct cgagaacacc ttctcgctct accgttgcca caccatcatg 1560 aactgctcca ggacttgccc caagaacctt aacccaggca aggccatctc ccagatcaag 1620 aaggacatgg ctgtcggtgc ccccaaggct gccgaccgtc ccatcatggc ctcgtcttaa 1680 gaaaagtaaa aggcttcggt agttcggttt gtattcgacc cttgtttcat tctttcaatc 1740 tagtcatttc gcattgcaat tcgttgttgc tcgtgtgtgt tactcgtccg tcaatttcag 1800 gttggttctt cgcaattttt cactgtagga gagagatcga agcaatgtct cacagcaaga 1860 cgttcgacta ccatgctctg aagtcatgtg gatcccaggt gttaaatgat agaggtaacc 1920 aacaatatat tcacaacgaa aaggtgacaa tcttaggcat acaggttgaa gcgt 1974 <210> 50 <211> 888 <212> DNA <213> Ustilago maydis <220> <223> coding region of Embl entry Z11738.1 (entry Z11738 is SEQ ID NO. 52) <400> 50 atgtcgctat tcaacgtcag caacggtctt cgtaccgctc tccgaccttc tgttgccagc 60 tcttcgcgcg ttgctgcctt ttccacaacc gccgctgccc gtctcgccac acccacctct 120 gacaacgttg gcagttcggg caagcctcag cacttgaagc agttcaagat ctaccgatgg 180 aaccctgaca agccctcgga gaagcctcgt ctgcagtcgt acacactgga cctcaaccag 240 accggtccaa tggttctcga cgcgctcatc aaaatcaaga acgaaattga ccctacgctc 300 accttccgtc gctcgtgccg tgagggtatc tgcggttcgt gcgctatgaa tattgacggt 360 gtcaacaccc tcgcctgcct ctgccggatc gacaagcaga atgacaccaa gatctacccc 420 ttgccgcaca tgtacattgt caaggacctc gtgccagact tgacccagtt ctacaagcag 480 taccgatcca tcgagccttt cctcaagtcc aacaacaccc cttctgaggg tgaacatctt 540 cagtcgcccg aggagcgtcg tcgactcgac ggtctgtacg agtgcattct gtgcgcgtgc 600 tgctccacat cctgcccctc ttactggtgg aatcaggacg agtaccttgg ccccgccgtg 660 ctcatgcagg cgtaccgatg gatggccgac tcgcgtgacg actttggtga ggagcgaaga 720 cagaagctcg agaacacctt ttcgctctac cgatgccaca ccatcatgaa ctgctccagg 780 acctgcccca agaacctcaa ccctggtaag gcaattgcac agatcaagaa ggacatggcc 840 gtcggcgcac ccaaggcttc cgagcgccct atcatggctt cgtcgtaa 888 <210> 51 <211> 1145 <212> DNA <213> Pseudozyma tsukubaensis <220> <223> Pseudozyma tsukubaensis genomic sequence corresponding to Embl entry Z11738 (entry Z11738 is SEQ ID NO. 52) <400> 51 cagcggcaga cttcgagttc caactctccc cgcacaagcg accgcgagtt ccattcggtc 60 agagttggca agtctctcgc gcgcacacct tgagttgatt gaaagattgt agccaacgcc 120 atcttcattg ctgaacacca tcaccaatac ctacattcgt actcgcatca cacattggtc 180 gtcatgtcgc ttttcaacgt cagcaacggt cttcgtgccg ccctccgacc ctccatcgcg 240 agctcgtccc gcgttactgc tgctttctcg acatccgcag ctgcccgtct tgccacgccc 300 accaacgatg ctcctggctc tggcaagcct cagcacttga agcagttcaa gatctaccgc 360 tggaaccccg acaagccttc cgagaagcct cgtctccagt cctacactct tgaccttaac 420 cagaccggcc caatggtgct cgatgccttg attaagatca agaacgagat cgaccccact 480 cttactttcc gtcgctcgtg ccgtgaaggt atctgcggtt cttgcgccat gaacatcgac 540 ggtgtcaaca cccttgcttg tctttgccga attgacaagg ccaacgacac caagatctac 600 cccctccctc acatgtacgt cgtcaaggac cttgttcctg acttgaccca gttctacaag 660 cagtaccgtt ccatcgagcc tttcctcaag tccaacaaca cccctgctga gggagagcac 720 cttcagtcgc ccgaggagcg tcgtcgtctc gacggtcttt acgagtgcat tctctgcgct 780 tgctgctcca cgtcctgccc ctcctactgg tggaaccagg acgagtacct tggtcccgcc 840 gtcctcatgc aggcttaccg atggatggcc gactcccgtg atgactttgg tgaggagcga 900 agacagaagc tcgagaacac cttctcgctc taccgttgcc acaccatcat gaactgctcc 960 aggacttgcc ccaagaacct taacccaggc aaggccatct cccagatcaa gaaggacatg 1020 gctgtcggtg cccccaaggc tgccgaccgt cccatcatgg cctcgtctta agaaaagtaa 1080 aaggcttcgg tagttcggtt tgtattcgac ccttgtttca ttctttcaat ctagtcattt 1140 cgcat 1145 <210> 52 <211> 1145 <212> DNA <213> Ustilago maydis <220> <223> Embl Z11738.1 (genomic sequence from U. maydis) <400> 52 atcgtgctct acgactttgc acaccacaaa gtgtgcgggg agcaaaggac ccgatcttgg 60 tcgcgcgcaa agcagtcttg aacctgagag tgtgcgtgtc ttctgacgct tgcccttctg 120 tactttgctg tgacactacc accacatctg tcttggcttt ttgttcatac atccacaccg 180 accatgtcgc tattcaacgt cagcaacggt cttcgtaccg ctctccgacc ttctgttgcc 240 agctcttcgc gcgttgctgc cttttccaca accgccgctg cccgtctcgc cacacccacc 300 tctgacaacg ttggcagttc gggcaagcct cagcacttga agcagttcaa gatctaccga 360 tggaaccctg acaagccctc ggagaagcct cgtctgcagt cgtacacact ggacctcaac 420 cagaccggtc caatggttct cgacgcgctc atcaaaatca agaacgaaat tgaccctacg 480 ctcaccttcc gtcgctcgtg ccgtgagggt atctgcggtt cgtgcgctat gaatattgac 540 ggtgtcaaca ccctcgcctg cctctgccgg atcgacaagc agaatgacac caagatctac 600 cccttgccgc acatgtacat tgtcaaggac ctcgtgccag acttgaccca gttctacaag 660 cagtaccgat ccatcgagcc tttcctcaag tccaacaaca ccccttctga gggtgaacat 720 cttcagtcgc ccgaggagcg tcgtcgactc gacggtctgt acgagtgcat tctgtgcgcg 780 tgctgctcca catcctgccc ctcttactgg tggaatcagg acgagtacct tggccccgcc 840 gtgctcatgc aggcgtaccg atggatggcc gactcgcgtg acgactttgg tgaggagcga 900 agacagaagc tcgagaacac cttttcgctc taccgatgcc acaccatcat gaactgctcc 960 aggacctgcc ccaagaacct caaccctggt aaggcaattg cacagatcaa gaaggacatg 1020 gccgtcggcg cacccaaggc ttccgagcgc cctatcatgg cttcgtcgta atcttgatat 1080 atcatatcgt tctttcctca gcacttcttt tgtcaatttc aaaagtatct aattgcattc 1140 aactc 1145 <210> 53 <211> 1974 <212> DNA <213> Pseudozyma tsukubaensis <220> <223> extended ip locus <400> 53 cgtgttgcat gaggttgctg gggaggcttc acggtctttc acaccgagac ttttgggagc 60 tgggaggcgc aaagaggacc ctgagcagga tgcgtagaaa cgcagtgtgg agcttggccg 120 agttccgcaa aaatgtcaaa atgttacatc ttcaaataag acatcgactg cacagcggga 180 gcttacggat gcgccgggtc tcttccggtc taacacgatg gtaaattgta caaaatcggc 240 aggaaacggc gttccgccaa atgcgatgag gcaaaggcgc gctgttgtca attatgtcag 300 cgacgagcga gacttggcgg gaaaaagatt ctaatttcgc acactcacac tgctgcctgg 360 caggcgcgcg taggcatgcc caatcagact cgatttgatt tcaaagccaa aagctcaaat 420 tgcagcagtc agccactgca cactgtgact gcgaaattca gctgaaaagc cgatacaggc 480 cgagttttag aggcagcaca ctgcgaagct gagaaaatga gctacgaacg tgttttggta 540 atcagccggc gtaacccaca ctgcactgca cgcttgagag ggtcagggtg tgtgtggcta 600 cagcagcagc agcggcagac ttcgagttcc aactctcccc gcacaagcga ccgcgagttc 660 cattcggtca gagttggcaa gtctctcgcg cgcacacctt gagttgattg aaagattgta 720 gccaacgcca tcttcattgc tgaacaccat caccaatacc tacattcgta ctcgcatcac 780 acattggtcg tcatgtcgct tttcaacgtc agcaacggtc ttcgtgccgc cctccgaccc 840 tccatcgcga gctcgtcccg cgttactgct gctttctcga catccgcagc tgcccgtctt 900 gccacgccca ccaacgatgc tcctggctct ggcaagcctc agcacttgaa gcagttcaag 960 atctaccgct ggaaccccga caagccttcc gagaagcctc gtctccagtc ctacactctt 1020 gaccttaacc agaccggccc aatggtgctc gatgccttga ttaagatcaa gaacgagatc 1080 gaccccactc ttactttccg tcgctcgtgc cgtgaaggta tctgcggttc ttgcgccatg 1140 aacatcgacg gtgtcaacac ccttgcttgt ctttgccgaa ttgacaaggc caacgacacc 1200 aagatctacc ccctccctca catgtacgtc gtcaaggacc ttgttcctga cttgacccag 1260 ttctacaagc agtaccgttc catcgagcct ttcctcaagt ccaacaacac ccctgctgag 1320 ggagagcacc ttcagtcgcc cgaggagcgt cgtcgtctcg acggtcttta cgagtgcatt 1380 ctctgcgctt gctgctccac gtcctgcccc tcctactggt ggaaccagga cgagtacctt 1440 ggtcccgccg tcctcatgca ggcttaccga tggatggccg actcccgtga tgactttggt 1500 gaggagcgaa gacagaagct cgagaacacc ttctcgctct accgttgcca caccatcatg 1560 aactgctcca ggacttgccc caagaacctt aacccaggca aggccatctc ccagatcaag 1620 aaggacatgg ctgtcggtgc ccccaaggct gccgaccgtc ccatcatggc ctcgtcttaa 1680 gaaaagtaaa aggcttcggt agttcggttt gtattcgacc cttgtttcat tctttcaatc 1740 tagtcatttc gcattgcaat tcgttgttgc tcgtgtgtgt tactcgtccg tcaatttcag 1800 gttggttctt cgcaattttt cactgtagga gagagatcga agcaatgtct cacagcaaga 1860 cgttcgacta ccatgctctg aagtcatgtg gatcccaggt gttaaatgat agaggtaacc 1920 aacaatatat tcacaacgaa aaggtgacaa tcttaggcat acaggttgaa gcgt 1974 <210> 54 <211> 2001 <212> DNA <213> Pseudozyma tsukubaensis <220> <223> upstream of SEQ ID NO 53 <400> 54 gcaaagtgga gtaagctgtg tttctcggat gccgggattc agaaagtggc gagaagaaca 60 ctcgtgctca aagcacatgg taacgttcgc tacgacgtcc tcactgtact tcgcaccctg 120 cactcctcat acccaagtcc tttgagcttc aagatgttag gcaccgtcac tagactggca 180 cgcgccgacc tgaagtcaag tcagctcacg ctagagcatt tcctcatgcg agctcgcact 240 ctttcgctct accgcaaata cctcagagct accagagaca ttccaaatcc gctcgctcga 300 tgggagacaa tccatttctt ccgggacgat gtccaccgct ttcgtcacga aacagatctg 360 gagaagatca aggacttgct tgtacagggc aaccgcttct tgaagcaaat gcaaggacag 420 atgactttgg cgggagcagc ttcggatggc aacgccaata agcttcgtgg cacacggcaa 480 ttgtgattgc tcaaaagctc aatcacaggc acagctttga ctcatcatgg cttagcccca 540 caccgcagct acgcaacgca cttgcgtcct acagctatat acctgaacgc cgcatcacag 600 caacacacaa gagcgacaca gagcagctag ccttaggcga ccagccttcg attcgttctc 660 tcgtcgaaag actgcaccag tctgctacat ttcatagatt ttcgcatgac ggcatcagcc 720 ccgggtcaca agcacggcga acgagcaaag gatcgaccat gctctcccgc tcaatacaat 780 atgccccgta cacttggctt cttggcagca gccagagccg aggcgtccat cagcacgatc 840 aaaggtcaat cagtctcagg accagcgaaa tattgcaaca ggaagcttca atttatgcct 900 ttacatcgtc tacatggtaa taccaaccca tcaaacagac tcgtcgagca gaacgtactc 960 tcgcgtgcta gccccaaatg tgagcgtgtc acccgatctg agctggtagt atctcgaagt 1020 aggaatctcc ttgtcgttga cgtaggagcc attactcgat tcgagatcga tcaagaaagg 1080 ctgtatacgc ttctttcggt ctccgaattc gttggttgtg atggtttggc ggtactgaag 1140 cacagcgtgc tgtttcgaac acgattcgtg atccagagga atgtcgacca ctgtacgatc 1200 tcgaccaaga aggaaacaag attgtgaagc gagatggagc acttgctgct ctttgccgtc 1260 tttgaaacag tagagacgcc atggcgtttt gggtttgcga gcttcaggtg gttcgtgata 1320 cttgagagcg acgccattga cggtatttga ttcggcggcg aggagtccag atggagcaaa 1380 gtttggagca tcttcgtcga atccttcctc gagagcgtga gaagcaggtg caggagggga 1440 tgcaggacgt ggcgagcgtg aagctacagg tcttgaagag gtggaagcgg ctggaattgg 1500 tgagcgtgag cgtgagcggc gagatggctc tttgtctttg cgagaggagc tctctcgagc 1560 ctctcgagcc tctcgatcat gtcgatcatg tcggcgatga cggtttgatg atgagtagtg 1620 gcgatgtgag cgatcatcgt ctcgcttccg attggagctg gagcgacggt cttcgtcgcg 1680 atgtcgtcga tgcctatcct catccctgtc atctcgatgc cttttggagc ttgagctcgc 1740 tcggtggctg tcgtctggat cctccttatg cctccttgat cctgaagaat gttctttgtc 1800 acccttattg tggctcgatc cgtgcctgtg cctgtcacgc tctgcgtctg catgttctcg 1860 atgtgagtgt gatctccttt cgcggtgttg atctcggtca tatctggagc tgcctgagcg 1920 attggaggat gatggcggga tgtctgcctt ctcagcaaca atgcgtcttg aggagccgga 1980 atcagctgct gagtccgaca t 2001 <210> 55 <211> 2000 <212> DNA <213> Pseudozyma tsukubaensis <220> <223> downstream of SEQ ID NO 53 <400> 55 ttaccaagtg aagcagtcct caagcagatc gacatgtacg cctttcttca acatgtgcac 60 cgtctccacc ctgacgtcgt cgcataggct tggcggcccg caaagaccaa cagtcaagcc 120 tttgctctcc tgcaacattt gctcgttcaa gtgtccaaac atagcgccct tcaaactctc 180 cggtcggcct ccgaactggg acactgcgat cttggctccg ttggcgccgt ccgagaacaa 240 gtctgctcgg gcgtcaatat gctcgttgcg ctgctcttgc tgctgctttg gaatcatggc 300 aagctcgacg acttcgctcg taagctcgga cgaaggtgtg gagggttcgc cagcctgcga 360 ttcggattgc tggacgggca gcttctcctt gatcgaggcg gatgacgagg atcgagagta 420 aggcgtgctg gagatcgact tgtcagagtc agcttcgaca gcgcgcttcc ccccatcgac 480 ccgtccgtgc gaggtgacat agagatcgag agagaattgg cagcccttcc agctctcctg 540 tccctccatc tctttgatca gctctgcaaa cgcttcggca atcacagtca gcgtatctgt 600 aagtagatca aaacgacgtg ggtttttacg gagcgtcagc aagatgttcc cttgggataa 660 tttgagaacg gagcgagtct gagctacgga tacttacttt gttctcgaac gatccagata 720 agcttgcaag atttgagctt tttgttcgca gcactgccct tcactgcagc cacgaagagc 780 ggccagcagt aagtgatagc aatgccacca gcaaccagaa ctagatccgt agcatggtcg 840 atgttgggga tcacgccgaa aggtccttcg accagaacag ctacctttcc gttgtcatcc 900 gcgttcctgc cggccagctc aacatctttc tccgcaacct ctccgtgagt gtgagcattg 960 atgtggtggg cgagctttcg cgtaagacca gcctcggttt tgatgaccag atcgatgaag 1020 ccttgggtgg ggttttctgg ctgaacaccg acagagaaga cggtgaaagg atgctcgccg 1080 acccattgca agcgagggat tgtgatgcgg atgtcgtcgc cgccagcgat acctccgatc 1140 aagcgcggct ggttggcaag tcgcagcttc gatgcaggaa cagagataca caagcgagtg 1200 tactggctgt tcgagccata ggtgcggata tcgccagtgg cgcaagtgat gagcgaagat 1260 ccgcgaccgt tcattcgtgg ggacgagaac gagaggtaga tccggcttgc gagtcgagct 1320 acgcggtcga aagcccacac agcggccgcg atctctgtga gcacgacgaa catttggaac 1380 tgacatccga aagcattgag gagaggtgat ggtcagcatg tgtcgtcgta tcaaatcttt 1440 cagtgtacga gatgcatgtc gacatctgtc gaggtgtagt aaaagactta ccctgctcga 1500 tttgatcaag gagatgtgca ggtatgttcc cagaatagca aagaaagcca tagcgatgtg 1560 tagcatcaca aagatctgca aagaattgtc gttagcgtgt aaacatcaaa aagcaaaatg 1620 ccatggtcag cgtctactca aagatataca cgagtccaag acggatcact cacttcgtaa 1680 aagcgttgtc gcagagctcg aaccgaaaag aagaccagtc cgaacatcat actcaacgcc 1740 acaatacccc acgtaacata atcgtcctcg agcatctctg caactcctcc aggccgccta 1800 acgtaaatcg cagtccaagc cgaagcatga acaacaatgt gaagccagaa ccacctcgca 1860 atccacctgt gccacagcat aagactgttc atgttcaaac cggacatgat ggccaaagga 1920 gtccttttgc tcgccatcaa gatcaagagc ggaagttggg ccgttcccag aattgcagtt 1980 cgatcggcta agtgtcgagc 2000 <210> 56 <211> 5975 <212> DNA <213> Pseudozyma tsukubaensis <220> <223> most extended ip locus <400> 56 gcaaagtgga gtaagctgtg tttctcggat gccgggattc agaaagtggc gagaagaaca 60 ctcgtgctca aagcacatgg taacgttcgc tacgacgtcc tcactgtact tcgcaccctg 120 cactcctcat acccaagtcc tttgagcttc aagatgttag gcaccgtcac tagactggca 180 cgcgccgacc tgaagtcaag tcagctcacg ctagagcatt tcctcatgcg agctcgcact 240 ctttcgctct accgcaaata cctcagagct accagagaca ttccaaatcc gctcgctcga 300 tgggagacaa tccatttctt ccgggacgat gtccaccgct ttcgtcacga aacagatctg 360 gagaagatca aggacttgct tgtacagggc aaccgcttct tgaagcaaat gcaaggacag 420 atgactttgg cgggagcagc ttcggatggc aacgccaata agcttcgtgg cacacggcaa 480 ttgtgattgc tcaaaagctc aatcacaggc acagctttga ctcatcatgg cttagcccca 540 caccgcagct acgcaacgca cttgcgtcct acagctatat acctgaacgc cgcatcacag 600 caacacacaa gagcgacaca gagcagctag ccttaggcga ccagccttcg attcgttctc 660 tcgtcgaaag actgcaccag tctgctacat ttcatagatt ttcgcatgac ggcatcagcc 720 ccgggtcaca agcacggcga acgagcaaag gatcgaccat gctctcccgc tcaatacaat 780 atgccccgta cacttggctt cttggcagca gccagagccg aggcgtccat cagcacgatc 840 aaaggtcaat cagtctcagg accagcgaaa tattgcaaca ggaagcttca atttatgcct 900 ttacatcgtc tacatggtaa taccaaccca tcaaacagac tcgtcgagca gaacgtactc 960 tcgcgtgcta gccccaaatg tgagcgtgtc acccgatctg agctggtagt atctcgaagt 1020 aggaatctcc ttgtcgttga cgtaggagcc attactcgat tcgagatcga tcaagaaagg 1080 ctgtatacgc ttctttcggt ctccgaattc gttggttgtg atggtttggc ggtactgaag 1140 cacagcgtgc tgtttcgaac acgattcgtg atccagagga atgtcgacca ctgtacgatc 1200 tcgaccaaga aggaaacaag attgtgaagc gagatggagc acttgctgct ctttgccgtc 1260 tttgaaacag tagagacgcc atggcgtttt gggtttgcga gcttcaggtg gttcgtgata 1320 cttgagagcg acgccattga cggtatttga ttcggcggcg aggagtccag atggagcaaa 1380 gtttggagca tcttcgtcga atccttcctc gagagcgtga gaagcaggtg caggagggga 1440 tgcaggacgt ggcgagcgtg aagctacagg tcttgaagag gtggaagcgg ctggaattgg 1500 tgagcgtgag cgtgagcggc gagatggctc tttgtctttg cgagaggagc tctctcgagc 1560 ctctcgagcc tctcgatcat gtcgatcatg tcggcgatga cggtttgatg atgagtagtg 1620 gcgatgtgag cgatcatcgt ctcgcttccg attggagctg gagcgacggt cttcgtcgcg 1680 atgtcgtcga tgcctatcct catccctgtc atctcgatgc cttttggagc ttgagctcgc 1740 tcggtggctg tcgtctggat cctccttatg cctccttgat cctgaagaat gttctttgtc 1800 acccttattg tggctcgatc cgtgcctgtg cctgtcacgc tctgcgtctg catgttctcg 1860 atgtgagtgt gatctccttt cgcggtgttg atctcggtca tatctggagc tgcctgagcg 1920 attggaggat gatggcggga tgtctgcctt ctcagcaaca atgcgtcttg aggagccgga 1980 atcagctgct gagtccgaca tcgtgttgca tgaggttgct ggggaggctt cacggtcttt 2040 cacaccgaga cttttgggag ctgggaggcg caaagaggac cctgagcagg atgcgtagaa 2100 acgcagtgtg gagcttggcc gagttccgca aaaatgtcaa aatgttacat cttcaaataa 2160 gacatcgact gcacagcggg agcttacgga tgcgccgggt ctcttccggt ctaacacgat 2220 ggtaaattgt acaaaatcgg caggaaacgg cgttccgcca aatgcgatga ggcaaaggcg 2280 cgctgttgtc aattatgtca gcgacgagcg agacttggcg ggaaaaagat tctaatttcg 2340 cacactcaca ctgctgcctg gcaggcgcgc gtaggcatgc ccaatcagac tcgatttgat 2400 ttcaaagcca aaagctcaaa ttgcagcagt cagccactgc acactgtgac tgcgaaattc 2460 agctgaaaag ccgatacagg ccgagtttta gaggcagcac actgcgaagc tgagaaaatg 2520 agctacgaac gtgttttggt aatcagccgg cgtaacccac actgcactgc acgcttgaga 2580 gggtcagggt gtgtgtggct acagcagcag cagcggcaga cttcgagttc caactctccc 2640 cgcacaagcg accgcgagtt ccattcggtc agagttggca agtctctcgc gcgcacacct 2700 tgagttgatt gaaagattgt agccaacgcc atcttcattg ctgaacacca tcaccaatac 2760 ctacattcgt actcgcatca cacattggtc gtcatgtcgc ttttcaacgt cagcaacggt 2820 cttcgtgccg ccctccgacc ctccatcgcg agctcgtccc gcgttactgc tgctttctcg 2880 acatccgcag ctgcccgtct tgccacgccc accaacgatg ctcctggctc tggcaagcct 2940 cagcacttga agcagttcaa gatctaccgc tggaaccccg acaagccttc cgagaagcct 3000 cgtctccagt cctacactct tgaccttaac cagaccggcc caatggtgct cgatgccttg 3060 attaagatca agaacgagat cgaccccact cttactttcc gtcgctcgtg ccgtgaaggt 3120 atctgcggtt cttgcgccat gaacatcgac ggtgtcaaca cccttgcttg tctttgccga 3180 attgacaagg ccaacgacac caagatctac cccctccctc acatgtacgt cgtcaaggac 3240 cttgttcctg acttgaccca gttctacaag cagtaccgtt ccatcgagcc tttcctcaag 3300 tccaacaaca cccctgctga gggagagcac cttcagtcgc ccgaggagcg tcgtcgtctc 3360 gacggtcttt acgagtgcat tctctgcgct tgctgctcca cgtcctgccc ctcctactgg 3420 tggaaccagg acgagtacct tggtcccgcc gtcctcatgc aggcttaccg atggatggcc 3480 gactcccgtg atgactttgg tgaggagcga agacagaagc tcgagaacac cttctcgctc 3540 taccgttgcc acaccatcat gaactgctcc aggacttgcc ccaagaacct taacccaggc 3600 aaggccatct cccagatcaa gaaggacatg gctgtcggtg cccccaaggc tgccgaccgt 3660 cccatcatgg cctcgtctta agaaaagtaa aaggcttcgg tagttcggtt tgtattcgac 3720 ccttgtttca ttctttcaat ctagtcattt cgcattgcaa ttcgttgttg ctcgtgtgtg 3780 ttactcgtcc gtcaatttca ggttggttct tcgcaatttt tcactgtagg agagagatcg 3840 aagcaatgtc tcacagcaag acgttcgact accatgctct gaagtcatgt ggatcccagg 3900 tgttaaatga tagaggtaac caacaatata ttcacaacga aaaggtgaca atcttaggca 3960 tacaggttga agcgtttacc aagtgaagca gtcctcaagc agatcgacat gtacgccttt 4020 cttcaacatg tgcaccgtct ccaccctgac gtcgtcgcat aggcttggcg gcccgcaaag 4080 accaacagtc aagcctttgc tctcctgcaa catttgctcg ttcaagtgtc caaacatagc 4140 gcccttcaaa ctctccggtc ggcctccgaa ctgggacact gcgatcttgg ctccgttggc 4200 gccgtccgag aacaagtctg ctcgggcgtc aatatgctcg ttgcgctgct cttgctgctg 4260 ctttggaatc atggcaagct cgacgacttc gctcgtaagc tcggacgaag gtgtggaggg 4320 ttcgccagcc tgcgattcgg attgctggac gggcagcttc tccttgatcg aggcggatga 4380 cgaggatcga gagtaaggcg tgctggagat cgacttgtca gagtcagctt cgacagcgcg 4440 cttcccccca tcgacccgtc cgtgcgaggt gacatagaga tcgagagaga attggcagcc 4500 cttccagctc tcctgtccct ccatctcttt gatcagctct gcaaacgctt cggcaatcac 4560 agtcagcgta tctgtaagta gatcaaaacg acgtgggttt ttacggagcg tcagcaagat 4620 gttcccttgg gataatttga gaacggagcg agtctgagct acggatactt actttgttct 4680 cgaacgatcc agataagctt gcaagatttg agctttttgt tcgcagcact gcccttcact 4740 gcagccacga agagcggcca gcagtaagtg atagcaatgc caccagcaac cagaactaga 4800 tccgtagcat ggtcgatgtt ggggatcacg ccgaaaggtc cttcgaccag aacagctacc 4860 tttccgttgt catccgcgtt cctgccggcc agctcaacat ctttctccgc aacctctccg 4920 tgagtgtgag cattgatgtg gtgggcgagc tttcgcgtaa gaccagcctc ggttttgatg 4980 accagatcga tgaagccttg ggtggggttt tctggctgaa caccgacaga gaagacggtg 5040 aaaggatgct cgccgaccca ttgcaagcga gggattgtga tgcggatgtc gtcgccgcca 5100 gcgatacctc cgatcaagcg cggctggttg gcaagtcgca gcttcgatgc aggaacagag 5160 atacacaagc gagtgtactg gctgttcgag ccataggtgc ggatatcgcc agtggcgcaa 5220 gtgatgagcg aagatccgcg accgttcatt cgtggggacg agaacgagag gtagatccgg 5280 cttgcgagtc gagctacgcg gtcgaaagcc cacacagcgg ccgcgatctc tgtgagcacg 5340 acgaacattt ggaactgaca tccgaaagca ttgaggagag gtgatggtca gcatgtgtcg 5400 tcgtatcaaa tctttcagtg tacgagatgc atgtcgacat ctgtcgaggt gtagtaaaag 5460 acttaccctg ctcgatttga tcaaggagat gtgcaggtat gttcccagaa tagcaaagaa 5520 agccatagcg atgtgtagca tcacaaagat ctgcaaagaa ttgtcgttag cgtgtaaaca 5580 tcaaaaagca aaatgccatg gtcagcgtct actcaaagat atacacgagt ccaagacgga 5640 tcactcactt cgtaaaagcg ttgtcgcaga gctcgaaccg aaaagaagac cagtccgaac 5700 atcatactca acgccacaat accccacgta acataatcgt cctcgagcat ctctgcaact 5760 cctccaggcc gcctaacgta aatcgcagtc caagccgaag catgaacaac aatgtgaagc 5820 cagaaccacc tcgcaatcca cctgtgccac agcataagac tgttcatgtt caaaccggac 5880 atgatggcca aaggagtcct tttgctcgcc atcaagatca agagcggaag ttgggccgtt 5940 cccagaattg cagttcgatc ggctaagtgt cgagc 5975 <210> 57 <211> 1126 <212> DNA <213> artificial <220> <223> (BsrGI)-pActin-olapACO1 <400> 57 atatatgtac aggcccgttc aacacaatgc gcctgcaatt tctatccccg ctttccacct 60 ctgtctccct cttcaaagtc acagagtctg ccatttgtat tcgagcatga aaaatgatga 120 cctcctttct tctcgttcaa tacagcggac atgaacaaga aaggggtggc ctgagccacc 180 aagttctaca cttgcagcca gacgtattca aaaatcgacg tggacgagtt gcgactcaac 240 atcctctgtg aattgcaatc gagtgagtga ttacgacctg tattcacgtc aaaatgcagg 300 tgtgacattt gaattttgaa atacatgagg caggctcgat ttgctccact caagtcgagt 360 ttgccaaatt caagaagcgc taatcggagc caaccgaccg accacaacca gccaaatcag 420 ccagccaagg cagagaagca gaagcaaagg cggtgcattg agaggtgagc cgtgtgctgt 480 gctgtgctct gctgtgctgt ctgtcaatgc ttgctgcgtg tgtttgtctc gcctctacag 540 cctgcccctc aagatgtgac cgattggaag gaaaggaagg tcacacgcag ttctggcatg 600 ccacgcacgc acagcccgaa attgcgatct caagagactg ccgacgccgc cgtccgccgt 660 tgagcgctct gcttgggtca aagcgtaagc gcttctcgaa ttcaaactca cagagttcca 720 agtctgcaca ggtcatctgt tcgtcctttt gagactgcct gactggctgg ctggaacgca 780 cgcacgcaca cttccgattc gacaccgccc gctgctgctg tcttctgcgc tcttgtgccc 840 ttcttctgta cttggccttt gcgtcgactt ctttgcttgc tcggcagtgc cgtctcatct 900 gccccaagtc aagctcagca gcacagcaca cacgcatcac cctctcggct tgggtttgcc 960 cctgttgcct gtctgtccac actcacacac atccctatcg cttgctcgac atcatcgctt 1020 acctcttccc caccacctcg tctttgacac ctttactttc tcaacccctc ttccaccacc 1080 aaccccccca ccacttactt tcaacatgct tccccttcgc gcactc 1126 <210> 58 <211> 3507 <212> DNA <213> artificial <220> <223> (BsrGI)_pActin_ACO1_(NsiI) <400> 58 atatatgtac aggcccgttc aacacaatgc gcctgcaatt tctatccccg ctttccacct 60 ctgtctccct cttcaaagtc acagagtctg ccatttgtat tcgagcatga aaaatgatga 120 cctcctttct tctcgttcaa tacagcggac atgaacaaga aaggggtggc ctgagccacc 180 aagttctaca cttgcagcca gacgtattca aaaatcgacg tggacgagtt gcgactcaac 240 atcctctgtg aattgcaatc gagtgagtga ttacgacctg tattcacgtc aaaatgcagg 300 tgtgacattt gaattttgaa atacatgagg caggctcgat ttgctccact caagtcgagt 360 ttgccaaatt caagaagcgc taatcggagc caaccgaccg accacaacca gccaaatcag 420 ccagccaagg cagagaagca gaagcaaagg cggtgcattg agaggtgagc cgtgtgctgt 480 gctgtgctct gctgtgctgt ctgtcaatgc ttgctgcgtg tgtttgtctc gcctctacag 540 cctgcccctc aagatgtgac cgattggaag gaaaggaagg tcacacgcag ttctggcatg 600 ccacgcacgc acagcccgaa attgcgatct caagagactg ccgacgccgc cgtccgccgt 660 tgagcgctct gcttgggtca aagcgtaagc gcttctcgaa ttcaaactca cagagttcca 720 agtctgcaca ggtcatctgt tcgtcctttt gagactgcct gactggctgg ctggaacgca 780 cgcacgcaca cttccgattc gacaccgccc gctgctgctg tcttctgcgc tcttgtgccc 840 ttcttctgta cttggccttt gcgtcgactt ctttgcttgc tcggcagtgc cgtctcatct 900 gccccaagtc aagctcagca gcacagcaca cacgcatcac cctctcggct tgggtttgcc 960 cctgttgcct gtctgtccac actcacacac atccctatcg cttgctcgac atcatcgctt 1020 acctcttccc caccacctcg tctttgacac ctttactttc tcaacccctc ttccaccacc 1080 aaccccccca ccacttactt tcaacatgct tccccttcgc gcactccgtt cttcctccct 1140 ccgggctgcc gccaaggctc ccctcgccag gggctatgcc accaccgtcg ccgaggaggc 1200 tgccgaaatc tcgccttccc tcttcgacaa gaaggttgag atgtccgttg tcgagtccgg 1260 caagggttac tacatcaact acaagcgtat cgaggacaac ctcaaggtcg ttcgatcccg 1320 cctcaaccga cctctttcgc tcgccgagaa gatcgtttac ggtcacttgg acaaccccca 1380 cgagcaggaa atcacccgtg gccagtccta cctcaagctc cgccctgacc gtgttgcttg 1440 ccaggatgcc accgcccaga tggccctcct ccaattcatg tcggctggtc ttcccaccgt 1500 cgccgtcccc tccaccgtcc actgtgatca ccttatcgag gctcaggtcg gcggtgccaa 1560 ggacttggcc cgtgctatcg agatcaacaa ggaggtttac gacttccttg ccactgccac 1620 tgccaagtac ggtcttggtt tctggaagcc cggatctggt atcatccacc agatcatcct 1680 tgagaactac gccttccccg gtggtctcat gatcggtacc gactcgcaca cccccaacgc 1740 cggtggtctc ggtatgatcg cctgtggtgt cggaggtgcc gacgctgtcg acgtcatggc 1800 tgacatcccc tgggagctca aggcccccaa ggtgatcggt gtcgagctca agggtaagct 1860 ctcgggctgg accaccccta aggatgttat cctcaaggtc gctggtgagc tcaccgttaa 1920 gggtggtacc ggtgccatca tcgagtacaa gggtgctggt gtcgactcgc tctcgtgcac 1980 tggtatggcc accatctgca acatgggtgc cgagattggt gctaccacct ccgtcttccc 2040 ttacaacgag cgcatgggtg actacctccg tgccaccaac cgttccgaca ttgctgacct 2100 cgccaagggc ttccagcgca accttcttcc cgactcgggt gccgagtacg actcgcacat 2160 cgagatcaac ctcgacaccc tcgagcccca catcaacggt cccttcaccc ccgatcttgc 2220 cacccccctc tccaagttcg ccgaggccgt caagaagaac gactggcccg aggagctcaa 2280 ggtttcgctc atcggttcgt gcaccaactc ctcgtacgag gacatgagcc gatccgcctc 2340 catcgctgag gaggctgccg cccacggcct caaggtcaag tcggccttca ccatcacccc 2400 cggttccgag cagattcgtg ctaccatcga gcgtgacggt cagatggccg ccctcgagaa 2460 cgctggtggt atggttcttg ccaacgcctg tggcccttgc attggtcagt gggaccgaaa 2520 ggacatcaag aagggtgaca agaactcgat catcacttct tacaaccgta acttcactgg 2580 tcgtaacgac gccaaccctg ctacccacgc tttcgtcgcc tcgcccgatc tcgttaccgc 2640 catggctttc gccggtaagc tcaccttcaa ccccatgacc gacagcctca agggtgctga 2700 cggcaaggag ttcaagttca ccgcccccag cggtaaggag ctccctcccc gcggctacga 2760 ccccggtaac aacacctacc aagacccccc caaggaccgc tcttcggttc aggtcgccat 2820 tgaccccaag tcggaccgtc tccagaggct cgagcccttc aagccctgga acggcaagaa 2880 ccccaccgac tgccccgtcc tcattaaggc tcagggcaag tgcaccactg accacatctc 2940 ggccggtggt ccttggctca agtaccgtgg tcaccttgag aacatctcga acaactgttt 3000 gattggtgcc atcaacgctg ccaacggcaa ggccaacgag gtccagaacg tcttctccgg 3060 cgagtggggc cccgttcccg ccactgccat ctcgtaccgt gagcagggca agccctgggt 3120 tgtcattggt gacgagaact acggtgaggg ttcgtcgcgt gagcacgccg ctcttgagcc 3180 ccgtttcctc ggtggttgcg ccgtcattgc ccgttcgttc gctcgtatcc accagaccaa 3240 cttgcgcaag cagggtatgc tcgccttcga gttcgccaac cccgctgact acgacaaggt 3300 tcgccccgat gaccttgttg acattctcgg tgttaccgag ctcgctgagg gctccaaggt 3360 ttcgctcctt gccaagcaca aggacggctc caaggatgag atccccctta cccacaccat 3420 gaacgacaat cagatctcgt ggttcaagca cggttcggcc ctcaacagga tggctgctgc 3480 cgccaagtcc gcctaaatgc attatat 3507 <210> 59 <211> 2702 <212> DNA <213> artificial <220> <223> (KpnI)-pActin-ADI1-(NsiI) <400> 59 atataggtac cggcccgttc aacacaatgc gcctgcaatt tctatccccg ctttccacct 60 ctgtctccct cttcaaagtc acagagtctg ccatttgtat tcgagcatga aaaatgatga 120 cctcctttct tctcgttcaa tacagcggac atgaacaaga aaggggtggc ctgagccacc 180 aagttctaca cttgcagcca gacgtattca aaaatcgacg tggacgagtt gcgactcaac 240 atcctctgtg aattgcaatc gagtgagtga ttacgacctg tattcacgtc aaaatgcagg 300 tgtgacattt gaattttgaa atacatgagg caggctcgat ttgctccact caagtcgagt 360 ttgccaaatt caagaagcgc taatcggagc caaccgaccg accacaacca gccaaatcag 420 ccagccaagg cagagaagca gaagcaaagg cggtgcattg agaggtgagc cgtgtgctgt 480 gctgtgctct gctgtgctgt ctgtcaatgc ttgctgcgtg tgtttgtctc gcctctacag 540 cctgcccctc aagatgtgac cgattggaag gaaaggaagg tcacacgcag ttctggcatg 600 ccacgcacgc acagcccgaa attgcgatct caagagactg ccgacgccgc cgtccgccgt 660 tgagcgctct gcttgggtca aagcgtaagc gcttctcgaa ttcaaactca cagagttcca 720 agtctgcaca ggtcatctgt tcgtcctttt gagactgcct gactggctgg ctggaacgca 780 cgcacgcaca cttccgattc gacaccgccc gctgctgctg tcttctgcgc tcttgtgccc 840 ttcttctgta cttggccttt gcgtcgactt ctttgcttgc tcggcagtgc cgtctcatct 900 gccccaagtc aagctcagca gcacagcaca cacgcatcac cctctcggct tgggtttgcc 960 cctgttgcct gtctgtccac actcacacac atccctatcg cttgctcgac atcatcgctt 1020 acctcttccc caccacctcg tctttgacac ctttactttc tcaacccctc ttccaccacc 1080 aaccccccca ccacttactt tcaacatgtc gaatcctctt gcgggacgtg tcaagtggtt 1140 cagaaggata gtaggtactt ccatggcctc gaccgaagaa ctcaggcgaa gaaagatcat 1200 ataacgacgt tttggttagc cgtccatctt attggctttt gtcgttagtc acactgacag 1260 cttcacgatg ctgcgaggca ttgagaccac aatttaccgc gctggcacca gtcgtggctt 1320 atacctcttg gcaagtgacc tgccatccga gccaagcgct cgtgatgcgg cgctgctgtc 1380 catcatgggt tccggacatc cactgcagat cgacggtatg gggggtggca attctctgac 1440 ttcaaaagtg gccatagtct cgccaagtgc acagagcgat cactccgatg ttgactacct 1500 cttttgccaa gttggcatca atgagcgcat cgtcgacaca gcacccaact gcggcaattt 1560 gatgagcggg gtggctgcct tcgcgatcga gcgaggtcta gtcaagcctc atccatccga 1620 caccacctgc cttgtgcgca tctttaatct caactccaac caggcatccg agctcctcat 1680 tccggttcaa gatggtcgag tccactacaa agatgtggac gatacgggct tgcagcgtcc 1740 ttcggctcgc gtcagcttac gcttccttaa taccgtgggt gcatgcacag gcaagcttct 1800 tccaactggc aatgccactg actcaatcga gggactcgag gtatccgtca tcgattcggc 1860 catccctgtt gtttttgttc gtcaagccga tgttggtatc acaggtttcg agaccccagc 1920 gacgctcaat gcggacactg ccttgctatc tcgactggaa cgtgtacgcc tggaggcagg 1980 tcgacgaatg ggctggggtg atgtttcttc tagcgtggtg cccaaattgt ctctcatcgg 2040 accaggttcc aattgcacca cttttacggc acggtgtaag ttctcaacgc tgaattgacc 2100 gtaccttgtt gaatgattga cggctgctga ttctcagttc ctttttgtcc aacagacttc 2160 actcccaaaa cttgccacaa cgcacacgcc gtcaccggtg ccatctgcac cgccggagcc 2220 gcctatgtac ctggaacggt ggtctcggac atcttttcgt cacgcactcc ttcgctctct 2280 tcatcgcctg gcgataccac ccctccctac acgcctcagc gtcgcatctc tatcgaacat 2340 cctagtggcg ttctcgagat tggacttaca gccgccgaaa gcgactcacc ccgttcgcta 2400 gatattgccc acgttgagcg ttccgtagcc ctgattgcac acgcccgcgt ctattatact 2460 atgcctgatc ggcacccttc ggttgaaata ccgatcatct cacccgtcac tccaaccagc 2520 gcggagatgc tcgatagggc atatcagtcg ctggcgctcg cattgggaag aggtaaagat 2580 agatctcaca tcattccact tggttcggaa gggaaggaaa gtgagctata ttacaatatg 2640 ccggacagca ctgtgtctag ctaccgcggc acgcattcca cagccctatg aatgcattat 2700 at 2702 <210> 60 <211> 2589 <212> DNA <213> artificial <220> <223> (KpnI)-pActin-AtCAD1-(NsiI) <400> 60 atataggtac cggcccgttc aacacaatgc gcctgcaatt tctatccccg ctttccacct 60 ctgtctccct cttcaaagtc acagagtctg ccatttgtat tcgagcatga aaaatgatga 120 cctcctttct tctcgttcaa tacagcggac atgaacaaga aaggggtggc ctgagccacc 180 aagttctaca cttgcagcca gacgtattca aaaatcgacg tggacgagtt gcgactcaac 240 atcctctgtg aattgcaatc gagtgagtga ttacgacctg tattcacgtc aaaatgcagg 300 tgtgacattt gaattttgaa atacatgagg caggctcgat ttgctccact caagtcgagt 360 ttgccaaatt caagaagcgc taatcggagc caaccgaccg accacaacca gccaaatcag 420 ccagccaagg cagagaagca gaagcaaagg cggtgcattg agaggtgagc cgtgtgctgt 480 gctgtgctct gctgtgctgt ctgtcaatgc ttgctgcgtg tgtttgtctc gcctctacag 540 cctgcccctc aagatgtgac cgattggaag gaaaggaagg tcacacgcag ttctggcatg 600 ccacgcacgc acagcccgaa attgcgatct caagagactg ccgacgccgc cgtccgccgt 660 tgagcgctct gcttgggtca aagcgtaagc gcttctcgaa ttcaaactca cagagttcca 720 agtctgcaca ggtcatctgt tcgtcctttt gagactgcct gactggctgg ctggaacgca 780 cgcacgcaca cttccgattc gacaccgccc gctgctgctg tcttctgcgc tcttgtgccc 840 ttcttctgta cttggccttt gcgtcgactt ctttgcttgc tcggcagtgc cgtctcatct 900 gccccaagtc aagctcagca gcacagcaca cacgcatcac cctctcggct tgggtttgcc 960 cctgttgcct gtctgtccac actcacacac atccctatcg cttgctcgac atcatcgctt 1020 acctcttccc caccacctcg tctttgacac ctttactttc tcaacccctc ttccaccacc 1080 aaccccccca ccacttactt tcaacatgac caagcaatct gcggacagca acgcaaagtc 1140 aggagttacg tccgaaatat gtcattgggc atccaacctg gccactgacg acatcccttc 1200 ggacgtatta gaaagagcaa aataccttat tctcgacggt attgcatgtg cctgggttgg 1260 tgcaagagtg ccttggtcag agaagtatgt tcaggcaacg atgagctttg agccgccggg 1320 ggcctgcagg gtgattggat atgggcagaa actggggcct gttgcagcag ccatgaccaa 1380 ttccgctttc atacaggcta cggagcttga cgactaccac agcgaagccc ccctacactc 1440 tgcaagcatt gtccttcctg cggtctttgc agcaagtgag gtcttagccg agcagggcaa 1500 aacaatttcc ggtatagatg ttattctagc cgccattgtg gggtttgaat ctggcccacg 1560 gatcggcaaa gcaatctacg gatcggacct cttgaacaac ggctggcatt gtggagctgt 1620 gtatggcgct ccagccggtg cgctggccac aggaaagctc ctcggtctaa ctccagactc 1680 catggaagat gctctcggaa ttgcgtgcac gcaagcctgt ggtttaatgt cggcgcaata 1740 cggaggcatg gtaaagcgtg tgcaacacgg attcgcagcg cgtaatggtc ttcttggggg 1800 actgttggcc catggtgggt acgaggcaat gaaaggtgtc ctggagagat cttacggcgg 1860 tttcctcaag atgttcacca agggcaacgg cagagagcct ccctacaaag aggaggaagt 1920 ggtggctggt ctcggttcat tctggcatac ctttactatt cgcatcaagc tctatgcctg 1980 ctgcggactt gtccatggtc cagtcgaggc tatcgaaaac cttcagggga gataccccga 2040 gctcttgaat agagccaacc tcagcaacat tcgccatgtt catgtacagc tttcaacggc 2100 ctcgaacagt cactgtggat ggataccaga ggagagaccc atcagttcaa tcgcagggca 2160 gatgagtgtc gcatacattc tcgccgtcca gctggtcgac cagcaatgtc ttttgtccca 2220 gttttctgag tttgatgaca acctggagag gccagaagtt tgggatctgg ccaggaaggt 2280 tacttcatct caaagcgaag agtttgatca agacggcaac tgtctcagtg cgggtcgcgt 2340 gaggattgag ttcaacgatg gttcttctat tacggaaagt gtcgagaagc ctcttggtgt 2400 caaagagccc atgccaaacg aacggattct ccacaaatac cgaacccttg ctggtagcgt 2460 gacggacgaa tcccgggtga aagagattga ggatcttgtc ctcggcctgg acaggctcac 2520 cgacattagc ccattgctgg agctgctgaa ttgccccgtg aaatcgccac tggtataaat 2580 gcattatat 2589 <210> 61 <211> 2971 <212> DNA <213> artificial <220> <223> (KpnI)-pActin-ITP1-(NsiI) <400> 61 atataggtac cggcccgttc aacacaatgc gcctgcaatt tctatccccg ctttccacct 60 ctgtctccct cttcaaagtc acagagtctg ccatttgtat tcgagcatga aaaatgatga 120 cctcctttct tctcgttcaa tacagcggac atgaacaaga aaggggtggc ctgagccacc 180 aagttctaca cttgcagcca gacgtattca aaaatcgacg tggacgagtt gcgactcaac 240 atcctctgtg aattgcaatc gagtgagtga ttacgacctg tattcacgtc aaaatgcagg 300 tgtgacattt gaattttgaa atacatgagg caggctcgat ttgctccact caagtcgagt 360 ttgccaaatt caagaagcgc taatcggagc caaccgaccg accacaacca gccaaatcag 420 ccagccaagg cagagaagca gaagcaaagg cggtgcattg agaggtgagc cgtgtgctgt 480 gctgtgctct gctgtgctgt ctgtcaatgc ttgctgcgtg tgtttgtctc gcctctacag 540 cctgcccctc aagatgtgac cgattggaag gaaaggaagg tcacacgcag ttctggcatg 600 ccacgcacgc acagcccgaa attgcgatct caagagactg ccgacgccgc cgtccgccgt 660 tgagcgctct gcttgggtca aagcgtaagc gcttctcgaa ttcaaactca cagagttcca 720 agtctgcaca ggtcatctgt tcgtcctttt gagactgcct gactggctgg ctggaacgca 780 cgcacgcaca cttccgattc gacaccgccc gctgctgctg tcttctgcgc tcttgtgccc 840 ttcttctgta cttggccttt gcgtcgactt ctttgcttgc tcggcagtgc cgtctcatct 900 gccccaagtc aagctcagca gcacagcaca cacgcatcac cctctcggct tgggtttgcc 960 cctgttgcct gtctgtccac actcacacac atccctatcg cttgctcgac atcatcgctt 1020 acctcttccc caccacctcg tctttgacac ctttactttc tcaacccctc ttccaccacc 1080 aaccccccca ccacttactt tcaacatgct tccacagaca cctgttccag attaccgtct 1140 cagcatgaga tattcgacag acagcgtcgc agcatcgcaa gcgttaacaa cgcctgaagc 1200 agctccaagt atttcccatc acgcagacac gggcgaggtt caacaggcgc atagcggcga 1260 tgacggcgcg ctcgaagagg gcgcaattgc tcactcaagt aaggaagggt cacaacgaga 1320 tcagcaaacg gagctttact gtgctttcac aaagggcacc aagctcttcg tcgtcttgtc 1380 cgtgtctatc gcgggctttt tctcgccatt ctccatcaat atatatatcc ctgcgttgcc 1440 tcagatctcg aagctactac atacatcgga aggtgagtga gacgatttct cgtagagaca 1500 gtttcccaga agcagctcct catcatcata ttttgtctta ttgtagcggc tactaatgta 1560 acggtaaccg tctacatgat cgcacaaggc ctctcgccgg tcatctgggc acctctttca 1620 gatgtaagtc cccattttat gtgacgcctg tctctgttgt aagatgtttc cacaggatca 1680 atctctgaaa tttctcgcct gtcaaatcgg cacgtacagg tttttggccg cagacccatc 1740 tacattgcaa ctttcctcgt ttttttcgtc gccaatcttg ggctttcgtt caccaatgtc 1800 tactggctct tggtcgtctt gcgtatggtt caagccgcag gagcatgcag cgccatcgct 1860 attggcgcag gaacgattgg cgatgttacc gagcgcaagg aacgaggaag ttatatgggc 1920 tattatgcgc ttgcccaata tactggtcca gccatcgggc ccgtaattgg aggtgcgctt 1980 tcgcaaagat gggattacca ttctaccttc ttcttcctca gtgccgtttc tggtgtcttt 2040 ctgatcttca tggccttctt cttacttgaa acgcttcgtg ttctagtggg gaacggaagt 2100 gcacgcacat tcggcatcta tcgcacttta gtgggaccca gactggtcaa gtcgacggca 2160 aattcgatgc gtccaaggat gaagagtccg cttgaaggtc gactcgaatt tggattccat 2220 cgtccatttt tggtgtttgc acgccccgag actagcctgg caatcctggc tttttcgatg 2280 gtgtatgcaa catactatct atcgtctgcc tctttgcctt atctcttcaa gcaagtatat 2340 ggtctacacg agctactcat tggggtatgc ttcgtgccta gtggtgttgg ttgtgccttg 2400 ggcacggtgc tcgctggcaa gatcctcgat tcggactatc gacgcgcgtt agacaagaac 2460 aagtcgggtg tcaaggttac gcgcgcacgg ctgcagtcgg cctggatcta cttgccaggc 2520 tatgcctcct cgcttctagc gtacggatgg tgtgttcggg cgcataccca catcgccgct 2580 cccatccttt ttcagtttac acgtaagtga gaattcaatc ttccgaatcg tggatcctgt 2640 tcgtgtacag cagtgctgac tctgcctttc aattaatcta cgaaacagtc ggcatgtttt 2700 caacaatgta cttcaccaac atcaacacac tcgttgtgga tctgtacccg ggcaaggcag 2760 ctactgccac agctgctgtt aacgtagggc gttgcttact cggcgctgtg gctgtggcca 2820 tcgtacaacc aatgaccgat gctatgggcg ctggatggac attcacagtc ggcgcgctcc 2880 ttgctctgtt catcggtctg atttgccaga cactcattca ctttcatggc gagaagtggg 2940 cagctcgcaa gcactcttga atgcattata t 2971 <210> 62 <211> 2234 <212> DNA <213> artificial <220> <223> (KpnI)-pActin-MTT1-(SdaI) <400> 62 atataggtac cggcccgttc aacacaatgc gcctgcaatt tctatccccg ctttccacct 60 ctgtctccct cttcaaagtc acagagtctg ccatttgtat tcgagcatga aaaatgatga 120 cctcctttct tctcgttcaa tacagcggac atgaacaaga aaggggtggc ctgagccacc 180 aagttctaca cttgcagcca gacgtattca aaaatcgacg tggacgagtt gcgactcaac 240 atcctctgtg aattgcaatc gagtgagtga ttacgacctg tattcacgtc aaaatgcagg 300 tgtgacattt gaattttgaa atacatgagg caggctcgat ttgctccact caagtcgagt 360 ttgccaaatt caagaagcgc taatcggagc caaccgaccg accacaacca gccaaatcag 420 ccagccaagg cagagaagca gaagcaaagg cggtgcattg agaggtgagc cgtgtgctgt 480 gctgtgctct gctgtgctgt ctgtcaatgc ttgctgcgtg tgtttgtctc gcctctacag 540 cctgcccctc aagatgtgac cgattggaag gaaaggaagg tcacacgcag ttctggcatg 600 ccacgcacgc acagcccgaa attgcgatct caagagactg ccgacgccgc cgtccgccgt 660 tgagcgctct gcttgggtca aagcgtaagc gcttctcgaa ttcaaactca cagagttcca 720 agtctgcaca ggtcatctgt tcgtcctttt gagactgcct gactggctgg ctggaacgca 780 cgcacgcaca cttccgattc gacaccgccc gctgctgctg tcttctgcgc tcttgtgccc 840 ttcttctgta cttggccttt gcgtcgactt ctttgcttgc tcggcagtgc cgtctcatct 900 gccccaagtc aagctcagca gcacagcaca cacgcatcac cctctcggct tgggtttgcc 960 cctgttgcct gtctgtccac actcacacac atccctatcg cttgctcgac atcatcgctt 1020 acctcttccc caccacctcg tctttgacac ctttactttc tcaacccctc ttccaccacc 1080 aaccccccca ccacttactt tcaacatgcc gtccgttcaa cgcaacatct ctccttcagt 1140 ctcggtgctg gccggtgcga ctgcaggcgc tgttgaagga ggtgagttct atcgctttcg 1200 cctcgtccat tttgctagta attttacctt acaatcttct tgtcttcctt agtggccact 1260 ttccccatcg agtatctcaa gacagttaca cagttcgcac agcgagatac tcacggcaat 1320 cgtgaacgtc tttcaccatt ggatgttttc cgatcaacac ttgaaaaaga agggcctaga 1380 gggctctttc gtggttgttc ggctgtagtt gtcggcaacg cttccaaggc tggtgttcgc 1440 tttttggctt ttgagaattt tcgaaatatg ctcaagaaca aatcaacagt gagtgttttc 1500 ccctagcatg gatgcattag gaaatagact gacactgaaa tctttcgcag gggaaattat 1560 cgagcggtag caactacatt gcaggaatgg gcgctggcac gctggaagcc atattcgctg 1620 tgacaccgag tgaaacgatc agtgagtgcc cacgcaaact cgcagaacag aaccaaagaa 1680 gggcgagaca gactgacctt gcgctgtatt gctttcacca gaaacaaaac tcatcgacga 1740 cggcaagcgt gccaaaccac gctacgaaca gggtctcttc cgtggaaccg cctcgatcat 1800 ccgacaagaa gggtttggcg gtatctacaa aggtgtattt ccagtcattc tacgccaagg 1860 ctcggcctca gcgatccgac taggtacata ctctgctatg cgagatttca ttcccaaagc 1920 ccaaggcaag ggttcatcct tcgtcaattg gttgaccact ttctccatcg gtgctacatc 1980 tggcgttgtc gccgtgtatg ggaccatgcc atttgacgtt ctcaaaacga ggatgcaggc 2040 catcgacgct tcgcgctacc gatccacgtg gcactgcttg accgacacca tcggtacaga 2100 gggcatagca gctctgtggc gtggttccgt atcacgtagt atgcgcctca tcgttagtgg 2160 aggagtcatt tttagcgtgt atgaacaggt agtttggctt ctcgccggtc ccgagttttg 2220 acctgcaggt atat 2234 <210> 63 <211> 1125 <212> DNA <213> artificial <220> <223> (KpnI)-pActin-olapADI1 <400> 63 atataggtac cggcccgttc aacacaatgc gcctgcaatt tctatccccg ctttccacct 60 ctgtctccct cttcaaagtc acagagtctg ccatttgtat tcgagcatga aaaatgatga 120 cctcctttct tctcgttcaa tacagcggac atgaacaaga aaggggtggc ctgagccacc 180 aagttctaca cttgcagcca gacgtattca aaaatcgacg tggacgagtt gcgactcaac 240 atcctctgtg aattgcaatc gagtgagtga ttacgacctg tattcacgtc aaaatgcagg 300 tgtgacattt gaattttgaa atacatgagg caggctcgat ttgctccact caagtcgagt 360 ttgccaaatt caagaagcgc taatcggagc caaccgaccg accacaacca gccaaatcag 420 ccagccaagg cagagaagca gaagcaaagg cggtgcattg agaggtgagc cgtgtgctgt 480 gctgtgctct gctgtgctgt ctgtcaatgc ttgctgcgtg tgtttgtctc gcctctacag 540 cctgcccctc aagatgtgac cgattggaag gaaaggaagg tcacacgcag ttctggcatg 600 ccacgcacgc acagcccgaa attgcgatct caagagactg ccgacgccgc cgtccgccgt 660 tgagcgctct gcttgggtca aagcgtaagc gcttctcgaa ttcaaactca cagagttcca 720 agtctgcaca ggtcatctgt tcgtcctttt gagactgcct gactggctgg ctggaacgca 780 cgcacgcaca cttccgattc gacaccgccc gctgctgctg tcttctgcgc tcttgtgccc 840 ttcttctgta cttggccttt gcgtcgactt ctttgcttgc tcggcagtgc cgtctcatct 900 gccccaagtc aagctcagca gcacagcaca cacgcatcac cctctcggct tgggtttgcc 960 cctgttgcct gtctgtccac actcacacac atccctatcg cttgctcgac atcatcgctt 1020 acctcttccc caccacctcg tctttgacac ctttactttc tcaacccctc ttccaccacc 1080 aaccccccca ccacttactt tcaacatgtc gaatcctctt gcggg 1125 <210> 64 <211> 1125 <212> DNA <213> artificial <220> <223> (KpnI)-pActin-olapAtCAD1 <400> 64 atataggtac cggcccgttc aacacaatgc gcctgcaatt tctatccccg ctttccacct 60 ctgtctccct cttcaaagtc acagagtctg ccatttgtat tcgagcatga aaaatgatga 120 cctcctttct tctcgttcaa tacagcggac atgaacaaga aaggggtggc ctgagccacc 180 aagttctaca cttgcagcca gacgtattca aaaatcgacg tggacgagtt gcgactcaac 240 atcctctgtg aattgcaatc gagtgagtga ttacgacctg tattcacgtc aaaatgcagg 300 tgtgacattt gaattttgaa atacatgagg caggctcgat ttgctccact caagtcgagt 360 ttgccaaatt caagaagcgc taatcggagc caaccgaccg accacaacca gccaaatcag 420 ccagccaagg cagagaagca gaagcaaagg cggtgcattg agaggtgagc cgtgtgctgt 480 gctgtgctct gctgtgctgt ctgtcaatgc ttgctgcgtg tgtttgtctc gcctctacag 540 cctgcccctc aagatgtgac cgattggaag gaaaggaagg tcacacgcag ttctggcatg 600 ccacgcacgc acagcccgaa attgcgatct caagagactg ccgacgccgc cgtccgccgt 660 tgagcgctct gcttgggtca aagcgtaagc gcttctcgaa ttcaaactca cagagttcca 720 agtctgcaca ggtcatctgt tcgtcctttt gagactgcct gactggctgg ctggaacgca 780 cgcacgcaca cttccgattc gacaccgccc gctgctgctg tcttctgcgc tcttgtgccc 840 ttcttctgta cttggccttt gcgtcgactt ctttgcttgc tcggcagtgc cgtctcatct 900 gccccaagtc aagctcagca gcacagcaca cacgcatcac cctctcggct tgggtttgcc 960 cctgttgcct gtctgtccac actcacacac atccctatcg cttgctcgac atcatcgctt 1020 acctcttccc caccacctcg tctttgacac ctttactttc tcaacccctc ttccaccacc 1080 aaccccccca ccacttactt tcaacatgac caagcaatct gcgga 1125 <210> 65 <211> 1125 <212> DNA <213> artificial <220> <223> (KpnI)-pActin-olapITP1 <400> 65 atataggtac cggcccgttc aacacaatgc gcctgcaatt tctatccccg ctttccacct 60 ctgtctccct cttcaaagtc acagagtctg ccatttgtat tcgagcatga aaaatgatga 120 cctcctttct tctcgttcaa tacagcggac atgaacaaga aaggggtggc ctgagccacc 180 aagttctaca cttgcagcca gacgtattca aaaatcgacg tggacgagtt gcgactcaac 240 atcctctgtg aattgcaatc gagtgagtga ttacgacctg tattcacgtc aaaatgcagg 300 tgtgacattt gaattttgaa atacatgagg caggctcgat ttgctccact caagtcgagt 360 ttgccaaatt caagaagcgc taatcggagc caaccgaccg accacaacca gccaaatcag 420 ccagccaagg cagagaagca gaagcaaagg cggtgcattg agaggtgagc cgtgtgctgt 480 gctgtgctct gctgtgctgt ctgtcaatgc ttgctgcgtg tgtttgtctc gcctctacag 540 cctgcccctc aagatgtgac cgattggaag gaaaggaagg tcacacgcag ttctggcatg 600 ccacgcacgc acagcccgaa attgcgatct caagagactg ccgacgccgc cgtccgccgt 660 tgagcgctct gcttgggtca aagcgtaagc gcttctcgaa ttcaaactca cagagttcca 720 agtctgcaca ggtcatctgt tcgtcctttt gagactgcct gactggctgg ctggaacgca 780 cgcacgcaca cttccgattc gacaccgccc gctgctgctg tcttctgcgc tcttgtgccc 840 ttcttctgta cttggccttt gcgtcgactt ctttgcttgc tcggcagtgc cgtctcatct 900 gccccaagtc aagctcagca gcacagcaca cacgcatcac cctctcggct tgggtttgcc 960 cctgttgcct gtctgtccac actcacacac atccctatcg cttgctcgac atcatcgctt 1020 acctcttccc caccacctcg tctttgacac ctttactttc tcaacccctc ttccaccacc 1080 aaccccccca ccacttactt tcaacatgct tccacagaca cctgt 1125 <210> 66 <211> 1125 <212> DNA <213> artificial <220> <223> (KpnI)-pActin-olapMTT1 <400> 66 atataggtac cggcccgttc aacacaatgc gcctgcaatt tctatccccg ctttccacct 60 ctgtctccct cttcaaagtc acagagtctg ccatttgtat tcgagcatga aaaatgatga 120 cctcctttct tctcgttcaa tacagcggac atgaacaaga aaggggtggc ctgagccacc 180 aagttctaca cttgcagcca gacgtattca aaaatcgacg tggacgagtt gcgactcaac 240 atcctctgtg aattgcaatc gagtgagtga ttacgacctg tattcacgtc aaaatgcagg 300 tgtgacattt gaattttgaa atacatgagg caggctcgat ttgctccact caagtcgagt 360 ttgccaaatt caagaagcgc taatcggagc caaccgaccg accacaacca gccaaatcag 420 ccagccaagg cagagaagca gaagcaaagg cggtgcattg agaggtgagc cgtgtgctgt 480 gctgtgctct gctgtgctgt ctgtcaatgc ttgctgcgtg tgtttgtctc gcctctacag 540 cctgcccctc aagatgtgac cgattggaag gaaaggaagg tcacacgcag ttctggcatg 600 ccacgcacgc acagcccgaa attgcgatct caagagactg ccgacgccgc cgtccgccgt 660 tgagcgctct gcttgggtca aagcgtaagc gcttctcgaa ttcaaactca cagagttcca 720 agtctgcaca ggtcatctgt tcgtcctttt gagactgcct gactggctgg ctggaacgca 780 cgcacgcaca cttccgattc gacaccgccc gctgctgctg tcttctgcgc tcttgtgccc 840 ttcttctgta cttggccttt gcgtcgactt ctttgcttgc tcggcagtgc cgtctcatct 900 gccccaagtc aagctcagca gcacagcaca cacgcatcac cctctcggct tgggtttgcc 960 cctgttgcct gtctgtccac actcacacac atccctatcg cttgctcgac atcatcgctt 1020 acctcttccc caccacctcg tctttgacac ctttactttc tcaacccctc ttccaccacc 1080 aaccccccca ccacttactt tcaacatgcc gtccgttcaa cgcaa 1125 <210> 67 <211> 1125 <212> DNA <213> artificial <220> <223> (KpnI)-pActin-olapRIA1 <400> 67 atataggtac cggcccgttc aacacaatgc gcctgcaatt tctatccccg ctttccacct 60 ctgtctccct cttcaaagtc acagagtctg ccatttgtat tcgagcatga aaaatgatga 120 cctcctttct tctcgttcaa tacagcggac atgaacaaga aaggggtggc ctgagccacc 180 aagttctaca cttgcagcca gacgtattca aaaatcgacg tggacgagtt gcgactcaac 240 atcctctgtg aattgcaatc gagtgagtga ttacgacctg tattcacgtc aaaatgcagg 300 tgtgacattt gaattttgaa atacatgagg caggctcgat ttgctccact caagtcgagt 360 ttgccaaatt caagaagcgc taatcggagc caaccgaccg accacaacca gccaaatcag 420 ccagccaagg cagagaagca gaagcaaagg cggtgcattg agaggtgagc cgtgtgctgt 480 gctgtgctct gctgtgctgt ctgtcaatgc ttgctgcgtg tgtttgtctc gcctctacag 540 cctgcccctc aagatgtgac cgattggaag gaaaggaagg tcacacgcag ttctggcatg 600 ccacgcacgc acagcccgaa attgcgatct caagagactg ccgacgccgc cgtccgccgt 660 tgagcgctct gcttgggtca aagcgtaagc gcttctcgaa ttcaaactca cagagttcca 720 agtctgcaca ggtcatctgt tcgtcctttt gagactgcct gactggctgg ctggaacgca 780 cgcacgcaca cttccgattc gacaccgccc gctgctgctg tcttctgcgc tcttgtgccc 840 ttcttctgta cttggccttt gcgtcgactt ctttgcttgc tcggcagtgc cgtctcatct 900 gccccaagtc aagctcagca gcacagcaca cacgcatcac cctctcggct tgggtttgcc 960 cctgttgcct gtctgtccac actcacacac atccctatcg cttgctcgac atcatcgctt 1020 acctcttccc caccacctcg tctttgacac ctttactttc tcaacccctc ttccaccacc 1080 aaccccccca ccacttactt tcaacatgag cctctcgaac agcaa 1125 <210> 68 <211> 1125 <212> DNA <213> artificial <220> <223> (KpnI)-pActin-olapTAD1 <400> 68 atataggtac cggcccgttc aacacaatgc gcctgcaatt tctatccccg ctttccacct 60 ctgtctccct cttcaaagtc acagagtctg ccatttgtat tcgagcatga aaaatgatga 120 cctcctttct tctcgttcaa tacagcggac atgaacaaga aaggggtggc ctgagccacc 180 aagttctaca cttgcagcca gacgtattca aaaatcgacg tggacgagtt gcgactcaac 240 atcctctgtg aattgcaatc gagtgagtga ttacgacctg tattcacgtc aaaatgcagg 300 tgtgacattt gaattttgaa atacatgagg caggctcgat ttgctccact caagtcgagt 360 ttgccaaatt caagaagcgc taatcggagc caaccgaccg accacaacca gccaaatcag 420 ccagccaagg cagagaagca gaagcaaagg cggtgcattg agaggtgagc cgtgtgctgt 480 gctgtgctct gctgtgctgt ctgtcaatgc ttgctgcgtg tgtttgtctc gcctctacag 540 cctgcccctc aagatgtgac cgattggaag gaaaggaagg tcacacgcag ttctggcatg 600 ccacgcacgc acagcccgaa attgcgatct caagagactg ccgacgccgc cgtccgccgt 660 tgagcgctct gcttgggtca aagcgtaagc gcttctcgaa ttcaaactca cagagttcca 720 agtctgcaca ggtcatctgt tcgtcctttt gagactgcct gactggctgg ctggaacgca 780 cgcacgcaca cttccgattc gacaccgccc gctgctgctg tcttctgcgc tcttgtgccc 840 ttcttctgta cttggccttt gcgtcgactt ctttgcttgc tcggcagtgc cgtctcatct 900 gccccaagtc aagctcagca gcacagcaca cacgcatcac cctctcggct tgggtttgcc 960 cctgttgcct gtctgtccac actcacacac atccctatcg cttgctcgac atcatcgctt 1020 acctcttccc caccacctcg tctttgacac ctttactttc tcaacccctc ttccaccacc 1080 aaccccccca ccacttactt tcaacatggc accttctctc aacgc 1125 <210> 69 <211> 2382 <212> DNA <213> artificial <220> <223> (KpnI)-pActin-RIA1-(NsiI) <400> 69 atataggtac cggcccgttc aacacaatgc gcctgcaatt tctatccccg ctttccacct 60 ctgtctccct cttcaaagtc acagagtctg ccatttgtat tcgagcatga aaaatgatga 120 cctcctttct tctcgttcaa tacagcggac atgaacaaga aaggggtggc ctgagccacc 180 aagttctaca cttgcagcca gacgtattca aaaatcgacg tggacgagtt gcgactcaac 240 atcctctgtg aattgcaatc gagtgagtga ttacgacctg tattcacgtc aaaatgcagg 300 tgtgacattt gaattttgaa atacatgagg caggctcgat ttgctccact caagtcgagt 360 ttgccaaatt caagaagcgc taatcggagc caaccgaccg accacaacca gccaaatcag 420 ccagccaagg cagagaagca gaagcaaagg cggtgcattg agaggtgagc cgtgtgctgt 480 gctgtgctct gctgtgctgt ctgtcaatgc ttgctgcgtg tgtttgtctc gcctctacag 540 cctgcccctc aagatgtgac cgattggaag gaaaggaagg tcacacgcag ttctggcatg 600 ccacgcacgc acagcccgaa attgcgatct caagagactg ccgacgccgc cgtccgccgt 660 tgagcgctct gcttgggtca aagcgtaagc gcttctcgaa ttcaaactca cagagttcca 720 agtctgcaca ggtcatctgt tcgtcctttt gagactgcct gactggctgg ctggaacgca 780 cgcacgcaca cttccgattc gacaccgccc gctgctgctg tcttctgcgc tcttgtgccc 840 ttcttctgta cttggccttt gcgtcgactt ctttgcttgc tcggcagtgc cgtctcatct 900 gccccaagtc aagctcagca gcacagcaca cacgcatcac cctctcggct tgggtttgcc 960 cctgttgcct gtctgtccac actcacacac atccctatcg cttgctcgac atcatcgctt 1020 acctcttccc caccacctcg tctttgacac ctttactttc tcaacccctc ttccaccacc 1080 aaccccccca ccacttactt tcaacatgag cctctcgaac agcaatcaca acgagcgcca 1140 caacgacgac aacaacatca atgacgatga ttgtgctaac ttctttgagc tgatggttca 1200 gcctgcctct tcttcttctt acggccccta ctttcccgac ccaggactgg cgcttccagc 1260 aatttccgat gtctcatcaa caacagatac gcgactaccg tcacagctcg gagtgacccc 1320 attcagtcat cagacatcgc ccatccgatc cgcagatgaa ggagagaaga cgacaacaac 1380 cgcatcatac aaaagaaagc attccgaggt ggagaaagac cgtcgaagaa tcatctcaaa 1440 cggatttgca gtgagtttcc ctcttcttct accataaagt tcaggctggt tgagctgaag 1500 tcgacgtttg gcaatatttg tgtagatctt gcagaacgtc ctccataacg actcaacttc 1560 caaacccatc tcgaaagcga ccctacttca acaagcgtgc gacgaaatcc gtgaactgcg 1620 caaaaaactt gatacgagca ttaccatcat ctcccgctat ggtctcgaaa atttgtttca 1680 ggtggctcca acccccaatt ctttgagcaa tgcttctcct cccaatggta cgagtagggc 1740 ttaccctacc tattcgaacg acctcggccc ggatcgtttc caagactcgc ggcgtagttc 1800 cacttcggcg acgagtgtgt ctggatctca atataacaat ggcgctgccg ctaaggagga 1860 tggaaacgag aggcgtaatt ccaacgtgaa gaggagaagt tcttacacca acagcatcaa 1920 cagcagcttc gagtcatccg aggaggacac tctgaatagc agttgcgaca acacaagtga 1980 cttcgacgaa agcgttggca gcagcgaaag cgaaagtgaa acaaacaaca ggacaagaaa 2040 cagaaacaga accaagaggg caatggcaac agcaaagctc aaagaccgag accgcgccaa 2100 agctcgaacc gcacccaagc cacacagcaa tcgcttatcg cctgcatcca ctataacgcc 2160 aagtgagatg agcagcagct tagccagccc aaacacctct tcacaagagc atatccagca 2220 agccatcttg tcattgctcc tcgaattgcc gaaacatctg gagaatgtgc acaagtcgaa 2280 gcgtccttcc tctcagcagc caagcacaca gattgatcaa accggaaacc ggactacgac 2340 ggtaacgaag accaggagac ggcaccgatg aatgcattat at 2382 <210> 70 <211> 2574 <212> DNA <213> artificial <220> <223> (KpnI)-pActin-TAD1-(NsiI) <400> 70 atataggtac cggcccgttc aacacaatgc gcctgcaatt tctatccccg ctttccacct 60 ctgtctccct cttcaaagtc acagagtctg ccatttgtat tcgagcatga aaaatgatga 120 cctcctttct tctcgttcaa tacagcggac atgaacaaga aaggggtggc ctgagccacc 180 aagttctaca cttgcagcca gacgtattca aaaatcgacg tggacgagtt gcgactcaac 240 atcctctgtg aattgcaatc gagtgagtga ttacgacctg tattcacgtc aaaatgcagg 300 tgtgacattt gaattttgaa atacatgagg caggctcgat ttgctccact caagtcgagt 360 ttgccaaatt caagaagcgc taatcggagc caaccgaccg accacaacca gccaaatcag 420 ccagccaagg cagagaagca gaagcaaagg cggtgcattg agaggtgagc cgtgtgctgt 480 gctgtgctct gctgtgctgt ctgtcaatgc ttgctgcgtg tgtttgtctc gcctctacag 540 cctgcccctc aagatgtgac cgattggaag gaaaggaagg tcacacgcag ttctggcatg 600 ccacgcacgc acagcccgaa attgcgatct caagagactg ccgacgccgc cgtccgccgt 660 tgagcgctct gcttgggtca aagcgtaagc gcttctcgaa ttcaaactca cagagttcca 720 agtctgcaca ggtcatctgt tcgtcctttt gagactgcct gactggctgg ctggaacgca 780 cgcacgcaca cttccgattc gacaccgccc gctgctgctg tcttctgcgc tcttgtgccc 840 ttcttctgta cttggccttt gcgtcgactt ctttgcttgc tcggcagtgc cgtctcatct 900 gccccaagtc aagctcagca gcacagcaca cacgcatcac cctctcggct tgggtttgcc 960 cctgttgcct gtctgtccac actcacacac atccctatcg cttgctcgac atcatcgctt 1020 acctcttccc caccacctcg tctttgacac ctttactttc tcaacccctc ttccaccacc 1080 aaccccccca ccacttactt tcaacatggc accttctctc aacgcgaact caacagccga 1140 tcggcggaac gccactgctg cccctgacct tctatccggc aataaagccg gtggtggcct 1200 caagctttcc ggattaccag acctctccga ctcggcaggc accttgagcg acgtatttgg 1260 aacgccggcc atgcgcctca tctggtctga ccaaaatcga gttgcttgct acctcgagat 1320 cgaggcagcg ctcgccgttg tccaagctga actcggtatc atcccaaagc acgccgctca 1380 ggagatcgtc aaacactgcc gtgtagatga gatcgattgg gctctgtaca agcaaaagac 1440 cgaattgatc ggctatcctg tcttgggaat cgtccagcag ctggttgcca actgcaaaga 1500 tggcttggga gagtactgtc attggggcgc tacgacacaa gatatcaccg acacagctac 1560 cattatgcag attcgtcagt cgctcgccct cgttaaggag aagctgtgca gcatcgttgc 1620 gagccttcgg tacttggcgg aaaagcaccg caaccttccc atggctgcgc gttcgaatct 1680 caagcaagcc gtgccaataa cttttggttt caagatggcg cgcttcttgg ccactttccg 1740 ccgacatcag gagcgtctgg ccgagctcga gaagagaaca tacacactag aattcggcgg 1800 tgcggcgggc aacttgtcct cgttaggcga aaagggtatt gcgacgcacg atgcactcgc 1860 caagatgctt gacctttcac ccgctgacat cgcctggcat accgaacacg atcgctttgc 1920 agaggtaggt gccttcctgg gtcttctgac gggaacgcta gccaaactcg ccacagacat 1980 caaactcatg tcgcagaccg aggtgggtga ggtcggggag ccattcatct caaaccgtgg 2040 ctcatcgtcc accatgccgc agaagaacaa cccgatttcg tgcgtgtata ttcatgcctg 2100 tgccgccaat gtccgtcagg gaactgctgc gctgttggat gccatgcagt cggatcacga 2160 gcgtggcact ggaccttggg agatcatctg ggttcaactc ccgctcatga tgaactggtc 2220 ggcagcggct ctggccaatg ccgacttcat tttgaaggga ttgcaggtct tccccgatgc 2280 catggtccga aacctggcct tgtccaaggg cttgatcgtc tccgaagcag tcatgatggc 2340 gctcggcgac actctcggcc gccagtacgc ccatgacgcc gtctacgagt gctgtcgagc 2400 ggcctttgag cataacagac cgttgcttga tgttcttctc gagaaccaag aaatagctag 2460 caagctgaag cgtgccgagc tagagaggct ttgcgagcca gccaattatc ttggacaatg 2520 ctcccaatgg atcgatcgtg tcttgctacc tccttccacg tgaatgcatt atat 2574 <210> 71 <211> 1123 <212> DNA <213> artificial <220> <223> (Pfl23II)-pActin-olapACO2 <400> 71 atatacgtac gggcccgttc aacacaatgc gcctgcaatt tctatccccg ctttccacct 60 ctgtctccct cttcaaagtc acagagtctg ccatttgtat tcgagcatga aaaatgatga 120 cctcctttct tctcgttcaa tacagcggac atgaacaaga aaggggtggc ctgagccacc 180 aagttctaca cttgcagcca gacgtattca aaaatcgacg tggacgagtt gcgactcaac 240 atcctctgtg aattgcaatc gagtgagtga ttacgacctg tattcacgtc aaaatgcagg 300 tgtgacattt gaattttgaa atacatgagg caggctcgat ttgctccact caagtcgagt 360 ttgccaaatt caagaagcgc taatcggagc caaccgaccg accacaacca gccaaatcag 420 ccagccaagg cagagaagca gaagcaaagg cggtgcattg agaggtgagc cgtgtgctgt 480 gctgtgctct gctgtgctgt ctgtcaatgc ttgctgcgtg tgtttgtctc gcctctacag 540 cctgcccctc aagatgtgac cgattggaag gaaaggaagg tcacacgcag ttctggcatg 600 ccacgcacgc acagcccgaa attgcgatct caagagactg ccgacgccgc cgtccgccgt 660 tgagcgctct gcttgggtca aagcgtaagc gcttctcgaa ttcaaactca cagagttcca 720 agtctgcaca ggtcatctgt tcgtcctttt gagactgcct gactggctgg ctggaacgca 780 cgcacgcaca cttccgattc gacaccgccc gctgctgctg tcttctgcgc tcttgtgccc 840 ttcttctgta cttggccttt gcgtcgactt ctttgcttgc tcggcagtgc cgtctcatct 900 gccccaagtc aagctcagca gcacagcaca cacgcatcac cctctcggct tgggtttgcc 960 cctgttgcct gtctgtccac actcacacac atccctatcg cttgctcgac atcatcgctt 1020 acctcttccc caccacctcg tctttgacac ctttactttc tcaacccctc ttccaccacc 1080 aaccccccca ccacttactt tcaacatgat tgcctcgctc gct 1123 <210> 72 <211> 4269 <212> DNA <213> artificial <220> <223> (Pfl23II)_pActin_ACO2_(NsiI) <400> 72 atatacgtac gggcccgttc aacacaatgc gcctgcaatt tctatccccg ctttccacct 60 ctgtctccct cttcaaagtc acagagtctg ccatttgtat tcgagcatga aaaatgatga 120 cctcctttct tctcgttcaa tacagcggac atgaacaaga aaggggtggc ctgagccacc 180 aagttctaca cttgcagcca gacgtattca aaaatcgacg tggacgagtt gcgactcaac 240 atcctctgtg aattgcaatc gagtgagtga ttacgacctg tattcacgtc aaaatgcagg 300 tgtgacattt gaattttgaa atacatgagg caggctcgat ttgctccact caagtcgagt 360 ttgccaaatt caagaagcgc taatcggagc caaccgaccg accacaacca gccaaatcag 420 ccagccaagg cagagaagca gaagcaaagg cggtgcattg agaggtgagc cgtgtgctgt 480 gctgtgctct gctgtgctgt ctgtcaatgc ttgctgcgtg tgtttgtctc gcctctacag 540 cctgcccctc aagatgtgac cgattggaag gaaaggaagg tcacacgcag ttctggcatg 600 ccacgcacgc acagcccgaa attgcgatct caagagactg ccgacgccgc cgtccgccgt 660 tgagcgctct gcttgggtca aagcgtaagc gcttctcgaa ttcaaactca cagagttcca 720 agtctgcaca ggtcatctgt tcgtcctttt gagactgcct gactggctgg ctggaacgca 780 cgcacgcaca cttccgattc gacaccgccc gctgctgctg tcttctgcgc tcttgtgccc 840 ttcttctgta cttggccttt gcgtcgactt ctttgcttgc tcggcagtgc cgtctcatct 900 gccccaagtc aagctcagca gcacagcaca cacgcatcac cctctcggct tgggtttgcc 960 cctgttgcct gtctgtccac actcacacac atccctatcg cttgctcgac atcatcgctt 1020 acctcttccc caccacctcg tctttgacac ctttactttc tcaacccctc ttccaccacc 1080 aaccccccca ccacttactt tcaacatgat tgcctcgctc gctcgcgttc agaggggccg 1140 caatggcttc tctgccgctc acaaggccat cggtgccaag cgcaccctcg ccacccccgc 1200 tgctgatggt cgcgtcccta cattccaccc gtcgcgcgtt ccaccataca cagagttgct 1260 cgccaccctc gagaccgttc gtcaacagct caaccgtcct ctcacactct ccgaaaagat 1320 tctctactcg catcttcgca accccgagca ggacctcgct ggtgtcggtg ctgatgtttc 1380 ggctattcga ggcaaaaagt acctcaagct caagatcgac cgtttggcca tgcaggatgc 1440 ttccgcccag atggctttgc ttcagttcat gacttgcggt ttgccacgta ccgccattcc 1500 ttccagtgtt cactgcgacc atctcattca ggcgttcgag ggtgctgagg ccgatcttaa 1560 gcgttccatc gcttccaacc aggaggtctt tgctttcctc gaatcggctt ccaagaagta 1620 cggtatcgag ttctggggtc caggctccgg tatcattcac cagattgttc tcgagaacta 1680 cgcagcaccc ggtcttctca tgctcggtac cgactcgcac actcccaacg cttccggtct 1740 cggttgtctt gctatcggtg tcggaggtgc tgatgccgtc gatgctatga ccaacactcc 1800 ttgggagctc atggcaccca aggtgctcgg tgttcacctc aagggagagc tcagcccttg 1860 gtgcacgccc aaggatgtca ttcttcacct tgccggcaag ctgaccgttc gtggtggtac 1920 cggaaagatc gtcgaatact cgggtcccgg tctccagact cttcccgcca ctggtcttgc 1980 taccatgtcc aacatgggtg ctgaggttgg tgccactact tccgctttcc ccttcactcc 2040 tgccatggga tcctacctcg aggctactgg ccgtgctgaa gtcgctcgcg ctgccgagaa 2100 ggctgctggc caaggtttcc ttgctgctga cgaaggcgca gagtacgatg agcgtatcga 2160 gatcaacctt tccgacctcg agccttgcct caacggtccc ttcactcccg atctcagcac 2220 tcccctttcc gaattcgtca acaaggccaa gtccgacgct cgtgaccacc ccgtcgagct 2280 cagcgccgct ctcatcggct catgcaccaa ttcttcttac gccgacatgg ctcgttgcgc 2340 ttcgctcgcc cagcaggcca gggaccgcgg catgaaggtc aagtccagct tcgatgtcac 2400 tcccggttcc gagcaggttc gtgccactgt tgagcgcgat ggtattcagc aagtcttgac 2460 cgatgtcggc ggacgtgttc ttgccaacgc ttgcggtcct tgcatcggac aatggaaccg 2520 aaaggagctc cagggcgagg acaacgtcat cttgacctcg ttcaaccgaa acttccgtgg 2580 ccgtaacgat ggcaactcca agacttggaa cttgctcgca tcccccgaga ttgtcaccgc 2640 catggccttt gctggtcgtc tcgacttcaa ccctatgacc gacagcctca ctgctcccga 2700 tggcaagcct ttcaagttcg agcctcctca gtctgatgtt ttgcccgcca gcggttttgc 2760 tcagggtgac attgactacc ttcccgcccc catgcctgag cctcaacctg acactgaggt 2820 tctcatcagc cccacctccg cgcgtctcga gcacttggca cctttcgaca gccccttcgc 2880 cgctactgcc gctcagggca agtacgagct ccccaccatg cgttgtctcc tccgtatcaa 2940 gggcaagtgc acaaccgacc acatcagtgc cgctggtcct tggctcaagt acaagggtca 3000 cctttccaac ttggccgaga acaccctcat cggtgccacc aatgacgagt tcgacgctgt 3060 caacgtcgct caagactacg agactggcaa gaaagacacc atccccggcg tcgccaagat 3120 ctacaagtcg cgtcaacagc catggatgat ggtcgccgac cacaactacg gagaaggatc 3180 cgctcgtgag cacgccgcct tgcagcctcg attctacggt tgcaacctca tcgttgcccg 3240 cagcatcgct cgtattgctg agactaactt gcgcaagcag ggtgtcttga cgttgctctt 3300 cgagaacgag gacgactacc tcaggatcag ctcgggtgac cttgtcgaga cggtcaacct 3360 gacggatttg atcaagcccg gaggagattt ggctacccag gtcaagttga aggtgaccaa 3420 gttcgaggag gatggaaaga cggtgaagga gactttcgag ttgcccacca agcactcgtt 3480 gagtgccgct catttggact ggatcagggc tggttccgcg ctcaacctca tccgtgagca 3540 ggctgcttcc tctgctgctg ctggcggtat cgctggtggt gtctctggtg ccttcgccgc 3600 tgctgctggc gctgccaagt ctgccgcgtc taaggttgcc tcccttggtg gtgtccgtgg 3660 atacgctact gccgctaagc ctgccaccgg tggatcgcgc aaccccaacg atcccaacta 3720 cgtcccgccc gcagctgatc cccgtaccga atccattcgc aagatcgttt accccccttc 3780 ccccgtctca gccaaggaca aagccgcgca ctcggccacc tccgcctctg ccgtcctccc 3840 cttcggctct gcctcagaag agatccacag caccattacc cgcgcatggc tcctctacca 3900 acgcacacaa cgcgaatccc tcgctgcctc cctcaacgcc aaacaagctc gcctccgcga 3960 agcgctccaa gacctcaaag aaacagacga acgcctgtac gcagcagcaa cgtacaaagt 4020 tgcccccaac aaacgttccc ctaaggaaca ccgtaaactt gttgaacttg ggttggtaac 4080 gctgccaggt gcaacaccca agccggacgc tccgagcggt gctgaggcga ggaggctggt 4140 gaaggcggtt gcgggaggtg ctaggttgga ggggttgttc cctagggagt tgagggttcc 4200 gactatgacg cccggtagga aggtttggaa ctcgaacttt gagcctagtc agatttgaat 4260 gcattatat 4269 <210> 73 <211> 21820 <212> DNA <213> artificial <220> <223> Vector_surroundings <400> 73 tgtgtgaaag tcgtaaatga tatcggcggc agctttcatg ccggcctggt tggggtggta 60 tgcgcatctg tttttgaagt tccagaacga gccgtctgat acccaaggct cttttgatcc 120 gagtgcgtgc ttgagcttgc tctcttctgc tagcggaacg acatagacgt tattcctccc 180 ttccgctgcc ttggcgtaga gcgattgaag ctgttcggcc atctcgatgt acttttgcac 240 ttgttgctga tcccaacata cgtccctcca cgcttttgta tcgggtccca tcatggcgtg 300 gtattcgacc aggtagatcg tcgcttttgg atactttttc tggacgccat cgatcaaggt 360 tgcgaatctt tgggagatct cgtctggcga agcgatggtg gggtgttcaa agtgctcctt 420 ctcttctttc gacaagacaa aatacgacaa caatctaccc caccatgtgt tcttgaacgt 480 cagaccgaac atactcccga tgtagaacat gtcattgccc ccaccggtga tcgtgactat 540 cgcatcgctg ccatcatctc cttccttaag ttcgggaaga agacttagtt gaggggcgta 600 gactttcttt ccagtatctt gcggttcgga gatcaaattg agtagcgtcg cacttgacac 660 cgaaaggtcg agaaattcat ccgtgttgtt cgggtcgaga ttgagtctac gcgccaagta 720 gttgggatag ttgtttgcac ttcgaccagc gtcagtgtct acttgaggag ggatgcctgg 780 cccagcggcg aacgatgagc ccaacgcgat caaccttgtc atttggactt gttatggcac 840 agtgttgata ttgccaagat cgacgtcgaa gatgcaatga tgaagcaaaa cggagcgaag 900 tgcaaacagg gtctcgataa gatgaattga cgagttcaaa ggaagggttc ccgatatgaa 960 gactaacgac ttcatcggca ggcttctagc ggaaaccgga ctggataagg cgggcagcgt 1020 gtaggtgggt ctgtgcgttt gcgtcaaccc cgcatttcct cggcaaagaa aaagcaagaa 1080 atttgagaaa aaggcgggaa aattgtaaca caggctaagg accggttgtc ggaggtcaaa 1140 ttgaagcgtt gagccggtac gacctagaga atggggaaac tcatcaccag ccgtgtcatt 1200 ctcttttgct gaggttgtga tcagattctc atctacatag cttgtcgttc gaagcaaccg 1260 ggcacttatt ctacctctat gcgtccatca tgatgaatct tcgcgaggct gtgtacccat 1320 gggtacattt gggcgaagaa aggacgtcgc acgaccgaca gcctaagaag catagcgcac 1380 caaagtaacg gttgaatgac tgcaaatgta gagccgtgtc aagttcgcga tcatagccga 1440 agcgagtgag ggatgtctcg agctatgtgg ccggcatgtt ctcagtgccc cgcaattttt 1500 tgtgtgtgtt cttgtggcac gagcaatcgg ctcaaccgag tctgcagcaa aactgagcca 1560 tttacccgtc gtggccgact tgaccgtgtg cgagccaaga gcaagccgaa aacgtgagtc 1620 ttcgccgagt ctcttccttc ctttgcttca ctaacatcag tagccgtcac tatagatccc 1680 ttatgagcag ctagccggca gattttggct gcgtttcctc cccaccatca tcgcattcct 1740 gcatcacctt gcctactccg tcacgatgcc ctacacacca ccacgttcgt cgcagcctcc 1800 taaaggttta ccctttgagc tttcgctctc gacgcatccc ggcgcgcagc acaaccgatc 1860 ttcgctcaca cccgtgtcgt tcctcttgcg tgccgcgctg attacgcctc gcaaattggc 1920 aatcactcat cctgaaaagg gctactcatt cacctacgag caatgggcag cacgtactct 1980 ctcgctcgcc tttgcacttc gcagccttcc cgccttcaag attggtgatc gcgtcgctgt 2040 tatctcgcct aacgcacctc tgatcgcaga cgctcactgg ggtattcctg ctgttggtgg 2100 tatcattacg ccgatcaaca ttcgaaacac gcccaaggag gtcgcttacg tcttggagca 2160 ctcgggtagc actgtaatct tggtcgacca cgagtttaca cacctcgtcc ccgagaaccc 2220 tggcccaggc atcaccgtca tcgtcagcaa agattcggga ggacaagaag ctgacgatcc 2280 atacgagaaa tttctcgatc gtggcttcct cgaatggcag cgtgctgagc aggctgagct 2340 caaagcctac aagtctcgca ctcgaccttc tgctgaacca aagacgggat ggaaactcat 2400 cgaggcgcct caagacgaag aacaacccat cgccctctgc tacacctcgg gtactactgg 2460 tcgacccaaa ggtgtgctca ctaaccaccg tggagcctac ctttctgccg tagccaacgc 2520 ttttgaagcc cacctcacgc aggatagcgt ctatctttgg gttcttccca tgttccatgc 2580 ttgtggatgg acgtaccctt gggctgttac tgcttctctc gctacgcatt tcaccattcg 2640 caaggtcgac aacaccgtta tctgggacgc gttgctcaat cacggcgtat cgcactactg 2700 cggtgcccct acagttcaga tcggcctcgt caaccatcct aacgcacgca agctcaaccg 2760 tcgcgtgaac gttgccgtcg cagcttccgc acccaccgcc aacctcctcg ccaagatgga 2820 gggtctaaac ttgcacccag tccacgtata cggcttgacc gaaacatacg gtcctttcac 2880 caggaggtac ttcgagcccg aatgggccaa actagatgtt gatgctcgag cacgaatgat 2940 ggctcgccaa ggacactcct acctcacttc agatgaggta cgtgtcgttc gtactgcttc 3000 ttccaccgac gcctctacac ctgacctcgt cgatgttgag cgcaacggtc aagaaacggg 3060 cgaaatcgtc attcgaggaa acatggtcat ggtaggctac tacaacgatc ccgccgccac 3120 ttccaaagcc gtcatgaaag gctggttcca cactggcgac ctagccgtcc gtcaccctgg 3180 cggcgaaatc caaatcctag accgaggtaa agacatcatc atctccggag gcgaaaacat 3240 ctcctcgctc atggttgaac aggaacttgc ctcccaccct tccgtcctcg aatgctgcgt 3300 cattgcacga ccgcacgaaa agtggggcga acgcggccag tcgtttatcg tgctcacaga 3360 acaggcgaaa gcgaaactca acttcgcaga gataaaaaag aagggttcac cggagaacaa 3420 ggcgtttgtt gaagaggtga aaaagcactg cgtggaaagg atgtccaaat tcgccgtacc 3480 ggaatggttc gacgtagtgg acgaattgcc aaagacaagc acgggcaagg tgcagaagaa 3540 gggcgcaggg tcgatgcgac gcaatcgtcc gatccggagc cgggactgtc gggcgtacac 3600 aaatcgcccg cagaagcgcg gccgtctgga ccgatggctg tgtagaagta ctcgccgata 3660 gtggaaaccg acgccccagc actcgtccga gggcaaagga atagagtaga tgccgaccgg 3720 gatctgggca gcaccaagac acggaacttt caacagtcgt gagtaggtgg tgatctgcat 3780 gtccaaatcg tgaaacgtga atcacgaacc acgaatcgtg aatagccact ttgcgcgaaa 3840 atcactgaat gccgccaaac cgacgcgacg cgagttgcgt gaagtattcg tgattcacat 3900 tcacgattga cgattgtgag ttggtcgacg acattcgcta gccagaccaa cactcacgac 3960 tttttgaaga gcgttgcagg ttgagccaac tttctccctc actctttgct ttcttctcca 4020 tcacgctcat tccttttaag tgttcatccg gtatcattag cactatatca tagtgaaact 4080 cgcaacaacc cggtcttcgt cgcgaaagca accctccatc gctgctgcct cttgcagtga 4140 agaccgccac catgcagtct acgcagtcga agaccctaca cgtccagttc gtccattctg 4200 gtcctacaca ttgtatccac gcacccaagt ctgccaacgt ggagtaagtg aacctttttt 4260 tgtcctgtcg aggctcaacg tagatcacag gctgatcatc cacactcttc taccttttga 4320 cattacgcag tcgacttttt acaggaggag atgactacct cgtccgaatc ttacccaccc 4380 tgcctctctc cgacgtagag ccgcagctta tcgaagacgc cactgaagcg gtgacctcgc 4440 tcgatgctga cggccgcttc ctcgtcaccg cttccgaaga tggctctgta cgcctctacc 4500 gacaccaccc aatcgacgcg gaaggcaacc cagcatcacc aactgtgctt caatcgctgc 4560 tgcgccgcga agcttggctg caggtcgacg gatcccgggt accggcccgt tcaacacaat 4620 gcgcctgcaa tttctatccc cgctttccac ctctgtctcc ctcttcaaag tcacagagtc 4680 tgccatttgt attcgagcat gaaaaatgat gacctccttt cttctcgttc aatacagcgg 4740 acatgaacaa gaaaggggtg gcctgagcca ccaagttcta cacttgcagc cagacgtatt 4800 caaaaatcga cgtggacgag ttgcgactca acatcctctg tgaattgcaa tcgagtgagt 4860 gattacgacc tgtattcacg tcaaaatgca ggtgtgacat ttgaattttg aaatacatga 4920 ggcaggctcg atttgctcca ctcaagtcga gtttgccaaa ttcaagaagc gctaatcgga 4980 gccaaccgac cgaccacaac cagccaaatc agccagccaa ggcagagaag cagaagcaaa 5040 ggcggtgcat tgagaggtga gccgtgtgct gtgctgtgct ctgctgtgct gtctgtcaat 5100 gcttgctgcg tgtgtttgtc tcgcctctac agcctgcccc tcaagatgtg accgattgga 5160 aggaaaggaa ggtcacacgc agttctggca tgccacgcac gcacagcccg aaattgcgat 5220 ctcaagagac tgccgacgcc gccgtccgcc gttgagcgct ctgcttgggt caaagcgtaa 5280 gcgcttctcg aattcaaact cacagagttc caagtctgca caggtcatct gttcgtcctt 5340 ttgagactgc ctgactggct ggctggaacg cacgcacgca cacttccgat tcgacaccgc 5400 ccgctgctgc tgtcttctgc gctcttgtgc ccttcttctg tacttggcct ttgcgtcgac 5460 ttctttgctt gctcggcagt gccgtctcat ctgccccaag tcaagctcag cagcacagca 5520 cacacgcatc accctctcgg cttgggtttg cccctgttgc ctgtctgtcc acactcacac 5580 acatccctat cgcttgctcg acatcatcgc ttacctcttc cccaccacct cgtctttgac 5640 acctttactt tctcaacccc tcttccacca ccaacccccc caccacttac tttcaacatg 5700 agcctctcga acagcaatca caacgagcgc cacaacgacg acaacaacat caatgacgat 5760 gattgtgcta acttctttga gctgatggtt cagcctgcct cttcttcttc ttacggcccc 5820 tactttcccg acccaggact ggcgcttcca gcaatttccg atgtctcatc aacaacagat 5880 acgcgactac cgtcacagct cggagtgacc ccattcagtc atcagacatc gcccatccga 5940 tccgcagatg aaggagagaa gacgacaaca accgcatcat acaaaagaaa gcattccgag 6000 gtggagaaag accgtcgaag aatcatctca aacggatttg cagtgagttt ccctcttctt 6060 ctaccataaa gttcaggctg gttgagctga agtcgacgtt tggcaatatt tgtgtagatc 6120 ttgcagaacg tcctccataa cgactcaact tccaaaccca tctcgaaagc gaccctactt 6180 caacaagcgt gcgacgaaat ccgtgaactg cgcaaaaaac ttgatacgag cattaccatc 6240 atctcccgct atggtctcga aaatttgttt caggtggctc caacccccaa ttctttgagc 6300 aatgcttctc ctcccaatgg tacgagtagg gcttacccta cctattcgaa cgacctcggc 6360 ccggatcgtt tccaagactc gcggcgtagt tccacttcgg cgacgagtgt gtctggatct 6420 caatataaca atggcgctgc cgctaaggag gatggaaacg agaggcgtaa ttccaacgtg 6480 aagaggagaa gttcttacac caacagcatc aacagcagct tcgagtcatc cgaggaggac 6540 actctgaata gcagttgcga caacacaagt gacttcgacg aaagcgttgg cagcagcgaa 6600 agcgaaagtg aaacaaacaa caggacaaga aacagaaaca gaaccaagag ggcaatggca 6660 acagcaaagc tcaaagaccg agaccgcgcc aaagctcgaa ccgcacccaa gccacacagc 6720 aatcgcttat cgcctgcatc cactataacg ccaagtgaga tgagcagcag cttagccagc 6780 ccaaacacct cttcacaaga gcatatccag caagccatct tgtcattgct cctcgaattg 6840 ccgaaacatc tggagaatgt gcacaagtcg aagcgtcctt cctctcagca gccaagcaca 6900 cagattgatc aaaccggaaa ccggactacg acggtaacga agaccaggag acggcaccga 6960 tgaatgcata gtagatgccg accgggatct gggcagcacc aagacacgga acttcaacag 7020 tcgtgagtag gtggtgatct gcatgtccaa atcgtgaaac gtgaatcacg aaccacgaat 7080 cgtgaatagc cactttgcgc gaaaatcact gaatgccgcc aaaccgacgc gacgcgagtt 7140 gcgtgaagta ttcgtgattc acattcacga ttgacgattg tgagttggtc gacgacattc 7200 gctagccaga ccaacactca cgactttttg aagagcgttg caggctgagc caactttctc 7260 cctcactctt tgctttcttc tccatcacgc tcattccttt taagtgttca tccggtatca 7320 ttagcactat atcatagtga aactcgcaac aacccggtct tcgtcgcgaa agcaaccctc 7380 catcgctgct gcctcttgca gtgaagaccg ccaccatgca gtctacgcag tcgaagaccc 7440 tacacgtcca gttcgtccat tctggtccta cacattgtat ccacgcaccc aagtctgcca 7500 acgtggagta agtgaacctt tttttgtcct gtcgaggctc aacgtagatc acaggctgat 7560 catccacact cttctacctt ttgacattac gcagtcgact ttttacagga ggagatgact 7620 acctcgtccg aatcttaccc accctgcctc tctccgacgt agagccgcag cttatcgaag 7680 acgccactga agcggtgacc tcgctcgatg ctgacggccg cttcctcgtc accgcttccg 7740 aagatggctc tgtacgcctc taccgacacc acccaatcga cgcggaaggc aacccagcat 7800 caccaactgt gcttcaatcg ctgctgcgcc gcgaagcttg gctgcaggtc gacggatccc 7860 ggttatcgag ctcgaattcg ccctatagtg agtcgtatta caattcactg gccgtcgttt 7920 tacaacgtcg tgactgggaa aaccctggcg ttacccaact taatcgcctt gcagcacatc 7980 cccctttcgc cagctggcgt aatagcgaag aggcccgcac cgatcgccct tcccaacagt 8040 tgcgcagcct gaatggcgaa tggacgcgcc ctgtagcggc gcattaagcg cggcgggtgt 8100 ggtggttacg cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc 8160 tttcttccct tcctttctcg ccacgttcgc cggctttccc cgtcaagctc taaatcgggg 8220 gctcccttta gggttccgat ttagtgcttt acggcacctc gaccccaaaa aacttgatta 8280 gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt 8340 ggagtccacg ttctttaata gtggactctt gttccaaact ggaacaacac tcaaccctat 8400 ctcggtctat tcttttgatt tataagggat tttgccgatt tcggcctatt ggttaaaaaa 8460 tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa atattaacgc ttacaatttc 8520 ctgatgcggt attttctcct tacgcatctg tgcggtattt cacaccgcat atggtgcact 8580 ctcagtacaa tctgctctga tgccgcatag ttaagccagc cccgacaccc gccaacaccc 8640 gctgacgcgc cctgacgggc ttgtctgctc ccggcatccg cttacagaca agctgtgacc 8700 gtctccggga gctgcatgtg tcagaggttt tcaccgtcat caccgaaacg cgcgagacga 8760 aagggcctcg tgatacgcct atttttatag gttaatgtca tgataataat ggtttcttag 8820 acgtcaggtg gcacttttcg gggaaatgtg cgcggaaccc ctatttgttt atttttctaa 8880 atacattcaa atatgtatcc gctcatgaga caataaccct gataaatgct tcaataatat 8940 tgaaaaagga agagtatgag tattcaacat ttccgtgtcg cccttattcc cttttttgcg 9000 gcattttgcc ttcctgtttt tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa 9060 gatcagttgg gtgcacgagt gggttacatc gaactggatc tcaacagcgg taagatcctt 9120 gagagttttc gccccgaaga acgttttcca atgatgagca cttttaaagt tctgctatgt 9180 ggcgcggtat tatcccgtat tgacgccggg caagagcaac tcggtcgccg catacactat 9240 tctcagaatg acttggttga gtactcacca gtcacagaaa agcatcttac ggatggcatg 9300 acagtaagag aattatgcag tgctgccata accatgagtg ataacactgc ggccaactta 9360 cttctgacaa cgatcggagg accgaaggag ctaaccgctt ttttgcacaa catgggggat 9420 catgtaactc gccttgatcg ttgggaaccg gagctgaatg aagccatacc aaacgacgag 9480 cgtgacacca cgatgcctgt agcaatggca acaacgttgc gcaaactatt aactggcgaa 9540 ctacttactc tagcttcccg gcaacaatta atagactgga tggaggcgga taaagttgca 9600 ggaccacttc tgcgctcggc ccttccggct ggctggttta ttgctgataa atctggagcc 9660 ggtgagcgtg ggtctcgcgg tatcattgca gcactggggc cagatggtaa gccctcccgt 9720 atcgtagtta tctacacgac ggggagtcag gcaactatgg atgaacgaaa tagacagatc 9780 gctgagatag gtgcctcact gattaagcat tggtaactgt cagaccaagt ttactcatat 9840 atactttaga ttgatttaaa acttcatttt taatttaaaa ggatctaggt gaagatcctt 9900 tttgataatc tcatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac 9960 cccgtagaaa agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc 10020 ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca 10080 actctttttc cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgttcttcta 10140 gtgtagccgt agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct 10200 ctgctaatcc tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg 10260 gactcaagac gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc 10320 acacagccca gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta 10380 tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg 10440 gtcggaacag gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt 10500 cctgtcgggt ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg 10560 cggagcctat ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc cttttgctgg 10620 ccttttgctc acatgttctt tcctgcgtta tcccctgatt ctgtggataa ccgtattacc 10680 gcctttgagt gagctgatac cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg 10740 agcgaggaag cggaagagcg cccaatacgc aaaccgcctc tccccgcgcg ttggccgatt 10800 cattaatgca gctggcacga caggtttccc gactggaaag cgggcagtga gcgcaacgca 10860 attaatgtga gttagctcac tcattaggca ccccaggctt tacactttat gcttccggct 10920 cgtatgttgt gtggaattgt gagcggataa caatttcaca caggaaacca cagctatgac 10980 ctgattacgc caagctattt aggtgacact atagaatact caagcttgca tgcctgcagg 11040 tcgactctag aggatcctag ggataacagg gtaatctcga gtggcggcag atgtgagtcg 11100 tgtgctacaa aacgtgaatc gacacgcgca gggcggaacc aaaaaaaacc cccaccccgc 11160 tgtcaagttg acaaatcaac acatttgttc caagttcaaa tcgggaaatc aaaaattagg 11220 gccagatcag cgatcaggaa tggtaatcgg gtaacagagg tcgcaaaatc gtctagaaaa 11280 tggaagaaga acgtggtaac taccagcgag ttctgcaaac ttcaaaaaaa aaatctgggc 11340 acgatgaaag ttgagctaac gctgacgctc acaaatggcg tggctaaagg aagcgagaca 11400 atcggaaaat tgttctctcg ggcaccacaa agctgttgtt agtcgctgaa gaacaattcc 11460 aactgattcc gccgccttcc tattgcgtca gccttgtacc taagctgccg agtaacgtca 11520 ctcaacctct cttttcagac tgctttgctc cgcgaatact tttcttctat gcgctcaaga 11580 aaatgacaca gcacaccaag ctctgcaaac tttcttcgct aatctgacgc gaaatgtgag 11640 ccatttcttc tcgcctgcaa tggcaatgcg tctgtgcggc gatgagaatc acgatgccgg 11700 aatgggtggc tggaagttca tagagatgct gaattgttgg agcgacatgg tacataagca 11760 tgaatctgtc ctgatttcca ccctccgtct ttcatcaact ttctcgtctg acccttccgt 11820 tgccagatcc cgggggcaat gagatatgaa aaagcctgaa ctcaccgcga cgtctgtcga 11880 gaagtttctg atcgaaaagt tcgacagcgt ctccgacctg atgcagctct cggagggcga 11940 agaatctcgt gctttcagct tcgatgtagg agggcgtgga tatgtcctgc gggtaaatag 12000 ctgcgccgat ggtttctaca aagatcgtta tgtttatcgg cactttgcat cggccgcgct 12060 cccgattccg gaagtgcttg acattgggga attcagcgag agcctgacct attgcatctc 12120 ccgccgtgca cagggtgtca cgttgcaaga cctgcctgaa accgaactgc ccgctgttct 12180 gcagccggtc gcggaggcca tggatgcgat cgctgcggcc gatcttagcc agacgagcgg 12240 gttcggccca ttcggaccgc aaggaatcgg tcaatacact acatggcgtg atttcatatg 12300 cgcgattgct gatccccatg tgtatcactg gcaaactgtg atggacgaca ccgtcagtgc 12360 gtccgtcgcg caggctctcg atgagctgat gctttgggcc gaggactgcc ccgaagtccg 12420 gcacctcgtg cacgcggatt tcggctccaa caatgtcctg acggacaatg gccgcataac 12480 agcggtcatt gactggagcg aggcgatgtt cggggattcc caatacgagg tcgccaacat 12540 cttcttctgg aggccgtggt tggcttgtat ggagcagcag acgcgctact tcgagcggag 12600 gcatccggag cttgcaggat cgccgcggct ccgggcgtat atgctccgca ttggtcttga 12660 ccaactctat cagagcttgg ttgacggcaa tttcgatgat gcagcttggg cgcagggtcg 12720 atgcgacgca atcgtccgat ccggagccgg gactgtcggg cgtacacaaa tcgcccgcag 12780 aagcgcggcc gtctggaccg atggctgtgt agaagtactc gccgatagtg gaaaccgacg 12840 ccccagcact cgtccgaggg caaaggaata gagtagatgc cgaccgggat ctgggcagca 12900 ccaagacacg gaactttcaa cagtcgtgag taggtggtga tctgcatgtc caaatcgtga 12960 aacgtgaatc acgaaccacg aatcgtgaat agccactttg cgcgaaaatc actgaatgcc 13020 gccaaaccga cgcgacgcga gttgcgtgaa gtattcgtga ttcacattca cgattgacga 13080 ttgtgagttg gtcgacgaca ttcgctagcc agaccaacac tcacgacttt ttgaagagcg 13140 ttgcaggttg agccaacttt ctccctcact ctttgctttc ttctccatca cgctcattcc 13200 ttttaagtgt tcatccggta tcattagcac tatatcatag tgaaactcgc aacaacccgg 13260 tcttcgtcgc gaaagcaacc ctccatcgct gctgcctctt gcagtgaaga ccgccaccat 13320 gcagtctacg cagtcgaaga ccctacacgt ccagttcgtc cattctggtc ctacacattg 13380 tatccacgca cccaagtctg ccaacgtgga gtaagtgaac ctttttttgt cctgtcgagg 13440 ctcaacgtag atcacaggct gatcatccac actcttctac cttttgacat tacgcagtcg 13500 actttttaca ggaggagatg actacctcgt ccgaatctta cccaccctgc ctctctccga 13560 cgtagagccg cagcttatcg aagacgccac tgaagcggtg acctcgctcg atgctgacgg 13620 ccgcttcctc gtcaccgctt ccgaagatgg ctctgtacgc ctctaccgac accacccaat 13680 cgacgcggaa ggcaacccag catcaccaac tgtgcttcaa tcgctgctgc gccgcgaagc 13740 ttggctgcag gtcgacggat cccgggtacc ggcccgttca acacaatgcg cctgcaattt 13800 ctatccccgc tttccacctc tgtctccctc ttcaaagtca cagagtctgc catttgtatt 13860 cgagcatgaa aaatgatgac ctcctttctt ctcgttcaat acagcggaca tgaacaagaa 13920 aggggtggcc tgagccacca agttctacac ttgcagccag acgtattcaa aaatcgacgt 13980 ggacgagttg cgactcaaca tcctctgtga attgcaatcg agtgagtgat tacgacctgt 14040 attcacgtca aaatgcaggt gtgacatttg aattttgaaa tacatgaggc aggctcgatt 14100 tgctccactc aagtcgagtt tgccaaattc aagaagcgct aatcggagcc aaccgaccga 14160 ccacaaccag ccaaatcagc cagccaaggc agagaagcag aagcaaaggc ggtgcattga 14220 gaggtgagcc gtgtgctgtg ctgtgctctg ctgtgctgtc tgtcaatgct tgctgcgtgt 14280 gtttgtctcg cctctacagc ctgcccctca agatgtgacc gattggaagg aaaggaaggt 14340 cacacgcagt tctggcatgc cacgcacgca cagcccgaaa ttgcgatctc aagagactgc 14400 cgacgccgcc gtccgccgtt gagcgctctg cttgggtcaa agcgtaagcg cttctcgaat 14460 tcaaactcac agagttccaa gtctgcacag gtcatctgtt cgtccttttg agactgcctg 14520 actggctggc tggaacgcac gcacgcacac ttccgattcg acaccgcccg ctgctgctgt 14580 cttctgcgct cttgtgccct tcttctgtac ttggcctttg cgtcgacttc tttgcttgct 14640 cggcagtgcc gtctcatctg ccccaagtca agctcagcag cacagcacac acgcatcacc 14700 ctctcggctt gggtttgccc ctgttgcctg tctgtccaca ctcacacaca tccctatcgc 14760 ttgctcgaca tcatcgctta cctcttcccc accacctcgt ctttgacacc tttactttct 14820 caacccctct tccaccacca acccccccac cacttacttt caacatgagc ctctcgaaca 14880 gcaatcacaa cgagcgccac aacgacgaca acaacatcaa tgacgatgat tgtgctaact 14940 tctttgagct gatggttcag cctgcctctt cttcttctta cggcccctac tttcccgacc 15000 caggactggc gcttccagca atttccgatg tctcatcaac aacagatacg cgactaccgt 15060 cacagctcgg agtgacccca ttcagtcatc agacatcgcc catccgatcc gcagatgaag 15120 gagagaagac gacaacaacc gcatcataca aaagaaagca ttccgaggtg gagaaagacc 15180 gtcgaagaat catctcaaac ggatttgcag tgagtttccc tcttcttcta ccataaagtt 15240 caggctggtt gagctgaagt cgacgtttgg caatatttgt gtagatcttg cagaacgtcc 15300 tccataacga ctcaacttcc aaacccatct cgaaagcgac cctacttcaa caagcgtgcg 15360 acgaaatccg tgaactgcgc aaaaaacttg atacgagcat taccatcatc tcccgctatg 15420 gtctcgaaaa tttgtttcag gtggctccaa cccccaattc tttgagcaat gcttctcctc 15480 ccaatggtac gagtagggct taccctacct attcgaacga cctcggcccg gatcgtttcc 15540 aagactcgcg gcgtagttcc acttcggcga cgagtgtgtc tggatctcaa tataacaatg 15600 gcgctgccgc taaggaggat ggaaacgaga ggcgtaattc caacgtgaag aggagaagtt 15660 cttacaccaa cagcatcaac agcagcttcg agtcatccga ggaggacact ctgaatagca 15720 gttgcgacaa cacaagtgac ttcgacgaaa gcgttggcag cagcgaaagc gaaagtgaaa 15780 caaacaacag gacaagaaac agaaacagaa ccaagagggc aatggcaaca gcaaagctca 15840 aagaccgaga ccgcgccaaa gctcgaaccg cacccaagcc acacagcaat cgcttatcgc 15900 ctgcatccac tataacgcca agtgagatga gcagcagctt agccagccca aacacctctt 15960 cacaagagca tatccagcaa gccatcttgt cattgctcct cgaattgccg aaacatctgg 16020 agaatgtgca caagtcgaag cgtccttcct ctcagcagcc aagcacacag attgatcaaa 16080 ccggaaaccg gactacgacg gtaacgaaga ccaggagacg gcaccgatga atgcatagta 16140 gatgccgacc gggatctggg cagcaccaag acacggaact tcaacagtcg tgagtaggtg 16200 gtgatctgca tgtccaaatc gtgaaacgtg aatcacgaac cacgaatcgt gaatagccac 16260 tttgcgcgaa aatcactgaa tgccgccaaa ccgacgcgac gcgagttgcg tgaagtattc 16320 gtgattcaca ttcacgattg acgattgtga gttggtcgac gacattcgct agccagacca 16380 acactcacga ctttttgaag agcgttgcag gctgagccaa ctttctccct cactctttgc 16440 tttcttctcc atcacgctca ttccttttaa gtgttcatcc ggtatcatta gcactatatc 16500 atagtgaaac tcgcaacaac ccggtcttcg tcgcgaaagc aaccctccat cgctgctgcc 16560 tcttgcagtg aagaccgcca ccatgcagtc tacgcagtcg aagaccctac acgtccagtt 16620 cgtccattct ggtcctacac attgtatcca cgcacccaag tctgccaacg tggagtaagt 16680 gaaccttttt ttgtcctgtc gaggctcaac gtagatcaca ggctgatcat ccacactctt 16740 ctaccttttg acattacgca gtcgactttt tacaggagga gatgactacc tcgtccgaat 16800 cttacccacc ctgcctctct ccgacgtaga gccgcagctt atcgaagacg ccactgaagc 16860 ggtgacctcg ctcgatgctg acggccgctt cctcgtcacc gcttccgaag atggctctgt 16920 acgcctctac cgacaccacc caatcgacgc ggaaggcaac ccagcatcac caactgtgct 16980 tcaatcgctg ctgcgccgcg aagcttggct gcaggtcgac ggatcccggt tatcgagctc 17040 gaattcgccc tatagtgagt cgtattacaa ttcactggcc gtcgttttac aacgtcgtga 17100 ctgggaaaac cctggcgtta cccaacttaa tcgccttgca gcacatcccc ctttcgccag 17160 ctggcgtaat agcgaagagg cccgcaccga tcgcccttcc caacagttgc gcagcctgaa 17220 tggcgaatgg acgcgccctg tagcggcgca ttaagcgcgg cgggtgtggt ggttacgcgc 17280 agcgtgaccg ctacacttgc cagcgcccta gcgcccgctc ctttcgcttt cttcccttcc 17340 tttctcgcca cgttcgccgg ctttccccgt caagctctaa atcgggggct ccctttaggg 17400 ttccgattta gtgctttacg gcacctcgac cccaaaaaac ttgattaggg tgatggttca 17460 cgtagtgggc catcgccctg atagacggtt tttcgccctt tgacgttgga gtccacgttc 17520 tttaatagtg gactcttgtt ccaaactgga acaacactca accctatctc ggtctattct 17580 tttgatttat aagggatttt gccgatttcg gcctattggt taaaaaatga gctgatttaa 17640 caaaaattta acgcgaattt taacaaaata ttaacgctta caatttcctg atgcggtatt 17700 ttctccttac gcatctgtgc ggtatttcac accgcatatg gtgcactctc agtacaatct 17760 gctctgatgc cgcatagtta agccagcccc gacacccgcc aacacccgct gacgcgccct 17820 gacgggcttg tctgctcccg gcatccgctt acagacaagc tgtgaccgtc tccgggagct 17880 gcatgtgtca gaggttttca ccgtcatcac cgaaacgcgc gagacgaaag ggcctcgtga 17940 tacgcctatt tttataggtt aatgtcatga taataatggt ttcttagacg tcaggtggca 18000 cttttcgggg aaatgtgcgc ggaaccccta tttgtttatt tttctaaata cattcaaata 18060 tgtatccgct catgagacaa taaccctgat aaatgcttca ataatattga aaaaggaaga 18120 gtatgagtat tcaacatttc cgtgtcgccc ttattccctt ttttgcggca ttttgccttc 18180 ctgtttttgc tcacccagaa acgctggtga aagtaaaaga tgctgaagat cagttgggtg 18240 cacgagtggg ttacatcgaa ctggatctca acagcggtaa gatccttgag agttttcgcc 18300 ccgaagaacg ttttccaatg atgagcactt ttaaagttct gctatgtggc gcggtattat 18360 cccgtattga cgccgggcaa gagcaactcg gtcgccgcat acactattct cagaatgact 18420 tggttgagta ctcaccagtc acagaaaagc atcttacgga tggcatgaca gtaagagaat 18480 tatgcagtgc tgccataacc atgagtgata acactgcggc caacttactt ctgacaacga 18540 tcggaggacc gaaggagcta accgcttttt tgcacaacat gggggatcat gtaactcgcc 18600 ttgatcgttg ggaaccggag ctgaatgaag ccataccaaa cgacgagcgt gacaccacga 18660 tgcctgtagc aatggcaaca acgttgcgca aactattaac tggcgaacta cttactctag 18720 cttcccggca acaattaata gactggatgg aggcggataa agttgcagga ccacttctgc 18780 gctcggccct tccggctggc tggtttattg ctgataaatc tggagccggt gagcgtgggt 18840 ctcgcggtat cattgcagca ctggggccag atggtaagcc cgcccaggtc gcaatcgtgt 18900 gatatcggac aacaccggta acaatagcgc ttaacagtcg tgctaacgtg ggcaactatg 18960 cagctcgctg tgctctttgc acagtcacag aagctcgaaa ggggcagcta cagttcgtaa 19020 acgtgtgcta agactcgcgc cgagccagca ttgaacacaa gcgcaacgat gccggattgc 19080 atatgagctt gtttcatata tcgttgttgt ttgtgagcag acaacacgat ttcatacatt 19140 cgttgcaatg taagagcaca ttatttctct attgtcacca gggccacatc aatgcgaagc 19200 aactttgtgg ctttcaattc actgcaaggt gctcagtgag cccactttgc atgcgttgac 19260 gtgggtaccg aagggtcgag acaagaccat cgtgggagag agccgttcaa tcctgagtca 19320 gtgtgaagaa ggatgagtac aaagctgatc agccagaaag acaatcgaca cgtacaacgg 19380 cgcctgaaga tcaagatggg aatacgtacg aaagctccga tcggggtcgc tcccttcttg 19440 agatgttggt gtcaatgctc gcgttgtagg acactttcca gtacctctgg atcccagttc 19500 atctccgtct tcctaattaa cctgtcaatc gaaacaatct tgttttgacc tttactgtgc 19560 ttccacaaga ctgcacccac catgctttga ggatgcaatt ggagctgacg tgcaacaact 19620 ccatcgtcat aatggatcag cgtgacaaaa tacgtcttct tgttccccgt caatgatgtg 19680 agaggactgt gaacgccaag aaccaacact cccttgtcgc gtgcatgctg caaggccgac 19740 tggtaccatt cggggccgaa ggcgaccact cgaggagaag aaatatgttc tcgtgcaaga 19800 ccttgcttga aggaagggtc gaatcgttcg tgcatcttta gccacatgct tcggtctgtc 19860 cctttgagat tgacgtaatc gctttcaaag aaggcagaaa ccaaggcagc gcccagaagc 19920 aggagcaaca agcggaagag catcatcttg gtgtagtagg cggtgtgatt gcccgtgctt 19980 gccggtcgac actggaatcg cagatcgcaa gctgcttata ttgtagctcg atgcatctca 20040 cttggcgttt tggggctcgt ccttccatgc cgactgggtg cccagcaacc cctgaattcg 20100 gctcttcgcg gcttctcggc attatttggt tcttagcact gccgttgcca cgttctgtgt 20160 ggcggtaggc gggacggtac tttgtggcgt tgacaccgcc cacatgaatc ggtctaccgt 20220 cggttgactg taacatattg gcaacatgcc ataatactgg ttcacagcga tttcttgctc 20280 tccttcggcc ttcggcgtct accactatct aagtgcaagg aacagacttc tctcagttat 20340 ctcatcgacc ttgtgtagat ctgggagcaa taccagatcc cattctgcta tctgtcacgt 20400 gtttgaagct gccggacgtt cagaccctca ataagccgat gttgtcctcg ctttatgaaa 20460 tgtcctgcca ctggcctcgt ggcgtcctgt cagaaccaaa ctgtcggctc aacgaatatg 20520 tttgcgtgaa aacagtcatc attctacaca gagtttgtcg cacacgcctg gaatatcgct 20580 tctgtttgat tttgggttga gatcaaagag ctgtgttact gactcggata gcagcatgtt 20640 gcttagaaag cggttgacat acgttacaaa gacgctcaga agcaaaaatc tgacgggagc 20700 tacggttatt gtcgacagga tcagcgagga tttgtagggt acaaagaagt ggtggtactg 20760 cggcaaggca gggaagctaa gatcggcgct gtaaagcccg catgactcct tcgacttgtt 20820 cccaagaaag ggcagggtga gcctgctgac gggctggcca ggcatccagt cgcagcaaaa 20880 ctggacgatg ccctataggc ttgtgccaga aagcatagat gtctttgtgc tcttcattgc 20940 ctgcgccgtc attcaaacgt acattcatac cccacttatg gccaacatca gaattgaacg 21000 gaatcttggt ggtcgcgtat gcattttcat gcttgcggtc gtaggtgacg tggatgggtc 21060 cgtttcctag cgactttgaa tggtcgtacg cttgacccgg agccagcggt tttccagata 21120 cgagatggga gtagtattca acacggctct ctgggtcgat gaccgctggc aataggctgt 21180 ccctgatata cgtgatatgg tgttgcttgt agtgcttctt ggcatcgctt gtcagacttg 21240 gttggctcac agcgaaagtc gcagtcgtaa ggacggaaat ggatagtaat agatggatga 21300 taatgcgagt cgagagaacc atcggagcaa cttgactggg cgatgagctg ggaaaacgat 21360 tggggtgccg tgaaggaagt gagtcggact tttcacttaa ttgactctat ttatggcttc 21420 aatccagaca gcaatctaat gctacatcgt ctcaaaagct cgaaagacag atcagaggcg 21480 gttcaggaaa gggctttgca gcttgcaagc aggcgacaac agtccaaagc ggctaaagag 21540 gcacccttga gacggttgtt tctatgatgg cgctcgtcgc attgtttcgg ctggttgtct 21600 tcctacatat caacaccgat cgtgcaagct tgacaacacc gatgctttgc ttatcaccat 21660 gccagcagca gttgcaggag gtacatctca cataaagaag aacgcggcct tgaggccaac 21720 ccagaagatt gtgacagcat ttgagtgggc tcgatgctag acaataagaa gcgtggttgc 21780 tcgttgtatc cttctgtcaa gccacgcaca ggtgagatgt 21820 <210> 74 <211> 1097 <212> DNA <213> artificial <220> <223> Actin promoter of P.tsukubaensis: last 4 nucleotides are s tart codon + G of genomic DNA coding for Pseudog6713.t1 <400> 74 gcccgttcaa cacaatgcgc ctgcaatttc tatccccgct ttccacctct gtctccctct 60 tcaaagtcac agagtctgcc atttgtattc gagcatgaaa aatgatgacc tcctttcttc 120 tcgttcaata cagcggacat gaacaagaaa ggggtggcct gagccaccaa gttctacact 180 tgcagccaga cgtattcaaa aatcgacgtg gacgagttgc gactcaacat cctctgtgaa 240 ttgcaatcga gtgagtgatt acgacctgta ttcacgtcaa aatgcaggtg tgacatttga 300 attttgaaat acatgaggca ggctcgattt gctccactca agtcgagttt gccaaattca 360 agaagcgcta atcggagcca accgaccgac cacaaccagc caaatcagcc agccaaggca 420 gagaagcaga agcaaaggcg gtgcattgag aggtgagccg tgtgctgtgc tgtgctctgc 480 tgtgctgtct gtcaatgctt gctgcgtgtg tttgtctcgc ctctacagcc tgcccctcaa 540 gatgtgaccg attggaagga aaggaaggtc acacgcagtt ctggcatgcc acgcacgcac 600 agcccgaaat tgcgatctca agagactgcc gacgccgccg tccgccgttg agcgctctgc 660 ttgggtcaaa gcgtaagcgc ttctcgaatt caaactcaca gagttccaag tctgcacagg 720 tcatctgttc gtccttttga gactgcctga ctggctggct ggaacgcacg cacgcacact 780 tccgattcga caccgcccgc tgctgctgtc ttctgcgctc ttgtgccctt cttctgtact 840 tggcctttgc gtcgacttct ttgcttgctc ggcagtgccg tctcatctgc cccaagtcaa 900 gctcagcagc acagcacaca cgcatcaccc tctcggcttg ggtttgcccc tgttgcctgt 960 ctgtccacac tcacacacat ccctatcgct tgctcgacat catcgcttac ctcttcccca 1020 ccacctcgtc tttgacacct ttactttctc aacccctctt ccaccaccaa cccccccacc 1080 acttactttc aacatgg 1097 <210> 75 <211> 2042 <212> DNA <213> Pseudozyma tsukubaensis <220> <223> Pseudog6713.t1 genomic DNA <400> 75 atggagggtg agtactttac ttgatcagct tctcttcgcc atcccgtcat tcgccatccg 60 ccagccaaag tgtgggaaga cagccacacc gcaattcgcc cctcagccgg ccattgcttt 120 gatagcgacg aacccttgca atctttgatc gagtgcaaag cttaaagcgc cacttggcgg 180 atggatcaaa gcatcttcag acagtcttcg cgaccatgct cggcgtcgtc gcgaccaggt 240 tgcacacctt caactgacga acggctgacc taccatcgtc ggatcagctt ccgatcatgg 300 atacaagtta ggtgggaaag gcctcacgca tccgactgca tgagctattc gctccgtcat 360 tttttggcaa ttggatgcaa actcggcgat gcgcttgggc caactagaat gcgtcatcgg 420 aagatttgct tgtcaaccat gtgcacacgg cttgactgtt tcggcgaatg actacggatg 480 gctggatggc ttcgacggac ttgtgactga ccttcccata ccttgttgcg ctcctttctc 540 gcctcaaatc caattctgca atccacagac gaagtcgctg ctgtaagtag ctcattcgag 600 cttccacctc gcacggaacc aaaggcccta atgcgctcta atttcgcgag ggggatgcac 660 acacaggtag tattgtaaca gagcaacgag gctgacttct gaatgctgct ttgtcttgaa 720 tcacacaaat ttgcacggac gcttgctttc ttcgaacgct tttccgcttc gccctctgac 780 agctcgttat cgacaatggt tcgggaatgt gcaaaggtaa gtttctacaa atttgcttcc 840 caaaaggagc ttcaatagct ttgcagccgt tctttgaccg gcactgcgca gcaattcacc 900 ccaagcaccg tttctgacgc tttcttccat gcacttttct gctacatttc actttgtctc 960 gcacaacagc cggtttcgcc ggtgatgacg ctccccgagc tgtcttccct tccgttgtcg 1020 gtcgtccccg tcaccagggt gtcatggtcg gcatgggcca gaaggactcg tacgtcggtg 1080 acgaggctca gtccaagcgt ggtatcttga ccctcaagta ccccatcgag cacggtatcg 1140 ttaccaattg ggacgacatg gagaagatct ggcaccacac cttctacaac gagcttcgtg 1200 tcgcccctga ggagcacccc gttctcctta ccgaggctcc cctcaacccc aaggctaacc 1260 gtgagaagat gacccagatc cttttcgaga ccttcaacgc tcccgccttc tacgttgcta 1320 tccaggccgt tctctcgctc tacgcctccg gtcgtaccac cggtatcgtt ctcgactcgg 1380 gtgatggtgt tacccacacc gtgcccatct acgaaggtta ctcgcttccc cactcgatcc 1440 tccgtctcga ccttgccggt cgtgacttga ccgagtacct cgcccgtatc ttgaccgagc 1500 gtggttaccc cttcaccacc actgccgagc gcgaaatcgt tcgtgacatc aaggagaagc 1560 tctgctacgt cgccctcgac tttgagcagg agatgcttac cgctacccag tcttcggccc 1620 tcgagaagtc atacgagctt cctgacggac aggtgatcac cattggtaac gagcgattcc 1680 gtacccccga agttctcttc cagcccgcct tcctcggtct tgaggctgcc ggtatccacg 1740 agaccactta caactcgatc atgaagtgtg acttggacat ccgaaaggac ctctacggta 1800 acattgtcat gtcgggtggt accacgatgt acgccggtat ctcggaccgt atgcagaagg 1860 agatcaccgc tcttgccccc agctcgatga aggtcaagat tgttgctccc cctgagcgca 1920 agtactcggt ctggattggt ggatcgattc tcgcctcgct ctctaccttc cagcagatgt 1980 ggatctcgaa gcaggagtac gacgagtctg gaccttcgat cgtccaccgc aagtgcttct 2040 aa 2042 <210> 76 <211> 375 <212> PRT <213> Pseudozyma tsukubaensis <220> <223> Pseudog6713.t1 <400> 76 Met Glu Asp Glu Val Ala Ala Leu Val Ile Asp Asn Gly Ser Gly Met 1 5 10 15 Cys Lys Ala Gly Phe Ala Gly Asp Asp Ala Pro Arg Ala Val Phe Pro 20 25 30 Ser Val Val Gly Arg Pro Arg His Gln Gly Val Met Val Gly Met Gly 35 40 45 Gln Lys Asp Ser Tyr Val Gly Asp Glu Ala Gln Ser Lys Arg Gly Ile 50 55 60 Leu Thr Leu Lys Tyr Pro Ile Glu His Gly Ile Val Thr Asn Trp Asp 65 70 75 80 Asp Met Glu Lys Ile Trp His His Thr Phe Tyr Asn Glu Leu Arg Val 85 90 95 Ala Pro Glu Glu His Pro Val Leu Leu Thr Glu Ala Pro Leu Asn Pro 100 105 110 Lys Ala Asn Arg Glu Lys Met Thr Gln Ile Leu Phe Glu Thr Phe Asn 115 120 125 Ala Pro Ala Phe Tyr Val Ala Ile Gln Ala Val Leu Ser Leu Tyr Ala 130 135 140 Ser Gly Arg Thr Thr Gly Ile Val Leu Asp Ser Gly Asp Gly Val Thr 145 150 155 160 His Thr Val Pro Ile Tyr Glu Gly Tyr Ser Leu Pro His Ser Ile Leu 165 170 175 Arg Leu Asp Leu Ala Gly Arg Asp Leu Thr Glu Tyr Leu Ala Arg Ile 180 185 190 Leu Thr Glu Arg Gly Tyr Pro Phe Thr Thr Thr Ala Glu Arg Glu Ile 195 200 205 Val Arg Asp Ile Lys Glu Lys Leu Cys Tyr Val Ala Leu Asp Phe Glu 210 215 220 Gln Glu Met Leu Thr Ala Thr Gln Ser Ser Ala Leu Glu Lys Ser Tyr 225 230 235 240 Glu Leu Pro Asp Gly Gln Val Ile Thr Ile Gly Asn Glu Arg Phe Arg 245 250 255 Thr Pro Glu Val Leu Phe Gln Pro Ala Phe Leu Gly Leu Glu Ala Ala 260 265 270 Gly Ile His Glu Thr Thr Tyr Asn Ser Ile Met Lys Cys Asp Leu Asp 275 280 285 Ile Arg Lys Asp Leu Tyr Gly Asn Ile Val Met Ser Gly Gly Thr Thr 290 295 300 Met Tyr Ala Gly Ile Ser Asp Arg Met Gln Lys Glu Ile Thr Ala Leu 305 310 315 320 Ala Pro Ser Ser Met Lys Val Lys Ile Val Ala Pro Pro Glu Arg Lys 325 330 335 Tyr Ser Val Trp Ile Gly Gly Ser Ile Leu Ala Ser Leu Ser Thr Phe 340 345 350 Gln Gln Met Trp Ile Ser Lys Gln Glu Tyr Asp Glu Ser Gly Pro Ser 355 360 365 Ile Val His Arg Lys Cys Phe 370 375 <210> 77 <211> 6327 <212> DNA <213> Pseudozyma tsukubaensis <220> <223> P. tsukubaensis genomic region of Actin promoter and gene <400> 77 atctccccaa tacaaatatt cataatcgtc atcatcacgg tcttgatcat gtatctgaaa 60 gctgcgaggg tggccgtaca aagaattggt gtccgtgggg atcatagtga gcaagcgaag 120 caacggactg aagttgttag accgtttcaa attctggacc ttagctcggt gatcggcaat 180 ccatattaga cacagcccga catcttctca aagccgtgcc ggtaccttgg ctgctcgatt 240 ggctgtttgt cgacattctt tccctccgcg gatagcattg ctttcgagtg acagaggtga 300 taccatacac tatcgcatcc cggccaattc ctcatactag gtgccgtgac ggtgccgtct 360 cggtgaaagt gaaatcaatc tcgctacgat gagtcggggt aagggttcaa gagatcgaac 420 accaggtcaa ctctcgcgaa ctgcgaactg caagtgtcag accctgatcc atccatccat 480 ccgtcgattc aaccgtccga ccacaagctg tcgtcatcag aacggagcaa tgcaagccgg 540 tttcccaccc tgcgttccct accagagata tagactggac acctcgtggc agctactgac 600 caacagcaac cacggcagta caagttcgat tcttgcttgg ttcaggcgga gagggcgcac 660 aggccagggt ttagaagaaa cgctgctgtc tcttgacgct tgacggagaa ggggcccgtt 720 caacacaatg cgcctgcaat ttctatcccc gctttccacc tctgtctccc tcttcaaagt 780 cacagagtct gccatttgta ttcgagcatg aaaaatgatg acctcctttc ttctcgttca 840 atacagcgga catgaacaag aaaggggtgg cctgagccac caagttctac acttgcagcc 900 agacgtattc aaaaatcgac gtggacgagt tgcgactcaa catcctctgt gaattgcaat 960 cgagtgagtg attacgacct gtattcacgt caaaatgcag gtgtgacatt tgaattttga 1020 aatacatgag gcaggctcga tttgctccac tcaagtcgag tttgccaaat tcaagaagcg 1080 ctaatcggag ccaaccgacc gaccacaacc agccaaatca gccagccaag gcagagaagc 1140 agaagcaaag gcggtgcatt gagaggtgag ccgtgtgctg tgctgtgctc tgctgtgctg 1200 tctgtcaatg cttgctgcgt gtgtttgtct cgcctctaca gcctgcccct caagatgtga 1260 ccgattggaa ggaaaggaag gtcacacgca gttctggcat gccacgcacg cacagcccga 1320 aattgcgatc tcaagagact gccgacgccg ccgtccgccg ttgagcgctc tgcttgggtc 1380 aaagcgtaag cgcttctcga attcaaactc acagagttcc aagtctgcac aggtcatctg 1440 ttcgtccttt tgagactgcc tgactggctg gctggaacgc acgcacgcac acttccgatt 1500 cgacaccgcc cgctgctgct gtcttctgcg ctcttgtgcc cttcttctgt acttggcctt 1560 tgcgtcgact tctttgcttg ctcggcagtg ccgtctcatc tgccccaagt caagctcagc 1620 agcacagcac acacgcatca ccctctcggc ttgggtttgc ccctgttgcc tgtctgtcca 1680 cactcacaca catccctatc gcttgctcga catcatcgct tacctcttcc ccaccacctc 1740 gtctttgaca cctttacttt ctcaacccct cttccaccac caaccccccc accacttact 1800 ttcaacatgg agggtgagta ctttacttga tcagcttctc ttcgccatcc cgtcattcgc 1860 catccgccag ccaaagtgtg ggaagacagc cacaccgcaa ttcgcccctc agccggccat 1920 tgctttgata gcgacgaacc cttgcaatct ttgatcgagt gcaaagctta aagcgccact 1980 tggcggatgg atcaaagcat cttcagacag tcttcgcgac catgctcggc gtcgtcgcga 2040 ccaggttgca caccttcaac tgacgaacgg ctgacctacc atcgtcggat cagcttccga 2100 tcatggatac aagttaggtg ggaaaggcct cacgcatccg actgcatgag ctattcgctc 2160 cgtcattttt tggcaattgg atgcaaactc ggcgatgcgc ttgggccaac tagaatgcgt 2220 catcggaaga tttgcttgtc aaccatgtgc acacggcttg actgtttcgg cgaatgacta 2280 cggatggctg gatggcttcg acggacttgt gactgacctt cccatacctt gttgcgctcc 2340 tttctcgcct caaatccaat tctgcaatcc acagacgaag tcgctgctgt aagtagctca 2400 ttcgagcttc cacctcgcac ggaaccaaag gccctaatgc gctctaattt cgcgaggggg 2460 atgcacacac aggtagtatt gtaacagagc aacgaggctg acttctgaat gctgctttgt 2520 cttgaatcac acaaatttgc acggacgctt gctttcttcg aacgcttttc cgcttcgccc 2580 tctgacagct cgttatcgac aatggttcgg gaatgtgcaa aggtaagttt ctacaaattt 2640 gcttcccaaa aggagcttca atagctttgc agccgttctt tgaccggcac tgcgcagcaa 2700 ttcaccccaa gcaccgtttc tgacgctttc ttccatgcac ttttctgcta catttcactt 2760 tgtctcgcac aacagccggt ttcgccggtg atgacgctcc ccgagctgtc ttcccttccg 2820 ttgtcggtcg tccccgtcac cagggtgtca tggtcggcat gggccagaag gactcgtacg 2880 tcggtgacga ggctcagtcc aagcgtggta tcttgaccct caagtacccc atcgagcacg 2940 gtatcgttac caattgggac gacatggaga agatctggca ccacaccttc tacaacgagc 3000 ttcgtgtcgc ccctgaggag caccccgttc tccttaccga ggctcccctc aaccccaagg 3060 ctaaccgtga gaagatgacc cagatccttt tcgagacctt caacgctccc gccttctacg 3120 ttgctatcca ggccgttctc tcgctctacg cctccggtcg taccaccggt atcgttctcg 3180 actcgggtga tggtgttacc cacaccgtgc ccatctacga aggttactcg cttccccact 3240 cgatcctccg tctcgacctt gccggtcgtg acttgaccga gtacctcgcc cgtatcttga 3300 ccgagcgtgg ttaccccttc accaccactg ccgagcgcga aatcgttcgt gacatcaagg 3360 agaagctctg ctacgtcgcc ctcgactttg agcaggagat gcttaccgct acccagtctt 3420 cggccctcga gaagtcatac gagcttcctg acggacaggt gatcaccatt ggtaacgagc 3480 gattccgtac ccccgaagtt ctcttccagc ccgccttcct cggtcttgag gctgccggta 3540 tccacgagac cacttacaac tcgatcatga agtgtgactt ggacatccga aaggacctct 3600 acggtaacat tgtcatgtcg ggtggtacca cgatgtacgc cggtatctcg gaccgtatgc 3660 agaaggagat caccgctctt gcccccagct cgatgaaggt caagattgtt gctccccctg 3720 agcgcaagta ctcggtctgg attggtggat cgattctcgc ctcgctctct accttccagc 3780 agatgtggat ctcgaagcag gagtacgacg agtctggacc ttcgatcgtc caccgcaagt 3840 gcttctaagc gagttgcatt tcgaaggcgc tctggttgtg ttactagcgg ccagcgggcc 3900 cgaatctgac tcgcatttga caacaacgac aacatcatca tcactgtact tcaaggcagt 3960 atgtagacgg gcctttgacg agcgcagtgg caccagcggg agagcgagta gaaggagacg 4020 gcagcagact tgttgtactt cttggaatcg tctctggctg gtgtgacacg cgagcggcag 4080 ggaaccattt ccatttcgcg tcttctatgt aggcttttgg ccaaaccttt tcctcctcac 4140 aaatgaaaga tatgataacg acctcacaga atcttggtgc atggaacgaa agctcgtgat 4200 tagcgctgac tgaacctgga tttggacctt gggtgtgaag actttcccgg gaaaccatgc 4260 gaagagcgtt tgagagactt gcgaatggct tcagtgatgc aagacgctat caatgcaaat 4320 cgaaccctgc tcatctgcga acgagaagag cacttaacct tgcctcacag agagtaggag 4380 aagcaggcac gacgaggaga aaggttgcat ctagccgtcg gacctgtcaa agatcggaat 4440 ccatcggggc aaaagcaacg ttgacatatt gagattcatt attttagatc ggctgtactg 4500 taaatcttgg ccttttggta ttcagctccg atcctctagc tctgcgtcgc tcgctggcaa 4560 cctcctgcgt gctccttcct tcttgtaatc cctcggctat gcctttccta gcgtctgcgc 4620 tgttgcaggc tagcatcgca cttgagattc cttgcatgga tttagcttgt cattgctttt 4680 tggcgcacgg atcgctacat tgctcatctg catcccgagg cgaatcggaa aaagaagcat 4740 ctgcaacggt ctagcgacga cgaaagaaga cggaaagagc gcttgcgagc tgaggttctg 4800 cctagacagt agcgagcgct acagacaatg aaaggagcgg aacgctgcaa ggcaagatca 4860 gaggtctgtg cgtgtgatgc tgcgggtcct gtgctaaatt cggcatgcta agttactact 4920 ttgtctcttt tgcctctcac gacatgaaag ggaaacccga aaacgaaaga ggaaagagag 4980 agacgacctg tcaacctacc tcttgctttc cccggtcttg gcagcgtgtt ggcatggatg 5040 acggtctgcg atcgaaatcg acgccgaggc cttctttcct ttctgtgcgt tcgaaagggc 5100 caaaagaggt atcgaattcg accgacacac cgaggcggag agcggataaa gggcgcattc 5160 cgaagaaaaa gttgctggca catgtgcaca ctcgcttggc gtttctcaaa gagtgctgca 5220 tcgaaatgca catgcattcc tgcatgactg cgttgctctg tctggtcttt gtgcgccttt 5280 ttgctaaaat cacattttac tcgcttgcac agacatccaa gaaaagacag gcatgtgtct 5340 gcgtccatat cggtggtcgc ttggcacatt tgctagacca ctttcctcgg ctgcttgtgt 5400 tgttactgcg cacacacagg cggcagatgg tatcaaaacg agcgcttcga atggcatcaa 5460 aagtgagaga aaaagcacag acagccacag agtgtaaaaa agaacgaact cgacccaagc 5520 tgcggggttg gcgagacatt ttggtctttt tgacaggcgc agcacgaggc tagtcaagtc 5580 cgttcaagtc aaaaagtgtt ggtgtcagac gcgagtgcca gccagccagc aagcaagcaa 5640 aagcgcgaat ttggacagcc acgctagaac aaagaaaggg cagcacaccg cgacactgca 5700 acaaagagag agagagagag agagaaaggc gtcggaaagc cccattcctg cgctgcgtgt 5760 gtgactgcgc ttggcgttct gtctcttgcg ctgctgctgc tcctcgtcct cattgacctc 5820 ttcgctagtg tattcctttg ttcatcttac tctccaaccc cttccttccc ttccttccct 5880 tccatcactt ccctcatcct cattctcaat acggccccct atctctctct tcctcaaaca 5940 aagcagcacg gttcttcctt tcaacccctc tcttttctga cattcagttc cctttctttg 6000 gctggtccat acaaaggtct ctcaggtacc cgacacatac acaaacgcac gcataccact 6060 tcgtttgctt tcccatctcc gtctcacaaa acgcatcctg caaatcccat atcaactgcc 6120 ttgcatcgtc atccaaactc tctttcgctc ccactcgatc aataatctct atctctccac 6180 tctcccttac cttcccaacc ctttggtccc tataccacct ccccacccac ttactgctgc 6240 tgcttcgtca atcacgttct ttgacagaac tctcaatcgc atacatctca ttgatcccca 6300 gcaacatttc aactctagac aacaaca 6327

Claims

이타콘산 생산 숙주 미생물로서, 여기서 미생물은 ip 로커스의 외부에서 미생물의 게놈에 통합된 적어도 1개의 이종성 발현 카세트를 포함하며, 여기서 발현 카세트는 하기를 포함하는 것인 이타콘산 생산 숙주 미생물:
a) 기능성 프로모터의 작동가능한 제어 하의 이종성 RIA1 유전자, 및/또는
b) 이종성 기능성 프로모터의 작동가능한 제어 하의 RIA1 유전자.
이타콘산 생산 숙주 미생물로서, 여기서 숙주는
- RIA1 유전자의 발현을 위한 및/또는
- ADI1, MTT1 및 TAD1로 이루어진 군으로부터 선택된 적어도 2개의 유전자의 발현을 위한
발현 카세트를 포함하는 재조합 미생물이고,
여기서 상기 발현 카세트는 통합 부위에서 미생물의 게놈에 통합되며, 여기서 통합 부위는
a) 좌측 경계 유전자와 우측 경계 유전자 사이에 위치하며, 여기서 좌측 및 우측 경계 유전자의 각각의 번역 개시 코돈의 각각의 제1 뉴클레오티드는 상응하는 야생형 미생물에서 최대 51600개 뉴클레오티드에 의해 분리되어 있고,
여기서 좌측 경계 유전자는 아세틸-CoA 신테타제 활성을 갖는 단백질을 코딩하고,
여기서 우측 경계 유전자는 서열식별번호: 25와 적어도 21% 동일성을 갖는 아미노산 서열로 이루어진 단백질을 코딩하고/거나,
b) 서열식별번호: 3, 서열식별번호: 5, 서열식별번호: 7, 서열식별번호: 9, 서열식별번호: 11, 서열식별번호: 13, 서열식별번호: 15, 서열식별번호: 17, 서열식별번호: 19, 서열식별번호: 21, 서열식별번호: 23, 서열식별번호: 25 중 임의의 것과 적어도 30% 서열 동일성을 갖는 아미노산 서열로 번역되는 오픈 리딩 프레임의 가장 가까운 경계의 51600개 이하의 뉴클레오티드에 위치하고/거나,
c) 서열식별번호: 3, 서열식별번호: 5, 서열식별번호: 7, 서열식별번호: 9, 서열식별번호: 11, 서열식별번호: 13, 서열식별번호: 15, 서열식별번호: 17, 서열식별번호: 19, 서열식별번호: 21, 서열식별번호: 23, 서열식별번호: 25 중 임의의 것과 적어도 30% 서열 동일성을 갖는 아미노산 서열로 번역되는 오픈 리딩 프레임 내에 위치하거나 또는 그를 대체하는 것인
이타콘산 생산 숙주 미생물.
이타콘산 생산 숙주 미생물로서, 여기서 숙주는 재조합 미생물이며, 이는
a) 이타콘산 생산을 위한 활성 이타콘산 대사 경로를 포함하고,
b) 여기서
i) 단백질 서열인 서열식별번호: 3, 서열식별번호: 5, 서열식별번호: 7, 서열식별번호: 9, 서열식별번호: 11, 서열식별번호: 13, 서열식별번호: 15, 서열식별번호: 17, 서열식별번호: 19, 서열식별번호: 21, 서열식별번호: 23 또는 서열식별번호: 25 중 임의의 것과 적어도 30% 서열 동일성을 갖는 단백질을 코딩하고/거나
ii) 적어도 낮은 엄격도 조건 하에 상기 단백질 서열을 코딩하는 핵산 서열과 혼성화하는 상보성 가닥인
적어도 1개의 유전자가 불활성화된 것인
이타콘산 생산 숙주 미생물.
제1항 내지 제3항 중 어느 한 항에 있어서, 동일한 조건 하에 배양된 상응하는 야생형 균주와 비교하여
a) RIA1 유전자의 발현 수준이 적어도 50배 증가하고/거나,
b) ADI1, MTT1 및 TAD1로 이루어진 군으로부터 선택된 적어도 2개의 유전자의 발현 수준이 적어도 1000배 증가하고/거나,
c) ITP1 유전자의 발현 수준이 최대 500배 증가한 것인
생산 숙주 미생물.
제1항 내지 제4항 중 어느 한 항에 있어서, 미생물이 분류학상 우스틸라기노마이세테스(Ustilaginomycetes) 강, 보다 더 바람직하게는 우스틸라기날레스(Ustilaginales) 목, 보다 더 바람직하게는 우스틸라기나세아에(Ustilaginaceae) 과, 보다 더 바람직하게는 아노말로마이세스(Anomalomyces), 안트라코시스티스(Anthracocystis), 브로멜리아고(Bromeliago), 신트라크티아(Cintractia), 더마토소루스(Dermatosorus), 디르크메이아(Dirkmeia), 에리오코르텍스(Eriocortex), 파리시아(Farysia), 프란츠페트라키아(Franzpetrakia), 김노신트라크티아(Gymnocintractia), 헤테로톨리포스포리움(Heterotolyposporium), 칼마노지마(Kalmanozyma), 랑도니아(Langdonia), 류코신트라크티아(Leucocintractia), 마칼피노마이세스(Macalpinomyces), 멜라노시키움(Melanopsichium), 모에스지오마이세스(Moesziomyces), 모레아우아(Moreaua), 마이코시린크스(Mycosyrinx), 파르불라고(Parvulago), 페리클라디움(Pericladium), 포르탈리아(Portalia), 슈도지마(Pseudozyma), 레스티오스포리움(Restiosporium), 쉬조넬라(Schizonella), 쉬바시아(Shivasia), 스포리소리움(Sporisorium), 스테고신트라크티아(Stegocintractia), 톨리포스포리움(Tolyposporium), 트란츠쉘리엘라(Tranzscheliella), 트리코신트라크티아(Trichocintractia), 트리오디오마이세스(Triodiomyces), 투비소루스(Tubisorus), 우스틸라고(Ustilago), 웹스다네아(Websdanea) 중 임의의 속에 속하고, 가장 바람직하게는 슈도지마(Pseudozyma) 속에 속하는 것인 생산 숙주 미생물.
제1항 내지 제5항 중 어느 한 항에 있어서,
a) 적어도 9.5 g /(l d)의 생산율로 및/또는
b) 적어도 25 % (w/w 글루코스)의 수율로
글루코스를 이타콘산으로 전환시키기 위한
생산 숙주 미생물.
ip 로커스의 외부에서 통합을 위해 강한 구성적으로 활성인 프로모터에 작동가능하게 연결된 RIA1 유전자를 포함하는 통합 벡터.
제7항의 벡터로 형질전환된 생산 숙주 미생물.
하기를 포함하는, 이타콘산 생산 숙주 미생물을 변경시키는 방법:
- RIA1 유전자의 발현을 위한 및/또는
- ADI1, MTT1 및 TAD1로 이루어진 군으로부터 선택된 적어도 2개의 유전자의 발현을 위한
적어도 1개의 발현 카세트를 ip 로커스 이외의 통합 부위에서 미생물 게놈에 통합시키는 것.
제9항에 있어서, 통합 부위가
a) 좌측 경계 유전자와 우측 경계 유전자 사이에 위치하며, 여기서 좌측 및 우측 경계 유전자의 번역 개시 코돈의 아데닌은 상응하는 야생형 미생물에서 최대 51600개 뉴클레오티드에 의해 분리되어 있고,
여기서 좌측 경계 유전자는 아세틸-CoA 신테타제 활성을 갖는 단백질을 코딩하고,
여기서 우측 경계 유전자는 서열식별번호: 25와 적어도 21% 동일성을 갖는 아미노산 서열로 이루어진 단백질을 코딩하고/거나,
b) 서열식별번호: 3, 서열식별번호: 5, 서열식별번호: 7, 서열식별번호: 9, 서열식별번호: 11, 서열식별번호: 13, 서열식별번호: 15, 서열식별번호: 17, 서열식별번호: 19, 서열식별번호: 21, 서열식별번호: 23, 서열식별번호: 25 중 임의의 것과 적어도 30% 서열 동일성을 갖는 아미노산 서열로 번역되는 오픈 리딩 프레임의 가장 가까운 경계의 6500개 이하의 뉴클레오티드에 위치하고/거나,
c) 서열식별번호: 3, 서열식별번호: 5, 서열식별번호: 7, 서열식별번호: 9, 서열식별번호: 11, 서열식별번호: 13, 서열식별번호: 15, 서열식별번호: 17, 서열식별번호: 19, 서열식별번호: 21, 서열식별번호: 23, 서열식별번호: 25 중 임의의 것과 적어도 30% 서열 동일성을 갖는 아미노산 서열로 번역되는 오픈 리딩 프레임 내에 위치하거나 또는 그를 대체하는 것인
방법.
제9항 또는 제10항에 있어서, 단백질 서열인 서열식별번호: 19, 서열식별번호: 15 및/또는 서열식별번호: 29와 적어도 30% 서열 동일성을 갖는 단백질을 코딩하는 적어도 1개의 유전자가 불활성화된 것인 방법.
제9항 또는 제10항에 있어서, 미생물이 적어도 1개의 발현 카세트를 포함하지 않는 대조군 미생물에 비해 증가된 이타콘산 생산율을 갖는 것인 방법.
하기를 포함하는, 재조합 이타콘산 생산 숙주 미생물을 수득하는 방법:
a) 모 미생물을 배양하고,
b) 임의의 순서로 및/또는 동시에 하기를 수행하고:
- 필요한 경우: 미생물에서 활성 이타콘산 경로를 수득하기 위해 미생물에게 임의의 이종성 ADI1, MTT1 및 TAD1 유전자를 제공하기 위한 하나 이상의 형질전환,
- 구성적으로 활성인 프로모터의 제어 하의 RIA1 유전자의 적어도 하나의 통합, 여기서 통합이 ip-로커스에 있지 않음,
- i) 단백질 서열인 서열식별번호: 3, 서열식별번호: 5, 서열식별번호: 7, 서열식별번호: 9, 서열식별번호: 11, 서열식별번호: 13, 서열식별번호: 15, 서열식별번호: 17, 서열식별번호: 19, 서열식별번호: 21, 서열식별번호: 23 또는 서열식별번호: 25 중 임의의 것과 적어도 30% 서열 동일성을 갖는 단백질을 코딩하고/거나
ii) 적어도 낮은 엄격도 조건 하에 상기 단백질 서열을 코딩하는 핵산 서열과 혼성화하는 상보성 가닥인
적어도 1개의 유전자의 불활성화;
c) 단계 b)로부터 생성된 재조합 이타콘산 생산 숙주 미생물을 단리하는 것.
하기를 포함하는 생산 방법으로서:
a) 이타콘산을 생산하도록 생산 숙주 미생물을 발효시키고,
b) 단계 (a)에서 생산된 이타콘산을 회수하는 것,
여기서 미생물은 제1항 내지 제6항 및 제8항 중 어느 한 항에 따른 미생물이거나, 또는 제9항 내지 제13항 중 어느 한 항에 따라 수득되거나 또는 수득가능한 것인
생산 방법.
제14항에 있어서, 발효 공정이 액침 발효인 생산 방법.
제14항 내지 제16항 중 어느 한 항에 있어서, 생산 방법이 회분식 발효, 유가 배양식 발효 또는 연속 발효인 생산 방법.
제14항 내지 제16항 중 어느 한 항에 있어서, 발효가 최대 0.1 %(v/v)의 복합 배지 성분를 포함하는 최소 배지에서 시작되고, 최대 5.5의 pH를 갖는 것인 생산 방법.
제14항 내지 제17항 중 어느 한 항에 있어서, 발효 동안에 배지의 pH를 최대 4로 저하시키는 것을 포함하는 생산 방법.
제14항 내지 제18항 중 어느 한 항에 있어서,
배지가 폴리알콜성 탄소 공급원을 포함하고,
발효 동안에 탄소 공급원의 농도가 3시간 초과 동안 10 g/l 미만으로 떨어지지 않는 것인
생산 방법.
제14항 내지 제19항 중 어느 한 항에 있어서, 배지 내 이타콘산 대 말산의 농도 비가 적어도 15:1인 생산 방법.
제14항 내지 제20항 중 어느 한 항에 있어서, 단계 a)에서의 발효 방법이 호기성 또는 미세호기성 조건 하에 있는 것인 생산 방법.