KR20190130134A

KR20190130134A - Fdca 제조를 위한 fdca-탈카르복실화 모노옥시게나제-결핍 숙주 세포

Info

Publication number: KR20190130134A
Application number: KR1020197029619A
Authority: KR
Inventors: 봉 요하네스 아드리아누스 마리아 드; 하랄드 요한 루이제나르스; 얀 웨리즈
Original assignee: 푸락 바이오켐 비.브이.
Priority date: 2017-03-21
Filing date: 2018-03-21
Publication date: 2019-11-21
Also published as: EP3378931A1; JP2020513816A; WO2018172401A1; BR112019019516A2; MX2019011083A; EP3601524A1; AU2018238393A1; CA3056491A1; US20200102584A1; CN110651034A

Abstract

본 발명은 FDCA의 제조를 위한 진균 세포에 관한 것이다. 진균 세포는 유전자 변형이 결핍된 상응하는 모 세포와 비교하여, 세포에서 특이적 2,5-푸란디카르복실산 (FDCA) 탈카르복실화 모노옥시게나제 활성을 감소시키는 유전자 변형을 갖는다. 진균 세포는 푸란계 알데히드를 상응하는 푸란계 카르복실산으로 산화시키는 세포의 능력을 증가시키기 위해 추가로 유전자 변형될 수 있다. 본 발명은 또한 FDCA의 푸란계 전구체를 FDCA로 산화시키기 위해 본 발명의 세포를 사용하는, 2,5-푸란-디카르복실산 (FDCA)의 제조 방법에 관한 것이다.

Description

FDCA 제조를 위한 FDCA-탈카르복실화 모노옥시게나제-결핍 숙주 세포

본 발명은 분자 유전학, 대사 공학, 생체형질전환 및 발효 기술 분야에 관한 것이다. 특히, 본 발명은 히드록시메틸푸르푸랄로부터 2,5-푸란디카르복실산을 제조하도록 유전자 변형되는 진균에 관한 것이다. 본 발명은 추가로 히드록시메틸푸르푸랄의 2,5-푸란디카르복실산으로의 생체형질변환 방법에서 이러한 진균의 용도에 관한 것이다.

2,5-푸란디카르복실산 (FDCA)은 엄청난 경제적 영향을 미치는 폴리에스테르의 제조에 적용될 수 있는 단량체 화합물이다. 본 분야에서 매우 중요한 화합물은 테레프탈산 (PTA) 및 에틸렌 글리콜로부터 제조되는 폴리에틸렌테레프탈레이트 (PET)이다. FDCA는 폴리에스테르 PET에서 PTA를 대체할 수 있으며 이 경우에 폴리에틸렌푸란디카르복실레이트 (PEF)가 생성된다. PEF는 대형 폴리에스테르 시장에서 PET를 대체하는데 있어 양호한 잠재력을 갖고 있다. 그것이 PET와 비교할 때 우수한 특성을 가지고 있기 때문일뿐만 아니라 재생가능한 공급원료으로부터 유래될 수 있기 때문이다. FDCA는 당류로부터 화학적으로 (De Jong et al., 2012. In: Biobased Monomers, Polymers, and Materials; Smith, P., et al.; ACS Symposium Series; American Chemical Society: Washington, DC) 또는 조합된 화학-생물학적 경로로 (Wiercks et al., 2011. Appl Microbiol Biotechnol 92:1095-1105) 제조될 수 있다. 후자의 경우에, 글루코스 또는 프럭토스와 같은 단량체성 당은 5-(히드록시메틸)-2-푸르알데히드 (HMF)로 화학적으로 변환되고, 이는 후속적으로 효소에 의해 FDCA로 산화될 수 있다.

HMF로부터 FDCA를 제조하기 위한 생물학적 경로는 쿠프리아비두스 바실렌시스(Cupriavidus basilensis) HMF14의 HMF-분해 균주의 단리에 기초하여 개발되었다 (Wierckx et al., 2010. Microbial Technology 3:336-343). 씨. 바실렌시스(C. basilensis) HMF14에서 HMF 분해 경로에 관여하는 효소를 코딩하는 유전자의 클러스터가 확인되었고, 관련 유전자가 슈도모나스 푸티다(Pseudomonas putida ) S12 균주에서 이종 발현되며 (Koopman et al., 2010. PNAS 107:4919-4924) 그로 인해 HMF를 대사시키는 능력을 획득하였다. HMF-산 (HMFCA)에서 주로 옥시다제로서 작용하나 HMF 또는 FFCA를 또한 산화시킬 수 있는 HMF 옥시도리덕타제를 코딩하는, 단지 hmfH 유전자의 이종 발현은, 피. 푸티다(P. putida) S12가 HMF로부터 FDCA를 제조할 수 있게 한다 (Koopman et al., 2010. Bioresource Technology 101:6291-6296; 및 WO 2011/026913). 추가 최적화 작업 (상기 문헌 [Wierckx et al., 2011]; 및 WO 2012/064195)에서, 각각 HMFCA 수송체 및 특이성이 알려지지 않은 알데히드 데히드로게나제를 코딩하는 피. 푸티다 S12에서 2개의 추가 유전자가 발현되었다.

US 7,067,303는 진균 코니오카에타 리그니아리아(Coniochaeta ligniaria) (유성생식형(teleomorph)), 또는 그의 레시토포라(Lecythophora) 무성생식형 상태가 농업용 바이오매스(biomass) 가수분해물에서 푸란, 특히 푸르푸랄 및 HMF의 독성 수준을 유의적으로 감소시킬 수 있음을 개시하고 있다. 당-함유 가수분해물을 해독하는데 있어서 생물학적 작용제로서 씨. 리그니아리아(C. ligniaria)의 용도는 다수의 후속 논문에서 추가로 입증되었다 (L

pez et al., 2004. Appl. Microbiol Biotechnol 64:125-131; Nichols et al., 2005. Appl Biochem Biotechnol. Spring; 121-124:379-90; Nichols et al., 2008. Enzyme and Microbial Technology 42:624-630; Nichols et al., 2010. Bioresource Technol 19:7545-50; Nichols et al., 2014. Biomass and Bioenergy 67:79-88). 독성이 덜한 화합물로의 HMF의 해독과는 별도로, 유기체는 성장을 위해 HMF를 또한 대사시킬 수 있었다.

문헌 [Zhang et al. (2010, Biotechnology for Biofuels 3:26)]은 아모르포테카 레시나에(Amorphotheca resinae) 및 유페니실리움 바아르넨세(Eupenicillium baarnense)로서 각각 확인된, 그의 옥수수 대(corn stover) 가수분해물을 해독한 2개의 HMF-대사 진균의 단리를 기재하였다. 후속 논문 (Ran et al., 2014, Biotechnology for Biofuels 7:51)에서, ZN1로서 명명된 에이. 레시나에(A. resinae) 균주의 성장은, HMF를 포함한 많은 화합물에 의해 지지되는 것으로 보고되었다. HMF는 분해되었고, HMF 알콜 및 HMFCA는 시간에 따라 축적되었으나, FDCA의 축적은 보고되지 않았다.

문헌 [Govinda Rajulu et al. (2014, Mycological Progress 13:1049-1056)]은 푸르푸랄 및/또는 HMF를 단독 탄소 공급원으로서 이용하는 능력을 가진 다수의 진균을 유사하게 단리하였으나, FDCA의 축적은 보고되지 않았다.

따라서, HMF를 희생하여 성장하거나 HMF-함유 공급원료를 해독하는 몇몇 진균이 기재되어 있다. 효모와 마찬가지로, 공급원료를 해독하기 위해 HMF를 HMF-알콜로 환원시키는 관점에서 유기체를 연구하였다. 그러나, 효모 또는 사상균에 의한 FDCA의 제조는 기재되어 있지 않다. 그런데도, HMF로부터 FDCA의 진균 제조는 관련 기술분야에서 박테리아 과정에 비해 몇몇 고유한 이점을 제공할 것이다. 예를 들어, 많은 진균은 성장을 위해 pH = 3 이하까지의 낮은 pH 값을 견딜 수 있으며, 한편 대부분의 박테리아는 중성 pH 환경을 선호한다. FDCA의 대규모 제조의 특정 상황에서, 다운스트림 프로세싱(downstream processing) (DSP)의 이점 때문에 그리고 감염 퇴치를 위해 낮은 pH 값에서의 전세포(whole-cell) 제조 방법론을 사용할 수 있다면 큰 이점이 될 것이다.

따라서, 본 발명의 목적은 진균 세포 및 HMF로부터 FDCA의 제조 방법에서 및 그의 용도를 제공하는 것이다.

발명의 개요

제1 측면에서 본 발명은 유전자 변형이 결핍된 상응하는 모 세포(parent cell)와 비교하여, 세포에서 특이적 2,5-푸란디카르복실산 (FDCA) 탈카르복실화 모노옥시게나제 활성을 감소시키는 유전자 변형을 포함하는 진균 세포로서, 여기서 유전자 변형이 유전자의 코딩 서열 및 프로모터 중 적어도 하나의 적어도 일부의 결실에 의해 FDCA 탈카르복실화 모노옥시게나제를 코딩하는 내인성 유전자의 발현을 제거하는 것인 진균 세포에 관한 것이다. 바람직하게는, 세포에서, 상응하는 모 세포에서의 내인성 유전자는 서열번호: 4 중 적어도 하나에 대해 적어도 45% 서열 동일성(sequence identity)을 가진 아미노산 서열을 포함하는 FDCA 탈카르복실화 모노옥시게나제를 코딩한다. 유전자 변형이 세포의 게놈에서의 유전자로부터 FDCA 탈카르복실화 모노옥시게나제를 코딩하는 내인성 유전자의 적어도 완전한 코딩 서열의 결실을 포함하거나 그로 이루어지는 것이 추가로 바람직하다. 내인성 유전자의 하나 초과의 카피를 포함하는 세포에서, 바람직하게는, FDCA 탈카르복실화 모노옥시게나제를 코딩하는 내인성 유전자의 모든 카피의 발현이 제거된다.

본 발명에 따른 진균 세포는 바람직하게는 HMF를 FDCA로 산화시키는 천연 능력을 갖는 세포이다.

본 발명에 따른 바람직한 진균 세포는 바람직하게는 a) 유전자 변형이 결핍된 상응하는 야생형 세포와 비교하여, 세포에 5-히드록시메틸-2-푸란카르복실산 (HMFCA)을 5-포르밀-2-푸로산 (FFCA)으로 산화시키는 능력을 부여하거나 세포에서 HMFCA를 FFCA로 산화시키는 효소의 특이적 활성을 증가시키는 유전자 변형; 및, b) 유전자 변형이 결핍된 상응하는 야생형 세포와 비교하여, 세포에 푸란계(furanic) 알데히드를 상응하는 푸란계 카르복실산으로 산화시키는 능력을 부여하는 유전자 변형 또는 세포에서 푸란계 알데히드를 상응하는 푸란계 카르복실산으로 산화시키는 효소의 특이적 활성을 증가시키는 유전자 변형 중 적어도 하나인 추가의 유전자 변형을 포함한다. 바람직하게는, 세포에서, a)에서의 유전자 변형은 HMFCA 데히드로게나제 활성을 가진 폴리펩티드를 코딩하는 뉴클레오티드 서열의 발현을 증가시키는 변형이며, 이 폴리펩티드는 서열번호: 1 및 2 중 적어도 하나의 아미노산 서열과 적어도 45% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인 변형이고/이거나; b)에서의 유전자 변형은 푸란계 알데히드 데히드로게나제 활성을 갖는 폴리펩티드를 코딩하는 뉴클레오티드 서열의 발현을 증가시키는 변형으로서, 이 알데히드 데히드로게나제는 i) HMF를 HMFCA로 산화시키는 능력, ii) DFF를 FFCA로 산화시키는 능력, 및, iii) FFCA를 FDCA로 산화시키는 능력 중 적어도 하나를 가지며, 이 폴리펩티드는 서열번호: 3의 아미노산과 적어도 45% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인 변형이다.

본 발명에 따른 진균 세포는 바람직하게는, a) HMF 및/또는 FFCA를 상응하는 알콜로 환원시키는 단쇄 데히드로게나제를 코딩하는 유전자의 발현을 감소시키거나 제거하는 유전자 변형으로서, 여기서 바람직하게는 유전자는 서열번호: 5 및 25 중 적어도 하나에 대해 적어도 45% 서열 동일성을 가진 아미노산 서열을 포함하는 폴리펩티드를 코딩하는 유전자 중 적어도 하나인 유전자 변형; b) 적어도 하나의 푸란계 화합물을 수송하는 폴리펩티드를 코딩하는 뉴클레오티드 서열의 발현을 증가시키는 유전자 변형으로서, 이 폴리펩티드는 바람직하게는 서열번호: 6 내지 10 중 적어도 하나의 아미노산 서열과 적어도 45% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인 유전자 변형; 및, c) 푸란 이화작용에 관여하는 유전자의 전사 활성인자를 코딩하는 유전자의 발현을 변경시키는 유전자 변형으로서, 여기서 바람직하게는 유전자는 서열번호: 11에 대해 적어도 45% 서열 동일성을 가진 아미노산 서열을 포함하는 폴리펩티드를 코딩하는 유전자인 유전자 변형으로부터 선택된 유전자 변형을 추가로 포함한다.

별개의 측면에서 본 발명은 HMF를 FDCA로 산화시키는 능력을 갖고 적어도 하나 이상의 푸란계 화합물을 수송하는 폴리펩티드를 코딩하는 뉴클레오티드 서열의 발현을 증가시키는 유전자 변형을 포함하는 진균 세포로서, 이 폴리펩티드는 바람직하게는 서열번호: 9 및 10 중 적어도 하나의 아미노산 서열과 적어도 45% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인, 진균 세포에 관한 것이다. 바람직하게는 이 측면에 따른 세포는, a) 유전자 변형이 결핍된 상응하는 모 세포와 비교하여, 세포에서 특이적 FDCA 탈카르복실화 모노옥시게나제 활성을 제거하거나 감소시키는 유전자 변형; b) 유전자 변형이 결핍된 상응하는 야생형 세포와 비교하여, 세포에 HMFCA를 FFCA로 산화시키는 능력을 부여하거나 세포에서 HMFCA를 FFCA로 산화시키는 효소의 특이적 활성을 증가시키는 유전자 변형; c) 유전자 변형이 결핍된 상응하는 야생형 세포와 비교하여, 세포에 푸란계 알데히드를 상응하는 푸란계 카르복실산으로 산화시키는 능력을 부여하는 유전자 변형 또는 세포에서 푸란계 알데히드를 상응하는 푸란계 카르복실산으로 산화시키는 효소의 특이적 활성을 증가시키는 유전자 변형; d) HMF 및/또는 FFCA를 상응하는 알콜로 환원시키는 단쇄 데히드로게나제를 코딩하는 유전자의 발현을 감소시키거나 제거하는 유전자 변형으로서, 여기서 바람직하게는 유전자는 서열번호: 5 및 25 중 적어도 하나에 대해 적어도 45% 서열 동일성을 가진 아미노산 서열을 포함하는 폴리펩티드를 코딩하는 유전자 중 적어도 하나인 유전자 변형; e) 적어도 하나의 푸란계 화합물을 수송하는 폴리펩티드를 코딩하는 뉴클레오티드 서열의 발현을 증가시키는 유전자 변형으로서, 이 폴리펩티드는 바람직하게는 서열번호: 6 내지 8 중 적어도 하나의 아미노산 서열과 적어도 45% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인 유전자 변형; 및, f) 푸란 이화작용에 관여하는 유전자의 전사 활성인자를 코딩하는 유전자의 발현을 변경시키는 유전자 변형으로서, 여기서 바람직하게는 유전자는 서열번호: 11에 대해 적어도 45% 서열 동일성을 가진 아미노산 서열을 포함하는 폴리펩티드를 코딩하는 유전자인 유전자 변형으로부터 선택된 추가의 유전자 변형을 포함한다.

본 발명의 상기 측면에 따른 세포는, 바람직하게는 아크레모니움(Acremonium), 아스페르길루스(Aspergillus), 아우레오바시디움(Aureobasidium), 크립토코쿠스(Cryptococcus), 필리바시디움(Filibasidium), 푸사리움(Fusarium), 후미콜라(Humicola), 마그나포르테(Magnaporthe), 무코르(Mucor), 미셀리오프토라(Myceliophthora), 네오칼리마스틱스(Neocallimastix), 뉴로스포라(Neurospora), 파에실로미세스(Paecilomyces), 페니실리움(Penicillium), 피로미세스(Piromyces), 스키조필룸(Schizophyllum), 탈라로미세스(Talaromyces), 써모아스쿠스(Thermoascus), 티엘라비아(Thielavia), 톨리포클라디움(Tolypocladium), 트리코더마(Trichoderma), 및 우스틸라고(Ustilago)로 이루어진 군으로부터의 속(genus)으로부터 선택된 사상균 세포(filamentous fungal cell)이며, 더 바람직하게는 세포는, 아스페르길루스 니게르(Aspergillus niger), 아스페르길루스 아와모리(Aspergillus awamori), 아스페르길루스 포에티두스(Aspergillus foetidus), 아스페르길루스 소자에(Aspergillus sojae), 아스페르길루스 푸미가투스(Aspergillus fumigatus), 탈라로미세스 에메르소니이(Talaromyces emersonii), 아스페르길루스 오리자에(Aspergillus oryzae), 미셀리오프토라 테르모필라(Myceliophthora thermophile), 트리코더마 레에세이(Trichoderma reesei), 페니실리움 크리소게눔(Penicillium chrysogenum), 페니실리움 심플리시시뭄(Penicillium simplicissimum) 및 페니실리움 브라실리아눔(Penicillium brasilianum)으로 이루어진 군으로부터의 종으로부터 선택된 사상균 세포이거나; 또는, 세포는, 사카로미세스(Saccharomyces), 클루이베로미세스(Kluyveromyces), 칸디다(Candida), 피치아(Pichia), 스키조사카로미세스(Schizosaccharomyces), 한세눌라(Hansenula), 클로에케라(Kloeckera), 쉬완니오미세스(Schwanniomyces), 야로위아(Yarrowia), 크립토코쿠스, 데바로미세스(Debaromyces), 사카로미세콥시스(Saccharomycecopsis), 사카로미코데스(Saccharomycodes), 위케르하미아(Wickerhamia), 데바요미세스(Debayomyces), 한세니아스포라(Hanseniaspora), 오가타에아(Ogataea), 쿠라이쉬아(Kuraishia), 코마가타엘라 (Komagataella), 메트쉬니코위아(Metschnikowia), 윌리옵시스(Williopsis), 나카자와에아(Nakazawaea), 토룰라스포라(Torulaspora), 불레라(Bullera), 로도토룰라(Rhodotorula), 및 스포로볼로미세스(Sporobolomyces)로 이루어진 군으로부터의 속으로부터 선택된 효모 세포이며, 더 바람직하게는 세포는 클루이베로미세스 락티스(Kluyveromyces lactis), 에스. 세레비시아에(S. cerevisiae), 한세눌라 폴리모르파(Hansenula polymorpha), 야로위아 리폴리티카 (Yarrowia lipolytica), 칸디다 트로피칼리스(Candida tropicalis) 및 피치아 파스토리스(Pichia pastoris)로 이루어진 군으로부터의 종으로부터 선택된 효모 세포이다.

추가 측면에서 본 발명은 HMFCA를 FFCA로 산화시키는 능력을 갖는 효소를 발현하는, 본 발명에 따른 진균 세포를, 상기 세포에 의한 HMFCA의 산화에 도움이 되는 조건하에, HMFCA의 존재하에, 인큐베이션하는 단계를 포함하는, HMFCA를 FFCA로 산화시키는 방법에 관한 것이다.

또 다른 측면에서, 본 발명은 본 발명에 따른 진균 세포를, FDCA의 하나 이상의 푸란계 전구체를 포함하는 배지에서, 바람직하게는 상기 세포에 의한 FDCA의 푸란계 전구체의 FDCA로의 산화에 도움이 되는 조건하에, 인큐베이션하는 단계, 및, 임의로 FDCA의 회수 단계를 포함하며, 여기서 바람직하게는, FDCA의 적어도 하나의 푸란계 전구체는 HMF, 2,5-디히드록시메틸 푸란 (DHF), HMFCA, FFCA 및 2,5-디포르밀 푸란 (DFF)으로 이루어진 군으로부터 선택되며, 이 중 HMF가 가장 바람직하고, 여기서 FDCA의 푸란계 전구체는 하나 이상의 헥소스 당, 바람직하게는 리그노셀룰로스 바이오매스로부터 수득된 하나 이상의 헥소스 당으로부터, 바람직하게는 산-촉매화된 탈수에 의해 수득되고, 여기서 바람직하게는 FDCA는 산 침전 후에 냉각 결정화 및/또는 용매 추출을 포함하는 공정에 의해 배지로부터 회수되는 것인, FDCA를 제조하는 방법에 관한 것이다. 바람직하게는, 상기 방법에서, 배지는 2.0 내지 3.0의 범위의 pH를 가지며, 여기서 바람직하게는 FDCA는 그것이 제조되는 산성 배지로부터 침전되고, 산 침전 후에 냉각 결정화를 포함하는 공정에 의해 배지로부터 회수된다.

또 다른 측면에서 본 발명은 a) 본 발명에 따른 방법으로 FDCA 단량체를 제조하는 단계; 및, b) a)에서 수득된 FDCA 단량체로부터 중합체를 제조하는 단계를 포함하는, 적어도 2개의 FDCA 단량체로부터 중합체를 제조하는 방법이며, 여기서 바람직하게는 중합체가 FDCA 단량체와 디올 단량체를 혼합하고 FDCA와 디올 단량체가 중합되는 조건하에 상기 혼합물을 가져옴으로써 제조되는 것인 방법에 관한 것이다.

최종 측면에서, 본 발명은 푸란계 전구체 중 하나 이상의 FDCA로의 생체형질전환을 위한 본 발명에 따른 진균 세포, 또는 FDCA의 푸란계 전구체를 FDCA로 전환시키는 능력을 가진 하나 이상의 박테리아 효소를 발현하는 진균 세포의 용도로서, 여기서 바람직하게는, FDCA의 적어도 하나의 푸란계 전구체가 HMF, DHF, HMFCA, FFCA 및 DFF로 이루어진 군으로부터 선택되며, 이 중 HMF가 가장 바람직한 것인, 용도에 관한 것이다.

발명의 설명

정의

용어 "상동성", "서열 동일성" 등은 본원에서 상호교환적으로 사용된다. 서열 동일성은 본원에서 서열을 비교함으로써 결정된 바와 같이, 2개 이상의 아미노산 (폴리펩티드 또는 단백질) 서열 또는 2개 이상의 핵산 (폴리뉴클레오티드) 서열 사이의 관계로서 정의된다. 관련 기술분야에서, "동일성"은 또한, 경우에 따라, 이러한 서열의 스트링 사이의 일치에 의해 결정되는 바와 같이, 아미노산 또는 핵산 서열 사이의 서열 관련성의 정도를 의미한다. 2개의 아미노산 서열 사이의 "유사성"은 하나의 폴리펩티드의 아미노산 서열 및 그의 보존된 아미노산 치환물을 제2 폴리펩티드의 서열과 비교함으로써 결정된다. "동일성"및 "유사성"은 공지된 방법에 의해 용이하게 계산될 수 있다.

"서열 동일성" 및 "서열 유사성"은 2개의 서열의 길이에 따라, 전반적인 또는 국소 정렬 알고리즘을 사용하여 2개의 펩티드 또는 2개의 뉴클레오티드 서열의 정렬에 의해 결정될 수 있다. 유사한 길이의 서열은 바람직하게는 전체 길이에 걸쳐 서열을 최적으로 정렬하는 전반적인 정렬 알고리즘 (예를 들어, 니들먼 분취(Needleman Wunsch))을 사용하여 정렬되며, 한편 실질적으로 상이한 길이의 서열은 바람직하게는 국소 정렬 알고리즘 (예를 들어 스미스 워터만(Smith Waterman))을 사용하여 정렬된다. 그 다음에 서열은 이들이 (예를 들어, 디폴트 파라미터를 사용하여 프로그램 GAP 또는 BESTFIT에 의해 최적으로 정렬되는 경우) 적어도 특정 최소한 백분율의 서열 동일성 (하기 정의된 바와 같이)을 공유하는 경우 "실질적으로 동일한" 또는 "본질적으로 유사한"으로 지칭될 수 있다. GAP는 니들먼 및 분취의 전반적인 정렬 알고리즘을 사용하여 2개의 서열을 그의 전체 길이 (전장)에 걸쳐 정렬하여, 일치의 수를 최대화하고 간격의 수를 최소화한다. 전반적인 정렬은 2개의 서열이 유사한 길이를 갖는 경우 서열동일성을 결정하는데 적합하게 사용된다. 일반적으로, 갭 생성 페널티 = 50 (뉴클레오티드) / 8 (단백질) 및 갭 확장 페널티 = 3 (뉴클레오티드) / 2 (단백질)로 GAP 디폴트 파라미터가 사용된다. 뉴클레오티드의 경우, 사용된 디폴트 스코어링 매트릭스는 nwsgapdna이고, 단백질의 경우 디폴트 스코어링 매트릭스는 Blosum62이다 (Henikoff & Henikoff, 1992, PNAS 89, 915-919). 서열 동일성 백분율에 대한 서열 정렬 및 점수는 컴퓨터 프로그램, 예컨대 GCG 위스콘신 패키지(Wisconsin Package), 버전 10.3 (엑설리스 인크.(Accelrys Inc.) (미국 캘리포니아주 92121-3752 샌디에고, 스크랜튼 로드 9685)로부터 입수 가능)을 사용하거나, 오픈 소스 소프트웨어, 예컨대 프로그램 "니들" (전반적인 니들먼 분취 알고리즘) 또는 "워터" (국소 스미스 워터만 알고리즘) (엠보스윈(EmbossWIN) 버전 2.10.0으로)를 사용하거나, 상기 GAP의 경우와 동일한 파라미터를 사용하거나, 디폴트 설정을 사용하여 결정될 수 있다 ('니들' 및 '워터' 둘 다에 대해 및 단백질 및 DNA 정렬 둘 다에 대해, 디폴트 갭 개방 페널티는 10.0이고 디폴트 갭 확장 페널티는 0.5이며; 디폴트 스코링 매트릭스는 단백질의 경우 Blossum62이고 DNA의 경우 DNAFull이다). 서열이 실질적으로 상이한 전체 길이를 갖는 경우, 스미스 워터만 알고리즘을 사용하는 것들과 같은 국소 정렬이 바람직하다.

대안적으로 백분율 유사성 또는 동일성은 FASTA, BLAST 등과 같은 알고리즘을 사용하여, 공개 데이터베이스를 검색함으로써 결정될 수 있다. 따라서, 본 발명의 핵산 및 단백질 서열은, 예를 들어, 다른 패밀리 구성원 또는 관련 서열을 확인하기 위해, 공개 데이터베이스에 대한 검색을 수행하기 위한 "조회(query) 서열"로서 추가로 사용될 수 있다. 이러한 검색은 문헌 [Altschul, et al. (1990) J. Mol. Biol. 215:403―10]의 BLASTn 및 BLASTx 프로그램 (버전 2.0)을 사용하여 수행할 수 있다. BLAST 뉴클레오티드 검색은 NBLAST 프로그램, 점수 = 100, 단어 길이 = 12로 수행되어 본 발명의 옥시도리덕타제 핵산 분자에 상동인 뉴클레오티드 서열을 수득할 수 있다. BLAST 단백질 검색은 BLASTx 프로그램, 점수 = 50, 단어 길이 = 3으로 수행되어 본 발명의 단백질 분자에 상동인 아미노산 서열을 수득할 수 있다. 비교 목적으로 갭트(gapped) 정렬을 수득하기 위해, 갭트(Gapped) BLAST는 문헌 [Altschul et al., (1997) Nucleic Acids Res. 25(17): 3389-3402]에 기재된 바와 같이 이용할 수 있다. BLAST 및 갭트 BLAST 프로그램을 이용할 때, 각각의 프로그램의 디폴트 파마미터 (예를 들어, BLASTx 및 BLASTn)를 사용할 수 있다. http://www.ncbi.nlm.nih.gov/에서 국립 생명공학 정보 센터의 홈페이지를 참조.

임의로, 아미노산 유사성의 정도를 결정하는데 있어서, 통상의 기술자는 통상의 기술자에게 명백한 바와 같이, 소위 "보존적" 아미노산 치환을 또한 고려할 수 있다. 보존적 아미노산 치환은 유사한 측쇄를 갖는 잔기의 상호교환성을 지칭한다. 보존적 치환을 위한 아미노산 잔기 부류의 예를 하기 표에 제공하였다.

대안적인 보존적 아미노산 잔기 치환 부류.

아미노산 잔기의 대안적인 물리적 및 기능적 분류.

본원에 사용된 바와 같이, 용어 "선택적으로 하이브리드화하는", "선택적으로 하이브리드화하다" 및 유사한 용어는 서로에 대해 적어도 66%, 적어도 70%, 적어도 75%, 적어도 80%, 더 바람직하게는 적어도 85%, 더욱 더 바람직하게는 적어도 90%, 바람직하게는 적어도 95%, 더 바람직하게는 적어도 98% 또는 더 바람직하게는 적어도 99%인 상동인 뉴클레오티드 서열이 전형적으로 서로 하이브리드화된 채로 존재하는 하이브리드화 및 세척을 위한 조건을 기재하고자 한다. 즉, 이러한 하이브리드화 서열은 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65, 적어도 70%, 적어도 75%, 적어도 80%, 더 바람직하게는 적어도 85%, 더욱 더 바람직하게는 적어도 90%, 더 바람직하게는 적어도 95%, 더 바람직하게는 적어도 98% 또는 더 바람직하게는 적어도 99% 서열 동일성을 공유할 수 있다.

이러한 하이브리드화 조건의 바람직한, 비제한적 예는 약 45℃에서 6X 염화나트륨/시트르산나트륨 (SSC) 중에서의 하이브리드화, 이어서 약 50℃에서, 바람직하게는 약 55℃에서, 바람직하게는 약 60℃에서, 더욱 더 바람직하게는 약 65℃에서 1 X SSC, 0.1% SDS에서 1회 이상의 세척이다.

매우 엄격한 조건은, 예를 들어, 5x SSC/5x 덴하르트 용액 / 1.0% SDS 중에서 약 68℃에서의 하이브리드화 및 실온에서 0.2x SSC/0.1% SDS 중에서의 세척을 포함한다. 대안적으로, 세척은 42℃에서 수행될 수 있다.

통상의 기술자는 엄격하고 매우 엄격한 하이브리드화 조건에 어떤 조건을 적용해야 하는지 알 것이다. 이러한 조건에 관한 추가 지침은 관련 기술분야에서, 예를 들어 문헌 [Sambrook et al., s readily available in the art, for example, in Sambrook et al., 1989, Molecular Cloning, A Laboratory Manual, Cold Spring Harbor Press, N.Y.; and Ausubel et al. (eds.), Sambrook and Russell (2001) "Molecular Cloning: A Laboratory Manual (3^rd edition), Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, New York 1995, Current Protocols in Molecular Biology, (John Wiley & Sons, N.Y.)]에서 용이하게 입수가능하다.

물론, 폴리 A 서열 (예컨대 mRNA의 3' 말단 폴리(A) 트랙)에만, 또는 T (또는 U)의 상보적인 스트레치에 하이브리드화하는 폴리뉴클레오티드는, 본 발명의 핵산의 일부에 특이적으로 하이브리드화하기 위해 사용되는 본 발명의 폴리뉴클레오티드에 포함되지 않을 것인데, 그 이유는 이러한 폴리뉴클레오티드는 폴리(A) 스트레치 또는 그의 보체 (예를 들어, 실제로 임의의 이중-가닥 cDNA 클론)를 함유하는 임의의 핵산 분자에 하이브리드화할 것이기 때문이다.

"핵산 구축물 "또는 "핵산 벡터"는 본원에서 재조합 DNA 기술의 사용으로 인한 인공 핵산 분자를 의미하는 것으로 이해된다. 따라서 용어 "핵산 구축물"은 자연 발생적 핵산 분자를 포함하지 않지만, 핵산 구축물은 (일부의) 자연 발생적 핵산 분자를 포함할 수 있다. 용어 "발현 벡터" 또는 "발현 구축물"은 숙주 세포 또는 뉴클레오티드 서열과 접합성인 숙주 유기체에서 유전자의 발현을 수행할 수 있는 이러한 뉴클레오티드 서열을 지칭한다. 이들 발현 벡터는 전형적으로 적어도 적합한 전사 조절 서열 및 임의로, 3' 전사 종결 신호를 포함한다. 발현 인핸서 요소와 같은, 발현을 수행하는데 필요하거나 도움을 주는 추가적인 인자가 또한 존재할 수 있다. 발현 벡터는 적합한 숙주 세포에 도입되고 숙주 세포의 시험관내 세포 배양에서 코딩 서열의 발현을 수행할 수 있을 것이다. 발현 벡터는 본 발명의 숙주 세포 또는 유기체에서의 복제에 적합할 것이다.

본원에 사용된 바와 같이, 용어 "프로모터" 또는 "전사 조절 서열"은 하나 이상의 코딩 서열의 전사를 제어하는 기능을 하며, 코딩 서열의 전사 개시 부위의 전사 방향과 관련하여 상류에 위치하는 핵산 단편을 지칭하며, 전사 인자 결합 부위, 리프레서 및 활성인자 단백질 결합 부위, 및 프로모터로부터의 전사의 양을 조절하기 위해 직접적으로 또는 간접적으로 작용하는 것으로 관련 기술분야의 통상의 기술자에게 공지된 뉴클레오티드의 임의의 다른 서열을 포함하나 이에 제한되지 않는, DNA-의존성 RNA 폴리머라제에 대한 결합 부위, 전사 개시 부위 및 임의의 다른 DNA 서열의 존재에 의해 구조적으로 확인된다. "구성적" 프로모터는 대부분의 생리학적 및 발달 조건하에 대부분의 조직에서 활성인 프로모터이다. "유도성" 프로모터는, 예를 들어 화학적 유도인자의 적용에 의해, 예를 들어 생리학적으로 또는 발달적으로 조절되는 프로모터이다.

용어 "선택 가능한 마커"는 관련 기술분야의 통상의 기술자에게 친숙한 용어이며, 발현시, 선택 가능한 마커를 함유하는 세포 또는 세포들을 선택하기 위해 사용될 수 있는 임의의 유전적 실체를 설명하기 위해 본원에서 사용된다. 용어 "리포터"는 마커와 상호교환적으로 사용될 수 있지만, 이는 녹색 형광 단백질 (GFP)과 같은 가시적인 마커를 지칭하기 위해 주로 사용된다. 선택 가능한 마커는 우성 또는 열성이거나 양방향일 수 있다.

본원에 사용된 바와 같이, 용어 "작동 가능하게 연결된"은 기능적 관계에서 폴리뉴클레오티드 요소의 연결을 지칭한다. 핵산은 그것이 또다른 핵산 서열과 기능적 관계에 놓일 경우 "작동 가능하게 연결"된다. 예를 들어, 전사 조절 서열은 그것이 코딩 서열의 전사에 영향을 미치는 경우 코딩 서열에 작동 가능하게 연결된다. 작동 가능하게 연결된다는 것은 연결되는 DNA 서열이 전형적으로 연속적이며, 두 단백질 코딩 영역을 연결시키는데 필요한 경우 연속적이며 판독 프레임에 있음을 의미한다.

용어 "단백질" 또는 "폴리펩티드"는 상호교환적으로 사용되며 특정 작용 방식, 크기, 3차원 구조 또는 기원을 언급하지 않고, 아미노산의 쇄로 이루어진 분자를 지칭한다.

용어 "유전자"는 적합한 조절 영역 (예를 들어 프로모터)에 작동 가능하게 연결된 세포에서 RNA 분자 (예를 들어, mRNA)로 전사되는 영역 (전사 영역)을 포함하는 DNA 단편을 의미한다. 유전자는 대개 몇몇 작동 가능하게 연결된 단편, 예컨대 프로모터, 5' 리더 서열, 코딩 영역 및 폴리아데닐화 부위를 포함하는 3'-비번역 서열 (3'- 말단)을 포함할 것이다. "유전자의 발현"은 적절한 조절 영역, 특히 프로모터에 작동 가능하게 연결된 DNA 영역이 생물학적으로 활성인, 즉 생물학적으로 활성인 단백질 또는 펩티드로 번역될 수 있는 RNA로 전사되는 과정을 지칭한다. 주어진 (재조합) 핵산 또는 폴리펩티드 분자와 주어진 숙주 유기체 또는 숙주 세포 사이의 관계를 나타내기 위해 사용되는 경우 용어 "상동성"은, 본질적으로 핵산 또는 폴리펩티드 분자는 동일한 종, 바람직하게는 동일한 변종 또는 균주의 숙주 세포 또는 유기체에 의해 생성됨을 의미하는 것으로 이해된다. 숙주 세포에 대해 상동성인 경우, 폴리펩티드를 코딩하는 핵산 서열은 그의 자연 환경에서보다 전형적으로 (반드시 그런 것은 아니라) 또 다른 (이종) 프로모터 서열, 및 적용 가능한 경우, 또 다른 (이종) 분비 신호 서열 및/또는 종결자 서열에 작동 가능하게 연결될 것이다. 조절 서열, 신호 서열, 종결자 서열 등은 숙주 세포와 또한 상동성일 수 있는 것으로 이해된다. 이 맥락에서, 오직 "상동성" 서열 요소의 사용은 "자기-복제된" 유전자 변형 유기체 (GMO)의 구축을 허용한다 (자기-복제는 본원에서 유럽 지침(European Directive) 98/81/EC 부록 II에서와 같이 정의됨). 2개의 핵산 서열의 관련성을 나타내기 위해 사용되는 경우, 용어 "상동성"은 하나의 단일-가닥 핵산 서열이 상보적인 단일-가닥 핵산 서열에 하이브리드화될 수 있음을 의미한다. 하이브리드화의 정도는 나중에 논의되는 바와 같이, 서열 사이의 동일성의 양 및 하이브리드화 조건, 예컨대 온도 및 염 농도를 포함한 다수의 인자에 의존할 수 있다.

핵산 (DNA 또는 RNA) 또는 단백질과 관련하여 사용되는 경우 용어 "이종" 및 "외인성"은 그것이 존재하는 유기체, 세포, 게놈 또는 DNA 또는 RNA 서열의 일부로서 자연적으로 발생하지 않는 핵산 또는 단백질, 또는 그것이 자연에서 발견되는 것과는 상이한 게놈 또는 DNA 또는 RNA 서열의 위치 또는 위치들 또는 세포에서 발견되는 핵산 또는 단백질을 지칭한다. 이종 및 외인성 핵산 또는 단백질은 그것이 도입되는 세포에 대해 내인성이지 않으나, 또 다른 세포로부터 수득되거나 합성적으로 또는 재조합적으로 생산된다. 일반적으로, 반드시 그런 것은 아니지만, 이러한 핵산은 DNA가 전사되거나 발현되는 세포에 의해 정상적으로 생성되지 않는 단백질, 즉 외인성 단백질을 코딩한다. 유사하게 외인성 RNA는 외인성 RNA가 존재하는 세포에서 정상적으로 발현되지 않는 단백질을 코딩한다. 이종/외인성 핵산 및 단백질은 또한 외래 핵산 또는 단백질로 지칭될 수 있다. 관련 기술분야의 통상의 기술자가 그것이 발현되는 세포에 외래물질로서 인식할 임의의 핵산 또는 단백질은 본원에서 용어 이종 또는 외인성 핵산 또는 단백질에 의해 포함한다. 용어 이종 및 외인성은 또한 핵산 또는 아미노산 서열의 비천연 조합, 즉 조합된 서열 중 적어도 2개가 서로에 대해 외래인 조합에 적용된다.

효소의 "특이적 활성"은 대개 총 숙주 세포 단백질 mg당 효소 활성의 단위로 표현되는, 본원에서 총 숙주 세포 단백질의 양당 특정 효소의 활성의 양을 의미하는 것으로 이해된다. 본 발명의 맥락에서, 특정 효소의 특이적 활성은 (그렇지 않으면 동일한) 야생형 숙주 세포에서 그 효소의 특이적 활성과 비교하여 증가 또는 감소될 수 있다.

"푸란계 화합물"은 본원에서 2,5-푸란-디카르복실산 (FDCA)뿐만 아니라 FDCA로 산화될 수 있는 푸란 기를 갖는 임의의 화합물로 이해되며, 후자는 본원에서 "FDCA의 전구체" 또는 "FDCA의 푸란계 전구체"로서 지칭된다. FDCA의 전구체는 적어도 다음을 포함한다: 5-히드록시메틸푸르푸랄 (HMF), 2,5-디히드록시메틸 푸란 (DHF) 또는 2,5-비스(히드록시메틸)푸란 (BHF) (HMF-OH로서 지칭됨), 5-히드록시메틸-2-푸란카르복실산 또는 5-히드록시메틸-2-푸로산 (HMFCA), 5-포르밀-2-푸로산 (FFCA), 및 2,5-디포르밀 푸란 (DFF). "푸란 화합물"에서, 푸란 고리 또는 임의의 또는 그의 치환 가능한 측기는, 예를 들어 임의의 이용 가능한 위치 상의 푸란 고리에서, 시클릭 기를 포함한, OH, C1-C10 알킬, 알킬, 알릴, 아릴 또는 RO- 에테르 모이어티로 치환될 수 있는 것으로 추가로 이해된다.

"호기성 조건" "호기 조건(Oxic condition)" 또는 호기성 또는 호기 발효 공정은 본원에서 산소의 존재하에 시행되고 바람직하게는 적어도 0.5, 1, 2, 5, 10, 20 또는 50 mmol/L/h의 속도로 산소가 소비되고, 유기 분자가 전자 공여체로서 작용하고 산소가 전자 수용체로서 작용하는 조건 또는 발효 공정으로서 정의된다.

"혐기성 또는 무산소 조건" 또는 "혐기성 또는 무산소 발효 공정"은 본원에서 실질적으로 산소의 부재하에 시행되고, 유기 분자가 전자 공여체 및 전자 수용체 둘 다로서 작용하는 조건 또는 발효 공정으로서 정의된다. 무산소 조건하에, 실질적으로 어떤 산소도 소비되지 않으며, 바람직하게는 5, 2, 1, 또는 0.5 mmol/L/h 미만, 더 바람직하게는 0 mmol/L/h가 소비되거나 (즉, 산소 소비가 검출되지 않음), 또는 실질적으로 어떤 용존 산소도 발효 배지에서 검출될 수 없고, 바람직하게는 배지에서의 용존 산소 농도는 공기 포화도의 2, 1, 0.5, 0.2, 0.1% 미만, 즉 상업적 산소 프로브의 검출 한계 미만이다.

본원에서 공개 서열 데이터베이스에서 접근 가능한 뉴클레오티드 또는 아미노산 서열에 대한 임의의 언급은 본 문서의 출원일에 이용 가능한 서열 항목(entry)의 버전을 지칭한다.

실시양태의 설명

모 숙주 세포

본 발명은 숙주 세포가 적합한 푸란계 전구체로부터 2,5-푸란디카르복실산 (FDCA)을 생성할 수 있도록 숙주 세포의 유전자 변형에 관한 것이다. 이를 위해 본 발명에 따라 다수의 유전자 변형이 모 숙주 세포에 도입될 수 있다. 이들 변형은 다수의 이종 유전자의 발현의 도입, 뿐만 아니라, 일부 내인성 유전자의 감소 또는 제거에 의해 및/또는 다른 내인성 유전자의 발현, 즉 과발현의 증가에 의해, 모 숙주 세포에 이미 존재하는 다수의 내인성 유전자의 발현의 변형을 포함한다. 이들 유전자 변형은 이하에 추가로 설명된다. 따라서, 모 숙주 세포는 본 발명에 따른 유전자 변형 중 어느 하나가 숙주 세포에 도입되기 전에 숙주 세포인 것으로 이해된다.

본 발명의 모 숙주 세포는 바람직하게는 푸란계 화합물을 대사하는 능력을 자연적으로 갖는 숙주 세포이다. 더 바람직하게는 모 숙주 세포는 적어도 FDCA를 분해하는 자연적인 능력을 갖는다. 본 발명의 모 숙주 세포는 HMF를 FDCA로 산화시키는 자연 능력을 추가로 가질 수 있다. 주어진 숙주 세포 균주가 HMF를 FDCA로 산화시키는 능력 및/또는 FDCA를 분해하는 능력을 자연적으로 갖는지의 여부는 예를 들어 본원의 실시예에 기재된 바와 같이, 바람직하게는 단독 탄소원으로서 HMF, HMF-알콜, HMFCA 및 FDCA 중 하나 이상을 희생하여 성장하는 균주의 능력을 결정함으로써 시험될 수 있다. 바람직하게는, 모 숙주 세포는 FDCA의 분해를 촉매하는 효소를 코딩하는 내인성 유전자를 포함한다. 바람직하게는 내인성 유전자는 FDCA의 분해를 촉매하는 효소를 발현하는 기능성 유전자이다. 바람직하게는, FDCA의 분해를 촉매하는 효소는 본원에 추가로 정의된 바와 같은 FDCA-탈카르복실화 모노옥시게나제이다.

본 발명의 모 숙주 세포는 예를 들어 진핵 세포, 예컨대 포유동물, 곤충, 식물, 진균, 또는 조류 세포를 포함한, 임의의 적합한 숙주 세포일 수 있다. 그러나, 바람직하게는, 숙주 세포는 미생물 세포이다. 미생물 숙주 세포는 원핵 세포, 바람직하게는 예를 들어 그람-음성 및 그람-양성 미생물 둘 다를 포함한, 박테리아 세포일 수 있다.

그러나, 더 바람직하게는, 본 발명의 모 숙주 세포는 진핵 미생물 숙주 세포, 예컨대 예를 들어 진균 숙주 세포이다. 본 발명에 따라 변형될 가장 바람직한 모 숙주 세포는 효모 또는 사상균 숙주 세포이다.

"진균"은 본원에서 진핵 미생물로서 정의되며, 아문 에우미코티나(subdivision Eumycotina)의 모든 종을 포함한다 (Alexopoulos, C. J., 1962, In: Introductory Mycology, John Wiley & Sons, Inc., New York)를 포함한다. 용어 "진균류" 및 "진균의"는 사상균 및 효모 둘 다를 포함하거나 지칭한다.

"사상균"은 본원에서 아문 에우미코티나 및 오오미코타(Oomycota)의 모든 사상균을 포함하는 진핵 미생물로 정의된다 (["Dictionary of The Fungi", 10th edition, 2008, CABI, UK, www.cabi.org]에 정의된 바와 같이). 사상균은 키틴, 셀룰로스, 글루칸, 키토산, 만난, 및 기타 복합 다당류로 구성된 균사 벽을 특징으로 한다. 식물 성장은 균사 신장에 의한 것이고 탄소 이화작용은 반드시 호기성이다. 사상균 균주는 아크레모니움, 아스페르길루스, 아우레오바시디움, 크립토코쿠스, 필리바시디움, 푸사리움, 후미콜라, 마그나포르테, 무코르, 미셀리오프토라, 네오칼리마스틱스, 뉴로스포라, 파에실로미세스, 페니실리움, 피로미세스, 스키조필룸, 탈라로미세스, 써모아스쿠스, 티엘라비아, 톨리포클라디움, 트리코더마, 및 우스틸라고의 균주를 포함하나, 이에 제한되지는 않는다.

본 발명의 모 숙주 세포로서 바람직한 사상균 종은 아스페르길루스, 미셀리오프토라, 페니실리움, 탈라로미세스 또는 트리코더마 속의 종, 그리고 더 바람직하게는 아스페르길루스 니게르, 아스페르길루스 아와모리, 아스페르길루스 포에티두스, 아스페르길루스 소자에, 아스페르길루스 푸미가투스, 탈라로미세스 에메르소니이, 아스페르길루스 오리자에, 미셀리오프토라 테르모필라, 트리코더마 레에세이, 페니실리움 크리소게눔, 페니실리움 심플리시시뭄 및 페니실리움 브라실리아눔으로부터 선택된 종에 속한다. 이들 사상균 종의 적합한 균주는 통상의 기술자에게 자체 공지된 기탁 기관으로부터 입수 가능하다.

"효모"는 본원에서 진핵 미생물로서 정의되며, 단세포 형태로 우세하게 성장하는 아문 에우미코티나의 모든 종을 포함한다 (Yeasts: characteristics and identification, J.A. Barnett, R.W. Payne, D. Yarrow, 2000, 3rd ed., Cambridge University Press, Cambridge UK; 및, The yeasts, a taxonomic study, CP. Kurtzman and J.W. Fell (eds) 1998, 4th ed., Elsevier Science Publ. B.V., Amsterdam, The Netherlands). 효모는 단세포 엽상체의 출아에 의해 성장할 수 있거나 유기체의 분열에 의해 성장할 수 있다. 본 발명에 사용하기에 바람직한 효모 세포는 속 사카로미세스, 클루이베로미세스, 칸디다, 피치아, 스키조사카로미세스, 한세눌라, 클로에케라, 쉬완니오미세스, 야로위아, 크립토코쿠스, 데바로미세스, 사카로미세콥시스, 사카로미코데스, 위케르하미아, 데바요미세스, 한세니아스포라, 오가타에아, 쿠라이쉬아, 코마가타엘라, 메트쉬니코위아, 윌리옵시스, 나카자와에아, 토룰라스포라, 불레라, 로도토룰라, 및 스포로볼로미세스에 속한다. 모 효모 숙주 세포는 자연적으로 혐기성 발효, 더 바람직하게는 알콜 발효, 가장 바람직하게는 혐기성 알콜 발효가 가능한 세포일 수 있다. 더 바람직하게는 클루이베로미세스 락티스, 에스. 세레비시아에, 한세눌라 폴리모르파 (신규 명칭: 오가타에아 헨리시이(Ogataea henricii)), 야로위아 리폴리티카, 칸디다 트로피칼리스 및 피치아 파스토리스 (신규 명칭: 코마가타엘라 파스토리스(Komagataella pastoris))와 같은 종으로부터의 효모.

특히, 박테리아와 비교시, 진균은, 예를 들어, 산, 에탄올 및 기타 유해한 화합물에 대한 그의 높은 내성, 그의 높은 삼투-내성, 그의 높은 발효 용량 및 일부 효모의 경우 그의 혐기성 성장 능력을 포함한, 산업 발효 공정에 대한 많은 매력적인 특징을 갖는다.

숙주 세포는 추가로 바람직하게는 낮은 pH에 대한 높은 내성을 가지며, 즉 5.0, 4.0, 3.5, 3.2, 3.0, 2.9, 2.8, 2.7, 2.6, 2.5, 2.4, 2.3 또는 2.28 이하의 pH에서 성장할 수 있으며 및 락트산, 아세트산 또는 포름산 및 푸란산과 같은 유기산에 대해 높은 내성을 갖고 승온에 대해 높은 내성을 갖는다. 숙주 세포의 이들 특징 또는 활성 중 어느 것도 숙주 세포에 자연적으로 존재할 수 있거나 유전자 변형, 바람직하게는 자기 복제에 의해 또는 하기 기재된 본 발명의 방법에 의해 도입되거나 변형될 수 있다.

적합한 세포는 배양된 세포, 발효 과정에서 예를 들어 침지된 또는 고상 발효에서 배양될 수 있는 세포이다.

본 발명에 따른 진균 숙주 세포에서 제조된 화합물의 구체적 용도를 위해, 이러한 용도에 따라 숙주 세포를 선택할 수 있다. 예를 들어 본 발명에 따른 숙주 세포에서 제조된 화합물이 식품 적용에서 사용될 경우, 숙주 세포는 식품-등급 유기체 예컨대 예를 들어 사카로미세스 종, 예를 들어 에스. 세레비시아에, 식품-등급 페니실리움 종 또는 야로위아 리폴리티카로부터 선택될 수 있다. 구체적 용도는 식품, (동물) 사료, 제약, 농업, 예컨대 농작물-보호, 및/또는 개인 관리 적용을 포함하나, 이에 제한되지는 않는다.

유전자 변형 세포

제1 측면에서, 본 발명은 세포, 바람직하게는 유전자 변형을 포함하는 진균 세포에 관한 것이다. 세포의 유전자 변형은 바람직하게는 유전자 변형이 결핍된 상응하는 야생형 세포와 비교하여, 2,5-푸란디카르복실산 (FDCA)의 분해를 촉매하는 효소의 특이적 활성을 감소시키거나 제거하는 적어도 유전자 변형이다.

본 발명의 세포는, a) 유전자 변형이 결핍된 상응하는 야생형 세포와 비교하여, 세포에 5-히드록시메틸-2-푸란카르복실산 (HMFCA)을 5-포르밀-2-푸로산 (FFCA)으로 산화시키는 능력을 부여하거나 세포에서 HMFCA를 FFCA로 산화시키는 효소의 특이적 활성을 증가시키는 유전자 변형; 및/또는, b) 유전자 변형이 결핍된 상응하는 야생형 세포와 비교하여, 세포에 푸란계 알데히드를 상응하는 푸란계 카르복실산으로 산화시키는 능력을 부여하거나 세포에서 푸란계 알데히드를 상응하는 푸란계 카르복실산으로 산화시키는 효소의 특이적 활성을 증가시키는 유전자 변형 중 적어도 하나를 추가로 바람직하게 포함한다.

이들 유전자 변형을 갖는 바람직한 세포는 하기에 본원에 추가로 특정된다.

특이적 2,5-푸란디카르복실산 (FDCA) 탈카르복실화 모노옥시게나제 활성의 감소 또는 제거

본 발명의 세포는 바람직하게는 FDCA를 분해하는 능력이 결핍된 세포이다. 본 발명의 세포는 대개 FDCA를 분해하는 능력을 자연적으로 갖는 진균 종의 유전자 변형된 세포일 것이며, 이 세포는 FDCA를 분해하는 그의 자연적인 능력을 감소시키거나 제거하도록 유전자 변형되었다. 주어진 진균 균주가 FDCA를 분해하는 능력을 자연적으로 갖는지의 여부는 예를 들어 본원의 실시예에 기재된 바와 같이, 단독 탄소원으로서 HMF, HMF-알콜, HMFCA 및 FDCA 중 하나 이상을 희생하여 성장하는 균주 능력을 결정함으로써 시험될 수 있다. FDCA를 분해하는 능력을 자연적으로 갖는 진균 종의 예는 본원의 실시예에 나타낸 바와 같은 페니실리움 브라실리아눔 또는 아스페르길루스 니게르이다 (Rumbold et al., 2010, Bioengineered Bugs 1:5, 359-366). 대조적으로, 사카로미세스 및 야로위아 종과 같은 효모는 FDCA를 분해하는 능력이 자연적으로 결핍된 진균 종의 예이다.

따라서, 본 발명의 한 실시양태에서, 세포는 FDCA를 분해하는 세포의 자연 능력을 감소시키거나 제거하도록 유전자 변형된다. FDCA를 분해하는 세포의 능력을 감소시키거나 제거하기 위해 변형될 유전자는 바람직하게는 FDCA 탈카르복실화 모노옥시게나제를 코딩하는 유전자이다.

본 발명의 세포에서 특이적 FDCA 탈카르복실화 모노옥시게나제 활성을 감소시키거나 제거하기 위해 변형될 FDCA 탈카르복실화 모노옥시게나제를 코딩하는 유전자는, 바람직하게는 서열번호: 4 (hmfK1) 중 적어도 하나에 대해 적어도 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 95, 96, 97, 98, 99 또는 100% 서열 동일성을 가진 아미노산 서열을 코딩하는 유전자이다. 세포에서 특이적 FDCA 탈카르복실화 모노옥시게나제 활성을 감소시키거나 제거하기 위해 변형될 적합한 hmfK1 병렬상동체는 예를 들어 XP 001397353.2 (서열번호: 26)를 가진 아스페르길루스 니게르 hmfK1 병렬상동체이다. 본 발명의 세포에서, 특이적 FDCA 탈카르복실화 모노옥시게나제 활성은 활성의 감소를 야기하는 유전자 변형을 제외하고는 유전적으로 동일한 균주의 세포와 비교하여 바람직하게는 적어도 1.05, 1.1, 1.2, 1.5, 2.0, 5.0, 10, 20, 50 또는 100배 만큼 감소된다.

페니실리움 브라실리아눔 hmfK1의 병렬상동체가 FDCA 탈카르복실화 모노옥시게나제 활성을 갖는 폴리펩티드를 코딩하는지의 여부는 FDCA를 분해할 수 없는 적합한 숙주 세포에서 폴리펩티드의 발현에 의해 그리고 폴리펩티드의 발현이 세포에 FDCA를 분해하는 능력을 부여하는지의 여부를 검출하는 것에 의해 검정할 수 있다. FDCA 탈카르복실화 모노옥시게나제 활성은, 예를 들어 PCT/EP2016/072406의 실시예에 기재된 바와 같이, 예를 들어 FDCA 탈카르복실화 모노옥시게나제에 대해 검정될 폴리펩티드를 코딩하는 뉴클레오티드 서열이 피. 푸티다 숙주 세포에서 발현되는 발현 구축물을 사용하고 형질전환체를 FDCA를 분해하는 그의 능력에 대해 시험함으로써 검정할 수 있다. 대안적으로, hmfK1 병렬상동체는 단독 탄소 공급원으로서 FDCA 상에서 성장하는 돌연변이체 능력을 회복시키는 그의 능력에 대해 시험함으로써 본원의 실시예에 기재된 바와 같이 페니실리움 브라실리아눔 hmfK1 ^- 파괴 돌연변이체를 보완하는 그의 능력에 대해 검정될 수 있다.

그의 특이적 활성이 본 발명의 세포에서 바람직하게는 감소 또는 제거되는, FDCA 탈카르복실화 모노옥시게나제를 코딩하는 본 발명의 뉴클레오티드 서열은, 그 자체가 관련 기술분야에 널리 공지된 뉴클레오티드 서열의 단리 방법을 사용하여, 진균, 효모 또는 박테리아, 예를 들어 상기 기재된 공급원 유기체와 동일한 문, 강 또는 속에 속하는 것의 게놈 및/또는 cDNA로부터 수득가능하고 동정될 수 있다 (예를 들어 문헌 [Sambrook and Russell (2001) "Molecular Cloning: A Laboratory Manual (3^rd edition), Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, New York)] 참조). 본 발명의 뉴클레오티드 서열은 예를 들어 a) 축퇴성 PCR 프라이머 (보존된 아미노산 서열을 기초로 설계됨)를 적합한 유기체의 게놈 및/또는 cDNA 상에서 사용하여 그의 특이적 활성이 바람직하게는 본 발명의 세포에서 감소되거나 제거되는 효소를 코딩하는 뉴클레오티드 서열의 일부를 포함하는 PCR 단편을 생성시키고; b) a)에서 수득된 PCR 단편을 프로브로서 사용하여 유기체의 cDNA 및/또는 게놈 라이브러리를 스크리닝하고; c) 그의 특이적 활성이 바람직하게는 본 발명의 세포에서 감소되거나 제거되는 효소를 코딩하는 뉴클레오티드 서열을 포함하는 cDNA 또는 게놈 DNA를 생성시키는 방법으로 수득가능하다. 이러한 보존된 서열은 표 4에 제시된 서열 정렬에서 확인될 수 있으며, 여기서 불변 위치는 "*"로 표시되고 강하게 보존된 위치는 ":"로 표시된다. 또한, 본 발명의 적합한 숙주 세포는 표 4로부터 유래될 수 있으며, 여기서 숙주는 바람직하게는 표 4에서 확인된 병렬상동체의 공급원 유기체와 동일한 문, 강, 목, 과 또는 속에 속하는 비병원성 진균 또는 효모이다. 표 4는 공개 데이터베이스에서 이용 가능한 바와 같이, 페니실리움 브라실리아눔 hmfK1과 그의 10개의 가장 가까운 병렬상동체의 아미노산 서열 정렬을 제시한다. 표 4A는 피. 브라실리아눔(P. brasilianum) 서열과 그의 병렬상동체 간의 백분율 아미노산 동일성, 뿐만 아니라 병렬상동체의 수탁 번호를 제공한다.

따라서 바람직한 실시양태에서, 본 발명은 유전자 변형이 결핍된 상응하는 모 세포와 비교하여, 세포에서 특이적 FDCA 탈카르복실화 모노옥시게나제 활성을 감소시키는 유전자 변형을 포함하는 진균 세포로서, 여기서 유전자 변형이 세포의 게놈으로부터 유전자의 코딩 서열 및 프로모터 중 적어도 하나의 적어도 일부의 결실에 의해 FDCA 탈카르복실화 모노옥시게나제를 코딩하는 내인성 유전자의 발현을 제거하는 것인 진균 세포에 관한 것이다. 바람직하게는 FDCA 탈카르복실화 모노옥시게나제 유전자의 코딩 서열의 적어도 일부는 세포의 게놈으로부터 결실되며, 예를 들어 코딩 서열의 적어도 10, 20, 30, 40, 50, 60, 70, 80, 90 또는 100%가 결실된다. 코딩 서열의 적어도 일부의 결실은 바람직하게는 번역 개시 코돈을 제거하는 결실 및/또는 프레임시프트를 야기하는 결실이다. 가장 바람직하게는 그러나 FDCA 탈카르복실화 모노옥시게나제를 코딩하는 내인성 유전자의 적어도 완전한 코딩 서열이 결실된다.

본 발명의 유전자 변형 진균 세포에서, FDCA 탈카르복실화 모노옥시게나제를 코딩하는 내인성 유전자의 모든 카피의 발현이 제거되는 것이 추가로 바람직하다. 따라서, 유전자 변형이 결핍된 상응하는 모 세포가 FDCA 탈카르복실화 모노옥시게나제를 코딩하는 유전자의 하나 초과의 내인성 카피를 포함하는 경우, 예를 들어 이배성 이수성 또는 다배수성 및/또는 유전자 증폭의 결과로서, 바람직하게는 FDCA 탈카르복실화 모노옥시게나제를 코딩하는 유전자의 각각 및 모든 카피의 발현이 제거된다.

진균 게놈으로부터 서열의 결실을 초래하는 방법 및 수단은 하기에 본원에 기재되어 있다.

본 발명의 유전자 변형 진균 세포는 HMF에 의해 유도되는 것으로 밝혀진 또 다른 히드록실라제, 즉 피. 브라실리아눔 hmfK3 코딩된 히드록실라제 또는 그의 병렬상동체의 특이적 활성을 감소시키거나 제거하는 유전자 변형을 추가로 포함할 수 있다. 비록 본원의 실시예에서 사용된 조건하에 피. 브라실리아눔에서 hmfK3-코딩된 히드록실라제의 파괴는 진균이 FDCA를 분해하는 능력에 영향을 미치지 않았긴 하였지만, 이는 다른 진균 및/또는 상이한 조건에서 상이할 수 있다. 이러한 상황에서, 본 발명의 진균 세포는 서열번호: 23 (hmfK3) 중 적어도 하나에 대해 적어도 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 95, 96, 97, 98, 99 또는 100% 서열 동일성을 가진 아미노산 서열을 포함하는 히드록실라제의 특이적 활성을 감소시키거나 제거하는 유전자 변형을 포함하는 것이 유용할 수 있다. 본 발명의 세포에서, 특이적 hmfK3-코딩된 히드록실라제 활성은 활성의 감소를 야기하는 유전자 변형을 제외하고는 유전적으로 동일한 균주의 세포와 비교하여 바람직하게는 적어도 1.05, 1.1, 1.2, 1.5, 2.0, 5.0, 10, 20, 50 또는 100배 만큼 감소된다.

그러나, 본원의 실시예는 hmfK1-코딩된 FDCA 탈카르복실화 모노옥시게나제의 파괴가 FDCA를 분해하는 세포의 능력을 제거하기에 충분하다는 것을 나타낸다. 따라서, 무손상 및/또는 기능적 내인성 hmfK3 유전자 또는 그의 병렬상동체를 포함하는 유전자 변형 진균 세포가 본 발명에 명백히 포함된다.

HMFCA 데히드로게나제 활성의 도입 또는 증가

본 발명의 세포는 바람직하게는 5-히드록시메틸-2-푸란카르복실산 (HMFCA)을 5-포르밀푸로산 (FFCA)으로 산화시키는 능력을 갖는 세포이다. HMFCA를 FFCA로 산화시키는 세포의 능력은, 예컨대 예를 들어 페니실리움 브라실리아눔에서, 세포의 내인성 활성일 수 있거나, 이는 예컨대 예를 들어 아스페르길루스 니게의 경우에, 세포에 부여되는 외인성 활성일 수 있다. 바람직하게는, HMFCA를 FFCA로 산화시키는 능력은 세포의 유전자 변형, 예를 들어 HMFCA를 FFCA로 산화시키는 능력을 갖는 데히드로게나제 또는 옥시다제를 코딩하는 뉴클레오티드 서열을 포함하는 핵산 구축물로 세포의 형질전환에 의해 세포에 부여되거나 세포에서 증가된다. 데히드로게나제는 바람직하게는 알콜 데히드로게나제 (즉, EC 1.1 활성을 가짐)이다. 따라서, 세포는 바람직하게는 HMFCA를 FFCA로 산화시키는 능력을 갖는 데히드로게나제 또는 옥시다제를 코딩하는 뉴클레오티드 서열의 발현을 위한 발현 구축물을 포함하는 세포이다. 본 발명의 바람직한 세포에서, 발현 구축물은 세포에서 발현될 수 있고, 데히드로게나제 또는 옥시다제의 발현은 발현 구축물이 결핍된 상응하는 세포, 예를 들어 야생형 세포와 비교하여, 바람직하게는 세포에서 HMFCA를 FFCA로 산화시키는 능력을 부여하거나 세포에서 HMFCA를 FFCA로 산화시키는 효소의 특이적 활성을 증가시킨다. HMFCA를 FFCA로 산화시키는 효소의 특이적 활성은 발현이 결핍된 상응하는 세포와 비교하여, 바람직하게는 세포에서 적어도 1.05, 1.1, 1.2, 1.5, 2.0, 5.0, 10, 20, 50 또는 100배만큼 증가된다.

HMFCA를 FFCA로 산화시키는 능력을 갖는 효소는 바람직하게는 알콜 데히드로게나제이다. HMFCA를 FFCA로 산화시키는 능력을 갖는 바람직한 효소는 HMFCA 데히드로게나제 활성을 갖는 알콜 데히드로게나제이다. 폴리펩티드가 HMFCA 데히드로게나제 활성을 갖는지의 여부는 HMFCA를 FFCA로 산화시킬 수 없는 적합한 숙주 세포에서 폴리펩티드의 발현에 의해 그리고 폴리펩티드의 발현이 세포에 HMFCA를 FFCA로 산화시키는 능력을 부여하는지의 여부를 검출하는 것에 의해 검정할 수 있다. HMFCA 데히드로게나제 활성은 예를 들어 HMFCA 데히드로게나제 활성에 대해 검정될 폴리펩티드를 코딩하는 뉴클레오티드 서열이 pBT'hmfH-adh에서 씨. 바실렌시스 hmfH 유전자를 대체하고 (WO2012/064195에 기재됨), 그 후 HMFCA 데히드로게나제 활성에 대해 검정될 폴리펩티드의 코딩 서열을 포함하는 플라스미드는 pJNNhmfT1(t)를 함유하는 피. 푸티다 KT2440Δgcd에 도입되는 (WO2012/064195에 또한 기재됨) 발현 구축물을 사용하여 검정될 수 있다. HMFCA 데히드로게나제 활성에 대해 검정될 폴리펩티드를 발현하는 피. 푸티다 형질전환체를 HMF와 함께 인큐베이션하고 샘플을 FDCA의 분석을 위해 규칙적인 간격으로 채취한다. HMFCA 데히드로게나제 활성에 대해 검정될 폴리펩티드가 결핍된 상응하는 피. 푸티다 형질전환체 (및 씨. 바실렌시스 hmfH 유전자)와 비교하여, FDCA의 생성 증가는 폴리펩티드가 HMFCA 데히드로게나제 활성을 가짐을 나타내는 것으로 여겨진다. 대안적으로, HMFCA 데히드로게나제 활성에 대해 검정될 폴리펩티드를 코딩하는 뉴클레오티드 서열은, 예를 들어 PCT/EP2016/072406의 실시예에 기재된 바와 같이 진균 숙주 세포, 바람직하게는 에스. 세레비시아에 숙주 세포에서 발현될 수 있으며, 폴리펩티드의 발현이 진균 숙주 세포에 HMF로부터 FFCA 및/또는 FDCA를 둘 다 생성하는 능력을 부여하는지의 여부를 검출할 수 있다.

본 발명의 세포에서 발현되는 HMFCA 데히드로게나제는 바람직하게는 아데닌 디뉴클레오티드, 예컨대 NADH 또는 NADPH, 플라빈 아데닌 디뉴클레오티드 (FAD), 플라빈 모노뉴클레오티드 (FMN), 및 피롤로퀴놀린 퀴놀론 (PQQ)으로부터 선택된 보조인자에 의존하는 데히드로게나제이다. 본 발명의 세포에서 발현되는 HMFCA 데히드로게나제는 바람직하게는 2가 양이온에 결합하고, 더 바람직하게는 HMFCA 데히드로게나제는 Zn-결합 데히드로게나제이다.

본 발명의 세포에서 발현되는 HMFCA 데히드로게나제는 추가로 바람직하게는 알콜 데히드로게나제이며, 이는 (또한) 다른 푸란계 알콜, 바람직하게는 2-위치에서 히드록시 기를 가진 푸란계 알콜을 상응하는 알데히드로 산화시키는 능력을 갖는다. 따라서, HMFCA 데히드로게나제는 바람직하게는 5-히드록시메틸푸르푸랄 (HMF)을 2,5-디포르밀 푸란 (DFF)으로 산화시키는 능력을 갖는다.

한 실시양태에서 HMFCA를 FFCA로 산화시키는 능력을 갖는 데히드로게나제를 코딩하는 뉴클레오티드 서열은 다음으로 이루어진 군으로부터 선택된다:

(a) HMFCA 데히드로게나제 활성을 가진 폴리펩티드를 코딩하는 뉴클레오티드 서열이며, 이 폴리펩티드가 서열번호: 1 및 2 (각각 hmfL1 및 hmfL2) 중 적어도 하나, 더 바람직하게는 서열번호: 1의 아미노산 서열과 적어도 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 95, 96, 97, 98, 99 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인, 뉴클레오티드 서열;

(b) 그의 상보성 가닥이 (a)의 뉴클레오티드 서열에 하이브리드화하는 뉴클레오티드 서열; 및,

(c) 그의 서열이 유전자 코드의 축퇴로 인해 (b)의 뉴클레오티드 서열의 서열과 상이한 뉴클레오티드 서열.

따라서 본 발명의 바람직한 뉴클레오티드 서열은 아스페르길루스, 비소클라미스(Byssochlamys), 코시디오이데스(Coccidioides), 카에토미움(Chaetomium), 에우티파(Eutypa), 엔도카르폰(Endocarpon), 푸사리움, 마이크로스포룸(Microsporum), 네오사르토리아(Neosartorya), 페니실리움, 스포로트릭스(Sporothrix) 및 트리코피톤(Trichophyton)으로 이루어진 군으로부터 선택된 속의 진균, 더 바람직하게는, 코시디오이데스 이미티스(Coccidioides immitis), 코시디오이데스 포사다시이(Coccidioides posadasii), 엔도카르폰 푸실룸(Endocarpon pusillum), 마이크로스포룸 깁세움(Microsporum gypseum), 페니실리움 브라실리아눔 및 스포로트릭스 쉔스키이(Sporothrix schenckii)로 이루어진 군으로부터 선택된 종의 진균, 가장 바람직하게는 균주 피. 브라실리아눔 C1 또는 MG11인 진균으로부터 수득가능한 (또는 상기 진균에서 자연적으로 발생하는) HMFCA 데히드로게나제의 것과 동일한 아미노산 서열을 가진 HMFCA 데히드로게나제를 코딩한다.

한 실시양태에서 뉴클레오티드 서열은 그것이 자연에서 발생하는 바와 같이, 예를 들어 그것이 야생형 공급원 유기체로부터 단리될 수 있는 바와 같이, HMFCA 데히드로게나제 활성을 가진 폴리펩티드를 코딩한다. 대안적으로, 뉴클레오티드 서열은 상기 정의되고 상응하는 자연적으로 발생하는 HMFCA 데히드로게나제와 비교하여 하나 이상의 아미노산 치환, 삽입 및/또는 결실을 포함하나 본원에 정의된 동일성 또는 유사성의 범위 내에 있는 HMFCA 데히드로게나제 중 어느 하나의 조작된 형태를 코딩할 수 있다. 따라서, 한 실시양태에서 본 발명의 뉴클레오티드 서열은 그의 아미노산 서열이 불변 위치 (표 1 및 2에 "*"로 표시됨) 각각에, 불변 위치에 존재하는 아미노산을 적어도 포함하는 HMFCA 데히드로게나제를 코딩한다. 바람직하게는, 아미노산 서열은 강하게 보존된 위치 (표 1 및 2에 ":"로 표시됨)에 강하게 보존된 위치에 존재하는 아미노산 중 하나를 또한 포함한다. 더 바람직하게는, 아미노산 서열은 덜 강하게 보존된 위치 (표 1 및 2에 "."로 표시됨)에 덜 강하게 보존된 위치에 존재하는 아미노산 중 하나를 추가로 또한 포함한다. 이들 불변 및 보존된 위치 외부의 아미노산 치환은 HMFCA 데히드로게나제 활성에 영향을 줄 가능성이 덜 낮다. 표 1 및 2는 공개 데이터베이스에서 이용 가능한 바와 같이, 페니실리움 브라실리아눔 각각 hmfL1 및 hmfL2와, 그의 10개의 가장 가까운 병렬상동체 각각의 아미노산 서열 정렬을 제시한다. 표 1A 및 2A는 피. 브라실리아눔 서열과 그의 병렬상동체 간의 백분율 아미노산 동일성, 뿐만 아니라 병렬상동체의 수탁 번호를 제공한다.

HMFCA 데히드로게나제 활성을 가진 폴리펩티드를 코딩하는 본 발명의 뉴클레오티드 서열은, 그 자체가 관련 기술분야에 널리 공지된 뉴클레오티드 서열의 단리 방법을 사용하여, 진균, 효모 또는 박테리아, 예를 들어 상기 기재된 공급원 유기체와 동일한 문, 강 또는 속에 속하는 것의 게놈 및/또는 cDNA로부터 수득가능하다 (예를 들어 문헌 [Sambrook and Russell (2001) "Molecular Cloning: A Laboratory Manual (3^rd edition), Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, New York] 참조). 본 발명의 뉴클레오티드 서열은 예를 들어 a) 축퇴성 PCR 프라이머 (보존된 아미노산 서열을 기초로 설계됨)를 적합한 유기체의 게놈 및/또는 cDNA 상에서 사용하여 HMFCA 데히드로게나제 활성을 가진 폴리펩티드를 코딩하는 뉴클레오티드 서열의 일부를 포함하는 PCR 단편을 생성시키고; b) a)에서 수득된 PCR 단편을 프로브로서 사용하여 유기체의 cDNA 및/또는 게놈 라이브러리를 스크리닝하고; c) HMFCA 데히드로게나제 활성을 갖는 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는 cDNA 또는 게놈 DNA를 생성시키는 방법으로 수득가능하다.

본 발명의 HMFCA 데히드로게나제가 본 발명의 세포에서 충분한 수준 및 활성 형태로 발현될 가능성을 증가시키기 위해, 이들 효소를 코딩하는 뉴클레오티드 서열, 뿐만 아니라 본 발명의 다른 효소 (하기 참조)는, 바람직하게는 그의 코돈 이용을 해당 숙주 세포의 코돈 이용에 최적화되도록 적응시킨다. 숙주 세포의 코돈 사용에 대한 폴리펩티드를 코딩하는 뉴클레오티드 서열의 적응성(adaptiveness)은 코돈 적응 지수(codon adaptation index) (CAI)로 표시될 수 있다. 코돈 적응 지수는 본원에서 특정 숙주 세포 또는 유기체에서 고도로 발현된 유전자의 코돈 이용에 대한 유전자 코돈 이용의 상대적인 적응성의 측정으로서 정의된다. 각각의 코돈의 상대 적응성 (w)은 동일한 아미노산에 대해 가장 풍부한 코돈의 이용에 대한 각각의 코돈의 이용의 비율이다. CAI 지수는 이들 상대 적응성 값의 기하 평균으로 정의된다. 비동의 코돈 및 종결 코돈 (유전자 코드에 따라 다름)은 제외된다. CAI 값은 0 내지 1의 범위이며, 값이 높을수록 가장 풍부한 코돈의 비율이 더 높다는 것을 나타낸다 (문헌 [Sharp and Li, 1987, Nucleic Acids Research 15: 1281-1295] 참조; 또한 문헌 [Jansen et al., 2003, Nucleic Acids Res. 31(8):2242-51] 참조). 적응된 뉴클레오티드 서열은 바람직하게는 적어도 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8 또는 0.9의 CAI를 갖는다. 적합한 코돈 최적화된 서열은 예를 들어 효모 세포, 바람직하게는 에스. 세레비시아에 세포에서의 발현을 위해 코돈 최적화된, 서열번호: 27 내지 29에 열거되어 있다.

본 발명의 HMFCA 데히드로게나제를 코딩하는 뉴클레오티드 서열의 발현을 위해 핵산 구축물로 형질전환될 진균 숙주 세포는 원칙적으로 본 발명의 HMFCA 데히드로게나제가, 바람직하게는 기능적, 즉 활성 형태로 적합하게 발현될 수 있는 임의의 진균 숙주 세포일 수 있다. 본 발명의 진균 숙주 세포는, 바람직하게는 푸란계 화합물을 세포 내로뿐만 아니라 세포 밖으로 능동적 또는 수동적 수송할 수 있는 숙주 세포이다. 본 발명의 바람직한 숙주 세포는 카르복실화 푸란계 화합물, 예컨대 특히 HMFCA, FFCA 및 FDCA를 분해하는 (예를 들어, 탈카르복실화하는) 검출 가능한 활성이 결핍되거나 없다. 이러한 숙주 세포는 바람직하게는 카르복실화 푸란계 화합물을 분해하는 능력이 자연적으로 결핍되어 있다. 대안적으로, 진균 숙주 세포는 하기 본원에 기재된 바와 같이, 카르복실화 푸란계 화합물의 분해를 촉매하는 하나 이상의 효소의 특이적 활성을 감소시키거나 제거하도록 유전자 변형될 수 있다.

본 발명의 HMFCA 데히드로게나제를 코딩하는 뉴클레오티드 서열의 발현을 위한 발현 구축물은, 바람직하게는 그 구축물로 형질전환된 숙주 세포와 이종 또는 외인성인 발현 구축물이다. 구축물은 본원에서 구축물이 숙주 세포에서 자연적으로 발생하지 않는 적어도 하나의 서열 또는 서열 요소를 포함하는 경우 및/또는 구축물이 숙주 세포에서 자연적으로 발생하지 않는 조합 및/또는 순서로 적어도 2개의 서열 요소를, 요소 자체가 숙주 세포에서 자연적으로 발생하더라도, 포함하는 경우 구축물을 포함하는 숙주 세포에 대해 이종 또는 외인성인 것으로 이해된다.

적절한 숙주 세포에서 본 발명의 HMFCA 데히드로게나제를 코딩하는 뉴클레오티드 서열의 발현을 위한 벡터 및 발현 구축물은 하기에 본원에서 보다 상세하게 기재되어 있다.

푸란계 알데히드 데히드로게나제 활성의 도입 또는 증가

상기 기재된 바와 같은 본 발명의 HMFCA 데히드로게나제를 발현하는 세포는, 추가로 바람직하게는 알데히드 데히드로게나제 활성 (즉, EC 1.2 활성을 가짐)을 갖는다. 바람직하게는, 알데히드 데히드로게나제는 푸란계 알데히드를 전환시킬 수 있다. 더 바람직하게는 알데히드 데히드로게나제 활성은 푸란계 알데히드를 상응하는 푸란계 카르복실산으로 산화시킬 수 있다. 보다 구체적으로, 알데히드 데히드로게나제 활성은 바람직하게는 i) HMF를 HMFCA로 산화시키는 것, ii) 2,5-디포르밀 푸란 (DFF)을 5-포르밀-2-푸로산 (FFCA)으로 산화시키는 것, 및 iii) FFCA를 FDCA로 산화시키는 것 중 하나 이상을 가능하게 할 수 있다. 이러한 푸란계 알데히드 데히드로게나제 활성은 세포의 내인성 활성일 수 있거나 이는 세포에 부여된 외인성 활성일 수 있다. 바람직하게는, 푸란계 알데히드 데히드로게나제 활성은 세포가 HMFCA 데히드로게나제의 발현을 위한 제1 발현 구축물을 이미 포함하는 경우, 발현 구축물, 예를 들어 제2 발현 구축물로 세포의 형질전환에 의해 세포에 부여되거나 세포에서 증가된다.

본 발명의 바람직한 세포에서, 푸란계 알데히드 데히드로게나제의 발현에 대한 발현 구축물은 세포에서 발현될 수 있고, 푸란계 알데히드 데히드로게나제의 발현은 발현 구축물이 결핍된 상응하는 세포, 예를 들어 야생형 세포와 비교하여, 바람직하게는 i) HMF를 HMFCA로 산화시키는 능력, ii) DFF를 FFCA로 산화시키는 능력, 및, iii) FFCA를 FDCA로 산화시키는 능력 중 적어도 하나의 산화 능력을 부여하거나, 세포에서 이들 능력 중 적어도 하나를 가진 푸란계 알데히드 데히드로게나제의 특이적 활성을 증가시킨다. 푸란계 알데히드 데히드로게나제의 특이적 활성은 발현이 결핍된 상응하는 세포와 비교하여, 바람직하게는 세포에서 적어도 1.05, 1.1, 1.2, 1.5, 2.0, 5.0, 10, 20, 50 또는 100배만큼 증가된다.

i) HMF를 HMFCA로 산화시키는 능력, ii) DFF를 FFCA로 산화시키는 능력, 및 iii) FFCA를 FDCA로 산화시키는 능력 중 적어도 하나의 폴리펩티드의 능력은, 예를 들어 WO2012/064195의 실시예 IV에 기재된 바와 같이, 씨. 바실렌시스 HMF 14로부터의 HmfH 및 HmfT1 유전자와 함께 피. 푸티다 숙주 세포에서, 바람직하게는 피. 푸티다 KT2440 숙주 세포에서, 폴리펩티드를 코딩하는 뉴클레오티드 서열을 공동-발현시키고, 10 mM HMF에서 피. 푸티다 세포를 인큐베이션하고, 폴리펩티드를 발현하지 않는 상응하는 피. 푸티다 세포와 비교하여 FDCA 축적에서의 증가를 검출함으로써 검정될 수 있다. HMF를 HMFCA로 산화시키는 폴리펩티드의 능력은 또한 상기 문헌 [Koopman et al 2010, PNAS]에 기재된 바와 같이 검정될 수 있다. 씨. 바실렌시스 HMF14로부터의 hmfT1 유전자를 발현하는 균주는 본원에서 서열번호: 55의 아미노산 서열을 갖는 유전자 생성물을 발현하는 것으로 이해된다. 대안적으로, i) HMF를 HMFCA로 산화시키는 능력, ii) DFF를 FFCA로 산화시키는 능력, 및 iii) FFCA를 FDCA로 산화시키는 능력 중 적어도 하나의 그의 산화 능력에 대해 검정될 폴리펩티드를 코딩하는 뉴클레오티드 서열은, 예를 들어 PCT/EP2016/072406의 실시예에 기재된 바와 같이, HMFCA 데히드로게나제와 함께, 진균 숙주 세포에서, 바람직하게는 에스. 세레비시아에 숙주 세포에서 공동-발현될 수 있으며, 폴리펩티드를 발현하지 않는 상응하는 진균 숙주 세포와 비교하여, 폴리펩티드의 발현이 FDCA 축적의 증가를 야기하는지의 여부를 검출할 수 있다.

본 발명의 세포에서 발현되는 푸란계 알데히드 데히드로게나제는 바람직하게는 아데닌 디뉴클레오티드, 예컨대 NADH 또는 NADPH, 플라빈 아데닌 디뉴클레오티드 (FAD), 플라빈 모노뉴클레오티드 (FMN), 및 피롤로퀴놀린 퀴놀론 (PQQ)으로부터 선택된 보조인자에 의존하는 데히드로게나제이다.

한 실시양태에서, 푸란계 알데히드 데히드로게나제를 코딩하는 뉴클레오티드 서열은 다음으로 이루어진 군으로부터 선택된다:

a) i) HMF를 HMFCA로 산화시키는 능력, ii) DFF를 FFCA로 산화시키는 능력, 및, iii) FFCA를 FDCA로 산화시키는 능력 중 적어도 하나의 능력을 갖는 폴리펩티드를 코딩하는 뉴클레오티드 서열이며, 이 폴리펩티드는 서열번호: 3 (hmfN1-코딩된 알데히드 데히드로게나제)의 적어도 하나의 아미노산 서열과 적어도 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 95, 96, 97, 98, 99 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인 뉴클레오티드 서열;

따라서 본 발명의 바람직한 뉴클레오티드 서열은 아스페르길루스, 에우티파, 네오사르토리아, 페니실리움, 포도스포라(Podospora), 세도스포리움(Scedosporium) 및 스포로트릭스로 이루어진 군으로부터 선택된 속의 진균, 더 바람직하게는, 에우티파 라타(Eutypa lata), 페니실리움 브라실리아눔, 포도스포라 안세리나(Podospora anserine), 세도스포리움 아피오스페르뭄(Scedosporium apiospermum) 및 스포로트릭스 쉔스키이로 이루어진 군으로부터 선택된 종의 진균, 가장 바람직하게는 균주 피. 브라실리아눔 C1 또는 MG11인 진균으로부터 수득가능한 (또는 상기 진균에서 자연적으로 발생하는) 푸란계 알데히드 데히드로게나제의 것과 동일한 아미노산 서열을 가진 푸란계 알데히드 데히드로게나제를 코딩한다.

한 실시양태에서 뉴클레오티드 서열은 그것이 자연에서 발생하는 바와 같이, 예를 들어 그것이 야생형 공급원 유기체로부터 단리될 수 있는 바와 같이, 푸란계 알데히드 활성을 가진 폴리펩티드를 코딩한다. 대안적으로, 뉴클레오티드 서열은 상기 정의되고 상응하는 자연적으로 발생하는 푸란계 알데히드 데히드로게나제와 비교하여 하나 이상의 아미노산 치환, 삽입 및/또는 결실을 포함하나 본원에 정의된 동일성 또는 유사성의 범위 내에 있는 푸란계 알데히드 데히드로게나제 중 어느 하나의 조작된 형태를 코딩할 수 있다. 따라서, 한 실시양태에서 본 발명의 뉴클레오티드 서열은 그의 아미노산 서열이 불변 위치 (표 3에 "*"로 표시됨) 각각에, 불변 위치에 존재하는 아미노산을 적어도 포함하는 푸란계 알데히드 데히드로게나제를 코딩한다. 바람직하게는, 아미노산 서열은 강하게 보존된 위치 (표 3에 ":"로 표시됨)에 강하게 보존된 위치에 존재하는 아미노산 중 하나를 또한 포함한다. 더 바람직하게는, 아미노산 서열은 덜 강하게 보존된 위치 (표 3에 "."로 표시됨)에 덜 강하게 보존된 위치에 존재하는 아미노산 중 하나를 추가로 또한 포함한다. 이들 불변 및 보존된 위치 외부의 아미노산 치환은 푸란계 알데히드 데히드로게나제 활성에 영향을 줄 가능성이 덜 낮다. 표 3은 공개 데이터베이스에서 이용 가능한 바와 같이, 페니실리움 브라실리아눔 hmfN1과 그의 10개의 가장 가까운 병렬상동체의 아미노산 서열 정렬을 제시한다. 표 3A는 피. 브라실리아눔 서열과 그의 병렬상동체 간의 백분율 아미노산 동일성, 뿐만 아니라 병렬상동체의 수탁 번호를 제공한다.

푸란계 알데히드 데히드로게나제 활성을 가진 폴리펩티드를 코딩하는 본 발명의 뉴클레오티드 서열은, 그 자체가 관련 기술분야에 널리 공지된 뉴클레오티드 서열의 단리 방법을 사용하여, 진균, 효모 또는 박테리아, 예를 들어 상기 기재된 공급원 유기체와 동일한 문, 강 또는 속에 속하는 것의 게놈 및/또는 cDNA로부터 수득가능하다 (예를 들어 문헌 [Sambrook and Russell (2001) "Molecular Cloning: A Laboratory Manual (3^rd edition), Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, New York] 참조). 본 발명의 뉴클레오티드 서열은 예를 들어 a) 축퇴성 PCR 프라이머 (보존된 아미노산 서열을 기초로 설계됨)를 적합한 유기체의 게놈 및/또는 cDNA 상에서 사용하여 푸란계 알데히드 데히드로게나제 활성을 가진 폴리펩티드를 코딩하는 뉴클레오티드 서열의 일부를 포함하는 PCR 단편을 생성시키고; b) a)에서 수득된 PCR 단편을 프로브로서 사용하여 유기체의 cDNA 및/또는 게놈 라이브러리를 스크리닝하고; c) 푸란계 알데히드 데히드로게나제 활성을 갖는 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는 cDNA 또는 게놈 DNA를 생성시키는 방법으로 수득가능하다.

본 발명의 푸란계 알데히드 데히드로게나제를 코딩하는 뉴클레오티드 서열의 발현을 위해 핵산 구축물로 형질전환될 진균 숙주 세포는 바람직하게는 HMFCA 데히드로게나제를 코딩하는 뉴클레오티드 서열의 발현을 위해 핵산 구축물로 형질전환을 위해 상기 기재된 바와 같고, 여기서 또한 푸란계 알데히드 데히드로게나제가, 바람직하게는 기능적, 즉 활성 형태로 적합하게 발현될 수 있는 진균 숙주 세포이다. 바람직하게는, 푸란계 알데히드 데히드로게나제를 코딩하는 뉴클레오티드 서열의 발현을 위해 핵산 구축물로 형질전환될 진균 숙주 세포는 또한 HMFCA 데히드로게나제를 코딩하는 뉴클레오티드 서열을 발현하며, 더 바람직하게는 세포는 HMFCA를 FFCA로 산화시키는 능력을 세포에 부여하거나 세포에서 증가시키는 HMFCA 데히드로게나제를 위한 발현 구축물을 포함한다. 상기 기재된 바와 같이, 이러한 진균 숙주 세포는, 바람직하게는 푸란계 화합물을 세포 내로뿐만 아니라 세포 밖으로 능동적 또는 수동적 수송할 수 있으며, 바람직하게는 카르복실화 푸란계 화합물을 분해하는 (예를 들어, 탈카르복실화하는) 검출 가능한 활성이 결핍되거나 없다.

본 발명의 푸란계 알데히드 데히드로게나제를 코딩하는 뉴클레오티드 서열의 발현을 위한 발현 구축물은, 바람직하게는 그 구축물로 형질전환된 숙주 세포와 이종 또는 외인성인 발현 구축물이다. 구축물은 본원에서 구축물이 숙주 세포에서 자연적으로 발생하지 않는 적어도 하나의 서열 또는 서열 요소를 포함하는 경우 및/또는 구축물이 숙주 세포에서 자연적으로 발생하지 않는 조합 및/또는 순서로 적어도 2개의 서열 요소를, 요소 자체가 숙주 세포에서 자연적으로 발생하더라도, 포함하는 경우 구축물을 포함하는 숙주 세포에 대해 이종 또는 외인성인 것으로 이해된다.

적절한 숙주 세포에서 본 발명의 푸란계 알데히드 데히드로게나제를 코딩하는 뉴클레오티드 서열의 발현을 위한 벡터 및 발현 구축물은 하기에 본원에서 보다 상세하게 기재되어 있다.

푸란계 화합물의 대사를 위한 대안적인 경로의 감소 또는 제거

HMF 및 FDCA의 다른 푸란계 전구체의 대사를 위한 대안적인 내인성 경로가 본 발명의 세포에 또한 존재할 수 있다. 이러한 대안적인 경로는 HMF 및 FDCA의 다른 푸란계 전구체로부터 FDCA를 제조하는 것과 경쟁한다. 따라서, 바람직하게는 이러한 대안적인 경로에서 효소의 특이적 활성은 본 발명의 세포에서 또한 감소되거나 제거된다. 하나의 이러한 내인성 대안적 경로는 예를 들어 HMF 및/또는 FFCA를 데히드로게나제, 예컨대 예를 들어 단쇄 데히드로게나제에 의해 상응하는 알콜로 환원시키는 것이다. HMF 및 FDCA의 다른 푸란 전구체를 대사하기 위한 대안적 경로의 특이적 활성을 감소시키거나 제거하기 위해 변형될 이러한 단쇄 데히드로게나제를 코딩하는 유전자는, 바람직하게는 서열번호: 5 (hmfM)에 대해 적어도 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 95, 96, 97, 98, 99 또는 100% 서열 동일성을 가진 아미노산 서열을 코딩하는 유전자이다. 본 발명의 세포에서, 특이적 단쇄 데히드로게나제 활성은 바람직하게는 활성의 감소를 야기하는 유전자 변형을 제외하고는 유전적으로 동일한 균주의 세포와 비교하여 적어도 1.05, 1.1, 1.2, 1.5, 2.0, 5.0, 10, 20, 50 또는 100배 만큼 감소된다.

그의 특이적 활성이 바람직하게는 본 발명의 세포에서 감소되거나 제거되는 단쇄 데히드로게나제를 코딩하는 뉴클레오티드 서열은, 그 자체가 관련 기술분야에 널리 공지된 뉴클레오티드 서열의 단리 방법을 사용하여, 진균, 효모 또는 박테리아, 예를 들어 상기 기재된 공급원 유기체와 동일한 문, 강 또는 속에 속하는 것의 게놈 및/또는 cDNA로부터 수득가능하고 동정될 수 있다 (예를 들어 문헌 [Sambrook and Russell (2001) "Molecular Cloning: A Laboratory Manual (3^rd edition), Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, New York] 참조). 본 발명의 뉴클레오티드 서열은 예를 들어 a) 축퇴성 PCR 프라이머 (보존된 아미노산 서열을 기초로 설계됨)를 적합한 유기체의 게놈 및/또는 cDNA 상에서 사용하여 그의 특이적 활성이 바람직하게는 본 발명의 세포에서 감소되거나 제거되는 효소를 코딩하는 뉴클레오티드 서열의 일부를 포함하는 PCR 단편을 생성시키고; b) a)에서 수득된 PCR 단편을 프로브로서 사용하여 유기체의 cDNA 및/또는 게놈 라이브러리를 스크리닝하고; c) 그의 특이적 활성이 바람직하게는 본 발명의 세포에서 감소되거나 제거되는 효소를 코딩하는 뉴클레오티드 서열을 포함하는 cDNA 또는 게놈 DNA를 생성시키는 방법으로 수득가능하다. 이러한 보존된 서열은 표 5에 제시된 서열 정렬에서 확인될 수 있으며, 여기서 불변 위치는 "*"로 표시되고 강하게 보존된 위치는 ":"로 표시된다. 또한, 본 발명의 적합한 숙주 세포는 표 5로부터 유래될 수 있으며, 여기서 숙주는 바람직하게는 표 5에서 확인된 병렬상동체의 공급원 유기체와 동일한 문, 강, 목, 과 또는 속에 속하는 비병원성 진균 또는 효모이다. 표 5는 공개 데이터베이스에서 이용 가능한 바와 같이, 페니실리움 브라실리아눔 hmfM 각각과 그의 10개의 가장 가까운 병렬상동체의 아미노산 서열 정렬을 제시한다. 표 5A는 피. 브라실리아눔 hmfM 서열과 그의 병렬상동체 간의 백분율 아미노산 동일성, 뿐만 아니라 병렬상동체의 수탁 번호를 제공한다.

HMF를 HMF-알콜로 환원시키는 것으로 공지된 또 다른 내인성 데히드로게나제는 문헌 [Petersson et al. (2006, Yeast, 23:455-464)]에 기재된 바와 같이 에스. 세레비시아에 ADH6 유전자에 의해 코딩된 NADPH-의존성 알콜 데히드로게나제이다. 따라서, HMF를 대사하기 위한 대안적인 경로의 특이적 활성을 감소시키거나 제거하기 위해 변형될 유전자는, 또 다른 진균 숙주 종에서 에스. 세레비시아에 ADH6 유전자 또는 그의 병렬상동체인 것이 바람직하다. 50-60%의 범위의 아미노산 서열 동일성을 가진 아스페르길루스 및 페니실리움과 같은 사상균에서 에스. 세레비시아에 ADH6 유전자의 병렬상동체는 공개 서열 데이터베이스에서 확인될 수 있다. 따라서, 바람직하게는, NADPH-의존성 HMF-환원 데히드로게나제의 특이적 활성을 감소시키거나 제거하기 위해 변형될 유전자는, 서열번호: 25 (에스. 세레비시아에 ADH6)에 대해 적어도 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 95, 96, 97, 98, 99 또는 100% 서열 동일성을 가진 아미노산 서열을 코딩하는 유전자이다. 본 발명의 세포에서, NADPH-의존성 HMF-환원 데히드로게나제의 특이적 활성은 바람직하게는 활성의 감소를 야기하는 유전자 변형을 제외하고는 유전적으로 동일한 균주의 세포와 비교하여 적어도 1.05, 1.1, 1.2, 1.5, 2.0, 5.0, 10, 20, 50 또는 100배 만큼 감소된다.

푸란계 화합물의 수송체를 발현하는 세포

상기 기재된 바와 같이, 본 발명의 세포는 푸란계 화합물 수송 능력을 갖는 폴리펩티드를 코딩하는 하나 이상의 뉴클레오티드 서열을 발현하는 것이 추가로 바람직하다. 푸란계 화합물 수송 능력을 갖는 이러한 폴리펩티드는 세포의 내인성 활성일 수 있거나 그것은 세포에 부여된 외인성 활성일 수 있다. 바람직하게는, 푸란계 화합물 수송 능력을 갖는 폴리펩티드의 활성은, 발현 구축물, 예를 들어 세포가 HMFCA 데히드로게나제 또는 옥시다제의 발현을 위한 제1 발현 구축물 및 푸란계 알데히드 데히드로게나제 또는 옥시다제의 발현을 위한 제2 발현 구축물을 미리 포함하는 경우 발현 구축물, 예를 들어 제3 발현 구축물로 세포의 형질전환에 의해 세포에 부여되거나 세포에서 증가된다.

바람직하게는, 세포는 푸란계 화합물 수송 능력을 갖는 폴리펩티드를 코딩하는 뉴클레오티드 서열의 발현을 위한 발현 구축물로 형질전환된다. 푸란계 화합물 수송 능력을 갖는 폴리펩티드는 바람직하게는 HMFCA 수송 능력을 갖는 폴리펩티드이며, 이는 HMFCA를 세포 내로 수송하는 능력을 적어도 포함한다. 바람직하게는, 세포는 적어도 HMFCA를 세포 내로 수송하는 능력을 갖는 폴리펩티드를 코딩하는 뉴클레오티드 서열의 발현을 위한 발현 구축물을 포함하며, 상기 폴리펩티드는 바람직하게는 서열번호: 6 내지 10 (각각, hmfT3, hmfT4, hmfT5, hmfT6, 및 hmfT7) 중 적어도 하나에 대해 적어도 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 95, 96, 97, 98, 99 또는 100% 서열 동일성을 가진 아미노산 서열을 포함하며, 여기서, 발현 구축물은 세포에서 발현될 수 있고, 폴리펩티드의 발현은 발현 구축물이 결핍된 상응하는 야생형 세포와 비교하여, 적어도 HMFCA를 세포 내로 수송하는 능력을 세포에 부여하거나 세포에서 증가시킨다.

푸란계 화합물, 특히 HMFCA를 세포 내로 수송하는 폴리펩티드의 능력은, 예를 들어 PCT/EP2016/072406의 실시예에 기재된 바와 같이, (WO2012/064195의 서열번호: 19의 아미노산 서열을 갖는) 씨. 바실렌시스 HMF 14로부터의 HMF-분해 오페론과 연관된 푸란계 알데히드 데히드로게나제를 코딩하는 유전자 및 씨. 바실렌시스 HMF 14로부터의 hmfH 유전자와 함께, 효모 숙주 세포에서, 바람직하게는 에스. 세레비시아에 CEN.PK 숙주 세포에서 수송체 폴리펩티드를 코딩하는 뉴클레오티드 서열을 공동-발현시키고, 4 mM HMF에서 형질전환된 에스. 세레비시아에 세포를 인큐베이션하고, 수송체 폴리펩티드를 발현하지 않는 상응하는 (즉, 그렇지 않으면 동일한) 에스. 세레비시아에 세포와 비교하여 FDCA 축적에서의 증가를 검출함으로써 검정될 수 있다.

따라서 본 발명의 바람직한 뉴클레오티드 서열은 아스페르길루스, 푸사리움, 넥트리아(Nectria), 페니실리움, 스포로트릭스(Sporothrix) 및 토그니니아(Togninia)로 이루어진 군으로부터 선택된 속의 진균, 더 바람직하게는, 아스페르길루스 테레우스(Aspergillus terreus), 페니실리움 브라실리아눔, 페니실리움 디기타툼(Penicillium digitatum), 페니실리움 루벤스(Penicillium rubens), 스포로트릭스 쉔스키이 및 토그니니아 미니마(Togninia minima)로 이루어진 군으로부터 선택된 종의 진균, 가장 바람직하게는 균주 피. 브라실리아눔 C1 또는 MG11인 진균으로부터 수득가능한 (또는 상기 진균에서 자연적으로 발생하는) 푸란계 화합물 수송체 폴리펩티드의 것과 동일한 아미노산 서열을 가진 푸란계 화합물 수송체 폴리펩티드를 코딩한다.

한 실시양태에서 뉴클레오티드 서열은 그것이 자연에서 발생하는 바와 같이, 예를 들어 그것이 야생형 공급원 유기체로부터 단리될 수 있는 바와 같이, 푸란계 화합물 수송체 폴리펩티드를 코딩한다. 대안적으로, 뉴클레오티드 서열은 상기 정의되고 상응하는 자연적으로 발생하는 푸란계 화합물 수송체 폴리펩티드와 비교하여 하나 이상의 아미노산 치환, 삽입 및/또는 결실을 포함하나 본원에 정의된 동일성 또는 유사성의 범위 내에 있는 푸란계 화합물 수송체 폴리펩티드 중 어느 하나의 조작된 형태를 코딩할 수 있다. 따라서, 한 실시양태에서 본 발명의 뉴클레오티드 서열은 그의 아미노산 서열이 불변 위치 (표 6 내지 10에 "*"로 표시됨) 각각에, 불변 위치에 존재하는 아미노산을 적어도 포함하는 푸란계 화합물 수송체 폴리펩티드를 코딩한다. 바람직하게는, 아미노산 서열은 강하게 보존된 위치 (표 6 내지 10에 ":"로 표시됨)에 강하게 보존된 위치에 존재하는 아미노산 중 하나를 또한 포함한다. 더 바람직하게는, 아미노산 서열은 덜 강하게 보존된 위치 (표 6 내지 10에 "."로 표시됨)에 덜 강하게 보존된 위치에 존재하는 아미노산 중 하나를 추가로 또한 포함한다. 이들 불변 및 보존된 위치 외부의 아미노산 치환은 푸란계 화합물 수송체 폴리펩티드 활성에 영향을 줄 가능성이 덜 낮다. 표 6 내지 10은 공개 데이터베이스에서 이용 가능한 바와 같이, 페니실리움 브라실리아눔 각각 hmfT3, hmfT4, hmfT5, hmfT6 및 hmfT7과, 그의 10개의 가장 가까운 병렬상동체 각각의 아미노산 서열 정렬을 제시한다. 표 6A 내지 10A는 피. 브라실리아눔 서열과 그의 병렬상동체 간의 백분율 아미노산 동일성, 뿐만 아니라 병렬상동체의 수탁 번호를 제공한다.

푸란계 화합물 수송체 활성을 가진 폴리펩티드를 코딩하는 본 발명의 뉴클레오티드 서열은, 그 자체가 관련 기술분야에 널리 공지된 뉴클레오티드 서열의 단리 방법을 사용하여, 진균, 효모 또는 박테리아, 예를 들어 상기 기재된 공급원 유기체와 동일한 문, 강 또는 속에 속하는 것의 게놈 및/또는 cDNA로부터 수득가능하다 (예를 들어 문헌 [Sambrook and Russell (2001) "Molecular Cloning: A Laboratory Manual (3^rd edition), Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, New York] 참조). 본 발명의 뉴클레오티드 서열은 예를 들어 a) 축퇴성 PCR 프라이머 (보존된 아미노산 서열을 기초로 설계됨)를 적합한 유기체의 게놈 및/또는 cDNA 상에서 사용하여 푸란계 화합물 수송체의 활성을 가진 폴리펩티드를 코딩하는 뉴클레오티드 서열의 일부를 포함하는 PCR 단편을 생성시키고; b) a)에서 수득된 PCR 단편을 프로브로서 사용하여 유기체의 cDNA 및/또는 게놈 라이브러리를 스크리닝하고; c) 푸란계 화합물 수송체 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는 cDNA 또는 게놈 DNA를 생성시키는 방법으로 수득가능하다.

푸란계 화합물 수송체 폴리펩티드를 코딩하는 뉴클레오티드 서열의 발현을 위해 핵산 구축물로 형질전환될 진균 숙주 세포는 바람직하게는 상기 기재된 바와 같은 본 발명의 진균 숙주 세포이다.

본 발명의 푸란계 화합물 수송체 폴리펩티드를 코딩하는 뉴클레오티드 서열의 발현을 위한 발현 구축물은, 바람직하게는 그 구축물로 형질전환된 숙주 세포와 이종 또는 외인성인 발현 구축물이다. 구축물은 본원에서 구축물이 숙주 세포에서 자연적으로 발생하지 않는 적어도 하나의 서열 또는 서열 요소를 포함하는 경우 및/또는 구축물이 숙주 세포에서 자연적으로 발생하지 않는 조합 및/또는 순서로 적어도 2개의 서열 요소를, 요소 자체가 숙주 세포에서 자연적으로 발생하더라도, 포함하는 경우 구축물을 포함하는 숙주 세포에 대해 이종 또는 외인성인 것으로 이해된다.

별개의 측면에서, 본 발명은 HMF를 FDCA로 산화시키는 능력을 갖고 적어도 하나의 푸란계 화합물을 수송하는 폴리펩티드를 코딩하는 뉴클레오티드 서열의 발현을 증가시키는 유전자 변형을 포함하는 진균 세포로서, 이 폴리펩티드는 바람직하게는 서열번호: 9 및 10 중 적어도 하나의 아미노산 서열과 적어도 45% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인, 진균 세포에 관한 것이다. 바람직하게는, 진균 세포는, a) 상기 본원에 기재된 바와 같이, 유전자 변형이 결핍된 상응하는 모 세포와 비교하여, 세포에서 특이적 2,5-푸란디카르복실산 (FDCA) 탈카르복실화 모노옥시게나제 활성을 제거하거나 감소시키는 유전자 변형; b) 상기 본원에 기재된 바와 같이, 유전자 변형이 결핍된 상응하는 야생형 세포와 비교하여, 세포에 5-히드록시메틸-2-푸란카르복실산 (HMFCA)을 5-포르밀-2-푸로산 (FFCA)으로 산화시키는 능력을 부여하거나 세포에서 HMFCA를 FFCA로 산화시키는 효소의 특이적 활성을 증가시키는 유전자 변형; c) 상기 본원에 기재된 바와 같이, 유전자 변형이 결핍된 상응하는 야생형 세포와 비교하여, 세포에 푸란계 알데히드를 상응하는 푸란계 카르복실산으로 산화시키는 능력을 부여하는 유전자 변형 또는 세포에서 푸란계 알데히드를 상응하는 푸란계 카르복실산으로 산화시키는 효소의 특이적 활성을 증가시키는 유전자 변형; d) 상기 본원에 기재된 바와 같이, HMF 및/또는 FFCA를 상응하는 알콜로 환원시키는 단쇄 데히드로게나제를 코딩하는 유전자의 발현을 감소시키거나 제거하는 유전자 변형으로서, 여기서 바람직하게는 유전자는 서열번호: 5 및 25 중 적어도 하나에 대해 적어도 45% 서열 동일성을 가진 아미노산 서열을 포함하는 폴리펩티드를 코딩하는 유전자 중 적어도 하나인 유전자 변형; e) 상기 본원에 기재된 바와 같이, 적어도 하나의 푸란계 화합물을 수송하는 폴리펩티드를 코딩하는 뉴클레오티드 서열의 발현을 증가시키는 유전자 변형으로서, 이 폴리펩티드는 바람직하게는 서열번호: 6 내지 8 중 적어도 하나의 아미노산 서열과 적어도 45% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인 유전자 변형; 및, f) 하기 본원에 기재된 바와 같이, 푸란 이화작용에 관여하는 유전자의 전사 활성인자를 코딩하는 유전자의 발현을 변경시키는 유전자 변형으로서, 여기서 바람직하게는 유전자는 서열번호: 11에 대해 적어도 45% 서열 동일성을 가진 아미노산 서열을 포함하는 폴리펩티드를 코딩하는 유전자인 유전자 변형으로부터 선택된 하나 이상의 유전자 변형을 추가로 포함한다.

적절한 숙주 세포에서 본 발명의 푸란계 화합물 수송체 폴리펩티드를 코딩하는 뉴클레오티드 서열의 발현을 위한 벡터 및 발현 구축물은 하기에 본원에서 보다 상세하게 기재되어 있다.

전사 활성인자의 발현의 변경된 조절을 가진 세포

본 발명의 세포의 한 실시양태에서, 푸란 이화작용에 관여하는 유전자의 전사 활성인자의 발현 조절이 변경된다. 전사 활성인자의 발현은 FDCA 분해를 위한 내인성 유전자를 함유하고, 바람직하게는 전사 활성인자와 독립적으로 발현되는 HMF를 FDCA로 전환시키기 위한 효소를 코딩하는 유전자를 함유하는 세포에서 FDCA의 분해를 방지하기 위해 감소되거나 제거될 수 있다. 대안적으로, 전사 활성인자의 발현은 HMF, 및/또는 다른 푸란계 전구체를 FDCA로 전환시키기 위한 내인성 유전자의 발현을 증가시키도록, FDCA 분해를 방지하기 위해 유전자 변형된 세포에서 증가될 수 있고/거나 구성적으로 만들어질 수 있다.

바람직하게는, 본 발명의 세포에서, 그의 발현의 조절이 변경되는 전사 활성인자는, 서열번호: 11 (hmfR)에 대해 적어도 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 95, 96, 97, 98, 99 또는 100% 서열 동일성을 가진 아미노산 서열을 포함하는 폴리펩티드를 코딩하는 뉴클레오티드 서열에 의해 암호화되며, 여기서, 폴리펩티드는 푸란 이화작용에 관여하는 적어도 하나의 유전자의 전사를 활성화시키는 능력을 갖는다.

따라서 본 발명의 바람직한 뉴클레오티드 서열은 푸사리움, 페니실리움, 세도스포리움, 스포로트릭스 및 스타키보트리즈(Stachybotrys)로 이루어진 군으로부터 선택된 속의 진균, 더 바람직하게는, 푸사리움 옥시스포룸(Fusarium oxysporum), 페니실리움 브라실리아눔, 세도스포리움 아피오스페르뭄, 스포로트릭스 쉔스키이 및 스타키보트리즈 클로로할로나타(Stachybotrys chlorohalonata)로 이루어진 군으로부터 선택된 종의 진균, 가장 바람직하게는 균주 피. 브라실리아눔 C1 또는 MG11인 진균으로부터 수득가능한 (또는 상기 진균에서 자연적으로 발생하는) 전사 활성인자의 것과 동일한 아미노산 서열을 가진 전사 활성인자를 코딩한다.

한 실시양태에서 뉴클레오티드 서열은 그것이 자연에서 발생하는 바와 같이, 예를 들어 그것이 야생형 공급원 유기체로부터 단리될 수 있는 바와 같이, 전사 활성인자를 코딩한다. 대안적으로, 뉴클레오티드 서열은 상기 정의되고 상응하는 자연적으로 발생하는 전사 활성인자 폴리펩티드와 비교하여 하나 이상의 아미노산 치환, 삽입 및/또는 결실을 포함하나 본원에 정의된 동일성 또는 유사성의 범위 내에 있는 전사 활성인자 폴리펩티드 중 어느 하나의 조작된 형태를 코딩할 수 있다. 따라서, 한 실시양태에서 본 발명의 뉴클레오티드 서열은 그의 아미노산 서열이 불변 위치 (표 11에 "*"로 표시됨) 각각에, 불변 위치에 존재하는 아미노산을 적어도 포함하는 전사 활성인자 폴리펩티드를 코딩한다. 바람직하게는, 아미노산 서열은 강하게 보존된 위치 (표 11에 ":"로 표시됨)에 강하게 보존된 위치에 존재하는 아미노산 중 하나를 또한 포함한다. 더 바람직하게는, 아미노산 서열은 덜 강하게 보존된 위치 (표 11에 "."로 표시됨)에 덜 강하게 보존된 위치에 존재하는 아미노산 중 하나를 추가로 또한 포함한다. 이들 불변 및 보존된 위치 외부의 아미노산 치환은 전사 활성인자 활성에 영향을 줄 가능성이 덜 낮다. 표 11은 공개 데이터베이스에서 이용 가능한 바와 같이 페니실리움 브라실리아눔 hmfR과, 그의 10개의 가장 가까운 병렬상동체의 아미노산 서열 정렬을 제시한다. 표 11A는 피. 브라실리아눔 서열과 그의 병렬상동체 간의 백분율 아미노산 동일성, 뿐만 아니라 병렬상동체의 수탁 번호를 제공한다.

전사 활성인자 활성을 가진 폴리펩티드를 코딩하는 본 발명의 뉴클레오티드 서열은, 그 자체가 관련 기술분야에 널리 공지된 뉴클레오티드 서열의 단리 방법을 사용하여, 진균, 효모 또는 박테리아, 예를 들어 상기 기재된 공급원 유기체와 동일한 문, 강 또는 속에 속하는 것의 게놈 및/또는 cDNA로부터 수득가능하다 (예를 들어 문헌 [Sambrook and Russell (2001) "Molecular Cloning: A Laboratory Manual (3^rd edition), Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, New York] 참조). 본 발명의 뉴클레오티드 서열은 예를 들어 a) 축퇴성 PCR 프라이머 (보존된 아미노산 서열을 기초로 설계됨)를 적합한 유기체의 게놈 및/또는 cDNA 상에서 사용하여 전사 활성인자의 활성을 가진 폴리펩티드를 코딩하는 뉴클레오티드 서열의 일부를 포함하는 PCR 단편을 생성시키고; b) a)에서 수득된 PCR 단편을 프로브로서 사용하여 유기체의 cDNA 및/또는 게놈 라이브러리를 스크리닝하고; c) 푸란계 전사 활성인자를 코딩하는 뉴클레오티드 서열을 포함하는 cDNA 또는 게놈 DNA를 생성시키는 방법으로 수득가능하다.

푸란계 전사 활성인자 폴리펩티드를 코딩하는 뉴클레오티드 서열의 발현을 위해 핵산 구축물로 형질전환될 진균 숙주 세포는 바람직하게는 상기 기재된 바와 같은 본 발명의 진균 숙주 세포이다.

본 발명의 푸란계 전사 활성인자 폴리펩티드를 코딩하는 뉴클레오티드 서열의 발현을 위한 발현 구축물은, 바람직하게는 그 구축물로 형질전환된 숙주 세포와 이종 또는 외인성인 발현 구축물이다. 구축물은 본원에서 구축물이 숙주 세포에서 자연적으로 발생하지 않는 적어도 하나의 서열 또는 서열 요소를 포함하는 경우 및/또는 구축물이 숙주 세포에서 자연적으로 발생하지 않는 조합 및/또는 순서로 적어도 2개의 서열 요소를, 요소 자체가 숙주 세포에서 자연적으로 발생하더라도, 포함하는 경우 구축물을 포함하는 숙주 세포에 대해 이종 또는 외인성인 것으로 이해된다.

적절한 숙주 세포에서 본 발명의 푸란계 전사 활성인자 폴리펩티드를 코딩하는 뉴클레오티드 서열의 발현을 위한 벡터 및 발현 구축물은 하기에 본원에서 보다 상세하게 기재되어 있다.

본 발명의 세포의 유전자 변형을 위한 벡터, 유전자 구축물 및 방법

본 발명의 모 숙주 세포의 유전자 변형, 즉 본 발명의 변형된 숙주 세포의 구축을 위해, 관련 기술분야에 일반적으로 공지되어 있고 예를 들어 문헌 [Sambrook and Russell (2001, "Molecular cloning: a laboratory manual" (3rd edition), Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press) and Ausubel et al. (1987, eds., "Current protocols in molecular biology", Green Publishing and Wiley Interscience, New York)]에 기재되어 있는 표준 유전 공학 및 분자 생물학 기술이 사용된다.

보다 구체적으로, 효모의 유전자 변형을 위한 수단 및 방법은 표준이며 관련 기술분야의 통상의 기술자에게 공지되어 있으며, 예를 들어 유전자, 에피솜 및/또는 통합 발현 구축물 및 벡터의 (과-)발현을 위한 프로모터, 선택 가능한 마커, 및 내인성 효모 유전자 또는 그의 일부를 파괴 및/또는 결실시키기 위한 방법 및 유전자 구축물, 및 효모를 형질전환시키는 방법을 포함한다. 이러한 수단 및 방법은 예를 들어 문헌 [Sherman et al, Methods Yeast Genetics, Cold Spring Harbor Laboratory, NY (1978)]; [Guthrie et al. (Eds.) Guide To Yeast Genetics and Molecular Biology Vol. 194, Academic Press, San Diego (1991)]; [Sudbery, P. E. (2001) Genetics Engineering of Yeast, in Biotechnology Set, Second Edition (eds H.-J. Rehm and G. Reed), Wiley-VCH Verlag GmbH, Weinheim, Germany. doi: 10.1002/9783527620999.ch13a]; 및, [Gaillardin, C. and Heslot, H. (1988), Genetics engineering in Yarrowia lipolytica. J. Basic Microbiol., 28: 161-174. doi: 10.1002/jobm.3620280303]에 기재되어 있으며; 이들 문헌 모두는 본원에 참조로 포함된다.

유사하게, 사상균의 유전자 변형을 위한 수단 및 방법은 표준이며 관련 기술분야의 통상의 기술자에게 공지되어 있으며, 예를 들어 유전자, 에피솜 및/또는 통합 발현 구축물 및 벡터의 (과-)발현을 위한 프로모터, 선택 가능한 마커, 및 내인성 진균 유전자 또는 그의 일부를 파괴 및/또는 결실시키기 위한 방법 및 유전자 구축물, 및 사상균을 형질전환시키는 방법을 포함한다. 이러한 수단 및 방법은 예를 들어 문헌 [Moore, M. M. (2007, "Genetic engineering of fungal cells", In Biotechnology Vol. III. (Ed. H. W. Doelle and E. J. Dasilva), EOLSS, Ontario, Canada. pp. 36-63; Lubertozzi, D., & Keasling, J. D. (2009), "Developing Aspergillus as a host for heterologous expression", Biotechnology advances, 27(1), 53-75; Meyer, V. (2008) "Genetic engineering of filamentous fungi--progress, obstacles and future trends", Biotechnology Advances, (26), 177-85; K

ck and Hoff (2010) "New tools for the genetic manipulation of filamentous fungi. Applied microbiology and biotechnology", 86(1), 51-62]; 및, WO2014/142647]에 기재되어 있으며, 이들 문헌 모두는 본원에 참조로 포함된다.

따라서 또 다른 측면에서, 본 발명은 본 발명의 폴리뉴클레오티드, 예를 들어 본 발명의 HMFCA 데히드로게나제 또는 푸란계 알데히드 데히드로게나제를 코딩하는 뉴클레오티드 서열 또는 그의 기능적 등가물을 포함하는, 클로닝 및 발현 벡터를 포함하는 벡터와 같은 핵산 구축물, 및 이러한 벡터로 적합한 숙주 세포를 형질전환 또는 형질감염시키는 방법에 관한 것이다. 본원에 사용된 바와 같이, 용어 "벡터" 및 "구축물"은 상호교환적으로 사용되며 본 발명의 폴리뉴클레오티드를 포함하는 구성된 구축된 핵산 분자를 지칭한다.

본 발명에 따른 벡터는 자율 복제 벡터, 즉 그의 복제가 염색체 복제와 무관한, 염색체외 개체로서 존재하는 벡터, 예를 들어 플라스미드일 수 있다. 대안적으로, 벡터는 숙주 세포 내로 도입될 때 숙주 세포 게놈으로 통합되고 그것이 통합 된 염색체 (들)와 함께 복제되는 것일 수 있다. 편의상 벡터는 조작 및 생산의 용이성을 위해, 이.콜라이(E.coli)와 같은 박테리아에서 사용하기 위한 선택 가능한 마커 및 복제 원점을 또한 포함하는 셔틀 벡터일 수 있다.

한 실시양태에서, 핵산 구축물은 (과-) 발현될 본 발명의 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하고, 여기서 폴리펩티드를 코딩하는 뉴클레오티드 서열은 해당 숙주 세포에서 코딩 뉴클레오티드 서열의 발현 (의 속도)을 수행하고 제어할 수 있는 조절 서열에 작동 가능하게 연결되어 있는 것인, 발현 구축물 또는 발현 벡터이다. 이러한 조절 서열은 전형적으로, 코딩 서열의 전사를 제어하는 기능을 하는 프로모터를 적어도 포함하며, 이 프로모터는 대개 코딩 서열의 상류에 위치하고 바람직하게는 작동 가능하게 연결된다. 프로모터에 더하여, 상류 전자 조절 서열은 추가 요소 예컨대 인핸서, 상류 활성화 인자 서열, 전사 인자 결합 부위, 리프레서 및 활성인자 단백질 결합 부위 등을 포함할 수 있다. 프로모터 서열은 대개 전사 개시 부위(들)를 포함할 것이다. 효모 또는 사상균에서 코딩 서열의 발현에 적합한 프로모터 및 전사 조절 서열은 상기 인용된 문헌에 기재되어 있다. 프로모터 및 전사 개시 부위(들)의 하류에서, 발현 구축물은 번역 개시 서열, 예컨대 번역 개시 코돈, 즉 코딩 서열의 제1 코돈을 둘러싸는 진핵 코작(Kozak) 공통 서열을 포함할 것이다. 코딩 서열은 번역 정지 코돈으로 종결된다. 코딩 서열의 하류에서, 발현 구축물은 하나 이상의 전사 종결 부위를 함유하는 3'- 번역되지 않은 영역, 예를 들어 바람직하게는 폴리아데닐화 부위를 또한 포함하는 종결자를 포함할 수 있다. 종결자의 기원은 덜 중대하다. 종결자는, 예를 들어, 폴리펩티드를 코딩하는 DNA 서열에 고유할 수 있다. 그러나, 바람직하게는 효모 종결자가 효모 숙주 세포에서 사용되고, 사상균 종결자는 사상균 숙주 세포에서 사용된다. 더 바람직하게는, 종결자는 숙주 세포 (여기서 폴리펩티드를 코딩하는 뉴클레오티드 서열이 발현되어야 함)에 대해 내인성이다. 적절한 상류- 및 하류 조절 서열에 작동 가능하게 연결된 코딩 서열을 포함하는 기능적 발현 유닛은 발현 카세트로서 지칭될 수 있다. 본 발명의 발현 벡터 또는 발현 구축물은, 임의로 하나 초과의 상이한 코딩 서열의 발현을 위해 하나 초과의 발현 카세트를 포함할 수 있다.

적어도 하나의 발현 카세트에 추가하여, 본 발명의 발현 벡터 또는 발현 구축물은 바람직하게는 벡터 또는 구축물로 형질전환된 숙주 세포의 선택을 위한 선택 가능한 마커를 또한 포함한다. 바람직한 실시양태에서, 예를 들어 EP 0 635 574에 기재된 바와 같은 상동 재조합을 사용하거나, 문헌 [G

ldener et al. (1996, Nucleic Acids Res. 24:2519-2524)]에 기재된 바와 같은 Cre-lox 시스템을 사용하여, 일단 형질전환체의 초기 선택 후 숙주 세포에서, 발현 구축물/벡터로부터 마커를 절제할 수 있는 구성으로 발현 벡터 또는 발현 구축물 중의 선택 가능한 마커.

본 발명은 추가로, 본 발명의 세포에서 그의 발현이 감소/제거될 폴리펩티드를 포함하여, 본 발명의 폴리펩티드, 예를 들어 HMFCA 데히드로게나제 활성을 갖는 폴리펩티드, 푸란계 알데히드 데히드로게나제 활성을 갖는 폴리펩티드의 제조 방법에 관한 것이다. 상기 방법은 폴리펩티드의 발현에 도움이 되는 조건하에 본 발명에 따른 세포를 배양하고, 임의로, 발현된 폴리펩티드를 회수하는 단계를 포함한다. 본 발명은 또한 이러한 방법에 의해 수득 가능한 폴리펩티드에 관한 것이다.

따라서 또 다른 측면에서, 본 발명은 코딩된 표적 단백질의 발현 및/또는 활성을 감소시키거나 제거하기 위해 본 발명의 세포에서 내인성 표적 유전자를 변형시키는 수단 및 방법에 관한 것이다. 표적 단백질의 발현을 감소시키거나 제거하기 위해 사용될 수 있는 변형은 표적 유전자를 코딩하는 전체 유전자 또는 유전자의 일부를 결실시키는 것, 단백질이 더 낮은 수준으로 발현되거나 발현되지 않도록 DNA 단편을 표적 유전자 내로 (프로모터 또는 코딩 영역에서) 삽입하는 것, 기능성 단백질이 발현되지 않도록 정지 코돈 또는 프레임 시프트를 추가하는 표적 코딩 영역에 돌연변이를 도입하는 것, 및 비기능성 표적 단백질 또는 감소된 효소 활성을 가진 표적 단백질이 발현되도록 아미노산을 변경시키기 위해 하나 이상의 돌연변이를 표적 코딩 영역으로 도입하는 것을 포함하나, 이에 제한되지는 않는 파괴이다. 게다가, 안티센스 RNA 또는 간섭 RNA의 발현에 의해 표적 유전자의 발현이 차단될 수 있고, 공동-억제를 결과하는 구축물이 도입될 수 있다. 게다가, 그의 발현이 낮을 표적 코딩 서열이 합성될 수 있는데 그 이유는 희귀 코돈이 다수의 코돈으로 대체되기 때문이며, 이는 이러한 차선의 선형 코딩 서열이 상응하는 내인성 표적 코딩 서열로 대체되는 경우이다. 바람직하게는, 이러한 차선의 코딩 서열은 0.5, 0.4, 0.3, 0.2 또는 0.1 미만의 코돈 적응 지수 (상기 참조)를 가질 것이다. 이러한 차선의 코딩 서열은 비효율적인 번역으로 인해 더 낮은 속도로 생산되는 것을 제외하고 동일한 폴리펩티드를 생산할 것이다. 게다가, 전사체의 합성 또는 안정성은 돌연변이에 의해 감소될 수 있다. 유사하게, 단백질이 mRNA로부터 번역되는 효율은, 예를 들어 차선의 번역 개시 코돈을 사용함으로써, 돌연변이에 의해 조절될 수 있다. 이들 방법 모두는 표적 단백질을 코딩하는 서열을 이용하는 관련 기술분야의 통상의 기술자에 의해 용이하게 실시될 수 있다.

특히, 표적 코딩 서열을 둘러싼 게놈 DNA 서열은 상동 재조합을 사용하는 변형 방법에 유용하다. 예를 들어, 이 방법에서 표적 유전자 플랭킹 서열은 선택 가능한 마커 유전자의 양쪽 어느 한 부위에 위치하여 상동 재조합을 매개함으로써 마커 유전자가 표적 유전자를 대체한다. 또한, 선택 가능한 마커 유전자에 결합하는 부분적 표적 유전자 서열 및 표적 유전자 플랭킹 서열을 사용하여 상동 재조합을 매개하여 마커 유전자가 표적 유전자의 일부를 대체할 수 있다. 게다가, 불활성화 구축물 중의 선택 가능한 마커는 예를 들어 EP 0 635 574에 기재된 바와 같은 상동 재조합을 사용하거나, 문헌 [G

ldener et al. (1996, Nucleic Acids Res. 24:2519-2524)]에 기재된 바와 같은 Cre-lox 시스템을 사용하여, 일단 숙주 세포의 게놈에서 통합되면, 불활성화 구축물 발현 구축물/벡터로부터 마커의 절제를 허용하도록 하는 방식으로 구성될 수 있다.

표적 유전자의 결실은 또한 문헌 [Wach et al. (1994, Yeast 10:1793-1808)]에 기재된 바와 같이 유사분열 재조합을 사용하여 수행될 수 있다. 이 방법은 20 bp 만큼 짧을 수 있으며, 표적 DNA 서열을 결합하는, 즉 측면에 있는 게놈 영역들 사이에 선택 가능한 마커를 함유하는 DNA 단편을 제조하는 것을 수반한다. 이 DNA 단편은 마커 유전자의 말단에 하이브리드화하고 진균 게놈과 재조합할 수 있는 게놈 영역을 포함하는 올리고뉴클레오티드를 프라이머로서 사용하여 선택 가능한 마커 유전자의 PCR 증폭에 의해 제조될 수 있다. 선형 DNA 단편은 효모 또는 사상균으로 효율적으로 형질전환되고 게놈으로 재조합되어 표적 DNA 서열의 결실을 포함하여 유전자 대체를 결과할 수 있다 (문헌 [Methods in Enzymology, 1991, v 194, pp 281-301]에 기재된 바와 같이). 게다가, 프로모터 대체 방법을 사용하여 내인성 전사 제어 요소를 교환할 수 있어서 문헌 [Mnaimneh et al. (2004, Cell 118(1):31-44)] 및 본원의 실시예에 기재된 바와 같이 또 다른 수단이 발현을 조절할 수 있게 한다.

게다가, 임의의 세포에서 표적 단백질 또는 유전자의 활성은 무작위 돌연변이유발을 사용하여 파괴될 수 있고, 그 후 스크리닝하여 표적 단백질의 활성이 감소된 균주를 확인할 수 있다. 이러한 유형의 방법을 사용하여, 표적 단백질, 또는 표적 단백질의 발현에 영향을 미치는 게놈의 임의의 다른 영역을 코딩하는 DNA 서열은 심지어 알 필요가 없다. 유전자 돌연변이를 생성하는 방법은 통상적이며 관련 기술분야에 널리 공지되어 있으며 돌연변이체를 생성하는 수행에 적용될 수 있다. 통상적으로 사용되는 무작위 유전자 변형 방법 (문헌 [Methods in Yeast Genetics, 2005, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.]에서 검토됨)은 자발적 돌연변이유발, 돌연변이유발 유전자(mutator gene)에 의한 돌연변이유발, 화학적 돌연변이유발, UV 또는 X-선에 의한 방사선조사, 또는 트랜스포손 돌연변이유발을 포함한다.

진균의 화학적 돌연변이유발은 통상적으로로 하기 DNA 돌연변이원 중 하나로의 세포의 처리를 수반한다: 에틸 메탄술포네이트 (EMS), 아질산, 디에틸 술페이트, 또는 N-메틸-N'-니트로-N-니트로소-구아니딘 (MNNG). 이들 돌연변이유발 방법은 문헌 [Spencer et al (Mutagenesis in Yeast, 1996, Yeast Protocols: Methods in Cell and Molecular Biology. Humana Press, Totowa, N.J.)]에서 검토되었다. EMS를 이용한 화학적 돌연변이유발은 문헌 [Methods in Yeast Genetics,, 2005, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y]의 기재된 바와 같이 수행될 수 있다. 자외선 (UV) 광 또는 X-선에 의한 방사선조사를 또한 사용하여 효모 세포에서 무작위 돌연변이유발을 초래할 수 있다. UV에 의한 돌연변이유발의 주요 효과는 DNA 복제의 충실도를 파괴하는 피리미딘 이량체의 형성이다. 효모의 UV-돌연변이유발에 대한 프로토콜은 문헌 [Spencer et al (Mutagenesis in Yeast, 1996, Yeast Protocols: Methods in Cell and Molecular Biology. Humana Press, Totowa, N.J.)]에서 찾을 수 있다. 돌연변이유발 표현형의 도입을 또한 사용하여 효모에서 무작위 염색체 돌연변이를 생성할 수 있다. 통상적인 돌연변이유발 표현형은 하기 유전자 중 하나 이상의 파괴를 통해 수득될 수 있다: PMS1, MAG1, RAD18 또는 RAD51 또는 에스. 세레비지아에 이외의 진균에서 그의 병렬상동체. 비-돌연변이유발 표현형의 복원은 야생형 대립유전자의 삽입에 의해 용이하게 수득될 수 있다. 이들 또는 다른 공지된 무작위 돌연변이유발 과정 중 어느 하나로부터 생성된 변형 된 세포의 수집은 표적 단백질의 감소된 활성에 대해 스크리닝될 수 있다 (US20090305363).

푸란계 화합물의 산화 방법

추가 측면에서, 본 발명은 푸란계 화합물을 산화시키는 방법에 관한 것이다. 특히, 본 발명은 FDCA의 푸란 전구체가 산화되는 방법에 관한 것이다. 본 발명의 방법은 생성물을 결과하는 단일 산화 반응 단계 (예를 들어, HMFCA의 FFCA로의 산화)를 포함할 수 있다. 대안적으로, 본 발명의 방법은 하나 초과의 산화 반응 단계를 포함할 수 있으며, 각각의 단계는 중간체를 결과하고, 여기서 최종 중간체는 최종 생성물이다. HMF가 순차적 산화 단계에서 FDCA로 산화되는 이러한 일련의 단계의 예는 예를 들어 다음을 포함한다: 1) HMF가 먼저 HMFCA로 산화되고, 이는 제2 단계에서 FFCA로 산화된 다음에, 최종적으로 FDCA로 산화되거나, 대안적으로 문헌 [Dijkman et al. (2014, Angew. Chem. 53 (2014) 6515-8)]에 기재된 바와 같이 2) HMF는 먼저 DFF로 산화되고, 이는 제2 단계에서 FFCA로 산화된 다음에, 최종적으로 FDCA로 산화된다. 따라서, 본 발명의 바람직한 방법에서, FDCA의 하나 이상의 푸란계 전구체는 일련의 단계에서 궁극적으로는 FDCA로 산화된다.

한 실시양태에서, 본 발명은 HMFCA의 FFCA로의 적어도 산화를 포함하는 방법에 관한 것이다. 바람직하게는, 방법은 세포를 HMFCA의 존재하에, 인큐베이션하는 단계를 포함하는, HMFCA를 FFCA로 산화시키는 방법이다. 세포는 바람직하게는 HMFCA를 FFCA로 산화시키는 능력을 갖는 효소를 발현하는 세포이다. 세포는 HMFCA를 FFCA로 산화시키는 능력을 갖도록 유전자 변형되는 세포이다. 바람직한 실시양태에서, 세포는 본원에서 상기에 정의된 바와 같이 유전자 변형된 진균 세포이다. 바람직하게는 세포는, 예를 들어 하기에 특정된 바와 같이, 세포에 의한 HMFCA의 산화에 도움이 되는 조건하에 HMFCA의 존재하에 인큐베이션된다.

또 다른 실시양태에서, 본 발명은 FDCA를 제조하는 방법에 관한 것이다. FDCA를 제조하는 방법은 바람직하게는 세포를 FDCA의 하나 이상의 푸란계 전구체를 포함하는 배지에서 인큐베이션하는 단계를 포함한다. 세포는 바람직하게는 FDCA의 푸란 전구체를 FDCA로 전환시키는 능력을 갖는 하나 이상의 효소를 발현하는 세포이다. FDCA의 푸란계 전구체를 FDCA로 전환시키는 능력을 가진 효소는 예시된 진균 효소를 포함하는, 상기 기재된 바와 같이 알콜 및/또는 알데히드 데히드로게나제 활성을 갖는 효소일 수 있다. 따라서, 바람직한 실시양태에서, 세포는, 본원에서 상기에 정의된 바와 같이, 유전자 변형된 진균 세포이다.

바람직하게는 세포는, 예를 들어 하기에 특정된 바와 같이, 세포에 의한 FDCA의 푸란계 전구체의 FDCA로의 산화에 도움이 되는 조건하에 FDCA의 하나 이상의 푸란계 전구체의 존재하에 인큐베이션된다.

바람직하게는 상기 방법에서, FDCA의 적어도 하나의 푸란계 전구체는 HMF, DHF, HMFCA, FFCA 및 DFF로 이루어진 군으로부터 선택되며, 이 중 HMF가 가장 바람직하다. FDCA의 푸란계 전구체는 바람직하게는 하나 이상의 헥소스 당으로부터, 바람직하게는 산-촉매화된 탈수에 의해, 예를 들어 통상적인 방식으로 산의 존재하에 가열함으로써 수득된다. 프럭토스로부터 HMF를 생성하는 기술은 널리 확립되고 강력하다 (예를 들어 문헌 [van Putten et al., 2013, Chem. Rev. 113, 1499-1597] 참조). 또한, 글루코스-풍부 공급원료가 이용될 수 있으나, HMF의 열화학 형성은 프럭토스로부터 보다 효율적으로 진행된다. 따라서, 글루코스 이소머라제를 사용하여, 글루코스를 프럭토스로 전환시키기 위해 추가의 효소 단계가 포함될 수 있다. 후자의 방법은, 예를 들어 가수분해 전분으로부터 고프럭토스 옥수수 시럽 (HFCS)을 제조하기 위한 식품 산업에서 널리 확립되어 있다. 글루코스는 또한 예를 들어 문헌 [van Putten et al. (2013, 상기)]에 기재된 바와 같이 촉매 및 용매의 조합을 사용하여 프럭토스로 화학적으로 이성질체화될 수 있다.

헥소스 당은 대개 바이오매스로부터 수득될 수 있다. 용어 "바이오매스"는 농업 (식물성 물질, 예컨대 농작물 잔류물, 및 동물성 물질 포함), 임업 (예컨대, 목재 자원) 및 어업 및 양식업을 포함한 관련 산업으로부터의 생물학적 기원의 산물, 폐기물 및 잔류물의 생물학적 분획, 뿐만 아니라 산업 및 도시 폐기물, 예컨대 도시의 고형 폐기물 또는 폐지의 생분해성 분획을 의미하는 것으로 이해된다. 바람직한 실시양태에서, 바이오매스는 식물 바이오매스, 더 바람직하게는 (발효성) 헥소스/글루코스/당-풍부 바이오매스, 예컨대 예를 들어 사탕수수, 전분-함유 바이오매스, 예를 들어 밀 곡물, 또는 옥수수 짚, 또는 심지어 시리얼 그레인, 예컨대 옥수수, 밀, 보리 또는 그의 혼합물이다. 프럭탄이 자연적으로 풍부한 농작물 (예를 들어, 식물돼지감자(topinambur) 또는 치커리 뿌리)이 바람직하다.

헥소스 당은 이러한 바이오매스의 가수분해에 의해 수득될 수 있다. 바이오 매스의 가수분해 방법은 그 자체가 관련 기술분야에 공지되어 있으며 예를 들어 증기 및/또는 카르보히드라제 예컨대 글루코아밀라제의 사용을 포함한다.

본 발명의 방법에서 사용하기 위한 또 다른 바람직한 유형의 바이오매스는 소위 "제2 세대" 리그노셀룰로스 공급원료이며, 이는 큰 부피의 FDCA가 더 지속가능한 방식으로 생성되는 경우에 바람직하다. 리그노셀룰로스 공급원료는 전용 에너지 작물, 예를 들어 한계 지대에서 재배되어, 식량 작물과 직접 경쟁하지 않는다. 또는 리그노셀룰로스 공급 원료는 부산물, 예를 들어 도시의 고형 폐기물, 폐지, 목재 잔류물 (제재소 및 제지 공정 폐기물 포함)로서 수득될 수 있으며 농작물 잔류물을 고려될 수 있다. 농작물 잔류물의 예는 사탕수수로부터의 버개스 및 또한 여러 옥수수 및 밀 폐기물을 포함한다. 옥수수 부산물의 경우에, 세 가지 폐기물은 섬유, 옥수수속(cobs) 및 스토버(stover)이다. 더욱이, 임업 바이오매스는 공급원료로서 사용될 수 있다. 2 세대 공급원료를 본 발명의 발효 생성물로 전환시키기 위해, 셀룰로스 및 헤미셀룰로오스는 모노사카라이드로서 방출될 필요가 있다. 여기에, 열화학적 접근법 (대개 전처리로 칭함), 효소적 접근법 또는 상기 두 방법론의 조합이 적용된다. 전처리는 당류를 완전히 유리시키거나, 중합체 화합물을 후속 효소적 공격에 더 접근 가능하게 하는 역할을 할 수 있다. 상이한 유형의 전처리는 액체 온수, 증기 폭발, 산 전처리, 알칼리 전처리, 및 이온성 액체 전처리를 포함한다. 다양한 화합물의 상대적인 양은 사용된 공급원료 및 이용된 사용된 전처리에 의존할 것이다. 이러한 리그노셀룰로스 공급원료로부터 모노사카라이드 당류의 방출을 위해, 예를 들어 아라비나제, 크실라나제, 글루카나제, 아밀라제, 셀룰라제, 글루카나제 등을 포함한, 적절한 카르보히드라제가 이용된다.

본 발명의 산화 방법은 바람직하게는 세포에 가장 최적인 온도에서 수행되고/거나 함유된 옥시도리덕타제 효소는 세포이다. 따라서, 호열성 세포 및/또는 호열성 효소의 경우에, 온도는 바람직하게는 40 내지 65℃의 범위, 예를 들어 적어도 40, 42 또는 45℃ 및/또는 예를 들어 65, 60, 55 또는 50℃ 이하이다. 그러나, 중온성 세포 및/또는 중온성균으로부터의 효소의 경우에, 산화 반응은 바람직하게는 비교적 온화한 온도, 예를 들어 예를 들어 10 내지 45℃, 더 바람직하게는 20 내지 40℃의 범위에서, 예를 들어 적어도 10, 15, 18, 20, 22 또는 25℃ 및/또는 예를 들어 45, 42, 40, 38, 35, 32 또는 30℃ 이하에서 수행된다.

본 발명의 산화 공정은 바람직하게는 산성 pH에서 수행된다. 다운스트림 프로세싱 (DSP), 즉 회수 및 정제는 임의의 생명공학적 공정에서 그러나 특히 단량체의 순도가 제어된 중합체 형성에서 필수적이기 때문에 중합제 제조를 위한 단량체 화합물의 제조에서 일반적인 관심사이다. FDCA는 3 미만의 pH 값에서 매우 제한된 용해도를 갖는다 (약 2.28의 pK_a를 가짐). 공정이 산성 pH에서 수행되는 경우, 생성된 FDCA는 그것이 생성되는 배지로부터, 바람직하게는 이미 그의 생산 동안에 침전되어, 회수를 크게 촉진시킬 것이다. 따라서 바람직하게는, 본 발명의 방법에서, 세포, 바람직하게는 진균 세포는 하나 이상의 푸란계의 존재하에 5.0, 4.0, 3.0, 2.9, 2.8, 2.7, 2.6, 2.5 또는 2.4 이하의 pH에서, 그리고 바람직하게는 2.0, 2.1, 2.2 또는 2.25, 2.27 또는 2.28 이상의 pH에서 인큐베이션된다. 바람직하게는, 본 발명의 방법에서, 이 범위의 pH에 대해 높은 내성을 갖는 세포, 바람직하게는 진균 숙주 세포가 선택된다. 산성 pH에서 공정을 수행하는 추가적 이점은 거의 모든 박테리아가 낮은 pH에서 악영향을 받기 때문에 공정의 미생물 오염이 문제가 덜 될 것이라는 점이다. 효모 및 진균은 감염원으로서 박테리아와 비교하여 문제가 덜 되며 다루기가 비교적 용이할 것이다.

반응 시간은 6 내지 150시간, 더 바람직하게는 6 내지 18시간일 수 있다. 바람직하게는 산소는 예를 들어 순수 산소로서 또는 공기, 또는 물 중의, 산소 공급원, 예컨대 분자 산소, 또는 푸란계 산화 효소의 요건에 따라 달라지는 다른 산소 공급원으로부터 반응 배지의 세포에 공급된다. 공기가 분자 산소의 공급원으로서 편리하게 사용될 수 있다.

반응기는 임의의 적합한 (통기의) 생물반응기일 수 있다. 이는 배치식, 연속식 또는 바람직하게는 유가식(fed-batch)으로 작동될 수 있다.

본 발명의 방법은 추가로 바람직하게는 FDCA 또는 HMFCA와 같이, 공정에서 생성된 산화 생성물(들)을 회수하는 단계를 포함한다. 바람직하게는, 산화 생성물은 산화 단계를 수행하는 세포가 인큐베이션되는 배지로부터 회수된다. FDCA, HMFCA 등과 같은 산화 생성물은, 예를 들어 (산) 침전, 후속 냉각 결정화, 및 결정화된 산화 생성물, 예를 들어 결정화된 FDCA의 분리에 의해 반응 혼합물 또는 매질로부터 회수될 수 있다. 그러나, 다른 회복 방법, 예를 들어 관련 기술분야에 공지된 바와 같은, 예컨대 예를 들어 산 침전 및 용매 추출이 적합하다.

푸란계 화합물을 산화시키기 위한 본 발명의 방법은 유리하게는, 푸란계 화합물이 유해한 것으로 간주되는 공급원료, 예컨대 바이오연료 및 생화학물질의 제조를 위한 발효를 위한 공급원료로부터 푸란계 화합물을 제거하기 위해 적용될 수 있다. 더 바람직하게는, 푸란계 화합물을 산화시키는 방법은 폴리에스테르 (플라스틱)의 제조를 위한 단량체 전구체로서 FDCA의 생체제조에 적용되며, 여기서 FDCA는 폴리에스테르 PET에서 PTA를 대체할 수 있으며, 이 경우에 생체기반 폴리에틸렌푸란디카르복실레이트 (PEF)를 결과한다. FDCA는 예를 들어 숙신산, 2,5-비스(아미노메틸)-테트라히드로푸란, 2,5-디히드록시메틸-테트라히드로푸란, 2,5-디히드록시메틸푸란 및 2,5-푸란디카르브알데히드의 제조를 위한 기질로서를 포함한, 매우 다양한 귀중한 화합물을 위한 기질로서 또한 사용될 수 있다. FDCA는 예를 들어 알키드 수지에서의 코팅 및 열가소성 코팅의 제조에서 사용될 수 있다. 이는 바이오연료에서 크실렌 등가물로서 및 용매로서 또한 사용될 수 있다. FDCA는 에스테르 화될 수 있고, 에스테르는 가소제로서 사용될 수 있다. FDCA는 그의 디올로 전환될 수 있으며, 이는 PET-유사 폴리에스테르 및 폴리우레탄에서 사용될 수 있다. 추가의 FDCA는 그의 디아민으로 전환될 수 있고, 디아민은 사슬 연장 제로서 사용될 수 있고 디아민은 디이소시아네이트로 전환될 수 있으며, 이는 폴리우레탄의 제조에서 사용될 수 있다.

따라서, 추가 측면에서 본 발명은, a) 상기 정의된 바와 같은 본 발명의 산화 공정으로 FDCA 단량체를 제조하는 단계; 및, b) a)에서 수득된 FDCA 단량체(들)로부터 중합체를 제조하는 단계를 포함하는, 하나 이상의, 또는 적어도 2개의 FDCA 단량체로부터 중합체를 제조하는 방법에 관한 것이다. 바람직한 방법에서, 중합체는 FDCA 단량체와 하나 이상의 유형의 디올 단량체를 혼합하고 FDCA 단량체와 디올 단량체가 중합되는 조건하에 상기 혼합물을 가져옴으로써 제조된다. 따라서, 중합은 에스테르화 또는 에스테르교환 반응일 수 있으며, 둘 다 (중)축합 반응으로도 지칭된다. 디올 단량체는 방향족, 지방족 또는 지환족 디올, 예를 들어 알킬렌 글리콜일 수 있다. 따라서 적합한 디올 및 폴리올 단량체의 예는 에틸렌 글리콜, 디에틸렌 글리콜, 1,2-프로판디올, 1,3-프로판디올, 1,4-부탄디올, 1,5-펜탄디올, 1,6-헥산디올, 1,4-시클로헥산디메탄올, 1,1,3,3-테트라메틸시클로부탄디올, 1,4-벤젠디메탄올, 2,2-디메틸-1,3-프로판디올, 폴리(에틸렌 글리콜), 폴리(테트라히드로푸란), 2,5-디(히드록시메틸)테트라히드로푸란, 이소소르비드, 글리세롤, 25 펜타에리트리톨, 소르비톨, 만니톨, 에리트리톨, 트레이톨을 포함한다. 에틸렌 글리콜, 1,3-프로판디올, 1,4-부탄디올, 1,4-시클로헥산디메탄올, 1,6-헥산디올, 2,2-디메틸-1,3-프로판디올,폴리(에틸렌 글리콜), 폴리(테트라히드로푸란), 글리세롤, 및 펜타에리트리톨이 바람직한 디올이다. 에틸렌 글리콜은 특히 바람직하다. 에틸렌 글리콜 (모노에틸렌 글리콜--MEG)은 바람직하게는 생체공급된다. 예를 들어 생체공급된 MEG는, 전분, 셀룰로스 또는 헤미셀룰로오스의 가수분해에 의해 농작물 또는 농업 부산물, 산림 부산물 또는 고형 도시 폐기물로부터 수득될 수 있는 당류 (예를 들어 글루코스, 프럭토스, 크실로스)로부터의 발효에 의해 또한 제조될 수 있는 에탄올로부터 수득될 수 있다. 대안적으로, 생체공급된 MEG는 글리세롤로부터 수득될 수 있으며, 그 자체는 바이오디젤로부터의 폐기물로서 수들될 수 있다. 바람직하게는 중합체는 폴리에틸렌푸란디카르복실레이트 (PEF)이다.

중합체는 FDCA 및/또는 알킬렌 글리콜 단량체 예컨대 다른 이산 단량체, 예를 들어 디카르복실산 또는 폴리카르복실산, 예를 들어 테레프탈산, 이소프탈산, 시클로헥산 디카르복실산, 말레산, 숙신산, 1,3,5-벤젠트리카르복실산과 상이한 구조를 갖는 (소량)의 다른 반응성 단량체를 또한 함유할 수 있다. 락톤은 또한 2,5-푸란디카르복실레이트 에스테르: 피발로락톤, 엡실론-카프로락톤 및 락티드 (L,L; D,D; D,L)와 함께 또한 사용될 수 있다. 비록 본 발명의 가장 바람직한 실시 양태가 아니더라도, 중합체는, 다관능성 단량체 (분자당 2개 초과의 산 또는 히드록실 관능기), 산 및/또는 히드록실 단량체 중 어느 하나, 예를 들어 다관능성 방향족, 지방족 또는 지환족 폴리올, 또는 다산의 사용 때문에, 비 선형, 분지형일 수 있다. 한 실시양태에서, 중합체 중 알킬렌 글리콜은 알킬렌 디아민에 의해 부분적으로 또는 완전히 대체된다.

또 다른 하나의 측면에서, 본 발명은 푸란계 전구체 중 하나 이상의 FDCA로의 생체형질전환을 위한 세포, 바람직하게는 본 발명의 세포의 용도로서, 여기서 세포가 본원에서 상기 정의된 바와 같은 HMFCA 데히드로게나제를 발현하는 세포, 또는 푸란계 화합물 수송 능력을 가지며 본원에서 상기 정의된 바와 같은 HMFCA 데히드로게나제 활성을 추가로 포함하는 폴리펩티드를 발현하는 세포인, 세포의 용도에 관한 것이다. 바람직하게는, FDCA로 형질전환되는 FDCA의 적어도 하나의 푸란계 전구체는 HMF, DHF, HMFCA, FFCA 및 DFF로 이루어진 군으로부터 선택되며, 이 중 HMF가 가장 바람직하다.

본 문서 및 그의 청구범위에서, 동사 "포함하는" 및 그의 활용은 상기 단어를 따르는 항목이 포함되나, 구체적으로 언급되지 않은 항목은 배제되지 않음을 의미하는 그의 비제한적인 의미로 사용된다. 게다가, 부정 관사 "a" 또는 "an"에 의한 요소에 대한 언급은 문맥상 요소 하나 그리고 단지 하나의 요소가 존재하도록 요구하지 않는 한, 하나 초과의 요소가 존재할 가능성을 배제하지 않는다. 부정 관사 "a" 또는 "an"은 대개 "적어도 하나"를 의미한다.

본 명세서에 인용된 모든 특허 및 문헌 참고 문헌은 그 전문이 본원에 참조로 포함된다.

하기 실시예는 단지 예시적 목적으로 제공되며, 본 발명의 범위를 어떠한 방식으로도 제한하려는 것은 아니다.

[표 1]

페니실리움 브라실리아눔 hmfL1 및 10개의 가장 가까운 병렬상동체의 아미노산 서열 정렬.

[표 2]

페니실리움 브라실리아눔 hmfL2 및 10개의 가장 가까운 병렬상동체의 아미노산 서열 정렬.

[표 3]

페니실리움 브라실리아눔 hmfN1 및 10개의 가장 가까운 병렬상동체의 아미노산 서열 정렬.

[표 4]

페니실리움 브라실리아눔 hmfK1 및 10개의 가장 가까운 병렬상동체의 아미노산 서열 정렬.

[표 5]

페니실리움 브라실리아눔 hmfM 및 10개의 가장 가까운 병렬상동체의 아미노산 서열 정렬.

[표 6]

페니실리움 브라실리아눔 hmfT3 및 10개의 가장 가까운 병렬상동체의 아미노산 서열 정렬.

[표 7]

페니실리움 브라실리아눔 hmfT4 및 10개의 가장 가까운 병렬상동체의 아미노산 서열 정렬.

[표 8]

페니실리움 브라실리아눔 hmfT5 및 10개의 가장 가까운 병렬상동체의 아미노산 서열 정렬.

[표 9]

페니실리움 브라실리아눔 hmfT6 및 10개의 가장 가까운 병렬상동체의 아미노산 서열 정렬.

[표 10]

페니실리움 브라실리아눔 hmfT7 및 10개의 가장 가까운 병렬상동체의 아미노산 서열 정렬.

[표 11]

페니실리움 브라실리아눔 hmfR 및 10개의 가장 가까운 병렬상동체의 아미노산 서열 정렬.

[표 1A]

[표 2A]

[표 3A]

[표 4A]

[표 5A]

[표 6A]

[표 7A]

[표 8A]

[표 9A]

[표 10A]

[표 11A]

[도면의 간단한 설명]

도 1. hygB 및 phleo 항생제 마커를 각각 사용하여, hmfK1 (상단) 및 hmfK3 (하단) 결실을 생성하기 위한 스플리트 마커 접근법.

도 2. 250 rpm에서 진탕 플라스크에서 30℃에서 5 mM 글루코스 및 6 mM HMF가 보충된 최소 배지에서 성장시킨, 야생형 피. 브라질리아눔 C1 (A) 및 피. 브라질리아눔 C1 파괴 돌연변이체 균주 ΔhmfK1 #26 (B), ΔhmfK1 #30 (C) 및 ΔhmfK3 #43 (D)의 배양액의 상청액에서 측정된 HMF, FDCA 및 중간체의 농도.

도 3. 250 rpm에서 진탕 플라스크에서 30℃에서 5 mM 시트레이트 및 6 mM HMF가 보충된 최소 배지에서 성장시킨, 야생형 피. 브라실리아눔 C1 (A), 및 피. 브라실리아눔 C1 파괴 돌연변이체 균주 ΔhmfK1 #26 (B), ΔhmfK1 #30 (C) 및 ΔhmfK3 #43 (D)의 배양액의 상청액에서 측정된 HMF, FDCA 및 중간체의 농도. 4일 후, #26 및 #30의 글루코스 함유 배양액의 ~ 1%를 사용하여 시트레이트 함유 플라스크를 재접종하였다.

실시예

도입

동시 계류중인 국제 출원 PCT/EP2016/072406에서, 본 발명자들은 페니실리움 브라실리아눔 균주의 네덜란드 토양으로부터의 단리를 기재하였다. 출원 PCT/EP2016/072406에서 피. 브라실리아눔 C1으로 지칭되는, 이러한 피. 브라실리아눔은 FDCA의 전구체인 HMF 상에서 성장 선택에 의해 단리되었다. 여기서, 피. 브라실리아눔 C1 균주는 야생형 (WT) WT 피. 브라실리아눔 균주 또는 WT 균주로 지칭될 것이다. 국제 출원 PCT/EP2016/072406은 피. 브라실리아눔 C1의 게놈의 서열분석 및 주석, 뿐만 아니라 HMF 및 시트르산 상에서 성장시킨 균주의 전사체의 서열분석을 기재한다. 공개 데이터베이스에 대한 게놈 주석 및 블래스팅 유전자뿐만 아니라 차등 발현 RNA-서열분석 결과에 기초하여, 살리실레이트 히드록실라제 hmfK1, 2개의 알콜 데히드로게나제 hmfL1 및 hmfL2 및 살리실알데히드 데히드로게나제 hmfN1을 포함하는, 푸로산으로의 제안된 HMF를 통한 푸로산으로의 (FDCA를 통한) 피. 브라실리아눔 C1에 의한 HMF의 이화작용에 관여하는 효소를 코딩하는데 관여하는 후보 유전자의 목록이 작성되었다. 슈도모나스 균주에서의 이종 발현에 의해, PCT/EP2016/072406의 실시예는 피. 브라실리아눔 hmfK1 히드록실라제가 실제로 FDCA 상에서 탈카르복실화 모노옥시게나제로서 작용하여 피. 브라실리아눔에서 FDCA의 분해에 관여함을 나타낸다. 더욱이, 피. 브라실리아눔 hmfL1 및 hmfL2 알콜 데히드로게나제 및 피. 브라실리아눔 hmfN1 살리실알데히드 데히드로게나제의 효모에서 이종 발현에 의해, PCT/EP2016/072406의 실시예는 이들 효소가 실제로 HMF를 FDCA로 효율적으로 산화시키는 능력을 갖고 있음을 나타낸다.

피. 브라실리아눔 hmfK1, hmfL1, hmfL2 및 hmfN1 유전자에 더하여, PCT/EP2016/072406의 실시예는 표 12에 열거된, 피. 브라실리아눔에서 HMF의 이화작용에 관여하는 단백질 또는 효소를 코딩하는 다수의 추가 유전자를 기재하였다.

[표 12]

실시예 1: hmfK1 결실 시도 및 hmfK3의 확인

nia1 선택 마커를 사용하여 제1 살리실레이트 히드록실라제 유전자 hmfK1을 결실시키려는 초기 시도가 이루어졌다. 비록 진단 PCR이 hmfK1의 결실을 확인하긴 했지만, RNAseq 분석은 hmfK1이 여전히 발현됨을 나타냈으며, 이는 결실이 성공적이지 않았음을 나타내는 것이다. 흥미롭게도, 분석된 추정된 돌연변이체 균주에서 또 다른 하나의 살리실레이트 히드록실라제, hmfK3 (서열번호: 24에 의해 코딩된 서열번호: 23)은 상향조절되었으며, 이는 PCT/EP2016/072406의 실시예에서 상향조절되는 것으로 확인되지 않았다. 추정된 hmfK1 결실 형질전환체를 다음에 보다 상세하게 분석하였다. 이 분석으로부터, 본 발명자들은 두 hmfK1 결실 형질전환체가 모두가 정확하지 않다는 결론을 내렸다. 아마도 결실 구축물이 다른 부위 (들)에서, 가능하게는 hmfK1의 상류로/하류로 및/또는 nia1 유전자 자체에서 (두 돌연변이체 모두에서 상이한) 통합되었을 것이다.

실시예 2: RNAseq 데이터의 평가

본 발명자들은 시트레이트 상에서 성장시킨 항성분배양조 배양액으로부터 WT 및 추정된 hmfK1 결실 형질전환체 ΔSH #2E4 (이는 올바른 hmfK1 결실을 갖지 않는 것으로 밝혀짐)로부터 RNAseq 데이터를 수득한 다음에 시트레이트를 HMF에 의해 대체하였다. FDCA를 통한 HMF의 분해에 관여할 수 있는 유전자 세트가 확인되었다. hmfK1 유전자는 WT 균주에서 HMF-공급된 배양에서 가장 강한 유도를 나타낸 유전자였다. 다수의 HMF-유도된 유전자는 hmfK1과 동일한 콘티그 (번호 730)에 위치하며, 이는 HMF 분해 경로를 코딩하는 유전자 클러스터의 존재를 나타낸다. 상기에서 이미 논의한 바와 같이, hmfK1은 여전히 형질전환체 ΔSH #2E4에서 강하게 유도되었다. 게다가, 현재 hmfK3으로 칭해지는, hmfK1에 대해 상동성을 가진 제2 히드록실라제 유전자가, 이 형질전환체에서 유도되나, WT 균주에서는 유도되지 않는 것으로 밝혀졌다. WT 및 돌연변이체 배양액 둘 다에서 어떤 FDCA 축적도 관찰되지 않았기 때문에, 본 발명자들은 개선된 FCDA 균주 설계 (예를 들어, 분해 특이적 조절인자 유전자)에 대한 잠재적 대안적인 표적의 확인을 위해 이용 가능한 RNAseq RPKM 데이터를 재분석하였다.

데이터 재분석은 다음의 (log₂) 비율에 집중되었다:

1. WT_HMF 대 WT_시트레이트

2. M_HMF 대 M_시트레이트

3. M_HMF 대 WT_HMF

4. M_Citr 대 WT_Citr

데이터는 먼저 "0" 및 "div0"의 비를 가진 유전자를 볼 수 있도록 플로어되었다(floored) (+2). 임의의 컷오프 값을 사용하여 유도된 유전자의 비슷한 양 (~100)을 얻기 위해 유전자를 선택하였다 (표 2 및 보충 엑셀 파일 참조).

돌연변이체 (WT와 비교하여) 배양에서, 많은 유전자 세트가 HMF 및 시트레이트 조건 둘 다에서 유사하게 유도되고 억제되었다. 이것은 이들 유전자의 유도/억제가 HMF 독립적이고 돌연변이체 및/또는 배양 특이적임을 시사한다. 살리실레이트 히드록실라제 hmfK3의 유도는 예외이다.

이전에 수득된 결과 (hmfK1, hmfK3, 알콜 데히드로게나제, 전사 활성인자, 락토나제 등의 유도)가 HMF-처리된 배양액에서 확인되었다. 살리실 관련 유전자 및 탈카르복실라제는 HMF에 의해 단지 유도되며 옥시도리덕타제는 HMF에 의해 주로 조절된다. HMF는 또한 주요 촉진자 수퍼패밀리 단백질을 코딩하는, g10375 (콘티그 570) 및 g5964 (콘티그_226)와 같은 다양한 수송체를 유도하였으며, 이는 HMF, 또는 그의 유도체를 세포 내외부로 수송하는데 역할을 할 수 있었다.

PCT/EP2016/072406의 실시예에서 이전에 확인되었고, 가능하게는 FDCA를 통한 HMF 분해에 관여하는 hmf 유전자의 BLAST 결과는 재평가되었다. 흥미로운 것은 hmfK1 (콘티그730) 주위의 HMF-유도된 유전자 클러스터가 진균의 제2 대사산물 클러스터와 분명한 유사성을 나타낸다는 점이다. 최고 동일성 (70%)은 스포로트릭스 쉔스키이 ATCC 58251에서 병렬상동체 유전자 클러스터로 발견되었다. 알콜 데히드로게나제를 코딩하는 hmfL1 유전자는 hmfK1 (콘티그 730)과 상이한 콘티그 (82)에 있다. 그러나, 에스 쉔스키이(S. schenckii)에서의 hmfL1 병렬상동체는 동일한 유전자 클러스터에 있다. 공개적으로 입수 가능한 피. 브라실리아눔 MG11 게놈 (Horn et al., 2015. Genome Announc 3(5):e00724-15. doi:10.1128/genomeA.00724-15; GenBank 수탁번호 CDHK01000001.1)에서 (hmfK1을 함유하는) hmf 유전자 클러스터는 hmfL1을 또한 포함한다. 따라서 본 발명자들은 콘티그 82 및 730이 서로 인접해 있다는 결론을 내린다.

hmf 유전자 클러스터 (콘티그 730 및 82)에서 데히드로게나제의 보조인자 의존성이 또한 조사되었다. 진균은 NADP보다 NAD를 재생성하는 더 높은 능력을 갖기 때문에, FDCA의 경제적으로 실행 가능한 제조를 위해 진균에서 보조인자로서 NAD가 바람직하다.

hmfL1을 사용한 BLAST 결과는 보조인자로서 NAD에 대한 선호도를 나타낸다. hmfN1을 사용한 BLAST 결과는 NAD 및 NADP 의존성을 구별하지 않는다. 그러나 hmfN1과 가장 잘 일치하는 것은 슈도모나스 균주 C18의 상부 나프탈렌 이화작용 경로에 관여하는 살리실알데히드 데히드로게나제 (DoxF, SaliADH, EC=1.2.1.65)를 사용한 경우이다. DoxF의 경우 NAD가 바람직한 보조인자로 보인다 .

RNAseq 데이터의 재평가 결과에 기초하여, 본 발명자들은 또한 살리실레이트 히드록실라제 hmfK1 및 두 번째로 hmfK3이 HMF를 FDCA로 산화시키나 제조된 FDCA를 분해시키지 않는 숙주 세포를 구축하기 위해 결실시킬 가장 좋은 초기 후보라는 결론을 내린다.

실시예 3: hmfK1 & hmfK3 단일 및 이중 돌연변이체 균주의 개발

유전자 결실 설계 및 합성

WT 피. 브라실리아눔 균주는 유전자 파괴에 대한 phleo 또는 hygB 항생제 선택 마커의 적합성을 확인하기 위해 플레오마이신 및 히그로마이신 민감성에 대해 시험되었다 (상기 참조). 유전자 결실 설계는 DDNA에 의해 수행되었으며 hmfK1 결실 돌연변이체에 대한 hygB 선택 마커 및 hmfK3 결실 돌연변이체에 대한 phleo 선택 마커를 사용하여 (도 1), 스플리트 마커 접근법에 기초한다 (Arentshorst et al., 2015, In: "Genetic Transformation Systems in Fungi", Volume 1. van den Berg M.A., Maruthachalam K., (eds). Switzerland: Springer International Publishing, pp. 263-272). 상동 재조합을 겪은 DNA 단편만이 무손상 항생제 선별 마커 유전자를 결과할 것이기 때문에, 스플리트 마커 접근법은 올바르지 않은 (hmfK1 또는 hmfK3이 아닌) 부위에서 통합 빈도를 감소시키기 위해 적용된다. 하나의 형질전환 실험에서 두 선택 마커 모두를 사용하여 hmfK1 hmfK3 이중 돌연변이체를 생성하려는 시도가 이루어졌다. 도 1에 개요된 바와 같은 유전자 파괴-단편의 합성은 진아트(GeneArt), 써모피셔 사이언티픽(ThermoFisher Scientific)에 아웃소싱하였다. 단편의 서열은 서열 목록 (서열번호: 30 내지 33)에 제공되어 있다.

형질전환 & 선택

형질전환을 수행하기 전에 WT 피. 브라실리아눔 균주에 대해 FDCA 분해 스크린을 설정하였다. WT 균주는 FDCA를 탄소원으로서 사용할 수 있다. 이를 행할 수없는 돌연변이체를 생성하는 것은 FDCA를 단독 C-공급원으로서 함유하는 배지 상에서는 성장시키지 않을 것이다. 이 검정은 올바른 hmfK1 (및 hmfK3) 결실 형질전환체에 대한 스크리닝을 용이하게 할 것이다 (이들 유전자의 결실이 FDCA 분해를 손상시킬 것이라고 가정).

1 리터의 탈염수당 하기를 함유하는, 코비온(Corbion) 최소 배지를 사용하였다: 2.0 g의 (NH₄)2SO₄, 0.1 g의 MgCl₂ 6H₂O, 10 mg의 EDTA, 2 mg의 ZnSO₄.7H₂0, 1 mg의 CaCl₂. 2H₂O, 5 mg의 FeSO₄ 7H₂O, 0.2 mg의 Na₂MoO₄. 2H₂O, 0.2 mg의 CuSO₄ 5H₂O, 0.4 mg의 CoCl₂ 6H₂O, 및 1 mg의 MnCl₂ 2H₂O. 25 mM KH₂PO₄ 및 25 mM NaH₂PO₄. 실험에 따라 하기 C-공급원 중 하나 이상을 첨가하였다: 0.2 g/l의 효모 추출물, 15 mM의 FDCA, 5 mM 글루코스, 5 mM 시트르산, 6 mM HMF. FDCA의 침전을 피하기 위해, FDCA를 단독 C-공급원으로서 사용한 경우를 제외하고, pH를 3.0으로 설정하였다.

WT 피. 브라실리아눔은 액체 배지 중에서뿐만 아니라 한천 플레이트 상 둘 다에서, 단독 C-공급원으로서 15 mM FDCA를 가진 코비온 최소 배지 상에서 성장할 수 있었다. 음성 대조군 (어떤 C-공급원도 없는 최소 배지)은 최소량의 배경 성장을 보였는데, 이는 한천 성분 상에서 성장하는 이 균주의 능력으로 인한 것임에 틀림없다. 이는 유익한 부작용인데, 그 이유는 형질전환체를 가진 스크린에서 이 배경 성장은 포자의 실제 이동을 긍정적으로 제어하기 때문이다. 본 발명자들은 FDCA를 가지나 YE가 없는, 즉 15 mM FDCA를 단독 C-공급원으로서 사용하여, 한천 플레이트 상에서 형질전환체 (하기 참조)를 처음에 스크리닝하기로 결정하였다 (더 명확한 결과 및 더 신속).

유전자 단편을 표준 DDNA 진균 형질전환 프로토콜을 사용하여 WT 피. 브라실리아눔 균주로 형질전환시켰다 (Punt and van den Hondel, 1992, Methods in Enzymol. 261:447-457). WT 균주의 원형질체를 단편으로 형질전환시켜 ΔhmfK1을 생성시키고 HygB를 함유하는 선택 플레이트 상에 플레이팅하였다. 게다가, WT 균주의 원형질체를 단편으로 형질전환시켜 ΔhmfK1 및 ΔhmfK3 둘 다를 생성시키고 HygB 단독, Phleo 단독, 및 HygB 및 Phleo 둘 다를 함유하는 선택 플레이트 상에 플레이팅하였다. 총, 48개의 1차 형질전환체가 다양한 선택 플레이트 상에서 생성되었다. 이들 1차 형질전환체는 단독 C-공급원으로서 FDCA를 함유하는 플레이트 상에서 성장이 없거나 감소된 성장에 기초하여 스크리닝되었다. 35개 중 17개의 (~50%) HygB+ (ΔhmfK1) 형질전환체는 플레이트 상에서 강한 표현형을 나타냈는데 (FDCA에서 성장하지 않음), 이는 FDCA 분해 경로가 무손상 hmfK1 유전자를 수반함을 시사한다. 잠재적인 ΔhmfK3 돌연변이체는 플레이트 상에서 어떤 표현형도 나타내지 않았다. 모든 형질전환체를 항생제 마커의 존재에 대해 추가로 시험하였다.

다음으로, 플레이트 상에서 표현형을 나타낸 17개의 HygB+ (ΔhmfK1) 클론 및 모든 hmfK1+hmfK3 형질전환체를 플레이트 상에서 정제하고 액체 매질 ± 15 mM FDCA (-YE) 중에서 시험하였다. 한천 플레이트 상에 강한 표현형을 나타내는 모든 ΔhmfK1 클론에 대해, 유일한 C-공급원으로서 FDCA를 가진 액체 배지 중에서 성장이 완전히 파괴되었다.

무손상과 올바르게 결실된 hmfK1 유전자를 구별하기 위해 상이한 hmfK1 결실 형질전환체로 진단 PCR 분석을 수행하였다. 상이한 프라이머 조합물을 시험하고 (표 13, 14 및 15 참조), 결과는 표현형을 나타내는 모든 hmfK1 클론 (FDCA 상에서 성장이 없음)이 올바르다는 것을 나타냈다 (데이터는 나타내지 않음). 반대로, hmfK1+hmfK3 형질전환체 #31 및 #33은 WT hmfK1 PCR 밴드를 여전히 생성시키는 표현형이 없음을 나타낸다. 올바른 hmfK3 결실에 대해 시험하기 위해 모든 hmfK1+hmfK3 형질전환체 상에 대해 진단 PCR 분석을 또한 수행하였다 (표 14 및 16 참조). 형질전환체 #43 (ΔhmfK1+ΔhmfK3; HygB+Phleo 선택)만이 PCR에 기초하여 올바른 hmfK3 결실을 갖는 것으로 밝혀졌다 (데이터는 나타내지 않음). 비록 이 형질전환체가 HygB 내성이긴 하지만, 이는 (PCR 결과에 기초하여) hmfK1 결실을 함유하지 않는다. 모든 정제된 hmfK1+hmfK3 형질전환체를 hmfK1 형질전환체와 유사하게 액체 배양액에서 또한 시험하였다. 형질전환체 #43 (올바른 hmfK3 결실)은 FDCA 상에서 성장하였다.

결과로부터 본 발명자들은 올바른 hmfK1 결실이 생성되었고 hmfK1 유전자의 결실이 시험된 조건하에 단독 C-공급원으로서 FDCA 상에서 성장하는 100% 불능을 결과한다는 결론을 내리며, 이는 hmfk1이 FDCA 분해의 핵심 유전자임을 확인해준다. 게다가, 본 발명자들은 hmfK3 결실이 1 클론 (#43)에서 올바르고 표현형을 나타내지 않는다는 결론을 내릴 수 있는데, 이는 hmfk3이 적어도 시험된 조건하에가 아닌, FDCA 분해에 관여하지 않음을 시사한다.

[표 13]

[표 14]

[표 15]

[표 16]

실시예 4: HMF의 전환 및 FDCA의 제조

다음으로 본 발명자들은 HMF의 전환 및 FDCA의 제조를 시간 맞춰 모니터링하는 실험을 설정하였다. 상기 결과로부터 WT 균주, 확인된 hmfK1 결실 #26 및 #30, 및 확인된 hmfK3 결실 #43을 선택하여 진탕 플라스크 배양에서 발효에 대해 분석하였다. 균주는 6 mM HMF가 보충된 5 mM 글루코스 또는 5 mM 시트레이트를 함유하는 효모 추출물이 없는 코비온 최소 배지에서 성장시켰다. 배양액을 7일 동안 성장시키고 1, 2, 3, 4 및 7일 후에 샘플을 수집하였다. 샘플로부터 상청액을 PCT/EP2016/072406의 실시예에 기재된 바와 같이 HPLC에 의해 HMF, FDCA 및 중간체에 대해 분석하였다.

모든 균주는 글루코스 함유 배지 상에서 잘 성장하였다. hmfK1 결실 균주 #26 및 #30은 시트레이트 함유 배지 상에서 유의하게 성장하지 않았다. 따라서, 4일째에, ~1%의, 글루코스 함유 배양액 (#26 및 #30의)을 사용하여 시트레이트 함유 플라스크 (=citr*)를 재접종하였다. 그러나, 이들 배양액에서 더 이상 어떠한 (분명한) 추가 성장도 관찰되지 않았다. hmfK3 결실 균주 #43은 WT 균주와 비슷한 시트레이트 함유 배지에서 성장하였다. 1주 후 pH를 측정하였다 (데이터는 나타내지 않음). 흥미롭게도, 1주 인큐베이션 후 hmfK1 결실 균주의 배양액의 pH는 두 배지 모두에서 WT 및 hmfK3 결실 균주 배양액의 pH보다 낮았으며, 이는 산 (FDCA) 생성을 나타낸다.

도 2 및 3은 각각 글루코스 또는 시트레이트 상에서 성장된 배양액의 HPLC 분석 결과를 나타낸다. 글루코스를 함유하는 배양액에서 즉각적인 HMF 전환이 관찰되었다. 샘플을 처음 분석한 경우에조차도 단지 낮은 미량의 HMF가 측정되었다. WT 및 ΔhmK3 배양액 둘 다에서, 모든 푸란 수준은 유사한 방식으로 매우 낮은 수준으로 강하되었고, 예상한 바와 같이, 어떤 FDCA 축적도 관찰되지 않았다 (도 2A 및 2D). 다른 한편으로는, 매우 재현가능한 FDCA 축적은 두 hmfK1 결실 균주 모두에서 측정되었다 (도 2B 및 2C). 7일 후에 HMF에서 FDCA로의 최대 60-70%의 전환에 도달하였다. HMF-산은 글루코스 상에서 성장한 hmfK1 결실 배양에서 관찰된 주요 일시적 중간체 화합물이었다.

시트레이트 함유 배양액에서, WT 및 hmK3 배양액 둘 다에서 어떤 FDCA 축적도 또한 측정되지 않았다 (도 3A 및 3D). 모든 푸란은 글루코스 함유 배양액에서보다 비록 느린 속도일지라도 시간이 지남에 따라 분해되었다. 비록 시트레이트 함유 배지에서 hmfK1 결실 #26 및 #30에 대한 유의한 성장이 4일 후에 관찰되지 않긴 하였지만, 약 50% HMF → HMFCA → FDCA 전환이 측정되었다 (도 3B 및 3D). 이것은 (발아된) 포자에 의해 수행된 FDCA로의 HMF의 가능한 생물-전환을 나타낸다.

이들 결과로부터 본 발명자들은 hmfK1이 FDCA 분해의 핵심 유전자라는 결론을 내린다. hmfK1의 결실은 HMF가 배양액에 제공되는 경우 FDCA 축적을 야기한다. (발아된) 포자-기반 생물전환은 가능해 보이며 세포의 어떤 성장도 필요하지 않음을 시사한다. 그러나, 글루코스 함유 배지에서 성장하는 배양액에서 FDCA 축적이 더 빠르다. 시험된 조건하에, hmfK3 유전자는 FDCA 분해에 관여하지 않는다.

실시예 5: 낮은 pH에서 HMF의 결정질 FDCA로의 전환

보다 제어된 조건하에 FDCA를 생산하는 hmfK1 결실 돌연변이체의 가능성을 추가로 입증하기 위해, 생체형질전환 실험을 7-L 유리 발효기에서 수행하였다. 세포는 미네랄 염 배지에서 30℃에서 배양되었다 (L당: KCl, 1.3 g; KH₂PO₄, 3.8 g; MgSO₄.7H₂O, 1.23 g; Na₂EDTA.2H₂O, 125 mg; ZnSO₄.7H₂O, 55 mg; H₃BO₃, 27.5 mg; MnCl₂.4H₂O, 12.5 mg; FeSO₄.7H₂O, 12.5 mg; CoCl₂.6H₂O, 4.25 mg; CuSO₄.5H₂O, 4 mg; Na₂MoO₄.2H₂O, 3.75 mg, 글루코스, 10 g; (NH₄)₂SO₄, 7.6 g 또는 NaNO₃, 9.8 g). 소포제를 필요에 따라 첨가하고 용존 산소 장력을 공기 포화 수준의 20%로 유지시켰다. 성장 동안에, HMF를 1 mM의 최종 농도로 공급하여 FDCA 생성 효소 시스템을 유도하였다. 초기 글루코스가 고갈된 후, 바이오매스 밀도가 20 g/L의 세포 건조 중량에 도달할 때까지 글루코스를 연속적으로 공급하였다. 생체형질전환 단계는 HMFCA 또는 HMF의 축적을 방지하기 위해 수동으로 조정된 2.5 mmol / L 브로쓰 / h의 시작 속도로 HMF 공급을 켜서 시작되었다. HMF와 함께, 생체형질전환 동안에 세포의 에너지 요구를 커버하기 위해 글루코스의 공급이 제공되었다. 글루코스를 전체적으로 모니터링하고, 어떤 글루코스도 축적되지 않도록 공급 속도를 수동으로 조정하였다. 초기 값 (5.5)으로부터 2.7의 설정 값으로 pH를 강하시킨 후, NaOH의 자동 첨가에 의해 이를 제어하였다. 대안적으로, pH는 조정 없이 강하시켰고, 이 경우 값은 약 2.3에서 안정화되었다. 생체형질전환 동안에, HMF는 FDCA로 형질전환되어 pH 3.5 미만의 고체 화합물로서 결정화되었다. HMF가 너무 높은 속도로 공급된 경우 HMFCA의 일시적 축적이 관찰되었으며; 공급 속도를 줄인 직후 축적된 HMFCA는 전형적으로 FDCA로 산화될 것이다. 생체형질전환은 90 g/L의 전체 역가까지 FDCA를 산출하였다.

SEQUENCE LISTING <110> PURAC BIOCHEM B.V. <120> FDCA-DECARBOXYLATING MONOOXYGENASE-DEFICIENT HOST CELLS FOR PRODUCING FDCA <130> IPA191174-NL <150> EP 17162104.8 <151> 2017-03-21 <160> 55 <170> PatentIn version 3.5 <210> 1 <211> 351 <212> PRT <213> Penicillium brasilianum <400> 1 Met Gly Ser Leu Ser Leu Pro Glu Thr Ser Leu Ala Ala Ile Gln Asp 1 5 10 15 Lys Glu Thr Lys Ala Ile Ser Val Ala Lys Arg Pro Thr Pro Val Pro 20 25 30 Val Gly Thr Gln Val Leu Val Lys Leu His Tyr Ser Gly Val Cys Ala 35 40 45 Thr Asp Leu His Leu Ala Arg Gly Ser Val Pro Tyr Leu Gln Pro Lys 50 55 60 Val Ser Val Gly Gly His Glu Gly Thr Gly Val Ile Ala Ser Leu Gly 65 70 75 80 Pro Asp Val Asp Ala Ala Glu Trp His Val Gly Asp Arg Val Ala Val 85 90 95 Arg Trp Val His Ile Val Cys Gly Lys Cys Glu Val Cys Thr Thr Gly 100 105 110 Phe Glu Asn Leu Cys Gln Ser Arg Lys Leu Ala Gly Lys Asp Val Glu 115 120 125 Gly Thr Phe Ala Glu Tyr Ala Ile Ala Asp Ser Ser Tyr Met Val Arg 130 135 140 Leu Pro Ala Gly Val Ser Asp Ala Asp Ala Ala Pro Ile Leu Cys Ala 145 150 155 160 Gly Val Thr Val Tyr Lys Ala Leu Lys Ile Ala Ser Leu Arg Ala Gly 165 170 175 Ser Trp Val Ala Val Ala Gly Ala Gly Gly Gly Leu Gly His Leu Ala 180 185 190 Ile Gln Tyr Ala Arg Ala Met Gly Leu Lys Val Val Ala Leu Asp Ala 195 200 205 Arg Lys Arg Asp Leu Cys Leu Ser Leu Gly Ala Glu Ser Tyr Ile Asp 210 215 220 Val Leu Glu Thr Asp Asp Cys Val Ala Gln Val Ile Lys Val Thr Asp 225 230 235 240 Gly Gly Ala His Gly Ala Leu Ile Cys Ala Ser Ser Gly Gln Ala Tyr 245 250 255 Asp Asp Ala Val Lys Phe Leu Arg Trp Thr Gly Thr Leu Val Cys Ile 260 265 270 Gly Leu Pro Pro Lys Pro Thr Leu Leu Ser Leu Gly Pro Ala Asp Phe 275 280 285 Val Ala Arg Gly Ile Lys Val Met Gly Thr Ser Thr Gly Asp Arg Gln 290 295 300 Asp Thr Val Glu Ala Leu Ala Phe Val Ala Lys Gly Gln Val Lys Pro 305 310 315 320 Gln Leu Thr Glu Arg Arg Leu Glu Asp Val Glu Glu Ile Leu Lys Glu 325 330 335 Ile Glu Asn Gly Thr Met Gln Gly Lys Ala Val Ile Arg Ile Ala 340 345 350 <210> 2 <211> 339 <212> PRT <213> Penicillium brasilianum <400> 2 Met Ser Leu Pro Ser His Tyr Lys Arg Ala Ala Phe Lys Glu Ala Gly 1 5 10 15 Gly Pro Leu Thr Ile Glu Glu Val Asp Leu Thr Met Pro Asp Ala Gly 20 25 30 Glu Val Leu Val Lys Val Glu Ala Cys Gly Val Cys Phe Ser Asp Thr 35 40 45 Val Pro Gln Ala His Gly Leu Gly Gly Lys Phe Pro Ile Val Pro Gly 50 55 60 His Glu Ile Ile Gly His Val Val Ala Thr Gly Asp Gly Val Ser Asp 65 70 75 80 Trp Glu Val Gly Asp Arg Ile Gly Glu Gly Trp His Gly Gly His Asp 85 90 95 Gly Thr Cys Pro Ser Cys Arg Gln Gly His Phe Gln Met Cys Asp Asn 100 105 110 Gln Ser Ile Asn Gly Val Thr Lys Asn Gly Gly Tyr Ala Gln Tyr Cys 115 120 125 Ile Leu Arg Ser Glu Ala Ala Val Arg Ile Pro Thr His Val Ser Ala 130 135 140 Ala Glu Tyr Ala Pro Ile Leu Cys Ala Gly Val Thr Val Phe Asn Ser 145 150 155 160 Met Arg Gln Ile Gly Val Lys Pro Gly Ser Thr Val Ala Ile Gln Gly 165 170 175 Leu Gly Gly Leu Gly His Leu Ala Ile Gln Tyr Ala Asn Arg Phe Gly 180 185 190 Phe Arg Val Val Ala Ile Ser Arg Asp Asp Gln Lys Glu Arg Phe Val 195 200 205 Arg Asp Leu Gly Ala His Glu Tyr Ile Asn Thr Ser Glu Glu Asp Val 210 215 220 Gly Ser Ala Leu Gln Lys Leu Gly Gly Ala Ser Leu Ile Val Ala Thr 225 230 235 240 Ala Pro Asn Ala Arg Ala Ile Ser Pro Leu Leu Lys Gly Leu Arg Pro 245 250 255 Leu Gly Lys Leu Leu Ile Leu Ala Val Pro Gly Glu Ile Pro Leu Asp 260 265 270 Thr Arg Leu Met Val Ala Arg Gly Leu Ser Val His Gly Trp Pro Ser 275 280 285 Gly His Ala Leu Asp Ser Glu Glu Thr Ile Arg Phe Thr Glu Leu Glu 290 295 300 Asp Ile Lys Cys Met Ile Gln Thr Tyr Ser Leu Asp Arg Ala Asn Glu 305 310 315 320 Ala Phe Asp Ala Met Ile Ser Gly Ser Val Arg Phe Arg Ala Val Ile 325 330 335 Thr Met Glu <210> 3 <211> 505 <212> PRT <213> Penicillium brasilianum <400> 3 Met Thr Gln Thr Asn Val His Val Asn Lys Ser Asp Thr Ser Leu Ala 1 5 10 15 Ala Pro Gln Gln Leu Phe Ile Ser Gly Lys Tyr Gln Asn Ser Gln Arg 20 25 30 Asn Gly Thr Phe Pro Val Lys Asn Pro Met Thr Gly Glu Thr Ile Tyr 35 40 45 Glu Cys Val Ser Ala Ser Leu Asp Asp Tyr Ala Ala Ala Ile Glu Glu 50 55 60 Ala Asp Ala Ala Gln Pro Ser Trp Ala Arg Leu Gly Pro Ser Ala Arg 65 70 75 80 Arg Leu Ile Leu Leu Lys Ala Ala Asp Ile Met Glu Thr Tyr Ile Glu 85 90 95 Thr Asp Ala Pro Ala Ile Leu Ser Ala Glu Val Ser Ala Thr Arg Gly 100 105 110 Trp Val Arg Ala Asn Ile Leu Ser Thr Ala Gly Val Phe Arg Glu Thr 115 120 125 Ala Ala Leu Ala Thr His Ile Lys Gly Glu Ile Val Pro Ala Asp Arg 130 135 140 Pro Gly Thr Thr Ile Leu Val Ser Arg Glu Pro Val Gly Val Val Leu 145 150 155 160 Ala Ile Ser Pro Trp Asn Met Pro Ala Thr Leu Thr Ala Arg Ala Ile 165 170 175 Cys Cys Pro Leu Ile Cys Gly Asn Ser Val Val Leu Arg Pro Ser Glu 180 185 190 Phe Ser Pro Lys Ser Gln His Leu Val Val Arg Ala Leu Thr Glu Ala 195 200 205 Gly Leu Pro Ala Gly Cys Leu Gln Phe Leu Pro Thr Ser Thr Ala Asp 210 215 220 Thr Pro Arg Ala Ile Glu Phe Ala Ile Arg His Pro Lys Val Ser Arg 225 230 235 240 Ala Asn Phe Thr Gly Ser Asp Arg Val Gly Arg Ile Ile Ala Gly Leu 245 250 255 Ser Ala Ser Cys Leu Lys Pro Cys Val Leu Glu Leu Gly Gly Lys Ala 260 265 270 Pro Val Val Val Leu Glu Asp Ala Asp Val Glu Ala Ala Val Glu Ala 275 280 285 Val Val Tyr Gly Ala Met Ser Asn Ser Gly Gln Ile Cys Met Ser Thr 290 295 300 Glu Arg Ala Ile Val His Arg Ser Leu Ala Ala Asp Phe Lys Ala Leu 305 310 315 320 Leu Val Lys Arg Ala Glu Ser Leu Arg Val Gly Asn His Leu Glu Asp 325 330 335 Pro Asp Val Gln Leu Ser Gly Leu Phe Thr Ala Ala Ser Ala Glu Arg 340 345 350 Val Leu Gly Leu Ile Lys Gly Ala Val Asn Ala Gly Ala Thr Leu Leu 355 360 365 Ala Gly Asp Leu Ala Leu His Gly Pro Cys Gln Thr Ile Met Ala Pro 370 375 380 His Ile Leu Thr Gly Val Thr Arg Asp Met Asp Leu Phe His Arg Glu 385 390 395 400 Thr Phe Gly Pro Val Leu Phe Val Ser Glu Phe Asp Thr Asp Asp Glu 405 410 415 Ala Ile Ala Gln Ala Asn Asp Thr Glu Phe Ser Leu Cys Ala Ser Val 420 425 430 Phe Ser Arg Asp Val Leu Arg Ala Met Asp Thr Ala Lys Arg Ile Arg 435 440 445 Thr Gly Ser Cys His Val Asn Gly Pro Thr Val Tyr Ile Glu Ala Pro 450 455 460 Leu Pro Asn Gly Gly Val Gly Gly Gly Ser Gly Tyr Gly Arg Phe Gly 465 470 475 480 Gly Val Ala Gly Ile Glu Glu Phe Thr Glu Arg Gln Ile Val Ser Leu 485 490 495 Ala Lys Pro Gly Ile Lys Tyr Ala Phe 500 505 <210> 4 <211> 427 <212> PRT <213> Penicillium brasilianum <400> 4 Met Pro His Ala Ser Arg Ser Leu Asn Val Leu Ile Val Gly Ala Gly 1 5 10 15 Leu Gly Gly Leu Ala Ala Gly Leu Ala Leu Gln Thr Asp Gly His Lys 20 25 30 Val Thr Ile Ile Asp Ala Ala Pro Glu Phe Ala Glu Ala Gly Ala Gly 35 40 45 Ile Arg Ile Pro Pro Asn Ser Ser Arg Leu Leu Met Arg Trp Gly Val 50 55 60 Asp Leu Glu Arg Met Lys Lys Ser Thr Ser Gln Arg Tyr His Phe Ile 65 70 75 80 Arg Trp Lys Asp Gly Ser Thr Ile Phe Asp Leu Pro Phe Asn Asn Ile 85 90 95 Val Glu Thr His Gly Ala Pro Tyr Trp Leu Val His Arg Ala Asp Leu 100 105 110 His Ala Ala Leu Leu Asp Ala Thr Leu Lys Ala Gly Val Lys Val Leu 115 120 125 Asn Asn Lys Leu Val Thr Ser Tyr Asp Phe Glu Ala Pro Ser Ala Thr 130 135 140 Thr Gln Asp Gly Glu Thr Phe Lys Ala Asp Leu Ile Val Gly Ala Asp 145 150 155 160 Gly Ile Lys Ser Ile Cys Arg Pro Leu Leu Thr Gly Gln Pro Asp Val 165 170 175 Pro Arg Asp Thr Gly Asp Val Ala Tyr Arg Ile Leu Ile Pro Gly Glu 180 185 190 Lys Leu Leu Ala Asp Pro Asp Leu Ala His Leu Ile Arg Asp Pro Cys 195 200 205 Thr Thr Ser Trp Cys Gly Pro Asp Ala His Leu Val Gly Tyr Pro Ile 210 215 220 Arg Asn Gly Glu Met Tyr Asn Ile Val Met Cys Ala Thr Ser Tyr Asn 225 230 235 240 Glu Thr Thr Asp Glu Val Trp Val Val Lys Gly Asp Asn Ser Glu Leu 245 250 255 Cys Lys Arg Phe Ala Ser Trp Glu Pro Gln Val Arg Lys Leu Cys Ala 260 265 270 Leu Thr Gly Asp Phe Met Lys Trp Arg Leu Cys Asp Leu Pro Asn Leu 275 280 285 Ala Arg Trp Thr His Pro Ser Gly Lys Ala Val Leu Leu Gly Asp Ser 290 295 300 Cys His Pro Met Leu Pro Tyr Leu Ala Gln Gly Ala Ala Gln Ala Val 305 310 315 320 Glu Asp Ala Ala Val Leu Arg Gln Val Leu Ala Gln Asp Met Asp Met 325 330 335 Ala Ala Ala Leu Lys Gln Tyr Glu Gln Ile Arg Met Pro Arg Ala Ser 340 345 350 Leu Val Gln Ala Lys Thr Arg Glu His Gln Tyr Ile Leu His Val Asp 355 360 365 Asp Gly His Glu Gln Gln Asp Arg Asp Lys Lys Leu Ala Leu Asp Ala 370 375 380 Ala Glu Asn Pro Val Phe Trp Gly Tyr Asp Asp Arg Arg Lys Trp Leu 385 390 395 400 Phe Ser His Asp Ala Glu Val Ile Gln Lys Glu Gly Ala Asn Trp Arg 405 410 415 Asp Gly Pro Asn Met Asn Gly Val His Val Ala 420 425 <210> 5 <211> 245 <212> PRT <213> Penicillium brasilianum <400> 5 Met Ser Leu Ser Gly Lys Val Val Leu Ile Thr Gly Ser Ser Lys Gly 1 5 10 15 Ile Gly Lys Ala Ala Ala Leu Arg Val Ala Ser Glu Gly Ala Asn Val 20 25 30 Val Ile Asn Tyr Leu Arg Asp Pro Val Ala Ala Asn Asn Leu Val Asp 35 40 45 Gln Ile Gly Ala Asp Arg Ala Leu Ala Val Gln Ala Asp Ala Ser Lys 50 55 60 Leu Ala Asp Leu Asp Arg Leu Val Asn Ala Ala Val Ala Gln Phe Gly 65 70 75 80 Lys Ile Asp Val Leu Ile Pro Asn Ala Gly Ile Leu Pro Leu Arg Asp 85 90 95 Leu Glu His Thr Ser Glu Glu Asp Phe Asp Arg Thr Tyr Asn Leu Met 100 105 110 Val Lys Gly Pro Tyr Phe Leu Ala Gln Lys Ala Val Lys His Met Pro 115 120 125 Pro Gly Gly Arg Ile Ile Phe Val Ser Thr Ser Thr Ala Arg Phe Ala 130 135 140 Ser Val Ala Pro Ala Tyr Leu Leu Tyr Thr Ser Ser Lys Gly Ala Ile 145 150 155 160 Glu Gln Met Thr Arg Ile Met Ala Lys Asp Leu Ala Arg Lys Gly Ile 165 170 175 Leu Val Asn Ala Val Ala Pro Gly Pro Thr Ser Thr Glu Leu Phe Leu 180 185 190 Glu Gly Lys Pro Glu Gln Met Ile Lys Ala Ile Ser Gly Phe Ser Pro 195 200 205 Phe Asn Arg Ile Gly Glu Pro Glu Glu Ile Ala Ala Val Met Ala Phe 210 215 220 Leu Ser Gly Lys Asp Ser Ser Trp Ile Ser Gly Gln Val Val Ala Val 225 230 235 240 Asn Gly Ala Met Ala 245 <210> 6 <211> 581 <212> PRT <213> Penicillium brasilianum <400> 6 Met Ala Ser Leu Ile Arg Glu Ala Pro Phe Gly Gln Ile Val Arg Tyr 1 5 10 15 Leu Thr Asn Asn Lys Tyr Phe Gln Tyr Pro Glu Glu Lys Pro Asp Phe 20 25 30 Lys Leu Pro Asp Thr Trp Leu Gln Leu Leu Asn Glu Ser Asp Ala Ala 35 40 45 Thr Ile Ala Asp Pro Glu Lys Thr Glu Pro Glu Pro Glu Gly Gln Gly 50 55 60 Tyr Asp Ala Thr Ser Glu Ala Ile Ser Arg Ala Ser Thr Gln Asn Ser 65 70 75 80 Leu Pro Phe Thr Glu Ala Arg Leu Glu Ala Asp Glu Gln His Glu Ile 85 90 95 Glu Lys Ile Lys Ser Ile Pro Ile Gln Pro Lys Lys Thr Lys Asp Gly 100 105 110 Ala Ile Leu Val Asp Trp Tyr Tyr Thr Asp Asp Ala Glu Asn Pro His 115 120 125 Asn Trp Ser Asn Arg Lys Arg Ala Leu Leu Thr Thr Leu Ile Cys Leu 130 135 140 Tyr Thr Phe Val Val Tyr Thr Thr Ser Ala Ile Tyr Thr Ser Ser Val 145 150 155 160 Pro Gly Ile Met Lys Glu Phe Gly Val Ser Asp Leu Val Ala Thr Leu 165 170 175 Gly Leu Ser Leu Tyr Val Leu Gly Tyr Gly Thr Gly Pro Leu Ile Phe 180 185 190 Ser Pro Leu Ser Glu Ile Pro Val Ile Gly Arg Asn Pro Val Tyr Ile 195 200 205 Val Thr Met Phe Leu Phe Val Ile Leu Ser Ile Pro Thr Ala Phe Val 210 215 220 Gly Asn Phe Ala Gly Leu Met Val Leu Arg Phe Leu Gln Gly Phe Phe 225 230 235 240 Gly Ser Pro Cys Leu Ala Ser Gly Gly Ala Ser Ile Gly Asp Met Tyr 245 250 255 Ser Leu Met Ser Leu Pro Tyr Ala Met Met Ser Trp Val Ser Ala Ala 260 265 270 Tyr Cys Gly Pro Ala Leu Gly Pro Leu Ile Ser Gly Phe Ala Val Pro 275 280 285 Ala Glu Thr Trp Arg Trp Ser Leu Phe Glu Ser Ile Trp Met Ser Ala 290 295 300 Pro Val Leu Ile Leu Met Phe Phe Phe Leu Pro Glu Thr Ser Ser Ala 305 310 315 320 Thr Ile Leu Leu Arg Arg Ala Ala Arg Leu Arg Lys Ile His Asn Asn 325 330 335 Ala Arg Phe Met Ala Gln Ser Glu Ile Asp Gln Arg Asn Met Lys Val 340 345 350 Ser Ala Val Ala Val Asp Ala Leu Ile Lys Pro Leu Glu Ile Thr Ile 355 360 365 Lys Asp Pro Ala Val Leu Phe Val Gln Val Tyr Thr Ala Ile Ile Tyr 370 375 380 Gly Ile Tyr Tyr Ser Phe Phe Glu Val Phe Pro Leu Val Tyr Pro Val 385 390 395 400 Asp Tyr Gly Met Asn Leu Gly Gln Val Gly Leu Val Phe Leu Cys Ile 405 410 415 Leu Val Ser Cys Ile Ile Gly Ile Ala Ile Tyr Trp Ser Tyr Leu Tyr 420 425 430 Phe Trp Met Asn Pro Arg Ile Glu Arg Phe Gly Phe Pro Ala Gln Glu 435 440 445 Ser Arg Leu Ile Pro Ala Leu Pro Ala Ser Ile Gly Pro Thr Ile Gly 450 455 460 Leu Phe Leu Phe Ala Trp Thr Ala Arg Ala Ser Ile His Trp Ile Ala 465 470 475 480 Pro Thr Ile Gly Ile Thr Ile Tyr Gly Ala Thr Val Phe Ile Val Met 485 490 495 Gln Cys Leu Phe Val Tyr Ile Pro Leu Ser Tyr Pro Met Tyr Ala Ala 500 505 510 Ser Leu Phe Ala Ala Asn Asp Phe Phe Arg Ser Ala Leu Ala Cys Gly 515 520 525 Ser Val Leu Phe Ala His Pro Leu Phe Gly Asn Leu Gly Val Ala Arg 530 535 540 Gly Thr Ser Leu Leu Gly Gly Leu Ser Val Ile Gly Ile Ile Gly Ile 545 550 555 560 Trp Leu Leu Tyr Tyr Tyr Gly Ala Arg Leu Arg Ser Leu Ser Lys Phe 565 570 575 Ala Ile Ser Asp Asp 580 <210> 7 <211> 513 <212> PRT <213> Penicillium brasilianum <400> 7 Met Ser Thr Thr Lys Glu Ala Phe Pro His Thr Asp Ser Asp Ile Met 1 5 10 15 Glu Asp Ser Glu Lys Asn Leu Pro Glu Cys Glu His Ile Val Ser Val 20 25 30 Glu Pro Thr Leu Lys Met Arg Asp Gly Ile Val Leu Met Pro Gln Pro 35 40 45 Ser Asp Asp Pro Asn Asp Pro Leu Asn Trp Ser Trp Phe Arg Lys His 50 55 60 Ala Ala Met Phe Thr Leu Ser Tyr Leu Ala Leu Val Cys Tyr Val Ala 65 70 75 80 Val Thr Thr Leu Val Thr Gly Thr Val Pro Leu Ala Lys Ser Met His 85 90 95 Val Ser Lys Ser Thr Ala Val Tyr Leu Gly Asn Thr Pro Val Ala Leu 100 105 110 Tyr Ala Val Ala Pro Trp Phe Trp Ser Pro Leu Ser His Phe Ile Gly 115 120 125 Arg Arg Pro Val Leu Leu Met Cys Asn Ile Ile Ala Val Val Gly Ala 130 135 140 Val Val Val Thr Thr Ser Lys Thr Tyr Ala Ser Cys Met Val Gly Arg 145 150 155 160 Val Ile Leu Gly Ala Gly Gly Ser Ala Phe Trp Thr Leu Gly Pro Ala 165 170 175 Ser Ile Gly Asp Ile Phe Phe Arg His Glu Lys Gly Lys Lys Ile Gly 180 185 190 Val Ser Thr Leu Ala Ile Val Ile Ala Pro Phe Leu Gly Thr Ile Ile 195 200 205 Gly Gly Pro Ile Ile Glu Asn Glu Lys Leu Gly Trp Pro Ala Ser Gln 210 215 220 Trp Ile Pro Leu Ile Phe Met Ala Ala Gly Phe Ile Met Gln Ile Phe 225 230 235 240 Phe Leu Pro Glu Thr Ile Tyr Ile Arg Glu Thr Arg Ala His Pro Ala 245 250 255 Ile Met Ser Thr Ser Thr Pro Gly Lys Pro Thr Phe Trp Asp Arg Tyr 260 265 270 Gly Ile His Ile Pro Lys Arg Ser Glu Glu Lys Gln His Ser Phe Leu 275 280 285 Phe Ile Ala Thr Arg Pro Phe Val Leu Phe Lys Phe Pro Ala Val Ile 290 295 300 Leu Ser Ala Phe Trp Phe Gly Ile Ala Tyr Met Met His Val Gly Ile 305 310 315 320 Thr Ser Glu Ile Pro Leu Ile Phe Glu Glu His Tyr Asp Phe Ser Val 325 330 335 Leu Glu Ile Gly Leu Ser Gly Phe Ser Gly Leu Ile Gly Ala Leu Leu 340 345 350 Gly Glu Val Tyr Ala Gly Pro Ser Leu Asp Phe Ile Ala Lys Arg Thr 355 360 365 Met Lys Gln Gly Arg Glu Trp Arg Pro Glu Tyr Arg Leu Gln Ala Ile 370 375 380 Trp Pro Ala Leu Ile Thr Val Pro Ala Gly Leu Ile Met Phe Gly Thr 385 390 395 400 Ser Ile Gln Phe Gly Asn Val Trp Ile Thr Pro Leu Ile Gly Gln Ala 405 410 415 Val Tyr Ile Phe Gly Ile Glu Ile Ala Thr Thr Val Ile Gln Thr Tyr 420 425 430 Ile Leu Glu Cys Tyr Pro Arg Gln Gly Ala Glu Ala Asn Leu Val Phe 435 440 445 Asn Leu Ile Arg Asn Leu Phe Ser Tyr Ile Ser Pro Phe Phe Val Gln 450 455 460 Pro Met Ile Ala Thr Leu Gly Thr Thr Ser Pro Phe Gly Leu Ser Ala 465 470 475 480 Ala Leu Thr Ala Phe Phe Phe Pro Phe Thr Val Gly Val Leu Met Trp 485 490 495 Arg Gly Lys Gln Ile Arg Asp Lys Gly Gly Asp Pro Gly Trp Ser Arg 500 505 510 Asp <210> 8 <211> 1435 <212> PRT <213> Penicillium brasilianum <400> 8 Met Glu Asp His Glu Lys Glu Tyr Asp Ser Thr Ser Pro Pro Gly Thr 1 5 10 15 Ala Thr Glu Glu Gly Asn Gly Gly Tyr Phe Asn Thr Leu Thr Val Pro 20 25 30 Glu Ile Asn Leu Arg Glu Ala Ser Ser Ala Glu Thr Leu Thr Pro His 35 40 45 Ala Ser Val Val Gln Pro Pro Lys Lys Ala Ala Glu Trp His Met Thr 50 55 60 Pro Gln Val Ile Arg Asn Ala Glu Arg Asp Glu Ala Ala Gly Phe Lys 65 70 75 80 Arg Arg Glu Leu Gly Val Thr Trp Gln Asp Leu Ser Val Glu Val Leu 85 90 95 Ala Ala Glu Ala Ala Val Lys Glu Asn Met Ile Ser Gln Phe Asn Val 100 105 110 Pro Gln Leu Ile Lys Asp Phe Arg Arg Lys Pro Pro Leu Lys Ser Ile 115 120 125 Leu Ser Asn Ser His Gly Cys Val Lys Pro Gly Glu Met Leu Leu Val 130 135 140 Leu Gly Arg Pro Gly Ser Gly Cys Thr Thr Leu Leu Lys Met Leu Ala 145 150 155 160 Asn Arg Arg Glu Gly Tyr Gln Asn Ile Thr Gly Asp Val Arg Phe Gly 165 170 175 Asn Met Thr Pro Glu Glu Ala Ser Arg Tyr Gln Gly Gln Ile Val Met 180 185 190 Asn Thr Glu Glu Glu Leu Phe Tyr Pro Arg Leu Thr Val Gly Gln Thr 195 200 205 Met Asp Phe Ala Thr Lys Leu Lys Val Pro Tyr His Leu Pro Gly Glu 210 215 220 Gly Lys Ser Val Ala Glu Tyr Thr Ala Glu Thr Lys Gln Phe Leu Leu 225 230 235 240 Glu Ser Met Gly Ile Ala His Thr Ala Asp Thr Lys Val Gly Asn Glu 245 250 255 Phe Val Arg Gly Val Ser Gly Gly Glu Arg Lys Arg Val Ser Ile Ile 260 265 270 Glu Cys Leu Ala Thr Arg Gly Ser Val Phe Thr Trp Asp Asn Ser Thr 275 280 285 Arg Gly Leu Asp Ala Ser Thr Ala Leu Glu Trp Ala Lys Ala Leu Arg 290 295 300 Ala Met Thr Asp Val Gln Gly Leu Ser Thr Ile Val Thr Leu Tyr Gln 305 310 315 320 Ala Gly Asn Gly Ile Tyr Asn Leu Phe Asp Lys Val Leu Val Leu Asp 325 330 335 Glu Gly Lys Gln Ile Tyr Tyr Gly Pro Ala Ala Glu Ala Lys Pro Phe 340 345 350 Met Glu Asn Leu Gly Phe Val Tyr Thr Asp Gly Ala Asn Ile Gly Asp 355 360 365 Phe Leu Thr Gly Leu Thr Val Pro Thr Glu Arg Lys Ile Arg Pro Gly 370 375 380 Trp Glu Asn Arg Phe Pro Arg Thr Ala Asp Ala Ile Leu Thr Glu Tyr 385 390 395 400 Gln Asn Ser Ala Thr Tyr Lys Asn Glu Val Ser Leu Tyr Gly Tyr Pro 405 410 415 Asp Thr Asp Leu Ala Ala Glu Arg Thr Glu Ala Phe Lys Glu Ser Val 420 425 430 Ala Trp Glu Lys Ser Lys His Leu Pro Lys Gly Ser Asp Leu Thr Thr 435 440 445 Ser Phe Trp Ala Gln Leu Met Ser Cys Thr Ala Arg Gln Tyr Gln Ile 450 455 460 Leu Trp Gly Glu Lys Ser Thr Phe Leu Ile Lys Gln Ile Leu Ser Cys 465 470 475 480 Val Met Ala Leu Ile Ala Gly Ser Cys Phe Tyr Asn Ser Pro Asp Thr 485 490 495 Ser Ala Gly Leu Phe Thr Lys Gly Gly Ala Val Phe Phe Ser Leu Leu 500 505 510 Tyr Asn Cys Ile Val Ala Met Ser Glu Val Thr Glu Ser Phe Lys Gly 515 520 525 Arg Pro Ile Leu Thr Lys His Lys Ser Phe Ala Met Tyr His Pro Ala 530 535 540 Ala Phe Cys Leu Ala Gln Ile Thr Ala Asp Phe Pro Val Leu Leu Phe 545 550 555 560 Gln Cys Thr Ile Phe Ser Val Val Ile Tyr Trp Met Val Gly Leu Lys 565 570 575 His Thr Ala Ala Ala Phe Phe Thr Phe Trp Ala Ile Leu Phe Thr Thr 580 585 590 Thr Leu Cys Ile Thr Ala Leu Phe Arg Phe Ile Gly Ala Ala Phe Ser 595 600 605 Ser Phe Glu Ala Ala Ser Lys Ile Ser Gly Thr Ala Val Lys Ala Ile 610 615 620 Val Met Tyr Ala Gly Tyr Met Ile Pro Lys Pro Glu Ile Lys Asn Trp 625 630 635 640 Phe Leu Glu Phe Tyr Tyr Thr Asn Pro Phe Ala Tyr Ala Phe Gln Ala 645 650 655 Ala Leu Thr Asn Glu Phe His Asp Gln His Ile Asp Cys Val Gly Gly 660 665 670 Asn Leu Ile Pro Ser Gly Pro Gly Tyr Glu Asp Val Gly Ser Gly Tyr 675 680 685 Lys Ala Cys Ala Gly Val Gly Gly Ala Leu Pro Gly Ala Asp Tyr Val 690 695 700 Thr Gly Asp Gln Tyr Leu Ser Ser Leu His Tyr Lys His Ser Gln Leu 705 710 715 720 Trp Arg Asn Phe Gly Val Val Trp Ala Trp Trp Gly Phe Phe Ala Val 725 730 735 Leu Thr Val Val Phe Thr Cys Phe Trp Lys Ser Gly Ala Ala Ser Gly 740 745 750 Ser Ser Leu Leu Ile Pro Arg Glu Asn Leu Lys Lys His Gln Val Gly 755 760 765 Asn Asp Glu Glu Ala Gln Asn Asn Glu Lys His Ala Ala Arg Thr Thr 770 775 780 Thr Asp Glu Pro Val Gln Val Glu Asp Asp Asn Leu Val Arg Asn Thr 785 790 795 800 Ser Ile Phe Thr Trp Lys Asn Leu Thr Tyr Thr Val Lys Thr Pro Thr 805 810 815 Gly Asp Arg Val Leu Leu Asp Asn Ile Asn Gly Trp Val Lys Pro Gly 820 825 830 Met Leu Gly Ala Leu Met Gly Ser Ser Gly Ala Gly Lys Thr Thr Leu 835 840 845 Leu Asp Val Leu Ala Gln Arg Lys Thr Glu Gly Thr Ile Lys Gly Ser 850 855 860 Ile Leu Val Asp Gly Arg Glu Leu Pro Val Ser Phe Gln Arg Met Ala 865 870 875 880 Gly Tyr Cys Glu Gln Leu Asp Val His Glu Ser Tyr Ala Thr Val Arg 885 890 895 Glu Ala Leu Glu Phe Ser Ala Leu Leu Arg Gln Ser Arg Asp Thr Pro 900 905 910 Lys Ala Glu Lys Leu Lys Tyr Val Asp Thr Ile Ile Asp Leu Leu Glu 915 920 925 Leu His Asp Leu Ala Asp Thr Leu Ile Gly Ser Val Gly Asn Gly Leu 930 935 940 Ser Val Glu Gln Arg Lys Arg Val Thr Ile Gly Val Glu Leu Val Ser 945 950 955 960 Lys Pro Ser Ile Leu Ile Phe Leu Asp Glu Pro Thr Ser Gly Leu Asp 965 970 975 Gly Gln Ser Ala Tyr Asn Thr Val Arg Phe Leu Arg Lys Leu Ala Asp 980 985 990 Val Gly Gln Ala Val Leu Val Thr Ile His Gln Pro Ser Ala Gln Leu 995 1000 1005 Phe Ala Gln Phe Asp Thr Leu Leu Leu Leu Ala Arg Gly Gly Lys 1010 1015 1020 Thr Val Tyr Phe Gly Asp Ile Gly Asp Asn Gly Ser Thr Ile Lys 1025 1030 1035 Gln Tyr Phe Gly Asn Tyr Gly Ala Ile Cys Pro Gln Glu Ala Asn 1040 1045 1050 Pro Ala Glu Phe Met Ile Asp Val Val Thr Gly Gly Ile Gln Glu 1055 1060 1065 Val Lys Asp Lys Asp Trp His Gln Ile Trp Leu Asp Ser Pro Glu 1070 1075 1080 Gln His Gln Met Ile Thr Glu Leu Asp Arg Met Ile Ala Asp Ala 1085 1090 1095 Ala Ser Lys Pro Pro Gly Thr Val Asn Asp Gly Tyr Glu Phe Ser 1100 1105 1110 Met Pro Leu Trp Glu Gln Ile Lys Ile Val Thr Gln Arg Met Asn 1115 1120 1125 Val Ser Leu Phe Arg Asn Thr Ala Tyr Val Asn Asn Lys Phe Ser 1130 1135 1140 Leu His Ile Ile Ser Ala Leu Leu Asn Gly Phe Ser Phe Trp Arg 1145 1150 1155 Pro Gly Pro Ser Val Ser Ala Leu Gln Leu Lys Met Phe Thr Ile 1160 1165 1170 Phe Asn Phe Val Phe Val Ala Pro Gly Val Ile Asn Gln Leu Gln 1175 1180 1185 Pro Leu Phe Ile Gln Arg Arg Asp Ile Tyr Asp Ala Arg Glu Lys 1190 1195 1200 Lys Ser Lys Met Tyr Ser Trp Val Ala Phe Val Thr Gly Leu Ile 1205 1210 1215 Val Ser Glu Phe Pro Tyr Leu Cys Ile Cys Ala Val Leu Tyr Phe 1220 1225 1230 Val Cys Trp Tyr Trp Pro Val Trp Arg Leu Pro His Asp Ser Asp 1235 1240 1245 Arg Ser Gly Ala Ile Phe Phe Met Met Leu Ile Tyr Glu Phe Ile 1250 1255 1260 Tyr Thr Gly Ile Gly Gln Phe Ile Ala Ala Tyr Ala Pro Asn Pro 1265 1270 1275 Thr Phe Ala Ala Leu Val Asn Pro Leu Ile Ile Ser Val Leu Val 1280 1285 1290 Leu Phe Cys Gly Val Phe Val Pro Tyr Asp Gln Leu Asn Val Phe 1295 1300 1305 Trp Lys Tyr Trp Met Tyr Tyr Leu Asn Pro Phe Asn Tyr Val Val 1310 1315 1320 Asn Gly Met Leu Thr Phe Gly Leu Trp Gly Gln Lys Val Thr Cys 1325 1330 1335 Asn Glu Ser Glu Tyr Ala Val Phe Asp Pro Leu Asn Gly Thr Cys 1340 1345 1350 Gly Glu Tyr Leu Ala Thr Tyr Met Ser Gly Lys Gly Ser Gly Val 1355 1360 1365 Asn Leu Leu Asn Pro Asp Ala Thr Ser Ser Cys Lys Val Cys Glu 1370 1375 1380 Tyr Thr Thr Gly Ser Asp Phe Leu Gln Thr Leu Asn Ile Asn His 1385 1390 1395 Tyr Tyr Tyr Gly Trp Arg Asp Ala Gly Ile Thr Val Ile Tyr Ala 1400 1405 1410 Ile Ser Gly Tyr Ala Leu Val Phe Gly Leu Met Lys Leu Arg Thr 1415 1420 1425 Lys Ala Ser Lys Lys Ala Glu 1430 1435 <210> 9 <211> 527 <212> PRT <213> Penicillium brasilianum <400> 9 Met Thr Pro Ile Ser Arg Leu Leu Ser Arg Ala Val Asn Lys Pro Tyr 1 5 10 15 Arg Thr Lys Asp Ile Thr Asp Glu Ile Pro Pro Thr Leu Asp Glu Asp 20 25 30 Gly Phe Val Ser Phe Gly Pro Gly Asp Ile Glu Asn Pro Arg Asn Trp 35 40 45 Ser Met Arg Arg Arg Ala Gly Val Thr Met Ser Ala Val Leu Leu Val 50 55 60 Val Asn Ala Thr Phe Ala Ser Ser Ser Pro Ser Gly Cys Phe Pro Ser 65 70 75 80 Ile Ser Lys His Phe Gly Val Ser Thr Glu Val Ala Gly Leu Thr Ile 85 90 95 Thr Leu Phe Leu Leu Gly Tyr Cys Ala Gly Pro Leu Ile Phe Ala Pro 100 105 110 Leu Ser Glu Phe Tyr Gly Arg Arg Trp Ile Phe Tyr Ile Thr Phe Leu 115 120 125 Leu Tyr Leu Ala Phe Asn Phe Leu Cys Ala Phe Pro Pro Asn Phe Gly 130 135 140 Ser Leu Leu Val Gly Arg Phe Leu Thr Gly Thr Phe Val Ser Ala Pro 145 150 155 160 Leu Ser Asn Cys Pro Gly Val Leu Ala Asp Val Trp Asn Pro Leu Glu 165 170 175 Arg Ala Asn Ala Met Ala Gly Phe Ser Ala Met Val Trp Ile Gly Pro 180 185 190 Ala Leu Gly Pro Val Val Ala Gly Phe Leu Gln Leu Lys Glu Asp Trp 195 200 205 Arg Trp Ser Phe Tyr Val Leu Leu Trp Leu Gly Gly Ala Ser Ala Val 210 215 220 Ile Met Leu Thr Ile Pro Glu Thr Tyr Ala Pro Ile Val Leu Tyr Asn 225 230 235 240 Lys Ala Arg Arg Ile Arg Glu Ala Gln Ile Pro Gly Tyr Glu Asn Val 245 250 255 Lys Ala Pro Val Glu Asp Gly Asp Arg Thr Leu Val Gly Ile Tyr Lys 260 265 270 Val Ala Leu Thr Arg Pro Trp Ile Ile Leu Phe Asp Pro Ile Ser Leu 275 280 285 Leu Cys Ala Ile Tyr Met Ala Phe Val Tyr Thr Leu Leu Tyr Met Leu 290 295 300 Phe Thr Ile Tyr Pro Ile Val Phe Gln Glu Lys Arg Gly Trp Asn Ser 305 310 315 320 Gly Val Gly Glu Leu Pro Leu Leu Gly Thr Val Val Gly Ala Leu Phe 325 330 335 Gly Gly Val Ile Val Val Ala Asp Thr Arg Met Arg Gln Lys Arg Ile 340 345 350 Asp Asn Gly Thr Thr Lys Met Glu Asp Ala Val Pro Glu Asp Arg Leu 355 360 365 Pro Leu Ala Met Gly Gly Gly Ile Gly Phe Ala Val Thr Met Phe Trp 370 375 380 Phe Ala Trp Ser Ala Glu Phe Asn Ser Val His Trp Ile Val Pro Thr 385 390 395 400 Leu Ala Gly Val Phe Leu Ser Ser Ala Leu Leu Leu Ile Phe Val Gly 405 410 415 Phe Leu Asn Tyr Leu Val Asp Val Tyr Gln Met Tyr Ala Ala Ser Ala 420 425 430 Ile Ala Ala Asn Thr Ile Ala Arg Ser Ala Cys Gly Ala Ala Ala Pro 435 440 445 Leu Phe Thr Ser Gln Met Phe Ala Ala Leu Gly Val Gly Gly Gly Gly 450 455 460 Ser Leu Ile Ala Gly Val Ala Thr Leu Leu Ala Ala Ile Pro Phe Leu 465 470 475 480 Phe Tyr Lys Tyr Gly Lys Gln Ile Arg Met Arg Ser Lys Phe Ala Pro 485 490 495 Thr Thr Lys Glu Glu Arg Pro Ala Glu Glu Asn Lys Asp Glu Glu Arg 500 505 510 Gly Leu Gly Asp Gly Ala Val Ser Ser Ser Ile Leu Gly Ala Gln 515 520 525 <210> 10 <211> 514 <212> PRT <213> Penicillium brasilianum <400> 10 Met Ala Ala Ser Asn Glu His Ala Thr Pro Ser Ile Asp Ser Ala Thr 1 5 10 15 Thr Lys Thr Ala Pro Ser Val Asp Ser Thr Pro Ala Met Ser Asp His 20 25 30 Val Asn Glu Asp Leu Glu Lys Gly Thr Arg Thr Thr Asp Pro Val Glu 35 40 45 Ala Glu Lys His Asp Leu Asn Val Asn Pro Leu Ser Glu Lys Ile Glu 50 55 60 Gly Thr Thr Pro Ala Pro Ala Gly Pro Pro Gly Pro Gly Pro Pro Pro 65 70 75 80 Asp Gly Gly Ala Glu Ala Trp Leu Val Val Leu Gly Ala Phe Cys Gly 85 90 95 Leu Phe Val Ser Phe Gly Trp Ile Asn Cys Ile Gly Val Phe Gln Thr 100 105 110 Tyr Tyr Glu Thr His Gln Leu Ser Asn Leu Ser Thr Ser Thr Val Thr 115 120 125 Trp Ile Thr Ser Leu Glu Thr Phe Val Met Phe Phe Ala Gly Pro Val 130 135 140 Phe Gly Thr Leu Phe Asp Ser Tyr Gly Pro Arg Tyr Ile Leu Leu Gly 145 150 155 160 Gly Thr Phe Leu His Val Phe Gly Leu Met Met Thr Ser Leu Ser Thr 165 170 175 Glu Tyr Tyr Gln Phe Ile Leu Ala Gln Gly Ile Cys Ser Pro Leu Gly 180 185 190 Ala Ser Ala Ile Phe Asn Ala Ser Ile Asn Ser Val Ser Thr Trp Phe 195 200 205 Ala Lys Arg Arg Ala Phe Ala Leu Gly Val Thr Ala Ser Gly Ser Ser 210 215 220 Leu Gly Gly Val Ile Phe Pro Ile Met Val Thr Asn Leu Ile Pro Glu 225 230 235 240 Val Gly Phe Pro Trp Ala Met Arg Ile Cys Ala Phe Leu Ile Leu Ala 245 250 255 Met Leu Gly Val Ser Asn Leu Thr Leu Lys Ser Arg Leu Lys His Thr 260 265 270 Arg Lys Pro Phe Asn Phe Met Asn Phe Val Arg Pro Leu Lys Asp Ile 275 280 285 Lys Phe Val Val Thr Val Ala Ala Ala Phe Cys Phe Phe Trp Gly Met 290 295 300 Phe Leu Pro Phe Thr Phe Val Ile Thr Gln Ala Gln Arg Tyr Gly Met 305 310 315 320 Ser Glu His Leu Ser Gln Tyr Leu Ile Pro Ile Leu Asn Ala Ala Ser 325 330 335 Val Phe Gly Arg Thr Leu Pro Gly Tyr Leu Ala Asp Arg Val Gly Arg 340 345 350 Tyr Asn Val Met Ile Phe Phe Ser Tyr Leu Ser Gly Ile Leu Val Leu 355 360 365 Ala Leu Trp Leu Pro Ser Arg Ser Asn Ala Pro Ala Ile Val Phe Ser 370 375 380 Ala Leu Tyr Gly Phe Gly Ser Gly Ala Phe Val Ser Leu Ala Pro Ala 385 390 395 400 Leu Ile Ala Gln Ile Ser Asp Val Arg Glu Val Gly Val Arg Asn Gly 405 410 415 Thr Cys Phe Ser Ile Ile Ala Phe Ala Ala Leu Thr Gly Thr Pro Ile 420 425 430 Gly Gly Ala Leu Val Pro Asp Val Leu Thr Gly Ser Tyr Thr Arg Leu 435 440 445 Gln Val Phe Ser Gly Val Val Met Leu Ala Gly Ala Thr Leu Phe Val 450 455 460 Val Ala Arg Leu Val Val Gly Gly Val Lys Phe Gly Lys Ser Leu Gly 465 470 475 480 Ser Gly Val Leu Met Gly Cys Ile Ser Asn Gly Leu Ile Glu His Asp 485 490 495 Arg Arg Met His Trp His Tyr His Val Val Ile Cys Cys Ala Ala Thr 500 505 510 Asp Ser <210> 11 <211> 872 <212> PRT <213> Penicillium brasilianum <400> 11 Met Cys Gln Asp His Asp Leu Glu Cys Ser Tyr Thr Leu Pro Arg Lys 1 5 10 15 Thr Arg Phe Tyr Gly Ser Val Asp Asp Leu Ser Asp Arg Tyr Lys Cys 20 25 30 Leu Glu Ala Ile Val Arg Ala Ala Phe Pro Asn Asp Gly Ile Ser Thr 35 40 45 Val Pro Glu Leu Ile Arg Leu Gly Glu Arg Met Gly Tyr Ala Met Pro 50 55 60 Asp Leu Ser Gln Lys Ser Gly Glu Ser Pro Arg Ile Glu Glu Leu Val 65 70 75 80 Arg Asp Phe Pro Thr Glu Ala Gly Asp Gln Gly Leu Ala Gly Ser Thr 85 90 95 Gln Cys Thr Ser Ser Pro Pro Arg Thr Gly Ala Val Asn Val Pro Thr 100 105 110 Glu Ser Glu Arg Arg His Ser Ser Ser Gln Val Gln Glu Asn Asn Ser 115 120 125 Cys Pro Asp Glu Pro Val Gly Leu Ile Arg Asp Thr Thr Gly Arg Glu 130 135 140 His Phe Ile Gly Pro Ser Gly Ser Leu Gln Phe Leu Gly Gln Leu Arg 145 150 155 160 Arg Leu Leu Leu Ile Ser Arg Ser Gly Asp Ala Val Glu Ser Arg Ala 165 170 175 Pro Ala Arg Leu Thr Ala Thr Phe Thr Asp Glu Asp Ala Ala Gln Ala 180 185 190 Leu Glu Ala Asp Gly Asp Gln Ser Glu Leu Ala Ala Leu Pro Ser Gly 195 200 205 Gly Thr Gly Asn Gly Gly Asp Glu Gly Gln Glu Ile Asp Glu Arg Ser 210 215 220 Pro Ala Ser Leu Gly Ser Ala Leu Val Arg Asp Phe Ser Ser Ile Pro 225 230 235 240 Val Asn Asp Ile Asp Glu Met Arg Arg Gln Leu Pro Pro Arg His Val 245 250 255 Leu Asp Ser Leu Met Arg Val Tyr Phe Lys Asn Val His Pro Asp Phe 260 265 270 Ala Leu Phe His Arg Gly Thr Phe Glu Glu Glu Tyr Glu Thr Phe Met 275 280 285 Ser Lys Gly Arg Tyr Tyr His Gln His Ala Arg Ala Gly Val His Leu 290 295 300 Ser Ser Pro Thr Leu Pro Glu Pro Gly Trp Leu Gly Cys Leu His Met 305 310 315 320 Met Ile Ala Phe Ala Ser Leu Asn Gly Ser Val Asp Val Ala Pro Asp 325 330 335 Leu Asp Leu Thr Ser Leu Cys Arg His Cys Ala Ser Leu Thr Arg Gln 340 345 350 Leu Leu Pro Gln Phe Ile Ser Lys Cys Thr Leu Ser Asn Val Arg Ala 355 360 365 Leu Leu Leu Leu Ser Leu Phe Leu His Asn His Asn Glu Arg Asn Ala 370 375 380 Ala Trp Asn Leu Val Gly Thr Ala Met Arg Leu Ser Phe Ala Met Gly 385 390 395 400 Leu His Arg Ala Ser Asp Asn Gly Ser His Phe Arg Pro Ile Glu Arg 405 410 415 Glu Val Arg Lys Arg Val Phe Cys Thr Leu Tyr Gly Phe Glu Gln Phe 420 425 430 Leu Ala Ser Ser Leu Gly Arg Pro Ser Gly Phe Tyr Asp Phe Glu Asp 435 440 445 Val Glu Ile Val Pro Pro Arg Glu Gly Val Leu Asp Ser Gly Gln Asp 450 455 460 Glu Asp Asp Glu Val Met Lys Leu Ser Leu Arg Leu Gln Val Ile Leu 465 470 475 480 Ala Lys Ala Arg Val Ser Leu Ala Val Lys Thr Leu Ala Val Ala Asn 485 490 495 Glu Arg Gly Asn Ile Asp Gly Leu Ala Arg Gln Gln Gln Ser Ser Arg 500 505 510 Glu Thr Leu Glu Ile Leu Lys Ala Trp Arg Glu Asp Leu Ala Ser His 515 520 525 His Ile Leu Asn Ile Pro Leu Ile Ser Glu Thr Asp Asp Pro Leu Cys 530 535 540 Gln Tyr Ala Glu Glu Ile Pro Arg Met Ser Leu Gln Asp Leu Lys Ala 545 550 555 560 Met Met Gly Trp Gln Ser Arg Pro Arg Leu Arg Ala Ala Leu Val Leu 565 570 575 His Leu Gln Tyr Arg Tyr Ile Ala Val Leu Val Thr Arg Ser Ser Leu 580 585 590 Leu Arg Tyr Val Ala Ser Ala Gln Arg Gly Glu Pro Glu His Glu Ala 595 600 605 Leu Leu Ser Arg Asn Glu Ala Arg Thr Asp Pro Tyr Asn Ser Glu Ala 610 615 620 Gly Glu Arg Leu Ser Asp Ile Cys Val Thr His Ala Thr Gln Leu Cys 625 630 635 640 Arg Leu Ile Leu Leu Ala Asp Ser Phe Gly Leu Val Asn Gly Ile Ser 645 650 655 Ala Met Asp Val Phe Tyr Val Tyr Cys Gly Val Met Val Leu Ile Leu 660 665 670 Arg Ser Leu Arg Ile Ser Ser Ser Ala Ser His Tyr His Asp Gln Arg 675 680 685 Glu Ala His Leu Gln Leu Glu Leu Arg Lys Leu Ile Ala Gln Thr Arg 690 695 700 Glu Val Leu Ile Arg Val Asn Lys Cys Ser Thr Met Lys Arg Phe Ala 705 710 715 720 Arg Val Val Ala Thr Phe Glu Asp Gly Ser Arg Gln Asp Asn Ile Arg 725 730 735 Pro Ala Asp Gly Ser Thr Asn Arg Ser Thr Ala Asn Cys Glu Met Arg 740 745 750 Thr Ala Arg Gln Ala Ser Arg Asp Pro Arg Gly Arg Phe Asn His Ser 755 760 765 Ile His Ala Ala Leu Asp Gly Gly Arg Ala Ser Asn Leu Ala Ile Phe 770 775 780 Pro Gly Ala Gly Gly Ser Leu Asp Thr Ser Ser Ser Leu Pro Val Ser 785 790 795 800 Gln Gln Glu Pro Leu Asn Phe Gln His Gly Tyr Gly Asn Gly Ile Gly 805 810 815 Pro Arg Leu Gly Ile Ser Asp Pro Phe Trp Gln Pro Asn Leu Leu Thr 820 825 830 Ser Phe Asp Gly Glu Pro Glu Ala Asn Gly Trp Met Met Asp Pro Phe 835 840 845 Leu Ala Met Asp Gly Thr Gly Val Val Asp Trp Gly Asp Ile Glu Ser 850 855 860 Leu Leu Ser Arg Asn Pro Gly Gln 865 870 <210> 12 <211> 1056 <212> DNA <213> Penicillium brasilianum <400> 12 atgggctcgc tatctctacc ggagacgtct cttgcggcaa tccaagataa ggagaccaag 60 gccatctccg tcgccaaacg cccaactcca gtccccgtcg gcactcaagt cctcgtcaag 120 ctacactact ccggtgtctg cgccacagat ctccatctgg cccgcggcag cgtcccctat 180 ctgcagccca aggtctcggt aggcggccat gagggcacgg gggtaatcgc cagcctcggc 240 cccgacgtgg acgccgcgga gtggcacgtc ggcgaccggg tcgcggtgcg gtgggtgcac 300 atcgtctgcg ggaagtgcga ggtgtgcact accggctttg agaacctgtg ccaaagccgg 360 aagctcgctg gcaaggacgt tgagggcacc tttgccgagt acgctattgc ggacagctcg 420 tacatggtcc gcctgccggc tggggtgagc gacgccgatg ccgctccgat actgtgcgcc 480 ggtgtcaccg tctacaaggc gctcaagatc gccagcctcc gggcgggctc gtgggtcgcc 540 gtggccgggg ctggtggcgg cttgggtcat ctggctattc aatatgcacg tgccatgggg 600 ctcaaggtcg tggccctgga tgctaggaaa cgggatctct gcctgagcct gggcgcggaa 660 tcgtacatcg acgtgctcga aacggacgac tgcgtagccc aggtgatcaa ggtcacggat 720 gggggcgctc atggcgcact catctgcgcc tcgtccggcc aggcctatga cgatgccgtc 780 aaattcctaa gatggaccgg caccctggtg tgtatcggcc tccccccaaa gccgacactg 840 ctctccctag gccccgcgga cttcgtcgcc cgtggcatca aggtcatggg cacatccaca 900 ggtgaccgcc aggacacggt ggaggccctc gcctttgtcg ccaagggcca ggtaaaaccg 960 cagttaactg agagaaggct ggaggatgtt gaggagatct taaaggagat cgagaatggg 1020 actatgcagg gtaaagctgt gatcaggata gcctga 1056 <210> 13 <211> 1020 <212> DNA <213> Penicillium brasilianum <400> 13 atgagtctgc cgtctcacta caaacgggcc gcctttaaag aggctggcgg cccgctcacc 60 attgaagaag tcgacttgac catgccggat gctggcgaag tgctggtgaa ggtggaagct 120 tgcggagttt gtttctccga cacggttcca caggctcatg gcctgggggg gaaatttcca 180 atcgtacccg gtcatgaaat catcggacat gtggttgcga caggtgacgg tgtctcggac 240 tgggaggttg gcgatcgtat cggcgaagga tggcacggcg gccatgacgg aacttgtccc 300 tcctgtcgcc agggccattt ccaaatgtgc gacaatcaga gcatcaatgg ggtgaccaaa 360 aacggcggat atgcccaata ctgcattctc cgtagtgaag ctgctgtcag aattcccact 420 catgtctcag ccgccgagta tgccccaatt ctctgcgcgg gcgtgaccgt cttcaactca 480 atgcgtcaaa taggggtcaa acctggctct accgttgcca ttcagggtct gggaggtctc 540 ggccatcttg ccatccaata tgcgaatcgc ttcggcttcc gagtggtggc catctctcgc 600 gatgatcaaa aggagcgatt tgtgcgagac ctcggtgccc acgagtatat caatacaagc 660 gaagaagatg tcggaagcgc gctccagaaa ctgggaggtg cttctctgat tgtagccacc 720 gcgcccaatg cccgggccat ttcccctcta ttgaagggcc ttagacctct gggtaagctt 780 cttattctcg ccgttccggg tgaaatcccc ctcgatacac ggcttatggt cgcccgaggt 840 ctttctgtcc acggatggcc gagtgggcat gcacttgatt ctgaggaaac cattcgcttt 900 acagaattag aggatatcaa gtgtatgatc cagacatatt ctcttgatcg tgccaatgaa 960 gcattcgatg ccatgatttc ggggtcggtt cgattccgtg cggtgattac catggagtaa 1020 <210> 14 <211> 1518 <212> DNA <213> Penicillium brasilianum <400> 14 atgactcaaa ccaacgtcca tgtcaacaag tctgatactt cactggcagc tccgcaacag 60 ttattcatct cgggaaaata ccagaacagc cagaggaatg ggaccttccc cgtgaagaac 120 cccatgacgg gcgagaccat atacgagtgc gtctcagcct ctctagacga ctacgccgcc 180 gccatcgagg aagcagatgc agcccaacct tcgtgggctc gcctcggccc ctcagcccgg 240 cggttgatcc ttctcaaggc cgccgacatc atggagacgt acatcgagac agacgcgccg 300 gccatccttt cagccgaggt ttcggccact aggggatggg tcagggccaa cattctgtcc 360 acagccggcg tcttccgcga gaccgccgcc ctggcaacgc atatcaaggg agagatcgtt 420 cccgcggacc ggccgggcac cacgatcctg gtgagccgcg agcccgtcgg cgtggtcctg 480 gccatcagcc cctggaatat gcccgccaca ctgacggcca gggcgatctg ctgcccgctg 540 atctgcggga atagcgtggt cctgaggccg tctgagttca gccccaagtc gcagcacctc 600 gtcgtgcgcg ctctgaccga ggctggactg ccggcggggt gcctgcagtt cctgcccacc 660 agcaccgccg acacgccgcg agcgatcgag tttgcaatcc gacacccgaa ggtgagccgc 720 gcaaacttca cgggcagcga ccgcgttggc cgcatcatcg ccgggctatc ggcatcctgt 780 ctgaagccgt gcgtgctgga gctaggcggc aaggcgcccg tcgtggtcct ggaggatgcc 840 gatgtggagg ccgccgtgga ggcagtggtg tatggcgcga tgtccaacag cgggcagata 900 tgtatgtcca cagagcgggc gatcgtgcat cgctccctgg cagcggactt caaggccctg 960 ttggtgaaac gggcggagag cctgcgggta gggaaccacc tcgaggaccc ggacgtgcag 1020 ctctcgggcc ttttcactgc cgcctccgcc gagcgtgtac tcggcctgat caagggcgcc 1080 gtcaacgcag gtgccacgct cctggcgggc gatctggctc ttcacggacc gtgccagaca 1140 atcatggctc cccacatcct cacgggcgtc acgcgggata tggacctctt ccatcgggag 1200 acgttcggcc ccgtgctctt cgtgtccgag ttcgacacgg acgatgaggc catcgcgcag 1260 gccaacgaca ccgagttctc tctgtgtgcc agcgtcttct cgcgtgacgt cctgcgcgcc 1320 atggacacgg ccaagcggat ccggacaggg agctgccacg tcaatgggcc gaccgtgtac 1380 atcgaggcgc cgctgcccaa cgggggtgtc ggcggcggga gcggctacgg ccggttcggt 1440 ggtgtggcgg gcatcgagga gtttacggag aggcagatcg tgagcttagc gaagccgggg 1500 attaagtatg cgttctag 1518 <210> 15 <211> 1284 <212> DNA <213> Penicillium brasilianum <400> 15 atgcctcacg catccagatc attgaacgtt ctcatcgtcg gtgctggctt gggcggcctc 60 gcggcgggat tagctttgca gacggacggc cacaaggtca caatcattga tgccgctcct 120 gagttcgcag aggccggagc ggggatcagg atcccaccca actcgagccg gctgctcatg 180 cgatggggcg ttgatctgga gaggatgaag aagtcgactt cacagagata tcacttcatc 240 cgctggaagg atggcagcac catcttcgac ttgcccttca acaatatcgt cgagacacac 300 ggggcgcctt actggcttgt ccatagagcc gacttgcacg ccgctctgct cgatgcgacc 360 ctgaaggccg gtgtcaaggt tctaaacaac aagcttgtca cgtcctacga cttcgaggca 420 ccgagcgcca ccacacagga tggcgagacc ttcaaggccg atcttatcgt cggtgcggac 480 ggcataaagt ccatctgccg accccttctt accggtcagc cggacgtccc gcgggacacg 540 ggcgacgtcg cctatcggat tctcatccct ggtgagaaac tgctggccga cccggacctg 600 gcccatctga tccgcgaccc ttgcacgaca tcgtggtgtg gcccggacgc gcacctggtc 660 ggctacccga tccgcaacgg cgagatgtac aacatcgtca tgtgtgccac ctcctacaac 720 gagaccacgg acgaggtctg ggtcgtcaag ggcgacaaca gcgagctgtg caagcgcttc 780 gccagctggg aaccccaggt gcggaagctc tgcgccctca cgggcgactt catgaagtgg 840 cgcctgtgcg acctgcccaa cctcgcccgc tggacgcacc cctcgggcaa ggccgtgctg 900 ctgggcgaca gctgccaccc catgctgcct tacctggccc agggcgctgc ccaggccgtc 960 gaggatgccg ccgtcctgcg ccaggtgctc gcccaggaca tggacatggc cgcggcccta 1020 aagcagtatg agcagatccg catgccgcgg gcgagcctgg tgcaggccaa gactcgcgag 1080 caccagtaca tcctccacgt cgacgacggt cacgagcagc aagaccggga caagaagttg 1140 gctctcgatg cggcggagaa cccggtcttc tggggctacg acgaccggag aaaatggctc 1200 tttagccatg atgcagaggt gatccaaaaa gaaggtgcga actggagaga cgggcccaac 1260 atgaatggcg tgcatgttgc ttag 1284 <210> 16 <211> 738 <212> DNA <213> Penicillium brasilianum <400> 16 atgtctctgt ctggcaaagt cgtcctcatc accggctcct ccaagggaat cggcaaagct 60 gctgcccttc gtgtcgccag cgaaggtgcc aacgtcgtga tcaactatct tcgtgacccg 120 gttgcagcca acaatctcgt cgaccaaatc ggtgccgacc gcgcccttgc tgttcaagct 180 gatgcttcaa agctggccga cctcgatcgc ctcgtcaatg ccgctgtcgc ccagttcggc 240 aagatagatg ttcttattcc aaatgccgga atcctcccgc ttagagactt ggagcatact 300 agcgaagagg actttgacag aacctacaat ctaatggtaa agggaccata cttcctggcc 360 cagaaagccg tgaagcatat gccccctgga ggacgaatca tctttgtctc tacctcaacc 420 gcccgattcg caagcgtggc tcccgcatac ctactctaca cctcctccaa aggcgcgatc 480 gagcagatga cccgaatcat ggccaaggat ttggcgcgaa agggaatctt ggtgaatgcg 540 gtcgctcccg gtccaacttc aaccgaactc ttcctcgagg gaaagccgga gcaaatgatc 600 aaggctatct ctgggtttag tccattcaat cggatcggag agcccgagga aattgccgca 660 gtcatggcgt tcttgtctgg gaaggacagc agttggatct caggacaggt tgtggctgtg 720 aacggagcta tggcatga 738 <210> 17 <211> 1746 <212> DNA <213> Penicillium brasilianum <400> 17 atggcatctc tcattcgaga ggcccccttt gggcaaatag ttcgatatct caccaacaac 60 aaatatttcc aatatcccga agaaaagccg gacttcaaac ttcccgatac atggcttcaa 120 ttattgaacg aatcggatgc cgcgacgata gccgatcccg agaaaacgga gccggagcca 180 gagggtcagg gctacgatgc aaccagcgag gcgattagtc gcgcatcaac ccaaaactcc 240 ttgcccttca cagaagctcg actggaagcg gatgagcagc atgagatcga aaagatcaag 300 tccattccta ttcagcctaa aaagaccaag gatggtgcga ttttggtcga ctggtactat 360 accgatgatg cagagaaccc acacaattgg tcgaatcgaa agcgagcact tctgacgacg 420 ctcatttgtc tttatacctt tgtggtatac acgacctctg caatttacac atcctccgtg 480 cccgggatca tgaaggagtt cggcgtcagt gacttggttg ctacactggg actgtccttg 540 tatgtccttg gctatggaac gggtcccctg atcttctcgc ctctgagtga gatccccgtg 600 attggtcgga acccggtcta tatcgtgacc atgttcctct ttgtgattct ctccattccc 660 actgcttttg tgggtaactt tgcaggactc atggtgcttc gtttcctgca aggattcttc 720 ggctcgccct gtctcgcttc tggaggtgct tcaattggcg acatgtacag tctcatgtct 780 ctcccttatg ccatgatgag ctgggtgtct gccgcttact gtggtcccgc cctgggtcct 840 ctcatcagtg gcttcgcagt tcccgccgag acctggcgct ggtccctgtt tgaatccatt 900 tggatgtcag ctccagtcct cattctgatg ttcttcttcc tccccgagac tagcagtgca 960 actatcctgc tccgtcgtgc cgctcgtctc cgcaagatcc ataacaacgc acgcttcatg 1020 gctcagtccg agattgacca gcgtaacatg aaggtctcgg ccgttgctgt cgacgccctg 1080 attaagcctt tggagattac catcaaggat cccgcggtgc tcttcgtcca ggtctacacc 1140 gccattatct acggcatcta ctactccttc ttcgaggtct tccccctggt ctaccccgtc 1200 gattatggca tgaatcttgg ccaagttggc ctggtcttcc tgtgtatcct ggtgtcctgc 1260 atcatcggta tcgccatcta ctggtcttac ctttacttct ggatgaaccc tcgcattgaa 1320 cgcttcggat tcccagctca agagtcccgt cttatccccg ccctgccagc ttctattgga 1380 cccaccattg gcttgttcct ctttgcctgg acagcccgtg cctcaatcca ctggattgcc 1440 ccgacaatcg gaatcaccat ctacggtgcg acggtcttca tcgtgatgca gtgcttgttt 1500 gtctacatcc ccttgagcta tccaatgtac gccgctagtc tgttcgctgc gaacgacttc 1560 ttccgcagtg ctctggcttg cggtagtgtc ctgtttgctc acccgttgtt tggcaacctc 1620 ggtgtcgctc ggggtaccag tctactcggt ggtctgagtg tgattggtat tatcggaata 1680 tggctgcttt actactatgg tgcccggctt cgctctttga gcaagtttgc catctccgat 1740 gattga 1746 <210> 18 <211> 1542 <212> DNA <213> Penicillium brasilianum <400> 18 atgagcacga ccaaggaagc tttcccacat acggatagcg acataatgga ggactcggag 60 aagaatctcc cagagtgcga gcatatcgtc tccgtggagc ccaccctcaa gatgcgcgac 120 ggcatcgtcc tgatgccgca accgtccgac gaccccaacg acccgctcaa ctggtcctgg 180 ttccgcaagc acgccgccat gttcaccctc tcgtatttgg ccctcgtctg ttacgtggct 240 gtgaccacgc tggttacggg aacagtgccc ctagccaagt ccatgcatgt ctccaagtcg 300 acggccgtct atctgggcaa cacgcccgtc gctctctacg ccgtggcgcc ctggttctgg 360 agcccgctga gccactttat aggccgtcgc ccggtgctgc tgatgtgtaa tatcatcgcc 420 gtcgtcgggg cggtcgttgt tacgacgtcc aagacatatg cgtcttgcat ggttggccgc 480 gtcatcctcg gtgccggtgg ttcggccttc tggacactgg ggccagccag tattggggac 540 attttcttcc gccacgagaa gggcaagaag attggtgtgt cgaccttggc cattgtgatc 600 gccccattct tggggacaat catcggcgga cccatcatag aaaacgagaa gctgggctgg 660 ccggcctccc agtggatccc cctgattttc atggccgccg gcttcatcat gcagatcttc 720 ttcctcccgg agaccatcta catccgagag acacgcgcgc atcctgcaat catgtccaca 780 tctacgccgg gcaagcccac gttctgggac cgctatggga tccacatccc caagcgctcg 840 gaggagaagc agcacagctt tctcttcatc gcgacgcgcc ctttcgtcct cttcaagttc 900 cccgcggtga tactgtcggc cttctggttc ggcatcgcct acatgatgca cgtgggcatc 960 acgtccgaga tcccgctcat cttcgaggag cactacgatt tctccgtgct cgagatcggg 1020 ctgtcgggct tctcgggact catcggcgcc ctgctcggcg aggtatacgc gggaccctcg 1080 ctggatttca tcgctaagcg gaccatgaag cagggtcgcg agtggcgccc cgagtaccgc 1140 ctgcaggcga tctggccggc gcttattacc gtgccggctg gtctgatcat gttcggcaca 1200 tcgatccagt tcggaaatgt ttggatcact cctctgatcg ggcaggccgt ttatatcttc 1260 ggcatcgaga ttgccaccac ggttattcaa acctacattt tagaatgtta ccctcgccag 1320 ggcgccgagg cgaacttggt cttcaacctc atccgcaacc tgttctccta tataagtccg 1380 ttctttgtgc agccaatgat cgccaccctc ggtaccacct ctccgtttgg tctctctgct 1440 gccttgactg ccttcttctt ccctttcact gtgggtgtct tgatgtggcg gggcaaacag 1500 atccgggata aaggaggcga cccgggctgg agcagggatt aa 1542 <210> 19 <211> 4308 <212> DNA <213> Penicillium brasilianum <400> 19 atggaggacc acgaaaaaga atacgatagt acctcacctc ccggaacggc cacggaagaa 60 gggaatggag gttacttcaa taccctcacc gttcctgaaa tcaacctccg agaagccagc 120 agtgccgaaa ccttaactcc tcacgcctcc gtcgtccaac ctcccaaaaa ggccgcagaa 180 tggcatatga caccacaagt cattcgcaat gccgaacgtg atgaagcagc tggttttaaa 240 aggcgtgagc tgggtgtcac ttggcaagac ctgtcggtcg aggttctcgc tgctgaagcg 300 gctgtcaaag agaacatgat ctcccaattc aacgttcctc aactcatcaa ggatttccgc 360 cgcaaaccac cactcaagtc gatcttgtcc aacagccatg gatgtgttaa gcctggagaa 420 atgcttctcg ttcttggaag acccggatcc ggatgcacta cccttctcaa aatgcttgcc 480 aaccgtcgtg agggatatca gaacatcacc ggagatgtaa gattcggaaa tatgactccg 540 gaagaagcat caagatatca aggccagatt gtgatgaata ccgaggagga gcttttctac 600 cctcgtttga cggtgggtca gacaatggat tttgctacca agcttaaggt cccatatcac 660 cttcctggag aagggaagag cgttgctgag tataccgccg aaacgaagca attcctcctc 720 gagtctatgg gaatcgccca tactgccgat acaaaagttg gcaatgaatt cgtccgaggt 780 gtcagtggtg gagaaagaaa gcgagtgtct attattgagt gccttgccac aagaggctct 840 gtttttactt gggataactc aacgagagga ctcgatgctt ccacggcctt agagtgggcc 900 aaagcccttc gcgccatgac cgacgtccaa ggtctttcga ctattgtaac gctctatcaa 960 gctggaaatg gaatttataa tcttttcgac aaagttctcg tcctcgacga aggaaagcag 1020 atctattacg gccctgccgc ggaagcgaaa cctttcatgg agaaccttgg ctttgtttac 1080 actgatggtg ccaacattgg tgatttcctc acggggttga ctgttccgac cgagcgaaag 1140 atcagacctg gttgggaaaa tcggttcccc aggacggccg acgccatttt gaccgagtac 1200 cagaactcgg cgacatataa gaatgaagtc tcactatacg gatatcccga cactgacctt 1260 gctgccgaac gcactgaggc cttcaaggaa tctgtggcct gggaaaagtc taaacactta 1320 cccaagggta gtgacctgac tactagtttc tgggcccagc tcatgtcatg cacggctaga 1380 cagtaccaga tcctctgggg cgagaagagc acgttcctga tcaaacagat tctgtcttgt 1440 gtcatggcct tgattgccgg gtcttgcttc tacaactctc cagatacctc tgcaggtctc 1500 ttcaccaagg gtggtgccgt tttcttctcg ttgctttaca actgcattgt ggccatgtcc 1560 gaggtcaccg aatctttcaa aggtcgtcct attttgacga aacacaaatc ttttgccatg 1620 tatcacccgg ctgctttctg tctggcccaa attactgcgg atttcccggt gttactgttc 1680 caatgcacga tcttctcggt cgttatctat tggatggttg gattgaagca taccgcggct 1740 gcatttttca ctttctgggc aatccttttc actacgacct tgtgcatcac agcgttattc 1800 agatttatcg gcgctgcttt cagtagcttc gaagctgcat ccaagatcag tggcaccgct 1860 gttaaggcaa tcgtcatgta tgcaggttac atgattccaa agccagagat caagaactgg 1920 ttcctcgagt tctactacac caatccgttt gcttatgcat tccaagctgc tttgaccaac 1980 gaattccacg accagcatat cgactgcgtt ggcggtaatc ttattcccag tggtcctgga 2040 tacgaggatg ttggatccgg ctataaagca tgtgctggag ttggtggtgc tcttcctggt 2100 gcagattatg tgactggaga tcagtatctt tcttctctac actacaagca ttctcaattg 2160 tggcgaaact tcggcgttgt ctgggcctgg tggggcttct tcgctgttct cacggtcgtc 2220 ttcacttgct tctggaaatc tggtgctgca tctggatctt cgcttctcat tccccgcgag 2280 aaccttaaga aacaccaagt tggcaatgat gaggaagccc aaaacaatga gaaacatgcc 2340 gctcggacga ccaccgatga gccagttcaa gtcgaggatg acaatcttgt gcgcaacaca 2400 tctatcttca catggaagaa tctcacctat acagtcaaaa caccaactgg cgaccgagtc 2460 ctcctggaca acatcaatgg atgggtgaaa cctggtatgc ttggtgcact catgggatct 2520 tccggagccg gcaaaacaac tctacttgat gttcttgcac agcgcaagac ggaaggtacc 2580 atcaaaggct ccattttggt tgacggtcgc gaattacctg tctctttcca aagaatggcc 2640 ggctactgtg agcaattgga tgttcatgag tcttacgcca ctgtgagaga agccctggag 2700 ttttctgctc tcctgcgaca gtctcgagat actcctaaag ctgagaaact taaatacgtc 2760 gacacaatta ttgacctctt ggagctgcat gatctcgccg acactctgat cggttccgtg 2820 ggtaatggct tgtctgttga acagcgcaaa cgtgtgacaa tcggtgtgga gctcgtgtcg 2880 aagcctagta ttctcatctt cttggatgag cccacttcag gtcttgatgg tcaatctgcg 2940 tataacactg tcagatttct tcggaaacta gccgatgtgg gccaagcagt tcttgtcacg 3000 attcaccagc cttcagctca gctattcgct caattcgata cccttctact ccttgcgaga 3060 ggtggcaaaa cggtctactt tggtgacatc ggggacaatg gatccacgat taagcagtac 3120 tttggcaatt acggggctat ctgccctcaa gaggcaaatc cagcagagtt catgattgac 3180 gtcgttaccg gtggtatcca agaagtgaag gacaaggatt ggcatcagat ctggcttgac 3240 tctcccgagc agcatcagat gatcaccgaa ttggacagaa tgattgcaga tgccgctagt 3300 aagccaccgg gaactgtcaa tgatggctat gagttttcaa tgcctctctg ggaacagatc 3360 aagattgtca ctcagcgcat gaacgtctcg cttttccgta atacggccta tgtcaacaac 3420 aagttctcgc ttcacatcat ctcagcattg ttgaacggat tctctttctg gcgacctggt 3480 cctagtgtga gtgcgttgca gctgaagatg ttcaccatct tcaattttgt tttcgtcgct 3540 ccaggtgtca tcaatcaact ccaacccctc ttcatccagc gccgcgatat ctacgatgct 3600 cgcgaaaaga agtccaagat gtattcctgg gtagctttcg tcactgggct tatcgtttcg 3660 gagttcccat atctctgcat ctgcgcagtt ctatactttg tttgctggta ctggcccgtc 3720 tggagattgc ctcatgactc tgaccgttct ggagccatct tcttcatgat gttgatctac 3780 gagttcatct acactggtat tggccagttc attgctgcgt atgcaccgaa cccaaccttt 3840 gcggcacttg tcaacccact tatcatcagt gttcttgttc tcttctgcgg tgtgtttgtg 3900 ccatatgacc agctgaacgt attctggaag tactggatgt attacctcaa cccattcaac 3960 tatgtcgtca acggcatgtt gactttcggt ctctggggcc agaaagtcac ctgcaatgag 4020 agcgagtatg cagtctttga tccgctcaat ggtacttgcg gcgagtatct ggcgacttac 4080 atgagtggca agggcagcgg agtcaatctg ctcaacccgg acgctacctc gagctgcaag 4140 gtctgtgagt acacaactgg aagtgacttc ctacagacgc tcaacatcaa ccattactat 4200 tatggatgga gagatgcggg catcactgtt atctatgcta tctcgggcta tgcacttgtg 4260 tttggtctga tgaagctccg gaccaaggcg tccaagaagg cagagtaa 4308 <210> 20 <211> 1584 <212> DNA <213> Penicillium brasilianum <400> 20 atgacaccta tctcgcgcct attgtcccgt gcggtcaata aaccctaccg aacgaaagat 60 atcacggacg agattccgcc tacactcgat gaagatggat ttgtgagctt tggcccgggg 120 gacattgaga accctcggaa ttggtcgatg cgccgccgag ctggtgtgac aatgtctgcg 180 gtgcttttag ttgtgaatgc cacttttgcc tcgagctcgc cgagcggatg tttcccatca 240 atctcaaagc atttcggtgt ttccactgaa gttgccggat tgacgataac tctgttcctg 300 ctagggtact gtgctgggcc tttgattttc gctccgctga gcgagttcta cggtcgccga 360 tggatcttct acattacctt tctgctttat ctggccttca actttctttg tgcattcccg 420 ccgaattttg gaagcttgtt ggttggaaga tttctgacgg ggacctttgt gtctgctcca 480 ttgagtaact gccccggtgt tttggccgat gtatggaatc cgcttgagcg cgccaatgct 540 atggctgggt tctcggcaat ggtctggatt gggccagcac tcggacctgt ggttgcaggt 600 ttcctgcagt tgaaagaaga ttggagatgg agcttctatg tgcttctctg gctcggtgga 660 gcatcagccg tcatcatgtt gacaataccc gagacttacg cgccgattgt tctgtataac 720 aaagcacgac ggatccgcga ggcacagatt cccggatatg aaaacgtgaa agcccctgtc 780 gaggacggtg accggactct cgtgggcatc tataaggttg ctctgactcg gccgtggatc 840 attctgttcg acccgatctc cttgctgtgt gcaatttaca tggcgttcgt ctatacattg 900 ctctacatgt tgtttaccat ataccccatt gtgtttcagg aaaaacgggg ctggaactct 960 ggtgttgggg agctgccgtt gctgggaacc gtcgtaggtg ccctatttgg tggtgttatc 1020 gttgtagcag acacccggat gcgccagaaa aggattgaca acggtacgac aaagatggaa 1080 gatgctgtgc cggaagaccg tctcccgcta gcgatgggtg gaggcatcgg ctttgccgtg 1140 acgatgttct ggttcgcctg gtcggctgag ttcaactctg tccattggat tgtcccaact 1200 ctggcaggag tgtttctctc cagtgccctg ctactcatct tcgttgggtt cctcaactat 1260 ctcgtggatg tttatcaaat gtacgctgca tccgccattg ctgcgaacac gatcgctcgt 1320 tctgcctgtg gagcggcagc accactattc acatcccaaa tgttcgcggc cttgggcgtg 1380 ggaggaggag gcagcttgat cgcgggtgtg gccaccctcc ttgccgctat tcctttcttg 1440 ttctataagt atgggaagca gattagaatg cgcagcaaat ttgccccgac taccaaagaa 1500 gaacggcccg ccgaagagaa taaagatgaa gagcgtggac tgggagacgg tgctgtcagc 1560 agtagtatct tgggggcgca ataa 1584 <210> 21 <211> 1545 <212> DNA <213> Penicillium brasilianum <400> 21 atggctgcca gtaatgagca tgcgactccc tccatcgaca gtgctaccac aaaaaccgct 60 ccgtcagtgg attcaacgcc ggccatgagc gaccatgtga acgaggacct tgagaagggg 120 actcgtacga ccgatcccgt cgaggcagag aagcacgatc tcaatgtaaa cccgctatca 180 gagaaaattg agggcaccac tccagctccc gctggtcctc cggggcctgg ccctccaccg 240 gatggaggag ctgaagcatg gttggtcgtg ctaggagcct tttgcggact gttcgtcagt 300 tttggctgga tcaactgtat cggtgtcttc caaacgtact acgaaaccca ccagctcagt 360 aatttgtcca ccagtacggt gacatggatc acatcattgg agactttcgt catgttcttc 420 gctggtcccg tctttggtac tctctttgat agctatggcc cccgatacat cctcctgggt 480 ggcacattcc tccacgtctt cggcctcatg atgacctccc tctcaacgga gtactaccaa 540 ttcatcctcg cgcaaggaat ctgcagtcca ctcggtgcga gtgccatatt caacgccagc 600 attaactctg tcagtacctg gttcgccaaa cgccgcgcct tcgcactggg cgtcacagct 660 tccggatcga gtctgggagg agtgatcttc cccatcatgg tgacaaatct gattccagag 720 gttgggttcc cttgggcaat gcgcatttgc gcgttcttga tcctagctat gctgggcgtt 780 tccaatctca ccctcaagtc gaggctgaag catacaagga agccgtttaa ttttatgaat 840 ttcgttcggc cgctgaagga tatcaaattc gtcgtcacgg ttgctgcggc cttttgtttc 900 ttctggggta tgttcttgcc ttttacgttt gttatcactc aggcgcagcg atatggcatg 960 tcggagcatt tgtcgcagta tctcattccg atcttgaatg ctgctagtgt ctttggccgt 1020 acactcccag gttacctggc agaccgcgtt ggtcgatata acgtgatgat cttcttctct 1080 tatctctccg gcatcctcgt cctagccctc tggcttccat cacgcagcaa cgcccccgcc 1140 atcgtcttta gcgcattgta cggctttggc tccggtgcct tcgtgtccct cgccccagcc 1200 cttatcgccc aaatctctga tgttcgtgag gttggtgtgc gcaacggcac ctgcttctcg 1260 atcattgctt tcgccgctct taccggtacc cctattggcg gtgccttggt tcctgatgtt 1320 ctgactggct cgtacacgag gctgcaggtc ttcagtggcg tggtcatgct tgcaggtgcg 1380 acactgtttg tggtcgctcg gcttgttgtt ggtggcgtga agtttggcaa gtccctgggc 1440 tctggtgttt taatggggtg catttcaaac ggtttaattg agcatgatag acggatgcat 1500 tggcattatc acgtagtgat ttgttgtgct gccactgaca gctaa 1545 <210> 22 <211> 2619 <212> DNA <213> Penicillium brasilianum <400> 22 atgtgccagg accacgacct ggaatgttct tatacacttc cgcgaaagac caggttctac 60 ggcagcgtgg atgatctgag tgatcgatat aaatgcttag aggccatagt acgtgctgca 120 tttcccaatg acggcatctc caccgtcccg gagctcatcc ggctgggaga gcgcatggga 180 tatgccatgc cggacctatc tcagaaatca ggggagtcac ctaggataga ggagctggtg 240 agagacttcc ccaccgaagc tggagaccag ggccttgctg ggtccacaca gtgtacctct 300 tcgccaccaa gaacgggtgc cgtgaatgtc cctactgaga gtgaaagaag gcactcttcc 360 agccaagtcc aggaaaacaa ctcctgtcca gatgaacctg tcggactaat tagagacacc 420 actgggcgag aacatttcat cggcccgtct ggaagcctgc agtttctggg ccagctccgg 480 aggctacttc ttatatcccg cagcggggat gccgtggagt cccgggcacc cgctcgcctt 540 acggccacgt tcaccgatga agatgcagcg caagccctgg aagcagacgg tgaccagagt 600 gagctcgccg ctttgccttc tggaggcact ggcaacggtg gcgatgaagg ccaggagatt 660 gacgagcgct cccctgcctc cttgggttct gctcttgtca gggatttttc cagcattccc 720 gtcaatgaca tcgacgagat gagaaggcag cttccgcctc gccacgttct cgattctctg 780 atgcgagtat atttcaagaa tgtccatccg gactttgccc tattccaccg cggtaccttc 840 gaggaagaat acgagacctt catgtccaaa gggcggtact atcatcagca cgctcgagct 900 ggtgtacatt tatcctctcc cacgttacct gaaccaggct ggttaggctg tttgcacatg 960 atgattgcct ttgcctcgct aaatggctct gtcgatgtcg ctcccgacct ggatcttact 1020 tccctctgtc gccattgtgc cagtcttacc cgccagctcc tgcctcaatt tatctcaaag 1080 tgcaccctct ccaacgtccg ggccctccta cttctatccc ttttccttca taaccacaat 1140 gaacgtaacg cggcttggaa cctggttggg actgccatgc gcctttcctt cgccatgggg 1200 ctgcaccggg ccagcgacaa cgggtcgcac ttccggccta tagaaaggga ggtgcgcaag 1260 cgcgtcttct gcacgctcta cggctttgag caattcctcg cgtccagcct ggggagacca 1320 agcgggttct acgacttcga ggatgtggag atagttcctc cgcgtgaggg agtgctggac 1380 agtgggcagg acgaggacga cgaggtcatg aaactttcgc tgaggctgca agttatcctg 1440 gccaaggcca gggtctccct tgccgtcaag acactggccg tggccaatga gaggggcaac 1500 atcgacggtc tggctcggca acagcagtct tcaagggaga cgctggagat cttgaaggcg 1560 tggagggagg atcttgcctc ccaccacatc ttaaacatcc cgttgatcag tgagacagat 1620 gatccgcttt gccagtacgc cgaggagata ccgcgaatgt cactccaaga tctcaaggcc 1680 atgatgggtt ggcaaagccg acctcgactt cgggctgccc tggtcctgca cctccaatac 1740 aggtacattg ctgtcttggt gacgcggtct tctttgctgc gatacgtcgc gtccgcgcaa 1800 cgtggtgaac cagagcacga agccctgctc agccggaacg aggctagaac cgacccgtat 1860 aacagcgagg caggagaacg gctatcggac atctgcgtca cgcacgccac gcagctatgc 1920 cggctcatct tgcttgcaga ctcctttggc ttggtgaatg gcatatcggc catggacgtc 1980 ttctacgtct actgcggcgt catggtgctc atattgcggt cgctacggat ttctagctct 2040 gcaagccact accatgacca gcgcgaggcg catctgcagc tggagttgcg caagctgatc 2100 gcacaaacga gagaagtgct catacgtgtg aacaaatgca gcacaatgaa gcgattcgcg 2160 cgcgtggtgg ctaccttcga ggatggatca aggcaggata acatcaggcc tgccgatggt 2220 tctaccaatc ggtcaacggc caactgtgag atgcgaacgg ctcggcaggc atctcgtgac 2280 cctcggggcc ggttcaacca ttctatccac gccgccttag atggcgggcg agcgagcaac 2340 ctggcaatct ttccgggtgc aggaggatcg ctggacacgt cctcctccct gccagtctcg 2400 cagcaagagc cgcttaactt ccagcacgga tatggtaatg gaattgggcc gaggctcggt 2460 atatcagatc ctttctggca accaaactta ttgacgtcct ttgacgggga gccagaggca 2520 aacggttgga tgatggaccc attcctcgcg atggacggga ccggcgttgt ggactggggc 2580 gatattgagt ccctcttgtc acggaatcct ggtcaatag 2619 <210> 23 <211> 458 <212> PRT <213> Penicillium brasilianum <400> 23 Met Ala Asn Gln Arg Val His Val Gly Ile Val Gly Ala Gly Ile Gly 1 5 10 15 Gly Leu Ala Ala Ala Ile Ala Phe Arg Arg Ala Gly Val Asp Val Thr 20 25 30 Val Leu Glu Ala Ala Asp Glu Leu Leu Glu Met Thr Pro Asn Val Ser 35 40 45 Val Leu Leu Gln Lys Trp Gly Val Ala Asp Val Ile Gly Asp Asn Leu 50 55 60 Val Gln Ile Glu Glu Leu Asn Met Arg Arg Lys Asp Gly Thr Leu Val 65 70 75 80 Gly His Thr Glu Ile Pro Ile Val Glu Lys Ala Leu Gly Arg Pro Trp 85 90 95 Trp Leu Val His Arg Ala His Leu His Glu Gly Leu Ala Thr Val Ala 100 105 110 Lys Arg Leu Gly Ala Val Ile His Ile Asn Ser Arg Val Ile Ser Leu 115 120 125 Asp Tyr Gln Glu Gly Gly Glu Val Thr Val Glu Thr Gln Lys Gly Asp 130 135 140 Lys Tyr His Phe Asp Leu Cys Val Gly Ala Asp Gly Val Asn Ser Ile 145 150 155 160 Val Arg Ser Thr Leu Phe Pro Gly Ile Lys Pro Asp Ala Lys Thr Thr 165 170 175 Asn Cys Ala Tyr Arg Ala Ile Ile Pro Tyr Glu Arg Ile Arg Gln Asp 180 185 190 Pro Ile Ala Lys Glu Leu Ile Gln Lys Leu Thr Met Glu Val Trp Met 195 200 205 Gly His Asn Ala Tyr Ile Ile Thr Tyr Pro Ile Ser Gly Gly Glu Thr 210 215 220 Phe Asn Leu Val Leu Ser His His Arg Pro Glu Lys Leu Tyr Ser Thr 225 230 235 240 Gln Pro Asn Val Pro Val Glu Glu Met Arg Asp Ala Tyr Lys Asp Phe 245 250 255 Asp Pro Arg Ile Lys Arg Ile Val Asp Met Ile Thr Glu Thr Ser Arg 260 265 270 Trp Pro Leu Leu Val Thr Gly Pro Leu Gln Ser Trp Ser Ser Pro Gln 275 280 285 Lys Asn Val Val Leu Met Gly Asp Ala Ala His Ser Met Val Asn His 290 295 300 Met Ala Gln Gly Ala Ala Thr Ser Met Glu Asp Gly Ala Phe Leu Ala 305 310 315 320 Lys Cys Val Gly Ala Val Thr Arg Gly Lys Leu Ser Leu Arg Glu Ala 325 330 335 Ile Asn Ile Tyr Glu Leu Glu Arg Met Pro Lys Ala Phe Met Lys Gln 340 345 350 Gln Val Ser Phe Leu Asn Gly Ala Ile Trp His Leu Pro Asp Gly Pro 355 360 365 Lys Gln Gln Ala Arg Asp Ala Ala Met Ala Pro Ser Leu Asp Gly Lys 370 375 380 Tyr Leu Val Arg Ser Ser Asn Leu Tyr Asp Asp Pro Gln Thr Val Leu 385 390 395 400 Asp Val Tyr Gly Tyr Asp Val Glu Ala His Ala Glu His Ala Leu Ala 405 410 415 Lys Phe Ala His Gly Arg Glu Ala Leu Tyr Pro Gly Thr Gly Leu Ala 420 425 430 Pro Phe Met Glu Asp Lys Tyr Met Gly Trp Phe Ser Lys Cys Gln Gln 435 440 445 Asn Asp Arg Tyr Ala Ala Val Gly Lys Leu 450 455 <210> 24 <211> 1377 <212> DNA <213> Penicillium brasilianum <400> 24 atggccaatc agcgtgttca tgttggaatc gtcggcgcag gaataggagg gctggcagcc 60 gccattgcct ttcgacgtgc aggagtggat gtcactgtcc tggaagcagc ggatgaattg 120 ctcgaaatga cgccgaatgt atcggttctg ctgcagaaat ggggcgttgc agatgtgatt 180 ggagacaact tggttcaaat tgaagaactg aatatgcgcc gcaaagatgg cactcttgtc 240 ggacataccg aaataccgat tgttgaaaag gcattgggca gaccgtggtg gcttgttcat 300 cgtgctcatc tccacgaagg cctcgcgact gtggccaagc gtctgggagc cgtgattcat 360 atcaacagtc gcgtcatttc acttgactat caggaggggg gtgaagtcac ggtcgaaaca 420 caaaaagggg ataagtatca tttcgacctc tgtgtgggtg ctgatggcgt caacagcatt 480 gtccgaagca cactgtttcc gggcataaag ccggacgcga aaaccaccaa ctgtgcttac 540 cgggcgatta taccgtatga gcgtatccga caggacccaa ttgcaaagga gctcattcaa 600 aagttgacga tggaggtctg gatgggacat aatgcctata ttatcaccta tcccatcagt 660 ggaggcgaaa cattcaacct ggtgctctcg catcatcgtc cagagaagct ctatagtacc 720 caaccgaatg ttcctgtcga ggaaatgcgg gatgcgtaca aggactttga ccctcggatc 780 aaacgcattg ttgatatgat caccgagact tcacgctggc cgctattggt gaccgggccc 840 ttgcaatcat ggtcctcccc acagaagaat gtggttttga tgggggatgc agcgcactca 900 atggtaaacc atatggcgca aggggctgct acgtccatgg aagatggcgc ttttctcgca 960 aagtgcgtag gggcagttac tcgtggaaag ctgagtcttc gcgaagccat caatatctac 1020 gagctcgagc ggatgccaaa agccttcatg aaacaacagg tctcttttct gaatggtgcc 1080 atctggcact taccggatgg acctaagcaa caggctcgtg atgcggcaat ggcaccgtca 1140 cttgatggga aatatttggt tcgcagcagc aatctctacg atgaccctca gacggtgctg 1200 gatgtatatg gatatgacgt tgaagcgcat gcagaacatg cgctggcaaa gtttgcccac 1260 gggcgtgagg cgttgtatcc aggcactggt ttggcgcctt tcatggagga caaatacatg 1320 gggtggttct caaagtgtca gcaaaatgac cgctacgccg cagttgggaa gctttag 1377 <210> 25 <211> 360 <212> PRT <213> Saccharomyces cerevisiae <400> 25 Met Ser Tyr Pro Glu Lys Phe Glu Gly Ile Ala Ile Gln Ser His Glu 1 5 10 15 Asp Trp Lys Asn Pro Lys Lys Thr Lys Tyr Asp Pro Lys Pro Phe Tyr 20 25 30 Asp His Asp Ile Asp Ile Lys Ile Glu Ala Cys Gly Val Cys Gly Ser 35 40 45 Asp Ile His Cys Ala Ala Gly His Trp Gly Asn Met Lys Met Pro Leu 50 55 60 Val Val Gly His Glu Ile Val Gly Lys Val Val Lys Leu Gly Pro Lys 65 70 75 80 Ser Asn Ser Gly Leu Lys Val Gly Gln Arg Val Gly Val Gly Ala Gln 85 90 95 Val Phe Ser Cys Leu Glu Cys Asp Arg Cys Lys Asn Asp Asn Glu Pro 100 105 110 Tyr Cys Thr Lys Phe Val Thr Thr Tyr Ser Gln Pro Tyr Glu Asp Gly 115 120 125 Tyr Val Ser Gln Gly Gly Tyr Ala Asn Tyr Val Arg Val His Glu His 130 135 140 Phe Val Val Pro Ile Pro Glu Asn Ile Pro Ser His Leu Ala Ala Pro 145 150 155 160 Leu Leu Cys Gly Gly Leu Thr Val Tyr Ser Pro Leu Val Arg Asn Gly 165 170 175 Cys Gly Pro Gly Lys Lys Val Gly Ile Val Gly Leu Gly Gly Ile Gly 180 185 190 Ser Met Gly Thr Leu Ile Ser Lys Ala Met Gly Ala Glu Thr Tyr Val 195 200 205 Ile Ser Arg Ser Ser Arg Lys Arg Glu Asp Ala Met Lys Met Gly Ala 210 215 220 Asp His Tyr Ile Ala Thr Leu Glu Glu Gly Asp Trp Gly Glu Lys Tyr 225 230 235 240 Phe Asp Thr Phe Asp Leu Ile Val Val Cys Ala Ser Ser Leu Thr Asp 245 250 255 Ile Asp Phe Asn Ile Met Pro Lys Ala Met Lys Val Gly Gly Arg Ile 260 265 270 Val Ser Ile Ser Ile Pro Glu Gln His Glu Met Leu Ser Leu Lys Pro 275 280 285 Tyr Gly Leu Lys Ala Val Ser Ile Ser Tyr Ser Ala Leu Gly Ser Ile 290 295 300 Lys Glu Leu Asn Gln Leu Leu Lys Leu Val Ser Glu Lys Asp Ile Lys 305 310 315 320 Ile Trp Val Glu Thr Leu Pro Val Gly Glu Ala Gly Val His Glu Ala 325 330 335 Phe Glu Arg Met Glu Lys Gly Asp Val Arg Tyr Arg Phe Thr Leu Val 340 345 350 Gly Tyr Asp Lys Glu Phe Ser Asp 355 360 <210> 26 <211> 422 <212> PRT <213> Aspergillus niger <400> 26 Met Cys Leu Lys Phe Glu Pro Leu Asn Ile Leu Ile Val Gly Ala Gly 1 5 10 15 Leu Gly Gly Leu Phe Ala Ser Leu Ala Leu Arg Gln Asp Gly His Arg 20 25 30 Ile Thr Leu Leu Asp Ala Ser Ala Glu Phe Lys Glu Ala Gly Ala Gly 35 40 45 Ile Arg Ile Pro Pro Asn Ser Thr Arg Leu Leu Arg Arg Trp Gly Val 50 55 60 Asp Phe Asp Lys Met Arg Lys Cys Val Cys Gln Gly Tyr His Phe Arg 65 70 75 80 Arg Trp Gln Asp Gly Ser Thr Ile Thr Glu Ile Asn Pro Glu Asp Met 85 90 95 Ile Ala Cys His Gly Ala Pro Tyr Tyr Leu Val His Arg Ala Asp Leu 100 105 110 His Ala Thr Leu Leu Ala Val Ala Ile Glu Ala Gly Val Val Ile His 115 120 125 Lys Asn Arg His Val Thr Tyr Tyr Asp Phe Ser Val Pro Ile Ala Val 130 135 140 Thr Ala Asp Ser Glu Lys Trp Thr Ala Asp Leu Ile Ile Cys Ala Asp 145 150 155 160 Gly Ile Lys Ser Thr Ala Arg Pro Leu Leu Thr Ser Gln Pro Asp His 165 170 175 Pro Arg Asp Thr Gly Asp Ile Ala Tyr Arg Ile Leu Ile Asn Gly Gln 180 185 190 Asp Leu Leu Ala Asp Pro Asp Leu Ala Gly Leu Ile Thr His Pro Ala 195 200 205 Thr Thr Ser Trp Cys Gly Pro Asp Ala His Leu Val Gly Tyr Pro Ile 210 215 220 Arg Asp Gly Glu Leu Tyr Asn Ile Val Val Cys Ala Thr Ser Lys Gly 225 230 235 240 Glu Thr Thr Asp Glu Ile Trp Val Val Glu Gly Asp Asn Glu Glu Leu 245 250 255 Cys Ala Arg Phe Ser Gly Trp Glu Pro Arg Val Gln Lys Leu Cys Arg 260 265 270 Leu Thr Lys Ser Phe Met Lys Trp Arg Leu Cys Asp Leu Pro Ala Leu 275 280 285 Ser Thr Trp Ile His Pro Ser Gly Lys Ala Cys Leu Leu Gly Asp Ser 290 295 300 Cys His Pro Met Leu Pro Tyr Leu Ala Gln Gly Ala Ala Gln Ala Ala 305 310 315 320 Glu Asp Ala Ala Thr Ile Cys Arg Ala Leu Ala Glu Asp Thr Asp Ile 325 330 335 Thr Ser Ala Leu Lys Arg Tyr Glu Arg Ile Arg Ser Pro Arg Ala Ser 340 345 350 Leu Ile Gln Ser Lys Thr Arg Glu His Gln Tyr Ile Leu His Val Asp 355 360 365 Asp Gly Glu Glu Gln Cys Gln Arg Asp Glu Leu Met Arg His Asp Ser 370 375 380 Pro Ser Ser Pro Ile Phe Trp Gly Tyr Glu Leu Arg Arg Glu Trp Leu 385 390 395 400 Phe Ser His Asp Ala Glu Lys Met Glu Glu Ala Thr Ala Glu Pro Arg 405 410 415 Leu Arg Thr Ala Ala Leu 420 <210> 27 <211> 1056 <212> DNA <213> Artificial <220> <223> hmfL1 coding sequence optimised for expression in yeast <400> 27 atgggttcct tatccttacc agaaacatca ttagccgcaa tccaagacaa agaaacaaaa 60 gctatctcag tcgccaaaag acctacacca gtacctgttg gtacccaagt cttagtaaaa 120 ttgcattatt ccggtgtttg tgccactgat ttgcacttag ctagaggttc tgttccatac 180 ttacaaccta aggtttcagt cggtggtcat gaaggtaccg gtgttattgc ttctttgggt 240 ccagatgtcg acgcagcaga atggcatgta ggtgacagag tagcagttag atgggtacac 300 atagtttgtg gtaaatgcga agtttgtact acaggtttcg aaaatttgtg ccaatctaga 360 aagttggctg gtaaagatgt tgaaggtact ttcgccgaat atgcaattgc cgactcttca 420 tacatggtta gattaccagc tggtgtctca gatgcagacg ccgctcctat cttgtgtgct 480 ggtgtcacag tatacaaagc cttgaagatc gcttctttga gagcaggttc atgggttgct 540 gtcgcaggtg ctggtggtgg tttaggtcat ttggcaatcc aatatgctag agcaatgggt 600 ttaaaagttg tcgcattgga tgccagaaag agagacttgt gcttatcctt gggtgctgaa 660 agttacatcg acgttttaga aactgatgac tgtgtcgcac aagtaattaa agttacagat 720 ggtggtgctc acggtgcatt aatatgcgct tccagtggtc aagcctacga tgacgctgtt 780 aaatttttga gatggaccgg tactttagtc tgtataggtt tgccacctaa gccaacattg 840 ttatccttag gtcctgctga ttttgtagcc agaggtatca aggttatggg tacaagtacc 900 ggtgacagac aagacacagt tgaagccttg gctttcgtcg ctaaaggtca agtaaagcct 960 caattaaccg aaagaagatt ggaagatgtt gaagaaatct taaaggaaat agaaaatggt 1020 acaatgcaag gtaaagccgt aatcagaatc gcatag 1056 <210> 28 <211> 1518 <212> DNA <213> Artificial <220> <223> hmfN1 coding sequence optimised for expression in yeast <400> 28 atgacccaaa ccaatgtcca cgtaaacaaa tccgacactt ccttagctgc tccacaacaa 60 ttattcatct ccggtaaata tcaaaactct caaagaaatg gtacatttcc agtcaaaaac 120 cctatgactg gtgaaacaat ctatgaatgt gtttctgcat cattagatga ctacgctgct 180 gctatagaag aagctgatgc cgcacaacca tcatgggcta gattaggtcc ttccgcaaga 240 agattgattt tgttaaaggc cgctgatata atggaaacat acatcgaaac cgacgctcca 300 gcaatcttga gtgctgaagt ttctgcaaca agaggttggg tcagagccaa tatattatct 360 accgctggtg ttttcagaga aactgctgct ttggcaacac atatcaaagg tgaaattgtt 420 ccagctgata gacctggtac tacaatctta gtttcaagag aaccagtcgg tgttgtcttg 480 gctatttccc cttggaatat gcctgcaacc ttaactgcca gagctatctg ttgcccttta 540 atttgtggta actctgtagt tttaagacca tccgaatttt ctcctaaatc tcaacatttg 600 gtcgtaagag ccttaacaga agctggtttg ccagcaggtt gcttgcaatt cttaccaaca 660 tcaaccgcag atacccctag agccatagaa tttgctatca gacaccctaa ggttagtaga 720 gctaatttca ctggttctga tagagtcggt agaattatag caggtttatc cgccagttgt 780 ttgaaaccat gcgttttgga attgggtggt aaagcccctg ttgtcgtatt agaagatgct 840 gatgtcgaag ctgctgttga agcagttgtc tacggtgcca tgtctaactc aggtcaaatt 900 tgtatgagta cagaaagagc tatagttcat agatcattgg ccgctgattt taaagcattg 960 ttagtaaaga gagccgaatc attaagagtt ggtaatcact tggaagatcc agacgttcaa 1020 ttgtcaggtt tgtttactgc tgcttccgca gaaagagtct tgggtttgat taaaggtgct 1080 gtaaacgcag gtgccacctt gttagctggt gacttggcat tacatggtcc atgccaaact 1140 ataatggctc ctcacatctt aaccggtgtt actagagata tggacttgtt tcatagagaa 1200 acattcggtc cagtattgtt cgttagtgaa tttgatactg atgacgaagc tatagcacaa 1260 gccaatgaca cagaattttc tttatgtgct tcagtattct ccagagatgt tttgagagct 1320 atggataccg ctaagagaat aagaactggt tcatgccacg tcaatggtcc tactgtatat 1380 atcgaagcac cattgcctaa cggtggtgtt ggtggtggtt ctggttacgg tagatttggt 1440 ggtgttgctg gtattgaaga gtttacagaa agacaaatag ttagtttagc caagccaggt 1500 atcaagtatg ccttttag 1518 <210> 29 <211> 2139 <212> DNA <213> Artificial <220> <223> synthetic fragment comprising hmfN1 for expression in yeast <400> 29 ctcccccggg ttagtcaaaa aattagcctt ttaattctgc tgtaacccgt acatgcccaa 60 aatagggggc gggttacaca gaatatataa catcgtaggt gtctgggtga acagtttatt 120 cctggcatcc actaaatata atggagcccg ctttttaagc tggcatccag aaaaaaaaag 180 aatcccagca ccaaaatatt gttttcttca ccaaccatca gttcataggt ccattctctt 240 agcgcaacta cagagaacag gggcacaaac aggcaaaaaa cgggcacaac ctcaatggag 300 tgatgcaacc tgcctggagt aaatgatgac acaaggcaat tgacccacgc atgtatctat 360 ctcattttct tacaccttct attaccttct gctctctctg atttggaaaa agctgaaaaa 420 aaaggttgaa accagttccc tgaaattatt cccctacttg actaataagt atataaagac 480 ggtaggtatt gattgtaatt ctgtaaatct atttcttaaa cttcttaaat tctactttta 540 tagttagtct tttttttagt tttaaaacac caagaactta gtttcgaata aacacacata 600 aacaaacaaa aatgacccaa accaatgtcc acgtaaacaa atccgacact tccttagctg 660 ctccacaaca attattcatc tccggtaaat atcaaaactc tcaaagaaat ggtacatttc 720 cagtcaaaaa ccctatgact ggtgaaacaa tctatgaatg tgtttctgca tcattagatg 780 actacgctgc tgctatagaa gaagctgatg ccgcacaacc atcatgggct agattaggtc 840 cttccgcaag aagattgatt ttgttaaagg ccgctgatat aatggaaaca tacatcgaaa 900 ccgacgctcc agcaatcttg agtgctgaag tttctgcaac aagaggttgg gtcagagcca 960 atatattatc taccgctggt gttttcagag aaactgctgc tttggcaaca catatcaaag 1020 gtgaaattgt tccagctgat agacctggta ctacaatctt agtttcaaga gaaccagtcg 1080 gtgttgtctt ggctatttcc ccttggaata tgcctgcaac cttaactgcc agagctatct 1140 gttgcccttt aatttgtggt aactctgtag ttttaagacc atccgaattt tctcctaaat 1200 ctcaacattt ggtcgtaaga gccttaacag aagctggttt gccagcaggt tgcttgcaat 1260 tcttaccaac atcaaccgca gataccccta gagccataga atttgctatc agacacccta 1320 aggttagtag agctaatttc actggttctg atagagtcgg tagaattata gcaggtttat 1380 ccgccagttg tttgaaacca tgcgttttgg aattgggtgg taaagcccct gttgtcgtat 1440 tagaagatgc tgatgtcgaa gctgctgttg aagcagttgt ctacggtgcc atgtctaact 1500 caggtcaaat ttgtatgagt acagaaagag ctatagttca tagatcattg gccgctgatt 1560 ttaaagcatt gttagtaaag agagccgaat cattaagagt tggtaatcac ttggaagatc 1620 cagacgttca attgtcaggt ttgtttactg ctgcttccgc agaaagagtc ttgggtttga 1680 ttaaaggtgc tgtaaacgca ggtgccacct tgttagctgg tgacttggca ttacatggtc 1740 catgccaaac tataatggct cctcacatct taaccggtgt tactagagat atggacttgt 1800 ttcatagaga aacattcggt ccagtattgt tcgttagtga atttgatact gatgacgaag 1860 ctatagcaca agccaatgac acagaatttt ctttatgtgc ttcagtattc tccagagatg 1920 ttttgagagc tatggatacc gctaagagaa taagaactgg ttcatgccac gtcaatggtc 1980 ctactgtata tatcgaagca ccattgccta acggtggtgt tggtggtggt tctggttacg 2040 gtagatttgg tggtgttgct ggtattgaag agtttacaga aagacaaata gttagtttag 2100 ccaagccagg tatcaagtat gccttttaga ctagtgtga 2139 <210> 30 <211> 3011 <212> DNA <213> Artificial <220> <223> Synthetic split marker fragment 5-flank hmfK1 with Hygromicin B marker <400> 30 ctcggtcgct cttttgggta gatggtagga taactgacag gaagtctatg ccagtactgc 60 ggaatcaaag aagcgtcgga gcaatgaacc gtatgcacgt cggaatgggg gaatgacacg 120 gagttatact cccggttcaa gccccgctta tcaaccctgg gcaggaattg cggggaagca 180 atgcggggaa gctacaacgc ttccccgcat ggtctacgtc tactcttggc acaacacatg 240 gaaatatcca gcgaagtggt tgactggtat cgagacttgg tccgtttcca gtcaaaatca 300 caccttcgta gaatccctgg cgttaccgcc tctcacgtct tttggctctg cttgtcagct 360 ggacgcagca cgcatcaatt ggcaagatgt cgtctacaag cgagtccttc actctcccaa 420 atgggcgaca gatggcttat accctctcgc ccggtggttc ctccgatcgc gtggtccttc 480 tctccaactc cttggccgaa gatctgacct cctgggagcg cgtcgtacct gtggtggaaa 540 accaaggctt ccgcgtcctc cgctacgacc agccaggcca tggacgctcg ggtgcaccta 600 ctgaagccga attgacctcc atgacattcg agaccttggt cgatgacgtc taccgccttc 660 tcggacacct caaaatcaac aatttgcatg cctgggtcgg cgtctcgatg ggcggcatca 720 aggccgtgta cttcaccgcg cgccacccag gcatcgtgaa caagatcgtc gtggccgacg 780 ccatcgccgc ttccccgtcc gtggtctgca tccccgataa cttcgccgcg cgggtaagcg 840 ctgtgaagca gtcgggttcc atctcggacg acctgtcaaa tactcggaag cggtggttcg 900 gtgaagactg gatggcgaag catccggagg agacggcgag gatggagaag tccatggcga 960 caactacaat tcagggtctc gaggcgtgct gtgctgccct tagcagcccg tcttttgacc 1020 tgaggccgct atatacgaag gtgggacatg gctgcgaaga agcactcatt gtcgccgggg 1080 agaaggatgc ggaccttcca gtcaagatgc aggagatgcg gcaggcaatc gaggagagcc 1140 tccggagctg tggaaagaag gtgcccgtga ggatggagat tatcaagggt gccgggcatg 1200 ttccctacat tgatggtttc gaggacttct gcgaaatcat caccaaattc cttgcctaga 1260 tagcactcga tctgcttcac gattgtgaaa tgtcttaaat tttcttgtca atctagactt 1320 tgcattaaac caatcttgag acaaatcatt cttcagtcgt attcccggag tgtgtgatgt 1380 cctggtccca tatttctcat ttctcatctt cgctatggct agtccgggta gcaagtgcgc 1440 gcaagtgcgc gctagtaggc aaatagaagc aatcgtcgga agttgggccc gactaggata 1500 acctggacta ggggcctgct gtacagtgac cggtgactct ttctggcatg cggagagacg 1560 gacggacgca gagagaaggg ctgagtaata agcgccactg cgccagacag ctctggcggc 1620 tctgaggtgc agtggatgat tattaatccg ggaccggccg cccctccgcc ccgaagtgga 1680 aaggctggtg tgcccctcgt tgaccaagaa tctattgcat catcggagaa tatggagctt 1740 catcgaatca ccggcagtaa gcgaaggaga atgtgaagcc aggggtgtat agccgtcggc 1800 gaaatagcat gccattaacc taggtacaga agtccaattg cttccgatct ggtaaaagat 1860 tcacgagata gtaccttctc cgaagtaggt agagcgagta cccggcgcgt aagctcccta 1920 attggcccat ccggcatctg tagggcgtcc aaatatcgtg cctctcctgc tttgcccggt 1980 gtatgaaacc ggaaaggccg ctcaggagct ggccagcggc gcagaccggg aacacaagct 2040 ggcagtcgac ccatccggtg ctctgcactc gacctgctga ggtccctcag tccctggtag 2100 gcagctttgc cccgtctgtc cgcccggtgt gtcggcgggg ttgacaaggt cgttgcgtca 2160 gtccaacatt tgttgccata ttttcctgct ctccccacca gctgctcttt tcttttctct 2220 ttcttttccc atcttcagta tattcatctt cccatccaag aacctttatt tcccctaagt 2280 aagtactttg ctacatccat actccatcct tcccatccct tattcctttg aacctttcag 2340 ttcgagcttt cccacttcat cgcagcttga ctaacagcta ccccgcttga gcagacatca 2400 ccatgcctga actcaccgcg acgtctgtcg agaagtttct gatcgaaaag ttcgacagcg 2460 tctccgacct gatgcagctc tcggagggcg aagaatctcg tgctttcagc ttcgatgtag 2520 gagggcgtgg atatgtcctg cgggtaaata gctgcgccga tggtttctac aaagatcgtt 2580 atgtttatcg gcactttgca tcggccgcgc tcccgattcc ggaagtgctt gacattgggg 2640 aattcagcga gagcctgacc tattgcatct cccgccgtgc acagggtgtc acgttgcaag 2700 acctgcctga aaccgaactg cccgctgttc tgcagccggt cgcggaggcc atggatgcga 2760 tcgctgcggc cgatcttagc cagacgagcg ggttcggccc attcggaccg caaggaatcg 2820 gtcaatacac tacatggcgt gatttcatat gcgcgattgc tgatccccat gtgtatcact 2880 ggcaaactgt gatggacgac accgtcagtg cgtccgtcgc gcaggctctc gatgagctga 2940 tgctttgggc cgaggactgc cccgaagtcc ggcacctcgt gcacgcggat ttcggctcca 3000 acaatgtcct g 3011 <210> 31 <211> 2886 <212> DNA <213> Artificial <220> <223> Synthetic split marker fragment 3'-flank hmfK1 with Hygromicin B marker <400> 31 tccggaagtg cttgacattg gggaattcag cgagagcctg acctattgca tctcccgccg 60 tgcacagggt gtcacgttgc aagacctgcc tgaaaccgaa ctgcccgctg ttctgcagcc 120 ggtcgcggag gccatggatg cgatcgctgc ggccgatctt agccagacga gcgggttcgg 180 cccattcgga ccgcaaggaa tcggtcaata cactacatgg cgtgatttca tatgcgcgat 240 tgctgatccc catgtgtatc actggcaaac tgtgatggac gacaccgtca gtgcgtccgt 300 cgcgcaggct ctcgatgagc tgatgctttg ggccgaggac tgccccgaag tccggcacct 360 cgtgcacgcg gatttcggct ccaacaatgt cctgacggac aatggccgca taacagcggt 420 cattgactgg agcgaggcga tgttcgggga ttcccaatac gaggtcgcca acatcttctt 480 ctggaggccg tggttggctt gtatggagca gcagacgcgc tacttcgagc ggaggcatcc 540 ggagcttgca ggatcgccgc ggctccgggc gtatatgctc cgcattggtc ttgaccaact 600 ctatcagagc ttggttgacg gcaatttcga tgatgcagct tgggcgcagg gtcgatgcga 660 cgcaatcgtc cgatccggag ccgggactgt cgggcgtaca caaatcgccc gcagaagcgc 720 ggccgtctgg accgatggct gtgtagaagt actcgccgat agtggaaacc gacgccccag 780 cactcgtccg agggcaaagg aatagtgatt taatagctcc atgtcaacaa gaataaaacg 840 cgtttcgggt ttacctcttc cagatacagc tcatctgcaa tgcattaatg cattggacct 900 cgcaacccta gtacgccctt caggctccgg cgaagcagaa gaatagctta gcagagtcta 960 ttttcatttt cgggagacga gatcaagcag atcaacggtc gtcaagagac ctacgagact 1020 gaggaatccg ctcttggctc cacgcgacta tatatttgtc tctaattgta ctttgacatg 1080 ctcctcttct ttactctgat agcttgacta tgaaaattcc gtcaccagcc cctgggttcg 1140 caaagataat tgcactgttt cttccttgaa ctctcaagcc tacaggacac acattcatcg 1200 taggtataaa cctcgaaaat cattcctact aagatgggta tacaatagta accatgcatg 1260 gttgcctagt gaatgctccg taacacccaa tacgccggcc gaaacttttt tacaactctc 1320 ctatgagtcg tttacccaga atgcacaggt acacttgttt agaggtaatc cttctttcta 1380 gaagtcctcg tgtactgtgt aagcgcccac tccacatctc cactcgagcc tatcactgtg 1440 gcaatgcctt agactctttt attcttcaat cataccatac atcctcgcgt tttgcattag 1500 tcctcggcga ttcacctcgc agttttcctc ctcctttggt tacatcttct cagcttaggc 1560 ggctggtacg tcttctgtat ttatttgagg cagctgtagg aaactttcac gttgaaagtt 1620 gacaagacga cttccacagc gtctgtgacg agggccacaa gcctgttttt tggtccatag 1680 aagttttcta tctttgtttc gaacagcgtc ttcctgtaac gggccagacc cagcagtgaa 1740 accatgtgcc atggcctttc ggacaccgcc tcaacaggca ggattctagg ggattctatc 1800 gcgaagattc catcagggac gagaccgatt ctctccatct ccttcgacac taaggattct 1860 aaactattcc aaaggattat atcagagacg agactgactc actttccttt cttcaatatt 1920 gttgtaaaaa gcatataggc ctaacataat tgaattaatg ctacaacacc ccttcgtact 1980 ttcttcttgt aggctccagg gatatagtcg ttcctctatc gtaagagacg acgcctttct 2040 ttagccttct catcacgctt ttagaaaaaa ggccttttga cccataaccg gatattctaa 2100 aagtaagctc aaagggtagg aggcagactc agaggagtag attttgaaac aagcaatgaa 2160 atggacgttg cttttaatga ggccgtagat gggataaagt ctcctttaat attttgtcac 2220 aggaagcatg actagtgcaa aggcctcttt gaactgcatt atcttgaaca ggacgggcca 2280 cctcacttgt gtcgttttgg ccagttttgt ttagatggag acctctagaa tgggatattc 2340 acgcgctagt tatcacagaa tagatgaccc tgtggggcat gtcctttttg ggtatagtct 2400 gacttggtct aagtgatcac tgagcgatca catgactgca ctcatgagcg cgtgctgaca 2460 tttactcact gagcctgagc ctgagtgccc tcattaaagc ggcggtagcc cagacaggaa 2520 agccctaccg gacaaaatcc ggtgtatata ggcgcatatt gcatcattgg gtgtgagtct 2580 gaggtagcac aacttattat cttggccatg tggagaggtc tataatgggc tttgtccgga 2640 tgcggcgatc agtcgacatt gtactttgta gacgtgtatg ggtggatgga tggagatcgg 2700 attgcgaagt atggagatcg cgattcttca gatgacgcac ggagtcgatc tcccgagctg 2760 ctctcttatt tacgtgtcaa gagtacaata acaattgagc tggacgatag atagtcttgg 2820 aaatcaacta tgacattgtt aactagacat ctattctaat gtacctcgaa agaatactcg 2880 ggatgg 2886 <210> 32 <211> 2658 <212> DNA <213> Artificial <220> <223> Synthetic split marker fragment 5-flank hmfK3 with Phleomycin marker <400> 32 ccgtgcgcta taataacctt cgaatcctgg tgcatcgccg ctgcttggaa agccttcttg 60 acccagttca gatagaaggt gacacttcgg tgacgtccga aatgcggttg cttcagcaaa 120 tgggactgag cagcgtcatg atctgtgttg agtctgctat gtctatcatc tcgattgtac 180 acaatatgtc tgccggtagt ggctggcgac gtgagttctt gggtgcatgg aattattcac 240 tctattacag taggttgggt tctgtaagat ttgacctcca gggagttgaa actaacgtaa 300 cacagctttc aatgcagcac tagttatttt cggctccctc attgtggcat cgaaggagcg 360 tgaccgcaac ccgtcagcct ggatcatgat cagccattcc cggtcgtata ttgacacggc 420 agctgaagcg ctgcgtcagc ttgacccggg aaaccctgtt gttgaacggt gtcaagagta 480 tctttcgcag ctatctgcaa cattggatcc tctcagttag ttatcccgca cagatgcaaa 540 cctccctttc gtcccatccg tgccatttca agactggccc tgcccgcgct tcaacaattg 600 ttccaaaaac ctgctgacag cccttgccta cacaatgcac agtttcagaa gagccatatt 660 gtgataatag gcttgctttc gactttccta ccgaatattc caccgggctg ttttctcttc 720 acagtgccga cttagtaccg cctatggact ttggcgaatt catgattggt tagggttgta 780 gcttttcggt acggccctgg gaatagcgag gcattgactg ctagtcaact gtagtggagc 840 aaacagagaa gggaccacgt aggtacaagc tgggcgatgc agctgtccga ccctctcgag 900 atgggttcgc cgcggaagga gcaaatagtc tcagtatcca gctttgccgt aggaatgaga 960 aaactgaact caagacagaa acctcagcgt accttttcaa agatgatgta aaagatgtct 1020 ctctcagaga aggatagtat agtaatgatc agatccgctg gaaaatagtg cggcaccgaa 1080 cccctgacgg cccggcggcc cggcgggtat ggtaatgacg gtaaattatc tagggcatcg 1140 ctatgatcat ttgacaagac ccgtgtgtcg gcattatcat tcggacatga ttcaacgcct 1200 caattttacc ccatatgtgc caaccattcc atctcgcgtg ggcttagaca tcccacgggc 1260 aaacgtcccg tccagcccca gtcagcgaat gcggggataa tccggggttt cctaccccca 1320 tgggctgggc cggaatgcct aactccccga attggctgcc cggggagtgc aaataaaata 1380 gttgcttgta tacatatata tatatccttc ggtatatcca agacttcctg ttgcatcaag 1440 cgcaatccta agcttttttc tccctaccac aagtagctct acaaacccga aacctagaac 1500 aggcctgctg tacagtgacc ggtgactctt tctggcatgc ggagagacgg acggacgcag 1560 agagaagggc tgagtaataa gcgccactgc gccagacagc tctggcggct ctgaggtgca 1620 gtggatgatt attaatccgg gaccggccgc ccctccgccc cgaagtggaa aggctggtgt 1680 gcccctcgtt gaccaagaat ctattgcatc atcggagaat atggagcttc atcgaatcac 1740 cggcagtaag cgaaggagaa tgtgaagcca ggggtgtata gccgtcggcg aaatagcatg 1800 ccattaacct aggtacagaa gtccaattgc ttccgatctg gtaaaagatt cacgagatag 1860 taccttctcc gaagtaggta gagcgagtac ccggcgcgta agctccctaa ttggcccatc 1920 cggcatctgt agggcgtcca aatatcgtgc ctctcctgct ttgcccggtg tatgaaaccg 1980 gaaaggccgc tcaggagctg gccagcggcg cagaccggga acacaagctg gcagtcgacc 2040 catccggtgc tctgcactcg acctgctgag gtccctcagt ccctggtagg cagctttgcc 2100 ccgtctgtcc gcccggtgtg tcggcggggt tgacaaggtc gttgcgtcag tccaacattt 2160 gttgccatat tttcctgctc tccccaccag ctgctctttt cttttctctt tcttttccca 2220 tcttcagtat attcatcttc ccatccaaga acctttattt cccctaagta agtactttgc 2280 tacatccata ctccatcctt cccatccctt attcctttga acctttcagt tcgagctttc 2340 ccacttcatc gcagcttgac taacagctac cccgcttgag cagacatcac catggccaag 2400 ttgaccagtg ccgttccggt gctcaccgcg cgcgacgtcg ccggagcggt cgagttctgg 2460 accgaccggc tcgggttctc ccgggacttc gtggaggacg acttcgccgg tgtggtccgg 2520 gacgacgtga ccctgttcat cagcgcggtc caggaccagg tggtgccgga caacaccctg 2580 gcctgggtgt gggtgcgcgg cctggacgag ctgtacgccg agtggtcgga ggtcgtgtcc 2640 acgaacttcc gggacgcc 2658 <210> 33 <211> 2472 <212> DNA <213> Artificial <220> <223> Synthetic split marker fragment 3-flank hmfK3 with Phleomycin marker <400> 33 gcgcgacgtc gccggagcgg tcgagttctg gaccgaccgg ctcgggttct cccgggactt 60 cgtggaggac gacttcgccg gtgtggtccg ggacgacgtg accctgttca tcagcgcggt 120 ccaggaccag gtggtgccgg acaacaccct ggcctgggtg tgggtgcgcg gcctggacga 180 gctgtacgcc gagtggtcgg aggtcgtgtc cacgaacttc cgggacgcct ccgggccggc 240 catgaccgag atcggcgagc agccgtgggg gcgggagttc gccctgcgcg acccggccgg 300 caactgcgtg cacttcgtgg ccgaggagca ggactgatga tttaatagct ccatgtcaac 360 aagaataaaa cgcgtttcgg gtttacctct tccagataca gctcatctgc aatgcattaa 420 tgcattggac ctcgcaaccc tagtacgccc ttcaggctcc ggcgaagcag aagaatagct 480 tagcagagtc tattttcatt ttcgggagac gagatcaagc agatcaacgg tcgtcaagag 540 acctacgaga ctgaggaatc cgctcttggc tccacgcgac tatatatttg tctctaattg 600 tactttgaca tgctcctctt ctttactctg atagcttgac tatgaaaatt ccgtcaccag 660 cccctgggtt cgcaaagata attgcactgt ttcttccttg aactctcaag cctacaggac 720 acacattcat cgtaggtata aacctcgaaa atcattccta ctaagatggg tatacaatag 780 taaccatgca tggttgccta gtgaatgctc cgtaacaccc aatacgccgg ccgaaacttt 840 tttacaactc tcctatgagt cgtttaccca gaatgcacag gtacacttgt ttagaggtaa 900 tccttctttc tagaagtcct cgtgtactgt gtaagcgccc actccacatc tccactcgag 960 cctatcattc agcaatcaga ctctcctatc tcttccttgc atgcaataac tgtgtaaata 1020 tacgttttgc tctatgagat tgtacctttg gacgaacttg gagccccgcc gtggcctgtg 1080 tttgtttcta ttttgatctg tggagaggct agggtattta ggtgtgcaga ttcatcattg 1140 taaactggtt tgtatggtcg gggaactgtt ggatcactct tgcgccaccg ttgccctgtt 1200 gccccgttgc cccgttgccc tgttgcctgg caggtgacat gattagatcc actgcatttc 1260 ctcgccgttt ttaaattcaa ctatctcttt ctctctgata atttgcgtgg gtgacaatca 1320 tggcagtcca tagacatcgt cagcttcagc tggagctgat tctgatggtc gcagactatt 1380 tgcgaccttt agatctttta aatttggttc agggcatacc tcaaattgct tcccttctct 1440 cctctcgaca tatgcgagcc caagatgaca atggattcac tatatttcat ctgattgtgg 1500 aacaggggct taaaagccta atagaacgcc tcgataaatg gatcccacgg ggctttattc 1560 ccgacaacga agggtggaca cctcttcatc aagaagttag gaaggctaat taccggatgg 1620 taaaagcact gattgatgct ggctcagatt tatcagcccg gggttataat ggaaaaactt 1680 cccttcacct tgcctgcggt ggaaatgcag ttgaaattgt caggttgctc ttagaccatg 1740 gtgcaaaccc gtccgcaaag gattacgacg aaaggacgcc tttgcacgac gcctattctc 1800 atgacatatc tgtccgtcag atgcttatta cagccggcgc ggaccttgac ccctgccaag 1860 tgccacgggg gttgaccccc ctttattatg aacctatgat agcccgagaa agcgttatta 1920 ggattcttct tgaggctggg gcagaccttt ccattcaaga tatgagtggg gatactatat 1980 tacaccgcgc tacgatccac aatttcgcta atgtcgtccg gctgttactt gaattcggtg 2040 ttgatatcac tgtgcgaaat gtccacggtt ataccccggt tttggttgct gcaattggcg 2100 ggtcagatga atgtctacga ctgctcctca aggccggcgc agacctttca gtcatggata 2160 atcatggacg tagcgctttg catatagcag ctcgggcggg aagggaatct acagtccgac 2220 tgcttgtgaa acaaggaatg gacatcgccg cacgggacag ccgccgtggc tggactccga 2280 tgtgctgggc ggtaaactac gaacagaaag gggtaatcca agttttagaa gatacgcaaa 2340 caaaccgatt tgcgaagttt gcacggcgag tacgcatcaa attttaaatg ccatttttgc 2400 tcagagcgct aggcatgtcg tggttccgga tttcctgtag ccagataagc ctcatatatc 2460 actctttcac ca 2472 <210> 34 <211> 20 <212> DNA <213> Artificial <220> <223> Primer 180 <400> 34 ggtagaaaag gggttgcgat 20 <210> 35 <211> 18 <212> DNA <213> Artificial <220> <223> Primer 181 <400> 35 gaagcaatcg tcggaagt 18 <210> 36 <211> 21 <212> DNA <213> Artificial <220> <223> Primer 182 <400> 36 cgcgaggatg tatggtatga t 21 <210> 37 <211> 21 <212> DNA <213> Artificial <220> <223> Primer 183 <400> 37 gaaagtgaga ttgtggatgg a 21 <210> 38 <211> 17 <212> DNA <213> Artificial <220> <223> Primer 184 <400> 38 tgtcgttcat ggctccc 17 <210> 39 <211> 18 <212> DNA <213> Artificial <220> <223> Primer 185 <400> 39 aaggtgcgaa ctggagag 18 <210> 40 <211> 22 <212> DNA <213> Artificial <220> <223> Primer 186 <400> 40 ggaacaatcg gcaaagaaag tg 22 <210> 41 <211> 19 <212> DNA <213> Artificial <220> <223> Primer 187 <400> 41 caacttcttg tggcgttgg 19 <210> 42 <211> 20 <212> DNA <213> Artificial <220> <223> Primer 212 <400> 42 ctcggtcgct cttttgggta 20 <210> 43 <211> 20 <212> DNA <213> Artificial <220> <223> Primer 213 <400> 43 caggacattg ttggagccga 20 <210> 44 <211> 20 <212> DNA <213> Artificial <220> <223> Primer 214 <400> 44 tccggaagtg cttgacattg 20 <210> 45 <211> 22 <212> DNA <213> Artificial <220> <223> Primer 215 <400> 45 ccatcccgag tattctttcg ag 22 <210> 46 <211> 22 <212> DNA <213> Artificial <220> <223> Primer 216 <400> 46 ccgtgcgcta taataacctt cg 22 <210> 47 <211> 16 <212> DNA <213> Artificial <220> <223> Primer 217 <400> 47 gcgtcccgga agttcg 16 <210> 48 <211> 18 <212> DNA <213> Artificial <220> <223> Primer 218 <400> 48 gagcggtcga gttctgga 18 <210> 49 <211> 23 <212> DNA <213> Artificial <220> <223> Primer 219 <400> 49 ggtgaaagag tgatatatga ggc 23 <210> 50 <211> 21 <212> DNA <213> Artificial <220> <223> Primer 220 <400> 50 tctcaggact tgcagatgtt g 21 <210> 51 <211> 19 <212> DNA <213> Artificial <220> <223> Primer 221 <400> 51 gccaagtcat catcctcgc 19 <210> 52 <211> 20 <212> DNA <213> Artificial <220> <223> Primer 222 <400> 52 cttactgccg gtgattcgat 20 <210> 53 <211> 22 <212> DNA <213> Artificial <220> <223> Primer 223 <400> 53 ctacaggaca cacattcatc gt 22 <210> 54 <211> 18 <212> DNA <213> Artificial <220> <223> Primer 224 <400> 54 tgccagccct cctattcc 18 <210> 55 <211> 447 <212> PRT <213> Cupriavidus basilensis <400> 55 Met Glu Ala Val Ala Lys Lys Arg Thr Glu Thr Ile Ser Glu Ala Leu 1 5 10 15 Pro Ala Ala Thr Asn Arg Gln Val Phe Gly Ala Val Thr Ala Ser Cys 20 25 30 Met Gly Trp Ala Leu Asp Leu Phe Asp Leu Phe Ile Leu Leu Phe Val 35 40 45 Ala Pro Val Ile Gly Arg Leu Phe Phe Pro Ser Glu His Ala Met Leu 50 55 60 Ser Leu Ala Ala Val Tyr Ala Ser Phe Ala Val Thr Leu Leu Met Arg 65 70 75 80 Pro Leu Gly Ser Ala Ile Phe Gly Thr Tyr Ala Asp Arg His Gly Arg 85 90 95 Lys Gly Ala Met Val Val Ala Val Thr Gly Val Gly Leu Ser Thr Ala 100 105 110 Ala Phe Gly Leu Leu Pro Thr Val Gly Gln Val Gly Leu Leu Ala Pro 115 120 125 Ala Leu Phe Ile Leu Leu Arg Leu Val Gln Gly Ile Phe Val Gly Gly 130 135 140 Val Val Ala Ser Thr His Thr Ile Gly Thr Glu Ser Val Pro Pro Ser 145 150 155 160 Trp Arg Gly Ala Val Ser Gly Leu Val Gly Gly Gly Gly Ala Gly Ile 165 170 175 Gly Ala Leu Leu Ala Ser Ile Thr Tyr Met Ala Met Thr Ala Leu Phe 180 185 190 Pro Gly Glu Ala Phe Asp Ala Trp Gly Trp Arg Cys Met Phe Phe Ser 195 200 205 Gly Ile Ile Ser Ser Val Leu Gly Leu Phe Ile Phe Asn Ser Leu Glu 210 215 220 Glu Ser Pro Leu Trp Lys Gln Leu Gln Ala Ala Lys Gly His Ala Ala 225 230 235 240 Pro Val Glu Asn Pro Leu Arg Val Ile Phe Ser Arg Gln Tyr Arg Gly 245 250 255 Val Leu Phe Val Asn Ile Leu Leu Thr Val Gly Gly Gly Ser Ala Tyr 260 265 270 Tyr Leu Thr Ser Gly Tyr Leu Pro Thr Phe Leu Lys Val Val Val Lys 275 280 285 Ala Pro Ala Gly Ala Ser Ala Ala Ile Leu Met Ala Ser Ser Val Gly 290 295 300 Val Ile Val Ala Ser Ile Ile Ala Gly His Leu Ser Thr Leu Ile Gly 305 310 315 320 Arg Lys Arg Ala Phe Leu Leu Ile Gly Ala Leu Asn Val Val Leu Leu 325 330 335 Pro Leu Ile Tyr Gln Arg Met Pro Ala Ala Pro Asp Val Thr Thr Leu 340 345 350 Gly Ile Tyr Ala Val Ala Leu Ala Met Leu Gly Ser Thr Gly Phe Ala 355 360 365 Pro Ile Leu Ile Phe Leu Asn Glu Arg Phe Pro Thr Ser Ile Arg Ala 370 375 380 Thr Gly Thr Gly Leu Ser Trp Asn Ile Gly Phe Ala Ile Gly Gly Met 385 390 395 400 Met Pro Thr Phe Ala Ser Leu Cys Ala Ser Thr Pro Ala Asp Leu Pro 405 410 415 Lys Val Leu Gly Ile Phe Val Ala Val Val Thr Ala Ile Tyr Leu Ala 420 425 430 Gly Ala Ala Ile Val Pro Glu Thr Ala Gly Arg Leu Gly Glu Lys 435 440 445

Claims

유전자 변형이 결핍된 상응하는 모 세포(parent cell)와 비교하여, 세포에서 특이적 2,5-푸란디카르복실산 (FDCA) 탈카르복실화 모노옥시게나제 활성을 감소시키는 유전자 변형을 포함하는 진균 세포로서, 여기서 유전자 변형이 유전자의 코딩 서열 및 프로모터 중 적어도 하나의 적어도 일부의 결실에 의해 FDCA 탈카르복실화 모노옥시게나제를 코딩하는 내인성 유전자의 발현을 제거하는 것인 진균 세포.
제1항에 있어서, 상응하는 모 세포에서의 내인성 유전자가 서열번호: 4 중 적어도 하나에 대해 적어도 45% 서열 동일성(sequence identity)을 가진 아미노산 서열을 포함하는 FDCA 탈카르복실화 모노옥시게나제를 코딩하는 것인 진균 세포.
제1항 또는 제2항에 있어서, FDCA 탈카르복실화 모노옥시게나제를 코딩하는 내인성 유전자의 적어도 완전한 코딩 서열이 결실되는 것인 진균 세포.
제1항 내지 제3항 중 어느 한 항에 있어서, FDCA 탈카르복실화 모노옥시게나제를 코딩하는 내인성 유전자의 모든 카피의 발현이 제거되는 것인 진균 세포.
제1항 내지 제4항 중 어느 한 항에 있어서, HMF를 FDCA로 산화시키는 천연 능력을 갖는 진균 세포.
제1항 내지 제5항 중 어느 한 항에 있어서,
a) 유전자 변형이 결핍된 상응하는 야생형 세포와 비교하여, 세포에 5-히드록시메틸-2-푸란카르복실산 (HMFCA)을 5-포르밀-2-푸로산 (FFCA)으로 산화시키는 능력을 부여하거나 세포에서 HMFCA를 FFCA로 산화시키는 효소의 특이적 활성을 증가시키는 유전자 변형; 및,
b) 유전자 변형이 결핍된 상응하는 야생형 세포와 비교하여, 세포에 푸란계 알데히드를 상응하는 푸란계 카르복실산으로 산화시키는 능력을 부여하는 유전자 변형 또는 세포에서 푸란계 알데히드를 상응하는 푸란계 카르복실산으로 산화시키는 효소의 특이적 활성을 증가시키는 유전자 변형
중 적어도 하나인 추가의 유전자 변형을 포함하는 진균 세포.
제6항에 있어서, a)에서의 유전자 변형이 HMFCA 데히드로게나제 활성을 가진 폴리펩티드를 코딩하는 뉴클레오티드 서열의 발현을 증가시키는 변형으로서, 이 폴리펩티드는 서열번호: 1 및 2 중 적어도 하나의 아미노산 서열과 적어도 45% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인 변형; 및/또는,
b)에서의 유전자 변형이 푸란계 알데히드 데히드로게나제 활성을 갖는 폴리펩티드를 코딩하는 뉴클레오티드 서열의 발현을 증가시키는 변형으로서, 이 알데히드 데히드로게나제는 i) HMF를 HMFCA로 산화시키는 능력, ii) DFF를 FFCA로 산화시키는 능력, 및, iii) FFCA를 FDCA로 산화시키는 능력 중 적어도 하나를 가지며, 이 폴리펩티드는 서열번호: 3의 아미노산과 적어도 45% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인 변형인 진균 세포.
제1항 내지 제7항 중 어느 한 항에 있어서,
a) HMF 및/또는 FFCA를 상응하는 알콜로 환원시키는 단쇄 데히드로게나제를 코딩하는 유전자의 발현을 감소시키거나 제거하는 유전자 변형으로서, 여기서 바람직하게는 유전자는 서열번호: 5 및 25 중 적어도 하나에 대해 적어도 45% 서열 동일성을 가진 아미노산 서열을 포함하는 폴리펩티드를 코딩하는 유전자 중 적어도 하나인 유전자 변형;
b) 적어도 하나의 푸란계 화합물을 수송하는 폴리펩티드를 코딩하는 뉴클레오티드 서열의 발현을 증가시키는 유전자 변형으로서, 이 폴리펩티드는 바람직하게는 서열번호: 6 내지 10 중 적어도 하나의 아미노산 서열과 적어도 45% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인 유전자 변형; 및,
c) 푸란 이화작용에 관여하는 유전자의 전사 활성인자를 코딩하는 유전자의 발현을 변경시키는 유전자 변형으로서, 여기서 바람직하게는 유전자는 서열번호: 11에 대해 적어도 45% 서열 동일성을 가진 아미노산 서열을 포함하는 폴리펩티드를 코딩하는 유전자인 유전자 변형
으로부터 선택된 유전자 변형을 추가로 포함하는 진균 세포.
HMF를 FDCA로 산화시키는 능력을 갖고 적어도 하나의 푸란계 화합물을 수송하는 폴리펩티드를 코딩하는 뉴클레오티드 서열의 발현을 증가시키는 유전자 변형을 포함하는 진균 세포로서, 이 폴리펩티드는 바람직하게는 서열번호: 9 및 10 중 적어도 하나의 아미노산 서열과 적어도 45% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인, 진균 세포.
제9항에 있어서,
a) 유전자 변형이 결핍된 상응하는 모 세포와 비교하여, 세포에서 특이적 FDCA 탈카르복실화 모노옥시게나제 활성을 감소시키거나 제거하는 유전자 변형;
b) 유전자 변형이 결핍된 상응하는 야생형 세포와 비교하여, 세포에 HMFCA를 FFCA로 산화시키는 능력을 부여하거나 세포에서 HMFCA를 FFCA로 산화시키는 효소의 특이적 활성을 증가시키는 유전자 변형;
c) 유전자 변형이 결핍된 상응하는 야생형 세포와 비교하여, 세포에 푸란계 알데히드를 상응하는 푸란계 카르복실산으로 산화시키는 능력을 부여하는 유전자 변형 또는 세포에서 푸란계 알데히드를 상응하는 푸란계 카르복실산으로 산화시키는 효소의 특이적 활성을 증가시키는 유전자 변형;
d) HMF 및/또는 FFCA를 상응하는 알콜로 환원시키는 단쇄 데히드로게나제를 코딩하는 유전자의 발현을 감소시키거나 제거하는 유전자 변형으로서, 여기서 바람직하게는 유전자는 서열번호: 5 및 25 중 적어도 하나에 대해 적어도 45% 서열 동일성을 가진 아미노산 서열을 포함하는 폴리펩티드를 코딩하는 유전자 중 적어도 하나인 유전자 변형;
e) 적어도 하나의 푸란계 화합물을 수송하는 폴리펩티드를 코딩하는 뉴클레오티드 서열의 발현을 증가시키는 유전자 변형으로서, 이 폴리펩티드는 바람직하게는 서열번호: 6 내지 8 중 적어도 하나의 아미노산 서열과 적어도 45% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인 유전자 변형; 및,
f) 푸란 이화작용에 관여하는 유전자의 전사 활성인자를 코딩하는 유전자의 발현을 변경시키는 유전자 변형으로서, 여기서 바람직하게는 유전자는 서열번호: 11에 대해 적어도 45% 서열 동일성을 가진 아미노산 서열을 포함하는 폴리펩티드를 코딩하는 유전자인 유전자 변형
으로부터 선택되는 유전자 변형을 추가로 포함하는 진균 세포.
제1항 내지 제10항 중 어느 한 항에 있어서, 세포가,
아크레모니움, 아스페르길루스, 아우레오바시디움, 크립토코쿠스, 필리바시디움, 푸사리움, 후미콜라, 마그나포르테, 무코르, 미셀리오프토라, 네오칼리마스틱스, 뉴로스포라, 파에실로미세스, 페니실리움, 피로미세스, 스키조필룸, 탈라로미세스, 써모아스쿠스, 티엘라비아, 톨리포클라디움, 트리코더마, 및 우스틸라고로 이루어진 군으로부터의 속(genus)으로부터 선택된 사상균 세포(filamentous fungal cell)이며, 바람직하게는 세포가,
아스페르길루스 니게르, 아스페르길루스 아와모리, 아스페르길루스 포에티두스, 아스페르길루스 소자에, 아스페르길루스 푸미가투스, 탈라로미세스 에메르소니이, 아스페르길루스 오리자에, 미셀리오프토라 테르모필라, 트리코더마 레에세이, 페니실리움 크리소게눔, 페니실리움 심플리시시뭄 및 페니실리움 브라실리아눔으로 이루어진 군으로부터의 종으로부터 선택된 사상균 세포이거나;
또는, 여기서 세포가,
사카로미세스, 클루이베로미세스, 칸디다, 피치아, 스키조사카로미세스, 한세눌라, 클로에케라, 쉬완니오미세스, 야로위아, 크립토코쿠스, 데바로미세스, 사카로미세콥시스, 사카로미코데스, 위케르하미아, 데바요미세스, 한세니아스포라, 오가타에아, 쿠라이쉬아, 코마가타엘라, 메트쉬니코위아, 윌리옵시스, 나카자와에아, 토룰라스포라, 불레라, 로도토룰라, 및 스포로볼로미세스로 이루어진 군으로부터의 속으로부터 선택된 효모 세포이며, 바람직하게는 세포가, 클루이베로미세스 락티스, 에스. 세레비시아에, 한세눌라 폴리모르파, 야로위아 리폴리티카, 칸디다 트로피칼리스 및 피치아 파스토리스로 이루어진 군으로부터의 종으로부터 선택된 효모 세포인, 세포.
HMFCA를 FFCA로 산화시키는 능력을 갖는 효소를 발현하는, 제5항 내지 제11항 중 어느 한 항에 따른 진균 세포를, 상기 세포에 의한 HMFCA의 산화에 도움이 되는 조건하에, HMFCA의 존재하에, 인큐베이션하는 단계를 포함하는, HMFCA를 FFCA로 산화시키는 방법.
제5항 내지 제11항 중 어느 한 항에 따른 진균 세포를, FDCA의 하나 이상의 푸란계 전구체를 포함하는 배지에서, 바람직하게는 상기 세포에 의한 FDCA의 푸란계 전구체의 FDCA로의 산화에 도움이 되는 조건하에, 인큐베이션하는 단계, 및, 임의로 FDCA의 회수 단계를 포함하며, 여기서 바람직하게는, FDCA의 적어도 하나의 푸란계 전구체는 HMF, 2,5-디히드록시메틸 푸란 (DHF), HMFCA, FFCA 및 2,5-디포르밀 푸란 (DFF)으로 이루어진 군으로부터 선택되며, 이 중 HMF가 가장 바람직하고,
여기서 FDCA의 푸란계 전구체는 하나 이상의 헥소스 당, 바람직하게는 리그노셀룰로스 바이오매스(biomass)로부터 수득된 하나 이상의 헥소스 당으로부터, 바람직하게는 산-촉매화된 탈수에 의해 수득되고,
여기서 바람직하게는 FDCA는 산 침전 후에 냉각 결정화 및/또는 용매 추출을 포함하는 공정에 의해 배지로부터 회수되는 것인,
FDCA를 제조하는 방법.
제13항에 있어서, 배지가 2.0 내지 3.0의 범위의 pH를 가지며, 여기서 바람직하게는 FDCA는 그것이 제조되는 산성 배지로부터 침전되고, 산 침전 후에 냉각 결정화를 포함하는 공정에 의해 배지로부터 회수되는 것인 방법.
a) 제13항 또는 제14항에 따른 방법으로 FDCA 단량체를 제조하는 단계; 및,
b) a)에서 수득된 FDCA 단량체로부터 중합체를 제조하는 단계
를 포함하는, 적어도 2개의 FDCA 단량체로부터 중합체를 제조하는 방법.
제15항에 있어서, 중합체가 FDCA 단량체와 디올 단량체를 혼합하고 FDCA와 디올 단량체가 중합되는 조건하에 상기 혼합물을 가져옴으로써 제조되는 것인 방법.
푸란계 전구체 중 하나 이상의 FDCA로의 생체형질전환을 위한, 제5항 내지 제11항 중 어느 한 항에 따른 진균 세포, 또는 FDCA의 푸란계 전구체를 FDCA로 전환시키는 능력을 가진 하나 이상의 박테리아 효소를 발현하는 진균 세포의 용도로서, 여기서 바람직하게는, FDCA의 적어도 하나의 푸란계 전구체가 HMF, DHF, HMFCA, FFCA 및 DFF로 이루어진 군으로부터 선택되며, 이 중 HMF가 가장 바람직한 것인, 용도.