KR20190130134A - Fdca 제조를 위한 fdca-탈카르복실화 모노옥시게나제-결핍 숙주 세포 - Google Patents
Fdca 제조를 위한 fdca-탈카르복실화 모노옥시게나제-결핍 숙주 세포 Download PDFInfo
- Publication number
- KR20190130134A KR20190130134A KR1020197029619A KR20197029619A KR20190130134A KR 20190130134 A KR20190130134 A KR 20190130134A KR 1020197029619 A KR1020197029619 A KR 1020197029619A KR 20197029619 A KR20197029619 A KR 20197029619A KR 20190130134 A KR20190130134 A KR 20190130134A
- Authority
- KR
- South Korea
- Prior art keywords
- ala
- leu
- gly
- val
- ser
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P17/00—Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
- C12P17/02—Oxygen as only ring hetero atoms
- C12P17/04—Oxygen as only ring hetero atoms containing a five-membered hetero ring, e.g. griseofulvin, vitamin C
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/37—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
- C07K14/385—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from Penicillium
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0071—Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
- C12N9/0073—Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14) with NADH or NADPH as one donor, and incorporation of one atom of oxygen 1.14.13
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/40—Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
- C12P7/42—Hydroxy-carboxylic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/40—Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
- C12P7/44—Polycarboxylic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/62—Carboxylic acid esters
Abstract
본 발명은 FDCA의 제조를 위한 진균 세포에 관한 것이다. 진균 세포는 유전자 변형이 결핍된 상응하는 모 세포와 비교하여, 세포에서 특이적 2,5-푸란디카르복실산 (FDCA) 탈카르복실화 모노옥시게나제 활성을 감소시키는 유전자 변형을 갖는다. 진균 세포는 푸란계 알데히드를 상응하는 푸란계 카르복실산으로 산화시키는 세포의 능력을 증가시키기 위해 추가로 유전자 변형될 수 있다. 본 발명은 또한 FDCA의 푸란계 전구체를 FDCA로 산화시키기 위해 본 발명의 세포를 사용하는, 2,5-푸란-디카르복실산 (FDCA)의 제조 방법에 관한 것이다.
Description
본 발명은 분자 유전학, 대사 공학, 생체형질전환 및 발효 기술 분야에 관한 것이다. 특히, 본 발명은 히드록시메틸푸르푸랄로부터 2,5-푸란디카르복실산을 제조하도록 유전자 변형되는 진균에 관한 것이다. 본 발명은 추가로 히드록시메틸푸르푸랄의 2,5-푸란디카르복실산으로의 생체형질변환 방법에서 이러한 진균의 용도에 관한 것이다.
2,5-푸란디카르복실산 (FDCA)은 엄청난 경제적 영향을 미치는 폴리에스테르의 제조에 적용될 수 있는 단량체 화합물이다. 본 분야에서 매우 중요한 화합물은 테레프탈산 (PTA) 및 에틸렌 글리콜로부터 제조되는 폴리에틸렌테레프탈레이트 (PET)이다. FDCA는 폴리에스테르 PET에서 PTA를 대체할 수 있으며 이 경우에 폴리에틸렌푸란디카르복실레이트 (PEF)가 생성된다. PEF는 대형 폴리에스테르 시장에서 PET를 대체하는데 있어 양호한 잠재력을 갖고 있다. 그것이 PET와 비교할 때 우수한 특성을 가지고 있기 때문일뿐만 아니라 재생가능한 공급원료으로부터 유래될 수 있기 때문이다. FDCA는 당류로부터 화학적으로 (De Jong et al., 2012. In: Biobased Monomers, Polymers, and Materials; Smith, P., et al.; ACS Symposium Series; American Chemical Society: Washington, DC) 또는 조합된 화학-생물학적 경로로 (Wiercks et al., 2011. Appl Microbiol Biotechnol 92:1095-1105) 제조될 수 있다. 후자의 경우에, 글루코스 또는 프럭토스와 같은 단량체성 당은 5-(히드록시메틸)-2-푸르알데히드 (HMF)로 화학적으로 변환되고, 이는 후속적으로 효소에 의해 FDCA로 산화될 수 있다.
HMF로부터 FDCA를 제조하기 위한 생물학적 경로는 쿠프리아비두스 바실렌시스(Cupriavidus basilensis) HMF14의 HMF-분해 균주의 단리에 기초하여 개발되었다 (Wierckx et al., 2010. Microbial Technology 3:336-343). 씨. 바실렌시스(C. basilensis) HMF14에서 HMF 분해 경로에 관여하는 효소를 코딩하는 유전자의 클러스터가 확인되었고, 관련 유전자가 슈도모나스 푸티다(Pseudomonas putida ) S12 균주에서 이종 발현되며 (Koopman et al., 2010. PNAS 107:4919-4924) 그로 인해 HMF를 대사시키는 능력을 획득하였다. HMF-산 (HMFCA)에서 주로 옥시다제로서 작용하나 HMF 또는 FFCA를 또한 산화시킬 수 있는 HMF 옥시도리덕타제를 코딩하는, 단지 hmfH 유전자의 이종 발현은, 피. 푸티다(P. putida) S12가 HMF로부터 FDCA를 제조할 수 있게 한다 (Koopman et al., 2010. Bioresource Technology 101:6291-6296; 및 WO 2011/026913). 추가 최적화 작업 (상기 문헌 [Wierckx et al., 2011]; 및 WO 2012/064195)에서, 각각 HMFCA 수송체 및 특이성이 알려지지 않은 알데히드 데히드로게나제를 코딩하는 피. 푸티다 S12에서 2개의 추가 유전자가 발현되었다.
US 7,067,303는 진균 코니오카에타 리그니아리아(Coniochaeta ligniaria) (유성생식형(teleomorph)), 또는 그의 레시토포라(Lecythophora) 무성생식형 상태가 농업용 바이오매스(biomass) 가수분해물에서 푸란, 특히 푸르푸랄 및 HMF의 독성 수준을 유의적으로 감소시킬 수 있음을 개시하고 있다. 당-함유 가수분해물을 해독하는데 있어서 생물학적 작용제로서 씨. 리그니아리아(C. ligniaria)의 용도는 다수의 후속 논문에서 추가로 입증되었다 (Lpez et al., 2004. Appl. Microbiol Biotechnol 64:125-131; Nichols et al., 2005. Appl Biochem Biotechnol. Spring; 121-124:379-90; Nichols et al., 2008. Enzyme and Microbial Technology 42:624-630; Nichols et al., 2010. Bioresource Technol 19:7545-50; Nichols et al., 2014. Biomass and Bioenergy 67:79-88). 독성이 덜한 화합물로의 HMF의 해독과는 별도로, 유기체는 성장을 위해 HMF를 또한 대사시킬 수 있었다.
문헌 [Zhang et al. (2010, Biotechnology for Biofuels 3:26)]은 아모르포테카 레시나에(Amorphotheca resinae) 및 유페니실리움 바아르넨세(Eupenicillium baarnense)로서 각각 확인된, 그의 옥수수 대(corn stover) 가수분해물을 해독한 2개의 HMF-대사 진균의 단리를 기재하였다. 후속 논문 (Ran et al., 2014, Biotechnology for Biofuels 7:51)에서, ZN1로서 명명된 에이. 레시나에(A. resinae) 균주의 성장은, HMF를 포함한 많은 화합물에 의해 지지되는 것으로 보고되었다. HMF는 분해되었고, HMF 알콜 및 HMFCA는 시간에 따라 축적되었으나, FDCA의 축적은 보고되지 않았다.
문헌 [Govinda Rajulu et al. (2014, Mycological Progress 13:1049-1056)]은 푸르푸랄 및/또는 HMF를 단독 탄소 공급원으로서 이용하는 능력을 가진 다수의 진균을 유사하게 단리하였으나, FDCA의 축적은 보고되지 않았다.
따라서, HMF를 희생하여 성장하거나 HMF-함유 공급원료를 해독하는 몇몇 진균이 기재되어 있다. 효모와 마찬가지로, 공급원료를 해독하기 위해 HMF를 HMF-알콜로 환원시키는 관점에서 유기체를 연구하였다. 그러나, 효모 또는 사상균에 의한 FDCA의 제조는 기재되어 있지 않다. 그런데도, HMF로부터 FDCA의 진균 제조는 관련 기술분야에서 박테리아 과정에 비해 몇몇 고유한 이점을 제공할 것이다. 예를 들어, 많은 진균은 성장을 위해 pH = 3 이하까지의 낮은 pH 값을 견딜 수 있으며, 한편 대부분의 박테리아는 중성 pH 환경을 선호한다. FDCA의 대규모 제조의 특정 상황에서, 다운스트림 프로세싱(downstream processing) (DSP)의 이점 때문에 그리고 감염 퇴치를 위해 낮은 pH 값에서의 전세포(whole-cell) 제조 방법론을 사용할 수 있다면 큰 이점이 될 것이다.
따라서, 본 발명의 목적은 진균 세포 및 HMF로부터 FDCA의 제조 방법에서 및 그의 용도를 제공하는 것이다.
발명의 개요
제1 측면에서 본 발명은 유전자 변형이 결핍된 상응하는 모 세포(parent cell)와 비교하여, 세포에서 특이적 2,5-푸란디카르복실산 (FDCA) 탈카르복실화 모노옥시게나제 활성을 감소시키는 유전자 변형을 포함하는 진균 세포로서, 여기서 유전자 변형이 유전자의 코딩 서열 및 프로모터 중 적어도 하나의 적어도 일부의 결실에 의해 FDCA 탈카르복실화 모노옥시게나제를 코딩하는 내인성 유전자의 발현을 제거하는 것인 진균 세포에 관한 것이다. 바람직하게는, 세포에서, 상응하는 모 세포에서의 내인성 유전자는 서열번호: 4 중 적어도 하나에 대해 적어도 45% 서열 동일성(sequence identity)을 가진 아미노산 서열을 포함하는 FDCA 탈카르복실화 모노옥시게나제를 코딩한다. 유전자 변형이 세포의 게놈에서의 유전자로부터 FDCA 탈카르복실화 모노옥시게나제를 코딩하는 내인성 유전자의 적어도 완전한 코딩 서열의 결실을 포함하거나 그로 이루어지는 것이 추가로 바람직하다. 내인성 유전자의 하나 초과의 카피를 포함하는 세포에서, 바람직하게는, FDCA 탈카르복실화 모노옥시게나제를 코딩하는 내인성 유전자의 모든 카피의 발현이 제거된다.
본 발명에 따른 진균 세포는 바람직하게는 HMF를 FDCA로 산화시키는 천연 능력을 갖는 세포이다.
본 발명에 따른 바람직한 진균 세포는 바람직하게는 a) 유전자 변형이 결핍된 상응하는 야생형 세포와 비교하여, 세포에 5-히드록시메틸-2-푸란카르복실산 (HMFCA)을 5-포르밀-2-푸로산 (FFCA)으로 산화시키는 능력을 부여하거나 세포에서 HMFCA를 FFCA로 산화시키는 효소의 특이적 활성을 증가시키는 유전자 변형; 및, b) 유전자 변형이 결핍된 상응하는 야생형 세포와 비교하여, 세포에 푸란계(furanic) 알데히드를 상응하는 푸란계 카르복실산으로 산화시키는 능력을 부여하는 유전자 변형 또는 세포에서 푸란계 알데히드를 상응하는 푸란계 카르복실산으로 산화시키는 효소의 특이적 활성을 증가시키는 유전자 변형 중 적어도 하나인 추가의 유전자 변형을 포함한다. 바람직하게는, 세포에서, a)에서의 유전자 변형은 HMFCA 데히드로게나제 활성을 가진 폴리펩티드를 코딩하는 뉴클레오티드 서열의 발현을 증가시키는 변형이며, 이 폴리펩티드는 서열번호: 1 및 2 중 적어도 하나의 아미노산 서열과 적어도 45% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인 변형이고/이거나; b)에서의 유전자 변형은 푸란계 알데히드 데히드로게나제 활성을 갖는 폴리펩티드를 코딩하는 뉴클레오티드 서열의 발현을 증가시키는 변형으로서, 이 알데히드 데히드로게나제는 i) HMF를 HMFCA로 산화시키는 능력, ii) DFF를 FFCA로 산화시키는 능력, 및, iii) FFCA를 FDCA로 산화시키는 능력 중 적어도 하나를 가지며, 이 폴리펩티드는 서열번호: 3의 아미노산과 적어도 45% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인 변형이다.
본 발명에 따른 진균 세포는 바람직하게는, a) HMF 및/또는 FFCA를 상응하는 알콜로 환원시키는 단쇄 데히드로게나제를 코딩하는 유전자의 발현을 감소시키거나 제거하는 유전자 변형으로서, 여기서 바람직하게는 유전자는 서열번호: 5 및 25 중 적어도 하나에 대해 적어도 45% 서열 동일성을 가진 아미노산 서열을 포함하는 폴리펩티드를 코딩하는 유전자 중 적어도 하나인 유전자 변형; b) 적어도 하나의 푸란계 화합물을 수송하는 폴리펩티드를 코딩하는 뉴클레오티드 서열의 발현을 증가시키는 유전자 변형으로서, 이 폴리펩티드는 바람직하게는 서열번호: 6 내지 10 중 적어도 하나의 아미노산 서열과 적어도 45% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인 유전자 변형; 및, c) 푸란 이화작용에 관여하는 유전자의 전사 활성인자를 코딩하는 유전자의 발현을 변경시키는 유전자 변형으로서, 여기서 바람직하게는 유전자는 서열번호: 11에 대해 적어도 45% 서열 동일성을 가진 아미노산 서열을 포함하는 폴리펩티드를 코딩하는 유전자인 유전자 변형으로부터 선택된 유전자 변형을 추가로 포함한다.
별개의 측면에서 본 발명은 HMF를 FDCA로 산화시키는 능력을 갖고 적어도 하나 이상의 푸란계 화합물을 수송하는 폴리펩티드를 코딩하는 뉴클레오티드 서열의 발현을 증가시키는 유전자 변형을 포함하는 진균 세포로서, 이 폴리펩티드는 바람직하게는 서열번호: 9 및 10 중 적어도 하나의 아미노산 서열과 적어도 45% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인, 진균 세포에 관한 것이다. 바람직하게는 이 측면에 따른 세포는, a) 유전자 변형이 결핍된 상응하는 모 세포와 비교하여, 세포에서 특이적 FDCA 탈카르복실화 모노옥시게나제 활성을 제거하거나 감소시키는 유전자 변형; b) 유전자 변형이 결핍된 상응하는 야생형 세포와 비교하여, 세포에 HMFCA를 FFCA로 산화시키는 능력을 부여하거나 세포에서 HMFCA를 FFCA로 산화시키는 효소의 특이적 활성을 증가시키는 유전자 변형; c) 유전자 변형이 결핍된 상응하는 야생형 세포와 비교하여, 세포에 푸란계 알데히드를 상응하는 푸란계 카르복실산으로 산화시키는 능력을 부여하는 유전자 변형 또는 세포에서 푸란계 알데히드를 상응하는 푸란계 카르복실산으로 산화시키는 효소의 특이적 활성을 증가시키는 유전자 변형; d) HMF 및/또는 FFCA를 상응하는 알콜로 환원시키는 단쇄 데히드로게나제를 코딩하는 유전자의 발현을 감소시키거나 제거하는 유전자 변형으로서, 여기서 바람직하게는 유전자는 서열번호: 5 및 25 중 적어도 하나에 대해 적어도 45% 서열 동일성을 가진 아미노산 서열을 포함하는 폴리펩티드를 코딩하는 유전자 중 적어도 하나인 유전자 변형; e) 적어도 하나의 푸란계 화합물을 수송하는 폴리펩티드를 코딩하는 뉴클레오티드 서열의 발현을 증가시키는 유전자 변형으로서, 이 폴리펩티드는 바람직하게는 서열번호: 6 내지 8 중 적어도 하나의 아미노산 서열과 적어도 45% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인 유전자 변형; 및, f) 푸란 이화작용에 관여하는 유전자의 전사 활성인자를 코딩하는 유전자의 발현을 변경시키는 유전자 변형으로서, 여기서 바람직하게는 유전자는 서열번호: 11에 대해 적어도 45% 서열 동일성을 가진 아미노산 서열을 포함하는 폴리펩티드를 코딩하는 유전자인 유전자 변형으로부터 선택된 추가의 유전자 변형을 포함한다.
본 발명의 상기 측면에 따른 세포는, 바람직하게는 아크레모니움(Acremonium), 아스페르길루스(Aspergillus), 아우레오바시디움(Aureobasidium), 크립토코쿠스(Cryptococcus), 필리바시디움(Filibasidium), 푸사리움(Fusarium), 후미콜라(Humicola), 마그나포르테(Magnaporthe), 무코르(Mucor), 미셀리오프토라(Myceliophthora), 네오칼리마스틱스(Neocallimastix), 뉴로스포라(Neurospora), 파에실로미세스(Paecilomyces), 페니실리움(Penicillium), 피로미세스(Piromyces), 스키조필룸(Schizophyllum), 탈라로미세스(Talaromyces), 써모아스쿠스(Thermoascus), 티엘라비아(Thielavia), 톨리포클라디움(Tolypocladium), 트리코더마(Trichoderma), 및 우스틸라고(Ustilago)로 이루어진 군으로부터의 속(genus)으로부터 선택된 사상균 세포(filamentous fungal cell)이며, 더 바람직하게는 세포는, 아스페르길루스 니게르(Aspergillus niger), 아스페르길루스 아와모리(Aspergillus awamori), 아스페르길루스 포에티두스(Aspergillus foetidus), 아스페르길루스 소자에(Aspergillus sojae), 아스페르길루스 푸미가투스(Aspergillus fumigatus), 탈라로미세스 에메르소니이(Talaromyces emersonii), 아스페르길루스 오리자에(Aspergillus oryzae), 미셀리오프토라 테르모필라(Myceliophthora thermophile), 트리코더마 레에세이(Trichoderma reesei), 페니실리움 크리소게눔(Penicillium chrysogenum), 페니실리움 심플리시시뭄(Penicillium simplicissimum) 및 페니실리움 브라실리아눔(Penicillium brasilianum)으로 이루어진 군으로부터의 종으로부터 선택된 사상균 세포이거나; 또는, 세포는, 사카로미세스(Saccharomyces), 클루이베로미세스(Kluyveromyces), 칸디다(Candida), 피치아(Pichia), 스키조사카로미세스(Schizosaccharomyces), 한세눌라(Hansenula), 클로에케라(Kloeckera), 쉬완니오미세스(Schwanniomyces), 야로위아(Yarrowia), 크립토코쿠스, 데바로미세스(Debaromyces), 사카로미세콥시스(Saccharomycecopsis), 사카로미코데스(Saccharomycodes), 위케르하미아(Wickerhamia), 데바요미세스(Debayomyces), 한세니아스포라(Hanseniaspora), 오가타에아(Ogataea), 쿠라이쉬아(Kuraishia), 코마가타엘라 (Komagataella), 메트쉬니코위아(Metschnikowia), 윌리옵시스(Williopsis), 나카자와에아(Nakazawaea), 토룰라스포라(Torulaspora), 불레라(Bullera), 로도토룰라(Rhodotorula), 및 스포로볼로미세스(Sporobolomyces)로 이루어진 군으로부터의 속으로부터 선택된 효모 세포이며, 더 바람직하게는 세포는 클루이베로미세스 락티스(Kluyveromyces lactis), 에스. 세레비시아에(S. cerevisiae), 한세눌라 폴리모르파(Hansenula polymorpha), 야로위아 리폴리티카 (Yarrowia lipolytica), 칸디다 트로피칼리스(Candida tropicalis) 및 피치아 파스토리스(Pichia pastoris)로 이루어진 군으로부터의 종으로부터 선택된 효모 세포이다.
추가 측면에서 본 발명은 HMFCA를 FFCA로 산화시키는 능력을 갖는 효소를 발현하는, 본 발명에 따른 진균 세포를, 상기 세포에 의한 HMFCA의 산화에 도움이 되는 조건하에, HMFCA의 존재하에, 인큐베이션하는 단계를 포함하는, HMFCA를 FFCA로 산화시키는 방법에 관한 것이다.
또 다른 측면에서, 본 발명은 본 발명에 따른 진균 세포를, FDCA의 하나 이상의 푸란계 전구체를 포함하는 배지에서, 바람직하게는 상기 세포에 의한 FDCA의 푸란계 전구체의 FDCA로의 산화에 도움이 되는 조건하에, 인큐베이션하는 단계, 및, 임의로 FDCA의 회수 단계를 포함하며, 여기서 바람직하게는, FDCA의 적어도 하나의 푸란계 전구체는 HMF, 2,5-디히드록시메틸 푸란 (DHF), HMFCA, FFCA 및 2,5-디포르밀 푸란 (DFF)으로 이루어진 군으로부터 선택되며, 이 중 HMF가 가장 바람직하고, 여기서 FDCA의 푸란계 전구체는 하나 이상의 헥소스 당, 바람직하게는 리그노셀룰로스 바이오매스로부터 수득된 하나 이상의 헥소스 당으로부터, 바람직하게는 산-촉매화된 탈수에 의해 수득되고, 여기서 바람직하게는 FDCA는 산 침전 후에 냉각 결정화 및/또는 용매 추출을 포함하는 공정에 의해 배지로부터 회수되는 것인, FDCA를 제조하는 방법에 관한 것이다. 바람직하게는, 상기 방법에서, 배지는 2.0 내지 3.0의 범위의 pH를 가지며, 여기서 바람직하게는 FDCA는 그것이 제조되는 산성 배지로부터 침전되고, 산 침전 후에 냉각 결정화를 포함하는 공정에 의해 배지로부터 회수된다.
또 다른 측면에서 본 발명은 a) 본 발명에 따른 방법으로 FDCA 단량체를 제조하는 단계; 및, b) a)에서 수득된 FDCA 단량체로부터 중합체를 제조하는 단계를 포함하는, 적어도 2개의 FDCA 단량체로부터 중합체를 제조하는 방법이며, 여기서 바람직하게는 중합체가 FDCA 단량체와 디올 단량체를 혼합하고 FDCA와 디올 단량체가 중합되는 조건하에 상기 혼합물을 가져옴으로써 제조되는 것인 방법에 관한 것이다.
최종 측면에서, 본 발명은 푸란계 전구체 중 하나 이상의 FDCA로의 생체형질전환을 위한 본 발명에 따른 진균 세포, 또는 FDCA의 푸란계 전구체를 FDCA로 전환시키는 능력을 가진 하나 이상의 박테리아 효소를 발현하는 진균 세포의 용도로서, 여기서 바람직하게는, FDCA의 적어도 하나의 푸란계 전구체가 HMF, DHF, HMFCA, FFCA 및 DFF로 이루어진 군으로부터 선택되며, 이 중 HMF가 가장 바람직한 것인, 용도에 관한 것이다.
발명의 설명
정의
용어 "상동성", "서열 동일성" 등은 본원에서 상호교환적으로 사용된다. 서열 동일성은 본원에서 서열을 비교함으로써 결정된 바와 같이, 2개 이상의 아미노산 (폴리펩티드 또는 단백질) 서열 또는 2개 이상의 핵산 (폴리뉴클레오티드) 서열 사이의 관계로서 정의된다. 관련 기술분야에서, "동일성"은 또한, 경우에 따라, 이러한 서열의 스트링 사이의 일치에 의해 결정되는 바와 같이, 아미노산 또는 핵산 서열 사이의 서열 관련성의 정도를 의미한다. 2개의 아미노산 서열 사이의 "유사성"은 하나의 폴리펩티드의 아미노산 서열 및 그의 보존된 아미노산 치환물을 제2 폴리펩티드의 서열과 비교함으로써 결정된다. "동일성"및 "유사성"은 공지된 방법에 의해 용이하게 계산될 수 있다.
"서열 동일성" 및 "서열 유사성"은 2개의 서열의 길이에 따라, 전반적인 또는 국소 정렬 알고리즘을 사용하여 2개의 펩티드 또는 2개의 뉴클레오티드 서열의 정렬에 의해 결정될 수 있다. 유사한 길이의 서열은 바람직하게는 전체 길이에 걸쳐 서열을 최적으로 정렬하는 전반적인 정렬 알고리즘 (예를 들어, 니들먼 분취(Needleman Wunsch))을 사용하여 정렬되며, 한편 실질적으로 상이한 길이의 서열은 바람직하게는 국소 정렬 알고리즘 (예를 들어 스미스 워터만(Smith Waterman))을 사용하여 정렬된다. 그 다음에 서열은 이들이 (예를 들어, 디폴트 파라미터를 사용하여 프로그램 GAP 또는 BESTFIT에 의해 최적으로 정렬되는 경우) 적어도 특정 최소한 백분율의 서열 동일성 (하기 정의된 바와 같이)을 공유하는 경우 "실질적으로 동일한" 또는 "본질적으로 유사한"으로 지칭될 수 있다. GAP는 니들먼 및 분취의 전반적인 정렬 알고리즘을 사용하여 2개의 서열을 그의 전체 길이 (전장)에 걸쳐 정렬하여, 일치의 수를 최대화하고 간격의 수를 최소화한다. 전반적인 정렬은 2개의 서열이 유사한 길이를 갖는 경우 서열동일성을 결정하는데 적합하게 사용된다. 일반적으로, 갭 생성 페널티 = 50 (뉴클레오티드) / 8 (단백질) 및 갭 확장 페널티 = 3 (뉴클레오티드) / 2 (단백질)로 GAP 디폴트 파라미터가 사용된다. 뉴클레오티드의 경우, 사용된 디폴트 스코어링 매트릭스는 nwsgapdna이고, 단백질의 경우 디폴트 스코어링 매트릭스는 Blosum62이다 (Henikoff & Henikoff, 1992, PNAS 89, 915-919). 서열 동일성 백분율에 대한 서열 정렬 및 점수는 컴퓨터 프로그램, 예컨대 GCG 위스콘신 패키지(Wisconsin Package), 버전 10.3 (엑설리스 인크.(Accelrys Inc.) (미국 캘리포니아주 92121-3752 샌디에고, 스크랜튼 로드 9685)로부터 입수 가능)을 사용하거나, 오픈 소스 소프트웨어, 예컨대 프로그램 "니들" (전반적인 니들먼 분취 알고리즘) 또는 "워터" (국소 스미스 워터만 알고리즘) (엠보스윈(EmbossWIN) 버전 2.10.0으로)를 사용하거나, 상기 GAP의 경우와 동일한 파라미터를 사용하거나, 디폴트 설정을 사용하여 결정될 수 있다 ('니들' 및 '워터' 둘 다에 대해 및 단백질 및 DNA 정렬 둘 다에 대해, 디폴트 갭 개방 페널티는 10.0이고 디폴트 갭 확장 페널티는 0.5이며; 디폴트 스코링 매트릭스는 단백질의 경우 Blossum62이고 DNA의 경우 DNAFull이다). 서열이 실질적으로 상이한 전체 길이를 갖는 경우, 스미스 워터만 알고리즘을 사용하는 것들과 같은 국소 정렬이 바람직하다.
대안적으로 백분율 유사성 또는 동일성은 FASTA, BLAST 등과 같은 알고리즘을 사용하여, 공개 데이터베이스를 검색함으로써 결정될 수 있다. 따라서, 본 발명의 핵산 및 단백질 서열은, 예를 들어, 다른 패밀리 구성원 또는 관련 서열을 확인하기 위해, 공개 데이터베이스에 대한 검색을 수행하기 위한 "조회(query) 서열"로서 추가로 사용될 수 있다. 이러한 검색은 문헌 [Altschul, et al. (1990) J. Mol. Biol. 215:403―10]의 BLASTn 및 BLASTx 프로그램 (버전 2.0)을 사용하여 수행할 수 있다. BLAST 뉴클레오티드 검색은 NBLAST 프로그램, 점수 = 100, 단어 길이 = 12로 수행되어 본 발명의 옥시도리덕타제 핵산 분자에 상동인 뉴클레오티드 서열을 수득할 수 있다. BLAST 단백질 검색은 BLASTx 프로그램, 점수 = 50, 단어 길이 = 3으로 수행되어 본 발명의 단백질 분자에 상동인 아미노산 서열을 수득할 수 있다. 비교 목적으로 갭트(gapped) 정렬을 수득하기 위해, 갭트(Gapped) BLAST는 문헌 [Altschul et al., (1997) Nucleic Acids Res. 25(17): 3389-3402]에 기재된 바와 같이 이용할 수 있다. BLAST 및 갭트 BLAST 프로그램을 이용할 때, 각각의 프로그램의 디폴트 파마미터 (예를 들어, BLASTx 및 BLASTn)를 사용할 수 있다. http://www.ncbi.nlm.nih.gov/에서 국립 생명공학 정보 센터의 홈페이지를 참조.
임의로, 아미노산 유사성의 정도를 결정하는데 있어서, 통상의 기술자는 통상의 기술자에게 명백한 바와 같이, 소위 "보존적" 아미노산 치환을 또한 고려할 수 있다. 보존적 아미노산 치환은 유사한 측쇄를 갖는 잔기의 상호교환성을 지칭한다. 보존적 치환을 위한 아미노산 잔기 부류의 예를 하기 표에 제공하였다.
대안적인 보존적 아미노산 잔기 치환 부류.
아미노산 잔기의 대안적인 물리적 및 기능적 분류.
본원에 사용된 바와 같이, 용어 "선택적으로 하이브리드화하는", "선택적으로 하이브리드화하다" 및 유사한 용어는 서로에 대해 적어도 66%, 적어도 70%, 적어도 75%, 적어도 80%, 더 바람직하게는 적어도 85%, 더욱 더 바람직하게는 적어도 90%, 바람직하게는 적어도 95%, 더 바람직하게는 적어도 98% 또는 더 바람직하게는 적어도 99%인 상동인 뉴클레오티드 서열이 전형적으로 서로 하이브리드화된 채로 존재하는 하이브리드화 및 세척을 위한 조건을 기재하고자 한다. 즉, 이러한 하이브리드화 서열은 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65, 적어도 70%, 적어도 75%, 적어도 80%, 더 바람직하게는 적어도 85%, 더욱 더 바람직하게는 적어도 90%, 더 바람직하게는 적어도 95%, 더 바람직하게는 적어도 98% 또는 더 바람직하게는 적어도 99% 서열 동일성을 공유할 수 있다.
이러한 하이브리드화 조건의 바람직한, 비제한적 예는 약 45℃에서 6X 염화나트륨/시트르산나트륨 (SSC) 중에서의 하이브리드화, 이어서 약 50℃에서, 바람직하게는 약 55℃에서, 바람직하게는 약 60℃에서, 더욱 더 바람직하게는 약 65℃에서 1 X SSC, 0.1% SDS에서 1회 이상의 세척이다.
매우 엄격한 조건은, 예를 들어, 5x SSC/5x 덴하르트 용액 / 1.0% SDS 중에서 약 68℃에서의 하이브리드화 및 실온에서 0.2x SSC/0.1% SDS 중에서의 세척을 포함한다. 대안적으로, 세척은 42℃에서 수행될 수 있다.
통상의 기술자는 엄격하고 매우 엄격한 하이브리드화 조건에 어떤 조건을 적용해야 하는지 알 것이다. 이러한 조건에 관한 추가 지침은 관련 기술분야에서, 예를 들어 문헌 [Sambrook et al., s readily available in the art, for example, in Sambrook et al., 1989, Molecular Cloning, A Laboratory Manual, Cold Spring Harbor Press, N.Y.; and Ausubel et al. (eds.), Sambrook and Russell (2001) "Molecular Cloning: A Laboratory Manual (3rd edition), Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, New York 1995, Current Protocols in Molecular Biology, (John Wiley & Sons, N.Y.)]에서 용이하게 입수가능하다.
물론, 폴리 A 서열 (예컨대 mRNA의 3' 말단 폴리(A) 트랙)에만, 또는 T (또는 U)의 상보적인 스트레치에 하이브리드화하는 폴리뉴클레오티드는, 본 발명의 핵산의 일부에 특이적으로 하이브리드화하기 위해 사용되는 본 발명의 폴리뉴클레오티드에 포함되지 않을 것인데, 그 이유는 이러한 폴리뉴클레오티드는 폴리(A) 스트레치 또는 그의 보체 (예를 들어, 실제로 임의의 이중-가닥 cDNA 클론)를 함유하는 임의의 핵산 분자에 하이브리드화할 것이기 때문이다.
"핵산 구축물 "또는 "핵산 벡터"는 본원에서 재조합 DNA 기술의 사용으로 인한 인공 핵산 분자를 의미하는 것으로 이해된다. 따라서 용어 "핵산 구축물"은 자연 발생적 핵산 분자를 포함하지 않지만, 핵산 구축물은 (일부의) 자연 발생적 핵산 분자를 포함할 수 있다. 용어 "발현 벡터" 또는 "발현 구축물"은 숙주 세포 또는 뉴클레오티드 서열과 접합성인 숙주 유기체에서 유전자의 발현을 수행할 수 있는 이러한 뉴클레오티드 서열을 지칭한다. 이들 발현 벡터는 전형적으로 적어도 적합한 전사 조절 서열 및 임의로, 3' 전사 종결 신호를 포함한다. 발현 인핸서 요소와 같은, 발현을 수행하는데 필요하거나 도움을 주는 추가적인 인자가 또한 존재할 수 있다. 발현 벡터는 적합한 숙주 세포에 도입되고 숙주 세포의 시험관내 세포 배양에서 코딩 서열의 발현을 수행할 수 있을 것이다. 발현 벡터는 본 발명의 숙주 세포 또는 유기체에서의 복제에 적합할 것이다.
본원에 사용된 바와 같이, 용어 "프로모터" 또는 "전사 조절 서열"은 하나 이상의 코딩 서열의 전사를 제어하는 기능을 하며, 코딩 서열의 전사 개시 부위의 전사 방향과 관련하여 상류에 위치하는 핵산 단편을 지칭하며, 전사 인자 결합 부위, 리프레서 및 활성인자 단백질 결합 부위, 및 프로모터로부터의 전사의 양을 조절하기 위해 직접적으로 또는 간접적으로 작용하는 것으로 관련 기술분야의 통상의 기술자에게 공지된 뉴클레오티드의 임의의 다른 서열을 포함하나 이에 제한되지 않는, DNA-의존성 RNA 폴리머라제에 대한 결합 부위, 전사 개시 부위 및 임의의 다른 DNA 서열의 존재에 의해 구조적으로 확인된다. "구성적" 프로모터는 대부분의 생리학적 및 발달 조건하에 대부분의 조직에서 활성인 프로모터이다. "유도성" 프로모터는, 예를 들어 화학적 유도인자의 적용에 의해, 예를 들어 생리학적으로 또는 발달적으로 조절되는 프로모터이다.
용어 "선택 가능한 마커"는 관련 기술분야의 통상의 기술자에게 친숙한 용어이며, 발현시, 선택 가능한 마커를 함유하는 세포 또는 세포들을 선택하기 위해 사용될 수 있는 임의의 유전적 실체를 설명하기 위해 본원에서 사용된다. 용어 "리포터"는 마커와 상호교환적으로 사용될 수 있지만, 이는 녹색 형광 단백질 (GFP)과 같은 가시적인 마커를 지칭하기 위해 주로 사용된다. 선택 가능한 마커는 우성 또는 열성이거나 양방향일 수 있다.
본원에 사용된 바와 같이, 용어 "작동 가능하게 연결된"은 기능적 관계에서 폴리뉴클레오티드 요소의 연결을 지칭한다. 핵산은 그것이 또다른 핵산 서열과 기능적 관계에 놓일 경우 "작동 가능하게 연결"된다. 예를 들어, 전사 조절 서열은 그것이 코딩 서열의 전사에 영향을 미치는 경우 코딩 서열에 작동 가능하게 연결된다. 작동 가능하게 연결된다는 것은 연결되는 DNA 서열이 전형적으로 연속적이며, 두 단백질 코딩 영역을 연결시키는데 필요한 경우 연속적이며 판독 프레임에 있음을 의미한다.
용어 "단백질" 또는 "폴리펩티드"는 상호교환적으로 사용되며 특정 작용 방식, 크기, 3차원 구조 또는 기원을 언급하지 않고, 아미노산의 쇄로 이루어진 분자를 지칭한다.
용어 "유전자"는 적합한 조절 영역 (예를 들어 프로모터)에 작동 가능하게 연결된 세포에서 RNA 분자 (예를 들어, mRNA)로 전사되는 영역 (전사 영역)을 포함하는 DNA 단편을 의미한다. 유전자는 대개 몇몇 작동 가능하게 연결된 단편, 예컨대 프로모터, 5' 리더 서열, 코딩 영역 및 폴리아데닐화 부위를 포함하는 3'-비번역 서열 (3'- 말단)을 포함할 것이다. "유전자의 발현"은 적절한 조절 영역, 특히 프로모터에 작동 가능하게 연결된 DNA 영역이 생물학적으로 활성인, 즉 생물학적으로 활성인 단백질 또는 펩티드로 번역될 수 있는 RNA로 전사되는 과정을 지칭한다. 주어진 (재조합) 핵산 또는 폴리펩티드 분자와 주어진 숙주 유기체 또는 숙주 세포 사이의 관계를 나타내기 위해 사용되는 경우 용어 "상동성"은, 본질적으로 핵산 또는 폴리펩티드 분자는 동일한 종, 바람직하게는 동일한 변종 또는 균주의 숙주 세포 또는 유기체에 의해 생성됨을 의미하는 것으로 이해된다. 숙주 세포에 대해 상동성인 경우, 폴리펩티드를 코딩하는 핵산 서열은 그의 자연 환경에서보다 전형적으로 (반드시 그런 것은 아니라) 또 다른 (이종) 프로모터 서열, 및 적용 가능한 경우, 또 다른 (이종) 분비 신호 서열 및/또는 종결자 서열에 작동 가능하게 연결될 것이다. 조절 서열, 신호 서열, 종결자 서열 등은 숙주 세포와 또한 상동성일 수 있는 것으로 이해된다. 이 맥락에서, 오직 "상동성" 서열 요소의 사용은 "자기-복제된" 유전자 변형 유기체 (GMO)의 구축을 허용한다 (자기-복제는 본원에서 유럽 지침(European Directive) 98/81/EC 부록 II에서와 같이 정의됨). 2개의 핵산 서열의 관련성을 나타내기 위해 사용되는 경우, 용어 "상동성"은 하나의 단일-가닥 핵산 서열이 상보적인 단일-가닥 핵산 서열에 하이브리드화될 수 있음을 의미한다. 하이브리드화의 정도는 나중에 논의되는 바와 같이, 서열 사이의 동일성의 양 및 하이브리드화 조건, 예컨대 온도 및 염 농도를 포함한 다수의 인자에 의존할 수 있다.
핵산 (DNA 또는 RNA) 또는 단백질과 관련하여 사용되는 경우 용어 "이종" 및 "외인성"은 그것이 존재하는 유기체, 세포, 게놈 또는 DNA 또는 RNA 서열의 일부로서 자연적으로 발생하지 않는 핵산 또는 단백질, 또는 그것이 자연에서 발견되는 것과는 상이한 게놈 또는 DNA 또는 RNA 서열의 위치 또는 위치들 또는 세포에서 발견되는 핵산 또는 단백질을 지칭한다. 이종 및 외인성 핵산 또는 단백질은 그것이 도입되는 세포에 대해 내인성이지 않으나, 또 다른 세포로부터 수득되거나 합성적으로 또는 재조합적으로 생산된다. 일반적으로, 반드시 그런 것은 아니지만, 이러한 핵산은 DNA가 전사되거나 발현되는 세포에 의해 정상적으로 생성되지 않는 단백질, 즉 외인성 단백질을 코딩한다. 유사하게 외인성 RNA는 외인성 RNA가 존재하는 세포에서 정상적으로 발현되지 않는 단백질을 코딩한다. 이종/외인성 핵산 및 단백질은 또한 외래 핵산 또는 단백질로 지칭될 수 있다. 관련 기술분야의 통상의 기술자가 그것이 발현되는 세포에 외래물질로서 인식할 임의의 핵산 또는 단백질은 본원에서 용어 이종 또는 외인성 핵산 또는 단백질에 의해 포함한다. 용어 이종 및 외인성은 또한 핵산 또는 아미노산 서열의 비천연 조합, 즉 조합된 서열 중 적어도 2개가 서로에 대해 외래인 조합에 적용된다.
효소의 "특이적 활성"은 대개 총 숙주 세포 단백질 mg당 효소 활성의 단위로 표현되는, 본원에서 총 숙주 세포 단백질의 양당 특정 효소의 활성의 양을 의미하는 것으로 이해된다. 본 발명의 맥락에서, 특정 효소의 특이적 활성은 (그렇지 않으면 동일한) 야생형 숙주 세포에서 그 효소의 특이적 활성과 비교하여 증가 또는 감소될 수 있다.
"푸란계 화합물"은 본원에서 2,5-푸란-디카르복실산 (FDCA)뿐만 아니라 FDCA로 산화될 수 있는 푸란 기를 갖는 임의의 화합물로 이해되며, 후자는 본원에서 "FDCA의 전구체" 또는 "FDCA의 푸란계 전구체"로서 지칭된다. FDCA의 전구체는 적어도 다음을 포함한다: 5-히드록시메틸푸르푸랄 (HMF), 2,5-디히드록시메틸 푸란 (DHF) 또는 2,5-비스(히드록시메틸)푸란 (BHF) (HMF-OH로서 지칭됨), 5-히드록시메틸-2-푸란카르복실산 또는 5-히드록시메틸-2-푸로산 (HMFCA), 5-포르밀-2-푸로산 (FFCA), 및 2,5-디포르밀 푸란 (DFF). "푸란 화합물"에서, 푸란 고리 또는 임의의 또는 그의 치환 가능한 측기는, 예를 들어 임의의 이용 가능한 위치 상의 푸란 고리에서, 시클릭 기를 포함한, OH, C1-C10 알킬, 알킬, 알릴, 아릴 또는 RO- 에테르 모이어티로 치환될 수 있는 것으로 추가로 이해된다.
"호기성 조건" "호기 조건(Oxic condition)" 또는 호기성 또는 호기 발효 공정은 본원에서 산소의 존재하에 시행되고 바람직하게는 적어도 0.5, 1, 2, 5, 10, 20 또는 50 mmol/L/h의 속도로 산소가 소비되고, 유기 분자가 전자 공여체로서 작용하고 산소가 전자 수용체로서 작용하는 조건 또는 발효 공정으로서 정의된다.
"혐기성 또는 무산소 조건" 또는 "혐기성 또는 무산소 발효 공정"은 본원에서 실질적으로 산소의 부재하에 시행되고, 유기 분자가 전자 공여체 및 전자 수용체 둘 다로서 작용하는 조건 또는 발효 공정으로서 정의된다. 무산소 조건하에, 실질적으로 어떤 산소도 소비되지 않으며, 바람직하게는 5, 2, 1, 또는 0.5 mmol/L/h 미만, 더 바람직하게는 0 mmol/L/h가 소비되거나 (즉, 산소 소비가 검출되지 않음), 또는 실질적으로 어떤 용존 산소도 발효 배지에서 검출될 수 없고, 바람직하게는 배지에서의 용존 산소 농도는 공기 포화도의 2, 1, 0.5, 0.2, 0.1% 미만, 즉 상업적 산소 프로브의 검출 한계 미만이다.
본원에서 공개 서열 데이터베이스에서 접근 가능한 뉴클레오티드 또는 아미노산 서열에 대한 임의의 언급은 본 문서의 출원일에 이용 가능한 서열 항목(entry)의 버전을 지칭한다.
실시양태의 설명
모 숙주 세포
본 발명은 숙주 세포가 적합한 푸란계 전구체로부터 2,5-푸란디카르복실산 (FDCA)을 생성할 수 있도록 숙주 세포의 유전자 변형에 관한 것이다. 이를 위해 본 발명에 따라 다수의 유전자 변형이 모 숙주 세포에 도입될 수 있다. 이들 변형은 다수의 이종 유전자의 발현의 도입, 뿐만 아니라, 일부 내인성 유전자의 감소 또는 제거에 의해 및/또는 다른 내인성 유전자의 발현, 즉 과발현의 증가에 의해, 모 숙주 세포에 이미 존재하는 다수의 내인성 유전자의 발현의 변형을 포함한다. 이들 유전자 변형은 이하에 추가로 설명된다. 따라서, 모 숙주 세포는 본 발명에 따른 유전자 변형 중 어느 하나가 숙주 세포에 도입되기 전에 숙주 세포인 것으로 이해된다.
본 발명의 모 숙주 세포는 바람직하게는 푸란계 화합물을 대사하는 능력을 자연적으로 갖는 숙주 세포이다. 더 바람직하게는 모 숙주 세포는 적어도 FDCA를 분해하는 자연적인 능력을 갖는다. 본 발명의 모 숙주 세포는 HMF를 FDCA로 산화시키는 자연 능력을 추가로 가질 수 있다. 주어진 숙주 세포 균주가 HMF를 FDCA로 산화시키는 능력 및/또는 FDCA를 분해하는 능력을 자연적으로 갖는지의 여부는 예를 들어 본원의 실시예에 기재된 바와 같이, 바람직하게는 단독 탄소원으로서 HMF, HMF-알콜, HMFCA 및 FDCA 중 하나 이상을 희생하여 성장하는 균주의 능력을 결정함으로써 시험될 수 있다. 바람직하게는, 모 숙주 세포는 FDCA의 분해를 촉매하는 효소를 코딩하는 내인성 유전자를 포함한다. 바람직하게는 내인성 유전자는 FDCA의 분해를 촉매하는 효소를 발현하는 기능성 유전자이다. 바람직하게는, FDCA의 분해를 촉매하는 효소는 본원에 추가로 정의된 바와 같은 FDCA-탈카르복실화 모노옥시게나제이다.
본 발명의 모 숙주 세포는 예를 들어 진핵 세포, 예컨대 포유동물, 곤충, 식물, 진균, 또는 조류 세포를 포함한, 임의의 적합한 숙주 세포일 수 있다. 그러나, 바람직하게는, 숙주 세포는 미생물 세포이다. 미생물 숙주 세포는 원핵 세포, 바람직하게는 예를 들어 그람-음성 및 그람-양성 미생물 둘 다를 포함한, 박테리아 세포일 수 있다.
그러나, 더 바람직하게는, 본 발명의 모 숙주 세포는 진핵 미생물 숙주 세포, 예컨대 예를 들어 진균 숙주 세포이다. 본 발명에 따라 변형될 가장 바람직한 모 숙주 세포는 효모 또는 사상균 숙주 세포이다.
"진균"은 본원에서 진핵 미생물로서 정의되며, 아문 에우미코티나(subdivision Eumycotina)의 모든 종을 포함한다 (Alexopoulos, C. J., 1962, In: Introductory Mycology, John Wiley & Sons, Inc., New York)를 포함한다. 용어 "진균류" 및 "진균의"는 사상균 및 효모 둘 다를 포함하거나 지칭한다.
"사상균"은 본원에서 아문 에우미코티나 및 오오미코타(Oomycota)의 모든 사상균을 포함하는 진핵 미생물로 정의된다 (["Dictionary of The Fungi", 10th edition, 2008, CABI, UK, www.cabi.org]에 정의된 바와 같이). 사상균은 키틴, 셀룰로스, 글루칸, 키토산, 만난, 및 기타 복합 다당류로 구성된 균사 벽을 특징으로 한다. 식물 성장은 균사 신장에 의한 것이고 탄소 이화작용은 반드시 호기성이다. 사상균 균주는 아크레모니움, 아스페르길루스, 아우레오바시디움, 크립토코쿠스, 필리바시디움, 푸사리움, 후미콜라, 마그나포르테, 무코르, 미셀리오프토라, 네오칼리마스틱스, 뉴로스포라, 파에실로미세스, 페니실리움, 피로미세스, 스키조필룸, 탈라로미세스, 써모아스쿠스, 티엘라비아, 톨리포클라디움, 트리코더마, 및 우스틸라고의 균주를 포함하나, 이에 제한되지는 않는다.
본 발명의 모 숙주 세포로서 바람직한 사상균 종은 아스페르길루스, 미셀리오프토라, 페니실리움, 탈라로미세스 또는 트리코더마 속의 종, 그리고 더 바람직하게는 아스페르길루스 니게르, 아스페르길루스 아와모리, 아스페르길루스 포에티두스, 아스페르길루스 소자에, 아스페르길루스 푸미가투스, 탈라로미세스 에메르소니이, 아스페르길루스 오리자에, 미셀리오프토라 테르모필라, 트리코더마 레에세이, 페니실리움 크리소게눔, 페니실리움 심플리시시뭄 및 페니실리움 브라실리아눔으로부터 선택된 종에 속한다. 이들 사상균 종의 적합한 균주는 통상의 기술자에게 자체 공지된 기탁 기관으로부터 입수 가능하다.
"효모"는 본원에서 진핵 미생물로서 정의되며, 단세포 형태로 우세하게 성장하는 아문 에우미코티나의 모든 종을 포함한다 (Yeasts: characteristics and identification, J.A. Barnett, R.W. Payne, D. Yarrow, 2000, 3rd ed., Cambridge University Press, Cambridge UK; 및, The yeasts, a taxonomic study, CP. Kurtzman and J.W. Fell (eds) 1998, 4th ed., Elsevier Science Publ. B.V., Amsterdam, The Netherlands). 효모는 단세포 엽상체의 출아에 의해 성장할 수 있거나 유기체의 분열에 의해 성장할 수 있다. 본 발명에 사용하기에 바람직한 효모 세포는 속 사카로미세스, 클루이베로미세스, 칸디다, 피치아, 스키조사카로미세스, 한세눌라, 클로에케라, 쉬완니오미세스, 야로위아, 크립토코쿠스, 데바로미세스, 사카로미세콥시스, 사카로미코데스, 위케르하미아, 데바요미세스, 한세니아스포라, 오가타에아, 쿠라이쉬아, 코마가타엘라, 메트쉬니코위아, 윌리옵시스, 나카자와에아, 토룰라스포라, 불레라, 로도토룰라, 및 스포로볼로미세스에 속한다. 모 효모 숙주 세포는 자연적으로 혐기성 발효, 더 바람직하게는 알콜 발효, 가장 바람직하게는 혐기성 알콜 발효가 가능한 세포일 수 있다. 더 바람직하게는 클루이베로미세스 락티스, 에스. 세레비시아에, 한세눌라 폴리모르파 (신규 명칭: 오가타에아 헨리시이(Ogataea henricii)), 야로위아 리폴리티카, 칸디다 트로피칼리스 및 피치아 파스토리스 (신규 명칭: 코마가타엘라 파스토리스(Komagataella pastoris))와 같은 종으로부터의 효모.
특히, 박테리아와 비교시, 진균은, 예를 들어, 산, 에탄올 및 기타 유해한 화합물에 대한 그의 높은 내성, 그의 높은 삼투-내성, 그의 높은 발효 용량 및 일부 효모의 경우 그의 혐기성 성장 능력을 포함한, 산업 발효 공정에 대한 많은 매력적인 특징을 갖는다.
숙주 세포는 추가로 바람직하게는 낮은 pH에 대한 높은 내성을 가지며, 즉 5.0, 4.0, 3.5, 3.2, 3.0, 2.9, 2.8, 2.7, 2.6, 2.5, 2.4, 2.3 또는 2.28 이하의 pH에서 성장할 수 있으며 및 락트산, 아세트산 또는 포름산 및 푸란산과 같은 유기산에 대해 높은 내성을 갖고 승온에 대해 높은 내성을 갖는다. 숙주 세포의 이들 특징 또는 활성 중 어느 것도 숙주 세포에 자연적으로 존재할 수 있거나 유전자 변형, 바람직하게는 자기 복제에 의해 또는 하기 기재된 본 발명의 방법에 의해 도입되거나 변형될 수 있다.
적합한 세포는 배양된 세포, 발효 과정에서 예를 들어 침지된 또는 고상 발효에서 배양될 수 있는 세포이다.
본 발명에 따른 진균 숙주 세포에서 제조된 화합물의 구체적 용도를 위해, 이러한 용도에 따라 숙주 세포를 선택할 수 있다. 예를 들어 본 발명에 따른 숙주 세포에서 제조된 화합물이 식품 적용에서 사용될 경우, 숙주 세포는 식품-등급 유기체 예컨대 예를 들어 사카로미세스 종, 예를 들어 에스. 세레비시아에, 식품-등급 페니실리움 종 또는 야로위아 리폴리티카로부터 선택될 수 있다. 구체적 용도는 식품, (동물) 사료, 제약, 농업, 예컨대 농작물-보호, 및/또는 개인 관리 적용을 포함하나, 이에 제한되지는 않는다.
유전자 변형 세포
제1 측면에서, 본 발명은 세포, 바람직하게는 유전자 변형을 포함하는 진균 세포에 관한 것이다. 세포의 유전자 변형은 바람직하게는 유전자 변형이 결핍된 상응하는 야생형 세포와 비교하여, 2,5-푸란디카르복실산 (FDCA)의 분해를 촉매하는 효소의 특이적 활성을 감소시키거나 제거하는 적어도 유전자 변형이다.
본 발명의 세포는, a) 유전자 변형이 결핍된 상응하는 야생형 세포와 비교하여, 세포에 5-히드록시메틸-2-푸란카르복실산 (HMFCA)을 5-포르밀-2-푸로산 (FFCA)으로 산화시키는 능력을 부여하거나 세포에서 HMFCA를 FFCA로 산화시키는 효소의 특이적 활성을 증가시키는 유전자 변형; 및/또는, b) 유전자 변형이 결핍된 상응하는 야생형 세포와 비교하여, 세포에 푸란계 알데히드를 상응하는 푸란계 카르복실산으로 산화시키는 능력을 부여하거나 세포에서 푸란계 알데히드를 상응하는 푸란계 카르복실산으로 산화시키는 효소의 특이적 활성을 증가시키는 유전자 변형 중 적어도 하나를 추가로 바람직하게 포함한다.
이들 유전자 변형을 갖는 바람직한 세포는 하기에 본원에 추가로 특정된다.
특이적 2,5-푸란디카르복실산 (FDCA) 탈카르복실화 모노옥시게나제 활성의 감소 또는 제거
본 발명의 세포는 바람직하게는 FDCA를 분해하는 능력이 결핍된 세포이다. 본 발명의 세포는 대개 FDCA를 분해하는 능력을 자연적으로 갖는 진균 종의 유전자 변형된 세포일 것이며, 이 세포는 FDCA를 분해하는 그의 자연적인 능력을 감소시키거나 제거하도록 유전자 변형되었다. 주어진 진균 균주가 FDCA를 분해하는 능력을 자연적으로 갖는지의 여부는 예를 들어 본원의 실시예에 기재된 바와 같이, 단독 탄소원으로서 HMF, HMF-알콜, HMFCA 및 FDCA 중 하나 이상을 희생하여 성장하는 균주 능력을 결정함으로써 시험될 수 있다. FDCA를 분해하는 능력을 자연적으로 갖는 진균 종의 예는 본원의 실시예에 나타낸 바와 같은 페니실리움 브라실리아눔 또는 아스페르길루스 니게르이다 (Rumbold et al., 2010, Bioengineered Bugs 1:5, 359-366). 대조적으로, 사카로미세스 및 야로위아 종과 같은 효모는 FDCA를 분해하는 능력이 자연적으로 결핍된 진균 종의 예이다.
따라서, 본 발명의 한 실시양태에서, 세포는 FDCA를 분해하는 세포의 자연 능력을 감소시키거나 제거하도록 유전자 변형된다. FDCA를 분해하는 세포의 능력을 감소시키거나 제거하기 위해 변형될 유전자는 바람직하게는 FDCA 탈카르복실화 모노옥시게나제를 코딩하는 유전자이다.
본 발명의 세포에서 특이적 FDCA 탈카르복실화 모노옥시게나제 활성을 감소시키거나 제거하기 위해 변형될 FDCA 탈카르복실화 모노옥시게나제를 코딩하는 유전자는, 바람직하게는 서열번호: 4 (hmfK1) 중 적어도 하나에 대해 적어도 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 95, 96, 97, 98, 99 또는 100% 서열 동일성을 가진 아미노산 서열을 코딩하는 유전자이다. 세포에서 특이적 FDCA 탈카르복실화 모노옥시게나제 활성을 감소시키거나 제거하기 위해 변형될 적합한 hmfK1 병렬상동체는 예를 들어 XP 001397353.2 (서열번호: 26)를 가진 아스페르길루스 니게르 hmfK1 병렬상동체이다. 본 발명의 세포에서, 특이적 FDCA 탈카르복실화 모노옥시게나제 활성은 활성의 감소를 야기하는 유전자 변형을 제외하고는 유전적으로 동일한 균주의 세포와 비교하여 바람직하게는 적어도 1.05, 1.1, 1.2, 1.5, 2.0, 5.0, 10, 20, 50 또는 100배 만큼 감소된다.
페니실리움 브라실리아눔 hmfK1의 병렬상동체가 FDCA 탈카르복실화 모노옥시게나제 활성을 갖는 폴리펩티드를 코딩하는지의 여부는 FDCA를 분해할 수 없는 적합한 숙주 세포에서 폴리펩티드의 발현에 의해 그리고 폴리펩티드의 발현이 세포에 FDCA를 분해하는 능력을 부여하는지의 여부를 검출하는 것에 의해 검정할 수 있다. FDCA 탈카르복실화 모노옥시게나제 활성은, 예를 들어 PCT/EP2016/072406의 실시예에 기재된 바와 같이, 예를 들어 FDCA 탈카르복실화 모노옥시게나제에 대해 검정될 폴리펩티드를 코딩하는 뉴클레오티드 서열이 피. 푸티다 숙주 세포에서 발현되는 발현 구축물을 사용하고 형질전환체를 FDCA를 분해하는 그의 능력에 대해 시험함으로써 검정할 수 있다. 대안적으로, hmfK1 병렬상동체는 단독 탄소 공급원으로서 FDCA 상에서 성장하는 돌연변이체 능력을 회복시키는 그의 능력에 대해 시험함으로써 본원의 실시예에 기재된 바와 같이 페니실리움 브라실리아눔 hmfK1 - 파괴 돌연변이체를 보완하는 그의 능력에 대해 검정될 수 있다.
그의 특이적 활성이 본 발명의 세포에서 바람직하게는 감소 또는 제거되는, FDCA 탈카르복실화 모노옥시게나제를 코딩하는 본 발명의 뉴클레오티드 서열은, 그 자체가 관련 기술분야에 널리 공지된 뉴클레오티드 서열의 단리 방법을 사용하여, 진균, 효모 또는 박테리아, 예를 들어 상기 기재된 공급원 유기체와 동일한 문, 강 또는 속에 속하는 것의 게놈 및/또는 cDNA로부터 수득가능하고 동정될 수 있다 (예를 들어 문헌 [Sambrook and Russell (2001) "Molecular Cloning: A Laboratory Manual (3rd edition), Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, New York)] 참조). 본 발명의 뉴클레오티드 서열은 예를 들어 a) 축퇴성 PCR 프라이머 (보존된 아미노산 서열을 기초로 설계됨)를 적합한 유기체의 게놈 및/또는 cDNA 상에서 사용하여 그의 특이적 활성이 바람직하게는 본 발명의 세포에서 감소되거나 제거되는 효소를 코딩하는 뉴클레오티드 서열의 일부를 포함하는 PCR 단편을 생성시키고; b) a)에서 수득된 PCR 단편을 프로브로서 사용하여 유기체의 cDNA 및/또는 게놈 라이브러리를 스크리닝하고; c) 그의 특이적 활성이 바람직하게는 본 발명의 세포에서 감소되거나 제거되는 효소를 코딩하는 뉴클레오티드 서열을 포함하는 cDNA 또는 게놈 DNA를 생성시키는 방법으로 수득가능하다. 이러한 보존된 서열은 표 4에 제시된 서열 정렬에서 확인될 수 있으며, 여기서 불변 위치는 "*"로 표시되고 강하게 보존된 위치는 ":"로 표시된다. 또한, 본 발명의 적합한 숙주 세포는 표 4로부터 유래될 수 있으며, 여기서 숙주는 바람직하게는 표 4에서 확인된 병렬상동체의 공급원 유기체와 동일한 문, 강, 목, 과 또는 속에 속하는 비병원성 진균 또는 효모이다. 표 4는 공개 데이터베이스에서 이용 가능한 바와 같이, 페니실리움 브라실리아눔 hmfK1과 그의 10개의 가장 가까운 병렬상동체의 아미노산 서열 정렬을 제시한다. 표 4A는 피. 브라실리아눔(P. brasilianum) 서열과 그의 병렬상동체 간의 백분율 아미노산 동일성, 뿐만 아니라 병렬상동체의 수탁 번호를 제공한다.
따라서 바람직한 실시양태에서, 본 발명은 유전자 변형이 결핍된 상응하는 모 세포와 비교하여, 세포에서 특이적 FDCA 탈카르복실화 모노옥시게나제 활성을 감소시키는 유전자 변형을 포함하는 진균 세포로서, 여기서 유전자 변형이 세포의 게놈으로부터 유전자의 코딩 서열 및 프로모터 중 적어도 하나의 적어도 일부의 결실에 의해 FDCA 탈카르복실화 모노옥시게나제를 코딩하는 내인성 유전자의 발현을 제거하는 것인 진균 세포에 관한 것이다. 바람직하게는 FDCA 탈카르복실화 모노옥시게나제 유전자의 코딩 서열의 적어도 일부는 세포의 게놈으로부터 결실되며, 예를 들어 코딩 서열의 적어도 10, 20, 30, 40, 50, 60, 70, 80, 90 또는 100%가 결실된다. 코딩 서열의 적어도 일부의 결실은 바람직하게는 번역 개시 코돈을 제거하는 결실 및/또는 프레임시프트를 야기하는 결실이다. 가장 바람직하게는 그러나 FDCA 탈카르복실화 모노옥시게나제를 코딩하는 내인성 유전자의 적어도 완전한 코딩 서열이 결실된다.
본 발명의 유전자 변형 진균 세포에서, FDCA 탈카르복실화 모노옥시게나제를 코딩하는 내인성 유전자의 모든 카피의 발현이 제거되는 것이 추가로 바람직하다. 따라서, 유전자 변형이 결핍된 상응하는 모 세포가 FDCA 탈카르복실화 모노옥시게나제를 코딩하는 유전자의 하나 초과의 내인성 카피를 포함하는 경우, 예를 들어 이배성 이수성 또는 다배수성 및/또는 유전자 증폭의 결과로서, 바람직하게는 FDCA 탈카르복실화 모노옥시게나제를 코딩하는 유전자의 각각 및 모든 카피의 발현이 제거된다.
진균 게놈으로부터 서열의 결실을 초래하는 방법 및 수단은 하기에 본원에 기재되어 있다.
본 발명의 유전자 변형 진균 세포는 HMF에 의해 유도되는 것으로 밝혀진 또 다른 히드록실라제, 즉 피. 브라실리아눔 hmfK3 코딩된 히드록실라제 또는 그의 병렬상동체의 특이적 활성을 감소시키거나 제거하는 유전자 변형을 추가로 포함할 수 있다. 비록 본원의 실시예에서 사용된 조건하에 피. 브라실리아눔에서 hmfK3-코딩된 히드록실라제의 파괴는 진균이 FDCA를 분해하는 능력에 영향을 미치지 않았긴 하였지만, 이는 다른 진균 및/또는 상이한 조건에서 상이할 수 있다. 이러한 상황에서, 본 발명의 진균 세포는 서열번호: 23 (hmfK3) 중 적어도 하나에 대해 적어도 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 95, 96, 97, 98, 99 또는 100% 서열 동일성을 가진 아미노산 서열을 포함하는 히드록실라제의 특이적 활성을 감소시키거나 제거하는 유전자 변형을 포함하는 것이 유용할 수 있다. 본 발명의 세포에서, 특이적 hmfK3-코딩된 히드록실라제 활성은 활성의 감소를 야기하는 유전자 변형을 제외하고는 유전적으로 동일한 균주의 세포와 비교하여 바람직하게는 적어도 1.05, 1.1, 1.2, 1.5, 2.0, 5.0, 10, 20, 50 또는 100배 만큼 감소된다.
그러나, 본원의 실시예는 hmfK1-코딩된 FDCA 탈카르복실화 모노옥시게나제의 파괴가 FDCA를 분해하는 세포의 능력을 제거하기에 충분하다는 것을 나타낸다. 따라서, 무손상 및/또는 기능적 내인성 hmfK3 유전자 또는 그의 병렬상동체를 포함하는 유전자 변형 진균 세포가 본 발명에 명백히 포함된다.
HMFCA 데히드로게나제 활성의 도입 또는 증가
본 발명의 세포는 바람직하게는 5-히드록시메틸-2-푸란카르복실산 (HMFCA)을 5-포르밀푸로산 (FFCA)으로 산화시키는 능력을 갖는 세포이다. HMFCA를 FFCA로 산화시키는 세포의 능력은, 예컨대 예를 들어 페니실리움 브라실리아눔에서, 세포의 내인성 활성일 수 있거나, 이는 예컨대 예를 들어 아스페르길루스 니게의 경우에, 세포에 부여되는 외인성 활성일 수 있다. 바람직하게는, HMFCA를 FFCA로 산화시키는 능력은 세포의 유전자 변형, 예를 들어 HMFCA를 FFCA로 산화시키는 능력을 갖는 데히드로게나제 또는 옥시다제를 코딩하는 뉴클레오티드 서열을 포함하는 핵산 구축물로 세포의 형질전환에 의해 세포에 부여되거나 세포에서 증가된다. 데히드로게나제는 바람직하게는 알콜 데히드로게나제 (즉, EC 1.1 활성을 가짐)이다. 따라서, 세포는 바람직하게는 HMFCA를 FFCA로 산화시키는 능력을 갖는 데히드로게나제 또는 옥시다제를 코딩하는 뉴클레오티드 서열의 발현을 위한 발현 구축물을 포함하는 세포이다. 본 발명의 바람직한 세포에서, 발현 구축물은 세포에서 발현될 수 있고, 데히드로게나제 또는 옥시다제의 발현은 발현 구축물이 결핍된 상응하는 세포, 예를 들어 야생형 세포와 비교하여, 바람직하게는 세포에서 HMFCA를 FFCA로 산화시키는 능력을 부여하거나 세포에서 HMFCA를 FFCA로 산화시키는 효소의 특이적 활성을 증가시킨다. HMFCA를 FFCA로 산화시키는 효소의 특이적 활성은 발현이 결핍된 상응하는 세포와 비교하여, 바람직하게는 세포에서 적어도 1.05, 1.1, 1.2, 1.5, 2.0, 5.0, 10, 20, 50 또는 100배만큼 증가된다.
HMFCA를 FFCA로 산화시키는 능력을 갖는 효소는 바람직하게는 알콜 데히드로게나제이다. HMFCA를 FFCA로 산화시키는 능력을 갖는 바람직한 효소는 HMFCA 데히드로게나제 활성을 갖는 알콜 데히드로게나제이다. 폴리펩티드가 HMFCA 데히드로게나제 활성을 갖는지의 여부는 HMFCA를 FFCA로 산화시킬 수 없는 적합한 숙주 세포에서 폴리펩티드의 발현에 의해 그리고 폴리펩티드의 발현이 세포에 HMFCA를 FFCA로 산화시키는 능력을 부여하는지의 여부를 검출하는 것에 의해 검정할 수 있다. HMFCA 데히드로게나제 활성은 예를 들어 HMFCA 데히드로게나제 활성에 대해 검정될 폴리펩티드를 코딩하는 뉴클레오티드 서열이 pBT'hmfH-adh에서 씨. 바실렌시스 hmfH 유전자를 대체하고 (WO2012/064195에 기재됨), 그 후 HMFCA 데히드로게나제 활성에 대해 검정될 폴리펩티드의 코딩 서열을 포함하는 플라스미드는 pJNNhmfT1(t)를 함유하는 피. 푸티다 KT2440Δgcd에 도입되는 (WO2012/064195에 또한 기재됨) 발현 구축물을 사용하여 검정될 수 있다. HMFCA 데히드로게나제 활성에 대해 검정될 폴리펩티드를 발현하는 피. 푸티다 형질전환체를 HMF와 함께 인큐베이션하고 샘플을 FDCA의 분석을 위해 규칙적인 간격으로 채취한다. HMFCA 데히드로게나제 활성에 대해 검정될 폴리펩티드가 결핍된 상응하는 피. 푸티다 형질전환체 (및 씨. 바실렌시스 hmfH 유전자)와 비교하여, FDCA의 생성 증가는 폴리펩티드가 HMFCA 데히드로게나제 활성을 가짐을 나타내는 것으로 여겨진다. 대안적으로, HMFCA 데히드로게나제 활성에 대해 검정될 폴리펩티드를 코딩하는 뉴클레오티드 서열은, 예를 들어 PCT/EP2016/072406의 실시예에 기재된 바와 같이 진균 숙주 세포, 바람직하게는 에스. 세레비시아에 숙주 세포에서 발현될 수 있으며, 폴리펩티드의 발현이 진균 숙주 세포에 HMF로부터 FFCA 및/또는 FDCA를 둘 다 생성하는 능력을 부여하는지의 여부를 검출할 수 있다.
본 발명의 세포에서 발현되는 HMFCA 데히드로게나제는 바람직하게는 아데닌 디뉴클레오티드, 예컨대 NADH 또는 NADPH, 플라빈 아데닌 디뉴클레오티드 (FAD), 플라빈 모노뉴클레오티드 (FMN), 및 피롤로퀴놀린 퀴놀론 (PQQ)으로부터 선택된 보조인자에 의존하는 데히드로게나제이다. 본 발명의 세포에서 발현되는 HMFCA 데히드로게나제는 바람직하게는 2가 양이온에 결합하고, 더 바람직하게는 HMFCA 데히드로게나제는 Zn-결합 데히드로게나제이다.
본 발명의 세포에서 발현되는 HMFCA 데히드로게나제는 추가로 바람직하게는 알콜 데히드로게나제이며, 이는 (또한) 다른 푸란계 알콜, 바람직하게는 2-위치에서 히드록시 기를 가진 푸란계 알콜을 상응하는 알데히드로 산화시키는 능력을 갖는다. 따라서, HMFCA 데히드로게나제는 바람직하게는 5-히드록시메틸푸르푸랄 (HMF)을 2,5-디포르밀 푸란 (DFF)으로 산화시키는 능력을 갖는다.
한 실시양태에서 HMFCA를 FFCA로 산화시키는 능력을 갖는 데히드로게나제를 코딩하는 뉴클레오티드 서열은 다음으로 이루어진 군으로부터 선택된다:
(a)
HMFCA 데히드로게나제 활성을 가진 폴리펩티드를 코딩하는 뉴클레오티드 서열이며, 이 폴리펩티드가 서열번호: 1 및 2 (각각 hmfL1 및 hmfL2) 중 적어도 하나, 더 바람직하게는 서열번호: 1의 아미노산 서열과 적어도 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 95, 96, 97, 98, 99 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인, 뉴클레오티드 서열;
(b) 그의 상보성 가닥이 (a)의 뉴클레오티드 서열에 하이브리드화하는 뉴클레오티드 서열; 및,
(c) 그의 서열이 유전자 코드의 축퇴로 인해 (b)의 뉴클레오티드 서열의 서열과 상이한 뉴클레오티드 서열.
따라서 본 발명의 바람직한 뉴클레오티드 서열은 아스페르길루스, 비소클라미스(Byssochlamys), 코시디오이데스(Coccidioides), 카에토미움(Chaetomium), 에우티파(Eutypa), 엔도카르폰(Endocarpon), 푸사리움, 마이크로스포룸(Microsporum), 네오사르토리아(Neosartorya), 페니실리움, 스포로트릭스(Sporothrix) 및 트리코피톤(Trichophyton)으로 이루어진 군으로부터 선택된 속의 진균, 더 바람직하게는, 코시디오이데스 이미티스(Coccidioides immitis), 코시디오이데스 포사다시이(Coccidioides posadasii), 엔도카르폰 푸실룸(Endocarpon pusillum), 마이크로스포룸 깁세움(Microsporum gypseum), 페니실리움 브라실리아눔 및 스포로트릭스 쉔스키이(Sporothrix schenckii)로 이루어진 군으로부터 선택된 종의 진균, 가장 바람직하게는 균주 피. 브라실리아눔 C1 또는 MG11인 진균으로부터 수득가능한 (또는 상기 진균에서 자연적으로 발생하는) HMFCA 데히드로게나제의 것과 동일한 아미노산 서열을 가진 HMFCA 데히드로게나제를 코딩한다.
한 실시양태에서 뉴클레오티드 서열은 그것이 자연에서 발생하는 바와 같이, 예를 들어 그것이 야생형 공급원 유기체로부터 단리될 수 있는 바와 같이, HMFCA 데히드로게나제 활성을 가진 폴리펩티드를 코딩한다. 대안적으로, 뉴클레오티드 서열은 상기 정의되고 상응하는 자연적으로 발생하는 HMFCA 데히드로게나제와 비교하여 하나 이상의 아미노산 치환, 삽입 및/또는 결실을 포함하나 본원에 정의된 동일성 또는 유사성의 범위 내에 있는 HMFCA 데히드로게나제 중 어느 하나의 조작된 형태를 코딩할 수 있다. 따라서, 한 실시양태에서 본 발명의 뉴클레오티드 서열은 그의 아미노산 서열이 불변 위치 (표 1 및 2에 "*"로 표시됨) 각각에, 불변 위치에 존재하는 아미노산을 적어도 포함하는 HMFCA 데히드로게나제를 코딩한다. 바람직하게는, 아미노산 서열은 강하게 보존된 위치 (표 1 및 2에 ":"로 표시됨)에 강하게 보존된 위치에 존재하는 아미노산 중 하나를 또한 포함한다. 더 바람직하게는, 아미노산 서열은 덜 강하게 보존된 위치 (표 1 및 2에 "."로 표시됨)에 덜 강하게 보존된 위치에 존재하는 아미노산 중 하나를 추가로 또한 포함한다. 이들 불변 및 보존된 위치 외부의 아미노산 치환은 HMFCA 데히드로게나제 활성에 영향을 줄 가능성이 덜 낮다. 표 1 및 2는 공개 데이터베이스에서 이용 가능한 바와 같이, 페니실리움 브라실리아눔 각각 hmfL1 및 hmfL2와, 그의 10개의 가장 가까운 병렬상동체 각각의 아미노산 서열 정렬을 제시한다. 표 1A 및 2A는 피. 브라실리아눔 서열과 그의 병렬상동체 간의 백분율 아미노산 동일성, 뿐만 아니라 병렬상동체의 수탁 번호를 제공한다.
HMFCA 데히드로게나제 활성을 가진 폴리펩티드를 코딩하는 본 발명의 뉴클레오티드 서열은, 그 자체가 관련 기술분야에 널리 공지된 뉴클레오티드 서열의 단리 방법을 사용하여, 진균, 효모 또는 박테리아, 예를 들어 상기 기재된 공급원 유기체와 동일한 문, 강 또는 속에 속하는 것의 게놈 및/또는 cDNA로부터 수득가능하다 (예를 들어 문헌 [Sambrook and Russell (2001) "Molecular Cloning: A Laboratory Manual (3rd edition), Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, New York] 참조). 본 발명의 뉴클레오티드 서열은 예를 들어 a) 축퇴성 PCR 프라이머 (보존된 아미노산 서열을 기초로 설계됨)를 적합한 유기체의 게놈 및/또는 cDNA 상에서 사용하여 HMFCA 데히드로게나제 활성을 가진 폴리펩티드를 코딩하는 뉴클레오티드 서열의 일부를 포함하는 PCR 단편을 생성시키고; b) a)에서 수득된 PCR 단편을 프로브로서 사용하여 유기체의 cDNA 및/또는 게놈 라이브러리를 스크리닝하고; c) HMFCA 데히드로게나제 활성을 갖는 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는 cDNA 또는 게놈 DNA를 생성시키는 방법으로 수득가능하다.
본 발명의 HMFCA 데히드로게나제가 본 발명의 세포에서 충분한 수준 및 활성 형태로 발현될 가능성을 증가시키기 위해, 이들 효소를 코딩하는 뉴클레오티드 서열, 뿐만 아니라 본 발명의 다른 효소 (하기 참조)는, 바람직하게는 그의 코돈 이용을 해당 숙주 세포의 코돈 이용에 최적화되도록 적응시킨다. 숙주 세포의 코돈 사용에 대한 폴리펩티드를 코딩하는 뉴클레오티드 서열의 적응성(adaptiveness)은 코돈 적응 지수(codon adaptation index) (CAI)로 표시될 수 있다. 코돈 적응 지수는 본원에서 특정 숙주 세포 또는 유기체에서 고도로 발현된 유전자의 코돈 이용에 대한 유전자 코돈 이용의 상대적인 적응성의 측정으로서 정의된다. 각각의 코돈의 상대 적응성 (w)은 동일한 아미노산에 대해 가장 풍부한 코돈의 이용에 대한 각각의 코돈의 이용의 비율이다. CAI 지수는 이들 상대 적응성 값의 기하 평균으로 정의된다. 비동의 코돈 및 종결 코돈 (유전자 코드에 따라 다름)은 제외된다. CAI 값은 0 내지 1의 범위이며, 값이 높을수록 가장 풍부한 코돈의 비율이 더 높다는 것을 나타낸다 (문헌 [Sharp and Li, 1987, Nucleic Acids Research 15: 1281-1295] 참조; 또한 문헌 [Jansen et al., 2003, Nucleic Acids Res. 31(8):2242-51] 참조). 적응된 뉴클레오티드 서열은 바람직하게는 적어도 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8 또는 0.9의 CAI를 갖는다. 적합한 코돈 최적화된 서열은 예를 들어 효모 세포, 바람직하게는 에스. 세레비시아에 세포에서의 발현을 위해 코돈 최적화된, 서열번호: 27 내지 29에 열거되어 있다.
본 발명의 HMFCA 데히드로게나제를 코딩하는 뉴클레오티드 서열의 발현을 위해 핵산 구축물로 형질전환될 진균 숙주 세포는 원칙적으로 본 발명의 HMFCA 데히드로게나제가, 바람직하게는 기능적, 즉 활성 형태로 적합하게 발현될 수 있는 임의의 진균 숙주 세포일 수 있다. 본 발명의 진균 숙주 세포는, 바람직하게는 푸란계 화합물을 세포 내로뿐만 아니라 세포 밖으로 능동적 또는 수동적 수송할 수 있는 숙주 세포이다. 본 발명의 바람직한 숙주 세포는 카르복실화 푸란계 화합물, 예컨대 특히 HMFCA, FFCA 및 FDCA를 분해하는 (예를 들어, 탈카르복실화하는) 검출 가능한 활성이 결핍되거나 없다. 이러한 숙주 세포는 바람직하게는 카르복실화 푸란계 화합물을 분해하는 능력이 자연적으로 결핍되어 있다. 대안적으로, 진균 숙주 세포는 하기 본원에 기재된 바와 같이, 카르복실화 푸란계 화합물의 분해를 촉매하는 하나 이상의 효소의 특이적 활성을 감소시키거나 제거하도록 유전자 변형될 수 있다.
본 발명의 HMFCA 데히드로게나제를 코딩하는 뉴클레오티드 서열의 발현을 위한 발현 구축물은, 바람직하게는 그 구축물로 형질전환된 숙주 세포와 이종 또는 외인성인 발현 구축물이다. 구축물은 본원에서 구축물이 숙주 세포에서 자연적으로 발생하지 않는 적어도 하나의 서열 또는 서열 요소를 포함하는 경우 및/또는 구축물이 숙주 세포에서 자연적으로 발생하지 않는 조합 및/또는 순서로 적어도 2개의 서열 요소를, 요소 자체가 숙주 세포에서 자연적으로 발생하더라도, 포함하는 경우 구축물을 포함하는 숙주 세포에 대해 이종 또는 외인성인 것으로 이해된다.
적절한 숙주 세포에서 본 발명의 HMFCA 데히드로게나제를 코딩하는 뉴클레오티드 서열의 발현을 위한 벡터 및 발현 구축물은 하기에 본원에서 보다 상세하게 기재되어 있다.
푸란계 알데히드 데히드로게나제 활성의 도입 또는 증가
상기 기재된 바와 같은 본 발명의 HMFCA 데히드로게나제를 발현하는 세포는, 추가로 바람직하게는 알데히드 데히드로게나제 활성 (즉, EC 1.2 활성을 가짐)을 갖는다. 바람직하게는, 알데히드 데히드로게나제는 푸란계 알데히드를 전환시킬 수 있다. 더 바람직하게는 알데히드 데히드로게나제 활성은 푸란계 알데히드를 상응하는 푸란계 카르복실산으로 산화시킬 수 있다. 보다 구체적으로, 알데히드 데히드로게나제 활성은 바람직하게는 i) HMF를 HMFCA로 산화시키는 것, ii) 2,5-디포르밀 푸란 (DFF)을 5-포르밀-2-푸로산 (FFCA)으로 산화시키는 것, 및 iii) FFCA를 FDCA로 산화시키는 것 중 하나 이상을 가능하게 할 수 있다. 이러한 푸란계 알데히드 데히드로게나제 활성은 세포의 내인성 활성일 수 있거나 이는 세포에 부여된 외인성 활성일 수 있다. 바람직하게는, 푸란계 알데히드 데히드로게나제 활성은 세포가 HMFCA 데히드로게나제의 발현을 위한 제1 발현 구축물을 이미 포함하는 경우, 발현 구축물, 예를 들어 제2 발현 구축물로 세포의 형질전환에 의해 세포에 부여되거나 세포에서 증가된다.
본 발명의 바람직한 세포에서, 푸란계 알데히드 데히드로게나제의 발현에 대한 발현 구축물은 세포에서 발현될 수 있고, 푸란계 알데히드 데히드로게나제의 발현은 발현 구축물이 결핍된 상응하는 세포, 예를 들어 야생형 세포와 비교하여, 바람직하게는 i) HMF를 HMFCA로 산화시키는 능력, ii) DFF를 FFCA로 산화시키는 능력, 및, iii) FFCA를 FDCA로 산화시키는 능력 중 적어도 하나의 산화 능력을 부여하거나, 세포에서 이들 능력 중 적어도 하나를 가진 푸란계 알데히드 데히드로게나제의 특이적 활성을 증가시킨다. 푸란계 알데히드 데히드로게나제의 특이적 활성은 발현이 결핍된 상응하는 세포와 비교하여, 바람직하게는 세포에서 적어도 1.05, 1.1, 1.2, 1.5, 2.0, 5.0, 10, 20, 50 또는 100배만큼 증가된다.
i) HMF를 HMFCA로 산화시키는 능력, ii) DFF를 FFCA로 산화시키는 능력, 및 iii) FFCA를 FDCA로 산화시키는 능력 중 적어도 하나의 폴리펩티드의 능력은, 예를 들어 WO2012/064195의 실시예 IV에 기재된 바와 같이, 씨. 바실렌시스 HMF 14로부터의 HmfH 및 HmfT1 유전자와 함께 피. 푸티다 숙주 세포에서, 바람직하게는 피. 푸티다 KT2440 숙주 세포에서, 폴리펩티드를 코딩하는 뉴클레오티드 서열을 공동-발현시키고, 10 mM HMF에서 피. 푸티다 세포를 인큐베이션하고, 폴리펩티드를 발현하지 않는 상응하는 피. 푸티다 세포와 비교하여 FDCA 축적에서의 증가를 검출함으로써 검정될 수 있다. HMF를 HMFCA로 산화시키는 폴리펩티드의 능력은 또한 상기 문헌 [Koopman et al 2010, PNAS]에 기재된 바와 같이 검정될 수 있다. 씨. 바실렌시스 HMF14로부터의 hmfT1 유전자를 발현하는 균주는 본원에서 서열번호: 55의 아미노산 서열을 갖는 유전자 생성물을 발현하는 것으로 이해된다. 대안적으로, i) HMF를 HMFCA로 산화시키는 능력, ii) DFF를 FFCA로 산화시키는 능력, 및 iii) FFCA를 FDCA로 산화시키는 능력 중 적어도 하나의 그의 산화 능력에 대해 검정될 폴리펩티드를 코딩하는 뉴클레오티드 서열은, 예를 들어 PCT/EP2016/072406의 실시예에 기재된 바와 같이, HMFCA 데히드로게나제와 함께, 진균 숙주 세포에서, 바람직하게는 에스. 세레비시아에 숙주 세포에서 공동-발현될 수 있으며, 폴리펩티드를 발현하지 않는 상응하는 진균 숙주 세포와 비교하여, 폴리펩티드의 발현이 FDCA 축적의 증가를 야기하는지의 여부를 검출할 수 있다.
본 발명의 세포에서 발현되는 푸란계 알데히드 데히드로게나제는 바람직하게는 아데닌 디뉴클레오티드, 예컨대 NADH 또는 NADPH, 플라빈 아데닌 디뉴클레오티드 (FAD), 플라빈 모노뉴클레오티드 (FMN), 및 피롤로퀴놀린 퀴놀론 (PQQ)으로부터 선택된 보조인자에 의존하는 데히드로게나제이다.
한 실시양태에서, 푸란계 알데히드 데히드로게나제를 코딩하는 뉴클레오티드 서열은 다음으로 이루어진 군으로부터 선택된다:
a)
i) HMF를 HMFCA로 산화시키는 능력, ii) DFF를 FFCA로 산화시키는 능력, 및, iii) FFCA를 FDCA로 산화시키는 능력 중 적어도 하나의 능력을 갖는 폴리펩티드를 코딩하는 뉴클레오티드 서열이며, 이 폴리펩티드는 서열번호: 3 (hmfN1-코딩된 알데히드 데히드로게나제)의 적어도 하나의 아미노산 서열과 적어도 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 95, 96, 97, 98, 99 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인 뉴클레오티드 서열;
(b) 그의 상보성 가닥이 (a)의 뉴클레오티드 서열에 하이브리드화하는 뉴클레오티드 서열; 및,
(c) 그의 서열이 유전자 코드의 축퇴로 인해 (b)의 뉴클레오티드 서열의 서열과 상이한 뉴클레오티드 서열.
따라서 본 발명의 바람직한 뉴클레오티드 서열은 아스페르길루스, 에우티파, 네오사르토리아, 페니실리움, 포도스포라(Podospora), 세도스포리움(Scedosporium) 및 스포로트릭스로 이루어진 군으로부터 선택된 속의 진균, 더 바람직하게는, 에우티파 라타(Eutypa lata), 페니실리움 브라실리아눔, 포도스포라 안세리나(Podospora anserine), 세도스포리움 아피오스페르뭄(Scedosporium apiospermum) 및 스포로트릭스 쉔스키이로 이루어진 군으로부터 선택된 종의 진균, 가장 바람직하게는 균주 피. 브라실리아눔 C1 또는 MG11인 진균으로부터 수득가능한 (또는 상기 진균에서 자연적으로 발생하는) 푸란계 알데히드 데히드로게나제의 것과 동일한 아미노산 서열을 가진 푸란계 알데히드 데히드로게나제를 코딩한다.
한 실시양태에서 뉴클레오티드 서열은 그것이 자연에서 발생하는 바와 같이, 예를 들어 그것이 야생형 공급원 유기체로부터 단리될 수 있는 바와 같이, 푸란계 알데히드 활성을 가진 폴리펩티드를 코딩한다. 대안적으로, 뉴클레오티드 서열은 상기 정의되고 상응하는 자연적으로 발생하는 푸란계 알데히드 데히드로게나제와 비교하여 하나 이상의 아미노산 치환, 삽입 및/또는 결실을 포함하나 본원에 정의된 동일성 또는 유사성의 범위 내에 있는 푸란계 알데히드 데히드로게나제 중 어느 하나의 조작된 형태를 코딩할 수 있다. 따라서, 한 실시양태에서 본 발명의 뉴클레오티드 서열은 그의 아미노산 서열이 불변 위치 (표 3에 "*"로 표시됨) 각각에, 불변 위치에 존재하는 아미노산을 적어도 포함하는 푸란계 알데히드 데히드로게나제를 코딩한다. 바람직하게는, 아미노산 서열은 강하게 보존된 위치 (표 3에 ":"로 표시됨)에 강하게 보존된 위치에 존재하는 아미노산 중 하나를 또한 포함한다. 더 바람직하게는, 아미노산 서열은 덜 강하게 보존된 위치 (표 3에 "."로 표시됨)에 덜 강하게 보존된 위치에 존재하는 아미노산 중 하나를 추가로 또한 포함한다. 이들 불변 및 보존된 위치 외부의 아미노산 치환은 푸란계 알데히드 데히드로게나제 활성에 영향을 줄 가능성이 덜 낮다. 표 3은 공개 데이터베이스에서 이용 가능한 바와 같이, 페니실리움 브라실리아눔 hmfN1과 그의 10개의 가장 가까운 병렬상동체의 아미노산 서열 정렬을 제시한다. 표 3A는 피. 브라실리아눔 서열과 그의 병렬상동체 간의 백분율 아미노산 동일성, 뿐만 아니라 병렬상동체의 수탁 번호를 제공한다.
푸란계 알데히드 데히드로게나제 활성을 가진 폴리펩티드를 코딩하는 본 발명의 뉴클레오티드 서열은, 그 자체가 관련 기술분야에 널리 공지된 뉴클레오티드 서열의 단리 방법을 사용하여, 진균, 효모 또는 박테리아, 예를 들어 상기 기재된 공급원 유기체와 동일한 문, 강 또는 속에 속하는 것의 게놈 및/또는 cDNA로부터 수득가능하다 (예를 들어 문헌 [Sambrook and Russell (2001) "Molecular Cloning: A Laboratory Manual (3rd edition), Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, New York] 참조). 본 발명의 뉴클레오티드 서열은 예를 들어 a) 축퇴성 PCR 프라이머 (보존된 아미노산 서열을 기초로 설계됨)를 적합한 유기체의 게놈 및/또는 cDNA 상에서 사용하여 푸란계 알데히드 데히드로게나제 활성을 가진 폴리펩티드를 코딩하는 뉴클레오티드 서열의 일부를 포함하는 PCR 단편을 생성시키고; b) a)에서 수득된 PCR 단편을 프로브로서 사용하여 유기체의 cDNA 및/또는 게놈 라이브러리를 스크리닝하고; c) 푸란계 알데히드 데히드로게나제 활성을 갖는 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는 cDNA 또는 게놈 DNA를 생성시키는 방법으로 수득가능하다.
본 발명의 푸란계 알데히드 데히드로게나제를 코딩하는 뉴클레오티드 서열의 발현을 위해 핵산 구축물로 형질전환될 진균 숙주 세포는 바람직하게는 HMFCA 데히드로게나제를 코딩하는 뉴클레오티드 서열의 발현을 위해 핵산 구축물로 형질전환을 위해 상기 기재된 바와 같고, 여기서 또한 푸란계 알데히드 데히드로게나제가, 바람직하게는 기능적, 즉 활성 형태로 적합하게 발현될 수 있는 진균 숙주 세포이다. 바람직하게는, 푸란계 알데히드 데히드로게나제를 코딩하는 뉴클레오티드 서열의 발현을 위해 핵산 구축물로 형질전환될 진균 숙주 세포는 또한 HMFCA 데히드로게나제를 코딩하는 뉴클레오티드 서열을 발현하며, 더 바람직하게는 세포는 HMFCA를 FFCA로 산화시키는 능력을 세포에 부여하거나 세포에서 증가시키는 HMFCA 데히드로게나제를 위한 발현 구축물을 포함한다. 상기 기재된 바와 같이, 이러한 진균 숙주 세포는, 바람직하게는 푸란계 화합물을 세포 내로뿐만 아니라 세포 밖으로 능동적 또는 수동적 수송할 수 있으며, 바람직하게는 카르복실화 푸란계 화합물을 분해하는 (예를 들어, 탈카르복실화하는) 검출 가능한 활성이 결핍되거나 없다.
본 발명의 푸란계 알데히드 데히드로게나제를 코딩하는 뉴클레오티드 서열의 발현을 위한 발현 구축물은, 바람직하게는 그 구축물로 형질전환된 숙주 세포와 이종 또는 외인성인 발현 구축물이다. 구축물은 본원에서 구축물이 숙주 세포에서 자연적으로 발생하지 않는 적어도 하나의 서열 또는 서열 요소를 포함하는 경우 및/또는 구축물이 숙주 세포에서 자연적으로 발생하지 않는 조합 및/또는 순서로 적어도 2개의 서열 요소를, 요소 자체가 숙주 세포에서 자연적으로 발생하더라도, 포함하는 경우 구축물을 포함하는 숙주 세포에 대해 이종 또는 외인성인 것으로 이해된다.
적절한 숙주 세포에서 본 발명의 푸란계 알데히드 데히드로게나제를 코딩하는 뉴클레오티드 서열의 발현을 위한 벡터 및 발현 구축물은 하기에 본원에서 보다 상세하게 기재되어 있다.
푸란계 화합물의 대사를 위한 대안적인 경로의 감소 또는 제거
HMF 및 FDCA의 다른 푸란계 전구체의 대사를 위한 대안적인 내인성 경로가 본 발명의 세포에 또한 존재할 수 있다. 이러한 대안적인 경로는 HMF 및 FDCA의 다른 푸란계 전구체로부터 FDCA를 제조하는 것과 경쟁한다. 따라서, 바람직하게는 이러한 대안적인 경로에서 효소의 특이적 활성은 본 발명의 세포에서 또한 감소되거나 제거된다. 하나의 이러한 내인성 대안적 경로는 예를 들어 HMF 및/또는 FFCA를 데히드로게나제, 예컨대 예를 들어 단쇄 데히드로게나제에 의해 상응하는 알콜로 환원시키는 것이다. HMF 및 FDCA의 다른 푸란 전구체를 대사하기 위한 대안적 경로의 특이적 활성을 감소시키거나 제거하기 위해 변형될 이러한 단쇄 데히드로게나제를 코딩하는 유전자는, 바람직하게는 서열번호: 5 (hmfM)에 대해 적어도 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 95, 96, 97, 98, 99 또는 100% 서열 동일성을 가진 아미노산 서열을 코딩하는 유전자이다. 본 발명의 세포에서, 특이적 단쇄 데히드로게나제 활성은 바람직하게는 활성의 감소를 야기하는 유전자 변형을 제외하고는 유전적으로 동일한 균주의 세포와 비교하여 적어도 1.05, 1.1, 1.2, 1.5, 2.0, 5.0, 10, 20, 50 또는 100배 만큼 감소된다.
그의 특이적 활성이 바람직하게는 본 발명의 세포에서 감소되거나 제거되는 단쇄 데히드로게나제를 코딩하는 뉴클레오티드 서열은, 그 자체가 관련 기술분야에 널리 공지된 뉴클레오티드 서열의 단리 방법을 사용하여, 진균, 효모 또는 박테리아, 예를 들어 상기 기재된 공급원 유기체와 동일한 문, 강 또는 속에 속하는 것의 게놈 및/또는 cDNA로부터 수득가능하고 동정될 수 있다 (예를 들어 문헌 [Sambrook and Russell (2001) "Molecular Cloning: A Laboratory Manual (3rd edition), Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, New York] 참조). 본 발명의 뉴클레오티드 서열은 예를 들어 a) 축퇴성 PCR 프라이머 (보존된 아미노산 서열을 기초로 설계됨)를 적합한 유기체의 게놈 및/또는 cDNA 상에서 사용하여 그의 특이적 활성이 바람직하게는 본 발명의 세포에서 감소되거나 제거되는 효소를 코딩하는 뉴클레오티드 서열의 일부를 포함하는 PCR 단편을 생성시키고; b) a)에서 수득된 PCR 단편을 프로브로서 사용하여 유기체의 cDNA 및/또는 게놈 라이브러리를 스크리닝하고; c) 그의 특이적 활성이 바람직하게는 본 발명의 세포에서 감소되거나 제거되는 효소를 코딩하는 뉴클레오티드 서열을 포함하는 cDNA 또는 게놈 DNA를 생성시키는 방법으로 수득가능하다. 이러한 보존된 서열은 표 5에 제시된 서열 정렬에서 확인될 수 있으며, 여기서 불변 위치는 "*"로 표시되고 강하게 보존된 위치는 ":"로 표시된다. 또한, 본 발명의 적합한 숙주 세포는 표 5로부터 유래될 수 있으며, 여기서 숙주는 바람직하게는 표 5에서 확인된 병렬상동체의 공급원 유기체와 동일한 문, 강, 목, 과 또는 속에 속하는 비병원성 진균 또는 효모이다. 표 5는 공개 데이터베이스에서 이용 가능한 바와 같이, 페니실리움 브라실리아눔 hmfM 각각과 그의 10개의 가장 가까운 병렬상동체의 아미노산 서열 정렬을 제시한다. 표 5A는 피. 브라실리아눔 hmfM 서열과 그의 병렬상동체 간의 백분율 아미노산 동일성, 뿐만 아니라 병렬상동체의 수탁 번호를 제공한다.
HMF를 HMF-알콜로 환원시키는 것으로 공지된 또 다른 내인성 데히드로게나제는 문헌 [Petersson et al. (2006, Yeast, 23:455-464)]에 기재된 바와 같이 에스. 세레비시아에 ADH6 유전자에 의해 코딩된 NADPH-의존성 알콜 데히드로게나제이다. 따라서, HMF를 대사하기 위한 대안적인 경로의 특이적 활성을 감소시키거나 제거하기 위해 변형될 유전자는, 또 다른 진균 숙주 종에서 에스. 세레비시아에 ADH6 유전자 또는 그의 병렬상동체인 것이 바람직하다. 50-60%의 범위의 아미노산 서열 동일성을 가진 아스페르길루스 및 페니실리움과 같은 사상균에서 에스. 세레비시아에 ADH6 유전자의 병렬상동체는 공개 서열 데이터베이스에서 확인될 수 있다. 따라서, 바람직하게는, NADPH-의존성 HMF-환원 데히드로게나제의 특이적 활성을 감소시키거나 제거하기 위해 변형될 유전자는, 서열번호: 25 (에스. 세레비시아에 ADH6)에 대해 적어도 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 95, 96, 97, 98, 99 또는 100% 서열 동일성을 가진 아미노산 서열을 코딩하는 유전자이다. 본 발명의 세포에서, NADPH-의존성 HMF-환원 데히드로게나제의 특이적 활성은 바람직하게는 활성의 감소를 야기하는 유전자 변형을 제외하고는 유전적으로 동일한 균주의 세포와 비교하여 적어도 1.05, 1.1, 1.2, 1.5, 2.0, 5.0, 10, 20, 50 또는 100배 만큼 감소된다.
푸란계 화합물의 수송체를 발현하는 세포
상기 기재된 바와 같이, 본 발명의 세포는 푸란계 화합물 수송 능력을 갖는 폴리펩티드를 코딩하는 하나 이상의 뉴클레오티드 서열을 발현하는 것이 추가로 바람직하다. 푸란계 화합물 수송 능력을 갖는 이러한 폴리펩티드는 세포의 내인성 활성일 수 있거나 그것은 세포에 부여된 외인성 활성일 수 있다. 바람직하게는, 푸란계 화합물 수송 능력을 갖는 폴리펩티드의 활성은, 발현 구축물, 예를 들어 세포가 HMFCA 데히드로게나제 또는 옥시다제의 발현을 위한 제1 발현 구축물 및 푸란계 알데히드 데히드로게나제 또는 옥시다제의 발현을 위한 제2 발현 구축물을 미리 포함하는 경우 발현 구축물, 예를 들어 제3 발현 구축물로 세포의 형질전환에 의해 세포에 부여되거나 세포에서 증가된다.
바람직하게는, 세포는 푸란계 화합물 수송 능력을 갖는 폴리펩티드를 코딩하는 뉴클레오티드 서열의 발현을 위한 발현 구축물로 형질전환된다. 푸란계 화합물 수송 능력을 갖는 폴리펩티드는 바람직하게는 HMFCA 수송 능력을 갖는 폴리펩티드이며, 이는 HMFCA를 세포 내로 수송하는 능력을 적어도 포함한다. 바람직하게는, 세포는 적어도 HMFCA를 세포 내로 수송하는 능력을 갖는 폴리펩티드를 코딩하는 뉴클레오티드 서열의 발현을 위한 발현 구축물을 포함하며, 상기 폴리펩티드는 바람직하게는 서열번호: 6 내지 10 (각각, hmfT3, hmfT4, hmfT5, hmfT6, 및 hmfT7) 중 적어도 하나에 대해 적어도 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 95, 96, 97, 98, 99 또는 100% 서열 동일성을 가진 아미노산 서열을 포함하며, 여기서, 발현 구축물은 세포에서 발현될 수 있고, 폴리펩티드의 발현은 발현 구축물이 결핍된 상응하는 야생형 세포와 비교하여, 적어도 HMFCA를 세포 내로 수송하는 능력을 세포에 부여하거나 세포에서 증가시킨다.
푸란계 화합물, 특히 HMFCA를 세포 내로 수송하는 폴리펩티드의 능력은, 예를 들어 PCT/EP2016/072406의 실시예에 기재된 바와 같이, (WO2012/064195의 서열번호: 19의 아미노산 서열을 갖는) 씨. 바실렌시스 HMF 14로부터의 HMF-분해 오페론과 연관된 푸란계 알데히드 데히드로게나제를 코딩하는 유전자 및 씨. 바실렌시스 HMF 14로부터의 hmfH 유전자와 함께, 효모 숙주 세포에서, 바람직하게는 에스. 세레비시아에 CEN.PK 숙주 세포에서 수송체 폴리펩티드를 코딩하는 뉴클레오티드 서열을 공동-발현시키고, 4 mM HMF에서 형질전환된 에스. 세레비시아에 세포를 인큐베이션하고, 수송체 폴리펩티드를 발현하지 않는 상응하는 (즉, 그렇지 않으면 동일한) 에스. 세레비시아에 세포와 비교하여 FDCA 축적에서의 증가를 검출함으로써 검정될 수 있다.
따라서 본 발명의 바람직한 뉴클레오티드 서열은 아스페르길루스, 푸사리움, 넥트리아(Nectria), 페니실리움, 스포로트릭스(Sporothrix) 및 토그니니아(Togninia)로 이루어진 군으로부터 선택된 속의 진균, 더 바람직하게는, 아스페르길루스 테레우스(Aspergillus terreus), 페니실리움 브라실리아눔, 페니실리움 디기타툼(Penicillium digitatum), 페니실리움 루벤스(Penicillium rubens), 스포로트릭스 쉔스키이 및 토그니니아 미니마(Togninia minima)로 이루어진 군으로부터 선택된 종의 진균, 가장 바람직하게는 균주 피. 브라실리아눔 C1 또는 MG11인 진균으로부터 수득가능한 (또는 상기 진균에서 자연적으로 발생하는) 푸란계 화합물 수송체 폴리펩티드의 것과 동일한 아미노산 서열을 가진 푸란계 화합물 수송체 폴리펩티드를 코딩한다.
한 실시양태에서 뉴클레오티드 서열은 그것이 자연에서 발생하는 바와 같이, 예를 들어 그것이 야생형 공급원 유기체로부터 단리될 수 있는 바와 같이, 푸란계 화합물 수송체 폴리펩티드를 코딩한다. 대안적으로, 뉴클레오티드 서열은 상기 정의되고 상응하는 자연적으로 발생하는 푸란계 화합물 수송체 폴리펩티드와 비교하여 하나 이상의 아미노산 치환, 삽입 및/또는 결실을 포함하나 본원에 정의된 동일성 또는 유사성의 범위 내에 있는 푸란계 화합물 수송체 폴리펩티드 중 어느 하나의 조작된 형태를 코딩할 수 있다. 따라서, 한 실시양태에서 본 발명의 뉴클레오티드 서열은 그의 아미노산 서열이 불변 위치 (표 6 내지 10에 "*"로 표시됨) 각각에, 불변 위치에 존재하는 아미노산을 적어도 포함하는 푸란계 화합물 수송체 폴리펩티드를 코딩한다. 바람직하게는, 아미노산 서열은 강하게 보존된 위치 (표 6 내지 10에 ":"로 표시됨)에 강하게 보존된 위치에 존재하는 아미노산 중 하나를 또한 포함한다. 더 바람직하게는, 아미노산 서열은 덜 강하게 보존된 위치 (표 6 내지 10에 "."로 표시됨)에 덜 강하게 보존된 위치에 존재하는 아미노산 중 하나를 추가로 또한 포함한다. 이들 불변 및 보존된 위치 외부의 아미노산 치환은 푸란계 화합물 수송체 폴리펩티드 활성에 영향을 줄 가능성이 덜 낮다. 표 6 내지 10은 공개 데이터베이스에서 이용 가능한 바와 같이, 페니실리움 브라실리아눔 각각 hmfT3, hmfT4, hmfT5, hmfT6 및 hmfT7과, 그의 10개의 가장 가까운 병렬상동체 각각의 아미노산 서열 정렬을 제시한다. 표 6A 내지 10A는 피. 브라실리아눔 서열과 그의 병렬상동체 간의 백분율 아미노산 동일성, 뿐만 아니라 병렬상동체의 수탁 번호를 제공한다.
푸란계 화합물 수송체 활성을 가진 폴리펩티드를 코딩하는 본 발명의 뉴클레오티드 서열은, 그 자체가 관련 기술분야에 널리 공지된 뉴클레오티드 서열의 단리 방법을 사용하여, 진균, 효모 또는 박테리아, 예를 들어 상기 기재된 공급원 유기체와 동일한 문, 강 또는 속에 속하는 것의 게놈 및/또는 cDNA로부터 수득가능하다 (예를 들어 문헌 [Sambrook and Russell (2001) "Molecular Cloning: A Laboratory Manual (3rd edition), Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, New York] 참조). 본 발명의 뉴클레오티드 서열은 예를 들어 a) 축퇴성 PCR 프라이머 (보존된 아미노산 서열을 기초로 설계됨)를 적합한 유기체의 게놈 및/또는 cDNA 상에서 사용하여 푸란계 화합물 수송체의 활성을 가진 폴리펩티드를 코딩하는 뉴클레오티드 서열의 일부를 포함하는 PCR 단편을 생성시키고; b) a)에서 수득된 PCR 단편을 프로브로서 사용하여 유기체의 cDNA 및/또는 게놈 라이브러리를 스크리닝하고; c) 푸란계 화합물 수송체 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는 cDNA 또는 게놈 DNA를 생성시키는 방법으로 수득가능하다.
푸란계 화합물 수송체 폴리펩티드를 코딩하는 뉴클레오티드 서열의 발현을 위해 핵산 구축물로 형질전환될 진균 숙주 세포는 바람직하게는 상기 기재된 바와 같은 본 발명의 진균 숙주 세포이다.
본 발명의 푸란계 화합물 수송체 폴리펩티드를 코딩하는 뉴클레오티드 서열의 발현을 위한 발현 구축물은, 바람직하게는 그 구축물로 형질전환된 숙주 세포와 이종 또는 외인성인 발현 구축물이다. 구축물은 본원에서 구축물이 숙주 세포에서 자연적으로 발생하지 않는 적어도 하나의 서열 또는 서열 요소를 포함하는 경우 및/또는 구축물이 숙주 세포에서 자연적으로 발생하지 않는 조합 및/또는 순서로 적어도 2개의 서열 요소를, 요소 자체가 숙주 세포에서 자연적으로 발생하더라도, 포함하는 경우 구축물을 포함하는 숙주 세포에 대해 이종 또는 외인성인 것으로 이해된다.
별개의 측면에서, 본 발명은 HMF를 FDCA로 산화시키는 능력을 갖고 적어도 하나의 푸란계 화합물을 수송하는 폴리펩티드를 코딩하는 뉴클레오티드 서열의 발현을 증가시키는 유전자 변형을 포함하는 진균 세포로서, 이 폴리펩티드는 바람직하게는 서열번호: 9 및 10 중 적어도 하나의 아미노산 서열과 적어도 45% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인, 진균 세포에 관한 것이다. 바람직하게는, 진균 세포는, a) 상기 본원에 기재된 바와 같이, 유전자 변형이 결핍된 상응하는 모 세포와 비교하여, 세포에서 특이적 2,5-푸란디카르복실산 (FDCA) 탈카르복실화 모노옥시게나제 활성을 제거하거나 감소시키는 유전자 변형; b) 상기 본원에 기재된 바와 같이, 유전자 변형이 결핍된 상응하는 야생형 세포와 비교하여, 세포에 5-히드록시메틸-2-푸란카르복실산 (HMFCA)을 5-포르밀-2-푸로산 (FFCA)으로 산화시키는 능력을 부여하거나 세포에서 HMFCA를 FFCA로 산화시키는 효소의 특이적 활성을 증가시키는 유전자 변형; c) 상기 본원에 기재된 바와 같이, 유전자 변형이 결핍된 상응하는 야생형 세포와 비교하여, 세포에 푸란계 알데히드를 상응하는 푸란계 카르복실산으로 산화시키는 능력을 부여하는 유전자 변형 또는 세포에서 푸란계 알데히드를 상응하는 푸란계 카르복실산으로 산화시키는 효소의 특이적 활성을 증가시키는 유전자 변형; d) 상기 본원에 기재된 바와 같이, HMF 및/또는 FFCA를 상응하는 알콜로 환원시키는 단쇄 데히드로게나제를 코딩하는 유전자의 발현을 감소시키거나 제거하는 유전자 변형으로서, 여기서 바람직하게는 유전자는 서열번호: 5 및 25 중 적어도 하나에 대해 적어도 45% 서열 동일성을 가진 아미노산 서열을 포함하는 폴리펩티드를 코딩하는 유전자 중 적어도 하나인 유전자 변형; e) 상기 본원에 기재된 바와 같이, 적어도 하나의 푸란계 화합물을 수송하는 폴리펩티드를 코딩하는 뉴클레오티드 서열의 발현을 증가시키는 유전자 변형으로서, 이 폴리펩티드는 바람직하게는 서열번호: 6 내지 8 중 적어도 하나의 아미노산 서열과 적어도 45% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인 유전자 변형; 및, f) 하기 본원에 기재된 바와 같이, 푸란 이화작용에 관여하는 유전자의 전사 활성인자를 코딩하는 유전자의 발현을 변경시키는 유전자 변형으로서, 여기서 바람직하게는 유전자는 서열번호: 11에 대해 적어도 45% 서열 동일성을 가진 아미노산 서열을 포함하는 폴리펩티드를 코딩하는 유전자인 유전자 변형으로부터 선택된 하나 이상의 유전자 변형을 추가로 포함한다.
적절한 숙주 세포에서 본 발명의 푸란계 화합물 수송체 폴리펩티드를 코딩하는 뉴클레오티드 서열의 발현을 위한 벡터 및 발현 구축물은 하기에 본원에서 보다 상세하게 기재되어 있다.
전사 활성인자의 발현의 변경된 조절을 가진 세포
본 발명의 세포의 한 실시양태에서, 푸란 이화작용에 관여하는 유전자의 전사 활성인자의 발현 조절이 변경된다. 전사 활성인자의 발현은 FDCA 분해를 위한 내인성 유전자를 함유하고, 바람직하게는 전사 활성인자와 독립적으로 발현되는 HMF를 FDCA로 전환시키기 위한 효소를 코딩하는 유전자를 함유하는 세포에서 FDCA의 분해를 방지하기 위해 감소되거나 제거될 수 있다. 대안적으로, 전사 활성인자의 발현은 HMF, 및/또는 다른 푸란계 전구체를 FDCA로 전환시키기 위한 내인성 유전자의 발현을 증가시키도록, FDCA 분해를 방지하기 위해 유전자 변형된 세포에서 증가될 수 있고/거나 구성적으로 만들어질 수 있다.
바람직하게는, 본 발명의 세포에서, 그의 발현의 조절이 변경되는 전사 활성인자는, 서열번호: 11 (hmfR)에 대해 적어도 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 95, 96, 97, 98, 99 또는 100% 서열 동일성을 가진 아미노산 서열을 포함하는 폴리펩티드를 코딩하는 뉴클레오티드 서열에 의해 암호화되며, 여기서, 폴리펩티드는 푸란 이화작용에 관여하는 적어도 하나의 유전자의 전사를 활성화시키는 능력을 갖는다.
따라서 본 발명의 바람직한 뉴클레오티드 서열은 푸사리움, 페니실리움, 세도스포리움, 스포로트릭스 및 스타키보트리즈(Stachybotrys)로 이루어진 군으로부터 선택된 속의 진균, 더 바람직하게는, 푸사리움 옥시스포룸(Fusarium oxysporum), 페니실리움 브라실리아눔, 세도스포리움 아피오스페르뭄, 스포로트릭스 쉔스키이 및 스타키보트리즈 클로로할로나타(Stachybotrys chlorohalonata)로 이루어진 군으로부터 선택된 종의 진균, 가장 바람직하게는 균주 피. 브라실리아눔 C1 또는 MG11인 진균으로부터 수득가능한 (또는 상기 진균에서 자연적으로 발생하는) 전사 활성인자의 것과 동일한 아미노산 서열을 가진 전사 활성인자를 코딩한다.
한 실시양태에서 뉴클레오티드 서열은 그것이 자연에서 발생하는 바와 같이, 예를 들어 그것이 야생형 공급원 유기체로부터 단리될 수 있는 바와 같이, 전사 활성인자를 코딩한다. 대안적으로, 뉴클레오티드 서열은 상기 정의되고 상응하는 자연적으로 발생하는 전사 활성인자 폴리펩티드와 비교하여 하나 이상의 아미노산 치환, 삽입 및/또는 결실을 포함하나 본원에 정의된 동일성 또는 유사성의 범위 내에 있는 전사 활성인자 폴리펩티드 중 어느 하나의 조작된 형태를 코딩할 수 있다. 따라서, 한 실시양태에서 본 발명의 뉴클레오티드 서열은 그의 아미노산 서열이 불변 위치 (표 11에 "*"로 표시됨) 각각에, 불변 위치에 존재하는 아미노산을 적어도 포함하는 전사 활성인자 폴리펩티드를 코딩한다. 바람직하게는, 아미노산 서열은 강하게 보존된 위치 (표 11에 ":"로 표시됨)에 강하게 보존된 위치에 존재하는 아미노산 중 하나를 또한 포함한다. 더 바람직하게는, 아미노산 서열은 덜 강하게 보존된 위치 (표 11에 "."로 표시됨)에 덜 강하게 보존된 위치에 존재하는 아미노산 중 하나를 추가로 또한 포함한다. 이들 불변 및 보존된 위치 외부의 아미노산 치환은 전사 활성인자 활성에 영향을 줄 가능성이 덜 낮다. 표 11은 공개 데이터베이스에서 이용 가능한 바와 같이 페니실리움 브라실리아눔 hmfR과, 그의 10개의 가장 가까운 병렬상동체의 아미노산 서열 정렬을 제시한다. 표 11A는 피. 브라실리아눔 서열과 그의 병렬상동체 간의 백분율 아미노산 동일성, 뿐만 아니라 병렬상동체의 수탁 번호를 제공한다.
전사 활성인자 활성을 가진 폴리펩티드를 코딩하는 본 발명의 뉴클레오티드 서열은, 그 자체가 관련 기술분야에 널리 공지된 뉴클레오티드 서열의 단리 방법을 사용하여, 진균, 효모 또는 박테리아, 예를 들어 상기 기재된 공급원 유기체와 동일한 문, 강 또는 속에 속하는 것의 게놈 및/또는 cDNA로부터 수득가능하다 (예를 들어 문헌 [Sambrook and Russell (2001) "Molecular Cloning: A Laboratory Manual (3rd edition), Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, New York] 참조). 본 발명의 뉴클레오티드 서열은 예를 들어 a) 축퇴성 PCR 프라이머 (보존된 아미노산 서열을 기초로 설계됨)를 적합한 유기체의 게놈 및/또는 cDNA 상에서 사용하여 전사 활성인자의 활성을 가진 폴리펩티드를 코딩하는 뉴클레오티드 서열의 일부를 포함하는 PCR 단편을 생성시키고; b) a)에서 수득된 PCR 단편을 프로브로서 사용하여 유기체의 cDNA 및/또는 게놈 라이브러리를 스크리닝하고; c) 푸란계 전사 활성인자를 코딩하는 뉴클레오티드 서열을 포함하는 cDNA 또는 게놈 DNA를 생성시키는 방법으로 수득가능하다.
푸란계 전사 활성인자 폴리펩티드를 코딩하는 뉴클레오티드 서열의 발현을 위해 핵산 구축물로 형질전환될 진균 숙주 세포는 바람직하게는 상기 기재된 바와 같은 본 발명의 진균 숙주 세포이다.
본 발명의 푸란계 전사 활성인자 폴리펩티드를 코딩하는 뉴클레오티드 서열의 발현을 위한 발현 구축물은, 바람직하게는 그 구축물로 형질전환된 숙주 세포와 이종 또는 외인성인 발현 구축물이다. 구축물은 본원에서 구축물이 숙주 세포에서 자연적으로 발생하지 않는 적어도 하나의 서열 또는 서열 요소를 포함하는 경우 및/또는 구축물이 숙주 세포에서 자연적으로 발생하지 않는 조합 및/또는 순서로 적어도 2개의 서열 요소를, 요소 자체가 숙주 세포에서 자연적으로 발생하더라도, 포함하는 경우 구축물을 포함하는 숙주 세포에 대해 이종 또는 외인성인 것으로 이해된다.
적절한 숙주 세포에서 본 발명의 푸란계 전사 활성인자 폴리펩티드를 코딩하는 뉴클레오티드 서열의 발현을 위한 벡터 및 발현 구축물은 하기에 본원에서 보다 상세하게 기재되어 있다.
본 발명의 세포의 유전자 변형을 위한 벡터, 유전자 구축물 및 방법
본 발명의 모 숙주 세포의 유전자 변형, 즉 본 발명의 변형된 숙주 세포의 구축을 위해, 관련 기술분야에 일반적으로 공지되어 있고 예를 들어 문헌 [Sambrook and Russell (2001, "Molecular cloning: a laboratory manual" (3rd edition), Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press) and Ausubel et al. (1987, eds., "Current protocols in molecular biology", Green Publishing and Wiley Interscience, New York)]에 기재되어 있는 표준 유전 공학 및 분자 생물학 기술이 사용된다.
보다 구체적으로, 효모의 유전자 변형을 위한 수단 및 방법은 표준이며 관련 기술분야의 통상의 기술자에게 공지되어 있으며, 예를 들어 유전자, 에피솜 및/또는 통합 발현 구축물 및 벡터의 (과-)발현을 위한 프로모터, 선택 가능한 마커, 및 내인성 효모 유전자 또는 그의 일부를 파괴 및/또는 결실시키기 위한 방법 및 유전자 구축물, 및 효모를 형질전환시키는 방법을 포함한다. 이러한 수단 및 방법은 예를 들어 문헌 [Sherman et al, Methods Yeast Genetics, Cold Spring Harbor Laboratory, NY (1978)]; [Guthrie et al. (Eds.) Guide To Yeast Genetics and Molecular Biology Vol. 194, Academic Press, San Diego (1991)]; [Sudbery, P. E. (2001) Genetics Engineering of Yeast, in Biotechnology Set, Second Edition (eds H.-J. Rehm and G. Reed), Wiley-VCH Verlag GmbH, Weinheim, Germany. doi: 10.1002/9783527620999.ch13a]; 및, [Gaillardin, C. and Heslot, H. (1988), Genetics engineering in Yarrowia lipolytica. J. Basic Microbiol., 28: 161-174. doi: 10.1002/jobm.3620280303]에 기재되어 있으며; 이들 문헌 모두는 본원에 참조로 포함된다.
유사하게, 사상균의 유전자 변형을 위한 수단 및 방법은 표준이며 관련 기술분야의 통상의 기술자에게 공지되어 있으며, 예를 들어 유전자, 에피솜 및/또는 통합 발현 구축물 및 벡터의 (과-)발현을 위한 프로모터, 선택 가능한 마커, 및 내인성 진균 유전자 또는 그의 일부를 파괴 및/또는 결실시키기 위한 방법 및 유전자 구축물, 및 사상균을 형질전환시키는 방법을 포함한다. 이러한 수단 및 방법은 예를 들어 문헌 [Moore, M. M. (2007, "Genetic engineering of fungal cells", In Biotechnology Vol. III. (Ed. H. W. Doelle and E. J. Dasilva), EOLSS, Ontario, Canada. pp. 36-63; Lubertozzi, D., & Keasling, J. D. (2009), "Developing Aspergillus as a host for heterologous expression", Biotechnology advances, 27(1), 53-75; Meyer, V. (2008) "Genetic engineering of filamentous fungi--progress, obstacles and future trends", Biotechnology Advances, (26), 177-85; Kck and Hoff (2010) "New tools for the genetic manipulation of filamentous fungi. Applied microbiology and biotechnology", 86(1), 51-62]; 및, WO2014/142647]에 기재되어 있으며, 이들 문헌 모두는 본원에 참조로 포함된다.
따라서 또 다른 측면에서, 본 발명은 본 발명의 폴리뉴클레오티드, 예를 들어 본 발명의 HMFCA 데히드로게나제 또는 푸란계 알데히드 데히드로게나제를 코딩하는 뉴클레오티드 서열 또는 그의 기능적 등가물을 포함하는, 클로닝 및 발현 벡터를 포함하는 벡터와 같은 핵산 구축물, 및 이러한 벡터로 적합한 숙주 세포를 형질전환 또는 형질감염시키는 방법에 관한 것이다. 본원에 사용된 바와 같이, 용어 "벡터" 및 "구축물"은 상호교환적으로 사용되며 본 발명의 폴리뉴클레오티드를 포함하는 구성된 구축된 핵산 분자를 지칭한다.
본 발명에 따른 벡터는 자율 복제 벡터, 즉 그의 복제가 염색체 복제와 무관한, 염색체외 개체로서 존재하는 벡터, 예를 들어 플라스미드일 수 있다. 대안적으로, 벡터는 숙주 세포 내로 도입될 때 숙주 세포 게놈으로 통합되고 그것이 통합 된 염색체 (들)와 함께 복제되는 것일 수 있다. 편의상 벡터는 조작 및 생산의 용이성을 위해, 이.콜라이(E.coli)와 같은 박테리아에서 사용하기 위한 선택 가능한 마커 및 복제 원점을 또한 포함하는 셔틀 벡터일 수 있다.
한 실시양태에서, 핵산 구축물은 (과-) 발현될 본 발명의 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하고, 여기서 폴리펩티드를 코딩하는 뉴클레오티드 서열은 해당 숙주 세포에서 코딩 뉴클레오티드 서열의 발현 (의 속도)을 수행하고 제어할 수 있는 조절 서열에 작동 가능하게 연결되어 있는 것인, 발현 구축물 또는 발현 벡터이다. 이러한 조절 서열은 전형적으로, 코딩 서열의 전사를 제어하는 기능을 하는 프로모터를 적어도 포함하며, 이 프로모터는 대개 코딩 서열의 상류에 위치하고 바람직하게는 작동 가능하게 연결된다. 프로모터에 더하여, 상류 전자 조절 서열은 추가 요소 예컨대 인핸서, 상류 활성화 인자 서열, 전사 인자 결합 부위, 리프레서 및 활성인자 단백질 결합 부위 등을 포함할 수 있다. 프로모터 서열은 대개 전사 개시 부위(들)를 포함할 것이다. 효모 또는 사상균에서 코딩 서열의 발현에 적합한 프로모터 및 전사 조절 서열은 상기 인용된 문헌에 기재되어 있다. 프로모터 및 전사 개시 부위(들)의 하류에서, 발현 구축물은 번역 개시 서열, 예컨대 번역 개시 코돈, 즉 코딩 서열의 제1 코돈을 둘러싸는 진핵 코작(Kozak) 공통 서열을 포함할 것이다. 코딩 서열은 번역 정지 코돈으로 종결된다. 코딩 서열의 하류에서, 발현 구축물은 하나 이상의 전사 종결 부위를 함유하는 3'- 번역되지 않은 영역, 예를 들어 바람직하게는 폴리아데닐화 부위를 또한 포함하는 종결자를 포함할 수 있다. 종결자의 기원은 덜 중대하다. 종결자는, 예를 들어, 폴리펩티드를 코딩하는 DNA 서열에 고유할 수 있다. 그러나, 바람직하게는 효모 종결자가 효모 숙주 세포에서 사용되고, 사상균 종결자는 사상균 숙주 세포에서 사용된다. 더 바람직하게는, 종결자는 숙주 세포 (여기서 폴리펩티드를 코딩하는 뉴클레오티드 서열이 발현되어야 함)에 대해 내인성이다. 적절한 상류- 및 하류 조절 서열에 작동 가능하게 연결된 코딩 서열을 포함하는 기능적 발현 유닛은 발현 카세트로서 지칭될 수 있다. 본 발명의 발현 벡터 또는 발현 구축물은, 임의로 하나 초과의 상이한 코딩 서열의 발현을 위해 하나 초과의 발현 카세트를 포함할 수 있다.
적어도 하나의 발현 카세트에 추가하여, 본 발명의 발현 벡터 또는 발현 구축물은 바람직하게는 벡터 또는 구축물로 형질전환된 숙주 세포의 선택을 위한 선택 가능한 마커를 또한 포함한다. 바람직한 실시양태에서, 예를 들어 EP 0 635 574에 기재된 바와 같은 상동 재조합을 사용하거나, 문헌 [Gldener et al. (1996, Nucleic Acids Res. 24:2519-2524)]에 기재된 바와 같은 Cre-lox 시스템을 사용하여, 일단 형질전환체의 초기 선택 후 숙주 세포에서, 발현 구축물/벡터로부터 마커를 절제할 수 있는 구성으로 발현 벡터 또는 발현 구축물 중의 선택 가능한 마커.
본 발명은 추가로, 본 발명의 세포에서 그의 발현이 감소/제거될 폴리펩티드를 포함하여, 본 발명의 폴리펩티드, 예를 들어 HMFCA 데히드로게나제 활성을 갖는 폴리펩티드, 푸란계 알데히드 데히드로게나제 활성을 갖는 폴리펩티드의 제조 방법에 관한 것이다. 상기 방법은 폴리펩티드의 발현에 도움이 되는 조건하에 본 발명에 따른 세포를 배양하고, 임의로, 발현된 폴리펩티드를 회수하는 단계를 포함한다. 본 발명은 또한 이러한 방법에 의해 수득 가능한 폴리펩티드에 관한 것이다.
따라서 또 다른 측면에서, 본 발명은 코딩된 표적 단백질의 발현 및/또는 활성을 감소시키거나 제거하기 위해 본 발명의 세포에서 내인성 표적 유전자를 변형시키는 수단 및 방법에 관한 것이다. 표적 단백질의 발현을 감소시키거나 제거하기 위해 사용될 수 있는 변형은 표적 유전자를 코딩하는 전체 유전자 또는 유전자의 일부를 결실시키는 것, 단백질이 더 낮은 수준으로 발현되거나 발현되지 않도록 DNA 단편을 표적 유전자 내로 (프로모터 또는 코딩 영역에서) 삽입하는 것, 기능성 단백질이 발현되지 않도록 정지 코돈 또는 프레임 시프트를 추가하는 표적 코딩 영역에 돌연변이를 도입하는 것, 및 비기능성 표적 단백질 또는 감소된 효소 활성을 가진 표적 단백질이 발현되도록 아미노산을 변경시키기 위해 하나 이상의 돌연변이를 표적 코딩 영역으로 도입하는 것을 포함하나, 이에 제한되지는 않는 파괴이다. 게다가, 안티센스 RNA 또는 간섭 RNA의 발현에 의해 표적 유전자의 발현이 차단될 수 있고, 공동-억제를 결과하는 구축물이 도입될 수 있다. 게다가, 그의 발현이 낮을 표적 코딩 서열이 합성될 수 있는데 그 이유는 희귀 코돈이 다수의 코돈으로 대체되기 때문이며, 이는 이러한 차선의 선형 코딩 서열이 상응하는 내인성 표적 코딩 서열로 대체되는 경우이다. 바람직하게는, 이러한 차선의 코딩 서열은 0.5, 0.4, 0.3, 0.2 또는 0.1 미만의 코돈 적응 지수 (상기 참조)를 가질 것이다. 이러한 차선의 코딩 서열은 비효율적인 번역으로 인해 더 낮은 속도로 생산되는 것을 제외하고 동일한 폴리펩티드를 생산할 것이다. 게다가, 전사체의 합성 또는 안정성은 돌연변이에 의해 감소될 수 있다. 유사하게, 단백질이 mRNA로부터 번역되는 효율은, 예를 들어 차선의 번역 개시 코돈을 사용함으로써, 돌연변이에 의해 조절될 수 있다. 이들 방법 모두는 표적 단백질을 코딩하는 서열을 이용하는 관련 기술분야의 통상의 기술자에 의해 용이하게 실시될 수 있다.
특히, 표적 코딩 서열을 둘러싼 게놈 DNA 서열은 상동 재조합을 사용하는 변형 방법에 유용하다. 예를 들어, 이 방법에서 표적 유전자 플랭킹 서열은 선택 가능한 마커 유전자의 양쪽 어느 한 부위에 위치하여 상동 재조합을 매개함으로써 마커 유전자가 표적 유전자를 대체한다. 또한, 선택 가능한 마커 유전자에 결합하는 부분적 표적 유전자 서열 및 표적 유전자 플랭킹 서열을 사용하여 상동 재조합을 매개하여 마커 유전자가 표적 유전자의 일부를 대체할 수 있다. 게다가, 불활성화 구축물 중의 선택 가능한 마커는 예를 들어 EP 0 635 574에 기재된 바와 같은 상동 재조합을 사용하거나, 문헌 [Gldener et al. (1996, Nucleic Acids Res. 24:2519-2524)]에 기재된 바와 같은 Cre-lox 시스템을 사용하여, 일단 숙주 세포의 게놈에서 통합되면, 불활성화 구축물 발현 구축물/벡터로부터 마커의 절제를 허용하도록 하는 방식으로 구성될 수 있다.
표적 유전자의 결실은 또한 문헌 [Wach et al. (1994, Yeast 10:1793-1808)]에 기재된 바와 같이 유사분열 재조합을 사용하여 수행될 수 있다. 이 방법은 20 bp 만큼 짧을 수 있으며, 표적 DNA 서열을 결합하는, 즉 측면에 있는 게놈 영역들 사이에 선택 가능한 마커를 함유하는 DNA 단편을 제조하는 것을 수반한다. 이 DNA 단편은 마커 유전자의 말단에 하이브리드화하고 진균 게놈과 재조합할 수 있는 게놈 영역을 포함하는 올리고뉴클레오티드를 프라이머로서 사용하여 선택 가능한 마커 유전자의 PCR 증폭에 의해 제조될 수 있다. 선형 DNA 단편은 효모 또는 사상균으로 효율적으로 형질전환되고 게놈으로 재조합되어 표적 DNA 서열의 결실을 포함하여 유전자 대체를 결과할 수 있다 (문헌 [Methods in Enzymology, 1991, v 194, pp 281-301]에 기재된 바와 같이). 게다가, 프로모터 대체 방법을 사용하여 내인성 전사 제어 요소를 교환할 수 있어서 문헌 [Mnaimneh et al. (2004, Cell 118(1):31-44)] 및 본원의 실시예에 기재된 바와 같이 또 다른 수단이 발현을 조절할 수 있게 한다.
게다가, 임의의 세포에서 표적 단백질 또는 유전자의 활성은 무작위 돌연변이유발을 사용하여 파괴될 수 있고, 그 후 스크리닝하여 표적 단백질의 활성이 감소된 균주를 확인할 수 있다. 이러한 유형의 방법을 사용하여, 표적 단백질, 또는 표적 단백질의 발현에 영향을 미치는 게놈의 임의의 다른 영역을 코딩하는 DNA 서열은 심지어 알 필요가 없다. 유전자 돌연변이를 생성하는 방법은 통상적이며 관련 기술분야에 널리 공지되어 있으며 돌연변이체를 생성하는 수행에 적용될 수 있다. 통상적으로 사용되는 무작위 유전자 변형 방법 (문헌 [Methods in Yeast Genetics, 2005, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.]에서 검토됨)은 자발적 돌연변이유발, 돌연변이유발 유전자(mutator gene)에 의한 돌연변이유발, 화학적 돌연변이유발, UV 또는 X-선에 의한 방사선조사, 또는 트랜스포손 돌연변이유발을 포함한다.
진균의 화학적 돌연변이유발은 통상적으로로 하기 DNA 돌연변이원 중 하나로의 세포의 처리를 수반한다: 에틸 메탄술포네이트 (EMS), 아질산, 디에틸 술페이트, 또는 N-메틸-N'-니트로-N-니트로소-구아니딘 (MNNG). 이들 돌연변이유발 방법은 문헌 [Spencer et al (Mutagenesis in Yeast, 1996, Yeast Protocols: Methods in Cell and Molecular Biology. Humana Press, Totowa, N.J.)]에서 검토되었다. EMS를 이용한 화학적 돌연변이유발은 문헌 [Methods in Yeast Genetics,, 2005, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y]의 기재된 바와 같이 수행될 수 있다. 자외선 (UV) 광 또는 X-선에 의한 방사선조사를 또한 사용하여 효모 세포에서 무작위 돌연변이유발을 초래할 수 있다. UV에 의한 돌연변이유발의 주요 효과는 DNA 복제의 충실도를 파괴하는 피리미딘 이량체의 형성이다. 효모의 UV-돌연변이유발에 대한 프로토콜은 문헌 [Spencer et al (Mutagenesis in Yeast, 1996, Yeast Protocols: Methods in Cell and Molecular Biology. Humana Press, Totowa, N.J.)]에서 찾을 수 있다. 돌연변이유발 표현형의 도입을 또한 사용하여 효모에서 무작위 염색체 돌연변이를 생성할 수 있다. 통상적인 돌연변이유발 표현형은 하기 유전자 중 하나 이상의 파괴를 통해 수득될 수 있다: PMS1, MAG1, RAD18 또는 RAD51 또는 에스. 세레비지아에 이외의 진균에서 그의 병렬상동체. 비-돌연변이유발 표현형의 복원은 야생형 대립유전자의 삽입에 의해 용이하게 수득될 수 있다. 이들 또는 다른 공지된 무작위 돌연변이유발 과정 중 어느 하나로부터 생성된 변형 된 세포의 수집은 표적 단백질의 감소된 활성에 대해 스크리닝될 수 있다 (US20090305363).
푸란계 화합물의 산화 방법
추가 측면에서, 본 발명은 푸란계 화합물을 산화시키는 방법에 관한 것이다. 특히, 본 발명은 FDCA의 푸란 전구체가 산화되는 방법에 관한 것이다. 본 발명의 방법은 생성물을 결과하는 단일 산화 반응 단계 (예를 들어, HMFCA의 FFCA로의 산화)를 포함할 수 있다. 대안적으로, 본 발명의 방법은 하나 초과의 산화 반응 단계를 포함할 수 있으며, 각각의 단계는 중간체를 결과하고, 여기서 최종 중간체는 최종 생성물이다. HMF가 순차적 산화 단계에서 FDCA로 산화되는 이러한 일련의 단계의 예는 예를 들어 다음을 포함한다: 1) HMF가 먼저 HMFCA로 산화되고, 이는 제2 단계에서 FFCA로 산화된 다음에, 최종적으로 FDCA로 산화되거나, 대안적으로 문헌 [Dijkman et al. (2014, Angew. Chem. 53 (2014) 6515-8)]에 기재된 바와 같이 2) HMF는 먼저 DFF로 산화되고, 이는 제2 단계에서 FFCA로 산화된 다음에, 최종적으로 FDCA로 산화된다. 따라서, 본 발명의 바람직한 방법에서, FDCA의 하나 이상의 푸란계 전구체는 일련의 단계에서 궁극적으로는 FDCA로 산화된다.
한 실시양태에서, 본 발명은 HMFCA의 FFCA로의 적어도 산화를 포함하는 방법에 관한 것이다. 바람직하게는, 방법은 세포를 HMFCA의 존재하에, 인큐베이션하는 단계를 포함하는, HMFCA를 FFCA로 산화시키는 방법이다. 세포는 바람직하게는 HMFCA를 FFCA로 산화시키는 능력을 갖는 효소를 발현하는 세포이다. 세포는 HMFCA를 FFCA로 산화시키는 능력을 갖도록 유전자 변형되는 세포이다. 바람직한 실시양태에서, 세포는 본원에서 상기에 정의된 바와 같이 유전자 변형된 진균 세포이다. 바람직하게는 세포는, 예를 들어 하기에 특정된 바와 같이, 세포에 의한 HMFCA의 산화에 도움이 되는 조건하에 HMFCA의 존재하에 인큐베이션된다.
또 다른 실시양태에서, 본 발명은 FDCA를 제조하는 방법에 관한 것이다. FDCA를 제조하는 방법은 바람직하게는 세포를 FDCA의 하나 이상의 푸란계 전구체를 포함하는 배지에서 인큐베이션하는 단계를 포함한다. 세포는 바람직하게는 FDCA의 푸란 전구체를 FDCA로 전환시키는 능력을 갖는 하나 이상의 효소를 발현하는 세포이다. FDCA의 푸란계 전구체를 FDCA로 전환시키는 능력을 가진 효소는 예시된 진균 효소를 포함하는, 상기 기재된 바와 같이 알콜 및/또는 알데히드 데히드로게나제 활성을 갖는 효소일 수 있다. 따라서, 바람직한 실시양태에서, 세포는, 본원에서 상기에 정의된 바와 같이, 유전자 변형된 진균 세포이다.
바람직하게는 세포는, 예를 들어 하기에 특정된 바와 같이, 세포에 의한 FDCA의 푸란계 전구체의 FDCA로의 산화에 도움이 되는 조건하에 FDCA의 하나 이상의 푸란계 전구체의 존재하에 인큐베이션된다.
바람직하게는 상기 방법에서, FDCA의 적어도 하나의 푸란계 전구체는 HMF, DHF, HMFCA, FFCA 및 DFF로 이루어진 군으로부터 선택되며, 이 중 HMF가 가장 바람직하다. FDCA의 푸란계 전구체는 바람직하게는 하나 이상의 헥소스 당으로부터, 바람직하게는 산-촉매화된 탈수에 의해, 예를 들어 통상적인 방식으로 산의 존재하에 가열함으로써 수득된다. 프럭토스로부터 HMF를 생성하는 기술은 널리 확립되고 강력하다 (예를 들어 문헌 [van Putten et al., 2013, Chem. Rev. 113, 1499-1597] 참조). 또한, 글루코스-풍부 공급원료가 이용될 수 있으나, HMF의 열화학 형성은 프럭토스로부터 보다 효율적으로 진행된다. 따라서, 글루코스 이소머라제를 사용하여, 글루코스를 프럭토스로 전환시키기 위해 추가의 효소 단계가 포함될 수 있다. 후자의 방법은, 예를 들어 가수분해 전분으로부터 고프럭토스 옥수수 시럽 (HFCS)을 제조하기 위한 식품 산업에서 널리 확립되어 있다. 글루코스는 또한 예를 들어 문헌 [van Putten et al. (2013, 상기)]에 기재된 바와 같이 촉매 및 용매의 조합을 사용하여 프럭토스로 화학적으로 이성질체화될 수 있다.
헥소스 당은 대개 바이오매스로부터 수득될 수 있다. 용어 "바이오매스"는 농업 (식물성 물질, 예컨대 농작물 잔류물, 및 동물성 물질 포함), 임업 (예컨대, 목재 자원) 및 어업 및 양식업을 포함한 관련 산업으로부터의 생물학적 기원의 산물, 폐기물 및 잔류물의 생물학적 분획, 뿐만 아니라 산업 및 도시 폐기물, 예컨대 도시의 고형 폐기물 또는 폐지의 생분해성 분획을 의미하는 것으로 이해된다. 바람직한 실시양태에서, 바이오매스는 식물 바이오매스, 더 바람직하게는 (발효성) 헥소스/글루코스/당-풍부 바이오매스, 예컨대 예를 들어 사탕수수, 전분-함유 바이오매스, 예를 들어 밀 곡물, 또는 옥수수 짚, 또는 심지어 시리얼 그레인, 예컨대 옥수수, 밀, 보리 또는 그의 혼합물이다. 프럭탄이 자연적으로 풍부한 농작물 (예를 들어, 식물돼지감자(topinambur) 또는 치커리 뿌리)이 바람직하다.
헥소스 당은 이러한 바이오매스의 가수분해에 의해 수득될 수 있다. 바이오 매스의 가수분해 방법은 그 자체가 관련 기술분야에 공지되어 있으며 예를 들어 증기 및/또는 카르보히드라제 예컨대 글루코아밀라제의 사용을 포함한다.
본 발명의 방법에서 사용하기 위한 또 다른 바람직한 유형의 바이오매스는 소위 "제2 세대" 리그노셀룰로스 공급원료이며, 이는 큰 부피의 FDCA가 더 지속가능한 방식으로 생성되는 경우에 바람직하다. 리그노셀룰로스 공급원료는 전용 에너지 작물, 예를 들어 한계 지대에서 재배되어, 식량 작물과 직접 경쟁하지 않는다. 또는 리그노셀룰로스 공급 원료는 부산물, 예를 들어 도시의 고형 폐기물, 폐지, 목재 잔류물 (제재소 및 제지 공정 폐기물 포함)로서 수득될 수 있으며 농작물 잔류물을 고려될 수 있다. 농작물 잔류물의 예는 사탕수수로부터의 버개스 및 또한 여러 옥수수 및 밀 폐기물을 포함한다. 옥수수 부산물의 경우에, 세 가지 폐기물은 섬유, 옥수수속(cobs) 및 스토버(stover)이다. 더욱이, 임업 바이오매스는 공급원료로서 사용될 수 있다. 2 세대 공급원료를 본 발명의 발효 생성물로 전환시키기 위해, 셀룰로스 및 헤미셀룰로오스는 모노사카라이드로서 방출될 필요가 있다. 여기에, 열화학적 접근법 (대개 전처리로 칭함), 효소적 접근법 또는 상기 두 방법론의 조합이 적용된다. 전처리는 당류를 완전히 유리시키거나, 중합체 화합물을 후속 효소적 공격에 더 접근 가능하게 하는 역할을 할 수 있다. 상이한 유형의 전처리는 액체 온수, 증기 폭발, 산 전처리, 알칼리 전처리, 및 이온성 액체 전처리를 포함한다. 다양한 화합물의 상대적인 양은 사용된 공급원료 및 이용된 사용된 전처리에 의존할 것이다. 이러한 리그노셀룰로스 공급원료로부터 모노사카라이드 당류의 방출을 위해, 예를 들어 아라비나제, 크실라나제, 글루카나제, 아밀라제, 셀룰라제, 글루카나제 등을 포함한, 적절한 카르보히드라제가 이용된다.
본 발명의 산화 방법은 바람직하게는 세포에 가장 최적인 온도에서 수행되고/거나 함유된 옥시도리덕타제 효소는 세포이다. 따라서, 호열성 세포 및/또는 호열성 효소의 경우에, 온도는 바람직하게는 40 내지 65℃의 범위, 예를 들어 적어도 40, 42 또는 45℃ 및/또는 예를 들어 65, 60, 55 또는 50℃ 이하이다. 그러나, 중온성 세포 및/또는 중온성균으로부터의 효소의 경우에, 산화 반응은 바람직하게는 비교적 온화한 온도, 예를 들어 예를 들어 10 내지 45℃, 더 바람직하게는 20 내지 40℃의 범위에서, 예를 들어 적어도 10, 15, 18, 20, 22 또는 25℃ 및/또는 예를 들어 45, 42, 40, 38, 35, 32 또는 30℃ 이하에서 수행된다.
본 발명의 산화 공정은 바람직하게는 산성 pH에서 수행된다. 다운스트림 프로세싱 (DSP), 즉 회수 및 정제는 임의의 생명공학적 공정에서 그러나 특히 단량체의 순도가 제어된 중합체 형성에서 필수적이기 때문에 중합제 제조를 위한 단량체 화합물의 제조에서 일반적인 관심사이다. FDCA는 3 미만의 pH 값에서 매우 제한된 용해도를 갖는다 (약 2.28의 pKa를 가짐). 공정이 산성 pH에서 수행되는 경우, 생성된 FDCA는 그것이 생성되는 배지로부터, 바람직하게는 이미 그의 생산 동안에 침전되어, 회수를 크게 촉진시킬 것이다. 따라서 바람직하게는, 본 발명의 방법에서, 세포, 바람직하게는 진균 세포는 하나 이상의 푸란계의 존재하에 5.0, 4.0, 3.0, 2.9, 2.8, 2.7, 2.6, 2.5 또는 2.4 이하의 pH에서, 그리고 바람직하게는 2.0, 2.1, 2.2 또는 2.25, 2.27 또는 2.28 이상의 pH에서 인큐베이션된다. 바람직하게는, 본 발명의 방법에서, 이 범위의 pH에 대해 높은 내성을 갖는 세포, 바람직하게는 진균 숙주 세포가 선택된다. 산성 pH에서 공정을 수행하는 추가적 이점은 거의 모든 박테리아가 낮은 pH에서 악영향을 받기 때문에 공정의 미생물 오염이 문제가 덜 될 것이라는 점이다. 효모 및 진균은 감염원으로서 박테리아와 비교하여 문제가 덜 되며 다루기가 비교적 용이할 것이다.
반응 시간은 6 내지 150시간, 더 바람직하게는 6 내지 18시간일 수 있다. 바람직하게는 산소는 예를 들어 순수 산소로서 또는 공기, 또는 물 중의, 산소 공급원, 예컨대 분자 산소, 또는 푸란계 산화 효소의 요건에 따라 달라지는 다른 산소 공급원으로부터 반응 배지의 세포에 공급된다. 공기가 분자 산소의 공급원으로서 편리하게 사용될 수 있다.
반응기는 임의의 적합한 (통기의) 생물반응기일 수 있다. 이는 배치식, 연속식 또는 바람직하게는 유가식(fed-batch)으로 작동될 수 있다.
본 발명의 방법은 추가로 바람직하게는 FDCA 또는 HMFCA와 같이, 공정에서 생성된 산화 생성물(들)을 회수하는 단계를 포함한다. 바람직하게는, 산화 생성물은 산화 단계를 수행하는 세포가 인큐베이션되는 배지로부터 회수된다. FDCA, HMFCA 등과 같은 산화 생성물은, 예를 들어 (산) 침전, 후속 냉각 결정화, 및 결정화된 산화 생성물, 예를 들어 결정화된 FDCA의 분리에 의해 반응 혼합물 또는 매질로부터 회수될 수 있다. 그러나, 다른 회복 방법, 예를 들어 관련 기술분야에 공지된 바와 같은, 예컨대 예를 들어 산 침전 및 용매 추출이 적합하다.
푸란계 화합물을 산화시키기 위한 본 발명의 방법은 유리하게는, 푸란계 화합물이 유해한 것으로 간주되는 공급원료, 예컨대 바이오연료 및 생화학물질의 제조를 위한 발효를 위한 공급원료로부터 푸란계 화합물을 제거하기 위해 적용될 수 있다. 더 바람직하게는, 푸란계 화합물을 산화시키는 방법은 폴리에스테르 (플라스틱)의 제조를 위한 단량체 전구체로서 FDCA의 생체제조에 적용되며, 여기서 FDCA는 폴리에스테르 PET에서 PTA를 대체할 수 있으며, 이 경우에 생체기반 폴리에틸렌푸란디카르복실레이트 (PEF)를 결과한다. FDCA는 예를 들어 숙신산, 2,5-비스(아미노메틸)-테트라히드로푸란, 2,5-디히드록시메틸-테트라히드로푸란, 2,5-디히드록시메틸푸란 및 2,5-푸란디카르브알데히드의 제조를 위한 기질로서를 포함한, 매우 다양한 귀중한 화합물을 위한 기질로서 또한 사용될 수 있다. FDCA는 예를 들어 알키드 수지에서의 코팅 및 열가소성 코팅의 제조에서 사용될 수 있다. 이는 바이오연료에서 크실렌 등가물로서 및 용매로서 또한 사용될 수 있다. FDCA는 에스테르 화될 수 있고, 에스테르는 가소제로서 사용될 수 있다. FDCA는 그의 디올로 전환될 수 있으며, 이는 PET-유사 폴리에스테르 및 폴리우레탄에서 사용될 수 있다. 추가의 FDCA는 그의 디아민으로 전환될 수 있고, 디아민은 사슬 연장 제로서 사용될 수 있고 디아민은 디이소시아네이트로 전환될 수 있으며, 이는 폴리우레탄의 제조에서 사용될 수 있다.
따라서, 추가 측면에서 본 발명은, a) 상기 정의된 바와 같은 본 발명의 산화 공정으로 FDCA 단량체를 제조하는 단계; 및, b) a)에서 수득된 FDCA 단량체(들)로부터 중합체를 제조하는 단계를 포함하는, 하나 이상의, 또는 적어도 2개의 FDCA 단량체로부터 중합체를 제조하는 방법에 관한 것이다. 바람직한 방법에서, 중합체는 FDCA 단량체와 하나 이상의 유형의 디올 단량체를 혼합하고 FDCA 단량체와 디올 단량체가 중합되는 조건하에 상기 혼합물을 가져옴으로써 제조된다. 따라서, 중합은 에스테르화 또는 에스테르교환 반응일 수 있으며, 둘 다 (중)축합 반응으로도 지칭된다. 디올 단량체는 방향족, 지방족 또는 지환족 디올, 예를 들어 알킬렌 글리콜일 수 있다. 따라서 적합한 디올 및 폴리올 단량체의 예는 에틸렌 글리콜, 디에틸렌 글리콜, 1,2-프로판디올, 1,3-프로판디올, 1,4-부탄디올, 1,5-펜탄디올, 1,6-헥산디올, 1,4-시클로헥산디메탄올, 1,1,3,3-테트라메틸시클로부탄디올, 1,4-벤젠디메탄올, 2,2-디메틸-1,3-프로판디올, 폴리(에틸렌 글리콜), 폴리(테트라히드로푸란), 2,5-디(히드록시메틸)테트라히드로푸란, 이소소르비드, 글리세롤, 25 펜타에리트리톨, 소르비톨, 만니톨, 에리트리톨, 트레이톨을 포함한다. 에틸렌 글리콜, 1,3-프로판디올, 1,4-부탄디올, 1,4-시클로헥산디메탄올, 1,6-헥산디올, 2,2-디메틸-1,3-프로판디올,폴리(에틸렌 글리콜), 폴리(테트라히드로푸란), 글리세롤, 및 펜타에리트리톨이 바람직한 디올이다. 에틸렌 글리콜은 특히 바람직하다. 에틸렌 글리콜 (모노에틸렌 글리콜--MEG)은 바람직하게는 생체공급된다. 예를 들어 생체공급된 MEG는, 전분, 셀룰로스 또는 헤미셀룰로오스의 가수분해에 의해 농작물 또는 농업 부산물, 산림 부산물 또는 고형 도시 폐기물로부터 수득될 수 있는 당류 (예를 들어 글루코스, 프럭토스, 크실로스)로부터의 발효에 의해 또한 제조될 수 있는 에탄올로부터 수득될 수 있다. 대안적으로, 생체공급된 MEG는 글리세롤로부터 수득될 수 있으며, 그 자체는 바이오디젤로부터의 폐기물로서 수들될 수 있다. 바람직하게는 중합체는 폴리에틸렌푸란디카르복실레이트 (PEF)이다.
중합체는 FDCA 및/또는 알킬렌 글리콜 단량체 예컨대 다른 이산 단량체, 예를 들어 디카르복실산 또는 폴리카르복실산, 예를 들어 테레프탈산, 이소프탈산, 시클로헥산 디카르복실산, 말레산, 숙신산, 1,3,5-벤젠트리카르복실산과 상이한 구조를 갖는 (소량)의 다른 반응성 단량체를 또한 함유할 수 있다. 락톤은 또한 2,5-푸란디카르복실레이트 에스테르: 피발로락톤, 엡실론-카프로락톤 및 락티드 (L,L; D,D; D,L)와 함께 또한 사용될 수 있다. 비록 본 발명의 가장 바람직한 실시 양태가 아니더라도, 중합체는, 다관능성 단량체 (분자당 2개 초과의 산 또는 히드록실 관능기), 산 및/또는 히드록실 단량체 중 어느 하나, 예를 들어 다관능성 방향족, 지방족 또는 지환족 폴리올, 또는 다산의 사용 때문에, 비 선형, 분지형일 수 있다. 한 실시양태에서, 중합체 중 알킬렌 글리콜은 알킬렌 디아민에 의해 부분적으로 또는 완전히 대체된다.
또 다른 하나의 측면에서, 본 발명은 푸란계 전구체 중 하나 이상의 FDCA로의 생체형질전환을 위한 세포, 바람직하게는 본 발명의 세포의 용도로서, 여기서 세포가 본원에서 상기 정의된 바와 같은 HMFCA 데히드로게나제를 발현하는 세포, 또는 푸란계 화합물 수송 능력을 가지며 본원에서 상기 정의된 바와 같은 HMFCA 데히드로게나제 활성을 추가로 포함하는 폴리펩티드를 발현하는 세포인, 세포의 용도에 관한 것이다. 바람직하게는, FDCA로 형질전환되는 FDCA의 적어도 하나의 푸란계 전구체는 HMF, DHF, HMFCA, FFCA 및 DFF로 이루어진 군으로부터 선택되며, 이 중 HMF가 가장 바람직하다.
본 문서 및 그의 청구범위에서, 동사 "포함하는" 및 그의 활용은 상기 단어를 따르는 항목이 포함되나, 구체적으로 언급되지 않은 항목은 배제되지 않음을 의미하는 그의 비제한적인 의미로 사용된다. 게다가, 부정 관사 "a" 또는 "an"에 의한 요소에 대한 언급은 문맥상 요소 하나 그리고 단지 하나의 요소가 존재하도록 요구하지 않는 한, 하나 초과의 요소가 존재할 가능성을 배제하지 않는다. 부정 관사 "a" 또는 "an"은 대개 "적어도 하나"를 의미한다.
본 명세서에 인용된 모든 특허 및 문헌 참고 문헌은 그 전문이 본원에 참조로 포함된다.
하기 실시예는 단지 예시적 목적으로 제공되며, 본 발명의 범위를 어떠한 방식으로도 제한하려는 것은 아니다.
[표 1]
페니실리움 브라실리아눔 hmfL1 및 10개의 가장 가까운 병렬상동체의 아미노산 서열 정렬.
[표 2]
페니실리움 브라실리아눔 hmfL2 및 10개의 가장 가까운 병렬상동체의 아미노산 서열 정렬.
[표 3]
페니실리움 브라실리아눔 hmfN1 및 10개의 가장 가까운 병렬상동체의 아미노산 서열 정렬.
[표 4]
페니실리움 브라실리아눔 hmfK1 및 10개의 가장 가까운 병렬상동체의 아미노산 서열 정렬.
[표 5]
페니실리움 브라실리아눔 hmfM 및 10개의 가장 가까운 병렬상동체의 아미노산 서열 정렬.
[표 6]
페니실리움 브라실리아눔 hmfT3 및 10개의 가장 가까운 병렬상동체의 아미노산 서열 정렬.
[표 7]
페니실리움 브라실리아눔 hmfT4 및 10개의 가장 가까운 병렬상동체의 아미노산 서열 정렬.
[표 8]
페니실리움 브라실리아눔 hmfT5 및 10개의 가장 가까운 병렬상동체의 아미노산 서열 정렬.
[표 9]
페니실리움 브라실리아눔 hmfT6 및 10개의 가장 가까운 병렬상동체의 아미노산 서열 정렬.
[표 10]
페니실리움 브라실리아눔 hmfT7 및 10개의 가장 가까운 병렬상동체의 아미노산 서열 정렬.
[표 11]
페니실리움 브라실리아눔 hmfR 및 10개의 가장 가까운 병렬상동체의 아미노산 서열 정렬.
[표 1A]
[표 2A]
[표 3A]
[표 4A]
[표 5A]
[표 6A]
[표 7A]
[표 8A]
[표 9A]
[표 10A]
[표 11A]
[도면의 간단한 설명]
도 1. hygB 및 phleo 항생제 마커를 각각 사용하여, hmfK1 (상단) 및 hmfK3 (하단) 결실을 생성하기 위한 스플리트 마커 접근법.
도 2. 250 rpm에서 진탕 플라스크에서 30℃에서 5 mM 글루코스 및 6 mM HMF가 보충된 최소 배지에서 성장시킨, 야생형 피. 브라질리아눔 C1 (A) 및 피. 브라질리아눔 C1 파괴 돌연변이체 균주 ΔhmfK1 #26 (B), ΔhmfK1 #30 (C) 및 ΔhmfK3 #43 (D)의 배양액의 상청액에서 측정된 HMF, FDCA 및 중간체의 농도.
도 3. 250 rpm에서 진탕 플라스크에서 30℃에서 5 mM 시트레이트 및 6 mM HMF가 보충된 최소 배지에서 성장시킨, 야생형 피. 브라실리아눔 C1 (A), 및 피. 브라실리아눔 C1 파괴 돌연변이체 균주 ΔhmfK1 #26 (B), ΔhmfK1 #30 (C) 및 ΔhmfK3 #43 (D)의 배양액의 상청액에서 측정된 HMF, FDCA 및 중간체의 농도. 4일 후, #26 및 #30의 글루코스 함유 배양액의 ~ 1%를 사용하여 시트레이트 함유 플라스크를 재접종하였다.
실시예
도입
동시 계류중인 국제 출원 PCT/EP2016/072406에서, 본 발명자들은 페니실리움 브라실리아눔 균주의 네덜란드 토양으로부터의 단리를 기재하였다. 출원 PCT/EP2016/072406에서 피. 브라실리아눔 C1으로 지칭되는, 이러한 피. 브라실리아눔은 FDCA의 전구체인 HMF 상에서 성장 선택에 의해 단리되었다. 여기서, 피. 브라실리아눔 C1 균주는 야생형 (WT) WT 피. 브라실리아눔 균주 또는 WT 균주로 지칭될 것이다. 국제 출원 PCT/EP2016/072406은 피. 브라실리아눔 C1의 게놈의 서열분석 및 주석, 뿐만 아니라 HMF 및 시트르산 상에서 성장시킨 균주의 전사체의 서열분석을 기재한다. 공개 데이터베이스에 대한 게놈 주석 및 블래스팅 유전자뿐만 아니라 차등 발현 RNA-서열분석 결과에 기초하여, 살리실레이트 히드록실라제 hmfK1, 2개의 알콜 데히드로게나제 hmfL1 및 hmfL2 및 살리실알데히드 데히드로게나제 hmfN1을 포함하는, 푸로산으로의 제안된 HMF를 통한 푸로산으로의 (FDCA를 통한) 피. 브라실리아눔 C1에 의한 HMF의 이화작용에 관여하는 효소를 코딩하는데 관여하는 후보 유전자의 목록이 작성되었다. 슈도모나스 균주에서의 이종 발현에 의해, PCT/EP2016/072406의 실시예는 피. 브라실리아눔 hmfK1 히드록실라제가 실제로 FDCA 상에서 탈카르복실화 모노옥시게나제로서 작용하여 피. 브라실리아눔에서 FDCA의 분해에 관여함을 나타낸다. 더욱이, 피. 브라실리아눔 hmfL1 및 hmfL2 알콜 데히드로게나제 및 피. 브라실리아눔 hmfN1 살리실알데히드 데히드로게나제의 효모에서 이종 발현에 의해, PCT/EP2016/072406의 실시예는 이들 효소가 실제로 HMF를 FDCA로 효율적으로 산화시키는 능력을 갖고 있음을 나타낸다.
피. 브라실리아눔 hmfK1, hmfL1, hmfL2 및 hmfN1 유전자에 더하여, PCT/EP2016/072406의 실시예는 표 12에 열거된, 피. 브라실리아눔에서 HMF의 이화작용에 관여하는 단백질 또는 효소를 코딩하는 다수의 추가 유전자를 기재하였다.
[표 12]
실시예 1: hmfK1 결실 시도 및 hmfK3의 확인
nia1 선택 마커를 사용하여 제1 살리실레이트 히드록실라제 유전자 hmfK1을 결실시키려는 초기 시도가 이루어졌다. 비록 진단 PCR이 hmfK1의 결실을 확인하긴 했지만, RNAseq 분석은 hmfK1이 여전히 발현됨을 나타냈으며, 이는 결실이 성공적이지 않았음을 나타내는 것이다. 흥미롭게도, 분석된 추정된 돌연변이체 균주에서 또 다른 하나의 살리실레이트 히드록실라제, hmfK3 (서열번호: 24에 의해 코딩된 서열번호: 23)은 상향조절되었으며, 이는 PCT/EP2016/072406의 실시예에서 상향조절되는 것으로 확인되지 않았다. 추정된 hmfK1 결실 형질전환체를 다음에 보다 상세하게 분석하였다. 이 분석으로부터, 본 발명자들은 두 hmfK1 결실 형질전환체가 모두가 정확하지 않다는 결론을 내렸다. 아마도 결실 구축물이 다른 부위 (들)에서, 가능하게는 hmfK1의 상류로/하류로 및/또는 nia1 유전자 자체에서 (두 돌연변이체 모두에서 상이한) 통합되었을 것이다.
실시예 2: RNAseq 데이터의 평가
본 발명자들은 시트레이트 상에서 성장시킨 항성분배양조 배양액으로부터 WT 및 추정된 hmfK1 결실 형질전환체 ΔSH #2E4 (이는 올바른 hmfK1 결실을 갖지 않는 것으로 밝혀짐)로부터 RNAseq 데이터를 수득한 다음에 시트레이트를 HMF에 의해 대체하였다. FDCA를 통한 HMF의 분해에 관여할 수 있는 유전자 세트가 확인되었다. hmfK1 유전자는 WT 균주에서 HMF-공급된 배양에서 가장 강한 유도를 나타낸 유전자였다. 다수의 HMF-유도된 유전자는 hmfK1과 동일한 콘티그 (번호 730)에 위치하며, 이는 HMF 분해 경로를 코딩하는 유전자 클러스터의 존재를 나타낸다. 상기에서 이미 논의한 바와 같이, hmfK1은 여전히 형질전환체 ΔSH #2E4에서 강하게 유도되었다. 게다가, 현재 hmfK3으로 칭해지는, hmfK1에 대해 상동성을 가진 제2 히드록실라제 유전자가, 이 형질전환체에서 유도되나, WT 균주에서는 유도되지 않는 것으로 밝혀졌다. WT 및 돌연변이체 배양액 둘 다에서 어떤 FDCA 축적도 관찰되지 않았기 때문에, 본 발명자들은 개선된 FCDA 균주 설계 (예를 들어, 분해 특이적 조절인자 유전자)에 대한 잠재적 대안적인 표적의 확인을 위해 이용 가능한 RNAseq RPKM 데이터를 재분석하였다.
데이터 재분석은 다음의 (log2) 비율에 집중되었다:
1. WT_HMF 대 WT_시트레이트
2. M_HMF 대 M_시트레이트
3. M_HMF 대 WT_HMF
4. M_Citr 대 WT_Citr
데이터는 먼저 "0" 및 "div0"의 비를 가진 유전자를 볼 수 있도록 플로어되었다(floored) (+2). 임의의 컷오프 값을 사용하여 유도된 유전자의 비슷한 양 (~100)을 얻기 위해 유전자를 선택하였다 (표 2 및 보충 엑셀 파일 참조).
돌연변이체 (WT와 비교하여) 배양에서, 많은 유전자 세트가 HMF 및 시트레이트 조건 둘 다에서 유사하게 유도되고 억제되었다. 이것은 이들 유전자의 유도/억제가 HMF 독립적이고 돌연변이체 및/또는 배양 특이적임을 시사한다. 살리실레이트 히드록실라제 hmfK3의 유도는 예외이다.
이전에 수득된 결과 (hmfK1, hmfK3, 알콜 데히드로게나제, 전사 활성인자, 락토나제 등의 유도)가 HMF-처리된 배양액에서 확인되었다. 살리실 관련 유전자 및 탈카르복실라제는 HMF에 의해 단지 유도되며 옥시도리덕타제는 HMF에 의해 주로 조절된다. HMF는 또한 주요 촉진자 수퍼패밀리 단백질을 코딩하는, g10375 (콘티그 570) 및 g5964 (콘티그_226)와 같은 다양한 수송체를 유도하였으며, 이는 HMF, 또는 그의 유도체를 세포 내외부로 수송하는데 역할을 할 수 있었다.
PCT/EP2016/072406의 실시예에서 이전에 확인되었고, 가능하게는 FDCA를 통한 HMF 분해에 관여하는 hmf 유전자의 BLAST 결과는 재평가되었다. 흥미로운 것은 hmfK1 (콘티그730) 주위의 HMF-유도된 유전자 클러스터가 진균의 제2 대사산물 클러스터와 분명한 유사성을 나타낸다는 점이다. 최고 동일성 (70%)은 스포로트릭스 쉔스키이 ATCC 58251에서 병렬상동체 유전자 클러스터로 발견되었다. 알콜 데히드로게나제를 코딩하는 hmfL1 유전자는 hmfK1 (콘티그 730)과 상이한 콘티그 (82)에 있다. 그러나, 에스 쉔스키이(S. schenckii)에서의 hmfL1 병렬상동체는 동일한 유전자 클러스터에 있다. 공개적으로 입수 가능한 피. 브라실리아눔 MG11 게놈 (Horn et al., 2015. Genome Announc 3(5):e00724-15. doi:10.1128/genomeA.00724-15; GenBank 수탁번호 CDHK01000001.1)에서 (hmfK1을 함유하는) hmf 유전자 클러스터는 hmfL1을 또한 포함한다. 따라서 본 발명자들은 콘티그 82 및 730이 서로 인접해 있다는 결론을 내린다.
hmf 유전자 클러스터 (콘티그 730 및 82)에서 데히드로게나제의 보조인자 의존성이 또한 조사되었다. 진균은 NADP보다 NAD를 재생성하는 더 높은 능력을 갖기 때문에, FDCA의 경제적으로 실행 가능한 제조를 위해 진균에서 보조인자로서 NAD가 바람직하다.
hmfL1을 사용한 BLAST 결과는 보조인자로서 NAD에 대한 선호도를 나타낸다. hmfN1을 사용한 BLAST 결과는 NAD 및 NADP 의존성을 구별하지 않는다. 그러나 hmfN1과 가장 잘 일치하는 것은 슈도모나스 균주 C18의 상부 나프탈렌 이화작용 경로에 관여하는 살리실알데히드 데히드로게나제 (DoxF, SaliADH, EC=1.2.1.65)를 사용한 경우이다. DoxF의 경우 NAD가 바람직한 보조인자로 보인다 .
RNAseq 데이터의 재평가 결과에 기초하여, 본 발명자들은 또한 살리실레이트 히드록실라제 hmfK1 및 두 번째로 hmfK3이 HMF를 FDCA로 산화시키나 제조된 FDCA를 분해시키지 않는 숙주 세포를 구축하기 위해 결실시킬 가장 좋은 초기 후보라는 결론을 내린다.
실시예 3: hmfK1 & hmfK3 단일 및 이중 돌연변이체 균주의 개발
유전자 결실 설계 및 합성
WT 피. 브라실리아눔 균주는 유전자 파괴에 대한 phleo 또는 hygB 항생제 선택 마커의 적합성을 확인하기 위해 플레오마이신 및 히그로마이신 민감성에 대해 시험되었다 (상기 참조). 유전자 결실 설계는 DDNA에 의해 수행되었으며 hmfK1 결실 돌연변이체에 대한 hygB 선택 마커 및 hmfK3 결실 돌연변이체에 대한 phleo 선택 마커를 사용하여 (도 1), 스플리트 마커 접근법에 기초한다 (Arentshorst et al., 2015, In: "Genetic Transformation Systems in Fungi", Volume 1. van den Berg M.A., Maruthachalam K., (eds). Switzerland: Springer International Publishing, pp. 263-272). 상동 재조합을 겪은 DNA 단편만이 무손상 항생제 선별 마커 유전자를 결과할 것이기 때문에, 스플리트 마커 접근법은 올바르지 않은 (hmfK1 또는 hmfK3이 아닌) 부위에서 통합 빈도를 감소시키기 위해 적용된다. 하나의 형질전환 실험에서 두 선택 마커 모두를 사용하여 hmfK1 hmfK3 이중 돌연변이체를 생성하려는 시도가 이루어졌다. 도 1에 개요된 바와 같은 유전자 파괴-단편의 합성은 진아트(GeneArt), 써모피셔 사이언티픽(ThermoFisher Scientific)에 아웃소싱하였다. 단편의 서열은 서열 목록 (서열번호: 30 내지 33)에 제공되어 있다.
형질전환 & 선택
형질전환을 수행하기 전에 WT 피. 브라실리아눔 균주에 대해 FDCA 분해 스크린을 설정하였다. WT 균주는 FDCA를 탄소원으로서 사용할 수 있다. 이를 행할 수없는 돌연변이체를 생성하는 것은 FDCA를 단독 C-공급원으로서 함유하는 배지 상에서는 성장시키지 않을 것이다. 이 검정은 올바른 hmfK1 (및 hmfK3) 결실 형질전환체에 대한 스크리닝을 용이하게 할 것이다 (이들 유전자의 결실이 FDCA 분해를 손상시킬 것이라고 가정).
1 리터의 탈염수당 하기를 함유하는, 코비온(Corbion) 최소 배지를 사용하였다: 2.0 g의 (NH4)2SO4, 0.1 g의 MgCl2 6H2O, 10 mg의 EDTA, 2 mg의 ZnSO4.7H20, 1 mg의 CaCl2. 2H2O, 5 mg의 FeSO4 7H2O, 0.2 mg의 Na2MoO4. 2H2O, 0.2 mg의 CuSO4 5H2O, 0.4 mg의 CoCl2 6H2O, 및 1 mg의 MnCl2 2H2O. 25 mM KH2PO4 및 25 mM NaH2PO4. 실험에 따라 하기 C-공급원 중 하나 이상을 첨가하였다: 0.2 g/l의 효모 추출물, 15 mM의 FDCA, 5 mM 글루코스, 5 mM 시트르산, 6 mM HMF. FDCA의 침전을 피하기 위해, FDCA를 단독 C-공급원으로서 사용한 경우를 제외하고, pH를 3.0으로 설정하였다.
WT 피. 브라실리아눔은 액체 배지 중에서뿐만 아니라 한천 플레이트 상 둘 다에서, 단독 C-공급원으로서 15 mM FDCA를 가진 코비온 최소 배지 상에서 성장할 수 있었다. 음성 대조군 (어떤 C-공급원도 없는 최소 배지)은 최소량의 배경 성장을 보였는데, 이는 한천 성분 상에서 성장하는 이 균주의 능력으로 인한 것임에 틀림없다. 이는 유익한 부작용인데, 그 이유는 형질전환체를 가진 스크린에서 이 배경 성장은 포자의 실제 이동을 긍정적으로 제어하기 때문이다. 본 발명자들은 FDCA를 가지나 YE가 없는, 즉 15 mM FDCA를 단독 C-공급원으로서 사용하여, 한천 플레이트 상에서 형질전환체 (하기 참조)를 처음에 스크리닝하기로 결정하였다 (더 명확한 결과 및 더 신속).
유전자 단편을 표준 DDNA 진균 형질전환 프로토콜을 사용하여 WT 피. 브라실리아눔 균주로 형질전환시켰다 (Punt and van den Hondel, 1992, Methods in Enzymol. 261:447-457). WT 균주의 원형질체를 단편으로 형질전환시켜 ΔhmfK1을 생성시키고 HygB를 함유하는 선택 플레이트 상에 플레이팅하였다. 게다가, WT 균주의 원형질체를 단편으로 형질전환시켜 ΔhmfK1 및 ΔhmfK3 둘 다를 생성시키고 HygB 단독, Phleo 단독, 및 HygB 및 Phleo 둘 다를 함유하는 선택 플레이트 상에 플레이팅하였다. 총, 48개의 1차 형질전환체가 다양한 선택 플레이트 상에서 생성되었다. 이들 1차 형질전환체는 단독 C-공급원으로서 FDCA를 함유하는 플레이트 상에서 성장이 없거나 감소된 성장에 기초하여 스크리닝되었다. 35개 중 17개의 (~50%) HygB+ (ΔhmfK1) 형질전환체는 플레이트 상에서 강한 표현형을 나타냈는데 (FDCA에서 성장하지 않음), 이는 FDCA 분해 경로가 무손상 hmfK1 유전자를 수반함을 시사한다. 잠재적인 ΔhmfK3 돌연변이체는 플레이트 상에서 어떤 표현형도 나타내지 않았다. 모든 형질전환체를 항생제 마커의 존재에 대해 추가로 시험하였다.
다음으로, 플레이트 상에서 표현형을 나타낸 17개의 HygB+ (ΔhmfK1) 클론 및 모든 hmfK1+hmfK3 형질전환체를 플레이트 상에서 정제하고 액체 매질 ± 15 mM FDCA (-YE) 중에서 시험하였다. 한천 플레이트 상에 강한 표현형을 나타내는 모든 ΔhmfK1 클론에 대해, 유일한 C-공급원으로서 FDCA를 가진 액체 배지 중에서 성장이 완전히 파괴되었다.
무손상과 올바르게 결실된 hmfK1 유전자를 구별하기 위해 상이한 hmfK1 결실 형질전환체로 진단 PCR 분석을 수행하였다. 상이한 프라이머 조합물을 시험하고 (표 13, 14 및 15 참조), 결과는 표현형을 나타내는 모든 hmfK1 클론 (FDCA 상에서 성장이 없음)이 올바르다는 것을 나타냈다 (데이터는 나타내지 않음). 반대로, hmfK1+hmfK3 형질전환체 #31 및 #33은 WT hmfK1 PCR 밴드를 여전히 생성시키는 표현형이 없음을 나타낸다. 올바른 hmfK3 결실에 대해 시험하기 위해 모든 hmfK1+hmfK3 형질전환체 상에 대해 진단 PCR 분석을 또한 수행하였다 (표 14 및 16 참조). 형질전환체 #43 (ΔhmfK1+ΔhmfK3; HygB+Phleo 선택)만이 PCR에 기초하여 올바른 hmfK3 결실을 갖는 것으로 밝혀졌다 (데이터는 나타내지 않음). 비록 이 형질전환체가 HygB 내성이긴 하지만, 이는 (PCR 결과에 기초하여) hmfK1 결실을 함유하지 않는다. 모든 정제된 hmfK1+hmfK3 형질전환체를 hmfK1 형질전환체와 유사하게 액체 배양액에서 또한 시험하였다. 형질전환체 #43 (올바른 hmfK3 결실)은 FDCA 상에서 성장하였다.
결과로부터 본 발명자들은 올바른 hmfK1 결실이 생성되었고 hmfK1 유전자의 결실이 시험된 조건하에 단독 C-공급원으로서 FDCA 상에서 성장하는 100% 불능을 결과한다는 결론을 내리며, 이는 hmfk1이 FDCA 분해의 핵심 유전자임을 확인해준다. 게다가, 본 발명자들은 hmfK3 결실이 1 클론 (#43)에서 올바르고 표현형을 나타내지 않는다는 결론을 내릴 수 있는데, 이는 hmfk3이 적어도 시험된 조건하에가 아닌, FDCA 분해에 관여하지 않음을 시사한다.
[표 13]
[표 14]
[표 15]
[표 16]
실시예 4: HMF의 전환 및 FDCA의 제조
다음으로 본 발명자들은 HMF의 전환 및 FDCA의 제조를 시간 맞춰 모니터링하는 실험을 설정하였다. 상기 결과로부터 WT 균주, 확인된 hmfK1 결실 #26 및 #30, 및 확인된 hmfK3 결실 #43을 선택하여 진탕 플라스크 배양에서 발효에 대해 분석하였다. 균주는 6 mM HMF가 보충된 5 mM 글루코스 또는 5 mM 시트레이트를 함유하는 효모 추출물이 없는 코비온 최소 배지에서 성장시켰다. 배양액을 7일 동안 성장시키고 1, 2, 3, 4 및 7일 후에 샘플을 수집하였다. 샘플로부터 상청액을 PCT/EP2016/072406의 실시예에 기재된 바와 같이 HPLC에 의해 HMF, FDCA 및 중간체에 대해 분석하였다.
모든 균주는 글루코스 함유 배지 상에서 잘 성장하였다. hmfK1 결실 균주 #26 및 #30은 시트레이트 함유 배지 상에서 유의하게 성장하지 않았다. 따라서, 4일째에, ~1%의, 글루코스 함유 배양액 (#26 및 #30의)을 사용하여 시트레이트 함유 플라스크 (=citr*)를 재접종하였다. 그러나, 이들 배양액에서 더 이상 어떠한 (분명한) 추가 성장도 관찰되지 않았다. hmfK3 결실 균주 #43은 WT 균주와 비슷한 시트레이트 함유 배지에서 성장하였다. 1주 후 pH를 측정하였다 (데이터는 나타내지 않음). 흥미롭게도, 1주 인큐베이션 후 hmfK1 결실 균주의 배양액의 pH는 두 배지 모두에서 WT 및 hmfK3 결실 균주 배양액의 pH보다 낮았으며, 이는 산 (FDCA) 생성을 나타낸다.
도 2 및 3은 각각 글루코스 또는 시트레이트 상에서 성장된 배양액의 HPLC 분석 결과를 나타낸다. 글루코스를 함유하는 배양액에서 즉각적인 HMF 전환이 관찰되었다. 샘플을 처음 분석한 경우에조차도 단지 낮은 미량의 HMF가 측정되었다. WT 및 ΔhmK3 배양액 둘 다에서, 모든 푸란 수준은 유사한 방식으로 매우 낮은 수준으로 강하되었고, 예상한 바와 같이, 어떤 FDCA 축적도 관찰되지 않았다 (도 2A 및 2D). 다른 한편으로는, 매우 재현가능한 FDCA 축적은 두 hmfK1 결실 균주 모두에서 측정되었다 (도 2B 및 2C). 7일 후에 HMF에서 FDCA로의 최대 60-70%의 전환에 도달하였다. HMF-산은 글루코스 상에서 성장한 hmfK1 결실 배양에서 관찰된 주요 일시적 중간체 화합물이었다.
시트레이트 함유 배양액에서, WT 및 hmK3 배양액 둘 다에서 어떤 FDCA 축적도 또한 측정되지 않았다 (도 3A 및 3D). 모든 푸란은 글루코스 함유 배양액에서보다 비록 느린 속도일지라도 시간이 지남에 따라 분해되었다. 비록 시트레이트 함유 배지에서 hmfK1 결실 #26 및 #30에 대한 유의한 성장이 4일 후에 관찰되지 않긴 하였지만, 약 50% HMF → HMFCA → FDCA 전환이 측정되었다 (도 3B 및 3D). 이것은 (발아된) 포자에 의해 수행된 FDCA로의 HMF의 가능한 생물-전환을 나타낸다.
이들 결과로부터 본 발명자들은 hmfK1이 FDCA 분해의 핵심 유전자라는 결론을 내린다. hmfK1의 결실은 HMF가 배양액에 제공되는 경우 FDCA 축적을 야기한다. (발아된) 포자-기반 생물전환은 가능해 보이며 세포의 어떤 성장도 필요하지 않음을 시사한다. 그러나, 글루코스 함유 배지에서 성장하는 배양액에서 FDCA 축적이 더 빠르다. 시험된 조건하에, hmfK3 유전자는 FDCA 분해에 관여하지 않는다.
실시예 5: 낮은 pH에서 HMF의 결정질 FDCA로의 전환
보다 제어된 조건하에 FDCA를 생산하는 hmfK1 결실 돌연변이체의 가능성을 추가로 입증하기 위해, 생체형질전환 실험을 7-L 유리 발효기에서 수행하였다. 세포는 미네랄 염 배지에서 30℃에서 배양되었다 (L당: KCl, 1.3 g; KH2PO4, 3.8 g; MgSO4.7H2O, 1.23 g; Na2EDTA.2H2O, 125 mg; ZnSO4.7H2O, 55 mg; H3BO3, 27.5 mg; MnCl2.4H2O, 12.5 mg; FeSO4.7H2O, 12.5 mg; CoCl2.6H2O, 4.25 mg; CuSO4.5H2O, 4 mg; Na2MoO4.2H2O, 3.75 mg, 글루코스, 10 g; (NH4)2SO4, 7.6 g 또는 NaNO3, 9.8 g). 소포제를 필요에 따라 첨가하고 용존 산소 장력을 공기 포화 수준의 20%로 유지시켰다. 성장 동안에, HMF를 1 mM의 최종 농도로 공급하여 FDCA 생성 효소 시스템을 유도하였다. 초기 글루코스가 고갈된 후, 바이오매스 밀도가 20 g/L의 세포 건조 중량에 도달할 때까지 글루코스를 연속적으로 공급하였다. 생체형질전환 단계는 HMFCA 또는 HMF의 축적을 방지하기 위해 수동으로 조정된 2.5 mmol / L 브로쓰 / h의 시작 속도로 HMF 공급을 켜서 시작되었다. HMF와 함께, 생체형질전환 동안에 세포의 에너지 요구를 커버하기 위해 글루코스의 공급이 제공되었다. 글루코스를 전체적으로 모니터링하고, 어떤 글루코스도 축적되지 않도록 공급 속도를 수동으로 조정하였다. 초기 값 (5.5)으로부터 2.7의 설정 값으로 pH를 강하시킨 후, NaOH의 자동 첨가에 의해 이를 제어하였다. 대안적으로, pH는 조정 없이 강하시켰고, 이 경우 값은 약 2.3에서 안정화되었다. 생체형질전환 동안에, HMF는 FDCA로 형질전환되어 pH 3.5 미만의 고체 화합물로서 결정화되었다. HMF가 너무 높은 속도로 공급된 경우 HMFCA의 일시적 축적이 관찰되었으며; 공급 속도를 줄인 직후 축적된 HMFCA는 전형적으로 FDCA로 산화될 것이다. 생체형질전환은 90 g/L의 전체 역가까지 FDCA를 산출하였다.
SEQUENCE LISTING
<110> PURAC BIOCHEM B.V.
<120> FDCA-DECARBOXYLATING MONOOXYGENASE-DEFICIENT HOST CELLS FOR
PRODUCING FDCA
<130> IPA191174-NL
<150> EP 17162104.8
<151> 2017-03-21
<160> 55
<170> PatentIn version 3.5
<210> 1
<211> 351
<212> PRT
<213> Penicillium brasilianum
<400> 1
Met Gly Ser Leu Ser Leu Pro Glu Thr Ser Leu Ala Ala Ile Gln Asp
1 5 10 15
Lys Glu Thr Lys Ala Ile Ser Val Ala Lys Arg Pro Thr Pro Val Pro
20 25 30
Val Gly Thr Gln Val Leu Val Lys Leu His Tyr Ser Gly Val Cys Ala
35 40 45
Thr Asp Leu His Leu Ala Arg Gly Ser Val Pro Tyr Leu Gln Pro Lys
50 55 60
Val Ser Val Gly Gly His Glu Gly Thr Gly Val Ile Ala Ser Leu Gly
65 70 75 80
Pro Asp Val Asp Ala Ala Glu Trp His Val Gly Asp Arg Val Ala Val
85 90 95
Arg Trp Val His Ile Val Cys Gly Lys Cys Glu Val Cys Thr Thr Gly
100 105 110
Phe Glu Asn Leu Cys Gln Ser Arg Lys Leu Ala Gly Lys Asp Val Glu
115 120 125
Gly Thr Phe Ala Glu Tyr Ala Ile Ala Asp Ser Ser Tyr Met Val Arg
130 135 140
Leu Pro Ala Gly Val Ser Asp Ala Asp Ala Ala Pro Ile Leu Cys Ala
145 150 155 160
Gly Val Thr Val Tyr Lys Ala Leu Lys Ile Ala Ser Leu Arg Ala Gly
165 170 175
Ser Trp Val Ala Val Ala Gly Ala Gly Gly Gly Leu Gly His Leu Ala
180 185 190
Ile Gln Tyr Ala Arg Ala Met Gly Leu Lys Val Val Ala Leu Asp Ala
195 200 205
Arg Lys Arg Asp Leu Cys Leu Ser Leu Gly Ala Glu Ser Tyr Ile Asp
210 215 220
Val Leu Glu Thr Asp Asp Cys Val Ala Gln Val Ile Lys Val Thr Asp
225 230 235 240
Gly Gly Ala His Gly Ala Leu Ile Cys Ala Ser Ser Gly Gln Ala Tyr
245 250 255
Asp Asp Ala Val Lys Phe Leu Arg Trp Thr Gly Thr Leu Val Cys Ile
260 265 270
Gly Leu Pro Pro Lys Pro Thr Leu Leu Ser Leu Gly Pro Ala Asp Phe
275 280 285
Val Ala Arg Gly Ile Lys Val Met Gly Thr Ser Thr Gly Asp Arg Gln
290 295 300
Asp Thr Val Glu Ala Leu Ala Phe Val Ala Lys Gly Gln Val Lys Pro
305 310 315 320
Gln Leu Thr Glu Arg Arg Leu Glu Asp Val Glu Glu Ile Leu Lys Glu
325 330 335
Ile Glu Asn Gly Thr Met Gln Gly Lys Ala Val Ile Arg Ile Ala
340 345 350
<210> 2
<211> 339
<212> PRT
<213> Penicillium brasilianum
<400> 2
Met Ser Leu Pro Ser His Tyr Lys Arg Ala Ala Phe Lys Glu Ala Gly
1 5 10 15
Gly Pro Leu Thr Ile Glu Glu Val Asp Leu Thr Met Pro Asp Ala Gly
20 25 30
Glu Val Leu Val Lys Val Glu Ala Cys Gly Val Cys Phe Ser Asp Thr
35 40 45
Val Pro Gln Ala His Gly Leu Gly Gly Lys Phe Pro Ile Val Pro Gly
50 55 60
His Glu Ile Ile Gly His Val Val Ala Thr Gly Asp Gly Val Ser Asp
65 70 75 80
Trp Glu Val Gly Asp Arg Ile Gly Glu Gly Trp His Gly Gly His Asp
85 90 95
Gly Thr Cys Pro Ser Cys Arg Gln Gly His Phe Gln Met Cys Asp Asn
100 105 110
Gln Ser Ile Asn Gly Val Thr Lys Asn Gly Gly Tyr Ala Gln Tyr Cys
115 120 125
Ile Leu Arg Ser Glu Ala Ala Val Arg Ile Pro Thr His Val Ser Ala
130 135 140
Ala Glu Tyr Ala Pro Ile Leu Cys Ala Gly Val Thr Val Phe Asn Ser
145 150 155 160
Met Arg Gln Ile Gly Val Lys Pro Gly Ser Thr Val Ala Ile Gln Gly
165 170 175
Leu Gly Gly Leu Gly His Leu Ala Ile Gln Tyr Ala Asn Arg Phe Gly
180 185 190
Phe Arg Val Val Ala Ile Ser Arg Asp Asp Gln Lys Glu Arg Phe Val
195 200 205
Arg Asp Leu Gly Ala His Glu Tyr Ile Asn Thr Ser Glu Glu Asp Val
210 215 220
Gly Ser Ala Leu Gln Lys Leu Gly Gly Ala Ser Leu Ile Val Ala Thr
225 230 235 240
Ala Pro Asn Ala Arg Ala Ile Ser Pro Leu Leu Lys Gly Leu Arg Pro
245 250 255
Leu Gly Lys Leu Leu Ile Leu Ala Val Pro Gly Glu Ile Pro Leu Asp
260 265 270
Thr Arg Leu Met Val Ala Arg Gly Leu Ser Val His Gly Trp Pro Ser
275 280 285
Gly His Ala Leu Asp Ser Glu Glu Thr Ile Arg Phe Thr Glu Leu Glu
290 295 300
Asp Ile Lys Cys Met Ile Gln Thr Tyr Ser Leu Asp Arg Ala Asn Glu
305 310 315 320
Ala Phe Asp Ala Met Ile Ser Gly Ser Val Arg Phe Arg Ala Val Ile
325 330 335
Thr Met Glu
<210> 3
<211> 505
<212> PRT
<213> Penicillium brasilianum
<400> 3
Met Thr Gln Thr Asn Val His Val Asn Lys Ser Asp Thr Ser Leu Ala
1 5 10 15
Ala Pro Gln Gln Leu Phe Ile Ser Gly Lys Tyr Gln Asn Ser Gln Arg
20 25 30
Asn Gly Thr Phe Pro Val Lys Asn Pro Met Thr Gly Glu Thr Ile Tyr
35 40 45
Glu Cys Val Ser Ala Ser Leu Asp Asp Tyr Ala Ala Ala Ile Glu Glu
50 55 60
Ala Asp Ala Ala Gln Pro Ser Trp Ala Arg Leu Gly Pro Ser Ala Arg
65 70 75 80
Arg Leu Ile Leu Leu Lys Ala Ala Asp Ile Met Glu Thr Tyr Ile Glu
85 90 95
Thr Asp Ala Pro Ala Ile Leu Ser Ala Glu Val Ser Ala Thr Arg Gly
100 105 110
Trp Val Arg Ala Asn Ile Leu Ser Thr Ala Gly Val Phe Arg Glu Thr
115 120 125
Ala Ala Leu Ala Thr His Ile Lys Gly Glu Ile Val Pro Ala Asp Arg
130 135 140
Pro Gly Thr Thr Ile Leu Val Ser Arg Glu Pro Val Gly Val Val Leu
145 150 155 160
Ala Ile Ser Pro Trp Asn Met Pro Ala Thr Leu Thr Ala Arg Ala Ile
165 170 175
Cys Cys Pro Leu Ile Cys Gly Asn Ser Val Val Leu Arg Pro Ser Glu
180 185 190
Phe Ser Pro Lys Ser Gln His Leu Val Val Arg Ala Leu Thr Glu Ala
195 200 205
Gly Leu Pro Ala Gly Cys Leu Gln Phe Leu Pro Thr Ser Thr Ala Asp
210 215 220
Thr Pro Arg Ala Ile Glu Phe Ala Ile Arg His Pro Lys Val Ser Arg
225 230 235 240
Ala Asn Phe Thr Gly Ser Asp Arg Val Gly Arg Ile Ile Ala Gly Leu
245 250 255
Ser Ala Ser Cys Leu Lys Pro Cys Val Leu Glu Leu Gly Gly Lys Ala
260 265 270
Pro Val Val Val Leu Glu Asp Ala Asp Val Glu Ala Ala Val Glu Ala
275 280 285
Val Val Tyr Gly Ala Met Ser Asn Ser Gly Gln Ile Cys Met Ser Thr
290 295 300
Glu Arg Ala Ile Val His Arg Ser Leu Ala Ala Asp Phe Lys Ala Leu
305 310 315 320
Leu Val Lys Arg Ala Glu Ser Leu Arg Val Gly Asn His Leu Glu Asp
325 330 335
Pro Asp Val Gln Leu Ser Gly Leu Phe Thr Ala Ala Ser Ala Glu Arg
340 345 350
Val Leu Gly Leu Ile Lys Gly Ala Val Asn Ala Gly Ala Thr Leu Leu
355 360 365
Ala Gly Asp Leu Ala Leu His Gly Pro Cys Gln Thr Ile Met Ala Pro
370 375 380
His Ile Leu Thr Gly Val Thr Arg Asp Met Asp Leu Phe His Arg Glu
385 390 395 400
Thr Phe Gly Pro Val Leu Phe Val Ser Glu Phe Asp Thr Asp Asp Glu
405 410 415
Ala Ile Ala Gln Ala Asn Asp Thr Glu Phe Ser Leu Cys Ala Ser Val
420 425 430
Phe Ser Arg Asp Val Leu Arg Ala Met Asp Thr Ala Lys Arg Ile Arg
435 440 445
Thr Gly Ser Cys His Val Asn Gly Pro Thr Val Tyr Ile Glu Ala Pro
450 455 460
Leu Pro Asn Gly Gly Val Gly Gly Gly Ser Gly Tyr Gly Arg Phe Gly
465 470 475 480
Gly Val Ala Gly Ile Glu Glu Phe Thr Glu Arg Gln Ile Val Ser Leu
485 490 495
Ala Lys Pro Gly Ile Lys Tyr Ala Phe
500 505
<210> 4
<211> 427
<212> PRT
<213> Penicillium brasilianum
<400> 4
Met Pro His Ala Ser Arg Ser Leu Asn Val Leu Ile Val Gly Ala Gly
1 5 10 15
Leu Gly Gly Leu Ala Ala Gly Leu Ala Leu Gln Thr Asp Gly His Lys
20 25 30
Val Thr Ile Ile Asp Ala Ala Pro Glu Phe Ala Glu Ala Gly Ala Gly
35 40 45
Ile Arg Ile Pro Pro Asn Ser Ser Arg Leu Leu Met Arg Trp Gly Val
50 55 60
Asp Leu Glu Arg Met Lys Lys Ser Thr Ser Gln Arg Tyr His Phe Ile
65 70 75 80
Arg Trp Lys Asp Gly Ser Thr Ile Phe Asp Leu Pro Phe Asn Asn Ile
85 90 95
Val Glu Thr His Gly Ala Pro Tyr Trp Leu Val His Arg Ala Asp Leu
100 105 110
His Ala Ala Leu Leu Asp Ala Thr Leu Lys Ala Gly Val Lys Val Leu
115 120 125
Asn Asn Lys Leu Val Thr Ser Tyr Asp Phe Glu Ala Pro Ser Ala Thr
130 135 140
Thr Gln Asp Gly Glu Thr Phe Lys Ala Asp Leu Ile Val Gly Ala Asp
145 150 155 160
Gly Ile Lys Ser Ile Cys Arg Pro Leu Leu Thr Gly Gln Pro Asp Val
165 170 175
Pro Arg Asp Thr Gly Asp Val Ala Tyr Arg Ile Leu Ile Pro Gly Glu
180 185 190
Lys Leu Leu Ala Asp Pro Asp Leu Ala His Leu Ile Arg Asp Pro Cys
195 200 205
Thr Thr Ser Trp Cys Gly Pro Asp Ala His Leu Val Gly Tyr Pro Ile
210 215 220
Arg Asn Gly Glu Met Tyr Asn Ile Val Met Cys Ala Thr Ser Tyr Asn
225 230 235 240
Glu Thr Thr Asp Glu Val Trp Val Val Lys Gly Asp Asn Ser Glu Leu
245 250 255
Cys Lys Arg Phe Ala Ser Trp Glu Pro Gln Val Arg Lys Leu Cys Ala
260 265 270
Leu Thr Gly Asp Phe Met Lys Trp Arg Leu Cys Asp Leu Pro Asn Leu
275 280 285
Ala Arg Trp Thr His Pro Ser Gly Lys Ala Val Leu Leu Gly Asp Ser
290 295 300
Cys His Pro Met Leu Pro Tyr Leu Ala Gln Gly Ala Ala Gln Ala Val
305 310 315 320
Glu Asp Ala Ala Val Leu Arg Gln Val Leu Ala Gln Asp Met Asp Met
325 330 335
Ala Ala Ala Leu Lys Gln Tyr Glu Gln Ile Arg Met Pro Arg Ala Ser
340 345 350
Leu Val Gln Ala Lys Thr Arg Glu His Gln Tyr Ile Leu His Val Asp
355 360 365
Asp Gly His Glu Gln Gln Asp Arg Asp Lys Lys Leu Ala Leu Asp Ala
370 375 380
Ala Glu Asn Pro Val Phe Trp Gly Tyr Asp Asp Arg Arg Lys Trp Leu
385 390 395 400
Phe Ser His Asp Ala Glu Val Ile Gln Lys Glu Gly Ala Asn Trp Arg
405 410 415
Asp Gly Pro Asn Met Asn Gly Val His Val Ala
420 425
<210> 5
<211> 245
<212> PRT
<213> Penicillium brasilianum
<400> 5
Met Ser Leu Ser Gly Lys Val Val Leu Ile Thr Gly Ser Ser Lys Gly
1 5 10 15
Ile Gly Lys Ala Ala Ala Leu Arg Val Ala Ser Glu Gly Ala Asn Val
20 25 30
Val Ile Asn Tyr Leu Arg Asp Pro Val Ala Ala Asn Asn Leu Val Asp
35 40 45
Gln Ile Gly Ala Asp Arg Ala Leu Ala Val Gln Ala Asp Ala Ser Lys
50 55 60
Leu Ala Asp Leu Asp Arg Leu Val Asn Ala Ala Val Ala Gln Phe Gly
65 70 75 80
Lys Ile Asp Val Leu Ile Pro Asn Ala Gly Ile Leu Pro Leu Arg Asp
85 90 95
Leu Glu His Thr Ser Glu Glu Asp Phe Asp Arg Thr Tyr Asn Leu Met
100 105 110
Val Lys Gly Pro Tyr Phe Leu Ala Gln Lys Ala Val Lys His Met Pro
115 120 125
Pro Gly Gly Arg Ile Ile Phe Val Ser Thr Ser Thr Ala Arg Phe Ala
130 135 140
Ser Val Ala Pro Ala Tyr Leu Leu Tyr Thr Ser Ser Lys Gly Ala Ile
145 150 155 160
Glu Gln Met Thr Arg Ile Met Ala Lys Asp Leu Ala Arg Lys Gly Ile
165 170 175
Leu Val Asn Ala Val Ala Pro Gly Pro Thr Ser Thr Glu Leu Phe Leu
180 185 190
Glu Gly Lys Pro Glu Gln Met Ile Lys Ala Ile Ser Gly Phe Ser Pro
195 200 205
Phe Asn Arg Ile Gly Glu Pro Glu Glu Ile Ala Ala Val Met Ala Phe
210 215 220
Leu Ser Gly Lys Asp Ser Ser Trp Ile Ser Gly Gln Val Val Ala Val
225 230 235 240
Asn Gly Ala Met Ala
245
<210> 6
<211> 581
<212> PRT
<213> Penicillium brasilianum
<400> 6
Met Ala Ser Leu Ile Arg Glu Ala Pro Phe Gly Gln Ile Val Arg Tyr
1 5 10 15
Leu Thr Asn Asn Lys Tyr Phe Gln Tyr Pro Glu Glu Lys Pro Asp Phe
20 25 30
Lys Leu Pro Asp Thr Trp Leu Gln Leu Leu Asn Glu Ser Asp Ala Ala
35 40 45
Thr Ile Ala Asp Pro Glu Lys Thr Glu Pro Glu Pro Glu Gly Gln Gly
50 55 60
Tyr Asp Ala Thr Ser Glu Ala Ile Ser Arg Ala Ser Thr Gln Asn Ser
65 70 75 80
Leu Pro Phe Thr Glu Ala Arg Leu Glu Ala Asp Glu Gln His Glu Ile
85 90 95
Glu Lys Ile Lys Ser Ile Pro Ile Gln Pro Lys Lys Thr Lys Asp Gly
100 105 110
Ala Ile Leu Val Asp Trp Tyr Tyr Thr Asp Asp Ala Glu Asn Pro His
115 120 125
Asn Trp Ser Asn Arg Lys Arg Ala Leu Leu Thr Thr Leu Ile Cys Leu
130 135 140
Tyr Thr Phe Val Val Tyr Thr Thr Ser Ala Ile Tyr Thr Ser Ser Val
145 150 155 160
Pro Gly Ile Met Lys Glu Phe Gly Val Ser Asp Leu Val Ala Thr Leu
165 170 175
Gly Leu Ser Leu Tyr Val Leu Gly Tyr Gly Thr Gly Pro Leu Ile Phe
180 185 190
Ser Pro Leu Ser Glu Ile Pro Val Ile Gly Arg Asn Pro Val Tyr Ile
195 200 205
Val Thr Met Phe Leu Phe Val Ile Leu Ser Ile Pro Thr Ala Phe Val
210 215 220
Gly Asn Phe Ala Gly Leu Met Val Leu Arg Phe Leu Gln Gly Phe Phe
225 230 235 240
Gly Ser Pro Cys Leu Ala Ser Gly Gly Ala Ser Ile Gly Asp Met Tyr
245 250 255
Ser Leu Met Ser Leu Pro Tyr Ala Met Met Ser Trp Val Ser Ala Ala
260 265 270
Tyr Cys Gly Pro Ala Leu Gly Pro Leu Ile Ser Gly Phe Ala Val Pro
275 280 285
Ala Glu Thr Trp Arg Trp Ser Leu Phe Glu Ser Ile Trp Met Ser Ala
290 295 300
Pro Val Leu Ile Leu Met Phe Phe Phe Leu Pro Glu Thr Ser Ser Ala
305 310 315 320
Thr Ile Leu Leu Arg Arg Ala Ala Arg Leu Arg Lys Ile His Asn Asn
325 330 335
Ala Arg Phe Met Ala Gln Ser Glu Ile Asp Gln Arg Asn Met Lys Val
340 345 350
Ser Ala Val Ala Val Asp Ala Leu Ile Lys Pro Leu Glu Ile Thr Ile
355 360 365
Lys Asp Pro Ala Val Leu Phe Val Gln Val Tyr Thr Ala Ile Ile Tyr
370 375 380
Gly Ile Tyr Tyr Ser Phe Phe Glu Val Phe Pro Leu Val Tyr Pro Val
385 390 395 400
Asp Tyr Gly Met Asn Leu Gly Gln Val Gly Leu Val Phe Leu Cys Ile
405 410 415
Leu Val Ser Cys Ile Ile Gly Ile Ala Ile Tyr Trp Ser Tyr Leu Tyr
420 425 430
Phe Trp Met Asn Pro Arg Ile Glu Arg Phe Gly Phe Pro Ala Gln Glu
435 440 445
Ser Arg Leu Ile Pro Ala Leu Pro Ala Ser Ile Gly Pro Thr Ile Gly
450 455 460
Leu Phe Leu Phe Ala Trp Thr Ala Arg Ala Ser Ile His Trp Ile Ala
465 470 475 480
Pro Thr Ile Gly Ile Thr Ile Tyr Gly Ala Thr Val Phe Ile Val Met
485 490 495
Gln Cys Leu Phe Val Tyr Ile Pro Leu Ser Tyr Pro Met Tyr Ala Ala
500 505 510
Ser Leu Phe Ala Ala Asn Asp Phe Phe Arg Ser Ala Leu Ala Cys Gly
515 520 525
Ser Val Leu Phe Ala His Pro Leu Phe Gly Asn Leu Gly Val Ala Arg
530 535 540
Gly Thr Ser Leu Leu Gly Gly Leu Ser Val Ile Gly Ile Ile Gly Ile
545 550 555 560
Trp Leu Leu Tyr Tyr Tyr Gly Ala Arg Leu Arg Ser Leu Ser Lys Phe
565 570 575
Ala Ile Ser Asp Asp
580
<210> 7
<211> 513
<212> PRT
<213> Penicillium brasilianum
<400> 7
Met Ser Thr Thr Lys Glu Ala Phe Pro His Thr Asp Ser Asp Ile Met
1 5 10 15
Glu Asp Ser Glu Lys Asn Leu Pro Glu Cys Glu His Ile Val Ser Val
20 25 30
Glu Pro Thr Leu Lys Met Arg Asp Gly Ile Val Leu Met Pro Gln Pro
35 40 45
Ser Asp Asp Pro Asn Asp Pro Leu Asn Trp Ser Trp Phe Arg Lys His
50 55 60
Ala Ala Met Phe Thr Leu Ser Tyr Leu Ala Leu Val Cys Tyr Val Ala
65 70 75 80
Val Thr Thr Leu Val Thr Gly Thr Val Pro Leu Ala Lys Ser Met His
85 90 95
Val Ser Lys Ser Thr Ala Val Tyr Leu Gly Asn Thr Pro Val Ala Leu
100 105 110
Tyr Ala Val Ala Pro Trp Phe Trp Ser Pro Leu Ser His Phe Ile Gly
115 120 125
Arg Arg Pro Val Leu Leu Met Cys Asn Ile Ile Ala Val Val Gly Ala
130 135 140
Val Val Val Thr Thr Ser Lys Thr Tyr Ala Ser Cys Met Val Gly Arg
145 150 155 160
Val Ile Leu Gly Ala Gly Gly Ser Ala Phe Trp Thr Leu Gly Pro Ala
165 170 175
Ser Ile Gly Asp Ile Phe Phe Arg His Glu Lys Gly Lys Lys Ile Gly
180 185 190
Val Ser Thr Leu Ala Ile Val Ile Ala Pro Phe Leu Gly Thr Ile Ile
195 200 205
Gly Gly Pro Ile Ile Glu Asn Glu Lys Leu Gly Trp Pro Ala Ser Gln
210 215 220
Trp Ile Pro Leu Ile Phe Met Ala Ala Gly Phe Ile Met Gln Ile Phe
225 230 235 240
Phe Leu Pro Glu Thr Ile Tyr Ile Arg Glu Thr Arg Ala His Pro Ala
245 250 255
Ile Met Ser Thr Ser Thr Pro Gly Lys Pro Thr Phe Trp Asp Arg Tyr
260 265 270
Gly Ile His Ile Pro Lys Arg Ser Glu Glu Lys Gln His Ser Phe Leu
275 280 285
Phe Ile Ala Thr Arg Pro Phe Val Leu Phe Lys Phe Pro Ala Val Ile
290 295 300
Leu Ser Ala Phe Trp Phe Gly Ile Ala Tyr Met Met His Val Gly Ile
305 310 315 320
Thr Ser Glu Ile Pro Leu Ile Phe Glu Glu His Tyr Asp Phe Ser Val
325 330 335
Leu Glu Ile Gly Leu Ser Gly Phe Ser Gly Leu Ile Gly Ala Leu Leu
340 345 350
Gly Glu Val Tyr Ala Gly Pro Ser Leu Asp Phe Ile Ala Lys Arg Thr
355 360 365
Met Lys Gln Gly Arg Glu Trp Arg Pro Glu Tyr Arg Leu Gln Ala Ile
370 375 380
Trp Pro Ala Leu Ile Thr Val Pro Ala Gly Leu Ile Met Phe Gly Thr
385 390 395 400
Ser Ile Gln Phe Gly Asn Val Trp Ile Thr Pro Leu Ile Gly Gln Ala
405 410 415
Val Tyr Ile Phe Gly Ile Glu Ile Ala Thr Thr Val Ile Gln Thr Tyr
420 425 430
Ile Leu Glu Cys Tyr Pro Arg Gln Gly Ala Glu Ala Asn Leu Val Phe
435 440 445
Asn Leu Ile Arg Asn Leu Phe Ser Tyr Ile Ser Pro Phe Phe Val Gln
450 455 460
Pro Met Ile Ala Thr Leu Gly Thr Thr Ser Pro Phe Gly Leu Ser Ala
465 470 475 480
Ala Leu Thr Ala Phe Phe Phe Pro Phe Thr Val Gly Val Leu Met Trp
485 490 495
Arg Gly Lys Gln Ile Arg Asp Lys Gly Gly Asp Pro Gly Trp Ser Arg
500 505 510
Asp
<210> 8
<211> 1435
<212> PRT
<213> Penicillium brasilianum
<400> 8
Met Glu Asp His Glu Lys Glu Tyr Asp Ser Thr Ser Pro Pro Gly Thr
1 5 10 15
Ala Thr Glu Glu Gly Asn Gly Gly Tyr Phe Asn Thr Leu Thr Val Pro
20 25 30
Glu Ile Asn Leu Arg Glu Ala Ser Ser Ala Glu Thr Leu Thr Pro His
35 40 45
Ala Ser Val Val Gln Pro Pro Lys Lys Ala Ala Glu Trp His Met Thr
50 55 60
Pro Gln Val Ile Arg Asn Ala Glu Arg Asp Glu Ala Ala Gly Phe Lys
65 70 75 80
Arg Arg Glu Leu Gly Val Thr Trp Gln Asp Leu Ser Val Glu Val Leu
85 90 95
Ala Ala Glu Ala Ala Val Lys Glu Asn Met Ile Ser Gln Phe Asn Val
100 105 110
Pro Gln Leu Ile Lys Asp Phe Arg Arg Lys Pro Pro Leu Lys Ser Ile
115 120 125
Leu Ser Asn Ser His Gly Cys Val Lys Pro Gly Glu Met Leu Leu Val
130 135 140
Leu Gly Arg Pro Gly Ser Gly Cys Thr Thr Leu Leu Lys Met Leu Ala
145 150 155 160
Asn Arg Arg Glu Gly Tyr Gln Asn Ile Thr Gly Asp Val Arg Phe Gly
165 170 175
Asn Met Thr Pro Glu Glu Ala Ser Arg Tyr Gln Gly Gln Ile Val Met
180 185 190
Asn Thr Glu Glu Glu Leu Phe Tyr Pro Arg Leu Thr Val Gly Gln Thr
195 200 205
Met Asp Phe Ala Thr Lys Leu Lys Val Pro Tyr His Leu Pro Gly Glu
210 215 220
Gly Lys Ser Val Ala Glu Tyr Thr Ala Glu Thr Lys Gln Phe Leu Leu
225 230 235 240
Glu Ser Met Gly Ile Ala His Thr Ala Asp Thr Lys Val Gly Asn Glu
245 250 255
Phe Val Arg Gly Val Ser Gly Gly Glu Arg Lys Arg Val Ser Ile Ile
260 265 270
Glu Cys Leu Ala Thr Arg Gly Ser Val Phe Thr Trp Asp Asn Ser Thr
275 280 285
Arg Gly Leu Asp Ala Ser Thr Ala Leu Glu Trp Ala Lys Ala Leu Arg
290 295 300
Ala Met Thr Asp Val Gln Gly Leu Ser Thr Ile Val Thr Leu Tyr Gln
305 310 315 320
Ala Gly Asn Gly Ile Tyr Asn Leu Phe Asp Lys Val Leu Val Leu Asp
325 330 335
Glu Gly Lys Gln Ile Tyr Tyr Gly Pro Ala Ala Glu Ala Lys Pro Phe
340 345 350
Met Glu Asn Leu Gly Phe Val Tyr Thr Asp Gly Ala Asn Ile Gly Asp
355 360 365
Phe Leu Thr Gly Leu Thr Val Pro Thr Glu Arg Lys Ile Arg Pro Gly
370 375 380
Trp Glu Asn Arg Phe Pro Arg Thr Ala Asp Ala Ile Leu Thr Glu Tyr
385 390 395 400
Gln Asn Ser Ala Thr Tyr Lys Asn Glu Val Ser Leu Tyr Gly Tyr Pro
405 410 415
Asp Thr Asp Leu Ala Ala Glu Arg Thr Glu Ala Phe Lys Glu Ser Val
420 425 430
Ala Trp Glu Lys Ser Lys His Leu Pro Lys Gly Ser Asp Leu Thr Thr
435 440 445
Ser Phe Trp Ala Gln Leu Met Ser Cys Thr Ala Arg Gln Tyr Gln Ile
450 455 460
Leu Trp Gly Glu Lys Ser Thr Phe Leu Ile Lys Gln Ile Leu Ser Cys
465 470 475 480
Val Met Ala Leu Ile Ala Gly Ser Cys Phe Tyr Asn Ser Pro Asp Thr
485 490 495
Ser Ala Gly Leu Phe Thr Lys Gly Gly Ala Val Phe Phe Ser Leu Leu
500 505 510
Tyr Asn Cys Ile Val Ala Met Ser Glu Val Thr Glu Ser Phe Lys Gly
515 520 525
Arg Pro Ile Leu Thr Lys His Lys Ser Phe Ala Met Tyr His Pro Ala
530 535 540
Ala Phe Cys Leu Ala Gln Ile Thr Ala Asp Phe Pro Val Leu Leu Phe
545 550 555 560
Gln Cys Thr Ile Phe Ser Val Val Ile Tyr Trp Met Val Gly Leu Lys
565 570 575
His Thr Ala Ala Ala Phe Phe Thr Phe Trp Ala Ile Leu Phe Thr Thr
580 585 590
Thr Leu Cys Ile Thr Ala Leu Phe Arg Phe Ile Gly Ala Ala Phe Ser
595 600 605
Ser Phe Glu Ala Ala Ser Lys Ile Ser Gly Thr Ala Val Lys Ala Ile
610 615 620
Val Met Tyr Ala Gly Tyr Met Ile Pro Lys Pro Glu Ile Lys Asn Trp
625 630 635 640
Phe Leu Glu Phe Tyr Tyr Thr Asn Pro Phe Ala Tyr Ala Phe Gln Ala
645 650 655
Ala Leu Thr Asn Glu Phe His Asp Gln His Ile Asp Cys Val Gly Gly
660 665 670
Asn Leu Ile Pro Ser Gly Pro Gly Tyr Glu Asp Val Gly Ser Gly Tyr
675 680 685
Lys Ala Cys Ala Gly Val Gly Gly Ala Leu Pro Gly Ala Asp Tyr Val
690 695 700
Thr Gly Asp Gln Tyr Leu Ser Ser Leu His Tyr Lys His Ser Gln Leu
705 710 715 720
Trp Arg Asn Phe Gly Val Val Trp Ala Trp Trp Gly Phe Phe Ala Val
725 730 735
Leu Thr Val Val Phe Thr Cys Phe Trp Lys Ser Gly Ala Ala Ser Gly
740 745 750
Ser Ser Leu Leu Ile Pro Arg Glu Asn Leu Lys Lys His Gln Val Gly
755 760 765
Asn Asp Glu Glu Ala Gln Asn Asn Glu Lys His Ala Ala Arg Thr Thr
770 775 780
Thr Asp Glu Pro Val Gln Val Glu Asp Asp Asn Leu Val Arg Asn Thr
785 790 795 800
Ser Ile Phe Thr Trp Lys Asn Leu Thr Tyr Thr Val Lys Thr Pro Thr
805 810 815
Gly Asp Arg Val Leu Leu Asp Asn Ile Asn Gly Trp Val Lys Pro Gly
820 825 830
Met Leu Gly Ala Leu Met Gly Ser Ser Gly Ala Gly Lys Thr Thr Leu
835 840 845
Leu Asp Val Leu Ala Gln Arg Lys Thr Glu Gly Thr Ile Lys Gly Ser
850 855 860
Ile Leu Val Asp Gly Arg Glu Leu Pro Val Ser Phe Gln Arg Met Ala
865 870 875 880
Gly Tyr Cys Glu Gln Leu Asp Val His Glu Ser Tyr Ala Thr Val Arg
885 890 895
Glu Ala Leu Glu Phe Ser Ala Leu Leu Arg Gln Ser Arg Asp Thr Pro
900 905 910
Lys Ala Glu Lys Leu Lys Tyr Val Asp Thr Ile Ile Asp Leu Leu Glu
915 920 925
Leu His Asp Leu Ala Asp Thr Leu Ile Gly Ser Val Gly Asn Gly Leu
930 935 940
Ser Val Glu Gln Arg Lys Arg Val Thr Ile Gly Val Glu Leu Val Ser
945 950 955 960
Lys Pro Ser Ile Leu Ile Phe Leu Asp Glu Pro Thr Ser Gly Leu Asp
965 970 975
Gly Gln Ser Ala Tyr Asn Thr Val Arg Phe Leu Arg Lys Leu Ala Asp
980 985 990
Val Gly Gln Ala Val Leu Val Thr Ile His Gln Pro Ser Ala Gln Leu
995 1000 1005
Phe Ala Gln Phe Asp Thr Leu Leu Leu Leu Ala Arg Gly Gly Lys
1010 1015 1020
Thr Val Tyr Phe Gly Asp Ile Gly Asp Asn Gly Ser Thr Ile Lys
1025 1030 1035
Gln Tyr Phe Gly Asn Tyr Gly Ala Ile Cys Pro Gln Glu Ala Asn
1040 1045 1050
Pro Ala Glu Phe Met Ile Asp Val Val Thr Gly Gly Ile Gln Glu
1055 1060 1065
Val Lys Asp Lys Asp Trp His Gln Ile Trp Leu Asp Ser Pro Glu
1070 1075 1080
Gln His Gln Met Ile Thr Glu Leu Asp Arg Met Ile Ala Asp Ala
1085 1090 1095
Ala Ser Lys Pro Pro Gly Thr Val Asn Asp Gly Tyr Glu Phe Ser
1100 1105 1110
Met Pro Leu Trp Glu Gln Ile Lys Ile Val Thr Gln Arg Met Asn
1115 1120 1125
Val Ser Leu Phe Arg Asn Thr Ala Tyr Val Asn Asn Lys Phe Ser
1130 1135 1140
Leu His Ile Ile Ser Ala Leu Leu Asn Gly Phe Ser Phe Trp Arg
1145 1150 1155
Pro Gly Pro Ser Val Ser Ala Leu Gln Leu Lys Met Phe Thr Ile
1160 1165 1170
Phe Asn Phe Val Phe Val Ala Pro Gly Val Ile Asn Gln Leu Gln
1175 1180 1185
Pro Leu Phe Ile Gln Arg Arg Asp Ile Tyr Asp Ala Arg Glu Lys
1190 1195 1200
Lys Ser Lys Met Tyr Ser Trp Val Ala Phe Val Thr Gly Leu Ile
1205 1210 1215
Val Ser Glu Phe Pro Tyr Leu Cys Ile Cys Ala Val Leu Tyr Phe
1220 1225 1230
Val Cys Trp Tyr Trp Pro Val Trp Arg Leu Pro His Asp Ser Asp
1235 1240 1245
Arg Ser Gly Ala Ile Phe Phe Met Met Leu Ile Tyr Glu Phe Ile
1250 1255 1260
Tyr Thr Gly Ile Gly Gln Phe Ile Ala Ala Tyr Ala Pro Asn Pro
1265 1270 1275
Thr Phe Ala Ala Leu Val Asn Pro Leu Ile Ile Ser Val Leu Val
1280 1285 1290
Leu Phe Cys Gly Val Phe Val Pro Tyr Asp Gln Leu Asn Val Phe
1295 1300 1305
Trp Lys Tyr Trp Met Tyr Tyr Leu Asn Pro Phe Asn Tyr Val Val
1310 1315 1320
Asn Gly Met Leu Thr Phe Gly Leu Trp Gly Gln Lys Val Thr Cys
1325 1330 1335
Asn Glu Ser Glu Tyr Ala Val Phe Asp Pro Leu Asn Gly Thr Cys
1340 1345 1350
Gly Glu Tyr Leu Ala Thr Tyr Met Ser Gly Lys Gly Ser Gly Val
1355 1360 1365
Asn Leu Leu Asn Pro Asp Ala Thr Ser Ser Cys Lys Val Cys Glu
1370 1375 1380
Tyr Thr Thr Gly Ser Asp Phe Leu Gln Thr Leu Asn Ile Asn His
1385 1390 1395
Tyr Tyr Tyr Gly Trp Arg Asp Ala Gly Ile Thr Val Ile Tyr Ala
1400 1405 1410
Ile Ser Gly Tyr Ala Leu Val Phe Gly Leu Met Lys Leu Arg Thr
1415 1420 1425
Lys Ala Ser Lys Lys Ala Glu
1430 1435
<210> 9
<211> 527
<212> PRT
<213> Penicillium brasilianum
<400> 9
Met Thr Pro Ile Ser Arg Leu Leu Ser Arg Ala Val Asn Lys Pro Tyr
1 5 10 15
Arg Thr Lys Asp Ile Thr Asp Glu Ile Pro Pro Thr Leu Asp Glu Asp
20 25 30
Gly Phe Val Ser Phe Gly Pro Gly Asp Ile Glu Asn Pro Arg Asn Trp
35 40 45
Ser Met Arg Arg Arg Ala Gly Val Thr Met Ser Ala Val Leu Leu Val
50 55 60
Val Asn Ala Thr Phe Ala Ser Ser Ser Pro Ser Gly Cys Phe Pro Ser
65 70 75 80
Ile Ser Lys His Phe Gly Val Ser Thr Glu Val Ala Gly Leu Thr Ile
85 90 95
Thr Leu Phe Leu Leu Gly Tyr Cys Ala Gly Pro Leu Ile Phe Ala Pro
100 105 110
Leu Ser Glu Phe Tyr Gly Arg Arg Trp Ile Phe Tyr Ile Thr Phe Leu
115 120 125
Leu Tyr Leu Ala Phe Asn Phe Leu Cys Ala Phe Pro Pro Asn Phe Gly
130 135 140
Ser Leu Leu Val Gly Arg Phe Leu Thr Gly Thr Phe Val Ser Ala Pro
145 150 155 160
Leu Ser Asn Cys Pro Gly Val Leu Ala Asp Val Trp Asn Pro Leu Glu
165 170 175
Arg Ala Asn Ala Met Ala Gly Phe Ser Ala Met Val Trp Ile Gly Pro
180 185 190
Ala Leu Gly Pro Val Val Ala Gly Phe Leu Gln Leu Lys Glu Asp Trp
195 200 205
Arg Trp Ser Phe Tyr Val Leu Leu Trp Leu Gly Gly Ala Ser Ala Val
210 215 220
Ile Met Leu Thr Ile Pro Glu Thr Tyr Ala Pro Ile Val Leu Tyr Asn
225 230 235 240
Lys Ala Arg Arg Ile Arg Glu Ala Gln Ile Pro Gly Tyr Glu Asn Val
245 250 255
Lys Ala Pro Val Glu Asp Gly Asp Arg Thr Leu Val Gly Ile Tyr Lys
260 265 270
Val Ala Leu Thr Arg Pro Trp Ile Ile Leu Phe Asp Pro Ile Ser Leu
275 280 285
Leu Cys Ala Ile Tyr Met Ala Phe Val Tyr Thr Leu Leu Tyr Met Leu
290 295 300
Phe Thr Ile Tyr Pro Ile Val Phe Gln Glu Lys Arg Gly Trp Asn Ser
305 310 315 320
Gly Val Gly Glu Leu Pro Leu Leu Gly Thr Val Val Gly Ala Leu Phe
325 330 335
Gly Gly Val Ile Val Val Ala Asp Thr Arg Met Arg Gln Lys Arg Ile
340 345 350
Asp Asn Gly Thr Thr Lys Met Glu Asp Ala Val Pro Glu Asp Arg Leu
355 360 365
Pro Leu Ala Met Gly Gly Gly Ile Gly Phe Ala Val Thr Met Phe Trp
370 375 380
Phe Ala Trp Ser Ala Glu Phe Asn Ser Val His Trp Ile Val Pro Thr
385 390 395 400
Leu Ala Gly Val Phe Leu Ser Ser Ala Leu Leu Leu Ile Phe Val Gly
405 410 415
Phe Leu Asn Tyr Leu Val Asp Val Tyr Gln Met Tyr Ala Ala Ser Ala
420 425 430
Ile Ala Ala Asn Thr Ile Ala Arg Ser Ala Cys Gly Ala Ala Ala Pro
435 440 445
Leu Phe Thr Ser Gln Met Phe Ala Ala Leu Gly Val Gly Gly Gly Gly
450 455 460
Ser Leu Ile Ala Gly Val Ala Thr Leu Leu Ala Ala Ile Pro Phe Leu
465 470 475 480
Phe Tyr Lys Tyr Gly Lys Gln Ile Arg Met Arg Ser Lys Phe Ala Pro
485 490 495
Thr Thr Lys Glu Glu Arg Pro Ala Glu Glu Asn Lys Asp Glu Glu Arg
500 505 510
Gly Leu Gly Asp Gly Ala Val Ser Ser Ser Ile Leu Gly Ala Gln
515 520 525
<210> 10
<211> 514
<212> PRT
<213> Penicillium brasilianum
<400> 10
Met Ala Ala Ser Asn Glu His Ala Thr Pro Ser Ile Asp Ser Ala Thr
1 5 10 15
Thr Lys Thr Ala Pro Ser Val Asp Ser Thr Pro Ala Met Ser Asp His
20 25 30
Val Asn Glu Asp Leu Glu Lys Gly Thr Arg Thr Thr Asp Pro Val Glu
35 40 45
Ala Glu Lys His Asp Leu Asn Val Asn Pro Leu Ser Glu Lys Ile Glu
50 55 60
Gly Thr Thr Pro Ala Pro Ala Gly Pro Pro Gly Pro Gly Pro Pro Pro
65 70 75 80
Asp Gly Gly Ala Glu Ala Trp Leu Val Val Leu Gly Ala Phe Cys Gly
85 90 95
Leu Phe Val Ser Phe Gly Trp Ile Asn Cys Ile Gly Val Phe Gln Thr
100 105 110
Tyr Tyr Glu Thr His Gln Leu Ser Asn Leu Ser Thr Ser Thr Val Thr
115 120 125
Trp Ile Thr Ser Leu Glu Thr Phe Val Met Phe Phe Ala Gly Pro Val
130 135 140
Phe Gly Thr Leu Phe Asp Ser Tyr Gly Pro Arg Tyr Ile Leu Leu Gly
145 150 155 160
Gly Thr Phe Leu His Val Phe Gly Leu Met Met Thr Ser Leu Ser Thr
165 170 175
Glu Tyr Tyr Gln Phe Ile Leu Ala Gln Gly Ile Cys Ser Pro Leu Gly
180 185 190
Ala Ser Ala Ile Phe Asn Ala Ser Ile Asn Ser Val Ser Thr Trp Phe
195 200 205
Ala Lys Arg Arg Ala Phe Ala Leu Gly Val Thr Ala Ser Gly Ser Ser
210 215 220
Leu Gly Gly Val Ile Phe Pro Ile Met Val Thr Asn Leu Ile Pro Glu
225 230 235 240
Val Gly Phe Pro Trp Ala Met Arg Ile Cys Ala Phe Leu Ile Leu Ala
245 250 255
Met Leu Gly Val Ser Asn Leu Thr Leu Lys Ser Arg Leu Lys His Thr
260 265 270
Arg Lys Pro Phe Asn Phe Met Asn Phe Val Arg Pro Leu Lys Asp Ile
275 280 285
Lys Phe Val Val Thr Val Ala Ala Ala Phe Cys Phe Phe Trp Gly Met
290 295 300
Phe Leu Pro Phe Thr Phe Val Ile Thr Gln Ala Gln Arg Tyr Gly Met
305 310 315 320
Ser Glu His Leu Ser Gln Tyr Leu Ile Pro Ile Leu Asn Ala Ala Ser
325 330 335
Val Phe Gly Arg Thr Leu Pro Gly Tyr Leu Ala Asp Arg Val Gly Arg
340 345 350
Tyr Asn Val Met Ile Phe Phe Ser Tyr Leu Ser Gly Ile Leu Val Leu
355 360 365
Ala Leu Trp Leu Pro Ser Arg Ser Asn Ala Pro Ala Ile Val Phe Ser
370 375 380
Ala Leu Tyr Gly Phe Gly Ser Gly Ala Phe Val Ser Leu Ala Pro Ala
385 390 395 400
Leu Ile Ala Gln Ile Ser Asp Val Arg Glu Val Gly Val Arg Asn Gly
405 410 415
Thr Cys Phe Ser Ile Ile Ala Phe Ala Ala Leu Thr Gly Thr Pro Ile
420 425 430
Gly Gly Ala Leu Val Pro Asp Val Leu Thr Gly Ser Tyr Thr Arg Leu
435 440 445
Gln Val Phe Ser Gly Val Val Met Leu Ala Gly Ala Thr Leu Phe Val
450 455 460
Val Ala Arg Leu Val Val Gly Gly Val Lys Phe Gly Lys Ser Leu Gly
465 470 475 480
Ser Gly Val Leu Met Gly Cys Ile Ser Asn Gly Leu Ile Glu His Asp
485 490 495
Arg Arg Met His Trp His Tyr His Val Val Ile Cys Cys Ala Ala Thr
500 505 510
Asp Ser
<210> 11
<211> 872
<212> PRT
<213> Penicillium brasilianum
<400> 11
Met Cys Gln Asp His Asp Leu Glu Cys Ser Tyr Thr Leu Pro Arg Lys
1 5 10 15
Thr Arg Phe Tyr Gly Ser Val Asp Asp Leu Ser Asp Arg Tyr Lys Cys
20 25 30
Leu Glu Ala Ile Val Arg Ala Ala Phe Pro Asn Asp Gly Ile Ser Thr
35 40 45
Val Pro Glu Leu Ile Arg Leu Gly Glu Arg Met Gly Tyr Ala Met Pro
50 55 60
Asp Leu Ser Gln Lys Ser Gly Glu Ser Pro Arg Ile Glu Glu Leu Val
65 70 75 80
Arg Asp Phe Pro Thr Glu Ala Gly Asp Gln Gly Leu Ala Gly Ser Thr
85 90 95
Gln Cys Thr Ser Ser Pro Pro Arg Thr Gly Ala Val Asn Val Pro Thr
100 105 110
Glu Ser Glu Arg Arg His Ser Ser Ser Gln Val Gln Glu Asn Asn Ser
115 120 125
Cys Pro Asp Glu Pro Val Gly Leu Ile Arg Asp Thr Thr Gly Arg Glu
130 135 140
His Phe Ile Gly Pro Ser Gly Ser Leu Gln Phe Leu Gly Gln Leu Arg
145 150 155 160
Arg Leu Leu Leu Ile Ser Arg Ser Gly Asp Ala Val Glu Ser Arg Ala
165 170 175
Pro Ala Arg Leu Thr Ala Thr Phe Thr Asp Glu Asp Ala Ala Gln Ala
180 185 190
Leu Glu Ala Asp Gly Asp Gln Ser Glu Leu Ala Ala Leu Pro Ser Gly
195 200 205
Gly Thr Gly Asn Gly Gly Asp Glu Gly Gln Glu Ile Asp Glu Arg Ser
210 215 220
Pro Ala Ser Leu Gly Ser Ala Leu Val Arg Asp Phe Ser Ser Ile Pro
225 230 235 240
Val Asn Asp Ile Asp Glu Met Arg Arg Gln Leu Pro Pro Arg His Val
245 250 255
Leu Asp Ser Leu Met Arg Val Tyr Phe Lys Asn Val His Pro Asp Phe
260 265 270
Ala Leu Phe His Arg Gly Thr Phe Glu Glu Glu Tyr Glu Thr Phe Met
275 280 285
Ser Lys Gly Arg Tyr Tyr His Gln His Ala Arg Ala Gly Val His Leu
290 295 300
Ser Ser Pro Thr Leu Pro Glu Pro Gly Trp Leu Gly Cys Leu His Met
305 310 315 320
Met Ile Ala Phe Ala Ser Leu Asn Gly Ser Val Asp Val Ala Pro Asp
325 330 335
Leu Asp Leu Thr Ser Leu Cys Arg His Cys Ala Ser Leu Thr Arg Gln
340 345 350
Leu Leu Pro Gln Phe Ile Ser Lys Cys Thr Leu Ser Asn Val Arg Ala
355 360 365
Leu Leu Leu Leu Ser Leu Phe Leu His Asn His Asn Glu Arg Asn Ala
370 375 380
Ala Trp Asn Leu Val Gly Thr Ala Met Arg Leu Ser Phe Ala Met Gly
385 390 395 400
Leu His Arg Ala Ser Asp Asn Gly Ser His Phe Arg Pro Ile Glu Arg
405 410 415
Glu Val Arg Lys Arg Val Phe Cys Thr Leu Tyr Gly Phe Glu Gln Phe
420 425 430
Leu Ala Ser Ser Leu Gly Arg Pro Ser Gly Phe Tyr Asp Phe Glu Asp
435 440 445
Val Glu Ile Val Pro Pro Arg Glu Gly Val Leu Asp Ser Gly Gln Asp
450 455 460
Glu Asp Asp Glu Val Met Lys Leu Ser Leu Arg Leu Gln Val Ile Leu
465 470 475 480
Ala Lys Ala Arg Val Ser Leu Ala Val Lys Thr Leu Ala Val Ala Asn
485 490 495
Glu Arg Gly Asn Ile Asp Gly Leu Ala Arg Gln Gln Gln Ser Ser Arg
500 505 510
Glu Thr Leu Glu Ile Leu Lys Ala Trp Arg Glu Asp Leu Ala Ser His
515 520 525
His Ile Leu Asn Ile Pro Leu Ile Ser Glu Thr Asp Asp Pro Leu Cys
530 535 540
Gln Tyr Ala Glu Glu Ile Pro Arg Met Ser Leu Gln Asp Leu Lys Ala
545 550 555 560
Met Met Gly Trp Gln Ser Arg Pro Arg Leu Arg Ala Ala Leu Val Leu
565 570 575
His Leu Gln Tyr Arg Tyr Ile Ala Val Leu Val Thr Arg Ser Ser Leu
580 585 590
Leu Arg Tyr Val Ala Ser Ala Gln Arg Gly Glu Pro Glu His Glu Ala
595 600 605
Leu Leu Ser Arg Asn Glu Ala Arg Thr Asp Pro Tyr Asn Ser Glu Ala
610 615 620
Gly Glu Arg Leu Ser Asp Ile Cys Val Thr His Ala Thr Gln Leu Cys
625 630 635 640
Arg Leu Ile Leu Leu Ala Asp Ser Phe Gly Leu Val Asn Gly Ile Ser
645 650 655
Ala Met Asp Val Phe Tyr Val Tyr Cys Gly Val Met Val Leu Ile Leu
660 665 670
Arg Ser Leu Arg Ile Ser Ser Ser Ala Ser His Tyr His Asp Gln Arg
675 680 685
Glu Ala His Leu Gln Leu Glu Leu Arg Lys Leu Ile Ala Gln Thr Arg
690 695 700
Glu Val Leu Ile Arg Val Asn Lys Cys Ser Thr Met Lys Arg Phe Ala
705 710 715 720
Arg Val Val Ala Thr Phe Glu Asp Gly Ser Arg Gln Asp Asn Ile Arg
725 730 735
Pro Ala Asp Gly Ser Thr Asn Arg Ser Thr Ala Asn Cys Glu Met Arg
740 745 750
Thr Ala Arg Gln Ala Ser Arg Asp Pro Arg Gly Arg Phe Asn His Ser
755 760 765
Ile His Ala Ala Leu Asp Gly Gly Arg Ala Ser Asn Leu Ala Ile Phe
770 775 780
Pro Gly Ala Gly Gly Ser Leu Asp Thr Ser Ser Ser Leu Pro Val Ser
785 790 795 800
Gln Gln Glu Pro Leu Asn Phe Gln His Gly Tyr Gly Asn Gly Ile Gly
805 810 815
Pro Arg Leu Gly Ile Ser Asp Pro Phe Trp Gln Pro Asn Leu Leu Thr
820 825 830
Ser Phe Asp Gly Glu Pro Glu Ala Asn Gly Trp Met Met Asp Pro Phe
835 840 845
Leu Ala Met Asp Gly Thr Gly Val Val Asp Trp Gly Asp Ile Glu Ser
850 855 860
Leu Leu Ser Arg Asn Pro Gly Gln
865 870
<210> 12
<211> 1056
<212> DNA
<213> Penicillium brasilianum
<400> 12
atgggctcgc tatctctacc ggagacgtct cttgcggcaa tccaagataa ggagaccaag 60
gccatctccg tcgccaaacg cccaactcca gtccccgtcg gcactcaagt cctcgtcaag 120
ctacactact ccggtgtctg cgccacagat ctccatctgg cccgcggcag cgtcccctat 180
ctgcagccca aggtctcggt aggcggccat gagggcacgg gggtaatcgc cagcctcggc 240
cccgacgtgg acgccgcgga gtggcacgtc ggcgaccggg tcgcggtgcg gtgggtgcac 300
atcgtctgcg ggaagtgcga ggtgtgcact accggctttg agaacctgtg ccaaagccgg 360
aagctcgctg gcaaggacgt tgagggcacc tttgccgagt acgctattgc ggacagctcg 420
tacatggtcc gcctgccggc tggggtgagc gacgccgatg ccgctccgat actgtgcgcc 480
ggtgtcaccg tctacaaggc gctcaagatc gccagcctcc gggcgggctc gtgggtcgcc 540
gtggccgggg ctggtggcgg cttgggtcat ctggctattc aatatgcacg tgccatgggg 600
ctcaaggtcg tggccctgga tgctaggaaa cgggatctct gcctgagcct gggcgcggaa 660
tcgtacatcg acgtgctcga aacggacgac tgcgtagccc aggtgatcaa ggtcacggat 720
gggggcgctc atggcgcact catctgcgcc tcgtccggcc aggcctatga cgatgccgtc 780
aaattcctaa gatggaccgg caccctggtg tgtatcggcc tccccccaaa gccgacactg 840
ctctccctag gccccgcgga cttcgtcgcc cgtggcatca aggtcatggg cacatccaca 900
ggtgaccgcc aggacacggt ggaggccctc gcctttgtcg ccaagggcca ggtaaaaccg 960
cagttaactg agagaaggct ggaggatgtt gaggagatct taaaggagat cgagaatggg 1020
actatgcagg gtaaagctgt gatcaggata gcctga 1056
<210> 13
<211> 1020
<212> DNA
<213> Penicillium brasilianum
<400> 13
atgagtctgc cgtctcacta caaacgggcc gcctttaaag aggctggcgg cccgctcacc 60
attgaagaag tcgacttgac catgccggat gctggcgaag tgctggtgaa ggtggaagct 120
tgcggagttt gtttctccga cacggttcca caggctcatg gcctgggggg gaaatttcca 180
atcgtacccg gtcatgaaat catcggacat gtggttgcga caggtgacgg tgtctcggac 240
tgggaggttg gcgatcgtat cggcgaagga tggcacggcg gccatgacgg aacttgtccc 300
tcctgtcgcc agggccattt ccaaatgtgc gacaatcaga gcatcaatgg ggtgaccaaa 360
aacggcggat atgcccaata ctgcattctc cgtagtgaag ctgctgtcag aattcccact 420
catgtctcag ccgccgagta tgccccaatt ctctgcgcgg gcgtgaccgt cttcaactca 480
atgcgtcaaa taggggtcaa acctggctct accgttgcca ttcagggtct gggaggtctc 540
ggccatcttg ccatccaata tgcgaatcgc ttcggcttcc gagtggtggc catctctcgc 600
gatgatcaaa aggagcgatt tgtgcgagac ctcggtgccc acgagtatat caatacaagc 660
gaagaagatg tcggaagcgc gctccagaaa ctgggaggtg cttctctgat tgtagccacc 720
gcgcccaatg cccgggccat ttcccctcta ttgaagggcc ttagacctct gggtaagctt 780
cttattctcg ccgttccggg tgaaatcccc ctcgatacac ggcttatggt cgcccgaggt 840
ctttctgtcc acggatggcc gagtgggcat gcacttgatt ctgaggaaac cattcgcttt 900
acagaattag aggatatcaa gtgtatgatc cagacatatt ctcttgatcg tgccaatgaa 960
gcattcgatg ccatgatttc ggggtcggtt cgattccgtg cggtgattac catggagtaa 1020
<210> 14
<211> 1518
<212> DNA
<213> Penicillium brasilianum
<400> 14
atgactcaaa ccaacgtcca tgtcaacaag tctgatactt cactggcagc tccgcaacag 60
ttattcatct cgggaaaata ccagaacagc cagaggaatg ggaccttccc cgtgaagaac 120
cccatgacgg gcgagaccat atacgagtgc gtctcagcct ctctagacga ctacgccgcc 180
gccatcgagg aagcagatgc agcccaacct tcgtgggctc gcctcggccc ctcagcccgg 240
cggttgatcc ttctcaaggc cgccgacatc atggagacgt acatcgagac agacgcgccg 300
gccatccttt cagccgaggt ttcggccact aggggatggg tcagggccaa cattctgtcc 360
acagccggcg tcttccgcga gaccgccgcc ctggcaacgc atatcaaggg agagatcgtt 420
cccgcggacc ggccgggcac cacgatcctg gtgagccgcg agcccgtcgg cgtggtcctg 480
gccatcagcc cctggaatat gcccgccaca ctgacggcca gggcgatctg ctgcccgctg 540
atctgcggga atagcgtggt cctgaggccg tctgagttca gccccaagtc gcagcacctc 600
gtcgtgcgcg ctctgaccga ggctggactg ccggcggggt gcctgcagtt cctgcccacc 660
agcaccgccg acacgccgcg agcgatcgag tttgcaatcc gacacccgaa ggtgagccgc 720
gcaaacttca cgggcagcga ccgcgttggc cgcatcatcg ccgggctatc ggcatcctgt 780
ctgaagccgt gcgtgctgga gctaggcggc aaggcgcccg tcgtggtcct ggaggatgcc 840
gatgtggagg ccgccgtgga ggcagtggtg tatggcgcga tgtccaacag cgggcagata 900
tgtatgtcca cagagcgggc gatcgtgcat cgctccctgg cagcggactt caaggccctg 960
ttggtgaaac gggcggagag cctgcgggta gggaaccacc tcgaggaccc ggacgtgcag 1020
ctctcgggcc ttttcactgc cgcctccgcc gagcgtgtac tcggcctgat caagggcgcc 1080
gtcaacgcag gtgccacgct cctggcgggc gatctggctc ttcacggacc gtgccagaca 1140
atcatggctc cccacatcct cacgggcgtc acgcgggata tggacctctt ccatcgggag 1200
acgttcggcc ccgtgctctt cgtgtccgag ttcgacacgg acgatgaggc catcgcgcag 1260
gccaacgaca ccgagttctc tctgtgtgcc agcgtcttct cgcgtgacgt cctgcgcgcc 1320
atggacacgg ccaagcggat ccggacaggg agctgccacg tcaatgggcc gaccgtgtac 1380
atcgaggcgc cgctgcccaa cgggggtgtc ggcggcggga gcggctacgg ccggttcggt 1440
ggtgtggcgg gcatcgagga gtttacggag aggcagatcg tgagcttagc gaagccgggg 1500
attaagtatg cgttctag 1518
<210> 15
<211> 1284
<212> DNA
<213> Penicillium brasilianum
<400> 15
atgcctcacg catccagatc attgaacgtt ctcatcgtcg gtgctggctt gggcggcctc 60
gcggcgggat tagctttgca gacggacggc cacaaggtca caatcattga tgccgctcct 120
gagttcgcag aggccggagc ggggatcagg atcccaccca actcgagccg gctgctcatg 180
cgatggggcg ttgatctgga gaggatgaag aagtcgactt cacagagata tcacttcatc 240
cgctggaagg atggcagcac catcttcgac ttgcccttca acaatatcgt cgagacacac 300
ggggcgcctt actggcttgt ccatagagcc gacttgcacg ccgctctgct cgatgcgacc 360
ctgaaggccg gtgtcaaggt tctaaacaac aagcttgtca cgtcctacga cttcgaggca 420
ccgagcgcca ccacacagga tggcgagacc ttcaaggccg atcttatcgt cggtgcggac 480
ggcataaagt ccatctgccg accccttctt accggtcagc cggacgtccc gcgggacacg 540
ggcgacgtcg cctatcggat tctcatccct ggtgagaaac tgctggccga cccggacctg 600
gcccatctga tccgcgaccc ttgcacgaca tcgtggtgtg gcccggacgc gcacctggtc 660
ggctacccga tccgcaacgg cgagatgtac aacatcgtca tgtgtgccac ctcctacaac 720
gagaccacgg acgaggtctg ggtcgtcaag ggcgacaaca gcgagctgtg caagcgcttc 780
gccagctggg aaccccaggt gcggaagctc tgcgccctca cgggcgactt catgaagtgg 840
cgcctgtgcg acctgcccaa cctcgcccgc tggacgcacc cctcgggcaa ggccgtgctg 900
ctgggcgaca gctgccaccc catgctgcct tacctggccc agggcgctgc ccaggccgtc 960
gaggatgccg ccgtcctgcg ccaggtgctc gcccaggaca tggacatggc cgcggcccta 1020
aagcagtatg agcagatccg catgccgcgg gcgagcctgg tgcaggccaa gactcgcgag 1080
caccagtaca tcctccacgt cgacgacggt cacgagcagc aagaccggga caagaagttg 1140
gctctcgatg cggcggagaa cccggtcttc tggggctacg acgaccggag aaaatggctc 1200
tttagccatg atgcagaggt gatccaaaaa gaaggtgcga actggagaga cgggcccaac 1260
atgaatggcg tgcatgttgc ttag 1284
<210> 16
<211> 738
<212> DNA
<213> Penicillium brasilianum
<400> 16
atgtctctgt ctggcaaagt cgtcctcatc accggctcct ccaagggaat cggcaaagct 60
gctgcccttc gtgtcgccag cgaaggtgcc aacgtcgtga tcaactatct tcgtgacccg 120
gttgcagcca acaatctcgt cgaccaaatc ggtgccgacc gcgcccttgc tgttcaagct 180
gatgcttcaa agctggccga cctcgatcgc ctcgtcaatg ccgctgtcgc ccagttcggc 240
aagatagatg ttcttattcc aaatgccgga atcctcccgc ttagagactt ggagcatact 300
agcgaagagg actttgacag aacctacaat ctaatggtaa agggaccata cttcctggcc 360
cagaaagccg tgaagcatat gccccctgga ggacgaatca tctttgtctc tacctcaacc 420
gcccgattcg caagcgtggc tcccgcatac ctactctaca cctcctccaa aggcgcgatc 480
gagcagatga cccgaatcat ggccaaggat ttggcgcgaa agggaatctt ggtgaatgcg 540
gtcgctcccg gtccaacttc aaccgaactc ttcctcgagg gaaagccgga gcaaatgatc 600
aaggctatct ctgggtttag tccattcaat cggatcggag agcccgagga aattgccgca 660
gtcatggcgt tcttgtctgg gaaggacagc agttggatct caggacaggt tgtggctgtg 720
aacggagcta tggcatga 738
<210> 17
<211> 1746
<212> DNA
<213> Penicillium brasilianum
<400> 17
atggcatctc tcattcgaga ggcccccttt gggcaaatag ttcgatatct caccaacaac 60
aaatatttcc aatatcccga agaaaagccg gacttcaaac ttcccgatac atggcttcaa 120
ttattgaacg aatcggatgc cgcgacgata gccgatcccg agaaaacgga gccggagcca 180
gagggtcagg gctacgatgc aaccagcgag gcgattagtc gcgcatcaac ccaaaactcc 240
ttgcccttca cagaagctcg actggaagcg gatgagcagc atgagatcga aaagatcaag 300
tccattccta ttcagcctaa aaagaccaag gatggtgcga ttttggtcga ctggtactat 360
accgatgatg cagagaaccc acacaattgg tcgaatcgaa agcgagcact tctgacgacg 420
ctcatttgtc tttatacctt tgtggtatac acgacctctg caatttacac atcctccgtg 480
cccgggatca tgaaggagtt cggcgtcagt gacttggttg ctacactggg actgtccttg 540
tatgtccttg gctatggaac gggtcccctg atcttctcgc ctctgagtga gatccccgtg 600
attggtcgga acccggtcta tatcgtgacc atgttcctct ttgtgattct ctccattccc 660
actgcttttg tgggtaactt tgcaggactc atggtgcttc gtttcctgca aggattcttc 720
ggctcgccct gtctcgcttc tggaggtgct tcaattggcg acatgtacag tctcatgtct 780
ctcccttatg ccatgatgag ctgggtgtct gccgcttact gtggtcccgc cctgggtcct 840
ctcatcagtg gcttcgcagt tcccgccgag acctggcgct ggtccctgtt tgaatccatt 900
tggatgtcag ctccagtcct cattctgatg ttcttcttcc tccccgagac tagcagtgca 960
actatcctgc tccgtcgtgc cgctcgtctc cgcaagatcc ataacaacgc acgcttcatg 1020
gctcagtccg agattgacca gcgtaacatg aaggtctcgg ccgttgctgt cgacgccctg 1080
attaagcctt tggagattac catcaaggat cccgcggtgc tcttcgtcca ggtctacacc 1140
gccattatct acggcatcta ctactccttc ttcgaggtct tccccctggt ctaccccgtc 1200
gattatggca tgaatcttgg ccaagttggc ctggtcttcc tgtgtatcct ggtgtcctgc 1260
atcatcggta tcgccatcta ctggtcttac ctttacttct ggatgaaccc tcgcattgaa 1320
cgcttcggat tcccagctca agagtcccgt cttatccccg ccctgccagc ttctattgga 1380
cccaccattg gcttgttcct ctttgcctgg acagcccgtg cctcaatcca ctggattgcc 1440
ccgacaatcg gaatcaccat ctacggtgcg acggtcttca tcgtgatgca gtgcttgttt 1500
gtctacatcc ccttgagcta tccaatgtac gccgctagtc tgttcgctgc gaacgacttc 1560
ttccgcagtg ctctggcttg cggtagtgtc ctgtttgctc acccgttgtt tggcaacctc 1620
ggtgtcgctc ggggtaccag tctactcggt ggtctgagtg tgattggtat tatcggaata 1680
tggctgcttt actactatgg tgcccggctt cgctctttga gcaagtttgc catctccgat 1740
gattga 1746
<210> 18
<211> 1542
<212> DNA
<213> Penicillium brasilianum
<400> 18
atgagcacga ccaaggaagc tttcccacat acggatagcg acataatgga ggactcggag 60
aagaatctcc cagagtgcga gcatatcgtc tccgtggagc ccaccctcaa gatgcgcgac 120
ggcatcgtcc tgatgccgca accgtccgac gaccccaacg acccgctcaa ctggtcctgg 180
ttccgcaagc acgccgccat gttcaccctc tcgtatttgg ccctcgtctg ttacgtggct 240
gtgaccacgc tggttacggg aacagtgccc ctagccaagt ccatgcatgt ctccaagtcg 300
acggccgtct atctgggcaa cacgcccgtc gctctctacg ccgtggcgcc ctggttctgg 360
agcccgctga gccactttat aggccgtcgc ccggtgctgc tgatgtgtaa tatcatcgcc 420
gtcgtcgggg cggtcgttgt tacgacgtcc aagacatatg cgtcttgcat ggttggccgc 480
gtcatcctcg gtgccggtgg ttcggccttc tggacactgg ggccagccag tattggggac 540
attttcttcc gccacgagaa gggcaagaag attggtgtgt cgaccttggc cattgtgatc 600
gccccattct tggggacaat catcggcgga cccatcatag aaaacgagaa gctgggctgg 660
ccggcctccc agtggatccc cctgattttc atggccgccg gcttcatcat gcagatcttc 720
ttcctcccgg agaccatcta catccgagag acacgcgcgc atcctgcaat catgtccaca 780
tctacgccgg gcaagcccac gttctgggac cgctatggga tccacatccc caagcgctcg 840
gaggagaagc agcacagctt tctcttcatc gcgacgcgcc ctttcgtcct cttcaagttc 900
cccgcggtga tactgtcggc cttctggttc ggcatcgcct acatgatgca cgtgggcatc 960
acgtccgaga tcccgctcat cttcgaggag cactacgatt tctccgtgct cgagatcggg 1020
ctgtcgggct tctcgggact catcggcgcc ctgctcggcg aggtatacgc gggaccctcg 1080
ctggatttca tcgctaagcg gaccatgaag cagggtcgcg agtggcgccc cgagtaccgc 1140
ctgcaggcga tctggccggc gcttattacc gtgccggctg gtctgatcat gttcggcaca 1200
tcgatccagt tcggaaatgt ttggatcact cctctgatcg ggcaggccgt ttatatcttc 1260
ggcatcgaga ttgccaccac ggttattcaa acctacattt tagaatgtta ccctcgccag 1320
ggcgccgagg cgaacttggt cttcaacctc atccgcaacc tgttctccta tataagtccg 1380
ttctttgtgc agccaatgat cgccaccctc ggtaccacct ctccgtttgg tctctctgct 1440
gccttgactg ccttcttctt ccctttcact gtgggtgtct tgatgtggcg gggcaaacag 1500
atccgggata aaggaggcga cccgggctgg agcagggatt aa 1542
<210> 19
<211> 4308
<212> DNA
<213> Penicillium brasilianum
<400> 19
atggaggacc acgaaaaaga atacgatagt acctcacctc ccggaacggc cacggaagaa 60
gggaatggag gttacttcaa taccctcacc gttcctgaaa tcaacctccg agaagccagc 120
agtgccgaaa ccttaactcc tcacgcctcc gtcgtccaac ctcccaaaaa ggccgcagaa 180
tggcatatga caccacaagt cattcgcaat gccgaacgtg atgaagcagc tggttttaaa 240
aggcgtgagc tgggtgtcac ttggcaagac ctgtcggtcg aggttctcgc tgctgaagcg 300
gctgtcaaag agaacatgat ctcccaattc aacgttcctc aactcatcaa ggatttccgc 360
cgcaaaccac cactcaagtc gatcttgtcc aacagccatg gatgtgttaa gcctggagaa 420
atgcttctcg ttcttggaag acccggatcc ggatgcacta cccttctcaa aatgcttgcc 480
aaccgtcgtg agggatatca gaacatcacc ggagatgtaa gattcggaaa tatgactccg 540
gaagaagcat caagatatca aggccagatt gtgatgaata ccgaggagga gcttttctac 600
cctcgtttga cggtgggtca gacaatggat tttgctacca agcttaaggt cccatatcac 660
cttcctggag aagggaagag cgttgctgag tataccgccg aaacgaagca attcctcctc 720
gagtctatgg gaatcgccca tactgccgat acaaaagttg gcaatgaatt cgtccgaggt 780
gtcagtggtg gagaaagaaa gcgagtgtct attattgagt gccttgccac aagaggctct 840
gtttttactt gggataactc aacgagagga ctcgatgctt ccacggcctt agagtgggcc 900
aaagcccttc gcgccatgac cgacgtccaa ggtctttcga ctattgtaac gctctatcaa 960
gctggaaatg gaatttataa tcttttcgac aaagttctcg tcctcgacga aggaaagcag 1020
atctattacg gccctgccgc ggaagcgaaa cctttcatgg agaaccttgg ctttgtttac 1080
actgatggtg ccaacattgg tgatttcctc acggggttga ctgttccgac cgagcgaaag 1140
atcagacctg gttgggaaaa tcggttcccc aggacggccg acgccatttt gaccgagtac 1200
cagaactcgg cgacatataa gaatgaagtc tcactatacg gatatcccga cactgacctt 1260
gctgccgaac gcactgaggc cttcaaggaa tctgtggcct gggaaaagtc taaacactta 1320
cccaagggta gtgacctgac tactagtttc tgggcccagc tcatgtcatg cacggctaga 1380
cagtaccaga tcctctgggg cgagaagagc acgttcctga tcaaacagat tctgtcttgt 1440
gtcatggcct tgattgccgg gtcttgcttc tacaactctc cagatacctc tgcaggtctc 1500
ttcaccaagg gtggtgccgt tttcttctcg ttgctttaca actgcattgt ggccatgtcc 1560
gaggtcaccg aatctttcaa aggtcgtcct attttgacga aacacaaatc ttttgccatg 1620
tatcacccgg ctgctttctg tctggcccaa attactgcgg atttcccggt gttactgttc 1680
caatgcacga tcttctcggt cgttatctat tggatggttg gattgaagca taccgcggct 1740
gcatttttca ctttctgggc aatccttttc actacgacct tgtgcatcac agcgttattc 1800
agatttatcg gcgctgcttt cagtagcttc gaagctgcat ccaagatcag tggcaccgct 1860
gttaaggcaa tcgtcatgta tgcaggttac atgattccaa agccagagat caagaactgg 1920
ttcctcgagt tctactacac caatccgttt gcttatgcat tccaagctgc tttgaccaac 1980
gaattccacg accagcatat cgactgcgtt ggcggtaatc ttattcccag tggtcctgga 2040
tacgaggatg ttggatccgg ctataaagca tgtgctggag ttggtggtgc tcttcctggt 2100
gcagattatg tgactggaga tcagtatctt tcttctctac actacaagca ttctcaattg 2160
tggcgaaact tcggcgttgt ctgggcctgg tggggcttct tcgctgttct cacggtcgtc 2220
ttcacttgct tctggaaatc tggtgctgca tctggatctt cgcttctcat tccccgcgag 2280
aaccttaaga aacaccaagt tggcaatgat gaggaagccc aaaacaatga gaaacatgcc 2340
gctcggacga ccaccgatga gccagttcaa gtcgaggatg acaatcttgt gcgcaacaca 2400
tctatcttca catggaagaa tctcacctat acagtcaaaa caccaactgg cgaccgagtc 2460
ctcctggaca acatcaatgg atgggtgaaa cctggtatgc ttggtgcact catgggatct 2520
tccggagccg gcaaaacaac tctacttgat gttcttgcac agcgcaagac ggaaggtacc 2580
atcaaaggct ccattttggt tgacggtcgc gaattacctg tctctttcca aagaatggcc 2640
ggctactgtg agcaattgga tgttcatgag tcttacgcca ctgtgagaga agccctggag 2700
ttttctgctc tcctgcgaca gtctcgagat actcctaaag ctgagaaact taaatacgtc 2760
gacacaatta ttgacctctt ggagctgcat gatctcgccg acactctgat cggttccgtg 2820
ggtaatggct tgtctgttga acagcgcaaa cgtgtgacaa tcggtgtgga gctcgtgtcg 2880
aagcctagta ttctcatctt cttggatgag cccacttcag gtcttgatgg tcaatctgcg 2940
tataacactg tcagatttct tcggaaacta gccgatgtgg gccaagcagt tcttgtcacg 3000
attcaccagc cttcagctca gctattcgct caattcgata cccttctact ccttgcgaga 3060
ggtggcaaaa cggtctactt tggtgacatc ggggacaatg gatccacgat taagcagtac 3120
tttggcaatt acggggctat ctgccctcaa gaggcaaatc cagcagagtt catgattgac 3180
gtcgttaccg gtggtatcca agaagtgaag gacaaggatt ggcatcagat ctggcttgac 3240
tctcccgagc agcatcagat gatcaccgaa ttggacagaa tgattgcaga tgccgctagt 3300
aagccaccgg gaactgtcaa tgatggctat gagttttcaa tgcctctctg ggaacagatc 3360
aagattgtca ctcagcgcat gaacgtctcg cttttccgta atacggccta tgtcaacaac 3420
aagttctcgc ttcacatcat ctcagcattg ttgaacggat tctctttctg gcgacctggt 3480
cctagtgtga gtgcgttgca gctgaagatg ttcaccatct tcaattttgt tttcgtcgct 3540
ccaggtgtca tcaatcaact ccaacccctc ttcatccagc gccgcgatat ctacgatgct 3600
cgcgaaaaga agtccaagat gtattcctgg gtagctttcg tcactgggct tatcgtttcg 3660
gagttcccat atctctgcat ctgcgcagtt ctatactttg tttgctggta ctggcccgtc 3720
tggagattgc ctcatgactc tgaccgttct ggagccatct tcttcatgat gttgatctac 3780
gagttcatct acactggtat tggccagttc attgctgcgt atgcaccgaa cccaaccttt 3840
gcggcacttg tcaacccact tatcatcagt gttcttgttc tcttctgcgg tgtgtttgtg 3900
ccatatgacc agctgaacgt attctggaag tactggatgt attacctcaa cccattcaac 3960
tatgtcgtca acggcatgtt gactttcggt ctctggggcc agaaagtcac ctgcaatgag 4020
agcgagtatg cagtctttga tccgctcaat ggtacttgcg gcgagtatct ggcgacttac 4080
atgagtggca agggcagcgg agtcaatctg ctcaacccgg acgctacctc gagctgcaag 4140
gtctgtgagt acacaactgg aagtgacttc ctacagacgc tcaacatcaa ccattactat 4200
tatggatgga gagatgcggg catcactgtt atctatgcta tctcgggcta tgcacttgtg 4260
tttggtctga tgaagctccg gaccaaggcg tccaagaagg cagagtaa 4308
<210> 20
<211> 1584
<212> DNA
<213> Penicillium brasilianum
<400> 20
atgacaccta tctcgcgcct attgtcccgt gcggtcaata aaccctaccg aacgaaagat 60
atcacggacg agattccgcc tacactcgat gaagatggat ttgtgagctt tggcccgggg 120
gacattgaga accctcggaa ttggtcgatg cgccgccgag ctggtgtgac aatgtctgcg 180
gtgcttttag ttgtgaatgc cacttttgcc tcgagctcgc cgagcggatg tttcccatca 240
atctcaaagc atttcggtgt ttccactgaa gttgccggat tgacgataac tctgttcctg 300
ctagggtact gtgctgggcc tttgattttc gctccgctga gcgagttcta cggtcgccga 360
tggatcttct acattacctt tctgctttat ctggccttca actttctttg tgcattcccg 420
ccgaattttg gaagcttgtt ggttggaaga tttctgacgg ggacctttgt gtctgctcca 480
ttgagtaact gccccggtgt tttggccgat gtatggaatc cgcttgagcg cgccaatgct 540
atggctgggt tctcggcaat ggtctggatt gggccagcac tcggacctgt ggttgcaggt 600
ttcctgcagt tgaaagaaga ttggagatgg agcttctatg tgcttctctg gctcggtgga 660
gcatcagccg tcatcatgtt gacaataccc gagacttacg cgccgattgt tctgtataac 720
aaagcacgac ggatccgcga ggcacagatt cccggatatg aaaacgtgaa agcccctgtc 780
gaggacggtg accggactct cgtgggcatc tataaggttg ctctgactcg gccgtggatc 840
attctgttcg acccgatctc cttgctgtgt gcaatttaca tggcgttcgt ctatacattg 900
ctctacatgt tgtttaccat ataccccatt gtgtttcagg aaaaacgggg ctggaactct 960
ggtgttgggg agctgccgtt gctgggaacc gtcgtaggtg ccctatttgg tggtgttatc 1020
gttgtagcag acacccggat gcgccagaaa aggattgaca acggtacgac aaagatggaa 1080
gatgctgtgc cggaagaccg tctcccgcta gcgatgggtg gaggcatcgg ctttgccgtg 1140
acgatgttct ggttcgcctg gtcggctgag ttcaactctg tccattggat tgtcccaact 1200
ctggcaggag tgtttctctc cagtgccctg ctactcatct tcgttgggtt cctcaactat 1260
ctcgtggatg tttatcaaat gtacgctgca tccgccattg ctgcgaacac gatcgctcgt 1320
tctgcctgtg gagcggcagc accactattc acatcccaaa tgttcgcggc cttgggcgtg 1380
ggaggaggag gcagcttgat cgcgggtgtg gccaccctcc ttgccgctat tcctttcttg 1440
ttctataagt atgggaagca gattagaatg cgcagcaaat ttgccccgac taccaaagaa 1500
gaacggcccg ccgaagagaa taaagatgaa gagcgtggac tgggagacgg tgctgtcagc 1560
agtagtatct tgggggcgca ataa 1584
<210> 21
<211> 1545
<212> DNA
<213> Penicillium brasilianum
<400> 21
atggctgcca gtaatgagca tgcgactccc tccatcgaca gtgctaccac aaaaaccgct 60
ccgtcagtgg attcaacgcc ggccatgagc gaccatgtga acgaggacct tgagaagggg 120
actcgtacga ccgatcccgt cgaggcagag aagcacgatc tcaatgtaaa cccgctatca 180
gagaaaattg agggcaccac tccagctccc gctggtcctc cggggcctgg ccctccaccg 240
gatggaggag ctgaagcatg gttggtcgtg ctaggagcct tttgcggact gttcgtcagt 300
tttggctgga tcaactgtat cggtgtcttc caaacgtact acgaaaccca ccagctcagt 360
aatttgtcca ccagtacggt gacatggatc acatcattgg agactttcgt catgttcttc 420
gctggtcccg tctttggtac tctctttgat agctatggcc cccgatacat cctcctgggt 480
ggcacattcc tccacgtctt cggcctcatg atgacctccc tctcaacgga gtactaccaa 540
ttcatcctcg cgcaaggaat ctgcagtcca ctcggtgcga gtgccatatt caacgccagc 600
attaactctg tcagtacctg gttcgccaaa cgccgcgcct tcgcactggg cgtcacagct 660
tccggatcga gtctgggagg agtgatcttc cccatcatgg tgacaaatct gattccagag 720
gttgggttcc cttgggcaat gcgcatttgc gcgttcttga tcctagctat gctgggcgtt 780
tccaatctca ccctcaagtc gaggctgaag catacaagga agccgtttaa ttttatgaat 840
ttcgttcggc cgctgaagga tatcaaattc gtcgtcacgg ttgctgcggc cttttgtttc 900
ttctggggta tgttcttgcc ttttacgttt gttatcactc aggcgcagcg atatggcatg 960
tcggagcatt tgtcgcagta tctcattccg atcttgaatg ctgctagtgt ctttggccgt 1020
acactcccag gttacctggc agaccgcgtt ggtcgatata acgtgatgat cttcttctct 1080
tatctctccg gcatcctcgt cctagccctc tggcttccat cacgcagcaa cgcccccgcc 1140
atcgtcttta gcgcattgta cggctttggc tccggtgcct tcgtgtccct cgccccagcc 1200
cttatcgccc aaatctctga tgttcgtgag gttggtgtgc gcaacggcac ctgcttctcg 1260
atcattgctt tcgccgctct taccggtacc cctattggcg gtgccttggt tcctgatgtt 1320
ctgactggct cgtacacgag gctgcaggtc ttcagtggcg tggtcatgct tgcaggtgcg 1380
acactgtttg tggtcgctcg gcttgttgtt ggtggcgtga agtttggcaa gtccctgggc 1440
tctggtgttt taatggggtg catttcaaac ggtttaattg agcatgatag acggatgcat 1500
tggcattatc acgtagtgat ttgttgtgct gccactgaca gctaa 1545
<210> 22
<211> 2619
<212> DNA
<213> Penicillium brasilianum
<400> 22
atgtgccagg accacgacct ggaatgttct tatacacttc cgcgaaagac caggttctac 60
ggcagcgtgg atgatctgag tgatcgatat aaatgcttag aggccatagt acgtgctgca 120
tttcccaatg acggcatctc caccgtcccg gagctcatcc ggctgggaga gcgcatggga 180
tatgccatgc cggacctatc tcagaaatca ggggagtcac ctaggataga ggagctggtg 240
agagacttcc ccaccgaagc tggagaccag ggccttgctg ggtccacaca gtgtacctct 300
tcgccaccaa gaacgggtgc cgtgaatgtc cctactgaga gtgaaagaag gcactcttcc 360
agccaagtcc aggaaaacaa ctcctgtcca gatgaacctg tcggactaat tagagacacc 420
actgggcgag aacatttcat cggcccgtct ggaagcctgc agtttctggg ccagctccgg 480
aggctacttc ttatatcccg cagcggggat gccgtggagt cccgggcacc cgctcgcctt 540
acggccacgt tcaccgatga agatgcagcg caagccctgg aagcagacgg tgaccagagt 600
gagctcgccg ctttgccttc tggaggcact ggcaacggtg gcgatgaagg ccaggagatt 660
gacgagcgct cccctgcctc cttgggttct gctcttgtca gggatttttc cagcattccc 720
gtcaatgaca tcgacgagat gagaaggcag cttccgcctc gccacgttct cgattctctg 780
atgcgagtat atttcaagaa tgtccatccg gactttgccc tattccaccg cggtaccttc 840
gaggaagaat acgagacctt catgtccaaa gggcggtact atcatcagca cgctcgagct 900
ggtgtacatt tatcctctcc cacgttacct gaaccaggct ggttaggctg tttgcacatg 960
atgattgcct ttgcctcgct aaatggctct gtcgatgtcg ctcccgacct ggatcttact 1020
tccctctgtc gccattgtgc cagtcttacc cgccagctcc tgcctcaatt tatctcaaag 1080
tgcaccctct ccaacgtccg ggccctccta cttctatccc ttttccttca taaccacaat 1140
gaacgtaacg cggcttggaa cctggttggg actgccatgc gcctttcctt cgccatgggg 1200
ctgcaccggg ccagcgacaa cgggtcgcac ttccggccta tagaaaggga ggtgcgcaag 1260
cgcgtcttct gcacgctcta cggctttgag caattcctcg cgtccagcct ggggagacca 1320
agcgggttct acgacttcga ggatgtggag atagttcctc cgcgtgaggg agtgctggac 1380
agtgggcagg acgaggacga cgaggtcatg aaactttcgc tgaggctgca agttatcctg 1440
gccaaggcca gggtctccct tgccgtcaag acactggccg tggccaatga gaggggcaac 1500
atcgacggtc tggctcggca acagcagtct tcaagggaga cgctggagat cttgaaggcg 1560
tggagggagg atcttgcctc ccaccacatc ttaaacatcc cgttgatcag tgagacagat 1620
gatccgcttt gccagtacgc cgaggagata ccgcgaatgt cactccaaga tctcaaggcc 1680
atgatgggtt ggcaaagccg acctcgactt cgggctgccc tggtcctgca cctccaatac 1740
aggtacattg ctgtcttggt gacgcggtct tctttgctgc gatacgtcgc gtccgcgcaa 1800
cgtggtgaac cagagcacga agccctgctc agccggaacg aggctagaac cgacccgtat 1860
aacagcgagg caggagaacg gctatcggac atctgcgtca cgcacgccac gcagctatgc 1920
cggctcatct tgcttgcaga ctcctttggc ttggtgaatg gcatatcggc catggacgtc 1980
ttctacgtct actgcggcgt catggtgctc atattgcggt cgctacggat ttctagctct 2040
gcaagccact accatgacca gcgcgaggcg catctgcagc tggagttgcg caagctgatc 2100
gcacaaacga gagaagtgct catacgtgtg aacaaatgca gcacaatgaa gcgattcgcg 2160
cgcgtggtgg ctaccttcga ggatggatca aggcaggata acatcaggcc tgccgatggt 2220
tctaccaatc ggtcaacggc caactgtgag atgcgaacgg ctcggcaggc atctcgtgac 2280
cctcggggcc ggttcaacca ttctatccac gccgccttag atggcgggcg agcgagcaac 2340
ctggcaatct ttccgggtgc aggaggatcg ctggacacgt cctcctccct gccagtctcg 2400
cagcaagagc cgcttaactt ccagcacgga tatggtaatg gaattgggcc gaggctcggt 2460
atatcagatc ctttctggca accaaactta ttgacgtcct ttgacgggga gccagaggca 2520
aacggttgga tgatggaccc attcctcgcg atggacggga ccggcgttgt ggactggggc 2580
gatattgagt ccctcttgtc acggaatcct ggtcaatag 2619
<210> 23
<211> 458
<212> PRT
<213> Penicillium brasilianum
<400> 23
Met Ala Asn Gln Arg Val His Val Gly Ile Val Gly Ala Gly Ile Gly
1 5 10 15
Gly Leu Ala Ala Ala Ile Ala Phe Arg Arg Ala Gly Val Asp Val Thr
20 25 30
Val Leu Glu Ala Ala Asp Glu Leu Leu Glu Met Thr Pro Asn Val Ser
35 40 45
Val Leu Leu Gln Lys Trp Gly Val Ala Asp Val Ile Gly Asp Asn Leu
50 55 60
Val Gln Ile Glu Glu Leu Asn Met Arg Arg Lys Asp Gly Thr Leu Val
65 70 75 80
Gly His Thr Glu Ile Pro Ile Val Glu Lys Ala Leu Gly Arg Pro Trp
85 90 95
Trp Leu Val His Arg Ala His Leu His Glu Gly Leu Ala Thr Val Ala
100 105 110
Lys Arg Leu Gly Ala Val Ile His Ile Asn Ser Arg Val Ile Ser Leu
115 120 125
Asp Tyr Gln Glu Gly Gly Glu Val Thr Val Glu Thr Gln Lys Gly Asp
130 135 140
Lys Tyr His Phe Asp Leu Cys Val Gly Ala Asp Gly Val Asn Ser Ile
145 150 155 160
Val Arg Ser Thr Leu Phe Pro Gly Ile Lys Pro Asp Ala Lys Thr Thr
165 170 175
Asn Cys Ala Tyr Arg Ala Ile Ile Pro Tyr Glu Arg Ile Arg Gln Asp
180 185 190
Pro Ile Ala Lys Glu Leu Ile Gln Lys Leu Thr Met Glu Val Trp Met
195 200 205
Gly His Asn Ala Tyr Ile Ile Thr Tyr Pro Ile Ser Gly Gly Glu Thr
210 215 220
Phe Asn Leu Val Leu Ser His His Arg Pro Glu Lys Leu Tyr Ser Thr
225 230 235 240
Gln Pro Asn Val Pro Val Glu Glu Met Arg Asp Ala Tyr Lys Asp Phe
245 250 255
Asp Pro Arg Ile Lys Arg Ile Val Asp Met Ile Thr Glu Thr Ser Arg
260 265 270
Trp Pro Leu Leu Val Thr Gly Pro Leu Gln Ser Trp Ser Ser Pro Gln
275 280 285
Lys Asn Val Val Leu Met Gly Asp Ala Ala His Ser Met Val Asn His
290 295 300
Met Ala Gln Gly Ala Ala Thr Ser Met Glu Asp Gly Ala Phe Leu Ala
305 310 315 320
Lys Cys Val Gly Ala Val Thr Arg Gly Lys Leu Ser Leu Arg Glu Ala
325 330 335
Ile Asn Ile Tyr Glu Leu Glu Arg Met Pro Lys Ala Phe Met Lys Gln
340 345 350
Gln Val Ser Phe Leu Asn Gly Ala Ile Trp His Leu Pro Asp Gly Pro
355 360 365
Lys Gln Gln Ala Arg Asp Ala Ala Met Ala Pro Ser Leu Asp Gly Lys
370 375 380
Tyr Leu Val Arg Ser Ser Asn Leu Tyr Asp Asp Pro Gln Thr Val Leu
385 390 395 400
Asp Val Tyr Gly Tyr Asp Val Glu Ala His Ala Glu His Ala Leu Ala
405 410 415
Lys Phe Ala His Gly Arg Glu Ala Leu Tyr Pro Gly Thr Gly Leu Ala
420 425 430
Pro Phe Met Glu Asp Lys Tyr Met Gly Trp Phe Ser Lys Cys Gln Gln
435 440 445
Asn Asp Arg Tyr Ala Ala Val Gly Lys Leu
450 455
<210> 24
<211> 1377
<212> DNA
<213> Penicillium brasilianum
<400> 24
atggccaatc agcgtgttca tgttggaatc gtcggcgcag gaataggagg gctggcagcc 60
gccattgcct ttcgacgtgc aggagtggat gtcactgtcc tggaagcagc ggatgaattg 120
ctcgaaatga cgccgaatgt atcggttctg ctgcagaaat ggggcgttgc agatgtgatt 180
ggagacaact tggttcaaat tgaagaactg aatatgcgcc gcaaagatgg cactcttgtc 240
ggacataccg aaataccgat tgttgaaaag gcattgggca gaccgtggtg gcttgttcat 300
cgtgctcatc tccacgaagg cctcgcgact gtggccaagc gtctgggagc cgtgattcat 360
atcaacagtc gcgtcatttc acttgactat caggaggggg gtgaagtcac ggtcgaaaca 420
caaaaagggg ataagtatca tttcgacctc tgtgtgggtg ctgatggcgt caacagcatt 480
gtccgaagca cactgtttcc gggcataaag ccggacgcga aaaccaccaa ctgtgcttac 540
cgggcgatta taccgtatga gcgtatccga caggacccaa ttgcaaagga gctcattcaa 600
aagttgacga tggaggtctg gatgggacat aatgcctata ttatcaccta tcccatcagt 660
ggaggcgaaa cattcaacct ggtgctctcg catcatcgtc cagagaagct ctatagtacc 720
caaccgaatg ttcctgtcga ggaaatgcgg gatgcgtaca aggactttga ccctcggatc 780
aaacgcattg ttgatatgat caccgagact tcacgctggc cgctattggt gaccgggccc 840
ttgcaatcat ggtcctcccc acagaagaat gtggttttga tgggggatgc agcgcactca 900
atggtaaacc atatggcgca aggggctgct acgtccatgg aagatggcgc ttttctcgca 960
aagtgcgtag gggcagttac tcgtggaaag ctgagtcttc gcgaagccat caatatctac 1020
gagctcgagc ggatgccaaa agccttcatg aaacaacagg tctcttttct gaatggtgcc 1080
atctggcact taccggatgg acctaagcaa caggctcgtg atgcggcaat ggcaccgtca 1140
cttgatggga aatatttggt tcgcagcagc aatctctacg atgaccctca gacggtgctg 1200
gatgtatatg gatatgacgt tgaagcgcat gcagaacatg cgctggcaaa gtttgcccac 1260
gggcgtgagg cgttgtatcc aggcactggt ttggcgcctt tcatggagga caaatacatg 1320
gggtggttct caaagtgtca gcaaaatgac cgctacgccg cagttgggaa gctttag 1377
<210> 25
<211> 360
<212> PRT
<213> Saccharomyces cerevisiae
<400> 25
Met Ser Tyr Pro Glu Lys Phe Glu Gly Ile Ala Ile Gln Ser His Glu
1 5 10 15
Asp Trp Lys Asn Pro Lys Lys Thr Lys Tyr Asp Pro Lys Pro Phe Tyr
20 25 30
Asp His Asp Ile Asp Ile Lys Ile Glu Ala Cys Gly Val Cys Gly Ser
35 40 45
Asp Ile His Cys Ala Ala Gly His Trp Gly Asn Met Lys Met Pro Leu
50 55 60
Val Val Gly His Glu Ile Val Gly Lys Val Val Lys Leu Gly Pro Lys
65 70 75 80
Ser Asn Ser Gly Leu Lys Val Gly Gln Arg Val Gly Val Gly Ala Gln
85 90 95
Val Phe Ser Cys Leu Glu Cys Asp Arg Cys Lys Asn Asp Asn Glu Pro
100 105 110
Tyr Cys Thr Lys Phe Val Thr Thr Tyr Ser Gln Pro Tyr Glu Asp Gly
115 120 125
Tyr Val Ser Gln Gly Gly Tyr Ala Asn Tyr Val Arg Val His Glu His
130 135 140
Phe Val Val Pro Ile Pro Glu Asn Ile Pro Ser His Leu Ala Ala Pro
145 150 155 160
Leu Leu Cys Gly Gly Leu Thr Val Tyr Ser Pro Leu Val Arg Asn Gly
165 170 175
Cys Gly Pro Gly Lys Lys Val Gly Ile Val Gly Leu Gly Gly Ile Gly
180 185 190
Ser Met Gly Thr Leu Ile Ser Lys Ala Met Gly Ala Glu Thr Tyr Val
195 200 205
Ile Ser Arg Ser Ser Arg Lys Arg Glu Asp Ala Met Lys Met Gly Ala
210 215 220
Asp His Tyr Ile Ala Thr Leu Glu Glu Gly Asp Trp Gly Glu Lys Tyr
225 230 235 240
Phe Asp Thr Phe Asp Leu Ile Val Val Cys Ala Ser Ser Leu Thr Asp
245 250 255
Ile Asp Phe Asn Ile Met Pro Lys Ala Met Lys Val Gly Gly Arg Ile
260 265 270
Val Ser Ile Ser Ile Pro Glu Gln His Glu Met Leu Ser Leu Lys Pro
275 280 285
Tyr Gly Leu Lys Ala Val Ser Ile Ser Tyr Ser Ala Leu Gly Ser Ile
290 295 300
Lys Glu Leu Asn Gln Leu Leu Lys Leu Val Ser Glu Lys Asp Ile Lys
305 310 315 320
Ile Trp Val Glu Thr Leu Pro Val Gly Glu Ala Gly Val His Glu Ala
325 330 335
Phe Glu Arg Met Glu Lys Gly Asp Val Arg Tyr Arg Phe Thr Leu Val
340 345 350
Gly Tyr Asp Lys Glu Phe Ser Asp
355 360
<210> 26
<211> 422
<212> PRT
<213> Aspergillus niger
<400> 26
Met Cys Leu Lys Phe Glu Pro Leu Asn Ile Leu Ile Val Gly Ala Gly
1 5 10 15
Leu Gly Gly Leu Phe Ala Ser Leu Ala Leu Arg Gln Asp Gly His Arg
20 25 30
Ile Thr Leu Leu Asp Ala Ser Ala Glu Phe Lys Glu Ala Gly Ala Gly
35 40 45
Ile Arg Ile Pro Pro Asn Ser Thr Arg Leu Leu Arg Arg Trp Gly Val
50 55 60
Asp Phe Asp Lys Met Arg Lys Cys Val Cys Gln Gly Tyr His Phe Arg
65 70 75 80
Arg Trp Gln Asp Gly Ser Thr Ile Thr Glu Ile Asn Pro Glu Asp Met
85 90 95
Ile Ala Cys His Gly Ala Pro Tyr Tyr Leu Val His Arg Ala Asp Leu
100 105 110
His Ala Thr Leu Leu Ala Val Ala Ile Glu Ala Gly Val Val Ile His
115 120 125
Lys Asn Arg His Val Thr Tyr Tyr Asp Phe Ser Val Pro Ile Ala Val
130 135 140
Thr Ala Asp Ser Glu Lys Trp Thr Ala Asp Leu Ile Ile Cys Ala Asp
145 150 155 160
Gly Ile Lys Ser Thr Ala Arg Pro Leu Leu Thr Ser Gln Pro Asp His
165 170 175
Pro Arg Asp Thr Gly Asp Ile Ala Tyr Arg Ile Leu Ile Asn Gly Gln
180 185 190
Asp Leu Leu Ala Asp Pro Asp Leu Ala Gly Leu Ile Thr His Pro Ala
195 200 205
Thr Thr Ser Trp Cys Gly Pro Asp Ala His Leu Val Gly Tyr Pro Ile
210 215 220
Arg Asp Gly Glu Leu Tyr Asn Ile Val Val Cys Ala Thr Ser Lys Gly
225 230 235 240
Glu Thr Thr Asp Glu Ile Trp Val Val Glu Gly Asp Asn Glu Glu Leu
245 250 255
Cys Ala Arg Phe Ser Gly Trp Glu Pro Arg Val Gln Lys Leu Cys Arg
260 265 270
Leu Thr Lys Ser Phe Met Lys Trp Arg Leu Cys Asp Leu Pro Ala Leu
275 280 285
Ser Thr Trp Ile His Pro Ser Gly Lys Ala Cys Leu Leu Gly Asp Ser
290 295 300
Cys His Pro Met Leu Pro Tyr Leu Ala Gln Gly Ala Ala Gln Ala Ala
305 310 315 320
Glu Asp Ala Ala Thr Ile Cys Arg Ala Leu Ala Glu Asp Thr Asp Ile
325 330 335
Thr Ser Ala Leu Lys Arg Tyr Glu Arg Ile Arg Ser Pro Arg Ala Ser
340 345 350
Leu Ile Gln Ser Lys Thr Arg Glu His Gln Tyr Ile Leu His Val Asp
355 360 365
Asp Gly Glu Glu Gln Cys Gln Arg Asp Glu Leu Met Arg His Asp Ser
370 375 380
Pro Ser Ser Pro Ile Phe Trp Gly Tyr Glu Leu Arg Arg Glu Trp Leu
385 390 395 400
Phe Ser His Asp Ala Glu Lys Met Glu Glu Ala Thr Ala Glu Pro Arg
405 410 415
Leu Arg Thr Ala Ala Leu
420
<210> 27
<211> 1056
<212> DNA
<213> Artificial
<220>
<223> hmfL1 coding sequence optimised for expression in yeast
<400> 27
atgggttcct tatccttacc agaaacatca ttagccgcaa tccaagacaa agaaacaaaa 60
gctatctcag tcgccaaaag acctacacca gtacctgttg gtacccaagt cttagtaaaa 120
ttgcattatt ccggtgtttg tgccactgat ttgcacttag ctagaggttc tgttccatac 180
ttacaaccta aggtttcagt cggtggtcat gaaggtaccg gtgttattgc ttctttgggt 240
ccagatgtcg acgcagcaga atggcatgta ggtgacagag tagcagttag atgggtacac 300
atagtttgtg gtaaatgcga agtttgtact acaggtttcg aaaatttgtg ccaatctaga 360
aagttggctg gtaaagatgt tgaaggtact ttcgccgaat atgcaattgc cgactcttca 420
tacatggtta gattaccagc tggtgtctca gatgcagacg ccgctcctat cttgtgtgct 480
ggtgtcacag tatacaaagc cttgaagatc gcttctttga gagcaggttc atgggttgct 540
gtcgcaggtg ctggtggtgg tttaggtcat ttggcaatcc aatatgctag agcaatgggt 600
ttaaaagttg tcgcattgga tgccagaaag agagacttgt gcttatcctt gggtgctgaa 660
agttacatcg acgttttaga aactgatgac tgtgtcgcac aagtaattaa agttacagat 720
ggtggtgctc acggtgcatt aatatgcgct tccagtggtc aagcctacga tgacgctgtt 780
aaatttttga gatggaccgg tactttagtc tgtataggtt tgccacctaa gccaacattg 840
ttatccttag gtcctgctga ttttgtagcc agaggtatca aggttatggg tacaagtacc 900
ggtgacagac aagacacagt tgaagccttg gctttcgtcg ctaaaggtca agtaaagcct 960
caattaaccg aaagaagatt ggaagatgtt gaagaaatct taaaggaaat agaaaatggt 1020
acaatgcaag gtaaagccgt aatcagaatc gcatag 1056
<210> 28
<211> 1518
<212> DNA
<213> Artificial
<220>
<223> hmfN1 coding sequence optimised for expression in yeast
<400> 28
atgacccaaa ccaatgtcca cgtaaacaaa tccgacactt ccttagctgc tccacaacaa 60
ttattcatct ccggtaaata tcaaaactct caaagaaatg gtacatttcc agtcaaaaac 120
cctatgactg gtgaaacaat ctatgaatgt gtttctgcat cattagatga ctacgctgct 180
gctatagaag aagctgatgc cgcacaacca tcatgggcta gattaggtcc ttccgcaaga 240
agattgattt tgttaaaggc cgctgatata atggaaacat acatcgaaac cgacgctcca 300
gcaatcttga gtgctgaagt ttctgcaaca agaggttggg tcagagccaa tatattatct 360
accgctggtg ttttcagaga aactgctgct ttggcaacac atatcaaagg tgaaattgtt 420
ccagctgata gacctggtac tacaatctta gtttcaagag aaccagtcgg tgttgtcttg 480
gctatttccc cttggaatat gcctgcaacc ttaactgcca gagctatctg ttgcccttta 540
atttgtggta actctgtagt tttaagacca tccgaatttt ctcctaaatc tcaacatttg 600
gtcgtaagag ccttaacaga agctggtttg ccagcaggtt gcttgcaatt cttaccaaca 660
tcaaccgcag atacccctag agccatagaa tttgctatca gacaccctaa ggttagtaga 720
gctaatttca ctggttctga tagagtcggt agaattatag caggtttatc cgccagttgt 780
ttgaaaccat gcgttttgga attgggtggt aaagcccctg ttgtcgtatt agaagatgct 840
gatgtcgaag ctgctgttga agcagttgtc tacggtgcca tgtctaactc aggtcaaatt 900
tgtatgagta cagaaagagc tatagttcat agatcattgg ccgctgattt taaagcattg 960
ttagtaaaga gagccgaatc attaagagtt ggtaatcact tggaagatcc agacgttcaa 1020
ttgtcaggtt tgtttactgc tgcttccgca gaaagagtct tgggtttgat taaaggtgct 1080
gtaaacgcag gtgccacctt gttagctggt gacttggcat tacatggtcc atgccaaact 1140
ataatggctc ctcacatctt aaccggtgtt actagagata tggacttgtt tcatagagaa 1200
acattcggtc cagtattgtt cgttagtgaa tttgatactg atgacgaagc tatagcacaa 1260
gccaatgaca cagaattttc tttatgtgct tcagtattct ccagagatgt tttgagagct 1320
atggataccg ctaagagaat aagaactggt tcatgccacg tcaatggtcc tactgtatat 1380
atcgaagcac cattgcctaa cggtggtgtt ggtggtggtt ctggttacgg tagatttggt 1440
ggtgttgctg gtattgaaga gtttacagaa agacaaatag ttagtttagc caagccaggt 1500
atcaagtatg ccttttag 1518
<210> 29
<211> 2139
<212> DNA
<213> Artificial
<220>
<223> synthetic fragment comprising hmfN1 for expression in yeast
<400> 29
ctcccccggg ttagtcaaaa aattagcctt ttaattctgc tgtaacccgt acatgcccaa 60
aatagggggc gggttacaca gaatatataa catcgtaggt gtctgggtga acagtttatt 120
cctggcatcc actaaatata atggagcccg ctttttaagc tggcatccag aaaaaaaaag 180
aatcccagca ccaaaatatt gttttcttca ccaaccatca gttcataggt ccattctctt 240
agcgcaacta cagagaacag gggcacaaac aggcaaaaaa cgggcacaac ctcaatggag 300
tgatgcaacc tgcctggagt aaatgatgac acaaggcaat tgacccacgc atgtatctat 360
ctcattttct tacaccttct attaccttct gctctctctg atttggaaaa agctgaaaaa 420
aaaggttgaa accagttccc tgaaattatt cccctacttg actaataagt atataaagac 480
ggtaggtatt gattgtaatt ctgtaaatct atttcttaaa cttcttaaat tctactttta 540
tagttagtct tttttttagt tttaaaacac caagaactta gtttcgaata aacacacata 600
aacaaacaaa aatgacccaa accaatgtcc acgtaaacaa atccgacact tccttagctg 660
ctccacaaca attattcatc tccggtaaat atcaaaactc tcaaagaaat ggtacatttc 720
cagtcaaaaa ccctatgact ggtgaaacaa tctatgaatg tgtttctgca tcattagatg 780
actacgctgc tgctatagaa gaagctgatg ccgcacaacc atcatgggct agattaggtc 840
cttccgcaag aagattgatt ttgttaaagg ccgctgatat aatggaaaca tacatcgaaa 900
ccgacgctcc agcaatcttg agtgctgaag tttctgcaac aagaggttgg gtcagagcca 960
atatattatc taccgctggt gttttcagag aaactgctgc tttggcaaca catatcaaag 1020
gtgaaattgt tccagctgat agacctggta ctacaatctt agtttcaaga gaaccagtcg 1080
gtgttgtctt ggctatttcc ccttggaata tgcctgcaac cttaactgcc agagctatct 1140
gttgcccttt aatttgtggt aactctgtag ttttaagacc atccgaattt tctcctaaat 1200
ctcaacattt ggtcgtaaga gccttaacag aagctggttt gccagcaggt tgcttgcaat 1260
tcttaccaac atcaaccgca gataccccta gagccataga atttgctatc agacacccta 1320
aggttagtag agctaatttc actggttctg atagagtcgg tagaattata gcaggtttat 1380
ccgccagttg tttgaaacca tgcgttttgg aattgggtgg taaagcccct gttgtcgtat 1440
tagaagatgc tgatgtcgaa gctgctgttg aagcagttgt ctacggtgcc atgtctaact 1500
caggtcaaat ttgtatgagt acagaaagag ctatagttca tagatcattg gccgctgatt 1560
ttaaagcatt gttagtaaag agagccgaat cattaagagt tggtaatcac ttggaagatc 1620
cagacgttca attgtcaggt ttgtttactg ctgcttccgc agaaagagtc ttgggtttga 1680
ttaaaggtgc tgtaaacgca ggtgccacct tgttagctgg tgacttggca ttacatggtc 1740
catgccaaac tataatggct cctcacatct taaccggtgt tactagagat atggacttgt 1800
ttcatagaga aacattcggt ccagtattgt tcgttagtga atttgatact gatgacgaag 1860
ctatagcaca agccaatgac acagaatttt ctttatgtgc ttcagtattc tccagagatg 1920
ttttgagagc tatggatacc gctaagagaa taagaactgg ttcatgccac gtcaatggtc 1980
ctactgtata tatcgaagca ccattgccta acggtggtgt tggtggtggt tctggttacg 2040
gtagatttgg tggtgttgct ggtattgaag agtttacaga aagacaaata gttagtttag 2100
ccaagccagg tatcaagtat gccttttaga ctagtgtga 2139
<210> 30
<211> 3011
<212> DNA
<213> Artificial
<220>
<223> Synthetic split marker fragment 5-flank hmfK1 with Hygromicin B
marker
<400> 30
ctcggtcgct cttttgggta gatggtagga taactgacag gaagtctatg ccagtactgc 60
ggaatcaaag aagcgtcgga gcaatgaacc gtatgcacgt cggaatgggg gaatgacacg 120
gagttatact cccggttcaa gccccgctta tcaaccctgg gcaggaattg cggggaagca 180
atgcggggaa gctacaacgc ttccccgcat ggtctacgtc tactcttggc acaacacatg 240
gaaatatcca gcgaagtggt tgactggtat cgagacttgg tccgtttcca gtcaaaatca 300
caccttcgta gaatccctgg cgttaccgcc tctcacgtct tttggctctg cttgtcagct 360
ggacgcagca cgcatcaatt ggcaagatgt cgtctacaag cgagtccttc actctcccaa 420
atgggcgaca gatggcttat accctctcgc ccggtggttc ctccgatcgc gtggtccttc 480
tctccaactc cttggccgaa gatctgacct cctgggagcg cgtcgtacct gtggtggaaa 540
accaaggctt ccgcgtcctc cgctacgacc agccaggcca tggacgctcg ggtgcaccta 600
ctgaagccga attgacctcc atgacattcg agaccttggt cgatgacgtc taccgccttc 660
tcggacacct caaaatcaac aatttgcatg cctgggtcgg cgtctcgatg ggcggcatca 720
aggccgtgta cttcaccgcg cgccacccag gcatcgtgaa caagatcgtc gtggccgacg 780
ccatcgccgc ttccccgtcc gtggtctgca tccccgataa cttcgccgcg cgggtaagcg 840
ctgtgaagca gtcgggttcc atctcggacg acctgtcaaa tactcggaag cggtggttcg 900
gtgaagactg gatggcgaag catccggagg agacggcgag gatggagaag tccatggcga 960
caactacaat tcagggtctc gaggcgtgct gtgctgccct tagcagcccg tcttttgacc 1020
tgaggccgct atatacgaag gtgggacatg gctgcgaaga agcactcatt gtcgccgggg 1080
agaaggatgc ggaccttcca gtcaagatgc aggagatgcg gcaggcaatc gaggagagcc 1140
tccggagctg tggaaagaag gtgcccgtga ggatggagat tatcaagggt gccgggcatg 1200
ttccctacat tgatggtttc gaggacttct gcgaaatcat caccaaattc cttgcctaga 1260
tagcactcga tctgcttcac gattgtgaaa tgtcttaaat tttcttgtca atctagactt 1320
tgcattaaac caatcttgag acaaatcatt cttcagtcgt attcccggag tgtgtgatgt 1380
cctggtccca tatttctcat ttctcatctt cgctatggct agtccgggta gcaagtgcgc 1440
gcaagtgcgc gctagtaggc aaatagaagc aatcgtcgga agttgggccc gactaggata 1500
acctggacta ggggcctgct gtacagtgac cggtgactct ttctggcatg cggagagacg 1560
gacggacgca gagagaaggg ctgagtaata agcgccactg cgccagacag ctctggcggc 1620
tctgaggtgc agtggatgat tattaatccg ggaccggccg cccctccgcc ccgaagtgga 1680
aaggctggtg tgcccctcgt tgaccaagaa tctattgcat catcggagaa tatggagctt 1740
catcgaatca ccggcagtaa gcgaaggaga atgtgaagcc aggggtgtat agccgtcggc 1800
gaaatagcat gccattaacc taggtacaga agtccaattg cttccgatct ggtaaaagat 1860
tcacgagata gtaccttctc cgaagtaggt agagcgagta cccggcgcgt aagctcccta 1920
attggcccat ccggcatctg tagggcgtcc aaatatcgtg cctctcctgc tttgcccggt 1980
gtatgaaacc ggaaaggccg ctcaggagct ggccagcggc gcagaccggg aacacaagct 2040
ggcagtcgac ccatccggtg ctctgcactc gacctgctga ggtccctcag tccctggtag 2100
gcagctttgc cccgtctgtc cgcccggtgt gtcggcgggg ttgacaaggt cgttgcgtca 2160
gtccaacatt tgttgccata ttttcctgct ctccccacca gctgctcttt tcttttctct 2220
ttcttttccc atcttcagta tattcatctt cccatccaag aacctttatt tcccctaagt 2280
aagtactttg ctacatccat actccatcct tcccatccct tattcctttg aacctttcag 2340
ttcgagcttt cccacttcat cgcagcttga ctaacagcta ccccgcttga gcagacatca 2400
ccatgcctga actcaccgcg acgtctgtcg agaagtttct gatcgaaaag ttcgacagcg 2460
tctccgacct gatgcagctc tcggagggcg aagaatctcg tgctttcagc ttcgatgtag 2520
gagggcgtgg atatgtcctg cgggtaaata gctgcgccga tggtttctac aaagatcgtt 2580
atgtttatcg gcactttgca tcggccgcgc tcccgattcc ggaagtgctt gacattgggg 2640
aattcagcga gagcctgacc tattgcatct cccgccgtgc acagggtgtc acgttgcaag 2700
acctgcctga aaccgaactg cccgctgttc tgcagccggt cgcggaggcc atggatgcga 2760
tcgctgcggc cgatcttagc cagacgagcg ggttcggccc attcggaccg caaggaatcg 2820
gtcaatacac tacatggcgt gatttcatat gcgcgattgc tgatccccat gtgtatcact 2880
ggcaaactgt gatggacgac accgtcagtg cgtccgtcgc gcaggctctc gatgagctga 2940
tgctttgggc cgaggactgc cccgaagtcc ggcacctcgt gcacgcggat ttcggctcca 3000
acaatgtcct g 3011
<210> 31
<211> 2886
<212> DNA
<213> Artificial
<220>
<223> Synthetic split marker fragment 3'-flank hmfK1 with Hygromicin B
marker
<400> 31
tccggaagtg cttgacattg gggaattcag cgagagcctg acctattgca tctcccgccg 60
tgcacagggt gtcacgttgc aagacctgcc tgaaaccgaa ctgcccgctg ttctgcagcc 120
ggtcgcggag gccatggatg cgatcgctgc ggccgatctt agccagacga gcgggttcgg 180
cccattcgga ccgcaaggaa tcggtcaata cactacatgg cgtgatttca tatgcgcgat 240
tgctgatccc catgtgtatc actggcaaac tgtgatggac gacaccgtca gtgcgtccgt 300
cgcgcaggct ctcgatgagc tgatgctttg ggccgaggac tgccccgaag tccggcacct 360
cgtgcacgcg gatttcggct ccaacaatgt cctgacggac aatggccgca taacagcggt 420
cattgactgg agcgaggcga tgttcgggga ttcccaatac gaggtcgcca acatcttctt 480
ctggaggccg tggttggctt gtatggagca gcagacgcgc tacttcgagc ggaggcatcc 540
ggagcttgca ggatcgccgc ggctccgggc gtatatgctc cgcattggtc ttgaccaact 600
ctatcagagc ttggttgacg gcaatttcga tgatgcagct tgggcgcagg gtcgatgcga 660
cgcaatcgtc cgatccggag ccgggactgt cgggcgtaca caaatcgccc gcagaagcgc 720
ggccgtctgg accgatggct gtgtagaagt actcgccgat agtggaaacc gacgccccag 780
cactcgtccg agggcaaagg aatagtgatt taatagctcc atgtcaacaa gaataaaacg 840
cgtttcgggt ttacctcttc cagatacagc tcatctgcaa tgcattaatg cattggacct 900
cgcaacccta gtacgccctt caggctccgg cgaagcagaa gaatagctta gcagagtcta 960
ttttcatttt cgggagacga gatcaagcag atcaacggtc gtcaagagac ctacgagact 1020
gaggaatccg ctcttggctc cacgcgacta tatatttgtc tctaattgta ctttgacatg 1080
ctcctcttct ttactctgat agcttgacta tgaaaattcc gtcaccagcc cctgggttcg 1140
caaagataat tgcactgttt cttccttgaa ctctcaagcc tacaggacac acattcatcg 1200
taggtataaa cctcgaaaat cattcctact aagatgggta tacaatagta accatgcatg 1260
gttgcctagt gaatgctccg taacacccaa tacgccggcc gaaacttttt tacaactctc 1320
ctatgagtcg tttacccaga atgcacaggt acacttgttt agaggtaatc cttctttcta 1380
gaagtcctcg tgtactgtgt aagcgcccac tccacatctc cactcgagcc tatcactgtg 1440
gcaatgcctt agactctttt attcttcaat cataccatac atcctcgcgt tttgcattag 1500
tcctcggcga ttcacctcgc agttttcctc ctcctttggt tacatcttct cagcttaggc 1560
ggctggtacg tcttctgtat ttatttgagg cagctgtagg aaactttcac gttgaaagtt 1620
gacaagacga cttccacagc gtctgtgacg agggccacaa gcctgttttt tggtccatag 1680
aagttttcta tctttgtttc gaacagcgtc ttcctgtaac gggccagacc cagcagtgaa 1740
accatgtgcc atggcctttc ggacaccgcc tcaacaggca ggattctagg ggattctatc 1800
gcgaagattc catcagggac gagaccgatt ctctccatct ccttcgacac taaggattct 1860
aaactattcc aaaggattat atcagagacg agactgactc actttccttt cttcaatatt 1920
gttgtaaaaa gcatataggc ctaacataat tgaattaatg ctacaacacc ccttcgtact 1980
ttcttcttgt aggctccagg gatatagtcg ttcctctatc gtaagagacg acgcctttct 2040
ttagccttct catcacgctt ttagaaaaaa ggccttttga cccataaccg gatattctaa 2100
aagtaagctc aaagggtagg aggcagactc agaggagtag attttgaaac aagcaatgaa 2160
atggacgttg cttttaatga ggccgtagat gggataaagt ctcctttaat attttgtcac 2220
aggaagcatg actagtgcaa aggcctcttt gaactgcatt atcttgaaca ggacgggcca 2280
cctcacttgt gtcgttttgg ccagttttgt ttagatggag acctctagaa tgggatattc 2340
acgcgctagt tatcacagaa tagatgaccc tgtggggcat gtcctttttg ggtatagtct 2400
gacttggtct aagtgatcac tgagcgatca catgactgca ctcatgagcg cgtgctgaca 2460
tttactcact gagcctgagc ctgagtgccc tcattaaagc ggcggtagcc cagacaggaa 2520
agccctaccg gacaaaatcc ggtgtatata ggcgcatatt gcatcattgg gtgtgagtct 2580
gaggtagcac aacttattat cttggccatg tggagaggtc tataatgggc tttgtccgga 2640
tgcggcgatc agtcgacatt gtactttgta gacgtgtatg ggtggatgga tggagatcgg 2700
attgcgaagt atggagatcg cgattcttca gatgacgcac ggagtcgatc tcccgagctg 2760
ctctcttatt tacgtgtcaa gagtacaata acaattgagc tggacgatag atagtcttgg 2820
aaatcaacta tgacattgtt aactagacat ctattctaat gtacctcgaa agaatactcg 2880
ggatgg 2886
<210> 32
<211> 2658
<212> DNA
<213> Artificial
<220>
<223> Synthetic split marker fragment 5-flank hmfK3 with Phleomycin
marker
<400> 32
ccgtgcgcta taataacctt cgaatcctgg tgcatcgccg ctgcttggaa agccttcttg 60
acccagttca gatagaaggt gacacttcgg tgacgtccga aatgcggttg cttcagcaaa 120
tgggactgag cagcgtcatg atctgtgttg agtctgctat gtctatcatc tcgattgtac 180
acaatatgtc tgccggtagt ggctggcgac gtgagttctt gggtgcatgg aattattcac 240
tctattacag taggttgggt tctgtaagat ttgacctcca gggagttgaa actaacgtaa 300
cacagctttc aatgcagcac tagttatttt cggctccctc attgtggcat cgaaggagcg 360
tgaccgcaac ccgtcagcct ggatcatgat cagccattcc cggtcgtata ttgacacggc 420
agctgaagcg ctgcgtcagc ttgacccggg aaaccctgtt gttgaacggt gtcaagagta 480
tctttcgcag ctatctgcaa cattggatcc tctcagttag ttatcccgca cagatgcaaa 540
cctccctttc gtcccatccg tgccatttca agactggccc tgcccgcgct tcaacaattg 600
ttccaaaaac ctgctgacag cccttgccta cacaatgcac agtttcagaa gagccatatt 660
gtgataatag gcttgctttc gactttccta ccgaatattc caccgggctg ttttctcttc 720
acagtgccga cttagtaccg cctatggact ttggcgaatt catgattggt tagggttgta 780
gcttttcggt acggccctgg gaatagcgag gcattgactg ctagtcaact gtagtggagc 840
aaacagagaa gggaccacgt aggtacaagc tgggcgatgc agctgtccga ccctctcgag 900
atgggttcgc cgcggaagga gcaaatagtc tcagtatcca gctttgccgt aggaatgaga 960
aaactgaact caagacagaa acctcagcgt accttttcaa agatgatgta aaagatgtct 1020
ctctcagaga aggatagtat agtaatgatc agatccgctg gaaaatagtg cggcaccgaa 1080
cccctgacgg cccggcggcc cggcgggtat ggtaatgacg gtaaattatc tagggcatcg 1140
ctatgatcat ttgacaagac ccgtgtgtcg gcattatcat tcggacatga ttcaacgcct 1200
caattttacc ccatatgtgc caaccattcc atctcgcgtg ggcttagaca tcccacgggc 1260
aaacgtcccg tccagcccca gtcagcgaat gcggggataa tccggggttt cctaccccca 1320
tgggctgggc cggaatgcct aactccccga attggctgcc cggggagtgc aaataaaata 1380
gttgcttgta tacatatata tatatccttc ggtatatcca agacttcctg ttgcatcaag 1440
cgcaatccta agcttttttc tccctaccac aagtagctct acaaacccga aacctagaac 1500
aggcctgctg tacagtgacc ggtgactctt tctggcatgc ggagagacgg acggacgcag 1560
agagaagggc tgagtaataa gcgccactgc gccagacagc tctggcggct ctgaggtgca 1620
gtggatgatt attaatccgg gaccggccgc ccctccgccc cgaagtggaa aggctggtgt 1680
gcccctcgtt gaccaagaat ctattgcatc atcggagaat atggagcttc atcgaatcac 1740
cggcagtaag cgaaggagaa tgtgaagcca ggggtgtata gccgtcggcg aaatagcatg 1800
ccattaacct aggtacagaa gtccaattgc ttccgatctg gtaaaagatt cacgagatag 1860
taccttctcc gaagtaggta gagcgagtac ccggcgcgta agctccctaa ttggcccatc 1920
cggcatctgt agggcgtcca aatatcgtgc ctctcctgct ttgcccggtg tatgaaaccg 1980
gaaaggccgc tcaggagctg gccagcggcg cagaccggga acacaagctg gcagtcgacc 2040
catccggtgc tctgcactcg acctgctgag gtccctcagt ccctggtagg cagctttgcc 2100
ccgtctgtcc gcccggtgtg tcggcggggt tgacaaggtc gttgcgtcag tccaacattt 2160
gttgccatat tttcctgctc tccccaccag ctgctctttt cttttctctt tcttttccca 2220
tcttcagtat attcatcttc ccatccaaga acctttattt cccctaagta agtactttgc 2280
tacatccata ctccatcctt cccatccctt attcctttga acctttcagt tcgagctttc 2340
ccacttcatc gcagcttgac taacagctac cccgcttgag cagacatcac catggccaag 2400
ttgaccagtg ccgttccggt gctcaccgcg cgcgacgtcg ccggagcggt cgagttctgg 2460
accgaccggc tcgggttctc ccgggacttc gtggaggacg acttcgccgg tgtggtccgg 2520
gacgacgtga ccctgttcat cagcgcggtc caggaccagg tggtgccgga caacaccctg 2580
gcctgggtgt gggtgcgcgg cctggacgag ctgtacgccg agtggtcgga ggtcgtgtcc 2640
acgaacttcc gggacgcc 2658
<210> 33
<211> 2472
<212> DNA
<213> Artificial
<220>
<223> Synthetic split marker fragment 3-flank hmfK3 with Phleomycin
marker
<400> 33
gcgcgacgtc gccggagcgg tcgagttctg gaccgaccgg ctcgggttct cccgggactt 60
cgtggaggac gacttcgccg gtgtggtccg ggacgacgtg accctgttca tcagcgcggt 120
ccaggaccag gtggtgccgg acaacaccct ggcctgggtg tgggtgcgcg gcctggacga 180
gctgtacgcc gagtggtcgg aggtcgtgtc cacgaacttc cgggacgcct ccgggccggc 240
catgaccgag atcggcgagc agccgtgggg gcgggagttc gccctgcgcg acccggccgg 300
caactgcgtg cacttcgtgg ccgaggagca ggactgatga tttaatagct ccatgtcaac 360
aagaataaaa cgcgtttcgg gtttacctct tccagataca gctcatctgc aatgcattaa 420
tgcattggac ctcgcaaccc tagtacgccc ttcaggctcc ggcgaagcag aagaatagct 480
tagcagagtc tattttcatt ttcgggagac gagatcaagc agatcaacgg tcgtcaagag 540
acctacgaga ctgaggaatc cgctcttggc tccacgcgac tatatatttg tctctaattg 600
tactttgaca tgctcctctt ctttactctg atagcttgac tatgaaaatt ccgtcaccag 660
cccctgggtt cgcaaagata attgcactgt ttcttccttg aactctcaag cctacaggac 720
acacattcat cgtaggtata aacctcgaaa atcattccta ctaagatggg tatacaatag 780
taaccatgca tggttgccta gtgaatgctc cgtaacaccc aatacgccgg ccgaaacttt 840
tttacaactc tcctatgagt cgtttaccca gaatgcacag gtacacttgt ttagaggtaa 900
tccttctttc tagaagtcct cgtgtactgt gtaagcgccc actccacatc tccactcgag 960
cctatcattc agcaatcaga ctctcctatc tcttccttgc atgcaataac tgtgtaaata 1020
tacgttttgc tctatgagat tgtacctttg gacgaacttg gagccccgcc gtggcctgtg 1080
tttgtttcta ttttgatctg tggagaggct agggtattta ggtgtgcaga ttcatcattg 1140
taaactggtt tgtatggtcg gggaactgtt ggatcactct tgcgccaccg ttgccctgtt 1200
gccccgttgc cccgttgccc tgttgcctgg caggtgacat gattagatcc actgcatttc 1260
ctcgccgttt ttaaattcaa ctatctcttt ctctctgata atttgcgtgg gtgacaatca 1320
tggcagtcca tagacatcgt cagcttcagc tggagctgat tctgatggtc gcagactatt 1380
tgcgaccttt agatctttta aatttggttc agggcatacc tcaaattgct tcccttctct 1440
cctctcgaca tatgcgagcc caagatgaca atggattcac tatatttcat ctgattgtgg 1500
aacaggggct taaaagccta atagaacgcc tcgataaatg gatcccacgg ggctttattc 1560
ccgacaacga agggtggaca cctcttcatc aagaagttag gaaggctaat taccggatgg 1620
taaaagcact gattgatgct ggctcagatt tatcagcccg gggttataat ggaaaaactt 1680
cccttcacct tgcctgcggt ggaaatgcag ttgaaattgt caggttgctc ttagaccatg 1740
gtgcaaaccc gtccgcaaag gattacgacg aaaggacgcc tttgcacgac gcctattctc 1800
atgacatatc tgtccgtcag atgcttatta cagccggcgc ggaccttgac ccctgccaag 1860
tgccacgggg gttgaccccc ctttattatg aacctatgat agcccgagaa agcgttatta 1920
ggattcttct tgaggctggg gcagaccttt ccattcaaga tatgagtggg gatactatat 1980
tacaccgcgc tacgatccac aatttcgcta atgtcgtccg gctgttactt gaattcggtg 2040
ttgatatcac tgtgcgaaat gtccacggtt ataccccggt tttggttgct gcaattggcg 2100
ggtcagatga atgtctacga ctgctcctca aggccggcgc agacctttca gtcatggata 2160
atcatggacg tagcgctttg catatagcag ctcgggcggg aagggaatct acagtccgac 2220
tgcttgtgaa acaaggaatg gacatcgccg cacgggacag ccgccgtggc tggactccga 2280
tgtgctgggc ggtaaactac gaacagaaag gggtaatcca agttttagaa gatacgcaaa 2340
caaaccgatt tgcgaagttt gcacggcgag tacgcatcaa attttaaatg ccatttttgc 2400
tcagagcgct aggcatgtcg tggttccgga tttcctgtag ccagataagc ctcatatatc 2460
actctttcac ca 2472
<210> 34
<211> 20
<212> DNA
<213> Artificial
<220>
<223> Primer 180
<400> 34
ggtagaaaag gggttgcgat 20
<210> 35
<211> 18
<212> DNA
<213> Artificial
<220>
<223> Primer 181
<400> 35
gaagcaatcg tcggaagt 18
<210> 36
<211> 21
<212> DNA
<213> Artificial
<220>
<223> Primer 182
<400> 36
cgcgaggatg tatggtatga t 21
<210> 37
<211> 21
<212> DNA
<213> Artificial
<220>
<223> Primer 183
<400> 37
gaaagtgaga ttgtggatgg a 21
<210> 38
<211> 17
<212> DNA
<213> Artificial
<220>
<223> Primer 184
<400> 38
tgtcgttcat ggctccc 17
<210> 39
<211> 18
<212> DNA
<213> Artificial
<220>
<223> Primer 185
<400> 39
aaggtgcgaa ctggagag 18
<210> 40
<211> 22
<212> DNA
<213> Artificial
<220>
<223> Primer 186
<400> 40
ggaacaatcg gcaaagaaag tg 22
<210> 41
<211> 19
<212> DNA
<213> Artificial
<220>
<223> Primer 187
<400> 41
caacttcttg tggcgttgg 19
<210> 42
<211> 20
<212> DNA
<213> Artificial
<220>
<223> Primer 212
<400> 42
ctcggtcgct cttttgggta 20
<210> 43
<211> 20
<212> DNA
<213> Artificial
<220>
<223> Primer 213
<400> 43
caggacattg ttggagccga 20
<210> 44
<211> 20
<212> DNA
<213> Artificial
<220>
<223> Primer 214
<400> 44
tccggaagtg cttgacattg 20
<210> 45
<211> 22
<212> DNA
<213> Artificial
<220>
<223> Primer 215
<400> 45
ccatcccgag tattctttcg ag 22
<210> 46
<211> 22
<212> DNA
<213> Artificial
<220>
<223> Primer 216
<400> 46
ccgtgcgcta taataacctt cg 22
<210> 47
<211> 16
<212> DNA
<213> Artificial
<220>
<223> Primer 217
<400> 47
gcgtcccgga agttcg 16
<210> 48
<211> 18
<212> DNA
<213> Artificial
<220>
<223> Primer 218
<400> 48
gagcggtcga gttctgga 18
<210> 49
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Primer 219
<400> 49
ggtgaaagag tgatatatga ggc 23
<210> 50
<211> 21
<212> DNA
<213> Artificial
<220>
<223> Primer 220
<400> 50
tctcaggact tgcagatgtt g 21
<210> 51
<211> 19
<212> DNA
<213> Artificial
<220>
<223> Primer 221
<400> 51
gccaagtcat catcctcgc 19
<210> 52
<211> 20
<212> DNA
<213> Artificial
<220>
<223> Primer 222
<400> 52
cttactgccg gtgattcgat 20
<210> 53
<211> 22
<212> DNA
<213> Artificial
<220>
<223> Primer 223
<400> 53
ctacaggaca cacattcatc gt 22
<210> 54
<211> 18
<212> DNA
<213> Artificial
<220>
<223> Primer 224
<400> 54
tgccagccct cctattcc 18
<210> 55
<211> 447
<212> PRT
<213> Cupriavidus basilensis
<400> 55
Met Glu Ala Val Ala Lys Lys Arg Thr Glu Thr Ile Ser Glu Ala Leu
1 5 10 15
Pro Ala Ala Thr Asn Arg Gln Val Phe Gly Ala Val Thr Ala Ser Cys
20 25 30
Met Gly Trp Ala Leu Asp Leu Phe Asp Leu Phe Ile Leu Leu Phe Val
35 40 45
Ala Pro Val Ile Gly Arg Leu Phe Phe Pro Ser Glu His Ala Met Leu
50 55 60
Ser Leu Ala Ala Val Tyr Ala Ser Phe Ala Val Thr Leu Leu Met Arg
65 70 75 80
Pro Leu Gly Ser Ala Ile Phe Gly Thr Tyr Ala Asp Arg His Gly Arg
85 90 95
Lys Gly Ala Met Val Val Ala Val Thr Gly Val Gly Leu Ser Thr Ala
100 105 110
Ala Phe Gly Leu Leu Pro Thr Val Gly Gln Val Gly Leu Leu Ala Pro
115 120 125
Ala Leu Phe Ile Leu Leu Arg Leu Val Gln Gly Ile Phe Val Gly Gly
130 135 140
Val Val Ala Ser Thr His Thr Ile Gly Thr Glu Ser Val Pro Pro Ser
145 150 155 160
Trp Arg Gly Ala Val Ser Gly Leu Val Gly Gly Gly Gly Ala Gly Ile
165 170 175
Gly Ala Leu Leu Ala Ser Ile Thr Tyr Met Ala Met Thr Ala Leu Phe
180 185 190
Pro Gly Glu Ala Phe Asp Ala Trp Gly Trp Arg Cys Met Phe Phe Ser
195 200 205
Gly Ile Ile Ser Ser Val Leu Gly Leu Phe Ile Phe Asn Ser Leu Glu
210 215 220
Glu Ser Pro Leu Trp Lys Gln Leu Gln Ala Ala Lys Gly His Ala Ala
225 230 235 240
Pro Val Glu Asn Pro Leu Arg Val Ile Phe Ser Arg Gln Tyr Arg Gly
245 250 255
Val Leu Phe Val Asn Ile Leu Leu Thr Val Gly Gly Gly Ser Ala Tyr
260 265 270
Tyr Leu Thr Ser Gly Tyr Leu Pro Thr Phe Leu Lys Val Val Val Lys
275 280 285
Ala Pro Ala Gly Ala Ser Ala Ala Ile Leu Met Ala Ser Ser Val Gly
290 295 300
Val Ile Val Ala Ser Ile Ile Ala Gly His Leu Ser Thr Leu Ile Gly
305 310 315 320
Arg Lys Arg Ala Phe Leu Leu Ile Gly Ala Leu Asn Val Val Leu Leu
325 330 335
Pro Leu Ile Tyr Gln Arg Met Pro Ala Ala Pro Asp Val Thr Thr Leu
340 345 350
Gly Ile Tyr Ala Val Ala Leu Ala Met Leu Gly Ser Thr Gly Phe Ala
355 360 365
Pro Ile Leu Ile Phe Leu Asn Glu Arg Phe Pro Thr Ser Ile Arg Ala
370 375 380
Thr Gly Thr Gly Leu Ser Trp Asn Ile Gly Phe Ala Ile Gly Gly Met
385 390 395 400
Met Pro Thr Phe Ala Ser Leu Cys Ala Ser Thr Pro Ala Asp Leu Pro
405 410 415
Lys Val Leu Gly Ile Phe Val Ala Val Val Thr Ala Ile Tyr Leu Ala
420 425 430
Gly Ala Ala Ile Val Pro Glu Thr Ala Gly Arg Leu Gly Glu Lys
435 440 445
Claims (17)
- 유전자 변형이 결핍된 상응하는 모 세포(parent cell)와 비교하여, 세포에서 특이적 2,5-푸란디카르복실산 (FDCA) 탈카르복실화 모노옥시게나제 활성을 감소시키는 유전자 변형을 포함하는 진균 세포로서, 여기서 유전자 변형이 유전자의 코딩 서열 및 프로모터 중 적어도 하나의 적어도 일부의 결실에 의해 FDCA 탈카르복실화 모노옥시게나제를 코딩하는 내인성 유전자의 발현을 제거하는 것인 진균 세포.
- 제1항에 있어서, 상응하는 모 세포에서의 내인성 유전자가 서열번호: 4 중 적어도 하나에 대해 적어도 45% 서열 동일성(sequence identity)을 가진 아미노산 서열을 포함하는 FDCA 탈카르복실화 모노옥시게나제를 코딩하는 것인 진균 세포.
- 제1항 또는 제2항에 있어서, FDCA 탈카르복실화 모노옥시게나제를 코딩하는 내인성 유전자의 적어도 완전한 코딩 서열이 결실되는 것인 진균 세포.
- 제1항 내지 제3항 중 어느 한 항에 있어서, FDCA 탈카르복실화 모노옥시게나제를 코딩하는 내인성 유전자의 모든 카피의 발현이 제거되는 것인 진균 세포.
- 제1항 내지 제4항 중 어느 한 항에 있어서, HMF를 FDCA로 산화시키는 천연 능력을 갖는 진균 세포.
- 제1항 내지 제5항 중 어느 한 항에 있어서,
a) 유전자 변형이 결핍된 상응하는 야생형 세포와 비교하여, 세포에 5-히드록시메틸-2-푸란카르복실산 (HMFCA)을 5-포르밀-2-푸로산 (FFCA)으로 산화시키는 능력을 부여하거나 세포에서 HMFCA를 FFCA로 산화시키는 효소의 특이적 활성을 증가시키는 유전자 변형; 및,
b) 유전자 변형이 결핍된 상응하는 야생형 세포와 비교하여, 세포에 푸란계 알데히드를 상응하는 푸란계 카르복실산으로 산화시키는 능력을 부여하는 유전자 변형 또는 세포에서 푸란계 알데히드를 상응하는 푸란계 카르복실산으로 산화시키는 효소의 특이적 활성을 증가시키는 유전자 변형
중 적어도 하나인 추가의 유전자 변형을 포함하는 진균 세포. - 제6항에 있어서, a)에서의 유전자 변형이 HMFCA 데히드로게나제 활성을 가진 폴리펩티드를 코딩하는 뉴클레오티드 서열의 발현을 증가시키는 변형으로서, 이 폴리펩티드는 서열번호: 1 및 2 중 적어도 하나의 아미노산 서열과 적어도 45% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인 변형; 및/또는,
b)에서의 유전자 변형이 푸란계 알데히드 데히드로게나제 활성을 갖는 폴리펩티드를 코딩하는 뉴클레오티드 서열의 발현을 증가시키는 변형으로서, 이 알데히드 데히드로게나제는 i) HMF를 HMFCA로 산화시키는 능력, ii) DFF를 FFCA로 산화시키는 능력, 및, iii) FFCA를 FDCA로 산화시키는 능력 중 적어도 하나를 가지며, 이 폴리펩티드는 서열번호: 3의 아미노산과 적어도 45% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인 변형인 진균 세포. - 제1항 내지 제7항 중 어느 한 항에 있어서,
a) HMF 및/또는 FFCA를 상응하는 알콜로 환원시키는 단쇄 데히드로게나제를 코딩하는 유전자의 발현을 감소시키거나 제거하는 유전자 변형으로서, 여기서 바람직하게는 유전자는 서열번호: 5 및 25 중 적어도 하나에 대해 적어도 45% 서열 동일성을 가진 아미노산 서열을 포함하는 폴리펩티드를 코딩하는 유전자 중 적어도 하나인 유전자 변형;
b) 적어도 하나의 푸란계 화합물을 수송하는 폴리펩티드를 코딩하는 뉴클레오티드 서열의 발현을 증가시키는 유전자 변형으로서, 이 폴리펩티드는 바람직하게는 서열번호: 6 내지 10 중 적어도 하나의 아미노산 서열과 적어도 45% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인 유전자 변형; 및,
c) 푸란 이화작용에 관여하는 유전자의 전사 활성인자를 코딩하는 유전자의 발현을 변경시키는 유전자 변형으로서, 여기서 바람직하게는 유전자는 서열번호: 11에 대해 적어도 45% 서열 동일성을 가진 아미노산 서열을 포함하는 폴리펩티드를 코딩하는 유전자인 유전자 변형
으로부터 선택된 유전자 변형을 추가로 포함하는 진균 세포. - HMF를 FDCA로 산화시키는 능력을 갖고 적어도 하나의 푸란계 화합물을 수송하는 폴리펩티드를 코딩하는 뉴클레오티드 서열의 발현을 증가시키는 유전자 변형을 포함하는 진균 세포로서, 이 폴리펩티드는 바람직하게는 서열번호: 9 및 10 중 적어도 하나의 아미노산 서열과 적어도 45% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인, 진균 세포.
- 제9항에 있어서,
a) 유전자 변형이 결핍된 상응하는 모 세포와 비교하여, 세포에서 특이적 FDCA 탈카르복실화 모노옥시게나제 활성을 감소시키거나 제거하는 유전자 변형;
b) 유전자 변형이 결핍된 상응하는 야생형 세포와 비교하여, 세포에 HMFCA를 FFCA로 산화시키는 능력을 부여하거나 세포에서 HMFCA를 FFCA로 산화시키는 효소의 특이적 활성을 증가시키는 유전자 변형;
c) 유전자 변형이 결핍된 상응하는 야생형 세포와 비교하여, 세포에 푸란계 알데히드를 상응하는 푸란계 카르복실산으로 산화시키는 능력을 부여하는 유전자 변형 또는 세포에서 푸란계 알데히드를 상응하는 푸란계 카르복실산으로 산화시키는 효소의 특이적 활성을 증가시키는 유전자 변형;
d) HMF 및/또는 FFCA를 상응하는 알콜로 환원시키는 단쇄 데히드로게나제를 코딩하는 유전자의 발현을 감소시키거나 제거하는 유전자 변형으로서, 여기서 바람직하게는 유전자는 서열번호: 5 및 25 중 적어도 하나에 대해 적어도 45% 서열 동일성을 가진 아미노산 서열을 포함하는 폴리펩티드를 코딩하는 유전자 중 적어도 하나인 유전자 변형;
e) 적어도 하나의 푸란계 화합물을 수송하는 폴리펩티드를 코딩하는 뉴클레오티드 서열의 발현을 증가시키는 유전자 변형으로서, 이 폴리펩티드는 바람직하게는 서열번호: 6 내지 8 중 적어도 하나의 아미노산 서열과 적어도 45% 서열 동일성을 갖는 아미노산 서열을 포함하는 것인 유전자 변형; 및,
f) 푸란 이화작용에 관여하는 유전자의 전사 활성인자를 코딩하는 유전자의 발현을 변경시키는 유전자 변형으로서, 여기서 바람직하게는 유전자는 서열번호: 11에 대해 적어도 45% 서열 동일성을 가진 아미노산 서열을 포함하는 폴리펩티드를 코딩하는 유전자인 유전자 변형
으로부터 선택되는 유전자 변형을 추가로 포함하는 진균 세포. - 제1항 내지 제10항 중 어느 한 항에 있어서, 세포가,
아크레모니움, 아스페르길루스, 아우레오바시디움, 크립토코쿠스, 필리바시디움, 푸사리움, 후미콜라, 마그나포르테, 무코르, 미셀리오프토라, 네오칼리마스틱스, 뉴로스포라, 파에실로미세스, 페니실리움, 피로미세스, 스키조필룸, 탈라로미세스, 써모아스쿠스, 티엘라비아, 톨리포클라디움, 트리코더마, 및 우스틸라고로 이루어진 군으로부터의 속(genus)으로부터 선택된 사상균 세포(filamentous fungal cell)이며, 바람직하게는 세포가,
아스페르길루스 니게르, 아스페르길루스 아와모리, 아스페르길루스 포에티두스, 아스페르길루스 소자에, 아스페르길루스 푸미가투스, 탈라로미세스 에메르소니이, 아스페르길루스 오리자에, 미셀리오프토라 테르모필라, 트리코더마 레에세이, 페니실리움 크리소게눔, 페니실리움 심플리시시뭄 및 페니실리움 브라실리아눔으로 이루어진 군으로부터의 종으로부터 선택된 사상균 세포이거나;
또는, 여기서 세포가,
사카로미세스, 클루이베로미세스, 칸디다, 피치아, 스키조사카로미세스, 한세눌라, 클로에케라, 쉬완니오미세스, 야로위아, 크립토코쿠스, 데바로미세스, 사카로미세콥시스, 사카로미코데스, 위케르하미아, 데바요미세스, 한세니아스포라, 오가타에아, 쿠라이쉬아, 코마가타엘라, 메트쉬니코위아, 윌리옵시스, 나카자와에아, 토룰라스포라, 불레라, 로도토룰라, 및 스포로볼로미세스로 이루어진 군으로부터의 속으로부터 선택된 효모 세포이며, 바람직하게는 세포가, 클루이베로미세스 락티스, 에스. 세레비시아에, 한세눌라 폴리모르파, 야로위아 리폴리티카, 칸디다 트로피칼리스 및 피치아 파스토리스로 이루어진 군으로부터의 종으로부터 선택된 효모 세포인, 세포. - HMFCA를 FFCA로 산화시키는 능력을 갖는 효소를 발현하는, 제5항 내지 제11항 중 어느 한 항에 따른 진균 세포를, 상기 세포에 의한 HMFCA의 산화에 도움이 되는 조건하에, HMFCA의 존재하에, 인큐베이션하는 단계를 포함하는, HMFCA를 FFCA로 산화시키는 방법.
- 제5항 내지 제11항 중 어느 한 항에 따른 진균 세포를, FDCA의 하나 이상의 푸란계 전구체를 포함하는 배지에서, 바람직하게는 상기 세포에 의한 FDCA의 푸란계 전구체의 FDCA로의 산화에 도움이 되는 조건하에, 인큐베이션하는 단계, 및, 임의로 FDCA의 회수 단계를 포함하며, 여기서 바람직하게는, FDCA의 적어도 하나의 푸란계 전구체는 HMF, 2,5-디히드록시메틸 푸란 (DHF), HMFCA, FFCA 및 2,5-디포르밀 푸란 (DFF)으로 이루어진 군으로부터 선택되며, 이 중 HMF가 가장 바람직하고,
여기서 FDCA의 푸란계 전구체는 하나 이상의 헥소스 당, 바람직하게는 리그노셀룰로스 바이오매스(biomass)로부터 수득된 하나 이상의 헥소스 당으로부터, 바람직하게는 산-촉매화된 탈수에 의해 수득되고,
여기서 바람직하게는 FDCA는 산 침전 후에 냉각 결정화 및/또는 용매 추출을 포함하는 공정에 의해 배지로부터 회수되는 것인,
FDCA를 제조하는 방법. - 제13항에 있어서, 배지가 2.0 내지 3.0의 범위의 pH를 가지며, 여기서 바람직하게는 FDCA는 그것이 제조되는 산성 배지로부터 침전되고, 산 침전 후에 냉각 결정화를 포함하는 공정에 의해 배지로부터 회수되는 것인 방법.
- a) 제13항 또는 제14항에 따른 방법으로 FDCA 단량체를 제조하는 단계; 및,
b) a)에서 수득된 FDCA 단량체로부터 중합체를 제조하는 단계
를 포함하는, 적어도 2개의 FDCA 단량체로부터 중합체를 제조하는 방법. - 제15항에 있어서, 중합체가 FDCA 단량체와 디올 단량체를 혼합하고 FDCA와 디올 단량체가 중합되는 조건하에 상기 혼합물을 가져옴으로써 제조되는 것인 방법.
- 푸란계 전구체 중 하나 이상의 FDCA로의 생체형질전환을 위한, 제5항 내지 제11항 중 어느 한 항에 따른 진균 세포, 또는 FDCA의 푸란계 전구체를 FDCA로 전환시키는 능력을 가진 하나 이상의 박테리아 효소를 발현하는 진균 세포의 용도로서, 여기서 바람직하게는, FDCA의 적어도 하나의 푸란계 전구체가 HMF, DHF, HMFCA, FFCA 및 DFF로 이루어진 군으로부터 선택되며, 이 중 HMF가 가장 바람직한 것인, 용도.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP17162104.8 | 2017-03-21 | ||
EP17162104.8A EP3378931A1 (en) | 2017-03-21 | 2017-03-21 | Fdca-decarboxylating monooxygenase-deficient host cells for producing fdca |
PCT/EP2018/057140 WO2018172401A1 (en) | 2017-03-21 | 2018-03-21 | Fdca-decarboxylating monooxygenase-deficient host cells for producing fdca |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20190130134A true KR20190130134A (ko) | 2019-11-21 |
Family
ID=58401429
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020197029619A KR20190130134A (ko) | 2017-03-21 | 2018-03-21 | Fdca 제조를 위한 fdca-탈카르복실화 모노옥시게나제-결핍 숙주 세포 |
Country Status (10)
Country | Link |
---|---|
US (1) | US20200102584A1 (ko) |
EP (2) | EP3378931A1 (ko) |
JP (1) | JP2020513816A (ko) |
KR (1) | KR20190130134A (ko) |
CN (1) | CN110651034A (ko) |
AU (1) | AU2018238393A1 (ko) |
BR (1) | BR112019019516A2 (ko) |
CA (1) | CA3056491A1 (ko) |
MX (1) | MX2019011083A (ko) |
WO (1) | WO2018172401A1 (ko) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109536466B (zh) * | 2018-11-19 | 2022-04-22 | 华南理工大学 | 醛脱氢酶及其基因、重组菌构建及其在呋喃羧酸合成中的应用 |
MX2021010457A (es) * | 2019-03-01 | 2021-12-10 | Braskem Sa | Método para la síntesis in vivo del 4-hidroximetilfurfural y sus derivados. |
CN110551639B (zh) * | 2019-09-09 | 2021-05-18 | 南京工业大学 | 一种短梗霉菌株及其在2,5-二羟甲基呋喃合成中的应用 |
CN110713939B (zh) * | 2019-10-29 | 2021-01-22 | 华东理工大学 | 一种极低pH条件下降解木质纤维素来源抑制物的菌株及应用 |
CN110699387B (zh) * | 2019-10-29 | 2021-06-04 | 华东理工大学 | 一种使用生物可降解有机酸催化剂的木质纤维素预处理方法 |
CN114410517B (zh) * | 2022-01-06 | 2023-03-31 | 齐鲁工业大学 | 一株解淀粉芽孢杆菌及其在制备2,5-呋喃二甲酸中的应用 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0635574B1 (en) | 1993-07-23 | 2003-04-23 | Dsm N.V. | Selection marker gene free recombinant strains, a method for obtaining them and the use of these strains |
US7067303B1 (en) | 2003-01-24 | 2006-06-27 | The United States Of America As Represented By The Secretary Of Agriculture | Culture containing biomass acid hydrolysate and Coniochaeta ligniaria fungus |
BRPI0814296A2 (pt) * | 2007-07-31 | 2014-10-21 | Baerbel Hahn Ab | Polipeptídeo isolado, seqüência de nucleotídeos, vetor, célula hospedeira, e, uso do polipeptídeo, da seqüência de nucleotídeos, do vetor ou da célula hospedeira |
BRPI0909989A2 (pt) | 2008-06-05 | 2021-06-22 | Butamax Advanced Biofuels Llc | célula de levedura recombinante e método para a produção de um produto |
BR112012004802A2 (pt) | 2009-09-02 | 2015-09-08 | Dsm Ip Assets Bv | polipeptídeos tendo atividade oxirredutase e seus usos |
NL2006359C2 (en) * | 2011-03-08 | 2012-04-24 | Bird Engineering B V | Genetically modified cell and process for use of said cell. |
FR2985260B1 (fr) * | 2011-12-29 | 2014-06-27 | Natura Cosmeticos Sa | Procede pour la production de poly(2,5-furanedicarboxylate d'ethylene) a partir d'acide 2,5-furanedicarboxylique et son utilisation, compose polyester et melanges de celui-ci. |
NZ705079A (en) * | 2012-09-12 | 2017-10-27 | Butamax Advanced Biofuels Llc | Processes and systems for the production of fermentation products |
WO2014142647A1 (en) | 2013-03-14 | 2014-09-18 | Wageningen Universiteit | Fungals strains with improved citric acid and itaconic acid production |
CN104164397B (zh) * | 2013-05-17 | 2018-09-07 | 武汉臻智生物科技有限公司 | 重组微生物及其用途 |
US10457965B2 (en) * | 2015-02-17 | 2019-10-29 | Purac Biochem B.V. | Dehydrogenase-catalysed production of FDCA |
EP3353289A1 (en) * | 2015-09-21 | 2018-08-01 | Purac Biochem B.V. | Fungal production of fdca |
-
2017
- 2017-03-21 EP EP17162104.8A patent/EP3378931A1/en not_active Withdrawn
-
2018
- 2018-03-21 US US16/495,845 patent/US20200102584A1/en not_active Abandoned
- 2018-03-21 CN CN201880033567.5A patent/CN110651034A/zh active Pending
- 2018-03-21 BR BR112019019516A patent/BR112019019516A2/pt not_active IP Right Cessation
- 2018-03-21 KR KR1020197029619A patent/KR20190130134A/ko not_active Application Discontinuation
- 2018-03-21 CA CA3056491A patent/CA3056491A1/en not_active Abandoned
- 2018-03-21 JP JP2019551319A patent/JP2020513816A/ja active Pending
- 2018-03-21 EP EP18711134.9A patent/EP3601524A1/en not_active Withdrawn
- 2018-03-21 WO PCT/EP2018/057140 patent/WO2018172401A1/en unknown
- 2018-03-21 MX MX2019011083A patent/MX2019011083A/es unknown
- 2018-03-21 AU AU2018238393A patent/AU2018238393A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
EP3378931A1 (en) | 2018-09-26 |
JP2020513816A (ja) | 2020-05-21 |
WO2018172401A1 (en) | 2018-09-27 |
BR112019019516A2 (pt) | 2020-04-22 |
MX2019011083A (es) | 2019-11-05 |
EP3601524A1 (en) | 2020-02-05 |
AU2018238393A1 (en) | 2019-10-03 |
CA3056491A1 (en) | 2018-09-27 |
US20200102584A1 (en) | 2020-04-02 |
CN110651034A (zh) | 2020-01-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3259349B1 (en) | Dehydrogenase-catalysed production of fdca | |
KR20190130134A (ko) | Fdca 제조를 위한 fdca-탈카르복실화 모노옥시게나제-결핍 숙주 세포 | |
US11034979B2 (en) | Fungal production of FDCA | |
JP6372889B2 (ja) | オキシドレダクターゼ活性を有するポリペプチドおよびその使用 | |
JP4963488B2 (ja) | 変異体酵母及びこれを用いた物質生産方法 | |
EA032726B1 (ru) | Рекомбинантная эукариотическая клетка для продукции янтарной кислоты, которая содержит nad(h)-зависимую фумаратредуктазу | |
US9885066B2 (en) | Organic acid pathway | |
JP2010075171A (ja) | キャンディダ・ユティリスによる高効率乳酸製造法 | |
EP2222854A1 (en) | Dicarboxylic acid production in a filamentous fungus | |
KR101437041B1 (ko) | 숙신산 내성 효모균주를 이용한 숙신산의 제조방법 | |
JP2006020602A (ja) | 乳酸生産方法 | |
JP2011120508A (ja) | コハク酸を製造する方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application |