KR20170116051A

KR20170116051A - Fdca의 디하이드로게나아제-촉매화 생산

Info

Publication number: KR20170116051A
Application number: KR1020177022848A
Authority: KR
Inventors: 하랄트 요한 라이제나르스
Original assignee: 푸락 바이오켐 비.브이.
Priority date: 2015-02-17
Filing date: 2016-02-17
Publication date: 2017-10-18
Also published as: WO2016133384A1; AU2016220612A1; EP3259349B1; DK3259349T3; JP2018504904A; BR112017017525A2; AU2016220612B2; US10457965B2; JP2021101708A; MX2017010459A; CN107250368A; EP3259349A1; ES2817001T3; TWI727941B; US20180030488A1; CA2975226A1; TW201638336A

Abstract

본 발명은 푸라닉 화합물 운반 역량을 갖는 폴리펩티드를 발현하는 세포뿐만 아니라 5-히드록시메틸-2-푸란카르복실산 디하이드로게나아제 활성을 갖는 폴리펩티드를 발현하는 세포에 관한 것이다. 또한, 본 발명은 2,5-푸란-디카르복실산(FDCA)의 제조방법에 관한 것으로, 여기서 본 발명의 세포는 FDCA의 푸라닉 전구체의 산화에 사용된다.

Description

FDCA의 디하이드로게나아제-촉매화 생산{DEHYDROGENASE-CATALYSED PRODUCTION OF FDCA}

본 발명은 효소학, 분자 유전학, 바이오트랜스포메이션(biotransformation) 및 발효 기술 분야에 관한 것이다. 특히, 본 발명은 5-(히드록시메틸)-2-푸로산(5-(hydroxymethyl)-2-furoic acid)을 5-포르밀-2-푸로산으로 산화시키는 디하이드로게나아제, 및 상기 디하이드로게나아제를 코딩하는 폴리뉴클레오티드 및 히드록시메틸푸르푸랄의 2,5-푸란디카르복실산으로의 바이오트랜스포메이션에 사용하는 이들의 용도에 관한 것이다.

2,5- 푸란디카르복실산(FDCA)은 엄청난 경제적 영향을 미치는 폴리에스테르의 생산에 적용할 수 있는 모노머 화합물이다. 당해 분야에서 매우 중요한 화합물은 테레프탈산(PTA) 및 에틸렌 글리콜로부터 생산된 폴리에틸렌테레프탈레이트(PET)이다. FDCA는 폴리에스터 PET에서 PTA를 대체할 수 있으며, 폴리에틸렌푸란디카르복실레이트(PEF)가 생성된다. PEF는 대형 폴리에스테르 시장에서 PET를 대체할 수 있는 좋은 잠재력을 가지고 있다. PET와 비교하여 우수한 특성을 지닐뿐만 아니라 재생가능 원료에서 유도될 수 있기 때문이다. FDCA는 화학적으로 당으로부터 생산되거나(De Jong et al.. 2012. In: Biobased Monomers, Polymers and Materials, Smith, P., et al., ACS 심포지엄 시리즈, American Chemical Society: Washington DC) 또는 복합 화학-생물학적 경로((Wiercks et al 2011, Appl Microbiol Biotechnol 92: 1095-1105)로 생산될 수 있다. 후자의 경우 글루코오스나 프룩토즈와 같은 단당을 효소에 의해 FDCA로 산화될 수 있는 5-(히드록시메틸)-2-푸르알데히드(HMF)로 화학적으로 변형시킨다.

HMF로부터 FDCA를 생산하기 위한 생물학적 경로는 쿠프리아비더스 바실렌시스(Cupriavidus basilensis) HMF14의 HMF 분해 균주의 분리를 기반으로 개발되었다(Wierckx et al., 2010. Microbial Technology 3: 336-343). C. 바질렌시스(C. basilensis) HMF14에서 HMF 분해 경로에 관여하는 효소를 코딩하는 유전자 클러스터가 확인되었고, 슈도모나스 푸티다(Pseudomonas putida) 균주에서 관련 유전자가 이형적으로 발현되어(Koopman et al., 2010, PNAS 107: 4919-4924), 이로 인해 HMF를 대사하는 능력을 얻었다. 분해 경로의 첫 번째 산화 단계는 5-(히드록시메틸)-2-푸로산(HMFCA)의 형성을 포함하며, 이는 그 다음 5-포르밀 2-푸로산(FFA)으로 그리고 FDCA로 더욱 산화된다. 후속 작업(Koopman et al., 2010, Bioresource Technology 101: 6291-6296 및 WO 2011/026913)에서 효소 HMF 산화 환원 효소를 코딩하는 C. 바실렌시스(C. basilensis) HMF14의 hmfli 유전자만 P. 푸티다(P. putida)에 도입되었다. 산화 환원 효소는 주로 HMFCA에서 산화 효소로 작용하지만 HMF 또는 FFA를 산화시킬 수도 있다. hmfli 유전자만의 이종 발현은 P. 푸티다(P. putida)가 HMF로부터 FDCA를 생산할 수 있게 한다. 추가의 최적화 작업(Wierckx et al., 2011, supra; 및 WO 2012/064195)에서, HMFCA 운반체를 코딩하는 P. 푸티다(P. putida) 및 알려지지 않은 특이성을 갖는 알데히드 디하이드로게나아제를 코딩하는 P. 푸티다(P. putida)에서 2개의 추가 유전자가 각각 발현되었다.

그러나, HMF로부터 FDCA를 생산하기 위한 산화 효소 - 촉매화 경로는 디하이드로게나아제 - 촉매화 경로와 비교하여 몇 가지 고유한 단점을 가지며, 이는 적어도 독성 H₂O₂의 생성, 산화 단계로부터의 에너지 이득의 부족, O₂에 대한 빈약한 친화도, 및 상기 시스템의 관련된 높은 산소 요구량을 포함한다. 따라서, 본 발명의 목적은 HMF와 같은 푸라닉 전구체로부터 FDCA를 생산하기 위한 신규한 디하이드로게나아제 촉매화 경로에 대한 수단 및 방법을 제공함으로써, 그리고 이러한 방법에서 신규한 HMFCA 운반체를 사용하기 위한 수단 및 방법을 제공함으로써 이러한 단점을 해결하는 것이다.

제 1 견지로, 본 발명은 SEQ ID NO: 1 내지 11의 아미노산 서열 중 어느 하나와 적어도 45% 동일성을 갖는 아미노산 서열을 갖는 디하이드로게나아제를 코딩하는 뉴클레오티드 서열의 발현을 위한 발현 구조물을 포함하는 세포에 관한 것으로, 상기 발현 구조물은 상기 세포에서 발현가능하며, 디하이드로게나아제의 발현은 상기 발현 구조물이 결여된 이에 상응하는 와일드 타입 세포에 비해, 5-히드록시메틸-2-푸란 카르복실산(HMFCA)을 5-포르밀-2-푸로산(FFA)으로 산화시키는 능력을 세포에 부여하거나 증가시킨다. 바람직하게, 상기 세포는 추가로 a) 및 b)를 갖는다: a) 푸라닉 알데히드를 이에 상응하는 푸라닉 카르복실산으로 산화시키는 알데히드 디하이드로게나아제 활성을 가지며, 여기서 바람직하게 상기 세포는 SEQ ID NO's: 24, 25, 26, 27, 28, 29 및 30 중 어느 하나의 아미노산 서열과 적어도 45% 동일성을 갖는 아미노산 서열을 포함하는 알데히드 디하이드로게나아제를 코딩하는 뉴클레오티드 서열의 발현을 위한 제 2 발현 구조물을 포함하며, 여기서 상기 제 2 발현 구조물은 상기 세포에서 발현가능하고 상기 알데히드 디하이드로게나아제의 발현은 상기 제 2 발현 구조물이 결여된 이에 상응하는 와일드 타입 세포에 비해, i) 5-히드록시메틸푸르푸랄(HMF)을 HMFCA로 산화시키는 것, ii) DFF를 FFA로 산화시키는 것, 및 iii) FFA를 FDCA로 산화시키는 것 중 적어도 하나의 능력을 상기 세포에 부여하거나 증가시킴; 및 b) 상기 세포 내로 및/또는 외로 푸라닉 화합물을 운반하는 능력, 여기서 바람직하게 상기 세포는 적어도 FDVIFCA를 세포 내로 수송하는 능력을 갖는 폴리펩티드를 코딩하는 뉴클레오티드 서열의 발현을 위한 제 3 발현 구조물을 포함하고, 상기 폴리펩티드는 SEQ ID NO's: 17, 31, 32, 33 및 34의 아미노산 서열 중 어느 하나와 적어도 45% 동일성을 갖는 아미노산 서열을 포함하며, 여기서 상기 제 3 발현 구조물은 상기 세포에서 발현 가능하며, 상기 폴리펩티드의 발현은 상기 제 3 발현 구조물이 결여된 이에 상응하는 와일드 타입 세포와 비교하여, 상기 세포에 적어도 FDVIFCA를 수송하는 능력을 상기 세포에 부여하거나 증가시킨다.

다른 견지로, 본 발명은 적어도 HMFCA를 세포 내로 수송하는 능력을 갖는 폴리펩티드를 코딩하는 뉴클레오티드 서열의 발현을 위한 발현 구조물을 포함하는 세포에 관한 것으로, 상기 폴리펩티드는 SEQ ID NO: 17의 아미노산 서열과 적어도 86.5% 동일성을 갖는 아미노산 서열을 포함하며, 여기서 상기 발현 구조물은 상기 세포에서 발현가능하고, 상기 폴리펩티드의 발현은 상기 발현 구조물이 결여된 이에 상응하는 와일드 타입 세포에 비해, 상기 세포 내에서 적어도 HMFCA를 세포 내로 운반하는 능력을 세포에 부여하거나 증가시키며, 여기서 상기 세포는 추가로 HMF를 FDCA로 전환시키는 효소를 포함하며, 여기서 HMF를 FDCA로 전환시키는 효소는 바람직하게 a) 및 b) 중 적어도 하나를 포함한다: a) HMFCA를 FFA로 산화시키는 알코올 디하이드로게나아제 및 푸라닉 알데히드를 이에 상응하는 푸라닉 카르복실산으로 산화시키는 알데히드 디하이드로게나아제 활성; 및 b) HMF, 2,5-디히드록시메틸 푸란, HMFCA, FFA 및 2,5-디포르밀 푸란 중 하나 이상을 FDCA로 산화시키는 산화 환원 효소 및 선택적으로 푸라닉 알데히드를 이에 상응하는 푸라닉 카르복실산으로 산화시키는 알데히드 디하이드로게나아제 활성.

본 발명에 따른 세포는 박테리아, 효모 또는 사상균류 세포와 같은 미생물 세포인 것이 바람직하다. 본 발명의 효모 또는 사상균류 세포는 바람직하게는 칸디다(Candida), 한세눌라(Hansenula), 클루이베로미세스(Kluyveromyces), 피치아(Pichia), 사카로미세스(Saccharomyces), 쉬조사카로미세스(Schizosaccharomyces), 야로위아(Yarrowia), 아크레모늄(Acremonium), 아가리커스(Agaricus), 아스퍼질러스(Aspergillus), 아우레오바시듐(Aureobasidium), 미셀리오프토라(Myceliophthora), 크리소스포륨(Chrysosporium), 코프리너스(Coprinus), 크립토코커스(Cryptococcus), 필리바시듐(Filibasidium), 푸사륨(Fusarium), 휴미콜라(Humicola), 마그나포르테(Magnaporthe), 뮤코르(Mucor), 미셀리오프토라(Myceliophthora), 네오칼리마스틱스(Neocallimastix), 뉴로스포라(Neurospora), 파에실로미세스(Paecilomyces), 페니실리움(Penicillium), 피로미세스(Piromyces), 파네로카에테(Panerochaete), 플레우로터스(Pleurotus), 쉬조필룸(Schizophyllum), 탈라로미세스(Talaromyces), 테르모아스커스(Thermoascus), 티엘라비아(Thielavia), 톨리포클라듐(Tolypocladium), 및 트리코더마(Trichoderma)로 구성되는 그룹의 속으로부터 선택되며, 가장 바람직하게 클루이베로미세스 락티스(Kluyveromyces lactis), S. 세레비지아에(S. cerevisiae), 한세눌라 폴리모르파(Hansenula polymorpha), 야로위아 리포리티카(Yarrowia lipolytica), 피치아 파스토리스(Pichia pastoris), 아스퍼질러스 나이거(Aspergillus niger), 아스퍼질러스 아와모리(Aspergillus awamori), 아스퍼질러스 포에티더스(Aspergillus foetidus), 아스퍼질러스 소자에(Aspergillus sojae), 아스퍼질러스 푸미가터스(Aspergillus fumigatus), 탈라로미세스 에머르소니(Talaromyces emersonii), 아스퍼질러스 오리자에(Aspergillus oryzae), 미셀리오프토라 테르모필라(Myceliophthora thermophila), 트리코더마 리세이(Trichoderma reesei) 및 페니실리움 크리소게넘(Penicillium chrysogenum)으로 구성되는 그룹의 종으로부터 선택된 효모 또는 사상균류 세포이다. 본 발명의 박테리아 세포는 에쉐리키아(Escherichia), 아나바에나(Anabaena), 아에리바실러스(Aeribacillus), 아네우리니바실러스(Aneurinibacillus), 버콜데리아(Burkholderia), 브래디라이조븀(Bradyrhizobium), 카울로박터(Caulobacter), 큐프리아비더스(Cupriavidus), 데설포토마컬럼(Desulfotomaculum), 데설푸리스포라(Desulfurispora), 글루코노박터(Gluconobacter), 로도박터(Rhodobacter), 펠로토마컬럼(Pelotomaculum), 슈도모나스(Pseudomonas), 파라코커스(Paracoccus), 바실러스(Bacillus), 게오바실러스(Geobacillus), 브레비바실러스(Brevibacillus), 브레비박테리움(Brevibacterium), 코리네박테리움(Corynebacterium), 리조븀 (시노히조븀)(Rhizobium (Sinorhizobium)), 플라보박테리움(Flavobacterium), 클렙시엘라(Klebsiella), 엔테로박터(Enterobacter), 락토바실러스(Lactobacillus), 락토코커스(Lactococcus), 메틸로박테리움(Methylobacterium), 랄스토니아(Ralstonia), 로도슈도모나스(Rhodopseudomonas), 스타필로코커스(Staphylococcus) 및 스트렙토미세스(Streptomyces)로 구성되는 그룹의 속으로부터 선택되며, 보다 바람직하게 A. 팔리더스(A. pallidus), A. 테라노벤시스(A. terranovensis), B. 서브틸리스(B. subtilis), B. 아밀로리쿼파시엔스(B. amyloliquefaciens), B. 코아굴란스(B. coagulans), B. 크리벤시스(B. kribbensis), B. 리체니포르미스(B. licheniformis), B. 펀티스(B. puntis), B. 메가테리움(B. megaterium), B. 할로더란스(B. halodurans), B. 퍼밀러스(B. pumilus), B. 테르모러버(B. thermoruber), B. 파나시후미(B. panacihumi), C. 바실렌시스(C. basilensis), D. 쿠즈네트소비(D. kuznetsovii), D. 테르모필라(D. thermophila), G. 카우스토필러스(G. kaustophilus), 글루코노박터 옥시단스(Gluconobacter oxydans), 카울로박터 크레센터스(Caulobacter crescentus) CB 15, 메틸로박테리움 엑스토르퀀스(Methylobacterium extorquens), 로도박터 스파에로이데스(Rhodobacter sphaeroides), 펠로토마컬럼 테르모프로피오니컴(Pelotomaculum thermopropionicum), 슈도모나스 제아산티니파시엔스(Pseudomonas zeaxanthinifaciens), 슈도모나스 퍼티다(Pseudomonas putida), 파라코커스 데니트리피칸스(Paracoccus denitrificans), E. 콜라이(E. coli), C. 글루타미컴(C. glutamicum), 스타필로코커스 카르노서스(Staphylococcus carnosus), 스트렙토미세스 리비단스(Streptomyces lividans), 시노르히조븀 멜리오티(Sinorhizobium melioti) 및 리조븀 래디오박터(Rhizobium radiobacter)로 구성되는 그룹의 종으로부터 선택된 박테리아 세포이다.

다른 견지로, 본 발명은 상기 견지에서 정의된 바와 같은 HMFCA 디하이드로게나아제 활성을 갖는 폴리펩티드를 제조하는 방법, 및/또는 상기 견지에서 정의된 푸라닉 화합물 운반 능력을 갖는 폴리펩티드를 제조하는 방법에 관한 것이다. 상기 방법은 바람직하게 상기 견지에서 정의된 바와 같은 세포를 상기 폴리펩티드(들)의 발현에 도움이 되는 조건하에 배양하고, 선택적으로 상기 폴리펩티드(들)를 회수하는 단계를 포함한다.

또 다른 견지로, 본 발명은 HMFCA를 FFA로 산화시키는 방법에 관한 것으로, 상기 방법은 HMFCA의 존재하에, 바람직하게는 상기 세포에 의해 HMFCA의 산화에 도움이 되는 조건하에 상기 견지들 중 어느 하나에 따른 세포를 배양하는 단계를 포함한다.

또 다른 견지로, 본 발명은 FDCA를 생산하는 방법에 관한 것으로, 상기 방법은 FDCA의 하나 이상의 푸라닉 전구체를 포함하는 배지에서, 바람직하게는 상기 세포에 의한 FDCA의 푸라닉 전구체의 FDCA로의 산화에 도움이 되는 조건하에서 상기 견지들 중 어느 하나에 따른 세포를 배양하는 단계, 및 선택적으로 상기 FDCA의 회수를 포함하며, 여기서 바람직하게, FDCA의 적어도 하나의 푸라닉 전구체는 HMF, 2,5-디히드록시메틸 푸란(DHF, 또는 HMF-OH), HMFCA, FFA 및 2,5-디포르밀 푸란(DFF)으로 구성되는 그룹으로부터 선택되며, 이중에서는 HMF가 가장 바람직하며, 여기서 FDCA의 푸라닉 전구체는 하나 이상의 헥소스 당으로부터 얻어지며, 바람직하게 리그노셀룰로즈 바이오매스로부터, 바람직하게는 산-촉매화 디하이드로게네이션에 의해 얻어진 하나 이상의 헥소스 당이며, 그리고 여기서 바람직하게 상기 FDCA는 냉각 결정화 및/또는 용매 추출이 후속하는 산 또는 염 침전을 포함하는 공정에 의해 배지로부터 회수된다.

추가의 견지로, 본 발명은 하나 이상의 FDCA 모노머로부터 폴리머를 제조하는 방법에 관한 것으로, 상기 방법은 a) 상기 견지에 따른 방법으로 FDCA 모노머를 제조하는 단계; 및 a)에서 얻어진 FDCA로부터 폴리머를 생산하는 단계를 포함한다.

또한, 본 발명은 FDCA에 대한 하나 이상의 푸라닉 전구체를 FDCA로 바이오트랜스포메이션(biotransformation)시키기 위한, 상기 견지들 중 어느 하나에 따른 세포의 용도에 관한 것으로, 여기서 바람직하게, FDCA의 적어도 하나의 푸라닉 전구체는 HMF, DHF, HMFCA, FFA 및 DFF로 구성되는 그룹으로부터 선택되며, 그 중 HMF가 가장 바람직하다.

다른 일 견지로, 본 발명은 SEQ ID NO:1의 아미노산 서열과 적어도 81.85% 서열 동일성을 갖는 아미노산 서열을 포함하는 HMFCA 디하이드로게나아제 활성을 갖는 폴리펩티드에 관한 것이다. 이 견지에서, 본 발명은 또한 a) HMFCA 디하이드로게나아제 활성을 갖는 폴리펩티드를 코딩하는 뉴클레오티드 서열로서, 여기서 폴리펩티드는 SEQ ID NO:1의 아미노산 서열과 적어도 81.85% 서열 동일성을 갖는 아미노산 서열을 포함하는 뉴클레오티드 서열; b) SEQ ID NO: 12 또는 13에 나타낸 뉴클레오티드 서열; c) 길이가 10, 15, 20, 30, 50 또는 100 뉴클레오티드인 (a) 또는 (b)에 정의된 바와 같은 뉴클레오티드 서열의 프래그먼트; d) 유전 암호의 축퇴(degeneracy)에 기인하여 b) 또는 c)의 뉴클레오티드 서열의 서열과 상이한 뉴클레오티드 서열; 및 e) a) 내지 c)에서 정의된 뉴클레오티드 서열의 리버스 컴플리먼트(reverse complement)인 뉴클레오타이드 서열 중 적어도 하나를 포함하며, 여기서 바람직하게 핵산 분자는 벡터이다. 이 견지에서, 본 발명은 또한 이 견지의 폴리펩티드 및 이 견지의 핵산 분자 중 적어도 하나를 포함하는 세포에 관한 것이며, 여기서 바람직하게 상기 세포는 배양된 세포이다.

최종 견지로, 본 발명은 적어도 HMFCA를 세포 내로 운반하는 능력을 갖는 폴리펩티드에 관한 것으로, 여기서 폴리펩티드는 SEQ ID NO: 17의 아미노산 서열과 적어도 86.5% 서열 동일성을 갖는 아미노산 서열을 포함한다. 이 견지에서, 본 발명은 또한 a) 적어도 HMFCA를 세포 내로 운반하는 능력을 갖는 폴리펩티드를 코딩하는 뉴클레오티드 서열로서, 여기서 폴리펩티드는 SEQ ID NO: 17의 아미노산 서열과 적어도 86.5% 서열 동일성을 갖는 아미노산 서열을 포함하는, 뉴클레오티드 서열; b) SEQ ID NO: 18에 나타낸 뉴클레오티드 서열; c) 길이가 10, 15, 20, 30, 50 또는 100 뉴클레오티드인 (a) 또는 (b)에 정의된 바와 같은 뉴클레오티드 서열의 프래그먼트; d) 유전 암호의 축퇴에 기인하여 b) 또는 c)의 뉴클레오티드 서열의 서열과 상이한 뉴클레오티드 서열; 및 e) a) 내지 d)에서 정의된 뉴클레오티드 서열의 리버스 컴플리먼트인 뉴클레오티드 서열 중 적어도 하나를 포함하는 핵산 분자에 관한 것으로, 여기서 바람직하게 상기 핵산 분자는 벡터이다. 이 견지에서, 본 발명은 또한 이 견지의 폴리펩티드 및 이 견지의 핵산 분자 중 적어도 하나를 포함하는 세포에 관한 것이며, 여기서 바람직하게 상기 세포는 배양된 세포이다.

도 1a: P. 푸티다(P. putida ) CA2046에 의한 HMF의 바이오트랜스포메이션(P. 푸티다(P. putida); 개방 원: HMF(5-히드록시메틸푸르푸랄), 개방 사각형: HMFCA(5-히드록시메틸푸로산), 채워진 다이아몬드: FDCA(2,5-푸란 디카르복실산); 채워진 회색 원: OD600.
도 1b: P. 푸티다(P. putida) CA2101에 의한 HMF의 바이오트랜스포메이션; 개방 원: HMF(5-히드록시메틸푸르푸랄); 개방 사각형: HMFCA(5-히드록시메틸푸로산); 채워진 다이아몬드: FDCA(2,5-푸란 디카르복실산); 채워진 회색 원: OD600.
도 2: C. 바실렌시스(C. basilensis) HMF14로부터 Aldh 및 HmfT1과 함께 YiaY를 동시 발현하는, P. 푸티다(P. putida) CA2111에 의한 HMF의 바이오트랜스포메이션; 개방 원: HMF(5-히드록시메틸푸르푸랄); 개방 사각형: HMFCA(5-히드록시메틸푸로산); 채워진 다이아몬드: FDCA(2,5-푸란 디카르복실산); 채워진 회색 원: OD600. 이중 배양의 평균이 표시된다.
도 3: C. 바실렌시스(C. basilensis) HMF14로부터의 Aldh 및 HmfT1과 함께 YiaY를 동시 발현하는 P. 푸티다(P. putida) CA2112에 의한 HMF의 바이오트랜스포메이션; 개방 원: HMF(5-히드록시메틸푸르푸랄); 개방 사각형: HMFCA(5-히드록시메틸푸로산); 채워진 다이아몬드: FDCA(2,5-푸란 디카르복실산); 채워진 회색 원: OD600. 이중 배양의 평균이 표시된다.
도 4. 바실러스 크리벤시스(Bacillus kribbensis) DSM17871로부터 YiaY, 및 C. 바실렌시스(C. basilensis)로부터 Aldh 및 HmfT1를 동시 발현하는, P. 푸티다(P. putida) CA21780에 의한 HMF 바이오트랜스포메이션, HMF-OH는 본 명세서에서 "DHF"로도 언급되는 디히드록시메틸 푸란이다.
도 5. 아네우리니바실러스 테라노벤시스(Aneurinibacillus terranovensis) DSM18919로부터 YiaY, 및 C. 바실렌시스(C. basilensis)로부터 Aldh 및 HmfT1을 동시 발현하는 P. 푸티다(P. putida) CA21781에 의한 바이오트랜스포메이션. HMF-OH는 본 명세서에서 "DHF"로도 언급되는 디히드록시메틸 푸란이다.
도 6. 브레비바실러스 파나시후미(Brevibacillus panacihumi) W25로부터 YiaY, 및 C. 바실렌시스(C. basilensis)로부터 Aldh 및 HmfT1을 동시 발현하는 P. 푸티다(P. putida) CA21783에 의한 HMF 바이오트랜스포메이션. HMF-OH는 본 명세서에서 "DHF"로도 언급되는 디히드록시메틸 푸란이다.

정의

용어 "상동성(homology)", "서열 동일성(sequence identity)" 등은 본 명세서에서 상호 교환적으로 사용된다. 서열 동일성은 서열을 비교함으로써 결정된 바와 같이 2개 이상의 아미노산(폴리펩티드 또는 단백질) 서열 또는 2개 이상의 핵산(폴리뉴클레오티드) 서열 간의 관계로서 본 명세서에서 정의된다. 당해 분야에서, "동일성(identity)"은 아미노산 또는 핵산 서열 사이의 서열 연관성의 정도를 의미하며, 경우에 따라 그러한 서열의 스트링 사이의 일치에 의해 결정된다. 2개의 아미노산 서열 사이의 "유사성(similarity)"은 하나의 폴리펩티드의 아미노산 서열 및 이의 보존된 아미노산 치환체를 제 2 폴리펩티드의 서열과 비교함으로써 결정된다. "동일성(identity)"과 "유사성(similarity)"은 알려진 방법으로 쉽게 산출될 수 있다.

"서열 동일성(sequence identity)" 및 "서열 유사성(sequence similarity)"은 두 서열의 길이에 따라 전역 또는 국소 정렬 알고리즘을 사용하여 두 펩티드 또는 두 개의 뉴클레오티드 서열을 정렬함으로써 결정될 수 있다. 유사한 길이의 서열은 전체 길이에 걸쳐 서열을 최적으로 정렬하는 전역 정렬 알고리즘(예: Needleman Wunsch)을 사용하여 정렬되는 것이 바람직하며, 한편 실질적으로 상이한 길이의 서열은 국소 정렬 알고리즘(예: Smith Waterman)을 사용하여 정렬되는 것이 바람직하다. 서열은 (예를 들어, 디폴트 파라미터를 사용하여 프로그램 GAP 또는 BESTFIT에 의해 최적으로 정렬되는 경우) 서열 동일성의 특정 최소 백분율 (하기 정의된 바와 같음)을 공유할 때 "실질적으로 동일(substantially identical)" 또는 "본질적으로 유사(essentially similar)"로 언급될 수 있다. GAP은 Needleman and Wunsch 전역 정렬 알고리즘을 사용하여 이들의 전체 길이(풀(full) 길이)에 걸쳐 두 개의 시퀀스를 정렬하고, 일치 수를 최대화하며 간격을 최소화한다. 전역 정렬은 두 시퀀스가 유사한 길이를 갖는 경우 시퀀스 아이덴티티를 결정하는데 적절히 사용된다. 일반적으로 갭 생성 페널티 = 50(뉴클레오티드)/8(단백질)과 갭 익스텐션 페널티 = 3(뉴클레오티드)/2(단백질)으로 GAP 디폴트 파라미터가 사용된다. 뉴클레오티드에 대해, 사용되는 디폴트 스코어링 매트릭스는 nwsgapdna이며, 단백질에 대해 디폴트 스코어링 매트릭스는 Blosum62이다(Henikoff & Henikoff, 1992, PNAS 89, 915-919). 서열 정렬 및 퍼센트 서열 동일성에 대한 스코어는 GCG Wisconsin Package, Version 10.3(Accelrys Inc.로부터 구입가능함, 9685 Scranton Road, San Diego, CA 92121-3752 USA)과 같은 컴퓨터 프로그램을 사용하여, 또는 EmbossWIN version 2.10.0으로 프로그램 "니들(needle)"(global Needleman Wunsch 알고리즘 사용) 또는 "워터(water)"(local Smith Waterman 알고리즘 사용)과 같은 오픈 소스 소프트웨어를 사용하여, 또는 디폴트 셋팅('니들' 및 '워터' 모두에 대해, 그리고 단백질 및 DNA 정렬 모두에 대해, 디폴트 갭 오프닝 페털티는 10.0이며, 그리고 디폴트 갭 익스텐션 페널티는 0.5이며; 디폴트 스코어링 매트릭스는 단백질에 대해 Blossum62이며, DNA에 대해 DNAFull임)을 사용하여 결정될 수 있다. 전반적인 서열의 길이가 실질적으로 다른 경우, Smith Waterman 알고리즘을 사용하는 것과 같은 국소 정렬이 바람직하다.

대안적으로, 백분율 유사성 또는 동일성은 FASTA, BLAST 등과 같은 알고리즘을 사용하여 공개 데이터베이스를 검색함으로써 결정될 수 있다. 따라서, 본 발명의 핵산 및 단백질 서열은 예를 들어, 다른 패밀리 멤버 또는 관련 서열을 확인하기 위해 공개 데이터베이스에 대해 검색을 수행하는 "쿼리 서열(query sequence)"로서 또한 사용될 수 있다. 이러한 검색은 Altschul et al.(1990, J. Mol. Biol. 215: 403-10)의 BLASTn 및 BLASTx 프로그램(버전 2.0)을 사용하여 수행될 수 있다. BLAST 뉴클레오티드 검색은 NBLAST 프로그램, 스코어 = 100, 워드 길이 = 12로 수행되어 본 발명의 산화 환원 효소 핵산 분자에 상동적인 뉴클레오티드 서열을 얻을 수 있다. 본 발명의 단백질 분자와 상동적인 아미노산 서열을 얻기 위해 BLASTx 프로그램, 스코어 = 50, 워드 길이 = 3으로 BLAST 단백질 검색을 수행할 수 있다. 비교 목적으로 갭 정렬을 얻기 위해, Gapped BLAST가 문헌 Altschul et al.(1997, Nucleic Acids Res. 25(17): 3389-3402에 기재된 바와 같이 이용될 수 있다. BLAST 및 Gapped BLAST 프로그램을 이용할 경우, 각각의 프로그램(예를 들어, BLASTx 및 BLASTn)의 디폴트 파라미터가 사용될 수 있다. http://www.ncbi.nlm.nih.gov/에서 National Center for Biotechnology Information의 홈페이지 참조바람.

선택적으로, 아미노산 유사성의 정도를 결정함에 있어서, 당업자는 당업자에게 명백한 바와 같이 소위 "보존적(conservative)" 아미노산 치환을 고려할 수 있다. 보존적 아미노산 치환은 유사한 측쇄를 갖는 잔기의 상호교환성을 지칭한다. 예를 들어, 지방족 측쇄를 갖는 아미노산 그룹은 글리신, 알라닌, 발린, 루신 및 이소루신이며; 지방족-히드록시 측쇄를 갖는 아미노산 그룹은 세린 및 트레오닌이며; 아미드-함유 측쇄를 갖는 아미노산 그룹은 아스파라긴 및 글루타민이며; 방향족 측쇄를 갖는 아미노산 그룹은 페닐알라닌, 티로신 및 트립토판이며; 염기성 측쇄를 갖는 아미노산 그룹은 리신, 아르기닌 및 히스티딘이며; 황-함유 측쇄를 갖는 아미노산 그룹은 시스테인 및 메티오닌이다. 바람직한 보존적 아미노산 치환기는 발린-루신-이소루신, 페닐알라닌-티로신, 리신-아르기닌, 알라닌-발린 및 아스파라긴-글루타민이다. 본 명세서에 개시된 아미노산 서열의 치환된 변이체는 개시된 서열들에서 적어도 하나의 잔기가 제거되고 그 자리에 상이한 잔기가 삽입된 것이다. 바람직하게, 아미노산 변화는 보존적이다. 천연 발생 아미노산의 각각에 대해 바람직한 보존적 치환은 다음과 같다: Ala에서 ser으로; Arg에서 lys으로; Asp에서 gln 또는 his으로; Asp에서 glu으로; Cys에서 ser 또는 ala으로; Gln에서 asn으로; Glu에서 asp으로; Gly에서 pro으로; His에서 asn 또는 gln으로; Ile에서 leu 또는 val으로; Leu에서 ile 또는 val으로; Lys에서 arg; gln 또는 glu으로; Met에서 leu 또는 ile으로; Phe에서 met, leu 또는 tyr으로; Ser에서 thr으로; Thr에서 ser으로; Trp에서 tyr으로; Tyr에서 trp 또는 phe으로; 및 Val에서 ile 또는 leu으로.

본 명세서에서 사용된 바와 같이, 용어 "선택적으로 하이브리드화(selectively hybridizing)", "선택적으로 하이브리드화하다(hybridizes selectively)" 및 유사한 용어는 뉴클레오티드 서열이 서로에 대해 이의 조건하에서 전형적으로 적어도 66%, 적어도 70%, 적어도 75%, 적어도 80%, 더욱 바람직하게는 적어도 85%, 더욱 더 바람직하게는 적어도 90%, 바람직하게는 적어도 95%, 더욱 바람직하게는 적어도 98% 또는 보다 바람직하게는 적어도 99% 상동성을 서로 하이브리된 채로 유지하는 하이브리드화 및 세척 조건을 나타내는 것으로 의도된다. 즉, 이러한 하이브리드화 서열은 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 보다 바람직하게는 적어도 85%, 더욱 더 바람직하게는 적어도 90%, 보다 바람직하게는 적어도 95%, 보다 바람직하게는 적어도 98% 또는 보다 바람직하게는 적어도 99% 서열 동일성을 공유할 수 있다.

이러한 하이브리드화 조건의 바람직한 비-제한적인 예는 약 45℃에서 6X 소듐 클로라이드/소듐 시트레이트(SSC)에서 하이브리드화한 후, 약 50℃, 바람직하게는 약 55℃에서, 바람직하게는 약 60℃, 더욱 바람직하게는 약 65℃에서 1X SSC, 0.1% SDS에서 1회 이상 세척하는 것이다.

고도로 엄격한 조건은 예를 들어, 5x SSC/5x 덴하르트 용액/1.0% SDS에서 약 68℃에서 하이브리드화하고, 상온에서 0.2x SSC/0.1% SDS로 세척하는 것을 포함한다. 대안적으로, 세척은 42℃에서 수행될 수 있다.

당업자는 엄격하고 고도로 엄격한 하이브리드 조건에 적용할 조건을 알 것이다. 이러한 조건에 관한 추가적인 지침은 예를 들어 Sambrook et al., 1989, Molecular Cloning, A Laboratory Manual, Cold Spring Harbor Press, N.Y.; 및 Ausubel et al.(eds.), Sambrook and Russell(2001) "Molecular Cloning: A Laboratory Manual(3^rd edition), Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, New York 1995, Current Protocols in Molecular Biology, (John Wiley & Sons, N.Y.)에서 당해 기술분야에서 쉽게 이용가능하다.

물론, 폴리 A 서열(mRNA의 3' 말단 폴리(A) 트랙과 같은) 또는 T(또는 U) 잔기의 상보적 스트레치에만 하이브리드화하는 폴리뉴클레오티드는, 그러한 폴리뉴클레오티드는 폴리 (A) 스트레치 또는 이의 컴플리먼트(예를 들어, 실질적으로 어느 이중가닥 cDNA 클론)을 함유하는 어느 핵산 분자에 하이브리드화될 수 있기 때문에, 본 발명의 핵산의 일부에 특이적으로 하이브리드화하는데 사용되는 본 발명의 폴리뉴클레오티드에 포함되지 않을 수 있다.

"핵산 구조물(nucleic acid construct)" 또는 "핵산 벡터(nucleic acid vector)"는 본 명세서에서 재조합 DNA 기술의 사용으로부터 생성된 인공 핵산 분자를 의미하는 것으로 이해된다. 따라서, 용어 "핵산 구조물"은 천연 발생 핵산 분자를 포함하지 않지만 핵산 구조물은 천연 발생 핵산 분자(의 일부)를 포함할 수있다. 용어 "발현 벡터" 또는 "발현 구조물"은 숙주 세포 또는 이러한 서열과 양립가능한 숙주 생물에서 유전자의 발현을 수행할 수 있는 뉴클레오티드 서열을 의미한다. 이러한 발현 벡터는 전형적으로 적어도 적절한 전사 조절 서열을 포함하고, 선택적으로 3' 전사 종결 신호를 포함할 수 있다. 발현을 수행하는데 필요하거나 도움이 되는 추가적인 인자, 예를 들어 발현 인핸서 요소가 존재할 수 있다. 발현 벡터는 적합한 숙주 세포 내로 도입되고, 숙주 세포의 시험관 내 세포 배양시 코딩 서열의 발현을 수행할 수 있다. 발현 벡터는 숙주 세포 또는 본 발명의 유기체에서의 복제에 적합할 것이다.

본 명세서에 사용된 용어 "프로모터(promoter)" 또는 "전사 조절 서열(transcription regulatory sequence)"은 하나 이상의 코딩 서열의 전사를 조절하는 기능을 하는 핵산 프래그먼트를 지칭하며, 코딩 서열의 전사 개시 부위의 전사 방향에 대해 상류에 위치하며, DNA 의존성 RNA 폴리머라아제, 전사 개시 부위 및 이에 한정하는 것은 아니나 전사 인자 바인딩 부위, 리프레서 및 액티베이터 단백질 바인딩 부위를 포함하는 어느 다른 DNA 서열, 및 상기 프로모터로부터 전사의 양을 조절하기 위해 직접적으로 또는 간접적으로 작용하는 것으로 당업자에게 알려진 어느 다른 뉴클레오티드 서열에 대한 바인딩 사이트의 존재에 의해 구조적으로 확인된다. "구성적인(constitutive)" 프로모터는 대부분의 생리 및 발달 조건하에서 대부분의 조직에서 활성적인 프로모터이다. "유도성(inducible)" 프로모터는 예를 들어, 화학 유도체의 적용에 의한 것과 같이, 생리학적으로 또는 발달적으로 조절되는 프로모터이다.

용어 "선별 마커(selectable marker)"는 당업자에게 친숙한 용어이며, 발현시 선별가능한 마커를 함유하는 세포 또는 세포들을 선별하는데 사용될 수 있는 어느 유전적 엔티티를 기술하기 위해 본 명세서에서 사용된다. "리포터(reporter)"라는 용어는 녹색 형광 단백질(GFP)과 같은 가시적 마커를 나타내는데 주로 사용되지만 마커와 상호교환적으로 사용할 수 있다. 선별가능한 마커는 우성 또는 열성 또는 양방향일 수 있다.

본 명세서에 사용된 바와 같이, "작동가능하게 연결된(operably linked)"이란 용어는 기능적 관계에 있는 폴리뉴클레오티드 요소의 연결을 의미한다. 핵산은 다른 핵산 서열과 기능적 관계로 놓이면 "작동가능하게 연결"된다. 예를 들어, 전사 조절 서열은 코딩 서열의 전사에 영향을 주면 코딩 서열에 작동가능하게 연결된다. 작동가능하게 연결된다는 것은 연결된 DNA 서열이 전형적으로 연속적이며, 두 단백질 코딩 영역을 합치는데 필요한 경우 연속적이며 판독 프레임에 있음을 의미한다.

용어 "단백질" 또는 "폴리펩티드"는 상호교환적으로 사용되며, 특정 작용 기전, 크기, 3차원 구조 또는 기원과 관련없이 아미노산 사슬로 구성된 분자를 지칭한다.

용어 "유전자"는 적절한 조절 영역(예: 프로모터)에 작동가능하게 연결된 세포 내 RNA 분자(예: mRNA)로 전사되는 영역(전사 영역)을 포함하는 DNA 프래그먼트를 의미한다. 유전자는 일반적으로 프로모터, 5' 리더 서열, 코딩 영역 및 폴리아데닐화 부위를 포함하는 3'-비번역 서열(3'-말단)과 같은 몇 가지 작동가능하게 연결된 프래그먼트를 포함할 것이다. "유전자의 발현"은 생물학적으로 활성인 RNA, 즉 생물학적으로 활성인 단백질 또는 펩티드로 번역될 수 있는 RNA로 전사되는, 적절한 조절 영역, 특히 프로모터에 작동가능하게 연결된 DNA 영역을 처리하는 방법을 의미한다. 주어진 (재조합) 핵산 또는 폴리펩티드 분자와 주어진 숙주 유기체 또는 숙주 세포 사이의 관계를 나타내기 위해 사용되는 "상동성(homologous)"이란 용어는 본질적으로 핵산 또는 폴리뉴클레오티드 분자가 동일한 종, 바람직하게 동일한 변종 또는 균주의 숙주 세포 또는 유기체에 의해 생성되는 것을 의미하는 것으로 이해된다. 숙주 세포에 상동성인 경우, 폴리펩티드를 코딩하는 핵산 서열은 이의 천연 환경에서보다 전형적으로 (반드시 필수는 아님) 다른 (이종성) 프로모터 서열, 및 적용 가능하다면 다른 (이종성) 분비 신호 서열 및/또는 종결자 서열에 작동가능하게 연결될 것이다. 조절 서열, 신호 서열, 종결자 서열 등은 또한 숙주 세포에 상동성일 수 있는 것으로 이해된다. 이러한 맥락에서, 단지 "상동성" 서열 요소의 사용은 "자가 클로닝된(self-cloned)" 유전자 변형 생물체(GMO's)의 구축을 가능하게 한다(자가 클로닝은 본 명세서에서 European Directive 98/81/ EC Annex II에 정의된 바와 같은 것으로 정의된다). 두 핵산 서열의 관련성을 나타내기 위해 사용되는 경우, 용어 "상동성"은 하나의 단일 가닥 핵산 서열이 상보적 단일 가닥 핵산 서열에 하이브리드화될 수 있음을 의미한다. 하이브리화의 정도는 서열 사이의 동일성의 양 및 후술되는 바와 같은 온도 및 염 농도와 같은 하이브리드화 조건을 포함하는 다수의 인자에 좌우될 수 있다.

핵산(DNA 또는 RNA) 또는 단백질과 관련하여 사용되는 용어 "이종성" 및 "외인성"은 유기체, 세포, 게놈 또는 DNA 또는 RNA 서열의 일부로서 천연적으로 발생하지 않는 핵산 또는 단백질을 의미하며, 그것이 존재하거나 자연계에서 발견되는 게놈 또는 DNA 서열 또는 RNA 서열과 상이한 세포 또는 위치 또는 위치들에서 발견된다. 이종성 및 외인성 핵산 또는 단백질은 도입된 세포에 내인성이 없지만, 다른 세포 또는 합성적으로 또는 재조합적으로 생산된 세포로부터 얻어진다. 일반적으로, 반드시 그런 것은 아니지만, 그러한 핵산은 DNA가 전사되거나 발현되는 세포에 의해 정상적으로 생산되지 않는 단백질, 즉 외인성 단백질을 코딩한다. 유사하게 외인성 RNA는 외인성 RNA가 존재하는 세포에서 정상적으로 발현되지 않는 단백질을 코딩한다. 이종성/외인성 핵산 및 단백질은 또한 외래 핵산 또는 단백질로 지칭될 수 있다. 발현된 세포에 대해 당업자가 외래물질로 인식하는 어느 핵산 또는 단백질은 본 명세서에서 상기 용어 이종성 또는 외인성 핵산 단백질로 포함된다. 용어 이종성 및 외인성은 또한 핵산 또는 아미노산 서열의 비-천연 조합, 즉, 적어도 두개의 조합 서열이 서로에 대해 외래물질인 조합에 적용된다.

효소의 "특이적 활성도(specific activity)"는 본 명세서에서 총 숙주 세포 단백질 mg 당 효소 활성의 단위로 통상적으로 표현되는 총 숙주 세포 단백질의 양 당 특정 효소의 활성 양을 의미하는 것으로 이해된다. 본 발명과 관련하여, 특정 효소의 특이적 활성은 (그렇지 않으면 동일한) 와일드 타입 숙주 세포에서의 해당 효소의 특이적 활성과 비교하여 증가되거나 감소될 수 있다.

"푸라닉 화합물(Furanic compounds)"은 본 명세서에서 2,5-푸란-디카르복실 산(FDCA)뿐만 아니라 FDCA로 산화될 수 있는 푸란기를 갖는 어느 화합물로 이해되며, 후자는 본 명세서에서 "FDCA의 전구체" 또는 "FDCA의 푸라닉 전구체"로서 지칭된다. FDCA의 전구체로는 적어도 5-히드록시메틸푸르푸랄(HMF), 2,5-디히드록시메틸 푸란(DHF 또는 HMF-OH) 또는 2,5-비스(히드록시메틸)푸란(BHF), 5-히드록시메틸-2-푸란카르복실산 또는 5-히드록시메틸-2-푸로산(HMFCA), 5-포르밀-2-푸로산(FFA), 및 2,5-디포르밀 푸란(DFF)을 포함한다. 또한, "푸라닉 화합물"에서, 푸란 고리 또는 어느 또는 이의 치환가능한 측쇄가 예를 들어, 어느 이용가능한 위치상에서 푸란 고리 내의 시클릭기를 포함하는 OH, C1-C1 알킬, 알킬, 알릴, 아릴 또는 RO- 에테르부로 치환될 수 있는 것으로 이해된다.

본 명세서에서 공개 서열 데이터베이스에서 접근가능한 뉴클레오티드 또는 아미노산 서열에 대한 어느 레퍼런스는 본 문헌의 출원일에 이용가능한 서열 엔트리의 버전을 나타낸다.

발명의 상세한 설명

HMFCA 디하이드로게나아제를 발현하는 세포

제 1 견지에서, 본 발명은 5-히드록시메틸-2-푸란카복실산(HMFCA)을 5-포르밀푸로산(FFA)으로 산화시키는 능력을 갖는 세포에 관한 것이다. HMFA를 FFA로 산화시키는 능력은 바람직하게 HMFCA를 FFA으로 산화시키는 능력을 갖는 디하이드로게나아제를 코딩하는 뉴클레오티드 서열을 포함하는 핵산 구조물로 상기 세포를 형질전환시킴으로써 상기 세포에 부여되거나 또는 상기 세포에서 증가된다. 디하이드로게나아제는 바람직하게 알코올 디하이드로게나아제(즉, EC 1.1 활성을 갖는)이다. 따라서, 상기 세포는 바람직하게 HMFCA를 FFA로 산화시키는 능력을 갖는 디하이드로게나아제를 코딩하는 뉴클레오티드 서열의 발현을 위한 발현 구조물을 포함하는 세포이다. 본 발명의 바람직한 세포에서, 상기 발현 구조물은 상기 세포에서 발현가능하고, 발현 구조물이 결여된 이에 상응하는 세포, 예를 들어 와일드 타입 세포와 비교하여, 바람직하게는 세포에 HMACA를 FFA로 산화시키는 능력을 부여하거나 세포에서 증가시킨다. HMFCA를 FFA로 산화시키는 효소의 특이적 활성은 바람직하게는 상기 발현 구조물이 결여된 이에 상응하는 세포와 비교하여 적어도 1.05, 1.1, 1.2, 1.5, 2.0, 5.0, 10, 20, 50 또는 100 인자로 상기 세포에서 증가된다.

따라서, HMFCA를 FFA로 산화시키는 능력을 갖는 디하이드로게나아제는 HMFCA 디하이드로게나아제 활성을 갖는 알코올 디하이드로게나아제이다. 폴리펩티드가 HMFCA 디하이드로게나아제 활성을 갖는지 여부는 HMFA를 FFA로 산화시킬 수 없는 적합한 숙주 세포에서 폴리펩티드의 발현 및 폴리펩티드의 발현이 HMFCA를 FFA로 산화시키는 능력을 세포에 부여하는지 여부를 검출함으로써 어세이될 수 있다. 바람직하게, HMFCA 디하이드로게나아제 활성을 본 명세서의 실시예 IV에 기재된 바와 같이 어세이하며, 이에 의해 HMFCA 디하이드로게나아제 활성에 대해 어세이할 폴리펩티드를 코딩하는 뉴클레오티드 서열이 pBT'hmfH-adh(WO2012/064195에 기술됨) 내의 C. 바실렌시스(C. basilensis ) hmfH 유전자를 대체하며, 이후에 HMFCA 디하이드로게나아제 활성에 대해 어세이할 폴리펩티드의 코딩 서열을 포함하는 플라스미드가 pJNNhmfT1(t)를 함유하는 P. 푸티다(P. putida) KT2440Agcd(WO2012064195에 기술됨) 내로 도입된다. HMFCA 디하이드로게나아제 활성을 어세이할 폴리펩티드를 발현하는 P. 푸티다(P. putida) 형질전환체를 HMF와 함께 배양하고, FDCA 분석을 위해 일정한 간격으로 시료를 채취한다. HMFCA 디하이드로게나아제 활성 (및 hmfH 유전자)에 대해 어세이할 폴리펩티드가결여된 이에 상응하는 P. 푸티다(P. putida) 형질전환체와 비교하여, FDCA의 생산 증가는 상기 폴리펩티드가 HMFCA 디하이드로게나아제 활성을 갖는다는 지표로서 취해진다.

본 발명의 세포에서 발현되는 HMFCA 디하이드로게나아제는 바람직하게 NADH 또는 NADPH와 같은 아데닌 디뉴클레오티드, 플라빈 아데닌 디뉴클레오타이드(FAD), 플라빈 모노뉴클레오티드(FMN), 및 피롤로퀴놀린 퀴놀론(PQQ)으로부터 선택되는 코팩터에 의존하는 디하이드로게나아제이다.

본 발명의 세포에서 발현된 FEVIFCA 디하이드로게나아제는 또한 바람직하게는 다른 푸라닉 알코올, 바람직하게는 2번 위치의 히드록시기를 갖는 푸라닉 알코올을 이에 상응하는 알데히드로 산화시키는 능력을 갖는 알코올 디하이드로게나아제이다. 따라서, FEVIFCA 디하이드로게나아제는 바람직하게 5-히드록시메틸푸르푸랄(HMF)을 2,5-디포르밀 푸란(DFF)으로 산화시키는 능력을 갖는다.

일 구현으로, FEVIFCA를 FFA로 산화시키는 능력을 갖는 디하이드로게나아제를 코딩하는 뉴클레오티드 서열은 다음으로 이루어진 그룹으로부터 선택된다:

(a) FEVIFCA 디하이드로게나아제 활성을 갖는 폴리펩티드를 코딩하는 뉴클레오티드 서열로서, 상기 폴리펩티드는 SEQ ID NO: 1(Aeribacillus pallidus), SEQ ID NO: 2(Bacillus kribbensis), SEQ ID NO: 3(Geobacillus kaustophilus), SEQ ID NO: 4(Aneurinibacillus terranovensis), SEQ ID NO: 5(Brevibacillus thermoruber), SEQ ID NO: 6(Brevibacillus panacihumi), SEQ ID NO: 7(Bacillus sp . FJAT -14578), SEQ ID NO: 8(Desulfotomaculum kuznetsovii), SEQ ID NO: 9(Desulfurispora thermophila), SEQ ID NO: 10(Bacillus sp . L1 (2012)) 및 SEQ ID NO: 11(Pelotomaculum thermopropionicum) 중 어느 하나의 아미노산 서열과 적어도 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 81.65, 81.7, 81.8, 81.85, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 95, 96, 97, 98, 99 또는 100% 서열 동일성을 갖는, 뉴클레오티드 서열;

(b) (a)의 뉴클레오티드 서열에 하이브리드하는 상보적 스트랜드의 뉴클레오티드 서열; 및,

(c) 유전 코드의 축퇴로 인해 서열이 (b)의 뉴클레오티드 서열의 서열과 상이한 뉴클레오티드 서열.

본 발명의 바람직한 뉴클레오티드 서열은 따라서 바실랄레스(Bacillales) 또는 클로스트리디알레스(Clostridiales) 목의 박테리아로부터 얻을 수 있는 (또는 이러한 박테리아에서 자연적으로 발생하는) FEVIFCA 디하이드로게나아제의 것과 동일한 아미노산 서열을 갖는 FEVIFCA 디하이드로게나아제를 코딩한다. 하나의 바람직한 구현으로, 박테리아는 바실라세아에(Bacillaceae) 과의 것이며, 보다 바람직하게 박테리아는 아에리바실러스(Aeribacillus), 게오바실러스(Geobacillus) 및 바실러스(Bacillus) 속의 것이며, 이의 종 아에리바실러스 팔리더스(Aeribacillus pallidus), 바실러스 크리벤시스(Bacillus kribbensis), 게오바실러스 카우스토필러스(Geobacillus kaustophilus), 아네우리니바실러스 테라노벤시스(Aneurinibacillus terranovensis), 바실러스 sp.(Bacillus sp). FJAT-14578 및 바실러스 sp.(Bacillus sp .) L1(2012)이 가장 바람직하다. 다른 바람직한 구현으로, 박테리아는 파에니바실라세아에(Paenibacillaceae) 과의 것이며, 보다 바람직하게 아네우리니바실러스(Aneurinibacillus) 및 브레비바실러스(Brevibacillus) 속의 박테리아이며, 이의 종 아네우리니바실러스 테라노벤시스(Aneurinibacillus terranovensis), 브레비바실러스 테르모러버(Brevibacillus thermoruber) 및 브레비바실러스 파나시후미(Brevibacillus panacihumi)가 가장 바람직하다. 또 다른 바람직한 구현으로, 박테리아는 펩토코카세아에(Peptococcaceae) 과의 것이며, 보다 바람직하게 박테리아는 데설포토마컬럼(Desulfotomaculum), 데설푸리스포라(Desulfurispora) 및 펠로토마컬럼(Pelotomaculum) 속의 것이며, 이의 종 데설포토마컬럼 쿠즈네트소비(Desulfotomaculum kuznetsovii), 데설푸리스포라 테르모필라(Desulfurispora thermophila) 및 펠로토마컬럼 테르모프로피오니컴(Pelotomaculum thermopropionicum)이 가장 바람직하다.

일 구현으로, 본 발명의 바람직한 뉴클레오티드 서열은 중온성 박테리아, 즉 적당한 온도, 전형적으로 20 내지 45℃에서 가장 잘 자라는 박테리아의 HMFCA 디하이드로게나아제를 코딩한다. 바람직하게, 본 발명의 뉴클레오티드 서열은 20 내지 45℃ 범위의 최적 활성 및 안정성을 갖는 중온성 HMFCA 디하이드로게나아제를 코딩한다. 이러한 중온성 디하이드로게나아제의 예는 예를 들어, 바실러스 크리벤시스(Bacillus kribbensis)(30℃), 아네우리니바실러스 테라노벤시스(Aneurinibacillus terranovensis)(40℃), 브레비바실러스 테르모러버(Brevibacillus thermoruber)(45℃), 브레비바실러스 파나시후미(Brevibacillus panacihumi)(30℃), 바실러스 sp.(Bacillus sp .) FJAT-14578(30℃) 및 바실러스 에스피. L1(2012)(30-50℃)의 디하이드로게나아제 및 이에 관련된 디하이드로게나아제이다.

일 구현으로, 본 발명의 바람직한 뉴클레오티드 서열은 고온성 박테리아, 즉 전형적으로 45℃보다 높은 온도와 122℃ 사이의 비교적 고온에서 가장 잘 성장하는 박테리아의 HMFCA 디하이드로게나아제를 코딩한다. 바람직하게, 본 발명의 뉴클레오티드 서열은 따라서 45℃보다 높은 온도와 122℃ 사이 범위에서 최적 활성 및 안정성을 갖는 고온성 HMFCA 디하이드로게나아제를 코딩한다. 이러한 고온성 디하이드로게나아제의 예는 아에리바실러스 팔리더스(Aeribacillus pallidus)(55℃), 게오바실러스 카우스토필러스(Geobacillus kaustophilus)(55℃), 데설포토마컬럼 쿠즈네트소비(esulfotomaculum kuznetsovii)(60℃), 데설푸리스포라 테르모필라(Desulfurispora thermophila)(50℃), 펠로토마컬럼 테르모프로피오니컴(Pelotomaculum thermopropionicum)(55℃) 및 바실러스 sp.(Bacillus sp .) L1(2012)(30-50℃)의 디하이드로게나아제 및 이에 관련된 디하이드로게나아제이다.

일 구현으로, 뉴클레오티드 서열은, 예를 들어 와일드 타입 공급원 유기체로부터 분리될 수 있는 것과 같이, 자연에서 발생하는 것처럼 HMFCA 디하이드로게나아제 활성을 갖는 폴리펩티드를 코딩한다. 대안적으로, 상기 뉴클레오티드 서열은 상기 정의된 HMFCA 디하이드로게나아제의 어느 조작된 형태를 코딩할 수 있으며, 이는 이에 상응하는 자연적으로 발생하는 디하이드로게나아제와 비교하여 하나 이상의 아미노산 치환, 삽입 및/또는 결실을 포함하나, 본 명세서에 정의된 바와 같은 동일성 또는 유사성의 범위 내에 있다. 따라서, 일 구현으로, 본 발명의 뉴클레오티드 서열은 HMFCA 디하이드로게나아제를 코딩하며, 이의 아미노산 서열은 적어도 각각의 불변 위치(표 2에서 "*"로 표시됨)에 포함되며, 상기 아미노산은 불변 위치에 존재한다. 바람직하게, 상기 아미노산 서열은 강력하게 보존된 위치(표 2에서 ":"로 표시됨)에 포함되며, 상기 아미노산들 중 하나는 강력하게 보존된 위치에 존재한다. 더욱 바람직하게, 상기 아미노산 서열은 또한 덜 강력하게 보존된 위치(표 2에서 "."로 표시됨)에 포함되며, 상기 아미노산들 중 하나는 덜 강력하게 보존된 위치에 존재한다. 이러한 불변 및 보존된 위치 밖의 아미노산 치환은 HMFCA 디하이드로게나아제 활성에 영향을 미치기 쉽다.

HMFCA 디하이드로게나아제 활성을 갖는 폴리펩티드를 코딩하는 본 발명의 뉴클레오티드 서열은 예를 들어, 당해 기술분야(예, Sambrook and Russell (2001) "Molecular Cloning: A Laboratory Manual"(3^rd edition), Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, New York) 참조)에 잘 알려진 뉴클레오티드 서열의 분리 방법을 사용하여 상술한 공급원 유기체로서 동일한 문(phylum), 강(class) 또는 속(genus)에 속하는 것과 같은 균류, 효모 또는 박테리아의 게놈 및/또는 cDNA로부터 얻을 수 있다. 본 발명의 뉴클레오티드 서열은 예를 들어 a) 축퇴된 PCR 프라이머(보존된 아미노산 서열을 기초로 하여 설계됨)가 HMFCA 디하이드로게나아제 활성을 갖는 폴리펩티드를 코딩하는 뉴클레오티드 서열의 일부를 포함하는 PCR 프래그먼트를 생성하기 위해 적합한 유기체의 게놈 및/또는 cDNA에 사용되며; b) a)에서 얻어진 PCR 프래그먼트를 PCR 프로브로 사용하여 상기 유기체의 cDNA 및/또는 게노믹 라이브러리를 스크리닝하며; 그리고 c) HMFCA 디하이드로게나아제 활성을 갖는 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는 cDNA 또는 게놈 DNA를 생산하는 단계를 포함하는 방법으로 얻어질 수 있다.

본 발명의 HMFCA 디하이드로게나아제가 본 발명의 형질전환된 세포에서 충분한 수준 및 활성 형태로 발현될 가능성을 증가시키기 위해, 이들 효소를 코딩하는 뉴클레오티드 서열 및 본 발명의 다른 효소(하기 참조)는 바람직하게 코돈 사용을 문제의 숙주 세포의 것으로 최적화하는데 적합하다. 폴리펩티드를 코딩하는 뉴클레오티드 서열의 숙주 세포의 코돈 사용에 대한 적응성은 코돈 적응 지수(codon adaptation index; CAI)로서 나타낼 수 있다. 코돈 적응 지수는 본 명세서에서 특정 숙주 세포 또는 유기체에서 고 발현된 유전자의 코돈 사용에 대한 유전자의 코돈 사용의 상대적인 적응성의 측정으로서 정의된다. 각 코돈의 상대적 적응성(w)은 동일한 아미노산에 대해 가장 풍부한 코돈의 비율과 각 코돈의 사용 비율이다. CAI 지수는 이들 상대적인 적응성 값의 기하학적 평균으로서 정의된다. 비-유사한 코돈과 종결 코돈(유전 암호에 따라 다름)은 제외된다. CAI 값 범위는 0에서 1까지이며, 보다 높은 수치는 가장 풍부한 코돈의 보다 높은 비율을 나타낸다(Sharp and Li, 1987, Nucleic Acids Research 15: 1281-1295 참조, Jansen et al., 2003, Nucleic Acids Res 31(8): 2242-51 또한 참조). 적응된 뉴클레오티드 서열은 바람직하게 적어도 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8 또는 0.9의 CAI를 갖는다. P. 푸티다(P. putida) 세포에서 발현을 위해 코돈 최적화된 SEQ ID NO's: 13 또는 14에 열거된 서열이 가장 바람직하다.

본 발명의 HMFCA 디하이드로게나아제를 코딩하는 뉴클레오티드 서열의 발현을위한 핵산 구조물로 형질전환될 숙주 세포는 원칙적으로 본 발명의 HMACA 디하이드로게나아제가 적합하게, 바람직하게는 기능적으로, 즉 활성 형태로 발현될 수 있는 어느 숙주 세포일 수 있다. 본 발명의 숙주 세포는 바람직하게 푸라닉 화합물을 세포 내외로 능동적 또는 수동적으로 수송할 수 있는 숙주이다. 본 발명의 바람직한 숙주 세포는 특히 HMFCA, FFA 및 FDCA와 같은 카르복실화된 푸라닉 화합물을 디카르복실화하는 검출가능한 활성이 없거나 검출되지 않는다. 이러한 숙주 세포는 바람직하게는 카르복실화 푸라닉 화합물을 디카르복실화하는 능력이 자연적으로 결여되어 있다.

바람직하게, 상기 숙주 세포는 예를 들어 발효 공정에서 바람직하게는 수중 발효로 배양될 수 있는 세포와 같은 배양된 세포이다.

일 구현에 따르면, 본 발명에 따른 숙주 세포는 진핵 숙주 세포이다. 바람직하게, 진핵 세포는 포유류, 곤충, 식물, 균류 또는 조류 세포이다. 바람직한 포유류 세포는 예를 들어, 차이니즈 햄스터 난소(Chinese hamster ovary; CHO) 세포, COS 세포, 293 세포, PerC6 세포 및 하이브리도마를 포함한다. 바람직한 곤충 세포는 예를 들어, Sf9 및 Sf21 세포 및 이의 유도체를 포함한다.

그러나, 바람직하게 숙주 세포는 미생물 세포이다. 상기 세포는 진핵 미생물 세포, 바람직하게 효모 또는 사상균류 세포와 같은 균류 세포이다. 바람직한 효모 숙주 세포는 예를 들어, 칸디다(Candida), 한세눌라(Hansenula), 클루이베로미세스(Kluyveromyces), 피치아(Pichia), 사카로미세스(Saccharomyces), 쉬조사카로미세스(Schizosaccharomyces), 및 야로위아(Yarrowia)와 같은 속의 효모의 세포를 포함한다. 보다 바람직하게, 클루이베로미세스 락티스(Kluyveromyces lactis), S. 세레비지아에(S. cerevisiae), 한세눌라 폴리모파(Hansenula polymorpha), 야로위아 리폴리티카(Yarrowia lipolytica) 및 피치아 파스토리스(Pichia pastoris)와 같은 종의 효모이다. 바람직한 사상균류 세포는 예를 들어, 아크레모늄(Acremonium), 아가리커스(Agaricus), 아스퍼질러스(Aspergillus), 아우레오바시듐(Aureobasidium), 미셀리오프토라(Myceliophthora), 크리소스포륨(Chrysosporium), 코프리너스(Coprinus), 크립토코커스(Cryptococcus), 필리바시듐(Filibasidium), 푸사륨(Fusarium), 휴미콜라(Humicola), 마그나포르테(Magnaporthe), 뮤코르(Mucor), 미셀리오프토라(Myceliophthora), 네오칼리마스틱스(Neocallimastix), 뉴로스포라(Neurospora), 파에실로미세스(Paecilomyces), 페니실리움(Penicillium), 피로미세스(Piromyces), 파네로카에테(Panerochaete), 플레우로터스(Pleurotus), 쉬조필룸(Schizophyllum), 탈라로미세스(Talaromyces), 테르모아스커스(Thermoascus), 티엘라비아(Thielavia), 톨리포클라듐(Tolypocladium), 및 트리코더마(Trichoderma)와 같은 속의 사상균류의 세포를 포함한다. 바람직한 사상균류 세포는 아스퍼질러스(Aspergillus), 미셀리오프토라(Myceliophthora), 페니실리움(Penicillium), 미셀레오프토라(Myceliophthora), 탈라로미세스(Talaromyces) 또는 트리코더마(Trichoderma) 속에 속하는 것이며, 가장 바람직하게는 아스퍼질러스 나이거(Aspergillus niger), 아스퍼질러스 아와모리(Aspergillus awamori), 아스퍼질러스 포에티더스(Aspergillus foetidus), 아스퍼질러스 소자에(Aspergillus sojae), 아스퍼질러스 푸미가터스(Aspergillus fumigatus), 탈라로미세스 에머르소니(Talaromyces emersonii), 아스퍼질러스 오리자에(Aspergillus oryzae), 미셀리오프토라 테르모필라(Myceliophthora thermophila), 트리코더마 리세이(Trichoderma reesei) 및 페니실리움 크리소게넘(Penicillium chrysogenum)으로부터 선택된 종이다.

미생물 숙주 세포는 또한 원핵 세포, 바람직하게는 박테리아 세포일 수 있다. "박테리아 세포"라는 용어는 그람 음성균과 그람 양성균을 모두 포함한다. 적절한 박테리아는 에쉐리키아(Escherichia), 아나바에나(Anabaena), 아에리바실러스(Aeribacillus), 아네우리니바실러스(Aneurinibacillus), 버콜데리아(Burkholderia), 브래디라이조븀(Bradyrhizobium), 카울로박터(Caulobacter), 큐프리아비더스(Cupriavidus), 데설포토마컬럼(Desulfotomaculum), 데설푸리스포라(Desulfurispora), 글루코노박터(Gluconobacter), 로도박터(Rhodobacter), 펠로토마컬럼(Pelotomaculum), 슈도모나스(Pseudomonas), 파라코커스(Paracoccus), 바실러스(Bacillus), 게오바실러스(Geobacillus), 브레비바실러스(Brevibacillus), 브레비박테리움(Brevibacterium), 코리네박테리움(Corynebacterium), 리조븀 (시노히조븀)(Rhizobium (Sinorhizobium)), 플라보박테리움(Flavobacterium), 클렙시엘라(Klebsiella), 엔테로박터(Enterobacter), 락토바실러스(Lactobacillus), 락토코커스(Lactococcus), 메틸로박테리움(Methylobacterium), 랄스토니아(Ralstonia), 로도슈도모나스(Rhodopseudomonas), 스타필로코커스(Staphylococcus) 및 스트렙토미세스(Streptomyces)로부터 선택될 수 있다. 바람직하게, 박테리아 세포는 A. 팔리더스(A. pallidus), A. 테라노벤시스(A. terranovensis), B. 서브틸리스(B. subtilis), B. 아밀로리쿼파시엔스(B. amyloliquefaciens), B. 코아굴란스(B. coagulans), B. 크리벤시스(B. kribbensis), B. 리체니포르미스(B. licheniformis), B. 펀티스(B. puntis), B. 메가테리움(B. megaterium), B. 할로더란스(B. halodurans), B. 퍼밀러스(B. pumilus), B. 테르모러버(B. thermoruber), B. 파나시후미(B. panacihumi), C. 바실렌시스(C. basilensis), D. 쿠즈네트소비(D. kuznetsovii), D. 테르모필라(D. thermophila), G. 카우스토필러스(G. kaustophilus), 글루코노박터 옥시단스(Gluconobacter oxydans), 카울로박터 크레센터스(Caulobacter crescentus) CB 15, 메틸로박테리움 엑스토르퀀스(Methylobacterium extorquens), 로도박터 스파에로이데스(Rhodobacter sphaeroides), 펠로토마컬럼 테르모프로피오니컴(Pelotomaculum thermopropionicum), 슈도모나스 제아산티니파시엔스(Pseudomonas zeaxanthinifaciens), 슈도모나스 퍼티다(Pseudomonas putida), 파라코커스 데니트리피칸스(Paracoccus denitrificans), E. 콜라이(E. coli), C. 글루타미컴(C. glutamicum), 스타필로코커스 카르노서스(Staphylococcus carnosus), 스트렙토미세스 리비단스(Streptomyces lividans), 시노르히조븀 멜리오티(Sinorhizobium melioti) 및 리조븀 래디오박터(Rhizobium radiobacter)로 구성되는 그룹의 종으로부터 선택된다. 슈도모나스 푸티다(Pseudomonas putida) 종 내에서, P. 푸티다(P. putida) S12 및 P. 푸티다(P. putida) KT2440 균주가 바람직하다.

본 발명에 따른 숙주 세포에서 생성된 화합물의 특정 용도에 있어서, 숙주 세포의 선택은 이러한 용도에 따라 이루어질 수 있다. 예를 들어, 본 발명에 따른 숙주 세포에서 생성된 화합물이 식품 용도에 사용되는 경우, 숙주 세포는 사카로미세스 세레비지아에(Saccharomyces cerevisiae)와 같은 식품 등급 유기체로부터 선택될 수 있다. 특정 용도로는 이에 한정하는 것은 아니나 식품, (동물) 사료, 의약품, 농작물 보호와 같은 농업 및/또는 개인 위생 용품을 포함한다.

본 발명의 HMFCA 디하이드로게나아제를 코딩하는 뉴클레오티드 서열의 발현을위한 발현 구조물은 바람직하게 상기 구조물로 형질전환된 숙주 세포에 이종성 또는 외인성인 발현 구조물이다. 구조물은 숙주 세포에서 자연적으로 발생하지 않는 적어도 하나의 서열 또는 서열 요소를 포함하는 경우 및/또는 구조물이 숙주 세포에서 적어도 두 개의 서열 요소를 포함하고 그리고/또는 숙주 세포에서 요소 자체가 자연적으로 발생하지 않더라도 숙주 세포에서 자연적으로 발생하지 않는 오더를 포함하는 경우, 구조물을 포함하는 숙주 세포에 이종성 또는 외인성인 것으로 본 명세서에서 이해된다.

적절한 숙주 세포에서의 본 발명의 FDVIFCA 디하이드로게나아제를 코딩하는 뉴클레오티드 서열의 발현을 위한 벡터 및 발현 구조물은 하기에 보다 상세히 기술된다.

본 발명의 FDVIFCA 디하이드로게나아제를 발현하는 형질전환된 세포는 또한 바람직하게 알데히드 디하이드로게나아제 활성을 갖는다(즉, EC 1.2 활성을 갖는다). 바람직하게, 알데히드 디하이드로게나아제 활성은 푸라닉 알데히드를 전환시킬 수 있다. 더욱 바람직하게, 알데히드 디하이드로게나아제 활성은 푸라닉 알데히드를 이에 상응하는 푸라닉 카르복실산으로 산화시킬 수 있다. 보다 구체적으로, 알데히드 디하이드로게나아제 활성은 i) HMF를 HMFCA로 산화시키는 것, ii) 2,5-디포르밀 푸란(DFF)을 5-포르밀-2-푸로산(FFA)으로 산화시키는 것, 및 iii) FFA를 FDCA로 산화시키는 것 중 적어도 하나가 가능하다. 이러한 푸라닉 알데히드 디하이드로게나아제 활성은 세포의 내인성 활성일 수 있거나 또는 세포에 부여된 외인성 활성일 수 있다. 바람직하게, 푸라닉 알데히드 디하이드로게나아제 활성은 제 2 발현 구조물을 이용한 세포의 형질 전환에 의해 세포에 부여되거나 세포에서 증가된다. 본 발명의 바람직한 세포에서, 제 2 발현 구조물은 상기 세포에서 발현가능하고, 푸라닉 알데히드 디하이드로게나아제의 발현은 바람직하게, 예를 들어 와일드 타입 세포와 같이, 상기 발현 구조물이 결여된 이에 상응하는 세포와 비교하여, 상기 세포에서 i) HMF를 HMFCA로 산화시키는 것, ii) DFF를 FFA로 산화시키는 것, 및 iii) FFA를 FDCA로 산화시키는 것 중 적어도 하나를 산화시키는 능력을 부여하거나 증가시킨다. 푸라닉 알데히드 디하이드로게나아제의 특이적 활성은 바람직하게 상기 발현 구조물이 결여된 이에 상응하는 세포와 비교하여 상기 세포에서 1.05, 1.1, 1.2, 1.5, 2.0, 5.0, 10, 20, 50 또는 100 인자 증가된다. 제 2 발현 구조물은 바람직하게,

a) i) HMF를 HMFCA로 산화시키는 것, ii) DFF를 FFA로 산화시키는 것, 및 iii) FFA를 FDCA로 산화시키는 것 중 적어도 하나의 능력을 가지며; 그리고

b) SEQ ID NO's: 24, 25, 26, 27, 28, 29 및 30 중 어느 하나의 아미노산 서열과 적어도 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 95, 96, 97, 98, 99 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는

폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함한다.

i) HMF를 HMFCA로, ii) DFF를 FFA로 산화시키는 것, 및 iii) FFA를 FDCA로 산화시키는 것 중 적어도 하나를 산화시키는 폴리펩티드의 능력은 예를 들어, WO2012/064195의 실시예 IV에 기술된 바와 같이, C. 바실렌시스(C. basilensis) HMF 14의 HmfH 및 HmfT1 유전자와 함께 P. 푸티다(P. putida)에서 바람직하게, P. 푸티다(P. putida) KT2440 숙주 세포에서, 폴리펩티드를 코딩하는 뉴클레오티드 서열을 동시-발현시키고, 10mM HMF에서 P. 푸티다(P. putida) 세포를 배양하고, 그리고 상기 폴리펩티드를 발현하지 않는 이에 상응하는 P. 푸티다(P. putida) 세포와 비교함으로써 FDCA 축적의 증가를 검출함으로써 어세이될 수 있다. HMF를 HMFCA로 산화시키는 폴리펩티드의 능력은 또한 Koopman et al.(2010, PNAS supra)에 기술된 바와 같이 어세이될 수 있다. C. 바실렌시스(C. basilensis) HMF14로부터의 HmfT1 유전자를 발현하는 균주는 SEQ ID NO: 31의 아미노산 서열을 갖는 유전자 산물을 발현하는 것으로 이해된다.

본 발명의 HMFCA 디하이드로게나아제를 발현하는 형질전환된 세포는 또한 푸라닉 화합물을 세포 내 및/또는 외로 운반할 수 있는 능력을 갖는 것이 바람직하다. 바람직하게, 상기 세포는 FDCA에 대한 전구체인 푸라닉 화합물을 세포 내로, 바람직하게는 FDCA를 세포 밖으로 운반할 수 있는 능력을 갖는다. 이러한 푸라닉 화합물 운반 능력은 상기 세포의 내인성 역량(capabilities)일 수 있고 그리고/또는 세포에 부여된 외인성 역량일 수 있다. 따라서, 본 발명의 바람직한 세포는 푸라닉 화합물 운반 역량을 갖는 폴리펩티드를 발현한다. 더욱 바람직하게, 상기 세포는 HMFCA 운반 역량을 갖는 폴리펩티드를 발현한다. HMFCA 운반 역량은 적어도 HMFCA를 상기 세포 내로 운반하는 역량을 포함하는 것으로 이해된다. HMFCA 운반 역량을 갖는 폴리펩티드의 발현은 상기 세포 내로의 HMFCA의 운반을 증가시킬 것이며, 이는 FDCA 로의 세포 내 전환에 대한 이의 가용성을 증가시킨다. 따라서, HMFCA 바이오트랜스포메이션은 개선될 수 있다.

바람직하게, 푸라닉 화합물을 세포 내 및/또는 외로 운반하는 능력은 세포의 제 3 발현 구조물에 의한 형질전환에 의해 세포에 부여되거나 세포 내에서 증가된다. 본 발명의 바람직한 세포에서, 제 3 발현 구조물은 상기 세포에서 발현가능하고, 푸라닉 화합물 운반체의 발현은 바람직하게, 예를 들어 와일드 타입 세포와 같은 상기 발현 구조물이 결여된 이에 상응하는 세포에 비해, 상기 세포 내에서 적어도 HMFCA를 상기 세포로 운반하는 능력을 상기 세포에 부여하거나 증가시킨다. 제 3 발현 구조물은 바람직하게

a) 적어도 HMFCA 운반 역량을 가지며; 그리고

b) SEQ ID NO's: 17, 31, 32, 33 및 34 중 어느 하나의 아미노산 서열과 적어도 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 95, 96, 97, 98, 99 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는

폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함한다.

푸라닉 화합물, 특히 HMFCA를 상기 세포 내로 운반시키는 폴리펩티드의 능력은, 예를 들어, WO2012/064195의 실시예 IV에 기재되어 있는 바와 같이, C. 바실렌시스(C. basilensis) HMF 14의 HmfH 유전자 및 (WO2012/064195의 SEQ ID NO: 19의 아미노산 서열을 갖는) C. 바실렌시스(C. basilensis) HMF 14의 HMF-분해 오페론과 연관된 푸라닉 알데히드 디하이드로게나아제를 코딩하는 유전자와 함께, P. 푸티다(P. putida) 숙주 세포, 바람직하게는 P. 푸티다(P. putida) KT2440 숙주 세포에서 운반체 폴리펩티드를 코딩하는 뉴클레오티드 서열을 동시-발현시키고, 10mM HMF에서 P. 푸티다(P. putida) 세포를 배양하고, 그리고 상기 운반체 폴리펩티드를 발현하지 않는 이에 상응하는 P. 푸티다(P. putida) 세포와 비교함으로써 FDCA 축적의 증가를 검출함으로써 어세이될 수 있다.

일 구현으로, 상기 뉴클레오티드 서열은 예를 들어, 와일드 타입 공급원 유기체로부터 분리될 수 있는 것과 같이, 자연적으로 일어남에 따라 HMFCA 운반 역량을 갖는 폴리펩티드를 암호화한다. 대안적으로, 상기 뉴클레오티드 서열은 상기 정의된 바와 같은 HMFCA 운반 역량을 가지며, HMFCA 운반 역량을 갖는 이에 상응하는 천연 발생 폴리펩티드와 비교하여 하나 이상의 아미노산 치환, 삽입 및/또는 결실을 포함하나 본 명세서에 정의된 바와 같은 동일성 또는 유사성의 범위 내에 있는 어느 조작된 형태의 폴리펩티드를 코딩할 수 있다. 따라서, 일 구현으로, 본 발명의 뉴클레오티드 서열은 HMACA 운반 역량을 갖는 폴리펩티드를 코딩하며, 이의 아미노산 서열은 적어도 각각의 불변 위치(표 3에서 "*"로 표시됨)를 포함하며, 상기 아미노산은 불변 위치에 존재한다. 바람직하게, 상기 아미노산 서열은 또한 강하게 보존된 위치에 존재하는 아미노산 중 하나를 강하게 보존된 위치(표 3에서 ":"로 표시됨)를 포함한다. 더욱 바람직하게, 상기 아미노산 서열은 덜 강하에 보존된 위치(표 3에서 "."로 표시됨)에 덜 강하게 보존된 위치에 존재하는 아미노산들 중 하나를 더 포함한다. 이러한 불변의 보존된 위치 밖의 아미노산 치환은 HMFCA 운반 역량에 영향을 미치기 쉽다.

HMFCA 운반 역량을 갖는 폴리펩티드를 코딩하는 본 발명의 뉴클레오티드 서열은 본 발명의 HMFCA 디하이드로게나아제를 코딩하는 뉴클레오티드 서열에 대해 상술한 바와 같은 방식으로, 당해 기술분야에 잘 알려진 뉴클레오티드 서열의 분리 방법을 이용하여 상기 공급 유기체로서 예를 들어, 동일한 문(phylum), 강(class) 또는 속(genus)에 속하는 것과 같은 균류, 효모 또는 박테리아의 게놈 및/또는 cDNA로부터 얻을 수 있다.

푸라닉 화합물의 운반을 발현하는 세포

제 2 견지로, 본 발명은 추라닉 화합물 운반 역량을 갖는 폴리펩티드를 코딩하는 뉴클레오티드 서열을 발현하는 세포에 관한 것이다. 바람직하게, 상기 세포는 퓨라닉 화합물 운반 능력을 갖는 폴리펩티드를 코딩하는 뉴클레오티드 서열의 발현을 위한 발현 구조물로 형질전환된다. 푸라닉 화합물 운반 능력을 갖는 폴리펩티드는 HMFCA 운반 능력을 갖는 폴리펩티드인 것이 바람직하며, 적어도 HMFCA를 세포 내로 수송할 수 있는 능력을 포함한다. 바람직하게, 상기 세포는 적어도 HMFCA를 세포 내로 운반능을 갖는 폴리펩티드를 코딩하는 뉴클레오티드 서열의 발현을 위한 발현 구조물을 포함하며, 상기 폴리펩티드는 SEQ ID NO: 17의 아미노산 서열과 적어도 86.5, 87, 88, 89, 90, 91, 92, 93, 94, 95, 95, 96, 97, 98, 99 또는 100% 동일성을 갖는 아미노산 서열을 포함하며, 여기서 상기 발현 구조물은 상기 세포에서 발현가능하며, 상기 폴리펩티드의 발현은 상기 발현 구조물이 결여된 이에 상응하는 와일드 타입 세포와 비교하여 상기 세포에서 적어도 HMFCA를 상기 세포 내로 운반하는 능력을 부여하거나 증가시킨다. 푸라닉 화합물, 특히 HMFCA를 상기 세포 내로 운반하는 폴리펩티드의 능력은 상술한 바와 같이 어세이될 수 있다.

바람직하게는, 본 발명의 이러한 견지의 푸라닌 화합물의 운반체를 발현하는 형질전환된 세포는 HMF를 FDCA로 전환시키는 효소 활성을 추가로 포함하며, 여기서 HMF를 FDCA로 전환시키는 활성은 바람직하게는 다음 중 하나를 포함한다:

a) HMFCA를 FFA로 산화시키는 알코올 디하이드로게나아제 및 푸라닉 알데히드를 이에 상응하는 푸라닉 카르복실산으로 산화시키는 알데히드 디하이드로게나아제 활성; 및,

b) HMF, 2,5-디히드록시메틸 푸란, HMFCA, FFA 및 2,5-디포르밀 푸란 중 하나 이상을 FDCA로 산화시키는 산화환원 효소, 바람직하게는 옥시다아제 및 선택적으로 푸라닉 알데히드를 이에 상응하는 푸라닉 카르복실산으로 산화시키는 알데히드 디하이드로게나아제.

FDVIFCA를 FFA로 산화시키는 알코올 디하이드로게나아제 및 푸라닉 알데히드를 산화시키는 알데히드 디하이드로게나아제 활성은 바람직하게 상기 정의된 바와 같다. HMF, 2,5-디히드록시 메틸 푸란, FDVIFCA, FFA 및 2,5-디포르밀 푸란 중 하나 이상을 FDCA로 산화시키는 산화환원 효소는 WO2011/026913에 기재된 바와 같이 EC1.1 및 EC1.2 활성을 모두 갖는 산화환원 효소인 것이 바람직하다.

달리 명시하지 않는 한, 본 발명의 이러한 견지의 푸라닉 화합물의 운반체를 발현하는 형질전환된 세포는 상기 정의된 바와 같은 본 발명의 제 1 견지의 FDVIFCA 디하이드로게나아제를 발현하는 세포의 특징을 추가로 가질 수 있다.

본 발명의 폴리펩티드의 발현을 위한 벡터 및 구조물 및 방법

본 발명의 또 다른 견지는 본 발명의 HMFCA 디하이드로게나아제 또는 운반체를 코딩하는 뉴클레오티드 서열 또는 이의 기능적 등가물과 같은 본 발명의 폴리뉴클레오티드를 포함하는 클로닝 및 발현 벡터를 포함하는, 벡터와 같은 핵산 구조물, 이러한 벡터를 본 발명의 폴리펩티드의 발현이 일어나는 조건하에서와 같이 적절한 숙주 세포에서 성장, 형질전환 또는 형질감염시키는 방법에 관한 것이다. 본명세서에 사용된 바와 같이, 용어 "벡터" 및 "구조물"은 상호교환가능하게 사용되고, 본 발명의 폴리뉴클레오티드를 포함하고 바람직하게는 운반할 수 있는 구성된(constructed) 핵산 분자를 나타낸다.

본 발명의 폴리뉴클레오티드는 예를 들어, 클로닝 또는 발현 벡터와 같은 재조합 복제가능 벡터에 편입될 수 있다. 상기 벡터는 호환가능한 숙주 세포에서 핵산을 복제하는데 사용될 수 있다. 따라서, 또 다른 구현으로, 본 발명은 본 발명의 폴리뉴클레오티드를 복제가능 벡터 내로 도입시키고, 상기 벡터를 호환가능한 숙주 세포 내로 도입시키고, 상기 벡터의 복제를 일으키는 조건하에서 상기 숙주 세포를 성장시킴으로써 본 발명의 폴리뉴클레오티드를 제조하는 방법을 제공한다. 상기 벡터는 상기 숙주 세포로부터 회수될 수 있다. 적절한 숙주 세포는 상기 기재되어 있다.

본 발명의 발현 카세트 또는 폴리뉴클레오티드가 삽입되는 벡터는 재조합 DNA 과정에 편리하게 적용될 수 있는 어느 벡터일 수 있으며, 벡터의 선택은 종종 그것이 도입될 숙주 세포에 의존할 것이다.

본 발명에 따른 벡터는 자율 복제 벡터, 즉 염색체 복제와는 독립적인 복제인, 염색체 외 엔티티(extra-chromosomal entity)로서 존재하는 벡터일 수 있다. 대안적으로, 상기 벡터는 숙주 세포 내로 도입될 때 숙주 세포 게놈 내에 통합되고 그것이 통합된 염색체(들)과 함께 복제되는 벡터일 수 있다.

벡터의 일 타입은 추가 DNA 세그먼트가 라이게이션될 수 있는 원형 이중 가닥 DNA 루프를 나타내는 "플라스미드(plasmid)"이다. 또 다른 타입의 벡터는 바이러스 벡터이며, 여기서 추가 DNA 세그먼트는 바이러스 게놈에 라이게이션될 수 있다. 특정 벡터는 이들이 도입된 숙주 세포(예를 들어, 박테리아 복제 기원을 갖는 박테리아 벡터 및 에피솜 포유류 벡터)에서 자율 복제가능하다. 다른 벡터(예를 들어, 비-에피솜 포유류 벡터)는 숙주 세포 내로 도입시 숙주 세포의 게놈 내에 통합되어 숙주 게놈과 함께 복제된다. 또한, 특정 벡터는 작동 가능하게 연결된 유전자의 발현을 지시할 수 있다. 이러한 벡터는 본 명세서에서 "발현 벡터(expression vectors)"로 지칭된다. 일반적으로, 재조합 DNA 기술에서 유용성을 갖는 발현 벡터는 종종 플라스미드 형태이다. 용어 "플라스미드" 및 "벡터"는 플라스미드가 가장 일반적으로 사용되는 형태의 벡터이기 때문에 상호교환적으로 사용될 수 있다. 그러나, 본 발명은 코스미드, 바이러스 벡터(예, 복제 결함이 있는 레트로바이러스, 아데노바이러스 및 아데노-관련 바이러스) 및 동등한 기능을 수행하는 파지 벡터와 같은 다른 형태의 발현 벡터를 포함하는 것으로 의도된다.

본 발명에 따른 벡터는 시험관 내에서, 예를 들어 RNA의 생산에 사용될 수 있거나 숙주 세포를 형질감염시키거나 형질변형시키는데 사용될 수 있다.

본 발명의 벡터는 예를 들어, 과발현을 위해 본 발명의 폴리펩티드를 3개, 4개 또는 5개와 같이 2개 이상 포함할 수 있다.

본 발명의 재조합 발현 벡터는 숙주 세포에서 핵산의 발현에 적합한 형태로 본 발명의 핵산을 포함하며, 이는 재조합 발현 벡터가 발현을 위해 사용될 숙주 세포에 기반하여 선택된 하나 이상의 조절 서열을 포함하는 것을 의미하며, 상기 조절 서열은 발현될 핵산 서열에 작동가능하게 연결된다. 코딩 서열에 "작동가능하게 연결된(operably linked)" 프로모터, 인핸서 또는 다른 발현 조절 신호와 같은 조절 서열은 코딩 서열의 발현이, 예를 들어, 전사가 프로모터에서 시작하여 상기 폴리펩티드를 코딩하는 DNA 서열을 통해 진행하는 것과 같이, 이들의 의도된 목적에 맞추어 이들이 기능하도록 배치된 조절 서열 또는 상기 서열과 양립가능한 조건하에서 달성되는 식으로 배치된다. 용어 "조절 서열(regulatory sequence 또는 control sequence)"은 프로모터, 인핸서 및 기타 발현 조절 요소(예, 폴리아데닐화 시그널)를 포함하는 것으로 의도된다. 이러한 조절 서열은 예를 들어 Goeddel; Gene Expression Technology : Methods in Enzymology 185, Academic Press, San Diego, CA (1990)에 기술되어 있다. 용어 조절(regulatory 또는 control) 서열은 많은 타입의 숙주 세포에서 뉴클레오티드 서열의 구성적 발현을 지시하는 서열 및 특정 숙주 세포에서만 뉴클레오티드 서열의 발현을 지시하는 서열(예를 들어, 조직 특이적 조절 서열)을 포함한다.

따라서, 주어진 숙주 세포에 대한 벡터 또는 발현 구조물은 제 1 발명의 폴리펩티드를 코딩하는 서열의 코딩 스트랜드와 관련하여 5'-말단에서 3'-말단으로 순차적으로 서로 작동가능하게 연결된 다음의 엘리먼트들을 포함할 수 있다: (1) 주어진 숙주 세포에서 폴리펩티드를 코딩하는 뉴클레오티드 서열의 전사를 지시할 수 있는 프로모터 서열; (2) 진핵 코작(Kozak) 컨센서스 서열 또는 원핵 리보솜 결합 부위/샤인-달가노(Shine-Dalgarno) 서열과 같은 번역 개시 서열, (3) 선택적으로, 주어진 숙주 세포로부터 배양 배지로 폴리펩티드의 분비를 지시할 수 있는 신호 서열; (4) 본 발명의 폴리펩티드의 성숙 및 바람직하게는 활성 형태를 코딩하는 본 발명의 DNA 서열; 및 바람직하게는 또한 (5) 상기 폴리펩티드를 코딩하는 뉴클레오티드 서열의 하류에서 전사를 종결시킬 수 있는 전사 종결 영역(종결자).

본 발명에 따른 뉴클레오티드 서열의 하류에는 하나 이상의 전사 종결 부위(예: 종결자)를 함유하는 3' 비번역 영역이 있을 수 있다. 종결자의 오리진은 그다지 중요하지 않다. 예를 들어, 종결자는 폴리펩티드를 코딩하는 DNA 서열에 고유한 것일 수 있다. 그러나, 바람직하게는 효모 종결자가 효모 숙주 세포에 사용되며, 사상균류 종결자는 사상균류 숙주 세포에 사용된다. 보다 바람직하게, 종결자는 숙주 세포(폴리펩티드를 코딩하는 뉴클레오티드 서열이 발현됨)에 내인성이다. 전사된 영역에는 번역을 위한 리보솜 결합 부위가 있을 수 있다. 구조물에 의해 발현된 성숙 전사물의 코딩 부분은 처음에 AUG를 개시하는 번역 및 번역될 폴리펩티드의 말단에 적절히 위치하는 종결 코돈을 포함할 것이다.

본 발명의 폴리뉴클레오티드의 증진된 발현은 또한, 예를 들어, 발현 숙주로부터 관심 단백질의 발현 및, 원하는 경우에 상기 발현 숙주로부터 관심 단백질의 분비 수준을 증가시키기 위해 그리고/또는 본 발명의 폴리펩티드의 발현의 유도가능한 조절을 제공하기 위해 프로모터, 분비 리더 및/또는 종결자 영역과 같은 이종 조절 영역의 선택에 의해 달성될 수 있다.

발현 벡터의 디자인은 형질전환될 숙주 세포의 선택, 목적하는 단백질의 발현 수준 등과 같은 인자에 좌우될 수 있음이 당업자에 의해 인식될 것이다. 본 발명의 발현 벡터와 같은 벡터는 숙주 세포 내로 도입되어 이에 의해 본 명세서에 기재된 바와 같은 핵산에 의해 코딩되는 단백질 또는 펩티드(예, 본 발명의 HMFCA 디하이드로게나아제 또는 운반체, 이의 돌연변이 형태, 프래그먼트, 변이체 또는 이의 기능적 등가물, 융합 단백질 등)를 생산할 수 있다.

상기 개시된 바와 같이, 용어 "조절 서열(regulatory sequence 또는 control sequence)"은 적어도 폴리펩티드의 발현에 필요하고 그리고/또는 유리할 수 있는 어느 성분을 포함하는 것으로 정의된다. 어느 조절 서열은 폴리펩티드를 코딩하는 본 발명의 핵산 서열에 대해 고유한 것이거나 또는 이질적인 것일 수 있다. 이러한 조절 서열은 이에 한정하는 것은 아니나, 프로모터, 리더, 최적 번역 개시 서열(Kozak, 1991, J. Biol. Chem. 266: 19867-19870에 기재된 바와 같음) 또는 원핵 샤인-델가노 서열, 분비 신호 서열, 프로-펩티드 서열, 폴리아데닐화 서열, 전사 종결자를 포함할 수 있다. 최소한, 조절 서열은 전형적으로 프로모터 및 번역 개시 및 정지 신호를 포함한다.

안정적으로 형질전환된 미생물은 도입된 분자가 성장하는 배양물에서 유지되고, 복제되고, 분리되도록 하나 이상의 DNA 프래그먼트가 도입된 것이다. 안정한 형질전환은 다중 또는 단일 염색체 통합(들) 또는 (a) 플라스미드 벡터(들)와 같은 염색체외 엘리먼트에 의한 것일 수 있다. 플라스미드 벡터는 특정 DNA 단편에 의해 코딩된 폴리펩티드의 발현을 지시할 수 있다.

발현은 구성적이거나 또는 특정 폴리펩티드를 코딩하는 기능적으로 연관된 DNA 프래그먼트의 높은 수준의 전사를 가능하게 하는 유도성 (또는 억제성) 프로모터에 의해 조절될 수 있다.

본 발명의 폴리펩티드의 발현을 위해 사용된 정확한 메카니즘에 관계없이, 이러한 발현은 당해 분야에 공지된 방법에 의해 이들 폴리펩티드를 코딩하는 유전자를 다른 숙주 세포에 도입함으로써 전달될 수 있는 것으로 고려된다. 본 명세서에서 정의된 유전적 엘리먼트는 관련 폴리펩티드를 발현하거나 발현을 조절하는 단백질, 특히 효소, 아포단백질 또는 안티센스 RNA와 같은 산물에 대한 발현 가능한 코딩 서열을 갖는 핵산(일반적으로 DNA 또는 RNA)을 포함한다. 발현된 단백질은 효소로서 기능할 수 있고, 효소 활성을 억제 또는 디리프레스(derepress)할 수 있거나 또는 효소의 발현을 조절할 수 있거나 또는 예를 들어, 대사물과 같은 화합물의 운반체로서 기능할 수 있다. 이러한 발현가능한 서열을 코딩하는 재조합 DNA는 염색체(예를 들어, 상동성 재조합에 의해 숙주 세포 염색체에 통합됨) 또는 염색체외(예를 들어, 하나 이상의 플라스미드, 코스미드 및 자가 복제가능한 다른 벡터에 의해 운반됨)일 수 있다. 본 발명에 따라 숙주 세포를 형질전환하는데 이용되는 재조합 DNA는 구조 유전자 및 전사 인자 이외에, 단백질, 아포단백질 또는 안티센스 RNA에 대한 코딩 서열의 발현 또는 디리프레션을 조절하도록 작용하는 프로모터, 리프레서 및 인핸서를 포함하는 발현 조절 서열을 포함할 수 있다. 예를 들어, 이러한 조절 서열은 숙주 세포 게놈에서 이미 코딩된 선택된 폴리펩티드의 과발현을 촉진시키기 위해 와일드 타입 숙주 세포 내로 삽입되거나, 또는 염색체 외로 코딩된 폴리펩티드의 합성을 조절하는데 사용될 수 있다.

재조합 DNA는 이에 한정하는 것은 아니나, 플라스미드, 코스미드, 파지, 효모 인공 염색체 또는 유전 엘리먼트의 숙주 세포 내로의 전달을 매개하는 다른 벡터를 포함하는 어느 수단에 의해 숙주 세포 내로 도입될 수 있다. 이들 벡터는 벡터의 복제 및 벡터에 의해 운반되는 유전 엘리먼트를 조절하는 cis-작용 조절 엘리먼트와 함께 복제의 오리진을 포함할 수 있다. 유전 엘리먼트가 도입된 숙주 세포의 확인을 돕기 위해 선별가능한 마커가 벡터 상에 존재할 수 있다.

숙주 세포 내로 유전 엘리먼트를 도입하기 위한 수단(예, 클로닝)은 당업자에게 잘 알려져 있다. 본 발명에 따라 유전 엘리먼트를 삽입하기 위해 염색체 외 다중 복사 플라스미드 벡터를 이용할 수 있다. 숙주 세포 내로의 유전 엘리먼트의 플라스미스로 운반되는 도입(plasmid-borne introduction)은 제한 효소를 이용한 플라스미드 벡터의 초기 클리빙(cleaving), 이어서 본 발명에 따라 표적화된 효소 종을 코딩하는 플라스미드 및 유전 엘리먼트의 라이게이션을 포함한다. 라이게이션된 재조합 플라스미드의 재순환시, 플라스미드를 숙주 세포 내로 운반하기 위해 감염(예를 들어, 파지 람다에서의 패키징) 또는 플라스미드 운반을 위한 다른 메커니즘(예를 들어, 일렉트로포레이션, 마이크로인젝션 등)이 이용된다. 유전 엘리먼트를 숙주 세포 내로 삽입하기에 적합한 플라스미드는 당업자에게 잘 알려져 있다.

다른 유전자 클로닝 방법으로는 이에 한정하는 것은 아니나, 염색체 내로 유전 물질의 직접 통합을 포함한다. 이것은 숙주 염색체의 상동성 DNA 서열이 측면에 위치하는 비-복제 플라스미드에서 본 명세서에 기술된 유전 엘리먼트를 클로닝하는 것을 포함하는 다양한 수단에 의해 일어날 수 있으며; 상기 재조합 플라스미드를 숙주 내로 형질전환시킬 때, 유전 엘리먼트는 DNA 재조합에 의해 염색체 내로 도입될 수 있다. 그러한 재조합 균주는 통합 DNA 프래그먼트가 항생제 내성과 같은 선별 마커를 함유하는 경우에 회수될 수 있다. 대안적으로, 유전 요소는 복제되지 않는 플라스미드를 사용하지 않고 숙주 세포의 염색체 내로 직접 도입될 수 있다. 이는 숙주 염색체의 상동성 DNA 서열을 또한 함유하는 본 발명에 따른 유전 엘리먼트의 DNA 프래그먼트를 합성적으로 생산함으로써 수행될 수 있다. 이러한 합성 DNA 단편이 또한 선별 마커를 함유하는 경우에, 유전 엘리먼트는 숙주 염색체 내로 삽입될 수 있다.

본 발명은 또한 본 발명의 HMFCA 디하이드로게나아제 활성을 갖는 폴리펩티드 및/또는 본 발명의 푸라닉 화합물 운반 역량을 갖는 폴리펩티드를 제조하는 방법에 관한 것으로, 이 방법은 상기 폴리펩티드의 발현에 도움이 되는 조건하에서 본 발명에 따른 세포를 배양하는 것, 및 선택적으로 발현된 폴리펩티드를 회수하는 것을 포함하며, 뿐만 아니라 이러한 방법에 의해 수득가능한 폴리펩티드에 관한 것이다.

푸라닉 화합물의 산화 방법

추가적인 견지로, 본 발명은 푸라닉 화합물을 산화시키는 방법에 관한 것이다. 특히, 본 발명은 FDCA의 푸라닉 전구체가 산화되는 방법에 관한 것이다. 본 발명의 방법은 생성물을 생성시키는 단일 산화 반응 단계를 포함할 수 있다(예를 들어, HMFCA를 FFA로 산화시킴). 대안적으로, 본 발명의 방법은 하나 이상의 산화 반응 단계를 포함할 수 있으며, 각 단계는 최종 중간체가 최종 생성물인 중간체를 생성한다. HMF가 순차적 산화 단계에서 FDCA로 산화되는 이러한 일련의 단계의 예는 다음과 같다: 1) HMF가 먼저 HMFCA로 산화되고, 이는 제 2 단계에서 FFA로 산화되고, 이어서 FDCA로 최종 산화되거나, 택일적으로, Dijkman et al.(2014, Angew. Chem. 53(2014) 6515-8)에 기술된 바와 같이, 2) HMF는 먼저 DFF로 산화되고, 제 2 단계에서 FFA로 산화되고, 그 다음 마지막으로 FDCA로 산화된다. 따라서, 본 발명의 바람직한 방법에서, FDCA의 하나 이상의 푸라닉 전구체는 일련의 단계에서 궁극적으로 FDCA로 산화된다.

일 구현으로, 본 발명은 적어도 HMFCA의 FFA로의 산화를 포함하는 방법에 관한 것이다. 바람직하게, 상기 방법은 HMFCA를 FFA로 산화시키는 방법으로서, 여기서 상기 방법은 HMFCA 존재하에 세포를 배양하는 단계를 포함하며, 상기 세포는 본 명세서에서 상기 정의된 바와 같은 HMFCA 디하이드로게나아제를 발현하는 세포이거나, 또는 푸라닉 화합물 운반 역량을 가지며, 또한 본 명세서에 정의된 바와 같은 HMFCA 디하이드로게나아제 또는 옥시다아제 활성을 포함하는 폴리펩티드를 발현하는 세포이다. 바람직하게, 상기 세포는 예를 들어 하기에 명시한 바와 같이, 상기 세포에 의해 HMFCA의 산화에 도움이 되는 조건하에, HMFCA의 존재하에서 배양된다.

또 다른 구현으로, 본 발명은 FDCA를 생산하는 방법에 관한 것이다. FDCA를 생산하는 방법은 바람직하게 FDCA의 하나 이상의 푸라닉 전구체를 포함하는 배지에서 세포를 배양하는 단계를 포함하며, 여기서 상기 세포는 본 명세서에서 상기 정의된 바와 같은 HMFCA 디하이드로게나아제를 발현하는 세포이거나, 또는 푸라닉 화합물 운반 역량을 가지며, 또한 본 명세서에서 상기 정의된 바와 같은 HMFCA 디히드록시게나아제 또는 옥시다아제 활성을 포함하는 폴리펩티드를 발현하는 세포이다. 바람직하게, 상기 세포는 예를 들어 하기에 명시한 바와 같이, 상기 세포에 의해 HMFCA의 산화에 도움이 되는 조건하에, HMFCA의 존재하에서 배양된다.

바람직하게는, 상기 공정에서, FDCA의 적어도 하나의 푸라닉 전구체는 HMF, DHF, HMFCA, FFA 및 DFF로 이루어진 그룹으로부터 선택되며, 그 중 HMF가 가장 바람직하다. FDCA의 푸라닉 전구체는 바람직하게 하나 이상의 헥소스 당으로부터, 바람직하게는 산-촉매 탈수, 예를 들면, 산의 존재하에 통상적인 방식으로 가열함으로써 얻어진다. 프룩토오스로부터 HMF를 생성하는 기술은 잘 확립되고 견고하다(van Putten et al., 2013, Chem.Rev.113, 1499-1597 참조). 또한, 글루코오스가 풍부한 공급 원료를 사용할 수 있지만, HMF의 열 화학적 형성은 프룩토오스로부터 보다 효율적으로 진행된다. 따라서, 글루코오스 이소머라아제를 사용하여 글루코오스를 프룩토오스로 전환시키는 추가적인 효소 단계가 포함될 수 있다. 후자의 방법은 예를 들어, 가수분해 전분으로부터 고 프룩토오스 옥수수 시럽(HFCS)을 생산하기 위한 것과 같은 식품 산업에서 잘 정립되어있다. 글루코오스는 또한 예를 들어, van Putten et al. (2013, 상기 참조)에 기술된 바와 같이 촉매 및 용매의 조합을 사용하여 프룩토오스로 화학적으로 이성화될 수 있다.

헥소스 당은 일반적으로 바이오매스로부터 얻어진다. "바이오매스(biomass)"라는 용어는 농산물(농작물 잔류물과 같은 식물성 물질 및 동물성 물질을 포함), 임업(목재 자원과 같은) 및 어업 및 양식업을 포함하는 관련 산업의 생물학적 오리진의 산물, 폐기물 및 잔류물의 생물학적 분획뿐만 아니라 도시의 고형 폐기물 또는 폐지와 같은 산업 및 도시 폐기물의 생분해성 분획을 의미한다. 바람직한 구현으로, 바이오매스는 식물 바이오매스, 보다 바람직하게 (발효성) 헥소스/글루코오스/당-풍부 바이오매스, 예를 들어, 사탕 수수, 전분-함유 바이 매스, 예를 들면, 밀 곡물 또는 옥수수 짚, 또는 옥수수, 밀, 보리 또는 이들의 혼합물과 같은 시리얼 곡물일 수 있다. 자연스럽게 푸룩탄이 풍부한 농작물(예, 토피낭부(topinambur) 또는 치커리 뿌리)이 바람직하다.

헥소스 당은 이러한 바이오 매스의 가수분해에 의해 수득될 수 있다. 바이오매스의 가수분해 방법은 당업계에 공지되어 있고 예를 들어, 수증기 및/또는 글루코아밀라아제와 같은 카르보하이드라아제의 사용을 포함한다.

본 발명의 방법에 사용하기 위한 또 다른 바람직한 타입의 바이오매스는 소위 "제 2 세대" 리그노셀룰로오스 공급 원료이며, 이는 보다 많은 양의 FDCA가 보다 지속가능한 방식으로 제조되어야하는 경우에 바람직하다. 리그노셀룰로오스 공급 원료는 예를 들어, 한계지(marginal lands)에서 자라 식량 작물과 직접 경쟁하지 않는 전용 에너지 작물에서 얻을 수 있다. 또는, 리그노셀룰로오스 공급 원료는 예를 들어, 도시 고형 폐기물, 폐지, 목재 잔류물(제재소 및 제지 공정 폐기물 포함)과 같은 부산물로서 수득될 수 있으며, 농작물 잔류물이 고려될 수 있다. 농작물 잔류물의 예로는 사탕 수수에서 추출한 바가스(bagasse) 및 여러 옥수수와 밀가루를 포함한다. 옥수수 부산물의 경우, 세 가지 폐기물은 섬유, 구근 및 여물이다. 또한, 임업 바이오매스가 공급 원료로 사용될 수 있다. 2 세대 공급 원료를 본 발명의 발효 산물로 전환시키기 위해서는, 셀룰로오스 및 헤미셀룰로오스를 모노사카 라이드로서 방출할 필요가 있다. 여기서는 열 화학적 접근법(일반적으로 전처리라고 함), 효소 접근법 또는 두 가지 방법론의 조합이 적용된다. 전처리는 당을 완전히 유리시키거나 폴리머 화합물을 이후의 효소 공격에보다 보다 접근가능하도록 한다. 다른 타입의 전처리는 액체 온수, 증기 폭발, 산 전처리, 알칼리 전처리 및 이온성 액체 전처리를 포함한다. 다양한 화합물의 상대적인 양은 사용된 원료 및 사용된 전처리 모두에 의존할 것이다. 그러한 리그노셀룰로오스 공급 원료로부터 모노사카라이드 당의 방출을 위해, 적절한 카보하이드라아제가 사용되며, 예를 들어, 아라비나아제, 크실라나아제, 글루카나아제, 아밀라아제, 셀룰라아제, 글루카나아제 등을 포함한다.

본 발명의 방법은 바람직하게 FDCA 또는 HMFCA와 같이 상기 방법에서 생성된 산화 생성물(들)의 회수 단계를 더 포함한다. 바람직하게, 산화 생성물은 산화 단계를 수행하는 세포가 배양되는 배지로부터 회수된다. FDCA, FDVIFCA 등과 같은 산화 생성물은 반응 혼합물 또는 매질로부터 예를 들어, (산 또는 염) 침전, 후속 냉각 결정화 및 결정화된 산화 생성물, 예컨대 결정화된 FDCA의 분리에 의해 회수될 수 있다. 그러나, 예를 들어, 당해 기술분야에 알려진 산 또는 염 침전 및 용매 추출과 같은 다른 회수 방법이 적합하다. FDCA의 회수를 위한 염 침전은 예를 들어, Mg²⁺와 같은 2가 (금속) 양이온을 사용하여 수행될 수 있다.

산화 반응은 바람직하게 세포에 가장 적합한 온도에서 수행되고, 함유된 산화 환원 효소는 세포이다. 따라서, 고온성 세포 및 효소의 경우, 온도는 바람직하게 예를 들면, 50, 55, 60 또는 65℃ 초과와 같은 예를 들면, 45-122℃ 범위와 같이, 45℃ 이상이다. 그러나, 중온균(mesophiles)의 효소를 함유하는 중온성 세포의 경우, 산화 반응은 바람직하게 비교적 온화한 온도, 예를 들어, 10-80℃, 보다 바람직하게 20-45℃, 가장 바람직하게는 25-40℃에서 수행된다.

산화 반응은 바람직하게 FDCA가 중성 형태 또는 완전히 해리된 형태 중 어느 하나인 pH에서 수행되어 염 형성이 조절될 수 있다. FDCA에 2개의 산부(acid moieties)가 존재한다는 관점에서, 2개의 별도의 바람직한 pH 범위가 있다. 반응 중 pH는 pH 1 내지 6, 바람직하게는 pH 1 내지 4, 가장 바람직하게는 pH 1 내지 3일 수 있다. 대안적으로, 반응 동안의 pH는 pH 5 내지 9, 바람직하게는 pH 5 내지 8, 가장 바람직하게는 pH 5 내지 7이다. 숙련자는 숙주 세포의 요건이 또한 상기 방법에 적절한 pH 값의 선택에도 영향을 미친다는 것을 이해할 것이다. 특정 숙주 세포에 적합한 pH 값의 선택은 숙련자의 범위 내에 있으며, 표준 텍스트 북으로부터 도출될 수 있다. 예를 들어, 슈도모나스 푸티다(Pseudomonas putida) S12 또는 KT2440 균주를 포함하는 슈도모나스 푸티다(Pseudomonas putida)의 경우, 바람직한 pH 범위는 pH 5 내지 7이다.

반응 시간은 6 내지 150시간, 보다 바람직하게 6 내지 18 시간이다. 바람직하게, 산소는 예를 들어, 순수 산소로서 또는 공기 중의 분자 산소, 또는 물과 같은 산소 공급원, 또는 푸라닉 산화 효소의 요건에 따라 달라지는 다른 산소 공급원으로부터 반응 매질 내의 세포로 공급된다. 공기는 분자 산소의 공급원으로 편리하게 사용될 수 있다.

반응기는 어느 적합한 (폭기된) 바이오리액터일 수 있다. 이는 배치(batch)로, 연속적으로 또는 바람직하게는 페드-배치(fed-batch)로 작동될 수 있다.

푸라닉 화합물을 산화시키는 본 발명의 방법은, 예를 들어, 바이오 연료 및 생화학 물질의 생산을 위한 발효용 공급 원료와 같이, 푸라닉 화합물이 유해한 것으로 여겨지는 공급 원료로부터 푸라닉 화합물의 제거에 유리하게 적용될 수 있다. 보다 바람직하게, 푸라닉 화합물을 산화시키는 방법은 폴리에스테르(플라스틱)의 제조를 위한 모노머 전구체로서 FDCA의 바이오프로덕션(생물 생성)에 적용되며, 여기서 FDCA는 폴리에스테르 PET에서 PTA를 대신할 수 있으며, 이 경우에 바이오베이즈드(biobased) 폴리에틸렌푸란디카르복실레이트(PEF)를 생성시킬 수 있다. FDCA는 또한 다양한 유익한 화합물에 대한 기질로서 사용될 수 있는데, 예를 들면. 숙신산, 2,5-비스(아미노메틸)-테트라히드로푸란, 2,5-디히드록시메틸-테트라히드로푸란, 2,5-디히드록시메틸푸란 및 2,5-푸란디카르브알데히드의 제조를 위한 기질로서 사용된다. FDCA는 알키드 수지 및 열가소성 코팅에서와 같은 코팅의 제조에 사용될 수 있다. 또한, 이는 바이오 연료에서 자일렌 등가물로서 및 용제로서 사용될 수 있다. FDCA는 이의 디올로 전환될 수 있으며, 이는 PET-유사(PET-like) 폴리에스테르 및 폴리우레탄에 사용될 수 있다. 또한, FDCA는 이의 디아민으로 전환될 수 있고, 디아민은 사슬 연장제로서 사용될 수 있고, 디아민은 폴리우레탄의 제조에 사용될 수 있는 디-이소시아네이트로 전환될 수 있다.

따라서, 추가의 견지로, 본 발명은 하나 이상의 FDCA 모노머로부터 폴리머를 제조하는 방법에 관한 것으로서, 상기 방법은 a) 상술한 바와 같은 본 발명의 산화 방법에서 FDCA 모노머를 제조하는 단계; 및 b) a)에서 얻어진 FDCA 모노머로부터 폴리머를 제조하는 단계를 포함한다. 바람직하게 상기 폴리머는 폴리에틸렌푸란디카르복실레이트(PEF)이다.

또 다른 견지로, 본 발명은 본 발명의 세포를 하나 이상의 푸라닉 전구체의 FDCA에서 FDCA로의 바이오트랜스포메이션을 위해 사용하는 용도에 관한 것으로, 상기 세포는 본 명세서에서 상기 정의된 바와 같은 HMFCA 디하이드로게나아제를 발현하는 세포이거나, 또는 푸라닉 화합물 운반 역량을 가지며 또한 본 명세서에서 상기 정의된 바와 같은 HMFCA 디하이드로게나아제 또는 옥시다아제 활성을 포함하는 폴리펩티드를 발현하는 세포이다. 바람직하게, FDCA로 바이오트랜스포메이션된 FDCA의 적어도 하나의 푸라닉 전구체는 HMF, DHF, HMFCA, FFA 및 DFF로 구성되는 그룹으로부터 선택되며, 그 중 HMF가 가장 바람직하다.

HMFCA 디하이드로게나아제를 코딩하는 HMFCA 디하이드로게나아제 폴리펩티드 및 핵산

본 발명의 다른 견지로, 본 발명은 HMFCA 디하이드로게나아제 활성을 갖는 폴리펩티드에 관한 것이다. HMFCA 디하이드로게나아제 활성을 갖는 폴리펩티드는 SEQ ID NO: 1(아에리바실러스 팔리더스(Aeribacillus pallidus))의 아미노산 서열과 적어도 81.65, 81.7, 81.8, 81.85, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 95, 96, 97, 98, 99 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하거나 또는 이로 구성되나, 그 외에는 본 명세서에서 상기 정의된 바와 같다. 바람직하게, 상기 폴리펩티드는 분리된 폴리펩티드이다.

본 발명은 또한 다음 중 적어도 하나를 포함하는 핵산 분자에 관한 것이다:

a) HMFCA 디하이드로게나아제 활성을 갖는 폴리펩티드를 코딩하는 뉴클레오티드 서열로서, 상기 폴리펩티드는 SEQ ID NO: 1의 아미노산 서열과 적어도 81.65, 81.7, 81.8, 81.85, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 95, 96, 97, 98, 99 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하거나 또는 이로 구성되는, 뉴클레오티드 서열;

b) SEQ ID NO: 12 또는 13에 나타낸 뉴클레오티드 서열;

c) 길이가 10, 15, 20, 30, 50 또는 100 뉴클레오티드인 (a) 또는 (b)에 정의된 바와 같은 뉴클레오티드 서열의 프래그먼트;

d) 유전 암호의 축퇴(degeneracy)에 기인하여 b) 또는 c)의 뉴클레오티드 서열의 서열과 상이한 뉴클레오티드 서열; 및

e) a) 내지 d)에서 정의된 뉴클레오티드 서열의 리버스 컴플리먼트인 뉴클레오티드 서열.

본 발명의 또 다른 견지는 본 절의 상기 a) 내지 e)에서 정의된 바와 같은 뉴클레오티드 서열을 포함하는 클로닝 및 발현 벡터를 포함하는 벡터에 관한 것이며, 상기 벡터는 본 명세서에서 상기 정의된 바와 같다.

또 다른 견지로, 본 발명은 i) 본 절에서 상기 정의된 바와 같은 HMFCA 디하이드로게나아제 활성을 갖는 폴리펩티드 및 ii) 본 절에서 상기 정의된 바와 같은 핵산 분자 중 적어도 하나를 포함하는 세포에 관한 것이다. 바람직하게, 상기 세포는 본 절에서 상기 a) 내지 e)에서 정의된 바와 같은 뉴클레오티드 서열, 또는 이러한 뉴클레오티드 서열을 포함하는 벡터를 포함하거나 이로 형질변형된 세포이다. 상기 세포는 바람직하게 분리된 세포 또는 배양된 세포이고, 그렇지 않으면 상기 세포는 바람직하게 본 명세서에서 상기 정의된 바와 같고, 바람직하게 상기 세포는 상기 정의된 유전적 변형 중 하나 이상을 포함한다. 상기 세포는 상술한 바와 같은 어느 방법, 공정 및 용도에 적용될 수 있다.

푸라닉 화합물 운반체 폴리펩티드 및 이러한 운반체 폴리펩티드를 코딩하는 핵산

또 다른 견지로, 본 발명은 푸라닉 화합물 운반 역량을 갖는 폴리펩티드에 관한 것이다. 상기 폴리펩티드는 바람직하게 HMFCA를 상기 세포 내로 운반하는 역량을 갖는다. 바람직하게 상기 폴리펩티드는 SEQ ID NO: 17(아에리바실러스 팔리더스(Aeribacillus pallidus))의 아미노산 서열과 적어도 86.5, 87, 88, 89, 90, 91, 92, 93, 94, 95, 95, 96, 97, 98, 99 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하거나 또는 이로 구성되나, 그 외에는 본 명세서에서 상기 정의된 바와 같다. 바람직하게, 상기 폴리펩티드는 분리된 폴리펩티드이다.

a) 적어도 HMFCA를 상기 세포 내로 운반하는 능력을 갖는 폴리펩티드를 코딩하는 뉴클레오티드 서열로서, 상기 폴리펩티드는 SEQ ID NO: 17의 아미노산 서열과 적어도 86.5, 87, 88, 89, 90, 91, 92, 93, 94, 95, 95, 96, 97, 98, 99 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하거나 또는 이로 구성되는, 뉴클레오티드 서열;

b) SEQ ID NO: 18에 나타낸 뉴클레오티드 서열;

또 다른 견지로, 본 발명은 i) 본 절에서 상기 정의된 바와 같은 푸라닉 화합물 운반 역량을 갖는 폴리펩티드 및 ii) 본 절에서 상기 정의된 바와 같은 핵산 분자 중 적어도 하나를 포함하는 세포에 관한 것이다. 바람직하게, 상기 세포는 본 절에서 상기 a) 내지 e)에서 정의된 바와 같은 뉴클레오티드 서열, 또는 이러한 뉴클레오티드 서열을 포함하는 벡터를 포함하거나 이로 형질변형된 세포이다. 상기 세포는 바람직하게 분리된 세포 또는 배양된 세포이고, 그렇지 않으면 상기 세포는 바람직하게 본 명세서에서 상기 정의된 바와 같고, 바람직하게 상기 세포는 상기 정의된 유전적 변형 중 하나 이상을 포함한다. 상기 세포는 상술한 바와 같은 어느 방법, 공정 및 용도에 적용될 수 있다.

본 문서와 이의 청구범위에서, 동사 "~을 포함한다"라는 동사는 그 단어 뒤에 오는 항목이 포함되지만 특별히 언급되지 않은 항목은 제외되지 않는다는 것을 의미하는 비-제한적 의미로 사용된다. 또한, 부정관사 "a" 또는 "an"(하나의)에 의한 하나의 요소에 대한 언급은 문맥상 하나의 요소만이 명백하게 요구되는 경우를 제외하고는, 하나 이상의 요소가 존재할 가능성을 배제하지 않는다. 따라서, 부정관사 "a"또는 "an"(하나의)은 일반적으로 "적어도 하나(at least one)"를 의미한다.

본 명세서에 인용된 모든 특허 및 문헌은 그 전체가 본 명세서에 참고문헌으로 편입된다.

하기 실시예는 본 발명을 예시하기 위한 것일 뿐, 본 발명의 범위가 이들로 한정되는 것은 아니다.

실시예

일반적인 방법

균주 및 플라스미드

슈도모나스 푸티다(Pseudomonas putida) S12Agcd 또는 P. 푸티다(각각, P. putida) KT2440Agcd(P. 푸티다(P. putida) S12(ATCC 700801), P. 푸티다(P. putida) KT2440(DSM6125)의 글루코오스-디하이드로게나아제 결핍 돌연변이) 또는 와일드 타입 P. 푸티다(P. putida) S12를 아에리바실러스 팔리더스(Aeribacillus pallidus) 균주 CA1828의 yiaY 유전자 발현을 위한 숙주로서 사용하였다(하기 참조). 에쉐리키아 콜라이(Escherichia coli) TG90 균주는 일반적인 클로닝목적으로 사용되었다.

A. 팔리더스(A. pallidus) 유전자의 에피솜(episomal) 발현을 위해 pBBR1MCS 유래 pBT'mcs(Koopman et al., 2010a, Biores Technol 101: 6291-6196)를 사용하였다. pBT'mcs에서, 표적 유전자의 발현은 구성적 tac 프로모터로부터 유도된다.

배지 및 배양 조건

중온성 균(Mesophile) 미네랄 염 배지(MMM)는 다음과 같은 것을 함유하였다(탈이온수 1리터당): 명시된 바와 같은 탄소 공급원이 보충된 K₂HPO₄ 15.52g, NaH₂PO₄ 6.52g, (NH₄)₂SO₄ 2.0g, MgCl₂·6H₂O 0.1g, EDTA 10mg, CaCl₂·2H₂O 1mg, FeSO₄·7H₂O 5mg, Na₂Mo₄·2H₂O 0.2mg, CuSO₄·5H₂O 0.2mg, CoCl₂·6H₂O 0.4mg 및 MnCl₂ㆍ2H₂0 1mg.

호열성 균 미네랄 염 배지(TMM)는 다음과 같은 것을 함유하였다(탈이온수 1리터당): 10g의 Bis-Tris, 10μM FeSO₄·7H₂O, 4mM 트리신, 1.32 mM K₂HPO₄, 9.53 mM NH₄Cl, 0.2g 효모 추출물, 5g의 NaCl, 1.47g의 Na₂SO₄, 0.08g의 NaHCO₃, 0.25g의 KCl, 1.87g의 MgCl₂·6H₂O, 0.41g의 CaCl₂·2H₂O, 0.008g의 SrCl₂·6H₂O, 0.008g의 H₃BO₃, 0.90g의 NaNO₃ 및 비타민 용액(티아민, 0.1g/L; 리보플라빈 0.1g/L; 니코틴산 0.5g/L, 판토텐산 0.1g/L; 피리독사민-HCl 0.5g/L, 피리독살-HCl, 0.5g/L, D-바이오틴, 0.1g/L; 엽산, 0.1g/L, p-아미노벤조산, 0.1g/L; 코발라민, 0.1g/L). 탄소 공급원은 명시된 바와 같이 보충되었다.

중온성 균의 증식을 위한 완전한 배지로서, Luria-Bertani(LB) 브로스를 사용하였다: 10g/l Bacto trypton(Difco), 5g/l 효모 추출물(Difco), 10g/l NaCl. 플레이트 배양을 위해 LB를 1.5%(w/v) 한천(Difco)으로 응고시켰다. pBT'mcs로부터 유래된 플라스미드를 보유하는 E. 콜라이(E. coli), P. putida(P. putida) S12 또는 P. putida(P. putida) KT2440 형질전환체의 선별을 위해, 50㎍/ml의 카나마이신(Km)을 배지에 첨가하였다. 항생제는 Sigma-Aldrich에서 구입하였다. P. putida(P. putida)를 30℃에서 배양하고; E. 콜라이(E. coli)를 37℃에서 배양하였다.

호열성 균의 증식을 위한 완전 배지로서, TGP 브로스를 사용하였다: 17g/L 트립톤, 3g/L 소이(soy) 펩톤, 5g/L NaCl, 2.5g/L K₂HPO₄, 4g/L 글리세롤 및 4g/L Na-피루베이트(pH 7). 플레이트 배양을 위해 TGP를 1.5%(w/v) 한천(Difco)으로 응고시켰다. 아에리바실러스 팔리더스(Aeribacillus pallidus)를 60℃에서 배양하였다.

어세이 및 분석 방법

세포 건중량 ( CDW ) 측정:

박테리아 배양물의 CDW 함량은 플랫-바텀 96-웰 마이크로 플레이트(Greiner)를 사용하여 Biowave Cell Density Meter(WPA Ltd) 또는 μQuant MQX200 유니버셜 마이크로 플레이트 스펙트로포토미터(Biotek)를 사용하여 600nm(OD 600)에서 광학 밀도를 측정함으로써 검출되었다. 1.0의 OD₆₀₀은 P. putida(P. putida)에 대해 0.56g CDW/L(Biowave) 또는 1.4g CDW/L(μQuant)에 해당한다.

푸란 화합물(FDCA, HMF, HMF-알코올, HMFCA 및 FFA)은 Koopman et al.(2010a, Biores Technol 101: 6291-6196)에 의해 기술된 바와 같이 RP-HPLC에 의해 분석되었다.

화학물질

5-히드록시메틸푸르푸랄(HMF)은 Eurolabs Ltd(Poynton, UK)에서 구입하였다. FDCA 및 5-히드록시메틸-푸로산(HMFCA)의 분석 표준은 각각 Immunosource B.V.(Halle-Zoersel, Belgium), Matrix Scientific(Columbia SC, USA)에서 구입하였다. 다른 모든 화학 물질은 Sigma-Aldrich Chemie B.V.(Zwijndrecht, The Netherlands)에서 구입하였다.

분자 및 유전학 기술:

게놈 DNA는 A. 팔리더스(A. Pallidus) CA1828로부터 MasterPure™ Gram Positive DNA Purification Kit(Epicenter)를 사용하여 분리 하였다. 플라스미드 DNA는 JETSTAR Maxi Plasmid Purification Kit(GENOMED, ITK diagnostics)로 분리하였다. 아가로오스-트랩된 DNA 프래그먼트를 DNA Clean & Concentrator™(Zymo research)로 분리하였다. PCR 반응은 Phusion Flash PCR Master Mix(Thermo Scientific)를 사용하여 제조자의 지시에 따라 수행하였다. 올리고뉴클레오티드 프라이머(실시예에 명시됨)는 Sigma-Aldrich에 의해 합성되었다. Gene Pulser 일렉트로포레이션 장치(BioRad)를 사용하여 일렉트로컴피턴트 세포 내로 플라스미드 DNA를 도입하였다. 다른 표준 분자 생물학 기술은 Sambrook and Russell(2001, supra)에 따라 수행되었다.

실시예 I: HMF 대사 아에리바실러스 팔리더스 ( Aeribacillus pallidus ) 균주의 분리

컴포스트(15g)를 0.9%(w/v) NaCl 용액 15ml와 혼합하고 750rpm 및 80℃에서 40분간 배양하였다. 생성된 컴포스트 슬러리를 60℃ 및 180rpm에서 3일 동안 쉐이크 플라스크에서 0.65g/L HMF로 보충된 TMM에서 배양하였다. 배양물을 일정한 간격으로 신선한 TMM-HMF에 옮기고, 고체 TMM-HMF 상에 플레이팅하였다. 단일 콜로니는 TMM-HMF 및 TGP 플레이트 상에서 리-스트리킹되고, HMF 및 FDCA를 대사하는 능력에 대해 재평가되었다. HMF와 FDCA 모두를 대사한 두 분리 균주(CA1809 및 CA1828 주)는 16S rDNA 시퀀싱에 의해 아에리바실러스 팔리더스(Aeribacillus pallidus)로 확인되었고, 추가 연구를 위해 선택되었다.

실시예 II : HMF 분해 A. 팔리더스( A. pallidus )에서 새로운 디하이드로게나아제 - 촉매화 HMF 이화( catabolic ) 경로의 확인

A. 팔리더스(A. pallidus) 균주 CA1809 및 CA1828의 게놈은 PacBio 시퀀싱을 통해 시퀀싱되고, 자동화된 ORF 콜링 및 주석(annotation)이 수행되었다. 주석된 게놈에서, 푸로산 분해 클러스터를 구성하는 쿠프리아비더스 바실렌시스(Cupriavidus basilensis) HMF14의 hmfABCDE 유전자의 동족체가 확인되었다(Koopman et al., 2010, Proc Nat Acad Sci USA 107: 4919-4924).

HMF에 부가적으로 FDCA를 대사시키는 CA1809 및 CA1828 균주의 능력을 고려하면, C. 바실렌시스(C. basilensis) HMF14에서와 같이 HMF가 FDCA를 통해 대사된다는 것을 강력하게 제시하였다. 그러나, 예상외로 HMF에서 FDCA를 거쳐 푸로익 산으로의 분해 경로를 구성하는 C. 바실렌시스(C. basilensis) HMF14의 hmfFGH 클러스터의 동족체는 발견되지 않았다. 이 결과는 HMF의 FDCA로의 산화를 위한 대안적인 경로, 그리고 후속적인 푸로익 산으로의 디카르복실화산으로의 대안적인 경로가 A. 팔리더스(A. pallidus) 분리 균주에 존재함을 제시하였다. 산화 및 디카르복실화 활성 모두를 코딩하는 유전자를 포함하는 유전자 클러스터에 대한 게놈을 채취하는 것은 알코올 디하이드로게나아제, 알데히드 디하이드로게나아제 및 두 디카르복실라아제(표 1 A 및 B)를 코딩하는 유전자들을 포함하는 추정 HMF 분해 클러스터의 확인을 이끈다. 이와 함께, 이러한 유전자는 C. 바실렌시스(C. basilensis) HMF14에서와 같이 히드로시메틸푸로익 산(HMFCA)을 통한 HMF의 FDCA로의 산화를 위한 추정 경로를 코딩하지만, 옥시다아제 활성보다는 HMFA의 포르밀푸로익 산(FFA)으로의 산화를 위한 알코올 디하이드로게나아제 활성을 포함한다.

실시예 III : P. 푸티다( P. putida )에서 A. 팔리더스( A. pallidus )로부터 YiaY의 발현은 HMF 를 FDCA 로 산화시키는 능력을 부여한다.

yiaY 유전자를 B. 코아굴란스(B. coagulans) DSM1의 PldhL1 프로모터 영역을 포함하는 1988-bp 합성 XbaI-SalI 프래그먼트(SEQ ID NO: 15)로서 pBT'mcs에서 클로닝하여 플라스미드 pKW007을 얻었다. 플라스미드 pKW007을 P. 푸티다(P. putida) KT2440Δgcd(CA1877)에 도입하여 P. 푸티다(P. putida) CA2101을 수득하였다. pBT'mcs(균주 CA2046)를 갖는 P. 푸티다(P. putida) KT2440Δgcd를 빈 벡터 컨트롤로서 시험하였다.

P. 푸티다(P. putida) 균주 CA2101 및 CA2046을 10㎖의 MM + 80mM 글리세롤 및 50㎎/L 카나마이신이 보충된 2mM 글루코오스를 함유하는 100㎖ 쉐이크 플라스크에서 성장시켰다. 로그 단계(OD600

4)의 끝에서 세포들을 수거하고, 19.4 g/L K₂HPO₄, 8.15 g/L NaH₂PO₄, 80mM 글리세롤 및 50 mg/L 카나마이신이 보충된 MM에서 세척하고 재현탁시켰다. 세척된 세포 현탁액(1-2의 OD600에서)의 분취량(10㎖)을 100㎖ 삼각 플라스크 내의 HMF와 함께 배양하고, FDCA 분석을 위해 일정한 간격으로 샘플을 채취하였다. 도 1a는 빈 벡터 컨트롤에서 HMF가 히드록시메틸푸로닉 산(FDVIFCA)으로 빠르게 산화되지만, FDCA 형성은 완전히 없는 것을 보여준다. YiaY가 발현되면(도 1b), 축적된 FDVIFCA는 FDCA로 천천히 산화되었으며, 이는 HMFCA- 산화 디하이드로게나아제로서의 YiaY의 기능을 입증하였다.

실시예 IV : A. 팔리더스( A. pallidus )로부터 YiaY 및 C. 바실렌시스( C. basilensis ) HMF14 로부터 Aldh 와 HmfT1 의 동시 발현을 통한 HMF 의 FDCA 로의 최적화된 산화

리보솜 결합 부위 TAGGAAAGGAAGATTAACCC(SEQ ID NO: 21)를 포함하는 A. 팔리더스(A. pallidus) CA1828의 yiaY 유전자를 합성하였다. yiaY 프래그먼트(서열 16)를 KpnI 및 XbaI로 절단하여 pBT'hmfH-adh(WO2012064195)의 hmfH 유전자를 대체하여 플라스미드 pKW010을 수득하였다. 플라스미드 pKW010을 P. putida CA2111을 생성하는 pJNNhmfT1(t)(WO2012064195)-보유하는 P. putida S12Δgcd 내로 도입하고, 그리고 P. putida CA2112를 생성하는 P. putida KT2440Δgcd(또한 pJNNhmfT1(t)를 보유함)에 도입하였다. 따라서, yiaY에 의해 코딩된 HMFCA 산화 알코올 디하이드로게나아제는 C. basilensis HMF14의 HMF 디하이드로게나아제 및 HMFCA 운반체와 함께 공동 발현되어 HMFCA 및 HMFCA 흡수로의 HMF 산화의 병목 현상을 제거할 수 있다.

P. putida CA2111 및 CA2112를 10㎖의 MM + 80mM 글리세롤 및 50㎎/L 카나마이신, 30㎎/L 젠타마이신 및 100μM의 살리실산이 보충된 2mM 글루코오스를 함유하는 100㎖ 쉐이크 플라스크에서 성장시켰다. 세포를 대수 단계(OD600

4)의 끝에서 수거하고, MM 50mg/L 카나마이신, 30mg/L 젠타마이신 및 10μM의 살리실산에 세척하고 재현탁시켰다. 세척된 세포 현탁액(1-2의 OD600에서)의 분취량(10㎖)을 100㎖ 삼각 플라스크에서 HMF와 함께 배양하고, FDCA 분석을 위해 일정한 간격으로 샘플을 채취하였다. 도 2와 3은 HMF가 HMFCA로 빠르게 산화되고, 이는 FDCA로 더욱 산화되었음을 보여준다. YiaY와 Aldh 및 HmfT1의 동시 발현이 HMF의 FDCA로의 산화를 상당히 촉진한다는 것이 명백하다.

실시예 V: C. 바실렌시스 ( C. basilensis ) HMF14 로부터 중온성 HMFCA 알코올 디하이드로게나아제 및 Aldh 및 HmfT1 의 동시 발현을 통한 HMF 의 FDCA 로의 산화를 위해 최적화된 균주의 구축

클로닝을 위한 제한 효소(KpnI, resp., NheI; XbaI와 호환 가능)에 대한 인식 부위(SEQ ID NO.'s: 19, 36, 38 및 39)뿐만 아니라 스페이서 TAGGAAAGGAAGATTAACCC(SEQ ID NO: 21)를 함유하는 리보좀 결합 부위를 포함하는 바실러스 크리벤시스(Bacillus kribbensis) DSM17871, 브레비바실러스 테르모러버(Brevibacillus thermoruber) 423, 바실러스 종(Bacillus sp.) FJAT-14578, 및 바실러스 종(Bacillus sp.) L1 (2012)의 yiaY 동족체를 합성하였다.

클로닝을위한 제한 효소(KpnI, resp., XbaI)에 대한 인식 부위(SEQ ID NO.'s: 35 및 37)뿐만 아니라 스페이서 GAATTCCACATGACAAGGGGAGACCGC(SEQ ID NO: 40)를 함유하는 리보솜 결합 부위를 포함하는 아네우리니바실러스 테라노벤시스(Aneurinibacillus terranovensis) DSM18919 및 브레비바실러스 파나시후미(Brevibacillus panacihumi) W25의 yiaY 동족체를 합성하였다. B. 크리벤시스(B. kribbensis) 효소(SEQ ID NO: 19), B. 테르모러버(B. thermoruber) 효소(SEQ ID NO: 36) 및 바실러스 종(Bacillus sp.) 효소들 모두(SEQ ID NO: 38 및 39)에 대한 코딩 뉴클레오티드 서열은 http://www.kazusa.or.jp/codon/.의 P. 푸티다(P. putida) 코돈 사용 표를 사용하여 아미노산 서열의 역번역((http://www.bioinformatics.org/sms2/rev_trans.html)을 통해 수득하였다. A. 테라노바(A. terranova) 및 B. 파나시후미(B. panacihumi) 효소에 대한 코딩 뉴클레오티드 서열은 GeneArt의 E. 콜라이(E. coli) 서열 최적화 툴(https://www.thermofisher.com/nl/en/home/life-science/cloning/gene-synthesis/geneart-gene-synthesis/geneoptimizer.html)을 사용하여 아미노산 서열의 역번역을 통해 수득하였다.

B. 크리벤시스(B. kribbensis), B. 테르모러버(B. thermoruber), 바실러스 종(Bacillus sp .) FJAT-14578, 및 바실러스 종(Bacillus sp .) L1(2012)의 yiaY-동족체 프래그먼트들을 KpnI 및 NheI(pBT'hmfH-adh에서 XbaI와 호환가능)로 절단하여 pBT'hmfH-adh(WO2012064195)에서 hmfH 유전자를 대체하여 플라스미드 pKW2210, pKW2212, pKW2214 및 pKW2215를 생성하였다. A. 테라노벤시스(A. terranovensis) 및 B. 파나시후미(B. panacihumi)의 yiaY-동족체 프래그먼트들을 KpnI 및 XbaI로 절단하여 pBT'hmfH-adh(WO2012064195)에서 hmfH 유전자를 대체하여 플라스미드 pKW2211 및 pKW2213을 생성하였다.

P. 푸티다(P. putida) KT2440Agcd_pJNNhmfT1(CA1965) 내로 플라스미드 pKW2210, pKW2211, pKW2211, pKW2211, pKW2212, pKW2221, pKW2214 및 pKW2215를 도입하여, aldh와 hmfT1을 포함하는 최적화된 숙주 백그라운드에서 각각 YiaY 동족체의 발현을 위해 P. 푸티다(P. putida) CA21780, CA21781, CA21782, CA21783, CA21784 및 CA21785를 수득하였다. 성능 평가를 위해, P. 푸티다(P. putida) 균주 CA21780, CA21781, CA21782, CA21783, CA21784 및 CA21785를 50㎎/L의 카나마이신, 30mg/L의 젠타마이신 및 100μM의 살리실산이 보충된 10ml의 MM+80mM 글리세롤 및 2mM 글루코오스를 함유하는 100-ml 쉐이크 플라스크에서 성장시켰다. 세포들을 대수 단계(OD600

4)의 끝에서 수거하고, 세척하고, MM 50㎎/ℓ의 카나마이신, 30㎎/L 젠타마이신 및 10μM의 살리실산에 재현탁하였다. 세척된 세포 현탁액(1-2 OD600)의 분취량(10ml)을 100-ml 삼각 플라스크에서 HMF과 함께 배양하고, 샘플들을 FDCA의 분석을 위해 정기적 간격으로 채집하였다. P. 푸티다(P. putida) CA21780, CA21781 및 CA21783에 대한 결과가 각각, 도 4, 도 5 및 도 6에 도시되어있다. 3가지 형질전환 균주 모두 HMF로부터 FDCA를 생산하였다. 그러나 상이한 균주들은 HMFCA의 일시적인 축적 및 HMF의 디히드록시메틸 푸란(HMF-OH 또는 DHF)으로의 부분적 산화에 현저한 차이를 나타내었다. 균주 P. 푸티다(P. putida) P. CA21782, CA21784 및 CA21785도 HMF로부터 FDCA를 생산하는 것으로 발견되었으며, 이는 HMFCA 산화 효소로서 6개의 모든 알코올 디하이드로게나아제들의 기능을 입증하는 것이다.

실시예 VI : HMFCA 운반체를 코딩하는 아에리바실러스 팔리더스( Aeribacillus pallidus) proP 를 발현하는 P. 푸티다 ( P. putida ) 균주의 구축

프라이머 proP(f)(gccgaattcATGAAGAATATCGCTAATACG; SEQ ID NO: 22) 및 proP(r)(gccgctagcTTATTTGAGGTTTCCTTTTGTTTCC; SEQ ID NO: 23)를 사용하여 PCR에 의해 아에리바실러스 팔리더스(Aeribacillus pallidus) CA1828의 게놈 DNA로부터 proP 유전자(SEQ ID NO: 18)를 증폭하였다. PCR 산물을 pJNNmcs(t)에서 1350-bp EcoRI-NheI 프래그먼트(SEQ ID NO: 20)으로서 도입하여 pJNNproP(t)를 얻었다. 플라스미드 pBT'hmfH_aldh 및 pJNNproP(t)를 P. 푸티다(P. putida) KT2440Δgcd(CA1877) 내로 연속적으로 도입하여 P. 푸티다(P. putida) CA21783을 수득하였다. P. 푸티다(P. putida) CA21783은 50㎎/L의 카나마이신, 30mg/L의 젠타마이신 및 100μM의 살리실산이 보충된 10ml의 MM+80mM 글리세롤 및 2mM 글루코오스를 함유하는 100-ml 쉐이크 플라스크에서 배양하였다. 세포들을 대수 단계(OD600

4)의 끝에서 수거하고, 세척하고, MM 50㎎/ℓ의 카나마이신, 30㎎/L 젠타마이신 및 10μM의 살리실산에 재현탁하였다. 세척된 세포 현탁액(1-2 OD600)의 분취량(10ml)을 100-ml 삼각 플라스크에서 HMF과 함께 배양하고, 샘플들을 FDCA의 분석을 위해 정기적 간격으로 채집하였다. proP-코딩된 HMFCA 운반체의 발현은 proP를 발현하지 않는 이에 상응하는 컨트롤 균주와 비교하여 HMF의 FDCA로의 산화를 상당히 촉진한다는 것이 명백하다.

Adh_Bp = SEQ ID NO: 6(Brevibacillus panacihumi); Adh_Bk = SEQ ID NO: 2(Bacillus kribbensis); Adh_Bt = SEQ ID NO: 5(Brevibacillus thermoruber); Adh_At = SEQ ID NO: 4(Aneurinibacillus terranovensis); YiaY = SEQ ID NO: 1(Aeribacillus pallidus); Adh_Gk = SEQ ID NO: 3(Geobacillus kaustophilus); Adh_Bsp = SEQ ID NO: 7(Bacillus sp . FJAT-14578); Adh_BspL1 = 서열 번호 10(Bacillus sp . L1(2012)); Adh_Pt = SEQ ID NO: 11(Pelotomaculum thermopropionicum); Adh_Dk = SEQ ID NO: 8(Desulfotomaculum kuznetsovii); 및 Adh_Dt = SEQ ID NO: 9(Desulfurispora thermophila). 정렬 아래의 기호는 다음을 나타낸다. * = 불변 위치; : = 강하게 보존된 위치; . = 덜 강하게 보존된 위치; 아무 기호도 없는 것은 비-보존 위치를 나타내었다.

정렬 아래의 기호는 다음을 나타낸다: * = 불변 위치; : = 강하게 보존된 위치; . = 덜 강하게 보존된 위치; 아무 기호도 없는 것은 비-보존 위치를 나타내었다.

SEQUENCE LISTING <110> Purac Biochem B.V. <120> Dehydrogenase-catalysed production of FDCA <130> P6054479PCT <150> EP15155401 <151> 2015-02-17 <160> 40 <170> PatentIn version 3.3 <210> 1 <211> 392 <212> PRT <213> Aeribacillus pallidus <400> 1 Met Ile Gly Asn Tyr Ala Lys Lys Ala Ile Asp Phe Glu Phe Thr Phe 1 5 10 15 Tyr Leu Pro Thr Leu Ile Glu Phe Gly Tyr Gly Lys Ala Ser Arg Met 20 25 30 Gly Glu Met Leu Glu Gln Met Gly Ile Lys Asn Val Phe Leu Val Thr 35 40 45 Asp Lys Gly Val Glu Ala Ala Gly Leu Leu Ala Gly Ile Val Gln Ser 50 55 60 Leu Glu Ser Ser Asn Ile Arg Tyr Val Ile Tyr Ser Asp Val Glu Pro 65 70 75 80 Asp Pro Ser Leu Glu Thr Ile Asp Arg Gly Ala Ser Val Phe Lys Glu 85 90 95 Gln Ser Phe Asp Cys Ile Leu Ala Val Gly Gly Gly Ser Pro Ile Asp 100 105 110 Thr Ala Lys Gly Ile Arg Val Val Val Thr Asn Gly Gly Asn Ile Gly 115 120 125 Asp Tyr Ala Gly Val Asn Arg Val Ala Lys Lys Ser Glu Ile Pro Leu 130 135 140 Val Ala Val Pro Thr Thr Ser Gly Thr Gly Ser Glu Val Thr Ile Phe 145 150 155 160 Gly Val Tyr Ser Asp Trp Glu Asn Gln Val Lys Val Thr Val Thr Ser 165 170 175 Pro Tyr Met Ala Pro Glu Ile Ala Leu Val Asp Pro Glu Leu Thr Met 180 185 190 Ser Leu Pro Gln Lys Met Thr Ala Ala Ser Gly Ile Asp Ala Leu Ala 195 200 205 His Gly Ile Glu Thr Phe Phe Ser Leu Arg Ser Arg Pro Ala Ser Asp 210 215 220 Ala Leu Ala Val Glu Ala Met Ala Thr Val Ser Ala Tyr Leu Arg Arg 225 230 235 240 Ala Val Glu Asp Gly Thr Asp Lys Glu Ala Arg Ile Gly Met Ser Gln 245 250 255 Gly Ser Leu Leu Ala Gly Met Ala Phe Asn Asn Gly Phe Leu Gly Leu 260 265 270 Ala His Ala Ile Gly Ser Ala Leu Ser Gly His Cys His Val Ser His 275 280 285 Gly Val Ala Ile Gly Leu Leu Leu Pro Lys Val Val Glu Phe Asn Ala 290 295 300 Arg Val Arg Pro Glu Lys Ala Ala Lys Ile Ala Glu Leu Leu Gly Val 305 310 315 320 Lys Gly Asp Arg Glu Glu Val Leu Ala Glu Gln Ala Ala Pro Ala Val 325 330 335 Ala Ser Leu Val Lys Glu Ile Gly Leu Pro Thr Arg Leu Arg Asp Val 340 345 350 Asp Val Ser Glu Glu Lys Leu Pro Asp Ile Ala Arg Asp Ala Phe Lys 355 360 365 Ser Gly Met Met Lys Phe Asn Pro Arg Gln Pro Ser Leu Ser Glu Val 370 375 380 Leu Thr Leu Leu Gln Gln Ile Tyr 385 390 <210> 2 <211> 383 <212> PRT <213> Bacillus kribbensis <400> 2 Met Asp Val Glu Phe Ser Phe His Leu Pro Thr Leu Ile Glu Phe Gly 1 5 10 15 Phe Gly Lys Ala Ser Leu Leu Gly Glu Arg Leu Leu Lys Leu Gly Val 20 25 30 Gly Asn Val Phe Leu Val Ser Asp Lys Gly Val Ala Ser Ala Gly Leu 35 40 45 Leu Gln Lys Leu Glu Gln Ser Leu Gln Thr Ser Asp Ile His Phe Lys 50 55 60 Thr Tyr Leu Glu Val Glu Pro Asp Pro Ser Leu Glu Thr Ile Asp Leu 65 70 75 80 Gly Ala Glu Ala Phe Asn Ser Gly Lys Tyr Asp Cys Ile Val Ala Val 85 90 95 Gly Gly Gly Ser Ala Ile Asp Thr Ala Lys Gly Ile Arg Val Val Ala 100 105 110 Gly Asn Gly Gly Ser Ile Gly Asp Phe Ala Gly Val Asp Lys Ile Gly 115 120 125 Lys Ala Pro Gln Ile Pro Leu Ile Ala Val Pro Thr Thr Ser Gly Thr 130 135 140 Gly Ser Glu Val Thr Ile Phe Gly Val Tyr Ser Asp Trp Val Lys Asn 145 150 155 160 Val Lys Val Thr Val Thr Ser Gln Tyr Met Ala Pro Thr Ile Ala Leu 165 170 175 Val Asp Pro Glu Leu Thr Met Arg Leu Pro Arg Lys Met Thr Ala Ala 180 185 190 Ser Gly Ile Asp Ala Leu Ala His Gly Ile Glu Ser Tyr Phe Ser Leu 195 200 205 Arg Ser Thr Ser Ala Ser Arg Ala Leu Ser Leu Glu Ala Ile Asn Ile 210 215 220 Val Gly Asn His Leu Arg Gln Ser Val Ala Asn Gly Glu Asp Lys Glu 225 230 235 240 Ala Arg Cys Gly Met Ser His Gly Ser Leu Leu Ala Gly Met Ala Phe 245 250 255 Asn Asn Gly Phe Leu Gly Leu Ala His Ala Ile Gly Ser Ala Leu Ser 260 265 270 Gly His Cys His Val Pro His Gly Val Ala Ile Gly Leu Leu Leu Pro 275 280 285 His Val Val Glu Phe Asn Ser Ser Glu Cys Pro Asp Gln Ala Ala Glu 290 295 300 Ile Ala Lys Ile Leu Gly Val Lys Ala Glu Asp Glu Arg Gln Leu Ala 305 310 315 320 Glu Gln Ala Ser His Ala Val Gly Asp Leu Val Lys Asp Ile Gly Leu 325 330 335 Pro Thr Arg Leu Arg Asp Met Asn Val Pro Glu Glu Lys Leu Ala Asp 340 345 350 Ile Ala Arg Asp Ser Phe Gln Ser Gly Met Met Lys Phe Asn Pro Arg 355 360 365 Arg Ala Ser Glu Ser Glu Val Leu Glu Leu Leu His Arg Val Tyr 370 375 380 <210> 3 <211> 391 <212> PRT <213> Geobacillus kaustophilus <400> 3 Met Val Gly His Tyr Ile Gln Lys Glu Val Glu Phe Glu Phe Ser Phe 1 5 10 15 His Leu Pro Thr Ser Ile Gln Phe Gly Tyr Gly Lys Ala Ser Gln Leu 20 25 30 Gly Asn Gln Leu Val Asp Met Gly Ile Lys Ser Ala Phe Leu Val Thr 35 40 45 Asp Arg Gly Val Glu Ala Thr Gly Leu Leu Ala Gly Ile Ile Gln Ser 50 55 60 Leu Glu Ser Ser Asn Ile Gln Tyr Cys Val Tyr Ala Asp Val Glu Pro 65 70 75 80 Asp Pro Ser Leu Glu Thr Ile Asp Gln Gly Ala Ala Ala Phe Lys Glu 85 90 95 Gln Pro Phe Asp Cys Ile Val Ala Ile Gly Gly Gly Ser Pro Ile Asp 100 105 110 Thr Ala Lys Gly Ile Arg Val Val Ala Thr Asn Gly Gly Ser Ile Gly 115 120 125 Asp Tyr Ala Gly Val Asn Arg Ile Lys Lys Lys Ser Glu Ile Pro Leu 130 135 140 Ile Ala Leu Pro Thr Thr Ser Gly Thr Gly Ser Glu Val Thr Ile Phe 145 150 155 160 Gly Val Tyr Ser Asp Trp Lys Asn Asn Val Lys Val Thr Val Thr Ser 165 170 175 Pro Tyr Met Ala Pro Glu Ile Ala Leu Val Asp Pro Lys Leu Thr Met 180 185 190 Ser Leu Pro Lys Lys Ile Thr Ala Ala Ser Gly Ile Asp Ala Leu Ala 195 200 205 His Gly Ile Glu Thr Phe Phe Ser Leu Arg Ser Gln Pro Ile Ser Asp 210 215 220 Val Leu Ala Ile Glu Ala Met Thr Thr Val Asn Arg Tyr Leu Arg Arg 225 230 235 240 Ala Val Glu Asp Gly Thr Asn Lys Glu Ala Arg Ile Gly Met Ser Tyr 245 250 255 Gly Ser Leu Leu Ala Gly Met Ala Phe Asn Asn Gly Phe Leu Gly Leu 260 265 270 Ala His Ala Ile Gly Ser Ala Leu Ser Gly His Cys His Val Ser His 275 280 285 Gly Val Ala Ile Gly Leu Leu Leu Pro Lys Val Val Glu Phe Asn Ser 290 295 300 Val Val Gln Pro Glu Lys Ala Ala Lys Ile Ala Glu Leu Leu Gly Arg 305 310 315 320 Lys Gly Asn Gln Asn Thr Leu Val Gln Gln Ala Ala Leu Ala Val Ala 325 330 335 Ser Leu Val Lys Glu Ile Gly Leu Pro Thr Arg Leu Arg Asp Val Asp 340 345 350 Val Pro Lys Glu Lys Leu Pro Asp Ile Ala Lys Asp Ser Phe Lys Ser 355 360 365 Gly Met Met Arg Phe Asn Pro Arg Gln Pro Ser Glu Ala Glu Val Met 370 375 380 Thr Leu Leu Gln Gln Ile Tyr 385 390 <210> 4 <211> 390 <212> PRT <213> Aneurinibacillus terranovensis <400> 4 Met Ser Pro Ala Val Lys Ala Ile Asn Phe Glu Phe Ser Phe Asn Leu 1 5 10 15 Pro Thr Leu Ile Glu Phe Gly Tyr Gly Lys Met Glu Lys Phe Gly Gln 20 25 30 Gln Leu Ile Ser Ile Gly Val Lys Arg Ile Phe Met Val Thr Asp Lys 35 40 45 Gly Val Glu Ser Ala Gly Leu Leu Ala Ala Leu Thr Asp Ser Leu Gln 50 55 60 Ala Ala Ala Ile Gln Phe Asp Ile Tyr Thr Asp Val Glu Ser Asp Pro 65 70 75 80 Ser Leu Glu Thr Ile Asp Arg Gly Val Glu Val Phe Gln Gln Lys Pro 85 90 95 Tyr Asp Cys Ile Val Ala Val Gly Gly Gly Ser Pro Ile Asp Thr Ala 100 105 110 Lys Gly Ile Arg Val Val Ala Ala Asn Gly Gly Asn Ile Gly His Tyr 115 120 125 Ala Gly Val Asn Gln Ile Pro Val Ala Pro Thr Ile Pro Leu Leu Ala 130 135 140 Ile Pro Thr Thr Ser Gly Thr Gly Ser Glu Val Thr Asn Phe Gly Val 145 150 155 160 Tyr Ser Asp Trp Gln Asn Asn Val Lys Val Thr Val Thr Ser Gln Tyr 165 170 175 Met Ala Pro Thr Ile Ala Trp Val Asp Pro Ala Leu Thr Met Ser Leu 180 185 190 Pro Ala Lys Met Thr Ala Ala Ser Gly Ile Asp Ala Leu Ala His Gly 195 200 205 Ile Glu Thr Phe Phe Ser Leu Gly Ser Ser Pro Ala Ser Asp Ala Leu 210 215 220 Ala Ile Glu Ala Ile His Thr Val Asn Arg Tyr Leu Ser Arg Ala Val 225 230 235 240 His Asn Gly Ser Asp Met Glu Ala Arg Ile Gly Met Ser His Gly Ser 245 250 255 Leu Leu Ala Gly Met Ala Phe Asn Asn Gly Phe Leu Gly Leu Ala His 260 265 270 Ala Ile Gly Ser Ala Leu Ser Gly His Cys His Val Pro His Gly Val 275 280 285 Ala Ile Gly Leu Leu Leu Pro Lys Val Val Glu Phe Asn Ala Thr Val 290 295 300 Arg Pro Asp Lys Ala Ala Lys Ile Ala Gly Leu Met Gly Met Lys Gly 305 310 315 320 Glu His Ser Glu Glu Leu Ala Leu Gln Ala Ser Pro Ala Val Ala Arg 325 330 335 Leu Val Glu Asp Ile Gly Leu Pro Thr Arg Leu Arg Glu Val Asp Val 340 345 350 Thr Glu Lys Lys Leu Phe Glu Ile Ala Lys Asp Ser Phe Lys Ser Gly 355 360 365 Met Met Lys Phe Asn Pro Arg Gln Pro Ser Glu Ser Glu Val Leu Gln 370 375 380 Leu Leu Lys Glu Ile Phe 385 390 <210> 5 <211> 390 <212> PRT <213> Brevibacillus thermoruber <400> 5 Met Ser Gln Thr Val Gln Gly Thr Asp Phe Ala Phe Ser Phe His Leu 1 5 10 15 Pro Thr Leu Ile Glu Phe Gly Tyr Gly Arg Ala Ser Arg Leu Gly Glu 20 25 30 Arg Leu Gln His Leu Gly Val Thr Asn Val Phe Val Val Thr Asp Lys 35 40 45 Gly Val Glu Ala Ala Gly Leu Leu Asn Gly Leu Val Gly Ser Leu Gln 50 55 60 Ser Ala Gly Ile Ala Phe Asp Leu Tyr Thr Glu Val Glu Pro Asp Pro 65 70 75 80 Gly Leu Glu Thr Ile Asp Arg Gly Ala Ala Val Phe Arg Ala Lys Pro 85 90 95 Tyr Asp Cys Leu Val Ala Val Gly Gly Gly Ser Pro Ile Asp Ala Ala 100 105 110 Lys Gly Met Arg Val Val Thr Ser Cys Gly Gly Ser Ile Ala Asp Tyr 115 120 125 Ala Gly Val Asn Arg Val Pro Met Ala Pro Ala Val Pro Leu Val Ala 130 135 140 Val Pro Thr Thr Ser Gly Thr Gly Ser Glu Val Thr Met Phe Gly Val 145 150 155 160 Tyr Ser Asp Trp His Asn His Val Lys Val Thr Val Thr Ser Pro His 165 170 175 Met Ala Pro Thr Ile Ala Leu Val Asp Pro Ala Leu Thr Val Ser Leu 180 185 190 Pro Ala Lys Met Thr Ala Ala Ser Gly Ile Asp Ala Leu Ala His Gly 195 200 205 Ile Glu Thr Phe Phe Ser Val Arg Ser Arg Pro Ala Ser Asp Ala Leu 210 215 220 Ala Met Glu Ala Ile Ala Ala Val Asn Ala His Leu Arg Arg Ala Val 225 230 235 240 His Asp Gly Ser Asp Val Glu Ala Arg Ile Gly Met Ser His Gly Ser 245 250 255 Leu Leu Ala Gly Met Ala Phe Thr Asn Gly Phe Leu Gly Leu Ala His 260 265 270 Ala Ile Gly Ser Ala Leu Ser Gly His Cys His Val Pro His Gly Ile 275 280 285 Ala Ile Gly Leu Leu Leu Pro His Val Val Ala Phe Asn Ala Pro Ala 290 295 300 Arg Pro Asp Lys Ala Ala Gln Leu Ala Arg Leu Leu Gly Val Glu Ala 305 310 315 320 Asn Pro Arg Glu Glu Arg Gly Glu Glu Thr Ser Ala Ala Val Ala Arg 325 330 335 Met Val Ala Asp Ile Gly Leu Pro Thr Arg Leu Arg Asp Val Gly Val 340 345 350 Pro Glu Glu Lys Leu Pro Ala Ile Ala Lys Asp Ala Phe Lys Ser Gly 355 360 365 Met Met Thr Cys Asn Pro Arg Gln Pro Thr Glu Gln Glu Val Arg Glu 370 375 380 Leu Leu Arg Arg Ala Phe 385 390 <210> 6 <211> 379 <212> PRT <213> Brevibacillus panacihumi <400> 6 Met Glu Ser Pro Phe Ser Phe His Leu Pro Thr Asn Val Gln Phe Gly 1 5 10 15 Val Gly Ser Ala Ser Arg Leu Gly Glu Met Leu Leu Ser Met Gly Val 20 25 30 Arg Arg Val Phe Leu Val Thr Asp Gln Gly Val Arg Gln Ala Gly Leu 35 40 45 Leu Asp Glu Val Ile His Ser Leu Glu Glu Lys Gly Leu His Phe Gln 50 55 60 Ile Tyr Ala Asp Val Glu Pro Asp Pro Ser Leu Glu Thr Ile Gln Ala 65 70 75 80 Gly Ala Ala Met Phe Gln Gln Gln Ser Phe Asp Cys Met Val Ala Ile 85 90 95 Gly Gly Gly Ser Pro Ile Asp Thr Ala Lys Gly Ile Arg Val Leu Ala 100 105 110 Ala Asn Gly Gly Gly Ile Gly Gln Tyr Ala Gly Val Asn Arg Val Pro 115 120 125 Ala Ala Ser Ala Ile Pro Leu Ile Ala Ile Pro Thr Thr Ser Gly Thr 130 135 140 Gly Ser Glu Val Thr Ile Phe Gly Val Tyr Ser Asp Trp Glu Asn His 145 150 155 160 Val Lys Ile Thr Val Thr Ser Pro His Met Ala Pro Ser Thr Ala Leu 165 170 175 Ile Asp Pro Ala Leu Thr Leu Ser Leu Pro Ala Lys Met Thr Ala Ala 180 185 190 Thr Gly Ile Asp Ala Leu Ala His Gly Ile Glu Thr Phe Phe Ser Leu 195 200 205 Arg Ser Ser Pro Ala Ser Asp Ala Leu Ala Ile His Ala Met Lys Met 210 215 220 Ile Ala Pro His Leu Arg Arg Ala Val Arg Asp Gly Ala Asp Met Glu 225 230 235 240 Ala Arg Ile Gly Met Ser Gln Gly Ser Val Leu Ala Gly Met Ala Phe 245 250 255 Asn Asn Gly Phe Leu Gly Leu Ala His Ala Ile Gly Ser Ala Leu Ser 260 265 270 Gly His Cys His Val Pro His Gly Val Ala Ile Gly Leu Leu Leu Pro 275 280 285 His Val Val Ala Phe Asn Thr Pro Val Arg Pro Glu Lys Ala Glu Leu 290 295 300 Ile Ala Asp Val Leu Gly Ser Val Gln Lys Glu Thr Gly Thr Ala Ala 305 310 315 320 Glu Leu Val Gly Gln Leu Val Gln Asp Ile Gly Leu Pro Gln Arg Leu 325 330 335 Gln Glu Val Gly Val Pro Glu Ala Lys Leu Val Asp Ile Ala Lys Asp 340 345 350 Ser Phe Lys Ser Gly Met Met Lys Trp Asn Pro Arg Leu Pro Thr Glu 355 360 365 Gln Glu Val Leu Glu Leu Leu Gln Lys Ala Phe 370 375 <210> 7 <211> 383 <212> PRT <213> Bacillus sp. FJAT-14578 <400> 7 Met Tyr Pro Ser Phe Glu Phe His Leu Pro Thr Lys Ile His Phe Gly 1 5 10 15 Tyr Asn Thr Ile Lys Gln Leu Asp His Leu Pro Phe Glu Ile Lys Arg 20 25 30 Ala Phe Ile Val Thr Asp Gln Gly Val Leu Asn Ser Gly Leu Val Glu 35 40 45 Asn Val Thr Asn Ile Leu Lys Asp His Gln Ile Ser Tyr Val Ile Tyr 50 55 60 Ser Glu Val Glu Pro Asp Pro Ser Val Glu Thr Val Asp Lys Ala Ala 65 70 75 80 Gln Met Phe Gln Arg Glu Glu Ala Asp Ala Leu Ile Ala Ile Gly Gly 85 90 95 Gly Ser Pro Ile Asp Thr Ala Lys Gly Val Arg Val Ile Ala Gly Asn 100 105 110 Gly Gly Ser Ile Arg Asp Tyr Ala Gly Val Asn Leu Ile Lys Gln Lys 115 120 125 Ser Asn Ile Pro Leu Ile Ala Ile Pro Thr Thr Ser Gly Thr Gly Ser 130 135 140 Glu Val Thr Ile Phe Ala Val Phe Ser Asp Trp Glu Glu Asn Arg Lys 145 150 155 160 Val Thr Val Thr Ser Pro Phe Leu Ala Pro Asp Ile Ser Ile Val Asp 165 170 175 Pro Lys Met Thr Met Thr Ala Pro Pro Ala Ile Thr Ala Ala Ser Gly 180 185 190 Phe Asp Ala Phe Ala His Gly Ala Glu Thr Phe Val Ser Arg Ala Ser 195 200 205 Gln Pro Ala Ser Asp Val Leu Ala Phe Ser Ala Met Ser Thr Val Ser 210 215 220 Lys Tyr Leu Arg Arg Ala Val Tyr Asn Gly Glu Asp Val Glu Ala Arg 225 230 235 240 Ile Lys Met Ala Glu Ala Ser Leu Leu Ala Gly Met Ala Phe Asn Gln 245 250 255 Ser Tyr Leu Gly Leu Thr His Ala Ile Gly Ser Ala Leu Ser Gly His 260 265 270 Ala His Val Ser His Gly Val Ala Ile Gly Leu Leu Leu Pro Gly Val 275 280 285 Ile Arg Tyr Asn Ser Ile Ser Arg Met Asp Lys His Ile Glu Met Ala 290 295 300 Gly Ala Phe Arg Glu Ile Asp Arg Ser Leu Ser Asp Trp Glu Ile Ile 305 310 315 320 Asp Gln Leu Ile Glu Asp Val Ser Arg Leu Arg Asp Asp Ile Gly Leu 325 330 335 Pro Gln Arg Leu Gln Gln Val Gly Val Lys Glu Asp Gln Leu Lys Met 340 345 350 Ile Ala Ala Asp Ser Val Lys Ser Gly Met Trp Lys Phe Asn Pro Arg 355 360 365 Gln Ala Ser Glu Glu Glu Ile Leu Glu Leu Leu Lys Glu Leu Tyr 370 375 380 <210> 8 <211> 384 <212> PRT <213> Desulfotomaculum kuznetsovii <400> 8 Met Glu Ala Phe Thr Phe Gln Leu Lys Thr Thr Val Cys Phe Gly Ala 1 5 10 15 Asn Val Val Ser Gly Ile Val Asp Trp Cys Arg Asn Tyr Asn Ala Lys 20 25 30 Arg Val Leu Ile Val Thr Asp Gln Gly Val Arg Lys Ala Gly Ile Leu 35 40 45 Glu Lys Val Glu Lys Ile Leu Ser Asp Ala Gly Ile Glu Asn Val Val 50 55 60 Phe Asp Asp Val Glu Pro Asp Pro Gly Leu Glu Thr Ile His Arg Cys 65 70 75 80 Ala Ser Cys Phe Arg Glu Asn Lys Cys Asp Leu Ile Leu Ala Val Gly 85 90 95 Gly Gly Ser Pro Ile Asp Thr Ala Lys Gly Ala Arg Val Ile Val Glu 100 105 110 Asn Gly Gly His Ile Arg Asp Tyr Ala Gly Val Asn Lys Val Pro Arg 115 120 125 Ala Pro Val Thr Pro Leu Ile Ala Ile Pro Thr Thr Ser Gly Thr Gly 130 135 140 Ser Glu Val Thr Thr Phe Ala Val Leu Ser Asp Trp Glu Asn Arg Met 145 150 155 160 Lys Ile Thr Ile Ser Ser Pro Phe Leu Ala Pro Glu Val Ala Val Val 165 170 175 Asp Pro Leu Leu Thr Met Thr Ala Pro Pro Ser Val Thr Ala Ala Ser 180 185 190 Gly Ile Asp Ala Leu Ser His Ala Ile Glu Thr Tyr Val Ser Leu Lys 195 200 205 Ala Gln Pro Pro Ala Glu Ala Leu Ala Leu Lys Ala Ile Glu Leu Ile 210 215 220 Gly Glu Ser Leu Arg Thr Ala Val Ala Asp Gly Ser Asp Lys Glu Ala 225 230 235 240 Arg Thr Arg Met Ser Leu Gly Ser Leu Leu Ala Gly Met Ala Phe Asn 245 250 255 Asn Ser Leu Leu Gly Leu Thr His Ser Ile Gly Ala Ala Leu Ser Gly 260 265 270 His Ala His Val Ser His Gly Met Ala Ile Gly Leu Leu Leu Pro Tyr 275 280 285 Val Met Glu Phe Asn Ala Met Ala Arg Met Glu Lys Phe Ser Lys Ile 290 295 300 Ala Val Ala Leu Gly Glu Asp Val Lys Gly Leu Ser Leu Arg Glu Ala 305 310 315 320 Ala Leu Arg Ser Val Lys Ala Val Arg Glu Leu Val Glu Asp Ile Ser 325 330 335 Leu Pro Arg Arg Leu Gly Asp Val Gly Val Thr Gly Asp Met Ile Glu 340 345 350 Gly Met Ala Lys Asp Ala Met Gly His Gly Met Leu Lys Phe Asn Pro 355 360 365 Arg Ala Val Thr Glu Lys Asp Ile Ile Ala Ile Leu Arg Lys Ala Leu 370 375 380 <210> 9 <211> 377 <212> PRT <213> Desulfurispora thermophila <400> 9 Met Lys Thr Thr Val Cys Phe Gly Ala Asn Ile Val Ser Ser Ile Asp 1 5 10 15 Asp Arg Cys Arg Asp Tyr Asn Ala Arg His Val Leu Ile Val Thr Asp 20 25 30 Gln Gly Val Glu Lys Ala Gly Ile Leu Glu Lys Val Glu Lys Val Leu 35 40 45 Ser Asp Ala Gly Ile Glu Asn Val Val Phe Asp Asp Val Glu Pro Asp 50 55 60 Pro Gly Leu Glu Thr Ile His Arg Cys Ala Ser Cys Phe Arg Glu Asn 65 70 75 80 Lys Cys Asp Leu Phe Leu Ala Ile Gly Gly Gly Ser Pro Ile Asp Thr 85 90 95 Ala Lys Gly Ala Arg Ile Ile Val Asp Asn Gly Gly His Ile Arg Asp 100 105 110 Tyr Ala Gly Val Asn Lys Val Pro Arg Ala Pro Arg Thr Pro Leu Leu 115 120 125 Ala Ile Pro Thr Thr Ser Gly Thr Gly Ser Glu Val Thr Thr Phe Ala 130 135 140 Val Leu Ser Asp Trp Glu Asn Arg Met Lys Ile Thr Ile Ser Ser Pro 145 150 155 160 Phe Leu Ala Pro Glu Val Ala Val Val Asp Pro Ile Leu Thr Leu Thr 165 170 175 Ala Pro Pro Ser Val Thr Ala Ala Ser Gly Ile Asp Ala Leu Ser His 180 185 190 Ala Ile Glu Thr Tyr Val Ser Leu Lys Ala Gln Pro Pro Ala Glu Ala 195 200 205 Leu Ala Leu Lys Ala Ile Glu Leu Ile Gly Glu Ser Leu Arg Ala Ala 210 215 220 Val Ala Asp Gly Ser Asn Lys Glu Ala Arg Thr Lys Met Ser Leu Gly 225 230 235 240 Ser Leu Leu Ala Gly Met Ala Phe Asn Asn Ser Leu Leu Gly Leu Thr 245 250 255 His Ser Ile Gly Ala Ala Leu Ser Gly His Ala His Val Ser His Gly 260 265 270 Met Ala Val Gly Leu Leu Leu Pro Tyr Val Met Glu Phe Asn Ala Met 275 280 285 Ala Arg Leu Glu Lys Tyr Gly Lys Ile Ala Ile Ala Leu Gly Glu Asp 290 295 300 Val Lys Gly Leu Ser Leu Arg Glu Ala Ala Leu Arg Ser Val Lys Ala 305 310 315 320 Val Arg Glu Leu Val Glu Asp Ile Ser Leu Pro Arg Arg Leu Gly Glu 325 330 335 Val Gly Val Thr Gly Asp Met Ile Glu Gly Met Ala Lys Asp Ala Met 340 345 350 Gly His Gly Met Leu Lys Phe Asn Pro Arg Val Val Thr Glu Lys Asp 355 360 365 Ile Met Ala Ile Leu Gln Lys Ala Leu 370 375 <210> 10 <211> 383 <212> PRT <213> Bacillus sp. L1(2012) <400> 10 Met Tyr Thr Ser Phe Asn Phe His Leu Pro Thr Arg Ile Gln Phe Gly 1 5 10 15 Tyr Glu Lys Val Lys Glu Leu Lys Asn Leu Pro Phe Gln Ala Asn Arg 20 25 30 Ala Phe Ile Val Thr Asp Lys Gly Val Glu Lys Ala Gly Leu Leu Asn 35 40 45 Asp Val Ile Asp Ala Ile Lys Gln Ala Asn Met Thr Tyr Lys Ile Tyr 50 55 60 Arg Asp Val Glu Pro Asp Pro Ser Val Glu Thr Val Asp Lys Ala Ala 65 70 75 80 Lys Ala Phe Ala Glu Ala Glu Cys Asp Leu Leu Ile Ala Val Gly Gly 85 90 95 Gly Ser Pro Ile Asp Thr Ala Lys Gly Val Arg Val Val Ala Ser Asn 100 105 110 Gly Gly Ser Ile Arg Asn Tyr Ser Gly Val Asn Leu Val Lys Glu Ala 115 120 125 Pro Ser Val Pro Leu Val Ala Ile Pro Thr Thr Ala Gly Thr Gly Ser 130 135 140 Glu Val Thr Ile Phe Ala Val Phe Ser Asp Asp Lys Glu Asn Arg Lys 145 150 155 160 Val Thr Val Thr Ser Ser His Leu Ser Pro Asp Val Ser Ile Ile Asp 165 170 175 Pro Lys Leu Thr Leu Thr Ala Pro Pro Ser Ile Thr Ala Ala Ala Gly 180 185 190 Phe Asp Ala Phe Ala His Ala Ala Glu Ala Phe Val Ser Arg Ile Ser 195 200 205 Gln Pro Pro Ser Asp Ala Leu Ala Leu Ser Ala Met Lys Thr Val His 210 215 220 Thr Tyr Leu Arg Arg Ala Val Tyr Asn Gly Asp Asp Ile Glu Ala Arg 225 230 235 240 Met Lys Met Ala Glu Ala Ser Leu Leu Ala Gly Met Ala Phe Asn Gln 245 250 255 Ser Tyr Leu Gly Leu Ala His Ala Ile Gly Ser Ala Ile Ser Val His 260 265 270 Ala His Val Ser His Gly Val Val Ile Gly Leu Leu Leu Pro Lys Val 275 280 285 Ile Glu Tyr Asn Leu Val Ala Lys Ile Asp Lys Tyr Ala Glu Ala Gly 290 295 300 Lys Tyr Ile Glu Gln Ser Ser His Gly Leu Ser Asn Tyr Glu Ala Ala 305 310 315 320 Ala Leu Phe Ser Glu Thr Val Thr Gln Leu Arg Asn Asp Ile Gly Leu 325 330 335 Pro Lys Gln Leu Arg Glu Val Asn Val Lys Glu Ala Gln Leu Glu Ala 340 345 350 Ile Ser Lys Asp Ser Ile Lys Ser Gly Met Trp Gln Phe Asn Pro Arg 355 360 365 Arg Ala Ser Glu Gln Asp Val Tyr Gln Met Leu Arg Glu Met Leu 370 375 380 <210> 11 <211> 387 <212> PRT <213> Pelotomaculum thermopropionicum <400> 11 Met Ala Asp Tyr Asn Phe Ser Phe Ala Val Arg Thr Lys Val Phe Phe 1 5 10 15 Gly Arg Gly Val Val Phe Glu Gln Leu Pro Gly Ala Val Arg Glu Met 20 25 30 Gly Cys Lys Lys Ala Val Leu Val Ser Asp Pro Gly Ile Val Gly Thr 35 40 45 Gly Leu Ala Asp Arg Val Lys Asp Leu Leu Ala Gly Gly Gly Val Ala 50 55 60 Val Glu Val Phe Ser Glu Val Glu Pro Asp Pro Gly Leu Glu Thr Val 65 70 75 80 His Lys Ala Ala Ala Phe Leu Gly Arg Thr Arg Pro Asp Cys Leu Val 85 90 95 Ala Leu Gly Gly Gly Ser Ser Ile Asp Val Ala Lys Gly Ala Arg Val 100 105 110 Ile Tyr Asp Asn Gly Gly Lys Ile Ser Asp Tyr Ala Gly Val Asn Lys 115 120 125 Val Lys Val Lys Pro Ser Leu Pro Leu Met Ala Val Pro Thr Thr Ala 130 135 140 Gly Thr Gly Ser Glu Val Thr Val Phe Ala Val Leu Ser Asp Trp Glu 145 150 155 160 Gln Asn Ile Lys Ile Thr Val Thr Ser Glu Tyr Leu Ala Pro Glu Ala 165 170 175 Ala Phe Val Asp Pro Leu Ala Met Val Ser Ala Pro Pro Gly Ile Thr 180 185 190 Ala Ala Ser Gly Ile Asp Ala Leu Ser His Ala Val Glu Ala Tyr Val 195 200 205 Ser Arg Ala Ala Ser Pro Val Ser Asp Asn Leu Ala Leu Gly Ala Val 210 215 220 Glu Leu Ile Gly Gly His Leu Arg Gln Ala Val Ala Asn Gly Gly Asp 225 230 235 240 Leu Ala Ala Arg Thr Gly Ala Ala Leu Gly Ser Leu Leu Ala Gly Met 245 250 255 Ala Phe Asn Asn Ala Phe Leu Gly Leu Thr His Ser Ile Gly Ala Ala 260 265 270 Leu Ser Gly His Val His Val Ser His Gly Val Ala Val Gly Leu Leu 275 280 285 Leu Pro Tyr Val Met Glu Tyr Asn Leu Met Ala Lys Pro Asp Lys Phe 290 295 300 Ala Arg Leu Ala Arg Ala Met Gly Glu Val Thr Glu Gly Lys Ser Leu 305 310 315 320 Tyr Arg Ala Ala Ser Leu Ala Pro Arg Ala Val Lys Ala Met Val Lys 325 330 335 Ser Ile Gly Leu Pro Val Arg Leu Lys Glu Ile Gly Val Pro Glu Gly 340 345 350 Ala Leu Ala Ala Ile Ala Glu Thr Ala Leu Lys His Gly Met Ile Lys 355 360 365 Phe Asn Pro Arg Val Pro Ser Arg Glu Asp Ile Leu Asp Ile Val Lys 370 375 380 Lys Ala Tyr 385 <210> 12 <211> 1176 <212> DNA <213> Aeribacillus pallidus <400> 12 atgatcggaa attacgcaaa aaaggcgatt gatttcgagt tcacttttta tcttcctaca 60 ttgatcgaat tcggatacgg caaggcttcc cgaatgggag agatgcttga acagatgggt 120 ataaagaacg tttttttggt taccgacaaa ggagtggaag ctgcgggtct gttggcagga 180 atcgttcagt ctctggaatc atccaatatc cgatatgtta tttattcaga cgtagaacct 240 gacccgagct tagagacgat tgatcgtggt gcgtccgttt ttaaggagca gtcttttgac 300 tgtatcttag ctgtgggtgg aggaagtccg attgatacag ctaaggggat ccgtgtcgta 360 gtgacgaacg gaggaaacat cggtgactat gccggtgtta accgtgttgc gaaaaaatct 420 gaaattcctt tggtggctgt gccgactaca tccggcacgg gcagtgaagt aaccattttc 480 ggagtctact ccgattggga aaatcaagta aaggtgacgg taacaagccc atatatggcg 540 ccggagatcg ctttggtaga ccccgaactt accatgagtc taccgcaaaa aatgacagca 600 gcatcgggaa ttgatgctct agctcatggg attgaaactt tcttctcctt gcgttctcga 660 cctgcatccg atgccctagc ggtcgaagcg atggcgacgg tgagtgctta tttgcgccgt 720 gcggtggaag atggtacgga taaagaagcg aggatcggca tgtcccaggg cagtttgttg 780 gcagggatgg cattcaacaa tggcttctta ggtttggccc atgcgatcgg tagtgctttg 840 tctggccatt gtcatgtgtc ccatggtgtc gcaatcggtt tgttgctacc gaaagtggtg 900 gaatttaatg ctagggtgcg cccggaaaaa gctgcaaaaa tcgcagaatt gttgggagta 960 aaaggggatc gagaggaggt tcttgcggag caggcagctc ctgcagtcgc ctcgttagtc 1020 aaagagattg gtcttcccac tcgtttgcgt gatgttgatg tttctgaaga aaagctccca 1080 gatatcgcaa gagatgcatt taaaagcggt atgatgaagt ttaacccacg ccaaccaagt 1140 ttgtcagaag tgcttacact tttgcagcag atttat 1176 <210> 13 <211> 1179 <212> DNA <213> Artificial <220> <223> Synthetic codon optimised for expression in P. putida <400> 13 atgatcggca actacgccaa gaaggccatc gacttcgagt tcaccttcta cctgccgacc 60 ctgatcgagt tcggctacgg caaggccagc cgcatgggcg agatgctgga acaaatgggt 120 atcaagaacg tgttcctggt gaccgacaag ggcgtggaag ccgccggtct gctggccggc 180 atcgtgcaga gcctggaaag cagcaacatc cgctacgtga tctacagcga cgtggaaccg 240 gacccgagcc tggaaaccat cgaccgcggc gccagcgtgt tcaaagaaca gagcttcgac 300 tgcatcctgg ccgtgggcgg cggcagcccg atcgacaccg ccaagggcat ccgcgtggtg 360 gtgaccaacg gcggcaacat cggcgactac gccggcgtga accgcgtggc caagaagtcg 420 gagatcccgc tggtcgccgt gccaaccacc tcgggcaccg gcagcgaagt gaccatcttc 480 ggcgtgtaca gcgactggga gaaccaggtg aaggtgaccg tgaccagccc gtacatggcc 540 ccggaaatcg ccctggtgga cccggaactg accatgagcc tgccgcagaa gatgaccgcc 600 gccagcggca tcgacgccct ggcccacggc atcgaaacct tcttcagcct gcgcagccgc 660 ccagcctcgg atgccctggc ggtggaagcc atggccaccg tgagcgccta cctgcgccgc 720 gccgtcgagg acggcaccga caaagaagcc cgcatcggca tgagccaggg cagcctgctg 780 gcgggcatgg ccttcaacaa cggcttcctg ggcctggccc atgccatcgg cagcgccctg 840 agcggccatt gccatgtgag ccacggcgtg gccatcggcc tgctgctgcc gaaggtggtg 900 gaattcaacg cccgcgtgcg cccggaaaag gccgccaaga tcgccgaact gctgggcgtg 960 aagggcgacc gcgaagaggt gctggccgaa caggccgccc cagccgtggc cagcctggtg 1020 aaagaaatcg gcctgccgac ccgcctgcgc gacgtggacg tgagcgaaga gaagctgccg 1080 gacatcgccc gcgacgcctt caagagcggc atgatgaagt tcaacccgcg ccagccgagc 1140 ctgagcgagg tgctgaccct gctgcagcag atctactga 1179 <210> 14 <211> 1152 <212> DNA <213> Artificial <220> <223> Synthetic codon optimised for expression in P.putida <400> 14 atggacgtgg aattcagctt ccatctgccg accctgatcg agttcggctt cggcaaggcc 60 agcctgctgg gcgagcgcct gctgaagctg ggcgtgggca acgtgttcct ggtgagcgac 120 aagggcgtgg ccagcgcagg cctgctgcag aagctggaac agagcctgca gaccagcgac 180 atccacttca agacctacct ggaagtggaa ccggacccga gcctggaaac catcgacctg 240 ggtgccgagg ccttcaacag cggcaagtac gactgcatcg tggccgtggg tggtggcagc 300 gccatcgaca ccgccaaggg catccgcgtg gtggcaggca acggtggcag catcggcgac 360 ttcgcaggcg tggacaagat cggcaaggca ccgcagatcc cgctgatcgc cgtgccgacc 420 acctcgggca ccggcagcga agtgaccatc ttcggcgtgt acagcgactg ggtgaagaac 480 gtgaaggtga ccgtgaccag ccagtacatg gcaccgacca ttgccctggt ggacccggaa 540 ctgaccatgc gcctgccacg caagatgacc gcagccagcg gcatcgacgc cctggcccac 600 ggcatcgaga gctacttcag cctgcgcagc accagcgcca gccgtgccct gtcgctggaa 660 gccatcaaca tcgtgggcaa ccatctgcgc cagagcgtgg cgaacggcga ggacaaggaa 720 gcacgctgcg gcatgagcca cggcagcctg ctggcaggca tggcgttcaa caacggcttc 780 ctgggcctgg cccatgccat cggcagcgca ctgagcggtc actgccacgt gccgcacggc 840 gtggccatcg gcctgctgct gccgcacgtg gtggaattca acagcagcga gtgcccagac 900 caggcagccg agatcgccaa gatcctgggc gtgaaggccg aggacgaacg ccagctggcc 960 gaacaggcca gccacgccgt gggcgacctg gtgaaggaca tcggcctgcc gacccgtctg 1020 cgcgacatga acgtgccgga agagaagctg gccgacattg cacgcgacag cttccagagc 1080 ggcatgatga agttcaaccc acgtcgtgcc agcgagagcg aggtgctgga actgctgcac 1140 cgcgtgtact ga 1152 <210> 15 <211> 1994 <212> DNA <213> Artificial <220> <223> Synthetic XbaI-SalI fragment <400> 15 tctagatctt ctttgataat aaatgaaagc agccggtatg gagagaaaaa agtgcactta 60 tatgaagttg attttatggt cggctttatt ttgcccgtcg tactggctgt ccacacgatg 120 ttcatttttg atgcacaatt gaatggctgt acagttgcgt ttttgtcgat gtctggcggg 180 cacgcctcca tgcatgtgaa gcagattctt ttaagcgggc agcacccgct tttttggagg 240 gcaggcattc aggagcaaaa atggcagaga tcagttgggc gggatcagcc atttattcct 300 ccatccgggg cactttgtga aaatcagcac aagaatgaat aacgctttca tatctggctt 360 tttcaaataa aaccatttgt gaaaaatgta aacggatgat tttgaaaaac cgtcattttc 420 ctttaaaacc gggcatttgg gcagataaat tttcaaattt tcgccataaa atatgtgaat 480 ctaatcacaa aaatagtggt atacttaccc atgtggaatg aaggaaaatg aacggaacga 540 tccatttcag ccataaaagg gcatgccgtc catctatttc acaaaccgca cggcagcatt 600 tgctgcaaaa gtttaatcgt cctgctttaa aggaaaagca gtatggaatc cattaggagt 660 tggcacaata tccatagact ggataggggc ccgccatgcc gggcttgcaa aactgctttc 720 atacagtgga aatatttttt acttttgatg gggaggaaga ttatatatga tcggaaatta 780 cgcaaaaaag gcgattgatt tcgagttcac tttttatctt cctacattga tcgaattcgg 840 atacggcaag gcttcccgaa tgggagagat gcttgaacag atgggtataa agaacgtttt 900 tttggttacc gacaaaggag tggaagctgc gggtctgttg gcaggaatcg ttcagtctct 960 ggaatcatcc aatatccgat atgttattta ttcagacgta gaacctgacc cgagcttaga 1020 gacgattgat cgtggtgcgt ccgtttttaa ggagcagtct tttgactgta tcttagctgt 1080 gggtggagga agtccgattg atacagctaa ggggatccgt gtcgtagtga cgaacggagg 1140 aaacatcggt gactatgccg gtgttaaccg tgttgcgaaa aaatctgaaa ttcctttggt 1200 ggctgtgccg actacatccg gcacgggcag tgaagtaacc attttcggag tctactccga 1260 ttgggaaaat caagtaaagg tgacggtaac aagcccatat atggcgccgg agatcgcttt 1320 ggtagacccc gaacttacca tgagtctacc gcaaaaaatg acagcagcat cgggaattga 1380 tgctctagct catgggattg aaactttctt ctccttgcgt tctcgacctg catccgatgc 1440 cctagcggtc gaagcgatgg cgacggtgag tgcttatttg cgccgtgcgg tggaagatgg 1500 tacggataaa gaagcgagga tcggcatgtc ccagggcagt ttgttggcag ggatggcatt 1560 caacaatggc ttcttaggtt tggcccatgc gatcggtagt gctttgtctg gccattgtca 1620 tgtgtcccat ggtgtcgcaa tcggtttgtt gctaccgaaa gtggtggaat ttaatgctag 1680 ggtgcgcccg gaaaaagctg caaaaatcgc agaattgttg ggagtaaaag gggatcgaga 1740 ggaggttctt gcggagcagg cagctcctgc agtcgcctcg ttagtcaaag agattggtct 1800 tcccactcgt ttgcgtgatg ttgatgtttc tgaagaaaag ctcccagata tcgcaagaga 1860 tgcatttaaa agcggtatga tgaagtttaa cccacgccaa ccaagtttgt cagaagtgct 1920 tacacttttg cagcagattt attaattgtt cgggtttcag tgttccattt tcaaatattc 1980 cgttaagggt cgac 1994 <210> 16 <211> 1258 <212> DNA <213> Artificial <220> <223> Synthetic KpnI-XbaI fragment <400> 16 ggtaccttca cacaggaaac aggaggtaca atgatcggaa attacgcaaa aaaggcgatt 60 gatttcgagt tcacttttta tcttcctaca ttgatcgaat tcggatacgg caaggcttcc 120 cgaatgggag agatgcttga acagatgggt ataaagaacg tttttttggt taccgacaaa 180 ggagtggaag ctgcgggtct gttggcagga atcgttcagt ctctggaatc atccaatatc 240 cgatatgtta tttattcaga cgtagaacct gacccgagct tagagacgat tgatcgtggt 300 gcgtccgttt ttaaggagca gtcttttgac tgtatcttag ctgtgggtgg aggaagtccg 360 attgatacag ctaaggggat ccgtgtcgta gtgacgaacg gaggaaacat cggtgactat 420 gccggtgtta accgtgttgc gaaaaaatct gaaattcctt tggtggctgt gccgactaca 480 tccggcacgg gcagtgaagt aaccattttc ggagtctact ccgattggga aaatcaagta 540 aaggtgacgg taacaagccc atatatggcg ccggagatcg ctttggtaga ccccgaactt 600 accatgagtc taccgcaaaa aatgacagca gcatcgggaa ttgatgctct agctcatggg 660 attgaaactt tcttctcctt gcgttctcga cctgcatccg atgccctagc ggtcgaagcg 720 atggcgacgg tgagtgctta tttgcgccgt gcggtggaag atggtacgga taaagaagcg 780 aggatcggca tgtcccaggg cagtttgttg gcagggatgg cattcaacaa tggcttctta 840 ggtttggccc atgcgatcgg tagtgctttg tctggccatt gtcatgtgtc ccatggtgtc 900 gcaatcggtt tgttgctacc gaaagtggtg gaatttaatg ctagggtgcg cccggaaaaa 960 gctgcaaaaa tcgcagaatt gttgggagta aaaggggatc gagaggaggt tcttgcggag 1020 caggcagctc ctgcagtcgc ctcgttagtc aaagagattg gtcttcccac tcgtttgcgt 1080 gatgttgatg tttctgaaga aaagctccca gatatcgcaa gagatgcatt taaaagcggt 1140 atgatgaagt ttaacccacg ccaaccaagt ttgtcagaag tgcttacact tttgcagcag 1200 atttattaat tgttcgggtt tcagtgttcc attttcaaat attccgttaa ggtctaga 1258 <210> 17 <211> 446 <212> PRT <213> Aeribacillus pallidus <400> 17 Met Lys Asn Ile Ala Asn Thr Ser Thr Glu Arg Pro Val Asn Asp Ala 1 5 10 15 Ser Val Lys Asn Arg Gln Met Val Arg Ala Thr Ile Ala Ser Leu Ile 20 25 30 Gly Trp Ser Leu Asp Leu Tyr Asp Leu Phe Leu Leu Leu Phe Val Ala 35 40 45 Thr Thr Ile Gly Asn Leu Phe Phe Pro Ala Ser Asn Gln Thr Leu Ser 50 55 60 Leu Ala Ala Val Tyr Ala Ser Phe Ala Val Thr Leu Leu Met Arg Pro 65 70 75 80 Leu Gly Ser Ala Ile Phe Gly Ile Tyr Ala Asp Lys Asn Gly Arg Lys 85 90 95 Lys Ala Met Thr Val Ala Ile Ile Gly Ala Gly Leu Cys Thr Ala Ala 100 105 110 Phe Gly Leu Leu Pro Thr Ile His Gln Val Gly Val Val Ala Ala Ile 115 120 125 Ala Phe Leu Ile Leu Arg Leu Val Gln Gly Val Phe Val Gly Gly Val 130 135 140 Val Ala Ser Thr His Thr Ile Gly Thr Glu Ser Ala Ser Pro Lys Tyr 145 150 155 160 Arg Gly Phe Met Ser Gly Leu Ile Gly Gly Gly Gly Ala Gly Leu Gly 165 170 175 Ala Leu Phe Ala Ser Ile Ser Tyr Ser Val Val Thr Ala Ile Phe Pro 180 185 190 Gly Glu Ala Phe Asp Val Trp Gly Trp Arg Val Met Phe Phe Thr Gly 195 200 205 Ile Ile Gly Ser Leu Phe Gly Leu Phe Ile Phe Arg Ser Leu Glu Glu 210 215 220 Ser Pro Leu Trp Lys Gln Leu Lys Glu Glu Asn Ser Lys Gly Glu Val 225 230 235 240 Ser Glu Phe Gln Lys Ala Pro Leu Lys Thr Phe Phe Thr Lys Tyr Tyr 245 250 255 Lys Val Leu Leu Val Asn Leu Met Ile Val Ile Gly Gly Gly Ser Gly 260 265 270 Tyr Tyr Leu Thr Ser Gly Phe Ile Pro Thr Phe Leu Lys Val Val Asn 275 280 285 Lys Val Ser Ala Ser Val Ser Ser Gly Val Leu Ile Ala Thr Ser Ile 290 295 300 Met Thr Ile Val Ala Ala Val Leu Val Gly His Leu Ser Glu Val Ile 305 310 315 320 Gly Arg Lys Lys Thr Phe Leu Leu Ile Gly Ile Leu Cys Leu Val Gly 325 330 335 Leu Pro Tyr Phe Tyr Leu Ser Leu Ala Asn Ser Thr Thr Thr Thr Gly 340 345 350 Ile Tyr Leu Asn Ala Leu Gly Leu Ile Phe Leu Gly Asn Ala Ala Tyr 355 360 365 Ala Pro Val Leu Ile Phe Leu Asn Glu Arg Phe Pro Thr Ser Ile Arg 370 375 380 Ser Thr Gly Thr Gly Leu Ser Trp Asn Met Gly Phe Ala Ile Gly Gly 385 390 395 400 Met Met Pro Thr Phe Val Asn Leu Ala Ser Gly Thr Val Glu His Ile 405 410 415 Pro Tyr Thr Leu Met Tyr Phe Thr Ile Gly Ile Tyr Leu Val Tyr Ile 420 425 430 Leu Gly Ser Leu Ile Ile Pro Glu Thr Lys Gly Asn Leu Lys 435 440 445 <210> 18 <211> 1338 <212> DNA <213> Aeribacillus pallidus <400> 18 gtgaagaata tcgctaatac gagtaccgaa cgacctgtaa atgatgcttc agttaagaat 60 cgtcaaatgg tgcgagctac gattgcctcg ctcatagggt ggtcactcga tctttacgat 120 ttatttctgc tgctttttgt tgcgacgacc atagggaatt tgttttttcc cgccagcaat 180 caaacacttt ctttggctgc cgtgtatgct tcctttgccg ttacgctttt gatgcggcct 240 ttgggttccg ccattttcgg catttatgcg gataaaaacg ggagaaagaa agcgatgact 300 gtggcaatca ttggagcagg cttgtgcacg gcggctttcg gtctgttacc tacgatccac 360 caagttggag tggtcgctgc gatcgccttc ttgattttac gtttagttca aggagtgttt 420 gtcggcggag tggttgcttc cacccatacg ataggaacgg aatccgcatc gccaaaatat 480 cgggggttta tgtcgggatt gatcggtggt ggcggagcag gattgggagc actgtttgct 540 tctatttctt attcggttgt gacggcaatt tttccgggag aggcttttga tgtttgggga 600 tggcgtgtca tgtttttcac aggcattatc ggttccctct tcggcctttt catattccgg 660 tcccttgagg aatctcctct ctggaaacaa ttgaaagaag aaaatagtaa aggcgaagtg 720 tccgagtttc agaaagcacc gctgaagacg tttttcacta aatattacaa ggtattgctc 780 gtcaacctta tgatcgtcat cggtggtggc tccggttatt atctgactag tggatttatt 840 cctacatttt taaaggtagt taacaaagta tcagcctctg tttcgtcggg ggtactcatt 900 gcgacaagta ttatgaccat tgtagccgcc gttctcgtgg gacacctgag cgaggtcatc 960 ggcagaaaga aaacatttct gttaatcggt attctttgtc ttgtcggact tccgtatttt 1020 tatctgtcat tggcaaactc aactacgaca acgggcatct acttaaatgc tcttggactc 1080 atattcttgg ggaatgctgc atatgcaccg gtactcatct tcttgaacga acgttttccc 1140 acatcgatcc gttcaacagg taccggatta tcatggaaca tgggtttcgc cattggcggg 1200 atgatgccga cgtttgtgaa cttagccagt ggtacggtgg aacatattcc ttacacgctg 1260 atgtatttta ctatcggaat ttacttggtt tatatccttg gcagcctgat tattccggaa 1320 acaaaaggaa acctcaaa 1338 <210> 19 <211> 1184 <212> DNA <213> Artificial <220> <223> Synthetic KpnI - NheI fragment with codon optimized B.kribbensis YiaY <400> 19 ggtacctagg aaaggaagat taacccatgg acgtggaatt cagcttccat ctgccgaccc 60 tgatcgagtt cggcttcggc aaggccagcc tgctgggcga gcgcctgctg aagctgggcg 120 tgggcaacgt gttcctggtg agcgacaagg gcgtggccag cgcaggcctg ctgcagaagc 180 tggaacagag cctgcagacc agcgacatcc acttcaagac ctacctggaa gtggaaccgg 240 acccgagcct ggaaaccatc gacctgggtg ccgaggcctt caacagcggc aagtacgact 300 gcatcgtggc cgtgggtggt ggcagcgcca tcgacaccgc caagggcatc cgcgtggtgg 360 caggcaacgg tggcagcatc ggcgacttcg caggcgtgga caagatcggc aaggcaccgc 420 agatcccgct gatcgccgtg ccgaccacct cgggcaccgg cagcgaagtg accatcttcg 480 gcgtgtacag cgactgggtg aagaacgtga aggtgaccgt gaccagccag tacatggcac 540 cgaccattgc cctggtggac ccggaactga ccatgcgcct gccacgcaag atgaccgcag 600 ccagcggcat cgacgccctg gcccacggca tcgagagcta cttcagcctg cgcagcacca 660 gcgccagccg tgccctgtcg ctggaagcca tcaacatcgt gggcaaccat ctgcgccaga 720 gcgtggcgaa cggcgaggac aaggaagcac gctgcggcat gagccacggc agcctgctgg 780 caggcatggc gttcaacaac ggcttcctgg gcctggccca tgccatcggc agcgcactga 840 gcggtcactg ccacgtgccg cacggcgtgg ccatcggcct gctgctgccg cacgtggtgg 900 aattcaacag cagcgagtgc ccagaccagg cagccgagat cgccaagatc ctgggcgtga 960 aggccgagga cgaacgccag ctggccgaac aggccagcca cgccgtgggc gacctggtga 1020 aggacatcgg cctgccgacc cgtctgcgcg acatgaacgt gccggaagag aagctggccg 1080 acattgcacg cgacagcttc cagagcggca tgatgaagtt caacccacgt cgtgccagcg 1140 agagcgaggt gctggaactg ctgcaccgcg tgtactgagc tagc 1184 <210> 20 <211> 1359 <212> DNA <213> Artificial <220> <223> EcoRI-NheI PCR fragment with A.pallidus proP coding sequence <400> 20 gccgaattca tgaagaatat cgctaatacg agtaccgaac gacctgtaaa tgatgcttca 60 gttaagaatc gtcaaatggt gcgagctacg attgcctcgc tcatagggtg gtcactcgat 120 ctttacgatt tatttctgct gctttttgtt gcgacgacca tagggaattt gttttttccc 180 gccagcaatc aaacactttc tttggctgcc gtgtatgctt cctttgccgt tacgcttttg 240 atgcggcctt tgggttccgc cattttcggc atttatgcgg ataaaaacgg gagaaagaaa 300 gcgatgactg tggcaatcat tggagcaggc ttgtgcacgg cggctttcgg tctgttacct 360 acgatccacc aagttggagt ggtcgctgcg atcgccttct tgattttacg tttagttcaa 420 ggagtgtttg tcggcggagt ggttgcttcc acccatacga taggaacgga atccgcatcg 480 ccaaaatatc gggggtttat gtcgggattg atcggtggtg gcggagcagg attgggagca 540 ctgtttgctt ctatttctta ttcggttgtg acggcaattt ttccgggaga ggcttttgat 600 gtttggggat ggcgtgtcat gtttttcaca ggcattatcg gttccctctt cggccttttc 660 atattccggt cccttgagga atctcctctc tggaaacaat tgaaagaaga aaatagtaaa 720 ggcgaagtgt ccgagtttca gaaagcaccg ctgaagacgt ttttcactaa atattacaag 780 gtattgctcg tcaaccttat gatcgtcatc ggtggtggct ccggttatta tctgactagt 840 ggatttattc ctacattttt aaaggtagtt aacaaagtat cagcctctgt ttcgtcgggg 900 gtactcattg cgacaagtat tatgaccatt gtagccgccg ttctcgtggg acacctgagc 960 gaggtcatcg gcagaaagaa aacatttctg ttaatcggta ttctttgtct tgtcggactt 1020 ccgtattttt atctgtcatt ggcaaactca actacgacaa cgggcatcta cttaaatgct 1080 cttggactca tattcttggg gaatgctgca tatgcaccgg tactcatctt cttgaacgaa 1140 cgttttccca catcgatccg ttcaacaggt accggattat catggaacat gggtttcgcc 1200 attggcggga tgatgccgac gtttgtgaac ttagccagtg gtacggtgga acatattcct 1260 tacacgctga tgtattttac tatcggaatt tacttggttt atatccttgg cagcctgatt 1320 attccggaaa caaaaggaaa cctcaaataa gctagcggc 1359 <210> 21 <211> 20 <212> DNA <213> Artificial <220> <223> ribosome binding site <400> 21 taggaaagga agattaaccc 20 <210> 22 <211> 30 <212> DNA <213> Artificial <220> <223> PCR primer proP(f) <400> 22 gccgaattca tgaagaatat cgctaatacg 30 <210> 23 <211> 34 <212> DNA <213> Artificial <220> <223> PCR primer proP(r) <400> 23 gccgctagct tatttgaggt ttccttttgt ttcc 34 <210> 24 <211> 500 <212> PRT <213> Cupriavidus basilensis <400> 24 Met Asn Ala Gln His Trp Ile Ala Gly Ala Trp Thr Gly Glu Pro Ser 1 5 10 15 Ala Asp Ser Val Asn Pro Ala Asp Gly Thr Leu Ile Gly Gln Phe Ala 20 25 30 Asp Gly Gly Thr Trp Gln Ala Glu Ala Ala Ile Ala Ala Ala Arg His 35 40 45 Val Phe Glu Arg Thr Thr Trp Gly Gln Asp Ala Arg Leu Arg Gln Asp 50 55 60 Val Leu Leu Ala Trp Ala Gly Ala Leu Glu Ala Glu Arg Glu Arg Leu 65 70 75 80 Ala Ser Leu Leu Thr Ala Glu Asn Gly Lys Pro Val Ala Gln Ala Arg 85 90 95 Gly Glu Val Gly Ala Ala Ile Ser Glu Val Arg Tyr Tyr Ala Gly Leu 100 105 110 Ala Arg His Ile Pro Gly His Val Leu Glu Pro Glu Pro Gly Thr Ile 115 120 125 Ser Thr Ile Leu Arg Glu Pro Ala Gly Val Ala Ala Ile Ile Val Pro 130 135 140 Trp Asn Ala Pro Ala Val Leu Leu Val Arg Ser Leu Ala Pro Ala Leu 145 150 155 160 Ala Ala Gly Cys Thr Ala Val Val Lys Ser Ala Ala Gln Thr Thr Leu 165 170 175 Phe Thr Ala Ala Met Leu Arg Leu Phe Glu Arg Thr Ala Leu Pro Ala 180 185 190 Gly Ala Val Asn Leu Val Cys Glu Thr Gly Tyr Ala Ala Ala Asp His 195 200 205 Leu Val Arg Ser Arg Asp Val Asp Val Val Ser Phe Thr Gly Ser Thr 210 215 220 Ala Thr Gly Lys Lys Ile Met Ile Ala Ala Ala Asp Ser Val Lys Lys 225 230 235 240 Leu Ser Leu Glu Leu Gly Gly Lys Ser Cys Cys Leu Val Phe Asp Asp 245 250 255 Val Asp Ala Gln Ala Val Ala Lys Arg Leu Ala Leu Ala Ala Thr Val 260 265 270 Ile Ser Gly Gln Gln Cys Thr Ala Ala Arg Arg Val Leu Val His Glu 275 280 285 Ala Ile Ala Pro Gln Met Arg Arg His Leu Thr Glu Ala Leu Ala Ala 290 295 300 Leu Arg Leu Gly Pro Gly Ile Glu Pro Asp Thr Gln Ile Gly Pro Leu 305 310 315 320 Ile Asp His Pro Thr Arg Ala Met Val Ser Ala Gln Val Glu Arg Ala 325 330 335 Cys Asp Glu Ala Asp Thr Val Leu Leu Arg Gly Thr Met Pro Gly Gly 340 345 350 Ala Leu Ala Arg Gly Ala Phe Leu Ser Pro Thr Leu Val Glu His Ser 355 360 365 Asp Pro Gly Ala Phe Phe Cys Gln Glu Glu Ile Phe Gly Pro Phe Val 370 375 380 Thr Phe Glu Thr Phe Ala Thr Glu Asp Glu Ala Leu Ala Lys Ala Asn 385 390 395 400 Asn Thr Val Phe Gly Leu Ser Ala Ser Val Trp Thr His His Gly Glu 405 410 415 Arg Ala Ile Arg Leu Ala Arg Ala Leu Arg Asn Gly Thr Val Trp Val 420 425 430 Asn Asp His Asn Arg Leu Phe Ala Glu Ala Glu Thr Gly Gly Tyr Arg 435 440 445 Gln Ser Gly Leu Gly Arg Leu His Gly Tyr Asp Ala Leu Ala Asp Phe 450 455 460 Thr Glu Leu Lys His Ile Cys Ile Gln Ala Gly Leu Pro Lys Gly Met 465 470 475 480 Ser Gln Ala Gly Cys Arg Leu Ser Gly Val Ala Ala Arg Glu Arg Met 485 490 495 Gly Val Ser Val 500 <210> 25 <211> 479 <212> PRT <213> Burkholderia sp. CCGE1002 <400> 25 Met Asn Ala Arg His Trp Ile Ala Gly Glu Trp Thr Gly Thr Pro Asn 1 5 10 15 Ile Asp Ser Ile Asp Pro Ala Thr Gly Asp Ala Ile Gly Arg Phe Ala 20 25 30 Asp Gly Gly Ser Ser Glu Ala Asp Ala Ala Ile Ala Ala Ala Arg His 35 40 45 Ala Phe Asp Arg Thr Thr Trp Ala Gln Asp Ala Arg Leu Arg Gln Asp 50 55 60 Val Leu Leu Gly Trp Ala Ser Ala Leu Glu Ala Glu Arg Asp Met Leu 65 70 75 80 Ala Thr Leu Leu Thr Arg Glu Asn Gly Lys Ala Ile Ala Gln Ser Arg 85 90 95 Asp Glu Ile Ala Gly Ala Ile Ser Glu Val Arg Tyr Tyr Ala Gly Leu 100 105 110 Ala Arg His Ile Ala Gly His Val Leu Glu Pro Glu Pro Gly Thr Ile 115 120 125 Ser Thr Met Leu Arg Glu Ala Ala Gly Val Ala Ala Ile Ile Val Pro 130 135 140 Trp Asn Ala Pro Ala Val Leu Leu Val Arg Ser Leu Ala Pro Ala Leu 145 150 155 160 Ala Ala Gly Cys Thr Val Ile Val Lys Pro Ala Ala Gln Thr Ser Leu 165 170 175 Leu Thr Ala Ala Met Leu Arg Cys Phe Glu His Thr Ala Leu Pro Glu 180 185 190 Gly Ala Val Asn Leu Val Asn Glu Arg Gly Tyr Ala Ala Ser Gln Arg 195 200 205 Leu Val Asp Ser His Gly Val Asp Val Val Ser Phe Thr Gly Ser Thr 210 215 220 Ala Thr Gly Lys Lys Ile Met Ala Ala Ala Ala Asp Ser Met Lys Lys 225 230 235 240 Leu Ser Leu Glu Leu Gly Gly Lys Ser Cys Cys Val Val Phe Asp Asp 245 250 255 Ala Asp Val Ala Ala Ile Ala Pro Arg Leu Ala Arg Ala Ala Thr Ile 260 265 270 Ile Ser Gly Gln Gln Cys Thr Ala Ala Arg Arg Val Leu Val His Ala 275 280 285 Ser Arg Ala Ala Gln Met Arg Glu Gln Leu Ala Ser Ala Leu Ala Ser 290 295 300 Leu Arg Val Gly Pro Gly Ile Asp Pro Ala Thr Asp Ile Gly Ala Leu 305 310 315 320 Ile Asp Gly Thr Thr Arg Asp Ala Val Ala Arg Thr Ile Glu Arg Ala 325 330 335 Cys Gly Thr Ala Glu Arg Val Leu Leu Arg Gly Thr Cys Ser Gly His 340 345 350 Ala Phe Leu Ser Pro Thr Leu Val Glu His Asp Asp Pro Lys Ala Phe 355 360 365 Phe Cys Gln Asp Glu Ile Phe Gly Pro Phe Val Thr Leu Glu Val Phe 370 375 380 Glu Asn Glu Met Glu Ala Ile Glu Lys Ala Asn Asp Thr Val Phe Gly 385 390 395 400 Leu Ser Ala Ser Val Trp Thr His Asp Gly Ala Arg Ala Leu Arg Val 405 410 415 Ala Arg Ala Leu Arg Asn Gly Thr Val Trp Ile Asn Asp His Asn Lys 420 425 430 Leu Phe Ala Glu Ala Glu Thr Gly Gly Tyr Arg Gln Ser Gly Leu Gly 435 440 445 Arg Leu His Gly Tyr Asp Ala Leu Ala Asp Phe Thr Glu Leu Lys His 450 455 460 Ile Cys Met Pro Ala Gly Val Ala Glu Gly Ile Ala Pro Leu Arg 465 470 475 <210> 26 <211> 483 <212> PRT <213> Burkholderia graminis C4D1M <400> 26 Met Glu Arg Asp Ala Met Asn Trp Ile Ala Gly Glu Trp Ala Gly Lys 1 5 10 15 Pro Val Leu Ala Ser Ser Asp Pro Ser Asn Gly Glu Thr Leu Gly Arg 20 25 30 Phe Val Ser Ser Asn Thr Gln Asp Ala Asp Ala Ala Val Ser Ala Ala 35 40 45 Arg His Thr Phe Asp His Thr Thr Trp Ala Gln Asp Ala Arg Arg Arg 50 55 60 Gln Asp Val Leu Leu Arg Trp Ala Gln Ala Leu Glu Leu Ser Val Glu 65 70 75 80 Pro Leu Ala Glu Leu Leu Thr His Glu Asn Gly Lys Thr Ile Gly Gln 85 90 95 Ala Arg Gly Glu Met Arg Ala Ala Ile Ser Glu Val Arg Tyr Tyr Ala 100 105 110 Gly Leu Ala Arg His Ile Ala Gly His Val Ile Glu Pro Glu Pro Gly 115 120 125 Thr Ile Ser Thr Met Leu Arg Glu Ala Ala Gly Val Ala Ala Ile Ile 130 135 140 Val Pro Trp Asn Ala Pro Ala Val Leu Leu Val Arg Ser Leu Ala Pro 145 150 155 160 Ala Leu Ala Ala Gly Cys Thr Ala Ile Val Lys Pro Ala Ala Gln Thr 165 170 175 Ser Leu Ile Thr Ala Ala Met Ile Arg Cys Leu Asp Gln Pro Ala Leu 180 185 190 Pro Ala Gly Ala Val Asn Leu Leu Leu Glu Asn Gly Ala Glu Ala Ala 195 200 205 Ala Arg Leu Val Glu Ser Ala Asp Val Asp Val Ile Ser Phe Thr Gly 210 215 220 Ser Thr Glu Val Gly Lys Arg Ile Met Arg Ala Ala Ala Asp Ser Met 225 230 235 240 Lys Arg Leu Ser Leu Glu Leu Gly Gly Lys Ser Cys Cys Leu Val Phe 245 250 255 Glu Asp Ser Asp Val Lys Ala Ile Ala Pro Arg Leu Ala Arg Ala Ala 260 265 270 Thr Ile Ile Ser Gly Gln Gln Cys Thr Ala Ala Arg Arg Ile Leu Val 275 280 285 His Val Ser Lys Ala Asp Gln Met Arg Asp Glu Leu Val Lys Ala Leu 290 295 300 Ala Ser Leu Lys Val Gly Pro Gly Ile Asp Pro Ala Ser Asp Ile Gly 305 310 315 320 Ala Leu Ile Asp Ala Ala Ser Arg Asp Ala Val Gln Thr Thr Val Glu 325 330 335 Arg Ala Cys Asp Leu Ala Asp Arg Val Leu Leu Arg Gly Thr Ser Ser 340 345 350 Gly Pro Gly Ala Phe Leu Ser Pro Thr Leu Val Glu His Gly Glu Pro 355 360 365 His Ala Phe Phe Cys Gln Asp Glu Ile Phe Gly Pro Phe Val Thr Leu 370 375 380 Glu Thr Phe Val Thr Glu Lys Glu Ala Val Glu Lys Ala Asn Asn Thr 385 390 395 400 Val Phe Gly Leu Ser Ala Ser Val Trp Thr His Asp Ser Ala Arg Ala 405 410 415 Phe Arg Ile Ala Arg Ala Leu Arg Asp Gly Thr Val Trp Ile Asn Asp 420 425 430 His Asn Arg Leu Phe Ala Glu Ala Glu Thr Gly Gly Tyr Arg Gln Ser 435 440 445 Gly Leu Gly Arg Leu His Gly Tyr Asp Ala Leu Ala Asp Phe Thr Glu 450 455 460 Ile Lys His Ile Cys Val Gly Ala Gly Val Leu Glu Gly Ile Glu Val 465 470 475 480 Leu Gly Ser <210> 27 <211> 483 <212> PRT <213> Azospirillum sp. B510 <400> 27 Met Thr Asn Leu Asp Ser Arg His Trp Ile Asp Gly Ala Trp Val Pro 1 5 10 15 Gly Thr Asp Arg Phe Ala Ser Ile Asn Pro Ala Asp Gly Ser Val Leu 20 25 30 Gly His Ala Ala Asp Gly Gly Arg Ala Glu Ala Glu Ala Ala Ile Ala 35 40 45 Ala Ala His Ala Ala Phe Asn Arg Pro Asp Trp Ala Gln Asn Pro Arg 50 55 60 Leu Arg Gln Ser Ile Leu Leu Gly Trp Ala Asp Arg Leu Asp Thr Gln 65 70 75 80 Ala Glu Asp Leu Ala Arg Leu Leu Thr Leu Glu Asn Gly Lys Ala Ile 85 90 95 Ala Gln Ser Arg Gly Glu Ile Ala Gly Ala Ile Ser Glu Ile Arg Tyr 100 105 110 Tyr Gly Gly Leu Ala Arg His Val Pro Gly His Val Leu Glu Val Glu 115 120 125 Pro Gly Val Leu Ser Thr Met Leu Arg Glu Pro Ala Gly Val Ala Ala 130 135 140 Leu Ile Ile Pro Trp Asn Ala Pro Ala Val Leu Leu Ala Arg Ala Ile 145 150 155 160 Gly Pro Ala Leu Ala Cys Gly Cys Thr Val Val Val Lys Pro Ala Ala 165 170 175 Gln Thr Thr Leu Leu Thr Ala Ala Phe Leu Arg Ala Leu Ser Glu Val 180 185 190 Pro Ser Leu Pro Arg Gly Val Cys Asn Met Ile Ser Glu Thr Gly His 195 200 205 Ala Ala Ala Ala Arg Leu Val Asp Ser Pro Leu Val Asp Val Val Ser 210 215 220 Phe Thr Gly Ser Thr Ala Thr Gly Lys Arg Ile Met Val Ala Ala Ala 225 230 235 240 Asp Thr Met Lys Lys Leu Ser Leu Glu Leu Gly Gly Lys Ser Cys Cys 245 250 255 Leu Val Phe Pro Asp Ala Asp Pro Ala Glu Thr Ala Ala Arg Ile Ala 260 265 270 Thr Ala Ala Thr Ile Ile Ser Gly Gln Gln Cys Thr Ala Ala Arg Arg 275 280 285 Val Leu Val His Ala Ser Ala Phe Asp Ala Met Lys Thr His Leu Arg 290 295 300 Ala Ala Leu Ala Ala Met Thr Val Gly Asn Gly Leu Asp Pro Ala Ile 305 310 315 320 Arg Met Gly Pro Leu Ile Asp Arg Pro Ala Arg Asp Gln Val Gln Thr 325 330 335 Gln Val Glu Arg Ala Phe Asp Ala Cys Asp Glu Val Leu Leu Arg Gly 340 345 350 Gly Val Pro Thr Asp Ser Pro Ala Ala Ala Ser Phe Leu Thr Pro Ser 355 360 365 Leu Val Ala His Asp Asp Pro Ser Ala Phe Phe Cys Gln Asp Glu Ile 370 375 380 Phe Gly Pro Phe Val Val Leu Glu Arg Phe Glu Thr Glu Ala Glu Ala 385 390 395 400 Val Ala Lys Ala Asn Asn Thr Val Phe Gly Leu Ser Ala Ser Val Trp 405 410 415 Thr Arg Asp Gly Ala Arg Ala Leu Arg Met Ala Arg Ala Leu Arg Asn 420 425 430 Gly Thr Val Trp Ile Asn Asp His Asn Arg Leu Phe Ala Glu Ala Glu 435 440 445 Thr Gly Gly Tyr Arg Gln Ser Gly Leu Gly Arg Leu His Gly Tyr Asp 450 455 460 Ala Phe Ala Asp Phe Thr Glu Leu Lys His Val Cys Gln Thr Val Gly 465 470 475 480 Thr Ile Gly <210> 28 <211> 480 <212> PRT <213> Pseudomonas putida <400> 28 Met Gln Ser Gln His Tyr Ile Asp Gly Gln Trp Thr Ser Thr Asp Arg 1 5 10 15 Trp Thr Asp Ser Leu Asp Pro Ala Ser Gly Glu Leu Ile Gly Cys Phe 20 25 30 Ala Asp Gly Gly Glu Ala Glu Ala Glu Ala Ala Val Ala Ala Ala Ala 35 40 45 Arg Ala Phe Asn Asp Pro Gln Trp Ala Gln Asn Pro Arg Leu Arg Gln 50 55 60 Gln Leu Leu Leu Glu Trp Ala Ala Gly Leu Lys Ala Arg Gln Glu Gln 65 70 75 80 Leu Ala Gln Leu Leu Thr Arg Glu Asn Gly Lys Ala Leu Ala Gln Ser 85 90 95 Arg Gly Glu Ile Gly Gly Ala Ile Ser Glu Ile Leu Tyr Tyr Ala Gly 100 105 110 Leu Ala Arg His Asn Pro Gly His Met Leu Glu Val Ala Pro Gly Glu 115 120 125 Phe Ser Ser Met Leu Arg Glu Pro Ala Gly Val Ala Gly Leu Ile Ile 130 135 140 Pro Trp Asn Ala Pro Ala Val Leu Leu Val Arg Ala Leu Ala Pro Ala 145 150 155 160 Ile Ala Ala Gly Cys Thr Val Val Ile Lys Pro Ala Pro Gln Thr Ala 165 170 175 Leu Phe Asn Ala Ala Met Leu Glu Pro Leu Phe Ala Leu Pro Gly Leu 180 185 190 Pro Ala Gly Ala Val Asn Leu Phe Ala Glu Ser Gly His Ala Gly Ala 195 200 205 Ala His Leu Val Ala Ser Pro Arg Val Asp Val Leu Ser Phe Thr Gly 210 215 220 Ser Thr Ala Thr Gly Gln Arg Ile Met Arg Asp Cys Ala Ala Thr Met 225 230 235 240 Lys Lys Leu Ser Leu Glu Leu Gly Gly Lys Ser Cys Cys Leu Val Phe 245 250 255 Glu Asp Ala Asp Ile Ala Ala Ile Ala Pro Lys Leu Ala Ala Ala Ala 260 265 270 Thr Ile Ile Ser Gly Gln Gln Cys Thr Ala Ala Arg Arg Val Leu Val 275 280 285 His Ala Ser Arg Phe Ala Glu Met Lys Thr Ala Leu Ser Ala Ala Leu 290 295 300 Gly Gln Ile Arg Leu Gly Asn Gly Leu Asp Pro Ala Asn Asn Met Gly 305 310 315 320 Pro Leu Ile Asp Trp His Ser Arg Asp Ser Val Glu Arg Arg Ile Gly 325 330 335 Glu Ala Leu Asp Ser Cys Asp Glu Val Leu Leu Ala Gly Gly Arg Pro 340 345 350 Gln Gly Glu Leu Ser Lys Gly Ala Phe Leu Ala Pro Ser Leu Ile Ala 355 360 365 His Arg Asp Ser Ser Ala Phe Phe Cys Gln Glu Glu Ile Phe Gly Pro 370 375 380 Leu Leu Val Leu Glu Ser Phe Glu Asp Glu Thr Glu Ala Val Ala Arg 385 390 395 400 Ala Asn His Thr Glu Phe Gly Leu Ser Ala Ser Val Trp Thr Asp Gln 405 410 415 Gly Ala Arg Ala Trp Arg Val Ala Arg Ala Leu Arg Asn Gly Thr Val 420 425 430 Trp Leu Asn Asp His Asn Arg Leu Phe Ala Glu Ala Glu Thr Gly Gly 435 440 445 Tyr Arg Lys Ser Gly Leu Gly Arg Leu His Gly Val Asp Ala Leu Leu 450 455 460 Asp Phe Ser Glu Leu Lys His Ile Tyr Gln Asn Val Gly Thr Leu Gly 465 470 475 480 <210> 29 <211> 486 <212> PRT <213> Rhodopseudomonas palustris <400> 29 Met Gly Met Thr Ala Leu His Ala Asp Asn Leu Ile Asp Gly Ala Trp 1 5 10 15 Gln Pro Ala Gln Ser Gly Ala Thr Ala Pro Ser Leu Asp Pro Ser Ser 20 25 30 Gly Gly Thr Ile Gly Gly Phe Ala Ala Gly Gly Ala Ala Asp Ala Gln 35 40 45 Ala Ala Val Ala Ala Ala Arg Arg Ala Phe Glu Arg Pro Glu Trp Ser 50 55 60 Gln Asn Pro Arg Ala Arg Gln Met Val Met Leu Arg Trp Ala Asp Arg 65 70 75 80 Met Glu Ala Gln Ala Asp Gln Leu Ala Arg Leu Leu Thr Leu Glu Asn 85 90 95 Gly Lys Pro Leu Pro Gln Ser Arg Gly Glu Ile Ala Gly Ser Val Ser 100 105 110 Glu Ile Arg Tyr Tyr Ala Gly Leu Thr Arg Tyr Ile Pro Gly His Val 115 120 125 Phe Glu Val Glu Pro Gly Ser Phe Ser Thr Leu Leu Lys Glu Pro Ala 130 135 140 Gly Val Ala Gly Leu Ile Ile Pro Trp Asn Ala Pro Ala Val Leu Leu 145 150 155 160 Ile Arg Ala Leu Thr Pro Ala Leu Ala Ala Gly Cys Thr Val Val Ile 165 170 175 Lys Pro Ala Pro Gln Thr Ala Gln Ile Thr Ala Ala Ile Ile Lys Cys 180 185 190 Leu His Glu Val Asp Gly Leu Pro Arg Gly Val Val Asn Leu Val Ser 195 200 205 Glu Gln Gly His Gln Val Ala Glu His Leu Val Thr Ser Asn Asp Val 210 215 220 Asp Val Ile Ser Phe Thr Gly Ser Asn Ala Thr Gly Ala Arg Ile Met 225 230 235 240 Ala Ala Ala Ala Pro Thr Met Lys Lys Leu Ser Leu Glu Leu Gly Gly 245 250 255 Lys Ser Ala Cys Leu Val Phe Asp Asp Ala Asp Ile Ala Asp Val Ala 260 265 270 Pro Lys Leu Ala Ala Ala Ala Thr Ile Ile Ala Gly Gln Gln Cys Thr 275 280 285 Ala Ala Arg Arg Val Leu Val His Ala Ser Arg Tyr Asp Glu Met Lys 290 295 300 Ala Ala Leu Lys Ala Ala Leu Ala Asn Ile Arg Ile Ala Pro Gly Ser 305 310 315 320 Ala Ala Gly Ala Glu Met Gly Pro Leu Ile Asp Ala Ala Ser Leu Ala 325 330 335 Ala Val Ala Lys Arg Ala Asp Glu Ala Met Gln Ala Ala Asp Glu Val 340 345 350 Val Leu Arg Gly Gly Arg Pro Ala Gly Asp Leu Ala Asn Gly Tyr Phe 355 360 365 Leu Ser Pro Thr Leu Val Ala His Arg Asp Thr Ser Ala Phe Phe Val 370 375 380 Gln Glu Glu Ile Phe Gly Pro Leu Val Val Leu Glu Lys Phe Glu Asp 385 390 395 400 Glu Lys Glu Ala Val Ala Arg Ala Asn His Ser Asp Tyr Gly Leu Ser 405 410 415 Ala Ser Val Trp Thr His Asp Gly Ala Arg Ala Met Arg Val Ala Arg 420 425 430 Ala Leu Arg Asn Gly Thr Val Trp Ile Asn Asp His Asn Lys Leu Phe 435 440 445 Ala Glu Ala Glu Thr Gly Gly Tyr Arg Arg Ser Gly Leu Gly Arg Leu 450 455 460 His Gly Tyr Asp Ala Leu Ile Asp Phe Leu Glu Ile Lys His Val Tyr 465 470 475 480 Gln Ser Cys Gly Val Val 485 <210> 30 <211> 485 <212> PRT <213> Dinoroseobacter shibae DFL 12 <400> 30 Met Thr Thr Thr Asp Leu Ile Ala Arg His Met Ile Gly Gly Ser Tyr 1 5 10 15 Ser Asp Ala Gly Asp Lys Ile Ala Ser Ile Asn Pro Ala Thr Gly Ala 20 25 30 Val Val Gly His Val Arg Ala Asp Gly Ala Ala Gln Ala Thr Ala Ala 35 40 45 Ile Ala Ala Ala Arg Ala Ala Phe Asp Thr Thr Leu Trp Pro Gln Ser 50 55 60 Pro Arg Asp Arg Gln Met Ala Leu Leu Arg Trp Ala Asp Ala Leu Glu 65 70 75 80 Ala Asp Leu Ala Arg Leu Ala Glu Leu Leu Thr Leu Thr Asn Gly Lys 85 90 95 Pro Leu Gly Ala Ser Lys Gly Glu Leu Gly Ala Ala Ile Ser Glu Ile 100 105 110 Arg Tyr Tyr Ala Gly Leu Thr Arg His Asn Pro Gly His Ala Met Glu 115 120 125 Val Ala Pro Gly Glu Leu Ser Val Met Leu Arg Glu Pro Ala Gly Val 130 135 140 Ala Gly Ile Ile Val Pro Trp Asn Ala Pro Ala Val Leu Leu Ile Arg 145 150 155 160 Ser Leu Ala Pro Ala Leu Ala Val Gly Cys Thr Thr Val Thr Lys Pro 165 170 175 Ala Pro Gln Thr Ala Leu Phe Thr Ala Ala Cys Met Ala Pro Leu Phe 180 185 190 Glu Asp Ala Ala Ile Pro Ala Gly Val Val Asn Val Val Phe Glu Val 195 200 205 Gly His Asp Ala Ala Gln Thr Leu Val Thr Ser Pro Asp Val Asp Val 210 215 220 Ile Ser Phe Thr Gly Ser Asn Ala Val Gly Gln Arg Ile Met Ala Asp 225 230 235 240 Ala Ala Pro Thr Met Lys Lys Leu Ser Leu Glu Leu Gly Gly Lys Ser 245 250 255 Cys Cys Ile Val Leu Asp Asp Ala Asp Ile Gly Val Val Ala Pro Lys 260 265 270 Leu Ala Ala Ala Ala Thr Ile Ile Ser Gly Gln Gln Cys Thr Ala Ala 275 280 285 Arg Arg Val Leu Val His Glu Ser Arg Leu Asp Glu Ala Lys Ser Ala 290 295 300 Leu Ser Ala Ala Leu Gln Ala Val Ser Ile Gly Asp Gly Met Ser Asp 305 310 315 320 Gly Thr Ala Met Gly Pro Leu Ile Asp Ile Gln Ser Arg Asp Arg Val 325 330 335 Met Arg Asp Cys Gly Thr Val Tyr Asp Thr Ala Asp Glu Val Val Leu 340 345 350 Arg Gly Gly Pro Leu Asp Gly Pro Lys Gly Ser Ala Phe Met Ser Pro 355 360 365 Ala Leu Val Val His Ser Asp Pro Asn Ala Ser Phe Val Gln Asp Glu 370 375 380 Ile Phe Gly Pro Leu Val Val Leu Glu Thr Phe Arg Asp Glu Ala Asp 385 390 395 400 Ala Val Ala Lys Ala Asn Asn Thr Val Tyr Gly Leu Ser Ala Ser Ile 405 410 415 Trp Thr His Arg Gly Asp Ala Ser Trp Arg Leu Ala Arg Ala Leu Arg 420 425 430 Asn Gly Thr Val Trp Ile Asn Asp His Asn Arg Leu Phe Ala Glu Ala 435 440 445 Glu Thr Gly Gly Tyr Arg Arg Ser Gly Leu Gly Arg Leu His Gly Phe 450 455 460 Asp Gly Leu Leu Asp Phe Cys Glu Leu Lys His Val Tyr Gln Asn Val 465 470 475 480 Gly Val Val Gly His 485 <210> 31 <211> 447 <212> PRT <213> Cupriavidus basilensis <400> 31 Met Glu Ala Val Ala Lys Lys Arg Thr Glu Thr Ile Ser Glu Ala Leu 1 5 10 15 Pro Ala Ala Thr Asn Arg Gln Val Phe Gly Ala Val Thr Ala Ser Cys 20 25 30 Met Gly Trp Ala Leu Asp Leu Phe Asp Leu Phe Ile Leu Leu Phe Val 35 40 45 Ala Pro Val Ile Gly Arg Leu Phe Phe Pro Ser Glu His Ala Met Leu 50 55 60 Ser Leu Ala Ala Val Tyr Ala Ser Phe Ala Val Thr Leu Leu Met Arg 65 70 75 80 Pro Leu Gly Ser Ala Ile Phe Gly Thr Tyr Ala Asp Arg His Gly Arg 85 90 95 Lys Gly Ala Met Val Val Ala Val Thr Gly Val Gly Leu Ser Thr Ala 100 105 110 Ala Phe Gly Leu Leu Pro Thr Val Gly Gln Val Gly Leu Leu Ala Pro 115 120 125 Ala Leu Phe Ile Leu Leu Arg Leu Val Gln Gly Ile Phe Val Gly Gly 130 135 140 Val Val Ala Ser Thr His Thr Ile Gly Thr Glu Ser Val Pro Pro Ser 145 150 155 160 Trp Arg Gly Ala Val Ser Gly Leu Val Gly Gly Gly Gly Ala Gly Ile 165 170 175 Gly Ala Leu Leu Ala Ser Ile Thr Tyr Met Ala Met Thr Ala Leu Phe 180 185 190 Pro Gly Glu Ala Phe Asp Ala Trp Gly Trp Arg Cys Met Phe Phe Ser 195 200 205 Gly Ile Ile Ser Ser Val Leu Gly Leu Phe Ile Phe Asn Ser Leu Glu 210 215 220 Glu Ser Pro Leu Trp Lys Gln Leu Gln Ala Ala Lys Gly His Ala Ala 225 230 235 240 Pro Val Glu Asn Pro Leu Arg Val Ile Phe Ser Arg Gln Tyr Arg Gly 245 250 255 Val Leu Phe Val Asn Ile Leu Leu Thr Val Gly Gly Gly Ser Ala Tyr 260 265 270 Tyr Leu Thr Ser Gly Tyr Leu Pro Thr Phe Leu Lys Val Val Val Lys 275 280 285 Ala Pro Ala Gly Ala Ser Ala Ala Ile Leu Met Ala Ser Ser Val Gly 290 295 300 Val Ile Val Ala Ser Ile Ile Ala Gly His Leu Ser Thr Leu Ile Gly 305 310 315 320 Arg Lys Arg Ala Phe Leu Leu Ile Gly Ala Leu Asn Val Val Leu Leu 325 330 335 Pro Leu Ile Tyr Gln Arg Met Pro Ala Ala Pro Asp Val Thr Thr Leu 340 345 350 Gly Ile Tyr Ala Val Ala Leu Ala Met Leu Gly Ser Thr Gly Phe Ala 355 360 365 Pro Ile Leu Ile Phe Leu Asn Glu Arg Phe Pro Thr Ser Ile Arg Ala 370 375 380 Thr Gly Thr Gly Leu Ser Trp Asn Ile Gly Phe Ala Ile Gly Gly Met 385 390 395 400 Met Pro Thr Phe Ala Ser Leu Cys Ala Ser Thr Pro Ala Asp Leu Pro 405 410 415 Lys Val Leu Gly Ile Phe Val Ala Val Val Thr Ala Ile Tyr Leu Ala 420 425 430 Gly Ala Ala Ile Val Pro Glu Thr Ala Gly Arg Leu Gly Glu Lys 435 440 445 <210> 32 <211> 449 <212> PRT <213> Cupriavidus basilensis <400> 32 Met Glu Ala Val Ala Lys Lys Ser Ala Ala Thr Ile Ser Glu Ala Leu 1 5 10 15 Pro Ala Ala Ser Asn Arg Gln Val Phe Gly Ala Val Ala Ala Ser Cys 20 25 30 Met Gly Trp Ala Leu Asp Leu Phe Asp Leu Phe Ile Leu Leu Phe Val 35 40 45 Ala Pro Val Ile Gly Arg Leu Phe Phe Pro Ser Glu His Ala Met Leu 50 55 60 Ser Leu Ala Ala Val Tyr Ala Ser Phe Ala Val Thr Leu Leu Met Arg 65 70 75 80 Pro Leu Gly Ser Ala Ile Phe Gly Ser Tyr Ala Asp Arg His Gly Arg 85 90 95 Lys Gly Ala Met Val Val Ala Val Thr Gly Val Gly Leu Ser Thr Ala 100 105 110 Ala Phe Gly Leu Leu Pro Thr Val Gly Gln Val Gly Leu Leu Ala Pro 115 120 125 Ala Leu Phe Ile Leu Leu Arg Leu Val Gln Gly Ile Phe Val Gly Gly 130 135 140 Val Val Ala Ser Thr His Thr Ile Gly Thr Glu Ser Val Pro Pro Ser 145 150 155 160 Trp Arg Gly Ala Val Ser Gly Leu Val Gly Gly Gly Gly Ala Gly Leu 165 170 175 Gly Ala Leu Leu Ala Ser Ile Thr Tyr Met Ala Met Thr Ala Leu Phe 180 185 190 Pro Gly Glu Ala Phe Asp Ala Trp Gly Trp Arg Cys Met Phe Phe Ser 195 200 205 Gly Ile Ile Ser Ser Val Leu Gly Leu Phe Ile Phe Asn Ser Leu Glu 210 215 220 Glu Ser Pro Leu Trp Lys Gln Leu Gln Ala Ala Lys Gly His Ala Ala 225 230 235 240 Pro Val Glu Asn Pro Leu Arg Val Ile Phe Ser Arg Gln Tyr Arg Gly 245 250 255 Val Leu Phe Val Asn Ile Leu Leu Thr Val Gly Gly Gly Ser Ala Tyr 260 265 270 Tyr Leu Thr Ser Gly Tyr Leu Pro Thr Phe Leu Lys Val Val Val Lys 275 280 285 Ala Ser Ala Gly Glu Ser Ala Ala Ile Leu Met Ala Ser Ser Leu Gly 290 295 300 Val Ile Val Ala Ser Ile Leu Ala Gly His Leu Ser Thr Met Ile Gly 305 310 315 320 Arg Lys Arg Ala Phe Leu Leu Ile Gly Ala Leu Asn Val Val Val Leu 325 330 335 Pro Leu Leu Tyr Gln Trp Met Pro Ala Ala Pro Asp Thr Thr Thr Leu 340 345 350 Gly Leu Tyr Ala Val Val Leu Ser Met Leu Gly Cys Ser Gly Phe Ala 355 360 365 Pro Ile Leu Ile Phe Leu Asn Glu Arg Phe Pro Thr Ser Ile Arg Ala 370 375 380 Thr Gly Thr Gly Leu Ser Trp Asn Ile Gly Phe Ala Val Gly Gly Met 385 390 395 400 Met Pro Thr Phe Ala Ser Leu Cys Ala Ser Thr Pro Ala Glu Leu Pro 405 410 415 Met Val Leu Gly Ile Phe Leu Ala Val Val Thr Ile Ile Tyr Leu Val 420 425 430 Gly Ala Phe Ile Val Pro Glu Thr Val Gly Arg Leu Gly Asp Asn Gly 435 440 445 Ala <210> 33 <211> 449 <212> PRT <213> Methylobacterium radiotolerans <400> 33 Met Gln Thr Ala Ala Thr Phe Ala Ser Asp Pro Pro Ala Leu Ala Lys 1 5 10 15 Pro Thr Gly Arg Gln Thr Val Thr Ala Ala Met Ala Ser Leu Phe Gly 20 25 30 Trp Gly Leu Asp Leu Phe Asp Leu Phe Ile Leu Leu Tyr Val Ala Pro 35 40 45 Val Val Gly Thr Leu Phe Phe Pro Ala Asp Lys Pro Met Leu Ser Leu 50 55 60 Ala Gly Ala Tyr Ala Ser Phe Ala Val Thr Leu Leu Ile Arg Pro Leu 65 70 75 80 Gly Ser Ala Leu Phe Gly Ser Tyr Ala Asp Arg Phe Gly Arg Arg Arg 85 90 95 Ala Leu Met Val Ala Val Val Gly Val Gly Ile Ser Thr Ala Val Phe 100 105 110 Gly Leu Leu Pro Thr Val Gly Gln Ile Gly Trp Leu Ala Thr Ala Val 115 120 125 Phe Leu Phe Phe Arg Leu Val Gln Gly Ile Phe Val Gly Gly Val Val 130 135 140 Ala Ala Ser His Thr Ile Gly Thr Glu Ser Val Pro Glu Arg Trp Arg 145 150 155 160 Gly Leu Met Ser Gly Ala Val Gly Gly Gly Gly Ser Ala Ile Gly Gly 165 170 175 Leu Leu Ala Ser Leu Val Phe Tyr Val Val Ser Leu Met Ala Pro Gly 180 185 190 Glu Ala Phe Ala Glu Trp Gly Trp Arg Leu Met Phe Phe Ser Gly Leu 195 200 205 Leu Thr Ser Val Ile Gly Leu Ile Leu Phe Arg Asn Leu Glu Glu Ser 210 215 220 Pro Ile Phe Lys Glu Leu Gln Ala Arg Lys Ala Ala Leu Arg Ala Gly 225 230 235 240 Ala Pro Ala Glu Ala Ser Pro Ile Arg Ser Leu Phe Ser Pro Ser Asn 245 250 255 Arg Gly Ser Phe Ala Val Ala Thr Leu Ile Ser Phe Gly Gly Gly Ala 260 265 270 Ala Tyr Tyr Leu Thr Ser Gly Tyr Leu Pro Thr Leu Leu Lys Leu Val 275 280 285 Asn Gly Val Pro Asn Ala Thr Ala Ser Met Ile Leu Ile Gly Ala Asn 290 295 300 Val Ala Ala Ala Ile Gly Ala Cys Gly Met Gly Glu Leu Ser Gln His 305 310 315 320 Ile Gly Arg Lys Arg Ser Phe Leu Leu Met Gly Val Ile Arg Leu Leu 325 330 335 Ala Phe Pro Ala Leu Phe Leu Thr Met Ala Asn Thr Thr Ser Leu Val 340 345 350 Gly Val Ala Ala Cys Ala Phe Leu Leu Ala Leu Ile Ala Asn Gly Ser 355 360 365 Tyr Gly Pro Leu Leu Ile Phe Leu Asn Glu Lys Phe Pro Thr Ala Val 370 375 380 Arg Ala Thr Gly Thr Gly Leu Thr Trp Asn Ile Gly Phe Ala Leu Gly 385 390 395 400 Gly Met Leu Pro Thr Leu Val Ser Leu Val Ala Asp Gly Pro Thr Gln 405 410 415 Ile Pro Met Val Leu Ala Val Ile Thr Thr Gly Val Thr Leu Val Tyr 420 425 430 Leu Val Gly Ala Phe Leu Thr Asp Glu Thr Gln Gly Asn Leu Asp Arg 435 440 445 Ala <210> 34 <211> 443 <212> PRT <213> Sulfolobus acidocaldarius <400> 34 Met Lys Lys Glu Glu Lys Phe Thr Ser Asn His Phe Lys Trp Thr Leu 1 5 10 15 Ala Thr Phe Phe Thr Trp Thr Phe Asp Leu Tyr Asp Leu Phe Thr Ile 20 25 30 Leu Leu Val Ala Pro Tyr Ile Ser Ser Leu Phe Phe Pro Ser Ser Ile 35 40 45 Thr Phe Leu Ser Ile Ala Ala Thr Tyr Ala Gly Phe Ala Thr Ser Leu 50 55 60 Ile Met Arg Pro Val Gly Ala Thr Val Phe Gly Ser Arg Val Ser Asp 65 70 75 80 Lys Val Gly Arg Lys Arg Ala Ile Phe Tyr Gly Leu Ile Gly Leu Val 85 90 95 Ile Thr Ser Thr Leu Gln Gly Ala Leu Pro Thr Tyr Gln Val Val Gly 100 105 110 Val Ile Ala Pro Ile Leu Leu Leu Ala Val Arg Leu Ile Gln Gly Val 115 120 125 Phe Ile Gly Gly Ile Thr Ala Gly Ser His Val Ile Gly Pro Glu Ser 130 135 140 Val Pro Glu Arg Tyr Arg Gly Ile Val Gly Gly Leu Gly Phe Ser Ala 145 150 155 160 Ala Gly Val Ala Tyr Leu Ile Ala Ala Gly Trp Phe Phe Leu Thr Thr 165 170 175 Ile Leu Tyr Pro Gly Ser Ser Tyr Leu Val Trp Gly Trp Arg Val Met 180 185 190 Phe Phe Gly Gly Leu Leu Ser Leu Ala Val Leu Gly Phe Val Asn Tyr 195 200 205 Leu Val Pro Glu Ser Glu Val Trp Thr Lys Ile Lys Lys Arg Gly Ser 210 215 220 Val Val Lys Ser Pro Leu Lys Glu Ile Phe Ser Lys Tyr Arg Tyr Gln 225 230 235 240 Leu Gly Val Ala Leu Leu Leu Ser Ile Gly Trp Gly Ala Ser Phe Tyr 245 250 255 Val Thr Asp Gly Ile Leu Pro Thr Phe Leu Ser Ser Val Asn Lys Leu 260 265 270 Ala Lys Thr Glu Ile Ala Ile Val Met Ile Ile Gly Ser Ile Gly Met 275 280 285 Ser Ile Gly Pro Leu Ile Gly Gly Glu Ile Ser Gln Ile Ile Gly Arg 290 295 300 Lys Ile Thr Ser Leu Ile Gly Ala Ile Ile Val Leu Ala Val Val Gly 305 310 315 320 Pro Leu Phe Leu Ser Leu Gly Ser Leu Lys Ser Gly Asp Leu Asn Gln 325 330 335 Ile Ile Leu His Ser Phe Ala Ile Leu Phe Leu Val Asp Ile Gly Gly 340 345 350 Gly Met Leu Met Thr Tyr Leu Asn Glu Ile Tyr Pro Ala Ser Val Arg 355 360 365 Gly Thr Gly Val Gly Phe Thr Trp Asn Thr Gly Phe Ala Ile Gly Gly 370 375 380 Thr Ile Pro Thr Ile Ile Ser Leu Ala Val Ala Ser Ala Gly Leu Ser 385 390 395 400 Ala Phe Pro Ser Ile Met Phe Tyr Thr Leu Ile Val Val Ser Val Ile 405 410 415 Ile Leu Val Gly Thr Val Leu Thr Lys Glu Thr Lys Gly Thr Ile Ser 420 425 430 Lys Glu Glu Tyr Glu Ile Gln Lys Glu Thr Leu 435 440 <210> 35 <211> 1240 <212> DNA <213> Artificial <220> <223> Synthetic KpnI-NheI fragment for expression of alcohol dehydrogenase of Aneurinibacillus terranovensis <400> 35 ggtaccgaat tccacatgac aaggggagac cgcatgacca ttagtccggc agttaaagcc 60 atcaactttg aattttcatt taacctgccg accctgatcg aatttggtta tggtaaaatg 120 gaaaaattcg gccagcagct gattagcatt ggtgttaaac gcatttttat ggtgaccgat 180 aaaggtgttg aaagcgcagg tctgctggca gcactgaccg attcactgca ggcagcagca 240 attcagtttg atatctatac cgatgtggaa agcgatccga gcctggaaac cattgatcgt 300 ggtgttgaag tttttcagca gaaaccgtat gattgcattg ttgcagttgg tggtggtagc 360 ccgattgata ccgcaaaagg tattcgtgtt gttgcagcaa atggtggtaa tattggtcat 420 tatgccggtg ttaatcagat tccggttgca ccgaccattc cgctgctggc aattccgacc 480 accagtggca ccggtagcga agttaccaat tttggtgttt atagcgattg gcagaacaac 540 gttaaagtta ccgttaccag ccagtatatg gcaccgacaa ttgcatgggt tgatccggca 600 ctgaccatga gcctgcctgc aaaaatgacc gcagcaagcg gtattgatgc actggcacat 660 ggtattgaaa ccttttttag cctgggtagc agtccggcaa gtgatgccct ggcaattgaa 720 gcaattcata ccgttaatcg ttatctgagc cgtgcagttc ataatggtag cgatatggaa 780 gcacgtattg gtatgagcca tggtagcctg ctggctggca tggcatttaa caatggtttt 840 ctgggtctgg cccatgccat tggtagcgca ctgagcggtc attgtcatgt tccgcatggt 900 gttgcaattg gtctgctgct gccgaaagtt gttgaattta atgcaaccgt tcgtccggat 960 aaagcagcaa aaattgcagg tctgatgggt atgaaaggtg aacatagcga agaactggcc 1020 ctgcaggcat caccggcagt tgcacgtctg gttgaagata ttggcctgcc gacacgtctg 1080 cgtgaagttg atgttaccga aaaaaaactg ttcgagatcg ccaaagatag ctttaaaagc 1140 ggcatgatga aattcaatcc gcgtcagccg agcgaaagcg aagttctgca gctgctgaaa 1200 gaaatctttt gaagaccgaa gcgaattcct cgagtctaga 1240 <210> 36 <211> 1205 <212> DNA <213> Artificial <220> <223> Synthetic KpnI-NheI fragment for expression of alcohol dehydrogenase of Brevibacillus thermoruber <400> 36 ggtacctagg aaaggaagat taacccatga gccagaccgt gcagggcacc gacttcgcct 60 tcagcttcca cctgccgacc ctgatcgagt tcggctacgg ccgcgccagc cgcctgggcg 120 agcgcctgca gcacctgggc gtgaccaacg tgttcgtggt gaccgacaag ggcgtggagg 180 ccgccggcct gctgaacggc ctggtgggca gcctgcagag cgccggcatc gccttcgacc 240 tgtacaccga ggtggagccg gacccgggcc tggagaccat cgaccgcggc gccgccgtgt 300 tccgcgccaa gccgtacgac tgcctggtgg ccgtgggcgg cggcagcccg atcgacgccg 360 ccaagggcat gcgcgtggtg accagctgcg gcggcagcat cgccgactac gccggcgtga 420 accgcgtgcc gatggccccg gccgtgccgc tggtggccgt gccgaccacc agcggcaccg 480 gcagcgaggt gaccatgttc ggcgtgtaca gcgactggca caaccacgtg aaggtgaccg 540 tgaccagccc gcacatggcc ccgaccatcg ccctggtgga cccggccctg accgtgagcc 600 tgccggccaa gatgaccgcc gccagcggca tcgacgccct ggcccacggc atcgagacct 660 tcttcagcgt gcgcagccgc ccggccagcg acgccctggc catggaggcc atcgccgccg 720 tgaacgccca cctgcgccgc gccgtgcacg acggcagcga cgtggaggcc cgcatcggca 780 tgagccacgg cagcctgctg gccggcatgg ccttcaccaa cggcttcctg ggcctggccc 840 acgccatcgg cagcgccctg agcggccact gccacgtgcc gcacggcatc gccatcggcc 900 tgctgctgcc gcacgtggtg gccttcaacg ccccggcccg cccggacaag gccgcccagc 960 tggcccgcct gctgggcgtg gaggccaacc cgcgcgagga gcgcggcgag gagaccagcg 1020 ccgccgtggc ccgcatggtg gccgacatcg gcctgccgac ccgcctgcgc gacgtgggcg 1080 tgccggagga gaagctgccg gccatcgcca aggacgcctt caagagcggc atgatgacct 1140 gcaacccgcg ccagccgacc gagcaggagg tgcgcgagct gctgcgccgc gccttctgag 1200 ctagc 1205 <210> 37 <211> 1228 <212> DNA <213> Artificial <220> <223> Synthetic KpnI-NheI fragment for expression of alcohol dehydrogenase of Brevibacillus panacihumi <400> 37 ggtaccgaat tccacatgac aaggggagac cgcatgagcg caaatcagag cgttcagggt 60 attgaaagcc cgtttagctt tcatctgccg accaatgttc agtttggtgt tggtagcgca 120 agccgtctgg gtgaaatgct gctgagcatg ggtgttcgtc gtgtttttct ggttaccgat 180 cagggtgtgc gtcaggcagg tctgctggat gaagttattc atagcctgga agaaaaaggc 240 ctgcactttc agatttatgc agatgttgaa ccggatccga gcctggaaac cattcaggca 300 ggcgcagcaa tgtttcagca gcagagcttt gattgtatgg ttgcaattgg tggtggtagt 360 ccgattgata ccgcaaaagg tattcgtgtt ctggcagcaa atggtggcgg tattggtcag 420 tatgccggtg ttaatcgcgt tccggcagca agcgcaattc cgctgattgc aattccgacc 480 accagtggca ccggtagcga agttaccatt tttggtgttt atagcgattg ggagaaccac 540 gtgaaaatta ccgttaccag tccgcatatg gcaccgagca ccgcactgat tgatccggca 600 ctgaccctga gcctgcctgc aaaaatgacc gcagcaaccg gtattgatgc actggcacat 660 ggcattgaaa ccttttttag cctgcgtagc agtccggcaa gtgatgccct ggcaattcat 720 gcaatgaaaa tgattgcacc gcatctgcgt cgtgcagttc gtgatggtgc agatatggaa 780 gcacgtattg gtatgagcca gggtagcgtg ctggcaggta tggcatttaa caatggtttt 840 ctgggtctgg cccatgccat tggtagtgca ctgagcggtc attgtcatgt tccgcatggt 900 gttgcgattg gcctgctgct gccgcatgtg gttgcattta atacaccggt tcgtccggaa 960 aaagcagaac tgattgccga tgttctgggt agcgttcaga aagaaaccgg caccgcagcc 1020 gaactggttg gtcagctggt tcaggatatt ggtctgccgc agcgtctgca agaagttggc 1080 gttccggaag cgaaactggt tgatattgca aaagatagct ttaaaagcgg catgatgaaa 1140 tggaatccgc gtctgccgac agaacaagaa gttctggaac tgctgcagaa agccttttga 1200 agaccgaagc gaattcctcg agtctaga 1228 <210> 38 <211> 1184 <212> DNA <213> Artificial <220> <223> Synthetic KpnI-NheI fragment for expression of alcohol dehydrogenase of Bacillus sp. FJAT-14578 <400> 38 ggtacctagg aaaggaagat taacccatgt acccgagctt cgagttccac ctgccgacca 60 agatccactt cggctacaac accatcaagc agctggacca cctgccgttc gagatcaagc 120 gcgccttcat cgtgaccgac cagggcgtgc tgaacagcgg cctggtggag aacgtgacca 180 acatcctgaa ggaccaccag atcagctacg tgatctacag cgaggtggag ccggacccga 240 gcgtggagac cgtggacaag gccgcccaga tgttccagcg cgaggaggcc gacgccctga 300 tcgccatcgg cggcggcagc ccgatcgaca ccgccaaggg cgtgcgcgtg atcgccggca 360 acggcggcag catccgcgac tacgccggcg tgaacctgat caagcagaag agcaacatcc 420 cgctgatcgc catcccgacc accagcggca ccggcagcga ggtgaccatc ttcgccgtgt 480 tcagcgactg ggaggagaac cgcaaggtga ccgtgaccag cccgttcctg gccccggaca 540 tcagcatcgt ggacccgaag atgaccatga ccgccccgcc ggccatcacc gccgccagcg 600 gcttcgacgc cttcgcccac ggcgccgaga ccttcgtgag ccgcgccagc cagccggcca 660 gcgacgtgct ggccttcagc gccatgagca ccgtgagcaa gtacctgcgc cgcgccgtgt 720 acaacggcga ggacgtggag gcccgcatca agatggccga ggccagcctg ctggccggca 780 tggccttcaa ccagagctac ctgggcctga cccacgccat cggcagcgcc ctgagcggcc 840 acgcccacgt gagccacggc gtggccatcg gcctgctgct gccgggcgtg atccgctaca 900 acagcatcag ccgcatggac aagcacatcg agatggccgg cgccttccgc gagatcgacc 960 gcagcctgag cgactgggag atcatcgacc agctgatcga ggacgtgagc cgcctgcgcg 1020 acgacatcgg cctgccgcag cgcctgcagc aggtgggcgt gaaggaggac cagctgaaga 1080 tgatcgccgc cgacagcgtg aagagcggca tgtggaagtt caacccgcgc caggccagcg 1140 aggaggagat cctggagctg ctgaaggagc tgtactgagc tagc 1184 <210> 39 <211> 1184 <212> DNA <213> Artificial <220> <223> Synthetic KpnI-NheI fragment for expression of alcohol dehydrogenase of Bacillus sp. L1(2012) <400> 39 ggtacctagg aaaggaagat taacccatgt acaccagctt caacttccac ctgccgaccc 60 gcatccagtt cggctacgag aaggtgaagg agctgaagaa cctgccgttc caggccaacc 120 gcgccttcat cgtgaccgac aagggcgtgg agaaggccgg cctgctgaac gacgtgatcg 180 acgccatcaa gcaggccaac atgacctaca agatctaccg cgacgtggag ccggacccga 240 gcgtggagac cgtggacaag gccgccaagg ccttcgccga ggccgagtgc gacctgctga 300 tcgccgtggg cggcggcagc ccgatcgaca ccgccaaggg cgtgcgcgtg gtggccagca 360 acggcggcag catccgcaac tacagcggcg tgaacctggt gaaggaggcc ccgagcgtgc 420 cgctggtggc catcccgacc accgccggca ccggcagcga ggtgaccatc ttcgccgtgt 480 tcagcgacga caaggagaac cgcaaggtga ccgtgaccag cagccacctg agcccggacg 540 tgagcatcat cgacccgaag ctgaccctga ccgccccgcc gagcatcacc gccgccgccg 600 gcttcgacgc cttcgcccac gccgccgagg ccttcgtgag ccgcatcagc cagccgccga 660 gcgacgccct ggccctgagc gccatgaaga ccgtgcacac ctacctgcgc cgcgccgtgt 720 acaacggcga cgacatcgag gcccgcatga agatggccga ggccagcctg ctggccggca 780 tggccttcaa ccagagctac ctgggcctgg cccacgccat cggcagcgcc atcagcgtgc 840 acgcccacgt gagccacggc gtggtgatcg gcctgctgct gccgaaggtg atcgagtaca 900 acctggtggc caagatcgac aagtacgccg aggccggcaa gtacatcgag cagagcagcc 960 acggcctgag caactacgag gccgccgccc tgttcagcga gaccgtgacc cagctgcgca 1020 acgacatcgg cctgccgaag cagctgcgcg aggtgaacgt gaaggaggcc cagctggagg 1080 ccatcagcaa ggacagcatc aagagcggca tgtggcagtt caacccgcgc cgcgccagcg 1140 agcaggacgt gtaccagatg ctgcgcgaga tgctgtgagc tagc 1184 <210> 40 <211> 27 <212> DNA <213> Artificial <220> <223> ribosome binding site containing spacer no. 2 <400> 40 gaattccaca tgacaagggg agaccgc 27

Claims

5-히드록시메틸-2-푸란카르복실산(HMFCA)을 5-포르밀-2-푸로산(FFA)으로 산화시키는 방법으로서, 상기 방법은 FDVIFCA의 존재하에서 세포를 배양하며, 바람직하게는 상기 세포에 의한 FDVIFCA의 산화에 도움이 되는 조건하에서 세포를 배양하는 단계를 포함하며, 여기서 상기 세포는 SEQ ID NO: 1 내지 11의 아미노산 서열 중 어느 하나와 적어도 45% 동일성을 갖는 아미노산 서열을 갖는 디하이드로게나아제를 코딩하는 뉴클레오티드 서열의 발현을 위한 발현 구조물을 포함하며, 그리고 여기서 상기 발현 구조물은 상기 세포에서 발현가능하며, 상기 디하이드로게나아제의 발현은 상기 발현 구조물이 결여된 이에 상응하는 와일드 타입 세포에 비해, FDVIFCA를 FFA로 산화시키는 능력을 세포에 부여하거나 증가시키는, 5-히드록시메틸-2-푸란카르복실산(HMFCA)을 5-포르밀-2-푸로산(FFA)으로 산화시키는 방법.
FDCA를 생산하는 방법으로서, 상기 방법은 FDCA의 하나 이상의 푸라닉 전구체를 포함하는 배지에서 세포를 배양하며, 바람직하게는 상기 세포에 의한 FDCA의 푸라닉 전구체의 FDCA로의 산화에 도움이 되는 조건하에서 세포를 배양하는 단계, 및 선택적으로 상기 FDCA의 회수를 포함하며, 여기서 상기 세포는 SEQ ID NO: 1 내지 11의 아미노산 서열 중 어느 하나와 적어도 45% 동일성을 갖는 아미노산 서열을 갖는 디하이드로게나아제를 코딩하는 뉴클레오티드 서열의 발현을 위한 발현 구조물을 포함하며, 여기서, 상기 발현 구조물은 상기 세포에서 발현가능하며, 상기 디하이드로게나아제의 발현은 상기 발현 구조물이 결여된 이에 상응하는 와일드 타입 세포에 비해, HMFCA를 FFA로 산화시키는 능력을 세포에 부여하거나 증가시키며,
여기서 바람직하게, FDCA의 적어도 하나의 푸라닉 전구체는 HMF, 2,5-디히드록시메틸 푸란(DHF), HMFCA, FFA 및 2,5-디포르밀 푸란(DFF)으로 구성되는 그룹으로부터 선택되며, 이중에서는 HMF가 가장 바람직하며, 그리고
여기서 바람직하게 FDCA의 푸라닉 전구체는 하나 이상의 헥소스 당으로부터 얻어지며, 바람직하게 리그노셀룰로즈 바이오매스로부터, 바람직하게는 산-촉매화 디하이드로게네이션에 의해 얻어진 하나 이상의 헥소스 당인,
FDCA를 생산하는 방법.
제2항에 있어서,
상기 FDCA는 냉각 결정화 및/또는 용매 추출이 후속하는 산 또는 염 침전을 포함하는 공정에 의해 배지로부터 회수되는, FDCA를 생산하는 방법.
a) 제2항 또는 제3항에 따른 방법으로 FDCA 모노머를 제조하는 단계; 및
b) a)에서 얻어진 FDCA 모노머로부터 폴리머를 제조하는 단계
를 포함하는, 하나 이상의 FDCA 모노머로부터 폴리머를 제조하는 방법.
하나 이상의 푸라닉 전구체를 FDCA로 바이오트랜스포메이션(biotransformation)시키기 위한, 세포의 용도로서,
FDCA의 적어도 하나의 푸라닉 전구체는 HMF, DHF, HMFCA, FFA 및 DFF로 구성되는 그룹으로부터 선택되며, 그 중 HMF가 가장 바람직하며, 여기서 상기 세포는 SEQ ID NO: 1 내지 11의 아미노산 서열 중 어느 하나와 적어도 45% 동일성을 갖는 아미노산 서열을 갖는 디하이드로게나아제를 코딩하는 뉴클레오티드 서열의 발현을 위한 발현 구조물을 포함하며, 그리고 여기서, 상기 발현 구조물은 상기 세포에서 발현가능하며, 상기 디하이드로게나아제의 발현은 상기 발현 구조물이 결여된 이에 상응하는 와일드 타입 세포에 비해, HMFCA를 FFA로 산화시키는 능력을 세포에 부여하거나 증가시키는, 세포의 용도.
SEQ ID NO: 1 내지 11 중 어느 하나의 아미노산 서열과 적어도 45% 동일성을 갖는 아미노산 서열을 갖는 디하이드로게나아제를 코딩하는 뉴클레오티드 서열의 발현을 위한 발현 구조물을 포함하는 세포로서, 여기서, 상기 발현 구조물은 상기 세포에서 발현가능하며, 상기 디하이드로게나아제의 발현은 상기 발현 구조물이 결여된 이에 상응하는 와일드 타입 세포에 비해, HMFCA를 FFA로 산화시키는 능력을 세포에 부여하거나 증가시키며,
그리고 여기서 상기 세포는 다음 중 적어도 하나를 추가로 갖는, 세포.
a) 푸라닉 알데히드를 이에 상응하는 푸라닉 카르복실산으로 산화시키는 알데히드 디하이드로게나아제 활성으로서, 여기서 바람직하게 상기 세포는 SEQ ID NO: 24, 25, 26, 27, 28, 29 및 30 중 어느 하나의 아미노산 서열과 적어도 45% 동일성을 갖는 아미노산 서열을 포함하는 알데히드 디하이드로게나아제를 코딩하는 뉴클레오티드 서열의 발현을 위한 제 2 발현 구조물을 포함하며, 여기서 상기 제 2 발현 구조물은 상기 세포에서 발현가능하고 상기 알데히드 디하이드로게나아제의 발현은 상기 제 2 발현 구조물이 결여된 이에 상응하는 와일드 타입 세포에 비해, i) 5-히드록시메틸푸르푸랄(HMF)을 HMFCA로 산화시키는 것, ii) DFF를 FFA로 산화시키는 것, 및 iii) FFA를 FDCA로 산화시키는 것 중 적어도 하나의 능력을 상기 세포에 부여하거나 증가시킴; 및
b) 상기 세포 내로 및/또는 외로 푸라닉 화합물을 운반하는 능력으로서, 여기서 바람직하게 상기 세포는 적어도 HMFCA를 상기 세포 내로 운반하는 능력을 갖는 폴리펩티드를 코딩하는 뉴클레오티드 서열의 발현을 위한 제 3 발현 구조물을 포함하고, 상기 폴리펩티드는 SEQ ID NO's: 17, 31, 32, 33 및 34 중 어느 하나의 아미노산 서열과 적어도 45% 동일성을 갖는 아미노산 서열을 포함하며, 여기서, 상기 제 3 발현 구조물은 상기 세포에서 발현 가능하며, 상기 폴리펩티드의 발현은 상기 제 3 발현 구조물이 결여된 이에 상응하는 와일드 타입 세포와 비교하여, 상기 세포에 적어도 HMFCA를 운반하는 능력을 상기 세포에 부여하거나 증가시킴.
제6항에 있어서,
상기 세포는 미생물 세포이며, 바람직하게 상기 세포는 칸디다(Candida), 한세눌라(Hansenula), 클루이베로미세스(Kluyveromyces), 피치아(Pichia), 사카로미세스(Saccharomyces), 쉬조사카로미세스(Schizosaccharomyces), 야로위아(Yarrowia), 아크레모늄(Acremonium), 아가리커스(Agaricus), 아스퍼질러스(Aspergillus), 아우레오바시듐(Aureobasidium), 미셀리오프토라(Myceliophthora), 크리소스포륨(Chrysosporium), 코프리너스(Coprinus), 크립토코커스(Cryptococcus), 필리바시듐(Filibasidium), 푸사륨(Fusarium), 휴미콜라(Humicola), 마그나포르테(Magnaporthe), 뮤코르(Mucor), 미셀리오프토라(Myceliophthora), 네오칼리마스틱스(Neocallimastix), 뉴로스포라(Neurospora), 파에실로미세스(Paecilomyces), 페니실리움(Penicillium), 피로미세스(Piromyces), 파네로카에테(Panerochaete), 플레우로터스(Pleurotus), 쉬조필룸(Schizophyllum), 탈라로미세스(Talaromyces), 테르모아스커스(Thermoascus), 티엘라비아(Thielavia), 톨리포클라듐(Tolypocladium), 및 트리코더마(Trichoderma)로 구성되는 그룹의 속으로부터 선택되는 효모 또는 사상균류 세포이며, 보다 바람직하게 클루이베로미세스 락티스(Kluyveromyces lactis), S. 세레비지아에(S. cerevisiae), 한세눌라 폴리모르파(Hansenula polymorpha), 야로위아 리포리티카(Yarrowia lipolytica), 피치아 파스토리스(Pichia pastoris), 아스퍼질러스 나이거(Aspergillus niger), 아스퍼질러스 아와모리(Aspergillus awamori), 아스퍼질러스 포에티더스(Aspergillus foetidus), 아스퍼질러스 소자에(Aspergillus sojae), 아스퍼질러스 푸미가터스(Aspergillus fumigatus), 탈라로미세스 에머르소니(Talaromyces emersonii), 아스퍼질러스 오리자에(Aspergillus oryzae), 미셀리오프토라 테르모필라(Myceliophthora thermophila), 트리코더마 리세이(Trichoderma reesei) 및 페니실리움 크리소게넘(Penicillium chrysogenum)으로 구성되는 그룹의 종으로부터 선택되는 효모 또는 사상균류 세포이며; 또는,
바람직하게 상기 세포는 에쉐리키아(Escherichia), 아나바에나(Anabaena), 아에리바실러스(Aeribacillus), 아네우리니바실러스(Aneurinibacillus), 버콜데리아(Burkholderia), 브래디라이조븀(Bradyrhizobium), 카울로박터(Caulobacter), 큐프리아비더스(Cupriavidus), 데설포토마컬럼(Desulfotomaculum), 데설푸리스포라(Desulfurispora), 글루코노박터(Gluconobacter), 로도박터(Rhodobacter), 펠로토마컬럼(Pelotomaculum), 슈도모나스(Pseudomonas), 파라코커스(Paracoccus), 바실러스(Bacillus), 게오바실러스(Geobacillus), 브레비바실러스(Brevibacillus), 브레비박테리움(Brevibacterium), 코리네박테리움(Corynebacterium), 리조븀(시노히조븀)(Rhizobium(Sinorhizobium)), 플라보박테리움(Flavobacterium), 클렙시엘라(Klebsiella), 엔테로박터(Enterobacter), 락토바실러스(Lactobacillus), 락토코커스(Lactococcus), 메틸로박테리움(Methylobacterium), 랄스토니아(Ralstonia), 로도슈도모나스(Rhodopseudomonas), 스타필로코커스(Staphylococcus) 및 스트렙토미세스(Streptomyces)로 구성되는 그룹의 속으로부터 선택되는 박테리아 세포이며, 보다 바람직하게 A. 팔리더스(A. pallidus), A. 테라노벤시스(A. terranovensis), B. 서브틸리스(B. subtilis), B. 아밀로리쿼파시엔스(B. amyloliquefaciens), B. 코아굴란스(B. coagulans), B. 크리벤시스(B. kribbensis), B. 리체니포르미스(B. licheniformis), B. 펀티스(B. puntis), B. 메가테리움(B. megaterium), B. 할로더란스(B. halodurans), B. 퍼밀러스(B. pumilus), B. 테르모러버(B. thermoruber), B. 파나시후미(B. panacihumi), C. 바실렌시스(C. basilensis), D. 쿠즈네트소비(D. kuznetsovii), D. 테르모필라(D. thermophila), G. 카우스토필러스(G. kaustophilus), 글루코노박터 옥시단스(Gluconobacter oxydans), 카울로박터 크레센터스(Caulobacter crescentus) CB 15, 메틸로박테리움 엑스토르퀀스(Methylobacterium extorquens), 로도박터 스파에로이데스(Rhodobacter sphaeroides), 펠로토마컬럼 테르모프로피오니컴(Pelotomaculum thermopropionicum), 슈도모나스 제아산티니파시엔스(Pseudomonas zeaxanthinifaciens), 슈도모나스 퍼티다(Pseudomonas putida), 파라코커스 데니트리프완스(Paracoccus denitrifwans), E. 콜라이(E. coli), C. 글루타미컴(C. glutamicum), 스타필로코커스 카르노서스(Staphylococcus carnosus), 스트렙토미세스 리비단스(Streptomyces lividans), 시노르히조븀 멜리오티(Sinorhizobium melioti) 및 리조븀 래디오박터(Rhizobium radiobacter)로 구성되는 그룹의 종으로부터 선택된 박테리아 세포인, 세포.
HMFCA 디하이드로게나아제 활성을 갖는 폴리펩티드로서, 상기 폴리펩티드는 SEQ ID NO: 1의 아미노산 서열과 적어도 81.65% 서열 동일성을 갖는 아미노산 서열을 포함하는, 폴리펩티드.
a) 제8항에 정의된 바와 같은 HMFCA 디하이드로게나아제 활성을 갖는 폴리펩티드를 코딩하는 뉴클레오티드 서열;
b) SEQ ID NO: 12 또는 13에 나타낸 뉴클레오티드 서열;
c) 길이가 10, 15, 20, 30, 50 또는 100 뉴클레오티드인 (a) 또는 (b)에 정의된 바와 같은 뉴클레오티드 서열의 프래그먼트;
d) 유전 암호의 축퇴(degeneracy)에 기인하여 b) 또는 c)의 뉴클레오티드 서열의 서열과 상이한 뉴클레오티드 서열; 및
e) a) 내지 d)에서 정의된 뉴클레오티드 서열의 리버스 컴플리먼트(reverse complement)인 뉴클레오타이드 서열
중 적어도 하나를 포함하는 핵산 분자로서, 여기서 바람직하게 상기 핵산 분자는 벡터인, 핵산 분자.
제8항에 정의된 바와 같은 폴리펩티드, 및 제9항에 정의된 바와 같은 핵산 분자 중 적어도 하나를 포함하는 세포로서, 여기서 바람직하게 상기 세포는 배양된 세포인, 세포.
적어도 HMFCA를 세포 내로 운반하는 능력을 갖는 폴리펩티드를 코딩하는 뉴클레오티드 서열의 발현을 위한 발현 구조물을 포함하는 세포로서, 상기 폴리펩티드는 SEQ ID NO: 17의 아미노산 서열과 적어도 86.5% 동일성을 갖는 아미노산 서열을 포함하며, 여기서 상기 발현 구조물은 상기 세포에서 발현가능하고, 상기 폴리펩티드의 발현은 상기 발현 구조물이 결여된 이에 상응하는 와일드 타입 세포에 비해, 상기 세포 내에서 적어도 HMFCA를 상기 세포 내로 운반하는 능력을 상기 세포에 부여하거나 증가시키며, 그리고 여기서 상기 세포는 추가로 HMF를 FDCA로 전환시키는 효소를 포함하며, 여기서 HMF를 FDCA로 전환시키는 효소는 바람직하게 a) 및 b) 중 적어도 하나를 포함하는, 세포.
a) HMFCA를 FFA로 산화시키는 알코올 디하이드로게나아제 및 푸라닉 알데히드를 이에 상응하는 푸라닉 카르복실산으로 산화시키는 알데히드 디하이드로게나아제 활성; 및
b) HMF, 2,5-디히드록시메틸 푸란, FDVIFCA, FFA 및 2,5-디포르밀 푸란 중 하나 이상을 FDCA로 산화시키는 산화 환원 효소 및 선택적으로 푸라닉 알데히드를 이에 상응하는 푸라닉 카르복실산으로 산화시키는 알데히드 디하이드로게나아제 활성.
제11항에 있어서,
상기 세포는 미생물 세포이며, 바람직하게 상기 세포는 칸디다(Candida), 한세눌라(Hansenula), 클루이베로미세스(Kluyveromyces), 피치아(Pichia), 사카로미세스(Saccharomyces), 쉬조사카로미세스(Schizosaccharomyces), 야로위아(Yarrowia), 아크레모늄(Acremonium), 아가리커스(Agaricus), 아스퍼질러스(Aspergillus), 아우레오바시듐(Aureobasidium), 미셀리오프토라(Myceliophthora), 크리소스포륨(Chrysosporium), 코프리너스(Coprinus), 크립토코커스(Cryptococcus), 필리바시듐(Filibasidium), 푸사륨(Fusarium), 휴미콜라(Humicola), 마그나포르테(Magnaporthe), 뮤코르(Mucor), 미셀리오프토라(Myceliophthora), 네오칼리마스틱스(Neocallimastix), 뉴로스포라(Neurospora), 파에실로미세스(Paecilomyces), 페니실리움(Penicillium), 피로미세스(Piromyces), 파네로카에테(Panerochaete), 플레우로터스(Pleurotus), 쉬조필룸(Schizophyllum), 탈라로미세스(Talaromyces), 테르모아스커스(Thermoascus), 티엘라비아(Thielavia), 톨리포클라듐(Tolypocladium), 및 트리코더마(Trichoderma)로 구성되는 그룹의 속으로부터 선택되는 효모 또는 사상균류 세포이며, 보다 바람직하게 클루이베로미세스 락티스(Kluyveromyces lactis), S. 세레비지아에(S. cerevisiae), 한세눌라 폴리모르파(Hansenula polymorpha), 야로위아 리포리티카(Yarrowia lipolytica), 피치아 파스토리스(Pichia pastoris), 아스퍼질러스 나이거(Aspergillus niger), 아스퍼질러스 아와모리(Aspergillus awamori), 아스퍼질러스 포에티더스(Aspergillus foetidus), 아스퍼질러스 소자에(Aspergillus sojae), 아스퍼질러스 푸미가터스(Aspergillus fumigatus), 탈라로미세스 에머르소니(Talaromyces emersonii), 아스퍼질러스 오리자에(Aspergillus oryzae), 미셀리오프토라 테르모필라(Myceliophthora thermophila), 트리코더마 리세이(Trichoderma reesei) 및 페니실리움 크리소게넘(Penicillium chrysogenum)으로 구성되는 그룹의 종으로부터 선택되는 효모 또는 사상균류 세포이며; 또는,
바람직하게 상기 세포는 에쉐리키아(Escherichia), 아나바에나(Anabaena), 아에리바실러스(Aeribacillus), 아네우리니바실러스(Aneurinibacillus), 버콜데리아(Burkholderia), 브래디라이조븀(Bradyrhizobium), 카울로박터(Caulobacter), 큐프리아비더스(Cupriavidus), 데설포토마컬럼(Desulfotomaculum), 데설푸리스포라(Desulfurispora), 글루코노박터(Gluconobacter), 로도박터(Rhodobacter), 펠로토마컬럼(Pelotomaculum), 슈도모나스(Pseudomonas), 파라코커스(Paracoccus), 바실러스(Bacillus), 게오바실러스(Geobacillus), 브레비바실러스(Brevibacillus), 브레비박테리움(Brevibacterium), 코리네박테리움(Corynebacterium), 리조븀(시노히조븀)(Rhizobium(Sinorhizobium)), 플라보박테리움(Flavobacterium), 클렙시엘라(Klebsiella), 엔테로박터(Enterobacter), 락토바실러스(Lactobacillus), 락토코커스(Lactococcus), 메틸로박테리움(Methylobacterium), 랄스토니아(Ralstonia), 로도슈도모나스(Rhodopseudomonas), 스타필로코커스(Staphylococcus) 및 스트렙토미세스(Streptomyces)로 구성되는 그룹의 속으로부터 선택되는 박테리아 세포이며, 보다 바람직하게 A. 팔리더스(A. pallidus), A. 테라노벤시스(A. terranovensis), B. 서브틸리스(B. subtilis), B. 아밀로리쿼파시엔스(B. amyloliquefaciens), B. 코아굴란스(B. coagulans), B. 크리벤시스(B. kribbensis), B. 리체니포르미스(B. licheniformis), B. 펀티스(B. puntis), B. 메가테리움(B. megaterium), B. 할로더란스(B. halodurans), B. 퍼밀러스(B. pumilus), B. 테르모러버(B. thermoruber), B. 파나시후미(B. panacihumi), C. 바실렌시스(C. basilensis), D. 쿠즈네트소비(D. kuznetsovii), D. 테르모필라(D. thermophila), G. 카우스토필러스(G. kaustophilus), 글루코노박터 옥시단스(Gluconobacter oxydans), 카울로박터 크레센터스(Caulobacter crescentus) CB 15, 메틸로박테리움 엑스토르퀀스(Methylobacterium extorquens), 로도박터 스파에로이데스(Rhodobacter sphaeroides), 펠로토마컬럼 테르모프로피오니컴(Pelotomaculum thermopropionicum), 슈도모나스 제아산티니파시엔스(Pseudomonas zeaxanthinifaciens), 슈도모나스 퍼티다(Pseudomonas putida), 파라코커스 데니트리프완스(Paracoccus denitrifwans), E. 콜라이(E. coli), C. 글루타미컴(C. glutamicum), 스타필로코커스 카르노서스(Staphylococcus carnosus), 스트렙토미세스 리비단스(Streptomyces lividans), 시노르히조븀 멜리오티(Sinorhizobium melioti) 및 리조븀 래디오박터(Rhizobium radiobacter)로 구성되는 그룹의 종으로부터 선택된 박테리아 세포인, 세포.
적어도 HMFCA를 세포 내로 운반하는 능력을 갖는 폴리펩티드로서, 상기 폴리펩티드는 SEQ ID NO: 17의 아미노산 서열과 적어도 86.5% 서열 동일성을 갖는 아미노산 서열을 포함하는, 폴리펩티드.
a) 제13항에 정의된 바와 같은, 적어도 HMFCA를 세포 내로 운반하는 능력을 갖는 폴리펩티드를 코딩하는 뉴클레오티드 서열;
b) SEQ ID NO: 18에 나타낸 뉴클레오티드 서열;
c) 길이가 10, 15, 20, 30, 50 또는 100 뉴클레오티드인 (a) 또는 (b)에 정의된 바와 같은 뉴클레오티드 서열의 프래그먼트;
d) 유전 암호의 축퇴(degeneracy)에 기인하여 b) 또는 c)의 뉴클레오티드 서열의 서열과 상이한 뉴클레오티드 서열; 및
e) a) 내지 d)에서 정의된 뉴클레오티드 서열의 리버스 컴플리먼트(reverse complement)인 뉴클레오타이드 서열
중 적어도 하나를 포함하는 핵산 분자로서, 여기서 바람직하게 상기 핵산 분자는 벡터인, 핵산 분자.
제13항에 정의된 바와 같은 폴리펩티드, 및 제14항에 정의된 바와 같은 핵산 분자 중 적어도 하나를 포함하는 세포로서, 여기서 바람직하게 상기 세포는 배양된 세포인, 세포.