KR20170116051A - Fdca의 디하이드로게나아제-촉매화 생산 - Google Patents
Fdca의 디하이드로게나아제-촉매화 생산 Download PDFInfo
- Publication number
- KR20170116051A KR20170116051A KR1020177022848A KR20177022848A KR20170116051A KR 20170116051 A KR20170116051 A KR 20170116051A KR 1020177022848 A KR1020177022848 A KR 1020177022848A KR 20177022848 A KR20177022848 A KR 20177022848A KR 20170116051 A KR20170116051 A KR 20170116051A
- Authority
- KR
- South Korea
- Prior art keywords
- ala
- leu
- gly
- val
- ser
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P17/00—Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
- C12P17/02—Oxygen as only ring hetero atoms
- C12P17/04—Oxygen as only ring hetero atoms containing a five-membered hetero ring, e.g. griseofulvin, vitamin C
-
- C—CHEMISTRY; METALLURGY
- C08—ORGANIC MACROMOLECULAR COMPOUNDS; THEIR PREPARATION OR CHEMICAL WORKING-UP; COMPOSITIONS BASED THEREON
- C08G—MACROMOLECULAR COMPOUNDS OBTAINED OTHERWISE THAN BY REACTIONS ONLY INVOLVING UNSATURATED CARBON-TO-CARBON BONDS
- C08G63/00—Macromolecular compounds obtained by reactions forming a carboxylic ester link in the main chain of the macromolecule
- C08G63/02—Polyesters derived from hydroxycarboxylic acids or from polycarboxylic acids and polyhydroxy compounds
- C08G63/12—Polyesters derived from hydroxycarboxylic acids or from polycarboxylic acids and polyhydroxy compounds derived from polycarboxylic acids and polyhydroxy compounds
- C08G63/16—Dicarboxylic acids and dihydroxy compounds
- C08G63/18—Dicarboxylic acids and dihydroxy compounds the acids or hydroxy compounds containing carbocyclic rings
- C08G63/181—Acids containing aromatic rings
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0008—Oxidoreductases (1.) acting on the aldehyde or oxo group of donors (1.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0012—Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7)
- C12N9/0014—Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on the CH-NH2 group of donors (1.4)
- C12N9/0016—Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on the CH-NH2 group of donors (1.4) with NAD or NADP as acceptor (1.4.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y101/00—Oxidoreductases acting on the CH-OH group of donors (1.1)
- C12Y101/01—Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
- C12Y101/01001—Alcohol dehydrogenase (1.1.1.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y102/00—Oxidoreductases acting on the aldehyde or oxo group of donors (1.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y102/00—Oxidoreductases acting on the aldehyde or oxo group of donors (1.2)
- C12Y102/01—Oxidoreductases acting on the aldehyde or oxo group of donors (1.2) with NAD+ or NADP+ as acceptor (1.2.1)
- C12Y102/01003—Aldehyde dehydrogenase (NAD+) (1.2.1.3)
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Genetics & Genomics (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Biotechnology (AREA)
- Medicinal Chemistry (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Polymers & Plastics (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Enzymes And Modification Thereof (AREA)
- Furan Compounds (AREA)
- Peptides Or Proteins (AREA)
Abstract
본 발명은 푸라닉 화합물 운반 역량을 갖는 폴리펩티드를 발현하는 세포뿐만 아니라 5-히드록시메틸-2-푸란카르복실산 디하이드로게나아제 활성을 갖는 폴리펩티드를 발현하는 세포에 관한 것이다. 또한, 본 발명은 2,5-푸란-디카르복실산(FDCA)의 제조방법에 관한 것으로, 여기서 본 발명의 세포는 FDCA의 푸라닉 전구체의 산화에 사용된다.
Description
본 발명은 효소학, 분자 유전학, 바이오트랜스포메이션(biotransformation) 및 발효 기술 분야에 관한 것이다. 특히, 본 발명은 5-(히드록시메틸)-2-푸로산(5-(hydroxymethyl)-2-furoic acid)을 5-포르밀-2-푸로산으로 산화시키는 디하이드로게나아제, 및 상기 디하이드로게나아제를 코딩하는 폴리뉴클레오티드 및 히드록시메틸푸르푸랄의 2,5-푸란디카르복실산으로의 바이오트랜스포메이션에 사용하는 이들의 용도에 관한 것이다.
2,5- 푸란디카르복실산(FDCA)은 엄청난 경제적 영향을 미치는 폴리에스테르의 생산에 적용할 수 있는 모노머 화합물이다. 당해 분야에서 매우 중요한 화합물은 테레프탈산(PTA) 및 에틸렌 글리콜로부터 생산된 폴리에틸렌테레프탈레이트(PET)이다. FDCA는 폴리에스터 PET에서 PTA를 대체할 수 있으며, 폴리에틸렌푸란디카르복실레이트(PEF)가 생성된다. PEF는 대형 폴리에스테르 시장에서 PET를 대체할 수 있는 좋은 잠재력을 가지고 있다. PET와 비교하여 우수한 특성을 지닐뿐만 아니라 재생가능 원료에서 유도될 수 있기 때문이다. FDCA는 화학적으로 당으로부터 생산되거나(De Jong et al.. 2012. In: Biobased Monomers, Polymers and Materials, Smith, P., et al., ACS 심포지엄 시리즈, American Chemical Society: Washington DC) 또는 복합 화학-생물학적 경로((Wiercks et al 2011, Appl Microbiol Biotechnol 92: 1095-1105)로 생산될 수 있다. 후자의 경우 글루코오스나 프룩토즈와 같은 단당을 효소에 의해 FDCA로 산화될 수 있는 5-(히드록시메틸)-2-푸르알데히드(HMF)로 화학적으로 변형시킨다.
HMF로부터 FDCA를 생산하기 위한 생물학적 경로는 쿠프리아비더스 바실렌시스(Cupriavidus basilensis) HMF14의 HMF 분해 균주의 분리를 기반으로 개발되었다(Wierckx et al., 2010. Microbial Technology 3: 336-343). C. 바질렌시스(C. basilensis) HMF14에서 HMF 분해 경로에 관여하는 효소를 코딩하는 유전자 클러스터가 확인되었고, 슈도모나스 푸티다(Pseudomonas putida) 균주에서 관련 유전자가 이형적으로 발현되어(Koopman et al., 2010, PNAS 107: 4919-4924), 이로 인해 HMF를 대사하는 능력을 얻었다. 분해 경로의 첫 번째 산화 단계는 5-(히드록시메틸)-2-푸로산(HMFCA)의 형성을 포함하며, 이는 그 다음 5-포르밀 2-푸로산(FFA)으로 그리고 FDCA로 더욱 산화된다. 후속 작업(Koopman et al., 2010, Bioresource Technology 101: 6291-6296 및 WO 2011/026913)에서 효소 HMF 산화 환원 효소를 코딩하는 C. 바실렌시스(C. basilensis) HMF14의 hmfli 유전자만 P. 푸티다(P. putida)에 도입되었다. 산화 환원 효소는 주로 HMFCA에서 산화 효소로 작용하지만 HMF 또는 FFA를 산화시킬 수도 있다. hmfli 유전자만의 이종 발현은 P. 푸티다(P. putida)가 HMF로부터 FDCA를 생산할 수 있게 한다. 추가의 최적화 작업(Wierckx et al., 2011, supra; 및 WO 2012/064195)에서, HMFCA 운반체를 코딩하는 P. 푸티다(P. putida) 및 알려지지 않은 특이성을 갖는 알데히드 디하이드로게나아제를 코딩하는 P. 푸티다(P. putida)에서 2개의 추가 유전자가 각각 발현되었다.
그러나, HMF로부터 FDCA를 생산하기 위한 산화 효소 - 촉매화 경로는 디하이드로게나아제 - 촉매화 경로와 비교하여 몇 가지 고유한 단점을 가지며, 이는 적어도 독성 H2O2의 생성, 산화 단계로부터의 에너지 이득의 부족, O2에 대한 빈약한 친화도, 및 상기 시스템의 관련된 높은 산소 요구량을 포함한다. 따라서, 본 발명의 목적은 HMF와 같은 푸라닉 전구체로부터 FDCA를 생산하기 위한 신규한 디하이드로게나아제 촉매화 경로에 대한 수단 및 방법을 제공함으로써, 그리고 이러한 방법에서 신규한 HMFCA 운반체를 사용하기 위한 수단 및 방법을 제공함으로써 이러한 단점을 해결하는 것이다.
제 1 견지로, 본 발명은 SEQ ID NO: 1 내지 11의 아미노산 서열 중 어느 하나와 적어도 45% 동일성을 갖는 아미노산 서열을 갖는 디하이드로게나아제를 코딩하는 뉴클레오티드 서열의 발현을 위한 발현 구조물을 포함하는 세포에 관한 것으로, 상기 발현 구조물은 상기 세포에서 발현가능하며, 디하이드로게나아제의 발현은 상기 발현 구조물이 결여된 이에 상응하는 와일드 타입 세포에 비해, 5-히드록시메틸-2-푸란 카르복실산(HMFCA)을 5-포르밀-2-푸로산(FFA)으로 산화시키는 능력을 세포에 부여하거나 증가시킨다. 바람직하게, 상기 세포는 추가로 a) 및 b)를 갖는다: a) 푸라닉 알데히드를 이에 상응하는 푸라닉 카르복실산으로 산화시키는 알데히드 디하이드로게나아제 활성을 가지며, 여기서 바람직하게 상기 세포는 SEQ ID NO's: 24, 25, 26, 27, 28, 29 및 30 중 어느 하나의 아미노산 서열과 적어도 45% 동일성을 갖는 아미노산 서열을 포함하는 알데히드 디하이드로게나아제를 코딩하는 뉴클레오티드 서열의 발현을 위한 제 2 발현 구조물을 포함하며, 여기서 상기 제 2 발현 구조물은 상기 세포에서 발현가능하고 상기 알데히드 디하이드로게나아제의 발현은 상기 제 2 발현 구조물이 결여된 이에 상응하는 와일드 타입 세포에 비해, i) 5-히드록시메틸푸르푸랄(HMF)을 HMFCA로 산화시키는 것, ii) DFF를 FFA로 산화시키는 것, 및 iii) FFA를 FDCA로 산화시키는 것 중 적어도 하나의 능력을 상기 세포에 부여하거나 증가시킴; 및 b) 상기 세포 내로 및/또는 외로 푸라닉 화합물을 운반하는 능력, 여기서 바람직하게 상기 세포는 적어도 FDVIFCA를 세포 내로 수송하는 능력을 갖는 폴리펩티드를 코딩하는 뉴클레오티드 서열의 발현을 위한 제 3 발현 구조물을 포함하고, 상기 폴리펩티드는 SEQ ID NO's: 17, 31, 32, 33 및 34의 아미노산 서열 중 어느 하나와 적어도 45% 동일성을 갖는 아미노산 서열을 포함하며, 여기서 상기 제 3 발현 구조물은 상기 세포에서 발현 가능하며, 상기 폴리펩티드의 발현은 상기 제 3 발현 구조물이 결여된 이에 상응하는 와일드 타입 세포와 비교하여, 상기 세포에 적어도 FDVIFCA를 수송하는 능력을 상기 세포에 부여하거나 증가시킨다.
다른 견지로, 본 발명은 적어도 HMFCA를 세포 내로 수송하는 능력을 갖는 폴리펩티드를 코딩하는 뉴클레오티드 서열의 발현을 위한 발현 구조물을 포함하는 세포에 관한 것으로, 상기 폴리펩티드는 SEQ ID NO: 17의 아미노산 서열과 적어도 86.5% 동일성을 갖는 아미노산 서열을 포함하며, 여기서 상기 발현 구조물은 상기 세포에서 발현가능하고, 상기 폴리펩티드의 발현은 상기 발현 구조물이 결여된 이에 상응하는 와일드 타입 세포에 비해, 상기 세포 내에서 적어도 HMFCA를 세포 내로 운반하는 능력을 세포에 부여하거나 증가시키며, 여기서 상기 세포는 추가로 HMF를 FDCA로 전환시키는 효소를 포함하며, 여기서 HMF를 FDCA로 전환시키는 효소는 바람직하게 a) 및 b) 중 적어도 하나를 포함한다: a) HMFCA를 FFA로 산화시키는 알코올 디하이드로게나아제 및 푸라닉 알데히드를 이에 상응하는 푸라닉 카르복실산으로 산화시키는 알데히드 디하이드로게나아제 활성; 및 b) HMF, 2,5-디히드록시메틸 푸란, HMFCA, FFA 및 2,5-디포르밀 푸란 중 하나 이상을 FDCA로 산화시키는 산화 환원 효소 및 선택적으로 푸라닉 알데히드를 이에 상응하는 푸라닉 카르복실산으로 산화시키는 알데히드 디하이드로게나아제 활성.
본 발명에 따른 세포는 박테리아, 효모 또는 사상균류 세포와 같은 미생물 세포인 것이 바람직하다. 본 발명의 효모 또는 사상균류 세포는 바람직하게는 칸디다(Candida), 한세눌라(Hansenula), 클루이베로미세스(Kluyveromyces), 피치아(Pichia), 사카로미세스(Saccharomyces), 쉬조사카로미세스(Schizosaccharomyces), 야로위아(Yarrowia), 아크레모늄(Acremonium), 아가리커스(Agaricus), 아스퍼질러스(Aspergillus), 아우레오바시듐(Aureobasidium), 미셀리오프토라(Myceliophthora), 크리소스포륨(Chrysosporium), 코프리너스(Coprinus), 크립토코커스(Cryptococcus), 필리바시듐(Filibasidium), 푸사륨(Fusarium), 휴미콜라(Humicola), 마그나포르테(Magnaporthe), 뮤코르(Mucor), 미셀리오프토라(Myceliophthora), 네오칼리마스틱스(Neocallimastix), 뉴로스포라(Neurospora), 파에실로미세스(Paecilomyces), 페니실리움(Penicillium), 피로미세스(Piromyces), 파네로카에테(Panerochaete), 플레우로터스(Pleurotus), 쉬조필룸(Schizophyllum), 탈라로미세스(Talaromyces), 테르모아스커스(Thermoascus), 티엘라비아(Thielavia), 톨리포클라듐(Tolypocladium), 및 트리코더마(Trichoderma)로 구성되는 그룹의 속으로부터 선택되며, 가장 바람직하게 클루이베로미세스 락티스(Kluyveromyces lactis), S. 세레비지아에(S. cerevisiae), 한세눌라 폴리모르파(Hansenula polymorpha), 야로위아 리포리티카(Yarrowia lipolytica), 피치아 파스토리스(Pichia pastoris), 아스퍼질러스 나이거(Aspergillus niger), 아스퍼질러스 아와모리(Aspergillus awamori), 아스퍼질러스 포에티더스(Aspergillus foetidus), 아스퍼질러스 소자에(Aspergillus sojae), 아스퍼질러스 푸미가터스(Aspergillus fumigatus), 탈라로미세스 에머르소니(Talaromyces emersonii), 아스퍼질러스 오리자에(Aspergillus oryzae), 미셀리오프토라 테르모필라(Myceliophthora thermophila), 트리코더마 리세이(Trichoderma reesei) 및 페니실리움 크리소게넘(Penicillium chrysogenum)으로 구성되는 그룹의 종으로부터 선택된 효모 또는 사상균류 세포이다. 본 발명의 박테리아 세포는 에쉐리키아(Escherichia), 아나바에나(Anabaena), 아에리바실러스(Aeribacillus), 아네우리니바실러스(Aneurinibacillus), 버콜데리아(Burkholderia), 브래디라이조븀(Bradyrhizobium), 카울로박터(Caulobacter), 큐프리아비더스(Cupriavidus), 데설포토마컬럼(Desulfotomaculum), 데설푸리스포라(Desulfurispora), 글루코노박터(Gluconobacter), 로도박터(Rhodobacter), 펠로토마컬럼(Pelotomaculum), 슈도모나스(Pseudomonas), 파라코커스(Paracoccus), 바실러스(Bacillus), 게오바실러스(Geobacillus), 브레비바실러스(Brevibacillus), 브레비박테리움(Brevibacterium), 코리네박테리움(Corynebacterium), 리조븀 (시노히조븀)(Rhizobium (Sinorhizobium)), 플라보박테리움(Flavobacterium), 클렙시엘라(Klebsiella), 엔테로박터(Enterobacter), 락토바실러스(Lactobacillus), 락토코커스(Lactococcus), 메틸로박테리움(Methylobacterium), 랄스토니아(Ralstonia), 로도슈도모나스(Rhodopseudomonas), 스타필로코커스(Staphylococcus) 및 스트렙토미세스(Streptomyces)로 구성되는 그룹의 속으로부터 선택되며, 보다 바람직하게 A. 팔리더스(A. pallidus), A. 테라노벤시스(A. terranovensis), B. 서브틸리스(B. subtilis), B. 아밀로리쿼파시엔스(B. amyloliquefaciens), B. 코아굴란스(B. coagulans), B. 크리벤시스(B. kribbensis), B. 리체니포르미스(B. licheniformis), B. 펀티스(B. puntis), B. 메가테리움(B. megaterium), B. 할로더란스(B. halodurans), B. 퍼밀러스(B. pumilus), B. 테르모러버(B. thermoruber), B. 파나시후미(B. panacihumi), C. 바실렌시스(C. basilensis), D. 쿠즈네트소비(D. kuznetsovii), D. 테르모필라(D. thermophila), G. 카우스토필러스(G. kaustophilus), 글루코노박터 옥시단스(Gluconobacter oxydans), 카울로박터 크레센터스(Caulobacter crescentus) CB 15, 메틸로박테리움 엑스토르퀀스(Methylobacterium extorquens), 로도박터 스파에로이데스(Rhodobacter sphaeroides), 펠로토마컬럼 테르모프로피오니컴(Pelotomaculum thermopropionicum), 슈도모나스 제아산티니파시엔스(Pseudomonas zeaxanthinifaciens), 슈도모나스 퍼티다(Pseudomonas putida), 파라코커스 데니트리피칸스(Paracoccus denitrificans), E. 콜라이(E. coli), C. 글루타미컴(C. glutamicum), 스타필로코커스 카르노서스(Staphylococcus carnosus), 스트렙토미세스 리비단스(Streptomyces lividans), 시노르히조븀 멜리오티(Sinorhizobium melioti) 및 리조븀 래디오박터(Rhizobium radiobacter)로 구성되는 그룹의 종으로부터 선택된 박테리아 세포이다.
다른 견지로, 본 발명은 상기 견지에서 정의된 바와 같은 HMFCA 디하이드로게나아제 활성을 갖는 폴리펩티드를 제조하는 방법, 및/또는 상기 견지에서 정의된 푸라닉 화합물 운반 능력을 갖는 폴리펩티드를 제조하는 방법에 관한 것이다. 상기 방법은 바람직하게 상기 견지에서 정의된 바와 같은 세포를 상기 폴리펩티드(들)의 발현에 도움이 되는 조건하에 배양하고, 선택적으로 상기 폴리펩티드(들)를 회수하는 단계를 포함한다.
또 다른 견지로, 본 발명은 HMFCA를 FFA로 산화시키는 방법에 관한 것으로, 상기 방법은 HMFCA의 존재하에, 바람직하게는 상기 세포에 의해 HMFCA의 산화에 도움이 되는 조건하에 상기 견지들 중 어느 하나에 따른 세포를 배양하는 단계를 포함한다.
또 다른 견지로, 본 발명은 FDCA를 생산하는 방법에 관한 것으로, 상기 방법은 FDCA의 하나 이상의 푸라닉 전구체를 포함하는 배지에서, 바람직하게는 상기 세포에 의한 FDCA의 푸라닉 전구체의 FDCA로의 산화에 도움이 되는 조건하에서 상기 견지들 중 어느 하나에 따른 세포를 배양하는 단계, 및 선택적으로 상기 FDCA의 회수를 포함하며, 여기서 바람직하게, FDCA의 적어도 하나의 푸라닉 전구체는 HMF, 2,5-디히드록시메틸 푸란(DHF, 또는 HMF-OH), HMFCA, FFA 및 2,5-디포르밀 푸란(DFF)으로 구성되는 그룹으로부터 선택되며, 이중에서는 HMF가 가장 바람직하며, 여기서 FDCA의 푸라닉 전구체는 하나 이상의 헥소스 당으로부터 얻어지며, 바람직하게 리그노셀룰로즈 바이오매스로부터, 바람직하게는 산-촉매화 디하이드로게네이션에 의해 얻어진 하나 이상의 헥소스 당이며, 그리고 여기서 바람직하게 상기 FDCA는 냉각 결정화 및/또는 용매 추출이 후속하는 산 또는 염 침전을 포함하는 공정에 의해 배지로부터 회수된다.
추가의 견지로, 본 발명은 하나 이상의 FDCA 모노머로부터 폴리머를 제조하는 방법에 관한 것으로, 상기 방법은 a) 상기 견지에 따른 방법으로 FDCA 모노머를 제조하는 단계; 및 a)에서 얻어진 FDCA로부터 폴리머를 생산하는 단계를 포함한다.
또한, 본 발명은 FDCA에 대한 하나 이상의 푸라닉 전구체를 FDCA로 바이오트랜스포메이션(biotransformation)시키기 위한, 상기 견지들 중 어느 하나에 따른 세포의 용도에 관한 것으로, 여기서 바람직하게, FDCA의 적어도 하나의 푸라닉 전구체는 HMF, DHF, HMFCA, FFA 및 DFF로 구성되는 그룹으로부터 선택되며, 그 중 HMF가 가장 바람직하다.
다른 일 견지로, 본 발명은 SEQ ID NO:1의 아미노산 서열과 적어도 81.85% 서열 동일성을 갖는 아미노산 서열을 포함하는 HMFCA 디하이드로게나아제 활성을 갖는 폴리펩티드에 관한 것이다. 이 견지에서, 본 발명은 또한 a) HMFCA 디하이드로게나아제 활성을 갖는 폴리펩티드를 코딩하는 뉴클레오티드 서열로서, 여기서 폴리펩티드는 SEQ ID NO:1의 아미노산 서열과 적어도 81.85% 서열 동일성을 갖는 아미노산 서열을 포함하는 뉴클레오티드 서열; b) SEQ ID NO: 12 또는 13에 나타낸 뉴클레오티드 서열; c) 길이가 10, 15, 20, 30, 50 또는 100 뉴클레오티드인 (a) 또는 (b)에 정의된 바와 같은 뉴클레오티드 서열의 프래그먼트; d) 유전 암호의 축퇴(degeneracy)에 기인하여 b) 또는 c)의 뉴클레오티드 서열의 서열과 상이한 뉴클레오티드 서열; 및 e) a) 내지 c)에서 정의된 뉴클레오티드 서열의 리버스 컴플리먼트(reverse complement)인 뉴클레오타이드 서열 중 적어도 하나를 포함하며, 여기서 바람직하게 핵산 분자는 벡터이다. 이 견지에서, 본 발명은 또한 이 견지의 폴리펩티드 및 이 견지의 핵산 분자 중 적어도 하나를 포함하는 세포에 관한 것이며, 여기서 바람직하게 상기 세포는 배양된 세포이다.
최종 견지로, 본 발명은 적어도 HMFCA를 세포 내로 운반하는 능력을 갖는 폴리펩티드에 관한 것으로, 여기서 폴리펩티드는 SEQ ID NO: 17의 아미노산 서열과 적어도 86.5% 서열 동일성을 갖는 아미노산 서열을 포함한다. 이 견지에서, 본 발명은 또한 a) 적어도 HMFCA를 세포 내로 운반하는 능력을 갖는 폴리펩티드를 코딩하는 뉴클레오티드 서열로서, 여기서 폴리펩티드는 SEQ ID NO: 17의 아미노산 서열과 적어도 86.5% 서열 동일성을 갖는 아미노산 서열을 포함하는, 뉴클레오티드 서열; b) SEQ ID NO: 18에 나타낸 뉴클레오티드 서열; c) 길이가 10, 15, 20, 30, 50 또는 100 뉴클레오티드인 (a) 또는 (b)에 정의된 바와 같은 뉴클레오티드 서열의 프래그먼트; d) 유전 암호의 축퇴에 기인하여 b) 또는 c)의 뉴클레오티드 서열의 서열과 상이한 뉴클레오티드 서열; 및 e) a) 내지 d)에서 정의된 뉴클레오티드 서열의 리버스 컴플리먼트인 뉴클레오티드 서열 중 적어도 하나를 포함하는 핵산 분자에 관한 것으로, 여기서 바람직하게 상기 핵산 분자는 벡터이다. 이 견지에서, 본 발명은 또한 이 견지의 폴리펩티드 및 이 견지의 핵산 분자 중 적어도 하나를 포함하는 세포에 관한 것이며, 여기서 바람직하게 상기 세포는 배양된 세포이다.
도 1a: P. 푸티다(P. putida ) CA2046에 의한 HMF의 바이오트랜스포메이션(P. 푸티다(P. putida); 개방 원: HMF(5-히드록시메틸푸르푸랄), 개방 사각형: HMFCA(5-히드록시메틸푸로산), 채워진 다이아몬드: FDCA(2,5-푸란 디카르복실산); 채워진 회색 원: OD600.
도 1b: P. 푸티다(P. putida) CA2101에 의한 HMF의 바이오트랜스포메이션; 개방 원: HMF(5-히드록시메틸푸르푸랄); 개방 사각형: HMFCA(5-히드록시메틸푸로산); 채워진 다이아몬드: FDCA(2,5-푸란 디카르복실산); 채워진 회색 원: OD600.
도 2: C. 바실렌시스(C. basilensis) HMF14로부터 Aldh 및 HmfT1과 함께 YiaY를 동시 발현하는, P. 푸티다(P. putida) CA2111에 의한 HMF의 바이오트랜스포메이션; 개방 원: HMF(5-히드록시메틸푸르푸랄); 개방 사각형: HMFCA(5-히드록시메틸푸로산); 채워진 다이아몬드: FDCA(2,5-푸란 디카르복실산); 채워진 회색 원: OD600. 이중 배양의 평균이 표시된다.
도 3: C. 바실렌시스(C. basilensis) HMF14로부터의 Aldh 및 HmfT1과 함께 YiaY를 동시 발현하는 P. 푸티다(P. putida) CA2112에 의한 HMF의 바이오트랜스포메이션; 개방 원: HMF(5-히드록시메틸푸르푸랄); 개방 사각형: HMFCA(5-히드록시메틸푸로산); 채워진 다이아몬드: FDCA(2,5-푸란 디카르복실산); 채워진 회색 원: OD600. 이중 배양의 평균이 표시된다.
도 4. 바실러스 크리벤시스(Bacillus kribbensis) DSM17871로부터 YiaY, 및 C. 바실렌시스(C. basilensis)로부터 Aldh 및 HmfT1를 동시 발현하는, P. 푸티다(P. putida) CA21780에 의한 HMF 바이오트랜스포메이션, HMF-OH는 본 명세서에서 "DHF"로도 언급되는 디히드록시메틸 푸란이다.
도 5. 아네우리니바실러스 테라노벤시스(Aneurinibacillus terranovensis) DSM18919로부터 YiaY, 및 C. 바실렌시스(C. basilensis)로부터 Aldh 및 HmfT1을 동시 발현하는 P. 푸티다(P. putida) CA21781에 의한 바이오트랜스포메이션. HMF-OH는 본 명세서에서 "DHF"로도 언급되는 디히드록시메틸 푸란이다.
도 6. 브레비바실러스 파나시후미(Brevibacillus panacihumi) W25로부터 YiaY, 및 C. 바실렌시스(C. basilensis)로부터 Aldh 및 HmfT1을 동시 발현하는 P. 푸티다(P. putida) CA21783에 의한 HMF 바이오트랜스포메이션. HMF-OH는 본 명세서에서 "DHF"로도 언급되는 디히드록시메틸 푸란이다.
도 1b: P. 푸티다(P. putida) CA2101에 의한 HMF의 바이오트랜스포메이션; 개방 원: HMF(5-히드록시메틸푸르푸랄); 개방 사각형: HMFCA(5-히드록시메틸푸로산); 채워진 다이아몬드: FDCA(2,5-푸란 디카르복실산); 채워진 회색 원: OD600.
도 2: C. 바실렌시스(C. basilensis) HMF14로부터 Aldh 및 HmfT1과 함께 YiaY를 동시 발현하는, P. 푸티다(P. putida) CA2111에 의한 HMF의 바이오트랜스포메이션; 개방 원: HMF(5-히드록시메틸푸르푸랄); 개방 사각형: HMFCA(5-히드록시메틸푸로산); 채워진 다이아몬드: FDCA(2,5-푸란 디카르복실산); 채워진 회색 원: OD600. 이중 배양의 평균이 표시된다.
도 3: C. 바실렌시스(C. basilensis) HMF14로부터의 Aldh 및 HmfT1과 함께 YiaY를 동시 발현하는 P. 푸티다(P. putida) CA2112에 의한 HMF의 바이오트랜스포메이션; 개방 원: HMF(5-히드록시메틸푸르푸랄); 개방 사각형: HMFCA(5-히드록시메틸푸로산); 채워진 다이아몬드: FDCA(2,5-푸란 디카르복실산); 채워진 회색 원: OD600. 이중 배양의 평균이 표시된다.
도 4. 바실러스 크리벤시스(Bacillus kribbensis) DSM17871로부터 YiaY, 및 C. 바실렌시스(C. basilensis)로부터 Aldh 및 HmfT1를 동시 발현하는, P. 푸티다(P. putida) CA21780에 의한 HMF 바이오트랜스포메이션, HMF-OH는 본 명세서에서 "DHF"로도 언급되는 디히드록시메틸 푸란이다.
도 5. 아네우리니바실러스 테라노벤시스(Aneurinibacillus terranovensis) DSM18919로부터 YiaY, 및 C. 바실렌시스(C. basilensis)로부터 Aldh 및 HmfT1을 동시 발현하는 P. 푸티다(P. putida) CA21781에 의한 바이오트랜스포메이션. HMF-OH는 본 명세서에서 "DHF"로도 언급되는 디히드록시메틸 푸란이다.
도 6. 브레비바실러스 파나시후미(Brevibacillus panacihumi) W25로부터 YiaY, 및 C. 바실렌시스(C. basilensis)로부터 Aldh 및 HmfT1을 동시 발현하는 P. 푸티다(P. putida) CA21783에 의한 HMF 바이오트랜스포메이션. HMF-OH는 본 명세서에서 "DHF"로도 언급되는 디히드록시메틸 푸란이다.
정의
용어 "상동성(homology)", "서열 동일성(sequence identity)" 등은 본 명세서에서 상호 교환적으로 사용된다. 서열 동일성은 서열을 비교함으로써 결정된 바와 같이 2개 이상의 아미노산(폴리펩티드 또는 단백질) 서열 또는 2개 이상의 핵산(폴리뉴클레오티드) 서열 간의 관계로서 본 명세서에서 정의된다. 당해 분야에서, "동일성(identity)"은 아미노산 또는 핵산 서열 사이의 서열 연관성의 정도를 의미하며, 경우에 따라 그러한 서열의 스트링 사이의 일치에 의해 결정된다. 2개의 아미노산 서열 사이의 "유사성(similarity)"은 하나의 폴리펩티드의 아미노산 서열 및 이의 보존된 아미노산 치환체를 제 2 폴리펩티드의 서열과 비교함으로써 결정된다. "동일성(identity)"과 "유사성(similarity)"은 알려진 방법으로 쉽게 산출될 수 있다.
"서열 동일성(sequence identity)" 및 "서열 유사성(sequence similarity)"은 두 서열의 길이에 따라 전역 또는 국소 정렬 알고리즘을 사용하여 두 펩티드 또는 두 개의 뉴클레오티드 서열을 정렬함으로써 결정될 수 있다. 유사한 길이의 서열은 전체 길이에 걸쳐 서열을 최적으로 정렬하는 전역 정렬 알고리즘(예: Needleman Wunsch)을 사용하여 정렬되는 것이 바람직하며, 한편 실질적으로 상이한 길이의 서열은 국소 정렬 알고리즘(예: Smith Waterman)을 사용하여 정렬되는 것이 바람직하다. 서열은 (예를 들어, 디폴트 파라미터를 사용하여 프로그램 GAP 또는 BESTFIT에 의해 최적으로 정렬되는 경우) 서열 동일성의 특정 최소 백분율 (하기 정의된 바와 같음)을 공유할 때 "실질적으로 동일(substantially identical)" 또는 "본질적으로 유사(essentially similar)"로 언급될 수 있다. GAP은 Needleman and Wunsch 전역 정렬 알고리즘을 사용하여 이들의 전체 길이(풀(full) 길이)에 걸쳐 두 개의 시퀀스를 정렬하고, 일치 수를 최대화하며 간격을 최소화한다. 전역 정렬은 두 시퀀스가 유사한 길이를 갖는 경우 시퀀스 아이덴티티를 결정하는데 적절히 사용된다. 일반적으로 갭 생성 페널티 = 50(뉴클레오티드)/8(단백질)과 갭 익스텐션 페널티 = 3(뉴클레오티드)/2(단백질)으로 GAP 디폴트 파라미터가 사용된다. 뉴클레오티드에 대해, 사용되는 디폴트 스코어링 매트릭스는 nwsgapdna이며, 단백질에 대해 디폴트 스코어링 매트릭스는 Blosum62이다(Henikoff & Henikoff, 1992, PNAS 89, 915-919). 서열 정렬 및 퍼센트 서열 동일성에 대한 스코어는 GCG Wisconsin Package, Version 10.3(Accelrys Inc.로부터 구입가능함, 9685 Scranton Road, San Diego, CA 92121-3752 USA)과 같은 컴퓨터 프로그램을 사용하여, 또는 EmbossWIN version 2.10.0으로 프로그램 "니들(needle)"(global Needleman Wunsch 알고리즘 사용) 또는 "워터(water)"(local Smith Waterman 알고리즘 사용)과 같은 오픈 소스 소프트웨어를 사용하여, 또는 디폴트 셋팅('니들' 및 '워터' 모두에 대해, 그리고 단백질 및 DNA 정렬 모두에 대해, 디폴트 갭 오프닝 페털티는 10.0이며, 그리고 디폴트 갭 익스텐션 페널티는 0.5이며; 디폴트 스코어링 매트릭스는 단백질에 대해 Blossum62이며, DNA에 대해 DNAFull임)을 사용하여 결정될 수 있다. 전반적인 서열의 길이가 실질적으로 다른 경우, Smith Waterman 알고리즘을 사용하는 것과 같은 국소 정렬이 바람직하다.
대안적으로, 백분율 유사성 또는 동일성은 FASTA, BLAST 등과 같은 알고리즘을 사용하여 공개 데이터베이스를 검색함으로써 결정될 수 있다. 따라서, 본 발명의 핵산 및 단백질 서열은 예를 들어, 다른 패밀리 멤버 또는 관련 서열을 확인하기 위해 공개 데이터베이스에 대해 검색을 수행하는 "쿼리 서열(query sequence)"로서 또한 사용될 수 있다. 이러한 검색은 Altschul et al.(1990, J. Mol. Biol. 215: 403-10)의 BLASTn 및 BLASTx 프로그램(버전 2.0)을 사용하여 수행될 수 있다. BLAST 뉴클레오티드 검색은 NBLAST 프로그램, 스코어 = 100, 워드 길이 = 12로 수행되어 본 발명의 산화 환원 효소 핵산 분자에 상동적인 뉴클레오티드 서열을 얻을 수 있다. 본 발명의 단백질 분자와 상동적인 아미노산 서열을 얻기 위해 BLASTx 프로그램, 스코어 = 50, 워드 길이 = 3으로 BLAST 단백질 검색을 수행할 수 있다. 비교 목적으로 갭 정렬을 얻기 위해, Gapped BLAST가 문헌 Altschul et al.(1997, Nucleic Acids Res. 25(17): 3389-3402에 기재된 바와 같이 이용될 수 있다. BLAST 및 Gapped BLAST 프로그램을 이용할 경우, 각각의 프로그램(예를 들어, BLASTx 및 BLASTn)의 디폴트 파라미터가 사용될 수 있다. http://www.ncbi.nlm.nih.gov/에서 National Center for Biotechnology Information의 홈페이지 참조바람.
선택적으로, 아미노산 유사성의 정도를 결정함에 있어서, 당업자는 당업자에게 명백한 바와 같이 소위 "보존적(conservative)" 아미노산 치환을 고려할 수 있다. 보존적 아미노산 치환은 유사한 측쇄를 갖는 잔기의 상호교환성을 지칭한다. 예를 들어, 지방족 측쇄를 갖는 아미노산 그룹은 글리신, 알라닌, 발린, 루신 및 이소루신이며; 지방족-히드록시 측쇄를 갖는 아미노산 그룹은 세린 및 트레오닌이며; 아미드-함유 측쇄를 갖는 아미노산 그룹은 아스파라긴 및 글루타민이며; 방향족 측쇄를 갖는 아미노산 그룹은 페닐알라닌, 티로신 및 트립토판이며; 염기성 측쇄를 갖는 아미노산 그룹은 리신, 아르기닌 및 히스티딘이며; 황-함유 측쇄를 갖는 아미노산 그룹은 시스테인 및 메티오닌이다. 바람직한 보존적 아미노산 치환기는 발린-루신-이소루신, 페닐알라닌-티로신, 리신-아르기닌, 알라닌-발린 및 아스파라긴-글루타민이다. 본 명세서에 개시된 아미노산 서열의 치환된 변이체는 개시된 서열들에서 적어도 하나의 잔기가 제거되고 그 자리에 상이한 잔기가 삽입된 것이다. 바람직하게, 아미노산 변화는 보존적이다. 천연 발생 아미노산의 각각에 대해 바람직한 보존적 치환은 다음과 같다: Ala에서 ser으로; Arg에서 lys으로; Asp에서 gln 또는 his으로; Asp에서 glu으로; Cys에서 ser 또는 ala으로; Gln에서 asn으로; Glu에서 asp으로; Gly에서 pro으로; His에서 asn 또는 gln으로; Ile에서 leu 또는 val으로; Leu에서 ile 또는 val으로; Lys에서 arg; gln 또는 glu으로; Met에서 leu 또는 ile으로; Phe에서 met, leu 또는 tyr으로; Ser에서 thr으로; Thr에서 ser으로; Trp에서 tyr으로; Tyr에서 trp 또는 phe으로; 및 Val에서 ile 또는 leu으로.
본 명세서에서 사용된 바와 같이, 용어 "선택적으로 하이브리드화(selectively hybridizing)", "선택적으로 하이브리드화하다(hybridizes selectively)" 및 유사한 용어는 뉴클레오티드 서열이 서로에 대해 이의 조건하에서 전형적으로 적어도 66%, 적어도 70%, 적어도 75%, 적어도 80%, 더욱 바람직하게는 적어도 85%, 더욱 더 바람직하게는 적어도 90%, 바람직하게는 적어도 95%, 더욱 바람직하게는 적어도 98% 또는 보다 바람직하게는 적어도 99% 상동성을 서로 하이브리된 채로 유지하는 하이브리드화 및 세척 조건을 나타내는 것으로 의도된다. 즉, 이러한 하이브리드화 서열은 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 보다 바람직하게는 적어도 85%, 더욱 더 바람직하게는 적어도 90%, 보다 바람직하게는 적어도 95%, 보다 바람직하게는 적어도 98% 또는 보다 바람직하게는 적어도 99% 서열 동일성을 공유할 수 있다.
이러한 하이브리드화 조건의 바람직한 비-제한적인 예는 약 45℃에서 6X 소듐 클로라이드/소듐 시트레이트(SSC)에서 하이브리드화한 후, 약 50℃, 바람직하게는 약 55℃에서, 바람직하게는 약 60℃, 더욱 바람직하게는 약 65℃에서 1X SSC, 0.1% SDS에서 1회 이상 세척하는 것이다.
고도로 엄격한 조건은 예를 들어, 5x SSC/5x 덴하르트 용액/1.0% SDS에서 약 68℃에서 하이브리드화하고, 상온에서 0.2x SSC/0.1% SDS로 세척하는 것을 포함한다. 대안적으로, 세척은 42℃에서 수행될 수 있다.
당업자는 엄격하고 고도로 엄격한 하이브리드 조건에 적용할 조건을 알 것이다. 이러한 조건에 관한 추가적인 지침은 예를 들어 Sambrook et al., 1989, Molecular Cloning, A Laboratory Manual, Cold Spring Harbor Press, N.Y.; 및 Ausubel et al.(eds.), Sambrook and Russell(2001) "Molecular Cloning: A Laboratory Manual(3rd edition), Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, New York 1995, Current Protocols in Molecular Biology, (John Wiley & Sons, N.Y.)에서 당해 기술분야에서 쉽게 이용가능하다.
물론, 폴리 A 서열(mRNA의 3' 말단 폴리(A) 트랙과 같은) 또는 T(또는 U) 잔기의 상보적 스트레치에만 하이브리드화하는 폴리뉴클레오티드는, 그러한 폴리뉴클레오티드는 폴리 (A) 스트레치 또는 이의 컴플리먼트(예를 들어, 실질적으로 어느 이중가닥 cDNA 클론)을 함유하는 어느 핵산 분자에 하이브리드화될 수 있기 때문에, 본 발명의 핵산의 일부에 특이적으로 하이브리드화하는데 사용되는 본 발명의 폴리뉴클레오티드에 포함되지 않을 수 있다.
"핵산 구조물(nucleic acid construct)" 또는 "핵산 벡터(nucleic acid vector)"는 본 명세서에서 재조합 DNA 기술의 사용으로부터 생성된 인공 핵산 분자를 의미하는 것으로 이해된다. 따라서, 용어 "핵산 구조물"은 천연 발생 핵산 분자를 포함하지 않지만 핵산 구조물은 천연 발생 핵산 분자(의 일부)를 포함할 수있다. 용어 "발현 벡터" 또는 "발현 구조물"은 숙주 세포 또는 이러한 서열과 양립가능한 숙주 생물에서 유전자의 발현을 수행할 수 있는 뉴클레오티드 서열을 의미한다. 이러한 발현 벡터는 전형적으로 적어도 적절한 전사 조절 서열을 포함하고, 선택적으로 3' 전사 종결 신호를 포함할 수 있다. 발현을 수행하는데 필요하거나 도움이 되는 추가적인 인자, 예를 들어 발현 인핸서 요소가 존재할 수 있다. 발현 벡터는 적합한 숙주 세포 내로 도입되고, 숙주 세포의 시험관 내 세포 배양시 코딩 서열의 발현을 수행할 수 있다. 발현 벡터는 숙주 세포 또는 본 발명의 유기체에서의 복제에 적합할 것이다.
본 명세서에 사용된 용어 "프로모터(promoter)" 또는 "전사 조절 서열(transcription regulatory sequence)"은 하나 이상의 코딩 서열의 전사를 조절하는 기능을 하는 핵산 프래그먼트를 지칭하며, 코딩 서열의 전사 개시 부위의 전사 방향에 대해 상류에 위치하며, DNA 의존성 RNA 폴리머라아제, 전사 개시 부위 및 이에 한정하는 것은 아니나 전사 인자 바인딩 부위, 리프레서 및 액티베이터 단백질 바인딩 부위를 포함하는 어느 다른 DNA 서열, 및 상기 프로모터로부터 전사의 양을 조절하기 위해 직접적으로 또는 간접적으로 작용하는 것으로 당업자에게 알려진 어느 다른 뉴클레오티드 서열에 대한 바인딩 사이트의 존재에 의해 구조적으로 확인된다. "구성적인(constitutive)" 프로모터는 대부분의 생리 및 발달 조건하에서 대부분의 조직에서 활성적인 프로모터이다. "유도성(inducible)" 프로모터는 예를 들어, 화학 유도체의 적용에 의한 것과 같이, 생리학적으로 또는 발달적으로 조절되는 프로모터이다.
용어 "선별 마커(selectable marker)"는 당업자에게 친숙한 용어이며, 발현시 선별가능한 마커를 함유하는 세포 또는 세포들을 선별하는데 사용될 수 있는 어느 유전적 엔티티를 기술하기 위해 본 명세서에서 사용된다. "리포터(reporter)"라는 용어는 녹색 형광 단백질(GFP)과 같은 가시적 마커를 나타내는데 주로 사용되지만 마커와 상호교환적으로 사용할 수 있다. 선별가능한 마커는 우성 또는 열성 또는 양방향일 수 있다.
본 명세서에 사용된 바와 같이, "작동가능하게 연결된(operably linked)"이란 용어는 기능적 관계에 있는 폴리뉴클레오티드 요소의 연결을 의미한다. 핵산은 다른 핵산 서열과 기능적 관계로 놓이면 "작동가능하게 연결"된다. 예를 들어, 전사 조절 서열은 코딩 서열의 전사에 영향을 주면 코딩 서열에 작동가능하게 연결된다. 작동가능하게 연결된다는 것은 연결된 DNA 서열이 전형적으로 연속적이며, 두 단백질 코딩 영역을 합치는데 필요한 경우 연속적이며 판독 프레임에 있음을 의미한다.
용어 "단백질" 또는 "폴리펩티드"는 상호교환적으로 사용되며, 특정 작용 기전, 크기, 3차원 구조 또는 기원과 관련없이 아미노산 사슬로 구성된 분자를 지칭한다.
용어 "유전자"는 적절한 조절 영역(예: 프로모터)에 작동가능하게 연결된 세포 내 RNA 분자(예: mRNA)로 전사되는 영역(전사 영역)을 포함하는 DNA 프래그먼트를 의미한다. 유전자는 일반적으로 프로모터, 5' 리더 서열, 코딩 영역 및 폴리아데닐화 부위를 포함하는 3'-비번역 서열(3'-말단)과 같은 몇 가지 작동가능하게 연결된 프래그먼트를 포함할 것이다. "유전자의 발현"은 생물학적으로 활성인 RNA, 즉 생물학적으로 활성인 단백질 또는 펩티드로 번역될 수 있는 RNA로 전사되는, 적절한 조절 영역, 특히 프로모터에 작동가능하게 연결된 DNA 영역을 처리하는 방법을 의미한다. 주어진 (재조합) 핵산 또는 폴리펩티드 분자와 주어진 숙주 유기체 또는 숙주 세포 사이의 관계를 나타내기 위해 사용되는 "상동성(homologous)"이란 용어는 본질적으로 핵산 또는 폴리뉴클레오티드 분자가 동일한 종, 바람직하게 동일한 변종 또는 균주의 숙주 세포 또는 유기체에 의해 생성되는 것을 의미하는 것으로 이해된다. 숙주 세포에 상동성인 경우, 폴리펩티드를 코딩하는 핵산 서열은 이의 천연 환경에서보다 전형적으로 (반드시 필수는 아님) 다른 (이종성) 프로모터 서열, 및 적용 가능하다면 다른 (이종성) 분비 신호 서열 및/또는 종결자 서열에 작동가능하게 연결될 것이다. 조절 서열, 신호 서열, 종결자 서열 등은 또한 숙주 세포에 상동성일 수 있는 것으로 이해된다. 이러한 맥락에서, 단지 "상동성" 서열 요소의 사용은 "자가 클로닝된(self-cloned)" 유전자 변형 생물체(GMO's)의 구축을 가능하게 한다(자가 클로닝은 본 명세서에서 European Directive 98/81/ EC Annex II에 정의된 바와 같은 것으로 정의된다). 두 핵산 서열의 관련성을 나타내기 위해 사용되는 경우, 용어 "상동성"은 하나의 단일 가닥 핵산 서열이 상보적 단일 가닥 핵산 서열에 하이브리드화될 수 있음을 의미한다. 하이브리화의 정도는 서열 사이의 동일성의 양 및 후술되는 바와 같은 온도 및 염 농도와 같은 하이브리드화 조건을 포함하는 다수의 인자에 좌우될 수 있다.
핵산(DNA 또는 RNA) 또는 단백질과 관련하여 사용되는 용어 "이종성" 및 "외인성"은 유기체, 세포, 게놈 또는 DNA 또는 RNA 서열의 일부로서 천연적으로 발생하지 않는 핵산 또는 단백질을 의미하며, 그것이 존재하거나 자연계에서 발견되는 게놈 또는 DNA 서열 또는 RNA 서열과 상이한 세포 또는 위치 또는 위치들에서 발견된다. 이종성 및 외인성 핵산 또는 단백질은 도입된 세포에 내인성이 없지만, 다른 세포 또는 합성적으로 또는 재조합적으로 생산된 세포로부터 얻어진다. 일반적으로, 반드시 그런 것은 아니지만, 그러한 핵산은 DNA가 전사되거나 발현되는 세포에 의해 정상적으로 생산되지 않는 단백질, 즉 외인성 단백질을 코딩한다. 유사하게 외인성 RNA는 외인성 RNA가 존재하는 세포에서 정상적으로 발현되지 않는 단백질을 코딩한다. 이종성/외인성 핵산 및 단백질은 또한 외래 핵산 또는 단백질로 지칭될 수 있다. 발현된 세포에 대해 당업자가 외래물질로 인식하는 어느 핵산 또는 단백질은 본 명세서에서 상기 용어 이종성 또는 외인성 핵산 단백질로 포함된다. 용어 이종성 및 외인성은 또한 핵산 또는 아미노산 서열의 비-천연 조합, 즉, 적어도 두개의 조합 서열이 서로에 대해 외래물질인 조합에 적용된다.
효소의 "특이적 활성도(specific activity)"는 본 명세서에서 총 숙주 세포 단백질 mg 당 효소 활성의 단위로 통상적으로 표현되는 총 숙주 세포 단백질의 양 당 특정 효소의 활성 양을 의미하는 것으로 이해된다. 본 발명과 관련하여, 특정 효소의 특이적 활성은 (그렇지 않으면 동일한) 와일드 타입 숙주 세포에서의 해당 효소의 특이적 활성과 비교하여 증가되거나 감소될 수 있다.
"푸라닉 화합물(Furanic compounds)"은 본 명세서에서 2,5-푸란-디카르복실 산(FDCA)뿐만 아니라 FDCA로 산화될 수 있는 푸란기를 갖는 어느 화합물로 이해되며, 후자는 본 명세서에서 "FDCA의 전구체" 또는 "FDCA의 푸라닉 전구체"로서 지칭된다. FDCA의 전구체로는 적어도 5-히드록시메틸푸르푸랄(HMF), 2,5-디히드록시메틸 푸란(DHF 또는 HMF-OH) 또는 2,5-비스(히드록시메틸)푸란(BHF), 5-히드록시메틸-2-푸란카르복실산 또는 5-히드록시메틸-2-푸로산(HMFCA), 5-포르밀-2-푸로산(FFA), 및 2,5-디포르밀 푸란(DFF)을 포함한다. 또한, "푸라닉 화합물"에서, 푸란 고리 또는 어느 또는 이의 치환가능한 측쇄가 예를 들어, 어느 이용가능한 위치상에서 푸란 고리 내의 시클릭기를 포함하는 OH, C1-C1 알킬, 알킬, 알릴, 아릴 또는 RO- 에테르부로 치환될 수 있는 것으로 이해된다.
본 명세서에서 공개 서열 데이터베이스에서 접근가능한 뉴클레오티드 또는 아미노산 서열에 대한 어느 레퍼런스는 본 문헌의 출원일에 이용가능한 서열 엔트리의 버전을 나타낸다.
발명의 상세한 설명
HMFCA
디하이드로게나아제를
발현하는 세포
제 1 견지에서, 본 발명은 5-히드록시메틸-2-푸란카복실산(HMFCA)을 5-포르밀푸로산(FFA)으로 산화시키는 능력을 갖는 세포에 관한 것이다. HMFA를 FFA로 산화시키는 능력은 바람직하게 HMFCA를 FFA으로 산화시키는 능력을 갖는 디하이드로게나아제를 코딩하는 뉴클레오티드 서열을 포함하는 핵산 구조물로 상기 세포를 형질전환시킴으로써 상기 세포에 부여되거나 또는 상기 세포에서 증가된다. 디하이드로게나아제는 바람직하게 알코올 디하이드로게나아제(즉, EC 1.1 활성을 갖는)이다. 따라서, 상기 세포는 바람직하게 HMFCA를 FFA로 산화시키는 능력을 갖는 디하이드로게나아제를 코딩하는 뉴클레오티드 서열의 발현을 위한 발현 구조물을 포함하는 세포이다. 본 발명의 바람직한 세포에서, 상기 발현 구조물은 상기 세포에서 발현가능하고, 발현 구조물이 결여된 이에 상응하는 세포, 예를 들어 와일드 타입 세포와 비교하여, 바람직하게는 세포에 HMACA를 FFA로 산화시키는 능력을 부여하거나 세포에서 증가시킨다. HMFCA를 FFA로 산화시키는 효소의 특이적 활성은 바람직하게는 상기 발현 구조물이 결여된 이에 상응하는 세포와 비교하여 적어도 1.05, 1.1, 1.2, 1.5, 2.0, 5.0, 10, 20, 50 또는 100 인자로 상기 세포에서 증가된다.
따라서, HMFCA를 FFA로 산화시키는 능력을 갖는 디하이드로게나아제는 HMFCA 디하이드로게나아제 활성을 갖는 알코올 디하이드로게나아제이다. 폴리펩티드가 HMFCA 디하이드로게나아제 활성을 갖는지 여부는 HMFA를 FFA로 산화시킬 수 없는 적합한 숙주 세포에서 폴리펩티드의 발현 및 폴리펩티드의 발현이 HMFCA를 FFA로 산화시키는 능력을 세포에 부여하는지 여부를 검출함으로써 어세이될 수 있다. 바람직하게, HMFCA 디하이드로게나아제 활성을 본 명세서의 실시예 IV에 기재된 바와 같이 어세이하며, 이에 의해 HMFCA 디하이드로게나아제 활성에 대해 어세이할 폴리펩티드를 코딩하는 뉴클레오티드 서열이 pBT'hmfH-adh(WO2012/064195에 기술됨) 내의 C. 바실렌시스(C. basilensis ) hmfH 유전자를 대체하며, 이후에 HMFCA 디하이드로게나아제 활성에 대해 어세이할 폴리펩티드의 코딩 서열을 포함하는 플라스미드가 pJNNhmfT1(t)를 함유하는 P. 푸티다(P. putida) KT2440Agcd(WO2012064195에 기술됨) 내로 도입된다. HMFCA 디하이드로게나아제 활성을 어세이할 폴리펩티드를 발현하는 P. 푸티다(P. putida) 형질전환체를 HMF와 함께 배양하고, FDCA 분석을 위해 일정한 간격으로 시료를 채취한다. HMFCA 디하이드로게나아제 활성 (및 hmfH 유전자)에 대해 어세이할 폴리펩티드가결여된 이에 상응하는 P. 푸티다(P. putida) 형질전환체와 비교하여, FDCA의 생산 증가는 상기 폴리펩티드가 HMFCA 디하이드로게나아제 활성을 갖는다는 지표로서 취해진다.
본 발명의 세포에서 발현되는 HMFCA 디하이드로게나아제는 바람직하게 NADH 또는 NADPH와 같은 아데닌 디뉴클레오티드, 플라빈 아데닌 디뉴클레오타이드(FAD), 플라빈 모노뉴클레오티드(FMN), 및 피롤로퀴놀린 퀴놀론(PQQ)으로부터 선택되는 코팩터에 의존하는 디하이드로게나아제이다.
본 발명의 세포에서 발현된 FEVIFCA 디하이드로게나아제는 또한 바람직하게는 다른 푸라닉 알코올, 바람직하게는 2번 위치의 히드록시기를 갖는 푸라닉 알코올을 이에 상응하는 알데히드로 산화시키는 능력을 갖는 알코올 디하이드로게나아제이다. 따라서, FEVIFCA 디하이드로게나아제는 바람직하게 5-히드록시메틸푸르푸랄(HMF)을 2,5-디포르밀 푸란(DFF)으로 산화시키는 능력을 갖는다.
일 구현으로, FEVIFCA를 FFA로 산화시키는 능력을 갖는 디하이드로게나아제를 코딩하는 뉴클레오티드 서열은 다음으로 이루어진 그룹으로부터 선택된다:
(a) FEVIFCA 디하이드로게나아제 활성을 갖는 폴리펩티드를 코딩하는 뉴클레오티드 서열로서, 상기 폴리펩티드는 SEQ ID NO: 1(Aeribacillus pallidus), SEQ ID NO: 2(Bacillus kribbensis), SEQ ID NO: 3(Geobacillus kaustophilus), SEQ ID NO: 4(Aneurinibacillus terranovensis), SEQ ID NO: 5(Brevibacillus thermoruber), SEQ ID NO: 6(Brevibacillus panacihumi), SEQ ID NO: 7(Bacillus sp . FJAT -14578), SEQ ID NO: 8(Desulfotomaculum kuznetsovii), SEQ ID NO: 9(Desulfurispora thermophila), SEQ ID NO: 10(Bacillus sp . L1 (2012)) 및 SEQ ID NO: 11(Pelotomaculum thermopropionicum) 중 어느 하나의 아미노산 서열과 적어도 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 81.65, 81.7, 81.8, 81.85, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 95, 96, 97, 98, 99 또는 100% 서열 동일성을 갖는, 뉴클레오티드 서열;
(b) (a)의 뉴클레오티드 서열에 하이브리드하는 상보적 스트랜드의 뉴클레오티드 서열; 및,
(c) 유전 코드의 축퇴로 인해 서열이 (b)의 뉴클레오티드 서열의 서열과 상이한 뉴클레오티드 서열.
본 발명의 바람직한 뉴클레오티드 서열은 따라서 바실랄레스(Bacillales) 또는 클로스트리디알레스(Clostridiales) 목의 박테리아로부터 얻을 수 있는 (또는 이러한 박테리아에서 자연적으로 발생하는) FEVIFCA 디하이드로게나아제의 것과 동일한 아미노산 서열을 갖는 FEVIFCA 디하이드로게나아제를 코딩한다. 하나의 바람직한 구현으로, 박테리아는 바실라세아에(Bacillaceae) 과의 것이며, 보다 바람직하게 박테리아는 아에리바실러스(Aeribacillus), 게오바실러스(Geobacillus) 및 바실러스(Bacillus) 속의 것이며, 이의 종 아에리바실러스 팔리더스(Aeribacillus pallidus), 바실러스 크리벤시스(Bacillus kribbensis), 게오바실러스 카우스토필러스(Geobacillus kaustophilus), 아네우리니바실러스 테라노벤시스(Aneurinibacillus terranovensis), 바실러스 sp.(Bacillus sp). FJAT-14578 및 바실러스 sp.(Bacillus sp .) L1(2012)이 가장 바람직하다. 다른 바람직한 구현으로, 박테리아는 파에니바실라세아에(Paenibacillaceae) 과의 것이며, 보다 바람직하게 아네우리니바실러스(Aneurinibacillus) 및 브레비바실러스(Brevibacillus) 속의 박테리아이며, 이의 종 아네우리니바실러스 테라노벤시스(Aneurinibacillus terranovensis), 브레비바실러스 테르모러버(Brevibacillus thermoruber) 및 브레비바실러스 파나시후미(Brevibacillus panacihumi)가 가장 바람직하다. 또 다른 바람직한 구현으로, 박테리아는 펩토코카세아에(Peptococcaceae) 과의 것이며, 보다 바람직하게 박테리아는 데설포토마컬럼(Desulfotomaculum), 데설푸리스포라(Desulfurispora) 및 펠로토마컬럼(Pelotomaculum) 속의 것이며, 이의 종 데설포토마컬럼 쿠즈네트소비(Desulfotomaculum kuznetsovii), 데설푸리스포라 테르모필라(Desulfurispora thermophila) 및 펠로토마컬럼 테르모프로피오니컴(Pelotomaculum thermopropionicum)이 가장 바람직하다.
일 구현으로, 본 발명의 바람직한 뉴클레오티드 서열은 중온성 박테리아, 즉 적당한 온도, 전형적으로 20 내지 45℃에서 가장 잘 자라는 박테리아의 HMFCA 디하이드로게나아제를 코딩한다. 바람직하게, 본 발명의 뉴클레오티드 서열은 20 내지 45℃ 범위의 최적 활성 및 안정성을 갖는 중온성 HMFCA 디하이드로게나아제를 코딩한다. 이러한 중온성 디하이드로게나아제의 예는 예를 들어, 바실러스 크리벤시스(Bacillus kribbensis)(30℃), 아네우리니바실러스 테라노벤시스(Aneurinibacillus terranovensis)(40℃), 브레비바실러스 테르모러버(Brevibacillus thermoruber)(45℃), 브레비바실러스 파나시후미(Brevibacillus panacihumi)(30℃), 바실러스 sp.(Bacillus sp .) FJAT-14578(30℃) 및 바실러스 에스피. L1(2012)(30-50℃)의 디하이드로게나아제 및 이에 관련된 디하이드로게나아제이다.
일 구현으로, 본 발명의 바람직한 뉴클레오티드 서열은 고온성 박테리아, 즉 전형적으로 45℃보다 높은 온도와 122℃ 사이의 비교적 고온에서 가장 잘 성장하는 박테리아의 HMFCA 디하이드로게나아제를 코딩한다. 바람직하게, 본 발명의 뉴클레오티드 서열은 따라서 45℃보다 높은 온도와 122℃ 사이 범위에서 최적 활성 및 안정성을 갖는 고온성 HMFCA 디하이드로게나아제를 코딩한다. 이러한 고온성 디하이드로게나아제의 예는 아에리바실러스 팔리더스(Aeribacillus pallidus)(55℃), 게오바실러스 카우스토필러스(Geobacillus kaustophilus)(55℃), 데설포토마컬럼 쿠즈네트소비(esulfotomaculum kuznetsovii)(60℃), 데설푸리스포라 테르모필라(Desulfurispora thermophila)(50℃), 펠로토마컬럼 테르모프로피오니컴(Pelotomaculum thermopropionicum)(55℃) 및 바실러스 sp.(Bacillus sp .) L1(2012)(30-50℃)의 디하이드로게나아제 및 이에 관련된 디하이드로게나아제이다.
일 구현으로, 뉴클레오티드 서열은, 예를 들어 와일드 타입 공급원 유기체로부터 분리될 수 있는 것과 같이, 자연에서 발생하는 것처럼 HMFCA 디하이드로게나아제 활성을 갖는 폴리펩티드를 코딩한다. 대안적으로, 상기 뉴클레오티드 서열은 상기 정의된 HMFCA 디하이드로게나아제의 어느 조작된 형태를 코딩할 수 있으며, 이는 이에 상응하는 자연적으로 발생하는 디하이드로게나아제와 비교하여 하나 이상의 아미노산 치환, 삽입 및/또는 결실을 포함하나, 본 명세서에 정의된 바와 같은 동일성 또는 유사성의 범위 내에 있다. 따라서, 일 구현으로, 본 발명의 뉴클레오티드 서열은 HMFCA 디하이드로게나아제를 코딩하며, 이의 아미노산 서열은 적어도 각각의 불변 위치(표 2에서 "*"로 표시됨)에 포함되며, 상기 아미노산은 불변 위치에 존재한다. 바람직하게, 상기 아미노산 서열은 강력하게 보존된 위치(표 2에서 ":"로 표시됨)에 포함되며, 상기 아미노산들 중 하나는 강력하게 보존된 위치에 존재한다. 더욱 바람직하게, 상기 아미노산 서열은 또한 덜 강력하게 보존된 위치(표 2에서 "."로 표시됨)에 포함되며, 상기 아미노산들 중 하나는 덜 강력하게 보존된 위치에 존재한다. 이러한 불변 및 보존된 위치 밖의 아미노산 치환은 HMFCA 디하이드로게나아제 활성에 영향을 미치기 쉽다.
HMFCA 디하이드로게나아제 활성을 갖는 폴리펩티드를 코딩하는 본 발명의 뉴클레오티드 서열은 예를 들어, 당해 기술분야(예, Sambrook and Russell (2001) "Molecular Cloning: A Laboratory Manual"(3rd edition), Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, New York) 참조)에 잘 알려진 뉴클레오티드 서열의 분리 방법을 사용하여 상술한 공급원 유기체로서 동일한 문(phylum), 강(class) 또는 속(genus)에 속하는 것과 같은 균류, 효모 또는 박테리아의 게놈 및/또는 cDNA로부터 얻을 수 있다. 본 발명의 뉴클레오티드 서열은 예를 들어 a) 축퇴된 PCR 프라이머(보존된 아미노산 서열을 기초로 하여 설계됨)가 HMFCA 디하이드로게나아제 활성을 갖는 폴리펩티드를 코딩하는 뉴클레오티드 서열의 일부를 포함하는 PCR 프래그먼트를 생성하기 위해 적합한 유기체의 게놈 및/또는 cDNA에 사용되며; b) a)에서 얻어진 PCR 프래그먼트를 PCR 프로브로 사용하여 상기 유기체의 cDNA 및/또는 게노믹 라이브러리를 스크리닝하며; 그리고 c) HMFCA 디하이드로게나아제 활성을 갖는 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함하는 cDNA 또는 게놈 DNA를 생산하는 단계를 포함하는 방법으로 얻어질 수 있다.
본 발명의 HMFCA 디하이드로게나아제가 본 발명의 형질전환된 세포에서 충분한 수준 및 활성 형태로 발현될 가능성을 증가시키기 위해, 이들 효소를 코딩하는 뉴클레오티드 서열 및 본 발명의 다른 효소(하기 참조)는 바람직하게 코돈 사용을 문제의 숙주 세포의 것으로 최적화하는데 적합하다. 폴리펩티드를 코딩하는 뉴클레오티드 서열의 숙주 세포의 코돈 사용에 대한 적응성은 코돈 적응 지수(codon adaptation index; CAI)로서 나타낼 수 있다. 코돈 적응 지수는 본 명세서에서 특정 숙주 세포 또는 유기체에서 고 발현된 유전자의 코돈 사용에 대한 유전자의 코돈 사용의 상대적인 적응성의 측정으로서 정의된다. 각 코돈의 상대적 적응성(w)은 동일한 아미노산에 대해 가장 풍부한 코돈의 비율과 각 코돈의 사용 비율이다. CAI 지수는 이들 상대적인 적응성 값의 기하학적 평균으로서 정의된다. 비-유사한 코돈과 종결 코돈(유전 암호에 따라 다름)은 제외된다. CAI 값 범위는 0에서 1까지이며, 보다 높은 수치는 가장 풍부한 코돈의 보다 높은 비율을 나타낸다(Sharp and Li, 1987, Nucleic Acids Research 15: 1281-1295 참조, Jansen et al., 2003, Nucleic Acids Res 31(8): 2242-51 또한 참조). 적응된 뉴클레오티드 서열은 바람직하게 적어도 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8 또는 0.9의 CAI를 갖는다. P. 푸티다(P. putida) 세포에서 발현을 위해 코돈 최적화된 SEQ ID NO's: 13 또는 14에 열거된 서열이 가장 바람직하다.
본 발명의 HMFCA 디하이드로게나아제를 코딩하는 뉴클레오티드 서열의 발현을위한 핵산 구조물로 형질전환될 숙주 세포는 원칙적으로 본 발명의 HMACA 디하이드로게나아제가 적합하게, 바람직하게는 기능적으로, 즉 활성 형태로 발현될 수 있는 어느 숙주 세포일 수 있다. 본 발명의 숙주 세포는 바람직하게 푸라닉 화합물을 세포 내외로 능동적 또는 수동적으로 수송할 수 있는 숙주이다. 본 발명의 바람직한 숙주 세포는 특히 HMFCA, FFA 및 FDCA와 같은 카르복실화된 푸라닉 화합물을 디카르복실화하는 검출가능한 활성이 없거나 검출되지 않는다. 이러한 숙주 세포는 바람직하게는 카르복실화 푸라닉 화합물을 디카르복실화하는 능력이 자연적으로 결여되어 있다.
바람직하게, 상기 숙주 세포는 예를 들어 발효 공정에서 바람직하게는 수중 발효로 배양될 수 있는 세포와 같은 배양된 세포이다.
일 구현에 따르면, 본 발명에 따른 숙주 세포는 진핵 숙주 세포이다. 바람직하게, 진핵 세포는 포유류, 곤충, 식물, 균류 또는 조류 세포이다. 바람직한 포유류 세포는 예를 들어, 차이니즈 햄스터 난소(Chinese hamster ovary; CHO) 세포, COS 세포, 293 세포, PerC6 세포 및 하이브리도마를 포함한다. 바람직한 곤충 세포는 예를 들어, Sf9 및 Sf21 세포 및 이의 유도체를 포함한다.
그러나, 바람직하게 숙주 세포는 미생물 세포이다. 상기 세포는 진핵 미생물 세포, 바람직하게 효모 또는 사상균류 세포와 같은 균류 세포이다. 바람직한 효모 숙주 세포는 예를 들어, 칸디다(Candida), 한세눌라(Hansenula), 클루이베로미세스(Kluyveromyces), 피치아(Pichia), 사카로미세스(Saccharomyces), 쉬조사카로미세스(Schizosaccharomyces), 및 야로위아(Yarrowia)와 같은 속의 효모의 세포를 포함한다. 보다 바람직하게, 클루이베로미세스 락티스(Kluyveromyces lactis), S. 세레비지아에(S. cerevisiae), 한세눌라 폴리모파(Hansenula polymorpha), 야로위아 리폴리티카(Yarrowia lipolytica) 및 피치아 파스토리스(Pichia pastoris)와 같은 종의 효모이다. 바람직한 사상균류 세포는 예를 들어, 아크레모늄(Acremonium), 아가리커스(Agaricus), 아스퍼질러스(Aspergillus), 아우레오바시듐(Aureobasidium), 미셀리오프토라(Myceliophthora), 크리소스포륨(Chrysosporium), 코프리너스(Coprinus), 크립토코커스(Cryptococcus), 필리바시듐(Filibasidium), 푸사륨(Fusarium), 휴미콜라(Humicola), 마그나포르테(Magnaporthe), 뮤코르(Mucor), 미셀리오프토라(Myceliophthora), 네오칼리마스틱스(Neocallimastix), 뉴로스포라(Neurospora), 파에실로미세스(Paecilomyces), 페니실리움(Penicillium), 피로미세스(Piromyces), 파네로카에테(Panerochaete), 플레우로터스(Pleurotus), 쉬조필룸(Schizophyllum), 탈라로미세스(Talaromyces), 테르모아스커스(Thermoascus), 티엘라비아(Thielavia), 톨리포클라듐(Tolypocladium), 및 트리코더마(Trichoderma)와 같은 속의 사상균류의 세포를 포함한다. 바람직한 사상균류 세포는 아스퍼질러스(Aspergillus), 미셀리오프토라(Myceliophthora), 페니실리움(Penicillium), 미셀레오프토라(Myceliophthora), 탈라로미세스(Talaromyces) 또는 트리코더마(Trichoderma) 속에 속하는 것이며, 가장 바람직하게는 아스퍼질러스 나이거(Aspergillus niger), 아스퍼질러스 아와모리(Aspergillus awamori), 아스퍼질러스 포에티더스(Aspergillus foetidus), 아스퍼질러스 소자에(Aspergillus sojae), 아스퍼질러스 푸미가터스(Aspergillus fumigatus), 탈라로미세스 에머르소니(Talaromyces emersonii), 아스퍼질러스 오리자에(Aspergillus oryzae), 미셀리오프토라 테르모필라(Myceliophthora thermophila), 트리코더마 리세이(Trichoderma reesei) 및 페니실리움 크리소게넘(Penicillium chrysogenum)으로부터 선택된 종이다.
미생물 숙주 세포는 또한 원핵 세포, 바람직하게는 박테리아 세포일 수 있다. "박테리아 세포"라는 용어는 그람 음성균과 그람 양성균을 모두 포함한다. 적절한 박테리아는 에쉐리키아(Escherichia), 아나바에나(Anabaena), 아에리바실러스(Aeribacillus), 아네우리니바실러스(Aneurinibacillus), 버콜데리아(Burkholderia), 브래디라이조븀(Bradyrhizobium), 카울로박터(Caulobacter), 큐프리아비더스(Cupriavidus), 데설포토마컬럼(Desulfotomaculum), 데설푸리스포라(Desulfurispora), 글루코노박터(Gluconobacter), 로도박터(Rhodobacter), 펠로토마컬럼(Pelotomaculum), 슈도모나스(Pseudomonas), 파라코커스(Paracoccus), 바실러스(Bacillus), 게오바실러스(Geobacillus), 브레비바실러스(Brevibacillus), 브레비박테리움(Brevibacterium), 코리네박테리움(Corynebacterium), 리조븀 (시노히조븀)(Rhizobium (Sinorhizobium)), 플라보박테리움(Flavobacterium), 클렙시엘라(Klebsiella), 엔테로박터(Enterobacter), 락토바실러스(Lactobacillus), 락토코커스(Lactococcus), 메틸로박테리움(Methylobacterium), 랄스토니아(Ralstonia), 로도슈도모나스(Rhodopseudomonas), 스타필로코커스(Staphylococcus) 및 스트렙토미세스(Streptomyces)로부터 선택될 수 있다. 바람직하게, 박테리아 세포는 A. 팔리더스(A. pallidus), A. 테라노벤시스(A. terranovensis), B. 서브틸리스(B. subtilis), B. 아밀로리쿼파시엔스(B. amyloliquefaciens), B. 코아굴란스(B. coagulans), B. 크리벤시스(B. kribbensis), B. 리체니포르미스(B. licheniformis), B. 펀티스(B. puntis), B. 메가테리움(B. megaterium), B. 할로더란스(B. halodurans), B. 퍼밀러스(B. pumilus), B. 테르모러버(B. thermoruber), B. 파나시후미(B. panacihumi), C. 바실렌시스(C. basilensis), D. 쿠즈네트소비(D. kuznetsovii), D. 테르모필라(D. thermophila), G. 카우스토필러스(G. kaustophilus), 글루코노박터 옥시단스(Gluconobacter oxydans), 카울로박터 크레센터스(Caulobacter crescentus) CB 15, 메틸로박테리움 엑스토르퀀스(Methylobacterium extorquens), 로도박터 스파에로이데스(Rhodobacter sphaeroides), 펠로토마컬럼 테르모프로피오니컴(Pelotomaculum thermopropionicum), 슈도모나스 제아산티니파시엔스(Pseudomonas zeaxanthinifaciens), 슈도모나스 퍼티다(Pseudomonas putida), 파라코커스 데니트리피칸스(Paracoccus denitrificans), E. 콜라이(E. coli), C. 글루타미컴(C. glutamicum), 스타필로코커스 카르노서스(Staphylococcus carnosus), 스트렙토미세스 리비단스(Streptomyces lividans), 시노르히조븀 멜리오티(Sinorhizobium melioti) 및 리조븀 래디오박터(Rhizobium radiobacter)로 구성되는 그룹의 종으로부터 선택된다. 슈도모나스 푸티다(Pseudomonas putida) 종 내에서, P. 푸티다(P. putida) S12 및 P. 푸티다(P. putida) KT2440 균주가 바람직하다.
본 발명에 따른 숙주 세포에서 생성된 화합물의 특정 용도에 있어서, 숙주 세포의 선택은 이러한 용도에 따라 이루어질 수 있다. 예를 들어, 본 발명에 따른 숙주 세포에서 생성된 화합물이 식품 용도에 사용되는 경우, 숙주 세포는 사카로미세스 세레비지아에(Saccharomyces cerevisiae)와 같은 식품 등급 유기체로부터 선택될 수 있다. 특정 용도로는 이에 한정하는 것은 아니나 식품, (동물) 사료, 의약품, 농작물 보호와 같은 농업 및/또는 개인 위생 용품을 포함한다.
본 발명의 HMFCA 디하이드로게나아제를 코딩하는 뉴클레오티드 서열의 발현을위한 발현 구조물은 바람직하게 상기 구조물로 형질전환된 숙주 세포에 이종성 또는 외인성인 발현 구조물이다. 구조물은 숙주 세포에서 자연적으로 발생하지 않는 적어도 하나의 서열 또는 서열 요소를 포함하는 경우 및/또는 구조물이 숙주 세포에서 적어도 두 개의 서열 요소를 포함하고 그리고/또는 숙주 세포에서 요소 자체가 자연적으로 발생하지 않더라도 숙주 세포에서 자연적으로 발생하지 않는 오더를 포함하는 경우, 구조물을 포함하는 숙주 세포에 이종성 또는 외인성인 것으로 본 명세서에서 이해된다.
적절한 숙주 세포에서의 본 발명의 FDVIFCA 디하이드로게나아제를 코딩하는 뉴클레오티드 서열의 발현을 위한 벡터 및 발현 구조물은 하기에 보다 상세히 기술된다.
본 발명의 FDVIFCA 디하이드로게나아제를 발현하는 형질전환된 세포는 또한 바람직하게 알데히드 디하이드로게나아제 활성을 갖는다(즉, EC 1.2 활성을 갖는다). 바람직하게, 알데히드 디하이드로게나아제 활성은 푸라닉 알데히드를 전환시킬 수 있다. 더욱 바람직하게, 알데히드 디하이드로게나아제 활성은 푸라닉 알데히드를 이에 상응하는 푸라닉 카르복실산으로 산화시킬 수 있다. 보다 구체적으로, 알데히드 디하이드로게나아제 활성은 i) HMF를 HMFCA로 산화시키는 것, ii) 2,5-디포르밀 푸란(DFF)을 5-포르밀-2-푸로산(FFA)으로 산화시키는 것, 및 iii) FFA를 FDCA로 산화시키는 것 중 적어도 하나가 가능하다. 이러한 푸라닉 알데히드 디하이드로게나아제 활성은 세포의 내인성 활성일 수 있거나 또는 세포에 부여된 외인성 활성일 수 있다. 바람직하게, 푸라닉 알데히드 디하이드로게나아제 활성은 제 2 발현 구조물을 이용한 세포의 형질 전환에 의해 세포에 부여되거나 세포에서 증가된다. 본 발명의 바람직한 세포에서, 제 2 발현 구조물은 상기 세포에서 발현가능하고, 푸라닉 알데히드 디하이드로게나아제의 발현은 바람직하게, 예를 들어 와일드 타입 세포와 같이, 상기 발현 구조물이 결여된 이에 상응하는 세포와 비교하여, 상기 세포에서 i) HMF를 HMFCA로 산화시키는 것, ii) DFF를 FFA로 산화시키는 것, 및 iii) FFA를 FDCA로 산화시키는 것 중 적어도 하나를 산화시키는 능력을 부여하거나 증가시킨다. 푸라닉 알데히드 디하이드로게나아제의 특이적 활성은 바람직하게 상기 발현 구조물이 결여된 이에 상응하는 세포와 비교하여 상기 세포에서 1.05, 1.1, 1.2, 1.5, 2.0, 5.0, 10, 20, 50 또는 100 인자 증가된다. 제 2 발현 구조물은 바람직하게,
a) i) HMF를 HMFCA로 산화시키는 것, ii) DFF를 FFA로 산화시키는 것, 및 iii) FFA를 FDCA로 산화시키는 것 중 적어도 하나의 능력을 가지며; 그리고
b) SEQ ID NO's: 24, 25, 26, 27, 28, 29 및 30 중 어느 하나의 아미노산 서열과 적어도 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 95, 96, 97, 98, 99 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는
폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함한다.
i) HMF를 HMFCA로, ii) DFF를 FFA로 산화시키는 것, 및 iii) FFA를 FDCA로 산화시키는 것 중 적어도 하나를 산화시키는 폴리펩티드의 능력은 예를 들어, WO2012/064195의 실시예 IV에 기술된 바와 같이, C. 바실렌시스(C. basilensis) HMF 14의 HmfH 및 HmfT1 유전자와 함께 P. 푸티다(P. putida)에서 바람직하게, P. 푸티다(P. putida) KT2440 숙주 세포에서, 폴리펩티드를 코딩하는 뉴클레오티드 서열을 동시-발현시키고, 10mM HMF에서 P. 푸티다(P. putida) 세포를 배양하고, 그리고 상기 폴리펩티드를 발현하지 않는 이에 상응하는 P. 푸티다(P. putida) 세포와 비교함으로써 FDCA 축적의 증가를 검출함으로써 어세이될 수 있다. HMF를 HMFCA로 산화시키는 폴리펩티드의 능력은 또한 Koopman et al.(2010, PNAS supra)에 기술된 바와 같이 어세이될 수 있다. C. 바실렌시스(C. basilensis) HMF14로부터의 HmfT1 유전자를 발현하는 균주는 SEQ ID NO: 31의 아미노산 서열을 갖는 유전자 산물을 발현하는 것으로 이해된다.
본 발명의 HMFCA 디하이드로게나아제를 발현하는 형질전환된 세포는 또한 푸라닉 화합물을 세포 내 및/또는 외로 운반할 수 있는 능력을 갖는 것이 바람직하다. 바람직하게, 상기 세포는 FDCA에 대한 전구체인 푸라닉 화합물을 세포 내로, 바람직하게는 FDCA를 세포 밖으로 운반할 수 있는 능력을 갖는다. 이러한 푸라닉 화합물 운반 능력은 상기 세포의 내인성 역량(capabilities)일 수 있고 그리고/또는 세포에 부여된 외인성 역량일 수 있다. 따라서, 본 발명의 바람직한 세포는 푸라닉 화합물 운반 역량을 갖는 폴리펩티드를 발현한다. 더욱 바람직하게, 상기 세포는 HMFCA 운반 역량을 갖는 폴리펩티드를 발현한다. HMFCA 운반 역량은 적어도 HMFCA를 상기 세포 내로 운반하는 역량을 포함하는 것으로 이해된다. HMFCA 운반 역량을 갖는 폴리펩티드의 발현은 상기 세포 내로의 HMFCA의 운반을 증가시킬 것이며, 이는 FDCA 로의 세포 내 전환에 대한 이의 가용성을 증가시킨다. 따라서, HMFCA 바이오트랜스포메이션은 개선될 수 있다.
바람직하게, 푸라닉 화합물을 세포 내 및/또는 외로 운반하는 능력은 세포의 제 3 발현 구조물에 의한 형질전환에 의해 세포에 부여되거나 세포 내에서 증가된다. 본 발명의 바람직한 세포에서, 제 3 발현 구조물은 상기 세포에서 발현가능하고, 푸라닉 화합물 운반체의 발현은 바람직하게, 예를 들어 와일드 타입 세포와 같은 상기 발현 구조물이 결여된 이에 상응하는 세포에 비해, 상기 세포 내에서 적어도 HMFCA를 상기 세포로 운반하는 능력을 상기 세포에 부여하거나 증가시킨다. 제 3 발현 구조물은 바람직하게
a) 적어도 HMFCA 운반 역량을 가지며; 그리고
b) SEQ ID NO's: 17, 31, 32, 33 및 34 중 어느 하나의 아미노산 서열과 적어도 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 95, 96, 97, 98, 99 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하는
폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함한다.
푸라닉 화합물, 특히 HMFCA를 상기 세포 내로 운반시키는 폴리펩티드의 능력은, 예를 들어, WO2012/064195의 실시예 IV에 기재되어 있는 바와 같이, C. 바실렌시스(C. basilensis) HMF 14의 HmfH 유전자 및 (WO2012/064195의 SEQ ID NO: 19의 아미노산 서열을 갖는) C. 바실렌시스(C. basilensis) HMF 14의 HMF-분해 오페론과 연관된 푸라닉 알데히드 디하이드로게나아제를 코딩하는 유전자와 함께, P. 푸티다(P. putida) 숙주 세포, 바람직하게는 P. 푸티다(P. putida) KT2440 숙주 세포에서 운반체 폴리펩티드를 코딩하는 뉴클레오티드 서열을 동시-발현시키고, 10mM HMF에서 P. 푸티다(P. putida) 세포를 배양하고, 그리고 상기 운반체 폴리펩티드를 발현하지 않는 이에 상응하는 P. 푸티다(P. putida) 세포와 비교함으로써 FDCA 축적의 증가를 검출함으로써 어세이될 수 있다.
일 구현으로, 상기 뉴클레오티드 서열은 예를 들어, 와일드 타입 공급원 유기체로부터 분리될 수 있는 것과 같이, 자연적으로 일어남에 따라 HMFCA 운반 역량을 갖는 폴리펩티드를 암호화한다. 대안적으로, 상기 뉴클레오티드 서열은 상기 정의된 바와 같은 HMFCA 운반 역량을 가지며, HMFCA 운반 역량을 갖는 이에 상응하는 천연 발생 폴리펩티드와 비교하여 하나 이상의 아미노산 치환, 삽입 및/또는 결실을 포함하나 본 명세서에 정의된 바와 같은 동일성 또는 유사성의 범위 내에 있는 어느 조작된 형태의 폴리펩티드를 코딩할 수 있다. 따라서, 일 구현으로, 본 발명의 뉴클레오티드 서열은 HMACA 운반 역량을 갖는 폴리펩티드를 코딩하며, 이의 아미노산 서열은 적어도 각각의 불변 위치(표 3에서 "*"로 표시됨)를 포함하며, 상기 아미노산은 불변 위치에 존재한다. 바람직하게, 상기 아미노산 서열은 또한 강하게 보존된 위치에 존재하는 아미노산 중 하나를 강하게 보존된 위치(표 3에서 ":"로 표시됨)를 포함한다. 더욱 바람직하게, 상기 아미노산 서열은 덜 강하에 보존된 위치(표 3에서 "."로 표시됨)에 덜 강하게 보존된 위치에 존재하는 아미노산들 중 하나를 더 포함한다. 이러한 불변의 보존된 위치 밖의 아미노산 치환은 HMFCA 운반 역량에 영향을 미치기 쉽다.
HMFCA 운반 역량을 갖는 폴리펩티드를 코딩하는 본 발명의 뉴클레오티드 서열은 본 발명의 HMFCA 디하이드로게나아제를 코딩하는 뉴클레오티드 서열에 대해 상술한 바와 같은 방식으로, 당해 기술분야에 잘 알려진 뉴클레오티드 서열의 분리 방법을 이용하여 상기 공급 유기체로서 예를 들어, 동일한 문(phylum), 강(class) 또는 속(genus)에 속하는 것과 같은 균류, 효모 또는 박테리아의 게놈 및/또는 cDNA로부터 얻을 수 있다.
푸라닉
화합물의 운반을 발현하는 세포
제 2 견지로, 본 발명은 추라닉 화합물 운반 역량을 갖는 폴리펩티드를 코딩하는 뉴클레오티드 서열을 발현하는 세포에 관한 것이다. 바람직하게, 상기 세포는 퓨라닉 화합물 운반 능력을 갖는 폴리펩티드를 코딩하는 뉴클레오티드 서열의 발현을 위한 발현 구조물로 형질전환된다. 푸라닉 화합물 운반 능력을 갖는 폴리펩티드는 HMFCA 운반 능력을 갖는 폴리펩티드인 것이 바람직하며, 적어도 HMFCA를 세포 내로 수송할 수 있는 능력을 포함한다. 바람직하게, 상기 세포는 적어도 HMFCA를 세포 내로 운반능을 갖는 폴리펩티드를 코딩하는 뉴클레오티드 서열의 발현을 위한 발현 구조물을 포함하며, 상기 폴리펩티드는 SEQ ID NO: 17의 아미노산 서열과 적어도 86.5, 87, 88, 89, 90, 91, 92, 93, 94, 95, 95, 96, 97, 98, 99 또는 100% 동일성을 갖는 아미노산 서열을 포함하며, 여기서 상기 발현 구조물은 상기 세포에서 발현가능하며, 상기 폴리펩티드의 발현은 상기 발현 구조물이 결여된 이에 상응하는 와일드 타입 세포와 비교하여 상기 세포에서 적어도 HMFCA를 상기 세포 내로 운반하는 능력을 부여하거나 증가시킨다. 푸라닉 화합물, 특히 HMFCA를 상기 세포 내로 운반하는 폴리펩티드의 능력은 상술한 바와 같이 어세이될 수 있다.
바람직하게는, 본 발명의 이러한 견지의 푸라닌 화합물의 운반체를 발현하는 형질전환된 세포는 HMF를 FDCA로 전환시키는 효소 활성을 추가로 포함하며, 여기서 HMF를 FDCA로 전환시키는 활성은 바람직하게는 다음 중 하나를 포함한다:
a) HMFCA를 FFA로 산화시키는 알코올 디하이드로게나아제 및 푸라닉 알데히드를 이에 상응하는 푸라닉 카르복실산으로 산화시키는 알데히드 디하이드로게나아제 활성; 및,
b) HMF, 2,5-디히드록시메틸 푸란, HMFCA, FFA 및 2,5-디포르밀 푸란 중 하나 이상을 FDCA로 산화시키는 산화환원 효소, 바람직하게는 옥시다아제 및 선택적으로 푸라닉 알데히드를 이에 상응하는 푸라닉 카르복실산으로 산화시키는 알데히드 디하이드로게나아제.
FDVIFCA를 FFA로 산화시키는 알코올 디하이드로게나아제 및 푸라닉 알데히드를 산화시키는 알데히드 디하이드로게나아제 활성은 바람직하게 상기 정의된 바와 같다. HMF, 2,5-디히드록시 메틸 푸란, FDVIFCA, FFA 및 2,5-디포르밀 푸란 중 하나 이상을 FDCA로 산화시키는 산화환원 효소는 WO2011/026913에 기재된 바와 같이 EC1.1 및 EC1.2 활성을 모두 갖는 산화환원 효소인 것이 바람직하다.
달리 명시하지 않는 한, 본 발명의 이러한 견지의 푸라닉 화합물의 운반체를 발현하는 형질전환된 세포는 상기 정의된 바와 같은 본 발명의 제 1 견지의 FDVIFCA 디하이드로게나아제를 발현하는 세포의 특징을 추가로 가질 수 있다.
본 발명의 폴리펩티드의 발현을 위한 벡터 및 구조물 및 방법
본 발명의 또 다른 견지는 본 발명의 HMFCA 디하이드로게나아제 또는 운반체를 코딩하는 뉴클레오티드 서열 또는 이의 기능적 등가물과 같은 본 발명의 폴리뉴클레오티드를 포함하는 클로닝 및 발현 벡터를 포함하는, 벡터와 같은 핵산 구조물, 이러한 벡터를 본 발명의 폴리펩티드의 발현이 일어나는 조건하에서와 같이 적절한 숙주 세포에서 성장, 형질전환 또는 형질감염시키는 방법에 관한 것이다. 본명세서에 사용된 바와 같이, 용어 "벡터" 및 "구조물"은 상호교환가능하게 사용되고, 본 발명의 폴리뉴클레오티드를 포함하고 바람직하게는 운반할 수 있는 구성된(constructed) 핵산 분자를 나타낸다.
본 발명의 폴리뉴클레오티드는 예를 들어, 클로닝 또는 발현 벡터와 같은 재조합 복제가능 벡터에 편입될 수 있다. 상기 벡터는 호환가능한 숙주 세포에서 핵산을 복제하는데 사용될 수 있다. 따라서, 또 다른 구현으로, 본 발명은 본 발명의 폴리뉴클레오티드를 복제가능 벡터 내로 도입시키고, 상기 벡터를 호환가능한 숙주 세포 내로 도입시키고, 상기 벡터의 복제를 일으키는 조건하에서 상기 숙주 세포를 성장시킴으로써 본 발명의 폴리뉴클레오티드를 제조하는 방법을 제공한다. 상기 벡터는 상기 숙주 세포로부터 회수될 수 있다. 적절한 숙주 세포는 상기 기재되어 있다.
본 발명의 발현 카세트 또는 폴리뉴클레오티드가 삽입되는 벡터는 재조합 DNA 과정에 편리하게 적용될 수 있는 어느 벡터일 수 있으며, 벡터의 선택은 종종 그것이 도입될 숙주 세포에 의존할 것이다.
본 발명에 따른 벡터는 자율 복제 벡터, 즉 염색체 복제와는 독립적인 복제인, 염색체 외 엔티티(extra-chromosomal entity)로서 존재하는 벡터일 수 있다. 대안적으로, 상기 벡터는 숙주 세포 내로 도입될 때 숙주 세포 게놈 내에 통합되고 그것이 통합된 염색체(들)과 함께 복제되는 벡터일 수 있다.
벡터의 일 타입은 추가 DNA 세그먼트가 라이게이션될 수 있는 원형 이중 가닥 DNA 루프를 나타내는 "플라스미드(plasmid)"이다. 또 다른 타입의 벡터는 바이러스 벡터이며, 여기서 추가 DNA 세그먼트는 바이러스 게놈에 라이게이션될 수 있다. 특정 벡터는 이들이 도입된 숙주 세포(예를 들어, 박테리아 복제 기원을 갖는 박테리아 벡터 및 에피솜 포유류 벡터)에서 자율 복제가능하다. 다른 벡터(예를 들어, 비-에피솜 포유류 벡터)는 숙주 세포 내로 도입시 숙주 세포의 게놈 내에 통합되어 숙주 게놈과 함께 복제된다. 또한, 특정 벡터는 작동 가능하게 연결된 유전자의 발현을 지시할 수 있다. 이러한 벡터는 본 명세서에서 "발현 벡터(expression vectors)"로 지칭된다. 일반적으로, 재조합 DNA 기술에서 유용성을 갖는 발현 벡터는 종종 플라스미드 형태이다. 용어 "플라스미드" 및 "벡터"는 플라스미드가 가장 일반적으로 사용되는 형태의 벡터이기 때문에 상호교환적으로 사용될 수 있다. 그러나, 본 발명은 코스미드, 바이러스 벡터(예, 복제 결함이 있는 레트로바이러스, 아데노바이러스 및 아데노-관련 바이러스) 및 동등한 기능을 수행하는 파지 벡터와 같은 다른 형태의 발현 벡터를 포함하는 것으로 의도된다.
본 발명에 따른 벡터는 시험관 내에서, 예를 들어 RNA의 생산에 사용될 수 있거나 숙주 세포를 형질감염시키거나 형질변형시키는데 사용될 수 있다.
본 발명의 벡터는 예를 들어, 과발현을 위해 본 발명의 폴리펩티드를 3개, 4개 또는 5개와 같이 2개 이상 포함할 수 있다.
본 발명의 재조합 발현 벡터는 숙주 세포에서 핵산의 발현에 적합한 형태로 본 발명의 핵산을 포함하며, 이는 재조합 발현 벡터가 발현을 위해 사용될 숙주 세포에 기반하여 선택된 하나 이상의 조절 서열을 포함하는 것을 의미하며, 상기 조절 서열은 발현될 핵산 서열에 작동가능하게 연결된다. 코딩 서열에 "작동가능하게 연결된(operably linked)" 프로모터, 인핸서 또는 다른 발현 조절 신호와 같은 조절 서열은 코딩 서열의 발현이, 예를 들어, 전사가 프로모터에서 시작하여 상기 폴리펩티드를 코딩하는 DNA 서열을 통해 진행하는 것과 같이, 이들의 의도된 목적에 맞추어 이들이 기능하도록 배치된 조절 서열 또는 상기 서열과 양립가능한 조건하에서 달성되는 식으로 배치된다. 용어 "조절 서열(regulatory sequence 또는 control sequence)"은 프로모터, 인핸서 및 기타 발현 조절 요소(예, 폴리아데닐화 시그널)를 포함하는 것으로 의도된다. 이러한 조절 서열은 예를 들어 Goeddel; Gene Expression Technology : Methods in Enzymology 185, Academic Press, San Diego, CA (1990)에 기술되어 있다. 용어 조절(regulatory 또는 control) 서열은 많은 타입의 숙주 세포에서 뉴클레오티드 서열의 구성적 발현을 지시하는 서열 및 특정 숙주 세포에서만 뉴클레오티드 서열의 발현을 지시하는 서열(예를 들어, 조직 특이적 조절 서열)을 포함한다.
따라서, 주어진 숙주 세포에 대한 벡터 또는 발현 구조물은 제 1 발명의 폴리펩티드를 코딩하는 서열의 코딩 스트랜드와 관련하여 5'-말단에서 3'-말단으로 순차적으로 서로 작동가능하게 연결된 다음의 엘리먼트들을 포함할 수 있다: (1) 주어진 숙주 세포에서 폴리펩티드를 코딩하는 뉴클레오티드 서열의 전사를 지시할 수 있는 프로모터 서열; (2) 진핵 코작(Kozak) 컨센서스 서열 또는 원핵 리보솜 결합 부위/샤인-달가노(Shine-Dalgarno) 서열과 같은 번역 개시 서열, (3) 선택적으로, 주어진 숙주 세포로부터 배양 배지로 폴리펩티드의 분비를 지시할 수 있는 신호 서열; (4) 본 발명의 폴리펩티드의 성숙 및 바람직하게는 활성 형태를 코딩하는 본 발명의 DNA 서열; 및 바람직하게는 또한 (5) 상기 폴리펩티드를 코딩하는 뉴클레오티드 서열의 하류에서 전사를 종결시킬 수 있는 전사 종결 영역(종결자).
본 발명에 따른 뉴클레오티드 서열의 하류에는 하나 이상의 전사 종결 부위(예: 종결자)를 함유하는 3' 비번역 영역이 있을 수 있다. 종결자의 오리진은 그다지 중요하지 않다. 예를 들어, 종결자는 폴리펩티드를 코딩하는 DNA 서열에 고유한 것일 수 있다. 그러나, 바람직하게는 효모 종결자가 효모 숙주 세포에 사용되며, 사상균류 종결자는 사상균류 숙주 세포에 사용된다. 보다 바람직하게, 종결자는 숙주 세포(폴리펩티드를 코딩하는 뉴클레오티드 서열이 발현됨)에 내인성이다. 전사된 영역에는 번역을 위한 리보솜 결합 부위가 있을 수 있다. 구조물에 의해 발현된 성숙 전사물의 코딩 부분은 처음에 AUG를 개시하는 번역 및 번역될 폴리펩티드의 말단에 적절히 위치하는 종결 코돈을 포함할 것이다.
본 발명의 폴리뉴클레오티드의 증진된 발현은 또한, 예를 들어, 발현 숙주로부터 관심 단백질의 발현 및, 원하는 경우에 상기 발현 숙주로부터 관심 단백질의 분비 수준을 증가시키기 위해 그리고/또는 본 발명의 폴리펩티드의 발현의 유도가능한 조절을 제공하기 위해 프로모터, 분비 리더 및/또는 종결자 영역과 같은 이종 조절 영역의 선택에 의해 달성될 수 있다.
발현 벡터의 디자인은 형질전환될 숙주 세포의 선택, 목적하는 단백질의 발현 수준 등과 같은 인자에 좌우될 수 있음이 당업자에 의해 인식될 것이다. 본 발명의 발현 벡터와 같은 벡터는 숙주 세포 내로 도입되어 이에 의해 본 명세서에 기재된 바와 같은 핵산에 의해 코딩되는 단백질 또는 펩티드(예, 본 발명의 HMFCA 디하이드로게나아제 또는 운반체, 이의 돌연변이 형태, 프래그먼트, 변이체 또는 이의 기능적 등가물, 융합 단백질 등)를 생산할 수 있다.
상기 개시된 바와 같이, 용어 "조절 서열(regulatory sequence 또는 control sequence)"은 적어도 폴리펩티드의 발현에 필요하고 그리고/또는 유리할 수 있는 어느 성분을 포함하는 것으로 정의된다. 어느 조절 서열은 폴리펩티드를 코딩하는 본 발명의 핵산 서열에 대해 고유한 것이거나 또는 이질적인 것일 수 있다. 이러한 조절 서열은 이에 한정하는 것은 아니나, 프로모터, 리더, 최적 번역 개시 서열(Kozak, 1991, J. Biol. Chem. 266: 19867-19870에 기재된 바와 같음) 또는 원핵 샤인-델가노 서열, 분비 신호 서열, 프로-펩티드 서열, 폴리아데닐화 서열, 전사 종결자를 포함할 수 있다. 최소한, 조절 서열은 전형적으로 프로모터 및 번역 개시 및 정지 신호를 포함한다.
안정적으로 형질전환된 미생물은 도입된 분자가 성장하는 배양물에서 유지되고, 복제되고, 분리되도록 하나 이상의 DNA 프래그먼트가 도입된 것이다. 안정한 형질전환은 다중 또는 단일 염색체 통합(들) 또는 (a) 플라스미드 벡터(들)와 같은 염색체외 엘리먼트에 의한 것일 수 있다. 플라스미드 벡터는 특정 DNA 단편에 의해 코딩된 폴리펩티드의 발현을 지시할 수 있다.
발현은 구성적이거나 또는 특정 폴리펩티드를 코딩하는 기능적으로 연관된 DNA 프래그먼트의 높은 수준의 전사를 가능하게 하는 유도성 (또는 억제성) 프로모터에 의해 조절될 수 있다.
본 발명의 폴리펩티드의 발현을 위해 사용된 정확한 메카니즘에 관계없이, 이러한 발현은 당해 분야에 공지된 방법에 의해 이들 폴리펩티드를 코딩하는 유전자를 다른 숙주 세포에 도입함으로써 전달될 수 있는 것으로 고려된다. 본 명세서에서 정의된 유전적 엘리먼트는 관련 폴리펩티드를 발현하거나 발현을 조절하는 단백질, 특히 효소, 아포단백질 또는 안티센스 RNA와 같은 산물에 대한 발현 가능한 코딩 서열을 갖는 핵산(일반적으로 DNA 또는 RNA)을 포함한다. 발현된 단백질은 효소로서 기능할 수 있고, 효소 활성을 억제 또는 디리프레스(derepress)할 수 있거나 또는 효소의 발현을 조절할 수 있거나 또는 예를 들어, 대사물과 같은 화합물의 운반체로서 기능할 수 있다. 이러한 발현가능한 서열을 코딩하는 재조합 DNA는 염색체(예를 들어, 상동성 재조합에 의해 숙주 세포 염색체에 통합됨) 또는 염색체외(예를 들어, 하나 이상의 플라스미드, 코스미드 및 자가 복제가능한 다른 벡터에 의해 운반됨)일 수 있다. 본 발명에 따라 숙주 세포를 형질전환하는데 이용되는 재조합 DNA는 구조 유전자 및 전사 인자 이외에, 단백질, 아포단백질 또는 안티센스 RNA에 대한 코딩 서열의 발현 또는 디리프레션을 조절하도록 작용하는 프로모터, 리프레서 및 인핸서를 포함하는 발현 조절 서열을 포함할 수 있다. 예를 들어, 이러한 조절 서열은 숙주 세포 게놈에서 이미 코딩된 선택된 폴리펩티드의 과발현을 촉진시키기 위해 와일드 타입 숙주 세포 내로 삽입되거나, 또는 염색체 외로 코딩된 폴리펩티드의 합성을 조절하는데 사용될 수 있다.
재조합 DNA는 이에 한정하는 것은 아니나, 플라스미드, 코스미드, 파지, 효모 인공 염색체 또는 유전 엘리먼트의 숙주 세포 내로의 전달을 매개하는 다른 벡터를 포함하는 어느 수단에 의해 숙주 세포 내로 도입될 수 있다. 이들 벡터는 벡터의 복제 및 벡터에 의해 운반되는 유전 엘리먼트를 조절하는 cis-작용 조절 엘리먼트와 함께 복제의 오리진을 포함할 수 있다. 유전 엘리먼트가 도입된 숙주 세포의 확인을 돕기 위해 선별가능한 마커가 벡터 상에 존재할 수 있다.
숙주 세포 내로 유전 엘리먼트를 도입하기 위한 수단(예, 클로닝)은 당업자에게 잘 알려져 있다. 본 발명에 따라 유전 엘리먼트를 삽입하기 위해 염색체 외 다중 복사 플라스미드 벡터를 이용할 수 있다. 숙주 세포 내로의 유전 엘리먼트의 플라스미스로 운반되는 도입(plasmid-borne introduction)은 제한 효소를 이용한 플라스미드 벡터의 초기 클리빙(cleaving), 이어서 본 발명에 따라 표적화된 효소 종을 코딩하는 플라스미드 및 유전 엘리먼트의 라이게이션을 포함한다. 라이게이션된 재조합 플라스미드의 재순환시, 플라스미드를 숙주 세포 내로 운반하기 위해 감염(예를 들어, 파지 람다에서의 패키징) 또는 플라스미드 운반을 위한 다른 메커니즘(예를 들어, 일렉트로포레이션, 마이크로인젝션 등)이 이용된다. 유전 엘리먼트를 숙주 세포 내로 삽입하기에 적합한 플라스미드는 당업자에게 잘 알려져 있다.
다른 유전자 클로닝 방법으로는 이에 한정하는 것은 아니나, 염색체 내로 유전 물질의 직접 통합을 포함한다. 이것은 숙주 염색체의 상동성 DNA 서열이 측면에 위치하는 비-복제 플라스미드에서 본 명세서에 기술된 유전 엘리먼트를 클로닝하는 것을 포함하는 다양한 수단에 의해 일어날 수 있으며; 상기 재조합 플라스미드를 숙주 내로 형질전환시킬 때, 유전 엘리먼트는 DNA 재조합에 의해 염색체 내로 도입될 수 있다. 그러한 재조합 균주는 통합 DNA 프래그먼트가 항생제 내성과 같은 선별 마커를 함유하는 경우에 회수될 수 있다. 대안적으로, 유전 요소는 복제되지 않는 플라스미드를 사용하지 않고 숙주 세포의 염색체 내로 직접 도입될 수 있다. 이는 숙주 염색체의 상동성 DNA 서열을 또한 함유하는 본 발명에 따른 유전 엘리먼트의 DNA 프래그먼트를 합성적으로 생산함으로써 수행될 수 있다. 이러한 합성 DNA 단편이 또한 선별 마커를 함유하는 경우에, 유전 엘리먼트는 숙주 염색체 내로 삽입될 수 있다.
본 발명은 또한 본 발명의 HMFCA 디하이드로게나아제 활성을 갖는 폴리펩티드 및/또는 본 발명의 푸라닉 화합물 운반 역량을 갖는 폴리펩티드를 제조하는 방법에 관한 것으로, 이 방법은 상기 폴리펩티드의 발현에 도움이 되는 조건하에서 본 발명에 따른 세포를 배양하는 것, 및 선택적으로 발현된 폴리펩티드를 회수하는 것을 포함하며, 뿐만 아니라 이러한 방법에 의해 수득가능한 폴리펩티드에 관한 것이다.
푸라닉
화합물의 산화 방법
추가적인 견지로, 본 발명은 푸라닉 화합물을 산화시키는 방법에 관한 것이다. 특히, 본 발명은 FDCA의 푸라닉 전구체가 산화되는 방법에 관한 것이다. 본 발명의 방법은 생성물을 생성시키는 단일 산화 반응 단계를 포함할 수 있다(예를 들어, HMFCA를 FFA로 산화시킴). 대안적으로, 본 발명의 방법은 하나 이상의 산화 반응 단계를 포함할 수 있으며, 각 단계는 최종 중간체가 최종 생성물인 중간체를 생성한다. HMF가 순차적 산화 단계에서 FDCA로 산화되는 이러한 일련의 단계의 예는 다음과 같다: 1) HMF가 먼저 HMFCA로 산화되고, 이는 제 2 단계에서 FFA로 산화되고, 이어서 FDCA로 최종 산화되거나, 택일적으로, Dijkman et al.(2014, Angew. Chem. 53(2014) 6515-8)에 기술된 바와 같이, 2) HMF는 먼저 DFF로 산화되고, 제 2 단계에서 FFA로 산화되고, 그 다음 마지막으로 FDCA로 산화된다. 따라서, 본 발명의 바람직한 방법에서, FDCA의 하나 이상의 푸라닉 전구체는 일련의 단계에서 궁극적으로 FDCA로 산화된다.
일 구현으로, 본 발명은 적어도 HMFCA의 FFA로의 산화를 포함하는 방법에 관한 것이다. 바람직하게, 상기 방법은 HMFCA를 FFA로 산화시키는 방법으로서, 여기서 상기 방법은 HMFCA 존재하에 세포를 배양하는 단계를 포함하며, 상기 세포는 본 명세서에서 상기 정의된 바와 같은 HMFCA 디하이드로게나아제를 발현하는 세포이거나, 또는 푸라닉 화합물 운반 역량을 가지며, 또한 본 명세서에 정의된 바와 같은 HMFCA 디하이드로게나아제 또는 옥시다아제 활성을 포함하는 폴리펩티드를 발현하는 세포이다. 바람직하게, 상기 세포는 예를 들어 하기에 명시한 바와 같이, 상기 세포에 의해 HMFCA의 산화에 도움이 되는 조건하에, HMFCA의 존재하에서 배양된다.
또 다른 구현으로, 본 발명은 FDCA를 생산하는 방법에 관한 것이다. FDCA를 생산하는 방법은 바람직하게 FDCA의 하나 이상의 푸라닉 전구체를 포함하는 배지에서 세포를 배양하는 단계를 포함하며, 여기서 상기 세포는 본 명세서에서 상기 정의된 바와 같은 HMFCA 디하이드로게나아제를 발현하는 세포이거나, 또는 푸라닉 화합물 운반 역량을 가지며, 또한 본 명세서에서 상기 정의된 바와 같은 HMFCA 디히드록시게나아제 또는 옥시다아제 활성을 포함하는 폴리펩티드를 발현하는 세포이다. 바람직하게, 상기 세포는 예를 들어 하기에 명시한 바와 같이, 상기 세포에 의해 HMFCA의 산화에 도움이 되는 조건하에, HMFCA의 존재하에서 배양된다.
바람직하게는, 상기 공정에서, FDCA의 적어도 하나의 푸라닉 전구체는 HMF, DHF, HMFCA, FFA 및 DFF로 이루어진 그룹으로부터 선택되며, 그 중 HMF가 가장 바람직하다. FDCA의 푸라닉 전구체는 바람직하게 하나 이상의 헥소스 당으로부터, 바람직하게는 산-촉매 탈수, 예를 들면, 산의 존재하에 통상적인 방식으로 가열함으로써 얻어진다. 프룩토오스로부터 HMF를 생성하는 기술은 잘 확립되고 견고하다(van Putten et al., 2013, Chem.Rev.113, 1499-1597 참조). 또한, 글루코오스가 풍부한 공급 원료를 사용할 수 있지만, HMF의 열 화학적 형성은 프룩토오스로부터 보다 효율적으로 진행된다. 따라서, 글루코오스 이소머라아제를 사용하여 글루코오스를 프룩토오스로 전환시키는 추가적인 효소 단계가 포함될 수 있다. 후자의 방법은 예를 들어, 가수분해 전분으로부터 고 프룩토오스 옥수수 시럽(HFCS)을 생산하기 위한 것과 같은 식품 산업에서 잘 정립되어있다. 글루코오스는 또한 예를 들어, van Putten et al. (2013, 상기 참조)에 기술된 바와 같이 촉매 및 용매의 조합을 사용하여 프룩토오스로 화학적으로 이성화될 수 있다.
헥소스 당은 일반적으로 바이오매스로부터 얻어진다. "바이오매스(biomass)"라는 용어는 농산물(농작물 잔류물과 같은 식물성 물질 및 동물성 물질을 포함), 임업(목재 자원과 같은) 및 어업 및 양식업을 포함하는 관련 산업의 생물학적 오리진의 산물, 폐기물 및 잔류물의 생물학적 분획뿐만 아니라 도시의 고형 폐기물 또는 폐지와 같은 산업 및 도시 폐기물의 생분해성 분획을 의미한다. 바람직한 구현으로, 바이오매스는 식물 바이오매스, 보다 바람직하게 (발효성) 헥소스/글루코오스/당-풍부 바이오매스, 예를 들어, 사탕 수수, 전분-함유 바이 매스, 예를 들면, 밀 곡물 또는 옥수수 짚, 또는 옥수수, 밀, 보리 또는 이들의 혼합물과 같은 시리얼 곡물일 수 있다. 자연스럽게 푸룩탄이 풍부한 농작물(예, 토피낭부(topinambur) 또는 치커리 뿌리)이 바람직하다.
헥소스 당은 이러한 바이오 매스의 가수분해에 의해 수득될 수 있다. 바이오매스의 가수분해 방법은 당업계에 공지되어 있고 예를 들어, 수증기 및/또는 글루코아밀라아제와 같은 카르보하이드라아제의 사용을 포함한다.
본 발명의 방법에 사용하기 위한 또 다른 바람직한 타입의 바이오매스는 소위 "제 2 세대" 리그노셀룰로오스 공급 원료이며, 이는 보다 많은 양의 FDCA가 보다 지속가능한 방식으로 제조되어야하는 경우에 바람직하다. 리그노셀룰로오스 공급 원료는 예를 들어, 한계지(marginal lands)에서 자라 식량 작물과 직접 경쟁하지 않는 전용 에너지 작물에서 얻을 수 있다. 또는, 리그노셀룰로오스 공급 원료는 예를 들어, 도시 고형 폐기물, 폐지, 목재 잔류물(제재소 및 제지 공정 폐기물 포함)과 같은 부산물로서 수득될 수 있으며, 농작물 잔류물이 고려될 수 있다. 농작물 잔류물의 예로는 사탕 수수에서 추출한 바가스(bagasse) 및 여러 옥수수와 밀가루를 포함한다. 옥수수 부산물의 경우, 세 가지 폐기물은 섬유, 구근 및 여물이다. 또한, 임업 바이오매스가 공급 원료로 사용될 수 있다. 2 세대 공급 원료를 본 발명의 발효 산물로 전환시키기 위해서는, 셀룰로오스 및 헤미셀룰로오스를 모노사카 라이드로서 방출할 필요가 있다. 여기서는 열 화학적 접근법(일반적으로 전처리라고 함), 효소 접근법 또는 두 가지 방법론의 조합이 적용된다. 전처리는 당을 완전히 유리시키거나 폴리머 화합물을 이후의 효소 공격에보다 보다 접근가능하도록 한다. 다른 타입의 전처리는 액체 온수, 증기 폭발, 산 전처리, 알칼리 전처리 및 이온성 액체 전처리를 포함한다. 다양한 화합물의 상대적인 양은 사용된 원료 및 사용된 전처리 모두에 의존할 것이다. 그러한 리그노셀룰로오스 공급 원료로부터 모노사카라이드 당의 방출을 위해, 적절한 카보하이드라아제가 사용되며, 예를 들어, 아라비나아제, 크실라나아제, 글루카나아제, 아밀라아제, 셀룰라아제, 글루카나아제 등을 포함한다.
본 발명의 방법은 바람직하게 FDCA 또는 HMFCA와 같이 상기 방법에서 생성된 산화 생성물(들)의 회수 단계를 더 포함한다. 바람직하게, 산화 생성물은 산화 단계를 수행하는 세포가 배양되는 배지로부터 회수된다. FDCA, FDVIFCA 등과 같은 산화 생성물은 반응 혼합물 또는 매질로부터 예를 들어, (산 또는 염) 침전, 후속 냉각 결정화 및 결정화된 산화 생성물, 예컨대 결정화된 FDCA의 분리에 의해 회수될 수 있다. 그러나, 예를 들어, 당해 기술분야에 알려진 산 또는 염 침전 및 용매 추출과 같은 다른 회수 방법이 적합하다. FDCA의 회수를 위한 염 침전은 예를 들어, Mg2+와 같은 2가 (금속) 양이온을 사용하여 수행될 수 있다.
산화 반응은 바람직하게 세포에 가장 적합한 온도에서 수행되고, 함유된 산화 환원 효소는 세포이다. 따라서, 고온성 세포 및 효소의 경우, 온도는 바람직하게 예를 들면, 50, 55, 60 또는 65℃ 초과와 같은 예를 들면, 45-122℃ 범위와 같이, 45℃ 이상이다. 그러나, 중온균(mesophiles)의 효소를 함유하는 중온성 세포의 경우, 산화 반응은 바람직하게 비교적 온화한 온도, 예를 들어, 10-80℃, 보다 바람직하게 20-45℃, 가장 바람직하게는 25-40℃에서 수행된다.
산화 반응은 바람직하게 FDCA가 중성 형태 또는 완전히 해리된 형태 중 어느 하나인 pH에서 수행되어 염 형성이 조절될 수 있다. FDCA에 2개의 산부(acid moieties)가 존재한다는 관점에서, 2개의 별도의 바람직한 pH 범위가 있다. 반응 중 pH는 pH 1 내지 6, 바람직하게는 pH 1 내지 4, 가장 바람직하게는 pH 1 내지 3일 수 있다. 대안적으로, 반응 동안의 pH는 pH 5 내지 9, 바람직하게는 pH 5 내지 8, 가장 바람직하게는 pH 5 내지 7이다. 숙련자는 숙주 세포의 요건이 또한 상기 방법에 적절한 pH 값의 선택에도 영향을 미친다는 것을 이해할 것이다. 특정 숙주 세포에 적합한 pH 값의 선택은 숙련자의 범위 내에 있으며, 표준 텍스트 북으로부터 도출될 수 있다. 예를 들어, 슈도모나스 푸티다(Pseudomonas putida) S12 또는 KT2440 균주를 포함하는 슈도모나스 푸티다(Pseudomonas putida)의 경우, 바람직한 pH 범위는 pH 5 내지 7이다.
반응 시간은 6 내지 150시간, 보다 바람직하게 6 내지 18 시간이다. 바람직하게, 산소는 예를 들어, 순수 산소로서 또는 공기 중의 분자 산소, 또는 물과 같은 산소 공급원, 또는 푸라닉 산화 효소의 요건에 따라 달라지는 다른 산소 공급원으로부터 반응 매질 내의 세포로 공급된다. 공기는 분자 산소의 공급원으로 편리하게 사용될 수 있다.
반응기는 어느 적합한 (폭기된) 바이오리액터일 수 있다. 이는 배치(batch)로, 연속적으로 또는 바람직하게는 페드-배치(fed-batch)로 작동될 수 있다.
푸라닉 화합물을 산화시키는 본 발명의 방법은, 예를 들어, 바이오 연료 및 생화학 물질의 생산을 위한 발효용 공급 원료와 같이, 푸라닉 화합물이 유해한 것으로 여겨지는 공급 원료로부터 푸라닉 화합물의 제거에 유리하게 적용될 수 있다. 보다 바람직하게, 푸라닉 화합물을 산화시키는 방법은 폴리에스테르(플라스틱)의 제조를 위한 모노머 전구체로서 FDCA의 바이오프로덕션(생물 생성)에 적용되며, 여기서 FDCA는 폴리에스테르 PET에서 PTA를 대신할 수 있으며, 이 경우에 바이오베이즈드(biobased) 폴리에틸렌푸란디카르복실레이트(PEF)를 생성시킬 수 있다. FDCA는 또한 다양한 유익한 화합물에 대한 기질로서 사용될 수 있는데, 예를 들면. 숙신산, 2,5-비스(아미노메틸)-테트라히드로푸란, 2,5-디히드록시메틸-테트라히드로푸란, 2,5-디히드록시메틸푸란 및 2,5-푸란디카르브알데히드의 제조를 위한 기질로서 사용된다. FDCA는 알키드 수지 및 열가소성 코팅에서와 같은 코팅의 제조에 사용될 수 있다. 또한, 이는 바이오 연료에서 자일렌 등가물로서 및 용제로서 사용될 수 있다. FDCA는 이의 디올로 전환될 수 있으며, 이는 PET-유사(PET-like) 폴리에스테르 및 폴리우레탄에 사용될 수 있다. 또한, FDCA는 이의 디아민으로 전환될 수 있고, 디아민은 사슬 연장제로서 사용될 수 있고, 디아민은 폴리우레탄의 제조에 사용될 수 있는 디-이소시아네이트로 전환될 수 있다.
따라서, 추가의 견지로, 본 발명은 하나 이상의 FDCA 모노머로부터 폴리머를 제조하는 방법에 관한 것으로서, 상기 방법은 a) 상술한 바와 같은 본 발명의 산화 방법에서 FDCA 모노머를 제조하는 단계; 및 b) a)에서 얻어진 FDCA 모노머로부터 폴리머를 제조하는 단계를 포함한다. 바람직하게 상기 폴리머는 폴리에틸렌푸란디카르복실레이트(PEF)이다.
또 다른 견지로, 본 발명은 본 발명의 세포를 하나 이상의 푸라닉 전구체의 FDCA에서 FDCA로의 바이오트랜스포메이션을 위해 사용하는 용도에 관한 것으로, 상기 세포는 본 명세서에서 상기 정의된 바와 같은 HMFCA 디하이드로게나아제를 발현하는 세포이거나, 또는 푸라닉 화합물 운반 역량을 가지며 또한 본 명세서에서 상기 정의된 바와 같은 HMFCA 디하이드로게나아제 또는 옥시다아제 활성을 포함하는 폴리펩티드를 발현하는 세포이다. 바람직하게, FDCA로 바이오트랜스포메이션된 FDCA의 적어도 하나의 푸라닉 전구체는 HMF, DHF, HMFCA, FFA 및 DFF로 구성되는 그룹으로부터 선택되며, 그 중 HMF가 가장 바람직하다.
HMFCA
디하이드로게나아제를
코딩하는
HMFCA
디하이드로게나아제
폴리펩티드 및 핵산
본 발명의 다른 견지로, 본 발명은 HMFCA 디하이드로게나아제 활성을 갖는 폴리펩티드에 관한 것이다. HMFCA 디하이드로게나아제 활성을 갖는 폴리펩티드는 SEQ ID NO: 1(아에리바실러스 팔리더스(Aeribacillus pallidus))의 아미노산 서열과 적어도 81.65, 81.7, 81.8, 81.85, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 95, 96, 97, 98, 99 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하거나 또는 이로 구성되나, 그 외에는 본 명세서에서 상기 정의된 바와 같다. 바람직하게, 상기 폴리펩티드는 분리된 폴리펩티드이다.
본 발명은 또한 다음 중 적어도 하나를 포함하는 핵산 분자에 관한 것이다:
a) HMFCA 디하이드로게나아제 활성을 갖는 폴리펩티드를 코딩하는 뉴클레오티드 서열로서, 상기 폴리펩티드는 SEQ ID NO: 1의 아미노산 서열과 적어도 81.65, 81.7, 81.8, 81.85, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 95, 96, 97, 98, 99 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하거나 또는 이로 구성되는, 뉴클레오티드 서열;
b) SEQ ID NO: 12 또는 13에 나타낸 뉴클레오티드 서열;
c) 길이가 10, 15, 20, 30, 50 또는 100 뉴클레오티드인 (a) 또는 (b)에 정의된 바와 같은 뉴클레오티드 서열의 프래그먼트;
d) 유전 암호의 축퇴(degeneracy)에 기인하여 b) 또는 c)의 뉴클레오티드 서열의 서열과 상이한 뉴클레오티드 서열; 및
e) a) 내지 d)에서 정의된 뉴클레오티드 서열의 리버스 컴플리먼트인 뉴클레오티드 서열.
본 발명의 또 다른 견지는 본 절의 상기 a) 내지 e)에서 정의된 바와 같은 뉴클레오티드 서열을 포함하는 클로닝 및 발현 벡터를 포함하는 벡터에 관한 것이며, 상기 벡터는 본 명세서에서 상기 정의된 바와 같다.
또 다른 견지로, 본 발명은 i) 본 절에서 상기 정의된 바와 같은 HMFCA 디하이드로게나아제 활성을 갖는 폴리펩티드 및 ii) 본 절에서 상기 정의된 바와 같은 핵산 분자 중 적어도 하나를 포함하는 세포에 관한 것이다. 바람직하게, 상기 세포는 본 절에서 상기 a) 내지 e)에서 정의된 바와 같은 뉴클레오티드 서열, 또는 이러한 뉴클레오티드 서열을 포함하는 벡터를 포함하거나 이로 형질변형된 세포이다. 상기 세포는 바람직하게 분리된 세포 또는 배양된 세포이고, 그렇지 않으면 상기 세포는 바람직하게 본 명세서에서 상기 정의된 바와 같고, 바람직하게 상기 세포는 상기 정의된 유전적 변형 중 하나 이상을 포함한다. 상기 세포는 상술한 바와 같은 어느 방법, 공정 및 용도에 적용될 수 있다.
푸라닉
화합물 운반체 폴리펩티드 및 이러한 운반체 폴리펩티드를 코딩하는 핵산
또 다른 견지로, 본 발명은 푸라닉 화합물 운반 역량을 갖는 폴리펩티드에 관한 것이다. 상기 폴리펩티드는 바람직하게 HMFCA를 상기 세포 내로 운반하는 역량을 갖는다. 바람직하게 상기 폴리펩티드는 SEQ ID NO: 17(아에리바실러스 팔리더스(Aeribacillus pallidus))의 아미노산 서열과 적어도 86.5, 87, 88, 89, 90, 91, 92, 93, 94, 95, 95, 96, 97, 98, 99 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하거나 또는 이로 구성되나, 그 외에는 본 명세서에서 상기 정의된 바와 같다. 바람직하게, 상기 폴리펩티드는 분리된 폴리펩티드이다.
본 발명은 또한 다음 중 적어도 하나를 포함하는 핵산 분자에 관한 것이다:
a) 적어도 HMFCA를 상기 세포 내로 운반하는 능력을 갖는 폴리펩티드를 코딩하는 뉴클레오티드 서열로서, 상기 폴리펩티드는 SEQ ID NO: 17의 아미노산 서열과 적어도 86.5, 87, 88, 89, 90, 91, 92, 93, 94, 95, 95, 96, 97, 98, 99 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함하거나 또는 이로 구성되는, 뉴클레오티드 서열;
b) SEQ ID NO: 18에 나타낸 뉴클레오티드 서열;
c) 길이가 10, 15, 20, 30, 50 또는 100 뉴클레오티드인 (a) 또는 (b)에 정의된 바와 같은 뉴클레오티드 서열의 프래그먼트;
d) 유전 암호의 축퇴(degeneracy)에 기인하여 b) 또는 c)의 뉴클레오티드 서열의 서열과 상이한 뉴클레오티드 서열; 및
e) a) 내지 d)에서 정의된 뉴클레오티드 서열의 리버스 컴플리먼트인 뉴클레오티드 서열.
본 발명의 또 다른 견지는 본 절의 상기 a) 내지 e)에서 정의된 바와 같은 뉴클레오티드 서열을 포함하는 클로닝 및 발현 벡터를 포함하는 벡터에 관한 것이며, 상기 벡터는 본 명세서에서 상기 정의된 바와 같다.
또 다른 견지로, 본 발명은 i) 본 절에서 상기 정의된 바와 같은 푸라닉 화합물 운반 역량을 갖는 폴리펩티드 및 ii) 본 절에서 상기 정의된 바와 같은 핵산 분자 중 적어도 하나를 포함하는 세포에 관한 것이다. 바람직하게, 상기 세포는 본 절에서 상기 a) 내지 e)에서 정의된 바와 같은 뉴클레오티드 서열, 또는 이러한 뉴클레오티드 서열을 포함하는 벡터를 포함하거나 이로 형질변형된 세포이다. 상기 세포는 바람직하게 분리된 세포 또는 배양된 세포이고, 그렇지 않으면 상기 세포는 바람직하게 본 명세서에서 상기 정의된 바와 같고, 바람직하게 상기 세포는 상기 정의된 유전적 변형 중 하나 이상을 포함한다. 상기 세포는 상술한 바와 같은 어느 방법, 공정 및 용도에 적용될 수 있다.
본 문서와 이의 청구범위에서, 동사 "~을 포함한다"라는 동사는 그 단어 뒤에 오는 항목이 포함되지만 특별히 언급되지 않은 항목은 제외되지 않는다는 것을 의미하는 비-제한적 의미로 사용된다. 또한, 부정관사 "a" 또는 "an"(하나의)에 의한 하나의 요소에 대한 언급은 문맥상 하나의 요소만이 명백하게 요구되는 경우를 제외하고는, 하나 이상의 요소가 존재할 가능성을 배제하지 않는다. 따라서, 부정관사 "a"또는 "an"(하나의)은 일반적으로 "적어도 하나(at least one)"를 의미한다.
본 명세서에 인용된 모든 특허 및 문헌은 그 전체가 본 명세서에 참고문헌으로 편입된다.
하기 실시예는 본 발명을 예시하기 위한 것일 뿐, 본 발명의 범위가 이들로 한정되는 것은 아니다.
실시예
일반적인 방법
균주 및 플라스미드
슈도모나스 푸티다(Pseudomonas putida) S12Agcd 또는 P. 푸티다(각각, P. putida) KT2440Agcd(P. 푸티다(P. putida) S12(ATCC 700801), P. 푸티다(P. putida) KT2440(DSM6125)의 글루코오스-디하이드로게나아제 결핍 돌연변이) 또는 와일드 타입 P. 푸티다(P. putida) S12를 아에리바실러스 팔리더스(Aeribacillus pallidus) 균주 CA1828의 yiaY 유전자 발현을 위한 숙주로서 사용하였다(하기 참조). 에쉐리키아 콜라이(Escherichia coli) TG90 균주는 일반적인 클로닝목적으로 사용되었다.
A. 팔리더스(A. pallidus) 유전자의 에피솜(episomal) 발현을 위해 pBBR1MCS 유래 pBT'mcs(Koopman et al., 2010a, Biores Technol 101: 6291-6196)를 사용하였다. pBT'mcs에서, 표적 유전자의 발현은 구성적 tac 프로모터로부터 유도된다.
배지 및 배양 조건
중온성 균(Mesophile) 미네랄 염 배지(MMM)는 다음과 같은 것을 함유하였다(탈이온수 1리터당): 명시된 바와 같은 탄소 공급원이 보충된 K2HPO4 15.52g, NaH2PO4 6.52g, (NH4)2SO4 2.0g, MgCl2·6H2O 0.1g, EDTA 10mg, CaCl2·2H2O 1mg, FeSO4·7H2O 5mg, Na2Mo4·2H2O 0.2mg, CuSO4·5H2O 0.2mg, CoCl2·6H2O 0.4mg 및 MnCl2ㆍ2H20 1mg.
호열성 균 미네랄 염 배지(TMM)는 다음과 같은 것을 함유하였다(탈이온수 1리터당): 10g의 Bis-Tris, 10μM FeSO4·7H2O, 4mM 트리신, 1.32 mM K2HPO4, 9.53 mM NH4Cl, 0.2g 효모 추출물, 5g의 NaCl, 1.47g의 Na2SO4, 0.08g의 NaHCO3, 0.25g의 KCl, 1.87g의 MgCl2·6H2O, 0.41g의 CaCl2·2H2O, 0.008g의 SrCl2·6H2O, 0.008g의 H3BO3, 0.90g의 NaNO3 및 비타민 용액(티아민, 0.1g/L; 리보플라빈 0.1g/L; 니코틴산 0.5g/L, 판토텐산 0.1g/L; 피리독사민-HCl 0.5g/L, 피리독살-HCl, 0.5g/L, D-바이오틴, 0.1g/L; 엽산, 0.1g/L, p-아미노벤조산, 0.1g/L; 코발라민, 0.1g/L). 탄소 공급원은 명시된 바와 같이 보충되었다.
중온성 균의 증식을 위한 완전한 배지로서, Luria-Bertani(LB) 브로스를 사용하였다: 10g/l Bacto trypton(Difco), 5g/l 효모 추출물(Difco), 10g/l NaCl. 플레이트 배양을 위해 LB를 1.5%(w/v) 한천(Difco)으로 응고시켰다. pBT'mcs로부터 유래된 플라스미드를 보유하는 E. 콜라이(E. coli), P. putida(P. putida) S12 또는 P. putida(P. putida) KT2440 형질전환체의 선별을 위해, 50㎍/ml의 카나마이신(Km)을 배지에 첨가하였다. 항생제는 Sigma-Aldrich에서 구입하였다. P. putida(P. putida)를 30℃에서 배양하고; E. 콜라이(E. coli)를 37℃에서 배양하였다.
호열성 균의 증식을 위한 완전 배지로서, TGP 브로스를 사용하였다: 17g/L 트립톤, 3g/L 소이(soy) 펩톤, 5g/L NaCl, 2.5g/L K2HPO4, 4g/L 글리세롤 및 4g/L Na-피루베이트(pH 7). 플레이트 배양을 위해 TGP를 1.5%(w/v) 한천(Difco)으로 응고시켰다. 아에리바실러스 팔리더스(Aeribacillus pallidus)를 60℃에서 배양하였다.
어세이
및 분석 방법
세포 건중량 ( CDW ) 측정:
박테리아 배양물의 CDW 함량은 플랫-바텀 96-웰 마이크로 플레이트(Greiner)를 사용하여 Biowave Cell Density Meter(WPA Ltd) 또는 μQuant MQX200 유니버셜 마이크로 플레이트 스펙트로포토미터(Biotek)를 사용하여 600nm(OD 600)에서 광학 밀도를 측정함으로써 검출되었다. 1.0의 OD600은 P. putida(P. putida)에 대해 0.56g CDW/L(Biowave) 또는 1.4g CDW/L(μQuant)에 해당한다.
푸란 화합물(FDCA, HMF, HMF-알코올, HMFCA 및 FFA)은 Koopman et al.(2010a, Biores Technol 101: 6291-6196)에 의해 기술된 바와 같이 RP-HPLC에 의해 분석되었다.
화학물질
5-히드록시메틸푸르푸랄(HMF)은 Eurolabs Ltd(Poynton, UK)에서 구입하였다. FDCA 및 5-히드록시메틸-푸로산(HMFCA)의 분석 표준은 각각 Immunosource B.V.(Halle-Zoersel, Belgium), Matrix Scientific(Columbia SC, USA)에서 구입하였다. 다른 모든 화학 물질은 Sigma-Aldrich Chemie B.V.(Zwijndrecht, The Netherlands)에서 구입하였다.
분자 및 유전학 기술:
게놈 DNA는 A. 팔리더스(A. Pallidus) CA1828로부터 MasterPure™ Gram Positive DNA Purification Kit(Epicenter)를 사용하여 분리 하였다. 플라스미드 DNA는 JETSTAR Maxi Plasmid Purification Kit(GENOMED, ITK diagnostics)로 분리하였다. 아가로오스-트랩된 DNA 프래그먼트를 DNA Clean & Concentrator™(Zymo research)로 분리하였다. PCR 반응은 Phusion Flash PCR Master Mix(Thermo Scientific)를 사용하여 제조자의 지시에 따라 수행하였다. 올리고뉴클레오티드 프라이머(실시예에 명시됨)는 Sigma-Aldrich에 의해 합성되었다. Gene Pulser 일렉트로포레이션 장치(BioRad)를 사용하여 일렉트로컴피턴트 세포 내로 플라스미드 DNA를 도입하였다. 다른 표준 분자 생물학 기술은 Sambrook and Russell(2001, supra)에 따라 수행되었다.
실시예
I:
HMF
대사
아에리바실러스
팔리더스
(
Aeribacillus
pallidus
) 균주의 분리
컴포스트(15g)를 0.9%(w/v) NaCl 용액 15ml와 혼합하고 750rpm 및 80℃에서 40분간 배양하였다. 생성된 컴포스트 슬러리를 60℃ 및 180rpm에서 3일 동안 쉐이크 플라스크에서 0.65g/L HMF로 보충된 TMM에서 배양하였다. 배양물을 일정한 간격으로 신선한 TMM-HMF에 옮기고, 고체 TMM-HMF 상에 플레이팅하였다. 단일 콜로니는 TMM-HMF 및 TGP 플레이트 상에서 리-스트리킹되고, HMF 및 FDCA를 대사하는 능력에 대해 재평가되었다. HMF와 FDCA 모두를 대사한 두 분리 균주(CA1809 및 CA1828 주)는 16S rDNA 시퀀싱에 의해 아에리바실러스 팔리더스(Aeribacillus pallidus)로 확인되었고, 추가 연구를 위해 선택되었다.
실시예
II
:
HMF
분해 A.
팔리더스(
A.
pallidus
)에서
새로운
디하이드로게나아제
-
촉매화
HMF
이화(
catabolic
) 경로의 확인
A. 팔리더스(A. pallidus) 균주 CA1809 및 CA1828의 게놈은 PacBio 시퀀싱을 통해 시퀀싱되고, 자동화된 ORF 콜링 및 주석(annotation)이 수행되었다. 주석된 게놈에서, 푸로산 분해 클러스터를 구성하는 쿠프리아비더스 바실렌시스(Cupriavidus basilensis) HMF14의 hmfABCDE 유전자의 동족체가 확인되었다(Koopman et al., 2010, Proc Nat Acad Sci USA 107: 4919-4924).
HMF에 부가적으로 FDCA를 대사시키는 CA1809 및 CA1828 균주의 능력을 고려하면, C. 바실렌시스(C. basilensis) HMF14에서와 같이 HMF가 FDCA를 통해 대사된다는 것을 강력하게 제시하였다. 그러나, 예상외로 HMF에서 FDCA를 거쳐 푸로익 산으로의 분해 경로를 구성하는 C. 바실렌시스(C. basilensis) HMF14의 hmfFGH 클러스터의 동족체는 발견되지 않았다. 이 결과는 HMF의 FDCA로의 산화를 위한 대안적인 경로, 그리고 후속적인 푸로익 산으로의 디카르복실화산으로의 대안적인 경로가 A. 팔리더스(A. pallidus) 분리 균주에 존재함을 제시하였다. 산화 및 디카르복실화 활성 모두를 코딩하는 유전자를 포함하는 유전자 클러스터에 대한 게놈을 채취하는 것은 알코올 디하이드로게나아제, 알데히드 디하이드로게나아제 및 두 디카르복실라아제(표 1 A 및 B)를 코딩하는 유전자들을 포함하는 추정 HMF 분해 클러스터의 확인을 이끈다. 이와 함께, 이러한 유전자는 C. 바실렌시스(C. basilensis) HMF14에서와 같이 히드로시메틸푸로익 산(HMFCA)을 통한 HMF의 FDCA로의 산화를 위한 추정 경로를 코딩하지만, 옥시다아제 활성보다는 HMFA의 포르밀푸로익 산(FFA)으로의 산화를 위한 알코올 디하이드로게나아제 활성을 포함한다.
실시예
III
: P.
푸티다(
P. putida
)에서
A.
팔리더스(
A. pallidus
)로부터
YiaY의 발현은
HMF
를
FDCA
로 산화시키는 능력을 부여한다.
yiaY 유전자를 B. 코아굴란스(B. coagulans) DSM1의 PldhL1 프로모터 영역을 포함하는 1988-bp 합성 XbaI-SalI 프래그먼트(SEQ ID NO: 15)로서 pBT'mcs에서 클로닝하여 플라스미드 pKW007을 얻었다. 플라스미드 pKW007을 P. 푸티다(P. putida) KT2440Δgcd(CA1877)에 도입하여 P. 푸티다(P. putida) CA2101을 수득하였다. pBT'mcs(균주 CA2046)를 갖는 P. 푸티다(P. putida) KT2440Δgcd를 빈 벡터 컨트롤로서 시험하였다.
P. 푸티다(P. putida) 균주 CA2101 및 CA2046을 10㎖의 MM + 80mM 글리세롤 및 50㎎/L 카나마이신이 보충된 2mM 글루코오스를 함유하는 100㎖ 쉐이크 플라스크에서 성장시켰다. 로그 단계(OD600 4)의 끝에서 세포들을 수거하고, 19.4 g/L K2HPO4, 8.15 g/L NaH2PO4, 80mM 글리세롤 및 50 mg/L 카나마이신이 보충된 MM에서 세척하고 재현탁시켰다. 세척된 세포 현탁액(1-2의 OD600에서)의 분취량(10㎖)을 100㎖ 삼각 플라스크 내의 HMF와 함께 배양하고, FDCA 분석을 위해 일정한 간격으로 샘플을 채취하였다. 도 1a는 빈 벡터 컨트롤에서 HMF가 히드록시메틸푸로닉 산(FDVIFCA)으로 빠르게 산화되지만, FDCA 형성은 완전히 없는 것을 보여준다. YiaY가 발현되면(도 1b), 축적된 FDVIFCA는 FDCA로 천천히 산화되었으며, 이는 HMFCA- 산화 디하이드로게나아제로서의 YiaY의 기능을 입증하였다.
실시예
IV
: A.
팔리더스(
A. pallidus
)로부터
YiaY
및 C. 바실렌시스(
C. basilensis
)
HMF14
로부터
Aldh
와
HmfT1
의 동시 발현을 통한
HMF
의
FDCA
로의 최적화된 산화
리보솜 결합 부위 TAGGAAAGGAAGATTAACCC(SEQ ID NO: 21)를 포함하는 A. 팔리더스(A. pallidus) CA1828의 yiaY 유전자를 합성하였다. yiaY 프래그먼트(서열 16)를 KpnI 및 XbaI로 절단하여 pBT'hmfH-adh(WO2012064195)의 hmfH 유전자를 대체하여 플라스미드 pKW010을 수득하였다. 플라스미드 pKW010을 P. putida CA2111을 생성하는 pJNNhmfT1(t)(WO2012064195)-보유하는 P. putida S12Δgcd 내로 도입하고, 그리고 P. putida CA2112를 생성하는 P. putida KT2440Δgcd(또한 pJNNhmfT1(t)를 보유함)에 도입하였다. 따라서, yiaY에 의해 코딩된 HMFCA 산화 알코올 디하이드로게나아제는 C. basilensis HMF14의 HMF 디하이드로게나아제 및 HMFCA 운반체와 함께 공동 발현되어 HMFCA 및 HMFCA 흡수로의 HMF 산화의 병목 현상을 제거할 수 있다.
P. putida CA2111 및 CA2112를 10㎖의 MM + 80mM 글리세롤 및 50㎎/L 카나마이신, 30㎎/L 젠타마이신 및 100μM의 살리실산이 보충된 2mM 글루코오스를 함유하는 100㎖ 쉐이크 플라스크에서 성장시켰다. 세포를 대수 단계(OD600 4)의 끝에서 수거하고, MM 50mg/L 카나마이신, 30mg/L 젠타마이신 및 10μM의 살리실산에 세척하고 재현탁시켰다. 세척된 세포 현탁액(1-2의 OD600에서)의 분취량(10㎖)을 100㎖ 삼각 플라스크에서 HMF와 함께 배양하고, FDCA 분석을 위해 일정한 간격으로 샘플을 채취하였다. 도 2와 3은 HMF가 HMFCA로 빠르게 산화되고, 이는 FDCA로 더욱 산화되었음을 보여준다. YiaY와 Aldh 및 HmfT1의 동시 발현이 HMF의 FDCA로의 산화를 상당히 촉진한다는 것이 명백하다.
실시예
V: C.
바실렌시스
(
C.
basilensis
)
HMF14
로부터
중온성
HMFCA
알코올 디하이드로게나아제 및
Aldh
및
HmfT1
의 동시 발현을 통한
HMF
의
FDCA
로의 산화를 위해 최적화된 균주의 구축
클로닝을 위한 제한 효소(KpnI, resp., NheI; XbaI와 호환 가능)에 대한 인식 부위(SEQ ID NO.'s: 19, 36, 38 및 39)뿐만 아니라 스페이서 TAGGAAAGGAAGATTAACCC(SEQ ID NO: 21)를 함유하는 리보좀 결합 부위를 포함하는 바실러스 크리벤시스(Bacillus kribbensis) DSM17871, 브레비바실러스 테르모러버(Brevibacillus thermoruber) 423, 바실러스 종(Bacillus sp.) FJAT-14578, 및 바실러스 종(Bacillus sp.) L1 (2012)의 yiaY 동족체를 합성하였다.
클로닝을위한 제한 효소(KpnI, resp., XbaI)에 대한 인식 부위(SEQ ID NO.'s: 35 및 37)뿐만 아니라 스페이서 GAATTCCACATGACAAGGGGAGACCGC(SEQ ID NO: 40)를 함유하는 리보솜 결합 부위를 포함하는 아네우리니바실러스 테라노벤시스(Aneurinibacillus terranovensis) DSM18919 및 브레비바실러스 파나시후미(Brevibacillus panacihumi) W25의 yiaY 동족체를 합성하였다. B. 크리벤시스(B. kribbensis) 효소(SEQ ID NO: 19), B. 테르모러버(B. thermoruber) 효소(SEQ ID NO: 36) 및 바실러스 종(Bacillus sp.) 효소들 모두(SEQ ID NO: 38 및 39)에 대한 코딩 뉴클레오티드 서열은 http://www.kazusa.or.jp/codon/.의 P. 푸티다(P. putida) 코돈 사용 표를 사용하여 아미노산 서열의 역번역((http://www.bioinformatics.org/sms2/rev_trans.html)을 통해 수득하였다. A. 테라노바(A. terranova) 및 B. 파나시후미(B. panacihumi) 효소에 대한 코딩 뉴클레오티드 서열은 GeneArt의 E. 콜라이(E. coli) 서열 최적화 툴(https://www.thermofisher.com/nl/en/home/life-science/cloning/gene-synthesis/geneart-gene-synthesis/geneoptimizer.html)을 사용하여 아미노산 서열의 역번역을 통해 수득하였다.
B. 크리벤시스(B. kribbensis), B. 테르모러버(B. thermoruber), 바실러스 종(Bacillus sp .) FJAT-14578, 및 바실러스 종(Bacillus sp .) L1(2012)의 yiaY-동족체 프래그먼트들을 KpnI 및 NheI(pBT'hmfH-adh에서 XbaI와 호환가능)로 절단하여 pBT'hmfH-adh(WO2012064195)에서 hmfH 유전자를 대체하여 플라스미드 pKW2210, pKW2212, pKW2214 및 pKW2215를 생성하였다. A. 테라노벤시스(A. terranovensis) 및 B. 파나시후미(B. panacihumi)의 yiaY-동족체 프래그먼트들을 KpnI 및 XbaI로 절단하여 pBT'hmfH-adh(WO2012064195)에서 hmfH 유전자를 대체하여 플라스미드 pKW2211 및 pKW2213을 생성하였다.
P. 푸티다(P. putida) KT2440Agcd_pJNNhmfT1(CA1965) 내로 플라스미드 pKW2210, pKW2211, pKW2211, pKW2211, pKW2212, pKW2221, pKW2214 및 pKW2215를 도입하여, aldh와 hmfT1을 포함하는 최적화된 숙주 백그라운드에서 각각 YiaY 동족체의 발현을 위해 P. 푸티다(P. putida) CA21780, CA21781, CA21782, CA21783, CA21784 및 CA21785를 수득하였다. 성능 평가를 위해, P. 푸티다(P. putida) 균주 CA21780, CA21781, CA21782, CA21783, CA21784 및 CA21785를 50㎎/L의 카나마이신, 30mg/L의 젠타마이신 및 100μM의 살리실산이 보충된 10ml의 MM+80mM 글리세롤 및 2mM 글루코오스를 함유하는 100-ml 쉐이크 플라스크에서 성장시켰다. 세포들을 대수 단계(OD600 4)의 끝에서 수거하고, 세척하고, MM 50㎎/ℓ의 카나마이신, 30㎎/L 젠타마이신 및 10μM의 살리실산에 재현탁하였다. 세척된 세포 현탁액(1-2 OD600)의 분취량(10ml)을 100-ml 삼각 플라스크에서 HMF과 함께 배양하고, 샘플들을 FDCA의 분석을 위해 정기적 간격으로 채집하였다. P. 푸티다(P. putida) CA21780, CA21781 및 CA21783에 대한 결과가 각각, 도 4, 도 5 및 도 6에 도시되어있다. 3가지 형질전환 균주 모두 HMF로부터 FDCA를 생산하였다. 그러나 상이한 균주들은 HMFCA의 일시적인 축적 및 HMF의 디히드록시메틸 푸란(HMF-OH 또는 DHF)으로의 부분적 산화에 현저한 차이를 나타내었다. 균주 P. 푸티다(P. putida) P. CA21782, CA21784 및 CA21785도 HMF로부터 FDCA를 생산하는 것으로 발견되었으며, 이는 HMFCA 산화 효소로서 6개의 모든 알코올 디하이드로게나아제들의 기능을 입증하는 것이다.
실시예
VI
:
HMFCA
운반체를 코딩하는
아에리바실러스
팔리더스(
Aeribacillus
pallidus)
proP
를 발현하는 P.
푸티다
(
P.
putida
) 균주의 구축
프라이머 proP(f)(gccgaattcATGAAGAATATCGCTAATACG; SEQ ID NO: 22) 및 proP(r)(gccgctagcTTATTTGAGGTTTCCTTTTGTTTCC; SEQ ID NO: 23)를 사용하여 PCR에 의해 아에리바실러스 팔리더스(Aeribacillus pallidus) CA1828의 게놈 DNA로부터 proP 유전자(SEQ ID NO: 18)를 증폭하였다. PCR 산물을 pJNNmcs(t)에서 1350-bp EcoRI-NheI 프래그먼트(SEQ ID NO: 20)으로서 도입하여 pJNNproP(t)를 얻었다. 플라스미드 pBT'hmfH_aldh 및 pJNNproP(t)를 P. 푸티다(P. putida) KT2440Δgcd(CA1877) 내로 연속적으로 도입하여 P. 푸티다(P. putida) CA21783을 수득하였다. P. 푸티다(P. putida) CA21783은 50㎎/L의 카나마이신, 30mg/L의 젠타마이신 및 100μM의 살리실산이 보충된 10ml의 MM+80mM 글리세롤 및 2mM 글루코오스를 함유하는 100-ml 쉐이크 플라스크에서 배양하였다. 세포들을 대수 단계(OD600 4)의 끝에서 수거하고, 세척하고, MM 50㎎/ℓ의 카나마이신, 30㎎/L 젠타마이신 및 10μM의 살리실산에 재현탁하였다. 세척된 세포 현탁액(1-2 OD600)의 분취량(10ml)을 100-ml 삼각 플라스크에서 HMF과 함께 배양하고, 샘플들을 FDCA의 분석을 위해 정기적 간격으로 채집하였다. proP-코딩된 HMFCA 운반체의 발현은 proP를 발현하지 않는 이에 상응하는 컨트롤 균주와 비교하여 HMF의 FDCA로의 산화를 상당히 촉진한다는 것이 명백하다.
Adh_Bp = SEQ ID NO: 6(Brevibacillus panacihumi); Adh_Bk = SEQ ID NO: 2(Bacillus kribbensis); Adh_Bt = SEQ ID NO: 5(Brevibacillus thermoruber); Adh_At = SEQ ID NO: 4(Aneurinibacillus terranovensis); YiaY = SEQ ID NO: 1(Aeribacillus pallidus); Adh_Gk = SEQ ID NO: 3(Geobacillus kaustophilus); Adh_Bsp = SEQ ID NO: 7(Bacillus sp . FJAT-14578); Adh_BspL1 = 서열 번호 10(Bacillus sp . L1(2012)); Adh_Pt = SEQ ID NO: 11(Pelotomaculum thermopropionicum); Adh_Dk = SEQ ID NO: 8(Desulfotomaculum kuznetsovii); 및 Adh_Dt = SEQ ID NO: 9(Desulfurispora thermophila). 정렬 아래의 기호는 다음을 나타낸다. * = 불변 위치; : = 강하게 보존된 위치; . = 덜 강하게 보존된 위치; 아무 기호도 없는 것은 비-보존 위치를 나타내었다.
정렬 아래의 기호는 다음을 나타낸다: * = 불변 위치; : = 강하게 보존된 위치; . = 덜 강하게 보존된 위치; 아무 기호도 없는 것은 비-보존 위치를 나타내었다.
SEQUENCE LISTING
<110> Purac Biochem B.V.
<120> Dehydrogenase-catalysed production of FDCA
<130> P6054479PCT
<150> EP15155401
<151> 2015-02-17
<160> 40
<170> PatentIn version 3.3
<210> 1
<211> 392
<212> PRT
<213> Aeribacillus pallidus
<400> 1
Met Ile Gly Asn Tyr Ala Lys Lys Ala Ile Asp Phe Glu Phe Thr Phe
1 5 10 15
Tyr Leu Pro Thr Leu Ile Glu Phe Gly Tyr Gly Lys Ala Ser Arg Met
20 25 30
Gly Glu Met Leu Glu Gln Met Gly Ile Lys Asn Val Phe Leu Val Thr
35 40 45
Asp Lys Gly Val Glu Ala Ala Gly Leu Leu Ala Gly Ile Val Gln Ser
50 55 60
Leu Glu Ser Ser Asn Ile Arg Tyr Val Ile Tyr Ser Asp Val Glu Pro
65 70 75 80
Asp Pro Ser Leu Glu Thr Ile Asp Arg Gly Ala Ser Val Phe Lys Glu
85 90 95
Gln Ser Phe Asp Cys Ile Leu Ala Val Gly Gly Gly Ser Pro Ile Asp
100 105 110
Thr Ala Lys Gly Ile Arg Val Val Val Thr Asn Gly Gly Asn Ile Gly
115 120 125
Asp Tyr Ala Gly Val Asn Arg Val Ala Lys Lys Ser Glu Ile Pro Leu
130 135 140
Val Ala Val Pro Thr Thr Ser Gly Thr Gly Ser Glu Val Thr Ile Phe
145 150 155 160
Gly Val Tyr Ser Asp Trp Glu Asn Gln Val Lys Val Thr Val Thr Ser
165 170 175
Pro Tyr Met Ala Pro Glu Ile Ala Leu Val Asp Pro Glu Leu Thr Met
180 185 190
Ser Leu Pro Gln Lys Met Thr Ala Ala Ser Gly Ile Asp Ala Leu Ala
195 200 205
His Gly Ile Glu Thr Phe Phe Ser Leu Arg Ser Arg Pro Ala Ser Asp
210 215 220
Ala Leu Ala Val Glu Ala Met Ala Thr Val Ser Ala Tyr Leu Arg Arg
225 230 235 240
Ala Val Glu Asp Gly Thr Asp Lys Glu Ala Arg Ile Gly Met Ser Gln
245 250 255
Gly Ser Leu Leu Ala Gly Met Ala Phe Asn Asn Gly Phe Leu Gly Leu
260 265 270
Ala His Ala Ile Gly Ser Ala Leu Ser Gly His Cys His Val Ser His
275 280 285
Gly Val Ala Ile Gly Leu Leu Leu Pro Lys Val Val Glu Phe Asn Ala
290 295 300
Arg Val Arg Pro Glu Lys Ala Ala Lys Ile Ala Glu Leu Leu Gly Val
305 310 315 320
Lys Gly Asp Arg Glu Glu Val Leu Ala Glu Gln Ala Ala Pro Ala Val
325 330 335
Ala Ser Leu Val Lys Glu Ile Gly Leu Pro Thr Arg Leu Arg Asp Val
340 345 350
Asp Val Ser Glu Glu Lys Leu Pro Asp Ile Ala Arg Asp Ala Phe Lys
355 360 365
Ser Gly Met Met Lys Phe Asn Pro Arg Gln Pro Ser Leu Ser Glu Val
370 375 380
Leu Thr Leu Leu Gln Gln Ile Tyr
385 390
<210> 2
<211> 383
<212> PRT
<213> Bacillus kribbensis
<400> 2
Met Asp Val Glu Phe Ser Phe His Leu Pro Thr Leu Ile Glu Phe Gly
1 5 10 15
Phe Gly Lys Ala Ser Leu Leu Gly Glu Arg Leu Leu Lys Leu Gly Val
20 25 30
Gly Asn Val Phe Leu Val Ser Asp Lys Gly Val Ala Ser Ala Gly Leu
35 40 45
Leu Gln Lys Leu Glu Gln Ser Leu Gln Thr Ser Asp Ile His Phe Lys
50 55 60
Thr Tyr Leu Glu Val Glu Pro Asp Pro Ser Leu Glu Thr Ile Asp Leu
65 70 75 80
Gly Ala Glu Ala Phe Asn Ser Gly Lys Tyr Asp Cys Ile Val Ala Val
85 90 95
Gly Gly Gly Ser Ala Ile Asp Thr Ala Lys Gly Ile Arg Val Val Ala
100 105 110
Gly Asn Gly Gly Ser Ile Gly Asp Phe Ala Gly Val Asp Lys Ile Gly
115 120 125
Lys Ala Pro Gln Ile Pro Leu Ile Ala Val Pro Thr Thr Ser Gly Thr
130 135 140
Gly Ser Glu Val Thr Ile Phe Gly Val Tyr Ser Asp Trp Val Lys Asn
145 150 155 160
Val Lys Val Thr Val Thr Ser Gln Tyr Met Ala Pro Thr Ile Ala Leu
165 170 175
Val Asp Pro Glu Leu Thr Met Arg Leu Pro Arg Lys Met Thr Ala Ala
180 185 190
Ser Gly Ile Asp Ala Leu Ala His Gly Ile Glu Ser Tyr Phe Ser Leu
195 200 205
Arg Ser Thr Ser Ala Ser Arg Ala Leu Ser Leu Glu Ala Ile Asn Ile
210 215 220
Val Gly Asn His Leu Arg Gln Ser Val Ala Asn Gly Glu Asp Lys Glu
225 230 235 240
Ala Arg Cys Gly Met Ser His Gly Ser Leu Leu Ala Gly Met Ala Phe
245 250 255
Asn Asn Gly Phe Leu Gly Leu Ala His Ala Ile Gly Ser Ala Leu Ser
260 265 270
Gly His Cys His Val Pro His Gly Val Ala Ile Gly Leu Leu Leu Pro
275 280 285
His Val Val Glu Phe Asn Ser Ser Glu Cys Pro Asp Gln Ala Ala Glu
290 295 300
Ile Ala Lys Ile Leu Gly Val Lys Ala Glu Asp Glu Arg Gln Leu Ala
305 310 315 320
Glu Gln Ala Ser His Ala Val Gly Asp Leu Val Lys Asp Ile Gly Leu
325 330 335
Pro Thr Arg Leu Arg Asp Met Asn Val Pro Glu Glu Lys Leu Ala Asp
340 345 350
Ile Ala Arg Asp Ser Phe Gln Ser Gly Met Met Lys Phe Asn Pro Arg
355 360 365
Arg Ala Ser Glu Ser Glu Val Leu Glu Leu Leu His Arg Val Tyr
370 375 380
<210> 3
<211> 391
<212> PRT
<213> Geobacillus kaustophilus
<400> 3
Met Val Gly His Tyr Ile Gln Lys Glu Val Glu Phe Glu Phe Ser Phe
1 5 10 15
His Leu Pro Thr Ser Ile Gln Phe Gly Tyr Gly Lys Ala Ser Gln Leu
20 25 30
Gly Asn Gln Leu Val Asp Met Gly Ile Lys Ser Ala Phe Leu Val Thr
35 40 45
Asp Arg Gly Val Glu Ala Thr Gly Leu Leu Ala Gly Ile Ile Gln Ser
50 55 60
Leu Glu Ser Ser Asn Ile Gln Tyr Cys Val Tyr Ala Asp Val Glu Pro
65 70 75 80
Asp Pro Ser Leu Glu Thr Ile Asp Gln Gly Ala Ala Ala Phe Lys Glu
85 90 95
Gln Pro Phe Asp Cys Ile Val Ala Ile Gly Gly Gly Ser Pro Ile Asp
100 105 110
Thr Ala Lys Gly Ile Arg Val Val Ala Thr Asn Gly Gly Ser Ile Gly
115 120 125
Asp Tyr Ala Gly Val Asn Arg Ile Lys Lys Lys Ser Glu Ile Pro Leu
130 135 140
Ile Ala Leu Pro Thr Thr Ser Gly Thr Gly Ser Glu Val Thr Ile Phe
145 150 155 160
Gly Val Tyr Ser Asp Trp Lys Asn Asn Val Lys Val Thr Val Thr Ser
165 170 175
Pro Tyr Met Ala Pro Glu Ile Ala Leu Val Asp Pro Lys Leu Thr Met
180 185 190
Ser Leu Pro Lys Lys Ile Thr Ala Ala Ser Gly Ile Asp Ala Leu Ala
195 200 205
His Gly Ile Glu Thr Phe Phe Ser Leu Arg Ser Gln Pro Ile Ser Asp
210 215 220
Val Leu Ala Ile Glu Ala Met Thr Thr Val Asn Arg Tyr Leu Arg Arg
225 230 235 240
Ala Val Glu Asp Gly Thr Asn Lys Glu Ala Arg Ile Gly Met Ser Tyr
245 250 255
Gly Ser Leu Leu Ala Gly Met Ala Phe Asn Asn Gly Phe Leu Gly Leu
260 265 270
Ala His Ala Ile Gly Ser Ala Leu Ser Gly His Cys His Val Ser His
275 280 285
Gly Val Ala Ile Gly Leu Leu Leu Pro Lys Val Val Glu Phe Asn Ser
290 295 300
Val Val Gln Pro Glu Lys Ala Ala Lys Ile Ala Glu Leu Leu Gly Arg
305 310 315 320
Lys Gly Asn Gln Asn Thr Leu Val Gln Gln Ala Ala Leu Ala Val Ala
325 330 335
Ser Leu Val Lys Glu Ile Gly Leu Pro Thr Arg Leu Arg Asp Val Asp
340 345 350
Val Pro Lys Glu Lys Leu Pro Asp Ile Ala Lys Asp Ser Phe Lys Ser
355 360 365
Gly Met Met Arg Phe Asn Pro Arg Gln Pro Ser Glu Ala Glu Val Met
370 375 380
Thr Leu Leu Gln Gln Ile Tyr
385 390
<210> 4
<211> 390
<212> PRT
<213> Aneurinibacillus terranovensis
<400> 4
Met Ser Pro Ala Val Lys Ala Ile Asn Phe Glu Phe Ser Phe Asn Leu
1 5 10 15
Pro Thr Leu Ile Glu Phe Gly Tyr Gly Lys Met Glu Lys Phe Gly Gln
20 25 30
Gln Leu Ile Ser Ile Gly Val Lys Arg Ile Phe Met Val Thr Asp Lys
35 40 45
Gly Val Glu Ser Ala Gly Leu Leu Ala Ala Leu Thr Asp Ser Leu Gln
50 55 60
Ala Ala Ala Ile Gln Phe Asp Ile Tyr Thr Asp Val Glu Ser Asp Pro
65 70 75 80
Ser Leu Glu Thr Ile Asp Arg Gly Val Glu Val Phe Gln Gln Lys Pro
85 90 95
Tyr Asp Cys Ile Val Ala Val Gly Gly Gly Ser Pro Ile Asp Thr Ala
100 105 110
Lys Gly Ile Arg Val Val Ala Ala Asn Gly Gly Asn Ile Gly His Tyr
115 120 125
Ala Gly Val Asn Gln Ile Pro Val Ala Pro Thr Ile Pro Leu Leu Ala
130 135 140
Ile Pro Thr Thr Ser Gly Thr Gly Ser Glu Val Thr Asn Phe Gly Val
145 150 155 160
Tyr Ser Asp Trp Gln Asn Asn Val Lys Val Thr Val Thr Ser Gln Tyr
165 170 175
Met Ala Pro Thr Ile Ala Trp Val Asp Pro Ala Leu Thr Met Ser Leu
180 185 190
Pro Ala Lys Met Thr Ala Ala Ser Gly Ile Asp Ala Leu Ala His Gly
195 200 205
Ile Glu Thr Phe Phe Ser Leu Gly Ser Ser Pro Ala Ser Asp Ala Leu
210 215 220
Ala Ile Glu Ala Ile His Thr Val Asn Arg Tyr Leu Ser Arg Ala Val
225 230 235 240
His Asn Gly Ser Asp Met Glu Ala Arg Ile Gly Met Ser His Gly Ser
245 250 255
Leu Leu Ala Gly Met Ala Phe Asn Asn Gly Phe Leu Gly Leu Ala His
260 265 270
Ala Ile Gly Ser Ala Leu Ser Gly His Cys His Val Pro His Gly Val
275 280 285
Ala Ile Gly Leu Leu Leu Pro Lys Val Val Glu Phe Asn Ala Thr Val
290 295 300
Arg Pro Asp Lys Ala Ala Lys Ile Ala Gly Leu Met Gly Met Lys Gly
305 310 315 320
Glu His Ser Glu Glu Leu Ala Leu Gln Ala Ser Pro Ala Val Ala Arg
325 330 335
Leu Val Glu Asp Ile Gly Leu Pro Thr Arg Leu Arg Glu Val Asp Val
340 345 350
Thr Glu Lys Lys Leu Phe Glu Ile Ala Lys Asp Ser Phe Lys Ser Gly
355 360 365
Met Met Lys Phe Asn Pro Arg Gln Pro Ser Glu Ser Glu Val Leu Gln
370 375 380
Leu Leu Lys Glu Ile Phe
385 390
<210> 5
<211> 390
<212> PRT
<213> Brevibacillus thermoruber
<400> 5
Met Ser Gln Thr Val Gln Gly Thr Asp Phe Ala Phe Ser Phe His Leu
1 5 10 15
Pro Thr Leu Ile Glu Phe Gly Tyr Gly Arg Ala Ser Arg Leu Gly Glu
20 25 30
Arg Leu Gln His Leu Gly Val Thr Asn Val Phe Val Val Thr Asp Lys
35 40 45
Gly Val Glu Ala Ala Gly Leu Leu Asn Gly Leu Val Gly Ser Leu Gln
50 55 60
Ser Ala Gly Ile Ala Phe Asp Leu Tyr Thr Glu Val Glu Pro Asp Pro
65 70 75 80
Gly Leu Glu Thr Ile Asp Arg Gly Ala Ala Val Phe Arg Ala Lys Pro
85 90 95
Tyr Asp Cys Leu Val Ala Val Gly Gly Gly Ser Pro Ile Asp Ala Ala
100 105 110
Lys Gly Met Arg Val Val Thr Ser Cys Gly Gly Ser Ile Ala Asp Tyr
115 120 125
Ala Gly Val Asn Arg Val Pro Met Ala Pro Ala Val Pro Leu Val Ala
130 135 140
Val Pro Thr Thr Ser Gly Thr Gly Ser Glu Val Thr Met Phe Gly Val
145 150 155 160
Tyr Ser Asp Trp His Asn His Val Lys Val Thr Val Thr Ser Pro His
165 170 175
Met Ala Pro Thr Ile Ala Leu Val Asp Pro Ala Leu Thr Val Ser Leu
180 185 190
Pro Ala Lys Met Thr Ala Ala Ser Gly Ile Asp Ala Leu Ala His Gly
195 200 205
Ile Glu Thr Phe Phe Ser Val Arg Ser Arg Pro Ala Ser Asp Ala Leu
210 215 220
Ala Met Glu Ala Ile Ala Ala Val Asn Ala His Leu Arg Arg Ala Val
225 230 235 240
His Asp Gly Ser Asp Val Glu Ala Arg Ile Gly Met Ser His Gly Ser
245 250 255
Leu Leu Ala Gly Met Ala Phe Thr Asn Gly Phe Leu Gly Leu Ala His
260 265 270
Ala Ile Gly Ser Ala Leu Ser Gly His Cys His Val Pro His Gly Ile
275 280 285
Ala Ile Gly Leu Leu Leu Pro His Val Val Ala Phe Asn Ala Pro Ala
290 295 300
Arg Pro Asp Lys Ala Ala Gln Leu Ala Arg Leu Leu Gly Val Glu Ala
305 310 315 320
Asn Pro Arg Glu Glu Arg Gly Glu Glu Thr Ser Ala Ala Val Ala Arg
325 330 335
Met Val Ala Asp Ile Gly Leu Pro Thr Arg Leu Arg Asp Val Gly Val
340 345 350
Pro Glu Glu Lys Leu Pro Ala Ile Ala Lys Asp Ala Phe Lys Ser Gly
355 360 365
Met Met Thr Cys Asn Pro Arg Gln Pro Thr Glu Gln Glu Val Arg Glu
370 375 380
Leu Leu Arg Arg Ala Phe
385 390
<210> 6
<211> 379
<212> PRT
<213> Brevibacillus panacihumi
<400> 6
Met Glu Ser Pro Phe Ser Phe His Leu Pro Thr Asn Val Gln Phe Gly
1 5 10 15
Val Gly Ser Ala Ser Arg Leu Gly Glu Met Leu Leu Ser Met Gly Val
20 25 30
Arg Arg Val Phe Leu Val Thr Asp Gln Gly Val Arg Gln Ala Gly Leu
35 40 45
Leu Asp Glu Val Ile His Ser Leu Glu Glu Lys Gly Leu His Phe Gln
50 55 60
Ile Tyr Ala Asp Val Glu Pro Asp Pro Ser Leu Glu Thr Ile Gln Ala
65 70 75 80
Gly Ala Ala Met Phe Gln Gln Gln Ser Phe Asp Cys Met Val Ala Ile
85 90 95
Gly Gly Gly Ser Pro Ile Asp Thr Ala Lys Gly Ile Arg Val Leu Ala
100 105 110
Ala Asn Gly Gly Gly Ile Gly Gln Tyr Ala Gly Val Asn Arg Val Pro
115 120 125
Ala Ala Ser Ala Ile Pro Leu Ile Ala Ile Pro Thr Thr Ser Gly Thr
130 135 140
Gly Ser Glu Val Thr Ile Phe Gly Val Tyr Ser Asp Trp Glu Asn His
145 150 155 160
Val Lys Ile Thr Val Thr Ser Pro His Met Ala Pro Ser Thr Ala Leu
165 170 175
Ile Asp Pro Ala Leu Thr Leu Ser Leu Pro Ala Lys Met Thr Ala Ala
180 185 190
Thr Gly Ile Asp Ala Leu Ala His Gly Ile Glu Thr Phe Phe Ser Leu
195 200 205
Arg Ser Ser Pro Ala Ser Asp Ala Leu Ala Ile His Ala Met Lys Met
210 215 220
Ile Ala Pro His Leu Arg Arg Ala Val Arg Asp Gly Ala Asp Met Glu
225 230 235 240
Ala Arg Ile Gly Met Ser Gln Gly Ser Val Leu Ala Gly Met Ala Phe
245 250 255
Asn Asn Gly Phe Leu Gly Leu Ala His Ala Ile Gly Ser Ala Leu Ser
260 265 270
Gly His Cys His Val Pro His Gly Val Ala Ile Gly Leu Leu Leu Pro
275 280 285
His Val Val Ala Phe Asn Thr Pro Val Arg Pro Glu Lys Ala Glu Leu
290 295 300
Ile Ala Asp Val Leu Gly Ser Val Gln Lys Glu Thr Gly Thr Ala Ala
305 310 315 320
Glu Leu Val Gly Gln Leu Val Gln Asp Ile Gly Leu Pro Gln Arg Leu
325 330 335
Gln Glu Val Gly Val Pro Glu Ala Lys Leu Val Asp Ile Ala Lys Asp
340 345 350
Ser Phe Lys Ser Gly Met Met Lys Trp Asn Pro Arg Leu Pro Thr Glu
355 360 365
Gln Glu Val Leu Glu Leu Leu Gln Lys Ala Phe
370 375
<210> 7
<211> 383
<212> PRT
<213> Bacillus sp. FJAT-14578
<400> 7
Met Tyr Pro Ser Phe Glu Phe His Leu Pro Thr Lys Ile His Phe Gly
1 5 10 15
Tyr Asn Thr Ile Lys Gln Leu Asp His Leu Pro Phe Glu Ile Lys Arg
20 25 30
Ala Phe Ile Val Thr Asp Gln Gly Val Leu Asn Ser Gly Leu Val Glu
35 40 45
Asn Val Thr Asn Ile Leu Lys Asp His Gln Ile Ser Tyr Val Ile Tyr
50 55 60
Ser Glu Val Glu Pro Asp Pro Ser Val Glu Thr Val Asp Lys Ala Ala
65 70 75 80
Gln Met Phe Gln Arg Glu Glu Ala Asp Ala Leu Ile Ala Ile Gly Gly
85 90 95
Gly Ser Pro Ile Asp Thr Ala Lys Gly Val Arg Val Ile Ala Gly Asn
100 105 110
Gly Gly Ser Ile Arg Asp Tyr Ala Gly Val Asn Leu Ile Lys Gln Lys
115 120 125
Ser Asn Ile Pro Leu Ile Ala Ile Pro Thr Thr Ser Gly Thr Gly Ser
130 135 140
Glu Val Thr Ile Phe Ala Val Phe Ser Asp Trp Glu Glu Asn Arg Lys
145 150 155 160
Val Thr Val Thr Ser Pro Phe Leu Ala Pro Asp Ile Ser Ile Val Asp
165 170 175
Pro Lys Met Thr Met Thr Ala Pro Pro Ala Ile Thr Ala Ala Ser Gly
180 185 190
Phe Asp Ala Phe Ala His Gly Ala Glu Thr Phe Val Ser Arg Ala Ser
195 200 205
Gln Pro Ala Ser Asp Val Leu Ala Phe Ser Ala Met Ser Thr Val Ser
210 215 220
Lys Tyr Leu Arg Arg Ala Val Tyr Asn Gly Glu Asp Val Glu Ala Arg
225 230 235 240
Ile Lys Met Ala Glu Ala Ser Leu Leu Ala Gly Met Ala Phe Asn Gln
245 250 255
Ser Tyr Leu Gly Leu Thr His Ala Ile Gly Ser Ala Leu Ser Gly His
260 265 270
Ala His Val Ser His Gly Val Ala Ile Gly Leu Leu Leu Pro Gly Val
275 280 285
Ile Arg Tyr Asn Ser Ile Ser Arg Met Asp Lys His Ile Glu Met Ala
290 295 300
Gly Ala Phe Arg Glu Ile Asp Arg Ser Leu Ser Asp Trp Glu Ile Ile
305 310 315 320
Asp Gln Leu Ile Glu Asp Val Ser Arg Leu Arg Asp Asp Ile Gly Leu
325 330 335
Pro Gln Arg Leu Gln Gln Val Gly Val Lys Glu Asp Gln Leu Lys Met
340 345 350
Ile Ala Ala Asp Ser Val Lys Ser Gly Met Trp Lys Phe Asn Pro Arg
355 360 365
Gln Ala Ser Glu Glu Glu Ile Leu Glu Leu Leu Lys Glu Leu Tyr
370 375 380
<210> 8
<211> 384
<212> PRT
<213> Desulfotomaculum kuznetsovii
<400> 8
Met Glu Ala Phe Thr Phe Gln Leu Lys Thr Thr Val Cys Phe Gly Ala
1 5 10 15
Asn Val Val Ser Gly Ile Val Asp Trp Cys Arg Asn Tyr Asn Ala Lys
20 25 30
Arg Val Leu Ile Val Thr Asp Gln Gly Val Arg Lys Ala Gly Ile Leu
35 40 45
Glu Lys Val Glu Lys Ile Leu Ser Asp Ala Gly Ile Glu Asn Val Val
50 55 60
Phe Asp Asp Val Glu Pro Asp Pro Gly Leu Glu Thr Ile His Arg Cys
65 70 75 80
Ala Ser Cys Phe Arg Glu Asn Lys Cys Asp Leu Ile Leu Ala Val Gly
85 90 95
Gly Gly Ser Pro Ile Asp Thr Ala Lys Gly Ala Arg Val Ile Val Glu
100 105 110
Asn Gly Gly His Ile Arg Asp Tyr Ala Gly Val Asn Lys Val Pro Arg
115 120 125
Ala Pro Val Thr Pro Leu Ile Ala Ile Pro Thr Thr Ser Gly Thr Gly
130 135 140
Ser Glu Val Thr Thr Phe Ala Val Leu Ser Asp Trp Glu Asn Arg Met
145 150 155 160
Lys Ile Thr Ile Ser Ser Pro Phe Leu Ala Pro Glu Val Ala Val Val
165 170 175
Asp Pro Leu Leu Thr Met Thr Ala Pro Pro Ser Val Thr Ala Ala Ser
180 185 190
Gly Ile Asp Ala Leu Ser His Ala Ile Glu Thr Tyr Val Ser Leu Lys
195 200 205
Ala Gln Pro Pro Ala Glu Ala Leu Ala Leu Lys Ala Ile Glu Leu Ile
210 215 220
Gly Glu Ser Leu Arg Thr Ala Val Ala Asp Gly Ser Asp Lys Glu Ala
225 230 235 240
Arg Thr Arg Met Ser Leu Gly Ser Leu Leu Ala Gly Met Ala Phe Asn
245 250 255
Asn Ser Leu Leu Gly Leu Thr His Ser Ile Gly Ala Ala Leu Ser Gly
260 265 270
His Ala His Val Ser His Gly Met Ala Ile Gly Leu Leu Leu Pro Tyr
275 280 285
Val Met Glu Phe Asn Ala Met Ala Arg Met Glu Lys Phe Ser Lys Ile
290 295 300
Ala Val Ala Leu Gly Glu Asp Val Lys Gly Leu Ser Leu Arg Glu Ala
305 310 315 320
Ala Leu Arg Ser Val Lys Ala Val Arg Glu Leu Val Glu Asp Ile Ser
325 330 335
Leu Pro Arg Arg Leu Gly Asp Val Gly Val Thr Gly Asp Met Ile Glu
340 345 350
Gly Met Ala Lys Asp Ala Met Gly His Gly Met Leu Lys Phe Asn Pro
355 360 365
Arg Ala Val Thr Glu Lys Asp Ile Ile Ala Ile Leu Arg Lys Ala Leu
370 375 380
<210> 9
<211> 377
<212> PRT
<213> Desulfurispora thermophila
<400> 9
Met Lys Thr Thr Val Cys Phe Gly Ala Asn Ile Val Ser Ser Ile Asp
1 5 10 15
Asp Arg Cys Arg Asp Tyr Asn Ala Arg His Val Leu Ile Val Thr Asp
20 25 30
Gln Gly Val Glu Lys Ala Gly Ile Leu Glu Lys Val Glu Lys Val Leu
35 40 45
Ser Asp Ala Gly Ile Glu Asn Val Val Phe Asp Asp Val Glu Pro Asp
50 55 60
Pro Gly Leu Glu Thr Ile His Arg Cys Ala Ser Cys Phe Arg Glu Asn
65 70 75 80
Lys Cys Asp Leu Phe Leu Ala Ile Gly Gly Gly Ser Pro Ile Asp Thr
85 90 95
Ala Lys Gly Ala Arg Ile Ile Val Asp Asn Gly Gly His Ile Arg Asp
100 105 110
Tyr Ala Gly Val Asn Lys Val Pro Arg Ala Pro Arg Thr Pro Leu Leu
115 120 125
Ala Ile Pro Thr Thr Ser Gly Thr Gly Ser Glu Val Thr Thr Phe Ala
130 135 140
Val Leu Ser Asp Trp Glu Asn Arg Met Lys Ile Thr Ile Ser Ser Pro
145 150 155 160
Phe Leu Ala Pro Glu Val Ala Val Val Asp Pro Ile Leu Thr Leu Thr
165 170 175
Ala Pro Pro Ser Val Thr Ala Ala Ser Gly Ile Asp Ala Leu Ser His
180 185 190
Ala Ile Glu Thr Tyr Val Ser Leu Lys Ala Gln Pro Pro Ala Glu Ala
195 200 205
Leu Ala Leu Lys Ala Ile Glu Leu Ile Gly Glu Ser Leu Arg Ala Ala
210 215 220
Val Ala Asp Gly Ser Asn Lys Glu Ala Arg Thr Lys Met Ser Leu Gly
225 230 235 240
Ser Leu Leu Ala Gly Met Ala Phe Asn Asn Ser Leu Leu Gly Leu Thr
245 250 255
His Ser Ile Gly Ala Ala Leu Ser Gly His Ala His Val Ser His Gly
260 265 270
Met Ala Val Gly Leu Leu Leu Pro Tyr Val Met Glu Phe Asn Ala Met
275 280 285
Ala Arg Leu Glu Lys Tyr Gly Lys Ile Ala Ile Ala Leu Gly Glu Asp
290 295 300
Val Lys Gly Leu Ser Leu Arg Glu Ala Ala Leu Arg Ser Val Lys Ala
305 310 315 320
Val Arg Glu Leu Val Glu Asp Ile Ser Leu Pro Arg Arg Leu Gly Glu
325 330 335
Val Gly Val Thr Gly Asp Met Ile Glu Gly Met Ala Lys Asp Ala Met
340 345 350
Gly His Gly Met Leu Lys Phe Asn Pro Arg Val Val Thr Glu Lys Asp
355 360 365
Ile Met Ala Ile Leu Gln Lys Ala Leu
370 375
<210> 10
<211> 383
<212> PRT
<213> Bacillus sp. L1(2012)
<400> 10
Met Tyr Thr Ser Phe Asn Phe His Leu Pro Thr Arg Ile Gln Phe Gly
1 5 10 15
Tyr Glu Lys Val Lys Glu Leu Lys Asn Leu Pro Phe Gln Ala Asn Arg
20 25 30
Ala Phe Ile Val Thr Asp Lys Gly Val Glu Lys Ala Gly Leu Leu Asn
35 40 45
Asp Val Ile Asp Ala Ile Lys Gln Ala Asn Met Thr Tyr Lys Ile Tyr
50 55 60
Arg Asp Val Glu Pro Asp Pro Ser Val Glu Thr Val Asp Lys Ala Ala
65 70 75 80
Lys Ala Phe Ala Glu Ala Glu Cys Asp Leu Leu Ile Ala Val Gly Gly
85 90 95
Gly Ser Pro Ile Asp Thr Ala Lys Gly Val Arg Val Val Ala Ser Asn
100 105 110
Gly Gly Ser Ile Arg Asn Tyr Ser Gly Val Asn Leu Val Lys Glu Ala
115 120 125
Pro Ser Val Pro Leu Val Ala Ile Pro Thr Thr Ala Gly Thr Gly Ser
130 135 140
Glu Val Thr Ile Phe Ala Val Phe Ser Asp Asp Lys Glu Asn Arg Lys
145 150 155 160
Val Thr Val Thr Ser Ser His Leu Ser Pro Asp Val Ser Ile Ile Asp
165 170 175
Pro Lys Leu Thr Leu Thr Ala Pro Pro Ser Ile Thr Ala Ala Ala Gly
180 185 190
Phe Asp Ala Phe Ala His Ala Ala Glu Ala Phe Val Ser Arg Ile Ser
195 200 205
Gln Pro Pro Ser Asp Ala Leu Ala Leu Ser Ala Met Lys Thr Val His
210 215 220
Thr Tyr Leu Arg Arg Ala Val Tyr Asn Gly Asp Asp Ile Glu Ala Arg
225 230 235 240
Met Lys Met Ala Glu Ala Ser Leu Leu Ala Gly Met Ala Phe Asn Gln
245 250 255
Ser Tyr Leu Gly Leu Ala His Ala Ile Gly Ser Ala Ile Ser Val His
260 265 270
Ala His Val Ser His Gly Val Val Ile Gly Leu Leu Leu Pro Lys Val
275 280 285
Ile Glu Tyr Asn Leu Val Ala Lys Ile Asp Lys Tyr Ala Glu Ala Gly
290 295 300
Lys Tyr Ile Glu Gln Ser Ser His Gly Leu Ser Asn Tyr Glu Ala Ala
305 310 315 320
Ala Leu Phe Ser Glu Thr Val Thr Gln Leu Arg Asn Asp Ile Gly Leu
325 330 335
Pro Lys Gln Leu Arg Glu Val Asn Val Lys Glu Ala Gln Leu Glu Ala
340 345 350
Ile Ser Lys Asp Ser Ile Lys Ser Gly Met Trp Gln Phe Asn Pro Arg
355 360 365
Arg Ala Ser Glu Gln Asp Val Tyr Gln Met Leu Arg Glu Met Leu
370 375 380
<210> 11
<211> 387
<212> PRT
<213> Pelotomaculum thermopropionicum
<400> 11
Met Ala Asp Tyr Asn Phe Ser Phe Ala Val Arg Thr Lys Val Phe Phe
1 5 10 15
Gly Arg Gly Val Val Phe Glu Gln Leu Pro Gly Ala Val Arg Glu Met
20 25 30
Gly Cys Lys Lys Ala Val Leu Val Ser Asp Pro Gly Ile Val Gly Thr
35 40 45
Gly Leu Ala Asp Arg Val Lys Asp Leu Leu Ala Gly Gly Gly Val Ala
50 55 60
Val Glu Val Phe Ser Glu Val Glu Pro Asp Pro Gly Leu Glu Thr Val
65 70 75 80
His Lys Ala Ala Ala Phe Leu Gly Arg Thr Arg Pro Asp Cys Leu Val
85 90 95
Ala Leu Gly Gly Gly Ser Ser Ile Asp Val Ala Lys Gly Ala Arg Val
100 105 110
Ile Tyr Asp Asn Gly Gly Lys Ile Ser Asp Tyr Ala Gly Val Asn Lys
115 120 125
Val Lys Val Lys Pro Ser Leu Pro Leu Met Ala Val Pro Thr Thr Ala
130 135 140
Gly Thr Gly Ser Glu Val Thr Val Phe Ala Val Leu Ser Asp Trp Glu
145 150 155 160
Gln Asn Ile Lys Ile Thr Val Thr Ser Glu Tyr Leu Ala Pro Glu Ala
165 170 175
Ala Phe Val Asp Pro Leu Ala Met Val Ser Ala Pro Pro Gly Ile Thr
180 185 190
Ala Ala Ser Gly Ile Asp Ala Leu Ser His Ala Val Glu Ala Tyr Val
195 200 205
Ser Arg Ala Ala Ser Pro Val Ser Asp Asn Leu Ala Leu Gly Ala Val
210 215 220
Glu Leu Ile Gly Gly His Leu Arg Gln Ala Val Ala Asn Gly Gly Asp
225 230 235 240
Leu Ala Ala Arg Thr Gly Ala Ala Leu Gly Ser Leu Leu Ala Gly Met
245 250 255
Ala Phe Asn Asn Ala Phe Leu Gly Leu Thr His Ser Ile Gly Ala Ala
260 265 270
Leu Ser Gly His Val His Val Ser His Gly Val Ala Val Gly Leu Leu
275 280 285
Leu Pro Tyr Val Met Glu Tyr Asn Leu Met Ala Lys Pro Asp Lys Phe
290 295 300
Ala Arg Leu Ala Arg Ala Met Gly Glu Val Thr Glu Gly Lys Ser Leu
305 310 315 320
Tyr Arg Ala Ala Ser Leu Ala Pro Arg Ala Val Lys Ala Met Val Lys
325 330 335
Ser Ile Gly Leu Pro Val Arg Leu Lys Glu Ile Gly Val Pro Glu Gly
340 345 350
Ala Leu Ala Ala Ile Ala Glu Thr Ala Leu Lys His Gly Met Ile Lys
355 360 365
Phe Asn Pro Arg Val Pro Ser Arg Glu Asp Ile Leu Asp Ile Val Lys
370 375 380
Lys Ala Tyr
385
<210> 12
<211> 1176
<212> DNA
<213> Aeribacillus pallidus
<400> 12
atgatcggaa attacgcaaa aaaggcgatt gatttcgagt tcacttttta tcttcctaca 60
ttgatcgaat tcggatacgg caaggcttcc cgaatgggag agatgcttga acagatgggt 120
ataaagaacg tttttttggt taccgacaaa ggagtggaag ctgcgggtct gttggcagga 180
atcgttcagt ctctggaatc atccaatatc cgatatgtta tttattcaga cgtagaacct 240
gacccgagct tagagacgat tgatcgtggt gcgtccgttt ttaaggagca gtcttttgac 300
tgtatcttag ctgtgggtgg aggaagtccg attgatacag ctaaggggat ccgtgtcgta 360
gtgacgaacg gaggaaacat cggtgactat gccggtgtta accgtgttgc gaaaaaatct 420
gaaattcctt tggtggctgt gccgactaca tccggcacgg gcagtgaagt aaccattttc 480
ggagtctact ccgattggga aaatcaagta aaggtgacgg taacaagccc atatatggcg 540
ccggagatcg ctttggtaga ccccgaactt accatgagtc taccgcaaaa aatgacagca 600
gcatcgggaa ttgatgctct agctcatggg attgaaactt tcttctcctt gcgttctcga 660
cctgcatccg atgccctagc ggtcgaagcg atggcgacgg tgagtgctta tttgcgccgt 720
gcggtggaag atggtacgga taaagaagcg aggatcggca tgtcccaggg cagtttgttg 780
gcagggatgg cattcaacaa tggcttctta ggtttggccc atgcgatcgg tagtgctttg 840
tctggccatt gtcatgtgtc ccatggtgtc gcaatcggtt tgttgctacc gaaagtggtg 900
gaatttaatg ctagggtgcg cccggaaaaa gctgcaaaaa tcgcagaatt gttgggagta 960
aaaggggatc gagaggaggt tcttgcggag caggcagctc ctgcagtcgc ctcgttagtc 1020
aaagagattg gtcttcccac tcgtttgcgt gatgttgatg tttctgaaga aaagctccca 1080
gatatcgcaa gagatgcatt taaaagcggt atgatgaagt ttaacccacg ccaaccaagt 1140
ttgtcagaag tgcttacact tttgcagcag atttat 1176
<210> 13
<211> 1179
<212> DNA
<213> Artificial
<220>
<223> Synthetic codon optimised for expression in P. putida
<400> 13
atgatcggca actacgccaa gaaggccatc gacttcgagt tcaccttcta cctgccgacc 60
ctgatcgagt tcggctacgg caaggccagc cgcatgggcg agatgctgga acaaatgggt 120
atcaagaacg tgttcctggt gaccgacaag ggcgtggaag ccgccggtct gctggccggc 180
atcgtgcaga gcctggaaag cagcaacatc cgctacgtga tctacagcga cgtggaaccg 240
gacccgagcc tggaaaccat cgaccgcggc gccagcgtgt tcaaagaaca gagcttcgac 300
tgcatcctgg ccgtgggcgg cggcagcccg atcgacaccg ccaagggcat ccgcgtggtg 360
gtgaccaacg gcggcaacat cggcgactac gccggcgtga accgcgtggc caagaagtcg 420
gagatcccgc tggtcgccgt gccaaccacc tcgggcaccg gcagcgaagt gaccatcttc 480
ggcgtgtaca gcgactggga gaaccaggtg aaggtgaccg tgaccagccc gtacatggcc 540
ccggaaatcg ccctggtgga cccggaactg accatgagcc tgccgcagaa gatgaccgcc 600
gccagcggca tcgacgccct ggcccacggc atcgaaacct tcttcagcct gcgcagccgc 660
ccagcctcgg atgccctggc ggtggaagcc atggccaccg tgagcgccta cctgcgccgc 720
gccgtcgagg acggcaccga caaagaagcc cgcatcggca tgagccaggg cagcctgctg 780
gcgggcatgg ccttcaacaa cggcttcctg ggcctggccc atgccatcgg cagcgccctg 840
agcggccatt gccatgtgag ccacggcgtg gccatcggcc tgctgctgcc gaaggtggtg 900
gaattcaacg cccgcgtgcg cccggaaaag gccgccaaga tcgccgaact gctgggcgtg 960
aagggcgacc gcgaagaggt gctggccgaa caggccgccc cagccgtggc cagcctggtg 1020
aaagaaatcg gcctgccgac ccgcctgcgc gacgtggacg tgagcgaaga gaagctgccg 1080
gacatcgccc gcgacgcctt caagagcggc atgatgaagt tcaacccgcg ccagccgagc 1140
ctgagcgagg tgctgaccct gctgcagcag atctactga 1179
<210> 14
<211> 1152
<212> DNA
<213> Artificial
<220>
<223> Synthetic codon optimised for expression in P.putida
<400> 14
atggacgtgg aattcagctt ccatctgccg accctgatcg agttcggctt cggcaaggcc 60
agcctgctgg gcgagcgcct gctgaagctg ggcgtgggca acgtgttcct ggtgagcgac 120
aagggcgtgg ccagcgcagg cctgctgcag aagctggaac agagcctgca gaccagcgac 180
atccacttca agacctacct ggaagtggaa ccggacccga gcctggaaac catcgacctg 240
ggtgccgagg ccttcaacag cggcaagtac gactgcatcg tggccgtggg tggtggcagc 300
gccatcgaca ccgccaaggg catccgcgtg gtggcaggca acggtggcag catcggcgac 360
ttcgcaggcg tggacaagat cggcaaggca ccgcagatcc cgctgatcgc cgtgccgacc 420
acctcgggca ccggcagcga agtgaccatc ttcggcgtgt acagcgactg ggtgaagaac 480
gtgaaggtga ccgtgaccag ccagtacatg gcaccgacca ttgccctggt ggacccggaa 540
ctgaccatgc gcctgccacg caagatgacc gcagccagcg gcatcgacgc cctggcccac 600
ggcatcgaga gctacttcag cctgcgcagc accagcgcca gccgtgccct gtcgctggaa 660
gccatcaaca tcgtgggcaa ccatctgcgc cagagcgtgg cgaacggcga ggacaaggaa 720
gcacgctgcg gcatgagcca cggcagcctg ctggcaggca tggcgttcaa caacggcttc 780
ctgggcctgg cccatgccat cggcagcgca ctgagcggtc actgccacgt gccgcacggc 840
gtggccatcg gcctgctgct gccgcacgtg gtggaattca acagcagcga gtgcccagac 900
caggcagccg agatcgccaa gatcctgggc gtgaaggccg aggacgaacg ccagctggcc 960
gaacaggcca gccacgccgt gggcgacctg gtgaaggaca tcggcctgcc gacccgtctg 1020
cgcgacatga acgtgccgga agagaagctg gccgacattg cacgcgacag cttccagagc 1080
ggcatgatga agttcaaccc acgtcgtgcc agcgagagcg aggtgctgga actgctgcac 1140
cgcgtgtact ga 1152
<210> 15
<211> 1994
<212> DNA
<213> Artificial
<220>
<223> Synthetic XbaI-SalI fragment
<400> 15
tctagatctt ctttgataat aaatgaaagc agccggtatg gagagaaaaa agtgcactta 60
tatgaagttg attttatggt cggctttatt ttgcccgtcg tactggctgt ccacacgatg 120
ttcatttttg atgcacaatt gaatggctgt acagttgcgt ttttgtcgat gtctggcggg 180
cacgcctcca tgcatgtgaa gcagattctt ttaagcgggc agcacccgct tttttggagg 240
gcaggcattc aggagcaaaa atggcagaga tcagttgggc gggatcagcc atttattcct 300
ccatccgggg cactttgtga aaatcagcac aagaatgaat aacgctttca tatctggctt 360
tttcaaataa aaccatttgt gaaaaatgta aacggatgat tttgaaaaac cgtcattttc 420
ctttaaaacc gggcatttgg gcagataaat tttcaaattt tcgccataaa atatgtgaat 480
ctaatcacaa aaatagtggt atacttaccc atgtggaatg aaggaaaatg aacggaacga 540
tccatttcag ccataaaagg gcatgccgtc catctatttc acaaaccgca cggcagcatt 600
tgctgcaaaa gtttaatcgt cctgctttaa aggaaaagca gtatggaatc cattaggagt 660
tggcacaata tccatagact ggataggggc ccgccatgcc gggcttgcaa aactgctttc 720
atacagtgga aatatttttt acttttgatg gggaggaaga ttatatatga tcggaaatta 780
cgcaaaaaag gcgattgatt tcgagttcac tttttatctt cctacattga tcgaattcgg 840
atacggcaag gcttcccgaa tgggagagat gcttgaacag atgggtataa agaacgtttt 900
tttggttacc gacaaaggag tggaagctgc gggtctgttg gcaggaatcg ttcagtctct 960
ggaatcatcc aatatccgat atgttattta ttcagacgta gaacctgacc cgagcttaga 1020
gacgattgat cgtggtgcgt ccgtttttaa ggagcagtct tttgactgta tcttagctgt 1080
gggtggagga agtccgattg atacagctaa ggggatccgt gtcgtagtga cgaacggagg 1140
aaacatcggt gactatgccg gtgttaaccg tgttgcgaaa aaatctgaaa ttcctttggt 1200
ggctgtgccg actacatccg gcacgggcag tgaagtaacc attttcggag tctactccga 1260
ttgggaaaat caagtaaagg tgacggtaac aagcccatat atggcgccgg agatcgcttt 1320
ggtagacccc gaacttacca tgagtctacc gcaaaaaatg acagcagcat cgggaattga 1380
tgctctagct catgggattg aaactttctt ctccttgcgt tctcgacctg catccgatgc 1440
cctagcggtc gaagcgatgg cgacggtgag tgcttatttg cgccgtgcgg tggaagatgg 1500
tacggataaa gaagcgagga tcggcatgtc ccagggcagt ttgttggcag ggatggcatt 1560
caacaatggc ttcttaggtt tggcccatgc gatcggtagt gctttgtctg gccattgtca 1620
tgtgtcccat ggtgtcgcaa tcggtttgtt gctaccgaaa gtggtggaat ttaatgctag 1680
ggtgcgcccg gaaaaagctg caaaaatcgc agaattgttg ggagtaaaag gggatcgaga 1740
ggaggttctt gcggagcagg cagctcctgc agtcgcctcg ttagtcaaag agattggtct 1800
tcccactcgt ttgcgtgatg ttgatgtttc tgaagaaaag ctcccagata tcgcaagaga 1860
tgcatttaaa agcggtatga tgaagtttaa cccacgccaa ccaagtttgt cagaagtgct 1920
tacacttttg cagcagattt attaattgtt cgggtttcag tgttccattt tcaaatattc 1980
cgttaagggt cgac 1994
<210> 16
<211> 1258
<212> DNA
<213> Artificial
<220>
<223> Synthetic KpnI-XbaI fragment
<400> 16
ggtaccttca cacaggaaac aggaggtaca atgatcggaa attacgcaaa aaaggcgatt 60
gatttcgagt tcacttttta tcttcctaca ttgatcgaat tcggatacgg caaggcttcc 120
cgaatgggag agatgcttga acagatgggt ataaagaacg tttttttggt taccgacaaa 180
ggagtggaag ctgcgggtct gttggcagga atcgttcagt ctctggaatc atccaatatc 240
cgatatgtta tttattcaga cgtagaacct gacccgagct tagagacgat tgatcgtggt 300
gcgtccgttt ttaaggagca gtcttttgac tgtatcttag ctgtgggtgg aggaagtccg 360
attgatacag ctaaggggat ccgtgtcgta gtgacgaacg gaggaaacat cggtgactat 420
gccggtgtta accgtgttgc gaaaaaatct gaaattcctt tggtggctgt gccgactaca 480
tccggcacgg gcagtgaagt aaccattttc ggagtctact ccgattggga aaatcaagta 540
aaggtgacgg taacaagccc atatatggcg ccggagatcg ctttggtaga ccccgaactt 600
accatgagtc taccgcaaaa aatgacagca gcatcgggaa ttgatgctct agctcatggg 660
attgaaactt tcttctcctt gcgttctcga cctgcatccg atgccctagc ggtcgaagcg 720
atggcgacgg tgagtgctta tttgcgccgt gcggtggaag atggtacgga taaagaagcg 780
aggatcggca tgtcccaggg cagtttgttg gcagggatgg cattcaacaa tggcttctta 840
ggtttggccc atgcgatcgg tagtgctttg tctggccatt gtcatgtgtc ccatggtgtc 900
gcaatcggtt tgttgctacc gaaagtggtg gaatttaatg ctagggtgcg cccggaaaaa 960
gctgcaaaaa tcgcagaatt gttgggagta aaaggggatc gagaggaggt tcttgcggag 1020
caggcagctc ctgcagtcgc ctcgttagtc aaagagattg gtcttcccac tcgtttgcgt 1080
gatgttgatg tttctgaaga aaagctccca gatatcgcaa gagatgcatt taaaagcggt 1140
atgatgaagt ttaacccacg ccaaccaagt ttgtcagaag tgcttacact tttgcagcag 1200
atttattaat tgttcgggtt tcagtgttcc attttcaaat attccgttaa ggtctaga 1258
<210> 17
<211> 446
<212> PRT
<213> Aeribacillus pallidus
<400> 17
Met Lys Asn Ile Ala Asn Thr Ser Thr Glu Arg Pro Val Asn Asp Ala
1 5 10 15
Ser Val Lys Asn Arg Gln Met Val Arg Ala Thr Ile Ala Ser Leu Ile
20 25 30
Gly Trp Ser Leu Asp Leu Tyr Asp Leu Phe Leu Leu Leu Phe Val Ala
35 40 45
Thr Thr Ile Gly Asn Leu Phe Phe Pro Ala Ser Asn Gln Thr Leu Ser
50 55 60
Leu Ala Ala Val Tyr Ala Ser Phe Ala Val Thr Leu Leu Met Arg Pro
65 70 75 80
Leu Gly Ser Ala Ile Phe Gly Ile Tyr Ala Asp Lys Asn Gly Arg Lys
85 90 95
Lys Ala Met Thr Val Ala Ile Ile Gly Ala Gly Leu Cys Thr Ala Ala
100 105 110
Phe Gly Leu Leu Pro Thr Ile His Gln Val Gly Val Val Ala Ala Ile
115 120 125
Ala Phe Leu Ile Leu Arg Leu Val Gln Gly Val Phe Val Gly Gly Val
130 135 140
Val Ala Ser Thr His Thr Ile Gly Thr Glu Ser Ala Ser Pro Lys Tyr
145 150 155 160
Arg Gly Phe Met Ser Gly Leu Ile Gly Gly Gly Gly Ala Gly Leu Gly
165 170 175
Ala Leu Phe Ala Ser Ile Ser Tyr Ser Val Val Thr Ala Ile Phe Pro
180 185 190
Gly Glu Ala Phe Asp Val Trp Gly Trp Arg Val Met Phe Phe Thr Gly
195 200 205
Ile Ile Gly Ser Leu Phe Gly Leu Phe Ile Phe Arg Ser Leu Glu Glu
210 215 220
Ser Pro Leu Trp Lys Gln Leu Lys Glu Glu Asn Ser Lys Gly Glu Val
225 230 235 240
Ser Glu Phe Gln Lys Ala Pro Leu Lys Thr Phe Phe Thr Lys Tyr Tyr
245 250 255
Lys Val Leu Leu Val Asn Leu Met Ile Val Ile Gly Gly Gly Ser Gly
260 265 270
Tyr Tyr Leu Thr Ser Gly Phe Ile Pro Thr Phe Leu Lys Val Val Asn
275 280 285
Lys Val Ser Ala Ser Val Ser Ser Gly Val Leu Ile Ala Thr Ser Ile
290 295 300
Met Thr Ile Val Ala Ala Val Leu Val Gly His Leu Ser Glu Val Ile
305 310 315 320
Gly Arg Lys Lys Thr Phe Leu Leu Ile Gly Ile Leu Cys Leu Val Gly
325 330 335
Leu Pro Tyr Phe Tyr Leu Ser Leu Ala Asn Ser Thr Thr Thr Thr Gly
340 345 350
Ile Tyr Leu Asn Ala Leu Gly Leu Ile Phe Leu Gly Asn Ala Ala Tyr
355 360 365
Ala Pro Val Leu Ile Phe Leu Asn Glu Arg Phe Pro Thr Ser Ile Arg
370 375 380
Ser Thr Gly Thr Gly Leu Ser Trp Asn Met Gly Phe Ala Ile Gly Gly
385 390 395 400
Met Met Pro Thr Phe Val Asn Leu Ala Ser Gly Thr Val Glu His Ile
405 410 415
Pro Tyr Thr Leu Met Tyr Phe Thr Ile Gly Ile Tyr Leu Val Tyr Ile
420 425 430
Leu Gly Ser Leu Ile Ile Pro Glu Thr Lys Gly Asn Leu Lys
435 440 445
<210> 18
<211> 1338
<212> DNA
<213> Aeribacillus pallidus
<400> 18
gtgaagaata tcgctaatac gagtaccgaa cgacctgtaa atgatgcttc agttaagaat 60
cgtcaaatgg tgcgagctac gattgcctcg ctcatagggt ggtcactcga tctttacgat 120
ttatttctgc tgctttttgt tgcgacgacc atagggaatt tgttttttcc cgccagcaat 180
caaacacttt ctttggctgc cgtgtatgct tcctttgccg ttacgctttt gatgcggcct 240
ttgggttccg ccattttcgg catttatgcg gataaaaacg ggagaaagaa agcgatgact 300
gtggcaatca ttggagcagg cttgtgcacg gcggctttcg gtctgttacc tacgatccac 360
caagttggag tggtcgctgc gatcgccttc ttgattttac gtttagttca aggagtgttt 420
gtcggcggag tggttgcttc cacccatacg ataggaacgg aatccgcatc gccaaaatat 480
cgggggttta tgtcgggatt gatcggtggt ggcggagcag gattgggagc actgtttgct 540
tctatttctt attcggttgt gacggcaatt tttccgggag aggcttttga tgtttgggga 600
tggcgtgtca tgtttttcac aggcattatc ggttccctct tcggcctttt catattccgg 660
tcccttgagg aatctcctct ctggaaacaa ttgaaagaag aaaatagtaa aggcgaagtg 720
tccgagtttc agaaagcacc gctgaagacg tttttcacta aatattacaa ggtattgctc 780
gtcaacctta tgatcgtcat cggtggtggc tccggttatt atctgactag tggatttatt 840
cctacatttt taaaggtagt taacaaagta tcagcctctg tttcgtcggg ggtactcatt 900
gcgacaagta ttatgaccat tgtagccgcc gttctcgtgg gacacctgag cgaggtcatc 960
ggcagaaaga aaacatttct gttaatcggt attctttgtc ttgtcggact tccgtatttt 1020
tatctgtcat tggcaaactc aactacgaca acgggcatct acttaaatgc tcttggactc 1080
atattcttgg ggaatgctgc atatgcaccg gtactcatct tcttgaacga acgttttccc 1140
acatcgatcc gttcaacagg taccggatta tcatggaaca tgggtttcgc cattggcggg 1200
atgatgccga cgtttgtgaa cttagccagt ggtacggtgg aacatattcc ttacacgctg 1260
atgtatttta ctatcggaat ttacttggtt tatatccttg gcagcctgat tattccggaa 1320
acaaaaggaa acctcaaa 1338
<210> 19
<211> 1184
<212> DNA
<213> Artificial
<220>
<223> Synthetic KpnI - NheI fragment with codon optimized B.kribbensis
YiaY
<400> 19
ggtacctagg aaaggaagat taacccatgg acgtggaatt cagcttccat ctgccgaccc 60
tgatcgagtt cggcttcggc aaggccagcc tgctgggcga gcgcctgctg aagctgggcg 120
tgggcaacgt gttcctggtg agcgacaagg gcgtggccag cgcaggcctg ctgcagaagc 180
tggaacagag cctgcagacc agcgacatcc acttcaagac ctacctggaa gtggaaccgg 240
acccgagcct ggaaaccatc gacctgggtg ccgaggcctt caacagcggc aagtacgact 300
gcatcgtggc cgtgggtggt ggcagcgcca tcgacaccgc caagggcatc cgcgtggtgg 360
caggcaacgg tggcagcatc ggcgacttcg caggcgtgga caagatcggc aaggcaccgc 420
agatcccgct gatcgccgtg ccgaccacct cgggcaccgg cagcgaagtg accatcttcg 480
gcgtgtacag cgactgggtg aagaacgtga aggtgaccgt gaccagccag tacatggcac 540
cgaccattgc cctggtggac ccggaactga ccatgcgcct gccacgcaag atgaccgcag 600
ccagcggcat cgacgccctg gcccacggca tcgagagcta cttcagcctg cgcagcacca 660
gcgccagccg tgccctgtcg ctggaagcca tcaacatcgt gggcaaccat ctgcgccaga 720
gcgtggcgaa cggcgaggac aaggaagcac gctgcggcat gagccacggc agcctgctgg 780
caggcatggc gttcaacaac ggcttcctgg gcctggccca tgccatcggc agcgcactga 840
gcggtcactg ccacgtgccg cacggcgtgg ccatcggcct gctgctgccg cacgtggtgg 900
aattcaacag cagcgagtgc ccagaccagg cagccgagat cgccaagatc ctgggcgtga 960
aggccgagga cgaacgccag ctggccgaac aggccagcca cgccgtgggc gacctggtga 1020
aggacatcgg cctgccgacc cgtctgcgcg acatgaacgt gccggaagag aagctggccg 1080
acattgcacg cgacagcttc cagagcggca tgatgaagtt caacccacgt cgtgccagcg 1140
agagcgaggt gctggaactg ctgcaccgcg tgtactgagc tagc 1184
<210> 20
<211> 1359
<212> DNA
<213> Artificial
<220>
<223> EcoRI-NheI PCR fragment with A.pallidus proP coding sequence
<400> 20
gccgaattca tgaagaatat cgctaatacg agtaccgaac gacctgtaaa tgatgcttca 60
gttaagaatc gtcaaatggt gcgagctacg attgcctcgc tcatagggtg gtcactcgat 120
ctttacgatt tatttctgct gctttttgtt gcgacgacca tagggaattt gttttttccc 180
gccagcaatc aaacactttc tttggctgcc gtgtatgctt cctttgccgt tacgcttttg 240
atgcggcctt tgggttccgc cattttcggc atttatgcgg ataaaaacgg gagaaagaaa 300
gcgatgactg tggcaatcat tggagcaggc ttgtgcacgg cggctttcgg tctgttacct 360
acgatccacc aagttggagt ggtcgctgcg atcgccttct tgattttacg tttagttcaa 420
ggagtgtttg tcggcggagt ggttgcttcc acccatacga taggaacgga atccgcatcg 480
ccaaaatatc gggggtttat gtcgggattg atcggtggtg gcggagcagg attgggagca 540
ctgtttgctt ctatttctta ttcggttgtg acggcaattt ttccgggaga ggcttttgat 600
gtttggggat ggcgtgtcat gtttttcaca ggcattatcg gttccctctt cggccttttc 660
atattccggt cccttgagga atctcctctc tggaaacaat tgaaagaaga aaatagtaaa 720
ggcgaagtgt ccgagtttca gaaagcaccg ctgaagacgt ttttcactaa atattacaag 780
gtattgctcg tcaaccttat gatcgtcatc ggtggtggct ccggttatta tctgactagt 840
ggatttattc ctacattttt aaaggtagtt aacaaagtat cagcctctgt ttcgtcgggg 900
gtactcattg cgacaagtat tatgaccatt gtagccgccg ttctcgtggg acacctgagc 960
gaggtcatcg gcagaaagaa aacatttctg ttaatcggta ttctttgtct tgtcggactt 1020
ccgtattttt atctgtcatt ggcaaactca actacgacaa cgggcatcta cttaaatgct 1080
cttggactca tattcttggg gaatgctgca tatgcaccgg tactcatctt cttgaacgaa 1140
cgttttccca catcgatccg ttcaacaggt accggattat catggaacat gggtttcgcc 1200
attggcggga tgatgccgac gtttgtgaac ttagccagtg gtacggtgga acatattcct 1260
tacacgctga tgtattttac tatcggaatt tacttggttt atatccttgg cagcctgatt 1320
attccggaaa caaaaggaaa cctcaaataa gctagcggc 1359
<210> 21
<211> 20
<212> DNA
<213> Artificial
<220>
<223> ribosome binding site
<400> 21
taggaaagga agattaaccc 20
<210> 22
<211> 30
<212> DNA
<213> Artificial
<220>
<223> PCR primer proP(f)
<400> 22
gccgaattca tgaagaatat cgctaatacg 30
<210> 23
<211> 34
<212> DNA
<213> Artificial
<220>
<223> PCR primer proP(r)
<400> 23
gccgctagct tatttgaggt ttccttttgt ttcc 34
<210> 24
<211> 500
<212> PRT
<213> Cupriavidus basilensis
<400> 24
Met Asn Ala Gln His Trp Ile Ala Gly Ala Trp Thr Gly Glu Pro Ser
1 5 10 15
Ala Asp Ser Val Asn Pro Ala Asp Gly Thr Leu Ile Gly Gln Phe Ala
20 25 30
Asp Gly Gly Thr Trp Gln Ala Glu Ala Ala Ile Ala Ala Ala Arg His
35 40 45
Val Phe Glu Arg Thr Thr Trp Gly Gln Asp Ala Arg Leu Arg Gln Asp
50 55 60
Val Leu Leu Ala Trp Ala Gly Ala Leu Glu Ala Glu Arg Glu Arg Leu
65 70 75 80
Ala Ser Leu Leu Thr Ala Glu Asn Gly Lys Pro Val Ala Gln Ala Arg
85 90 95
Gly Glu Val Gly Ala Ala Ile Ser Glu Val Arg Tyr Tyr Ala Gly Leu
100 105 110
Ala Arg His Ile Pro Gly His Val Leu Glu Pro Glu Pro Gly Thr Ile
115 120 125
Ser Thr Ile Leu Arg Glu Pro Ala Gly Val Ala Ala Ile Ile Val Pro
130 135 140
Trp Asn Ala Pro Ala Val Leu Leu Val Arg Ser Leu Ala Pro Ala Leu
145 150 155 160
Ala Ala Gly Cys Thr Ala Val Val Lys Ser Ala Ala Gln Thr Thr Leu
165 170 175
Phe Thr Ala Ala Met Leu Arg Leu Phe Glu Arg Thr Ala Leu Pro Ala
180 185 190
Gly Ala Val Asn Leu Val Cys Glu Thr Gly Tyr Ala Ala Ala Asp His
195 200 205
Leu Val Arg Ser Arg Asp Val Asp Val Val Ser Phe Thr Gly Ser Thr
210 215 220
Ala Thr Gly Lys Lys Ile Met Ile Ala Ala Ala Asp Ser Val Lys Lys
225 230 235 240
Leu Ser Leu Glu Leu Gly Gly Lys Ser Cys Cys Leu Val Phe Asp Asp
245 250 255
Val Asp Ala Gln Ala Val Ala Lys Arg Leu Ala Leu Ala Ala Thr Val
260 265 270
Ile Ser Gly Gln Gln Cys Thr Ala Ala Arg Arg Val Leu Val His Glu
275 280 285
Ala Ile Ala Pro Gln Met Arg Arg His Leu Thr Glu Ala Leu Ala Ala
290 295 300
Leu Arg Leu Gly Pro Gly Ile Glu Pro Asp Thr Gln Ile Gly Pro Leu
305 310 315 320
Ile Asp His Pro Thr Arg Ala Met Val Ser Ala Gln Val Glu Arg Ala
325 330 335
Cys Asp Glu Ala Asp Thr Val Leu Leu Arg Gly Thr Met Pro Gly Gly
340 345 350
Ala Leu Ala Arg Gly Ala Phe Leu Ser Pro Thr Leu Val Glu His Ser
355 360 365
Asp Pro Gly Ala Phe Phe Cys Gln Glu Glu Ile Phe Gly Pro Phe Val
370 375 380
Thr Phe Glu Thr Phe Ala Thr Glu Asp Glu Ala Leu Ala Lys Ala Asn
385 390 395 400
Asn Thr Val Phe Gly Leu Ser Ala Ser Val Trp Thr His His Gly Glu
405 410 415
Arg Ala Ile Arg Leu Ala Arg Ala Leu Arg Asn Gly Thr Val Trp Val
420 425 430
Asn Asp His Asn Arg Leu Phe Ala Glu Ala Glu Thr Gly Gly Tyr Arg
435 440 445
Gln Ser Gly Leu Gly Arg Leu His Gly Tyr Asp Ala Leu Ala Asp Phe
450 455 460
Thr Glu Leu Lys His Ile Cys Ile Gln Ala Gly Leu Pro Lys Gly Met
465 470 475 480
Ser Gln Ala Gly Cys Arg Leu Ser Gly Val Ala Ala Arg Glu Arg Met
485 490 495
Gly Val Ser Val
500
<210> 25
<211> 479
<212> PRT
<213> Burkholderia sp. CCGE1002
<400> 25
Met Asn Ala Arg His Trp Ile Ala Gly Glu Trp Thr Gly Thr Pro Asn
1 5 10 15
Ile Asp Ser Ile Asp Pro Ala Thr Gly Asp Ala Ile Gly Arg Phe Ala
20 25 30
Asp Gly Gly Ser Ser Glu Ala Asp Ala Ala Ile Ala Ala Ala Arg His
35 40 45
Ala Phe Asp Arg Thr Thr Trp Ala Gln Asp Ala Arg Leu Arg Gln Asp
50 55 60
Val Leu Leu Gly Trp Ala Ser Ala Leu Glu Ala Glu Arg Asp Met Leu
65 70 75 80
Ala Thr Leu Leu Thr Arg Glu Asn Gly Lys Ala Ile Ala Gln Ser Arg
85 90 95
Asp Glu Ile Ala Gly Ala Ile Ser Glu Val Arg Tyr Tyr Ala Gly Leu
100 105 110
Ala Arg His Ile Ala Gly His Val Leu Glu Pro Glu Pro Gly Thr Ile
115 120 125
Ser Thr Met Leu Arg Glu Ala Ala Gly Val Ala Ala Ile Ile Val Pro
130 135 140
Trp Asn Ala Pro Ala Val Leu Leu Val Arg Ser Leu Ala Pro Ala Leu
145 150 155 160
Ala Ala Gly Cys Thr Val Ile Val Lys Pro Ala Ala Gln Thr Ser Leu
165 170 175
Leu Thr Ala Ala Met Leu Arg Cys Phe Glu His Thr Ala Leu Pro Glu
180 185 190
Gly Ala Val Asn Leu Val Asn Glu Arg Gly Tyr Ala Ala Ser Gln Arg
195 200 205
Leu Val Asp Ser His Gly Val Asp Val Val Ser Phe Thr Gly Ser Thr
210 215 220
Ala Thr Gly Lys Lys Ile Met Ala Ala Ala Ala Asp Ser Met Lys Lys
225 230 235 240
Leu Ser Leu Glu Leu Gly Gly Lys Ser Cys Cys Val Val Phe Asp Asp
245 250 255
Ala Asp Val Ala Ala Ile Ala Pro Arg Leu Ala Arg Ala Ala Thr Ile
260 265 270
Ile Ser Gly Gln Gln Cys Thr Ala Ala Arg Arg Val Leu Val His Ala
275 280 285
Ser Arg Ala Ala Gln Met Arg Glu Gln Leu Ala Ser Ala Leu Ala Ser
290 295 300
Leu Arg Val Gly Pro Gly Ile Asp Pro Ala Thr Asp Ile Gly Ala Leu
305 310 315 320
Ile Asp Gly Thr Thr Arg Asp Ala Val Ala Arg Thr Ile Glu Arg Ala
325 330 335
Cys Gly Thr Ala Glu Arg Val Leu Leu Arg Gly Thr Cys Ser Gly His
340 345 350
Ala Phe Leu Ser Pro Thr Leu Val Glu His Asp Asp Pro Lys Ala Phe
355 360 365
Phe Cys Gln Asp Glu Ile Phe Gly Pro Phe Val Thr Leu Glu Val Phe
370 375 380
Glu Asn Glu Met Glu Ala Ile Glu Lys Ala Asn Asp Thr Val Phe Gly
385 390 395 400
Leu Ser Ala Ser Val Trp Thr His Asp Gly Ala Arg Ala Leu Arg Val
405 410 415
Ala Arg Ala Leu Arg Asn Gly Thr Val Trp Ile Asn Asp His Asn Lys
420 425 430
Leu Phe Ala Glu Ala Glu Thr Gly Gly Tyr Arg Gln Ser Gly Leu Gly
435 440 445
Arg Leu His Gly Tyr Asp Ala Leu Ala Asp Phe Thr Glu Leu Lys His
450 455 460
Ile Cys Met Pro Ala Gly Val Ala Glu Gly Ile Ala Pro Leu Arg
465 470 475
<210> 26
<211> 483
<212> PRT
<213> Burkholderia graminis C4D1M
<400> 26
Met Glu Arg Asp Ala Met Asn Trp Ile Ala Gly Glu Trp Ala Gly Lys
1 5 10 15
Pro Val Leu Ala Ser Ser Asp Pro Ser Asn Gly Glu Thr Leu Gly Arg
20 25 30
Phe Val Ser Ser Asn Thr Gln Asp Ala Asp Ala Ala Val Ser Ala Ala
35 40 45
Arg His Thr Phe Asp His Thr Thr Trp Ala Gln Asp Ala Arg Arg Arg
50 55 60
Gln Asp Val Leu Leu Arg Trp Ala Gln Ala Leu Glu Leu Ser Val Glu
65 70 75 80
Pro Leu Ala Glu Leu Leu Thr His Glu Asn Gly Lys Thr Ile Gly Gln
85 90 95
Ala Arg Gly Glu Met Arg Ala Ala Ile Ser Glu Val Arg Tyr Tyr Ala
100 105 110
Gly Leu Ala Arg His Ile Ala Gly His Val Ile Glu Pro Glu Pro Gly
115 120 125
Thr Ile Ser Thr Met Leu Arg Glu Ala Ala Gly Val Ala Ala Ile Ile
130 135 140
Val Pro Trp Asn Ala Pro Ala Val Leu Leu Val Arg Ser Leu Ala Pro
145 150 155 160
Ala Leu Ala Ala Gly Cys Thr Ala Ile Val Lys Pro Ala Ala Gln Thr
165 170 175
Ser Leu Ile Thr Ala Ala Met Ile Arg Cys Leu Asp Gln Pro Ala Leu
180 185 190
Pro Ala Gly Ala Val Asn Leu Leu Leu Glu Asn Gly Ala Glu Ala Ala
195 200 205
Ala Arg Leu Val Glu Ser Ala Asp Val Asp Val Ile Ser Phe Thr Gly
210 215 220
Ser Thr Glu Val Gly Lys Arg Ile Met Arg Ala Ala Ala Asp Ser Met
225 230 235 240
Lys Arg Leu Ser Leu Glu Leu Gly Gly Lys Ser Cys Cys Leu Val Phe
245 250 255
Glu Asp Ser Asp Val Lys Ala Ile Ala Pro Arg Leu Ala Arg Ala Ala
260 265 270
Thr Ile Ile Ser Gly Gln Gln Cys Thr Ala Ala Arg Arg Ile Leu Val
275 280 285
His Val Ser Lys Ala Asp Gln Met Arg Asp Glu Leu Val Lys Ala Leu
290 295 300
Ala Ser Leu Lys Val Gly Pro Gly Ile Asp Pro Ala Ser Asp Ile Gly
305 310 315 320
Ala Leu Ile Asp Ala Ala Ser Arg Asp Ala Val Gln Thr Thr Val Glu
325 330 335
Arg Ala Cys Asp Leu Ala Asp Arg Val Leu Leu Arg Gly Thr Ser Ser
340 345 350
Gly Pro Gly Ala Phe Leu Ser Pro Thr Leu Val Glu His Gly Glu Pro
355 360 365
His Ala Phe Phe Cys Gln Asp Glu Ile Phe Gly Pro Phe Val Thr Leu
370 375 380
Glu Thr Phe Val Thr Glu Lys Glu Ala Val Glu Lys Ala Asn Asn Thr
385 390 395 400
Val Phe Gly Leu Ser Ala Ser Val Trp Thr His Asp Ser Ala Arg Ala
405 410 415
Phe Arg Ile Ala Arg Ala Leu Arg Asp Gly Thr Val Trp Ile Asn Asp
420 425 430
His Asn Arg Leu Phe Ala Glu Ala Glu Thr Gly Gly Tyr Arg Gln Ser
435 440 445
Gly Leu Gly Arg Leu His Gly Tyr Asp Ala Leu Ala Asp Phe Thr Glu
450 455 460
Ile Lys His Ile Cys Val Gly Ala Gly Val Leu Glu Gly Ile Glu Val
465 470 475 480
Leu Gly Ser
<210> 27
<211> 483
<212> PRT
<213> Azospirillum sp. B510
<400> 27
Met Thr Asn Leu Asp Ser Arg His Trp Ile Asp Gly Ala Trp Val Pro
1 5 10 15
Gly Thr Asp Arg Phe Ala Ser Ile Asn Pro Ala Asp Gly Ser Val Leu
20 25 30
Gly His Ala Ala Asp Gly Gly Arg Ala Glu Ala Glu Ala Ala Ile Ala
35 40 45
Ala Ala His Ala Ala Phe Asn Arg Pro Asp Trp Ala Gln Asn Pro Arg
50 55 60
Leu Arg Gln Ser Ile Leu Leu Gly Trp Ala Asp Arg Leu Asp Thr Gln
65 70 75 80
Ala Glu Asp Leu Ala Arg Leu Leu Thr Leu Glu Asn Gly Lys Ala Ile
85 90 95
Ala Gln Ser Arg Gly Glu Ile Ala Gly Ala Ile Ser Glu Ile Arg Tyr
100 105 110
Tyr Gly Gly Leu Ala Arg His Val Pro Gly His Val Leu Glu Val Glu
115 120 125
Pro Gly Val Leu Ser Thr Met Leu Arg Glu Pro Ala Gly Val Ala Ala
130 135 140
Leu Ile Ile Pro Trp Asn Ala Pro Ala Val Leu Leu Ala Arg Ala Ile
145 150 155 160
Gly Pro Ala Leu Ala Cys Gly Cys Thr Val Val Val Lys Pro Ala Ala
165 170 175
Gln Thr Thr Leu Leu Thr Ala Ala Phe Leu Arg Ala Leu Ser Glu Val
180 185 190
Pro Ser Leu Pro Arg Gly Val Cys Asn Met Ile Ser Glu Thr Gly His
195 200 205
Ala Ala Ala Ala Arg Leu Val Asp Ser Pro Leu Val Asp Val Val Ser
210 215 220
Phe Thr Gly Ser Thr Ala Thr Gly Lys Arg Ile Met Val Ala Ala Ala
225 230 235 240
Asp Thr Met Lys Lys Leu Ser Leu Glu Leu Gly Gly Lys Ser Cys Cys
245 250 255
Leu Val Phe Pro Asp Ala Asp Pro Ala Glu Thr Ala Ala Arg Ile Ala
260 265 270
Thr Ala Ala Thr Ile Ile Ser Gly Gln Gln Cys Thr Ala Ala Arg Arg
275 280 285
Val Leu Val His Ala Ser Ala Phe Asp Ala Met Lys Thr His Leu Arg
290 295 300
Ala Ala Leu Ala Ala Met Thr Val Gly Asn Gly Leu Asp Pro Ala Ile
305 310 315 320
Arg Met Gly Pro Leu Ile Asp Arg Pro Ala Arg Asp Gln Val Gln Thr
325 330 335
Gln Val Glu Arg Ala Phe Asp Ala Cys Asp Glu Val Leu Leu Arg Gly
340 345 350
Gly Val Pro Thr Asp Ser Pro Ala Ala Ala Ser Phe Leu Thr Pro Ser
355 360 365
Leu Val Ala His Asp Asp Pro Ser Ala Phe Phe Cys Gln Asp Glu Ile
370 375 380
Phe Gly Pro Phe Val Val Leu Glu Arg Phe Glu Thr Glu Ala Glu Ala
385 390 395 400
Val Ala Lys Ala Asn Asn Thr Val Phe Gly Leu Ser Ala Ser Val Trp
405 410 415
Thr Arg Asp Gly Ala Arg Ala Leu Arg Met Ala Arg Ala Leu Arg Asn
420 425 430
Gly Thr Val Trp Ile Asn Asp His Asn Arg Leu Phe Ala Glu Ala Glu
435 440 445
Thr Gly Gly Tyr Arg Gln Ser Gly Leu Gly Arg Leu His Gly Tyr Asp
450 455 460
Ala Phe Ala Asp Phe Thr Glu Leu Lys His Val Cys Gln Thr Val Gly
465 470 475 480
Thr Ile Gly
<210> 28
<211> 480
<212> PRT
<213> Pseudomonas putida
<400> 28
Met Gln Ser Gln His Tyr Ile Asp Gly Gln Trp Thr Ser Thr Asp Arg
1 5 10 15
Trp Thr Asp Ser Leu Asp Pro Ala Ser Gly Glu Leu Ile Gly Cys Phe
20 25 30
Ala Asp Gly Gly Glu Ala Glu Ala Glu Ala Ala Val Ala Ala Ala Ala
35 40 45
Arg Ala Phe Asn Asp Pro Gln Trp Ala Gln Asn Pro Arg Leu Arg Gln
50 55 60
Gln Leu Leu Leu Glu Trp Ala Ala Gly Leu Lys Ala Arg Gln Glu Gln
65 70 75 80
Leu Ala Gln Leu Leu Thr Arg Glu Asn Gly Lys Ala Leu Ala Gln Ser
85 90 95
Arg Gly Glu Ile Gly Gly Ala Ile Ser Glu Ile Leu Tyr Tyr Ala Gly
100 105 110
Leu Ala Arg His Asn Pro Gly His Met Leu Glu Val Ala Pro Gly Glu
115 120 125
Phe Ser Ser Met Leu Arg Glu Pro Ala Gly Val Ala Gly Leu Ile Ile
130 135 140
Pro Trp Asn Ala Pro Ala Val Leu Leu Val Arg Ala Leu Ala Pro Ala
145 150 155 160
Ile Ala Ala Gly Cys Thr Val Val Ile Lys Pro Ala Pro Gln Thr Ala
165 170 175
Leu Phe Asn Ala Ala Met Leu Glu Pro Leu Phe Ala Leu Pro Gly Leu
180 185 190
Pro Ala Gly Ala Val Asn Leu Phe Ala Glu Ser Gly His Ala Gly Ala
195 200 205
Ala His Leu Val Ala Ser Pro Arg Val Asp Val Leu Ser Phe Thr Gly
210 215 220
Ser Thr Ala Thr Gly Gln Arg Ile Met Arg Asp Cys Ala Ala Thr Met
225 230 235 240
Lys Lys Leu Ser Leu Glu Leu Gly Gly Lys Ser Cys Cys Leu Val Phe
245 250 255
Glu Asp Ala Asp Ile Ala Ala Ile Ala Pro Lys Leu Ala Ala Ala Ala
260 265 270
Thr Ile Ile Ser Gly Gln Gln Cys Thr Ala Ala Arg Arg Val Leu Val
275 280 285
His Ala Ser Arg Phe Ala Glu Met Lys Thr Ala Leu Ser Ala Ala Leu
290 295 300
Gly Gln Ile Arg Leu Gly Asn Gly Leu Asp Pro Ala Asn Asn Met Gly
305 310 315 320
Pro Leu Ile Asp Trp His Ser Arg Asp Ser Val Glu Arg Arg Ile Gly
325 330 335
Glu Ala Leu Asp Ser Cys Asp Glu Val Leu Leu Ala Gly Gly Arg Pro
340 345 350
Gln Gly Glu Leu Ser Lys Gly Ala Phe Leu Ala Pro Ser Leu Ile Ala
355 360 365
His Arg Asp Ser Ser Ala Phe Phe Cys Gln Glu Glu Ile Phe Gly Pro
370 375 380
Leu Leu Val Leu Glu Ser Phe Glu Asp Glu Thr Glu Ala Val Ala Arg
385 390 395 400
Ala Asn His Thr Glu Phe Gly Leu Ser Ala Ser Val Trp Thr Asp Gln
405 410 415
Gly Ala Arg Ala Trp Arg Val Ala Arg Ala Leu Arg Asn Gly Thr Val
420 425 430
Trp Leu Asn Asp His Asn Arg Leu Phe Ala Glu Ala Glu Thr Gly Gly
435 440 445
Tyr Arg Lys Ser Gly Leu Gly Arg Leu His Gly Val Asp Ala Leu Leu
450 455 460
Asp Phe Ser Glu Leu Lys His Ile Tyr Gln Asn Val Gly Thr Leu Gly
465 470 475 480
<210> 29
<211> 486
<212> PRT
<213> Rhodopseudomonas palustris
<400> 29
Met Gly Met Thr Ala Leu His Ala Asp Asn Leu Ile Asp Gly Ala Trp
1 5 10 15
Gln Pro Ala Gln Ser Gly Ala Thr Ala Pro Ser Leu Asp Pro Ser Ser
20 25 30
Gly Gly Thr Ile Gly Gly Phe Ala Ala Gly Gly Ala Ala Asp Ala Gln
35 40 45
Ala Ala Val Ala Ala Ala Arg Arg Ala Phe Glu Arg Pro Glu Trp Ser
50 55 60
Gln Asn Pro Arg Ala Arg Gln Met Val Met Leu Arg Trp Ala Asp Arg
65 70 75 80
Met Glu Ala Gln Ala Asp Gln Leu Ala Arg Leu Leu Thr Leu Glu Asn
85 90 95
Gly Lys Pro Leu Pro Gln Ser Arg Gly Glu Ile Ala Gly Ser Val Ser
100 105 110
Glu Ile Arg Tyr Tyr Ala Gly Leu Thr Arg Tyr Ile Pro Gly His Val
115 120 125
Phe Glu Val Glu Pro Gly Ser Phe Ser Thr Leu Leu Lys Glu Pro Ala
130 135 140
Gly Val Ala Gly Leu Ile Ile Pro Trp Asn Ala Pro Ala Val Leu Leu
145 150 155 160
Ile Arg Ala Leu Thr Pro Ala Leu Ala Ala Gly Cys Thr Val Val Ile
165 170 175
Lys Pro Ala Pro Gln Thr Ala Gln Ile Thr Ala Ala Ile Ile Lys Cys
180 185 190
Leu His Glu Val Asp Gly Leu Pro Arg Gly Val Val Asn Leu Val Ser
195 200 205
Glu Gln Gly His Gln Val Ala Glu His Leu Val Thr Ser Asn Asp Val
210 215 220
Asp Val Ile Ser Phe Thr Gly Ser Asn Ala Thr Gly Ala Arg Ile Met
225 230 235 240
Ala Ala Ala Ala Pro Thr Met Lys Lys Leu Ser Leu Glu Leu Gly Gly
245 250 255
Lys Ser Ala Cys Leu Val Phe Asp Asp Ala Asp Ile Ala Asp Val Ala
260 265 270
Pro Lys Leu Ala Ala Ala Ala Thr Ile Ile Ala Gly Gln Gln Cys Thr
275 280 285
Ala Ala Arg Arg Val Leu Val His Ala Ser Arg Tyr Asp Glu Met Lys
290 295 300
Ala Ala Leu Lys Ala Ala Leu Ala Asn Ile Arg Ile Ala Pro Gly Ser
305 310 315 320
Ala Ala Gly Ala Glu Met Gly Pro Leu Ile Asp Ala Ala Ser Leu Ala
325 330 335
Ala Val Ala Lys Arg Ala Asp Glu Ala Met Gln Ala Ala Asp Glu Val
340 345 350
Val Leu Arg Gly Gly Arg Pro Ala Gly Asp Leu Ala Asn Gly Tyr Phe
355 360 365
Leu Ser Pro Thr Leu Val Ala His Arg Asp Thr Ser Ala Phe Phe Val
370 375 380
Gln Glu Glu Ile Phe Gly Pro Leu Val Val Leu Glu Lys Phe Glu Asp
385 390 395 400
Glu Lys Glu Ala Val Ala Arg Ala Asn His Ser Asp Tyr Gly Leu Ser
405 410 415
Ala Ser Val Trp Thr His Asp Gly Ala Arg Ala Met Arg Val Ala Arg
420 425 430
Ala Leu Arg Asn Gly Thr Val Trp Ile Asn Asp His Asn Lys Leu Phe
435 440 445
Ala Glu Ala Glu Thr Gly Gly Tyr Arg Arg Ser Gly Leu Gly Arg Leu
450 455 460
His Gly Tyr Asp Ala Leu Ile Asp Phe Leu Glu Ile Lys His Val Tyr
465 470 475 480
Gln Ser Cys Gly Val Val
485
<210> 30
<211> 485
<212> PRT
<213> Dinoroseobacter shibae DFL 12
<400> 30
Met Thr Thr Thr Asp Leu Ile Ala Arg His Met Ile Gly Gly Ser Tyr
1 5 10 15
Ser Asp Ala Gly Asp Lys Ile Ala Ser Ile Asn Pro Ala Thr Gly Ala
20 25 30
Val Val Gly His Val Arg Ala Asp Gly Ala Ala Gln Ala Thr Ala Ala
35 40 45
Ile Ala Ala Ala Arg Ala Ala Phe Asp Thr Thr Leu Trp Pro Gln Ser
50 55 60
Pro Arg Asp Arg Gln Met Ala Leu Leu Arg Trp Ala Asp Ala Leu Glu
65 70 75 80
Ala Asp Leu Ala Arg Leu Ala Glu Leu Leu Thr Leu Thr Asn Gly Lys
85 90 95
Pro Leu Gly Ala Ser Lys Gly Glu Leu Gly Ala Ala Ile Ser Glu Ile
100 105 110
Arg Tyr Tyr Ala Gly Leu Thr Arg His Asn Pro Gly His Ala Met Glu
115 120 125
Val Ala Pro Gly Glu Leu Ser Val Met Leu Arg Glu Pro Ala Gly Val
130 135 140
Ala Gly Ile Ile Val Pro Trp Asn Ala Pro Ala Val Leu Leu Ile Arg
145 150 155 160
Ser Leu Ala Pro Ala Leu Ala Val Gly Cys Thr Thr Val Thr Lys Pro
165 170 175
Ala Pro Gln Thr Ala Leu Phe Thr Ala Ala Cys Met Ala Pro Leu Phe
180 185 190
Glu Asp Ala Ala Ile Pro Ala Gly Val Val Asn Val Val Phe Glu Val
195 200 205
Gly His Asp Ala Ala Gln Thr Leu Val Thr Ser Pro Asp Val Asp Val
210 215 220
Ile Ser Phe Thr Gly Ser Asn Ala Val Gly Gln Arg Ile Met Ala Asp
225 230 235 240
Ala Ala Pro Thr Met Lys Lys Leu Ser Leu Glu Leu Gly Gly Lys Ser
245 250 255
Cys Cys Ile Val Leu Asp Asp Ala Asp Ile Gly Val Val Ala Pro Lys
260 265 270
Leu Ala Ala Ala Ala Thr Ile Ile Ser Gly Gln Gln Cys Thr Ala Ala
275 280 285
Arg Arg Val Leu Val His Glu Ser Arg Leu Asp Glu Ala Lys Ser Ala
290 295 300
Leu Ser Ala Ala Leu Gln Ala Val Ser Ile Gly Asp Gly Met Ser Asp
305 310 315 320
Gly Thr Ala Met Gly Pro Leu Ile Asp Ile Gln Ser Arg Asp Arg Val
325 330 335
Met Arg Asp Cys Gly Thr Val Tyr Asp Thr Ala Asp Glu Val Val Leu
340 345 350
Arg Gly Gly Pro Leu Asp Gly Pro Lys Gly Ser Ala Phe Met Ser Pro
355 360 365
Ala Leu Val Val His Ser Asp Pro Asn Ala Ser Phe Val Gln Asp Glu
370 375 380
Ile Phe Gly Pro Leu Val Val Leu Glu Thr Phe Arg Asp Glu Ala Asp
385 390 395 400
Ala Val Ala Lys Ala Asn Asn Thr Val Tyr Gly Leu Ser Ala Ser Ile
405 410 415
Trp Thr His Arg Gly Asp Ala Ser Trp Arg Leu Ala Arg Ala Leu Arg
420 425 430
Asn Gly Thr Val Trp Ile Asn Asp His Asn Arg Leu Phe Ala Glu Ala
435 440 445
Glu Thr Gly Gly Tyr Arg Arg Ser Gly Leu Gly Arg Leu His Gly Phe
450 455 460
Asp Gly Leu Leu Asp Phe Cys Glu Leu Lys His Val Tyr Gln Asn Val
465 470 475 480
Gly Val Val Gly His
485
<210> 31
<211> 447
<212> PRT
<213> Cupriavidus basilensis
<400> 31
Met Glu Ala Val Ala Lys Lys Arg Thr Glu Thr Ile Ser Glu Ala Leu
1 5 10 15
Pro Ala Ala Thr Asn Arg Gln Val Phe Gly Ala Val Thr Ala Ser Cys
20 25 30
Met Gly Trp Ala Leu Asp Leu Phe Asp Leu Phe Ile Leu Leu Phe Val
35 40 45
Ala Pro Val Ile Gly Arg Leu Phe Phe Pro Ser Glu His Ala Met Leu
50 55 60
Ser Leu Ala Ala Val Tyr Ala Ser Phe Ala Val Thr Leu Leu Met Arg
65 70 75 80
Pro Leu Gly Ser Ala Ile Phe Gly Thr Tyr Ala Asp Arg His Gly Arg
85 90 95
Lys Gly Ala Met Val Val Ala Val Thr Gly Val Gly Leu Ser Thr Ala
100 105 110
Ala Phe Gly Leu Leu Pro Thr Val Gly Gln Val Gly Leu Leu Ala Pro
115 120 125
Ala Leu Phe Ile Leu Leu Arg Leu Val Gln Gly Ile Phe Val Gly Gly
130 135 140
Val Val Ala Ser Thr His Thr Ile Gly Thr Glu Ser Val Pro Pro Ser
145 150 155 160
Trp Arg Gly Ala Val Ser Gly Leu Val Gly Gly Gly Gly Ala Gly Ile
165 170 175
Gly Ala Leu Leu Ala Ser Ile Thr Tyr Met Ala Met Thr Ala Leu Phe
180 185 190
Pro Gly Glu Ala Phe Asp Ala Trp Gly Trp Arg Cys Met Phe Phe Ser
195 200 205
Gly Ile Ile Ser Ser Val Leu Gly Leu Phe Ile Phe Asn Ser Leu Glu
210 215 220
Glu Ser Pro Leu Trp Lys Gln Leu Gln Ala Ala Lys Gly His Ala Ala
225 230 235 240
Pro Val Glu Asn Pro Leu Arg Val Ile Phe Ser Arg Gln Tyr Arg Gly
245 250 255
Val Leu Phe Val Asn Ile Leu Leu Thr Val Gly Gly Gly Ser Ala Tyr
260 265 270
Tyr Leu Thr Ser Gly Tyr Leu Pro Thr Phe Leu Lys Val Val Val Lys
275 280 285
Ala Pro Ala Gly Ala Ser Ala Ala Ile Leu Met Ala Ser Ser Val Gly
290 295 300
Val Ile Val Ala Ser Ile Ile Ala Gly His Leu Ser Thr Leu Ile Gly
305 310 315 320
Arg Lys Arg Ala Phe Leu Leu Ile Gly Ala Leu Asn Val Val Leu Leu
325 330 335
Pro Leu Ile Tyr Gln Arg Met Pro Ala Ala Pro Asp Val Thr Thr Leu
340 345 350
Gly Ile Tyr Ala Val Ala Leu Ala Met Leu Gly Ser Thr Gly Phe Ala
355 360 365
Pro Ile Leu Ile Phe Leu Asn Glu Arg Phe Pro Thr Ser Ile Arg Ala
370 375 380
Thr Gly Thr Gly Leu Ser Trp Asn Ile Gly Phe Ala Ile Gly Gly Met
385 390 395 400
Met Pro Thr Phe Ala Ser Leu Cys Ala Ser Thr Pro Ala Asp Leu Pro
405 410 415
Lys Val Leu Gly Ile Phe Val Ala Val Val Thr Ala Ile Tyr Leu Ala
420 425 430
Gly Ala Ala Ile Val Pro Glu Thr Ala Gly Arg Leu Gly Glu Lys
435 440 445
<210> 32
<211> 449
<212> PRT
<213> Cupriavidus basilensis
<400> 32
Met Glu Ala Val Ala Lys Lys Ser Ala Ala Thr Ile Ser Glu Ala Leu
1 5 10 15
Pro Ala Ala Ser Asn Arg Gln Val Phe Gly Ala Val Ala Ala Ser Cys
20 25 30
Met Gly Trp Ala Leu Asp Leu Phe Asp Leu Phe Ile Leu Leu Phe Val
35 40 45
Ala Pro Val Ile Gly Arg Leu Phe Phe Pro Ser Glu His Ala Met Leu
50 55 60
Ser Leu Ala Ala Val Tyr Ala Ser Phe Ala Val Thr Leu Leu Met Arg
65 70 75 80
Pro Leu Gly Ser Ala Ile Phe Gly Ser Tyr Ala Asp Arg His Gly Arg
85 90 95
Lys Gly Ala Met Val Val Ala Val Thr Gly Val Gly Leu Ser Thr Ala
100 105 110
Ala Phe Gly Leu Leu Pro Thr Val Gly Gln Val Gly Leu Leu Ala Pro
115 120 125
Ala Leu Phe Ile Leu Leu Arg Leu Val Gln Gly Ile Phe Val Gly Gly
130 135 140
Val Val Ala Ser Thr His Thr Ile Gly Thr Glu Ser Val Pro Pro Ser
145 150 155 160
Trp Arg Gly Ala Val Ser Gly Leu Val Gly Gly Gly Gly Ala Gly Leu
165 170 175
Gly Ala Leu Leu Ala Ser Ile Thr Tyr Met Ala Met Thr Ala Leu Phe
180 185 190
Pro Gly Glu Ala Phe Asp Ala Trp Gly Trp Arg Cys Met Phe Phe Ser
195 200 205
Gly Ile Ile Ser Ser Val Leu Gly Leu Phe Ile Phe Asn Ser Leu Glu
210 215 220
Glu Ser Pro Leu Trp Lys Gln Leu Gln Ala Ala Lys Gly His Ala Ala
225 230 235 240
Pro Val Glu Asn Pro Leu Arg Val Ile Phe Ser Arg Gln Tyr Arg Gly
245 250 255
Val Leu Phe Val Asn Ile Leu Leu Thr Val Gly Gly Gly Ser Ala Tyr
260 265 270
Tyr Leu Thr Ser Gly Tyr Leu Pro Thr Phe Leu Lys Val Val Val Lys
275 280 285
Ala Ser Ala Gly Glu Ser Ala Ala Ile Leu Met Ala Ser Ser Leu Gly
290 295 300
Val Ile Val Ala Ser Ile Leu Ala Gly His Leu Ser Thr Met Ile Gly
305 310 315 320
Arg Lys Arg Ala Phe Leu Leu Ile Gly Ala Leu Asn Val Val Val Leu
325 330 335
Pro Leu Leu Tyr Gln Trp Met Pro Ala Ala Pro Asp Thr Thr Thr Leu
340 345 350
Gly Leu Tyr Ala Val Val Leu Ser Met Leu Gly Cys Ser Gly Phe Ala
355 360 365
Pro Ile Leu Ile Phe Leu Asn Glu Arg Phe Pro Thr Ser Ile Arg Ala
370 375 380
Thr Gly Thr Gly Leu Ser Trp Asn Ile Gly Phe Ala Val Gly Gly Met
385 390 395 400
Met Pro Thr Phe Ala Ser Leu Cys Ala Ser Thr Pro Ala Glu Leu Pro
405 410 415
Met Val Leu Gly Ile Phe Leu Ala Val Val Thr Ile Ile Tyr Leu Val
420 425 430
Gly Ala Phe Ile Val Pro Glu Thr Val Gly Arg Leu Gly Asp Asn Gly
435 440 445
Ala
<210> 33
<211> 449
<212> PRT
<213> Methylobacterium radiotolerans
<400> 33
Met Gln Thr Ala Ala Thr Phe Ala Ser Asp Pro Pro Ala Leu Ala Lys
1 5 10 15
Pro Thr Gly Arg Gln Thr Val Thr Ala Ala Met Ala Ser Leu Phe Gly
20 25 30
Trp Gly Leu Asp Leu Phe Asp Leu Phe Ile Leu Leu Tyr Val Ala Pro
35 40 45
Val Val Gly Thr Leu Phe Phe Pro Ala Asp Lys Pro Met Leu Ser Leu
50 55 60
Ala Gly Ala Tyr Ala Ser Phe Ala Val Thr Leu Leu Ile Arg Pro Leu
65 70 75 80
Gly Ser Ala Leu Phe Gly Ser Tyr Ala Asp Arg Phe Gly Arg Arg Arg
85 90 95
Ala Leu Met Val Ala Val Val Gly Val Gly Ile Ser Thr Ala Val Phe
100 105 110
Gly Leu Leu Pro Thr Val Gly Gln Ile Gly Trp Leu Ala Thr Ala Val
115 120 125
Phe Leu Phe Phe Arg Leu Val Gln Gly Ile Phe Val Gly Gly Val Val
130 135 140
Ala Ala Ser His Thr Ile Gly Thr Glu Ser Val Pro Glu Arg Trp Arg
145 150 155 160
Gly Leu Met Ser Gly Ala Val Gly Gly Gly Gly Ser Ala Ile Gly Gly
165 170 175
Leu Leu Ala Ser Leu Val Phe Tyr Val Val Ser Leu Met Ala Pro Gly
180 185 190
Glu Ala Phe Ala Glu Trp Gly Trp Arg Leu Met Phe Phe Ser Gly Leu
195 200 205
Leu Thr Ser Val Ile Gly Leu Ile Leu Phe Arg Asn Leu Glu Glu Ser
210 215 220
Pro Ile Phe Lys Glu Leu Gln Ala Arg Lys Ala Ala Leu Arg Ala Gly
225 230 235 240
Ala Pro Ala Glu Ala Ser Pro Ile Arg Ser Leu Phe Ser Pro Ser Asn
245 250 255
Arg Gly Ser Phe Ala Val Ala Thr Leu Ile Ser Phe Gly Gly Gly Ala
260 265 270
Ala Tyr Tyr Leu Thr Ser Gly Tyr Leu Pro Thr Leu Leu Lys Leu Val
275 280 285
Asn Gly Val Pro Asn Ala Thr Ala Ser Met Ile Leu Ile Gly Ala Asn
290 295 300
Val Ala Ala Ala Ile Gly Ala Cys Gly Met Gly Glu Leu Ser Gln His
305 310 315 320
Ile Gly Arg Lys Arg Ser Phe Leu Leu Met Gly Val Ile Arg Leu Leu
325 330 335
Ala Phe Pro Ala Leu Phe Leu Thr Met Ala Asn Thr Thr Ser Leu Val
340 345 350
Gly Val Ala Ala Cys Ala Phe Leu Leu Ala Leu Ile Ala Asn Gly Ser
355 360 365
Tyr Gly Pro Leu Leu Ile Phe Leu Asn Glu Lys Phe Pro Thr Ala Val
370 375 380
Arg Ala Thr Gly Thr Gly Leu Thr Trp Asn Ile Gly Phe Ala Leu Gly
385 390 395 400
Gly Met Leu Pro Thr Leu Val Ser Leu Val Ala Asp Gly Pro Thr Gln
405 410 415
Ile Pro Met Val Leu Ala Val Ile Thr Thr Gly Val Thr Leu Val Tyr
420 425 430
Leu Val Gly Ala Phe Leu Thr Asp Glu Thr Gln Gly Asn Leu Asp Arg
435 440 445
Ala
<210> 34
<211> 443
<212> PRT
<213> Sulfolobus acidocaldarius
<400> 34
Met Lys Lys Glu Glu Lys Phe Thr Ser Asn His Phe Lys Trp Thr Leu
1 5 10 15
Ala Thr Phe Phe Thr Trp Thr Phe Asp Leu Tyr Asp Leu Phe Thr Ile
20 25 30
Leu Leu Val Ala Pro Tyr Ile Ser Ser Leu Phe Phe Pro Ser Ser Ile
35 40 45
Thr Phe Leu Ser Ile Ala Ala Thr Tyr Ala Gly Phe Ala Thr Ser Leu
50 55 60
Ile Met Arg Pro Val Gly Ala Thr Val Phe Gly Ser Arg Val Ser Asp
65 70 75 80
Lys Val Gly Arg Lys Arg Ala Ile Phe Tyr Gly Leu Ile Gly Leu Val
85 90 95
Ile Thr Ser Thr Leu Gln Gly Ala Leu Pro Thr Tyr Gln Val Val Gly
100 105 110
Val Ile Ala Pro Ile Leu Leu Leu Ala Val Arg Leu Ile Gln Gly Val
115 120 125
Phe Ile Gly Gly Ile Thr Ala Gly Ser His Val Ile Gly Pro Glu Ser
130 135 140
Val Pro Glu Arg Tyr Arg Gly Ile Val Gly Gly Leu Gly Phe Ser Ala
145 150 155 160
Ala Gly Val Ala Tyr Leu Ile Ala Ala Gly Trp Phe Phe Leu Thr Thr
165 170 175
Ile Leu Tyr Pro Gly Ser Ser Tyr Leu Val Trp Gly Trp Arg Val Met
180 185 190
Phe Phe Gly Gly Leu Leu Ser Leu Ala Val Leu Gly Phe Val Asn Tyr
195 200 205
Leu Val Pro Glu Ser Glu Val Trp Thr Lys Ile Lys Lys Arg Gly Ser
210 215 220
Val Val Lys Ser Pro Leu Lys Glu Ile Phe Ser Lys Tyr Arg Tyr Gln
225 230 235 240
Leu Gly Val Ala Leu Leu Leu Ser Ile Gly Trp Gly Ala Ser Phe Tyr
245 250 255
Val Thr Asp Gly Ile Leu Pro Thr Phe Leu Ser Ser Val Asn Lys Leu
260 265 270
Ala Lys Thr Glu Ile Ala Ile Val Met Ile Ile Gly Ser Ile Gly Met
275 280 285
Ser Ile Gly Pro Leu Ile Gly Gly Glu Ile Ser Gln Ile Ile Gly Arg
290 295 300
Lys Ile Thr Ser Leu Ile Gly Ala Ile Ile Val Leu Ala Val Val Gly
305 310 315 320
Pro Leu Phe Leu Ser Leu Gly Ser Leu Lys Ser Gly Asp Leu Asn Gln
325 330 335
Ile Ile Leu His Ser Phe Ala Ile Leu Phe Leu Val Asp Ile Gly Gly
340 345 350
Gly Met Leu Met Thr Tyr Leu Asn Glu Ile Tyr Pro Ala Ser Val Arg
355 360 365
Gly Thr Gly Val Gly Phe Thr Trp Asn Thr Gly Phe Ala Ile Gly Gly
370 375 380
Thr Ile Pro Thr Ile Ile Ser Leu Ala Val Ala Ser Ala Gly Leu Ser
385 390 395 400
Ala Phe Pro Ser Ile Met Phe Tyr Thr Leu Ile Val Val Ser Val Ile
405 410 415
Ile Leu Val Gly Thr Val Leu Thr Lys Glu Thr Lys Gly Thr Ile Ser
420 425 430
Lys Glu Glu Tyr Glu Ile Gln Lys Glu Thr Leu
435 440
<210> 35
<211> 1240
<212> DNA
<213> Artificial
<220>
<223> Synthetic KpnI-NheI fragment for expression of alcohol
dehydrogenase of Aneurinibacillus terranovensis
<400> 35
ggtaccgaat tccacatgac aaggggagac cgcatgacca ttagtccggc agttaaagcc 60
atcaactttg aattttcatt taacctgccg accctgatcg aatttggtta tggtaaaatg 120
gaaaaattcg gccagcagct gattagcatt ggtgttaaac gcatttttat ggtgaccgat 180
aaaggtgttg aaagcgcagg tctgctggca gcactgaccg attcactgca ggcagcagca 240
attcagtttg atatctatac cgatgtggaa agcgatccga gcctggaaac cattgatcgt 300
ggtgttgaag tttttcagca gaaaccgtat gattgcattg ttgcagttgg tggtggtagc 360
ccgattgata ccgcaaaagg tattcgtgtt gttgcagcaa atggtggtaa tattggtcat 420
tatgccggtg ttaatcagat tccggttgca ccgaccattc cgctgctggc aattccgacc 480
accagtggca ccggtagcga agttaccaat tttggtgttt atagcgattg gcagaacaac 540
gttaaagtta ccgttaccag ccagtatatg gcaccgacaa ttgcatgggt tgatccggca 600
ctgaccatga gcctgcctgc aaaaatgacc gcagcaagcg gtattgatgc actggcacat 660
ggtattgaaa ccttttttag cctgggtagc agtccggcaa gtgatgccct ggcaattgaa 720
gcaattcata ccgttaatcg ttatctgagc cgtgcagttc ataatggtag cgatatggaa 780
gcacgtattg gtatgagcca tggtagcctg ctggctggca tggcatttaa caatggtttt 840
ctgggtctgg cccatgccat tggtagcgca ctgagcggtc attgtcatgt tccgcatggt 900
gttgcaattg gtctgctgct gccgaaagtt gttgaattta atgcaaccgt tcgtccggat 960
aaagcagcaa aaattgcagg tctgatgggt atgaaaggtg aacatagcga agaactggcc 1020
ctgcaggcat caccggcagt tgcacgtctg gttgaagata ttggcctgcc gacacgtctg 1080
cgtgaagttg atgttaccga aaaaaaactg ttcgagatcg ccaaagatag ctttaaaagc 1140
ggcatgatga aattcaatcc gcgtcagccg agcgaaagcg aagttctgca gctgctgaaa 1200
gaaatctttt gaagaccgaa gcgaattcct cgagtctaga 1240
<210> 36
<211> 1205
<212> DNA
<213> Artificial
<220>
<223> Synthetic KpnI-NheI fragment for expression of alcohol
dehydrogenase of Brevibacillus thermoruber
<400> 36
ggtacctagg aaaggaagat taacccatga gccagaccgt gcagggcacc gacttcgcct 60
tcagcttcca cctgccgacc ctgatcgagt tcggctacgg ccgcgccagc cgcctgggcg 120
agcgcctgca gcacctgggc gtgaccaacg tgttcgtggt gaccgacaag ggcgtggagg 180
ccgccggcct gctgaacggc ctggtgggca gcctgcagag cgccggcatc gccttcgacc 240
tgtacaccga ggtggagccg gacccgggcc tggagaccat cgaccgcggc gccgccgtgt 300
tccgcgccaa gccgtacgac tgcctggtgg ccgtgggcgg cggcagcccg atcgacgccg 360
ccaagggcat gcgcgtggtg accagctgcg gcggcagcat cgccgactac gccggcgtga 420
accgcgtgcc gatggccccg gccgtgccgc tggtggccgt gccgaccacc agcggcaccg 480
gcagcgaggt gaccatgttc ggcgtgtaca gcgactggca caaccacgtg aaggtgaccg 540
tgaccagccc gcacatggcc ccgaccatcg ccctggtgga cccggccctg accgtgagcc 600
tgccggccaa gatgaccgcc gccagcggca tcgacgccct ggcccacggc atcgagacct 660
tcttcagcgt gcgcagccgc ccggccagcg acgccctggc catggaggcc atcgccgccg 720
tgaacgccca cctgcgccgc gccgtgcacg acggcagcga cgtggaggcc cgcatcggca 780
tgagccacgg cagcctgctg gccggcatgg ccttcaccaa cggcttcctg ggcctggccc 840
acgccatcgg cagcgccctg agcggccact gccacgtgcc gcacggcatc gccatcggcc 900
tgctgctgcc gcacgtggtg gccttcaacg ccccggcccg cccggacaag gccgcccagc 960
tggcccgcct gctgggcgtg gaggccaacc cgcgcgagga gcgcggcgag gagaccagcg 1020
ccgccgtggc ccgcatggtg gccgacatcg gcctgccgac ccgcctgcgc gacgtgggcg 1080
tgccggagga gaagctgccg gccatcgcca aggacgcctt caagagcggc atgatgacct 1140
gcaacccgcg ccagccgacc gagcaggagg tgcgcgagct gctgcgccgc gccttctgag 1200
ctagc 1205
<210> 37
<211> 1228
<212> DNA
<213> Artificial
<220>
<223> Synthetic KpnI-NheI fragment for expression of alcohol
dehydrogenase of Brevibacillus panacihumi
<400> 37
ggtaccgaat tccacatgac aaggggagac cgcatgagcg caaatcagag cgttcagggt 60
attgaaagcc cgtttagctt tcatctgccg accaatgttc agtttggtgt tggtagcgca 120
agccgtctgg gtgaaatgct gctgagcatg ggtgttcgtc gtgtttttct ggttaccgat 180
cagggtgtgc gtcaggcagg tctgctggat gaagttattc atagcctgga agaaaaaggc 240
ctgcactttc agatttatgc agatgttgaa ccggatccga gcctggaaac cattcaggca 300
ggcgcagcaa tgtttcagca gcagagcttt gattgtatgg ttgcaattgg tggtggtagt 360
ccgattgata ccgcaaaagg tattcgtgtt ctggcagcaa atggtggcgg tattggtcag 420
tatgccggtg ttaatcgcgt tccggcagca agcgcaattc cgctgattgc aattccgacc 480
accagtggca ccggtagcga agttaccatt tttggtgttt atagcgattg ggagaaccac 540
gtgaaaatta ccgttaccag tccgcatatg gcaccgagca ccgcactgat tgatccggca 600
ctgaccctga gcctgcctgc aaaaatgacc gcagcaaccg gtattgatgc actggcacat 660
ggcattgaaa ccttttttag cctgcgtagc agtccggcaa gtgatgccct ggcaattcat 720
gcaatgaaaa tgattgcacc gcatctgcgt cgtgcagttc gtgatggtgc agatatggaa 780
gcacgtattg gtatgagcca gggtagcgtg ctggcaggta tggcatttaa caatggtttt 840
ctgggtctgg cccatgccat tggtagtgca ctgagcggtc attgtcatgt tccgcatggt 900
gttgcgattg gcctgctgct gccgcatgtg gttgcattta atacaccggt tcgtccggaa 960
aaagcagaac tgattgccga tgttctgggt agcgttcaga aagaaaccgg caccgcagcc 1020
gaactggttg gtcagctggt tcaggatatt ggtctgccgc agcgtctgca agaagttggc 1080
gttccggaag cgaaactggt tgatattgca aaagatagct ttaaaagcgg catgatgaaa 1140
tggaatccgc gtctgccgac agaacaagaa gttctggaac tgctgcagaa agccttttga 1200
agaccgaagc gaattcctcg agtctaga 1228
<210> 38
<211> 1184
<212> DNA
<213> Artificial
<220>
<223> Synthetic KpnI-NheI fragment for expression of alcohol
dehydrogenase of Bacillus sp. FJAT-14578
<400> 38
ggtacctagg aaaggaagat taacccatgt acccgagctt cgagttccac ctgccgacca 60
agatccactt cggctacaac accatcaagc agctggacca cctgccgttc gagatcaagc 120
gcgccttcat cgtgaccgac cagggcgtgc tgaacagcgg cctggtggag aacgtgacca 180
acatcctgaa ggaccaccag atcagctacg tgatctacag cgaggtggag ccggacccga 240
gcgtggagac cgtggacaag gccgcccaga tgttccagcg cgaggaggcc gacgccctga 300
tcgccatcgg cggcggcagc ccgatcgaca ccgccaaggg cgtgcgcgtg atcgccggca 360
acggcggcag catccgcgac tacgccggcg tgaacctgat caagcagaag agcaacatcc 420
cgctgatcgc catcccgacc accagcggca ccggcagcga ggtgaccatc ttcgccgtgt 480
tcagcgactg ggaggagaac cgcaaggtga ccgtgaccag cccgttcctg gccccggaca 540
tcagcatcgt ggacccgaag atgaccatga ccgccccgcc ggccatcacc gccgccagcg 600
gcttcgacgc cttcgcccac ggcgccgaga ccttcgtgag ccgcgccagc cagccggcca 660
gcgacgtgct ggccttcagc gccatgagca ccgtgagcaa gtacctgcgc cgcgccgtgt 720
acaacggcga ggacgtggag gcccgcatca agatggccga ggccagcctg ctggccggca 780
tggccttcaa ccagagctac ctgggcctga cccacgccat cggcagcgcc ctgagcggcc 840
acgcccacgt gagccacggc gtggccatcg gcctgctgct gccgggcgtg atccgctaca 900
acagcatcag ccgcatggac aagcacatcg agatggccgg cgccttccgc gagatcgacc 960
gcagcctgag cgactgggag atcatcgacc agctgatcga ggacgtgagc cgcctgcgcg 1020
acgacatcgg cctgccgcag cgcctgcagc aggtgggcgt gaaggaggac cagctgaaga 1080
tgatcgccgc cgacagcgtg aagagcggca tgtggaagtt caacccgcgc caggccagcg 1140
aggaggagat cctggagctg ctgaaggagc tgtactgagc tagc 1184
<210> 39
<211> 1184
<212> DNA
<213> Artificial
<220>
<223> Synthetic KpnI-NheI fragment for expression of alcohol
dehydrogenase of Bacillus sp. L1(2012)
<400> 39
ggtacctagg aaaggaagat taacccatgt acaccagctt caacttccac ctgccgaccc 60
gcatccagtt cggctacgag aaggtgaagg agctgaagaa cctgccgttc caggccaacc 120
gcgccttcat cgtgaccgac aagggcgtgg agaaggccgg cctgctgaac gacgtgatcg 180
acgccatcaa gcaggccaac atgacctaca agatctaccg cgacgtggag ccggacccga 240
gcgtggagac cgtggacaag gccgccaagg ccttcgccga ggccgagtgc gacctgctga 300
tcgccgtggg cggcggcagc ccgatcgaca ccgccaaggg cgtgcgcgtg gtggccagca 360
acggcggcag catccgcaac tacagcggcg tgaacctggt gaaggaggcc ccgagcgtgc 420
cgctggtggc catcccgacc accgccggca ccggcagcga ggtgaccatc ttcgccgtgt 480
tcagcgacga caaggagaac cgcaaggtga ccgtgaccag cagccacctg agcccggacg 540
tgagcatcat cgacccgaag ctgaccctga ccgccccgcc gagcatcacc gccgccgccg 600
gcttcgacgc cttcgcccac gccgccgagg ccttcgtgag ccgcatcagc cagccgccga 660
gcgacgccct ggccctgagc gccatgaaga ccgtgcacac ctacctgcgc cgcgccgtgt 720
acaacggcga cgacatcgag gcccgcatga agatggccga ggccagcctg ctggccggca 780
tggccttcaa ccagagctac ctgggcctgg cccacgccat cggcagcgcc atcagcgtgc 840
acgcccacgt gagccacggc gtggtgatcg gcctgctgct gccgaaggtg atcgagtaca 900
acctggtggc caagatcgac aagtacgccg aggccggcaa gtacatcgag cagagcagcc 960
acggcctgag caactacgag gccgccgccc tgttcagcga gaccgtgacc cagctgcgca 1020
acgacatcgg cctgccgaag cagctgcgcg aggtgaacgt gaaggaggcc cagctggagg 1080
ccatcagcaa ggacagcatc aagagcggca tgtggcagtt caacccgcgc cgcgccagcg 1140
agcaggacgt gtaccagatg ctgcgcgaga tgctgtgagc tagc 1184
<210> 40
<211> 27
<212> DNA
<213> Artificial
<220>
<223> ribosome binding site containing spacer no. 2
<400> 40
gaattccaca tgacaagggg agaccgc 27
Claims (15)
- 5-히드록시메틸-2-푸란카르복실산(HMFCA)을 5-포르밀-2-푸로산(FFA)으로 산화시키는 방법으로서, 상기 방법은 FDVIFCA의 존재하에서 세포를 배양하며, 바람직하게는 상기 세포에 의한 FDVIFCA의 산화에 도움이 되는 조건하에서 세포를 배양하는 단계를 포함하며, 여기서 상기 세포는 SEQ ID NO: 1 내지 11의 아미노산 서열 중 어느 하나와 적어도 45% 동일성을 갖는 아미노산 서열을 갖는 디하이드로게나아제를 코딩하는 뉴클레오티드 서열의 발현을 위한 발현 구조물을 포함하며, 그리고 여기서 상기 발현 구조물은 상기 세포에서 발현가능하며, 상기 디하이드로게나아제의 발현은 상기 발현 구조물이 결여된 이에 상응하는 와일드 타입 세포에 비해, FDVIFCA를 FFA로 산화시키는 능력을 세포에 부여하거나 증가시키는, 5-히드록시메틸-2-푸란카르복실산(HMFCA)을 5-포르밀-2-푸로산(FFA)으로 산화시키는 방법.
- FDCA를 생산하는 방법으로서, 상기 방법은 FDCA의 하나 이상의 푸라닉 전구체를 포함하는 배지에서 세포를 배양하며, 바람직하게는 상기 세포에 의한 FDCA의 푸라닉 전구체의 FDCA로의 산화에 도움이 되는 조건하에서 세포를 배양하는 단계, 및 선택적으로 상기 FDCA의 회수를 포함하며, 여기서 상기 세포는 SEQ ID NO: 1 내지 11의 아미노산 서열 중 어느 하나와 적어도 45% 동일성을 갖는 아미노산 서열을 갖는 디하이드로게나아제를 코딩하는 뉴클레오티드 서열의 발현을 위한 발현 구조물을 포함하며, 여기서, 상기 발현 구조물은 상기 세포에서 발현가능하며, 상기 디하이드로게나아제의 발현은 상기 발현 구조물이 결여된 이에 상응하는 와일드 타입 세포에 비해, HMFCA를 FFA로 산화시키는 능력을 세포에 부여하거나 증가시키며,
여기서 바람직하게, FDCA의 적어도 하나의 푸라닉 전구체는 HMF, 2,5-디히드록시메틸 푸란(DHF), HMFCA, FFA 및 2,5-디포르밀 푸란(DFF)으로 구성되는 그룹으로부터 선택되며, 이중에서는 HMF가 가장 바람직하며, 그리고
여기서 바람직하게 FDCA의 푸라닉 전구체는 하나 이상의 헥소스 당으로부터 얻어지며, 바람직하게 리그노셀룰로즈 바이오매스로부터, 바람직하게는 산-촉매화 디하이드로게네이션에 의해 얻어진 하나 이상의 헥소스 당인,
FDCA를 생산하는 방법.
- 제2항에 있어서,
상기 FDCA는 냉각 결정화 및/또는 용매 추출이 후속하는 산 또는 염 침전을 포함하는 공정에 의해 배지로부터 회수되는, FDCA를 생산하는 방법.
- a) 제2항 또는 제3항에 따른 방법으로 FDCA 모노머를 제조하는 단계; 및
b) a)에서 얻어진 FDCA 모노머로부터 폴리머를 제조하는 단계
를 포함하는, 하나 이상의 FDCA 모노머로부터 폴리머를 제조하는 방법.
- 하나 이상의 푸라닉 전구체를 FDCA로 바이오트랜스포메이션(biotransformation)시키기 위한, 세포의 용도로서,
FDCA의 적어도 하나의 푸라닉 전구체는 HMF, DHF, HMFCA, FFA 및 DFF로 구성되는 그룹으로부터 선택되며, 그 중 HMF가 가장 바람직하며, 여기서 상기 세포는 SEQ ID NO: 1 내지 11의 아미노산 서열 중 어느 하나와 적어도 45% 동일성을 갖는 아미노산 서열을 갖는 디하이드로게나아제를 코딩하는 뉴클레오티드 서열의 발현을 위한 발현 구조물을 포함하며, 그리고 여기서, 상기 발현 구조물은 상기 세포에서 발현가능하며, 상기 디하이드로게나아제의 발현은 상기 발현 구조물이 결여된 이에 상응하는 와일드 타입 세포에 비해, HMFCA를 FFA로 산화시키는 능력을 세포에 부여하거나 증가시키는, 세포의 용도.
- SEQ ID NO: 1 내지 11 중 어느 하나의 아미노산 서열과 적어도 45% 동일성을 갖는 아미노산 서열을 갖는 디하이드로게나아제를 코딩하는 뉴클레오티드 서열의 발현을 위한 발현 구조물을 포함하는 세포로서, 여기서, 상기 발현 구조물은 상기 세포에서 발현가능하며, 상기 디하이드로게나아제의 발현은 상기 발현 구조물이 결여된 이에 상응하는 와일드 타입 세포에 비해, HMFCA를 FFA로 산화시키는 능력을 세포에 부여하거나 증가시키며,
그리고 여기서 상기 세포는 다음 중 적어도 하나를 추가로 갖는, 세포.
a) 푸라닉 알데히드를 이에 상응하는 푸라닉 카르복실산으로 산화시키는 알데히드 디하이드로게나아제 활성으로서, 여기서 바람직하게 상기 세포는 SEQ ID NO: 24, 25, 26, 27, 28, 29 및 30 중 어느 하나의 아미노산 서열과 적어도 45% 동일성을 갖는 아미노산 서열을 포함하는 알데히드 디하이드로게나아제를 코딩하는 뉴클레오티드 서열의 발현을 위한 제 2 발현 구조물을 포함하며, 여기서 상기 제 2 발현 구조물은 상기 세포에서 발현가능하고 상기 알데히드 디하이드로게나아제의 발현은 상기 제 2 발현 구조물이 결여된 이에 상응하는 와일드 타입 세포에 비해, i) 5-히드록시메틸푸르푸랄(HMF)을 HMFCA로 산화시키는 것, ii) DFF를 FFA로 산화시키는 것, 및 iii) FFA를 FDCA로 산화시키는 것 중 적어도 하나의 능력을 상기 세포에 부여하거나 증가시킴; 및
b) 상기 세포 내로 및/또는 외로 푸라닉 화합물을 운반하는 능력으로서, 여기서 바람직하게 상기 세포는 적어도 HMFCA를 상기 세포 내로 운반하는 능력을 갖는 폴리펩티드를 코딩하는 뉴클레오티드 서열의 발현을 위한 제 3 발현 구조물을 포함하고, 상기 폴리펩티드는 SEQ ID NO's: 17, 31, 32, 33 및 34 중 어느 하나의 아미노산 서열과 적어도 45% 동일성을 갖는 아미노산 서열을 포함하며, 여기서, 상기 제 3 발현 구조물은 상기 세포에서 발현 가능하며, 상기 폴리펩티드의 발현은 상기 제 3 발현 구조물이 결여된 이에 상응하는 와일드 타입 세포와 비교하여, 상기 세포에 적어도 HMFCA를 운반하는 능력을 상기 세포에 부여하거나 증가시킴.
- 제6항에 있어서,
상기 세포는 미생물 세포이며, 바람직하게 상기 세포는 칸디다(Candida), 한세눌라(Hansenula), 클루이베로미세스(Kluyveromyces), 피치아(Pichia), 사카로미세스(Saccharomyces), 쉬조사카로미세스(Schizosaccharomyces), 야로위아(Yarrowia), 아크레모늄(Acremonium), 아가리커스(Agaricus), 아스퍼질러스(Aspergillus), 아우레오바시듐(Aureobasidium), 미셀리오프토라(Myceliophthora), 크리소스포륨(Chrysosporium), 코프리너스(Coprinus), 크립토코커스(Cryptococcus), 필리바시듐(Filibasidium), 푸사륨(Fusarium), 휴미콜라(Humicola), 마그나포르테(Magnaporthe), 뮤코르(Mucor), 미셀리오프토라(Myceliophthora), 네오칼리마스틱스(Neocallimastix), 뉴로스포라(Neurospora), 파에실로미세스(Paecilomyces), 페니실리움(Penicillium), 피로미세스(Piromyces), 파네로카에테(Panerochaete), 플레우로터스(Pleurotus), 쉬조필룸(Schizophyllum), 탈라로미세스(Talaromyces), 테르모아스커스(Thermoascus), 티엘라비아(Thielavia), 톨리포클라듐(Tolypocladium), 및 트리코더마(Trichoderma)로 구성되는 그룹의 속으로부터 선택되는 효모 또는 사상균류 세포이며, 보다 바람직하게 클루이베로미세스 락티스(Kluyveromyces lactis), S. 세레비지아에(S. cerevisiae), 한세눌라 폴리모르파(Hansenula polymorpha), 야로위아 리포리티카(Yarrowia lipolytica), 피치아 파스토리스(Pichia pastoris), 아스퍼질러스 나이거(Aspergillus niger), 아스퍼질러스 아와모리(Aspergillus awamori), 아스퍼질러스 포에티더스(Aspergillus foetidus), 아스퍼질러스 소자에(Aspergillus sojae), 아스퍼질러스 푸미가터스(Aspergillus fumigatus), 탈라로미세스 에머르소니(Talaromyces emersonii), 아스퍼질러스 오리자에(Aspergillus oryzae), 미셀리오프토라 테르모필라(Myceliophthora thermophila), 트리코더마 리세이(Trichoderma reesei) 및 페니실리움 크리소게넘(Penicillium chrysogenum)으로 구성되는 그룹의 종으로부터 선택되는 효모 또는 사상균류 세포이며; 또는,
바람직하게 상기 세포는 에쉐리키아(Escherichia), 아나바에나(Anabaena), 아에리바실러스(Aeribacillus), 아네우리니바실러스(Aneurinibacillus), 버콜데리아(Burkholderia), 브래디라이조븀(Bradyrhizobium), 카울로박터(Caulobacter), 큐프리아비더스(Cupriavidus), 데설포토마컬럼(Desulfotomaculum), 데설푸리스포라(Desulfurispora), 글루코노박터(Gluconobacter), 로도박터(Rhodobacter), 펠로토마컬럼(Pelotomaculum), 슈도모나스(Pseudomonas), 파라코커스(Paracoccus), 바실러스(Bacillus), 게오바실러스(Geobacillus), 브레비바실러스(Brevibacillus), 브레비박테리움(Brevibacterium), 코리네박테리움(Corynebacterium), 리조븀(시노히조븀)(Rhizobium(Sinorhizobium)), 플라보박테리움(Flavobacterium), 클렙시엘라(Klebsiella), 엔테로박터(Enterobacter), 락토바실러스(Lactobacillus), 락토코커스(Lactococcus), 메틸로박테리움(Methylobacterium), 랄스토니아(Ralstonia), 로도슈도모나스(Rhodopseudomonas), 스타필로코커스(Staphylococcus) 및 스트렙토미세스(Streptomyces)로 구성되는 그룹의 속으로부터 선택되는 박테리아 세포이며, 보다 바람직하게 A. 팔리더스(A. pallidus), A. 테라노벤시스(A. terranovensis), B. 서브틸리스(B. subtilis), B. 아밀로리쿼파시엔스(B. amyloliquefaciens), B. 코아굴란스(B. coagulans), B. 크리벤시스(B. kribbensis), B. 리체니포르미스(B. licheniformis), B. 펀티스(B. puntis), B. 메가테리움(B. megaterium), B. 할로더란스(B. halodurans), B. 퍼밀러스(B. pumilus), B. 테르모러버(B. thermoruber), B. 파나시후미(B. panacihumi), C. 바실렌시스(C. basilensis), D. 쿠즈네트소비(D. kuznetsovii), D. 테르모필라(D. thermophila), G. 카우스토필러스(G. kaustophilus), 글루코노박터 옥시단스(Gluconobacter oxydans), 카울로박터 크레센터스(Caulobacter crescentus) CB 15, 메틸로박테리움 엑스토르퀀스(Methylobacterium extorquens), 로도박터 스파에로이데스(Rhodobacter sphaeroides), 펠로토마컬럼 테르모프로피오니컴(Pelotomaculum thermopropionicum), 슈도모나스 제아산티니파시엔스(Pseudomonas zeaxanthinifaciens), 슈도모나스 퍼티다(Pseudomonas putida), 파라코커스 데니트리프완스(Paracoccus denitrifwans), E. 콜라이(E. coli), C. 글루타미컴(C. glutamicum), 스타필로코커스 카르노서스(Staphylococcus carnosus), 스트렙토미세스 리비단스(Streptomyces lividans), 시노르히조븀 멜리오티(Sinorhizobium melioti) 및 리조븀 래디오박터(Rhizobium radiobacter)로 구성되는 그룹의 종으로부터 선택된 박테리아 세포인, 세포.
- HMFCA 디하이드로게나아제 활성을 갖는 폴리펩티드로서, 상기 폴리펩티드는 SEQ ID NO: 1의 아미노산 서열과 적어도 81.65% 서열 동일성을 갖는 아미노산 서열을 포함하는, 폴리펩티드.
- a) 제8항에 정의된 바와 같은 HMFCA 디하이드로게나아제 활성을 갖는 폴리펩티드를 코딩하는 뉴클레오티드 서열;
b) SEQ ID NO: 12 또는 13에 나타낸 뉴클레오티드 서열;
c) 길이가 10, 15, 20, 30, 50 또는 100 뉴클레오티드인 (a) 또는 (b)에 정의된 바와 같은 뉴클레오티드 서열의 프래그먼트;
d) 유전 암호의 축퇴(degeneracy)에 기인하여 b) 또는 c)의 뉴클레오티드 서열의 서열과 상이한 뉴클레오티드 서열; 및
e) a) 내지 d)에서 정의된 뉴클레오티드 서열의 리버스 컴플리먼트(reverse complement)인 뉴클레오타이드 서열
중 적어도 하나를 포함하는 핵산 분자로서, 여기서 바람직하게 상기 핵산 분자는 벡터인, 핵산 분자.
- 제8항에 정의된 바와 같은 폴리펩티드, 및 제9항에 정의된 바와 같은 핵산 분자 중 적어도 하나를 포함하는 세포로서, 여기서 바람직하게 상기 세포는 배양된 세포인, 세포.
- 적어도 HMFCA를 세포 내로 운반하는 능력을 갖는 폴리펩티드를 코딩하는 뉴클레오티드 서열의 발현을 위한 발현 구조물을 포함하는 세포로서, 상기 폴리펩티드는 SEQ ID NO: 17의 아미노산 서열과 적어도 86.5% 동일성을 갖는 아미노산 서열을 포함하며, 여기서 상기 발현 구조물은 상기 세포에서 발현가능하고, 상기 폴리펩티드의 발현은 상기 발현 구조물이 결여된 이에 상응하는 와일드 타입 세포에 비해, 상기 세포 내에서 적어도 HMFCA를 상기 세포 내로 운반하는 능력을 상기 세포에 부여하거나 증가시키며, 그리고 여기서 상기 세포는 추가로 HMF를 FDCA로 전환시키는 효소를 포함하며, 여기서 HMF를 FDCA로 전환시키는 효소는 바람직하게 a) 및 b) 중 적어도 하나를 포함하는, 세포.
a) HMFCA를 FFA로 산화시키는 알코올 디하이드로게나아제 및 푸라닉 알데히드를 이에 상응하는 푸라닉 카르복실산으로 산화시키는 알데히드 디하이드로게나아제 활성; 및
b) HMF, 2,5-디히드록시메틸 푸란, FDVIFCA, FFA 및 2,5-디포르밀 푸란 중 하나 이상을 FDCA로 산화시키는 산화 환원 효소 및 선택적으로 푸라닉 알데히드를 이에 상응하는 푸라닉 카르복실산으로 산화시키는 알데히드 디하이드로게나아제 활성.
- 제11항에 있어서,
상기 세포는 미생물 세포이며, 바람직하게 상기 세포는 칸디다(Candida), 한세눌라(Hansenula), 클루이베로미세스(Kluyveromyces), 피치아(Pichia), 사카로미세스(Saccharomyces), 쉬조사카로미세스(Schizosaccharomyces), 야로위아(Yarrowia), 아크레모늄(Acremonium), 아가리커스(Agaricus), 아스퍼질러스(Aspergillus), 아우레오바시듐(Aureobasidium), 미셀리오프토라(Myceliophthora), 크리소스포륨(Chrysosporium), 코프리너스(Coprinus), 크립토코커스(Cryptococcus), 필리바시듐(Filibasidium), 푸사륨(Fusarium), 휴미콜라(Humicola), 마그나포르테(Magnaporthe), 뮤코르(Mucor), 미셀리오프토라(Myceliophthora), 네오칼리마스틱스(Neocallimastix), 뉴로스포라(Neurospora), 파에실로미세스(Paecilomyces), 페니실리움(Penicillium), 피로미세스(Piromyces), 파네로카에테(Panerochaete), 플레우로터스(Pleurotus), 쉬조필룸(Schizophyllum), 탈라로미세스(Talaromyces), 테르모아스커스(Thermoascus), 티엘라비아(Thielavia), 톨리포클라듐(Tolypocladium), 및 트리코더마(Trichoderma)로 구성되는 그룹의 속으로부터 선택되는 효모 또는 사상균류 세포이며, 보다 바람직하게 클루이베로미세스 락티스(Kluyveromyces lactis), S. 세레비지아에(S. cerevisiae), 한세눌라 폴리모르파(Hansenula polymorpha), 야로위아 리포리티카(Yarrowia lipolytica), 피치아 파스토리스(Pichia pastoris), 아스퍼질러스 나이거(Aspergillus niger), 아스퍼질러스 아와모리(Aspergillus awamori), 아스퍼질러스 포에티더스(Aspergillus foetidus), 아스퍼질러스 소자에(Aspergillus sojae), 아스퍼질러스 푸미가터스(Aspergillus fumigatus), 탈라로미세스 에머르소니(Talaromyces emersonii), 아스퍼질러스 오리자에(Aspergillus oryzae), 미셀리오프토라 테르모필라(Myceliophthora thermophila), 트리코더마 리세이(Trichoderma reesei) 및 페니실리움 크리소게넘(Penicillium chrysogenum)으로 구성되는 그룹의 종으로부터 선택되는 효모 또는 사상균류 세포이며; 또는,
바람직하게 상기 세포는 에쉐리키아(Escherichia), 아나바에나(Anabaena), 아에리바실러스(Aeribacillus), 아네우리니바실러스(Aneurinibacillus), 버콜데리아(Burkholderia), 브래디라이조븀(Bradyrhizobium), 카울로박터(Caulobacter), 큐프리아비더스(Cupriavidus), 데설포토마컬럼(Desulfotomaculum), 데설푸리스포라(Desulfurispora), 글루코노박터(Gluconobacter), 로도박터(Rhodobacter), 펠로토마컬럼(Pelotomaculum), 슈도모나스(Pseudomonas), 파라코커스(Paracoccus), 바실러스(Bacillus), 게오바실러스(Geobacillus), 브레비바실러스(Brevibacillus), 브레비박테리움(Brevibacterium), 코리네박테리움(Corynebacterium), 리조븀(시노히조븀)(Rhizobium(Sinorhizobium)), 플라보박테리움(Flavobacterium), 클렙시엘라(Klebsiella), 엔테로박터(Enterobacter), 락토바실러스(Lactobacillus), 락토코커스(Lactococcus), 메틸로박테리움(Methylobacterium), 랄스토니아(Ralstonia), 로도슈도모나스(Rhodopseudomonas), 스타필로코커스(Staphylococcus) 및 스트렙토미세스(Streptomyces)로 구성되는 그룹의 속으로부터 선택되는 박테리아 세포이며, 보다 바람직하게 A. 팔리더스(A. pallidus), A. 테라노벤시스(A. terranovensis), B. 서브틸리스(B. subtilis), B. 아밀로리쿼파시엔스(B. amyloliquefaciens), B. 코아굴란스(B. coagulans), B. 크리벤시스(B. kribbensis), B. 리체니포르미스(B. licheniformis), B. 펀티스(B. puntis), B. 메가테리움(B. megaterium), B. 할로더란스(B. halodurans), B. 퍼밀러스(B. pumilus), B. 테르모러버(B. thermoruber), B. 파나시후미(B. panacihumi), C. 바실렌시스(C. basilensis), D. 쿠즈네트소비(D. kuznetsovii), D. 테르모필라(D. thermophila), G. 카우스토필러스(G. kaustophilus), 글루코노박터 옥시단스(Gluconobacter oxydans), 카울로박터 크레센터스(Caulobacter crescentus) CB 15, 메틸로박테리움 엑스토르퀀스(Methylobacterium extorquens), 로도박터 스파에로이데스(Rhodobacter sphaeroides), 펠로토마컬럼 테르모프로피오니컴(Pelotomaculum thermopropionicum), 슈도모나스 제아산티니파시엔스(Pseudomonas zeaxanthinifaciens), 슈도모나스 퍼티다(Pseudomonas putida), 파라코커스 데니트리프완스(Paracoccus denitrifwans), E. 콜라이(E. coli), C. 글루타미컴(C. glutamicum), 스타필로코커스 카르노서스(Staphylococcus carnosus), 스트렙토미세스 리비단스(Streptomyces lividans), 시노르히조븀 멜리오티(Sinorhizobium melioti) 및 리조븀 래디오박터(Rhizobium radiobacter)로 구성되는 그룹의 종으로부터 선택된 박테리아 세포인, 세포.
- 적어도 HMFCA를 세포 내로 운반하는 능력을 갖는 폴리펩티드로서, 상기 폴리펩티드는 SEQ ID NO: 17의 아미노산 서열과 적어도 86.5% 서열 동일성을 갖는 아미노산 서열을 포함하는, 폴리펩티드.
- a) 제13항에 정의된 바와 같은, 적어도 HMFCA를 세포 내로 운반하는 능력을 갖는 폴리펩티드를 코딩하는 뉴클레오티드 서열;
b) SEQ ID NO: 18에 나타낸 뉴클레오티드 서열;
c) 길이가 10, 15, 20, 30, 50 또는 100 뉴클레오티드인 (a) 또는 (b)에 정의된 바와 같은 뉴클레오티드 서열의 프래그먼트;
d) 유전 암호의 축퇴(degeneracy)에 기인하여 b) 또는 c)의 뉴클레오티드 서열의 서열과 상이한 뉴클레오티드 서열; 및
e) a) 내지 d)에서 정의된 뉴클레오티드 서열의 리버스 컴플리먼트(reverse complement)인 뉴클레오타이드 서열
중 적어도 하나를 포함하는 핵산 분자로서, 여기서 바람직하게 상기 핵산 분자는 벡터인, 핵산 분자.
- 제13항에 정의된 바와 같은 폴리펩티드, 및 제14항에 정의된 바와 같은 핵산 분자 중 적어도 하나를 포함하는 세포로서, 여기서 바람직하게 상기 세포는 배양된 세포인, 세포.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP15155401.1 | 2015-02-17 | ||
EP15155401 | 2015-02-17 | ||
PCT/NL2016/050108 WO2016133384A1 (en) | 2015-02-17 | 2016-02-17 | Dehydrogenase-catalysed production of fdca |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20170116051A true KR20170116051A (ko) | 2017-10-18 |
Family
ID=52469748
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020177022848A KR20170116051A (ko) | 2015-02-17 | 2016-02-17 | Fdca의 디하이드로게나아제-촉매화 생산 |
Country Status (13)
Country | Link |
---|---|
US (1) | US10457965B2 (ko) |
EP (1) | EP3259349B1 (ko) |
JP (2) | JP2018504904A (ko) |
KR (1) | KR20170116051A (ko) |
CN (1) | CN107250368A (ko) |
AU (1) | AU2016220612B2 (ko) |
BR (1) | BR112017017525A2 (ko) |
CA (1) | CA2975226A1 (ko) |
DK (1) | DK3259349T3 (ko) |
ES (1) | ES2817001T3 (ko) |
MX (1) | MX2017010459A (ko) |
TW (1) | TWI727941B (ko) |
WO (1) | WO2016133384A1 (ko) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11034979B2 (en) * | 2015-09-21 | 2021-06-15 | Purac Biochem B.V. | Fungal production of FDCA |
CA3010631A1 (en) | 2016-01-13 | 2017-07-20 | Stora Enso Oyj | Processes for the preparation of 2,5-furandicarboxylic acid and intermediates and derivatives thereof |
EP3378931A1 (en) * | 2017-03-21 | 2018-09-26 | Purac Biochem B.V. | Fdca-decarboxylating monooxygenase-deficient host cells for producing fdca |
CN108977472B (zh) * | 2017-06-02 | 2021-06-29 | 中国科学院大连化学物理研究所 | 一种串联酶法制备2,5-呋喃二甲酸的方法 |
EP3652161A1 (en) | 2017-07-12 | 2020-05-20 | Stora Enso Oyj | Purified 2,5-furandicarboxylic acid pathway products |
CN109234245B (zh) * | 2018-09-21 | 2022-04-22 | 南京农业大学 | 一种吲哚乙醛脱氢酶基因ald2及其过表达和应用 |
CN109536466B (zh) * | 2018-11-19 | 2022-04-22 | 华南理工大学 | 醛脱氢酶及其基因、重组菌构建及其在呋喃羧酸合成中的应用 |
CA3132051A1 (en) | 2019-03-01 | 2020-09-10 | Braskem S.A. | Method for the in vivo synthesis of 4-hydroxymethylfurfural and derivatives thereof |
CN109750015B (zh) * | 2019-03-27 | 2023-05-23 | 云南师范大学 | 一种热稳性提高的木聚糖酶突变体及其应用 |
CN110272402B (zh) * | 2019-07-15 | 2021-02-26 | 南京林业大学 | 一种化学反应和生物反应耦合生产2,5-呋喃二甲酸的方法 |
CN110408659B (zh) * | 2019-08-20 | 2023-08-22 | 华南理工大学 | 一种可控合成呋喃羧酸的方法 |
CN110591995A (zh) * | 2019-09-12 | 2019-12-20 | 华南理工大学 | 一种共表达重组菌及其在合成呋喃羧酸中的应用 |
CN110819565B (zh) * | 2019-11-20 | 2021-04-13 | 青岛农业大学 | 一株具有抑制植物病原菌作用的耐盐芽孢杆菌bw9及其应用 |
CN110724654B (zh) * | 2019-11-22 | 2020-09-29 | 南京科技职业学院 | 一株生产5-羟甲基-2呋喃甲酸的铜绿假单胞菌及其应用 |
CN113956537B (zh) * | 2020-07-21 | 2023-04-18 | 中国科学院宁波材料技术与工程研究所 | 增塑剂及其制备方法 |
CN116024184B (zh) * | 2022-07-26 | 2024-03-15 | 南京科技职业学院 | 醛脱氢酶突变体及其在制备5-羟甲基-2-呋喃甲酸中的应用 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2194140A2 (en) * | 2005-03-02 | 2010-06-09 | Metanomics GmbH | Process for the production of fine chemicals |
ES2744466T3 (es) * | 2009-09-02 | 2020-02-25 | Purac Biochem Bv | Polipéptidos con actividad oxidorreductasa y sus usos |
CN101899145B (zh) * | 2010-07-28 | 2012-07-11 | 江南大学 | 一种2,5-呋喃二甲酸基聚酯的制备方法 |
NL2006359C2 (en) | 2011-03-08 | 2012-04-24 | Bird Engineering B V | Genetically modified cell and process for use of said cell. |
US11034979B2 (en) * | 2015-09-21 | 2021-06-15 | Purac Biochem B.V. | Fungal production of FDCA |
-
2016
- 2016-02-17 TW TW105104651A patent/TWI727941B/zh not_active IP Right Cessation
- 2016-02-17 ES ES16715126T patent/ES2817001T3/es active Active
- 2016-02-17 JP JP2017538354A patent/JP2018504904A/ja not_active Ceased
- 2016-02-17 CN CN201680010802.8A patent/CN107250368A/zh active Pending
- 2016-02-17 BR BR112017017525A patent/BR112017017525A2/pt not_active IP Right Cessation
- 2016-02-17 US US15/550,438 patent/US10457965B2/en not_active Expired - Fee Related
- 2016-02-17 DK DK16715126.5T patent/DK3259349T3/da active
- 2016-02-17 AU AU2016220612A patent/AU2016220612B2/en not_active Ceased
- 2016-02-17 EP EP16715126.5A patent/EP3259349B1/en active Active
- 2016-02-17 WO PCT/NL2016/050108 patent/WO2016133384A1/en active Application Filing
- 2016-02-17 MX MX2017010459A patent/MX2017010459A/es unknown
- 2016-02-17 KR KR1020177022848A patent/KR20170116051A/ko unknown
- 2016-02-17 CA CA2975226A patent/CA2975226A1/en not_active Abandoned
-
2021
- 2021-03-03 JP JP2021033821A patent/JP2021101708A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
WO2016133384A1 (en) | 2016-08-25 |
AU2016220612A1 (en) | 2017-08-17 |
EP3259349B1 (en) | 2020-06-17 |
DK3259349T3 (da) | 2020-08-10 |
JP2018504904A (ja) | 2018-02-22 |
BR112017017525A2 (pt) | 2018-04-17 |
AU2016220612B2 (en) | 2021-09-30 |
US10457965B2 (en) | 2019-10-29 |
JP2021101708A (ja) | 2021-07-15 |
MX2017010459A (es) | 2018-04-24 |
CN107250368A (zh) | 2017-10-13 |
EP3259349A1 (en) | 2017-12-27 |
ES2817001T3 (es) | 2021-04-06 |
TWI727941B (zh) | 2021-05-21 |
US20180030488A1 (en) | 2018-02-01 |
CA2975226A1 (en) | 2016-08-25 |
TW201638336A (zh) | 2016-11-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3259349B1 (en) | Dehydrogenase-catalysed production of fdca | |
JP6372889B2 (ja) | オキシドレダクターゼ活性を有するポリペプチドおよびその使用 | |
US11034979B2 (en) | Fungal production of FDCA | |
EP3378931A1 (en) | Fdca-decarboxylating monooxygenase-deficient host cells for producing fdca | |
US20140193885A1 (en) | Production of itaconic acid |