KR20140015439A

KR20140015439A - 유전자 변형 세포 및 이 세포의 사용 방법

Info

Publication number: KR20140015439A
Application number: KR1020137026204A
Authority: KR
Inventors: 닉 요하네스 페트러스 위르크스; 슈우르만 톰 다니엘 엘린크; 십코 마아르텐 쿠이이퍼; 하랄드 요한 루이이센아아르스
Original assignee: 푸락 바이오켐 비.브이.
Priority date: 2011-03-08
Filing date: 2012-03-07
Publication date: 2014-02-06
Also published as: US20140073019A1; SI2683815T1; EP2683815A2; HUE027066T2; BR112013022915B1; US9828616B2; NL2006359C2; DK2683815T3; KR101947202B1; JP2014508531A; CN103502441B; US20180023105A1; JP2017060471A; WO2012064195A3; CA2829078C; PT2683815E; JP6327724B2; WO2012064195A2; EA023764B1; MY161455A

Abstract

본 발명은 푸란 화합물의 생물전환 분야에 관한 것이다. 보다 특히, 본 발명은 푸란 화합물의 생체촉매적 형질전환에 개선된 특징을 갖는 새로운 유전자 변형 세포 및 숙주 세포의 유전자 변형에 적합한 벡터에 관한 것이다. 본 발명의 다른 양태는 본 발명에 따른 세포의 사용에 의한 5-(하이드록시메틸)푸란-2-카복실산(HMF-산) 및 이의 전구체의 생물전환 방법을 목적으로 한다.

Description

유전자 변형 세포 및 이 세포의 사용 방법{GENETICALLY MODIFIED CELL AND PROCESS FOR USE OF SAID CELL}

본 발명은 일반적으로 푸란 화합물의 생물전환(biotransformation) 분야에 관한 것이다. 상기 생물전환은 푸란-2,5-다이카복실산(FDCA)의 제조 및 리그노셀룰로스 함유 물질의 가공에서, 예를 들면, 생물연료 및 생화학물질의 제조에 유용성을 갖는다. 보다 특히, 본 발명은 푸란 화합물의 생체촉매적 형질전환에 개선된 특성을 갖는 신규 유전자 변형 세포에 관한 것이다. 본 발명의 다른 양태는 푸란 화합물의 생물전환을 위해 그 특성을 개선하기 위한 숙주 세포의 유전자 변형에 적합한 벡터에 관한 것이다. 본 발명의 다른 양태는 본 발명에 따른 세포의 사용에 의한 5-(하이드록시메틸)푸란-2-카복실산(HMF-산) 및 이의 전구체의 생물전환 방법에 관한 것이다.

푸란 화합물의 생물전환에 관심이 증가하고 있다. 이것은 바이오매스(biomass)로부터의 유망한 부가 가치 화학물질인 푸란-2,5-다이카복실산(FDCA)의 바이오생산(bioproduction)(문헌[Werpy et al., Top Value-Added Chemicals from Biomass, Volume I - Results of screening for portential Candidates from Sugars and Synthesis gas (2004)]), 및 리그노셀룰로스 함유 물질로부터 생물연료 및 생화학물질의 발효 생산(문헌[Almeida et al., Metabolic effects of furaldehydes and impacts on biotechnological processes. Applied Microbiology and Biotechnology, 82(4):625-638 (2009)]) 둘 다에 대해 그러하다.

최근에 푸란 화합물 이용 유기체인 큐프리아비더스 바실렌시스( Cupriavidus basilensis) HMF14가 단리되었다(문헌[Koopman et al., Identification and characterization of the furfural and 5-(hydroxymethyl)furfural degradation pathways of Cupriavidus basilensis HMF14, PNAS, Vol. 107, p.4919-4924 (2010a)]). 상기 유기체는 푸르푸랄 및 5-(하이드록시메틸)푸란-2-카브알데하이드(HMF)를 대사시킬 수 있다. 큐프리아비더스 바실렌시스 HMF14의 푸르푸랄 및 HMF 분해 경로는 수반되는 유전자와 함께 문헌[Koopman et al., Identification and characterization of the furfural and 5-(hydroxymethyl)furfural degradation pathways of Cupriavidus basilensis HMF14, PNAS, Vol. 107, p.4919-4924 (2010a)]에 개시되었다.

슈도모나스 푸티다 ( Pseudomonas putida) S12에서 큐프리아비더스 바실렌시스 HMF14로부터의 hmfH 유전자의 기능적 도입이 문헌[Koopman et al., Efficient whole-cell biotransformation of 5-(hydroxymethyl)furfural into FDCA, 2,5-furandicarboxylic acid. Bioresour. Technol., Vol. 101, p.6291-6296 (2010b)]에 개시되어 있다. 생성된 균주는 기질로서 HMF를 사용하여 우수한 FDCA 생성 능력을 갖는다. 그러나, 관찰된 5-(하이드록시메틸)푸란-2-카복실산(HMF-산) 축적은 긴 처리 시간 또는 상기 부산물을 제거하기 위한 대체 수단을 필요로 한다. FDCA가 생성될 수 있고 때때로 필수적인 많은 용도에 HMF-산 부산물의 충분한 제거가 바람직하다.

HMF-산 축적 문제의 해결책을 찾던 중에, 본 발명의 발명자들은 본 발명에 이르러 놀랍게도 슈도모나스 푸티다 S12 FDCA 생산 시스템에서 특정 폴리펩티드의 발현이 HMF-산 축적을 효과적으로 감소시키는 것을 밝혀내었다.

본 발명자들의 상기 발견은 5-(하이드록시메틸)푸란-2-카복실산(HMF-산)을 전환시킬 수 있는 하나 이상의 폴리펩티드와 함께 서열번호 1 또는 2의 아미노산 서열 또는 이의 유사체/동족체(예를 들면, 서열번호 3 또는 4)를 갖는 폴리펩티드의 숙주에서의 발현이 효과적인 HMF-산 생체전환(bioconversion)을 야기한다는 일반적인 개념을 제공하였다. 개선된 HMF-산 생체전환은, 예를 들면, 생물연료의 생산을 위한 에탄올생산성(ethanologenic) 발효 또는 화학물질의 생물학적 생산을 위한 발효를 위한 공급원료와 같이, 푸란 화합물이 해로운 것으로 간주되는 공급원료로부터 HMF-산 및 이의 푸란 전구체의 제거에 유리하다. 다른 용도에서, 개선된 HMF-산 생체전환은, FDCA 바이오생산에서와 같이 HMF-산이 출발 물질 또는 중간체인 화학물질의 바이오생산을 개선할 것이다.

따라서, 본 발명의 첫 번째 목적은 서열번호 1, 2, 3 또는 4의 아미노산 서열 또는 이의 유사체/동족체를 갖는 제 1 폴리펩티드를 암호화하는 제 1 폴리뉴클레오티드, 및 HMF-산 전환 활성을 갖는 제 2 폴리펩티드를 암호화하는 제 2 폴리뉴클레오티드 서열을 포함하는 유전자 변형 세포이다. HMF-산 전환 폴리펩티드는 전술한 큐프리아비더스 바실렌시스 HMF14 hmfH 유전자(문헌[Koopman et al., Identification and characterization of the furfural and 5-(hydroxymethyl)furfural degradation pathways of Cupriavidus basilensis HMF14, PNAS, Vol. 107, p.4919-4924 (2010a)])에 의해 암호화된 옥시도리덕타제일 수 있다. 특정 태양에 따르면, 상기 유전자 변형 세포는 서열번호 19, 20, 21, 22, 23, 24, 25의 아미노산 서열 또는 이의 유사체/동족체를 갖는 제 3 폴리펩티드를 암호화하는 제 3 폴리뉴클레오티드 서열을 포함하는 것이 바람직하다. 제 3 아미노산 서열의 기능적 발현은 푸란 알데하이드를 전환시킬 수 있는 알데하이드 데하이드로게나제 활성을 제공한다.

제 2 폴리펩티드가 옥시도리덕타제인 경우, 옥시도리덕타제와 동시에 제 1 폴리펩티드의 동시-발현은 또한 생체촉매적 FDCA 생산에 대해 옥시도리덕타제를 포함하는 전세포(whole-cell) 생체촉매의 질을 개선시킬 수 있다.

본 발명에 따른 세포는 적어도 제 1 폴리뉴클레오티드 서열의 기능적 도입에 의해 유전자 변형된다. 바람직하게, 상기 세포는 제 1 및 제 2 폴리뉴클레오티드 서열 둘 다의 기능적 도입에 의해 유전자 변형된다. 또는, 상기 세포는 제 1 및 제 3 폴리뉴클레오티드 서열의 기능적 도입에 의해 유전자 변형된다. 제 1, 제 2 및 제 3 폴리뉴클레오티드 3개 모두의 기능적 도입이 또 다른 대안이다.

본 발명의 다른 양태는 숙주 세포의 유전자 변형에 적합한 벡터에 관한 것이다. 상기 벡터는 서열번호 1, 2, 3 또는 4의 아미노산 서열 또는 이의 유사체/동족체를 갖는 제 1 폴리펩티드를 암호화하는 제 1 폴리뉴클레오티드 서열, 및 5-(하이드록시메틸)푸란-2-카복실산(HMF-산) 전환 활성을 갖는 제 2 폴리펩티드를 암호화하는 제 2 폴리뉴클레오티드 서열을 포함한다. 선택적으로, 상기 벡터는 서열번호 19, 20, 21, 22, 23, 24, 25의 아미노산 서열 또는 이의 유사체/동족체를 갖는 제 3 폴리펩티드를 암호화하는 제 3 폴리뉴클레오티드 서열을 포함할 수 있다. 상기 벡터는 본 발명에 따른 유전자 변형 세포를 수득하기에 적합하다.

본 발명의 다른 양태는 5-(하이드록시메틸)푸란-2-카복실산(HMF-산) 전환 방법에 관한 것이다. 상기 방법은 본 발명에 따른 세포를 사용한다. 바람직한 태양에 따르면, 상기 방법은 FDCA의 제조에 적합하다.

본 발명의 또 다른 양태는 푸란 전구체의 FDCA로의 생물전환을 위한, 본 발명에 따른 유전자 변형 세포의 용도를 목적으로 한다.

도 1은 푸란 화합물의 2,5-푸란 다이카복실산으로의 산화 반응을 도식적으로 나타낸 것이다. 다음의 푸란 화합물들이 제공되어 있다: 1, HMF-알콜; 2, HMF; 3, HMF-산; 4, FFA; 5, FDCA.
도 2는 슈도모나스 푸티다 S12_2642(도 2a) 및 B38(도 2b)의 HMF-공급 배양물중 PDCA 생성 및 HMF-산 축적을 나타낸 것이다(◆, FDCA(mM); ■, HMF-산(mM); ○, 세포 건조 중량(CDW; g/l); 점선: HMF 공급률(ml 4M 용액/h)).
도 3은 도 2에 나타낸 유가식(fed-batch) 공정 동안 다양한 시점에서 FDCA 비생산성(specific productivity)을 나타낸 것이다(진한색: 슈도모나스 푸티다 S12_2642; 밝은색: 슈도모나스 푸티다 SZ12_B38).
도 4는 슈도모나스 푸티다 S12_B38(도 4a) 및 B51(도 4b)을 사용한 진탕-플라스크 실험에서 FDCA 생성 및 HMF-산 축적을 나타낸 것이다(▲, HMF(mM); ◆, FDCA(mM); ■, HMF-산(mM); ○, 세포 건조 중량(CDW; g/l)).
도 5는 높은 세포 밀도에서 출발하여 슈도모나스 푸티다 S12_B38의 HMF-공급 고밀도 세포 배양물중 FDCA 생성 및 HMF-산 축적을 나타낸 것이다(□, HMF; ◆, FDCA(mM); ■, HMF-산(mM); ○, 세포 건조 중량(CDW; g/l); 점선: HMF 공급률(ml 4M 용액/h)).
도 6은 슈도모나스 푸티다 S12_B38(동시-발현된 HmfH 및 HmfT1; A); S12_B97(동시-발현된 HmfH, HmfT1 및 알데하이드 데하이드로게나제; B) 및 S12_B101(동시-발현된 HmfH 및 알데하이드 데하이드로게나제; C)의 HMF 함유 진탕-플라스크 배양물중 FDCA, FFA 및 HMF-산의 축적을 나타낸 것이다(▲, HMF(mM); ◆, FDCA(mM); ■, HMF-산(mM); ●, FFA(mM0; ○, 세포 건조 중량(CDW; g/l)).
서열 설명
서열번호 1은 큐프리아비더스 바실렌시스 HMF14로부터의 HmfT1의 아미노산 서열을 나타낸 것이다. 상기 서열은 진뱅크(GenBank) 등록번호 ADE20411.1을 갖는다.
서열번호 2는 큐프리아비더스 바실렌시스 HMF14로부터의 HmfT2의 아미노산 서열을 나타낸 것이다. 상기 서열은 진뱅크 등록번호 ADE20404.1을 갖는다.
서열번호 3은 메틸로박테리움 라디오톨레란스( Methylobacterium radiotolerans) JCM 2831(= ATCC 27329 = DSM 1819)로부터의 유전자좌 표지 mrad2831_4728을 갖는 유전자로부터의 단백질 산물의 아미노산 서열을 나타낸 것이다. 상기 서열은 진뱅크 등록번호 ACB26689.1을 갖는다.
서열번호 4는 설폴로부스 아시도칼다리우스 ( Sulfolobus acidocaldarius) DSM 639로부터의 saci_2058 유전자로부터의 단백질 산물의 아미노산 서열을 나타낸 것이다. 상기 서열은 진뱅크 등록번호 AAY81352.1을 갖는다.
서열번호 5는 큐프리아비더스 바실렌시스 HMF14로부터의 HmfH의 아미노산 서열을 나타낸 것이다. 상기 서열은 진뱅크 등록번호 ADE20408.1을 갖는다.
서열번호 6은 브래디리조븀 자포니쿰 ( Bradyrhizobium japonicum) USDA 110으로부터의 blr0367 유전자로부터의 단백질 산물의 아미노산 서열을 나타낸 것이다. 상기 서열은 진뱅크 등록번호 BAC45632.1을 갖는다.
서열번호 7은 큐프리아비더스 바실렌시스 HMF14로부터의 hmfT1의 암호화 서열을 나타낸 것이다.
서열번호 8은 큐프리아비더스 바실렌시스 HMF14로부터의 hmfT2의 암호화 서열을 나타낸 것이다.
서열번호 9는 메틸로박테리움 라디오톨레란스 JCM 2831(= ATCC 27329 = DSM 1819)로부터의 유전자좌 표지 mrad2831 _4728을 갖는 유전자의 암호화 서열을 나타낸 것이다.
서열번호 10은 설폴로부스 아시도칼다리우스 DSM 639로부터의 saci_2058 유전자의 암호화 서열을 나타낸 것이다.
서열번호 11은 큐프리아비더스 바실렌시스 HMF14로부터의 hmfH의 암호화 서열을 나타낸 것이다.
서열번호 12는 브래디리조븀 자포니쿰 USDA 110으로부터의 blr0367 유전자의 암호화 서열을 나타낸 것이다.
서열번호 13 내지 18은 다양한 합성 프라이머들의 서열을 나타낸 것이다. 제한효소 위치(밑줄), 출발 및 정지 (역 상보성) 코돈(이탤릭체) 및 추정상의 리보솜 결합 부위(소문자)가 표시되어 있다. FN23 프라이머는 hmfH의 출발 코돈 바로 상위에 설계되었다.
서열번호 13은 합성 DNA 프라이머 hmfT1(f)의 뉴클레오티드 서열을 나타낸 것이다: 5'-ACGAATTCAAaggagACAACAATGGAAG-3'.
서열번호 14는 합성 DNA 프라이머 hmfT1(r)의 뉴클레오티드 서열을 나타낸 것이다: 5'-AAGCTAGCTGAGCAGTCACCCTCACTC-3'.
서열번호 15는 합성 DNA 프라이머 FN23의 뉴클레오티드 서열을 나타낸 것이다: 5'-CGGAATTCCACATGACAagggagACCG-3'.
서열번호 16은 합성 DNA 프라이머 FN24의 뉴클레오티드 서열을 나타낸 것이다: 5'-CGGAATTCGCTTCGGTCTTCAACTCGGATG-3'.
서열번호 17은 합성 DNA 프라이머 mrad(f)의 뉴클레오티드 서열을 나타낸 것이다: 5'-ACGAATTCggaggAAATCTATGCAGACC-3'.
서열번호 18은 합성 DNA 프라이머 mrad(r)의 뉴클레오티드 서열을 나타낸 것이다: 5'-AAGCTAGCGCAGAACCGTATCGTCAG-3'.
서열번호 19는 큐프리아비더스 바실렌시스 HMF14로부터의 알데하이드 데하이드로게나제 Adh의 아미노산 서열을 나타낸 것이다.
서열번호 20은 진뱅크 등록번호 YP_003609156.1을 갖는 아미노산 서열을 나타낸 것이다.
서열번호 21은 진뱅크 등록번호 ZP_02881577.1을 갖는 아미노산 서열을 나타낸 것이다.
서열번호 22는 진뱅크 등록번호 YP_003451184.1을 갖는 아미노산 서열을 나타낸 것이다.
서열번호 23은 진뱅크 등록번호 ACA09737.1을 갖는 아미노산 서열을 나타낸 것이다.
서열번호 24는 진뱅크 등록번호 YP_530742.1을 갖는 아미노산 서열을 나타낸 것이다.
서열번호 25는 진뱅크 등록번호 YP_001541929.1을 갖는 아미노산 서열을 나타낸 것이다.
서열번호 26은 큐프리아비더스 바실렌시스 HMF14로부터의 알데하이드 데하이드로게나제 Adh를 암호화하는 adh의 폴리뉴클레오티드 서열을 나타낸 것이다.
서열번호 27은 진뱅크 등록번호 YP_003609156.1을 갖는 아미노산 서열을 암호화하는 폴리뉴클레오티드 서열을 나타낸 것이다.
서열번호 28은 진뱅크 등록번호 ZP_02881577.1을 갖는 아미노산 서열을 암호화하는 폴리뉴클레오티드 서열을 나타낸 것이다.
서열번호 29는 진뱅크 등록번호 YP_003451184.1을 갖는 아미노산 서열을 암호화하는 폴리뉴클레오티드 서열을 나타낸 것이다.
서열번호 30은 진뱅크 등록번호 ACA09737.1을 갖는 아미노산 서열을 암호화하는 폴리뉴클레오티드 서열을 나타낸 것이다.
서열번호 31은 진뱅크 등록번호 YP_530742.1을 갖는 아미노산 서열을 암호화하는 폴리뉴클레오티드 서열을 나타낸 것이다.
서열번호 32는 진뱅크 등록번호 YP_001541929.1을 갖는 아미노산 서열을 암호화하는 폴리뉴클레오티드 서열을 나타낸 것이다.
서열번호 33은 합성 DNA 프라이머 FN13의 뉴클레오티드 서열을 나타낸 것이다: 5'-ATGCGGCCGCAACAaggagAAGATGGAATGAACG-3'(밑줄친 서열: NotI 제한효소 부위; 이탤릭체는 알데하이드 데하이드로게나제 암호화 유전자의 출발 코돈(ATG); 소문자는 추정상의 리보솜 결합 부위(RBS)).
서열번호 34는 합성 DNA 프라이머 FN14의 뉴클레오티드 서열을 나타낸 것이다: 5'-ATGCGGCCGCGCGTCGGGGTCGGTGCTA-3'(밑줄친 서열: NotI 제한효소 부위; 이탤릭체는 정지 코돈(역 상보성 가닥)).

일반적 정의

본 명세서 및 첨부된 특허청구범위 전체에 걸쳐서, 단어 "이루어지다" 및 "포함하다" 및 "이루어지는" 및 "포함하는"과 같은 변형은 포괄적으로 이해해야 한다. 즉, 상기 단어들은 문맥이 허용하는 경우 특별히 열거되지 않은 다른 요소 또는 정수의 가능한 포함을 시사하는 것이다.

단수 형태는 본원에서 하나 또는 하나보다 많은(즉, 하나 또는 하나 이상) 문법적 대상을 지칭하기 위해 사용된다. 예로서, "요소"는 하나의 요소 또는 하나보다 많은 요소를 의미할 수 있다.

용어 "다수의"는 하나 이상의 의미를 갖는 것으로 이해되어야 한다.

푸란 화합물은 본원에서 푸란 고리를 갖는 임의의 화합물인 것으로 이해된다. 바람직하게, 푸란 화합물은 2,5-푸란-다이카복실산으로 산화될 수 있는 화합물이다. 본 발명의 맥락에서 적절한 푸란 화합물로는 [5-(하이드록시메틸)푸란-2-일]메탄올("HMF-알콜"), 5-(하이드록시메틸)푸란-2-카브알데하이드("HMF"), 5-(하이드록시메틸)푸란-2-카복실산("HMF-산"), 5-포밀푸란-2-카복실산("FFA"), 푸란-2,5-다이카브알데하이드(DFF) 및 푸란-2,5-다이카복실산("FDCA")이 포함된다. 푸란 고리 또는 임의의 이의 치환가능한 측쇄 기는 푸란 고리중 임의의 이용가능한 위치 상에서, 예를 들면, 환상 기를 포함하여, OH, C1-C10 알킬, 알킬, 알릴, 아릴 또는 RO- 에터 잔기로 치환될 수 있다. 다수의 적절한 푸란 화합물의 화학적 구조를 하기에 나타낸다.

용어 "폴리뉴클레오티드"는 폴리 데옥시리보핵산(DNA) 및 폴리 리보핵산(RNA)을 포함하며, 상기 용어는 DNA 또는 RNA를 말할 수 있다. 숙련된 자라면 DNA 및 RNA 분자의 안정성에서의 차이를 인지할 것이다. 따라서, 숙련된 자라면 용어 "폴리뉴클레오티드"의 사용 맥락으로부터 어떤 형태의 폴리뉴클레오티드(DNA 및/또는 RNA)가 적합한 지를 이해할 수 있을 것이다.

본원에서 사용된 바와 같은 용어 서열 "유사성"은 개개 폴리뉴클레오티드 또는 단백질 서열이 유사한 정도를 말한다. 두 서열간 유사성의 정도는 보존적 변화의 정도와 함께 동일성 정도를 기초로 한다. "서열 유사성"의 퍼센트는 동일하거나 보존적으로 변화된 아미노산 또는 뉴클레오티드의 퍼센트이다, 즉 "서열 유사성" = (% 서열 동일성) + (% 보존적 변화)이다.

본 발명에 있어서, "보존적 변화" 및 "동일성"은 보다 광범위한 용어 "유사성"의 종류인 것으로 간주된다. 따라서, 용어 서열 "유사성"이 사용되는 경우, 상기 용어는 서열 "동일성" 및 "보존적 변화"를 포함한다.

용어 "서열 동일성"은 숙련된 자에게 공지되어 있다. 2개의 아미노산 서열에 의해 또는 2개의 핵산 서열에 의해 공유된 서열 동일성의 정도를 측정하기 위해, 서열들은 최적의 비교 목적으로 정렬된다(예를 들면, 제 2 아미노산 또는 핵산 서열과의 최적 정렬을 위해 제 1 아미노산 또는 핵산 서열의 서열내에 갭(gap)이 도입될 수 있다). 상기 정렬은 비교되는 서열들의 전장(full length)에 걸쳐 수행될 수 있다. 또는, 정렬은 더 짧은 비교 길이에 걸쳐, 예를 들면, 약 20, 약 50, 약 100개 이상의 핵산/염기 또는 아미노산에 걸쳐 수행될 수 있다.

이어서, 상응하는 아미노산 위치 또는 뉴클레오티드 위치에서 아미노산 잔기 또는 뉴클레오티드를 비교한다. 제 1 서열에서의 위치에 제 2 서열내 상응하는 위치와 동일한 아미노산 잔기 또는 뉴클레오티드가 존재하는 경우, 분자는 그 위치에서 동일하다. 서열들 사이에 공유된 동일성의 정도는 전형적으로 두 서열들 사이의 동일성 퍼센트의 용어로 표현되며, 서열내 동일 잔기들에 의해 공유된 동일 위치의 수의 함수이다(즉, % 동일성 = 상응하는 위치에서 동일 잔기들의 수/위치의 총수 x 100). 바람직하게, 비교되는 두 서열은 동일하거나 실질적으로 동일한 길이를 갖는다.

"보존적 변화"의 퍼센트는 서열 동일성의 퍼센트와 유사하게 측정될 수 있다. 그러나, 이 경우, 원래 잔기의 기능적 성질을 보존하는 경향이 있는 아미노산 또는 뉴클레오티드 서열의 특정 위치에서의 변화는 변화가 일어나지 않은 경우와 같이 기록된다.

아미노산 서열의 경우, 적절한 기능적 성질은 아미노산의 물리화학적 성질이다. 본 발명의 폴리펩티드중 아미노산에 대한 보존적 치환은 아미노산이 속한 부류의 다른 구성원들로부터 선택될 수 있다. 예를 들면, 특정 크기 또는 특성(예를 들면, 전하, 소수성 및 친수성)을 갖는 아미노산의 집단에 속하는 아미노산이, 특히 생물학적 활성과 직접 관련되지 않는 단백질의 영역들에서, 단백질의 활성을 변화시키지 않고 또 다른 아미노산 대신 치환될 수 있다. 예를 들면, 비극성(소수성) 아미노산으로는 알라닌, 류신, 이소류신, 발린, 프롤린, 페닐알라닌, 트립토판 및 티로신이 포함된다. 극성 중성 아미노산으로는 글리신, 세린, 트레오닌, 시스테인, 티로신, 아스파라긴 및 글루타민이 포함된다. 양으로 하전된 (염기성) 아미노산으로는 아르기닌, 라이신 및 히스티딘이 포함된다. 음으로 하전된 (산성) 아미노산으로는 아스파트산 및 글루탐산이 포함된다. 보존적 치환으로는, 예를 들면, Arg 대신 Lys 및 양전하를 유지하기 위한 그 반대경우; Asp 대신 Glu 및 음전하를 유지하기 위한 그 반대경우; 유리 -OH가 유지되도록 하기 위한 Thr 대신 Ser; 및 유리 -NH₂를 유지하기 위한 Asn 대신 Gln이 포함된다.

뉴클레오티드 서열의 경우, 적절한 기능적 성질은 주로 특정 뉴클레오티드가 전사 및/또는 번역 기구에 관한 서열의 개방 판독 프레임(open reading frame) 내에 보유하는 생물학적 정보이다. 유전자 코드가 축중(degeneracy)(또는 중복(redundancy))을 가지며 다중 코돈이 그들이 암호화하는 아미노산에 관해 동일한 정보를 가질 수 있다는 것은 일반적인 지식이다. 예를 들면, 특정 종에서, 아미노산 류신은 UUA, UUG, CUU, CUC, CUA, CUG 코돈(또는 DNA의 경우 TTA, TTG, CTT, CTC, CTA, CTG)에 의해 암호화되며, 아미노산 세린은 UCA, UCG, UCC, UCU, AGU, AGC(또는 DNA의 경우 TCA, TCG, TCC, TCT, AGT, AGC)로 특정화된다. 번역된 정보를 변화시키지 않는 뉴클레오티드 변화는 보존적 변화로 간주된다.

숙련된 자라면 두 서열 사이의 동일성을 측정하기 위해 다양한 수학적 알고리즘을 이용한 여러 다양한 컴퓨터 프로그램을 이용할 수 있다는 사실을 인지할 것이다. 예를 들면, 니들맨 앤 분쉬(Needleman and Wunsch) 알고리즘을 사용하는 컴퓨터 프로그램을 이용할 수 있다(문헌[Needleman et al., A general method applicable to the search for similarities in the amino acid sequences of two proteins, J. Mol. Biol. (48):444-453 (1970)]). 한 태양에 따르면, 상기 컴퓨터 프로그램은 액셀러리스(Accelerys) GCG 소프트웨어 패키지(액셀러리스 인코포레이티드, 미국 샌디에고)의 GAP 프로그램이다. 사용될 수 있는 치환 행렬은, 예를 들면, 16, 14, 12, 10, 8, 6 또는 4의 갭 가중치 및 1, 2, 3, 4, 5 또는 6의 길이 가중치를 갖는 BLOSUM62 행렬 또는 PAM250 행렬이다. 숙련된 자라면 모든 상기 상이한 파라미터들이 약간 상이한 결과를 제공할 것이지만 상이한 알고리즘을 사용할 때 두 서열의 전체 동일성 퍼센트가 별로 변화되지 않음을 인지할 것이다.

한 태양에 따르면, 두 뉴클레오티드 서열 사이의 동일성 퍼센트는 액셀러리스 GCG 소프트웨어 패키지(액셀러리스 인코포레이티드, 미국 샌디에고)의 GAP 프로그램을 사용하여 측정된다. NWSgapdna CMP 행렬 및 40, 50, 60, 70 또는 80의 갭 가중치, 및 1, 2, 3, 4, 5 또는 6의 길이 가중치를 사용한다.

또 다른 태양에서, 두 아미노산 또는 뉴클레오티드 서열의 동일성 퍼센트는, PAM120 가중치 잔여 표, 12의 갭 길이 패널티 및 4의 갭 패널티를 사용하는 ALIGN 프로그램(버전 2.0)(진스트림(Genestream) 서버 IGH 몽펠리어(Montpellier) 프랑스의 서열 데이터를 이용하여 ALIGN 쿼리에서 이용가능, http://vega.igh.cnrs.fr/bin/align-guess.cgi) 내에 포함된 메이어스(E. Meyers) 및 밀러(W. Miller)의 알고리즘(문헌[Meyers et al., Optimal alignments in linear space, CABIOS, 4:11-17 (1989)])을 이용하여 측정된다.

본 발명에 있어서, 뉴클레오티드 또는 아미노산 서열 사이의 동일성 및/또는 유사성 퍼센트를 측정하기 위해 BLAST(Basic Local Alignment Tool)를 사용하는 것이 가장 바람직하다.

문헌[Altschul et al., Basic local alignment search tool, J. Mol. Biol., 215:403-410 (1990)]의 BLASTn, BLASTp, BLASTx, tBLASTn 및 tBLASTx 프로그램을 사용하는 쿼리(query)는 http://www.ncbi.nlm.nih.gov/.을 통해 접근가능한 BLAST의 온라인 버전을 통해 게시될 수 있다. 또는, NCBI 인터넷 사이트를 통해 또한 다운로드할 수 있는 BLAST의 독립 버전(예를 들면, 버전 2.2.24(2010년 8월 23일 발표))을 사용할 수 있다. 바람직하게, BLAST 쿼리는 하기의 파라미터하에 수행된다. 아미노산 서열 사이의 동일성 및/또는 유사성 퍼센트를 측정하기 위해: 알고리즘: blastp; 워드 크기: 3; 스코어링 행렬: BLOSUM62; 갭 코스트: 이그지스턴스(Existence): 11, 익스텐션(Extension): 1; 구성 조정: 잠정 구성 스코어 행렬 조정; 필터: 오프; 마스크: 오프. 뉴클레오티드 서열 사이의 동일성 및/또는 유사성 퍼센트를 측정하기 위해: 알고리즘: blastn; 워드 크기: 11; 쿼리 범위내 최대 매치: 0; 매치/미스매치 스코어: 2, -3; 갭 코스트: 이그지스턴스: 5, 익스텐션: 2; 필터: 낮은 복잡성 영역; 마스크: 룩업(lookup) 테이블에만 대한 마스크.

"보존적 변화"의 퍼센트는 언급된 알고리즘 및 컴퓨터 프로그램을 사용하여 서열 동일성 퍼센트와 유사하게 측정할 수 있다. 몇몇 컴퓨터 프로그램, 예를 들어, BLASTp는 포지티브의 수/퍼센트(= 유사성) 및 동일성의 수/퍼센트를 제공한다. 보존적 변화의 퍼센트는 포지티브/유사성 퍼센트로부터 동일성 퍼센트를 차감함으로써 그로부터 유도될 수 있다(보존적 변화 퍼센트 = 유사성 퍼센트 - 동일성 퍼센트).

하이브리드화 실험, PCR 실험, 제한효소 절단, 숙주의 형질전환 등과 같은 일반적인 분자 생물학적 기술들은 문헌[Sambrook et al., Molecular Cloning, A Laboratory Manual, Cold Spring Harbor Press, N.Y. (1989); and Ausubel et al. (eds.), Current Protocols in Molecular Biology, (John Wiley & Sons, N.Y.) (1995)]에 개시된 바와 같이 숙련된 자에게 공지된 표준 관행에 따라 수행될 수 있다.

제 1 폴리뉴클레오티드 및 폴리펩티드

본 발명에 따른 유전자 변형 세포는 제 1 폴리펩티드를 암호화하는 제 1 폴리뉴클레오티드를 포함한다. 제 1 폴리펩티드는 서열번호 1, 2, 3 또는 4의 아미노산 서열과 45% 이상, 바람직하게는 60% 이상, 예를 들면, 70% 이상, 보다 바람직하게는 80% 이상, 예를 들면, 90%, 가장 바람직하게는 95% 이상의 서열 유사성을 갖는 아미노산 서열을 포함한다.

다르게는, 서열 유사성은 적어도 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 적어도 99%의 유사성으로 표현될 수 있다. 한 태양에 따르면, 언급된 유사성 퍼센트는 동일성 퍼센트일 수 있다. 특정 태양에서, 제 1 폴리펩티드는 서열번호 1, 2, 3 또는 4 중 어느 하나에 나타낸 바와 같은 아미노산 서열을 포함할 수 있다.

상기 폴리펩티드는 HMF-산 생체전환에 관해 개선을 제공할 수 있다.

어떤 이론에 결부시키고자 하는 것은 아니지만, 상기 폴리펩티드는 HMF-산 운반 능력을 갖는 것으로 생각된다. 제 1 폴리펩티드에 의한 HMF-산의 세포내로의 운반에 의해, HMF-산은 세포내 전환에 더 잘 이용가능하게 된다. 따라서, HMF-산 생체전환이 개선될 수 있다.

HMF-산 생체전환에 대한 상기 개선은 HmfT1(서열번호 1) 및 메틸로박테리움 라디오톨레란스 JCM 2831(= ATCC 27329 = DMS 1819)로부터의 유전자좌 표지 mrad2831_4728을 갖는 유전자로부터의 단백질 산물(서열번호 3)에 대한 예에 나타내었다. 상기 서열들과의 서열 유사성/동일성의 수준에 근거하여, HmfT2(서열번호 2) 및 설폴로부스 아시도칼다리우스 DSM 639로부터의 Saci _2058 유전자로부터의 단백질 산물이 유사한 효과를 가질 것으로 예상하는 것은 당연하다.

HmfT2(서열번호 2)는 HmfT1(서열번호 1)과 90% 이상의 유사성을 갖는다. 동일성 수준은 87%이다.

상이한 기능적 부류로부터의 운반체를 사용한 CLUSTALW2 다중 서열 정렬에 준하여 설폴로부스 아시도칼다리우스 DSM 639로부터의 saci _2058 유전자의 단백질 산물(서열번호 4)에 대해 유사한 기능이 예상될 수 있다. 설폴로부스 운반체는 HmfT1(서열번호 1) 및 Mrad2831_4728(서열번호 3)과 함께 클러스터(cluster)를 형성한다. 더우기, 설폴로부스 아시도칼다리우스 게놈의 분석은 운반체 유전자 saci_2058은, HMF(-유사 화합물)의 분해시 예상되는 활성 유형인, hmf 유전자 클러스터와 유사한 기능 각각을 암호화하는 유전자들이 측면에 위치함을 나타내었다. 예: Saci_2057, 알콜 데하이드로게나제; Saci_2059/2060, 방향족 고리 디옥시게나제; Saci_2062, 아실-CoA 신테타제(hmfD에 기능적으로 필적함); Saci_2063, 에노일-CoA 하이드라타제(hmfE와 기능적으로 필적함); Saci_2064, 알데하이드 옥시다제/잔틴 데하이드로게나제(hmfABC에 기능적으로 필적함). 상기 분석에 근거하여, 설 폴로부스 아시도칼다리우스 DSM 639로부터의 Saci _2058 유전자의 단백질 산물(서열번호 4)이 HmfT1(서열번호 1) 및/또는 메틸로박테리움 라다오톨레란스 JCM 2831(= ATCC 27329 = DSM 1819)로부터의 유전자좌 표지 mrad2831 _4728을 갖는 유전자로부터의 단백질 산물(서열번호 3)과 유사한 효과를 가질 것으로 예상하는 것은 당연하다.

제 1 폴리펩티드는, 서열번호 7, 8, 9 또는 10에 나타낸 폴리뉴클레오티드 서열과 45% 이상, 바람직하게는 60% 이상, 예를 들면 70% 이상, 보다 바람직하게는 80% 이상, 예를 들면, 90%, 가장 바람직하게는 95% 이상의 서열 유사성을 갖는 제 1 폴리뉴클레오티드 서열에 의해 암호화될 수 있다. 서열번호 7, 8, 9 또는 10에 나타낸 서열과 제 1 폴리뉴클레오티드의 유사성의 적합한 대체 수준은 적어도 66%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 적어도 99% 유사성일 수 있다. 한 태양에 따르면, 언급된 유사성 퍼센트는 동일성 퍼센트일 수 있다. 특정 태양에서, 제 1 폴리펩티드는 서열번호 7, 8, 9 또는 10에 나타낸 바와 같은 폴리뉴클레오티드 서열에 의해 암호화될 수 있다.

제 1 폴리펩티드, 또는 제 1 폴리펩티드를 암호화하는 폴리뉴클레오티드는 유기체, 바람직하게는 특정 성장 조건하에서 제 1 폴리펩티드를 발현하는 미생물로부터 단리될 수 있다. 상기 미생물은 탄소 공급원으로 HMF-산 또는 관련 푸란 물질, 예를 들어, HMF 또는 HMF-알콜을 사용할 수 있지만, 필수적인 것은 아니다.

전형적인 접근방법에서, 적합한 대체 폴리뉴클레오티드를 단리하기 위해 유전자 라이브러리를 검색할 수 있다. 상기 라이브러리는 박테리아의 초계(superkingdom)의 미생물로부터 구성될 수 있다. 상기 미생물은 프로테오박테리아(Proteobacteria) 문, 보다 특히는 알파프로테오박테리아(Alphaproteobacteria) 또는 베타프로테오박테리아(Betaproteobacteria) 강에 속할 수 있다. 알파프로테오박테리아는 리조비알레스(Rhizobiales) 목, 브래디리조비아세아(Bradyrhizobiaceae) 또는 메틸로박테리아세아(Methylobacteriaceae) 과에 속할 수 있다. 브래디리조비아세아는 브래디리조븀 ( Bradyrhizobium) 속, 예를 들면, 브 래디리조븀 자포니쿰, 또는 아피피아 ( Afipia) 속에 속할 수 있다. 메틸로박테리아세아는 메틸로박테리움 ( Methylobacterium) 속, 예를 들면, 메틸로박테리움 노둘란스 또는 메틸로박테리움 라디오톨레란스에 속할 수 있다. 베타프로테오박테리아는 버크홀데리알레스(Burkholderiales) 목, 보다 특히 버크홀데리아세아(Burkholderiaceae) 과에 속할 수 있다. 이들은 큐프리아비더스 속, 예를 들면, 큐프리아비더스 바실렌시스에, 또는 랄스토니아 ( Ralstonia) 속, 예를 들면, 랄스토니아 유트로파(Ralstonia eutropha)에, 또는 버크홀데리아 ( Burkholderia) 속, 예를 들면, 버크홀데리아 피마툼 ( Burkholderia phymatum), 버크홀데리아 피토피르만스 ( Burkholderia phytofirmans), 버크홀데리아 제노보란스( Burkholderia xenovorans) 또는 버크홀데리아 그라미니스( Burkholderia graminis)에 속할 수 있다. 박테리아는 또한 피르미쿠테스(Firmicutes) 문, 보다 특히 바실러스(Bacillus) 강, 보다 특히는 바실라레스(Bacillales) 목에 속할 수 있다. 바실라레스는 바실라세아(Bacillaceae) 강, 보다 특히 제오바실러스 ( Geobacillus) 속, 예를 들면, 제오바실러스 카우스토필루 스( Geobacillus kaustophilus)에 속할 수 있다. 또는, 상기 미생물은 고세균(Archaea)의 초계, 보다 특히는 유리아케오타(Euryarchaeota) 문, 또는 크렌아케오타(Crenarchaeota) 문에 속할 수 있다. 유리아케오타는 분류되지 않은 속, 예를 들면, Cand. 파바케움 아시디필룸 ( Parvarchaeum acidiphilum), 또는 터모플라스마타(Thermoplasmata) 강, 보다 특히 터모플라스마탈레스(Thermoplasmatales) 목에 속할 수 있다. 터모플라스마탈레스는 터모플라스마타세아(Thermoplasmataceae) 과, 보다 특히 터모플라스마( Thermoplasma) 속, 예를 들면, 터모플라스마 아시도필룸( Thermoplasma acidophilum) 또는 터모플라스마 볼카늄(Thermoplasma volcanium)에 속할 수 있다. 크렌아케오타는 터모프로테이(Thermoprotei) 강, 보다 특히 설폴로발레스(Sulfolobales) 목에 속할 수 있다. 설폴로발레스는 설폴로바세아(Sulfolobaceae) 과, 보다 특히 설폴로부스 ( Sulfolobus) 속, 예를 들면, 설폴로부스 아시도칼다리우스 , 설폴로부스 이슬란디쿠스 ( Sulfolobus islandicus ), 설폴로 부스 솔파타리쿠스 ( Sulfolobus solfataricus) 또는 설폴로부스 토코다이( Sulfolobus tokodaii); 또는 메탈로스페라 ( Metallosphaera) 속, 예를 들면, 메 탈로스페라 세둘라(Metallosphaera sedula)에 속할 수 있다. 터모프로테이는 또한 터모프로테알레스(Thermoproteales) 목, 터모프로테아세아(Thermoproteaceae) 과에 속할 수 있다. 터모프로테아세아는 불카니세타 ( Vulcanisaeta) 속, 예를 들면, 불 카니세타 디스트리부타 ( Vulcanisaeta distributa); 또는 칼디비르가 ( Caldivirga) 속, 예를 들면, 칼디비르가 마퀼린젠시스( Caldivirga maquilingensis)에 속할 수 있다.

바람직하게, 제 1 폴리펩티드, 및/또는 상기 제 1 폴리펩티드를 암호화하는 제 1 폴리뉴클레오티드는 큐프리아비더스 바실렌시스 HMF14로부터 단리된다(문헌[Wierckx et al., Isolation and characterization of Cupriavidus basilensis HMF14 for biological removal of inhibitors from lignocellulosic hydrolysate, Microb Biotechnol 3:336-343 (2010)]). 한 대안적 태양에 따르면, 제 1 폴리펩티드 및/또는 제 1 폴리펩티드를 암호화하는 제 1 폴리뉴클레오티드는 메틸로박테리 움 라디오톨레란스로부터 단리될 수 있다.

서열번호 1, 2, 3 또는 4에 제공된 아미노산 서열 및/또는 서열번호 7, 8, 9 또는 10에 제공된 뉴클레오티드 서열을 근거로, 숙련된 자라면 제 1 폴리펩티드를 암호화하는 뉴클레오티드 서열을 단리하기 위해 적절한 프로브 및/또는 프라이머를 구성할 수 있을 것이다.

다르게는, 서열번호 1, 2, 3 또는 4에 제공된 아미노산 서열 및/또는 서열번호 7, 8, 9 또는 10에 제공된 뉴클레오티드 서열을 근거로, 숙련된 자는, 유전자 합성이 점차 이용가능해지고 있기 때문에, 상업적 공급원으로부터 제 1 폴리펩티드를 암호화하는 합성 서열을 수득할 수 있다. 합성 서열은, 예를 들어, 몇가지만 말하자면, 진아트 아게(Geneart A.G.)(독일 레겐스버그)로부터 또는 젠스크립트 유에스에이 인코포레이티드(Genscript USA Inc.)(미국 뉴저지 피스카타웨이)로부터 구입할 수 있다.

본 발명에 따른 세포는 제 1 폴리뉴클레오티드의 기능적 도입에 의해 유전자 변형된다. 폴리뉴클레오티드의 기능적 도입이란, 상기 세포가 폴리뉴클레오티드의 기능적 폴리펩티드 산물을 발현할 가능성을 갖도록 하는 세포내 상기 폴리뉴클레오티드의 도입을 의미한다. 숙주 세포내 폴리뉴클레오티드의 기능적 도입을 위한 방법 및 기술은 숙련된 자의 일반적인 지식에 속한다.

HMF -산 전환 폴리펩티드

본 발명에 따른 유전자 변형 세포는 제 2 폴리펩티드를 암호화하는 제 2 폴리뉴클레오티드를 포함한다. 제 2 폴리펩티드는 HMF-산 전환 활성을 가지며, HMF-산을 생성물로 전환시킬 수 있는 임의의 폴리펩티드로부터 선택될 수 있다. 본 발명자들은 HMF-산을 전환시키는 제 2 폴리펩티드에 의한 HMF-산의 생체전환이 세포내 제 1 폴리펩티드의 발현에 의해 효과적으로 개선됨을 알아내었다.

제 2 폴리펩티드를 암호화하는 제 2 폴리뉴클레오티드는 본 발명에 따른 세포의 천연 성분일 수 있다, 즉, 세포는 제 2 폴리뉴클레오티드에 대해 유전자 변형될 필요가 없다. 그러나, 본 발명의 특정 태양에 따라서, 본 발명에 따른 세포는 제 2 폴리뉴클레오티드의 기능적 도입에 의해 제 2 폴리뉴클레오티드에 대해 유전자 변형된다. 용어 "기능적 도입"은 제 1 폴리펩티드 및 제 1 폴리뉴클레오티드와 관련하여 상기에서 이미 설명하였다.

본 발명의 바람직한 태양에 따르면, 제 2 폴리펩티드는 HMF-산 전환 옥시도리덕타제이다. 상기 HMF-산 전환 옥시도리덕타제는 서열번호 5 또는 6에 나타낸 아미노산 서열, 또는 서열번호 5 또는 6에 나타낸 아미노산 서열과 45% 이상, 바람직하게는 60% 이상, 예를 들면, 70% 이상, 보다 바람직하게는 80% 이상, 예를 들면, 90%, 가장 바람직하게는 95% 이상의 서열 유사성을 갖는 이의 변이체 폴리펩티드를 포함할 수 있다.

또는, 상기 서열 유사성은 적어도 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 적어도 99% 유사성일 수 있다. 한 태양에 따르면, 언급된 유사성 퍼센트는 동일성 퍼센트일 수 있다. 특정 태양에서, 제 2 폴리펩티드는 서열번호 5 또는 6 중 어느 하나에 나타낸 아미노산 서열을 포함할 수 있다.

서열번호 5의 HMF-산 전환 옥시도리덕타제는 이미 개시되었으며(문헌[Koopman et al., Identification and characterization of the furfural and 5-(hydroxymethyl)furfural degradation pathways of Cupriavidus basilensis HMF14, PNAS, Vol. 107, p.4919-4924 (2010a); and Koopman et al., Efficient whole-cell biotransformation of 5-(hydroxymethyl)furfural into FDCA, 2,5-furandicarboxylic acid, Bioresour. Technol., Vol. 101, p.6291-6296 (2010b)]), HmfH로 지칭되었다. 서열번호 6의 HMF-산 전환 옥시도리덕타제는 브래디리조븀 자포니쿰 USDA 110으로부터 단리될 수 있으며, blr0367 유전자의 번역된 단백질 산물에 상응한다. 브래디리조븀 자포니쿰 USDA 110은 이의 게놈에 큐프리아비더스 바실렌시스 HMF14로부터의 모든 HMF/푸르푸랄 이용 유전자에 대한 동족체를 함유한다(문헌[Koopman et al., Identification and characterization of the furfural and 5-(hydroxymethyl)furfural degradation pathways of Cupriavidus basilensis HMF14, PNAS, Vol. 107, p.4919-4924 (2010a)]). blr0367 유전자의 번역 산물은 큐프리아 비더스 바실렌시스 HMF14로부터의 HmfH에 대해 최고의 상동성을 나타낸 브래디리조 븀 자포니쿰 USDA 110의 단백질이다. 브래디리조븀 자포니쿰 USDA 110이 단독 탄소 공급원으로서 HMF를 이용하는 것으로 밝혀진 점을 고려하여(문헌[Koopman et al., Identification and characterization of the furfural and 5-(hydroxymethyl)furfural degradation pathways of Cupriavidus basilensis HMF14, PNAS, Vol. 107, p.4919-4924 (2010a)]), 상기 번역 산물은 기능적 HmfH 동족체를 함유해야 한다. 그러므로, blr0367로부터 HmfH 유사 활성이 야기되는 것으로 예상하는 것은 당연하다.

본 발명은 다수의 HMF-산 전환 옥시도리덕타제에 대해 예시되지만, 본 발명에서 제 2 폴리펩티드가 상이한 HMF-산 전환 옥시도리덕타제이거나 옥시도리덕타제 활성을 갖지 않는 상이한 HMF-산 전환 폴리펩티드임이 특별히 허용됨을 주지해야 한다.

제 2 폴리펩티드는 서열번호 11 또는 12에 나타낸 폴리뉴클레오티드 서열과 45% 이상, 바람직하게는 60% 이상, 예를 들면, 70% 이상, 보다 바람직하게는 80% 이상, 예를 들면, 90%, 가장 바람직하게는 95% 이상의 서열 유사성을 갖는 제 2 폴리뉴클레오티드 서열에 의해 암호화될 수 있다. 서열번호 11 또는 12에 나타낸 서열과 제 1 폴리뉴클레오티드의 유사성의 적합한 대체 수준은 적어도 66%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 적어도 99% 유사성일 수 있다. 한 태양에 따르면, 언급된 유사성 퍼센트는 동일성 퍼센트일 수 있다. 특정 태양에서, 제 2 폴리펩티드는 서열번호 11 또는 12에 나타낸 바와 같은 폴리뉴클레오티드 서열에 의해 암호화될 수 있다.

큐프리아비더스 바실렌시스로부터 옥시도리덕타제 활성을 갖는 제 2 폴리펩티드를 암호화하는 적합한 폴리뉴클레오티드의 단리는 문헌[Koopman et al., Identification and characterization of the furfural and 5-(hydroxymethyl)furfural degradation pathways of Cupriavidus basilensis HMF14, PNAS, Vol. 107, p.4919-4924 (2010a)]에 개시되었다. 상기 유전자는 hmfH로 지칭되었다.

제 2 폴리뉴클레오티드를 단리하기 위한 접근방법에서, 적합한 폴리뉴클레오티드를 단리하기 위해 유전자 라이브러리를 검색할 수 있다. 상기 라이브러리는 박테리아의 초계의 미생물로부터 구성될 수 있다. 상기 미생물은 프로테오박테리아 문, 보다 특히는 알파프로테오박테리아, 베타프로테오박테리아 또는 감마프로테오박테리아(Gammaproteobacteria) 강에 속할 수 있다. 알파프로테오박테리아는 리조비알레스 목 또는 스핀고모나달레스(Sphingomonadales) 목에 속할 수 있다. 리조비알레스는 메틸로박테리아세아 과, 예를 들면, 메틸로박테리움 노둘란스 또는 메틸로박테리움 라디오톨레란스와 같은 메틸로박테리움 속으로부터의 유기체, 또는 리조비아세아 과로부터의 유기체에 속할 수 있다. 리조비아세아는 리조븀/아그로박테리움(Agrobacterium) 군, 보다 특히는 리조븀 레구미노사룸 (R. leguminosarum) 또는 리조븀 레구미노사룸 bv . 트리폴리와 같은 리조븀 속에 속할 수 있다. 이들은 또한 아그로박테리움 라디오박터(A. radiobacter)와 같은 아그로박테리움 속에 속할 수 있다. 리조비아세아는 또한 브래디리조비아세아 과, 보다 특히는 브래디 리조븀 자포니쿰과 같은 브래디리조븀 속에 속할 수 있다. 스핀고모나달레스는 스핀고모나다세아(Sphingomonadaceae) 과, 보다 특히 스핀고모나스 위티치(S. wittichii) 또는 스핀고모나스 클로로페놀리쿰(S. chlorophenolicum)과 같은 스핀고모나스( Sphingomonas) 속에 속할 수 있다. 베타프로테오박테리아는 메틸로필라레스(Methylophilales) 목 또는 버크홀데리알레스 목에 속할 수 있다. 메틸로필라레스는 메틸로필라세아(Methylophilaceae) 과, 예를 들면, 메틸로보러스( Methylovorus ) 속으로부터의 유기체에 속할 수 있다. 버크홀데리알레스는 버크홀데리아세아 과, 예를 들면, 큐프리아비더스 바실렌시스와 같은 큐프리아비더스 속으로부터의 유기체에 속할 수 있다. 이들은 또한 버크홀데리아 속, 예를 들면, 버크홀데리아 피토피르만스, 버크홀데리아 피마툼, 버크홀데리아 그라미니스 , 버크 홀데리아 제노보란스 또는 버크홀데리아 세노세파시아(B. cenocepacia)에, 또는 옥살로박테라세아(Oxalobacteraceae) 과, 잔티노박테리움 ( Janthinobacterium) 속에 속할 수 있다. 감마프로테오박테리아는 엔테로박테리알레스(Enterobacteriales) 목, 엔테로박테리아세아(Enterobacteriaceae) 과, 예르시니아 ( Yersinia) 속, 예를 들면, 예르시니아 루케리(Yersinia ruckeri)에 속할 수 있다. 미생물은 또한 악티노박테리아(Actinobacteria) 문, 악티노박테리아 강, 악티노박테리대(Actinobacteridae) 아강, 악티노마이세탈레스(Actinomycetales) 목의 박테리아일 수 있다. 악티노마이세탈레스는 스트렙토마이시네아(Streptomycineae), 슈도노카르디네아(Pseudonocardineae) 또는 마이크로모노스포리네아(Micromonosporineae)의 아목에 속할 수 있다. 스트렙토마이시네아는 스트렙토마이세타세아(Streptomycetaceae) 과, 보다 특히 스트렙토마이세스 ( Streptomyces) 속, 예를 들면, 스트렙토마이세스 비올라세우스니거 (S. violaceusniger), 스트렙토마이세스 하이그로스코피쿠스(S. hygroscopicus) 또는 스트렙토마이세스 클라불리게루스 (S. clavuligerus)에 속할 수 있다. 슈도노카르디네아는 슈도노카르디아세아(Pseudonocardiaceae) 과, 보다 특히는 사카로폴리스포라 에리트라에(S. erythraea)와 같은 사카로폴리스포라 ( Saccharopolyspora) 속; 또는 악티노시네마타세아(Actinosynnemataceae) 과, 보다 특히는 사카로트릭스 무타빌리스 (S. mutabilis) 또는 사카로트릭스 무타빌리스 아종 카프레올루스(capreolus)와 같은 사카로트릭스( Saccharothrix) 속, 또는 악티노시네마 미룸(A. mirum)과 같은 악티 노시네마( Actinosynnema) 속에 속할 수 있다. 마이크로모노스포리네아(Micromonosporineae)는 마이크로모노스포라세아(Micromonosporaceae) 과, 보다 특히는 마이크로모노스포라 ( Micromonospora) 속에 속할 수 있다.

서열번호 5 또는 6에 제공된 아미노산 서열 및/또는 서열번호 11 또는 12에 제공된 뉴클레오티드 서열을 기초로, 숙련된 자는 제 2 폴리펩티드를 암호화하는 뉴클레오티드 서열을 단리하기 위해 적합한 프로브 및/또는 프라이머를 구성할 수 있을 것이다.

다르게는, 서열번호 5 또는 6에 제공된 아미노산 서열 및 서열번호 11 또는 12에 제공된 뉴클레오티드 서열을 기초로, 숙련된 자는 제 1 폴리펩티드를 논의한 부분에서 이미 언급한 바와 같이 상업적 공급원으로부터 제 2 폴리펩티드를 암호화하는 합성 서열을 수득할 수 있다.

제 3 폴리뉴클레오티드 및 폴리펩티드

대안적 태양에 따르면, 본 발명에 따른 유전자 변형 세포는 제 3 폴리펩티드를 암호화하는 제 3 폴리뉴클레오티드를 포함한다. 제 3 폴리펩티드는 서열번호 19, 20, 21, 22, 23, 24 또는 25의 아미노산 서열과 45% 이상, 바람직하게는 60% 이상, 예를 들면, 70% 이상, 보다 바람직하게는 80% 이상, 예를 들면, 90%, 가장 바람직하게는 95% 이상의 서열 유사성을 갖는 아미노산 서열을 포함한다.

다르게는, 서열 유사성은 적어도 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 적어도 99%의 유사성으로 표현될 수 있다. 한 태양에 따르면, 언급된 유사성 퍼센트는 동일성 퍼센트일 수 있다. 특정 태양에서, 제 1 폴리펩티드는 서열번호 19, 20, 21, 22, 23, 24 또는 25 중 어느 하나에 나타낸 바와 같은 아미노산 서열을 포함할 수 있다. 서열번호 19의 아미노산 서열이 제 3 폴리펩티드의 바람직한 선택이다. 상기 아미노산 서열은 최근에 WO 2011/026906 호에 발표되었다(서열번호 15).

상기 제 3 폴리펩티드의 기능적 발현은 푸란 알데하이드를 전환시킬 수 있는 알데하이드 데하이드로게나제 활성(Adh)을 야기하며, HMF-산 생체전환 및/또는 FDCA 생산에 대해 추가의 개선을 제공한다.

제 3 폴리펩티드의 발현과 관련된 효과는 서열번호 19의 아미노산 서열에 대한 실시예에 나타내었다. 서열 유사성/동일성의 수준에 근거하여, 서열번호 20 내지 25의 폴리펩티드 및 이의 유사체/동족체가 유사한 효과를 가질 것으로 예상하는 것이 당연하다.

제 3 폴리펩티드는, 서열번호 26, 27, 28, 29, 30, 31 또는 32에 나타낸 폴리뉴클레오티드 서열과 45% 이상, 바람직하게는 60% 이상, 예를 들면 70% 이상, 보다 바람직하게는 80% 이상, 예를 들면, 90%, 가장 바람직하게는 95% 이상의 서열 유사성을 갖는 제 3 폴리뉴클레오티드 서열에 의해 암호화될 수 있다. 바람직하게, 제 3 폴리펩티드는 서열번호 26에 나타낸 폴리뉴클레오티드 서열 또는 서열번호 26에 나타낸 폴리뉴클레오티드 서열과 언급된 서열 유사성을 갖는 동족체에 의해 암호화된다. 서열번호 26의 폴리뉴클레오티드 서열은 최근에 WO 2011/026906 호에 발표되었다(서열번호 16). 서열번호 26, 27, 28, 29, 30, 31 또는 32에 나타낸 서열과 제 3 폴리뉴클레오티드의 유사성의 적합한 대체 수준은 적어도 66%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 적어도 99% 유사성일 수 있다. 한 태양에 따르면, 언급된 유사성 퍼센트는 동일성 퍼센트일 수 있다. 특정 태양에서, 제 3 폴리펩티드는 서열번호 26, 27, 28, 29, 30, 31 또는 32에 나타낸 바와 같은 폴리뉴클레오티드 서열에 의해 암호화될 수 있다.

제 3 폴리펩티드 및 상응하는 제 3 폴리뉴클레오티드의 단리 및 추가의 조작은 일반적으로 상기 및 하기에서 제 1 폴리펩티드 및 상응하는 제 1 폴리펩티드에 대해 논의하는 바와 같이 수행될 수 있다.

벡터

본 발명의 또 다른 양태는 클로닝 및 발현 벡터를 포함하여, 제 1 및 제 2 폴리뉴클레오티드 또는 이의 기능적 등가물을 포함하는 벡터, 및 예를 들면, 본 발명의 폴리펩티드의 발현이 일어나는 조건하에서 적합한 숙주 세포에서 상기 벡터를 성장, 형질전환 또는 형질감염시키는 방법에 관한 것이다. 본원에서 사용된 바와 같이, 용어 "벡터"는 연결된 또 다른 핵산을 운반할 수 있는 핵산 분자를 말한다.

제 1 및 제 2 폴리뉴클레오티드 및 선택적으로 제 3 폴리뉴클레오티드는 재조합 복제가능 벡터, 예를 들면, 클로닝 또는 발현 벡터 내에 혼입될 수 있다. 상기 벡터는 상용가능한 숙주 세포에서 핵산을 복제하기 위해 사용될 수 있다. 따라서, 또 다른 태양에서, 본 발명은 본 발명의 폴리뉴클레오티드를 복제가능 벡터 내에 도입하고, 상기 벡터를 상용가능한 숙주 세포 내에 도입하고, 상기 숙주 세포를 벡터의 복제를 야기하는 조건하에서 성장시킴으로써 본 발명의 폴리뉴클레오티드를 제조하는 방법을 제공한다. 상기 벡터는 숙주 세포로부터 회수될 수 있다. 적합한 숙주 세포는 하기에서 기술한다.

본 발명의 발현 카세트 또는 폴리뉴클레오티드가 삽입되는 벡터는 재조합 DNA 절차에 편리하게 적용될 수 있는 임의의 벡터일 수 있으며, 벡터의 선택은 흔히 상기 벡터가 도입될 숙주 세포에 따라 달라질 것이다.

본 발명에 따른 벡터는 자율 복제 벡터, 즉, 그 복제가 염색체 복제와 무관한 염색체외 존재로서 존재하는 벡터, 예를 들면, 플라스미드일 수 있다. 또는, 벡터는, 숙주 세포내에 도입될 때 숙주 세포 게놈 내에 통합되어 통합된 염색체와 함께 복제되는 벡터일 수 있다.

벡터의 한 유형은 "플라스미드"로, 이것은 추가의 DNA 절편이 접합될 수 있는 원형 이중 가닥 DNA 루프를 말한다. 벡터의 또 다른 유형은 바이러스 벡터로, 여기서는 추가의 DNA 절편이 바이러스 게놈 내로 접합될 수 있다. 특정 벡터는 그들이 도입되는 숙주 세포에서 자율 복제될 수 있다(예를 들면, 박테리아 복제 기점을 갖는 박테리아 벡터 및 에피솜 포유동물 벡터). 다른 벡터(예를 들면, 비-에피솜 포유동물 벡터)는 숙주 세포내에 도입시 숙주 세포의 게놈 내에 통합됨으로써, 숙주 게놈과 함께 복제된다. 또한, 특정 벡터들은 이들이 작동가능하게 연결된 유전자의 발현을 유도할 수 있다. 상기 벡터는 본원에서 "발현 벡터"로 지칭된다. 일반적으로, 재조합 DNA 기술에서 유용한 발현 벡터는 흔히 플라스미드의 형태이다. 용어 "플라스미드" 및 "벡터"는 플라스미드가 가장 흔히 사용되는 형태의 벡터이므로 본원에서 상호교환적으로 사용될 수 있다. 그러나, 본 발명은 상기 다른 형태의 발현 벡터, 예를 들면, 코스미드, 바이러스 벡터(예를 들면, 복제 결핍 레트로바이러스, 아데노바이러스 및 아데노-연관 바이러스), 파지 벡터 및 트랜스포손(transposon) 및 등가의 기능을 제공하는 플라스포손(plasposon)을 포함하는 것이다.

숙련된 자라면 제공된 아미노산 및 폴리뉴클레오티드 서열, 당해 분야에 대한 지식 및 상업적으로 이용가능한 수단들을 기초로 하여 본 발명에 따른 벡터를 구성할 수 있을 것이다.

바람직한 태양에 따르면, 제 1 및 제 2 폴리뉴클레오티드 서열은 단일 벡터 상에 위치한다. 상기 벡터는 선택적으로 제 3 폴리뉴클레오티드 서열을 또한 포함한다. 숙련된 자가 이해하듯이, 제 1 및 제 2 폴리뉴클레오티드 서열을 포함(및 선택적으로 제 3 폴리뉴클레오티드 서열을 추가로 포함)하는 벡터의 사용은 제 1 및 제 2 폴리펩티드(선택적으로 제 3 폴리펩티드와 함께)를 기능적으로 발현시키는 유전자 변형 세포의 구성을 매우 단순화시킨다. 그러나, 숙련된 자가 또한 이해하듯이, 제 1 및 제 2 폴리펩티드를 기능적으로 발현시키는 유전자 변형 세포는 대체 벡터를 포함하는 다양한 다른 형질전환 방법에 의해 수득될 수 있다. 이와 관련하여, 특정 태양에 따라서, 제 2 폴리뉴클레오티드 서열의 기능적 도입이 필요조건은 아님을 주지해야 한다. 또한, 특정한 또 다른 대안적 태양에 따라서, 제 3 폴리뉴클레오티드 서열의 기능적 도입이 필요조건은 아니다.

숙주 세포

본 발명에 따른 유전자 변형 세포는 임의의 적합한 숙주 세포로부터 구성될 수 있다. 숙주 세포는 비변형 세포일 수 있거나, 이미 유전자 변형될 수 있다. 상기 세포는 원핵 세포, 진핵 세포, 식물 세포 또는 동물 세포일 수 있다. 상기 세포에서, 하나 이상의 유전자기 결실되거나, 제거(knocked-out)되거나 완전히 또는 부분적으로 파괴될 수 있으며, 이때 선택적으로 하나 이상의 유전자는 프로테아제를 암호화한다. 한 태양에 따르면, 본 발명에 따른 숙주 세포는 진핵 숙주 세포이다. 바람직하게, 진핵 세포는 포유동물, 곤충, 식물, 진균류 또는 조류(algal) 세포이다. 바람직한 포유동물 세포로는, 예를 들면, 차이니즈 햄스터 난소(Chinese hamster ovary, CHO) 세포, COS 세포, 293 세포, PerC6 세포 및 하이브리도마가 포함된다. 바람직한 곤충 세포로는, 예를 들면, Sf9 및 Sf21 세포 및 이의 유도체가 포함된다. 보다 바람직하게, 진핵 세포는 진균 세포, 즉, 효모 세포, 예를 들면, 캔디다( Candida ), 한세눌라 ( Hansenula ), 클루이베로마이세스( Kluyveromyces ), 피치아 ( Pichia ), 사카로마이세스 ( Saccharomyces ), 쉬조사카로마이세스( Schizosaccharomyces) 또는 야로이야 ( Yarrowia) 균주이다. 보다 바람직하게, 진핵 세포는 클루이베로마이세스 락티스 ( Kluyveromyces lactis ), 사카로마이 세스 세레비지에 ( Saccharomyces cerevisiae ), 한세눌라 폴리모르파( Hansenula polymorpha), 야로이야 리포라이티카 ( Yarrowia lipolytica ), 피치아 스티피티 스( Pichia stipitis) 및 피치아 파스토리스 ( Pichia pastoris), 또는 사상균 세포이다. 특정 태양에서, 진핵 세포는 사상균(filamentous fungi) 세포이다.

"사상균"은 아문 진균문(Eumycota) 및 난균문(Oomycota)의 모든 사상 형태를 포함한다(문헌[Hawksworth et al., In: Ainsworth and Bisby's Dictionary of The Fungi, 8th edition, CAB International, University Press, Cambridge, UK (1995)]에 정의된 바와 같음). 사상균은 키틴, 셀룰로스, 글루칸, 키토산, 만난 및 다른 복합 폴리사카라이드로 이루어진 균사체 벽을 특징으로 한다. 영양 생장(vegetative growth)은 균사 신장에 의하며, 탄소 이화작용은 절대 호기성이다. 사상균 균주로는 아크레모늄 ( Acremonium ), 아가리쿠스( Agaricus ), 아스퍼질러스 ( Aspergillus ), 오레오바시듐 ( Aureobasidium ), 크리소스포륨( Chrysosporium ), 코프리누스 ( Coprinus ), 크립토코커스 ( Cryptococcus ), 필리바시듐( Filibasidium ), 푸사리움 ( Fusarium ), 후미콜라( Humicola ), 마그나포르테( Magnaporthe ), 뮤코 ( Mucor ), 마이셀리오프토라 ( Myceliophthora ), 네오칼리마스틱스( Neocallimastix ), 뉴로스포라 ( Neurospora ), 페실로마이세스 ( Paecilomyces ), 페니실리움( Penicillium ), 피로마이세스 ( Piromyces ), 파네로카에테( Phanerochaete ), 플레우로투스 ( Pleurotus ), 쉬조필룸 ( Schizophyllum ), 탈라로마 이세스( Talaromyces ), 터모아스쿠스 ( Thermoascus ), 티엘라비아 ( Thielavia ), 톨리포클라듐( Tolypocladium) 및 트리코더마(Trichoderma)의 균주들이 포함되나, 이로 한정되지는 않는다.

바람직한 사상균 세포는 아스퍼질러스 , 크리소스포륨 , 페니실륨, 탈라로마이 세스 또는 트리코더마 속의 종, 가장 바람직하게는 아스퍼질러스 니거( Aspergillus niger), 아스퍼질러스 아와모리 ( Aspergillus awamori ), 아스퍼질러스 포에티두스( Aspergillus foetidus ), 아스퍼질러스 소재( Aspergillus sojae ), 아스퍼질러스 푸미가투스( Aspergillus fumigatus ), 탈라로마이세스 에메르소니( Talaromyces emersonii), 아스퍼질러스 오리재( Aspergillus oryzae ), 크리소스포륨 루크노웬스( Chrysosporium lucknowense ), 트리코더마 레세이 ( Trichoderma reesei) 또는 페 니실리움 크리소게눔( Penicillium chrysogenum)으로부터 선택된 종에 속한다.

또 다른 태양에 따르면, 본 발명에 따른 숙주 세포는 원핵 세포이다. 바람직하게, 원핵 숙주 세포는 박테리아 세포이다. 용어 "박테리아 세포"는 그람-음성 및 그람-양성 미생물 둘 다를 포함한다. 적합한 박테리아는, 예를 들면, 에스케리키아( Escherichia ), 아나바에나 ( Anabaena ), 카울로박터 ( Caulobacter ), 글루코노박 터( Gluconobacter ), 로도박터 ( Rhodobacter ), 슈도모나스( Pseudomonas ), 파라코커스( Paracoccus ), 바실러스 ( Bacillus ), 브레비박테리움 ( Brevibacterium ), 코리네박테리움( Corynebacterium ), 리조븀 ( Rhizobium )( 시노리조븀 ( Sinorhizobium )), 브래디리조븀( Bradyrhizobium ), 플라보박테리움 ( Flavobacterium ), 클렙시엘라( Klebsiella ), 엔테로박터( Enterobacter ), 락토바실러스 ( Lactobacillus ), 락토코커스( Lactococcus ), 메틸로박테리움 ( Methylobacterium ), 스태필로코커스( Staphylococcus ), 스트렙토마이세스 ( Streptomyces ), 지모모나스 ( Zymomonas ), 아세토박터( Acetobacter ), 스트렙토코커스 ( Streptococcus ), 박터로이데스( Bacteroides ), 셀레노모나스 ( Selenomonas ), 메가스파에라 ( Megasphaera ), 버크홀데리아( Burkholderia ), 큐프리아비더스 ( Cupriavidus ), 랄스토니아 ( Ralstonia ), 메틸로박테리움( Methylobacterium ), 메틸로보러스 ( Methylovorus ), 로도슈도모나스( Rhodopseudomonas ), 아시디필리움 ( Acidiphilium ), 디노로세오박터( Dinoroseobacter ), 아그로박테리움( Agrobacterium ), 설폴로부스 ( Sulfolobus) 또는 스핀고모나스 ( Sphingomonas) 속으로부터 선택될 수 있다. 바람직하게, 박테리아 세포는 다음으로 이루어진 군으로부터 선택된다: 바실러스 서브틸리스( Bacillus subtilis), 바실러스 아밀로리퀘파시엔스 ( Bacillus amyloliquefaciens ), 바실러스 리케니포미스( Bacillus licheniformis ), 바실러스 푼티스 ( Bacillus puntis ), 바실 러스 메가테리움 ( Bacillus megaterium ), 바실러스 할로두란스( Bacillus halodurans), 바실러스 푸밀러스 ( Bacillus pumilus ), 글루코노박터 옥시단스( Gluconobacter oxydans ), 카울로박터 크레센투스 ( Caulobacter crescentus ), 메 틸로박테리움 엑스토르쿠엔스 ( Methylobacterium extorquens ), 메틸로박테리움 라디오톨레란스( Methylobacterium radiotolerans ), 메틸로박테리움 노둘란스( Methylobacterium nodulans ), 로도박터 스파에로이데스( Rhodobacter sphaeroides), 슈도모나스 제아잔티니파시엔스 ( Pseudomonas zeaxanthinifaciens ), 슈도모나스 푸티다 ( Pseudomonas putida ), 슈도모나스 푸티다 S12, 파라코커스 데니트리피칸스( Paracoccus denitrificans ), 에스케리키아 콜라이 ( Escherichia coli ), 코 리네박테리움 글루타미쿰 ( Corynebacterium glutamicum ), 스태필로코커스 카르노서스( Staphylococcus carnosus ), 스트렙토마이세스 리비단스( Streptomyces lividans), 시노리조븀 멜리로티 ( Sinorhizobium meliloti ), 브래디리조븀 자포니쿰( Bradyrhizobium japonicum ), 리조븀 라디오박터 ( Rhizobium radiobacter ), 리조 븀 레구미노사룸 ( Rhizobium leguminosarum ), 리조븀 레구미노사룸 bv. 트리폴리( Rhizobium leguminosarum bv. trifolii ), 아그로박테리움 라디오박터( Agrobacterium radiobacter ), 큐프리아비더스 바실렌시스( Cupriavidus basilensis), 큐프리아비더스 네카토르( Cupriavidus necator )( 랄스토니아 유트로 파( Ralstonia eutropha )), 랄스토니아 피케티 ( Ralstonia pickettii ), 버크홀데리아 피토피르만스( Burkholderia phytofirmans ), 버크홀데리아 피마툼( Burkholderia phymatum), 버크홀데리아 제노보란스 ( Burkholderia xenovorans ), 버크홀데리아 그라미니스( Burkholderia graminis ), 로도슈도모나스 팔루스트리스( Rhodopseudomonas palustris), 아시디필리움 크립툼 ( Acidiphilium cryptum ), 디노로세오박터 시바에( Dinoroseobacter shibae ), 설폴로부스 아시도칼다리우스( Sulfolobus acidocaldarius), 설폴로부스 이슬란디쿠스 ( Sulfolobus islandicus ), 설폴로부스 솔파타리쿠스( Sulfolobus solfataricus ), 설폴로부스 토코다이( Sulfolobus tokodaii).

매우 바람직한 숙주 세포는 슈도모나스 푸티다 S12이다. 상기 균주에서, 큐 프리아비더스 바실렌시스 HMF14로부터의 hmfH 유전자의 기능적 발현은 HMF 산화 능력을 도입하는데 효과적이어서 상기 기질로부터 FDCA 생성을 야기하는 것으로 입증되었다.

본 발명에 따른 세포의 특정 용도를 위해, 숙주 세포의 선택은 상기 용도에 따라 이루어질 수 있다. 리그노셀룰로스 공급 원료의 전환에 적합한 숙주들 및 FDCA와 같은 푸란 화합물의 생산에 바람직한 조건에 내성인 숙주들이 특히 바람직하다. 숙련된 자라면 제 1 및 선택적으로 제 2 폴리뉴클레오티드를 임의의 상기 언급한 숙주 세포 내에 기능적으로 도입하기에 적합한 수단 및 방법을 이용할 수 있을 것이다.

HMF -산 생물전환

본 발명에 따른 유전자 변형 세포는 개선된 HMF-산 생물전환을 갖는다. 개선된 HMF-산 생체전환은 푸란 화합물이 해로운 것으로 간주되는 공급원료, 예를 들면, 생물연료 및 생화학물질의 생산을 위한 에탄올생산성 발효를 위한 공급원료로부터 HMF-산 및 이의 푸란 전구체의 제거에 유리하다. 다른 용도에서, 개선된 HMF-산 생체전환은, FDCA 바이오생산에서와 같이, HMF-산이 출발 물질 또는 중간체인 화학물질의 바이오생산을 개선할 것이다.

HMF-산 전환 효소가 HMF-산 전환 옥시도리덕타제인 경우, 본 발명에 따른 세포는 생물학적 산화 반응을 수행할 수 있을 것이다. 산화 반응은 본원에서 옥시도리덕타제의 존재하에 HMF-산과 산화제의 하나 이상의 반응이다.

바람직한 산화 반응은 FDCA의 생성이며, 여기서 HMF-산은 HMF-산 전환 옥시도리덕타제의 존재하에 산화제와의 반응에 의해 FDCA로 전환된다. 예를 들어, HMF를 출발 물질로 사용하여, HMF-산이 중간체인 푸란 화합물의 FDCA로의 생체전환은 선행 기술에 개시되었다(문헌[Koopman et al., Identification and characterization of the furfural and 5-(hydroxymethyl)furfural degradation pathways of Cupriavidus basilensis HMF14, PNAS, Vol. 107, p.4919-4924 (2010a); and Koopman et al., Efficient whole-cell biotransformation of 5-(hydroxymethyl)furfural into FDCA, 2,5-furandicarboxylic acid, Bioresour. Technol., Vol. 101, p.6291-6296 (2010b)] 참조). 상기 생체전환은 본 발명에 따른 세포에 의해 수행되는 경우 개선될 것이다.

HMF-산은 본 발명의 세포 또는 존재하는 임의의 다른 세포에 의해 하나 이상의 푸란 전구체로부터 동일반응계내에서 생성될 수 있다. 동일반응계내 생성이란 HMF-산이 시스템 외부로부터 첨가되지 않는 것을 의미한다. 대신 HMF-산은 푸란 전구체를 HMF-산으로 전환시키는 하나 이상의 생체전환에 의해 시스템내에서 생성된다.

HMF-산의 푸란 전구체는 5-(하이드록시메틸)푸란-2-카브알데하이드(HMF), 푸란-2,5-다이카브알데하이드(DFF) 및 [5-(하이드록시메틸)푸란-2-일]메탄올(HMF 알콜)로 이루어진 군으로부터 선택될 수 있으며, 바람직하게 푸란 전구체는 HMF이다.

HMF는 당해 분야에 알려져 있는 바와 같이 산-촉진된 탈수에 의해 하나 이상의 6탄당으로부터 수득될 수 있다. 6탄당은 바이오매스, 바람직하게는 리그노셀룰로스 바이오매스로부터 수득될 수 있다.

산화 반응은 생성물을 제공하는 많은 연속적 산화 반응 단계, 예를 들면, HMF-산의 FFA로의 산화 및 또한 FFA의 FDCA로의 산화를 포함할 수 있다. 산화 반응의 예는 도 1에 나타내었다.

산화 반응은 바람직하게는 비교적 온화한 온도, 즉 10 내지 80 ℃, 보다 바람직하게는 20 내지 45 ℃, 가장 바람직하게는 약 25 내지 40 ℃에서 수행된다. 염 생성이 제어될 수 있도록, FDCA가 중성 형태 또는 완전히 용해된 형태인 pH에서 반응을 수행하는 것이 바람직하다. FDCA 중 2개의 산 분자의 존재를 고려하여, 2개의 별개의 바람직한 pH 범위가 있다. 반응시 pH는 pH 1 내지 6, 바람직하게는 pH 1 내지 4, 가장 바람직하게는 pH 1 내지 3일 수 있다. 또는 반응시 pH는 pH 5 내지 9, 바람직하게는 pH 5 내지 8, 가장 바람직하게는 pH 5 내지 7일 수 있다. 숙련된 자라면 숙주 세포의 필요조건이 공정에 적합한 pH 값의 선택에 또한 영향을 미칠 것임을 이해할 것이다. 본 발명에 적합한 다양한 숙주 세포에 적합한 pH 값의 선택은 숙련된 자의 영역에 속하며 표준 교과서로부터 유도될 수 있다. 슈도모나스 푸티다 S12를 포함하여 슈도모나스 푸티다의 경우, 바람직한 pH 범위는 pH 5 내지 7이다.

반응 시간은 분자 산소 또는 물과 같은 산소 공급원, 또는 푸란 산화 효소의 필요조건에 따라 상이한 산소 공급원으로부터 산소의 첨가하에, 6 내지 150 시간일 수 있다. 공기를 편리하게 분자 산소의 공급원으로 사용할 수 있다.

반응기는 임의의 적합한 (통기) 생물반응기일 수 있다. 상기 반응기는 회분식(batch), 연속식 또는 유가식(fed-batch) 운전으로 작동될 수 있다.

생물전환 후에, 세포는 입증된 방법에 의해 배양액으로부터 단리되어 재사용될 수 있다. FDCA, HMF-산 등과 같은 산화 생성물은 (산) 침전 및 후속 냉각 결정화, 및 결정화된 산화 생성물, 예를 들면, 결정화된 FDCA의 단리에 의해 반응 혼합물로부터 회수될 수 있다. 그러나, 당해 분야에 공지된 바와 같이, 산 침전 및 용매 추출과 같은(이로 한정되지는 않는다) 다른 회수 방법도 적합하다.

리그노셀룰로스 공급원료로부터 HMF-산의 제거와 같은 많은 용도에서, HMF-전환의 정확한 방식은 중요하지 않다. 중요한 것은 HMF-산을 그대로 제거하기 위해 또는 HMF-산이 푸란 전구체로부터 생성되는 경우 이의 축적을 방지하기 위해 HMF-산이 효과적으로 전환되는 것이다. 상기 용도의 경우, HMF-산 전환 폴리펩티드는 현재 알려져 있거나 언젠가는 발견될 HMF-전환 활성을 갖는 임의의 폴리펩티드일 수 있다.

본 발명의 다른 양태는 푸란 전구체의 FDCA로의 생물전환을 위한 본 발명에 따른 유전자 변형 세포의 용도를 목적으로 한다. 푸란 전구체는 특히 5-(하이드록시메틸)푸란-2-카브알데하이드(HMF), [5-(하이드록시메틸)푸란-2-일]메탄올(HMF 알콜), 푸란-2,5-다이카브알데하이드(DFF), 5-(하이드록시메틸)푸란-2-카복실산(HMF-산) 또는 5-포밀푸란-2-카복실산(FFA)으로부터 선택될 수 있다. 바람직하게, HMF는 선택된 푸란 전구체이다. HMF-산은 HMF의 FDCA로의 생체전환에서 중간체일 수 있다.

본 발명은 또한 하기 실시예에 관하여 더 예시될 것이다.

실시예

일반적 방법

균주 및 플라스미드. 슈도모나스 푸티다 S12(ATCC 700801)를, 큐프리아비더 스 바실렌시스 HMF14(문헌[Wierckx et al., Isolation and characterization of Cupriavidus basilensis HMF14 for biological removal of inhibitors from lignocellulosic hydrolysate, Microb Biotechnol 3:336-343 (2010); and Koopman et al., Identification and characterization of the furfural and 5-(hydroxymethyl)furfural degradation pathways of Cupriavidus basilensis HMF14, PNAS, Vol. 107, p.4919-4924 (2010a)]) 및 메틸로박테리움 라디오톨레란스 JCM 2831(= ATCC 27329 = DSM 1819; http://genome.jgi-psf.org/metra/metra.home.html에서 이용가능한 게놈 서열)로부터의 유전자 발현을 위한 숙주로 사용하였다. 에스케리키아 콜라이 균주 DH5α 또는 TOP10(인비트로겐)을 일반 클로닝 목적으로 사용하였다.

큐프리아비더스 바실렌시스 또는 메틸로박테리움 라디오톨레란스 유전자의 에피솜 발현을 위해, pUCP22-유도된 pJT'mcs(문헌[Koopman et al., Identification and characterization of the furfural and 5-(hydroxymethyl)furfural degradation pathways of Cupriavidus basilensis HMF14, PNAS, Vol. 107, p.4919-4924 (2010a)]) 또는 pJNNmcs(t)(문헌[Wierckx et al., Transcriptome analysis of a phenol producing Peudomonas putida S12 construct: genetic and physiological basis for improved production. J Bacteriol 190:2822-2830 (2008)]), 또는 pBBR1MCS-유도된 pBT'mcs(문헌[Koopman et al., Identification and characterization of the furfural and 5-(hydroxymethyl)furfural degradation pathways of Cupriavidus basilensis HMF14, PNAS, Vol. 107, p.4919-4924 (2010a)])를 사용하였다. pJT'mcs 및 pBT'mcs에서, 표적 유전자의 발현은 구성적 tac 프로모터로부터 유도된다. pJNNmcs(t)에서는, 발현이 살리실레이트 유도성 NagR/P_nagAa 발현 카세트로부터 유도된다.

배지 및 배양 조건. 무기염 배지(MM)를 제한 배지로 사용하였다. MM은 다음을 함유하였다(탈염수 리터 당): 명시된 바와 같은 탄소 공급원이 보충된, 3.88 g의 K₂HPO₄, 1.63 g의 NaH₂PO₄, 2.0 g의 (NH₄)₂SO₄, 0.1 g의 MgCl₂·6H₂O, 10 mg의 EDTA, 2 mg의 ZnSO₄·7H₂O, 1 mg의 CaCl₂·2H₂O, 5 mg의 FeSO₄·7H₂O, 0.2 mg의 Na₂MoO₄·2H₂O, 0.2 mg의 CuSO₄·5H₂O, 0.4 mg의 CoCl₂·6H₂O, 및 1 mg의 MnCl₂·2H₂O. 루리아 브로스(Luria broth)(L-브로스: 10 g/l 박토 트립톤(딥코), 5 g/l 효모 추출물(딥코), 5 g/l NaCl)를 슈도모나스 푸티다 S12 및 유도 균주, 큐프리아비더스 바실렌시스, 메틸로박테리움 라디오톨레란스 및 에스케리키아 콜라이 DH5α 및 유도체의 증식을 위한 완전 배지로 사용하였다. 평판 배양을 위해, L-브로스를 1.5%(w/v)의 아가(딥코)로 고형화시켰다. pJT'mcs 또는 pJNNmcs(t)-유도된 플라스미드를 함유하는 에스케리키아 콜라이 형질전환체의 선별을 위해 암피실린(Amp)을 배지에 100 ㎍/ml로 가하였다. pJT'mcs 또는 pJNNmcs(t)-유도된 플라스미드를 갖는 슈도모나스 푸티다 S12 형질전환체의 선별을 위해 젠타마이신(Gm)을 루리아 브로스에 30 ㎍/ml 및 무기염 배지에 10 ㎍/ml로 가하였다. pBT'mcs-유도된 플라스미드를 갖는 에스케리키아 콜라이 또는 슈도모나스 푸티다 S12 형질전환체의 선별을 위해, 50 ㎍/ml의 카나마이신(Km)을 배지에 가하였다. 항생물질들은 시그마-앨드리치(Sigma-Aldrich)로부터 구입하였다. 슈도모나스 푸티다 , 큐프리아비더스 바 실렌시스 및 메틸로박테리움 라디오톨레란스는 30 ℃에서 배양하였으며; 에스케리키아 콜라이는 37 ℃에서 배양하였다.

슈도모나스 푸티다 S12-유도된 균주를 사용한 유가식 실험을 랩포스(Labfors) 4 바이오리액터 시스템(인포스 베네룩스(Infors Benelux) BV) 또는 바이오플로(BioFlo)110 제어기(뉴 브런스윅 사이언티픽(New Brunswick Scientific))에 의해 제어되는 2-L 용기에서 수행하였다. 가압 공기 또는 순수 산소를 헤드 스페이스에 공급하거나 배양액을 통해 스파징하였다. 온도는 30 ℃에서 조절하였으며, pH는 7.0에서 NH₄OH, NaOH 또는 KOH의 자동 첨가에 의해 7.0에서 유지시켰다. 회분 단계는 균주 특이적 항생물질 및 40 g/l 글리세롤을 보충한 2x MM 배지에서 수행하였다. 고밀도 세포 배양물의 경우, 회분-단계 배지에 10 g/l의 효모 추출물(YE)을 더 보충하였다. 초기 글리세롤의 고갈 후에, 공급(필요한 경우 1 mM의 Na-살리실레이트로 보충된 100 mM MgCl₂ 중 4 또는 8 M 글리세롤)을 시작하고 배양물중 제한 기질로서 글리세롤을 유지하면서 성장하도록 조절하였다. HMF 공급물(탈염수중 4M)을 별도의 공급물 펌프를 통해 공급하고; 사용된 균주 및 연구된 조건에 따라 공급률을 조정하였다. 용존 산소 농도(DO)를 연속적으로 모니터링하고, 교반 속도를 조정하여 충분한 통기를 유지하였다.

분석 및 분석 방법. 세포 건조 중량( CDW ) 측정: 평저 96-웰 마이크로플레이트(그레이너(Greiner))를 사용하여, 바이오웨이브 세포 밀도 계측기(Biowave Cell Density Meter)(더블유피에이 리미티드(WPA Ltd)) 또는 마이크로퀀트(μQuant) MQX200 일반 마이크로플레이트 분광광도계(바이오테크(Biotek))를 사용하여 600 nm에서 흡광도(OD₆₀₀)를 측정함으로써 박테리아 배양물의 CDW 함량을 측정하였다. 1.0의 OD₆₀₀은 슈도모나스 푸티다의 경우 0.56 g CDW/L(바이오웨이브) 또는 1.4 g CDW/L(마이크로퀀트)에 상응한다.

HPLC 분석: 푸란 화합물(FDCA, HMF, HMF-알콜, HMF-산 및 FFA)을 문헌[Koopman et al., Identification and characterization of the furfural and 5-(hydroxymethyl)furfural degradation pathways of Cupriavidus basilensis HMF14, PNAS, Vol. 107, p.4919-4924 (2010a)]에 기술된 바와 같이 RP-HPLC로 분석하였다. 당, 알콜 및 유기산도 또한 굴절률(RI) 검출기를 사용하여 HPLC(에이질런트(Agilent) 1100 시스템)로 분석하였다. 사용된 컬럼은 0.6 ml/분의 유량에서 용출제로서 5 mM H₂SO₄를 사용하는 바이오-래드 아미넥스(Bio-Rad Aminex) HPX-87H(300 x 7.8 mm, 수소 형태, 9 ㎛ 입자 크기, 8% 가교 결합, pH 범위 1 내지 3)였다.

화학물질

HMF는 시그마(Sigma), 유로랩스 리미티드(Eurolabs Ltd)(영국 포인튼) 또는 요어 케미팜 캄파니 리미티드(Yore Chemipharm Co. Ltd.)(중국 닝보)에서 구입하였다. FDCA 및 5-하이드록시메틸-푸로산(HMF 산)의 분석용 표준물은 각각 임뮤노소스(Immunosource) B.V.(벨기에 할레-주르셀), 매트릭스 사이언티픽(Matrix Scientific)(미국 사우스캐롤라이나 컬럼비아)에서 구입하였다. 모든 다른 화학물질은 시그마-앨드리치 케미(Sigma-Aldrich Chemie) B.V.(네덜란드 즈빈드레비치)에서 구입하였다.

분자 및 유전 기술: 게놈 DNA를 디엔이지(DNeasy) 조직 키트(키아겐(QIAGEN))를 사용하여 큐프리아비더스 바실렌시스 HMF14 및 메틸로박테리움 라디오톨레란스 JCM 2831로부터 단리하였다. 플라스미드 DNA는 키아프레프(QIAprep) 스핀 미니프레프 키트(키아겐)를 사용하여 단리하였다. 아가로스-포획된 DNA 단편은 키아엑스II(QIAEXII) 겔 추출 키트(키아겐)를 사용하여 단리하였다.

PCR 반응은 제조사의 지시에 따라 어큐프라임(Accuprime) Pfx 폴리머라제(인비트로겐)를 사용하여 수행하였다. 올리고뉴클레오티드 프라이머(실시예에서 명시됨)는 MWG 바이오테크 AG(독일)에 의해 합성하였다. 플라스미드 DNA는 진 펄서(Gene Pulser) 전기천공 장치(바이오래드)를 사용하여 일렉트로컴피턴트(electrocompetent) 세포 내에 도입하였다. 다른 표준 분자 생물 기술은 문헌[Sambrook and Russell, Molecular cloning - a laboratory manual. Third edition. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY (2001)]에 따라 수행하였다.

실시예 I: HmfH 및 HmfT1 의 동시-발현은 슈도모나스 푸티다 S12 에서 FDCA 생성을 개선시킨다

hmfT1 유전자(이전에 mfs1로 지칭됨(문헌[Koopman et al., Identification and characterization of the furfural and 5-(hydroxymethyl)furfural degradation pathways of Cupriavidus basilensis HMF14, PNAS, Vol. 107, p.4919-4924 (2010a)]); 서열번호 7)를, 프라이머 hmfT1(f)(서열번호 13) 및 hmfT1(r)(서열번호 14)을 사용하여 PCR에 의해 큐프리아비더스 바실렌시스 HMF14의 게놈 DNA로부터 증폭시켰다. 이의 천연 리보솜 결합 부위(RBS)를 포함하는 hmfH 유전자(서열번호 11)는 프라이머 FN23(서열번호 15) 및 FN24(서열번호 16)를 사용하여 큐프리 아비더스 바실렌시스 HMF14의 게놈 DNA로부터 PCR에 의해 증폭시켰다. PCR 산물을 pBT'mcs에 1777-bp EcoRI 단편으로 클로닝하여 플라스미드 pBT'hmfH를 수득하였다. 플라스미드 pBT'hmfH 및 pJNNhmfT1(t)를 연속적으로 슈도모나스 푸티다 S12 내에 도입하여 슈도모나스 푸티다 S12_B38을 수득하였다.

슈도모나스 푸티다 S12_B38을 일반적 방법 부분에서 기술한 바와 같이 유가식으로 배양하였다. 회분 단계에서, 약 3 g CDW/l의 세포 밀도를 달성한 후 글리세롤 공급 및 HMF 공급을 개시하였다. HmfT1을 발현하지 않는 슈도모나스 푸티다 S12_2642(슈도모나스 푸티다 S12_hmfH(문헌[Koopman et al., Efficient whole-cell biotransformation of 5-(hydroxymethyl)furfural into FDCA, 2,5-furandicarboxylic acid. Bioresour. Technol., Vol. 101, p.6291-6296 (2010b)])와 유사함)를 사용하여 대조군 유가식 배양을 수행하였다.

도 2는 슈도모나스 푸티다 균주 S12_2642 및 S12_B38의 HMF-공급 배양물 중 FDCA 및 HMF-산의 농도를 나타낸 것이다. HMF-산의 대규모 축적이 슈도모나스 푸티다 S12_2642에서 명백하다. 대조적으로, 슈도모나스 푸티다 S12_B38 배양물에서 HMF-산 축적은 미미하다. 감소된 HMF-산 축적은 HFM 공급률을 더 증가시켰으며, 이에 의해 훨씬 더 짧은 공정 시간에 더 높은 FDCA 역가가 야기되었다. 이것은 또한 시험 균주에 대한 FDCA 비생산성에서 명백히 반영되었다(도 3).

실시예 II : HmfH 및 메틸로박테리움 라디오톨레란스 JCM 2831로부터의 폴리펩티드의 동시-발현은 슈도모나스 푸티다 S12 에서 FDCA 생성을 개선시킨다

유전자좌 표지 mrad2831 _4728을 갖는 유전자(서열번호 9)를, 프라이머 Mrad(f)(서열번호 17) 및 Mrad(r)(서열번호 18)을 사용하여 PCR에 의해 메틸로박 테리움 라디오톨레란스 JCM2831의 게놈 DNA로부터 증폭시켰다. PCR 산물을 pJNNmcs(t)에 1381-bp EcoRI-NheI 단편으로 도입하여 pJNN_Mrad(t)를 수득하였다. 플라스미드 pBT'hmfH(실시예 I 참조) 및 pJNN_Mrad(t)를 연속적으로 슈도모나스 푸 티다 S12 내에 도입하여 슈도모나스 푸티다 S12_B51을 수득하였다.

슈도모나스 푸티다 S12_B51을 진탕 플라스크에서 1 g/l 효모 추출물, 80 mM 글리세롤, 2 mM 글루코스, 100 μM Na-살리실레이트, 50 ㎍/ml 카나마이신 및 10 ㎍/ml 젠타마이신으로 보충된 무기염 배지(4x 완충액 농도) 상에서 배양하였다. 대조군 균주로서, 슈도모나스 푸티다 S12_B38을 사용하였다(실시예 I 참조). 밤새 배양한 후에, 배양물에 80 mM 글리세롤 및 100 μM Na-살리실레이트를 보충하였다. 이어서, 약 10 mM HMF를 가하고 FDCA 생산을 평가하였다.

도 4는 FDCA 생성시 HMF-산 축적이 두 균주 모두에서 미미하여 HmfT1 및 Mrad2831_4728 폴리펩티드가 유사한 기능을 나타냄을 보여준다. 슈도모나스 푸티 다 S12_B38의 경우, FDCA 생성은 더 긴 유도기(lag phase)와 다소 더 느린 속도를 나타내었으며, 이것은 더 낮은 초기 바이오매스 밀도에 기인할 수 있다(도 4a). 그러나, 최대 FDCA 비생산성은 두 균주 모두에 대해 동일하여, 즉, 2.36 밀리몰 FDCA/(g CDW, h)이어서, Mrad2831_4728 및 HmfT1 폴리펩티드가 HMF-산 축적을 최소화하고 FDCA 생산을 최대화하는데 동일하게 효과적이었음을 시사한다.

실시예 III : HmfH 및 HmfT1 을 동시-발현하는 슈도모나스 푸티다 S12 에 의한 고수준 HMF -산 전환 능력

실시예 I에서 입증된 바와 같이, 슈도모나스 푸티다 S12에서 HmfH 및 HmfT1의 동시-발현은 HMF를 FDCA로 산화시키는 특정 능력을 상당히 개선시켰다. 상기 개선된 능력을 최적으로 사용하기 위해, 슈도모나스 푸티다 S12_B38을 사용하여 고 바이오매스 밀도에서 출발하여 유가식 실험을 수행하였다.

슈도모나스 푸티다 S12_B38의 산화 능력을 최대화시키고 HMF 및 HMF-산의 축적을 유발하기 위해 HMF 공급을 높은 공급률(20 ml/h; 4 M HMF 공급 용액)에서 개시하였다(도 5). HMF-산이 약 20 mM로 축적되었을 때, HMF 공급률을 5 ml/h로 저하시키고 푸란 농도를 모니터링하였다. 초기에, HMF-산 농도는 잔류 축적된 HMF의 산화로 인해 약 37 mM로 증가되었으며, 그 후에 0.72 밀리몰/(g CDW.h)의 HMF 공급률에서, 5 시간 이내에 2 mM 미만으로 저하되었다.

상기 결과들은 HMF-산 산화 능력이 HmfH 및 HmfT1의 동시-발현에 의해 개선되었음을 명백하게 나타낸다. 문헌[Koopman et al., Efficient whole-cell biotransformation of 5-(hydroxymethyl)furfural into FDCA, 2,5-furandicarboxylic acid, Bioresour. Technol., Vol. 101, p.6291-6296 (2010b)]의 결과는, 슈도모나스 푸티다 S12_hmfH(HmfT1이 결여됨)가 훨씬 더 낮은 HMF 공급률(0.09 밀리몰/(g CDW.h))에서 50 시간동안 HMF-산 농도를 약 50 mM로부터 5 mM 미만으로 감소시켜야 함을 나타내었다. 개선된 HMF-산 산화 능력은 훨씬 더 높은 최종 FDCA 역가(상기 문헌[Koopman et al., (2010b)]에 의하면 152 g/l 대 30.1 g/l)를 야기하였으며, 이것은 또한 더 짧은 공정 시간(상기 문헌[Koopman et al., (2010b)]에 의하면 94 시간 대 115 시간)에 달성되었다.

실시예 IV : 큐프리아비더스 바실렌시스 HMF 14로부터의 HmfH , HmfT1 및 알데 하이드 데하이드로게나제의 동시-발현은 슈도모나스 푸티다 S12 에서 FDCA 의 생성을 개선시킨다

큐프리아비더스 바실렌시스 HMF14에서 HMF-분해 오페론과 관련된 알데하이드 데하이드로게나제를 암호화하는 유전자(서열번호 26; 번역된 아미노산 서열: 서열번호 19)(문헌[Wierckx et al., Microbial degradation of furanic compounds: biochemistry, genetics and impact. Appl Microbiol Biotechnol 92:1095-1105 (2011)])를 프라이머 FN13(서열번호 33) 및 FN14(서열번호 34)를 사용하여 PCR에 의해 증폭시켰다. PCR 산물을 Bsp120I-절단된(NotI과 상용가능) pBT'hmfH(실시예 I 참조)에 1543-bp NotI 단편으로 도입하여 pBT'hmfH-adh를 수득하였다. 알데하이드 데하이드로게나제 암호화 유전자가 정방향(f) 배향으로 존재하는 플라스미드 변이체(pBT'hmfH-adh(f)) 및 pJNNhmfT1(t)(실시예 I 참조)를 연속적으로 슈도모나스 푸 티다 S12 내에 도입하였다. 수득된 균주 슈도모나스 푸티다 S12_B97은 HmfH, HmfT1 및 알데하이드 데하이드로게나제를 동시-발현하였다. HmfH 옥시도리덕타제와 알데하이드 데하이드로게나제의 동시-발현을 위한 대조군 균주(즉, HMF-산 운반체 HmfT1 비함유)로서, pBT'hmfH-adh(f) 만을 함유한 슈도모나스 푸티다 S12_B101을 제작하였다. 슈도모나스 푸티다 S12_B38(실시예 I 참조)을 알데하이드 데하이드로게나제 없이 HmfT1 및 HmfH의 동시-발현을 위한 대조군 균주로 사용하였다.

슈도모나스 푸티다 S12_B, S12_B97 및 S12_B101을 진탕 플라스크에서 1 g/l 효모 추출물, 80 mM 글리세롤, 2 mM 글루코스, 50 ㎍/ml 카나마이신 및 10 ㎍/ml 젠타마이신으로 보충된 무기염 배지(4x 완충액 농도) 상에서 배양하였다(주: 균주 B101의 경우, 카나마이신만 첨가). 예비배양물에만 hmfT1의 유도를 위해 Na-살리실레이트(1 μM)를 첨가하였다. 약 10 mM HMF의 첨가 후에, FDCA 및 HMF-산의 축적을 평가하였다.

HmfH(옥시도리덕타제) 및 HmfT1(HMF-산 운반체)을 동시-발현한 균주(균주 S12_B38; 도 6a)에서, FDCA 생성은 FFA가 실질적인 수준으로 축적된 후에만 시작되었다. HMF 산은, 앞에서 관찰된 바와 같이(실시예 II 참조), 일시적으로 소량으로 축적되었다. 알데하이드 데하이드로게나제가 HmfH 및 HmfT1과 동시-발현되었을 때(균주 S12_B97; 도 6b), FDCA 생성은 지연되지 않고 시작되었으며, FFA 및 HMF-산은 둘 다 미량으로만 관찰되었다. HmfT1 없이 알데하이드 데하이드로게나제와 HmfH의 동시-발현(균주 S12_B101; 도 6c)은 HMF-산의 대규모 축적을 야기한 반면, 소량의 FFA와 FDCA 만이 생성되었다.

결과들은 HMF의 HMF-산으로의 산화가 알데하이드 데하이드로게나제를 발현시킴으로써 상당히 증대됨을 나타내었다. 그러나, HmfT1은 생성된 HMF-산의 효과적인 생물전환을 가능케 하기 위해 동시-발현되어야만 한다. 알데하이드 데하이드로게나제는 중간 생성물 FFA의 FDCA로의 산화를 더 개선시켰다. 따라서, 알데하이드 데하이드로게나제와 HmfT1의 동시 발현이 HMF의 HMF-산을 거쳐 최종 생성물로의 산화에 대한 전체적 가능성 및 상기 산화의 속도를 상당히 개선시킨다.

참고문헌

SEQUENCE LISTING <110> Purac Biochem B.V. <120> GENETICALLY MODIFIED CELL AND PROCESS FOR USE OF SAID CELL <130> 1.848.001 WO <140> PCT/NL2012/050141 <141> 2012-03-07 <150> NL2006359 <151> 2011-03-08 <160> 34 <170> PatentIn version 3.5 <210> 1 <211> 441 <212> PRT <213> Cupriavidus basilensis HMF14 <400> 1 Met Glu Ala Val Ala Lys Lys Arg Thr Glu Thr Ile Ser Glu Ala Leu 1 5 10 15 Pro Ala Ala Thr Asn Arg Gln Val Phe Gly Ala Val Thr Ala Ser Cys 20 25 30 Met Gly Trp Ala Leu Asp Leu Phe Asp Leu Phe Ile Leu Leu Phe Val 35 40 45 Ala Pro Val Ile Gly Arg Leu Phe Phe Pro Ser Glu His Ala Met Leu 50 55 60 Ser Leu Ala Ala Val Tyr Ala Ser Phe Ala Val Thr Leu Leu Met Arg 65 70 75 80 Pro Leu Gly Ser Ala Ile Phe Gly Thr Tyr Ala Asp Arg His Gly Arg 85 90 95 Lys Gly Ala Met Val Val Ala Val Thr Gly Val Gly Leu Ser Thr Ala 100 105 110 Ala Phe Gly Leu Leu Pro Thr Val Gly Gln Val Gly Leu Leu Ala Pro 115 120 125 Ala Leu Phe Ile Leu Leu Arg Leu Val Gln Gly Ile Phe Val Gly Gly 130 135 140 Val Val Ala Ser Thr His Thr Ile Gly Thr Glu Ser Val Pro Pro Ser 145 150 155 160 Trp Arg Gly Ala Val Ser Gly Leu Val Gly Gly Gly Gly Ala Gly Ile 165 170 175 Gly Ala Leu Leu Ala Ser Ile Thr Tyr Met Ala Met Thr Ala Leu Phe 180 185 190 Pro Gly Glu Ala Phe Asp Ala Trp Gly Trp Arg Cys Met Phe Phe Ser 195 200 205 Gly Ile Ile Ser Ser Val Leu Gly Leu Phe Ile Phe Asn Ser Leu Glu 210 215 220 Glu Ser Pro Leu Trp Lys Gln Leu Gln Ala Ala Lys Gly His Ala Ala 225 230 235 240 Pro Val Glu Asn Pro Leu Arg Val Ile Phe Ser Arg Gln Tyr Arg Gly 245 250 255 Val Leu Phe Val Asn Ile Leu Leu Thr Val Gly Gly Gly Ser Ala Tyr 260 265 270 Tyr Leu Thr Ser Gly Tyr Leu Pro Thr Phe Leu Lys Val Val Val Lys 275 280 285 Ala Pro Ala Gly Ala Ser Ala Ala Ile Leu Met Ala Ser Ser Val Gly 290 295 300 Val Ile Val Ala Ser Ile Ile Ala Gly His Leu Ser Thr Leu Ile Gly 305 310 315 320 Arg Lys Arg Ala Phe Leu Leu Ile Gly Ala Leu Asn Val Val Leu Leu 325 330 335 Pro Leu Ile Tyr Gln Arg Met Pro Ala Ala Pro Asp Val Thr Thr Leu 340 345 350 Gly Ile Tyr Ala Val Ala Leu Ala Met Leu Gly Ser Thr Gly Phe Ala 355 360 365 Pro Ile Leu Ile Phe Leu Asn Glu Arg Val Ser His Gln His Pro Cys 370 375 380 Tyr Gly Asn Trp Pro Val Met Glu Tyr Arg Leu Cys His Arg Arg His 385 390 395 400 Asp Ala Thr Phe Ala Ser Leu Cys Ala Ala Pro Pro Arg Leu Pro Lys 405 410 415 Cys Trp Gly Ser Arg Arg Gly Val Lys Ala Phe Thr Ala Gly Ala Ala 420 425 430 Ile Val Trp Asn Ala Pro Leu Gly Glu 435 440 <210> 2 <211> 449 <212> PRT <213> Cupriavidus basilensis HMF14 <400> 2 Met Glu Ala Val Ala Lys Lys Ser Ala Ala Thr Ile Ser Glu Ala Leu 1 5 10 15 Pro Ala Ala Ser Asn Arg Gln Val Phe Gly Ala Val Ala Ala Ser Cys 20 25 30 Met Gly Trp Ala Leu Asp Leu Phe Asp Leu Phe Ile Leu Leu Phe Val 35 40 45 Ala Pro Val Ile Gly Arg Leu Phe Phe Pro Ser Glu His Ala Met Leu 50 55 60 Ser Leu Ala Ala Val Tyr Ala Ser Phe Ala Val Thr Leu Leu Met Arg 65 70 75 80 Pro Leu Gly Ser Ala Ile Phe Gly Ser Tyr Ala Asp Arg His Gly Arg 85 90 95 Lys Gly Ala Met Val Val Ala Val Thr Gly Val Gly Leu Ser Thr Ala 100 105 110 Ala Phe Gly Leu Leu Pro Thr Val Gly Gln Val Gly Leu Leu Ala Pro 115 120 125 Ala Leu Phe Ile Leu Leu Arg Leu Val Gln Gly Ile Phe Val Gly Gly 130 135 140 Val Val Ala Ser Thr His Thr Ile Gly Thr Glu Ser Val Pro Pro Ser 145 150 155 160 Trp Arg Gly Ala Val Ser Gly Leu Val Gly Gly Gly Gly Ala Gly Leu 165 170 175 Gly Ala Leu Leu Ala Ser Ile Thr Tyr Met Ala Met Thr Ala Leu Phe 180 185 190 Pro Gly Glu Ala Phe Asp Ala Trp Gly Trp Arg Cys Met Phe Phe Ser 195 200 205 Gly Ile Ile Ser Ser Val Leu Gly Leu Phe Ile Phe Asn Ser Leu Glu 210 215 220 Glu Ser Pro Leu Trp Lys Gln Leu Gln Ala Ala Lys Gly His Ala Ala 225 230 235 240 Pro Val Glu Asn Pro Leu Arg Val Ile Phe Ser Arg Gln Tyr Arg Gly 245 250 255 Val Leu Phe Val Asn Ile Leu Leu Thr Val Gly Gly Gly Ser Ala Tyr 260 265 270 Tyr Leu Thr Ser Gly Tyr Leu Pro Thr Phe Leu Lys Val Val Val Lys 275 280 285 Ala Ser Ala Gly Glu Ser Ala Ala Ile Leu Met Ala Ser Ser Leu Gly 290 295 300 Val Ile Val Ala Ser Ile Leu Ala Gly His Leu Ser Thr Met Ile Gly 305 310 315 320 Arg Lys Arg Ala Phe Leu Leu Ile Gly Ala Leu Asn Val Val Val Leu 325 330 335 Pro Leu Leu Tyr Gln Trp Met Pro Ala Ala Pro Asp Thr Thr Thr Leu 340 345 350 Gly Leu Tyr Ala Val Val Leu Ser Met Leu Gly Cys Ser Gly Phe Ala 355 360 365 Pro Ile Leu Ile Phe Leu Asn Glu Arg Phe Pro Thr Ser Ile Arg Ala 370 375 380 Thr Gly Thr Gly Leu Ser Trp Asn Ile Gly Phe Ala Val Gly Gly Met 385 390 395 400 Met Pro Thr Phe Ala Ser Leu Cys Ala Ser Thr Pro Ala Glu Leu Pro 405 410 415 Met Val Leu Gly Ile Phe Leu Ala Val Val Thr Ile Ile Tyr Leu Val 420 425 430 Gly Ala Phe Ile Val Pro Glu Thr Val Gly Arg Leu Gly Asp Asn Gly 435 440 445 Ala <210> 3 <211> 449 <212> PRT <213> Methylobacterium radiotolerans JCM2831 <400> 3 Met Gln Thr Ala Ala Thr Phe Ala Ser Asp Pro Pro Ala Leu Ala Lys 1 5 10 15 Pro Thr Gly Arg Gln Thr Val Thr Ala Ala Met Ala Ser Leu Phe Gly 20 25 30 Trp Gly Leu Asp Leu Phe Asp Leu Phe Ile Leu Leu Tyr Val Ala Pro 35 40 45 Val Val Gly Thr Leu Phe Phe Pro Ala Asp Lys Pro Met Leu Ser Leu 50 55 60 Ala Gly Ala Tyr Ala Ser Phe Ala Val Thr Leu Leu Ile Arg Pro Leu 65 70 75 80 Gly Ser Ala Leu Phe Gly Ser Tyr Ala Asp Arg Phe Gly Arg Arg Arg 85 90 95 Ala Leu Met Val Ala Val Val Gly Val Gly Ile Ser Thr Ala Val Phe 100 105 110 Gly Leu Leu Pro Thr Val Gly Gln Ile Gly Trp Leu Ala Thr Ala Val 115 120 125 Phe Leu Phe Phe Arg Leu Val Gln Gly Ile Phe Val Gly Gly Val Val 130 135 140 Ala Ala Ser His Thr Ile Gly Thr Glu Ser Val Pro Glu Arg Trp Arg 145 150 155 160 Gly Leu Met Ser Gly Ala Val Gly Gly Gly Gly Ser Ala Ile Gly Gly 165 170 175 Leu Leu Ala Ser Leu Val Phe Tyr Val Val Ser Leu Met Ala Pro Gly 180 185 190 Glu Ala Phe Ala Glu Trp Gly Trp Arg Leu Met Phe Phe Ser Gly Leu 195 200 205 Leu Thr Ser Val Ile Gly Leu Ile Leu Phe Arg Asn Leu Glu Glu Ser 210 215 220 Pro Ile Phe Lys Glu Leu Gln Ala Arg Lys Ala Ala Leu Arg Ala Gly 225 230 235 240 Ala Pro Ala Glu Ala Ser Pro Ile Arg Ser Leu Phe Ser Pro Ser Asn 245 250 255 Arg Gly Ser Phe Ala Val Ala Thr Leu Ile Ser Phe Gly Gly Gly Ala 260 265 270 Ala Tyr Tyr Leu Thr Ser Gly Tyr Leu Pro Thr Leu Leu Lys Leu Val 275 280 285 Asn Gly Val Pro Asn Ala Thr Ala Ser Met Ile Leu Ile Gly Ala Asn 290 295 300 Val Ala Ala Ala Ile Gly Ala Cys Gly Met Gly Glu Leu Ser Gln His 305 310 315 320 Ile Gly Arg Lys Arg Ser Phe Leu Leu Met Gly Val Ile Arg Leu Leu 325 330 335 Ala Phe Pro Ala Leu Phe Leu Thr Met Ala Asn Thr Thr Ser Leu Val 340 345 350 Gly Val Ala Ala Cys Ala Phe Leu Leu Ala Leu Ile Ala Asn Gly Ser 355 360 365 Tyr Gly Pro Leu Leu Ile Phe Leu Asn Glu Lys Phe Pro Thr Ala Val 370 375 380 Arg Ala Thr Gly Thr Gly Leu Thr Trp Asn Ile Gly Phe Ala Leu Gly 385 390 395 400 Gly Met Leu Pro Thr Leu Val Ser Leu Val Ala Asp Gly Pro Thr Gln 405 410 415 Ile Pro Met Val Leu Ala Val Ile Thr Thr Gly Val Thr Leu Val Tyr 420 425 430 Leu Val Gly Ala Phe Leu Thr Asp Glu Thr Gln Gly Asn Leu Asp Arg 435 440 445 Ala <210> 4 <211> 443 <212> PRT <213> Sulfolobus acidocaldarius DSM 639 <400> 4 Met Lys Lys Glu Glu Lys Phe Thr Ser Asn His Phe Lys Trp Thr Leu 1 5 10 15 Ala Thr Phe Phe Thr Trp Thr Phe Asp Leu Tyr Asp Leu Phe Thr Ile 20 25 30 Leu Leu Val Ala Pro Tyr Ile Ser Ser Leu Phe Phe Pro Ser Ser Ile 35 40 45 Thr Phe Leu Ser Ile Ala Ala Thr Tyr Ala Gly Phe Ala Thr Ser Leu 50 55 60 Ile Met Arg Pro Val Gly Ala Thr Val Phe Gly Ser Arg Val Ser Asp 65 70 75 80 Lys Val Gly Arg Lys Arg Ala Ile Phe Tyr Gly Leu Ile Gly Leu Val 85 90 95 Ile Thr Ser Thr Leu Gln Gly Ala Leu Pro Thr Tyr Gln Val Val Gly 100 105 110 Val Ile Ala Pro Ile Leu Leu Leu Ala Val Arg Leu Ile Gln Gly Val 115 120 125 Phe Ile Gly Gly Ile Thr Ala Gly Ser His Val Ile Gly Pro Glu Ser 130 135 140 Val Pro Glu Arg Tyr Arg Gly Ile Val Gly Gly Leu Gly Phe Ser Ala 145 150 155 160 Ala Gly Val Ala Tyr Leu Ile Ala Ala Gly Trp Phe Phe Leu Thr Thr 165 170 175 Ile Leu Tyr Pro Gly Ser Ser Tyr Leu Val Trp Gly Trp Arg Val Met 180 185 190 Phe Phe Gly Gly Leu Leu Ser Leu Ala Val Leu Gly Phe Val Asn Tyr 195 200 205 Leu Val Pro Glu Ser Glu Val Trp Thr Lys Ile Lys Lys Arg Gly Ser 210 215 220 Val Val Lys Ser Pro Leu Lys Glu Ile Phe Ser Lys Tyr Arg Tyr Gln 225 230 235 240 Leu Gly Val Ala Leu Leu Leu Ser Ile Gly Trp Gly Ala Ser Phe Tyr 245 250 255 Val Thr Asp Gly Ile Leu Pro Thr Phe Leu Ser Ser Val Asn Lys Leu 260 265 270 Ala Lys Thr Glu Ile Ala Ile Val Met Ile Ile Gly Ser Ile Gly Met 275 280 285 Ser Ile Gly Pro Leu Ile Gly Gly Glu Ile Ser Gln Ile Ile Gly Arg 290 295 300 Lys Ile Thr Ser Leu Ile Gly Ala Ile Ile Val Leu Ala Val Val Gly 305 310 315 320 Pro Leu Phe Leu Ser Leu Gly Ser Leu Lys Ser Gly Asp Leu Asn Gln 325 330 335 Ile Ile Leu His Ser Phe Ala Ile Leu Phe Leu Val Asp Ile Gly Gly 340 345 350 Gly Met Leu Met Thr Tyr Leu Asn Glu Ile Tyr Pro Ala Ser Val Arg 355 360 365 Gly Thr Gly Val Gly Phe Thr Trp Asn Thr Gly Phe Ala Ile Gly Gly 370 375 380 Thr Ile Pro Thr Ile Ile Ser Leu Ala Val Ala Ser Ala Gly Leu Ser 385 390 395 400 Ala Phe Pro Ser Ile Met Phe Tyr Thr Leu Ile Val Val Ser Val Ile 405 410 415 Ile Leu Val Gly Thr Val Leu Thr Lys Glu Thr Lys Gly Thr Ile Ser 420 425 430 Lys Glu Glu Tyr Glu Ile Gln Lys Glu Thr Leu 435 440 <210> 5 <211> 579 <212> PRT <213> Cupriavidus basilensis HMF14 <400> 5 Met Asp Thr Pro Arg Glu Arg Phe Asp Tyr Val Ile Val Gly Gly Gly 1 5 10 15 Ser Ala Gly Cys Val Leu Ala Asn Arg Leu Ser Gln Asp Pro Ala Ile 20 25 30 Arg Val Ala Leu Ile Glu Ala Gly Val Asp Thr Pro Pro Asp Ala Val 35 40 45 Pro Ala Glu Ile Leu Asp Ser Tyr Pro Met Pro Leu Phe Phe Gly Asp 50 55 60 Arg Tyr Ile Trp Pro Ser Leu Gln Ala Arg Ala Val Ala Gly Gly Arg 65 70 75 80 Ser Lys Val Tyr Glu Gln Gly Arg Val Met Gly Gly Gly Ser Ser Ile 85 90 95 Asn Val Gln Ala Ala Asn Arg Gly Leu Pro Arg Asp Tyr Asp Glu Trp 100 105 110 Ala Ala Ser Gly Ala Ser Gly Trp Ser Trp Gln Asp Val Leu Pro Tyr 115 120 125 Phe Arg His Leu Glu Arg Asp Val Asp Tyr Gly Asn Ser Pro Leu His 130 135 140 Gly Ser His Gly Pro Val Pro Ile Arg Arg Ile Leu Pro Gln Ala Trp 145 150 155 160 Pro Pro Phe Cys Thr Glu Phe Ala His Ala Met Gly Arg Ser Gly Leu 165 170 175 Ser Ala Leu Ala Asp Gln Asn Ala Glu Phe Gly Asp Gly Trp Phe Pro 180 185 190 Ala Ala Phe Ser Asn Leu Asp Asp Lys Arg Val Ser Thr Ala Ile Ala 195 200 205 Tyr Leu Asp Ala Asp Thr Arg Arg Arg Ala Asn Leu Arg Ile Tyr Ala 210 215 220 Glu Thr Thr Val Arg Lys Leu Val Val Ser Gly Arg Glu Ala Arg Gly 225 230 235 240 Val Ile Ala Met Arg Ala Asp Gly Ser Arg Leu Ala Leu Asp Ala Gly 245 250 255 Glu Val Ile Val Ser Ala Gly Ala Leu Gln Ser Pro Ala Ile Leu Met 260 265 270 Arg Ala Gly Ile Gly Asp Ala Gly Ala Leu Gln Ala Leu Gly Ile Glu 275 280 285 Val Val Ala Asp Arg Pro Gly Val Gly Arg Asn Leu Gln Asp His Pro 290 295 300 Ala Leu Thr Phe Cys Gln Phe Leu Ala Pro Gln Tyr Arg Met Pro Leu 305 310 315 320 Ser Arg Arg Arg Ala Ser Met Thr Ala Ala Arg Phe Ser Ser Gly Val 325 330 335 Pro Gly Gly Glu Ala Ser Asp Met Tyr Leu Ser Ser Ser Thr Arg Ala 340 345 350 Gly Trp His Ala Leu Gly Asn Arg Leu Gly Leu Phe Phe Leu Trp Cys 355 360 365 Asn Arg Pro Phe Ser Arg Gly Gln Val Ser Leu Ala Gly Ala Gln Pro 370 375 380 Asp Val Pro Pro Met Val Glu Leu Asn Leu Leu Asp Asp Glu Arg Asp 385 390 395 400 Leu Arg Arg Met Val Ala Gly Val Arg Lys Leu Val Gln Ile Val Gly 405 410 415 Ala Ser Ala Leu His Gln His Pro Gly Asp Phe Phe Pro Ala Thr Phe 420 425 430 Ser Pro Arg Val Lys Ala Leu Ser Arg Val Ser Arg Gly Asn Val Leu 435 440 445 Leu Thr Glu Leu Leu Gly Ala Val Leu Asp Val Ser Gly Pro Leu Arg 450 455 460 Arg Ser Leu Ile Ala Arg Phe Val Thr Gly Gly Ala Asn Leu Ala Ser 465 470 475 480 Leu Leu Thr Asp Glu Ser Ala Leu Glu Gly Phe Val Arg Gln Ser Val 485 490 495 Phe Gly Val Trp His Ala Ser Gly Thr Cys Arg Met Gly Ala His Ala 500 505 510 Asp Arg Ser Ala Val Thr Asp Ala Ala Gly Arg Val His Asp Val Gly 515 520 525 Arg Leu Arg Val Ile Asp Ala Ser Leu Met Pro Arg Leu Pro Thr Ala 530 535 540 Asn Thr Asn Ile Pro Thr Ile Met Leu Ala Glu Lys Ile Ala Asp Thr 545 550 555 560 Met Gln Ala Glu Arg Arg Ala Val Arg Pro Ala Ser Ser Glu Val Ala 565 570 575 His Pro Ser <210> 6 <211> 564 <212> PRT <213> Bradyrhizobium japonicum USDA 110 <400> 6 Met Tyr Asp Tyr Ile Ile Val Gly Gly Gly Ser Ala Gly Ser Val Leu 1 5 10 15 Ala His Arg Leu Ser Ala Lys Ser Ala Asn Lys Val Leu Leu Cys Glu 20 25 30 Ala Gly Gln Asp Thr Pro Pro Gly Asn Glu Pro Ala Glu Ile Arg Asp 35 40 45 Ser Tyr Pro Gly Thr Ala Tyr Phe Asp Pro Arg Phe His Trp Thr Glu 50 55 60 Leu Lys Val Thr Thr Gln Val Val Ser His Asn Asn Pro Thr Glu Ala 65 70 75 80 Arg Pro Pro Leu Arg Lys Tyr Glu Gln Ala Arg Val Leu Gly Gly Gly 85 90 95 Ser Ser Ile Asn Gly Gln Met Ala Asn Arg Gly Ala Pro Thr Asp Tyr 100 105 110 Asp Glu Trp Asp Ala Arg Gly Ala Glu Gly Trp Thr Trp Asn Asp Val 115 120 125 Leu Pro Phe Phe Lys Lys Val Glu Arg Asp Leu Asp Phe Asp Gly Pro 130 135 140 Tyr His Gly Lys Asp Gly Arg Ile Pro Val Arg Arg Ile Pro Arg Glu 145 150 155 160 His Trp Thr Arg His Ser Gln Ala Phe Ala Asp Ala Phe Gln Gln Ala 165 170 175 Gly His Gln Phe Val Ala Asp Gln Asn Gly Glu Phe Val Asp Gly Tyr 180 185 190 Phe Ala Val Thr His Ser Asn Gln Ala Glu Gln Arg Val Ser Ala Ala 195 200 205 Met Gly Tyr Leu Asp Arg Asp Thr Arg Lys Arg Ala Asn Leu Thr Ile 210 215 220 Ser Thr Asn Thr Gln Val Arg Glu Leu Leu Phe Glu Gly Thr Gln Cys 225 230 235 240 Val Gly Val Lys Ala Arg Val Asp Gly Arg Glu Gln Glu Phe Arg Gly 245 250 255 Arg Glu Ile Ile Leu Ser Ser Gly Ala Ile His Ser Pro Ala His Leu 260 265 270 Leu Arg Ala Gly Ile Gly Pro Val Gly His Leu Lys Asp Met Gly Ile 275 280 285 Pro Val Leu Thr Gly Leu Pro Gly Val Gly Gln Arg Leu Met Asp His 290 295 300 Pro Ser Ile Ser Leu Ser Ser Phe Val Arg Arg Gly Ala Arg Met Asn 305 310 315 320 Glu His Thr Arg Arg His Met Gln Leu Gly Leu Arg Tyr Ser Ser Gly 325 330 335 Leu Ser Gly Val Pro Lys Gly Asp Met Phe Val Val Val Leu Ser Lys 340 345 350 Ser Ala Trp His Ala Val Gly Ala Gln Ile Gly Ser Leu Leu Thr Phe 355 360 365 Val Asn Lys Thr Tyr Ser Glu Thr Gly Gln Val Lys Leu Ala Ser Arg 370 375 380 Asp Pro Ser Ala Glu Pro Ile Val Glu Phe Asn Leu Leu Ser Asp Arg 385 390 395 400 Arg Asp Leu Asp Arg Leu Met Ser Gly Phe Arg Lys Met Ala Ala Val 405 410 415 Gln Met Ser Glu Ile Val Arg Lys Val Thr Asp Lys Pro Phe Pro Ala 420 425 430 Ala Tyr Thr Asp Lys Val Arg Lys Ile Gly Val Val Asn Thr Gly Asn 435 440 445 Lys Ile Leu Thr Arg Val Ala Ala Ala Leu Met Asp Gly Pro Ala Ala 450 455 460 Leu Arg His Tyr Leu Ile Asp Asn Phe Val Val Glu Gly Phe Thr Phe 465 470 475 480 Asp Asp Val Met Asn Asp Asp Glu Ala Leu Glu Ala Phe Val Arg Lys 485 490 495 Ala Thr Ile Gly Val Trp His Ala Ser Cys Ser Cys Arg Met Gly Arg 500 505 510 Ala Asp Asp Pro Met Ala Val Val Asp Asn Gln Gly Arg Val Arg Gly 515 520 525 Val Gln Gly Leu Arg Val Val Asp Ala Ser Ile Phe Pro Val Val Pro 530 535 540 Cys Ala Asn Thr Asn Phe Pro Val Leu Met Ser Ala Glu Lys Ile Ala 545 550 555 560 Ala Thr Met Gln <210> 7 <211> 1326 <212> DNA <213> Cupriavidus basilensis HMF14 <400> 7 atggaagccg tagcaaagaa gcgtacagag acgatcagcg aggcgctgcc agcggcgacc 60 aatcgccagg tgtttggtgc cgtgacggcg tcgtgcatgg gatgggcgct ggacctgttc 120 gacctgttca tcctgctgtt cgtggcgccc gtgatcggca ggctgttttt cccgtcggag 180 cacgccatgc tgtcgctggc ggcggtgtat gcgtcgtttg ccgtgacgct gctgatgcgg 240 ccgctcggct cggcgatctt cggcacttat gccgaccgcc acggccgcaa gggggcgatg 300 gtagttgccg tcactggcgt tggcttgtcc acggcggcgt tcggcctgct gcctacggtg 360 ggtcaggtgg ggctgcttgc gccagccttg tttatcctgc tgcggctggt gcagggcatc 420 ttcgtaggtg gcgtggtggc atccacccac accatcggta ccgaatcggt gcccccgtcc 480 tggcgcggcg ccgtctccgg gctggtcggt ggcggtggcg cgggcatcgg ggcactgctg 540 gcttccatta cctacatggc gatgaccgcg ctgtttccgg gggaagcgtt cgatgcctgg 600 ggttggcgct gcatgttctt ctccggcatc atcagctcgg tgctcggcct gttcatcttc 660 aactcgctgg aggagtctcc gctgtggaag cagttgcagg cggccaaggg gcacgccgcg 720 ccggttgaga acccgctgcg cgtgatcttc tcccgccagt accgtggcgt cctcttcgtc 780 aacatcctgc tcaccgtggg cggtggcagc gcctactacc tgacctccgg ctatctgccg 840 accttcctca aggtggtggt gaaggcaccg gctggcgcat ccgcagccat cctgatggcc 900 agcagtgttg gcgttatcgt ggcatcgata attgccggtc acctcagcac gctgattggt 960 cgcaagcgag ccttcctgct gatcggcgcc ttgaacgtgg tgctgctgcc gttgatctac 1020 caacggatgc ccgcggcgcc ggatgtcacc acgcttggca tttatgccgt ggcgctggcg 1080 atgctgggca gcaccggctt cgccccgatc ctcattttcc tgaacgaacg ggtttcccac 1140 cagcatccgt gctacgggaa ctggcctgtc atggaatatc ggctttgcca tcggcggcat 1200 gatgcgacgt ttgcgtcgct gtgcgcagca cccccgcgac tgccaaagtg ctggggatct 1260 cgtcgcggtg tcaaagcatt tactgccggt gcggcgatcg tctggaacgc gccgctgggg 1320 gagtga 1326 <210> 8 <211> 1350 <212> DNA <213> Cupriavidus basilensis HMF14 <400> 8 atggaagccg tagcaaagaa gagtgcagcg acgatcagcg aggcgctgcc agcggcgagc 60 aatcgccagg tgtttggtgc cgtggcggcg tcgtgcatgg gatgggcgct ggacctgttc 120 gacctgttca tcctgctgtt cgtggcgccc gtgatcggca ggctgttttt cccgtcggag 180 cacgcgatgc tgtcgctggc ggcggtgtat gcgtcgtttg ccgtgacgct gctgatgcgg 240 ccgctcggct cggcgatctt cggctcttat gccgaccgcc acggccgcaa gggggcgatg 300 gtggttgccg tcactggcgt tggcttgtcc acggcggcgt tcggcctgct gccgacggtg 360 ggtcaggtgg ggctgcttgc gccagccttg tttatcctgc tgcggctggt gcagggcatc 420 ttcgtgggtg gcgtggtggc atccacccac accatcggta ccgaatcggt gcccccgtcc 480 tggcgcggcg ccgtttccgg gctggttggt ggcggtggcg cgggtctcgg ggcgctgctg 540 gcttccatta cctacatggc gatgaccgcg ctgtttccgg gggaagcgtt cgatgcctgg 600 ggttggcgct gcatgttctt ctccggcatc atcagctcgg tgctcggcct gttcatcttc 660 aactcgctgg aggagtctcc gctgtggaag cagttgcagg cggccaaggg gcacgccgcg 720 ccggttgaga acccgctgcg cgtgatcttc tcccgccagt accgtggtgt cctcttcgtc 780 aacatcctgc tcaccgtggg cggtggcagc gcctactacc tgacctccgg ctatctgccg 840 accttcctca aggtggtggt gaaggcatcg gctggcgagt ctgccgccat cctgatggcc 900 agcagtctgg gtgtgatcgt ggcatcgatt cttgccggcc acctcagtac gatgatcggc 960 cgcaagcgag ccttcctgtt gatcggcgcg ctgaacgtgg tagtactgcc gctgctctac 1020 cagtggatgc cggcggcgcc ggacaccacc acgctcggcc tgtatgctgt ggtgctgtcc 1080 atgctgggct gcagcggctt cgccccgatc ctcattttcc tgaacgaacg gttccccacc 1140 agcatccgtg ccacggggac cggcctgtca tggaatatcg gatttgccgt cggtggcatg 1200 atgccgacgt ttgcttcgct gtgcgccagc acccctgccg aactgcccat ggtgctgggc 1260 atcttcctgg cggttgtcac catcatctac ctggtgggtg cgttcatcgt tccggagacg 1320 gtagggcgcc ttggcgacaa tggagcgtag 1350 <210> 9 <211> 1350 <212> DNA <213> Methylobacterium radiotolerans JCM2831 <400> 9 atgcagaccg ccgccacctt cgcatccgat ccccccgccc tcgccaaacc cacaggccgg 60 cagacggtga ccgccgccat ggcctcgctg ttcggctggg ggctcgatct cttcgacctg 120 ttcatcctgc tttacgtcgc gccggtcgtt ggcacgttgt tcttcccggc ggacaagccg 180 atgctgtcgc tggccggcgc ctatgcgtcc ttcgcggtca cgctgctgat ccggcccctc 240 ggctcggccc tgttcggctc ctatgcggac cgcttcggcc gccgtcgcgc cctcatggtg 300 gcggtggtcg gcgtcggcat atcgaccgcg gtcttcggtc tcctgccgac ggtcggccag 360 atcggatggc tcgcgactgc ggtcttcctt ttcttccgcc tcgtccaggg catcttcgtc 420 ggcggcgtcg tcgcggcatc ccacacgatc gggacggaat ccgtcccgga gcggtggcgg 480 gggctgatgt ccggggcggt cggcggtggc ggctcggcca tcggcggcct gcttgcctcc 540 ctggtcttct atgtcgtctc gctcatggcg ccgggagaag ccttcgccga gtggggctgg 600 cggctgatgt tcttctcggg tctcctgacc tcggtgatcg gcctgatcct cttccgcaat 660 ctcgaggaat ccccgatctt caaggaactg caggcccgga aggcggcgct ccgggcaggc 720 gctccggcgg aggcctcacc gatccgctcc ctgttctcac cgtccaaccg gggaagcttc 780 gcggtcgcga ctctcatctc cttcggtggt ggcgcagcct actaccttac gtccggctac 840 ctgccgaccc tcctcaagct cgtgaacggc gtgccgaacg ccaccgcctc gatgatcctg 900 atcggcgcca acgtcgcggc ggcgatcggc gcctgcggca tgggcgaact gagccagcat 960 atcgggcgca aacggtcgtt ccttctgatg ggcgtcatcc gcctgctcgc ttttcccgcc 1020 ctgttcctga ccatggcgaa cacgacgagc ctcgttgggg tcgcggcctg cgccttcctg 1080 ctggcgctca tcgccaacgg cagctacggg ccgctgctga tcttcctcaa cgaaaaattc 1140 ccgacggcgg tgcgggccac ggggacgggc ctgacctgga acatcggctt cgcgctgggc 1200 ggcatgctgc cgacgctcgt ctcccttgtc gccgacgggc cgacgcaaat tccgatggtg 1260 ctggccgtca tcacgaccgg cgtcaccctg gtctatcttg tcggtgcctt cctgaccgac 1320 gagacgcagg gcaatctcga ccgggcctga 1350 <210> 10 <211> 1332 <212> DNA <213> Sulfolobus acidocaldarius DSM 639 <400> 10 atgaaaaaag aagaaaaatt tacttcaaat cattttaaat ggactttagc aacctttttc 60 acctggacat tcgacttata tgacctgttc actatcctac ttgttgcacc ttatatctct 120 tccctgtttt tcccttcaag tatcactttc ttgtctatag cggcaacata tgcggggttt 180 gccacctcat tgatcatgag acctgtaggt gctacagtct ttgggtctag ggtatcggac 240 aaggtaggta gaaagagggc tattttttac ggtctaatag gtcttgtgat aacttccaca 300 ttacagggcg cattaccgac ttatcaagta gtaggagtga tagcaccaat attactgtta 360 gcagtgagac tgattcaagg ggtgttcata ggaggcataa ctgcaggtag tcatgtgata 420 ggacctgagt ctgtcccaga gaggtataga gggattgtag gtggactagg gttttcagct 480 gctggagtgg catacctcat agcagctggc tggtttttcc tgacaaccat actctaccct 540 ggaagttcct atctggtatg gggatggaga gtgatgttct ttggcgggct actgagctta 600 gctgtacttg gatttgtaaa ctatttagtc cctgagtctg aggtttggac taaaattaaa 660 aagagagggt cagtggtgaa gtctcccctc aaggagatat tttcgaaata caggtatcag 720 ttaggcgttg cactgctact ttcaattggc tggggtgcaa gtttttacgt tactgatggt 780 atactaccta cgtttttaag tagtgtcaat aaattagcca agactgaaat agcaatagta 840 atgataatag ggtcaattgg gatgtcgata ggaccattaa taggagggga gatatcccag 900 ataataggga ggaagataac gtcattaata ggtgcaatta ttgtactagc agtagttgga 960 cctctctttc tctccctggg ttcactaaaa tccggtgacc ttaatcagat aattcttcac 1020 tcttttgcaa tcctgttctt agtcgatata ggaggaggga tgctaatgac ttacctaaat 1080 gagatatatc cagctagcgt gaggggaaca ggggttggct tcacgtggaa tactgggttt 1140 gcaataggag ggacaatccc aaccataatc agcctagcag tagcttcagc aggtctctct 1200 gcttttccct ctataatgtt ctacacctta atagtggtct ctgtaataat attagtgggt 1260 acagtactca cgaaggagac taagggtacc atatcaaagg aggagtatga gattcagaag 1320 gagactttat ag 1332 <210> 11 <211> 1740 <212> DNA <213> Cupriavidus basilensis HMF14 <400> 11 atggatacgc cgagggagcg tttcgactac gtgattgttg gcggcgggtc cgccggttgc 60 gtactggcca atcgcctgtc gcaggacccg gccatccgcg tcgcgctgat cgaggcgggc 120 gtcgatacgc cgccggacgc tgtgccggcg gagatcctcg acagctatcc gatgcccttg 180 ttcttcggtg accggtatat ctggccatcg ctgcaagccc gcgccgtggc agggggcagg 240 tccaaggtct acgagcaagg gcgcgtcatg ggcggcggct ccagcatcaa cgtgcaggcg 300 gcaaaccgcg ggctgccgcg cgactacgat gagtgggccg cgtcgggcgc gtccggatgg 360 tcgtggcagg atgtgctgcc gtatttccgc caccttgagc gcgatgtgga ttacggcaac 420 agcccgctgc acggcagcca cggaccggtg ccgatccgcc gcatcctgcc gcaggcttgg 480 ccgccgttct gcacggagtt tgcgcacgcg atgggccgca gcggcttgtc cgcgctggcc 540 gaccagaacg cggagttcgg cgatggctgg tttccggccg ccttctcgaa cctggatgac 600 aagcgggttt cgaccgccat cgcctatctc gacgcggata cgcgccggcg ggccaatctg 660 cggatctatg ccgagacaac ggtgcgcaag ctcgtcgtat ccggccggga agcgcgtggg 720 gtgatcgcca tgcgggccga tgggtcgcgg ctggcgctgg acgccgggga ggtcatcgtg 780 tccgcgggcg ccttgcagtc gcccgccatc ctgatgcgcg cggggatcgg cgacgccggc 840 gcgctgcagg ccctcggcat cgaggtcgta gccgaccgac ccggcgttgg ccgcaatctc 900 caggatcatc ccgcgctgac gttctgccag ttcctcgcgc cccagtaccg catgccgctc 960 tcgcgccggc gcgctagcat gacggcggcg cggttctcat cgggggtgcc aggtggcgag 1020 gcgtcggaca tgtacctgtc cagttccaca cgggcaggct ggcatgcact cggtaatcgg 1080 ctcggcctct tcttcctgtg gtgcaatcgg ccattctcgc gcgggcaggt gagccttgcg 1140 ggagcccagc cggatgtgcc gcccatggtg gagctcaacc tgctcgacga cgagcgggat 1200 ctgcggcgca tggtggccgg cgtacgcaag ttggtgcaga tcgtgggtgc gtcggccttg 1260 catcagcatc ccggtgattt cttccccgct acgttttcgc cgcgcgtcaa ggcgctgagc 1320 cgcgtgagcc gcggcaatgt gttgctcacg gagttgctgg gggcagtgct tgatgtctcg 1380 gggccgctgc gcagaagcct gatcgcgcgc tttgtcacgg gcggcgcaaa cctggccagc 1440 ctgctgacgg atgagtccgc gctagagggc ttcgtgcgcc agagcgtctt cggggtctgg 1500 catgccagcg gcacttgccg gatgggcgcg catgcggacc ggagcgcggt gacggatgcg 1560 gcgggccgcg ttcacgatgt tggcaggctg cgcgttattg acgcctctct gatgccgcgg 1620 ctgccgacgg ccaataccaa catccccacc atcatgctcg cggaaaagat tgccgacacc 1680 atgcaagccg agcgccgcgc ggtccggccg gcatcgagcg aagttgccca tccgagttga 1740 <210> 12 <211> 1695 <212> DNA <213> Bradyrhizobium japonicum USDA 110 <400> 12 gtgtacgact acattatcgt gggcggcggc tcggcggggt ccgtgctggc ccaccggctc 60 tccgcaaaga gtgccaacaa ggtcctgctc tgcgaagccg gacaggacac accacccggc 120 aacgagccgg ccgagatcag ggacagctat ccgggcacgg cctatttcga tccgcgcttc 180 cactggacgg aattgaaggt cacgacgcag gtcgtcagcc acaacaatcc gaccgaagcg 240 cgtcctccct tgcgcaaata cgagcaggcg cgcgtgctcg gcggcggctc gtcgatcaac 300 ggccagatgg ccaaccgcgg cgcgccgacc gactacgacg aatgggatgc gcggggtgcc 360 gaagggtgga cgtggaacga cgtgctgccg ttcttcaaga aggtcgagcg cgacctcgat 420 ttcgacggcc cgtatcacgg caaggacggc cggatcccgg tgcgccggat tccgcgggag 480 cactggacac ggcattcgca ggccttcgcc gatgccttcc agcaggccgg tcatcaattc 540 gtggcggacc agaacggcga gttcgtcgac ggctatttcg cggtgacgca ctccaaccag 600 gccgagcagc gcgtctccgc cgcgatgggc tatctcgatc gcgacacccg caagcgcgcc 660 aacctcacga tctccaccaa cacgcaagtt cgggagctgc tgttcgaagg cacgcaatgc 720 gtcggcgtga aggccagggt cgacgggcgg gagcaggaat tccgcggacg cgagatcatt 780 ctctccagcg gcgccatcca ttcgccggcg catctgctcc gcgccggtat cggcccggtc 840 ggccacctca aggacatggg gattcccgtg ctgacgggct tgccgggcgt cggccagcgc 900 ctgatggatc atccctcgat ttcgctgtcg tcctttgtcc gccgcggcgc gcgcatgaac 960 gagcatacca ggcgccacat gcagcttggc ctgcgctatt cgtccgggct gtcaggggtg 1020 ccgaagggcg acatgttcgt cgtcgtgctc agcaaatcgg cctggcacgc ggtcggcgcg 1080 caaatcggct cgctgctgac cttcgtcaac aagacctatt ccgagaccgg acaggtcaag 1140 cttgcctcgc gcgacccttc cgcagagccg atcgtcgagt tcaacctgct gtcggaccgg 1200 cgcgacctcg atcggctgat gagcggcttc cgcaagatgg cggcggtgca gatgagcgaa 1260 atcgtcagga aggtgacgga caagccgttc ccggccgcct ataccgacaa ggtccgcaag 1320 atcggcgtgg tcaacaccgg gaacaagatc ctgaccagag tcgcggcggc gctcatggac 1380 gggccggcgg cgctgcgtca ctatctgatc gacaatttcg tggtcgaagg cttcaccttc 1440 gatgacgtga tgaacgacga cgaggcgctt gaagccttcg tgcgcaaggc gaccatcggc 1500 gtgtggcacg cctcgtgctc atgccgcatg ggccgggccg acgatccgat ggcggtggtc 1560 gacaaccagg gccgcgtcag gggtgtccag ggtctgcggg tcgtcgacgc ctcgatcttc 1620 ccggtggtgc catgcgccaa caccaacttt ccggtgctga tgtcggcaga gaagatcgct 1680 gcaaccatgc agtga 1695 <210> 13 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 13 acgaattcaa aggagacaac aatggaag 28 <210> 14 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 14 aagctagctg agcagtcacc ctcactc 27 <210> 15 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 15 cggaattcca catgacaagg gagaccg 27 <210> 16 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 16 cggaattcgc ttcggtcttc aactcggatg 30 <210> 17 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 17 acgaattcgg aggaaatcta tgcagacc 28 <210> 18 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 18 aagctagcgc agaaccgtat cgtcag 26 <210> 19 <211> 500 <212> PRT <213> Cupriavidus basilensis HMF14 <400> 19 Met Asn Ala Gln His Trp Ile Ala Gly Ala Trp Thr Gly Glu Pro Ser 1 5 10 15 Ala Asp Ser Val Asn Pro Ala Asp Gly Thr Leu Ile Gly Gln Phe Ala 20 25 30 Asp Gly Gly Thr Trp Gln Ala Glu Ala Ala Ile Ala Ala Ala Arg His 35 40 45 Val Phe Glu Arg Thr Thr Trp Gly Gln Asp Ala Arg Leu Arg Gln Asp 50 55 60 Val Leu Leu Ala Trp Ala Gly Ala Leu Glu Ala Glu Arg Glu Arg Leu 65 70 75 80 Ala Ser Leu Leu Thr Ala Glu Asn Gly Lys Pro Val Ala Gln Ala Arg 85 90 95 Gly Glu Val Gly Ala Ala Ile Ser Glu Val Arg Tyr Tyr Ala Gly Leu 100 105 110 Ala Arg His Ile Pro Gly His Val Leu Glu Pro Glu Pro Gly Thr Ile 115 120 125 Ser Thr Ile Leu Arg Glu Pro Ala Gly Val Ala Ala Ile Ile Val Pro 130 135 140 Trp Asn Ala Pro Ala Val Leu Leu Val Arg Ser Leu Ala Pro Ala Leu 145 150 155 160 Ala Ala Gly Cys Thr Ala Val Val Lys Ser Ala Ala Gln Thr Thr Leu 165 170 175 Phe Thr Ala Ala Met Leu Arg Leu Phe Glu Arg Thr Ala Leu Pro Ala 180 185 190 Gly Ala Val Asn Leu Val Cys Glu Thr Gly Tyr Ala Ala Ala Asp His 195 200 205 Leu Val Arg Ser Arg Asp Val Asp Val Val Ser Phe Thr Gly Ser Thr 210 215 220 Ala Thr Gly Lys Lys Ile Met Ile Ala Ala Ala Asp Ser Val Lys Lys 225 230 235 240 Leu Ser Leu Glu Leu Gly Gly Lys Ser Cys Cys Leu Val Phe Asp Asp 245 250 255 Val Asp Ala Gln Ala Val Ala Lys Arg Leu Ala Leu Ala Ala Thr Val 260 265 270 Ile Ser Gly Gln Gln Cys Thr Ala Ala Arg Arg Val Leu Val His Glu 275 280 285 Ala Ile Ala Pro Gln Met Arg Arg His Leu Thr Glu Ala Leu Ala Ala 290 295 300 Leu Arg Leu Gly Pro Gly Ile Glu Pro Asp Thr Gln Ile Gly Pro Leu 305 310 315 320 Ile Asp His Pro Thr Arg Ala Met Val Ser Ala Gln Val Glu Arg Ala 325 330 335 Cys Asp Glu Ala Asp Thr Val Leu Leu Arg Gly Thr Met Pro Gly Gly 340 345 350 Ala Leu Ala Arg Gly Ala Phe Leu Ser Pro Thr Leu Val Glu His Ser 355 360 365 Asp Pro Gly Ala Phe Phe Cys Gln Glu Glu Ile Phe Gly Pro Phe Val 370 375 380 Thr Phe Glu Thr Phe Ala Thr Glu Asp Glu Ala Leu Ala Lys Ala Asn 385 390 395 400 Asn Thr Val Phe Gly Leu Ser Ala Ser Val Trp Thr His His Gly Glu 405 410 415 Arg Ala Ile Arg Leu Ala Arg Ala Leu Arg Asn Gly Thr Val Trp Val 420 425 430 Asn Asp His Asn Arg Leu Phe Ala Glu Ala Glu Thr Gly Gly Tyr Arg 435 440 445 Gln Ser Gly Leu Gly Arg Leu His Gly Tyr Asp Ala Leu Ala Asp Phe 450 455 460 Thr Glu Leu Lys His Ile Cys Ile Gln Ala Gly Leu Pro Lys Gly Met 465 470 475 480 Ser Gln Ala Gly Cys Arg Leu Ser Gly Val Ala Ala Arg Glu Arg Met 485 490 495 Gly Val Ser Val 500 <210> 20 <211> 479 <212> PRT <213> Burkholderia sp. CCGE1002 <400> 20 Met Asn Ala Arg His Trp Ile Ala Gly Glu Trp Thr Gly Thr Pro Asn 1 5 10 15 Ile Asp Ser Ile Asp Pro Ala Thr Gly Asp Ala Ile Gly Arg Phe Ala 20 25 30 Asp Gly Gly Ser Ser Glu Ala Asp Ala Ala Ile Ala Ala Ala Arg His 35 40 45 Ala Phe Asp Arg Thr Thr Trp Ala Gln Asp Ala Arg Leu Arg Gln Asp 50 55 60 Val Leu Leu Gly Trp Ala Ser Ala Leu Glu Ala Glu Arg Asp Met Leu 65 70 75 80 Ala Thr Leu Leu Thr Arg Glu Asn Gly Lys Ala Ile Ala Gln Ser Arg 85 90 95 Asp Glu Ile Ala Gly Ala Ile Ser Glu Val Arg Tyr Tyr Ala Gly Leu 100 105 110 Ala Arg His Ile Ala Gly His Val Leu Glu Pro Glu Pro Gly Thr Ile 115 120 125 Ser Thr Met Leu Arg Glu Ala Ala Gly Val Ala Ala Ile Ile Val Pro 130 135 140 Trp Asn Ala Pro Ala Val Leu Leu Val Arg Ser Leu Ala Pro Ala Leu 145 150 155 160 Ala Ala Gly Cys Thr Val Ile Val Lys Pro Ala Ala Gln Thr Ser Leu 165 170 175 Leu Thr Ala Ala Met Leu Arg Cys Phe Glu His Thr Ala Leu Pro Glu 180 185 190 Gly Ala Val Asn Leu Val Asn Glu Arg Gly Tyr Ala Ala Ser Gln Arg 195 200 205 Leu Val Asp Ser His Gly Val Asp Val Val Ser Phe Thr Gly Ser Thr 210 215 220 Ala Thr Gly Lys Lys Ile Met Ala Ala Ala Ala Asp Ser Met Lys Lys 225 230 235 240 Leu Ser Leu Glu Leu Gly Gly Lys Ser Cys Cys Val Val Phe Asp Asp 245 250 255 Ala Asp Val Ala Ala Ile Ala Pro Arg Leu Ala Arg Ala Ala Thr Ile 260 265 270 Ile Ser Gly Gln Gln Cys Thr Ala Ala Arg Arg Val Leu Val His Ala 275 280 285 Ser Arg Ala Ala Gln Met Arg Glu Gln Leu Ala Ser Ala Leu Ala Ser 290 295 300 Leu Arg Val Gly Pro Gly Ile Asp Pro Ala Thr Asp Ile Gly Ala Leu 305 310 315 320 Ile Asp Gly Thr Thr Arg Asp Ala Val Ala Arg Thr Ile Glu Arg Ala 325 330 335 Cys Gly Thr Ala Glu Arg Val Leu Leu Arg Gly Thr Cys Ser Gly His 340 345 350 Ala Phe Leu Ser Pro Thr Leu Val Glu His Asp Asp Pro Lys Ala Phe 355 360 365 Phe Cys Gln Asp Glu Ile Phe Gly Pro Phe Val Thr Leu Glu Val Phe 370 375 380 Glu Asn Glu Met Glu Ala Ile Glu Lys Ala Asn Asp Thr Val Phe Gly 385 390 395 400 Leu Ser Ala Ser Val Trp Thr His Asp Gly Ala Arg Ala Leu Arg Val 405 410 415 Ala Arg Ala Leu Arg Asn Gly Thr Val Trp Ile Asn Asp His Asn Lys 420 425 430 Leu Phe Ala Glu Ala Glu Thr Gly Gly Tyr Arg Gln Ser Gly Leu Gly 435 440 445 Arg Leu His Gly Tyr Asp Ala Leu Ala Asp Phe Thr Glu Leu Lys His 450 455 460 Ile Cys Met Pro Ala Gly Val Ala Glu Gly Ile Ala Pro Leu Arg 465 470 475 <210> 21 <211> 483 <212> PRT <213> Burkholderia graminis C4D1M <400> 21 Met Glu Arg Asp Ala Met Asn Trp Ile Ala Gly Glu Trp Ala Gly Lys 1 5 10 15 Pro Val Leu Ala Ser Ser Asp Pro Ser Asn Gly Glu Thr Leu Gly Arg 20 25 30 Phe Val Ser Ser Asn Thr Gln Asp Ala Asp Ala Ala Val Ser Ala Ala 35 40 45 Arg His Thr Phe Asp His Thr Thr Trp Ala Gln Asp Ala Arg Arg Arg 50 55 60 Gln Asp Val Leu Leu Arg Trp Ala Gln Ala Leu Glu Leu Ser Val Glu 65 70 75 80 Pro Leu Ala Glu Leu Leu Thr His Glu Asn Gly Lys Thr Ile Gly Gln 85 90 95 Ala Arg Gly Glu Met Arg Ala Ala Ile Ser Glu Val Arg Tyr Tyr Ala 100 105 110 Gly Leu Ala Arg His Ile Ala Gly His Val Ile Glu Pro Glu Pro Gly 115 120 125 Thr Ile Ser Thr Met Leu Arg Glu Ala Ala Gly Val Ala Ala Ile Ile 130 135 140 Val Pro Trp Asn Ala Pro Ala Val Leu Leu Val Arg Ser Leu Ala Pro 145 150 155 160 Ala Leu Ala Ala Gly Cys Thr Ala Ile Val Lys Pro Ala Ala Gln Thr 165 170 175 Ser Leu Ile Thr Ala Ala Met Ile Arg Cys Leu Asp Gln Pro Ala Leu 180 185 190 Pro Ala Gly Ala Val Asn Leu Leu Leu Glu Asn Gly Ala Glu Ala Ala 195 200 205 Ala Arg Leu Val Glu Ser Ala Asp Val Asp Val Ile Ser Phe Thr Gly 210 215 220 Ser Thr Glu Val Gly Lys Arg Ile Met Arg Ala Ala Ala Asp Ser Met 225 230 235 240 Lys Arg Leu Ser Leu Glu Leu Gly Gly Lys Ser Cys Cys Leu Val Phe 245 250 255 Glu Asp Ser Asp Val Lys Ala Ile Ala Pro Arg Leu Ala Arg Ala Ala 260 265 270 Thr Ile Ile Ser Gly Gln Gln Cys Thr Ala Ala Arg Arg Ile Leu Val 275 280 285 His Val Ser Lys Ala Asp Gln Met Arg Asp Glu Leu Val Lys Ala Leu 290 295 300 Ala Ser Leu Lys Val Gly Pro Gly Ile Asp Pro Ala Ser Asp Ile Gly 305 310 315 320 Ala Leu Ile Asp Ala Ala Ser Arg Asp Ala Val Gln Thr Thr Val Glu 325 330 335 Arg Ala Cys Asp Leu Ala Asp Arg Val Leu Leu Arg Gly Thr Ser Ser 340 345 350 Gly Pro Gly Ala Phe Leu Ser Pro Thr Leu Val Glu His Gly Glu Pro 355 360 365 His Ala Phe Phe Cys Gln Asp Glu Ile Phe Gly Pro Phe Val Thr Leu 370 375 380 Glu Thr Phe Val Thr Glu Lys Glu Ala Val Glu Lys Ala Asn Asn Thr 385 390 395 400 Val Phe Gly Leu Ser Ala Ser Val Trp Thr His Asp Ser Ala Arg Ala 405 410 415 Phe Arg Ile Ala Arg Ala Leu Arg Asp Gly Thr Val Trp Ile Asn Asp 420 425 430 His Asn Arg Leu Phe Ala Glu Ala Glu Thr Gly Gly Tyr Arg Gln Ser 435 440 445 Gly Leu Gly Arg Leu His Gly Tyr Asp Ala Leu Ala Asp Phe Thr Glu 450 455 460 Ile Lys His Ile Cys Val Gly Ala Gly Val Leu Glu Gly Ile Glu Val 465 470 475 480 Leu Gly Ser <210> 22 <211> 483 <212> PRT <213> Azospirillum sp. B510 <400> 22 Met Thr Asn Leu Asp Ser Arg His Trp Ile Asp Gly Ala Trp Val Pro 1 5 10 15 Gly Thr Asp Arg Phe Ala Ser Ile Asn Pro Ala Asp Gly Ser Val Leu 20 25 30 Gly His Ala Ala Asp Gly Gly Arg Ala Glu Ala Glu Ala Ala Ile Ala 35 40 45 Ala Ala His Ala Ala Phe Asn Arg Pro Asp Trp Ala Gln Asn Pro Arg 50 55 60 Leu Arg Gln Ser Ile Leu Leu Gly Trp Ala Asp Arg Leu Asp Thr Gln 65 70 75 80 Ala Glu Asp Leu Ala Arg Leu Leu Thr Leu Glu Asn Gly Lys Ala Ile 85 90 95 Ala Gln Ser Arg Gly Glu Ile Ala Gly Ala Ile Ser Glu Ile Arg Tyr 100 105 110 Tyr Gly Gly Leu Ala Arg His Val Pro Gly His Val Leu Glu Val Glu 115 120 125 Pro Gly Val Leu Ser Thr Met Leu Arg Glu Pro Ala Gly Val Ala Ala 130 135 140 Leu Ile Ile Pro Trp Asn Ala Pro Ala Val Leu Leu Ala Arg Ala Ile 145 150 155 160 Gly Pro Ala Leu Ala Cys Gly Cys Thr Val Val Val Lys Pro Ala Ala 165 170 175 Gln Thr Thr Leu Leu Thr Ala Ala Phe Leu Arg Ala Leu Ser Glu Val 180 185 190 Pro Ser Leu Pro Arg Gly Val Cys Asn Met Ile Ser Glu Thr Gly His 195 200 205 Ala Ala Ala Ala Arg Leu Val Asp Ser Pro Leu Val Asp Val Val Ser 210 215 220 Phe Thr Gly Ser Thr Ala Thr Gly Lys Arg Ile Met Val Ala Ala Ala 225 230 235 240 Asp Thr Met Lys Lys Leu Ser Leu Glu Leu Gly Gly Lys Ser Cys Cys 245 250 255 Leu Val Phe Pro Asp Ala Asp Pro Ala Glu Thr Ala Ala Arg Ile Ala 260 265 270 Thr Ala Ala Thr Ile Ile Ser Gly Gln Gln Cys Thr Ala Ala Arg Arg 275 280 285 Val Leu Val His Ala Ser Ala Phe Asp Ala Met Lys Thr His Leu Arg 290 295 300 Ala Ala Leu Ala Ala Met Thr Val Gly Asn Gly Leu Asp Pro Ala Ile 305 310 315 320 Arg Met Gly Pro Leu Ile Asp Arg Pro Ala Arg Asp Gln Val Gln Thr 325 330 335 Gln Val Glu Arg Ala Phe Asp Ala Cys Asp Glu Val Leu Leu Arg Gly 340 345 350 Gly Val Pro Thr Asp Ser Pro Ala Ala Ala Ser Phe Leu Thr Pro Ser 355 360 365 Leu Val Ala His Asp Asp Pro Ser Ala Phe Phe Cys Gln Asp Glu Ile 370 375 380 Phe Gly Pro Phe Val Val Leu Glu Arg Phe Glu Thr Glu Ala Glu Ala 385 390 395 400 Val Ala Lys Ala Asn Asn Thr Val Phe Gly Leu Ser Ala Ser Val Trp 405 410 415 Thr Arg Asp Gly Ala Arg Ala Leu Arg Met Ala Arg Ala Leu Arg Asn 420 425 430 Gly Thr Val Trp Ile Asn Asp His Asn Arg Leu Phe Ala Glu Ala Glu 435 440 445 Thr Gly Gly Tyr Arg Gln Ser Gly Leu Gly Arg Leu His Gly Tyr Asp 450 455 460 Ala Phe Ala Asp Phe Thr Glu Leu Lys His Val Cys Gln Thr Val Gly 465 470 475 480 Thr Ile Gly <210> 23 <211> 480 <212> PRT <213> Pseudomonas putida <400> 23 Met Gln Ser Gln His Tyr Ile Asp Gly Gln Trp Thr Ser Thr Asp Arg 1 5 10 15 Trp Thr Asp Ser Leu Asp Pro Ala Ser Gly Glu Leu Ile Gly Cys Phe 20 25 30 Ala Asp Gly Gly Glu Ala Glu Ala Glu Ala Ala Val Ala Ala Ala Ala 35 40 45 Arg Ala Phe Asn Asp Pro Gln Trp Ala Gln Asn Pro Arg Leu Arg Gln 50 55 60 Gln Leu Leu Leu Glu Trp Ala Ala Gly Leu Lys Ala Arg Gln Glu Gln 65 70 75 80 Leu Ala Gln Leu Leu Thr Arg Glu Asn Gly Lys Ala Leu Ala Gln Ser 85 90 95 Arg Gly Glu Ile Gly Gly Ala Ile Ser Glu Ile Leu Tyr Tyr Ala Gly 100 105 110 Leu Ala Arg His Asn Pro Gly His Met Leu Glu Val Ala Pro Gly Glu 115 120 125 Phe Ser Ser Met Leu Arg Glu Pro Ala Gly Val Ala Gly Leu Ile Ile 130 135 140 Pro Trp Asn Ala Pro Ala Val Leu Leu Val Arg Ala Leu Ala Pro Ala 145 150 155 160 Ile Ala Ala Gly Cys Thr Val Val Ile Lys Pro Ala Pro Gln Thr Ala 165 170 175 Leu Phe Asn Ala Ala Met Leu Glu Pro Leu Phe Ala Leu Pro Gly Leu 180 185 190 Pro Ala Gly Ala Val Asn Leu Phe Ala Glu Ser Gly His Ala Gly Ala 195 200 205 Ala His Leu Val Ala Ser Pro Arg Val Asp Val Leu Ser Phe Thr Gly 210 215 220 Ser Thr Ala Thr Gly Gln Arg Ile Met Arg Asp Cys Ala Ala Thr Met 225 230 235 240 Lys Lys Leu Ser Leu Glu Leu Gly Gly Lys Ser Cys Cys Leu Val Phe 245 250 255 Glu Asp Ala Asp Ile Ala Ala Ile Ala Pro Lys Leu Ala Ala Ala Ala 260 265 270 Thr Ile Ile Ser Gly Gln Gln Cys Thr Ala Ala Arg Arg Val Leu Val 275 280 285 His Ala Ser Arg Phe Ala Glu Met Lys Thr Ala Leu Ser Ala Ala Leu 290 295 300 Gly Gln Ile Arg Leu Gly Asn Gly Leu Asp Pro Ala Asn Asn Met Gly 305 310 315 320 Pro Leu Ile Asp Trp His Ser Arg Asp Ser Val Glu Arg Arg Ile Gly 325 330 335 Glu Ala Leu Asp Ser Cys Asp Glu Val Leu Leu Ala Gly Gly Arg Pro 340 345 350 Gln Gly Glu Leu Ser Lys Gly Ala Phe Leu Ala Pro Ser Leu Ile Ala 355 360 365 His Arg Asp Ser Ser Ala Phe Phe Cys Gln Glu Glu Ile Phe Gly Pro 370 375 380 Leu Leu Val Leu Glu Ser Phe Glu Asp Glu Thr Glu Ala Val Ala Arg 385 390 395 400 Ala Asn His Thr Glu Phe Gly Leu Ser Ala Ser Val Trp Thr Asp Gln 405 410 415 Gly Ala Arg Ala Trp Arg Val Ala Arg Ala Leu Arg Asn Gly Thr Val 420 425 430 Trp Leu Asn Asp His Asn Arg Leu Phe Ala Glu Ala Glu Thr Gly Gly 435 440 445 Tyr Arg Lys Ser Gly Leu Gly Arg Leu His Gly Val Asp Ala Leu Leu 450 455 460 Asp Phe Ser Glu Leu Lys His Ile Tyr Gln Asn Val Gly Thr Leu Gly 465 470 475 480 <210> 24 <211> 486 <212> PRT <213> Rhodopseudomonas palustris BisB18 <400> 24 Met Gly Met Thr Ala Leu His Ala Asp Asn Leu Ile Asp Gly Ala Trp 1 5 10 15 Gln Pro Ala Gln Ser Gly Ala Thr Ala Pro Ser Leu Asp Pro Ser Ser 20 25 30 Gly Gly Thr Ile Gly Gly Phe Ala Ala Gly Gly Ala Ala Asp Ala Gln 35 40 45 Ala Ala Val Ala Ala Ala Arg Arg Ala Phe Glu Arg Pro Glu Trp Ser 50 55 60 Gln Asn Pro Arg Ala Arg Gln Met Val Met Leu Arg Trp Ala Asp Arg 65 70 75 80 Met Glu Ala Gln Ala Asp Gln Leu Ala Arg Leu Leu Thr Leu Glu Asn 85 90 95 Gly Lys Pro Leu Pro Gln Ser Arg Gly Glu Ile Ala Gly Ser Val Ser 100 105 110 Glu Ile Arg Tyr Tyr Ala Gly Leu Thr Arg Tyr Ile Pro Gly His Val 115 120 125 Phe Glu Val Glu Pro Gly Ser Phe Ser Thr Leu Leu Lys Glu Pro Ala 130 135 140 Gly Val Ala Gly Leu Ile Ile Pro Trp Asn Ala Pro Ala Val Leu Leu 145 150 155 160 Ile Arg Ala Leu Thr Pro Ala Leu Ala Ala Gly Cys Thr Val Val Ile 165 170 175 Lys Pro Ala Pro Gln Thr Ala Gln Ile Thr Ala Ala Ile Ile Lys Cys 180 185 190 Leu His Glu Val Asp Gly Leu Pro Arg Gly Val Val Asn Leu Val Ser 195 200 205 Glu Gln Gly His Gln Val Ala Glu His Leu Val Thr Ser Asn Asp Val 210 215 220 Asp Val Ile Ser Phe Thr Gly Ser Asn Ala Thr Gly Ala Arg Ile Met 225 230 235 240 Ala Ala Ala Ala Pro Thr Met Lys Lys Leu Ser Leu Glu Leu Gly Gly 245 250 255 Lys Ser Ala Cys Leu Val Phe Asp Asp Ala Asp Ile Ala Asp Val Ala 260 265 270 Pro Lys Leu Ala Ala Ala Ala Thr Ile Ile Ala Gly Gln Gln Cys Thr 275 280 285 Ala Ala Arg Arg Val Leu Val His Ala Ser Arg Tyr Asp Glu Met Lys 290 295 300 Ala Ala Leu Lys Ala Ala Leu Ala Asn Ile Arg Ile Ala Pro Gly Ser 305 310 315 320 Ala Ala Gly Ala Glu Met Gly Pro Leu Ile Asp Ala Ala Ser Leu Ala 325 330 335 Ala Val Ala Lys Arg Ala Asp Glu Ala Met Gln Ala Ala Asp Glu Val 340 345 350 Val Leu Arg Gly Gly Arg Pro Ala Gly Asp Leu Ala Asn Gly Tyr Phe 355 360 365 Leu Ser Pro Thr Leu Val Ala His Arg Asp Thr Ser Ala Phe Phe Val 370 375 380 Gln Glu Glu Ile Phe Gly Pro Leu Val Val Leu Glu Lys Phe Glu Asp 385 390 395 400 Glu Lys Glu Ala Val Ala Arg Ala Asn His Ser Asp Tyr Gly Leu Ser 405 410 415 Ala Ser Val Trp Thr His Asp Gly Ala Arg Ala Met Arg Val Ala Arg 420 425 430 Ala Leu Arg Asn Gly Thr Val Trp Ile Asn Asp His Asn Lys Leu Phe 435 440 445 Ala Glu Ala Glu Thr Gly Gly Tyr Arg Arg Ser Gly Leu Gly Arg Leu 450 455 460 His Gly Tyr Asp Ala Leu Ile Asp Phe Leu Glu Ile Lys His Val Tyr 465 470 475 480 Gln Ser Cys Gly Val Val 485 <210> 25 <211> 485 <212> PRT <213> Dinoroseobacter shibae DFL 12 <400> 25 Met Thr Thr Thr Asp Leu Ile Ala Arg His Met Ile Gly Gly Ser Tyr 1 5 10 15 Ser Asp Ala Gly Asp Lys Ile Ala Ser Ile Asn Pro Ala Thr Gly Ala 20 25 30 Val Val Gly His Val Arg Ala Asp Gly Ala Ala Gln Ala Thr Ala Ala 35 40 45 Ile Ala Ala Ala Arg Ala Ala Phe Asp Thr Thr Leu Trp Pro Gln Ser 50 55 60 Pro Arg Asp Arg Gln Met Ala Leu Leu Arg Trp Ala Asp Ala Leu Glu 65 70 75 80 Ala Asp Leu Ala Arg Leu Ala Glu Leu Leu Thr Leu Thr Asn Gly Lys 85 90 95 Pro Leu Gly Ala Ser Lys Gly Glu Leu Gly Ala Ala Ile Ser Glu Ile 100 105 110 Arg Tyr Tyr Ala Gly Leu Thr Arg His Asn Pro Gly His Ala Met Glu 115 120 125 Val Ala Pro Gly Glu Leu Ser Val Met Leu Arg Glu Pro Ala Gly Val 130 135 140 Ala Gly Ile Ile Val Pro Trp Asn Ala Pro Ala Val Leu Leu Ile Arg 145 150 155 160 Ser Leu Ala Pro Ala Leu Ala Val Gly Cys Thr Thr Val Thr Lys Pro 165 170 175 Ala Pro Gln Thr Ala Leu Phe Thr Ala Ala Cys Met Ala Pro Leu Phe 180 185 190 Glu Asp Ala Ala Ile Pro Ala Gly Val Val Asn Val Val Phe Glu Val 195 200 205 Gly His Asp Ala Ala Gln Thr Leu Val Thr Ser Pro Asp Val Asp Val 210 215 220 Ile Ser Phe Thr Gly Ser Asn Ala Val Gly Gln Arg Ile Met Ala Asp 225 230 235 240 Ala Ala Pro Thr Met Lys Lys Leu Ser Leu Glu Leu Gly Gly Lys Ser 245 250 255 Cys Cys Ile Val Leu Asp Asp Ala Asp Ile Gly Val Val Ala Pro Lys 260 265 270 Leu Ala Ala Ala Ala Thr Ile Ile Ser Gly Gln Gln Cys Thr Ala Ala 275 280 285 Arg Arg Val Leu Val His Glu Ser Arg Leu Asp Glu Ala Lys Ser Ala 290 295 300 Leu Ser Ala Ala Leu Gln Ala Val Ser Ile Gly Asp Gly Met Ser Asp 305 310 315 320 Gly Thr Ala Met Gly Pro Leu Ile Asp Ile Gln Ser Arg Asp Arg Val 325 330 335 Met Arg Asp Cys Gly Thr Val Tyr Asp Thr Ala Asp Glu Val Val Leu 340 345 350 Arg Gly Gly Pro Leu Asp Gly Pro Lys Gly Ser Ala Phe Met Ser Pro 355 360 365 Ala Leu Val Val His Ser Asp Pro Asn Ala Ser Phe Val Gln Asp Glu 370 375 380 Ile Phe Gly Pro Leu Val Val Leu Glu Thr Phe Arg Asp Glu Ala Asp 385 390 395 400 Ala Val Ala Lys Ala Asn Asn Thr Val Tyr Gly Leu Ser Ala Ser Ile 405 410 415 Trp Thr His Arg Gly Asp Ala Ser Trp Arg Leu Ala Arg Ala Leu Arg 420 425 430 Asn Gly Thr Val Trp Ile Asn Asp His Asn Arg Leu Phe Ala Glu Ala 435 440 445 Glu Thr Gly Gly Tyr Arg Arg Ser Gly Leu Gly Arg Leu His Gly Phe 450 455 460 Asp Gly Leu Leu Asp Phe Cys Glu Leu Lys His Val Tyr Gln Asn Val 465 470 475 480 Gly Val Val Gly His 485 <210> 26 <211> 1503 <212> DNA <213> Cupriavidus basilensis HMF14 <400> 26 atgaacgcgc aacactggat tgccggcgcc tggaccggcg agccttccgc cgatagcgtc 60 aaccccgccg acgggaccct gatcgggcag ttcgcggacg gcggcacctg gcaagccgaa 120 gccgccatcg ccgccgcgcg ccatgtcttc gagcgcacca cctggggcca ggatgcccgc 180 ctgcgccagg acgtgcttct agcctgggct ggtgcgctcg aggcagagcg agagcgcctg 240 gccagcctgc tcaccgcgga aaacggcaag ccggtcgcac aagcccgagg cgaggtcggc 300 gccgcaattt cagaggtccg ctattacgcc gggctggcgc ggcacatccc gggtcacgtg 360 ctggagcccg agccaggcac gatatcgacc atcctgcgcg agccggccgg cgtcgccgcc 420 atcatcgtcc cctggaacgc gccggcggtg ctgctcgtgc gctccctcgc gccagcgctt 480 gccgcgggct gcacggcagt ggtcaaatcg gcagcgcaaa ccacgctgtt cacagccgca 540 atgctgcgct tgttcgagcg cacggccctg ccggccggcg ccgtcaatct ggtctgcgaa 600 acgggctatg cggcagcgga ccacctggtg cgttcgcgcg acgtggacgt agtgagcttc 660 acaggatcga ccgcaaccgg caagaagatc atgatcgccg ctgcggacag cgtgaaaaaa 720 ctctcgctgg aactcggcgg gaaatcgtgc tgcctggtgt tcgacgacgt cgatgcgcaa 780 gcggtcgcga aacggcttgc gcttgccgcc accgtcatct cgggccagca atgcaccgcc 840 gcgcggcgag tactggttca cgaagccatc gcgccacaga tgcgccggca cctgaccgag 900 gccctcgccg cgctgcgcct cgggcccggc atcgagcccg acacccaaat cggcccgctg 960 atcgaccacc cgacgcgcgc gatggtgagc gcgcaagtcg agcgcgcctg cgacgaggcg 1020 gacacggtcc tgctgcgcgg cacgatgccg ggcggcgcgc tagcgcgcgg cgccttcctc 1080 agccccacac tagtggaaca cagcgacccc ggtgccttct tctgccagga ggagatcttc 1140 gggcccttcg tcacattcga gaccttcgcg accgaagacg aggcgctagc caaggccaac 1200 aacaccgtct tcggcctgtc cgccagcgtc tggacgcacc acggcgagcg cgccatacgc 1260 ctagcgcggg cgctgcgcaa cggcacggtc tgggtcaacg accacaaccg cctgttcgcc 1320 gaagcggaga cgggcggcta tcggcaaagc ggccttggac ggctccacgg ttatgacgcc 1380 ctcgcggact tcaccgagtt gaagcacatc tgcatccagg cgggcctgcc gaaagggatg 1440 tcgcaggcgg gctgcaggct cagtggggta gcagcgcgcg agcggatggg agtttccgtc 1500 tag 1503 <210> 27 <211> 1440 <212> DNA <213> Burkholderia sp. CCGE1002 <400> 27 atgaacgcac gacactggat tgccggcgaa tggaccggca cgcccaacat cgacagcatc 60 gatcccgcga cgggcgatgc catcggccgg ttcgccgacg gcggatcgag cgaagccgat 120 gccgccatcg ccgccgctcg ccacgcgttc gatcgcacga catgggcgca ggacgcgcgc 180 ttgcgccagg acgtgctact cggctgggct tcggcgctcg aagccgaacg cgacatgctc 240 gcgacgctgc tcacgcgtga aaacggcaag gcgatcgcgc aatcgcgcga cgagattgcc 300 ggcgcgatat cggaggtgcg ctattacgcg gggctcgcgc gccatattgc cgggcacgtg 360 ctcgaaccgg aaccgggcac gatatcgacg atgctgcgcg aagcggccgg cgtcgcggcg 420 atcatcgtgc cgtggaatgc gcccgccgtg ctgctcgtgc gctcgctcgc gcccgctctc 480 gcggccggct gcacggtgat agtcaaaccg gcggcgcaaa cgtcgctgct cacggccgcg 540 atgttgcgct gcttcgaaca cacggcgttg cctgaaggcg cggtgaacct agtcaacgaa 600 cggggatacg cggccagcca gcggctcgtc gactcgcacg gggtcgacgt ggtgagcttc 660 acgggatcga cggcgacggg caagaagatc atggcggccg ctgccgacag catgaagaag 720 ctgtcgctcg aacttggcgg caagtcatgc tgcgtcgtct tcgacgatgc cgatgtcgcg 780 gcgatcgcgc cgcgtctcgc gcgcgccgcg acgatcatct ccgggcagca atgcacggcg 840 gcgcgccggg tgctggttca tgcgtcgcgc gctgcgcaaa tgcgcgagca gctcgcgtcg 900 gcgcttgcgt cgctgcgggt cggaccgggc atcgatccgg cgacggatat cggcgcgctc 960 atcgacggca ccacgcgcga tgcggtggca cggacgatcg agcgcgcgtg cggaacggcc 1020 gagcgtgtgc tgctgcgagg cacttgctcg gggcacgcgt ttctgtcgcc gacgctcgtc 1080 gagcatgacg atccgaaggc gttcttttgc caggacgaga tctttggccc gttcgtcacg 1140 ctggaagtct tcgagaacga aatggaagcg atcgagaaag ccaacgacac ggtcttcggt 1200 ctctcggcga gcgtatggac gcacgacgga gcgcgcgcat tgcgcgtcgc gcgtgcgctg 1260 cgcaacggca cggtgtggat caacgaccac aacaagcttt tcgccgaagc cgaaacgggc 1320 gggtatcgcc aaagcggact gggtcggctg cacggctacg atgcgctggc ggacttcacc 1380 gagttgaagc acatctgcat gccggccggc gtggcggaag gtatcgcgcc gttgcggtga 1440 <210> 28 <211> 1452 <212> DNA <213> Burkholderia graminis C4D1M <400> 28 atggaaagag acgctatgaa ttggatcgcc ggcgaatggg ccggcaagcc cgtgctcgca 60 agctccgatc cttcgaacgg agagacgctc ggccggttcg tcagctcgaa cacgcaagac 120 gcggacgccg ccgtctcggc tgcccgccat acgttcgatc acacaacgtg ggcacaggat 180 gcccgtcgac ggcaggatgt tctgcttcgc tgggcgcaag ctctcgagtt gtcggtggaa 240 ccgctagcgg aattgctgac gcatgaaaac ggcaagacta ttgggcaggc gcgaggagaa 300 atgcgcgccg caatttccga agtgcgctac tacgcgggac tcgcgcgcca cattgccggt 360 cacgtcatcg agcccgagcc aggcaccatc tcgacgatgt tgcgcgaggc cgccggcgtt 420 gctgcgatca tcgtgccgtg gaacgctccc gccgtgctgc tcgtgcggtc ccttgcgccc 480 gccctcgctg ccggatgcac ggccatcgtc aagccggctg cccagacgtc attgatcacc 540 gcggcaatga tccgttgtct cgaccagccg gcgcttcccg ccggtgctgt caatctgctt 600 ctcgaaaacg gcgcagaagc cgctgcgcga ctggtcgagt ccgccgatgt cgatgtgatc 660 agctttacgg gttcgacgga agtcggcaag cgaatcatgc gcgccgctgc agacagcatg 720 aagcgattgt cgcttgagct gggcggcaaa tcgtgttgtc tcgtcttcga ggacagcgac 780 gttaaggcca ttgcacctcg tcttgcccgg gccgcgacca tcatctccgg acaacaatgc 840 accgctgcac ggcgaatact cgtgcatgtg tcaaaggcgg accaaatgcg agacgaactc 900 gtcaaagcac tcgcaagcct caaggttggc ccagggatcg atcccgcttc cgacattggc 960 gcgctgatcg atgctgcgtc ccgcgacgct gtccagacca cggttgaacg agcgtgtgac 1020 cttgcagatc gcgtgctctt gcgcgggact tcgagcggac cgggcgcctt tctgtcaccg 1080 acgctggtcg agcacggaga acctcacgcc ttcttttgcc aggacgagat ctttggcccg 1140 ttcgtcacgt tagagacctt tgtgaccgaa aaggaagccg ttgaaaaggc aaacaacacc 1200 gtttttggcc tgtccgcgag cgtgtggacc cacgactcgg ctcgggcttt ccggattgcg 1260 cgtgcgctgc gtgatgggac cgtctggatc aacgaccaca acaggttgtt cgcagaggcc 1320 gaaactggcg gctatcggca gagcggactg ggccggttgc acggctatga cgcgctagcg 1380 gacttcacgg agatcaagca tatctgtgtc ggtgcaggag tcctggaagg catcgaagtg 1440 cttggctcgt ga 1452 <210> 29 <211> 1452 <212> DNA <213> Azospirillum sp. B510 <400> 29 gtgaccaact tggacagccg gcattggatc gacggcgcat gggtgcccgg caccgaccgc 60 ttcgccagca tcaaccccgc cgacggcagc gtcctcggcc atgccgccga tggcggacgc 120 gccgaggccg aggccgccat cgccgccgcg catgccgcct tcaatcggcc cgactgggcg 180 caaaacccgc ggctgcgcca atccatcctg ctcggctggg ccgacaggct cgacacgcaa 240 gccgaggatc tcgcccgcct gctgacgctg gagaacggca aggccatcgc ccagtcgcgg 300 ggcgagatcg ccggcgccat ttcggaaatc cgctattacg gcggcctcgc tcgccatgtt 360 cccggccatg tgctggaggt cgagccgggc gtgctgtcca ccatgctgcg agagccggcc 420 ggcgtggcgg cgctgatcat tccgtggaat gcgccggcgg tgctgctggc gcgggccatc 480 ggtccggcgc tggcctgcgg ctgcaccgtc gtggtcaagc cggcggcaca gaccaccttg 540 ctgaccgccg ccttcctgcg cgccctgtcc gaggttccca gcctgccccg cggcgtctgc 600 aacatgatca gcgagaccgg ccatgccgcc gccgcccgcc tggtcgactc gccgttggtc 660 gacgtggtca gcttcaccgg ctccaccgcc accggcaagc gcatcatggt cgcggcggcg 720 gacaccatga agaagctgtc gctggagctg ggcggcaaga gctgctgctt ggtcttcccc 780 gacgccgatc cggcagagac cgcggcgcgc atcgccaccg ccgccaccat catctccggc 840 cagcaatgca ccgccgcccg ccgggtgctg gtccatgcat cggccttcga cgcgatgaag 900 acacatctgc gggcagcgtt ggcggccatg acggtgggga acggcctcga tccggcgata 960 cggatgggac cgctgatcga ccggccggcg cgcgatcagg tgcagaccca ggtcgaacgg 1020 gccttcgatg cctgcgacga ggtgctgctg cgtggcgggg tgccgacgga cagccccgcc 1080 gccgcgtcgt tcctcacccc atcgctggtg gcgcacgacg acccctccgc cttcttctgc 1140 caggacgaga ttttcggccc cttcgtcgtg ctggagcgct tcgagaccga agcggaggcg 1200 gtggccaagg ccaacaacac cgtgttcggc ctgtcggcca gcgtctggac ccgcgacggc 1260 gcccgggcgt tgcgcatggc ccgggcgttg cgcaatggaa ccgtctggat caacgaccac 1320 aaccgcctgt tcgccgaggc ggaaacaggc ggctaccggc aaagcggcct gggccggttg 1380 cacggctacg atgccttcgc cgatttcacg gaactgaagc atgtttgcca gacggtggga 1440 accattggct ga 1452 <210> 30 <211> 1443 <212> DNA <213> Pseudomonas putida <400> 30 atgcaaagcc aacactacat cgatggacaa tggacctcaa cggatcgttg gaccgacagt 60 ctcgacccgg caagcggcga actgatcgga tgctttgccg acggcggcga ggccgaagct 120 gaagcggcgg tggcagcggc cgcccgagcc ttcaacgacc cgcaatgggc gcagaatcca 180 cgcctgcgtc agcagctatt gctggagtgg gctgccggcc tgaaggcgcg tcaggaacaa 240 ctcgcgcaat tgctgacgcg cgagaacggc aaggcattgg cgcagtcccg aggagagatc 300 ggcggggcta tttccgagat tctttactac gccggcctgg cccggcataa cccggggcac 360 atgctagaag tggcgcccgg tgagttctcc agcatgctgc gcgaacccgc cggggtggcg 420 gggctgatca ttccatggaa tgccccggcg gtgctgctgg ttcgtgctct ggcgccagcg 480 atcgcggcgg gttgtacagt ggtgatcaaa cccgcgccgc aaaccgcgct attcaatgct 540 gcgatgctcg aaccgctgtt cgcattgcca ggcctgccgg ctggggcggt caatctattc 600 gccgagagcg ggcatgccgg ggctgcgcat ttggtggctt cgccacgggt ggacgtgctc 660 agcttcaccg gctcgactgc tacgggccag cgcatcatgc gcgactgcgc ggcgactatg 720 aagaagctct ctctggaact gggcgggaaa tcttgctgcc tggtctttga agatgccgat 780 attgccgcca tcgcgccgaa actggcagcg gcggccacca ttatctctgg ccagcaatgc 840 actgccgccc ggcgcgtact ggtgcatgcc agccgtttcg ccgaaatgaa aaccgcgctg 900 agcgccgcac tggggcagat ccgcctgggt aatggcctcg atccagcgaa caacatggga 960 ccgctgatcg actggcattc ccgggacagc gttgagcggc gcattggcga ggcgctggac 1020 agctgtgacg aagtgctgct ggccggaggt cgcccgcagg gtgaactgag caaaggcgca 1080 tttctcgcgc cgtcgctgat cgcccatcgc gacagcagcg cattcttttg tcaggaagaa 1140 atttttggcc cgttgctggt actggagtcg ttcgaagacg aaaccgaggc tgtagcgcgc 1200 gccaaccata ccgagttcgg tctgtccgcg agtgtctgga ccgatcaggg tgctcgcgcc 1260 tggcgtgtcg ctcgggcact gcgcaacggt acggtgtggc tcaacgacca caacagattg 1320 tttgccgagg cggaaaccgg tggctatcga aagagcggtc tggggcgctt gcatggcgtc 1380 gatgcgctgc tggatttcag cgagctcaaa cacatttatc agaacgtcgg cacgctcggt 1440 tga 1443 <210> 31 <211> 1461 <212> DNA <213> Rhodopseudomonas palustris BisB18 <400> 31 atgggcatga ctgctctgca tgcggataat ctgatcgacg gcgcctggca gccggcgcaa 60 tccggcgcca cggcgccgag ccttgatccg tcgagcggcg gcacgatcgg tggcttcgcg 120 gctggtggcg cggcggatgc gcaggccgcg gtagcggcgg cgcggcgcgc cttcgagcgg 180 ccggagtggt cgcagaaccc gcgggcgcgg cagatggtga tgctgcgctg ggccgaccgg 240 atggaggcgc aggccgatca gctcgcccgg ctgctgacac tggagaacgg caagccgctg 300 ccgcagtcgc gcggcgaaat cgccggcagc gtctcggaga tccgttatta cgccgggctc 360 acgcgttaca tccccggcca cgtgttcgag gtcgagccgg gcagtttctc gacgttgttg 420 aaagaaccgg ccggcgtcgc cggactgatc attccgtgga acgcgccggc ggtgctgctg 480 atccgcgcgc tgacgccggc gctcgccgcc ggctgcaccg tggtgatcaa gccggcgccg 540 cagaccgcgc agatcaccgc cgcgatcatc aaatgcctgc acgaggtcga cgggctgccg 600 cgcggcgtgg tcaatctggt cagcgagcag ggccaccaag tggccgagca tctggtgacc 660 tcgaacgacg tcgacgtcat cagcttcacc ggctccaacg ccaccggcgc gcggatcatg 720 gcggcggcgg cgccgaccat gaagaaactg tcgctcgagc tcggcggcaa atccgcttgc 780 ctggtgttcg acgacgccga tatcgccgac gtggctccga agctcgccgc tgccgccacc 840 atcatcgccg gccagcaatg caccgccgcg cgccgcgtgc tggtgcatgc ctcgcgctac 900 gacgagatga aggcggcgct gaaagccgcg ctggcgaaca tccgcattgc gccgggcagc 960 gcggcgggcg ccgagatggg tccgctgatc gacgcagcct cgctggccgc cgtggcgaag 1020 cgcgccgacg aggcgatgca ggccgccgac gaggtggtgc tgcgcggcgg caggcccgcc 1080 ggcgacctcg ccaacggtta cttcctgtcg ccgacgctcg tggcgcatcg cgacacgtcg 1140 gcgttcttcg tccaggaaga gatttttggg ccgctggtgg tgctcgaaaa attcgaggac 1200 gagaaggagg cggtggcccg cgccaatcac agcgactacg ggctgtccgc cagcgtgtgg 1260 acccatgacg gcgcccgcgc gatgcgggtg gcgagggcgc tgcgcaacgg cacggtgtgg 1320 atcaacgacc acaacaagct attcgccgaa gccgagaccg gcggttatcg ccgcagcggg 1380 ctcggccgcc tgcacggcta tgacgcgctg atcgacttcc tcgagatcaa gcacgtctat 1440 cagagctgcg gcgtagtgta g 1461 <210> 32 <211> 1458 <212> DNA <213> Dinoroseobacter shibae DFL 12 <400> 32 atgacaacga cggacctgat cgcgcggcac atgatcggcg gctcctattc ggacgcgggc 60 gacaagatcg cgtcgatcaa cccggcgacc ggggcggtcg ttgggcatgt ccgggccgac 120 ggcgcggcgc aggccacagc cgccattgcc gccgcgcggg ccgcattcga cacaacgctc 180 tggccgcaat caccccgcga ccggcagatg gccctgctgc ggtgggccga cgcgctggag 240 gccgatctcg cacggcttgc ggaattgctg acgttgacca atggcaaacc gcttggcgcg 300 tccaagggcg aattgggcgc ggcgatatcg gaaatccgat actatgcggg cctgacccgc 360 cacaatcccg gccacgcgat ggaagtggcg ccgggcgagc tttcggtgat gctgcgcgag 420 ccggccgggg tcgcgggcat catcgtgccg tggaacgcac ccgccgtgct gctgatccgg 480 tcgctcgctc cggcgctggc ggtgggctgc acgaccgtga cgaaacccgc gccgcagacg 540 gcgctgttca ccgcggcctg catggccccg ctgttcgagg atgccgccat ccccgcgggc 600 gtggtcaatg tggttttcga ggtcggtcat gacgcagcgc aaacgctggt cacatcgccc 660 gatgtcgatg tcatcagctt taccggctcg aacgcggtcg gccagcggat catggcggac 720 gccgcgccga cgatgaagaa actgtcgctg gaactgggcg gcaaatcctg ctgcatcgtg 780 ctggatgatg cagacatcgg cgtggtggca ccgaaacttg ccgccgcagc cacgatcatc 840 tccggccagc aatgcaccgc ggcgcgtcgg gttctggtgc acgaatcccg gcttgatgaa 900 gcgaaaagcg cgctttccgc tgcgcttcag gctgtctcca tcggcgacgg catgtcagac 960 ggcactgcga tggggccgct gatcgacatc cagtcgcgcg accgggtcat gcgtgattgc 1020 ggaacggtat acgataccgc cgacgaggtc gtgctgcgcg gcggcccgct cgacggtccg 1080 aagggcagcg cgttcatgtc gccggcgctg gtcgtgcata gcgatccgaa cgccagcttc 1140 gtacaggacg aaattttcgg cccgcttgtg gtgcttgaga cgttccgaga cgaggcggat 1200 gcggtggcaa aggcaaacaa caccgtctat ggcttgtccg catcaatctg gacccatcgc 1260 ggcgatgcgt catggcggct ggcgcgtgcc ctgcgcaatg gcaccgtctg gatcaacgac 1320 cacaacaggc ttttcgccga agccgagacc ggcggctatc gccgttcggg cctgggcaga 1380 ttgcacggtt tcgacggtct gctcgatttc tgcgagctca agcacgttta ccagaacgtc 1440 ggtgtcgtcg gtcactga 1458 <210> 33 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 33 atgcggccgc aacaaggaga agatggaatg aacg 34 <210> 34 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 34 atgcggccgc gcgtcggggt cggtgcta 28

Claims

(i) 서열번호 1, 2, 3 또는 4에 나타낸 아미노산 서열과 45% 이상, 바람직하게는 60% 이상, 예를 들면, 70% 이상, 보다 바람직하게는 80% 이상, 예를 들면, 90%, 가장 바람직하게는 95% 이상의 서열 유사성을 갖는 아미노산 서열을 포함하는 제 1 폴리펩티드를 암호화하는 제 1 폴리뉴클레오티드 서열; 및
(ii) 5-(하이드록시메틸)푸란-2-카복실산(HMF-산) 전환 활성을 갖는 제 2 폴리펩티드를 암호화하는 제 2 폴리뉴클레오티드 서열
을 포함하는 유전자 변형 세포로서,
적어도 제 1 폴리뉴클레오티드 서열의 기능적 도입에 의해, 바람직하게는 제 1 및 제 2 폴리뉴클레오티드 서열 둘 다의 기능적 도입에 의해 유전자 변형된 것을 특징으로 하는 유전자 변형 세포.
제 1 항에 있어서,
제 2 폴리펩티드가 5-(하이드록시메틸)푸란-2-카복실산 옥시도리덕타제, 바람직하게는 서열번호 5 또는 6에 나타낸 아미노산 서열과 45% 이상, 바람직하게는 60% 이상, 예를 들면, 70% 이상, 보다 바람직하게는 80% 이상, 예를 들면, 90%, 가장 바람직하게는 95% 이상의 서열 유사성을 갖는 아미노산 서열을 갖는 폴리펩티드인 유전자 변형 세포.
제 1 항 또는 제 2 항에 있어서,
제 1 폴리뉴클레오티드 서열이 서열번호 7, 8, 9 또는 10에 나타낸 뉴클레오티드 서열과 45% 이상, 바람직하게는 60% 이상, 예를 들면, 70% 이상, 보다 바람직하게는 80% 이상, 예를 들면, 90%, 가장 바람직하게는 95% 이상의 서열 유사성을 갖는 뉴클레오티드 서열을 포함하는 유전자 변형 세포.
제 1 항 내지 제 3 항 중 어느 한 항에 있어서,
제 2 폴리뉴클레오티드 서열이 서열번호 11 또는 12에 나타낸 뉴클레오티드 서열과 45% 이상, 바람직하게는 60% 이상, 예를 들면, 70% 이상, 보다 바람직하게는 80% 이상, 예를 들면, 90%, 가장 바람직하게는 95% 이상의 서열 유사성을 갖는 뉴클레오티드 서열을 포함하는 유전자 변형 세포.
제 1 항 내지 제 4 항 중 어느 한 항에 있어서,
서열번호 19, 20, 21, 22, 23, 24 또는 25에 나타낸 아미노산 서열과 45% 이상, 바람직하게는 60% 이상, 예를 들면, 70% 이상, 보다 바람직하게는 80% 이상, 예를 들면, 90%, 가장 바람직하게는 95% 이상의 서열 유사성을 갖는 아미노산 서열을 포함하는 제 3 폴리펩티드를 암호화하는 제 3 폴리뉴클레오티드 서열을 포함하는 유전자 변형 세포.
제 1 항 내지 제 5 항 중 어느 한 항에 있어서,
제 3 폴리뉴클레오티드 서열이 서열번호 26, 27, 28, 29, 30, 31 또는 32에 나타낸 뉴클레오티드 서열과 45% 이상, 바람직하게는 60% 이상, 예를 들면, 70% 이상, 보다 바람직하게는 80% 이상, 예를 들면, 90%, 가장 바람직하게는 95% 이상의 서열 유사성을 갖는 뉴클레오티드 서열을 포함하는 유전자 변형 세포.
제 1 항 내지 제 6 항 중 어느 한 항에 있어서,
박테리아 세포와 같은 원핵 세포, 또는 효모 세포, 진균 세포, 식물 세포 또는 동물 세포와 같은 진핵 세포인 유전자 변형 세포.
제 1 항 내지 제 7 항 중 어느 한 항에 있어서,
원핵 세포, 바람직하게는 에스케리키아( Escherichia ), 아나바에나( Anabaena ), 카울로박터 ( Caulobacter ), 글루코노박터 ( Gluconobacter ), 로도박 터( Rhodobacter ), 슈도모나스( Pseudomonas ), 파라코커스 ( Paracoccus ), 바실러스( Bacillus ), 브레비박테리움 ( Brevibacterium ), 코리네박테리움( Corynebacterium ), 리조븀 ( Rhizobium )( 시노리조븀 ( Sinorhizobium )), 브래디리조븀( Bradyrhizobium ), 플라보박테리움 ( Flavobacterium ), 클렙시엘라 ( Klebsiella ), 엔테로박터( Enterobacter ), 락토바실러스 ( Lactobacillus ), 락토코커스( Lactococcus ), 메틸로박테리움 ( Methylobacterium ), 스태필로코커스( Staphylococcus ), 스트렙토마이세스 ( Streptomyces ), 지모모나스 ( Zymomonas ), 아세토박터( Acetobacter ), 스트렙토코커스 ( Streptococcus ), 박터로이데스( Bacteroides ), 셀레노모나스 ( Selenomonas ), 메가스파에라 ( Megasphaera ), 버크홀데리아( Burkholderia ), 큐프리아비더스 ( Cupriavidus ), 랄스토니아 ( Ralstonia ), 메틸로박테리움( Methylobacterium ), 메틸로보러스 ( Methylovorus ), 로도슈도모나스( Rhodopseudomonas ), 아시디필리움 ( Acidiphilium ), 디노로세오박터( Dinoroseobacter ), 아그로박테리움( Agrobacterium ), 설폴로부스 ( Sulfolobus) 및 스핀고모나스( Sphingomonas) 속으로부터 선택된 박테리아 세포, 보다 바람직하게는 바실러스 서브틸리스 ( Bacillus subtilis ), 바실러스 아밀로리퀘파시엔스( Bacillus amyloliquefaciens ), 바실러스 리케니포미스( Bacillus licheniformis), 바실러스 푼티스 ( Bacillus puntis ), 바실러스 메가테리움( Bacillus megaterium ), 바실러스 할로두란스 ( Bacillus halodurans ), 바실러스 푸밀러스( Bacillus pumilus ), 글루코노박터 옥시단스 ( Gluconobacter oxydans ), 카울로박터 크레센투스 ( Caulobacter crescentus ), 메틸로박테리움 엑스토르쿠엔스( Methylobacterium extorquens ), 메틸로박테리움 라디오톨레란스( Methylobacterium radiotolerans ), 메틸로박테리움 노둘란스( Methylobacterium nodulans), 로도박터 스파에로이데스 ( Rhodobacter sphaeroides ), 슈도모나스 제아잔티니파시엔스( Pseudomonas zeaxanthinifaciens ), 슈도모나스 푸티다( Pseudomonas putida), 슈도모나스 푸티다 S12, 파라코커스 데니트리피칸스( Paracoccus denitrificans), 에스케리키아 콜라이 ( Escherichia coli ), 코리네박테리움 글루타 미쿰( Corynebacterium glutamicum ), 스태필로코커스 카르노서스( Staphylococcus carnosus), 스트렙토마이세스 리비단스 ( Streptomyces lividans ), 시노리조븀 멜리로티( Sinorhizobium meliloti ), 브래디리조븀 자포니쿰( Bradyrhizobium japonicum), 리조븀 라디오박터 ( Rhizobium radiobacter ), 리조븀 레구미노사룸( Rhizobium leguminosarum ), 리조븀 레구미노사룸 bv. 트리폴리( Rhizobium leguminosarum bv. trifolii ), 아그로박테리움 라디오박터( Agrobacterium radiobacter), 큐프리아비더스 바실렌시스 ( Cupriavidus basilensis ), 큐프리아비더스 네카토르 ( Cupriavidus necator )( 랄스토니아 유트로파 ( Ralstonia eutropha )), 랄 스토니아 피케티 ( Ralstonia pickettii ), 버크홀데리아 피토피르만스( Burkholderia phytofirmans), 버크홀데리아 피마툼 ( Burkholderia phymatum ), 버크홀데리아 제노보란스( Burkholderia xenovorans ), 버크홀데리아 그라미니스( Burkholderia graminis), 로도슈도모나스 팔루스트리스 ( Rhodopseudomonas palustris ), 아시디필리움 크립툼 ( Acidiphilium cryptum ), 디노로세오박터 시바에( Dinoroseobacter shibae), 설폴로부스 아시도칼다리우스 ( Sulfolobus acidocaldarius ), 설폴로부스 이슬란디쿠스( Sulfolobus islandicus ), 설폴로부스 솔파타리쿠스( Sulfolobus solfataricus), 설폴로부스 토코다이(Sulfolobus tokodaii)로 이루어진 군으로부터 선택된 박테리아 세포인 유전자 변형 세포.
제 1 항 내지 제 8 항 중 어느 한 항에 있어서,
진핵 숙주 세포, 예를 들면, 포유동물, 곤충, 식물, 진균류 또는 조류(algal) 세포, 예를 들면, 차이니즈 햄스터 난소(CHO) 세포, COS 세포, 293 세포, PerC6 세포 및 하이브리도마로부터 선택된 포유동물 세포, Sf9 및 Sf21 세포 및 이들의 유도체로부터 선택된 곤충 세포, 바람직하게는 캔디다( Candida ), 한세눌라( Hansenula ), 클루이베로마이세스 ( Kluyveromyces ), 피치아 ( Pichia ), 사카로마이세스( Saccharomyces ), 쉬조사카로마이세스 ( Schizosaccharomyces) 또는 야로이야( Yarrowia) 종과 같은 진균 또는 효모 세포로부터 선택된 진핵 세포, 보다 바람직하게는 클루이베로마이세스 락티스 ( Kluyveromyces lactis ), 사카로마이세스 세레비지에( Saccharomyces cerevisiae ), 한세눌라 폴리모르파 ( Hansenula polymorpha ), 야로이야 리포라이티카 ( Yarrowia lipolytica ), 피치아 스티피티스( Pichia stipitis) 및 피치아 파스토리스(Pichia pastoris)로부터 선택된 진핵 세포, 또는 아문 진균문(Eumycota) 및 난균문(Oomycota)으로부터 선택된 종, 또는 선택적으로 아크레모늄( Acremonium ), 아가리쿠스( Agaricus ), 아스퍼질러스 ( Aspergillus ), 오레오바시듐 ( Aureobasidium ), 크리소스포륨( Chrysosporium ), 코프리누스 ( Coprinus ), 크립토코커스 ( Cryptococcus ), 필리바시듐( Filibasidium ), 푸사리움 ( Fusarium ), 후미콜라( Humicola ), 마그나포르테( Magnaporthe ), 뮤코 ( Mucor ), 마이셀리오프토라 ( Myceliophthora ), 네오칼리마스틱스( Neocallimastix ), 뉴로스포라 ( Neurospora ), 페실로마이세스( Paecilomyces ), 페니실리움 ( Penicillium ), 피로마이세스( Piromyces ), 파네로카에테 ( Phanerochaete ), 플레우로투스 ( Pleurotus ), 쉬조필룸 ( Schizophyllum ), 탈라로마이세스( Talaromyces ), 터모아스쿠스 ( Thermoascus ), 티 엘라비아( Thielavia ), 톨리포클라듐 ( Tolypocladium) 또는 트리코더마 ( Trichoderma) 속으로부터의 종, 예를 들면, 아스퍼질러스 니거 ( Aspergillus niger ), 아스퍼질러스 아와모리 ( Aspergillus awamori ), 아스퍼질러스 포에티두스( Aspergillus foetidus), 아스퍼질러스 소재( Aspergillus sojae ), 아스퍼질러스 푸미가투스( Aspergillus fumigatus ), 탈라로마이세스 에메르소니 ( Talaromyces emersonii ), 아스퍼질러스 오리재( Aspergillus oryzae ), 크리소스포륨 루크노웬 스( Chrysosporium lucknowense ), 트리코더마 레세이 ( Trichoderma reesei) 또는 페 니실리움 크리소게눔( Penicillium chrysogenum)으로부터의 사상균 세포인 유전자 변형 세포.
제 1 항 내지 제 9 항 중 어느 한 항에 있어서,
제 1 및 제 2 폴리뉴클레오티드 서열이 단일 벡터, 선택적으로 제 3 폴리뉴클레오티드 서열을 추가로 포함하는 벡터 상에 위치하는 유전자 변형 세포.
(i) 서열번호 1, 2, 3 또는 4에 나타낸 아미노산 서열과 45% 이상, 바람직하게는 60% 이상, 예를 들면, 70% 이상, 보다 바람직하게는 80% 이상, 예를 들면, 90%, 가장 바람직하게는 95% 이상의 서열 유사성을 갖는 아미노산 서열을 포함하는 제 1 폴리펩티드를 암호화하는 제 1 폴리뉴클레오티드 서열; 및
(ii) 5-(하이드록시메틸)푸란-2-카복실산(HMF-산) 전환 활성을 갖는 제 2 폴리펩티드를 암호화하는 제 2 폴리뉴클레오티드 서열
을 포함하는 벡터.
제 11 항에 있어서,
제 2 폴리펩티드가 5-하이드록시메틸푸로산 옥시도리덕타제, 바람직하게는 서열번호 5 또는 6에 나타낸 아미노산 서열과 45% 이상, 바람직하게는 60% 이상, 예를 들면, 70% 이상, 보다 바람직하게는 80% 이상, 예를 들면, 90%, 가장 바람직하게는 95% 이상의 서열 유사성을 갖는 아미노산 서열을 갖는 폴리펩티드인 벡터.
제 11 항 또는 제 12 항에 있어서,
제 1 폴리뉴클레오티드 서열이 서열번호 7, 8, 9 또는 10에 나타낸 뉴클레오티드 서열과 45% 이상, 바람직하게는 60% 이상, 예를 들면, 70% 이상, 보다 바람직하게는 80% 이상, 예를 들면, 90%, 가장 바람직하게는 95% 이상의 서열 유사성을 갖는 뉴클레오티드 서열을 포함하는 벡터.
제 11 항 내지 제 13 항 중 어느 한 항에 있어서,
제 2 폴리뉴클레오티드 서열이 서열번호 11 또는 12에 나타낸 뉴클레오티드 서열과 45% 이상, 바람직하게는 60% 이상, 예를 들면, 70% 이상, 보다 바람직하게는 80% 이상, 예를 들면, 90%, 가장 바람직하게는 95% 이상의 서열 유사성을 갖는 뉴클레오티드 서열을 포함하는 벡터.
제 11 항 내지 제 14 항 중 어느 한 항에 있어서,
서열번호 19, 20, 21, 22, 23, 24 또는 25에 나타낸 아미노산 서열과 45% 이상, 바람직하게는 60% 이상, 예를 들면, 70% 이상, 보다 바람직하게는 80% 이상, 예를 들면, 90%, 가장 바람직하게는 95% 이상의 서열 유사성을 갖는 아미노산 서열을 포함하는 제 3 폴리펩티드를 암호화하는 제 3 폴리뉴클레오티드 서열을 포함하는 벡터.
제 11 항 내지 제 15 항 중 어느 한 항에 있어서,
제 3 폴리뉴클레오티드 서열이 서열번호 26, 27, 28, 29, 30, 31 또는 32에 나타낸 뉴클레오티드 서열과 45% 이상, 바람직하게는 60% 이상, 예를 들면, 70% 이상, 보다 바람직하게는 80% 이상, 예를 들면, 90%, 가장 바람직하게는 95% 이상의 서열 유사성을 갖는 뉴클레오티드 서열을 포함하는 벡터.
제 1 항 내지 제 10 항 중 어느 한 항에 따른 세포에 의한 5-(하이드록시메틸)푸란-2-카복실산(HMF-산)의 전환에 적합한 조건하에서 HMF-산의 존재하에 상기 세포를 배양하는 것을 포함하는, HMF-산 전환 방법.
제 17 항에 있어서,
HMF-산이 세포에 의한 하나 이상의 푸란 전구체의 HMF-산으로의 전환에 적합한 조건하에서 HMF-산의 하나 이상의 푸란 전구체로부터 동일반응계내에서 생성되는 HMF-산 전환 방법.
제 17 항 또는 제 18 항에 있어서,
세포의 제 2 폴리펩티드가 HMF-산 옥시도리덕타제이고, 세포를 HMF-산의 FDCA로의 전환에 적합한 조건에 적용시키는 것을 추가로 포함하는 HMF-산 전환 방법.
제 17 항 내지 제 19 항 중 어느 한 항에 있어서,
푸란 전구체가 5-(하이드록시메틸)푸란-2-카브알데하이드(HMF), 푸란-2,5-다이카브알데하이드(DFF), [5-(하이드록시메틸)푸란-2-일]메탄올(HMF 알콜)을 포함하는 군으로부터 선택되고, 바람직하게는 HMF인 HMF-산 전환 방법.
제 17 항 내지 제 20 항 중 어느 한 항에 있어서,
푸란 전구체가 하나 이상의 육탄당, 바람직하게는 리그노셀룰로스 바이오매스로부터 수득된 하나 이상의 육탄당으로부터, 예를 들면, 산-촉진된 탈수에 의해 수득되는 HMF-산 전환 방법.
제 17 항 내지 제 21 항 중 어느 한 항에 있어서,
FDCA가 산 침전, 및 이어서 냉각 결정화 또는 선택적으로 용매 추출을 포함하는 방법에 의해 반응 혼합물로부터 회수되는 HMF-산 전환 방법.
다수의 푸란 전구체의 FDCA로의 생물전환을 위한, 제 1 항 내지 제 10 항 중 어느 한 항에 따른 유전자 변형 세포의 용도.
제 23 항에 있어서,
다수의 푸란 전구체가 5-(하이드록시메틸)푸란-2-카브알데하이드(HMF), [5-(하이드록시메틸)푸란-2-일]메탄올(HMF 알콜), 5-(하이드록시메틸)푸란-2-카복실산(HMF-산), 푸란-2,5-다이카브알데하이드(DFF) 또는 5-포밀푸란-2-카복실산(FFA)을 포함하는 군으로부터 선택되는 용도.