KR20140015439A - 유전자 변형 세포 및 이 세포의 사용 방법 - Google Patents
유전자 변형 세포 및 이 세포의 사용 방법 Download PDFInfo
- Publication number
- KR20140015439A KR20140015439A KR1020137026204A KR20137026204A KR20140015439A KR 20140015439 A KR20140015439 A KR 20140015439A KR 1020137026204 A KR1020137026204 A KR 1020137026204A KR 20137026204 A KR20137026204 A KR 20137026204A KR 20140015439 A KR20140015439 A KR 20140015439A
- Authority
- KR
- South Korea
- Prior art keywords
- ala
- leu
- gly
- val
- arg
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
- C12N1/14—Fungi; Culture media therefor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
- C12N1/20—Bacteria; Culture media therefor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/10—Cells modified by introduction of foreign genetic material
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0008—Oxidoreductases (1.) acting on the aldehyde or oxo group of donors (1.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P17/00—Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
- C12P17/02—Oxygen as only ring hetero atoms
- C12P17/04—Oxygen as only ring hetero atoms containing a five-membered hetero ring, e.g. griseofulvin, vitamin C
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y102/00—Oxidoreductases acting on the aldehyde or oxo group of donors (1.2)
- C12Y102/01—Oxidoreductases acting on the aldehyde or oxo group of donors (1.2) with NAD+ or NADP+ as acceptor (1.2.1)
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Biomedical Technology (AREA)
- Medicinal Chemistry (AREA)
- Molecular Biology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Biophysics (AREA)
- Tropical Medicine & Parasitology (AREA)
- Virology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Gastroenterology & Hepatology (AREA)
- Cell Biology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Botany (AREA)
- Mycology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
본 발명은 푸란 화합물의 생물전환 분야에 관한 것이다. 보다 특히, 본 발명은 푸란 화합물의 생체촉매적 형질전환에 개선된 특징을 갖는 새로운 유전자 변형 세포 및 숙주 세포의 유전자 변형에 적합한 벡터에 관한 것이다. 본 발명의 다른 양태는 본 발명에 따른 세포의 사용에 의한 5-(하이드록시메틸)푸란-2-카복실산(HMF-산) 및 이의 전구체의 생물전환 방법을 목적으로 한다.
Description
본 발명은 일반적으로 푸란 화합물의 생물전환(biotransformation) 분야에 관한 것이다. 상기 생물전환은 푸란-2,5-다이카복실산(FDCA)의 제조 및 리그노셀룰로스 함유 물질의 가공에서, 예를 들면, 생물연료 및 생화학물질의 제조에 유용성을 갖는다. 보다 특히, 본 발명은 푸란 화합물의 생체촉매적 형질전환에 개선된 특성을 갖는 신규 유전자 변형 세포에 관한 것이다. 본 발명의 다른 양태는 푸란 화합물의 생물전환을 위해 그 특성을 개선하기 위한 숙주 세포의 유전자 변형에 적합한 벡터에 관한 것이다. 본 발명의 다른 양태는 본 발명에 따른 세포의 사용에 의한 5-(하이드록시메틸)푸란-2-카복실산(HMF-산) 및 이의 전구체의 생물전환 방법에 관한 것이다.
푸란 화합물의 생물전환에 관심이 증가하고 있다. 이것은 바이오매스(biomass)로부터의 유망한 부가 가치 화학물질인 푸란-2,5-다이카복실산(FDCA)의 바이오생산(bioproduction)(문헌[Werpy et al., Top Value-Added Chemicals from Biomass, Volume I - Results of screening for portential Candidates from Sugars and Synthesis gas (2004)]), 및 리그노셀룰로스 함유 물질로부터 생물연료 및 생화학물질의 발효 생산(문헌[Almeida et al., Metabolic effects of furaldehydes and impacts on biotechnological processes. Applied Microbiology and Biotechnology, 82(4):625-638 (2009)]) 둘 다에 대해 그러하다.
최근에 푸란 화합물 이용 유기체인 큐프리아비더스 바실렌시스( Cupriavidus basilensis) HMF14가 단리되었다(문헌[Koopman et al., Identification and characterization of the furfural and 5-(hydroxymethyl)furfural degradation pathways of Cupriavidus basilensis HMF14, PNAS, Vol. 107, p.4919-4924 (2010a)]). 상기 유기체는 푸르푸랄 및 5-(하이드록시메틸)푸란-2-카브알데하이드(HMF)를 대사시킬 수 있다. 큐프리아비더스 바실렌시스 HMF14의 푸르푸랄 및 HMF 분해 경로는 수반되는 유전자와 함께 문헌[Koopman et al., Identification and characterization of the furfural and 5-(hydroxymethyl)furfural degradation pathways of Cupriavidus basilensis HMF14, PNAS, Vol. 107, p.4919-4924 (2010a)]에 개시되었다.
슈도모나스 푸티다 ( Pseudomonas putida) S12에서 큐프리아비더스 바실렌시스 HMF14로부터의 hmfH 유전자의 기능적 도입이 문헌[Koopman et al., Efficient whole-cell biotransformation of 5-(hydroxymethyl)furfural into FDCA, 2,5-furandicarboxylic acid. Bioresour. Technol., Vol. 101, p.6291-6296 (2010b)]에 개시되어 있다. 생성된 균주는 기질로서 HMF를 사용하여 우수한 FDCA 생성 능력을 갖는다. 그러나, 관찰된 5-(하이드록시메틸)푸란-2-카복실산(HMF-산) 축적은 긴 처리 시간 또는 상기 부산물을 제거하기 위한 대체 수단을 필요로 한다. FDCA가 생성될 수 있고 때때로 필수적인 많은 용도에 HMF-산 부산물의 충분한 제거가 바람직하다.
HMF-산 축적 문제의 해결책을 찾던 중에, 본 발명의 발명자들은 본 발명에 이르러 놀랍게도 슈도모나스 푸티다 S12 FDCA 생산 시스템에서 특정 폴리펩티드의 발현이 HMF-산 축적을 효과적으로 감소시키는 것을 밝혀내었다.
본 발명자들의 상기 발견은 5-(하이드록시메틸)푸란-2-카복실산(HMF-산)을 전환시킬 수 있는 하나 이상의 폴리펩티드와 함께 서열번호 1 또는 2의 아미노산 서열 또는 이의 유사체/동족체(예를 들면, 서열번호 3 또는 4)를 갖는 폴리펩티드의 숙주에서의 발현이 효과적인 HMF-산 생체전환(bioconversion)을 야기한다는 일반적인 개념을 제공하였다. 개선된 HMF-산 생체전환은, 예를 들면, 생물연료의 생산을 위한 에탄올생산성(ethanologenic) 발효 또는 화학물질의 생물학적 생산을 위한 발효를 위한 공급원료와 같이, 푸란 화합물이 해로운 것으로 간주되는 공급원료로부터 HMF-산 및 이의 푸란 전구체의 제거에 유리하다. 다른 용도에서, 개선된 HMF-산 생체전환은, FDCA 바이오생산에서와 같이 HMF-산이 출발 물질 또는 중간체인 화학물질의 바이오생산을 개선할 것이다.
따라서, 본 발명의 첫 번째 목적은 서열번호 1, 2, 3 또는 4의 아미노산 서열 또는 이의 유사체/동족체를 갖는 제 1 폴리펩티드를 암호화하는 제 1 폴리뉴클레오티드, 및 HMF-산 전환 활성을 갖는 제 2 폴리펩티드를 암호화하는 제 2 폴리뉴클레오티드 서열을 포함하는 유전자 변형 세포이다. HMF-산 전환 폴리펩티드는 전술한 큐프리아비더스 바실렌시스 HMF14 hmfH 유전자(문헌[Koopman et al., Identification and characterization of the furfural and 5-(hydroxymethyl)furfural degradation pathways of Cupriavidus basilensis HMF14, PNAS, Vol. 107, p.4919-4924 (2010a)])에 의해 암호화된 옥시도리덕타제일 수 있다. 특정 태양에 따르면, 상기 유전자 변형 세포는 서열번호 19, 20, 21, 22, 23, 24, 25의 아미노산 서열 또는 이의 유사체/동족체를 갖는 제 3 폴리펩티드를 암호화하는 제 3 폴리뉴클레오티드 서열을 포함하는 것이 바람직하다. 제 3 아미노산 서열의 기능적 발현은 푸란 알데하이드를 전환시킬 수 있는 알데하이드 데하이드로게나제 활성을 제공한다.
제 2 폴리펩티드가 옥시도리덕타제인 경우, 옥시도리덕타제와 동시에 제 1 폴리펩티드의 동시-발현은 또한 생체촉매적 FDCA 생산에 대해 옥시도리덕타제를 포함하는 전세포(whole-cell) 생체촉매의 질을 개선시킬 수 있다.
본 발명에 따른 세포는 적어도 제 1 폴리뉴클레오티드 서열의 기능적 도입에 의해 유전자 변형된다. 바람직하게, 상기 세포는 제 1 및 제 2 폴리뉴클레오티드 서열 둘 다의 기능적 도입에 의해 유전자 변형된다. 또는, 상기 세포는 제 1 및 제 3 폴리뉴클레오티드 서열의 기능적 도입에 의해 유전자 변형된다. 제 1, 제 2 및 제 3 폴리뉴클레오티드 3개 모두의 기능적 도입이 또 다른 대안이다.
본 발명의 다른 양태는 숙주 세포의 유전자 변형에 적합한 벡터에 관한 것이다. 상기 벡터는 서열번호 1, 2, 3 또는 4의 아미노산 서열 또는 이의 유사체/동족체를 갖는 제 1 폴리펩티드를 암호화하는 제 1 폴리뉴클레오티드 서열, 및 5-(하이드록시메틸)푸란-2-카복실산(HMF-산) 전환 활성을 갖는 제 2 폴리펩티드를 암호화하는 제 2 폴리뉴클레오티드 서열을 포함한다. 선택적으로, 상기 벡터는 서열번호 19, 20, 21, 22, 23, 24, 25의 아미노산 서열 또는 이의 유사체/동족체를 갖는 제 3 폴리펩티드를 암호화하는 제 3 폴리뉴클레오티드 서열을 포함할 수 있다. 상기 벡터는 본 발명에 따른 유전자 변형 세포를 수득하기에 적합하다.
본 발명의 다른 양태는 5-(하이드록시메틸)푸란-2-카복실산(HMF-산) 전환 방법에 관한 것이다. 상기 방법은 본 발명에 따른 세포를 사용한다. 바람직한 태양에 따르면, 상기 방법은 FDCA의 제조에 적합하다.
본 발명의 또 다른 양태는 푸란 전구체의 FDCA로의 생물전환을 위한, 본 발명에 따른 유전자 변형 세포의 용도를 목적으로 한다.
도 1은 푸란 화합물의 2,5-푸란 다이카복실산으로의 산화 반응을 도식적으로 나타낸 것이다. 다음의 푸란 화합물들이 제공되어 있다: 1, HMF-알콜; 2, HMF; 3, HMF-산; 4, FFA; 5, FDCA.
도 2는 슈도모나스 푸티다 S12_2642(도 2a) 및 B38(도 2b)의 HMF-공급 배양물중 PDCA 생성 및 HMF-산 축적을 나타낸 것이다(◆, FDCA(mM); ■, HMF-산(mM); ○, 세포 건조 중량(CDW; g/l); 점선: HMF 공급률(ml 4M 용액/h)).
도 3은 도 2에 나타낸 유가식(fed-batch) 공정 동안 다양한 시점에서 FDCA 비생산성(specific productivity)을 나타낸 것이다(진한색: 슈도모나스 푸티다 S12_2642; 밝은색: 슈도모나스 푸티다 SZ12_B38).
도 4는 슈도모나스 푸티다 S12_B38(도 4a) 및 B51(도 4b)을 사용한 진탕-플라스크 실험에서 FDCA 생성 및 HMF-산 축적을 나타낸 것이다(▲, HMF(mM); ◆, FDCA(mM); ■, HMF-산(mM); ○, 세포 건조 중량(CDW; g/l)).
도 5는 높은 세포 밀도에서 출발하여 슈도모나스 푸티다 S12_B38의 HMF-공급 고밀도 세포 배양물중 FDCA 생성 및 HMF-산 축적을 나타낸 것이다(□, HMF; ◆, FDCA(mM); ■, HMF-산(mM); ○, 세포 건조 중량(CDW; g/l); 점선: HMF 공급률(ml 4M 용액/h)).
도 6은 슈도모나스 푸티다 S12_B38(동시-발현된 HmfH 및 HmfT1; A); S12_B97(동시-발현된 HmfH, HmfT1 및 알데하이드 데하이드로게나제; B) 및 S12_B101(동시-발현된 HmfH 및 알데하이드 데하이드로게나제; C)의 HMF 함유 진탕-플라스크 배양물중 FDCA, FFA 및 HMF-산의 축적을 나타낸 것이다(▲, HMF(mM); ◆, FDCA(mM); ■, HMF-산(mM); ●, FFA(mM0; ○, 세포 건조 중량(CDW; g/l)).
서열 설명
서열번호 1은 큐프리아비더스 바실렌시스 HMF14로부터의 HmfT1의 아미노산 서열을 나타낸 것이다. 상기 서열은 진뱅크(GenBank) 등록번호 ADE20411.1을 갖는다.
서열번호 2는 큐프리아비더스 바실렌시스 HMF14로부터의 HmfT2의 아미노산 서열을 나타낸 것이다. 상기 서열은 진뱅크 등록번호 ADE20404.1을 갖는다.
서열번호 3은 메틸로박테리움 라디오톨레란스( Methylobacterium radiotolerans) JCM 2831(= ATCC 27329 = DSM 1819)로부터의 유전자좌 표지 mrad2831_4728을 갖는 유전자로부터의 단백질 산물의 아미노산 서열을 나타낸 것이다. 상기 서열은 진뱅크 등록번호 ACB26689.1을 갖는다.
서열번호 4는 설폴로부스 아시도칼다리우스 ( Sulfolobus acidocaldarius) DSM 639로부터의 saci_2058 유전자로부터의 단백질 산물의 아미노산 서열을 나타낸 것이다. 상기 서열은 진뱅크 등록번호 AAY81352.1을 갖는다.
서열번호 5는 큐프리아비더스 바실렌시스 HMF14로부터의 HmfH의 아미노산 서열을 나타낸 것이다. 상기 서열은 진뱅크 등록번호 ADE20408.1을 갖는다.
서열번호 6은 브래디리조븀 자포니쿰 ( Bradyrhizobium japonicum) USDA 110으로부터의 blr0367 유전자로부터의 단백질 산물의 아미노산 서열을 나타낸 것이다. 상기 서열은 진뱅크 등록번호 BAC45632.1을 갖는다.
서열번호 7은 큐프리아비더스 바실렌시스 HMF14로부터의 hmfT1의 암호화 서열을 나타낸 것이다.
서열번호 8은 큐프리아비더스 바실렌시스 HMF14로부터의 hmfT2의 암호화 서열을 나타낸 것이다.
서열번호 9는 메틸로박테리움 라디오톨레란스 JCM 2831(= ATCC 27329 = DSM 1819)로부터의 유전자좌 표지 mrad2831 _4728을 갖는 유전자의 암호화 서열을 나타낸 것이다.
서열번호 10은 설폴로부스 아시도칼다리우스 DSM 639로부터의 saci_2058 유전자의 암호화 서열을 나타낸 것이다.
서열번호 11은 큐프리아비더스 바실렌시스 HMF14로부터의 hmfH의 암호화 서열을 나타낸 것이다.
서열번호 12는 브래디리조븀 자포니쿰 USDA 110으로부터의 blr0367 유전자의 암호화 서열을 나타낸 것이다.
서열번호 13 내지 18은 다양한 합성 프라이머들의 서열을 나타낸 것이다. 제한효소 위치(밑줄), 출발 및 정지 (역 상보성) 코돈(이탤릭체) 및 추정상의 리보솜 결합 부위(소문자)가 표시되어 있다. FN23 프라이머는 hmfH의 출발 코돈 바로 상위에 설계되었다.
서열번호 13은 합성 DNA 프라이머 hmfT1(f)의 뉴클레오티드 서열을 나타낸 것이다: 5'-ACGAATTCAAaggagACAACAATGGAAG-3'.
서열번호 14는 합성 DNA 프라이머 hmfT1(r)의 뉴클레오티드 서열을 나타낸 것이다: 5'-AAGCTAGCTGAGCAGTCACCCTCACTC-3'.
서열번호 15는 합성 DNA 프라이머 FN23의 뉴클레오티드 서열을 나타낸 것이다: 5'-CGGAATTCCACATGACAagggagACCG-3'.
서열번호 16은 합성 DNA 프라이머 FN24의 뉴클레오티드 서열을 나타낸 것이다: 5'-CGGAATTCGCTTCGGTCTTCAACTCGGATG-3'.
서열번호 17은 합성 DNA 프라이머 mrad(f)의 뉴클레오티드 서열을 나타낸 것이다: 5'-ACGAATTCggaggAAATCTATGCAGACC-3'.
서열번호 18은 합성 DNA 프라이머 mrad(r)의 뉴클레오티드 서열을 나타낸 것이다: 5'-AAGCTAGCGCAGAACCGTATCGTCAG-3'.
서열번호 19는 큐프리아비더스 바실렌시스 HMF14로부터의 알데하이드 데하이드로게나제 Adh의 아미노산 서열을 나타낸 것이다.
서열번호 20은 진뱅크 등록번호 YP_003609156.1을 갖는 아미노산 서열을 나타낸 것이다.
서열번호 21은 진뱅크 등록번호 ZP_02881577.1을 갖는 아미노산 서열을 나타낸 것이다.
서열번호 22는 진뱅크 등록번호 YP_003451184.1을 갖는 아미노산 서열을 나타낸 것이다.
서열번호 23은 진뱅크 등록번호 ACA09737.1을 갖는 아미노산 서열을 나타낸 것이다.
서열번호 24는 진뱅크 등록번호 YP_530742.1을 갖는 아미노산 서열을 나타낸 것이다.
서열번호 25는 진뱅크 등록번호 YP_001541929.1을 갖는 아미노산 서열을 나타낸 것이다.
서열번호 26은 큐프리아비더스 바실렌시스 HMF14로부터의 알데하이드 데하이드로게나제 Adh를 암호화하는 adh의 폴리뉴클레오티드 서열을 나타낸 것이다.
서열번호 27은 진뱅크 등록번호 YP_003609156.1을 갖는 아미노산 서열을 암호화하는 폴리뉴클레오티드 서열을 나타낸 것이다.
서열번호 28은 진뱅크 등록번호 ZP_02881577.1을 갖는 아미노산 서열을 암호화하는 폴리뉴클레오티드 서열을 나타낸 것이다.
서열번호 29는 진뱅크 등록번호 YP_003451184.1을 갖는 아미노산 서열을 암호화하는 폴리뉴클레오티드 서열을 나타낸 것이다.
서열번호 30은 진뱅크 등록번호 ACA09737.1을 갖는 아미노산 서열을 암호화하는 폴리뉴클레오티드 서열을 나타낸 것이다.
서열번호 31은 진뱅크 등록번호 YP_530742.1을 갖는 아미노산 서열을 암호화하는 폴리뉴클레오티드 서열을 나타낸 것이다.
서열번호 32는 진뱅크 등록번호 YP_001541929.1을 갖는 아미노산 서열을 암호화하는 폴리뉴클레오티드 서열을 나타낸 것이다.
서열번호 33은 합성 DNA 프라이머 FN13의 뉴클레오티드 서열을 나타낸 것이다: 5'-ATGCGGCCGCAACAaggagAAGATGGAATGAACG-3'(밑줄친 서열: NotI 제한효소 부위; 이탤릭체는 알데하이드 데하이드로게나제 암호화 유전자의 출발 코돈(ATG); 소문자는 추정상의 리보솜 결합 부위(RBS)).
서열번호 34는 합성 DNA 프라이머 FN14의 뉴클레오티드 서열을 나타낸 것이다: 5'-ATGCGGCCGCGCGTCGGGGTCGGTGCTA-3'(밑줄친 서열: NotI 제한효소 부위; 이탤릭체는 정지 코돈(역 상보성 가닥)).
도 2는 슈도모나스 푸티다 S12_2642(도 2a) 및 B38(도 2b)의 HMF-공급 배양물중 PDCA 생성 및 HMF-산 축적을 나타낸 것이다(◆, FDCA(mM); ■, HMF-산(mM); ○, 세포 건조 중량(CDW; g/l); 점선: HMF 공급률(ml 4M 용액/h)).
도 3은 도 2에 나타낸 유가식(fed-batch) 공정 동안 다양한 시점에서 FDCA 비생산성(specific productivity)을 나타낸 것이다(진한색: 슈도모나스 푸티다 S12_2642; 밝은색: 슈도모나스 푸티다 SZ12_B38).
도 4는 슈도모나스 푸티다 S12_B38(도 4a) 및 B51(도 4b)을 사용한 진탕-플라스크 실험에서 FDCA 생성 및 HMF-산 축적을 나타낸 것이다(▲, HMF(mM); ◆, FDCA(mM); ■, HMF-산(mM); ○, 세포 건조 중량(CDW; g/l)).
도 5는 높은 세포 밀도에서 출발하여 슈도모나스 푸티다 S12_B38의 HMF-공급 고밀도 세포 배양물중 FDCA 생성 및 HMF-산 축적을 나타낸 것이다(□, HMF; ◆, FDCA(mM); ■, HMF-산(mM); ○, 세포 건조 중량(CDW; g/l); 점선: HMF 공급률(ml 4M 용액/h)).
도 6은 슈도모나스 푸티다 S12_B38(동시-발현된 HmfH 및 HmfT1; A); S12_B97(동시-발현된 HmfH, HmfT1 및 알데하이드 데하이드로게나제; B) 및 S12_B101(동시-발현된 HmfH 및 알데하이드 데하이드로게나제; C)의 HMF 함유 진탕-플라스크 배양물중 FDCA, FFA 및 HMF-산의 축적을 나타낸 것이다(▲, HMF(mM); ◆, FDCA(mM); ■, HMF-산(mM); ●, FFA(mM0; ○, 세포 건조 중량(CDW; g/l)).
서열 설명
서열번호 1은 큐프리아비더스 바실렌시스 HMF14로부터의 HmfT1의 아미노산 서열을 나타낸 것이다. 상기 서열은 진뱅크(GenBank) 등록번호 ADE20411.1을 갖는다.
서열번호 2는 큐프리아비더스 바실렌시스 HMF14로부터의 HmfT2의 아미노산 서열을 나타낸 것이다. 상기 서열은 진뱅크 등록번호 ADE20404.1을 갖는다.
서열번호 3은 메틸로박테리움 라디오톨레란스( Methylobacterium radiotolerans) JCM 2831(= ATCC 27329 = DSM 1819)로부터의 유전자좌 표지 mrad2831_4728을 갖는 유전자로부터의 단백질 산물의 아미노산 서열을 나타낸 것이다. 상기 서열은 진뱅크 등록번호 ACB26689.1을 갖는다.
서열번호 4는 설폴로부스 아시도칼다리우스 ( Sulfolobus acidocaldarius) DSM 639로부터의 saci_2058 유전자로부터의 단백질 산물의 아미노산 서열을 나타낸 것이다. 상기 서열은 진뱅크 등록번호 AAY81352.1을 갖는다.
서열번호 5는 큐프리아비더스 바실렌시스 HMF14로부터의 HmfH의 아미노산 서열을 나타낸 것이다. 상기 서열은 진뱅크 등록번호 ADE20408.1을 갖는다.
서열번호 6은 브래디리조븀 자포니쿰 ( Bradyrhizobium japonicum) USDA 110으로부터의 blr0367 유전자로부터의 단백질 산물의 아미노산 서열을 나타낸 것이다. 상기 서열은 진뱅크 등록번호 BAC45632.1을 갖는다.
서열번호 7은 큐프리아비더스 바실렌시스 HMF14로부터의 hmfT1의 암호화 서열을 나타낸 것이다.
서열번호 8은 큐프리아비더스 바실렌시스 HMF14로부터의 hmfT2의 암호화 서열을 나타낸 것이다.
서열번호 9는 메틸로박테리움 라디오톨레란스 JCM 2831(= ATCC 27329 = DSM 1819)로부터의 유전자좌 표지 mrad2831 _4728을 갖는 유전자의 암호화 서열을 나타낸 것이다.
서열번호 10은 설폴로부스 아시도칼다리우스 DSM 639로부터의 saci_2058 유전자의 암호화 서열을 나타낸 것이다.
서열번호 11은 큐프리아비더스 바실렌시스 HMF14로부터의 hmfH의 암호화 서열을 나타낸 것이다.
서열번호 12는 브래디리조븀 자포니쿰 USDA 110으로부터의 blr0367 유전자의 암호화 서열을 나타낸 것이다.
서열번호 13 내지 18은 다양한 합성 프라이머들의 서열을 나타낸 것이다. 제한효소 위치(밑줄), 출발 및 정지 (역 상보성) 코돈(이탤릭체) 및 추정상의 리보솜 결합 부위(소문자)가 표시되어 있다. FN23 프라이머는 hmfH의 출발 코돈 바로 상위에 설계되었다.
서열번호 13은 합성 DNA 프라이머 hmfT1(f)의 뉴클레오티드 서열을 나타낸 것이다: 5'-ACGAATTCAAaggagACAACAATGGAAG-3'.
서열번호 14는 합성 DNA 프라이머 hmfT1(r)의 뉴클레오티드 서열을 나타낸 것이다: 5'-AAGCTAGCTGAGCAGTCACCCTCACTC-3'.
서열번호 15는 합성 DNA 프라이머 FN23의 뉴클레오티드 서열을 나타낸 것이다: 5'-CGGAATTCCACATGACAagggagACCG-3'.
서열번호 16은 합성 DNA 프라이머 FN24의 뉴클레오티드 서열을 나타낸 것이다: 5'-CGGAATTCGCTTCGGTCTTCAACTCGGATG-3'.
서열번호 17은 합성 DNA 프라이머 mrad(f)의 뉴클레오티드 서열을 나타낸 것이다: 5'-ACGAATTCggaggAAATCTATGCAGACC-3'.
서열번호 18은 합성 DNA 프라이머 mrad(r)의 뉴클레오티드 서열을 나타낸 것이다: 5'-AAGCTAGCGCAGAACCGTATCGTCAG-3'.
서열번호 19는 큐프리아비더스 바실렌시스 HMF14로부터의 알데하이드 데하이드로게나제 Adh의 아미노산 서열을 나타낸 것이다.
서열번호 20은 진뱅크 등록번호 YP_003609156.1을 갖는 아미노산 서열을 나타낸 것이다.
서열번호 21은 진뱅크 등록번호 ZP_02881577.1을 갖는 아미노산 서열을 나타낸 것이다.
서열번호 22는 진뱅크 등록번호 YP_003451184.1을 갖는 아미노산 서열을 나타낸 것이다.
서열번호 23은 진뱅크 등록번호 ACA09737.1을 갖는 아미노산 서열을 나타낸 것이다.
서열번호 24는 진뱅크 등록번호 YP_530742.1을 갖는 아미노산 서열을 나타낸 것이다.
서열번호 25는 진뱅크 등록번호 YP_001541929.1을 갖는 아미노산 서열을 나타낸 것이다.
서열번호 26은 큐프리아비더스 바실렌시스 HMF14로부터의 알데하이드 데하이드로게나제 Adh를 암호화하는 adh의 폴리뉴클레오티드 서열을 나타낸 것이다.
서열번호 27은 진뱅크 등록번호 YP_003609156.1을 갖는 아미노산 서열을 암호화하는 폴리뉴클레오티드 서열을 나타낸 것이다.
서열번호 28은 진뱅크 등록번호 ZP_02881577.1을 갖는 아미노산 서열을 암호화하는 폴리뉴클레오티드 서열을 나타낸 것이다.
서열번호 29는 진뱅크 등록번호 YP_003451184.1을 갖는 아미노산 서열을 암호화하는 폴리뉴클레오티드 서열을 나타낸 것이다.
서열번호 30은 진뱅크 등록번호 ACA09737.1을 갖는 아미노산 서열을 암호화하는 폴리뉴클레오티드 서열을 나타낸 것이다.
서열번호 31은 진뱅크 등록번호 YP_530742.1을 갖는 아미노산 서열을 암호화하는 폴리뉴클레오티드 서열을 나타낸 것이다.
서열번호 32는 진뱅크 등록번호 YP_001541929.1을 갖는 아미노산 서열을 암호화하는 폴리뉴클레오티드 서열을 나타낸 것이다.
서열번호 33은 합성 DNA 프라이머 FN13의 뉴클레오티드 서열을 나타낸 것이다: 5'-ATGCGGCCGCAACAaggagAAGATGGAATGAACG-3'(밑줄친 서열: NotI 제한효소 부위; 이탤릭체는 알데하이드 데하이드로게나제 암호화 유전자의 출발 코돈(ATG); 소문자는 추정상의 리보솜 결합 부위(RBS)).
서열번호 34는 합성 DNA 프라이머 FN14의 뉴클레오티드 서열을 나타낸 것이다: 5'-ATGCGGCCGCGCGTCGGGGTCGGTGCTA-3'(밑줄친 서열: NotI 제한효소 부위; 이탤릭체는 정지 코돈(역 상보성 가닥)).
일반적 정의
본 명세서 및 첨부된 특허청구범위 전체에 걸쳐서, 단어 "이루어지다" 및 "포함하다" 및 "이루어지는" 및 "포함하는"과 같은 변형은 포괄적으로 이해해야 한다. 즉, 상기 단어들은 문맥이 허용하는 경우 특별히 열거되지 않은 다른 요소 또는 정수의 가능한 포함을 시사하는 것이다.
단수 형태는 본원에서 하나 또는 하나보다 많은(즉, 하나 또는 하나 이상) 문법적 대상을 지칭하기 위해 사용된다. 예로서, "요소"는 하나의 요소 또는 하나보다 많은 요소를 의미할 수 있다.
용어 "다수의"는 하나 이상의 의미를 갖는 것으로 이해되어야 한다.
푸란 화합물은 본원에서 푸란 고리를 갖는 임의의 화합물인 것으로 이해된다. 바람직하게, 푸란 화합물은 2,5-푸란-다이카복실산으로 산화될 수 있는 화합물이다. 본 발명의 맥락에서 적절한 푸란 화합물로는 [5-(하이드록시메틸)푸란-2-일]메탄올("HMF-알콜"), 5-(하이드록시메틸)푸란-2-카브알데하이드("HMF"), 5-(하이드록시메틸)푸란-2-카복실산("HMF-산"), 5-포밀푸란-2-카복실산("FFA"), 푸란-2,5-다이카브알데하이드(DFF) 및 푸란-2,5-다이카복실산("FDCA")이 포함된다. 푸란 고리 또는 임의의 이의 치환가능한 측쇄 기는 푸란 고리중 임의의 이용가능한 위치 상에서, 예를 들면, 환상 기를 포함하여, OH, C1-C10 알킬, 알킬, 알릴, 아릴 또는 RO- 에터 잔기로 치환될 수 있다. 다수의 적절한 푸란 화합물의 화학적 구조를 하기에 나타낸다.
용어 "폴리뉴클레오티드"는 폴리 데옥시리보핵산(DNA) 및 폴리 리보핵산(RNA)을 포함하며, 상기 용어는 DNA 또는 RNA를 말할 수 있다. 숙련된 자라면 DNA 및 RNA 분자의 안정성에서의 차이를 인지할 것이다. 따라서, 숙련된 자라면 용어 "폴리뉴클레오티드"의 사용 맥락으로부터 어떤 형태의 폴리뉴클레오티드(DNA 및/또는 RNA)가 적합한 지를 이해할 수 있을 것이다.
본원에서 사용된 바와 같은 용어 서열 "유사성"은 개개 폴리뉴클레오티드 또는 단백질 서열이 유사한 정도를 말한다. 두 서열간 유사성의 정도는 보존적 변화의 정도와 함께 동일성 정도를 기초로 한다. "서열 유사성"의 퍼센트는 동일하거나 보존적으로 변화된 아미노산 또는 뉴클레오티드의 퍼센트이다, 즉 "서열 유사성" = (% 서열 동일성) + (% 보존적 변화)이다.
본 발명에 있어서, "보존적 변화" 및 "동일성"은 보다 광범위한 용어 "유사성"의 종류인 것으로 간주된다. 따라서, 용어 서열 "유사성"이 사용되는 경우, 상기 용어는 서열 "동일성" 및 "보존적 변화"를 포함한다.
용어 "서열 동일성"은 숙련된 자에게 공지되어 있다. 2개의 아미노산 서열에 의해 또는 2개의 핵산 서열에 의해 공유된 서열 동일성의 정도를 측정하기 위해, 서열들은 최적의 비교 목적으로 정렬된다(예를 들면, 제 2 아미노산 또는 핵산 서열과의 최적 정렬을 위해 제 1 아미노산 또는 핵산 서열의 서열내에 갭(gap)이 도입될 수 있다). 상기 정렬은 비교되는 서열들의 전장(full length)에 걸쳐 수행될 수 있다. 또는, 정렬은 더 짧은 비교 길이에 걸쳐, 예를 들면, 약 20, 약 50, 약 100개 이상의 핵산/염기 또는 아미노산에 걸쳐 수행될 수 있다.
이어서, 상응하는 아미노산 위치 또는 뉴클레오티드 위치에서 아미노산 잔기 또는 뉴클레오티드를 비교한다. 제 1 서열에서의 위치에 제 2 서열내 상응하는 위치와 동일한 아미노산 잔기 또는 뉴클레오티드가 존재하는 경우, 분자는 그 위치에서 동일하다. 서열들 사이에 공유된 동일성의 정도는 전형적으로 두 서열들 사이의 동일성 퍼센트의 용어로 표현되며, 서열내 동일 잔기들에 의해 공유된 동일 위치의 수의 함수이다(즉, % 동일성 = 상응하는 위치에서 동일 잔기들의 수/위치의 총수 x 100). 바람직하게, 비교되는 두 서열은 동일하거나 실질적으로 동일한 길이를 갖는다.
"보존적 변화"의 퍼센트는 서열 동일성의 퍼센트와 유사하게 측정될 수 있다. 그러나, 이 경우, 원래 잔기의 기능적 성질을 보존하는 경향이 있는 아미노산 또는 뉴클레오티드 서열의 특정 위치에서의 변화는 변화가 일어나지 않은 경우와 같이 기록된다.
아미노산 서열의 경우, 적절한 기능적 성질은 아미노산의 물리화학적 성질이다. 본 발명의 폴리펩티드중 아미노산에 대한 보존적 치환은 아미노산이 속한 부류의 다른 구성원들로부터 선택될 수 있다. 예를 들면, 특정 크기 또는 특성(예를 들면, 전하, 소수성 및 친수성)을 갖는 아미노산의 집단에 속하는 아미노산이, 특히 생물학적 활성과 직접 관련되지 않는 단백질의 영역들에서, 단백질의 활성을 변화시키지 않고 또 다른 아미노산 대신 치환될 수 있다. 예를 들면, 비극성(소수성) 아미노산으로는 알라닌, 류신, 이소류신, 발린, 프롤린, 페닐알라닌, 트립토판 및 티로신이 포함된다. 극성 중성 아미노산으로는 글리신, 세린, 트레오닌, 시스테인, 티로신, 아스파라긴 및 글루타민이 포함된다. 양으로 하전된 (염기성) 아미노산으로는 아르기닌, 라이신 및 히스티딘이 포함된다. 음으로 하전된 (산성) 아미노산으로는 아스파트산 및 글루탐산이 포함된다. 보존적 치환으로는, 예를 들면, Arg 대신 Lys 및 양전하를 유지하기 위한 그 반대경우; Asp 대신 Glu 및 음전하를 유지하기 위한 그 반대경우; 유리 -OH가 유지되도록 하기 위한 Thr 대신 Ser; 및 유리 -NH2를 유지하기 위한 Asn 대신 Gln이 포함된다.
뉴클레오티드 서열의 경우, 적절한 기능적 성질은 주로 특정 뉴클레오티드가 전사 및/또는 번역 기구에 관한 서열의 개방 판독 프레임(open reading frame) 내에 보유하는 생물학적 정보이다. 유전자 코드가 축중(degeneracy)(또는 중복(redundancy))을 가지며 다중 코돈이 그들이 암호화하는 아미노산에 관해 동일한 정보를 가질 수 있다는 것은 일반적인 지식이다. 예를 들면, 특정 종에서, 아미노산 류신은 UUA, UUG, CUU, CUC, CUA, CUG 코돈(또는 DNA의 경우 TTA, TTG, CTT, CTC, CTA, CTG)에 의해 암호화되며, 아미노산 세린은 UCA, UCG, UCC, UCU, AGU, AGC(또는 DNA의 경우 TCA, TCG, TCC, TCT, AGT, AGC)로 특정화된다. 번역된 정보를 변화시키지 않는 뉴클레오티드 변화는 보존적 변화로 간주된다.
숙련된 자라면 두 서열 사이의 동일성을 측정하기 위해 다양한 수학적 알고리즘을 이용한 여러 다양한 컴퓨터 프로그램을 이용할 수 있다는 사실을 인지할 것이다. 예를 들면, 니들맨 앤 분쉬(Needleman and Wunsch) 알고리즘을 사용하는 컴퓨터 프로그램을 이용할 수 있다(문헌[Needleman et al., A general method applicable to the search for similarities in the amino acid sequences of two proteins, J. Mol. Biol. (48):444-453 (1970)]). 한 태양에 따르면, 상기 컴퓨터 프로그램은 액셀러리스(Accelerys) GCG 소프트웨어 패키지(액셀러리스 인코포레이티드, 미국 샌디에고)의 GAP 프로그램이다. 사용될 수 있는 치환 행렬은, 예를 들면, 16, 14, 12, 10, 8, 6 또는 4의 갭 가중치 및 1, 2, 3, 4, 5 또는 6의 길이 가중치를 갖는 BLOSUM62 행렬 또는 PAM250 행렬이다. 숙련된 자라면 모든 상기 상이한 파라미터들이 약간 상이한 결과를 제공할 것이지만 상이한 알고리즘을 사용할 때 두 서열의 전체 동일성 퍼센트가 별로 변화되지 않음을 인지할 것이다.
한 태양에 따르면, 두 뉴클레오티드 서열 사이의 동일성 퍼센트는 액셀러리스 GCG 소프트웨어 패키지(액셀러리스 인코포레이티드, 미국 샌디에고)의 GAP 프로그램을 사용하여 측정된다. NWSgapdna CMP 행렬 및 40, 50, 60, 70 또는 80의 갭 가중치, 및 1, 2, 3, 4, 5 또는 6의 길이 가중치를 사용한다.
또 다른 태양에서, 두 아미노산 또는 뉴클레오티드 서열의 동일성 퍼센트는, PAM120 가중치 잔여 표, 12의 갭 길이 패널티 및 4의 갭 패널티를 사용하는 ALIGN 프로그램(버전 2.0)(진스트림(Genestream) 서버 IGH 몽펠리어(Montpellier) 프랑스의 서열 데이터를 이용하여 ALIGN 쿼리에서 이용가능, http://vega.igh.cnrs.fr/bin/align-guess.cgi) 내에 포함된 메이어스(E. Meyers) 및 밀러(W. Miller)의 알고리즘(문헌[Meyers et al., Optimal alignments in linear space, CABIOS, 4:11-17 (1989)])을 이용하여 측정된다.
본 발명에 있어서, 뉴클레오티드 또는 아미노산 서열 사이의 동일성 및/또는 유사성 퍼센트를 측정하기 위해 BLAST(Basic Local Alignment Tool)를 사용하는 것이 가장 바람직하다.
문헌[Altschul et al., Basic local alignment search tool, J. Mol. Biol., 215:403-410 (1990)]의 BLASTn, BLASTp, BLASTx, tBLASTn 및 tBLASTx 프로그램을 사용하는 쿼리(query)는 http://www.ncbi.nlm.nih.gov/.을 통해 접근가능한 BLAST의 온라인 버전을 통해 게시될 수 있다. 또는, NCBI 인터넷 사이트를 통해 또한 다운로드할 수 있는 BLAST의 독립 버전(예를 들면, 버전 2.2.24(2010년 8월 23일 발표))을 사용할 수 있다. 바람직하게, BLAST 쿼리는 하기의 파라미터하에 수행된다. 아미노산 서열 사이의 동일성 및/또는 유사성 퍼센트를 측정하기 위해: 알고리즘: blastp; 워드 크기: 3; 스코어링 행렬: BLOSUM62; 갭 코스트: 이그지스턴스(Existence): 11, 익스텐션(Extension): 1; 구성 조정: 잠정 구성 스코어 행렬 조정; 필터: 오프; 마스크: 오프. 뉴클레오티드 서열 사이의 동일성 및/또는 유사성 퍼센트를 측정하기 위해: 알고리즘: blastn; 워드 크기: 11; 쿼리 범위내 최대 매치: 0; 매치/미스매치 스코어: 2, -3; 갭 코스트: 이그지스턴스: 5, 익스텐션: 2; 필터: 낮은 복잡성 영역; 마스크: 룩업(lookup) 테이블에만 대한 마스크.
"보존적 변화"의 퍼센트는 언급된 알고리즘 및 컴퓨터 프로그램을 사용하여 서열 동일성 퍼센트와 유사하게 측정할 수 있다. 몇몇 컴퓨터 프로그램, 예를 들어, BLASTp는 포지티브의 수/퍼센트(= 유사성) 및 동일성의 수/퍼센트를 제공한다. 보존적 변화의 퍼센트는 포지티브/유사성 퍼센트로부터 동일성 퍼센트를 차감함으로써 그로부터 유도될 수 있다(보존적 변화 퍼센트 = 유사성 퍼센트 - 동일성 퍼센트).
하이브리드화 실험, PCR 실험, 제한효소 절단, 숙주의 형질전환 등과 같은 일반적인 분자 생물학적 기술들은 문헌[Sambrook et al., Molecular Cloning, A Laboratory Manual, Cold Spring Harbor Press, N.Y. (1989); and Ausubel et al. (eds.), Current Protocols in Molecular Biology, (John Wiley & Sons, N.Y.) (1995)]에 개시된 바와 같이 숙련된 자에게 공지된 표준 관행에 따라 수행될 수 있다.
제 1 폴리뉴클레오티드 및 폴리펩티드
본 발명에 따른 유전자 변형 세포는 제 1 폴리펩티드를 암호화하는 제 1 폴리뉴클레오티드를 포함한다. 제 1 폴리펩티드는 서열번호 1, 2, 3 또는 4의 아미노산 서열과 45% 이상, 바람직하게는 60% 이상, 예를 들면, 70% 이상, 보다 바람직하게는 80% 이상, 예를 들면, 90%, 가장 바람직하게는 95% 이상의 서열 유사성을 갖는 아미노산 서열을 포함한다.
다르게는, 서열 유사성은 적어도 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 적어도 99%의 유사성으로 표현될 수 있다. 한 태양에 따르면, 언급된 유사성 퍼센트는 동일성 퍼센트일 수 있다. 특정 태양에서, 제 1 폴리펩티드는 서열번호 1, 2, 3 또는 4 중 어느 하나에 나타낸 바와 같은 아미노산 서열을 포함할 수 있다.
상기 폴리펩티드는 HMF-산 생체전환에 관해 개선을 제공할 수 있다.
어떤 이론에 결부시키고자 하는 것은 아니지만, 상기 폴리펩티드는 HMF-산 운반 능력을 갖는 것으로 생각된다. 제 1 폴리펩티드에 의한 HMF-산의 세포내로의 운반에 의해, HMF-산은 세포내 전환에 더 잘 이용가능하게 된다. 따라서, HMF-산 생체전환이 개선될 수 있다.
HMF-산 생체전환에 대한 상기 개선은 HmfT1(서열번호 1) 및 메틸로박테리움 라디오톨레란스 JCM 2831(= ATCC 27329 = DMS 1819)로부터의 유전자좌 표지 mrad2831_4728을 갖는 유전자로부터의 단백질 산물(서열번호 3)에 대한 예에 나타내었다. 상기 서열들과의 서열 유사성/동일성의 수준에 근거하여, HmfT2(서열번호 2) 및 설폴로부스 아시도칼다리우스 DSM 639로부터의 Saci _2058 유전자로부터의 단백질 산물이 유사한 효과를 가질 것으로 예상하는 것은 당연하다.
HmfT2(서열번호 2)는 HmfT1(서열번호 1)과 90% 이상의 유사성을 갖는다. 동일성 수준은 87%이다.
상이한 기능적 부류로부터의 운반체를 사용한 CLUSTALW2 다중 서열 정렬에 준하여 설폴로부스 아시도칼다리우스 DSM 639로부터의 saci _2058 유전자의 단백질 산물(서열번호 4)에 대해 유사한 기능이 예상될 수 있다. 설폴로부스 운반체는 HmfT1(서열번호 1) 및 Mrad2831_4728(서열번호 3)과 함께 클러스터(cluster)를 형성한다. 더우기, 설폴로부스 아시도칼다리우스 게놈의 분석은 운반체 유전자 saci_2058은, HMF(-유사 화합물)의 분해시 예상되는 활성 유형인, hmf 유전자 클러스터와 유사한 기능 각각을 암호화하는 유전자들이 측면에 위치함을 나타내었다. 예: Saci_2057, 알콜 데하이드로게나제; Saci_2059/2060, 방향족 고리 디옥시게나제; Saci_2062, 아실-CoA 신테타제(hmfD에 기능적으로 필적함); Saci_2063, 에노일-CoA 하이드라타제(hmfE와 기능적으로 필적함); Saci_2064, 알데하이드 옥시다제/잔틴 데하이드로게나제(hmfABC에 기능적으로 필적함). 상기 분석에 근거하여, 설 폴로부스 아시도칼다리우스 DSM 639로부터의 Saci _2058 유전자의 단백질 산물(서열번호 4)이 HmfT1(서열번호 1) 및/또는 메틸로박테리움 라다오톨레란스 JCM 2831(= ATCC 27329 = DSM 1819)로부터의 유전자좌 표지 mrad2831 _4728을 갖는 유전자로부터의 단백질 산물(서열번호 3)과 유사한 효과를 가질 것으로 예상하는 것은 당연하다.
제 1 폴리펩티드는, 서열번호 7, 8, 9 또는 10에 나타낸 폴리뉴클레오티드 서열과 45% 이상, 바람직하게는 60% 이상, 예를 들면 70% 이상, 보다 바람직하게는 80% 이상, 예를 들면, 90%, 가장 바람직하게는 95% 이상의 서열 유사성을 갖는 제 1 폴리뉴클레오티드 서열에 의해 암호화될 수 있다. 서열번호 7, 8, 9 또는 10에 나타낸 서열과 제 1 폴리뉴클레오티드의 유사성의 적합한 대체 수준은 적어도 66%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 적어도 99% 유사성일 수 있다. 한 태양에 따르면, 언급된 유사성 퍼센트는 동일성 퍼센트일 수 있다. 특정 태양에서, 제 1 폴리펩티드는 서열번호 7, 8, 9 또는 10에 나타낸 바와 같은 폴리뉴클레오티드 서열에 의해 암호화될 수 있다.
제 1 폴리펩티드, 또는 제 1 폴리펩티드를 암호화하는 폴리뉴클레오티드는 유기체, 바람직하게는 특정 성장 조건하에서 제 1 폴리펩티드를 발현하는 미생물로부터 단리될 수 있다. 상기 미생물은 탄소 공급원으로 HMF-산 또는 관련 푸란 물질, 예를 들어, HMF 또는 HMF-알콜을 사용할 수 있지만, 필수적인 것은 아니다.
전형적인 접근방법에서, 적합한 대체 폴리뉴클레오티드를 단리하기 위해 유전자 라이브러리를 검색할 수 있다. 상기 라이브러리는 박테리아의 초계(superkingdom)의 미생물로부터 구성될 수 있다. 상기 미생물은 프로테오박테리아(Proteobacteria) 문, 보다 특히는 알파프로테오박테리아(Alphaproteobacteria) 또는 베타프로테오박테리아(Betaproteobacteria) 강에 속할 수 있다. 알파프로테오박테리아는 리조비알레스(Rhizobiales) 목, 브래디리조비아세아(Bradyrhizobiaceae) 또는 메틸로박테리아세아(Methylobacteriaceae) 과에 속할 수 있다. 브래디리조비아세아는 브래디리조븀 ( Bradyrhizobium) 속, 예를 들면, 브 래디리조븀 자포니쿰, 또는 아피피아 ( Afipia) 속에 속할 수 있다. 메틸로박테리아세아는 메틸로박테리움 ( Methylobacterium) 속, 예를 들면, 메틸로박테리움 노둘란스 또는 메틸로박테리움 라디오톨레란스에 속할 수 있다. 베타프로테오박테리아는 버크홀데리알레스(Burkholderiales) 목, 보다 특히 버크홀데리아세아(Burkholderiaceae) 과에 속할 수 있다. 이들은 큐프리아비더스 속, 예를 들면, 큐프리아비더스 바실렌시스에, 또는 랄스토니아 ( Ralstonia) 속, 예를 들면, 랄스토니아 유트로파(Ralstonia eutropha)에, 또는 버크홀데리아 ( Burkholderia) 속, 예를 들면, 버크홀데리아 피마툼 ( Burkholderia phymatum), 버크홀데리아 피토피르만스 ( Burkholderia phytofirmans), 버크홀데리아 제노보란스( Burkholderia xenovorans) 또는 버크홀데리아 그라미니스( Burkholderia graminis)에 속할 수 있다. 박테리아는 또한 피르미쿠테스(Firmicutes) 문, 보다 특히 바실러스(Bacillus) 강, 보다 특히는 바실라레스(Bacillales) 목에 속할 수 있다. 바실라레스는 바실라세아(Bacillaceae) 강, 보다 특히 제오바실러스 ( Geobacillus) 속, 예를 들면, 제오바실러스 카우스토필루 스( Geobacillus kaustophilus)에 속할 수 있다. 또는, 상기 미생물은 고세균(Archaea)의 초계, 보다 특히는 유리아케오타(Euryarchaeota) 문, 또는 크렌아케오타(Crenarchaeota) 문에 속할 수 있다. 유리아케오타는 분류되지 않은 속, 예를 들면, Cand. 파바케움 아시디필룸 ( Parvarchaeum acidiphilum), 또는 터모플라스마타(Thermoplasmata) 강, 보다 특히 터모플라스마탈레스(Thermoplasmatales) 목에 속할 수 있다. 터모플라스마탈레스는 터모플라스마타세아(Thermoplasmataceae) 과, 보다 특히 터모플라스마( Thermoplasma) 속, 예를 들면, 터모플라스마 아시도필룸( Thermoplasma acidophilum) 또는 터모플라스마 볼카늄(Thermoplasma volcanium)에 속할 수 있다. 크렌아케오타는 터모프로테이(Thermoprotei) 강, 보다 특히 설폴로발레스(Sulfolobales) 목에 속할 수 있다. 설폴로발레스는 설폴로바세아(Sulfolobaceae) 과, 보다 특히 설폴로부스 ( Sulfolobus) 속, 예를 들면, 설폴로부스 아시도칼다리우스 , 설폴로부스 이슬란디쿠스 ( Sulfolobus islandicus ), 설폴로 부스 솔파타리쿠스 ( Sulfolobus solfataricus) 또는 설폴로부스 토코다이( Sulfolobus tokodaii); 또는 메탈로스페라 ( Metallosphaera) 속, 예를 들면, 메 탈로스페라 세둘라(Metallosphaera sedula)에 속할 수 있다. 터모프로테이는 또한 터모프로테알레스(Thermoproteales) 목, 터모프로테아세아(Thermoproteaceae) 과에 속할 수 있다. 터모프로테아세아는 불카니세타 ( Vulcanisaeta) 속, 예를 들면, 불 카니세타 디스트리부타 ( Vulcanisaeta distributa); 또는 칼디비르가 ( Caldivirga) 속, 예를 들면, 칼디비르가 마퀼린젠시스( Caldivirga maquilingensis)에 속할 수 있다.
바람직하게, 제 1 폴리펩티드, 및/또는 상기 제 1 폴리펩티드를 암호화하는 제 1 폴리뉴클레오티드는 큐프리아비더스 바실렌시스 HMF14로부터 단리된다(문헌[Wierckx et al., Isolation and characterization of Cupriavidus basilensis HMF14 for biological removal of inhibitors from lignocellulosic hydrolysate, Microb Biotechnol 3:336-343 (2010)]). 한 대안적 태양에 따르면, 제 1 폴리펩티드 및/또는 제 1 폴리펩티드를 암호화하는 제 1 폴리뉴클레오티드는 메틸로박테리 움 라디오톨레란스로부터 단리될 수 있다.
서열번호 1, 2, 3 또는 4에 제공된 아미노산 서열 및/또는 서열번호 7, 8, 9 또는 10에 제공된 뉴클레오티드 서열을 근거로, 숙련된 자라면 제 1 폴리펩티드를 암호화하는 뉴클레오티드 서열을 단리하기 위해 적절한 프로브 및/또는 프라이머를 구성할 수 있을 것이다.
다르게는, 서열번호 1, 2, 3 또는 4에 제공된 아미노산 서열 및/또는 서열번호 7, 8, 9 또는 10에 제공된 뉴클레오티드 서열을 근거로, 숙련된 자는, 유전자 합성이 점차 이용가능해지고 있기 때문에, 상업적 공급원으로부터 제 1 폴리펩티드를 암호화하는 합성 서열을 수득할 수 있다. 합성 서열은, 예를 들어, 몇가지만 말하자면, 진아트 아게(Geneart A.G.)(독일 레겐스버그)로부터 또는 젠스크립트 유에스에이 인코포레이티드(Genscript USA Inc.)(미국 뉴저지 피스카타웨이)로부터 구입할 수 있다.
본 발명에 따른 세포는 제 1 폴리뉴클레오티드의 기능적 도입에 의해 유전자 변형된다. 폴리뉴클레오티드의 기능적 도입이란, 상기 세포가 폴리뉴클레오티드의 기능적 폴리펩티드 산물을 발현할 가능성을 갖도록 하는 세포내 상기 폴리뉴클레오티드의 도입을 의미한다. 숙주 세포내 폴리뉴클레오티드의 기능적 도입을 위한 방법 및 기술은 숙련된 자의 일반적인 지식에 속한다.
HMF
-산 전환 폴리펩티드
본 발명에 따른 유전자 변형 세포는 제 2 폴리펩티드를 암호화하는 제 2 폴리뉴클레오티드를 포함한다. 제 2 폴리펩티드는 HMF-산 전환 활성을 가지며, HMF-산을 생성물로 전환시킬 수 있는 임의의 폴리펩티드로부터 선택될 수 있다. 본 발명자들은 HMF-산을 전환시키는 제 2 폴리펩티드에 의한 HMF-산의 생체전환이 세포내 제 1 폴리펩티드의 발현에 의해 효과적으로 개선됨을 알아내었다.
제 2 폴리펩티드를 암호화하는 제 2 폴리뉴클레오티드는 본 발명에 따른 세포의 천연 성분일 수 있다, 즉, 세포는 제 2 폴리뉴클레오티드에 대해 유전자 변형될 필요가 없다. 그러나, 본 발명의 특정 태양에 따라서, 본 발명에 따른 세포는 제 2 폴리뉴클레오티드의 기능적 도입에 의해 제 2 폴리뉴클레오티드에 대해 유전자 변형된다. 용어 "기능적 도입"은 제 1 폴리펩티드 및 제 1 폴리뉴클레오티드와 관련하여 상기에서 이미 설명하였다.
본 발명의 바람직한 태양에 따르면, 제 2 폴리펩티드는 HMF-산 전환 옥시도리덕타제이다. 상기 HMF-산 전환 옥시도리덕타제는 서열번호 5 또는 6에 나타낸 아미노산 서열, 또는 서열번호 5 또는 6에 나타낸 아미노산 서열과 45% 이상, 바람직하게는 60% 이상, 예를 들면, 70% 이상, 보다 바람직하게는 80% 이상, 예를 들면, 90%, 가장 바람직하게는 95% 이상의 서열 유사성을 갖는 이의 변이체 폴리펩티드를 포함할 수 있다.
또는, 상기 서열 유사성은 적어도 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 적어도 99% 유사성일 수 있다. 한 태양에 따르면, 언급된 유사성 퍼센트는 동일성 퍼센트일 수 있다. 특정 태양에서, 제 2 폴리펩티드는 서열번호 5 또는 6 중 어느 하나에 나타낸 아미노산 서열을 포함할 수 있다.
서열번호 5의 HMF-산 전환 옥시도리덕타제는 이미 개시되었으며(문헌[Koopman et al., Identification and characterization of the furfural and 5-(hydroxymethyl)furfural degradation pathways of Cupriavidus basilensis HMF14, PNAS, Vol. 107, p.4919-4924 (2010a); and Koopman et al., Efficient whole-cell biotransformation of 5-(hydroxymethyl)furfural into FDCA, 2,5-furandicarboxylic acid, Bioresour. Technol., Vol. 101, p.6291-6296 (2010b)]), HmfH로 지칭되었다. 서열번호 6의 HMF-산 전환 옥시도리덕타제는 브래디리조븀 자포니쿰 USDA 110으로부터 단리될 수 있으며, blr0367 유전자의 번역된 단백질 산물에 상응한다. 브래디리조븀 자포니쿰 USDA 110은 이의 게놈에 큐프리아비더스 바실렌시스 HMF14로부터의 모든 HMF/푸르푸랄 이용 유전자에 대한 동족체를 함유한다(문헌[Koopman et al., Identification and characterization of the furfural and 5-(hydroxymethyl)furfural degradation pathways of Cupriavidus basilensis HMF14, PNAS, Vol. 107, p.4919-4924 (2010a)]). blr0367 유전자의 번역 산물은 큐프리아 비더스 바실렌시스 HMF14로부터의 HmfH에 대해 최고의 상동성을 나타낸 브래디리조 븀 자포니쿰 USDA 110의 단백질이다. 브래디리조븀 자포니쿰 USDA 110이 단독 탄소 공급원으로서 HMF를 이용하는 것으로 밝혀진 점을 고려하여(문헌[Koopman et al., Identification and characterization of the furfural and 5-(hydroxymethyl)furfural degradation pathways of Cupriavidus basilensis HMF14, PNAS, Vol. 107, p.4919-4924 (2010a)]), 상기 번역 산물은 기능적 HmfH 동족체를 함유해야 한다. 그러므로, blr0367로부터 HmfH 유사 활성이 야기되는 것으로 예상하는 것은 당연하다.
본 발명은 다수의 HMF-산 전환 옥시도리덕타제에 대해 예시되지만, 본 발명에서 제 2 폴리펩티드가 상이한 HMF-산 전환 옥시도리덕타제이거나 옥시도리덕타제 활성을 갖지 않는 상이한 HMF-산 전환 폴리펩티드임이 특별히 허용됨을 주지해야 한다.
제 2 폴리펩티드는 서열번호 11 또는 12에 나타낸 폴리뉴클레오티드 서열과 45% 이상, 바람직하게는 60% 이상, 예를 들면, 70% 이상, 보다 바람직하게는 80% 이상, 예를 들면, 90%, 가장 바람직하게는 95% 이상의 서열 유사성을 갖는 제 2 폴리뉴클레오티드 서열에 의해 암호화될 수 있다. 서열번호 11 또는 12에 나타낸 서열과 제 1 폴리뉴클레오티드의 유사성의 적합한 대체 수준은 적어도 66%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 적어도 99% 유사성일 수 있다. 한 태양에 따르면, 언급된 유사성 퍼센트는 동일성 퍼센트일 수 있다. 특정 태양에서, 제 2 폴리펩티드는 서열번호 11 또는 12에 나타낸 바와 같은 폴리뉴클레오티드 서열에 의해 암호화될 수 있다.
큐프리아비더스 바실렌시스로부터 옥시도리덕타제 활성을 갖는 제 2 폴리펩티드를 암호화하는 적합한 폴리뉴클레오티드의 단리는 문헌[Koopman et al., Identification and characterization of the furfural and 5-(hydroxymethyl)furfural degradation pathways of Cupriavidus basilensis HMF14, PNAS, Vol. 107, p.4919-4924 (2010a)]에 개시되었다. 상기 유전자는 hmfH로 지칭되었다.
제 2 폴리뉴클레오티드를 단리하기 위한 접근방법에서, 적합한 폴리뉴클레오티드를 단리하기 위해 유전자 라이브러리를 검색할 수 있다. 상기 라이브러리는 박테리아의 초계의 미생물로부터 구성될 수 있다. 상기 미생물은 프로테오박테리아 문, 보다 특히는 알파프로테오박테리아, 베타프로테오박테리아 또는 감마프로테오박테리아(Gammaproteobacteria) 강에 속할 수 있다. 알파프로테오박테리아는 리조비알레스 목 또는 스핀고모나달레스(Sphingomonadales) 목에 속할 수 있다. 리조비알레스는 메틸로박테리아세아 과, 예를 들면, 메틸로박테리움 노둘란스 또는 메틸로박테리움 라디오톨레란스와 같은 메틸로박테리움 속으로부터의 유기체, 또는 리조비아세아 과로부터의 유기체에 속할 수 있다. 리조비아세아는 리조븀/아그로박테리움(Agrobacterium) 군, 보다 특히는 리조븀 레구미노사룸 (R. leguminosarum) 또는 리조븀 레구미노사룸 bv . 트리폴리와 같은 리조븀 속에 속할 수 있다. 이들은 또한 아그로박테리움 라디오박터(A. radiobacter)와 같은 아그로박테리움 속에 속할 수 있다. 리조비아세아는 또한 브래디리조비아세아 과, 보다 특히는 브래디 리조븀 자포니쿰과 같은 브래디리조븀 속에 속할 수 있다. 스핀고모나달레스는 스핀고모나다세아(Sphingomonadaceae) 과, 보다 특히 스핀고모나스 위티치(S. wittichii) 또는 스핀고모나스 클로로페놀리쿰(S. chlorophenolicum)과 같은 스핀고모나스( Sphingomonas) 속에 속할 수 있다. 베타프로테오박테리아는 메틸로필라레스(Methylophilales) 목 또는 버크홀데리알레스 목에 속할 수 있다. 메틸로필라레스는 메틸로필라세아(Methylophilaceae) 과, 예를 들면, 메틸로보러스( Methylovorus ) 속으로부터의 유기체에 속할 수 있다. 버크홀데리알레스는 버크홀데리아세아 과, 예를 들면, 큐프리아비더스 바실렌시스와 같은 큐프리아비더스 속으로부터의 유기체에 속할 수 있다. 이들은 또한 버크홀데리아 속, 예를 들면, 버크홀데리아 피토피르만스, 버크홀데리아 피마툼, 버크홀데리아 그라미니스 , 버크 홀데리아 제노보란스 또는 버크홀데리아 세노세파시아(B. cenocepacia)에, 또는 옥살로박테라세아(Oxalobacteraceae) 과, 잔티노박테리움 ( Janthinobacterium) 속에 속할 수 있다. 감마프로테오박테리아는 엔테로박테리알레스(Enterobacteriales) 목, 엔테로박테리아세아(Enterobacteriaceae) 과, 예르시니아 ( Yersinia) 속, 예를 들면, 예르시니아 루케리(Yersinia ruckeri)에 속할 수 있다. 미생물은 또한 악티노박테리아(Actinobacteria) 문, 악티노박테리아 강, 악티노박테리대(Actinobacteridae) 아강, 악티노마이세탈레스(Actinomycetales) 목의 박테리아일 수 있다. 악티노마이세탈레스는 스트렙토마이시네아(Streptomycineae), 슈도노카르디네아(Pseudonocardineae) 또는 마이크로모노스포리네아(Micromonosporineae)의 아목에 속할 수 있다. 스트렙토마이시네아는 스트렙토마이세타세아(Streptomycetaceae) 과, 보다 특히 스트렙토마이세스 ( Streptomyces) 속, 예를 들면, 스트렙토마이세스 비올라세우스니거 (S. violaceusniger), 스트렙토마이세스 하이그로스코피쿠스(S. hygroscopicus) 또는 스트렙토마이세스 클라불리게루스 (S. clavuligerus)에 속할 수 있다. 슈도노카르디네아는 슈도노카르디아세아(Pseudonocardiaceae) 과, 보다 특히는 사카로폴리스포라 에리트라에(S. erythraea)와 같은 사카로폴리스포라 ( Saccharopolyspora) 속; 또는 악티노시네마타세아(Actinosynnemataceae) 과, 보다 특히는 사카로트릭스 무타빌리스 (S. mutabilis) 또는 사카로트릭스 무타빌리스 아종 카프레올루스(capreolus)와 같은 사카로트릭스( Saccharothrix) 속, 또는 악티노시네마 미룸(A. mirum)과 같은 악티 노시네마( Actinosynnema) 속에 속할 수 있다. 마이크로모노스포리네아(Micromonosporineae)는 마이크로모노스포라세아(Micromonosporaceae) 과, 보다 특히는 마이크로모노스포라 ( Micromonospora) 속에 속할 수 있다.
서열번호 5 또는 6에 제공된 아미노산 서열 및/또는 서열번호 11 또는 12에 제공된 뉴클레오티드 서열을 기초로, 숙련된 자는 제 2 폴리펩티드를 암호화하는 뉴클레오티드 서열을 단리하기 위해 적합한 프로브 및/또는 프라이머를 구성할 수 있을 것이다.
다르게는, 서열번호 5 또는 6에 제공된 아미노산 서열 및 서열번호 11 또는 12에 제공된 뉴클레오티드 서열을 기초로, 숙련된 자는 제 1 폴리펩티드를 논의한 부분에서 이미 언급한 바와 같이 상업적 공급원으로부터 제 2 폴리펩티드를 암호화하는 합성 서열을 수득할 수 있다.
제 3 폴리뉴클레오티드 및 폴리펩티드
대안적 태양에 따르면, 본 발명에 따른 유전자 변형 세포는 제 3 폴리펩티드를 암호화하는 제 3 폴리뉴클레오티드를 포함한다. 제 3 폴리펩티드는 서열번호 19, 20, 21, 22, 23, 24 또는 25의 아미노산 서열과 45% 이상, 바람직하게는 60% 이상, 예를 들면, 70% 이상, 보다 바람직하게는 80% 이상, 예를 들면, 90%, 가장 바람직하게는 95% 이상의 서열 유사성을 갖는 아미노산 서열을 포함한다.
다르게는, 서열 유사성은 적어도 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 적어도 99%의 유사성으로 표현될 수 있다. 한 태양에 따르면, 언급된 유사성 퍼센트는 동일성 퍼센트일 수 있다. 특정 태양에서, 제 1 폴리펩티드는 서열번호 19, 20, 21, 22, 23, 24 또는 25 중 어느 하나에 나타낸 바와 같은 아미노산 서열을 포함할 수 있다. 서열번호 19의 아미노산 서열이 제 3 폴리펩티드의 바람직한 선택이다. 상기 아미노산 서열은 최근에 WO 2011/026906 호에 발표되었다(서열번호 15).
상기 제 3 폴리펩티드의 기능적 발현은 푸란 알데하이드를 전환시킬 수 있는 알데하이드 데하이드로게나제 활성(Adh)을 야기하며, HMF-산 생체전환 및/또는 FDCA 생산에 대해 추가의 개선을 제공한다.
제 3 폴리펩티드의 발현과 관련된 효과는 서열번호 19의 아미노산 서열에 대한 실시예에 나타내었다. 서열 유사성/동일성의 수준에 근거하여, 서열번호 20 내지 25의 폴리펩티드 및 이의 유사체/동족체가 유사한 효과를 가질 것으로 예상하는 것이 당연하다.
제 3 폴리펩티드는, 서열번호 26, 27, 28, 29, 30, 31 또는 32에 나타낸 폴리뉴클레오티드 서열과 45% 이상, 바람직하게는 60% 이상, 예를 들면 70% 이상, 보다 바람직하게는 80% 이상, 예를 들면, 90%, 가장 바람직하게는 95% 이상의 서열 유사성을 갖는 제 3 폴리뉴클레오티드 서열에 의해 암호화될 수 있다. 바람직하게, 제 3 폴리펩티드는 서열번호 26에 나타낸 폴리뉴클레오티드 서열 또는 서열번호 26에 나타낸 폴리뉴클레오티드 서열과 언급된 서열 유사성을 갖는 동족체에 의해 암호화된다. 서열번호 26의 폴리뉴클레오티드 서열은 최근에 WO 2011/026906 호에 발표되었다(서열번호 16). 서열번호 26, 27, 28, 29, 30, 31 또는 32에 나타낸 서열과 제 3 폴리뉴클레오티드의 유사성의 적합한 대체 수준은 적어도 66%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 적어도 99% 유사성일 수 있다. 한 태양에 따르면, 언급된 유사성 퍼센트는 동일성 퍼센트일 수 있다. 특정 태양에서, 제 3 폴리펩티드는 서열번호 26, 27, 28, 29, 30, 31 또는 32에 나타낸 바와 같은 폴리뉴클레오티드 서열에 의해 암호화될 수 있다.
제 3 폴리펩티드 및 상응하는 제 3 폴리뉴클레오티드의 단리 및 추가의 조작은 일반적으로 상기 및 하기에서 제 1 폴리펩티드 및 상응하는 제 1 폴리펩티드에 대해 논의하는 바와 같이 수행될 수 있다.
벡터
본 발명의 또 다른 양태는 클로닝 및 발현 벡터를 포함하여, 제 1 및 제 2 폴리뉴클레오티드 또는 이의 기능적 등가물을 포함하는 벡터, 및 예를 들면, 본 발명의 폴리펩티드의 발현이 일어나는 조건하에서 적합한 숙주 세포에서 상기 벡터를 성장, 형질전환 또는 형질감염시키는 방법에 관한 것이다. 본원에서 사용된 바와 같이, 용어 "벡터"는 연결된 또 다른 핵산을 운반할 수 있는 핵산 분자를 말한다.
제 1 및 제 2 폴리뉴클레오티드 및 선택적으로 제 3 폴리뉴클레오티드는 재조합 복제가능 벡터, 예를 들면, 클로닝 또는 발현 벡터 내에 혼입될 수 있다. 상기 벡터는 상용가능한 숙주 세포에서 핵산을 복제하기 위해 사용될 수 있다. 따라서, 또 다른 태양에서, 본 발명은 본 발명의 폴리뉴클레오티드를 복제가능 벡터 내에 도입하고, 상기 벡터를 상용가능한 숙주 세포 내에 도입하고, 상기 숙주 세포를 벡터의 복제를 야기하는 조건하에서 성장시킴으로써 본 발명의 폴리뉴클레오티드를 제조하는 방법을 제공한다. 상기 벡터는 숙주 세포로부터 회수될 수 있다. 적합한 숙주 세포는 하기에서 기술한다.
본 발명의 발현 카세트 또는 폴리뉴클레오티드가 삽입되는 벡터는 재조합 DNA 절차에 편리하게 적용될 수 있는 임의의 벡터일 수 있으며, 벡터의 선택은 흔히 상기 벡터가 도입될 숙주 세포에 따라 달라질 것이다.
본 발명에 따른 벡터는 자율 복제 벡터, 즉, 그 복제가 염색체 복제와 무관한 염색체외 존재로서 존재하는 벡터, 예를 들면, 플라스미드일 수 있다. 또는, 벡터는, 숙주 세포내에 도입될 때 숙주 세포 게놈 내에 통합되어 통합된 염색체와 함께 복제되는 벡터일 수 있다.
벡터의 한 유형은 "플라스미드"로, 이것은 추가의 DNA 절편이 접합될 수 있는 원형 이중 가닥 DNA 루프를 말한다. 벡터의 또 다른 유형은 바이러스 벡터로, 여기서는 추가의 DNA 절편이 바이러스 게놈 내로 접합될 수 있다. 특정 벡터는 그들이 도입되는 숙주 세포에서 자율 복제될 수 있다(예를 들면, 박테리아 복제 기점을 갖는 박테리아 벡터 및 에피솜 포유동물 벡터). 다른 벡터(예를 들면, 비-에피솜 포유동물 벡터)는 숙주 세포내에 도입시 숙주 세포의 게놈 내에 통합됨으로써, 숙주 게놈과 함께 복제된다. 또한, 특정 벡터들은 이들이 작동가능하게 연결된 유전자의 발현을 유도할 수 있다. 상기 벡터는 본원에서 "발현 벡터"로 지칭된다. 일반적으로, 재조합 DNA 기술에서 유용한 발현 벡터는 흔히 플라스미드의 형태이다. 용어 "플라스미드" 및 "벡터"는 플라스미드가 가장 흔히 사용되는 형태의 벡터이므로 본원에서 상호교환적으로 사용될 수 있다. 그러나, 본 발명은 상기 다른 형태의 발현 벡터, 예를 들면, 코스미드, 바이러스 벡터(예를 들면, 복제 결핍 레트로바이러스, 아데노바이러스 및 아데노-연관 바이러스), 파지 벡터 및 트랜스포손(transposon) 및 등가의 기능을 제공하는 플라스포손(plasposon)을 포함하는 것이다.
숙련된 자라면 제공된 아미노산 및 폴리뉴클레오티드 서열, 당해 분야에 대한 지식 및 상업적으로 이용가능한 수단들을 기초로 하여 본 발명에 따른 벡터를 구성할 수 있을 것이다.
바람직한 태양에 따르면, 제 1 및 제 2 폴리뉴클레오티드 서열은 단일 벡터 상에 위치한다. 상기 벡터는 선택적으로 제 3 폴리뉴클레오티드 서열을 또한 포함한다. 숙련된 자가 이해하듯이, 제 1 및 제 2 폴리뉴클레오티드 서열을 포함(및 선택적으로 제 3 폴리뉴클레오티드 서열을 추가로 포함)하는 벡터의 사용은 제 1 및 제 2 폴리펩티드(선택적으로 제 3 폴리펩티드와 함께)를 기능적으로 발현시키는 유전자 변형 세포의 구성을 매우 단순화시킨다. 그러나, 숙련된 자가 또한 이해하듯이, 제 1 및 제 2 폴리펩티드를 기능적으로 발현시키는 유전자 변형 세포는 대체 벡터를 포함하는 다양한 다른 형질전환 방법에 의해 수득될 수 있다. 이와 관련하여, 특정 태양에 따라서, 제 2 폴리뉴클레오티드 서열의 기능적 도입이 필요조건은 아님을 주지해야 한다. 또한, 특정한 또 다른 대안적 태양에 따라서, 제 3 폴리뉴클레오티드 서열의 기능적 도입이 필요조건은 아니다.
숙주 세포
본 발명에 따른 유전자 변형 세포는 임의의 적합한 숙주 세포로부터 구성될 수 있다. 숙주 세포는 비변형 세포일 수 있거나, 이미 유전자 변형될 수 있다. 상기 세포는 원핵 세포, 진핵 세포, 식물 세포 또는 동물 세포일 수 있다. 상기 세포에서, 하나 이상의 유전자기 결실되거나, 제거(knocked-out)되거나 완전히 또는 부분적으로 파괴될 수 있으며, 이때 선택적으로 하나 이상의 유전자는 프로테아제를 암호화한다. 한 태양에 따르면, 본 발명에 따른 숙주 세포는 진핵 숙주 세포이다. 바람직하게, 진핵 세포는 포유동물, 곤충, 식물, 진균류 또는 조류(algal) 세포이다. 바람직한 포유동물 세포로는, 예를 들면, 차이니즈 햄스터 난소(Chinese hamster ovary, CHO) 세포, COS 세포, 293 세포, PerC6 세포 및 하이브리도마가 포함된다. 바람직한 곤충 세포로는, 예를 들면, Sf9 및 Sf21 세포 및 이의 유도체가 포함된다. 보다 바람직하게, 진핵 세포는 진균 세포, 즉, 효모 세포, 예를 들면, 캔디다( Candida ), 한세눌라 ( Hansenula ), 클루이베로마이세스( Kluyveromyces ), 피치아 ( Pichia ), 사카로마이세스 ( Saccharomyces ), 쉬조사카로마이세스( Schizosaccharomyces) 또는 야로이야 ( Yarrowia) 균주이다. 보다 바람직하게, 진핵 세포는 클루이베로마이세스 락티스 ( Kluyveromyces lactis ), 사카로마이 세스 세레비지에 ( Saccharomyces cerevisiae ), 한세눌라 폴리모르파( Hansenula polymorpha), 야로이야 리포라이티카 ( Yarrowia lipolytica ), 피치아 스티피티 스( Pichia stipitis) 및 피치아 파스토리스 ( Pichia pastoris), 또는 사상균 세포이다. 특정 태양에서, 진핵 세포는 사상균(filamentous fungi) 세포이다.
"사상균"은 아문 진균문(Eumycota) 및 난균문(Oomycota)의 모든 사상 형태를 포함한다(문헌[Hawksworth et al., In: Ainsworth and Bisby's Dictionary of The Fungi, 8th edition, CAB International, University Press, Cambridge, UK (1995)]에 정의된 바와 같음). 사상균은 키틴, 셀룰로스, 글루칸, 키토산, 만난 및 다른 복합 폴리사카라이드로 이루어진 균사체 벽을 특징으로 한다. 영양 생장(vegetative growth)은 균사 신장에 의하며, 탄소 이화작용은 절대 호기성이다. 사상균 균주로는 아크레모늄 ( Acremonium ), 아가리쿠스( Agaricus ), 아스퍼질러스 ( Aspergillus ), 오레오바시듐 ( Aureobasidium ), 크리소스포륨( Chrysosporium ), 코프리누스 ( Coprinus ), 크립토코커스 ( Cryptococcus ), 필리바시듐( Filibasidium ), 푸사리움 ( Fusarium ), 후미콜라( Humicola ), 마그나포르테( Magnaporthe ), 뮤코 ( Mucor ), 마이셀리오프토라 ( Myceliophthora ), 네오칼리마스틱스( Neocallimastix ), 뉴로스포라 ( Neurospora ), 페실로마이세스 ( Paecilomyces ), 페니실리움( Penicillium ), 피로마이세스 ( Piromyces ), 파네로카에테( Phanerochaete ), 플레우로투스 ( Pleurotus ), 쉬조필룸 ( Schizophyllum ), 탈라로마 이세스( Talaromyces ), 터모아스쿠스 ( Thermoascus ), 티엘라비아 ( Thielavia ), 톨리포클라듐( Tolypocladium) 및 트리코더마(Trichoderma)의 균주들이 포함되나, 이로 한정되지는 않는다.
바람직한 사상균 세포는 아스퍼질러스 , 크리소스포륨 , 페니실륨, 탈라로마이 세스 또는 트리코더마 속의 종, 가장 바람직하게는 아스퍼질러스 니거( Aspergillus niger), 아스퍼질러스 아와모리 ( Aspergillus awamori ), 아스퍼질러스 포에티두스( Aspergillus foetidus ), 아스퍼질러스 소재( Aspergillus sojae ), 아스퍼질러스 푸미가투스( Aspergillus fumigatus ), 탈라로마이세스 에메르소니( Talaromyces emersonii), 아스퍼질러스 오리재( Aspergillus oryzae ), 크리소스포륨 루크노웬스( Chrysosporium lucknowense ), 트리코더마 레세이 ( Trichoderma reesei) 또는 페 니실리움 크리소게눔( Penicillium chrysogenum)으로부터 선택된 종에 속한다.
또 다른 태양에 따르면, 본 발명에 따른 숙주 세포는 원핵 세포이다. 바람직하게, 원핵 숙주 세포는 박테리아 세포이다. 용어 "박테리아 세포"는 그람-음성 및 그람-양성 미생물 둘 다를 포함한다. 적합한 박테리아는, 예를 들면, 에스케리키아( Escherichia ), 아나바에나 ( Anabaena ), 카울로박터 ( Caulobacter ), 글루코노박 터( Gluconobacter ), 로도박터 ( Rhodobacter ), 슈도모나스( Pseudomonas ), 파라코커스( Paracoccus ), 바실러스 ( Bacillus ), 브레비박테리움 ( Brevibacterium ), 코리네박테리움( Corynebacterium ), 리조븀 ( Rhizobium )( 시노리조븀 ( Sinorhizobium )), 브래디리조븀( Bradyrhizobium ), 플라보박테리움 ( Flavobacterium ), 클렙시엘라( Klebsiella ), 엔테로박터( Enterobacter ), 락토바실러스 ( Lactobacillus ), 락토코커스( Lactococcus ), 메틸로박테리움 ( Methylobacterium ), 스태필로코커스( Staphylococcus ), 스트렙토마이세스 ( Streptomyces ), 지모모나스 ( Zymomonas ), 아세토박터( Acetobacter ), 스트렙토코커스 ( Streptococcus ), 박터로이데스( Bacteroides ), 셀레노모나스 ( Selenomonas ), 메가스파에라 ( Megasphaera ), 버크홀데리아( Burkholderia ), 큐프리아비더스 ( Cupriavidus ), 랄스토니아 ( Ralstonia ), 메틸로박테리움( Methylobacterium ), 메틸로보러스 ( Methylovorus ), 로도슈도모나스( Rhodopseudomonas ), 아시디필리움 ( Acidiphilium ), 디노로세오박터( Dinoroseobacter ), 아그로박테리움( Agrobacterium ), 설폴로부스 ( Sulfolobus) 또는 스핀고모나스 ( Sphingomonas) 속으로부터 선택될 수 있다. 바람직하게, 박테리아 세포는 다음으로 이루어진 군으로부터 선택된다: 바실러스 서브틸리스( Bacillus subtilis), 바실러스 아밀로리퀘파시엔스 ( Bacillus amyloliquefaciens ), 바실러스 리케니포미스( Bacillus licheniformis ), 바실러스 푼티스 ( Bacillus puntis ), 바실 러스 메가테리움 ( Bacillus megaterium ), 바실러스 할로두란스( Bacillus halodurans), 바실러스 푸밀러스 ( Bacillus pumilus ), 글루코노박터 옥시단스( Gluconobacter oxydans ), 카울로박터 크레센투스 ( Caulobacter crescentus ), 메 틸로박테리움 엑스토르쿠엔스 ( Methylobacterium extorquens ), 메틸로박테리움 라디오톨레란스( Methylobacterium radiotolerans ), 메틸로박테리움 노둘란스( Methylobacterium nodulans ), 로도박터 스파에로이데스( Rhodobacter sphaeroides), 슈도모나스 제아잔티니파시엔스 ( Pseudomonas zeaxanthinifaciens ), 슈도모나스 푸티다 ( Pseudomonas putida ), 슈도모나스 푸티다 S12, 파라코커스 데니트리피칸스( Paracoccus denitrificans ), 에스케리키아 콜라이 ( Escherichia coli ), 코 리네박테리움 글루타미쿰 ( Corynebacterium glutamicum ), 스태필로코커스 카르노서스( Staphylococcus carnosus ), 스트렙토마이세스 리비단스( Streptomyces lividans), 시노리조븀 멜리로티 ( Sinorhizobium meliloti ), 브래디리조븀 자포니쿰( Bradyrhizobium japonicum ), 리조븀 라디오박터 ( Rhizobium radiobacter ), 리조 븀 레구미노사룸 ( Rhizobium leguminosarum ), 리조븀 레구미노사룸 bv. 트리폴리( Rhizobium leguminosarum bv. trifolii ), 아그로박테리움 라디오박터( Agrobacterium radiobacter ), 큐프리아비더스 바실렌시스( Cupriavidus basilensis), 큐프리아비더스 네카토르( Cupriavidus necator )( 랄스토니아 유트로 파( Ralstonia eutropha )), 랄스토니아 피케티 ( Ralstonia pickettii ), 버크홀데리아 피토피르만스( Burkholderia phytofirmans ), 버크홀데리아 피마툼( Burkholderia phymatum), 버크홀데리아 제노보란스 ( Burkholderia xenovorans ), 버크홀데리아 그라미니스( Burkholderia graminis ), 로도슈도모나스 팔루스트리스( Rhodopseudomonas palustris), 아시디필리움 크립툼 ( Acidiphilium cryptum ), 디노로세오박터 시바에( Dinoroseobacter shibae ), 설폴로부스 아시도칼다리우스( Sulfolobus acidocaldarius), 설폴로부스 이슬란디쿠스 ( Sulfolobus islandicus ), 설폴로부스 솔파타리쿠스( Sulfolobus solfataricus ), 설폴로부스 토코다이( Sulfolobus tokodaii).
매우 바람직한 숙주 세포는 슈도모나스 푸티다 S12이다. 상기 균주에서, 큐 프리아비더스 바실렌시스 HMF14로부터의 hmfH 유전자의 기능적 발현은 HMF 산화 능력을 도입하는데 효과적이어서 상기 기질로부터 FDCA 생성을 야기하는 것으로 입증되었다.
본 발명에 따른 세포의 특정 용도를 위해, 숙주 세포의 선택은 상기 용도에 따라 이루어질 수 있다. 리그노셀룰로스 공급 원료의 전환에 적합한 숙주들 및 FDCA와 같은 푸란 화합물의 생산에 바람직한 조건에 내성인 숙주들이 특히 바람직하다. 숙련된 자라면 제 1 및 선택적으로 제 2 폴리뉴클레오티드를 임의의 상기 언급한 숙주 세포 내에 기능적으로 도입하기에 적합한 수단 및 방법을 이용할 수 있을 것이다.
HMF
-산 생물전환
본 발명에 따른 유전자 변형 세포는 개선된 HMF-산 생물전환을 갖는다. 개선된 HMF-산 생체전환은 푸란 화합물이 해로운 것으로 간주되는 공급원료, 예를 들면, 생물연료 및 생화학물질의 생산을 위한 에탄올생산성 발효를 위한 공급원료로부터 HMF-산 및 이의 푸란 전구체의 제거에 유리하다. 다른 용도에서, 개선된 HMF-산 생체전환은, FDCA 바이오생산에서와 같이, HMF-산이 출발 물질 또는 중간체인 화학물질의 바이오생산을 개선할 것이다.
HMF-산 전환 효소가 HMF-산 전환 옥시도리덕타제인 경우, 본 발명에 따른 세포는 생물학적 산화 반응을 수행할 수 있을 것이다. 산화 반응은 본원에서 옥시도리덕타제의 존재하에 HMF-산과 산화제의 하나 이상의 반응이다.
바람직한 산화 반응은 FDCA의 생성이며, 여기서 HMF-산은 HMF-산 전환 옥시도리덕타제의 존재하에 산화제와의 반응에 의해 FDCA로 전환된다. 예를 들어, HMF를 출발 물질로 사용하여, HMF-산이 중간체인 푸란 화합물의 FDCA로의 생체전환은 선행 기술에 개시되었다(문헌[Koopman et al., Identification and characterization of the furfural and 5-(hydroxymethyl)furfural degradation pathways of Cupriavidus basilensis HMF14, PNAS, Vol. 107, p.4919-4924 (2010a); and Koopman et al., Efficient whole-cell biotransformation of 5-(hydroxymethyl)furfural into FDCA, 2,5-furandicarboxylic acid, Bioresour. Technol., Vol. 101, p.6291-6296 (2010b)] 참조). 상기 생체전환은 본 발명에 따른 세포에 의해 수행되는 경우 개선될 것이다.
HMF-산은 본 발명의 세포 또는 존재하는 임의의 다른 세포에 의해 하나 이상의 푸란 전구체로부터 동일반응계내에서 생성될 수 있다. 동일반응계내 생성이란 HMF-산이 시스템 외부로부터 첨가되지 않는 것을 의미한다. 대신 HMF-산은 푸란 전구체를 HMF-산으로 전환시키는 하나 이상의 생체전환에 의해 시스템내에서 생성된다.
HMF-산의 푸란 전구체는 5-(하이드록시메틸)푸란-2-카브알데하이드(HMF), 푸란-2,5-다이카브알데하이드(DFF) 및 [5-(하이드록시메틸)푸란-2-일]메탄올(HMF 알콜)로 이루어진 군으로부터 선택될 수 있으며, 바람직하게 푸란 전구체는 HMF이다.
HMF는 당해 분야에 알려져 있는 바와 같이 산-촉진된 탈수에 의해 하나 이상의 6탄당으로부터 수득될 수 있다. 6탄당은 바이오매스, 바람직하게는 리그노셀룰로스 바이오매스로부터 수득될 수 있다.
산화 반응은 생성물을 제공하는 많은 연속적 산화 반응 단계, 예를 들면, HMF-산의 FFA로의 산화 및 또한 FFA의 FDCA로의 산화를 포함할 수 있다. 산화 반응의 예는 도 1에 나타내었다.
산화 반응은 바람직하게는 비교적 온화한 온도, 즉 10 내지 80 ℃, 보다 바람직하게는 20 내지 45 ℃, 가장 바람직하게는 약 25 내지 40 ℃에서 수행된다. 염 생성이 제어될 수 있도록, FDCA가 중성 형태 또는 완전히 용해된 형태인 pH에서 반응을 수행하는 것이 바람직하다. FDCA 중 2개의 산 분자의 존재를 고려하여, 2개의 별개의 바람직한 pH 범위가 있다. 반응시 pH는 pH 1 내지 6, 바람직하게는 pH 1 내지 4, 가장 바람직하게는 pH 1 내지 3일 수 있다. 또는 반응시 pH는 pH 5 내지 9, 바람직하게는 pH 5 내지 8, 가장 바람직하게는 pH 5 내지 7일 수 있다. 숙련된 자라면 숙주 세포의 필요조건이 공정에 적합한 pH 값의 선택에 또한 영향을 미칠 것임을 이해할 것이다. 본 발명에 적합한 다양한 숙주 세포에 적합한 pH 값의 선택은 숙련된 자의 영역에 속하며 표준 교과서로부터 유도될 수 있다. 슈도모나스 푸티다 S12를 포함하여 슈도모나스 푸티다의 경우, 바람직한 pH 범위는 pH 5 내지 7이다.
반응 시간은 분자 산소 또는 물과 같은 산소 공급원, 또는 푸란 산화 효소의 필요조건에 따라 상이한 산소 공급원으로부터 산소의 첨가하에, 6 내지 150 시간일 수 있다. 공기를 편리하게 분자 산소의 공급원으로 사용할 수 있다.
반응기는 임의의 적합한 (통기) 생물반응기일 수 있다. 상기 반응기는 회분식(batch), 연속식 또는 유가식(fed-batch) 운전으로 작동될 수 있다.
생물전환 후에, 세포는 입증된 방법에 의해 배양액으로부터 단리되어 재사용될 수 있다. FDCA, HMF-산 등과 같은 산화 생성물은 (산) 침전 및 후속 냉각 결정화, 및 결정화된 산화 생성물, 예를 들면, 결정화된 FDCA의 단리에 의해 반응 혼합물로부터 회수될 수 있다. 그러나, 당해 분야에 공지된 바와 같이, 산 침전 및 용매 추출과 같은(이로 한정되지는 않는다) 다른 회수 방법도 적합하다.
리그노셀룰로스 공급원료로부터 HMF-산의 제거와 같은 많은 용도에서, HMF-전환의 정확한 방식은 중요하지 않다. 중요한 것은 HMF-산을 그대로 제거하기 위해 또는 HMF-산이 푸란 전구체로부터 생성되는 경우 이의 축적을 방지하기 위해 HMF-산이 효과적으로 전환되는 것이다. 상기 용도의 경우, HMF-산 전환 폴리펩티드는 현재 알려져 있거나 언젠가는 발견될 HMF-전환 활성을 갖는 임의의 폴리펩티드일 수 있다.
본 발명의 다른 양태는 푸란 전구체의 FDCA로의 생물전환을 위한 본 발명에 따른 유전자 변형 세포의 용도를 목적으로 한다. 푸란 전구체는 특히 5-(하이드록시메틸)푸란-2-카브알데하이드(HMF), [5-(하이드록시메틸)푸란-2-일]메탄올(HMF 알콜), 푸란-2,5-다이카브알데하이드(DFF), 5-(하이드록시메틸)푸란-2-카복실산(HMF-산) 또는 5-포밀푸란-2-카복실산(FFA)으로부터 선택될 수 있다. 바람직하게, HMF는 선택된 푸란 전구체이다. HMF-산은 HMF의 FDCA로의 생체전환에서 중간체일 수 있다.
본 발명은 또한 하기 실시예에 관하여 더 예시될 것이다.
실시예
일반적 방법
균주 및 플라스미드. 슈도모나스 푸티다 S12(ATCC 700801)를, 큐프리아비더 스 바실렌시스 HMF14(문헌[Wierckx et al., Isolation and characterization of Cupriavidus basilensis HMF14 for biological removal of inhibitors from lignocellulosic hydrolysate, Microb Biotechnol 3:336-343 (2010); and Koopman et al., Identification and characterization of the furfural and 5-(hydroxymethyl)furfural degradation pathways of Cupriavidus basilensis HMF14, PNAS, Vol. 107, p.4919-4924 (2010a)]) 및 메틸로박테리움 라디오톨레란스 JCM 2831(= ATCC 27329 = DSM 1819; http://genome.jgi-psf.org/metra/metra.home.html에서 이용가능한 게놈 서열)로부터의 유전자 발현을 위한 숙주로 사용하였다. 에스케리키아 콜라이 균주 DH5α 또는 TOP10(인비트로겐)을 일반 클로닝 목적으로 사용하였다.
큐프리아비더스 바실렌시스 또는 메틸로박테리움 라디오톨레란스 유전자의 에피솜 발현을 위해, pUCP22-유도된 pJT'mcs(문헌[Koopman et al., Identification and characterization of the furfural and 5-(hydroxymethyl)furfural degradation pathways of Cupriavidus basilensis HMF14, PNAS, Vol. 107, p.4919-4924 (2010a)]) 또는 pJNNmcs(t)(문헌[Wierckx et al., Transcriptome analysis of a phenol producing Peudomonas putida S12 construct: genetic and physiological basis for improved production. J Bacteriol 190:2822-2830 (2008)]), 또는 pBBR1MCS-유도된 pBT'mcs(문헌[Koopman et al., Identification and characterization of the furfural and 5-(hydroxymethyl)furfural degradation pathways of Cupriavidus basilensis HMF14, PNAS, Vol. 107, p.4919-4924 (2010a)])를 사용하였다. pJT'mcs 및 pBT'mcs에서, 표적 유전자의 발현은 구성적 tac 프로모터로부터 유도된다. pJNNmcs(t)에서는, 발현이 살리실레이트 유도성 NagR/PnagAa 발현 카세트로부터 유도된다.
배지 및 배양 조건. 무기염 배지(MM)를 제한 배지로 사용하였다. MM은 다음을 함유하였다(탈염수 리터 당): 명시된 바와 같은 탄소 공급원이 보충된, 3.88 g의 K2HPO4, 1.63 g의 NaH2PO4, 2.0 g의 (NH4)2SO4, 0.1 g의 MgCl2·6H2O, 10 mg의 EDTA, 2 mg의 ZnSO4·7H2O, 1 mg의 CaCl2·2H2O, 5 mg의 FeSO4·7H2O, 0.2 mg의 Na2MoO4·2H2O, 0.2 mg의 CuSO4·5H2O, 0.4 mg의 CoCl2·6H2O, 및 1 mg의 MnCl2·2H2O. 루리아 브로스(Luria broth)(L-브로스: 10 g/l 박토 트립톤(딥코), 5 g/l 효모 추출물(딥코), 5 g/l NaCl)를 슈도모나스 푸티다 S12 및 유도 균주, 큐프리아비더스 바실렌시스, 메틸로박테리움 라디오톨레란스 및 에스케리키아 콜라이 DH5α 및 유도체의 증식을 위한 완전 배지로 사용하였다. 평판 배양을 위해, L-브로스를 1.5%(w/v)의 아가(딥코)로 고형화시켰다. pJT'mcs 또는 pJNNmcs(t)-유도된 플라스미드를 함유하는 에스케리키아 콜라이 형질전환체의 선별을 위해 암피실린(Amp)을 배지에 100 ㎍/ml로 가하였다. pJT'mcs 또는 pJNNmcs(t)-유도된 플라스미드를 갖는 슈도모나스 푸티다 S12 형질전환체의 선별을 위해 젠타마이신(Gm)을 루리아 브로스에 30 ㎍/ml 및 무기염 배지에 10 ㎍/ml로 가하였다. pBT'mcs-유도된 플라스미드를 갖는 에스케리키아 콜라이 또는 슈도모나스 푸티다 S12 형질전환체의 선별을 위해, 50 ㎍/ml의 카나마이신(Km)을 배지에 가하였다. 항생물질들은 시그마-앨드리치(Sigma-Aldrich)로부터 구입하였다. 슈도모나스 푸티다 , 큐프리아비더스 바 실렌시스 및 메틸로박테리움 라디오톨레란스는 30 ℃에서 배양하였으며; 에스케리키아 콜라이는 37 ℃에서 배양하였다.
슈도모나스 푸티다 S12-유도된 균주를 사용한 유가식 실험을 랩포스(Labfors) 4 바이오리액터 시스템(인포스 베네룩스(Infors Benelux) BV) 또는 바이오플로(BioFlo)110 제어기(뉴 브런스윅 사이언티픽(New Brunswick Scientific))에 의해 제어되는 2-L 용기에서 수행하였다. 가압 공기 또는 순수 산소를 헤드 스페이스에 공급하거나 배양액을 통해 스파징하였다. 온도는 30 ℃에서 조절하였으며, pH는 7.0에서 NH4OH, NaOH 또는 KOH의 자동 첨가에 의해 7.0에서 유지시켰다. 회분 단계는 균주 특이적 항생물질 및 40 g/l 글리세롤을 보충한 2x MM 배지에서 수행하였다. 고밀도 세포 배양물의 경우, 회분-단계 배지에 10 g/l의 효모 추출물(YE)을 더 보충하였다. 초기 글리세롤의 고갈 후에, 공급(필요한 경우 1 mM의 Na-살리실레이트로 보충된 100 mM MgCl2 중 4 또는 8 M 글리세롤)을 시작하고 배양물중 제한 기질로서 글리세롤을 유지하면서 성장하도록 조절하였다. HMF 공급물(탈염수중 4M)을 별도의 공급물 펌프를 통해 공급하고; 사용된 균주 및 연구된 조건에 따라 공급률을 조정하였다. 용존 산소 농도(DO)를 연속적으로 모니터링하고, 교반 속도를 조정하여 충분한 통기를 유지하였다.
분석 및 분석 방법. 세포 건조 중량( CDW ) 측정: 평저 96-웰 마이크로플레이트(그레이너(Greiner))를 사용하여, 바이오웨이브 세포 밀도 계측기(Biowave Cell Density Meter)(더블유피에이 리미티드(WPA Ltd)) 또는 마이크로퀀트(μQuant) MQX200 일반 마이크로플레이트 분광광도계(바이오테크(Biotek))를 사용하여 600 nm에서 흡광도(OD600)를 측정함으로써 박테리아 배양물의 CDW 함량을 측정하였다. 1.0의 OD600은 슈도모나스 푸티다의 경우 0.56 g CDW/L(바이오웨이브) 또는 1.4 g CDW/L(마이크로퀀트)에 상응한다.
HPLC 분석: 푸란 화합물(FDCA, HMF, HMF-알콜, HMF-산 및 FFA)을 문헌[Koopman et al., Identification and characterization of the furfural and 5-(hydroxymethyl)furfural degradation pathways of Cupriavidus basilensis HMF14, PNAS, Vol. 107, p.4919-4924 (2010a)]에 기술된 바와 같이 RP-HPLC로 분석하였다. 당, 알콜 및 유기산도 또한 굴절률(RI) 검출기를 사용하여 HPLC(에이질런트(Agilent) 1100 시스템)로 분석하였다. 사용된 컬럼은 0.6 ml/분의 유량에서 용출제로서 5 mM H2SO4를 사용하는 바이오-래드 아미넥스(Bio-Rad Aminex) HPX-87H(300 x 7.8 mm, 수소 형태, 9 ㎛ 입자 크기, 8% 가교 결합, pH 범위 1 내지 3)였다.
화학물질
HMF는 시그마(Sigma), 유로랩스 리미티드(Eurolabs Ltd)(영국 포인튼) 또는 요어 케미팜 캄파니 리미티드(Yore Chemipharm Co. Ltd.)(중국 닝보)에서 구입하였다. FDCA 및 5-하이드록시메틸-푸로산(HMF 산)의 분석용 표준물은 각각 임뮤노소스(Immunosource) B.V.(벨기에 할레-주르셀), 매트릭스 사이언티픽(Matrix Scientific)(미국 사우스캐롤라이나 컬럼비아)에서 구입하였다. 모든 다른 화학물질은 시그마-앨드리치 케미(Sigma-Aldrich Chemie) B.V.(네덜란드 즈빈드레비치)에서 구입하였다.
분자 및 유전 기술: 게놈 DNA를 디엔이지(DNeasy) 조직 키트(키아겐(QIAGEN))를 사용하여 큐프리아비더스 바실렌시스 HMF14 및 메틸로박테리움 라디오톨레란스 JCM 2831로부터 단리하였다. 플라스미드 DNA는 키아프레프(QIAprep) 스핀 미니프레프 키트(키아겐)를 사용하여 단리하였다. 아가로스-포획된 DNA 단편은 키아엑스II(QIAEXII) 겔 추출 키트(키아겐)를 사용하여 단리하였다.
PCR 반응은 제조사의 지시에 따라 어큐프라임(Accuprime) Pfx 폴리머라제(인비트로겐)를 사용하여 수행하였다. 올리고뉴클레오티드 프라이머(실시예에서 명시됨)는 MWG 바이오테크 AG(독일)에 의해 합성하였다. 플라스미드 DNA는 진 펄서(Gene Pulser) 전기천공 장치(바이오래드)를 사용하여 일렉트로컴피턴트(electrocompetent) 세포 내에 도입하였다. 다른 표준 분자 생물 기술은 문헌[Sambrook and Russell, Molecular cloning - a laboratory manual. Third edition. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY (2001)]에 따라 수행하였다.
실시예
I:
HmfH
및
HmfT1
의 동시-발현은
슈도모나스
푸티다
S12
에서
FDCA
생성을
개선시킨다
hmfT1 유전자(이전에 mfs1로 지칭됨(문헌[Koopman et al., Identification and characterization of the furfural and 5-(hydroxymethyl)furfural degradation pathways of Cupriavidus basilensis HMF14, PNAS, Vol. 107, p.4919-4924 (2010a)]); 서열번호 7)를, 프라이머 hmfT1(f)(서열번호 13) 및 hmfT1(r)(서열번호 14)을 사용하여 PCR에 의해 큐프리아비더스 바실렌시스 HMF14의 게놈 DNA로부터 증폭시켰다. 이의 천연 리보솜 결합 부위(RBS)를 포함하는 hmfH 유전자(서열번호 11)는 프라이머 FN23(서열번호 15) 및 FN24(서열번호 16)를 사용하여 큐프리 아비더스 바실렌시스 HMF14의 게놈 DNA로부터 PCR에 의해 증폭시켰다. PCR 산물을 pBT'mcs에 1777-bp EcoRI 단편으로 클로닝하여 플라스미드 pBT'hmfH를 수득하였다. 플라스미드 pBT'hmfH 및 pJNNhmfT1(t)를 연속적으로 슈도모나스 푸티다 S12 내에 도입하여 슈도모나스 푸티다 S12_B38을 수득하였다.
슈도모나스 푸티다 S12_B38을 일반적 방법 부분에서 기술한 바와 같이 유가식으로 배양하였다. 회분 단계에서, 약 3 g CDW/l의 세포 밀도를 달성한 후 글리세롤 공급 및 HMF 공급을 개시하였다. HmfT1을 발현하지 않는 슈도모나스 푸티다 S12_2642(슈도모나스 푸티다 S12_hmfH(문헌[Koopman et al., Efficient whole-cell biotransformation of 5-(hydroxymethyl)furfural into FDCA, 2,5-furandicarboxylic acid. Bioresour. Technol., Vol. 101, p.6291-6296 (2010b)])와 유사함)를 사용하여 대조군 유가식 배양을 수행하였다.
도 2는 슈도모나스 푸티다 균주 S12_2642 및 S12_B38의 HMF-공급 배양물 중 FDCA 및 HMF-산의 농도를 나타낸 것이다. HMF-산의 대규모 축적이 슈도모나스 푸티다 S12_2642에서 명백하다. 대조적으로, 슈도모나스 푸티다 S12_B38 배양물에서 HMF-산 축적은 미미하다. 감소된 HMF-산 축적은 HFM 공급률을 더 증가시켰으며, 이에 의해 훨씬 더 짧은 공정 시간에 더 높은 FDCA 역가가 야기되었다. 이것은 또한 시험 균주에 대한 FDCA 비생산성에서 명백히 반영되었다(도 3).
실시예
II
:
HmfH
및
메틸로박테리움
라디오톨레란스
JCM
2831로부터의 폴리펩티드의 동시-발현은
슈도모나스
푸티다
S12
에서
FDCA
생성을
개선시킨다
유전자좌 표지 mrad2831 _4728을 갖는 유전자(서열번호 9)를, 프라이머 Mrad(f)(서열번호 17) 및 Mrad(r)(서열번호 18)을 사용하여 PCR에 의해 메틸로박 테리움 라디오톨레란스 JCM2831의 게놈 DNA로부터 증폭시켰다. PCR 산물을 pJNNmcs(t)에 1381-bp EcoRI-NheI 단편으로 도입하여 pJNN_Mrad(t)를 수득하였다. 플라스미드 pBT'hmfH(실시예 I 참조) 및 pJNN_Mrad(t)를 연속적으로 슈도모나스 푸 티다 S12 내에 도입하여 슈도모나스 푸티다 S12_B51을 수득하였다.
슈도모나스 푸티다 S12_B51을 진탕 플라스크에서 1 g/l 효모 추출물, 80 mM 글리세롤, 2 mM 글루코스, 100 μM Na-살리실레이트, 50 ㎍/ml 카나마이신 및 10 ㎍/ml 젠타마이신으로 보충된 무기염 배지(4x 완충액 농도) 상에서 배양하였다. 대조군 균주로서, 슈도모나스 푸티다 S12_B38을 사용하였다(실시예 I 참조). 밤새 배양한 후에, 배양물에 80 mM 글리세롤 및 100 μM Na-살리실레이트를 보충하였다. 이어서, 약 10 mM HMF를 가하고 FDCA 생산을 평가하였다.
도 4는 FDCA 생성시 HMF-산 축적이 두 균주 모두에서 미미하여 HmfT1 및 Mrad2831_4728 폴리펩티드가 유사한 기능을 나타냄을 보여준다. 슈도모나스 푸티 다 S12_B38의 경우, FDCA 생성은 더 긴 유도기(lag phase)와 다소 더 느린 속도를 나타내었으며, 이것은 더 낮은 초기 바이오매스 밀도에 기인할 수 있다(도 4a). 그러나, 최대 FDCA 비생산성은 두 균주 모두에 대해 동일하여, 즉, 2.36 밀리몰 FDCA/(g CDW, h)이어서, Mrad2831_4728 및 HmfT1 폴리펩티드가 HMF-산 축적을 최소화하고 FDCA 생산을 최대화하는데 동일하게 효과적이었음을 시사한다.
실시예
III
:
HmfH
및
HmfT1
을 동시-발현하는
슈도모나스
푸티다
S12
에 의한 고수준
HMF
-산 전환 능력
실시예 I에서 입증된 바와 같이, 슈도모나스 푸티다 S12에서 HmfH 및 HmfT1의 동시-발현은 HMF를 FDCA로 산화시키는 특정 능력을 상당히 개선시켰다. 상기 개선된 능력을 최적으로 사용하기 위해, 슈도모나스 푸티다 S12_B38을 사용하여 고 바이오매스 밀도에서 출발하여 유가식 실험을 수행하였다.
슈도모나스 푸티다 S12_B38의 산화 능력을 최대화시키고 HMF 및 HMF-산의 축적을 유발하기 위해 HMF 공급을 높은 공급률(20 ml/h; 4 M HMF 공급 용액)에서 개시하였다(도 5). HMF-산이 약 20 mM로 축적되었을 때, HMF 공급률을 5 ml/h로 저하시키고 푸란 농도를 모니터링하였다. 초기에, HMF-산 농도는 잔류 축적된 HMF의 산화로 인해 약 37 mM로 증가되었으며, 그 후에 0.72 밀리몰/(g CDW.h)의 HMF 공급률에서, 5 시간 이내에 2 mM 미만으로 저하되었다.
상기 결과들은 HMF-산 산화 능력이 HmfH 및 HmfT1의 동시-발현에 의해 개선되었음을 명백하게 나타낸다. 문헌[Koopman et al., Efficient whole-cell biotransformation of 5-(hydroxymethyl)furfural into FDCA, 2,5-furandicarboxylic acid, Bioresour. Technol., Vol. 101, p.6291-6296 (2010b)]의 결과는, 슈도모나스 푸티다 S12_hmfH(HmfT1이 결여됨)가 훨씬 더 낮은 HMF 공급률(0.09 밀리몰/(g CDW.h))에서 50 시간동안 HMF-산 농도를 약 50 mM로부터 5 mM 미만으로 감소시켜야 함을 나타내었다. 개선된 HMF-산 산화 능력은 훨씬 더 높은 최종 FDCA 역가(상기 문헌[Koopman et al., (2010b)]에 의하면 152 g/l 대 30.1 g/l)를 야기하였으며, 이것은 또한 더 짧은 공정 시간(상기 문헌[Koopman et al., (2010b)]에 의하면 94 시간 대 115 시간)에 달성되었다.
실시예
IV
:
큐프리아비더스
바실렌시스
HMF
14로부터의
HmfH
,
HmfT1
및
알데
하이드
데하이드로게나제의
동시-발현은
슈도모나스
푸티다
S12
에서
FDCA
의 생성을 개선시킨다
큐프리아비더스 바실렌시스 HMF14에서 HMF-분해 오페론과 관련된 알데하이드 데하이드로게나제를 암호화하는 유전자(서열번호 26; 번역된 아미노산 서열: 서열번호 19)(문헌[Wierckx et al., Microbial degradation of furanic compounds: biochemistry, genetics and impact. Appl Microbiol Biotechnol 92:1095-1105 (2011)])를 프라이머 FN13(서열번호 33) 및 FN14(서열번호 34)를 사용하여 PCR에 의해 증폭시켰다. PCR 산물을 Bsp120I-절단된(NotI과 상용가능) pBT'hmfH(실시예 I 참조)에 1543-bp NotI 단편으로 도입하여 pBT'hmfH-adh를 수득하였다. 알데하이드 데하이드로게나제 암호화 유전자가 정방향(f) 배향으로 존재하는 플라스미드 변이체(pBT'hmfH-adh(f)) 및 pJNNhmfT1(t)(실시예 I 참조)를 연속적으로 슈도모나스 푸 티다 S12 내에 도입하였다. 수득된 균주 슈도모나스 푸티다 S12_B97은 HmfH, HmfT1 및 알데하이드 데하이드로게나제를 동시-발현하였다. HmfH 옥시도리덕타제와 알데하이드 데하이드로게나제의 동시-발현을 위한 대조군 균주(즉, HMF-산 운반체 HmfT1 비함유)로서, pBT'hmfH-adh(f) 만을 함유한 슈도모나스 푸티다 S12_B101을 제작하였다. 슈도모나스 푸티다 S12_B38(실시예 I 참조)을 알데하이드 데하이드로게나제 없이 HmfT1 및 HmfH의 동시-발현을 위한 대조군 균주로 사용하였다.
슈도모나스 푸티다 S12_B, S12_B97 및 S12_B101을 진탕 플라스크에서 1 g/l 효모 추출물, 80 mM 글리세롤, 2 mM 글루코스, 50 ㎍/ml 카나마이신 및 10 ㎍/ml 젠타마이신으로 보충된 무기염 배지(4x 완충액 농도) 상에서 배양하였다(주: 균주 B101의 경우, 카나마이신만 첨가). 예비배양물에만 hmfT1의 유도를 위해 Na-살리실레이트(1 μM)를 첨가하였다. 약 10 mM HMF의 첨가 후에, FDCA 및 HMF-산의 축적을 평가하였다.
HmfH(옥시도리덕타제) 및 HmfT1(HMF-산 운반체)을 동시-발현한 균주(균주 S12_B38; 도 6a)에서, FDCA 생성은 FFA가 실질적인 수준으로 축적된 후에만 시작되었다. HMF 산은, 앞에서 관찰된 바와 같이(실시예 II 참조), 일시적으로 소량으로 축적되었다. 알데하이드 데하이드로게나제가 HmfH 및 HmfT1과 동시-발현되었을 때(균주 S12_B97; 도 6b), FDCA 생성은 지연되지 않고 시작되었으며, FFA 및 HMF-산은 둘 다 미량으로만 관찰되었다. HmfT1 없이 알데하이드 데하이드로게나제와 HmfH의 동시-발현(균주 S12_B101; 도 6c)은 HMF-산의 대규모 축적을 야기한 반면, 소량의 FFA와 FDCA 만이 생성되었다.
결과들은 HMF의 HMF-산으로의 산화가 알데하이드 데하이드로게나제를 발현시킴으로써 상당히 증대됨을 나타내었다. 그러나, HmfT1은 생성된 HMF-산의 효과적인 생물전환을 가능케 하기 위해 동시-발현되어야만 한다. 알데하이드 데하이드로게나제는 중간 생성물 FFA의 FDCA로의 산화를 더 개선시켰다. 따라서, 알데하이드 데하이드로게나제와 HmfT1의 동시 발현이 HMF의 HMF-산을 거쳐 최종 생성물로의 산화에 대한 전체적 가능성 및 상기 산화의 속도를 상당히 개선시킨다.
참고문헌
SEQUENCE LISTING
<110> Purac Biochem B.V.
<120> GENETICALLY MODIFIED CELL AND PROCESS FOR USE OF SAID CELL
<130> 1.848.001 WO
<140> PCT/NL2012/050141
<141> 2012-03-07
<150> NL2006359
<151> 2011-03-08
<160> 34
<170> PatentIn version 3.5
<210> 1
<211> 441
<212> PRT
<213> Cupriavidus basilensis HMF14
<400> 1
Met Glu Ala Val Ala Lys Lys Arg Thr Glu Thr Ile Ser Glu Ala Leu
1 5 10 15
Pro Ala Ala Thr Asn Arg Gln Val Phe Gly Ala Val Thr Ala Ser Cys
20 25 30
Met Gly Trp Ala Leu Asp Leu Phe Asp Leu Phe Ile Leu Leu Phe Val
35 40 45
Ala Pro Val Ile Gly Arg Leu Phe Phe Pro Ser Glu His Ala Met Leu
50 55 60
Ser Leu Ala Ala Val Tyr Ala Ser Phe Ala Val Thr Leu Leu Met Arg
65 70 75 80
Pro Leu Gly Ser Ala Ile Phe Gly Thr Tyr Ala Asp Arg His Gly Arg
85 90 95
Lys Gly Ala Met Val Val Ala Val Thr Gly Val Gly Leu Ser Thr Ala
100 105 110
Ala Phe Gly Leu Leu Pro Thr Val Gly Gln Val Gly Leu Leu Ala Pro
115 120 125
Ala Leu Phe Ile Leu Leu Arg Leu Val Gln Gly Ile Phe Val Gly Gly
130 135 140
Val Val Ala Ser Thr His Thr Ile Gly Thr Glu Ser Val Pro Pro Ser
145 150 155 160
Trp Arg Gly Ala Val Ser Gly Leu Val Gly Gly Gly Gly Ala Gly Ile
165 170 175
Gly Ala Leu Leu Ala Ser Ile Thr Tyr Met Ala Met Thr Ala Leu Phe
180 185 190
Pro Gly Glu Ala Phe Asp Ala Trp Gly Trp Arg Cys Met Phe Phe Ser
195 200 205
Gly Ile Ile Ser Ser Val Leu Gly Leu Phe Ile Phe Asn Ser Leu Glu
210 215 220
Glu Ser Pro Leu Trp Lys Gln Leu Gln Ala Ala Lys Gly His Ala Ala
225 230 235 240
Pro Val Glu Asn Pro Leu Arg Val Ile Phe Ser Arg Gln Tyr Arg Gly
245 250 255
Val Leu Phe Val Asn Ile Leu Leu Thr Val Gly Gly Gly Ser Ala Tyr
260 265 270
Tyr Leu Thr Ser Gly Tyr Leu Pro Thr Phe Leu Lys Val Val Val Lys
275 280 285
Ala Pro Ala Gly Ala Ser Ala Ala Ile Leu Met Ala Ser Ser Val Gly
290 295 300
Val Ile Val Ala Ser Ile Ile Ala Gly His Leu Ser Thr Leu Ile Gly
305 310 315 320
Arg Lys Arg Ala Phe Leu Leu Ile Gly Ala Leu Asn Val Val Leu Leu
325 330 335
Pro Leu Ile Tyr Gln Arg Met Pro Ala Ala Pro Asp Val Thr Thr Leu
340 345 350
Gly Ile Tyr Ala Val Ala Leu Ala Met Leu Gly Ser Thr Gly Phe Ala
355 360 365
Pro Ile Leu Ile Phe Leu Asn Glu Arg Val Ser His Gln His Pro Cys
370 375 380
Tyr Gly Asn Trp Pro Val Met Glu Tyr Arg Leu Cys His Arg Arg His
385 390 395 400
Asp Ala Thr Phe Ala Ser Leu Cys Ala Ala Pro Pro Arg Leu Pro Lys
405 410 415
Cys Trp Gly Ser Arg Arg Gly Val Lys Ala Phe Thr Ala Gly Ala Ala
420 425 430
Ile Val Trp Asn Ala Pro Leu Gly Glu
435 440
<210> 2
<211> 449
<212> PRT
<213> Cupriavidus basilensis HMF14
<400> 2
Met Glu Ala Val Ala Lys Lys Ser Ala Ala Thr Ile Ser Glu Ala Leu
1 5 10 15
Pro Ala Ala Ser Asn Arg Gln Val Phe Gly Ala Val Ala Ala Ser Cys
20 25 30
Met Gly Trp Ala Leu Asp Leu Phe Asp Leu Phe Ile Leu Leu Phe Val
35 40 45
Ala Pro Val Ile Gly Arg Leu Phe Phe Pro Ser Glu His Ala Met Leu
50 55 60
Ser Leu Ala Ala Val Tyr Ala Ser Phe Ala Val Thr Leu Leu Met Arg
65 70 75 80
Pro Leu Gly Ser Ala Ile Phe Gly Ser Tyr Ala Asp Arg His Gly Arg
85 90 95
Lys Gly Ala Met Val Val Ala Val Thr Gly Val Gly Leu Ser Thr Ala
100 105 110
Ala Phe Gly Leu Leu Pro Thr Val Gly Gln Val Gly Leu Leu Ala Pro
115 120 125
Ala Leu Phe Ile Leu Leu Arg Leu Val Gln Gly Ile Phe Val Gly Gly
130 135 140
Val Val Ala Ser Thr His Thr Ile Gly Thr Glu Ser Val Pro Pro Ser
145 150 155 160
Trp Arg Gly Ala Val Ser Gly Leu Val Gly Gly Gly Gly Ala Gly Leu
165 170 175
Gly Ala Leu Leu Ala Ser Ile Thr Tyr Met Ala Met Thr Ala Leu Phe
180 185 190
Pro Gly Glu Ala Phe Asp Ala Trp Gly Trp Arg Cys Met Phe Phe Ser
195 200 205
Gly Ile Ile Ser Ser Val Leu Gly Leu Phe Ile Phe Asn Ser Leu Glu
210 215 220
Glu Ser Pro Leu Trp Lys Gln Leu Gln Ala Ala Lys Gly His Ala Ala
225 230 235 240
Pro Val Glu Asn Pro Leu Arg Val Ile Phe Ser Arg Gln Tyr Arg Gly
245 250 255
Val Leu Phe Val Asn Ile Leu Leu Thr Val Gly Gly Gly Ser Ala Tyr
260 265 270
Tyr Leu Thr Ser Gly Tyr Leu Pro Thr Phe Leu Lys Val Val Val Lys
275 280 285
Ala Ser Ala Gly Glu Ser Ala Ala Ile Leu Met Ala Ser Ser Leu Gly
290 295 300
Val Ile Val Ala Ser Ile Leu Ala Gly His Leu Ser Thr Met Ile Gly
305 310 315 320
Arg Lys Arg Ala Phe Leu Leu Ile Gly Ala Leu Asn Val Val Val Leu
325 330 335
Pro Leu Leu Tyr Gln Trp Met Pro Ala Ala Pro Asp Thr Thr Thr Leu
340 345 350
Gly Leu Tyr Ala Val Val Leu Ser Met Leu Gly Cys Ser Gly Phe Ala
355 360 365
Pro Ile Leu Ile Phe Leu Asn Glu Arg Phe Pro Thr Ser Ile Arg Ala
370 375 380
Thr Gly Thr Gly Leu Ser Trp Asn Ile Gly Phe Ala Val Gly Gly Met
385 390 395 400
Met Pro Thr Phe Ala Ser Leu Cys Ala Ser Thr Pro Ala Glu Leu Pro
405 410 415
Met Val Leu Gly Ile Phe Leu Ala Val Val Thr Ile Ile Tyr Leu Val
420 425 430
Gly Ala Phe Ile Val Pro Glu Thr Val Gly Arg Leu Gly Asp Asn Gly
435 440 445
Ala
<210> 3
<211> 449
<212> PRT
<213> Methylobacterium radiotolerans JCM2831
<400> 3
Met Gln Thr Ala Ala Thr Phe Ala Ser Asp Pro Pro Ala Leu Ala Lys
1 5 10 15
Pro Thr Gly Arg Gln Thr Val Thr Ala Ala Met Ala Ser Leu Phe Gly
20 25 30
Trp Gly Leu Asp Leu Phe Asp Leu Phe Ile Leu Leu Tyr Val Ala Pro
35 40 45
Val Val Gly Thr Leu Phe Phe Pro Ala Asp Lys Pro Met Leu Ser Leu
50 55 60
Ala Gly Ala Tyr Ala Ser Phe Ala Val Thr Leu Leu Ile Arg Pro Leu
65 70 75 80
Gly Ser Ala Leu Phe Gly Ser Tyr Ala Asp Arg Phe Gly Arg Arg Arg
85 90 95
Ala Leu Met Val Ala Val Val Gly Val Gly Ile Ser Thr Ala Val Phe
100 105 110
Gly Leu Leu Pro Thr Val Gly Gln Ile Gly Trp Leu Ala Thr Ala Val
115 120 125
Phe Leu Phe Phe Arg Leu Val Gln Gly Ile Phe Val Gly Gly Val Val
130 135 140
Ala Ala Ser His Thr Ile Gly Thr Glu Ser Val Pro Glu Arg Trp Arg
145 150 155 160
Gly Leu Met Ser Gly Ala Val Gly Gly Gly Gly Ser Ala Ile Gly Gly
165 170 175
Leu Leu Ala Ser Leu Val Phe Tyr Val Val Ser Leu Met Ala Pro Gly
180 185 190
Glu Ala Phe Ala Glu Trp Gly Trp Arg Leu Met Phe Phe Ser Gly Leu
195 200 205
Leu Thr Ser Val Ile Gly Leu Ile Leu Phe Arg Asn Leu Glu Glu Ser
210 215 220
Pro Ile Phe Lys Glu Leu Gln Ala Arg Lys Ala Ala Leu Arg Ala Gly
225 230 235 240
Ala Pro Ala Glu Ala Ser Pro Ile Arg Ser Leu Phe Ser Pro Ser Asn
245 250 255
Arg Gly Ser Phe Ala Val Ala Thr Leu Ile Ser Phe Gly Gly Gly Ala
260 265 270
Ala Tyr Tyr Leu Thr Ser Gly Tyr Leu Pro Thr Leu Leu Lys Leu Val
275 280 285
Asn Gly Val Pro Asn Ala Thr Ala Ser Met Ile Leu Ile Gly Ala Asn
290 295 300
Val Ala Ala Ala Ile Gly Ala Cys Gly Met Gly Glu Leu Ser Gln His
305 310 315 320
Ile Gly Arg Lys Arg Ser Phe Leu Leu Met Gly Val Ile Arg Leu Leu
325 330 335
Ala Phe Pro Ala Leu Phe Leu Thr Met Ala Asn Thr Thr Ser Leu Val
340 345 350
Gly Val Ala Ala Cys Ala Phe Leu Leu Ala Leu Ile Ala Asn Gly Ser
355 360 365
Tyr Gly Pro Leu Leu Ile Phe Leu Asn Glu Lys Phe Pro Thr Ala Val
370 375 380
Arg Ala Thr Gly Thr Gly Leu Thr Trp Asn Ile Gly Phe Ala Leu Gly
385 390 395 400
Gly Met Leu Pro Thr Leu Val Ser Leu Val Ala Asp Gly Pro Thr Gln
405 410 415
Ile Pro Met Val Leu Ala Val Ile Thr Thr Gly Val Thr Leu Val Tyr
420 425 430
Leu Val Gly Ala Phe Leu Thr Asp Glu Thr Gln Gly Asn Leu Asp Arg
435 440 445
Ala
<210> 4
<211> 443
<212> PRT
<213> Sulfolobus acidocaldarius DSM 639
<400> 4
Met Lys Lys Glu Glu Lys Phe Thr Ser Asn His Phe Lys Trp Thr Leu
1 5 10 15
Ala Thr Phe Phe Thr Trp Thr Phe Asp Leu Tyr Asp Leu Phe Thr Ile
20 25 30
Leu Leu Val Ala Pro Tyr Ile Ser Ser Leu Phe Phe Pro Ser Ser Ile
35 40 45
Thr Phe Leu Ser Ile Ala Ala Thr Tyr Ala Gly Phe Ala Thr Ser Leu
50 55 60
Ile Met Arg Pro Val Gly Ala Thr Val Phe Gly Ser Arg Val Ser Asp
65 70 75 80
Lys Val Gly Arg Lys Arg Ala Ile Phe Tyr Gly Leu Ile Gly Leu Val
85 90 95
Ile Thr Ser Thr Leu Gln Gly Ala Leu Pro Thr Tyr Gln Val Val Gly
100 105 110
Val Ile Ala Pro Ile Leu Leu Leu Ala Val Arg Leu Ile Gln Gly Val
115 120 125
Phe Ile Gly Gly Ile Thr Ala Gly Ser His Val Ile Gly Pro Glu Ser
130 135 140
Val Pro Glu Arg Tyr Arg Gly Ile Val Gly Gly Leu Gly Phe Ser Ala
145 150 155 160
Ala Gly Val Ala Tyr Leu Ile Ala Ala Gly Trp Phe Phe Leu Thr Thr
165 170 175
Ile Leu Tyr Pro Gly Ser Ser Tyr Leu Val Trp Gly Trp Arg Val Met
180 185 190
Phe Phe Gly Gly Leu Leu Ser Leu Ala Val Leu Gly Phe Val Asn Tyr
195 200 205
Leu Val Pro Glu Ser Glu Val Trp Thr Lys Ile Lys Lys Arg Gly Ser
210 215 220
Val Val Lys Ser Pro Leu Lys Glu Ile Phe Ser Lys Tyr Arg Tyr Gln
225 230 235 240
Leu Gly Val Ala Leu Leu Leu Ser Ile Gly Trp Gly Ala Ser Phe Tyr
245 250 255
Val Thr Asp Gly Ile Leu Pro Thr Phe Leu Ser Ser Val Asn Lys Leu
260 265 270
Ala Lys Thr Glu Ile Ala Ile Val Met Ile Ile Gly Ser Ile Gly Met
275 280 285
Ser Ile Gly Pro Leu Ile Gly Gly Glu Ile Ser Gln Ile Ile Gly Arg
290 295 300
Lys Ile Thr Ser Leu Ile Gly Ala Ile Ile Val Leu Ala Val Val Gly
305 310 315 320
Pro Leu Phe Leu Ser Leu Gly Ser Leu Lys Ser Gly Asp Leu Asn Gln
325 330 335
Ile Ile Leu His Ser Phe Ala Ile Leu Phe Leu Val Asp Ile Gly Gly
340 345 350
Gly Met Leu Met Thr Tyr Leu Asn Glu Ile Tyr Pro Ala Ser Val Arg
355 360 365
Gly Thr Gly Val Gly Phe Thr Trp Asn Thr Gly Phe Ala Ile Gly Gly
370 375 380
Thr Ile Pro Thr Ile Ile Ser Leu Ala Val Ala Ser Ala Gly Leu Ser
385 390 395 400
Ala Phe Pro Ser Ile Met Phe Tyr Thr Leu Ile Val Val Ser Val Ile
405 410 415
Ile Leu Val Gly Thr Val Leu Thr Lys Glu Thr Lys Gly Thr Ile Ser
420 425 430
Lys Glu Glu Tyr Glu Ile Gln Lys Glu Thr Leu
435 440
<210> 5
<211> 579
<212> PRT
<213> Cupriavidus basilensis HMF14
<400> 5
Met Asp Thr Pro Arg Glu Arg Phe Asp Tyr Val Ile Val Gly Gly Gly
1 5 10 15
Ser Ala Gly Cys Val Leu Ala Asn Arg Leu Ser Gln Asp Pro Ala Ile
20 25 30
Arg Val Ala Leu Ile Glu Ala Gly Val Asp Thr Pro Pro Asp Ala Val
35 40 45
Pro Ala Glu Ile Leu Asp Ser Tyr Pro Met Pro Leu Phe Phe Gly Asp
50 55 60
Arg Tyr Ile Trp Pro Ser Leu Gln Ala Arg Ala Val Ala Gly Gly Arg
65 70 75 80
Ser Lys Val Tyr Glu Gln Gly Arg Val Met Gly Gly Gly Ser Ser Ile
85 90 95
Asn Val Gln Ala Ala Asn Arg Gly Leu Pro Arg Asp Tyr Asp Glu Trp
100 105 110
Ala Ala Ser Gly Ala Ser Gly Trp Ser Trp Gln Asp Val Leu Pro Tyr
115 120 125
Phe Arg His Leu Glu Arg Asp Val Asp Tyr Gly Asn Ser Pro Leu His
130 135 140
Gly Ser His Gly Pro Val Pro Ile Arg Arg Ile Leu Pro Gln Ala Trp
145 150 155 160
Pro Pro Phe Cys Thr Glu Phe Ala His Ala Met Gly Arg Ser Gly Leu
165 170 175
Ser Ala Leu Ala Asp Gln Asn Ala Glu Phe Gly Asp Gly Trp Phe Pro
180 185 190
Ala Ala Phe Ser Asn Leu Asp Asp Lys Arg Val Ser Thr Ala Ile Ala
195 200 205
Tyr Leu Asp Ala Asp Thr Arg Arg Arg Ala Asn Leu Arg Ile Tyr Ala
210 215 220
Glu Thr Thr Val Arg Lys Leu Val Val Ser Gly Arg Glu Ala Arg Gly
225 230 235 240
Val Ile Ala Met Arg Ala Asp Gly Ser Arg Leu Ala Leu Asp Ala Gly
245 250 255
Glu Val Ile Val Ser Ala Gly Ala Leu Gln Ser Pro Ala Ile Leu Met
260 265 270
Arg Ala Gly Ile Gly Asp Ala Gly Ala Leu Gln Ala Leu Gly Ile Glu
275 280 285
Val Val Ala Asp Arg Pro Gly Val Gly Arg Asn Leu Gln Asp His Pro
290 295 300
Ala Leu Thr Phe Cys Gln Phe Leu Ala Pro Gln Tyr Arg Met Pro Leu
305 310 315 320
Ser Arg Arg Arg Ala Ser Met Thr Ala Ala Arg Phe Ser Ser Gly Val
325 330 335
Pro Gly Gly Glu Ala Ser Asp Met Tyr Leu Ser Ser Ser Thr Arg Ala
340 345 350
Gly Trp His Ala Leu Gly Asn Arg Leu Gly Leu Phe Phe Leu Trp Cys
355 360 365
Asn Arg Pro Phe Ser Arg Gly Gln Val Ser Leu Ala Gly Ala Gln Pro
370 375 380
Asp Val Pro Pro Met Val Glu Leu Asn Leu Leu Asp Asp Glu Arg Asp
385 390 395 400
Leu Arg Arg Met Val Ala Gly Val Arg Lys Leu Val Gln Ile Val Gly
405 410 415
Ala Ser Ala Leu His Gln His Pro Gly Asp Phe Phe Pro Ala Thr Phe
420 425 430
Ser Pro Arg Val Lys Ala Leu Ser Arg Val Ser Arg Gly Asn Val Leu
435 440 445
Leu Thr Glu Leu Leu Gly Ala Val Leu Asp Val Ser Gly Pro Leu Arg
450 455 460
Arg Ser Leu Ile Ala Arg Phe Val Thr Gly Gly Ala Asn Leu Ala Ser
465 470 475 480
Leu Leu Thr Asp Glu Ser Ala Leu Glu Gly Phe Val Arg Gln Ser Val
485 490 495
Phe Gly Val Trp His Ala Ser Gly Thr Cys Arg Met Gly Ala His Ala
500 505 510
Asp Arg Ser Ala Val Thr Asp Ala Ala Gly Arg Val His Asp Val Gly
515 520 525
Arg Leu Arg Val Ile Asp Ala Ser Leu Met Pro Arg Leu Pro Thr Ala
530 535 540
Asn Thr Asn Ile Pro Thr Ile Met Leu Ala Glu Lys Ile Ala Asp Thr
545 550 555 560
Met Gln Ala Glu Arg Arg Ala Val Arg Pro Ala Ser Ser Glu Val Ala
565 570 575
His Pro Ser
<210> 6
<211> 564
<212> PRT
<213> Bradyrhizobium japonicum USDA 110
<400> 6
Met Tyr Asp Tyr Ile Ile Val Gly Gly Gly Ser Ala Gly Ser Val Leu
1 5 10 15
Ala His Arg Leu Ser Ala Lys Ser Ala Asn Lys Val Leu Leu Cys Glu
20 25 30
Ala Gly Gln Asp Thr Pro Pro Gly Asn Glu Pro Ala Glu Ile Arg Asp
35 40 45
Ser Tyr Pro Gly Thr Ala Tyr Phe Asp Pro Arg Phe His Trp Thr Glu
50 55 60
Leu Lys Val Thr Thr Gln Val Val Ser His Asn Asn Pro Thr Glu Ala
65 70 75 80
Arg Pro Pro Leu Arg Lys Tyr Glu Gln Ala Arg Val Leu Gly Gly Gly
85 90 95
Ser Ser Ile Asn Gly Gln Met Ala Asn Arg Gly Ala Pro Thr Asp Tyr
100 105 110
Asp Glu Trp Asp Ala Arg Gly Ala Glu Gly Trp Thr Trp Asn Asp Val
115 120 125
Leu Pro Phe Phe Lys Lys Val Glu Arg Asp Leu Asp Phe Asp Gly Pro
130 135 140
Tyr His Gly Lys Asp Gly Arg Ile Pro Val Arg Arg Ile Pro Arg Glu
145 150 155 160
His Trp Thr Arg His Ser Gln Ala Phe Ala Asp Ala Phe Gln Gln Ala
165 170 175
Gly His Gln Phe Val Ala Asp Gln Asn Gly Glu Phe Val Asp Gly Tyr
180 185 190
Phe Ala Val Thr His Ser Asn Gln Ala Glu Gln Arg Val Ser Ala Ala
195 200 205
Met Gly Tyr Leu Asp Arg Asp Thr Arg Lys Arg Ala Asn Leu Thr Ile
210 215 220
Ser Thr Asn Thr Gln Val Arg Glu Leu Leu Phe Glu Gly Thr Gln Cys
225 230 235 240
Val Gly Val Lys Ala Arg Val Asp Gly Arg Glu Gln Glu Phe Arg Gly
245 250 255
Arg Glu Ile Ile Leu Ser Ser Gly Ala Ile His Ser Pro Ala His Leu
260 265 270
Leu Arg Ala Gly Ile Gly Pro Val Gly His Leu Lys Asp Met Gly Ile
275 280 285
Pro Val Leu Thr Gly Leu Pro Gly Val Gly Gln Arg Leu Met Asp His
290 295 300
Pro Ser Ile Ser Leu Ser Ser Phe Val Arg Arg Gly Ala Arg Met Asn
305 310 315 320
Glu His Thr Arg Arg His Met Gln Leu Gly Leu Arg Tyr Ser Ser Gly
325 330 335
Leu Ser Gly Val Pro Lys Gly Asp Met Phe Val Val Val Leu Ser Lys
340 345 350
Ser Ala Trp His Ala Val Gly Ala Gln Ile Gly Ser Leu Leu Thr Phe
355 360 365
Val Asn Lys Thr Tyr Ser Glu Thr Gly Gln Val Lys Leu Ala Ser Arg
370 375 380
Asp Pro Ser Ala Glu Pro Ile Val Glu Phe Asn Leu Leu Ser Asp Arg
385 390 395 400
Arg Asp Leu Asp Arg Leu Met Ser Gly Phe Arg Lys Met Ala Ala Val
405 410 415
Gln Met Ser Glu Ile Val Arg Lys Val Thr Asp Lys Pro Phe Pro Ala
420 425 430
Ala Tyr Thr Asp Lys Val Arg Lys Ile Gly Val Val Asn Thr Gly Asn
435 440 445
Lys Ile Leu Thr Arg Val Ala Ala Ala Leu Met Asp Gly Pro Ala Ala
450 455 460
Leu Arg His Tyr Leu Ile Asp Asn Phe Val Val Glu Gly Phe Thr Phe
465 470 475 480
Asp Asp Val Met Asn Asp Asp Glu Ala Leu Glu Ala Phe Val Arg Lys
485 490 495
Ala Thr Ile Gly Val Trp His Ala Ser Cys Ser Cys Arg Met Gly Arg
500 505 510
Ala Asp Asp Pro Met Ala Val Val Asp Asn Gln Gly Arg Val Arg Gly
515 520 525
Val Gln Gly Leu Arg Val Val Asp Ala Ser Ile Phe Pro Val Val Pro
530 535 540
Cys Ala Asn Thr Asn Phe Pro Val Leu Met Ser Ala Glu Lys Ile Ala
545 550 555 560
Ala Thr Met Gln
<210> 7
<211> 1326
<212> DNA
<213> Cupriavidus basilensis HMF14
<400> 7
atggaagccg tagcaaagaa gcgtacagag acgatcagcg aggcgctgcc agcggcgacc 60
aatcgccagg tgtttggtgc cgtgacggcg tcgtgcatgg gatgggcgct ggacctgttc 120
gacctgttca tcctgctgtt cgtggcgccc gtgatcggca ggctgttttt cccgtcggag 180
cacgccatgc tgtcgctggc ggcggtgtat gcgtcgtttg ccgtgacgct gctgatgcgg 240
ccgctcggct cggcgatctt cggcacttat gccgaccgcc acggccgcaa gggggcgatg 300
gtagttgccg tcactggcgt tggcttgtcc acggcggcgt tcggcctgct gcctacggtg 360
ggtcaggtgg ggctgcttgc gccagccttg tttatcctgc tgcggctggt gcagggcatc 420
ttcgtaggtg gcgtggtggc atccacccac accatcggta ccgaatcggt gcccccgtcc 480
tggcgcggcg ccgtctccgg gctggtcggt ggcggtggcg cgggcatcgg ggcactgctg 540
gcttccatta cctacatggc gatgaccgcg ctgtttccgg gggaagcgtt cgatgcctgg 600
ggttggcgct gcatgttctt ctccggcatc atcagctcgg tgctcggcct gttcatcttc 660
aactcgctgg aggagtctcc gctgtggaag cagttgcagg cggccaaggg gcacgccgcg 720
ccggttgaga acccgctgcg cgtgatcttc tcccgccagt accgtggcgt cctcttcgtc 780
aacatcctgc tcaccgtggg cggtggcagc gcctactacc tgacctccgg ctatctgccg 840
accttcctca aggtggtggt gaaggcaccg gctggcgcat ccgcagccat cctgatggcc 900
agcagtgttg gcgttatcgt ggcatcgata attgccggtc acctcagcac gctgattggt 960
cgcaagcgag ccttcctgct gatcggcgcc ttgaacgtgg tgctgctgcc gttgatctac 1020
caacggatgc ccgcggcgcc ggatgtcacc acgcttggca tttatgccgt ggcgctggcg 1080
atgctgggca gcaccggctt cgccccgatc ctcattttcc tgaacgaacg ggtttcccac 1140
cagcatccgt gctacgggaa ctggcctgtc atggaatatc ggctttgcca tcggcggcat 1200
gatgcgacgt ttgcgtcgct gtgcgcagca cccccgcgac tgccaaagtg ctggggatct 1260
cgtcgcggtg tcaaagcatt tactgccggt gcggcgatcg tctggaacgc gccgctgggg 1320
gagtga 1326
<210> 8
<211> 1350
<212> DNA
<213> Cupriavidus basilensis HMF14
<400> 8
atggaagccg tagcaaagaa gagtgcagcg acgatcagcg aggcgctgcc agcggcgagc 60
aatcgccagg tgtttggtgc cgtggcggcg tcgtgcatgg gatgggcgct ggacctgttc 120
gacctgttca tcctgctgtt cgtggcgccc gtgatcggca ggctgttttt cccgtcggag 180
cacgcgatgc tgtcgctggc ggcggtgtat gcgtcgtttg ccgtgacgct gctgatgcgg 240
ccgctcggct cggcgatctt cggctcttat gccgaccgcc acggccgcaa gggggcgatg 300
gtggttgccg tcactggcgt tggcttgtcc acggcggcgt tcggcctgct gccgacggtg 360
ggtcaggtgg ggctgcttgc gccagccttg tttatcctgc tgcggctggt gcagggcatc 420
ttcgtgggtg gcgtggtggc atccacccac accatcggta ccgaatcggt gcccccgtcc 480
tggcgcggcg ccgtttccgg gctggttggt ggcggtggcg cgggtctcgg ggcgctgctg 540
gcttccatta cctacatggc gatgaccgcg ctgtttccgg gggaagcgtt cgatgcctgg 600
ggttggcgct gcatgttctt ctccggcatc atcagctcgg tgctcggcct gttcatcttc 660
aactcgctgg aggagtctcc gctgtggaag cagttgcagg cggccaaggg gcacgccgcg 720
ccggttgaga acccgctgcg cgtgatcttc tcccgccagt accgtggtgt cctcttcgtc 780
aacatcctgc tcaccgtggg cggtggcagc gcctactacc tgacctccgg ctatctgccg 840
accttcctca aggtggtggt gaaggcatcg gctggcgagt ctgccgccat cctgatggcc 900
agcagtctgg gtgtgatcgt ggcatcgatt cttgccggcc acctcagtac gatgatcggc 960
cgcaagcgag ccttcctgtt gatcggcgcg ctgaacgtgg tagtactgcc gctgctctac 1020
cagtggatgc cggcggcgcc ggacaccacc acgctcggcc tgtatgctgt ggtgctgtcc 1080
atgctgggct gcagcggctt cgccccgatc ctcattttcc tgaacgaacg gttccccacc 1140
agcatccgtg ccacggggac cggcctgtca tggaatatcg gatttgccgt cggtggcatg 1200
atgccgacgt ttgcttcgct gtgcgccagc acccctgccg aactgcccat ggtgctgggc 1260
atcttcctgg cggttgtcac catcatctac ctggtgggtg cgttcatcgt tccggagacg 1320
gtagggcgcc ttggcgacaa tggagcgtag 1350
<210> 9
<211> 1350
<212> DNA
<213> Methylobacterium radiotolerans JCM2831
<400> 9
atgcagaccg ccgccacctt cgcatccgat ccccccgccc tcgccaaacc cacaggccgg 60
cagacggtga ccgccgccat ggcctcgctg ttcggctggg ggctcgatct cttcgacctg 120
ttcatcctgc tttacgtcgc gccggtcgtt ggcacgttgt tcttcccggc ggacaagccg 180
atgctgtcgc tggccggcgc ctatgcgtcc ttcgcggtca cgctgctgat ccggcccctc 240
ggctcggccc tgttcggctc ctatgcggac cgcttcggcc gccgtcgcgc cctcatggtg 300
gcggtggtcg gcgtcggcat atcgaccgcg gtcttcggtc tcctgccgac ggtcggccag 360
atcggatggc tcgcgactgc ggtcttcctt ttcttccgcc tcgtccaggg catcttcgtc 420
ggcggcgtcg tcgcggcatc ccacacgatc gggacggaat ccgtcccgga gcggtggcgg 480
gggctgatgt ccggggcggt cggcggtggc ggctcggcca tcggcggcct gcttgcctcc 540
ctggtcttct atgtcgtctc gctcatggcg ccgggagaag ccttcgccga gtggggctgg 600
cggctgatgt tcttctcggg tctcctgacc tcggtgatcg gcctgatcct cttccgcaat 660
ctcgaggaat ccccgatctt caaggaactg caggcccgga aggcggcgct ccgggcaggc 720
gctccggcgg aggcctcacc gatccgctcc ctgttctcac cgtccaaccg gggaagcttc 780
gcggtcgcga ctctcatctc cttcggtggt ggcgcagcct actaccttac gtccggctac 840
ctgccgaccc tcctcaagct cgtgaacggc gtgccgaacg ccaccgcctc gatgatcctg 900
atcggcgcca acgtcgcggc ggcgatcggc gcctgcggca tgggcgaact gagccagcat 960
atcgggcgca aacggtcgtt ccttctgatg ggcgtcatcc gcctgctcgc ttttcccgcc 1020
ctgttcctga ccatggcgaa cacgacgagc ctcgttgggg tcgcggcctg cgccttcctg 1080
ctggcgctca tcgccaacgg cagctacggg ccgctgctga tcttcctcaa cgaaaaattc 1140
ccgacggcgg tgcgggccac ggggacgggc ctgacctgga acatcggctt cgcgctgggc 1200
ggcatgctgc cgacgctcgt ctcccttgtc gccgacgggc cgacgcaaat tccgatggtg 1260
ctggccgtca tcacgaccgg cgtcaccctg gtctatcttg tcggtgcctt cctgaccgac 1320
gagacgcagg gcaatctcga ccgggcctga 1350
<210> 10
<211> 1332
<212> DNA
<213> Sulfolobus acidocaldarius DSM 639
<400> 10
atgaaaaaag aagaaaaatt tacttcaaat cattttaaat ggactttagc aacctttttc 60
acctggacat tcgacttata tgacctgttc actatcctac ttgttgcacc ttatatctct 120
tccctgtttt tcccttcaag tatcactttc ttgtctatag cggcaacata tgcggggttt 180
gccacctcat tgatcatgag acctgtaggt gctacagtct ttgggtctag ggtatcggac 240
aaggtaggta gaaagagggc tattttttac ggtctaatag gtcttgtgat aacttccaca 300
ttacagggcg cattaccgac ttatcaagta gtaggagtga tagcaccaat attactgtta 360
gcagtgagac tgattcaagg ggtgttcata ggaggcataa ctgcaggtag tcatgtgata 420
ggacctgagt ctgtcccaga gaggtataga gggattgtag gtggactagg gttttcagct 480
gctggagtgg catacctcat agcagctggc tggtttttcc tgacaaccat actctaccct 540
ggaagttcct atctggtatg gggatggaga gtgatgttct ttggcgggct actgagctta 600
gctgtacttg gatttgtaaa ctatttagtc cctgagtctg aggtttggac taaaattaaa 660
aagagagggt cagtggtgaa gtctcccctc aaggagatat tttcgaaata caggtatcag 720
ttaggcgttg cactgctact ttcaattggc tggggtgcaa gtttttacgt tactgatggt 780
atactaccta cgtttttaag tagtgtcaat aaattagcca agactgaaat agcaatagta 840
atgataatag ggtcaattgg gatgtcgata ggaccattaa taggagggga gatatcccag 900
ataataggga ggaagataac gtcattaata ggtgcaatta ttgtactagc agtagttgga 960
cctctctttc tctccctggg ttcactaaaa tccggtgacc ttaatcagat aattcttcac 1020
tcttttgcaa tcctgttctt agtcgatata ggaggaggga tgctaatgac ttacctaaat 1080
gagatatatc cagctagcgt gaggggaaca ggggttggct tcacgtggaa tactgggttt 1140
gcaataggag ggacaatccc aaccataatc agcctagcag tagcttcagc aggtctctct 1200
gcttttccct ctataatgtt ctacacctta atagtggtct ctgtaataat attagtgggt 1260
acagtactca cgaaggagac taagggtacc atatcaaagg aggagtatga gattcagaag 1320
gagactttat ag 1332
<210> 11
<211> 1740
<212> DNA
<213> Cupriavidus basilensis HMF14
<400> 11
atggatacgc cgagggagcg tttcgactac gtgattgttg gcggcgggtc cgccggttgc 60
gtactggcca atcgcctgtc gcaggacccg gccatccgcg tcgcgctgat cgaggcgggc 120
gtcgatacgc cgccggacgc tgtgccggcg gagatcctcg acagctatcc gatgcccttg 180
ttcttcggtg accggtatat ctggccatcg ctgcaagccc gcgccgtggc agggggcagg 240
tccaaggtct acgagcaagg gcgcgtcatg ggcggcggct ccagcatcaa cgtgcaggcg 300
gcaaaccgcg ggctgccgcg cgactacgat gagtgggccg cgtcgggcgc gtccggatgg 360
tcgtggcagg atgtgctgcc gtatttccgc caccttgagc gcgatgtgga ttacggcaac 420
agcccgctgc acggcagcca cggaccggtg ccgatccgcc gcatcctgcc gcaggcttgg 480
ccgccgttct gcacggagtt tgcgcacgcg atgggccgca gcggcttgtc cgcgctggcc 540
gaccagaacg cggagttcgg cgatggctgg tttccggccg ccttctcgaa cctggatgac 600
aagcgggttt cgaccgccat cgcctatctc gacgcggata cgcgccggcg ggccaatctg 660
cggatctatg ccgagacaac ggtgcgcaag ctcgtcgtat ccggccggga agcgcgtggg 720
gtgatcgcca tgcgggccga tgggtcgcgg ctggcgctgg acgccgggga ggtcatcgtg 780
tccgcgggcg ccttgcagtc gcccgccatc ctgatgcgcg cggggatcgg cgacgccggc 840
gcgctgcagg ccctcggcat cgaggtcgta gccgaccgac ccggcgttgg ccgcaatctc 900
caggatcatc ccgcgctgac gttctgccag ttcctcgcgc cccagtaccg catgccgctc 960
tcgcgccggc gcgctagcat gacggcggcg cggttctcat cgggggtgcc aggtggcgag 1020
gcgtcggaca tgtacctgtc cagttccaca cgggcaggct ggcatgcact cggtaatcgg 1080
ctcggcctct tcttcctgtg gtgcaatcgg ccattctcgc gcgggcaggt gagccttgcg 1140
ggagcccagc cggatgtgcc gcccatggtg gagctcaacc tgctcgacga cgagcgggat 1200
ctgcggcgca tggtggccgg cgtacgcaag ttggtgcaga tcgtgggtgc gtcggccttg 1260
catcagcatc ccggtgattt cttccccgct acgttttcgc cgcgcgtcaa ggcgctgagc 1320
cgcgtgagcc gcggcaatgt gttgctcacg gagttgctgg gggcagtgct tgatgtctcg 1380
gggccgctgc gcagaagcct gatcgcgcgc tttgtcacgg gcggcgcaaa cctggccagc 1440
ctgctgacgg atgagtccgc gctagagggc ttcgtgcgcc agagcgtctt cggggtctgg 1500
catgccagcg gcacttgccg gatgggcgcg catgcggacc ggagcgcggt gacggatgcg 1560
gcgggccgcg ttcacgatgt tggcaggctg cgcgttattg acgcctctct gatgccgcgg 1620
ctgccgacgg ccaataccaa catccccacc atcatgctcg cggaaaagat tgccgacacc 1680
atgcaagccg agcgccgcgc ggtccggccg gcatcgagcg aagttgccca tccgagttga 1740
<210> 12
<211> 1695
<212> DNA
<213> Bradyrhizobium japonicum USDA 110
<400> 12
gtgtacgact acattatcgt gggcggcggc tcggcggggt ccgtgctggc ccaccggctc 60
tccgcaaaga gtgccaacaa ggtcctgctc tgcgaagccg gacaggacac accacccggc 120
aacgagccgg ccgagatcag ggacagctat ccgggcacgg cctatttcga tccgcgcttc 180
cactggacgg aattgaaggt cacgacgcag gtcgtcagcc acaacaatcc gaccgaagcg 240
cgtcctccct tgcgcaaata cgagcaggcg cgcgtgctcg gcggcggctc gtcgatcaac 300
ggccagatgg ccaaccgcgg cgcgccgacc gactacgacg aatgggatgc gcggggtgcc 360
gaagggtgga cgtggaacga cgtgctgccg ttcttcaaga aggtcgagcg cgacctcgat 420
ttcgacggcc cgtatcacgg caaggacggc cggatcccgg tgcgccggat tccgcgggag 480
cactggacac ggcattcgca ggccttcgcc gatgccttcc agcaggccgg tcatcaattc 540
gtggcggacc agaacggcga gttcgtcgac ggctatttcg cggtgacgca ctccaaccag 600
gccgagcagc gcgtctccgc cgcgatgggc tatctcgatc gcgacacccg caagcgcgcc 660
aacctcacga tctccaccaa cacgcaagtt cgggagctgc tgttcgaagg cacgcaatgc 720
gtcggcgtga aggccagggt cgacgggcgg gagcaggaat tccgcggacg cgagatcatt 780
ctctccagcg gcgccatcca ttcgccggcg catctgctcc gcgccggtat cggcccggtc 840
ggccacctca aggacatggg gattcccgtg ctgacgggct tgccgggcgt cggccagcgc 900
ctgatggatc atccctcgat ttcgctgtcg tcctttgtcc gccgcggcgc gcgcatgaac 960
gagcatacca ggcgccacat gcagcttggc ctgcgctatt cgtccgggct gtcaggggtg 1020
ccgaagggcg acatgttcgt cgtcgtgctc agcaaatcgg cctggcacgc ggtcggcgcg 1080
caaatcggct cgctgctgac cttcgtcaac aagacctatt ccgagaccgg acaggtcaag 1140
cttgcctcgc gcgacccttc cgcagagccg atcgtcgagt tcaacctgct gtcggaccgg 1200
cgcgacctcg atcggctgat gagcggcttc cgcaagatgg cggcggtgca gatgagcgaa 1260
atcgtcagga aggtgacgga caagccgttc ccggccgcct ataccgacaa ggtccgcaag 1320
atcggcgtgg tcaacaccgg gaacaagatc ctgaccagag tcgcggcggc gctcatggac 1380
gggccggcgg cgctgcgtca ctatctgatc gacaatttcg tggtcgaagg cttcaccttc 1440
gatgacgtga tgaacgacga cgaggcgctt gaagccttcg tgcgcaaggc gaccatcggc 1500
gtgtggcacg cctcgtgctc atgccgcatg ggccgggccg acgatccgat ggcggtggtc 1560
gacaaccagg gccgcgtcag gggtgtccag ggtctgcggg tcgtcgacgc ctcgatcttc 1620
ccggtggtgc catgcgccaa caccaacttt ccggtgctga tgtcggcaga gaagatcgct 1680
gcaaccatgc agtga 1695
<210> 13
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 13
acgaattcaa aggagacaac aatggaag 28
<210> 14
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 14
aagctagctg agcagtcacc ctcactc 27
<210> 15
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 15
cggaattcca catgacaagg gagaccg 27
<210> 16
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 16
cggaattcgc ttcggtcttc aactcggatg 30
<210> 17
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 17
acgaattcgg aggaaatcta tgcagacc 28
<210> 18
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 18
aagctagcgc agaaccgtat cgtcag 26
<210> 19
<211> 500
<212> PRT
<213> Cupriavidus basilensis HMF14
<400> 19
Met Asn Ala Gln His Trp Ile Ala Gly Ala Trp Thr Gly Glu Pro Ser
1 5 10 15
Ala Asp Ser Val Asn Pro Ala Asp Gly Thr Leu Ile Gly Gln Phe Ala
20 25 30
Asp Gly Gly Thr Trp Gln Ala Glu Ala Ala Ile Ala Ala Ala Arg His
35 40 45
Val Phe Glu Arg Thr Thr Trp Gly Gln Asp Ala Arg Leu Arg Gln Asp
50 55 60
Val Leu Leu Ala Trp Ala Gly Ala Leu Glu Ala Glu Arg Glu Arg Leu
65 70 75 80
Ala Ser Leu Leu Thr Ala Glu Asn Gly Lys Pro Val Ala Gln Ala Arg
85 90 95
Gly Glu Val Gly Ala Ala Ile Ser Glu Val Arg Tyr Tyr Ala Gly Leu
100 105 110
Ala Arg His Ile Pro Gly His Val Leu Glu Pro Glu Pro Gly Thr Ile
115 120 125
Ser Thr Ile Leu Arg Glu Pro Ala Gly Val Ala Ala Ile Ile Val Pro
130 135 140
Trp Asn Ala Pro Ala Val Leu Leu Val Arg Ser Leu Ala Pro Ala Leu
145 150 155 160
Ala Ala Gly Cys Thr Ala Val Val Lys Ser Ala Ala Gln Thr Thr Leu
165 170 175
Phe Thr Ala Ala Met Leu Arg Leu Phe Glu Arg Thr Ala Leu Pro Ala
180 185 190
Gly Ala Val Asn Leu Val Cys Glu Thr Gly Tyr Ala Ala Ala Asp His
195 200 205
Leu Val Arg Ser Arg Asp Val Asp Val Val Ser Phe Thr Gly Ser Thr
210 215 220
Ala Thr Gly Lys Lys Ile Met Ile Ala Ala Ala Asp Ser Val Lys Lys
225 230 235 240
Leu Ser Leu Glu Leu Gly Gly Lys Ser Cys Cys Leu Val Phe Asp Asp
245 250 255
Val Asp Ala Gln Ala Val Ala Lys Arg Leu Ala Leu Ala Ala Thr Val
260 265 270
Ile Ser Gly Gln Gln Cys Thr Ala Ala Arg Arg Val Leu Val His Glu
275 280 285
Ala Ile Ala Pro Gln Met Arg Arg His Leu Thr Glu Ala Leu Ala Ala
290 295 300
Leu Arg Leu Gly Pro Gly Ile Glu Pro Asp Thr Gln Ile Gly Pro Leu
305 310 315 320
Ile Asp His Pro Thr Arg Ala Met Val Ser Ala Gln Val Glu Arg Ala
325 330 335
Cys Asp Glu Ala Asp Thr Val Leu Leu Arg Gly Thr Met Pro Gly Gly
340 345 350
Ala Leu Ala Arg Gly Ala Phe Leu Ser Pro Thr Leu Val Glu His Ser
355 360 365
Asp Pro Gly Ala Phe Phe Cys Gln Glu Glu Ile Phe Gly Pro Phe Val
370 375 380
Thr Phe Glu Thr Phe Ala Thr Glu Asp Glu Ala Leu Ala Lys Ala Asn
385 390 395 400
Asn Thr Val Phe Gly Leu Ser Ala Ser Val Trp Thr His His Gly Glu
405 410 415
Arg Ala Ile Arg Leu Ala Arg Ala Leu Arg Asn Gly Thr Val Trp Val
420 425 430
Asn Asp His Asn Arg Leu Phe Ala Glu Ala Glu Thr Gly Gly Tyr Arg
435 440 445
Gln Ser Gly Leu Gly Arg Leu His Gly Tyr Asp Ala Leu Ala Asp Phe
450 455 460
Thr Glu Leu Lys His Ile Cys Ile Gln Ala Gly Leu Pro Lys Gly Met
465 470 475 480
Ser Gln Ala Gly Cys Arg Leu Ser Gly Val Ala Ala Arg Glu Arg Met
485 490 495
Gly Val Ser Val
500
<210> 20
<211> 479
<212> PRT
<213> Burkholderia sp. CCGE1002
<400> 20
Met Asn Ala Arg His Trp Ile Ala Gly Glu Trp Thr Gly Thr Pro Asn
1 5 10 15
Ile Asp Ser Ile Asp Pro Ala Thr Gly Asp Ala Ile Gly Arg Phe Ala
20 25 30
Asp Gly Gly Ser Ser Glu Ala Asp Ala Ala Ile Ala Ala Ala Arg His
35 40 45
Ala Phe Asp Arg Thr Thr Trp Ala Gln Asp Ala Arg Leu Arg Gln Asp
50 55 60
Val Leu Leu Gly Trp Ala Ser Ala Leu Glu Ala Glu Arg Asp Met Leu
65 70 75 80
Ala Thr Leu Leu Thr Arg Glu Asn Gly Lys Ala Ile Ala Gln Ser Arg
85 90 95
Asp Glu Ile Ala Gly Ala Ile Ser Glu Val Arg Tyr Tyr Ala Gly Leu
100 105 110
Ala Arg His Ile Ala Gly His Val Leu Glu Pro Glu Pro Gly Thr Ile
115 120 125
Ser Thr Met Leu Arg Glu Ala Ala Gly Val Ala Ala Ile Ile Val Pro
130 135 140
Trp Asn Ala Pro Ala Val Leu Leu Val Arg Ser Leu Ala Pro Ala Leu
145 150 155 160
Ala Ala Gly Cys Thr Val Ile Val Lys Pro Ala Ala Gln Thr Ser Leu
165 170 175
Leu Thr Ala Ala Met Leu Arg Cys Phe Glu His Thr Ala Leu Pro Glu
180 185 190
Gly Ala Val Asn Leu Val Asn Glu Arg Gly Tyr Ala Ala Ser Gln Arg
195 200 205
Leu Val Asp Ser His Gly Val Asp Val Val Ser Phe Thr Gly Ser Thr
210 215 220
Ala Thr Gly Lys Lys Ile Met Ala Ala Ala Ala Asp Ser Met Lys Lys
225 230 235 240
Leu Ser Leu Glu Leu Gly Gly Lys Ser Cys Cys Val Val Phe Asp Asp
245 250 255
Ala Asp Val Ala Ala Ile Ala Pro Arg Leu Ala Arg Ala Ala Thr Ile
260 265 270
Ile Ser Gly Gln Gln Cys Thr Ala Ala Arg Arg Val Leu Val His Ala
275 280 285
Ser Arg Ala Ala Gln Met Arg Glu Gln Leu Ala Ser Ala Leu Ala Ser
290 295 300
Leu Arg Val Gly Pro Gly Ile Asp Pro Ala Thr Asp Ile Gly Ala Leu
305 310 315 320
Ile Asp Gly Thr Thr Arg Asp Ala Val Ala Arg Thr Ile Glu Arg Ala
325 330 335
Cys Gly Thr Ala Glu Arg Val Leu Leu Arg Gly Thr Cys Ser Gly His
340 345 350
Ala Phe Leu Ser Pro Thr Leu Val Glu His Asp Asp Pro Lys Ala Phe
355 360 365
Phe Cys Gln Asp Glu Ile Phe Gly Pro Phe Val Thr Leu Glu Val Phe
370 375 380
Glu Asn Glu Met Glu Ala Ile Glu Lys Ala Asn Asp Thr Val Phe Gly
385 390 395 400
Leu Ser Ala Ser Val Trp Thr His Asp Gly Ala Arg Ala Leu Arg Val
405 410 415
Ala Arg Ala Leu Arg Asn Gly Thr Val Trp Ile Asn Asp His Asn Lys
420 425 430
Leu Phe Ala Glu Ala Glu Thr Gly Gly Tyr Arg Gln Ser Gly Leu Gly
435 440 445
Arg Leu His Gly Tyr Asp Ala Leu Ala Asp Phe Thr Glu Leu Lys His
450 455 460
Ile Cys Met Pro Ala Gly Val Ala Glu Gly Ile Ala Pro Leu Arg
465 470 475
<210> 21
<211> 483
<212> PRT
<213> Burkholderia graminis C4D1M
<400> 21
Met Glu Arg Asp Ala Met Asn Trp Ile Ala Gly Glu Trp Ala Gly Lys
1 5 10 15
Pro Val Leu Ala Ser Ser Asp Pro Ser Asn Gly Glu Thr Leu Gly Arg
20 25 30
Phe Val Ser Ser Asn Thr Gln Asp Ala Asp Ala Ala Val Ser Ala Ala
35 40 45
Arg His Thr Phe Asp His Thr Thr Trp Ala Gln Asp Ala Arg Arg Arg
50 55 60
Gln Asp Val Leu Leu Arg Trp Ala Gln Ala Leu Glu Leu Ser Val Glu
65 70 75 80
Pro Leu Ala Glu Leu Leu Thr His Glu Asn Gly Lys Thr Ile Gly Gln
85 90 95
Ala Arg Gly Glu Met Arg Ala Ala Ile Ser Glu Val Arg Tyr Tyr Ala
100 105 110
Gly Leu Ala Arg His Ile Ala Gly His Val Ile Glu Pro Glu Pro Gly
115 120 125
Thr Ile Ser Thr Met Leu Arg Glu Ala Ala Gly Val Ala Ala Ile Ile
130 135 140
Val Pro Trp Asn Ala Pro Ala Val Leu Leu Val Arg Ser Leu Ala Pro
145 150 155 160
Ala Leu Ala Ala Gly Cys Thr Ala Ile Val Lys Pro Ala Ala Gln Thr
165 170 175
Ser Leu Ile Thr Ala Ala Met Ile Arg Cys Leu Asp Gln Pro Ala Leu
180 185 190
Pro Ala Gly Ala Val Asn Leu Leu Leu Glu Asn Gly Ala Glu Ala Ala
195 200 205
Ala Arg Leu Val Glu Ser Ala Asp Val Asp Val Ile Ser Phe Thr Gly
210 215 220
Ser Thr Glu Val Gly Lys Arg Ile Met Arg Ala Ala Ala Asp Ser Met
225 230 235 240
Lys Arg Leu Ser Leu Glu Leu Gly Gly Lys Ser Cys Cys Leu Val Phe
245 250 255
Glu Asp Ser Asp Val Lys Ala Ile Ala Pro Arg Leu Ala Arg Ala Ala
260 265 270
Thr Ile Ile Ser Gly Gln Gln Cys Thr Ala Ala Arg Arg Ile Leu Val
275 280 285
His Val Ser Lys Ala Asp Gln Met Arg Asp Glu Leu Val Lys Ala Leu
290 295 300
Ala Ser Leu Lys Val Gly Pro Gly Ile Asp Pro Ala Ser Asp Ile Gly
305 310 315 320
Ala Leu Ile Asp Ala Ala Ser Arg Asp Ala Val Gln Thr Thr Val Glu
325 330 335
Arg Ala Cys Asp Leu Ala Asp Arg Val Leu Leu Arg Gly Thr Ser Ser
340 345 350
Gly Pro Gly Ala Phe Leu Ser Pro Thr Leu Val Glu His Gly Glu Pro
355 360 365
His Ala Phe Phe Cys Gln Asp Glu Ile Phe Gly Pro Phe Val Thr Leu
370 375 380
Glu Thr Phe Val Thr Glu Lys Glu Ala Val Glu Lys Ala Asn Asn Thr
385 390 395 400
Val Phe Gly Leu Ser Ala Ser Val Trp Thr His Asp Ser Ala Arg Ala
405 410 415
Phe Arg Ile Ala Arg Ala Leu Arg Asp Gly Thr Val Trp Ile Asn Asp
420 425 430
His Asn Arg Leu Phe Ala Glu Ala Glu Thr Gly Gly Tyr Arg Gln Ser
435 440 445
Gly Leu Gly Arg Leu His Gly Tyr Asp Ala Leu Ala Asp Phe Thr Glu
450 455 460
Ile Lys His Ile Cys Val Gly Ala Gly Val Leu Glu Gly Ile Glu Val
465 470 475 480
Leu Gly Ser
<210> 22
<211> 483
<212> PRT
<213> Azospirillum sp. B510
<400> 22
Met Thr Asn Leu Asp Ser Arg His Trp Ile Asp Gly Ala Trp Val Pro
1 5 10 15
Gly Thr Asp Arg Phe Ala Ser Ile Asn Pro Ala Asp Gly Ser Val Leu
20 25 30
Gly His Ala Ala Asp Gly Gly Arg Ala Glu Ala Glu Ala Ala Ile Ala
35 40 45
Ala Ala His Ala Ala Phe Asn Arg Pro Asp Trp Ala Gln Asn Pro Arg
50 55 60
Leu Arg Gln Ser Ile Leu Leu Gly Trp Ala Asp Arg Leu Asp Thr Gln
65 70 75 80
Ala Glu Asp Leu Ala Arg Leu Leu Thr Leu Glu Asn Gly Lys Ala Ile
85 90 95
Ala Gln Ser Arg Gly Glu Ile Ala Gly Ala Ile Ser Glu Ile Arg Tyr
100 105 110
Tyr Gly Gly Leu Ala Arg His Val Pro Gly His Val Leu Glu Val Glu
115 120 125
Pro Gly Val Leu Ser Thr Met Leu Arg Glu Pro Ala Gly Val Ala Ala
130 135 140
Leu Ile Ile Pro Trp Asn Ala Pro Ala Val Leu Leu Ala Arg Ala Ile
145 150 155 160
Gly Pro Ala Leu Ala Cys Gly Cys Thr Val Val Val Lys Pro Ala Ala
165 170 175
Gln Thr Thr Leu Leu Thr Ala Ala Phe Leu Arg Ala Leu Ser Glu Val
180 185 190
Pro Ser Leu Pro Arg Gly Val Cys Asn Met Ile Ser Glu Thr Gly His
195 200 205
Ala Ala Ala Ala Arg Leu Val Asp Ser Pro Leu Val Asp Val Val Ser
210 215 220
Phe Thr Gly Ser Thr Ala Thr Gly Lys Arg Ile Met Val Ala Ala Ala
225 230 235 240
Asp Thr Met Lys Lys Leu Ser Leu Glu Leu Gly Gly Lys Ser Cys Cys
245 250 255
Leu Val Phe Pro Asp Ala Asp Pro Ala Glu Thr Ala Ala Arg Ile Ala
260 265 270
Thr Ala Ala Thr Ile Ile Ser Gly Gln Gln Cys Thr Ala Ala Arg Arg
275 280 285
Val Leu Val His Ala Ser Ala Phe Asp Ala Met Lys Thr His Leu Arg
290 295 300
Ala Ala Leu Ala Ala Met Thr Val Gly Asn Gly Leu Asp Pro Ala Ile
305 310 315 320
Arg Met Gly Pro Leu Ile Asp Arg Pro Ala Arg Asp Gln Val Gln Thr
325 330 335
Gln Val Glu Arg Ala Phe Asp Ala Cys Asp Glu Val Leu Leu Arg Gly
340 345 350
Gly Val Pro Thr Asp Ser Pro Ala Ala Ala Ser Phe Leu Thr Pro Ser
355 360 365
Leu Val Ala His Asp Asp Pro Ser Ala Phe Phe Cys Gln Asp Glu Ile
370 375 380
Phe Gly Pro Phe Val Val Leu Glu Arg Phe Glu Thr Glu Ala Glu Ala
385 390 395 400
Val Ala Lys Ala Asn Asn Thr Val Phe Gly Leu Ser Ala Ser Val Trp
405 410 415
Thr Arg Asp Gly Ala Arg Ala Leu Arg Met Ala Arg Ala Leu Arg Asn
420 425 430
Gly Thr Val Trp Ile Asn Asp His Asn Arg Leu Phe Ala Glu Ala Glu
435 440 445
Thr Gly Gly Tyr Arg Gln Ser Gly Leu Gly Arg Leu His Gly Tyr Asp
450 455 460
Ala Phe Ala Asp Phe Thr Glu Leu Lys His Val Cys Gln Thr Val Gly
465 470 475 480
Thr Ile Gly
<210> 23
<211> 480
<212> PRT
<213> Pseudomonas putida
<400> 23
Met Gln Ser Gln His Tyr Ile Asp Gly Gln Trp Thr Ser Thr Asp Arg
1 5 10 15
Trp Thr Asp Ser Leu Asp Pro Ala Ser Gly Glu Leu Ile Gly Cys Phe
20 25 30
Ala Asp Gly Gly Glu Ala Glu Ala Glu Ala Ala Val Ala Ala Ala Ala
35 40 45
Arg Ala Phe Asn Asp Pro Gln Trp Ala Gln Asn Pro Arg Leu Arg Gln
50 55 60
Gln Leu Leu Leu Glu Trp Ala Ala Gly Leu Lys Ala Arg Gln Glu Gln
65 70 75 80
Leu Ala Gln Leu Leu Thr Arg Glu Asn Gly Lys Ala Leu Ala Gln Ser
85 90 95
Arg Gly Glu Ile Gly Gly Ala Ile Ser Glu Ile Leu Tyr Tyr Ala Gly
100 105 110
Leu Ala Arg His Asn Pro Gly His Met Leu Glu Val Ala Pro Gly Glu
115 120 125
Phe Ser Ser Met Leu Arg Glu Pro Ala Gly Val Ala Gly Leu Ile Ile
130 135 140
Pro Trp Asn Ala Pro Ala Val Leu Leu Val Arg Ala Leu Ala Pro Ala
145 150 155 160
Ile Ala Ala Gly Cys Thr Val Val Ile Lys Pro Ala Pro Gln Thr Ala
165 170 175
Leu Phe Asn Ala Ala Met Leu Glu Pro Leu Phe Ala Leu Pro Gly Leu
180 185 190
Pro Ala Gly Ala Val Asn Leu Phe Ala Glu Ser Gly His Ala Gly Ala
195 200 205
Ala His Leu Val Ala Ser Pro Arg Val Asp Val Leu Ser Phe Thr Gly
210 215 220
Ser Thr Ala Thr Gly Gln Arg Ile Met Arg Asp Cys Ala Ala Thr Met
225 230 235 240
Lys Lys Leu Ser Leu Glu Leu Gly Gly Lys Ser Cys Cys Leu Val Phe
245 250 255
Glu Asp Ala Asp Ile Ala Ala Ile Ala Pro Lys Leu Ala Ala Ala Ala
260 265 270
Thr Ile Ile Ser Gly Gln Gln Cys Thr Ala Ala Arg Arg Val Leu Val
275 280 285
His Ala Ser Arg Phe Ala Glu Met Lys Thr Ala Leu Ser Ala Ala Leu
290 295 300
Gly Gln Ile Arg Leu Gly Asn Gly Leu Asp Pro Ala Asn Asn Met Gly
305 310 315 320
Pro Leu Ile Asp Trp His Ser Arg Asp Ser Val Glu Arg Arg Ile Gly
325 330 335
Glu Ala Leu Asp Ser Cys Asp Glu Val Leu Leu Ala Gly Gly Arg Pro
340 345 350
Gln Gly Glu Leu Ser Lys Gly Ala Phe Leu Ala Pro Ser Leu Ile Ala
355 360 365
His Arg Asp Ser Ser Ala Phe Phe Cys Gln Glu Glu Ile Phe Gly Pro
370 375 380
Leu Leu Val Leu Glu Ser Phe Glu Asp Glu Thr Glu Ala Val Ala Arg
385 390 395 400
Ala Asn His Thr Glu Phe Gly Leu Ser Ala Ser Val Trp Thr Asp Gln
405 410 415
Gly Ala Arg Ala Trp Arg Val Ala Arg Ala Leu Arg Asn Gly Thr Val
420 425 430
Trp Leu Asn Asp His Asn Arg Leu Phe Ala Glu Ala Glu Thr Gly Gly
435 440 445
Tyr Arg Lys Ser Gly Leu Gly Arg Leu His Gly Val Asp Ala Leu Leu
450 455 460
Asp Phe Ser Glu Leu Lys His Ile Tyr Gln Asn Val Gly Thr Leu Gly
465 470 475 480
<210> 24
<211> 486
<212> PRT
<213> Rhodopseudomonas palustris BisB18
<400> 24
Met Gly Met Thr Ala Leu His Ala Asp Asn Leu Ile Asp Gly Ala Trp
1 5 10 15
Gln Pro Ala Gln Ser Gly Ala Thr Ala Pro Ser Leu Asp Pro Ser Ser
20 25 30
Gly Gly Thr Ile Gly Gly Phe Ala Ala Gly Gly Ala Ala Asp Ala Gln
35 40 45
Ala Ala Val Ala Ala Ala Arg Arg Ala Phe Glu Arg Pro Glu Trp Ser
50 55 60
Gln Asn Pro Arg Ala Arg Gln Met Val Met Leu Arg Trp Ala Asp Arg
65 70 75 80
Met Glu Ala Gln Ala Asp Gln Leu Ala Arg Leu Leu Thr Leu Glu Asn
85 90 95
Gly Lys Pro Leu Pro Gln Ser Arg Gly Glu Ile Ala Gly Ser Val Ser
100 105 110
Glu Ile Arg Tyr Tyr Ala Gly Leu Thr Arg Tyr Ile Pro Gly His Val
115 120 125
Phe Glu Val Glu Pro Gly Ser Phe Ser Thr Leu Leu Lys Glu Pro Ala
130 135 140
Gly Val Ala Gly Leu Ile Ile Pro Trp Asn Ala Pro Ala Val Leu Leu
145 150 155 160
Ile Arg Ala Leu Thr Pro Ala Leu Ala Ala Gly Cys Thr Val Val Ile
165 170 175
Lys Pro Ala Pro Gln Thr Ala Gln Ile Thr Ala Ala Ile Ile Lys Cys
180 185 190
Leu His Glu Val Asp Gly Leu Pro Arg Gly Val Val Asn Leu Val Ser
195 200 205
Glu Gln Gly His Gln Val Ala Glu His Leu Val Thr Ser Asn Asp Val
210 215 220
Asp Val Ile Ser Phe Thr Gly Ser Asn Ala Thr Gly Ala Arg Ile Met
225 230 235 240
Ala Ala Ala Ala Pro Thr Met Lys Lys Leu Ser Leu Glu Leu Gly Gly
245 250 255
Lys Ser Ala Cys Leu Val Phe Asp Asp Ala Asp Ile Ala Asp Val Ala
260 265 270
Pro Lys Leu Ala Ala Ala Ala Thr Ile Ile Ala Gly Gln Gln Cys Thr
275 280 285
Ala Ala Arg Arg Val Leu Val His Ala Ser Arg Tyr Asp Glu Met Lys
290 295 300
Ala Ala Leu Lys Ala Ala Leu Ala Asn Ile Arg Ile Ala Pro Gly Ser
305 310 315 320
Ala Ala Gly Ala Glu Met Gly Pro Leu Ile Asp Ala Ala Ser Leu Ala
325 330 335
Ala Val Ala Lys Arg Ala Asp Glu Ala Met Gln Ala Ala Asp Glu Val
340 345 350
Val Leu Arg Gly Gly Arg Pro Ala Gly Asp Leu Ala Asn Gly Tyr Phe
355 360 365
Leu Ser Pro Thr Leu Val Ala His Arg Asp Thr Ser Ala Phe Phe Val
370 375 380
Gln Glu Glu Ile Phe Gly Pro Leu Val Val Leu Glu Lys Phe Glu Asp
385 390 395 400
Glu Lys Glu Ala Val Ala Arg Ala Asn His Ser Asp Tyr Gly Leu Ser
405 410 415
Ala Ser Val Trp Thr His Asp Gly Ala Arg Ala Met Arg Val Ala Arg
420 425 430
Ala Leu Arg Asn Gly Thr Val Trp Ile Asn Asp His Asn Lys Leu Phe
435 440 445
Ala Glu Ala Glu Thr Gly Gly Tyr Arg Arg Ser Gly Leu Gly Arg Leu
450 455 460
His Gly Tyr Asp Ala Leu Ile Asp Phe Leu Glu Ile Lys His Val Tyr
465 470 475 480
Gln Ser Cys Gly Val Val
485
<210> 25
<211> 485
<212> PRT
<213> Dinoroseobacter shibae DFL 12
<400> 25
Met Thr Thr Thr Asp Leu Ile Ala Arg His Met Ile Gly Gly Ser Tyr
1 5 10 15
Ser Asp Ala Gly Asp Lys Ile Ala Ser Ile Asn Pro Ala Thr Gly Ala
20 25 30
Val Val Gly His Val Arg Ala Asp Gly Ala Ala Gln Ala Thr Ala Ala
35 40 45
Ile Ala Ala Ala Arg Ala Ala Phe Asp Thr Thr Leu Trp Pro Gln Ser
50 55 60
Pro Arg Asp Arg Gln Met Ala Leu Leu Arg Trp Ala Asp Ala Leu Glu
65 70 75 80
Ala Asp Leu Ala Arg Leu Ala Glu Leu Leu Thr Leu Thr Asn Gly Lys
85 90 95
Pro Leu Gly Ala Ser Lys Gly Glu Leu Gly Ala Ala Ile Ser Glu Ile
100 105 110
Arg Tyr Tyr Ala Gly Leu Thr Arg His Asn Pro Gly His Ala Met Glu
115 120 125
Val Ala Pro Gly Glu Leu Ser Val Met Leu Arg Glu Pro Ala Gly Val
130 135 140
Ala Gly Ile Ile Val Pro Trp Asn Ala Pro Ala Val Leu Leu Ile Arg
145 150 155 160
Ser Leu Ala Pro Ala Leu Ala Val Gly Cys Thr Thr Val Thr Lys Pro
165 170 175
Ala Pro Gln Thr Ala Leu Phe Thr Ala Ala Cys Met Ala Pro Leu Phe
180 185 190
Glu Asp Ala Ala Ile Pro Ala Gly Val Val Asn Val Val Phe Glu Val
195 200 205
Gly His Asp Ala Ala Gln Thr Leu Val Thr Ser Pro Asp Val Asp Val
210 215 220
Ile Ser Phe Thr Gly Ser Asn Ala Val Gly Gln Arg Ile Met Ala Asp
225 230 235 240
Ala Ala Pro Thr Met Lys Lys Leu Ser Leu Glu Leu Gly Gly Lys Ser
245 250 255
Cys Cys Ile Val Leu Asp Asp Ala Asp Ile Gly Val Val Ala Pro Lys
260 265 270
Leu Ala Ala Ala Ala Thr Ile Ile Ser Gly Gln Gln Cys Thr Ala Ala
275 280 285
Arg Arg Val Leu Val His Glu Ser Arg Leu Asp Glu Ala Lys Ser Ala
290 295 300
Leu Ser Ala Ala Leu Gln Ala Val Ser Ile Gly Asp Gly Met Ser Asp
305 310 315 320
Gly Thr Ala Met Gly Pro Leu Ile Asp Ile Gln Ser Arg Asp Arg Val
325 330 335
Met Arg Asp Cys Gly Thr Val Tyr Asp Thr Ala Asp Glu Val Val Leu
340 345 350
Arg Gly Gly Pro Leu Asp Gly Pro Lys Gly Ser Ala Phe Met Ser Pro
355 360 365
Ala Leu Val Val His Ser Asp Pro Asn Ala Ser Phe Val Gln Asp Glu
370 375 380
Ile Phe Gly Pro Leu Val Val Leu Glu Thr Phe Arg Asp Glu Ala Asp
385 390 395 400
Ala Val Ala Lys Ala Asn Asn Thr Val Tyr Gly Leu Ser Ala Ser Ile
405 410 415
Trp Thr His Arg Gly Asp Ala Ser Trp Arg Leu Ala Arg Ala Leu Arg
420 425 430
Asn Gly Thr Val Trp Ile Asn Asp His Asn Arg Leu Phe Ala Glu Ala
435 440 445
Glu Thr Gly Gly Tyr Arg Arg Ser Gly Leu Gly Arg Leu His Gly Phe
450 455 460
Asp Gly Leu Leu Asp Phe Cys Glu Leu Lys His Val Tyr Gln Asn Val
465 470 475 480
Gly Val Val Gly His
485
<210> 26
<211> 1503
<212> DNA
<213> Cupriavidus basilensis HMF14
<400> 26
atgaacgcgc aacactggat tgccggcgcc tggaccggcg agccttccgc cgatagcgtc 60
aaccccgccg acgggaccct gatcgggcag ttcgcggacg gcggcacctg gcaagccgaa 120
gccgccatcg ccgccgcgcg ccatgtcttc gagcgcacca cctggggcca ggatgcccgc 180
ctgcgccagg acgtgcttct agcctgggct ggtgcgctcg aggcagagcg agagcgcctg 240
gccagcctgc tcaccgcgga aaacggcaag ccggtcgcac aagcccgagg cgaggtcggc 300
gccgcaattt cagaggtccg ctattacgcc gggctggcgc ggcacatccc gggtcacgtg 360
ctggagcccg agccaggcac gatatcgacc atcctgcgcg agccggccgg cgtcgccgcc 420
atcatcgtcc cctggaacgc gccggcggtg ctgctcgtgc gctccctcgc gccagcgctt 480
gccgcgggct gcacggcagt ggtcaaatcg gcagcgcaaa ccacgctgtt cacagccgca 540
atgctgcgct tgttcgagcg cacggccctg ccggccggcg ccgtcaatct ggtctgcgaa 600
acgggctatg cggcagcgga ccacctggtg cgttcgcgcg acgtggacgt agtgagcttc 660
acaggatcga ccgcaaccgg caagaagatc atgatcgccg ctgcggacag cgtgaaaaaa 720
ctctcgctgg aactcggcgg gaaatcgtgc tgcctggtgt tcgacgacgt cgatgcgcaa 780
gcggtcgcga aacggcttgc gcttgccgcc accgtcatct cgggccagca atgcaccgcc 840
gcgcggcgag tactggttca cgaagccatc gcgccacaga tgcgccggca cctgaccgag 900
gccctcgccg cgctgcgcct cgggcccggc atcgagcccg acacccaaat cggcccgctg 960
atcgaccacc cgacgcgcgc gatggtgagc gcgcaagtcg agcgcgcctg cgacgaggcg 1020
gacacggtcc tgctgcgcgg cacgatgccg ggcggcgcgc tagcgcgcgg cgccttcctc 1080
agccccacac tagtggaaca cagcgacccc ggtgccttct tctgccagga ggagatcttc 1140
gggcccttcg tcacattcga gaccttcgcg accgaagacg aggcgctagc caaggccaac 1200
aacaccgtct tcggcctgtc cgccagcgtc tggacgcacc acggcgagcg cgccatacgc 1260
ctagcgcggg cgctgcgcaa cggcacggtc tgggtcaacg accacaaccg cctgttcgcc 1320
gaagcggaga cgggcggcta tcggcaaagc ggccttggac ggctccacgg ttatgacgcc 1380
ctcgcggact tcaccgagtt gaagcacatc tgcatccagg cgggcctgcc gaaagggatg 1440
tcgcaggcgg gctgcaggct cagtggggta gcagcgcgcg agcggatggg agtttccgtc 1500
tag 1503
<210> 27
<211> 1440
<212> DNA
<213> Burkholderia sp. CCGE1002
<400> 27
atgaacgcac gacactggat tgccggcgaa tggaccggca cgcccaacat cgacagcatc 60
gatcccgcga cgggcgatgc catcggccgg ttcgccgacg gcggatcgag cgaagccgat 120
gccgccatcg ccgccgctcg ccacgcgttc gatcgcacga catgggcgca ggacgcgcgc 180
ttgcgccagg acgtgctact cggctgggct tcggcgctcg aagccgaacg cgacatgctc 240
gcgacgctgc tcacgcgtga aaacggcaag gcgatcgcgc aatcgcgcga cgagattgcc 300
ggcgcgatat cggaggtgcg ctattacgcg gggctcgcgc gccatattgc cgggcacgtg 360
ctcgaaccgg aaccgggcac gatatcgacg atgctgcgcg aagcggccgg cgtcgcggcg 420
atcatcgtgc cgtggaatgc gcccgccgtg ctgctcgtgc gctcgctcgc gcccgctctc 480
gcggccggct gcacggtgat agtcaaaccg gcggcgcaaa cgtcgctgct cacggccgcg 540
atgttgcgct gcttcgaaca cacggcgttg cctgaaggcg cggtgaacct agtcaacgaa 600
cggggatacg cggccagcca gcggctcgtc gactcgcacg gggtcgacgt ggtgagcttc 660
acgggatcga cggcgacggg caagaagatc atggcggccg ctgccgacag catgaagaag 720
ctgtcgctcg aacttggcgg caagtcatgc tgcgtcgtct tcgacgatgc cgatgtcgcg 780
gcgatcgcgc cgcgtctcgc gcgcgccgcg acgatcatct ccgggcagca atgcacggcg 840
gcgcgccggg tgctggttca tgcgtcgcgc gctgcgcaaa tgcgcgagca gctcgcgtcg 900
gcgcttgcgt cgctgcgggt cggaccgggc atcgatccgg cgacggatat cggcgcgctc 960
atcgacggca ccacgcgcga tgcggtggca cggacgatcg agcgcgcgtg cggaacggcc 1020
gagcgtgtgc tgctgcgagg cacttgctcg gggcacgcgt ttctgtcgcc gacgctcgtc 1080
gagcatgacg atccgaaggc gttcttttgc caggacgaga tctttggccc gttcgtcacg 1140
ctggaagtct tcgagaacga aatggaagcg atcgagaaag ccaacgacac ggtcttcggt 1200
ctctcggcga gcgtatggac gcacgacgga gcgcgcgcat tgcgcgtcgc gcgtgcgctg 1260
cgcaacggca cggtgtggat caacgaccac aacaagcttt tcgccgaagc cgaaacgggc 1320
gggtatcgcc aaagcggact gggtcggctg cacggctacg atgcgctggc ggacttcacc 1380
gagttgaagc acatctgcat gccggccggc gtggcggaag gtatcgcgcc gttgcggtga 1440
<210> 28
<211> 1452
<212> DNA
<213> Burkholderia graminis C4D1M
<400> 28
atggaaagag acgctatgaa ttggatcgcc ggcgaatggg ccggcaagcc cgtgctcgca 60
agctccgatc cttcgaacgg agagacgctc ggccggttcg tcagctcgaa cacgcaagac 120
gcggacgccg ccgtctcggc tgcccgccat acgttcgatc acacaacgtg ggcacaggat 180
gcccgtcgac ggcaggatgt tctgcttcgc tgggcgcaag ctctcgagtt gtcggtggaa 240
ccgctagcgg aattgctgac gcatgaaaac ggcaagacta ttgggcaggc gcgaggagaa 300
atgcgcgccg caatttccga agtgcgctac tacgcgggac tcgcgcgcca cattgccggt 360
cacgtcatcg agcccgagcc aggcaccatc tcgacgatgt tgcgcgaggc cgccggcgtt 420
gctgcgatca tcgtgccgtg gaacgctccc gccgtgctgc tcgtgcggtc ccttgcgccc 480
gccctcgctg ccggatgcac ggccatcgtc aagccggctg cccagacgtc attgatcacc 540
gcggcaatga tccgttgtct cgaccagccg gcgcttcccg ccggtgctgt caatctgctt 600
ctcgaaaacg gcgcagaagc cgctgcgcga ctggtcgagt ccgccgatgt cgatgtgatc 660
agctttacgg gttcgacgga agtcggcaag cgaatcatgc gcgccgctgc agacagcatg 720
aagcgattgt cgcttgagct gggcggcaaa tcgtgttgtc tcgtcttcga ggacagcgac 780
gttaaggcca ttgcacctcg tcttgcccgg gccgcgacca tcatctccgg acaacaatgc 840
accgctgcac ggcgaatact cgtgcatgtg tcaaaggcgg accaaatgcg agacgaactc 900
gtcaaagcac tcgcaagcct caaggttggc ccagggatcg atcccgcttc cgacattggc 960
gcgctgatcg atgctgcgtc ccgcgacgct gtccagacca cggttgaacg agcgtgtgac 1020
cttgcagatc gcgtgctctt gcgcgggact tcgagcggac cgggcgcctt tctgtcaccg 1080
acgctggtcg agcacggaga acctcacgcc ttcttttgcc aggacgagat ctttggcccg 1140
ttcgtcacgt tagagacctt tgtgaccgaa aaggaagccg ttgaaaaggc aaacaacacc 1200
gtttttggcc tgtccgcgag cgtgtggacc cacgactcgg ctcgggcttt ccggattgcg 1260
cgtgcgctgc gtgatgggac cgtctggatc aacgaccaca acaggttgtt cgcagaggcc 1320
gaaactggcg gctatcggca gagcggactg ggccggttgc acggctatga cgcgctagcg 1380
gacttcacgg agatcaagca tatctgtgtc ggtgcaggag tcctggaagg catcgaagtg 1440
cttggctcgt ga 1452
<210> 29
<211> 1452
<212> DNA
<213> Azospirillum sp. B510
<400> 29
gtgaccaact tggacagccg gcattggatc gacggcgcat gggtgcccgg caccgaccgc 60
ttcgccagca tcaaccccgc cgacggcagc gtcctcggcc atgccgccga tggcggacgc 120
gccgaggccg aggccgccat cgccgccgcg catgccgcct tcaatcggcc cgactgggcg 180
caaaacccgc ggctgcgcca atccatcctg ctcggctggg ccgacaggct cgacacgcaa 240
gccgaggatc tcgcccgcct gctgacgctg gagaacggca aggccatcgc ccagtcgcgg 300
ggcgagatcg ccggcgccat ttcggaaatc cgctattacg gcggcctcgc tcgccatgtt 360
cccggccatg tgctggaggt cgagccgggc gtgctgtcca ccatgctgcg agagccggcc 420
ggcgtggcgg cgctgatcat tccgtggaat gcgccggcgg tgctgctggc gcgggccatc 480
ggtccggcgc tggcctgcgg ctgcaccgtc gtggtcaagc cggcggcaca gaccaccttg 540
ctgaccgccg ccttcctgcg cgccctgtcc gaggttccca gcctgccccg cggcgtctgc 600
aacatgatca gcgagaccgg ccatgccgcc gccgcccgcc tggtcgactc gccgttggtc 660
gacgtggtca gcttcaccgg ctccaccgcc accggcaagc gcatcatggt cgcggcggcg 720
gacaccatga agaagctgtc gctggagctg ggcggcaaga gctgctgctt ggtcttcccc 780
gacgccgatc cggcagagac cgcggcgcgc atcgccaccg ccgccaccat catctccggc 840
cagcaatgca ccgccgcccg ccgggtgctg gtccatgcat cggccttcga cgcgatgaag 900
acacatctgc gggcagcgtt ggcggccatg acggtgggga acggcctcga tccggcgata 960
cggatgggac cgctgatcga ccggccggcg cgcgatcagg tgcagaccca ggtcgaacgg 1020
gccttcgatg cctgcgacga ggtgctgctg cgtggcgggg tgccgacgga cagccccgcc 1080
gccgcgtcgt tcctcacccc atcgctggtg gcgcacgacg acccctccgc cttcttctgc 1140
caggacgaga ttttcggccc cttcgtcgtg ctggagcgct tcgagaccga agcggaggcg 1200
gtggccaagg ccaacaacac cgtgttcggc ctgtcggcca gcgtctggac ccgcgacggc 1260
gcccgggcgt tgcgcatggc ccgggcgttg cgcaatggaa ccgtctggat caacgaccac 1320
aaccgcctgt tcgccgaggc ggaaacaggc ggctaccggc aaagcggcct gggccggttg 1380
cacggctacg atgccttcgc cgatttcacg gaactgaagc atgtttgcca gacggtggga 1440
accattggct ga 1452
<210> 30
<211> 1443
<212> DNA
<213> Pseudomonas putida
<400> 30
atgcaaagcc aacactacat cgatggacaa tggacctcaa cggatcgttg gaccgacagt 60
ctcgacccgg caagcggcga actgatcgga tgctttgccg acggcggcga ggccgaagct 120
gaagcggcgg tggcagcggc cgcccgagcc ttcaacgacc cgcaatgggc gcagaatcca 180
cgcctgcgtc agcagctatt gctggagtgg gctgccggcc tgaaggcgcg tcaggaacaa 240
ctcgcgcaat tgctgacgcg cgagaacggc aaggcattgg cgcagtcccg aggagagatc 300
ggcggggcta tttccgagat tctttactac gccggcctgg cccggcataa cccggggcac 360
atgctagaag tggcgcccgg tgagttctcc agcatgctgc gcgaacccgc cggggtggcg 420
gggctgatca ttccatggaa tgccccggcg gtgctgctgg ttcgtgctct ggcgccagcg 480
atcgcggcgg gttgtacagt ggtgatcaaa cccgcgccgc aaaccgcgct attcaatgct 540
gcgatgctcg aaccgctgtt cgcattgcca ggcctgccgg ctggggcggt caatctattc 600
gccgagagcg ggcatgccgg ggctgcgcat ttggtggctt cgccacgggt ggacgtgctc 660
agcttcaccg gctcgactgc tacgggccag cgcatcatgc gcgactgcgc ggcgactatg 720
aagaagctct ctctggaact gggcgggaaa tcttgctgcc tggtctttga agatgccgat 780
attgccgcca tcgcgccgaa actggcagcg gcggccacca ttatctctgg ccagcaatgc 840
actgccgccc ggcgcgtact ggtgcatgcc agccgtttcg ccgaaatgaa aaccgcgctg 900
agcgccgcac tggggcagat ccgcctgggt aatggcctcg atccagcgaa caacatggga 960
ccgctgatcg actggcattc ccgggacagc gttgagcggc gcattggcga ggcgctggac 1020
agctgtgacg aagtgctgct ggccggaggt cgcccgcagg gtgaactgag caaaggcgca 1080
tttctcgcgc cgtcgctgat cgcccatcgc gacagcagcg cattcttttg tcaggaagaa 1140
atttttggcc cgttgctggt actggagtcg ttcgaagacg aaaccgaggc tgtagcgcgc 1200
gccaaccata ccgagttcgg tctgtccgcg agtgtctgga ccgatcaggg tgctcgcgcc 1260
tggcgtgtcg ctcgggcact gcgcaacggt acggtgtggc tcaacgacca caacagattg 1320
tttgccgagg cggaaaccgg tggctatcga aagagcggtc tggggcgctt gcatggcgtc 1380
gatgcgctgc tggatttcag cgagctcaaa cacatttatc agaacgtcgg cacgctcggt 1440
tga 1443
<210> 31
<211> 1461
<212> DNA
<213> Rhodopseudomonas palustris BisB18
<400> 31
atgggcatga ctgctctgca tgcggataat ctgatcgacg gcgcctggca gccggcgcaa 60
tccggcgcca cggcgccgag ccttgatccg tcgagcggcg gcacgatcgg tggcttcgcg 120
gctggtggcg cggcggatgc gcaggccgcg gtagcggcgg cgcggcgcgc cttcgagcgg 180
ccggagtggt cgcagaaccc gcgggcgcgg cagatggtga tgctgcgctg ggccgaccgg 240
atggaggcgc aggccgatca gctcgcccgg ctgctgacac tggagaacgg caagccgctg 300
ccgcagtcgc gcggcgaaat cgccggcagc gtctcggaga tccgttatta cgccgggctc 360
acgcgttaca tccccggcca cgtgttcgag gtcgagccgg gcagtttctc gacgttgttg 420
aaagaaccgg ccggcgtcgc cggactgatc attccgtgga acgcgccggc ggtgctgctg 480
atccgcgcgc tgacgccggc gctcgccgcc ggctgcaccg tggtgatcaa gccggcgccg 540
cagaccgcgc agatcaccgc cgcgatcatc aaatgcctgc acgaggtcga cgggctgccg 600
cgcggcgtgg tcaatctggt cagcgagcag ggccaccaag tggccgagca tctggtgacc 660
tcgaacgacg tcgacgtcat cagcttcacc ggctccaacg ccaccggcgc gcggatcatg 720
gcggcggcgg cgccgaccat gaagaaactg tcgctcgagc tcggcggcaa atccgcttgc 780
ctggtgttcg acgacgccga tatcgccgac gtggctccga agctcgccgc tgccgccacc 840
atcatcgccg gccagcaatg caccgccgcg cgccgcgtgc tggtgcatgc ctcgcgctac 900
gacgagatga aggcggcgct gaaagccgcg ctggcgaaca tccgcattgc gccgggcagc 960
gcggcgggcg ccgagatggg tccgctgatc gacgcagcct cgctggccgc cgtggcgaag 1020
cgcgccgacg aggcgatgca ggccgccgac gaggtggtgc tgcgcggcgg caggcccgcc 1080
ggcgacctcg ccaacggtta cttcctgtcg ccgacgctcg tggcgcatcg cgacacgtcg 1140
gcgttcttcg tccaggaaga gatttttggg ccgctggtgg tgctcgaaaa attcgaggac 1200
gagaaggagg cggtggcccg cgccaatcac agcgactacg ggctgtccgc cagcgtgtgg 1260
acccatgacg gcgcccgcgc gatgcgggtg gcgagggcgc tgcgcaacgg cacggtgtgg 1320
atcaacgacc acaacaagct attcgccgaa gccgagaccg gcggttatcg ccgcagcggg 1380
ctcggccgcc tgcacggcta tgacgcgctg atcgacttcc tcgagatcaa gcacgtctat 1440
cagagctgcg gcgtagtgta g 1461
<210> 32
<211> 1458
<212> DNA
<213> Dinoroseobacter shibae DFL 12
<400> 32
atgacaacga cggacctgat cgcgcggcac atgatcggcg gctcctattc ggacgcgggc 60
gacaagatcg cgtcgatcaa cccggcgacc ggggcggtcg ttgggcatgt ccgggccgac 120
ggcgcggcgc aggccacagc cgccattgcc gccgcgcggg ccgcattcga cacaacgctc 180
tggccgcaat caccccgcga ccggcagatg gccctgctgc ggtgggccga cgcgctggag 240
gccgatctcg cacggcttgc ggaattgctg acgttgacca atggcaaacc gcttggcgcg 300
tccaagggcg aattgggcgc ggcgatatcg gaaatccgat actatgcggg cctgacccgc 360
cacaatcccg gccacgcgat ggaagtggcg ccgggcgagc tttcggtgat gctgcgcgag 420
ccggccgggg tcgcgggcat catcgtgccg tggaacgcac ccgccgtgct gctgatccgg 480
tcgctcgctc cggcgctggc ggtgggctgc acgaccgtga cgaaacccgc gccgcagacg 540
gcgctgttca ccgcggcctg catggccccg ctgttcgagg atgccgccat ccccgcgggc 600
gtggtcaatg tggttttcga ggtcggtcat gacgcagcgc aaacgctggt cacatcgccc 660
gatgtcgatg tcatcagctt taccggctcg aacgcggtcg gccagcggat catggcggac 720
gccgcgccga cgatgaagaa actgtcgctg gaactgggcg gcaaatcctg ctgcatcgtg 780
ctggatgatg cagacatcgg cgtggtggca ccgaaacttg ccgccgcagc cacgatcatc 840
tccggccagc aatgcaccgc ggcgcgtcgg gttctggtgc acgaatcccg gcttgatgaa 900
gcgaaaagcg cgctttccgc tgcgcttcag gctgtctcca tcggcgacgg catgtcagac 960
ggcactgcga tggggccgct gatcgacatc cagtcgcgcg accgggtcat gcgtgattgc 1020
ggaacggtat acgataccgc cgacgaggtc gtgctgcgcg gcggcccgct cgacggtccg 1080
aagggcagcg cgttcatgtc gccggcgctg gtcgtgcata gcgatccgaa cgccagcttc 1140
gtacaggacg aaattttcgg cccgcttgtg gtgcttgaga cgttccgaga cgaggcggat 1200
gcggtggcaa aggcaaacaa caccgtctat ggcttgtccg catcaatctg gacccatcgc 1260
ggcgatgcgt catggcggct ggcgcgtgcc ctgcgcaatg gcaccgtctg gatcaacgac 1320
cacaacaggc ttttcgccga agccgagacc ggcggctatc gccgttcggg cctgggcaga 1380
ttgcacggtt tcgacggtct gctcgatttc tgcgagctca agcacgttta ccagaacgtc 1440
ggtgtcgtcg gtcactga 1458
<210> 33
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 33
atgcggccgc aacaaggaga agatggaatg aacg 34
<210> 34
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 34
atgcggccgc gcgtcggggt cggtgcta 28
Claims (24)
- (i) 서열번호 1, 2, 3 또는 4에 나타낸 아미노산 서열과 45% 이상, 바람직하게는 60% 이상, 예를 들면, 70% 이상, 보다 바람직하게는 80% 이상, 예를 들면, 90%, 가장 바람직하게는 95% 이상의 서열 유사성을 갖는 아미노산 서열을 포함하는 제 1 폴리펩티드를 암호화하는 제 1 폴리뉴클레오티드 서열; 및
(ii) 5-(하이드록시메틸)푸란-2-카복실산(HMF-산) 전환 활성을 갖는 제 2 폴리펩티드를 암호화하는 제 2 폴리뉴클레오티드 서열
을 포함하는 유전자 변형 세포로서,
적어도 제 1 폴리뉴클레오티드 서열의 기능적 도입에 의해, 바람직하게는 제 1 및 제 2 폴리뉴클레오티드 서열 둘 다의 기능적 도입에 의해 유전자 변형된 것을 특징으로 하는 유전자 변형 세포. - 제 1 항에 있어서,
제 2 폴리펩티드가 5-(하이드록시메틸)푸란-2-카복실산 옥시도리덕타제, 바람직하게는 서열번호 5 또는 6에 나타낸 아미노산 서열과 45% 이상, 바람직하게는 60% 이상, 예를 들면, 70% 이상, 보다 바람직하게는 80% 이상, 예를 들면, 90%, 가장 바람직하게는 95% 이상의 서열 유사성을 갖는 아미노산 서열을 갖는 폴리펩티드인 유전자 변형 세포. - 제 1 항 또는 제 2 항에 있어서,
제 1 폴리뉴클레오티드 서열이 서열번호 7, 8, 9 또는 10에 나타낸 뉴클레오티드 서열과 45% 이상, 바람직하게는 60% 이상, 예를 들면, 70% 이상, 보다 바람직하게는 80% 이상, 예를 들면, 90%, 가장 바람직하게는 95% 이상의 서열 유사성을 갖는 뉴클레오티드 서열을 포함하는 유전자 변형 세포. - 제 1 항 내지 제 3 항 중 어느 한 항에 있어서,
제 2 폴리뉴클레오티드 서열이 서열번호 11 또는 12에 나타낸 뉴클레오티드 서열과 45% 이상, 바람직하게는 60% 이상, 예를 들면, 70% 이상, 보다 바람직하게는 80% 이상, 예를 들면, 90%, 가장 바람직하게는 95% 이상의 서열 유사성을 갖는 뉴클레오티드 서열을 포함하는 유전자 변형 세포. - 제 1 항 내지 제 4 항 중 어느 한 항에 있어서,
서열번호 19, 20, 21, 22, 23, 24 또는 25에 나타낸 아미노산 서열과 45% 이상, 바람직하게는 60% 이상, 예를 들면, 70% 이상, 보다 바람직하게는 80% 이상, 예를 들면, 90%, 가장 바람직하게는 95% 이상의 서열 유사성을 갖는 아미노산 서열을 포함하는 제 3 폴리펩티드를 암호화하는 제 3 폴리뉴클레오티드 서열을 포함하는 유전자 변형 세포. - 제 1 항 내지 제 5 항 중 어느 한 항에 있어서,
제 3 폴리뉴클레오티드 서열이 서열번호 26, 27, 28, 29, 30, 31 또는 32에 나타낸 뉴클레오티드 서열과 45% 이상, 바람직하게는 60% 이상, 예를 들면, 70% 이상, 보다 바람직하게는 80% 이상, 예를 들면, 90%, 가장 바람직하게는 95% 이상의 서열 유사성을 갖는 뉴클레오티드 서열을 포함하는 유전자 변형 세포. - 제 1 항 내지 제 6 항 중 어느 한 항에 있어서,
박테리아 세포와 같은 원핵 세포, 또는 효모 세포, 진균 세포, 식물 세포 또는 동물 세포와 같은 진핵 세포인 유전자 변형 세포. - 제 1 항 내지 제 7 항 중 어느 한 항에 있어서,
원핵 세포, 바람직하게는 에스케리키아( Escherichia ), 아나바에나( Anabaena ), 카울로박터 ( Caulobacter ), 글루코노박터 ( Gluconobacter ), 로도박 터( Rhodobacter ), 슈도모나스( Pseudomonas ), 파라코커스 ( Paracoccus ), 바실러스( Bacillus ), 브레비박테리움 ( Brevibacterium ), 코리네박테리움( Corynebacterium ), 리조븀 ( Rhizobium )( 시노리조븀 ( Sinorhizobium )), 브래디리조븀( Bradyrhizobium ), 플라보박테리움 ( Flavobacterium ), 클렙시엘라 ( Klebsiella ), 엔테로박터( Enterobacter ), 락토바실러스 ( Lactobacillus ), 락토코커스( Lactococcus ), 메틸로박테리움 ( Methylobacterium ), 스태필로코커스( Staphylococcus ), 스트렙토마이세스 ( Streptomyces ), 지모모나스 ( Zymomonas ), 아세토박터( Acetobacter ), 스트렙토코커스 ( Streptococcus ), 박터로이데스( Bacteroides ), 셀레노모나스 ( Selenomonas ), 메가스파에라 ( Megasphaera ), 버크홀데리아( Burkholderia ), 큐프리아비더스 ( Cupriavidus ), 랄스토니아 ( Ralstonia ), 메틸로박테리움( Methylobacterium ), 메틸로보러스 ( Methylovorus ), 로도슈도모나스( Rhodopseudomonas ), 아시디필리움 ( Acidiphilium ), 디노로세오박터( Dinoroseobacter ), 아그로박테리움( Agrobacterium ), 설폴로부스 ( Sulfolobus) 및 스핀고모나스( Sphingomonas) 속으로부터 선택된 박테리아 세포, 보다 바람직하게는 바실러스 서브틸리스 ( Bacillus subtilis ), 바실러스 아밀로리퀘파시엔스( Bacillus amyloliquefaciens ), 바실러스 리케니포미스( Bacillus licheniformis), 바실러스 푼티스 ( Bacillus puntis ), 바실러스 메가테리움( Bacillus megaterium ), 바실러스 할로두란스 ( Bacillus halodurans ), 바실러스 푸밀러스( Bacillus pumilus ), 글루코노박터 옥시단스 ( Gluconobacter oxydans ), 카울로박터 크레센투스 ( Caulobacter crescentus ), 메틸로박테리움 엑스토르쿠엔스( Methylobacterium extorquens ), 메틸로박테리움 라디오톨레란스( Methylobacterium radiotolerans ), 메틸로박테리움 노둘란스( Methylobacterium nodulans), 로도박터 스파에로이데스 ( Rhodobacter sphaeroides ), 슈도모나스 제아잔티니파시엔스( Pseudomonas zeaxanthinifaciens ), 슈도모나스 푸티다( Pseudomonas putida), 슈도모나스 푸티다 S12, 파라코커스 데니트리피칸스( Paracoccus denitrificans), 에스케리키아 콜라이 ( Escherichia coli ), 코리네박테리움 글루타 미쿰( Corynebacterium glutamicum ), 스태필로코커스 카르노서스( Staphylococcus carnosus), 스트렙토마이세스 리비단스 ( Streptomyces lividans ), 시노리조븀 멜리로티( Sinorhizobium meliloti ), 브래디리조븀 자포니쿰( Bradyrhizobium japonicum), 리조븀 라디오박터 ( Rhizobium radiobacter ), 리조븀 레구미노사룸( Rhizobium leguminosarum ), 리조븀 레구미노사룸 bv. 트리폴리( Rhizobium leguminosarum bv. trifolii ), 아그로박테리움 라디오박터( Agrobacterium radiobacter), 큐프리아비더스 바실렌시스 ( Cupriavidus basilensis ), 큐프리아비더스 네카토르 ( Cupriavidus necator )( 랄스토니아 유트로파 ( Ralstonia eutropha )), 랄 스토니아 피케티 ( Ralstonia pickettii ), 버크홀데리아 피토피르만스( Burkholderia phytofirmans), 버크홀데리아 피마툼 ( Burkholderia phymatum ), 버크홀데리아 제노보란스( Burkholderia xenovorans ), 버크홀데리아 그라미니스( Burkholderia graminis), 로도슈도모나스 팔루스트리스 ( Rhodopseudomonas palustris ), 아시디필리움 크립툼 ( Acidiphilium cryptum ), 디노로세오박터 시바에( Dinoroseobacter shibae), 설폴로부스 아시도칼다리우스 ( Sulfolobus acidocaldarius ), 설폴로부스 이슬란디쿠스( Sulfolobus islandicus ), 설폴로부스 솔파타리쿠스( Sulfolobus solfataricus), 설폴로부스 토코다이(Sulfolobus tokodaii)로 이루어진 군으로부터 선택된 박테리아 세포인 유전자 변형 세포. - 제 1 항 내지 제 8 항 중 어느 한 항에 있어서,
진핵 숙주 세포, 예를 들면, 포유동물, 곤충, 식물, 진균류 또는 조류(algal) 세포, 예를 들면, 차이니즈 햄스터 난소(CHO) 세포, COS 세포, 293 세포, PerC6 세포 및 하이브리도마로부터 선택된 포유동물 세포, Sf9 및 Sf21 세포 및 이들의 유도체로부터 선택된 곤충 세포, 바람직하게는 캔디다( Candida ), 한세눌라( Hansenula ), 클루이베로마이세스 ( Kluyveromyces ), 피치아 ( Pichia ), 사카로마이세스( Saccharomyces ), 쉬조사카로마이세스 ( Schizosaccharomyces) 또는 야로이야( Yarrowia) 종과 같은 진균 또는 효모 세포로부터 선택된 진핵 세포, 보다 바람직하게는 클루이베로마이세스 락티스 ( Kluyveromyces lactis ), 사카로마이세스 세레비지에( Saccharomyces cerevisiae ), 한세눌라 폴리모르파 ( Hansenula polymorpha ), 야로이야 리포라이티카 ( Yarrowia lipolytica ), 피치아 스티피티스( Pichia stipitis) 및 피치아 파스토리스(Pichia pastoris)로부터 선택된 진핵 세포, 또는 아문 진균문(Eumycota) 및 난균문(Oomycota)으로부터 선택된 종, 또는 선택적으로 아크레모늄( Acremonium ), 아가리쿠스( Agaricus ), 아스퍼질러스 ( Aspergillus ), 오레오바시듐 ( Aureobasidium ), 크리소스포륨( Chrysosporium ), 코프리누스 ( Coprinus ), 크립토코커스 ( Cryptococcus ), 필리바시듐( Filibasidium ), 푸사리움 ( Fusarium ), 후미콜라( Humicola ), 마그나포르테( Magnaporthe ), 뮤코 ( Mucor ), 마이셀리오프토라 ( Myceliophthora ), 네오칼리마스틱스( Neocallimastix ), 뉴로스포라 ( Neurospora ), 페실로마이세스( Paecilomyces ), 페니실리움 ( Penicillium ), 피로마이세스( Piromyces ), 파네로카에테 ( Phanerochaete ), 플레우로투스 ( Pleurotus ), 쉬조필룸 ( Schizophyllum ), 탈라로마이세스( Talaromyces ), 터모아스쿠스 ( Thermoascus ), 티 엘라비아( Thielavia ), 톨리포클라듐 ( Tolypocladium) 또는 트리코더마 ( Trichoderma) 속으로부터의 종, 예를 들면, 아스퍼질러스 니거 ( Aspergillus niger ), 아스퍼질러스 아와모리 ( Aspergillus awamori ), 아스퍼질러스 포에티두스( Aspergillus foetidus), 아스퍼질러스 소재( Aspergillus sojae ), 아스퍼질러스 푸미가투스( Aspergillus fumigatus ), 탈라로마이세스 에메르소니 ( Talaromyces emersonii ), 아스퍼질러스 오리재( Aspergillus oryzae ), 크리소스포륨 루크노웬 스( Chrysosporium lucknowense ), 트리코더마 레세이 ( Trichoderma reesei) 또는 페 니실리움 크리소게눔( Penicillium chrysogenum)으로부터의 사상균 세포인 유전자 변형 세포. - 제 1 항 내지 제 9 항 중 어느 한 항에 있어서,
제 1 및 제 2 폴리뉴클레오티드 서열이 단일 벡터, 선택적으로 제 3 폴리뉴클레오티드 서열을 추가로 포함하는 벡터 상에 위치하는 유전자 변형 세포. - (i) 서열번호 1, 2, 3 또는 4에 나타낸 아미노산 서열과 45% 이상, 바람직하게는 60% 이상, 예를 들면, 70% 이상, 보다 바람직하게는 80% 이상, 예를 들면, 90%, 가장 바람직하게는 95% 이상의 서열 유사성을 갖는 아미노산 서열을 포함하는 제 1 폴리펩티드를 암호화하는 제 1 폴리뉴클레오티드 서열; 및
(ii) 5-(하이드록시메틸)푸란-2-카복실산(HMF-산) 전환 활성을 갖는 제 2 폴리펩티드를 암호화하는 제 2 폴리뉴클레오티드 서열
을 포함하는 벡터. - 제 11 항에 있어서,
제 2 폴리펩티드가 5-하이드록시메틸푸로산 옥시도리덕타제, 바람직하게는 서열번호 5 또는 6에 나타낸 아미노산 서열과 45% 이상, 바람직하게는 60% 이상, 예를 들면, 70% 이상, 보다 바람직하게는 80% 이상, 예를 들면, 90%, 가장 바람직하게는 95% 이상의 서열 유사성을 갖는 아미노산 서열을 갖는 폴리펩티드인 벡터. - 제 11 항 또는 제 12 항에 있어서,
제 1 폴리뉴클레오티드 서열이 서열번호 7, 8, 9 또는 10에 나타낸 뉴클레오티드 서열과 45% 이상, 바람직하게는 60% 이상, 예를 들면, 70% 이상, 보다 바람직하게는 80% 이상, 예를 들면, 90%, 가장 바람직하게는 95% 이상의 서열 유사성을 갖는 뉴클레오티드 서열을 포함하는 벡터. - 제 11 항 내지 제 13 항 중 어느 한 항에 있어서,
제 2 폴리뉴클레오티드 서열이 서열번호 11 또는 12에 나타낸 뉴클레오티드 서열과 45% 이상, 바람직하게는 60% 이상, 예를 들면, 70% 이상, 보다 바람직하게는 80% 이상, 예를 들면, 90%, 가장 바람직하게는 95% 이상의 서열 유사성을 갖는 뉴클레오티드 서열을 포함하는 벡터. - 제 11 항 내지 제 14 항 중 어느 한 항에 있어서,
서열번호 19, 20, 21, 22, 23, 24 또는 25에 나타낸 아미노산 서열과 45% 이상, 바람직하게는 60% 이상, 예를 들면, 70% 이상, 보다 바람직하게는 80% 이상, 예를 들면, 90%, 가장 바람직하게는 95% 이상의 서열 유사성을 갖는 아미노산 서열을 포함하는 제 3 폴리펩티드를 암호화하는 제 3 폴리뉴클레오티드 서열을 포함하는 벡터. - 제 11 항 내지 제 15 항 중 어느 한 항에 있어서,
제 3 폴리뉴클레오티드 서열이 서열번호 26, 27, 28, 29, 30, 31 또는 32에 나타낸 뉴클레오티드 서열과 45% 이상, 바람직하게는 60% 이상, 예를 들면, 70% 이상, 보다 바람직하게는 80% 이상, 예를 들면, 90%, 가장 바람직하게는 95% 이상의 서열 유사성을 갖는 뉴클레오티드 서열을 포함하는 벡터. - 제 1 항 내지 제 10 항 중 어느 한 항에 따른 세포에 의한 5-(하이드록시메틸)푸란-2-카복실산(HMF-산)의 전환에 적합한 조건하에서 HMF-산의 존재하에 상기 세포를 배양하는 것을 포함하는, HMF-산 전환 방법.
- 제 17 항에 있어서,
HMF-산이 세포에 의한 하나 이상의 푸란 전구체의 HMF-산으로의 전환에 적합한 조건하에서 HMF-산의 하나 이상의 푸란 전구체로부터 동일반응계내에서 생성되는 HMF-산 전환 방법. - 제 17 항 또는 제 18 항에 있어서,
세포의 제 2 폴리펩티드가 HMF-산 옥시도리덕타제이고, 세포를 HMF-산의 FDCA로의 전환에 적합한 조건에 적용시키는 것을 추가로 포함하는 HMF-산 전환 방법. - 제 17 항 내지 제 19 항 중 어느 한 항에 있어서,
푸란 전구체가 5-(하이드록시메틸)푸란-2-카브알데하이드(HMF), 푸란-2,5-다이카브알데하이드(DFF), [5-(하이드록시메틸)푸란-2-일]메탄올(HMF 알콜)을 포함하는 군으로부터 선택되고, 바람직하게는 HMF인 HMF-산 전환 방법. - 제 17 항 내지 제 20 항 중 어느 한 항에 있어서,
푸란 전구체가 하나 이상의 육탄당, 바람직하게는 리그노셀룰로스 바이오매스로부터 수득된 하나 이상의 육탄당으로부터, 예를 들면, 산-촉진된 탈수에 의해 수득되는 HMF-산 전환 방법. - 제 17 항 내지 제 21 항 중 어느 한 항에 있어서,
FDCA가 산 침전, 및 이어서 냉각 결정화 또는 선택적으로 용매 추출을 포함하는 방법에 의해 반응 혼합물로부터 회수되는 HMF-산 전환 방법. - 다수의 푸란 전구체의 FDCA로의 생물전환을 위한, 제 1 항 내지 제 10 항 중 어느 한 항에 따른 유전자 변형 세포의 용도.
- 제 23 항에 있어서,
다수의 푸란 전구체가 5-(하이드록시메틸)푸란-2-카브알데하이드(HMF), [5-(하이드록시메틸)푸란-2-일]메탄올(HMF 알콜), 5-(하이드록시메틸)푸란-2-카복실산(HMF-산), 푸란-2,5-다이카브알데하이드(DFF) 또는 5-포밀푸란-2-카복실산(FFA)을 포함하는 군으로부터 선택되는 용도.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
NL2006359A NL2006359C2 (en) | 2011-03-08 | 2011-03-08 | Genetically modified cell and process for use of said cell. |
NL2006359 | 2011-03-08 | ||
PCT/NL2012/050141 WO2012064195A2 (en) | 2011-03-08 | 2012-03-07 | Genetically modified cell and process for use of said cell |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20140015439A true KR20140015439A (ko) | 2014-02-06 |
KR101947202B1 KR101947202B1 (ko) | 2019-02-12 |
Family
ID=45873204
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020137026204A KR101947202B1 (ko) | 2011-03-08 | 2012-03-07 | 유전자 변형 세포 및 이 세포의 사용 방법 |
Country Status (19)
Country | Link |
---|---|
US (3) | US9309546B2 (ko) |
EP (1) | EP2683815B1 (ko) |
JP (2) | JP6017463B2 (ko) |
KR (1) | KR101947202B1 (ko) |
CN (1) | CN103502441B (ko) |
AU (1) | AU2012202889B2 (ko) |
BR (1) | BR112013022915B1 (ko) |
CA (1) | CA2829078C (ko) |
DK (1) | DK2683815T3 (ko) |
EA (1) | EA023764B9 (ko) |
ES (1) | ES2543568T3 (ko) |
HU (1) | HUE027066T2 (ko) |
MX (1) | MX336694B (ko) |
MY (1) | MY161455A (ko) |
NL (1) | NL2006359C2 (ko) |
PL (1) | PL2683815T3 (ko) |
PT (1) | PT2683815E (ko) |
SI (1) | SI2683815T1 (ko) |
WO (1) | WO2012064195A2 (ko) |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
NL2006359C2 (en) * | 2011-03-08 | 2012-04-24 | Bird Engineering B V | Genetically modified cell and process for use of said cell. |
WO2014015256A2 (en) * | 2012-07-20 | 2014-01-23 | Novozymes A/S | Enzymatic oxidation of 5-hydroxymethylfurfural and derivatives thereof |
CN104769122B (zh) | 2012-09-21 | 2018-08-10 | 合成基因组股份有限公司 | 用于生产化学品和其衍生物的组合物和方法 |
US9528133B2 (en) | 2012-09-21 | 2016-12-27 | Synthetic Genomics, Inc. | Compositions and methods for producing chemicals and derivatives thereof |
CA2930688A1 (en) * | 2012-11-21 | 2014-05-30 | The Regents Of The University Of California | Nucleic acids useful for integrating into and gene expression in hyperthermophilic acidophilic archaea |
NL2011027C2 (en) | 2013-06-24 | 2014-12-29 | Univ Delft Tech | Process for the preparation of 2,5-furandicarboxylic acid. |
CN104371955B (zh) * | 2014-10-30 | 2017-02-08 | 江南大学 | 一种合成2,5‑呋喃二甲酸的土生拉乌尔菌及其应用 |
BR112017017525A2 (pt) | 2015-02-17 | 2018-04-17 | Purac Biochem Bv | produção de fdca catalisada por desidrogenase |
AU2016328448A1 (en) * | 2015-09-21 | 2018-03-29 | Purac Biochem B.V. | Fungal production of fdca |
CN110062807B (zh) * | 2016-12-20 | 2024-01-09 | 株式会社钟化 | 聚羟基链烷酸酯的制造方法及微生物 |
EP3366681A1 (en) | 2017-02-28 | 2018-08-29 | Nederlandse Organisatie voor toegepast- natuurwetenschappelijk onderzoek TNO | Production of 2,5-furandicarboxylic acid |
EP3378931A1 (en) * | 2017-03-21 | 2018-09-26 | Purac Biochem B.V. | Fdca-decarboxylating monooxygenase-deficient host cells for producing fdca |
CN109609397A (zh) * | 2017-10-31 | 2019-04-12 | 天津科技大学 | 一种水产养殖用复合微生物菌剂及应用 |
WO2019094740A1 (en) | 2017-11-10 | 2019-05-16 | Shell Oil Company | Methods of producing 2,5-furandicarboxylic acid |
EP3505514A1 (en) | 2017-12-29 | 2019-07-03 | Nederlandse Organisatie voor toegepast- natuurwetenschappelijk onderzoek TNO | Method for purifying and removing color of 2,5-furandicarboxylic acid (fdca) |
EP3732174B1 (en) | 2017-12-29 | 2023-12-27 | Nederlandse Organisatie voor toegepast- natuurwetenschappelijk Onderzoek TNO | Method for purifying and removing colour of 2,5-furandicarboxylic acid (fdca) |
JP2022523540A (ja) * | 2019-03-01 | 2022-04-25 | ブラスケム エス.エー. | 4-ヒドロキシメチルフルフラールおよびその誘導体のインビボ合成のための方法 |
CN110591995A (zh) * | 2019-09-12 | 2019-12-20 | 华南理工大学 | 一种共表达重组菌及其在合成呋喃羧酸中的应用 |
CN110724654B (zh) * | 2019-11-22 | 2020-09-29 | 南京科技职业学院 | 一株生产5-羟甲基-2呋喃甲酸的铜绿假单胞菌及其应用 |
TWI735113B (zh) | 2019-12-23 | 2021-08-01 | 國立清華大學 | 2,5-呋喃二甲酸之製備方法 |
NL2024726B1 (en) | 2020-01-22 | 2021-09-09 | Biomosae B V | Enzymatic crop protection and process for preparing biological crop protection composition |
US20240011990A1 (en) | 2020-07-17 | 2024-01-11 | Trustees Of Boston University | Viral detection systems and uses thereof |
EP4284394A1 (en) | 2021-01-26 | 2023-12-06 | Cytocares (Shanghai) Inc. | Chimeric antigen receptor (car) constructs and nk cells expressing car constructs |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110086395A1 (en) * | 2009-09-02 | 2011-04-14 | Koopman Frank Wouter | Novel microorganism and its use in lignocellulose detoxification |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2744466T3 (es) * | 2009-09-02 | 2020-02-25 | Purac Biochem Bv | Polipéptidos con actividad oxidorreductasa y sus usos |
NL2006359C2 (en) * | 2011-03-08 | 2012-04-24 | Bird Engineering B V | Genetically modified cell and process for use of said cell. |
-
2011
- 2011-03-08 NL NL2006359A patent/NL2006359C2/en not_active IP Right Cessation
-
2012
- 2012-03-07 HU HUE12709978A patent/HUE027066T2/en unknown
- 2012-03-07 EP EP12709978.6A patent/EP2683815B1/en active Active
- 2012-03-07 KR KR1020137026204A patent/KR101947202B1/ko active IP Right Grant
- 2012-03-07 MY MYPI2013003233A patent/MY161455A/en unknown
- 2012-03-07 PL PL12709978T patent/PL2683815T3/pl unknown
- 2012-03-07 EA EA201300999A patent/EA023764B9/ru not_active IP Right Cessation
- 2012-03-07 SI SI201230263T patent/SI2683815T1/sl unknown
- 2012-03-07 JP JP2013557661A patent/JP6017463B2/ja not_active Expired - Fee Related
- 2012-03-07 DK DK12709978.6T patent/DK2683815T3/en active
- 2012-03-07 ES ES12709978.6T patent/ES2543568T3/es active Active
- 2012-03-07 CN CN201280012453.5A patent/CN103502441B/zh not_active Expired - Fee Related
- 2012-03-07 BR BR112013022915-2A patent/BR112013022915B1/pt not_active IP Right Cessation
- 2012-03-07 PT PT127099786T patent/PT2683815E/pt unknown
- 2012-03-07 WO PCT/NL2012/050141 patent/WO2012064195A2/en active Application Filing
- 2012-03-07 MX MX2013010226A patent/MX336694B/es unknown
- 2012-03-07 AU AU2012202889A patent/AU2012202889B2/en not_active Ceased
- 2012-03-07 CA CA2829078A patent/CA2829078C/en not_active Expired - Fee Related
- 2012-03-07 US US14/003,386 patent/US9309546B2/en not_active Expired - Fee Related
-
2016
- 2016-03-03 US US15/059,857 patent/US9828616B2/en active Active
- 2016-09-28 JP JP2016190165A patent/JP6327724B2/ja not_active Expired - Fee Related
-
2017
- 2017-08-25 US US15/687,192 patent/US10023890B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110086395A1 (en) * | 2009-09-02 | 2011-04-14 | Koopman Frank Wouter | Novel microorganism and its use in lignocellulose detoxification |
Non-Patent Citations (3)
Title |
---|
Bioresour. Technol., Vol.101, No.16, pp.6291-6296(2010) * |
Microb. Biotechnol., Vol.3, No.3, pp.336-343 (2010) * |
Proc. Natl. Acad. Sci. U. S. A., Vol.107, No.11, pp.4919-4924(2010) * |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101947202B1 (ko) | 유전자 변형 세포 및 이 세포의 사용 방법 | |
JP6372889B2 (ja) | オキシドレダクターゼ活性を有するポリペプチドおよびその使用 | |
US20110086395A1 (en) | Novel microorganism and its use in lignocellulose detoxification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
AMND | Amendment | ||
AMND | Amendment | ||
E601 | Decision to refuse application | ||
AMND | Amendment | ||
X701 | Decision to grant (after re-examination) | ||
GRNT | Written decision to grant |