KR20230009372A

KR20230009372A - D-프럭토스를 d-알룰로스로 생물전환시키기 위한 d-알룰로스 3-에피머라제

Info

Publication number: KR20230009372A
Application number: KR1020227035754A
Authority: KR
Inventors: 구오홍 마오; 마이클 배튼; 티모시 조셉 핸리; 필립 헌트; 홍팡 리우; 양 루오; 올리버 위
Original assignee: 코나겐 인크.
Priority date: 2020-05-11
Filing date: 2021-05-11
Publication date: 2023-01-17
Also published as: EP4114935A2; US20230313254A1; CN115380109A; JP2023525666A; WO2021231488A2; EP4114935A4; WO2021231488A3

Abstract

본 명세서에서는 광범위한 미생물로부터 D-알룰로스 3-에피머라제 활성을 갖는 폴리펩타이드를 코딩하는 폴리뉴클레오타이드를 식별하고 단리시키는 방법이 제공된다. 또한 D-알룰로스 3-에피머라제 활성을 코딩하는 폴리뉴클레오타이드를 포함하는 핵산 작제물, 벡터 및 재조합 숙주 세포뿐만 아니라, D-알룰로스 3-에피머라제 활성을 갖는 상기 재조합 숙주 세포 또는 D-알룰로스 3-에피머라제 활성을 갖는 상기 재조합 숙주 세포의 D-알룰로스 3-에피머라제 효소를 사용해서 프럭토스로부터 알룰로스를 생산하는 방법이 제공된다.

Description

D-프럭토스를 D-알룰로스로 생물전환시키기 위한 D-알룰로스 3-에피머라제

관련 출원

본 출원은 미국 가출원 제63/022,617호(출원일: 2020년 5월 11일, 발명의 명칭: "D-ALLULOSE 3-EPIMERASES FOR BIOCONVERSION OF D-FRUCTOSE TO D-ALLULOSE")의 35 U.S.C. § 119(e)하의 이익을 주장하며, 이의 내용은 전문이 참조에 의해 본 명세서에 원용된다.

발명의 기술분야

본 발명은 D-알룰로스 3-에피머라제 효소를 사용하여 프럭토스로부터 D-알룰로스를 생산하는 방법에 관한 것이다. 본 발명은 D-알룰로스 3-에피머라제 활성을 갖는 폴리펩타이드, 및 상기 폴리펩타이드를 인코딩하는 핵산 분자를 제공한다. 본 발명은 또한 벡터를 포함하는 재조합 핵산 작제물 및 재조합 핵산 작제물을 포함하는 재조합 숙주 세포에 관한 것이다.

D-프시코스(D-psicose)로도 알려진 D-알룰로스는 프럭토스와 구조적으로 유사한 유형의 당인데, 이는 과일에 자연적으로 존재하는 당이다. D-알룰로스는 과립화된 형태로 입수 가능하고, 수크로스 결정처럼 보인다. 알룰로스는 수크로스의 감미도의 70%를 갖는 저칼로리 감미제이다. 미국 식품의약국(FDA)에 따르면, 알룰로스는 약 0.4 칼로리/그램을 제공하는데, 이는 수크로스에 의해 제공되는 4 칼로리/그램보다 상당히 더 낮다. 인체는 알룰로스를 흡수하는 능력을 갖지만, 알룰로스를 대사하는 능력은 부족하다. 그 결과, 알룰로스는 혈당 또는 인슐린 수준에 영향이 거의 내지 전혀 없다. 이러한 이유로, 알룰로스는 저칼로리 감미제로서 간주된다.

알룰로스는 말린 과일, 흑설탕 및 메이플 시럽과 같은 일부 식품에서 극히 소량으로 자연적으로 발견된다. 알룰로스의 화학적 합성은 어렵고, 재조합 미생물을 사용하여 프럭토스와 같은 용이하게 입수 가능한 당으로부터 알룰로스를 생산하는 현장에서 요구된다.

D-알룰로스 3-에피머라제(DAE, D-프시코스 3-에피머라제(DPE)로도 명명됨)를 포함하는 케토스 3-에피머라제 패밀리로부터의 효소는 D-프럭토스의 D-알룰로스로의 가역적 전환을 촉매할 수 있다. D-알룰로스 3-에피머라제는 D-프럭토스의 D-알룰로스로의 생물전환을 위한 높은 활성을 가질 수 있다. 본 발명은, 특히, D-알룰로스 3-에피머라제 활성을 갖는 재조합 폴리펩타이드를 사용해서 D-프럭토스로부터 D-알룰로스를 생산하기 위한 방법을 제공한다.

일 실시형태에서, 본 발명의 방법은, 프럭토스 기질을, D-알룰로스 3-에피머라제 효소 활성을 갖는 재조합 폴리펩타이드를 포함하는 효소계를 포함하는 반응 혼합물과, D-프럭토스 기질이 D-알룰로스로 전환되도록 하는 조건하에서 접촉시키는 단계를 포함한다. 본 발명의 일 양상에서, 효소계는 D-알룰로스를 생산물로서 생산하는 기질로서 D-알룰로스 3-에피머라제 효소 활성을 갖는 재조합 폴리펩타이드 및 D-프럭토스를 제공한다. 본 발명의 또 다른 양상에서, 본 발명의 방법은 프럭토스 기질을, D-알룰로스 3-에피머라제 효소의 소스로서 외인성 D-알룰로스 3-에피머라제를 발현 가능한 숙주 세포 또는 이러한 숙주 세포의 용해물을 포함하는 반응 혼합물과 접촉시키는 것을 포함할 수 있다. 본 실시형태의 소정의 양상에서, 효소계에 존재하는 D-알룰로스 3-에피머라제 효소는 정제된 효소이고, 이것은 당업계에 공지된 하나 이상의 생화학 기술을 사용해서 D-알룰로스 3-에피머라제 효소를 발현하는 숙주 세포의 용해물로부터 유래될 수 있다. 본 발명의 또 다른 양상에서, D-알룰로스 3-에피머라제의 정제된 형태는 고체 지지체 상에 고정화된다. 다양한 실시형태에서, 본 발명의 방법은 반응계에 적어도 하나의 유형의 금속 이온을 첨가하는 단계를 더 포함할 수 있다. 예를 들어, 금속 이온은 마그네슘 이온, 망간 이온, 구리 이온, 아연 이온, 니켈 이온, 코발트 이온, 철 이온, 알루미늄 이온 및 칼슘 이온으로 이루어진 군으로부터 선택될 수 있다. 일부 바람직한 실시형태에서, 망간 이온 및/또는 마그네슘 이온이 반응계에 첨가된다. 금속 이온은 약 0.01mM 내지 약 5mM(예컨대, 0.01mM, 0.05mM, 0.1mM, 0.2mM, 0.3mM, 0.4mM, 0.5mM, 0.6mM, 0.7mM, 0.8mM, 0.9mM, 1mM, 2mM, 3mM, 4mM 또는 5mM)의 농도로 첨가될 수 있다. 다양한 양상에서, 본 발명의 방법은 반응계에 남아 있는 프럭토스가 없는 알룰로스를 포함하는 산물 스트림을 제거하는 단계를 포함할 수 있다.

다른 실시형태에서, 본 발명은 D-알룰로스 3-에피머라제 활성을 갖는 폴리펩타이드를 코딩하는 폴리뉴클레오타이드 서열을 제공한다. 본 실시형태의 일 양상에서, D-알룰로스 3-에피머라제 활성을 갖는 폴리펩타이드를 코딩하는 폴리뉴클레오타이드는 프로모터 및 종결자와 같은 요구되는 조절 요소를 갖는 적절한 플라스미드 발현 벡터에 클로닝된다. 일 양상에서, 플라스미드 발현 벡터는 D-알룰로스 3-에피머라제 효소 활성의 발현이 소정의 화학물질을 사용함으로써 유도될 수 있도록 유도성 프로모터를 갖는다.

또 다른 실시형태에서, D-알룰로스 3-에피머라제 활성을 갖는 폴리펩타이드를 코딩하는 폴리뉴클레오타이드 서열을 포함하는 발현 플라스미드 벡터는 원핵 미생물 세포 또는 진핵 미생물 세포 또는 진핵 동물 세포 또는 진핵 식물 세포를 포함하는 숙주 세포를 형질전환시키는 데 사용된다. 일 양상에서, 형질전환된 숙주 세포 내의 발현 플라스미드 벡터는 자기 복제 핵산 실체로서 존재한다. 본 실시형태의 또 다른 양상에서, 발현 플라스미드 벡터는 숙주 염색체 DNA에 통합된다.

다른 실시형태에서, 본 발명은 D-알룰로스 3-에피머라제가 연루된 반응에서 기질로서 D-프럭토스가 없는 D-알룰로스를 회수하기 위한 방법을 제공한다.

일부 실시형태에서, 본 명세서에 기재된 알룰로스를 생산하는 방법은, 프럭토스 기질을,

(a) D-알룰로스 3-에피머라제 효소를 포함하는 효소계;

(b) D-알룰로스 3-에피머라제 효소를 인코딩하는 핵산 분자를 포함하는 재조합 벡터로 형질전환된 숙주 세포; 및/또는

(c) (b)의 숙주 세포의 용해물을 포함하는 반응 혼합물과, 프럭토스 기질이 알룰로스로 전환되는 조건 하에 접촉시키는 단계를 포함하되, 여기서 D-알룰로스 3-에피머라제 효소는 서열번호 1, 서열번호 3, 서열번호 5, 서열번호 7, 서열번호 9, 서열번호 11, 서열번호 13, 서열번호 15, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23, 서열번호 25, 서열번호 27, 서열번호 29, 서열번호 31, 서열번호 33, 서열번호 35, 서열번호 37, 서열번호 39, 서열번호 41 및 서열번호 43으로 이루어진 군으로부터 선택된 폴리펩타이드와 적어도 80%(예컨대, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99% 또는 100%) 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에서, 반응 혼합물은 서열번호 1, 서열번호 5, 서열번호 7, 서열번호 9, 서열번호 13, 서열번호 15, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23 및 서열번호 25로 이루어진 군으로부터 선택된 폴리펩타이드와 적어도 80%(예컨대, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99% 또는 100%) 서열 동일성을 갖는 아미노산 서열을 포함하는 D-알룰로스 3-에피머라제 효소를 포함한다.

일부 실시형태에서, D-알룰로스 3-에피머라제 효소는 서열번호 1, 서열번호 5, 서열번호 7, 서열번호 9, 서열번호 13, 서열번호 15, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23 및 서열번호 25로 이루어진 군으로부터 선택된 폴리펩타이드와 적어도 90%(예컨대, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%) 서열 동일성을 갖는 아미노산 서열을 포함한다.

일부 실시형태에서, D-알룰로스 3-에피머라제 효소는 서열번호 1, 서열번호 5, 서열번호 7, 서열번호 9, 서열번호 13, 서열번호 15, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23 및 서열번호 25로 이루어진 군으로부터 선택된 폴리펩타이드와 적어도 95%(예컨대, 95%, 96%, 97%, 98%, 00% 또는 100%) 서열 동일성을 갖는 아미노산 서열을 포함한다.

일부 실시형태에서, D-알룰로스 3-에피머라제 효소는 서열번호 1, 서열번호 5, 서열번호 7, 서열번호 9, 서열번호 13, 서열번호 15, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23 또는 서열번호 25의 아미노산 서열을 포함한다. 일부 실시형태에서, D-알룰로스 3-에피머라제 효소는 서열번호 5의 아미노산 서열을 포함한다.

일부 실시형태에서, 반응 혼합물은 서열번호 3, 서열번호 11, 서열번호 27, 서열번호 29, 서열번호 31, 서열번호 33, 서열번호 35, 서열번호 37, 서열번호 39, 서열번호 41 및 서열번호 43으로 이루어진 군으로부터 선택된 폴리펩타이드와 적어도 80%(예컨대, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99% 또는 100%) 서열 동일성을 갖는 아미노산 서열을 포함하는 D-알룰로스 3-에피머라제 효소를 포함한다.

일부 실시형태에서, D-알룰로스 3-에피머라제 효소는 서열번호 3, 서열번호 11, 서열번호 27, 서열번호 29, 서열번호 31, 서열번호 33, 서열번호 35, 서열번호 37, 서열번호 39, 서열번호 41 및 서열번호 43으로 이루어진 군으로부터 선택된 폴리펩타이드와 적어도 90%(예컨대, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%) 서열 동일성을 갖는 아미노산 서열을 포함한다.

일부 실시형태에서, D-알룰로스 3-에피머라제 효소는 서열번호 3, 서열번호 11, 서열번호 27, 서열번호 29, 서열번호 31, 서열번호 33, 서열번호 35, 서열번호 37, 서열번호 39, 서열번호 41 및 서열번호 43으로 이루어진 군으로부터 선택된 폴리펩타이드와 적어도 95%(예컨대, 95%, 96%, 97%, 98%, 00% 또는 100%) 서열 동일성을 갖는 아미노산 서열을 포함한다.

일부 실시형태에서, D-알룰로스 3-에피머라제 효소는 서열번호 3, 서열번호 11, 서열번호 27, 서열번호 29, 서열번호 31, 서열번호 33, 서열번호 35, 서열번호 37, 서열번호 39, 서열번호 41 및 서열번호 43의 아미노산 서열을 포함한다.

일부 실시형태에서, 조건은 효소계와 프럭토스 기질을 25℃ 내지 75℃(예컨대, 25℃, 30℃, 35℃, 40℃, 45℃, 50℃, 55℃, 60℃, 65℃, 70℃ 또는 75℃)의 온도에서 유지시키는 것을 포함한다.

일부 실시형태에서, 조건은 효소계와 프럭토스 기질을 4 내지 10(예컨대, 4, 4.5, 5, 5.5, 6, 6.5, 7, 7.5, 8, 8.5, 9, 9.5 또는 10)의 pH에서 유지시키는 것을 포함한다.

일부 실시형태에서, D-알룰로스 3-에피머라제 효소는 단리된 형태이다. 일부 실시형태에서, D-알룰로스 3-에피머라제 효소는 고체 기질 상에 고정화된다.

일부 실시형태에서, 반응 혼합물은 D-알룰로스 3-에피머라제 효소를 인코딩하는 핵산 분자를 포함하는 재조합 벡터로 형질전환된 숙주 세포 또는 상기 숙주 세포의 용해물을 포함하되, 여기서 D-알룰로스 3-에피머라제 효소를 인코딩하는 핵산 분자는 서열번호 2, 서열번호 4, 서열번호 6, 서열번호 8, 서열번호 10, 서열번호 12, 서열번호 14, 서열번호 16, 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26, 서열번호 28, 서열번호 30, 서열번호 32, 서열번호 34, 서열번호 36, 서열번호 38, 서열번호 40, 서열번호 42 및 서열번호 44로 이루어진 군으로부터 선택된 폴리뉴클레오타이드 서열과 적어도 80%(예컨대, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99% 또는 100%) 서열 동일성을 갖는 폴리뉴클레오타이드 서열을 포함한다. 일부 실시형태에서, D-알룰로스 3-에피머라제 효소를 인코딩하는 핵산 분자는 서열번호 44의 폴리뉴클레오타이드 서열을 포함한다.

일부 실시형태에서, 숙주 세포는 효모 세포, 섬유상 진균 세포, 박테리아 세포, 포유류 세포, 식물 세포 및 라비린툴로마이세테스(Labyrinthulomycetes) 세포. 일부 실시형태에서, 숙주 세포는 이. 콜라이(E. coli) 또는 피. 파스토리스(P. pastoris)로 이루어진 군으로부터 선택된다. 일부 실시형태에서, 재조합 벡터는 숙주 세포 내에서 자기 복제 핵산 분자로서 존재한다. 일부 실시형태에서, 재조합 벡터는 숙주 세포 염색체에 통합된다.

일부 실시형태에서, 방법은 반응계에 적어도 하나의 유형의 금속 이온을 첨가하는 단계를 더 포함하되, 여기서 상기 적어도 하나의 유형의 금속 이온은 마그네슘 이온, 망간 이온, 구리 이온, 아연 이온, 니켈 이온, 코발트 이온, 철 이온, 알루미늄 이온 및 칼슘 이온으로 이루어진 군으로부터 선택된다. 일부 실시형태에서, 금속 이온은 약 0.01mM 내지 약 5mM(예컨대, 0.01mM, 0.05mM, 0.1mM, 0.2mM, 0.3mM, 0.4mM, 0.5mM, 0.6mM, 0.7mM, 0.8mM, 0.9mM, 1mM, 2mM, 3mM, 4mM 또는 5mM)의 농도로 첨가된다. 일부 실시형태에서, 방법은 프럭토스 기질이 알룰로스 전환됨에 따라서 반응계로부터 알룰로스를 포함하는 산물 스트림을 제거하는 단계를 더 포함한다.

하기 도면은 본 명세서의 부분을 형성하고, 본 개시내용의 소정의 양상을 더욱 입증하기 위하여 포함되며, 이는 본 명세서에서 제시된 특정 실시형태의 상세한 설명과 조합하여 이들 도면의 하나 이상을 참조함으로써 더욱 잘 이해될 수 있다.
도 1. D-알룰로스 3-에피머라제(DAE)에 의한 D-프럭토스의 D-알룰로스로의 생물전환.
도 2A 내지 도 2B. D-알룰로스 3-에피머라제 후보의 효소 스크리닝. D-알룰로스 3-에피머라제 활성을 갖는 정제된 후보 재조합 폴리펩타이드를 50mM 인산염 완충액(pH 7.2)에 대해서 투석하고, D-프럭토스를 기질로서 사용함으로써 D-알룰로스 합성에 대해서 검정하였다. 전형적으로, 재조합 폴리펩타이드(5 내지 10㎍)를 200㎕ 시험관내 반응계에서 시험하였다. 반응계는 20mM Tris-HCl 완충액, pH 8.0, 3mM MgCl₂ 또는MnSO4, 20g/ℓ D-프럭토스를 함유하였다. 반응은 60℃에서 수행하였고, 반응은 10분 동안 가열함으로써 2시간에(도 2A) 그리고 16시간에(도 2B) 종결되었다. D-프럭토스 및 D-알룰로스의 양을 결정하기 위한 HPLC에 의해 샘플을 분석하였다.
도 3. pHKA-AL39 플라스미드 작제물의 맵.
도 4A 내지 도 4B. 조작된 피키아 파스토리스(Pichia pastoris) 균주에 의해 생산된 AL 효소의 식별 및 특성규명. 도 4A는 조작된 피키아 파스토리스 균주의 배양 배지로부터 분비된 AL39 효소의 SDS-PAGE(16%) 분석을 도시한다. AL39 효소는 화살표에 의해 나타낸다. M: 단백질 사다리; S: 조작된 피키아 파스토리스 균주의 배양 배지의 샘플(12㎕). 도 4B는 DAE 활성을 도시한다. 배양 배지는 1시간 반응 후에 프럭토스 및 알룰로스의 존재에 대해서 분석하였다.
도 5. 재사용 사이클(1 내지 5)을 거쳐서 고정화된 AL39 효소의 DAE 활성의 비교.

본 발명에 따른 알룰로스를 생산하기 위한 방법은 프럭토스 기질을 D-알룰로스 3-에피머라제 활성을 갖는 폴리펩타이드를 포함하는 반응 혼합물과 접촉시키는 단계를 포함한다. D-프럭토스는 바람직한 기질이고, D-알룰로스 3-에피머라제는 바람직한 효소이다. 본 발명에 따른 반응 혼합물은 하나 이상의 보조인자를 더 포함할 수 있다. 2가 양이온은 본 발명에 따른 반응 혼합물에서 바람직한 보조인자이다. 망간 및 마그네슘은 바람직한 2가 양이온이고, 이들은 각각 MgCl₂ 및 MnSO₄로서 공급될 수 있다. 기타 적합한 2가 양이온은 구리 이온, 아연 이온, 니켈 이온, 코발트 이온, 철 이온, 알루미늄 이온 및 칼슘 이온을 포함할 수 있다. 본 발명의 일 실시형태에서, 본 발명에 따라 사용된 D-알룰로스 3-에피머라제는 적합한 완충액에서 고도로 정제된 균질한 재조합 단백질로서 제공된다. 본 발명의 또 다른 실시형태에서, 본 발명에 따라 사용되는 D-알룰로스 3-에피머라제는 고체 지지체 상에 고정된 고도로 정제된 재조합 단백질로서 제공된다. 본 발명의 또 다른 실시형태에서, 반응 혼합물은 재조합 D-알룰로스 3-에피머라제를 발현하는 재조합 원핵 세포 또는 재조합 진핵 세포를 포함하고 그 재조합 원핵 세포 또는 재조합 진핵 세포는 D-알룰로스 3-에피머라제의 소스로서 사용된다.

본 발명에 따른 숙주 세포는 D-알룰로스 3-에피머라제 활성을 갖는 상동성 단백질의 발현에 적합한 임의의 세포이다. 3-에피머라제 활성을 갖는 상동성 단백질을 발현하는 이러한 숙주 세포는 D-알룰로스 3-에피머라제 활성을 갖는 폴리펩타이드를 코딩하는 폴리뉴클레오타이드 서열을 포함하는 재조합 플라스미드로 숙주 세포의 형질전환에 기인되고, 이러한 숙주 세포는 본 발명에서 재조합 숙주 세포로 지칭된다. 본 발명에 적합한 숙주 세포의 일람은, 박테리아 세포, 효모 세포, 식물 세포, 동물 세포 및 라비린툴로마이세테스 세포를 포함하지만, 이들로 제한되지 않는다. 일부 실시형태에서, 세포계는 박테리아 세포, 효모 세포 또는 이들의 조합을 포함한다. 본 발명에 적합한 박테리아 세포는, 제한 없이, 에스케리키아 종(Escherichia spp.), 스트렙토마이세스 종(Streptomyces spp.), 지모모나스 종(Zymomonas spp.), 아세토박터 종(Acetobacter spp.), 시트로박터 종(Citrobacter spp.), 시네코시스티스 종(Synechocystis spp.), 리조븀 종(Rhizobium spp.), 클로스트리듐 종(Clostridium spp.), 코리네박테리움 종(Corynebacterium spp.), 스트렙토코커스 종(Streptococcus spp.), 잔토모나스 종(Xanthomonas spp.), 락토바실러스 종(Lactobacillus spp.), 락토코커스 종(Lactococcus spp.), 바실러스 종(Bacillus spp.), 알칼리게네스 종(Alcaligenes spp.), 슈도모나스 종(Pseudomonas spp.), 아에로모나스 종(Aeromonas spp.), 아조토박터 종(Azotobacter spp.), 코마모나 종스(Comamonas spp.), 미코박테리움 종(Mycobacterium spp.), 로도코커스 종(Rhodococcus spp.), 글루코노박터 종(Gluconobacter spp.), 랄스토니아 종(Ralstonia spp.), 아시디티오바실러스 종(Acidithiobacillus spp.), 마이크로루나투스 종(Microlunatus spp.), 지오박터 종(Geobacter spp.), 지오바실러스 종(Geobacillus spp.), 아트로박터 종(Arthrobacter spp.), 플라보박테리움 종(Flavobacterium spp.), 세라티아 종(Serratia spp.), 사카로폴리스포라 종(Saccharopolyspora spp.), 테르무스 종(Thermus spp.), 스테노트로포모나스 종(Stenotrophomonas spp.), 크로모박테리움 종(Chromobacterium spp.), 시노리조븀 종(Sinorhizobium spp.), 사카로폴리스포라 종(Saccharopolyspora spp.), 아그로박테리움 종(Agrobacterium spp.), 판토이아 종(Pantoea spp.) 및 비브리오 나트리에겐스(Vibrio natriegens)를 포함한다.. 본 발명에 적합한 효모 세포는, 제한 없이, 조작된 사카로마이세스 종(Saccharomyces spp.), 스키조사카로마이세스(Schizosaccharomyces), 한세눌라(Hansenula), 칸디다(Candida), 클루이베로마이세스(Kluyveromyces), 야로위아(Yarrowia), 칸디다 보이디니이(Candida boidinii) 및 피치아(Pichia)를 포함한다.

용어 세포 배양물은 배양물 중에 있는 재조합 숙주 세포를 포함하는 임의의 세포 또는 세포들을 지칭한다. 배양은 제어된 조건하에서, 전형적으로 이의 자연 환경의 외부에서 세포가 성장되는 과정이다. 예를 들어, 세포, 예를 들어, 효모 세포는 액체 영양소 브로쓰에서의 세포 현탁액으로서 성장될 수 있다. 세포 배양물은 박테리아 세포 배양물, 효모 세포 배양물, 식물 세포 배양물, 및 동물 세포 배양물을 포함하지만, 이로 제한되지 않는다.

일부 실시형태에서, 세포는 16℃ 내지 40℃의 온도에서 배양된다. 예를 들어, 세포는 16℃, 17℃, 18℃, 19℃, 20℃, 21℃, 22℃, 23℃, 24℃, 25℃, 26℃, 27℃, 28℃, 29℃, 30℃, 31℃, 32℃, 33℃, 34℃, 35℃, 36℃, 37℃, 38℃, 39℃ 또는 40℃의 온도에서 배양될 수 있다.

일부 실시형태에서, 세포는 12시간 내지 72시간 또는 그 이상의 기간 동안 배양된다. 예를 들어, 세포는 12, 18, 24, 30, 36, 42, 48, 54, 60, 66 또는 72시간의 기간 동안 배양된다. 전형적으로, 박테리아 세포와 같은 세포는 12 내지 24시간의 기간 동안 배양된다. 일부 실시형태에서, 세포는 37℃의 온도에서 12 내지 24시간 동안 배양된다. 일부 실시형태에서, 세포는 16℃의 온도에서 12 내지 24시간 동안 배양된다.

일부 실시형태에서, 세포는 1×10⁸(OD₆₀₀<1) 내지 2×10¹¹(OD ~ 200)개 생존 가능 세포/㎖ 세포 배양 배지의 밀도로 배양된다. 일부 실시형태에서, 세포는 1×10⁸, 2×10⁸, 3×10⁸, 4×10⁸, 5×10⁸, 6×10⁸, 7×10⁸, 8×10⁸, 9×10⁸, 1×10⁹, 2×10⁹, 3×10⁹, 4×10⁹, 5×10⁹, 6×10⁹, 7×10⁹, 8×10⁹, 9×10⁹, 1×10¹⁰, 2×10¹⁰, 3×10¹⁰, 4×10¹⁰, 5×10¹⁰, 6×10¹⁰, 7×10¹⁰, 8×10¹⁰, 9×10¹⁰, 1×10¹¹ 또는 2×10¹¹개의 생존 가능 세포/㎖의 밀도로 배양된다. (전환 인자: OD 1 = 8×10⁸개 세포/㎖).

숙주 세포에 의해 단백질 발현을 유도하기 위하여, 0.5mM 아이소프로필 β-D-1-티오갈락토피라노사이드(IPTG)를 첨가하고, 16℃에서 22시간 동안 배양물을 더욱 성장시켰다. 세포를 원심분리(3,000×g; 10분; 4℃)에 의해 수거하였다. 세포 펠릿을 수집하고 즉시 사용하거나 -80℃에서 보관하였다.

일부 실시형태에서, 세포 펠릿은 D-알룰로스 3-에피머라제 활성을 갖는 폴리펩타이드를 발현하는 숙주 세포로부터 수거된다. 일부 실시형태에서, 숙주 세포 펠릿은 다양한 농도로 재현탁될 수 있다. 일부 실시형태에서, 숙주 세포 펠릿은 1 g/ℓ 내지 250 g/ℓ의 농도로 재현탁된다. 일부 실시형태에서, 세포계로부터 수거된 숙주 세포 펠릿은 1 g/ℓ, 10 g/ℓ, 25 g/ℓ, 50 g/ℓ, 75 g/ℓ, 100 g/ℓ, 125 g/ℓ, 150 g/ℓ, 175 g/ℓ, 200 g/ℓ, 225 g/ℓ 또는 250 g/ℓ의 농도로 재현탁된다.

본 명세서에서 사용되는 바와 같은 용어 "인큐베이션시키는" 및 "인큐베이션"은 2개 이상의 화학적 또는 생물학적 실체 또는 적어도 1개의 화학적 실체 및 적어도 1개의 생물학적 실체(예컨대, 화학적 화합물 및 효소)를 혼합하고, 이들이 본 명세서에 기재된 바와 같은 D-알룰로스와 같은 생성물을 생산하기에 바람직한 조건 하에 상호작용하게 두는 공정을 지칭한다.

용어 "하류 분리 공정"은 원래의 기질 D-프럭토스로부터 최종 생성물인 D-알룰로스를 회수하는 것을 의미한다. 프럭토스가 D-알룰로스를 생성하기 위하여 효소 반응에서 기질로서 사용되는 경우, 프럭토스는 반응에서 완전히 소비되지 않고, 효소 반응의 말기에 상당한 양의 프럭토스가 반응 매질에 여전히 존재한다. D-프럭토스와 D-알룰로스는 유사한 물리적 및 화학적 특성을 가지므로, 기질로서의 프럭토스와 D-알룰로스 3-에피머라제가 연루된 효소 반응의 말기에 이들을 분리하는 것은 어렵다. D-프럭토스가 없는 D-알룰로스를 회수하는 하나의 가능한 방식은 남아 있는 프럭토스를 만니톨로 전환시키고 D-알룰로스를 만니톨로부터 분리시키는 것이다. NADPH- 또는 NADH-의존적 만니톨 탈수소효소는 D-프럭토스를 만니톨로 전환시키는 데 사용될 수 있다. 만니톨 탈수소효소는 만니톨 탈수소효소의 작용에 요구되는 환원된 보조인자인 NADH를 재생시키기 위하여 2-효소계에서 폼에이트 탈수소효소와 함께 사용될 수 있다. 폼에이트 탈수소효소는 폼에이트를 이산화탄소로 전환시키고 NAD를 NADH로 환원시킨다. 만니톨은 냉 결정화를 통해서 수용액으로부터 결정화될 수 있고, D-알룰로스는 D-프럭토스가 없는 형태로 회수될 수 있다. (Saha, B. C. and Racine, F. M. (2011) Biotechnological production of mannitol and its applications. Appl Microbiol Biotechnol. 89:879-891; 미국 특허 제10266862B2호).

용어 고정화는 D-알룰로스 3-에피머라제 또는 D-알룰로스 3-에피머라제 활성을 갖는 정제된 폴리펩타이드를 발현하는 숙주 세포를 당업계에 충분히 공지된 하나 또는 다른 방법을 사용하여 고체 지지체에 결합시키는 것을 지칭한다. 해조류에 대해서 유도된 알긴산나트륨은, 특허 문서 US2019169591A1에 상세히 기재된 바와 같이 D-알룰로스 3-에피머라제 또는 D-알룰로스 3-에피머라제 활성을 갖는 정제된 폴리펩타이드를 발현하는 숙주 세포를 고정화시키기 위하여 고체 지지체로서 사용될 수 있다.

용어 "핵산" 및 "뉴클레오타이드"는 당업자가 이해하는 바와 같은 이의 각각의 통상적이고 관례적인 의미에 따라 사용되며, 제한 없이 단일쇄 또는 이중쇄 형태의 데옥시리보뉴클레오타이드 또는 리보뉴클레오타이드 및 이의 중합체를 지칭하기 위하여 사용된다. 구체적으로 제한되지 않는 한, 이 용어는 참조 핵산과 유사한 결합 특성을 가지며 천연 발생 뉴클레오타이드와 유사한 방식으로 대사되는 천연 뉴클레오타이드의 알려진 유사체를 함유하는 핵산을 포괄한다. 달리 나타내지 않는 한, 특정 핵산 서열은 명시적으로 나타낸 서열뿐만 아니라, 묵시적으로 보존적으로 변형된 서열 또는 이의 축퇴성 변이체(예컨대, 축퇴성 코돈 치환) 및 상보성 서열 또한 포괄한다.

용어 "폴리펩타이드," "단백질" 및 "펩타이드"는 당업자가 이해하는 바와 같은 이의 각각의 통상적이고 관례적인 의미에 따라 사용되며; 이러한 3개 용어는 때때로 호환 가능하게 사용되며, 그 크기 또는 기능과 무관하게 비제한적으로 아미노산 또는 아미노산 유사체의 중합체를 나타내기 위하여 사용된다. "단백질"은 종종 상대적으로 큰 폴리펩타이드를 나타내는 데 사용되며 "펩타이드"는 종종 작은 폴리펩타이드를 나타내는 데 사용되지만, 당업계에서 이들 용어의 사용은 중첩되며 변한다. 본 명세서에서 사용되는 바와 같은 용어 "폴리펩타이드"는, 달리 언급되지 않는 한, 펩타이드, 폴리펩타이드 및 단백질을 지칭한다. 용어 "단백질", "폴리펩타이드" 및 "펩타이드"는 폴리펩타이드 산물을 지칭하는 경우 본 명세서에서 호환 가능하게 사용된다. 따라서, 예시적인 폴리펩타이드는 폴리펩타이드 산물, 천연 발생 단백질, 상동체, 오쏘로그, 파라로그, 단편 및 이의 다른 등가물, 변이체 및 유사체를 포함한다.

폴리펩타이드 또는 단백질의 "기능적 단편"이란 용어는 전장 폴리펩타이드 또는 단백질의 일부이며, 전장 폴리펩타이드 또는 단백질과 실질적으로 동일한 생물학적 활성을 갖거나 실질적으로 동일한 기능을 수행하는(예컨대, 동일한 효소 반응을 수행하는) 펩타이드 단편을 나타낸다.

용어 "기능적 변이체"는 보존적으로 치환된 변이체를 더 포함한다. 용어 "보존적으로 치환된 변이체"는 하나 이상의 보존적 아미노산 치환에 의해 참조 펩타이드와는 상이하며 참조 펩타이드의 일부 또는 모든 활성을 유지하는 아미노산 서열을 갖는 펩타이드를 나타낸다. "보존적 아미노산 치환"은 아미노산 잔기의 기능적으로 유사한 잔기로의 치환이다. 보존적 치환의 예는 하나의 비극성(소수성) 잔기, 예컨대, 아이소류신, 발린, 류신 또는 메티오닌의 또 다른 비극성(소수성) 잔기로의 치환; 하나의 하전된 또는 극성(친수성) 잔기의 또 다른 극성(친수성) 잔기, 예컨대, 아르기닌과 라이신 간, 글루타민과 아스파라긴 간, 트레오닌과 세린 간 치환; 하나의 염기성 잔기, 예컨대, 라이신 또는 아르기닌의 또 다른 염기성 잔기로의 치환; 또는 하나의 산성 잔기, 예컨대, 아스파르트산 또는 글루탐산의 또 다른 산성 잔기로의 치환; 또는 하나의 방향족 잔기, 예컨대, 페닐알라닌, 티로신 또는 트립토판의 또 다른 방향족 잔기로의 치환이 포함된다. 이러한 치환은 단백질 또는 폴리펩타이드의 겉보기 분자량 또는 등전점에 대한 효과를 거의 또는 전혀 갖지 않을 것으로 예상된다. 어구 "보존적으로 치환된 변이체"는, 생성 펩타이드가 본 명세서에 기재된 바와 같은 참조 펩타이드의 일부 또는 모든 활성을 유지하는 한, 잔기가 화학적으로 유도체화된 잔기로 대체되는 펩타이드를 또한 포함한다.

주제 기술의 폴리펩타이드에 관한 용어 "변이체"는, 참조 폴리펩타이드의 아미노산 서열과 적어도 75%, 적어도 76%, 적어도 77%, 적어도 78%, 적어도 79%, 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 및 심지어 100% 동일한 아미노산 서열을 가진 기능적으로 활성인 폴리펩타이드를 더 포함한다.

모든 문법적 형태 및 철자 변형에 있어서의 용어 "상동성(homologous)"은 수퍼 패밀리로부터의 폴리뉴클레오타이드 또는 폴리펩타이드 및 상이한 종으로부터의 상동성 폴리뉴클레오타이드 또는 단백질을 포함하는, "공통 진화 기원"을 보유하는 폴리뉴클레오타이드 또는 폴리펩타이드 간 관계를 나타낸다(Reeck et al., Cell 50:667, 1987). 이러한 폴리뉴클레오타이드 또는 폴리펩타이드는, 보존된 위치에서의 동일성 백분율 또는 특정 아미노산 또는 모티브의존재의 관점과 무관하게, 이의 서열 유사성으로 반영되는 서열 상동성을 갖는다. 예를 들어, 2개의 상동성 폴리펩타이드는 적어도 75%, 적어도 76%, 적어도 77%, 적어도 78%, 적어도 79%, 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 및 심지어 100% 동일한 아미노산 서열을 가질 수 있다.

본 기술의 변종 폴리펩타이드 서열과 관련하여 "퍼센트(%) 아미노산 서열 동일성"은, 필요한 경우, 서열 동일성의 부분으로서 임의의 보존적 치환을 고려하지 않고 최대 퍼센트 서열 동일성을 달성하기 위해 서열을 정렬하고 갭을 도입한 후에, 참조 폴리펩타이드의 아미노산 잔기와 동일한, 후보 서열에서 아미노산 잔기의 백분율을 지칭하는 것이다.

퍼센트 아미노산 서열 동일성을 결정하기 위한 정렬은, 예를 들어, BLAST, BLAST-2, ALIGN, ALIGN-2 또는 Megalign(DNASTAR) 소프트웨어와 같은 공개적으로 이용 가능한 컴퓨터 소프트웨어를 사용하여 당해 기술분야의 기술 내에 있는 다양한 방식으로 달성될 수 있다. 당업자는 비교되는 서열의 전체 길이에 걸쳐 최대 정렬을 달성하는 데 필요한 임의의 알고리즘을 포함하는, 정렬을 측정하기 위한 적절한 파라미터를 결정할 수 있다. 예를 들어, % 아미노산 서열 동일성은 서열 비교 프로그램 NCBI-BLAST2를 사용하여 결정될 수 있다. NCBI-BLAST2 서열 비교 프로그램은 ncbi.nlm.nih.gov로부터 다운로딩될 수 있다. NCBI BLAST2는 여러 조사 파라미터를 사용하고, 여기서, 그러한 조사 파라미터 모두는 예를 들어, 언마스크 예스(unmask yes), 스트랜드=모두, 예상된 발생 10, 최소 낮은 복잡성 길이=15/5, 다중-패스 e-값=0.01, 다중-패스에 대한 상수 =25, 최종 갭 정렬에 대한 드롭오프=25, 및 스코어링 매트릭스=BLOSUM62를 포함하는 디폴트 값으로 설정된다. 아미노산 서열 비교를 위해 NCBI-BLAST2를 사용하는 상황에서, 제공된 아미노산 서열 B에 대한, 이와, 또는 이에 대한 제공된 아미노산 서열 A의 % 아미노산 서열 동일성(대안적으로, 제공된 아미노산 서열 B에 대한, 이와, 또는 이에 대한 특정 % 아미노산 서열 동일성을 갖거나 이를 포함하는 제공된 아미노산 서열 A로서 표현될 수 있음)은 하기와 같이 계산된다: 100 × 분수 X/Y(상기 식에서, X는 A 및 B의 그러한 프로그램 정렬에서 서열 정렬 프로그램 NCBI-BLAST2에 의해 동일한 매치로서 스코어링된 아미노산 잔기의 수이고, Y는 B에서 아미노산 잔기의 총 수임). 아미노산 서열 A의 길이가 아미노산 서열 B의 길이와 동일하지 않은 경우, B에 대한 A의 % 아미노산 서열 동일성이 A에 대한 B의 % 아미노산 서열 동일성과 동일하지 않는다는 것이 인식될 것이다.

아미노산 서열 "유사성"을 결정하기 위한 기술은 당해 기술분야에 널리 공지되어 있다. 일반적으로, "유사성"은 적절한 장소에서 둘 이상의 폴리펩타이드의 정확한 아미노산 대 아미노산 비교를 지칭하고, 여기서, 아미노산은 동일하거나 유사한 화학적 및/또는 물리적 특성, 예를 들어, 전하 또는 소수성을 지닌다. "퍼센트 유사성"은 이후에, 비교된 폴리펩타이드 서열 간에 결정될 수 있다. 핵산 및 아미노산 서열 동일성을 결정하기 위한 기술은 또한, 당해 기술분야에 널리 공지되어 있고, (대개 cDNA 중간체를 통해) 그러한 유전자에 대한 mRNA의 뉴클레오타이드 서열을 결정하고, 그 안에 인코딩된 아미노산 서열을 결정하고, 이를 제2 아미노산 서열과 비교하는 것을 포함한다. 일반적으로, "동일성"은 2개의 폴리뉴클레오타이드 또는 폴리펩타이드 서열 각각의 정확한 뉴클레오타이드 또는 아미노산 대 아미노산 대응을 지칭한다. 2개 이상의 폴리뉴클레오타이드 서열은 2개 이상의 아미노산 서열과 같이, 이의 "퍼센트 동일성"을 결정함으로써 비교될 수 있다. Wisconsin Sequence Analysis Package, Version 8(Genetics Computer Group(위스콘신주 매디슨 소재)으로부터 입수 가능함)에서 입수 가능한 프로그램, 예를 들어, GAP 프로그램은 2개의 폴리뉴클레오타이드 간의 동일성 및 2개의 폴리펩타이드 서열 간의 유사성 둘 모두를 계산할 수 있다. 서열들 간의 동일성 또는 유사성을 계산하기 위한 다른 프로그램은 당업자에 의해 알려져 있다.

기준 위치에 "상응하는" 아미노산 위치는 아미노산 서열을 정렬시킴으로써 식별되는 바와 같이, 기준 서열과 정렬하는 위치를 지칭한다. 이러한 정렬은 수작업으로 또는 ClustalW2, Blast 2, 등과 같은 널리 공지된 서열 정렬 프로그램을 사용함으로써 수행될 수 있다.

달리 특정되지 않는 한, 2개의 폴리펩타이드 또는 폴리뉴클레오타이드 서열의 퍼센트 동일성은 2개의 서열 중 더 짧은 부분의 전체 길이에 걸친 동일한 아미노산 잔기 또는 뉴클레오타이드의 백분율을 지칭한다.

본 명세서에서 사용되는 바와 같은 용어 "발현"은, 당업자에게 통상적이고 관례적인 의미로 주어지며, 비제한적으로, 주제 기술의 핵산 단편으로부터 유래되는 센스(mRNA) 또는 안티센스 RNA의 전사 및 안정한 축적을 나타내기 위하여 사용된다. "과발현"은 정상 또는 형질전환되지 않은 유기체에서의 생산 수준을 초과하는 트랜스제닉 또는 재조합 유기체에서의 유전자 산물의 생산을 나타낸다.

"형질전환"은 당업자가 이해하는 바와 같은 통상적이고 관례적인 의미에 따라 사용되며, 제한 없이, 표적 세포 내로의 폴리뉴클레오타이드의 전달을 지칭하기 위하여 사용된다. 전달된 폴리뉴클레오타이드는 표적 세포의 게놈 또는 염색체 DNA 내로 혼입되어, 유전적으로 안정한 유전을 야기할 수 있거나, 숙주 염색체 DNA와 무관하게 복제할 수 있다. 형질전환된 핵산 단편을 함유하는 숙주 유기체는 "트랜스제닉" 또는 "재조합" 또는 "형질전환된" 유기체로 지칭된다.

숙주 세포와 관련하여 본 명세서에서 사용되는 경우, 용어 "형질전환된", "트랜스제닉" 및 "재조합"은 당업자가 이해하는 바와 같은 이의 각각의 통상적이고 관례적인 의미에 따라 사용되며, 제한 없이, 이종성 핵산 분자가 도입된 숙주 유기체의 세포, 예컨대, 식물 또는 미생물 세포를 지칭하기 위하여 사용된다. 핵산 분자는 숙주 세포의 게놈 내로 안정적으로 통합될 수 있거나, 또는 핵산 분자는 염색체외 분자로서 존재할 수 있다. 이러한 염색체외 분자는 자가-복제할 수 있다. 형질전환된 세포, 조직 또는 대상체는 형질전환 공정의 최종 산물뿐만 아니라, 이의 트랜스제닉 자손도 포괄하는 것으로 이해된다.

폴리뉴클레오타이드와 관련하여 본 명세서에서 사용되는 경우, 용어 "재조합", "이종성" 및 "외인성"은 당업자가 이해하는 바와 같은 이의 통상적이고 관례적인 의미에 따라 사용되며, 제한 없이 특정 숙주 세포에 대한 외래 출처에서 기인하는, 또는 동일한 출처로부터인 경우, 그 원래 형태로부터 변형된 폴리뉴클레오타이드(예컨대, DNA 서열 또는 유전자)를 지칭하기 위하여 사용된다. 따라서, 숙주 세포 내의 이종성 유전자는 특정 숙주 세포에 내인성이지만, 예를 들어, 부위-지정 돌연변이화 또는 다른 재조합 기법의 사용을 통해 변형된 유전자를 포함한다. 이 용어는 또한 천연 발생 DNA 서열의 여러 비-천연 발생 카피가 포함된다. 따라서, 이 용어는 세포에 대해 외래이거나 이종성인, 또는 세포와 상동성이지만 요소가 보통 확인되지 않는 숙주 세포 내의 위치에 있거나 형태인 DNA 절편을 나타낸다.

유사하게, 폴리펩타이드 또는 아미노산 서열에 관하여 본 명세서에서 사용되는 경우, 용어 "재조합", "이종성" 및 "외인성"은 특정 숙주 세포에 대해 외래 출처에서 기인하는, 또는 동일한 출처로부터인 경우, 그 원래 형태로부터 변형된 폴리펩타이드 또는 아미노산 서열을 의미한다. 따라서, 재조합 DNA 절편은 숙주 세포에서 발현되어 재조합 폴리펩타이드를 생산할 수 있다.

용어 "플라스미드", "벡터" 및 "카세트"는 당업자가 이해하는 바와 같은 이의 각각의 통상적이고 관례적인 의미에 따라 사용되며, 제한 없이 종종 세포의 중심 대사의 일부가 아닌 유전자를 운반하고 보통 원형 이중쇄 DNA 분자 형태인 염색체외 요소를 나타내기 위하여 사용된다. 이러한 요소는 임의의 출처로부터 유래되는, 단일 가닥 또는 이중 가닥 DNA 또는 RNA의 선형 또는 원형, 자가 복제 서열, 게놈 통합 서열, 파지 또는 뉴클레오타이드 서열일 수 있고, 여기서 다수의 뉴클레오타이드 서열이 세포 내로 적절한 3' 미번역 서열을 따라 프로모터 단편 및 선택된 유전자 산물에 대한 DNA 서열을 도입할 수 있는 고유한 구성으로 연결되거나 재조합되었다. "형질전환 카세트"는 외래 유전자를 함유하고 특정 숙주 세포의 형질전환을 촉진하는 외래 유전자에 부가하는 요소를 갖는 특정 벡터를 지칭한다. "발현 카세트"는 외래 유전자를 함유하고 외래 숙주에서 그 유전자의 발현 증강을 허용하는 외래 유전자에 부가하는 요소를 갖는 특정 벡터를 지칭한다.

본 명세서에서 사용되는 표준 재조합 DNA 및 분자 클로닝 수법은 당업계에 잘 알려져 있고, 예를 들어, 문헌[Sambrook, J., Fritsch, E. F. and Maniatis, T. Molecular Cloning: A Laboratory Manual, 2nd ed.; Cold Spring Harbor Laboratory: Cold Spring Harbor, N.Y., 1989 (이하 "Maniatis"); 및 Silhavy, T. J., Bennan, M. L. and Enquist, L. W. Experiments with Gene Fusions; Cold Spring Harbor Laboratory: Cold Spring Harbor, N.Y., 1984; 및 Ausubel, F. M. et al., In Current Protocols in Molecular Biology, published by Greene Publishing and Wiley-Interscience, 1987]에 기재되어 있으며; 이들의 각각의 전문은 이들이 본 발명과 일치하는 정도까지 참조에 의해 본 명세서에 원용된다.

달리 정의되지 않는 한, 본 명세서에서 사용되는 모든 기술 및 과학 용어는 본 개시내용이 속하는 분야의 당업자가 통상적으로 이해하는 바와 동일한 의미를 갖는다. 본 명세서에 기재된 것과 유사하거나 동등한 임의의 방법 및 물질이 본 개시내용의 실시 또는 시험에서 사용될 수 있지만, 바람직한 물질 및 방법이 아래에 기재된다.

실시예

실시예 1 : D-알룰로스 3-에피머라제를 발현하기 위한 플라스미드 벡터의 작제

D-알룰로스 3-에피머라제(DAE)는 D-프럭토스를 D-알룰로스로 전환시키는 능력을 갖는다(도 1). D-프럭토스를 기질로서 사용하여 D-알룰로스 생산을 위한 특정 D-알룰로스 3-에피머라제 효소를 식별하기 위하여, D-알룰로스 3-에피머라제 활성을 갖는 폴리펩타이드를 코딩하는 폴리뉴클레오타이드 서열은 다원발생(polygenetic) 및 BLAST 분석을 사용하여 식별하였다. 모든 후보 D-알룰로스 3-에피머라제 유전자의 전장 DNA 단편은 상업적으로 합성되었다. cDNA의 거의 모든 코돈은 이. 콜라이(Twist Bioscience, 캘리포니아주 소재)를 위하여 바람직한 것으로 변화시켰다. 합성된 DNA는 발현 작제물을 생성하기 위하여 박테리아 발현 벡터에 클로닝시켰다.

실시예 2 : 재조합 이. 콜라이 세포에서의 D-알룰로스 3-에피머라제 효소 활성의 측정

실시예 1에서처럼 제조된 D-알룰로스 3-에피머라제 활성을 갖는 폴리펩타이드를 코딩하는 폴리뉴클레오타이드를 가진 각 발현 벡터 작제물을 이. 콜라이 T7 발현 세포(Biolabs, 매사추세츠주 소재)에 형질전환시키고, 후속하여 0.8 내지 1.0의 OD600에 도달할 때까지 37℃에서 50 ㎍/㎖ 암피실린을 함유하는 Terrific Broth 배지에서 성장시켰다. 0.5mM 아이소프로필 β-D-1-티오갈락토피라노사이드(IPTG)의 첨가에 의해 단백질 발현을 유도시키고, 배양물을 16℃ㅔ서 22시간 동안 더욱 성장시켰다. 세포를 원심분리(3,000×g; 10분; 4℃)에 의해 수거하였다. 세포 펠릿을 수집하고 즉시 사용하거나 -80℃에서 보관하였다.

세포 펠릿을 추출 완충액(BugBuster Master Mix, EMD Millipore, 미국 소재)에 의해 추출하였다. 원심분리 후, 활성 검정을 위하여 반응 혼합물에 상청액을 첨가하였다. 전형적으로, 상청액(5㎕)을 200㎕ 시험관내 반응계에서 시험하였다. 반응계는 20mM Tris-HCl 완충액, pH 8.0, 1mM MgCl₂ 또는MnSO4, 10g/ℓ D-프럭토스를 함유한다. 반응은 60℃에서 수행하였고, 10분 동안 가열함으로써 반응을 종결시켰다. 샘플을 HPLC에 의해 분석하였다.

D-프럭토스 및 D-알룰로스의 농도는 RefractorMax521 검출기(IDEX Health & Science KK, 일본 소재)가 장착된 HPLC 시스템(Vanquish, Thermo Scientific, 미국 소재)에 의해 결정하였다. 크로마토그래피 분리는 Rezex RCM-Monosaccharide Ca²⁺ 칼럼(100x7.8mm, Phenomenex, 캘리포니아주 소재)을 사용해서 수행하였다. 칼럼을 0.5㎖/분의 유량으로 물로 80℃에서 용리시켰다. D-알룰로스 3-에피머라제 효소 활성의 분석으로부터, D-프럭토스를 D-알룰로스로 생물전환하기 위한 적절한 효소 활성을 갖는 총 21가지 후보 D-알룰로스 3-에피머라제 효소를 식별하였다(표 1).

실시예 3 : 재조합 D-알룰로스 3-에피머라제의 정제

재조합 단백질을 정제하기 위하여, 세포 펠릿을 전형적으로 용해 완충액(50mM 인산칼륨 완충액, pH 7.2, 25mg/㎖ 라이소자임, 5mg/㎖ DNase I, 20mM 이미다졸, 500mM NaCl, 10% 글리세롤 및 0.4% Triton X-100)에 재현탁시켰다. 세포를 4℃하의 초음파 처리에 의해 파쇄하였고, 세포 파편을 원심분리(18,000×g; 30분)에 의해 청징화시켰다. 상청액을, 50mM 인산칼륨 완충액, pH 7.2, 20mM 이미다졸, 500mM NaCl 및 10% 글리세롤을 함유하는 평형 완충액으로 평형화된 친화도 칼럼 Ni-NTA(Qiagen)에 로딩하였다. 단백질 샘플의 로딩 후, 칼럼을 평형 완충액으로 세척하여 미결합된 오염 단백질을 제거하였다. D-알룰로스 3-에피머라제 활성을 갖는 His-태그화된 재조합 폴리펩타이드를 250mM 이미다졸을 함유하는 평형 완충액으로 용리시켰다.

D-알룰로스 3-에피머라제 활성을 갖는 정제된 후보 재조합 폴리펩타이드를 50mM 인산염 완충액(pH 7.2)에 대해서 투석하고 D-프럭토스를 기질로서 사용함으로써 D-알룰로스 합성에 대해서 검정하였다. 전형적으로, 재조합 폴리펩타이드(5 내지 10㎍)를 200㎕ 시험관내 반응계에서 시험하였다. 반응계는 20mM Tris-HCl 완충액, pH 8.0, 3mM MgCl₂ 또는 MnSO4, 20g/ℓ D-프럭토스를 함유하였다. 반응은 60℃에서 수행하였고, 반응은 10분 동안 가열함으로써 2시간에 그리고 16시간에 종결시켰다. 샘플은 HPLC에 의해 분석하였다.

D-알룰로스 3-에피머라제 활성을 갖는 이들 후보 재조합 폴리펩타이드는 2가 금속 인자에 대해서 선호도가 상이한 알룰로스 생산을 위한 다양한 효소 활성을 갖는다. 도 2A 내지 도 2B에 나타낸 바와 같이, 선택된 모든 후보는 2시간에 D-알룰로스 3-에피머라제 활성을 갖고(도 2A), 반응이 16시간까지 연장되었을 때 더 많은 D-알룰로스가 생산될 수 있다(도 2B). Mg²⁺ 첨가와 비교하여, Mn²⁺ 첨가는 대부분의 효소(AL28, 35, 39, 42, 50 및 51)의 활성을 증가시킬 수 있는데, 이는 이들 효소가 Mn²⁺ 보조인자보다 선호하는 것을 나타낸다.

실시예 4 : DAE 효소를 생산하는 조작된 피키아 파스토리스 균주의 생성

AL39 유전자(서열번호 43)의 전장 DNA 단편은 피키아 파스토리스 세포의 형질전환에 사용하기 위하여 합성하였다. 구체적으로, cDNA는 AL39 효소(서열번호 5)를 생산하기 위하여 피키아 파스토리스 발현을 위해 코돈 최적화시켰다. AL39 유전자를 α-교배 인자(mating factor) 신호 펩타이드와 프레임내 삽입하였다. EcoRI 및 NotI 제한 소화를 사용하여, 합성된 융합 유전자를 pHKA 벡터(변형된 피키아 파스토리스 발현 벡터)에 클로닝하였다. 발현 플라스미드(pHKA-AL39, 도 3)에서, 발현 카세트는 AOX1 프로모터, α-교배 인자 신호 펩타이드, AL39 유전자 및 AOX1 전사 종결자를 함유한다.

선형화된 pHKA-AL39 플라스미드는 당업계에 공지된 방법(Lin-Cereghino, et al., Biotechniques, 38(1):44-48, 2005)을 사용하여 피키아 파스토리스(GS115) 세포로 형질전환시키고, 발현 카세트는 HIS4 좌위에서 피키아 파스토리스 게놈에 통합시켰다.

분비된 AL39 효소 생산을 입증하기 위하여, 피키아 파스토리스 균주 pHKA-AL39의 단일 콜로니를 배플 부착된 플라스크 내 BMGY 배지에 접종하고, 배양액이 2 내지 6의 OD600(대수기 성장)에 도달할 때까지 진탕 인큐베이터(250 내지 300 rpm)에서 28 내지 30℃에서 성장시켰다. pHKA-AL39 세포를 원심분리에 의해 수거하고 BMMY 배지 중 1.0의 OD600에 재현탁시켜 발현을 유도하였다. 발현의 유도를 유지시키기 위하여 100% 메탄올을 매 24시간마다 1% 메탄올의 최종 농도로 BMMY 배지에 첨가하였다. pHKA-AL39 배양액으로부터의 배지를 원심분리에 의해 수거하고, 이하에 기재된 바와 같은 DAE 활성 분석 및 SDS-PAGE 분석에 적용하였다.

원심분리 후에, 활성 검정을 위하여 상청액을 반응 혼합물에 첨가하였다. 전형적으로, 상청액(65㎕)을 200㎕ 시험관내 반응계에서 시험하였다. 반응계는 20mM Tris-HCl 완충액, pH 8.0, 1mM MnSO4, 30g/ℓ D-프럭토스를 함유하였다. 반응은 55 내지 60℃에서 수행하였고, 10분 동안 가열함으로써 종결시켰다. 샘플은 HPLC에 의해 분석하였다.

D-프럭토스 및 D-알룰로스의 농도는 RefractorMax521 검출기(IDEX Health & Science KK, 일본 소재)가 장착된 HPLC 시스템(Vanquish, Thermo Scientific, 미국 소재)으로 결정하였다. 크로마토그래피 분리는 Rezex RCM-단당류 Ca²⁺ 칼럼(100x7.8mm, Phenomenex, 캘리포니아주 소재)를 사용하여 수행하였다. 0.5㎖/분의 유량으로 물로 80℃에서 칼럼을 용리시켰다.

AL39 단백질의 존재는 SDS-PAGE 분석에 의해 결정하였다(도 4A). 배지 샘플은 당업계에 공지된 방법(Laemmli, Nature, 227 (5259): 680-685, 1970)을 사용하여 SDS-PAGE에 의해 분리시켰다. 생성된 AL39 단백질은 염색 용액에 의해 염색된 후에 시각화하였다. 생성된 AL39는 SDS-PAGE 분석에 기반한 배지 샘플에서 주된 단백질이었다(도 4A).

SDS-PAGE 및 DAE 활성 스크리닝 후, 최상의 균주는 높은 분비된 AL39 효소 생산을 갖는 것으로 식별되었다. 생산된 AL39 효소는 D-프럭토스를 D-알룰로스로 생물전환시키기 위한 활성을 갖는다. 도 4A에 도시된 바와 같이, 생산된 AL39 단백질은 SDS-PAGE 분석에 의해 발효 배지에서 검출될 수 있는데, 이는 생산된 AL39 효소가 조작된 피키아 파스토리스 균주의 세포외 간격으로 분비될 수 있다. 생산된 효소는 원심분리에 의해 세포 펠릿을 제거한 후에 발효 배지로부터 쉽게 수집되어 농축될 수 있다. DAE 활성은 배지 샘플에서 검출될 수 있다. 도 4B에 도시된 바와 같이, 대략 25%의 프럭토스가 반응에서 1시간 후에 알룰로스로 전환될 수 있다.

실시예 5 : 고정화된 DAE 효소를 사용하는 생물전환

효소 고정화는 상당한 시간 기간에 걸쳐서 보다 큰 회전률(turnover)로 기질에 대한 효소의 가용성을 증가시키기 위한 우수한 기반을 제공한다. 프럭토스의 알룰로스로의 생물전환에 대한 높은 활성 및 우수한 내구성을 갖는 고정화된 D-알룰로스 에피머라제를 효율적으로 생산하는 방법이 하기에 기재된다.

AL39 단백질을 여과에 의해 농축시켰다. 추출된 AL39를 고정화를 위하여 20mM 인산염 완충액(pH 8.0)에 용해시켰다. DAE 활성의 1단위는 pH 8.0 및 55℃에서 분당 1 μ㏖ D-알룰로스의 형성을 촉매하는 효소의 양으로서 정의되었다. 고정화된 DAE 효소의 비활성(specific activity)은 ㎎ 효소당의 단위로서 정의되었다.

제조된 AL39 단백질을 20mM 인산염 완충액(pH 8.0) 중 수-전처리 이온 교환 수지(LXP-505, SUNRESIN)와 혼합하고, 25℃에서 24시간 동안 반응기에서 서서히 교반하였다. 후속하여, 상청액을 제거하고, 얻어진 혼합물을 20mM 인산염 완충액(pH 8.0)으로 세척하여 고정화된 DAE 효소를 얻었다.

고정화된 DAE 효소를 활성 검정을 위하여 반응 혼합물에 첨가하였다. 고정화된 효소를 1㎖ 시험관내 반응계에서 시험하였다. 반응계는 20mM 인산염 완충액, pH 8.0, 1mM MnSO4, 500g/ℓ D-프럭토스를 함유하였다. 반응은 55℃에서 수행하고, 반응은 10분 동안 가열함으로써 종결시켰다. 샘플을 HPLC에 의해 분석하였다. 고정화된 효소는 3시간 후에 23% 초과의 프럭토스를 알룰로스로 전환시켰다.

AL39가 사용 후 활성을 보유할 수 있는지의 여부를 결정하기 위하여, 고정화된 AL39의 재사용 사이클을 시험하였다. 180㎎ 고정화된 AL39를, 20mM 인산염 완충액(pH 8.0), 1mM MnSO4, 500g/ℓ D-프럭토스를 함유하는 1ℓ 반응물에 첨가하였다. 반응은 55℃에서 수행하였다. 5시간 반응 후, 고정화된 효소를 여과에 의해 수집하였다. 알룰로스 생산을 측정하기 위하여 상청액을 HPLC에 의해 분석하고, 고정화된 효소를 그 다음 사이클 반응을 위하여 20mM 인산염 완충액(pH 8.0)으로 5회 세척하였다. 5회 사이클 후에, 각 사이클의 활성을 비교하였다. 도 5에 도시된 바와 같이, 고정화된 AL39의 활성은 단지 첫 번째 사이클에 비해서 다섯 번째 사이클에서 10.76% 소실되었는데, 이는 고정화된 AL39가 알룰로스 생물전환을 위하여 안정적인 것을 나타낸다.

참고문헌:

1. Lin-Cereghino J, Wong WW, Xiong S, et al. Condensed protocol for competent cell preparation and transformation of the methylotrophic yeast Pichia pastoris. Biotechniques. 2005;38(1):44-48.

2. Laemmli, U. K. (1970). "Cleavage of Structural Proteins during the Assembly of the Head of Bacteriophage T4". Nature. 227 (5259): 680-685.

서열정보

서열번호 1; 단백질; 메이오써무스 실바누스

서열번호 2; DNA; 메이오써무스 실바누스

서열번호 3; 단백질; 열수 분출공 메타게놈(hydrothermal vent metagenome)

서열번호 4; DNA; 열수 분출공 메타게놈

서열번호 5; 단백질; 써모클로스트리듐 카에니콜라

서열번호 6; DNA; 써모클로스트리듐 카에니콜라

서열번호 7; 단백질; 열수 분출공 메타게놈

서열번호 8; DNA; 열수 분출공 메타게놈

서열번호 9; 단백질; 메이오써무스 그라나티시우스

서열번호 10; DNA; 메이오써무스 그라나티시우스

서열번호 11; 단백질; 루벨리마이크로븀 써모필룸

서열번호 12; DNA; 루벨리마이크로븀 써모필룸

서열번호 13; 단백질; 칸디다투스 써모폰시아 클레드 1 박테륨

서열번호 14; DNA; 칸디다투스 써모폰시아 클레드 1 박테륨

서열번호 15; 단백질; 데이노코커스 코렌시스

서열번호 16; DNA; 데이노코커스 코렌시스

서열번호 17; 단백질; 올라비우스 알가르벤시스 스피로케테 엔도심비온트

서열번호 18; DNA; 올라비우스 알가르벤시스 스피로케테 엔도심비온트

서열번호 19; 단백질; 아시디필륨(Acidiphilium)

서열번호 20; DNA; 아시디필륨

서열번호 21; 단백질; 로도박테랄레스 박테륨

서열번호 22; DNA; 로도박테랄레스 박테륨

서열번호 23; 단백질; 클로로플렉시 박테륨

서열번호 24; DNA; 클로로플렉시 박테륨

서열번호 25; 단백질; 스피리박터 종 E85

서열번호 26; DNA; 스피리박터 종 E85

서열번호 27; 단백질; 타브리지콜라 종 TH137

서열번호 28; DNA; 타브리지콜라 종 TH137

서열번호 29; 단백질; 트로피시모나스 아이소알카니보란스

서열번호 30; DNA; 트로피시모나스 아이소알카니보란스

서열번호 31; 단백질; 로도박터과 박테륨

서열번호 32; DNA; 로도박터과 박테륨

서열번호 33; 단백질; 로도박터 종 SW2

서열번호 34; DNA; 로도박터 종 SW2

서열번호 35; 단백질; 알파프로테오박테리아 박테륨 HGW-알파프로테오박테리아-8

서열번호 36; DNA; 알파프로테오박테리아 박테륨 HGW-알파프로테오박테리아-8

서열번호 37; 단백질; 루벨리마이크로븀 메소필룸

서열번호 38; DNA; 루벨리마이크로븀 메소필룸

서열번호 39; 단백질; 로도박테랄레스 박테륨

서열번호 40; DNA; 로도박테랄레스 박테륨

서열번호 41; 단백질; 로도박테랄레스 박테륨 RIFCSPHIGHO2_02_FULL_62_130>

서열번호 42; DNA; 로도박테랄레스 박테륨 RIFCSPHIGHO2_02_FULL_62_130

서열번호 43; 단백질; 코돈 최적화된 DNA 서열 서열번호 44에 의해 인코딩된 써모클로스트리듐 카에니콜라

서열번호 44; DNA; 코돈 최적화된 써모클로스트리듐 카에니콜라

기타 실시형태

본 명세서에 개시된 모든 특징은 임의의 조합으로 조합될 수 있다. 본 명세서에 개시된 각각의 특징은 동일하거나 동등하거나 유사한 목적을 제공하는 대안적 특징으로 대체될 수 있다. 따라서, 달리 명시적으로 언급되지 않는 한, 개시된 각 특징은 동등하거나 유사한 특징의 일반적인 시리즈의 예일 뿐이다. 상기 설명으로부터, 당업자는 본 개시내용의 필수적 특징을 용이하게 확인할 수 있고, 이의 정신 및 범주로부터 벗어나는 일 없이, 다양한 용법 및 조건에 적합하도록 본 개시내용을 다양하게 변화 및 변형시킬 수 있다. 따라서, 다른 실시형태도 청구범위 내이다.

균등물 및 범위

당업자라면 단지 일상적인 실험과정에 지나지 않는 것을 사용하여, 본 명세서에 기재된 개시내용의 특정 실시형태의 많은 균등물을 인식할 것이거나 확인할 수 있을 것이다. 본 개시내용의 범위는 상기 설명으로 제한되는 것으로 의도되지 않고, 오히려 첨부된 청구범위에 제시된 바와 같다.

명세서에서 그리고 청구범위에서 여기서 사용된 바와 같은 단수 표현은, 반대로 명확히 표시되지 않는다면, "적어도 하나"를 의미하는 것으로 이해되어야 한다.

명세서에서 그리고 청구범위에서 여기서 사용된 바와 같은 어구 "및/또는"는, 그렇게 결합된 요소들, 즉, 몇몇 경우에서 결합하여 존재하며 다른 경우에서 분리적으로 존재하는 요소들 중 "어느 하나 또는 둘 다"를 의미하는 것으로 이해되어야 한다. "및/또는"과 함께 나열된 다수의 요소는, 동일한 방식으로, 즉, 그렇게 결합된 요소들 중 "하나 이상"으로 해석되어야 한다. 다른 요소는, 구체적으로 식별된 이들 요소와 관련되었는지 또는 관련되지 않았는지에 관계없이, "및/또는" 절에 의해 구체적으로 식별된 요소들이 아닌 다른 요소들로 선택적으로 존재할 수 있다. 따라서, 비제한적인 예로서, "A 및/또는 B"에 대한 언급은, "포함하는"과 같은 제약을 두지 않은 언어와 함께 사용될 때, 일 실시형태에서, A만을(선택적으로 B가 아닌 요소들을 포함); 다른 실시형태에서, B만을(선택적으로 A가 아닌 요소들을 포함); 또 다른 실시형태에서, A 및 B 둘 다를(선택적으로 다른 요소들을 포함) 등을 지칭할 수 있다.

명세서에서 그리고 청구범위에서 여기서 사용된 바와 같이, "또는"은 위에서 정의된 바와 같은 "및/또는"과 동일한 의미를 갖는 것으로 이해되어야 한다. 예를 들어, 일람에서 품목들을 분리할 때, "또는" 또는 "및/또는"은 포괄적인 것으로, 즉, 다수의 또는 목록의 요소들 중 하나 초과를 포함하는 적어도 하나 및 선택적으로 부가적인 나열되지 않은 품목들의 포함인 것으로 해석될 것이다. "~ 중 단지 하나" 또는 " ~ 중 정확하게 하나", 또는 청구항에서 사용될 때, "~로 이루어진"과 같은 대조적으로 명확하게 표시된 용어들은 단지 다수의 또는 일람의 요소들 중 정확하게 하나의 요소의 포함을 지칭할 것이다. 일반적으로, 본 명세서에서 사용되는 바와 같은 용어 "또는"은 "어느 하나", "중 하나", "중 단지 하나" 또는 "중 정확히 하나"와 같은 독점성 용어가 선행하는 경우 배타적 대안(즉, "하나 또는 다른 하나 그러나 둘 다는 아님")을 나타내는 것으로만 해석되어야 한다. 청구범위에서 사용될 때, "로 본질적으로 이루어진"은 특허법 분야에서 사용되는 바와 같은 그의 일반적인 의미를 가질 것이다.

명세서에서 그리고 청구범위에서 여기서 사용된 바와 같이, 하나 이상의 요소의 일람과 관련하여 어구 "적어도 하나"는 요소들의 일람에서 요소들 중 임의의 하나 이상으로부터 선택된 적어도 하나의 요소를 의미하지만, 반드시 요소들의 일람 내에 구체적으로 나열된 모든 각각의 요소 중 적어도 하나를 포함하지는 않으며 요소들의 일람에서 요소들의 임의의 조합들을 배제하는 것은 아니라는 것이 이해되어야 한다. 이 정의는 또한, 구체적으로 식별된 이들 요소와 관련되는지 또는 관련되지 않는지에 관계없이, 어구 "적어도 하나"가 지칭하는 요소들의 일람 내에서 구체적으로 식별된 요소들 이외의 것으로 선택적으로 존재할 수 있음을 허용한다. 따라서, 비제한적인 예로서, "A 및 B 중 적어도 하나"(또는 동등하게, "A 또는 B 중 적어도 하나" 또는 동등하게 "A 및/또는 B 중 적어도 하나")는, 일 실시형태에서, 선택적으로, B가 존재하지 않고, 하나 초과의 A를 포함(및 선택적으로 B 이외의 요소들을 포함)하는, 적어도 하나를; 또 다른 실시형태에서, 선택적으로, A가 존재하지 않고, 하나 초과의 B를 포함(및 선택적으로 A 이이의 요소들을 포함)하는, 적어도 하나를; 또 다른 실시형태에서, 선택적으로 하나 초과의 A를 포함하는 적어도 하나, 및 선택적으로 하나 초과의 B를 포함하는 적어도 하나(및 선택적으로 다른 요소들을 포함) 등을 지칭할 수 있다.

또한, 명백히 반대로 표시되지 않는 한, 하나 초과의 단계 또는 행위를 포함하는 본 명세서에 청구된 임의의 방법에서, 방법의 단계 또는 행위의 순서는 반드시 방법의 단계 또는 행위가 언급된 순서로 제한되지 않는다는 것을 이해해야 한다.

상기 명세서에서뿐만 아니라 청구범위에서, "포함하는", "포함시키는", "운반하는", "갖는", "함유하는", "수반하는", "유지하는", "~로 구성된" 등과 같은 모든 전환어구는, 제약을 두지 않는 것으로, 즉, 포함하지만, 이들로 제한되지 않는을 의미하는 것으로 이해되어야 한다. 단지 전환어구 "로 이루어진" 및 "로 본질적으로 이루어진"은, 미국 특허청 특허 심사 절차 매뉴얼, 섹션 2111.03에서 제시된 바와 같이, 각각 폐쇄형 또는 반폐쇄형 전환어구일 것이다. 개방형 전환 어구(예컨대, "포함하는")를 사용하여 이 문서에 기재된 실시형태는, 대안적인 실시형태에서, 개방형 전환 어구로 설명된 특징"으로 이루어진" 및 "으로 본질적으로 이루어진"으로도 고려된다는 것을 이해해야 한다. 예를 들어, 개시내용이 "A 및 B를 포함하는 조성물"을 기재하는 경우, 개시내용은 또한 대안적인 실시형태 "A 및 B로 이루어진 조성물" 및 "A 및 B로 본질적으로 이루어진 조성물"을 고려한다.

또한, 본 개시내용은 열거된 청구항 중 하나 이상으로부터의 하나 이상의 제한, 요소, 절 및 설명 용어가 다른 청구항에 도입되는 모든 변형, 조합 및 순열을 포함한다. 예를 들어, 또 다른 청구항에 종속된 임의의 청구항은 동일한 기본 청구항에 종속하는 임의의 다른 청구항에서 발견되는 하나 이상의 제한을 포함하도록 변형될 수 있다. 요소가 예컨대 마쿠시 그룹 형식으로 일람으로서 제시되는 경우, 요소들의 각 하위그룹이 또한 개시되고, 임의의 요소(들)가 그룹으로부터 제거될 수 있다. 일반적으로, 본 개시내용 또는 본 개시내용의 양상이 특정 요소 및/또는 특징을 포함하는 것으로 언급되는 경우, 본 개시내용의 소정의 실시형태 또는 본 개시내용의 양상은 이러한 요소 및/또는 특징으로 이루어지거나 또는 본질적으로 이루어지는 것이 이해되어야 한다. 단순화를 위하여, 이들 실시형태는 본 명세서에서 이들 단어에 구체적으로 제시되어 있지 않다. 또한, 용어 "포함하는" 및 "함유하는"이 개방인 것으로 의도되고, 추가의 요소 또는 단계의 포함을 허용하는 것에 주목한다. 범위가 주어지는 경우, 종점이 포함된다. 또한, 달리 표시되지 않는 한 또는 달리 문맥 및 당업자의 이해로부터 명백하지 않는 한, 범위로서 표현된 값은, 문맥이 달리 명확히 기술하지 않는 한, 본 개시내용의 상이한 실시형태에서의 기술된 범위 내의 임의의 특정한 값 또는 하위범위를 범위의 하한의 단위의 1/10까지 취할 수 있다.

본 출원은 다양한 발행된 특허, 공개된 특허 출원, 저널 기사 및 기타 간행물을 지칭하며, 이들은 모두 참조에 의해 본 명세서에 원용된다. 본 명세서에 개시된 모든 참조문헌, 특허 및 특허 출원은, 각각이 인용된 주제와 관련하여 참조에 의해 원용되며, 일부 경우에는 문서 전체를 포함할 수 있다. 원용된 문헌 중 임의의 것과 본 명세서 간에 상충이 있는 경우, 본 명세서가 통제할 것이다. 또한, 종래 기술 내에 들어가는 본 개시내용의 임의의 특정 실시형태는 임의의 하나 이상의 청구항으로부터 명확히 배제될 수 있는 것으로 이해되어야 한다. 이러한 실시형태가 당업자에게 공지된 것으로 간주되므로, 이들은 배제가 본 명세서에 명확히 제시되지 않더라도 배제될 수 있다. 본 개시내용의 임의의 특정 실시형태는, 종래 기술의 존재와 관련되는지의 여부와 상관없이, 임의의 이유로, 임의의 청구항으로부터 배제될 수 있다.

당업자라면 단지 일상적인 실험에 불과한 것을 사용하여 본 명세서에 기재된 특정 실시형태에 대한 많은 등가물을 인식할 것이거나 확인할 것이다. 본 명세서에 기재된 본 실시형태의 범위는 상기 설명으로 제한되는 것으로 의도되지 않고, 오히려 첨부된 청구범위에 제시된 바와 같다. 당업자라면, 하기 청구범위에 정의된 바와 같이, 본 개시내용의 정신 또는 범위로부터 벗어나는 일 없이 이 설명에 대한 다양한 변화와 변형이 이루어질 수 있음을 이해할 것이다.

SEQUENCE LISTING <110> Conagen Inc. <120> D-ALLULOSE 3-EPIMERASES FOR BIOCONVERSION OF D-FRUCTOSE TO D-ALLULOSE <130> WO 2021231488 <140> PCT/US2021/031859 <141> 2021-05-11 <150> US 63/022,617 <151> 2020-05-11 <160> 44 <170> PatentIn version 3.5 <210> 1 <211> 283 <212> PRT <213> Unknown <220> <223> Meiothermus silvanus <400> 1 Met Pro Arg Phe Gly Ala His Ala Phe Ile Trp Ala Ala Glu Trp Asn 1 5 10 15 Pro Glu Ala Ala Glu Lys Val Ile Gln Gly Ala Thr Arg Val Gly Leu 20 25 30 Asp Phe Val Glu Ile Pro Leu Leu His Pro Glu Ser Phe Asp Val Glu 35 40 45 Leu Thr Arg Arg Leu Leu Asn Gly Tyr Gly Val Gly Cys Thr Cys Ser 50 55 60 Leu Gly Leu Pro Arg Glu Ala Ser Leu Pro Glu His Pro Glu Ala Ala 65 70 75 80 Thr Arg Phe Leu Ile Gln Ala Leu Asn Val Ala His Gln Ile Gly Ser 85 90 95 Glu Val Leu Thr Gly Val Thr Tyr Ala Thr Leu Gly Thr Leu Ser Gly 100 105 110 Arg Ala Pro Arg Glu Ala Asp Tyr Gln Ala Val Val Lys Ala Leu Lys 115 120 125 Pro Ala Ala Arg His Ala Ala Ala Leu Gly Met Arg Leu Gly Ile Glu 130 135 140 Pro Val Asn Arg Tyr Glu Thr Tyr Leu Ile Asn Leu Ala Ala Gln Gly 145 150 155 160 Leu Glu Leu Ile Arg Arg Leu Asp Glu Pro Asn Val Phe Leu His Leu 165 170 175 Asp Thr Tyr His Met Asn Ile Glu Glu Lys Gly Phe Arg Gly Pro Ile 180 185 190 Val Glu Ala Gly Ala His Leu Gly Tyr Ile His Leu Ser Glu Ser Asp 195 200 205 Arg Gly Thr Pro Gly Thr Gly Asn Val His Trp Asp Ala Val Phe Ala 210 215 220 Gly Leu Arg Glu Ile Gly Phe Ser Gly Asp Leu Val Met Glu Ser Phe 225 230 235 240 Val Ala Leu Asn Pro Asp Ile Ala Arg Ala Thr Cys Met Trp Arg Asp 245 250 255 Val Val Gly Asp Pro Gln Ala Leu Val Gln Glu Gly Leu Ala Phe Leu 260 265 270 Arg Gly Lys Ala Ser Glu Tyr Gly Leu Leu Gly 275 280 <210> 2 <211> 852 <212> DNA <213> Unknown <220> <223> Meiothermus silvanus <400> 2 atgccacgct tcggagctca tgcgttcatt tgggccgctg agtggaaccc ggaagcggca 60 gagaaagtga ttcagggtgc aacccgtgtt ggcctcgact tcgttgaaat tccgctcttg 120 cacccggaat ccttcgatgt cgagctcaca cgtcgtttac taaacgggta cggcgtcggt 180 tgtacgtgtt ctctgggctt gccgcgtgaa gcgtccctgc cggagcaccc cgaagccgcg 240 actcgttttc tgattcaggc cctgaatgtt gcacatcaga ttggctcaga ggtgctgacc 300 ggggtaacct acgcgacttt aggcacttta tctggccggg cgccgcgcga agctgattat 360 caagcagtcg taaaagcact gaaaccggcg gctagacatg cagcagcact gggtatgcgc 420 ctcggcattg aacccgttaa tcgttatgaa acttatttaa ttaacctggc cgctcagggc 480 ctggagttaa tccgtcgtct ggacgaaccg aatgtgttcc tgcacctgga tacgtaccac 540 atgaatattg aagagaaagg tttccggggc ccgatcgtgg aagcgggcgc ccacctgggg 600 tatattcatc tgagcgagag tgatcgcggc acccctggaa cgggcaacgt ccattgggac 660 gcggtgttcg cggggctgcg tgaaattggc ttctcaggcg atttggtcat ggaaagcttc 720 gtcgcactga accctgatat tgcgcgcgct acatgcatgt ggcgggacgt cgttggcgat 780 ccccaggcgc tggtccagga aggcttagca tttctccgtg gcaaggctag cgagtatggc 840 ctactcggtt aa 852 <210> 3 <211> 282 <212> PRT <213> Unknown <220> <223> hydrothermal vent metagenome <400> 3 Met Glu Gly Phe Gly Val His Thr Ser Met Trp Thr Met Ser Trp Asp 1 5 10 15 Lys Lys Gly Ala Glu Tyr Ala Val Ser Gln Ala Val Arg Tyr Gln Met 20 25 30 Asp Phe Leu Glu Ile Ala Leu Leu Ser Pro Leu Asp Val Asp Ala Gln 35 40 45 His Ser Arg Arg Leu Leu Glu Lys Asn His Met Arg Ala Ile Cys Ser 50 55 60 Leu Gly Leu Pro Glu Gly Ala Trp Leu Ser Asn Asn Pro Gln Ala Gly 65 70 75 80 Val Glu Tyr Leu Lys Ile Ala Leu Glu Lys Thr Ala Glu Met Gly Cys 85 90 95 Glu Ala Leu Ser Gly Val Ile Tyr Gly Gly Ile Gly Glu Arg Thr Gly 100 105 110 Phe Pro Pro Thr Glu Lys Glu Leu Asp Asn Val Val Arg Ala Leu Gly 115 120 125 Glu Ala Ala Ser Tyr Ala Lys Ser Leu Gly Leu Leu Leu Gly Ile Glu 130 135 140 Pro Val Asn Arg Tyr Glu Ser His Leu Ile Asn Thr Gly Arg Gln Ser 145 150 155 160 Val Glu Met Ile Glu Lys Val Gly Ala Ser Asn Met Phe Val His Leu 165 170 175 Asp Thr Tyr His Met Asn Ile Glu Glu Lys Gly Val Ala Gln Gly Ile 180 185 190 Leu Asp Ala Arg Glu His Ile Lys Tyr Ile His Leu Ser Glu Ser Asp 195 200 205 Arg Gly Thr Pro Gly Ala Gly Thr Cys Asp Trp Asp Glu Ile Phe Ala 210 215 220 Val Leu Ala Ala Ile Asn Phe Lys Gly Gly Leu Ala Met Glu Ser Phe 225 230 235 240 Val Asn Met Pro Pro Glu Ile Ala Tyr Gly Leu Ser Ile Trp Arg Pro 245 250 255 Val Ala Lys Ser Ala Asp Glu Val Met Glu Asn Gly Leu Pro Phe Leu 260 265 270 Arg Asn Lys Ala Arg Gln Tyr Gln Leu Leu 275 280 <210> 4 <211> 849 <212> DNA <213> Unknown <220> <223> hydrothermal vent metagenome <400> 4 atggaaggtt ttggagtgca cacgagcatg tggactatga gttgggataa gaagggtgcg 60 gagtatgctg taagccaggc ggtgcgctat cagatggatt ttcttgaaat cgctctgctg 120 agtccactgg atgtcgatgc ccagcatagt cgccgtctgc tagagaagaa ccacatgcgc 180 gcgatttgca gccttgggtt accggaaggt gcgtggctca gtaataaccc tcaggccgga 240 gtggaatacc tgaagatcgc cctggaaaag actgcggaga tgggttgcga agcgctgtcc 300 ggcgtaatct acggcggcat tggcgaaaga acaggttttc cgccgacgga gaaagagctg 360 gacaatgtcg tgcgcgcgct gggtgaagcg gcatcttacg caaaatcgtt aggccttctg 420 ctcggtattg aaccggtgaa ccggtatgag tctcatctga ttaatacggg acgtcagagt 480 gtggaaatga ttgaaaaggt cggtgcctct aacatgtttg ttcaccttga cacataccac 540 atgaatattg aagaaaaggg tgtggcacaa gggattctgg acgcgcgcga acacataaaa 600 tatatccacc tgtcagagtc tgaccgaggg actccgggcg caggcacgtg tgactgggat 660 gagattttcg cagtcctggc cgcaattaac tttaaaggcg gcttagcgat ggaatcgttc 720 gtgaacatgc cgccggaaat tgcctatggt ctgtccattt ggcgtccggt ggctaaatcg 780 gctgatgaag tcatggaaaa cggcctgccg tttctacgca acaaagcgcg ccagtatcag 840 ctgctgtaa 849 <210> 5 <211> 289 <212> PRT <213> Unknown <220> <223> Thermoclostridium caenicola <400> 5 Met Lys Tyr Gly Ile Phe Tyr Ala Tyr Trp Glu Lys Glu Trp Lys Gly 1 5 10 15 Asp Phe Ile Thr Tyr Ile Glu Lys Val Lys Lys Leu Gly Phe Asp Ile 20 25 30 Leu Glu Val Gly Cys Gly Asp Phe His Lys Gln Pro Asp Ser Tyr Phe 35 40 45 His Thr Leu Arg Asp Ala Ala Arg Glu Tyr Asp Ile Ile Leu Thr Gly 50 55 60 Gly Tyr Gly Pro Arg Ala Glu His Asn Leu Cys Ser Pro Asp Thr Ala 65 70 75 80 Val Val Glu Asn Ala Leu Ala Phe Tyr Ser Asp Ile Phe Arg Lys Met 85 90 95 Glu Ile Ala Gly Ile Arg Ser Ile Gly Gly Gly Leu Tyr Ala Tyr Trp 100 105 110 Pro Val Asp Tyr Ser Arg Glu Pro Asp Lys Ala Gly Asp Leu Glu Arg 115 120 125 Ser Ile Lys Asn Met Arg Arg Leu Ala Asp Ile Ala Glu Arg His Gly 130 135 140 Ile Thr Leu Asn Met Glu Val Leu Asn Arg Phe Glu Gly Tyr Leu Ile 145 150 155 160 Asn Asp Thr Asn Glu Gly Leu Ala Tyr Ile Arg Ala Val Asp Lys Pro 165 170 175 Asn Val Lys Leu Met Leu Asp Thr Phe His Met Asn Ile Glu Glu Asp 180 185 190 Ser Phe Thr Glu Pro Ile Leu Gln Ala Gly Lys Tyr Leu Gly His Val 195 200 205 His Val Gly Glu Pro Asn Arg Lys Pro Pro Arg Glu Gly Arg Ile Pro 210 215 220 Trp Gly Glu Ile Gly Lys Ala Leu Arg Gln Ile Gly Tyr Asp Gly Pro 225 230 235 240 Val Val Met Glu Pro Phe Val Thr Met Gly Gly Gln Val Gly Lys Asp 245 250 255 Ile Cys Val Trp Arg Asp Leu Ser Gln Gly Ala Thr Glu Glu Asp Leu 260 265 270 Asp Arg Asp Ala Glu Lys Ser Leu Ala Phe Leu Lys Gly Met Phe Glu 275 280 285 Ala <210> 6 <211> 870 <212> PRT <213> Unknown <220> <223> Thermoclostridium caenicola <400> 6 Ala Thr Gly Ala Ala Ala Thr Ala Thr Gly Gly Thr Ala Thr Ala Thr 1 5 10 15 Thr Thr Thr Ala Cys Gly Cys Ala Thr Ala Thr Thr Gly Gly Gly Ala 20 25 30 Gly Ala Ala Ala Gly Ala Ala Thr Gly Gly Ala Ala Ala Gly Gly Cys 35 40 45 Gly Ala Cys Thr Thr Thr Ala Thr Cys Ala Cys Ala Thr Ala Cys Ala 50 55 60 Thr Thr Gly Ala Gly Ala Ala Ala Gly Thr Thr Ala Ala Gly Ala Ala 65 70 75 80 Ala Thr Thr Ala Gly Gly Cys Thr Thr Thr Gly Ala Cys Ala Thr Thr 85 90 95 Thr Thr Gly Gly Ala Ala Gly Thr Cys Gly Gly Cys Thr Gly Cys Gly 100 105 110 Gly Thr Gly Ala Thr Thr Thr Thr Cys Ala Thr Ala Ala Ala Cys Ala 115 120 125 Gly Cys Cys Gly Gly Ala Thr Thr Cys Ala Thr Ala Cys Thr Thr Cys 130 135 140 Cys Ala Cys Ala Cys Cys Cys Thr Gly Cys Gly Thr Gly Ala Thr Gly 145 150 155 160 Cys Cys Gly Cys Thr Cys Gly Cys Gly Ala Ala Thr Ala Cys Gly Ala 165 170 175 Cys Ala Thr Thr Ala Thr Thr Cys Thr Gly Ala Cys Cys Gly Gly Cys 180 185 190 Gly Gly Cys Thr Ala Thr Gly Gly Gly Cys Cys Gly Cys Gly Cys Gly 195 200 205 Cys Cys Gly Ala Ala Cys Ala Cys Ala Ala Cys Thr Thr Gly Thr Gly 210 215 220 Thr Ala Gly Cys Cys Cys Gly Gly Ala Thr Ala Cys Ala Gly Cys Gly 225 230 235 240 Gly Thr Cys Gly Thr Thr Gly Ala Ala Ala Ala Thr Gly Cys Cys Cys 245 250 255 Thr Gly Gly Cys Ala Thr Thr Thr Thr Ala Cys Thr Cys Cys Gly Ala 260 265 270 Thr Ala Thr Ala Thr Thr Thr Cys Gly Cys Ala Ala Ala Ala Thr Gly 275 280 285 Gly Ala Ala Ala Thr Thr Gly Cys Cys Gly Gly Cys Ala Thr Cys Cys 290 295 300 Gly Thr Thr Cys Gly Ala Thr Cys Gly Gly Cys Gly Gly Cys Gly Gly 305 310 315 320 Thr Cys Thr Ala Thr Ala Thr Gly Cys Gly Thr Ala Thr Thr Gly Gly 325 330 335 Cys Cys Ala Gly Thr Thr Gly Ala Thr Thr Ala Cys Ala Gly Cys Cys 340 345 350 Gly Thr Gly Ala Ala Cys Cys Cys Gly Ala Cys Ala Ala Ala Gly Cys 355 360 365 Cys Gly Gly Cys Gly Ala Thr Thr Thr Ala Gly Ala Ala Cys Gly Thr 370 375 380 Thr Cys Cys Ala Thr Thr Ala Ala Gly Ala Ala Cys Ala Thr Gly Cys 385 390 395 400 Gly Thr Cys Gly Cys Thr Thr Ala Gly Cys Cys Gly Ala Thr Ala Thr 405 410 415 Thr Gly Cys Gly Gly Ala Ala Cys Gly Gly Cys Ala Thr Gly Gly Thr 420 425 430 Ala Thr Cys Ala Cys Gly Cys Thr Gly Ala Ala Thr Ala Thr Gly Gly 435 440 445 Ala Ala Gly Thr Gly Cys Thr Cys Ala Ala Thr Cys Gly Cys Thr Thr 450 455 460 Cys Gly Ala Ala Gly Gly Thr Thr Ala Cys Cys Thr Thr Ala Thr Thr 465 470 475 480 Ala Ala Thr Gly Ala Thr Ala Cys Cys Ala Ala Thr Gly Ala Ala Gly 485 490 495 Gly Thr Cys Thr Gly Gly Cys Cys Thr Ala Cys Ala Thr Thr Cys Gly 500 505 510 Thr Gly Cys Cys Gly Thr Cys Gly Ala Thr Ala Ala Ala Cys Cys Cys 515 520 525 Ala Ala Cys Gly Thr Ala Ala Ala Gly Thr Thr Gly Ala Thr Gly Cys 530 535 540 Thr Gly Gly Ala Thr Ala Cys Ala Thr Thr Thr Cys Ala Cys Ala Thr 545 550 555 560 Gly Ala Ala Cys Ala Thr Thr Gly Ala Gly Gly Ala Ala Gly Ala Thr 565 570 575 Ala Gly Cys Thr Thr Thr Ala Cys Cys Gly Ala Ala Cys Cys Cys Ala 580 585 590 Thr Thr Cys Thr Cys Cys Ala Gly Gly Cys Thr Gly Gly Thr Ala Ala 595 600 605 Gly Thr Ala Cys Cys Thr Gly Gly Gly Cys Cys Ala Thr Gly Thr Ala 610 615 620 Cys Ala Thr Gly Thr Cys Gly Gly Cys Gly Ala Ala Cys Cys Ala Ala 625 630 635 640 Ala Thr Cys Gly Thr Ala Ala Ala Cys Cys Ala Cys Cys Ala Cys Gly 645 650 655 Gly Gly Ala Ala Gly Gly Thr Cys Gly Thr Ala Thr Thr Cys Cys Gly 660 665 670 Thr Gly Gly Gly Gly Cys Gly Ala Gly Ala Thr Thr Gly Gly Cys Ala 675 680 685 Ala Ala Gly Cys Gly Cys Thr Gly Cys Gly Cys Cys Ala Gly Ala Thr 690 695 700 Thr Gly Gly Gly Thr Ala Cys Gly Ala Cys Gly Gly Thr Cys Cys Cys 705 710 715 720 Gly Thr Gly Gly Thr Gly Ala Thr Gly Gly Ala Ala Cys Cys Gly Thr 725 730 735 Thr Thr Gly Thr Thr Ala Cys Cys Ala Thr Gly Gly Gly Cys Gly Gly 740 745 750 Cys Cys Ala Ala Gly Thr Gly Gly Gly Gly Ala Ala Ala Gly Ala Cys 755 760 765 Ala Thr Thr Thr Gly Thr Gly Thr Gly Thr Gly Gly Cys Gly Gly Gly 770 775 780 Ala Cys Cys Thr Thr Ala Gly Cys Cys Ala Ala Gly Gly Thr Gly Cys 785 790 795 800 Gly Ala Cys Cys Gly Ala Ala Gly Ala Ala Gly Ala Thr Cys Thr Gly 805 810 815 Gly Ala Thr Cys Gly Cys Gly Ala Thr Gly Cys Thr Gly Ala Gly Ala 820 825 830 Ala Ala Ala Gly Cys Cys Thr Gly Gly Cys Cys Thr Thr Thr Cys Thr 835 840 845 Gly Ala Ala Ala Gly Gly Ala Ala Thr Gly Thr Thr Thr Gly Ala Ala 850 855 860 Gly Cys Cys Thr Ala Ala 865 870 <210> 7 <211> 290 <212> PRT <213> Unknown <220> <223> hydrothermal vent metagenome <400> 7 Met Asn Leu Pro Ala Lys Lys Met Val Leu Gly Val His Thr Phe Ala 1 5 10 15 Val Ala Pro Phe Trp Asp Leu Glu Val Met Arg His Glu Ala Arg Arg 20 25 30 Leu Lys Ser His Gly Val Gly Leu Leu Glu Ile Pro Leu Leu Arg Pro 35 40 45 Glu Glu Ile Asn Ile Lys Ala Thr Arg Ala Phe Ala Arg Glu Phe Gly 50 55 60 Phe Glu Leu Val Thr Ser Leu Gly Leu Pro Ser Asn Ile Asp Ala Val 65 70 75 80 Glu Asp Pro Gln Ser Ala Leu Ala Phe Leu Glu Pro Ala Phe Lys Val 85 90 95 Ala Ala Glu Ile Gly Ser Asn Met Leu Ser Gly Val Thr Tyr Ala Pro 100 105 110 Ile Gly Lys Ile Ser Gly Gln Pro Val Thr Gln Arg Glu Lys Asp Gly 115 120 125 Ile Cys Arg Phe Leu Gln Gln Ala Ala Ala Leu Ala Ala Asn His Gly 130 135 140 Leu Lys Leu Gly Val Glu Pro Cys Asn Arg Tyr Glu Thr His Leu Met 145 150 155 160 Asn Thr Ala Ala Gln Ala Val Glu Tyr Val Glu Ala Val Ala Ala Glu 165 170 175 Asn Leu Phe Ile His Leu Asp Thr Tyr His Met Asn Ile Glu Glu Glu 180 185 190 Ser Phe Ala Ala Gly Phe Ala Lys Ala Ala Pro Tyr Leu Gly Tyr Val 195 200 205 His Leu Ser Glu Ser Asn Arg Gly Val Pro Gly Arg Ala Met Ile Asn 210 215 220 Trp Asp Ala Val Met Gly Ala Leu Ala Asp Ile Gly Tyr His Gly Ala 225 230 235 240 Leu Thr Leu Glu Ser Met Asn Tyr Val Asp Pro Asp Ile Ala Thr Ala 245 250 255 Leu Ala Val Trp Arg Pro Val Ala Lys Asn Pro Asp Asp Val Ile Asp 260 265 270 Phe Gly Leu Ala Phe Leu Leu Lys Ala Ala Ala Asp Ala Gly Leu Thr 275 280 285 Phe Gly 290 <210> 8 <211> 873 <212> DNA <213> Unknown <220> <223> hydrothermal vent metagenome <400> 8 atgaacctgc cggctaagaa gatggtcctg ggagtccata cgttcgcagt cgccccgttt 60 tgggatcttg aagtaatgcg ccacgaggcc cgccgtttaa agagccatgg cgtagggtta 120 ttggaaatcc cacttctccg gccagaagaa attaatatta aagcgacccg cgcatttgct 180 cgtgaatttg ggtttgaatt agtgaccagt ttaggcctgc cttcgaatat cgacgctgta 240 gaagatccgc agtctgcttt agcctttctg gaaccggcgt tcaaagtggc tgctgaaatt 300 ggtagcaata tgctttcagg cgttacctat gctccgattg gaaagataag tggtcagccg 360 gtgacccagc gtgagaagga tggtatttgt cggttcctac aacaagcggc tgcgttggcc 420 gcgaaccatg ggttgaaact gggcgtagag ccttgtaatc gctatgaaac gcatctgatg 480 aacacagcag cccaagcagt tgaatacgtt gaggctgtgg cagcggaaaa ccttttcatc 540 cacttagata cctaccacat gaacatcgaa gaagaaagtt ttgcagcagg gtttgcgaaa 600 gcggcgcctt atctggggta cgtgcatctg agcgagagca atcgcggcgt accgggccgc 660 gccatgatca attgggatgc agtgatgggt gcccttgccg acatcgggta tcatggggca 720 ctgactctgg agtctatgaa ttatgtggat ccggatattg cgactgccct tgcggtctgg 780 cgtccggttg ccaagaaccc ggacgatgtg atagactttg gcctggcgtt tctgctgaag 840 gccgcagcgg atgcgggttt gacattcggt taa 873 <210> 9 <211> 282 <212> PRT <213> Unknown <220> <223> Meiothermus granaticius <400> 9 Met Ala Arg Phe Gly Ala His Ala Phe Ile Trp Ser Ala Asp Trp Thr 1 5 10 15 Pro Gln Ala Ala Glu Lys Val Ala Ala Gly Ala Ala Ala Ala Gly Leu 20 25 30 Asp Phe Val Glu Ile Pro Leu Leu Arg Pro Glu Ala Phe Asp Ser Thr 35 40 45 Leu Thr Arg Arg Leu Leu Glu His His Gly Leu Gly Cys Thr Cys Ser 50 55 60 Leu Gly Leu Pro Thr Glu Ala Ala Leu Pro Asp His Pro Gln Ala Ala 65 70 75 80 Ala Arg Phe Leu Ile Gln Ala Leu Asp Val Ala His Gln Met Gly Ser 85 90 95 Pro Val Leu Ser Gly Val Thr Tyr Ala Thr Leu Gly Ala Leu Ser Gly 100 105 110 Arg Pro Pro Thr Glu Ala Asp Tyr Glu Thr Leu Ala Lys Thr Leu Lys 115 120 125 Pro Val Ala Gln His Ala Ala Arg Leu Gly Met Arg Leu Gly Leu Glu 130 135 140 Pro Val Asn Arg Tyr Glu Thr Tyr Leu Ile Asn Leu Gly Ser Gln Ala 145 150 155 160 Leu Asp Leu Ile Gln Arg Ile Gly Glu Pro Asn Val Phe Val His Leu 165 170 175 Asp Thr Tyr His Met Asn Ile Glu Glu Lys Gly Phe Lys Asn Pro Ile 180 185 190 Val Thr Val Gly Lys His Leu Gly Tyr Ile His Leu Ser Glu Ser Asp 195 200 205 Arg Gly Thr Pro Gly Ser Gly Asn Val His Trp Asp Glu Val Phe Ser 210 215 220 Gly Leu Gln Ala Ile Gly Phe Gln Gly Asp Leu Val Met Glu Ser Phe 225 230 235 240 Val Ala Leu Asn Pro Asp Ile Ala Arg Ala Thr Cys Met Trp Arg Asp 245 250 255 Val Val Gly Asp Pro Lys Thr Leu Val His Asp Gly Leu Ala Phe Leu 260 265 270 Arg Gly Lys Ala Arg Glu Tyr Gly Leu Leu 275 280 <210> 10 <211> 849 <212> DNA <213> Unknown <220> <223> Meiothermus granaticius <400> 10 atggcgcgct ttggtgcgca tgcttttatt tggagtgctg attggacccc tcaagccgcc 60 gaaaaggtcg cagcgggagc agcggcggcg ggactggatt ttgtcgaaat accgcttctt 120 cgtccagagg cgttcgattc gacacttacc cgtaggttat tagagcatca tggactggga 180 tgcacctgct ctctgggtct gcctaccgag gcagcactcc cggaccatcc tcaagcagca 240 gcccgttttc tcatccaggc cttggatgta gcccatcaaa tgggcagccc ggtcctgagt 300 ggggtcacct acgcaaccct gggcgcactg tcaggccgcc cgccgaccga ggccgattat 360 gaaaccctgg cgaaaacact gaagccagta gcgcagcacg ccgcccgcct gggtatgcga 420 ctcgggcttg aaccggttaa ccgctatgaa acatacctga taaacttagg gtcacaggcg 480 ctggatctca tccaacgtat cggcgaaccg aacgtgttcg tacacctgga tacttatcac 540 atgaacatcg aagagaaagg ttttaagaac ccgattgtta ccgtcggtaa acatcttggt 600 tatattcacc tgtctgaaag cgaccgtggt accccaggta gcggtaatgt gcattgggat 660 gaagtgttct ccggcctgca agcaatcggt tttcagggtg accttgtgat ggagtcgttt 720 gtggcactga atccggatat tgcccgcgcc acgtgcatgt ggcgggatgt tgtgggagat 780 ccgaaaacac tggtgcatga tggcctagct ttcctgcgcg gtaaagctcg cgaatacgga 840 ctgctgtaa 849 <210> 11 <211> 283 <212> PRT <213> Unknown <220> <223> Rubellimicrobium thermophilum <400> 11 Met Gln Gly Phe Gly Val His Thr Ser Met Trp Thr Met His Trp Asp 1 5 10 15 Arg Ala Gly Ala Glu Arg Thr Ile Pro Ala Ala Ala Ala Tyr Lys Met 20 25 30 Asp Phe Ile Glu Ile Ala Leu Leu Asp Thr Ala Ile Val Asp Ala Ala 35 40 45 His Thr Arg Ala Leu Leu Glu Lys His Gly Leu Arg Ala Val Cys Ser 50 55 60 Leu Gly Leu Pro Glu Pro Val Trp Ala Ser Val Asn Pro Glu Gly Ala 65 70 75 80 Ile Ala His Leu Lys Arg Ala Leu Asp Lys Thr Ala Glu Met Gly Ala 85 90 95 Glu Ala Leu Ser Gly Val Thr Tyr Gly Gly Ile Gly Gln Arg Thr Gly 100 105 110 Val Pro Pro Thr Pro Gln Glu Tyr Asp Asn Ile Ala Arg Ala Leu Glu 115 120 125 Ala Ala Ala Lys His Ala Lys Ala Leu Gly Leu Ala Phe Gly Ile Glu 130 135 140 Pro Val Asn Arg Tyr Glu Asn His Leu Ile Asn Thr Gly Arg Gln Ala 145 150 155 160 Val Glu Met Ile Glu Lys Val Gly Ala Asp Asn Ile Phe Ile His Leu 165 170 175 Asp Thr Tyr His Met Asn Ile Glu Glu Lys Gly Val Ala Asn Gly Ile 180 185 190 Leu Asp Ala Arg Glu His Leu Arg Tyr Ile His Leu Ser Glu Ser Asp 195 200 205 Arg Gly Thr Pro Gly Glu Gly Thr Cys Asp Trp Asp Glu Ile Phe Ala 210 215 220 Ala Leu Ala Ala Ile Gly Phe Lys Gly Gly Leu Ala Met Glu Ser Phe 225 230 235 240 Ile Asn Met Pro Pro Gln Val Ala Tyr Gly Leu Ala Val Trp Arg Pro 245 250 255 Val Ala Glu Ser Phe Glu Glu Val Met Asp Arg Gly Leu Pro Phe Leu 260 265 270 Arg Asn Lys Ala Arg Gln Tyr Arg Leu Ile Ala 275 280 <210> 12 <211> 852 <212> DNA <213> Unknown <220> <223> Rubellimicrobium thermophilum <400> 12 atgcaaggtt tcggcgtaca cactagcatg tggacgatgc attgggatcg cgcgggcgcc 60 gagcgcacca ttccggccgc cgccgcctac aaaatggact ttatcgaaat tgcgctgctg 120 gatacagcta tagtcgatgc agcgcacacc cgtgcgctgc tggagaagca cggcctgcgt 180 gcagtttgtt cactcggatt accggagccg gtctgggcct ctgtgaaccc ggaaggggcc 240 attgctcacc tgaaacgcgc gctggacaag accgcagaga tgggagctga agctctgtct 300 ggtgtgactt acggcggtat cggccagcgc acaggcgtac caccaacgcc ccaagaatac 360 gataacattg cccgtgccct tgaagcagct gcgaaacatg ccaaagcctt aggcctggcc 420 tttggtatcg aaccggttaa caggtatgaa aaccatttga taaacaccgg acgtcaagct 480 gtagaaatga tcgaaaaggt cggggcagat aacattttca tacacctgga tacgtatcac 540 atgaatatcg aagagaaagg tgtggcaaac ggtatcctgg atgcccgaga acaccttcgt 600 tatattcacc tgtcagaaag cgatcgcggc actcctggcg aagggacgtg tgattgggac 660 gaaatcttcg ctgcgttggc cgccatcggt tttaaaggcg gccttgctat ggaatccttt 720 attaacatgc cgcctcaagt cgcttacggc ctggcggtgt ggcgtcctgt tgccgaatct 780 tttgaagaag tcatggaccg tggcctgccg tttctacgta acaaggctcg tcagtataga 840 ttgatcgctt aa 852 <210> 13 <211> 282 <212> PRT <213> Unknown <220> <223> Candidatus Thermofonsia Clade 1 bacterium <400> 13 Met Pro Thr Phe Gly Ala His Ala Phe Val Trp Ile Gly Asp Trp Thr 1 5 10 15 Thr Glu Ser Gly Asn Tyr Ala Ile Ala Gln Ala Gly Ala Leu Gly Phe 20 25 30 Asp Phe Ile Glu Ile Pro Leu Leu Ala Pro Gln Arg Phe Asp Ala Ala 35 40 45 Ser His Arg Gln Ala Leu Ala Gln Ala Gly Ile Gln Ala Thr Cys Ser 50 55 60 Leu Val Leu Pro Lys Gly Ala His Met Pro Arg Tyr Pro Glu Arg Ala 65 70 75 80 Arg Gln Phe Leu Tyr Glu Ala Leu Glu Lys Val Glu Ala Val Gly Ser 85 90 95 Gln Tyr Leu Gly Gly Cys Ile Ala Tyr Glu Leu Gly Tyr Leu Thr Gly 100 105 110 Gln Pro Pro Thr Pro Glu Glu Arg Gln Val Val Val Glu Val Leu Arg 115 120 125 Asp Val Ala Ala Glu Ala Arg Arg Arg Gly Ile Gln Leu Ala Leu Glu 130 135 140 Ala Cys Asn Arg Tyr Glu Thr Tyr Leu Tyr Asn Thr Leu Ala Asp Val 145 150 155 160 Arg Glu Thr Val Leu Ala Val Gly Ala Pro Asn Leu Lys Leu His Ala 165 170 175 Asp Thr Tyr His Met Asn Ile Glu Glu Glu Gly Phe Ala Gln Pro Leu 180 185 190 Ile Ala Cys Ala Asp Val Leu Asp Tyr Ile His Met Ser Glu Ser His 195 200 205 Arg Gly Leu Val Gly Ser Gly Asn Val Asn Trp Ala Gln Val Trp Gln 210 215 220 Ala Leu Ala Ala Ile Arg Phe Asn Gly Lys Leu Val Leu Glu Ser Phe 225 230 235 240 Ala Ala Ile Asn Pro Asp Leu Gln Ala Ala Thr Cys Leu Trp Arg Pro 245 250 255 Pro Asn Gln Pro Pro Glu Val Leu Ala Arg Glu Gly Leu Arg Phe Leu 260 265 270 Arg Glu Gly Ala Ala Gln Ala Gln Leu Pro 275 280 <210> 14 <211> 849 <212> DNA <213> Unknown <220> <223> Candidatus Thermofonsia Clade 1 bacterium <400> 14 atgccaacct tcggcgccca tgcatttgtg tggattggag attggacgac agaatcggga 60 aactatgcga tcgcgcaagc cggcgcactg ggcttcgact tcattgagat tccgcttttg 120 gcaccgcagc gttttgatgc cgcttcccac cgtcaagccc tggcgcaggc cggcattcag 180 gcgacgtgca gcctggtatt gccaaaaggc gctcacatgc ccaggtatcc agaacgtgcg 240 cgtcagttct tgtatgaagc gttagaaaag gtagaggcgg ttggaagtca atacttgggc 300 ggttgcatcg cgtacgaact tgggtatctt accggtcagc caccgacccc ggaagagcgt 360 caggttgttg tggaagtgct gcgcgatgta gccgcagaag cacgccgtcg cggcattcag 420 ttggcactgg aagcatgcaa tcgctatgag acttacctgt acaacacgct ggcggacgtg 480 cgcgaaacgg ttttagcggt gggcgcgcca aacttgaagc tgcatgcgga tacctaccac 540 atgaacatcg aagaagaagg ctttgcccag ccgcttattg cctgtgccga cgtgctggat 600 tatatccaca tgtcggaatc ccatcgcggc ctggtcggaa gcggcaacgt taattgggcg 660 caggtctggc aagcgctcgc cgcaattcgc ttcaatggca aactggtgct ggaatcgttt 720 gccgcgatta acccggacct tcaggccgct acttgtctgt ggcgcccgcc caaccagccg 780 ccggaagtgc tggcccgcga aggactgcga tttctccgag aaggtgcggc acaggcccaa 840 ctaccgtaa 849 <210> 15 <211> 282 <212> PRT <213> Unknown <220> <223> Deinococcus koreensis <400> 15 Met Leu Lys Phe Gly Ala His Ala Phe Cys Trp Glu Gly Asp Trp Thr 1 5 10 15 Asp Glu Ile Gly Asp Arg Val Ile Glu Gln Ala Ala Arg Ala Gly Leu 20 25 30 Asp Phe Ile Glu Ile Pro Leu Leu His Pro Glu Thr Phe Asp Ala Arg 35 40 45 Arg His Arg Arg His Leu Glu Ala Val Gly Leu Ala Cys Val Ser Ser 50 55 60 Leu Gly Leu Pro Arg Asp Ala His Met Pro His Glu Pro Glu Lys Ala 65 70 75 80 Val Thr Phe Leu Thr Gly Val Leu Asp Arg Met Glu Glu Leu Gly Ala 85 90 95 Arg Asp Leu Thr Gly Cys Thr Gly Tyr Ser Ile Gly Val Leu Thr Gly 100 105 110 Gln Gly Pro Thr Ser Gln Glu Leu Asp Arg Met Val Asp Gly Leu Ala 115 120 125 Arg Val Thr Glu Asp Ala Arg Ser Arg Gly Ile Gly Val Gly Leu Glu 130 135 140 Ala Ile Asn Arg Tyr Glu Thr Tyr Met Val Asn Thr Leu Asp Asp Ala 145 150 155 160 Leu Ala Val Val Asn Arg Val Gly Ser Asp Asn Leu Arg Val His Ala 165 170 175 Asp Thr Tyr His Met Asn Ile Glu Glu Thr Asn Leu Arg Glu Ala Leu 180 185 190 Gly Arg Val Lys Gly Lys Leu Asn Phe Ile His Met Ser Glu Ser His 195 200 205 Arg Gly Leu Val Gly Thr Gly Thr Val Pro Trp Glu Asp Val Trp Gln 210 215 220 Gly Leu Ala Asp Ile Glu Phe Ser Gly Tyr Leu Thr Leu Glu Ser Phe 225 230 235 240 Ala Ala Pro Asn Ala Glu Leu Ala Ala Ala Thr Cys Ile Trp Lys Pro 245 250 255 Pro Arg His Ser Gly Gln Glu Leu Ala Gln Gly Gly Leu Ala Phe Leu 260 265 270 Arg Glu Gly Ala Thr Arg His Gly Leu Met 275 280 <210> 16 <211> 849 <212> DNA <213> Unknown <220> <223> Deinococcus koreensis <400> 16 atgttgaagt tcggcgcgca cgccttttgc tgggaaggcg attggaccga tgaaattggc 60 gatcgcgtca tcgagcaagc ggcgcgggcc ggattggatt tcattgaaat cccgctcttg 120 caccctgaaa ccttcgatgc gcgccgtcat cgtcgccatc ttgaggctgt gggcctggcg 180 tgcgtttcca gcctgggcct tccgcgtgac gcccacatgc cacatgaacc ggagaaagcg 240 gtaacattcc ttaccggcgt actggatcgc atggaagaac tgggcgctcg cgaccttacc 300 ggttgtaccg gttatagcat tggcgtactg accggccagg gtccgacctc tcaagagctc 360 gatcgtatgg tggatggtct ggctcgtgtg actgaagatg cacggtcgcg cgggattggc 420 gtaggccttg aagccatcaa tcgttatgaa acttatatgg taaacacgct ggacgatgcg 480 ttagcggtcg tgaatcgtgt cgggagtgac aatcttcgcg ttcatgccga tacataccac 540 atgaacatag aagaaaccaa cctgcgtgag gcgcttgggc gagttaaggg taagctgaac 600 ttcattcaca tgagtgaaag tcatcgtggt ctggttggta ccgggacagt tccatgggaa 660 gatgtttggc agggtctggc ggatattgag ttcagcgggt atcttactct tgaatcgttt 720 gcagctccga atgccgagtt ggcggcagct acctgtatct ggaaaccacc acggcatagc 780 ggccaggaac tggcgcaggg tggcctagct tttctgcgcg agggcgcgac tcgccacggc 840 ttaatgtaa 849 <210> 17 <211> 281 <212> PRT <213> Unknown <220> <223> Olavius algarvensis spirochete endosymbiont <400> 17 Met Lys Phe Gly Ala His Ala Phe Val Trp Glu Pro Glu Trp Asn Asp 1 5 10 15 Thr Thr Ser Arg Arg Val Ile Ser Glu Ala Ala Arg Ile Gly Leu Asp 20 25 30 Phe Val Glu Ile Pro Leu Leu Arg Pro Glu Arg Phe Asp Gly Ala Ala 35 40 45 Thr Lys Val Leu Leu Asp Glu His Ala Val Gly Ala Thr Tyr Ser Leu 50 55 60 Gly Leu Pro Ser Asp Lys Ser Leu Pro Glu Arg Pro Tyr Leu Ala Glu 65 70 75 80 Pro Phe Leu Arg Ser Ala Ile Asp Ala Ile Glu Ser Ala Gly Gly Asp 85 90 95 Thr Leu Thr Gly Val Leu Tyr Gly Thr Leu Gly Glu Leu Pro Gly Arg 100 105 110 Pro Pro Asn Glu Lys Asp Tyr Lys Val Ile Ala Gln Val Leu Arg Ser 115 120 125 Val Ala Asp Tyr Ala Lys Asp Arg Gly Ile Lys Leu Gly Ile Glu Pro 130 135 140 Val Asn Arg Tyr Glu Thr Phe Leu Val Asn Thr Ala Glu Gln Ala Ile 145 150 155 160 Thr Leu Leu Asp Arg Ile Glu Ser Asp Asn Val Phe Ile His Leu Asp 165 170 175 Thr Tyr His Val Asn Ile Glu Glu Asp Ser Phe Gly Ala Ala Ile Arg 180 185 190 Leu Ala Gly Asp Arg Leu Gly Tyr Ile His Leu Ser Glu Ser His Arg 195 200 205 Gly Thr Pro Gly Lys Gly Thr Val Asp Trp Asp Asp Val Phe Gly Ala 210 215 220 Leu Ser Asp Ile Gly Phe Ala Gly Pro Leu Val Met Glu Ser Phe Val 225 230 235 240 Lys Leu Asn Ala Asp Ile Ala Arg Ala Thr Cys Met Trp Arg Asp Ile 245 250 255 Val Lys Asp Pro Glu Ala Leu Ile Arg Asp Gly Ile Ala Phe Leu Glu 260 265 270 Gly Lys Ala Lys Gly Tyr Gly Leu Phe 275 280 <210> 18 <211> 846 <212> DNA <213> Unknown <220> <223> Olavius algarvensis spirochete endosymbiont <400> 18 atgaaatttg gtgcgcatgc tttcgtctgg gaaccagaat ggaatgatac cacctcgcgc 60 cgtgtgattt cagaggccgc gcgcatcggc ctggattttg tggaaatacc gctccttcgc 120 ccagaacgct ttgacggcgc cgctaccaaa gtcttgctgg atgaacatgc cgtgggcgcc 180 acttattcat tgggcctgcc cagtgacaaa agcctgccag aacgcccgta tctggctgaa 240 cccttcttac ggtctgcaat cgacgccatt gaatccgcag gcggtgatac actgacaggc 300 gtgctgtatg gcactctggg tgagctgccg ggccgcccgc cgaacgaaaa ggactacaaa 360 gtgattgcgc aggtattacg tagtgttgct gattacgcga aagaccgtgg catcaaactg 420 ggcattgagc cggtaaaccg ttatgaaacc tttctggtga ataccgcaga gcaggcgatc 480 acattgttag accgtatcga aagcgacaat gtctttattc atctggatac ctatcacgtg 540 aacatcgaag aagatagttt tggcgcggct atccgcctgg ctggggatcg tttaggctac 600 atccacctgt ccgaaagcca ccgtggcacg ccaggcaagg gtactgtgga ttgggacgac 660 gttttcggag cgctttccga tattggtttc gcaggccctc ttgtgatgga aagctttgtc 720 aagctgaatg cagacattgc acgtgcgacc tgcatgtggc gtgatattgt gaaagaccca 780 gaagccctga ttcgcgatgg tattgcgttt ctcgagggga aagcgaaagg ctatggtctg 840 ttttaa 846 <210> 19 <211> 282 <212> PRT <213> Unknown <220> <223> Acidiphilium <400> 19 Met Lys Gly Phe Gly Ile His Thr Ser Leu Trp Ala His Asp Trp Thr 1 5 10 15 Glu Gln Ala Ala Arg Leu Ala Ile Pro Glu Ala Ala Lys His Gly Leu 20 25 30 Ala Phe Val Glu Ile Ala Leu Ile Glu Pro Asp Arg Ala Glu Thr Glu 35 40 45 Val Thr Arg Gly Leu Leu Glu Gln His Gly Leu Ala Ala Cys Cys Ser 50 55 60 Leu Gly Leu Pro Glu Glu Ala Arg Pro Thr Thr Asn Pro Asp Lys Ala 65 70 75 80 Leu Glu Phe Val Thr Leu Ala Leu Glu Lys Thr Ala Ala Ile Gly Ala 85 90 95 Ser Leu Phe Thr Gly Val Thr Tyr Gly Ser Ile Gly Glu Arg Thr Gly 100 105 110 Gln Pro Pro Thr Ala Ala Glu Leu Asp Ala Val Ala Arg Phe Leu Asp 115 120 125 Lys Ala Ala Ala Val Ala Arg Gly Phe Gly Ile Ile Phe Gly Ile Glu 130 135 140 Val Val Asn Arg Tyr Glu Ser His Leu Phe Asn Thr Thr Glu Gln Ala 145 150 155 160 Val Ala Leu Ile Glu Arg Val Gly Ala Pro Asn Ile Val Leu His Leu 165 170 175 Asp Thr Tyr His Met Asn Ile Glu Ala Thr Gly Gln Ala Asn Ala Ile 180 185 190 Arg Ala Ala Gly Ala His Leu Ala Tyr Ile His Leu Ser Glu Ser His 195 200 205 Arg Gly Val Pro Gly Thr Gly Thr Ile Ala Trp Asp Glu Val Phe Ala 210 215 220 Gly Leu Ala Gly Leu Gly Phe Thr Gly Gly Met Ala Leu Glu Ser Phe 225 230 235 240 Ile His Met Pro Pro Arg Leu Ala Ala Ala Leu Ser Val Trp Arg Pro 245 250 255 Val Ala Pro Ser Arg Ala Ala Ile Ile Asp Glu Gly Leu Pro Phe Leu 260 265 270 Arg Asn Lys Ala Arg Gln Tyr Gly Leu Ile 275 280 <210> 20 <211> 849 <212> DNA <213> Unknown <220> <223> Acidiphilium <400> 20 atgaaaggct ttggcattca tacaagtctg tgggcccatg actggaccga gcaagcggct 60 cgtttagcaa ttccggaagc ggcaaaacat ggcctggcgt ttgtcgaaat tgctttaatt 120 gaaccagatc gcgcggaaac tgaagttacc cgcgggctgc tggaacagca cggcttggct 180 gcctgctgct ctctgggctt acctgaggaa gcgcggccaa cgacgaaccc ggataaagcg 240 ttggagttcg tcactttagc tctggaaaag accgcggcga taggggctag cctgtttacc 300 ggtgtgacct acgggagcat tggcgaacgt acgggccagc cacctactgc cgccgaactt 360 gatgcagtag caaggttctt ggataaggct gccgcagtag cgcgcggttt cggtatcatt 420 ttcggtatcg aagtagtgaa tcggtacgag tctcatctgt ttaacaccac cgaacaggcc 480 gttgcactga tcgaacgtgt cggcgcaccg aacatagtgc tgcacttaga cacgtatcac 540 atgaacatcg aagccacggg ccaggccaac gcaatacgcg cggcgggtgc acatctggcc 600 tatattcacc tgagtgaatc gcacaggggt gttccgggca cagggaccat cgcctgggac 660 gaggtgtttg caggtcttgc cggcctgggc tttaccggcg ggatggccct cgaatcattt 720 attcacatgc cgccccgcct ggccgccgcg ctgagcgtct ggcgtccagt tgcaccgagt 780 cgcgcggcca tcatcgatga aggccttcca tttctgcgaa ataaagcccg tcaatacggc 840 ctcatttaa 849 <210> 21 <211> 285 <212> PRT <213> Unknown <220> <223> Rhodobacterales bacterium <400> 21 Met Leu Ser Leu Gly Leu His Ala Leu Ala Ala Ala Pro Glu Trp Arg 1 5 10 15 Pro Asp Leu Trp Ala Ala Ile Leu Pro Arg Met Ala Ala His Gly Val 20 25 30 Ser Val Ile Glu Ile Pro Leu Leu Arg Pro Ala Glu Leu Asp Ile Ala 35 40 45 Gly Thr Arg Ala Leu Ala Ala Lys His Asp Val Glu Leu Val Cys Ser 50 55 60 Leu Gly Leu Pro Ala Thr Leu Asn Val Ala Glu Arg Pro Asp Glu Ala 65 70 75 80 Phe Asp Phe Ile Arg Val Ala Leu Glu Val Thr Ala Ser Ala Gly Ala 85 90 95 Thr Ala Leu Ser Gly Val Thr Phe Gly Val Ile Gly Gln Thr Thr Gly 100 105 110 Ala Ala Pro Thr Thr Arg Glu Ile Asp Ala Met Thr Arg His Val Ser 115 120 125 Arg Ser Ala Ala Leu Ala Lys Lys Leu Gly Leu Arg Phe Gly Ile Glu 130 135 140 Pro Cys Asn Arg Tyr Glu Thr His Leu Leu Asn Thr Gly Ala Ala Ala 145 150 155 160 Arg Ala Val Ile Glu Arg Ser Gly Ala Asp Asn Ala Phe Ile His Leu 165 170 175 Asp Thr Tyr His Met Asn Ile Glu Glu Val Ser His Ala Gln Gly Phe 180 185 190 Ala Asp Ala Gly Asp Leu Leu Gly Tyr Val His Leu Ser Glu Ser Asn 195 200 205 Arg Gly Val Pro Gly Arg Gly Thr Val Asp Trp Ala Asn Val Phe Gln 210 215 220 Gly Leu Lys Ala Ala Gly Phe Asp Gly Cys Ala Ala Leu Glu Ser Phe 225 230 235 240 Val Phe Val Asp Ala Asp Leu Ala Ser Gly Leu Ala Ile Trp Arg Pro 245 250 255 Val Ala Glu Asn Pro Asp Asp Val Ile Asp Val Gly Phe Pro Phe Leu 260 265 270 Arg Thr Ala Gly Glu Ala Ala Gly Leu Arg Trp Ala Arg 275 280 285 <210> 22 <211> 858 <212> DNA <213> Unknown <220> <223> Rhodobacterales bacterium <400> 22 atgctttctc tgggactgca tgcgcttgca gccgcccctg aatggcgccc ggatctgtgg 60 gcggcgatcc tgccgcgtat ggcggcccac ggtgttagcg ttatcgaaat tccgctgctc 120 cgtcctgctg aactggatat tgcgggcacg cgggctttag cggctaaaca tgatgttgaa 180 ctcgtttgtt cattggggct gccagccacc ctcaatgttg cggaacgccc tgatgaggcg 240 tttgatttta tccgcgtggc gttagaagtg accgcgagcg cgggtgcgac cgcgctgtca 300 ggagtgacat ttggcgtgat tgggcagacg acgggcgccg ccccaaccac gcgcgaaatc 360 gatgctatga cccggcatgt gagccgtagc gcagccctcg ccaagaaact gggcttgcgc 420 tttggcattg agccgtgcaa ccgctacgaa acccacttac tgaatactgg cgcagccgct 480 cgggccgtga tagaacgctc aggcgctgat aacgccttca tccatttgga tacatatcac 540 atgaatatcg aagaagtgtc tcatgctcag ggttttgcag atgcgggcga cctgctggga 600 tatgtgcact tgtcagaaag caatcgaggc gtcccggggc gtggtaccgt cgattgggcg 660 aatgtatttc agggtctgaa agccgccgga ttcgatggtt gcgccgcact cgaaagtttc 720 gtgttcgttg acgcggactt agcatccgga cttgccatct ggcgtcctgt tgctgaaaac 780 ccagatgacg tgattgacgt aggtttcccg ttcttgcgga cagccggaga ggcggcgggc 840 ttgcgctggg cgcgttaa 858 <210> 23 <211> 282 <212> PRT <213> Unknown <220> <223> Chloroflexi bacterium <400> 23 Met Val Leu Phe Gly Ala His Thr Phe Ile Trp Ser Ala Glu Trp Asn 1 5 10 15 Pro Glu Thr Ala Glu His Val Ile Asp Gly Ala Ala Arg Ala Gly Leu 20 25 30 Asp Phe Val Glu Ile Pro Leu Leu His Pro Asp Gln Met Asp Ala Gly 35 40 45 Gly Thr Arg Arg Leu Leu Glu Asn Tyr Gly Leu Gln Cys Thr Cys Ser 50 55 60 Leu Gly Leu Pro Arg Glu Ala His Leu Pro Phe Ala Pro Asp Lys Ala 65 70 75 80 Thr Gly Phe Leu Glu Gln Ala Val Asp Val Thr Ser Asp Leu Gly Ser 85 90 95 Pro Val Leu Thr Gly Cys Leu Tyr Thr His Leu Gly Thr Leu Thr Gly 100 105 110 Lys Pro Pro Thr Asp Glu Glu Ile Asp Leu Val Val Arg Val Leu Lys 115 120 125 Arg Ile Ala Arg Tyr Ala Gln Asp Arg Gly Ile Ser Leu Gly Ile Glu 130 135 140 Pro Val Asn Arg Tyr Glu Thr Tyr Leu Leu Asn Leu Ala Glu Gln Ala 145 150 155 160 Ser Ala Leu Leu Asp Arg Ile Asp Glu Ala Asn Val Phe Val His Leu 165 170 175 Asp Thr Tyr His Met Asn Ile Glu Glu Lys Gly Phe Tyr Thr Pro Ile 180 185 190 Val Asp Thr Gly Pro Arg Leu Gln Tyr Ile His Leu Ser Glu Ser Asp 195 200 205 Arg Gly Ile Pro Gly Thr Gly Asn Val His Trp Asp Glu Val Phe Arg 210 215 220 Gly Leu Lys Ala Val Lys Tyr Glu Gly Arg Leu Val Met Glu Ser Phe 225 230 235 240 Ala Ala Val Asn Glu Asp Leu Met Gly Ala Thr Ala Met Trp Arg Asp 245 250 255 Val Val Gly Asp Pro Asp Arg Leu Val Thr Glu Gly Leu Ala Phe Leu 260 265 270 Arg Gly Lys Ala Ile Glu Tyr Gly Leu Leu 275 280 <210> 24 <211> 849 <212> DNA <213> Unknown <220> <223> Chloroflexi bacterium <400> 24 atggtactgt ttggggcgca tacctttatt tggagcgccg aatggaaccc agaaacggcg 60 gaacatgtaa ttgatggcgc agctcgcgcc ggcctggatt tcgttgagat tccgttgctg 120 catcccgatc agatggacgc aggcggcacg cgccggcttt tggaaaacta tggtctgcaa 180 tgcacatgta gcttgggcct gccgcgcgaa gcgcatctgc cattcgcccc tgacaaggca 240 acaggctttc tggaacaggc cgtcgatgtg acaagtgacc tgggtagccc tgttttgacc 300 ggctgtttat atacccactt aggaacgctg acaggaaagc cgcctaccga cgaagagatt 360 gatttggtcg ttcgtgtcct gaagcgaatt gcgcgctacg cccaggaccg agggattagt 420 ctgggcatcg aaccggtcaa ccgctatgaa acctatcttc tgaatctggc ggagcaagcg 480 tctgcactgc tcgatcgtat tgacgaagcc aatgtatttg tgcatctgga tacctatcac 540 atgaacattg aagaaaaggg cttttatact ccgatcgttg ataccgggcc gcgtttacag 600 tacattcacc tgtccgaatc ggaccgcggt atcccgggta ctggcaacgt tcattgggac 660 gaggtgtttc gaggcctcaa ggccgttaaa tacgaaggcc gtcttgtgat ggaatctttc 720 gccgcagtca acgaagatct gatgggtgca acggcgatgt ggcgggatgt ggtgggtgat 780 ccggatcgat tagtcacgga aggcctggcg ttcttacgtg gaaaggcgat tgagtacggc 840 ctgctgtaa 849 <210> 25 <211> 283 <212> PRT <213> Unknown <220> <223> Spiribacter sp. E85 <400> 25 Met Ala Glu Phe Gly Ala His Ala Phe Ile Trp Glu Ser Asp Trp Asn 1 5 10 15 Pro Ala Ser Ala Arg Arg Val Ile Ala Gly Ala Ala Ala Ala Gly Leu 20 25 30 Asp Phe Val Glu Ile Pro Leu Leu Arg Pro Glu Ser Met Asp Thr Ala 35 40 45 Gly Thr Arg Arg Leu Leu Ala Glu His Arg Leu Gly Val Arg Cys Ser 50 55 60 Leu Gly Leu Pro Pro Ala Ala Ser Leu Pro Ala His Pro Gln Ala Ala 65 70 75 80 Glu Ala Phe Leu Cys Arg Ala Leu Asp Val Thr Arg Ala Leu Gly Gly 85 90 95 Pro Val Leu Thr Gly Val Ile Tyr Gly Thr Leu Gly Gln Leu Pro Gly 100 105 110 His Pro Pro Arg Pro Gly Asp Leu Asp Ile Val Ala Gln Thr Leu Arg 115 120 125 Arg Val Ala Ala Tyr Ala Ala Asp Gln Gly Leu Ala Leu Gly Ile Glu 130 135 140 Pro Val Asn Arg Tyr Glu Thr His Leu Val Asn Leu Thr Asp Gln Ala 145 150 155 160 Leu Glu Leu Leu Asp Ala Ile Gly Ala Asp Asn Val Phe Leu His Leu 165 170 175 Asp Thr Tyr His Met Asn Val Glu Glu Lys Gly Phe Arg Gly Pro Val 180 185 190 Glu Ala Ala Gly Lys Arg Leu Arg Tyr Ile His Leu Ser Glu Ser Asp 195 200 205 Arg Gly Thr Pro Gly Thr Gly Asn Val His Trp Asp Glu Val Phe Asp 210 215 220 Gly Leu Ala Ala Ile Gly Tyr Arg Gly Asp Leu Val Met Glu Ser Phe 225 230 235 240 Ala Ala Val Asn Glu Asp Ile Ala Arg Ala Thr Cys Ile Trp Arg Gln 245 250 255 Val Ala Pro Asp Pro Asp Thr Leu Val Arg Glu Gly Leu Ala Phe Leu 260 265 270 Arg Gly Lys Ala Thr Ala Arg Gly Leu Ile Pro 275 280 <210> 26 <211> 852 <212> DNA <213> Unknown <220> <223> Spiribacter sp. E85 <400> 26 atggcggagt tcggtgcaca tgctttcatt tgggagtctg actggaatcc ggcgtcagct 60 cgccgtgtca ttgccggcgc cgctgccgcc ggcctagatt tcgtcgagat cccactgctc 120 cgcccggaat ccatggacac cgcgggaacc cgcagattac ttgctgaaca tcgcctcggc 180 gtgcgctgtt cactgggcct gccgccggca gcgagtctac ccgctcatcc gcaggccgca 240 gaagcattcc tttgccgcgc cctagacgtt acgcgtgcgt tgggcggacc cgtactcact 300 ggtgtcatct atggcactct gggccagtta ccgggtcacc cgccacgccc tggcgatctt 360 gacattgtcg cacagacctt acggcgcgtg gcagcgtacg ccgcagatca gggtctggcc 420 ctgggcattg aaccagtgaa ccgttatgaa acacatttag tgaatctcac ggatcaagcc 480 ctagaactgt tagatgcgat tggcgccgac aatgtattcc tgcatctgga tacctatcac 540 atgaacgtgg aagagaaagg ttttcgtggt ccagttgaag cagctggtaa acgtttgaga 600 tacattcatc tttcggagtc agatcgtggt accccgggga caggcaacgt tcactgggat 660 gaagtattcg acggtctggc tgcaatcgga taccgtgggg atctggtgat ggaaagtttt 720 gcggccgtga atgaggacat tgcgcgtgcg acctgcatct ggcgtcaagt tgccccagac 780 ccggacactc tggttagaga aggcttggcg tttcttcgcg gcaaagcgac cgcccgcggc 840 cttatccctt aa 852 <210> 27 <211> 282 <212> PRT <213> Unknown <220> <223> Tabrizicola sp. TH137 <400> 27 Met Glu Gly Phe Gly Val His Thr Ser Met Trp Thr Met His Trp Asp 1 5 10 15 Arg Ala Gly Ala Glu Arg Thr Ile Pro Ala Ala Ala Ala Tyr Arg Met 20 25 30 Asp Phe Ile Glu Ile Ala Leu Leu Asn Thr Ala Ile Val Asp Ala Ala 35 40 45 His Thr Arg Ala Leu Leu Glu Arg His Gly Met Arg Ala Val Cys Ser 50 55 60 Leu Gly Leu Pro Glu Arg Asn Trp Ala Ser Val Asn Pro Glu Gly Ala 65 70 75 80 Ile Ala His Leu Cys Asp Cys Ile Asp Thr Ala Ala Ala Met Gly Ala 85 90 95 Glu Ala Leu Ser Gly Val Thr Tyr Gly Gly Ile Gly Gln Arg Thr Gly 100 105 110 Leu Pro Pro Thr Met Ala Glu Tyr Asp Asn Ile Ala Arg Ala Leu Ala 115 120 125 Ala Val Ala Lys His Ala Lys Ala Arg Gly Ile Ala Phe Gly Ile Glu 130 135 140 Pro Val Asn Arg Tyr Glu Asn His Leu Ile Asn Thr Ala Ala Gln Ala 145 150 155 160 Lys Trp Met Ile Glu Lys Val Gly Ala Asp Asn Ile Phe Ile His Leu 165 170 175 Asp Thr Tyr His Met Asn Ile Glu Glu Lys Gly Ala Gly Asn Gly Ile 180 185 190 Leu Asp Ala Arg Asp His Leu Arg Tyr Ile His Leu Ser Glu Ser Asp 195 200 205 Arg Gly Thr Pro Gly Glu Gly Thr Cys Asp Trp Asp Glu Val Tyr Ala 210 215 220 Thr Leu Ala Ala Ile Gly Phe Lys Gly Gly Leu Ala Met Glu Ser Phe 225 230 235 240 Ile Asn Met Pro Pro Glu Val Ala Tyr Gly Leu Ala Val Trp Arg Pro 245 250 255 Val Ala Glu Asn Phe Glu Glu Val Met Asp Lys Gly Leu Pro Phe Leu 260 265 270 Arg Asn Lys Ala Arg Gln Tyr Arg Leu Ile 275 280 <210> 28 <211> 849 <212> DNA <213> Unknown <220> <223> Tabrizicola sp. TH137 <400> 28 atggaaggat ttggtgtaca tacttccatg tggacaatgc actgggatcg cgcgggcgct 60 gaacgtacca ttcctgccgc agctgcgtac cgcatggatt tcatagagat tgctttatta 120 aacacagcca ttgttgacgc ggcacacacg agggctctcc ttgaacggca tggcatgcgc 180 gcagtgtgtt cattgggctt acctgaacgc aattgggcga gcgtgaaccc ggaaggcgcc 240 atcgcacatc tgtgcgattg tattgacaca gcagcagcca tgggcgccga agccctatcc 300 ggcgtcacgt atggcggcat cgggcaacgt acggggctcc cgcctacgat ggccgaatac 360 gataacattg cccgcgctct ggcagctgtg gcgaaacatg ctaaagcacg cggcattgcg 420 tttggtatcg aacccgtgaa tcgctacgaa aatcacttga ttaataccgc cgcacaagct 480 aaatggatga tcgaaaaggt tggggctgat aatatattta ttcatctgga cacctatcac 540 atgaacatag aggaaaaggg agccggcaat gggatcctcg atgcgcgtga tcatttgaga 600 tatatccact tatcggaatc ggatcgcggc actccgggcg aaggcacgtg tgactgggat 660 gaggtatatg ctaccctggc cgccattggt tttaaaggcg gtttggctat ggaatcgttt 720 attaatatgc caccggaagt ggcctatggt cttgccgtct ggcgtccggt ggcggaaaat 780 tttgaggaag tgatggataa aggactcccg ttcttgcgta ataaagcgcg ccaatatcgc 840 ctgatataa 849 <210> 29 <211> 282 <212> PRT <213> Unknown <220> <223> Tropicimonas isoalkanivorans <400> 29 Met Lys Gly Phe Gly Val His Thr Ser Met Trp Thr Met His Trp Asp 1 5 10 15 Arg Asp Gly Ala Glu Arg Thr Ile Pro Ala Thr Ala Ala Tyr Gly Met 20 25 30 Asp Phe Val Glu Ile Ala Leu Leu Asp Thr Ser Ile Val Asp Ala Ala 35 40 45 His Thr Arg Ala Leu Leu Glu Lys His Glu Leu Arg Ala Val Cys Ser 50 55 60 Leu Gly Leu Pro Glu Gly Ser Trp Pro Ser Val Ala Pro Glu Ala Ala 65 70 75 80 Val Ala His Leu Lys Asp Val Phe Glu Thr Ala Ala Ala Met Gly Ala 85 90 95 Glu Ala Val Ser Gly Val Thr Tyr Gly Gly Ile Gly Gln Arg Ser Gly 100 105 110 Val Pro Pro Thr Glu Glu Glu Tyr Asp Asn Val Ala Arg Ala Leu Gln 115 120 125 Gln Ala Ala Ala Tyr Ala Lys Arg Leu Gly Leu Ala Phe Gly Ile Glu 130 135 140 Pro Val Asn Arg Tyr Glu Asn His Leu Ile Asn Thr Ala Trp Gln Ala 145 150 155 160 Arg Asp Met Ile Glu Lys Val Gly Ser Asp Asn Ile Phe Ile His Leu 165 170 175 Asp Thr Tyr His Met Asn Ile Glu Glu Lys Gly Val Ala Asn Gly Ile 180 185 190 Leu Asp Ala Arg Asp His Leu Arg Tyr Ile His Leu Ser Glu Ser Asp 195 200 205 Arg Gly Thr Pro Gly Glu Gly Cys Cys Asp Trp Asn Glu Val Phe Gly 210 215 220 Thr Leu Ser Ala Ile Gly Phe Glu Gly Gly Met Ala Met Glu Ser Phe 225 230 235 240 Ile Asn Met Pro Pro Gln Ile Ala Tyr Gly Leu Ala Val Trp Arg Pro 245 250 255 Val Ala Asp Ser Phe Glu Asp Val Met Asp Arg Gly Leu Pro Phe Leu 260 265 270 Arg Asn Lys Ala Arg Gln Tyr Arg Leu Ala 275 280 <210> 30 <211> 849 <212> DNA <213> Unknown <220> <223> Tropicimonas isoalkanivorans <400> 30 atgaagggtt tcggggtgca cacgagtatg tggacgatgc attgggaccg ggatggcgcg 60 gaacgtacaa ttccagcgac ggccgcgtat ggcatggatt ttgtcgagat cgctctgttg 120 gatacctcta tcgttgatgc tgcgcacacc cgggcgctcc tggagaaaca cgagctgcgc 180 gccgtttgct cgttgggcct gccggaaggc tcgtggcctt cggttgcccc agaggcggcg 240 gtagcgcatc tgaaagacgt atttgaaacc gcagccgcga tgggcgccga agcggtttcg 300 ggcgtcacat acggcggtat tggccaacgt tccggtgtgc cgcccaccga ggaagaatat 360 gacaacgtag ctcgtgccct gcaacaggca gcggcttacg ccaaacgctt aggcttagcc 420 tttggcattg aacctgtgaa ccgctacgaa aaccatttga tcaacactgc atggcaggcc 480 cgtgacatga ttgaaaaggt aggctcggac aatattttca tccatttaga tacttaccac 540 atgaatatag aagagaaagg tgtggcgaac ggtatcttag acgcacgtga tcaccttcgt 600 tatattcatc tttcagagag cgaccgtggc actccgggtg aaggttgctg cgattggaac 660 gaagttttcg ggaccttgag cgctattggg tttgaaggtg gtatggcgat ggaatcgttt 720 attaacatgc cgccgcagat agcttacggc ctggccgttt ggcgaccagt tgcggactcc 780 ttcgaagatg tgatggatcg cgggctgccg tttctgcgta acaaagcgcg tcagtaccgt 840 ctggcttaa 849 <210> 31 <211> 282 <212> PRT <213> Unknown <220> <223> Rhodobacteraceae bacterium <400> 31 Met Gln Gly Phe Gly Val His Thr Ser Met Trp Thr Met His Trp Asp 1 5 10 15 Arg Leu Gly Ala Glu Arg Thr Ile Pro Ala Ala Ala Ala Tyr Lys Met 20 25 30 Asp Phe Ile Glu Ile Ala Leu Leu Asp Thr Ser Val Val Asp Ala His 35 40 45 His Thr Arg Asp Leu Leu Ala Lys His Glu Met Arg Ala Val Cys Ser 50 55 60 Leu Gly Leu Pro Arg Glu Ser Trp Ala Ser Val Asn Pro Asp Gly Ala 65 70 75 80 Ile Ala His Leu Ile Asp Ala Met Asp Tyr Thr Lys Glu Met Gly Gly 85 90 95 Glu Ala Leu Ser Gly Val Thr Tyr Gly Gly Ile Gly Glu Arg Ser Gly 100 105 110 Val Pro Pro Thr Glu Ala Glu Tyr Asp Asn Ile Ala Arg Ala Leu Glu 115 120 125 Val Ala Ala Lys Tyr Ala Lys Thr Leu Gly Ile Ala Phe Gly Ile Glu 130 135 140 Pro Val Asn Arg Tyr Glu Ser His Leu Ile Asn Thr Ser Trp Gln Ala 145 150 155 160 Lys Glu Met Ile Asp Lys Ile Gly Ala Asp Asn Ile Phe Ile His Leu 165 170 175 Asp Thr Tyr His Met Asn Ile Glu Glu Lys Gly Ala Gly Asn Gly Ile 180 185 190 Leu Ala Ala Arg Glu His Leu Arg Tyr Ile His Leu Ser Glu Ser Asp 195 200 205 Arg Gly Thr Pro Gly Glu Gly Thr Cys Asp Trp Asp Glu Ile Phe Ala 210 215 220 Thr Leu Ala Ala Val Glu Phe Lys Gly Gly Leu Ala Met Glu Ser Phe 225 230 235 240 Ile Asn Met Pro Pro Gln Val Gly Tyr Gly Leu Gly Ile Trp Arg Pro 245 250 255 Val Ala Asn Ser Phe Glu Glu Val Met Asp Lys Gly Leu Pro Phe Leu 260 265 270 Arg Asn Lys Ala Ala Gln Tyr Arg Leu Ile 275 280 <210> 32 <211> 849 <212> DNA <213> Unknown <220> <223> Rhodobacteraceae bacterium <400> 32 atgcaaggtt ttggtgtcca taccagtatg tggacaatgc actgggatcg cctgggcgcg 60 gaacgaacca ttccggccgc ggctgcgtac aaaatggact ttattgaaat tgctcttctg 120 gacaccagcg tcgtggatgc gcatcacact cgtgatcttc tggcgaaaca tgaaatgcgt 180 gcggtttgct cgctgggctt gcctcgcgaa tcttgggcca gtgttaaccc ggatggtgcc 240 atagctcacc ttatagatgc aatggactat actaaagaga tgggcggcga ggcactgtct 300 ggcgtcacct atggcggtat cggtgaacgt agcggtgttc cgccgacgga agctgaatat 360 gataatatcg cacgtgccct agaagttgcc gccaaatacg ccaaaacgct gggcattgcc 420 tttggcattg aacccgtgaa ccgctatgaa agccacctga ttaataccag ttggcaggct 480 aaagaaatga ttgataaaat cggtgcagat aacatcttca ttcacttaga tacctaccac 540 atgaacattg aagagaaagg cgccggtaat ggaatcctgg cagctcggga acaccttcgc 600 tacattcatt tgagcgaaag cgaccggggt acacccggcg aaggcacctg tgattgggac 660 gaaatatttg cgacccttgc tgccgttgag ttcaaaggtg gcttggccat ggagagtttc 720 attaatatgc cgccgcaagt gggatatggc ttgggtatct ggcgcccggt cgccaattca 780 ttcgaggaag tgatggataa aggcctgccg ttcctgcgta acaaagcggc ccagtatcgt 840 cttatttaa 849 <210> 33 <211> 282 <212> PRT <213> Unknown <220> <223> Rhodobacter sp. SW2 <400> 33 Met Glu Gly Phe Gly Val His Thr Ser Met Trp Thr Met Gln Trp Asp 1 5 10 15 Arg Ala Gly Ala Glu Arg Thr Ile Pro Ala Ala Ala Ala Tyr Lys Met 20 25 30 Asp Phe Ile Glu Ile Ala Leu Leu Asn Thr Ala Ile Val Asp Ala Pro 35 40 45 His Thr Arg Ala Leu Leu Gln Lys His Gly Leu Arg Ala Val Ala Ser 50 55 60 Leu Gly Leu Pro Gln Gln Asn Trp Ala Ser Val Asn Pro Glu Gly Ala 65 70 75 80 Ile Glu Gln Leu Cys Arg Ser Leu Asp Thr Ala Ala Ala Met Gly Cys 85 90 95 Glu Ala Leu Ser Gly Val Thr Tyr Gly Gly Ile Gly Glu Arg Ser Gly 100 105 110 Leu Pro Pro Thr Met Ala Glu Tyr Asp Asn Val Ala Arg Ala Leu Ala 115 120 125 Ala Ala Ala Lys His Ala Lys Lys Leu Gly Leu Ala Phe Gly Ile Glu 130 135 140 Pro Val Asn Arg Tyr Glu Ser His Leu Ile Asn Thr Gly Trp Gln Ala 145 150 155 160 Lys Trp Met Ile Glu Lys Val Gly Ala Asp Asn Ile Phe Ile His Leu 165 170 175 Asp Thr Tyr His Met Asn Ile Glu Glu Lys Gly Ala Gly Asn Gly Ile 180 185 190 Leu Asp Ala Arg Glu His Leu Arg Tyr Val His Leu Ser Glu Ser Asp 195 200 205 Arg Gly Thr Pro Gly Glu Gly Thr Val Asp Trp Asp Glu Ile Phe Ala 210 215 220 Thr Leu Ala Ala Val Gly Phe Lys Gly Gly Leu Ala Met Glu Ser Phe 225 230 235 240 Ile Asn Met Pro Pro Glu Leu Gly Tyr Gly Leu Ala Val Trp Arg Pro 245 250 255 Val Ala Glu Ser Phe Gln Ala Val Met Asp Lys Gly Leu Pro Phe Leu 260 265 270 Arg Asn Lys Ala Arg Gln Tyr Arg Leu Ile 275 280 <210> 34 <211> 849 <212> DNA <213> Unknown <220> <223> Rhodobacter sp. SW2 <400> 34 atggaaggtt tcggtgtcca tacttccatg tggaccatgc aatgggaccg tgctggtgcc 60 gaacggacga taccagccgc tgcggcatat aagatggatt tcatcgaaat cgcgctgctg 120 aatacggcca ttgtggatgc cccgcatacc cgcgcactgt tacagaaaca tggtctgcgc 180 gccgttgcga gtctgggcct gccacaacag aactgggcga gtgtcaatcc tgagggtgcc 240 attgagcagt tatgccgctc actggacacc gctgccgcga tgggttgcga agccctgtca 300 ggggttacct acggcggcat cggagagcgc agcggtctgc cgccaacaat ggcagaatat 360 gacaacgtgg cccgtgcgtt ggcggcggca gcaaaacacg ctaagaaact gggcctggcg 420 tttggaatcg aacctgtgaa cagatatgag tctcacttga tcaacaccgg atggcaagca 480 aaatggatga ttgaaaaggt gggtgcggat aacatcttta tccacctgga tacttatcac 540 atgaatattg aggaaaaggg tgcaggcaac ggcattctcg atgcgcgcga acacctgcgt 600 tacgtgcatc ttagcgaaag cgaccgtggg acccctggag aaggtactgt tgactgggat 660 gaaatattcg cgacactcgc cgcagttgga tttaaaggcg gattagcaat ggaaagcttt 720 atcaacatgc caccggaact gggatatggc ctggcagtat ggcgcccggt ggcggaatcc 780 tttcaagcag taatggataa aggtttacct tttctgcgga acaaagcgcg tcagtatcgt 840 ctgatctaa 849 <210> 35 <211> 282 <212> PRT <213> Unknown <220> <223> Alphaproteobacteria bacterium HGW-Alphaproteobacteria-8 <400> 35 Met Arg Gly Phe Gly Val His Thr Ser Met Trp Thr Met Lys Trp Asp 1 5 10 15 Arg Ala Gly Ala Glu Arg Ala Val Ala Ala Ala Ala His Tyr Lys Met 20 25 30 Asp Phe Ile Glu Ile Ala Leu Leu Asn Ala Pro Gly Val Asp Ala Pro 35 40 45 His Ser Arg Ala Leu Leu Glu Lys His Gly Leu Arg Ala Val Cys Ser 50 55 60 Leu Gly Leu Pro Glu Ala Ala Trp Pro Ser Arg Asn Pro Glu Ala Ala 65 70 75 80 Val Ala His Leu Lys Val Ala Leu Asp Lys Thr Ala Glu Met Gly Cys 85 90 95 Glu Ala Leu Thr Gly Val Thr Tyr Gly Gly Ile Gly Glu Arg Thr Gly 100 105 110 Leu Pro Pro Ser Ala Thr Glu Leu Asp Asn Val Ala Arg Ala Leu Arg 115 120 125 Glu Ala Ala Ala His Ala Lys Lys Leu Gly Leu Leu Phe Gly Ile Glu 130 135 140 Pro Val Asn Arg Tyr Glu Thr His Leu Ile Asn Thr Gly Arg Gln Ala 145 150 155 160 Val Glu Met Ile Glu Lys Val Gly Ala Glu Asn Met Phe Ile His Leu 165 170 175 Asp Thr Tyr His Met Asn Ile Glu Glu Lys Gly Ala Ala Asn Gly Ile 180 185 190 Leu Asp Ala Arg Glu His Ile Lys Tyr Ile His Leu Ser Glu Ser Asp 195 200 205 Arg Gly Thr Pro Gly Trp Gly Thr Cys Asp Trp Asp Glu Ile Phe Ala 210 215 220 Val Leu Ser Ala Ile Gly Phe Lys Gly Gly Leu Ala Met Glu Ser Phe 225 230 235 240 Ile Asn Met Pro Pro Glu Val Ala Tyr Gly Leu Ser Val Trp Arg Pro 245 250 255 Val Ala Arg Asp Glu Ala Glu Val Met Asp Asn Gly Leu Pro Phe Leu 260 265 270 Arg Gly Lys Ala Arg Gln Tyr Arg Leu Ile 275 280 <210> 36 <211> 849 <212> DNA <213> Unknown <220> <223> Alphaproteobacteria bacterium HGW-Alphaproteobacteria-8 <400> 36 atgcgtggtt ttggcgtcca tacatctatg tggactatga aatgggaccg tgcaggtgcc 60 gagcgtgccg tggcggcggc agcccactat aagatggact tcatcgaaat tgcgctgctg 120 aacgcgccgg gtgtcgatgc accgcatagt cgggcactcc tggagaaaca tggactgcgc 180 gcggtctgtt cattggggct tccggaagcc gcttggccga gccgcaaccc ggaagccgcc 240 gttgctcatc tgaaagtggc gctcgataaa accgctgaaa tgggttgtga agcgctgacc 300 ggagtcacct acggcggcat cggggaacgg accggcctgc caccgtctgc caccgaactg 360 gataacgtgg cacgcgcttt acgcgaagcc gcagcacacg ctaagaagct ggggctcctc 420 ttcggcatcg aaccggttaa ccgctacgaa acccatctga ttaacactgg tcggcaagcc 480 gttgaaatga ttgagaaagt cggcgcagag aatatgttta ttcacctgga cacctatcac 540 atgaacatcg aggaaaaggg cgcagcgaat ggtattctgg atgcacgcga acacattaaa 600 tatatccatc tttcagaatc tgatcgcggt accccgggct ggggtacctg cgattgggat 660 gaaattttcg cagtgctgag cgcaattgga tttaaaggtg gtttggcgat ggaaagtttt 720 attaacatgc cgccggaagt tgcgtatggc ctgtcagtat ggcgaccagt cgcacgggat 780 gaagcggaag ttatggataa cggccttccg tttcttcgtg gtaaagcccg ccagtaccgc 840 ttaatttaa 849 <210> 37 <211> 282 <212> PRT <213> Unknown <220> <223> Rubellimicrobium mesophilum <400> 37 Met Gln Gly Phe Gly Val His Thr Ser Met Trp Thr Met Asn Trp Asp 1 5 10 15 Arg Ala Gly Ala Glu Arg Thr Ile Pro Ala Ala Ser Ala Tyr Gly Met 20 25 30 Asp Phe Ile Glu Ile Ala Leu Leu Asn Ala Pro Ala Val Asp Ala Pro 35 40 45 His Thr Arg Ala Leu Leu Glu Lys His Gly Met Arg Ala Val Cys Ser 50 55 60 Leu Gly Leu Pro Glu Arg Asn Trp Ala Ser Val Asn Pro Glu Gly Ala 65 70 75 80 Ile Glu His Leu Arg Gln Ala Leu Glu Val Thr Ala Ala Leu Gly Ala 85 90 95 Glu Ala Leu Ser Gly Val Thr Tyr Gly Gly Ile Gly Gln Arg Thr Gly 100 105 110 Val Pro Pro Thr Ala Gly Glu Tyr Asp Asn Ile Ala Arg Ala Leu Glu 115 120 125 Ala Ala Ala Arg Tyr Ala Arg Glu Leu Gly Ile Ala Phe Gly Ile Glu 130 135 140 Pro Val Asn Arg Tyr Glu Asn His Leu Val Asn Thr Ala Ala Gln Ala 145 150 155 160 Lys Trp Met Ile Glu Lys Val Gly Ala Asp Asn Ile Phe Ile His Leu 165 170 175 Asp Thr Tyr His Met Asn Ile Glu Glu Lys Gly Val Gly Asn Gly Ile 180 185 190 Leu Asp Ala Arg Glu His Leu Arg Tyr Ile His Leu Ser Glu Ser Asp 195 200 205 Arg Gly Thr Pro Gly Glu Gly Thr Cys Asp Trp Asp Glu Val Phe Ala 210 215 220 Thr Leu Ala Ala Ile Gly Phe Lys Gly Gly Leu Ala Met Glu Ser Phe 225 230 235 240 Ile Asn Met Pro Pro Glu Ile Gly Tyr Gly Leu Ala Val Trp Arg Pro 245 250 255 Val Ala Glu Ser Phe Glu Glu Val Met Asp Arg Gly Leu Pro Phe Leu 260 265 270 Arg Asn Lys Ala Lys Gln Tyr Arg Leu Val 275 280 <210> 38 <211> 849 <212> DNA <213> Unknown <220> <223> Rubellimicrobium mesophilum <400> 38 atgcaagggt ttggcgtcca cacttcgatg tggaccatga actgggatcg tgccggcgcc 60 gaacgtacaa tcccggccgc gagcgcatac ggtatggatt ttattgaaat tgcgctgctg 120 aatgccccgg cggtggacgc tccacatacg cgcgcccttc ttgaaaagca cgggatgcgt 180 gcagtttgca gtttgggttt gcctgagcgt aattgggcaa gcgtcaaccc tgaaggcgcg 240 atcgagcacc ttcgacaagc cctcgaagtg accgccgccc ttggggcaga agcgttaagc 300 ggtgtcacat acggcggtat aggtcagcgc acaggggtgc cacccaccgc tggcgagtat 360 gataacatcg cccgtgcact ggaagccgct gcacgctatg cacgagaact gggtatcgcc 420 tttggtatcg aaccggttaa ccggtacgag aaccatctgg tgaacaccgc ggcccaagct 480 aaatggatga tagaaaaggt tggcgcggat aatattttca tccatttgga tacatatcac 540 atgaacattg aggagaaagg tgtcggcaac ggtatcctgg atgcgcgtga gcacctgcgc 600 tatattcatc tgtctgagag cgatcgcggc acaccaggcg agggtacttg cgattgggac 660 gaagtattcg caaccctggc agcaattggt ttcaaaggcg gacttgctat ggaatcgttt 720 atcaacatgc cgccagaaat tggatacggc ttggccgttt ggcgacctgt ggcagagagt 780 tttgaagaag tcatggaccg cggcctgccg ttcctgcgga acaaggcgaa acagtaccgt 840 cttgtgtaa 849 <210> 39 <211> 282 <212> PRT <213> Unknown <220> <223> Rhodobacterales bacterium <400> 39 Met Glu Gly Phe Gly Val His Thr Ser Met Trp Thr Met His Trp Asp 1 5 10 15 Arg Ala Gly Ala Glu Arg Thr Ile Pro Ala Ala Ala Ala Tyr Lys Met 20 25 30 Asp Phe Ile Glu Ile Ala Leu Leu Asn Ala Ala Met Ile Asp Pro Pro 35 40 45 His Thr Arg Ala Leu Leu Glu Lys His Asn Met Arg Ala Val Ala Ser 50 55 60 Leu Gly Leu Pro Gln Arg Asn Trp Ala Ser Val Asn Pro Asp Gly Ala 65 70 75 80 Ala Ala His Leu Ile Glu Ala Met Asp Val Ala Ala Ala Met Gly Ala 85 90 95 Glu Ala Leu Ser Gly Val Thr Tyr Gly Gly Ile Gly Glu Arg Thr Gly 100 105 110 Leu Pro Pro Thr Met Ala Glu Tyr Asp Asn Ile Ala Arg Ala Leu Gly 115 120 125 Gln Ala Ala Lys His Ala Lys Lys Leu Gly Ile Ala Phe Gly Ile Glu 130 135 140 Pro Val Asn Arg Tyr Glu Asn His Leu Ile Asn Thr Gly Trp Gln Ala 145 150 155 160 Lys Trp Met Ile Glu Lys Val Gly Ala Asp Asn Ile Phe Ile His Leu 165 170 175 Asp Thr Tyr His Met Asn Ile Glu Glu Lys Gly Ala Gly Asn Gly Ile 180 185 190 Leu Asp Ala Arg Glu His Leu Arg Tyr Ile His Leu Ser Glu Ser Asp 195 200 205 Arg Gly Thr Pro Gly Glu Gly Thr Cys Asp Trp Asp Glu Val Tyr Ala 210 215 220 Thr Leu Ala Ala Ile Gly Phe Lys Gly Gly Leu Ala Met Glu Ser Phe 225 230 235 240 Ile Asn Met Pro Pro Glu Val Gly Tyr Gly Leu Ala Val Trp Arg Pro 245 250 255 Val Ala Asn Ser Phe Glu Glu Val Met Asp Lys Gly Leu Pro Phe Leu 260 265 270 Arg Asn Lys Ala Arg Gln Tyr Arg Leu Ile 275 280 <210> 40 <211> 849 <212> DNA <213> Unknown <220> <223> Rhodobacterales bacterium <400> 40 atggaaggct tcggtgtgca cacgagtatg tggacgatgc actgggatcg tgctggtgct 60 gaacgtacga ttccggccgc cgccgcgtac aagatggact tcattgaaat tgcgctgctg 120 aacgcagcga tgatcgatcc gccacatact cgcgcgcttc tggagaaaca taacatgcgg 180 gctgttgcga gtctcggact tccacaacgc aattgggcct cggttaatcc agatggtgcc 240 gcggcccatc ttatcgaggc gatggacgtg gcggcagcaa tgggtgccga agcgctttcc 300 ggagtgacat acggcggaat cggtgaacgc actggcctgc cgccaactat ggcagagtac 360 gataacattg cacgagcact cgggcaggcc gccaaacatg ccaagaagct tgggatcgct 420 ttcggcatag agccggtgaa tcgctatgag aatcatctga tcaacactgg ctggcaggcc 480 aaatggatga ttgagaaagt gggtgctgat aacatcttta tccatctgga tacatatcac 540 atgaatatcg aggaaaaggg cgctggtaat ggtattttag atgcacgtga acacctgcgt 600 tatattcatt tgtctgagtc cgatcgcggc acgccgggtg aaggcacgtg tgactgggat 660 gaagtttacg cgacactggc agccattggc tttaaaggtg gactcgcgat ggaatcattc 720 atcaacatgc cgccggaagt gggttatggt ctggcagttt ggcgcccggt ggcgaacagc 780 tttgaagaag ttatggacaa aggtctgccg tttctccgca ataaagcgcg gcagtaccgc 840 ctgatctaa 849 <210> 41 <211> 282 <212> PRT <213> Unknown <220> <223> Rhodobacterales bacterium RIFCSPHIGHO2_02_FULL_62_130 <400> 41 Met Glu Gly Phe Gly Val His Thr Ser Met Trp Thr Met Lys Trp Asp 1 5 10 15 Arg Glu Gly Thr Glu Arg Ala Val Gln Ala Ala Val Asp Tyr Lys Met 20 25 30 Asp Phe Leu Glu Ile Ala Leu Leu Asp Ala Pro Ser Val Asp Ala Ala 35 40 45 His Thr Arg Lys Leu Leu Glu Asp Asn Asp Met Arg Ala Val Cys Ser 50 55 60 Leu Gly Leu Pro Glu Ala Val Trp Pro Ser Arg Asp Pro Glu Ser Ala 65 70 75 80 Ile Ala Phe Met Lys Gly Val Phe Asp Lys Ala Asn Glu Met Gly Ala 85 90 95 Glu Ala Val Ser Gly Val Thr Tyr Gly Gly Ile Gly Glu Arg Thr Asp 100 105 110 Met Pro Pro Thr Glu Ala Glu Leu Ser Asn Val Ala Arg Ala Leu Glu 115 120 125 Ala Cys Ala Ser Tyr Ala Lys Ser Leu Gly Leu Arg Phe Gly Ile Glu 130 135 140 Pro Val Asn Arg Tyr Glu Thr His Leu Leu Asn Thr Gly Trp Gln Ala 145 150 155 160 Arg Asp Met Ile Glu Arg Ile Gly Ser Asp Asn Ile Phe Ile His Leu 165 170 175 Asp Thr Tyr His Met Asn Ile Glu Glu Lys Gly Ala Ala Ser Gly Ile 180 185 190 Leu Asp Ala Arg Glu His Leu Lys Tyr Ile His Leu Ser Glu Ser Asp 195 200 205 Arg Gly Thr Pro Gly Glu Gly Cys Cys Asp Trp Asp Glu Ile Phe Ala 210 215 220 Thr Leu Ala Ala Ile Asn Phe Thr Gly Gly Leu Ala Met Glu Ser Phe 225 230 235 240 Ile Asn Met Pro Pro Glu Leu Ala His Gly Leu Ser Val Trp Arg Pro 245 250 255 Val Ala Pro Asp Phe Gln Ala Val Met Asp Lys Gly Leu Pro Phe Leu 260 265 270 Arg Asn Lys Ala Ala Gln Tyr Arg Leu Val 275 280 <210> 42 <211> 849 <212> DNA <213> Unknown <220> <223> Rhodobacterales bacterium RIFCSPHIGHO2_02_FULL_62_130 <400> 42 atggaaggtt ttggggtaca caccagcatg tggacgatga aatgggatcg tgagggcacc 60 gagcgggctg tacaggcggc agttgattac aaaatggatt ttctggaaat tgctctgctt 120 gacgctccga gcgtggacgc ggcacacacg cgcaaactcc tggaagataa cgatatgcgt 180 gcggtgtgca gtttagggtt accagaagcg gtgtggccga gtcgcgaccc agagagcgca 240 attgctttta tgaaaggagt attcgataag gccaacgaaa tgggcgccga ggcagtgagt 300 ggggtcacgt atggcggcat aggcgaacgc acagacatgc caccgacaga agcggagctg 360 agcaacgtag cccgcgcact ggaagcgtgc gcgagttatg caaaatcatt aggtctgcga 420 tttggcattg agcctgtgaa tcgttatgaa acccatctgc tgaataccgg ttggcaagca 480 cgcgatatga tcgaacgtat cggttcagat aacattttca ttcatttgga tacgtaccac 540 atgaatatcg aagagaaagg cgcggcctct ggtattttag atgcccgtga acacttgaaa 600 tacatccatt tatctgaaag tgacagaggc acgccaggcg aaggttgttg cgactgggat 660 gaaattttcg ccaccctcgc cgccattaat tttaccggcg gtcttgccat ggaaagtttc 720 attaacatgc cgccagagct ggcgcatggt ctgagcgtgt ggcgccccgt ggccccggac 780 ttccaagcgg tgatggataa aggcctgccg ttcctgcgaa acaaagccgc gcagtaccgc 840 ctggtctaa 849 <210> 43 <211> 288 <212> PRT <213> Unknown <220> <223> Thermoclostridium caenicola <400> 43 Lys Tyr Gly Ile Phe Tyr Ala Tyr Trp Glu Lys Glu Trp Lys Gly Asp 1 5 10 15 Phe Ile Thr Tyr Ile Glu Lys Val Lys Lys Leu Gly Phe Asp Ile Leu 20 25 30 Glu Val Gly Cys Gly Asp Phe His Lys Gln Pro Asp Ser Tyr Phe His 35 40 45 Thr Leu Arg Asp Ala Ala Arg Glu Tyr Asp Ile Ile Leu Thr Gly Gly 50 55 60 Tyr Gly Pro Arg Ala Glu His Asn Leu Cys Ser Pro Asp Thr Ala Val 65 70 75 80 Val Glu Asn Ala Leu Ala Phe Tyr Ser Asp Ile Phe Arg Lys Met Glu 85 90 95 Ile Ala Gly Ile Arg Ser Ile Gly Gly Gly Leu Tyr Ala Tyr Trp Pro 100 105 110 Val Asp Tyr Ser Arg Glu Pro Asp Lys Ala Gly Asp Leu Glu Arg Ser 115 120 125 Ile Lys Asn Met Arg Arg Leu Ala Asp Ile Ala Glu Arg His Gly Ile 130 135 140 Thr Leu Asn Met Glu Val Leu Asn Arg Phe Glu Gly Tyr Leu Ile Asn 145 150 155 160 Asp Thr Asn Glu Gly Leu Ala Tyr Ile Arg Ala Val Asp Lys Pro Asn 165 170 175 Val Lys Leu Met Leu Asp Thr Phe His Met Asn Ile Glu Glu Asp Ser 180 185 190 Phe Thr Glu Pro Ile Leu Gln Ala Gly Lys Tyr Leu Gly His Val His 195 200 205 Val Gly Glu Pro Asn Arg Lys Pro Pro Arg Glu Gly Arg Ile Pro Trp 210 215 220 Gly Glu Ile Gly Lys Ala Leu Arg Gln Ile Gly Tyr Asp Gly Pro Val 225 230 235 240 Val Met Glu Pro Phe Val Thr Met Gly Gly Gln Val Gly Lys Asp Ile 245 250 255 Cys Val Trp Arg Asp Leu Ser Gln Gly Ala Thr Glu Glu Asp Leu Asp 260 265 270 Arg Asp Ala Glu Lys Ser Leu Ala Phe Leu Lys Gly Met Phe Glu Ala 275 280 285 <210> 44 <211> 864 <212> DNA <213> Unknown <220> <223> Thermoclostridium caenicola <400> 44 aagtacggta tcttctatgc ttattgggaa aaggaatgga agggtgactt cattacttac 60 attgaaaagg ttaagaagct gggattcgat attcttgaag ttggttgtgg tgacttccat 120 aaacaacctg attcttactt ccatactctt agagatgctg ctagagaata tgatattatt 180 cttactggtg gttacggtcc tagagctgaa cataacttgt gttctccaga tactgctgtt 240 gttgaaaacg ctcttgcctt ctattctgat atcttcagaa aaatggagat cgctggtatt 300 agatccattg gtggtggtct gtatgcttac tggcctgttg attattctag agaacctgat 360 aaggctggtg atcttgaaag atccattaag aacatgagaa gattggctga tattgctgaa 420 agacatggta ttactcttaa tatggaagtt cttaacagat tcgaaggtta tcttattaac 480 gatactaacg aaggtcttgc ttatattaga gctgttgata aaccaaacgt taaattgatg 540 ttggatacct tccacatgaa cattgaagaa gattccttca ctgaacctat tcttcaagct 600 ggtaagtatc ttggtcatgt tcatgttggt gaacctaata gaaagccacc tagagaaggt 660 agaatccctt ggggtgaaat tggtaaagct cttagacaaa ttggttacga tggtcctgtt 720 gttatggaac cattcgttac tatgggtggt caagttggta aggatatctg tgtctggaga 780 gacttatctc aaggtgctac tgaagaggat cttgatagag atgctgaaaa gtctcttgcc 840 ttcttgaaag gtatgttcga agct 864

Claims

알룰로스를 생산하는 방법으로서,
프럭토스 기질을,
(a) D-알룰로스 3-에피머라제 효소를 포함하는 효소계;
(b) D-알룰로스 3-에피머라제 효소를 인코딩하는 핵산 분자를 포함하는 재조합 벡터로 형질전환된 숙주 세포; 및/또는
(c) (b)의 상기 숙주 세포의 용해물을 포함하는 반응 혼합물과, 상기 프럭토스 기질이 알룰로스로 전환되는 조건 하에 접촉시키는 단계를 포함하되,
상기 D-알룰로스 3-에피머라제 효소는 서열번호 1, 서열번호 3, 서열번호 5, 서열번호 7, 서열번호 9, 서열번호 11, 서열번호 13, 서열번호 15, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23, 서열번호 25, 서열번호 27, 서열번호 29, 서열번호 31, 서열번호 33, 서열번호 35, 서열번호 37, 서열번호 39, 서열번호 41 및 서열번호 43으로 이루어진 군으로부터 선택된 폴리펩타이드와 적어도 80% 서열 동일성을 갖는 아미노산 서열을 포함하는, 알룰로스를 생산하는 방법.
제1항에 있어서, 상기 반응 혼합물은 서열번호 1, 서열번호 5, 서열번호 7, 서열번호 9, 서열번호 13, 서열번호 15, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23 및 서열번호 25로 이루어진 군으로부터 선택된 폴리펩타이드와 적어도 80% 서열 동일성을 갖는 아미노산 서열을 포함하는 D-알룰로스 3-에피머라제 효소를 포함하는, 알룰로스를 생산하는 방법.
제2항에 있어서, 상기 D-알룰로스 3-에피머라제 효소는 서열번호 1, 서열번호 5, 서열번호 7, 서열번호 9, 서열번호 13, 서열번호 15, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23 및 서열번호 25로 이루어진 군으로부터 선택된 폴리펩타이드와 적어도 90% 서열 동일성을 갖는 아미노산 서열을 포함하는, 알룰로스를 생산하는 방법.
제2항에 있어서, 상기 D-알룰로스 3-에피머라제 효소는 서열번호 1, 서열번호 5, 서열번호 7, 서열번호 9, 서열번호 13, 서열번호 15, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23 및 서열번호 25로 이루어진 군으로부터 선택된 폴리펩타이드와 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는, 알룰로스를 생산하는 방법.
제2항에 있어서, 기 D-알룰로스 3-에피머라제 효소는 서열번호 1, 서열번호 5, 서열번호 7, 서열번호 9, 서열번호 13, 서열번호 15, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23 또는 서열번호 25의 아미노산 서열을 포함하는, 알룰로스를 생산하는 방법.
제1항에 있어서, 상기 반응 혼합물은 서열번호 3, 서열번호 11, 서열번호 27, 서열번호 29, 서열번호 31, 서열번호 33, 서열번호 35, 서열번호 37, 서열번호 39, 서열번호 41 및 서열번호 43으로 이루어진 군으로부터 선택된 폴리펩타이드와 적어도 90% 서열 동일성을 갖는 아미노산 서열을 포함하는 D-알룰로스 3-에피머라제 효소를 포함하는, 알룰로스를 생산하는 방법.
제6항에 있어서, 상기 D-알룰로스 3-에피머라제 효소는 서열번호 3, 서열번호 11, 서열번호 27, 서열번호 29, 서열번호 31, 서열번호 33, 서열번호 35, 서열번호 37, 서열번호 39, 서열번호 41 및 서열번호 43으로 이루어진 군으로부터 선택된 폴리펩타이드와 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는, 알룰로스를 생산하는 방법.
제6항에 있어서, 상기 D-알룰로스 3-에피머라제 효소는 서열번호 3, 서열번호 11, 서열번호 27, 서열번호 29, 서열번호 31, 서열번호 33, 서열번호 35, 서열번호 37, 서열번호 39, 서열번호 41 및 서열번호 43의 아미노산 서열을 포함하는, 알룰로스를 생산하는 방법.
제1항에 있어서, 상기 조건은 상기 효소계와 상기 프럭토스 기질을 25℃ 내지 75℃의 온도에서 유지시키는 것을 포함하는, 알룰로스를 생산하는 방법.
제1항에 있어서, 상기 조건은 상기 효소계와 상기 프럭토스 기질을 4 내지 10의 pH에서 유지시키는 것을 포함하는, 알룰로스를 생산하는 방법.
제1항에 있어서, 상기 D-알룰로스 3-에피머라제 효소는 단리된 형태인, 알룰로스를 생산하는 방법.
제1항에 있어서, 상기 D-알룰로스 3-에피머라제 효소는 고체 기질 상에 고정화된, 알룰로스를 생산하는 방법.
제1항에 있어서, 상기 반응 혼합물은 상기 D-알룰로스 3-에피머라제 효소를 인코딩하는 핵산 분자를 포함하는 재조합 벡터로 형질전환된 숙주 세포 또는 상기 숙주 세포의 용해물을 포함하되, 상기 D-알룰로스 3-에피머라제 효소를 인코딩하는 상기 핵산 분자는 서열번호 2, 서열번호 4, 서열번호 6, 서열번호 8, 서열번호 10, 서열번호 12, 서열번호 14, 서열번호 16, 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26, 서열번호 28, 서열번호 30, 서열번호 32, 서열번호 34, 서열번호 36, 서열번호 38, 서열번호 40, 서열번호 42 및 서열번호 44로 이루어진 군으로부터 선택된 폴리뉴클레오타이드 서열과 적어도 80% 서열 동일성을 갖는 폴리뉴클레오타이드 서열을 포함하는, 알룰로스를 생산하는 방법.
제13항에 있어서, 상기 숙주 세포는 효모 세포, 섬유상 진균 세포, 박테리아 세포, 포유류 세포, 식물 세포 및 라비린툴로마이세테스(Labyrinthulomycetes) 세포로 이루어진 군으로부터 선택되는, 알룰로스를 생산하는 방법.
제14항에 있어서, 상기 숙주 세포는 이. 콜라이(E. coli) 또는 피. 파스토리스(P. pastoris)인, 알룰로스를 생산하는 방법.
제13항에 있어서, 상기 재조합 벡터는 상기 숙주 세포 내에서 자기 복제 핵산 분자로서 존재하는, 알룰로스를 생산하는 방법.
제13항에 있어서, 상기 재조합 벡터는 상기 숙주 세포 염색체에 통합되는, 알룰로스를 생산하는 방법.
제1항에 있어서, 상기 반응계에 적어도 하나의 유형의 금속 이온을 첨가하는 단계를 더 포함하되, 상기 적어도 하나의 유형의 금속 이온은 마그네슘 이온, 망간 이온, 구리 이온, 아연 이온, 니켈 이온, 코발트 이온, 철 이온, 알루미늄 이온 및 칼슘 이온으로 이루어진 군으로부터 선택된, 알룰로스를 생산하는 방법.
제18항에 있어서, 상기 금속 이온은 약 0.01mM 내지 약 5mM의 농도로 첨가되는, 알룰로스를 생산하는 방법.
제1항에 있어서, 상기 프럭토스 기질이 알룰로스로 전환됨에 따라서 상기 반응계로부터 알룰로스를 포함하는 산물 스트림을 제거하는 단계를 포함하는, 알룰로스를 생산하는 방법.