KR20230009372A - D-프럭토스를 d-알룰로스로 생물전환시키기 위한 d-알룰로스 3-에피머라제 - Google Patents
D-프럭토스를 d-알룰로스로 생물전환시키기 위한 d-알룰로스 3-에피머라제 Download PDFInfo
- Publication number
- KR20230009372A KR20230009372A KR1020227035754A KR20227035754A KR20230009372A KR 20230009372 A KR20230009372 A KR 20230009372A KR 1020227035754 A KR1020227035754 A KR 1020227035754A KR 20227035754 A KR20227035754 A KR 20227035754A KR 20230009372 A KR20230009372 A KR 20230009372A
- Authority
- KR
- South Korea
- Prior art keywords
- seq
- ala
- gly
- leu
- thr
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/02—Monosaccharides
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/90—Isomerases (5.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/24—Preparation of compounds containing saccharide radicals produced by the action of an isomerase, e.g. fructose
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y501/00—Racemaces and epimerases (5.1)
- C12Y501/03—Racemaces and epimerases (5.1) acting on carbohydrates and derivatives (5.1.3)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12R—INDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
- C12R2001/00—Microorganisms ; Processes using microorganisms
- C12R2001/01—Bacteria or Actinomycetales ; using bacteria or Actinomycetales
- C12R2001/185—Escherichia
- C12R2001/19—Escherichia coli
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12R—INDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
- C12R2001/00—Microorganisms ; Processes using microorganisms
- C12R2001/645—Fungi ; Processes using fungi
- C12R2001/84—Pichia
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Mycology (AREA)
- Plant Pathology (AREA)
- Medicinal Chemistry (AREA)
- Enzymes And Modification Thereof (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
본 명세서에서는 광범위한 미생물로부터 D-알룰로스 3-에피머라제 활성을 갖는 폴리펩타이드를 코딩하는 폴리뉴클레오타이드를 식별하고 단리시키는 방법이 제공된다. 또한 D-알룰로스 3-에피머라제 활성을 코딩하는 폴리뉴클레오타이드를 포함하는 핵산 작제물, 벡터 및 재조합 숙주 세포뿐만 아니라, D-알룰로스 3-에피머라제 활성을 갖는 상기 재조합 숙주 세포 또는 D-알룰로스 3-에피머라제 활성을 갖는 상기 재조합 숙주 세포의 D-알룰로스 3-에피머라제 효소를 사용해서 프럭토스로부터 알룰로스를 생산하는 방법이 제공된다.
Description
관련 출원
본 출원은 미국 가출원 제63/022,617호(출원일: 2020년 5월 11일, 발명의 명칭: "D-ALLULOSE 3-EPIMERASES FOR BIOCONVERSION OF D-FRUCTOSE TO D-ALLULOSE")의 35 U.S.C. § 119(e)하의 이익을 주장하며, 이의 내용은 전문이 참조에 의해 본 명세서에 원용된다.
발명의 기술분야
본 발명은 D-알룰로스 3-에피머라제 효소를 사용하여 프럭토스로부터 D-알룰로스를 생산하는 방법에 관한 것이다. 본 발명은 D-알룰로스 3-에피머라제 활성을 갖는 폴리펩타이드, 및 상기 폴리펩타이드를 인코딩하는 핵산 분자를 제공한다. 본 발명은 또한 벡터를 포함하는 재조합 핵산 작제물 및 재조합 핵산 작제물을 포함하는 재조합 숙주 세포에 관한 것이다.
D-프시코스(D-psicose)로도 알려진 D-알룰로스는 프럭토스와 구조적으로 유사한 유형의 당인데, 이는 과일에 자연적으로 존재하는 당이다. D-알룰로스는 과립화된 형태로 입수 가능하고, 수크로스 결정처럼 보인다. 알룰로스는 수크로스의 감미도의 70%를 갖는 저칼로리 감미제이다. 미국 식품의약국(FDA)에 따르면, 알룰로스는 약 0.4 칼로리/그램을 제공하는데, 이는 수크로스에 의해 제공되는 4 칼로리/그램보다 상당히 더 낮다. 인체는 알룰로스를 흡수하는 능력을 갖지만, 알룰로스를 대사하는 능력은 부족하다. 그 결과, 알룰로스는 혈당 또는 인슐린 수준에 영향이 거의 내지 전혀 없다. 이러한 이유로, 알룰로스는 저칼로리 감미제로서 간주된다.
알룰로스는 말린 과일, 흑설탕 및 메이플 시럽과 같은 일부 식품에서 극히 소량으로 자연적으로 발견된다. 알룰로스의 화학적 합성은 어렵고, 재조합 미생물을 사용하여 프럭토스와 같은 용이하게 입수 가능한 당으로부터 알룰로스를 생산하는 현장에서 요구된다.
D-알룰로스 3-에피머라제(DAE, D-프시코스 3-에피머라제(DPE)로도 명명됨)를 포함하는 케토스 3-에피머라제 패밀리로부터의 효소는 D-프럭토스의 D-알룰로스로의 가역적 전환을 촉매할 수 있다. D-알룰로스 3-에피머라제는 D-프럭토스의 D-알룰로스로의 생물전환을 위한 높은 활성을 가질 수 있다. 본 발명은, 특히, D-알룰로스 3-에피머라제 활성을 갖는 재조합 폴리펩타이드를 사용해서 D-프럭토스로부터 D-알룰로스를 생산하기 위한 방법을 제공한다.
일 실시형태에서, 본 발명의 방법은, 프럭토스 기질을, D-알룰로스 3-에피머라제 효소 활성을 갖는 재조합 폴리펩타이드를 포함하는 효소계를 포함하는 반응 혼합물과, D-프럭토스 기질이 D-알룰로스로 전환되도록 하는 조건하에서 접촉시키는 단계를 포함한다. 본 발명의 일 양상에서, 효소계는 D-알룰로스를 생산물로서 생산하는 기질로서 D-알룰로스 3-에피머라제 효소 활성을 갖는 재조합 폴리펩타이드 및 D-프럭토스를 제공한다. 본 발명의 또 다른 양상에서, 본 발명의 방법은 프럭토스 기질을, D-알룰로스 3-에피머라제 효소의 소스로서 외인성 D-알룰로스 3-에피머라제를 발현 가능한 숙주 세포 또는 이러한 숙주 세포의 용해물을 포함하는 반응 혼합물과 접촉시키는 것을 포함할 수 있다. 본 실시형태의 소정의 양상에서, 효소계에 존재하는 D-알룰로스 3-에피머라제 효소는 정제된 효소이고, 이것은 당업계에 공지된 하나 이상의 생화학 기술을 사용해서 D-알룰로스 3-에피머라제 효소를 발현하는 숙주 세포의 용해물로부터 유래될 수 있다. 본 발명의 또 다른 양상에서, D-알룰로스 3-에피머라제의 정제된 형태는 고체 지지체 상에 고정화된다. 다양한 실시형태에서, 본 발명의 방법은 반응계에 적어도 하나의 유형의 금속 이온을 첨가하는 단계를 더 포함할 수 있다. 예를 들어, 금속 이온은 마그네슘 이온, 망간 이온, 구리 이온, 아연 이온, 니켈 이온, 코발트 이온, 철 이온, 알루미늄 이온 및 칼슘 이온으로 이루어진 군으로부터 선택될 수 있다. 일부 바람직한 실시형태에서, 망간 이온 및/또는 마그네슘 이온이 반응계에 첨가된다. 금속 이온은 약 0.01mM 내지 약 5mM(예컨대, 0.01mM, 0.05mM, 0.1mM, 0.2mM, 0.3mM, 0.4mM, 0.5mM, 0.6mM, 0.7mM, 0.8mM, 0.9mM, 1mM, 2mM, 3mM, 4mM 또는 5mM)의 농도로 첨가될 수 있다. 다양한 양상에서, 본 발명의 방법은 반응계에 남아 있는 프럭토스가 없는 알룰로스를 포함하는 산물 스트림을 제거하는 단계를 포함할 수 있다.
다른 실시형태에서, 본 발명은 D-알룰로스 3-에피머라제 활성을 갖는 폴리펩타이드를 코딩하는 폴리뉴클레오타이드 서열을 제공한다. 본 실시형태의 일 양상에서, D-알룰로스 3-에피머라제 활성을 갖는 폴리펩타이드를 코딩하는 폴리뉴클레오타이드는 프로모터 및 종결자와 같은 요구되는 조절 요소를 갖는 적절한 플라스미드 발현 벡터에 클로닝된다. 일 양상에서, 플라스미드 발현 벡터는 D-알룰로스 3-에피머라제 효소 활성의 발현이 소정의 화학물질을 사용함으로써 유도될 수 있도록 유도성 프로모터를 갖는다.
또 다른 실시형태에서, D-알룰로스 3-에피머라제 활성을 갖는 폴리펩타이드를 코딩하는 폴리뉴클레오타이드 서열을 포함하는 발현 플라스미드 벡터는 원핵 미생물 세포 또는 진핵 미생물 세포 또는 진핵 동물 세포 또는 진핵 식물 세포를 포함하는 숙주 세포를 형질전환시키는 데 사용된다. 일 양상에서, 형질전환된 숙주 세포 내의 발현 플라스미드 벡터는 자기 복제 핵산 실체로서 존재한다. 본 실시형태의 또 다른 양상에서, 발현 플라스미드 벡터는 숙주 염색체 DNA에 통합된다.
다른 실시형태에서, 본 발명은 D-알룰로스 3-에피머라제가 연루된 반응에서 기질로서 D-프럭토스가 없는 D-알룰로스를 회수하기 위한 방법을 제공한다.
일부 실시형태에서, 본 명세서에 기재된 알룰로스를 생산하는 방법은, 프럭토스 기질을,
(a) D-알룰로스 3-에피머라제 효소를 포함하는 효소계;
(b) D-알룰로스 3-에피머라제 효소를 인코딩하는 핵산 분자를 포함하는 재조합 벡터로 형질전환된 숙주 세포; 및/또는
(c) (b)의 숙주 세포의 용해물을 포함하는 반응 혼합물과, 프럭토스 기질이 알룰로스로 전환되는 조건 하에 접촉시키는 단계를 포함하되, 여기서 D-알룰로스 3-에피머라제 효소는 서열번호 1, 서열번호 3, 서열번호 5, 서열번호 7, 서열번호 9, 서열번호 11, 서열번호 13, 서열번호 15, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23, 서열번호 25, 서열번호 27, 서열번호 29, 서열번호 31, 서열번호 33, 서열번호 35, 서열번호 37, 서열번호 39, 서열번호 41 및 서열번호 43으로 이루어진 군으로부터 선택된 폴리펩타이드와 적어도 80%(예컨대, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99% 또는 100%) 서열 동일성을 갖는 아미노산 서열을 포함한다. 일부 실시형태에서, 반응 혼합물은 서열번호 1, 서열번호 5, 서열번호 7, 서열번호 9, 서열번호 13, 서열번호 15, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23 및 서열번호 25로 이루어진 군으로부터 선택된 폴리펩타이드와 적어도 80%(예컨대, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99% 또는 100%) 서열 동일성을 갖는 아미노산 서열을 포함하는 D-알룰로스 3-에피머라제 효소를 포함한다.
일부 실시형태에서, D-알룰로스 3-에피머라제 효소는 서열번호 1, 서열번호 5, 서열번호 7, 서열번호 9, 서열번호 13, 서열번호 15, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23 및 서열번호 25로 이루어진 군으로부터 선택된 폴리펩타이드와 적어도 90%(예컨대, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%) 서열 동일성을 갖는 아미노산 서열을 포함한다.
일부 실시형태에서, D-알룰로스 3-에피머라제 효소는 서열번호 1, 서열번호 5, 서열번호 7, 서열번호 9, 서열번호 13, 서열번호 15, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23 및 서열번호 25로 이루어진 군으로부터 선택된 폴리펩타이드와 적어도 95%(예컨대, 95%, 96%, 97%, 98%, 00% 또는 100%) 서열 동일성을 갖는 아미노산 서열을 포함한다.
일부 실시형태에서, D-알룰로스 3-에피머라제 효소는 서열번호 1, 서열번호 5, 서열번호 7, 서열번호 9, 서열번호 13, 서열번호 15, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23 또는 서열번호 25의 아미노산 서열을 포함한다. 일부 실시형태에서, D-알룰로스 3-에피머라제 효소는 서열번호 5의 아미노산 서열을 포함한다.
일부 실시형태에서, 반응 혼합물은 서열번호 3, 서열번호 11, 서열번호 27, 서열번호 29, 서열번호 31, 서열번호 33, 서열번호 35, 서열번호 37, 서열번호 39, 서열번호 41 및 서열번호 43으로 이루어진 군으로부터 선택된 폴리펩타이드와 적어도 80%(예컨대, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99% 또는 100%) 서열 동일성을 갖는 아미노산 서열을 포함하는 D-알룰로스 3-에피머라제 효소를 포함한다.
일부 실시형태에서, D-알룰로스 3-에피머라제 효소는 서열번호 3, 서열번호 11, 서열번호 27, 서열번호 29, 서열번호 31, 서열번호 33, 서열번호 35, 서열번호 37, 서열번호 39, 서열번호 41 및 서열번호 43으로 이루어진 군으로부터 선택된 폴리펩타이드와 적어도 90%(예컨대, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%) 서열 동일성을 갖는 아미노산 서열을 포함한다.
일부 실시형태에서, D-알룰로스 3-에피머라제 효소는 서열번호 3, 서열번호 11, 서열번호 27, 서열번호 29, 서열번호 31, 서열번호 33, 서열번호 35, 서열번호 37, 서열번호 39, 서열번호 41 및 서열번호 43으로 이루어진 군으로부터 선택된 폴리펩타이드와 적어도 95%(예컨대, 95%, 96%, 97%, 98%, 00% 또는 100%) 서열 동일성을 갖는 아미노산 서열을 포함한다.
일부 실시형태에서, D-알룰로스 3-에피머라제 효소는 서열번호 3, 서열번호 11, 서열번호 27, 서열번호 29, 서열번호 31, 서열번호 33, 서열번호 35, 서열번호 37, 서열번호 39, 서열번호 41 및 서열번호 43의 아미노산 서열을 포함한다.
일부 실시형태에서, 조건은 효소계와 프럭토스 기질을 25℃ 내지 75℃(예컨대, 25℃, 30℃, 35℃, 40℃, 45℃, 50℃, 55℃, 60℃, 65℃, 70℃ 또는 75℃)의 온도에서 유지시키는 것을 포함한다.
일부 실시형태에서, 조건은 효소계와 프럭토스 기질을 4 내지 10(예컨대, 4, 4.5, 5, 5.5, 6, 6.5, 7, 7.5, 8, 8.5, 9, 9.5 또는 10)의 pH에서 유지시키는 것을 포함한다.
일부 실시형태에서, D-알룰로스 3-에피머라제 효소는 단리된 형태이다. 일부 실시형태에서, D-알룰로스 3-에피머라제 효소는 고체 기질 상에 고정화된다.
일부 실시형태에서, 반응 혼합물은 D-알룰로스 3-에피머라제 효소를 인코딩하는 핵산 분자를 포함하는 재조합 벡터로 형질전환된 숙주 세포 또는 상기 숙주 세포의 용해물을 포함하되, 여기서 D-알룰로스 3-에피머라제 효소를 인코딩하는 핵산 분자는 서열번호 2, 서열번호 4, 서열번호 6, 서열번호 8, 서열번호 10, 서열번호 12, 서열번호 14, 서열번호 16, 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26, 서열번호 28, 서열번호 30, 서열번호 32, 서열번호 34, 서열번호 36, 서열번호 38, 서열번호 40, 서열번호 42 및 서열번호 44로 이루어진 군으로부터 선택된 폴리뉴클레오타이드 서열과 적어도 80%(예컨대, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99% 또는 100%) 서열 동일성을 갖는 폴리뉴클레오타이드 서열을 포함한다. 일부 실시형태에서, D-알룰로스 3-에피머라제 효소를 인코딩하는 핵산 분자는 서열번호 44의 폴리뉴클레오타이드 서열을 포함한다.
일부 실시형태에서, 숙주 세포는 효모 세포, 섬유상 진균 세포, 박테리아 세포, 포유류 세포, 식물 세포 및 라비린툴로마이세테스(Labyrinthulomycetes) 세포. 일부 실시형태에서, 숙주 세포는 이. 콜라이(E. coli) 또는 피. 파스토리스(P. pastoris)로 이루어진 군으로부터 선택된다. 일부 실시형태에서, 재조합 벡터는 숙주 세포 내에서 자기 복제 핵산 분자로서 존재한다. 일부 실시형태에서, 재조합 벡터는 숙주 세포 염색체에 통합된다.
일부 실시형태에서, 방법은 반응계에 적어도 하나의 유형의 금속 이온을 첨가하는 단계를 더 포함하되, 여기서 상기 적어도 하나의 유형의 금속 이온은 마그네슘 이온, 망간 이온, 구리 이온, 아연 이온, 니켈 이온, 코발트 이온, 철 이온, 알루미늄 이온 및 칼슘 이온으로 이루어진 군으로부터 선택된다. 일부 실시형태에서, 금속 이온은 약 0.01mM 내지 약 5mM(예컨대, 0.01mM, 0.05mM, 0.1mM, 0.2mM, 0.3mM, 0.4mM, 0.5mM, 0.6mM, 0.7mM, 0.8mM, 0.9mM, 1mM, 2mM, 3mM, 4mM 또는 5mM)의 농도로 첨가된다. 일부 실시형태에서, 방법은 프럭토스 기질이 알룰로스 전환됨에 따라서 반응계로부터 알룰로스를 포함하는 산물 스트림을 제거하는 단계를 더 포함한다.
하기 도면은 본 명세서의 부분을 형성하고, 본 개시내용의 소정의 양상을 더욱 입증하기 위하여 포함되며, 이는 본 명세서에서 제시된 특정 실시형태의 상세한 설명과 조합하여 이들 도면의 하나 이상을 참조함으로써 더욱 잘 이해될 수 있다.
도 1. D-알룰로스 3-에피머라제(DAE)에 의한 D-프럭토스의 D-알룰로스로의 생물전환.
도 2A 내지 도 2B. D-알룰로스 3-에피머라제 후보의 효소 스크리닝. D-알룰로스 3-에피머라제 활성을 갖는 정제된 후보 재조합 폴리펩타이드를 50mM 인산염 완충액(pH 7.2)에 대해서 투석하고, D-프럭토스를 기질로서 사용함으로써 D-알룰로스 합성에 대해서 검정하였다. 전형적으로, 재조합 폴리펩타이드(5 내지 10㎍)를 200㎕ 시험관내 반응계에서 시험하였다. 반응계는 20mM Tris-HCl 완충액, pH 8.0, 3mM MgCl2 또는 MnSO4, 20g/ℓ D-프럭토스를 함유하였다. 반응은 60℃에서 수행하였고, 반응은 10분 동안 가열함으로써 2시간에(도 2A) 그리고 16시간에(도 2B) 종결되었다. D-프럭토스 및 D-알룰로스의 양을 결정하기 위한 HPLC에 의해 샘플을 분석하였다.
도 3. pHKA-AL39 플라스미드 작제물의 맵.
도 4A 내지 도 4B. 조작된 피키아 파스토리스(Pichia pastoris) 균주에 의해 생산된 AL 효소의 식별 및 특성규명. 도 4A는 조작된 피키아 파스토리스 균주의 배양 배지로부터 분비된 AL39 효소의 SDS-PAGE(16%) 분석을 도시한다. AL39 효소는 화살표에 의해 나타낸다. M: 단백질 사다리; S: 조작된 피키아 파스토리스 균주의 배양 배지의 샘플(12㎕). 도 4B는 DAE 활성을 도시한다. 배양 배지는 1시간 반응 후에 프럭토스 및 알룰로스의 존재에 대해서 분석하였다.
도 5. 재사용 사이클(1 내지 5)을 거쳐서 고정화된 AL39 효소의 DAE 활성의 비교.
도 1. D-알룰로스 3-에피머라제(DAE)에 의한 D-프럭토스의 D-알룰로스로의 생물전환.
도 2A 내지 도 2B. D-알룰로스 3-에피머라제 후보의 효소 스크리닝. D-알룰로스 3-에피머라제 활성을 갖는 정제된 후보 재조합 폴리펩타이드를 50mM 인산염 완충액(pH 7.2)에 대해서 투석하고, D-프럭토스를 기질로서 사용함으로써 D-알룰로스 합성에 대해서 검정하였다. 전형적으로, 재조합 폴리펩타이드(5 내지 10㎍)를 200㎕ 시험관내 반응계에서 시험하였다. 반응계는 20mM Tris-HCl 완충액, pH 8.0, 3mM MgCl2 또는 MnSO4, 20g/ℓ D-프럭토스를 함유하였다. 반응은 60℃에서 수행하였고, 반응은 10분 동안 가열함으로써 2시간에(도 2A) 그리고 16시간에(도 2B) 종결되었다. D-프럭토스 및 D-알룰로스의 양을 결정하기 위한 HPLC에 의해 샘플을 분석하였다.
도 3. pHKA-AL39 플라스미드 작제물의 맵.
도 4A 내지 도 4B. 조작된 피키아 파스토리스(Pichia pastoris) 균주에 의해 생산된 AL 효소의 식별 및 특성규명. 도 4A는 조작된 피키아 파스토리스 균주의 배양 배지로부터 분비된 AL39 효소의 SDS-PAGE(16%) 분석을 도시한다. AL39 효소는 화살표에 의해 나타낸다. M: 단백질 사다리; S: 조작된 피키아 파스토리스 균주의 배양 배지의 샘플(12㎕). 도 4B는 DAE 활성을 도시한다. 배양 배지는 1시간 반응 후에 프럭토스 및 알룰로스의 존재에 대해서 분석하였다.
도 5. 재사용 사이클(1 내지 5)을 거쳐서 고정화된 AL39 효소의 DAE 활성의 비교.
본 발명에 따른 알룰로스를 생산하기 위한 방법은 프럭토스 기질을 D-알룰로스 3-에피머라제 활성을 갖는 폴리펩타이드를 포함하는 반응 혼합물과 접촉시키는 단계를 포함한다. D-프럭토스는 바람직한 기질이고, D-알룰로스 3-에피머라제는 바람직한 효소이다. 본 발명에 따른 반응 혼합물은 하나 이상의 보조인자를 더 포함할 수 있다. 2가 양이온은 본 발명에 따른 반응 혼합물에서 바람직한 보조인자이다. 망간 및 마그네슘은 바람직한 2가 양이온이고, 이들은 각각 MgCl2 및 MnSO4로서 공급될 수 있다. 기타 적합한 2가 양이온은 구리 이온, 아연 이온, 니켈 이온, 코발트 이온, 철 이온, 알루미늄 이온 및 칼슘 이온을 포함할 수 있다. 본 발명의 일 실시형태에서, 본 발명에 따라 사용된 D-알룰로스 3-에피머라제는 적합한 완충액에서 고도로 정제된 균질한 재조합 단백질로서 제공된다. 본 발명의 또 다른 실시형태에서, 본 발명에 따라 사용되는 D-알룰로스 3-에피머라제는 고체 지지체 상에 고정된 고도로 정제된 재조합 단백질로서 제공된다. 본 발명의 또 다른 실시형태에서, 반응 혼합물은 재조합 D-알룰로스 3-에피머라제를 발현하는 재조합 원핵 세포 또는 재조합 진핵 세포를 포함하고 그 재조합 원핵 세포 또는 재조합 진핵 세포는 D-알룰로스 3-에피머라제의 소스로서 사용된다.
본 발명에 따른 숙주 세포는 D-알룰로스 3-에피머라제 활성을 갖는 상동성 단백질의 발현에 적합한 임의의 세포이다. 3-에피머라제 활성을 갖는 상동성 단백질을 발현하는 이러한 숙주 세포는 D-알룰로스 3-에피머라제 활성을 갖는 폴리펩타이드를 코딩하는 폴리뉴클레오타이드 서열을 포함하는 재조합 플라스미드로 숙주 세포의 형질전환에 기인되고, 이러한 숙주 세포는 본 발명에서 재조합 숙주 세포로 지칭된다. 본 발명에 적합한 숙주 세포의 일람은, 박테리아 세포, 효모 세포, 식물 세포, 동물 세포 및 라비린툴로마이세테스 세포를 포함하지만, 이들로 제한되지 않는다. 일부 실시형태에서, 세포계는 박테리아 세포, 효모 세포 또는 이들의 조합을 포함한다. 본 발명에 적합한 박테리아 세포는, 제한 없이, 에스케리키아 종(Escherichia spp.), 스트렙토마이세스 종(Streptomyces spp.), 지모모나스 종(Zymomonas spp.), 아세토박터 종(Acetobacter spp.), 시트로박터 종(Citrobacter spp.), 시네코시스티스 종(Synechocystis spp.), 리조븀 종(Rhizobium spp.), 클로스트리듐 종(Clostridium spp.), 코리네박테리움 종(Corynebacterium spp.), 스트렙토코커스 종(Streptococcus spp.), 잔토모나스 종(Xanthomonas spp.), 락토바실러스 종(Lactobacillus spp.), 락토코커스 종(Lactococcus spp.), 바실러스 종(Bacillus spp.), 알칼리게네스 종(Alcaligenes spp.), 슈도모나스 종(Pseudomonas spp.), 아에로모나스 종(Aeromonas spp.), 아조토박터 종(Azotobacter spp.), 코마모나 종스(Comamonas spp.), 미코박테리움 종(Mycobacterium spp.), 로도코커스 종(Rhodococcus spp.), 글루코노박터 종(Gluconobacter spp.), 랄스토니아 종(Ralstonia spp.), 아시디티오바실러스 종(Acidithiobacillus spp.), 마이크로루나투스 종(Microlunatus spp.), 지오박터 종(Geobacter spp.), 지오바실러스 종(Geobacillus spp.), 아트로박터 종(Arthrobacter spp.), 플라보박테리움 종(Flavobacterium spp.), 세라티아 종(Serratia spp.), 사카로폴리스포라 종(Saccharopolyspora spp.), 테르무스 종(Thermus spp.), 스테노트로포모나스 종(Stenotrophomonas spp.), 크로모박테리움 종(Chromobacterium spp.), 시노리조븀 종(Sinorhizobium spp.), 사카로폴리스포라 종(Saccharopolyspora spp.), 아그로박테리움 종(Agrobacterium spp.), 판토이아 종(Pantoea spp.) 및 비브리오 나트리에겐스(Vibrio natriegens)를 포함한다.. 본 발명에 적합한 효모 세포는, 제한 없이, 조작된 사카로마이세스 종(Saccharomyces spp.), 스키조사카로마이세스(Schizosaccharomyces), 한세눌라(Hansenula), 칸디다(Candida), 클루이베로마이세스(Kluyveromyces), 야로위아(Yarrowia), 칸디다 보이디니이(Candida boidinii) 및 피치아(Pichia)를 포함한다.
용어 세포 배양물은 배양물 중에 있는 재조합 숙주 세포를 포함하는 임의의 세포 또는 세포들을 지칭한다. 배양은 제어된 조건하에서, 전형적으로 이의 자연 환경의 외부에서 세포가 성장되는 과정이다. 예를 들어, 세포, 예를 들어, 효모 세포는 액체 영양소 브로쓰에서의 세포 현탁액으로서 성장될 수 있다. 세포 배양물은 박테리아 세포 배양물, 효모 세포 배양물, 식물 세포 배양물, 및 동물 세포 배양물을 포함하지만, 이로 제한되지 않는다.
일부 실시형태에서, 세포는 16℃ 내지 40℃의 온도에서 배양된다. 예를 들어, 세포는 16℃, 17℃, 18℃, 19℃, 20℃, 21℃, 22℃, 23℃, 24℃, 25℃, 26℃, 27℃, 28℃, 29℃, 30℃, 31℃, 32℃, 33℃, 34℃, 35℃, 36℃, 37℃, 38℃, 39℃ 또는 40℃의 온도에서 배양될 수 있다.
일부 실시형태에서, 세포는 12시간 내지 72시간 또는 그 이상의 기간 동안 배양된다. 예를 들어, 세포는 12, 18, 24, 30, 36, 42, 48, 54, 60, 66 또는 72시간의 기간 동안 배양된다. 전형적으로, 박테리아 세포와 같은 세포는 12 내지 24시간의 기간 동안 배양된다. 일부 실시형태에서, 세포는 37℃의 온도에서 12 내지 24시간 동안 배양된다. 일부 실시형태에서, 세포는 16℃의 온도에서 12 내지 24시간 동안 배양된다.
일부 실시형태에서, 세포는 1×108(OD600<1) 내지 2×1011(OD ~ 200)개 생존 가능 세포/㎖ 세포 배양 배지의 밀도로 배양된다. 일부 실시형태에서, 세포는 1×108, 2×108, 3×108, 4×108, 5×108, 6×108, 7×108, 8×108, 9×108, 1×109, 2×109, 3×109, 4×109, 5×109, 6×109, 7×109, 8×109, 9×109, 1×1010, 2×1010, 3×1010, 4×1010, 5×1010, 6×1010, 7×1010, 8×1010, 9×1010, 1×1011 또는 2×1011개의 생존 가능 세포/㎖의 밀도로 배양된다. (전환 인자: OD 1 = 8×108개 세포/㎖).
숙주 세포에 의해 단백질 발현을 유도하기 위하여, 0.5mM 아이소프로필 β-D-1-티오갈락토피라노사이드(IPTG)를 첨가하고, 16℃에서 22시간 동안 배양물을 더욱 성장시켰다. 세포를 원심분리(3,000×g; 10분; 4℃)에 의해 수거하였다. 세포 펠릿을 수집하고 즉시 사용하거나 -80℃에서 보관하였다.
일부 실시형태에서, 세포 펠릿은 D-알룰로스 3-에피머라제 활성을 갖는 폴리펩타이드를 발현하는 숙주 세포로부터 수거된다. 일부 실시형태에서, 숙주 세포 펠릿은 다양한 농도로 재현탁될 수 있다. 일부 실시형태에서, 숙주 세포 펠릿은 1 g/ℓ 내지 250 g/ℓ의 농도로 재현탁된다. 일부 실시형태에서, 세포계로부터 수거된 숙주 세포 펠릿은 1 g/ℓ, 10 g/ℓ, 25 g/ℓ, 50 g/ℓ, 75 g/ℓ, 100 g/ℓ, 125 g/ℓ, 150 g/ℓ, 175 g/ℓ, 200 g/ℓ, 225 g/ℓ 또는 250 g/ℓ의 농도로 재현탁된다.
본 명세서에서 사용되는 바와 같은 용어 "인큐베이션시키는" 및 "인큐베이션"은 2개 이상의 화학적 또는 생물학적 실체 또는 적어도 1개의 화학적 실체 및 적어도 1개의 생물학적 실체(예컨대, 화학적 화합물 및 효소)를 혼합하고, 이들이 본 명세서에 기재된 바와 같은 D-알룰로스와 같은 생성물을 생산하기에 바람직한 조건 하에 상호작용하게 두는 공정을 지칭한다.
용어 "하류 분리 공정"은 원래의 기질 D-프럭토스로부터 최종 생성물인 D-알룰로스를 회수하는 것을 의미한다. 프럭토스가 D-알룰로스를 생성하기 위하여 효소 반응에서 기질로서 사용되는 경우, 프럭토스는 반응에서 완전히 소비되지 않고, 효소 반응의 말기에 상당한 양의 프럭토스가 반응 매질에 여전히 존재한다. D-프럭토스와 D-알룰로스는 유사한 물리적 및 화학적 특성을 가지므로, 기질로서의 프럭토스와 D-알룰로스 3-에피머라제가 연루된 효소 반응의 말기에 이들을 분리하는 것은 어렵다. D-프럭토스가 없는 D-알룰로스를 회수하는 하나의 가능한 방식은 남아 있는 프럭토스를 만니톨로 전환시키고 D-알룰로스를 만니톨로부터 분리시키는 것이다. NADPH- 또는 NADH-의존적 만니톨 탈수소효소는 D-프럭토스를 만니톨로 전환시키는 데 사용될 수 있다. 만니톨 탈수소효소는 만니톨 탈수소효소의 작용에 요구되는 환원된 보조인자인 NADH를 재생시키기 위하여 2-효소계에서 폼에이트 탈수소효소와 함께 사용될 수 있다. 폼에이트 탈수소효소는 폼에이트를 이산화탄소로 전환시키고 NAD를 NADH로 환원시킨다. 만니톨은 냉 결정화를 통해서 수용액으로부터 결정화될 수 있고, D-알룰로스는 D-프럭토스가 없는 형태로 회수될 수 있다. (Saha, B. C. and Racine, F. M. (2011) Biotechnological production of mannitol and its applications. Appl Microbiol Biotechnol. 89:879-891; 미국 특허 제10266862B2호).
용어 고정화는 D-알룰로스 3-에피머라제 또는 D-알룰로스 3-에피머라제 활성을 갖는 정제된 폴리펩타이드를 발현하는 숙주 세포를 당업계에 충분히 공지된 하나 또는 다른 방법을 사용하여 고체 지지체에 결합시키는 것을 지칭한다. 해조류에 대해서 유도된 알긴산나트륨은, 특허 문서 US2019169591A1에 상세히 기재된 바와 같이 D-알룰로스 3-에피머라제 또는 D-알룰로스 3-에피머라제 활성을 갖는 정제된 폴리펩타이드를 발현하는 숙주 세포를 고정화시키기 위하여 고체 지지체로서 사용될 수 있다.
용어 "핵산" 및 "뉴클레오타이드"는 당업자가 이해하는 바와 같은 이의 각각의 통상적이고 관례적인 의미에 따라 사용되며, 제한 없이 단일쇄 또는 이중쇄 형태의 데옥시리보뉴클레오타이드 또는 리보뉴클레오타이드 및 이의 중합체를 지칭하기 위하여 사용된다. 구체적으로 제한되지 않는 한, 이 용어는 참조 핵산과 유사한 결합 특성을 가지며 천연 발생 뉴클레오타이드와 유사한 방식으로 대사되는 천연 뉴클레오타이드의 알려진 유사체를 함유하는 핵산을 포괄한다. 달리 나타내지 않는 한, 특정 핵산 서열은 명시적으로 나타낸 서열뿐만 아니라, 묵시적으로 보존적으로 변형된 서열 또는 이의 축퇴성 변이체(예컨대, 축퇴성 코돈 치환) 및 상보성 서열 또한 포괄한다.
용어 "폴리펩타이드," "단백질" 및 "펩타이드"는 당업자가 이해하는 바와 같은 이의 각각의 통상적이고 관례적인 의미에 따라 사용되며; 이러한 3개 용어는 때때로 호환 가능하게 사용되며, 그 크기 또는 기능과 무관하게 비제한적으로 아미노산 또는 아미노산 유사체의 중합체를 나타내기 위하여 사용된다. "단백질"은 종종 상대적으로 큰 폴리펩타이드를 나타내는 데 사용되며 "펩타이드"는 종종 작은 폴리펩타이드를 나타내는 데 사용되지만, 당업계에서 이들 용어의 사용은 중첩되며 변한다. 본 명세서에서 사용되는 바와 같은 용어 "폴리펩타이드"는, 달리 언급되지 않는 한, 펩타이드, 폴리펩타이드 및 단백질을 지칭한다. 용어 "단백질", "폴리펩타이드" 및 "펩타이드"는 폴리펩타이드 산물을 지칭하는 경우 본 명세서에서 호환 가능하게 사용된다. 따라서, 예시적인 폴리펩타이드는 폴리펩타이드 산물, 천연 발생 단백질, 상동체, 오쏘로그, 파라로그, 단편 및 이의 다른 등가물, 변이체 및 유사체를 포함한다.
폴리펩타이드 또는 단백질의 "기능적 단편"이란 용어는 전장 폴리펩타이드 또는 단백질의 일부이며, 전장 폴리펩타이드 또는 단백질과 실질적으로 동일한 생물학적 활성을 갖거나 실질적으로 동일한 기능을 수행하는(예컨대, 동일한 효소 반응을 수행하는) 펩타이드 단편을 나타낸다.
용어 "기능적 변이체"는 보존적으로 치환된 변이체를 더 포함한다. 용어 "보존적으로 치환된 변이체"는 하나 이상의 보존적 아미노산 치환에 의해 참조 펩타이드와는 상이하며 참조 펩타이드의 일부 또는 모든 활성을 유지하는 아미노산 서열을 갖는 펩타이드를 나타낸다. "보존적 아미노산 치환"은 아미노산 잔기의 기능적으로 유사한 잔기로의 치환이다. 보존적 치환의 예는 하나의 비극성(소수성) 잔기, 예컨대, 아이소류신, 발린, 류신 또는 메티오닌의 또 다른 비극성(소수성) 잔기로의 치환; 하나의 하전된 또는 극성(친수성) 잔기의 또 다른 극성(친수성) 잔기, 예컨대, 아르기닌과 라이신 간, 글루타민과 아스파라긴 간, 트레오닌과 세린 간 치환; 하나의 염기성 잔기, 예컨대, 라이신 또는 아르기닌의 또 다른 염기성 잔기로의 치환; 또는 하나의 산성 잔기, 예컨대, 아스파르트산 또는 글루탐산의 또 다른 산성 잔기로의 치환; 또는 하나의 방향족 잔기, 예컨대, 페닐알라닌, 티로신 또는 트립토판의 또 다른 방향족 잔기로의 치환이 포함된다. 이러한 치환은 단백질 또는 폴리펩타이드의 겉보기 분자량 또는 등전점에 대한 효과를 거의 또는 전혀 갖지 않을 것으로 예상된다. 어구 "보존적으로 치환된 변이체"는, 생성 펩타이드가 본 명세서에 기재된 바와 같은 참조 펩타이드의 일부 또는 모든 활성을 유지하는 한, 잔기가 화학적으로 유도체화된 잔기로 대체되는 펩타이드를 또한 포함한다.
주제 기술의 폴리펩타이드에 관한 용어 "변이체"는, 참조 폴리펩타이드의 아미노산 서열과 적어도 75%, 적어도 76%, 적어도 77%, 적어도 78%, 적어도 79%, 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 및 심지어 100% 동일한 아미노산 서열을 가진 기능적으로 활성인 폴리펩타이드를 더 포함한다.
모든 문법적 형태 및 철자 변형에 있어서의 용어 "상동성(homologous)"은 수퍼 패밀리로부터의 폴리뉴클레오타이드 또는 폴리펩타이드 및 상이한 종으로부터의 상동성 폴리뉴클레오타이드 또는 단백질을 포함하는, "공통 진화 기원"을 보유하는 폴리뉴클레오타이드 또는 폴리펩타이드 간 관계를 나타낸다(Reeck et al., Cell 50:667, 1987). 이러한 폴리뉴클레오타이드 또는 폴리펩타이드는, 보존된 위치에서의 동일성 백분율 또는 특정 아미노산 또는 모티브의존재의 관점과 무관하게, 이의 서열 유사성으로 반영되는 서열 상동성을 갖는다. 예를 들어, 2개의 상동성 폴리펩타이드는 적어도 75%, 적어도 76%, 적어도 77%, 적어도 78%, 적어도 79%, 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 및 심지어 100% 동일한 아미노산 서열을 가질 수 있다.
본 기술의 변종 폴리펩타이드 서열과 관련하여 "퍼센트(%) 아미노산 서열 동일성"은, 필요한 경우, 서열 동일성의 부분으로서 임의의 보존적 치환을 고려하지 않고 최대 퍼센트 서열 동일성을 달성하기 위해 서열을 정렬하고 갭을 도입한 후에, 참조 폴리펩타이드의 아미노산 잔기와 동일한, 후보 서열에서 아미노산 잔기의 백분율을 지칭하는 것이다.
퍼센트 아미노산 서열 동일성을 결정하기 위한 정렬은, 예를 들어, BLAST, BLAST-2, ALIGN, ALIGN-2 또는 Megalign(DNASTAR) 소프트웨어와 같은 공개적으로 이용 가능한 컴퓨터 소프트웨어를 사용하여 당해 기술분야의 기술 내에 있는 다양한 방식으로 달성될 수 있다. 당업자는 비교되는 서열의 전체 길이에 걸쳐 최대 정렬을 달성하는 데 필요한 임의의 알고리즘을 포함하는, 정렬을 측정하기 위한 적절한 파라미터를 결정할 수 있다. 예를 들어, % 아미노산 서열 동일성은 서열 비교 프로그램 NCBI-BLAST2를 사용하여 결정될 수 있다. NCBI-BLAST2 서열 비교 프로그램은 ncbi.nlm.nih.gov로부터 다운로딩될 수 있다. NCBI BLAST2는 여러 조사 파라미터를 사용하고, 여기서, 그러한 조사 파라미터 모두는 예를 들어, 언마스크 예스(unmask yes), 스트랜드=모두, 예상된 발생 10, 최소 낮은 복잡성 길이=15/5, 다중-패스 e-값=0.01, 다중-패스에 대한 상수 =25, 최종 갭 정렬에 대한 드롭오프=25, 및 스코어링 매트릭스=BLOSUM62를 포함하는 디폴트 값으로 설정된다. 아미노산 서열 비교를 위해 NCBI-BLAST2를 사용하는 상황에서, 제공된 아미노산 서열 B에 대한, 이와, 또는 이에 대한 제공된 아미노산 서열 A의 % 아미노산 서열 동일성(대안적으로, 제공된 아미노산 서열 B에 대한, 이와, 또는 이에 대한 특정 % 아미노산 서열 동일성을 갖거나 이를 포함하는 제공된 아미노산 서열 A로서 표현될 수 있음)은 하기와 같이 계산된다: 100 × 분수 X/Y(상기 식에서, X는 A 및 B의 그러한 프로그램 정렬에서 서열 정렬 프로그램 NCBI-BLAST2에 의해 동일한 매치로서 스코어링된 아미노산 잔기의 수이고, Y는 B에서 아미노산 잔기의 총 수임). 아미노산 서열 A의 길이가 아미노산 서열 B의 길이와 동일하지 않은 경우, B에 대한 A의 % 아미노산 서열 동일성이 A에 대한 B의 % 아미노산 서열 동일성과 동일하지 않는다는 것이 인식될 것이다.
아미노산 서열 "유사성"을 결정하기 위한 기술은 당해 기술분야에 널리 공지되어 있다. 일반적으로, "유사성"은 적절한 장소에서 둘 이상의 폴리펩타이드의 정확한 아미노산 대 아미노산 비교를 지칭하고, 여기서, 아미노산은 동일하거나 유사한 화학적 및/또는 물리적 특성, 예를 들어, 전하 또는 소수성을 지닌다. "퍼센트 유사성"은 이후에, 비교된 폴리펩타이드 서열 간에 결정될 수 있다. 핵산 및 아미노산 서열 동일성을 결정하기 위한 기술은 또한, 당해 기술분야에 널리 공지되어 있고, (대개 cDNA 중간체를 통해) 그러한 유전자에 대한 mRNA의 뉴클레오타이드 서열을 결정하고, 그 안에 인코딩된 아미노산 서열을 결정하고, 이를 제2 아미노산 서열과 비교하는 것을 포함한다. 일반적으로, "동일성"은 2개의 폴리뉴클레오타이드 또는 폴리펩타이드 서열 각각의 정확한 뉴클레오타이드 또는 아미노산 대 아미노산 대응을 지칭한다. 2개 이상의 폴리뉴클레오타이드 서열은 2개 이상의 아미노산 서열과 같이, 이의 "퍼센트 동일성"을 결정함으로써 비교될 수 있다. Wisconsin Sequence Analysis Package, Version 8(Genetics Computer Group(위스콘신주 매디슨 소재)으로부터 입수 가능함)에서 입수 가능한 프로그램, 예를 들어, GAP 프로그램은 2개의 폴리뉴클레오타이드 간의 동일성 및 2개의 폴리펩타이드 서열 간의 유사성 둘 모두를 계산할 수 있다. 서열들 간의 동일성 또는 유사성을 계산하기 위한 다른 프로그램은 당업자에 의해 알려져 있다.
기준 위치에 "상응하는" 아미노산 위치는 아미노산 서열을 정렬시킴으로써 식별되는 바와 같이, 기준 서열과 정렬하는 위치를 지칭한다. 이러한 정렬은 수작업으로 또는 ClustalW2, Blast 2, 등과 같은 널리 공지된 서열 정렬 프로그램을 사용함으로써 수행될 수 있다.
달리 특정되지 않는 한, 2개의 폴리펩타이드 또는 폴리뉴클레오타이드 서열의 퍼센트 동일성은 2개의 서열 중 더 짧은 부분의 전체 길이에 걸친 동일한 아미노산 잔기 또는 뉴클레오타이드의 백분율을 지칭한다.
본 명세서에서 사용되는 바와 같은 용어 "발현"은, 당업자에게 통상적이고 관례적인 의미로 주어지며, 비제한적으로, 주제 기술의 핵산 단편으로부터 유래되는 센스(mRNA) 또는 안티센스 RNA의 전사 및 안정한 축적을 나타내기 위하여 사용된다. "과발현"은 정상 또는 형질전환되지 않은 유기체에서의 생산 수준을 초과하는 트랜스제닉 또는 재조합 유기체에서의 유전자 산물의 생산을 나타낸다.
"형질전환"은 당업자가 이해하는 바와 같은 통상적이고 관례적인 의미에 따라 사용되며, 제한 없이, 표적 세포 내로의 폴리뉴클레오타이드의 전달을 지칭하기 위하여 사용된다. 전달된 폴리뉴클레오타이드는 표적 세포의 게놈 또는 염색체 DNA 내로 혼입되어, 유전적으로 안정한 유전을 야기할 수 있거나, 숙주 염색체 DNA와 무관하게 복제할 수 있다. 형질전환된 핵산 단편을 함유하는 숙주 유기체는 "트랜스제닉" 또는 "재조합" 또는 "형질전환된" 유기체로 지칭된다.
숙주 세포와 관련하여 본 명세서에서 사용되는 경우, 용어 "형질전환된", "트랜스제닉" 및 "재조합"은 당업자가 이해하는 바와 같은 이의 각각의 통상적이고 관례적인 의미에 따라 사용되며, 제한 없이, 이종성 핵산 분자가 도입된 숙주 유기체의 세포, 예컨대, 식물 또는 미생물 세포를 지칭하기 위하여 사용된다. 핵산 분자는 숙주 세포의 게놈 내로 안정적으로 통합될 수 있거나, 또는 핵산 분자는 염색체외 분자로서 존재할 수 있다. 이러한 염색체외 분자는 자가-복제할 수 있다. 형질전환된 세포, 조직 또는 대상체는 형질전환 공정의 최종 산물뿐만 아니라, 이의 트랜스제닉 자손도 포괄하는 것으로 이해된다.
폴리뉴클레오타이드와 관련하여 본 명세서에서 사용되는 경우, 용어 "재조합", "이종성" 및 "외인성"은 당업자가 이해하는 바와 같은 이의 통상적이고 관례적인 의미에 따라 사용되며, 제한 없이 특정 숙주 세포에 대한 외래 출처에서 기인하는, 또는 동일한 출처로부터인 경우, 그 원래 형태로부터 변형된 폴리뉴클레오타이드(예컨대, DNA 서열 또는 유전자)를 지칭하기 위하여 사용된다. 따라서, 숙주 세포 내의 이종성 유전자는 특정 숙주 세포에 내인성이지만, 예를 들어, 부위-지정 돌연변이화 또는 다른 재조합 기법의 사용을 통해 변형된 유전자를 포함한다. 이 용어는 또한 천연 발생 DNA 서열의 여러 비-천연 발생 카피가 포함된다. 따라서, 이 용어는 세포에 대해 외래이거나 이종성인, 또는 세포와 상동성이지만 요소가 보통 확인되지 않는 숙주 세포 내의 위치에 있거나 형태인 DNA 절편을 나타낸다.
유사하게, 폴리펩타이드 또는 아미노산 서열에 관하여 본 명세서에서 사용되는 경우, 용어 "재조합", "이종성" 및 "외인성"은 특정 숙주 세포에 대해 외래 출처에서 기인하는, 또는 동일한 출처로부터인 경우, 그 원래 형태로부터 변형된 폴리펩타이드 또는 아미노산 서열을 의미한다. 따라서, 재조합 DNA 절편은 숙주 세포에서 발현되어 재조합 폴리펩타이드를 생산할 수 있다.
용어 "플라스미드", "벡터" 및 "카세트"는 당업자가 이해하는 바와 같은 이의 각각의 통상적이고 관례적인 의미에 따라 사용되며, 제한 없이 종종 세포의 중심 대사의 일부가 아닌 유전자를 운반하고 보통 원형 이중쇄 DNA 분자 형태인 염색체외 요소를 나타내기 위하여 사용된다. 이러한 요소는 임의의 출처로부터 유래되는, 단일 가닥 또는 이중 가닥 DNA 또는 RNA의 선형 또는 원형, 자가 복제 서열, 게놈 통합 서열, 파지 또는 뉴클레오타이드 서열일 수 있고, 여기서 다수의 뉴클레오타이드 서열이 세포 내로 적절한 3' 미번역 서열을 따라 프로모터 단편 및 선택된 유전자 산물에 대한 DNA 서열을 도입할 수 있는 고유한 구성으로 연결되거나 재조합되었다. "형질전환 카세트"는 외래 유전자를 함유하고 특정 숙주 세포의 형질전환을 촉진하는 외래 유전자에 부가하는 요소를 갖는 특정 벡터를 지칭한다. "발현 카세트"는 외래 유전자를 함유하고 외래 숙주에서 그 유전자의 발현 증강을 허용하는 외래 유전자에 부가하는 요소를 갖는 특정 벡터를 지칭한다.
본 명세서에서 사용되는 표준 재조합 DNA 및 분자 클로닝 수법은 당업계에 잘 알려져 있고, 예를 들어, 문헌[Sambrook, J., Fritsch, E. F. and Maniatis, T. Molecular Cloning: A Laboratory Manual, 2nd ed.; Cold Spring Harbor Laboratory: Cold Spring Harbor, N.Y., 1989 (이하 "Maniatis"); 및 Silhavy, T. J., Bennan, M. L. and Enquist, L. W. Experiments with Gene Fusions; Cold Spring Harbor Laboratory: Cold Spring Harbor, N.Y., 1984; 및 Ausubel, F. M. et al., In Current Protocols in Molecular Biology, published by Greene Publishing and Wiley-Interscience, 1987]에 기재되어 있으며; 이들의 각각의 전문은 이들이 본 발명과 일치하는 정도까지 참조에 의해 본 명세서에 원용된다.
달리 정의되지 않는 한, 본 명세서에서 사용되는 모든 기술 및 과학 용어는 본 개시내용이 속하는 분야의 당업자가 통상적으로 이해하는 바와 동일한 의미를 갖는다. 본 명세서에 기재된 것과 유사하거나 동등한 임의의 방법 및 물질이 본 개시내용의 실시 또는 시험에서 사용될 수 있지만, 바람직한 물질 및 방법이 아래에 기재된다.
실시예
실시예 1
:
D-알룰로스 3-에피머라제를 발현하기 위한 플라스미드 벡터의 작제
D-알룰로스 3-에피머라제(DAE)는 D-프럭토스를 D-알룰로스로 전환시키는 능력을 갖는다(도 1). D-프럭토스를 기질로서 사용하여 D-알룰로스 생산을 위한 특정 D-알룰로스 3-에피머라제 효소를 식별하기 위하여, D-알룰로스 3-에피머라제 활성을 갖는 폴리펩타이드를 코딩하는 폴리뉴클레오타이드 서열은 다원발생(polygenetic) 및 BLAST 분석을 사용하여 식별하였다. 모든 후보 D-알룰로스 3-에피머라제 유전자의 전장 DNA 단편은 상업적으로 합성되었다. cDNA의 거의 모든 코돈은 이. 콜라이(Twist Bioscience, 캘리포니아주 소재)를 위하여 바람직한 것으로 변화시켰다. 합성된 DNA는 발현 작제물을 생성하기 위하여 박테리아 발현 벡터에 클로닝시켰다.
실시예 2
:
재조합 이. 콜라이 세포에서의 D-알룰로스 3-에피머라제 효소 활성의 측정
실시예 1에서처럼 제조된 D-알룰로스 3-에피머라제 활성을 갖는 폴리펩타이드를 코딩하는 폴리뉴클레오타이드를 가진 각 발현 벡터 작제물을 이. 콜라이 T7 발현 세포(Biolabs, 매사추세츠주 소재)에 형질전환시키고, 후속하여 0.8 내지 1.0의 OD600에 도달할 때까지 37℃에서 50 ㎍/㎖ 암피실린을 함유하는 Terrific Broth 배지에서 성장시켰다. 0.5mM 아이소프로필 β-D-1-티오갈락토피라노사이드(IPTG)의 첨가에 의해 단백질 발현을 유도시키고, 배양물을 16℃ㅔ서 22시간 동안 더욱 성장시켰다. 세포를 원심분리(3,000×g; 10분; 4℃)에 의해 수거하였다. 세포 펠릿을 수집하고 즉시 사용하거나 -80℃에서 보관하였다.
세포 펠릿을 추출 완충액(BugBuster Master Mix, EMD Millipore, 미국 소재)에 의해 추출하였다. 원심분리 후, 활성 검정을 위하여 반응 혼합물에 상청액을 첨가하였다. 전형적으로, 상청액(5㎕)을 200㎕ 시험관내 반응계에서 시험하였다. 반응계는 20mM Tris-HCl 완충액, pH 8.0, 1mM MgCl2 또는 MnSO4, 10g/ℓ D-프럭토스를 함유한다. 반응은 60℃에서 수행하였고, 10분 동안 가열함으로써 반응을 종결시켰다. 샘플을 HPLC에 의해 분석하였다.
D-프럭토스 및 D-알룰로스의 농도는 RefractorMax521 검출기(IDEX Health & Science KK, 일본 소재)가 장착된 HPLC 시스템(Vanquish, Thermo Scientific, 미국 소재)에 의해 결정하였다. 크로마토그래피 분리는 Rezex RCM-Monosaccharide Ca2+ 칼럼(100x7.8mm, Phenomenex, 캘리포니아주 소재)을 사용해서 수행하였다. 칼럼을 0.5㎖/분의 유량으로 물로 80℃에서 용리시켰다. D-알룰로스 3-에피머라제 효소 활성의 분석으로부터, D-프럭토스를 D-알룰로스로 생물전환하기 위한 적절한 효소 활성을 갖는 총 21가지 후보 D-알룰로스 3-에피머라제 효소를 식별하였다(표 1).
실시예 3
:
재조합 D-알룰로스 3-에피머라제의 정제
재조합 단백질을 정제하기 위하여, 세포 펠릿을 전형적으로 용해 완충액(50mM 인산칼륨 완충액, pH 7.2, 25mg/㎖ 라이소자임, 5mg/㎖ DNase I, 20mM 이미다졸, 500mM NaCl, 10% 글리세롤 및 0.4% Triton X-100)에 재현탁시켰다. 세포를 4℃하의 초음파 처리에 의해 파쇄하였고, 세포 파편을 원심분리(18,000×g; 30분)에 의해 청징화시켰다. 상청액을, 50mM 인산칼륨 완충액, pH 7.2, 20mM 이미다졸, 500mM NaCl 및 10% 글리세롤을 함유하는 평형 완충액으로 평형화된 친화도 칼럼 Ni-NTA(Qiagen)에 로딩하였다. 단백질 샘플의 로딩 후, 칼럼을 평형 완충액으로 세척하여 미결합된 오염 단백질을 제거하였다. D-알룰로스 3-에피머라제 활성을 갖는 His-태그화된 재조합 폴리펩타이드를 250mM 이미다졸을 함유하는 평형 완충액으로 용리시켰다.
D-알룰로스 3-에피머라제 활성을 갖는 정제된 후보 재조합 폴리펩타이드를 50mM 인산염 완충액(pH 7.2)에 대해서 투석하고 D-프럭토스를 기질로서 사용함으로써 D-알룰로스 합성에 대해서 검정하였다. 전형적으로, 재조합 폴리펩타이드(5 내지 10㎍)를 200㎕ 시험관내 반응계에서 시험하였다. 반응계는 20mM Tris-HCl 완충액, pH 8.0, 3mM MgCl2 또는 MnSO4, 20g/ℓ D-프럭토스를 함유하였다. 반응은 60℃에서 수행하였고, 반응은 10분 동안 가열함으로써 2시간에 그리고 16시간에 종결시켰다. 샘플은 HPLC에 의해 분석하였다.
D-알룰로스 3-에피머라제 활성을 갖는 이들 후보 재조합 폴리펩타이드는 2가 금속 인자에 대해서 선호도가 상이한 알룰로스 생산을 위한 다양한 효소 활성을 갖는다. 도 2A 내지 도 2B에 나타낸 바와 같이, 선택된 모든 후보는 2시간에 D-알룰로스 3-에피머라제 활성을 갖고(도 2A), 반응이 16시간까지 연장되었을 때 더 많은 D-알룰로스가 생산될 수 있다(도 2B). Mg2+ 첨가와 비교하여, Mn2+ 첨가는 대부분의 효소(AL28, 35, 39, 42, 50 및 51)의 활성을 증가시킬 수 있는데, 이는 이들 효소가 Mn2+ 보조인자보다 선호하는 것을 나타낸다.
실시예 4
:
DAE 효소를 생산하는 조작된 피키아 파스토리스 균주의 생성
AL39 유전자(서열번호 43)의 전장 DNA 단편은 피키아 파스토리스 세포의 형질전환에 사용하기 위하여 합성하였다. 구체적으로, cDNA는 AL39 효소(서열번호 5)를 생산하기 위하여 피키아 파스토리스 발현을 위해 코돈 최적화시켰다. AL39 유전자를 α-교배 인자(mating factor) 신호 펩타이드와 프레임내 삽입하였다. EcoRI 및 NotI 제한 소화를 사용하여, 합성된 융합 유전자를 pHKA 벡터(변형된 피키아 파스토리스 발현 벡터)에 클로닝하였다. 발현 플라스미드(pHKA-AL39, 도 3)에서, 발현 카세트는 AOX1 프로모터, α-교배 인자 신호 펩타이드, AL39 유전자 및 AOX1 전사 종결자를 함유한다.
선형화된 pHKA-AL39 플라스미드는 당업계에 공지된 방법(Lin-Cereghino, et al., Biotechniques, 38(1):44-48, 2005)을 사용하여 피키아 파스토리스(GS115) 세포로 형질전환시키고, 발현 카세트는 HIS4 좌위에서 피키아 파스토리스 게놈에 통합시켰다.
분비된 AL39 효소 생산을 입증하기 위하여, 피키아 파스토리스 균주 pHKA-AL39의 단일 콜로니를 배플 부착된 플라스크 내 BMGY 배지에 접종하고, 배양액이 2 내지 6의 OD600(대수기 성장)에 도달할 때까지 진탕 인큐베이터(250 내지 300 rpm)에서 28 내지 30℃에서 성장시켰다. pHKA-AL39 세포를 원심분리에 의해 수거하고 BMMY 배지 중 1.0의 OD600에 재현탁시켜 발현을 유도하였다. 발현의 유도를 유지시키기 위하여 100% 메탄올을 매 24시간마다 1% 메탄올의 최종 농도로 BMMY 배지에 첨가하였다. pHKA-AL39 배양액으로부터의 배지를 원심분리에 의해 수거하고, 이하에 기재된 바와 같은 DAE 활성 분석 및 SDS-PAGE 분석에 적용하였다.
원심분리 후에, 활성 검정을 위하여 상청액을 반응 혼합물에 첨가하였다. 전형적으로, 상청액(65㎕)을 200㎕ 시험관내 반응계에서 시험하였다. 반응계는 20mM Tris-HCl 완충액, pH 8.0, 1mM MnSO4, 30g/ℓ D-프럭토스를 함유하였다. 반응은 55 내지 60℃에서 수행하였고, 10분 동안 가열함으로써 종결시켰다. 샘플은 HPLC에 의해 분석하였다.
D-프럭토스 및 D-알룰로스의 농도는 RefractorMax521 검출기(IDEX Health & Science KK, 일본 소재)가 장착된 HPLC 시스템(Vanquish, Thermo Scientific, 미국 소재)으로 결정하였다. 크로마토그래피 분리는 Rezex RCM-단당류 Ca2+ 칼럼(100x7.8mm, Phenomenex, 캘리포니아주 소재)를 사용하여 수행하였다. 0.5㎖/분의 유량으로 물로 80℃에서 칼럼을 용리시켰다.
AL39 단백질의 존재는 SDS-PAGE 분석에 의해 결정하였다(도 4A). 배지 샘플은 당업계에 공지된 방법(Laemmli, Nature, 227 (5259): 680-685, 1970)을 사용하여 SDS-PAGE에 의해 분리시켰다. 생성된 AL39 단백질은 염색 용액에 의해 염색된 후에 시각화하였다. 생성된 AL39는 SDS-PAGE 분석에 기반한 배지 샘플에서 주된 단백질이었다(도 4A).
SDS-PAGE 및 DAE 활성 스크리닝 후, 최상의 균주는 높은 분비된 AL39 효소 생산을 갖는 것으로 식별되었다. 생산된 AL39 효소는 D-프럭토스를 D-알룰로스로 생물전환시키기 위한 활성을 갖는다. 도 4A에 도시된 바와 같이, 생산된 AL39 단백질은 SDS-PAGE 분석에 의해 발효 배지에서 검출될 수 있는데, 이는 생산된 AL39 효소가 조작된 피키아 파스토리스 균주의 세포외 간격으로 분비될 수 있다. 생산된 효소는 원심분리에 의해 세포 펠릿을 제거한 후에 발효 배지로부터 쉽게 수집되어 농축될 수 있다. DAE 활성은 배지 샘플에서 검출될 수 있다. 도 4B에 도시된 바와 같이, 대략 25%의 프럭토스가 반응에서 1시간 후에 알룰로스로 전환될 수 있다.
실시예 5
: 고정화된 DAE 효소를 사용하는 생물전환
효소 고정화는 상당한 시간 기간에 걸쳐서 보다 큰 회전률(turnover)로 기질에 대한 효소의 가용성을 증가시키기 위한 우수한 기반을 제공한다. 프럭토스의 알룰로스로의 생물전환에 대한 높은 활성 및 우수한 내구성을 갖는 고정화된 D-알룰로스 에피머라제를 효율적으로 생산하는 방법이 하기에 기재된다.
AL39 단백질을 여과에 의해 농축시켰다. 추출된 AL39를 고정화를 위하여 20mM 인산염 완충액(pH 8.0)에 용해시켰다. DAE 활성의 1단위는 pH 8.0 및 55℃에서 분당 1 μ㏖ D-알룰로스의 형성을 촉매하는 효소의 양으로서 정의되었다. 고정화된 DAE 효소의 비활성(specific activity)은 ㎎ 효소당의 단위로서 정의되었다.
제조된 AL39 단백질을 20mM 인산염 완충액(pH 8.0) 중 수-전처리 이온 교환 수지(LXP-505, SUNRESIN)와 혼합하고, 25℃에서 24시간 동안 반응기에서 서서히 교반하였다. 후속하여, 상청액을 제거하고, 얻어진 혼합물을 20mM 인산염 완충액(pH 8.0)으로 세척하여 고정화된 DAE 효소를 얻었다.
고정화된 DAE 효소를 활성 검정을 위하여 반응 혼합물에 첨가하였다. 고정화된 효소를 1㎖ 시험관내 반응계에서 시험하였다. 반응계는 20mM 인산염 완충액, pH 8.0, 1mM MnSO4, 500g/ℓ D-프럭토스를 함유하였다. 반응은 55℃에서 수행하고, 반응은 10분 동안 가열함으로써 종결시켰다. 샘플을 HPLC에 의해 분석하였다. 고정화된 효소는 3시간 후에 23% 초과의 프럭토스를 알룰로스로 전환시켰다.
AL39가 사용 후 활성을 보유할 수 있는지의 여부를 결정하기 위하여, 고정화된 AL39의 재사용 사이클을 시험하였다. 180㎎ 고정화된 AL39를, 20mM 인산염 완충액(pH 8.0), 1mM MnSO4, 500g/ℓ D-프럭토스를 함유하는 1ℓ 반응물에 첨가하였다. 반응은 55℃에서 수행하였다. 5시간 반응 후, 고정화된 효소를 여과에 의해 수집하였다. 알룰로스 생산을 측정하기 위하여 상청액을 HPLC에 의해 분석하고, 고정화된 효소를 그 다음 사이클 반응을 위하여 20mM 인산염 완충액(pH 8.0)으로 5회 세척하였다. 5회 사이클 후에, 각 사이클의 활성을 비교하였다. 도 5에 도시된 바와 같이, 고정화된 AL39의 활성은 단지 첫 번째 사이클에 비해서 다섯 번째 사이클에서 10.76% 소실되었는데, 이는 고정화된 AL39가 알룰로스 생물전환을 위하여 안정적인 것을 나타낸다.
참고문헌:
1. Lin-Cereghino J, Wong WW, Xiong S, et al. Condensed protocol for competent cell preparation and transformation of the methylotrophic yeast Pichia pastoris. Biotechniques. 2005;38(1):44-48.
2. Laemmli, U. K. (1970). "Cleavage of Structural Proteins during the Assembly of the Head of Bacteriophage T4". Nature. 227 (5259): 680-685.
서열정보
서열번호 1; 단백질; 메이오써무스 실바누스
서열번호 2; DNA; 메이오써무스 실바누스
서열번호 3; 단백질; 열수 분출공 메타게놈(hydrothermal vent metagenome)
서열번호 4; DNA; 열수 분출공 메타게놈
서열번호 5; 단백질; 써모클로스트리듐 카에니콜라
서열번호 6; DNA; 써모클로스트리듐 카에니콜라
서열번호 7; 단백질; 열수 분출공 메타게놈
서열번호 8; DNA; 열수 분출공 메타게놈
서열번호 9; 단백질; 메이오써무스 그라나티시우스
서열번호 10; DNA; 메이오써무스 그라나티시우스
서열번호 11; 단백질; 루벨리마이크로븀 써모필룸
서열번호 12; DNA; 루벨리마이크로븀 써모필룸
서열번호 13; 단백질; 칸디다투스 써모폰시아 클레드 1 박테륨
서열번호 14; DNA; 칸디다투스 써모폰시아 클레드 1 박테륨
서열번호 15; 단백질; 데이노코커스 코렌시스
서열번호 16; DNA; 데이노코커스 코렌시스
서열번호 17; 단백질; 올라비우스 알가르벤시스 스피로케테 엔도심비온트
서열번호 18; DNA; 올라비우스 알가르벤시스 스피로케테 엔도심비온트
서열번호 19; 단백질; 아시디필륨(Acidiphilium)
서열번호 20; DNA; 아시디필륨
서열번호 21; 단백질; 로도박테랄레스 박테륨
서열번호 22; DNA; 로도박테랄레스 박테륨
서열번호 23; 단백질; 클로로플렉시 박테륨
서열번호 24; DNA; 클로로플렉시 박테륨
서열번호 25; 단백질; 스피리박터 종 E85
서열번호 26; DNA; 스피리박터 종 E85
서열번호 27; 단백질; 타브리지콜라 종 TH137
서열번호 28; DNA; 타브리지콜라 종 TH137
서열번호 29; 단백질; 트로피시모나스 아이소알카니보란스
서열번호 30; DNA; 트로피시모나스 아이소알카니보란스
서열번호 31; 단백질; 로도박터과 박테륨
서열번호 32; DNA; 로도박터과 박테륨
서열번호 33; 단백질; 로도박터 종 SW2
서열번호 34; DNA; 로도박터 종 SW2
서열번호 35; 단백질; 알파프로테오박테리아 박테륨 HGW-알파프로테오박테리아-8
서열번호 36; DNA; 알파프로테오박테리아 박테륨 HGW-알파프로테오박테리아-8
서열번호 37; 단백질; 루벨리마이크로븀 메소필룸
서열번호 38; DNA; 루벨리마이크로븀 메소필룸
서열번호 39; 단백질; 로도박테랄레스 박테륨
서열번호 40; DNA; 로도박테랄레스 박테륨
서열번호 41; 단백질; 로도박테랄레스 박테륨 RIFCSPHIGHO2_02_FULL_62_130>
서열번호 42; DNA; 로도박테랄레스 박테륨 RIFCSPHIGHO2_02_FULL_62_130
서열번호 43; 단백질; 코돈 최적화된 DNA 서열 서열번호 44에 의해 인코딩된 써모클로스트리듐 카에니콜라
서열번호 44; DNA; 코돈 최적화된 써모클로스트리듐 카에니콜라
기타 실시형태
본 명세서에 개시된 모든 특징은 임의의 조합으로 조합될 수 있다. 본 명세서에 개시된 각각의 특징은 동일하거나 동등하거나 유사한 목적을 제공하는 대안적 특징으로 대체될 수 있다. 따라서, 달리 명시적으로 언급되지 않는 한, 개시된 각 특징은 동등하거나 유사한 특징의 일반적인 시리즈의 예일 뿐이다. 상기 설명으로부터, 당업자는 본 개시내용의 필수적 특징을 용이하게 확인할 수 있고, 이의 정신 및 범주로부터 벗어나는 일 없이, 다양한 용법 및 조건에 적합하도록 본 개시내용을 다양하게 변화 및 변형시킬 수 있다. 따라서, 다른 실시형태도 청구범위 내이다.
균등물 및 범위
당업자라면 단지 일상적인 실험과정에 지나지 않는 것을 사용하여, 본 명세서에 기재된 개시내용의 특정 실시형태의 많은 균등물을 인식할 것이거나 확인할 수 있을 것이다. 본 개시내용의 범위는 상기 설명으로 제한되는 것으로 의도되지 않고, 오히려 첨부된 청구범위에 제시된 바와 같다.
명세서에서 그리고 청구범위에서 여기서 사용된 바와 같은 단수 표현은, 반대로 명확히 표시되지 않는다면, "적어도 하나"를 의미하는 것으로 이해되어야 한다.
명세서에서 그리고 청구범위에서 여기서 사용된 바와 같은 어구 "및/또는"는, 그렇게 결합된 요소들, 즉, 몇몇 경우에서 결합하여 존재하며 다른 경우에서 분리적으로 존재하는 요소들 중 "어느 하나 또는 둘 다"를 의미하는 것으로 이해되어야 한다. "및/또는"과 함께 나열된 다수의 요소는, 동일한 방식으로, 즉, 그렇게 결합된 요소들 중 "하나 이상"으로 해석되어야 한다. 다른 요소는, 구체적으로 식별된 이들 요소와 관련되었는지 또는 관련되지 않았는지에 관계없이, "및/또는" 절에 의해 구체적으로 식별된 요소들이 아닌 다른 요소들로 선택적으로 존재할 수 있다. 따라서, 비제한적인 예로서, "A 및/또는 B"에 대한 언급은, "포함하는"과 같은 제약을 두지 않은 언어와 함께 사용될 때, 일 실시형태에서, A만을(선택적으로 B가 아닌 요소들을 포함); 다른 실시형태에서, B만을(선택적으로 A가 아닌 요소들을 포함); 또 다른 실시형태에서, A 및 B 둘 다를(선택적으로 다른 요소들을 포함) 등을 지칭할 수 있다.
명세서에서 그리고 청구범위에서 여기서 사용된 바와 같이, "또는"은 위에서 정의된 바와 같은 "및/또는"과 동일한 의미를 갖는 것으로 이해되어야 한다. 예를 들어, 일람에서 품목들을 분리할 때, "또는" 또는 "및/또는"은 포괄적인 것으로, 즉, 다수의 또는 목록의 요소들 중 하나 초과를 포함하는 적어도 하나 및 선택적으로 부가적인 나열되지 않은 품목들의 포함인 것으로 해석될 것이다. "~ 중 단지 하나" 또는 " ~ 중 정확하게 하나", 또는 청구항에서 사용될 때, "~로 이루어진"과 같은 대조적으로 명확하게 표시된 용어들은 단지 다수의 또는 일람의 요소들 중 정확하게 하나의 요소의 포함을 지칭할 것이다. 일반적으로, 본 명세서에서 사용되는 바와 같은 용어 "또는"은 "어느 하나", "중 하나", "중 단지 하나" 또는 "중 정확히 하나"와 같은 독점성 용어가 선행하는 경우 배타적 대안(즉, "하나 또는 다른 하나 그러나 둘 다는 아님")을 나타내는 것으로만 해석되어야 한다. 청구범위에서 사용될 때, "로 본질적으로 이루어진"은 특허법 분야에서 사용되는 바와 같은 그의 일반적인 의미를 가질 것이다.
명세서에서 그리고 청구범위에서 여기서 사용된 바와 같이, 하나 이상의 요소의 일람과 관련하여 어구 "적어도 하나"는 요소들의 일람에서 요소들 중 임의의 하나 이상으로부터 선택된 적어도 하나의 요소를 의미하지만, 반드시 요소들의 일람 내에 구체적으로 나열된 모든 각각의 요소 중 적어도 하나를 포함하지는 않으며 요소들의 일람에서 요소들의 임의의 조합들을 배제하는 것은 아니라는 것이 이해되어야 한다. 이 정의는 또한, 구체적으로 식별된 이들 요소와 관련되는지 또는 관련되지 않는지에 관계없이, 어구 "적어도 하나"가 지칭하는 요소들의 일람 내에서 구체적으로 식별된 요소들 이외의 것으로 선택적으로 존재할 수 있음을 허용한다. 따라서, 비제한적인 예로서, "A 및 B 중 적어도 하나"(또는 동등하게, "A 또는 B 중 적어도 하나" 또는 동등하게 "A 및/또는 B 중 적어도 하나")는, 일 실시형태에서, 선택적으로, B가 존재하지 않고, 하나 초과의 A를 포함(및 선택적으로 B 이외의 요소들을 포함)하는, 적어도 하나를; 또 다른 실시형태에서, 선택적으로, A가 존재하지 않고, 하나 초과의 B를 포함(및 선택적으로 A 이이의 요소들을 포함)하는, 적어도 하나를; 또 다른 실시형태에서, 선택적으로 하나 초과의 A를 포함하는 적어도 하나, 및 선택적으로 하나 초과의 B를 포함하는 적어도 하나(및 선택적으로 다른 요소들을 포함) 등을 지칭할 수 있다.
또한, 명백히 반대로 표시되지 않는 한, 하나 초과의 단계 또는 행위를 포함하는 본 명세서에 청구된 임의의 방법에서, 방법의 단계 또는 행위의 순서는 반드시 방법의 단계 또는 행위가 언급된 순서로 제한되지 않는다는 것을 이해해야 한다.
상기 명세서에서뿐만 아니라 청구범위에서, "포함하는", "포함시키는", "운반하는", "갖는", "함유하는", "수반하는", "유지하는", "~로 구성된" 등과 같은 모든 전환어구는, 제약을 두지 않는 것으로, 즉, 포함하지만, 이들로 제한되지 않는을 의미하는 것으로 이해되어야 한다. 단지 전환어구 "로 이루어진" 및 "로 본질적으로 이루어진"은, 미국 특허청 특허 심사 절차 매뉴얼, 섹션 2111.03에서 제시된 바와 같이, 각각 폐쇄형 또는 반폐쇄형 전환어구일 것이다. 개방형 전환 어구(예컨대, "포함하는")를 사용하여 이 문서에 기재된 실시형태는, 대안적인 실시형태에서, 개방형 전환 어구로 설명된 특징"으로 이루어진" 및 "으로 본질적으로 이루어진"으로도 고려된다는 것을 이해해야 한다. 예를 들어, 개시내용이 "A 및 B를 포함하는 조성물"을 기재하는 경우, 개시내용은 또한 대안적인 실시형태 "A 및 B로 이루어진 조성물" 및 "A 및 B로 본질적으로 이루어진 조성물"을 고려한다.
또한, 본 개시내용은 열거된 청구항 중 하나 이상으로부터의 하나 이상의 제한, 요소, 절 및 설명 용어가 다른 청구항에 도입되는 모든 변형, 조합 및 순열을 포함한다. 예를 들어, 또 다른 청구항에 종속된 임의의 청구항은 동일한 기본 청구항에 종속하는 임의의 다른 청구항에서 발견되는 하나 이상의 제한을 포함하도록 변형될 수 있다. 요소가 예컨대 마쿠시 그룹 형식으로 일람으로서 제시되는 경우, 요소들의 각 하위그룹이 또한 개시되고, 임의의 요소(들)가 그룹으로부터 제거될 수 있다. 일반적으로, 본 개시내용 또는 본 개시내용의 양상이 특정 요소 및/또는 특징을 포함하는 것으로 언급되는 경우, 본 개시내용의 소정의 실시형태 또는 본 개시내용의 양상은 이러한 요소 및/또는 특징으로 이루어지거나 또는 본질적으로 이루어지는 것이 이해되어야 한다. 단순화를 위하여, 이들 실시형태는 본 명세서에서 이들 단어에 구체적으로 제시되어 있지 않다. 또한, 용어 "포함하는" 및 "함유하는"이 개방인 것으로 의도되고, 추가의 요소 또는 단계의 포함을 허용하는 것에 주목한다. 범위가 주어지는 경우, 종점이 포함된다. 또한, 달리 표시되지 않는 한 또는 달리 문맥 및 당업자의 이해로부터 명백하지 않는 한, 범위로서 표현된 값은, 문맥이 달리 명확히 기술하지 않는 한, 본 개시내용의 상이한 실시형태에서의 기술된 범위 내의 임의의 특정한 값 또는 하위범위를 범위의 하한의 단위의 1/10까지 취할 수 있다.
본 출원은 다양한 발행된 특허, 공개된 특허 출원, 저널 기사 및 기타 간행물을 지칭하며, 이들은 모두 참조에 의해 본 명세서에 원용된다. 본 명세서에 개시된 모든 참조문헌, 특허 및 특허 출원은, 각각이 인용된 주제와 관련하여 참조에 의해 원용되며, 일부 경우에는 문서 전체를 포함할 수 있다. 원용된 문헌 중 임의의 것과 본 명세서 간에 상충이 있는 경우, 본 명세서가 통제할 것이다. 또한, 종래 기술 내에 들어가는 본 개시내용의 임의의 특정 실시형태는 임의의 하나 이상의 청구항으로부터 명확히 배제될 수 있는 것으로 이해되어야 한다. 이러한 실시형태가 당업자에게 공지된 것으로 간주되므로, 이들은 배제가 본 명세서에 명확히 제시되지 않더라도 배제될 수 있다. 본 개시내용의 임의의 특정 실시형태는, 종래 기술의 존재와 관련되는지의 여부와 상관없이, 임의의 이유로, 임의의 청구항으로부터 배제될 수 있다.
당업자라면 단지 일상적인 실험에 불과한 것을 사용하여 본 명세서에 기재된 특정 실시형태에 대한 많은 등가물을 인식할 것이거나 확인할 것이다. 본 명세서에 기재된 본 실시형태의 범위는 상기 설명으로 제한되는 것으로 의도되지 않고, 오히려 첨부된 청구범위에 제시된 바와 같다. 당업자라면, 하기 청구범위에 정의된 바와 같이, 본 개시내용의 정신 또는 범위로부터 벗어나는 일 없이 이 설명에 대한 다양한 변화와 변형이 이루어질 수 있음을 이해할 것이다.
SEQUENCE LISTING
<110> Conagen Inc.
<120> D-ALLULOSE 3-EPIMERASES FOR BIOCONVERSION OF D-FRUCTOSE TO
D-ALLULOSE
<130> WO 2021231488
<140> PCT/US2021/031859
<141> 2021-05-11
<150> US 63/022,617
<151> 2020-05-11
<160> 44
<170> PatentIn version 3.5
<210> 1
<211> 283
<212> PRT
<213> Unknown
<220>
<223> Meiothermus silvanus
<400> 1
Met Pro Arg Phe Gly Ala His Ala Phe Ile Trp Ala Ala Glu Trp Asn
1 5 10 15
Pro Glu Ala Ala Glu Lys Val Ile Gln Gly Ala Thr Arg Val Gly Leu
20 25 30
Asp Phe Val Glu Ile Pro Leu Leu His Pro Glu Ser Phe Asp Val Glu
35 40 45
Leu Thr Arg Arg Leu Leu Asn Gly Tyr Gly Val Gly Cys Thr Cys Ser
50 55 60
Leu Gly Leu Pro Arg Glu Ala Ser Leu Pro Glu His Pro Glu Ala Ala
65 70 75 80
Thr Arg Phe Leu Ile Gln Ala Leu Asn Val Ala His Gln Ile Gly Ser
85 90 95
Glu Val Leu Thr Gly Val Thr Tyr Ala Thr Leu Gly Thr Leu Ser Gly
100 105 110
Arg Ala Pro Arg Glu Ala Asp Tyr Gln Ala Val Val Lys Ala Leu Lys
115 120 125
Pro Ala Ala Arg His Ala Ala Ala Leu Gly Met Arg Leu Gly Ile Glu
130 135 140
Pro Val Asn Arg Tyr Glu Thr Tyr Leu Ile Asn Leu Ala Ala Gln Gly
145 150 155 160
Leu Glu Leu Ile Arg Arg Leu Asp Glu Pro Asn Val Phe Leu His Leu
165 170 175
Asp Thr Tyr His Met Asn Ile Glu Glu Lys Gly Phe Arg Gly Pro Ile
180 185 190
Val Glu Ala Gly Ala His Leu Gly Tyr Ile His Leu Ser Glu Ser Asp
195 200 205
Arg Gly Thr Pro Gly Thr Gly Asn Val His Trp Asp Ala Val Phe Ala
210 215 220
Gly Leu Arg Glu Ile Gly Phe Ser Gly Asp Leu Val Met Glu Ser Phe
225 230 235 240
Val Ala Leu Asn Pro Asp Ile Ala Arg Ala Thr Cys Met Trp Arg Asp
245 250 255
Val Val Gly Asp Pro Gln Ala Leu Val Gln Glu Gly Leu Ala Phe Leu
260 265 270
Arg Gly Lys Ala Ser Glu Tyr Gly Leu Leu Gly
275 280
<210> 2
<211> 852
<212> DNA
<213> Unknown
<220>
<223> Meiothermus silvanus
<400> 2
atgccacgct tcggagctca tgcgttcatt tgggccgctg agtggaaccc ggaagcggca 60
gagaaagtga ttcagggtgc aacccgtgtt ggcctcgact tcgttgaaat tccgctcttg 120
cacccggaat ccttcgatgt cgagctcaca cgtcgtttac taaacgggta cggcgtcggt 180
tgtacgtgtt ctctgggctt gccgcgtgaa gcgtccctgc cggagcaccc cgaagccgcg 240
actcgttttc tgattcaggc cctgaatgtt gcacatcaga ttggctcaga ggtgctgacc 300
ggggtaacct acgcgacttt aggcacttta tctggccggg cgccgcgcga agctgattat 360
caagcagtcg taaaagcact gaaaccggcg gctagacatg cagcagcact gggtatgcgc 420
ctcggcattg aacccgttaa tcgttatgaa acttatttaa ttaacctggc cgctcagggc 480
ctggagttaa tccgtcgtct ggacgaaccg aatgtgttcc tgcacctgga tacgtaccac 540
atgaatattg aagagaaagg tttccggggc ccgatcgtgg aagcgggcgc ccacctgggg 600
tatattcatc tgagcgagag tgatcgcggc acccctggaa cgggcaacgt ccattgggac 660
gcggtgttcg cggggctgcg tgaaattggc ttctcaggcg atttggtcat ggaaagcttc 720
gtcgcactga accctgatat tgcgcgcgct acatgcatgt ggcgggacgt cgttggcgat 780
ccccaggcgc tggtccagga aggcttagca tttctccgtg gcaaggctag cgagtatggc 840
ctactcggtt aa 852
<210> 3
<211> 282
<212> PRT
<213> Unknown
<220>
<223> hydrothermal vent metagenome
<400> 3
Met Glu Gly Phe Gly Val His Thr Ser Met Trp Thr Met Ser Trp Asp
1 5 10 15
Lys Lys Gly Ala Glu Tyr Ala Val Ser Gln Ala Val Arg Tyr Gln Met
20 25 30
Asp Phe Leu Glu Ile Ala Leu Leu Ser Pro Leu Asp Val Asp Ala Gln
35 40 45
His Ser Arg Arg Leu Leu Glu Lys Asn His Met Arg Ala Ile Cys Ser
50 55 60
Leu Gly Leu Pro Glu Gly Ala Trp Leu Ser Asn Asn Pro Gln Ala Gly
65 70 75 80
Val Glu Tyr Leu Lys Ile Ala Leu Glu Lys Thr Ala Glu Met Gly Cys
85 90 95
Glu Ala Leu Ser Gly Val Ile Tyr Gly Gly Ile Gly Glu Arg Thr Gly
100 105 110
Phe Pro Pro Thr Glu Lys Glu Leu Asp Asn Val Val Arg Ala Leu Gly
115 120 125
Glu Ala Ala Ser Tyr Ala Lys Ser Leu Gly Leu Leu Leu Gly Ile Glu
130 135 140
Pro Val Asn Arg Tyr Glu Ser His Leu Ile Asn Thr Gly Arg Gln Ser
145 150 155 160
Val Glu Met Ile Glu Lys Val Gly Ala Ser Asn Met Phe Val His Leu
165 170 175
Asp Thr Tyr His Met Asn Ile Glu Glu Lys Gly Val Ala Gln Gly Ile
180 185 190
Leu Asp Ala Arg Glu His Ile Lys Tyr Ile His Leu Ser Glu Ser Asp
195 200 205
Arg Gly Thr Pro Gly Ala Gly Thr Cys Asp Trp Asp Glu Ile Phe Ala
210 215 220
Val Leu Ala Ala Ile Asn Phe Lys Gly Gly Leu Ala Met Glu Ser Phe
225 230 235 240
Val Asn Met Pro Pro Glu Ile Ala Tyr Gly Leu Ser Ile Trp Arg Pro
245 250 255
Val Ala Lys Ser Ala Asp Glu Val Met Glu Asn Gly Leu Pro Phe Leu
260 265 270
Arg Asn Lys Ala Arg Gln Tyr Gln Leu Leu
275 280
<210> 4
<211> 849
<212> DNA
<213> Unknown
<220>
<223> hydrothermal vent metagenome
<400> 4
atggaaggtt ttggagtgca cacgagcatg tggactatga gttgggataa gaagggtgcg 60
gagtatgctg taagccaggc ggtgcgctat cagatggatt ttcttgaaat cgctctgctg 120
agtccactgg atgtcgatgc ccagcatagt cgccgtctgc tagagaagaa ccacatgcgc 180
gcgatttgca gccttgggtt accggaaggt gcgtggctca gtaataaccc tcaggccgga 240
gtggaatacc tgaagatcgc cctggaaaag actgcggaga tgggttgcga agcgctgtcc 300
ggcgtaatct acggcggcat tggcgaaaga acaggttttc cgccgacgga gaaagagctg 360
gacaatgtcg tgcgcgcgct gggtgaagcg gcatcttacg caaaatcgtt aggccttctg 420
ctcggtattg aaccggtgaa ccggtatgag tctcatctga ttaatacggg acgtcagagt 480
gtggaaatga ttgaaaaggt cggtgcctct aacatgtttg ttcaccttga cacataccac 540
atgaatattg aagaaaaggg tgtggcacaa gggattctgg acgcgcgcga acacataaaa 600
tatatccacc tgtcagagtc tgaccgaggg actccgggcg caggcacgtg tgactgggat 660
gagattttcg cagtcctggc cgcaattaac tttaaaggcg gcttagcgat ggaatcgttc 720
gtgaacatgc cgccggaaat tgcctatggt ctgtccattt ggcgtccggt ggctaaatcg 780
gctgatgaag tcatggaaaa cggcctgccg tttctacgca acaaagcgcg ccagtatcag 840
ctgctgtaa 849
<210> 5
<211> 289
<212> PRT
<213> Unknown
<220>
<223> Thermoclostridium caenicola
<400> 5
Met Lys Tyr Gly Ile Phe Tyr Ala Tyr Trp Glu Lys Glu Trp Lys Gly
1 5 10 15
Asp Phe Ile Thr Tyr Ile Glu Lys Val Lys Lys Leu Gly Phe Asp Ile
20 25 30
Leu Glu Val Gly Cys Gly Asp Phe His Lys Gln Pro Asp Ser Tyr Phe
35 40 45
His Thr Leu Arg Asp Ala Ala Arg Glu Tyr Asp Ile Ile Leu Thr Gly
50 55 60
Gly Tyr Gly Pro Arg Ala Glu His Asn Leu Cys Ser Pro Asp Thr Ala
65 70 75 80
Val Val Glu Asn Ala Leu Ala Phe Tyr Ser Asp Ile Phe Arg Lys Met
85 90 95
Glu Ile Ala Gly Ile Arg Ser Ile Gly Gly Gly Leu Tyr Ala Tyr Trp
100 105 110
Pro Val Asp Tyr Ser Arg Glu Pro Asp Lys Ala Gly Asp Leu Glu Arg
115 120 125
Ser Ile Lys Asn Met Arg Arg Leu Ala Asp Ile Ala Glu Arg His Gly
130 135 140
Ile Thr Leu Asn Met Glu Val Leu Asn Arg Phe Glu Gly Tyr Leu Ile
145 150 155 160
Asn Asp Thr Asn Glu Gly Leu Ala Tyr Ile Arg Ala Val Asp Lys Pro
165 170 175
Asn Val Lys Leu Met Leu Asp Thr Phe His Met Asn Ile Glu Glu Asp
180 185 190
Ser Phe Thr Glu Pro Ile Leu Gln Ala Gly Lys Tyr Leu Gly His Val
195 200 205
His Val Gly Glu Pro Asn Arg Lys Pro Pro Arg Glu Gly Arg Ile Pro
210 215 220
Trp Gly Glu Ile Gly Lys Ala Leu Arg Gln Ile Gly Tyr Asp Gly Pro
225 230 235 240
Val Val Met Glu Pro Phe Val Thr Met Gly Gly Gln Val Gly Lys Asp
245 250 255
Ile Cys Val Trp Arg Asp Leu Ser Gln Gly Ala Thr Glu Glu Asp Leu
260 265 270
Asp Arg Asp Ala Glu Lys Ser Leu Ala Phe Leu Lys Gly Met Phe Glu
275 280 285
Ala
<210> 6
<211> 870
<212> PRT
<213> Unknown
<220>
<223> Thermoclostridium caenicola
<400> 6
Ala Thr Gly Ala Ala Ala Thr Ala Thr Gly Gly Thr Ala Thr Ala Thr
1 5 10 15
Thr Thr Thr Ala Cys Gly Cys Ala Thr Ala Thr Thr Gly Gly Gly Ala
20 25 30
Gly Ala Ala Ala Gly Ala Ala Thr Gly Gly Ala Ala Ala Gly Gly Cys
35 40 45
Gly Ala Cys Thr Thr Thr Ala Thr Cys Ala Cys Ala Thr Ala Cys Ala
50 55 60
Thr Thr Gly Ala Gly Ala Ala Ala Gly Thr Thr Ala Ala Gly Ala Ala
65 70 75 80
Ala Thr Thr Ala Gly Gly Cys Thr Thr Thr Gly Ala Cys Ala Thr Thr
85 90 95
Thr Thr Gly Gly Ala Ala Gly Thr Cys Gly Gly Cys Thr Gly Cys Gly
100 105 110
Gly Thr Gly Ala Thr Thr Thr Thr Cys Ala Thr Ala Ala Ala Cys Ala
115 120 125
Gly Cys Cys Gly Gly Ala Thr Thr Cys Ala Thr Ala Cys Thr Thr Cys
130 135 140
Cys Ala Cys Ala Cys Cys Cys Thr Gly Cys Gly Thr Gly Ala Thr Gly
145 150 155 160
Cys Cys Gly Cys Thr Cys Gly Cys Gly Ala Ala Thr Ala Cys Gly Ala
165 170 175
Cys Ala Thr Thr Ala Thr Thr Cys Thr Gly Ala Cys Cys Gly Gly Cys
180 185 190
Gly Gly Cys Thr Ala Thr Gly Gly Gly Cys Cys Gly Cys Gly Cys Gly
195 200 205
Cys Cys Gly Ala Ala Cys Ala Cys Ala Ala Cys Thr Thr Gly Thr Gly
210 215 220
Thr Ala Gly Cys Cys Cys Gly Gly Ala Thr Ala Cys Ala Gly Cys Gly
225 230 235 240
Gly Thr Cys Gly Thr Thr Gly Ala Ala Ala Ala Thr Gly Cys Cys Cys
245 250 255
Thr Gly Gly Cys Ala Thr Thr Thr Thr Ala Cys Thr Cys Cys Gly Ala
260 265 270
Thr Ala Thr Ala Thr Thr Thr Cys Gly Cys Ala Ala Ala Ala Thr Gly
275 280 285
Gly Ala Ala Ala Thr Thr Gly Cys Cys Gly Gly Cys Ala Thr Cys Cys
290 295 300
Gly Thr Thr Cys Gly Ala Thr Cys Gly Gly Cys Gly Gly Cys Gly Gly
305 310 315 320
Thr Cys Thr Ala Thr Ala Thr Gly Cys Gly Thr Ala Thr Thr Gly Gly
325 330 335
Cys Cys Ala Gly Thr Thr Gly Ala Thr Thr Ala Cys Ala Gly Cys Cys
340 345 350
Gly Thr Gly Ala Ala Cys Cys Cys Gly Ala Cys Ala Ala Ala Gly Cys
355 360 365
Cys Gly Gly Cys Gly Ala Thr Thr Thr Ala Gly Ala Ala Cys Gly Thr
370 375 380
Thr Cys Cys Ala Thr Thr Ala Ala Gly Ala Ala Cys Ala Thr Gly Cys
385 390 395 400
Gly Thr Cys Gly Cys Thr Thr Ala Gly Cys Cys Gly Ala Thr Ala Thr
405 410 415
Thr Gly Cys Gly Gly Ala Ala Cys Gly Gly Cys Ala Thr Gly Gly Thr
420 425 430
Ala Thr Cys Ala Cys Gly Cys Thr Gly Ala Ala Thr Ala Thr Gly Gly
435 440 445
Ala Ala Gly Thr Gly Cys Thr Cys Ala Ala Thr Cys Gly Cys Thr Thr
450 455 460
Cys Gly Ala Ala Gly Gly Thr Thr Ala Cys Cys Thr Thr Ala Thr Thr
465 470 475 480
Ala Ala Thr Gly Ala Thr Ala Cys Cys Ala Ala Thr Gly Ala Ala Gly
485 490 495
Gly Thr Cys Thr Gly Gly Cys Cys Thr Ala Cys Ala Thr Thr Cys Gly
500 505 510
Thr Gly Cys Cys Gly Thr Cys Gly Ala Thr Ala Ala Ala Cys Cys Cys
515 520 525
Ala Ala Cys Gly Thr Ala Ala Ala Gly Thr Thr Gly Ala Thr Gly Cys
530 535 540
Thr Gly Gly Ala Thr Ala Cys Ala Thr Thr Thr Cys Ala Cys Ala Thr
545 550 555 560
Gly Ala Ala Cys Ala Thr Thr Gly Ala Gly Gly Ala Ala Gly Ala Thr
565 570 575
Ala Gly Cys Thr Thr Thr Ala Cys Cys Gly Ala Ala Cys Cys Cys Ala
580 585 590
Thr Thr Cys Thr Cys Cys Ala Gly Gly Cys Thr Gly Gly Thr Ala Ala
595 600 605
Gly Thr Ala Cys Cys Thr Gly Gly Gly Cys Cys Ala Thr Gly Thr Ala
610 615 620
Cys Ala Thr Gly Thr Cys Gly Gly Cys Gly Ala Ala Cys Cys Ala Ala
625 630 635 640
Ala Thr Cys Gly Thr Ala Ala Ala Cys Cys Ala Cys Cys Ala Cys Gly
645 650 655
Gly Gly Ala Ala Gly Gly Thr Cys Gly Thr Ala Thr Thr Cys Cys Gly
660 665 670
Thr Gly Gly Gly Gly Cys Gly Ala Gly Ala Thr Thr Gly Gly Cys Ala
675 680 685
Ala Ala Gly Cys Gly Cys Thr Gly Cys Gly Cys Cys Ala Gly Ala Thr
690 695 700
Thr Gly Gly Gly Thr Ala Cys Gly Ala Cys Gly Gly Thr Cys Cys Cys
705 710 715 720
Gly Thr Gly Gly Thr Gly Ala Thr Gly Gly Ala Ala Cys Cys Gly Thr
725 730 735
Thr Thr Gly Thr Thr Ala Cys Cys Ala Thr Gly Gly Gly Cys Gly Gly
740 745 750
Cys Cys Ala Ala Gly Thr Gly Gly Gly Gly Ala Ala Ala Gly Ala Cys
755 760 765
Ala Thr Thr Thr Gly Thr Gly Thr Gly Thr Gly Gly Cys Gly Gly Gly
770 775 780
Ala Cys Cys Thr Thr Ala Gly Cys Cys Ala Ala Gly Gly Thr Gly Cys
785 790 795 800
Gly Ala Cys Cys Gly Ala Ala Gly Ala Ala Gly Ala Thr Cys Thr Gly
805 810 815
Gly Ala Thr Cys Gly Cys Gly Ala Thr Gly Cys Thr Gly Ala Gly Ala
820 825 830
Ala Ala Ala Gly Cys Cys Thr Gly Gly Cys Cys Thr Thr Thr Cys Thr
835 840 845
Gly Ala Ala Ala Gly Gly Ala Ala Thr Gly Thr Thr Thr Gly Ala Ala
850 855 860
Gly Cys Cys Thr Ala Ala
865 870
<210> 7
<211> 290
<212> PRT
<213> Unknown
<220>
<223> hydrothermal vent metagenome
<400> 7
Met Asn Leu Pro Ala Lys Lys Met Val Leu Gly Val His Thr Phe Ala
1 5 10 15
Val Ala Pro Phe Trp Asp Leu Glu Val Met Arg His Glu Ala Arg Arg
20 25 30
Leu Lys Ser His Gly Val Gly Leu Leu Glu Ile Pro Leu Leu Arg Pro
35 40 45
Glu Glu Ile Asn Ile Lys Ala Thr Arg Ala Phe Ala Arg Glu Phe Gly
50 55 60
Phe Glu Leu Val Thr Ser Leu Gly Leu Pro Ser Asn Ile Asp Ala Val
65 70 75 80
Glu Asp Pro Gln Ser Ala Leu Ala Phe Leu Glu Pro Ala Phe Lys Val
85 90 95
Ala Ala Glu Ile Gly Ser Asn Met Leu Ser Gly Val Thr Tyr Ala Pro
100 105 110
Ile Gly Lys Ile Ser Gly Gln Pro Val Thr Gln Arg Glu Lys Asp Gly
115 120 125
Ile Cys Arg Phe Leu Gln Gln Ala Ala Ala Leu Ala Ala Asn His Gly
130 135 140
Leu Lys Leu Gly Val Glu Pro Cys Asn Arg Tyr Glu Thr His Leu Met
145 150 155 160
Asn Thr Ala Ala Gln Ala Val Glu Tyr Val Glu Ala Val Ala Ala Glu
165 170 175
Asn Leu Phe Ile His Leu Asp Thr Tyr His Met Asn Ile Glu Glu Glu
180 185 190
Ser Phe Ala Ala Gly Phe Ala Lys Ala Ala Pro Tyr Leu Gly Tyr Val
195 200 205
His Leu Ser Glu Ser Asn Arg Gly Val Pro Gly Arg Ala Met Ile Asn
210 215 220
Trp Asp Ala Val Met Gly Ala Leu Ala Asp Ile Gly Tyr His Gly Ala
225 230 235 240
Leu Thr Leu Glu Ser Met Asn Tyr Val Asp Pro Asp Ile Ala Thr Ala
245 250 255
Leu Ala Val Trp Arg Pro Val Ala Lys Asn Pro Asp Asp Val Ile Asp
260 265 270
Phe Gly Leu Ala Phe Leu Leu Lys Ala Ala Ala Asp Ala Gly Leu Thr
275 280 285
Phe Gly
290
<210> 8
<211> 873
<212> DNA
<213> Unknown
<220>
<223> hydrothermal vent metagenome
<400> 8
atgaacctgc cggctaagaa gatggtcctg ggagtccata cgttcgcagt cgccccgttt 60
tgggatcttg aagtaatgcg ccacgaggcc cgccgtttaa agagccatgg cgtagggtta 120
ttggaaatcc cacttctccg gccagaagaa attaatatta aagcgacccg cgcatttgct 180
cgtgaatttg ggtttgaatt agtgaccagt ttaggcctgc cttcgaatat cgacgctgta 240
gaagatccgc agtctgcttt agcctttctg gaaccggcgt tcaaagtggc tgctgaaatt 300
ggtagcaata tgctttcagg cgttacctat gctccgattg gaaagataag tggtcagccg 360
gtgacccagc gtgagaagga tggtatttgt cggttcctac aacaagcggc tgcgttggcc 420
gcgaaccatg ggttgaaact gggcgtagag ccttgtaatc gctatgaaac gcatctgatg 480
aacacagcag cccaagcagt tgaatacgtt gaggctgtgg cagcggaaaa ccttttcatc 540
cacttagata cctaccacat gaacatcgaa gaagaaagtt ttgcagcagg gtttgcgaaa 600
gcggcgcctt atctggggta cgtgcatctg agcgagagca atcgcggcgt accgggccgc 660
gccatgatca attgggatgc agtgatgggt gcccttgccg acatcgggta tcatggggca 720
ctgactctgg agtctatgaa ttatgtggat ccggatattg cgactgccct tgcggtctgg 780
cgtccggttg ccaagaaccc ggacgatgtg atagactttg gcctggcgtt tctgctgaag 840
gccgcagcgg atgcgggttt gacattcggt taa 873
<210> 9
<211> 282
<212> PRT
<213> Unknown
<220>
<223> Meiothermus granaticius
<400> 9
Met Ala Arg Phe Gly Ala His Ala Phe Ile Trp Ser Ala Asp Trp Thr
1 5 10 15
Pro Gln Ala Ala Glu Lys Val Ala Ala Gly Ala Ala Ala Ala Gly Leu
20 25 30
Asp Phe Val Glu Ile Pro Leu Leu Arg Pro Glu Ala Phe Asp Ser Thr
35 40 45
Leu Thr Arg Arg Leu Leu Glu His His Gly Leu Gly Cys Thr Cys Ser
50 55 60
Leu Gly Leu Pro Thr Glu Ala Ala Leu Pro Asp His Pro Gln Ala Ala
65 70 75 80
Ala Arg Phe Leu Ile Gln Ala Leu Asp Val Ala His Gln Met Gly Ser
85 90 95
Pro Val Leu Ser Gly Val Thr Tyr Ala Thr Leu Gly Ala Leu Ser Gly
100 105 110
Arg Pro Pro Thr Glu Ala Asp Tyr Glu Thr Leu Ala Lys Thr Leu Lys
115 120 125
Pro Val Ala Gln His Ala Ala Arg Leu Gly Met Arg Leu Gly Leu Glu
130 135 140
Pro Val Asn Arg Tyr Glu Thr Tyr Leu Ile Asn Leu Gly Ser Gln Ala
145 150 155 160
Leu Asp Leu Ile Gln Arg Ile Gly Glu Pro Asn Val Phe Val His Leu
165 170 175
Asp Thr Tyr His Met Asn Ile Glu Glu Lys Gly Phe Lys Asn Pro Ile
180 185 190
Val Thr Val Gly Lys His Leu Gly Tyr Ile His Leu Ser Glu Ser Asp
195 200 205
Arg Gly Thr Pro Gly Ser Gly Asn Val His Trp Asp Glu Val Phe Ser
210 215 220
Gly Leu Gln Ala Ile Gly Phe Gln Gly Asp Leu Val Met Glu Ser Phe
225 230 235 240
Val Ala Leu Asn Pro Asp Ile Ala Arg Ala Thr Cys Met Trp Arg Asp
245 250 255
Val Val Gly Asp Pro Lys Thr Leu Val His Asp Gly Leu Ala Phe Leu
260 265 270
Arg Gly Lys Ala Arg Glu Tyr Gly Leu Leu
275 280
<210> 10
<211> 849
<212> DNA
<213> Unknown
<220>
<223> Meiothermus granaticius
<400> 10
atggcgcgct ttggtgcgca tgcttttatt tggagtgctg attggacccc tcaagccgcc 60
gaaaaggtcg cagcgggagc agcggcggcg ggactggatt ttgtcgaaat accgcttctt 120
cgtccagagg cgttcgattc gacacttacc cgtaggttat tagagcatca tggactggga 180
tgcacctgct ctctgggtct gcctaccgag gcagcactcc cggaccatcc tcaagcagca 240
gcccgttttc tcatccaggc cttggatgta gcccatcaaa tgggcagccc ggtcctgagt 300
ggggtcacct acgcaaccct gggcgcactg tcaggccgcc cgccgaccga ggccgattat 360
gaaaccctgg cgaaaacact gaagccagta gcgcagcacg ccgcccgcct gggtatgcga 420
ctcgggcttg aaccggttaa ccgctatgaa acatacctga taaacttagg gtcacaggcg 480
ctggatctca tccaacgtat cggcgaaccg aacgtgttcg tacacctgga tacttatcac 540
atgaacatcg aagagaaagg ttttaagaac ccgattgtta ccgtcggtaa acatcttggt 600
tatattcacc tgtctgaaag cgaccgtggt accccaggta gcggtaatgt gcattgggat 660
gaagtgttct ccggcctgca agcaatcggt tttcagggtg accttgtgat ggagtcgttt 720
gtggcactga atccggatat tgcccgcgcc acgtgcatgt ggcgggatgt tgtgggagat 780
ccgaaaacac tggtgcatga tggcctagct ttcctgcgcg gtaaagctcg cgaatacgga 840
ctgctgtaa 849
<210> 11
<211> 283
<212> PRT
<213> Unknown
<220>
<223> Rubellimicrobium thermophilum
<400> 11
Met Gln Gly Phe Gly Val His Thr Ser Met Trp Thr Met His Trp Asp
1 5 10 15
Arg Ala Gly Ala Glu Arg Thr Ile Pro Ala Ala Ala Ala Tyr Lys Met
20 25 30
Asp Phe Ile Glu Ile Ala Leu Leu Asp Thr Ala Ile Val Asp Ala Ala
35 40 45
His Thr Arg Ala Leu Leu Glu Lys His Gly Leu Arg Ala Val Cys Ser
50 55 60
Leu Gly Leu Pro Glu Pro Val Trp Ala Ser Val Asn Pro Glu Gly Ala
65 70 75 80
Ile Ala His Leu Lys Arg Ala Leu Asp Lys Thr Ala Glu Met Gly Ala
85 90 95
Glu Ala Leu Ser Gly Val Thr Tyr Gly Gly Ile Gly Gln Arg Thr Gly
100 105 110
Val Pro Pro Thr Pro Gln Glu Tyr Asp Asn Ile Ala Arg Ala Leu Glu
115 120 125
Ala Ala Ala Lys His Ala Lys Ala Leu Gly Leu Ala Phe Gly Ile Glu
130 135 140
Pro Val Asn Arg Tyr Glu Asn His Leu Ile Asn Thr Gly Arg Gln Ala
145 150 155 160
Val Glu Met Ile Glu Lys Val Gly Ala Asp Asn Ile Phe Ile His Leu
165 170 175
Asp Thr Tyr His Met Asn Ile Glu Glu Lys Gly Val Ala Asn Gly Ile
180 185 190
Leu Asp Ala Arg Glu His Leu Arg Tyr Ile His Leu Ser Glu Ser Asp
195 200 205
Arg Gly Thr Pro Gly Glu Gly Thr Cys Asp Trp Asp Glu Ile Phe Ala
210 215 220
Ala Leu Ala Ala Ile Gly Phe Lys Gly Gly Leu Ala Met Glu Ser Phe
225 230 235 240
Ile Asn Met Pro Pro Gln Val Ala Tyr Gly Leu Ala Val Trp Arg Pro
245 250 255
Val Ala Glu Ser Phe Glu Glu Val Met Asp Arg Gly Leu Pro Phe Leu
260 265 270
Arg Asn Lys Ala Arg Gln Tyr Arg Leu Ile Ala
275 280
<210> 12
<211> 852
<212> DNA
<213> Unknown
<220>
<223> Rubellimicrobium thermophilum
<400> 12
atgcaaggtt tcggcgtaca cactagcatg tggacgatgc attgggatcg cgcgggcgcc 60
gagcgcacca ttccggccgc cgccgcctac aaaatggact ttatcgaaat tgcgctgctg 120
gatacagcta tagtcgatgc agcgcacacc cgtgcgctgc tggagaagca cggcctgcgt 180
gcagtttgtt cactcggatt accggagccg gtctgggcct ctgtgaaccc ggaaggggcc 240
attgctcacc tgaaacgcgc gctggacaag accgcagaga tgggagctga agctctgtct 300
ggtgtgactt acggcggtat cggccagcgc acaggcgtac caccaacgcc ccaagaatac 360
gataacattg cccgtgccct tgaagcagct gcgaaacatg ccaaagcctt aggcctggcc 420
tttggtatcg aaccggttaa caggtatgaa aaccatttga taaacaccgg acgtcaagct 480
gtagaaatga tcgaaaaggt cggggcagat aacattttca tacacctgga tacgtatcac 540
atgaatatcg aagagaaagg tgtggcaaac ggtatcctgg atgcccgaga acaccttcgt 600
tatattcacc tgtcagaaag cgatcgcggc actcctggcg aagggacgtg tgattgggac 660
gaaatcttcg ctgcgttggc cgccatcggt tttaaaggcg gccttgctat ggaatccttt 720
attaacatgc cgcctcaagt cgcttacggc ctggcggtgt ggcgtcctgt tgccgaatct 780
tttgaagaag tcatggaccg tggcctgccg tttctacgta acaaggctcg tcagtataga 840
ttgatcgctt aa 852
<210> 13
<211> 282
<212> PRT
<213> Unknown
<220>
<223> Candidatus Thermofonsia Clade 1 bacterium
<400> 13
Met Pro Thr Phe Gly Ala His Ala Phe Val Trp Ile Gly Asp Trp Thr
1 5 10 15
Thr Glu Ser Gly Asn Tyr Ala Ile Ala Gln Ala Gly Ala Leu Gly Phe
20 25 30
Asp Phe Ile Glu Ile Pro Leu Leu Ala Pro Gln Arg Phe Asp Ala Ala
35 40 45
Ser His Arg Gln Ala Leu Ala Gln Ala Gly Ile Gln Ala Thr Cys Ser
50 55 60
Leu Val Leu Pro Lys Gly Ala His Met Pro Arg Tyr Pro Glu Arg Ala
65 70 75 80
Arg Gln Phe Leu Tyr Glu Ala Leu Glu Lys Val Glu Ala Val Gly Ser
85 90 95
Gln Tyr Leu Gly Gly Cys Ile Ala Tyr Glu Leu Gly Tyr Leu Thr Gly
100 105 110
Gln Pro Pro Thr Pro Glu Glu Arg Gln Val Val Val Glu Val Leu Arg
115 120 125
Asp Val Ala Ala Glu Ala Arg Arg Arg Gly Ile Gln Leu Ala Leu Glu
130 135 140
Ala Cys Asn Arg Tyr Glu Thr Tyr Leu Tyr Asn Thr Leu Ala Asp Val
145 150 155 160
Arg Glu Thr Val Leu Ala Val Gly Ala Pro Asn Leu Lys Leu His Ala
165 170 175
Asp Thr Tyr His Met Asn Ile Glu Glu Glu Gly Phe Ala Gln Pro Leu
180 185 190
Ile Ala Cys Ala Asp Val Leu Asp Tyr Ile His Met Ser Glu Ser His
195 200 205
Arg Gly Leu Val Gly Ser Gly Asn Val Asn Trp Ala Gln Val Trp Gln
210 215 220
Ala Leu Ala Ala Ile Arg Phe Asn Gly Lys Leu Val Leu Glu Ser Phe
225 230 235 240
Ala Ala Ile Asn Pro Asp Leu Gln Ala Ala Thr Cys Leu Trp Arg Pro
245 250 255
Pro Asn Gln Pro Pro Glu Val Leu Ala Arg Glu Gly Leu Arg Phe Leu
260 265 270
Arg Glu Gly Ala Ala Gln Ala Gln Leu Pro
275 280
<210> 14
<211> 849
<212> DNA
<213> Unknown
<220>
<223> Candidatus Thermofonsia Clade 1 bacterium
<400> 14
atgccaacct tcggcgccca tgcatttgtg tggattggag attggacgac agaatcggga 60
aactatgcga tcgcgcaagc cggcgcactg ggcttcgact tcattgagat tccgcttttg 120
gcaccgcagc gttttgatgc cgcttcccac cgtcaagccc tggcgcaggc cggcattcag 180
gcgacgtgca gcctggtatt gccaaaaggc gctcacatgc ccaggtatcc agaacgtgcg 240
cgtcagttct tgtatgaagc gttagaaaag gtagaggcgg ttggaagtca atacttgggc 300
ggttgcatcg cgtacgaact tgggtatctt accggtcagc caccgacccc ggaagagcgt 360
caggttgttg tggaagtgct gcgcgatgta gccgcagaag cacgccgtcg cggcattcag 420
ttggcactgg aagcatgcaa tcgctatgag acttacctgt acaacacgct ggcggacgtg 480
cgcgaaacgg ttttagcggt gggcgcgcca aacttgaagc tgcatgcgga tacctaccac 540
atgaacatcg aagaagaagg ctttgcccag ccgcttattg cctgtgccga cgtgctggat 600
tatatccaca tgtcggaatc ccatcgcggc ctggtcggaa gcggcaacgt taattgggcg 660
caggtctggc aagcgctcgc cgcaattcgc ttcaatggca aactggtgct ggaatcgttt 720
gccgcgatta acccggacct tcaggccgct acttgtctgt ggcgcccgcc caaccagccg 780
ccggaagtgc tggcccgcga aggactgcga tttctccgag aaggtgcggc acaggcccaa 840
ctaccgtaa 849
<210> 15
<211> 282
<212> PRT
<213> Unknown
<220>
<223> Deinococcus koreensis
<400> 15
Met Leu Lys Phe Gly Ala His Ala Phe Cys Trp Glu Gly Asp Trp Thr
1 5 10 15
Asp Glu Ile Gly Asp Arg Val Ile Glu Gln Ala Ala Arg Ala Gly Leu
20 25 30
Asp Phe Ile Glu Ile Pro Leu Leu His Pro Glu Thr Phe Asp Ala Arg
35 40 45
Arg His Arg Arg His Leu Glu Ala Val Gly Leu Ala Cys Val Ser Ser
50 55 60
Leu Gly Leu Pro Arg Asp Ala His Met Pro His Glu Pro Glu Lys Ala
65 70 75 80
Val Thr Phe Leu Thr Gly Val Leu Asp Arg Met Glu Glu Leu Gly Ala
85 90 95
Arg Asp Leu Thr Gly Cys Thr Gly Tyr Ser Ile Gly Val Leu Thr Gly
100 105 110
Gln Gly Pro Thr Ser Gln Glu Leu Asp Arg Met Val Asp Gly Leu Ala
115 120 125
Arg Val Thr Glu Asp Ala Arg Ser Arg Gly Ile Gly Val Gly Leu Glu
130 135 140
Ala Ile Asn Arg Tyr Glu Thr Tyr Met Val Asn Thr Leu Asp Asp Ala
145 150 155 160
Leu Ala Val Val Asn Arg Val Gly Ser Asp Asn Leu Arg Val His Ala
165 170 175
Asp Thr Tyr His Met Asn Ile Glu Glu Thr Asn Leu Arg Glu Ala Leu
180 185 190
Gly Arg Val Lys Gly Lys Leu Asn Phe Ile His Met Ser Glu Ser His
195 200 205
Arg Gly Leu Val Gly Thr Gly Thr Val Pro Trp Glu Asp Val Trp Gln
210 215 220
Gly Leu Ala Asp Ile Glu Phe Ser Gly Tyr Leu Thr Leu Glu Ser Phe
225 230 235 240
Ala Ala Pro Asn Ala Glu Leu Ala Ala Ala Thr Cys Ile Trp Lys Pro
245 250 255
Pro Arg His Ser Gly Gln Glu Leu Ala Gln Gly Gly Leu Ala Phe Leu
260 265 270
Arg Glu Gly Ala Thr Arg His Gly Leu Met
275 280
<210> 16
<211> 849
<212> DNA
<213> Unknown
<220>
<223> Deinococcus koreensis
<400> 16
atgttgaagt tcggcgcgca cgccttttgc tgggaaggcg attggaccga tgaaattggc 60
gatcgcgtca tcgagcaagc ggcgcgggcc ggattggatt tcattgaaat cccgctcttg 120
caccctgaaa ccttcgatgc gcgccgtcat cgtcgccatc ttgaggctgt gggcctggcg 180
tgcgtttcca gcctgggcct tccgcgtgac gcccacatgc cacatgaacc ggagaaagcg 240
gtaacattcc ttaccggcgt actggatcgc atggaagaac tgggcgctcg cgaccttacc 300
ggttgtaccg gttatagcat tggcgtactg accggccagg gtccgacctc tcaagagctc 360
gatcgtatgg tggatggtct ggctcgtgtg actgaagatg cacggtcgcg cgggattggc 420
gtaggccttg aagccatcaa tcgttatgaa acttatatgg taaacacgct ggacgatgcg 480
ttagcggtcg tgaatcgtgt cgggagtgac aatcttcgcg ttcatgccga tacataccac 540
atgaacatag aagaaaccaa cctgcgtgag gcgcttgggc gagttaaggg taagctgaac 600
ttcattcaca tgagtgaaag tcatcgtggt ctggttggta ccgggacagt tccatgggaa 660
gatgtttggc agggtctggc ggatattgag ttcagcgggt atcttactct tgaatcgttt 720
gcagctccga atgccgagtt ggcggcagct acctgtatct ggaaaccacc acggcatagc 780
ggccaggaac tggcgcaggg tggcctagct tttctgcgcg agggcgcgac tcgccacggc 840
ttaatgtaa 849
<210> 17
<211> 281
<212> PRT
<213> Unknown
<220>
<223> Olavius algarvensis spirochete endosymbiont
<400> 17
Met Lys Phe Gly Ala His Ala Phe Val Trp Glu Pro Glu Trp Asn Asp
1 5 10 15
Thr Thr Ser Arg Arg Val Ile Ser Glu Ala Ala Arg Ile Gly Leu Asp
20 25 30
Phe Val Glu Ile Pro Leu Leu Arg Pro Glu Arg Phe Asp Gly Ala Ala
35 40 45
Thr Lys Val Leu Leu Asp Glu His Ala Val Gly Ala Thr Tyr Ser Leu
50 55 60
Gly Leu Pro Ser Asp Lys Ser Leu Pro Glu Arg Pro Tyr Leu Ala Glu
65 70 75 80
Pro Phe Leu Arg Ser Ala Ile Asp Ala Ile Glu Ser Ala Gly Gly Asp
85 90 95
Thr Leu Thr Gly Val Leu Tyr Gly Thr Leu Gly Glu Leu Pro Gly Arg
100 105 110
Pro Pro Asn Glu Lys Asp Tyr Lys Val Ile Ala Gln Val Leu Arg Ser
115 120 125
Val Ala Asp Tyr Ala Lys Asp Arg Gly Ile Lys Leu Gly Ile Glu Pro
130 135 140
Val Asn Arg Tyr Glu Thr Phe Leu Val Asn Thr Ala Glu Gln Ala Ile
145 150 155 160
Thr Leu Leu Asp Arg Ile Glu Ser Asp Asn Val Phe Ile His Leu Asp
165 170 175
Thr Tyr His Val Asn Ile Glu Glu Asp Ser Phe Gly Ala Ala Ile Arg
180 185 190
Leu Ala Gly Asp Arg Leu Gly Tyr Ile His Leu Ser Glu Ser His Arg
195 200 205
Gly Thr Pro Gly Lys Gly Thr Val Asp Trp Asp Asp Val Phe Gly Ala
210 215 220
Leu Ser Asp Ile Gly Phe Ala Gly Pro Leu Val Met Glu Ser Phe Val
225 230 235 240
Lys Leu Asn Ala Asp Ile Ala Arg Ala Thr Cys Met Trp Arg Asp Ile
245 250 255
Val Lys Asp Pro Glu Ala Leu Ile Arg Asp Gly Ile Ala Phe Leu Glu
260 265 270
Gly Lys Ala Lys Gly Tyr Gly Leu Phe
275 280
<210> 18
<211> 846
<212> DNA
<213> Unknown
<220>
<223> Olavius algarvensis spirochete endosymbiont
<400> 18
atgaaatttg gtgcgcatgc tttcgtctgg gaaccagaat ggaatgatac cacctcgcgc 60
cgtgtgattt cagaggccgc gcgcatcggc ctggattttg tggaaatacc gctccttcgc 120
ccagaacgct ttgacggcgc cgctaccaaa gtcttgctgg atgaacatgc cgtgggcgcc 180
acttattcat tgggcctgcc cagtgacaaa agcctgccag aacgcccgta tctggctgaa 240
cccttcttac ggtctgcaat cgacgccatt gaatccgcag gcggtgatac actgacaggc 300
gtgctgtatg gcactctggg tgagctgccg ggccgcccgc cgaacgaaaa ggactacaaa 360
gtgattgcgc aggtattacg tagtgttgct gattacgcga aagaccgtgg catcaaactg 420
ggcattgagc cggtaaaccg ttatgaaacc tttctggtga ataccgcaga gcaggcgatc 480
acattgttag accgtatcga aagcgacaat gtctttattc atctggatac ctatcacgtg 540
aacatcgaag aagatagttt tggcgcggct atccgcctgg ctggggatcg tttaggctac 600
atccacctgt ccgaaagcca ccgtggcacg ccaggcaagg gtactgtgga ttgggacgac 660
gttttcggag cgctttccga tattggtttc gcaggccctc ttgtgatgga aagctttgtc 720
aagctgaatg cagacattgc acgtgcgacc tgcatgtggc gtgatattgt gaaagaccca 780
gaagccctga ttcgcgatgg tattgcgttt ctcgagggga aagcgaaagg ctatggtctg 840
ttttaa 846
<210> 19
<211> 282
<212> PRT
<213> Unknown
<220>
<223> Acidiphilium
<400> 19
Met Lys Gly Phe Gly Ile His Thr Ser Leu Trp Ala His Asp Trp Thr
1 5 10 15
Glu Gln Ala Ala Arg Leu Ala Ile Pro Glu Ala Ala Lys His Gly Leu
20 25 30
Ala Phe Val Glu Ile Ala Leu Ile Glu Pro Asp Arg Ala Glu Thr Glu
35 40 45
Val Thr Arg Gly Leu Leu Glu Gln His Gly Leu Ala Ala Cys Cys Ser
50 55 60
Leu Gly Leu Pro Glu Glu Ala Arg Pro Thr Thr Asn Pro Asp Lys Ala
65 70 75 80
Leu Glu Phe Val Thr Leu Ala Leu Glu Lys Thr Ala Ala Ile Gly Ala
85 90 95
Ser Leu Phe Thr Gly Val Thr Tyr Gly Ser Ile Gly Glu Arg Thr Gly
100 105 110
Gln Pro Pro Thr Ala Ala Glu Leu Asp Ala Val Ala Arg Phe Leu Asp
115 120 125
Lys Ala Ala Ala Val Ala Arg Gly Phe Gly Ile Ile Phe Gly Ile Glu
130 135 140
Val Val Asn Arg Tyr Glu Ser His Leu Phe Asn Thr Thr Glu Gln Ala
145 150 155 160
Val Ala Leu Ile Glu Arg Val Gly Ala Pro Asn Ile Val Leu His Leu
165 170 175
Asp Thr Tyr His Met Asn Ile Glu Ala Thr Gly Gln Ala Asn Ala Ile
180 185 190
Arg Ala Ala Gly Ala His Leu Ala Tyr Ile His Leu Ser Glu Ser His
195 200 205
Arg Gly Val Pro Gly Thr Gly Thr Ile Ala Trp Asp Glu Val Phe Ala
210 215 220
Gly Leu Ala Gly Leu Gly Phe Thr Gly Gly Met Ala Leu Glu Ser Phe
225 230 235 240
Ile His Met Pro Pro Arg Leu Ala Ala Ala Leu Ser Val Trp Arg Pro
245 250 255
Val Ala Pro Ser Arg Ala Ala Ile Ile Asp Glu Gly Leu Pro Phe Leu
260 265 270
Arg Asn Lys Ala Arg Gln Tyr Gly Leu Ile
275 280
<210> 20
<211> 849
<212> DNA
<213> Unknown
<220>
<223> Acidiphilium
<400> 20
atgaaaggct ttggcattca tacaagtctg tgggcccatg actggaccga gcaagcggct 60
cgtttagcaa ttccggaagc ggcaaaacat ggcctggcgt ttgtcgaaat tgctttaatt 120
gaaccagatc gcgcggaaac tgaagttacc cgcgggctgc tggaacagca cggcttggct 180
gcctgctgct ctctgggctt acctgaggaa gcgcggccaa cgacgaaccc ggataaagcg 240
ttggagttcg tcactttagc tctggaaaag accgcggcga taggggctag cctgtttacc 300
ggtgtgacct acgggagcat tggcgaacgt acgggccagc cacctactgc cgccgaactt 360
gatgcagtag caaggttctt ggataaggct gccgcagtag cgcgcggttt cggtatcatt 420
ttcggtatcg aagtagtgaa tcggtacgag tctcatctgt ttaacaccac cgaacaggcc 480
gttgcactga tcgaacgtgt cggcgcaccg aacatagtgc tgcacttaga cacgtatcac 540
atgaacatcg aagccacggg ccaggccaac gcaatacgcg cggcgggtgc acatctggcc 600
tatattcacc tgagtgaatc gcacaggggt gttccgggca cagggaccat cgcctgggac 660
gaggtgtttg caggtcttgc cggcctgggc tttaccggcg ggatggccct cgaatcattt 720
attcacatgc cgccccgcct ggccgccgcg ctgagcgtct ggcgtccagt tgcaccgagt 780
cgcgcggcca tcatcgatga aggccttcca tttctgcgaa ataaagcccg tcaatacggc 840
ctcatttaa 849
<210> 21
<211> 285
<212> PRT
<213> Unknown
<220>
<223> Rhodobacterales bacterium
<400> 21
Met Leu Ser Leu Gly Leu His Ala Leu Ala Ala Ala Pro Glu Trp Arg
1 5 10 15
Pro Asp Leu Trp Ala Ala Ile Leu Pro Arg Met Ala Ala His Gly Val
20 25 30
Ser Val Ile Glu Ile Pro Leu Leu Arg Pro Ala Glu Leu Asp Ile Ala
35 40 45
Gly Thr Arg Ala Leu Ala Ala Lys His Asp Val Glu Leu Val Cys Ser
50 55 60
Leu Gly Leu Pro Ala Thr Leu Asn Val Ala Glu Arg Pro Asp Glu Ala
65 70 75 80
Phe Asp Phe Ile Arg Val Ala Leu Glu Val Thr Ala Ser Ala Gly Ala
85 90 95
Thr Ala Leu Ser Gly Val Thr Phe Gly Val Ile Gly Gln Thr Thr Gly
100 105 110
Ala Ala Pro Thr Thr Arg Glu Ile Asp Ala Met Thr Arg His Val Ser
115 120 125
Arg Ser Ala Ala Leu Ala Lys Lys Leu Gly Leu Arg Phe Gly Ile Glu
130 135 140
Pro Cys Asn Arg Tyr Glu Thr His Leu Leu Asn Thr Gly Ala Ala Ala
145 150 155 160
Arg Ala Val Ile Glu Arg Ser Gly Ala Asp Asn Ala Phe Ile His Leu
165 170 175
Asp Thr Tyr His Met Asn Ile Glu Glu Val Ser His Ala Gln Gly Phe
180 185 190
Ala Asp Ala Gly Asp Leu Leu Gly Tyr Val His Leu Ser Glu Ser Asn
195 200 205
Arg Gly Val Pro Gly Arg Gly Thr Val Asp Trp Ala Asn Val Phe Gln
210 215 220
Gly Leu Lys Ala Ala Gly Phe Asp Gly Cys Ala Ala Leu Glu Ser Phe
225 230 235 240
Val Phe Val Asp Ala Asp Leu Ala Ser Gly Leu Ala Ile Trp Arg Pro
245 250 255
Val Ala Glu Asn Pro Asp Asp Val Ile Asp Val Gly Phe Pro Phe Leu
260 265 270
Arg Thr Ala Gly Glu Ala Ala Gly Leu Arg Trp Ala Arg
275 280 285
<210> 22
<211> 858
<212> DNA
<213> Unknown
<220>
<223> Rhodobacterales bacterium
<400> 22
atgctttctc tgggactgca tgcgcttgca gccgcccctg aatggcgccc ggatctgtgg 60
gcggcgatcc tgccgcgtat ggcggcccac ggtgttagcg ttatcgaaat tccgctgctc 120
cgtcctgctg aactggatat tgcgggcacg cgggctttag cggctaaaca tgatgttgaa 180
ctcgtttgtt cattggggct gccagccacc ctcaatgttg cggaacgccc tgatgaggcg 240
tttgatttta tccgcgtggc gttagaagtg accgcgagcg cgggtgcgac cgcgctgtca 300
ggagtgacat ttggcgtgat tgggcagacg acgggcgccg ccccaaccac gcgcgaaatc 360
gatgctatga cccggcatgt gagccgtagc gcagccctcg ccaagaaact gggcttgcgc 420
tttggcattg agccgtgcaa ccgctacgaa acccacttac tgaatactgg cgcagccgct 480
cgggccgtga tagaacgctc aggcgctgat aacgccttca tccatttgga tacatatcac 540
atgaatatcg aagaagtgtc tcatgctcag ggttttgcag atgcgggcga cctgctggga 600
tatgtgcact tgtcagaaag caatcgaggc gtcccggggc gtggtaccgt cgattgggcg 660
aatgtatttc agggtctgaa agccgccgga ttcgatggtt gcgccgcact cgaaagtttc 720
gtgttcgttg acgcggactt agcatccgga cttgccatct ggcgtcctgt tgctgaaaac 780
ccagatgacg tgattgacgt aggtttcccg ttcttgcgga cagccggaga ggcggcgggc 840
ttgcgctggg cgcgttaa 858
<210> 23
<211> 282
<212> PRT
<213> Unknown
<220>
<223> Chloroflexi bacterium
<400> 23
Met Val Leu Phe Gly Ala His Thr Phe Ile Trp Ser Ala Glu Trp Asn
1 5 10 15
Pro Glu Thr Ala Glu His Val Ile Asp Gly Ala Ala Arg Ala Gly Leu
20 25 30
Asp Phe Val Glu Ile Pro Leu Leu His Pro Asp Gln Met Asp Ala Gly
35 40 45
Gly Thr Arg Arg Leu Leu Glu Asn Tyr Gly Leu Gln Cys Thr Cys Ser
50 55 60
Leu Gly Leu Pro Arg Glu Ala His Leu Pro Phe Ala Pro Asp Lys Ala
65 70 75 80
Thr Gly Phe Leu Glu Gln Ala Val Asp Val Thr Ser Asp Leu Gly Ser
85 90 95
Pro Val Leu Thr Gly Cys Leu Tyr Thr His Leu Gly Thr Leu Thr Gly
100 105 110
Lys Pro Pro Thr Asp Glu Glu Ile Asp Leu Val Val Arg Val Leu Lys
115 120 125
Arg Ile Ala Arg Tyr Ala Gln Asp Arg Gly Ile Ser Leu Gly Ile Glu
130 135 140
Pro Val Asn Arg Tyr Glu Thr Tyr Leu Leu Asn Leu Ala Glu Gln Ala
145 150 155 160
Ser Ala Leu Leu Asp Arg Ile Asp Glu Ala Asn Val Phe Val His Leu
165 170 175
Asp Thr Tyr His Met Asn Ile Glu Glu Lys Gly Phe Tyr Thr Pro Ile
180 185 190
Val Asp Thr Gly Pro Arg Leu Gln Tyr Ile His Leu Ser Glu Ser Asp
195 200 205
Arg Gly Ile Pro Gly Thr Gly Asn Val His Trp Asp Glu Val Phe Arg
210 215 220
Gly Leu Lys Ala Val Lys Tyr Glu Gly Arg Leu Val Met Glu Ser Phe
225 230 235 240
Ala Ala Val Asn Glu Asp Leu Met Gly Ala Thr Ala Met Trp Arg Asp
245 250 255
Val Val Gly Asp Pro Asp Arg Leu Val Thr Glu Gly Leu Ala Phe Leu
260 265 270
Arg Gly Lys Ala Ile Glu Tyr Gly Leu Leu
275 280
<210> 24
<211> 849
<212> DNA
<213> Unknown
<220>
<223> Chloroflexi bacterium
<400> 24
atggtactgt ttggggcgca tacctttatt tggagcgccg aatggaaccc agaaacggcg 60
gaacatgtaa ttgatggcgc agctcgcgcc ggcctggatt tcgttgagat tccgttgctg 120
catcccgatc agatggacgc aggcggcacg cgccggcttt tggaaaacta tggtctgcaa 180
tgcacatgta gcttgggcct gccgcgcgaa gcgcatctgc cattcgcccc tgacaaggca 240
acaggctttc tggaacaggc cgtcgatgtg acaagtgacc tgggtagccc tgttttgacc 300
ggctgtttat atacccactt aggaacgctg acaggaaagc cgcctaccga cgaagagatt 360
gatttggtcg ttcgtgtcct gaagcgaatt gcgcgctacg cccaggaccg agggattagt 420
ctgggcatcg aaccggtcaa ccgctatgaa acctatcttc tgaatctggc ggagcaagcg 480
tctgcactgc tcgatcgtat tgacgaagcc aatgtatttg tgcatctgga tacctatcac 540
atgaacattg aagaaaaggg cttttatact ccgatcgttg ataccgggcc gcgtttacag 600
tacattcacc tgtccgaatc ggaccgcggt atcccgggta ctggcaacgt tcattgggac 660
gaggtgtttc gaggcctcaa ggccgttaaa tacgaaggcc gtcttgtgat ggaatctttc 720
gccgcagtca acgaagatct gatgggtgca acggcgatgt ggcgggatgt ggtgggtgat 780
ccggatcgat tagtcacgga aggcctggcg ttcttacgtg gaaaggcgat tgagtacggc 840
ctgctgtaa 849
<210> 25
<211> 283
<212> PRT
<213> Unknown
<220>
<223> Spiribacter sp. E85
<400> 25
Met Ala Glu Phe Gly Ala His Ala Phe Ile Trp Glu Ser Asp Trp Asn
1 5 10 15
Pro Ala Ser Ala Arg Arg Val Ile Ala Gly Ala Ala Ala Ala Gly Leu
20 25 30
Asp Phe Val Glu Ile Pro Leu Leu Arg Pro Glu Ser Met Asp Thr Ala
35 40 45
Gly Thr Arg Arg Leu Leu Ala Glu His Arg Leu Gly Val Arg Cys Ser
50 55 60
Leu Gly Leu Pro Pro Ala Ala Ser Leu Pro Ala His Pro Gln Ala Ala
65 70 75 80
Glu Ala Phe Leu Cys Arg Ala Leu Asp Val Thr Arg Ala Leu Gly Gly
85 90 95
Pro Val Leu Thr Gly Val Ile Tyr Gly Thr Leu Gly Gln Leu Pro Gly
100 105 110
His Pro Pro Arg Pro Gly Asp Leu Asp Ile Val Ala Gln Thr Leu Arg
115 120 125
Arg Val Ala Ala Tyr Ala Ala Asp Gln Gly Leu Ala Leu Gly Ile Glu
130 135 140
Pro Val Asn Arg Tyr Glu Thr His Leu Val Asn Leu Thr Asp Gln Ala
145 150 155 160
Leu Glu Leu Leu Asp Ala Ile Gly Ala Asp Asn Val Phe Leu His Leu
165 170 175
Asp Thr Tyr His Met Asn Val Glu Glu Lys Gly Phe Arg Gly Pro Val
180 185 190
Glu Ala Ala Gly Lys Arg Leu Arg Tyr Ile His Leu Ser Glu Ser Asp
195 200 205
Arg Gly Thr Pro Gly Thr Gly Asn Val His Trp Asp Glu Val Phe Asp
210 215 220
Gly Leu Ala Ala Ile Gly Tyr Arg Gly Asp Leu Val Met Glu Ser Phe
225 230 235 240
Ala Ala Val Asn Glu Asp Ile Ala Arg Ala Thr Cys Ile Trp Arg Gln
245 250 255
Val Ala Pro Asp Pro Asp Thr Leu Val Arg Glu Gly Leu Ala Phe Leu
260 265 270
Arg Gly Lys Ala Thr Ala Arg Gly Leu Ile Pro
275 280
<210> 26
<211> 852
<212> DNA
<213> Unknown
<220>
<223> Spiribacter sp. E85
<400> 26
atggcggagt tcggtgcaca tgctttcatt tgggagtctg actggaatcc ggcgtcagct 60
cgccgtgtca ttgccggcgc cgctgccgcc ggcctagatt tcgtcgagat cccactgctc 120
cgcccggaat ccatggacac cgcgggaacc cgcagattac ttgctgaaca tcgcctcggc 180
gtgcgctgtt cactgggcct gccgccggca gcgagtctac ccgctcatcc gcaggccgca 240
gaagcattcc tttgccgcgc cctagacgtt acgcgtgcgt tgggcggacc cgtactcact 300
ggtgtcatct atggcactct gggccagtta ccgggtcacc cgccacgccc tggcgatctt 360
gacattgtcg cacagacctt acggcgcgtg gcagcgtacg ccgcagatca gggtctggcc 420
ctgggcattg aaccagtgaa ccgttatgaa acacatttag tgaatctcac ggatcaagcc 480
ctagaactgt tagatgcgat tggcgccgac aatgtattcc tgcatctgga tacctatcac 540
atgaacgtgg aagagaaagg ttttcgtggt ccagttgaag cagctggtaa acgtttgaga 600
tacattcatc tttcggagtc agatcgtggt accccgggga caggcaacgt tcactgggat 660
gaagtattcg acggtctggc tgcaatcgga taccgtgggg atctggtgat ggaaagtttt 720
gcggccgtga atgaggacat tgcgcgtgcg acctgcatct ggcgtcaagt tgccccagac 780
ccggacactc tggttagaga aggcttggcg tttcttcgcg gcaaagcgac cgcccgcggc 840
cttatccctt aa 852
<210> 27
<211> 282
<212> PRT
<213> Unknown
<220>
<223> Tabrizicola sp. TH137
<400> 27
Met Glu Gly Phe Gly Val His Thr Ser Met Trp Thr Met His Trp Asp
1 5 10 15
Arg Ala Gly Ala Glu Arg Thr Ile Pro Ala Ala Ala Ala Tyr Arg Met
20 25 30
Asp Phe Ile Glu Ile Ala Leu Leu Asn Thr Ala Ile Val Asp Ala Ala
35 40 45
His Thr Arg Ala Leu Leu Glu Arg His Gly Met Arg Ala Val Cys Ser
50 55 60
Leu Gly Leu Pro Glu Arg Asn Trp Ala Ser Val Asn Pro Glu Gly Ala
65 70 75 80
Ile Ala His Leu Cys Asp Cys Ile Asp Thr Ala Ala Ala Met Gly Ala
85 90 95
Glu Ala Leu Ser Gly Val Thr Tyr Gly Gly Ile Gly Gln Arg Thr Gly
100 105 110
Leu Pro Pro Thr Met Ala Glu Tyr Asp Asn Ile Ala Arg Ala Leu Ala
115 120 125
Ala Val Ala Lys His Ala Lys Ala Arg Gly Ile Ala Phe Gly Ile Glu
130 135 140
Pro Val Asn Arg Tyr Glu Asn His Leu Ile Asn Thr Ala Ala Gln Ala
145 150 155 160
Lys Trp Met Ile Glu Lys Val Gly Ala Asp Asn Ile Phe Ile His Leu
165 170 175
Asp Thr Tyr His Met Asn Ile Glu Glu Lys Gly Ala Gly Asn Gly Ile
180 185 190
Leu Asp Ala Arg Asp His Leu Arg Tyr Ile His Leu Ser Glu Ser Asp
195 200 205
Arg Gly Thr Pro Gly Glu Gly Thr Cys Asp Trp Asp Glu Val Tyr Ala
210 215 220
Thr Leu Ala Ala Ile Gly Phe Lys Gly Gly Leu Ala Met Glu Ser Phe
225 230 235 240
Ile Asn Met Pro Pro Glu Val Ala Tyr Gly Leu Ala Val Trp Arg Pro
245 250 255
Val Ala Glu Asn Phe Glu Glu Val Met Asp Lys Gly Leu Pro Phe Leu
260 265 270
Arg Asn Lys Ala Arg Gln Tyr Arg Leu Ile
275 280
<210> 28
<211> 849
<212> DNA
<213> Unknown
<220>
<223> Tabrizicola sp. TH137
<400> 28
atggaaggat ttggtgtaca tacttccatg tggacaatgc actgggatcg cgcgggcgct 60
gaacgtacca ttcctgccgc agctgcgtac cgcatggatt tcatagagat tgctttatta 120
aacacagcca ttgttgacgc ggcacacacg agggctctcc ttgaacggca tggcatgcgc 180
gcagtgtgtt cattgggctt acctgaacgc aattgggcga gcgtgaaccc ggaaggcgcc 240
atcgcacatc tgtgcgattg tattgacaca gcagcagcca tgggcgccga agccctatcc 300
ggcgtcacgt atggcggcat cgggcaacgt acggggctcc cgcctacgat ggccgaatac 360
gataacattg cccgcgctct ggcagctgtg gcgaaacatg ctaaagcacg cggcattgcg 420
tttggtatcg aacccgtgaa tcgctacgaa aatcacttga ttaataccgc cgcacaagct 480
aaatggatga tcgaaaaggt tggggctgat aatatattta ttcatctgga cacctatcac 540
atgaacatag aggaaaaggg agccggcaat gggatcctcg atgcgcgtga tcatttgaga 600
tatatccact tatcggaatc ggatcgcggc actccgggcg aaggcacgtg tgactgggat 660
gaggtatatg ctaccctggc cgccattggt tttaaaggcg gtttggctat ggaatcgttt 720
attaatatgc caccggaagt ggcctatggt cttgccgtct ggcgtccggt ggcggaaaat 780
tttgaggaag tgatggataa aggactcccg ttcttgcgta ataaagcgcg ccaatatcgc 840
ctgatataa 849
<210> 29
<211> 282
<212> PRT
<213> Unknown
<220>
<223> Tropicimonas isoalkanivorans
<400> 29
Met Lys Gly Phe Gly Val His Thr Ser Met Trp Thr Met His Trp Asp
1 5 10 15
Arg Asp Gly Ala Glu Arg Thr Ile Pro Ala Thr Ala Ala Tyr Gly Met
20 25 30
Asp Phe Val Glu Ile Ala Leu Leu Asp Thr Ser Ile Val Asp Ala Ala
35 40 45
His Thr Arg Ala Leu Leu Glu Lys His Glu Leu Arg Ala Val Cys Ser
50 55 60
Leu Gly Leu Pro Glu Gly Ser Trp Pro Ser Val Ala Pro Glu Ala Ala
65 70 75 80
Val Ala His Leu Lys Asp Val Phe Glu Thr Ala Ala Ala Met Gly Ala
85 90 95
Glu Ala Val Ser Gly Val Thr Tyr Gly Gly Ile Gly Gln Arg Ser Gly
100 105 110
Val Pro Pro Thr Glu Glu Glu Tyr Asp Asn Val Ala Arg Ala Leu Gln
115 120 125
Gln Ala Ala Ala Tyr Ala Lys Arg Leu Gly Leu Ala Phe Gly Ile Glu
130 135 140
Pro Val Asn Arg Tyr Glu Asn His Leu Ile Asn Thr Ala Trp Gln Ala
145 150 155 160
Arg Asp Met Ile Glu Lys Val Gly Ser Asp Asn Ile Phe Ile His Leu
165 170 175
Asp Thr Tyr His Met Asn Ile Glu Glu Lys Gly Val Ala Asn Gly Ile
180 185 190
Leu Asp Ala Arg Asp His Leu Arg Tyr Ile His Leu Ser Glu Ser Asp
195 200 205
Arg Gly Thr Pro Gly Glu Gly Cys Cys Asp Trp Asn Glu Val Phe Gly
210 215 220
Thr Leu Ser Ala Ile Gly Phe Glu Gly Gly Met Ala Met Glu Ser Phe
225 230 235 240
Ile Asn Met Pro Pro Gln Ile Ala Tyr Gly Leu Ala Val Trp Arg Pro
245 250 255
Val Ala Asp Ser Phe Glu Asp Val Met Asp Arg Gly Leu Pro Phe Leu
260 265 270
Arg Asn Lys Ala Arg Gln Tyr Arg Leu Ala
275 280
<210> 30
<211> 849
<212> DNA
<213> Unknown
<220>
<223> Tropicimonas isoalkanivorans
<400> 30
atgaagggtt tcggggtgca cacgagtatg tggacgatgc attgggaccg ggatggcgcg 60
gaacgtacaa ttccagcgac ggccgcgtat ggcatggatt ttgtcgagat cgctctgttg 120
gatacctcta tcgttgatgc tgcgcacacc cgggcgctcc tggagaaaca cgagctgcgc 180
gccgtttgct cgttgggcct gccggaaggc tcgtggcctt cggttgcccc agaggcggcg 240
gtagcgcatc tgaaagacgt atttgaaacc gcagccgcga tgggcgccga agcggtttcg 300
ggcgtcacat acggcggtat tggccaacgt tccggtgtgc cgcccaccga ggaagaatat 360
gacaacgtag ctcgtgccct gcaacaggca gcggcttacg ccaaacgctt aggcttagcc 420
tttggcattg aacctgtgaa ccgctacgaa aaccatttga tcaacactgc atggcaggcc 480
cgtgacatga ttgaaaaggt aggctcggac aatattttca tccatttaga tacttaccac 540
atgaatatag aagagaaagg tgtggcgaac ggtatcttag acgcacgtga tcaccttcgt 600
tatattcatc tttcagagag cgaccgtggc actccgggtg aaggttgctg cgattggaac 660
gaagttttcg ggaccttgag cgctattggg tttgaaggtg gtatggcgat ggaatcgttt 720
attaacatgc cgccgcagat agcttacggc ctggccgttt ggcgaccagt tgcggactcc 780
ttcgaagatg tgatggatcg cgggctgccg tttctgcgta acaaagcgcg tcagtaccgt 840
ctggcttaa 849
<210> 31
<211> 282
<212> PRT
<213> Unknown
<220>
<223> Rhodobacteraceae bacterium
<400> 31
Met Gln Gly Phe Gly Val His Thr Ser Met Trp Thr Met His Trp Asp
1 5 10 15
Arg Leu Gly Ala Glu Arg Thr Ile Pro Ala Ala Ala Ala Tyr Lys Met
20 25 30
Asp Phe Ile Glu Ile Ala Leu Leu Asp Thr Ser Val Val Asp Ala His
35 40 45
His Thr Arg Asp Leu Leu Ala Lys His Glu Met Arg Ala Val Cys Ser
50 55 60
Leu Gly Leu Pro Arg Glu Ser Trp Ala Ser Val Asn Pro Asp Gly Ala
65 70 75 80
Ile Ala His Leu Ile Asp Ala Met Asp Tyr Thr Lys Glu Met Gly Gly
85 90 95
Glu Ala Leu Ser Gly Val Thr Tyr Gly Gly Ile Gly Glu Arg Ser Gly
100 105 110
Val Pro Pro Thr Glu Ala Glu Tyr Asp Asn Ile Ala Arg Ala Leu Glu
115 120 125
Val Ala Ala Lys Tyr Ala Lys Thr Leu Gly Ile Ala Phe Gly Ile Glu
130 135 140
Pro Val Asn Arg Tyr Glu Ser His Leu Ile Asn Thr Ser Trp Gln Ala
145 150 155 160
Lys Glu Met Ile Asp Lys Ile Gly Ala Asp Asn Ile Phe Ile His Leu
165 170 175
Asp Thr Tyr His Met Asn Ile Glu Glu Lys Gly Ala Gly Asn Gly Ile
180 185 190
Leu Ala Ala Arg Glu His Leu Arg Tyr Ile His Leu Ser Glu Ser Asp
195 200 205
Arg Gly Thr Pro Gly Glu Gly Thr Cys Asp Trp Asp Glu Ile Phe Ala
210 215 220
Thr Leu Ala Ala Val Glu Phe Lys Gly Gly Leu Ala Met Glu Ser Phe
225 230 235 240
Ile Asn Met Pro Pro Gln Val Gly Tyr Gly Leu Gly Ile Trp Arg Pro
245 250 255
Val Ala Asn Ser Phe Glu Glu Val Met Asp Lys Gly Leu Pro Phe Leu
260 265 270
Arg Asn Lys Ala Ala Gln Tyr Arg Leu Ile
275 280
<210> 32
<211> 849
<212> DNA
<213> Unknown
<220>
<223> Rhodobacteraceae bacterium
<400> 32
atgcaaggtt ttggtgtcca taccagtatg tggacaatgc actgggatcg cctgggcgcg 60
gaacgaacca ttccggccgc ggctgcgtac aaaatggact ttattgaaat tgctcttctg 120
gacaccagcg tcgtggatgc gcatcacact cgtgatcttc tggcgaaaca tgaaatgcgt 180
gcggtttgct cgctgggctt gcctcgcgaa tcttgggcca gtgttaaccc ggatggtgcc 240
atagctcacc ttatagatgc aatggactat actaaagaga tgggcggcga ggcactgtct 300
ggcgtcacct atggcggtat cggtgaacgt agcggtgttc cgccgacgga agctgaatat 360
gataatatcg cacgtgccct agaagttgcc gccaaatacg ccaaaacgct gggcattgcc 420
tttggcattg aacccgtgaa ccgctatgaa agccacctga ttaataccag ttggcaggct 480
aaagaaatga ttgataaaat cggtgcagat aacatcttca ttcacttaga tacctaccac 540
atgaacattg aagagaaagg cgccggtaat ggaatcctgg cagctcggga acaccttcgc 600
tacattcatt tgagcgaaag cgaccggggt acacccggcg aaggcacctg tgattgggac 660
gaaatatttg cgacccttgc tgccgttgag ttcaaaggtg gcttggccat ggagagtttc 720
attaatatgc cgccgcaagt gggatatggc ttgggtatct ggcgcccggt cgccaattca 780
ttcgaggaag tgatggataa aggcctgccg ttcctgcgta acaaagcggc ccagtatcgt 840
cttatttaa 849
<210> 33
<211> 282
<212> PRT
<213> Unknown
<220>
<223> Rhodobacter sp. SW2
<400> 33
Met Glu Gly Phe Gly Val His Thr Ser Met Trp Thr Met Gln Trp Asp
1 5 10 15
Arg Ala Gly Ala Glu Arg Thr Ile Pro Ala Ala Ala Ala Tyr Lys Met
20 25 30
Asp Phe Ile Glu Ile Ala Leu Leu Asn Thr Ala Ile Val Asp Ala Pro
35 40 45
His Thr Arg Ala Leu Leu Gln Lys His Gly Leu Arg Ala Val Ala Ser
50 55 60
Leu Gly Leu Pro Gln Gln Asn Trp Ala Ser Val Asn Pro Glu Gly Ala
65 70 75 80
Ile Glu Gln Leu Cys Arg Ser Leu Asp Thr Ala Ala Ala Met Gly Cys
85 90 95
Glu Ala Leu Ser Gly Val Thr Tyr Gly Gly Ile Gly Glu Arg Ser Gly
100 105 110
Leu Pro Pro Thr Met Ala Glu Tyr Asp Asn Val Ala Arg Ala Leu Ala
115 120 125
Ala Ala Ala Lys His Ala Lys Lys Leu Gly Leu Ala Phe Gly Ile Glu
130 135 140
Pro Val Asn Arg Tyr Glu Ser His Leu Ile Asn Thr Gly Trp Gln Ala
145 150 155 160
Lys Trp Met Ile Glu Lys Val Gly Ala Asp Asn Ile Phe Ile His Leu
165 170 175
Asp Thr Tyr His Met Asn Ile Glu Glu Lys Gly Ala Gly Asn Gly Ile
180 185 190
Leu Asp Ala Arg Glu His Leu Arg Tyr Val His Leu Ser Glu Ser Asp
195 200 205
Arg Gly Thr Pro Gly Glu Gly Thr Val Asp Trp Asp Glu Ile Phe Ala
210 215 220
Thr Leu Ala Ala Val Gly Phe Lys Gly Gly Leu Ala Met Glu Ser Phe
225 230 235 240
Ile Asn Met Pro Pro Glu Leu Gly Tyr Gly Leu Ala Val Trp Arg Pro
245 250 255
Val Ala Glu Ser Phe Gln Ala Val Met Asp Lys Gly Leu Pro Phe Leu
260 265 270
Arg Asn Lys Ala Arg Gln Tyr Arg Leu Ile
275 280
<210> 34
<211> 849
<212> DNA
<213> Unknown
<220>
<223> Rhodobacter sp. SW2
<400> 34
atggaaggtt tcggtgtcca tacttccatg tggaccatgc aatgggaccg tgctggtgcc 60
gaacggacga taccagccgc tgcggcatat aagatggatt tcatcgaaat cgcgctgctg 120
aatacggcca ttgtggatgc cccgcatacc cgcgcactgt tacagaaaca tggtctgcgc 180
gccgttgcga gtctgggcct gccacaacag aactgggcga gtgtcaatcc tgagggtgcc 240
attgagcagt tatgccgctc actggacacc gctgccgcga tgggttgcga agccctgtca 300
ggggttacct acggcggcat cggagagcgc agcggtctgc cgccaacaat ggcagaatat 360
gacaacgtgg cccgtgcgtt ggcggcggca gcaaaacacg ctaagaaact gggcctggcg 420
tttggaatcg aacctgtgaa cagatatgag tctcacttga tcaacaccgg atggcaagca 480
aaatggatga ttgaaaaggt gggtgcggat aacatcttta tccacctgga tacttatcac 540
atgaatattg aggaaaaggg tgcaggcaac ggcattctcg atgcgcgcga acacctgcgt 600
tacgtgcatc ttagcgaaag cgaccgtggg acccctggag aaggtactgt tgactgggat 660
gaaatattcg cgacactcgc cgcagttgga tttaaaggcg gattagcaat ggaaagcttt 720
atcaacatgc caccggaact gggatatggc ctggcagtat ggcgcccggt ggcggaatcc 780
tttcaagcag taatggataa aggtttacct tttctgcgga acaaagcgcg tcagtatcgt 840
ctgatctaa 849
<210> 35
<211> 282
<212> PRT
<213> Unknown
<220>
<223> Alphaproteobacteria bacterium HGW-Alphaproteobacteria-8
<400> 35
Met Arg Gly Phe Gly Val His Thr Ser Met Trp Thr Met Lys Trp Asp
1 5 10 15
Arg Ala Gly Ala Glu Arg Ala Val Ala Ala Ala Ala His Tyr Lys Met
20 25 30
Asp Phe Ile Glu Ile Ala Leu Leu Asn Ala Pro Gly Val Asp Ala Pro
35 40 45
His Ser Arg Ala Leu Leu Glu Lys His Gly Leu Arg Ala Val Cys Ser
50 55 60
Leu Gly Leu Pro Glu Ala Ala Trp Pro Ser Arg Asn Pro Glu Ala Ala
65 70 75 80
Val Ala His Leu Lys Val Ala Leu Asp Lys Thr Ala Glu Met Gly Cys
85 90 95
Glu Ala Leu Thr Gly Val Thr Tyr Gly Gly Ile Gly Glu Arg Thr Gly
100 105 110
Leu Pro Pro Ser Ala Thr Glu Leu Asp Asn Val Ala Arg Ala Leu Arg
115 120 125
Glu Ala Ala Ala His Ala Lys Lys Leu Gly Leu Leu Phe Gly Ile Glu
130 135 140
Pro Val Asn Arg Tyr Glu Thr His Leu Ile Asn Thr Gly Arg Gln Ala
145 150 155 160
Val Glu Met Ile Glu Lys Val Gly Ala Glu Asn Met Phe Ile His Leu
165 170 175
Asp Thr Tyr His Met Asn Ile Glu Glu Lys Gly Ala Ala Asn Gly Ile
180 185 190
Leu Asp Ala Arg Glu His Ile Lys Tyr Ile His Leu Ser Glu Ser Asp
195 200 205
Arg Gly Thr Pro Gly Trp Gly Thr Cys Asp Trp Asp Glu Ile Phe Ala
210 215 220
Val Leu Ser Ala Ile Gly Phe Lys Gly Gly Leu Ala Met Glu Ser Phe
225 230 235 240
Ile Asn Met Pro Pro Glu Val Ala Tyr Gly Leu Ser Val Trp Arg Pro
245 250 255
Val Ala Arg Asp Glu Ala Glu Val Met Asp Asn Gly Leu Pro Phe Leu
260 265 270
Arg Gly Lys Ala Arg Gln Tyr Arg Leu Ile
275 280
<210> 36
<211> 849
<212> DNA
<213> Unknown
<220>
<223> Alphaproteobacteria bacterium HGW-Alphaproteobacteria-8
<400> 36
atgcgtggtt ttggcgtcca tacatctatg tggactatga aatgggaccg tgcaggtgcc 60
gagcgtgccg tggcggcggc agcccactat aagatggact tcatcgaaat tgcgctgctg 120
aacgcgccgg gtgtcgatgc accgcatagt cgggcactcc tggagaaaca tggactgcgc 180
gcggtctgtt cattggggct tccggaagcc gcttggccga gccgcaaccc ggaagccgcc 240
gttgctcatc tgaaagtggc gctcgataaa accgctgaaa tgggttgtga agcgctgacc 300
ggagtcacct acggcggcat cggggaacgg accggcctgc caccgtctgc caccgaactg 360
gataacgtgg cacgcgcttt acgcgaagcc gcagcacacg ctaagaagct ggggctcctc 420
ttcggcatcg aaccggttaa ccgctacgaa acccatctga ttaacactgg tcggcaagcc 480
gttgaaatga ttgagaaagt cggcgcagag aatatgttta ttcacctgga cacctatcac 540
atgaacatcg aggaaaaggg cgcagcgaat ggtattctgg atgcacgcga acacattaaa 600
tatatccatc tttcagaatc tgatcgcggt accccgggct ggggtacctg cgattgggat 660
gaaattttcg cagtgctgag cgcaattgga tttaaaggtg gtttggcgat ggaaagtttt 720
attaacatgc cgccggaagt tgcgtatggc ctgtcagtat ggcgaccagt cgcacgggat 780
gaagcggaag ttatggataa cggccttccg tttcttcgtg gtaaagcccg ccagtaccgc 840
ttaatttaa 849
<210> 37
<211> 282
<212> PRT
<213> Unknown
<220>
<223> Rubellimicrobium mesophilum
<400> 37
Met Gln Gly Phe Gly Val His Thr Ser Met Trp Thr Met Asn Trp Asp
1 5 10 15
Arg Ala Gly Ala Glu Arg Thr Ile Pro Ala Ala Ser Ala Tyr Gly Met
20 25 30
Asp Phe Ile Glu Ile Ala Leu Leu Asn Ala Pro Ala Val Asp Ala Pro
35 40 45
His Thr Arg Ala Leu Leu Glu Lys His Gly Met Arg Ala Val Cys Ser
50 55 60
Leu Gly Leu Pro Glu Arg Asn Trp Ala Ser Val Asn Pro Glu Gly Ala
65 70 75 80
Ile Glu His Leu Arg Gln Ala Leu Glu Val Thr Ala Ala Leu Gly Ala
85 90 95
Glu Ala Leu Ser Gly Val Thr Tyr Gly Gly Ile Gly Gln Arg Thr Gly
100 105 110
Val Pro Pro Thr Ala Gly Glu Tyr Asp Asn Ile Ala Arg Ala Leu Glu
115 120 125
Ala Ala Ala Arg Tyr Ala Arg Glu Leu Gly Ile Ala Phe Gly Ile Glu
130 135 140
Pro Val Asn Arg Tyr Glu Asn His Leu Val Asn Thr Ala Ala Gln Ala
145 150 155 160
Lys Trp Met Ile Glu Lys Val Gly Ala Asp Asn Ile Phe Ile His Leu
165 170 175
Asp Thr Tyr His Met Asn Ile Glu Glu Lys Gly Val Gly Asn Gly Ile
180 185 190
Leu Asp Ala Arg Glu His Leu Arg Tyr Ile His Leu Ser Glu Ser Asp
195 200 205
Arg Gly Thr Pro Gly Glu Gly Thr Cys Asp Trp Asp Glu Val Phe Ala
210 215 220
Thr Leu Ala Ala Ile Gly Phe Lys Gly Gly Leu Ala Met Glu Ser Phe
225 230 235 240
Ile Asn Met Pro Pro Glu Ile Gly Tyr Gly Leu Ala Val Trp Arg Pro
245 250 255
Val Ala Glu Ser Phe Glu Glu Val Met Asp Arg Gly Leu Pro Phe Leu
260 265 270
Arg Asn Lys Ala Lys Gln Tyr Arg Leu Val
275 280
<210> 38
<211> 849
<212> DNA
<213> Unknown
<220>
<223> Rubellimicrobium mesophilum
<400> 38
atgcaagggt ttggcgtcca cacttcgatg tggaccatga actgggatcg tgccggcgcc 60
gaacgtacaa tcccggccgc gagcgcatac ggtatggatt ttattgaaat tgcgctgctg 120
aatgccccgg cggtggacgc tccacatacg cgcgcccttc ttgaaaagca cgggatgcgt 180
gcagtttgca gtttgggttt gcctgagcgt aattgggcaa gcgtcaaccc tgaaggcgcg 240
atcgagcacc ttcgacaagc cctcgaagtg accgccgccc ttggggcaga agcgttaagc 300
ggtgtcacat acggcggtat aggtcagcgc acaggggtgc cacccaccgc tggcgagtat 360
gataacatcg cccgtgcact ggaagccgct gcacgctatg cacgagaact gggtatcgcc 420
tttggtatcg aaccggttaa ccggtacgag aaccatctgg tgaacaccgc ggcccaagct 480
aaatggatga tagaaaaggt tggcgcggat aatattttca tccatttgga tacatatcac 540
atgaacattg aggagaaagg tgtcggcaac ggtatcctgg atgcgcgtga gcacctgcgc 600
tatattcatc tgtctgagag cgatcgcggc acaccaggcg agggtacttg cgattgggac 660
gaagtattcg caaccctggc agcaattggt ttcaaaggcg gacttgctat ggaatcgttt 720
atcaacatgc cgccagaaat tggatacggc ttggccgttt ggcgacctgt ggcagagagt 780
tttgaagaag tcatggaccg cggcctgccg ttcctgcgga acaaggcgaa acagtaccgt 840
cttgtgtaa 849
<210> 39
<211> 282
<212> PRT
<213> Unknown
<220>
<223> Rhodobacterales bacterium
<400> 39
Met Glu Gly Phe Gly Val His Thr Ser Met Trp Thr Met His Trp Asp
1 5 10 15
Arg Ala Gly Ala Glu Arg Thr Ile Pro Ala Ala Ala Ala Tyr Lys Met
20 25 30
Asp Phe Ile Glu Ile Ala Leu Leu Asn Ala Ala Met Ile Asp Pro Pro
35 40 45
His Thr Arg Ala Leu Leu Glu Lys His Asn Met Arg Ala Val Ala Ser
50 55 60
Leu Gly Leu Pro Gln Arg Asn Trp Ala Ser Val Asn Pro Asp Gly Ala
65 70 75 80
Ala Ala His Leu Ile Glu Ala Met Asp Val Ala Ala Ala Met Gly Ala
85 90 95
Glu Ala Leu Ser Gly Val Thr Tyr Gly Gly Ile Gly Glu Arg Thr Gly
100 105 110
Leu Pro Pro Thr Met Ala Glu Tyr Asp Asn Ile Ala Arg Ala Leu Gly
115 120 125
Gln Ala Ala Lys His Ala Lys Lys Leu Gly Ile Ala Phe Gly Ile Glu
130 135 140
Pro Val Asn Arg Tyr Glu Asn His Leu Ile Asn Thr Gly Trp Gln Ala
145 150 155 160
Lys Trp Met Ile Glu Lys Val Gly Ala Asp Asn Ile Phe Ile His Leu
165 170 175
Asp Thr Tyr His Met Asn Ile Glu Glu Lys Gly Ala Gly Asn Gly Ile
180 185 190
Leu Asp Ala Arg Glu His Leu Arg Tyr Ile His Leu Ser Glu Ser Asp
195 200 205
Arg Gly Thr Pro Gly Glu Gly Thr Cys Asp Trp Asp Glu Val Tyr Ala
210 215 220
Thr Leu Ala Ala Ile Gly Phe Lys Gly Gly Leu Ala Met Glu Ser Phe
225 230 235 240
Ile Asn Met Pro Pro Glu Val Gly Tyr Gly Leu Ala Val Trp Arg Pro
245 250 255
Val Ala Asn Ser Phe Glu Glu Val Met Asp Lys Gly Leu Pro Phe Leu
260 265 270
Arg Asn Lys Ala Arg Gln Tyr Arg Leu Ile
275 280
<210> 40
<211> 849
<212> DNA
<213> Unknown
<220>
<223> Rhodobacterales bacterium
<400> 40
atggaaggct tcggtgtgca cacgagtatg tggacgatgc actgggatcg tgctggtgct 60
gaacgtacga ttccggccgc cgccgcgtac aagatggact tcattgaaat tgcgctgctg 120
aacgcagcga tgatcgatcc gccacatact cgcgcgcttc tggagaaaca taacatgcgg 180
gctgttgcga gtctcggact tccacaacgc aattgggcct cggttaatcc agatggtgcc 240
gcggcccatc ttatcgaggc gatggacgtg gcggcagcaa tgggtgccga agcgctttcc 300
ggagtgacat acggcggaat cggtgaacgc actggcctgc cgccaactat ggcagagtac 360
gataacattg cacgagcact cgggcaggcc gccaaacatg ccaagaagct tgggatcgct 420
ttcggcatag agccggtgaa tcgctatgag aatcatctga tcaacactgg ctggcaggcc 480
aaatggatga ttgagaaagt gggtgctgat aacatcttta tccatctgga tacatatcac 540
atgaatatcg aggaaaaggg cgctggtaat ggtattttag atgcacgtga acacctgcgt 600
tatattcatt tgtctgagtc cgatcgcggc acgccgggtg aaggcacgtg tgactgggat 660
gaagtttacg cgacactggc agccattggc tttaaaggtg gactcgcgat ggaatcattc 720
atcaacatgc cgccggaagt gggttatggt ctggcagttt ggcgcccggt ggcgaacagc 780
tttgaagaag ttatggacaa aggtctgccg tttctccgca ataaagcgcg gcagtaccgc 840
ctgatctaa 849
<210> 41
<211> 282
<212> PRT
<213> Unknown
<220>
<223> Rhodobacterales bacterium RIFCSPHIGHO2_02_FULL_62_130
<400> 41
Met Glu Gly Phe Gly Val His Thr Ser Met Trp Thr Met Lys Trp Asp
1 5 10 15
Arg Glu Gly Thr Glu Arg Ala Val Gln Ala Ala Val Asp Tyr Lys Met
20 25 30
Asp Phe Leu Glu Ile Ala Leu Leu Asp Ala Pro Ser Val Asp Ala Ala
35 40 45
His Thr Arg Lys Leu Leu Glu Asp Asn Asp Met Arg Ala Val Cys Ser
50 55 60
Leu Gly Leu Pro Glu Ala Val Trp Pro Ser Arg Asp Pro Glu Ser Ala
65 70 75 80
Ile Ala Phe Met Lys Gly Val Phe Asp Lys Ala Asn Glu Met Gly Ala
85 90 95
Glu Ala Val Ser Gly Val Thr Tyr Gly Gly Ile Gly Glu Arg Thr Asp
100 105 110
Met Pro Pro Thr Glu Ala Glu Leu Ser Asn Val Ala Arg Ala Leu Glu
115 120 125
Ala Cys Ala Ser Tyr Ala Lys Ser Leu Gly Leu Arg Phe Gly Ile Glu
130 135 140
Pro Val Asn Arg Tyr Glu Thr His Leu Leu Asn Thr Gly Trp Gln Ala
145 150 155 160
Arg Asp Met Ile Glu Arg Ile Gly Ser Asp Asn Ile Phe Ile His Leu
165 170 175
Asp Thr Tyr His Met Asn Ile Glu Glu Lys Gly Ala Ala Ser Gly Ile
180 185 190
Leu Asp Ala Arg Glu His Leu Lys Tyr Ile His Leu Ser Glu Ser Asp
195 200 205
Arg Gly Thr Pro Gly Glu Gly Cys Cys Asp Trp Asp Glu Ile Phe Ala
210 215 220
Thr Leu Ala Ala Ile Asn Phe Thr Gly Gly Leu Ala Met Glu Ser Phe
225 230 235 240
Ile Asn Met Pro Pro Glu Leu Ala His Gly Leu Ser Val Trp Arg Pro
245 250 255
Val Ala Pro Asp Phe Gln Ala Val Met Asp Lys Gly Leu Pro Phe Leu
260 265 270
Arg Asn Lys Ala Ala Gln Tyr Arg Leu Val
275 280
<210> 42
<211> 849
<212> DNA
<213> Unknown
<220>
<223> Rhodobacterales bacterium RIFCSPHIGHO2_02_FULL_62_130
<400> 42
atggaaggtt ttggggtaca caccagcatg tggacgatga aatgggatcg tgagggcacc 60
gagcgggctg tacaggcggc agttgattac aaaatggatt ttctggaaat tgctctgctt 120
gacgctccga gcgtggacgc ggcacacacg cgcaaactcc tggaagataa cgatatgcgt 180
gcggtgtgca gtttagggtt accagaagcg gtgtggccga gtcgcgaccc agagagcgca 240
attgctttta tgaaaggagt attcgataag gccaacgaaa tgggcgccga ggcagtgagt 300
ggggtcacgt atggcggcat aggcgaacgc acagacatgc caccgacaga agcggagctg 360
agcaacgtag cccgcgcact ggaagcgtgc gcgagttatg caaaatcatt aggtctgcga 420
tttggcattg agcctgtgaa tcgttatgaa acccatctgc tgaataccgg ttggcaagca 480
cgcgatatga tcgaacgtat cggttcagat aacattttca ttcatttgga tacgtaccac 540
atgaatatcg aagagaaagg cgcggcctct ggtattttag atgcccgtga acacttgaaa 600
tacatccatt tatctgaaag tgacagaggc acgccaggcg aaggttgttg cgactgggat 660
gaaattttcg ccaccctcgc cgccattaat tttaccggcg gtcttgccat ggaaagtttc 720
attaacatgc cgccagagct ggcgcatggt ctgagcgtgt ggcgccccgt ggccccggac 780
ttccaagcgg tgatggataa aggcctgccg ttcctgcgaa acaaagccgc gcagtaccgc 840
ctggtctaa 849
<210> 43
<211> 288
<212> PRT
<213> Unknown
<220>
<223> Thermoclostridium caenicola
<400> 43
Lys Tyr Gly Ile Phe Tyr Ala Tyr Trp Glu Lys Glu Trp Lys Gly Asp
1 5 10 15
Phe Ile Thr Tyr Ile Glu Lys Val Lys Lys Leu Gly Phe Asp Ile Leu
20 25 30
Glu Val Gly Cys Gly Asp Phe His Lys Gln Pro Asp Ser Tyr Phe His
35 40 45
Thr Leu Arg Asp Ala Ala Arg Glu Tyr Asp Ile Ile Leu Thr Gly Gly
50 55 60
Tyr Gly Pro Arg Ala Glu His Asn Leu Cys Ser Pro Asp Thr Ala Val
65 70 75 80
Val Glu Asn Ala Leu Ala Phe Tyr Ser Asp Ile Phe Arg Lys Met Glu
85 90 95
Ile Ala Gly Ile Arg Ser Ile Gly Gly Gly Leu Tyr Ala Tyr Trp Pro
100 105 110
Val Asp Tyr Ser Arg Glu Pro Asp Lys Ala Gly Asp Leu Glu Arg Ser
115 120 125
Ile Lys Asn Met Arg Arg Leu Ala Asp Ile Ala Glu Arg His Gly Ile
130 135 140
Thr Leu Asn Met Glu Val Leu Asn Arg Phe Glu Gly Tyr Leu Ile Asn
145 150 155 160
Asp Thr Asn Glu Gly Leu Ala Tyr Ile Arg Ala Val Asp Lys Pro Asn
165 170 175
Val Lys Leu Met Leu Asp Thr Phe His Met Asn Ile Glu Glu Asp Ser
180 185 190
Phe Thr Glu Pro Ile Leu Gln Ala Gly Lys Tyr Leu Gly His Val His
195 200 205
Val Gly Glu Pro Asn Arg Lys Pro Pro Arg Glu Gly Arg Ile Pro Trp
210 215 220
Gly Glu Ile Gly Lys Ala Leu Arg Gln Ile Gly Tyr Asp Gly Pro Val
225 230 235 240
Val Met Glu Pro Phe Val Thr Met Gly Gly Gln Val Gly Lys Asp Ile
245 250 255
Cys Val Trp Arg Asp Leu Ser Gln Gly Ala Thr Glu Glu Asp Leu Asp
260 265 270
Arg Asp Ala Glu Lys Ser Leu Ala Phe Leu Lys Gly Met Phe Glu Ala
275 280 285
<210> 44
<211> 864
<212> DNA
<213> Unknown
<220>
<223> Thermoclostridium caenicola
<400> 44
aagtacggta tcttctatgc ttattgggaa aaggaatgga agggtgactt cattacttac 60
attgaaaagg ttaagaagct gggattcgat attcttgaag ttggttgtgg tgacttccat 120
aaacaacctg attcttactt ccatactctt agagatgctg ctagagaata tgatattatt 180
cttactggtg gttacggtcc tagagctgaa cataacttgt gttctccaga tactgctgtt 240
gttgaaaacg ctcttgcctt ctattctgat atcttcagaa aaatggagat cgctggtatt 300
agatccattg gtggtggtct gtatgcttac tggcctgttg attattctag agaacctgat 360
aaggctggtg atcttgaaag atccattaag aacatgagaa gattggctga tattgctgaa 420
agacatggta ttactcttaa tatggaagtt cttaacagat tcgaaggtta tcttattaac 480
gatactaacg aaggtcttgc ttatattaga gctgttgata aaccaaacgt taaattgatg 540
ttggatacct tccacatgaa cattgaagaa gattccttca ctgaacctat tcttcaagct 600
ggtaagtatc ttggtcatgt tcatgttggt gaacctaata gaaagccacc tagagaaggt 660
agaatccctt ggggtgaaat tggtaaagct cttagacaaa ttggttacga tggtcctgtt 720
gttatggaac cattcgttac tatgggtggt caagttggta aggatatctg tgtctggaga 780
gacttatctc aaggtgctac tgaagaggat cttgatagag atgctgaaaa gtctcttgcc 840
ttcttgaaag gtatgttcga agct 864
Claims (20)
- 알룰로스를 생산하는 방법으로서,
프럭토스 기질을,
(a) D-알룰로스 3-에피머라제 효소를 포함하는 효소계;
(b) D-알룰로스 3-에피머라제 효소를 인코딩하는 핵산 분자를 포함하는 재조합 벡터로 형질전환된 숙주 세포; 및/또는
(c) (b)의 상기 숙주 세포의 용해물을 포함하는 반응 혼합물과, 상기 프럭토스 기질이 알룰로스로 전환되는 조건 하에 접촉시키는 단계를 포함하되,
상기 D-알룰로스 3-에피머라제 효소는 서열번호 1, 서열번호 3, 서열번호 5, 서열번호 7, 서열번호 9, 서열번호 11, 서열번호 13, 서열번호 15, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23, 서열번호 25, 서열번호 27, 서열번호 29, 서열번호 31, 서열번호 33, 서열번호 35, 서열번호 37, 서열번호 39, 서열번호 41 및 서열번호 43으로 이루어진 군으로부터 선택된 폴리펩타이드와 적어도 80% 서열 동일성을 갖는 아미노산 서열을 포함하는, 알룰로스를 생산하는 방법. - 제1항에 있어서, 상기 반응 혼합물은 서열번호 1, 서열번호 5, 서열번호 7, 서열번호 9, 서열번호 13, 서열번호 15, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23 및 서열번호 25로 이루어진 군으로부터 선택된 폴리펩타이드와 적어도 80% 서열 동일성을 갖는 아미노산 서열을 포함하는 D-알룰로스 3-에피머라제 효소를 포함하는, 알룰로스를 생산하는 방법.
- 제2항에 있어서, 상기 D-알룰로스 3-에피머라제 효소는 서열번호 1, 서열번호 5, 서열번호 7, 서열번호 9, 서열번호 13, 서열번호 15, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23 및 서열번호 25로 이루어진 군으로부터 선택된 폴리펩타이드와 적어도 90% 서열 동일성을 갖는 아미노산 서열을 포함하는, 알룰로스를 생산하는 방법.
- 제2항에 있어서, 상기 D-알룰로스 3-에피머라제 효소는 서열번호 1, 서열번호 5, 서열번호 7, 서열번호 9, 서열번호 13, 서열번호 15, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23 및 서열번호 25로 이루어진 군으로부터 선택된 폴리펩타이드와 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는, 알룰로스를 생산하는 방법.
- 제2항에 있어서, 기 D-알룰로스 3-에피머라제 효소는 서열번호 1, 서열번호 5, 서열번호 7, 서열번호 9, 서열번호 13, 서열번호 15, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23 또는 서열번호 25의 아미노산 서열을 포함하는, 알룰로스를 생산하는 방법.
- 제1항에 있어서, 상기 반응 혼합물은 서열번호 3, 서열번호 11, 서열번호 27, 서열번호 29, 서열번호 31, 서열번호 33, 서열번호 35, 서열번호 37, 서열번호 39, 서열번호 41 및 서열번호 43으로 이루어진 군으로부터 선택된 폴리펩타이드와 적어도 90% 서열 동일성을 갖는 아미노산 서열을 포함하는 D-알룰로스 3-에피머라제 효소를 포함하는, 알룰로스를 생산하는 방법.
- 제6항에 있어서, 상기 D-알룰로스 3-에피머라제 효소는 서열번호 3, 서열번호 11, 서열번호 27, 서열번호 29, 서열번호 31, 서열번호 33, 서열번호 35, 서열번호 37, 서열번호 39, 서열번호 41 및 서열번호 43으로 이루어진 군으로부터 선택된 폴리펩타이드와 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함하는, 알룰로스를 생산하는 방법.
- 제6항에 있어서, 상기 D-알룰로스 3-에피머라제 효소는 서열번호 3, 서열번호 11, 서열번호 27, 서열번호 29, 서열번호 31, 서열번호 33, 서열번호 35, 서열번호 37, 서열번호 39, 서열번호 41 및 서열번호 43의 아미노산 서열을 포함하는, 알룰로스를 생산하는 방법.
- 제1항에 있어서, 상기 조건은 상기 효소계와 상기 프럭토스 기질을 25℃ 내지 75℃의 온도에서 유지시키는 것을 포함하는, 알룰로스를 생산하는 방법.
- 제1항에 있어서, 상기 조건은 상기 효소계와 상기 프럭토스 기질을 4 내지 10의 pH에서 유지시키는 것을 포함하는, 알룰로스를 생산하는 방법.
- 제1항에 있어서, 상기 D-알룰로스 3-에피머라제 효소는 단리된 형태인, 알룰로스를 생산하는 방법.
- 제1항에 있어서, 상기 D-알룰로스 3-에피머라제 효소는 고체 기질 상에 고정화된, 알룰로스를 생산하는 방법.
- 제1항에 있어서, 상기 반응 혼합물은 상기 D-알룰로스 3-에피머라제 효소를 인코딩하는 핵산 분자를 포함하는 재조합 벡터로 형질전환된 숙주 세포 또는 상기 숙주 세포의 용해물을 포함하되, 상기 D-알룰로스 3-에피머라제 효소를 인코딩하는 상기 핵산 분자는 서열번호 2, 서열번호 4, 서열번호 6, 서열번호 8, 서열번호 10, 서열번호 12, 서열번호 14, 서열번호 16, 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26, 서열번호 28, 서열번호 30, 서열번호 32, 서열번호 34, 서열번호 36, 서열번호 38, 서열번호 40, 서열번호 42 및 서열번호 44로 이루어진 군으로부터 선택된 폴리뉴클레오타이드 서열과 적어도 80% 서열 동일성을 갖는 폴리뉴클레오타이드 서열을 포함하는, 알룰로스를 생산하는 방법.
- 제13항에 있어서, 상기 숙주 세포는 효모 세포, 섬유상 진균 세포, 박테리아 세포, 포유류 세포, 식물 세포 및 라비린툴로마이세테스(Labyrinthulomycetes) 세포로 이루어진 군으로부터 선택되는, 알룰로스를 생산하는 방법.
- 제14항에 있어서, 상기 숙주 세포는 이. 콜라이(E. coli) 또는 피. 파스토리스(P. pastoris)인, 알룰로스를 생산하는 방법.
- 제13항에 있어서, 상기 재조합 벡터는 상기 숙주 세포 내에서 자기 복제 핵산 분자로서 존재하는, 알룰로스를 생산하는 방법.
- 제13항에 있어서, 상기 재조합 벡터는 상기 숙주 세포 염색체에 통합되는, 알룰로스를 생산하는 방법.
- 제1항에 있어서, 상기 반응계에 적어도 하나의 유형의 금속 이온을 첨가하는 단계를 더 포함하되, 상기 적어도 하나의 유형의 금속 이온은 마그네슘 이온, 망간 이온, 구리 이온, 아연 이온, 니켈 이온, 코발트 이온, 철 이온, 알루미늄 이온 및 칼슘 이온으로 이루어진 군으로부터 선택된, 알룰로스를 생산하는 방법.
- 제18항에 있어서, 상기 금속 이온은 약 0.01mM 내지 약 5mM의 농도로 첨가되는, 알룰로스를 생산하는 방법.
- 제1항에 있어서, 상기 프럭토스 기질이 알룰로스로 전환됨에 따라서 상기 반응계로부터 알룰로스를 포함하는 산물 스트림을 제거하는 단계를 포함하는, 알룰로스를 생산하는 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063022617P | 2020-05-11 | 2020-05-11 | |
US63/022,617 | 2020-05-11 | ||
PCT/US2021/031859 WO2021231488A2 (en) | 2020-05-11 | 2021-05-11 | D-allulose 3-epimerases for bioconversion of d-fructose to d-allulose |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230009372A true KR20230009372A (ko) | 2023-01-17 |
Family
ID=78524895
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227035754A KR20230009372A (ko) | 2020-05-11 | 2021-05-11 | D-프럭토스를 d-알룰로스로 생물전환시키기 위한 d-알룰로스 3-에피머라제 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20230313254A1 (ko) |
EP (1) | EP4114935A4 (ko) |
JP (1) | JP2023525666A (ko) |
KR (1) | KR20230009372A (ko) |
CN (1) | CN115380109A (ko) |
WO (1) | WO2021231488A2 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115074350B (zh) * | 2022-08-12 | 2022-12-13 | 保龄宝生物股份有限公司 | 一种降低d-阿洛酮糖-3-差向异构酶酶液酶活力损失的方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20110035805A (ko) * | 2009-09-30 | 2011-04-06 | 씨제이제일제당 (주) | 사이코스-에피머화 효소의 고정화 및 이를 이용한 사이코스의 제조방법 |
EP2843044A1 (en) * | 2013-09-03 | 2015-03-04 | Roquette Frères | Improved variant of D-psicose 3-epimerase and uses thereof |
CN109306347B (zh) * | 2017-12-28 | 2019-08-30 | 吉林中粮生化有限公司 | 一种新型d-阿洛酮糖3-差向异构酶及其应用 |
-
2021
- 2021-05-11 JP JP2022564671A patent/JP2023525666A/ja active Pending
- 2021-05-11 WO PCT/US2021/031859 patent/WO2021231488A2/en unknown
- 2021-05-11 EP EP21804358.6A patent/EP4114935A4/en active Pending
- 2021-05-11 KR KR1020227035754A patent/KR20230009372A/ko unknown
- 2021-05-11 CN CN202180026890.1A patent/CN115380109A/zh active Pending
-
2022
- 2022-11-10 US US18/054,195 patent/US20230313254A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
EP4114935A2 (en) | 2023-01-11 |
US20230313254A1 (en) | 2023-10-05 |
CN115380109A (zh) | 2022-11-22 |
JP2023525666A (ja) | 2023-06-19 |
WO2021231488A2 (en) | 2021-11-18 |
EP4114935A4 (en) | 2023-12-27 |
WO2021231488A3 (en) | 2021-12-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3259349B1 (en) | Dehydrogenase-catalysed production of fdca | |
KR102132381B1 (ko) | 아스로박터 글로비포미스에 의해 생산되는 케토오스 3-에피머라제 | |
CN110878261B (zh) | 合成木糖醇的重组解脂耶氏酵母的构建方法及其菌株 | |
WO2019107516A1 (ja) | 3-ヒドロキシアジピン酸、α-ヒドロムコン酸および/またはアジピン酸を生産するための遺伝子改変微生物および当該化学品の製造方法 | |
JP2010207094A (ja) | プロトカテク酸の製造法 | |
CN112063666A (zh) | 一种重组蔗糖异构酶在转化蔗糖制备异麦芽酮糖中的应用 | |
US20230313254A1 (en) | D-allulose 3-epimerases for bioconversion of d-fructose to d-allulose | |
KR20210146922A (ko) | Udp-람노스의 생합성 생산 | |
KR101521045B1 (ko) | 유기산을 생산하기 위한 재조합 미생물유기체 | |
JP7404537B2 (ja) | アルロースエピマー化酵素変異体、その製造方法及びそれを利用したアルロースの製造方法 | |
WO2021187533A1 (ja) | 3-ヒドロキシアジピン酸および/またはα-ヒドロムコン酸を生産するための遺伝子改変微生物および当該化学品の製造方法 | |
KR20220062331A (ko) | 알파-이오논 및 베타-이오논의 생합성 | |
WO2006134374A2 (en) | A method for production of l-ascorbic acid | |
CN115786319A (zh) | 一种热稳定性提高的d-阿洛酮糖3-差向异构酶及突变体 | |
WO2022075435A1 (ja) | 新規ケトース-3-エピメラーゼを用いたケトースの製造方法 | |
CN112410353B (zh) | 一种fkbS基因、含其的基因工程菌及其制备方法和用途 | |
WO2021125514A1 (ko) | 알룰로스 에피머화 효소 변이체, 이의 제조방법 및 이를 이용한 알룰로스의 제조방법 | |
KR20190097250A (ko) | 신규한 효소를 사용한 메틸글리옥살의 히드록시아세톤으로의 전환 및 그의 적용 | |
KR20190052927A (ko) | 포도당으로부터 1,3-프로판디올를 생산하는 신규한 크렙시엘라 뉴모니아 균주 및 이를 이용한 1,3 프로판디올의 생산방법 | |
JP6989746B2 (ja) | 変異型2-デオキシ-シロ-イノソース合成酵素 | |
CN113061593A (zh) | 一种l-苹果酸脱氢酶突变体及其应用 | |
JP2023509176A (ja) | D-キシルロース4-エピメラーゼ、その変異体及びそれらの使用 | |
WO2005123921A1 (ja) | 新規グリセロール脱水素酵素、その遺伝子、及びその利用法 | |
DK2992106T3 (en) | ENZYMATIC PROCEDURE FOR PREPARING (R) -3-QUINUCLIDINOL | |
KR102682846B1 (ko) | 열 안정성이 우수한 알룰로스 에피머화 효소 변이체, 이의 제조방법 및 이를 이용한 알룰로스의 제조방법 |