KR20220116243A - 락토오스 전환 알파-1,2-푸코실트랜스퍼라제 효소 - Google Patents

락토오스 전환 알파-1,2-푸코실트랜스퍼라제 효소 Download PDF

Info

Publication number
KR20220116243A
KR20220116243A KR1020227024260A KR20227024260A KR20220116243A KR 20220116243 A KR20220116243 A KR 20220116243A KR 1020227024260 A KR1020227024260 A KR 1020227024260A KR 20227024260 A KR20227024260 A KR 20227024260A KR 20220116243 A KR20220116243 A KR 20220116243A
Authority
KR
South Korea
Prior art keywords
leu
ile
lys
ser
ala
Prior art date
Application number
KR1020227024260A
Other languages
English (en)
Inventor
조에리 보우프레즈
나우시카아 란누
크리스토프 판데발레
아넬리에스 베르카테렌
Original Assignee
인바이오스 엔.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 인바이오스 엔.브이. filed Critical 인바이오스 엔.브이.
Publication of KR20220116243A publication Critical patent/KR20220116243A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • C12N1/205Bacterial isolates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/18Preparation of compounds containing saccharide radicals produced by the action of a glycosyl transferase, e.g. alpha-, beta- or gamma-cyclodextrins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2330/00Production
    • C12N2330/50Biochemical production, i.e. in a transformed host cell
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/01Bacteria or Actinomycetales ; using bacteria or Actinomycetales
    • C12R2001/185Escherichia
    • C12R2001/19Escherichia coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/01Hexosyltransferases (2.4.1)
    • C12Y204/01069Galactoside 2-alpha-L-fucosyltransferase (2.4.1.69)
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Mycology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Virology (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

본 발명은 2'푸코실락토오스(2'-FL)의 생산 방법, 뿐만 아니라 새롭게 확인된 푸코실트랜스퍼라제, 보다 구체적으로 새롭게 확인된 락토오스 결합 α-1,2-푸코실트랜스퍼라제 폴리펩티드, 및 이들의 적용에 관한 것이다. 또한, 본 발명은 새롭게 확인된 α-1,2-푸코실트랜스퍼라제를 이용하여 2-푸코실락토오스(2'FL)를 생산하는 방법을 제공한다.

Description

락토오스 전환 알파-1,2-푸코실트랜스퍼라제 효소
본 발명은 2'푸코실락토오스(2'-FL)의 생산 방법, 뿐만 아니라 새롭게 확인된 푸코실트랜스퍼라제, 보다 구체적으로 새롭게 확인된 락토오스 결합 알파-1,2-푸코실트랜스퍼라제 폴리펩티드, 및 이들의 적용에 관한 것이다. 또한 본 발명은 새롭게 확인된 알파-1,2-푸코실트랜스퍼라제를 이용하여 2-푸코실락토오스(2'FL)를 생산하는 방법을 제공한다.
인간 모유 올리고당(Human Milk Oligosaccharides)은 락토오스와 지질 다음으로 인간 모유에서 세 번째로 많은 고형 성분이다. 지금까지 200개 이상의 유리 올리고당 구조가 인간 모유 샘플에서 확인되었다. 오늘날 80개 이상의 HMO 관련 화합물이 구조적으로 특성화되었다. 이들 HMO는 프리바이오틱스로 작용하는 복합 올리고당의 한 종류를 나타낸다. 또한, 상피 에피토프에 대한 HMO의 구조적 상동성은 박테리아 병원체에 대한 보호 특성을 설명한다. 유아 위장관 내에서 HMO는 선택된 박테리아 균주의 성장에 선택적으로 영양을 공급하므로 모유를 먹는 유아에서 고유한 장내 미생물의 발달을 촉진한다.
모유에는 세 가지 주요 HMO 카테고리: 푸코실화 중성 HMO, 푸코실화되지 않은 중성 HMO 및 시알릴화 산성 HMO가 존재한다. 2'푸코실락토오스(2'FL)는 HMO의 푸코실화된 군의 일부이다. "분비자"인 여성에서 2'FL은 단연코 가장 풍부한 HMO이며 모든 HMO의 거의 30%를 구성한다.
푸코실화 올리고당의 생산은 푸코실트랜스퍼라제의 작용을 필요로 한다. 글리코실트랜스퍼라제의 효소 패밀리에 속하는 이러한 푸코실트랜스퍼라제는 척추동물, 무척추동물, 식물, 균류, 효모 및 박테리아에서 널리 발현된다. 이들은 공여체, 일반적으로 구아노신-이인산 푸코오스(GDP-푸코오스)로부터 이당류, 올리고당, (당)단백질 및 (당)지질을 포함하는 수용체로의 푸코오스 잔기의 전달을 촉매한다. 그리하여 푸코실화된 수용체 기질은 다양한 생물학적 및 병리학적 과정에 관여한다.
여러 푸코실트랜스퍼라제가 식물뿐만 아니라 예를 들어, 박테리아 Helicobacter pylori, Escherichia coli, Salmonella enterica, Yersinia, Enterococcus, Shigella, Klebsiella, Bacteroides, 포유류, Drosophila, Caenorhabditis elegans 및 Schistosoma mansoni에서 확인되었다. 푸코실트랜스퍼라제는 푸코오스 부가 부위에 따라 예를 들어 알파-1,2, 알파-1,3, 알파-1,4 및 O-푸코실트랜스퍼라제로 분류된다.
여러 알파-1,2-푸코실트랜스퍼라제(2'-FTs)가 이미 설명되어 있다. 첫 번째 보고서는 GDP-푸코오스 합성을 위해 변형된 E. coli 균주에서 락토오스를 2'FL로 전환시키기 위해 H.pylori로부터의 HpFucT2(Lee et al., 2012, Microb Cell Fact 11:48; Chin et al., 2016, Biotechnol Bioeng.113:11, 2443-52) 또는 HpFutC(Baumgartner et al., 2013, Microb Cell Fact12:40; Chin et al., 2015, J. Biotechnol 210, 107-115; Wang et al., 1999, Microbiology 145, 3245-3253)의 사용을 설명한다. Bacteroides fragilis에서 유래한 WcfB를 사용한 테스트는 HpFucT2와 비교할 때 조작된 E.coli 숙주에서 개선된 2'FL 생산을 보여주었다(Chin et al., 2017, J Biotechnol 257, 192-198). 기타 2'FL, 예컨대 E. coli O128로부터의 WbsJ, E. coli O126으로부터의 WbgL, E. coli O86로부터의 WbnK 및 WbwK, E. coli O127로부터의 WbiQ, H. Mustelae로부터의 FutL, C.jejuni로부터의 FutG, B. vulgatus ATCC 8482로부터의 FutN, B.fragilis로부터의 WcfW, 및 Thermosynechococcus elongatus(Te2FT)로부터의 Te2FT도 조작된 E.coli 숙주에서 2'FL을 생성하는 것으로 보고되었다(Chin et al., 2017, J Biotechnol 257, 192-198; Huang et al., 2017, Metab Eng 41 , 23-38; Seydametova et al., 2019, Microbiol Res 222, 35-42; US20170081353; US20140024820). 일부 2FT는 또한 GDP-푸코오스를 락토오스로 전달하여 예컨대 Corynebacterium glutamicum(WO2017188684) 또는 Saccharomyces cerevisiae(Liu et al., 2018, ACS Synth Biol 7:11; Yu et al., 2018, Microb Cell Fact 17, 101)와 같이 다른 조작된 세포 내에서 푸코실락토오스 합성을 초래하는 것으로 보고되었다.
그러나 2'푸코실락토오스를 생성하는데 필요한 2-푸코실트랜스퍼라제 또는 2-푸코실트랜스퍼라제 효소로도 알려진 알파-1,2-푸코실트랜스퍼라제는 일반적으로 락토오스에 대한 친화도가 낮은 것으로 알려져 있다. 낮은 친화도는 2'푸코실락토오스의 생산성에 부정적인 영향을 미친다. 전환율과 생산성을 향상시키기 위해서는 락토오스 친화도가 높은 트랜스퍼라제가 필요하다. 나아가 H.pylori로부터의 HpFutC와 같은 일부 알파-1,2-푸코실트랜스퍼라제는 1:5의 높은 디푸코실락토오스 농도 대 2'푸코실락토오스 농도 비율로 2'FL 합성 동안 원하지 않는 부산물로서 디푸코실락토오스(diFL)를 생성하는 것으로 알려져 있다.
따라서, 본 발명의 목적은 2'푸코실락토오스를 효과적이고 시간 및 비용 효율적인 방식으로 생산 또는 합성할 수 있는 도구 및 방법을 제공하는 것이다. 바람직하게는, 본 발명은 원하는 생성물을 다량으로, 더욱 바람직하게는 바람직하지 않은 부산물 diFL 없이, 또는 diFL이 생성된다면 1:5보다 낮은 디푸코실락토오스 농도 대 2'푸코실락토오스 농도 비율로 생성하는 방법 및 도구를 제공하는 것이다.
놀랍게도, 본 발명의 새롭게 확인된 락토오스 결합 알파-1,2-푸코실트랜스퍼라제 효소는 현재 알려진 락토오스 결합 알파-1,2-푸코실트랜스퍼라제 효소와 유사하거나 더 높은 락토오스 결합 및/또는 트랜스퍼라제 특성을 갖는 트랜스퍼라제를 제공한다는 것이 이제 밝혀졌다. 또한, 새로 확인된 이러한 트랜스퍼라제는 2'푸코실락토오스를 합성할 때 디-푸코실락토오스(diFL)의 원치 않는 부산물 형성을 초래하는, 현재 알려진 알파-1,2-푸코실트랜스퍼라제 효소에 비해 효소적 부작용 활성을 갖지 않거나 덜 갖는다. diFL이 새로 확인된 트랜스퍼라제에 의해 형성될 때 diFL 농도 대 2'FL 농도의 비율은 1:5보다 작고, 보다 구체적으로 diFL 농도 대 2'FL 농도 비율은 1:10보다 낮다.
따라서, 본 발명은 새롭게 확인된 락토오스 결합 알파-1,2-푸코실트랜스퍼라제를 사용하여 2'푸코실락토오스(2'FL)를 생산하는 방법을 제공한다. 2'FL은 알파-1,2-푸코실트랜스퍼라제의 존재하에 락토오스를 반응시켜 얻을 수 있으며, 이는 락토오스와 GDP-푸코오스로부터 2'푸코실락토오스 올리고당의 형성을 촉매할 수 있다. 대안적으로는, 본 발명에 따른 알파-1,2-푸코실트랜스퍼라제를 생산하는 미생물로부터 그것을 얻을 수도 있다.
도 1은 실시예 2에 기재된 바와 같이 20g/L 락토오스가 보충된 최소 배지에서 72시간 배양 후 프로모터-UTR 조합 P12U2(De Mey et al., BMC Biotechnology, 2007)로 구축된 전사 단위로부터 상이한 알파-1,2-푸코실트랜스퍼라제(서열번호 1, 2, 3, 4 또는 5)를 발현하는 돌연변이 균주의 상대 백분율로 g 생성물/g바이오매스에서의 2'FL(상단 패널) 및 diFL (하단 패널)의 정규화된 생산을 보여준다. 각 균주에서 2'FL 및 diFL 생산은 서열번호 71(파선 수평선으로 표시됨)을 갖는 선행 기술의 HpFutC 유전자를 발현하는 참조 균주에서 얻은 2'FL 및 diFL 생산 수준에 대해 각각 정규화된다.
도 2는 실시예 2에 기재된 바와 같이 20g/L 락토오스가 보충된 최소 배지에서 72시간 배양 후 프로모터-UTR 조합 P12U2(De Mey et al., BMC Biotechnology, 2007)로 구축된 전사 단위로부터 상이한 알파-1,2-푸코실트랜스퍼라제(서열번호 1 또는 4)를 발현하는 돌연변이 균주의 상대 백분율(%)로 정규화된 2'FL 생산(2FL) 및 성장속도(mu)를 보여준다. 각 균주의 2'FL 생산 수준 및 성장 속도는 서열번호 71(파선 수평선으로 표시됨)을 갖는 선행 기술의 HpFutC 유전자를 발현하는 참조 균주에서 얻은 2'FL 생산 수준 및 성장 속도에 대해 정규화된다.
도 3은 실시예 2에 기재된 바와 같이 다양한 농도의 락토오스(2.5, 5, 10, 20, 45 및 70g/L)이 보충된 최소 배지에서 72시간 배양한 후 프로모터-UTR 조합 P12U2(De Mey et al., BMC Biotechnology, 2007)로 구축된 전사 단위로부터 서열번호 3을 갖는 알파-1,2-푸코실트랜스퍼라제를 발현하는 돌연변이 균주에서 얻은 2'FL 타이터(g/L)을 보여준다.
도 4는 실시예 2에 기재된 바와 같이 20g/L 락토오스가 보충된 최소 배지에서 72시간 배양 후 4개의 상이한 전사 단위(TU)로부터 서열번호 3을 갖는 알파-1,2-푸코실트랜스퍼라제를 발현하는 돌연변이 균주의 상대 백분율(%)로 정규화된 2'FL 생산(2FL) 및 성장 속도(mu)를 나타낸다. 전사 단위는 De Mey et al. (De Mey et al., BMC Biotechnology, 2007)에 기재된 프로모터-UTR 조합 P05U14 (TU 01), P05U38 (TU 02), P10U13 (TU 03) 및 P31U17 (TU 04)로 구성된다. 시험된 각 TU에 대해, 각 균주의 2'FL 생산 수준 및 성장 속도는 동일한 전사 단위(파선 수평선으로 표시됨)로부터의 서열번호 71을 갖는 선행 기술의 HpFutC 유전자를 발현하는 참조 균주에서 얻은 2'FL 생산 수준 및 성장 속도 각각에 대해 정규화된다.
도 5는 실시예 2에 기재된 바와 같이 서열번호 1, 2 또는 71을 갖는 알파-1,2-푸코실트랜스퍼라제를 발현하는 균주를 사용한 유가 발효(fed-batch fermentation) 과정의 마지막에 전체 브로스 샘플에서 얻은 diFL 농도 대 2'FL 농도 비율을 보여준다.
도 6은 실시예 2에 기재된 바와 같이 서열번호 1, 3, 4 또는 71을 갖는 알파-1,2-푸코실트랜스퍼라제를 발현하는 균주를 사용한 발효 과정 동안 다양한 시점에서의 상대적인 2'FL, diFL 및 락토오스 농도(%)를 보여준다.
정의
본 명세서에서 본 발명 및 그 다양한 구체예를 설명하기 위해 사용된 단어는 일반적으로 정의된 의미의 뜻으로 이해되어야 할 뿐만 아니라, 본 명세서에서 특별한 정의에 의해 일반적으로 정의된 범위를 넘어서는 구조, 물질 또는 작용을 포함하는 것으로 이해되어야 한다. 따라서, 만약 요소가 본 명세서의 맥락에서 하나 이상의 의미를 포함하는 것으로 이해될 수 있다면, 청구항에서의 그 사용은 명세서에 의해 및 단어 자체에 의해 지지되는 모든 가능한 의미에 대해 포괄적인 것으로 이해되어야 한다.
본원에 개시된 본 발명의 구체예의 다양한 구체예 및 양상은 본 명세서에 구체적으로 기재된 순서 및 맥락에서 뿐만 아니라 임의의 순서 및 임의의 조합을 포함하는 것으로 이해되어야 한다. 문맥이 요구할 때마다 단수에 사용된 모든 단어는 복수를 포함하는 것으로 간주되며 그 반대의 경우도 마찬가지이다. 달리 정의되지 않는 한, 본 명세서에서 사용되는 모든 기술 및 과학 용어는 일반적으로 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 일반적으로 이해하는 것과 동일한 의미를 갖는다. 일반적으로, 본원에 사용된 명명법 및 세포 배양, 분자 유전학, 유기 화학 및 핵산 화학 및 본원에 기재된 혼성화에서의 실험실 절차는 당업계에 널리 공지되고 일반적으로 사용되는 것들이다. 핵산 및 펩티드 합성에는 표준 기술이 사용된다. 일반적으로 효소 반응 및 정제 단계는 제조업체의 사양에 따라 수행된다.
도면 및 명세서에는 본 발명의 구체예가 개시되어 있으며, 특정한 용어가 사용되었지만, 그 용어는 단지 설명적인 의미로 사용되었으며 제한을 위한 것은 아니고, 본 발명의 범위는 하기 특허청구범위에 기재되어 있다. 예시된 구체예는 예시의 목적으로만 설명되었으며 본 발명을 제한하는 것으로 간주되어서는 안 된다는 것을 이해해야 한다. 변경, 다른 구체예, 개선, 세부사항 및 사용이 본 명세서의 개시내용의 문자 및 정신과 일치하게 그리고, 균등의 원칙을 포함하여 특허법에 따라 해석되는 청구범위에 의해서만 제한되는 본 개시내용의 범위 내에서 이루어질 수 있다는 것이 통상의 기술자에게 명백할 것이다. 후속되는 청구범위에서 청구 단계를 지정하는 데 사용되는 참조 문자는 설명의 편의를 위해 제공되며 그 단계를 수행하기 위한 특정 순서를 의미하지 않는 것으로 의도된 것이다.
본 발명에 따르면, 용어 "폴리뉴클레오티드(들)"은 일반적으로 변형되지 않은 RNA 또는 DNA 또는 변형된 RNA 또는 DNA일 수 있는 임의의 폴리리보뉴클레오티드 또는 폴리데옥시리보뉴클레오티드를 지칭한다. "폴리뉴클레오티드(들)"에는 무제한적으로 단일 및 이중 가닥 DNA, 단일 및 이중 가닥 영역 또는 단일, 이중 및 삼중 가닥 영역의 혼합물인 DNA, 단일 및 이중 가닥 RNA, 및 단일 가닥 및 이중 가닥 영역의 혼합물인 RNA, 단일 가닥, 또는 보다 일반적으로, 이중 가닥, 또는 삼중 가닥 영역일 수 있는 DNA 및 RNA를 포함하는 하이브리드 분자, 또는 단일 가닥 및 이중 가닥 영역의 혼합물을 포함한다. 또한, 본 명세서에 사용된 "폴리뉴클레오티드"는 RNA 또는 DNA 또는 RNA와 DNA 모두를 포함하는 삼중 가닥 영역을 지칭한다. 이러한 영역의 가닥은 동일한 분자 또는 다른 분자 유래일 수 있다. 상기 영역은 하나 이상의 분자 모두를 포함할 수 있지만, 보다 일반적으로 분자 중 일부의 영역만 포함한다. 삼중 나선 영역의 분자 중 하나는 종종 올리고뉴클레오티드이다. 본원에 사용된 용어 "폴리뉴클레오티드(들)"은 또한 하나 이상의 변형된 염기를 함유하는 상기 기재된 바와 같은 DNA 또는 RNA를 포함한다. 따라서, 안정성을 위해 또는 다른 이유로 변형된 골격을 갖는 DNA 또는 RNA는 본 발명에 따른 "폴리뉴클레오티드(들)"이다. 또한, 이노신과 같은 특이한 염기 또는 트리틸화된 염기와 같은 변형된 염기를 포함하는 DNA 또는 RNA는 용어 "폴리뉴클레오티드"에 포함되는 것으로 이해되어야 한다. 관련분야 통상의 기술자에게 공지된 많은 유용한 목적을 수행하는 DNA 및 RNA에 대해 매우 다양한 변형이 이루어졌다는 것이 이해될 것이다. 본원에 사용된 용어 "폴리뉴클레오티드(들)"는 폴리뉴클레오티드의 그러한 화학적, 효소적 또는 대사적으로 변형된 형태뿐만 아니라, 예를 들어 단순 세포 및 복합 세포를 포함하는 바이러스 및 세포에 특징적인 DNA 및 RNA의 화학적 형태를 포함한다. 용어 "폴리뉴클레오티드(들)"는 또한 종종 올리고뉴클레오티드(들)로 지칭되는 짧은 폴리뉴클레오티드를 포함한다.
"폴리펩티드(들)"은 펩티드 결합 또는 변형된 펩티드 결합에 의해 서로 연결된 2개 이상의 아미노산을 포함하는 임의의 펩티드 또는 단백질을 지칭한다. "폴리펩티드(들)"은 일반적으로 펩티드, 올리고펩티드 및 올리고머로 지칭되는 짧은 사슬과 일반적으로 단백질로 지칭되는 보다 긴 사슬을 둘다 지칭한다. 폴리펩티드는 20개의 유전자 암호화된 아미노산 이외의 아미노산을 포함할 수 있다. "폴리펩티드(들)"에는 프로세싱 및 기타 번역 후 변형(post-translational modifications)과 같은 자연적 과정뿐만 아니라 화학적 변형 기술에 의해 변형된 것이 포함된다. 이러한 수정은 기본 텍스트와 더 자세한 논문, 방대한 연구 문헌에 잘 설명되어 있으며 통상의 기술자에게 잘 알려져 있다. 동일한 유형의 변형이 주어진 폴리펩티드의 여러 부위에 동일하거나 다양한 정도로 존재할 수 있다. 또한, 주어진 폴리펩티드는 많은 유형의 변형을 포함할 수 있다. 변형은 펩티드 백본, 아미노산 측쇄, 및 아미노 또는 카르복실 말단을 포함하여 폴리펩티드의 어느 곳에서나 발생할 수 있다. 변형은 예를 들어 아세틸화, 아실화, ADP-리보실화, 아미드화, 플라빈의 공유 부착, 헴 모이어티의 공유 부착, 뉴클레오티드 또는 뉴클레오티드 유도체의 공유 부착, 지질 또는 지질 유도체의 공유 부착, 포스파티딜이노시톨의 공유 부착, 가교, 고리화, 이황화 결합 형성, 탈메틸화, 공유 가교 형성, 피로글루타메이트 형성, 포르밀화, 감마-카르복실화, 글리코실화, GPI 앵커 형성, 히드록실화, 요오드화, 메틸화, 미리스토일화, 산화, 단백질 분해 처리, 인산화, 프레닐화, 라세미화, 지질 부착, 황산화, 글루탐산 잔기의 감마-카르복실화, 히드록실화 및 ADP-리보실화, 셀레노일화, 아르기닐화 및 유비퀴틴화와 같은 단백질에 대한 t-RNA 매개의 아미노산 추가를 포함한다. 폴리펩티드는 분지되거나 가지가 없는 분지형 또는 고리형일 수 있다. 고리형, 분지형 및 분지형 원형 폴리펩티드는 번역 후 자연적 프로세싱에서 발생할 수 있으며 완전히 합성 방법으로도 만들 수 있다.
"단리된(isolated)"은 자연 상태에서 "사람의 손에 의해" 변경된 것을 의미한다. 즉, 자연에서 발생하는 경우 원래 환경에서 변경되거나 제거되었거나 둘 다이다. 예를 들어, 살아있는 유기체에 자연적으로 존재하는 폴리뉴클레오티드 또는 폴리펩티드는 "단리된" 것이 아니라, 자연 상태의 공존 물질로부터 분리된 동일한 폴리뉴클레오티드 또는 폴리펩티드가 본 명세서에 사용된 바와 같이 "단리된" 것이다. 유사하게, 용어가 본원에 사용된 "합성" 서열은 합성적으로 생성되고 천연 공급원으로부터 직접적으로 단리되지 않은 임의의 서열을 의미한다. 본 명세서에 사용된 용어 "합성된"은 천연 공급원으로부터 직접적으로 단리되지 않은 임의의 합성적으로 생성된 서열을 의미한다.
"재조합"은 한 종의 유전자를 다른 종의 숙주 유기체의 세포에 이식하거나 스플라이싱하여 제조된 유전적으로 조작된 DNA를 의미한다. 그러한 DNA는 숙주의 유전적 구성의 일부가 되고 복제된다. 본 개시내용의 맥락 내에서 사용되는 "돌연변이" 세포 또는 미생물은 유전적으로 조작되거나 변경된 유전 구성을 갖는 세포 또는 미생물을 지칭한다.
본 개시내용의 맥락 내에서 "2'-푸코실락토오스의 생산을 위해 유전적으로 변형된 세포"라는 용어는 i) 상기 2'-푸코실락토오스의 합성에 필요한 α1,2푸코실트랜스퍼라제를 코딩하는 재조합 유전자, ii) 상기 푸코실트랜스퍼라제에 의해 락토오스로 전달되기에 적합한 GDP-푸코오스를 생성하기 위한 생합성 경로, 및/또는 iii) 락토오스를 생성하기 위한 생합성 경로 또는 배양 배지로부터, 락토오스가 전달되어 그것이 푸코실화되어 2'-푸코실락토오스를 생성하는 세포로의 락토오스의 내재화 메카니즘 중 적어도 하나를 포함하도록 유전적으로 조작된 미생물의 세포를 지칭한다.
용어 "2'푸코실락토오스 합성을 위한 효소를 코딩하는 핵산 서열"은 2'-푸코실락토오스로의 합성 경로에 필요한 효소, 예를 들어 GDP-푸코오스 공여체 기질의 푸코오스 잔기를 락토오스의 갈락토오스 모이어티의 2' 하이드록실기에 전달시켜 2'푸코실락토오스를 생성하도록 할 수 있는 효소를 코딩하는 핵산 서열에 관한 것이다.
본 개시내용의 맥락 내에서 용어 "내인성(endogenous)"은 세포의 천연 부분이고 세포 염색체의 자연적 위치에서 발생하는 임의의 폴리뉴클레오티드, 폴리펩티드 또는 단백질 서열을 지칭한다. "외인성"이라는 용어는 세포의 자연적인 부분이 아니라 연구 중인 세포 외부에서 유래하거나 세포 염색체 또는 플라스미드의 자연적인 위치에서 발생하지 않는 임의의 폴리뉴클레오티드, 폴리펩티드 또는 단백질 서열을 지칭한다.
폴리뉴클레오티드, 유전자, 핵산, 폴리펩티드, 또는 효소와 관련하여 사용될 때 용어 "이종(heterologous)"은 숙주 유기체 종 이외의 공급원으로부터 유래한 또는 공급원으로부터 파생된 폴리뉴클레오티드, 유전자, 핵산, 폴리펩티드, 또는 효소를 지칭한다. 대조적으로, "동종(heterologous)" 폴리뉴클레오티드, 유전자, 핵산, 폴리펩티드, 또는 효소는 숙주 유기체로부터 파생된 폴리뉴클레오티드, 유전자, 핵산, 폴리펩티드, 또는 효소를 나타내기 위해 본원에서 사용된다. 유전자 조절 서열 또는 유전자 서열을 유지하거나 조작하는데 사용되는 보조 핵산 서열을 언급할 때(예를 들어, 프로모터, 5' 비번역 영역, 3' 비번역 영역, 폴리 A 부가 서열, 인트론 서열, 스플라이스 부위, 리보솜 결합 부위, 내부 리보솜 진입 서열, 게놈 상동성 부위, 재조합 부위 등), "이종"은 조절 서열 또는 보조 서열이 구성체, 게놈, 염색체, 또는 에피솜에서 조절 또는 보조 핵산 서열이 병치되어 있는 유전자와 자연적으로 연관되지 않음을 의미한다. 따라서, 자연 상태에서(즉, 비유전적으로 조작된 유기체의 게놈에서) 작동 가능하게 연결되지 않은 유전자에 작동 가능하게 연결된 프로모터는 비록 그 프로모터가 연결된 유전자와 동일한 종(또는 경우에 따라 동일한 유기체)에서 파생될 수 있다 할지라도 본원에서는 "이종 프로모터"라고 칭한다.
본원에 사용된 용어 "폴리펩티드를 코딩하는 폴리뉴클레오티드"는 본 발명의 폴리펩티드, 특히 첨부된 서열 목록의 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 75, 76, 77, 78 또는 79에 제시된 아미노산 서열을 갖는 알파-1,2-푸코실트랜스퍼라제를 코딩하는 서열을 포함하는 폴리뉴클레오티드를 포함한다. 명확성을 위해 서열번호 71의 폴리펩티드를 코딩하는 폴리뉴클레오티드도 정의에 포함되는 폴리뉴클레오티드이지만, 서열번호 71의 폴리뉴클레오티드는 참조로 사용되는 선행 기술의 알파-1,2-푸코실트랜스퍼라제이다. 이 용어는 또한 코딩 및/또는 비-코딩 서열을 또한 함유할 수 있는 추가 영역과 함께 폴리펩티드를 코딩하는 단일 연속 영역 또는 불연속 영역(예를 들어, 통합 파지 또는 삽입 서열 또는 편집에 의해 중단됨)을 포함하는 폴리뉴클레오티드를 포함한다.
본원에 사용된 용어 "변이체(들)"은 각각 참조 폴리뉴클레오티드 또는 폴리펩티드와 다르지만 필수적인 특성을 유지하는 폴리뉴클레오티드 또는 폴리펩티드이다. 폴리뉴클레오티드의 전형적인 변이체는 뉴클레오티드 서열이 다른 참조 폴리뉴클레오티드와 상이하다. 변이체의 뉴클레오티드 서열의 변화는 참조 폴리뉴클레오티드에 의해 코딩된 폴리펩티드의 아미노산 서열을 변경하거나 변경하지 않을 수 있다. 뉴클레오티드 변화는 아래에서 논의되는 바와 같이 참조 서열에 의해 코딩되는 폴리펩티드에서 아미노산 치환, 추가, 결실, 융합 및 절단을 초래할 수 있다. 폴리펩티드의 전형적인 변이체는 다른 참조 폴리펩티드와 아미노산 서열이 다르다. 일반적으로는 참조 폴리펩티드와 변이체의 서열이 전체적으로 매우 유사하고 많은 영역에서 동일하도록 차이는 제한적이다. 변이체 및 참조 폴리펩티드는 임의의 조합에서 하나 이상의 치환, 추가, 결실에 의해 아미노산 서열이 상이할 수 있다. 치환 또는 삽입된 아미노산 잔기는 유전자 코드에 의해 암호화된 것일 수도 있고 아닐 수도 있다. 폴리뉴클레오티드 또는 폴리펩티드의 변이체는 대립유전자 변이체와 같이 자연적으로 발생하거나 자연적으로 발생하는 것으로 알려지지 않은 변이체일 수 있다. 폴리뉴클레오티드 및 폴리펩티드의 비천연 변이체는 돌연변이초래(mutagenesis) 기술, 직접 합성, 및 관련 분야 통상의 기술자에게 공지된 다른 재조합 방법에 의해 제조될 수 있다. 일부 구체예에서, 본 개시내용은 본 발명에서 사용되는 막 단백질의 구조를 변형함으로써 기능적 변이체를 만드는 것을 고려한다. 변이체는 아미노산 치환, 결실, 부가, 또는 이들의 조합에 의해 생성될 수 있다. 예를 들어, 류신을 이소류신이나 발린으로, 아스파르테이트를 글루타메이트로, 트레오닌을 세린으로 단리적인 대체를 기대하는 것이 합리적이고, 또는 아미노산을 구조적으로 관련된 아미노산(예: 보존적 돌연변이)는 생성된 분자의 생물학적 활성에 큰 영향을 미치지 않는다. 보존적 대체는 측쇄와 관련된 아미노산 패밀리 내에서 발생하는 대체이다. 본 개시내용의 폴리펩티드의 아미노산 서열의 변화가 기능적 상동체(homolog)를 생성하는지 여부는 야생형 폴리펩티드와 유사한 방식으로 세포에서 반응을 생성하는 변이 폴리펩티드의 능력을 평가함으로써 용이하게 결정될 수 있고, 본 발명의 경우 변이체가 없는 세포보다 더 나은 수율, 생산성 및/또는 성장 속도를 제공하는 것이다.
본원에 사용된 용어 "기능적 상동체"는 서열 유사성을 갖고 또한 생화학적 활성과 같은 적어도 하나의 기능적 특성을 공유하는 분자를 기술한다. 기능적 상동체는 일반적으로 유사한 정도로 동일한 특성을 나타내지만 반드시 동일한 것은 아니다. 기능적으로 상동성인 단백질은 한 상동체에 의해 생성된 정량적 측정이 다른 상동체의 10% 이상; 보다 전형적으로, 20% 이상, 약 30% 내지 약 40%; 예를 들어, 약 50% 내지 약 60%; 약 70% 내지 약 80%; 또는 약 90% 내지 약 95%; 약 98% 내지 약 100%, 또는 원래 분자에 의해 생성된 것의 100% 초과인 경우 동일한 특성을 제공한다. 따라서, 분자가 효소 활성을 갖는 경우 기능적 상동체는 원래의 효소와 비교하여 위에서 언급한 백분율의 효소 활성을 가질 것이다. 분자가 DNA-결합 분자(예를 들어, 폴리펩티드)인 경우, 상동체는 원래 분자와 비교하여 결합된 분자의 중량으로 측정할 때 상기 언급된 결합 친화도 백분율을 가질 것이다.
기능적 상동체 및 참조 폴리펩티드는 자연 발생 폴리펩티드일 수 있으며, 서열 유사성은 수렴 또는 발산 진화 사건으로 인한 것일 수 있다. 기능적 상동체는 때때로 이종상동체(ortholog)로 지칭되며, 여기서 "이종상동체"는 다른 종의 참조된 유전자 또는 단백질의 기능적 균등물인 상동성 유전자 또는 단백질을 지칭한다.
기능적 상동체는 뉴클레오티드 및 폴리펩티드 서열 정렬의 분석에 의해 확인될 수 있다. 예를 들어, 뉴클레오티드 또는 폴리펩티드 서열의 데이터베이스에 대한 쿼리(query)를 수행하면 바이오매스-조절 폴리펩티드의 상동체를 확인할 수 있다. 서열 분석은 바이오매스-조절 폴리펩티드의 아미노산 서열을 참조 서열로 사용하는 비중복(non-redundant) 데이터베이스의 BLAST, Reciprocal BLAST 또는 PSI-BLAST 분석을 포함할 수 있다. 아미노산 서열은 어떤 경우에는 뉴클레오티드 서열에서 추론된다. 일반적으로, 데이터베이스에서 40%보다 큰 서열 동일성을 갖는 폴리펩티드는 바이오매스-조절 폴리펩티드로서의 적합성에 대한 추가 평가를 위한 후보이다. 아미노산 서열 유사성은 하나의 소수성 잔기를 다른 것으로 치환하거나 하나의 극성 잔기를 다른 것으로 치환하는 것과 같은 보존적 아미노산 치환을 허용한다. 원하는 경우 추가적으로 평가할 후보자 수를 줄이기 위해 이러한 후보자에 대한 수동 검사를 수행할 수 있다. 수동 검사는 생산성-조절 폴리펩티드에 존재하는 도메인, 예를 들어 보존된 기능 도메인을 갖는 것으로 보이는 이들 후보를 선택하여 수행할 수 있다.
폴리뉴클레오티드와 관련하여 "단편"은 폴리뉴클레오티드 분자의 클론 또는 임의의 부분, 특히 사용 가능한 기능적 특성을 유지하는 폴리뉴클레오티드의 일부를 의미한다. 유용한 단편에는 혼성화 또는 증폭 기술 또는 복제, 전사 또는 번역의 조절에 사용될 수 있는 올리고뉴클레오티드 및 폴리뉴클레오티드가 포함된다. "폴리뉴클레오티드 단편"은 폴리뉴클레오티드의 임의의 하위서열, 일반적으로 본원에서 제공되는 임의의 서열의 약 9개 이상의 연속 뉴클레오티드, 예를 들어 약 30개 이상의 뉴클레오티드 또는 약 50개 이상의 뉴클레오티드를 지칭한다. 예시적인 단편은 추가로 또는 대안적으로 폴리펩티드의 보존된 패밀리 도메인을 코딩하는 영역을 포함하거나, 본질적으로 이로 구성되거나, 이로 구성되는 단편을 포함할 수 있다. 예시적인 단편은 추가로 또는 대안적으로 폴리펩티드의 보존된 도메인을 포함하는 단편을 포함할 수 있다.
단편은 추가로 또는 대안적으로 폴리펩티드 및 단백질 분자의 서브서열, 또는 폴리펩티드의 서브서열을 포함할 수 있다. 일부 경우에, 상기 단편 또는 도메인은 손상되지 않은 폴리펩티드가 수행하는 것과 실질적으로 동일한 방식으로, 또는 유사한 정도로 손상되지 않은 폴리펩티드의 생물학적 기능 중 하나 이상을 수행하는 폴리펩티드의 부분서열이다. 예를 들어, 폴리펩티드 단편은 인식 가능한 구조적 모티프 또는 기능적 도메인, 예를 들어 DNA 프로모터 영역에 결합하는 DNA-결합 부위 또는 도메인, 활성화 도메인, 또는 단백질-단백질 상호작용을 위한 도메인을 포함할 수 있고, 전사를 개시할 수 있다. 단편은 크기가 3개 이하 아미노산 잔기와 같이 작은 것으로부터 온전한 폴리펩티드의 전체 길이까지, 예를 들어 길이가 약 20개 이상의 아미노산 잔기, 예를 들어 약 30개 이상의 아미노산 잔기 길이로 다양할 수 있다. 바람직하게는 단편은 그것이 파생된 폴리펩티드의 적어도 하나의 특성 또는 활성을 갖는 기능적 단편이며, 예를 들어 상기 단편은 폴리펩티드의 기능적 도메인 또는 보존된 도메인을 포함할 수 있다. 도메인은 예를 들어 Pfam(El-Gebali et al., Nucleic Acids Res. 47 (2019) D427-D432) 또는 보존 도메인 데이터베이스(CDD)(https://www.ncbi.nlm.nih.gov/cdd)(Lu et al., Nucleic Acids Res. 48 (2020) D265-D268) 지정에 의해 특성 규명이 가능하다. 각 데이터베이스의 내용은 각 출시 시점에서 고정되며 변경되지 않는다. 특정 데이터베이스의 내용이 변경되면 이 특정 데이터베이스는 새로운 출시 날짜의 새로운 출시 버전을 받는다. 해당 출시 날짜 및 이러한 특정 출시 날짜에 주석이 달린 특정 콘텐츠가 있는 각 데이터베이스에 대한 모든 출시 버전이 이용 가능하고 통상의 기술자에게 알려져 있다. 본 명세서에서 사용된 PFAM 데이터베이스(https://pfam.xfam.org/)는 2018년 9월에 출시된 Pfam 버전 32.0이다.
본 발명에서 사용된 바와 같은, 용어 "알파-1,2-푸코실트랜스퍼라제", "알파 1,2 푸코실트랜스퍼라제", "2-푸코실트랜스퍼라제, "α-1,2-푸코실트랜스퍼라제", "α 1,2-푸코실트랜스퍼라제", "2 푸코실트랜스퍼라제, "2-FT" 또는 "2FT"는 상호교환적으로 사용되며 공여체 기질 GDP-L-푸코오스로부터 알파-1,2-링키지 내에 있는 수용체 분자 락토오스로 푸코오스의 전달을 촉매하는 글리코실트랜스퍼라제를 지칭한다. "알파-1,2-푸코실트랜퍼라제" 또는 상기 용어 중 임의의 것을 코딩하는 폴리뉴클레오티드는 공여체 기질 GDP-L-푸코오스로부터 알파-1,2-링키지 내에 있는 수용체 분자 락토오스로 푸코오스의 전달을 촉매하는 그러한 글리코실트랜스퍼라제를 코딩하는 폴리뉴클레오티드를 지칭한다.
본 발명에서 사용된 바와 같은, 용어 "2'푸코실락토오스", "2'-푸코실락토오스", "알파-1,2-푸코실락토오스", "알파 1,2 푸코실락토오스", "α-1,2-푸코실락토오스", "α 1,2 푸코실락토오스", "Galβ-4(Fucα1-2)Glc", 2FL" 또는 "2'FL"은 상호교환적으로 사용되며 GDP-L-푸코오스로부터 α-1,2-결합내의 락토오스로의 푸코오스 잔기를 전달하는 알파-1,2-푸코실트랜스퍼라제의 촉매작용에 의해 얻어진 생성물을 지칭한다. 본 발명에서 사용된 바와 같은, 용어 "디푸코실락토오스", "di-푸코실락토오스", "락토디푸코테트라오스", "2',3-디푸코실락토오스", "2',3 디푸코실락토오스", "α-2',3-푸코실락토오스", "α 2',3 푸코실락토오스, "Fucα1-2Galβ 1-4(Fucα1-3)Glc", "DFLac", 2',3 diFL", "DFL", "DiFL" 또는 "diFL"은 상호교환적으로 사용된다. 바람직한 구체예에서, 이들 용어는 바람직한 알파-1,2 푸코실트랜스퍼라제 활성을 갖는 푸코실트랜스퍼라제의 촉매작용에 의해 수득된 생성물을 지칭하는 것으로서, 이는 푸코오스 잔기를 락토오스 코어의 글루코오스 모이어티의 3개의 탄소로 전달하여 최종적으로 글루코오스 모이어티에서 락토오스 또는 2'프코실락토오스로 알파 α1,3 결합된 푸코오스의 형성을 초래하고, 최종적으로 3-푸코실락토오스 또는 2',3-디푸코실락토오스를 각각 초래하거나, 또는 푸코오스 잔기를 3 푸코실락토오스로 전달하여 2', 3 디푸코실락토오스를 초래하는 알파 1,2-푸코실트랜스퍼라제의 촉매작용에 의해 수득되는 생성물을 지칭한다. 용어 "올리고당"은 본 명세서에서 사용되고 일반적으로 기술 분야에서 일반적으로 이해되는 바와 같이, 적은 수, 전형적으로 3 내지 10개의 단순한 당, 즉 단당류를 함유하는 당류 중합체를 지칭한다.
"정제된"이라는 용어는 생물학적 분자의 활성을 방해하는 성분이 실질적으로 또는 본질적으로 없는 물질을 지칭한다. 세포, 당류, 핵산 및 폴리펩티드의 경우, 용어 "정제된"은 천연 상태에서 발견되는 물질에 통상적으로 수반되는 성분이 실질적으로 또는 본질적으로 없는 물질을 지칭한다. 전형적으로, 본 발명의 정제된 당류, 올리고당류, 단백질 또는 핵산은 순도를 결정하기 위한 은 염색 젤 또는 기타 방법에서 밴드 강도로 측정한 경우 적어도 약 50%, 55%, 60%, 65%, 70%, 75%, 80% 또는 85% 순도, 일반적으로 적어도 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 순도이다. 순도 또는 균질성은 단백질 또는 핵산 샘플의 폴리아크릴아미드 겔 전기영동과 같은 당업계에 잘 알려진 다수의 수단에 의해 표시될 수 있으며, 이어서 염색 시 시각화될 수 있다. 특정 목적을 위해서는 고분해능이 필요하고 HPLC 또는 이와 유사한 정제 수단이 사용된다. 올리고당, 예를 들어 2-푸코실락토오스의 경우, 순도는 박층 크로마토그래피, 기체 크로마토그래피, NMR, HPLC, 모세관 전기영동 또는 질량 분광법과 같은 방법을 사용하여 결정할 수 있지만 이에 국한되지 않는다.
2개 이상의 핵산 또는 폴리펩티드 서열과 관련하여 "동일한" 또는 퍼센트 "동일성" 또는 % "동일성"이라는 용어는 서열 비교 알고리즘을 사용하거나 육안 검사에 의해 측정된 최대 일치성을 위해 비교 및 정렬될 때 동일하거나 또는 동일한 아미노산 서열 또는 뉴클레오티드의 특이적 백분율을 갖는 2개 이상의 서열 또는 하위서열이다. 서열 비교를 위해 하나의 서열은 시험 서열이 대비되는 참조 서열로서 역할을 한다. 서열 비교 알고리즘을 사용하는 경우 시험 서열과 참조 서열을 컴퓨터에 입력하고 필요에 따라 하위 서열 좌표를 지정하고 서열 알고리즘 프로그램 매개변수를 지정한다. 그런 다음 서열 비교 알고리즘은 지정된 프로그램 매개변수를 기반으로 참조 서열에 상대적인 시험 서열(들)의 서열 동일성 백분율을 계산한다. 퍼센트 동일성은 BLAST 및 PSI-BLAST를 사용하여 결정할 수 있다(Altschul et al., 1990, J Mol Biol 215:3, 403-410; Altschul et al., 1997, Nucleic Acids Res 25: 17, 3389-402). 본 발명의 목적을 위해, 퍼센트 동일성은 MatGAT2.01을 사용하여 결정된다(Campanella et al., 2003, BMC Bioinformatics 4:29). 단백질에 대해 다음과 같은 디폴트 매개변수가 사용된다. (1) 갭 비용 존재: 12 및 확장: 2; (2) 사용된 Matrix는 BLOSUM65이다.
용어 "제어 서열"은 폴리뉴클레오티드 서열의 폴리펩티드로의 전사 및 번역을 허용하는 숙주 세포 전사 및 번역 시스템에 의해 인식되는 서열을 지칭한다. 따라서 이러한 DNA 서열은 특정 숙주 세포 또는 유기체에서 작동가능하게 연결된 코딩 서열의 발현에 필요하다. 이러한 제어 서열은 프로모터 서열, 리보솜 결합 서열, Shine Dalgarno 서열, Kozak 서열, 전사 종결자 서열일 수 있지만 이에 제한되지 않는다. 예를 들어, 원핵생물에 적합한 조절 서열은 프로모터, 선택적으로 오퍼레이터 서열, 및 리보솜 결합 부위를 포함한다. 진핵 세포는 프로모터, 폴리아데닐화 신호 및 인핸서를 이용하는 것으로 알려져 있다. 전서열(presequence) 또는 분비 리더(secretory leader)에 대한 DNA는 그것이 폴리펩티드의 분비에 참여하는 전단백질(preprotein)로 발현되는 경우 폴리펩티드에 대한 DNA에 작동가능하게 연결될 수 있고; 프로모터 또는 인핸서는 그것이 서열의 전사에 영향을 미치는 경우 코딩 서열에 작동가능하게 연결되고; 또는 리보솜 결합 부위는 그것이 서열의 전사에 영향을 미치는 경우 코딩 서열에 작동가능하게 연결되어 있거나; 또는 리보솜 결합 부위는 그것이 번역을 용이하게 하도록 위치하는 경우 코딩 서열에 작동가능하게 연결된다. 상기 제어 서열은 유도성 프로모터를 통해 또는 상기 폴리뉴클레오티드의 폴리펩티드로의 전사 또는 번역을 유도하거나 억제하는 유전 회로를 통해 IPTG, 아라비노오스, 락토오스, 알로-락토오스, 람노오스 또는 푸코오스와 같은 외부 화학물질로 더욱 제어될 수 있다.
일반적으로 "작동 가능하게 연결된"은 연결되는 DNA 서열이 인접해 있고, 분비 리더의 경우 인접하고 판독 단계에 있음을 의미한다. 그러나 인핸서는 인접할 필요가 없다.
발명의 상세한 설명
제1 구체예에 따르면, 본 발명은 α-1,2-푸코실락토오스의 생산 방법을 제공한다. 이 방법은 다음 단계를 포함한다:
a) α-1,2-푸코실트랜스퍼라제 활성 및 수용체 기질로서 락토오스를 사용하는 능력을 갖는 폴리펩티드를 제공하는 단계로서, 상기 폴리펩티드는
i) 보존 도메인 GY-[F/Y]-Q-[N/S](서열번호 72)를 코딩하는 아미노산 서열 및 보존 도메인(X, K/V 없음) XXXX[I/L]H[I/L]R[R/L]GD[F/Y](X, C/M 없음)(서열번호 74)을 코딩하는 아미노산 서열을 포함하고, 여기서 X는 상기 도메인의 첫 번째 위치에서 라이신 및 발린 잔기를 제외하고 임의의 별개의 아미노산일 수 있고, 상기 도메인의 마지막 위치에서 시스테인 및 메티오닌 잔기를 제외한 임의의 별개의 아미노산일 수 있고, 및/또는
ii) 다음으로 구성된 군에서 선택되고:
i) 첨부된 서열 목록의 서열번호 1, 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 14, 15, 16, 17, 19, 21, 22, 25, 26, 29, 33, 34, 35, 36, 37, 38, 39, 40, 41, 43, 44, 45, 46, 47, 48, 50, 51, 52, 53, 54, 55, 56, 57, 58, 61, 62, 63, 66, 67 또는 76 중 어느 하나, 또는
ii) 첨부된 서열 목록의 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 33, 34, 35, 36, 37, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 65, 66, 67, 68, 69, 70, 75, 76, 77, 78 또는 79 중 어느 하나의 전장 아미노산 서열과 80% 이상의 서열 동일성을 갖는 아미노산 서열, 또는
iii) 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 65, 66, 67, 68, 69, 70, 75, 76, 77, 78 또는 79 중 어느 하나로 표시되는 아미노산 서열의 대립형질 변이체(allelic variant)의 아미노산 서열 또는
iv) 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 65, 66, 68, 69, 70, 75, 76, 77, 78 또는 79 중 어느 하나로 표시되는 아미노산 서열의 오르토로그의 아미노산 서열, 및
v) 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 65, 66, 67, 68, 69, 70, 75, 76, 77, 78 또는 79 중 어느 하나로 표시되는 아미노산 서열의 기능적 단편,
바람직하게는 상기 폴리펩티드는 글리코실트랜스퍼라제 11(GT11) 패밀리에 속하는 것인 단계,
b) 단계 a)의 α-1,2-푸코실트랜스퍼라제 활성을 갖는 폴리펩티드를, 그 폴리펩티드가 공여체 기질로부터 수용체 기질로 푸코오스 잔기의 전달을 촉매하고, 이에 의해 α-1,2-푸코실락토오스를 생성하는 조건 하에 공여체 기질로서 GDP-푸코오스 및 수용체 기질로서 락토오스를 포함하는 혼합물과 접촉시키는 단계.
상기 도메인을 모두 포함하고, 및/또는 첨부된 서열 목록의 서열번호 1, 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 14, 15, 16, 17, 19, 21, 22, 25, 26, 29, 33, 34, 35, 36, 37, 38, 39, 40, 41, 43, 44, 45, 46, 47, 48, 50, 51, 52, 53, 54, 55, 56, 57, 58, 61, 62, 63, 66, 67 또는 76, 또는 첨부된 서열 목록의 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 65, 66, 67, 68, 69, 70, 75, 76, 77, 78 또는 79 중 어느 하나의 전장 아미노산 서열에 대해 80% 이상의 서열 동일성을 갖는 아미노산 서열, 또는 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 65, 66, 67, 68, 69, 70, 75, 76, 77, 78 또는 79 중 어느 하나로 표시되는 아미노산 서열의 대립형질 변이체의 아미노산 서열, 또는 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 65, 66, 67, 68, 69, 70, 75, 76, 77, 78 또는 79 중 어느 하나로 표시되는 아미노산 서열의 오르토로그의 아미노산 서열, 또는 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 65, 66, 67, 68, 69, 70, 75, 76, 77, 78 또는 79 중 어느 하나로 표시되는 아미노산 서열의 기능적 단편으로 구성된 목록에서 선택된 새로이 확인된 폴리펩티드는 현재 알려진 α-1,2-푸코실트랜스퍼라제에 대한 수용체 기질로서 락토오스를 사용하는 능력을 가진 대안적인 α-1,2-푸코실트랜스퍼라제를 제공한다. 상기 도메인을 모두 포함하고, 및/또는 첨부된 서열 목록의 서열번호 1, 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 14, 15, 16, 17, 19, 21, 22, 25, 26, 29, 33, 34, 35, 36, 37, 38, 39, 40, 41, 43, 44, 45, 46, 47, 48, 50, 51, 52, 53, 54, 55, 56, 57, 58, 61, 62, 63, 66, 67 또는 76, 또는 첨부된 서열 목록의 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 65, 66, 67, 68, 69, 70, 75, 76, 77, 78 또는 79 중 어느 하나의 전장 아미노산 서열에 대해 80% 이상의 서열 동일성을 갖는 아미노산 서열, 또는 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 65, 66, 67, 68, 69, 70, 75, 76, 77, 78 또는 79 중 어느 하나로 표시되는 아미노산 서열의 대립형질 변이체의 아미노산 서열, 또는 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 65, 66, 67, 68, 69, 70, 75, 76, 77, 78 또는 79 중 어느 하나로 표시되는 아미노산 서열의 오르토로그의 아미노산 서열, 또는 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 65, 66, 67, 68, 69, 70, 75, 76, 77, 78 또는 79 중 어느 하나로 표시되는 아미노산 서열의 기능적 단편으로 구성된 목록에서 선택된 폴리펩티드는 현재 알려진 α-1,2-푸코실트랜스퍼라제과 동일한 또는 그 보다 더 높은 락토스 결합 및/또는 동일한 또는 그 보다 더 높은 트랜스퍼라제 특성을 갖는 트랜스퍼라제를 제공한다.
락토오스를 수용체 기질로 사용하는 능력을 갖고 α-1,2-푸코실트랜스퍼라제 활성을 갖는 것으로 새롭게 확인된 일부 폴리펩티드를 사용하는 것의 또 다른 이점은 2-푸코실락토오스가 원하지 않는 디-푸코실락토오스의 생성이 적거나 전혀 생성되지 않고, 보다 구체적으로 디-푸코실락토오스 농도 대 2-푸코실락토오스 농도 비율이 1:5 미만, 바람직하게는 1:10 미만, 더욱 바람직하게는 1:20 미만, 최적으로는 1:40 미만으로 된다는 사실에 있다.
본 발명에 따르면, α-1,2-푸코실락토오스의 생산 방법은 무세포 시스템 또는 세포를 포함하는 시스템에서 수행될 수 있다. 기질 GDP-푸코오스 및 락토오스는 효소 생성물의 형성을 허용하기에 충분한 시간 및 충분한 조건 하에서 알파-1,2-푸코실트랜스퍼라제 폴리펩티드와 반응하도록 허용된다. 이러한 조건은 기질과 효소의 양과 순도, 및 시스템이 무세포 또는 세포 기반 시스템인식에 의존적이다. 이들 변수는 관련분야 통상의 기술자에 의해 용이하게 조정될 것이다.
무세포 시스템에서, 본 발명에 따른 폴리펩티드, 수용체 기질(들), 공여체 기질(들) 및 경우에 따라 다른 글리코실트랜스퍼라제 및 보조 효소를 포함하는 다른 반응 혼합물 성분이 효소 반응을 수행하기 위한 수성 반응 배지에서 혼합에 의해 조합된다. 효소는 용액에서 자유로이 이용될 수 있거나, 또는 폴리머와 같은 지지체에 결합되거나 고정될 수 있고 기질이 지지체에 추가될 수 있다. 지지체는 예를 들어 컬럼에 패킹될 수 있다.
본원에 기재된 바와 같은 2-푸코실락토오스 합성을 위한 세포 함유 시스템 또는 세포 기반 시스템은 유전적으로 변형된 숙주 세포를 포함할 수 있다. 본 발명의 일 양상에 따르면, 알파-1,2-푸코실트랜스퍼라제 활성을 갖는 폴리펩티드는 폴리펩티드를 생산하는 세포, 예를 들어 본원에 기재된 바와 같은 숙주 세포에 의해 생산된다. 본 발명의 또 다른 양상에 따르면, GDP-푸코오스 및/또는 락토오스는 상기 GDP-푸코오스 및/또는 락토오스를 생산하는 세포에 의해 제공된다. 세포는 또한 알파-1,2-푸코실트랜스퍼라제를 생산하는 숙주 세포일 수 있다. 대안적으로, 세포는 알파-1,2-푸코실트랜스퍼라제를 생산하는 숙주 세포가 아닌 다른 세포일 수 있으며, 이 경우 통상의 기술자는 세포 커플링에 대해 이야기할 것이다. 이러한 GDP-푸코오스를 생산하는 세포는 예를 들어, 숙주 세포에 첨가될 푸코오스를 GDP-푸코오스로 전환시키는 효소를 발현할 수 있다. 이 효소는 예를 들어 Bacteroides fragilis의 Fkp와 같은 이중기능성 푸코오스 키나제/푸코오스-1-포스페이트 구아닐릴트랜스퍼라제, 또는 Homo sapiens, Sus scrofa Rattus norvegicus를 포함하는 여러 종에서 알려진 것처럼 하나의 개별 푸코오스 키나아제와 하나의 개별 푸코오스-1-포스페이트 구아닐릴트랜스퍼라제의 조합일 수 있다.
또 다른 구체예에서, 본 발명은 하기 단계를 포함하는 α-1,2-푸코실락토오스의 생산 방법에 관한 것이다:
i) α-1,2-푸코실락토오스 생산을 위해 유전적으로 변형된 세포를 제공하는 단계로서, 상기 세포는 α-1,2-푸코실락토오스 합성을 위한 효소를 코딩하는 하나 이상의 핵산 서열을 포함하고, 상기 세포는 α-1,2-푸코실트랜스퍼라제 활성 및 수용체 기질로서 락토오스를 사용하는 능력을 갖는 상기 폴리펩티드의 발현을 포함하고, 여기서 상기 폴리펩티드는 a) 보존 도메인 GY-[F/Y]-Q-[N/S](서열번호 72)를 코딩하는 아미노산 서열 및 보존 도메인(X, K/V 없음) XXXX[I/L]H[I/L]R[R/L]GD[F/Y](X, C/M 없음)(서열번호 74)을 코딩하는 아미노산 서열을 포함하고, 여기서 X는 상기 도메인의 첫 번째 위치에서 라이신 및 발린 잔기를 제외하고 임의의 별개의 아미노산일 수 있고, 상기 도메인의 마지막 위치에서 시스테인 및 메티오닌 잔기를 제외한 임의의 별개의 아미노산일 수 있고, 및/또는 b) 다음으로 구성된 군에서 선택되고:
i) 첨부된 서열 목록의 서열번호 1, 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 14, 15, 16, 17, 19, 21, 22, 25, 26, 29, 33, 34, 35, 36, 37, 38, 39, 40, 41, 43, 44, 45, 46, 47, 48, 50, 51, 52, 53, 54, 55, 56, 57, 58, 61, 62, 63, 66, 67 또는 76 중 어느 하나, 또는
ii) 첨부된 서열 목록의 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 33, 34, 35, 36, 37, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 65, 66, 67, 68, 69, 70, 75, 76, 77, 78 또는 79 중 어느 하나의 전장 아미노산 서열과 80% 이상의 서열 동일성을 갖는 아미노산 서열, 또는
iii) 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 65, 66, 67, 68, 69, 70, 75, 76, 77, 78 또는 79 중 어느 하나로 표시되는 아미노산 서열의 대립형질 변이체(allelic variant)의 아미노산 서열 또는
iv) 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 65, 66, 68, 69, 70, 75, 76, 77, 78 또는 79 중 어느 하나로 표시되는 아미노산 서열의 오르토로그의 아미노산 서열, 및
v) 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 65, 66, 67, 68, 69, 70, 75, 76, 77, 78 또는 79 중 어느 하나로 표시되는 아미노산 서열의 기능적 단편,
바람직하게는 상기 폴리펩티드는 글리코실트랜스퍼라제 11(GT11) 패밀리에 속하고, 및
ii) α-1,2-푸코실락토오스의 생산을 허용하는 조건 하에 배지에서 세포를 배양하는 단계.
추가적인 구체예에서,
본 발명은 하기 단계를 포함하는 α-1,2-푸코실락토오스의 생산 방법에 관한 것이다:
a) α-1,2-푸코실트랜스퍼라제 활성 및 수용체 기질로서 락토오스를 사용하는 능력을 갖는 폴리펩티드를 발현하는 숙주 세포를 제공하는 단계로서, 여기서 상기 폴리펩티드는 a) 보존 도메인 GY-[F/Y]-Q-[N/S](서열번호 72)를 코딩하는 아미노산 서열 및 보존 도메인(X, K/V 없음) XXXX[I/L]H[I/L]R[R/L]GD[F/Y](X, C/M 없음)(서열번호 74)을 코딩하는 아미노산 서열을 포함하고, 여기서 X는 상기 도메인의 첫 번째 위치에서 라이신 및 발린 잔기를 제외하고 임의의 별개의 아미노산일 수 있고, 상기 도메인의 마지막 위치에서 시스테인 및 메티오닌 잔기를 제외한 임의의 별개의 아미노산일 수 있고, 및/또는 ii) 다음으로 구성된 군에서 선택되고:
i) 첨부된 서열 목록의 서열번호 1, 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 14, 15, 16, 17, 19, 21, 22, 25, 26, 29, 33, 34, 35, 36, 37, 38, 39, 40, 41, 43, 44, 45, 46, 47, 48, 50, 51, 52, 53, 54, 55, 56, 57, 58, 61, 62, 63, 66, 67 또는 76 중 어느 하나, 또는
ii) 첨부된 서열 목록의 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 33, 34, 35, 36, 37, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 65, 66, 67, 68, 69, 70, 75, 76, 77, 78 또는 79 중 어느 하나의 전장 아미노산 서열과 80% 이상의 서열 동일성을 갖는 아미노산 서열, 또는
iii) 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 65, 66, 67, 68, 69, 70, 75, 76, 77, 78 또는 79 중 어느 하나로 표시되는 아미노산 서열의 대립형질 변이체(allelic variant)의 아미노산 서열 또는
iv) 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 65, 66, 68, 69, 70, 75, 76, 77, 78 또는 79 중 어느 하나로 표시되는 아미노산 서열의 오르토로그의 아미노산 서열, 및
v) 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 65, 66, 67, 68, 69, 70, 75, 76, 77, 78 또는 79 중 어느 하나로 표시되는 아미노산 서열의 기능적 단편,
바람직하게는 상기 폴리펩티드는 글리코실트랜스퍼라제 11(GT11) 패밀리에 속하고, 및
b) α-1,2-푸코실락토오스의 생산을 허용하고 α-1,2-푸코실트랜스퍼라제 활성을 갖는 폴리펩티드의 발현을 허용하는 적합한 영양 조건 하에 단계 a)의 상기 숙주 세포를 성장시키는 단계;
c) α-1,2-푸코실트랜스퍼라제 폴리펩티드가 GDP-푸코오스로부터 푸코오스 잔기의 락토오스로의 전달을 촉매하기 위해, 단계 b)와 동시에 또는 그 다음에 공여체 기질 GDP-푸코오스 및 수용체 기질 락토오스를 제공함으로써, α-1,2-푸코실락토오스를 생산하는 단계.
또 다른 구체예에 따르면, 본원에 기재된 방법에서 상기 2'-푸코실락토오스의 생성은 세포에 의한 알파-1,2-푸코실트랜스퍼라제를 코딩하는 폴리뉴클레오티드의 이종성 또는 상동성 (과)발현에 의해 수행된다.
본원에 기술된 본 발명의 방법에서 숙주 세포는 알파-1,2-푸코실트랜스퍼라제 활성 및 수용체 기질로서 락토오스를 사용하는 능력으로 본원에 기술된 바와 같은 외인성 폴리펩티드를 발현하도록 형질전환되거나 형질감염될 수 있다. 이와 같이, 본 발명은 하기 단계를 포함하는, 숙주 세포를 사용하여 알파-1,2-푸코실락토오스를 생산하는 방법에 관한 것이다:
a) 알파-1,2-푸코실트랜스퍼라제 활성 및 수용체 기질로서 락토오스를 사용하는 능력을 갖는 외인성 폴리펩티드를 발현하도록 형질전환 또는 형질감염된 숙주 세포를 성장시키는 단계(여기서 폴리펩티드는 본원에 기술됨); 및
b) 단계 a)와 동시에 또는 후속적으로 공여체 기질 GDP-푸코오스 및 수용체 기질 락토오스를 제공하는 단계로서, 알파-1,2-푸코실트랜스퍼라제 폴리펩티드는 푸코오스 잔기의 공여체 기질로부터 수용체 기질로의 전달을 촉매하고, 이에 따라서 알파-1,2-푸코실락토오스를 생성하는 단계.
바람직하게는 본원에 사용된 바와 같이 알파-1,2-푸코실트랜스퍼라제 활성 및 수용체 기질로서 락토오스를 사용하는 능력을 갖는 외인성 폴리펩티드는 1:5 미만의 diFL 농도 대 2'FL 농도 비율로 디푸코실락토오스를 생성하지 않거나 더 적은 디푸코실락토오스를 생성한다.
diFL 농도 대 2'FL 농도의 비율은 1:5, 1:6, 1:7, 1:8, 1:9, 1:10, 1:11, 1:12, 1:13, 1:14, 1:15, 1:16, 1:17, 1:18, 1:19, 1:20, 1:21, 1:22, 1:23, 1:24, 1:25, 1:26, 1:27, 1:28, 1:29, 1:30, 1:31, 1:32, 1:33, 1:34, 1:35, 1:36, 1:37, 1:38, 1:39, 1:40, 1:45, 1:50, 1:55, 1:60, 1:65, 1:70, 1:75, 1:80, 1:85, 1:90, 1:95 , 1:100, 1:110, 1:120, 1:130, 1:140, 1:150, 1:160, 1:170, 1:180, 1:190, 1:200, 1:300, 1:400, 1:500, 1:600, 1:700, 1:800, 1:900, 1:1000 미만일 수 있다.
바람직한 구체예에서 2'FL 농도에 대한 diFL 농도의 비율이 1:5, 1:6, 1:7, 1:8, 1:9, 1:10, 1:11, 1:12, 1:13, 1:14, 1:15, 1:16, 1:17, 1:18, 1:19, 1:20, 1:21, 1:22, 1:23, 1:24, 1:25, 1:26, 1:27, 1:28, 1:29, 1:30, 1:31, 1:32, 1:33, 1:34, 1:35, 1:36, 1:37, 1: 38, 1:39, 1:40, 1:45, 1:50, 1:55, 1:60, 1:65, 1:70, 1:75, 1:80, 1:85, 1:90, 1:95, 1:100, 1:110, 1:120, 1:130, 1:140, 1:150, 1:160, 1:170, 1:180; 1:190, 1:200, 1:300, 1:400, 1:500, 1:600, 1:700, 1:800, 1:900, 1:1000 미만으로 생산과정에서 얻어지고 결과적으로 최종 락토오스 농도가 25g/L, 20g/L, 15g/L 10g/L, 9g/L, 8g/L, 7g/L, 6g/L, 5g/L, 4g 미만의 농도 /L, 3g/L, 2g/L, 1g/L, 0.5g/L, 0.25g/L, 0.1g/L 미만 또는 0g/L이 된다.
또다른 구체예에서 2'FL 농도에 대한 diFL 농도의 비율이 1:5, 1:6, 1:7, 1:8, 1:9, 1:10, 1:11, 1:12, 1:13, 1:14, 1:15, 1:16, 1:17, 1:18, 1:19, 1:20, 1:21, 1:22, 1:23, 1:24, 1:25, 1:26, 1:27, 1:28, 1:29, 1:30, 1:31, 1:32, 1:33, 1:34, 1:35, 1:36, 1:37, 1:38, 1:39, 1:40, 1:45, 1:50, 1:55, 1:60, 1:65, 1:70, 1:75, 1:80, 1:85, 1:90, 1:95, 1:100, 1:110, 1:120, 1:130, 1:140, 1:150, 1:160, 1:170, 1:180; 1:190, 1:200, 1:300, 1:400, 1:500, 1:600, 1:700, 1:800, 1:900, 1:1000 미만으로 생산과정에서 얻어지고 여기서 락토오스 농도가 기질 제한 조건(substrate limiting conditions)에서 공급되며, 기질 제한은 기질의 전환율을 결정하는 생물반응기 내의 농도로 정의된다.
또다른 구체예에서 2'FL 농도에 대한 diFL 농도의 비율이 1:5, 1:6, 1:7, 1:8, 1:9, 1:10, 1:11, 1:12, 1:13, 1:14, 1:15, 1:16, 1:17, 1:18, 1:19, 1:20, 1:21, 1:22, 1:23, 1:24, 1:25, 1:26, 1:27, 1:28, 1:29, 1:30, 1:31, 1:32, 1:33, 1:34, 1:35, 1:36, 1:37, 1:38, 1:39, 1:40, 1:45, 1:50, 1:55, 1:60, 1:65, 1:70, 1:75, 1:80, 1:85, 1:90, 1:95, 1:100, 1:110, 1:120, 1:130, 1:140, 1:150, 1:160, 1:170, 1:180; 1:190, 1:200, 1:300, 1:400, 1:500, 1:600, 1:700, 1:800, 1:900, 1:1000 미만으로 생산과정에서 얻어지고 여기서 락토오스는 속도 제한 조건(rate limiting conditions)에서 형성된다.
또 다른 구체예에서, 브로스(broth) 중 2'푸코실락토오스 순도는 브로스 중 약 80% 초과, 예를 들어 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9%이다. 본 명세서에 사용된 바와 같이, 2'-푸코실락토오스 순도는 2'FL 농도 대 2'FL 농도, diFL 농도 및 락토오스 농도의 합의 비율로 정의된다([2'FL]/([2'FL ]+[diFL]+[락토오스])).
본 발명에 따르면, GDP-푸코오스 및/또는 락토오스는 발효 배지 또는 수성 배양 배지에서 숙주 세포에 공급될 수 있다. 대안적으로, GDP-푸코오스 및/또는 락토오스는 숙주 세포에서 동시에 발현되는 효소에 의해 또는 숙주 세포의 대사에 의해 제공될 수 있다. 따라서, 숙주 세포는 또한 GDP-푸코오스 및/또는 락토오스 다음으로 알파-1,2-푸코실트랜스퍼라제를 생성할 것이다. 또 다른 구체예에서, GDP-푸코오스 및/또는 락토오스는 알파-1,2-푸코실트랜스퍼라제를 생산하는 숙주 세포가 아닌 다른 세포인 세포에 의해 생산될 수 있으며, 이 경우 통상의 기술자는 세포 커플링에 대해 이야기할 것이다. 이러한 GDP-푸코오스를 생산하는 세포는 예를 들어, 숙주 세포에 첨가될 푸코오스를 GDP-푸코오스로 전환시키는 효소를 발현할 수 있다. 이 효소는 예를 들어 Bacteroides fragilis의 Fkp와 같은 이중기능성 푸코오스 키나제/푸코오스-1-포스페이트 구아닐릴트랜스퍼라제, 또는 Homo sapiens, Sus scrofa 및 Rattus norvegicus를 포함하는 여러 종에서 알려진 것처럼 하나의 개별 푸코오스 키나아제와 하나의 개별 푸코오스-1-포스페이트 구아닐릴트랜스퍼라제의 조합일 수 있다.
또 다른 구체예에 따르면, 상기 알파-1,2-푸코실락토오스의 생산은 알파-1,2-푸코실트랜스퍼라제를 코딩하는 폴리뉴클레오티드의 이종성 또는 상동성 (과)발현을 포함하는 본원에 기재된 바와 같은 숙주 세포에 의해 수행된다.
추가적인 양상에서 본 발명은 본원에 기재된 바와 같은 알파-1,2-푸코실락토오스를 생산하는 방법을 제공하며, 여기서 상기 방법은 상기 숙주 세포 또는 그것의 성장 배지로부터 상기 알파-1,2-푸코실락토오스를 분리하는 단계를 추가로 포함한다.
"분리하는"이라는 용어는 반응 혼합물 및/또는 알파-1,2-푸코실트랜스퍼라제를 생산하는 세포, 숙주 세포, 이의 성장 배지 및/또는 또는 본원에 설명된 반응 혼합물, 본 발명에 따라 새로 확인된 알파-1,2-푸코실트랜스퍼라제의 사용에 의해 생성된 2-푸코실락토오스로부터 알파-1,2-푸코실트랜스퍼라제를 수확, 수집 또는 회수하는 것을 의미한다.
α-1,2-푸코실락토오스가 세포나 발효를 이용하여 제조되는 경우, 2'FL은 혼합물이 제조된 수성 배양 배지로부터 통상적인 방법으로 분리될 수 있다. 알파-1,2-푸코실락토오스가 알파-1,2-푸코실락토오스를 생성하는 세포에 여전히 존재하는 경우, 세포로부터 알파-1,2-푸코실락토오스를 유리시키거나 추출하기 위한 통상적인 방식, 예컨대 높은 pH, 열 충격, 초음파 처리, 프렌치 프레스, 균질화, 효소적 가수분해, 화학적 가수분해, 용매 가수분해, 세제, 가수분해,... 가 사용될 수 있다. 배양 배지, 반응 혼합물 및/또는 세포 추출물은 함께 그리고 별도로 2'FL 함유 혼합물로 지칭되며, 2'FL을 분리하기 위해 추가로 사용될 수 있다. 이것은 바람직하게는 2'FL 함유 혼합물을 정화하여 현탁된 미립자 및 오염물, 특히 세포, 세포 성분, 불용성 대사산물 및 유전자 변형된 세포를 배양하고/하거나 효소 반응을 수행함으로써 생성된 파편을 제거하는 것을 포함한다. 이 단계에서, 2'FL 함유 혼합물은 통상적인 방식으로 정화될 수 있다. 바람직하게는, 2'FL 함유 혼합물은 원심분리, 응집, 경사분리 및/또는 여과에 의해 정화할 수 있다. 2'FL 함유 혼합물로부터 2'FL을 분리하는 두 번째 단계는 바람직하게는 2'FL 함유 혼합물, 바람직하게는 정화된 후에도 실질적으로 모든 단백질, 뿐만 아니라 펩티드, 아미노산, RNA 및 DNA 및 후속 분리 단계를 방해할 수 있는 임의의 내독소 및 당지질을 제거하는 것을 포함한다. 이 단계에서, 단백질 및 관련 불순물은 통상적인 방식으로 2'FL 함유 혼합물로부터 제거될 수 있다. 바람직하게는, 단백질, 염, 부산물, 색상 및 기타 관련 불순물은 한외여과, 나노여과, 역삼투, 정밀여과, 활성탄 또는 탄소 처리, 접선 흐름 고성능 여과, 접선 흐름 한외여과, 친화성 크로마토그래피, 이온 교환 크로마토그래피(예: 양이온 교환, 음이온 교환, 혼합층 이온 교환을 포함하나 이에 제한되지 않음), 소수성 상호작용 크로마토그래피 및/또는 겔 여과(즉, 크기 배제 크로마토그래피), 특히 크로마토그래피, 보다 특별히 이온 교환 크로마토그래피 또는 소수성 상호작용 크로마토그래피 또는 리간드 교환 크로마토그래피에 의해 2'FL 함유 혼합물로부터 제거된다. 크기 배제 크로마토그래피를 제외하고 단백질 및 관련 불순물은 크로마토그래피 매질 또는 선택된 멤브레인에 의해 유지되는 반면 2'FL은 2'FL 함유 혼합물에 남아 있다.
2'FL은 증발, 동결건조, 결정화, 침전 및/또는 건조, 분무 건조에 의한 추가 정제 단계가 있거나 없는 반응 혼합물 및/또는 배양 배지 및/또는 세포로부터 추가로 분리된다.
더욱 추가적인 양상에서, 본 발명은 또한 알파-1,2-푸코실락토오스의 추가 정제를 제공한다. 상기 2-푸코실락토오스의 추가 정제는 예를 들어 (활성화된) 목탄 또는 탄소, 나노여과, 한외여과 또는 이온 교환을 사용하여 잔류하는 DNA, 단백질, LPS, 내독소, 또는 기타 불순물을 제거함으로써 달성될 수 있다. 에탄올과 같은 알코올 및 수성 알코올 혼합물도 사용할 수 있다. 또 다른 정제 단계는 제품의 결정화, 증발 또는 침전에 의해 수행된다. 또 다른 정제 단계는 알파-1,2-푸코실락토오스를 건조, 분무 건조 또는 동결건조하는 것이다.
분리되고 바람직하게는 정제된 2'FL은 유아용 조제유의 보충제로 사용될 수 있고 신생아의 다양한 질병을 치료하기 위해 사용될 수 있다.
본 발명의 또 다른 양상은 α-1,2-푸코실트랜스퍼라제 활성 및 본원에 기재된 수용체 기질로서 락토오스 및 바람직하게는 또한 2'FL을 사용하는 능력을 갖는 폴리펩티드가 진균, 효모, 박테리아, 곤충, 동물 또는 식물 발현 시스템 또는 본원에 기재된 세포내에서 및/또는 이들에 의해 생성되는 방법을 제공한다. 발현 시스템 또는 세포는 박테리아, 효모, 또는 진균(fungus)을 포함하는 목록으로부터 선택되거나, 식물 또는 동물 세포를 지칭한다. 후자의 박테리아는 바람직하게는 프로테오박테리아의 문(phylum) 또는 Firmicutes의 문 또는 시아노박테리아의 문 또는 Deinococcus-Thermus의 문에 속한다. 프로테오박테리아 문에 속하는 후자의 박테리아는 바람직하게는 장내세균(Enterobacteriaceae)과, 바람직하게는 대장균(Escherichia coli) 종에 속한다. 후자의 박테리아는 바람직하게는 Escherichia coli B, Escherichia coli C, Escherichia coli W, Escherichia coli K12, Escherichia coli Nissle와 같은(이에 국한되지 않음) Escherichia coli 종에 속하는 임의의 균주에 관한 것이다. 보다 구체적으로, 후자는 실험실 환경에 잘 적응하고 야생형 균주와 달리 장에서 번성하는 능력을 상실한 배양된 대장균 균주(E. coli K12 균주로 지정됨)에 관한 것이다. E. coli K12 균주의 잘 알려진 예는 K12 야생형, W3110, MG1655, M182, MC1000, MC1060, MC1061, MC4100, JM101, NZN111 및 AA200이다. 따라서, 본 발명은 구체적으로 상기 E. coli 균주가 K12 균주인 것으로 상기 표시된 바와 같은 돌연변이 및/또는 형질전환된 대장균 숙주 세포 또는 균주에 관한 것이다. 더욱 바람직하게는, 대장균 K12 균주는 대장균 MG1655이다. Firmicutes 문에 속하는 후자의 박테리아는 바람직하게는 Bacilli, 바람직하게는 Lactobacillus lactis, Leuconostoc mesenteroides과 같은 구성원을 가진 Lactobacilliales, 또는 Bacillus subtilis, 또는 B. amyloliquefaciens와 같은 Bacillus 속과 같은 구성원을 가진 Bacillales에 속한다. 후자의 박테리아는 악티노박테리아 문에 속하며, 바람직하게는 코리네박테리움 글루타미쿰 또는 C. afermentans와 같은 구성원을 가진 Corynebacteriaceae의 과에 속하고, 또는 Streptomyces griseus 또는 S. fradiae의 구성원을 가진 Streptomycetaceae의 과에 속한다. 후자의 효모는 바람직하게는 자낭균(Ascomycota)문 또는 담자균(Basidiomycota)문 또는 신생균(Deuteromycota)문 또는 접합균(Zygomycetes)문에 속한다. 후자의 효모는 바람직하게는 Saccharomyces, Zygosaccharomyces, Pichia, Komagataella, Hansenula, Kluyveromyces, Debaromyces, Yarrowia 또는 Starmerella 속에 속한다. 후자의 진균류(fungus)는 바람직하게는 Rhizopus, Dictyostelium, Penicillium, Mucor 또는 Aspergillus 속에 속한다.
본 발명의 추가적인 양상에 따르면, 알파-1,2-푸코실트랜스퍼라제 활성을 갖는 폴리펩티드를 코딩하는 폴리뉴클레오티드는 각각의 세포 또는 발현 시스템의 코돈 사용에 적합화되어 있다.
추가의 바람직한 구체예에서, 본 발명의 방법은 본 발명의 알파-1,2-푸코실트랜스퍼라제를 포함하는 숙주 세포 또는 미생물의 성장을 위한 배양 배지를 사용하며, 여기서 배양 배지 중 락토오스 농도는 50 내지 150g/L 범위이다. 배양 배지에서 이러한 락토오스 농도는 50g/L, 55g/L, 60g/L, 65g/L, 70g/L, 75g/L, 80g/L, 85g/L, 90g/L, 95g/L, 100g/L, 105g/L, 110g/L, 115g/L, 120g/L, 125g/L, 130g/L, 135g/L, 140g /L, 145g/L 또는 150g/L일 수 있다.
추가의 바람직한 구체예에서, 본 발명의 방법은 본 발명의 알파-1,2-푸코실트랜스퍼라제를 포함하는 숙주 세포 또는 미생물의 성장을 위한 배양 배지를 사용하며, 여기서 배양 배지 중 GDP-푸코오스는 1:5 미만의 diFL 농도 대 2'푸코실락토오스 농도 비율로 숙주 세포가 2'-푸코실락토오스를 합성할 수 있도록 하는 농도로 존재한다.
추가의 바람직한 구체예에서, 본 발명의 방법은 본 발명의 알파-1,2-푸코실트랜스퍼라제를 포함하는 숙주 세포 또는 미생물의 성장을 위한 배양 배지를 사용하며, 여기서 배양 배지 중 GDP-푸코오스는 순도 80% 이상으로 숙주 세포가 2'-푸코실락토오스를 합성할 수 있도록 하는 농도로 존재한다.
추가의 바람직한 구체예에서, 본 발명의 방법은 본 발명의 알파-1,2-푸코실트랜스퍼라제를 포함하는 숙주 세포 또는 미생물의 성장을 위한 배양 배지를 사용하는데 여기서는 탄소계 기질이 숙주 세포로 하여금 1:5 미만의 diFL 농도 대 2'푸코실락토오스 농도 비율로 2'푸코실락토오스 합성을 위한 최적 농도에서 GDP-푸코오스를 합성할 수 있도록 하는 농도로 존재한다.
추가의 바람직한 구체예에서, 본 발명의 방법은 본 발명의 알파-1,2-푸코실트랜스퍼라제를 포함하는 숙주 세포 또는 미생물의 성장을 위한 배양 배지를 사용하는데 여기서는 탄소계 기질이 숙주 세포로 하여금 순도 80% 이상의 2'푸코실락토오스 합성을 위한 최적의 농도에서 GDP-푸코오스를 합성할 수 있도록 하는 농도로 존재한다.
추가의 바람직한 구체예에서, 본 발명의 방법은 70g/L 내지 200g/L 범위의 2-푸코실락토오스의 최종 농도를 생산한다. 이러한 2'FL 농도는 70g/L, 75g/L, 80g/L, 85g/L, 90g/L, 95g/L, 100g/L, 105g/L, 110g/L, 115g/L, 120g/L, 125g/L, 130g/L, 135g/L, 140g/L, 145g/L, 150g/L, 155g/L, 160g/L, 165g/L, 170g/L, 175g/L, 180g/L, 185g/L, 190g/L, 195g/L, 또는 200g/L이다. 배양 배지에서 더 높은 락토오스 농도는 생산 방법에서 훨씬 더 높은 2'FL 최종 농도가 얻어지도록 제공할 수 있다.
추가의 바람직한 구체예에서, 본 발명의 방법은 상기 설명된 바와 같이 70g/L 내지 200g/L 범위에서 2'FL의 최종농도를 생산하고, 여기서 diFL 농도 대 2'FL 농도 비율은 1:5 미만, 보다 바람직하게는 1:10, 훨씬 더 바람직하게는 1:40이다.
본 발명의 또 다른 측면은 증가된 GDP-푸코오스 공급에 의한 락토오스의 개선된 푸코실화 속도를 위한 방법을 제공하며, 여기서 2'FL 농도에 대한 diFL 농도 비율은 1:5 미만이다. 본 발명의 대안적인 측면은 증가된 GDP-푸코오스 공급에 의한 락토오스의 개선된 푸코실화 속도를 위한 방법을 제공하며, 여기서 최종 2'FL은 80% 이상의 순도를 갖는다. 본 발명의 바람직한 구체예에서, 락토오스를 수용체 기질로 사용하는 능력을 가지며 본 발명의 서열번호 71을 갖는 H.pylori의 HpFutC에 비하여 2'FL에 대해 푸코실트랜스퍼라제 활성을 덜 가지는 α-1,2-푸코실트랜스퍼라제 활성을 갖는 본 발명의 폴리펩티드는 GDP-푸코오스에 대해 개선된 친화도를 갖는다.
본원에 기재된 바와 같은 본 발명의 방법에서 α-1,2-푸코실트랜스퍼라제 활성 및 수용체 기질로서 락토오스를 사용하는 능력을 갖는 폴리펩티드는
i) 보존 도메인 GY-[F/Y]-Q-[N/S](서열번호 72)를 코딩하는 아미노산 서열 및 보존 도메인(X, K/V 없음) XXXX[I/L]H[I/L]R[R/L]GD[F/Y](X, C/M 없음)(서열번호 74)을 코딩하는 아미노산 서열을 포함하고, 여기서 X는 상기 도메인의 첫 번째 위치에서 라이신 및 발린 잔기를 제외하고 임의의 별개의 아미노산일 수 있고, 상기 도메인의 마지막 위치에서 시스테인 및 메티오닌 잔기를 제외한 임의의 별개의 아미노산일 수 있고, 및/또는 ii) 다음으로 구성된 군에서 선택되고:
i) 첨부된 서열 목록의 서열번호 1, 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 14, 15, 16, 17, 19, 21, 22, 25, 26, 29, 33, 34, 35, 36, 37, 38, 39, 40, 41, 43, 44, 45, 46, 47, 48, 50, 51, 52, 53, 54, 55, 56, 57, 58, 61, 62, 63, 66, 67 또는 76 중 어느 하나, 또는
ii) 첨부된 서열 목록의 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 33, 34, 35, 36, 37, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 65, 66, 67, 68, 69, 70, 75, 76, 77, 78 또는 79 중 어느 하나의 전장 아미노산 서열과 80% 이상의 서열 동일성을 갖는 아미노산 서열, 또는
iii) 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 65, 66, 67, 68, 69, 70, 75, 76, 77, 78 또는 79 중 어느 하나로 표시되는 아미노산 서열의 대립형질 변이체(allelic variant)의 아미노산 서열 또는
iv) 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 65, 66, 68, 69, 70, 75, 76, 77, 78 또는 79 중 어느 하나로 표시되는 아미노산 서열의 오르토로그의 아미노산 서열, 및
v) 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 65, 66, 67, 68, 69, 70, 75, 76, 77, 78 또는 79 중 어느 하나로 표시되는 아미노산 서열의 기능적 단편,
바람직하게는 상기 폴리펩티드는 글리코실트랜스퍼라제 11(GT11) 패밀리에 속한다.
본 발명의 범위 내에서, 이러한 폴리펩티드는 락토오스 결합 알파-1,2-푸코실트랜스퍼라제 활성을 갖는 것으로 입증되었으며, 바람직하게는 현재 알려진 알파-1,2-푸코실트랜스퍼라제 효소와 비교하여 2-푸코실락토오스에 대한 효소적 부작용 활성이 적거나 전혀 없다.
본원에 사용된 아미노산 서열은 첨부된 서열 목록 중 서열번호 1, 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 14, 15, 16, 17, 19, 21, 22, 25, 26, 29, 33, 34, 35, 36, 37, 38, 39, 40, 41, 43, 44, 45, 46, 47, 48, 50, 51, 52, 53, 54, 56, 57, 58, 61, 62, 63, 66, 67 또는 76으로부터 선택된 서열일 수 있다. 상기 아미노산 서열은 또한 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 57, 58, 59, 60, 61, 62, 63, 65, 66, 67, 68, 69, 70, 75, 76, 77, 78 또는 79 중 어느 하나의 전장 아미노산 서열과 약 80% 이상의 서열 동일성, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 95,5%, 96%, 96,5%, 97%, 97,5%, 98%, 98,5%, 99%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9% 서열 동일성을 갖는 아미노산 서열일 수 있다.
또한, 본 발명의 범위 내에서, 아미노산 서열은 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 65, 66, 67, 68, 69, 70, 75, 76, 77, 78 또는 79 중 어느 하나로 표시되는 아미노산 서열의 변이체일 수 있다.
N-말단 및/또는 C-말단 아미노산 스트레치에 의해 임의로 추가로 변형된 본원에 기재된 알파 1,2-푸코실트랜스퍼라제 폴리펩티드가 본 발명의 범위에 추가로 포함된다. 이러한 아미노산 스트레치는 폴리펩티드의 N-말단 및/또는 C-말단에서 폴리펩티드 서열의 부가로서 이해되어야 한다. 예를 들어, 폴리펩티드 서열은 추가적인 효소 활성을 달성하기 위해 알파-1,2-푸코실트랜스퍼라제 폴리펩티드에 융합될 수 있다. 이러한 아미노산 스트레치는 특정 태그 및/또는 HQ-태그일 수 있으며; 최대 20개 아미노산의 연장, 예를 들어 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개 아미노산일 수 있고; 이러한 확장은 또한 25, 30, 35, 40, 45, 50, 55, 60, 65, 70개 이상의 아미노산 길이일 수 있다. 선택적 N-말단 및/또는 C-말단 아미노산 스트레치는 또한 정제를 위한 태그, 폴리펩티드의 용해도를 증가시키기 위한 태그, 대사 형성을 위한 태그 또는 아미노산 스트레치, 단백질 대사체학(metabolomics)을 위한 태그, 기질 결합을 위한 태그, 유전자 융합에서 동일하거나 상이한 기능을 갖는 또 다른 폴리펩티드, 예를 들어 GDP-푸코오스 합성효소, 갈락토실트랜스퍼라제, 푸코실트랜스퍼라제, 이기능성 푸코오스 키나제/푸코오스-1-포스페이트 구아닐일트랜스퍼라제 또는 푸코오스- 1-포스페이트 구아닐트랜스퍼라제일 수 있으며 이제 제한되지 않고, 여기서 상기 다른 폴리펩티드는 펩티드 링커를 통해 알파-1,2-푸코실트랜스퍼라제 폴리펩티드에 선택적으로 융합된다. 예를 들어, 본원에 기술된 알파-1,2-푸코실트랜스퍼라제 폴리펩티드는 선택적으로 하나 이상의 외인성 친화성 태그, 예를 들어 정제 또는 기질 결합 태그, 예를 들어 6 His 태그 서열, GST 태그, HQ 태그, HA 태그 서열, 복수의 6 His 태그 서열, 복수의 GST 태그, 복수의 HA 태그 서열, SNAP-태그, SUMOstar 태그를 포함한다. 다른 예로는 단백질 분해 절단 부위, 보유 부위, 절단 부위, 폴리히스티딘 태그, 비오틴, 아비딘, BiTag 서열, S 태그, 엔테로키나제 부위, 트롬빈 부위, 항체 또는 항체 도메인, 항체 단편, 항원, 수용체, 수용체 도메인, 수용체 단편, 리간드, 염료, 수용체, 소광제, 또는 이들의 조합을 포함한다.
또한, 알파-1,2-푸코실트랜스퍼라제 폴리펩티드는 기능적으로 균등한 폴리펩티드를 나타내는 단백질 또는 폴리펩티드를 포함할 수 있다. 이러한 균등한 알파-1,2-푸코실트랜스퍼라제 폴리펩티드는 본원에 기술된 알파-1,2-푸코실트랜스퍼라제 폴리뉴클레오티드에 의해 코딩된 아미노산 서열 내에 아미노산 잔기의 결실, 부가 또는 치환을 포함할 수 있지만, 이는 침묵적 변화를 초래하므로, 기능적으로 균등한 알파-1,2-푸코실트랜스퍼라제를 생성한다. 아미노산 치환은 관련된 잔기의 극성, 전하, 용해도, 소수성, 친수성 및/또는 양친매성 성질의 유사성을 기반으로 이루어질 수 있다. 예를 들어, 비극성(소수성) 아미노산은 알라닌, 류신, 이소류신, 발린, 프롤린, 페닐알라닌, 트립토판, 및 메티오닌을 포함하고; 평면 중성 아미노산은 글리신, 세린, 트레오닌, 시스테인, 티로신, 아스파라긴, 및 글루타민을 포함하고; 양으로 하전된(염기성) 아미노산은 아르기닌, 라이신, 및 히스티딘을 포함하고; 음으로 하전된(산성) 아미노산은 아스파르트산 및 글루탐산을 포함한다. 본 발명의 맥락 내에서, 본원에 사용된 "기능적으로 균등한"은 효소 활성을 포함하지만 이에 국한되지 않는 여러 기준 중 임의의 것에 의해 판단되는 본 발명의 락토오스 결합 알파-1,2-푸코실트랜스퍼라제 폴리펩티드와 실질적으로 유사한 생체내(in vivo) 활성을 나타낼 수 있는 폴리펩티드를 지칭한다. 번역 동안 또는 번역 후에 차등적으로 변형되는 알파-1,2-푸코실트랜스퍼라제 단백질, 폴리펩티드, 및 유도체(단편 포함)가 본 발명의 범위 내에 포함된다. 나아가, 비고전적 아미노산 또는 화학적 아미노산 유사체는 알파-1,2-푸코실트랜스퍼라제 폴리펩티드 서열에 대한 치환 또는 부가로서 도입될 수 있다.
알파-1,2-푸코실트랜스퍼라제 폴리펩티드는 관련 분야에 잘 알려진 기술을 사용하여 재조합 DNA 기술을 통해 생성된 폴리뉴클레오티드에 의한 발현에 의해 생성될 수 있다. 통상의 기술자에게 잘 알려진 방법을 사용하여 알파-1,2-푸코실트랜스퍼라제 코딩 서열 및 적절한 전사 및/또는 번역 제어 신호를 함유하는 발현 벡터를 구축할 수 있다. 이러한 방법에는 예를 들어 시험관내(in vitro) 재조합 DNA 기술, 합성 기술, 및 생체내(in vivo) 유전자 재조합이 포함된다. 예를 들어 Sambrook et al.(2001) Molecular Cloning: a lab manual, 3rd Edition, Cold Spring Harbor Laboratory Press, CSH, New York 또는 Current Protocols in Molecular Biology, John Wiley and Sons, NY (1989년 및 매년 업데이트)에 설명된 기술을 참조할 것.
대안적으로, 알파-1,2-푸코실트랜스퍼라제 폴리펩티드는 자연에서 또는 무세포 및/또는 시험관내 시스템 내에서 폴리펩티드를 생성하는 세포의 추출에 의해, 직접 합성에 의해 생성될 수 있다. 디푸코실락토오스 부산물 형성이 적거나 전혀 없고, 바람직하게는 2'FL 농도에 대한 디푸코실락토오스 농도의 비율이 1:5 미만이고, 더욱 더 바람직하게는 80% 이상의 2'FL 순도를 갖는, 2-푸코실락토오스 생산에 사용되는 락토오스 결합 능력을 갖는 새로 확인된 알파-1,2-푸코실트랜스퍼라제의 적합성은 매우 놀랍고, 따라서 이들의 사용은 2'-푸코실락토오스를 쉽고 효율적이며 비용-효율적으로 생산하기 위한 우수한 도구를 나타낸다.
알파-1,2-푸코실트랜스퍼라제 폴리펩티드를 코딩하는 폴리뉴클레오티드는 관련 업계에 잘 알려진 기술을 사용하는 재조합 DNA 기술을 통해 생산될 수 있다. 관련 분야의 통상의 기술자에게 잘 알려진 방법을 사용하여 알파-1,2-푸코실트랜스퍼라제 코딩 서열 및 적절한 전사 및/또는 번역 제어 신호를 함유하는 발현 벡터를 구축할 수 있다. 이러한 방법에는 예를 들어 시험관내 재조합 DNA 기술, 합성 기술, 및 생체내 유전자 재조합이 포함된다. 예를 들어 Sambrook et al.(2001) Molecular Cloning: a laboratory manual, 3rd Edition, Cold Spring Harbor Laboratory Press, CSH, New York 또는 Current Protocols in Molecular Biology, John Wiley and Sons, NY (1989년 및 매년 업데이트)에 설명된 기술을 참조할 것.
본 발명의 또 다른 양상에 따르면, 본원에 기재된 바와 같은 알파-1,2-푸코실트랜스퍼라제 활성을 갖는 상기 폴리펩티드를 코딩하는 폴리뉴클레오티드를 함유하는 벡터가 제공될 수 있으며, 여기서 폴리뉴클레오티드는 벡터로 형징전환된 숙주 세포에 의해 인식되는 조절 서열에 작동적으로 링크된다. 특히 바람직한 구체예에서, 벡터는 발현 벡터이고, 본 발명의 또다른 양상에 따르면 상기 벡터는 플라스미드, 코스미드, 파지, 리포솜, 또는 바이러스의 형태로 존재할 수 있다.
따라서, 본 명세서에 기재된 바와 같은 알파-1,2-푸코실트랜스퍼라제 활성을 갖는 폴리펩티드를 코딩하는 폴리뉴클레오티드는, 예를 들어 숙주 세포 내로 안정적으로 형질전환/형질감염될 벡터에 포함될 수 있다. 벡터에서, 본원에 기술된 알파-1,2-푸코실트랜스퍼라제 활성을 갖는 폴리펩티드를 코딩하는 폴리뉴클레오티드는 프로모터의 제어 하에 있다. 프로모터는 예를 들어 유도성 프로모터일 수 있어, 유전자/폴리뉴클레오티드의 발현이 특이적으로 표적화될 수 있고, 원하는 경우 유전자가 그러한 방식으로 과발현될 수 있다. 프로모터는 또한 구성적 프로모터일 수 있다.
매우 다양한 발현 시스템을 사용하여 본 발명의 폴리펩티드를 생성할 수 있다. 이러한 벡터는 무엇보다도 염색체, 에피솜 및 바이러스 유래 벡터, 예를 들어 박테리아 플라스미드, 박테리오파지, 트랜스포존, 효모 에피솜, 삽입 요소, 효모 염색체 요소, 바이러스, 및 이들의 조합으로부터 유래된 벡터, 예컨대 코스미드 및 파지미드와 같은 플라스미드 및 박테리오파지 유전 요소로부터 유래된 것을 포함한다. 이들 벡터는 항생제 마커, 영양요구성 마커, 독소-항독소 마커, RNA 센스/안티센스 마커와 같은 선택 마커를 포함할 수 있지만 이에 국한되지 않는다. 발현 시스템 구축물은 발현을 조절할 뿐만 아니라 초래하는 제어 영역을 포함할 수 있다. 일반적으로, 폴리뉴클레오티드를 유지, 증식 또는 발현하고/하거나 숙주에서 폴리펩티드를 발현하기에 적합한 임의의 시스템 또는 벡터가 이와 관련하여 발현을 위해 사용될 수 있다. 적절한 DNA 서열은 예를 들어 Sambrook et al.(상기 참조)에 기재된 것과 같은 다양한 공지되고 일상적인 기술에 의해 발현 시스템에 삽입될 수 있다.
재조합 생산을 위해, 숙주 세포는 발현 시스템 또는 이의 부분 또는 본 발명의 폴리뉴클레오티드를 포함하도록 유전적으로 조작될 수 있다. 숙주 세포 내로 폴리뉴클레오티드의 도입은 Davis et al., Basic Methods in Molecular Biology, (1986) 및 상기 Sambrook et al., 1989와 같은 많은 표준 실험실 매뉴얼에 설명된 방법에 의해 유효화할 수 있다.
추가적인 양상에 따르면, 본 발명은 알파-1,2-푸코실락토오스의 생산을 위해 유전적으로 변형된 숙주 세포를 제공하며, 여기서 숙주 세포는 2'-푸코실락토오스 합성을 위한 효소를 코딩하는 적어도 하나의 핵산 서열을 포함하고, 여기서 상기 세포는 α-1,2-푸코실트랜스퍼라제 활성 및 락토오스를 수용체 기질로 사용하는 능력을 갖는 폴리펩티드의 발현을 포함한다.
상기 폴리펩티드는
i) 보존 도메인 GY-[F/Y]-Q-[N/S](서열번호 72)를 코딩하는 아미노산 서열 및 보존 도메인(X, K/V 없음) XXXX[I/L]H[I/L]R[R/L]GD[F/Y](X, C/M 없음)(서열번호 74)을 코딩하는 아미노산 서열을 포함하고, 여기서 X는 상기 도메인의 첫 번째 위치에서 라이신 및 발린 잔기를 제외하고 임의의 별개의 아미노산일 수 있고, 상기 도메인의 마지막 위치에서 시스테인 및 메티오닌 잔기를 제외한 임의의 별개의 아미노산일 수 있고, 및/또는
ii) 다음으로 구성된 군에서 선택되고:
i) 첨부된 서열 목록의 서열번호 1, 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 14, 15, 16, 17, 19, 21, 22, 25, 26, 29, 33, 34, 35, 36, 37, 38, 39, 40, 41, 43, 44, 45, 46, 47, 48, 50, 51, 52, 53, 54, 55, 56, 57, 58, 61, 62, 63, 66, 67 또는 76 중 어느 하나, 또는
ii) 첨부된 서열 목록의 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 33, 34, 35, 36, 37, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 65, 66, 67, 68, 69, 70, 75, 76, 77, 78 또는 79 중 어느 하나의 전장 아미노산 서열과 80% 이상의 서열 동일성을 갖는 아미노산 서열, 또는
iii) 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 65, 66, 67, 68, 69, 70, 75, 76, 77, 78 또는 79 중 어느 하나로 표시되는 아미노산 서열의 대립형질 변이체(allelic variant)의 아미노산 서열 또는
iv) 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 65, 66, 68, 69, 70, 75, 76, 77, 78 또는 79 중 어느 하나로 표시되는 아미노산 서열의 오르토로그의 아미노산 서열, 및
v) 서열번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 65, 66, 67, 68, 69, 70, 75, 76, 77, 78 또는 79 중 어느 하나로 표시되는 아미노산 서열의 기능적 단편,
바람직하게는 상기 폴리펩티드는 글리코실트랜스퍼라제 11(GT11) 패밀리에 속한다.
본원에 사용된 용어 "숙주 세포"는 형질전환 또는 형질감염되었거나 외인성 폴리뉴클레오티드 서열에 의해 형질전환 또는 형질감염될 수 있어 상기 숙주 세포에서 자연적으로 발생하지 않는 하나 이상의 서열을 함유하는 세포로 현재로서는 정의된다.
다양한 숙주-발현 벡터 시스템을 이용하여 본 발명의 알파-1,2-푸코실트랜스퍼라제 폴리뉴클레오티드를 발현시킬 수 있다. 그러한 숙주-발현 시스템은 관심 코딩 서열이 생성되고 후속적으로 정제될 수 있는 비히클을 나타내지만, 또한 적절한 뉴클레오티드 코딩 서열로 형질전환되거나 형질감염될 때 현장에서(in situ) 본 발명의 알파-1,2-푸코실트랜스퍼라제 유전자 생성물을 나타내는 세포를 또한 나타낸다.
본 발명의 또 다른 양상에 따르면, 2-푸코실락토오스 생산을 위한 숙주 세포가 제공되며, 여기서 숙주 세포는 본원에 기재된 바와 같은 락토오스 결합 알파-1,2-푸코실트랜스퍼라제 활성을 갖는 폴리펩티드를 코딩하는 폴리뉴클레오티드로 이루어진 서열을 포함하고, 여기서 폴리뉴클레오티드는 숙주 세포에 대해 외래인 서열이고, 여기서 상기 서열은 숙주 세포의 게놈에 통합된다. 폴리뉴클레오티드는 숙주 세포에 의해 인식되는 조절 서열에 작동가능하게 링크된다.
본 발명의 대안적인 양상에 따르면, 2-푸코실락토오스 생산을 위한 숙주 세포가 제공되며, 여기서 숙주 세포는 본원에 기재된 락토오스 결합 알파-1,2-푸코실트랜스퍼라제 활성을 갖는 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 벡터를 함유하고, 여기서 상기 폴리뉴클레오티드는 벡터로 형질전환된 숙주 세포에 의해 인식되는 조절 서열에 작동가능하게 링크되어 있다.
추가적인 측면에서, 본 발명은 또한 a) 본 명세서에 기재된 바와 같은 세포를 제공하는 단계, 및 b) α-1,2-푸코실락토오스의 생산을 허용하는 조건 하에 배지에서 세포를 배양하는 단계를 포함하는 α-1,2-푸코실락토오스의 생산 방법을 제공한다.
바람직하게는, 상기 α-1,2-푸코실락토오스는 본원에 기재된 바와 같이 배양물로부터 분리된다. 바람직하게는, 또한 정제가 본원에 기재된 바와 같이 수행될 수 있다.
또 다른 추가 측면에서, 본 발명은 2-푸코실락토오스의 생산을 위한 본원에 기재된 바와 같은 세포의 용도를 제공한다.
본 발명의 추가적인 양상에 따르면, 본원에 기재된 바와 같은 알파-1,2-푸코실트랜스퍼라제를 발현하는 미생물이 제공된다.
본원에 사용된 용어 미생물 또는 유기체 또는 세포 또는 숙주 세포는 박테리아, 효모, 또는 진균(fungus)을 포함하는 목록으로부터 선택된 미생물을 지칭되거나, 식물 또는 동물 세포를 지칭한다. 후자의 박테리아는 바람직하게는 프로테오박테리아의 문(phylum) 또는 Firmicutes의 문 또는 시아노박테리아의 문 또는 Deinococcus-Thermus의 문에 속한다. 프로테오박테리아 문에 속하는 후자의 박테리아는 바람직하게는 장내세균(Enterobacteriaceae)과, 바람직하게는 대장균(Escherichia coli) 종에 속한다. 후자의 박테리아는 바람직하게는 Escherichia coli B, Escherichia coli C, Escherichia coli W, Escherichia coli K12, Escherichia coli Nissle와 같은(이에 국한되지 않음) Escherichia coli 종에 속하는 임의의 균주에 관한 것이다. 보다 구체적으로, 후자는 실험실 환경에 잘 적응하고 야생형 균주와 달리 장에서 번성하는 능력을 상실한 배양된 대장균 균주(E. coli K12 균주로 지정됨)에 관한 것이다. E. coli K12 균주의 잘 알려진 예는 K12 야생형, W3110, MG1655, M182, MC1000, MC1060, MC1061, MC4100, JM101, NZN111 및 AA200이다. 따라서, 본 발명은 구체적으로 상기 E. coli 균주가 K12 균주인 것으로 상기 표시된 바와 같은 돌연변이 및/또는 형질전환된 대장균 숙주 세포 또는 균주에 관한 것이다. 더욱 바람직하게는, 대장균 K12 균주는 대장균 MG1655이다. Firmicutes 문에 속하는 후자의 박테리아는 바람직하게는 Bacilli, 바람직하게는 Lactobacillus lactis, Leuconostoc mesenteroides과 같은 구성원을 가진 Lactobacilliales, 또는 Bacillus subtilis, 또는 B. amyloliquefaciens와 같은 Bacillus 속과 같은 구성원을 가진 Bacillales에 속한다. 후자의 박테리아는 악티노박테리아 문에 속하며, 바람직하게는 코리네박테리움 글루타미쿰 또는 C. afermentans와 같은 구성원을 가진 Corynebacteriaceae의 과에 속하고, 또는 Streptomyces griseus 또는 S. fradiae의 구성원을 가진 Streptomycetaceae의 과에 속한다. 후자의 효모는 바람직하게는 자낭균(Ascomycota)문 또는 담자균(Basidiomycota)문 또는 신생균(Deuteromycota)문 또는 접합균(Zygomycetes)문에 속한다. 후자의 효모는 바람직하게는 Saccharomyces, Zygosaccharomyces, Pichia, Komagataella, Hansenula, Kluyveromyces, Debaromyces, Yarrowia 또는 Starmerella 속에 속한다. 후자의 진균류(fungus)는 바람직하게는 Rhizopus, Dictyostelium, Penicillium, Mucor 또는 Aspergillus 속에 속한다.
본 발명의 또 다른 양상에 따르면, 락토오스 결합 알파-1,2-푸코실트랜스퍼라제 활성을 갖는 폴리펩티드를 코딩하는 폴리뉴클레오티드는 각각의 숙주 세포의 코돈 사용에 적합화된다.
본 발명의 추가적인 양상은 알파-1,2-푸코실락토오스의 생산을 위해 본원에 기재된 바와 같은 폴리펩티드의 용도를 제공한다.
본 발명의 추가적인 양상은 알파-1,2-푸코실락토오스의 생산을 위한 본원에 기재된 바와 같은 벡터의 용도를 제공한다.
따라서, 본 발명은 또한 본 발명에 따른 방법에 의해 수득된 2-푸코실락토오스, 뿐만 아니라 2-푸코실락토오스의 생산을 위한 상기 기재된 폴리뉴클레오티드, 벡터, 숙주 세포, 미생물 또는 폴리펩티드의 용도에 관한 것이다. 알파-1,2-푸코실락토오스는 유아식, 성인 식품 또는 공급물의 보충을 위한 식품 첨가물, 프리바이오틱, 공생체로서, 또는 치료학적 또는 약학적 활성 화합물로서 사용될 수 있다. 새로운 방법을 사용하면 복잡하고 시간과 비용이 많이 드는 합성 과정 없이 알파-1,2-푸코실락토오스를 쉽고 효과적으로 제공할 수 있다.
달리 정의되지 않는 한, 본 명세서에서 사용되는 모든 기술 및 과학 용어는 일반적으로 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 통상적으로 이해하는 것과 동일한 의미를 갖는다. 일반적으로, 본 명세서에 사용된 명명법 및 세포 배양, 분자 유전학, 유기 화학 및 핵산 화학 및 상기 및 하기 기재된 혼성화에서의 실험실 절차는 관련 업계에 널리 공지되고 통상적으로 사용되는 것들이다. 핵산 및 펩티드 합성에는 표준 기술이 사용된다. 일반적으로 효소 반응 및 정제 단계는 제조업체의 사양에 따라 수행된다.
추가적인 이점은 특정 구체예, 실시예 및 첨부된 도면에 나온다.
물론, 상술한 특징 및 이하에서 설명할 특징은 본 발명의 범위를 벗어나지 않는 범위에서 각각 특정된 조합으로 사용될 수 있을 뿐만 아니라 다른 조합으로 또는 단독으로 사용될 수 있음은 물론이다.
본 발명은 다음의 특이적인 구체예에 관한 것이다:
1. 하기 단계들을 포함하는 α-1,2-푸코실락토오스의 생산 방법:
a) α-1,2-푸코실트랜스퍼라제 활성 및 수용체 기질로서 락토오스를 사용하는 능력을 갖는 폴리펩티드를 제공하는 단계로서, 상기 폴리펩티드는
i) 보존 도메인 GY-[F/Y]-Q-[N/S](서열번호 72)를 코딩하는 아미노산 서열 및 보존 도메인(X, K/V 없음) XXXX[I/L]H[I/L]R[R/L]GD[F/Y](X, C/M 없음)(서열번호 74)을 코딩하는 아미노산 서열을 포함하고, 여기서 X는 상기 도메인의 첫 번째 위치에서 라이신 및 발린 잔기를 제외하고 임의의 별개의 아미노산일 수 있고, 상기 도메인의 마지막 위치에서 시스테인 및 메티오닌 잔기를 제외한 임의의 별개의 아미노산일 수 있고 및/또는
ii) 다음으로 구성된 군에서 선택되고:
i) 첨부된 서열 목록의 서열번호 01, 02, 03, 04, 05, 06, 07, 09, 10, 11, 12, 13, 14, 15, 16, 17, 19, 21, 22, 25, 26, 29, 33, 34, 35, 36, 37, 38, 39, 40, 41, 43, 44, 45, 46, 47, 48, 50, 51, 52, 53, 54, 55, 56, 57, 58, 61, 62, 63, 66, 67 또는 76 중 어느 하나, 또는
ii) 첨부된 서열 목록의 서열번호 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 33, 34, 35, 36, 37, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 65, 66, 67, 68, 69, 70, 75, 76, 77, 78 또는 79 중 어느 하나의 전장 아미노산 서열과 80% 이상의 서열 동일성을 갖는 아미노산 서열, 또는
iii) 서열번호 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 65, 66, 67, 68, 69, 70, 75, 76, 77, 78 또는 79 중 어느 하나로 표시되는 아미노산 서열의 대립형질 변이체(allelic variant)의 아미노산 서열 또는
iv) 서열번호 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 65, 66, 68, 69, 70, 75, 76, 77, 78 또는 79 중 어느 하나로 표시되는 아미노산 서열의 오르토로그의 아미노산 서열, 및
v) 서열번호 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 65, 66, 67, 68, 70, 75, 76, 77, 78 또는 79 중 어느 하나로 표시되는 아미노산 서열의 기능적 단편,
바람직하게는 상기 폴리펩티드는 글리코실트랜스퍼라제 11(GT11) 패밀리에 속하고,
b) 단계 a)의 α-1,2-푸코실트랜스퍼라제 활성을 갖는 폴리펩티드를, 폴리펩티드가 공여체 기질로부터 수용체 기질로 푸코오스 잔기의 전달을 촉매하는 조건 하에 공여체 기질로서 GDP-푸코오스 및 수용체 기질로서 락토오스를 포함하는 혼합물과 접촉시키는 단계로서, 이에 의해 α-1,2-푸코실락토오스를 생성하고,
c) 선택적으로 상기 α-1,2-푸코실락토오스를 분리하는 단계.
2. 구체예 1에 있어서, α-1,2-푸코실락토오스의 생산이 diFL 농도 대 2'푸코실락토오스 농도 비율을 1:5 미만, 바람직하게는 α-1,2-푸코실락토오스 순도를 80% 이상으로 초래하는 것인 방법.
3. 구체예 1 또는 구체예 2에 있어서, 상기 폴리펩티드는 무세포 시스템으로 제공되는 것인 방법.
4. 구체예 1 또는 구체예 2에 있어서, 상기 폴리펩티드는 상기 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 세포에 의해 생산되는 것인 방법.
5. 구체예 1, 구체예 2 또는 구체예 4 중 어느 한 항에 있어서, 상기 GDP-푸코오스 및/또는 락토오스가 상기 GDP-푸코오스 및/또는 락토오스를 생산하는 세포에 의해 제공되는 것인 방법.
6. 구체예 1, 구체예 2, 구체예 4 또는 구체예 5 중 어느 한 항에 있어서, 상기 방법이 하기 단계들을 포함하는 것인 방법:
i) α-1,2-푸코실락토오스 합성을 위한 효소를 코딩하는 하나 이상의 핵산 서열을 포함하는, α-1,2-푸코실락토오스 생산을 위해 유전적으로 변형된 세포를 제공하는 단계로서, 상기 세포는 α-1,2-푸코실트랜스퍼라제 활성 및 수용체 기질로서 락토오스를 사용하는 능력을 갖는 상기 폴리펩티드의 발현을 포함하고,
ii) α-1,2-푸코실락토오스의 생산을 허용하는 조건 하에 배지에서 상기 세포를 배양하는 단계,
iii) 선택적으로 배양물로부터 α-1,2-푸코실락토오스를 분리하는 단계.
7. 구체예 4항에 있어서, 상기 방법이 하기 단계들을 포함하는 것인 방법:
a) α-1,2-푸코실트랜스퍼라제 활성 및 수용체 기질로서 락토오스를 사용하는 능력을 갖는 상기 폴리펩티드를 발현하는 숙주 세포를 제공하는 단계,
b) α-1,2-푸코실락토오스의 생산을 허용하고 α-1,2-푸코실트랜스퍼라제 활성을 갖는 상기 폴리펩티드의 발현을 허용하는 적합한 영양 조건 하에 상기 숙주 세포를 성장시키는 단계;
c) α-1,2-푸코실트랜스퍼라제 폴리펩티드가 푸코오스 잔기의 GDP-푸코오스로부터 락토오스로의 전달을 촉매하기 위해 b) 단계와 동시에 또는 그에 후속적으로 공여체 기질에 GDP-푸코오스 및 수용체 기질에 락토오스를 제공함으로써, α-1,2-푸코실락토오스를 생산하는 단계;
d) 선택적으로 상기 α-1,2-푸코실락토오스를 숙주 세포 또는 그의 성장 배지로부터 분리하는 단계.
8. 구체예 6 또는 구체예 7에 있어서, 숙주 세포가 알파-1,2-푸코실트랜스퍼라제 활성 및 수용체 기질로서 락토오스를 사용하는 능력을 갖는 외인성 폴리펩티드를 발현하도록 형질전환 또는 형질감염되는 것인 방법.
9. 구체예 4 내지 구체예 8 중 어느 한 항에 있어서, GDP-푸코오스 및/또는 락토오스가 숙주 세포에서 동시에 발현되는 효소에 의해 또는 숙주 세포의 대사에 의해 제공되는 것을 특징으로 하는 방법.
10. 구체예 1 내지 구체예 9 중 어느 한 항에 있어서, α-1,2-푸코실락토오스의 정제를 더 포함하는 것인 방법.
11. 구체예 1 내지 구체예 10 중 어느 한 항에 있어서, 하기 단계 중 하나 이상을 더 포함하는 것인 2'-푸코실락토오스의 생산 방법:
i) 초기 반응기 부피의 리터당 50 그램 이상, 보다 바람직하게는 75 그램 이상, 더욱 바람직하게는 100 그램 이상, 더욱 바람직하게는 120 그램 이상, 더욱 바람직하게는 150 그램 이상의 락토오스를 포함하는 락토오스 공급물을 배양 배지에 바람직하게는 연속 방식으로 첨가하는 단계로서, 여기서 총 반응기 부피는 250mL(밀리리터) 내지 10,000m3(입방 미터) 범위이고, 바람직하게는 배양 배지의 최종 부피가 상기 락토오스 공급물의 첨가 전 배양 배지 부피의 3배 이하, 바람직하게는 2배 이하, 보다 바람직하게는 2배 미만이 되도록 한 단계;
ii) 1:5 미만의 diFL 농도 대 2'푸코실락토오스 농도 비율로, 바람직하게는 연속 방식으로 숙주 세포가 2'-푸코실락토오스를 합성할 수 있도록 하는 농도에서 GDP-푸코오스 공급물을 배양 배지에 첨가하는 단계로서, 바람직하게는 배양 배지의 최종 부피가 상기 GDP-푸코오스 공급물의 첨가 전 배양 배지 부피의 3배 이하, 바람직하게는 2배 이하, 보다 바람직하게는 2배 미만이 되도록 한 단계;
iii) 1:5 미만의 diFL 농도 대 2'푸코실락토오스 농도 비율로, 바람직하게는 연속 방식으로, 숙주 세포가 2'-푸코실락토오스 합성의 최적 농도로 GDP-푸코오스를 합성할 수 있는 농도에서 탄소계 공급물을 배양 배지에 첨가하는 단계;
iv) 숙주 세포가 2'푸코실락토오스 합성을 위한 최적 농도에서 락토오스를 내부적으로 합성할 수 있는 농도로 탄소계 기질 공급물을 배양 배지에 첨가하는 단계;
v) 1일, 2일, 3일, 4일, 5일에 걸쳐 하나 이상의 공급 용액에 의하여 락토오스 공급물, GDP-푸코오스 공급물 및/또는 탄소계 기질 공급물를 배양 배지에 연속 방식으로 첨가하는 단계;
vi) 공급 용액에 의하여 1일, 2일, 3일, 4일, 5일에 걸쳐 배양 배지에 연속 방식으로 락토오스 공급물을 첨가하는 단계로서, 여기서 상기 락토오스 공급 용액의 농도는 50g/L, 바람직하게는 75g/L, 더 바람직하게는 100g/L, 더 바람직하게는 125g/L, 더 바람직하게는 150g/L, 더 바람직하게는 175g/L, 더 바람직하게는 200g/L, 더 바람직하게는 225g/L, 더 바람직하게는 250g/L, 더 바람직하게는 275g/L, 더 바람직하게는 300g/L, 더 바람직하게는 325g/L, 더 바람직하게는 350g/L, 더 바람직하게는 375g/L, 더 바람직하게는 400g/L, 더 바람직하게는 450g/L, 더 바람직하게는 500g/L, 더욱 더 바람직하게는 550g/L, 가장 바람직하게는 600g/L이고; 바람직하게는 상기 용액의 pH는 3 내지 7로 설정되고 바람직하게는 상기 공급 용액의 온도는 20℃ 내지 80℃로 유지되는 단계;
vii) 상기 방법이 상기 배양 배지의 최종 부피에 있어서 50g/L 이상, 바람직하게는 75g/L 이상, 보다 바람직하게는 적어도 90g/L 이상, 보다 바람직하게는 100g/L 이상, 보다 바람직하게는 125g/L 이상, 보다 바람직하게는 150g/L 이상, 보다 바람직하게는 175g/L 이상, 더욱 바람직하게는 200g/L 이상의 2'-푸코실락토오스 농도를 초래하는 단계.
12. 알파-1,2-푸코실락토오스의 생산을 위해 유전적으로 변형된 숙주 세포로서, 여기서 상기 숙주 세포는 α-1,2-푸코실락토오스 합성을 위한 효소를 코딩하는 하나 이상의 핵산 서열을 포함하고; 상기 세포는 α-1,2-푸코실트랜스퍼라제 활성 및 수용체 기질로서 락토오스를 사용하는 능력을 갖는 폴리펩티드의 발현을 포함하고, 여기서 상기 폴리펩티드는
i) 보존 도메인 GY-[F/Y]-Q-[N/S](서열번호 72)를 코딩하는 아미노산 서열 및 보존 도메인(X, K/V 없음) XXXX[I/L]H[I/L]R[R/L]GD[F/Y](X, C/M 없음)(서열번호 74)을 코딩하는 아미노산 서열을 포함하고, 여기서 X는 상기 도메인의 첫 번째 위치에서 라이신 및 발린 잔기를 제외하고 임의의 별개의 아미노산일 수 있고, 상기 도메인의 마지막 위치에서 시스테인 및 메티오닌 잔기를 제외한 임의의 별개의 아미노산일 수 있고, 및/또는
ii) 다음으로 구성된 군에서 선택되고:
i) 첨부된 서열 목록의 서열번호 01, 02, 03, 04, 05, 06, 07, 09, 10, 11, 12, 13, 14, 15, 16, 17, 19, 21, 22, 25, 26, 29, 33, 34, 35, 36, 37, 38, 39, 40, 41, 43, 44, 45, 46, 47, 48, 50, 51, 52, 53, 54, 55, 56, 57, 58, 61, 62, 63, 66, 67 또는 76 중 어느 하나, 또는
ii) 첨부된 서열 목록의 서열번호 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 33, 34, 35, 36, 37, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 65, 66, 67, 68, 69, 70, 75, 76, 77, 78 또는 79 중 어느 하나의 전장 아미노산 서열과 80% 이상의 서열 동일성을 갖는 아미노산 서열, 또는
iii) 서열번호 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 65, 66, 67, 68, 69, 70, 75, 76, 77, 78 또는 79 중 어느 하나로 표시되는 아미노산 서열의 대립형질 변이체(allelic variant)의 아미노산 서열 또는
iv) 서열번호 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 65, 66, 68, 69, 70, 75, 76, 77, 78 또는 79 중 어느 하나로 표시되는 아미노산 서열의 오르토로그의 아미노산 서열, 및
v) 서열번호 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 65, 66, 67, 68, 70, 75, 76, 77, 78 또는 79 중 어느 하나로 표시되는 아미노산 서열의 기능적 단편이고,
바람직하게는 상기 폴리펩티드는 글리코실트랜스퍼라제 11(GT11) 패밀리에 속하는 것인 세포.
13. 구체예 12에 있어서, 숙주 세포는
i) 락토오스 결합 α-1,2-푸코실트랜스퍼라제 활성을 갖는 상기 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 서열로서, 여기서 상기 서열은 숙주 세포에 대해 외래이고 숙주 세포의 게놈에 통합된 것을 포함하거나, 또는
ii) 상기 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 벡터를 함유하고, 여기서 폴리뉴클레오티드는 벡터로 형질전환된 숙주 세포에 의해 인식되는 조절 서열에 작동가능하게 연결된 것인 세포.
14. 구체예 12 또는 구체예 13에 있어서, 상기 세포는 미생물, 식물 또는 동물 세포로 이루어진 군으로부터 선택되고, 바람직하게는 상기 미생물은 박테리아, 진균 또는 효모이고, 바람직하게는 상기 식물은 벼, 목화, 유채, 대두, 메이즈 또는 옥수수(corn) 식물이고, 바람직하게는 상기 동물은 곤충, 물고기, 새 또는 인간이 아닌 포유동물이고; 바람직하게는 세포는 대장균(Escherichia coli) 세포인 것인 세포.
15. 구체예 12 내지 구체예 14 중 어느 한 항에 있어서, 숙주 세포가 박테리아, 바람직하게는 대장균 균주, 보다 바람직하게는 K12 균주인 대장균 균주의 세포이고, 훨씬 더 바람직하게는 대장균 K12 균주는 대장균 MG1655인 것을 특징으로 하는 숙주 세포.
16. 구체예 12 내지 구체예 14 중 어느 한 항에 있어서, 숙주 세포가 효모 세포인 것을 특징으로 하는 숙주 세포.
17. 구체예 12 내지 구체예 16 중 어느 한 항에 있어서, 락토오스 결합 알파-1,2-푸코실트랜스퍼라제 활성을 갖는 폴리펩티드를 코딩하는 폴리뉴클레오티드가 각각의 숙주 세포의 코돈 사용에 적응되어 있는 것을 특징으로 하는 숙주 세포.
18. 하기 단계들을 포함하는 α-1,2-푸코실락토오스의 생산 방법:
a) 구체예 12 내지 구체예 17 중 어느 한 항에 따른 세포를 제공하는 단계,
b) α-1,2-푸코실락토오스의 생산을 허용하는 조건 하에 배지에서 세포를 배양하는 단계,
c) 선택적으로, 상기 α-1,2-푸코실락토오스를 배양물로부터 분리하는 단계.
19. α-1,2-푸코실락토오스의 생산을 위한 구체예 12 내지 구체예 17 중 어느 한 항에 따른 숙주 세포의 용도.
20. 락토오스 결합 알파-1,2-푸코실트랜스퍼라제 폴리펩티드를 이종적으로(heterologously) 발현하는 미생물로서, 상기 폴리펩티드는
i) 보존 도메인 GY-[F/Y]-Q-[N/S](서열번호 72)를 코딩하는 아미노산 서열 및 보존 도메인(X, K/V 없음) XXXX[I/L]H[I/L]R[R/L]GD[F/Y](X, C/M 없음)(서열번호 74)을 코딩하는 아미노산 서열을 포함하고, 여기서 X는 상기 도메인의 첫 번째 위치에서 라이신 및 발린 잔기를 제외하고 임의의 별개의 아미노산일 수 있고, 상기 도메인의 마지막 위치에서 시스테인 및 메티오닌 잔기를 제외한 임의의 별개의 아미노산일 수 있고 및/또는
ii) 다음으로 구성된 군에서 선택되고:
i) 첨부된 서열 목록의 서열번호 01, 02, 03, 04, 05, 06, 07, 09, 10, 11, 12, 13, 14, 15, 16, 17, 19, 21, 22, 25, 26, 29, 33, 34, 35, 36, 37, 38, 39, 40, 41, 43, 44, 45, 46, 47, 48, 50, 51, 52, 53, 54, 55, 56, 57, 58, 61, 62, 63, 66, 67 또는 76 중 어느 하나, 또는
ii) 첨부된 서열 목록의 서열번호 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 33, 34, 35, 36, 37, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 65, 66, 67, 68, 69, 70, 75, 76, 77, 78 또는 79 중 어느 하나의 전장 아미노산 서열과 80% 이상의 서열 동일성을 갖는 아미노산 서열, 또는
iii) 서열번호 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 65, 66, 67, 68, 69, 70, 75, 76, 77, 78 또는 79 중 어느 하나로 표시되는 아미노산 서열의 대립형질 변이체(allelic variant)의 아미노산 서열 또는
iv) 서열번호 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 65, 66, 68, 69, 70, 75, 76, 77, 78 또는 79 중 어느 하나로 표시되는 아미노산 서열의 오르토로그의 아미노산 서열, 및
v) 서열번호 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 65, 66, 67, 68, 70, 75, 76, 77, 78 또는 79 중 어느 하나로 표시되는 아미노산 서열의 기능적 단편이고,
바람직하게는 상기 폴리펩티드는 글리코실트랜스퍼라제 11(GT11) 패밀리에 속하는 것인 미생물.
21. 알파-1,2-푸코실락토오스의 생산을 위한 구체예 20에 따른 미생물의 용도.
22. 구체예 1 내지 구체예 11, 구체예 18, 구체예 19 또는 구체예 21 중 어느 한 항에 있어서, 상기 알파-1,2-푸코실락토오스를 숙주 세포 또는 그의 성장 배지로부터 분리하는 단계를 더 포함하는 방법.
23. 구체예 1 내지 구체예 11, 구체예 18, 구체예 19, 구체예 21 또는 구체예 22 중 어느 한 항에 있어서, 상기 분리가 정화, 한외여과, 나노여과, 역삼투, 정밀여과, 활성탄 또는 탄소 처리, 접선 유동 고성능 여과, 접선 유동 한외여과, 친화성 크로마토그래피, 이온 교환 크로마토그래피, 소수성 상호작용 크로마토그래피 및/또는 겔 여과, 리간드 교환 크로마토그래피의 단계 중 하나 이상을 포함하는 것인 방법.
24. 구체예 1 내지 구체예 11, 구체예 18, 구체예 19, 구체예 21 내지 구체예 23 중 어느 한 항에 있어서, 알파-1,2-푸코실락토오스의 정제를 더 포함하는 것인 방법.
25. 구체예 24에 있어서, 상기 알파-1,2-푸코실락토오스의 정제가 활성탄 또는 탄소의 사용, 목탄의 사용, 나노여과, 한외여과 또는 이온 교환, 알코올의 사용, 수성 알코올 혼합물의 사용, 결정화, 증발, 침전, 건조, 분무 건조 또는 동결건조의 단계 중 하나 이상을 포함하는 것인 방법.
26. 구체예 1 내지 구체예 11, 구체예 21 내지 구체예 25 중 어느 한 항에 있어서, 폴리펩티드가 진균, 효모, 박테리아, 곤충, 동물 또는 식물 발현 시스템에서 생산되는 것인 방법.
27. 구체예 26에 있어서, 숙주 세포가 박테리아, 바람직하게는 대장균 균주, 보다 바람직하게는 K12 균주인 대장균 균주의 세포이고, 더욱 더 바람직하게는 대장균 K12 균주는 대장균 MG1655인 것인 방법.
28. 구체예 26에 있어서, 숙주 세포가 효모 세포인 방법.
29. 구체예 1 내지 구체예 11, 구체예 18, 구체예 19, 구체예 21 내지 구체예 28 중 어느 한 항에 있어서, 배양 배지 중 락토오스 농도가 50 내지 150g/L의 범위인 것인 방법.
30. 구체예 1 내지 구체예 11, 구체예 18, 구체예 19, 구체예 21 내지 구체예 29 중 어느 한 항에 있어서, 2'-푸코실락토오스의 최종 농도가 70g/L 내지 200g/L 범위인 것인 방법.
31. α-1,2-푸코실락토오스의 생산을 위한 구체예 1 또는 구체예 10의 방법에 기재된 폴리펩티드의 용도.
32. 하기 단계를 포함하는 α-1,2-푸코실락토오스의 생산 방법:
a) α-1,2-푸코실트랜스퍼라제 활성 및 락토오스를 수용체 기질로 사용하는 능력을 갖는 폴리펩티드를 제공하는 단계,
b) 단계 a)의 α-1,2-푸코실트랜스퍼라제 활성을 갖는 폴리펩티드를, 폴리펩티드가 공여체 기질로부터 수용체 기질로 푸코오스 잔기의 전달을 촉매하는 조건 하에 공여체 기질로서 GDP-푸코오스 및 수용체 기질로서 락토오스를 포함하는 혼합물과 접촉시키는 단계로서, 이에 의해 α-1,2-푸코실락토오스를 생성하고,
c) 상기 촉매 작용은 1:5 미만의 diFL 농도 대 2'푸코실락토오스 농도 비율을 초래하는 단계,
d) 선택적으로 상기 α-1,2-푸코실락토오스를 분리하는 단계.
33. 하기 단계를 포함하는 α-1,2-푸코실락토오스의 생산 방법:
a) α-1,2-푸코실트랜스퍼라제 활성 및 락토오스를 수용체 기질로 사용하는 능력을 갖는 폴리펩티드를 제공하는 단계,
b) 단계 a)의 α-1,2-푸코실트랜스퍼라제 활성을 갖는 폴리펩티드를, 폴리펩티드가 공여체 기질로부터 수용체 기질로 푸코오스 잔기의 전달을 촉매하는 조건 하에 공여체 기질로서 GDP-푸코오스 및 수용체 기질로서 락토오스를 포함하는 혼합물과 접촉시키는 단계로서, 이에 의해 α-1,2-푸코실락토오스를 생성하고,
c) 상기 촉매 작용은 80% 이상의 2'푸코실락토오스 순도를 초래하는 단계,
d) 선택적으로 상기 α-1,2-푸코실락토오스를 분리하는 단계.
34. 하기 단계 중 하나 이상을 포함하는 2'-푸코실락토오스의 생산 방법:
i) 초기 반응기 부피의 리터당 50 그램 이상, 보다 바람직하게는 75 그램 이상, 더욱 바람직하게는 100 그램 이상, 더욱 바람직하게는 120 그램 이상, 더욱 바람직하게는 150 그램 이상의 락토오스를 포함하는 락토오스 공급물을 배양 배지에 바람직하게는 연속 방식으로 첨가하는 단계로서, 여기서 총 반응기 부피는 250mL(밀리리터) 내지 10,000m3(입방 미터) 범위이고, 바람직하게는 배양 배지의 최종 부피가 상기 락토오스 공급물의 첨가 전 배양 배지 부피의 3배 이하, 바람직하게는 2배 이하, 보다 바람직하게는 2배 미만이 되도록 한 단계;
ii) 숙주 세포가 1:5 미만의 diFL 농도 대 2'푸코실락토오스 농도 비율로, 2'-푸코실락토오스를 합성할 수 있도록 하는 농로 GDP-푸코오스 공급물을 상기 배양 배지에 바람직하게는 연속 방식으로 첨가하는 단계로서, 바람직하게는 배양 배지의 최종 부피가 상기 GDP-푸코오스 공급물의 첨가 전 배양 배지 부피의 3배 이하, 바람직하게는 2배 이하, 보다 바람직하게는 2배 미만이 되도록 한 단계;
iii) 1:5 미만의 diFL 농도 대 2'푸코실락토오스 농도 비율로, 2'-푸코실락토오스를 합성하기 위한 최적 농도로 숙주 세포가 GDP-푸코오스를 합성할 수 있도록 하는 농도로 탄소계 기질 공급물을 배양 배지에 바람직하게는 연속 방식으로 첨가하는 단계;
iv) 숙주 세포가 2'푸코실락토오스 합성을 위한 최적 농도로 락토오스를 내부적으로 합성할 수 있도록 하는 농도로 탄소계 기질 공급물을 배양 배지에 첨가하는 단계;
v) 1일, 2일, 3일, 4일, 5일에 걸쳐 하나 이상의 공급 용액에 의하여 락토오스 공급물, GDP-푸코오스 공급물 및/또는 탄소계 기질 공급물를 배양 배지에 연속 방식으로 첨가하는 단계;
vi) 공급 용액에 의하여 1일, 2일, 3일, 4일, 5일에 걸쳐 배양 배지에 연속 방식으로 락토오스 공급물을 첨가하는 단계로서, 여기서 상기 락토오스 공급 용액의 농도는 50g/L, 바람직하게는 75g/L, 더 바람직하게는 100g/L, 더 바람직하게는 125g/L, 더 바람직하게는 150g/L, 더 바람직하게는 175g/L, 더 바람직하게는 200g/L, 더 바람직하게는 225g/L, 더 바람직하게는 250g/L, 더 바람직하게는 275g/L, 더 바람직하게는 300g/L, 더 바람직하게는 325g/L, 더 바람직하게는 350g/L, 더 바람직하게는 375g/L, 더 바람직하게는 400g/L, 더 바람직하게는 450g/L, 더 바람직하게는 500g/L, 더욱 더 바람직하게는 550g/L, 가장 바람직하게는 600g/L이고; 바람직하게는 상기 용액의 pH는 3 내지 7로 설정되고 바람직하게는 상기 공급 용액의 온도는 20℃ 내지 80℃로 유지되는 단계;
vii) 상기 방법이 상기 배양 배지의 최종 부피에 있어서 50g/L 이상, 바람직하게는 75g/L 이상, 보다 바람직하게는 적어도 90g/L 이상, 보다 바람직하게는 100g/L 이상, 보다 바람직하게는 125g/L 이상, 보다 바람직하게는 150g/L 이상, 보다 바람직하게는 175g/L 이상, 더욱 바람직하게는 200g/L 이상의 2'-푸코실락토오스 농도를 초래하고 바람직하게는 diFL 농도 대 2'FL 농도 비율 1:5 미만, 보다 바람직하게는 1:20, 더욱 더 바람직하게는 1:40인 것인 단계.
35. 하기 단계 중 하나 이상을 포함하는 2'-푸코실락토오스의 생산 방법:
i) 초기 반응기 부피의 리터당 50 그램 이상, 보다 바람직하게는 75 그램 이상, 더욱 바람직하게는 100 그램 이상, 더욱 바람직하게는 120 그램 이상, 더욱 바람직하게는 150 그램 이상의 락토오스를 포함하는 락토오스 공급물을 배양 배지에 첨가하는 바람직하게는 연속 방식으로 단계로서, 여기서 총 반응기 부피는 250mL(밀리리터) 내지 10,000m3(입방 미터) 범위이고, 바람직하게는 배양 배지의 최종 부피가 상기 락토오스 공급물의 첨가 전 배양 배지 부피의 3배 이하, 바람직하게는 2배 이하, 보다 바람직하게는 2배 미만이 되도록 한 단계;
ii) 숙주 세포가 바람직하게는 연속적인 방식으로, 80% 이상의 순도의 2'-푸코실락토오스 합성할 수 있도록 하는 농도로 GDP-푸코오스 공급물을 배양 배지에 첨가하는 단계로서, 바람직하게는 배양 배지의 최종 부피가 상기 GDP-푸코오스 공급물의 첨가 전 배양 배지 부피의 3배 이하, 바람직하게는 2배 이하, 더욱 바람직하게는 2배 미만인 단계;
iii) 숙주 세포가 80% 이상의 순도의 2'푸코실락토오스 합성을 위한 최적 농도로 GDP-푸코오스를 합성할 수 있도록 하는 농도로 탄소계 기질 공급물을 배양 배지에 바람직하게는 연속 방식으로 첨가하는 단계;
iv) 숙주 세포가 2'푸코실락토오스 합성을 위한 최적 농도로 락토오스를 내부적으로 합성할 수 있도록 하는 농도로 탄소계 기질 공급물을 배양 배지에 첨가하는 단계;
v) 1일, 2일, 3일, 4일, 5일에 걸쳐 하나 이상의 공급 용액에 의하여 락토오스 공급물, GDP-푸코오스 공급물 및/또는 탄소계 기질 공급물를 배양 배지에 연속 방식으로 첨가하는 단계;
vi) 공급 용액에 의하여 1일, 2일, 3일, 4일, 5일에 걸쳐 배양 배지에 연속 방식으로 락토오스 공급물을 첨가하는 단계로서, 여기서 상기 락토오스 공급 용액의 농도는 50g/L, 바람직하게는 75g/L, 더 바람직하게는 100g/L, 더 바람직하게는 125g/L, 더 바람직하게는 150g/L, 더 바람직하게는 175g/L, 더 바람직하게는 200g/L, 더 바람직하게는 225g/L, 더 바람직하게는 250g/L, 더 바람직하게는 275g/L, 더 바람직하게는 300g/L, 더 바람직하게는 325g/L, 더 바람직하게는 350g/L, 더 바람직하게는 375g/L, 더 바람직하게는 400g/L, 더 바람직하게는 450g/L, 더 바람직하게는 500g/L, 더욱 더 바람직하게는 550g/L, 가장 바람직하게는 600g/L이고; 바람직하게는 상기 용액의 pH는 3 내지 7로 설정되고 바람직하게는 상기 공급 용액의 온도는 20℃ 내지 80℃로 유지되는 단계;
vii) 상기 방법이 상기 배양 배지의 최종 부피에 있어서 50g/L 이상, 바람직하게는 75g/L 이상, 보다 바람직하게는 적어도 90g/L 이상, 보다 바람직하게는 100g/L 이상, 보다 바람직하게는 125g/L 이상, 보다 바람직하게는 150g/L 이상, 보다 바람직하게는 175g/L 이상, 더욱 바람직하게는 200g/L 이상의 2'-푸코실락토오스 농도 및 바람직하게는 80% 이상의 2'FL 순도를 초래하는 것인 단계.
하기 도면 및 구체예는 본 발명의 추가적인 예시 및 설명의 역할을 할 것이며 제한하려는 의도가 아니다.
실 시 예
구체예 1: 글리코실 트랜스퍼라제 11 단백질의 확인
HMM은 프로필 은닉 마르코프 모델이라고 불리는 확률 모델이다. 정렬된 단백질 세트를 위치별 스코어링 시스템으로 특성화한다. 아미노산은 발생 빈도에 따라 서열 정렬의 각 위치에 점수가 부여된다(Eddy, SR1998. Profile hidden Markov models. Bioinformatics. 14: 755-63). HMM은 Pfam, InterPro, SMART, TIGRFAM, PIRSF, PANTHER, SFLD, Superfamily 및 Gene3D를 포함하여 단백질 분류에 이 방법을 사용하는 수많은 데이터베이스에서 알 수 있듯이 광범위한 유용성을 가지고 있다. HMMER 패키지(http://hmmer.org/)의 HMMsearch는 이 HMM을 사용하여 서열 상동체에 대한 서열 데이터베이스를 검색할 수 있다. 사용될 수 있는 서열 데이터베이스는 예를 들어 NCBI nr 단백질 데이터베이스(NR; https://www.ncbi.nlm.nih.gov/protein), UniProt 지식베이스(UniProtKB, https://www.uniprot.org/help/uniprotkb) 및 SWISS-PROT 데이터베이스(https://web.expasy.org/docs/swiss-prot_guideline.html)이지만 이에 한정되지 않는다. 글리코실 트랜스퍼라제 11 PF01531 도메인은 'Curation & model'의 https://pfam.xfam.org/search#tabview=tab1을 통해 2018년 9월에 발매된 Pfam v 32.0 데이터베이스에서 얻었다. 이 모델을 사용하여 단백질 데이터베이스에 대한 HMMsearch는 새로운 패밀리 구성원을 식별했다(표 1 참조). EMBOSS Backtranseq(https://www.ebi.ac.uk/Tools/st/emboss_backtranseq/)를 사용하여 얻어진 아미노산 서열을 염기서열로 번역할 수 있다.
표 1: H.pylori(서열번호 71)의 선행 기술 알파 1,2-푸코실트랜스퍼라제 HpFutC와 함께 알파 1,2-푸코실트랜스퍼라제의 목록, 여기서 서열번호 1, 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 14, 15, 16, 17, 19, 21, 22, 25, 26, 29, 33, 34, 35, 36, 37, 38, 39, 40, 41, 43, 44, 45, 46, 47, 48, 50, 51, 52, 53, 54, 55, 56, 57, 58, 61, 62, 63, 66, 67 및 76은 보존 도메인 GY-[F/Y]-Q-[N/S](서열번호: 72) 및 보존 도메인(X, K/V 없음)XXXX[I/L]H[I/L]R[R/L]GD[F/Y](X, C/M 없음)(서열번호 74) 둘다를 가지고, 여기서 X는 상기 도메인의 첫 번째 위치에서 라이신 및 발린 잔기를 제외하고 임의의 별개의 아미노산일 수 있고, 상기 도메인의 마지막 위치에서 시스테인 및 메티오닌 잔기를 제외한 임의의 별개의 아미노산일 수 있음.
서열번호 유기체 원산지
1 아커만시아 뮤시니필라 인간
2 포르피로모나스 카토니아에 알려지지 않음
3 헬리코박터 종 MIT 01-6242 미국
4 카프노사이토파가 카니스 알려지지 않음
5 카프노사이토파가 납베테리 핀란드
6 헬리코박터 종 MIT 01-6242 미국
7 킹겔라 데니트리피칸스 인간
8 슈도알테로모나스 디스팅크타 알려지지 않음
9 포르피로모나스 카토니아에 F0037 알려지지 않음
10 캄필로박터 뮤코살리스 영국
11 페도박터 경힌시스 대한민국
12 노비허바스피릴룸 오토트로피쿰 일본
13 마이크로박테리움 트리코테세놀리티쿰 알려지지 않음
14 칸디다투스 심비오트릭스 디네님파에 일본
15 페도박터 종 스위스
16 크리세오박테리움 종 스위스
17 마이크로박테리움 종 독일
18 라마조티우스 바리에오르나투스 일본
19 칸디다투스 울페박테리아 박테리움 미국
20 칸디다투스 야노프스키박테리아 박테리움 미국
21 스피로카에테스 박테리움 미국
22 페도박터 솔리 대한민국
23 박테리오달레스 박테리움 KHT7 알려지지 않음
24 부티리비브리오 종 TB 알려지지 않음
25 부티리비브리오 피브리솔벤스 알려지지 않음
26 칸디다투스 마가사닉박테리아 박테리움 미국
27 부티리비브리오 피브리솔벤스 알려지지 않음
28 크리세오박테리움 스코프탈뭄 영국
29 아커만시아 종 54_46 알려지지 않음
30 링굴라 웅기스 일본
31 링굴라 웅기스 일본
32 [플렉시박터] 종 ATCC 35103 미국
33 박테리오데테스 박테리움 ADurb.Bin174 미국
34 페도박터 종 AJM 미국
35 칸디다투스 플랑크토필라 라쿠스 스위스
36 리조비알레스 박테리아 PAR1 영국
37 헬리코박터 종 11S02629-2 네덜란드
38 칸디다투스 마가사닉박테리아 박테리움 미국
39 칸디다투스 마가사닉박테리아 박테리움 미국
40 디아미노부티리시모나스 아에릴라타 대한민국
41 플라보박테리움 매그넘 대한민국
42 리토레이박터 폰티 대한민국
43 디스고노모나스 알기나틸리티카 일본
44 캄필로박터 히오인테스티날리스 아종 로소니 미국
45 피시스파에랄레스 박테리움 알려지지 않음
46 아커만시아 종 알려지지 않음
47 헬리코박터 종 MIT 17-337 미국
48 페도박터 종 G11 미국
49 엠페도박터 브레비스 알려지지 않음
50 아커만시아 뮤시니필라 대한민국
51 아커만시아 뮤시니필라 인간
52 아커만시아 뮤시니필라 미국
53 키티노파가세아에 박테리움 영국
54 키티노파가세아에 박테리움 영국
55 프로테오박테리아 박테리움 영국
56 플라비아에스투라리박터 종 17J68-12 대한민국
57 페도박터 종 AR-2-6 노르웨이
58 헬리코박터 자아치 미국
59 헬리코박터 자포니쿠스 미국
60 클렙시엘라 뉴모니아에 알려지지 않음
61 디스고노모나스 카프노사이토파고이데스 미국
62 플라보박테리움 종 영국
63 페도박터 종 영국
64 호에플레아 포코트로피카 독일
65 수브돌리그라눌룸 바리아빌레 덴마크
66 크라소스트레아 기가스 알려지지 않음
67 크라소스트레아 기가스 알려지지 않음
68 미배양 박테리움 미국
69 클로스트리디움 종 CAG:510 알려지지 않음
70 헬롭델라 로부스타 미국
71 헬리코박터 파일로리 호주
75 아커만시아 종 KLEI798 알려지지 않음
76 아커만시아 뮤시니필라 네덜란드
77 카프노사이토파가 긴기발리스 ATCC 33624 알려지지 않음
78 헬리코박터 종 클로-3 미국
79 헬리코박터 종 MIT 17-337 미국
실시예 2: 재료 및 방법 대장균(Escherichia coli)
배지
Luria Broth(LB) 배지는 1% 트립톤 펩톤(Difco, Erembodegem, Belgium), 0.5% 효모 추출물(Difco) 및 0.5% 염화나트륨(VWR, Leuven, Belgium)으로 구성되었다. 성장 실험을 위한 최소 배지는 2.00g/L NH4Cl, 5.00g/L (NH4)2SO4, 2.993g/L KH2PO4, 7.315g/L K2HPO4, 8.372g/L MOPS, 0.5g/L NaCl, 0.5g/L MgSO4.7H2O, 14.26g/L 슈크로스 또는 실시예에 명시된 경우 기타 탄소원, 1ml/L 비타민 용액, 100μl/L 몰리브덴산염 용액, 및 1mL/L 셀레늄 용액을 포함했다. 배지는 1M KOH를 사용하여 pH 7로 설정되었다. 비타민 용액은 3.6g/L FeCl2.4H2O, 5g/L CaCl2.2H2O, 1.3g/L MnCl2.2H2O, 0.38g/L CuCl2.2H2O, 0.5g/L CoCl2.6H2O, 0.94g/L ZnCl2, 0.0311g/L H3BO4, 0.4g/L Na2EDTA.2H2O 및 1.01g/L 티아민.HCl로 구성되었다. 몰리브덴산염 용액은 0.967g/L NaMoO4.2H2O를 함유했다. 셀레늄 용액은 42g/L Seo2를 함유했다.
발효를 위한 최소 배지는 6.75g/L NH4Cl, 1.25g/L (NH4)2SO4, 2.93g/L KH2PO4 및 7.31g/L KH2PO4, 0.5g/L NaCl, 0.5g/L MgSO4.7H2O, 14.26g/L 슈크로오스, 1mL/L 비타민 용액, 100μL/L 몰리브덴산염 용액, 및 1mL/L 셀레늄 용액을 위에서 설명한 것과 동일한 조성으로 을 함유했다. 복합 배지는 오토클레이브(121℃, 21')으로 멸균하고 최소 배지는 여과(0.22μm Sartorius)로 멸균했다. 필요한 경우, 배지는 항생제(예: 클로람페니콜(20mg/L), 카르베니실린(100mg/L), 스펙티노마이신(40mg/L) 및/또는 카나마이신(50mg/L))를 첨가하여 선택적으로 만들었다.
플라스미드
pKD46(Red 헬퍼 플라스미드, 암피실린 저항성), pKD3(FRT-flanked 클로람페니콜 저항성(cat) 유전자 함유), pKD4(FRT-flanked 카나마이신 저항성(kan) 유전자 함유), 및 pCP20(FLP 재조합 효소 활성 발현) 플라스미드들을 R.Cunin 교수(Vrije Universiteit Brussel, Belgium in 2007)로부터 얻었다.
플라스미드는 Invitrogen에서 구입한 숙주 E. coli DH5알파(F-, phi80d/acZ△M15, △(lacZYA-argF) U169, deoR, recA1, endA1, hsdR17(rk-, mk+), phoA, supE44, lambda-, thi-1, gyrA96, relA1) 내에 유지했다.
균주 및 돌연변이
E. coli K12 MG1655 [lambda-, F-, rph-1]는 2007년 3월에 Coli Genetic Stock Center(미국), CGSC Strain#: 7740에서 입수했다. 유전자 파괴, 유전자 도입 및 유전자 교체는 Datsenko 및 Wanner에 의해 공개된 기술을 사용하여 수행되었다(PNAS 97(2000), 6640-6645). 이 기술은 람다 레드 재조합 효소에 의해 수행된 상동 재조합 후 항생제 선택을 기반으로 한다. 플립파제 재조합 효소의 후속 촉매작용은 최종 생산 균주에서 항생제 선택 카세트의 제거를 보장한다.
레드 헬퍼 플라스미드 pKD46을 운반하는 형질전환체를 30℃에서 암피실린(100mg/L) 및 L-아라비노스(10mM)가 포함된 10mL LB 배지에서 OD600nm이 0.6이 되도록 성장시켰다. 세포를 처음에는 50mL의 빙냉수로 세척하고 두 번째로는 1mL의 얼음 빙냉수로 세척하여 세포를 전기 적격 상태(electrocompetent)로 만들었다. 그런 다음, 세포를 50 μL의 빙냉수에 재현탁했다. Gene Pulser™(BioRad)(600Ω, 25μFD 및 250볼트)를 사용하여 50μL의 세포와 10-100ng의 선형 이중 가닥 DNA 생성물로 전기천공을 수행했다.
전기천공 후, 세포를 37℃에서 1시간 인큐베이트된 1ml LB 배지에 첨가하고, 최종적으로 25mg/L의 클로람페니콜 또는 50mg/L의 카나마이신을 함유하는 LB-한천에 펼쳐서 항생제 내성 형질전환체를 선택하였다. 선택된 돌연변이체는 변형된 영역의 상류 및 하류 프라이머를 사용하여 PCR에 의해 확인하고 헬퍼 플라스미드의 손실을 위해 42℃에서 LB-한천에서 성장시켰다. 돌연변이체는 암피실린 감수성에 대해 테스트되었다.
선형 ds-DNA 앰플리콘은 pKD3, pKD4 및 이들의 유도체를 주형으로 사용하여 PCR에 의해 얻었다. 사용된 프라이머는 주형에 상보적인 서열의 일부와 재조합이 일어나야 하는 염색체 DNA 상의 측면에 상보적인 다른 부분을 가졌다. 게놈 녹아웃을 위해, 상동성 영역은 관심 유전자의 시작 및 종료 코돈의 50-nt 상류 및 50-nt 하류로 설계되었다. 게놈 녹-인(knock-in)의 경우 전사 시작점(+1)이 존중되어야 했다. PCR 생성물을 PCR 정제하고 Dpnl로 분해하고 아가로스 겔에서 재정제하고 용출 완충액(5mM Tris, pH 8.0)에 현탁시켰다.
선택된 돌연변이체(클로람페니콜 또는 카나마이신 내성)는 FLP 합성의 온도 민감성 복제 및 열 유도를 나타내는 암피실린 및 클로람페니콜 내성 플라스미드인 pCP20 플라스미드로 형질전환되었다. 암피실린 내성 형질전환체는 30℃에서 선택되었으며, 그 후 일부는 42℃에서 LB에서 콜로니 정제된 다음 모든 항생제 내성 및 FLP 헬퍼 플라스미드의 손실에 대해 테스트되었다. 유전자 녹아웃 및 녹인은 대조군 프라이머(Fw/Rv-gene-out)로 확인한다.
2'FL 생산을 위해 E. coli K12 MG1655에서 파생된 돌연변이 균주는 lacZ, lacY, lacA, glgC, agp, pfkA, pfkB, pgi, arcA, iclR, wcaJ, pgi, lonthyA 유전자의 녹아웃과 E. coli lacY 유전자, Zymomonas mobilis에서 유래한 fructose kinase 유전자(frk) 및 Bifidobacterium adolescentis에서 유래한 수크로스 포스포릴라제(SP)를 함유하는 구성적 발현 구조의 추가적 게놈 녹인(knock-in)을 가지고 있다. 이러한 유전적 변형은 WO2016075243 및 WO2012007481에도 기술되어 있다. E. coli 유전자 manA, manB, manC, gmd 및 fcl에 대한 구성적 전사 단위의 게놈 녹인을 포함하여 GDP-푸코오스 생산을 추가로 최적화할 수 있다. GDP-푸코오스 생산은 또한 E. coli fucK 및 fucI 유전자의 게놈 녹아웃과 E. coli로부터의 푸코오스 투과효소(fucP) 및 Bacteroides fragilis로부터의 이기능성 푸코오스 키나제/푸코오스-1-포스페이트 구아닐릴트랜스퍼라제(fkp)를 함유하는 구성적 전사 단위의 게놈 녹인에 의해 수득할 수 있다. 또한, 서열번호 1, 2, 3, 4, 5 또는 71에 대한 구성적 전사 단위를 갖는 알파-1,2-푸코실트랜스퍼라제 발현 플라스미드가 균주에 첨가된다.
모든 구성적 프로모터와 UTR은 De Mey et al. (BMC Biotechnology, 2007) 및 Mutalik et al. (Nat. Methods 2013, No. 10, 354-360)로부터 유래한다. 모든 유전자는 Twist Bioscience(twistbioscience.com) 또는 IDT(eu.idtdna.com)에서 합성 주문되었으며 코돈 사용은 공급자의 도구를 사용하여 조정되었다.
모든 균주는 -80℃에서 저온유리병에 저장된다(70% 글리세롤과 1:1 비율로 혼합되어 밤새 LB 배양).
재배 조건
96웰 마이크로타이터 플레이트 실험의 전배양은 150 μL LB의 저온유리병에서 시작되었고 800 rpm의 오비탈 진탕기에서 37 ℃로 밤새 인큐베이션하였다. 이 배양액은 400x를 희석하여 400μL 최소 배지와 함께 96웰 사각형 미세역가 플레이트의 접종물로서 사용되었다. 이 최종 96-웰 배양 플레이트를 72시간 또는 그 이하 또는 이상 동안 800rpm으로 오비탈 진탕기에서 37℃로 인큐베이션했다. 배양 실험이 끝나면 각 웰에서 샘플을 채취하여 브로쓰 상등액의 당 농도(세포 외 당 농도, 세포 회전 후)를 측정하거나 세포를 회전시키기 전에 배양 브로스를 90℃에서 15분 동안 끓여서 측정했다. 세포(= 전체 브로스 측정, 세포내 및 세포외 당 농도의 평균).
생물반응기의 전배양(preculture)은 특정 균주의 전체 1mL 저온유리병에서 시작되었으며 1L 또는 2.5L 쉐이크 플라스크 내 250mL 또는 500mL 최소 배지에 접종하고 오비탈 진탕기에서 200rpm으로 37℃에서 24시간 동안 배양되었다. 이어서, 5L 생물반응기에 접종하고(2L 배치 배지 중 250mL 접종물); 공정은 MFCS 제어 소프트웨어(Sartorius Stedim Biotech, Melsungen, Germany)에 의해 제어되었다. 배양 조건은 37℃로 설정하고, 최대 교반; 압력 가스 유속은 균주 및 생물 반응기에 따라 다르다. 0.5M H2SO4 및 20% NH4OH를 사용하여 pH를 6.8로 제어하였다. 배기 가스를 냉각시켰다. 발효 중 기포가 발생하면 실리콘 소포제 10% 용액을 첨가하였다.
광학 밀도
배양물의 세포 밀도는 600 nm에서 광학 밀도를 측정함으로써 자주 모니터링하였다(Implen Nanophotometer NP80, Westburg, Belgium 또는 Spark 10M microplate reader, Tecan, Switzerland).
성장률/속도 측정
최대 성장 속도(μMax)는 R 패키지 그로핏을 사용하여 600nm에서 관찰된 광학 밀도를 기반으로 계산하였다.
액체 크로마토그래피
2'푸코실락토오스 및 디푸코실락토오스에 대한 표준은 사내에서 합성되었다. 락토오스, 수크로스, 글루코스, 프룩토스, 푸코오스와 같은(이에 국한되지 않음) 다른 표준은 Sigma에서 구입했다.
탄수화물은 HPLC-RI(Waters, USA) 방법으로 분석하였으며, RI(Refractive Index)는 시료를 담았을 때 이동상의 굴절률 변화를 감지하였다. X-Bridge 컬럼(Waters X-bridge HPLC 컬럼, USA)과 75ml 아세토니트릴 및 25ml 초순수 및 0.15ml 트리에틸아민을 함유하는 이동상을 사용하여 등용매 흐름에서 당을 분리하였다. 컬럼 크기는 4.6 x 150mm이고 입자 크기는 3.5μm이다. 컬럼의 온도는 35℃로 설정되었고 펌프 유속은 1mL/분이었다.
실시예 3: 재료 및 방법 Saccharomyces cerevisiae
배지
균주는 완전 보충 혼합물(SD CSM) 또는 아미노산이 없는 6.7g/L 효모 질소 염기(YNB w/o AA, Difco), 20g/L 한천(Difco)(고체 배양), 22g/L 포도당 일수화물 또는 20g/L 락토오스 및 0.79g/L CSM 또는 0.77g/L CSM-Ura(MP Biomedicals)을 포함하는 CSM 드롭아웃(SD CSM-Ura)이 있는 합성 정의 효모 배지에서 성장시킨다.
균주
Brachmann et al.에 의해 생성된 Saccharomyces cerevisiae BY4742. (Yeast (1998) 14:115-32)는 Euroscarf 배양 컬렉션에서 입수가능한 것을 사용하였다. 모든 돌연변이 균주는 Gietz 방법(Yeast 11:355-360, 1995)을 사용하여 상동 재조합 또는 플라스미드 형질전환에 의해 생성되었다. Kluyveromyces marxianus lactis는 LMG 배양 컬렉션(Ghent, Belgium)에서 구할 수 있다.
플라스미드
효모 발현 플라스미드 p2a_2μ(Chan 2013(Plasmid 70 (2013) 2-17))는 Saccharomyces cerevisiae에서 외래 유전자의 발현을 위해 사용되었다. 이 플라스미드는 암피실린 내성 유전자와 E. coli에서 선택 및 유지를 허용하는 박테리아 복제 기점을 포함한다. 플라스미드에는 2μ 효모 ori와 효모의 선택 및 유지 관리를 위한 Ura3 선택 마커가 추가로 포함되어 있다. 다음으로, 이 플라스미드는 락토오스 투과효소(예: Kluyveromyces lactis의 LAC12), GDP-만노스 4,6-탈수효소(예: E. coli의 Gmd) 및 GDP-L-푸코오스 합성효소(예: E. coli의 fcl)을 함유하는 p2a_2μ_fl으로 변형할 수 있다.
효모 발현 플라스미드 p2a_2μ_fl_2ft는 p2a_2μ_fl에 기초하지만 서열번호 1, 2, 3, 4, 5, 6, 7, 9 또는 71도 발현되는 방식으로 변형되었다. 바람직하지만 필수적인 것은 아닌 것으로, 푸코실트랜스퍼라제 단백질은 푸코실트랜스퍼라제 효소의 용해도를 향상시키기 위해 SUMOstar 태그(예를 들어, pYSUMOstar, Life Sensors, Malvern, PA로부터 입수)에 N-말단 융합된다.
플라스미드는 Invitrogen에서 구입한 숙주 E. coli DH5alpha(F-, phi80dlacZdeltaM15, delta(lacZYA-argF)U169, deoR, recA1, endA1, hsdR17(rk-, mk+), phoA, supE44, lambda-, thi-1, gyrA96, relA1) 내에 유지되었다.
유전자 발현 프로모터
유전자는 Blazeck(Biotechnology and Bioengineering, Vol. 109, No. 11, 2012)에 기재된 바와 같이 합성의 구성적 프로모터를 사용하여 발현된다.
이종 및 상동 발현
플라스미드든 게놈이든 발현되어야 하는 유전자는 Twist Biosciences(미국 샌프란시스코)에 의해 합성되었다. 발현 숙주의 코돈 사용에 대한 코돈 사용을 최적화함으로써 발현이 더욱 촉진될 수 있다. 유전자는 공급자의 도구를 사용하여 최적화되었다.
재배 조건
일반적으로, 효모 균주는 초기에 SD CSM 플레이트에서 성장하여 단일 콜로니를 얻었다. 이 플레이트는 30℃에서 2-3일 동안 성장되었다.
단일 콜로니에서 시작하여 전배양물을 200rpm에서 진탕하면서 30℃로 5mL내에서 밤새 성장시켰다. 후속 125mL 진탕 플라스크 실험에 25mL 배지에서 이 전배양물의 2%를 접종했다. 이 진탕 플라스크를 200rpm의 오비탈 진탕으로 30℃에서 인큐베이션했다. 모든 유전자가 구성적으로 발현되기 때문에 인듀서의 사용은 요구되지 않는다.
실시예 4: E. coli에 통합된 잠재적인 락토오스-결합 알파-1,2-푸코실트랜스퍼라제 효소의 평가
실시예 1에서 확인된 서열번호 1, 2, 3, 4 및 5의 알파-1,2-푸코실트랜스퍼라제 효소를 돌연변이 E. coli 균주에서 GDP-푸코오스 및 락토오스로부터 2-푸코실락토오스(2'FL)를 생산하는 것으로 평가하였다. 프로모터-UTR 조합 P12U2(De Mey et al., BMC Biotechnology, 2007)로 구축된 전사 단위로부터 상기 알파-1,2-푸코실트랜스퍼라제를 발현하는 돌연변이 균주를 실시예 2에 제공된 배양 조건에 따른 성장 실험에서 분석하였다. 각각의 돌연변이 E. coli 균주를 96-웰 플레이트의 다중 웰에서 성장시켰다. 도 1(상단 패널)은 최소배지 중 20g/L 락토오스의 동일한 전사 단위에서 다양한 알파-1,2-푸코실트랜스퍼라제를 성공적으로 발현하는 균주의 성장 실험에서 얻은 2'FL의 정규화된 생산(상대 백분율로 g 생산물/g 바이오매스)을 보여준다. 모든 데이터 포인트는 동일한 P12U2 프로모터-UTR 조합을 갖는 전사 단위로부터 서열번호 71을 갖는 선행 기술 알파-1,2-푸코실트랜스퍼라제 HpFutC를 발현하는 참조 균주로 얻은 2'FL 생산으로 정규화되었으며, 이는 수평 파선으로 표시된다. 실험은 새로 확인된 모든 폴리펩티드가 락토오스 결합 2-푸코실트랜스퍼라제 활성을 갖는 것을 확인했다. 놀랍게도, 서열번호 1, 2 및 4를 갖는 폴리펩티드는 시험된 이러한 조건에서 서열번호 71을 갖는 선행 기술의 알파-1,2-푸코실트랜스퍼라제 HpFutC보다 더 나은 락토오스 결합 2-푸코실트랜스퍼라제 활성을 갖는 것으로 확인되었다. 실험은 또한 서열 1, 3, 4 및 5를 갖는 폴리펩티드가 서열 71을 갖는 선행 기술 효소와 달리 diFL을 생성하지 않는다는 것을 입증하였다. 서열번호 2를 갖는 폴리펩티드는 diFL을 생산했지만 이 diFL 생산은 서열번호 71을 갖는 선행 기술 HpFutC 효소로 측정된 diFL 생산과 비교하여 매우 최소였다(도 1, 하부 패널). 서열번호 2의 폴리펩티드를 발현하는 균주에서 측정된, diFL 농도 대 2'FL 농도비는 1:40이었다.
실험은 또한 서열번호 1 또는 4를 갖는 폴리펩티드를 발현하는 돌연변이 균주에서 2'FL의 더 높은 생산이, 서열번호 71을 갖는 선행 기술의 알파-1,2-푸코실트랜스퍼라제 HpFutC를 발현하는 참조 균주와 비교할 때 이들 균주의 성장 속도에 영향을 미치지 않는다는 것을 보여주었다(도 2).
실시예 5: 다양한 락토오스 농도에서 시험했을 때 락토오스 결합 알파-1,2-푸코실트랜스퍼라제 효소를 발현하는 E,coli 균주의 평가
다음 실험에서, P12U2 프로모터-UTR 조합으로 구축된 전사 단위로부터 서열번호 3의 알파-1,2-푸코실트랜스퍼라제 효소를 발현하는 돌연변이 E.coli 균주(De Mey et al., BMC Biotechnology, 2007)에 대해 실시예 4에 기재된 바와 같이 저농도 내지 고농도의 락토오스를 함유하는 최소 배지에서 2'FL 및 diFL 생산성을 평가하였다. 실시예 2에 기재된 배양 조건에 따라 생육 실험을 수행하였다. 각 조건에 대해 돌연변이 E. coli 균주를 96-웰 플레이트의 다중 웰에서 성장시켰다.
도 3은 이 실험에서 얻은 2'FL 역가(g/L)를 보여준다. 이 도면은 서열번호 3을 갖는 폴리펩티드가, 시험된 모든 조건에서 락토오스 결합 2-푸코실트랜스퍼라제 활성을 갖고 또한 다양한 락토오스 농도로부터 2'FL을 생성할 수 있음을 입증한다. 시험된 모든 조건에서 균주는 diFL을 생성하지 않았다(결과는 표시되지 않음).
실시예 6: 상이한 전사 단위로부터 락토오스 결합 알파-1,2-푸코실트랜스퍼라제 효소를 발현하는 E.coli 균주의 평가
다음 실험에서, 이전 실시예에서 사용된 것과 비교하여 다른 전사 단위(TU)로부터 서열번호 3을 갖는 알파-1,2-푸코실트랜스퍼라제 폴리펩티드를 발현하는 여러 돌연변이 E. coli 균주가 2'FL 및 diFL 생산성에 대해 평가되었다. 사용된 전사 단위는 De Mey et al. (BMC Biotechnology, 2007)에 기재된 바와 같이 각각 프로모터-UTR 조합 P05U14 (TU 01), P05U38 (TU 02), P10U13 (TU 03) and P31U17 (TU 04)으로 구성되었다. 실시예 2에 기재된 배양 조건에 따라 생육 실험을 수행하였다. 각각의 돌연변이 E. coli 균주를 96-웰 플레이트의 다중 웰에서 성장시켰다.
도 4는 정규화된 2'FL 생산(g 생성물/g 바이오매스) 및 이 실험에서 얻은 상대 백분율에서의 성장 속도를 보여준다. 각 균주에 대해, 따라서 시험된 각 전사 단위에 대해, 2'FL 생산 또는 성장 속도에 대한 데이터 포인트는 동일한 전사 단위로부터의 서열번호 71의 선행기술 알파-1,2-푸코실트랜스퍼라제 HpFutC를 발현하는 참조 균주로부터 각각 수득된 2'FL 생산 또는 성장 속도에 대해 정규화되었다(가로 파선으로 표시). 이 실험은 모든 시험 조건에서 균주들이 전부 diFL 생산 없이 2'FL을 생산한 것을 보여주었다. 또한 사용되는 전사 단위에 따라 돌연변이 균주에서 2'FL 생산을 증가시킬 수 있지만 균주의 성장 속도에 미치는 영향은 제한적이다. 서열번호 3을 갖는 폴리펩티드를 발현하기 위한 돌연변이 균주에 있어서 여기에서 사용된 4개의 전사 단위는 또한 실시예 4에서 사용된 바와 같이 P12U2로 구축된 전사 단위를 사용할 때와 비교하여 상기 폴리펩티드의 더 높은 발현을 초래하여 더 많은 2'FL 생산을 유도한다.
실시예 7: 락토오스-결합 알파-1,2-푸코실트랜스퍼라제 효소의 조합을 발현하는 E.coli 균주로의 2'푸코실락토오스의 생산
또 다른 실험에서, 서열번호 1, 2, 3, 4, 5, 6, 7 또는 9를 갖는 2개 이상의 알파-1,2-푸코실트랜스퍼라제 폴리펩티드의 조합을 발현하는 여러 돌연변이 E. coli 균주에 대해 2 'FL 및 diFL 생산성을 평가하였다. 실시예 2에 기재된 배양 조건에 따라 생육 실험을 수행하였다. 각각의 돌연변이 E. coli 균주를 96-웰 플레이트의 다중 웰에서 성장시켰다. 실험은 적어도 2개의 알파-1,2-푸코실트랜스퍼라제 폴리펩티드의 조합을 발현하는 단일 균주가 2'FL을 생성할 수 있고 균주당 단일 폴리펩티드만 발현될 때보다 더 높은 농도로 생성할 수 있음을 보여주었다.
실시예 8: 다양한 락토오스 결합 알파-1,2-푸코실트랜스퍼라제 효소를 이용한 사카로마이세스 세레비지애에서 2'푸코실락토오스의 생산
또다른 실시예는 본 발명을 위한 사카로마이세스 세레비지애 형태로 진핵 유기체의 용도를 제공한다. 실시예 3에 기술된 균주, 플라스미드 및 방법을 사용하여 서열번호 1, 2, 3, 4, 5, 6, 7, 9 또는 71을 발현하는 균주를 생성한다. 나아가 2'푸코실락토오스를 생산하기 위해 추가 변형이 이루어진다. 이러한 변형은 락토오스 투과효소, GDP-만노스 4,6-탈수효소 및 GDP-L-푸코오스 합성효소의 추가를 포함한다. 바람직한 락토오스 투과효소는 클루이베로마이세스 락티스(Kluyveromyces lactis)로부터의 KlLAC12 유전자이다(WO 2016/075243). 바람직한 GDP-만노스 4,6-탈수효소 및 GDP-L-푸코오스 합성효소는 각각 E.coli의 gmd 및 fcl이다.
이들 균주는 탄소원으로서 글루코스 또는 글리세롤 상에서 성장할 수 있고, 탄소원을 GDP-L-푸코오스로 전환시키고, 락토오스를 흡수하고, 참조로서 서열번호 71과 함께 서열번호 1, 2, 3, 4, 5, 6, 7, 9 및 71서열에 의해 나타내어지는 효소에 대한 기질로서 GDP-L-푸코오스 및 락토오스를 사용하여 2'푸코실락토오스를 생산할 수 있다. 상기 균주의 사전 배양은 22g/L 글루코스를 함유하는 합성 정의 배지 SD-CSM의 5mL에서 이루어지고 실시예 3에 기술된 바와 같이 30℃에서 성장된다. 이러한 전배양물은 유일한 탄소원으로 10g/L 자당이 있는 진탕 플라스크의 25mL 배지에 접종되고 30℃에서 성장한다. 정규적인 샘플을 채취하고 실시예 2에 기재된 바와 같이 2'푸코실락토오스 및 디-푸코실락토오스의 생산을 측정한다.
실시예 9: 회분식 발효에서 다양한 락토오스 결합 알파-1,2-푸코실트랜스퍼라제 효소를 발현하는 E. coli 균주의 평가
실시예 2에 기술된 바와 같이 돌연변이 E. coli K12 MG1655 균주 배경으로부터 유래된 균주를 평가하기 위해 생물반응기 규모에서의 배치 발효를 수행하였고, 참조로서 서열번호 71을 갖는 서열번호 1, 2, 3, 4, 5, 6, 7, 9 또는 71를 갖는 알파-1,2-푸코실트랜스퍼라제 효소를 발현하였다. 생물반응기 가동은 실시예 2에 기재된 바와 같이 수행하였다. 이들 예에서 자당은 탄소원으로 사용되었다. 2'FL 형성을 위한 전구체로서 락토오스를 90g/L로 배치 배지에 첨가하였다. 정규적인 샘플을 채취하고 실시예 2에 기재된 바와 같이 2'푸코실락토오스 및 디-푸코실락토오스의 생산을 측정한다.
실시예 10: 상이한 락토오스 농도로 2'푸코실락토오스 생산
실시예 2에 기재된 바와 같은 발효 과정을 수행하였으며, 여기서 배양 배지 중 락토오스 농도는 50 내지 150g/L 범위였다. 상기 락토오스은 소량의 락토오스가 남을 때까지 공정 동안 2'푸코실락토오스로 전환된다. 2'푸코실락토오스에 대한 최종 비율의 락토오스는 이 공정 동안 더 일찍(2'푸코실락토오스에 대한 더 높은 락토오스 비율) 또는 더 나중에(2'푸코실락토오스에 대한 더 낮은 락토오스 비율) 프로세스를 중지하여 조작할 수 있다. 다른 탄소 공급원이 있거나 없는 고농도의 락토오스 용액을 생물반응기에 공급함으로써 용기에서 락토오스 농도를 증가시킬 수 있다. 상기 락토오스 공급물은 100 내지 700g/L의 락토오스 농도를 함유하고, 낙농 산업에서 사용되는 표준 방법인, 공정 동안 락토오스의 형성을 피하기 위해 락토오스가 pH 6 이하에서 용해되도록 하는 온도에서 유지된다. 이러한 생산 공정에서 도달된 2'푸코실락토오스의 최종 농도는 더 낮은 락토오스 농도가 사용될 때의 70g/L 내지 높은 락토오스 농도가 전술한 바와 같은 공정에서 사용될 때의 200g/L 이상 범위이다. 이러한 유가식 발효 공정에서 얻을 수 있는 2'FL 역가는 진탕 플라스크 또는 멀티웰 플레이트에서의 회분식 성장 실험에 비해 훨씬 더 높다. 잘 제어된 생물반응기에서 추가 탄소원은 유가식(fed-batch) 동안 지속적으로 추가되며 훨씬 더 높은 바이오매스 농도를 얻을 수 있다(멀티웰 플레이트 배치 실험에 비해 더 나은 통기 및 더 적은 산성화). 서열번호 1 또는 2로부터 2'FL을 생산하는 균주를 사용하여 이러한 과정에서 얻은 최종 디푸코실락토오스 농도 대 2'FL 농도 비율은 각각 예를 들어 0 또는 1:55이며, 이는 서열번호 71로부터 2'FL을 생산하는 참조 균주와 유사한 공정에서 얻은 0g/L에 가까운 락토오스 농도에서 1:6(0,164의 비율)의 diFL 대 2'FL 비율보다 훨씬 더 작다. 이 참조 균주의 경우 비율은 다양한 잔류 락토오스 농도에서 측정되었으며 이 균주는 3g/L 잔류 락토오스에서 1:8, 5g/L 잔류 락토오스에서 1:9, 8g/L 잔여 락토오스에서 1:11, 14g/L 잔여 락토오스에서 1:12 및 21g/L 잔여 락토오스에서 1:22의 diFL 대 2'FL 비율에 도달한다. 생성된 2'FL 순도 범위는 76%와 86% 사이이며, 여기서 diFL은 각각 나머지 24%에서 14%의 상당한 부분을 형성한다. 서열번호 1 또는 2에 대한 2FL, diFL 및 락토오스 농도의 합에서, 얻은 2'푸코실락토오스의 순도는 80% 내지 99.9% 범위였으며 나머지 탄수화물(20% 내지 1%)은 주로 락토오스이었고, 이는 락토오스의 불완전한 전환의 결과이다.
실시예 11: 2'푸코실락토오스의 효소적 생산
또다른 실시예는 본 발명의 서열번호 1 및 2를 갖는 효소의 용도를 제공한다. 이들 효소는 PURExpress 시스템(NEB)(이에 국한되지 않음)과 같은 무세포 발현 시스템에서, 또는 E. coli 또는 Saccharomyces cerevisiae(이에 국한되지 않음)와 같은 숙주 유기체에서 생산되며, 그 후 위에 나열된 효소가 분리되고 선택적으로는 더욱 정제될 수 있다.
상기 효소 추출물 또는 정제된 효소 각각은 GDP-푸코오스 및 Tris-HCl 또는 HEPES과 같은 완충 성분 및 락토오스 또는 2'FL과 함께 반응 혼합물에 첨가된다. 그런 다음, 상기 반응 혼합물을 특정 온도(예: 37℃)에서 특정 시간(예: 24시간) 동안 인큐베이션하고, 그 동안 락토오스 또는 2'FL은 GDP-푸코오스를 사용하는 효소에 의해 2'푸코실락토오스 및 디푸코실락토오스 각각으로 전환되는데, 후자의 반응은 2-푸코실트랜스퍼라제가 2'FL에 대해 부활성을 가질 때에만 가능하다. 이어서, 2'푸코실락토오스 및 디-푸코실락토오스를 당업계에 공지된 방법에 의해 반응 혼합물로부터 분리된다. 원하는 경우 2'FL 및/또는 diFL의 추가 정제를 수행할 수 있다. 반응 종료 시 또는 분리 및/또는 정제 후, 실시예 2에 기재된 바와 같이 2'푸코실락토오스 및 디-푸코실락토오스의 생성을 측정하였다.
실시예 12: 생물반응기에서 2'푸코실락토오스 생산
실시예 2에 기재된 바와 같은 유가식 발효 공정을 수행하였으며, 여기서 배양 배지의 락토오스 농도는 120g/L로 설정하였다. 서열번호 1, 3, 4 또는 71을 갖는 알파-1,2-푸코실트랜스퍼라제 효소를 갖는 발현 플라스미드를 함유하고, 실시예 2에 기재된 바와 같이, 상이한 2'푸코실락토오스 생산 균주로 동일한 공정을 수행하였다. 상기 락토오스는 소량의 락토오스가 남을 때까지 공정 동안 2'푸코실락토오스로 전환된다. 2'푸코실락토오스에 대한 최종 비율의 락토오스는 이 공정 동안 더 일찍(2'푸코실락토오스에 대한 더 높은 락토오스 비율) 또는 더 나중에(2'푸코실락토오스에 대한 더 낮은 락토오스 비율) 공정을 중지하여 조작할 수 있다. 또한 최종 비율 diFL 대 2'푸코실락토오스는 2'FL을 생성하는 1,2-푸코실트랜스퍼라제 효소를 발현하는 균주에 대해 유사하게 조작할 수 있으며, 이 공정을 더 일찍(더 낮은 diFL 대 2'푸코실락토오스 비율) 또는 더 나중에 중단함으로써 diFL을 형성하는 부작용을 가질 수 있다(더 높은 diFL 대 2'푸코실락토오스 비율).
도 6은 이들 발효 동안 락토오스가 2'푸코실락토오스 및 diFL로 전환되는 것을 보여준다. x축은 발효 시작(100% 락토오스 존재)부터 종료(락토오스가 더 이상 검출되지 않거나 거의 검출되지 않을 때)동안의 다양한 시점을 나타낸다. y축은 발효 브로스에 존재하는 락토오스, 2'FL 및 diFL의 백분율을 나타내며, 각각의 당을 3개의 당의 합으로 나누어 결정한다. 서열번호 1, 3 또는 4의 균주를 사용한 발효의 마지막에 매우 높은 2'FL 순도(거의 100%)에 도달할 수 있었다. 락토오스가 완전히 고갈된 경우에도 더 이상 락토오스가 검출되지 않았고 diFL이 형성되지 않았다. 이에 대조적으로, 서열번호 71을 포함하는 균주를 사용한 유사한 발효에서는 발효 종료시에 소량의 락토오스가 남아 있었다. 동시에 락토오스 농도가 5% 미만으로 떨어지면 발효 브로스에 diFL이 나타나기 시작했다(이 실시예에서는 총 당 농도의 최대 19%).
따라서 서열번호 71을 갖는 효소와 비교하여 서열번호 1, 3 또는 4를 갖는 알파-1,2-푸코실트랜스퍼라제 효소를 사용하여 훨씬 더 높은 2'푸코실락토오스 순도를 얻을 수 있음이 명백하다.
실시예 13: 2'푸코실락토오스 및 디-푸코실락토오스의 효소적 생산
또다른 실시예는 본 발명의 서열번호 1, 2, 3, 4 또는 71을 갖는 효소의 용도를 제공한다. 이 효소는 E. coli에서 생성된 후 세포를 수확하고 초음파 처리를 사용하여 Tris-HCl 완충액에서 용해한다. 가용성 단백질 분획은 세포 파편에서 분리되어 하류의 효소 반응에 사용된다. 상기 효소 추출물 각각은 공여체 기질로서 GDP-L-푸코오스(5mM), 완충 성분(Tris-HCl) 및 수용체 기질로서 락토오스 또는 2'FL(5mM)과 함께 반응 혼합물에 첨가된다. 공여체 기질과 수용체 기질은 둘다 생리학적으로 가능한 것보다 더 높은 농도로 과도하게 존재한다. 이어서, 상기 반응 혼합물을 37℃에서 24시간 동안 인큐베이션한다. 이어서, 락토오스, 2'푸코실락토오스 및 디-푸코실락토오스를 분리하고 실시예 2에 기재된 바와 같이 액체 크로마토그래피를 사용하여 검출하였다.
실험은 락토오스를 기질로 사용하는 경우 서열번호 71의 효소(HpFutC)는 2'FL과 diFL을 모두 생성할 수 있는 반면 서열번호 1, 2, 3 및 4의 효소는 2'FL만 생성하고 diFL은 생성할 수 없었다. 유사하게, 2'FL을 기질로 사용하여, 서열번호 71을 갖는 효소(HpFutC)만이 diFL을 생성할 수 있는 반면, 서열번호 1, 2, 3 및 4를 갖는 효소에 대해서는 2'FL에서 diFL로의 더 이상의 전환이 관찰되지 않았다. 따라서, 서열번호 71을 갖는 효소(HpFutC)는 부산물로서 diFL을 생성한 반면, 다른 시험된 효소는 그렇지 않았다(또는 적어도 검출 한계 미만으로 훨씬 더 적은 정도). HpFutC가 있는 균주의 경우, 생체 내에서 생성된 diFL 대 2'FL 비율은 GDP-L-푸코오스 공여체 공급을 제한함으로써 낮게 유지될 수 있었지만, 이 낮은 GDP-푸코오스 공여체 공급은 동시에 2'FL 생산성을 제한했다. 서열번호 1, 2, 3 또는 4의 효소를 포함하는 균주의 경우 공급된 생체내 GDP-L-푸코오스 농도는 diFL 대 2'FL 비율과 관련이 없었으므로 훨씬 더 높은 2'FL 생산성이 달성될 수 있었다.
SEQUENCE LISTING <110> Inbiose N.V. <120> Lactose converting alpha-1,2-fucosyltransferase enzymes <130> 009-PCT <150> BE 2019/5929 <151> 2019-12-17 <160> 79 <170> PatentIn version 3.5 <210> 1 <211> 261 <212> PRT <213> Akkermansia muciniphila <400> 1 Met Asn Met Glu Arg Lys Thr Gly Leu Met Asn Lys Lys Tyr Val Ser 1 5 10 15 Pro Cys Phe Leu Pro Gly Met Arg Leu Gly Asn Ile Met Phe Thr Leu 20 25 30 Ala Ala Ala Cys Ala His Ala Arg Thr Val Gly Val Glu Cys Arg Val 35 40 45 Pro Trp Ala Tyr Asn Asp Ala Ser Leu Met Leu Arg Ser Arg Leu Gly 50 55 60 Gly Trp Val Leu Pro Ser Thr Pro Cys Gly Thr Asn Glu Pro Pro Ser 65 70 75 80 Trp Gln Glu Pro Ser Phe Ala Tyr Cys Pro Val Pro Ser Arg Ile Arg 85 90 95 Thr Gly Gly Leu Arg Gly Tyr Phe Gln Ser Ala Arg Tyr Phe Glu Gly 100 105 110 Gln Glu Ala Phe Ile Arg Ala Leu Phe Ala Pro Leu Thr Ala Glu Lys 115 120 125 Glu Pro Gly Ala Val Gly Ile His Ile Arg Leu Gly Asp Tyr Arg Arg 130 135 140 Leu Arg Asp Lys His Arg Ile Leu Asp Pro Gly Phe Leu Arg Arg Ala 145 150 155 160 Ala Gly His Leu Ser Ser Gly Lys Asn Arg Leu Val Leu Phe Ser Asp 165 170 175 Glu Pro Asp Glu Ala Ala Glu Met Leu Ala Arg Val Pro Ala Phe Gly 180 185 190 Arg Phe Ala Leu Glu Ile Asp Arg Gly Ala Pro Cys Glu Ser Leu Arg 195 200 205 Arg Met Thr Ala Met Glu Glu Leu Val Met Ser Cys Ser Ser Phe Ser 210 215 220 Trp Trp Gly Ala Trp Leu Gly Asn Thr Arg Lys Val Ile Val Pro Arg 225 230 235 240 Asp Trp Phe Val Gly Gly Val Glu Asp Tyr Arg Asp Ile Tyr Leu Pro 245 250 255 His Trp Val Thr Leu 260 <210> 2 <211> 297 <212> PRT <213> Porphyromonas catoniae <400> 2 Met Lys Arg Ile Tyr Leu Ser Ile Tyr Gly Gly Leu Gly Asn Gln Leu 1 5 10 15 Tyr Ile Leu Ala Tyr Ala Asp Tyr Leu Gln Arg Met Leu Gly Thr Arg 20 25 30 Pro Tyr Leu Leu Asn Glu Leu Gln Arg Thr Lys Ala Asp Thr Ser Ser 35 40 45 Leu Asp Arg Thr Arg Arg Asp Leu Phe Ser Glu Leu Ile Ala Tyr Leu 50 55 60 Gly Phe Gln Phe Val Asp Thr Asp Ser Arg Glu Phe Arg Leu Leu Lys 65 70 75 80 Lys Trp Glu Arg His Ile Lys His Tyr Gln Glu Glu Pro Asn Lys His 85 90 95 Gly Ile Tyr Leu Gln Asn Ile Leu Pro Pro Leu Gln Glu Asn His Arg 100 105 110 Trp Thr Leu Pro Leu Val Cys Arg Val Ser Gly Tyr Phe Gln Ser Cys 115 120 125 His Tyr Val Gly Thr Asp Phe Arg Met Arg Val Ser Lys Phe Leu Glu 130 135 140 Arg His Ala Thr Ser Ala Asp Leu Val Arg Glu Tyr Thr Ser Met Ile 145 150 155 160 Gln Pro Glu Asp Val Ala Ile His Leu Arg Arg Gly Asp Phe Val Ala 165 170 175 Leu Gln His Thr Gly Ile Gln Leu Phe Gly Ala Glu His Tyr Thr Lys 180 185 190 Gly Leu Ala Leu Gln Ala Gln Gln Gln Pro Ile Gly Arg Val Phe Val 195 200 205 Phe Ser Asp Asp Phe Glu Ala Ile Gly Glu Glu Leu Ser Leu Leu Ala 210 215 220 Asn Asn Tyr Gln Leu Val Leu Val Lys Gly Leu Thr Pro Leu Gln Asp 225 230 235 240 Leu Phe Leu Leu Thr Cys Phe Arg Arg Tyr Val Leu Ala Asn Ser Thr 245 250 255 Phe Ser Trp Trp Gly Ala Leu Cys Ser Lys Tyr Gly Asp Ala Val Lys 260 265 270 Val Val Val Pro Lys Lys Pro Leu Leu Ile Ser Tyr Pro Glu Asp Ser 275 280 285 Tyr Phe Pro Pro Ser Trp Glu Gln Ile 290 295 <210> 3 <211> 311 <212> PRT <213> Helicobacter sp. <400> 3 Met Phe Ser Val Arg Leu Met Gly Gly Leu Gly Asn Gln Met Phe Ile 1 5 10 15 Tyr Ala Phe Ala Lys Ala Ile Lys Ala Gln Gly Tyr Pro Val Arg Leu 20 25 30 Phe Tyr Tyr Asp Thr Asp Tyr Asn Val Pro Gln Thr His Asn Ile Arg 35 40 45 Asn Leu Glu Ile Val Asp Phe Gly Ile Ala Met Cys Ile Glu Thr Met 50 55 60 Cys Tyr Glu Glu Pro Gln Ile Lys Lys Ser Phe Phe Glu Arg Ala Leu 65 70 75 80 Gly Phe Ile Lys Arg Lys Leu Lys Ile His Ser Pro His Ser Ser Ser 85 90 95 Leu Ile Ser Asp His Cys Glu Ile Ala Leu Thr Lys Asp Phe Leu Asp 100 105 110 Thr Leu Asn Pro Asn Ala Met Phe Asn Gly Tyr Phe Gln Asn Val Val 115 120 125 Phe Phe Asp His Leu Arg Glu Ser Leu Leu Arg Asp Phe Thr Leu Lys 130 135 140 Arg Pro Leu Thr Pro Ala Asn Glu Ala Leu Lys His Gln Ile Leu Gln 145 150 155 160 Thr Pro Asn Ser Cys Phe Leu His Ile Arg Arg Gly Asp Tyr Leu Gln 165 170 175 Ile Pro Ile Tyr Val Lys Leu Gly Ser Thr Tyr Tyr Asn Asn Ala Ile 180 185 190 Lys Ala Leu Lys Asp Lys Ile Ser Lys Pro His Ile Phe Val Phe Ser 195 200 205 Asn Asp Ile Ala Trp Cys Lys Glu Phe Phe Leu Asp Ser Leu Asp Pro 210 215 220 Leu Val Ile Glu Asn Val Thr Phe Ser Phe Ile Glu Asn Asn Asp Glu 225 230 235 240 Gly Asn Ala Ile Glu Glu Met Glu Leu Met Arg Ser Cys Gln His Ala 245 250 255 Ile Ile Ala Asn Ser Thr Phe Ser Trp Trp Ala Ala Tyr Leu Ile Asp 260 265 270 Ser Ala Gln Lys Leu Cys Ile Met Pro Lys His Phe Phe Asn Asp Pro 275 280 285 Gln Gln Glu Val Ala His Lys Leu Ile Pro Pro Pro Leu His Ser Leu 290 295 300 Ser Gln Thr Ile Val Ile Gly 305 310 <210> 4 <211> 289 <212> PRT <213> Capnocytophaga canis <400> 4 Met Met Arg His Tyr Ile Cys Leu Gln Gly Gly Leu Gly Asn Gln Leu 1 5 10 15 Tyr Ile Leu Gly Tyr Ala Phe Tyr Leu Gln Glu Gln Gly Cys Lys Asn 20 25 30 Ile Cys Leu Phe Tyr Glu Gln Lys Gln Asn Gly Asp Thr Val Asp Thr 35 40 45 Gln Lys Arg Asn Ile Ile Asp Asp Leu Pro Lys Glu Leu Gly Phe Lys 50 55 60 Ser Leu Tyr Ile Ser Ser Leu Trp Leu Lys Val Leu Arg Asn Leu Cys 65 70 75 80 Lys Leu Pro Met Ile Ser Lys Leu Val Asp Tyr Tyr Glu Glu Pro Thr 85 90 95 Glu Glu Trp Ala Val Phe Thr Pro Phe Ser Pro Leu Arg Lys Lys Arg 100 105 110 Val Ser Val His Ile Gly Tyr Tyr Gln Ser Phe Tyr Tyr Gln Thr Pro 115 120 125 Leu Phe Ile Glu Arg Leu Lys Arg Phe Phe Phe Lys Asn Val Leu Leu 130 135 140 Glu Arg Phe Ser Pro Val Glu Asn Asp Ala Ala Ile His Ile Arg Arg 145 150 155 160 Gly Asp Phe Leu Thr Gly Val Asn Thr Met Ile Tyr Ser Glu Ile Gly 165 170 175 Val Lys Tyr Tyr Leu Glu Gly Leu Glu Lys Leu Asn Arg Glu Gln Gly 180 185 190 Ile Gly Lys Ile Tyr Val Phe Ser Asp Asp Phe Gln Ala Ile Thr Asn 195 200 205 Asp Ile Glu Glu Ile Ser Lys Ile Tyr Thr Val Glu Leu Met Gln Gly 210 215 220 Asn Ser Val Leu Gln Asp Ile Arg Met Leu Met Cys Phe Lys Arg Tyr 225 230 235 240 Val Leu Gly Asn Ser Thr Phe Ala Trp Trp Gly Ala Lys Leu Ser Glu 245 250 255 Lys Gln Asn Pro Ile Val Val Val Pro Ala Thr Pro Trp Lys Ile Asn 260 265 270 Leu Lys Lys Glu Val Thr Pro Tyr Pro Lys Asp Trp Ile Leu Leu Glu 275 280 285 Asn <210> 5 <211> 289 <212> PRT <213> Capnocytophaga leadbetteri <400> 5 Met Lys Ala Asn Tyr Val Leu Phe Gln Gly Gly Leu Gly Asn Gln Leu 1 5 10 15 Tyr Gln Leu Ala Tyr Thr Asp Phe Leu Lys Arg Asn Gly Tyr Ser Asn 20 25 30 Val Lys Leu Ile Thr Pro Ser Asn Lys Asn Lys Gly Asp Thr Lys Asp 35 40 45 Lys Asn Lys Arg Pro Leu Ile Thr Gln Leu Pro Glu Lys Ile Gly Ile 50 55 60 Asp Cys Val Asp Phe Gly His Lys Tyr Phe Tyr Ser Phe Leu Gln Arg 65 70 75 80 Leu Pro Lys Phe Pro Leu Tyr Lys Ser Phe Leu Arg Arg Leu Ile Asn 85 90 95 Val Glu Lys Glu Pro Pro Tyr Gln Trp Ala Ile Phe His Pro Ile Thr 100 105 110 Arg Glu Lys Tyr Arg Leu Asn Ile His Ile Gly Tyr Tyr Gln Ser Asn 115 120 125 Leu Tyr Ile Ser Asp Ser Phe Lys Gln Gln Val Ala Lys Val Ile Glu 130 135 140 Ser Leu Ser Pro Asn Ile Lys Phe Ser Ile Thr Asn Asn Asp Val Ala 145 150 155 160 Ile His Ile Arg Arg Gly Asp Phe Leu Ile Gly Asn Asn Ala Ser Val 165 170 175 Phe Asn Lys Ile Glu Leu Pro His Tyr Leu Gln Gly Leu Thr Ile Leu 180 185 190 Ser Glu Arg Met Asn Ile Gln Lys Val Tyr Ile Phe Ser Asp Asp Phe 195 200 205 Glu Ala Ile Lys Glu Asp Ile Lys Thr Ile Ala Glu Asn Tyr Glu Val 210 215 220 Val Leu Val Glu Gly Gln Ser Val Leu Ala Asp Phe Ala Leu Leu Gln 225 230 235 240 Lys Phe Thr Asn Phe Val Ile Gly Asn Ser Thr Phe Ala Trp Trp Gly 245 250 255 Ala Met Leu Ala Asn Ala Ser Asn Val Ile Val Pro Lys Lys Pro Trp 260 265 270 Lys Ile Glu Met Glu Asn Met Ser Pro Tyr Pro Asp Asn Trp Thr Thr 275 280 285 Ile <210> 6 <211> 303 <212> PRT <213> Helicobacter sp. <400> 6 Met Phe Ser Val Arg Leu Met Gly Gly Leu Gly Asn Gln Met Phe Ile 1 5 10 15 Tyr Ala Phe Ala Lys Ala Ile Lys Ala Gln Gly Tyr Pro Val Arg Leu 20 25 30 Phe Tyr Tyr Asp Thr Asp Tyr Asn Val Pro Gln Thr His Asn Ile Arg 35 40 45 Asn Leu Glu Ile Val Asp Phe Gly Leu Asn Leu Pro Ile Gln Arg Leu 50 55 60 Cys Ser Lys Gly Ile His Arg Asn Val Lys Arg Ile Ile Ala Phe Ile 65 70 75 80 His Arg Lys Ile Ala Lys Tyr Leu Phe Thr Phe Val Ser Asp Cys His 85 90 95 Asn Val Ser Pro Thr Lys Asp Phe Leu Asp Thr Leu Asn Pro Asn Ala 100 105 110 Met Phe Asn Gly Tyr Phe Gln Asn Val Val Phe Phe Asp His Leu Arg 115 120 125 Glu Ser Leu Leu Arg Asp Phe Thr Leu Lys Arg Pro Leu Thr Pro Ala 130 135 140 Asn Glu Ala Leu Lys His Gln Ile Leu Gln Thr Pro Asn Ser Cys Phe 145 150 155 160 Leu His Ile Arg Arg Gly Asp Phe Leu Pro Leu Pro Glu Tyr Ile Gln 165 170 175 Leu Asp Ser Thr Ala Tyr Tyr Asn Asn Ala Ile Lys Ala Leu Lys Asp 180 185 190 Lys Ile Ser Lys Pro His Ile Phe Val Phe Ser Asn Asp Ile Ala Trp 195 200 205 Cys Lys Glu Phe Phe Leu Asp Ser Leu Asp Pro Leu Val Ile Glu Asn 210 215 220 Val Thr Phe Ser Phe Val Glu Asn Asn Asp Glu Gly Asn Ala Ile Glu 225 230 235 240 Glu Met Glu Leu Met Arg Ser Cys Gln His Ala Ile Ile Ala Asn Ser 245 250 255 Thr Phe Ser Trp Trp Ala Ala Tyr Leu Ile Asp Ser Ala Gln Lys Leu 260 265 270 Cys Ile Met Pro Gln Arg Phe Tyr Gly Ile Gln Gln Glu Glu Asn Cys 275 280 285 Asp Ile Pro Pro Pro Pro His Thr Leu Ala Val Tyr Ser Lys Asn 290 295 300 <210> 7 <211> 288 <212> PRT <213> Kingella denitrificans <400> 7 Met Ala Lys His Tyr Ile His Phe Ala Asn Gly Leu Gly Leu Gly Asn 1 5 10 15 Gln Leu Tyr Leu Leu Ala Tyr Thr Asp Tyr Leu Lys Ser Leu Gly Ala 20 25 30 Asp Ala Ser Leu Phe Leu Met Gly Asn Gly Gln Val Gly Asp Thr Lys 35 40 45 Asp Lys Ala Lys Arg Asn Leu Val Leu Glu Ile Pro Gln Arg Leu Gly 50 55 60 Met Ala Val Val Asp Lys Lys Gln Ile Ser Arg Ser Phe Arg Tyr Ile 65 70 75 80 Phe Cys Lys Ala Phe Tyr Gly Lys Glu Lys Leu Asn Trp Arg Glu Pro 85 90 95 Lys Asp Gln Trp Ala Val Phe Phe Glu Gly Val His Gly Lys Tyr Pro 100 105 110 Ile Asn Phe Tyr Tyr Gly Tyr Phe Gln Ser His His Tyr Ile Ala Glu 115 120 125 Pro Phe Lys Gln Arg Leu Lys Thr Val Leu Arg Ala Leu Lys Pro Val 130 135 140 Asp Val Ala Val Gly Glu Asn Asp Val Ala Leu His Ile Arg Arg Gly 145 150 155 160 Asp Phe Leu Asn Pro Glu Asn Ala Gly Leu Ile Arg Thr Val Gly Leu 165 170 175 Asp Tyr Tyr Leu Asn Gly Leu Asp Tyr Ile Arg Gln Arg Gln Thr Ile 180 185 190 Gly Thr Val Tyr Ile Phe Ser Asp Asp Phe Ala Ala Ile Glu Lys Glu 195 200 205 Ile Ala Ala Ile Ser Ala Asp Tyr Pro Val Arg Leu Met Gln Gly Gln 210 215 220 Ser Val Leu Glu Asp Met Asn Trp Leu Thr Tyr Phe Lys His Tyr Val 225 230 235 240 Val Gly Asn Ser Thr Phe Ala Trp Trp Gly Cys Leu Leu Ser Asp His 245 250 255 Gln Asp Gly Leu Val Val Val Pro Gln Arg Pro Trp Val Gln Glu Gln 260 265 270 Pro Ala Ala Ser Gln Tyr Leu Pro His Trp Val Gln Leu Pro Asn Glu 275 280 285 <210> 8 <211> 288 <212> PRT <213> Pseudoalteromonas distincta <400> 8 Met Ile Lys Val Lys Ala Ile Gly Gly Leu Gly Asn Gln Leu Phe Gln 1 5 10 15 Tyr Ala Thr Ala Arg Ala Ile Ala Glu Lys Arg Gly Asp Gly Val Val 20 25 30 Val Asp Met Ser Asp Phe Ser Ser Tyr Lys Thr His Pro Phe Cys Leu 35 40 45 Asn Lys Phe Arg Cys Lys Ala Thr Tyr Glu Ser Lys Pro Lys Leu Ile 50 55 60 Asn Lys Leu Leu Ser Asn Glu Lys Ile Arg Asn Leu Leu Gln Lys Leu 65 70 75 80 Gly Phe Ile Lys Lys Tyr Tyr Phe Glu Thr Gln Leu Pro Phe Asn Glu 85 90 95 Asp Val Leu Leu Asn Asn Ser Ile Asn Tyr Leu Thr Gly Tyr Phe Gln 100 105 110 Ser Glu Lys Tyr Phe Leu Ser Ile Arg Glu Cys Leu Leu Asp Glu Leu 115 120 125 Thr Leu Ile Glu Asp Leu Asn Ile Ala Glu Thr Ala Val Ser Lys Ala 130 135 140 Ile Lys Asn Ala Lys Asn Ser Ile Ser Ile His Ile Arg Arg Gly Asp 145 150 155 160 Tyr Val Ser Asn Glu Gly Ala Asn Lys Thr His Gly Val Cys Asp Ser 165 170 175 Asp Tyr Phe Lys Lys Ala Leu Asn Tyr Phe Ser Glu Arg Lys Leu Leu 180 185 190 Asp Glu His Thr Glu Leu Phe Ile Phe Ser Asp Asp Ile Glu Trp Cys 195 200 205 Arg Asn Asn Leu Ser Phe Asp Tyr Lys Met Asn Phe Val Asp Gly Ser 210 215 220 Ser Glu Arg Pro Glu Val Asp Met Val Leu Met Ser Gln Cys Lys His 225 230 235 240 Gln Val Ile Ser Asn Ser Thr Phe Ser Trp Trp Gly Ala Trp Leu Asn 245 250 255 Lys Asn Asp Glu Lys Val Val Val Ala Pro Lys Glu Trp Phe Lys Ser 260 265 270 Thr Asp Leu Asp Ser Thr Asp Ile Val Pro Asn Gln Trp Ile Lys Leu 275 280 285 <210> 9 <211> 297 <212> PRT <213> Porphyromonas catoniae <400> 9 Met Lys Arg Ile Tyr Leu Ser Ile Tyr Gly Gly Leu Gly Asn Gln Leu 1 5 10 15 Tyr Ile Leu Ala Tyr Ala Asp Tyr Leu Gln Arg Met Leu Gly Thr Arg 20 25 30 Pro Tyr Leu Leu Asn Glu Leu Gln Arg Thr Lys Ala Asp Thr Ser Ser 35 40 45 Leu Asp Arg Thr Arg Arg Asp Leu Phe Ser Glu Leu Ile Ala Tyr Leu 50 55 60 Gly Phe Gln Phe Ile Asp Thr Asp Ser Arg Glu Phe Arg Leu Leu Lys 65 70 75 80 Lys Trp Glu Arg His Ile Glu His Tyr Gln Glu Glu Pro Asn Lys His 85 90 95 Gly Ile Tyr Leu Gln Asn Ile Leu Pro Pro Leu Arg Glu Asn Pro Arg 100 105 110 Trp Thr Leu Pro Leu Val Cys Arg Ile Ser Gly Tyr Phe Gln Ser Tyr 115 120 125 His Tyr Val Ser Thr Asp Phe Arg Arg Arg Val Gly Lys Phe Leu Asn 130 135 140 Leu His Ala Thr Ser Ala Asp Leu Ala Arg Glu Tyr Ala Leu Met Ile 145 150 155 160 Gln Pro Glu Asp Val Ala Ile His Leu Arg Arg Gly Asp Phe Val Ala 165 170 175 Leu Gln His Thr Gly Val Gln Leu Phe Gly Ala Glu His Tyr Ala Lys 180 185 190 Gly Leu Ala Leu Gln Ala Gln Gln Gln Pro Ile Gly Arg Val Phe Val 195 200 205 Phe Ser Asp Asp Phe Asp Ala Ile Gln Glu Glu Leu Gly Leu Leu Ala 210 215 220 Asp Asn Tyr Gln Leu Val Leu Val Lys Gly Leu Thr Pro Leu Gln Asp 225 230 235 240 Leu Phe Leu Leu Thr Cys Phe Arg Arg Tyr Val Leu Ala Asn Ser Thr 245 250 255 Phe Ser Trp Trp Gly Ala Leu Cys Ser Lys Tyr Gly Asn Glu Val Lys 260 265 270 Val Val Val Pro Lys Lys Pro Leu Leu Ile Ser Tyr Pro Glu Asp Ser 275 280 285 Tyr Phe Pro Pro Ser Trp Glu Gln Ile 290 295 <210> 10 <211> 281 <212> PRT <213> Campylobacter mucosalis <400> 10 Met Ile Ile Val Lys Ile Val Gly Gly Leu Gly Asn Gln Met Phe Cys 1 5 10 15 Tyr Ala Tyr Ala Lys Met Leu Ser Ile Gly Gly Tyr Asn Val Lys Met 20 25 30 Asp Thr Ser Val Tyr Lys Thr Tyr Lys Leu His Gly Gly Tyr Gln Leu 35 40 45 Asp Lys Tyr Asn Ile Asp Leu Ala Thr Leu Ser Gly Asn Lys Asn Ala 50 55 60 Lys Phe Tyr Ser Asn Gly Val Val Phe Lys Ile Leu Lys Lys Phe Gly 65 70 75 80 Leu Leu Lys Ile Lys Arg Glu Glu Ser Leu Leu Phe Asp Glu Ser Phe 85 90 95 Lys Thr Pro Asn Asp Lys Val Tyr Ile Glu Gly Tyr Phe Gln Ser Glu 100 105 110 Lys Tyr Phe Cys Asp Ile Lys Asp Ile Leu Leu Asn Gln Phe Val Leu 115 120 125 Lys Thr Thr Leu Ser Asn Tyr Ala Ile Ser Ile Lys Asp Lys Ile Thr 130 135 140 Gln Asn Ser Cys Ser Ile His Ile Arg Arg Gly Asp Tyr Leu Leu Gly 145 150 155 160 Lys Asn Ile Asn Tyr His Gly Val Cys Asp Leu Lys Tyr Tyr Gln Asp 165 170 175 Ala Thr Asp Phe Leu Glu Gln Lys Cys Gly Asp Leu Thr Tyr Phe Ile 180 185 190 Phe Ser Asp Asp Ile Glu Trp Ala Lys Gly Asn Leu Lys Leu Asn Asn 195 200 205 Ala Phe Tyr Val Asp Ser Ser Asp Arg Leu Pro His Glu Asp Ile Tyr 210 215 220 Leu Met Ser Leu Cys Gln Asn Asn Ile Ile Ala Asn Ser Thr Phe Ser 225 230 235 240 Trp Trp Gly Ala Tyr Leu Asn Gln Asn Gln Asn Lys Ile Val Ile Ala 245 250 255 Pro Lys Ile Trp Phe Ser Asn Ala Lys Leu Gln Ser Gln Thr Ser Asp 260 265 270 Leu Ile Pro Asn Glu Trp Ile Arg Val 275 280 <210> 11 <211> 283 <212> PRT <213> Pedobacter kyungheensis <400> 11 Met Ile Tyr Val Val Phe Ser Asp Arg Leu Gly Asn Asn Leu Phe Gln 1 5 10 15 Met Ala Ala Ala Leu Ser Leu Ser Glu Lys Ile Thr Ile Cys Val Pro 20 25 30 Leu Gln Glu Glu Tyr Ser Ala Thr Leu Lys Tyr Lys Asp Thr Phe Phe 35 40 45 Lys Gly Phe Asp Ile Leu Asn Tyr Ile Pro Asp Gly Ile Pro Val Tyr 50 55 60 Glu Glu Pro Phe Tyr His Tyr Asn Ser Val Pro Tyr Thr Glu Gly Thr 65 70 75 80 Asp Leu Ile Ile Lys Gly Tyr Phe Gln Ser His Arg Tyr Phe Asp Arg 85 90 95 Ser Leu Val Leu Lys Gln Tyr Ser Ile Asp Asp Asn Thr Ile Phe Phe 100 105 110 Ile Glu Lys Lys Tyr Pro Glu Ile Leu Lys Gly Gly Tyr Thr Ser Ile 115 120 125 His Ile Arg Arg Gly Asp Tyr Leu Lys Met Leu Tyr Lys His Pro Phe 130 135 140 Cys Gly Leu Lys Tyr Tyr Lys Lys Ala Ile Asp Leu Ile Gly Lys Asn 145 150 155 160 Glu Asn Phe Ile Ile Val Ser Asp Asp Ile Thr Trp Cys Lys Asn Asn 165 170 175 Ile Lys Leu Lys Asn Val Ile Phe Ala Glu Asn Thr Ser Pro Ile Ile 180 185 190 Asp Leu Tyr Ile Gln Ser Tyr Cys Glu Asn Asn Ile Leu Ser Asn Ser 195 200 205 Ser Phe Ser Trp Trp Gly Ala Tyr Leu Asn Lys His Ile Asn Lys Lys 210 215 220 Val Ile Val Pro Ser Leu Trp Phe Gly Tyr Lys Ala Asn Phe Ser Thr 225 230 235 240 Lys Asp Leu Leu Pro Arg Asp Tyr Ile Val Ile Ile Asn Lys Tyr Ser 245 250 255 Phe Val Gly Tyr Leu Lys Ser Val Met Gln Leu Val Lys Asn Lys Ile 260 265 270 Phe Phe Leu Leu Asn Asn Lys Asp Val Gln Asn 275 280 <210> 12 <211> 286 <212> PRT <213> Noviherbaspirillum autotrophicum <400> 12 Met Ile Val Val Arg Leu Ile Gly Gly Leu Gly Asn Gln Met Phe Gln 1 5 10 15 Tyr Ala Ser Ala Leu Ala Leu Ala Lys Arg Thr Gly Ser Asp Leu Ile 20 25 30 Leu Asp Leu Ser Ala Phe Lys His Tyr Ser Leu Arg Asp Tyr Gly Leu 35 40 45 Gln Gln Trp Lys Ile Ser Ala Arg Ile Ala Ser Ser Val Glu Leu Arg 50 55 60 Lys Phe Pro Arg Trp Gly Ala Arg Val Ala Arg Tyr Thr Gln Lys Leu 65 70 75 80 Gly Ile Lys Thr Arg Phe Tyr Ser Glu Leu Gly Leu Gly Phe Asp Pro 85 90 95 Ala Phe Met Lys Leu His Ala Pro Val Tyr Leu Asn Gly Tyr Phe Gln 100 105 110 Ser Glu Lys Tyr Phe Leu Asn Ile Arg Ser Ile Leu Leu Glu Glu Phe 115 120 125 Gln Pro Ser Asn Pro Leu Leu Ala Gln Asn Ser Arg His Ala Ser Asp 130 135 140 Ala Ile Glu Ser Asn Ser Val Ala Ile His Ile Arg Arg Gly Asp Tyr 145 150 155 160 Val Ser Asn Thr His Asn Leu Ser Ile His Gly Val Cys Ser Leu Gly 165 170 175 Tyr Tyr Glu Arg Ala Ile Asn Ile Ile Arg Ser Lys Ile Gly Pro Ala 180 185 190 Asn Phe Phe Val Phe Ser Asp Asp Met Glu Trp Val Arg Glu Asn Ile 195 200 205 Arg Ile Pro Asp Glu Val Val Phe Val Glu Gly Asn Asn Ala Arg Pro 210 215 220 Glu Ala Asp Ile His Leu Met Ser Leu Cys Lys His Asn Ile Cys Ala 225 230 235 240 Asn Ser Ser Phe Ser Trp Trp Gly Ala Trp Leu Asn Arg Asn Pro Glu 245 250 255 Lys Ile Val Ile Ala Pro Asp Pro Trp Phe Val Ser Lys Ala Leu Asp 260 265 270 Ser Asn His Leu Ile Pro Gln Asp Trp Phe Gln Val Ser Ser 275 280 285 <210> 13 <211> 294 <212> PRT <213> Microbacterium trichothecenolyticum <400> 13 Met Thr Val Arg Asp Gly Val Cys Ala Tyr Val Met Gly Gly Leu Gly 1 5 10 15 Asn Gln Leu Phe Ile Leu Ala Ala Ala Trp Glu Gln Ser Arg Arg Leu 20 25 30 Asn Val Pro Leu Tyr Leu Asp Arg Ser His Phe Ala Val Gly Gly Thr 35 40 45 Phe Ala Tyr Gly Leu Asp Ala Val Pro Asn Pro Gly His Val Leu Ser 50 55 60 Pro Thr Glu Ser Pro Trp Arg Ser Val Arg Ile Asn Arg Glu Arg Val 65 70 75 80 Leu Pro Leu Pro Arg Arg Pro Trp Gly Arg Val Tyr Leu Glu Arg Asp 85 90 95 Gly Asp Thr Tyr Ser Pro Ala Ile Asn Gly Ile Arg Pro Gly Thr Thr 100 105 110 Leu Val Gly Tyr Phe Gln Ser Pro Arg Tyr Phe Pro Thr Val Arg Asp 115 120 125 Glu Leu Ala Ser Ala Met Leu Lys Thr Glu Glu Thr Ala Glu Glu Thr 130 135 140 Ala Arg Ile Glu Ser Met Leu Ala Ala Pro Ala Ile Thr Leu His Leu 145 150 155 160 Arg Arg Gly Asp Tyr Leu Ala Val Ser Ala Asp Arg Gln Phe Ile Ala 165 170 175 Ser Val Asp Tyr Ala Val Arg Gly Val Arg His Leu Arg Ser Met Gly 180 185 190 Leu Asp His Pro Val Arg Val Phe Ser Asp Ser Val Asp Leu Val Lys 195 200 205 Asp Glu Leu Arg Gly Val Glu Gly Asp Phe Glu Phe Val Glu Asp Asp 210 215 220 Gly Val Leu Gly Thr Trp Ala Thr Leu Lys Ala Met Ser Ala Gly Thr 225 230 235 240 Ala Met Ile Met Ser Asn Ser Ser Phe Ser Trp Trp Gly Ala Glu Leu 245 250 255 Met Arg Gly Arg Leu Gly Pro Gly Val Pro Val Ile Ala Pro Arg Pro 260 265 270 Trp Thr Gln Thr Gly Thr Ala Lys Ala Asp Leu Leu Glu Pro Ala Trp 275 280 285 Val Thr Leu Asp Ala Arg 290 <210> 14 <211> 272 <212> PRT <213> Candidatus symbiothrix dinenymphae <400> 14 Met Asn Val Val Gln Leu Gln Gly Gly Leu Ala Asn Gln Met Phe Gln 1 5 10 15 Tyr Ala Phe Gly Gln Ala Leu Gly Glu Asp Thr Leu Tyr Asp Val Ser 20 25 30 Trp Phe Glu Arg Ala Lys Ser Glu Arg Thr Thr Ser Arg Pro Phe Cys 35 40 45 Leu Asp Val Phe Asn Ile Pro Ala Thr Val Phe Val Asn Arg Arg Pro 50 55 60 Pro Leu Leu Ala Arg Leu Val Gly Lys Tyr Lys Val Val Arg Glu Arg 65 70 75 80 Asn Trp Asp Glu Phe Gln Pro Glu Phe Leu Asn Leu Gly Gly Arg Gly 85 90 95 Thr Asn Tyr Phe Lys Gly Tyr Phe Gln Asn Glu Arg Tyr Leu Asn Cys 100 105 110 Val Lys Asp Lys Ile Ser Ala Asp Phe Ser Leu Lys Asn Thr Met Asn 115 120 125 Ser Asp Asn Leu Glu Leu Leu Lys Gln Ile Arg Asn Cys Asn Ser Val 130 135 140 Ser Leu His Ile Arg Arg Gly Asp Tyr Val Lys Gln Pro Asp Tyr His 145 150 155 160 Pro Leu Cys Gly Ile Glu Tyr Tyr Gln Ala Ala Met Lys Met Ile Glu 165 170 175 Gly His Tyr Phe Leu Phe Ser Asp Asp Ile Glu Trp Cys Lys Ala Asn 180 185 190 Ala Lys Thr Asp Met Pro Met Thr Ile Val Asp Ile Asn Ser Ala Glu 195 200 205 Thr Gly Tyr Trp Asp Met Glu Leu Met Lys Asn Cys Lys His Asn Ile 210 215 220 Ile Ala Asn Ser Ser Phe Ser Trp Met Ala Ala Tyr Leu Asn Pro Asn 225 230 235 240 Pro Asp Lys Met Val Ile Ala Pro Lys Asp Trp Asn Lys His Asn Gly 245 250 255 Glu Ala Ile Ser Asn Arg Gly Leu Ser Glu Lys Tyr Ile Gln Ile Lys 260 265 270 <210> 15 <211> 275 <212> PRT <213> Pedobacter sp. <400> 15 Met Ile Gly Ile Ser Ile Gln Cys Arg Leu Gly Asn Gln Leu Phe Gln 1 5 10 15 Tyr Ala Phe Ile Ile Ser Leu Ser Lys Thr Leu Asn Ser Lys Tyr Phe 20 25 30 Ile Ser Glu Lys Ile Glu Arg Phe Thr Leu Pro Asp Tyr Phe Glu Leu 35 40 45 Pro His Tyr Asn Pro Asn Leu Asn Leu Leu Tyr Lys Ile Ile Leu Lys 50 55 60 Ile Lys Lys Gly Tyr Leu Arg Lys Pro Leu Gln Asn Tyr Ser Leu Thr 65 70 75 80 Arg Asn Asn Ile Ala Arg Asp Asn Glu Ile Tyr Val Gly Tyr Phe Gln 85 90 95 Ser Glu Thr Phe Phe Asn Gln Leu Lys Asn Asp Ile Asp Ser Phe Ile 100 105 110 Lys Val Arg Lys Glu Tyr Lys Gln Val Phe Ser Asn Gln Tyr Gly Asn 115 120 125 Phe Phe Ser Glu His Lys Thr Ile Ala Ile His Leu Arg Arg Gly Asp 130 135 140 Tyr Leu Asn Leu Asp Asn Trp Trp Leu Glu Asn Leu Gly Ser Asn Asn 145 150 155 160 Leu Thr Leu Pro Leu Asp Tyr Tyr Lys Asn Cys Phe Ala Ala Ile Glu 165 170 175 Asn Leu His His Tyr Lys Leu Met Phe Ile Ser Asp Asp Ile Glu Phe 180 185 190 Val Lys Ser Glu Phe Gly Tyr Leu Glu Asn Ala Glu Phe His Asn Asn 195 200 205 Glu Leu Ile Ile Asp Phe Gln Ile Met Met Asn Ala Asp Ile Cys Ile 210 215 220 Val Ser Asn Ser Ser Phe Ala Trp Trp Ala Ala Tyr Leu Asn Pro Lys 225 230 235 240 Ala Thr Lys Lys Ile Leu Cys Pro Lys Tyr Trp Leu Gly Phe Asn Ile 245 250 255 Lys Lys Glu Tyr Pro Lys Asn Ile Ile Pro Lys Asp Trp Lys Gln Ile 260 265 270 Ile Ala Lys 275 <210> 16 <211> 288 <212> PRT <213> Chryseobacterium sp. <400> 16 Met Thr Ile Thr Lys Leu Gln Gly Gly Leu Gly Asn Gln Met Phe Gln 1 5 10 15 Tyr Ala Val Ala Arg Ser Arg Cys Val Asp Glu Lys Ile Tyr Leu Asp 20 25 30 Phe Ser Phe Leu Gln Lys Asn Asn Val Ser Thr Glu His Phe Thr Lys 35 40 45 Arg Asp Phe Glu Leu Gly Val Phe Gly Ile Gln Tyr Lys Glu Phe Ser 50 55 60 Asp Arg Glu Arg Lys Ile Cys Phe Gly Thr Ser Thr Lys Asp Lys Ile 65 70 75 80 Leu Arg Lys Leu Phe Tyr Gly Arg Thr Glu Thr Val His Gln Ile Glu 85 90 95 Asn Glu Phe Val Ile Ile Pro Ala Ala Gln Asn Ile Tyr Phe Asp Gly 100 105 110 Tyr Phe Gln Ser Glu Lys Tyr Phe Ala Ser Ile Arg Asn Gln Leu Leu 115 120 125 Thr Glu Phe Thr Phe Pro Glu Leu Asp Gly Ala Asn Ile Arg Ile Leu 130 135 140 Asp Gln Ile Asn Ser Val Gln Asn Ser Val Ser Ile His Ile Arg Arg 145 150 155 160 Gly Asp Tyr Leu Lys Pro Glu Val Leu Lys Tyr His Gly Ser Leu Gly 165 170 175 Glu Asn Tyr Tyr Lys Ala Gly Leu Glu Leu Leu Lys Ala Lys Phe Pro 180 185 190 Asn Leu Tyr Tyr Phe Val Phe Ser Asp Asp Ile Ser Phe Ala Lys Thr 195 200 205 Leu Phe Lys Asp Leu Glu Asn Thr Tyr Phe Val Asn Ile Asn Ser Gly 210 215 220 Lys Asp Ser Trp Lys Asp Met Phe Leu Met Ala Gln Cys Arg His His 225 230 235 240 Ile Ile Ala Asn Ser Ser Phe Ser Trp Trp Gly Ala Trp Leu Ser Gln 245 250 255 Lys Gln Gly Ile Asn Ile Ala Pro Glu Asn Trp Phe Asn Lys Glu Val 260 265 270 Ala Asn Phe Asp Ile Asn Asn Ile Val Pro Ser Asp Trp Ile Thr Ile 275 280 285 <210> 17 <211> 283 <212> PRT <213> Microbacterium sp. <400> 17 Met Gly Gly Leu Gly Asn Gln Ile Phe Ile Leu Ala Ala Ala Trp Glu 1 5 10 15 Gln Ala Arg Arg Leu Asp Val Pro Leu Tyr Leu Asp Ala Ser His Phe 20 25 30 Ser Val Gly Gly Thr Phe Arg Tyr Gly Leu Asp Ala Ile Asp His Pro 35 40 45 Gly Arg Leu Leu Gly Pro Lys Glu Ser Pro Trp Arg Ser Val Arg Ile 50 55 60 Asn Arg Glu Arg Val Leu Pro Phe Pro Arg Arg Pro Trp Gly His Ile 65 70 75 80 Phe Leu Glu Arg Asp Gly Asp Arg Tyr Gln Pro Ala Ile Glu Gln Ile 85 90 95 Thr Ser Gly Thr Thr Leu Val Gly Tyr Phe Gln Ser Pro Arg Tyr Phe 100 105 110 Pro Asn Val Arg Asp Gln Leu Ile Ala Ser Met Leu Asp Thr Ala Asp 115 120 125 Thr Glu Ala Glu Ala Ser Arg Leu Arg Glu Tyr Asp Arg Thr Pro Ala 130 135 140 Ile Ser Leu His Leu Arg Arg Gly Asp Tyr Leu Ala Val Ser Ala Asp 145 150 155 160 Arg Gln Phe Ile Ala Ser Val Ala Tyr Ala Val Arg Ser Val Lys Leu 165 170 175 Leu Arg Ala Met Gly Ile Asp Leu Pro Val Arg Val Phe Ser Asp Ser 180 185 190 Val Asp Leu Val Lys Asp Glu Leu Arg Gly Val Glu Gly Asp Phe Asp 195 200 205 Phe Val Glu Asp Asp Gly Ala Leu Gly Thr Trp Ala Thr Leu Lys Ala 210 215 220 Met Ser Ala Gly His Ala Met Ile Met Ser Asn Ser Ser Phe Ser Trp 225 230 235 240 Trp Ala Ala Glu Leu Met His Arg Arg Ser Gly Gly Arg Ala Pro Val 245 250 255 Ile Ala Pro Arg Pro Trp Thr Gln Thr Gly Thr Ala Lys Ser Asp Leu 260 265 270 Leu His Ala Asp Trp Ile Thr Leu Asp Ala Arg 275 280 <210> 18 <211> 264 <212> PRT <213> Ramazzottius varieornatus <400> 18 Met Phe Ile Tyr Ala Ser Leu Trp Gly Ile Ala Lys Lys Asn Gly Leu 1 5 10 15 Thr Pro Thr Ile Pro Phe Thr Lys Leu His Asp Ala Phe His Leu Asp 20 25 30 Leu Ser Pro Glu Gln Phe Phe Asp Leu Ser Asp Cys Asp Asn Tyr Val 35 40 45 Phe Gly Met Asp Glu Cys Cys Leu Tyr Asp Glu Arg Thr Glu Gln Ile 50 55 60 Phe Gln Arg Ala Val Gly Arg Asn Val Ser Leu Trp Gly Tyr Phe Gln 65 70 75 80 Ser Ser Arg Tyr Phe His Pro Glu His Glu Thr Asp Ile Arg Arg Gln 85 90 95 Phe Ala Phe Lys Glu Asn Ile Asp Val Arg Ala Asn Asp Ile Ile Lys 100 105 110 Gly Phe Arg Leu Arg Ser Gly Asp Ser Met Gln Lys Arg Pro Ser Val 115 120 125 Gly Ile His Ile Arg Arg Gly Asp Val Leu Val Lys Ser Phe Trp Arg 130 135 140 Asn Phe Gly Phe Thr Val Ala Thr Arg Glu Tyr Phe Arg His Ala Met 145 150 155 160 Glu Tyr Leu Lys Asn Lys Gly Val Ile Asp Pro Ile Phe Leu Val Cys 165 170 175 Thr Asn Asp Val Glu Trp Ser Arg Gln Asn Leu Ala Gly Phe Asp Val 180 185 190 His Phe Val Glu Asn Gln Thr Ser His Val Asp Met Ala Ile Leu Thr 195 200 205 His Met Asn His Leu Ile Leu Ser Ala Gly Thr Phe Ser Phe Phe Ala 210 215 220 Gly Tyr Leu Ser Ser Ala Gln His Ile Ile Tyr Tyr Lys Gly Trp Pro 225 230 235 240 Arg Pro Gly Ser Lys Tyr Ala Gly Met Met Asp Leu Ser Ser Phe Trp 245 250 255 Leu Pro Glu Trp Ile Ala Met Glu 260 <210> 19 <211> 288 <212> PRT <213> Candidatus wolfebacteria <400> 19 Met Ile Ile Ile Lys Leu Lys Gly Gly Leu Gly Asn Gln Met Phe Gln 1 5 10 15 Tyr Ala Cys Ala Lys His Leu Ala Glu Arg Asn Gly Asp Val Leu Lys 20 25 30 Leu Asp Ile Ser Leu Tyr Gln Pro Gly Asn Ala Pro Ala Gly Asp Thr 35 40 45 Ala Arg Ser Tyr Ala Leu Gly Ala Phe Ser Ile Ser Ala Gln Val Ala 50 55 60 Ser Lys Glu Glu Val Arg Arg Val Arg Gly Leu Leu Trp His Ile Met 65 70 75 80 Ala Leu Ala Met Lys Val Ile Asn Arg Val Arg Pro Ile Ser Ser Tyr 85 90 95 Met Phe Asp Pro Gln Val Leu Glu Arg Arg Gly Asn Val Tyr Leu Asp 100 105 110 Gly Tyr Phe Gln Ser Glu Arg Tyr Phe Lys Asp Ile Lys Ala Cys Ile 115 120 125 Arg Asn Glu Phe Arg Leu Arg Glu Pro Met Gly Glu Gln Ala Gln Ala 130 135 140 Met Leu Arg Asp Ile Asp Gly Ser Asp Ser Val Ser Leu His Ile Arg 145 150 155 160 Arg Gly Asp Tyr Val Thr Asn Lys Asn Ala Asn Ala Phe His Gly Thr 165 170 175 Cys Pro Pro Glu Tyr Tyr His Ala Ala Ile Lys Glu Ile Gly Lys His 180 185 190 Val His Ser Pro Lys Phe Phe Ile Phe Ser Asp Asp Ile Glu Trp Ala 195 200 205 Lys Ala Asp Val Gly Met Pro Ala His Ala Thr Tyr Val Ser Arg Asp 210 215 220 Gly Ile Ala Asp Tyr Glu Glu Leu Leu Leu Met Ser Lys Cys Lys His 225 230 235 240 Asn Ile Ile Ala Asn Ser Ser Phe Ser Trp Trp Gly Ala Trp Leu Asn 245 250 255 Ala Asn Ser Asn Lys Ile Val Val Ala Pro Lys Arg Trp Ile Asn Asp 260 265 270 Glu Arg Val Asp Thr Ser Asp Ala Val Pro Val Glu Trp Val Ser Met 275 280 285 <210> 20 <211> 272 <212> PRT <213> Candidatus yanofskybacteria <400> 20 Met Ile Thr Phe Arg Lys Leu Gly Leu Leu Gly Arg Phe Gly Asn Gln 1 5 10 15 Leu Phe Gln Tyr Ala Gly Ala Arg Met Tyr Ala Asp Ile Asn Gly Phe 20 25 30 Lys Ser Ala Phe Pro Gly Trp Val Gly Asn Lys Ile Phe Glu Asn Ile 35 40 45 Ile Ser Tyr Asn Asn Arg Glu Tyr Leu Leu Ser Arg Phe Leu Pro Thr 50 55 60 Arg Gln Leu Asn Asp Phe Leu Ser Tyr Thr Arg Thr Asp Lys Ile Lys 65 70 75 80 Tyr Met Leu Arg Leu Gln Lys Gln Leu Pro Gln Thr Ile Ala Leu Asn 85 90 95 Lys Leu Tyr Ala His Pro Glu Asp Asn Ile Asn Phe Leu Gly Tyr Phe 100 105 110 Gln Asn Glu Leu Ser Leu Lys Ile Leu Lys Glu Arg Lys Asn Tyr Val 115 120 125 Leu Gly Trp Phe Val Phe Lys Lys Asp Ile Ala Asp Glu Phe Lys Lys 130 135 140 Val Thr Gln Asn Tyr Lys Pro Trp Thr Gly Ile His Ile Arg Arg Gly 145 150 155 160 Asp Phe Val Lys Arg Gly Leu Ser Leu Pro Val Phe Leu Tyr Lys Asp 165 170 175 Phe Leu Lys Ser Val Asp Lys Lys Asn Ile Tyr Ile Ser Cys Asp Asp 180 185 190 Pro Glu Thr Ile Ser Glu Phe Lys Asp Tyr Ser Leu Ile Arg Pro Ala 195 200 205 Asn Pro Leu Pro Glu Ile Pro Asn Phe Ile Phe Asp Phe Trp Met Leu 210 215 220 Lys Glu Ser Glu Met Val Leu Gly Cys Gly Ser Thr Phe Ser Trp Trp 225 230 235 240 Ala Ala Tyr Leu Gly Asn Arg Asn Asn Tyr Phe Ser Pro Pro Leu Thr 245 250 255 His Leu Trp Pro Lys Gly Tyr Lys Pro Thr Leu Gly Lys Met Asp Ile 260 265 270 <210> 21 <211> 276 <212> PRT <213> Spirochaetes bacterium <400> 21 Met Ile Gly Ile Lys Ile Gly Gly Gly Leu Gly Asn Gln Met Phe Gln 1 5 10 15 Tyr Ala Phe Gly Tyr Val Val Ala Lys Lys Phe Ser Thr Ser Phe Tyr 20 25 30 Leu Glu Lys Arg Asn Gln Phe Lys Leu Asp Lys Tyr Phe Ser Leu Arg 35 40 45 Ile Leu Glu Asn Ser Ile Asn Ser Leu Ile Lys Pro Leu Tyr Lys Met 50 55 60 Gln Thr Lys Leu Gly Lys Ile Lys Met Tyr Asp Trp Glu Asp Phe Gly 65 70 75 80 Thr Lys Thr Pro Glu Ser Phe Ile Ser Gln Ile Lys Asp Asn Ile Tyr 85 90 95 Tyr Cys Gly Tyr Phe Gln Ser Glu Lys Tyr Phe Glu Gly Phe Tyr Lys 100 105 110 Asp Leu Gln Lys Ile Phe Lys Ile Lys Lys Glu Tyr Ile Glu Gln Phe 115 120 125 Asn Ser Lys Tyr Glu Lys Phe Tyr Lys Glu Asn Lys Val Ile Ala Ile 130 135 140 His Ile Arg Arg Gly Asp Tyr Ile Asn Phe Gly Asp Asp Ser Leu Gly 145 150 155 160 Gly Lys Asn Met Thr Leu Pro Ile Ser Tyr Tyr Thr Asn Cys Leu Lys 165 170 175 Gln Ile Lys Asp Ile Ser Ser Tyr Lys Ile Ile Phe Ile Ser Asp Asp 180 185 190 Ile Glu Phe Val Lys Lys Glu Phe Gly Gln Lys Glu Asn Tyr Phe Phe 195 200 205 Glu Ser Asn Asn Glu Ile Ile Asp Phe Gln Val Ile Leu Asn Ala Asp 210 215 220 Lys Val Ile Met Ser Asn Ser Ser Phe Ser Trp Trp Ala Ser Tyr Leu 225 230 235 240 Asn Ile Lys Ala Thr Asp Ile Tyr Cys Pro Asn Tyr Trp Leu Gly Phe 245 250 255 Lys Ile Gly Thr Glu Asn Pro Ile Gly Ile Val Cys Lys Lys Trp Thr 260 265 270 Arg Leu Asp Ile 275 <210> 22 <211> 296 <212> PRT <213> Pedobacter soli <400> 22 Met Glu Thr Glu Ile Pro Val Thr Gln Asp Leu Asp Gln Asn Lys Gln 1 5 10 15 Val Tyr Leu Ile Thr Met Val Gly Ile Ser Ile Gln Cys Arg Leu Gly 20 25 30 Asn Gln Leu Phe Gln Tyr Ala Phe Ile Thr Ala Leu Ser Lys Lys Leu 35 40 45 Asn Thr Lys Tyr Phe Ile Ser Glu Lys Ile Glu Arg Phe Thr Leu Pro 50 55 60 Asp Tyr Phe Glu Leu Pro Gln Tyr Ser Ser Lys Leu Asn Phe Leu Arg 65 70 75 80 Lys Leu Ile Leu Lys Ile Lys Lys Gly Tyr Thr Leu Lys Pro Leu Gln 85 90 95 His Tyr Glu Ile Thr Gln Asn Thr Pro Ala Lys Asp Asn Glu Ile Tyr 100 105 110 Val Gly Tyr Phe Gln Ser Glu Ser Phe Phe Glu Gly Thr Lys Asp Asn 115 120 125 Ile Gly Glu Leu Ile Lys Val Arg Pro Glu His Lys Asn Ala Phe Asn 130 135 140 Asn Gln Phe Glu Lys Thr Phe Ser Gln Gln Lys Thr Ile Ala Ile His 145 150 155 160 Leu Arg Arg Gly Asp Tyr Leu Asn Leu Asp Asp Trp Trp Leu Glu Asn 165 170 175 Leu Gly Gly Asn Asn Leu Thr Leu Pro Ile Thr Tyr Tyr Glu Lys Cys 180 185 190 Phe Ala Ala Ile Lys Asn Leu Asn Asn Tyr Arg Leu Leu Phe Ile Ser 195 200 205 Asp Asp Ile Ala Phe Ala Arg Leu Asn Phe Gly His Leu Glu Asn Ala 210 215 220 Glu Phe His Asn Asn Glu Leu Ile Ile Asp Phe Gln Ile Met Met Asn 225 230 235 240 Ala Asp Ile Cys Ile Val Ser Asn Ser Ser Phe Ala Trp Trp Ala Ala 245 250 255 Tyr Leu Asn Ala Lys Ser Thr Lys Lys Ile Phe Cys Pro Glu Tyr Trp 260 265 270 Leu Gly Phe Asn Ile Asn Thr Glu Tyr Pro Lys Asn Ile Ile Pro Asp 275 280 285 Ser Trp Glu Gln Ile Ala Val Lys 290 295 <210> 23 <211> 304 <212> PRT <213> Bacteroidales bacterium <400> 23 Met Glu Asn Asn Ile Leu Gln Thr Thr Leu Leu Gly Arg Leu Gly Asn 1 5 10 15 Gln Leu Phe Ile Tyr Ala Ala Thr Arg Val Met Ala Leu Glu Ser Gly 20 25 30 Lys Lys Leu Lys Leu Thr Cys Asp Ala Met Glu Arg Phe Arg Ala Thr 35 40 45 Tyr Arg Leu Asp Cys Phe Asn Ile Pro Gln Asp Gln Val Ser Leu Val 50 55 60 Ser Asp Lys His Leu Ser Ile Lys Gln Lys Ile Gly Tyr Phe Phe Tyr 65 70 75 80 Leu Leu Lys Cys Arg His Lys Thr Val Val Gln Ile His Glu Leu Glu 85 90 95 Asn Lys Tyr Gln Lys Phe Tyr His Arg Phe Gly Leu Ile Leu Asn Gln 100 105 110 Glu Gly Tyr Ile Lys Pro Leu Leu Leu Glu Gly Gly Asn Trp Tyr Ala 115 120 125 Leu Gly Tyr Phe Gln Ser Asp Lys Tyr Phe Thr Lys Tyr Glu Asp Leu 130 135 140 Ile Arg Lys Glu Leu Thr Phe Lys Thr Asp Met Phe Cys Lys Asp Ser 145 150 155 160 Lys Met Leu Gly Ser Lys Leu Arg Ala Asn Lys Asn Ser Val Cys Leu 165 170 175 His Ile Arg Arg Gly Asp Tyr Leu Asn Asp Pro Val Phe Ala Val Cys 180 185 190 Asp Ile Asn Tyr Tyr Asn Lys Ala Ile Asp Lys Leu Leu Glu Leu Ile 195 200 205 Pro Asn Ala Glu Phe Phe Val Phe Ser Asp Ser Ile Asp Glu Val Arg 210 215 220 Glu Phe Leu Ala Lys Tyr Cys Asp Asn Tyr Phe His Tyr Ile Asp Val 225 230 235 240 Lys Tyr Thr Asp Gln Glu Ser Leu Tyr Leu Gly Ser Cys Cys Asn Asn 245 250 255 Phe Ile Met Thr Asn Ser Thr Phe Ser Trp Trp Met Gln Tyr Leu Ser 260 265 270 Asp Asn Pro Asn Lys Ile Val Leu Ala Pro Asn Arg Trp Tyr Asn Thr 275 280 285 Asn Asn Pro Cys Asp Ile Tyr Gln Asp Asn Trp Met Ile Ile Glu Val 290 295 300 <210> 24 <211> 292 <212> PRT <213> Butyrivibrio sp. <400> 24 Met Ile Ile Ile Lys Met Gln Gly Gly Leu Gly Asn Gln Leu Phe Leu 1 5 10 15 Tyr Gly Leu Tyr Lys Glu Leu Leu Tyr Leu Gly Arg Glu Val Lys Met 20 25 30 Asp Asn Ile Ser Gly Phe Glu Asp Asp Pro Gln Arg Ser Pro Ser Leu 35 40 45 Tyr Lys Leu Gly Ile Ser Tyr Asp Ile Ala Glu Asp Gly Glu Ile Arg 50 55 60 Thr Met Arg Asp Ser Tyr Met Asp Pro Leu Ser Arg Ile Arg Arg Lys 65 70 75 80 Ile Thr Gly Arg Lys Asn Lys Asp Tyr Tyr Glu Ala Leu Asp Gly Asn 85 90 95 Phe Asp Glu His Val Leu Glu Ala Asp Asp Ile Tyr Leu Asn Gly Tyr 100 105 110 Phe Gln Ser Asp Asp Tyr Phe Lys Asp Asp Glu Val Arg Gln Glu Leu 115 120 125 Ile Ala Asp Ile Cys Lys Asn Lys Asp Leu Tyr Leu Gly Asp Gln Asp 130 135 140 Val Thr Asp Ile Arg Asn Ala Ile Arg Ser Ser Asn Ser Val Ser Met 145 150 155 160 His Ile Arg Arg Gly Asp Tyr Leu Thr Pro Val Ser Arg Lys Thr Tyr 165 170 175 Gly Gly Ile Cys Thr Asp Asp Tyr Tyr Ala Lys Ala Met Glu Leu Val 180 185 190 Arg Ser Ser Tyr Pro Asp Ala Gln Phe Tyr Ile Phe Ser Asn Asp Ile 195 200 205 Asp Trp Cys Arg Ala Lys Tyr Lys Asp Thr Asp Asn Ile Ser Phe Val 210 215 220 Asn Ile Ser Gly Asp Asp Ser Asp Ile Met Glu Phe Phe Leu Met Ser 225 230 235 240 Glu Cys Arg His His Ile Leu Ala Asn Ser Ser Phe Ser Trp Trp Ala 245 250 255 Ala Phe Leu Gly Ser Ala Asp Asp Arg Asp Arg Leu Asn Ile Val Pro 260 265 270 Ser Lys Trp Thr Asn Thr Arg Gln Met Lys Asp Ile Tyr Ala Ser Trp 275 280 285 Met Thr Arg Ile 290 <210> 25 <211> 309 <212> PRT <213> Butyrivibrio fibrisolvens <400> 25 Met Ile Ile Ile Lys Leu Gln Gly Gly Leu Gly Asn Gln Leu Phe Leu 1 5 10 15 Tyr Gly Leu Tyr Arg Asn Leu Glu Arg Leu Gly Arg Asp Val Lys Leu 20 25 30 Asp Ile Glu Ser Gly Phe Glu Cys Asp Glu Leu Arg Ser Pro Cys Leu 35 40 45 Asp Gly Met Lys Leu Lys Tyr Glu Val Ala Thr Arg Lys Glu Val Ile 50 55 60 Ala Ile Arg Asp Ser Tyr Met Asp Ile Leu Ser Arg Ile Arg Arg Lys 65 70 75 80 Ile Thr Gly Arg Lys Thr Phe Asp Tyr Tyr Glu Pro Glu Asp Gly Asn 85 90 95 Phe Asp Pro Lys Val Leu Glu Leu Thr His Ala Tyr Leu Asn Gly Tyr 100 105 110 Phe Gln Ser Glu Lys Tyr Phe Gly Asp Asp Asn Ser Ala Lys Ala Leu 115 120 125 Lys Ile Glu Leu Thr Thr Asn Arg Tyr Asp Ile Leu Ser Ser Ser Asp 130 135 140 Leu Val Thr Asp Ile Tyr Asn Asp Ile Arg Lys Ser Glu Ser Val Ser 145 150 155 160 Leu His Ile Arg Arg Gly Asp Tyr Leu Thr Pro Gly Ile Ile Glu Thr 165 170 175 Tyr Gly Gly Ile Cys Thr Asp Asp Tyr Tyr Asp Lys Ala Ile Ala Met 180 185 190 Ile Arg Asp Lys His Pro Asp Ala Lys Leu Phe Val Phe Ser Asn Asp 195 200 205 Ile Asp Trp Cys Lys Glu Lys Met Ala Asp Tyr Lys Asn Ile Ser Phe 210 215 220 Val Ser Thr Met Pro Val Asn Asn Ile Ile Glu Glu Val Phe Asn Ser 225 230 235 240 Ser Gln Ser Ser Lys Ile Thr Asn Asn Tyr Lys Asp Leu Ala Glu Leu 245 250 255 Tyr Leu Met Ser Ala Cys Lys His His Val Leu Ala Asn Ser Ser Tyr 260 265 270 Ser Trp Trp Gly Ala Trp Leu Ser Asp Asn Glu Gly Met Thr Ile Val 275 280 285 Pro Ser Lys Trp Leu Asn Asn Lys Asn Met Thr Asp Ile Tyr Thr Arg 290 295 300 Asp Met Ile Leu Ile 305 <210> 26 <211> 277 <212> PRT <213> Candidatus magasanikbacteria <400> 26 Met Ile Phe Asp Lys Leu Ser Gly Gly Leu Gly Asn Gln Met Phe Gln 1 5 10 15 Tyr Ala Ala Gly Tyr Ser Leu Ser Leu Asn Asn Arg Ile Pro Leu Asn 20 25 30 Leu Asp Leu Ser Ser Phe Glu His Lys Lys Thr Gly Ile Thr His Arg 35 40 45 Tyr Phe Leu Leu Asn Lys Phe Asn Ile Asp Arg Asn Ile Leu Ile Asn 50 55 60 His Met Glu Lys Ile Ser Gly Tyr Arg Lys Phe Leu Ser Lys Phe Ile 65 70 75 80 Thr Lys Phe Phe Gly Glu Asn Phe Tyr Tyr Asn Ile Thr Phe Leu Ser 85 90 95 Ser Lys Tyr Leu Asp Gly Tyr Phe Gln Ser Glu Lys Tyr Phe Lys Asn 100 105 110 Ile Glu Asp Ile Leu Arg Lys Glu Phe Thr Leu Lys Asn Glu Met Ser 115 120 125 Val Val Ala Arg Gln Val Glu Ser Lys Ile Ser Asn Ser Ile Asn Ser 130 135 140 Val Ser Leu His Ile Arg Arg Gly Asp Tyr Val Leu Asp Asn Lys Thr 145 150 155 160 Asn Ser Tyr His Gly Ile Cys Asp Leu Asp Tyr Tyr Lys Lys Ala Val 165 170 175 Glu Tyr Phe Lys Asn Lys Leu Gly Glu Leu Asn Ile Phe Val Phe Ser 180 185 190 Asp Asp Ile Val Trp Val Lys Glu Asn Leu Arg Phe Glu Asn Leu Tyr 195 200 205 Phe Val Ser Ser Pro Asp Ile Lys Asp Tyr Glu Glu Leu Ile Leu Met 210 215 220 Ser Arg Cys Lys His Asn Ile Ile Ala Asn Ser Ser Phe Ser Trp Trp 225 230 235 240 Gly Ala Trp Leu Asn Ala Asn Lys Asn Lys Thr Val Ile Thr Pro Lys 245 250 255 Lys Trp Phe Gln Lys Tyr Asn Ile Asn Gln Lys His Ile Val Pro Lys 260 265 270 Ser Trp Ile Arg Leu 275 <210> 27 <211> 292 <212> PRT <213> Butyrivibrio fibrisolvens <400> 27 Met Ile Ile Ile Lys Met Gln Gly Gly Leu Gly Asn Gln Leu Phe Leu 1 5 10 15 Tyr Gly Leu Tyr Lys Glu Leu Leu Phe Leu Gly Arg Glu Val Lys Met 20 25 30 Asp Asn Asn Ala Gly Phe Ile Glu Asp Pro Leu Arg Asp Pro Val Leu 35 40 45 Ser Lys Leu Gly Ile Ser Tyr Asp Leu Ala Glu Asp Lys Glu Ile Arg 50 55 60 Lys Met Arg Asp Ser Tyr Met Asp Pro Leu Ser Arg Ile Arg Arg Lys 65 70 75 80 Leu Thr Gly Arg Lys Asn Lys Asp Tyr Tyr Glu Ala Leu Asp Gly Asn 85 90 95 Phe Asp Glu Thr Val Leu Lys Ala Asp Asp Ile Tyr Leu Asn Gly Tyr 100 105 110 Phe Gln Ser Glu Lys Tyr Phe Asn Asp Asp Ser Val Arg Gln Glu Leu 115 120 125 Arg Ala Asp Ile Cys Lys Asn Lys Glu Arg Tyr Met Ser Glu Ser Asp 130 135 140 Val Ala Asp Leu Arg Gln Glu Ile Ala Asn Ala Asn Ser Val Ser Met 145 150 155 160 His Ile Arg Arg Gly Asp Tyr Leu Thr Pro Val Ser Lys Glu Thr Tyr 165 170 175 Gly Gly Ile Cys Thr Asp Glu Tyr Tyr Glu Lys Ala Met Asp Leu Val 180 185 190 Lys Glu Lys Asn Pro Asp Ala Arg Phe Tyr Ile Phe Ser Asn Asp Ile 195 200 205 Asp Trp Cys Lys Glu Lys Tyr Lys Asp Thr Asp Asn Val Ser Phe Val 210 215 220 Ser Leu Thr Gly Asp Asp Ser Asp Ile Lys Glu Phe Phe Leu Met Ser 225 230 235 240 Glu Cys Arg His His Ile Leu Ala Asn Ser Ser Phe Ser Trp Trp Ala 245 250 255 Ala Phe Leu Ser Ala Ala Asp Asp Asn Lys Ser Leu Asn Ile Val Pro 260 265 270 Ser Lys Trp Thr Asn Thr Arg Gln Met Lys Asp Ile Tyr Ala Ser Trp 275 280 285 Met Thr Arg Ile 290 <210> 28 <211> 293 <212> PRT <213> Chryseobacterium scophthalmum <400> 28 Met Val Ala Val Glu Leu Ile Gly Gly Leu Gly Asn Gln Met Phe Gln 1 5 10 15 Tyr Ala Thr Ala Arg Ala Leu Ala Leu His Arg Asp Glu Pro Leu Ser 20 25 30 Ile Asp Gly Arg Leu Phe Asp Asn Tyr Lys Leu Arg Asn Phe Cys Leu 35 40 45 Ser His Phe Ser Ile Glu Ala Ile Val Val Lys Asn Asp Leu Pro Leu 50 55 60 Lys Thr Pro Gly Phe Ser Lys Lys Val Val Asp Gln Ile Leu Lys Lys 65 70 75 80 Thr Asn Thr Phe Ile Leu Gln Asn Lys Leu Phe Ser Val Tyr Gln Glu 85 90 95 Lys Asn Leu Leu Phe Asp Asp Ser Leu Phe Arg Asn Gly Lys Lys Asn 100 105 110 Ile Tyr Leu Lys Gly Tyr Phe Gln Ser Glu Lys Tyr Phe Val Lys Tyr 115 120 125 Glu Asp Gln Leu Arg Lys Asp Phe Lys Ile Val Thr Pro Leu Lys Lys 130 135 140 Glu Thr Ile Asp Leu Leu Lys Ile Ile Lys Glu Lys Asn Ser Val Ser 145 150 155 160 Leu His Ile Arg Arg Gly Asp Tyr Val Ser Asn Pro Thr Val Asn Ala 165 170 175 Ile His Gly Thr Cys Asp Leu Asn Tyr Tyr His Arg Ala Ile Glu Ile 180 185 190 Val Lys Glu Lys Ile Leu His Pro Val Phe Phe Ile Phe Ser Asp Asp 195 200 205 Ile Asp Trp Ala Lys Glu Asn Leu Lys Leu Glu Asn Thr Thr Tyr Phe 210 215 220 Val Asp Phe Asn Asp Ala Ser Thr Ser Tyr Glu Asp Leu Lys Leu Met 225 230 235 240 Ser Ala Cys Lys His Asn Ile Ile Ala Asn Ser Ser Phe Ser Trp Trp 245 250 255 Gly Ala Trp Leu Asn Thr Asn Lys Ser Lys Thr Val Ile Ala Pro Ser 260 265 270 Lys Trp Phe Asn Thr Asp Val Leu Asn Ser Gln Asp Ile Ile Pro Glu 275 280 285 Ser Trp Met Lys Ile 290 <210> 29 <211> 261 <212> PRT <213> Akkermansia sp. <400> 29 Met Asn Met Glu Arg Lys Thr Gly Leu Met Asn Lys Lys Tyr Val Ser 1 5 10 15 Pro Cys Phe Leu Pro Gly Met Arg Leu Gly Asn Ile Met Phe Thr Leu 20 25 30 Ala Ala Ala Cys Ala His Ala Arg Thr Val Gly Val Glu Cys Arg Val 35 40 45 Pro Trp Ala Tyr Asn Asp Ala Ser Leu Met Leu Arg Ser Arg Leu Gly 50 55 60 Gly Trp Val Leu Pro Ser Thr Pro Cys Gly Thr Asn Glu Pro Pro Ser 65 70 75 80 Trp Gln Glu Pro Ser Phe Ser Tyr Cys Pro Val Pro Ser Arg Ile Arg 85 90 95 Thr Gly Gly Leu Arg Gly Tyr Phe Gln Ser Ala Arg Tyr Phe Glu Gly 100 105 110 Gln Glu Ala Phe Ile Arg Ala Leu Phe Ala Pro Leu Thr Ala Glu Lys 115 120 125 Glu Pro Gly Ala Val Gly Ile His Ile Arg Leu Gly Asp Tyr Arg Arg 130 135 140 Leu Arg Asp Lys His Arg Ile Leu Asp Pro Gly Phe Leu Arg Arg Ala 145 150 155 160 Ala Gly His Leu Ser Ser Gly Lys Asn Arg Leu Val Leu Phe Ser Asp 165 170 175 Glu Pro Asp Glu Ala Ala Glu Met Leu Ala Arg Val Pro Ala Phe Gly 180 185 190 Arg Phe Ala Leu Glu Ile Asp Arg Gly Ala Pro Cys Glu Ser Leu Arg 195 200 205 Arg Met Thr Ala Met Glu Glu Leu Val Met Ser Cys Ser Ser Phe Ser 210 215 220 Trp Trp Gly Ala Trp Leu Gly Asn Thr Arg Lys Val Ile Val Pro Arg 225 230 235 240 Asp Trp Phe Val Gly Gly Val Glu Asp Tyr Arg Asp Ile Tyr Leu Pro 245 250 255 His Trp Val Thr Leu 260 <210> 30 <211> 263 <212> PRT <213> Lingula unguis <400> 30 Met Phe Gln Phe Ala Ser Leu Leu Gly Ile Ala Ala Arg Asn Asn Leu 1 5 10 15 Thr Ala Val Ile Pro Tyr Asn Pro Glu Met Glu Arg Ile Phe Lys Ile 20 25 30 Ser Thr Pro Ser Thr Lys Asn Leu Gln Asn Thr Leu Gly Met Tyr Leu 35 40 45 Thr Val Thr Gln Phe Tyr Gly Arg Cys Cys Tyr Tyr Asp Ile Leu Thr 50 55 60 Glu Thr Leu Asp Pro Arg His Asn Tyr Leu Leu Tyr Gly Tyr Phe Gln 65 70 75 80 Ser Trp Lys Tyr Phe Lys Asn Val Asn Asp Ile Val Arg Gln Glu Phe 85 90 95 Gln Phe Arg Glu Glu Ile Leu Asn Glu Ala Lys Lys Phe His Arg Asp 100 105 110 Val Ser Asn Lys Phe Gln Cys His Glu Asn Asn Ser Cys Thr Phe Val 115 120 125 Gly Ile His Ile Arg Arg Gly Asp Ile Ser Asp Tyr Asp Val Tyr Lys 130 135 140 Lys Ala Gly Tyr Thr Thr Pro Ser Glu Gln Tyr Phe Lys Thr Ala Met 145 150 155 160 Asn Phe Phe Lys Arg Lys His Lys Asn Lys Val Val Phe Ile Val Cys 165 170 175 Ser Asp Ser Ser Lys Gly Trp Gln Lys Lys Leu Thr Ser Ser Asp Val 180 185 190 Val Phe Ser His Ala Lys Asp Gln Gly Val Asp Leu Ala Ile Leu Ser 195 200 205 Leu Cys Gln His Met Ile Ile Ser Thr Gly Thr Tyr Gly Trp Trp Ala 210 215 220 Ala Phe Leu Thr Gly Gly Thr Thr Val Tyr Tyr Arg Asp Trp Pro Lys 225 230 235 240 Ala Gly Ser Trp Leu Tyr Asp Gln Val Phe Lys Glu Asp Tyr Phe Val 245 250 255 Arg Gly Trp Ile Pro Met Lys 260 <210> 31 <211> 263 <212> PRT <213> Lingula unguis <400> 31 Met Phe Gln Phe Ala Ser Leu Leu Gly Ile Ala Ala Arg Asn Asn Leu 1 5 10 15 Thr Ala Val Ile Pro Tyr Asn Pro Glu Met Glu Arg Ile Phe Lys Ile 20 25 30 Ser Thr Pro Ser Thr Lys Asn Leu Gln Asn Thr Leu Gly Met Tyr Leu 35 40 45 Thr Val Thr Gln Phe Tyr Gly Arg Cys Cys Tyr Tyr Asp Ile Leu Thr 50 55 60 Glu Thr Leu Asp Pro Arg Tyr Asn Tyr Leu Leu Tyr Gly Tyr Phe Gln 65 70 75 80 Ser Trp Lys Tyr Phe Lys Asn Val Asn Asp Ile Val Arg Gln Glu Phe 85 90 95 Gln Phe Arg Glu Glu Ile Leu Asn Glu Ala Lys Lys Phe His Arg Asp 100 105 110 Val Ser Asn Lys Phe Gln Cys His Glu Asn Asn Ser Cys Thr Phe Val 115 120 125 Gly Ile His Ile Arg Arg Gly Asp Ile Ser Asp Tyr Asp Val Tyr Lys 130 135 140 Lys Ala Gly Tyr Thr Thr Pro Ser Glu Gln Tyr Phe Lys Thr Ala Met 145 150 155 160 Asn Phe Phe Lys Arg Lys His Lys Asn Lys Val Val Phe Ile Val Cys 165 170 175 Ser Asp Ser Ser Lys Gly Trp Gln Lys Lys Leu Thr Ser Ser Asp Val 180 185 190 Val Phe Ser His Ala Lys Asp Gln Gly Val Asp Leu Ala Ile Leu Ser 195 200 205 Leu Cys Gln His Met Ile Ile Ser Thr Gly Thr Tyr Gly Trp Trp Ala 210 215 220 Ala Phe Leu Thr Gly Gly Thr Thr Ile Tyr Tyr Arg Asp Trp Pro Lys 225 230 235 240 Ala Gly Ser Trp Leu Tyr Asp Gln Val Phe Lys Glu Asp Tyr Phe Val 245 250 255 Arg Gly Trp Ile Pro Met Lys 260 <210> 32 <211> 273 <212> PRT <213> Flexibacter sp. <400> 32 Met Ile Val Val Gln Leu Ile Gly Gly Leu Gly Asn Gln Leu Phe Gln 1 5 10 15 Tyr Ala Ala Ala Lys Ala Phe Ala Leu Glu Thr Glu Gln Lys Leu Tyr 20 25 30 Ile Asp Val Ser Gln Phe Glu Ser Tyr Lys Leu His Asn Tyr Ala Leu 35 40 45 Asn His Phe Asn Ile Ile Ser Asn Val Tyr Asn Lys Pro Asn Arg Tyr 50 55 60 Phe Lys Lys Ile Lys Ser Phe Tyr Gln Lys Asn Thr Ser Tyr Lys Glu 65 70 75 80 Val Asp Phe Gly Tyr Asn Gln Asp Leu Phe Asn Leu Lys Gly Asp Thr 85 90 95 Ile Phe Leu Asp Gly Tyr Phe Gln Ser Glu Lys Tyr Phe Lys Lys Tyr 100 105 110 Glu Lys Glu Ile Arg Glu Asp Phe Glu Ile Arg Thr Pro Leu Lys Lys 115 120 125 Ile Thr Thr Asp Thr Ile Ala Lys Ile Glu Thr Val Asn Ser Val Ser 130 135 140 Ile His Ile Arg Arg Gly Asp Tyr Leu Asn Asn Pro Leu His Asn Thr 145 150 155 160 Ser Lys Glu Glu Tyr Tyr Lys Lys Ala Leu Glu Ile Ile Glu Glu Lys 165 170 175 Ile Thr Asn Pro Val Phe Phe Val Phe Ser Asp Asp Ile Asn Trp Val 180 185 190 Lys Ser Asn Phe Ser Thr Asn His Glu Thr Val Phe Ile Asp Phe Asn 195 200 205 Asp Ala Ser Thr Asn Phe Glu Asp Leu Lys Leu Met Ala Ser Cys Lys 210 215 220 His Asn Val Ile Ala Asn Ser Ser Phe Ser Trp Trp Gly Ala Trp Leu 225 230 235 240 Asn Lys Asn Gln Asn Lys Ile Val Ile Ala Pro Lys Leu Trp Phe Asn 245 250 255 Asp Asn Ser Ile Asn Ile Asn Asp Ile Ile Pro Thr Ser Trp Leu Lys 260 265 270 Ile <210> 33 <211> 295 <212> PRT <213> Bacteroidetes bacterium <400> 33 Met Ile Ile Val Asn Leu Tyr Gly Gly Leu Gly Asn Gln Leu Phe Gln 1 5 10 15 Tyr Ala Cys Gly Lys Ala Val Ala Glu Arg Leu Gly Val Glu Leu Gln 20 25 30 Leu Asp Ile Ser His Leu Lys Glu Tyr Gly Lys Ala Thr Asn Phe Thr 35 40 45 Val Arg Asp Phe Glu Leu Gly Val Phe Ser Ile Asn Glu Lys Thr Ala 50 55 60 Asp Ile Gln Glu Val Arg Lys Tyr Val Pro Asn Leu Tyr Lys Thr Ser 65 70 75 80 Arg Tyr Tyr His Gln Leu Trp Arg Ile Lys Arg Leu Phe Asn Gly Arg 85 90 95 His Leu Phe Ile Glu Arg Thr Trp Gln Arg Asp Arg Tyr Ile Glu Asn 100 105 110 Ile Glu Lys Val Lys Asp Asn Thr Tyr Leu Tyr Gly Tyr Phe Gln Ser 115 120 125 Ala Arg Tyr Phe Ala Asp Ile Glu Glu Lys Leu Arg Thr Thr Leu Val 130 135 140 Leu Lys Asp Arg Ile Asp Ala Glu Asn Glu Ala Leu Ile Gln Gln Met 145 150 155 160 Glu Asn Glu Asn Ser Val Ser Ile His Ile Arg Arg Gly Asp Tyr Glu 165 170 175 Asn Ser Arg Phe Ser Leu Pro Glu Leu Asp Thr Tyr Tyr Leu Pro Ala 180 185 190 Ile Lys Ala Ile Gln Thr Gln Ile Pro Gln Pro Lys Phe Tyr Ile Phe 195 200 205 Ser Asn Asp Ala Glu Trp Val Lys Lys Asn Phe Asn Ser Leu Glu Ile 210 215 220 Lys Asn Glu Ile Val Ser Ile Asn Ser Gly Ser Arg Ser Phe Met Asp 225 230 235 240 Met Ile Leu Met Ser Arg Cys Lys His Asn Ile Ile Gly Asn Ser Ser 245 250 255 Phe Ser Trp Trp Gly Ala Trp Leu Asn Gln Asn Pro Asp Lys Met Ile 260 265 270 Val Val Pro Lys Asn Trp Tyr Lys Asn Gly Arg Glu Thr Asp Leu Gln 275 280 285 Leu Lys Glu Trp Ile Lys Ile 290 295 <210> 34 <211> 279 <212> PRT <213> Pedobacter sp. <400> 34 Met Ile Ile Val Lys Leu Gln Gly Gly Leu Gly Asn Gln Met Phe Gln 1 5 10 15 Tyr Ala Ala Ala Arg Thr Leu Ser Asn Ser Gly Lys Val Tyr Leu Asp 20 25 30 Phe Ser Phe Leu Asn Lys Asn Asn Ile Thr Thr Asp Ser Phe Thr Ala 35 40 45 Arg Gln Phe Glu Leu Asp Ile Phe Lys Arg Thr Lys Thr His Ile Ser 50 55 60 Asn Pro Tyr Phe Ile Arg Leu Ile Arg Ser Asn Arg Lys Ile Phe Lys 65 70 75 80 Met Leu Ser Pro Arg Tyr Gln Glu Val Lys Asp Glu Asn Ile Phe Asp 85 90 95 Phe Leu Asn Asn Asn Ser Ser Asn Leu Tyr Leu Asp Gly Tyr Phe Gln 100 105 110 Asn Pro Leu Ile Phe Gln Asp Ile Arg Asn Ile Leu Met Asp Glu Phe 115 120 125 Thr Phe Pro Glu Leu Ser Lys Leu Ser Lys Glu Ile Glu Leu Asn Ile 130 135 140 Leu Ser Thr Thr Asn Pro Val Ala Ile His Ile Arg Arg Gly Asp Tyr 145 150 155 160 Thr Lys Pro Glu Ile Gln Ser Tyr His Gly Ile Leu Pro Leu Asn Tyr 165 170 175 Tyr Lys Gln Gly Ile Glu Arg Ile Lys Ser Lys Val Glu Asn Pro Ile 180 185 190 Phe Tyr Ile Phe Ser Asp Asp Pro Glu Trp Cys Glu His Asn Leu Ser 195 200 205 Phe Ile Asp Asn Lys His Ile Ile Ala Gly Thr Lys Gln Ala Trp Glu 210 215 220 Asp Met Phe Leu Ile Ser Lys Cys Lys His Gln Ile Ile Ala Asn Ser 225 230 235 240 Ser Phe Ser Trp Trp Gly Ala Trp Leu Asn Ala Asn Pro Glu Lys Ile 245 250 255 Ile Val Ala Pro Lys Lys Trp Phe Asn Asn Val Asp Ile Asn Ile Leu 260 265 270 Pro Lys Ala Trp Ile Ser Leu 275 <210> 35 <211> 317 <212> PRT <213> Candidatus planktophila lacus <400> 35 Met Lys Arg Ser Asn Ser Ser Val Gly Val Ser Leu Thr Gly Gly Leu 1 5 10 15 Gly Asn Gln Leu Phe Gln Val Ala Ala Ala Leu Ala Met Ser Glu Gly 20 25 30 Glu Arg Val Thr Leu Ile Ser Ser Tyr Gly Lys Pro Arg Phe Ser Lys 35 40 45 Asn Asn Glu Ala Glu Ile Tyr Ser Leu Ile Arg Ala Glu Asp Trp Phe 50 55 60 Glu Arg Asp Asp Glu Val Ser Ser Trp Leu Pro Ala Lys Cys Val Gly 65 70 75 80 Tyr Ile Leu Arg Met Gly Val Gln Pro Lys Ile Trp Glu Lys Gly Leu 85 90 95 Val Val Phe Phe Ile Asn Lys Ile Ala Asn Leu Ile Leu Ser Ile Ser 100 105 110 Arg Asn Ser Lys Ile Arg Ile Leu Ala Gly Lys Gly Val Gly Tyr Phe 115 120 125 Thr Leu Pro Glu Lys Lys Tyr Phe Thr Leu Leu Ser Gly Tyr Phe Gln 130 135 140 Ser Tyr Arg Trp Ala Ser Leu Asp Asp Val Tyr Lys Lys Leu Phe His 145 150 155 160 Leu His Pro Lys His Pro Gly Ser Asp Leu Lys Tyr Tyr Glu Ser Leu 165 170 175 Thr Ser Asp Cys Lys Pro Leu Val Ile His Ile Arg Leu Gly Asp Tyr 180 185 190 Leu Ser Glu Arg Asp Phe Gly Ile Pro Ser Val Glu Tyr Tyr Lys Ser 195 200 205 Ala Val Ser Arg Ile Ser Thr Glu Val Glu Phe Asp Glu Ile Trp Val 210 215 220 Phe Ser Asp Thr Leu Thr Lys Ala Lys Glu Ile Leu Arg Phe Asp Gly 225 230 235 240 Arg Phe Lys Val Arg Trp Ile Gly Glu Leu Asp Gly Ser Ala Ala Ser 245 250 255 Thr Phe Gln Ala Met Arg His Gly Ala Gly Tyr Ile Ile Gly Asn Ser 260 265 270 Thr Phe Ser Trp Trp Ala Ala Phe Leu Arg Leu Asp Thr Lys Ala Pro 275 280 285 Val Ile Ala Pro Lys Pro Trp Phe Arg Gly Met Glu Glu Pro Phe Glu 290 295 300 Leu Ile Pro Lys Asn Trp Thr Arg Ile Asp Ser Asn Tyr 305 310 315 <210> 36 <211> 304 <212> PRT <213> Rhizobiales bacterium <400> 36 Met Ala Thr Gln Pro Arg Ile Pro Pro Asp Gln Thr Glu Arg Lys Thr 1 5 10 15 Gln Val Ala Val Gln Leu His Gly Gly Leu Gly Asn Gln Met Phe Gln 20 25 30 Ala Ala Ala Gly Leu Ala Leu Ala Glu Arg Leu Gly Ala Ser Leu Leu 35 40 45 Phe Asp Thr Ser Arg Phe Arg Asp Lys Gly Leu Arg Ala Tyr Ala Leu 50 55 60 Ser Ala Phe Ala Leu Ser Ala Lys Val Leu His Glu Thr Pro Thr Pro 65 70 75 80 Leu Ala Ala Leu Arg Arg Ala Ile Leu Lys Gly Met Gly Arg Lys Ser 85 90 95 Ala Thr Gln Pro Asn Tyr Trp Arg Gly Arg Phe Tyr Arg Glu Pro His 100 105 110 Phe His Phe Asp Pro Gly Phe Thr His Leu Ala Gly Asp Thr Met Ile 115 120 125 Ala Gly Tyr Phe Gln Ser Pro His Tyr Phe Ala Gly Tyr Glu Ser His 130 135 140 Ile Ala Leu Val Leu Ala Pro Glu Lys Leu Met Ser Asn Ala Ala Leu 145 150 155 160 His Leu Ala Glu Ile Leu Asn Gly Glu Ala Ser Val Ala Ile His Leu 165 170 175 Arg Arg Gly Asp Phe Ala Ala Asp Pro Lys Ala Ala Ala Val His Gly 180 185 190 Val Leu Asp Trp Ser Tyr Tyr Asp Arg Ala Val Ala His Ile Arg Ala 195 200 205 Gln Gln Pro Glu Ala Arg Phe Phe Val Phe Ser Asp Asn Pro Glu Ala 210 215 220 Ala Ala Glu Gly Ala Ala Arg Trp Pro Asn Ala Glu Pro Met Ala Gly 225 230 235 240 Thr Ser Ala Gly Asp Asp Leu Phe Leu Met Ser Arg Ala Arg His His 245 250 255 Ile Ile Ala Asn Ser Ser Phe Ser Trp Trp Ser Cys Trp Leu Asp Arg 260 265 270 Arg Glu Gly Gly Ile Arg Ile Ala Pro Glu Gln Trp Phe Ala Ala Gly 275 280 285 Asn Pro Gln Glu Thr Arg Asp Leu Cys Pro Pro Glu Trp Leu Arg Leu 290 295 300 <210> 37 <211> 396 <212> PRT <213> Helicobacter sp. <400> 37 Met Ile Glu Ile Arg Leu Gln Gly Arg Leu Gly Asn Gln Phe Phe Ile 1 5 10 15 Tyr Ala Phe Ala Lys Asn Leu Arg Lys His Leu Arg Asn Ser Asn Ser 20 25 30 Pro Lys Leu Ala Lys Gln Glu Val Ile Leu Val Cys Asp Asp Ile His 35 40 45 Ser Tyr Glu Val Pro Asp Ile Leu Lys Tyr Asn Val Asp Lys Ser Phe 50 55 60 Phe Arg Pro Ser Ala Phe His Gly Phe Lys Thr Thr Ile Asp Lys Ala 65 70 75 80 Phe Phe Phe Met Phe Arg Val Ala Arg Lys Gly Ile Tyr Leu Ile Thr 85 90 95 Lys Lys Thr Ile Ser Tyr Arg His Lys Asn Lys Glu Val Pro His Met 100 105 110 Leu Pro Glu Thr Leu Met Glu Thr Tyr Glu Asn Gly Glu Phe Asp Lys 115 120 125 Ala Val Ile Ala Lys Cys Leu Asn Lys Phe Ile Ile Gly Tyr Phe Gln 130 135 140 Ser Glu Leu Tyr Phe Glu Asp Val Lys Glu Glu Leu Lys Lys Asp Phe 145 150 155 160 Ser Leu Gln Glu Asn His Leu Pro Val Met Lys Val Ser Ala Phe Lys 165 170 175 Ala Leu Leu Thr Lys Ile Lys Glu Gln Asp Ser Ile Phe Leu His Ile 180 185 190 Arg Arg Gly Asp Tyr Leu Ser Ser Val Asn Val Thr Lys Tyr Ala Gln 195 200 205 Leu Gly Val Asn Tyr Tyr Thr Lys Ala Ile Ala Leu Val Leu Gln Lys 210 215 220 Cys Pro Asn Ala Lys Phe Tyr Ile Phe Ser Asp Asp Val Ala Trp Val 225 230 235 240 Lys Lys Glu Gly Ile Ser Leu Phe Gly Leu Asn Lys Leu Asp Tyr Glu 245 250 255 Val Val Asn Leu Asn Ser Pro Asn Ala Gly Tyr Leu Asp Leu Glu Leu 260 265 270 Met Lys Ala Cys Lys Gly Ala Ile Thr Ala Asn Ser Ser Phe Ser Tyr 275 280 285 Trp Gly Ala Tyr Leu Met Glu Asn Pro Lys Val Val Ile Ala Pro Phe 290 295 300 Pro Phe His Phe Ile His Ser Asn Met Asp Leu Leu Pro Arg Asp Phe 305 310 315 320 Ile Val Leu Asp Cys Lys Thr Gly Glu Val Leu Glu Glu Lys Asp Tyr 325 330 335 Met Tyr Thr Asn Ser Lys Ser Pro Lys Ser Leu Lys Val Ser Ala Phe 340 345 350 Thr Glu Met Phe Glu Ala Ala Phe Asp Val Val Tyr Asn Pro Asn Ser 355 360 365 Gly Gly Gly Gly Gly Asn Ile Pro Leu Gln Lys Thr Thr Lys Ile Ala 370 375 380 Lys Val Val Asn Phe Phe Lys Lys Leu Ile Leu Arg 385 390 395 <210> 38 <211> 277 <212> PRT <213> Candidatus magasanikbacteria <400> 38 Met Ile Phe Asp Lys Leu Ser Gly Gly Leu Gly Asn Gln Met Phe Gln 1 5 10 15 Tyr Ala Ala Gly Tyr Ser Leu Ser Leu Asn Asn Arg Ile Pro Leu Asn 20 25 30 Leu Asp Leu Ser Ser Phe Glu His Lys Lys Thr Gly Ile Thr His Arg 35 40 45 Tyr Phe Leu Leu Asn Lys Phe Asn Ile Asp Arg Asn Ile Leu Ile Asn 50 55 60 His Met Glu Lys Ile Ser Gly Tyr Arg Lys Phe Leu Ser Lys Phe Ile 65 70 75 80 Thr Lys Phe Phe Gly Glu Asn Phe Tyr Tyr Asn Ile Thr Phe Leu Ser 85 90 95 Ser Lys Tyr Leu Asp Gly Tyr Phe Gln Ser Glu Lys Tyr Phe Lys Asn 100 105 110 Ile Glu Asp Ile Leu Arg Lys Glu Phe Thr Leu Lys Asn Glu Met Ser 115 120 125 Val Val Ala Arg Gln Val Glu Ser Lys Ile Ser Asn Ser Ile Asn Ser 130 135 140 Val Ser Leu His Ile Arg Arg Gly Asp Tyr Val Leu Asp Asn Lys Thr 145 150 155 160 Asn Ser Tyr His Gly Ile Cys Asp Leu Asp Tyr Tyr Lys Lys Ala Val 165 170 175 Glu Tyr Phe Lys Asn Lys Leu Gly Glu Leu Asn Ile Phe Val Phe Ser 180 185 190 Asp Asp Ile Ala Trp Val Lys Glu Asn Leu Arg Leu Glu Asn Leu Tyr 195 200 205 Phe Val Ser Ser Pro Asp Ile Lys Asp Tyr Glu Glu Leu Ile Leu Met 210 215 220 Ser Arg Cys Lys His Asn Ile Ile Ala Asn Ser Ser Phe Ser Trp Trp 225 230 235 240 Gly Ala Trp Leu Asn Ala Asn Lys Asn Lys Thr Val Ile Thr Pro Lys 245 250 255 Lys Trp Phe Gln Lys Tyr Asn Ile Asn Gln Lys His Ile Val Pro Lys 260 265 270 Ser Trp Ile Arg Leu 275 <210> 39 <211> 284 <212> PRT <213> Candidatus magasanikbacteria <400> 39 Met Ile Ile Val Lys Leu Ser Ala Gly Leu Gly Asn Gln Met Phe Gln 1 5 10 15 Tyr Ala Leu Gly Arg Arg Leu Ser Leu Asp Trp Gly Asp Glu Leu Leu 20 25 30 Phe Asp Ser Ser Trp Phe Tyr Ser Thr Arg Glu Gly Glu Thr Pro Arg 35 40 45 Glu Leu Glu Leu His Lys Phe His Leu Leu Leu Pro Glu Ala His Pro 50 55 60 Ala Asp Ile Glu Lys Ala Lys Pro Cys Thr Phe Ile Lys Ile Val Lys 65 70 75 80 Lys Val Lys Ala Arg Leu Asp Lys Asn Val Phe Tyr Arg Phe Asn Lys 85 90 95 Thr Leu Leu Lys Lys Arg Lys Tyr Val Tyr Leu Asp Gly Tyr Phe Gln 100 105 110 Ser Tyr Lys Tyr Phe Glu Ser Ile Arg Glu Thr Leu Leu Thr Asp Phe 115 120 125 Ile Leu Thr Asp Gly Tyr Ser Asp Asp Ala Tyr Thr Thr Lys Gln Glu 130 135 140 Ile Glu Arg Val Gly Glu Ser Val Ser Ile His Ile Arg Arg Gly Asp 145 150 155 160 Phe Ala Ser Thr Cys Lys Thr Trp Asn Gly Leu Cys Ser Ile Asp Tyr 165 170 175 Tyr Gln Lys Ala Leu Ala Thr Ile Gln Lys Thr His Pro Leu Val Thr 180 185 190 Val Phe Ile Phe Ser Asp Asp Ile Lys Trp Ala Lys Glu Asn Leu Tyr 195 200 205 Phe Asp Ala Val Pro Met Val Phe Val Ser Arg Pro Ser Leu Ser Ala 210 215 220 Thr Glu Glu Leu Ser Leu Met Ser Leu Cys Lys His Gln Ile Ile Ala 225 230 235 240 Asn Ser Thr Phe Ser Trp Trp Ala Ala Trp Leu Asn Lys Asn Val Glu 245 250 255 Lys Ile Val Val Ala Pro Ser Arg Trp Leu Val Val Ser Asn Ile Asp 260 265 270 Thr Val Asp Leu Leu Pro Pro Asn Trp Ile Gln Ile 275 280 <210> 40 <211> 305 <212> PRT <213> Diaminobutyricimonas aerilata <400> 40 Met Asn Lys Ser Val Thr Gln His Thr Glu Ile Asn Ile Gly Asn Gly 1 5 10 15 Val Cys Ala Tyr Val Ala Gly Gly Leu Gly Asn Gln Leu Phe Ile Leu 20 25 30 Ala Ala Ala Trp Glu Gln Ala Lys Arg Leu Glu Cys Pro Leu Tyr Leu 35 40 45 Asp Thr Ser Asn His Asp Val Arg Gly Gly Trp Arg Phe Glu Leu Glu 50 55 60 Asp Ile Gly Ala Pro Gly Val Val Leu Gly Pro His Ser Pro Trp Thr 65 70 75 80 Ser Val Arg Leu Ser Lys Glu Arg Val Leu Pro Phe Pro Arg Phe Thr 85 90 95 Arg Pro Val Arg Arg Arg Val Phe Phe Glu Arg Asp Ser Ser Arg Tyr 100 105 110 Asp Pro Ala Ile Asn Asp Ile Arg Pro Gly Thr Thr Ile Phe Gly Tyr 115 120 125 Phe Gln Ser Ala Arg Tyr Phe Glu Arg Ser Ala Asp Ser Met His Gln 130 135 140 Leu Ile Glu Ser Ala Pro Thr Ser Pro Ala Glu Ala Asp Leu Leu Ala 145 150 155 160 His Tyr Ala Ala Thr Pro Arg Leu Thr Leu His Leu Arg Arg Gly Asp 165 170 175 Tyr Leu Asn Ala Pro Glu Ser Arg Arg Val Ile Ala Thr Thr Ala Tyr 180 185 190 Ala Arg Arg Ala Tyr Arg Leu Leu Gln Gln Met Gly Ala Ala Ala Pro 195 200 205 Leu Arg Leu Phe Ser Asp Ser Pro Asn Leu Val Gln Glu Glu Leu Gly 210 215 220 Asp Leu Asp Leu Asp Ile Glu Phe Ala Asp Pro Glu Gly Val Leu Ser 225 230 235 240 Pro Val Asn Thr Met Arg Ala Met Ser Tyr Gly Ser Gly Leu Val Met 245 250 255 Ser Asn Ser Ser Phe Ser Trp Trp Ala Gly Trp Leu Met Arg Arg Arg 260 265 270 Asp Ser Asn Leu Pro Val Ile Ala Pro Arg Pro Trp Asn Glu Thr Gly 275 280 285 Thr Ala Lys Ala Asp Leu Leu Phe Pro Glu Trp Ile Gly Leu Asp Ala 290 295 300 Arg 305 <210> 41 <211> 273 <212> PRT <213> Flavobacterium magnum <400> 41 Met Ile Val Val Lys Leu Ile Gly Gly Leu Gly Asn Gln Met Phe Gln 1 5 10 15 Tyr Ala Ala Ala Lys Ala Ile Ala Ile Glu Arg Asn Gln Pro Leu Glu 20 25 30 Leu Asp Val Ser Ala Phe Asp His Tyr Lys Leu His Gln Phe Ala Leu 35 40 45 His His Phe Asn Phe Ser Ala Lys Val Phe Arg Pro Arg His Ile Leu 50 55 60 Trp Asp Lys Val Arg Ser Leu Phe Ile Lys Ile Leu His Tyr Lys Glu 65 70 75 80 Arg Asp Phe Gly Phe Asn Ala Arg Ile Phe Asp Leu Lys Ala Asp Asp 85 90 95 Leu Tyr Leu Asp Gly Tyr Phe Gln Ser Glu Lys Tyr Phe Leu Lys His 100 105 110 Ser Ser Thr Ile Arg Arg Glu Phe Glu Ile Ile Ser Ser Leu Lys Pro 115 120 125 Gln Thr Leu Lys Val Leu Glu Glu Ile Arg Asn Thr Asn Ser Val Ser 130 135 140 Leu His Ile Arg Arg Gly Asp Tyr Val Gly Asn Pro Leu His Gly Thr 145 150 155 160 Asp Asn Glu Leu Phe Tyr Arg Lys Ala Leu Gly Phe Ile Glu Thr Lys 165 170 175 Ile Glu Asn Pro Lys Leu Phe Val Phe Ser Asp Asp Thr Leu Trp Ala 180 185 190 Lys Gln Asn Phe Lys Ser Lys His Glu Val Ile Phe Ile Asp Phe Asn 195 200 205 Asp Ala Leu Ser Asn Phe Glu Asp Ile Lys Leu Met Ser Cys Cys Lys 210 215 220 His Asn Ile Ile Ala Asn Ser Ser Phe Ser Trp Trp Gly Ala Trp Leu 225 230 235 240 Asn Asp Asn Pro Gly Lys Leu Val Val Ala Pro Gln Gln Trp Phe Asn 245 250 255 Asp Lys Ser Ile Asn Thr Ser Asp Leu Ile Pro Glu Asn Trp Ile Arg 260 265 270 Phe <210> 42 <211> 283 <212> PRT <213> Litoreibacter ponti <400> 42 Met Ile Ile Ala Arg Ile Phe Gly Gly Leu Gly Asn Gln Leu Phe Gln 1 5 10 15 Tyr Ala Thr Ala Arg Ala Leu Ala Lys Arg Ala Cys Ala Pro Leu Trp 20 25 30 Leu Asp Ile Arg Leu Ala Pro Pro Gly Asp His Trp Glu Phe Ala Leu 35 40 45 Asn His Phe Ala Ile Glu Ala Lys Ile Ala Gln Pro Gly Glu Leu Pro 50 55 60 Pro Asp Lys Asn Ser Lys Leu Arg Tyr Ala Ala Trp Arg Tyr Leu Gly 65 70 75 80 Gly Ser Pro Lys Phe Thr Arg Glu Arg Gly Leu Gly Phe Asn Glu Asn 85 90 95 Ile Leu Ser Leu Arg Gly Asp Val Tyr Leu His Gly Tyr Phe Gln Ser 100 105 110 Glu Arg Tyr Phe Glu Asp Phe Pro Gly Leu Arg Gln Glu Leu Thr Ile 115 120 125 Lys Thr Pro Pro Ser Asp Glu Asn Arg Arg Trp Ala Asp Asp Ile Arg 130 135 140 Ala Val Pro Ser Val Ser Leu His Leu Arg Arg Gly Asp Tyr Leu Thr 145 150 155 160 Ala Lys Gly Ala Gly Ser His Ala Ser Cys Asp Ala Ala Tyr Tyr Glu 165 170 175 Arg Ala Leu Asn His Val Ala Glu Lys Met Asp Ala Glu Pro Lys Val 180 185 190 Phe Val Phe Ser Asp Asp Pro Asp Trp Ala Arg Asp Asn Leu Lys Leu 195 200 205 Pro Phe Glu Met Arg Val Ala Gly His Asn Gly Ser Asp Lys His Tyr 210 215 220 Glu Asp Met Arg Leu Ile Ser Ile Cys Arg His Asn Ile Ile Ala Asn 225 230 235 240 Ser Thr Phe Ser Trp Trp Gly Ala Trp Leu Asn Asp Asn Pro Asp Lys 245 250 255 Val Val Val Ala Pro Lys Val Trp Phe Ala Asn Pro Lys Leu Ala Asn 260 265 270 Pro Asp Ile Thr Pro Glu Ser Trp Ile Arg Leu 275 280 <210> 43 <211> 290 <212> PRT <213> Dysgonomonas alginatilytica <400> 43 Met Ile Thr Leu Ile Ile Ser Gly Gly Leu Gly Asn Gln Met Phe Glu 1 5 10 15 Tyr Ala Ala Gly Arg Ala Leu Ser Leu Arg His Arg Thr Asn Leu Ser 20 25 30 Ile Asp Leu Tyr Ile Leu Asn Lys Lys Thr Lys Ala Thr Ile Arg Asn 35 40 45 Tyr Glu Leu Ile Val Phe Asn Ile Glu Thr Pro Ile Thr Ser Ser Ile 50 55 60 Phe Asn Lys Ile Ala Val Lys Gly Phe Gly Leu Leu Lys Ser Ser Asn 65 70 75 80 Thr Arg Arg Ile Leu Leu Ser Asn Thr Gly Ile Phe Arg Asp Glu Lys 85 90 95 Ala Gln Cys Tyr Asp Ser Arg Phe Lys Lys Leu Ser Glu Lys Met Thr 100 105 110 Leu Phe Gly Tyr Phe Gln Asn Glu Asn Tyr Phe Arg Asp Ile Ser Glu 115 120 125 Gln Leu Arg Thr Asp Phe Thr Phe Gln Ala Pro Leu Ile Gly Arg Asn 130 135 140 Asp Glu Ile Arg Ser Leu Ile Glu Leu Asn Thr Ser Val Ser Ile His 145 150 155 160 Ile Arg Arg Gly Asp Tyr Ser Asn Thr Asn Ser Asn Leu Pro Ile Leu 165 170 175 Asp Ile Ser His Tyr Lys Lys Ala Ile Glu Tyr Ile Ser Ser Gln Ile 180 185 190 Ser Asn Pro Tyr Phe Phe Ile Phe Ser Asp Asp Ile Asp Trp Val Lys 195 200 205 Asn Asn Leu Asp Leu Ser Asp Ser Asn His Gln Phe Ile Asp Trp Asn 210 215 220 Lys Asn Lys Asn Ser Tyr Ile Asp Met Gln Leu Met Ser Leu Cys Lys 225 230 235 240 His Asn Ile Ile Ala Asn Ser Ser Phe Ser Trp Trp Gly Ala Trp Leu 245 250 255 Asn Thr Asn Pro Asp Lys Leu Val Ile Ala Pro Asp Lys Trp Tyr Lys 260 265 270 Gly Asp Asn Gly Ile Tyr Pro Asp Gly Phe Leu Pro Lys Glu Trp Ile 275 280 285 Val Leu 290 <210> 44 <211> 285 <212> PRT <213> Campylobacter hyointestinalis lawsonii <400> 44 Met Val Ile Val Lys Ile Leu Gly Gly Leu Gly Asn Gln Met Phe Gln 1 5 10 15 Tyr Ala Tyr Ala Lys Ser Leu Glu Gln Asn Gly Tyr Ile Val Lys Ile 20 25 30 Asp Ile Ser Gly Phe Lys Asp Tyr Val Leu Gln Lys Tyr Gly Leu Asp 35 40 45 Lys Tyr Asn Ile Asp Leu Gln Ile Ser Gln Lys His Glu Asn Asp Lys 50 55 60 Ile Tyr Lys Asn Thr Leu Phe Tyr Lys Ile Leu Arg Lys Ile Ser Val 65 70 75 80 Asn Leu Ser Ser Ser Ile Lys Glu Lys Asp Leu Arg Phe Asn Asn Lys 85 90 95 Leu Leu Asn Ile Lys Asp Asn Ser Tyr Ile Tyr Gly Tyr Phe Gln Ser 100 105 110 Glu Lys Tyr Phe Lys Asp Ile Arg Glu Ile Ile Leu Lys Gln Phe Thr 115 120 125 Ile Asn Gln Glu Phe Ser Asp Tyr Ala Lys Asp Ile Glu Lys Lys Ile 130 135 140 Leu Asn Ser Gln Asn Ser Cys Ser Ile His Ile Arg Arg Gly Asp Tyr 145 150 155 160 Val Thr Asn Asn Asn Ile Leu Ile His Gly Met Cys Ser Ile Glu Tyr 165 170 175 Tyr Lys Lys Ser Met Lys Tyr Leu Glu Asn Lys Ile Ala Asn Ile Ser 180 185 190 Tyr Phe Ile Phe Ser Asp Asp Ile Glu Trp Val Lys Asn Asn Leu Pro 195 200 205 Ile Gln Asn Gly Ile Tyr Ile Asp Ser Lys Glu Lys Arg Ile Pro His 210 215 220 Glu Asp Ile Tyr Leu Met Ser Leu Cys Asn His Asn Ile Ile Ala Asn 225 230 235 240 Ser Thr Phe Ser Trp Trp Gly Gly Trp Leu Asn Gln Asn Lys Asn Lys 245 250 255 Ile Val Ile Ala Pro Lys Ile Trp Phe Ala Asp Lys Lys Leu Gln Glu 260 265 270 Gln Ser Lys Asp Ile Val Cys Gln Glu Trp Ile Lys Ile 275 280 285 <210> 45 <211> 290 <212> PRT <213> Phycisphaerales bacterium <400> 45 Met Ile Ile Val Glu Leu Lys Gly Gly Leu Gly Asn Gln Met Phe Gln 1 5 10 15 Tyr Ala Phe Ala Arg Asn Leu Ala His Ile His Asn Thr Thr Leu Lys 20 25 30 Thr Asp Ile Ser Gly Tyr Ala Cys Ser Ser Gly Met Pro Tyr Ala Leu 35 40 45 Ser Pro Phe Asn Val Gln Glu Asn Phe Ala Thr Pro Asp Glu Ile Gln 50 55 60 Ser Phe Thr Thr Pro Lys Gln Thr Ala Ala Gly Lys Trp Ile His Ser 65 70 75 80 Leu Leu His Asn His Pro Lys Lys Ala Lys Ser Tyr Ile Arg Val Lys 85 90 95 Tyr Pro His Phe Asn Pro Lys Tyr Leu Lys Leu Pro Asp Asn Val Tyr 100 105 110 Leu Ser Gly Tyr Phe Gln Ser Glu Lys Tyr Phe Ile Asn Ile Ala Asp 115 120 125 Ile Ile Arg Asn Glu Phe Lys Ile Lys Thr Glu Met Asp Ser Arg Asn 130 135 140 Gly Asn Ile Ala Glu Thr Ile Gln Asn Ser Gln Ser Val Ser Ile His 145 150 155 160 Ile Arg Arg Gly Asp Tyr Ile Thr Asn Pro Lys Ala Ile Gln Thr His 165 170 175 Gly Val Cys Gly Leu Asp Tyr Tyr Asn Arg Cys Val Glu Gln Ile Ser 180 185 190 Leu Lys Ile Lys Ser Pro Arg Phe Phe Val Phe Ser Asp Asp Phe Asp 195 200 205 Trp Ser Arg Lys Asn Ile Lys Leu Pro Asn Asp Ala Ile Tyr Ile Gly 210 215 220 His Asn Gly Pro Asn Glu Ala Tyr Lys Asp Leu Gln Leu Met Ser Phe 225 230 235 240 Cys Lys Tyr His Ile Thr Ala Asn Ser Thr Phe Ser Trp Trp Gly Ala 245 250 255 Trp Leu Ala Ala Tyr Lys Asp Lys Ile Val Phe Val Pro Lys Lys Trp 260 265 270 Phe Ala Lys Asn Met Asn Thr Glu Gly Met Met Pro Asp Asn Trp Ile 275 280 285 Lys Val 290 <210> 46 <211> 261 <212> PRT <213> Akkermansia sp. <400> 46 Met Asn Met Glu Arg Lys Thr Gly Leu Met Asn Lys Lys Tyr Val Ser 1 5 10 15 Pro Cys Phe Leu Pro Gly Met Arg Leu Gly Asn Ile Met Phe Thr Leu 20 25 30 Ala Ala Ala Cys Ala His Ala Arg Thr Val Gly Val Glu Cys Arg Val 35 40 45 Pro Trp Ala Tyr Asn Asp Ala Ser Leu Met Leu Arg Ser Arg Leu Gly 50 55 60 Gly Trp Val Leu Pro Ser Thr Pro Cys Gly Thr Asn Glu Pro Pro Ser 65 70 75 80 Trp Gln Glu Pro Ser Phe Ala Tyr Cys Pro Val Pro Ser Arg Ile Arg 85 90 95 Thr Gly Gly Leu Arg Gly Tyr Phe Gln Ser Ala Arg Tyr Phe Gly Gly 100 105 110 Gln Glu Ala Phe Ile Arg Ala Leu Phe Ala Pro Leu Thr Ala Glu Lys 115 120 125 Glu Pro Gly Ala Val Gly Ile His Ile Arg Leu Gly Asp Tyr Arg Arg 130 135 140 Leu Arg Asp Lys His Arg Ile Leu Asp Pro Gly Phe Leu Arg Arg Ala 145 150 155 160 Ala Gly His Leu Ser Ser Gly Lys Asn Arg Leu Val Leu Phe Ser Asp 165 170 175 Glu Pro Asp Glu Ala Ala Glu Met Leu Ala Arg Val Pro Ala Phe Gly 180 185 190 Arg Phe Ala Leu Glu Ile Asp Arg Gly Ala Pro Cys Glu Ser Leu Arg 195 200 205 Arg Met Thr Ala Met Glu Glu Leu Val Met Ser Cys Ser Ser Phe Ser 210 215 220 Trp Trp Gly Ala Trp Leu Gly Asn Thr Arg Lys Val Ile Val Pro Arg 225 230 235 240 Asp Trp Phe Val Gly Gly Val Glu Asp Tyr Arg Asp Ile Tyr Leu Pro 245 250 255 His Trp Val Thr Leu 260 <210> 47 <211> 304 <212> PRT <213> Helicobacter sp. <400> 47 Met Phe Gly Tyr Ala Phe Ala Lys Ala Leu Glu Ile Gln Tyr Asn Thr 1 5 10 15 Glu Val Lys Leu Asp Ile Leu Phe Tyr Thr Lys Lys Ile Asn Arg Lys 20 25 30 Asn Asn Asn Ile Arg Asn Phe Glu Leu Ser His Phe Asp Val His Ile 35 40 45 Lys Tyr Ala Phe Gly Val Ala Asn Arg Leu Asp Lys Ile Ile Thr Ser 50 55 60 Leu Ile Pro Lys Arg Phe Arg Ala Asp Phe Thr Pro Ser Pro Phe Asn 65 70 75 80 Leu Ile Lys Asp Asn Lys Asp Leu His Ile Lys Ile Lys Glu Arg Tyr 85 90 95 Pro Phe Pro Lys Asp Thr Tyr Phe Glu Gly Tyr Phe Gln Asn Leu Val 100 105 110 Tyr Phe Asp His Ile Arg Asn Ile Leu Leu His Asp Phe Cys Leu Lys 115 120 125 Thr Pro Leu Asp Leu Lys Asn Lys Gln Leu Gln Asp Tyr Ile Leu His 130 135 140 Thr His Asn Ser Val Phe Leu His Ile Arg Arg Gly Asp Tyr Leu Glu 145 150 155 160 Tyr Glu His Ser Gly Phe Ile Asn Leu Thr Tyr Thr Asn Tyr Tyr Asn 165 170 175 Thr Ala Leu Lys Thr Ile Gln Glu Lys Leu Gly Lys Ala His Ile Phe 180 185 190 Ile Phe Ser Asn Asp Met Val Trp Cys Lys Glu His Phe Leu Asn Gly 195 200 205 Leu Asp Ser Lys Ile Leu Gln Asp Leu Thr Phe Gln Phe Ala Asp Asn 210 215 220 Asn Asn Glu Gly Ser Ala Ala Phe Glu Met Glu Leu Met Arg Ser Cys 225 230 235 240 Lys His Gly Ile Ile Ala Asn Ser Thr Phe Ser Trp Trp Ala Ala Tyr 245 250 255 Leu Ile Gln Tyr Pro Asn Lys Ile Ile Val Ala Pro Asn Glu Phe Phe 260 265 270 Thr Ile Val Gln Asp Ser Tyr Ser Val Phe His Asp Tyr Glu Asp Lys 275 280 285 Ile Leu Pro Lys Asn Trp His Arg Ile Pro Leu Thr Lys Glu Asn Lys 290 295 300 <210> 48 <211> 297 <212> PRT <213> Pedobacter sp. <400> 48 Met Val Ile Val Lys Leu Met Gly Gly Leu Gly Asn Gln Met Phe Gln 1 5 10 15 Tyr Ala Ala Ala Arg Ser Leu Ser Phe Lys Arg Lys Val Tyr Leu Asp 20 25 30 Lys Ser Phe Leu Asp Glu His Lys Val Ser Ser Thr Asp Phe Thr Ala 35 40 45 Arg Asp Tyr Glu Leu Asp Lys Phe Lys Asn Ile Gln Ala Arg Asn Gly 50 55 60 Ile Lys Asn Cys Ile Thr Phe Phe Thr Asp Phe Arg Phe Pro Phe Asn 65 70 75 80 Ile Leu Arg Tyr Phe Phe Ala Arg Tyr Ala Ile Leu Ile Lys Gln Val 85 90 95 Glu Asn Glu Phe Ile Asp Leu Ala Ser Cys Lys Asn Tyr Thr Leu Ile 100 105 110 Tyr Leu Asp Gly Tyr Phe Gln Ser Glu Lys Tyr Phe Ser His Ile Arg 115 120 125 Lys Gln Leu Leu Lys Glu Phe Glu Phe Pro Gln Leu Asp Thr Glu Asn 130 135 140 Thr Ala Ile Arg Asn Lys Ile Ile Arg Ser Glu Asn Thr Val Ser Leu 145 150 155 160 His Ile Arg Arg Gly Asp Tyr Asn Ser Ser Glu Ile Ile His Asn Ile 165 170 175 His Gly Val Leu Pro Leu Thr Tyr Tyr His Gln Ala Ile Thr Ala Leu 180 185 190 Thr Leu Lys Tyr Gly Lys Leu Ser Ile Tyr Ile Phe Ser Asp Asp Met 195 200 205 Lys Trp Ala Lys Glu His Leu Leu Ile Asn Asp Gln Glu Val His Tyr 210 215 220 Val Asp Leu Asn His Lys Lys Lys His Trp Gln Asp Met Ala Leu Met 225 230 235 240 Ser Ala Cys Lys His His Ile Ile Ala Asn Ser Ser Phe Ser Trp Trp 245 250 255 Gly Ala Trp Leu Ala Asp Thr Gly Gly Asp Thr Phe Ala Pro Leu Lys 260 265 270 Trp Phe Asn Ser Asp Ala Thr Lys Phe Glu Ile Asn Asp Phe Ile Pro 275 280 285 Gln Asn Trp Thr Ile Val Asn Tyr Gly 290 295 <210> 49 <211> 285 <212> PRT <213> Empedobacter brevis <400> 49 Met Ile Ala Val Glu Ile Ile Gly Gly Leu Gly Asn Gln Met Phe Gln 1 5 10 15 Tyr Ala Thr Ala Lys Ala Met Ala Leu His Arg Arg Asp Asp Leu Leu 20 25 30 Ile Asp Lys Arg Pro Phe Glu Ser Tyr Ser Leu His Ser Phe Ser Leu 35 40 45 Pro His Phe Asn Val Thr Ala Pro Tyr Leu Lys Glu Asp Ile Val Leu 50 55 60 Asp Leu Lys Ser Thr Ser Asp Lys Leu Lys Ala Phe Ile Lys Gly Gln 65 70 75 80 Lys Asn Tyr Thr Leu Tyr Gln Glu Asn Gly Leu Gly Tyr Asp Ala Ser 85 90 95 Leu Phe Asp Leu Gln Ala Lys Asn Val Tyr Leu Lys Gly Tyr Phe Gln 100 105 110 Ser Glu Lys Tyr Phe Ile Lys Tyr Glu Asp Glu Ile Arg Asn Asp Phe 115 120 125 Glu Ile Val Thr Pro Leu Gln Glu Lys Thr Val Glu Met Leu Thr Ile 130 135 140 Ile Asn Glu Val Asn Ala Val Ser Leu His Ile Arg Arg Gly Asp Tyr 145 150 155 160 Val Thr Asn Pro Glu Ala Asn Ser Val His Gly Thr Cys Asn Leu Asp 165 170 175 Tyr Tyr Gln Arg Ala Ile Ser His Ile Arg Glu Val Val Glu Asn Pro 180 185 190 Ile Phe Phe Ile Phe Ser Asp Asp Ile Gln Trp Ala Lys Glu Asn Leu 195 200 205 Thr Ile Pro Glu Thr Thr His Phe Ile Asp Phe Thr Asp Ala Ser Thr 210 215 220 Asn Tyr Glu Asp Ile Lys Leu Met Ser Thr Cys Lys His Asn Ile Ile 225 230 235 240 Ala Asn Ser Ser Phe Ser Trp Trp Gly Ala Trp Leu Asn Lys Asn Lys 245 250 255 Ser Lys Ile Val Ile Ala Pro Ser Lys Trp Phe Asn Val Asp Tyr His 260 265 270 Asn Ala Asp Asp Ile Ile Pro Glu Ser Trp Met Lys Ile 275 280 285 <210> 50 <211> 261 <212> PRT <213> Akkermansia muciniphila <400> 50 Met Asn Met Glu Arg Lys Thr Gly Leu Met Asn Lys Lys Tyr Val Ser 1 5 10 15 Pro Cys Phe Leu Pro Gly Met Arg Leu Gly Asn Ile Met Phe Thr Leu 20 25 30 Ala Ala Ala Cys Ala His Ala Arg Thr Val Gly Val Glu Cys Arg Val 35 40 45 Pro Trp Ala Tyr Asn Asp Ala Ser Leu Met Leu Arg Ser Arg Leu Gly 50 55 60 Gly Trp Val Leu Pro Ser Thr Pro Cys Gly Thr Asn Glu Pro Pro Ser 65 70 75 80 Trp Gln Glu Pro Ser Phe Ala Tyr Cys Pro Val Pro Phe Arg Ile Arg 85 90 95 Thr Gly Gly Leu Arg Gly Tyr Phe Gln Ser Ala Arg Tyr Phe Glu Gly 100 105 110 Gln Glu Ala Phe Ile Arg Ala Leu Phe Ala Pro Leu Thr Ala Glu Lys 115 120 125 Glu Pro Gly Ala Val Gly Ile His Ile Arg Leu Gly Asp Tyr Arg Leu 130 135 140 Leu Arg Asp Lys His Arg Ile Leu Asp Pro Gly Phe Leu Arg Arg Ala 145 150 155 160 Ala Gly His Leu Ser Ser Gly Lys Asn Arg Leu Val Leu Phe Ser Asp 165 170 175 Glu Pro Asp Glu Ala Ala Glu Met Leu Ala Cys Val Pro Ala Phe Gly 180 185 190 Arg Phe Ala Leu Glu Ile Asp Arg Gly Ala Pro Cys Glu Ser Leu Arg 195 200 205 Arg Met Thr Ala Met Glu Glu Leu Val Met Ser Cys Ser Ser Phe Ser 210 215 220 Trp Trp Gly Ala Trp Leu Gly Asn Thr Arg Lys Val Ile Val Pro Arg 225 230 235 240 Asp Trp Phe Val Gly Gly Val Glu Asp Tyr Arg Asp Ile Tyr Leu Pro 245 250 255 His Trp Val Thr Leu 260 <210> 51 <211> 261 <212> PRT <213> Akkermansia muciniphila <400> 51 Met Asn Met Glu Arg Lys Thr Gly Leu Met Asn Lys Lys Tyr Val Ser 1 5 10 15 Ser Cys Phe Leu Pro Gly Met Arg Leu Gly Asn Ile Met Phe Thr Leu 20 25 30 Ala Ala Ala Cys Ala His Ala Arg Thr Val Gly Val Glu Cys Arg Val 35 40 45 Pro Trp Ala Tyr Asn Asp Ala Ser Leu Met Leu Arg Ser Arg Leu Gly 50 55 60 Gly Trp Val Leu Pro Ser Thr Pro Cys Gly Thr Asn Glu Pro Pro Ser 65 70 75 80 Trp Gln Glu Pro Ser Phe Ser Tyr Cys Pro Val Pro Ser Arg Ile Arg 85 90 95 Thr Gly Gly Leu Arg Gly Tyr Phe Gln Ser Ala Arg Tyr Phe Glu Gly 100 105 110 Gln Glu Ala Phe Ile Arg Ala Leu Phe Ala Pro Leu Thr Ala Glu Lys 115 120 125 Glu Pro Gly Ala Val Gly Ile His Ile Arg Leu Gly Asp Tyr Arg Arg 130 135 140 Leu Arg Asp Lys His Arg Ile Leu Asp Pro Gly Phe Leu Arg Arg Ala 145 150 155 160 Ala Gly His Leu Ser Ser Gly Lys Asn Arg Leu Val Leu Phe Ser Asp 165 170 175 Glu Pro Asp Glu Ala Ala Glu Met Leu Ala Arg Val Pro Ala Phe Gly 180 185 190 Arg Phe Ala Leu Glu Ile Asp Arg Gly Ala Pro Cys Glu Ser Leu Arg 195 200 205 Arg Met Thr Ala Met Glu Glu Leu Val Met Ser Cys Ser Ser Phe Ser 210 215 220 Trp Trp Gly Ala Trp Leu Gly Asn Thr Arg Lys Val Ile Val Pro His 225 230 235 240 Asp Trp Phe Val Gly Gly Val Glu Asp Tyr Arg Asp Ile Tyr Leu Pro 245 250 255 His Trp Val Thr Leu 260 <210> 52 <211> 261 <212> PRT <213> Akkermansia muciniphila <400> 52 Met Asn Met Glu Arg Lys Thr Gly Leu Met Asn Lys Lys Tyr Val Ser 1 5 10 15 Pro Cys Phe Leu Pro Gly Met Arg Leu Gly Asn Ile Met Phe Thr Leu 20 25 30 Ala Ala Ala Cys Ala His Ala Arg Thr Val Gly Val Glu Cys Arg Val 35 40 45 Ser Trp Ala Tyr Asn Asp Ala Ser Leu Met Leu Arg Ser Arg Leu Gly 50 55 60 Gly Trp Val Leu Pro Ser Thr Pro Cys Gly Thr Asn Glu Pro Pro Ser 65 70 75 80 Trp Gln Glu Pro Ser Phe Ser Tyr Cys Pro Val Pro Ser Arg Ile Arg 85 90 95 Thr Gly Gly Leu Arg Gly Tyr Phe Gln Ser Ala Arg Tyr Phe Glu Gly 100 105 110 Gln Glu Ala Phe Ile Arg Ala Leu Phe Ala Pro Leu Thr Ala Glu Lys 115 120 125 Glu Pro Gly Ala Val Gly Ile His Ile Arg Leu Gly Asp Tyr Arg Arg 130 135 140 Leu Arg Asp Lys His Arg Ile Leu Asp Pro Gly Phe Leu Arg Arg Ala 145 150 155 160 Ala Gly His Leu Ser Ser Gly Lys Asn Arg Leu Val Leu Phe Ser Asp 165 170 175 Glu Pro Asp Glu Ala Ala Glu Met Leu Ala Arg Val Pro Ala Phe Gly 180 185 190 Arg Phe Ala Leu Glu Ile Asp Arg Gly Ala Pro Cys Glu Ser Leu Arg 195 200 205 Arg Met Thr Ala Met Glu Glu Leu Val Met Ser Cys Ser Ser Phe Ser 210 215 220 Trp Trp Gly Ala Trp Leu Gly Asn Thr Arg Lys Val Ile Val Pro Arg 225 230 235 240 Asp Trp Phe Val Gly Gly Val Glu Asp Tyr Arg Asp Ile Tyr Leu Pro 245 250 255 His Trp Val Thr Leu 260 <210> 53 <211> 319 <212> PRT <213> Chitinophagaceae bacterium <400> 53 Met Glu Lys Leu Phe Arg Ile Gln Ala Ala His Arg Leu Ser Gly Val 1 5 10 15 Arg Ala His Leu Ile Arg Arg His Leu Phe Gln Lys Leu Ile Ser Arg 20 25 30 Arg Asp Ser Met Ile Ile Val Gln Leu Lys Gly Gly Leu Gly Asn Gln 35 40 45 Met Phe Gln Tyr Ala Ala Ala Arg Ala Leu Ala Ala Arg His Arg Thr 50 55 60 Gln Val Leu Leu Asp Thr Ala His Tyr Arg Ala Asp Gln Leu Arg Asn 65 70 75 80 Phe Asp Leu Phe His Leu Gln Val Ala Ala Ser Thr Ala Ala Pro Glu 85 90 95 Asp Cys Ala Pro Leu Lys Ala Gln Ser Thr Phe Ser Arg Leu Ala Ala 100 105 110 Arg Leu Thr Pro Tyr Ser Arg Lys Arg Phe Tyr Lys Gln Pro Phe Tyr 115 120 125 His Phe Asp Pro His Phe Phe Glu Leu Gly Pro Asp Val Tyr Leu Gln 130 135 140 Gly Tyr Phe Gln Ser Glu Arg Tyr Phe Ala Pro Leu Ala Pro Gln Leu 145 150 155 160 Arg Glu Glu Phe Arg Phe Arg Asp Ala Phe Pro Glu His Val Arg Asn 165 170 175 Ala Ala Gly Glu Met Arg Ala Gly Pro Ser Val Ser Leu His Ile Arg 180 185 190 Arg Gly Asp Tyr Arg Asn Pro Glu Thr Leu Arg Val His Gly Ile Leu 195 200 205 Pro Phe Ala Tyr Tyr Glu Ala Ala Ile Arg Lys Leu Gln Glu Arg Ile 210 215 220 Gly Pro Pro Ala Phe Tyr Val Phe Thr Asp Asp Pro Gln Trp Val Ala 225 230 235 240 Ala Asn Leu Asp Ile Pro Gly Ala Arg Ile Val Ser Gly Ala Thr Ser 245 250 255 Ser Thr His Phe Glu Asp Leu Tyr Leu Met Ser His Cys Arg His His 260 265 270 Ile Leu Ala Asn Ser Ser Phe Ser Trp Trp Gly Ala Trp Leu Asn Thr 275 280 285 Asp Pro Gly Lys Ile Val Ile Ala Pro Arg Gln Trp Phe Asn Glu Gly 290 295 300 Pro Val Asp Leu Gln Asp Leu Met Pro Ala Gly Trp Glu Arg Ile 305 310 315 <210> 54 <211> 284 <212> PRT <213> Chitinophagaceae bacterium <400> 54 Met Ile Ala Ile Gln Leu Lys Gly Gly Leu Gly Asn Gln Leu Phe Gln 1 5 10 15 Tyr Ala Ala Ala Arg Thr Leu Ala Ile Arg Gln His Thr Glu Val Leu 20 25 30 Leu Asp Thr Ser His Tyr Arg Glu Asp Gln Leu Arg Asp Phe Asp Leu 35 40 45 Phe His Leu Asn Val Lys Ala Arg Ile Ala Thr Ala Ser Gln Ile Asp 50 55 60 Glu Ile Arg Pro Thr Gly Thr Val Gly Arg Ala Leu Ser His Ile Ala 65 70 75 80 Pro Tyr Arg Phe Lys Arg Ile Tyr Gln Gln Pro Phe Tyr His Tyr Asp 85 90 95 Ala Gly Phe Val Arg Leu Arg Gly Pro Val Tyr Leu Lys Gly Tyr Phe 100 105 110 Gln Ser Glu Ala Tyr Phe Arg Pro Val Ala Ala Glu Ile Arg Arg Glu 115 120 125 Leu Thr Phe Arg Glu Leu Pro Leu Pro Gln Ile Gln Ala Leu Gly Ala 130 135 140 Arg Leu Arg Gln Glu Gln Ser Val Ser Leu His Ile Arg Arg Gly Asp 145 150 155 160 Tyr Lys Asn Pro Glu Thr Leu Arg Val His Gly Ile Leu Pro Leu Glu 165 170 175 Tyr Tyr Arg Ala Ala Val Lys Arg Ile Thr Asp Ser Arg Pro Asp Ala 180 185 190 Arg Phe Tyr Val Phe Thr Asp Asp Leu Glu Trp Val Arg Gln His Leu 195 200 205 Ala Met Pro Glu Ala Met Leu Val Ser Gly Glu Ile Thr Lys Thr His 210 215 220 Phe Glu Asp Leu Tyr Leu Met Gln His Cys Arg Asn His Ile Leu Ala 225 230 235 240 Asn Ser Ser Phe Ser Trp Trp Gly Ala Trp Leu Asn Pro Asp Lys Glu 245 250 255 Lys Ile Val Val Ala Pro Lys Ala Trp Phe Asn Glu Gly Pro Lys Asp 260 265 270 Thr Gln Asp Leu Ile Pro Arg Ser Trp Ile Arg Leu 275 280 <210> 55 <211> 245 <212> PRT <213> Proteobacteria bacterium <400> 55 Met Asp Lys Phe Ser Val Leu Thr Ser Gln Ala Ser Pro Ala Glu Val 1 5 10 15 Glu Lys Arg Phe Pro Leu Leu Ser Phe Arg Ser Leu Ile Lys Ile Tyr 20 25 30 Arg Arg Leu Leu Arg Ile Leu Pro Lys Leu Ser Arg Lys Tyr Tyr Phe 35 40 45 Glu Lys Ser Met Ala Phe Asp His Ser Leu Phe Glu Thr Asn Pro Glu 50 55 60 Cys Phe Ile Asp Gly Tyr Phe Gln Ser Tyr Lys Tyr Phe Glu Gly Val 65 70 75 80 Asn Asp Ile Ile Leu Gln Glu Phe Gln Pro Lys Glu Ala Pro Asp Glu 85 90 95 Val Asn His His Leu Ile Arg Val Met Gln Val Ala Asn Ser Val Ser 100 105 110 Leu His Ile Arg Arg Gly Asp Tyr Ile Ser Ser Ala Glu Ala Asn Lys 115 120 125 Val His Gly Ile Cys Gly Leu Glu Tyr Tyr Arg Ala Ala Val Glu Asn 130 135 140 Leu Gln Ser Arg Leu Val Asp Pro Gln Tyr Phe Val Phe Ser Asp Asp 145 150 155 160 Ile Ala Trp Ala Lys Glu Asn Leu Asp Leu Gly Ala Gly Ala Thr Phe 165 170 175 Val Gln His Asn Ala Gly Ser Lys Ser Tyr Trp Asp Leu Val Leu Met 180 185 190 Ser His Cys Lys His Asn Ile Ile Ala Asn Ser Thr Phe Ser Trp Trp 195 200 205 Gly Ala Trp Leu Asn Gln Asn Pro Asp Lys Ile Val Tyr Ala Pro Lys 210 215 220 Thr Trp Phe Ala Asp Ser Ser Lys Asn Thr Ser Asp Leu Ile Pro Gln 225 230 235 240 Ser Trp Met Arg Ile 245 <210> 56 <211> 339 <212> PRT <213> Flaviaesturariibacter sp. <400> 56 Met Ser Trp His Leu Arg Val Val Leu Thr Ile Ala Ser Ala Asn Gly 1 5 10 15 Cys Asn Gly Arg Cys Arg Asn Gly Cys Pro Thr Arg Ser Leu Cys Cys 20 25 30 Ile Ser Ala Arg Arg Arg Ser Leu Arg His His Ser Glu Thr Phe Ile 35 40 45 Ser Lys Ala Pro Gly Arg Phe Met Ile Val Val Glu Leu Lys Gly Gly 50 55 60 Leu Gly Asn Gln Leu Phe Gln Tyr Ala Ala Ala Arg Ala Leu Ala Ala 65 70 75 80 Lys His Gly Thr Gly Val Ala Phe Asp Ala Thr His Tyr His Glu Asp 85 90 95 Gln Leu Arg Asn Phe Glu Leu Leu His Met Lys Val Ala Ala Arg Lys 100 105 110 Ala Thr Ser Gly Glu Val Ala Ala Leu Lys Pro His Ser Phe Phe Asp 115 120 125 Arg Leu Arg Asn Arg Leu Ala Pro Tyr Glu Arg Lys Arg Phe Tyr Lys 130 135 140 Gln Pro Phe Phe His Tyr Asp Lys Gln Phe Phe Arg Leu Pro Ala Lys 145 150 155 160 Val Tyr Leu Arg Gly Tyr Phe Gln Ser Ala Arg Tyr Phe Glu Pro Val 165 170 175 Ala Glu Ile Ile Arg Gln Glu Phe Arg Phe Gln Gln Pro Met Pro Pro 180 185 190 Ala Val Glu Glu Leu Gly Arg Arg Leu Arg Ser Glu Glu Ser Val Ser 195 200 205 Ile His Ile Arg Arg Gly Asp Tyr Lys Asn Pro Glu Thr Leu Arg Val 210 215 220 His Gly Ile Gln Pro Leu Ala Tyr Tyr Glu Ala Ala Val Gln Leu Leu 225 230 235 240 Arg Glu Arg Ile Asn Ala Pro Leu Phe Tyr Ile Phe Thr Asp Asp Pro 245 250 255 Gly Trp Val Arg Lys Asn Leu Ser Ile Glu Gly Ala Gln Leu Val Ser 260 265 270 Gly Pro Val Ser Ala Thr His Phe Glu Asp Leu Tyr Leu Met Gln Gln 275 280 285 Cys Arg His Asn Ile Ile Ala Asn Ser Ser Phe Ser Trp Trp Gly Ala 290 295 300 Trp Leu Asn Asp Asn Ala Gln Lys Met Val Ile Ala Pro Asn Thr Trp 305 310 315 320 Phe Asn Glu Gly Pro Lys Asp Thr Gln Asn Leu Ile Pro Gly Thr Trp 325 330 335 Leu Arg Leu <210> 57 <211> 287 <212> PRT <213> Pedobacter sp. <400> 57 Met Ile Val Ile Val Lys Leu Met Gly Gly Leu Gly Asn Gln Met Phe 1 5 10 15 Gln Tyr Ala Ala Ala Arg Ser Leu Ser Ser Arg Lys Ile Tyr Phe Asp 20 25 30 Asp Ser Phe Leu Asn Lys Asn Asn Ile Ser Ser Glu Asp Phe Thr Ala 35 40 45 Arg Arg Phe Glu Leu His Ile Phe Arg Arg Leu Lys Val Lys Ile Leu 50 55 60 Asn Pro Tyr Ala Gln Arg Leu Leu Leu Thr Lys Asn Lys Lys Tyr Asp 65 70 75 80 Phe Leu Lys Leu Leu Leu Pro Asn Ser Leu Lys Arg Ile Cys His Ile 85 90 95 Asp Asp Ser Asn Ile Asn Glu Asn Leu Ser Lys Lys His Gln Asn Glu 100 105 110 Ile Leu Tyr Ile Asp Gly Tyr Phe Gln Asn Pro Thr Tyr Phe Asn Glu 115 120 125 Ile Arg Lys Ser Leu Leu Asn Glu Phe Ala Phe Pro Glu Leu Asp Asp 130 135 140 Lys Phe Thr Gly Leu Leu Asn Asp Ile Glu Asn Ser Asn Ser Val Ala 145 150 155 160 Ile His Ile Arg Arg Gly Asp Tyr Leu Lys Ser Lys Ile Asn Glu His 165 170 175 His Gly Val Leu Pro Leu Ser Tyr Tyr Lys Asn Ala Val Lys Ile Leu 180 185 190 Glu Gly Lys Leu Ile Asp Pro Lys Tyr Phe Ile Phe Ser Asp Asp Pro 195 200 205 Asn Trp Cys Lys Asn Asn Phe Ala Phe Leu Ala Asn Lys Glu Ile Val 210 215 220 Ser Lys Glu Asn Glu Pro Trp Ile Asp Met Tyr Leu Ile Ser Lys Cys 225 230 235 240 Lys Asn Gln Ile Ile Ala Asn Ser Ser Phe Ser Trp Trp Gly Ala Trp 245 250 255 Leu Asn Gln Phe Ile Asn Lys Ile Val Ile Ala Pro Lys Asn Trp Phe 260 265 270 Asn Ser Ile Glu Ser Asn Ile Val Pro Lys Glu Trp Ile Ser Leu 275 280 285 <210> 58 <211> 246 <212> PRT <213> Helicobacter jaachi <400> 58 Met Tyr Ala Leu Leu Arg Tyr Gly Ile Leu Lys Gly Asn Phe Ala Phe 1 5 10 15 Lys Pro Asp Ile Phe Ala Leu Tyr Lys Tyr Arg Tyr Asp Glu His Leu 20 25 30 Ser His Lys Asp Asp Arg Val Trp Gln Ala Phe Thr Gln Ser Ala Lys 35 40 45 Gly Ser Phe His Pro His Ala Leu Pro Ile Gly Tyr Phe Gln Asn Leu 50 55 60 Thr Tyr Leu Gln Gly Leu Asp Ser Ile Leu His Lys Glu Phe Cys Leu 65 70 75 80 Lys Thr Pro Leu Thr Ala Gln Asn Gln Ala Leu Lys Ala Tyr Ile His 85 90 95 Ser Leu Pro Gln Ser Ala Phe Leu His Ile Arg Leu Gly Asp Tyr Leu 100 105 110 Glu Gly Gly Thr Phe Val Arg Leu Gly Ser Ala Tyr Tyr Asn Gln Ala 115 120 125 Val Gln Ile Leu Lys Lys His Leu Gly Lys Ala Tyr Ile Phe Val Phe 130 135 140 Ser Asn Asn Ile Pro Trp Cys Glu Arg Asn Ala His Lys Tyr Ile Asp 145 150 155 160 Phe Ser Gly Leu Lys Val Glu Phe Val Lys His Asn Asp Glu Gly Asn 165 170 175 Ala Ala Gln Glu Leu Glu Leu Met Arg Ala Cys Lys His Gly Ile Met 180 185 190 Ala Asn Ser Thr Phe Ser Trp Trp Ala Ala Tyr Leu Asn Asp Asn Pro 195 200 205 His Lys Ile Val Cys Met Pro Lys Tyr Phe Phe Asn Asp Ile Thr Arg 210 215 220 Ile Pro Gln Ser Gln Met Ile Ala Lys Gln Asn Tyr Ile Leu Leu Asp 225 230 235 240 His Thr Trp Ala Glu Ile 245 <210> 59 <211> 295 <212> PRT <213> Helicobacter japonicus <400> 59 Met Gly Gly Leu Gly Asn Gln Met Phe Gln Tyr Ala Phe Ala Lys Ser 1 5 10 15 Leu Glu His His Leu Gln Ile Pro Ile Leu Leu Asp Lys Ser Trp Tyr 20 25 30 Asp Asn Pro Lys Asn Ala Lys Met Leu Ser Leu Asp Ile Phe His Met 35 40 45 Asp Leu Val Tyr Ala Thr Lys Thr Gln Val Ile Glu Ala Leu Asn His 50 55 60 Pro Asn Ile Glu Gln Leu Thr Glu Ser Arg Ala Phe Glu Arg Lys Pro 65 70 75 80 Lys Ile Leu Arg Ser Ile Leu Lys Trp Leu Gly Tyr Lys Lys Pro Thr 85 90 95 Phe Ser Thr Pro Pro Phe Glu Tyr Arg Ala Glu Tyr Leu Lys Ser Asn 100 105 110 Asn Ile Thr Tyr Phe His Gly Tyr Phe Gln Asn Pro Arg Tyr Tyr Gln 115 120 125 Gly Ile Asp Asp Tyr Ile Lys Glu Ser Leu Ser Pro Pro Pro Ile Lys 130 135 140 Ser Leu Glu Asn Leu Ser Lys Leu Asp Gln Ile Leu Asn Thr Lys Asn 145 150 155 160 Ser Ile Phe Ile His Ile Arg Arg Gly Asp Tyr Leu Ser Leu Ser Trp 165 170 175 Gln Ile Asp Ile Glu Tyr Tyr Lys Lys Ala Val Ala Thr Ile Val Asn 180 185 190 Lys Ile Glu Asn Pro His Phe Phe Leu Phe Cys Ala Asp Arg Glu Phe 195 200 205 Ala His Asn Leu Asp Leu Gly Tyr Pro Phe Ile Asp Met Thr Ser Glu 210 215 220 Asn Ile Ser Leu Asp Asn His Phe Glu Asp Leu Ile Leu Met Ala His 225 230 235 240 Cys Gln His Gly Ile Val Ala Asn Ser Ser Tyr Ser Trp Trp Ala Ala 245 250 255 Tyr Leu Ile Glu Asn Pro His Lys Ile Ile Ile Ala Pro Thr Pro Trp 260 265 270 Leu His Ser Asn Asp Glu Ile Ile Cys Asp Asp Trp Ile Lys Ile Gln 275 280 285 Ala Glu Lys Glu Val Arg Leu 290 295 <210> 60 <211> 268 <212> PRT <213> Klebsiella pneumoniae <400> 60 Met Leu Phe Gln Val Cys Leu Ala Met His Leu Arg Asp Met Gly His 1 5 10 15 Val Val Lys Ile Asp Thr Leu Gly Leu Glu Asn Lys Phe Lys Asp Lys 20 25 30 Val Met Phe Phe Leu Phe Lys Cys Gly Ile Thr Leu Glu Glu Cys Thr 35 40 45 Lys Ala Glu Arg Phe Ile Cys Cys His Ala Val Ser Thr Asn Arg Ile 50 55 60 Lys Ser Lys Glu Leu Lys Ile Ile Lys Leu Ile Phe Pro Lys Lys Leu 65 70 75 80 Tyr Leu Glu Gln Gln Trp Gly Glu Ile Pro Asp Asp Ser Tyr Asn Tyr 85 90 95 Tyr Phe Gly Tyr Phe Gln Asn Ile Asn Leu Ala Lys Lys Tyr Cys Asp 100 105 110 Phe Phe Gln Lys Gly Leu Asp Leu Ile Ala Glu Glu Asn Ser Phe Val 115 120 125 Gln Pro Leu Ser Asn Asp Cys Phe Ile His Ile Arg Arg Gly Asp Tyr 130 135 140 Cys Thr Pro Ser Ala Leu Ala Leu His Gly Leu Met Gly Glu Glu Tyr 145 150 155 160 Tyr Asn Gly Ala Val Arg Tyr Phe Ser Glu Asp Met His Phe Asp Val 165 170 175 Phe Ser Asn Asp Val Ser Trp Val Lys Ser Asn Leu Ser Ile Ser Asn 180 185 190 Ile Lys Val Met Glu Gly Glu Gly Phe Lys Tyr Pro Asp Ile Glu Asp 195 200 205 Leu Tyr Lys Met Ser Arg His Lys Tyr Gly Ile Ile Ala Asn Ser Thr 210 215 220 Phe Ser Phe Trp Ala Ala Leu Ile Gly Ser Ser Asn Ile Asn Lys Glu 225 230 235 240 Ile Val Cys Pro Glu Lys Trp Phe Ala Asn Glu Glu Leu Gln Lys Leu 245 250 255 Ser Tyr Lys Ile Lys Asn Ser Asp Trp Val Tyr Lys 260 265 <210> 61 <211> 293 <212> PRT <213> Dysgonomonas capnocytophagoides <400> 61 Met Ile Arg Val Ile Leu Ser Gly Gly Leu Gly Asn Gln Met Phe Gln 1 5 10 15 Tyr Ala Ala Gly Arg Ala Leu Ser Leu Lys Leu Gln Ser Glu Leu Ser 20 25 30 Val Asp Thr Phe Leu Leu Arg Lys Lys Thr Lys Thr Thr Val Arg Asn 35 40 45 Phe Glu Leu Lys Val Phe Asn Ile Lys Val Arg Glu Asn Asn His Leu 50 55 60 Lys Asn Lys Leu Ile Thr Lys Ser Phe Phe Phe Leu Asn Lys Tyr Gly 65 70 75 80 Leu Lys Lys Leu Ile Phe Gly Leu Phe Gly Ile Phe Arg Asp Gln Lys 85 90 95 Ala Gln Asn Phe Asp Gln Arg Phe Asn Asn Ile Asp Arg Asn Ile Thr 100 105 110 Leu Phe Gly Tyr Phe Gln Asn Glu Asn Tyr Phe Lys Ala Ile Ser Ala 115 120 125 Asn Leu Arg Glu Asp Phe Arg Phe Ile Ser Pro Leu Leu Gly Glu Asn 130 135 140 Ala Asp Ile Ala Asn Lys Ile Gly Ser Thr Ala Ser Val Ser Ile His 145 150 155 160 Ile Arg Arg Gly Asp Tyr Leu Asn Pro Asn Val Asn Leu Ser Leu Leu 165 170 175 Asn Ile Glu Tyr Tyr Gln Arg Ala Ile Ser Tyr Ile Gln Glu Lys Ile 180 185 190 Thr Asp Pro Val Phe Tyr Ile Phe Ser Asp Asp Ile Asn Trp Val Lys 195 200 205 Lys Asn Leu Asp Leu Ser Gln Ser Pro His Ile Phe Ile Asp Trp Asn 210 215 220 Thr Gly Asn Arg Ser Phe Leu Asp Met Gln Leu Met Ser Leu Cys Gln 225 230 235 240 His Asn Ile Ile Ala Asn Ser Ser Phe Ser Trp Trp Gly Ala Trp Leu 245 250 255 Asn Cys Asn Pro Asp Lys Ile Val Ile Ala Pro Gly Thr Trp Tyr Lys 260 265 270 Asn Glu Thr Ala Ala Asp Tyr Pro Ile Gly Phe Ile Pro Glu Lys Trp 275 280 285 Val Ile Leu Glu Thr 290 <210> 62 <211> 204 <212> PRT <213> Flavobacterium sp. <400> 62 Met Gln Asn Asp Asn Glu Ser Cys Glu Met Val Leu Pro Leu Phe Gly 1 5 10 15 Asn Trp Lys Phe Tyr Tyr Gly Tyr Phe Gln Ser Glu Gln Tyr Phe Lys 20 25 30 Glu Ile Ala Asp Asn Ile Arg Asp Tyr Phe Arg Ile Lys Ser Ile Tyr 35 40 45 Thr Lys Ala Phe Trp Gln Lys Tyr Gly Tyr Leu Phe Ser Gln Lys Val 50 55 60 Leu Ala Ile His Ile Arg Leu Gly Asp Tyr Leu Thr Trp Gly Asn Glu 65 70 75 80 Ala Met Gly Gly Glu Asn Met Thr Leu Pro Asp Ala Tyr Phe Gln Asn 85 90 95 Ala Leu Gly Met Ile Pro Asn Ile Gln Asp Tyr Thr Val Leu Val Ile 100 105 110 Thr Asp Asp Ile Glu Asn Ala Ser His Lys Met Gln Trp Leu Gln Gly 115 120 125 Lys Lys Ile Ile Ser Asp Thr Glu Ile Met Asp Phe Gln Leu Leu Met 130 135 140 His Ala Asp Lys Leu Ile Ile Ser Asn Ser Ser Phe Ala Trp Trp Ala 145 150 155 160 Ala Tyr Leu Asn Val Lys Asn Ala Glu Thr Phe Ala Pro Glu Tyr Trp 165 170 175 Leu Gly Phe Lys Val Asn Thr Glu Ile Pro Asn Asn Val Ile Pro Ser 180 185 190 Arg Phe Lys Arg Val Ala Val Ala Thr Cys Tyr Ala 195 200 <210> 63 <211> 291 <212> PRT <213> Pedobacter sp. <400> 63 Met Ile Thr Ile Lys Leu Gln Gly Gly Leu Gly Asn Gln Met Phe Gln 1 5 10 15 Tyr Ala Ala Ala Arg Ser Leu Ser Lys Lys Ile Phe Leu Asp Leu Asp 20 25 30 Phe Leu Glu Val Asn Cys Thr Asp Lys Leu His Phe Thr Ala Arg Thr 35 40 45 Phe Gln Leu Gly Ile Phe Glu Asn Leu Lys Ile Lys Arg Ser Ser Thr 50 55 60 Asn Asn Leu Leu Arg Gln Asn Asn Ile Ala Phe Arg Val Leu Gly Lys 65 70 75 80 Leu Phe Lys Ser Arg Ile Ile His Ile Lys Gln Thr Thr Asn Asp Phe 85 90 95 Ile Asn Leu Pro Gly Ser Gly Asp Leu Lys Tyr Ile Tyr Leu Asp Gly 100 105 110 Tyr Phe Gln Ser Glu Lys Tyr Phe Ser His Ile Lys Lys Glu Ile Arg 115 120 125 Asp Glu Phe Lys Phe Pro Ala Leu Asp Ile Lys Asn Leu Asp Ile Ala 130 135 140 Asn Gln Ile Arg Asn Ser Glu Asn Ala Thr Ser Ile His Ile Arg Arg 145 150 155 160 Gly Asp Tyr Val Lys Ser Ser Ile Val Asn Asp Ile His Gly Thr Leu 165 170 175 Pro Lys Ile Tyr Tyr Gln Lys Ala Val Ser Lys Leu Leu Leu Asp Phe 180 185 190 Pro Lys Ile Ser Ile Phe Val Phe Ser Asp Asp Ile Lys Trp Ala Arg 195 200 205 Lys His Leu Asn Phe Glu Asn Cys Asn Phe Ile Ser Asn Asn Ile Lys 210 215 220 Glu Glu Ser Trp Lys Asp Met Ala Leu Met Ser Leu Cys Lys His His 225 230 235 240 Ile Ile Ala Asn Ser Ser Phe Ser Trp Trp Gly Ala Trp Leu Ser Ile 245 250 255 Tyr Glu Gly Gln Lys Tyr Ala Pro Val Asn Trp Phe Asn Pro Lys Lys 260 265 270 Ile Lys Tyr Asn Leu Asn Asp Ile Ile Pro Arg Glu Trp Asn Ile Ile 275 280 285 Asp Tyr Asp 290 <210> 64 <211> 291 <212> PRT <213> Hoeflea phototrophica <400> 64 Met Thr Val Arg Arg Val Ile Ser Arg Met His Gly Gly Leu Gly Asn 1 5 10 15 Gln Leu Phe Gln Tyr Ala Val Gly Arg Ala Val Ala Leu Arg Thr Gly 20 25 30 Ser Glu Leu Leu Leu Asp Thr Arg Glu Phe Thr Ser Ser Asn Pro Phe 35 40 45 Gln Tyr Asp Leu Gly His Phe Ser Ile Gln Ala Lys Val Ala Asn Ser 50 55 60 Ser Glu Leu Pro Pro Gly Lys Asn Arg Pro Leu Ala Tyr Ala Trp Trp 65 70 75 80 Arg Lys Phe Gly Arg Ser Pro Arg Phe Val Arg Glu Gln Asp Leu Gly 85 90 95 Tyr Asn Ala Arg Ile Glu Thr Ile Glu Ala Asp Cys Tyr Leu His Gly 100 105 110 Tyr Phe Gln Ser Gln Lys Tyr Phe Glu Asp Ile Ala Ser Ile Leu Trp 115 120 125 Lys Asp Leu Ser Phe Arg Gln Ala Ile Ser Gly Glu Asn Ala Ser Met 130 135 140 Ala Glu Arg Ile Gln Ser Ala Pro Ser Val Ser Met His Ile Arg Arg 145 150 155 160 Gly Asp Tyr Leu Thr Ser Ala Lys Ala Arg Ser Thr His Gly Ala Pro 165 170 175 Asp Leu Gly Tyr Tyr Gly Arg Ala Leu Gly Glu Ile Arg Ala Arg Ser 180 185 190 Gly Ser Asp Pro Val Val Tyr Leu Phe Ser Asp Asp Pro Asp Trp Val 195 200 205 Arg Asn Asn Met Arg Met Asp Ala Asn Leu Val Thr Val Ala Ile Asn 210 215 220 Asp Gly Lys Thr Ala Phe Glu Asp Leu Arg Leu Met Ser Leu Cys Asp 225 230 235 240 His Asn Ile Ile Val Asn Ser Thr Phe Ser Trp Trp Gly Ala Trp Leu 245 250 255 Asn Pro Ser Leu Asp Lys Ile Val Val Ala Pro Lys Arg Trp Phe Ala 260 265 270 Asp Pro Lys Leu Ser Asn Pro Asp Ile Thr Pro Pro Gly Trp Leu Arg 275 280 285 Leu Gly Asp 290 <210> 65 <211> 305 <212> PRT <213> Subdoligranulum variabile <400> 65 Met Ile Tyr Ala Glu Leu Ala Gly Gly Leu Gly Asn Gln Met Phe Ile 1 5 10 15 Tyr Ala Phe Ala Arg Ala Leu Gly Leu Arg Cys Gly Glu Ala Val Thr 20 25 30 Leu Leu Asp Arg Gln Asp Trp Arg Asp Gly Ala Pro Ala His Thr Ala 35 40 45 Cys Ala Leu Glu Gly Leu Asn Leu Val Pro Glu Val Lys Ile Leu Ala 50 55 60 Glu Pro Gly Phe Ala Lys Arg His Leu Pro Arg Gln Asn Thr Ala Lys 65 70 75 80 Ala Leu Met Ile Lys Tyr Glu Gln Arg Gln Gly Leu Met Ala Arg Asp 85 90 95 Trp His Asp Trp Glu Arg Arg Cys Ala Pro Val Leu Asn Leu Leu Gly 100 105 110 Leu His Phe Ala Thr Asp Gly Tyr Thr Pro Val Arg Arg Gly Pro Ala 115 120 125 Arg Asp Phe Leu Ala Trp Gly Tyr Phe Gln Ser Glu Ala Tyr Phe Ala 130 135 140 Asp Phe Ala Pro Thr Ile Arg Ala Glu Leu Arg Ala Lys Gln Ala Pro 145 150 155 160 Ala Gly Val Trp Ala Glu Lys Ile Arg Ala Ala Ala Cys Pro Val Ala 165 170 175 Leu His Leu Arg Arg Gly Asp Tyr Cys Arg Pro Glu Asn Glu Ile Leu 180 185 190 Gln Val Cys Ser Pro Ala Tyr Tyr Ala Arg Ala Ala Ala Ala Ala Ala 195 200 205 Ala Ala Tyr Pro Glu Ala Thr Leu Phe Val Phe Ser Asp Asp Ile Asp 210 215 220 Trp Ala Lys Glu His Leu Asp Thr Ala Gly Leu Pro Ala Val Trp Met 225 230 235 240 Pro Arg Gly Asp Ala Val Gly Asp Leu Asn Leu Met Ala Leu Cys Arg 245 250 255 Gly Phe Ile Leu Ser Asn Ser Thr Tyr Ser Trp Trp Ala Gln Tyr Leu 260 265 270 Ala Gly Glu Gly Arg Thr Val Trp Ala Pro Asp Arg Trp Phe Ala His 275 280 285 Thr Lys Gln Thr Ala Leu Tyr Gln Pro Gly Trp His Leu Ile Glu Thr 290 295 300 Arg 305 <210> 66 <211> 288 <212> PRT <213> Crassostrea gigas <400> 66 Met Tyr Glu Ser Lys Lys Leu Asp Gly Ile Ala Cys Val Lys Phe Gln 1 5 10 15 Gly Arg Leu Gly Asn Leu Met Met Glu Tyr Val Phe Leu Tyr Val Ile 20 25 30 Ala Lys Met Lys His Leu Tyr Pro Ile Val Pro Glu Asn Ser Glu Leu 35 40 45 Phe Gln Ile Phe Asp Leu Glu Lys Thr Thr Leu Ser Ala Ile Asn Lys 50 55 60 Ser Thr Asp Ser Cys Ser Lys Leu Pro Glu Tyr Lys Glu Ser Trp Gly 65 70 75 80 Leu Ser Tyr Asp Glu Lys Leu Leu Ala Val Pro Pro Asn Lys Ser Val 85 90 95 Arg Phe Asn Gly Tyr Phe Gln Ser Trp Lys Tyr Trp Ile Lys Tyr Glu 100 105 110 Asp Lys Ile Arg Lys Leu Leu Arg Phe Lys Asn Pro Ile Arg Gln Lys 115 120 125 Ala His Asp Gln Met Arg Thr Ile Met Asn Lys Met Lys Phe Glu Val 130 135 140 Asn Lys Asp Ser Ala Ile Val Ser Ile His Ile Arg Arg Gly Asp Tyr 145 150 155 160 Ala Thr Glu Gly His Tyr Lys Tyr Gly Lys Leu Thr Pro Asn Glu Thr 165 170 175 Tyr Tyr Ala Asn Ala Leu Gln Tyr Phe Lys Thr Arg His Lys Asn Ile 180 185 190 Leu Phe Val Val Gly Ser Asn Asp Ile Asp Trp Ser Lys Lys Ala Leu 195 200 205 Ala Lys Glu Lys Asn Val Tyr Tyr Ser Thr Gly Asn Ser Pro Ala Glu 210 215 220 Asp Ile Ala Leu Leu Ser Leu Ala Asn His Thr Ile Met Ser Val Gly 225 230 235 240 Thr Phe Gly Trp Trp Ile Gly Trp Met Ala Gln Gly Thr Ser Ile Phe 245 250 255 Tyr Lys Asn Ile Phe Lys Ser Gln Ser Asp Phe Ala Lys Glu Phe Arg 260 265 270 Asn Asn Ser Thr Asp Asp Phe Ile Tyr Pro Gly Trp Ile Pro Met Glu 275 280 285 <210> 67 <211> 265 <212> PRT <213> Crassostrea gigas <400> 67 Met Glu Tyr Val Phe Leu Tyr Val Ile Ala Lys Met Lys His Leu Tyr 1 5 10 15 Pro Val Val Pro Glu Asn Ser Glu Leu Phe Gln Ile Phe Asn Ile Glu 20 25 30 Lys Thr Thr Leu Thr Ala Ile Gly Lys Ser Ala Tyr Ser Cys Ala Lys 35 40 45 Leu Pro Val Tyr Lys Glu Arg Trp Gly Leu Ser Tyr Asp Glu Lys Leu 50 55 60 His Ala Ile Pro Pro Tyr Lys Gly Val Gln Phe Asp Gly Tyr Phe Gln 65 70 75 80 Ser Trp Lys Tyr Trp Ile Lys Tyr Glu Asn Glu Ile Arg Lys Leu Leu 85 90 95 Arg Phe Lys Asn Pro Ile Thr Gln Lys Ala Phe Thr Gln Met Arg Asp 100 105 110 Ile Ile Asp Lys Met Lys Phe Glu Val Asn Lys Glu Ser Val Ile Val 115 120 125 Ser Ile His Ile Arg Arg Gly Asp Tyr Ala Thr Glu Gly His Tyr Lys 130 135 140 Tyr Gly Lys Leu Thr Pro Asn Glu Thr Tyr Tyr Ala Asn Ala Met Gln 145 150 155 160 Tyr Phe Lys Thr Arg His Lys Asn Ile Leu Phe Val Val Gly Ser Asn 165 170 175 Asp Ile Asp Trp Ser Lys Lys Ala Leu Ala Arg Glu Lys Asn Val Tyr 180 185 190 Tyr Ser Thr Gly Asn Ser Pro Ala Glu Asp Ile Ala Leu Leu Ser Leu 195 200 205 Ala Asn His Thr Ile Met Ser Val Gly Thr Phe Gly Trp Trp Ile Gly 210 215 220 Trp Met Ala Gln Gly Thr Ser Val Phe Tyr Lys Asn Ile Phe Arg Pro 225 230 235 240 Gln Ser Asp Phe Ala Lys Glu Phe Arg Asn Asn Ser Ile Asp Asp Phe 245 250 255 Ile Tyr Pro Gly Trp Ile Pro Met Glu 260 265 <210> 68 <211> 277 <212> PRT <213> uncultured bacterium <400> 68 Met Leu Thr Leu Lys Leu Lys Gly Gly Leu Gly Asn Gln Met Phe Gln 1 5 10 15 Tyr Ala Ala Ser His Asn Leu Ala Lys Asn Lys Lys Thr Lys Ile Asn 20 25 30 Phe Asp Leu Ser Phe Phe Ser Asp Ile Glu Val Arg Asp Ile Lys Arg 35 40 45 Asp Tyr Leu Leu Asp Lys Phe Asn Ile Ser Ala Asp Ile Ser Phe Asp 50 55 60 Gln Lys Asn Ser Ile Ser Gly Phe Arg Lys Phe Leu Val Lys Val Ile 65 70 75 80 Ser Lys Phe Phe Gly Glu Val Phe Tyr Tyr Arg Leu Lys Phe Leu Ser 85 90 95 Ser Lys Tyr Leu Asp Gly Tyr Phe Gln Ser Glu Lys Tyr Phe Lys Asn 100 105 110 Val Glu Glu Asp Ile Arg Lys Asp Phe Thr Leu Lys Asp Glu Met Gly 115 120 125 Val Glu Ala Lys Lys Ile Glu Gln Gln Ile Val Asn Ser Lys Asn Ser 130 135 140 Val Ser Leu His Ile Arg Arg Gly Asp Tyr Val Asp Asp Leu Lys Thr 145 150 155 160 Asn Ile Tyr His Gly Val Cys Asn Leu Asp Tyr Tyr Lys Arg Ser Ile 165 170 175 Lys Tyr Leu Lys Glu Asn Phe Gly Glu Ile Asn Ile Phe Val Phe Ser 180 185 190 Asp Asp Ile Ala Trp Val Lys Glu Asn Leu Ala Phe Glu Asn Leu Gln 195 200 205 Phe Val Ser Arg Pro Asp Ile Lys Asp Tyr Glu Glu Leu Met Leu Met 210 215 220 Ser Lys Cys Glu His Asn Ile Ile Ala Asn Ser Ser Phe Ser Trp Trp 225 230 235 240 Gly Ala Trp Leu Asn Glu Asn Lys Asn Lys Ile Ile Ile Ala Pro Lys 245 250 255 Glu Trp Phe Gln Lys Phe Asn Ile Asn Glu Lys His Ile Val Pro Lys 260 265 270 Ser Trp Ile Arg Leu 275 <210> 69 <211> 293 <212> PRT <213> Clostridium sp. <400> 69 Met Ile Met Leu Gln Met Thr Gly Gly Met Gly Asn Gln Met Phe Thr 1 5 10 15 Tyr Ala Leu Tyr Arg Ser Leu Arg Gln Lys Gly Lys Glu Val Cys Ile 20 25 30 Glu Asp Phe Thr His Tyr Asp Thr Pro Glu Lys Asn Cys Leu Gln Thr 35 40 45 Val Phe His Leu Asp Tyr Arg Lys Ala Asp Arg Glu Val Tyr Gln Arg 50 55 60 Leu Thr Asp Ser Glu Pro Asp Phe Leu His Lys Val Lys Arg Lys Leu 65 70 75 80 Thr Gly Arg Lys Glu Lys Ile Tyr Gln Glu Lys Asp Ala Ile Ile Phe 85 90 95 Glu Pro Glu Val Phe Gln Thr Asp Asp Val Tyr Met Ile Gly Tyr Phe 100 105 110 Gln Ser Gly Arg Tyr Phe Glu Lys Ala Val Phe Asp Leu Arg Lys Asp 115 120 125 Phe Thr Phe Ala Trp Asn Thr Phe Pro Glu Lys Ala Lys Lys Leu Arg 130 135 140 Glu Gln Met Gln Ala Glu Ser Ser Val Ser Leu His Ile Arg Arg Gly 145 150 155 160 Asp Tyr Met Asn Gly Lys Phe Ala Ser Ile Tyr Gly Asn Ile Cys Thr 165 170 175 Asp Ala Tyr Tyr Glu Ala Ala Arg Arg Tyr Met Lys Glu His Phe Gly 180 185 190 Asp Cys Arg Phe Tyr Leu Phe Thr Asp Asp Ala Glu Trp Gly Arg Gln 195 200 205 Gln Glu Ser Glu Asp Thr Val Tyr Val Asp Ala Ser Glu Gly Ala Gly 210 215 220 Ala Tyr Val Asp Met Ala Leu Met Ser Cys Cys Arg His His Ile Ile 225 230 235 240 Ala Asn Ser Ser Phe Ser Trp Trp Gly Ala Trp Leu Asp Glu Asn Pro 245 250 255 Asp Lys Thr Val Ile Ala Pro Ala Lys Trp Leu Asn Ile Ser Glu Gly 260 265 270 Lys Asp Ile Tyr Ala Gly Leu Cys Asn Cys Leu Ile Asp Ala Asn Gly 275 280 285 Ser Val Gln Gly Glu 290 <210> 70 <211> 351 <212> PRT <213> Helobdella robusta <400> 70 Met Ser Phe Ile Ile Lys Tyr Val Tyr Val Val Ala Leu Ala Thr Ile 1 5 10 15 Leu Ile Phe Leu Ile Thr Val Tyr Phe Ala Glu Asn Phe Lys Val Gly 20 25 30 Arg Asn Phe Leu Asp Ser Ser Pro Val Thr Pro Pro Gly Ser Lys Tyr 35 40 45 Ala Ser Leu Asp Ala Cys Thr Phe Asn Ser Arg Arg Thr Gly Asn Leu 50 55 60 Met Phe Ala Leu Ala Gly Leu Leu Phe Val Ala Gln Asn Thr Arg Arg 65 70 75 80 Asn Pro Ile Leu Pro Thr Asn Ile Pro Tyr Gly Trp Met Asp Asp Tyr 85 90 95 Phe Asn Thr Ser Ser Ile Gln Arg Leu Pro Asn Glu Phe Val Tyr Asp 100 105 110 Ala Asn Lys Thr Val Val Leu Lys Glu Arg Phe Gly Pro Phe Val Tyr 115 120 125 Asp Pro Ile Phe Glu Asn Pro His Lys Asn Ser Thr Val Glu Ser Lys 130 135 140 Glu Ile Ile Leu Leu Cys Gly Tyr Phe Gln Asn Tyr Lys Tyr Val Glu 145 150 155 160 Lys Ile Asp Lys Lys Leu Lys Met Ile Phe Thr Phe Tyr Asn Glu Thr 165 170 175 Gln Ser Lys Val Gln Asn Phe Ile Asp His His Lys Lys Thr Ser Ala 180 185 190 Lys Asn Arg Ser Asn Val Ala Thr Val Gly Ile His Ile Arg Arg Gly 195 200 205 Asp Phe Leu Ile Lys Phe His Arg Asn Arg Gly Phe Ala Val Val Asp 210 215 220 Glu Asn Phe Ile Asn Ser Thr Val Asn Tyr Phe Tyr Lys Leu Trp Thr 225 230 235 240 Ala Lys Asn Val Glu Phe Ile Leu Tyr Phe Ile Ala Ser Glu Asp Glu 245 250 255 Ala Trp Val Asn Ser Val Val Lys Lys Leu Asn Phe Ala Arg Ala Leu 260 265 270 Asn Lys Ala Ala Phe Val Phe Ser Thr Ser Asn Gly Gly Pro Phe Asp 275 280 285 Met Cys Leu Ile Ser Met Cys Asp Gly Val Ile Thr Ser Ser Gly Ser 290 295 300 Phe Ser Trp Trp Ala Gly Trp Leu Ala Asn Thr Thr Thr Ile Tyr Phe 305 310 315 320 Thr Gly Tyr Pro Arg Lys Gly Ser Ala Leu Gly Glu Gly Phe Asp Arg 325 330 335 Lys Thr Tyr Gln Lys Pro Asp Trp Ile Gly Phe Pro Pro Glu Ile 340 345 350 <210> 71 <211> 299 <212> PRT <213> Helicobacter pylori <400> 71 Met Ala Phe Lys Val Val Gln Ile Cys Gly Gly Leu Gly Asn Gln Met 1 5 10 15 Phe Gln Tyr Ala Phe Ala Lys Ser Leu Gln Lys His Ser Asn Thr Pro 20 25 30 Val Leu Leu Asp Ile Thr Ser Phe Asp Trp Ser Asn Arg Lys Met Gln 35 40 45 Leu Glu Leu Phe Pro Ile Asp Leu Pro Tyr Ala Ser Glu Lys Glu Ile 50 55 60 Ala Ile Ala Lys Met Gln His Leu Pro Lys Leu Val Arg Asn Val Leu 65 70 75 80 Lys Cys Met Gly Phe Asp Arg Val Ser Gln Glu Ile Val Phe Glu Tyr 85 90 95 Glu Pro Lys Leu Leu Lys Thr Ser Arg Leu Thr Tyr Phe Tyr Gly Tyr 100 105 110 Phe Gln Asp Pro Arg Tyr Phe Asp Ala Ile Ser Pro Leu Ile Lys Gln 115 120 125 Thr Phe Thr Leu Pro Pro Pro Pro Glu Asn Gly Asn Asn Lys Lys Lys 130 135 140 Glu Glu Glu Tyr His Arg Lys Leu Ala Leu Ile Leu Ala Ala Lys Asn 145 150 155 160 Ser Val Phe Val His Ile Arg Arg Gly Asp Tyr Val Gly Ile Gly Cys 165 170 175 Gln Leu Gly Ile Asp Tyr Gln Lys Lys Ala Leu Glu Tyr Met Ala Lys 180 185 190 Arg Val Pro Asn Met Glu Leu Phe Val Phe Cys Glu Asp Leu Glu Phe 195 200 205 Thr Gln Asn Leu Asp Leu Gly Tyr Pro Phe Met Asp Met Thr Thr Arg 210 215 220 Asp Lys Glu Glu Glu Ala Tyr Trp Asp Met Leu Leu Met Gln Ser Cys 225 230 235 240 Lys His Gly Ile Ile Ala Asn Ser Thr Tyr Ser Trp Trp Ala Ala Tyr 245 250 255 Leu Ile Asn Asn Pro Glu Lys Ile Ile Ile Gly Pro Lys His Trp Leu 260 265 270 Phe Gly His Glu Asn Ile Leu Cys Lys Glu Trp Val Lys Ile Glu Ser 275 280 285 His Phe Glu Val Lys Ser Gln Lys Tyr Asn Ala 290 295 <210> 72 <211> 5 <212> PRT <213> Artificial sequence <220> <223> domain 1 <220> <221> VARIANT <222> (3)..(3) <223> Xaa can be Phe or Tyr <220> <221> VARIANT <222> (5)..(5) <223> Xaa can be Asn or Ser <400> 72 Gly Tyr Xaa Gln Xaa 1 5 <210> 73 <211> 7 <212> PRT <213> Artificial sequence <220> <223> domain 2 <220> <221> UNSURE <222> (1)..(1) <223> Xaa can be any distinct amino acid excluding a valine residue <220> <221> VARIANT <222> (3)..(3) <223> Xaa can be Leu or Ile <220> <221> VARIANT <222> (5)..(5) <223> Xaa can be Arg or Leu <400> 73 Xaa His Xaa Arg Xaa Gly Asp 1 5 <210> 74 <211> 14 <212> PRT <213> Artificial sequence <220> <223> new domain 2 <220> <221> UNSURE <222> (1)..(1) <223> Xaa can be any naturally occcurring amino acid except Lys and Val <220> <221> UNSURE <222> (2)..(5) <223> Xaa can be any naturally occcurring amino acid <220> <221> VARIANT <222> (6)..(6) <223> Xaa can be Ile or Leu <220> <221> VARIANT <222> (8)..(8) <223> Xaa can be Ile or Leu <220> <221> VARIANT <222> (10)..(10) <223> Xaa can be Arg or Leu <220> <221> VARIANT <222> (13)..(13) <223> Xaa can be Phe or Tyr <220> <221> UNSURE <222> (14)..(14) <223> Xaa can be any naturally occcurring amino acid except Cys and Met <400> 74 Xaa Xaa Xaa Xaa Xaa Xaa His Xaa Arg Xaa Gly Asp Xaa Xaa 1 5 10 <210> 75 <211> 239 <212> PRT <213> Akkermansia sp. KLE1798 <400> 75 Met Arg Leu Gly Asn Ile Met Phe Thr Leu Ala Ala Ala Cys Ser His 1 5 10 15 Ala Arg Thr Val Gly Val Glu Cys Gln Val Pro Trp Thr Tyr Asn Asp 20 25 30 Ala Ser Leu Met Leu Arg Ser Trp Leu Gly Gly Trp Val Leu Pro Ser 35 40 45 Thr Pro Cys Gly Thr Asn Glu Pro Pro Ser Trp Gln Glu Pro Ser Phe 50 55 60 Ser Tyr Cys Pro Ile Pro Ser Asn Ile Arg Glu Gly Gly Leu Cys Gly 65 70 75 80 Tyr Phe Gln Ser Val Arg Tyr Phe Glu Glu Gln Glu Ala Phe Ile Arg 85 90 95 Ala Leu Phe Ala Pro Phe Ile Ala Glu Lys Glu Ser Gly Thr Leu Gly 100 105 110 Val His Ile Arg Leu Gly Asp Tyr Lys Arg Leu Arg Asp Lys His Arg 115 120 125 Val Leu Asp Leu Asp Phe Leu Arg Arg Ala Ala Gly His Leu Ser Pro 130 135 140 Gly Val Arg His Leu Val Leu Phe Ser Asp Glu Pro Asp Glu Ala Ala 145 150 155 160 Asp Met Leu Ala Arg Val Pro Glu Phe Gly Arg Phe Thr Leu Glu Ile 165 170 175 Asp Arg Gly Ala Pro Cys Glu Ser Leu His Arg Met Thr Ala Met Glu 180 185 190 Glu Leu Val Ile Ser Cys Ser Ser Phe Ser Trp Trp Gly Ala Trp Leu 195 200 205 Gly Asn Thr Arg Lys Val Ile Val Pro His Asp Trp Phe Val Gly Gly 210 215 220 Met Glu Asp Tyr Arg Asp Ile Tyr Leu Pro His Trp Ile Lys Leu 225 230 235 <210> 76 <211> 252 <212> PRT <213> Akkermansia muciniphila <400> 76 Met Asp Arg Leu His Val Ser Pro Cys Phe Leu Pro Gly Thr Arg Leu 1 5 10 15 Gly Asn Val Met Phe Thr Leu Ala Ala Ala Cys Ala His Ala Leu Arg 20 25 30 Val Gly Val Pro Cys His Val Pro Trp Asn Tyr Asn Asp Ala Thr Leu 35 40 45 Leu Leu Arg Ser Arg Leu Gly Asp Trp Val Leu Pro Ser Thr Pro Cys 50 55 60 Gly Val Asn Glu Pro Ala Ala Trp Gln Glu Pro Ser Phe Ala Tyr His 65 70 75 80 Pro Ile Pro Leu His Ile Thr Arg Gly Gly Val Cys Gly Tyr Phe Gln 85 90 95 Ser Ala Arg Tyr Phe Glu Gly Gln Glu Pro Phe Ile Arg Ser Leu Phe 100 105 110 Ala Pro Phe Ile Ala Glu Lys Glu Pro Arg Thr Ala Gly Ile His Ile 115 120 125 Arg Leu Gly Asp Tyr Lys Gln Leu Arg His Lys His Arg Val His Gly 130 135 140 Ile Asp Phe Leu Gln Arg Ala Phe Thr His Ile Ser Pro Asp Val Asn 145 150 155 160 Arg Leu Ile Leu Phe Ser Asp Glu Pro Glu Ala Ala Ala Asp Met Leu 165 170 175 Val His Leu Pro Glu Phe Arg Arg Leu Pro Leu Glu Ile Asp Arg Asn 180 185 190 Asn Thr Cys Glu Ala Leu Arg Arg Met Thr Ala Met Glu Glu Leu Ile 195 200 205 Ile Ser Cys Ser Ser Phe Ser Trp Trp Gly Ala Trp Leu Gly Gln Thr 210 215 220 Arg Lys Val Ile Val Pro Arg His Trp Phe Ser Gly Val Ile Glu Asp 225 230 235 240 Tyr Gln Asp Val Tyr Leu Pro His Trp Val Lys Leu 245 250 <210> 77 <211> 289 <212> PRT <213> Capnocytophaga gingivalis ATCC 33624 <400> 77 Met Lys Gln Lys His Tyr Ile Tyr Gln Gln Gly Gly Leu Gly Asn Gln 1 5 10 15 Leu Tyr Ile Leu Ala Tyr Ala Phe Tyr Leu Lys Glu Lys Gly Val Gly 20 25 30 Pro Leu Cys Met Tyr Ser Ala Asp Arg Gln Lys Lys Asp Thr Lys Asp 35 40 45 Lys Lys Lys Arg Asn Val Tyr Ser Gln Ile Thr Glu Lys Leu Gly Phe 50 55 60 Pro Ile Ser Gly Leu Ser Tyr Phe Phe Phe Ser Met Ala Lys Lys Met 65 70 75 80 Ala Lys Lys Ser Phe Phe Lys Asn Tyr Ile Ala Leu Gln Val Glu Lys 85 90 95 Glu Gly Gln Phe Ala Val Phe Gln Glu Pro Ala Thr Gln Tyr Glu Ser 100 105 110 Lys Ile Tyr Leu His Met Gly Trp Tyr Gln Ser Tyr Leu Tyr Gln Thr 115 120 125 Pro Glu Phe Ile Glu Arg Leu Tyr Lys Ile Ile Glu Glu Leu Ala Gly 130 135 140 Asn Thr Arg Gln Phe Ser Ile Thr Glu Asn Asp Val Val Leu His Ile 145 150 155 160 Arg Arg Gly Asp Phe Leu Lys Glu Lys Asn Arg Ala Leu Phe His Ile 165 170 175 Ile Glu Thr Pro His Tyr Leu Glu Gly Leu Ala Lys Leu Ser Gln Gly 180 185 190 Ile Asn Leu Glu Lys Val Tyr Ile Leu Ser Asp Asp Phe Glu Gly Ile 195 200 205 Glu Asp Ile Ile Thr Thr Leu Ser Lys Gln Tyr Glu Val Val Leu Val 210 215 220 Lys Gly Asn Thr Val Leu Gln Asp Leu Tyr Leu Leu Thr Gln Phe Lys 225 230 235 240 Asn Tyr Val Ile Gly Asn Ser Thr Phe Ser Trp Trp Gly Ala Tyr Leu 245 250 255 Ser Lys Tyr Lys Glu Arg Ala Asn Ile Ile Val Pro Lys Glu Pro Trp 260 265 270 Lys Ile Pro Met Pro Glu Lys Ser Pro Tyr Pro Pro Tyr Trp Val Gln 275 280 285 Ile <210> 78 <211> 340 <212> PRT <213> Helicobacter sp. CLO-3 <400> 78 Met Thr Ile Ile Asn Ile Arg Asp Gly Leu Gly Asn Gln Met Phe Gln 1 5 10 15 Tyr Ala Phe Ala Lys Val Leu Glu Ser Lys Gly Glu Ser Val Val Leu 20 25 30 Asp Thr Ser Trp Tyr Ser Glu Glu Pro Asp Ser Val Ser Lys Asn Ile 35 40 45 Ala Asn Lys Lys Asn Ile Arg Asn Leu Glu Ile Thr Arg Phe Asp Ile 50 55 60 Lys Ile Val Pro Tyr Met Glu Ile Glu Thr Met Leu Gln Thr Gln Asp 65 70 75 80 Lys Phe Tyr His Phe Phe Ser Phe Ile His Lys Leu Ile Ala Tyr Ala 85 90 95 Pro Lys Glu Cys Leu Arg Val Gly Leu Lys Ser Phe Leu Pro Lys Thr 100 105 110 Arg Arg Phe His Pro Tyr Lys Tyr His Ile Lys Glu Val Tyr Asp Ser 115 120 125 Arg Asp Leu Ser Ala Leu Pro His Asp Ile Leu Lys Asn Ala Leu Ile 130 135 140 Phe Gly Phe Phe Gln Lys Leu Ser Tyr Phe Lys His Ile Asp Ser Glu 145 150 155 160 Ile Arg Ala Asp Phe Thr Leu Cys Thr Pro Leu Ser Pro Ala Asn Glu 165 170 175 Ala Met Lys Lys Arg Ile Leu Ser Thr Pro Asn Ala Ala Phe Ile His 180 185 190 Ile Arg Arg Gly Asp Tyr Leu Asn Val Trp Gln Val Ile Lys Leu Gly 195 200 205 Lys Ala Tyr Tyr Ala Ser Ala Ile Lys Glu Ile Leu Thr His Val Lys 210 215 220 Asn Pro Lys Phe Phe Ile Phe Ser Asn Asp Ile Glu Trp Cys Lys Asn 225 230 235 240 Asn Phe Ile Asn Leu Ile Asp Ser Ser Val Phe Ala Gly Lys Glu Tyr 245 250 255 Glu Phe Val Glu Gln Asn Gly Glu Gly Asp Ala Ile Glu Glu Leu Glu 260 265 270 Leu Met Arg Ser Cys Lys His Gly Ile Ile Ala Asn Ser Thr Phe Ser 275 280 285 Trp Trp Ala Ala Tyr Leu Met Glu Asn Pro Lys Lys Thr Val Ile Ala 290 295 300 Pro Ser Lys Phe Phe Leu Ile Pro Pro Pro Gln Glu Pro Asn His Ile 305 310 315 320 Asp Asp Ile Leu Pro Glu Gly Trp Ile Lys Thr Asp Pro Thr Trp Gly 325 330 335 Asn Val Glu Ser 340 <210> 79 <211> 320 <212> PRT <213> Helicobacter sp. MIT 17-337 <400> 79 Met Leu Ile Val Arg Leu Asp Gly Gly Leu Gly Asn Gln Met Phe Gln 1 5 10 15 Tyr Ala Phe Ala Lys Lys Leu Glu Ser Lys Gly Tyr Glu Val Gly Ile 20 25 30 Asp Ile Ser Trp Tyr Ala Asp Lys Lys Asn Thr Asn Pro Thr Ile Ala 35 40 45 Asn Phe Ala Gln Asn Gln His Ala Thr Ile Arg Asn Leu Glu Ile Ser 50 55 60 His Tyr Asn Leu Ser Leu Pro Leu Leu Ser Asp Phe Asn Pro Tyr Asp 65 70 75 80 Phe Phe Ile Leu His Asp Arg Phe Tyr Val Leu Arg Asn Lys Ile Asn 85 90 95 Arg Phe Leu Pro Arg Pro Leu Arg Met Lys Asn Tyr Lys Phe Phe Ile 100 105 110 Pro Asp Asp Val Lys Leu Cys Lys Ile Ile Gln Glu Asn Lys Pro Tyr 115 120 125 Phe Pro Asp Tyr Ala Tyr Phe Ser Gly Phe Tyr Gln Asn Leu Ser Cys 130 135 140 Ile Val Glu Pro Gln Asp Ile Ser Gly Asp Phe Ser Leu Lys Asn Pro 145 150 155 160 Leu Ser Gln Ala Asn Gln Ala Leu Lys Glu Gln Ile Ala Ser Phe Gln 165 170 175 Asp Ser Val Phe Leu His Ile Arg Arg Gly Asp Tyr Leu Ala Phe Glu 180 185 190 Arg Tyr Ile His Leu Thr Glu Arg Tyr Tyr Asn Gln Ala Leu Tyr Met 195 200 205 Met Lys Thr Lys Lys Asp Ser Phe His Val Phe Val Phe Ser Asn Asp 210 215 220 Ile Gln Trp Cys Lys Glu Tyr Phe Ile Lys Gln Leu Asp Asn Thr Leu 225 230 235 240 Met Gln Asn Leu Thr Phe Glu Phe Ile Gly Asn Asn Asp Glu Gly Asn 245 250 255 Ala Ile Ile Asp Met Glu Leu Met Arg Thr Cys Lys His Gly Ile Ile 260 265 270 Ala Asn Ser Thr Phe Ser Trp Trp Ala Ala Tyr Leu Leu Lys Ser Lys 275 280 285 Asp Lys Ile Ile Ile Ala Pro Ser Arg Phe Leu Gln Asp Ser Thr Ile 290 295 300 Glu Arg Met Lys Leu Leu Tyr Pro Gln Glu Trp Thr Leu Ile Glu Val 305 310 315 320

Claims (35)

  1. 하기 단계들을 포함하는 α-1,2-푸코실락토오스의 생산 방법:
    a) α-1,2-푸코실트랜스퍼라제 활성 및 수용체 기질로서 락토오스를 사용하는 능력을 갖는 폴리펩티드를 제공하는 단계로서, 상기 폴리펩티드는
    i) 보존 도메인 GY-[F/Y]-Q-[N/S](서열번호 72)를 코딩하는 아미노산 서열 및 보존 도메인(X, K/V 없음) XXXX[I/L]H[I/L]R[R/L]GD[F/Y](X, C/M 없음)(서열번호 74)을 코딩하는 아미노산 서열을 포함하고, 여기서 X는 상기 도메인의 첫 번째 위치에서 라이신 및 발린 잔기를 제외하고 임의의 별개의 아미노산일 수 있고, 상기 도메인의 마지막 위치에서 시스테인 및 메티오닌 잔기를 제외한 임의의 별개의 아미노산일 수 있고, 및/또는
    ii) 다음으로 구성된 군에서 선택되고:
    i) 첨부된 서열 목록의 서열번호 01, 02, 03, 04, 05, 06, 07, 09, 10, 11, 12, 13, 14, 15, 16, 17, 19, 21, 22, 25, 26, 29, 33, 34, 35, 36, 37, 38, 39, 40, 41, 43, 44, 45, 46, 47, 48, 50, 51, 52, 53, 54, 55, 56, 57, 58, 61, 62, 63, 66, 67 또는 76 중 어느 하나, 또는
    ii) 첨부된 서열 목록의 서열번호 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 33, 34, 35, 36, 37, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 65, 66, 67, 68, 69, 70, 75, 76, 77, 78 또는 79 중 어느 하나의 전장 아미노산 서열과 80% 이상의 서열 동일성을 갖는 아미노산 서열, 또는
    iii) 서열번호 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 65, 66, 67, 68, 69, 70, 75, 76, 77, 78 또는 79 중 어느 하나로 표시되는 아미노산 서열의 대립형질 변이체(allelic variant)의 아미노산 서열 또는
    iv) 서열번호 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 65, 66, 68, 69, 70, 75, 76, 77, 78 또는 79 중 어느 하나로 표시되는 아미노산 서열의 오르토로그의 아미노산 서열, 및
    v) 서열번호 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 65, 66, 67, 68, 70, 75, 76, 77, 78 또는 79 중 어느 하나로 표시되는 아미노산 서열의 기능적 단편,
    바람직하게는 상기 폴리펩티드는 글리코실트랜스퍼라제 11(GT11) 패밀리에 속하는 것인 단계,
    b) 단계 a)의 α-1,2-푸코실트랜스퍼라제 활성을 갖는 폴리펩티드를, 그 폴리펩티드가 공여체 기질로부터 수용체 기질로 푸코오스 잔기의 전달을 촉매하고, 이에 의해 α-1,2-푸코실락토오스를 생성하는 조건 하에 공여체 기질로서 GDP-푸코오스 및 수용체 기질로서 락토오스를 포함하는 혼합물과 접촉시키는 단계,
    c) 선택적으로 상기 α-1,2-푸코실락토오스를 분리하는 단계.
  2. 청구항 1에 있어서, α-1,2-푸코실락토오스의 생산이 diFL 농도 대 2'푸코실락토오스 농도 비율을 1:5 미만, 바람직하게는 α-1,2-푸코실락토오스 순도를 80% 이상으로 초래하는 것인 방법.
  3. 청구항 1 또는 청구항 2에 있어서, 상기 폴리펩티드는 무세포 시스템으로 제공되는 것인 방법.
  4. 청구항 1 또는 청구항 2에 있어서, 상기 폴리펩티드는 상기 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 세포에 의해 생산되는 것인 방법.
  5. 청구항 1, 청구항 2 또는 청구항 4 중 어느 한 항에 있어서, 상기 GDP-푸코오스 및/또는 락토오스가 상기 GDP-푸코오스 및/또는 락토오스를 생산하는 세포에 의해 제공되는 것인 방법.
  6. 청구항 1, 청구항 2, 청구항 4 또는 청구항 5 중 어느 한 항에 있어서, 상기 방법이 하기 단계들을 포함하는 것인 방법:
    i) α-1,2-푸코실락토오스 합성을 위한 효소를 코딩하는 하나 이상의 핵산 서열을 포함하는, α-1,2-푸코실락토오스 생산을 위해 유전적으로 변형된 세포를 제공하는 단계로서, 상기 세포는 α-1,2-푸코실트랜스퍼라제 활성 및 수용체 기질로서 락토오스를 사용하는 능력을 갖는 상기 폴리펩티드의 발현을 포함하고,
    ii) α-1,2-푸코실락토오스의 생산을 허용하는 조건 하에 배지에서 상기 세포를 배양하는 단계,
    iii) 선택적으로 배양물로부터 α-1,2-푸코실락토오스를 분리하는 단계.
  7. 청구항 4항에 있어서, 상기 방법이 하기 단계들을 포함하는 것인 방법:
    a) α-1,2-푸코실트랜스퍼라제 활성 및 수용체 기질로서 락토오스를 사용하는 능력을 갖는 상기 폴리펩티드를 발현하는 숙주 세포를 제공하는 단계,
    b) α-1,2-푸코실락토오스의 생산을 허용하고 α-1,2-푸코실트랜스퍼라제 활성을 갖는 상기 폴리펩티드의 발현을 허용하는 적합한 영양 조건 하에 상기 숙주 세포를 성장시키는 단계;
    c) α-1,2-푸코실트랜스퍼라제 폴리펩티드가 GDP-푸코오스로부터 푸코오스 잔기의 락토오스로의 전달을 촉매하기 위해, b) 단계와 동시에 또는 그 다음에 공여체 기질 GDP-푸코오스 및 수용체 기질 락토오스를 제공함으로써, α-1,2-푸코실락토오스를 생산하는 단계;
    d) 선택적으로 숙주 세포 또는 그의 성장 배지로부터 상기 α-1,2-푸코실락토오스를 분리하는 단계.
  8. 청구항 6 또는 청구항 7에 있어서, 숙주 세포가 알파-1,2-푸코실트랜스퍼라제 활성 및 수용체 기질로서 락토오스를 사용하는 능력을 갖는 외인성 폴리펩티드를 발현하도록 형질전환 또는 형질감염되는 것인 방법.
  9. 청구항 4 내지 청구항 8 중 어느 한 항에 있어서, GDP-푸코오스 및/또는 락토오스가 숙주 세포에서 동시에 발현되는 효소에 의해 또는 숙주 세포의 대사에 의해 제공되는 것을 특징으로 하는 방법.
  10. 청구항 1 내지 청구항 9 중 어느 한 항에 있어서, α-1,2-푸코실락토오스의 정제를 더 포함하는 것인 방법.
  11. 청구항 1 내지 청구항 10 중 어느 한 항에 있어서, 하기 단계 중 하나 이상을 더 포함하는 것인 2'-푸코실락토오스의 생산 방법:
    i) 초기 반응기 부피의 리터당 50 그램 이상, 보다 바람직하게는 75 그램 이상, 더욱 바람직하게는 100 그램 이상, 더욱 바람직하게는 120 그램 이상, 더욱 바람직하게는 150 그램 이상의 락토오스를 포함하는 락토오스 공급물을 배양 배지에 바람직하게는 연속 방식으로 첨가하는 단계로서, 여기서 총 반응기 부피는 250mL(밀리리터) 내지 10,000m3(입방 미터) 범위이고, 바람직하게는 배양 배지의 최종 부피가 상기 락토오스 공급물의 첨가 전 배양 배지 부피의 3배 이하, 바람직하게는 2배 이하, 보다 바람직하게는 2배 미만이 되도록 한 단계;
    ii) 숙주 세포가 1:5 미만의 diFL 농도 대 2'푸코실락토오스 농도 비율로, 2'-푸코실락토오스를 합성할 수 있도록 하는 농도로 GDP-푸코오스 공급물을 상기 배양 배지에 바람직하게는 연속 방식으로 첨가하는 단계로서, 바람직하게는 배양 배지의 최종 부피가 상기 GDP-푸코오스 공급물의 첨가 전 배양 배지 부피의 3배 이하, 바람직하게는 2배 이하, 보다 바람직하게는 2배 미만이 되도록 한 단계;
    iii) 1:5 미만의 diFL 농도 대 2'푸코실락토오스 농도 비율로, 2'-푸코실락토오스를 합성하기 위한 최적 농도로 숙주 세포가 GDP-푸코오스를 합성할 수 있도록 하는 농도로 탄소계 기질 공급물을 배양 배지에 바람직하게는 연속 방식으로 첨가하는 단계;
    iv) 숙주 세포가 2'푸코실락토오스 합성을 위한 최적 농도로 락토오스를 내부적으로 합성할 수 있도록 하는 농도로 탄소계 기질 공급물을 배양 배지에 첨가하는 단계;
    v) 1일, 2일, 3일, 4일, 5일에 걸쳐 하나 이상의 공급 용액에 의하여 락토오스 공급물, GDP-푸코오스 공급물 및/또는 탄소계 기질 공급물를 배양 배지에 연속 방식으로 첨가하는 단계;
    vi) 공급 용액에 의하여 1일, 2일, 3일, 4일, 5일에 걸쳐 배양 배지에 연속 방식으로 락토오스 공급물을 첨가하는 단계로서, 여기서 상기 락토오스 공급 용액의 농도는 50g/L, 바람직하게는 75g/L, 더 바람직하게는 100g/L, 더 바람직하게는 125g/L, 더 바람직하게는 150g/L, 더 바람직하게는 175g/L, 더 바람직하게는 200g/L, 더 바람직하게는 225g/L, 더 바람직하게는 250g/L, 더 바람직하게는 275g/L, 더 바람직하게는 300g/L, 더 바람직하게는 325g/L, 더 바람직하게는 350g/L, 더 바람직하게는 375g/L, 더 바람직하게는 400g/L, 더 바람직하게는 450g/L, 더 바람직하게는 500g/L, 더욱 더 바람직하게는 550g/L, 가장 바람직하게는 600g/L이고; 바람직하게는 상기 용액의 pH는 3 내지 7로 설정되고 바람직하게는 상기 공급 용액의 온도는 20℃ 내지 80℃로 유지되는 단계;
    vii) 상기 방법이 상기 배양 배지의 최종 부피에 있어서 50g/L 이상, 바람직하게는 75g/L 이상, 보다 바람직하게는 적어도 90g/L 이상, 보다 바람직하게는 100g/L 이상, 보다 바람직하게는 125g/L 이상, 보다 바람직하게는 150g/L 이상, 보다 바람직하게는 175g/L 이상, 더욱 바람직하게는 200g/L 이상의 2'-푸코실락토오스 농도를 초래하는 단계.
  12. 알파-1,2-푸코실락토오스의 생산을 위해 유전적으로 변형된 숙주 세포로서, 여기서 상기 숙주 세포는 α-1,2-푸코실락토오스 합성을 위한 효소를 코딩하는 하나 이상의 핵산 서열을 포함하고; 상기 세포는 α-1,2-푸코실트랜스퍼라제 활성 및 수용체 기질로서 락토오스를 사용하는 능력을 갖는 폴리펩티드의 발현을 포함하고, 여기서 상기 폴리펩티드는
    i) 보존 도메인 GY-[F/Y]-Q-[N/S](서열번호 72)를 코딩하는 아미노산 서열 및 보존 도메인(X, K/V 없음) XXXX[I/L]H[I/L]R[R/L]GD[F/Y](X, C/M 없음)(서열번호 74)을 코딩하는 아미노산 서열을 포함하고, 여기서 X는 상기 도메인의 첫 번째 위치에서 라이신 및 발린 잔기를 제외하고 임의의 별개의 아미노산일 수 있고, 상기 도메인의 마지막 위치에서 시스테인 및 메티오닌 잔기를 제외한 임의의 별개의 아미노산일 수 있고, 및/또는
    ii) 다음으로 구성된 군에서 선택되고:
    i) 첨부된 서열 목록의 서열번호 01, 02, 03, 04, 05, 06, 07, 09, 10, 11, 12, 13, 14, 15, 16, 17, 19, 21, 22, 25, 26, 29, 33, 34, 35, 36, 37, 38, 39, 40, 41, 43, 44, 45, 46, 47, 48, 50, 51, 52, 53, 54, 55, 56, 57, 58, 61, 62, 63, 66, 67 또는 76 중 어느 하나, 또는
    ii) 첨부된 서열 목록의 서열번호 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 33, 34, 35, 36, 37, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 65, 66, 67, 68, 69, 70, 75, 76, 77, 78 또는 79 중 어느 하나의 전장 아미노산 서열과 80% 이상의 서열 동일성을 갖는 아미노산 서열, 또는
    iii) 서열번호 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 65, 66, 67, 68, 69, 70, 75, 76, 77, 78 또는 79 중 어느 하나로 표시되는 아미노산 서열의 대립형질 변이체(allelic variant)의 아미노산 서열 또는
    iv) 서열번호 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 65, 66, 68, 69, 70, 75, 76, 77, 78 또는 79 중 어느 하나로 표시되는 아미노산 서열의 오르토로그의 아미노산 서열, 및
    v) 서열번호 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 65, 66, 67, 68, 70, 75, 76, 77, 78 또는 79 중 어느 하나로 표시되는 아미노산 서열의 기능적 단편이고,
    바람직하게는 상기 폴리펩티드는 글리코실트랜스퍼라제 11(GT11) 패밀리에 속하는 것인 세포.
  13. 청구항 12에 있어서, 숙주 세포는
    i) 락토오스 결합 α-1,2-푸코실트랜스퍼라제 활성을 갖는 상기 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 서열로서, 여기서 상기 서열은 숙주 세포에 대해 외래이고 숙주 세포의 게놈에 통합되는 것인 서열을 포함하거나, 또는
    ii) 상기 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 벡터로서, 여기서 폴리뉴클레오티드는 벡터로 형질전환된 숙주 세포에 의해 인식되는 조절 서열에 작동가능하게 연결되는 것인 벡터를 함유하는 세포.
  14. 청구항 12 또는 청구항 13에 있어서, 상기 세포는 미생물, 식물 또는 동물 세포로 이루어진 군으로부터 선택되고, 바람직하게는 상기 미생물은 박테리아, 진균 또는 효모이고, 바람직하게는 상기 식물은 벼, 목화, 유채, 대두, 메이즈 또는 옥수수(corn) 식물이고, 바람직하게는 상기 동물은 곤충, 물고기, 새 또는 인간이 아닌 포유동물이고; 바람직하게는 세포는 대장균(Escherichia coli) 세포인 것인 세포.
  15. 청구항 12 내지 청구항 14 중 어느 한 항에 있어서, 숙주 세포가 박테리아, 바람직하게는 대장균 균주, 보다 바람직하게는 K12 균주인 대장균 균주의 세포이고, 훨씬 더 바람직하게는 대장균 K12 균주는 대장균 MG1655인 것을 특징으로 하는 숙주 세포.
  16. 청구항 12 내지 청구항 14 중 어느 한 항에 있어서, 숙주 세포가 효모 세포인 것을 특징으로 하는 숙주 세포.
  17. 청구항 12 내지 청구항 16 중 어느 한 항에 있어서, 락토오스 결합 알파-1,2-푸코실트랜스퍼라제 활성을 갖는 폴리펩티드를 코딩하는 폴리뉴클레오티드가 각각의 숙주 세포의 코돈 사용에 맞춰져 있는 것을 특징으로 하는 숙주 세포.
  18. 하기 단계들을 포함하는 α-1,2-푸코실락토오스의 생산 방법:
    a) 청구항 12 내지 청구항 17 중 어느 한 항에 따른 세포를 제공하는 단계,
    b) α-1,2-푸코실락토오스의 생산을 허용하는 조건 하에 배지에서 세포를 배양하는 단계,
    c) 선택적으로, 배양물로부터 상기 α-1,2-푸코실락토오스를 분리하는 단계.
  19. α-1,2-푸코실락토오스의 생산을 위한 청구항 12 내지 청구항 17 중 어느 한 항에 따른 숙주 세포의 용도.
  20. 락토오스 결합 알파-1,2-푸코실트랜스퍼라제 폴리펩티드를 이종 발현하는 미생물로서, 상기 폴리펩티드는
    i) 보존 도메인 GY-[F/Y]-Q-[N/S](서열번호 72)를 코딩하는 아미노산 서열 및 보존 도메인(X, K/V 없음) XXXX[I/L]H[I/L]R[R/L]GD[F/Y](X, C/M 없음)(서열번호 74)을 코딩하는 아미노산 서열을 포함하고, 여기서 X는 상기 도메인의 첫 번째 위치에서 라이신 및 발린 잔기를 제외하고 임의의 별개의 아미노산일 수 있고, 상기 도메인의 마지막 위치에서 시스테인 및 메티오닌 잔기를 제외한 임의의 별개의 아미노산일 수 있고, 및/또는
    ii) 다음으로 구성된 군에서 선택되고:
    i) 첨부된 서열 목록의 서열번호 01, 02, 03, 04, 05, 06, 07, 09, 10, 11, 12, 13, 14, 15, 16, 17, 19, 21, 22, 25, 26, 29, 33, 34, 35, 36, 37, 38, 39, 40, 41, 43, 44, 45, 46, 47, 48, 50, 51, 52, 53, 54, 55, 56, 57, 58, 61, 62, 63, 66, 67 또는 76 중 어느 하나, 또는
    ii) 첨부된 서열 목록의 서열번호 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 33, 34, 35, 36, 37, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 65, 66, 67, 68, 69, 70, 75, 76, 77, 78 또는 79 중 어느 하나의 전장 아미노산 서열과 80% 이상의 서열 동일성을 갖는 아미노산 서열, 또는
    iii) 서열번호 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 65, 66, 67, 68, 69, 70, 75, 76, 77, 78 또는 79 중 어느 하나로 표시되는 아미노산 서열의 대립형질 변이체(allelic variant)의 아미노산 서열 또는
    iv) 서열번호 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 65, 66, 68, 69, 70, 75, 76, 77, 78 또는 79 중 어느 하나로 표시되는 아미노산 서열의 오르토로그의 아미노산 서열, 및
    v) 서열번호 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 65, 66, 67, 68, 70, 75, 76, 77, 78 또는 79 중 어느 하나로 표시되는 아미노산 서열의 기능적 단편이고,
    바람직하게는 상기 폴리펩티드는 글리코실트랜스퍼라제 11(GT11) 패밀리에 속하는 것인 미생물.
  21. 알파-1,2-푸코실락토오스의 생산을 위한 청구항 20에 따른 미생물의 용도.
  22. 청구항 1 내지 청구항 11, 청구항 18, 청구항 19 또는 청구항 21 중 어느 한 항에 있어서, 상기 알파-1,2-푸코실락토오스를 숙주 세포 또는 그의 성장 배지로부터 분리하는 단계를 더 포함하는 방법.
  23. 청구항 1 내지 청구항 11, 청구항 18, 청구항 19, 청구항 21 또는 청구항 22 중 어느 한 항에 있어서, 상기 분리가 정화, 한외여과, 나노여과, 역삼투, 정밀여과, 활성탄 또는 탄소 처리, 접선 유동 고성능 여과, 접선 유동 한외여과, 친화성 크로마토그래피, 이온 교환 크로마토그래피, 소수성 상호작용 크로마토그래피 및/또는 겔 여과, 리간드 교환 크로마토그래피의 단계 중 하나 이상을 포함하는 것인 방법.
  24. 청구항 1 내지 청구항 11, 청구항 18, 청구항 19, 청구항 21 내지 청구항 23 중 어느 한 항에 있어서, 알파-1,2-푸코실락토오스의 정제를 더 포함하는 것인 방법.
  25. 청구항 24에 있어서, 상기 알파-1,2-푸코실락토오스의 정제가 활성탄 또는 탄소의 사용, 목탄의 사용, 나노여과, 한외여과 또는 이온 교환, 알코올의 사용, 수성 알코올 혼합물의 사용, 결정화, 증발, 침전, 건조, 분무 건조 또는 동결건조의 단계 중 하나 이상을 포함하는 것인 방법.
  26. 청구항 1 내지 청구항 11, 청구항 21 내지 청구항 25 중 어느 한 항에 있어서, 폴리펩티드가 진균, 효모, 박테리아, 곤충, 동물 또는 식물 발현 시스템에서 생산되는 것인 방법.
  27. 청구항 26에 있어서, 숙주 세포가 박테리아, 바람직하게는 대장균 균주, 보다 바람직하게는 K12 균주인 대장균 균주의 세포이고, 더욱 더 바람직하게는 대장균 K12 균주는 대장균 MG1655인 것인 방법.
  28. 청구항 26에 있어서, 숙주 세포가 효모 세포인 방법.
  29. 청구항 1 내지 청구항 11, 청구항 18, 청구항 19, 청구항 21 내지 청구항 28 중 어느 한 항에 있어서, 배양 배지 중 락토오스 농도가 50 내지 150g/L의 범위인 것인 방법.
  30. 청구항 1 내지 청구항 11, 청구항 18, 청구항 19, 청구항 21 내지 청구항 29 중 어느 한 항에 있어서, 2'-푸코실락토오스의 최종 농도가 70g/L 내지 200g/L 범위인 것인 방법.
  31. α-1,2-푸코실락토오스의 생산을 위한 청구항 1 또는 청구항 10의 방법에 기재된 폴리펩티드의 용도.
  32. 하기 단계를 포함하는 α-1,2-푸코실락토오스의 생산 방법:
    a) α-1,2-푸코실트랜스퍼라제 활성 및 락토오스를 수용체 기질로 사용하는 능력을 갖는 폴리펩티드를 제공하는 단계,
    b) 단계 a)의 α-1,2-푸코실트랜스퍼라제 활성을 갖는 폴리펩티드를, 폴리펩티드가 공여체 기질로부터 수용체 기질로 푸코오스 잔기의 전달을 촉매하는 조건 하에 공여체 기질로서 GDP-푸코오스 및 수용체 기질로서 락토오스를 포함하는 혼합물과 접촉시켜 α-1,2-푸코실락토오스를 생성하는 단계,
    c) 상기 촉매 작용은 1:5 미만의 diFL 농도 대 2'푸코실락토오스 농도 비율을 초래하고,
    d) 선택적으로 상기 α-1,2-푸코실락토오스를 분리하는 단계.
  33. 하기 단계를 포함하는 α-1,2-푸코실락토오스의 생산 방법:
    a) α-1,2-푸코실트랜스퍼라제 활성 및 락토오스를 수용체 기질로 사용하는 능력을 갖는 폴리펩티드를 제공하는 단계,
    b) 단계 a)의 α-1,2-푸코실트랜스퍼라제 활성을 갖는 폴리펩티드를, 폴리펩티드가 공여체 기질로부터 수용체 기질로 푸코오스 잔기의 전달을 촉매하는 조건 하에 공여체 기질로서 GDP-푸코오스 및 수용체 기질로서 락토오스를 포함하는 혼합물과 접촉시켜 α-1,2-푸코실락토오스를 생성하는 단계,
    c) 상기 촉매 작용은 80% 이상의 2'푸코실락토오스 순도를 초래하고,
    d) 선택적으로 상기 α-1,2-푸코실락토오스를 분리하는 단계.
  34. 하기 단계 중 하나 이상을 포함하는 2'-푸코실락토오스의 생산 방법:
    i) 배양 배지에, 초기 반응기 부피의 리터당 50 그램 이상, 보다 바람직하게는 75 그램 이상, 더욱 바람직하게는 100 그램 이상, 더욱 바람직하게는 120 그램 이상, 더욱 바람직하게는 150 그램 이상의 락토오스를 포함하는 락토오스 공급물을 바람직하게는 연속 방식으로 첨가하는 단계로서, 여기서 총 반응기 부피는 250mL(밀리리터) 내지 10,000m3(입방 미터) 범위이고, 바람직하게는 배양 배지의 최종 부피가 상기 락토오스 공급물의 첨가 전 배양 배지 부피의 3배 이하, 바람직하게는 2배 이하, 보다 바람직하게는 2배 미만이 되도록 한 단계;
    ii) 상기 배양 배지에, 숙주 세포가 1:5 미만의 diFL 농도 대 2'푸코실락토오스 농도 비율로, 2'-푸코실락토오스를 합성할 수 있도록 하는 농도로 GDP-푸코오스 공급물을 바람직하게는 연속 방식으로 첨가하는 단계로서, 바람직하게는 배양 배지의 최종 부피가 상기 GDP-푸코오스 공급물의 첨가 전 배양 배지 부피의 3배 이하, 바람직하게는 2배 이하, 보다 바람직하게는 2배 미만이 되도록 한 단계;
    iii) 1:5 미만의 diFL 농도 대 2'푸코실락토오스 농도 비율로, 바람직하게는 연속 방식으로, 2'-푸코실락토오스를 합성하기 위한 최적 농도로 숙주 세포가 GDP-푸코오스를 합성할 수 있도록 하는 농도로 탄소계 기질 공급물을 배양 배지에 첨가하는 단계;
    iv) 숙주 세포가 2'푸코실락토오스 합성을 위한 최적 농도로 락토오스를 내부적으로 합성할 수 있도록 하는 농도로 탄소계 기질 공급물을 배양 배지에 첨가하는 단계;
    v) 1일, 2일, 3일, 4일, 5일에 걸쳐 하나 이상의 공급 용액에 의하여 락토오스 공급물, GDP-푸코오스 공급물 및/또는 탄소계 기질 공급물를 배양 배지에 연속 방식으로 첨가하는 단계;
    vi) 공급 용액에 의하여 1일, 2일, 3일, 4일, 5일에 걸쳐 배양 배지에 연속 방식으로 락토오스 공급물을 첨가하는 단계로서, 여기서 상기 락토오스 공급 용액의 농도는 50g/L, 바람직하게는 75g/L, 더 바람직하게는 100g/L, 더 바람직하게는 125g/L, 더 바람직하게는 150g/L, 더 바람직하게는 175g/L, 더 바람직하게는 200g/L, 더 바람직하게는 225g/L, 더 바람직하게는 250g/L, 더 바람직하게는 275g/L, 더 바람직하게는 300g/L, 더 바람직하게는 325g/L, 더 바람직하게는 350g/L, 더 바람직하게는 375g/L, 더 바람직하게는 400g/L, 더 바람직하게는 450g/L, 더 바람직하게는 500g/L, 더욱 더 바람직하게는 550g/L, 가장 바람직하게는 600g/L이고; 바람직하게는 상기 용액의 pH는 3 내지 7로 설정되고 바람직하게는 상기 공급 용액의 온도는 20℃ 내지 80℃로 유지되는 단계;
    vii) 상기 방법이 상기 배양 배지의 최종 부피에 있어서 50g/L 이상, 바람직하게는 75g/L 이상, 보다 바람직하게는 적어도 90g/L 이상, 보다 바람직하게는 100g/L 이상, 보다 바람직하게는 125g/L 이상, 보다 바람직하게는 150g/L 이상, 보다 바람직하게는 175g/L 이상, 더욱 바람직하게는 200g/L 이상의 2'-푸코실락토오스 농도를 초래하고 바람직하게는 diFL 농도 대 2'FL 농도 비율 1:5 미만, 보다 바람직하게는 1:20, 더욱 더 바람직하게는 1:40인 것인 단계.
  35. 하기 단계 중 하나 이상을 포함하는 2'-푸코실락토오스의 생산 방법:
    i) 배양 배지에, 초기 반응기 부피의 리터당 50 그램 이상, 보다 바람직하게는 75 그램 이상, 더욱 바람직하게는 100 그램 이상, 더욱 바람직하게는 120 그램 이상, 더욱 바람직하게는 150 그램 이상의 락토오스를 포함하는 락토오스 공급물을 바람직하게는 연속 방식으로 첨가하는 단계로서, 여기서 총 반응기 부피는 250mL(밀리리터) 내지 10,000m3(입방 미터) 범위이고, 바람직하게는 배양 배지의 최종 부피가 상기 락토오스 공급물의 첨가 전 배양 배지 부피의 3배 이하, 바람직하게는 2배 이하, 보다 바람직하게는 2배 미만이 되도록 한 단계;
    ii) 숙주 세포가 바람직하게는 연속적인 방식으로, 80% 이상의 순도의 2'-푸코실락토오스를 합성할 수 있도록 하는 농도로 GDP-푸코오스 공급물을 배양 배지에 첨가하는 단계로서, 바람직하게는 배양 배지의 최종 부피가 상기 GDP-푸코오스 공급물의 첨가 전 배양 배지 부피의 3배 이하, 바람직하게는 2배 이하, 더욱 바람직하게는 2배 미만인 단계;
    iii) 숙주 세포가 80% 이상의 순도의 2'푸코실락토오스 합성을 위한 최적 농도로 GDP-푸코오스를 합성할 수 있도록 하는 농도로 탄소계 기질 공급물을 배양 배지에 바람직하게는 연속 방식으로 첨가하는 단계;
    iv) 숙주 세포가 2'푸코실락토오스 합성을 위한 최적 농도로 락토오스를 내부적으로 합성할 수 있도록 하는 농도로 탄소계 기질 공급물을 배양 배지에 첨가하는 단계;
    v) 1일, 2일, 3일, 4일, 5일에 걸쳐 하나 이상의 공급 용액에 의하여 락토오스 공급물, GDP-푸코오스 공급물 및/또는 탄소계 기질 공급물를 배양 배지에 연속 방식으로 첨가하는 단계;
    vi) 공급 용액에 의하여 1일, 2일, 3일, 4일, 5일에 걸쳐 배양 배지에 연속 방식으로 락토오스 공급물을 첨가하는 단계로서, 여기서 상기 락토오스 공급 용액의 농도는 50g/L, 바람직하게는 75g/L, 더 바람직하게는 100g/L, 더 바람직하게는 125g/L, 더 바람직하게는 150g/L, 더 바람직하게는 175g/L, 더 바람직하게는 200g/L, 더 바람직하게는 225g/L, 더 바람직하게는 250g/L, 더 바람직하게는 275g/L, 더 바람직하게는 300g/L, 더 바람직하게는 325g/L, 더 바람직하게는 350g/L, 더 바람직하게는 375g/L, 더 바람직하게는 400g/L, 더 바람직하게는 450g/L, 더 바람직하게는 500g/L, 더욱 더 바람직하게는 550g/L, 가장 바람직하게는 600g/L이고; 바람직하게는 상기 용액의 pH는 3 내지 7로 설정되고 바람직하게는 상기 공급 용액의 온도는 20℃ 내지 80℃로 유지되는 단계;
    vii) 상기 방법이 상기 배양 배지의 최종 부피에 있어서 50g/L 이상, 바람직하게는 75g/L 이상, 보다 바람직하게는 적어도 90g/L 이상, 보다 바람직하게는 100g/L 이상, 보다 바람직하게는 125g/L 이상, 보다 바람직하게는 150g/L 이상, 보다 바람직하게는 175g/L 이상, 더욱 바람직하게는 200g/L 이상의 2'-푸코실락토오스 농도 및 바람직하게는 80% 이상의 2'FL 순도를 초래하는 것인 단계.
KR1020227024260A 2019-12-17 2020-12-16 락토오스 전환 알파-1,2-푸코실트랜스퍼라제 효소 KR20220116243A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
BE201905929 2019-12-17
BEBE2019/5929 2019-12-17
PCT/EP2020/086370 WO2021122708A1 (en) 2019-12-17 2020-12-16 Lactose converting alpha-1,2-fucosyltransferase enzymes

Publications (1)

Publication Number Publication Date
KR20220116243A true KR20220116243A (ko) 2022-08-22

Family

ID=69844309

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227024260A KR20220116243A (ko) 2019-12-17 2020-12-16 락토오스 전환 알파-1,2-푸코실트랜스퍼라제 효소

Country Status (9)

Country Link
US (1) US20230348944A1 (ko)
EP (1) EP4077648A1 (ko)
JP (1) JP2023506287A (ko)
KR (1) KR20220116243A (ko)
CN (1) CN114829592A (ko)
AU (1) AU2020403864A1 (ko)
BR (1) BR112022011984A2 (ko)
CA (1) CA3164948A1 (ko)
WO (1) WO2021122708A1 (ko)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022034079A2 (en) 2020-08-10 2022-02-17 Inbiose N.V. Process for purification of an oligosaccharide solution produced by cell cultivation or microbial fermentation
EP4370664A1 (en) * 2021-07-16 2024-05-22 Inbiose N.V. Lacto-n-biose converting fucosyltransferases
CN117957315A (zh) * 2021-08-05 2024-04-30 瓦克化学股份公司 用于生物催化合成2’-岩藻糖基乳糖的特异性α-1,2-岩藻糖基转移酶
EP4448587A1 (en) 2021-12-15 2024-10-23 Inbiose N.V. Novel drying method for oligosaccharides
KR20240002283A (ko) * 2022-06-28 2024-01-05 주식회사 삼양사 2’-푸코실락토오스 제조방법
WO2024047096A1 (en) 2022-08-30 2024-03-07 Inbiose N.V. Process for purification of an oligosaccharide

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4242320A3 (en) 2010-07-12 2023-11-29 Inbiose N.V. Metabolically engineered organisms for the production of added value bio-products
ES2439507T3 (es) 2011-01-20 2014-01-23 Jennewein Biotechnologie Gmbh Fucosiltransferasas novedosas y sus aplicaciones
US9944965B2 (en) * 2012-12-20 2018-04-17 The Board Of Trustees Of The University Of Illinois Biosynthesis of oligosaccharides
KR20230113650A (ko) * 2014-05-15 2023-07-31 글리코신 엘엘씨 푸코실레이티드 올리고당의 제조에 사용되는 알파(1,2)푸코실트랜스퍼라아제 동질 유전자형
KR101648342B1 (ko) * 2014-06-23 2016-08-16 서울대학교산학협력단 가용성 단백질 발현량이 증대된 헬리코박터 파일로리 유래 α-1,2 푸코실 전달효소의 유전자와 단백질 및 α-1,2 푸코실올리고당 생산에의 응용
RU2021109889A (ru) 2014-11-14 2021-05-06 Инбиос Н.В. Мутантные микроорганизмы, устойчивые к гибели под действием лактозы
KR101731263B1 (ko) 2016-04-25 2017-05-02 서울대학교 산학협력단 코리네박테리움 글루타미쿰을 이용한 2'-푸코실락토오스의 생산방법
EP3425052A1 (en) * 2017-07-07 2019-01-09 Jennewein Biotechnologie GmbH Fucosyltransferases and their use in producing fucosylated oligosaccharides

Also Published As

Publication number Publication date
EP4077648A1 (en) 2022-10-26
JP2023506287A (ja) 2023-02-15
CN114829592A (zh) 2022-07-29
WO2021122708A1 (en) 2021-06-24
US20230348944A1 (en) 2023-11-02
CA3164948A1 (en) 2021-06-24
BR112022011984A2 (pt) 2022-08-30
AU2020403864A1 (en) 2022-08-11

Similar Documents

Publication Publication Date Title
US20220002773A1 (en) Production of 3-fucosyllactose and lactose converting alpha-1,3-fucosyltransferase enzymes
US20230399670A1 (en) In vivo synthesis of sialylated compounds
KR20220116243A (ko) 락토오스 전환 알파-1,2-푸코실트랜스퍼라제 효소
US20230416796A1 (en) Production of galactosylated di- and oligosaccharides
US20230212628A1 (en) Production of Sialylated Oligosaccharide in Host Cells
US20220259631A1 (en) Production of fucosyllactose in host cells
CN117157396A (zh) 唾液酸化的二糖和/或寡糖的细胞生产
RU2822039C2 (ru) Сиалилтрансферазы и их применение в получении сиалированных олигосахаридов
WO2023175079A1 (en) Sialyltransferases for the production of sialylated oligosaccharides
DK202270078A1 (en) New sialyltransferases for in vivo synthesis of lst-a
DK202200591A1 (en) New sialyltransferases for in vivo synthesis of lst-c
WO2023187109A1 (en) Sialyltransferases for the production of sialylated oligosaccharides
EP4448733A1 (en) Sialyltransferases for the production of sialylated oligosaccharides
NZ755558A (en) In vivo synthesis of sialylated compounds