KR20220035247A - 숙주 세포에서 푸코실락토스의 제조 - Google Patents

숙주 세포에서 푸코실락토스의 제조 Download PDF

Info

Publication number
KR20220035247A
KR20220035247A KR1020227005675A KR20227005675A KR20220035247A KR 20220035247 A KR20220035247 A KR 20220035247A KR 1020227005675 A KR1020227005675 A KR 1020227005675A KR 20227005675 A KR20227005675 A KR 20227005675A KR 20220035247 A KR20220035247 A KR 20220035247A
Authority
KR
South Korea
Prior art keywords
seq
coli
protein
fucosyllactose
blon
Prior art date
Application number
KR1020227005675A
Other languages
English (en)
Inventor
조에리 보우프레즈
나우시카아 란누
크리스토프 판데발러
아넬리스 베르카투른
Original Assignee
인바이오스 엔.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 인바이오스 엔.브이. filed Critical 인바이오스 엔.브이.
Publication of KR20220035247A publication Critical patent/KR20220035247A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/18Preparation of compounds containing saccharide radicals produced by the action of a glycosyl transferase, e.g. alpha-, beta- or gamma-cyclodextrins
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/24Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Enterobacteriaceae (F), e.g. Citrobacter, Serratia, Proteus, Providencia, Morganella, Yersinia
    • C07K14/245Escherichia (G)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/67General methods for enhancing the expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/01Hexosyltransferases (2.4.1)
    • C12Y204/010653-Galactosyl-N-acetylglucosaminide 4-alpha-L-fucosyltransferase (2.4.1.65), i.e. alpha-1-3 fucosyltransferase

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biophysics (AREA)
  • General Chemical & Material Sciences (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)

Abstract

본 발명은 합성 생물학 및 대사 공학의 기술 분야에 관한 것이다. 더 구체적으로, 본 발명은 대사 조작된 숙주 세포의 발효 기술 분야에 관한 것이다. 본 발명은 유전자 변형 세포를 이용한 발효에 의해 푸코실락토스를 제조하는 방법, 및 이러한 방법에 사용되는 유전자 변형 세포를 개시한다. 상기 유전자 변형 세포는 푸코실락토스 합성에 관여하는 효소를 코딩하는 핵산 서열을 적어도 1개 포함하고, 더 구체적으로 상기 세포는 푸코실락토스를 합성하는 푸코실트란스퍼라제를 코딩하는 핵산 서열 및 막 단백질을 발현하는 적어도 하나의 핵산, 더 구체적으로는 푸코실락토스 수송을 가능하게 하는 막 단백질을 발현하는 핵산 서열을 포함한다.

Description

숙주 세포에서 푸코실락토스의 제조
본 발명은 합성 생물학 및 대사 공학의 기술 분야에 관한 것이다. 더 구체적으로, 본 발명은 대사 조작된 숙주 세포의 발효 기술 분야에 관한 것이다. 본 발명은 유전자 변형 세포를 이용한 발효에 의해 푸코실락토스 (fucosyllactose)를 제조하는 방법, 및 이러한 방법에 사용되는 유전자 변형 세포를 개시한다. 상기 유전자 변형 세포는 푸코실락토스 합성에 관여하는 효소를 코딩하는 핵산 서열을 적어도 1개 포함하고, 더 구체적으로 상기 세포는 푸코실락토스를 합성하는 푸코실트란스퍼라제를 코딩하는 핵산 서열 및 막 단백질을 발현하는 적어도 하나의 핵산, 더 구체적으로는 푸코실락토스 수송을 가능하게 하는 막 단백질을 발현하는 핵산 서열을 포함한다.
오늘날, HMO (Human Milk Oligosaccharides) 계열에 속하는 80개 이상의 화합물들이 구조적으로 특성 규명되었다. 이러한 HMO는 프리바이오틱스 (prebiotics)로 기능하는 복합 올리고사카라이드의 부류를 나타낸다. 또한, HMO의 상피 에피토프에 대한 구조적 상동성은 박테리아 병원체에 대한 보호 특성을 설명한다. 유아 위장관 내에서, HMO는 선택된 박테리아 균주의 성장에 선택적으로 영양을 공급하여, 모유를 먹은 유아에서 독특한 장내 미생물의 발달을 촉진한다.
이러한 HMO들 중 일부는 특정 생물학적 활성을 나타낼 가능성이 가장 높은 특정 푸코실화 구조의 존재를 필요로 한다. 이러한 푸코실화 올리고사카라이드의 생성은 푸코실트란스퍼라제의 작용을 필요로 한다. 글리코실트란스퍼라제 (glycosyltransferases)의 효소 패밀리에 속하는 이러한 푸코실트란스퍼라제는 척추동물, 무척추동물, 식물, 진균, 효모 및 박테리아에서 널리 발현된다. 이들은 공여체, 일반적으로 구아노신-디포스페이트 푸코스 (GDP-푸코스)로부터의 푸코스 잔기를, 올리고사카라이드, (당)단백질 및 (당)지질을 포함하는 수용체로 전달하는 것을 촉매한다. 따라서 푸코실화 수용체 기질은 다양한 생물학적 및 병리학적 과정에 관여한다.
푸코실락토스 (FL)의 미생물 발효 제조에서, 상기 FL은 많은 경우에 산업적 생산 숙주에서 세포내에 생성된다. 당해 분야에서 올리고사카라이드를 세포에서 생성하는데 있어 진정한 어려움으로 확인된 한 가지 문제는 생성된 올리고사카라이드의 세포내 농축 및 이의 추출이다. 상기 세포내 농축은 원하는 올리고사카라이드의 생성에 대한 생성물-억제 효과에 대한 책임이 있는 것으로 여겨진다. 합성이 느려지거나, 또는 원하는 올리고사카라이드가 세포독성 농도에 도달하여, 대사 정지 또는 세포 용해가 발생할 수 있다.
본 발명의 목적은 푸코실락토스가 효율적이고, 시간 및 비용-효과적인 방식으로 생성될 수 있고, 원하는 생성물을 더 많은 양으로 수득하는 수단 및 방법을 제공하는 것이다.
본 발명에 따르면, 이러한 목적 및 다른 목적은 푸코실락토스 제조를 위한 방법 및 세포를 제공함으로써 달성되며, 여기서 상기 세포는 푸코실락토스 생성을 위해 유전자 변형되고, 푸코실락토스 합성에 관여하는 효소를 코딩하는 핵산 서열을 적어도 1개 포함하며, 더 구체적으로 상기 세포는 푸코실락토스를 합성하는, 푸코실트란스퍼라제를 코딩하는 핵산 서열을 포함한다. 상기 세포는 또한 본 발명에 따른 막 단백질을 발현하고, 더 구체적으로 상기 세포는 또한 푸코실락토스 수송을 가능하게 하기 위해 이전에 알려지지 않은 막 단백질을 발현한다.
발명의 요약
놀랍게도, 본 발명에서 사용된 막 단백질은 새롭게 확인된 막 단백질을 제공하고, 더 구체적으로 본 발명은 푸코실락토스 수송을 가능하게 하고 푸코실락토스의 발효 제조에 긍정적인 효과를 갖는, 이전에 알려지지 않은 새롭게 확인된 막 단백질을 제공하여, 푸코실락토스를 생성하는 숙주 세포를 유전자 조작하는데 사용하는 경우 수율, 생산성, 비생산성 및/또는 성장 속도가 더 양호한 것을 발견하였다.
본 발명은 또한 푸코실락토스를 제조하는 방법을 제공한다. 상기 푸코실락토스는 본 발명의 막 단백질을 포함하는 숙주 세포를 사용하여 수득된다.
정의
본 명세서에서 본 발명 및 이의 다양한 구체예를 설명하기 위해 사용된 단어는 이들의 통상적으로 정의된 의미로 이해될 뿐만 아니라, 본 명세서에서 통상적으로 정의된 범위를 넘어선 구조, 물질 또는 작용의 특별한 정의가 포함되는 것으로 이해되어야 한다. 따라서, 일 요소가 본 명세서의 맥락에서 하나 초과의 의미를 포함하는 것으로 이해될 수 있다면, 청구항에서 이의 사용은 명세서 및 단어 자체에 의해 뒷받침되는 모든 가능한 의미를 포괄하는 것으로 이해되어야 한다.
본원에 개시된 본 발명의 다양한 구체예 및 구체예의 양상은 본 명세서에서 구체적으로 기재된 순서 및 문맥으로 이해될 뿐만 아니라 임의의 순서 및 이들의 임의의 조합을 포함하는 것으로 이해되어야 한다. 문맥에 따라, 단수로 사용되는 모든 단어는 복수를 포함하는 것으로 간주되어야 하며, 그 반대의 경우도 마찬가지이다. 달리 정의되지 않는 한, 본원에 사용되는 모든 기술 및 과학 용어는 본 발명이 속하는 기술 분야의 통상의 기술자에 의해 통상적으로 이해되는 것과 동일한 의미를 갖는다. 일반적으로, 본원에서 사용된 명명법 및 본원에 기재된 세포 배양, 분자 유전학, 유기 화학 및 핵산 화학 및 혼성화의 실험실 절차는 당해 분야에 잘 알려져 있고, 일반적으로 사용되는 것이다. 핵산 및 펩티드 합성에 대한 표준 기술이 사용된다. 일반적으로, 효소 반응 및 정제 단계는 제조자의 명세서에 따라 수행된다.
도면 및 명세서에는 본 발명의 구체예가 개시되어 있으며, 특정 용어가 사용되더라도, 이러한 용어는 설명적인 의미로만 사용되고, 제한의 목적이 아니며, 본 발명의 범위는 하기 청구항에 명시되어 있다. 예시된 구체예는 단지 예시의 목적을 위해 제시되었으며 본 발명을 제한하는 것으로 간주되어서는 안된다는 것을 이해해야 한다. 당업자에게는 변경, 다른 구체예, 개선, 세부 사항 및 사용이 본원의 개시내용 및 정신과 일치하고, 청구항에 의해서만 제한되는 본 개시내용의 범위 내에서 이루어질 수 있으며, 균등물의 원칙을 포함하여 특허법에 따라 해석될 수 있다는 것이 명백할 것이다. 하기 청구 범위에서, 청구 단계를 지정하는데 사용되는 참조 문자는 설명의 편의를 위해서만 제공되며, 단계를 수행하기 위한 임의의 특정 순서를 의미하지는 않는다.
본 발명에 따르면, 용어 "폴리뉴클레오티드(들)"는 일반적으로 임의의 폴리리보뉴클레오티드 또는 폴리데옥시리보뉴클레오티드를 지칭하며, 이는 비변형된 RNA 또는 DNA, 또는 변형된 RNA 또는 DNA일 수 있다. "폴리뉴클레오티드(들)"에는 단일가닥 및 이중가닥 DNA, 단일가닥 및 이중가닥 영역의 혼합물 또는 단일가닥, 이중가닥 및 삼중가닥 영역인 DNA, 단일가닥 및 이중가닥 RNA, 및 단일가닥 및 이중가닥 영역의 혼합물인 RNA, 단일가닥 또는 더 전형적으로 이중가닥 또는 삼중가닥 영역, 또는 단일가닥 및 이중가닥 영역의 혼합물일 수 있는 DNA 및 RNA를 포함하는 혼성 분자를 제한 없이 포함한다. 또한, 본원에서 사용되는 "폴리뉴클레오티드"는 RNA, 또는 DNA, 또는 RNA 및 DNA 둘 다를 포함하는 삼중가닥 영역을 지칭한다. 이러한 영역 내의 가닥은 동일한 분자 또는 상이한 분자로부터 유래될 수 있다. 상기 영역은 하나 이상의 분자들 모두를 포함할 수 있지만, 더 전형적으로 일부 분자의 영역만을 포함할 수 있다. 삼중-나선 영역의 분자들 중 하나는 종종 올리고뉴클레오티드이다. 본원에서 사용된, 용어 "폴리뉴클레오티드(들)"는 또한 하나 이상의 변형된 염기를 함유하는 상기 기재된 DNA 또는 RNA를 포함한다. 따라서, 안정성 또는 기타 이유로 변형된 백본을 가진 DNA 또는 RNA가 본 발명에 따른 "폴리뉴클레오티드(들)"이다. 더욱이, 비정상적인 염기 예컨대 이노신 또는 변형된 염기 예컨대 트리틸화 염기를 포함하는 DNA 또는 RNA는 용어 "폴리뉴클레오티드"에 포함되는 것으로 이해되어야 한다. DNA 및 RNA에 대해 매우 다양한 변형이 이루어질 수 있다는 것을 이해할 것이며, 이는 당업자에게 알려진 많은 유용한 목적을 제공한다. 본원에서 사용된 용어 "폴리뉴클레오티드(들)"는 화학적, 효소적 또는 대사적으로 변형된 형태의 폴리뉴클레오티드뿐만 아니라, 예를 들어 단순 및 복합 세포를 포함하는 바이러스 및 세포의 특징적인 DNA 및 RNA의 화학적 형태를 포함한다. 용어 "폴리뉴클레오티드(들)"는 또한 올리고뉴클레오티드(들)로 종종 지칭되는 짧은 폴리뉴클레오티드를 포함한다.
"폴리펩티드(들)"는 2개 이상의 아미노산이 펩티드 결합 또는 변형된 펩티드 결합에 의해 서로 연결된 임의의 펩티드 또는 단백질을 지칭한다. "폴리펩티드(들)"는 통상 펩티드, 올리고펩티드 및 올리고머로 지칭되는 짧은 사슬 및 일반적으로 단백질로 지칭되는 더 긴 사슬 모두를 지칭한다. 폴리펩티드는 20개의 유전자 코딩된 아미노산 이외의 다른 아미노산을 함유할 수 있다. "폴리펩티드(들)"에는 처리과정 및 다른 번역 후 변형과 같은 자연 과정에 의해 변형된 것뿐만 아니라 화학적 변형 기술에 의해 변형된 것을 포함한다. 이러한 변형은 방대한 연구 문헌뿐만 아니라 기본 교과서 및 더 자세한 단행본에 잘 설명되어 있으며, 이는 당업자에게 잘 알려져 있다. 동일한 타입의 변형이 해당 폴리펩티드의 여러 부위에서 동일하거나 또는 다양한 정도로 존재할 수 있다. 또한, 해당 폴리펩티드는 많은 타입의 변형을 함유할 수 있다. 변형은 펩티드 백본, 아미노산 측쇄, 및 아미노 또는 카복실 말단을 포함하여, 폴리펩티드의 어느 곳에서나 발생할 수 있다. 변형에는 예를 들어 아세틸화, 아실화, ADP-리보실화, 아미드화, 플라빈의 공유 부착, 헴 (heme) 모이어티의 공유 부착, 뉴클레오티드 또는 뉴클레오티드 유도체의 공유 부착, 지질 또는 지질 유도체의 공유 부착, 포스포티딜이노시톨의 공유 부착, 가교, 고리화, 이황화 결합 형성, 탈메틸화, 공유 가교 형성, 피로글루타메이트 형성, 포르밀화, 감마-카복실화, 글리코실화, GPI 앵커 형성, 하이드록실화, 요오드화, 메틸화, 미리스토일화, 산화, 단백질분해 처리, 인산화, 프레닐화, 라세미화, 지질 부착, 황산화, 글루탐산 잔기의 감마-카복실화, 하이드록실화 및 ADP-리보실화, 셀레노일화, 아미노산의 단백질로의 전달-RNA 매개 부가 예컨대 아르기닐화, 및 유비퀴틴화를 포함한다. 폴리펩티드는 분지형이거나, 또는 분지 (branching)가 있거나 또는 없는 고리형일 수 있다. 고리형, 분지형 및 분지된 원형 폴리펩티드는 번역 후 자연 과정으로부터 유래될 수 있으며, 전체적으로 합성 방법으로도 만들어질 수 있다.
"단리된"은 이의 자연 상태로부터 "인간의 손에 의해" 변경된 것을 의미하며, 즉 자연에서 나타나는 경우, 이의 원래 환경으로부터 변경되거나 또는 제거되는, 또는 이들 모두를 의미한다. 예를 들어, 살아있는 유기체에 자연적으로 존재하는 폴리뉴클레오티드 또는 폴리펩티드는 "단리"된 것은 아니고, 상기 용어가 본원에서 사용되는 바와 같이, 이의 자연 상태의 공존하는 물질들로부터 분리된 동일한 폴리뉴클레오티드 또는 폴리펩티드는 "단리"된다. 유사하게, 본원에서 사용되는 "합성" 서열은 합성으로 생성되고 자연 공급원으로부터 직접 단리되지 않는 임의의 서열을 의미한다. 본원에서 사용되는 용어 "합성된"은 자연 공급원으로부터 직접 단리되지 않고 임의의 합성으로 생성된 서열을 의미한다.
"재조합"은 하나의 종 유래의 유전자를 다른 종의 숙주 유기체의 세포로 이식하거나 또는 스플라이싱하여 제조된 유전자 조작된 DNA를 의미한다. 이러한 DNA는 숙주의 유전적 구성의 일부가 되어 복제된다.
본 개시내용의 맥락에서 용어 "내인성"은 세포의 천연 부분이고 세포 염색체의 천연 위치에서 나타나는 임의의 폴리뉴클레오티드, 폴리펩티드 또는 단백질 서열을 지칭한다.
용어 "이종"은 폴리뉴클레오티드, 유전자, 핵산, 폴리펩티드 또는 효소와 관련하여 사용되는 경우 숙주 유기체 종 이외의 출처로부터 유래되거나 또는 출처 유래의 폴리뉴클레오티드, 유전자, 핵산, 폴리펩티드 또는 효소를 지칭한다. 대조적으로, "상동" 폴리뉴클레오티드, 유전자, 핵산, 폴리펩티드 또는 효소는 숙주 유기체 종으로부터 유래된 폴리뉴클레오티드, 유전자, 핵산, 폴리펩티드 또는 효소를 나타내기 위해 본원에서 사용된다. 유전자 서열을 유지 또는 조작하는데 사용되는 유전자 조절 서열 또는 보조 핵산 서열 (예: 프로모터, 5' 비번역 영역, 3' 비번역 영역, 폴리 A 부가 서열, 인트론 서열, 스플라이스 부위, 리보솜 결합 부위, 내부 리보솜 진입 서열, 게놈 상동성 영역, 재조합 부위 등)을 언급하는 경우, "이종"은 상기 조절 또는 보조 핵산 서열이 구조체, 게놈, 염색체 또는 에피솜에서 병치되는 유전자와 상기 조절 서열 또는 보조 서열이 자연적으로 결합되지 않음을 의미한다. 따라서, 자연 상태 (즉, 비-유전자 조작된 유기체의 게놈)에서 작동 가능하게 연결되지 않은 유전자에 프로모터가 작동 가능하게 연결되면, 상기 프로모터가 연결되는 유전자와 동일한 종 (또는 일부 경우에, 동일한 유기체)으로부터 유래될 수 있더라도 본원에서 "이종 프로모터"로 지칭된다.
본원에서 사용된 용어 "폴리펩티드를 코딩하는 폴리뉴클레오티드"는 본 발명의 폴리펩티드를 코딩하는 서열을 포함하는 폴리뉴클레오티드를 포함한다. 상기 용어는 또한 코딩 및/또는 비-코딩 서열을 함유할 수 있는 추가 영역과 함께 폴리펩티드를 코딩하는 단일 연속 영역 또는 불연속 영역 (예를 들어, 통합 파지 또는 삽입 서열 또는 편집에 의해 중단됨)을 포함하는 폴리뉴클레오티드를 포함한다.
유전자의 "변형된 발현"이라는 용어는 푸코실락토스 제조 방법의 임의의 단계에서 상기 유전자의 야생형 발현과 비교하여 발현의 변화에 관한 것이다. 상기 변형된 발현은 야생형과 비교하여 발현이 더 낮거나 또는 더 높으며, 여기서 용어 "더 높은 발현"은 또한 내인성 유전자의 경우 상기 유전자의 "과발현"으로 또는 야생형 균주에 존재하지 않는 이종 유전자의 경우 "발현"으로 정의된다. 보다 낮은 발현은 기능적인 최종 산물을 생성하는 능력이 떨어지거나 (즉, 기능적 야생형 유전자와 비교하여 통계적으로 유의미하게 '능력이 떨어짐 (less-able)') 또는 이를 전혀 이용할 수 없는 (예컨대 녹-아웃 유전자) 방식으로 유전자를 변경하는데 사용되는 당업자에게 잘 알려져 있는 기술 (예: siRNA, CrispR, CrispRi, 재조합 기술 (recombineering), 상동 재조합 (homologous recombination), ssDNA 돌연변이 유발 (mutagenesis), RNAi, miRNA, asRNA, 돌연변이 유전자 (mutating genes), 녹-아웃 유전자 (knocking-out genes), 트란스포존 돌연변이 유발 (transposon mutagenesis), ...의 사용)에 의해 수득된다. 과발현 또는 발현은 당업자에게 통상적으로 잘 알려진 기술에 의해 수득되며, 여기서 상기 유전자는 "발현 카세트"의 일부이고, 이는 프로모터 서열, 비-번역 영역 서열 (리보솜 결합 서열 또는 Kozak 서열 함유), 코딩 서열 (예를 들어, 막 단백질 유전자 서열) 및 선택적으로 전사 종결인자가 존재하고, 기능적 활성 단백질의 발현을 유도하는 임의의 서열과 관련이 있다. 상기 표현은 항시적 또는 조건적이거나 또는 조절된다.
용어 "항시적 발현"은 소정의 성장 조건 하에 RNA 폴리머라제의 서브유닛 (예: 박테리아 시그마 인자) 이외의 전사 인자에 의해 조절되지 않는 발현으로 정의된다. 이러한 전사 인자의 비-제한적인 예로는 대장균 (E. coli)에서 CRP, LacI, ArcA, Cra, IclR, 또는 사카로마이세스 세레비지에 (Saccharomyces cerevisiae)에서 Aft2p, Crz1p, Skn7, 또는 B. 서브틸리스 (B. subtilis.)에서 DeoR, GntR, Fur가 있다. 이들 전사 인자는 특정 서열에 결합하고, 소정의 성장 조건에서 발현을 차단하거나 또는 향상시킬 수 있다. RNA 폴리머라제는 예를 들어 원핵생물 숙주에서 시그마 인자를 통해 전사를 개시하기 위해 특정 서열에 결합한다.
용어 "조절된 발현"은 소정의 성장 조건하에 RNA 폴리머라제의 서브유닛 (예: 박테리아 시그마 인자) 이외의 전사 인자에 의해 조절되는 발현으로 정의된다. 이러한 전사 인자의 예가 상기에 기재되어 있다. 통상 발현 조절은 유도제 예컨대 이에 한정되지 않는 IPTG, 아라비노스, 람노스, 푸코스, 알로-락토스 또는 pH 이동, 또는 온도 이동 또는 탄소 고갈 또는 기질 또는 생성된 산물에 의해 수득된다.
용어 "야생형"은 자연에서 발생하는 통상 알려진 유전형 또는 표현형 상황을 나타낸다.
본원에서 사용된 용어 "변이체(들)"는 참조 폴리뉴클레오티드 또는 폴리펩티드와 상이하지만, 필수적인 특성을 유지하는 폴리뉴클레오티드 또는 폴리펩티드이다. 폴리뉴클레오티드의 전형적인 변이체는 다른 참조 폴리뉴클레오티드와 뉴클레오티드 서열이 상이하다. 상기 변이체의 뉴클레오티드 서열의 변화는 참조 폴리뉴클레오티드에 의해 코딩된 폴리펩티드의 아미노산 서열을 변경하거나 또는 변경하지 않을 수 있다. 뉴클레오티드 변화는 하기에 논의된 바와 같이 참조 서열에 의해 코딩된 폴리펩티드에서 아미노산 치환, 추가, 결실, 융합 및 절단을 초래할 수 있다. 폴리펩티드의 전형적인 변이체는 다른 참조 폴리펩티드와 아미노산 서열이 상이하다. 일반적으로, 참조 폴리펩티드 및 변이체의 서열이 전체적으로 매우 유사하고 많은 영역에서 동일하도록 차이가 제한된다. 변이체 및 참조 폴리펩티드는 하나 이상의 치환, 추가, 결실의 임의의 조합에 의해 아미노산 서열이 상이할 수 있다. 치환되거나 또는 삽입된 아미노산 잔기는 유전자 코드에 의해 코딩된 아미노산 잔기일 수도 있거나 또는 아닐 수 있다. 폴리뉴클레오티드 또는 폴리펩티드의 변이체는 대립 유전자 변이체와 같이 자연적으로 발생하거나, 또는 자연적으로 발생하는 것으로 알려지지 않은 변이체일 수 있다. 폴리뉴클레오티드 및 폴리펩티드의 비-자연적으로 발생하는 변이체는 돌연변이유발 기술, 직접 합성 및 당업자에게 알려진 다른 재조합 방법에 의해 제조될 수 있다.
일부 구체예에서, 본 개시내용은 본 발명에서 사용되는 막 단백질의 구조를 변형함으로써 기능적 변이체를 제조하는 것을 고려한다. 변이체는 아미노산 치환, 결실, 추가 또는 이들의 조합에 의해 생성될 수 있다. 예를 들어, 류신을 이소류신 또는 발린으로, 아스파르테이트를 글루타메이트로, 트레오닌을 세린으로의 단리된 대체, 또는 아미노산을 구조적으로 관련된 아미노산으로 유사한 대체 (예: 보존적 돌연변이)는 생성된 분자의 생물학적 활성에 큰 영향을 미치지 않을 것으로 기대된다. 보존적 대체는 아미노산의 측쇄와 관련된 아미노산 패밀리 내에서 일어나는 것이다. 본 개시내용의 폴리펩티드의 아미노산 서열의 변화가 기능적 상동체를 초래하는지 여부는 야생형 폴리펩티드와 유사한 방식으로 세포에서 반응을 생성하는, 본 발명의 경우는 변이체가 없는 세포보다 더 나은 수율, 생산성 및/또는 성장 속도를 제공하는, 변이체 폴리펩티드의 능력을 평가함으로써 용이하게 결정될 수 있다.
본원에서 사용된 용어 "기능적 상동체"는 서열 유사성을 갖고 또한 생화학적 활성과 같은 적어도 하나의 기능적 특성을 공유하는 분자를 설명한다. 더 구체적으로, 본원에서 사용된 용어 "기능적 상동체"는 서열 유사성 (즉, 상동성)을 갖고, 동시에 생화학적 활성과 같은 기능적 유사성을 적어도 하나 갖는 단백질을 설명한다 (Altenhoff et al., PLoS Comput. Biol. 8 (2012) e1002514).
기능적 상동체는 때때로 오르토로그 (orthologs)로 지칭되며, 여기서 "오르토로그"는 다른 종의 참조 유전자 또는 단백질과 기능적으로 동등한 상동 유전자 또는 단백질을 지칭한다. 기능적 상동체는 전형적으로 동일한 특성에 대해 유사하지만 반드시 동일하지는 않은 정도까지 특성을 야기할 것이다. 기능적으로 상동성 단백질은 하나의 상동체에 의해 생성된 정량적 측정이 다른 상동체의 적어도 10%; 더 전형적으로, 원래 분자에 의해 생성된 것의 적어도 20%, 약 30% 내지 약 40%; 예를 들어, 약 50% 내지 약 60%; 약 70% 내지 약 80%; 또는 약 90% 내지 약 95%; 약 98% 내지 약 100%, 또는 100% 초과인 경우 동일한 특성을 제공한다. 따라서, 상기 분자가 효소 활성을 갖는 경우, 기능적 상동체는 원래 효소에 비해 상기 언급한 효소 활성 퍼센트를 가질 것이다. 상기 분자가 DNA-결합 분자 (예: 폴리펩티드)인 경우, 상동체는 원래 분자와 비교하여 결합된 분자의 중량으로 측정하여 상기 언급된 결합 친화도 퍼센트를 가질 것이다.
기능적 상동체 및 참조 폴리펩티드는 자연 발생 폴리펩티드일 수 있고, 상기 서열 유사성은 수렴 또는 발산 전개 이벤트에 기인할 수 있다.
기능적 상동체는 뉴클레오티드 및 폴리펩티드 서열 정렬의 분석에 의해 확인될 수 있다. 예를 들어, 뉴클레오티드 또는 폴리펩티드 서열의 데이터베이스에서 쿼리를 수행하면 바이오매스-조절 폴리펩티드의 상동체를 확인할 수 있다. 서열 분석은 참조 서열로서 바이오매스-조절 폴리펩티드의 아미노산 서열을 사용하는 비-중복 데이터베이스의 BLAST, Reciprocal BLAST 또는 PSI-BLAST 분석을 포함할 수 있다. 아미노산 서열은 일부 경우에 뉴클레오티드 서열로부터 추정된다. 전형적으로, 40% 초과의 서열 동일성을 갖는 데이터베이스의 폴리펩티드는 바이오매스-조절 폴리펩티드로서의 적합성에 대한 추가 평가를 위한 후보이다. 아미노산 서열 유사성은 보존적 아미노산 치환, 예컨대 하나의 소수성 잔기의 다른 소수성 잔기에 대한 치환 또는 하나의 극성 잔기의 다른 극성 잔기에 대한 치환을 허용한다. 원하는 경우, 추가 평가할 후보의 수를 좁히기 위해 이러한 후보에 대한 수동 검사를 수행할 수 있다. 생산성-조절 폴리펩티드에 존재하는 도메인, 예를 들어 보존된 기능성 도메인을 갖는 것으로 보이는 후보를 선택함으로써 수동 검사가 수행될 수 있다.
폴리뉴클레오티드와 관련하여 "단편"은 클론 또는 폴리뉴클레오티드 분자의 임의의 부분, 특히 사용 가능한 기능적 특성을 유지하는 폴리뉴클레오티드의 일부를 지칭한다. 유용한 단편에는 혼성화 또는 증폭 기술 또는 복제, 전사 또는 번역의 조절에 사용될 수 있는 올리고뉴클레오티드 및 폴리뉴클레오티드를 포함한다. "폴리뉴클레오티드 단편"은 폴리뉴클레오티드의 임의의 서브서열, 전형적으로 본원에 제공된 임의의 서열의 적어도 약 9개의 연속 뉴클레오티드, 예를 들어 적어도 약 30개의 뉴클레오티드 또는 적어도 약 50개의 뉴클레오티드의 임의의 서브서열을 지칭한다. 예시되는 단편은 추가로 또는 대안으로서 폴리펩티드의 보존된 패밀리 도메인을 코딩하는 영역을 포함하거나, 이로 필수적으로 구성되거나, 또는 이로 구성되는 단편을 포함할 수 있다. 예시되는 단편은 추가로 또는 대안으로서 폴리펩티드의 보존된 도메인을 포함하는 단편을 포함할 수 있다.
단편은 추가로 또는 대안으로서 폴리펩티드 및 단백질 분자의 서브서열, 또는 폴리펩티드의 서브서열을 포함할 수 있다. 일부 경우에, 상기 단편 또는 도메인은 온전한 폴리펩티드와 마찬가지로 실질적으로 동일한 방식으로 또는 유사한 정도로 온전한 폴리펩티드의 적어도 하나의 생물학적 기능을 수행하는 폴리펩티드의 서브서열이다. 예를 들어, 폴리펩티드 단편은 DNA 프로모터 영역, 활성화 도메인 또는 단백질-단백질 상호작용을 위한 도메인에 결합하는 DNA-결합 부위 또는 도메인과 같은 인식 가능한 구조적 모티프 또는 기능적 도메인을 포함할 수 있고, 전사를 개시할 수 있다. 단편은 최소 3개의 아미노산 잔기로부터 온전한 폴리펩티드의 전체 길이까지, 예를 들어 길이가 적어도 약 20개의 아미노산 잔기, 예를 들어 길이가 적어도 약 30개인 아미노산 잔기까지 크기가 다양할 수 있다. 바람직하게는 단편은 이들이 유래된 폴리펩티드의 적어도 하나의 특성 또는 활성을 갖는 기능적 단편이며, 예를 들어 상기 단편은 폴리펩티드의 기능적 도메인 또는 보존된 도메인을 포함할 수 있다. 도메인은 예를 들어 Pfam (https://pfam.xfam.org/) (El-Gebali et al., Nucleic Acids Res. 47 (2019) D427-D432) 또는 보존된 도메인 데이터베이스 (Conserved Domain Database: CDD) (https://www.ncbi.nlm.nih.gov/cdd) (Lu et al., Nucleic Acids Res. 48 (2020) D265-D268) 지정으로 특성 규명될 수 있다. 본원에서 사용된 Pfam 데이터베이스는 2018년 9월에 공개된 Pfam database Pfam 32.0을 나타내고, 본원에서 사용된 CDD 데이터베이스는 2019년 4월 3일자로 공개된 CDD database v3.17을 나타낸다.
본원에서 사용된 용어 "푸코실락토스", "푸코실 락토스" 및 "FL"은 상호교환 가능하게 사용되며, 푸코스 잔기 및 락토스 잔기를 포함하는 올리고사카라이드를 지칭한다. 이러한 푸코실락토스는 2'-푸코실락토스, 3-푸코실락토스, 또는 디푸코실락토스 또는 이들의 임의의 조합을 지칭하고; 푸코실락토스는 2'-푸코실락토스, 3-푸코실락토스 또는 디푸코실락토스 중 임의의 적어도 2개의 조합을 지칭한다.
본 발명에서 사용된 용어 "알파-1,2'-푸코실트란스퍼라제", "알파 1,2' 푸코실트란스퍼라제", "2'-푸코실트란스퍼라제, "α-1,2'-푸코실트란스퍼라제", "α 1,2' 푸코실트란스퍼라제", "2'푸코실트란스퍼라제', "2'-FT" 또는 "2'FT"는 상호교환 가능하게 사용되며, 알파-1,2-연결에서 공여체 기질 GDP-L-푸코스로부터의 푸코스를 수용체 분자 락토스로의 전달을 촉매하는 글리코실트란스퍼라제를 지칭한다. "알파-1,2-푸코실트란스퍼라제" 또는 상기 용어 중 임의의 것을 코딩하는 폴리뉴클레오티드는 알파-1,2-연결에서 공여체 기질 GDP-L-푸코스로부터의 푸코스를 수용체 분자 락토스로의 전달을 촉매하는 이러한 글리코실트란스퍼라제를 코딩하는 폴리뉴클레오티드를 지칭한다.
본 발명에서 사용된 용어 "2'-푸코실락토스", "알파-1,2'-푸코실락토스", "알파 1,2' 푸코실락토스", "α-1,2'-푸코실락토스", "α 1,2' 푸코실락토스", "Fucα1-2Galβ1-4Glc", 2'FL" 또는 "2'-FL"은 상호교환 가능하게 사용된다. 바람직한 일 구체예에서, 이들 용어는 알파-1,2'-연결에서 GDP-L-푸코스로부터의 푸코스 잔기를 락토스에 전달하는 알파-1,2'-푸코실트란스퍼라제의 촉매작용에 의해 수득된 생성물을 지칭한다.
본 발명에서 사용된 용어 "알파-1,3-푸코실트란스퍼라제", "알파 1,3 푸코실트란스퍼라제", "3-푸코실트란스퍼라제", "α-1,3-푸코실트란스퍼라제", "α 1,3 푸코실트란스퍼라제", "3 푸코실트란스퍼라제, "3-FT" 또는 "3FT"는 상호교환 가능하게 사용되며, 알파-1,3-연결에서 공여체 기질 GDP-L-푸코스로부터의 푸코스를 수용체 분자 락토스로의 전달을 촉매하는 글리코실트란스퍼라제를 지칭한다. "알파-1,3-푸코실트란스퍼라제"를 코딩하는 폴리뉴클레오티드 또는 임의의 상기 용어는 알파-1,3-연결에서 공여체 기질 GDP-L-푸코스로부터의 푸코스를 수용체 분자 락토스로의 전달을 촉매하는 이러한 글리코실트란스퍼라제를 코딩하는 폴리뉴클레오티드를 지칭한다.
본 발명에서 사용된, 용어 "3-푸코실락토스", "알파-1,3-푸코실락토스", "알파 1,3 푸코실락토스", "α-1,3-푸코실락토스", "α 1,3 푸코실락토스", "Galβ1-4 (Fucα1-3)Glc", "3FL" 또는 "3-FL"은 상호교환 가능하게 사용된다. 바람직한 일 구체예에서, 이들 용어는 알파-1,3-연결에서 GDP-L-푸코스로부터의 푸코스 잔기를 락토스로 전달하는 알파-1,3-푸코실트란스퍼라제의 촉매 작용에 의해 수득된 생성물을 지칭한다.
본 발명에서 사용된 용어 "디푸코실락토스", "디-푸코실락토스", "락토디푸코테트라오스", "2',3-디푸코실락토스", "2',3 디푸코실락토스", "α-2',3-푸코실락토스", "α 2',3 푸코실락토스, "Fucα1-2Galβ 1-4(Fucα1-3)Glc", "DFLac", 2',3 diFL", "DFL" 또는 "diFL"은 상호교환 가능하게 사용된다. 바람직한 일 구체예에서, 이들 용어는 푸코스 잔기를 2'FL로 전달하여 2',3-디푸코실락토스를 생성하는 알파-1,3-푸코실트란스퍼라제의 촉매작용에 의해 수득된 생성물을 지칭하거나, 또는 푸코스 잔기를 3FL로 전달하여 2',3 디푸코실락토스를 생성하는 알파-1,2-푸코실트란스퍼라제의 촉매작용에 의해 수득된 생성물을 지칭한다.
본원에서 사용되는 용어 "올리고사카라이드"는 당해 분야에서 일반적으로 이해되는 바와 같고, 단당, 즉 모노사카라이드를 적은 수, 전형적으로 3 내지 10개 함유하는 사카라이드 폴리머를 지칭한다.
본원에서 사용된 "SET" 또는 "Sugar Efflux Transporter"는 InterPro 75.0 (공개일 2019.07.04)에 의해 정의되는 InterPRO 도메인 IPR001214를 갖는 단백질 및/또는 Eggnogdb 1.0.2 데이터베이스 (공개일 2017.11.03)에 의해 정의되는 eggNOGv4.5 패밀리 ENOG410XTE9에 속하는 단백질인 SET 패밀리의 막 단백질을 지칭한다. InterPro 도메인의 확인은 https://www.ebi.ac.uk/interpro/의 온라인 수단 또는 디폴트 값 (default values)을 사용하는 InterProScan (https://www.ebi.ac.uk/interpro/download.html)의 독립형 버젼 (standalone version)을 사용하여 수행될 수 있다. 오르톨로지 패밀리 (orthology family)의 eggNOGv4.5에서의 확인은 eggNOG-mapperv1 (http://eggnogdb.embl.de/#/app/home)의 독립형 버젼 또는 온라인 버젼을 사용하여 수행될 수 있다.
본원에서 사용된 용어 "막 단백질"은 세포막의 일부이거나 또는 세포막과 상호작용하여, 세포를 가로지르는 분자 및 정보의 흐름을 제어하는 단백질을 지칭한다. 따라서 상기 막 단백질은 세포로 내수송되거나 또는 외수송되는, 수송에 관여한다.
이러한 막 단백질은 www.tcdb.org에서 이용 가능한 Saier Lab Bioinformatics Group에 의해 운영 및 큐레이트되고, 막 수송 단백질의 기능적 및 계통 발생학적 분류를 제공하는 Transporter Classification Database에 의해 정의되는, 포터 (porters), P-P-결합-가수분해-유도 수송자 (P-P-bond-hydrolysis-driven transporters), β-Barrel 포린 (β-Barrel Porins), 보조 수송 단백질 (auxiliary transport proteins), 추정 수송 단백질 (putative transport proteins) 또는 포스포트란스퍼-유도 그룹 전위인자 (phosphotransfer-driven group translocators)일 수 있다. 이러한 Transporter Classification Database는 Transporter Classification (TC) 시스템으로 알려진 막 수송 단백질에 대한 포괄적 IUBMB 승인된 분류 시스템을 자세히 설명한다. 본원에 기재된 TCDB 분류 검색은 2019년 6월 17일자로 공개된 TCDB. org에 기반하여 정의된다.
포터는 운반체-매개 과정을 이용하는 유니포터 (uniporters), 심포터 (symporters) 및 안티포터 (antiporters)의 집합적인 이름이다 (Saier et al., Nucleic Acids Res. 44 (2016) D372-D379). 이들은 전기화학적 전위-유도 수송체에 속하며, 또한 2차 운반체-타입 촉진제 (secondary carrier-type facilitators)로 알려져 있다. 막 단백질이 하기를 촉매하는 운반체-매개 과정을 이용하는 경우 상기 막 단백질은 이러한 부류에 포함된다: 단일 종이 촉진 확산에 의해 수송되거나 또는 용질이 하전된 경우 막 전위-의존적 과정에서 수송되는 경우 유니포트; 2개 이상의 종이 화학삼투 에너지 이외의 직접적인 형태의 에너지에 커플링되지 않고, 밀접하게 커플링된 과정에서 반대 방향으로 수송되는 경우 안티포트; 및/또는 2개 이상의 종이 화학삼투 에너지 이외의 직접적인 형태의 에너지에 커플링되지 않고, 2차 운반체의 밀접하게 커플링된 과정에서 동일 방향으로 함께 수송되는 경우 심포트 (Forrest et al., Biochim. Biophys. Acta 1807 (2011) 167-188). 이러한 시스템은 통상 입체특이적이다. 용질:용질 역수송은 2차 운반체의 특징적인 특성이다. 포터 및 효소의 동적 회합은 전형적으로 세포외 구획으로부터 수득된 기질을 이의 세포 대사작용으로 직접 전달하는 기능적 막 수송 대사체를 형성한다 (Moraes and Reithmeier, Biochim. Biophys. Acta 1818 (2012), 2687-2706). 이러한 포터 시스템을 통해 수송된 용질에는 양이온, 유기 음이온, 무기 음이온, 뉴클레오사이드, 아미노산, 폴리올, 인산화된 해당 중간체, 오스몰라이트 (osmolites), 사이드로포어 (siderophores)를 포함하지만 이에 한정되지 않는다.
막 단백질이 무기 피로포스페이트, ATP 또는 다른 뉴클레오사이드 트리포스페이트의 디포스페이트 결합을 가수분해하여 용질 또는 용질들의 활성 흡수 및/또는 압출을 유도하는 경우 이는 P-P-결합 가수분해-유도 수송체의 부류에 포함된다 (Saier et al., Nucleic Acids Res. 44 (2016) D372-D379). 상기 막 단백질은 일시적으로 인산화될 수 있거나 또는 인산화되지 않을 수 있지만, 상기 기질은 인산화되지 않는다. P-P-결합 가수분해-유도 수송체 부류를 통해 수송되는 기질은 양이온, 중금속, 베타-글루칸, UDP-글루코스, 리포폴리사카라이드, 테이코산을 포함하지만 이에 한정되지 않는다.
상기 β-배럴 포린 막 단백질은 통상 막을 가로질러 용질의 에너지 비의존적 통과를 가능하게 하는 막횡단 포어 (transmembrane pores)를 형성한다. 이들 단백질의 막횡단 부분은 β-배럴을 형성하는 β-가닥으로만 구성된다 (Saier et al., Nucleic Acids Res. 44 (2016) D372-D379). 이러한 포린-타입 단백질은 그람-음성 박테리아, 미토콘드리아, 플라스티드 (plastids), 및 가능하게는 항-산 그람-양성 박테리아 (acid-fast Gram-positive bacteria)의 외막에서 발견된다. 이러한 β-배럴 포린 막 단백질을 통해 수송되는 용질에는 뉴클레오사이드, 라피노스, 글루코스, 베타-글루코사이드, 올리고사카라이드를 포함하지만 이에 한정되지 않는다.
상기 보조 수송 단백질은 하나 이상의 생물학적 막을 가로질러 수송을 촉진하지만, 수송에 직접 참여하지 않는 단백질로 정의된다. 이들 막 단백질은 항상 외막 인자 (outer membrane factor: OMF), 폴리사카라이드 (PST) 포터, ATP-결합 카세트 (ABC)-타입 수송체와 같은 하나 이상의 확립된 수송 시스템과 함께 기능한다. 이들은 수송에 커플링된 에너지와 연결된 기능을 제공하고, 복합체 형성에서 구조적 역할을 하며, 생물학적 또는 안정성 기능 또는 조절 기능을 제공할 수 있다 (Saier et al., Nucleic Acids Res. 44 (2016) D372-D379). 보조 수송 단백질의 예는 폴리사카라이드 수송에 관여하는 폴리사카라이드 코폴리머라제 패밀리, 박테리오신 및 화학적 독소 수송에 관여하는 막 융합 단백질 패밀리를 포함하지만 이에 한정되지 않는다.
추정 수송 단백질은 구성원의 수송 기능이 확립되는 경우 분류되거나, 또는 제안된 수송 기능이 입증되지 않는 경우 Transporter Classification 시스템으로부터 제거될 패밀리를 포함한다. 이러한 패밀리에는 수송 기능이 제시된 구성원 또는 구성원들을 포함하지만, 그러한 기능에 대한 증거는 아직 설득력이 없다 (Saier et al., Nucleic Acids Res. 44 (2016) D372-D379). 2019년 6월 17일자로 공개된 TCDB 시스템에 따라 이 그룹으로 분류된 추정 수송체의 예는 구리 수송체를 포함하지만 이에 한정되지 않는다.
상기 포스포트란스퍼-유도 그룹 전위인자는 또한 박테리아 포스포에놀피루베이트:당 포스포트란스퍼라제 시스템 (PTS)의 PEP-의존성 포스포릴 전달-유도 그룹 전위인자로 알려져 있다. 세포외 당으로부터 유래된 반응의 산물은 세포질 당-포스페이트이다. 당 인산화를 촉매하는 효소 성분은 밀접하게 커플링된 과정 중 수송 과정에 중첩된다. 상기 PTS 시스템은 조절 및 주화성, 생물막 형성 및 발병기전을 포함하는 많은 다양한 양상에 관여한다 (Lengeler, J. Mol. Microbiol. Biotechnol. 25 (2015) 79-93; Saier, J. Mol. Microbiol. Biotechnol. 25 (2015) 73-78). 2019년 6월 17일자로 공개된 TCDB 시스템에 따라 포스포트란스퍼-유도 그룹 전위인자내에 분류된 막 단백질 패밀리에는 글루코스-글루코사이드, 프럭토스-만니톨, 락토스-N,N'-디아세틸키토바이오스-베타-글루코사이드, 글루시톨, 갈락티톨, 만노스-프럭토스-소르보스 및 아스코르베이트의 수송과 연결된 PTS 시스템을 포함한다.
당업자는 Pfam 32.0 (2018.09 공개), CDD v3.17 (2019.04.03 공개), eggnoddb 1.0.2 (2017.11.03 공개), InterPro 75.0 (2019.07.04 공개) 및 TCDB (2019.06.17 공개)를 포함하는 본원에서 사용된 데이터베이스의 경우, 각 데이터베이스의 내용은 각 공개 시에 확정되고, 변경되지 않았다. 특정 데이터베이스의 내용이 변경되는 경우, 이러한 특정 데이터베이스는 새로운 공개 날짜의 새로운 공개 버젼을 받았다. 해당 공개 날짜 및 이러한 특정 공개 날짜에 주석이 달린 특정 콘텐츠가 있는 각 데이터베이스에 대한 모든 공개 버젼이 이용 가능하고, 당업자에게 알려져 있다.
용어 "수송 가능"은 세포질 막 및/또는 세포벽을 통한 용질의 수송 활성을 도입하는 것을 의미한다. 상기 수송은 본 발명에 기재된 수송체 단백질의 발현을 도입 및/또는 증가시킴으로써 가능해질 수 있다. 용어 "수송 향상"은 세포질 막 및/또는 세포벽을 통한 용질의 수송 활성을 개선하는 것을 의미한다. 상기 수송은 본 발명에 기재된 수송 단백질의 발현을 도입 및/또는 증가시킴으로써 향상될 수 있다. 수송체 단백질의 "발현"은 상기 유전자가 내인성 유전자인 경우 상기 수송체 단백질을 코딩하는 유전자의 "과발현" 또는 상기 수송체 단백질을 코딩하는 유전자가 아생형 균주에는 존재하지 않는 이종성 유전자인 경우 "발현"으로 정의된다.
혼성화
본원에서 정의된 용어 "혼성화"는 실질적으로 상동인 상보적 뉴클레오티드 서열들이 서로 어닐링되는 과정이다. 상기 혼성화 과정은 용액에서 전체적으로 일어날 수 있고, 즉 두 상보적 핵산이 모두 용액 중에 있다. 상기 혼성화 과정은 또한 자기 비드, 세파로스 비드 또는 임의의 다른 수지와 같은 매트릭스에 고정된 상보적 핵산들 중 하나를 사용하여 일어날 수 있다. 상기 혼성화 과정은 또한 니트로-셀룰로스 또는 나일론 막과 같은 고체 지지체에 고정되거나 또는 예를 들어 포토리소그래피에 의해 예를 들어 규산질 유리 지지체 (후자는 핵산 어레이 또는 마이크로어레이 또는 핵산 칩으로 알려짐)에 고정된 상보적 핵산들 중 하나를 사용하여 일어날 수 있다. 혼성화가 일어나도록 하기 위해, 상기 핵산 분자는 일반적으로 열적으로 또는 화학적으로 변성되어 이중 가닥을 2개의 단일 가닥으로 용융시키고/시키거나 단일 가닥 핵산으로부터 헤어핀 또는 다른 2차 구조를 제거한다. 용어 "엄격성"은 혼성화가 일어나는 조건을 의미한다. 혼성화의 엄격성은 온도, 염 농도, 이온 강도 및 혼성화 버퍼 조성과 같은 조건에 의해 영향을 받는다. 일반적으로, 낮은 엄격성 조건은 정의된 이온 강도 및 pH에서 특정 서열에 대한 열 용융점 (Tm)보다 약 30℃ 낮게 선택된다. 중간 엄격성 조건은 온도가 Tm보다 20℃ 낮은 경우이고, 높은 엄격성 조건은 온도가 Tm보다 10℃ 낮은 경우이다. 높은 엄격성 혼성화 조건은 표적 핵산 서열과 높은 서열 유사성을 갖는 혼성화 서열을 단리하기 위해 전형적으로 사용된다. 그러나, 핵산은 유전자 코드의 축퇴성으로 인해, 서열이 다를 수 있고, 여전히 실질적으로 동일한 폴리펩티드를 코딩할 수 있다. 그러므로, 이러한 핵산 분자를 식별하기 위해 중간 엄격성 혼성화 조건이 때때로 필요할 수 있다.
상기 Tm은 표적 서열의 50%가 완벽하게 일치하는 프로브에 혼성화되는, 정의된 이온 강도 및 pH 하의 온도이다. 상기 Tm은 용액 상태, 및 염기 조성 및 프로브의 길이에 따라 달라진다. 예를 들어, 더 긴 서열은 특히 더 높은 온도에서 혼성화된다. 혼성화의 최대 속도는 Tm보다 약 16℃ 내지 최대 32℃ 낮게 수득된다. 상기 혼성화 용액 중에 1가 양이온이 존재하면 2개의 핵산 가닥들 사이의 정전기적 반발이 감소하고, 이에 의해 혼성체 형성을 촉진하며; 이러한 효과는 최대 0.4M의 나트륨 농도에서 볼 수 있다 (더 높은 농도의 경우, 이 효과를 무시할 수 있다). 포름아미드는 각 % 포름아미드에 대해 0.6 내지 0.7℃로 DNA-DNA 및 DNA-RNA 듀플렉스의 용융 온도를 낮추고, 50% 포름아미드를 부가하면 혼성화 속도가 더 낮아지더라도, 혼성화가 30 내지 45℃에서 수행될 수 있다. 염기쌍 미스매치 (mismatches)는 듀플렉스의 혼성화 속도 및 열 안정성을 감소시킨다. 평균 및 큰 프로브의 경우, Tm은 염기 미스매치 %당 약 1℃ 감소한다. 상기 Tm은 혼성체의 타입에 따라, 하기 식을 사용하여 계산할 수 있다:
1) DNA-DNA 혼성체 (Meinkoth and Wahl, Anal. Biochem., 138: 267-284, 1984):
Tm= 81.5℃ + 16.6x(log10[Na+]a) + 0.41x (% [G+Cb] - 500x[Lc]-1 - 0.61x (% 포름아미드)
2) DNA-RNA 또는 RNA-RNA 혼성체:
Tm= 79.8℃+ 18.5x(log10[Na+]a) + 0.58x(% [G+Cb]) + 11.8x(% [G+Cb])2 - 820x[Lc]-1
3) 올리고-DNA 또는 올리고-RNAd 혼성체:
< 20개의 뉴클레오티드의 경우: Tm = 2/n
20 - 35개의 뉴클레오티드의 경우: Tm = 22 + 1.46/n
여기에서:
a: 또는 다른 1가 양이온의 경우, 0.01-0.4 M 범위에서만 정확하다.
b: 30% 내지 75% 범위의 % GC에 대해서만 정확하다.
c: L = 염기쌍에서의 듀플렉스 길이,
d: 올리고, 올리고뉴클레오티드,
n: 프라이머의 유효 길이 = 2x(G+C의 수)+(A+T의 수).
비-특이적 결합은 가령 예를 들어, 상기 막의 단백질 함유 용액으로의 차단, 이종 RNA, DNA 및 SDS의 혼성화 버퍼로의 부가, 및 Rnase로의 처리와 같은 다수의 알려진 기술들 중 어느 하나의 기술을 사용하여 제어될 수 있다. 비-상동성 프로브의 경우, 계열 혼성화는 (i) 어닐링 온도의 점진적 저하 (예: 68℃에서 42℃로) 또는 (ii) 포름아미드 농도의 점진적 저하 (예: 50%에서 0%로) 중 하나를 가변시킴으로써 수행될 수 있다. 당업자는 혼성화 중에 변경될 수 있고, 엄격성 조건을 유지하거나 또는 변경할 다양한 파라미터를 알고 있다.
혼성화 조건 외에도, 혼성화의 특이성은 또한 전형적으로 혼성화 후 세척의 기능에 따라 달라진다. 비-특이적 혼성화로 인한 배경을 제거하기 위해, 샘플을 묽은 염 용액으로 세척하였다. 이러한 세척의 중요한 요인에는 최종 세척 용액의 이온 강도 및 온도를 포함하며; 염 농도를 낮추고 세척 온도를 높이면, 세척의 엄격성이 높아진다. 세척 조건은 전형적으로 혼성화 엄격성에서 또는 그 이하에서 수행된다. 양성 혼성화는 배경 신호의 적어도 2배인 신호를 제공한다. 일반적으로, 핵산 혼성화 분석 또는 유전자 증폭 검출 절차에 적합한 엄격성 조건은 상기 제시된 바와 같다. 다소의 엄격성 조건이 또한 선택될 수 있다. 당업자는 세척 중에 변경될 수 있고, 엄격성 조건을 유지하거나 또는 변경하는 다양한 파라미터를 알고 있다.
예를 들어, 50개 초과의 뉴클레오티드의 DNA 혼성체에 대한 전형적으로 높은 엄격성 혼성화 조건은 1x SSC에서 65℃ 또는 1x SSC 및 50% 포름아미드에서 42℃에서 혼성화한 다음에, 0.3x SSC에서 65℃에서 세척하는 것을 포함한다. 50개 초과의 뉴클레오티드의 DNA 혼성체에 대한 중간 엄격성 혼성화 조건의 예로는 4x SSC에서 50℃ 또는 6x SSC 및 50% 포름아미드에서 40℃에서 혼성화한 다음에, 2x SSC에서 50℃에서 세척하는 것을 포함한다. 혼성체의 길이는 혼성화 핵산의 예상 길이이다. 알려진 서열의 핵산이 혼성화되는 경우, 혼성체 길이는 서열들을 정렬하고, 본원에 기재된 보존 영역을 확인함으로써 결정될 수 있다. 1x SSC는 0.15M NaCl 및 15mM 시트르산 나트륨이고; 상기 혼성화 용액 및 세척 용액은 5x Denhardt 시약, 0.5-1.0% SDS, 100 μg/ml 변성, 단편화된 연어 정자 DNA, 0.5% 소듐 피로포스페이트를 추가로 포함할 수 있다.
엄격성의 수준을 정의하기 위해, Sambrook et al. (2001) Molecular Cloning: a laboratory manual, 3rd Edition, Cold Spring Harbor Laboratory Press, CSH, New York or to Current Protocols in Molecular Biology, John Wiley and Sons, N.Y. (1989 and yearly updates)를 참조할 수 있다.
용어 "엄격한 조건"은 프로브가 이의 표적 서브서열에 혼성화되지만 다른 서열에는 혼성화되지 않는 조건을 지칭한다. 엄격한 조건은 서열-의존성이고, 상황에 따라 다를 것이다. 더 긴 서열은 더 높은 온도에서 특이적으로 혼성화된다. 일반적으로, 엄격한 조건은 정의된 이온 강도 및 pH에서 특정 서열에 대한 열 용융점 (Tm)보다 약 15℃ 낮게 선택된다. 상기 Tm은 표적 서열에 상보적인 프로브의 50%가 평형에서 표적 서열에 혼성화되는 온도 (정의된 이온 강도, pH 및 핵산 농도 하에)이다. 예시되는 엄격한 혼성화 조건은 하기와 같을 수 있다: 50% 포름아미드, 5xSSC, 및 1% SDS, 42℃에서 인큐베이션, 또는 5x SSC, 1% SDS, 65℃에서 인큐베이션, 0.2x SSC 및 0.1% SDS 65℃에서 세척.
용어 "정제된"은 생물학적 분자의 활성을 방해하는 성분이 실질적으로 또는 본질적으로 유리된 물질을 지칭한다. 세포, 사카라이드, 핵산 및 폴리펩티드의 경우, 용어 "정제된"은 이의 자연 상태에서 발견되는 물질에 통상 동반되는 성분이 실질적으로 또는 본질적으로 유리된 물질을 지칭한다. 전형적으로, 본 발명의 정제된 사카라이드, 올리고사카라이드, 단백질 또는 핵산은 은 염색된 겔에서 밴드 세기 또는 다른 순도 결정 방법에 의해 측정하여, 적어도 약 50%, 55%, 60%, 65%, 70%, 75%, 80% 또는 85% 순수하고, 통상적으로 적어도 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 순수하다. 순도 (purity) 또는 균질성 (homogeneity)은 당해 분야에 잘 알려진 여러 수단, 예컨대 단백질 또는 핵산 샘플의 폴리아크릴아미드 겔 전기 영동에 이어 염색에 의한 시각화로 표시될 수 있다. 소정의 목적을 위해, 고해상도가 필요하고, HPLC 또는 유사한 정제 수단이 사용된다. 올리고사카라이드, 예를 들어 3-푸코실락토스의 경우, 순도는 이에 한정되는 것은 아니지만, 박막 크로마토그래피, 기체 크로마토그래피, NMR, HPLC, 모세관 전기영동 또는 질량 분광법과 같은 방법을 사용하여 결정될 수 있다.
2개 이상의 핵산 또는 폴리펩티드 서열과 관련하여 용어 "동일한" 또는 "동일성" 퍼센트 또는 "동일성" %는 서열 비교 알고리즘을 사용하거나 또는 육안 검사로 측정하여, 2개 이상의 서열들 또는 서브서열들이 비교되고 최대 일치를 위해 정렬되는 경우, 동일하거나, 또는 동일한 아미노산 잔기 또는 뉴클레오티드의 특정 퍼센트를 갖는 것을 지칭한다. 서열 비교를 위해, 하나의 서열은 테스트 서열이 비교되는 참조 서열로 작용한다. 서열 비교 알고리즘을 사용하는 경우, 테스트 및 참조 서열을 컴퓨터에 입력하고, 필요에 따라 서브서열 좌표를 지정하고, 서열 알고리즘 프로그램 파라미터가 지정된다. 그 다음에 서열 비교 알고리즘은 지정된 프로그램 파라미터에 기반하여, 참조 서열에 대한 테스트 서열(들)에 대한 서열 동일성 퍼센트를 계산한다. 동일성 퍼센트는 BLAST 및 PSI-BLAST를 사용하여 결정될 수 있다 (Altschul et al., 1990, J Mol Biol 215:3, 403- 410; Altschul et al., 1997, Nucleic Acids Res 25: 17, 3389-402). 본 발명의 목적을 위해, 동일성 퍼센트는 MatGAT2.01을 사용하여 결정된다 (Campanella et al., 2003, BMC Bioinformatics 4:29). 단백질에 대한 하기 디폴트 파라미터가 사용된다: (1) Gap cost Existence: 12 및 Extension: 2; (2) 사용된 Matrix는 BLOSUM50임.
용어 "조절 서열"은 폴리뉴클레오티드 서열의 폴리펩티드로의 전사 및 번역을 허용하는 숙주 세포 전사 및 번역 시스템에 의해 인식되는 서열을 지칭한다. 따라서 이러한 DNA 서열은 특정 숙주 세포 또는 유기체에서 작동 가능하게 연결된 코딩 서열의 발현에 필요하다. 이러한 조절 서열은 프로모터 서열, 리보솜 결합 서열, Shine Dalgarno 서열, Kozak 서열, 전사 종결인자 서열일 수 있지만, 이에 한정되지 않는다. 예를 들어, 원핵생물에 적합한 조절 서열은 프로모터, 선택적으로 작동인자 서열 및 리보솜 결합 부위를 포함한다. 진핵 세포는 프로모터, 폴리아데닐화 신호 및 인핸서를 이용하는 것으로 알려져 있다. 프리서열 (presequence) 또는 분비 리더 (secretory leader)에 대한 DNA는 폴리펩티드의 분비에 관여하는 전단백질 (preprotein)로 발현되는 경우 폴리펩티드에 대한 DNA에 작동 가능하게 연결될 수 있다; 프로모터 또는 인핸서가 서열의 전사에 영향을 미치는 경우 이는 코딩 서열에 작동 가능하게 연결되거나; 또는 리보솜 결합 부위가 서열의 전사에 영향을 미치는 경우 이는 코딩 서열에 작동 가능하게 연결되거나; 또는 리보솜 결합 부위가 번역을 촉진하기 위해 위치되는 경우 이는 코딩 서열에 작동 가능하게 연결된다. 상기 제어 서열은 추가로 상기 폴리뉴클레오티드의 폴리펩티드로의 전사 또는 번역을 유도 또는 억제하는 유전자 회로 (genetic circuit)를 통해 또는 유도성 프로모터 (inducible promoter)를 통해 외부 화학물질, 예컨대 이에 한정되는 것은 아니지만, IPTG, 아라비노스, 락토스, 알로락토스, 람노스 또는 푸코스로 제어될 수 있다.
일반적으로, "작동 가능하게 연결된"은 연결되는 DNA 서열들이 연속적이며 분비 리더의 경우 연속적이며 판독 단계에 있음을 의미한다. 그러나 인핸서는 연속적일 필요는 없다.
본원에서 사용된, 용어 "세포 생산성 지수 (cell productivity index: CPI)"는 배양물에서 생성된 재조합 세포의 질량으로 재조합 세포에 의해 생성된 생성물의 질량을 나눈 것을 지칭한다.
발명의 상세한 설명
제1 구체예에서, 본 발명은 유전자 변형 세포에 의해 푸코실락토스를 제조하는 방법을 제공한다. 상기 방법은 하기 단계를 포함한다:
- 푸코실락토스를 생성할 수 있는 세포를 제공하는 단계로서, 상기 세포는 푸코실락토스 합성에 관여하는 효소를 코딩하는 핵산 서열을 적어도 1개 포함하고, 더 구체적으로 상기 세포는 구아노신-디포스페이트 푸코스 (GDP-푸코스) 공여체로부터의 푸코스 잔기를 락토스 수용체에 전달하여 푸코실락토스를 합성하는 푸코실트란스퍼라제를 코딩하는 핵산 서열을 적어도 1개 포함하며,
- 상기 세포는 i) 내인성 막 단백질, 더 구체적으로 푸코실락토스 수송에 관여하는 내인성 막 단백질, 더욱 구체적으로 푸코실락토스 수송을 가능하게 하고/하거나 이를 향상시키는 내인성 막 단백질의 변형된 발현, 및/또는 ii) 이종 막 단백질, 더 구체적으로 푸코실락토스 수송에 관여하는 이종 막 단백질, 더욱 구체적으로 푸코실락토스 수송을 가능하게 하고/하거나 이를 향상시키는 이종 막 단백질의 발현을 추가로 포함하고, 상기 막 단백질은 i) 2019년 7월 4일자로 공개된 InterPro 75.0에 정의되는, interpro 번호 IPR001503 및 IPR002516을 각각 사용하여 GT10 및 GT11 푸코실트란스퍼라제 패밀리의 게놈 인근 (genome neighborhood)을 검색하여 발견된 PFAM 도메인들 중 어느 하나의 도메인을 포함하는 막 단백질들의 그룹으로부터 선택되고, 여기서 상기 게놈 인근 윈도우 크기 (genomic neighbourhood window size)는 각 푸코실트란스퍼라제 앞에 14개의 유전자 및 뒤에 14개의 유전자이고, 상기 막 단백질은 SET 패밀리에 속하지 않으며, 또는 ii) 서열번호: 204, 206, 208, 210, 212, 214, 216, 218을 포함하는 막 단백질, 또는 서열번호: 204, 206, 208, 210, 212, 214, 216, 218을 포함하는 막 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 204, 206, 208, 210, 212, 214, 216, 218을 갖는 상기 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 서열의 그룹으로부터 선택되는 것인 단계, 및 상기 세포를 배지에서 원하는 푸코실락토스의 생성을 허용하는 조건 하에 배양하는 단계. 바람직하게는 상기 푸코실락토스는 본원에서 설명된 바와 같이 배양으로부터 분리된다.
본 발명의 바람직한 일 구체예에서, 상기 숙주 세포는 하기 그룹으로부터 선택되는 막 단백질을 포함한다:
a) 포터;
b) P-P-결합-가수분해-유도 수송체;
c) β-배럴 포린;
d) 보조 수송 단백질;
e) 추정 수송 단백질; 및
f) 포스포트란스퍼-유도 그룹 전위인자.
다른 구체예는 하기 단계를 포함하는, 유전자 변형 세포에 의해 푸코실락토스를 제조하는 방법을 제공한다:
- 푸코실락토스를 생성할 수 있는 세포를 제공하는 단계로서, 상기 세포는 푸코실락토스 합성에 관여하는 효소, 더 구체적으로 GDP-푸코스 공여체로부터의 푸코스 잔기를 락토스 수용체에 전달하여 푸코실락토스를 합성하는 푸코실트란스퍼라제를 코딩하는 핵산 서열을 적어도 1개 포함하고,
- 상기 세포는 i) 푸코실락토스 수송에 관여하고, 더 구체적으로 푸코실락토스 수송을 가능하게 하고/하거나 이를 향상시키는 내인성 막 단백질의 변형된 발현, 및/또는 ii) 푸코실락토스 수송에 관여하고, 더 구체적으로 푸코실락토스 수송을 가능하게 하고/하거나 이를 향상시키는 이종 막 단백질의 발현을 추가로 포함하고, 상기 막 단백질은
a) SET를 제외한 포터;
b) P-P-결합-가수분해-유도 수송체;
c) β-배럴 포린;
d) 보조 수송 단백질;
e) 추정 수송 단백질; 및
f) 포스포트란스퍼-유도 그룹 전위인자의 그룹으로부터 선택되는 단계;
- 상기 세포를 배지에서 원하는 푸코실락토스의 생성을 허용하는 조건 하에 배양하는 단계. 바람직하게는 상기 생성된 푸코실락토스는 본원에서 설명된 바와 같이 배양으로부터 분리된다.
본원에 기재된 본 발명의 방법에서, 상기 막 단백질은 변형된 발현을 갖는 내인성 단백질로, 바람직하게는 과발현되는 내인성 단백질이거나; 또는 상기 막 단백질은 세포에 의해 이종 발현될 수 있는 이종 단백질이다. 그 다음에, 상기 이종 발현된 막 단백질이 도입되어 발현될 것이며, 바람직하게는 과발현될 것이다. 다른 구체예에서, 상기 내인성 단백질은 이종 막 단백질을 또한 발현하는 세포에서 변형된 발현을 가질 수 있다.
본원에서 사용되는 숙주 세포는 바람직하게는 푸코실락토스 생성을 위해 유전자 변형된다. 추가의 바람직한 구체예에서, 본원에서 사용된 세포는 락토스 또는 중간체를 푸코실락토스로 변형시킬 수 있는 재조합 푸코실트란스퍼라제를 포함한다.
본원에서 사용된 숙주 세포는 푸코실락토스 생성을 위해 선택적으로 유전자 변형되며, 상기 숙주 세포는 GDP-푸코스의 데 노보 (de novo) 합성을 발현하도록 변형된다. 상기 GDP-푸코스의 데 노보 합성은 만노스-6-포스페이트 이소머라제, 포스포만노뮤타제 코딩 유전자, 만노스-1-포스페이트 구아노실트란스퍼라제, GDP-만노스-4,6-데하이드라타제 및 GDP-L-푸코스 신타제 효소에 의해 촉매된다. 바람직하게는, 상기 숙주 세포는 GDP-푸코스의 데 노보 합성의 효소를 코딩하는 하나 이상의 유전자를 발현하도록 추가로 변형된다.
본원에서 사용된 숙주 세포는 락토스 퍼미아제의 도입 및/또는 과발현에 의해, 세포에서 락토스를 내수송하도록 선택적으로 유전자 변형된다. 상기 락토스 퍼미아제는 예를 들어 lacY 유전자 또는 lac12 유전자에 의해 코딩된다.
본 발명의 추가 양상에 따르면, 상기 막 단백질을 코딩하는 폴리뉴클레오티드는 각 세포 또는 발현 시스템의 코돈 사용에 적응된다.
상기 구체예의 바람직한 일 양상에서, 상기 포터는 TCDB 클래스 2.A.1.1, 2.A.1.12, 2.A.1.15, 2.A.1.2, 2.A.1.3, 2.A.1.36, 2.A.1.38, 2.A.1.46, 2.A.1.68, 2.A.1.7, 2.A.1.81, 2.A.123, 2.A.2, 2.A.21, 2.A.58, 2.A.6.3, 2.A.66 및 2.A.7.1의 그룹으로부터 선택되고; 상기 P-P-결합-가수분해-유도 수송체는 TCDB 클래스 3.A.1.1, 3.A.1.2, 3.A.1.10, 3.A.1.11 및 3.A.1.5의 그룹으로부터 선택되며; 상기 β-배럴 포린은 TCDB 클래스 1.B.18 및 1.B.3.1로부터 선택되고; 상기 보조 수송 단백질은 TCDB 클래스 8.A.3으로부터 선택되며; 상기 추정 수송 단백질은 TCDB 클래스 9.B.14 및 9.B.158의 그룹으로부터 선택되거나; 또는 포스포트란스퍼-유도 그룹 전위인자는 TCDB 클래스 4.A.1.1 및 4.A.4.1의 그룹으로부터 선택된다. 상기 TCDB 클래스는 2019년 6월 17일자로 공개된 TCDB.org에 정의되는 바와 같이 분류된다.
상기 구체예의 다른 바람직한 양상에서, 상기 포터는 eggnog 패밀리 (eggnog families)  05BZS, 05C0R, 05C2C, 05CT4, 05CXP, 05CZQ, 05D94, 05DXI, 05E5M, 05E5W, 05E8G, 05EAM, 05EDR, 05EGZ, 05F9N, 05JHE, 05PSV, 05W2Y, 05W3H, 05XJ5, 070Q9, 07CWC, 07QF7, 07QNK, 07RBJ, 07RJ1, 07T5E, 07VQ3, 0814C, 088QT, 08H15, 08N8A, 08SC4, 08Z4Q의 그룹으로부터 선택되고; 상기 P-P-결합-가수분해-유도 수송체는 eggnog 패밀리 05BZ1, 05CJ1, 05DMK, 05DFW, 05EY8, 05HAC, 05MFV, 07FKK, 07R5U, 07V1T, 08IJ9, 08JQ7, 172T7의 그룹으로부터 선택되며; 상기 β-배럴 포린은 eggnog 패밀리 05DAY, 08KDD의 그룹으로부터 선택되고; 상기 보조 수송 단백질은 eggnog 패밀리 07SYR의 그룹으로부터 선택되며; 추정 수송 단백질은 eggnog 패밀리 05CRE, 05GWF, 06N3A의 그룹으로부터 선택되거나; 또는 포스포트란스퍼-유도 그룹 전위인자 단백질은 eggnog 패밀리 05CI1, 05VI0의 그룹으로부터 선택된다. 상기 eggnog 패밀리는 2017년 11월 3일자로 공개된 eggnogdb 1.0.2에 정의되는 바와 같이 분류된다.
상기 구체예의 다른 바람직한 양상에서, 상기 포터는 PFAM 목록 PF00083, PF00474, PF00873, PF00893, PF01895, PF01943, PF02690, PF03083, PF04193, PF05977, PF07690, PF07690, PF13347, PF13440, PF14667로부터 선택되고; 상기 P-P-결합-가수분해-유도 수송체는 PFAM 목록 PF00005, PF00532, PF00664, PF01061, PF08352, PF14524, PF13407, PF13416, PF17912로부터 선택되며; 상기 β-배럴 포린은 PFAM 목록 PF02264, PF02563, PF10531, PF18412로부터 선택되고; 상기 보조 수송 단백질은 PFAM 목록 PF13807, PF02706으로부터 선택되며; 상기 추정 수송 단백질은 PFAM 목록 PF01578, PF03932, PF05140, PF11045로부터 선택되고, 및/또는 상기 포스포트란스퍼-유도 그룹 전위인자 단백질은 PFAM 목록 PF00367, PF00358, PF02378, PF03829로부터 선택된다. 상기 PFAM 목록은 2018년 9월에 공개된 Pfam 32.0에 정의되는 바와 같이 분류된다.
상기 구체예의 다른 바람직한 양상에서, 상기 포터는 interpro 목록 IPR000390, IPR001036, IPR001411, IPR001734, IPR001927, IPR002797, IPR003663, IPR003841, IPR004316, IPR004633, IPR004638, IPR004734, IPR004812, IPR005275, IPR005828, IPR005829, IPR006603, IPR010290, IPR011701, IPR020846, IPR023008, IPR023721, IPR023722, IPR026022, IPR027417, IPR027463, IPR029303, IPR032896, IPR036259, IPR038078, IPR038377, IPR039672로부터 선택되고; 상기 P-P-결합-가수분해-유도 수송체는 interpro 목록 IPR000412, IPR001734, IPR001761, IPR003439, IPR003593, IPR005829, IPR005978, IPR005981, IPR006059, IPR006060, IPR006061, IPR008995, IPR011527, IPR011701, IPR013456, IPR013525, IPR013563, IPR015851, IPR015855, IPR017871, IPR019554, IPR020846, IPR025997, IPR026266, IPR027417, IPR028082, IPR029439, IPR033893, IPR036259, IPR036640, IPR038377, IPR039421, IPR040582로부터 선택되며; 상기 β-배럴 포린은 interpro 목록 IPR003192, IPR003715, IPR019554, IPR023738, IPR036998, IPR040716으로부터 선택되고; 상기 보조 수송 단백질은 interpro 목록 IPR003856, IPR020846, IPR027417, IPR032807, IPR036259로부터 선택되고; 상기 추정 수송 단백질은 interpro 목록 IPR002541, IPR003439, IPR003593, IPR004316, IPR005627, IPR006603, IPR007816, IPR017871, IPR020368, IPR020846, IPR023648, IPR027417, IPR036259, IPR036822로부터 선택되거나; 또는 상기 포스포트란스퍼-유도 그룹 전위인자 단백질은 interpro 목록 IPR001127, IPR001996, IPR003352, IPR004716, IPR010974, IPR011055, IPR013013, IPR018113, IPR018454, IPR036665, IPR036878로부터 선택된다. 상기 interpro 목록은 2019년 7월 4일자로 공개된 InterPro 75.0에 정의되는 바와 같이 분류된다.
본 발명의 바람직한 일 양상에서, 본원에 기재된 방법은 하기로부터 선택되는 포터 막 단백질 발현 숙주 세포를 사용한다: 서열번호: 02의 대장균 (Escherichia coli) K12 MG1655 유래의 MdfA, 서열번호: 06의 대장균 K12 MG1655 유래의 IceT, 서열번호: 40의 B. 론검 아종 인판티스 (B. longum subsp. Infantis) (균주 ATCC 15697) 유래의 Blon_2331, 서열번호: 42의 B. 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2332, 서열번호: 58의 키티노파가 종 (Chitinophaga sp.) CF118, 서열번호: 66의 프레보텔라 루미니콜라 (Prevotella ruminicola) (AR32), 서열번호: 64의 락토코커스 라피노락티스 (Lactococcus raffinolactis) (ATCC 43920), 또는 서열번호: 62의 디아도박터 솔리 (Dyadobacter soli) DSM 25329의 wzx-유사 단백질, 또는 상기 포터 막 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 02, 06, 40, 42, 58, 66, 64 또는 62 각각의 상기 MdfA, IceT, Blon_2331, Blon_2332 막 단백질 또는 wzx-유사 막 단백질 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 서열. 다른 바람직한 양상에서, 본원에 기재된 방법은 하기로부터 선택된 P-P-결합-가수분해 유도 수송체 막 단백질 발현 숙주 세포를 사용한다: 서열번호: 28의 락토코커스 락티스 (Lactococcus lactis) SRCM103457 유래의 lmrA, 서열번호: 70 및 74의 스포로무사 스파에로이데스 (Sporomusa sphaeroides) DSM 2875, 또는 서열번호: 68 및 72의 플라보박테리움 스파르탄시이 (Flavobacterium spartansii) 유래의 LpsE 막 단백질, 서열번호: 76의 칸디다투스 플란크토필라 설포니카 (Candidatus Planktophila sulfonica) 유래의 TolC, 서열번호: 82의 페도박터 긴센기솔리 (Pedobacter ginsengisoli), 서열번호: 84의 베루코미크로비아 박테리움 (Verrucomicrobia bacterium) CG1_02_43_26 유래의 MsbA, 서열번호: 206의 대장균 K-12 MG1655 유래의 malE, 서열번호: 208의 대장균 K-12 MG1655 유래의 malK, 서열번호: 214의 대장균 K-12 MG1655 유래의 araF, 서열번호: 216의 대장균 K-12 MG1655 유래의 xylF, 또는 서열번호: 218의 대장균 K-12 MG1655 유래의 ytfQ, 또는 상기 P-P-결합-가수분해 유도 수송체 막 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 28, 70, 74, 68, 72, 76, 82, 84, 206, 208, 214, 216 또는 218 각각의 상기 lmrA, LpsE, TolC, MsbA, malE, malK, araF, xylF 또는 ytfQ 막 단백질 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 서열.
또 다른 바람직한 양상에서, 본원에 기재된 방법은 하기로부터 선택된 β-배럴 포린 발현 숙주 세포를 사용한다: 서열번호: 34의 대장균 K12 MG1655 유래의 Wza 또는 서열번호: 204의 대장균 K-12 MG1655 유래의 lamB, 또는 이의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 34 또는 204 각각의 상기 Wza 또는 lamB 막 단백질에 대해 적어도 80%의 서열 동일성을 갖는 서열.
대안의 바람직한 일 양상에서, 본원에 기재된 방법은 하기로부터 선택되는 보조 수송 단백질 발현 숙주 세포를 사용한다: 서열번호: 88의 서모토가 마리티마 (Thermotoga maritima) (균주 ATCC 43589 / MSB8 / DSM 3109 / JCM 10099) 유래의 Wzc, 또는 이의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 88의 상기 Wzc 막 단백질에 대해 적어도 80%의 서열 동일성을 갖는 서열.
다른 대안의 바람직한 양상에서, 본원에 기재된 방법은 하기로부터 선택되는 추정 수송 단백질 발현 숙주 세포를 사용한다: 서열번호: 90의 클로스트리디움 종 (Clostridium sp.) CAG: 1013, 서열번호: 92의 오도리박터 스플란크니쿠스 (Odoribacter splanchnicus) DSM 20712, 서열번호: 94의 미추아리아 종 (Mitsuaria sp.) PDC51 또는 서열번호: 96의 프레보텔라 인테르메디아 (Prevotella intermedia) ATCC 25611 (DSM 20706) 유래의 CutC, 또는 상기 CutC 막 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 90, 92, 94 또는 96 각각의 상기 CutC 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 서열.
다른 대안의 바람직한 양상에서, 본원에 기재된 방법은 하기로부터 선택되는 포스포트란스퍼-유도 그룹 전위인자 발현 숙주 세포를 사용한다: 서열번호: 210의 대장균 K-12 MG1655 유래의 nagE 또는 서열번호: 212의 대장균 K-12 MG1655 유래의 srlB, 또는 이의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 210 또는 212 각각의 상기 nagE 또는 srlB 막 단백질에 대해 적어도 80%의 서열 동일성을 갖는 서열.
추가 대안의 바람직한 양상에서, 본원에 기재된 방법은 하기를 발현하는 숙주 세포를 사용한다: 포터 막 단백질인 서열번호: 02의 대장균 K12 MG1655 유래의 MdfA, 서열번호: 06의 대장균 K12 MG1655 유래의 IceT, 서열번호: 04의 대장균 K12 MG1655 유래의 YnfM, 서열번호: 08의 대장균 K12 MG1655 유래의 Yhhs, 서열번호: 10의 대장균 K12 MG1655 유래의 EmrD, 서열번호: 12의 대장균 K12 MG1655 유래의 YdhC, 서열번호: 14의 대장균 K12 MG1655 유래의 YbdA, 서열번호: 16의 대장균 K12 MG1655 유래의 YdeE, 서열번호: 18의 대장균 K12 MG1655 유래의 MhpT, 서열번호: 20의 대장균 K12 MG1655 유래의 YebQ, 서열번호: 22의 대장균 K12 MG1655 유래의 YjhB, 서열번호: 24의 대장균 K12 MG1655 유래의 Bcr, 서열번호: 26의 대장균 K12 MG1655 유래의 FucP, 서열번호: 32의 대장균 K12 MG1655 유래의 WzxE, 서열번호: 38의 대장균 K12 MG1655 유래의 EmrE, 서열번호: 40의 비피도박테리움 론검 아종 인판티스 (Bifidobacterium longum subsp. Infantis) (균주 ATCC 15697) 유래의 Blon_2331, 서열번호: 42의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2332, 서열번호: 46의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0247, 서열번호: 48의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0245, 서열번호: 50의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0345, 서열번호: 52의 뉴로스포라 크라사 (Neurospora crassa) OR74A 유래의 CDT2, 서열번호: 54의 아스페르길루스 오리제 (Aspergillus oryzae) RIB40 유래의 CDT2, 서열번호: 58의 키티노파가 종 CF118 유래의 Wzx, 서열번호: 60의 유박테리움 종 (Eubacterium sp.) CAG:581 유래의 Wzx, 서열번호: 62의 디아도박터 솔리 (DSM 25329) 유래의 Wzx, 서열번호: 64의 락토코커스 라피노락티스 (ATCC 43920) 유래의 Wzx, 서열번호: 66의 프레보텔라 루미니콜라 (AR32) 유래의 Wzx, 서열번호: 86의 브라키스피라 함프소니이 (Brachyspira hampsonii) P280/1 유래의 NAPO, 서열번호: 98의 악티노바쿨룸 수이스 (Actinobaculum suis) (DSM 20639) 유래의 NAm, 서열번호: 100의 루미노코커스 그나부스 (Ruminococcus gnavus) 유래의 NAm, 서열번호: 102의 쿠르토박테리움 종 (Curtobacterium sp.) 314Chir4.1 유래의 NAm, 서열번호: 104의 니아벨라 드릴라시스 (Niabella drilacis) (DSM25811) 유래의 Nap, 서열번호: 106의 사카리크리니스 퍼멘탄스 (Saccharicrinis fermentans) (DSM 9555) 유래의 Nap, 서열번호: 108의 시트로박터 프레운디이 (Citrobacter freundii) MGH152 유래의 mdtD, 서열번호: 110의 시트로박터 웨르크마니이 (Citrobacter werkmanii) NBRC 105721 유래의 mdtD, 서열번호: 112의 시트로박터 아말로나티쿠스 (Citrobacter amalonaticus) 유래의 mdtD, 서열번호: 114의 클레브시엘라 옥시토카 (Klebsiella oxytoca) 유래의 mdtD, 서열번호: 116의 에스케리치아 알베르티이 (Escherichia albertii) B156 유래의 mdtD, 서열번호: 118의 살모넬라 엔테리카 아종 살라메 (Salmonella enterica subsp. Salamae) 유래의 yegB, 서열번호: 120의 클레브시엘라 뉴모니에 (Klebsiella pneumoniae) 30684/NJST258_2 유래의 mdtD, 서열번호: 122의 클레브시엘라 뉴모니에 유래의 Tcr_1_D38215, 서열번호: 124의 슈도시트로박터 페칼리스 (Pseudocitrobacter faecalis) 유래의 mdtD, 서열번호: 126의 요케넬라 레겐스버게이 (Yokenella regensburgei) (ATCC43003) 유래의 Cmr, 서열번호: 128의 크로노박터 무이트젠시이 (Cronobacter muytjensii) 유래의 MdfA, 서열번호: 130의 클레브시엘라 옥시토카 유래의 MdfA, 서열번호: 132의 시트로박터 코세리 (Citrobacter koseri) 유래의 MFS, 서열번호: 134의 에스케리치아 마르모테 (Escherichia marmotae) 유래의 MdfA, 서열번호: 136의 시겔라 플렉스네리 (Shigella flexneri) 유래의 Cmr, 서열번호: 138의 살모넬라 엔테리카 아종 살라메 유래의 MdfA, 서열번호: 140의 시트로박터 윤게 (Citrobacter youngae) (ATCC 29220) 유래의 Cmr, 서열번호: 142의 시트로박터 프레운디이 유래의 MdfA, 서열번호: 144의 엔테로박터 코베이 (Enterobacter kobei) 유래의 MdfA, 서열번호: 146의 엔테로박터 종 (Enterobacter sp.) 유래의 MdfA, 서열번호: 148의 렐리오티아 종 (Lelliottia sp.) WB101 유래의 MdfA, 서열번호: 150의 엔테로박터 루드위기이 (Enterobacter ludwigii) EcWSU1 유래의 MdfA, 서열번호: 152의 악티노플라네스 우타헨시스 (Actinoplanes utahensis) 유래의 Sweet-유사 단백질, 서열번호: 154의 키티노파가세에 박테리움 (Chitinophagaceae bacterium) PMG_246 유래의 Sweet-유사 단백질, 서열번호: 156의 리조비움 종 (Rhizobium sp.) PDC82 유래의 Sweet-유사 단백질, 서열번호: 158의 키네오코커스 리조스파에레 (Kineococcus rhizosphaerae) (DSM 19711) 유래의 Sweet-유사 단백질, 서열번호: 160의 모르가넬라 모르가니이 (Morganella morganii) IS15 유래의 Sweet-유사 단백질, 서열번호: 162의 게오데르마토필루스 오브스쿠러스 (Geodermatophilus obscurus) (균주 ATCC 25078) 유래의 Sweet-유사 단백질, 서열번호: 164의 브라디리조비움 종 (Bradyrhizobium sp.) BTAi1 유래의 Sweet-유사 단백질, 서열번호: 166의 브라디리조비움 자포니쿰 (Bradyrhizobium japonicum) USDA 110 유래의 Sweet-유사 단백질, 서열번호: 168의 크산토모나스 캄페스트리스 pv. 베시카토리아 균주 (Xanthomonas campestris pv. vesicatoria str.) 85-10 유래의 Sweet-유사 단백질, 서열번호: 170의 헤르바스피릴룸 아쿠아티쿰 (Herbaspirillum aquaticum) 유래의 Sweet-유사 단백질, 서열번호: 172의 플라보박테리아 박테리움 (Flavobacteria bacterium) MS024-2A 유래의 Sweet-유사 단백질, 서열번호: 182의 시노리조비움 메디케 (Sinorhizobium medicae) WSM419 유래의 rnd-유사 단백질, 서열번호: 184의 아조스피릴룸 브라실리엔세 (Azospirillum brasiliense) LMG 04375 유래의 아라비노스 유출물 (arabinose efflux), 또는 상기 포터 막 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 02, 06, 04, 08, 10, 12, 14, 16, 18, 20, 22, 24, 26, 32, 38, 40, 42, 46, 48, 50, 52, 54, 58, 60, 62, 64, 66, 86, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164, 166, 168, 170, 172, 182 또는 184 각각의 상기 MdfA, IceT, YnfM, Yhhs, EmrD, YdhC, YbdA, YdeE, MhpT, YebQ, YjhB, Bcr, FucP, WzxE, EmrE, Wzx, Blon_2331, Blon_2232, Blon_0247, Blon_0245, Blon_0345, NAPO, NAm, Nap, mdtD, YegB, Tcr_1_D38215, cmr, MFS, CDT2, rnd, Sweet-유사 또는 아라비노스 유출물 막 단백질 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질; P-P-결합-가수분해-유도 수송체인 서열번호: 28의 락토코커스 락티스 균주 SRCM103457 유래의 LmrA, 서열번호: 30의 대장균 균주 K12 MG1655 유래의 OppF, 서열번호: 36의 헬리코박터 필로리 (Helicobacter pylori) (균주 ATCC 700392 / 26695) 유래의 Wzk, 서열번호: 44의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2475, 서열번호: 68 또는 72의 플라보박테리움 스파르탄시이 유래의 LpsE, 서열번호: 70 또는 74의 스포로무사 스파에로이데스 DSM 2875 유래의 LpsE, 서열번호: 76의 칸디다투스 플란크토필라 설포니카 유래의 TolC, 서열번호: 78의 부티리비브리오 훈가테이 (Butyrivibrio hungatei) XBD2006 유래의 TolC, 서열번호: 80의 로세부리아 인테스티날리스 (Roseburia intestinalis) CAG:13 유래의 MsbA, 서열번호: 82의 페도박터 긴센기솔리 유래의 MsbA, 서열번호: 84의 베루코미크로비아 박테리움 CG1_02_43_26 유래의 MsbA, 서열번호: 174의 리조비움 종 Root149 유래의 Wzm, 서열번호: 176의 아조스피릴룸 브라실리엔세 LMG 04375 유래의 Wzm, 서열번호: 196의 대장균 113303 유래의 Wzm, 서열번호: 178의 리조비움 종 Root149 유래의 Wzt, 서열번호: 180의 아조스피릴룸 브라실리엔세 LMG 04375 유래의 Wzt, 서열번호: 194의 대장균 113303 유래의 Wzt, 서열번호: 188 또는 190의 브라디리조비움 자포니쿰 USDA 110 유래의 Nodj, 서열번호: 206의 대장균 K-12 MG1655 유래의 malE, 서열번호: 208의 대장균 K-12 MG1655 유래의 malK, 서열번호: 214의 대장균 K-12 MG1655 유래의 araF, 서열번호: 216의 대장균 K-12 MG1655 유래의 xylF, 또는 서열번호: 218의 대장균 K-12 MG1655 유래의 ytfQ, 또는 상기 P-P-결합-가수분해-유도 수송체 막 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 28, 30, 36, 44, 68, 72, 70, 74, 76, 78, 80, 82, 84, 174, 176, 196, 178, 180, 194, 188, 190, 206, 208, 214, 216 또는 218 각각의 상기 LmrA, OppF, Wzk, Blon_2475, LpsE, TolC, MsbA, Wzm, Wzt 또는 Nodj 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질; 추정 수송 단백질인 서열번호: 56의 헬리코박터 필로리 유래의 사이토크롬 C 생합성 단백질, 서열번호: 90의 클로스트리디움 종 CAG: 1013 유래의 CutC, 서열번호: 92의 오도리박터 스플란크니쿠스 DSM 20712 유래의 CutC, 서열번호: 94의 미추아리아 종 PDC51 유래의 CutC, 서열번호: 96의 프레보텔라 인테르메디아 ATCC 25611 (DSM 20706) 유래의 CutC, 서열번호: 190의 대장균 K12 MG1655 유래의 ybjM, 서열번호: 192의 엔테로박테리아세에 박테리움 (Enterobacteriaceae bacterium) ENNIH1 유래의 ybjM, 또는 상기 추정 수송 단백질들 중 어느 하나를 코딩하는 폴리뉴클레이티드의 기능성 상동체 또는 기능성 단편; 또는 서열번호: 56, 90, 92, 94, 96, 190 또는 192 각각의 상기 CytC, CutC 또는 ybjM 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질.
본원에서 사용된 바와 같이, 열거된 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질은 상기 서열이 각 막 단백질의 아미노산 서열의 전장에 대해 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9%의 서열 동일성을 갖는 것으로 이해된다.
이러한 막 단백질의 아미노산 서열은 첨부된 서열목록의 서열번호: 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164, 166, 168, 170, 172, 174, 176, 178, 180, 182, 184, 186, 188, 190, 192, 194, 196, 204, 206, 208, 210, 212, 214, 216 또는 218로부터 선택되는 서열일 수 있고, 또는 서열번호: 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164, 166, 168, 170, 172, 174, 176, 178, 180, 182, 184, 186, 188, 190, 192, 194, 196, 204, 206, 208, 210, 212, 214, 216 또는 218 중 어느 하나의 전장의 아미노산 서열에 대해 적어도 80%의 서열 동일성, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.5%의 서열 동일성을 갖는 아미노산 서열일 수 있다.
본 발명의 추가 양상에서, 본원에 기재된 방법은 세포벽의 외막을 가로질러 화합물의 수송에 관여하는 수송체 단백질인 막 단백질 발현 숙주 세포를 사용한다.
추가의 바람직한 일 양상에서, 본원에 기재된 푸코실락토스의 제조 방법은 하기 단계들 중 적어도 하나를 추가로 포함하고:
i) 상기 배양 배지에, 초기 반응기 부피 1 리터 (litre)당 락토스를 적어도 50, 더 바람직하게는 적어도 75, 더 바람직하게는 적어도 100, 더 바람직하게는 적어도 120, 더 바람직하게는 적어도 150 그람 (gram)을 포함하는 락토스 공급물을, 바람직하게는 연속 방식 (continuous manner)으로, 바람직하게는 상기 배양 배지의 최종 부피가 상기 락토스 공급물의 부가 전 배양 배지 부피의 3배 이하, 바람직하게는 2배 이하, 더 바람직하게는 2배 미만이 되도록 부가하는 단계로서, 여기서 전체 반응기 부피는 250 mL (밀리리터) 내지 10.000 m3 (입방 미터)의 범위인 것이 단계;
ii) 락토스 공급물을 연속 방식으로 상기 배양 배지에 1일, 2일, 3일, 4일, 5일에 걸쳐 공급 용액에 의해 부가하는 단계;
iii) 락토스 공급물을 연속 방식으로 배양 배지에 1일, 2일, 3일, 4일, 5일에 걸쳐 공급 용액에 의해 부가하는 단계로서, 상기 락토스 공급 용액의 농도는 50 g/L, 바람직하게는 75 g/L, 더 바람직하게는 100 g/L, 더 바람직하게는 125 g/L, 더 바람직하게는 150 g/L, 더 바람직하게는 175 g/L, 더 바람직하게는 200 g/L, 더 바람직하게는 225 g/L, 더 바람직하게는 250 g/L, 더 바람직하게는 275 g/L, 더 바람직하게는 300 g/L, 더 바람직하게는 325 g/L, 더 바람직하게는 350 g/L, 더 바람직하게는 375 g/L, 더 바람직하게는 400 g/L, 더 바람직하게는 450 g/L, 더 바람직하게는 500 g/L, 더욱 바람직하게는 550 g/L, 가장 바람직하게는 600 g/L이며; 바람직하게는 상기 용액의 pH는 3 내지 7로 설정되고, 바람직하게는 상기 공급 용액의 온도는 20℃ 내지 80℃로 유지되는 것인 단계;
상기 방법으로 상기 배양 배지의 최종 부피 중에 적어도 50 g/L, 바람직하게는 적어도 75 g/L, 더 바람직하게는 적어도 90 g/L, 더 바람직하게는 적어도 100 g/L, 더 바람직하게는 적어도 125 g/L, 더 바람직하게는 적어도 150 g/L, 더 바람직하게는 적어도 175 g/L, 더 바람직하게는 적어도 200 g/L의 푸코실락토스 농도가 수득된다.
바람직하게는 상기 락토스 공급은 배양 초기부터 락토스를 적어도 5 mM의 농도, 바람직하게는 30, 40, 50, 60, 70, 80, 90, 100, 150 mM의 농도, 더 바람직하게는 > 300 mM의 농도로 부가함으로써 달성된다.
다른 양상에서, 상기 락토스 공급은 배양의 생산 단계 전체에 걸쳐 적어도 5 mM, 바람직하게는 10 mM 또는 30 mM의 락토스 농도가 수득되도록 하는 농도로 락토스를 상기 배양 배지에 부가함으로써 달성된다.
본원에 기재된 방법의 추가 일 구체예에서, 상기 숙주 세포는 적어도 약 60, 80, 100, 또는 약 120시간 동안, 또는 연속 방식으로 배양된다.
본원에 기재된 방법의 다른 구체예에서, 탄소 및 에너지 공급원, 바람직하게는 수크로스, 글루코스, 프럭토스, 글리세롤, 말토스, 말토덱스트린, 트레할로스, 폴리올, 전분, 숙시네이트, 말레이트, 피루베이트, 락테이트, 에탄올, 시트레이트 및/또는 락토스가 또한 부가되고, 바람직하게는 연속적으로, 바람직하게는 락토스와 함께 상기 배양 배지에 부가된다.
바람직한 일 구체예에서, 탄소계 기질, 바람직하게는 수크로스가 배양 배지에서 3일 이상, 바람직하게는 최대 7일 동안 제공되고; 및/또는 상기 배양 배지의 최종 부피가 배양 전 배양 배지 부피의 3배 이하, 유리하게는 2배 이하, 더욱 유리하게는 2배 미만이 되도록, 배양 배지에 연속 방식으로 초기 배양 부피 1 리터당 수크로스가 적어도 100, 유리하게는 적어도 105, 더 유리하게는 적어도 110, 더욱 유리하게는 적어도 120 g 제공된다.
바람직하게는, 본원에 기재된 방법을 수행하는 경우, 탄소계 기질, 바람직하게는 글루코스 또는 수크로스를 상기 배양 배지에 부가함으로써 제1 지수적 세포 성장 단계가 제공되고, 그 후에 제2 단계에서 락토스가 상기 배양 배지에 부가된다.
대안의 바람직한 구체예에서, 본원에 기재된 방법에서, 상기 락토스는 탄소계 기질과 함께 제1 지수적 성장 단계에서 이미 부가된다.
다른 구체예에서, 본원에 기재된 방법은 2'-푸코실락토스, 3-푸코실락토스 및 디푸코실락토스로 구성된 그룹 중 푸코실락토스만을 단독으로 생성한다.
대안의 구체예에서, 본원에 기재된 방법은 푸코실락토스의 혼합물을 생성한다.
이러한 혼합물은 2'-푸코실락토스, 3-푸코실락토스 및 디푸코실락토스로 구성된 그룹 중 적어도 2개를 포함할 수 있다.
본원에 기재된 방법에서, 상기 유전자 변형 세포는 미생물, 식물 또는 동물 세포로 구성된 그룹으로부터 선택되고, 바람직하게는 상기 미생물은 박테리아, 진균 또는 효모이며, 바람직하게는 상기 식물은 벼, 목화, 유채, 대두, 옥수수 (maize) 또는 옥수수 식물 (corn plant)이고, 바람직하게는 상기 동물은 곤충, 어류, 조류 또는 비-인간 포유동물이고, 모두 본원에 기재된 바와 같다.
특정 예시되는 구체예에서, 본 발명의 방법은 푸코실락토스를 고수율로 제조하는 방법을 제공한다. 상기 방법은 락토스를 함유하는 수성 배양 또는 발효 배지에서, 유전자 변형 세포, 바람직하게는 대장균, 더 바람직하게는 유전자 lacZ, lacY lacA, glgC, agp, pfkA, pfkB, pgi, arcA, iclR, wcaJ, lonthyA를 녹아웃 (knock out)시킴으로써 변형된 대장균 세포를 배양하거나 또는 발효시키는 단계를 포함한다. 더욱 바람직하게는, 추가로 대장균 lacY 유전자, 지모모나스 모빌리스 (Zymomonas mobilis) 유래의 프럭토스 키나제 유전자 (frk) 및 비피도박테리움 아돌레센티스 (Bifidobacterium adolescentis) 유래의 수크로스 포스포릴라제 (SP)가 게놈 내로 녹인 (knock in)될 수 있고, 항시적으로 발현될 수 있다. 상기 항시성 프로모터는 De Mey 등에 의해 기재된 프로모터 라이브러리로부터 기원한다 (BMC Biotechnology, 2007). 이러한 유전자 변형은 또한 WO2016075243 및 WO2012007481에 기재되어 있다. 추가로, 상기 변형된 대장균 세포는 단일 푸코실트란스퍼라제를 코딩하는 재조합 유전자를 가지며, 예시되는 구체예에서 이는 3-푸코실락토스 (3-FL)를 생성하기 위해 락토스를 변형시킬 수 있는, α-1,3-푸코실트란스퍼라제일 수 있다. 상기 세포는 또한 본원에 기재된 막 단백질들 중 어느 하나의 발현을 코딩하는 재조합 유전자를 포함한다.
본 발명의 다른 양상은 푸코실락토스 생성을 위해 유전자 변형된 숙주 세포를 제공하며, 상기 숙주 세포는 푸코실락토스 합성에 관여하는 효소, 더 구체적으로 GDP-푸코스 공여체로부터의 푸코스 잔기를 락토스 수용체에 전달하여 푸코실락토스를 합성하는 푸코실트란스퍼라제를 코딩하는 핵산 서열을 적어도 1개 포함하고, 상기 세포는 i) 푸코실락토스 수송에 관여하는, 더 구체적으로 푸코실락토스 수송을 가능하게 하고/하거나 이를 향상시킬 수 있는 내인성 막 단백질의 변형된 발현, 및/또는 ii) 푸코실락토스 수송에 관여하는, 더 구체적으로 푸코실락토스 수송을 가능하게 하고/하거나 이를 향상시킬 수 있는 이종 막 단백질의 발현을 추가로 포함한다. 상기 막 단백질은 i) 2019년 7월 4일자로 공개된 InterPro 75.0에 정의되는, interpro 번호 IPR001503 및 IPR002516을 각각 사용하여 GT10 및 GT11 푸코실트란스퍼라제 패밀리의 게놈 인근을 검색하여 발견된 PFAM 도메인들 중 어느 하나를 포함하는 막 단백질들의 그룹으로부터 선택되며, 여기서 상기 게놈 인근 윈도우 크기는 각 푸코실트란스퍼라제 앞에 14개의 유전자 및 뒤에 14개의 유전자이고, 상기 막 단백질은 SET 패밀리에 속하지 않으며, 또는 ii) 서열번호: 204, 206, 208, 210, 212, 214, 216, 218을 포함하는 막 단백질들, 또는 서열번호: 204, 206, 208, 210, 212, 214, 216, 218을 포함하는 막 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 204, 206, 208, 210, 212, 214, 216, 218의 상기 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 서열의 그룹으로부터 선택된다.
대안으로서 또는 바람직하게는, 상기 막 단백질은 하기 그룹으로부터 선택된다:
a) SET를 제외한 포터;
b) P-P-결합-가수분해-유도 수송체;
c) β-배럴 포린;
d) 보조 수송 단백질;
e) 추정 수송 단백질; 및
f) 포스포트란스퍼-유도 그룹 전위인자.
대안으로서 또는 바람직하게는, 상기 막 단백질은 하기 그룹으로부터 선택된다: i) 포터 막 단백질인 서열번호: 02의 대장균 K12 MG1655 유래의 MdfA, 서열번호: 06의 대장균 K12 MG1655 유래의 IceT, 서열번호: 04의 대장균 K12 MG1655 유래의 YnfM, 서열번호: 08의 대장균 K12 MG1655 유래의 Yhhs, 서열번호: 10의 대장균 K12 MG1655 유래의 EmrD, 서열번호: 12의 대장균 K12 MG1655 유래의 YdhC, 서열번호: 14의 대장균 K12 MG1655 유래의 YbdA, 서열번호: 16의 대장균 K12 MG1655 유래의 YdeE, 서열번호: 18의 대장균 K12 MG1655 유래의 MhpT, 서열번호: 20의 대장균 K12 MG1655 유래의 YebQ, 서열번호: 22의 대장균 K12 MG1655 유래의 YjhB, 서열번호: 24의 대장균 K12 MG1655 유래의 Bcr, 서열번호: 26의 대장균 K12 MG1655 유래의 FucP, 서열번호: 32의 대장균 K12 MG1655 유래의 WzxE, 서열번호: 38의 대장균 K12 MG1655 유래의 EmrE, 서열번호: 40의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2331, 서열번호: 42의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2332, 서열번호: 46의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0247, 서열번호: 48의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0245, 서열번호: 50의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0345, 서열번호: 52의 뉴로스포라 크라사 OR74A 유래의 CDT2, 서열번호: 54의 아스페르길루스 오리제 RIB40 유래의 CDT2, 서열번호: 58의 키티노파가 종 CF118 유래의 Wzx, 서열번호: 60의 유박테리움 종 CAG:581 유래의 Wzx, 서열번호: 62의 디아도박터 솔리 (DSM 25329) 유래의 Wzx, 서열번호: 64의 락토코커스 라피노락티스 (ATCC 43920) 유래의 Wzx, 서열번호: 66의 프레보텔라 루미니콜라 (AR32) 유래의 Wzx, 서열번호: 86의 브라키스피라 함프소니이 P280/1 유래의 NAPO, 서열번호: 98의 악티노바쿨룸 수이스 (DSM 20639) 유래의 NAm, 서열번호: 100의 루미노코커스 그나부스 유래의 NAm, 서열번호: 102의 쿠르토박테리움 종 314Chir4.1 유래의 NAm, 서열번호: 104의 니아벨라 드릴라시스 (DSM25811) 유래의 Nap, 서열번호: 106의 사카리크리니스 퍼멘탄스 (DSM 9555) 유래의 Nap, 서열번호: 108의 시트로박터 프레운디이 MGH152 유래의 mdtD, 서열번호: 110의 시트로박터 웨르크마니이 NBRC 105721 유래의 mdtD, 서열번호: 112의 시트로박터 아말로나티쿠스 유래의 mdtD, 서열번호: 114의 클레브시엘라 옥시토카 유래의 mdtD, 서열번호: 116의 에스케리치아 알베르티이 B156 유래의 mdtD, 서열번호: 118의 살모넬라 엔테리카 아종 살라메 유래의 yegB, 서열번호: 120의 클레브시엘라 뉴모니에 30684/NJST258_2 유래의 mdtD, 서열번호: 122의 클레브시엘라 뉴모니에 유래의 Tcr_1_D38215, 서열번호: 124의 슈도시트로박터 페칼리스 유래의 mdtD, 서열번호: 126의 요케넬라 레겐스버게이 (ATCC43003) 유래의 Cmr, 서열번호: 128의 크로노박터 무이트젠시이 유래의 MdfA, 서열번호: 130의 클레브시엘라 옥시토카 유래의 MdfA, 서열번호: 132의 시트로박터 코세리 유래의 MFS, 서열번호: 134의 에스케리치아 마르모테 유래의 MdfA, 서열번호: 136의 시겔라 플렉스네리 유래의 Cmr, 서열번호: 138의 살모넬라 엔테리카 아종 살라메 유래의 MdfA, 서열번호: 140의 시트로박터 윤게 (ATCC 29220) 유래의 Cmr, 서열번호: 142의 시트로박터 프레운디이 유래의 MdfA, 서열번호: 144의 엔테로박터 코베이 유래의 MdfA, 서열번호: 146의 엔테로박터 종 유래의 MdfA, 서열번호: 148의 렐리오티아 종 WB101 유래의 MdfA, 서열번호: 150의 엔테로박터 루드위기이 EcWSU1 유래의 MdfA, 서열번호: 152의 악티노플라네스 우타헨시스 유래의 Sweet-유사 단백질, 서열번호: 154의 키티노파가세에 박테리움 PMG_246 유래의 Sweet-유사 단백질, 서열번호: 156의 리조비움 종 PDC82 유래의 Sweet-유사 단백질, 서열번호: 158의 키네오코커스 리조스파에레 (DSM 19711) 유래의 Sweet-유사 단백질, 서열번호: 160의 모르가넬라 모르가니이 IS15 유래의 Sweet-유사 단백질, 서열번호: 162의 게오데르마토필루스 오브스쿠러스 (균주 ATCC 25078) 유래의 Sweet-유사 단백질, 서열번호: 164의 브라디리조비움 종 BTAi1 유래의 Sweet-유사 단백질, 서열번호: 166의 브라디리조비움 자포니쿰 USDA 110 유래의 Sweet-유사 단백질, 서열번호: 168의 크산토모나스 캄페스트리스 pv. 베시카토리아 균주 85-10 유래의 Sweet-유사 단백질, 서열번호: 170의 헤르바스피릴룸 아쿠아티쿰 유래의 Sweet-유사 단백질, 서열번호: 172의 플라보박테리아 박테리움 MS024-2A 유래의 Sweet-유사 단백질, 서열번호: 182의 시노리조비움 메디케 WSM419 유래의 rnd-유사 단백질, 서열번호: 184의 아조스피릴룸 브라실리엔세 LMG 04375 유래의 아라비노스 유출물, 또는 상기 포터 막 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 02, 06, 04, 08, 10, 12, 14, 16, 18, 20, 22, 24, 26, 32, 38, 40, 42, 46, 48, 50, 52, 54, 58, 60, 62, 64, 66, 86, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164, 166, 168, 170, 172, 182 또는 184 각각의 상기 MdfA, IceT, YnfM, Yhhs, EmrD, YdhC, YbdA, YdeE, MhpT, YebQ, YjhB, Bcr, FucP, WzxE, EmrE, Wzx, Blon_2331, Blon_2232, Blon_0247, Blon_0245, Blon_0345, NAPO, NAm, Nap, mdtD, YegB, Tcr_1_D38215, cmr, MFS, CDT2, rnd, Sweet-유사 또는 아라비노스 유출물 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질; ii) P-P-결합-가수분해-유도 수송체인 서열번호: 28의 락토코커스 락티스 균주 SRCM103457 유래의 LmrA, 서열번호: 30의 대장균 균주 K12 MG1655 유래의 OppF, 서열번호: 36의 헬리코박터 필로리 (균주 ATCC 700392 / 26695) 유래의 Wzk, 서열번호: 44의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2475, 서열번호: 68 또는 72의 플라보박테리움 스파르탄시이 유래의 LpsE, 서열번호: 70 또는 74의 스포로무사 스파에로이데스 DSM 2875 유래의 LpsE, 서열번호: 76의 칸디다투스 플란크토필라 설포니카 유래의 TolC, 서열번호: 78의 부티리비브리오 훈가테이 XBD2006 유래의 TolC, 서열번호: 80의 로세부리아 인테스티날리스 CAG:13 유래의 MsbA, 서열번호: 82의 페도박터 긴센기솔리 유래의 MsbA, 서열번호: 84의 베루코미크로비아 박테리움 CG1_02_43_26 유래의 MsbA, 서열번호: 174의 리조비움 종 Root149 유래의 Wzm, 서열번호: 176의 아조스피릴룸 브라실리엔세 LMG 04375 유래의 Wzm, 서열번호: 196의 대장균 113303 유래의 Wzm, 서열번호: 178의 리조비움 종 Root149 유래의 Wzt, 서열번호: 180의 아조스피릴룸 브라실리엔세 LMG 04375 유래의 Wzt, 서열번호: 194의 대장균 113303 유래의 Wzt, 서열번호: 186 또는 188의 브라디리조비움 자포니쿰 USDA 110 유래의 Nodj, 서열번호: 206의 대장균 K-12 MG1655 유래의 malE, 서열번호: 208의 대장균 K-12 MG1655 유래의 malK, 서열번호: 214의 대장균 K-12 MG1655 유래의 araF, 서열번호: 216의 대장균 K-12 MG1655 유래의 xylF, 또는 서열번호: 218의 대장균 K-12 MG1655 유래의 ytfQ, 또는 상기 P-P-결합-가수분해-유도 수송체 막 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 28, 30, 36, 44, 68, 72, 70, 74, 76, 78, 80, 82, 84, 174, 176, 196, 178, 180, 194, 188, 190, 206, 208, 214, 216 또는 218 각각의 상기 LmrA, OppF, Wzk, Blon_2475, LpsE, TolC, MsbA, Wzm, Wzt, Nodj, malE, malK, araF, xylF 또는 ytfQ 막 단백질들에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질; iii) 추정 수송 단백질인 서열번호: 56의 헬리코박터 필로리 유래의 사이토크롬 C 생합성 단백질, 서열번호: 90의 클로스트리디움 종 CAG: 1013 유래의 CutC, 서열번호: 92의 오도리박터 스플란크니쿠스 DSM 20712 유래의 CutC, 서열번호: 94의 미추아리아 종 PDC51 유래의 CutC, 서열번호: 96의 프레보텔라 인테르메디아 ATCC 25611 (DSM 20706) 유래의 CutC, 서열번호: 190의 대장균 K12 MG1655 유래의 ybjM, 서열번호: 192의 엔테로박테리아세에 박테리움 ENNIH1 유래의 ybjM, 또는 상기 추정 수송 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 56, 90, 92, 94, 96, 190 또는 192 각각의 상기 CytC, CutC 또는 ybjM 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질; iv) β-배럴 포린인 서열번호: 34의 대장균 K12 MG1655 유래의 Wza 또는 서열번호: 204의 대장균 K12 MG1655 유래의 lamB, 또는 이의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 34 또는 204 각각의 상기 Wza 또는 lamB 막 단백질에 대해 적어도 80%의 서열 동일성을 갖는 서열; v) 보조 수송 단백질인 서열번호: 88의 서모토가 마리티마 (균주 ATCC 43589 / MSB8 / DSM 3109 / JCM 10099) 유래의 Wzc, 또는 이의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 88의 상기 Wzc 막 단백질에 대해 적어도 80%의 서열 동일성을 갖는 서열; vi) 포스포트란스퍼-유도 그룹 전위인자인 서열번호: 210의 대장균 K12 MG1655 유래의 nagE 또는 서열번호: 212의 대장균 K12 MG1655 유래의 srlB, 또는 이의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 210 또는 212 각각의 상기 nagE 또는 srlB 막 단백질에 대해 적어도 80%의 서열 동일성을 갖는 서열.
본 발명의 추가 양상에서, 본원에 기재된 세포는 세포벽의 외막을 가로질러 화합물의 수송에 관여하는 수송체 단백질인 막 단백질을 발현한다.
다른 양상은 배지에서 안정적으로 배양되는 세포를 제공하며, 상기 배지는 최소 배지, 복합 배지, 또는 예를 들어 이에 한정되는 것은 아니지만 비타민, 미량 원소, 아미노산과 같은 소정의 화합물이 풍부한 성장 배지를 포함하는 임의의 타입의 성장 배지일 수 있다.
바람직하게는, 상기 세포는 락토스 수송체, 푸코스 수송체, 뉴클레오티드-활성화된 당에 대한 수송체로 구성된 그룹으로부터 선택된 단백질을 코딩하는 핵산 서열을 적어도 1개 포함하도록 형질전환된다.
본원에 기재된 방법에서, 상기 세포는 임의의 유기체의 세포일 수 있다. 본원에서 사용된 용어 '유기체' 또는 '세포'는 박테리아, 효모 또는 진균으로 구성된 목록으로부터 선택된 미생물을 지칭하거나, 또는 식물 세포, 동물 세포, 포유동물 세포, 곤충 세포 및 원생동물 세포를 지칭한다. 후자의 박테리아는 바람직하게는 프로테오박테리아 (Proteobacteria) 문 또는 피르미쿠테스 (Firmicutes) 문 또는 시아노박테리아 (Cyanobacteria) 문 또는 데이노코커스-서무스 (Deinococcus-Thermus) 문에 속한다. 프로테오박테리아 문에 속하는 후자의 박테리아는 엔테로박테리아세에 (Enterobacteriaceae) 과, 바람직하게는 대장균 종에 속한다. 상기 후자 박테리아는 바람직하게는 대장균 종 예컨대 이에 한정되는 것은 아니지만 대장균 B, 대장균 C, 대장균 W, 대장균 K12, 대장균 니슬 (Escherichia coli Nissle)에 속하는 임의의 균주에 관한 것이다. 더 구체적으로, 후자의 용어는 실험실 환경에 잘 적응하고, 야생형 균주와 달리 장에서 번성하는 능력을 상실한 배양된 대장균 균주, 예컨대 대장균 K12 균주에 관한 것이다. 대장균 K12 균주의 잘 알려진 예로는 K12 야생형, W3110, MG1655, M182, MC1000, MC1060, MC1061, MC4100, JM101, NZN111 및 AA200이다. 그러므로, 바람직하게는 본 발명은 구체적으로 상기에 나타낸 돌연변이 및/또는 형질전환된 대장균 균주에 관한 것으로서, 상기 대장균 균주가 K12 균주이다. 더 구체적으로, 본 발명은 상기에 나타낸 돌연변이 및/또는 형질전환된 대장균 균주에 관한 것으로서, 상기 K12 균주는 대장균 MG1655이다. 피르미쿠테스 문에 속하는 후자의 박테리아는 바실리 (Bacilli), 바람직하게는 바실러스 (Bacillus) 종에 속한다. 후자 효모는 바람직하게는 아스코마이코타 (Ascomycota) 문 또는 바시디오마이코타 (Basidiomycota) 문 또는 듀테로마이코타 (Deuteromycota) 문 또는 지고마이세테스 (Zygomycetes) 문에 속한다. 후자 효모는 바람직하게는 사카로마이세스 (Saccharomyces), 피치아 (Pichia), 한수넬라 (Hansunella), 클루이베로마이세스 (Kluyveromyces), 야로위아 (Yarrowia), 에레모테시움 (Eremothecium), 지고사카로마이세스 (Zygosaccharomyces) 또는 데바로마이세스 (Debaromyces) 속에 속한다. 후자 진균은 바람직하게는 리조푸스 (Rhizopus), 딕티오스텔리움 (Dictyostelium) 또는 아스페르길루스 (Aspergillus) 속에 속한다. "식물 세포"는 개화 (flowering) 및 비-개화 (non-flowering) 식물의 세포, 뿐만 아니라 조류 세포, 예를 들어 클라미도모나스 (Chlamydomonas), 클로렐라 등을 포함한다. 바람직하게는, 상기 식물 세포는 담배, 알팔파, 벼, 토마토, 옥수수 (corn), 옥수수 (maize) 또는 대두 세포이고; 상기 포유동물 세포는 CHO 세포 또는 HEK 세포이며; 상기 곤충 세포는 S. 프루기페르다 (S. frugiperda) 세포 및 상기 원생동물 세포는 L. 타렌톨레 (L. tarentolae) 세포이다.
바람직한 일 구체예에서, 상기 세포는 미생물의 세포이고, 더 바람직하게는 상기 미생물은 박테리아 또는 효모이다. 더 바람직한 일 구체예에서, 상기 미생물은 박테리아, 가장 바람직하게는 대장균이다. 이러한 대장균을 사용하는 예가 본원에 기재되어 있다.
다른 더 바람직한 구체예에서, 상기 박테리아는 효모이다. 푸코실락토스 생성을 위한 효모 및 본 발명에 사용할 수 있는 예는 예를 들어 Hollands et al. (Metabolic Engineering 52 (2019) 232-242)에 기재되어 있다.
일반적으로, 선택된 모노사카라이드, 디사카라이드 또는 올리고사카라이드에 대한 세포의 이화 경로 (catabolic pathway)는 푸코실락토스 합성에 관여하고/하거나 이의 합성에 필요한 적어도 부분적으로 불활성화된, 모노사카라이드, 디사카라이드 또는 올리고사카라이드인 것이 바람직하다.
추가 일 구체예에서, 본 발명은 푸코실락토스를 제조하는 방법을 제공하며, 상기 푸코실락토스의 생성을 허용하는 조건 하에 배지에서 배양하기 위해, 본원에 기재된 세포가 사용된다. 그 다음에, 상기 푸코실락토스는 배양으로부터 분리된다. 본원에서 사용되는, 생성에 허용되는 조건은 온도, pH, 압력, 삼투압 및 생성물/유리체 농도를 포함하지만 이에 한정되지 않는, 살아있는 세포 및 이의 성장을 가능하게 하는 물리적 또는 화학적 파라미터와 관련된 조건인 것으로 이해되어야 한다. 바람직하게는, 이러한 허용 조건은 30+/-20℃ 범위의 온도, 7+/-3 범위의 pH를 포함할 수 있다.
본 발명에 따른 세포는 푸코실락토스를 생성한다. 상기 푸코실락토스는 2'-푸코실락토스, 3-푸코실락토스 및 디푸코실락토스로 구성된 그룹으로부터 선택된다.
본 발명의 다른 양상은 푸코실락토스의 발효 생성에서 본원에 정의된 막 단백질들의 그룹으로부터 선택된 막 단백질의 용도를 제공한다. 상기 푸코실락토스는 2'-푸코실락토스, 3-푸코실락토스 및 디푸코실락토스로 구성된 그룹으로부터 선택된다.
추가 일 양상에서, 본 발명은 푸코실락토스의 제조 방법에서, 본원에 정의된 세포의 용도를 제공한다.
또 다른 양상에서, 본 발명은 상기 푸코실락토스가 2'-푸코실락토스, 3-푸코실락토스 및/또는 디푸코실락토스인, 본원에 정의된 세포의 용도를 제공한다.
또한, 본 발명은 또한 본 발명에 따른 방법에 의해 수득된 푸코실락토스, 뿐만 아니라 푸코실락토스의 제조를 위한 상기 기재된 폴리뉴클레오티드, 벡터, 숙주 세포, 미생물 또는 폴리펩티드의 용도에 관한 것이다. 상기 푸코실락토스는 유아식, 성인용 식품 또는 사료의 보충을 위한 식품 첨가제, 프리바이오틱 (prebiotic), 심바이오틱 (symbiotic)으로서, 또는 치료학적으로 또는 약학적으로 활성인 화합물로서 사용될 수 있다. 상기 새로운 방법을 사용하면, 복잡하고 시간과 비용이 많이 드는 합성 과정 없이, 푸코실락토스를 쉽고 효과적으로 제공할 수 있다.
본원에서 사용된 용어 "분리"는 본원에 설명된 바와 같이 숙주 세포 및/또는 이의 성장 배지로부터 푸코실락토스를 수확, 수집 또는 회수하는 것을 의미한다.
푸코실락토스는 혼합물이 만들어진, 배양 또는 수성 배양 배지로부터 통상적인 방식으로 분리될 수 있다. 상기 푸코실락토스가 푸코실락토스를 생성하는 세포에 여전히 존재하는 경우, 상기 세포로부터 푸코실락토스를 유리 또는 추출하는 통상적인 방법으로, 예컨대 높은 pH, 열 충격, 초음파 처리, 프렌치 프레스 (French press), 균질화, 효소적 가수분해, 화학적 가수분해, 용매 가수분해, 세제, 가수분해 등을 사용한 세포 파괴를 사용할 수 있다. 그 다음에 푸코실락토스 함유 혼합물 또는 배양물로 함께 및 개별적으로 불리는 배양 배지, 반응 혼합물 및/또는 세포 추출물이 푸코실락토스를 분리하는데 추가로 사용될 수 있다.
전형적으로 올리고사카라이드, 및 올리고사카라이드인 푸코실락토스는 먼저 거대 성분들, 즉 세포 및 세포 데브리스를 제거한 다음에 더 작은 성분들, 즉 단백질, 내독소 및 1000 Da 내지 1000 kDa의 기타 성분들을 제거한 다음에, 올리고사카라이드를 제1 단계에서 나노여과막 또는 전기투석으로, 및 제2 단계에서 이온 교환 크로마토그래피로도 알려진 이온 교환으로 유지함으로써 올리고사카라이드를 탈염하고, 이는 양이온 교환 수지 및 음이온 교환 수지로 구성되며, 여기서 가장 바람직하게는 양이온 교환 크로마토그래피는 음이온 교환 크로마토그래피 전에 수행된다. 이러한 단계는 중합도의 작은 차이로 당을 서로 분리하지 못한다. 상기 분리는 예를 들어 크로마토그래피 분리에 의해 수행된다.
이는 바람직하게는 푸코실락토스 함유 혼합물을 정화하여 현탁 입자 및 오염물, 특히 유전자 변형 세포를 배양하고 및/또는 효소 반응을 수행함으로써 생성된 세포, 세포 성분, 불용성 대사산물 및 데브리스를 제거하는 단계를 포함한다. 이러한 단계에서, 상기 푸코실락토스 함유 혼합물은 통상적인 방식으로 정화될 수 있다. 바람직하게는, 상기 푸코실락토스 함유 혼합물은 원심 분리, 응집, 경사 분리 및/또는 여과에 의해 정화된다. 상기 푸코실락토스 함유 혼합물로부터 푸코실락토스을 분리하는 제2 단계는 바람직하게는 정화되어진 후에, 실질적으로 모든 단백질뿐만 아니라 펩티드, 아미노산, RNA 및 DNA 및 후속 분리 단계를 방해할 수 있는 임의의 내독소 및 당지질을 상기 푸코실락토스 함유 혼합물로부터 제거하는 단계를 포함한다. 이러한 단계에서, 단백질 및 관련 불순물은 통상적인 방식으로 푸코실락토스 함유 혼합물로부터 제거될 수 있다. 바람직하게는, 단백질, 염, 부산물, 착색제 및 다른 관련 불순물이 한외여과, 나노여과, 역삼투, 미세여과, 활성탄 또는 탄소 처리, 고성능 접선 흐름 여과 (tangential flow high-performance filtration), 접선 흐름 한외여과 (tangential flow ultrafiltration), 친화도 크로마토그래피, 이온 교환 크로마토그래피 (예: 양이온 교환, 음이온 교환, 혼합층 이온 교환을 포함하지만, 이에 한정되지 않음), 소수성 상호작용 크로마토그래피 및/또는 겔 여과 (즉, 크기 배제 크로마토그래피), 특히 크로마토그래피, 더 구체적으로 이온 교환 크로마토그래피 또는 소수성 상호작용 크로마토그래피 또는 리간드 교환 크로마토그래피에 의해 푸코실락토스 함유 혼합물로부터 제거된다. 크기 배제 크로마토그래피를 제외하고, 단백질 및 관련 불순물은 크로마토그래피 매질 또는 선택된 멤브레인에 의해 유지되는 반면, 푸코실락토스는 푸코실락토스 함유 혼합물 중에 남아 있다.
분자량이 1000 Da (dalton) 이상인 오염 화합물은 컷-오프 (cut-off)가 1000 Da 이상 내지 약 1000 kDa인 한외여과막을 통해 제거된다. 상기 멤브레인에는 오염 물질이 유지되고, 올리고사카라이드는 여과액으로 이동한다. 전형적인 한외여과 원리는 당해 분야에 잘 알려져 있고, 관형 모듈 (Tubular modules), 중공 파이버 (Hollow fiber), 나선형으로 감긴 플레이트 또는 플레이트에 기반하며; 이들은 횡류 조건 (cross flow conditions)에서 또는 전량 여과 (dead-end filtration)에서 사용된다. 상기 멤브레인 조성은 잘 알려져 있고, 여러 공급업체로부터 입수 가능하고, PES (Polyethylene sulfone), 폴리비닐피롤리돈, PAN (Polyacrylonitrile), PA (Poly-amide), 폴리비닐리덴 디플루오라이드 (PVDF), NC (Nitrocellulose), 세라믹 재료 또는 이들의 조합으로 이루어진다.
올리고사카라이드보다 작은 성분, 예를 들어 모노사카라이드, 염, 디사카라이드, 산, 염기, 매질 성분은 나노여과 또는/및 전기투석을 통해 분리된다. 이러한 멤브레인은 100 Da 내지 1000 Da 사이의 분자량 컷오프를 갖는다. 올리고사카라이드 예컨대 2'-푸코실락토스의 경우, 최적의 컷오프는 300 Da 내지 500 Da이며, 여과액의 손실을 최소화한다. 전형적인 멤브레인 조성은 잘 알려져 있으며, 예를 들어 폴리아미드 (PA), TFC, PA-TFC, 폴리피페라진-아미드, PES, 셀룰로스 아세테이트 또는 이들의 조합이다.
푸코실락토스는 증발, 동결건조, 결정화, 침전 및/또는 건조, 분무 건조에 의한 추가 정제 단계를 포함하거나 또는 포함하지 않고, 배양 배지 및/또는 세포로부터 추가로 단리된다. 상기 추가 정제 단계는 다른 올리고사카라이드 및/또는 생성물과 조합된 푸코실락토스의 제제화를 가능하게 하지만, 예를 들어 분무-건조, 건조 또는 동결건조에 의한 공동-제제화 또는 액체 형태의 증발에 의한 농축에 제한되지 않는다.
추가의 양상에서, 본 발명은 또한 푸코실락토스의 추가 정제를 제공한다. 상기 푸코실락토스의 추가 정제는 예를 들어 (활성화된) 챠콜 또는 탄소, 나노여과, 한외여과 또는 이온교환을 사용하여 임의의 남아있는 DNA, 단백질, LPS, 내독소 또는 다른 불순물을 제거함으로써 수행될 수 있다. 에탄올과 같은 알코올 및 수성 알코올 혼합물이 또한 사용될 수 있다. 다른 정제 단계는 생성물의 결정화 또는 침전에 의해 수행된다. 다른 정제 단계는 푸코실락토스를 분무 건조 또는 동결 건조하는 것이다.
분리되고 바람직하게는 또한 정제된 푸코실락토스는 유아용 조제 분유의 보충제로서 사용될 수 있고, 신생아의 다양한 질병 치료에 사용될 수 있다.
본원의 실시예에서 개시되는 바와 같이, 본 발명의 방법 및 세포는 본원에 정의된 막 단백질을 사용하는 경우에, 동일한 유전자 배경을 갖지만 이종 막 단백질의 발현 또는 내인성 막 단백질의 조절된 발현이 결여된 푸코실락토스 생산 숙주와 비교하여, 하기와 같은 놀라운 이점들 중 적어도 하나를 제공한다:
- 더 우수한 푸코실락토스 역가 (향상) (g/L),
- 더 우수한 생성율 r (g 푸코실락토스/L/h),
- 더 우수한 세포 성능 지수 CPI (g 푸코실락토스/g X),
- 더 우수한 비생산성 Qp (g 푸코실락토스 /g X /h),
- 수크로스에 대한 더 우수한 수율 Ys (g 푸코실락토스/g 수크로스),
- 더 우수한 수크로스 흡수율/전환율 Qs (g 수크로스/g X/h),
- 더 우수한 락토스 전환율/소비율 rs (g 락토스/h),
- 푸코실락토스 분비 향상, 및/또는
- 생산 숙주의 성장 속도 향상.
또한, 본 발명은 하기 특정 구체예에 관한 것이다:
1. 유전자 변형 세포에 의해 푸코실락토스를 제조하는 방법으로서,
- 푸코실락토스를 생성할 수 있는 세포를 제공하는 단계로서, 상기 세포는 푸코실락토스 합성에 관여하는 효소를 코딩하는 핵산 서열을 적어도 1개 포함하고,
- 상기 세포는 i) 내인성 막 단백질의 변형된 발현 및/또는 ii) 이종 막 단백질의 발현을 추가로 포함하고, 상기 막 단백질은 interpro 번호 IPR001503 및 IPR002516을 각각 사용하여 GT10 및 GT11 푸코실트란스퍼라제 패밀리의 게놈 인근을 검색하여 발견된 PFAM 도메인들 중 어느 하나의 도메인을 포함하는 막 단백질들의 그룹으로부터 선택되고, 여기서 상기 게놈 인근 윈도우 크기는 각 푸코실트란스퍼라제 앞에 14개의 유전자 및 뒤에 14개의 유전자이고, 상기 막 단백질은 SET 패밀리에 속하지 않는 것인 단계,
- 상기 세포를 배지에서 원하는 푸코실락토스의 생성을 허용하는 조건 하에 배양하는 단계
- 바람직하게는 상기 푸코실락토스를 상기 배양으로부터 분리하는 단계를 포함하는 푸코실락토스를 제조하는 방법.
2. 구체예 1에 있어서, 상기 막 단백질은
a) 포터;
b) P-P-결합-가수분해-유도 수송체;
c) β-배럴 포린;
d) 보조 수송 단백질; 및
e) 추정 수송 단백질의 그룹으로부터 선택되는 것인 방법.
3. 유전자 변형 세포에 의해 푸코실락토스를 제조하는 방법으로서,
- 푸코실락토스를 생성할 수 있는 세포를 제공하는 단계로서, 상기 세포는 푸코실락토스 합성에 관여하는 효소를 코딩하는 핵산 서열을 적어도 1개 포함하고,
- 상기 세포는 i) 내인성 막 단백질의 변형된 발현 및/또는 ii) 이종 막 단백질의 발현을 추가로 포함하고, 상기 막 단백질은
a) 포터, 여기서 상기 막 단백질은 SET 패밀리에 속하는 않음;
b) P-P-결합-가수분해-유도 수송체;
c) β-배럴 포린;
d) 보조 수송 단백질; 및
e) 추정 수송 단백질의 그룹으로부터 선택되는 것인 단계,
- 상기 세포를 배지에서 원하는 푸코실락토스의 생성을 허용하는 조건 하에 배양하는 단계
- 바람직하게는 상기 푸코실락토스를 상기 배양으로부터 분리하는 단계를 포함하는 푸코실락토스를 제조하는 방법.
4. 구체예 2 또는 3에 있어서, 상기 포터는 TCDB 클래스 2.A.1.1, 2.A.1.12, 2.A.1.15, 2.A.1.2, 2.A.1.3, 2.A.1.36, 2.A.1.38, 2.A.1.46, 2.A.1.68, 2.A.1.7, 2.A.1.81, 2.A.123, 2.A.2, 2.A.21, 2.A.58, 2.A.6.3, 2.A.66 및 2.A.7.1의 그룹으로부터 선택되는 것인 방법.
5. 구체예 2 또는 3에 있어서, 상기 P-P-결합-가수분해-유도 수송체는 TCDB 클래스 3.A.1.1, 3.A.1.10, 3.A.1.11 및 3.A.1.5의 그룹으로부터 선택되는 것인 방법.
6. 구체예 2 또는 3에 있어서, 상기 β-배럴 포린은 TCDB 클래스 1.B.18로부터 선택되는 것인 방법.
7. 구체예 2 또는 3에 있어서, 상기 보조 수송 단백질은 TCDB 클래스 8.A.3으로부터 선택되는 것인 방법.
8. 구체예 2 또는 3에 있어서, 상기 추정 수송 단백질은 TCDB 클래스 9.B.14 및 9.B.158의 그룹으로부터 선택되는 것인 방법.
9. 구체예 2 또는 3에 있어서, 상기 포터는 eggnog 패밀리 05BZS, 05C0R, 05C2C, 05CT4, 05CXP, 05CZQ, 05D94, 05DXI, 05E5M, 05E5W, 05E8G, 05EAM, 05EDR, 05EGZ, 05F9N, 05JHE, 05PSV, 05W2Y, 05W3H, 05XJ5, 070Q9, 07CWC, 07QF7, 07QNK, 07RBJ, 07RJ1, 07T5E, 07VQ3, 0814C, 088QT, 08H15, 08N8A, 08SC4, 08Z4Q의 그룹으로부터 선택되는 것인 방법.
10. 구체예 2 또는 3에 있어서, 상기 P-P-결합-가수분해-유도 수송체는 eggnog 패밀리 05BZ1, 05CJ1, 05EY8, 05HAC, 05MFV, 07V1T, 08IJ9, 08JQ7의 그룹으로부터 선택되는 것인 방법.
11. 구체예 2 또는 3에 있어서, 상기 β-배럴 포린은 eggnog 패밀리 05DAY의 그룹으로부터 선택되는 것인 방법.
12. 구체예 2 또는 3에 있어서, 상기 보조 수송 단백질은 eggnog 패밀리 07SYR의 그룹으로부터 선택되는 것인 방법.
13. 구체예 2 또는 3에 있어서, 상기 추정 수송 단백질은 eggnog 패밀리 05CRE, 05GWF, 06N3A의 그룹으로부터 선택되는 것인 방법.
14. 구체예 2 또는 3에 있어서, 상기 포터는 PFAM 목록 PF00083, PF00474, PF00873, PF00893, PF01895, PF01943, PF02690, PF03083, PF04193, PF05977, PF07690, PF07690, PF13347, PF13440 및 PF14667로부터 선택되는 것인 방법.
15. 구체예 2 또는 3에 있어서, 상기 P-P-결합-가수분해-유도 수송체는 PFAM 목록 PF00005, PF00664, PF01061, PF08352, PF14524 및 PF17912로부터 선택되는 것인 방법.
16. 구체예 2 또는 3에 있어서, 상기 β-배럴 포린은 PFAM 목록 PF02563, PF10531 및 PF18412로부터 선택되는 것인 방법.
17. 구체예 2 또는 3에 있어서, 상기 보조 수송 단백질은 PFAM 목록 PF13807 및 PF02706으로부터 선택되는 것인 방법.
18. 구체예 2 또는 3에 있어서, 상기 추정 수송 단백질은 PFAM 목록 PF01578, PF03932, PF05140 및 PF11045로부터 선택되는 것인 방법.
19. 구체예 2 또는 3에 있어서, 상기 포터는 interpro 목록 IPR000390, IPR001036, IPR001411, IPR001734, IPR001927, IPR002797, IPR003663, IPR003841, IPR004316, IPR004633, IPR004638, IPR004734, IPR004812, IPR005275, IPR005828, IPR005829, IPR006603, IPR010290, IPR011701, IPR020846, IPR023008, IPR023721, IPR023722, IPR026022, IPR027417, IPR027463, IPR029303, IPR032896, IPR036259, IPR038078, IPR038377, IPR039672로부터 선택되는 것인 방법.
20. 구체예 2 또는 3에 있어서, 상기 P-P-결합-가수분해-유도 수송체는 interpro 목록 IPR000412, IPR001734, IPR003439, IPR003593, IPR005829, IPR005978, IPR005981, IPR008995, IPR011527, IPR011701, IPR013525, IPR013563, IPR015851, IPR017871, IPR019554, IPR020846, IPR027417, IPR029439, IPR036259, IPR036640, IPR038377, IPR039421 및 IPR040582로부터 선택되는 것인 방법.
21. 구체예 2 또는 3에 있어서, 상기 β-배럴 포린은 interpro 목록 IPR003715, IPR019554 및 IPR040716으로부터 선택되는 것인 방법.
22. 구체예 2에 있어서, 상기 보조 수송 단백질는 interpro 목록 IPR003856, IPR020846, IPR027417, IPR032807 및 IPR036259로부터 선택되는 것인 방법.
23. 구체예 2 또는 3에 있어서, 상기 추정 수송 단백질은 interpro 목록 IPR002541, IPR003439, IPR003593, IPR004316, IPR005627, IPR006603, IPR007816, IPR017871, IPR020368, IPR020846, IPR023648, IPR027417, IPR036259 및 IPR036822로부터 선택되는 것인 방법.
24. 구체예 2 또는 3에 있어서, 상기 포터 막 단백질은 대장균 K12 MG1655 유래의 MdfA, 대장균 K12 MG1655 유래의 IceT, B. 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2331, B. 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2332, 키티노파가 CF118, 프레보텔라 루미니콜라 (AR32), 락토코커스 라피노락티스 (ATCC 43920), 또는 디아도박터 솔리 DSM 25329의 wzx-유사 단백질, 또는 상기 포터 막 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 상기 MdfA, IceT, Blon_2331, Blon_2332 막 단백질들 또는 wzx-유사 막 단백질 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 서열로부터 선택되는 것인 방법.
25. 구체예 2 또는 3에 있어서, 상기 P-P-결합-가수분해 유도 수송체 막 단백질은 락토코커스 락티스 아종 락티스 bv. 디아세틸락티스 (Lactococcus lactis subsp. lactis bv. Diacetylactis) 유래의 lmrA, 스포로무사 스파에로이데스 DSM 2875, 플라보박테리움 스파르탄시이 유래의 LpsE 막 단백질, 칸디다투스 플란크토필라 설포니카 유래의 TolC, 페도박터 긴센기솔리 또는 베루코미크로비아 박테리움 CG1_02_43_26 유래의 MsbA, 또는 상기 P-P-결합-가수분해 유도 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 상기 lmrA, LpsE, TolC 또는 MsbA 막 단백질 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 서열로부터 선택되는 것인 방법.
26. 구체예 2 또는 3에 있어서, 상기 β-배럴 포린은 대장균 K12 MG1655 유래의 Wza, 또는 이의 기능성 상동체 또는 기능성 단편, 또는 상기 Wza 막 단백질에 대해 적어도 80%의 서열 동일성을 갖는 서열로부터 선택되는 것인 방법.
27. 구체예 2 또는 3에 있어서, 상기 보조 수송 단백질은 서모토가 마리티마 (균주 ATCC 43589 / MSB8 / DSM 3109 / JCM 10099) 유래의 Wzc, 또는 이의 기능성 상동체 또는 기능성 단편, 또는 상기 Wzc 막 단백질에 대해 적어도 80%의 서열 동일성을 갖는 서열로부터 선택되는 것인 방법.
28. 구체예 2 또는 3에 있어서, 상기 추정 수송 단백질은 클로스트리디움 종 CAG: 1013, 오도리박터 스플란크니쿠스 DSM 20712, 미추아리아 종 PDC51 또는 프레보텔라 인테르메디아 ATCC 25611 (DSM 20706) 유래의 CutC, 또는 상기 CutC 막 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 상기 CutC 막 단백질 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 서열로부터 선택되는 것인 방법.
29. 구체예 2 또는 3에 있어서, 상기 포터 막 단백질은 대장균 K12 MG1655 유래의 MdfA, 대장균 K12 MG1655 유래의 IceT, 대장균 K12 MG1655 유래의 YnfM, 대장균 K12 MG1655 유래의 Yhhs, 대장균 K12 MG1655 유래의 EmrD, 대장균 K12 MG1655 유래의 YdhC, 대장균 K12 MG1655 유래의 YbdA, 대장균 K12 MG1655 유래의 YdeE, 대장균 K12 MG1655 유래의 MhpT, 대장균 K12 MG1655 유래의 YebQ, 대장균 K12 MG1655 유래의 YjhB, 대장균 K12 MG1655 유래의 Bcr, 대장균 K12 MG1655 유래의 FucP, 대장균 K12 MG1655 유래의 WzxE, 대장균 K12 MG1655 유래의 EmrE, 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2331, 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2332, 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0247, 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0245, 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0345, 뉴로스포라 크라사 OR74A 유래의 CDT2, 아스페르길루스 오리제 RIB40 유래의 CDT2, 키티노파가 종 CF118 유래의 Wzx, 유박테리움 종 CAG:581 유래의 Wzx, 디아도박터 솔리 (DSM 25329) 유래의 Wzx, 락토코커스 라피노락티스 (ATCC 43920) 유래의 Wzx, 프레보텔라 루미니콜라 (AR32) 유래의 Wzx, 브라키스피라 함프소니이 P280/1 유래의 NAPO, 악티노바쿨룸 수이스 (DSM 20639) 유래의 NAm, 루미노코커스 그나부스 유래의 NAm, 쿠르토박테리움 종 314Chir4.1 유래의 NAm, 플란크토마이세테스 박테리움 (Planctomycetes bacterium) GWF2_42_9 유래의 NAm, 니아벨라 드릴라시스 (DSM25811) 유래의 Nap, 사카리크리니스 퍼멘탄스 (DSM 9555) 유래의 Nap, 시트로박터 프레운디이 MGH152 유래의 mdtD, 시트로박터 웨르크마니이 NBRC 105721 유래의 mdtD, 시트로박터 아말로나티쿠스 유래의 mdtD, 클레브시엘라 옥시토카 유래의 mdtD, 에스케리치아 알베르티이 B156 유래의 mdtD, 살모넬라 엔테리카 아종 살라메 유래의 yegB, 클레브시엘라 뉴모니에 30684/NJST258_2 유래의 mdtD, 클레브시엘라 뉴모니에 유래의 Tcr_1_D38215, 슈도시트로박터 페칼리스 유래의 mdtD, 요케넬라 레겐스버게이 (ATCC43003) 유래의 Cmr, 크로노박터 무이트젠시이 유래의 MdfA, 클레브시엘라 옥시토카 유래의 MdfA, 시트로박터 코세리 유래의 MFS, 에스케리치아 마르모테 유래의 MdfA, 시겔라 플렉스네리 유래의 Cmr, 살모넬라 엔테리카 아종 살라메 유래의 MdfA, 시트로박터 윤게 (ATCC 29220) 유래의 Cmr, 시트로박터 프레운디이 유래의 MdfA, 엔테로박터 코베이 유래의 MdfA, 엔테로박터 종 유래의 MdfA, 렐리오티아 종 WB101 유래의 MdfA, 엔테로박터 루드위기이 EcWSU1 유래의 MdfA, 악티노플라네스 우타헨시스 유래의 Sweet-유사 단백질, 키티노파가세에 박테리움 PMG_246 유래의 Sweet-유사 단백질, 리조비움 종 PDC82 유래의 Sweet-유사 단백질, 키네오코커스 리조스파에레 (DSM 19711) 유래의 Sweet-유사 단백질, 모르가넬라 모르가니이 IS15 유래의 Sweet-유사 단백질, 게오데르마토필루스 오브스쿠러스 (균주 ATCC 25078) 유래의 Sweet-유사 단백질, 브라디리조비움 종 BTAi1 유래의 Sweet-유사 단백질, 브라디리조비움 자포니쿰 USDA 110 유래의 Sweet-유사 단백질, 크산토모나스 캄페스트리스 pv. 베시카토리아 균주 85-10 유래의 Sweet-유사 단백질, 헤르바스피릴룸 아쿠아티쿰 유래의 Sweet-유사 단백질, 플라보박테리아 박테리움 MS024-2A 유래의 Sweet-유사 단백질, 시노리조비움 메디케 WSM419 유래의 rnd-유사, 아조스피릴룸 브라실리엔세 LMG 04375 유래의 아라비노스 유출물, 또는 상기 포터 막 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 상기 MdfA, IceT, YnfM, Yhhs, EmrD, YdhC, YbdA, YdeE, MhpT, YebQ, YjhB, Bcr, FucP, WzxE, EmrE, Wzx, Blon_2331, Blon_2232, Blon_0247, Blon_0245, Blon_0345, NAPO, NAm, Nap, mdtD, YegB, Tcr_1_D38215, cmr, MFS, CDT2, rnd, Sweet-유사 또는 아라비노스 유출물 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질로부터 선택되는 것인 방법.
30. 구체예 2 또는 3에 있어서, 상기 P-P-결합-가수분해-유도 수송체는 락토코커스 락티스 균주 SRCM103457 유래의 LmrA, 대장균 균주 K12 MG1655 유래의 OppF, 헬리코박터 필로리 (균주 ATCC 700392 / 26695) 유래의 Wzk, 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2475, 플라보박테리움 스파르탄시이 유래의 LpsE, 스포로무사 스파에로이데스 DSM 2875 유래의 LpsE, 칸디다투스 플란크토필라 설포니카 유래의 TolC, 부티리비브리오 훈가테이 XBD2006 유래의 TolC, 로세부리아 인테스티날리스 CAG:13 유래의 MsbA, 페도박터 긴센기솔리 유래의 MsbA, 베루코미크로비아 박테리움 CG1_02_43_26 유래의 MsbA, 리조비움 종 Root149 유래의 Wzm, 아조스피릴룸 브라실리엔세 LMG 04375 유래의 Wzm, 대장균 113303 유래의 Wzm, 리조비움 종 Root149 유래의 Wzt, 아조스피릴룸 브라실리엔세 LMG 04375 유래의 Wzt, 대장균 113303 유래의 Wzt, 브라디리조비움 자포니쿰 USDA 110 유래의 Nodj, 또는 상기 P-P-결합-가수분해-유도 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 상기 LmrA, OppF, Wzk, Blon_2475, LpsE, TolC, MsbA, Wzm, Wzt 또는 Nodj 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질로부터 선택되는 것인 방법.
31. 구체예 2 또는 3에 있어서, 상기 추정 수송 단백질은 헬리코박터 필로리 유래의 사이토크롬 C 생합성 단백질, 클로스트리디움 종 CAG: 1013 유래의 CutC, 오도리박터 스플란크니쿠스 DSM 20712 유래의 CutC, 미추아리아 종 PDC51 유래의 CutC, 프레보텔라 인테르메디아 ATCC 25611 (DSM 20706) 유래의 CutC, 대장균 K12 MG1655 유래의 ybjM, 엔테로박테리아세에 박테리움 ENNIH1 유래의 ybjM, 또는 상기 추정 수송 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 상기 CytC, CutC 또는 ybjM 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질로부터 선택되는 것인 방법.
32. 유전자 변형 세포에 의해 푸코실락토스를 제조하는 방법으로서,
- 푸코실락토스를 생성할 수 있는 세포를 제공하는 단계로서, 상기 세포는 푸코실락토스 합성에 관여하는 효소를 코딩하는 핵산 서열을 적어도 1개 포함하고,
- 상기 세포는 i) 내인성 막 단백질의 변형된 발현 및/또는 ii) 이종 막 단백질의 발현을 추가로 포함하고, 상기 막 단백질은 포터 막 단백질인 대장균 K12 MG1655 유래의 MdfA, 대장균 K12 MG1655 유래의 IceT, 대장균 K12 MG1655 유래의 YnfM, 대장균 K12 MG1655 유래의 Yhhs, 대장균 K12 MG1655 유래의 EmrD, 대장균 K12 MG1655 유래의 YdhC, 대장균 K12 MG1655 유래의 YbdA, 대장균 K12 MG1655 유래의 YdeE, 대장균 K12 MG1655 유래의 MhpT, 대장균 K12 MG1655 유래의 YebQ, 대장균 K12 MG1655 유래의 YjhB, 대장균 K12 MG1655 유래의 Bcr, 대장균 K12 MG1655 유래의 FucP, 대장균 K12 MG1655 유래의 WzxE, 대장균 K12 MG1655 유래의 EmrE, 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2331, 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2332, 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0247, 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0245, 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0345, 뉴로스포라 크라사 OR74A 유래의 CDT2, 아스페르길루스 오리제 RIB40 유래의 CDT2, 키티노파가 종 CF118 유래의 Wzx, 유박테리움 종 CAG:581 유래의 Wzx, 디아도박터 솔리 (DSM 25329) 유래의 Wzx, 락토코커스 라피노락티스 (ATCC 43920) 유래의 Wzx, 프레보텔라 루미니콜라 (AR32) 유래의 Wzx, 브라키스피라 함프소니이 P280/1 유래의 NAPO, 악티노바쿨룸 수이스 (DSM 20639) 유래의 NAm, 루미노코커스 그나부스 유래의 NAm, 쿠르토박테리움 종 314Chir4.1 유래의 NAm, 플란크토마이세테스 박테리움 GWF2_42_9 유래의 NAm, 니아벨라 드릴라시스 (DSM25811) 유래의 Nap, 사카리크리니스 퍼멘탄스 (DSM 9555) 유래의 Nap,시트로박터 프레운디이 MGH152 유래의 mdtD, 시트로박터 웨르크마니이 NBRC 105721 유래의 mdtD, 시트로박터 아말로나티쿠스 유래의 mdtD, 클레브시엘라 옥시토카 유래의 mdtD, 에스케리치아 알베르티이 B156 유래의 mdtD, 살모넬라 엔테리카 아종 살라메 유래의 yegB, 클레브시엘라 뉴모니에 30684/NJST258_2 유래의 mdtD, 클레브시엘라 뉴모니에 유래의 Tcr_1_D38215, 슈도시트로박터 페칼리스 유래의 mdtD, 요케넬라 레겐스버게이 (ATCC43003) 유래의 Cmr, 크로노박터 무이트젠시이 유래의 MdfA, 클레브시엘라 옥시토카 유래의 MdfA, 시트로박터 코세리 유래의 MFS, 에스케리치아 마르모테 유래의 MdfA, 시겔라 플렉스네리 유래의 Cmr, 살모넬라 엔테리카 아종 살라메 유래의 MdfA, 시트로박터 윤게 (ATCC 29220) 유래의 Cmr, 시트로박터 프레운디이 유래의 MdfA, 엔테로박터 코베이 유래의 MdfA, 엔테로박터 종 유래의 MdfA, 렐리오티아 종 WB101 유래의 MdfA, 엔테로박터 루드위기이 EcWSU1 유래의 MdfA, 악티노플라네스 우타헨시스 유래의 Sweet-유사 단백질, 키티노파가세에 박테리움 PMG_246 유래의 Sweet-유사 단백질, 리조비움 종 PDC82 유래의 Sweet-유사 단백질, 키네오코커스 리조스파에레 (DSM 19711) 유래의 Sweet-유사 단백질, 모르가넬라 모르가니이 IS15 유래의 Sweet-유사 단백질, 게오데르마토필루스 오브스쿠러스 (균주 ATCC 25078) 유래의 Sweet-유사 단백질, 브라디리조비움 종 BTAi1 유래의 Sweet-유사 단백질, 브라디리조비움 자포니쿰 USDA 110 유래의 Sweet-유사 단백질, 크산토모나스 캄페스트리스 pv. 베시카토리아 균주 85-10 유래의 Sweet-유사 단백질, 헤르바스피릴룸 아쿠아티쿰 유래의 Sweet-유사 단백질, 플라보박테리아 박테리움 MS024-2A 유래의 Sweet-유사 단백질, 시노리조비움 메디케 WSM419 유래의 rnd-유사, 아조스피릴룸 브라실리엔세 LMG 04375 유래의 아라비노스 유출물, 또는 상기 포터 막 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 상기 MdfA, IceT, YnfM, Yhhs, EmrD, YdhC, YbdA, YdeE, MhpT, YebQ, YjhB, Bcr, FucP, WzxE, EmrE, Wzx, Blon_2331, Blon_2232, Blon_0247, Blon_0245, Blon_0345, NAPO, NAm, Nap, mdtD, YegB, Tcr_1_D38215, cmr, MFS, CDT2, rnd, Sweet-유사 또는 아라비노스 유출물 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질; 및 P-P-결합-가수분해-유도 수송체인 락토코커스 락티스 균주 SRCM103457 유래의 LmrA, 대장균 균주 K12 MG1655 유래의 OppF, 헬리코박터 필로리 (균주 ATCC 700392 / 26695) 유래의 Wzk, 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2475, 플라보박테리움 스파르탄시이 유래의 LpsE, 스포로무사 스파에로이데스 DSM 2875 유래의 LpsE, 칸디다투스 플란크토필라 설포니카 유래의 TolC, 부티리비브리오 훈가테이 XBD2006 유래의 TolC, 로세부리아 인테스티날리스 CAG:13 유래의 MsbA, 페도박터 긴센기솔리 유래의 MsbA, 베루코미크로비아 박테리움 CG1_02_43_26 유래의 MsbA, 리조비움 종 Root149 유래의 Wzm, 아조스피릴룸 브라실리엔세 LMG 04375 유래의 Wzm, 대장균 113303 유래의 Wzm, 리조비움 종 Root149 유래의 Wzt, 아조스피릴룸 브라실리엔세 LMG 04375 유래의 Wzt, 대장균 113303 유래의 Wzt, 브라디리조비움 자포니쿰 USDA 110 유래의 Nodj, 또는 상기 P-P-결합-가수분해-유도 수송체 막 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 상기 LmrA, OppF, Wzk, Blon_2475, LpsE, TolC, MsbA, Wzm, Wzt 또는 Nodj 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질; 및 β-배럴 포린 막 단백질인 대장균 K12 MG1655 유래의 Wza, 또는 이의 기능성 상동체 또는 기능성 단편, 또는 상기 Wza 막 단백질에 대해 적어도 80%의 서열 동일성을 갖는 서열; 및 보조 수송 단백질인 서모토가 마리티마 (균주 ATCC 43589 / MSB8 / DSM 3109 / JCM 10099) 유래의 Wzc, 또는 이의 기능성 상동체 또는 기능성 단편, 또는 상기 Wzc 막 단백질에 대해 적어도 80%의 서열 동일성을 갖는 서열; 및 추정 수송 단백질인 헬리코박터 필로리 유래의 사이토크롬 C 생합성 단백질, 클로스트리디움 종 CAG: 1013 유래의 CutC, 오도리박터 스플란크니쿠스 DSM 20712 유래의 CutC, 미추아리아 종 PDC51 유래의 CutC, 프레보텔라 인테르메디아 ATCC 25611 (DSM 20706) 유래의 CutC, 대장균 K12 MG1655 유래의 ybjM, 엔테로박테리아세에 박테리움 ENNIH1 유래의 ybjM, 또는 상기 추정 수송 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 상기 CytC, CutC 또는 ybjM 막 단백질 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질로 구성된 막 단백질들의 그룹으로부터 선택되는 것인 단계를 포함하는 방법.
33. 구체예 1 내지 32 중 어느 한 구체예에 있어서, 상기 방법은 하기 단계들 중 적어도 하나를 추가로 포함하는 것인 푸코실락토스를 제조하는 방법:
i) 상기 배양 배지에, 초기 반응기 부피 당 락토스를 적어도 50, 더 바람직하게는 적어도 75, 더 바람직하게는 적어도 100, 더 바람직하게는 적어도 120, 더 바람직하게는 적어도 150 그람 (gram)을 포함하는 락토스 공급물을, 바람직하게는 연속 방식 (continuous manner)으로, 바람직하게는 상기 배양 배지의 최종 부피가 상기 락토스 공급물의 부가 전 배양 배지 부피의 3배 이하, 바람직하게는 2배 이하, 더 바람직하게는 2배 미만이 되도록 부가하는 단계;
ii) 락토스 공급물을 연속 방식으로 상기 배양 배지에 1일, 2일, 3일, 4일, 5일에 걸쳐 공급 용액에 의해 부가하는 단계;
iii) 락토스 공급물을 연속 방식으로 배양 배지에 1일, 2일, 3일, 4일, 5일에 걸쳐 공급 용액에 의해 부가하는 단계로서, 상기 락토스 공급 용액의 농도는 50 g/L, 바람직하게는 75 g/L, 더 바람직하게는 100 g/L, 더 바람직하게는 125 g/L, 더 바람직하게는 150 g/L, 더 바람직하게는 175 g/L, 더 바람직하게는 200 g/L, 더 바람직하게는 225 g/L, 더 바람직하게는 250 g/L, 더 바람직하게는 275 g/L, 더 바람직하게는 300 g/L, 더 바람직하게는 325 g/L, 더 바람직하게는 350 g/L, 더 바람직하게는 375 g/L, 더 바람직하게는 400 g/L, 더 바람직하게는 450 g/L, 더 바람직하게는 500 g/L, 더욱 바람직하게는 550 g/L, 가장 바람직하게는 600 g/L이며; 바람직하게는 상기 용액의 pH는 3 내지 7로 설정되고, 바람직하게는 상기 공급 용액의 온도는 20℃ 내지 80℃로 유지되는 것인 단계;
iv) 상기 방법으로 상기 배양 배지의 최종 부피 중에 적어도 50 g/L, 바람직하게는 적어도 75 g/L, 더 바람직하게는 적어도 90 g/L, 더 바람직하게는 적어도 100 g/L, 더 바람직하게는 적어도 125 g/L, 더 바람직하게는 적어도 150 g/L, 더 바람직하게는 적어도 175 g/L, 더 바람직하게는 적어도 200 g/L의 푸코실락토스 농도가 유도된다.
34. 구체예 33에 있어서, 상기 락토스 공급은 배양 초기부터 락토스를 적어도 5 mM의 농도, 바람직하게는 30, 40, 50, 60, 70, 80, 90, 100, 150 mM의 농도, 더 바람직하게는 > 300 mM의 농도로 부가함으로써 달성되는 것인 방법.
35. 구체예 33 또는 34에 있어서, 상기 락토스 공급은 배양의 생산 단계 (production phase) 전반에 걸쳐 적어도 5 mM, 바람직하게는 10 mM 또는 30 mM의 락토스 농도가 수득되도록 하는 농도로 락토스를 상기 배양 배지에 부가함으로써 달성되는 것인 방법.
36. 구체예 33, 34 또는 35 중 어느 구체예에 있어서, 상기 숙주 세포는 적어도 약 60, 80, 100, 또는 약 120시간 동안, 또는 연속 방식으로 배양되는 것인 방법.
37. 구체예 33 내지 36 중 어느 한 구체예에 있어서, 탄소 및 에너지 공급원, 바람직하게는 수크로스, 글루코스, 프럭토스, 글리세롤, 말토스, 말토덱스트린, 트레할로스, 폴리올, 전분, 숙시네이트, 말레이트, 피루베이트, 락테이트, 에탄올, 시트레이트, 락토스가 또한 부가되고, 바람직하게는 연속적으로, 바람직하게는 락토스와 함께 상기 배양 배지에 부가되는 것인 방법.
38. 구체예 33 내지 37 중 어느 한 구체예에 있어서, 탄소계 기질, 바람직하게는 글루코스 또는 수크로스를 상기 배양 배지에 부가함으로써 제1 지수적 세포 성장 단계가 제공되고, 그 후에 제2 단계에서 락토스가 상기 배양 배지에 부가되는 것인 방법.
39. 구체예 1 내지 38 중 어느 한 구체예에 있어서, 상기 방법이 푸코실락토스의 혼합물을 생성하는 것인 방법.
40. 구체예 1 내지 39 중 어느 한 구체예에 있어서, 상기 푸코실락토스는 2'-푸코실락토스, 3-푸코실락토스 및/또는 디푸코실락토스인 것인 방법.
41. 구체예 1 내지 40 중 어느 한 구체예에 있어서, 상기 유전자 변형 세포는 미생물, 식물 또는 동물 세포로 구성된 그룹으로부터 선택되고, 바람직하게는 상기 미생물은 박테리아, 진균 또는 효모이며, 바람직하게는 상기 식물은 벼, 목화, 유채, 대두, 옥수수 (maize) 또는 옥수수 식물 (corn plant)이고, 바람직하게는 상기 동물은 곤충, 어류, 조류 또는 비-인간 포유동물인 것인 방법.
42. 구체예 41에 있어서, 상기 세포는 대장균 세포인 것인 방법.
43. 푸코실락토스를 생산하도록 유전자 변형된 숙주 세포로서, 상기 숙주 세포는 푸코실락토스 합성에 관여하는 효소를 코딩하는 핵산 서열을 적어도 1개 포함하고,
- 상기 세포는 i) 내인성 막 단백질의 변형된 발현 및/또는 ii) 이종 막 단백질의 발현을 추가로 포함하고, 상기 막 단백질은 interpro 번호 IPR001503 및 IPR002516을 각각 사용하여 GT10 및 GT11 푸코실트란스퍼라제 패밀리의 게놈 인근을 검색하여 발견된 PFAM 도메인들 중 어느 하나의 도메인을 포함하는 막 단백질들의 그룹으로부터 선택되고, 여기서 상기 게놈 인근 윈도우 크기는 각 푸코실트란스퍼라제 앞에 14개의 유전자 및 뒤에 14개의 유전자이고, 상기 막 단백질은 SET 패밀리에 속하지 않는 것인 숙주 세포.
44. 구체예 43에 있어서, 상기 막 단백질은
a) 포터;
b) P-P-결합-가수분해-유도 수송체;
c) β-배럴 포린;
d) 보조 수송 단백질; 및
e) 추정 수송 단백질의 그룹으로부터 선택되는 것인 숙주 세포.
45. 푸코실락토스를 생산하도록 유전자 변형된 숙주 세포로서, 상기 숙주 세포는 푸코실락토스 합성에 관여하는 효소를 코딩하는 핵산 서열을 적어도 1개 포함하고,
- 상기 세포는 i) 내인성 막 단백질의 변형된 발현 및/또는 ii) 이종 막 단백질의 발현을 추가로 포함하고, 상기 막 단백질은
a) 포터, 여기서 상기 막 단백질은 SET 패밀리에 속하는 않음;
b) P-P-결합-가수분해-유도 수송체;
c) β-배럴 포린;
d) 보조 수송 단백질; 및
e) 추정 수송 단백질의 그룹으로부터 선택되는 것인 숙주 세포.
46. 구체예 44 또는 45에 있어서, 상기 막 단백질은 구체예 4 내지 32 중 어느 한 구체예에 정의된 막 단백질들의 그룹으로부터 선택되는 것인 숙주 세포.
47. 구체예 44 또는 45에 있어서, 상기 포터 막 단백질은 대장균 K12 MG1655 유래의 MdfA, 대장균 K12 MG1655 유래의 IceT, 대장균 K12 MG1655 유래의 YnfM, 대장균 K12 MG1655 유래의 Yhhs, 대장균 K12 MG1655 유래의 EmrD, 대장균 K12 MG1655 유래의 YdhC, 대장균 K12 MG1655 유래의 YbdA, 대장균 K12 MG1655 유래의 YdeE, 대장균 K12 MG1655 유래의 MhpT, 대장균 K12 MG1655 유래의 YebQ, 대장균 K12 MG1655 유래의 YjhB, 대장균 K12 MG1655 유래의 Bcr, 대장균 K12 MG1655 유래의 FucP, 대장균 K12 MG1655 유래의 WzxE, 대장균 K12 MG1655 유래의 EmrE, 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2331, 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2332, 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0247, 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0245, 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0345, 뉴로스포라 크라사 OR74A 유래의 CDT2, 아스페르길루스 오리제 RIB40 유래의 CDT2, 키티노파가 종 CF118 유래의 Wzx, 유박테리움 종 CAG:581 유래의 Wzx, 디아도박터 솔리 (DSM 25329) 유래의 Wzx, 락토코커스 라피노락티스 (ATCC 43920) 유래의 Wzx, 프레보텔라 루미니콜라 (AR32) 유래의 Wzx, 브라키스피라 함프소니이 P280/1 유래의 NAPO, 악티노바쿨룸 수이스 (DSM 20639) 유래의 NAm, 루미노코커스 그나부스 유래의 NAm, 쿠르토박테리움 종 314Chir4.1 유래의 NAm, 플란크토마이세테스 박테리움 GWF2_42_9 유래의 NAm, 니아벨라 드릴라시스 (DSM25811) 유래의 Nap, 사카리크리니스 퍼멘탄스 (DSM 9555) 유래의 Nap,시트로박터 프레운디이 MGH152 유래의 mdtD, 시트로박터 웨르크마니이 NBRC 105721 유래의 mdtD, 시트로박터 아말로나티쿠스 유래의 mdtD, 클레브시엘라 옥시토카 유래의 mdtD, 에스케리치아 알베르티이 B156 유래의 mdtD, 살모넬라 엔테리카 아종 살라메 유래의 yegB, 클레브시엘라 뉴모니에 30684/NJST258_2 유래의 mdtD, 클레브시엘라 뉴모니에 유래의 Tcr_1_D38215, 슈도시트로박터 페칼리스 유래의 mdtD, 요케넬라 레겐스버게이 (ATCC43003) 유래의 Cmr, 크로노박터 무이트젠시이 유래의 MdfA, 클레브시엘라 옥시토카 유래의 MdfA, 시트로박터 코세리 유래의 MFS, 에스케리치아 마르모테 유래의 MdfA, 시겔라 플렉스네리 유래의 Cmr, 살모넬라 엔테리카 아종 살라메 유래의 MdfA, 시트로박터 윤게 (ATCC 29220) 유래의 Cmr, 시트로박터 프레운디이 유래의 MdfA, 엔테로박터 코베이 유래의 MdfA, 엔테로박터 종 유래의 MdfA, 렐리오티아 종 WB101 유래의 MdfA, 엔테로박터 루드위기이 EcWSU1 유래의 MdfA, 악티노플라네스 우타헨시스 유래의 Sweet-유사 단백질, 키티노파가세에 박테리움 PMG_246 유래의 Sweet-유사 단백질, 리조비움 종 PDC82 유래의 Sweet-유사 단백질, 키네오코커스 리조스파에레 (DSM 19711) 유래의 Sweet-유사 단백질, 모르가넬라 모르가니이 IS15 유래의 Sweet-유사 단백질, 게오데르마토필루스 오브스쿠러스 (균주 ATCC 25078) 유래의 Sweet-유사 단백질, 브라디리조비움 종 BTAi1 유래의 Sweet-유사 단백질, 브라디리조비움 자포니쿰 USDA 110 유래의 Sweet-유사 단백질, 크산토모나스 캄페스트리스 pv. 베시카토리아 균주 85-10 유래의 Sweet-유사 단백질, 헤르바스피릴룸 아쿠아티쿰 유래의 Sweet-유사 단백질, 플라보박테리아 박테리움 MS024-2A 유래의 Sweet-유사 단백질, 시노리조비움 메디케 WSM419 유래의 rnd-유사, 아조스피릴룸 브라실리엔세 LMG 04375 유래의 아라비노스 유출물, 또는 상기 포터 막 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 상기 MdfA, IceT, YnfM, Yhhs, EmrD, YdhC, YbdA, YdeE, MhpT, YebQ, YjhB, Bcr, FucP, WzxE, EmrE, Wzx, Blon_2331, Blon_2232, Blon_0247, Blon_0245, Blon_0345, NAPO, NAm, Nap, mdtD, YegB, Tcr_1_D38215, cmr, MFS, CDT2, rnd, Sweet-유사 또는 아라비노스 유출물 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질로부터 선택되는 것인 푸코실락토스를 생산하도록 유전자 변형된 숙주 세포.
48. 구체예 44 또는 45에 있어서, 상기 P-P-결합-가수분해-유도 수송체는 락토코커스 락티스 균주 SRCM103457 유래의 LmrA, 대장균 균주 K12 MG1655 유래의 OppF, 헬리코박터 필로리 (균주 ATCC 700392 / 26695) 유래의 Wzk, 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2475, 플라보박테리움 스파르탄시이 유래의 LpsE, 스포로무사 스파에로이데스 DSM 2875 유래의 LpsE, 칸디다투스 플란크토필라 설포니카 유래의 TolC, 부티리비브리오 훈가테이 XBD2006 유래의 TolC, 로세부리아 인테스티날리스 CAG:13 유래의 MsbA, 페도박터 긴센기솔리 유래의 MsbA, 베루코미크로비아 박테리움 CG1_02_43_26 유래의 MsbA, 리조비움 종 Root149 유래의 Wzm, 아조스피릴룸 브라실리엔세 LMG 04375 유래의 Wzm, 대장균 113303 유래의 Wzm, 리조비움 종 Root149 유래의 Wzt, 아조스피릴룸 브라실리엔세 LMG 04375 유래의 Wzt, 대장균 113303 유래의 Wzt, 브라디리조비움 자포니쿰 USDA 110 유래의 Nodj, 또는 상기 P-P-결합-가수분해-유도 수송체 막 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 상기 LmrA, OppF, Wzk, Blon_2475, LpsE, TolC, MsbA, Wzm, Wzt 또는 Nodj 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질로부터 선택되는 것인 숙주 세포.
49. 구체예 44 또는 45에 있어서, 상기 추정 수송 단백질은 헬리코박터 필로리 유래의 사이토크롬 C 생합성 단백질, 클로스트리디움 종 CAG: 1013 유래의 CutC, 오도리박터 스플란크니쿠스 DSM 20712 유래의 CutC, 미추아리아 종 PDC51 유래의 CutC, 프레보텔라 인테르메디아 ATCC 25611 (DSM 20706) 유래의 CutC, 대장균 K12 MG1655 유래의 ybjM, 엔테로박테리아세에 박테리움 ENNIH1 유래의 ybjM, 또는 상기 추정 수송 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 상기 CytC, CutC 또는 ybjM 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질로부터 선택되는 것인 숙주 세포.
50. 구체예 44 또는 45에 있어서, 상기 β-배럴 포린은 대장균 K12 MG1655 유래의 Wza, 또는 이의 기능성 상동체 또는 기능성 단편, 또는 상기 Wza 막 단백질에 대해 적어도 80%의 서열 동일성을 갖는 서열로부터 선택되는 것인 숙주 세포.
51. 구체예 44 또는 45에 있어서, 상기 보조 수송 단백질은 서모토가 마리티마 (균주 ATCC 43589 / MSB8 / DSM 3109 / JCM 10099) 유래의 Wzc, 또는 이의 기능성 상동체 또는 기능성 단편, 또는 상기 Wzc 막 단백질에 대해 적어도 80%의 서열 동일성을 갖는 서열로부터 선택되는 것인 숙주 세포.
52. 배지에서 안정하게 배양되는 세포로서, 상기 세포는 푸코실락토스의 생성을 위해 조정되고, 상기 세포는 푸코실락토스 합성에 관여하는 효소를 코딩하는 핵산 서열을 적어도 1개 포함하도록 형질전환되며, 상기 세포는 i) 내인성 막 단백질의 변형된 발현 및/또는 ii) 이종 막 단백질의 발현을 추가로 포함하고, 상기 막 단백질은 구체예 1 내지 33 중 어느 한 구체예에 정의된 바와 같은 것을 특징으로 하는 세포.
53. 구체예 43 내지 52 중 어느 한 구체예에 있어서, 상기 세포는 미생물, 식물 또는 동물 세포로 구성된 그룹으로부터 선택되고, 바람직하게는 상기 미생물은 박테리아, 진균 또는 효모이며, 바람직하게는 상기 식물은 벼, 목화, 유채, 대두, 옥수수 또는 옥수수 식물이고, 바람직하게는 상기 동물은 곤충, 어류, 조류 또는 비-인간 포유동물인 것인 세포.
54. 구체예 53에 있어서, 상기 세포는 대장균 세포인 것인 숙주 세포.
55. 구체예 43 내지 54 중 어느 한 구체예에 있어서, 상기 세포는 푸코실락토스 합성에 관여하고/하거나 이의 합성에 필요한, 적어도 부분적으로 불활성화된, 모노사카라이드, 디사카라이드 또는 올리고사카라이드인, 선택된 모노사카라이드, 디사카라이드 또는 올리고사카라이드에 대한 이화 경로를 포함하는 것인 세포.
56. 구체예 43 내지 55 중 어느 한 구체예에 있어서, 상기 푸코실락토스는 2'-푸코실락토스, 3-푸코실락토스 및/또는 디푸코실락토스인 것인 세포.
57. 푸코실락토스를 제조하는 방법으로서,
a) 구체예 43 내지 56 중 어느 한 구체예에 따른 세포를 제공하는 단계,
b) 상기 푸코실락토스의 생성을 허용하는 조건 하에 배지에서 상기 세포를 배양하는 단계,
c) 상기 푸코실락토스를 배양으로부터 분리하는 단계를 포함하는 방법.
58. 푸코실락토스의 발효 생성에서 구체예 1 내지 31 중 어느 한 구체예에 정의된 막 단백질들의 그룹으로부터 선택된 막 단백질의 용도.
59. 푸코실락토스의 제조 방법에서 구체예 43 내지 56 중 어느 한 구체예에 따른 세포의 용도.
60. 구체예 59에 있어서, 상기 푸코실락토스는 2'-푸코실락토스, 3-푸코실락토스 및/또는 디푸코실락토스인 것인 세포의 용도.
또한, 본 발명은 하기 바람직한 특정 구체예에 관한 것이다:
1. 유전자 변형 세포에 의해 푸코실락토스를 제조하는 방법으로서,
- 푸코실락토스를 생성할 수 있는 세포를 제공하는 단계로서, 상기 세포는 구아노신-디포스페이트 푸코스 (GDP-푸코스) 공여체로부터의 푸코스 잔기를 락토스 수용체에 전달하여 푸코실락토스를 합성하는 푸코실트란스퍼라제를 코딩하는 핵산 서열을 적어도 1개 포함하고,
- 상기 세포는 i) 푸코실락토스 수송을 가능하게 하고/하거나 이를 향상시키는 내인성 막 단백질의 변형된 발현 및/또는 ii) 푸코실락토스 수송을 가능하게 하고/하거나 이를 향상시키는 이종 막 단백질의 발현을 추가로 포함하고, 상기 막 단백질은 i) 2019년 7월 4일자로 공개된 InterPro 75.0에 정의되는, interpro 번호 IPR001503 및 IPR002516을 각각 사용하여 GT10 및 GT11 푸코실트란스퍼라제 패밀리의 게놈 인근을 검색하여 발견된 PFAM 도메인들 중 어느 하나의 도메인을 포함하는 막 단백질들의 그룹으로부터 선택되고, 여기서 상기 게놈 인근 윈도우 크기는 각 푸코실트란스퍼라제 앞에 14개의 유전자 및 뒤에 14개의 유전자이고, 상기 막 단백질은 SET 패밀리에 속하지 않으며, 또는 ii) 서열번호: 204, 206, 208, 210, 212, 214, 216, 218을 포함하는 막 단백질, 또는 서열번호: 204, 206, 208, 210, 212, 214, 216, 218을 포함하는 막 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 204, 206, 208, 210, 212, 214, 216, 218을 갖는 상기 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 서열의 그룹으로부터 선택되는 것인 단계,
- 상기 세포를 배지에서 원하는 푸코실락토스의 생성을 허용하는 조건 하에 배양하는 단계
- 바람직하게는 상기 푸코실락토스를 배양으로부터 분리하는 단계를 포함하는 푸코실락토스를 제조하는 방법.
2. 특정 구체예 1에 있어서, 상기 막 단백질은
a) 포터;
b) P-P-결합-가수분해-유도 수송체;
c) β-배럴 포린;
d) 보조 수송 단백질;
e) 추정 수송 단백질; 및
f) 포스포트란스퍼-유도 그룹 전위인자의 그룹으로부터 선택되는 것인 방법.
3. 유전자 변형 세포에 의해 푸코실락토스를 제조하는 방법으로서,
- 푸코실락토스를 생성할 수 있는 세포를 제공하는 단계로서, 상기 세포는 GDP-푸코스 공여체로부터의 푸코스 잔기를 락토스 수용체에 전달하여 푸코실락토스를 합성하는 푸코실트란스퍼라제를 코딩하는 핵산 서열을 적어도 1개 포함하고,
- 상기 세포는 i) 푸코실락토스 수송을 가능하게 하고/하거나 이를 향상시키는 내인성 막 단백질의 변형된 발현, 및/또는 ii) 푸코실락토스 수송을 가능하게 하고/하거나 이를 향상시키는 이종 막 단백질의 발현을 추가로 포함하고, 상기 막 단백질은
a) 포터, 여기서 상기 막 단백질은 SET 패밀리에 속하지 않음;
b) P-P-결합-가수분해-유도 수송체;
c) β-배럴 포린;
d) 보조 수송 단백질;
e) 추정 수송 단백질; 및
f) 포스포트란스퍼-유도 그룹 전위인자의 그룹으로부터 선택되는 것인 단계;
- 상기 세포를 배지에서 원하는 푸코실락토스의 생성을 허용하는 조건 하에 배양하는 단계
- 바람직하게는, 상기 푸코실락토스를 배양으로부터 분리하는 단계를 포함하는 방법.
4. 특정 구체예 2 또는 3에 있어서, 상기 포터는 2019년 6월 17일자로 공개된 TCDB.org에 의해 정의되는, TCDB 클래스 2.A.1.1, 2.A.1.12, 2.A.1.15, 2.A.1.2, 2.A.1.3, 2.A.1.36, 2.A.1.38, 2.A.1.46, 2.A.1.68, 2.A.1.7, 2.A.1.81, 2.A.123, 2.A.2, 2.A.21, 2.A.58, 2.A.6.3, 2.A.66 및 2.A.7.1의 그룹으로부터 선택되는 것인 방법.
5. 특정 구체예 2 또는 3에 있어서, 상기 P-P-결합-가수분해-유도 수송체는 2019년 6월 17일자로 공개된 TCDB.org에 의해 정의되는, TCDB 클래스 3.A.1.1, 3.A.1.2, 3.A.1.10, 3.A.1.11 및 3.A.1.5의 그룹으로부터 선택되는 것인 방법.
6. 특정 구체예 2 또는 3에 있어서, 상기 β-배럴 포린은 2019년 6월 17일자로 공개된 TCDB.org에 의해 정의되는, TCDB 클래스 1.B.3.1 및 1.B.18로부터 선택되는 것인 방법.
7. 특정 구체예 2 또는 3에 있어서, 상기 보조 수송 단백질은 2019년 6월 17일자로 공개된 TCDB.org에 의해 정의되는, TCDB 클래스 8.A.3으로부터 선택되는 것인 방법.
8. 특정 구체예 2 또는 3에 있어서, 상기 추정 수송 단백질은 2019년 6월 17일자로 공개된 TCDB.org에 의해 정의되는, TCDB 클래스 9.B.14 및 9.B.158의 그룹으로부터 선택되는 것인 방법.
9. 특정 구체예 2 또는 3에 있어서, 상기 포스포트란스퍼-유도 그룹 전위인자는 2019년 6월 17일자로 공개된 TCDB.org에 의해 정의되는, TCDB 클래스 4.A.1.1 및 4.A.4.1의 그룹으로부터 선택되는 것인 방법.
10. 특정 구체예 2 또는 3에 있어서, 상기 포터는 2017년 11월 3일자로 공개된 eggnogdb 1.0.2에 의해 정의되는, eggnog 패밀리 05BZS, 05C0R, 05C2C, 05CT4, 05CXP, 05CZQ, 05D94, 05DXI, 05E5M, 05E5W, 05E8G, 05EAM, 05EDR, 05EGZ, 05F9N, 05JHE, 05PSV, 05W2Y, 05W3H, 05XJ5, 070Q9, 07CWC, 07QF7, 07QNK, 07RBJ, 07RJ1, 07T5E, 07VQ3, 0814C, 088QT, 08H15, 08N8A, 08SC4, 08Z4Q의 그룹으로부터 선택되는 것인 방법.
11. 특정 구체예 2 또는 3에 있어서, 상기 P-P-결합-가수분해-유도 수송체는 2017년 11월 3일자로 공개된 eggnogdb 1.0.2에 의해 정의되는, eggnog 패밀리 05BZ1, 05CJ1, 05EY8, 05HAC, 05DMK, 05DFW, 05MFV, 07FKK, 07R5U, 07V1T, 08IJ9, 08JQ7, 172T7의 그룹으로부터 선택되는 것인 방법.
12. 특정 구체예 2 또는 3에 있어서, 상기 β-배럴 포린은 2017년 11월 3일자로 공개된 eggnogdb 1.0.2에 의해 정의되는, eggnog 패밀리 05DAY, 08KDD의 그룹으로부터 선택되는 것인 방법.
13. 특정 구체예 2 또는 3에 있어서, 상기 보조 수송 단백질은 2017년 11월 3일자로 공개된 eggnogdb 1.0.2에 의해 정의되는, eggnog 패밀리 07SYR의 그룹으로부터 선택되는 것인 방법.
14. 특정 구체예 2 또는 3에 있어서, 상기 추정 수송 단백질은 2017년 11월 3일자로 공개된 eggnogdb 1.0.2에 의해 정의되는, eggnog 패밀리 05CRE, 05GWF, 06N3A의 그룹으로부터 선택되는 것인 방법.
15. 특정 구체예 2 또는 3에 있어서, 상기 포스포트란스퍼-유도 그룹 전위인자는 2017년 11월 3일자로 공개된 eggnogdb 1.0.2에 의해 정의되는, eggnog 패밀리 05CI1 및 05VI0의 그룹으로부터 선택되는 것인 방법.
16. 특정 구체예 2 또는 3에 있어서, 상기 포터는 2018년 9월에 공개된 Pfam 32.0에 의해 정의되는, PFAM 목록 PF00083, PF00474, PF00873, PF00893, PF01895, PF01943, PF02690, PF03083, PF04193, PF05977, PF07690, PF07690, PF13347, PF13440 및 PF14667로부터 선택되는 것인 방법.
17. 특정 구체예 2 또는 3에 있어서, 상기 P-P-결합-가수분해-유도 수송체는 2018년 9월에 공개된 Pfam 32.0에 의해 정의되는, PFAM 목록 PF00005, PF00532, PF00664, PF01061, PF08352, PF14524, PF13407, PF13416 및 PF17912로부터 선택되는 것인 방법.
18. 특정 구체예 2 또는 3에 있어서, 상기 β-배럴 포린은 2018년 9월에 공개된 Pfam 32.0에 의해 정의되는, PFAM 목록 PF02264, PF02563, PF10531 및 PF18412로부터 선택되는 것인 방법.
19. 특정 구체예 2 또는 3에 있어서, 상기 보조 수송 단백질은 2018년 9월에 공개된 Pfam 32.0에 의해 정의되는, PFAM 목록 PF13807 및 PF02706으로부터 선택되는 것인 방법.
20. 특정 구체예 2 또는 3에 있어서, 상기 추정 수송 단백질은 2018년 9월에 공개된 Pfam 32.0에 의해 정의되는, PFAM 목록 PF01578, PF03932, PF05140 및 PF11045로부터 선택되는 것인 방법.
21. 특정 구체예 2 또는 3에 있어서, 상기 포스포트란스퍼-유도 그룹 전위인자는 2018년 9월에 공개된 Pfam 32.0에 의해 정의되는, PFAM 목록 PF00367, PF00358, PF02378, PF03829로부터 선택되는 것인 방법.
22. 특정 구체예 2 또는 3에 있어서, 상기 포터는 2019년 7월 4일자로 공개된 InterPro 75.0에 의해 정의되는, interpro 목록 IPR000390, IPR001036, IPR001411, IPR001734, IPR001927, IPR002797, IPR003663, IPR003841, IPR004316, IPR004633, IPR004638, IPR004734, IPR004812, IPR005275, IPR005828, IPR005829, IPR006603, IPR010290, IPR011701, IPR020846, IPR023008, IPR023721, IPR023722, IPR026022, IPR027417, IPR027463, IPR029303, IPR032896, IPR036259, IPR038078, IPR038377, IPR039672로부터 선택되는 것인 방법.
23. 특정 구체예 2 또는 3에 있어서, 상기 P-P-결합-가수분해-유도 수송체는 2019년 7월 4일자로 공개된 InterPro 75.0에 의해 정의되는, interpro 목록 IPR000412, IPR001734, IPR001761, IPR003439, IPR003593, IPR005829, IPR005978, IPR005981, IPR006059, IPR006060, IPR006061, IPR008995, IPR011527, IPR011701, IPR013456, IPR013525, IPR013563, IPR015851, IPR015855, IPR017871, IPR019554, IPR020846, IPR025997, IPR026266, IPR027417, IPR028082, IPR029439, IPR033893, IPR036259, IPR036640, IPR038377, IPR039421 및 IPR040582로부터 선택되는 것인 방법.
24. 특정 구체예 2 또는 3에 있어서, 상기 β-배럴 포린은 2019년 7월 4일자로 공개된 InterPro 75.0에 의해 정의되는, interpro 목록 IPR003192, IPR003715, IPR019554, IPR023738, IPR036998 및 IPR040716으로부터 선택되는 것인 방법.
25. 특정 구체예 2 또는 3에 있어서, 상기 보조 수송 단백질은 2019년 7월 4일자로 공개된 InterPro 75.0에 의해 정의되는, interpro 목록 IPR003856, IPR020846, IPR027417, IPR032807 및 IPR036259로부터 선택되는 것인 방법.
26. 특정 구체예 2 또는 3에 있어서, 상기 추정 수송 단백질은 2019년 7월 4일자로 공개된 InterPro 75.0에 의해 정의되는, interpro 목록 IPR002541, IPR003439, IPR003593, IPR004316, IPR005627, IPR006603, IPR007816, IPR017871, IPR020368, IPR020846, IPR023648, IPR027417, IPR036259 및 IPR036822로부터 선택되는 것인 방법.
27. 특정 구체예 2 또는 3에 있어서, 상기 포스포트란스퍼-유도 그룹 전위인자는 2019년 7월 4일자로 공개된 InterPro 75.0에 의해 정의되는, interpro 목록 IPR001127, IPR001996, IPR003352, IPR004716, IPR010974, IPR011055, IPR013013, IPR018113, IPR018454, IPR036665 및 IPR036878로부터 선택되는 것인 방법.
28. 특정 구체예 2 또는 3에 있어서, 상기 포터 막 단백질은 서열번호: 02의 대장균 K12 MG1655 유래의 MdfA, 서열번호: 06의 대장균 K12 MG1655 유래의 IceT, 서열번호: 40의 B. 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2331, 서열번호: 42의 B. 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2332, 서열번호: 58의 키티노파가 CF118, 서열번호: 66의 프레보텔라 루미니콜라 (AR32), 서열번호: 64의 락토코커스 라피노락티스 (ATCC 43920), 또는 서열번호: 62의 디아도박터 솔리 DSM 25329의 wzx-유사 단백질, 또는 상기 포터 막 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 02, 06, 40, 42, 58, 66, 64 또는 62 각각의 상기 MdfA, IceT, Blon_2331, Blon_2332 막 단백질들 또는 wzx-유사 막 단백질 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 서열로부터 선택되는 것인 방법.
29. 특정 구체예 2 또는 3에 있어서, 상기 P-P-결합-가수분해 유도 수송체 막 단백질은 서열번호: 28의 락토코커스 락티스 균주 SRCM103457 유래의 lmrA, 서열번호: 70 또는 74의 스포로무사 스파에로이데스 DSM 2875, 서열번호: 68 또는 72의 플라보박테리움 스파르탄시이 유래의 LpsE 막 단백질, 서열번호: 76의 칸디다투스 플란크토필라 설포니카 유래의 TolC, 서열번호: 82의 페도박터 긴센기솔리 또는 서열번호: 84의 베루코미크로비아 박테리움 CG1_02_43_26 유래의 MsbA, 서열번호: 206의 대장균 K-12 MG1655 유래의 malE, 서열번호: 208의 대장균 K-12 MG1655 유래의 malK, 서열번호: 214의 대장균 K-12 MG1655 유래의 araF, 서열번호: 216의 대장균 K-12 MG1655 유래의 xylF, 또는 서열번호: 218의 대장균 K-12 MG1655 유래의 ytfQ, 또는 상기 P-P-결합-가수분해 유도 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 28, 70, 74, 68, 72, 76, 82, 84, 206, 208, 214, 216, 또는 218 각각의 상기 lmrA, LpsE, TolC, MsbA, malE, malK, araF, xylF 또는 ytfQ 막 단백질에 대해 적어도 80%의 서열 동일성을 갖는 서열로부터 선택되는 것인 방법.
30. 특정 구체예 2 또는 3에 있어서, 상기 β-배럴 포린은 서열번호: 34의 대장균 K12 MG1655 유래의 Wza 또는 서열번호: 204의 대장균 K12 MG1655 유래의 lamB, 또는 이의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 34 또는 204 각각의 상기 Wza 또는 lamB 막 단백질에 대해 적어도 80%의 서열 동일성을 갖는 서열로부터 선택되는 것인 방법.
31. 특정 구체예 2 또는 3에 있어서, 상기 보조 수송 단백질은 서열번호: 88의 서모토가 마리티마 (균주 ATCC 43589 / MSB8 / DSM 3109 / JCM 10099) 유래의 Wzc, 또는 이의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 88의 상기 Wzc 막 단백질에 대해 적어도 80%의 서열 동일성을 갖는 서열로부터 선택되는 것인 방법.
32. 특정 구체예 2 또는 3에 있어서, 상기 추정 수송 단백질은 서열번호: 90의 클로스트리디움 종 CAG: 1013, 서열번호: 92의 오도리박터 스플란크니쿠스 DSM 20712, 서열번호: 94의 미추아리아 종 PDC51 또는 서열번호: 96의 프레보텔라 인테르메디아 ATCC 25611 (DSM 20706) 유래의 CutC, 또는 상기 CutC 막 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 90, 92, 94 또는 96 각각의 상기 CutC 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 서열로부터 선택되는 것인 방법.
33. 특정 구체예 2 또는 3에 있어서, 상기 포스포트란스퍼-유도 그룹 전위인자는 서열번호: 210의 대장균 K12 MG1655 유래의 nagE, 서열번호: 212의 대장균 K12 MG1655 유래의 srlB, 또는 상기 nagE 또는 srlB 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 210 또는 212 각각의 상기 nagE 또는 srlB 막 단백질 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 서열로부터 선택되는 것인 방법.
34. 특정 구체예 2 또는 3에 있어서, 상기 포터 막 단백질은 서열번호: 02의 대장균 K12 MG1655 유래의 MdfA, 서열번호: 06의 대장균 K12 MG1655 유래의 IceT, 서열번호: 04의 대장균 K12 MG1655 유래의 YnfM, 서열번호: 08의 대장균 K12 MG1655 유래의 Yhhs, 서열번호: 10의 대장균 K12 MG1655 유래의 EmrD, 서열번호: 12의 대장균 K12 MG1655 유래의 YdhC, 서열번호: 14의 대장균 K12 MG1655 유래의 YbdA, 서열번호: 16의 대장균 K12 MG1655 유래의 YdeE, 서열번호: 18의 대장균 K12 MG1655 유래의 MhpT, 서열번호: 20의 대장균 K12 MG1655 유래의 YebQ, 서열번호: 22의 대장균 K12 MG1655 유래의 YjhB, 서열번호: 24의 대장균 K12 MG1655 유래의 Bcr, 서열번호: 26의 대장균 K12 MG1655 유래의 FucP, 서열번호: 32의 대장균 K12 MG1655 유래의 WzxE, 서열번호: 38의 대장균 K12 MG1655 유래의 EmrE, 서열번호: 40의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2331, 서열번호: 42의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2332, 서열번호: 46의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0247, 서열번호: 48의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0245, 서열번호: 50의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0345, 서열번호: 52의 뉴로스포라 크라사 OR74A 유래의 CDT2, 서열번호: 54의 아스페르길루스 오리제 RIB40 유래의 CDT2, 서열번호: 58의 키티노파가 종 CF118 유래의 Wzx, 서열번호: 60의 유박테리움 종 CAG:581 유래의 Wzx, 서열번호: 62의 디아도박터 솔리 (DSM 25329) 유래의 Wzx, 서열번호: 64의 락토코커스 라피노락티스 (ATCC 43920) 유래의 Wzx, 서열번호: 66의 프레보텔라 루미니콜라 (AR32) 유래의 Wzx, 서열번호: 86의 브라키스피라 함프소니이 P280/1 유래의 NAPO, 서열번호: 98의 악티노바쿨룸 수이스 (DSM 20639) 유래의 NAm, 서열번호: 100의 루미노코커스 그나부스 유래의 NAm, 서열번호: 102의 쿠르토박테리움 종 314Chir4.1 유래의 NAm, 서열번호: 104의 니아벨라 드릴라시스 (DSM25811) 유래의 Nap, 서열번호: 106의 사카리크리니스 퍼멘탄스 (DSM 9555) 유래의 Nap, 서열번호: 108의 시트로박터 프레운디이 MGH152 유래의 mdtD, 서열번호: 110의 시트로박터 웨르크마니이 NBRC 105721 유래의 mdtD, 서열번호: 112의 시트로박터 아말로나티쿠스 유래의 mdtD, 서열번호: 114의 클레브시엘라 옥시토카 유래의 mdtD, 서열번호: 116의 에스케리치아 알베르티이 B156 유래의 mdtD, 서열번호: 118의 살모넬라 엔테리카 아종 살라메 유래의 yegB, 서열번호: 120의 클레브시엘라 뉴모니에 30684/NJST258_2 유래의 mdtD, 서열번호: 122의 클레브시엘라 뉴모니에 유래의 Tcr_1_D38215, 서열번호: 124의 슈도시트로박터 페칼리스 유래의 mdtD, 서열번호: 126의 요케넬라 레겐스버게이 (ATCC43003) 유래의 Cmr, 서열번호: 128의 크로노박터 무이트젠시이 유래의 MdfA, 서열번호: 130의 클레브시엘라 옥시토카 유래의 MdfA, 서열번호: 132의 시트로박터 코세리 유래의 MFS, 서열번호: 134의 에스케리치아 마르모테 유래의 MdfA, 서열번호: 136의 시겔라 플렉스네리 유래의 Cmr, 서열번호: 138의 살모넬라 엔테리카 아종 살라메 유래의 MdfA, 서열번호: 140의 시트로박터 윤게 (ATCC 29220) 유래의 Cmr, 서열번호: 142의 시트로박터 프레운디이 유래의 MdfA, 서열번호: 144의 엔테로박터 코베이 유래의 MdfA, 서열번호: 146의 엔테로박터 종 유래의 MdfA, 서열번호: 148의 렐리오티아 종 WB101 유래의 MdfA, 서열번호: 150의 엔테로박터 루드위기이 EcWSU1 유래의 MdfA, 서열번호: 152의 악티노플라네스 우타헨시스 유래의 Sweet-유사 단백질, 서열번호: 154의 키티노파가세에 박테리움 PMG_246 유래의 Sweet-유사 단백질, 서열번호: 156의 리조비움 종 PDC82 유래의 Sweet-유사 단백질, 서열번호: 158의 키네오코커스 리조스파에레 (DSM 19711) 유래의 Sweet-유사 단백질, 서열번호: 160의 모르가넬라 모르가니이 IS15 유래의 Sweet-유사 단백질, 서열번호: 162의 게오데르마토필루스 오브스쿠러스 (균주 ATCC 25078) 유래의 Sweet-유사 단백질, 서열번호: 164의 브라디리조비움 종 BTAi1 유래의 Sweet-유사 단백질, 서열번호: 166의 브라디리조비움 자포니쿰 USDA 110 유래의 Sweet-유사 단백질, 서열번호: 168의 크산토모나스 캄페스트리스 pv. 베시카토리아 균주 85-10 유래의 Sweet-유사 단백질, 서열번호: 170의 헤르바스피릴룸 아쿠아티쿰 유래의 Sweet-유사 단백질, 서열번호: 172의 플라보박테리아 박테리움 MS024-2A 유래의 Sweet-유사 단백질, 서열번호: 182의 시노리조비움 메디케 WSM419 유래의 rnd-유사 단백질, 서열번호: 184의 아조스피릴룸 브라실리엔세 LMG 04375 유래의 아라비노스 유출물, 또는 상기 포터 막 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 02, 06, 04, 08, 10, 12, 14, 16, 18, 20, 22, 24, 26, 32, 38, 40, 42, 46, 48, 50, 52, 54, 58, 60, 62, 64, 66, 86, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164, 166, 168, 170, 172, 182 또는 184 각각의 상기 MdfA, IceT, YnfM, Yhhs, EmrD, YdhC, YbdA, YdeE, MhpT, YebQ, YjhB, Bcr, FucP, WzxE, EmrE, Wzx, Blon_2331, Blon_2232, Blon_0247, Blon_0245, Blon_0345, NAPO, NAm, Nap, mdtD, YegB, Tcr_1_D38215, cmr, MFS, CDT2, rnd, Sweet-유사 또는 아라비노스 유출물 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질로부터 선택되는 것인 방법.
35. 특정 구체예 2 또는 3에 있어서, 상기 P-P-결합-가수분해-유도 수송체는 서열번호: 28의 락토코커스 락티스 균주 SRCM103457 유래의 LmrA, 서열번호: 30의 대장균 균주 K12 MG1655 유래의 OppF, 서열번호: 36의 헬리코박터 필로리 (균주 ATCC 700392 / 26695) 유래의 Wzk, 서열번호: 44의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2475, 서열번호: 68 또는 72의 플라보박테리움 스파르탄시이 유래의 LpsE, 서열번호: 70 또는 74의 스포로무사 스파에로이데스 DSM 2875 유래의 LpsE, 서열번호: 76의 칸디다투스 플란크토필라 설포니카 유래의 TolC, 서열번호: 78의 부티리비브리오 훈가테이 XBD2006 유래의 TolC, 서열번호: 80의 로세부리아 인테스티날리스 CAG:13 유래의 MsbA, 서열번호: 82의 페도박터 긴센기솔리 유래의 MsbA, 서열번호: 84의 베루코미크로비아 박테리움 CG1_02_43_26 유래의 MsbA, 서열번호: 174의 리조비움 종 Root149 유래의 Wzm, 서열번호: 176의 아조스피릴룸 브라실리엔세 LMG 04375 유래의 Wzm, 서열번호: 196의 대장균 113303 유래의 Wzm, 서열번호: 178의 리조비움 종 Root149 유래의 Wzt, 서열번호: 180의 아조스피릴룸 브라실리엔세 LMG 04375 유래의 Wzt, 서열번호: 194의 대장균 113303 유래의 Wzt, 서열번호: 188 또는 190의 브라디리조비움 자포니쿰 USDA 110 유래의 Nodj, 서열번호: 206의 대장균 K-12 MG1655 유래의 malE, 서열번호: 208의 대장균 K-12 MG1655 유래의 malK, 서열번호: 214의 대장균 K-12 MG1655 유래의 araF, 서열번호: 216의 대장균 K-12 MG1655 유래의 xylF, 또는 서열번호: 218의 대장균 K-12 MG1655 유래의 ytfQ, 또는 상기 P-P-결합-가수분해-유도 수송체 막 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 28, 30, 36, 44, 68, 72, 70, 74, 76, 78, 80, 82, 84, 174, 176, 196, 178, 180, 194, 188, 190, 206, 208, 214, 216 또는 218 각각의 상기 LmrA, OppF, Wzk, Blon_2475, LpsE, TolC, MsbA, Wzm, Wzt, Nodj, malE, malK, araF, xylF 또는 ytfQ 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질로부터 선택되는 것인 방법.
36. 특정 구체예 2 또는 3에 있어서, 상기 추정 수송 단백질은 서열번호: 56의 헬리코박터 필로리 유래의 사이토크롬 C 생합성 단백질, 서열번호: 90의 클로스트리디움 종 CAG: 1013 유래의 CutC, 서열번호: 92의 오도리박터 스플란크니쿠스 DSM 20712 유래의 CutC, 서열번호: 94의 미추아리아 종 PDC51 유래의 CutC, 서열번호: 96의 프레보텔라 인테르메디아 ATCC 25611 (DSM 20706) 유래의 CutC, 서열번호: 190의 대장균 K12 MG1655 유래의 ybjM, 서열번호: 192의 엔테로박테리아세에 박테리움 ENNIH1 유래의 ybjM, 또는 상기 추정 수송 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 56, 90, 92, 94, 96, 190 또는 192 각각의 상기 CytC, CutC 또는 ybjM 막 단백질 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질로부터 선택되는 것인 방법.
37. 유전자 변형 세포에 의해 푸코실락토스를 제조하는 방법으로서,
- 푸코실락토스를 생성할 수 있는 세포를 제공하는 단계로서, 상기 세포는 GDP-푸코스 공여체로부터의 푸코스 잔기를 락토스 수용체에 전달하여 푸코실락토스를 합성하는 푸코실트란스퍼라제를 코딩하는 핵산 서열을 적어도 1개 포함하고,
- 상기 세포는 i) 푸코실락토스 수송을 가능하게 하고/하거나 이를 향상시키는 내인성 막 단백질의 변형된 발현, 및/또는 ii) 푸코실락토스 수송을 가능하게 하고/하거나 이를 향상시키는 이종 막 단백질의 발현을 추가로 포함하고, 상기 막 단백질은 포터 막 단백질인 서열번호: 02의 대장균 K12 MG1655 유래의 MdfA, 서열번호: 06의 대장균 K12 MG1655 유래의 IceT, 서열번호: 04의 대장균 K12 MG1655 유래의 YnfM, 서열번호: 08의 대장균 K12 MG1655 유래의 Yhhs, 서열번호: 10의 대장균 K12 MG1655 유래의 EmrD, 서열번호: 12의 대장균 K12 MG1655 유래의 YdhC, 서열번호: 14의 대장균 K12 MG1655 유래의 YbdA, 서열번호: 16의 대장균 K12 MG1655 유래의 YdeE, 서열번호: 18의 대장균 K12 MG1655 유래의 MhpT, 서열번호: 20의 대장균 K12 MG1655 유래의 YebQ, 서열번호: 22의 대장균 K12 MG1655 유래의 YjhB, 서열번호: 24의 대장균 K12 MG1655 유래의 Bcr, 서열번호: 26의 대장균 K12 MG1655 유래의 FucP, 서열번호: 32의 대장균 K12 MG1655 유래의 WzxE, 서열번호: 38의 대장균 K12 MG1655 유래의 EmrE, 서열번호: 40의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2331, 서열번호: 42의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2332, 서열번호: 46의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0247, 서열번호: 48의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0245, 서열번호: 50의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0345, 서열번호: 52의 뉴로스포라 크라사 OR74A 유래의 CDT2, 서열번호: 54의 아스페르길루스 오리제 RIB40 유래의 CDT2, 서열번호: 58의 키티노파가 종 CF118 유래의 Wzx, 서열번호: 60의 유박테리움 종 CAG:581 유래의 Wzx, 서열번호: 62의 디아도박터 솔리 (DSM 25329) 유래의 Wzx, 서열번호: 64의 락토코커스 라피노락티스 (ATCC 43920) 유래의 Wzx, 서열번호: 66의 프레보텔라 루미니콜라 (AR32) 유래의 Wzx, 서열번호: 86의 브라키스피라 함프소니이 P280/1 유래의 NAPO, 서열번호: 98의 악티노바쿨룸 수이스 (DSM 20639) 유래의 NAm, 서열번호: 100의 루미노코커스 그나부스 유래의 NAm, 서열번호: 102의 쿠르토박테리움 종 314Chir4.1 유래의 NAm, 서열번호: 104의 니아벨라 드릴라시스 (DSM25811) 유래의 Nap, 서열번호: 106의 사카리크리니스 퍼멘탄스 (DSM 9555) 유래의 Nap, 서열번호: 108의 시트로박터 프레운디이 MGH152 유래의 mdtD, 서열번호: 110의 시트로박터 웨르크마니이 NBRC 105721 유래의 mdtD, 서열번호: 112의 시트로박터 아말로나티쿠스 유래의 mdtD, 서열번호: 114의 클레브시엘라 옥시토카 유래의 mdtD, 서열번호: 116의 에스케리치아 알베르티이 B156 유래의 mdtD, 서열번호: 118의 살모넬라 엔테리카 아종 살라메 유래의 yegB, 서열번호: 120의 클레브시엘라 뉴모니에 30684/NJST258_2 유래의 mdtD, 서열번호: 122의 클레브시엘라 뉴모니에 유래의 Tcr_1_D38215, 서열번호: 124의 슈도시트로박터 페칼리스 유래의 mdtD, 서열번호: 126의 요케넬라 레겐스버게이 (ATCC43003) 유래의 Cmr, 서열번호: 128의 크로노박터 무이트젠시이 유래의 MdfA, 서열번호: 130의 클레브시엘라 옥시토카 유래의 MdfA, 서열번호: 132의 시트로박터 코세리 유래의 MFS, 서열번호: 134의 에스케리치아 마르모테 유래의 MdfA, 서열번호: 136의 시겔라 플렉스네리 유래의 Cmr, 서열번호: 138의 살모넬라 엔테리카 아종 살라메 유래의 MdfA, 서열번호: 140의 시트로박터 윤게 (ATCC 29220) 유래의 Cmr, 서열번호: 142의 시트로박터 프레운디이 유래의 MdfA, 서열번호: 144의 엔테로박터 코베이 유래의 MdfA, 서열번호: 146의 엔테로박터 종 유래의 MdfA, 서열번호: 148의 렐리오티아 종 WB101 유래의 MdfA, 서열번호: 150의 엔테로박터 루드위기이 EcWSU1 유래의 MdfA, 서열번호: 152의 악티노플라네스 우타헨시스 유래의 Sweet-유사 단백질, 서열번호: 154의 키티노파가세에 박테리움 PMG_246 유래의 Sweet-유사 단백질, 서열번호: 156의 리조비움 종 PDC82 유래의 Sweet-유사 단백질, 서열번호: 158의 키네오코커스 리조스파에레 (DSM 19711) 유래의 Sweet-유사 단백질, 서열번호: 160의 모르가넬라 모르가니이 IS15 유래의 Sweet-유사 단백질, 서열번호: 162의 게오데르마토필루스 오브스쿠러스 (균주 ATCC 25078) 유래의 Sweet-유사 단백질, 서열번호: 164의 브라디리조비움 종 BTAi1 유래의 Sweet-유사 단백질, 서열번호: 166의 브라디리조비움 자포니쿰 USDA 110 유래의 Sweet-유사 단백질, 서열번호: 168의 크산토모나스 캄페스트리스 pv. 베시카토리아 균주 85-10 유래의 Sweet-유사 단백질, 서열번호: 170의 헤르바스피릴룸 아쿠아티쿰 유래의 Sweet-유사 단백질, 서열번호: 172의 플라보박테리아 박테리움 MS024-2A 유래의 Sweet-유사 단백질, 서열번호: 182의 시노리조비움 메디케 WSM419 유래의 rnd-유사 단백질, 서열번호: 184의 아조스피릴룸 브라실리엔세 LMG 04375 유래의 아라비노스 유출물, 또는 상기 포터 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 02, 06, 04, 08, 10, 12, 14, 16, 18, 20, 22, 24, 26, 32, 38, 40, 42, 46, 48, 50, 52, 54, 58, 60, 62, 64, 66, 86, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164, 166, 168, 170, 172, 182 또는 184 각각의 상기 MdfA, IceT, YnfM, Yhhs, EmrD, YdhC, YbdA, YdeE, MhpT, YebQ, YjhB, Bcr, FucP, WzxE, EmrE, Wzx, Blon_2331, Blon_2232, Blon_0247, Blon_0245, Blon_0345, NAPO, NAm, Nap, mdtD, YegB, Tcr_1_D38215, cmr, MFS, CDT2, rnd, Sweet-유사 또는 아라비노스 유출물 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질; 및 P-P-결합-가수분해-유도 수송체인 서열번호: 28의 락토코커스 락티스 균주 SRCM103457 유래의 LmrA, 서열번호: 30의 대장균 균주 K12 MG1655 유래의 OppF, 서열번호: 36의 헬리코박터 필로리 (균주 ATCC 700392 / 26695) 유래의 Wzk, 서열번호: 44의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2475, 서열번호: 68 또는 72의 플라보박테리움 스파르탄시이 유래의 LpsE, 서열번호: 70 또는 74의 스포로무사 스파에로이데스 DSM 2875 유래의 LpsE, 서열번호: 76의 칸디다투스 플란크토필라 설포니카 유래의 TolC, 서열번호: 78의 부티리비브리오 훈가테이 XBD2006 유래의 TolC, 서열번호: 80의 로세부리아 인테스티날리스 CAG:13 유래의 MsbA, 서열번호: 82의 페도박터 긴센기솔리 유래의 MsbA, 서열번호: 84의 베루코미크로비아 박테리움 CG1_02_43_26 유래의 MsbA, 서열번호: 174의 리조비움 종 Root149 유래의 Wzm, 서열번호: 176의 아조스피릴룸 브라실리엔세 LMG 04375 유래의 Wzm, 서열번호: 196의 대장균 113303 유래의 Wzm, 서열번호: 178의 리조비움 종 Root149 유래의 Wzt, 서열번호: 180의 아조스피릴룸 브라실리엔세 LMG 04375 유래의 Wzt, 서열번호: 194의 대장균 113303 유래의 Wzt, 서열번호: 188 또는 190의 브라디리조비움 자포니쿰 USDA 110 유래의 Nodj, 서열번호: 206의 대장균 K-12 MG1655 유래의 malE, 서열번호: 208의 대장균 K-12 MG1655 유래의 malK, 서열번호: 214의 대장균 K-12 MG1655 유래의 araF, 서열번호: 216의 대장균 K-12 MG1655 유래의 xylF, 또는 서열번호: 218의 대장균 K-12 MG1655 유래의 ytfQ, 또는 상기 P-P-결합-가수분해-유도 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 28, 30, 36, 44, 68, 72, 70, 74, 76, 78, 80, 82, 84, 174, 176, 196, 178, 180, 194, 188, 190, 206, 208, 214, 216, 또는 218 각각의 상기 LmrA, OppF, Wzk, Blon_2475, LpsE, TolC, MsbA, Wzm, Wzt, Nodj, malE, malK, araF, xylF 또는 ytfQ 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질; 및 β-배럴 포린 막 단백질인 서열번호: 34의 대장균 K12 MG1655 유래의 Wza 또는 서열번호: 204의 대장균 K12 MG1655 유래의 lamB, 또는 상기 Wza 또는 lamB 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 34 또는 204 각각의 상기 Wza 또는 lamB 막 단백질 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 서열; 및 보조 수송 단백질인 서열번호: 88의 서모토가 마리티마 (균주 ATCC 43589 / MSB8 / DSM 3109 / JCM 10099) 유래의 Wzc, 또는 이의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 88의 상기 Wzc 막 단백질에 대해 적어도 80%의 서열 동일성을 갖는 서열; 및 추정 수송 단백질인 서열번호: 56의 헬리코박터 필로리 유래의 사이토크롬 C 생합성 단백질, 서열번호: 90의 클로스트리디움 종 CAG: 1013 유래의 CutC, 서열번호: 92의 오도리박터 스플란크니쿠스 DSM 20712 유래의 CutC, 서열번호: 94의 미추아리아 종 PDC51 유래의 CutC, 서열번호: 96의 프레보텔라 인테르메디아 ATCC 25611 (DSM 20706) 유래의 CutC, 서열번호: 190의 대장균 K12 MG1655 유래의 ybjM, 서열번호: 192의 엔테로박테리아세에 박테리움 ENNIH1 유래의 ybjM, 또는 상기 추정 수송 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 56, 90, 92, 94, 96, 190 또는 192 각각의 상기 CytC, CutC 또는 ybjM 막 단백질 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질; 및 포스포트란스퍼-유도 그룹 전위인자인 서열번호: 210의 대장균 K12 MG1655 유래의 nagE, 서열번호: 212의 대장균 K12 MG1655 유래의 srlB, 또는 상기 nagE 또는 srlB 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 210 또는 212 각각의 상기 nagE 또는 srlB 막 단백질 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 서열로 구성된 막 단백질들의 그룹으로부터 선택되는 단계를 포함하는 것인 방법.
38. 특정 구체예 1 내지 37 중 어느 한 구체예에 있어서, 상기 막 단백질은 세포벽의 외막을 가로질러 화합물의 수송에 관여하는 수송체 단백질인 것인 푸코실락토스를 제조하는 방법.
39. 특정 구체예 1 내지 38 중 어느 한 구체예에 있어서, 상기 방법은 하기 단계들 중 적어도 하나를 추가로 포함하고:
i) 상기 배양 배지에, 초기 반응기 부피 1 리터 (litre)당 락토스를 적어도 50, 더 바람직하게는 적어도 75, 더 바람직하게는 적어도 100, 더 바람직하게는 적어도 120, 더 바람직하게는 적어도 150 그람 (gram)을 포함하는 락토스 공급물을, 바람직하게는 연속 방식 (continuous manner)으로, 바람직하게는 상기 배양 배지의 최종 부피가 상기 락토스 공급물의 부가 전 배양 배지 부피의 3배 이하, 바람직하게는 2배 이하, 더 바람직하게는 2배 미만이 되도록 부가하는 단계;
ii) 락토스 공급물을 연속 방식으로 상기 배양 배지에 1일, 2일, 3일, 4일, 5일에 걸쳐 공급 용액에 의해 부가하는 단계;
iii) 락토스 공급물을 연속 방식으로 배양 배지에 1일, 2일, 3일, 4일, 5일에 걸쳐 공급 용액에 의해 부가하는 단계로서, 상기 락토스 공급 용액의 농도는 50 g/L, 바람직하게는 75 g/L, 더 바람직하게는 100 g/L, 더 바람직하게는 125 g/L, 더 바람직하게는 150 g/L, 더 바람직하게는 175 g/L, 더 바람직하게는 200 g/L, 더 바람직하게는 225 g/L, 더 바람직하게는 250 g/L, 더 바람직하게는 275 g/L, 더 바람직하게는 300 g/L, 더 바람직하게는 325 g/L, 더 바람직하게는 350 g/L, 더 바람직하게는 375 g/L, 더 바람직하게는 400 g/L, 더 바람직하게는 450 g/L, 더 바람직하게는 500 g/L, 더욱 바람직하게는 550 g/L, 가장 바람직하게는 600 g/L이며; 바람직하게는 상기 용액의 pH는 3 내지 7로 설정되고, 바람직하게는 상기 공급 용액의 온도는 20℃ 내지 80℃로 유지되는 것인 단계;
iv) 상기 방법으로 상기 배양 배지의 최종 부피 중에 적어도 50 g/L, 바람직하게는 적어도 75 g/L, 더 바람직하게는 적어도 90 g/L, 더 바람직하게는 적어도 100 g/L, 더 바람직하게는 적어도 125 g/L, 더 바람직하게는 적어도 150 g/L, 더 바람직하게는 적어도 175 g/L, 더 바람직하게는 적어도 200 g/L의 푸코실락토스 농도를 유도하는 것인 푸코실락토스를 제조하는 방법.
40. 특정 구체예 39에 있어서, 상기 락토스 공급은 배양 초기부터 락토스를 적어도 5 mM의 농도, 바람직하게는 30, 40, 50, 60, 70, 80, 90, 100, 150 mM의 농도, 더 바람직하게는 > 300 mM의 농도로 부가함으로써 달성되는 것인 방법.
41. 특정 구체예 39 또는 40에 있어서, 상기 락토스 공급은 배양의 생산 단계 전반에 걸쳐 적어도 5 mM, 바람직하게는 10 mM 또는 30 mM의 락토스 농도가 수득되도록 하는 농도로 락토스를 상기 배양 배지에 부가함으로써 달성되는 것인 방법.
42. 특정 구체예 39, 40 또는 41 중 어느 구체예에 있어서, 상기 숙주 세포는 적어도 약 60, 80, 100, 또는 약 120시간 동안, 또는 연속 방식으로 배양되는 것인 방법.
43. 특정 구체예 39 내지 42 중 어느 한 구체예에 있어서, 탄소 및 에너지 공급원, 바람직하게는 수크로스, 글루코스, 프럭토스, 글리세롤, 말토스, 말토덱스트린, 트레할로스, 폴리올, 전분, 숙시네이트, 말레이트, 피루베이트, 락테이트, 에탄올, 시트레이트, 락토스가 또한 부가되고, 바람직하게는 연속적으로, 바람직하게는 락토스와 함께 상기 배양 배지에 부가되는 것인 방법.
44. 특정 구체예 39 내지 43 중 어느 한 구체예에 있어서, 탄소계 기질, 바람직하게는 글루코스 또는 수크로스를 상기 배양 배지에 부가함으로써 제1 지수적 세포 성장 단계가 제공되고, 그 후에 제2 단계에서 락토스가 상기 배양 배지에 부가되는 것인 방법.
45. 특정 구체예 1 내지 44 중 어느 한 구체예에 있어서, 상기 방법이 푸코실락토스의 혼합물을 생성하는 것인 방법.
46. 특정 구체예 1 내지 45 중 어느 한 구체예에 있어서, 상기 푸코실락토스는 2'-푸코실락토스, 3-푸코실락토스 및/또는 디푸코실락토스인 것인 방법.
47. 특정 구체예 1 내지 46 중 어느 한 구체예에 있어서, 상기 유전자 변형 세포는 미생물, 식물 또는 동물 세포로 구성된 그룹으로부터 선택되고, 바람직하게는 상기 미생물은 박테리아, 진균 또는 효모이며, 바람직하게는 상기 식물은 벼, 목화, 유채, 대두, 옥수수 또는 옥수수 식물이고, 바람직하게는 상기 동물은 곤충, 어류, 조류 또는 비-인간 포유동물인 것인 방법.
48. 특정 구체예 47에 있어서, 상기 세포는 대장균 세포인 것인 방법.
49. 푸코실락토스 생성을 위해 유전자 변형된 숙주 세포로서, 상기 숙주 세포는 GDP-푸코스 공여체로부터의 푸코스 잔기를 락토스 수용체에 전달하여 푸코실락토스를 합성하는 푸코실트란스퍼라제를 코딩하는 핵산 서열을 적어도 1개 포함하고, - 상기 세포는 i) 푸코실락토스 수송을 가능하게 하고/하거나 이를 향상시킬 수 있는 내인성 막 단백질의 변형된 발현, 및/또는 ii) 푸코실락토스 수송을 가능하게 하고/하거나 이를 향상시킬 수 있는 이종 막 단백질의 발현을 추가로 포함하고, 상기 막 단백질은 i) 2019년 7월 4일자로 공개된 InterPro 75.0에 정의되는, interpro 번호 IPR001503 및 IPR002516을 각각 사용하여 GT10 및 GT11 푸코실트란스퍼라제 패밀리의 게놈 인근을 검색하여 발견된 PFAM 도메인들 중 어느 하나를 포함하는 막 단백질들의 그룹으로부터 선택되며, 여기서 상기 게놈 인근 윈도우 크기는 각 푸코실트란스퍼라제 앞에 14개의 유전자 및 뒤에 14개의 유전자이고, 상기 막 단백질은 SET 패밀리에 속하지 않으며, 또는 ii) 서열번호: 204, 206, 208, 210, 212, 214, 216, 218을 포함하는 막 단백질들, 또는 서열번호: 204, 206, 208, 210, 212, 214, 216, 218을 포함하는 막 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 204, 206, 208, 210, 212, 214, 216, 218의 상기 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 서열의 그룹으로부터 선택되는 것인 푸코실락토스 생성을 위해 유전자 변형된 숙주 세포.
50. 특정 구체예 49에 있어서, 상기 막 단백질
a) 포터;
b) P-P-결합-가수분해-유도 수송체;
c) β-배럴 포린;
d) 보조 수송 단백질;
e) 추정 수송 단백질; 및
f) 포스포트란스퍼-유도 그룹 전위인자의 그룹으로부터 선택되는 것인 숙주 세포.
51. 푸코실락토스 생성을 위해 유전자 변형된 숙주 세포로서, 상기 숙주 세포는 GDP-푸코스 공여체로부터의 푸코스 잔기를 락토스 수용체에 전달하여 푸코실락토스를 합성하는 푸코실트란스퍼라제를 코딩하는 핵산 서열을 적어도 1개 포함하고,
- 상기 세포는 i) 푸코실락토스 수송을 가능하게 하고/하거나 이를 향상시킬 수 있는 내인성 막 단백질의 변형된 발현, 및/또는 ii) 푸코실락토스 수송을 가능하게 하고/하거나 이를 향상시킬 수 있는 이종 막 단백질의 발현을 추가로 포함하고, 상기 막 단백질은
a) 포터, 여기서 상기 막 단백질은 SET 패밀리에 속하지 않음;
b) P-P-결합-가수분해-유도 수송체;
c) β-배럴 포린;
d) 보조 수송 단백질;
e) 추정 수송 단백질; 및
f) 포스포트란스퍼-유도 그룹 전위인자의 그룹으로부터 선택되는 것인 푸코실락토스 생성을 위해 유전자 변형된 숙주 세포.
52. 특정 구체예 50 또는 51에 있어서, 상기 막 단백질은 특정 구체예 4 내지 38 중 어느 한 구체예에 정의된 막 단백질들의 그룹으로부터 선택되는 것인 숙주 세포.
53. 특정 구체예 50 또는 51에 있어서, 상기 포터 막 단백질은 서열번호: 02의 대장균 K12 MG1655 유래의 MdfA, 서열번호: 06의 대장균 K12 MG1655 유래의 IceT, 서열번호: 04의 대장균 K12 MG1655 유래의 YnfM, 서열번호: 08의 대장균 K12 MG1655 유래의 Yhhs, 서열번호: 10의 대장균 K12 MG1655 유래의 EmrD, 서열번호: 12의 대장균 K12 MG1655 유래의 YdhC, 서열번호: 14의 대장균 K12 MG1655 유래의 YbdA, 서열번호: 16의 대장균 K12 MG1655 유래의 YdeE, 서열번호: 18의 대장균 K12 MG1655 유래의 MhpT, 서열번호: 20의 대장균 K12 MG1655 유래의 YebQ, 서열번호: 22의 대장균 K12 MG1655 유래의 YjhB, 서열번호: 24의 대장균 K12 MG1655 유래의 Bcr, 서열번호: 26의 대장균 K12 MG1655 유래의 FucP, 서열번호: 32의 대장균 K12 MG1655 유래의 WzxE, 서열번호: 38의 대장균 K12 MG1655 유래의 EmrE, 서열번호: 40의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2331, 서열번호: 42의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2332, 서열번호: 46의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0247, 서열번호: 48의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0245, 서열번호: 50의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0345, 서열번호: 52의 뉴로스포라 크라사 OR74A 유래의 CDT2, 서열번호: 54의 아스페르길루스 오리제 RIB40 유래의 CDT2, 서열번호: 58의 키티노파가 종 CF118 유래의 Wzx, 서열번호: 60의 유박테리움 종 CAG:581 유래의 Wzx, 서열번호: 62의 디아도박터 솔리 (DSM 25329) 유래의 Wzx, 서열번호: 64의 락토코커스 라피노락티스 (ATCC 43920) 유래의 Wzx, 서열번호: 66의 프레보텔라 루미니콜라 (AR32) 유래의 Wzx, 서열번호: 86의 브라키스피라 함프소니이 P280/1 유래의 NAPO, 서열번호: 98의 악티노바쿨룸 수이스 (DSM 20639) 유래의 NAm, 서열번호: 100의 루미노코커스 그나부스 유래의 NAm, 서열번호: 102의 쿠르토박테리움 종 314Chir4.1 유래의 NAm, 서열번호: 104의 니아벨라 드릴라시스 (DSM25811) 유래의 Nap, 서열번호: 106의 사카리크리니스 퍼멘탄스 (DSM 9555) 유래의 Nap, 서열번호: 108의 시트로박터 프레운디이 MGH152 유래의 mdtD, 서열번호: 110의 시트로박터 웨르크마니이 NBRC 105721 유래의 mdtD, 서열번호: 112의 시트로박터 아말로나티쿠스 유래의 mdtD, 서열번호: 114의 클레브시엘라 옥시토카 유래의 mdtD, 서열번호: 116의 에스케리치아 알베르티이 B156 유래의 mdtD, 서열번호: 118의 살모넬라 엔테리카 아종 살라메 유래의 yegB, 서열번호: 120의 클레브시엘라 뉴모니에 30684/NJST258_2 유래의 mdtD, 서열번호: 122의 클레브시엘라 뉴모니에 유래의 Tcr_1_D38215, 서열번호: 124의 슈도시트로박터 페칼리스 유래의 mdtD, 서열번호: 126의 요케넬라 레겐스버게이 (ATCC43003) 유래의 Cmr, 서열번호: 128의 크로노박터 무이트젠시이 유래의 MdfA, 서열번호: 130의 클레브시엘라 옥시토카 유래의 MdfA, 서열번호: 132의 시트로박터 코세리 유래의 MFS, 서열번호: 134의 에스케리치아 마르모테 유래의 MdfA, 서열번호: 136의 시겔라 플렉스네리 유래의 Cmr, 서열번호: 138의 살모넬라 엔테리카 아종 살라메 유래의 MdfA, 서열번호: 140의 시트로박터 윤게 (ATCC 29220) 유래의 Cmr, 서열번호: 142의 시트로박터 프레운디이 유래의 MdfA, 서열번호: 144의 엔테로박터 코베이 유래의 MdfA, 서열번호: 146의 엔테로박터 종 유래의 MdfA, 서열번호: 148의 렐리오티아 종 WB101 유래의 MdfA, 서열번호: 150의 엔테로박터 루드위기이 EcWSU1 유래의 MdfA, 서열번호: 152의 악티노플라네스 우타헨시스 유래의 Sweet-유사 단백질, 서열번호: 154의 키티노파가세에 박테리움 PMG_246 유래의 Sweet-유사 단백질, 서열번호: 156의 리조비움 종 PDC82 유래의 Sweet-유사 단백질, 서열번호: 158의 키네오코커스 리조스파에레 (DSM 19711) 유래의 Sweet-유사 단백질, 서열번호: 160의 모르가넬라 모르가니이 IS15 유래의 Sweet-유사 단백질, 서열번호: 162의 게오데르마토필루스 오브스쿠러스 (균주 ATCC 25078) 유래의 Sweet-유사 단백질, 서열번호: 164의 브라디리조비움 종 BTAi1 유래의 Sweet-유사 단백질, 서열번호: 166의 브라디리조비움 자포니쿰 USDA 110 유래의 Sweet-유사 단백질, 서열번호: 168의 크산토모나스 캄페스트리스 pv. 베시카토리아 균주 85-10 유래의 Sweet-유사 단백질, 서열번호: 170의 헤르바스피릴룸 아쿠아티쿰 유래의 Sweet-유사 단백질, 서열번호: 172의 플라보박테리아 박테리움 MS024-2A 유래의 Sweet-유사 단백질, 서열번호: 182의 시노리조비움 메디케 WSM419 유래의 rnd-유사 단백질, 서열번호: 184의 아조스피릴룸 브라실리엔세 LMG 04375 유래의 아라비노스 유출물, 또는 상기 포터 막 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 02, 06, 04, 08, 10, 12, 14, 16, 18, 20, 22, 24, 26, 32, 38, 40, 42, 46, 48, 50, 52, 54, 58, 60, 62, 64, 66, 86, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164, 166, 168, 170, 172, 182 또는 184 각각의 상기 MdfA, IceT, YnfM, Yhhs, EmrD, YdhC, YbdA, YdeE, MhpT, YebQ, YjhB, Bcr, FucP, WzxE, EmrE, Wzx, Blon_2331, Blon_2232, Blon_0247, Blon_0245, Blon_0345, NAPO, NAm, Nap, mdtD, YegB, Tcr_1_D38215, cmr, MFS, CDT2, rnd, Sweet-유사 또는 아라비노스 유출물 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질로부터 선택되는 것인 푸코실락토스 생성을 위해 유전자 변형된 숙주 세포.
54. 특정 구체예 50 또는 51에 있어서, 상기 P-P-결합-가수분해-유도 수송체는 서열번호: 28의 락토코커스 락티스 균주 SRCM103457 유래의 LmrA, 서열번호: 30의 대장균 균주 K12 MG1655 유래의 OppF, 서열번호: 36의 헬리코박터 필로리 (균주 ATCC 700392 / 26695) 유래의 Wzk, 서열번호: 44의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2475, 서열번호: 68 또는 72의 플라보박테리움 스파르탄시이 유래의 LpsE, 서열번호: 70 또는 74의 스포로무사 스파에로이데스 DSM 2875 유래의 LpsE, 서열번호: 76의 칸디다투스 플란크토필라 설포니카 유래의 TolC, 서열번호: 78의 부티리비브리오 훈가테이 XBD2006 유래의 TolC, 서열번호: 80의 로세부리아 인테스티날리스 CAG:13 유래의 MsbA, 서열번호: 82의 페도박터 긴센기솔리 유래의 MsbA, 서열번호: 84의 베루코미크로비아 박테리움 CG1_02_43_26 유래의 MsbA, 서열번호: 174의 리조비움 종 Root149 유래의 Wzm, 서열번호: 176의 아조스피릴룸 브라실리엔세 LMG 04375 유래의 Wzm, 서열번호: 196의 대장균 113303 유래의 Wzm, 서열번호: 178의 리조비움 종 Root149 유래의 Wzt, 서열번호: 180의 아조스피릴룸 브라실리엔세 LMG 04375 유래의 Wzt, 서열번호: 194의 대장균 113303 유래의 Wzt, 서열번호: 188 또는 190의 브라디리조비움 자포니쿰 USDA 110 유래의 Nodj, 서열번호: 206의 대장균 K-12 MG1655 유래의 malE, 서열번호: 208의 대장균 K-12 MG1655 유래의 malK, 서열번호: 214의 대장균 K-12 MG1655 유래의 araF, 서열번호: 216의 대장균 K-12 MG1655 유래의 xylF, 또는 서열번호: 218의 대장균 K-12 MG1655 유래의 ytfQ, 또는 상기 P-P-결합-가수분해-유도 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 28, 30, 36, 44, 68, 72, 70, 74, 76, 78, 80, 82, 84, 174, 176, 196, 178, 180, 194, 188, 190, 206, 208, 214, 216, 또는 218 각각의 상기 LmrA, OppF, Wzk, Blon_2475, LpsE, TolC, MsbA, Wzm, Wzt, Nodj, malE, malK, araF, xylF 또는 ytfQ 막 단백질 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질로부터 선택되는 것인 숙주 세포.
55. 특정 구체예 50 또는 51에 있어서, 상기 추정 수송 단백질은 서열번호: 56의 헬리코박터 필로리 유래의 사이토크롬 C 생합성 단백질, 서열번호: 90의 클로스트리디움 종 CAG: 1013 유래의 CutC, 서열번호: 92의 오도리박터 스플란크니쿠스 DSM 20712 유래의 CutC, 서열번호: 94의 미추아리아 종 PDC51 유래의 CutC, 서열번호: 96의 프레보텔라 인테르메디아 ATCC 25611 (DSM 20706) 유래의 CutC, 서열번호: 190의 대장균 K12 MG1655 유래의 ybjM, 서열번호: 192의 엔테로박테리아세에 박테리움 ENNIH1 유래의 ybjM, 또는 상기 추정 수송 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 56, 90, 92, 94, 96, 190 또는 192 각각의 상기 CytC, CutC 또는 ybjM 막 단백질 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질로부터 선택되는 것인 숙주 세포.
56. 특정 구체예 50 또는 51에 있어서, 상기 β-배럴 포린은 서열번호: 34의 대장균 K12 MG1655 유래의 Wza 또는 서열번호: 204의 대장균 K12 MG1655 유래의 lamB, 또는 상기 Wza 또는 lamB 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 34 또는 204 각각의 상기 Wza 또는 lamB 막 단백질 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 서열로부터 선택되는 것인 숙주 세포.
57. 특정 구체예 50 또는 51에 있어서, 상기 보조 수송 단백질은 서열번호: 88의 서모토가 마리티마 (균주 ATCC 43589 / MSB8 / DSM 3109 / JCM 10099) 유래의 Wzc, 또는 이의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 88의 상기 Wzc 막 단백질에 대해 적어도 80%의 서열 동일성을 갖는 서열로부터 선택되는 것인 숙주 세포.
58. 특정 구체예 50 또는 51에 있어서, 상기 포스포트란스퍼-유도 그룹 전위인자는 서열번호: 210의 대장균 K12 MG1655 유래의 nagE 또는 서열번호: 212의 대장균 K12 MG1655 유래의 srlB, 또는 상기 nagE 또는 srlB 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 210 또는 212 각각의 상기 nagE 또는 srlB 막 단백질 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 서열로부터 선택되는 것인 숙주 세포.
59. 특정 구체예 49 내지 58 중 어느 한 구체예에 있어서, 상기 막 단백질은 세포벽의 외막을 가로질러 화합물의 수송에 관여하는 수송체 단백질인 것인 세포.
60. 특정 구체예 49 내지 59 중 어느 한 구체예에 있어서, 상기 세포가 배지에서 안정하게 배양되는 것인 세포.
61. 특정 구체예 49 내지 60 중 어느 한 구체예에 있어서, 상기 세포는 미생물, 식물 또는 동물 세포로 구성된 그룹으로부터 선택되고, 바람직하게는 상기 미생물은 박테리아, 진균 또는 효모이며, 바람직하게는 상기 식물은 벼, 목화, 유채, 대두, 옥수수 또는 옥수수 식물이고, 바람직하게는 상기 동물은 곤충, 어류, 조류 또는 비-인간 포유동물인 것인 세포.
62. 특정 구체예 61에 있어서, 상기 세포는 대장균 세포인 것인 숙주 세포.
63. 특정 구체예 49 내지 62 중 어느 한 구체예에 있어서, 상기 세포는 푸코실락토스 합성에 관여하고/하거나 이의 합성에 필요한, 적어도 부분적으로 불활성화된, 모노사카라이드, 디사카라이드 또는 올리고사카라이드인, 선택된 모노사카라이드, 디사카라이드 또는 올리고사카라이드에 대한 이화 경로를 포함하는 것인 세포.
64. 특정 구체예 49 내지 63 중 어느 한 구체예에 있어서, 상기 푸코실락토스는 2'-푸코실락토스, 3-푸코실락토스 또는 디푸코실락토스인 것인 세포.
65. 푸코실락토스를 제조하는 방법으로서,
a) 특정 구체예 49 내지 64 중 어느 한 구체예에 따른 세포를 제공하는 단계,
b) 상기 푸코실락토스의 생성을 허용하는 조건 하에 배지에서 상기 세포를 배양하는 단계,
c) 상기 푸코실락토스를 배양으로부터 분리하는 단계를 포함하는 것인 방법.
66. 푸코실락토스의 발효 생성에서 푸코실락토스 수송을 위한, 특정 구체예 1 내지 38 중 어느 한 구체예에 정의된 막 단백질들의 그룹으로부터 선택된 막 단백질의 용도.
67. 푸코실락토스의 제조를 위한, 특정 구체예 49 내지 64 중 어느 한 구체예에 따른 세포의 용도.
68. 특정 구체예 67에 있어서, 상기 푸코실락토스는 2'-푸코실락토스, 3-푸코실락토스 또는 디푸코실락토스인 것인 세포의 용도.
하기 도면 및 실시예는 본 발명의 추가 예시 및 설명을 제공할 것이며, 제한하려는 의도는 아니다.
도 1: TU2에서 서열번호: 58 내지 서열번호: 96 (서열번호: 90 제외), TU3에서 서열번호: 90 또는 TU10에서 서열번호: 02 내지 서열번호: 44의 막 단백질을 발현하고 α1,3-푸코실트란스퍼라제를 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 CPI. 서열번호: 04 내지 서열번호: 34의 막 단백질을 가진 균주는 FT1로부터 3-FL을 생성하는 반면에, 서열번호: 02 및 서열번호: 40 내지 서열번호: 96의 막 단백질들을 가진 균주는 FT2로부터 3-FL을 생성한다. 상기 CPI 데이터는 전체 배양액 샘플 중 3-FL 측정값을 나타낸다. 상기 성장 실험은 3-FL의 전구체로서 20 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 2: TU2에서 서열번호: 58 내지 서열번호: 104 (서열번호: 90 제외), TU3에서 서열번호: 90 또는 TU10에서 서열번호: 02 내지 서열번호: 34의 막 단백질을 발현하고 α1,3-푸코실트란스퍼라제를 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 3-FL 외수송 비율 (export ratio). 서열번호: 08 내지 서열번호: 30의 막 단백질을 가진 균주는 FT1로부터 3-FL을 생성하는 반면에, 서열번호: 58 내지 서열번호: 104의 막 단백질을 가진 균주는 FT2로부터 3-FL을 생성한다. 서열번호: 2의 막 단백질을 가진 균주는 FT1 또는 FT2와 조합하여 테스트되었다. 상기 성장 실험은 3-FL의 전구체로서 20 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 3: TU10에서 서열번호: 08, 14, 18 또는 22의 막 단백질을 발현하고 α1,3-푸코실 트란스퍼라제 FT1을 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 성장 속도. 상기 성장 실험은 3-FL의 전구체로서 20 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 4: TU10에서 서열번호: 28의 막 단백질을 발현하고 α1,3-푸코실 트란스퍼라제 FT1을 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 3-FL 외수송 비율. 상기 성장 실험은 3-FL의 전구체로서 45 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 5: TU10에서 서열번호: 28의 막 단백질을 발현하고 α1,3-푸코실 트란스퍼라제 FT1을 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 CPI. 상기 CPI 데이터는 전체 배양액 샘플 중 3-FL 측정값을 나타낸다. 상기 성장 실험은 3-FL의 전구체로서 90 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 6: TU10에서 서열번호: 10 또는 16의 막 단백질을 발현하고 α1,3-푸코실트란스퍼라제 FT1을 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 3-FL 외수송 비율. 상기 성장 실험은 3-FL의 전구체로서 90 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 7: TU10에서 서열번호: 10, 16 또는 28의 막 단백질을 발현하고 α1,3-푸코실 트란스퍼라제 FT1을 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 CPI. 상기 성장 실험은 3-FL의 전구체로서 100 g/L 수크로스 및 90 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 8: TU10에서 서열번호: 28의 막 단백질을 발현하고 α1,3-푸코실 트란스퍼라제 FT1을 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 성장 속도. 상기 성장 실험은 3-FL의 전구체로서 100 g/L 수크로스 및 90 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 9: TU10에서 서열번호: 22의 막 단백질을 발현하고 α1,3-푸코실 트란스퍼라제 FT1을 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 CPI. 상기 성장 실험은 3-FL의 전구체로서 5 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 10: 숙주 게놈 유래의 TU10에서 서열번호: 02 또는 28의 막 단백질을 발현하고 플라스미드 유래의 α1,3-푸코실 트란스퍼라제인 FT1 또는 FT2를 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 CPI. 이에 의해, 서열번호: 01을 갖는 유전자는 EcLdhA 유전자좌에 통합되었고, 서열번호: 27을 갖는 유전자는 EcSetA 유전자좌에 통합되었다. 상기 성장 실험은 3-FL의 전구체로서 20 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 11: 숙주 게놈 유래의 TU10에서 서열번호: 02 또는 28의 막 단백질을 발현하고 플라스미드 유래의 α1,3-푸코실 트란스퍼라제 FT2를 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 3-FL 외수송 비율. 이에 의해, 서열번호: 01을 갖는 유전자는 EcLdhA 유전자좌에 통합되었고, 서열번호: 27을 갖는 유전자는 EcSetA 유전자좌에 통합되었다. 상기 성장 실험은 3-FL의 전구체로서 20 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 12: 플라스미드 유래의 상이한 전사 유닛 (transcriptional units: TU)의 서열번호: 02, 06, 10, 16, 22, 28, 32, 34, 36, 38, 40, 42, 44 또는 50의 막 단백질을 발현하고, 플라스미드 유래의 α1,3-푸코실 트란스퍼라제 FT2를 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 CPI. 상기 성장 실험은 3-FL의 전구체로서 20 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 13: 플라스미드 유래의 상이한 전사 유닛 (TU)의 서열번호: 02, 06, 10, 16, 22, 28, 32, 34, 36, 38, 40, 42, 44 또는 50의 막 단백질을 발현하고, 플라스미드 유래의 α1,3-푸코실 트란스퍼라제 FT2를 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 3-FL 외수송 비율. 상기 성장 실험은 3-FL의 전구체로서 20 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 14: TU10에서 단일 유전자로 클로닝되거나 또는 이의 네이티브 전사 오페론 구조 함유 2개의 막 단백질 유전자에 클로닝되어 플라스미드에 제시되는, 서열번호 40, 42, 46 또는 48의 막 단백질을 발현하고, 플라스미드 유래의 α1,3-푸코실 트란스퍼라제 FT2를 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 CPI (좌측 패널) 및 3-FL 외수송 비율 (우측 패널). 상기 성장 실험은 3-FL의 전구체로서 20 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 15: 숙주 게놈에서 EcSetA 유전자좌 (서열번호: 28의 막 단백질의 경우) 또는 EcLdhA 유전자좌 (서열번호: 02 및 06의 막 단백질의 경우)에 통합되는, TU10에서 서열번호: 02, 06 또는 28의 막 단백질을 발현하고, 플라스미드 유래의 α1,2-푸코실 트란스퍼라제 FT3을 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 2'FL이 생성된 숙주의 CPI (패널 A) 또는 DiFL이 생성된 숙주의 CPI (패널 B) 및 DiFL 외수송 비율 (패널 C). 상기 성장 실험은 2'-FL 및 DiFL의 전구체로서 20 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 16: 게놈 유래의 서열번호: 02의 막 단백질 및 플라스미드 유래의 α1,3-푸코실 트란스퍼라제 FT2를 과발현하는 3-FL 대장균 생산 숙주를 사용하여 수행된 8개의 독립적인 발효 실행에서 측정된 회분식 (batch) 및 유가식 (fed-batch) 단계에서 향상된 생산성 파라미터. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다. 참조 발효는 막 단백질 유전자의 과발현 카세트가 결여된 동일한 균주로 수행되었다. 발효는 실시예 3에 기재된 바와 같이 수행되었다. CPI, 세포 성능 지수 (g 3-FL/g 바이오매스); br, 전체 배양액; sn, 상등액; Qp, 비생산성 (g 3-FL/g 바이오매스/h); Qs, 비생산성 (g 수크로스/g 바이오매스/h); Ys, 수크로스에 대한 수율 (g 3-FL/g 수크로스); Yx, 바이오매스 수율 (g 바이오매스/g 수크로스); 속도, 생성율 (g 3-FL / L / h); lac_rate, 락토스 전환율 (g 락토스 소비량/h).
도 17: 제1 플라스미드 유래의 서열번호: 06의 막 단백질 및 제2 플라스미드 유래의 α1,3-푸코실 트란스퍼라제 FT2를 과발현하는 3-FL 대장균 생산 숙주를 사용하여 수행된 발효 실행에서 측정된 회분식 및 유가식 단계에서 향상된 생산성 파라미터. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다. 특정 참조 발효는 막 단백질 유전자가 결여된 동일한 균주로 수행되었다. 발효는 실시예 3에 기재된 바와 같이 수행되었다. CPI, 세포 성능 지수 (g 3-FL/g 바이오매스); br, 전체 배양액; sn, 상등액; Ys, 수크로스에 대한 수율 (g 3-FL/g 수크로스); Yx, 바이오매스 수율 (g 바이오매스/g 수크로스).
도 18: 서열번호: 02, 06, 120, 126, 128, 140, 146 또는 150의 막 단백질을 발현하고 플라스미드 유래의 α1,3-푸코실 트란스퍼라제 FT1 (서열번호: 02 및 서열번호: 06의 막 단백질의 경우) 또는 FT2 (다른 막 단백질의 경우)를 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 CPI. 서열번호: 02 및 서열번호: 06의 막 단백질은 TU10에 클로닝되었다. 서열번호: 126의 막 단백질은 TU2에 클로닝되었다. 서열번호: 120, 140 및 150의 막 단백질은 TU3에 클로닝되었다. 서열번호: 128 및 서열번호: 146의 막 단백질은 TU2 (버젼 v1) 또는 TU3 (버젼 v2)에 클로닝되었다. 상기 CPI 데이터는 전체 배양액 샘플 중 3-FL 측정값을 나타낸다. 상기 성장 실험은 3-FL의 전구체로서 20 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 19: TU2에 클로닝된 서열번호: 126 및 서열번호: 128 (버젼 v1), TU3에 클로닝된 서열번호: 128 (버젼 2) 및 TU10에 클로닝된 서열번호: 02의 막 단백질을 발현하고 플라스미드 유래의 α1,3-푸코실 트란스퍼라제 FT1 (서열번호: 02의 막 단백질을 가진 균주의 경우) 또는 FT2 (서열번호: 126 및 128의 막 단백질을 가진 균주의 경우)를 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 3-FL 외수송 비율. 상기 성장 실험은 3-FL의 전구체로서 20 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 20: TU3에서 서열번호: 120 및 140의 막 단백질을 발현하고 플라스미드 유래의 α1,3-푸코실 트란스퍼라제 FT2를 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 성장 속도. 상기 성장 실험은 3-FL의 전구체로서 20 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 21: EcMdfA와 관련된 실시예 20의 MATGAT 표.
도 22: EcIceT와 관련된 실시예 20의 MATGAT 표.
도 23: TU1에 클로닝된 서열번호: 54, TU2에 클로닝된 서열번호: 62, 66, 70, 76, 84, 92, 96, 104, TU3에 클로닝된 서열번호: 58, 64, 72, 74, 94, TU11에 클로닝된 서열번호: 184, 204, 208, TU12에 클로닝된 서열번호: 52, 56, 60, 80, 82, 88, 90, 98의 막 단백질을 발현하고 α1,3-푸코실트란스퍼라제 FT2를 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 CPI. 상기 CPI 데이터는 전체 배양액 샘플 중 3-FL 측정값을 나타낸다. 상기 성장 실험은 3-FL의 전구체로서 20 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 24: TU11에 클로닝된 서열번호: 204 또는 214의 막 단백질을 발현하고 α1,2-푸코실트란스퍼라제 FT4를 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 CPI. 상기 CPI 데이터는 전체 배양액 샘플 중 2'-FL 측정값을 나타낸다. 상기 성장 실험은 2'-FL의 전구체로서 20 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 25: TU11에 클로닝된 서열번호: 206, 208, 214, 216, 218의 막 단백질을 발현하고 α1,2-푸코실트란스퍼라제 FT4를 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 2'-FL 외수송 비율. 상기 성장 실험은 2'-FL의 전구체로서 20 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
실시예
실시예 1: 막 단백질 패밀리의 확인
HMM은 프로파일 히든 Markov 모델 (profile hidden Markov model)이라고 하는 확률 모델이다. 이는 정렬된 단백질 세트를 위치-특이적 스코어링 시스템으로 특성화한다. 아미노산은 발생 빈도에 따라 서열 정렬의 각 위치에 스코어가 부여된다 (Eddy, S.R.1998. Profile hidden Markov models. Bioinformatics. 14: 755-63). HMM은 Pfam, InterPro, SMART, TIGRFAM, PIRSF, PANTHER, SFLD, Superfamily 및 Gene3D를 포함하여, 이러한 단백질 분류 방법을 사용하는 수많은 데이터베이스로부터 알 수 있는 바와 같이, 광범위한 유용성을 가지고 있다.
2019년 6월 13일자로 공개된 HMMER 패키지 3.2.1 (http://hmmer.org/)의 HMMsearch는 이러한 HMM을 사용하여 서열 상동체에 대한 서열 데이터베이스를 검색할 수 있다. 사용될 수 있는 서열 데이터베이스는 예를 들어 NCBI nr Protein Database (NR; https://www.ncbi.nlm.nih.gov/protein), UniProt Knowledgebase (UniProtKB, https://www.uniprot.org/help/uniprotkb) 및 SWISS-PROT database (https://web.expasy.org/docs/swiss-prot_guideline.html)가 있으며 이에 한정되지 않는다.
막 단백질 패밀리는 2017년 11월 3일자로 공개된 eggNOG 데이터베이스 1.0.2 (https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6324079/; http://eggnog.embl.de/#/app/home), 2019년 6월 17일자로 공개된 TCDB 데이터베이스 (http://www.tcdb.org/public/tcdb), 2019년 7월 4일자로 공개된 InterPro 75.0 (https://www.ebi.ac.uk/interpro/) 및 2018년 9월 공개된 Pfam 32.0을 사용하는 PFAM 도메인 (https://pfam.xfam.org/)에 기반하여 분류되었다. 상기 eggNOG 데이터베이스는 오르톨로지 관계, 유전자 진화 이력 및 기능 주석을 갖는 공개 데이터베이스이다. TCDB (Transporter Classification DataBase)는 효소 분류를 위한 EC (Enzyme Commission) 시스템과 유사하며, 기능 및 계통 발생 정보를 모두 포함한다. Pfam 및 InterPro 데이터베이스는 단백질 패밀리의 대규모 컬렉션이다. 다른 단백질 도메인 예컨대 SMART (http://smart.embl-heidelberg.de/), TIGRFAM (https://www.jcvi.org/tigrfams), PIRSF (https://proteininformationresource.org/pirwww/dbinfo/pirsf.shtml), PANTHER (http://pantherdb.org/), SFLD (http://sfld.rbvi.ucsf.edu/archive/django/index.html), Superfamily (http://supfam.org/) 및 Gene3D (http://gene3d.biochem.ucl.ac.uk/Gene3D/), NCBI Conserved Domains (https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)가 또한 사용될 수 있다.
eggNOG 패밀리의 확인은 2017년 11월 3일자로 공개된 eggnogdb 1.0.2를 기반으로 하는 eggNOG-mapper의 독립 버젼 (https://github.com/eggnogdb/eggnog-mapper)을 사용하여 수행하였다. 각 eggNOG 패밀리에 대해, HMM은 eggNOG 웹사이트에서 다운로드할 수 있으며, 단백질 데이터베이스에 대한 HMMsearch에 사용할 수 있다.
TCDB 패밀리의 확인은 2019년 6월 17일자로 공개된 TCDB 데이터베이스에 블라스팅 (blastp)하여 수행하였다. 수득한 패밀리의 새로운 멤버는 웹사이트 (http://www.tcdb.org/download.php)에서 검색할 수 있다. Fasta 파일은 단백질 데이터베이스에 대한 blastp에서 입력으로 사용될 수 있다.
PFAM 도메인의 확인은 2018년 9월에 공개된 https://pfam.xfam.org/search#tabview=tab1에서 온라인 검색을 통해 수행하였다. 수득한 패밀리에 대한 HMM은 'Curation & model'에서 다운로드하였다. 이 모델을 사용하여 단백질 데이터베이스에 대한 HMMsearches는 새로운 패밀리 멤버를 확인할 것이다. InterPro 히트 (hit)를 포함하는 서열은 PFAM 웹사이트로부터 다운로드할 수 있다.
InterPro (super)패밀리, 도메인 및 사이트의 확인은 https://www.ebi.ac.uk/interpro/ 또는 InterProScan의 독립 버젼 (https://www.ebi.ac.uk/interpro/download.html)의 온라인 툴을 사용하여 수행하였고, 이들은 모두 2019년 7월 4일자로 공개된 InterPro 75.0을 기반으로 한다. InterPro는 단백질 모티프 및 도메인의 많은 데이터베이스의 정보를 조합한 복합 데이터베이스이다. InterPro 도메인 및/또는 (수퍼)패밀리의 HMM은 InterProScan으로부터 수득할 수 있고, 단백질 데이터베이스에서 새로운 패밀리 멤버를 확인하는데 사용할 수 있다. InterPro 히트를 포함하는 서열은 또한 InterPro 웹사이트 ('Protein Matched')로부터 다운로드하거나, 또는 UniProt 웹사이트 (https://www.uniprot.org)에서 쿼리를 수행할 수 있다.
실시예 2: 본 발명의 방법에 유용한 막 단백질 또는 단백질 서열의 확인
실시예 1에 예시된 바와 같이, 푸코실트란스퍼라제 인근에서 발견되는 막 단백질의 PFAM 도메인을 확인하고, 확인된 PFAM 도메인들 중 어느 하나를 갖는 막 단백질을 선택함으로써, 막 단백질 또는 단백질 서열의 제1 세트를 발견하였다. 푸코실트란스퍼라제 패밀리 IPR001053 (GT10) 및 IPR002516 (GT11)에 속하는 단백질 식별자는 2019년 7월 4일자로 공개된 InterPro 75.0에 의해 정의되는, UniProtKB/trembl로부터 추출되었다. 이러한 식별자는 2019년 6월 19일자로 공개된 게놈 인근 툴 (genome neighborhood tool) https://efi.igb.illinois.edu/efi-gnt/에서 입력으로 사용되었다. EFI-GNT (EFI Genome Neighborhood Tool)를 사용하여 게놈 인근을 탐색할 수 있으며, 단백질 패밀리 및 슈퍼패밀리를 게놈 컨텍스트에 배치하는데 중점을 두었다. SSN (sequence similarity network)이 입력으로 사용된다. SSN내 각 서열은 이의 게놈 인근의 질의에 대한 쿼리로 사용된다. EFI-GNT는 기능 배정을 용이하게 하기 위해 SSN 클러스터에서 서열에 대한 게놈 인근 탐색을 가능하게 한다.
인근 윈도우 크기 (neighborhood window size) 14가 선택되었다. 인근 유전자는 PFAM 도메인에 기반하여 분류되었다. 하기 PFAM 도메인을 가진 막 단백질은 GT10 (IPR001503) 및 GT11 (IPR002516) 푸코실트란스퍼라제 인근에 존재한다: PF00005, PF00006, PF00023, PF00083, PF00092, PF00115, PF00116, PF00122, PF00209, PF00213, PF00230, PF00231, PF00254, PF00359, PF00375, PF00381, PF00391, PF00401, PF00403, PF00474, PF00484, PF00520, PF00528, PF00529, PF00543, PF00571, PF00593, PF00625, PF00654, PF00664, PF00689, PF00690, PF00702, PF00860, PF00873, PF00892, PF00893, PF00902, PF00909, PF00916, PF00939, PF00999, PF01032, PF01061, PF01103, PF01203, PF01235, PF01384, PF01496, PF01544, PF01547, PF01554, PF01566, PF01578, PF01614, PF01618, PF01656, PF01699, PF01740, PF01741, PF01758, PF01810, PF01813, PF01891, PF01895, PF01899, PF01943, PF02026, PF02080, PF02133, PF02136, PF02225, PF02254, PF02277, PF02302, PF02321, PF02355, PF02378, PF02386, PF02417, PF02447, PF02501, PF02563, PF02632, PF02652, PF02653, PF02690, PF02706, PF02874, PF02896, PF03030, PF03083, PF03186, PF03222, PF03412, PF03459, PF03471, PF03544, PF03547, PF03548, PF03567, PF03605, PF03606, PF03610, PF03616, PF03814, PF03840, PF03865, PF03932, PF04193, PF04277, PF04389, PF04966, PF05134, PF05140, PF05524, PF05552, PF05977, PF06251, PF06826, PF06835, PF07264, PF07549, PF07660, PF07670, PF07685, PF07690, PF07715, PF07885, PF07969, PF08239, PF08279, PF08334, PF08352, PF08402, PF08479, PF10531, PF11356, PF11612, PF12156, PF12399, PF12796, PF12822, PF12848, PF12974, PF13306, PF13347, PF13409, PF13410, PF13416, PF13417, PF13440, PF13442, PF13462, PF13466, PF13473, PF13499, PF13505, PF13520, PF13531, PF13599, PF13609, PF13637, PF13807, PF13855, PF14524, PF14667, PF16327, PF17912 및 PF18412.
실시예 3: 재료 및 방법 대장균
배지
LB (Luria Broth) 배지는 1% 트립톤 펩톤 (Difco, Erembodegem, Belgium), 0.5% 효모 추출물 (Difco) 및 0.5% 염화나트륨 (VWR. Leuven, Belgium)으로 구성되었다. 96-웰 플레이트 또는 진탕 플라스크 배양 실험에 사용된 최소 배지는 2.00 g/L NH4Cl, 5.00 g/L (NH4)2SO4, 2.993 g/L KH2PO4, 7.315 g/L K2HPO4, 8.372 g/L MOPS, 0.5 g/L NaCl, 0.5 g/L MgSO4.7H2O, 30 g/L 수크로스 또는 실시예에서 특정되는 경우 다른 탄소원, 1 ml/L 비타민 용액, 100 μL/L 몰리브데이트 용액, 및 1 mL/L 셀레늄 용액을 함유하였다. 각 실시예에서 특정되는 바와 같이, 20 또는 45 g/L 락토스를 전구체로서 상기 배지에 추가로 부가하였다. 상기 배지는 1M KOH로 pH 7로 설정하였다. 비타민 용액은 3.6 g/L FeCl2.4H2O, 5 g/L CaCl2.2H2O, 1.3 g/L MnCl2.2H2O, 0.38 g/L CuCl2.2H2O, 0.5 g/L CoCl2.6H2O, 0.94 g/L ZnCl2, 0.0311 g/L H3BO4, 0.4 g/L Na2EDTA.2H2O 및 1.01 g/L 티아민.HCl로 구성되었다. 상기 몰리브데이트 용액은 0.967 g/L NaMoO4.2H2O를 함유하였다. 상기 셀레늄 용액은 42 g/L SeO2를 함유하였다.
발효를 위한 최소 배지에는 상기에 기재된 바와 같은 동일한 조성으로, 6.75 g/L NH4Cl, 1.25 g/L (NH4)2SO4, 2.93 g/L KH2PO4 및 7.31 g/L KH2PO4, 0.5 g/L NaCl, 0.5 g/L MgSO4.7H2O, 30 g/L 수크로스, 1 mL/L 비타민 용액, 100 μL/L 몰리브데이트 용액, 및 1 mL/L 셀레늄 용액을 함유하였다. 각 실시예에서 특정되는 바와 같이, 20 g/L 락토스를 전구체로서 상기 배지에 추가로 부가하였다.
복합 배지는 오토클레이브 (121℃, 21')로 멸균하였고, 최소 배지는 여과 (0.22 μm Sartorius)로 멸균하였다. 필요한 경우, 항생제 (예: 클로람페니콜 (20 mg/L), 카르베니실린 (100 mg/L), 스펙티노마이신 (40 mg/L) 및/또는 카나마이신 (50 mg/L))를 부가하여 상기 배지를 선택적으로 만들었다.
플라스미드
pKD46 (Red helper plasmid, 암피실린 저항성), pKD3 (FRT-플랭킹된 클로람페니콜 저항성 (cat) 유전자 함유), pKD4 (FRT-플랭킹된 카나마이신 저항성 (kan) 유전자 함유), 및 pCP20 (FLP 재조합효소 활성 발현) 플라스미드는 R. Cunin 교수 (Vrije Universiteit Brussel, Belgium in 2007)로부터 입수하였다.
막 단백질 및 푸코실트란스퍼라제 발현을 위한 플라스미드는 Golden Gate assembly를 사용하여 각각 백본 벡터를 포함하는 pSC101 ori (Rep10-v3) 및 pMB1 ori에서 구축되었다. 모든 막 단백질 및 푸코실트란스퍼라제 코딩 유전자는 Twist Biosciences (San Francisco, USA)에서 합성으로 합성되었다. 막 단백질의 폴리뉴클레오티드 서열 및 상응하는 막 단백질 폴리펩티드는 서열번호: 1 내지 196 및 서열번호: 204 내지 218에 제시되었고, 표 1에 기재되어 있다. 첨부된 실시예에 사용된 푸코실트란스퍼라제는 각각 서열번호: 197 및 198의 핵산 및 단백질 서열을 갖는 3-푸코실트란스퍼라제 FT1, 및 서열번호: 199 및 200을 갖는 FT2이다. 사용된 2-푸코실트란스퍼라제는 본원에서 FT3으로 지칭되는 서열번호: 201 및 202를 갖는 HpFutC, 및 서열번호: 219 및 220의 핵산 및 단백질 서열을 갖는 FT4이다. 막 단백질 및 푸코실트란스퍼라제 유전자는 표 2에 나열된 특정 프로모터, UTR 및 종결인자 조합을 사용하여 상이한 전사 유닛 (TU)으로 발현되었다. 상기 유전자는 프로모터 MutalikP5 (PROM0005_MutalikP5"), MutalikP12 (PROM0012_MutalikP12"), apFAB146 ("PROM0032") 및 MutalikP10 ("PROM0010_MutalikP10") (Mutalik 등에 의해 기재된 바와 같음 (Nat. Methods 2013, No. 10, 354-360)) 및 프로모터 p22 (PROM0015_p22) 및 p14 (PROM0016_p14) (모두는 De Mey 등에 의해 기재된 바와 같음 (BMC Biotechnology 2007, 7:34))를 사용하여 발현되었다. 사용된 UTR은 Gene10-LeuAB-BCD2 ("UTR0002_Gene10-LeuAB-BCD2"), BCD1 ("UTR003_BCD1"), Gene10_LeuL ("UTR0011_Gene10_LeuL"), ThrA_BCD2 ("UTR0013_ThrA_BCD2"), GalE_LeuAB ("UTR0014_GalE_LeuAB"), GalE_lptFG ("UTR0038_GalE_IptFG") 및 uspF_iptFG ("UTR0055_uspF_iptFG") (Mutalik 등에 의해 기재된 바와 같음 (Nat. Methods 2013, No. 10, 354-360))를 포함한다. 실시예에 사용된 종결인자는 Dunn 등에 기재된 바와 같은 TER0010_T7 Early이다 (Nucleic Acids Res. 1980, 8(10), 2119-32). 표 3은 상기 프로모터 UTR 및 종결인자의 조합에 의한 실시예에서 사용된 전사 유닛의 개요를 나타낸다. 발현 숙주의 코돈 사용에 대해 코돈 사용을 최적화함으로써 발현이 더욱 촉진될 수 있다. 유전자는 공급자의 툴을 사용하여 최적화되었다.
서열번호 (단백질) 명칭 /
TCDB 그룹
유기체 기원 디지털 서열 정보의 기원 국가
2 EcMdfA 대장균 K12 MG1655 합성 미국
4 EcYnfM 대장균 K12 MG1655 합성 미국
6 EcIceT 대장균 K12 MG1655 합성 미국
8 EcYhhs 대장균 K12 MG1655 합성 미국
10 EcEmrD 대장균 K12 MG1655 합성 미국
12 EcYdhC 대장균 K12 MG1655 합성 미국
14 EcYbdA 대장균 K12 MG1655 합성 미국
16 EcYdeE 대장균 K12 MG1655 합성 미국
18 EcMhpT 대장균 K12 MG1655 합성 미국
20 EcYebQ 대장균 K12 MG1655 합성 미국
22 EcYjhB 대장균 K12 MG1655 합성 미국
24 EcBcr 대장균 K12 MG1655 합성 미국
26 EcFucP 대장균 K12 MG1655 합성 미국
28 LllmrA 락토코커스 락티스 균주 SRCM103457 합성 대한민국
30 EcOppF 대장균 균주 K12 (MG1655) 합성 미국
32 EcWzxE 대장균 균주 K12 (MG1655) 합성 미국
34 EcWza 대장균 균주 K12 (MG1655) 합성 미국
36 HpWzk 헬리코박터 필로리 균주 ATCC 700392 / 26695 합성 영국
38 EcEmrE 대장균 균주 K12 합성 미국
40 Blon_2331 B. 론검 아종 인판티스 (균주 ATCC 15697) 합성 독일
42 Blon_2332 B. 론검 아종 인판티스 (균주 ATCC 15697) 합성 독일
44 Blon_2475 B. 론검 아종 인판티스 (균주 ATCC 15697) 합성 독일
46 Blon_0247 B. 론검 아종 인판티스 (균주 ATCC 15697) 합성 독일
48 Blon_0245 B. 론검 아종 인판티스 (균주 ATCC 15697) 합성 독일
50 Blon_0345 B. 론검 아종 인판티스 (균주 ATCC 15697) 합성 독일
52 NcCDT2 뉴로스포라 크라사 OR74A 합성 미국
54 AoCDT2 아스페르길루스 오리제 RIB40 합성 일본
56 HpCytC 헬리코박터 필로리 (캄필로박터 필로리 (Campylobacter pylori)) 합성
영국
58 ChWzx 키티노파가 종 CF118 합성 미국
60 EuWzx 유박테리움 종 CAG:581 합성 덴마크
62 DsWzx 디아도박터 솔리 DSM 25329 contig Ga0069981_102 합성 대한민국
64 LrWzx 락토코커스 라피노락티스 (ATCC 43920) 합성 알려지지 않음
66 PrWzx 프레보텔라 루미니콜라 (AR32) 합성 미국
68 FsLpsE 플라보박테리움 스파르탄시이 합성 미국
70 SsLpsE 스포로무사 스파에로이데스 DSM 2875 합성 독일
72 FsLpsE 플라보박테리움 스파르탄시이 합성 미국
74 SsLpsE 스포로무사 스파에로이데스 DSM 2875 합성 독일
76 PsTolC 칸디다투스 플란크토필라 설포니카 합성 스위스
78 BhTolC 부티리비브리오 훈가테이 XBD2006 합성 미국
80 RiMsbA 로세부리아 인테스티날리스 CAG:13 합성 덴마크
82 PgMsbA 페도박터 긴센기솔리 합성 대한민국
84 VbMsbA 베루코미크로비아 박테리움 CG1_02_43_26 합성 미국
86 BhNAPO 브라키스피라 함프소니이 P280/1 합성 영국
88 TmWzc 서모토가 마리티마 (균주 ATCC 43589 / MSB8 / DSM 3109 / JCM 10099) 합성 이탈리아
90 ClCutC 클로스트리디움 종 CAG:1013 합성 덴마크
92 OsCutC 오도리박터 스플란크니쿠스 DSM 20712 합성 알려지지 않음
94 MiCutC 미추아리아 종 PDC51 합성 미국
96 PiCutC 프레보텔라 인테르메디아 ATCC 25611 (DSM 20706) 합성 미국
98 AsNAm 악티노바쿨룸 수이스 DSM 20639 합성 알려지지 않음
100 RgNAm 루미노코커스 그나부스 합성 미국
102 CuNAm 쿠르토박테리움 종 314Chir4.1 합성 미국
104 NdNap 니아벨라 드릴라시스DSM25811 합성 독일
106 SfNap 사카리크리니스 퍼멘탄스 DSM 9555 = JCM 21142 합성 알려지지 않음
108 mdtD 시트로박터 프레운디이 MGH152 합성 미국
110 mdtD 시트로박터 웨르크마니이 NBRC 105721 합성 벨기에, 추가로 명시되지 않음
112 mdtD 시트로박터 아말로나티쿠스 합성 미국
114 mdtD 클레브시엘라 옥시토카 합성 영국
116 mdtD 에스케리치아 알베르티이 B156 합성 미국
118 yegB 살모넬라 엔테리카 아종 살라메 합성 영국
120 mdtD 클레브시엘라 뉴모니에 30684/NJST258_2 합성 미국
122 Tcr_1_D38215 클레브시엘라 뉴모니에 합성 미국
124 mdtD 슈도시트로박터 페칼리스 합성 미국
126 Cmr 요케넬라 레겐스버게이 ATCC43003 합성 영국
128 MdfA 크로노박터 무이트젠시이 합성 미국
130 MdfA 클레브시엘라 옥시토카 합성 스웨덴 (Zweden)
132 MFS 시트로박터 코세리 (시트로박터 디베르서스 (Citrobacter diversus)) 합성 미국
134 MdfA 에스케리치아 마르모테 합성 미국
136 Cmr 시겔라 플렉스네리 합성 영국
138 MdfA 살모넬라 엔테리카 아종 살라메 합성 덴마크
140 Cmr/MdfA 시트로박터 윤게 ATCC 29220 합성 미국
142 MdfA 시트로박터 프레운디이 합성 미국
144 MdfA/DHA1/MFS 엔테로박터 코베이 합성 미국
146 MdfA 엔테로박터 합성 호주
148 MdfA 렐리오티아 종 WB101 합성 미국
150 MdfA 엔테로박터 루드위기이 EcWSU1 합성 미국
152 Sweet-유사 악티노플라네스 우타헨시스 합성 미국
154 Sweet-유사 키티노파가세에 박테리움 PMG_246 합성 영국
156 Sweet-유사 리조비움 종 PDC82 합성 미국
158 Sweet-유사 키네오코커스 리조스파에레 DSM 19711 합성 대한민국
160 Sweet-유사 모르가넬라 모르가니이 IS15 합성 오스트리아
162 Sweet-유사 게오데르마토필루스 오브스쿠러스 (균주 ATCC 25078 / DSM 43160 / JCM 3152 / G-20) 합성 미국
164 Sweet-유사 브라디리조비움 종 BTAi1 합성 미국
166 Sweet-유사 브라디리조비움 자포니쿰 USDA 110 합성 미국
168 Sweet-유사 크산토모나스 캄페스트리스 pv. 베시카토리아 균주 85-10 합성 대한민국
170 Sweet-유사 헤르바스피릴룸 아쿠아티쿰 합성 미국
172 Sweet-유사 플라보박테리아 박테리움 MS024-2A 합성 미국
174 wzm 리조비움 종 Root149 합성 독일
176 wzm 아조스피릴룸 브라실리엔세 LMG 04375 합성 벨기에, 플랑드르
178 wzt 리조비움 종 Root149 합성 독일
180 wzt 아조스피릴룸 브라실리엔세 LMG 4375 합성 벨기에, 플랑드르
182 rnd-유사 시노리조비움 메디케 WSM419 합성 미국
184 아라비노스 유출물 아조스피릴룸 브라실리엔세 LMG 4375 합성 벨기에, 플랑드르
186 nodj 브라디리조비움 자포니쿰 USDA 110 합성 미국
188 nodi 브라디리조비움 자포니쿰 USDA 110 합성 미국
190 ybjM 대장균 K12 MG1655 합성 미국
192 ybjM-유사 엔테로박테리아세에 박테리움 ENNIH1 합성 미국
194 wzt 대장균 113303 합성 미국
196 wzm 대장균 113303 합성 미국
198 FT1 헬리코박터 필로리 합성 호주
200 FT2 바실레아 피차시풀모니스 (Basilea psittacipulmonis) JF4266 (DSM 24701) 합성 스위스
202 HpFutC (FT3) 헬리코박터 필로리 합성 호주
204 lamB 대장균 K12 MG1655 합성 미국
206 malE 대장균 K12 MG1655 합성 미국
208 malK 대장균 K12 MG1655 합성 미국
210 nagE 대장균 K12 MG1655 합성 미국
212 srlB 대장균 K12 MG1655 합성 미국
214 araF 대장균 K12 MG1655 합성 미국
216 xylF 대장균 K12 MG1655 합성 미국
218 ytfQ 대장균 K12 MG1655 합성 미국
220 FT4 헬리코박터 종 (Helicobacter sp.) MIT 01-6242 합성 미국
서열번호 (단백질) 패밀리 EggNOG PFAM Interpro TCDB
2 포터 07QF7 PF07690 IPR011701 IPR020846 IPR036259 IPR005829 2.A.1.2
4 포터 05D94 PF07690 IPR011701 IPR020846 IPR036259 IPR005829 2.A.1.36
6 포터 05C0R PF07690 IPR004638 IPR011701 IPR020846 IPR036259 IPR023721 IPR001411 2.A.1.3
8 포터 05F9N PF07690 IPR011701 IPR020846 IPR036259 IPR023008 2.A.1.46
10 포터 05E5M PF07690 IPR011701 IPR020846 IPR036259 IPR004734 2.A.1.2
12 포터 05CZQ PF07690 IPR004812 IPR011701 IPR020846 IPR036259 2.A.1.2
14 포터 05E8G PF05977 IPR023722 IPR020846 IPR036259 IPR010290 2.A.1.38
16 포터 05E5W PF07690 IPR011701 IPR020846 IPR036259 2.A.1.2
18 포터 08SC4 PF07690 IPR011701 IPR020846 IPR036259 IPR005829 2.A.1.15
20 포터 08H15 PF07690 IPR011701 IPR020846 IPR036259 IPR001411 2.A.1.3
22 포터 05JHE PF07690 IPR011701 IPR020846 IPR036259 2.A.1.12
24 포터 05C2C PF07690 IPR004812 IPR011701 IPR020846 IPR036259 IPR004734 2.A.1.2
26 포터 05EDR PF07690 IPR005275 IPR011701 IPR020846 IPR036259 2.A.1.7
28 P-P-결합-가수분해-유도 수송체 05BZ1 PF00664 PF00005 IPR003593 IPR011527 IPR036640 IPR003439 IPR017871 IPR027417 IPR039421 3.A.1.11
30 P-P-결합-가수분해-유도 수송체 08JQ7 PF00005 PF08352 IPR003593 IPR003439 IPR017871 IPR013563 IPR027417 3.A.1.5
32 포터 05EGZ PF01943 IPR002797 IPR032896 2.A.66
34 β-배럴 포린 05DAY PF02563 PF10531 PF18412 IPR003715 IPR019554 IPR040716 1.B.18
36 P-P-결합-가수분해-유도 수송체 05BZ1 PF00005 IPR003593 IPR011527 IPR036640 IPR003439 IPR017871 IPR027417 IPR039421 3.A.1.10
38 포터 0814C PF00893 IPR000390 2.A.7.1
40 포터 07RBJ PF13347 IPR039672 IPR036259 IPR001927 2.A.2
42 포터 07RBJ PF13347 IPR039672 IPR036259 IPR001927 2.A.2
44 P-P-결합-가수분해-유도 수송체 08IJ9 PF00005 PF17912 IPR003593 IPR003439 IPR017871 IPR008995 IPR040582 IPR027417 3.A.1.1
46 포터 08N8A PF07690 IPR011701 IPR020846 IPR036259 2.A.1.68
48 포터 05DXI PF07690 IPR011701 IPR020846 IPR036259 2.A.1.81
50 포터 08N8A PF07690 IPR011701 IPR020846 IPR036259 2.A.1.68
52 포터 07QNK PF00083 IPR020846 IPR005828 IPR036259 IPR003663 IPR005829 2.A.1.1
54 포터 07QNK PF00083 IPR020846 IPR005828 IPR036259 2.A.1.1
56 추정 수송 단백질 05CRE PF01578 PF05140 IPR002541 IPR007816 9.B.14
58 포터 07T5E PF14667 PF13440 IPR029303 2.A.66
60 포터 07VQ3 PF01943 PF14667 IPR029303 IPR002797 2.A.66
62 포터 08Z4Q PF13440   2.A.66
64 포터 07VQ3 PF01943 IPR002797 2.A.66
66 포터 05PSV PF13440   2.A.66
68 P-P-결합-가수분해-유도 수송체 05EY8 PF00005 PF14524 IPR003593 IPR003439 IPR027417 IPR029439 3.A.1.10
70 P-P-결합-가수분해-유도 수송체 05EY8 PF00005 IPR003593 IPR003439 IPR027417 3.A.1.10
72 P-P-결합-가수분해-유도 수송체 07V1T PF01061 IPR013525 IPR000412 3.A.1.10
74 P-P-결합-가수분해-유도 수송체 07V1T PF01061 IPR013525 IPR000412 3.A.1.10
76 P-P-결합-가수분해-유도 수송체 05BZ1 PF00005 IPR003593 IPR011527 IPR036640 IPR003439 IPR017871 IPR027417 IPR039421 3.A.1.11
78 P-P-결합-가수분해-유도 수송체 05BZ1 PF00664 PF00005 IPR003593 IPR011527 IPR036640 IPR003439 IPR017871 IPR027417 IPR039421 3.A.1.10
80 P-P-결합-가수분해-유도 수송체 05BZ1 PF00664 PF00005 IPR003593 IPR011527 IPR036640 IPR003439 IPR017871 IPR027417 IPR039421 3.A.1.10
82 P-P-결합-가수분해-유도 수송체 05BZ1 PF00664 PF00005 IPR003593 IPR011527 IPR036640 IPR003439 IPR017871 IPR027417 3.A.1.10
84 P-P-결합-가수분해-유도 수송체 05BZ1 PF00664 PF00005 IPR003593 IPR011527 IPR036640 IPR003439 IPR017871 IPR027417 3.A.1.10
86 포터 05EAM PF02690 PF01895 IPR003841 IPR004633 IPR038078 IPR026022 2.A.58
88 보조 수송 단백질 07SYR PF13807 PF02706 IPR032807 IPR003856 IPR027417 8.A.3
90 추정 수송 단백질 06N3A PF03932 IPR005627 IPR023648 IPR036822 9.B.158
92 추정 수송 단백질 06N3A PF03932 IPR005627 IPR023648 IPR036822 9.B.158
94 추정 수송 단백질 06N3A PF03932 IPR005627 IPR023648 IPR036822 9.B.158
96 추정 수송 단백질 06N3A PF03932 IPR005627 IPR023648 IPR036822 9.B.158
98 포터 05CT4 PF13347 IPR039672 IPR020846 IPR036259 2.A.2
100 포터 088QT PF13347 IPR039672 IPR020846 IPR036259 IPR001927 2.A.2
102 포터 05C0R PF07690 IPR004638 IPR011701 IPR020846 IPR036259 IPR001411 2.A.1.3
104 포터 07CWC PF00474 IPR038377 IPR001734 2.A.21
106 포터 07RJ1 PF00474 IPR038377 IPR001734 2.A.21
108 포터 05C0R PF07690 IPR011701 IPR020846 IPR036259 IPR023721 IPR001411 2.A.1.3
110 포터 05C0R PF07690 IPR004638 IPR011701 IPR020846 IPR036259 IPR023721 IPR001411 2.A.1.3
112 포터 05C0R PF07690 IPR011701 IPR020846 IPR036259 IPR023721 IPR001411 2.A.1.3
114 포터 05C0R PF07690 IPR004638 IPR011701 IPR020846 IPR036259 IPR023721 IPR001411 2.A.1.3
116 포터 05C0R PF07690 IPR004638 IPR011701 IPR020846 IPR036259 IPR023721 IPR001411 2.A.1.3
118 포터 05C0R PF07690 IPR011701 IPR020846 IPR036259 IPR023721 IPR001411 2.A.1.3
120 포터 05C0R PF07690 IPR011701 IPR020846 IPR036259 IPR023721 IPR001411 2.A.1.3
122 포터 05C0R PF07690 IPR004638 IPR011701 IPR020846 IPR036259 IPR023721 IPR001411 2.A.1.3
124 포터 05C0R PF07690 IPR004638 IPR011701 IPR020846 IPR036259 IPR023721 IPR001411 2.A.1.3
126 포터 07QF7 PF07690 PF07690 IPR011701 IPR011701 IPR020846 IPR020846 IPR036259 IPR036259 IPR005829 IPR005829 2.A.1.2
128 포터 07QF7 PF07690 IPR011701 IPR020846 IPR036259 IPR005829 2.A.1.2
130 포터 07QF7 PF07690 IPR011701 IPR020846 IPR036259 IPR005829 2.A.1.2
132 포터 07QF7 PF07690 IPR011701 IPR020846 IPR036259 IPR005829 2.A.1.2
134 포터 07QF7 PF07690 IPR011701 IPR020846 IPR036259 IPR005829 2.A.1.2
136 포터 07QF7 PF07690 IPR011701 IPR020846 IPR036259 IPR005829 2.A.1.2
138 포터 07QF7 PF07690 IPR011701 IPR020846 IPR036259 IPR005829 2.A.1.2
140 포터 07QF7 PF07690 IPR011701 IPR020846 IPR036259 IPR005829 2.A.1.2
142 포터 07QF7 PF07690 IPR011701 IPR020846 IPR036259 IPR005829 2.A.1.2
144 포터 07QF7 PF07690 IPR011701 IPR020846 IPR036259 IPR005829 2.A.1.2
146 포터 07QF7 PF07690 IPR011701 IPR020846 IPR036259 IPR005829 2.A.1.2
148 포터 07QF7 PF07690 IPR011701 IPR020846 IPR036259 IPR005829 2.A.1.2
150 포터 07QF7 PF07690 IPR011701 IPR020846 IPR036259 IPR005829 2.A.1.2
152 포터 070Q9 PF04193 IPR006603 2.A.123
154 포터 05W3H PF04193 IPR006603 2.A.123
156 포터 05W3H PF03083 IPR004316 2.A.123
158 포터 05W3H PF03083 PF04193 IPR006603 IPR004316 2.A.123
160 포터 05W2Y PF03083 IPR004316 2.A.123
162 포터 070Q9 PF04193 IPR006603 2.A.123
164 포터 05W3H PF04193 IPR006603 2.A.123
166 포터 05W3H PF04193 IPR006603 2.A.123
168 포터 05XJ5 PF04193 IPR006603 2.A.123
170 포터 05XJ5 PF03083 IPR004316 2.A.123
172 포터 05W3H PF04193 IPR006603 2.A.123
174 P-P-결합-가수분해-유도 수송체 05MFV PF01061 IPR013525 IPR000412 3.A.1.10
176 P-P-결합-가수분해-유도 수송체 05MFV PF01061 IPR013525 IPR000412 3.A.1.10
178 P-P-결합-가수분해-유도 수송체 05EY8 PF00005 PF14524 IPR003593 IPR003439 IPR027417 IPR029439 3.A.1.10
180 P-P-결합-가수분해-유도 수송체 05EY8 PF14524 IPR003593 IPR003439 IPR017871 IPR027417 IPR029439 3.A.1.10
182 포터 05BZS PF00873 IPR027463 IPR001036 2.A.6.3
184 포터 05CXP PF07690 IPR011701 IPR020846 IPR036259 2.A.1.2
186 P-P-결합-가수분해-유도 수송체 05HAC PF01061 IPR013525 IPR000412 IPR005981 3.A.1.10
188 P-P-결합-가수분해-유도 수송체 05CJ1 PF00005 IPR003593 IPR003439 IPR017871 IPR015851 IPR005978 IPR027417 3.A.1.10
190 추정 수송 단백질 05GWF PF11045 IPR020368 N/A
192 추정 수송 단백질 05GWF PF11045 IPR020368 N/A
194 P-P-결합-가수분해-유도 수송체 05EY8 PF00005 PF14524 IPR003593 IPR003439 IPR017871 IPR027417 IPR029439 3.A.1.10
196 P-P-결합-가수분해-유도 수송체 05MFV PF01061 IPR013525 IPR000412 3.A.1.10
204 β-배럴 포린 08KDD PF02264 IPR003192 IPR023738 IPR036998 1.B.3.1
206 P-P-결합-가수분해-유도 수송체 07FKK PF13416 IPR006059 IPR006060 IPR006061 3.A.1.1
208 P-P-결합-가수분해-유도 수송체 172T7 PF00005 PF17912 IPR003439 IPR003593 IPR008995 IPR015855 IPR017871 IPR027417 IPR040582 3.A.1.1
210 포스포트란스퍼-유도 그룹 전위인자 05CI1 PF00367 PF00358 PF02378 IPR001127 IPR001996 IPR003352 IPR010974 IPR011055 IPR013013 IPR018113 IPR036878 4.A.1.1
212 포스포트란스퍼-유도 그룹 전위인자 05VI0 PF03829 IPR004716 IPR018454 IPR036665 4.A.4.1
214 P-P-결합-가수분해-유도 수송체 05DMK PF00532 IPR001761 IPR026266 IPR028082 3.A.1.2
216 P-P-결합-가수분해-유도 수송체 05DFW PF13407 IPR013456 IPR025997 IPR028082 3.A.1.2
218 P-P-결합-가수분해-유도 수송체 07R5U PF13407 IPR025997 IPR028082 IPR033893 3.A.1.2
막 단백질 유전자의 발현을 위한 전사 유닛
TU 번호 프로모터 부분 UTR 부분 종결인자 부분
TU1 PROM0005_MutalikP5 UTR0014_GalE_LeuAB TER0010_T7early
TU2 PROM0005_MutalikP5 UTR0038_GalE_IptFG TER0010_T7early
TU3 PROM0005_MutalikP5 UTR0055_uspF_iptFG TER0010_T7early
TU4 PROM0012_MutalikP12 UTR0014_GalE_LeuAB TER0010_T7early
TU5 PROM0012_MutalikP12 UTR0038_GalE_IptFG TER0010_T7early
TU6 PROM0012_MutalikP12 UTR0055_uspF_iptFG TER0010_T7early
TU7 PROM0032_apFAB146 UTR0014_GalE_LeuAB TER0010_T7early
TU8 PROM0032_apFAB146 UTR0038_GalE_IptFG TER0010_T7early
TU9 PROM0032_apFAB146 UTR0055_uspF_iptFG TER0010_T7early
TU10 PROM0015_p22 UTR0003_BCD1 TER0010_T7early
TU11 PROM0010_MutalikP10 UTR0013_ThrA_BCD2 TER0010_T7early
TU12 PROM0005_MutalikP5 UTR0011_Gene10_LeuL TER0010_T7early
푸코실트란스퍼라제 유전자의 발현을 위한 전사 유닛
TU 번호 프로모터 부분 UTR 부분 종결인자 부분
TU13 PROM0016_p14 UTR0002_Gene10-LeuAB-BCD2 TER0010_T7early
플라스미드는 Invitrogen으로부터 구입한 숙주인 대장균 DH5alpha (F-, phi80dlacZdeltaM15, delta(lacZYAargF) U169, deoR, recA1, endA1, hsdR17(rk-, mk+), phoA, supE44, lambda-, thi-1, gyrA96, relA1)에서 유지되었다.
균주 및 돌연변이
대장균 K12 MG1655 [lambda-, F-, rph-1]는 2007년 3월에 the Coli Genetic Stock Center (US), CGSC Strain#: 7740으로부터 입수하였다. 유전자 파괴 및 유전자 도입은 Datsenko 및 Wanner가 발표한 기술을 사용하여 수행하였다 (PNAS 97 (2000), 6640- 6645). 이러한 기술은 람다 Red 재조합효소에 의해 수행된 상동성 재조합 후에 항생제 선택에 기반한다. 플립파제 (flippase) 재조합효소의 후속 촉매 작용은 최종 생산 균주에서 항생제 선택 카세트의 제거를 보장한다.
Red 헬퍼 플라스미드 pKD46을 보유하는 형질전환체를 암피실린 (100 mg/L) 및 L-아라비노스 (10 mM)를 함유하는 LB 배지 10 ml에서 30℃에서 OD6oonm이 0.6이 될 때까지 성장시켰다. 상기 세포를 먼저 50 ml의 빙냉수로 세척하고, 두번째로 1 ml의 빙냉수로 세척하여 상기 세포가 전기적격 (electrocompetent)이 되도록 만들었다. 그 다음에, 상기 세포를 50 μl의 빙냉수에 재현탁하였다. Gene Pulser™ (BioRad) (600 Ω, 25 μFD, 및 250 볼트)를 사용하여 50 μl의 세포 및 10-100 ng의 선형 이중가닥 DNA 산물로 전기천공을 수행하였다.
전기천공 후에, 세포를 1 ml의 LB 배지에 부가하고, 37℃에서 1시간 동안 인큐베이션하고, 마지막으로 25 mg/L의 클로람페니콜 또는 50 mg/L의 카나마이신을 함유하는 LB-아가에 도말하여 항생제 저항성 형질전환체를 선택하였다. 선택된 돌연변이체는 변형된 영역의 업스트림 및 다운스트림에 프라이머를 사용하여 PCR에 의해 확인하였고, 헬퍼 플라스미드의 결실을 위해 42℃에서 LB-아가에서 성장시켰다. 상기 돌연변이체를 암피실린 감수성에 대해 테스트하였다.
상기 선형 ds-DNA 앰플리콘은 pKD3, pKD4 및 이의 유도체를 주형으로 사용하여 PCR에 의해 수득하였다. 사용된 프라이머는 주형에 상보적인 서열의 일부 및 재조합이 발생되는 염색체 DNA의 측면에 상보적인 다른 부분을 갖는다. 게놈 녹-아웃 (genomic knock-out)의 경우, 상동성 영역은 관심 유전자의 개시 및 정지 코돈의 50-nt 업스트림 및 50-nt 다운스트림에 디자인되었다. 게놈 녹-인 (genomic knock-in)의 경우, 전사 개시점 (+1)이 고려되어야 한다. PCR 산물을 PCR-정제하고, Dpnl로 소화하고, 아가로스 겔로부터 재정제하고, 용출 버퍼 (5 mM Tris, pH 8.0)에 현탁하였다.
선택된 돌연변이체 (클로람페니콜 또는 카나마이신 저항성)는 온도-민감성 복제 및 FLP 합성의 열 유도를 나타내는 암피실린 및 클로람페니콜 저항성 플라스미드인 pCP20 플라스미드로 형질전환되었다. 상기 암피실린-저항성 형질전환체는 30℃에서 선택되었고, 그 후에 42℃의 LB에서 몇 개의 콜로니를 정제한 다음에, 모든 항생제 저항성 및 FLP 헬퍼 플라스미드의 결실을 테스트하였다. 상기 유전자 녹-아웃 및 녹-인은 대조군 프라이머 (Fw/Rv-gene-out)로 확인하였다.
대장균 K12 MG1655 유래의 돌연변이체 균주는 유전자 lacZ, lacY lacA, glgC, agp, pfkA, pfkB, pgi, arcA, iclR, wcaJ, lonthyA를 녹-아웃하여 형성되었다. 또한, 대장균 lacY 유전자, 지모모나스 모빌리스 (Zymomonas mobilis) 유래의 프럭토스 키나제 유전자 (frk), 대장균 W 수크로스 수송체 (cscB) 및 비피도박테리움 아돌레센티스 (Bifidobacterium adolescentis) 유래의 수크로스 포스포릴라제 (SP)가 게놈에 녹-인되고, 항시적으로 발현되었다. 상기 항시성 프로모터는 De Mey 등 (BMC Biotechnology, 2007)이 개시한 프로모터 라이브러리로부터 유래한다. 이러한 유전자 변형은 또한 WO2016075243 및 WO2012007481에 기재되어 있다.
상기 α1,3- 또는 α1,2-푸코실트란스퍼라제 유전자는 상기 기재된 바와 같이 플라스미드로부터 돌연변이체 균주로 제시되었다. 모든 막 단백질 유전자를 대장균 K12 MG1655 유래의 이러한 돌연변이체 균주에서 평가하였다. 플라스미드에 존재하거나, 또는 숙주 게놈 (setA 또는 ldhA 유전자좌)에 통합된 막 단백질 유전자를 평가하였다. 모든 균주는 -80℃의 저온바이알 (cryovials)에 저장된다 (70% 글리세롤과 1:1 비율로 혼합된 LB 배양물 중에 밤새).
대체 돌연변이체 균주는 유전자 lacZ, rcsA 및 wcaJ가 녹-아웃된 대장균 K12 JM109로부터 유래될 수 있다. α1,3- 또는 α1,2-푸코실트란스퍼라제 유전자를 상기 기재된 바와 같은 플라스미드로부터 상기 돌연변이체 균주에 제시하여 2'푸코실락토스, 3-푸코실락토스 또는 2',3-디푸코실락토스의 생성을 유도하였다. 막 단백질 유전자는 상기에 기재된 것과 동일한 방식으로 평가된다. 상기 균주는 알로-락토스 (allo-lactose) 또는 IPTG를 통해 락토스를 내재화하여 락토스 퍼미아제 유전자 lacY를 유도할 수 있다.
다른 대체 돌연변이체 균주는 대장균 BL21로부터 유래될 수 있다. 유전자 lacZ, fucI, fucK 및 wzxC-wcaJ가 상기 균주에서 녹-아웃된다. 상기 돌연변이체 균주에서 GDP-푸코스의 합성을 개선하기 위해, 포스포만노뮤타제 (manB), 만노스-1-포스페이트 구아노실트란스퍼라제 (manC), GDP-만노스-4,6-데하이드라타제 (gmd) 및 대장균 K12 유래의 GDP-L-푸코스 신타제 (wcaG)를 코딩하는 유전자들이 상기 기재된 것과 유사한 방식으로 과발현되었다. 세포내 락토스 합성은 lgtB 유전자에 의해 코딩되는 베타-1,4-갈락토실트란스퍼라제를 코딩하는 유전자의 과발현에 의해 달성된다. UDP-갈락토스의 합성을 향상시키기 위해, galETKM을 코딩하는 오페론을 녹-아웃시키고, UDP-글루코스 에피머라제를 코딩하는 유전자를 과발현시켰다. α1,3- 또는 α1,2-푸코실트란스퍼라제 유전자를 상기 기재된 바와 같은 플라스미드로부터 상기 돌연변이체 균주에 제시하여 2'푸코실락토스, 3-푸코실락토스 또는 2',3-디푸코실락토스의 생성을 유도하였다. 막 단백질 유전자는 상기 기재된 것과 동일한 방식으로 평가된다.
다른 대체 돌연변이체 균주는 대장균 K12로부터 유래될 수 있다. 유전자 lacZ, fucI, fucK 및 wzxC-wcaJ가 상기 균주에서 녹-아웃된다. 상기 돌연변이체 균주에서 GDP-푸코스의 합성을 개선하기 위해, 포스포만노뮤타제 (manB), 만노스-1-포스페이트 구아노실트란스퍼라제 (manC), GDP-만노스-4,6-데하이드라타제 (gmd) 및 대장균 K12 유래의 GDP-L-푸코스 신타제 (wcaG)를 코딩하는 유전자들이 상기 기재된 것과 유사한 방식으로 과발현되었다. 또한 상기 균주는 대장균 유래의 푸코스 퍼미아제 (fucP) 유전자 및 박테로이데스 프라길리스 (Bacteroides fragilis) 유래의 이관능성 푸코스 키나제/푸코스-1-포스페이트 구아닐일트란스퍼라제 (fkp) 유전자의 게놈 녹-인에 의해 변형된다. α1,3- 또는 α1,2-푸코실트란스퍼라제 유전자를 상기 기재된 바와 같은 플라스미드로부터 상기 돌연변이체 균주에 제시하여 2'푸코실락토스, 3-푸코실락토스 또는 2',3-디푸코실락토스의 생성을 유도하였다. 막 단백질 유전자는 상기 기재된 것과 동일한 방식으로 평가된다. 상기 균주는 알로-락토스 또는 IPTG를 통해 락토스를 내재화하여 락토스 퍼미아제 유전자 lacY를 유도할 수 있다.
다른 대체 돌연변이체 균주는 대장균 K12로부터 유래될 수 있다. 유전자 lacZ, 및 wzxC-wcaJ가 상기 균주에서 녹-아웃된다. 상기 돌연변이체 균주에서 GDP-푸코스의 합성을 개선하기 위해, 포스포만노뮤타제 (manB), 만노스-1-포스페이트 구아노실트란스퍼라제 (manC), GDP-만노스-4,6-데하이드라타제 (gmd) 및 대장균 K12 유래의 GDP-L-푸코스 신타제 (wcaG)를 코딩하는 유전자들을 상기 기재된 것과 유사한 방식으로 과발현시켰다. 글루코스신생합성 기질 (gluconeogenic substrate) 예컨대 글리세롤, 아세테이트, 락테이트, 에탄올, 숙시네이트, 피루베이트 유래의 플럭토스-6-포스페이트의 형성을 개선하기 위해, 포스포프럭토키나제 (pfkA 및 pfkB)를 코딩하는 유전자를 녹-아웃시키고, 프럭토스-1,6-비스포스페이트 알돌라제 (fbaB) 및 피숨 사티붐 (Pisum sativum) 유래의 이종 프럭토스-1,6-비스포스페이트 포스파타제 (fbpase)를 코딩하는 유전자를 과발현시켰다. α1,3- 또는 α1,2-푸코실트란스퍼라제 유전자를 상기 기재된 바와 같은 플라스미드로부터 상기 돌연변이체 균주에 제시하여 2'푸코실락토스, 3-푸코실락토스 또는 2',3-디푸코실락토스의 생성을 유도하였다. 막 단백질 유전자는 상기 기재된 것과 동일한 방식으로 평가된다.
배양 조건
96 웰 마이크로타이터 플레이트 실험의 전배양 (preculture)을 150 μL의 LB에서 저온바이알로부터 개시하여, 800 rpm의 오비탈 진탕기 (orbital shaker)에서 37℃로 밤새 인큐베이션하였다. 이러한 배양물은 400x 희석하여 400 μL 최소 배지를 사용하여, 96웰 사각형 마이크로타이터 플레이트에 접종물로 사용하였다. 각 균주를 생물학적 복제물로서 96-웰 플레이트의 다중 웰에서 성장시켰다. 그 다음에 이러한 최종 96-웰 배양 플레이트를 72시간 또는 더 짧거나 또는 더 긴 시간 동안 800 rpm의 오비탈 진탕기에서 37℃로 인큐베이션하였다. 배양 실험의 종료 시에, 각 웰로부터 샘플을 채취하여 배양액 상등액에서 당 농도 (세포를 5회 회전 침강시킨 후에, 세포외 당 농도)를 측정하거나, 또는 배양액을 90℃에서 15분 동안 끓인 후에 세포를 회전 침강시켜서 당 농도 (= 전체 배양액 측정, 세포내 및 세포외 당 농도의 평균)를 측정하였다.
또한 배양물을 희석하여 600 nm에서 광학 밀도를 측정하였다. 세포 성능 지수 또는 CPI는 전체 배양액에서 측정된 푸코실락토스 농도를 바이오매스로 나누어, 참조 균주와 비교한 상대 퍼센트로 결정하였다. 상기 바이오매스는 600 nm에서 측정된 광학 밀도의 약 1/3로 경험적으로 결정된다. 푸코실락토스 외수송 비율은 상등액에서 측정된 푸코실락토스 농도를 전체 배양액에서 측정된 푸코실락토스 농도로 나누어, 참조 균주와 비교한 상대 퍼센트로 결정하였다.
생물반응기의 전배양물은 소정의 균주의 전체 1 mL 저온바이알로부터 개시하여, 1 L 또는 2.5 L 진탕 플라스크에 250 mL 또는 500 mL의 최소 배지에 접종하고, 200 rpm의 오비탈 진탕기에서 37℃에서 24시간 동안 인큐베이션하였다. 그 다음에 5 L 생물반응기에 접종하였다 (2 L 회분식 배지 중에 250 mL 접종); 상기 공정은 MFCS 제어 소프트웨어 (Sartorius Stedim Biotech, Melsungen, Germany)에 의해 제어되었다. 배양 조건은 37℃로 설정하고, 최대 교반; 압력 기체 유속은 균주 및 생물반응기에 따라 좌우된다. pH는 0.5M H2SO4 및 20% NH4OH를 사용하여 6.8로 조절되었다. 배출 기체는 냉각되었다. 발효 중에 거품이 발생하는 경우 실리콘 소포제의 10% 용액을 부가하였다.
광학 밀도
배양물의 세포 밀도는 600 nm에서 광학 밀도를 측정하여 자주 모니터링하였다 (Implen Nanophotometer NP80, Westburg, Belgium or with a Spark 10M microplate reader, Tecan, Switzerland).
생산성
비생산성 (specific productivity) Qp는 푸코실락토스 생성물의 비생성율 (specific production rate)이며, 전형적으로 시간 단위당 바이오매스의 질량 단위당 생성물의 질량 단위 (= g 푸코실락토스/g 바이오매스/h)로 표시된다. 상기 Qp 값은 발효 실행의 각 단계, 즉 배치 및 유가식 단계에 대해, 각 단계의 종료 시에 및 각 단계가 지속되는 시간 프레임에서, 형성된 생성물 및 바이오매스의 양을 모두 측정하여 결정되었다.
비생산성 Qs는 기질, 예컨대 수크로스의 비소비율 (specific consumption rate)이며, 전형적으로 시간 단위당 바이오매스의 질량 단위당 기질의 질량 단위 (= g 수크로스/g 바이오매스/h)로 표시된다. 상기 Qs 값은 발효 실행의 각 단계, 즉 배치 및 유가식 단계에 대해, 각 단계의 종료 시에 및 각 단계가 지속되는 기간 프레임에서, 소비된 수크로스 및 형성된 바이오매스의 총량을 모두 측정하여 결정되었다.
수크로스에 대한 수율 Ys은 기질로부터 만들어진 생성물의 분율이며, 전형적으로 기질의 질량 단위당 생성물의 질량 단위 (= g 푸코실락토스/g 수크로스)로 표시된다. Ys는 발효 실행의 각 단계, 즉 배치 및 유가식 단계에 대해, 각 단계의 종료 시에 생성된 푸코실락토스의 총량 및 소비된 수크로스의 총량을 모두 측정하여 결정되었다.
바이오매스에 대한 수율 Yx은 기질로부터 만들어진 바이오매스의 분율이며, 전형적으로 기질의 질량 단위당 바이오매스의 질량 단위 (= g 바이오매스/g 수크로스)로 표시된다. 상기 Yp는 발효 실행의 각 단계, 즉 배치 및 유가식 단계에 대해, 각 단계의 종료 시에 생성된 바이오매스의 총량 및 소비된 수크로스의 총량을 모두 측정하여 결정되었다.
속도는 발효 실행에서 생성물이 제조되는 속도이며, 전형적으로 시간 단위당 생성된 생성물의 농도 (= g 푸코실락토스/L/h)로 표시된다. 상기 속도는 유가식 단계 종료 시에 제조된 푸코실락토스의 농도를 측정하고, 이 농도를 총 발효 시간으로 나누어 결정되었다.
상기 락토스 전환율은 발효 실행에서 락토스가 소비되는 속도이며, 전형적으로 시간 단위당 락토스의 질량 단위 (= 소모된 락토스 g/h)로 표시된다. 상기 락토스 전환율은 발효 실행 중에 소비된 총 락토스를 총 발효 시간으로 나눈 값으로 결정되었다.
성장률/속도 측정
최대 성장률 (μMax)은 R 패키지 grofit을 사용하여 600 nm에서 관찰된 광학 밀도에 기반하여 계산되었다.
액체 크로마토그래피
2'-푸코실락토스, 3-푸코실락토스 및 2',3-디푸코실락토스에 대한 표준을 자체적으로 합성하였다. 다른 표준 예컨대 이에 한정되는 것은 아니지만, 락토스, 수크로스, 글루코스, 글리세롤, 프럭토스는 Sigma로부터 구입하였다. 탄수화물은 HPLC-RI (Waters, USA) 방법을 통해 분석하였고, 이에 의해 RI (굴절률)는 샘플을 포함하는 경우 이동상의 굴절률 변화를 검출하였다. X-Bridge 컬럼 (Waters X-bridge HPLC column, USA) 및 75 ml의 아세토니트릴과 25 ml의 초순수 및 0.15 ml의 트리에틸아민을 함유하는 이동상을 사용하여 등용매 흐름 (isocratic flow)에서 당을 분리하였다. 컬럼 크기는 4.6 x 150 mm이고, 입자 크기는 3.5 μm이다. 상기 컬럼의 온도는 35℃로 설정되었고, 펌프 유속은 1 mL/분이었다.
데이터의 정규화
모든 타입의 배양 조건에 대해, 돌연변이체 균주로부터 수득된 데이터를 돌연변이체 균주와 동일한 유전적 배경을 갖지만 막 단백질 발현 카세트가 결여된 참조 균주를 사용하여 동일한 배양 조건에서 수득된 데이터에 대해 정규화하였다. 실시예에 표시된 각 플롯의 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다. 모든 데이터는 해당 설정값에 대한 상대 퍼센트로 제공된다.
실시예 4: 20 g/L 락토스가 보충된 최소 배지에서의 성장 실험에서 72시간 배양된 대장균 숙주에서 3-푸코실락토스 (3-FL) 생성을 향상시키는 막 단백질 확인
20 g/L 락토스가 보충된 최소 배지에서 성장하는 숙주 세포의 푸코실락토스 생성을 향상시키는 능력에 대해 막 단백질을 평가하기 위한 실험을 설정하였다. 서열번호: 02, 04, 06, 18, 20, 22, 26, 28, 30, 32, 34, 40, 42, 44, 58, 62, 64, 66, 70, 72, 74, 82, 84, 90, 92, 94 및 96의 막 단백질은 α1,3-푸코실 트란스퍼라제 FT1 또는 FT2를 발현하는 3-FL 생산 숙주에서 생성되는 3-FL 생성을 향상시킬 수 있음을 보여주었다. 후보 유전자가 전사 유닛 TU2, TU3 또는 TU10에서 조합되었고, pSC101 플라스미드로 3-FL 생산 숙주에 제시되었다. 실시예 3에 제공된 배양 조건에 따라 성장 실험을 수행하였다. 도 1은 각 참조 균주와 비교하여 상대 퍼센트로, 균주의 CPI를 나타낸다.
실시예 5: 20 g/L 락토스가 보충된 최소 배지에서의 성장 실험에서 72시간 배양된 대장균 숙주에서 3-FL 분비를 향상시키는 막 단백질 확인
20 g/L 락토스가 보충된 최소 배지에서 성장하는 숙주 세포의 푸코실락토스 분비를 향상시키는 능력에 대해 막 단백질을 평가하기 위한 실험을 설정하였다. 서열번호: 02, 08, 10, 14, 16, 18, 20, 22, 24, 26, 28, 30, 34, 58, 62, 64, 66, 70, 72, 74, 76, 82, 84, 90, 92, 94, 96 및 104의 막 단백질은 α1,3-푸코실 트란스퍼라제 FT1 또는 FT2를 발현하는 3-FL 박테리아 생산 숙주에서 세포내 생성되는 3-FL의 분비를 향상시킬 수 있음을 보여주었다. 후보 유전자가 전사 유닛 TU2, TU3 또는 TU10에서 조합되었고, pSC101 플라스미드로 3-FL 생산 숙주에 제시되었다. 실시예 3에 제공된 배양 조건에 따라 성장 실험을 수행하였다. 도 2는 각 참조 균주와 비교하여 상대 퍼센트로, 균주에서 3-FL의 외수송 비율을 나타낸다.
실시예 6: 20 g/L 락토스가 보충된 최소 배지에서의 성장 실험에서 72시간 배양된 대장균 숙주에서 성장 속도를 향상시키는 막 단백질 확인
20 g/L 락토스가 보충된 최소 배지에서 성장하는 숙주 세포의 성장 속도에 영향을 미치는 능력에 대해 막 단백질을 평가하기 위한 실험을 설정하였다. 서열번호: 08, 14, 18 및 22의 막 단백질은 α1,3-푸코실 트란스퍼라제 FT1 또는 FT2를 발현하는 3-FL 생산 숙주의 성장 속도를 향상시킬 수 있음을 보여주었다. 후보 유전자가 전사 유닛 TU2, TU3 또는 TU10에서 조합되었고, pSC101 플라스미드로 3-FL 생산 숙주에 제시되었다. 실시예 3에 제공된 배양 조건에 따라 성장 실험을 수행하였다. 도 3은 각 참조 균주와 비교하여 상대 퍼센트로, 균주의 성장 속도를 나타낸다.
실시예 7: 45 g/L 락토스가 보충된 최소 배지에서의 성장 실험에서 72시간 배양된 대장균 숙주에서 3-FL 분비를 향상시키는 막 단백질 확인
45 g/L 락토스가 보충된 최소 배지에서 성장하는 숙주 세포에 의해 푸코실락토스 분비를 향상시키는 다양한 확인된 막 단백질들의 효능을 평가하기 위한 실험을 설정하였다. 서열번호: 28의 막 단백질은 α1,3-푸코실 트란스퍼라제 FT1을 발현하는 3-FL 생산 숙주에서 3-FL의 분비를 향상시킬 수 있음을 보여주었다. 서열번호: 27의 유전자는 전사 유닛 TU10에서 조합되었고, pSC101 플라스미드로 3-FL 생산 숙주에 제시되었다. 실시예 3에 제공된 배양 조건에 따라, 45 g/L 락토스가 보충된 최소 배지를 사용하여 성장 실험을 수행하였다. 도 4는 각 참조 균주와 비교하여 상대 퍼센트로, 균주의 CPI를 나타낸다.
실시예 8: 90 g/L 락토스가 보충된 최소 배지에서의 성장 실험에서 72시간 배양된 대장균 숙주에서 3-FL 생성을 향상시키는 막 단백질 확인
90 g/L 락토스가 보충된 최소 배지에서 푸코실락토스 생성을 향상시키는 다양한 막 단백질들의 능력을 평가하기 위한 실험을 설정하였다. 서열번호: 28의 막 단백질은 α1,3-푸코실 트란스퍼라제 FT1을 발현하는 3-FL 생산 숙주에서 3-FL 생성을 향상시킬 수 있음을 보여주었다. 서열번호: 27의 유전자는 전사 유닛 TU10에서 조합되었고, pSC101 플라스미드로 3-FL 생산 숙주에 제시되었다. 실시예 3에 제공된 배양 조건에 따라, 90 g/L 락토스가 보충된 최소 배지를 사용하여 성장 실험을 수행하였다. 도 5는 각 참조 균주와 비교하여 상대 퍼센트로, CPI를 나타낸다.
실시예 9: 90 g/L 락토스가 보충된 최소 배지에서의 성장 실험에서 72시간 배양된 대장균 숙주에서 3-FL 분비를 증가시키는 막 단백질 확인
90 g/L 락토스가 보충된 최소 배지에서 성장하는 숙주 세포에 의해 푸코실락토스 분비를 증가시키는 다양한 막 단백질들의 능력을 평가하기 위한 실험을 설정하였다. 서열번호: 10 및 16의 막 단백질은 α1,3-푸코실 트란스퍼라제 FT1을 발현하는 3-FL 생산 숙주에서 3-FL의 분비를 향상시킬 수 있음을 보여주었다. 후보 유전자가 전사 유닛 TU10에서 조합되었고, pSC101 플라스미드로 3-FL 생산 숙주에 제시되었다. 실시예 3에 제공된 배양 조건에 따라, 90 g/L 락토스가 보충된 최소 배지를 사용하여 성장 실험을 수행하였다. 도 6은 각 참조 균주와 비교하여 상대 퍼센트로, 3-FL의 외수송 비율을 나타낸다.
실시예 10: 100 g/L 수크로스 및 90 g/L 락토스가 보충된 최소 배지에서의 성장 실험에서 72시간 배양된 대장균 숙주에서 3-FL 생성을 증가시키는 막 단백질 확인
100 g/L 수크로스 및 90 g/L 락토스가 보충된 최소 배지에서 성장하는 숙주 세포에서 푸코실락토스 생성을 증가시키는 다양한 막 단백질들의 능력을 평가하기 위한 실험을 설정하였다. 서열번호: 10, 16 및 28의 막 단백질은 α1,3-푸코실 트란스퍼라제 효소 FT1을 발현하는 3-FL 생산 숙주에서 3-FL 생성을 향상시킬 수 있음을 보여주었다. 모든 후보 유전자들은 전사 유닛 TU10에서 조합되었고, pSC101 플라스미드로 3-FL 생산 숙주에 제시되었다. 실시예 3에 제공된 배양 조건에 따라, 100 g/L 수크로스 및 90 g/L 락토스가 보충된 최소 배지를 사용하여 성장 실험을 수행하였다. 도 7은 각 참조 균주와 비교하여 상대 퍼센트로, CPI를 나타낸다.
실시예 11: 100 g/L 수크로스 및 90 g/L 락토스가 보충된 최소 배지에서의 성장 실험에서 72시간 배양하는 경우 대장균 숙주에서 성장 속도를 증가시키는 막 단백질 확인
100 g/L 수크로스 및 90 g/L 락토스가 보충된 최소 배지에서 성장하는 숙주 세포의 성장 속도에 영향을 주는 막 단백질의 능력에 대해 평가하기 위한 실험을 설정하였다. 서열번호: 28의 막 단백질은 α1,3-푸코실 트란스퍼라제 효소 FT1을 발현하는 3-FL 생산 숙주에서 성장 속도를 향상시킬 수 있음을 보여주었다. 서열번호: 27의 유전자는 전사 유닛 TU10에서 조합되었고, pSC101 플라스미드로 3-FL 생산 숙주에 제시되었다. 실시예 3에 제공된 배양 조건에 따라, 100 g/L 수크로스 및 90 g/L 락토스가 보충된 최소 배지를 사용하여 성장 실험을 수행하였다. 도 8은 각 참조 균주와 비교하여 상대 퍼센트로, 성장 속도를 나타낸다.
실시예 12: 5 g/L 락토스가 보충된 최소 배지에서의 성장 실험에서 72시간 배양된 대장균 숙주에서 3-FL 생성을 증가시키는 막 단백질 확인
5 g/L 락토스가 보충된 최소 배지에서 성장하는 숙주 세포에 의해 푸코실락토스 생성에 영향을 주는 막 단백질의 능력에 대해 평가하기 위한 실험을 설정하였다. 서열번호: 22의 막 단백질은 α1,3-푸코실 트란스퍼라제 효소 FT1을 발현하는 3-FL 생산 숙주에서 3-FL 생성을 향상시킬 수 있음을 보여주었다. 서열번호: 21의 유전자는 전사 유닛 TU10에서 조합되었고, pSC101 플라스미드로 3-FL 생산 숙주에 제시되었다. 실시예 3에 제공된 배양 조건에 따라, 5 g/L 락토스가 보충된 최소 배지를 사용하여 성장 실험을 수행하였다. 도 9는 각 참조 균주와 비교하여 상대 퍼센트로, CPI를 나타낸다.
실시예 13: 숙주의 게놈에 통합되는 경우, 20 g/L 락토스가 보충된 최소 배지에서의 성장 실험에서 72시간 배양된 대장균 숙주에서 3-FL 생성 및/또는 분비를 증가시키는 막 단백질 확인
20 g/L 락토스가 보충된 최소 배지에서 72시간 동안 배양된 숙주 세포에서/숙주 세포에 의해 푸코실락토스 생성 및/또는 분비를 증가시키는, 게놈에 통합된 막 단백질의 능력을 평가하기 위한 다른 계열 실험을 설정하였다. 서열번호: 02 및 28의 막 단백질들은 α1,3-푸코실 트란스퍼라제 효소 FT1 또는 FT2를 발현하는 3-FL 생산 숙주에서 세포내 생성되는 3-FL 생성 및/또는 3-FL 분비를 향상시킬 수 있음을 보여주었다. 서열번호: 01 및 27의 유전자들이 전사 유닛 TU10에서 조합되었고, 각각 EcLdhA 또는 EcSetA 유전자좌에서 게놈 KI로서 3-FL 생산 숙주의 게놈에 제시되었다. 실시예 3에 제공된 배양 조건에 따라 성장 실험을 수행하였다. 각 참조 균주와 비교하여 상대 퍼센트로, 도 10은 CPI를 나타내고, 도 11은 3-FL 외수송을 나타낸다.
실시예 14: 클로닝된 전사 유닛과 독립적으로, 대장균 숙주에서 3-FL 생성 및/또는 3-FL 분비를 향상시키는 막 단백질
숙주 세포의 푸코실락토스 생성 및/또는 분비에 영향을 주는 막 단백질의 능력을 평가하기 위한 다른 계열 실험을 설정하였다. 본 실시예에서는 클로닝에 사용되는 여러 전사 유닛이 있다. 서열번호: 02, 06, 10, 16, 22, 28, 32, 34, 36, 38, 40, 42, 44 및 50의 막 단백질은 α1,3-푸코실 트란스퍼라제 효소 FT2에 의해 3-FL 생산 숙주에서 세포내 생성되는 3-FL 생성 및/또는 3-FL 분비를 향상시킬 수 있음을 보여주었다. 외수송 유전자가 다른 전사 유닛에 클로닝되었고, 3-FL 생산 숙주에 클론 벡터 (pSC101 ori)로 제시되었다. 실시예 3에 제공된 배양 조건에 따라 성장 실험을 수행하였다. 각 참조 균주와 비교하여 상대 퍼센트로, 도 12는 CPI를 나타내고, 도 13은 3-FL 외수송을 나타낸다.
실시예 15: 네이티브 전사 오페론 구조에 클로닝되는 경우, 20 g/L 락토스가 보충된 최소 배지에서의 성장 실험에서 72시간 배양된 대장균 숙주에서 3-FL 생성 및/또는 3-FL 분비를 향상시키는 막 단백질 확인
20 g/L 락토스가 보충된 최소 배지에서 72시간 동안 배양된 숙주 세포의 푸코실락토스 생성 및/또는 분비를 향상시키는 막 단백질의 능력을 평가하기 위한 실험을 설정하였다. 이때 상기 막 단백질은 네이티브 전사 오페론 구조에 클로닝되었다. 서열번호: 40, 42, 46 및 48의 막 단백질은 α1,3-푸코실 트란스퍼라제 효소 FT2를 발현하는 3-FL 생산 숙주에서 3-FL 생성 및/또는 3-FL 분비를 향상시킬 수 있음을 보여주었다. 모든 후보 외수송 유전자는 TU10에 단일 유전자로서 클로닝되거나 또는 2개의 막 단백질 유전자를 함유하는 네이티브 전사 오페론 구조에 클로닝되었고, pSC101 플라스미드로 3-FL 생산 숙주에 제시되었다. 실시예 3에 제공된 배양 조건에 따라 성장 실험을 수행하였다. 도 14는 각 참조 균주와 비교하여 상대 퍼센트로, CPI (좌측 패널) 및 3-FL 외수송 비율 (우측 패널)을 나타낸다.
실시예 16: 20 g/L 락토스가 보충된 최소 배지에서의 성장 실험에서 72시간 배양된 2'-FL 대장균 숙주에서 2'-FL 및/또는 DiFL 생성, 및/또는 DiFL 분비를 향상시키는 막 단백질 확인
20 g/L 락토스가 보충된 최소 배지에서 72시간 동안 배양된 숙주 세포의 푸코실락토스 생성 및/또는 분비를 향상시키는 다양한 막 단백질들의 능력을 평가하기 위한 실험을 설정하였다. 이때 막 단백질을 2'-FL 및/또는 diFL 생성에 대해 테스트하였다. 서열번호: 02, 06 및 28의 막 단백질은 α1,2-푸코실트란스퍼라제 FT3을 발현하는 2'-FL 생산 숙주에서 2'FL 및/또는 DiFL 생성 및/또는 DiFL 분비를 향상시킬 수 있음을 보여주었다. 후보 유전자는 상이한 TU들에 클로닝되었고, SetA 유전자좌 (서열번호: 27의 유전자의 경우) 또는 ldhA 유전자좌 (서열번호: 01 및 05의 유전자의 경우)를 사용하여, 2'-FL 생산 숙주의 게놈에 제시되었다. 실시예 3에 제공된 배양 조건에 따라 성장 실험을 수행하였다. 도 15는 각 참조 균주와 비교하여 상대 퍼센트로, 2'FL을 생성하는 숙주의 CPI (패널 A) 또는 DiFL을 생성하는 숙주의 CPI (패널 B), 및 DiFL 외수송 비율 (패널 C)을 나타낸다.
실시예 17: (30L) 발효 실행에서 3-FL 생산 대장균 숙주의 생산성을 향상시키는 막 단백질 MdfA.
TU1에서 발현되고, 숙주 게놈의 EcldhA 유전자좌에 존재하며, 플라스미드 유래의 α1,3-푸코실 트란스퍼라제 FT2를 발현하는 서열번호: 01의 막 단백질 유전자를 가진 3-FL 생산 대장균을 생물반응기 설정에서 이의 생산성에 대해 평가하였다. 실시예 3에 제공된 조건에 따라 8회의 발효 실행을 수행하였다. 또한, 3-FL 생산 숙주와 동일하지만 막 단백질 유전자가 결여된 참조 균주를 동일한 발효 설정에서 분석하였다. 도 16은 이러한 참조 균주와 비교하여, 8개의 상이한 발효 실행에서 서열번호: 02의 막 단백질 EcMdfA를 과발현하는 균주의 향상된 생산성을 나타낸다.
실시예 18: (30L) 발효 실행에서 3-FL 생산 대장균 숙주의 생산성을 향상시키는 막 단백질 IceT.
막 단백질을 발현하는 다른 3-FL 생산 대장균 숙주를 30L 생물반응기에서 이의 생산성에 대해 평가하였다. 상기 3-FL 균주는 제1 플라스미드 유래의 TU3에서 발현되는 서열번호: 05의 막 단백질 유전자 EcIceT 및 제2 플라스미드로부터 발현된 α1,3-푸코실 트란스퍼라제 FT2를 갖는다. 3-FL 생산 숙주와 동일하지만 막 단백질 유전자 구조체가 결여된 특정 참조 균주를 사용하여 동일한 발효 설정에서 3-FL 생산성을 분석하였다. 도 17은 특정 참조 균주와 비교하여 막 단백질을 과발현시키는 균주의 생산성이 향상되었음을 나타낸다.
실시예 19: 20 g/L 락토스가 보충된 최소 배지에서의 성장 실험에서 72시간 배양된 3-FL 대장균 숙주에서 3-FL 생성, 및/또는 3-FL 분비, 및/또는 성장 속도를 향상시키는, EcMdfA 또는 EcIceT에 상동인 막 단백질.
α1,3-푸코실 트란스퍼라제 효소 FT1 또는 FT2에 의해 3-FL 생산 숙주에서 세포내 생성되는 3-FL 생성 및/또는 3-FL의 분비를 향상시킬 수 있고 및/또는 3-FL 대장균 숙주의 성장 속도를 향상시키는, 서열번호: 120의 막 단백질 (서열번호: 06의 EcIceT에 상동), 및 서열번호: 126, 128, 140, 146 및 150의 막 단백질 (서열번호: 02의 막 단백질 EcMdfA에 상동)을 평가하기 위한 실험을 설정하였다. 외수송 유전자가 다른 전사 유닛에 클로닝되었고, 3-FL 생산 숙주에 클론 벡터 (pSC101 ori)로 제시되었다. 실시예 3에 제공된 배양 조건에 따라 성장 실험을 수행하였다. 각 참조 균주와 비교하여 상대 퍼센트로, 도 18은 CPI를 나타내고, 도 19는 3-FL 외수송을 나타내며, 도 20은 성장 속도가 향상된 숙주를 나타내었다.
실시예 20: 폴리펩티드 서열들 간의 전체 동일성 퍼센트의 계산.
서열들의 비교를 위한 정렬 방법은 당해 분야에 잘 알려져 있으며, 이러한 방법은 GAP, BESTFIT, BLAST, FASTA 및 TFASTA를 포함한다. GAP는 Needleman 및 Wunsch의 알고리즘 ((1970) J Mol Biol 48: 443-453)을 사용하여, 두 서열들의 매치되는 수를 최대화하고 갭 (gap)의 수를 최소화하는, 두 서열들의 전체 (즉, 전체 서열에 걸쳐) 정렬을 찾는다. BLAST 알고리즘 (Altschul et al. (1990) J Mol Biol 215: 403-10)은 서열 동일성 퍼센트를 계산하고, 두 서열들 간의 유사성에 대한 통계적 분석을 수행하였다. BLAST 분석을 수행하기 위한 소프트웨어는 NCBI (National Centre for Biotechnology Information)를 통해 공개적으로 이용 가능하다. 상동체는 예를 들어 디폴트 쌍별 정렬 파라미터 (default pairwise alignment parameters), 및 퍼센트로 표시되는 스코어링 방법 (scoring method)을 사용하는, ClustalW 다중 서열 정렬 알고리즘 (ClustalW multiple sequence alignment algorithm) (버젼 1.83)을 사용하여 쉽게 확인될 수 있다. 유사성 및 동일성의 전체 퍼센트는 MatGAT 소프트웨어 패키지 (Campanella et al., BMC Bioinformatics. 2003 Jul 10;4:29. MatGAT: an application that generates similarity/identity matrices using protein or DNA sequences.)에서 이용 가능한 방법들 중 한 방법을 사용하여 결정될 수 있다. 당업자에게 명백한 바와 같이, 보존된 모티프들 간의 정렬을 최적화하기 위해 약간의 수동 편집이 수행될 수 있다. 또한, 상동체 확인을 위해 전장 서열을 사용하는 대신에, 특정 도메인이 또한 사용될 수 있다. 서열 동일성 값은 디폴트 파라미터를 사용하는 상기 언급한 프로그램을 사용하여, 전체 핵산 또는 아미노산 서열, 또는 선택된 도메인 또는 보존된 모티프(들)에 대해 결정될 수 있다. 국소 정렬의 경우, Smith-Waterman 알고리즘이 특히 유용하다 (Smith TF, Waterman MS (1981) J. Mol. Biol 147(1);195-7).
본 발명의 방법을 수행하는데 유용한 전장 폴리펩티드 서열들 간의 유사성 및 동일성의 전체 퍼센트는 MatGAT (Matrix Global Alignment Tool) 소프트웨어 (BMC Bioinformatics. 2003 4:29. MatGAT: an application that generates similarity/identity matrices using protein or DNA sequences. Campanella JJ, Bitincka L, S malley J; software hosted by Ledion Bitincka)를 사용하여 결정하였다. MatGAT는 데이터를 사전 정렬할 필요 없이 DNA 또는 단백질 서열에 대한 유사성/동일성 매트릭스를 생성한다. 이 프로그램은 Myers 및 Miller 전체 정렬 알고리즘을 사용하여 계열 쌍별 정렬을 수행하고, 유사성 및 동일성을 계산한 다음에, 결과를 거리 매트릭스. 1. CYP704-유사 폴리펩티드 (distance matrix. 1. CYP704-like polypeptides)에 배치하였다.
예시되는 분석 결과는 EcMdfA (서열번호: 2) 및 EcIceT (서열번호: 6)와 관련된 폴리펩티드 서열의 전장에 걸쳐 전체 동일성에 대해 도 21 및 22에 제시하였다. 서열 동일성은 대각선 구분선의 위쪽 절반에 표시된다. 비교에 사용된 파라미터는 하기와 같다: 스코어링 매트릭스 (Scoring matrix): Blosum62, 제1 갭 (First Gap): 12, 연장 갭 (Extending Gap): 2. 본 발명의 방법을 수행하는데 유용한 EcMdfA 막 단백질 및 이의 상동체 간의 서열 동일성 (퍼센트)은 일반적으로 80% 초과이다. 본 발명의 방법을 수행하는데 유용한 EcIceT 막 단백질 및 이의 상동체 간의 서열 동일성 퍼센트는 일반적으로 80% 초과이다.
실시예 21: 20 g/L 락토스가 보충된 최소 배지에서의 성장 실험에서 72시간 배양된 대장균 숙주에서 3-푸코실락토스 (3-FL) 생성을 향상시키는 막 단백질 확인
20 g/L 락토스가 보충된 최소 배지에서 성장하는 숙주 세포의 푸코실락토스 생성을 향상시키는 능력에 대해 막 단백질을 평가하기 위한 실험을 설정하였다. 서열번호: 52, 54, 56, 58, 60, 62, 64, 66, 70, 72, 74, 76, 80, 82, 84, 88, 90, 92, 94, 96, 98, 104, 184, 204 및 208의 막 단백질은 α1,3-푸코실트란스퍼라제 FT2를 발현하는 3-FL 생산 숙주에서 생성되는 3-FL 생성을 향상시킬 수 있음을 보여주었다. 후보 유전자가 전사 유닛 TU1, TU2, TU3, TU11 또는 TU12에서 조합되었고, pSC101 플라스미드로 3-FL 생산 숙주에 제시되었다. 실시예 3에 제공된 배양 조건에 따라 성장 실험을 수행하였다. 도 23은 각 참조 균주와 비교하여 상대 퍼센트로, 균주의 CPI를 나타낸다.
실시예 22: 20 g/L 락토스가 보충된 최소 배지에서의 성장 실험에서 72시간 배양된 대장균 숙주에서 2'-푸코실락토스 (2'-FL) 생성을 향상시키는 막 단백질 확인
20 g/L 락토스가 보충된 최소 배지에서 성장하는 숙주 세포의 푸코실락토스 생성을 향상시키는 능력에 대해 막 단백질을 평가하기 위한 실험을 설정하였다. 서열번호: 204 및 214의 막 단백질은 α1,2-푸코실트란스퍼라제 FT4를 발현하는 2'-FL 생산 숙주에서 생성되는 2'-FL 생성을 향상시킬 수 있음을 보여주었다. 후보 유전자가 전사 유닛 TU11에서 조합되었고, pSC101 플라스미드로 2'-FL 생산 숙주에 제시되었다. 실시예 3에 제공된 배양 조건에 따라 성장 실험을 수행하였다. 도 24는 각 참조 균주와 비교하여 상대 퍼센트로, 균주의 CPI를 나타낸다.
실시예 23: 20 g/L 락토스가 보충된 최소 배지에서의 성장 실험에서 72시간 배양된 대장균 숙주에서 2'-FL 분비를 향상시키는 막 단백질 확인
20 g/L 락토스가 보충된 최소 배지에서 성장하는 숙주 세포의 푸코실락토스 분비를 향상시키는 능력에 대해 막 단백질을 평가하기 위한 실험을 설정하였다. 서열번호: 206, 208, 214, 216 및 218의 막 단백질은 α1,2-푸코실트란스퍼라제 FT4를 발현하는 2'-FL 박테리아 생산 숙주에서 세포내 생성되는 2'-FL의 분비를 향상시킬 수 있음을 보여주었다. 후보 유전자가 전사 유닛 TU11에서 조합되었고, pSC101 플라스미드로 2'-FL 생산 숙주에 제시되었다. 실시예 3에 제공된 배양 조건에 따라 성장 실험을 수행하였다. 도 25는 각 참조 균주와 비교하여 상대 퍼센트로, 균주에서 2'-FL의 외수송 비율을 나타낸다.
SEQUENCE LISTING <110> Inbiose N.V. <120> Production of fucosyllactose in host cells <130> 007-pcT <150> 19187404.9 <151> 2019-07-19 <160> 220 <170> PatentIn version 3.5 <210> 1 <211> 1233 <212> DNA <213> Escherichia coli K12 MG1655 <400> 1 atgcaaaata aattagcttc cggtgccagg cttggacgtc aggcgttact tttccctctc 60 tgtctggtgc tttacgaatt ttcaacctat atcggcaacg atatgattca acccggtatg 120 ttggccgtgg tggaacaata tcaggcgggc attgattggg ttcctacttc gatgaccgcg 180 tatctggcgg gcgggatgtt tttacaatgg ctgctggggc cgctgtcgga tcgtattggt 240 cgccgtccgg tgatgctggc gggagtggtg tggtttatcg tcacctgtct ggcaatattg 300 ctggcgcaaa acattgaaca attcaccctg ttgcgcttct tgcagggcat aagcctctgt 360 ttcattggcg ctgtgggata cgccgcaatt caggaatcct tcgaagaggc ggtttgtatc 420 aagatcaccg cgctgatggc gaacgtggcg ctgattgctc cgctacttgg tccgctggtg 480 ggcgcggcgt ggatccatgt gctgccctgg gaggggatgt ttgttttgtt tgccgcattg 540 gcagcgatct cctttttcgg tctgcaacga gccatgcctg aaaccgccac gcgtataggc 600 gagaaactgt cactgaaaga actcggtcgt gactataagc tggtgctgaa gaacggccgc 660 tttgtggcgg gggcgctggc gctgggattc gttagtctgc cgttgctggc gtggatcgcc 720 cagtcgccga ttatcatcat taccggcgag cagttgagca gctatgaata tggcttgctg 780 caagtgccta ttttcggggc gttaattgcg ggtaacttgc tgttagcgcg tctgacctcg 840 cgccgcaccg tacgttcgct gattattatg ggcggctggc cgattatgat tggtctattg 900 gtcgctgctg cggcaacggt tatctcatcg cacgcgtatt tatggatgac tgccgggtta 960 agtatttatg ctttcggtat tggtctggcg aatgcgggac tggtgcgatt aaccctgttt 1020 gccagcgata tgagtaaagg tacggtttct gccgcgatgg gaatgctgca aatgctgatc 1080 tttaccgttg gtattgaaat cagcaaacat gcctggctga acgggggcaa cggactgttt 1140 aatctcttca accttgtcaa cggaattttg tggctgtcgc tgatggttat ctttttaaaa 1200 gataaacaga tgggaaattc tcacgaaggg taa 1233 <210> 2 <211> 410 <212> PRT <213> Escherichia coli K12 MG1655 <400> 2 Met Gln Asn Lys Leu Ala Ser Gly Ala Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln 35 40 45 Ala Gly Ile Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Ala Gly Val Val Trp Phe Ile Val Thr Cys 85 90 95 Leu Ala Ile Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Leu Leu Arg 100 105 110 Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Ile His Val Leu Pro Trp Glu Gly Met Phe Val Leu 165 170 175 Phe Ala Ala Leu Ala Ala Ile Ser Phe Phe Gly Leu Gln Arg Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Ile Gly Glu Lys Leu Ser Leu Lys Glu Leu 195 200 205 Gly Arg Asp Tyr Lys Leu Val Leu Lys Asn Gly Arg Phe Val Ala Gly 210 215 220 Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Ile Ile Ile Ile Thr Gly Glu Gln Leu Ser Ser Tyr Glu 245 250 255 Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn 260 265 270 Leu Leu Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile 275 280 285 Ile Met Gly Gly Trp Pro Ile Met Ile Gly Leu Leu Val Ala Ala Ala 290 295 300 Ala Thr Val Ile Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Ile Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Ile Ser 355 360 365 Lys His Ala Trp Leu Asn Gly Gly Asn Gly Leu Phe Asn Leu Phe Asn 370 375 380 Leu Val Asn Gly Ile Leu Trp Leu Ser Leu Met Val Ile Phe Leu Lys 385 390 395 400 Asp Lys Gln Met Gly Asn Ser His Glu Gly 405 410 <210> 3 <211> 1254 <212> DNA <213> Escherichia coli K12 MG1655 <400> 3 atgagccgta ctacaactgt tgatggcgct ccggcaagcg acactgacaa gcaaagcatt 60 tctcagccaa atcaatttat taaacgcggt acgccgcaat ttatgcgcgt caccctggcg 120 ctgttctctg ccggactggc aacatttgca cttctctatt gtgtgcagcc tatccttccg 180 gtgctttcgc aggagtttgg cttaaccccc gcgaacagta gtatttcact gtccatttcc 240 acggcgatgt tggctattgg tttgctgttt actggcccgc tatccgatgc cattggtcgc 300 aaaccagtga tggtcacggc gctactgttg gcctccattt gtacgttact ttcgacaatg 360 atgaccagct ggcacggcat tttgattatg cgcgccttga ttgggctttc gttaagtggc 420 gtggcagctg ttggcatgac ttatcttagc gaggaaatcc atcccagttt cgtggccttt 480 tcaatggggt tgtatatcag cggcaactca attggcggca tgagcggacg cttaattagc 540 ggtgtcttca cggacttttt caactggcga attgctctgg cggcaatcgg ttgtttcgcg 600 ctggcctcgg cgttgatgtt ctggaaaatc ctccctgaat cacgccattt tcgcccgact 660 tcgctgcgcc ctaagacgtt gtttatcaac tttcgtctgc actggcgtga ccggggatta 720 ccgttattgt tcgcagaagg ctttttgctg atggggtcgt tcgtcacgct gtttaattac 780 atcggctatc ggttgatgct ctccccctgg catgtcagtc aggccgtggt tggcttatta 840 tcgctggctt atttgaccgg tacatggagc tcacccaaag ccggaaccat gaccacccgc 900 tatgggcgtg gtccagtgat gttgttttcg acgggggtta tgctgtttgg tttactgatg 960 accttattca gctcgctgtg gctgatcttt gccggaatgt tactcttctc agcaggattc 1020 ttcgcagccc actcagtagc cagcagctgg atcggccccc gcgcaaaacg cgctaaaggc 1080 caggcctcct cgctgtatct gttcagttac tatctggggt cgagtattgc cgggacgctg 1140 ggtggtgttt tctggcataa ctatggctgg aacggcgtcg gcgcatttat tgctctgatg 1200 ctggtcattg ctctgctggt cgggacgcgt ttgcatcgtc gtctgcacgc ctaa 1254 <210> 4 <211> 417 <212> PRT <213> Escherichia coli K12 MG1655 <400> 4 Met Ser Arg Thr Thr Thr Val Asp Gly Ala Pro Ala Ser Asp Thr Asp 1 5 10 15 Lys Gln Ser Ile Ser Gln Pro Asn Gln Phe Ile Lys Arg Gly Thr Pro 20 25 30 Gln Phe Met Arg Val Thr Leu Ala Leu Phe Ser Ala Gly Leu Ala Thr 35 40 45 Phe Ala Leu Leu Tyr Cys Val Gln Pro Ile Leu Pro Val Leu Ser Gln 50 55 60 Glu Phe Gly Leu Thr Pro Ala Asn Ser Ser Ile Ser Leu Ser Ile Ser 65 70 75 80 Thr Ala Met Leu Ala Ile Gly Leu Leu Phe Thr Gly Pro Leu Ser Asp 85 90 95 Ala Ile Gly Arg Lys Pro Val Met Val Thr Ala Leu Leu Leu Ala Ser 100 105 110 Ile Cys Thr Leu Leu Ser Thr Met Met Thr Ser Trp His Gly Ile Leu 115 120 125 Ile Met Arg Ala Leu Ile Gly Leu Ser Leu Ser Gly Val Ala Ala Val 130 135 140 Gly Met Thr Tyr Leu Ser Glu Glu Ile His Pro Ser Phe Val Ala Phe 145 150 155 160 Ser Met Gly Leu Tyr Ile Ser Gly Asn Ser Ile Gly Gly Met Ser Gly 165 170 175 Arg Leu Ile Ser Gly Val Phe Thr Asp Phe Phe Asn Trp Arg Ile Ala 180 185 190 Leu Ala Ala Ile Gly Cys Phe Ala Leu Ala Ser Ala Leu Met Phe Trp 195 200 205 Lys Ile Leu Pro Glu Ser Arg His Phe Arg Pro Thr Ser Leu Arg Pro 210 215 220 Lys Thr Leu Phe Ile Asn Phe Arg Leu His Trp Arg Asp Arg Gly Leu 225 230 235 240 Pro Leu Leu Phe Ala Glu Gly Phe Leu Leu Met Gly Ser Phe Val Thr 245 250 255 Leu Phe Asn Tyr Ile Gly Tyr Arg Leu Met Leu Ser Pro Trp His Val 260 265 270 Ser Gln Ala Val Val Gly Leu Leu Ser Leu Ala Tyr Leu Thr Gly Thr 275 280 285 Trp Ser Ser Pro Lys Ala Gly Thr Met Thr Thr Arg Tyr Gly Arg Gly 290 295 300 Pro Val Met Leu Phe Ser Thr Gly Val Met Leu Phe Gly Leu Leu Met 305 310 315 320 Thr Leu Phe Ser Ser Leu Trp Leu Ile Phe Ala Gly Met Leu Leu Phe 325 330 335 Ser Ala Gly Phe Phe Ala Ala His Ser Val Ala Ser Ser Trp Ile Gly 340 345 350 Pro Arg Ala Lys Arg Ala Lys Gly Gln Ala Ser Ser Leu Tyr Leu Phe 355 360 365 Ser Tyr Tyr Leu Gly Ser Ser Ile Ala Gly Thr Leu Gly Gly Val Phe 370 375 380 Trp His Asn Tyr Gly Trp Asn Gly Val Gly Ala Phe Ile Ala Leu Met 385 390 395 400 Leu Val Ile Ala Leu Leu Val Gly Thr Arg Leu His Arg Arg Leu His 405 410 415 Ala <210> 5 <211> 1416 <212> DNA <213> Escherichia coli K12 MG1655 <400> 5 atgacagatc ttcccgacag cacccgttgg caattgtgga ttgtggcttt cggcttcttt 60 atgcagtcgc tggacaccac catcgtaaac accgcccttc cctcaatggc gcaaagcctc 120 ggggaaagtc cgttgcatat gcacatggtc attgtctctt atgtgctgac cgtggcggtg 180 atgctgcccg ccagcggctg gctggcggac aaagtcggcg tgcgcaatat tttctttacc 240 gccatcgtgc tgtttactct cggttcactg ttttgcgcgc tttccggcac gctgaacgaa 300 ctgttgctgg cacgcgcgtt acagggcgtt ggcggcgcga tgatggtgcc ggtcggcaga 360 ttgacggtga tgaaaatcgt accgcgcgag caatatatgg cggcgatgac ctttgtcacg 420 ttacccggtc aggtcggtcc gctgctcggt ccggcgctcg gcggtctgct ggtggagtac 480 gcatcgtggc actggatctt tttgatcaac attccggtgg ggattatcgg tgcgatcgcc 540 acattgctgt taatgccgaa ctacaccatg cagacgcggc gctttgatct ctccggattt 600 ttattgctgg cggttggcat ggcggtatta accctggcgc tggacggcag taaaggtaca 660 ggtttatcgc cgctgacgat tgcaggcctg gtcgcagttg gcgtggtggc actggtgctt 720 tatctgctgc acgccagaaa taacaaccgt gccctgttca gtctgaaact gttccgtact 780 cgtacctttt cgctgggcct ggcggggagc tttgccggac gtattggcag tggcatgttg 840 ccctttatga caccggtttt cctgcaaatt ggcctcggtt tctcgccgtt tcatgccgga 900 ctgatgatga tcccgatggt gcttggcagc atgggaatga agcgaattgt ggtacaggtg 960 gtgaatcgct ttggttatcg tcgggtactg gtagcgacca cgctgggtct gtcgctggtc 1020 accctgttgt ttatgactac cgccctgctg ggctggtact acgttttgcc gttcgtcctg 1080 tttttacaag ggatggtcaa ctcgacgcgt ttctcctcca tgaacaccct gacgctgaaa 1140 gatctcccgg acaatctggc gagcagcggc aacagcctgc tgtcgatgat tatgcaattg 1200 tcgatgagta tcggcgtcac tatcgccggg ctgttgctgg gactttttgg ttcacagcat 1260 gtcagcgtcg acagcggcac cacacaaacc gtctttatgt acacctggct tagcatggcg 1320 ttgatcatcg cccttccggc gttcatcttt gccagagtgc cgaacgatac gcatcaaaat 1380 gtagctattt cgcggcgaaa aaggagcgcg caataa 1416 <210> 6 <211> 471 <212> PRT <213> Escherichia coli K12 MG1655 <400> 6 Met Thr Asp Leu Pro Asp Ser Thr Arg Trp Gln Leu Trp Ile Val Ala 1 5 10 15 Phe Gly Phe Phe Met Gln Ser Leu Asp Thr Thr Ile Val Asn Thr Ala 20 25 30 Leu Pro Ser Met Ala Gln Ser Leu Gly Glu Ser Pro Leu His Met His 35 40 45 Met Val Ile Val Ser Tyr Val Leu Thr Val Ala Val Met Leu Pro Ala 50 55 60 Ser Gly Trp Leu Ala Asp Lys Val Gly Val Arg Asn Ile Phe Phe Thr 65 70 75 80 Ala Ile Val Leu Phe Thr Leu Gly Ser Leu Phe Cys Ala Leu Ser Gly 85 90 95 Thr Leu Asn Glu Leu Leu Leu Ala Arg Ala Leu Gln Gly Val Gly Gly 100 105 110 Ala Met Met Val Pro Val Gly Arg Leu Thr Val Met Lys Ile Val Pro 115 120 125 Arg Glu Gln Tyr Met Ala Ala Met Thr Phe Val Thr Leu Pro Gly Gln 130 135 140 Val Gly Pro Leu Leu Gly Pro Ala Leu Gly Gly Leu Leu Val Glu Tyr 145 150 155 160 Ala Ser Trp His Trp Ile Phe Leu Ile Asn Ile Pro Val Gly Ile Ile 165 170 175 Gly Ala Ile Ala Thr Leu Leu Leu Met Pro Asn Tyr Thr Met Gln Thr 180 185 190 Arg Arg Phe Asp Leu Ser Gly Phe Leu Leu Leu Ala Val Gly Met Ala 195 200 205 Val Leu Thr Leu Ala Leu Asp Gly Ser Lys Gly Thr Gly Leu Ser Pro 210 215 220 Leu Thr Ile Ala Gly Leu Val Ala Val Gly Val Val Ala Leu Val Leu 225 230 235 240 Tyr Leu Leu His Ala Arg Asn Asn Asn Arg Ala Leu Phe Ser Leu Lys 245 250 255 Leu Phe Arg Thr Arg Thr Phe Ser Leu Gly Leu Ala Gly Ser Phe Ala 260 265 270 Gly Arg Ile Gly Ser Gly Met Leu Pro Phe Met Thr Pro Val Phe Leu 275 280 285 Gln Ile Gly Leu Gly Phe Ser Pro Phe His Ala Gly Leu Met Met Ile 290 295 300 Pro Met Val Leu Gly Ser Met Gly Met Lys Arg Ile Val Val Gln Val 305 310 315 320 Val Asn Arg Phe Gly Tyr Arg Arg Val Leu Val Ala Thr Thr Leu Gly 325 330 335 Leu Ser Leu Val Thr Leu Leu Phe Met Thr Thr Ala Leu Leu Gly Trp 340 345 350 Tyr Tyr Val Leu Pro Phe Val Leu Phe Leu Gln Gly Met Val Asn Ser 355 360 365 Thr Arg Phe Ser Ser Met Asn Thr Leu Thr Leu Lys Asp Leu Pro Asp 370 375 380 Asn Leu Ala Ser Ser Gly Asn Ser Leu Leu Ser Met Ile Met Gln Leu 385 390 395 400 Ser Met Ser Ile Gly Val Thr Ile Ala Gly Leu Leu Leu Gly Leu Phe 405 410 415 Gly Ser Gln His Val Ser Val Asp Ser Gly Thr Thr Gln Thr Val Phe 420 425 430 Met Tyr Thr Trp Leu Ser Met Ala Leu Ile Ile Ala Leu Pro Ala Phe 435 440 445 Ile Phe Ala Arg Val Pro Asn Asp Thr His Gln Asn Val Ala Ile Ser 450 455 460 Arg Arg Lys Arg Ser Ala Gln 465 470 <210> 7 <211> 1218 <212> DNA <213> Escherichia coli K12 MG1655 <400> 7 atgcccgaac ccgtagccga acccgcgcta aacggattgc gcctgaattt gcgcattgtc 60 tctatagtca tgtttaactt cgccagctac ctcaccatcg ggttgccgct cgctgtatta 120 ccgggctatg tccatgatgt gatgggcttt agcgccttct gggcaggatt ggttatcagc 180 ctgcaatatt tcgccacctt gctgagccgc cctcatgccg gacgttacgc cgattcgctg 240 ggacccaaaa agattgtcgt cttcggttta tgcggctgct ttttgagcgg tctggggtat 300 ctgacggcag gattaaccgc cagtctgcct gtcatcagcc tgttattact ttgcctgggg 360 cgcgtcatcc ttgggattgg gcaaagtttt gccggaacgg gatcgaccct atggggcgtt 420 ggcgtggttg gctcgctgca tatcgggcgg gtgatttcgt ggaacggcat tgtcacttac 480 ggggcgatgg cgatgggtgc gccgttaggc gtcgtgtttt atcactgggg cggcttgcag 540 gcgttagcgt taatcattat gggcgtggcg ctggtggcca ttttgttggc gatcccgcgt 600 ccgacggtaa aagccagtaa aggcaaaccg ctgccgtttc gcgcggtgct tgggcgcgtc 660 tggctgtacg gtatggcgct ggcactggct tccgccggat ttggcgtcat cgccaccttt 720 atcacgctgt tttatgacgc taaaggttgg gacggtgcgg ctttcgcgct gacgctgttt 780 agctgtgcgt ttgtcggtac gcgtttgtta ttccctaacg gcattaaccg tatcggtggc 840 ttaaacgtag cgatgatttg ctttagcgtt gagataatcg gcctgctact ggttggcgtg 900 gcgactatgc cgtggatggc gaaaatcggc gtcttactgg cgggggccgg gttttcgctg 960 gtgttcccgg cattgggtgt agtggcggta aaagcggttc cgcagcaaaa tcagggggcg 1020 gcgctggcaa cttacaccgt atttatggat ttatcgcttg gcgtgactgg accactggct 1080 gggctggtga tgagctgggc gggcgtaccg gtgatttatc tggcggcggc gggactggtc 1140 gcaatcgcgt tattactgac gtggcgatta aaaaaacggc ctccggaaca cgtccctgag 1200 gccgcctcat catcttaa 1218 <210> 8 <211> 405 <212> PRT <213> Escherichia coli K12 MG1655 <400> 8 Met Pro Glu Pro Val Ala Glu Pro Ala Leu Asn Gly Leu Arg Leu Asn 1 5 10 15 Leu Arg Ile Val Ser Ile Val Met Phe Asn Phe Ala Ser Tyr Leu Thr 20 25 30 Ile Gly Leu Pro Leu Ala Val Leu Pro Gly Tyr Val His Asp Val Met 35 40 45 Gly Phe Ser Ala Phe Trp Ala Gly Leu Val Ile Ser Leu Gln Tyr Phe 50 55 60 Ala Thr Leu Leu Ser Arg Pro His Ala Gly Arg Tyr Ala Asp Ser Leu 65 70 75 80 Gly Pro Lys Lys Ile Val Val Phe Gly Leu Cys Gly Cys Phe Leu Ser 85 90 95 Gly Leu Gly Tyr Leu Thr Ala Gly Leu Thr Ala Ser Leu Pro Val Ile 100 105 110 Ser Leu Leu Leu Leu Cys Leu Gly Arg Val Ile Leu Gly Ile Gly Gln 115 120 125 Ser Phe Ala Gly Thr Gly Ser Thr Leu Trp Gly Val Gly Val Val Gly 130 135 140 Ser Leu His Ile Gly Arg Val Ile Ser Trp Asn Gly Ile Val Thr Tyr 145 150 155 160 Gly Ala Met Ala Met Gly Ala Pro Leu Gly Val Val Phe Tyr His Trp 165 170 175 Gly Gly Leu Gln Ala Leu Ala Leu Ile Ile Met Gly Val Ala Leu Val 180 185 190 Ala Ile Leu Leu Ala Ile Pro Arg Pro Thr Val Lys Ala Ser Lys Gly 195 200 205 Lys Pro Leu Pro Phe Arg Ala Val Leu Gly Arg Val Trp Leu Tyr Gly 210 215 220 Met Ala Leu Ala Leu Ala Ser Ala Gly Phe Gly Val Ile Ala Thr Phe 225 230 235 240 Ile Thr Leu Phe Tyr Asp Ala Lys Gly Trp Asp Gly Ala Ala Phe Ala 245 250 255 Leu Thr Leu Phe Ser Cys Ala Phe Val Gly Thr Arg Leu Leu Phe Pro 260 265 270 Asn Gly Ile Asn Arg Ile Gly Gly Leu Asn Val Ala Met Ile Cys Phe 275 280 285 Ser Val Glu Ile Ile Gly Leu Leu Leu Val Gly Val Ala Thr Met Pro 290 295 300 Trp Met Ala Lys Ile Gly Val Leu Leu Ala Gly Ala Gly Phe Ser Leu 305 310 315 320 Val Phe Pro Ala Leu Gly Val Val Ala Val Lys Ala Val Pro Gln Gln 325 330 335 Asn Gln Gly Ala Ala Leu Ala Thr Tyr Thr Val Phe Met Asp Leu Ser 340 345 350 Leu Gly Val Thr Gly Pro Leu Ala Gly Leu Val Met Ser Trp Ala Gly 355 360 365 Val Pro Val Ile Tyr Leu Ala Ala Ala Gly Leu Val Ala Ile Ala Leu 370 375 380 Leu Leu Thr Trp Arg Leu Lys Lys Arg Pro Pro Glu His Val Pro Glu 385 390 395 400 Ala Ala Ser Ser Ser 405 <210> 9 <211> 1185 <212> DNA <213> Escherichia coli K12 MG1655 <400> 9 atgaaaaggc aaagaaacgt caatttgtta ttgatgttgg tattactcgt ggccgtcggt 60 cagatggcgc aaaccattta tattccagct attgccgata tggcgcgcga tctcaacgtc 120 cgtgaagggg cggtgcagag cgtaatgggc gcttatctgc tgacttacgg tgtctcacag 180 ctgttttatg gcccgatttc cgaccgcgtg ggccgccgac cggtgatcct cgtcggaatg 240 tccattttta tgctggcaac gctggtcgcg gtcacgacct ccagtttgac ggtgttgatt 300 gccgccagcg cgatgcaggg gatgggcacc ggcgttggcg gcgtaatggc gcgtacttta 360 ccgcgagatt tatatgaacg gacacagttg cgccatgcta acagcctgtt aaacatgggg 420 attctcgtca gtccgttgct cgcaccgcta atcggcggtc tgctggatac gatgtggaac 480 tggcgcgcct gttatctctt tttgttggtt ctttgtgctg gtgtgacctt cagtatggcc 540 cgctggatgc cggaaacgcg tccggtcgat gcaccgcgca cgcgcctgct taccagttat 600 aaaacgcttt tcggtaacag cggttttaac tgttatttgc tgatgctgat tggcggtctg 660 gccgggattg ccgcctttga agcctgctcc ggcgtgctga tgggcgcggt gttagggctg 720 agcagtatga cggtcagtat tttgtttatt ctgccgattc cggcagcgtt ttttggcgca 780 tggtttgccg gacgtcccaa taaacgcttc tccacgttaa tgtggcagtc ggttatctgc 840 tgcctgctgg ctggcttgct gatgtggatc cccgactggt ttggcgtgat gaatgtctgg 900 acgctgctcg ttcccgccgc gctgttcttt ttcggtgccg ggatgctgtt tccgctggcg 960 accagcggcg cgatggagcc gttccccttc ctggcgggca cggctggcgc gctggtcggc 1020 ggtctgcaaa acattggttc cggcgtgctg gcgtcgctct ctgcgatgtt gccgcaaacc 1080 ggtcagggca gcctggggtt gttgatgacc ttaatgggat tgttgatcgt gctgtgctgg 1140 ctgccgctgg cgacgcggat gtcgcatcag gggcagcccg tttaa 1185 <210> 10 <211> 394 <212> PRT <213> Escherichia coli K12 MG1655 <400> 10 Met Lys Arg Gln Arg Asn Val Asn Leu Leu Leu Met Leu Val Leu Leu 1 5 10 15 Val Ala Val Gly Gln Met Ala Gln Thr Ile Tyr Ile Pro Ala Ile Ala 20 25 30 Asp Met Ala Arg Asp Leu Asn Val Arg Glu Gly Ala Val Gln Ser Val 35 40 45 Met Gly Ala Tyr Leu Leu Thr Tyr Gly Val Ser Gln Leu Phe Tyr Gly 50 55 60 Pro Ile Ser Asp Arg Val Gly Arg Arg Pro Val Ile Leu Val Gly Met 65 70 75 80 Ser Ile Phe Met Leu Ala Thr Leu Val Ala Val Thr Thr Ser Ser Leu 85 90 95 Thr Val Leu Ile Ala Ala Ser Ala Met Gln Gly Met Gly Thr Gly Val 100 105 110 Gly Gly Val Met Ala Arg Thr Leu Pro Arg Asp Leu Tyr Glu Arg Thr 115 120 125 Gln Leu Arg His Ala Asn Ser Leu Leu Asn Met Gly Ile Leu Val Ser 130 135 140 Pro Leu Leu Ala Pro Leu Ile Gly Gly Leu Leu Asp Thr Met Trp Asn 145 150 155 160 Trp Arg Ala Cys Tyr Leu Phe Leu Leu Val Leu Cys Ala Gly Val Thr 165 170 175 Phe Ser Met Ala Arg Trp Met Pro Glu Thr Arg Pro Val Asp Ala Pro 180 185 190 Arg Thr Arg Leu Leu Thr Ser Tyr Lys Thr Leu Phe Gly Asn Ser Gly 195 200 205 Phe Asn Cys Tyr Leu Leu Met Leu Ile Gly Gly Leu Ala Gly Ile Ala 210 215 220 Ala Phe Glu Ala Cys Ser Gly Val Leu Met Gly Ala Val Leu Gly Leu 225 230 235 240 Ser Ser Met Thr Val Ser Ile Leu Phe Ile Leu Pro Ile Pro Ala Ala 245 250 255 Phe Phe Gly Ala Trp Phe Ala Gly Arg Pro Asn Lys Arg Phe Ser Thr 260 265 270 Leu Met Trp Gln Ser Val Ile Cys Cys Leu Leu Ala Gly Leu Leu Met 275 280 285 Trp Ile Pro Asp Trp Phe Gly Val Met Asn Val Trp Thr Leu Leu Val 290 295 300 Pro Ala Ala Leu Phe Phe Phe Gly Ala Gly Met Leu Phe Pro Leu Ala 305 310 315 320 Thr Ser Gly Ala Met Glu Pro Phe Pro Phe Leu Ala Gly Thr Ala Gly 325 330 335 Ala Leu Val Gly Gly Leu Gln Asn Ile Gly Ser Gly Val Leu Ala Ser 340 345 350 Leu Ser Ala Met Leu Pro Gln Thr Gly Gln Gly Ser Leu Gly Leu Leu 355 360 365 Met Thr Leu Met Gly Leu Leu Ile Val Leu Cys Trp Leu Pro Leu Ala 370 375 380 Thr Arg Met Ser His Gln Gly Gln Pro Val 385 390 <210> 11 <211> 1212 <212> DNA <213> Escherichia coli K12 MG1655 <400> 11 atgcaacctg ggaaaagatt tttagtctgg ctggcgggtt tgagcgtact cggttttctg 60 gcaaccgata tgtatctgcc tgctttcgcc gccatacagg ccgacctgca aacgcctgcg 120 tctgctgtca gtgccagcct tagtctgttc cttgccggtt ttgccgcagc ccagcttctg 180 tgggggccgc tctccgaccg ttatggtcgt aaaccggtat tattaatcgg cctgacaatt 240 tttgcgttag gtagtctggg gatgctgtgg gtagaaaacg ccgctacgct gctggtattg 300 cgttttgtac aggctgtggg tgtctgcgcc gcggcggtta tctggcaagc attagtgaca 360 gattattatc cttcacagaa agttaaccgt atttttgcgg ccatcatgcc gctggtgggt 420 ctatctccgg cactggctcc tctgttagga agctggctgc tggtccattt ttcctggcag 480 gcgattttcg ccaccctgtt tgccattacc gtggtgctga ttctgcctat tttctggctc 540 aaacccacga cgaaggcccg taacaatagt caggatggtc tgacctttac cgacctgcta 600 cgttctaaaa cctatcgcgg caacgtgctg atatacgcag cctgttcagc cagttttttt 660 gcatggctga ccggttcacc gttcatcctt agtgaaatgg gctacagccc ggcagttatt 720 ggtttaagtt atgtcccgca aactatcgcg tttctgattg gtggttatgg ctgtcgcgcc 780 gcgctgcaga aatggcaagg caagcagtta ttaccgtggt tgctggtgct gtttgctgtc 840 agcgtcattg cgacctgggc tgcgggcttc attagccatg tgtcgctggt cgaaatcctg 900 atcccattct gtgtgatggc gattgccaat ggcgcgatct accctattgt tgtcgcccag 960 gcgctgcgtc ccttcccaca cgcaactggt cgcgccgcag cgttgcagaa cactcttcaa 1020 ctgggtctgt gcttcctcgc aagtctggta gtttcctggc tgatcagtat cagcacgcca 1080 ttgctcacca ccaccagcgt gatgttatca acagtagtgc tggtcgcgct gggttacatg 1140 atgcaacgtt gtgaagaagt tggctgccag aatcatggca atgccgaagt cgctcatagc 1200 gaatcacact aa 1212 <210> 12 <211> 403 <212> PRT <213> Escherichia coli K12 MG1655 <400> 12 Met Gln Pro Gly Lys Arg Phe Leu Val Trp Leu Ala Gly Leu Ser Val 1 5 10 15 Leu Gly Phe Leu Ala Thr Asp Met Tyr Leu Pro Ala Phe Ala Ala Ile 20 25 30 Gln Ala Asp Leu Gln Thr Pro Ala Ser Ala Val Ser Ala Ser Leu Ser 35 40 45 Leu Phe Leu Ala Gly Phe Ala Ala Ala Gln Leu Leu Trp Gly Pro Leu 50 55 60 Ser Asp Arg Tyr Gly Arg Lys Pro Val Leu Leu Ile Gly Leu Thr Ile 65 70 75 80 Phe Ala Leu Gly Ser Leu Gly Met Leu Trp Val Glu Asn Ala Ala Thr 85 90 95 Leu Leu Val Leu Arg Phe Val Gln Ala Val Gly Val Cys Ala Ala Ala 100 105 110 Val Ile Trp Gln Ala Leu Val Thr Asp Tyr Tyr Pro Ser Gln Lys Val 115 120 125 Asn Arg Ile Phe Ala Ala Ile Met Pro Leu Val Gly Leu Ser Pro Ala 130 135 140 Leu Ala Pro Leu Leu Gly Ser Trp Leu Leu Val His Phe Ser Trp Gln 145 150 155 160 Ala Ile Phe Ala Thr Leu Phe Ala Ile Thr Val Val Leu Ile Leu Pro 165 170 175 Ile Phe Trp Leu Lys Pro Thr Thr Lys Ala Arg Asn Asn Ser Gln Asp 180 185 190 Gly Leu Thr Phe Thr Asp Leu Leu Arg Ser Lys Thr Tyr Arg Gly Asn 195 200 205 Val Leu Ile Tyr Ala Ala Cys Ser Ala Ser Phe Phe Ala Trp Leu Thr 210 215 220 Gly Ser Pro Phe Ile Leu Ser Glu Met Gly Tyr Ser Pro Ala Val Ile 225 230 235 240 Gly Leu Ser Tyr Val Pro Gln Thr Ile Ala Phe Leu Ile Gly Gly Tyr 245 250 255 Gly Cys Arg Ala Ala Leu Gln Lys Trp Gln Gly Lys Gln Leu Leu Pro 260 265 270 Trp Leu Leu Val Leu Phe Ala Val Ser Val Ile Ala Thr Trp Ala Ala 275 280 285 Gly Phe Ile Ser His Val Ser Leu Val Glu Ile Leu Ile Pro Phe Cys 290 295 300 Val Met Ala Ile Ala Asn Gly Ala Ile Tyr Pro Ile Val Val Ala Gln 305 310 315 320 Ala Leu Arg Pro Phe Pro His Ala Thr Gly Arg Ala Ala Ala Leu Gln 325 330 335 Asn Thr Leu Gln Leu Gly Leu Cys Phe Leu Ala Ser Leu Val Val Ser 340 345 350 Trp Leu Ile Ser Ile Ser Thr Pro Leu Leu Thr Thr Thr Ser Val Met 355 360 365 Leu Ser Thr Val Val Leu Val Ala Leu Gly Tyr Met Met Gln Arg Cys 370 375 380 Glu Glu Val Gly Cys Gln Asn His Gly Asn Ala Glu Val Ala His Ser 385 390 395 400 Glu Ser His <210> 13 <211> 1251 <212> DNA <213> Escherichia coli K12 MG1655 <400> 13 atgaataaac aatcctggct gcttaacctc agcctgttga aaacgcaccc ggcgtttcgc 60 gcagtattcc tcgctcgttt catctcaatt gtgtctctgg gtttgctcgg cgtcgcggtg 120 ccggtgcaga tccagatgat gacacattcc acctggcagg tggggctttc ggtgacgctg 180 accggcggcg cgatgtttgt tggcctgatg gtcggcggtg tgctggcgga tcgctatgag 240 cgcaaaaaag tgattttgct ggcgcgcggc acctgtggca ttggcttcat tggactgtgc 300 cttaatgcac tgctgccgga gccgtcattg ctggcaatct atttacttgg tttatgggat 360 ggttttttcg catcgcttgg cgttacggcg ctattggcgg cgacaccagc actggtaggg 420 cgtgaaaact taatgcaggc cggggcgatc accatgttga ccgtgcgtct ggggtcggtg 480 atttcgccca tgattggcgg tttattgctg gcgaccggtg gcgtagcctg gaactacggg 540 ctggcggcgg cgggcacgtt tattaccttg ctaccgttgt taagccttcc ggcgttgcca 600 ccgccaccgc agccgcgtga gcatccgttg aaatcattac tggcaggatt tcgttttctg 660 cttgccagcc cgctggtggg cgggattgcg ctgctgggtg gtttattgac gatggcgagc 720 gcggtgcggg tactgtatcc ggcgctggct gacaactggc agatgtcagc ggcacagatt 780 ggttttctct acgcggcgat cccgctcggc gcggctattg gtgcgttaac cagcgggaag 840 ctggcacata gtgcgcgacc agggttattg atgctgctct ccacgctggg atcgttcctc 900 gccattggtc tgtttggcct gatgccgatg tggattttag gcgtggtttg tctggcgctg 960 ttcggctggt tgagtgcggt cagctcgttg ctgcaataca caatgctgca aacgcaaacc 1020 ccggaagcga tgttagggcg gattaacggt ttgtggacgg cgcagaacgt gacgggcgat 1080 gccataggcg cggcgctgct gggtggtttg ggcgcgatga tgacaccggt tgcttccgca 1140 agcgcgagcg gttttggttt gttgattatc ggcgtgttgt tattgctggt gctggtggag 1200 ttgcgacatt ttcgccagac gccgccgcag gtgacagcgt ccgacagtta a 1251 <210> 14 <211> 416 <212> PRT <213> Escherichia coli K12 MG1655 <400> 14 Met Asn Lys Gln Ser Trp Leu Leu Asn Leu Ser Leu Leu Lys Thr His 1 5 10 15 Pro Ala Phe Arg Ala Val Phe Leu Ala Arg Phe Ile Ser Ile Val Ser 20 25 30 Leu Gly Leu Leu Gly Val Ala Val Pro Val Gln Ile Gln Met Met Thr 35 40 45 His Ser Thr Trp Gln Val Gly Leu Ser Val Thr Leu Thr Gly Gly Ala 50 55 60 Met Phe Val Gly Leu Met Val Gly Gly Val Leu Ala Asp Arg Tyr Glu 65 70 75 80 Arg Lys Lys Val Ile Leu Leu Ala Arg Gly Thr Cys Gly Ile Gly Phe 85 90 95 Ile Gly Leu Cys Leu Asn Ala Leu Leu Pro Glu Pro Ser Leu Leu Ala 100 105 110 Ile Tyr Leu Leu Gly Leu Trp Asp Gly Phe Phe Ala Ser Leu Gly Val 115 120 125 Thr Ala Leu Leu Ala Ala Thr Pro Ala Leu Val Gly Arg Glu Asn Leu 130 135 140 Met Gln Ala Gly Ala Ile Thr Met Leu Thr Val Arg Leu Gly Ser Val 145 150 155 160 Ile Ser Pro Met Ile Gly Gly Leu Leu Leu Ala Thr Gly Gly Val Ala 165 170 175 Trp Asn Tyr Gly Leu Ala Ala Ala Gly Thr Phe Ile Thr Leu Leu Pro 180 185 190 Leu Leu Ser Leu Pro Ala Leu Pro Pro Pro Pro Gln Pro Arg Glu His 195 200 205 Pro Leu Lys Ser Leu Leu Ala Gly Phe Arg Phe Leu Leu Ala Ser Pro 210 215 220 Leu Val Gly Gly Ile Ala Leu Leu Gly Gly Leu Leu Thr Met Ala Ser 225 230 235 240 Ala Val Arg Val Leu Tyr Pro Ala Leu Ala Asp Asn Trp Gln Met Ser 245 250 255 Ala Ala Gln Ile Gly Phe Leu Tyr Ala Ala Ile Pro Leu Gly Ala Ala 260 265 270 Ile Gly Ala Leu Thr Ser Gly Lys Leu Ala His Ser Ala Arg Pro Gly 275 280 285 Leu Leu Met Leu Leu Ser Thr Leu Gly Ser Phe Leu Ala Ile Gly Leu 290 295 300 Phe Gly Leu Met Pro Met Trp Ile Leu Gly Val Val Cys Leu Ala Leu 305 310 315 320 Phe Gly Trp Leu Ser Ala Val Ser Ser Leu Leu Gln Tyr Thr Met Leu 325 330 335 Gln Thr Gln Thr Pro Glu Ala Met Leu Gly Arg Ile Asn Gly Leu Trp 340 345 350 Thr Ala Gln Asn Val Thr Gly Asp Ala Ile Gly Ala Ala Leu Leu Gly 355 360 365 Gly Leu Gly Ala Met Met Thr Pro Val Ala Ser Ala Ser Ala Ser Gly 370 375 380 Phe Gly Leu Leu Ile Ile Gly Val Leu Leu Leu Leu Val Leu Val Glu 385 390 395 400 Leu Arg His Phe Arg Gln Thr Pro Pro Gln Val Thr Ala Ser Asp Ser 405 410 415 <210> 15 <211> 1188 <212> DNA <213> Escherichia coli K12 MG1655 <400> 15 atgaacttat ccctacgacg ctctaccagc gcccttcttg cctcgtcgtt gttattaacc 60 atcggacgcg gcgctacgct gccatttatg accatttact tgagtcgcca gtacagcctg 120 agtgtcgatc taatcggtta tgcgatgaca attgcgctca ctattggcgt cgtttttagc 180 ctcggttttg gtatcctggc ggataagttc gacaagaaac gctatatgtt actggcaatt 240 accgccttcg ccagcggttt tattgccatt actttagtga ataacgtgac gctggttgtg 300 ctcttttttg ccctcattaa ctgcgcctat tctgtttttg ctaccgtgct gaaagcctgg 360 tttgccgaca atctttcgtc caccagcaaa acgaaaatct tctcaatcaa ctacaccatg 420 ctaaacattg gctggaccat cggtccgccg ctcggcacgc tgttggtaat gcagagcatc 480 aatctgccct tctggctggc agctatctgt tccgcgtttc ccatgctttt cattcaaatt 540 tgggtaaagc gcagcgagaa aatcatcgcc acggaaacag gcagtgtctg gtcgccgaaa 600 gttttattac aagataaagc actgttgtgg tttacctgct ctggttttct ggcttctttt 660 gtaagcggcg catttgcttc atgcatttca caatatgtga tggtgattgc tgatggggat 720 tttgccgaaa aggtggtcgc ggttgttctt ccggtgaatg ctgccatggt ggttacgttg 780 caatattccg tgggccgccg acttaacccg gctaacatcc gcgcgctgat gacagcaggc 840 accctctgtt tcgtcatcgg tctggtcggt tttatttttt ccggcaacag cctgctattg 900 tggggtatgt cagctgcggt atttactgtc ggtgaaatca tttatgcgcc gggcgagtat 960 atgttgattg accatattgc gccgccagaa atgaaagcca gctatttttc cgcccagtct 1020 ttaggctggc ttggtgccgc gattaaccca ttagtgagtg gcgtagtgct aaccagcctg 1080 ccgccttcct cgctgtttgt catcttagcg ttggtgatca ttgctgcgtg ggtgctgatg 1140 ttaaaaggga ttcgagcaag accgtggggg cagcccgcgc tttgttaa 1188 <210> 16 <211> 395 <212> PRT <213> Escherichia coli K12 MG1655 <400> 16 Met Asn Leu Ser Leu Arg Arg Ser Thr Ser Ala Leu Leu Ala Ser Ser 1 5 10 15 Leu Leu Leu Thr Ile Gly Arg Gly Ala Thr Leu Pro Phe Met Thr Ile 20 25 30 Tyr Leu Ser Arg Gln Tyr Ser Leu Ser Val Asp Leu Ile Gly Tyr Ala 35 40 45 Met Thr Ile Ala Leu Thr Ile Gly Val Val Phe Ser Leu Gly Phe Gly 50 55 60 Ile Leu Ala Asp Lys Phe Asp Lys Lys Arg Tyr Met Leu Leu Ala Ile 65 70 75 80 Thr Ala Phe Ala Ser Gly Phe Ile Ala Ile Thr Leu Val Asn Asn Val 85 90 95 Thr Leu Val Val Leu Phe Phe Ala Leu Ile Asn Cys Ala Tyr Ser Val 100 105 110 Phe Ala Thr Val Leu Lys Ala Trp Phe Ala Asp Asn Leu Ser Ser Thr 115 120 125 Ser Lys Thr Lys Ile Phe Ser Ile Asn Tyr Thr Met Leu Asn Ile Gly 130 135 140 Trp Thr Ile Gly Pro Pro Leu Gly Thr Leu Leu Val Met Gln Ser Ile 145 150 155 160 Asn Leu Pro Phe Trp Leu Ala Ala Ile Cys Ser Ala Phe Pro Met Leu 165 170 175 Phe Ile Gln Ile Trp Val Lys Arg Ser Glu Lys Ile Ile Ala Thr Glu 180 185 190 Thr Gly Ser Val Trp Ser Pro Lys Val Leu Leu Gln Asp Lys Ala Leu 195 200 205 Leu Trp Phe Thr Cys Ser Gly Phe Leu Ala Ser Phe Val Ser Gly Ala 210 215 220 Phe Ala Ser Cys Ile Ser Gln Tyr Val Met Val Ile Ala Asp Gly Asp 225 230 235 240 Phe Ala Glu Lys Val Val Ala Val Val Leu Pro Val Asn Ala Ala Met 245 250 255 Val Val Thr Leu Gln Tyr Ser Val Gly Arg Arg Leu Asn Pro Ala Asn 260 265 270 Ile Arg Ala Leu Met Thr Ala Gly Thr Leu Cys Phe Val Ile Gly Leu 275 280 285 Val Gly Phe Ile Phe Ser Gly Asn Ser Leu Leu Leu Trp Gly Met Ser 290 295 300 Ala Ala Val Phe Thr Val Gly Glu Ile Ile Tyr Ala Pro Gly Glu Tyr 305 310 315 320 Met Leu Ile Asp His Ile Ala Pro Pro Glu Met Lys Ala Ser Tyr Phe 325 330 335 Ser Ala Gln Ser Leu Gly Trp Leu Gly Ala Ala Ile Asn Pro Leu Val 340 345 350 Ser Gly Val Val Leu Thr Ser Leu Pro Pro Ser Ser Leu Phe Val Ile 355 360 365 Leu Ala Leu Val Ile Ile Ala Ala Trp Val Leu Met Leu Lys Gly Ile 370 375 380 Arg Ala Arg Pro Trp Gly Gln Pro Ala Leu Cys 385 390 395 <210> 17 <211> 1212 <212> DNA <213> Escherichia coli K12 MG1655 <400> 17 atgtcgactc gtaccccttc atcatcttca tcccgcctga tgctgaccat cgggctttgt 60 tttttggtcg ctctgatgga agggctggat cttcaggcgg ctggcattgc ggcgggtggc 120 atcgcccagg ctttcgcact cgataaaatg caaatgggct ggatatttag cgccggaata 180 ctcggtttgc tacccggcgc gttggttggc ggaatgctgg cggaccgtta tggtcgcaag 240 cgcattttga ttggctcagt tgcgctgttt ggtttgttct cactggcaac ggcgattgcc 300 tgggatttcc cctcactggt ctttgcgcgg ctgatgaccg gtgtcgggct gggggcggcg 360 ttgccgaatc ttatcgccct gacgtctgaa gccgcgggtc cacgttttcg tgggacggca 420 gtgagcctga tgtattgcgg tgttcccatt ggcgcggcgc tggcggcgac actgggtttc 480 gcgggggcaa acttagcatg gcaaacggtg ttttgggtag gtggtgtggt gccgttgatt 540 ctggtgccgc tattaatgcg ctggctgccg gagtcggcgg ttttcgctgg cgaaaaacag 600 tctgcgccac cactgcgtgc cttatttgcg ccagaaacgg caaccgcgac gctgctgctg 660 tggttgtgtt atttcttcac tctgctggtg gtctacatgt tgatcaactg gctaccgcta 720 cttttggtgg agcaaggatt ccagccatcg caggcggcag gggtgatgtt tgccctgcaa 780 atgggggcgg caagcgggac gttaatgttg ggcgcattga tggataagct gcgtccagta 840 accatgtcgc tactgattta tagcggcatg ttagcttcgc tgctggcgct tggaacggtg 900 tcgtcattta acggtatgtt gctggcggga tttgtcgcgg ggttgtttgc gacaggtggg 960 caaagcgttt tgtatgccct ggcaccgttg ttttacagtt cgcagatccg cgcaacaggt 1020 gtgggaacag ccgtggcggt agggcgtctg ggggctatga gcggtccgtt actggccggg 1080 aaaatgctgg cattaggcac tggcacggtc ggcgtaatgg ccgcttctgc accgggtatt 1140 cttgttgctg ggttggcggt gtttattttg atgagccgga gatcacgaat acagccgtgc 1200 gccgatgcct aa 1212 <210> 18 <211> 403 <212> PRT <213> Escherichia coli K12 MG1655 <400> 18 Met Ser Thr Arg Thr Pro Ser Ser Ser Ser Ser Arg Leu Met Leu Thr 1 5 10 15 Ile Gly Leu Cys Phe Leu Val Ala Leu Met Glu Gly Leu Asp Leu Gln 20 25 30 Ala Ala Gly Ile Ala Ala Gly Gly Ile Ala Gln Ala Phe Ala Leu Asp 35 40 45 Lys Met Gln Met Gly Trp Ile Phe Ser Ala Gly Ile Leu Gly Leu Leu 50 55 60 Pro Gly Ala Leu Val Gly Gly Met Leu Ala Asp Arg Tyr Gly Arg Lys 65 70 75 80 Arg Ile Leu Ile Gly Ser Val Ala Leu Phe Gly Leu Phe Ser Leu Ala 85 90 95 Thr Ala Ile Ala Trp Asp Phe Pro Ser Leu Val Phe Ala Arg Leu Met 100 105 110 Thr Gly Val Gly Leu Gly Ala Ala Leu Pro Asn Leu Ile Ala Leu Thr 115 120 125 Ser Glu Ala Ala Gly Pro Arg Phe Arg Gly Thr Ala Val Ser Leu Met 130 135 140 Tyr Cys Gly Val Pro Ile Gly Ala Ala Leu Ala Ala Thr Leu Gly Phe 145 150 155 160 Ala Gly Ala Asn Leu Ala Trp Gln Thr Val Phe Trp Val Gly Gly Val 165 170 175 Val Pro Leu Ile Leu Val Pro Leu Leu Met Arg Trp Leu Pro Glu Ser 180 185 190 Ala Val Phe Ala Gly Glu Lys Gln Ser Ala Pro Pro Leu Arg Ala Leu 195 200 205 Phe Ala Pro Glu Thr Ala Thr Ala Thr Leu Leu Leu Trp Leu Cys Tyr 210 215 220 Phe Phe Thr Leu Leu Val Val Tyr Met Leu Ile Asn Trp Leu Pro Leu 225 230 235 240 Leu Leu Val Glu Gln Gly Phe Gln Pro Ser Gln Ala Ala Gly Val Met 245 250 255 Phe Ala Leu Gln Met Gly Ala Ala Ser Gly Thr Leu Met Leu Gly Ala 260 265 270 Leu Met Asp Lys Leu Arg Pro Val Thr Met Ser Leu Leu Ile Tyr Ser 275 280 285 Gly Met Leu Ala Ser Leu Leu Ala Leu Gly Thr Val Ser Ser Phe Asn 290 295 300 Gly Met Leu Leu Ala Gly Phe Val Ala Gly Leu Phe Ala Thr Gly Gly 305 310 315 320 Gln Ser Val Leu Tyr Ala Leu Ala Pro Leu Phe Tyr Ser Ser Gln Ile 325 330 335 Arg Ala Thr Gly Val Gly Thr Ala Val Ala Val Gly Arg Leu Gly Ala 340 345 350 Met Ser Gly Pro Leu Leu Ala Gly Lys Met Leu Ala Leu Gly Thr Gly 355 360 365 Thr Val Gly Val Met Ala Ala Ser Ala Pro Gly Ile Leu Val Ala Gly 370 375 380 Leu Ala Val Phe Ile Leu Met Ser Arg Arg Ser Arg Ile Gln Pro Cys 385 390 395 400 Ala Asp Ala <210> 19 <211> 1374 <212> DNA <213> Escherichia coli K12 MG1655 <400> 19 atgccaaaag ttcaggccga cggcctgcca ttgccccagc gatacggtgc gatattaacc 60 attgtgattg gtatttcgat ggccgtcctt gacggcgcaa tcgccaacgt cgccctgcca 120 acaatcgcca cggaccttca tgccacgcca gccagttcca tctgggtagt gaacgcctat 180 caaatcgcca ttgtcatctc cctgctctcg ttttcgtttc tgggcgatat gtttggctat 240 cgacgtattt ataaatgcgg tctggtcgtt tttctgttgt cttcactgtt ctgcgccctt 300 tctgattcgc tgcaaatgct cacccttgcg cgtgtcatac aaggtttcgg cggtgcagcg 360 ttgatgagcg ttaataccgc acttatccgc ctgatctatc cacaacgttt tctgggtaga 420 gggatgggca taaactcgtt tattgttgcc gtctcttctg ctgccgggcc gacaattgct 480 gcagcaatcc tctccatcgc atcctggaaa tggttatttt taatcaacgt accgttaggt 540 attatcgccc tgcttctggc gatgcgtttt ctgccaccca atggttctcg cgccagtaaa 600 ccccgtttcg acctgcccag cgccgtgatg aacgcgttaa ccttcggcct gcttatcact 660 gcgttgagtg gtttcgctca ggggcaatcg ctgacgttaa ttgctgcgga actggtggta 720 atggttgttg ttggtatttt ctttattcgc cgccagcttt ctcttcccgt accgctgcta 780 ccggtggatt tactgcgtat cccgctgttt tcactttcta tttgcacatc tgtttgctct 840 ttctgcgcac aaatgctggc aatggtttcc ctgccctttt acctgcaaac cgtgctcggg 900 cgtagtgaag tcgaaacagg tttacttctg acaccgtggc cgttagcaac gatggtgatg 960 gctccgctgg caggctattt gattgaacgc gtacatgcag gattgctggg ggctttaggg 1020 ttgttcatca tggctgcggg gcttttttcc ctggttctgc tgcccgcgtc acctgcggat 1080 atcaatatta tctggccgat gatcttatgt ggtgctggat ttggcttatt ccagtcaccc 1140 aataaccaca ccattattac ctccgcgcct cgcgaacgta gcggtggagc cagtggcatg 1200 ttaggaacgg ctcgtctact gggtcagagt agcggcgcgg cgctggtggc gctgatgcta 1260 aatcagtttg gagataatgg tacacacgtc tcgctgatgg ctgcggctat tctggcagtg 1320 attgctgcct gtgtcagtgg tttacgtatc actcagccac gatccagggc ataa 1374 <210> 20 <211> 457 <212> PRT <213> Escherichia coli K12 MG1655 <400> 20 Met Pro Lys Val Gln Ala Asp Gly Leu Pro Leu Pro Gln Arg Tyr Gly 1 5 10 15 Ala Ile Leu Thr Ile Val Ile Gly Ile Ser Met Ala Val Leu Asp Gly 20 25 30 Ala Ile Ala Asn Val Ala Leu Pro Thr Ile Ala Thr Asp Leu His Ala 35 40 45 Thr Pro Ala Ser Ser Ile Trp Val Val Asn Ala Tyr Gln Ile Ala Ile 50 55 60 Val Ile Ser Leu Leu Ser Phe Ser Phe Leu Gly Asp Met Phe Gly Tyr 65 70 75 80 Arg Arg Ile Tyr Lys Cys Gly Leu Val Val Phe Leu Leu Ser Ser Leu 85 90 95 Phe Cys Ala Leu Ser Asp Ser Leu Gln Met Leu Thr Leu Ala Arg Val 100 105 110 Ile Gln Gly Phe Gly Gly Ala Ala Leu Met Ser Val Asn Thr Ala Leu 115 120 125 Ile Arg Leu Ile Tyr Pro Gln Arg Phe Leu Gly Arg Gly Met Gly Ile 130 135 140 Asn Ser Phe Ile Val Ala Val Ser Ser Ala Ala Gly Pro Thr Ile Ala 145 150 155 160 Ala Ala Ile Leu Ser Ile Ala Ser Trp Lys Trp Leu Phe Leu Ile Asn 165 170 175 Val Pro Leu Gly Ile Ile Ala Leu Leu Leu Ala Met Arg Phe Leu Pro 180 185 190 Pro Asn Gly Ser Arg Ala Ser Lys Pro Arg Phe Asp Leu Pro Ser Ala 195 200 205 Val Met Asn Ala Leu Thr Phe Gly Leu Leu Ile Thr Ala Leu Ser Gly 210 215 220 Phe Ala Gln Gly Gln Ser Leu Thr Leu Ile Ala Ala Glu Leu Val Val 225 230 235 240 Met Val Val Val Gly Ile Phe Phe Ile Arg Arg Gln Leu Ser Leu Pro 245 250 255 Val Pro Leu Leu Pro Val Asp Leu Leu Arg Ile Pro Leu Phe Ser Leu 260 265 270 Ser Ile Cys Thr Ser Val Cys Ser Phe Cys Ala Gln Met Leu Ala Met 275 280 285 Val Ser Leu Pro Phe Tyr Leu Gln Thr Val Leu Gly Arg Ser Glu Val 290 295 300 Glu Thr Gly Leu Leu Leu Thr Pro Trp Pro Leu Ala Thr Met Val Met 305 310 315 320 Ala Pro Leu Ala Gly Tyr Leu Ile Glu Arg Val His Ala Gly Leu Leu 325 330 335 Gly Ala Leu Gly Leu Phe Ile Met Ala Ala Gly Leu Phe Ser Leu Val 340 345 350 Leu Leu Pro Ala Ser Pro Ala Asp Ile Asn Ile Ile Trp Pro Met Ile 355 360 365 Leu Cys Gly Ala Gly Phe Gly Leu Phe Gln Ser Pro Asn Asn His Thr 370 375 380 Ile Ile Thr Ser Ala Pro Arg Glu Arg Ser Gly Gly Ala Ser Gly Met 385 390 395 400 Leu Gly Thr Ala Arg Leu Leu Gly Gln Ser Ser Gly Ala Ala Leu Val 405 410 415 Ala Leu Met Leu Asn Gln Phe Gly Asp Asn Gly Thr His Val Ser Leu 420 425 430 Met Ala Ala Ala Ile Leu Ala Val Ile Ala Ala Cys Val Ser Gly Leu 435 440 445 Arg Ile Thr Gln Pro Arg Ser Arg Ala 450 455 <210> 21 <211> 1218 <212> DNA <213> Escherichia coli K12 MG1655 <400> 21 atggcaacag catggtataa acaagttaat ccaccacaac ggaaagctct tttttccgca 60 tggcttggat atgtatttga tggctttgat tttatgatga tattttacat tcttcatatt 120 ataaaagcag atcttggcat tacggatatt caggctactt taatagggac agtggccttc 180 atagccagac ctattggagg tggttttttt ggtgccatgg ctgataaata tggtcgtaag 240 ccaatgatga tgtgggcaat tttcatttac tcagtcggaa caggccttag cggtattgct 300 acaaacttat atatgctcgc agtttgccgt tttattgttg gcttagggat gtctggtgaa 360 tatgcatgtg cttcaactta tgcggtagaa agttggccta aaaatcttca atctaaagct 420 agtgcttttt tggtaagtgg tttttctgtt ggaaatatta ttgcggcaca aataatccct 480 cagtttgctg aagtatatgg atggagaaac tcttttttta taggcctgtt accagtttta 540 ctagttcttt ggatcagaaa aagtgctcca gaaagtcagg agtggattga agataaatat 600 aaggataaat caacattttt gtctgtcttc agaaaaccac atctttcaat ctctatgatc 660 gttttcctcg tctgtttttg tctatttggt gcaaactggc cgataaacgg actacttcct 720 tcctacctgg cagataatgg agttaataca gtggtcattt caactctgat gacaatagca 780 ggtttaggaa cactgacagg tacaatattt tttggttttg ttggtgataa gattggtgta 840 aaaaaagcct ttgtagtcgg tctaataact tcatttattt tcctttgtcc tctttttttt 900 atttctgtga aaaactcttc tcttatagga ttatgtctct ttggattaat gtttacaaat 960 ttaggtattg cagggttggt tccaaaattt atatatgatt actttccaac aaaattaaga 1020 ggattaggga ccggtcttat ttataactta ggggcaactg gaggaatggc cgcacctgta 1080 ttagctacat acatttcagg atattatggc ttaggtgttt cattattcat tgttacggtt 1140 gcattctctg ccttattaat tttgttagtt ggttttgata ttccaggtaa aatttataaa 1200 ctatccgtgg ctaaataa 1218 <210> 22 <211> 405 <212> PRT <213> Escherichia coli K12 MG1655 <400> 22 Met Ala Thr Ala Trp Tyr Lys Gln Val Asn Pro Pro Gln Arg Lys Ala 1 5 10 15 Leu Phe Ser Ala Trp Leu Gly Tyr Val Phe Asp Gly Phe Asp Phe Met 20 25 30 Met Ile Phe Tyr Ile Leu His Ile Ile Lys Ala Asp Leu Gly Ile Thr 35 40 45 Asp Ile Gln Ala Thr Leu Ile Gly Thr Val Ala Phe Ile Ala Arg Pro 50 55 60 Ile Gly Gly Gly Phe Phe Gly Ala Met Ala Asp Lys Tyr Gly Arg Lys 65 70 75 80 Pro Met Met Met Trp Ala Ile Phe Ile Tyr Ser Val Gly Thr Gly Leu 85 90 95 Ser Gly Ile Ala Thr Asn Leu Tyr Met Leu Ala Val Cys Arg Phe Ile 100 105 110 Val Gly Leu Gly Met Ser Gly Glu Tyr Ala Cys Ala Ser Thr Tyr Ala 115 120 125 Val Glu Ser Trp Pro Lys Asn Leu Gln Ser Lys Ala Ser Ala Phe Leu 130 135 140 Val Ser Gly Phe Ser Val Gly Asn Ile Ile Ala Ala Gln Ile Ile Pro 145 150 155 160 Gln Phe Ala Glu Val Tyr Gly Trp Arg Asn Ser Phe Phe Ile Gly Leu 165 170 175 Leu Pro Val Leu Leu Val Leu Trp Ile Arg Lys Ser Ala Pro Glu Ser 180 185 190 Gln Glu Trp Ile Glu Asp Lys Tyr Lys Asp Lys Ser Thr Phe Leu Ser 195 200 205 Val Phe Arg Lys Pro His Leu Ser Ile Ser Met Ile Val Phe Leu Val 210 215 220 Cys Phe Cys Leu Phe Gly Ala Asn Trp Pro Ile Asn Gly Leu Leu Pro 225 230 235 240 Ser Tyr Leu Ala Asp Asn Gly Val Asn Thr Val Val Ile Ser Thr Leu 245 250 255 Met Thr Ile Ala Gly Leu Gly Thr Leu Thr Gly Thr Ile Phe Phe Gly 260 265 270 Phe Val Gly Asp Lys Ile Gly Val Lys Lys Ala Phe Val Val Gly Leu 275 280 285 Ile Thr Ser Phe Ile Phe Leu Cys Pro Leu Phe Phe Ile Ser Val Lys 290 295 300 Asn Ser Ser Leu Ile Gly Leu Cys Leu Phe Gly Leu Met Phe Thr Asn 305 310 315 320 Leu Gly Ile Ala Gly Leu Val Pro Lys Phe Ile Tyr Asp Tyr Phe Pro 325 330 335 Thr Lys Leu Arg Gly Leu Gly Thr Gly Leu Ile Tyr Asn Leu Gly Ala 340 345 350 Thr Gly Gly Met Ala Ala Pro Val Leu Ala Thr Tyr Ile Ser Gly Tyr 355 360 365 Tyr Gly Leu Gly Val Ser Leu Phe Ile Val Thr Val Ala Phe Ser Ala 370 375 380 Leu Leu Ile Leu Leu Val Gly Phe Asp Ile Pro Gly Lys Ile Tyr Lys 385 390 395 400 Leu Ser Val Ala Lys 405 <210> 23 <211> 1191 <212> DNA <213> Escherichia coli K12 MG1655 <400> 23 atgaccaccc gacagcattc gtcgtttgct attgttttta tccttggcct gctggccatg 60 ttgatgccgc tgtcgattga tatgtatctg cccgcgctac cggtaatttc agcgcagttt 120 ggcgtaccgg cgggcagtac gcagatgacc ctcagtactt atattctggg ctttgcgttg 180 gggcagttaa tctacgggcc gatggcagac agcttcgggc gtaagccggt ggtgctcggc 240 ggtacgctgg tgtttgccgc cgccgcggtg gcgtgtgcgt tggcaaacac catcgatcag 300 ctgattgtga tgcgtttctt ccacgggctg gctgcggctg cggccagcgt ggtcattaac 360 gccctgatgc gcgatattta cccgaaagaa gagttctcgc ggatgatgtc gtttgtcatg 420 ctggtgacaa ccattgcacc gctgatggca ccgatagttg gcggctgggt gctggtgtgg 480 ctgagctggc attacatctt ctggatcctg gcattagcgg cgattctggc ttcggcaatg 540 attttcttcc tgattaaaga aaccttacca ccggagcgtc gtcagccatt tcacattcgt 600 accactattg gtaactttgc ggcgctgttc cgccataaac gtgtcctgag ctacatgctt 660 gccagtggtt tcagctttgc cgggatgttc tcattcttaa gcgccggacc gtttgtttat 720 attgaaatta accacgtcgc gccggaaaac tttggttatt actttgcgct aaacattgtt 780 tttctgttcg tgatgaccat ctttaacagc cgcttcgtcc gccgcattgg cgcgttaaat 840 atgttccgct cggggttgtg gatacaattt attatggcag cgtggatggt catcagtgcg 900 ctgctggggc tgggattttg gtcgctggtg gttggcgttg cggcgtttgt gggctgcgtg 960 tcgatggtgt catccaatgc gatggcggtc attcttgatg agtttcccca tatggcggga 1020 acggcatctt cgctggcagg aaccttccgt tttggcatag gggcaattgt tggcgcattg 1080 ctttctcttg cgacctttaa ctctgcatgg ccgatgattt ggtcaattgc attctgcgca 1140 accagctcca ttctcttctg tctgtacgcc agtcggccga aaaaacggta a 1191 <210> 24 <211> 396 <212> PRT <213> Escherichia coli K12 MG1655 <400> 24 Met Thr Thr Arg Gln His Ser Ser Phe Ala Ile Val Phe Ile Leu Gly 1 5 10 15 Leu Leu Ala Met Leu Met Pro Leu Ser Ile Asp Met Tyr Leu Pro Ala 20 25 30 Leu Pro Val Ile Ser Ala Gln Phe Gly Val Pro Ala Gly Ser Thr Gln 35 40 45 Met Thr Leu Ser Thr Tyr Ile Leu Gly Phe Ala Leu Gly Gln Leu Ile 50 55 60 Tyr Gly Pro Met Ala Asp Ser Phe Gly Arg Lys Pro Val Val Leu Gly 65 70 75 80 Gly Thr Leu Val Phe Ala Ala Ala Ala Val Ala Cys Ala Leu Ala Asn 85 90 95 Thr Ile Asp Gln Leu Ile Val Met Arg Phe Phe His Gly Leu Ala Ala 100 105 110 Ala Ala Ala Ser Val Val Ile Asn Ala Leu Met Arg Asp Ile Tyr Pro 115 120 125 Lys Glu Glu Phe Ser Arg Met Met Ser Phe Val Met Leu Val Thr Thr 130 135 140 Ile Ala Pro Leu Met Ala Pro Ile Val Gly Gly Trp Val Leu Val Trp 145 150 155 160 Leu Ser Trp His Tyr Ile Phe Trp Ile Leu Ala Leu Ala Ala Ile Leu 165 170 175 Ala Ser Ala Met Ile Phe Phe Leu Ile Lys Glu Thr Leu Pro Pro Glu 180 185 190 Arg Arg Gln Pro Phe His Ile Arg Thr Thr Ile Gly Asn Phe Ala Ala 195 200 205 Leu Phe Arg His Lys Arg Val Leu Ser Tyr Met Leu Ala Ser Gly Phe 210 215 220 Ser Phe Ala Gly Met Phe Ser Phe Leu Ser Ala Gly Pro Phe Val Tyr 225 230 235 240 Ile Glu Ile Asn His Val Ala Pro Glu Asn Phe Gly Tyr Tyr Phe Ala 245 250 255 Leu Asn Ile Val Phe Leu Phe Val Met Thr Ile Phe Asn Ser Arg Phe 260 265 270 Val Arg Arg Ile Gly Ala Leu Asn Met Phe Arg Ser Gly Leu Trp Ile 275 280 285 Gln Phe Ile Met Ala Ala Trp Met Val Ile Ser Ala Leu Leu Gly Leu 290 295 300 Gly Phe Trp Ser Leu Val Val Gly Val Ala Ala Phe Val Gly Cys Val 305 310 315 320 Ser Met Val Ser Ser Asn Ala Met Ala Val Ile Leu Asp Glu Phe Pro 325 330 335 His Met Ala Gly Thr Ala Ser Ser Leu Ala Gly Thr Phe Arg Phe Gly 340 345 350 Ile Gly Ala Ile Val Gly Ala Leu Leu Ser Leu Ala Thr Phe Asn Ser 355 360 365 Ala Trp Pro Met Ile Trp Ser Ile Ala Phe Cys Ala Thr Ser Ser Ile 370 375 380 Leu Phe Cys Leu Tyr Ala Ser Arg Pro Lys Lys Arg 385 390 395 <210> 25 <211> 1317 <212> DNA <213> Escherichia coli K12 MG1655 <400> 25 atgggaaaca catcaataca aacgcagagt taccgtgcgg tagataaaga tgcagggcaa 60 agcagaagtt acattattcc attcgcgctg ctgtgctcac tgttttttct ttgggcggta 120 gccaataacc ttaacgacat tttattacct caattccagc aggcttttac gctgacaaat 180 ttccaggctg gcctgatcca atcggccttt tactttggtt atttcattat cccaatccct 240 gctgggatat tgatgaaaaa actcagttat aaagcaggga ttattaccgg gttattttta 300 tatgccttgg gtgctgcatt attctggccc gccgcagaaa taatgaacta caccttgttt 360 ttagttggcc tatttattat tgcagccgga ttaggttgtc tggaaactgc cgcaaaccct 420 tttgttacgg tattagggcc ggaaagtagt ggtcacttcc gcttaaatct tgcgcaaaca 480 tttaactcgt ttggcgcaat tatcgcggtt gtctttgggc aaagtcttat tttgtctaac 540 gtgccacatc aatcgcaaga cgttctcgat aaaatgtctc cagagcaatt gagtgcgtat 600 aaacacagcc tggtattatc ggtacagaca ccttatatga tcatcgtggc tatcgtgtta 660 ctggtcgccc tgctgatcat gctgacgaaa ttcccggcat tgcagagtga taatcacagt 720 gacgccaaac aaggatcgtt ctccgcatcg ctttctcgcc tggcgcgtat tcgccactgg 780 cgctgggcgg tattagcgca attctgctat gtcggcgcac aaacggcctg ctggagctat 840 ttgattcgct acgctgtaga agaaattcca ggtatgactg caggctttgc cgctaactat 900 ttaaccggaa ccatggtgtg cttctttatt ggtcgtttca ccggtacctg gctcatcagt 960 cgcttcgcac cacacaaagt cctggccgcc tacgcattaa tcgctatggc actgtgcctg 1020 atctcagcct tcgctggcgg tcatgtgggc ttaatagccc tgactttatg cagcgccttt 1080 atgtcgattc agtacccaac aatcttctcg ctgggcatta agaatctcgg ccaggacacc 1140 aaatatggtt cgtccttcat cgttatgacc attattggcg gcggtattgt cactccggtc 1200 atgggttttg tcagtgacgc ggcgggcaac atccccactg ctgaactgat ccccgcactc 1260 tgcttcgcgg tcatctttat ctttgcccgt ttccgttctc aaacggcaac taactaa 1317 <210> 26 <211> 438 <212> PRT <213> Escherichia coli K12 MG1655 <400> 26 Met Gly Asn Thr Ser Ile Gln Thr Gln Ser Tyr Arg Ala Val Asp Lys 1 5 10 15 Asp Ala Gly Gln Ser Arg Ser Tyr Ile Ile Pro Phe Ala Leu Leu Cys 20 25 30 Ser Leu Phe Phe Leu Trp Ala Val Ala Asn Asn Leu Asn Asp Ile Leu 35 40 45 Leu Pro Gln Phe Gln Gln Ala Phe Thr Leu Thr Asn Phe Gln Ala Gly 50 55 60 Leu Ile Gln Ser Ala Phe Tyr Phe Gly Tyr Phe Ile Ile Pro Ile Pro 65 70 75 80 Ala Gly Ile Leu Met Lys Lys Leu Ser Tyr Lys Ala Gly Ile Ile Thr 85 90 95 Gly Leu Phe Leu Tyr Ala Leu Gly Ala Ala Leu Phe Trp Pro Ala Ala 100 105 110 Glu Ile Met Asn Tyr Thr Leu Phe Leu Val Gly Leu Phe Ile Ile Ala 115 120 125 Ala Gly Leu Gly Cys Leu Glu Thr Ala Ala Asn Pro Phe Val Thr Val 130 135 140 Leu Gly Pro Glu Ser Ser Gly His Phe Arg Leu Asn Leu Ala Gln Thr 145 150 155 160 Phe Asn Ser Phe Gly Ala Ile Ile Ala Val Val Phe Gly Gln Ser Leu 165 170 175 Ile Leu Ser Asn Val Pro His Gln Ser Gln Asp Val Leu Asp Lys Met 180 185 190 Ser Pro Glu Gln Leu Ser Ala Tyr Lys His Ser Leu Val Leu Ser Val 195 200 205 Gln Thr Pro Tyr Met Ile Ile Val Ala Ile Val Leu Leu Val Ala Leu 210 215 220 Leu Ile Met Leu Thr Lys Phe Pro Ala Leu Gln Ser Asp Asn His Ser 225 230 235 240 Asp Ala Lys Gln Gly Ser Phe Ser Ala Ser Leu Ser Arg Leu Ala Arg 245 250 255 Ile Arg His Trp Arg Trp Ala Val Leu Ala Gln Phe Cys Tyr Val Gly 260 265 270 Ala Gln Thr Ala Cys Trp Ser Tyr Leu Ile Arg Tyr Ala Val Glu Glu 275 280 285 Ile Pro Gly Met Thr Ala Gly Phe Ala Ala Asn Tyr Leu Thr Gly Thr 290 295 300 Met Val Cys Phe Phe Ile Gly Arg Phe Thr Gly Thr Trp Leu Ile Ser 305 310 315 320 Arg Phe Ala Pro His Lys Val Leu Ala Ala Tyr Ala Leu Ile Ala Met 325 330 335 Ala Leu Cys Leu Ile Ser Ala Phe Ala Gly Gly His Val Gly Leu Ile 340 345 350 Ala Leu Thr Leu Cys Ser Ala Phe Met Ser Ile Gln Tyr Pro Thr Ile 355 360 365 Phe Ser Leu Gly Ile Lys Asn Leu Gly Gln Asp Thr Lys Tyr Gly Ser 370 375 380 Ser Phe Ile Val Met Thr Ile Ile Gly Gly Gly Ile Val Thr Pro Val 385 390 395 400 Met Gly Phe Val Ser Asp Ala Ala Gly Asn Ile Pro Thr Ala Glu Leu 405 410 415 Ile Pro Ala Leu Cys Phe Ala Val Ile Phe Ile Phe Ala Arg Phe Arg 420 425 430 Ser Gln Thr Ala Thr Asn 435 <210> 27 <211> 1755 <212> DNA <213> Lactococcus lactis strain SRCM103457 <400> 27 atggctaacc gcatagaagg caaagctgtg gacaaaacct caattaaaca tttcataaaa 60 ttaattcgcg cggcgaagcc gcgctattta ttctttataa ttggaattct tgcgggcata 120 gtgggcaccc ttattcagct gcaggtaccc aaaatggtgc agccgttagt gaacagcttt 180 ggccatggcg tcaatggcgg aaaagtggct ctggtgatag cgttatatat tggcagcgcg 240 gcggtgtcag cgattgcggc gattgtatta ggaatatttg gcgaaagcgt ggtcaaaaac 300 cttagaacac gcgtatggga taaaatgatt catctaccgg tcaaatattt tgatgaagtg 360 aaaaccggcg aaatgagcag ccgcctggct aatgatacaa cacaggtgaa aaacttaatt 420 gcgaatagca ttccgcaggc gtttacaagc attctgttat tagtgggcag cattgtattc 480 atgttacaaa tgcagtggcg cttaacatta gctatgatta ttgcggtgcc ggtcgtgatg 540 cttattatgt tccccattat gacctttgga cagaaaattg gacggacccg gcaggatagc 600 ctggcgaact tccagggaat tgcgagcgaa agcctgagcg aaattcggct ggtcaaaagc 660 agcaacgcgg aaaaacaggc tagcaaaaaa gcggaaaacg atgtaaacgc tttatataaa 720 attggagtca aagaagctat atttgatggc ttaatgagcc cggtgatgat gctgagcatg 780 atgctaatga tatttggctt attagcgtac ggcatttatc ttataagcac cggcgtaatg 840 agcttaggaa ccttattagg catgatgatg tatttaatga atctgatagg agctgtcccg 900 accgtagcga ccttctttac cgaattagcg aaagcgagcg gcagcaccgg ccgcttaaca 960 gaactgttag atgaagaaca ggaagtctta catcagggcg aaagcttaga tttagaaggc 1020 aaaacactta gcgcgcggca tgtggacttt gcgtatgatg atagcgaaca gattctgcgc 1080 gatataagct ttgaagcgca gccgaacagc attattgctt ttgctggccc gagcggcggc 1140 ggcaaaagca ccattttcag cttactggaa cgcttttatc agccgacagc gggcgaaatt 1200 accattgatg gccagcccat tgataacatt agcttagaaa actggcgaag ccagattggc 1260 tttgtaagcc aggatagcgc gattatggcg ggcacaattc gcgaaaacct gacctatggc 1320 ttagaaggcg actataccga tgaagactta tggcaggtgt tagacctggc gtttgcgcgg 1380 tcatttgtgg aaaacatgcc ggatcagtta aacacagaag tgggcgaacg gggcgtaaaa 1440 ataagcggcg gccagcggca gcgcctggcg attgcgcgcg cgttcttacg gaacccgaaa 1500 atactaatgt tagatgaagc gacagcgagc ctggatagcg aaagcgaaag catggtgcag 1560 aaggcgctgg atagcttaat gaaaggccgg accacacttg tcattgctca tcggttaagc 1620 accattgtgg atgctgataa gatttacttc attgaaaaag gccagataac cggaagcgga 1680 aaacataacg aattagtggc tacccatccg ctttatgcga agtatgtgag cgaacagtta 1740 accgtgggcc agtaa 1755 <210> 28 <211> 584 <212> PRT <213> Lactococcus lactis strain SRCM103457 <400> 28 Met Ala Asn Arg Ile Glu Gly Lys Ala Val Asp Lys Thr Ser Ile Lys 1 5 10 15 His Phe Ile Lys Leu Ile Arg Ala Ala Lys Pro Arg Tyr Leu Phe Phe 20 25 30 Ile Ile Gly Ile Leu Ala Gly Ile Val Gly Thr Leu Ile Gln Leu Gln 35 40 45 Val Pro Lys Met Val Gln Pro Leu Val Asn Ser Phe Gly His Gly Val 50 55 60 Asn Gly Gly Lys Val Ala Leu Val Ile Ala Leu Tyr Ile Gly Ser Ala 65 70 75 80 Ala Val Ser Ala Ile Ala Ala Ile Val Leu Gly Ile Phe Gly Glu Ser 85 90 95 Val Val Lys Asn Leu Arg Thr Arg Val Trp Asp Lys Met Ile His Leu 100 105 110 Pro Val Lys Tyr Phe Asp Glu Val Lys Thr Gly Glu Met Ser Ser Arg 115 120 125 Leu Ala Asn Asp Thr Thr Gln Val Lys Asn Leu Ile Ala Asn Ser Ile 130 135 140 Pro Gln Ala Phe Thr Ser Ile Leu Leu Leu Val Gly Ser Ile Val Phe 145 150 155 160 Met Leu Gln Met Gln Trp Arg Leu Thr Leu Ala Met Ile Ile Ala Val 165 170 175 Pro Val Val Met Leu Ile Met Phe Pro Ile Met Thr Phe Gly Gln Lys 180 185 190 Ile Gly Arg Thr Arg Gln Asp Ser Leu Ala Asn Phe Gln Gly Ile Ala 195 200 205 Ser Glu Ser Leu Ser Glu Ile Arg Leu Val Lys Ser Ser Asn Ala Glu 210 215 220 Lys Gln Ala Ser Lys Lys Ala Glu Asn Asp Val Asn Ala Leu Tyr Lys 225 230 235 240 Ile Gly Val Lys Glu Ala Ile Phe Asp Gly Leu Met Ser Pro Val Met 245 250 255 Met Leu Ser Met Met Leu Met Ile Phe Gly Leu Leu Ala Tyr Gly Ile 260 265 270 Tyr Leu Ile Ser Thr Gly Val Met Ser Leu Gly Thr Leu Leu Gly Met 275 280 285 Met Met Tyr Leu Met Asn Leu Ile Gly Ala Val Pro Thr Val Ala Thr 290 295 300 Phe Phe Thr Glu Leu Ala Lys Ala Ser Gly Ser Thr Gly Arg Leu Thr 305 310 315 320 Glu Leu Leu Asp Glu Glu Gln Glu Val Leu His Gln Gly Glu Ser Leu 325 330 335 Asp Leu Glu Gly Lys Thr Leu Ser Ala Arg His Val Asp Phe Ala Tyr 340 345 350 Asp Asp Ser Glu Gln Ile Leu Arg Asp Ile Ser Phe Glu Ala Gln Pro 355 360 365 Asn Ser Ile Ile Ala Phe Ala Gly Pro Ser Gly Gly Gly Lys Ser Thr 370 375 380 Ile Phe Ser Leu Leu Glu Arg Phe Tyr Gln Pro Thr Ala Gly Glu Ile 385 390 395 400 Thr Ile Asp Gly Gln Pro Ile Asp Asn Ile Ser Leu Glu Asn Trp Arg 405 410 415 Ser Gln Ile Gly Phe Val Ser Gln Asp Ser Ala Ile Met Ala Gly Thr 420 425 430 Ile Arg Glu Asn Leu Thr Tyr Gly Leu Glu Gly Asp Tyr Thr Asp Glu 435 440 445 Asp Leu Trp Gln Val Leu Asp Leu Ala Phe Ala Arg Ser Phe Val Glu 450 455 460 Asn Met Pro Asp Gln Leu Asn Thr Glu Val Gly Glu Arg Gly Val Lys 465 470 475 480 Ile Ser Gly Gly Gln Arg Gln Arg Leu Ala Ile Ala Arg Ala Phe Leu 485 490 495 Arg Asn Pro Lys Ile Leu Met Leu Asp Glu Ala Thr Ala Ser Leu Asp 500 505 510 Ser Glu Ser Glu Ser Met Val Gln Lys Ala Leu Asp Ser Leu Met Lys 515 520 525 Gly Arg Thr Thr Leu Val Ile Ala His Arg Leu Ser Thr Ile Val Asp 530 535 540 Ala Asp Lys Ile Tyr Phe Ile Glu Lys Gly Gln Ile Thr Gly Ser Gly 545 550 555 560 Lys His Asn Glu Leu Val Ala Thr His Pro Leu Tyr Ala Lys Tyr Val 565 570 575 Ser Glu Gln Leu Thr Val Gly Gln 580 <210> 29 <211> 1005 <212> DNA <213> Escherichia coli K12 MG1655 <400> 29 atgaatgctg taactgaagg aagaaaagtc ctccttgaaa tcgccgatct taaagtgcac 60 tttgaaatca aagatggcaa acagtggttc tggcaaccgc cgaaaacgct caaagccgtc 120 gatggtgtca ctcttcgcct gtatgaaggg gaaacattag gtgtggtagg ggaatcggga 180 tgcggtaagt ccacctttgc tcgcgccatc atcggtttgg tcaaggcgac cgacggtcat 240 gttgcctggt taggtaaaga gttgctgggc atgaaacccg atgaatggcg tgccgttcgc 300 agtgatattc agatgatttt ccaggatccg ttggcatcgc taaacccgcg tatgaccatc 360 ggcgagatca tcgctgaacc actgcgtact tatcatccga aaatgtcacg ccaggaagtt 420 cgcgagcgcg tgaaggcgat gatgctgaaa gtcgggttat tgcctaacct gattaaccgc 480 tatccgcatg agttctctgg tgggcagtgc cagcgtatcg ggattgcgcg tgctcttatt 540 cttgaaccga agctgattat ctgtgatgag ccggtgtcgg cgctggacgt gtcaattcag 600 gcacaggtgg tcaacctgct ccagcaattg caacgtgaga tgggattgtc attaattttt 660 atcgctcatg acctggccgt ggtaaaacac atttccgatc gtgtgttggt gatgtatctc 720 ggccatgcgg tagaactggg gacctatgat gaggtctacc acaatccact acatccttac 780 accagggcat tgatgtcggc agtccccata cctgatccgg atctggagaa gaacaaaacc 840 atccagttac tggaagggga attaccgtcg ccgatcaacc cgccttccgg ttgtgttttc 900 cgtacccgtt gcccgattgc cggtccagag tgcgccaaaa cacgtcctgt tctggagggg 960 agtttcagac actccgtttc ttgcctgaaa gtcgatccgc tttaa 1005 <210> 30 <211> 334 <212> PRT <213> Escherichia coli K12 MG1655 <400> 30 Met Asn Ala Val Thr Glu Gly Arg Lys Val Leu Leu Glu Ile Ala Asp 1 5 10 15 Leu Lys Val His Phe Glu Ile Lys Asp Gly Lys Gln Trp Phe Trp Gln 20 25 30 Pro Pro Lys Thr Leu Lys Ala Val Asp Gly Val Thr Leu Arg Leu Tyr 35 40 45 Glu Gly Glu Thr Leu Gly Val Val Gly Glu Ser Gly Cys Gly Lys Ser 50 55 60 Thr Phe Ala Arg Ala Ile Ile Gly Leu Val Lys Ala Thr Asp Gly His 65 70 75 80 Val Ala Trp Leu Gly Lys Glu Leu Leu Gly Met Lys Pro Asp Glu Trp 85 90 95 Arg Ala Val Arg Ser Asp Ile Gln Met Ile Phe Gln Asp Pro Leu Ala 100 105 110 Ser Leu Asn Pro Arg Met Thr Ile Gly Glu Ile Ile Ala Glu Pro Leu 115 120 125 Arg Thr Tyr His Pro Lys Met Ser Arg Gln Glu Val Arg Glu Arg Val 130 135 140 Lys Ala Met Met Leu Lys Val Gly Leu Leu Pro Asn Leu Ile Asn Arg 145 150 155 160 Tyr Pro His Glu Phe Ser Gly Gly Gln Cys Gln Arg Ile Gly Ile Ala 165 170 175 Arg Ala Leu Ile Leu Glu Pro Lys Leu Ile Ile Cys Asp Glu Pro Val 180 185 190 Ser Ala Leu Asp Val Ser Ile Gln Ala Gln Val Val Asn Leu Leu Gln 195 200 205 Gln Leu Gln Arg Glu Met Gly Leu Ser Leu Ile Phe Ile Ala His Asp 210 215 220 Leu Ala Val Val Lys His Ile Ser Asp Arg Val Leu Val Met Tyr Leu 225 230 235 240 Gly His Ala Val Glu Leu Gly Thr Tyr Asp Glu Val Tyr His Asn Pro 245 250 255 Leu His Pro Tyr Thr Arg Ala Leu Met Ser Ala Val Pro Ile Pro Asp 260 265 270 Pro Asp Leu Glu Lys Asn Lys Thr Ile Gln Leu Leu Glu Gly Glu Leu 275 280 285 Pro Ser Pro Ile Asn Pro Pro Ser Gly Cys Val Phe Arg Thr Arg Cys 290 295 300 Pro Ile Ala Gly Pro Glu Cys Ala Lys Thr Arg Pro Val Leu Glu Gly 305 310 315 320 Ser Phe Arg His Ser Val Ser Cys Leu Lys Val Asp Pro Leu 325 330 <210> 31 <211> 1251 <212> DNA <213> Escherichia coli K12 MG1655 <400> 31 atgtcgttgg caaaagcgtc cttgtggacg gcggccagta cactggtcaa gattggtgcc 60 gggttactgg tcggtaagtt gctggcggtg tcatttggtc cggcggggct tgggctggcg 120 gcaaatttcc gccagttgat taccgtgctc ggcgtgcttg ccggggctgg catctttaac 180 ggtgtaacca aatacgttgc ccagtaccat gataatccgc aacagctgcg ccgcgtggtc 240 ggcacttcat cagcgatggt acttggtttc tctacgctga tggcgctggt ttttgtgctg 300 gcagctgcgc caatcagcca gggattgttt ggtaataccg actatcaggg gctggtgcgt 360 ttagtggcgc tggtgcaaat ggggatcgcc tggggcaacc tgttactggc gctgatgaaa 420 ggctttcgcg atgccgcagg taatgcgtta tcgctgattg tcggcagctt gattggcgtt 480 ctcgcgtact acgtcagtta ccgtttgggc ggttatgaag gggcgttgct gggtctggcg 540 ctgattcccg cgctggtggt aattcctgcc gccatcatgt tgatcaaacg tggtgtcatc 600 ccgttaagct atctgaaacc cagctgggat aacggtctgg cagggcagtt gagcaaattt 660 acgctcatgg cgttgattac gtcggtgacc ttgcctgttg cttacatcat gatgcgtaaa 720 ctgctggcgg cgcagtatag ctgggatgag gtggggatct ggcaaggggt gagcagtatt 780 tccgatgcct acctgcaatt tattacggca tcgttcagcg tatatttgct gcccacgttg 840 tcgcggctaa cggaaaagcg cgatatcacc cgggaagtgg ttaaatcgct gaaattcgtc 900 ttaccggcag tggcggcggc gagttttacc gtctggctgc tgcgtgattt tgctatctgg 960 ctgctgttgt cgaataaatt taccgctatg cgcgatctct ttgcctggca gttagtgggt 1020 gatgtgttaa aagtgggcgc ttatgtcttt ggttatctgg tgatcgccaa agcgtcactg 1080 cggttttata ttctggcgga agtcagccag ttcactttat tgatggtatt tgcccactgg 1140 ctaatccctg cgcatggtgc actgggcgcg gcgcaggcat atatggcaac ttatatcgtc 1200 tatttttctc tttgttgtgg cgtgttttta ctctggcgta ggcgggcatg a 1251 <210> 32 <211> 416 <212> PRT <213> Escherichia coli K12 MG1655 <400> 32 Met Ser Leu Ala Lys Ala Ser Leu Trp Thr Ala Ala Ser Thr Leu Val 1 5 10 15 Lys Ile Gly Ala Gly Leu Leu Val Gly Lys Leu Leu Ala Val Ser Phe 20 25 30 Gly Pro Ala Gly Leu Gly Leu Ala Ala Asn Phe Arg Gln Leu Ile Thr 35 40 45 Val Leu Gly Val Leu Ala Gly Ala Gly Ile Phe Asn Gly Val Thr Lys 50 55 60 Tyr Val Ala Gln Tyr His Asp Asn Pro Gln Gln Leu Arg Arg Val Val 65 70 75 80 Gly Thr Ser Ser Ala Met Val Leu Gly Phe Ser Thr Leu Met Ala Leu 85 90 95 Val Phe Val Leu Ala Ala Ala Pro Ile Ser Gln Gly Leu Phe Gly Asn 100 105 110 Thr Asp Tyr Gln Gly Leu Val Arg Leu Val Ala Leu Val Gln Met Gly 115 120 125 Ile Ala Trp Gly Asn Leu Leu Leu Ala Leu Met Lys Gly Phe Arg Asp 130 135 140 Ala Ala Gly Asn Ala Leu Ser Leu Ile Val Gly Ser Leu Ile Gly Val 145 150 155 160 Leu Ala Tyr Tyr Val Ser Tyr Arg Leu Gly Gly Tyr Glu Gly Ala Leu 165 170 175 Leu Gly Leu Ala Leu Ile Pro Ala Leu Val Val Ile Pro Ala Ala Ile 180 185 190 Met Leu Ile Lys Arg Gly Val Ile Pro Leu Ser Tyr Leu Lys Pro Ser 195 200 205 Trp Asp Asn Gly Leu Ala Gly Gln Leu Ser Lys Phe Thr Leu Met Ala 210 215 220 Leu Ile Thr Ser Val Thr Leu Pro Val Ala Tyr Ile Met Met Arg Lys 225 230 235 240 Leu Leu Ala Ala Gln Tyr Ser Trp Asp Glu Val Gly Ile Trp Gln Gly 245 250 255 Val Ser Ser Ile Ser Asp Ala Tyr Leu Gln Phe Ile Thr Ala Ser Phe 260 265 270 Ser Val Tyr Leu Leu Pro Thr Leu Ser Arg Leu Thr Glu Lys Arg Asp 275 280 285 Ile Thr Arg Glu Val Val Lys Ser Leu Lys Phe Val Leu Pro Ala Val 290 295 300 Ala Ala Ala Ser Phe Thr Val Trp Leu Leu Arg Asp Phe Ala Ile Trp 305 310 315 320 Leu Leu Leu Ser Asn Lys Phe Thr Ala Met Arg Asp Leu Phe Ala Trp 325 330 335 Gln Leu Val Gly Asp Val Leu Lys Val Gly Ala Tyr Val Phe Gly Tyr 340 345 350 Leu Val Ile Ala Lys Ala Ser Leu Arg Phe Tyr Ile Leu Ala Glu Val 355 360 365 Ser Gln Phe Thr Leu Leu Met Val Phe Ala His Trp Leu Ile Pro Ala 370 375 380 His Gly Ala Leu Gly Ala Ala Gln Ala Tyr Met Ala Thr Tyr Ile Val 385 390 395 400 Tyr Phe Ser Leu Cys Cys Gly Val Phe Leu Leu Trp Arg Arg Arg Ala 405 410 415 <210> 33 <211> 1140 <212> DNA <213> Escherichia coli K12 MG1655 <400> 33 atgatgaaat ccaaaatgaa attgatgcca ttattggtgt cagtaacctt gataagcggt 60 tgcacagtac ttccgggcag caatatgtcg acgatgggca aagacgtcat caaacagcag 120 gacgctgatt tcgatctcga caaaatggtg aatgtttatc cgctgacccc gcgcctgatt 180 gaccaattac gcccacgccc gaatgtagcg cgccccaata tgacgctgga aagtgagatc 240 gcgaattacc agtatcgcgt cgggccgggg gacgttctta atgtcaccgt ctgggatcac 300 ccggaactca ccacgccagc cggtcagtac cgcagctcca gcgacaccgg caactgggta 360 cagcctgacg gcactatgtt ttacccgtat atcggcaagg tccacgtagt cgggaaaacg 420 ctcgctgaaa tccgcagtga tattaccggg cgcttagcga cgtacatcgc tgacccgcag 480 gtggacgtta atatcgccgc cttccgctca caaaaggcct atatctccgg tcaggtgaat 540 aaatccggtc aacaggcgat caccaacgtg ccactgacta ttctcgacgc catcaacgcc 600 gcaggtggcc tgaccgacac cgctgactgg cgcaacgtgg tgctaacaca caatggtcgt 660 gaagagcgca tttctttgca ggcgctgatg caaaacggcg acctcaacca gaatcgcctg 720 ctttaccccg gcgatattct ctacgtgcca cgtaatgatg atctgaaagt atttgtgatg 780 ggtgaagtga agaaacagag caccctgaaa atggacttta gcggcatgac cctgactgaa 840 gccctgggca atgctgaagg catcgacatg accacctcca acgccagcgg catctttgtc 900 attcgtccgc tgaaaggcga gggcgggcgt aacggcaaga ttgccaatat ctaccagctg 960 gatatgtccg atgccacgtc gctggtgatg gcgacagaat tccgcctgca accttatgac 1020 gtggtgtatg tcaccaccgc cccggtttcc cgctggaacc gtctgatcaa tcagttgctg 1080 ccaactatta gcggtgtccg ttacatgacg gatacagcca gcgacattca taactggtaa 1140 <210> 34 <211> 379 <212> PRT <213> Escherichia coli K12 MG1655 <400> 34 Met Met Lys Ser Lys Met Lys Leu Met Pro Leu Leu Val Ser Val Thr 1 5 10 15 Leu Ile Ser Gly Cys Thr Val Leu Pro Gly Ser Asn Met Ser Thr Met 20 25 30 Gly Lys Asp Val Ile Lys Gln Gln Asp Ala Asp Phe Asp Leu Asp Lys 35 40 45 Met Val Asn Val Tyr Pro Leu Thr Pro Arg Leu Ile Asp Gln Leu Arg 50 55 60 Pro Arg Pro Asn Val Ala Arg Pro Asn Met Thr Leu Glu Ser Glu Ile 65 70 75 80 Ala Asn Tyr Gln Tyr Arg Val Gly Pro Gly Asp Val Leu Asn Val Thr 85 90 95 Val Trp Asp His Pro Glu Leu Thr Thr Pro Ala Gly Gln Tyr Arg Ser 100 105 110 Ser Ser Asp Thr Gly Asn Trp Val Gln Pro Asp Gly Thr Met Phe Tyr 115 120 125 Pro Tyr Ile Gly Lys Val His Val Val Gly Lys Thr Leu Ala Glu Ile 130 135 140 Arg Ser Asp Ile Thr Gly Arg Leu Ala Thr Tyr Ile Ala Asp Pro Gln 145 150 155 160 Val Asp Val Asn Ile Ala Ala Phe Arg Ser Gln Lys Ala Tyr Ile Ser 165 170 175 Gly Gln Val Asn Lys Ser Gly Gln Gln Ala Ile Thr Asn Val Pro Leu 180 185 190 Thr Ile Leu Asp Ala Ile Asn Ala Ala Gly Gly Leu Thr Asp Thr Ala 195 200 205 Asp Trp Arg Asn Val Val Leu Thr His Asn Gly Arg Glu Glu Arg Ile 210 215 220 Ser Leu Gln Ala Leu Met Gln Asn Gly Asp Leu Asn Gln Asn Arg Leu 225 230 235 240 Leu Tyr Pro Gly Asp Ile Leu Tyr Val Pro Arg Asn Asp Asp Leu Lys 245 250 255 Val Phe Val Met Gly Glu Val Lys Lys Gln Ser Thr Leu Lys Met Asp 260 265 270 Phe Ser Gly Met Thr Leu Thr Glu Ala Leu Gly Asn Ala Glu Gly Ile 275 280 285 Asp Met Thr Thr Ser Asn Ala Ser Gly Ile Phe Val Ile Arg Pro Leu 290 295 300 Lys Gly Glu Gly Gly Arg Asn Gly Lys Ile Ala Asn Ile Tyr Gln Leu 305 310 315 320 Asp Met Ser Asp Ala Thr Ser Leu Val Met Ala Thr Glu Phe Arg Leu 325 330 335 Gln Pro Tyr Asp Val Val Tyr Val Thr Thr Ala Pro Val Ser Arg Trp 340 345 350 Asn Arg Leu Ile Asn Gln Leu Leu Pro Thr Ile Ser Gly Val Arg Tyr 355 360 365 Met Thr Asp Thr Ala Ser Asp Ile His Asn Trp 370 375 <210> 35 <211> 1737 <212> DNA <213> Helicobacter pylori strain ATCC 700392 / 26695 <400> 35 atggctaaaa agaaacataa aattagcacg ctgaaatact ttttacgtag cctgaagcag 60 atctatatgc ttatcacgtt caaggagaaa atggtttttt tcctattagt gctaatggcc 120 gtttttagca gctttgttga agtgatgagc cttacgcttc taatgccgtt tatcacgctt 180 gcgtcagatc cgaaccgtgc gctggacgat aaagattgga aaatggttta tgattttttc 240 catttttcaa gcccagttcg gttaatgtat ttcttttctt tttgcttagt gggcatttat 300 ttattccgta tgttttatgg cgtgagcttc acgtatttaa aaggccggtt ttcaaataag 360 aaagcatatc agatcaagca gcagttattt ctgcaacata ttaaaagcaa ttacctttct 420 cacttaaatc ataatttaga tagcctgcgt gacattatca ataataaagc tgaaggcatg 480 tttatgagct ttaatgcttt cctgagctta cttacggaaa taacggtgat cgtttttttc 540 tactcaacgc ttatactgac gaattggaaa ataacgcttg tttttacgat gatccttgca 600 ctgcagattt ttttaattgt aaagaaagta acggttctta tcaagaaaaa gggagagatg 660 gccgcaaaat caaaagccca gacgttaaaa gttttttcaa aatttttcag caacttcaaa 720 atcacgaaac ttaaagacaa tcacgaagaa gctcataagc tttttggaga aaatagccgg 780 aaagctcatg acactgagat tatttacgcg acgttgcaag tagtaccacg ttattcaata 840 gaaacggttg gttttagctt attaattctg gccgtagcgt atattctttt caaatacggt 900 gaagcgaaaa tggtgcttcc gacgattagc atgtatgcgc ttgccttata tcgtatactt 960 ccgagcgtga cgggaatgat caattactat aacgaaatcg cgtataatca attagccacg 1020 aatatggttt ttaaaagctt aagcaaaacg atcgttgaag aggatctggt accgctggac 1080 tttaacgaga aaatcacgtt gcagaatatt tcattcgcgt ataagtcaaa gcatcccgtt 1140 ttaaaagatt ttaatcttac gattcagcgt gggcaaaaag tagcgcttat aggtcattct 1200 ggctgcggca aatcaacgct tgccgatatt attatgggct taacgtaccc gaaaagcggc 1260 gaaattttta ttgataatac gttactgacg aataaaaatc gtcgttcatg gcgaaaaaag 1320 ataggttata tccctcagaa tatttactta tttgatggta cggttggcga taatatcgcg 1380 tttggctctg caatagatga aaaacgttta attaaggtgt gcaaaatggc gcatatttat 1440 gattttctgt gcgagcatga aggcttaaaa acgcaagtgg gcgaaggcgg ggcgaagtta 1500 agcggtgggc agaaacaacg tataggtatt gctcgtgcac tgtacgataa tccggaaatt 1560 ttagttctgg atgaagcaac gtcagcactt gacaatgaaa cggagtctaa aatcatggat 1620 gaaatctatc agatcgcgaa aaataaaacg ctaatcgtta tcgctcaccg tctgagcacg 1680 attgaacgtt gtgaagtaat cattgacatg agccagcata aagacaacct tggttaa 1737 <210> 36 <211> 578 <212> PRT <213> Helicobacter pylori strain ATCC 700392 / 26695 <400> 36 Met Ala Lys Lys Lys His Lys Ile Ser Thr Leu Lys Tyr Phe Leu Arg 1 5 10 15 Ser Leu Lys Gln Ile Tyr Met Leu Ile Thr Phe Lys Glu Lys Met Val 20 25 30 Phe Phe Leu Leu Val Leu Met Ala Val Phe Ser Ser Phe Val Glu Val 35 40 45 Met Ser Leu Thr Leu Leu Met Pro Phe Ile Thr Leu Ala Ser Asp Pro 50 55 60 Asn Arg Ala Leu Asp Asp Lys Asp Trp Lys Met Val Tyr Asp Phe Phe 65 70 75 80 His Phe Ser Ser Pro Val Arg Leu Met Tyr Phe Phe Ser Phe Cys Leu 85 90 95 Val Gly Ile Tyr Leu Phe Arg Met Phe Tyr Gly Val Ser Phe Thr Tyr 100 105 110 Leu Lys Gly Arg Phe Ser Asn Lys Lys Ala Tyr Gln Ile Lys Gln Gln 115 120 125 Leu Phe Leu Gln His Ile Lys Ser Asn Tyr Leu Ser His Leu Asn His 130 135 140 Asn Leu Asp Ser Leu Arg Asp Ile Ile Asn Asn Lys Ala Glu Gly Met 145 150 155 160 Phe Met Ser Phe Asn Ala Phe Leu Ser Leu Leu Thr Glu Ile Thr Val 165 170 175 Ile Val Phe Phe Tyr Ser Thr Leu Ile Leu Thr Asn Trp Lys Ile Thr 180 185 190 Leu Val Phe Thr Met Ile Leu Ala Leu Gln Ile Phe Leu Ile Val Lys 195 200 205 Lys Val Thr Val Leu Ile Lys Lys Lys Gly Glu Met Ala Ala Lys Ser 210 215 220 Lys Ala Gln Thr Leu Lys Val Phe Ser Lys Phe Phe Ser Asn Phe Lys 225 230 235 240 Ile Thr Lys Leu Lys Asp Asn His Glu Glu Ala His Lys Leu Phe Gly 245 250 255 Glu Asn Ser Arg Lys Ala His Asp Thr Glu Ile Ile Tyr Ala Thr Leu 260 265 270 Gln Val Val Pro Arg Tyr Ser Ile Glu Thr Val Gly Phe Ser Leu Leu 275 280 285 Ile Leu Ala Val Ala Tyr Ile Leu Phe Lys Tyr Gly Glu Ala Lys Met 290 295 300 Val Leu Pro Thr Ile Ser Met Tyr Ala Leu Ala Leu Tyr Arg Ile Leu 305 310 315 320 Pro Ser Val Thr Gly Met Ile Asn Tyr Tyr Asn Glu Ile Ala Tyr Asn 325 330 335 Gln Leu Ala Thr Asn Met Val Phe Lys Ser Leu Ser Lys Thr Ile Val 340 345 350 Glu Glu Asp Leu Val Pro Leu Asp Phe Asn Glu Lys Ile Thr Leu Gln 355 360 365 Asn Ile Ser Phe Ala Tyr Lys Ser Lys His Pro Val Leu Lys Asp Phe 370 375 380 Asn Leu Thr Ile Gln Arg Gly Gln Lys Val Ala Leu Ile Gly His Ser 385 390 395 400 Gly Cys Gly Lys Ser Thr Leu Ala Asp Ile Ile Met Gly Leu Thr Tyr 405 410 415 Pro Lys Ser Gly Glu Ile Phe Ile Asp Asn Thr Leu Leu Thr Asn Lys 420 425 430 Asn Arg Arg Ser Trp Arg Lys Lys Ile Gly Tyr Ile Pro Gln Asn Ile 435 440 445 Tyr Leu Phe Asp Gly Thr Val Gly Asp Asn Ile Ala Phe Gly Ser Ala 450 455 460 Ile Asp Glu Lys Arg Leu Ile Lys Val Cys Lys Met Ala His Ile Tyr 465 470 475 480 Asp Phe Leu Cys Glu His Glu Gly Leu Lys Thr Gln Val Gly Glu Gly 485 490 495 Gly Ala Lys Leu Ser Gly Gly Gln Lys Gln Arg Ile Gly Ile Ala Arg 500 505 510 Ala Leu Tyr Asp Asn Pro Glu Ile Leu Val Leu Asp Glu Ala Thr Ser 515 520 525 Ala Leu Asp Asn Glu Thr Glu Ser Lys Ile Met Asp Glu Ile Tyr Gln 530 535 540 Ile Ala Lys Asn Lys Thr Leu Ile Val Ile Ala His Arg Leu Ser Thr 545 550 555 560 Ile Glu Arg Cys Glu Val Ile Ile Asp Met Ser Gln His Lys Asp Asn 565 570 575 Leu Gly <210> 37 <211> 333 <212> DNA <213> Escherichia coli K12 <400> 37 atgaaccctt atatttatct tggtggtgca atacttgcag aggtcattgg tacaacctta 60 atgaagtttt cagaaggttt tacacggtta tggccatctg ttggtacaat tatttgttat 120 tgtgcatcat tctggttatt agctcagacg ctggcttata ttcctacagg gattgcttat 180 gctatctggt caggagtcgg tattgtcctg attagcttac tgtcatgggg atttttcggc 240 caacggctgg acctgccagc cattataggc atgatgttga tttgtgccgg tgtgttgatt 300 attaatttat tgtcacgaag cacaccacat taa 333 <210> 38 <211> 110 <212> PRT <213> Escherichia coli K12 <400> 38 Met Asn Pro Tyr Ile Tyr Leu Gly Gly Ala Ile Leu Ala Glu Val Ile 1 5 10 15 Gly Thr Thr Leu Met Lys Phe Ser Glu Gly Phe Thr Arg Leu Trp Pro 20 25 30 Ser Val Gly Thr Ile Ile Cys Tyr Cys Ala Ser Phe Trp Leu Leu Ala 35 40 45 Gln Thr Leu Ala Tyr Ile Pro Thr Gly Ile Ala Tyr Ala Ile Trp Ser 50 55 60 Gly Val Gly Ile Val Leu Ile Ser Leu Leu Ser Trp Gly Phe Phe Gly 65 70 75 80 Gln Arg Leu Asp Leu Pro Ala Ile Ile Gly Met Met Leu Ile Cys Ala 85 90 95 Gly Val Leu Ile Ile Asn Leu Leu Ser Arg Ser Thr Pro His 100 105 110 <210> 39 <211> 1524 <212> DNA <213> Bifidobacterium longum subsp. infantis (strain ATCC 15697) <400> 39 atgtcgaacg agaataccgc cgtgggcgat gtgcgcaaga aaggcggatt aggccagcgc 60 attgcgtatg cttgcggcaa cttagggcag gccgcgtttt ataacgctat gtcgacgtat 120 tttgtgacgt atgtgacctc gtgcctgttt gtgtcgtatt cgaaagcttt agcggcgcag 180 atgattgcgg tgattaccgg cctgattgta gtaattcgca ttgcggaaat ttttattgac 240 ccgttactgg gcaacttagt ggataatacc accaccaaat ggggccggtt tcgcccgtgg 300 cagtttattg gcgggctggt gagcagcgtg ctgattatgt taattttttc aggaatgttt 360 ggactggtga acgtgaatac cacgctgttt attgtgctgt ttgtgattac gtttattgtg 420 cttgatgtgt tttatagcct gcgggatatt agctattggg gcatgattcc ggccttaagc 480 agcgatagcc atgagcggag cacctatacc gcgttaggca cctttaccgg cagcattggc 540 tataacggca ttaccgtgat tgtgattccg attgtgtcgt attttacctg gacttttacc 600 ggcgcgaaag gccagggcca ggccggatgg accagctttg gctttattgt ggccttatta 660 ggcctgatta ccgcgtgggc cgtggcgttt ggcaccaaag agtcgaccaa cgccctgcgc 720 gcgaaagcgc agaaaaacgg caacccgttt gaagccttta aagcgctgtt tcagaacgat 780 cagctgttat gggttgcgct gagctatctg ctgtatgcga ttgctaacgt gattacgacc 840 ggagtgatgt attatttatt tgtgtttgtg cttgatgaac cggccgcgtt tagcgtgacc 900 gggattattc cgctgattgc gggatttatt atggccccgc tgtatccgat attaaaccgc 960 tggataccac ggcgctatct gtttgcgggc ggcatggtga gcatgattat tggctatacg 1020 atgttagcgc tgtttagctc gaacctgccg gttgtgattg tggcgctgat ttttttttac 1080 gtgcccgccc agtttattca gatgaccgcc attctgagcc tgaccgatag cattgaatat 1140 ggccagctga aaaacggcaa acgcaacgaa gccgtgaccc tgagcgtgcg gccaatgtta 1200 gataaaattg gcggcgccat gagcaacgga gtggttggag cggtagcgtt agccgctggc 1260 atgaccgggc acgcgacggc tgcggatatg accgccagca atattaccac gtttaaaacc 1320 tttgcgtttt atattccgct tgtattaatt attttatcgt tagtggtgtt ttggtttaaa 1380 gtgaaaattg atgagaaaat gcatgcccag attgtagatg aattagaggc gaaattagct 1440 agcggcgaaa ttgtggatga cgaagcccag accgtggaag cggttgaagc gattaacgaa 1500 gaaacgccgg ccgcgaaaaa ctaa 1524 <210> 40 <211> 507 <212> PRT <213> Bifidobacterium longum subsp. infantis (strain ATCC 15697) <400> 40 Met Ser Asn Glu Asn Thr Ala Val Gly Asp Val Arg Lys Lys Gly Gly 1 5 10 15 Leu Gly Gln Arg Ile Ala Tyr Ala Cys Gly Asn Leu Gly Gln Ala Ala 20 25 30 Phe Tyr Asn Ala Met Ser Thr Tyr Phe Val Thr Tyr Val Thr Ser Cys 35 40 45 Leu Phe Val Ser Tyr Ser Lys Ala Leu Ala Ala Gln Met Ile Ala Val 50 55 60 Ile Thr Gly Leu Ile Val Val Ile Arg Ile Ala Glu Ile Phe Ile Asp 65 70 75 80 Pro Leu Leu Gly Asn Leu Val Asp Asn Thr Thr Thr Lys Trp Gly Arg 85 90 95 Phe Arg Pro Trp Gln Phe Ile Gly Gly Leu Val Ser Ser Val Leu Ile 100 105 110 Met Leu Ile Phe Ser Gly Met Phe Gly Leu Val Asn Val Asn Thr Thr 115 120 125 Leu Phe Ile Val Leu Phe Val Ile Thr Phe Ile Val Leu Asp Val Phe 130 135 140 Tyr Ser Leu Arg Asp Ile Ser Tyr Trp Gly Met Ile Pro Ala Leu Ser 145 150 155 160 Ser Asp Ser His Glu Arg Ser Thr Tyr Thr Ala Leu Gly Thr Phe Thr 165 170 175 Gly Ser Ile Gly Tyr Asn Gly Ile Thr Val Ile Val Ile Pro Ile Val 180 185 190 Ser Tyr Phe Thr Trp Thr Phe Thr Gly Ala Lys Gly Gln Gly Gln Ala 195 200 205 Gly Trp Thr Ser Phe Gly Phe Ile Val Ala Leu Leu Gly Leu Ile Thr 210 215 220 Ala Trp Ala Val Ala Phe Gly Thr Lys Glu Ser Thr Asn Ala Leu Arg 225 230 235 240 Ala Lys Ala Gln Lys Asn Gly Asn Pro Phe Glu Ala Phe Lys Ala Leu 245 250 255 Phe Gln Asn Asp Gln Leu Leu Trp Val Ala Leu Ser Tyr Leu Leu Tyr 260 265 270 Ala Ile Ala Asn Val Ile Thr Thr Gly Val Met Tyr Tyr Leu Phe Val 275 280 285 Phe Val Leu Asp Glu Pro Ala Ala Phe Ser Val Thr Gly Ile Ile Pro 290 295 300 Leu Ile Ala Gly Phe Ile Met Ala Pro Leu Tyr Pro Ile Leu Asn Arg 305 310 315 320 Trp Ile Pro Arg Arg Tyr Leu Phe Ala Gly Gly Met Val Ser Met Ile 325 330 335 Ile Gly Tyr Thr Met Leu Ala Leu Phe Ser Ser Asn Leu Pro Val Val 340 345 350 Ile Val Ala Leu Ile Phe Phe Tyr Val Pro Ala Gln Phe Ile Gln Met 355 360 365 Thr Ala Ile Leu Ser Leu Thr Asp Ser Ile Glu Tyr Gly Gln Leu Lys 370 375 380 Asn Gly Lys Arg Asn Glu Ala Val Thr Leu Ser Val Arg Pro Met Leu 385 390 395 400 Asp Lys Ile Gly Gly Ala Met Ser Asn Gly Val Val Gly Ala Val Ala 405 410 415 Leu Ala Ala Gly Met Thr Gly His Ala Thr Ala Ala Asp Met Thr Ala 420 425 430 Ser Asn Ile Thr Thr Phe Lys Thr Phe Ala Phe Tyr Ile Pro Leu Val 435 440 445 Leu Ile Ile Leu Ser Leu Val Val Phe Trp Phe Lys Val Lys Ile Asp 450 455 460 Glu Lys Met His Ala Gln Ile Val Asp Glu Leu Glu Ala Lys Leu Ala 465 470 475 480 Ser Gly Glu Ile Val Asp Asp Glu Ala Gln Thr Val Glu Ala Val Glu 485 490 495 Ala Ile Asn Glu Glu Thr Pro Ala Ala Lys Asn 500 505 <210> 41 <211> 1533 <212> DNA <213> Bifidobacterium longum subsp. infantis (strain ATCC 15697) <400> 41 atgtcgaacg agaatgtggc cgatggtgat gtgcgccgaa aaggcggact aggccagcgc 60 attgcgtatg cctttggcaa cttagggcag gccgcgtttt ataacgccat gtcgacgtat 120 tttattgtgt atgtgacctc gtgcctgttt agcggcgtag ataaagccct tgccgcgaaa 180 ctgattggcg tgattacctc gttagtggtg attattcgca ttgcggaaat ttttgtggac 240 ccgctgctgg gcaacctggt tgataatacc aataccaaat ggggccggtt tcgcccgtgg 300 cagttttttg gcggactggt gagcagcgtg ctgcttgccg tggtattttc gggcatgttc 360 ggcctggtga acgtaaatag cactttattt attgtggtgt ttgtgattac gtttattgtg 420 cttgatgtgt tttatagcct gcgggatatt agctattggg gcatgattcc ggccttaagc 480 agcgatagcc atgaacggag cacctatact gcgttaggca gctttaccgg cagcattggc 540 ggcaacgcga ttaccatttt agtgataccg gttgtgacct atttttcctg ggtttttacc 600 ggcgaaaacg cggaacatca gagcggatgg accgcttttg gcattattgt ggccgtgtta 660 ggcattatga ccgcgtggac cgtggcgttt ggcacccgag agaaccaatc ggcgcttcgc 720 gcgaacgccg aggataacgg gggaccgttg caggccttta aagcggtgtt tcagaacgat 780 cagctgttat gggttgcgct gagctatctg ctgtatgcga ttgccaacgt gaccaccacc 840 ggagtgcttt tatttctgtt taaatttgtg cttgataatc aggccgcttt tagcgccacc 900 ggagtgattg cgatgattgc cggcctggtg atgagcccgc tgtatccgat actgaaccga 960 tatataccgc gccgctatct gtatattggc ggcatggtga gcatgattgt ggcttacgtg 1020 atgttagcgc tgtttagctc gaatattgtg ctggtgttta ttgccctggt gttattttat 1080 gtaccaggca cgttaattat gatgacggtg attttaagcc tgaccgatag cattgaatat 1140 ggccagctga aaaacggcaa acgcaacgaa gcggtaacgc ttagcattcg cccgatgtta 1200 gacaaaattg ggggcgctct gagcaacggc atagtgggct ttattgcgct tgccgcgggc 1260 atgacgggcg acgctaccgc cgcggacatg accccgacga atattcatgt gtttaaaatt 1320 tgcgcctttt acgcgccgtt aattctgatt gtgttatcgc tggttgtgtt tgtgagcaaa 1380 gtgaaaatta ccgagaaaat gcatgcccag attgtagatg aattagaggc gaaattagct 1440 agcggcgaaa ttgtggatga cgaagcccag ccagtggaag ccgcggaagc cgcggctgcg 1500 gttggcgacg aaacgcagac tgtgaaaaac taa 1533 <210> 42 <211> 510 <212> PRT <213> Bifidobacterium longum subsp. infantis (strain ATCC 15697) <400> 42 Met Ser Asn Glu Asn Val Ala Asp Gly Asp Val Arg Arg Lys Gly Gly 1 5 10 15 Leu Gly Gln Arg Ile Ala Tyr Ala Phe Gly Asn Leu Gly Gln Ala Ala 20 25 30 Phe Tyr Asn Ala Met Ser Thr Tyr Phe Ile Val Tyr Val Thr Ser Cys 35 40 45 Leu Phe Ser Gly Val Asp Lys Ala Leu Ala Ala Lys Leu Ile Gly Val 50 55 60 Ile Thr Ser Leu Val Val Ile Ile Arg Ile Ala Glu Ile Phe Val Asp 65 70 75 80 Pro Leu Leu Gly Asn Leu Val Asp Asn Thr Asn Thr Lys Trp Gly Arg 85 90 95 Phe Arg Pro Trp Gln Phe Phe Gly Gly Leu Val Ser Ser Val Leu Leu 100 105 110 Ala Val Val Phe Ser Gly Met Phe Gly Leu Val Asn Val Asn Ser Thr 115 120 125 Leu Phe Ile Val Val Phe Val Ile Thr Phe Ile Val Leu Asp Val Phe 130 135 140 Tyr Ser Leu Arg Asp Ile Ser Tyr Trp Gly Met Ile Pro Ala Leu Ser 145 150 155 160 Ser Asp Ser His Glu Arg Ser Thr Tyr Thr Ala Leu Gly Ser Phe Thr 165 170 175 Gly Ser Ile Gly Gly Asn Ala Ile Thr Ile Leu Val Ile Pro Val Val 180 185 190 Thr Tyr Phe Ser Trp Val Phe Thr Gly Glu Asn Ala Glu His Gln Ser 195 200 205 Gly Trp Thr Ala Phe Gly Ile Ile Val Ala Val Leu Gly Ile Met Thr 210 215 220 Ala Trp Thr Val Ala Phe Gly Thr Arg Glu Asn Gln Ser Ala Leu Arg 225 230 235 240 Ala Asn Ala Glu Asp Asn Gly Gly Pro Leu Gln Ala Phe Lys Ala Val 245 250 255 Phe Gln Asn Asp Gln Leu Leu Trp Val Ala Leu Ser Tyr Leu Leu Tyr 260 265 270 Ala Ile Ala Asn Val Thr Thr Thr Gly Val Leu Leu Phe Leu Phe Lys 275 280 285 Phe Val Leu Asp Asn Gln Ala Ala Phe Ser Ala Thr Gly Val Ile Ala 290 295 300 Met Ile Ala Gly Leu Val Met Ser Pro Leu Tyr Pro Ile Leu Asn Arg 305 310 315 320 Tyr Ile Pro Arg Arg Tyr Leu Tyr Ile Gly Gly Met Val Ser Met Ile 325 330 335 Val Ala Tyr Val Met Leu Ala Leu Phe Ser Ser Asn Ile Val Leu Val 340 345 350 Phe Ile Ala Leu Val Leu Phe Tyr Val Pro Gly Thr Leu Ile Met Met 355 360 365 Thr Val Ile Leu Ser Leu Thr Asp Ser Ile Glu Tyr Gly Gln Leu Lys 370 375 380 Asn Gly Lys Arg Asn Glu Ala Val Thr Leu Ser Ile Arg Pro Met Leu 385 390 395 400 Asp Lys Ile Gly Gly Ala Leu Ser Asn Gly Ile Val Gly Phe Ile Ala 405 410 415 Leu Ala Ala Gly Met Thr Gly Asp Ala Thr Ala Ala Asp Met Thr Pro 420 425 430 Thr Asn Ile His Val Phe Lys Ile Cys Ala Phe Tyr Ala Pro Leu Ile 435 440 445 Leu Ile Val Leu Ser Leu Val Val Phe Val Ser Lys Val Lys Ile Thr 450 455 460 Glu Lys Met His Ala Gln Ile Val Asp Glu Leu Glu Ala Lys Leu Ala 465 470 475 480 Ser Gly Glu Ile Val Asp Asp Glu Ala Gln Pro Val Glu Ala Ala Glu 485 490 495 Ala Ala Ala Ala Val Gly Asp Glu Thr Gln Thr Val Lys Asn 500 505 510 <210> 43 <211> 1128 <212> DNA <213> Bifidobacterium longum subsp. infantis (strain ATCC 15697) <400> 43 atggctgaag tggtatttga tcatgtgact cggatttatc cgggcaacga caaaccaagc 60 gtggacgacc tgaatcttga cattaaagac ggcgaatttt tagtgttagt gggccccagc 120 ggctgtggga aatcaacgac ccttcgaatg ttagcgggcc tggaagaagt gaataaaggc 180 cgcattttaa ttgggggcaa agacgtgacc acgatgcagc cgaaagatcg cgatattgct 240 atggtgtttc agaactatgc tctgtatccg catatgaccg tagcggataa tatgggcttt 300 gcgctgaaaa ttgcgggcac tccgaaagat gaaattcgca aacgcgtgga aaaagcggct 360 gaaattttag atctgaccga atatttagat cgcaaaccga aagctctgag cggtgggcag 420 cggcagcgag tggcgatggg gcgagctatt gtgcgggaac cgaaagtgtt tttaatggac 480 gaaccgctga gcaacttaga tgcgaaatta cgggtgcaga cccggaccca gattgcggct 540 ctgcagcggc agttaggcgt gaccaccctg tatgtgaccc atgaccagac cgaagcgctg 600 acgatgggcg accgcattgc ggtgattaaa ttaggcattc tgcaacaggt tggcgcgccg 660 accgagctgt acgaccggcc ggcgaacgtg tttgtggccg gctttattgg cagcccgagc 720 atgaacctga atacccatcc ggttgtgaac ggcaaagcca aaattgggga agataccgtg 780 gacctgccgg ccgaagcggt gaataaatta accgccgagg ataacggcca gattgttgtg 840 ggctttcggc cagaagatgc cggcctggcc ccggttgacg atccgaacgc gtttagcctg 900 aaagtagtga acgtggaaga tctgggcagc gacggctata tttatgggac cattgtgacc 960 gacggaagcg cggccgaagc gagccaggtg atgagcgatc agaataaatt aaccacgata 1020 cgggtgaatc cgcgggccct gccgaaagta ggcgccaccg tgaaaattaa aattgatccg 1080 gcgaaaatgc atctgtttgc tccgagcact gaactgcggc tgaactga 1128 <210> 44 <211> 375 <212> PRT <213> Bifidobacterium longum subsp. infantis (strain ATCC 15697) <400> 44 Met Ala Glu Val Val Phe Asp His Val Thr Arg Ile Tyr Pro Gly Asn 1 5 10 15 Asp Lys Pro Ser Val Asp Asp Leu Asn Leu Asp Ile Lys Asp Gly Glu 20 25 30 Phe Leu Val Leu Val Gly Pro Ser Gly Cys Gly Lys Ser Thr Thr Leu 35 40 45 Arg Met Leu Ala Gly Leu Glu Glu Val Asn Lys Gly Arg Ile Leu Ile 50 55 60 Gly Gly Lys Asp Val Thr Thr Met Gln Pro Lys Asp Arg Asp Ile Ala 65 70 75 80 Met Val Phe Gln Asn Tyr Ala Leu Tyr Pro His Met Thr Val Ala Asp 85 90 95 Asn Met Gly Phe Ala Leu Lys Ile Ala Gly Thr Pro Lys Asp Glu Ile 100 105 110 Arg Lys Arg Val Glu Lys Ala Ala Glu Ile Leu Asp Leu Thr Glu Tyr 115 120 125 Leu Asp Arg Lys Pro Lys Ala Leu Ser Gly Gly Gln Arg Gln Arg Val 130 135 140 Ala Met Gly Arg Ala Ile Val Arg Glu Pro Lys Val Phe Leu Met Asp 145 150 155 160 Glu Pro Leu Ser Asn Leu Asp Ala Lys Leu Arg Val Gln Thr Arg Thr 165 170 175 Gln Ile Ala Ala Leu Gln Arg Gln Leu Gly Val Thr Thr Leu Tyr Val 180 185 190 Thr His Asp Gln Thr Glu Ala Leu Thr Met Gly Asp Arg Ile Ala Val 195 200 205 Ile Lys Leu Gly Ile Leu Gln Gln Val Gly Ala Pro Thr Glu Leu Tyr 210 215 220 Asp Arg Pro Ala Asn Val Phe Val Ala Gly Phe Ile Gly Ser Pro Ser 225 230 235 240 Met Asn Leu Asn Thr His Pro Val Val Asn Gly Lys Ala Lys Ile Gly 245 250 255 Glu Asp Thr Val Asp Leu Pro Ala Glu Ala Val Asn Lys Leu Thr Ala 260 265 270 Glu Asp Asn Gly Gln Ile Val Val Gly Phe Arg Pro Glu Asp Ala Gly 275 280 285 Leu Ala Pro Val Asp Asp Pro Asn Ala Phe Ser Leu Lys Val Val Asn 290 295 300 Val Glu Asp Leu Gly Ser Asp Gly Tyr Ile Tyr Gly Thr Ile Val Thr 305 310 315 320 Asp Gly Ser Ala Ala Glu Ala Ser Gln Val Met Ser Asp Gln Asn Lys 325 330 335 Leu Thr Thr Ile Arg Val Asn Pro Arg Ala Leu Pro Lys Val Gly Ala 340 345 350 Thr Val Lys Ile Lys Ile Asp Pro Ala Lys Met His Leu Phe Ala Pro 355 360 365 Ser Thr Glu Leu Arg Leu Asn 370 375 <210> 45 <211> 1218 <212> DNA <213> Bifidobacterium longum subsp. infantis (strain ATCC 15697) <400> 45 atggctctag acgtaggcaa ggccttaaag agcaaaacct tagtggttgg cgtgttaagc 60 atgagcttac tgatgagcgc gtcgaatgct gtgtcgggca ccataccggc catgaaagaa 120 gcctttagcg attatagcgc cgccaacgtt gagctgctga ccacggtgcc gacgattggc 180 agcatggttg gcacggcttt aaccggccta tttgcgaatg cgattggccg aaagaagatt 240 gccatggccg gatttttaat aagcgcggtg actggcgtga taccggcctt ttttccgtat 300 tactggccga tattaataag ccgaatgttt tttggctttg gaagcgccct gtttgtgacc 360 ttatcagtga gctatattac cgatctgtac gatggcgaca tgcaacgcaa actgcttgga 420 tggagacagg ccgtgggcaa tcttggcgat gtggtgctgc tgtttgtggc gtcactgctg 480 attaccatta actggcaaag cacgtattta attttttttc tgttatttgt gccaatggtg 540 ttagtgggca tgtttatacc gaaagaattt gacaactttt cgatacgctc ggccttagtg 600 gatgacgaag gccatgttgt ggataaatcg gcgagccaga aacagacgac gaactggcaa 660 gtgctgtggc tggcctttat ttttctggtt gtgagcatgc tttataacgt gatgagcatt 720 aaattagcgt cgtacgtggt tgacgagggc attgggagcg ctagcttagc gactttaatt 780 ttttcgtttt tagttgtggc gaccatttta agcggcgtgt tatttgataa agtggcgaaa 840 gtgaccaaac gcctgacggt gaccattagc gaagtggtga ttggcatttg ttttattgcg 900 actgccctga cgaaaaacgt gccgctgatg tttgcgctgg tgctgatagc gggctttgct 960 tggggcatta ttaacccagc cctgaccgct cggtttgtgg attatagccc agcccatagc 1020 atgaacctga ccacgagcat tgtgataatt ggcattaata ttggctgtct gattagcccg 1080 tatttttttg ccctgacggc ttcgattttt ggcaatagca gcgcgggatt tgcgattatt 1140 gtgggagggg ccttatattt agtgatggtt gtgattgaac tgattacctt aaaagtggat 1200 aagaaattaa cggtgtaa 1218 <210> 46 <211> 405 <212> PRT <213> Bifidobacterium longum subsp. infantis (strain ATCC 15697) <400> 46 Met Ala Leu Asp Val Gly Lys Ala Leu Lys Ser Lys Thr Leu Val Val 1 5 10 15 Gly Val Leu Ser Met Ser Leu Leu Met Ser Ala Ser Asn Ala Val Ser 20 25 30 Gly Thr Ile Pro Ala Met Lys Glu Ala Phe Ser Asp Tyr Ser Ala Ala 35 40 45 Asn Val Glu Leu Leu Thr Thr Val Pro Thr Ile Gly Ser Met Val Gly 50 55 60 Thr Ala Leu Thr Gly Leu Phe Ala Asn Ala Ile Gly Arg Lys Lys Ile 65 70 75 80 Ala Met Ala Gly Phe Leu Ile Ser Ala Val Thr Gly Val Ile Pro Ala 85 90 95 Phe Phe Pro Tyr Tyr Trp Pro Ile Leu Ile Ser Arg Met Phe Phe Gly 100 105 110 Phe Gly Ser Ala Leu Phe Val Thr Leu Ser Val Ser Tyr Ile Thr Asp 115 120 125 Leu Tyr Asp Gly Asp Met Gln Arg Lys Leu Leu Gly Trp Arg Gln Ala 130 135 140 Val Gly Asn Leu Gly Asp Val Val Leu Leu Phe Val Ala Ser Leu Leu 145 150 155 160 Ile Thr Ile Asn Trp Gln Ser Thr Tyr Leu Ile Phe Phe Leu Leu Phe 165 170 175 Val Pro Met Val Leu Val Gly Met Phe Ile Pro Lys Glu Phe Asp Asn 180 185 190 Phe Ser Ile Arg Ser Ala Leu Val Asp Asp Glu Gly His Val Val Asp 195 200 205 Lys Ser Ala Ser Gln Lys Gln Thr Thr Asn Trp Gln Val Leu Trp Leu 210 215 220 Ala Phe Ile Phe Leu Val Val Ser Met Leu Tyr Asn Val Met Ser Ile 225 230 235 240 Lys Leu Ala Ser Tyr Val Val Asp Glu Gly Ile Gly Ser Ala Ser Leu 245 250 255 Ala Thr Leu Ile Phe Ser Phe Leu Val Val Ala Thr Ile Leu Ser Gly 260 265 270 Val Leu Phe Asp Lys Val Ala Lys Val Thr Lys Arg Leu Thr Val Thr 275 280 285 Ile Ser Glu Val Val Ile Gly Ile Cys Phe Ile Ala Thr Ala Leu Thr 290 295 300 Lys Asn Val Pro Leu Met Phe Ala Leu Val Leu Ile Ala Gly Phe Ala 305 310 315 320 Trp Gly Ile Ile Asn Pro Ala Leu Thr Ala Arg Phe Val Asp Tyr Ser 325 330 335 Pro Ala His Ser Met Asn Leu Thr Thr Ser Ile Val Ile Ile Gly Ile 340 345 350 Asn Ile Gly Cys Leu Ile Ser Pro Tyr Phe Phe Ala Leu Thr Ala Ser 355 360 365 Ile Phe Gly Asn Ser Ser Ala Gly Phe Ala Ile Ile Val Gly Gly Ala 370 375 380 Leu Tyr Leu Val Met Val Val Ile Glu Leu Ile Thr Leu Lys Val Asp 385 390 395 400 Lys Lys Leu Thr Val 405 <210> 47 <211> 1206 <212> DNA <213> Bifidobacterium longum subsp. infantis (strain ATCC 15697) <400> 47 atgatacagc gctactctca aggaacgtca gctagaagaa tttttccaat attactgata 60 gccgagggac tatgcctaag cggcatgtcc gtggacctga ctattacctc actgaccggg 120 agcagcttag cccccgctcc ctggatggct acttttccga tagcctgcat atttattggg 180 acggtgattg gcactccggc tatgggacgc ttagtgggac ggtttggcta ccggcaagta 240 tttgtgtttg gcgcgcttct agcggtgtta gggggaataa gctcagcgac ggctttacgg 300 tttcatcagt ttcccttatt atgtatagga acgttttgtg tgggcatata tcagagcgga 360 acgaactatt atcggtacgc ggctgcggac agcatgccag gcaaggagtc gaaagctatt 420 aacggaattc taagcgctgg agcgatagct tcgattattg gcccggtact ggccactttt 480 tttggcactg ccaccaatat tgagtatgaa ggatcatact atgtggtgtc ggtgttagcg 540 gcgtgcgccg taattgtgct gctggcctta ccgaagatac agagccccac tccagcccat 600 atgcgcgata aggctaccgc ctcgactacc ccaaattacc cggctttact gacccggcca 660 cggtttgtgc tgggcgccac catttcgttt gtggcttcat ttgtgatggt gttagtgatg 720 tcgggcgctc caatagtgtt agaatcgacg tttagccaaa acgcccaaac cagaatggtt 780 gcgatgcaac tgcatatggt tggcatgtat ctgcccaccc tgtttgcgat ttttatattt 840 cataaaaaga actccgagat ggcccaggcc ttaacgggat taattattgg catgttaggc 900 actgtggttg ctttagcggc cagcgctagc tacgcggtga ctctggacct gctgctgatt 960 ggaataagct ggagcctgtg ctatgcggct ggctcggcgc tgttaactaa gagctatacg 1020 gaaagcgagc gaagctgggc ccgaggcgtg ggcgagttag ctccagtatt agggcaagtg 1080 ctgggatcag tgttagctgg cgtgctgctg gccgccggat ggaaaaccgt atttgtgacc 1140 gtgctggcca tgattgtatg cgccttaatt gcgatggctg gataccgcaa taagattaaa 1200 tcataa 1206 <210> 48 <211> 401 <212> PRT <213> Bifidobacterium longum subsp. infantis (strain ATCC 15697) <400> 48 Met Ile Gln Arg Tyr Ser Gln Gly Thr Ser Ala Arg Arg Ile Phe Pro 1 5 10 15 Ile Leu Leu Ile Ala Glu Gly Leu Cys Leu Ser Gly Met Ser Val Asp 20 25 30 Leu Thr Ile Thr Ser Leu Thr Gly Ser Ser Leu Ala Pro Ala Pro Trp 35 40 45 Met Ala Thr Phe Pro Ile Ala Cys Ile Phe Ile Gly Thr Val Ile Gly 50 55 60 Thr Pro Ala Met Gly Arg Leu Val Gly Arg Phe Gly Tyr Arg Gln Val 65 70 75 80 Phe Val Phe Gly Ala Leu Leu Ala Val Leu Gly Gly Ile Ser Ser Ala 85 90 95 Thr Ala Leu Arg Phe His Gln Phe Pro Leu Leu Cys Ile Gly Thr Phe 100 105 110 Cys Val Gly Ile Tyr Gln Ser Gly Thr Asn Tyr Tyr Arg Tyr Ala Ala 115 120 125 Ala Asp Ser Met Pro Gly Lys Glu Ser Lys Ala Ile Asn Gly Ile Leu 130 135 140 Ser Ala Gly Ala Ile Ala Ser Ile Ile Gly Pro Val Leu Ala Thr Phe 145 150 155 160 Phe Gly Thr Ala Thr Asn Ile Glu Tyr Glu Gly Ser Tyr Tyr Val Val 165 170 175 Ser Val Leu Ala Ala Cys Ala Val Ile Val Leu Leu Ala Leu Pro Lys 180 185 190 Ile Gln Ser Pro Thr Pro Ala His Met Arg Asp Lys Ala Thr Ala Ser 195 200 205 Thr Thr Pro Asn Tyr Pro Ala Leu Leu Thr Arg Pro Arg Phe Val Leu 210 215 220 Gly Ala Thr Ile Ser Phe Val Ala Ser Phe Val Met Val Leu Val Met 225 230 235 240 Ser Gly Ala Pro Ile Val Leu Glu Ser Thr Phe Ser Gln Asn Ala Gln 245 250 255 Thr Arg Met Val Ala Met Gln Leu His Met Val Gly Met Tyr Leu Pro 260 265 270 Thr Leu Phe Ala Ile Phe Ile Phe His Lys Lys Asn Ser Glu Met Ala 275 280 285 Gln Ala Leu Thr Gly Leu Ile Ile Gly Met Leu Gly Thr Val Val Ala 290 295 300 Leu Ala Ala Ser Ala Ser Tyr Ala Val Thr Leu Asp Leu Leu Leu Ile 305 310 315 320 Gly Ile Ser Trp Ser Leu Cys Tyr Ala Ala Gly Ser Ala Leu Leu Thr 325 330 335 Lys Ser Tyr Thr Glu Ser Glu Arg Ser Trp Ala Arg Gly Val Gly Glu 340 345 350 Leu Ala Pro Val Leu Gly Gln Val Leu Gly Ser Val Leu Ala Gly Val 355 360 365 Leu Leu Ala Ala Gly Trp Lys Thr Val Phe Val Thr Val Leu Ala Met 370 375 380 Ile Val Cys Ala Leu Ile Ala Met Ala Gly Tyr Arg Asn Lys Ile Lys 385 390 395 400 Ser <210> 49 <211> 1224 <212> DNA <213> Bifidobacterium longum subsp. infantis (strain ATCC 15697) <400> 49 atgtcaaaga taataaatta ctcagaagta ctggagagca agcggctgat ggtaggcgtg 60 ttaagcgtgt catttctatt aagcgctggg aatgctatat cgggaacgat accagccatg 120 gaagaggcct ttagcaatat aagcaaggcg aatatagaaa ctctaacgac cataccgact 180 gccggaataa tgttaggaac cgtgttaagc ggagtattta gcaattacct aggaaagaaa 240 aagagcgtgt tagccgggtt aataattgct ttagtaggcg gagtaattcc agcctttctg 300 ccccaatatt ggcccatttt cataagccgg tttttattcg gcgtgggcat gggaattttc 360 aatccgcttt cagtgagcta tattaccgac ctgtacgtgg gcgaccggca gcggtcactt 420 cttggatatc gcaatgccgt atcgaatctg ggagacacca ttatgctttt tgtagctggg 480 attttaataa ccttcggatg gaatattacc tacctggtgt tttttgcgtt actgataccg 540 atagtactaa taatattatt tgtacccaaa gagtttgaca attttgacat tcgaaactca 600 gctctggacg aaaatgggca gatatcagat tcagtgtcag acgtgaagcc ctcaacgaat 660 ttaaaagtga ttgaagtagg cgtagtattc atggtaatta ctatgctata taacgccatt 720 ccgctgaagt tcgcctcgta tatagtgacg gaacatattg gcactgcgag caccgcgact 780 tggatttttt cgtttctggt gttagccggc atatttagcg gcgtgctgtt tgagaaaata 840 agcaaagtat ttaaacggtt aacggtgttt gtatttgaaa tagtaatagg cgtggcgtat 900 attacgatag cctttaccta taatataccg ttactgacgg ctttagtgtt aatttcaggc 960 ttcggatggg gaataattaa cccggcttta actgcccggt tagtagacgt gagcccgata 1020 aactcaatga atctgtcaac ttcaataata gtaattttca tttcagtagg gtcacttata 1080 agcccgtatt tttttgctat gtttgccggc ttatttggga acgacagcgc tgcctttgct 1140 atagtagttg ggggagcgct gtacgtggtg atggccgtgc ttgactttat taagataaag 1200 aagaataaag aactgtcgat ttaa 1224 <210> 50 <211> 407 <212> PRT <213> Bifidobacterium longum subsp. infantis (strain ATCC 15697) <400> 50 Met Ser Lys Ile Ile Asn Tyr Ser Glu Val Leu Glu Ser Lys Arg Leu 1 5 10 15 Met Val Gly Val Leu Ser Val Ser Phe Leu Leu Ser Ala Gly Asn Ala 20 25 30 Ile Ser Gly Thr Ile Pro Ala Met Glu Glu Ala Phe Ser Asn Ile Ser 35 40 45 Lys Ala Asn Ile Glu Thr Leu Thr Thr Ile Pro Thr Ala Gly Ile Met 50 55 60 Leu Gly Thr Val Leu Ser Gly Val Phe Ser Asn Tyr Leu Gly Lys Lys 65 70 75 80 Lys Ser Val Leu Ala Gly Leu Ile Ile Ala Leu Val Gly Gly Val Ile 85 90 95 Pro Ala Phe Leu Pro Gln Tyr Trp Pro Ile Phe Ile Ser Arg Phe Leu 100 105 110 Phe Gly Val Gly Met Gly Ile Phe Asn Pro Leu Ser Val Ser Tyr Ile 115 120 125 Thr Asp Leu Tyr Val Gly Asp Arg Gln Arg Ser Leu Leu Gly Tyr Arg 130 135 140 Asn Ala Val Ser Asn Leu Gly Asp Thr Ile Met Leu Phe Val Ala Gly 145 150 155 160 Ile Leu Ile Thr Phe Gly Trp Asn Ile Thr Tyr Leu Val Phe Phe Ala 165 170 175 Leu Leu Ile Pro Ile Val Leu Ile Ile Leu Phe Val Pro Lys Glu Phe 180 185 190 Asp Asn Phe Asp Ile Arg Asn Ser Ala Leu Asp Glu Asn Gly Gln Ile 195 200 205 Ser Asp Ser Val Ser Asp Val Lys Pro Ser Thr Asn Leu Lys Val Ile 210 215 220 Glu Val Gly Val Val Phe Met Val Ile Thr Met Leu Tyr Asn Ala Ile 225 230 235 240 Pro Leu Lys Phe Ala Ser Tyr Ile Val Thr Glu His Ile Gly Thr Ala 245 250 255 Ser Thr Ala Thr Trp Ile Phe Ser Phe Leu Val Leu Ala Gly Ile Phe 260 265 270 Ser Gly Val Leu Phe Glu Lys Ile Ser Lys Val Phe Lys Arg Leu Thr 275 280 285 Val Phe Val Phe Glu Ile Val Ile Gly Val Ala Tyr Ile Thr Ile Ala 290 295 300 Phe Thr Tyr Asn Ile Pro Leu Leu Thr Ala Leu Val Leu Ile Ser Gly 305 310 315 320 Phe Gly Trp Gly Ile Ile Asn Pro Ala Leu Thr Ala Arg Leu Val Asp 325 330 335 Val Ser Pro Ile Asn Ser Met Asn Leu Ser Thr Ser Ile Ile Val Ile 340 345 350 Phe Ile Ser Val Gly Ser Leu Ile Ser Pro Tyr Phe Phe Ala Met Phe 355 360 365 Ala Gly Leu Phe Gly Asn Asp Ser Ala Ala Phe Ala Ile Val Val Gly 370 375 380 Gly Ala Leu Tyr Val Val Met Ala Val Leu Asp Phe Ile Lys Ile Lys 385 390 395 400 Lys Asn Lys Glu Leu Ser Ile 405 <210> 51 <211> 1578 <212> DNA <213> Neurospora crassa OR74A <400> 51 atgggcattt ttaataaaaa accagttgcc caggccgtgg atttaaatca gatacaggaa 60 gaagcccctc agttcgaacg ggttgattgg aaaaaagatc caggtttacg taaattatat 120 ttttatgcgt ttatcttatg catcgcctcg gcgaccaccg gttatgacgg catgtttttt 180 aactcggttc agaactttga aacctggatc aaatatttcg gcgatccacg gggaagcgaa 240 ttaggtttat taggtgcctt atatcagatc ggtagcatcg gcagcattcc attcgtgcca 300 ttattaaccg ataacttcgg ccgtaaaacc ccaattatta ttggctgcgt tattatgatt 360 gttggtgcgg ttttgcaggc gacggcgaaa aacttagaca cttttatggg cggccggacc 420 atgttaggct tcggcaatag cttagcgcag attgcgagcc caatgttatt aaccgaatta 480 gcgcaccctc aacatcgtgc ccggttaacc accatttata actgcttatg gaacgttggt 540 gcgttagtgg tgtcgtggtt agcgttcggc accaactata ttaataacga ttggtcatgg 600 cgtatcccag cgttattgca ggcctttcca agcattatcc agttattagg tatttggtgg 660 gttccagaat ccccacggtt tttaattgcg aaagataaac atgatgaagc gttgcatatt 720 ttagcgaaat atcatgcgaa cggcgatcca aaccatccaa ccgtgcagtt cgaatttcgt 780 gaaattaaag aaaccattcg tttagaaatg gagtcgacca aaaactcgtc gtatttagat 840 ttctttaaat cgcgtggcaa ccgttatcgt ttagcgattt tattatcgtt aggctttttt 900 agccaatgga gcggcaacgc gattattagc aactatagca gcaaattata tgaaaccgcc 960 ggcgtgaccg atagcaccgc gaagttaggt ttaagcgcgg ggcagaccgg tttagcatta 1020 attgttagcg tgaccatggc attattagtg gataaattag gtcggcgatt agccttttta 1080 gccagcacgg gcggcatgtg cggcaccttc gtgatctgga ctttaactgc gggcttatat 1140 ggcgaacatc gtttaaaagg cgcggataaa gcgatgattt tcttcatttg ggtttttggc 1200 attttttatt cgttagcgtg gtccgggtta ttagtgggct atgcgattga gattttacca 1260 tatcggttac gtggcaaagg gttaatggtg atgaatatgt cggttcagtg cgcattaacg 1320 ttaaatactt acgcaaaccc agttgcattc gactatttcg gtccagacca ttcgtggaaa 1380 ttatacttaa tctatacttg ctggattgcg gccgaatttg tgtttgtgtt ttttatgtat 1440 gtggaaacca aaggcccaac gttagaagaa ttagcgaaag tgatcgacgg cgacgaagcc 1500 gacgttgcgc atattgatat ccatcaggtt gaaaaagaag ttgaaatcca tgaacacgaa 1560 ggcaaatccg ttgcctga 1578 <210> 52 <211> 525 <212> PRT <213> Neurospora crassa OR74A <400> 52 Met Gly Ile Phe Asn Lys Lys Pro Val Ala Gln Ala Val Asp Leu Asn 1 5 10 15 Gln Ile Gln Glu Glu Ala Pro Gln Phe Glu Arg Val Asp Trp Lys Lys 20 25 30 Asp Pro Gly Leu Arg Lys Leu Tyr Phe Tyr Ala Phe Ile Leu Cys Ile 35 40 45 Ala Ser Ala Thr Thr Gly Tyr Asp Gly Met Phe Phe Asn Ser Val Gln 50 55 60 Asn Phe Glu Thr Trp Ile Lys Tyr Phe Gly Asp Pro Arg Gly Ser Glu 65 70 75 80 Leu Gly Leu Leu Gly Ala Leu Tyr Gln Ile Gly Ser Ile Gly Ser Ile 85 90 95 Pro Phe Val Pro Leu Leu Thr Asp Asn Phe Gly Arg Lys Thr Pro Ile 100 105 110 Ile Ile Gly Cys Val Ile Met Ile Val Gly Ala Val Leu Gln Ala Thr 115 120 125 Ala Lys Asn Leu Asp Thr Phe Met Gly Gly Arg Thr Met Leu Gly Phe 130 135 140 Gly Asn Ser Leu Ala Gln Ile Ala Ser Pro Met Leu Leu Thr Glu Leu 145 150 155 160 Ala His Pro Gln His Arg Ala Arg Leu Thr Thr Ile Tyr Asn Cys Leu 165 170 175 Trp Asn Val Gly Ala Leu Val Val Ser Trp Leu Ala Phe Gly Thr Asn 180 185 190 Tyr Ile Asn Asn Asp Trp Ser Trp Arg Ile Pro Ala Leu Leu Gln Ala 195 200 205 Phe Pro Ser Ile Ile Gln Leu Leu Gly Ile Trp Trp Val Pro Glu Ser 210 215 220 Pro Arg Phe Leu Ile Ala Lys Asp Lys His Asp Glu Ala Leu His Ile 225 230 235 240 Leu Ala Lys Tyr His Ala Asn Gly Asp Pro Asn His Pro Thr Val Gln 245 250 255 Phe Glu Phe Arg Glu Ile Lys Glu Thr Ile Arg Leu Glu Met Glu Ser 260 265 270 Thr Lys Asn Ser Ser Tyr Leu Asp Phe Phe Lys Ser Arg Gly Asn Arg 275 280 285 Tyr Arg Leu Ala Ile Leu Leu Ser Leu Gly Phe Phe Ser Gln Trp Ser 290 295 300 Gly Asn Ala Ile Ile Ser Asn Tyr Ser Ser Lys Leu Tyr Glu Thr Ala 305 310 315 320 Gly Val Thr Asp Ser Thr Ala Lys Leu Gly Leu Ser Ala Gly Gln Thr 325 330 335 Gly Leu Ala Leu Ile Val Ser Val Thr Met Ala Leu Leu Val Asp Lys 340 345 350 Leu Gly Arg Arg Leu Ala Phe Leu Ala Ser Thr Gly Gly Met Cys Gly 355 360 365 Thr Phe Val Ile Trp Thr Leu Thr Ala Gly Leu Tyr Gly Glu His Arg 370 375 380 Leu Lys Gly Ala Asp Lys Ala Met Ile Phe Phe Ile Trp Val Phe Gly 385 390 395 400 Ile Phe Tyr Ser Leu Ala Trp Ser Gly Leu Leu Val Gly Tyr Ala Ile 405 410 415 Glu Ile Leu Pro Tyr Arg Leu Arg Gly Lys Gly Leu Met Val Met Asn 420 425 430 Met Ser Val Gln Cys Ala Leu Thr Leu Asn Thr Tyr Ala Asn Pro Val 435 440 445 Ala Phe Asp Tyr Phe Gly Pro Asp His Ser Trp Lys Leu Tyr Leu Ile 450 455 460 Tyr Thr Cys Trp Ile Ala Ala Glu Phe Val Phe Val Phe Phe Met Tyr 465 470 475 480 Val Glu Thr Lys Gly Pro Thr Leu Glu Glu Leu Ala Lys Val Ile Asp 485 490 495 Gly Asp Glu Ala Asp Val Ala His Ile Asp Ile His Gln Val Glu Lys 500 505 510 Glu Val Glu Ile His Glu His Glu Gly Lys Ser Val Ala 515 520 525 <210> 53 <211> 1590 <212> DNA <213> Aspergillus oryzae RIB40 <400> 53 atgatcgctg taggcaaaca acgggaagaa gatgtgtctg atccagtgtt agccaactta 60 ttagcggaag atcggacccc atggtataaa aaaccaaact tacggcgatt atacttaatt 120 ttatttccag cttgcatggg tatcgaaatt acctctgggt tcgattctca gattattaat 180 actgtgcaga ttgtgtatac ctggaataag tactttgggc gacttacggg agacaccgtg 240 gacgggatgc cagaatacga agtggagcct aatttaaagg gtttccttgg tgcagcttat 300 agccttggtg cgattctttc gttaccattc gtgccatggg taaatcaacg gttcggtcgg 360 cgatggacgg taatgtttgg gtcgtgcatt tcgttagttg gggcacttct tcaagggttt 420 tctaacggtg ttggtatgta tatagtagcg cggatgctac ttggtttcgg gatcccatac 480 tgcattgtgg ccgggtcgtg cttaattggg gaattagggt acccaaaaga gcggccaatt 540 ttaacgagct tattcaactc tagctacttt atcgggcaaa ttgttgcggc cgccgttggt 600 ttaggtacgg tgactattgc ttcgaactgg gcatggcgaa ttccatcttt attgcagtta 660 gcgccagcga tggtgcaagt ggtgttcgta tttttcttac cagaatcgcc acggtactta 720 atttcgaagg atcggcatga agaggccttt ggtatcttag ccaagtacca cgccgaaggc 780 gatcggaata gcgtaattgt gcgggcagaa atcgcccaga tcgagcggac cattaaatta 840 gaattagagg aagcaaagca atcgtggtgg gatatgtttc ggaccgcagg gatgcggcga 900 cggttattaa ttagcgcatt cttaggttta ttcacccaat ggagcggtaa taccttaatc 960 tcttactact tatcggattt attagacatg gttggtatta ccgattcagt gaccaaaagc 1020 aaaattaata ttgggatcgc gtgctgggga ctcgtgtcgg gtaccgccct agcgcttacg 1080 gcaccattat ttaaacggcg aacgatgtac ctaacctgtg caacttcttt actttgcgtg 1140 tatatcggtt ggactatcag catggaacgg tttatgacta ctgaagtgcg ggcagccgct 1200 attttaacta ttttcttcat tttcgcctat agccctgctt ataaccttgg ttataatgcg 1260 ttaacttata cttacttaat cgagattttt ccatactttg ggcgatcgcg gggcctcagc 1320 tggtttcagt tctacggtcg gggcagtgct ttcttcgcga cttacgtgaa tccagttggg 1380 ttagaccgga tttcgtggcg atggttatta gtatactgct gttggcttgc ctttgaatta 1440 gtattcattt actttctttt tcctgagact tcgggtcgga ctttagaaga attatctttc 1500 atgtttgaag gcaaggagaa ggccaatgaa gtggccgcgg ctgtgcataa acagattgaa 1560 gtggacggga aaactgaggg ccaggcgtaa 1590 <210> 54 <211> 529 <212> PRT <213> Aspergillus oryzae RIB40 <400> 54 Met Ile Ala Val Gly Lys Gln Arg Glu Glu Asp Val Ser Asp Pro Val 1 5 10 15 Leu Ala Asn Leu Leu Ala Glu Asp Arg Thr Pro Trp Tyr Lys Lys Pro 20 25 30 Asn Leu Arg Arg Leu Tyr Leu Ile Leu Phe Pro Ala Cys Met Gly Ile 35 40 45 Glu Ile Thr Ser Gly Phe Asp Ser Gln Ile Ile Asn Thr Val Gln Ile 50 55 60 Val Tyr Thr Trp Asn Lys Tyr Phe Gly Arg Leu Thr Gly Asp Thr Val 65 70 75 80 Asp Gly Met Pro Glu Tyr Glu Val Glu Pro Asn Leu Lys Gly Phe Leu 85 90 95 Gly Ala Ala Tyr Ser Leu Gly Ala Ile Leu Ser Leu Pro Phe Val Pro 100 105 110 Trp Val Asn Gln Arg Phe Gly Arg Arg Trp Thr Val Met Phe Gly Ser 115 120 125 Cys Ile Ser Leu Val Gly Ala Leu Leu Gln Gly Phe Ser Asn Gly Val 130 135 140 Gly Met Tyr Ile Val Ala Arg Met Leu Leu Gly Phe Gly Ile Pro Tyr 145 150 155 160 Cys Ile Val Ala Gly Ser Cys Leu Ile Gly Glu Leu Gly Tyr Pro Lys 165 170 175 Glu Arg Pro Ile Leu Thr Ser Leu Phe Asn Ser Ser Tyr Phe Ile Gly 180 185 190 Gln Ile Val Ala Ala Ala Val Gly Leu Gly Thr Val Thr Ile Ala Ser 195 200 205 Asn Trp Ala Trp Arg Ile Pro Ser Leu Leu Gln Leu Ala Pro Ala Met 210 215 220 Val Gln Val Val Phe Val Phe Phe Leu Pro Glu Ser Pro Arg Tyr Leu 225 230 235 240 Ile Ser Lys Asp Arg His Glu Glu Ala Phe Gly Ile Leu Ala Lys Tyr 245 250 255 His Ala Glu Gly Asp Arg Asn Ser Val Ile Val Arg Ala Glu Ile Ala 260 265 270 Gln Ile Glu Arg Thr Ile Lys Leu Glu Leu Glu Glu Ala Lys Gln Ser 275 280 285 Trp Trp Asp Met Phe Arg Thr Ala Gly Met Arg Arg Arg Leu Leu Ile 290 295 300 Ser Ala Phe Leu Gly Leu Phe Thr Gln Trp Ser Gly Asn Thr Leu Ile 305 310 315 320 Ser Tyr Tyr Leu Ser Asp Leu Leu Asp Met Val Gly Ile Thr Asp Ser 325 330 335 Val Thr Lys Ser Lys Ile Asn Ile Gly Ile Ala Cys Trp Gly Leu Val 340 345 350 Ser Gly Thr Ala Leu Ala Leu Thr Ala Pro Leu Phe Lys Arg Arg Thr 355 360 365 Met Tyr Leu Thr Cys Ala Thr Ser Leu Leu Cys Val Tyr Ile Gly Trp 370 375 380 Thr Ile Ser Met Glu Arg Phe Met Thr Thr Glu Val Arg Ala Ala Ala 385 390 395 400 Ile Leu Thr Ile Phe Phe Ile Phe Ala Tyr Ser Pro Ala Tyr Asn Leu 405 410 415 Gly Tyr Asn Ala Leu Thr Tyr Thr Tyr Leu Ile Glu Ile Phe Pro Tyr 420 425 430 Phe Gly Arg Ser Arg Gly Leu Ser Trp Phe Gln Phe Tyr Gly Arg Gly 435 440 445 Ser Ala Phe Phe Ala Thr Tyr Val Asn Pro Val Gly Leu Asp Arg Ile 450 455 460 Ser Trp Arg Trp Leu Leu Val Tyr Cys Cys Trp Leu Ala Phe Glu Leu 465 470 475 480 Val Phe Ile Tyr Phe Leu Phe Pro Glu Thr Ser Gly Arg Thr Leu Glu 485 490 495 Glu Leu Ser Phe Met Phe Glu Gly Lys Glu Lys Ala Asn Glu Val Ala 500 505 510 Ala Ala Val His Lys Gln Ile Glu Val Asp Gly Lys Thr Glu Gly Gln 515 520 525 Ala <210> 55 <211> 2811 <212> DNA <213> Helicobacter pylori (Campylobacter pylori) <400> 55 atgaagaacc ttaaaagcct attaagcttt ttactagcga gcttttgggt agcgatcccg 60 ctgatcgccc tttacgcgtg tgcctgtgcc atagcaacgt ttatagaaaa tgattacggc 120 acgagcacgt caaaggcgat tgtgtataat acgccgtggt ttaacttctt gcatgcctat 180 ttattagtgg ttctgatagg cactttcatt aaaagcaaag cgctggagcg taaacggtat 240 gccagcttat ttttccatag ctcattaatt ttcatcattc tgggcgctgc catcacgcgt 300 ttctttggga tagaaggctt aatgcatgtg cgagaaaata gcgcccagag cagctttgaa 360 agcgccgaca cgtacttaaa tatcacgtta aacgacacga cgaaattaag cctgaaaacg 420 ccgctgacgt tttattattc aaaacgactg cgtccaattc atgcaacgct ggatcataag 480 ccgctgattc tggaaccgtt agagatctat aagcagaatg caattaaaaa agatgacgcg 540 acgattctgg tgctgaaagc cacgtataat ggcgtgagcc gtaaattcaa tcttattaaa 600 aataatcgga acgaaggcat agaagaaagc gaagtgttta aagacgacaa gcttagcctg 660 tcatttggat cagcgtatat tgaattacca tttcagatca aactaaagcg gtttgaactg 720 gagcggtacg caggcagcat gtcaccgtca agctacgcgt cagaagttga agttttaaaa 780 ttagataata cgctgatcaa gccgtatcgg atttttatga atcatgttct ggactatgaa 840 ggctatcgtt ttttccagag ctcatatgac acggatgaaa aaggcacgat cttaagcgta 900 aataaagacc ccgggaaaat cccaacgtat ctgggctatg ccatgttaat tttaggcgcg 960 ttatggttat tattagataa gaatggccgg tttctgaagt tatcacgttt tctgaaatct 1020 caacaggttg cgtcattcct gcttgcgctg attcttgtaa gcccgtttgc gagctcattc 1080 gcaaacgaag gccagattga catgcatggc ggcaaaagcg cgaaaattga gcggcagagc 1140 gtagaaaacc cagcgaataa agaagatagc aaaagcgcca ttctggagcg gctaaagcat 1200 ttacgtgagt attcaaaaga ccacctgaaa gcatttcagc ggctccaggt ccaggatttt 1260 gatggccgga tcaagccgct ggacacgatt agcattgaat atattcataa gattctgaaa 1320 aaagatgatt ttcagggcct taatgcaatg caagtgttac tgggcatcat gtttttccca 1380 aacgattggc gaagcgttaa aatgatttat acgagcaata aagcactgcg taagttaatc 1440 ggcacgccgc tggacgaaag ccggatcgcg tttcgtgatg cctttgatag ccgaggctat 1500 aaactgaaaa acctagttga agaagtaaac cagaaatcac caaacgcccg taatgagtta 1560 gataaagatg tactgaaagt agatgaacgt atcaatctgg tatatacgtt atttagcgcg 1620 cagttcctgc gtattttccc gagcgataaa acgacggcgt ggctttcacc aattgaagcc 1680 atcaatagcc caaataaaga aatttcaagc gtggctacgg aatttctgaa aaatattttt 1740 agcggctttg atgacgcgct gaaagcaaac cagtgggata aagtagaaaa aacgcttaaa 1800 aacctgagcg tatatcaaca ggagcatgca aaaaatcttt atctgagcag cagcaaagtg 1860 gatagcgaaa tttttctgaa tcatacgaac ttttttaata gcctaacgtt accgtatatc 1920 ttacttggcc tgttattatt tatcgttgtg atcagcagct tagttaaaaa tacgattcct 1980 aatatttggc taacgaaaat cttatatgca gcgatcttat tatgcgccat cgcgcatagc 2040 atgggcctta ttttacgttg gtatgtgagc ggccattcac cgtggagcaa tgcgtatgag 2100 tcaatgttat atatcgcttg ggcgagcgtt atcgctggct ttattctgcg ttcaaaactt 2160 gccctttcag cgagcagctt tctggcaggg atcgcccttt ttgtggcgca tctgggcttt 2220 atggacccgc agatcggcca tctggtgccc gtattaaaat catattggct taatatccat 2280 gtaagcgtaa tcacggcgtc atatgggttt ctaggcttat gttttgtgct tggcatttta 2340 tcattagttt tatttatctt acgtaaacag ggccggttca acctggacaa aacgattctt 2400 tcaattagcg cgatcaacga aatgagcatg attctgggcc tattcatgct tactgcaggc 2460 aacttcctgg gcggcgtgtg ggccaacgaa agctggggac gctattgggg ctgggacccg 2520 aaagaaacgt gggccttaat tagcatttgc gtatatgcgc tgatcttgca tttacggttt 2580 ctggggagcc ataactggcc atttattctg gccagcagca gcgtgcttgg cttttattca 2640 gttctgatga cgtattttgg cgtgaactac tacttaagcg gcttgcatag ctatgcagct 2700 ggcgatccat tacccatccc gacgtttctg tactttttag tagccatacc gtttgcgctt 2760 gtgatcttag cctatttcaa acgtcattta tcattaccga aactggttta a 2811 <210> 56 <211> 936 <212> PRT <213> Helicobacter pylori (Campylobacter pylori) <400> 56 Met Lys Asn Leu Lys Ser Leu Leu Ser Phe Leu Leu Ala Ser Phe Trp 1 5 10 15 Val Ala Ile Pro Leu Ile Ala Leu Tyr Ala Cys Ala Cys Ala Ile Ala 20 25 30 Thr Phe Ile Glu Asn Asp Tyr Gly Thr Ser Thr Ser Lys Ala Ile Val 35 40 45 Tyr Asn Thr Pro Trp Phe Asn Phe Leu His Ala Tyr Leu Leu Val Val 50 55 60 Leu Ile Gly Thr Phe Ile Lys Ser Lys Ala Leu Glu Arg Lys Arg Tyr 65 70 75 80 Ala Ser Leu Phe Phe His Ser Ser Leu Ile Phe Ile Ile Leu Gly Ala 85 90 95 Ala Ile Thr Arg Phe Phe Gly Ile Glu Gly Leu Met His Val Arg Glu 100 105 110 Asn Ser Ala Gln Ser Ser Phe Glu Ser Ala Asp Thr Tyr Leu Asn Ile 115 120 125 Thr Leu Asn Asp Thr Thr Lys Leu Ser Leu Lys Thr Pro Leu Thr Phe 130 135 140 Tyr Tyr Ser Lys Arg Leu Arg Pro Ile His Ala Thr Leu Asp His Lys 145 150 155 160 Pro Leu Ile Leu Glu Pro Leu Glu Ile Tyr Lys Gln Asn Ala Ile Lys 165 170 175 Lys Asp Asp Ala Thr Ile Leu Val Leu Lys Ala Thr Tyr Asn Gly Val 180 185 190 Ser Arg Lys Phe Asn Leu Ile Lys Asn Asn Arg Asn Glu Gly Ile Glu 195 200 205 Glu Ser Glu Val Phe Lys Asp Asp Lys Leu Ser Leu Ser Phe Gly Ser 210 215 220 Ala Tyr Ile Glu Leu Pro Phe Gln Ile Lys Leu Lys Arg Phe Glu Leu 225 230 235 240 Glu Arg Tyr Ala Gly Ser Met Ser Pro Ser Ser Tyr Ala Ser Glu Val 245 250 255 Glu Val Leu Lys Leu Asp Asn Thr Leu Ile Lys Pro Tyr Arg Ile Phe 260 265 270 Met Asn His Val Leu Asp Tyr Glu Gly Tyr Arg Phe Phe Gln Ser Ser 275 280 285 Tyr Asp Thr Asp Glu Lys Gly Thr Ile Leu Ser Val Asn Lys Asp Pro 290 295 300 Gly Lys Ile Pro Thr Tyr Leu Gly Tyr Ala Met Leu Ile Leu Gly Ala 305 310 315 320 Leu Trp Leu Leu Leu Asp Lys Asn Gly Arg Phe Leu Lys Leu Ser Arg 325 330 335 Phe Leu Lys Ser Gln Gln Val Ala Ser Phe Leu Leu Ala Leu Ile Leu 340 345 350 Val Ser Pro Phe Ala Ser Ser Phe Ala Asn Glu Gly Gln Ile Asp Met 355 360 365 His Gly Gly Lys Ser Ala Lys Ile Glu Arg Gln Ser Val Glu Asn Pro 370 375 380 Ala Asn Lys Glu Asp Ser Lys Ser Ala Ile Leu Glu Arg Leu Lys His 385 390 395 400 Leu Arg Glu Tyr Ser Lys Asp His Leu Lys Ala Phe Gln Arg Leu Gln 405 410 415 Val Gln Asp Phe Asp Gly Arg Ile Lys Pro Leu Asp Thr Ile Ser Ile 420 425 430 Glu Tyr Ile His Lys Ile Leu Lys Lys Asp Asp Phe Gln Gly Leu Asn 435 440 445 Ala Met Gln Val Leu Leu Gly Ile Met Phe Phe Pro Asn Asp Trp Arg 450 455 460 Ser Val Lys Met Ile Tyr Thr Ser Asn Lys Ala Leu Arg Lys Leu Ile 465 470 475 480 Gly Thr Pro Leu Asp Glu Ser Arg Ile Ala Phe Arg Asp Ala Phe Asp 485 490 495 Ser Arg Gly Tyr Lys Leu Lys Asn Leu Val Glu Glu Val Asn Gln Lys 500 505 510 Ser Pro Asn Ala Arg Asn Glu Leu Asp Lys Asp Val Leu Lys Val Asp 515 520 525 Glu Arg Ile Asn Leu Val Tyr Thr Leu Phe Ser Ala Gln Phe Leu Arg 530 535 540 Ile Phe Pro Ser Asp Lys Thr Thr Ala Trp Leu Ser Pro Ile Glu Ala 545 550 555 560 Ile Asn Ser Pro Asn Lys Glu Ile Ser Ser Val Ala Thr Glu Phe Leu 565 570 575 Lys Asn Ile Phe Ser Gly Phe Asp Asp Ala Leu Lys Ala Asn Gln Trp 580 585 590 Asp Lys Val Glu Lys Thr Leu Lys Asn Leu Ser Val Tyr Gln Gln Glu 595 600 605 His Ala Lys Asn Leu Tyr Leu Ser Ser Ser Lys Val Asp Ser Glu Ile 610 615 620 Phe Leu Asn His Thr Asn Phe Phe Asn Ser Leu Thr Leu Pro Tyr Ile 625 630 635 640 Leu Leu Gly Leu Leu Leu Phe Ile Val Val Ile Ser Ser Leu Val Lys 645 650 655 Asn Thr Ile Pro Asn Ile Trp Leu Thr Lys Ile Leu Tyr Ala Ala Ile 660 665 670 Leu Leu Cys Ala Ile Ala His Ser Met Gly Leu Ile Leu Arg Trp Tyr 675 680 685 Val Ser Gly His Ser Pro Trp Ser Asn Ala Tyr Glu Ser Met Leu Tyr 690 695 700 Ile Ala Trp Ala Ser Val Ile Ala Gly Phe Ile Leu Arg Ser Lys Leu 705 710 715 720 Ala Leu Ser Ala Ser Ser Phe Leu Ala Gly Ile Ala Leu Phe Val Ala 725 730 735 His Leu Gly Phe Met Asp Pro Gln Ile Gly His Leu Val Pro Val Leu 740 745 750 Lys Ser Tyr Trp Leu Asn Ile His Val Ser Val Ile Thr Ala Ser Tyr 755 760 765 Gly Phe Leu Gly Leu Cys Phe Val Leu Gly Ile Leu Ser Leu Val Leu 770 775 780 Phe Ile Leu Arg Lys Gln Gly Arg Phe Asn Leu Asp Lys Thr Ile Leu 785 790 795 800 Ser Ile Ser Ala Ile Asn Glu Met Ser Met Ile Leu Gly Leu Phe Met 805 810 815 Leu Thr Ala Gly Asn Phe Leu Gly Gly Val Trp Ala Asn Glu Ser Trp 820 825 830 Gly Arg Tyr Trp Gly Trp Asp Pro Lys Glu Thr Trp Ala Leu Ile Ser 835 840 845 Ile Cys Val Tyr Ala Leu Ile Leu His Leu Arg Phe Leu Gly Ser His 850 855 860 Asn Trp Pro Phe Ile Leu Ala Ser Ser Ser Val Leu Gly Phe Tyr Ser 865 870 875 880 Val Leu Met Thr Tyr Phe Gly Val Asn Tyr Tyr Leu Ser Gly Leu His 885 890 895 Ser Tyr Ala Ala Gly Asp Pro Leu Pro Ile Pro Thr Phe Leu Tyr Phe 900 905 910 Leu Val Ala Ile Pro Phe Ala Leu Val Ile Leu Ala Tyr Phe Lys Arg 915 920 925 His Leu Ser Leu Pro Lys Leu Val 930 935 <210> 57 <211> 1290 <212> DNA <213> Chitinophaga sp. CF118 <400> 57 atgagcttta acgtaaaaaa ccggatcgcg gaattatttt cgaaacggat cttccgtgat 60 agtttttatt atactatcgg tgcattctta gtcaaaggga tcaacttctt cttagtccca 120 gtgtatacgt cgtacctgtc gccatcggaa tatggtatct tagatttata cctgacgttt 180 acgaatatct taacgatctt ttgctcgtta ggtttatctc aattaatctt cgtcgaattt 240 tataagatca aaggtgagga acggaagcgg ttcttctcgg tcatcttttt tgggtatgcc 300 ttatttgggt taatcatctg cgctatcggt ggagtgatct tccattttgc gagcgaatat 360 ttcactaaag ttgccctggc gagcatgcta agcgtcatct tatcgtcggc aatcgcgtat 420 atcacgttct atcaaacgaa cttctttaac tatttacggc tagccggtcg gtcgaagtta 480 tttgtttact tcagtatcat cactggtgtc gttaacgccg gtctgaatat cttatttgtc 540 gtcaaaggta atatgggtta taacggtatc cttttaggta atatcatcgt tttattcgcg 600 tcggttgtgt ttggtttctt cgtgatcaaa gataagatcg actttaagtt taatatcgac 660 ttaaaggttt tttcgggtta tacgaaaatc ggtttagcct ttatcttatc gtcgttatgc 720 cagtggttaa tcaacggtgc ggatagatgg atcgtgctga acgctttaaa tacgactgag 780 ttaggtatct atgctttagc gtttaagttt tcgtcatttg tcgatccatt aatcatcacg 840 ccaatcacgt atgcctatct tccatatatc tttaaaaagt atgctgaaaa cgattatagc 900 gaaaagttaa tgaaaatcgc cggtttagtg tttctgatct ttctgccaat cgctttatta 960 gtaccatatt tactaccaat ggtaatcagt aataaggatt attatatggc agtccaactg 1020 atcccattcc tgatcatcgc ttattatttt tatttcatca gtcaattagc cgggaacgtc 1080 ttagtatatt taaagaagat ccggtgcctg gtgcagaata tcatcatcag cgggatcagc 1140 aatatcatct taaattatat cttagttaga aagatgggaa tcatcgggtg cgcgtatgcc 1200 tatttaatct cgaatatcat ctgggcaatc ttaaatatct attaccgtaa tatgtattta 1260 agtagcctta agaacgaaaa atcgaactaa 1290 <210> 58 <211> 429 <212> PRT <213> Chitinophaga sp. CF118 <400> 58 Met Ser Phe Asn Val Lys Asn Arg Ile Ala Glu Leu Phe Ser Lys Arg 1 5 10 15 Ile Phe Arg Asp Ser Phe Tyr Tyr Thr Ile Gly Ala Phe Leu Val Lys 20 25 30 Gly Ile Asn Phe Phe Leu Val Pro Val Tyr Thr Ser Tyr Leu Ser Pro 35 40 45 Ser Glu Tyr Gly Ile Leu Asp Leu Tyr Leu Thr Phe Thr Asn Ile Leu 50 55 60 Thr Ile Phe Cys Ser Leu Gly Leu Ser Gln Leu Ile Phe Val Glu Phe 65 70 75 80 Tyr Lys Ile Lys Gly Glu Glu Arg Lys Arg Phe Phe Ser Val Ile Phe 85 90 95 Phe Gly Tyr Ala Leu Phe Gly Leu Ile Ile Cys Ala Ile Gly Gly Val 100 105 110 Ile Phe His Phe Ala Ser Glu Tyr Phe Thr Lys Val Ala Leu Ala Ser 115 120 125 Met Leu Ser Val Ile Leu Ser Ser Ala Ile Ala Tyr Ile Thr Phe Tyr 130 135 140 Gln Thr Asn Phe Phe Asn Tyr Leu Arg Leu Ala Gly Arg Ser Lys Leu 145 150 155 160 Phe Val Tyr Phe Ser Ile Ile Thr Gly Val Val Asn Ala Gly Leu Asn 165 170 175 Ile Leu Phe Val Val Lys Gly Asn Met Gly Tyr Asn Gly Ile Leu Leu 180 185 190 Gly Asn Ile Ile Val Leu Phe Ala Ser Val Val Phe Gly Phe Phe Val 195 200 205 Ile Lys Asp Lys Ile Asp Phe Lys Phe Asn Ile Asp Leu Lys Val Phe 210 215 220 Ser Gly Tyr Thr Lys Ile Gly Leu Ala Phe Ile Leu Ser Ser Leu Cys 225 230 235 240 Gln Trp Leu Ile Asn Gly Ala Asp Arg Trp Ile Val Leu Asn Ala Leu 245 250 255 Asn Thr Thr Glu Leu Gly Ile Tyr Ala Leu Ala Phe Lys Phe Ser Ser 260 265 270 Phe Val Asp Pro Leu Ile Ile Thr Pro Ile Thr Tyr Ala Tyr Leu Pro 275 280 285 Tyr Ile Phe Lys Lys Tyr Ala Glu Asn Asp Tyr Ser Glu Lys Leu Met 290 295 300 Lys Ile Ala Gly Leu Val Phe Leu Ile Phe Leu Pro Ile Ala Leu Leu 305 310 315 320 Val Pro Tyr Leu Leu Pro Met Val Ile Ser Asn Lys Asp Tyr Tyr Met 325 330 335 Ala Val Gln Leu Ile Pro Phe Leu Ile Ile Ala Tyr Tyr Phe Tyr Phe 340 345 350 Ile Ser Gln Leu Ala Gly Asn Val Leu Val Tyr Leu Lys Lys Ile Arg 355 360 365 Cys Leu Val Gln Asn Ile Ile Ile Ser Gly Ile Ser Asn Ile Ile Leu 370 375 380 Asn Tyr Ile Leu Val Arg Lys Met Gly Ile Ile Gly Cys Ala Tyr Ala 385 390 395 400 Tyr Leu Ile Ser Asn Ile Ile Trp Ala Ile Leu Asn Ile Tyr Tyr Arg 405 410 415 Asn Met Tyr Leu Ser Ser Leu Lys Asn Glu Lys Ser Asn 420 425 <210> 59 <211> 1413 <212> DNA <213> Eubacterium sp. CAG:581 <400> 59 atgaaccgaa ataaaaagtt aggcattaac gtggtgttaa tgagcataag cagctttggc 60 agcaaattat taaccttctt cttagtgccg ttatatacta gctatctcac caccgcggaa 120 tatggcgtga gcgatctcat aaccaccacc accagcctct tagcgccgat ttttaccgcg 180 accataggcg aagcggtatt acgctatgcg ctggaaaaag atatagataa gtatcaagtg 240 tttcgcattg gattatttat acatatggtt gggtttattg ctttaatgtg ctttagcccg 300 ttactcctga tgataaagtt actcaaaccg tattatgtgt tctttatatt atattatttt 360 agctttacct tttatagctt ctttagccta ttttgccgcg ggataaataa agtggttgcg 420 ttcaccatta gcgggattat acagacccta gtgatggttg ggaccaatat agtaagcctc 480 attttcttag atatgggaat atatgggtac ctcctgagct ttattgtgag caactttgcg 540 ggcatgattc tcttagtgac tttaggcaaa atgcatgtat attttaaaat aggcaaaatt 600 gataagaaat taatgaagaa aatgttattt tatagcctgc cgatgataac caactcaatt 660 agctggtgga ttagcaatag cagcgataag tatattttaa ccttcttatg cggcgcgacc 720 ataaacggca tttatagcgt ggcgtataaa attccgacca tattaagcgt atgctatggc 780 gtgtttatga gcgcgtggcg cctcagcgct gtggatgatt ttgggagcga agaaaccgat 840 cgcttttata gccaaatatt aactaagatg accaaggcgc tgataattgt gggcgcgggc 900 attgtgttat ttaataaaat tttagcgaaa tttttatatg cgaaggattt ctttagcgcg 960 cgcgaatttg tgcccgtgtt agtgattgcg tttttattgc atgggttagg cgaattctat 1020 ggcagcgtgt ataccagcgc gaaatgcacc aagatgctct tttatagcag cctcgcgggc 1080 gcggtgtgca atatagtact caactttgcg ttaataccgg aatttcaggc gatgggcgcg 1140 gctattgcga ccatgattag ctatggcgtg atactcgcga tacgcgcgat tcatagccgc 1200 accattatga agatgaccat tccggtgacc aatattacca ttagcagcgt gatttttata 1260 accatggcga ttattcagac catagatttc caaggcagct ttattattag cgcgatttta 1320 ttctgtataa ttgcgttttt caaccgcgat atggtagttg agattataaa taccgtgtta 1380 aaaaagaaac cgaagaaaac cgcgaaacag taa 1413 <210> 60 <211> 470 <212> PRT <213> Eubacterium sp. CAG:581 <400> 60 Met Asn Arg Asn Lys Lys Leu Gly Ile Asn Val Val Leu Met Ser Ile 1 5 10 15 Ser Ser Phe Gly Ser Lys Leu Leu Thr Phe Phe Leu Val Pro Leu Tyr 20 25 30 Thr Ser Tyr Leu Thr Thr Ala Glu Tyr Gly Val Ser Asp Leu Ile Thr 35 40 45 Thr Thr Thr Ser Leu Leu Ala Pro Ile Phe Thr Ala Thr Ile Gly Glu 50 55 60 Ala Val Leu Arg Tyr Ala Leu Glu Lys Asp Ile Asp Lys Tyr Gln Val 65 70 75 80 Phe Arg Ile Gly Leu Phe Ile His Met Val Gly Phe Ile Ala Leu Met 85 90 95 Cys Phe Ser Pro Leu Leu Leu Met Ile Lys Leu Leu Lys Pro Tyr Tyr 100 105 110 Val Phe Phe Ile Leu Tyr Tyr Phe Ser Phe Thr Phe Tyr Ser Phe Phe 115 120 125 Ser Leu Phe Cys Arg Gly Ile Asn Lys Val Val Ala Phe Thr Ile Ser 130 135 140 Gly Ile Ile Gln Thr Leu Val Met Val Gly Thr Asn Ile Val Ser Leu 145 150 155 160 Ile Phe Leu Asp Met Gly Ile Tyr Gly Tyr Leu Leu Ser Phe Ile Val 165 170 175 Ser Asn Phe Ala Gly Met Ile Leu Leu Val Thr Leu Gly Lys Met His 180 185 190 Val Tyr Phe Lys Ile Gly Lys Ile Asp Lys Lys Leu Met Lys Lys Met 195 200 205 Leu Phe Tyr Ser Leu Pro Met Ile Thr Asn Ser Ile Ser Trp Trp Ile 210 215 220 Ser Asn Ser Ser Asp Lys Tyr Ile Leu Thr Phe Leu Cys Gly Ala Thr 225 230 235 240 Ile Asn Gly Ile Tyr Ser Val Ala Tyr Lys Ile Pro Thr Ile Leu Ser 245 250 255 Val Cys Tyr Gly Val Phe Met Ser Ala Trp Arg Leu Ser Ala Val Asp 260 265 270 Asp Phe Gly Ser Glu Glu Thr Asp Arg Phe Tyr Ser Gln Ile Leu Thr 275 280 285 Lys Met Thr Lys Ala Leu Ile Ile Val Gly Ala Gly Ile Val Leu Phe 290 295 300 Asn Lys Ile Leu Ala Lys Phe Leu Tyr Ala Lys Asp Phe Phe Ser Ala 305 310 315 320 Arg Glu Phe Val Pro Val Leu Val Ile Ala Phe Leu Leu His Gly Leu 325 330 335 Gly Glu Phe Tyr Gly Ser Val Tyr Thr Ser Ala Lys Cys Thr Lys Met 340 345 350 Leu Phe Tyr Ser Ser Leu Ala Gly Ala Val Cys Asn Ile Val Leu Asn 355 360 365 Phe Ala Leu Ile Pro Glu Phe Gln Ala Met Gly Ala Ala Ile Ala Thr 370 375 380 Met Ile Ser Tyr Gly Val Ile Leu Ala Ile Arg Ala Ile His Ser Arg 385 390 395 400 Thr Ile Met Lys Met Thr Ile Pro Val Thr Asn Ile Thr Ile Ser Ser 405 410 415 Val Ile Phe Ile Thr Met Ala Ile Ile Gln Thr Ile Asp Phe Gln Gly 420 425 430 Ser Phe Ile Ile Ser Ala Ile Leu Phe Cys Ile Ile Ala Phe Phe Asn 435 440 445 Arg Asp Met Val Val Glu Ile Ile Asn Thr Val Leu Lys Lys Lys Pro 450 455 460 Lys Lys Thr Ala Lys Gln 465 470 <210> 61 <211> 1350 <212> DNA <213> Dyadobacter soli DSM 25329 contig Ga0069981_102 <400> 61 atggctttgc agttacttca gaaattacgg aataaacatt tcttaagcct ggccgggaac 60 ggcatcatga gcgtgttagg gatgctcaat atgattattc tgtatcgtgc attaccagta 120 gcgagcatcg gaatgtgggt cttttttctg agcatattat tactggtaga cacctttcgg 180 agcggctttt taacgacggc gtttattaaa ttctatgcag gcgccagcga tgcgcggaag 240 cgtgaagtcg tcgggagcgc gtggttcatt ggcggggcga tcacgggcat cttagccctg 300 attaatatcc cggcctttct gttcagcgac tggtttaaga acccatccgt ggtgctgttt 360 gtagaatggt ttggcatcat ttatatcgcg agcctgccgt actttattgc tagctgcgtg 420 gtgcaggccg agcagcggtt tgatcagtta ctatgcattc gttttttaag ccagggattc 480 tttatcttat tcgtcatggt aatggctttt accaaaaccg cgaatttgca gaatattatt 540 tatgcatatt taggcggcgc cgcattaacg agcatcttta cgatcgtaat gggctggtca 600 cggttaggca actttaagga ccgtacttca gaaagcatca aggaaatttt tcacttcggg 660 aaattctcag tcgggaccac tttatcatcg aatttattcg ggacttcgaa tacgatgatt 720 attaacttta tgttaggccc ggccgcatta gcggtgttta acttagggca gcggctgatg 780 gaaattattg aaataccatt acgaagcttt gcggcgaccg gcatgccaga attatccgcg 840 gcgtataatg aaggcaaccg tccaaaagtg attgaaacca tgaagcggta tgccggctta 900 attaccatgg cattactacc ggcgtgcatc ggcgccgtga ttttagccga cgtcgcgata 960 catattatag ggggagaaaa atatatcaat tcggaagcgg ccaatattat gcgtttatat 1020 atgacctttg ccctgctgta tccgttagat cgtttctttg cattaacttt agatgtcatt 1080 caccagccaa aaattaattt tgtcaaagta ctgattatgt tagcagggag cgtcattgct 1140 tcagtgacgg cgatctatat taccggctca atctatggcg tagcgatcgc cggcgtggtc 1200 ccgacgttaa ttggcgtggg cattgggtac tggggactca accggttcca gccattttca 1260 attctgagcg tctttacgac gggctacgcc gaggccgtgt cactggtgcg gctatggtgg 1320 ggcaagctga tggtccataa gtctcaataa 1350 <210> 62 <211> 449 <212> PRT <213> Dyadobacter soli DSM 25329 contig Ga0069981_102 <400> 62 Met Ala Leu Gln Leu Leu Gln Lys Leu Arg Asn Lys His Phe Leu Ser 1 5 10 15 Leu Ala Gly Asn Gly Ile Met Ser Val Leu Gly Met Leu Asn Met Ile 20 25 30 Ile Leu Tyr Arg Ala Leu Pro Val Ala Ser Ile Gly Met Trp Val Phe 35 40 45 Phe Leu Ser Ile Leu Leu Leu Val Asp Thr Phe Arg Ser Gly Phe Leu 50 55 60 Thr Thr Ala Phe Ile Lys Phe Tyr Ala Gly Ala Ser Asp Ala Arg Lys 65 70 75 80 Arg Glu Val Val Gly Ser Ala Trp Phe Ile Gly Gly Ala Ile Thr Gly 85 90 95 Ile Leu Ala Leu Ile Asn Ile Pro Ala Phe Leu Phe Ser Asp Trp Phe 100 105 110 Lys Asn Pro Ser Val Val Leu Phe Val Glu Trp Phe Gly Ile Ile Tyr 115 120 125 Ile Ala Ser Leu Pro Tyr Phe Ile Ala Ser Cys Val Val Gln Ala Glu 130 135 140 Gln Arg Phe Asp Gln Leu Leu Cys Ile Arg Phe Leu Ser Gln Gly Phe 145 150 155 160 Phe Ile Leu Phe Val Met Val Met Ala Phe Thr Lys Thr Ala Asn Leu 165 170 175 Gln Asn Ile Ile Tyr Ala Tyr Leu Gly Gly Ala Ala Leu Thr Ser Ile 180 185 190 Phe Thr Ile Val Met Gly Trp Ser Arg Leu Gly Asn Phe Lys Asp Arg 195 200 205 Thr Ser Glu Ser Ile Lys Glu Ile Phe His Phe Gly Lys Phe Ser Val 210 215 220 Gly Thr Thr Leu Ser Ser Asn Leu Phe Gly Thr Ser Asn Thr Met Ile 225 230 235 240 Ile Asn Phe Met Leu Gly Pro Ala Ala Leu Ala Val Phe Asn Leu Gly 245 250 255 Gln Arg Leu Met Glu Ile Ile Glu Ile Pro Leu Arg Ser Phe Ala Ala 260 265 270 Thr Gly Met Pro Glu Leu Ser Ala Ala Tyr Asn Glu Gly Asn Arg Pro 275 280 285 Lys Val Ile Glu Thr Met Lys Arg Tyr Ala Gly Leu Ile Thr Met Ala 290 295 300 Leu Leu Pro Ala Cys Ile Gly Ala Val Ile Leu Ala Asp Val Ala Ile 305 310 315 320 His Ile Ile Gly Gly Glu Lys Tyr Ile Asn Ser Glu Ala Ala Asn Ile 325 330 335 Met Arg Leu Tyr Met Thr Phe Ala Leu Leu Tyr Pro Leu Asp Arg Phe 340 345 350 Phe Ala Leu Thr Leu Asp Val Ile His Gln Pro Lys Ile Asn Phe Val 355 360 365 Lys Val Leu Ile Met Leu Ala Gly Ser Val Ile Ala Ser Val Thr Ala 370 375 380 Ile Tyr Ile Thr Gly Ser Ile Tyr Gly Val Ala Ile Ala Gly Val Val 385 390 395 400 Pro Thr Leu Ile Gly Val Gly Ile Gly Tyr Trp Gly Leu Asn Arg Phe 405 410 415 Gln Pro Phe Ser Ile Leu Ser Val Phe Thr Thr Gly Tyr Ala Glu Ala 420 425 430 Val Ser Leu Val Arg Leu Trp Trp Gly Lys Leu Met Val His Lys Ser 435 440 445 Gln <210> 63 <211> 1233 <212> DNA <213> Lactococcus raffinolactis (ATCC 43920) <400> 63 atgtttttag ccgtatggga aggcatttta cggttcggct taaacgaaaa taaccgggaa 60 aaattaacga gcttaattag caccaccgta ttttttgggt taggggcaac gatattttgg 120 gctattattt taccttttcc atatttacgg atctttaata cgttaccgta tgttcactta 180 ttcattatta gcttattatt gcagcctatt ttatcaacgt tgcagattgc ggtccgaggg 240 attaaggagt cgaagaacta tgtgatatca ggcattatca gcacttttgt taacgtgggc 300 ttattaattt tcttagtggt gttcttacgg ttagggttat taggcttact cttatcattt 360 ttaattggca accttgtgaa cgtgttatat ttattatttg gctcatcact cttaaaatat 420 atttcattta aagccatcga taaaaacctc ttaaagaagt tattaaaatt cagctggcca 480 ttaattttta acttagtatt tgtgtggttt ctcggtggct atgttatgtt ttatttaggc 540 tcgtttgtag gcagcgatga aaccggcttt ttcagctttg cgaataaatt tgcctcaatt 600 gtggcgatgt ttgggagcgt gttaggcatg gccactatag aagatactat tattacttcg 660 gaaaacgata actttattga aagctttgct aagaagaata cggaaatgtt taagatgttt 720 ttaaacgtgg gcatattact cttaccagta attggcatgt actatttcac cttaggcaat 780 agcgcgtatc agaatactct tataattgtc ccgttcttat taatggcgtc aatttttcaa 840 gccatggcta ccaacgtggg caatattatg attgtgcatc agaaaactaa ggctattgcc 900 gtggcgtcgt tattagtggg catatttaac gccatcttct gctttgtagg gtaccacttt 960 ctcggcttaa ccggcgtgtg cattgcctat ctctttgctt catttttatt atttttattc 1020 cggtataaga tggggcaaaa aattcagaac tataacttaa aatggcgctt tattgtagtg 1080 ctcgcggtca tattcattat gttaggctta ttaatacagt ttgaaaacgt gattatcaat 1140 agcattttag tcttagtcac tgcggtgttt gagatattta tttatcggca tattatatta 1200 aaaatactca accgcattat tgggcgagcg taa 1233 <210> 64 <211> 410 <212> PRT <213> Lactococcus raffinolactis (ATCC 43920) <400> 64 Met Phe Leu Ala Val Trp Glu Gly Ile Leu Arg Phe Gly Leu Asn Glu 1 5 10 15 Asn Asn Arg Glu Lys Leu Thr Ser Leu Ile Ser Thr Thr Val Phe Phe 20 25 30 Gly Leu Gly Ala Thr Ile Phe Trp Ala Ile Ile Leu Pro Phe Pro Tyr 35 40 45 Leu Arg Ile Phe Asn Thr Leu Pro Tyr Val His Leu Phe Ile Ile Ser 50 55 60 Leu Leu Leu Gln Pro Ile Leu Ser Thr Leu Gln Ile Ala Val Arg Gly 65 70 75 80 Ile Lys Glu Ser Lys Asn Tyr Val Ile Ser Gly Ile Ile Ser Thr Phe 85 90 95 Val Asn Val Gly Leu Leu Ile Phe Leu Val Val Phe Leu Arg Leu Gly 100 105 110 Leu Leu Gly Leu Leu Leu Ser Phe Leu Ile Gly Asn Leu Val Asn Val 115 120 125 Leu Tyr Leu Leu Phe Gly Ser Ser Leu Leu Lys Tyr Ile Ser Phe Lys 130 135 140 Ala Ile Asp Lys Asn Leu Leu Lys Lys Leu Leu Lys Phe Ser Trp Pro 145 150 155 160 Leu Ile Phe Asn Leu Val Phe Val Trp Phe Leu Gly Gly Tyr Val Met 165 170 175 Phe Tyr Leu Gly Ser Phe Val Gly Ser Asp Glu Thr Gly Phe Phe Ser 180 185 190 Phe Ala Asn Lys Phe Ala Ser Ile Val Ala Met Phe Gly Ser Val Leu 195 200 205 Gly Met Ala Thr Ile Glu Asp Thr Ile Ile Thr Ser Glu Asn Asp Asn 210 215 220 Phe Ile Glu Ser Phe Ala Lys Lys Asn Thr Glu Met Phe Lys Met Phe 225 230 235 240 Leu Asn Val Gly Ile Leu Leu Leu Pro Val Ile Gly Met Tyr Tyr Phe 245 250 255 Thr Leu Gly Asn Ser Ala Tyr Gln Asn Thr Leu Ile Ile Val Pro Phe 260 265 270 Leu Leu Met Ala Ser Ile Phe Gln Ala Met Ala Thr Asn Val Gly Asn 275 280 285 Ile Met Ile Val His Gln Lys Thr Lys Ala Ile Ala Val Ala Ser Leu 290 295 300 Leu Val Gly Ile Phe Asn Ala Ile Phe Cys Phe Val Gly Tyr His Phe 305 310 315 320 Leu Gly Leu Thr Gly Val Cys Ile Ala Tyr Leu Phe Ala Ser Phe Leu 325 330 335 Leu Phe Leu Phe Arg Tyr Lys Met Gly Gln Lys Ile Gln Asn Tyr Asn 340 345 350 Leu Lys Trp Arg Phe Ile Val Val Leu Ala Val Ile Phe Ile Met Leu 355 360 365 Gly Leu Leu Ile Gln Phe Glu Asn Val Ile Ile Asn Ser Ile Leu Val 370 375 380 Leu Val Thr Ala Val Phe Glu Ile Phe Ile Tyr Arg His Ile Ile Leu 385 390 395 400 Lys Ile Leu Asn Arg Ile Ile Gly Arg Ala 405 410 <210> 65 <211> 1305 <212> DNA <213> Prevotella ruminicola (AR32) <400> 65 atgactgaaa gccggatgaa gcggtcgctg actggtacgt tttggtcgat gacggagcga 60 ttcgctaaaa tgggaataca gatagtttgc acgtttatca tcgcccagtt tgttgcaccc 120 tcggaatttg ggctggtgag catgatgagc atctttttag cgttttcgac gatcttaata 180 gatagcggct tttcgcaggc actgatccat gagcagaacg taactcctca agatgaaagc 240 tcgatatttt ggttcaatat cggtctaggg tgcgctgtct atggcatatt ttggctgatc 300 gctccattaa tcgcgaactt ttataacgaa cctcagctaa ctctactaat ccgagtggcc 360 tttttagcac tgatatttca atcgttaatc gttgttcagc aaggactatt atttaaaagc 420 gttgacttta aagcggtgtc gaagatctcg ttttgggctg ttttattatc gggtatcgcc 480 ggtatcgtgg tgagctatat ccggaaagat gtgtggggcc taatcgttca aaacctgctg 540 ttcgccttac ttcaaactgt tttatactgg gtttattcgc gttggcgtcc aagcttaatc 600 tttaaaatgc aatgtgtgcg aaagtactta cgattttcga tgaatctgct gggtagcaat 660 atgctggcag cgataacgga taatctggcg aacctgttcg tcgggaaggc gtataatgcg 720 acgatattag ggcattatac tatggcgaat aaaataccat atttaacgtc ggggacggtt 780 tgttatggta tcaagcgtgt gagctattcg atcatgtcga cgttccagaa cgataacgag 840 caactagcgc ggtattcgca acgtgtggtt gggacggcgt tctggatctt atcgccagtt 900 atgatcttaa tgctggttct ggcagagccc ttcatctcgt ggctatttcc agaggagtgg 960 gctccagccg caatatatct gcgttatttt tgtgtgatag ggctggtgta ctgctttgcc 1020 gatgttaatc aggatatcct gctagtgaaa ggacgcacgg atatcctatt tcgtttagat 1080 atcgtgcgac ggacggtgtt agttgcactg ctgatcatcg gtatacaata ctcgatggaa 1140 acgtttttac tgctgttagt gatatataat atactaaacg cgatcatcgt gagctatata 1200 gcaggccgac tgatagattg ttcgttatgg cgacagatac gactggttgg gtcgacgcca 1260 ctatatttcc taactaatat caaccaacgg cgagagaaac ggtga 1305 <210> 66 <211> 434 <212> PRT <213> Prevotella ruminicola (AR32) <400> 66 Met Thr Glu Ser Arg Met Lys Arg Ser Leu Thr Gly Thr Phe Trp Ser 1 5 10 15 Met Thr Glu Arg Phe Ala Lys Met Gly Ile Gln Ile Val Cys Thr Phe 20 25 30 Ile Ile Ala Gln Phe Val Ala Pro Ser Glu Phe Gly Leu Val Ser Met 35 40 45 Met Ser Ile Phe Leu Ala Phe Ser Thr Ile Leu Ile Asp Ser Gly Phe 50 55 60 Ser Gln Ala Leu Ile His Glu Gln Asn Val Thr Pro Gln Asp Glu Ser 65 70 75 80 Ser Ile Phe Trp Phe Asn Ile Gly Leu Gly Cys Ala Val Tyr Gly Ile 85 90 95 Phe Trp Leu Ile Ala Pro Leu Ile Ala Asn Phe Tyr Asn Glu Pro Gln 100 105 110 Leu Thr Leu Leu Ile Arg Val Ala Phe Leu Ala Leu Ile Phe Gln Ser 115 120 125 Leu Ile Val Val Gln Gln Gly Leu Leu Phe Lys Ser Val Asp Phe Lys 130 135 140 Ala Val Ser Lys Ile Ser Phe Trp Ala Val Leu Leu Ser Gly Ile Ala 145 150 155 160 Gly Ile Val Val Ser Tyr Ile Arg Lys Asp Val Trp Gly Leu Ile Val 165 170 175 Gln Asn Leu Leu Phe Ala Leu Leu Gln Thr Val Leu Tyr Trp Val Tyr 180 185 190 Ser Arg Trp Arg Pro Ser Leu Ile Phe Lys Met Gln Cys Val Arg Lys 195 200 205 Tyr Leu Arg Phe Ser Met Asn Leu Leu Gly Ser Asn Met Leu Ala Ala 210 215 220 Ile Thr Asp Asn Leu Ala Asn Leu Phe Val Gly Lys Ala Tyr Asn Ala 225 230 235 240 Thr Ile Leu Gly His Tyr Thr Met Ala Asn Lys Ile Pro Tyr Leu Thr 245 250 255 Ser Gly Thr Val Cys Tyr Gly Ile Lys Arg Val Ser Tyr Ser Ile Met 260 265 270 Ser Thr Phe Gln Asn Asp Asn Glu Gln Leu Ala Arg Tyr Ser Gln Arg 275 280 285 Val Val Gly Thr Ala Phe Trp Ile Leu Ser Pro Val Met Ile Leu Met 290 295 300 Leu Val Leu Ala Glu Pro Phe Ile Ser Trp Leu Phe Pro Glu Glu Trp 305 310 315 320 Ala Pro Ala Ala Ile Tyr Leu Arg Tyr Phe Cys Val Ile Gly Leu Val 325 330 335 Tyr Cys Phe Ala Asp Val Asn Gln Asp Ile Leu Leu Val Lys Gly Arg 340 345 350 Thr Asp Ile Leu Phe Arg Leu Asp Ile Val Arg Arg Thr Val Leu Val 355 360 365 Ala Leu Leu Ile Ile Gly Ile Gln Tyr Ser Met Glu Thr Phe Leu Leu 370 375 380 Leu Leu Val Ile Tyr Asn Ile Leu Asn Ala Ile Ile Val Ser Tyr Ile 385 390 395 400 Ala Gly Arg Leu Ile Asp Cys Ser Leu Trp Arg Gln Ile Arg Leu Val 405 410 415 Gly Ser Thr Pro Leu Tyr Phe Leu Thr Asn Ile Asn Gln Arg Arg Glu 420 425 430 Lys Arg <210> 67 <211> 1284 <212> DNA <213> Flavobacterium spartansii <400> 67 atggaaaaag atataatact gaaggcagaa aatattagca aacagtatcg tctgggccag 60 gttggtactg gcactctgtc gcatgacatt aaccgttggt ggcataagat tcgcggtaaa 120 gagaatccgt atctgaaaat tggagacacg aacgatcgtt caacgaaagg caatagcgat 180 tatgtatggg ccttgcagga cattaacttt gaagtggaac ggggcgaagt gctaggcatt 240 attggtaaaa atggcgctgg caaaagcacg ttactgaaga tattaagcaa agtgacggcg 300 ccaacgactg gctcgataaa atcacgtggc cgtattgcga gcttattaga agtaggcacg 360 ggtttcaacg gcgaaatgac tggccgcgaa aatatttttc ttaacggtgc aattttaggc 420 atgactaaaa aagaaattag cagcaagtta gatgaaatta tagaatttag cggttgcgaa 480 cgttatatag atacgcccgt gaaacgctac tcaagcggca tgacggtacg tctggcgttt 540 gctgtggctg cgtttttaga acccgaaatt ttagttgtgg atgaagtgtt agctgtgggc 600 gatgcagaat ttcagaagaa ggcgattggt aaaatgcaag atattagcaa aggtgaaggc 660 cgtactgtgc tgtttgtgtc tcataatatg gccgcggtga agtcgctgtg cacgcgcggc 720 atagtgctag aaaacggaaa aattaaattt aacggcgata ttgatgaggc gttagatgtg 780 tatagcaata acggtaatag cacggatcat acggttgtgt ttgatagcga tacgaaacgg 840 acgggatcac gcaatataga gtttataagc gttgagatac gcgatcagaa tcagaagcca 900 tcgcatgaat tcagcattgg cgatgatctg attattaaat tccgccttca gaataatacg 960 aatgaagcga aaagcgaagt aggcatacaa atacgcagca gcgacgaaat gccgattttt 1020 catattatgg gtcgcgatag caactttgaa ctgactcatg tggaaaaaca ggaagagtat 1080 gtggtgtcga taaaagacat acgcttattt cccggaatgt atactatttc atttacgtcg 1140 aatacgacga ctggccacca aatatttgac tgcattgaaa acgcgttaag ctttcagatt 1200 atagatggcg gcaaatatac tattcgctcg ttaccacgcg cggcaggctt attctttctg 1260 aacccagaat ggaaaaaatt ataa 1284 <210> 68 <211> 427 <212> PRT <213> Flavobacterium spartansii <400> 68 Met Glu Lys Asp Ile Ile Leu Lys Ala Glu Asn Ile Ser Lys Gln Tyr 1 5 10 15 Arg Leu Gly Gln Val Gly Thr Gly Thr Leu Ser His Asp Ile Asn Arg 20 25 30 Trp Trp His Lys Ile Arg Gly Lys Glu Asn Pro Tyr Leu Lys Ile Gly 35 40 45 Asp Thr Asn Asp Arg Ser Thr Lys Gly Asn Ser Asp Tyr Val Trp Ala 50 55 60 Leu Gln Asp Ile Asn Phe Glu Val Glu Arg Gly Glu Val Leu Gly Ile 65 70 75 80 Ile Gly Lys Asn Gly Ala Gly Lys Ser Thr Leu Leu Lys Ile Leu Ser 85 90 95 Lys Val Thr Ala Pro Thr Thr Gly Ser Ile Lys Ser Arg Gly Arg Ile 100 105 110 Ala Ser Leu Leu Glu Val Gly Thr Gly Phe Asn Gly Glu Met Thr Gly 115 120 125 Arg Glu Asn Ile Phe Leu Asn Gly Ala Ile Leu Gly Met Thr Lys Lys 130 135 140 Glu Ile Ser Ser Lys Leu Asp Glu Ile Ile Glu Phe Ser Gly Cys Glu 145 150 155 160 Arg Tyr Ile Asp Thr Pro Val Lys Arg Tyr Ser Ser Gly Met Thr Val 165 170 175 Arg Leu Ala Phe Ala Val Ala Ala Phe Leu Glu Pro Glu Ile Leu Val 180 185 190 Val Asp Glu Val Leu Ala Val Gly Asp Ala Glu Phe Gln Lys Lys Ala 195 200 205 Ile Gly Lys Met Gln Asp Ile Ser Lys Gly Glu Gly Arg Thr Val Leu 210 215 220 Phe Val Ser His Asn Met Ala Ala Val Lys Ser Leu Cys Thr Arg Gly 225 230 235 240 Ile Val Leu Glu Asn Gly Lys Ile Lys Phe Asn Gly Asp Ile Asp Glu 245 250 255 Ala Leu Asp Val Tyr Ser Asn Asn Gly Asn Ser Thr Asp His Thr Val 260 265 270 Val Phe Asp Ser Asp Thr Lys Arg Thr Gly Ser Arg Asn Ile Glu Phe 275 280 285 Ile Ser Val Glu Ile Arg Asp Gln Asn Gln Lys Pro Ser His Glu Phe 290 295 300 Ser Ile Gly Asp Asp Leu Ile Ile Lys Phe Arg Leu Gln Asn Asn Thr 305 310 315 320 Asn Glu Ala Lys Ser Glu Val Gly Ile Gln Ile Arg Ser Ser Asp Glu 325 330 335 Met Pro Ile Phe His Ile Met Gly Arg Asp Ser Asn Phe Glu Leu Thr 340 345 350 His Val Glu Lys Gln Glu Glu Tyr Val Val Ser Ile Lys Asp Ile Arg 355 360 365 Leu Phe Pro Gly Met Tyr Thr Ile Ser Phe Thr Ser Asn Thr Thr Thr 370 375 380 Gly His Gln Ile Phe Asp Cys Ile Glu Asn Ala Leu Ser Phe Gln Ile 385 390 395 400 Ile Asp Gly Gly Lys Tyr Thr Ile Arg Ser Leu Pro Arg Ala Ala Gly 405 410 415 Leu Phe Phe Leu Asn Pro Glu Trp Lys Lys Leu 420 425 <210> 69 <211> 1305 <212> DNA <213> Sporomusa sphaeroides DSM 2875 <400> 69 atgtcagata ctgttataaa ggttgagaac ttatcaaagc aatatcaatt aggtactatt 60 ggttcgggta ctttatatcg tgatttgcag tcgtggtggg ctcggttaaa gggtaaagaa 120 gatccgaatt caaagctagg tcaatgggat gtttctcaga taggcgaaga taatagcttt 180 tgggctttac gagatgtatc atttgagatt aaccaagggg acattgttgg tattattggt 240 cgtaacgggg caggcaaatc aactttatta aagatattat cacgggttac tgggccaact 300 tcggggcaga taaaaataaa gggtcgggtt gcatcgttat tagaagttgg tactggtttt 360 catccggaac tgactgggcg agaaaatgtt tatctaaacg gggccattct aggtatgcgg 420 aaggccgaga tagatcgtaa atttgacgag atagttgact tcgctgaaat atcaaagttt 480 atagatactc cagttaaacg gtattcatca ggaatgtatg ttcggttagc ctttgccgtt 540 gccgctcatc tagatccaga aattttaatt gtagatgaag ttctggccgt tggggacata 600 gagtttcaaa agaagtgctt aggcaagatg aaagatgttg gccaacaggg gcgaactgtt 660 ttatttgttt cgcataatat ggttgccatt gaacaattat gctcatcggc tattctgatc 720 gaaaatgggc aaataaaaag caaatcgttt actgttcggg atattattaa ggattattta 780 tataaaaacg aatatagcca atttactcta tgggagaata aggagaaaga atttagcaac 840 ccatattttt atccagttaa aatgtatatt ggtgataaag atggtaagtt actacctacc 900 ccaatacgta acgatcaaga tgccttcatt tttatagaag cccagattaa gaagattgat 960 aaagcattaa ctgttggtta tgctatatat actgattcgg gtgagtgctt atattggtca 1020 tatcagactg acgagagcga agaagaatgg cctactctaa tagttggctc aaacgtttta 1080 tattcaaacc tgccaaaacg gttattaaac gaagggaaat atcggattga attaattggt 1140 ggagtccatt ttcgaaagtg gttatttcag ccattaaaat caccgccttc gatttcgtta 1200 gaaattgttg gtggcttatc ggattcacca tatctattat ataagcggcc aactgtttta 1260 aaccctataa ttcgatggaa ctcatttaat cgaaaggttg agtaa 1305 <210> 70 <211> 434 <212> PRT <213> Sporomusa sphaeroides DSM 2875 <400> 70 Met Ser Asp Thr Val Ile Lys Val Glu Asn Leu Ser Lys Gln Tyr Gln 1 5 10 15 Leu Gly Thr Ile Gly Ser Gly Thr Leu Tyr Arg Asp Leu Gln Ser Trp 20 25 30 Trp Ala Arg Leu Lys Gly Lys Glu Asp Pro Asn Ser Lys Leu Gly Gln 35 40 45 Trp Asp Val Ser Gln Ile Gly Glu Asp Asn Ser Phe Trp Ala Leu Arg 50 55 60 Asp Val Ser Phe Glu Ile Asn Gln Gly Asp Ile Val Gly Ile Ile Gly 65 70 75 80 Arg Asn Gly Ala Gly Lys Ser Thr Leu Leu Lys Ile Leu Ser Arg Val 85 90 95 Thr Gly Pro Thr Ser Gly Gln Ile Lys Ile Lys Gly Arg Val Ala Ser 100 105 110 Leu Leu Glu Val Gly Thr Gly Phe His Pro Glu Leu Thr Gly Arg Glu 115 120 125 Asn Val Tyr Leu Asn Gly Ala Ile Leu Gly Met Arg Lys Ala Glu Ile 130 135 140 Asp Arg Lys Phe Asp Glu Ile Val Asp Phe Ala Glu Ile Ser Lys Phe 145 150 155 160 Ile Asp Thr Pro Val Lys Arg Tyr Ser Ser Gly Met Tyr Val Arg Leu 165 170 175 Ala Phe Ala Val Ala Ala His Leu Asp Pro Glu Ile Leu Ile Val Asp 180 185 190 Glu Val Leu Ala Val Gly Asp Ile Glu Phe Gln Lys Lys Cys Leu Gly 195 200 205 Lys Met Lys Asp Val Gly Gln Gln Gly Arg Thr Val Leu Phe Val Ser 210 215 220 His Asn Met Val Ala Ile Glu Gln Leu Cys Ser Ser Ala Ile Leu Ile 225 230 235 240 Glu Asn Gly Gln Ile Lys Ser Lys Ser Phe Thr Val Arg Asp Ile Ile 245 250 255 Lys Asp Tyr Leu Tyr Lys Asn Glu Tyr Ser Gln Phe Thr Leu Trp Glu 260 265 270 Asn Lys Glu Lys Glu Phe Ser Asn Pro Tyr Phe Tyr Pro Val Lys Met 275 280 285 Tyr Ile Gly Asp Lys Asp Gly Lys Leu Leu Pro Thr Pro Ile Arg Asn 290 295 300 Asp Gln Asp Ala Phe Ile Phe Ile Glu Ala Gln Ile Lys Lys Ile Asp 305 310 315 320 Lys Ala Leu Thr Val Gly Tyr Ala Ile Tyr Thr Asp Ser Gly Glu Cys 325 330 335 Leu Tyr Trp Ser Tyr Gln Thr Asp Glu Ser Glu Glu Glu Trp Pro Thr 340 345 350 Leu Ile Val Gly Ser Asn Val Leu Tyr Ser Asn Leu Pro Lys Arg Leu 355 360 365 Leu Asn Glu Gly Lys Tyr Arg Ile Glu Leu Ile Gly Gly Val His Phe 370 375 380 Arg Lys Trp Leu Phe Gln Pro Leu Lys Ser Pro Pro Ser Ile Ser Leu 385 390 395 400 Glu Ile Val Gly Gly Leu Ser Asp Ser Pro Tyr Leu Leu Tyr Lys Arg 405 410 415 Pro Thr Val Leu Asn Pro Ile Ile Arg Trp Asn Ser Phe Asn Arg Lys 420 425 430 Val Glu <210> 71 <211> 864 <212> DNA <213> Flavobacterium spartansii <400> 71 atgaataata actcacccaa cgattggtta tttgaaataa cgccgaaaaa taagttcttc 60 tcactgaatc tgaaagaagt gtggcaatat cgtgacctgc tgtttttatt cgtgaaacgt 120 gacgtgataa cggtgtataa gcagacggtg ctgggaccat tatggtattt gattcaacca 180 ttatttacga gcgtgacgtt tacgataata ttcaataacg tggcaggcat tgagactggc 240 acggtgccgc catttctgtt taacttggct ggcataacgg tgtggaacta ttttacggca 300 tgtttgacgg gaacgagcga cacgtttaag gcgaacgcag ctatttttgg caaagtgtat 360 tttccacgaa taattacgcc gttgtcagtg gtgattagca acttagtgaa gtttggcata 420 cagtttctga tttttattgg cttctatatt ttctactatt ttcagggcgc ggatctgtcg 480 cttaacggtt tagtgctgtt ttttccggtg ctgataataa taatgggcat tctgggctta 540 ggactaggta tgttaataag cgctatggtg acgaaatatc gtgacttttc gcatctgatt 600 ggttttggaa tacagctgtt aatgtatctg agcgcggtga tgtatccgat ggaattaatt 660 aaagataaac tgccaagcta cggatggtta gtggtgtata acccactggc gtatattatt 720 gagactgcac gttttatgct gttaaacgtt ggtgatattt cagtgttagg cttaacgtat 780 acgctgattg tgacgataac ggtgtttttt ataggcctgt tggtgtttaa taaaactgag 840 aaatcgttta tagatacggt gtaa 864 <210> 72 <211> 287 <212> PRT <213> Flavobacterium spartansii <400> 72 Met Asn Asn Asn Ser Pro Asn Asp Trp Leu Phe Glu Ile Thr Pro Lys 1 5 10 15 Asn Lys Phe Phe Ser Leu Asn Leu Lys Glu Val Trp Gln Tyr Arg Asp 20 25 30 Leu Leu Phe Leu Phe Val Lys Arg Asp Val Ile Thr Val Tyr Lys Gln 35 40 45 Thr Val Leu Gly Pro Leu Trp Tyr Leu Ile Gln Pro Leu Phe Thr Ser 50 55 60 Val Thr Phe Thr Ile Ile Phe Asn Asn Val Ala Gly Ile Glu Thr Gly 65 70 75 80 Thr Val Pro Pro Phe Leu Phe Asn Leu Ala Gly Ile Thr Val Trp Asn 85 90 95 Tyr Phe Thr Ala Cys Leu Thr Gly Thr Ser Asp Thr Phe Lys Ala Asn 100 105 110 Ala Ala Ile Phe Gly Lys Val Tyr Phe Pro Arg Ile Ile Thr Pro Leu 115 120 125 Ser Val Val Ile Ser Asn Leu Val Lys Phe Gly Ile Gln Phe Leu Ile 130 135 140 Phe Ile Gly Phe Tyr Ile Phe Tyr Tyr Phe Gln Gly Ala Asp Leu Ser 145 150 155 160 Leu Asn Gly Leu Val Leu Phe Phe Pro Val Leu Ile Ile Ile Met Gly 165 170 175 Ile Leu Gly Leu Gly Leu Gly Met Leu Ile Ser Ala Met Val Thr Lys 180 185 190 Tyr Arg Asp Phe Ser His Leu Ile Gly Phe Gly Ile Gln Leu Leu Met 195 200 205 Tyr Leu Ser Ala Val Met Tyr Pro Met Glu Leu Ile Lys Asp Lys Leu 210 215 220 Pro Ser Tyr Gly Trp Leu Val Val Tyr Asn Pro Leu Ala Tyr Ile Ile 225 230 235 240 Glu Thr Ala Arg Phe Met Leu Leu Asn Val Gly Asp Ile Ser Val Leu 245 250 255 Gly Leu Thr Tyr Thr Leu Ile Val Thr Ile Thr Val Phe Phe Ile Gly 260 265 270 Leu Leu Val Phe Asn Lys Thr Glu Lys Ser Phe Ile Asp Thr Val 275 280 285 <210> 73 <211> 852 <212> DNA <213> Sporomusa sphaeroides DSM 2875 <400> 73 atgcatctag aacaggaaca atggacttcg attattaaac cttcgaacgg atggtttgat 60 attgatttta aagggttatg gcactatcgg gatttaattg caatgatggt taaacgggat 120 tttgttgcct tttataaaca aaccatctta gggcctctat ggtttttact gcagccgtta 180 ttaactacta ttgtttttac tattgttttt ggccagattg ccaaattacc tactaacggg 240 ttacctcaag tattatttta tttatcaggg actgttatgt ggaactactt tgctgcctgc 300 ttaaatacta cctcaaatac ctttgttgcg aacgccggta tttttggtaa agtttatttt 360 ccacggctag ttataccaat tggcgttgtt attaccaata tgttatcatt cgggattcaa 420 tttgcactat ttttagctct actaatcttc tttatgcttc aaggggcagc agttgcccca 480 aacttatgga tcttagttac tcctttatta gttctgcaaa tgggctgctt agggctaggt 540 tgtggtatta tagtttcatc aatgactacc aaataccggg acttatcatt attagttact 600 tttggtgccc agttatggat gtatgcgact ccggttgttt atcctgtttc gatggcatcc 660 gggttcatga gctgggtttt agtattaaac ccaatgactg ctattatcga aatctttcgt 720 tacgcgtttt taggtgggca gatgattcca ttatggtact ggttagttag cggtgcaatt 780 accgttattt tattcatggt tggtattatt ctattctcga aagttgagaa aaattttatg 840 gatactgttt ga 852 <210> 74 <211> 283 <212> PRT <213> Sporomusa sphaeroides DSM 2875 <400> 74 Met His Leu Glu Gln Glu Gln Trp Thr Ser Ile Ile Lys Pro Ser Asn 1 5 10 15 Gly Trp Phe Asp Ile Asp Phe Lys Gly Leu Trp His Tyr Arg Asp Leu 20 25 30 Ile Ala Met Met Val Lys Arg Asp Phe Val Ala Phe Tyr Lys Gln Thr 35 40 45 Ile Leu Gly Pro Leu Trp Phe Leu Leu Gln Pro Leu Leu Thr Thr Ile 50 55 60 Val Phe Thr Ile Val Phe Gly Gln Ile Ala Lys Leu Pro Thr Asn Gly 65 70 75 80 Leu Pro Gln Val Leu Phe Tyr Leu Ser Gly Thr Val Met Trp Asn Tyr 85 90 95 Phe Ala Ala Cys Leu Asn Thr Thr Ser Asn Thr Phe Val Ala Asn Ala 100 105 110 Gly Ile Phe Gly Lys Val Tyr Phe Pro Arg Leu Val Ile Pro Ile Gly 115 120 125 Val Val Ile Thr Asn Met Leu Ser Phe Gly Ile Gln Phe Ala Leu Phe 130 135 140 Leu Ala Leu Leu Ile Phe Phe Met Leu Gln Gly Ala Ala Val Ala Pro 145 150 155 160 Asn Leu Trp Ile Leu Val Thr Pro Leu Leu Val Leu Gln Met Gly Cys 165 170 175 Leu Gly Leu Gly Cys Gly Ile Ile Val Ser Ser Met Thr Thr Lys Tyr 180 185 190 Arg Asp Leu Ser Leu Leu Val Thr Phe Gly Ala Gln Leu Trp Met Tyr 195 200 205 Ala Thr Pro Val Val Tyr Pro Val Ser Met Ala Ser Gly Phe Met Ser 210 215 220 Trp Val Leu Val Leu Asn Pro Met Thr Ala Ile Ile Glu Ile Phe Arg 225 230 235 240 Tyr Ala Phe Leu Gly Gly Gln Met Ile Pro Leu Trp Tyr Trp Leu Val 245 250 255 Ser Gly Ala Ile Thr Val Ile Leu Phe Met Val Gly Ile Ile Leu Phe 260 265 270 Ser Lys Val Glu Lys Asn Phe Met Asp Thr Val 275 280 <210> 75 <211> 1851 <212> DNA <213> Candidatus Planktophila sulfonica <400> 75 atgattgaat tccttagcaa accaaagttc agcatactta ctaaatcccc gatttatcga 60 gccagccgcg tattatccgt taaggaccgg cgaaagatta gccttgtgat tgtggttcag 120 gtttgccttg gtctgtttga tttagccggt gtagcggtgt ttggtgtaat gggtagctta 180 gcggtaagcg gagtgcagag ccagagcccg aactcacggg taggccaggt tcttgatgcg 240 attggaatag ccaacctgcc gttccaaaag caggccgcga ttctggcgat tctggctact 300 tgcttcctta tggcccggac cttccttact gtagtggtaa cgaaacggac tatgcttttc 360 ctgtcccgac gaggcgccgc tattagctca gatttagtag ctcgactgct gagcaagtca 420 ttacttttca ttcaggagcg aacgactcaa cagacgcttt tcgctctgac gcaaggtgtg 480 agcacgctta ctataggtgt acttgctacc gtggtaacga tgattagcga tacgagcctt 540 cttattttac ttactgcggg ccttttcgta gtggatcccg cgatagctat atccacgtta 600 gtggtattcg gtagcattat tctgttcatg tataaaaacc ttcataataa agctaaaacg 660 ctgggtttcg cggaaagcac tcttcatata aagtccaacg aaaaggttct tgaagtgtta 720 aactcatacc gggaaagcgt agttcgaaat cgcaggaact attatagcga gcaaattggt 780 atgttacgat tcgatcttgc taagacccag gcgcagttat cctttatgcc ctatattggt 840 aagtatgtat tagagactag cgtagtatta ggttcacttt taattgcggc gattcagttc 900 gcgttgcacg atgctgttac cgccgtggcc acgctttcaa tatttcttgt ggctggtacg 960 cgcattagcc cagctgcttt aaggctgcaa caggcgctta ttcagattaa gagctcactg 1020 ggtggctcag aaccgactct tgatttaatt gatgcccttc gtgacaccct tccagcgacg 1080 tccgttaatc aagagctgga ccttacgcat gaacagttcg taccccgaat tcagattcag 1140 gatatatcat ttacgtaccc caactcagat cggcaggcct taagcggtgt taaccttgat 1200 attcagtccg gttccgtggt tgccctggta ggcccatcag gtggcggcaa gacgacgctt 1260 gttgatgtaa ttttaggtat tattgaaccc aatagcggta aagtattaat ttcaaatctt 1320 acccccattg atgctattca gatttcaccg ggtgcgattt catacgtgcc ccaagatgtg 1380 tcaattattg atggtacggt acgagaaaat attgcgatgg gtttccccgt tgaagtggct 1440 accgatgagc ttgtgcataa tgctattgaa ttagctggat taaaagaatt cgttgctacg 1500 ctgccgaatg gtcttgacac gtacgtaggc gaaaaaggtg ctcggatttc aggtggccaa 1560 cggcagcgcc tgggaattgc tagggcgctc ttcacgaacc cgaaattact ggtactggat 1620 gaagctactt ccgccttaga tggtgaaacg gagagccgaa ttacggatag catactgtcc 1680 ttaaagggta aagttacggt attaatggtt gctcataggc tgtccacggt acgcaacgcc 1740 gatcaagttg tgtatatgtc agaaggcagc attaaagctg taggcacttt cgagagcgtg 1800 aggaatacgg tgccggattt cgatacgcag gcccaactta tgggattatg a 1851 <210> 76 <211> 616 <212> PRT <213> Candidatus Planktophila sulfonica <400> 76 Met Ile Glu Phe Leu Ser Lys Pro Lys Phe Ser Ile Leu Thr Lys Ser 1 5 10 15 Pro Ile Tyr Arg Ala Ser Arg Val Leu Ser Val Lys Asp Arg Arg Lys 20 25 30 Ile Ser Leu Val Ile Val Val Gln Val Cys Leu Gly Leu Phe Asp Leu 35 40 45 Ala Gly Val Ala Val Phe Gly Val Met Gly Ser Leu Ala Val Ser Gly 50 55 60 Val Gln Ser Gln Ser Pro Asn Ser Arg Val Gly Gln Val Leu Asp Ala 65 70 75 80 Ile Gly Ile Ala Asn Leu Pro Phe Gln Lys Gln Ala Ala Ile Leu Ala 85 90 95 Ile Leu Ala Thr Cys Phe Leu Met Ala Arg Thr Phe Leu Thr Val Val 100 105 110 Val Thr Lys Arg Thr Met Leu Phe Leu Ser Arg Arg Gly Ala Ala Ile 115 120 125 Ser Ser Asp Leu Val Ala Arg Leu Leu Ser Lys Ser Leu Leu Phe Ile 130 135 140 Gln Glu Arg Thr Thr Gln Gln Thr Leu Phe Ala Leu Thr Gln Gly Val 145 150 155 160 Ser Thr Leu Thr Ile Gly Val Leu Ala Thr Val Val Thr Met Ile Ser 165 170 175 Asp Thr Ser Leu Leu Ile Leu Leu Thr Ala Gly Leu Phe Val Val Asp 180 185 190 Pro Ala Ile Ala Ile Ser Thr Leu Val Val Phe Gly Ser Ile Ile Leu 195 200 205 Phe Met Tyr Lys Asn Leu His Asn Lys Ala Lys Thr Leu Gly Phe Ala 210 215 220 Glu Ser Thr Leu His Ile Lys Ser Asn Glu Lys Val Leu Glu Val Leu 225 230 235 240 Asn Ser Tyr Arg Glu Ser Val Val Arg Asn Arg Arg Asn Tyr Tyr Ser 245 250 255 Glu Gln Ile Gly Met Leu Arg Phe Asp Leu Ala Lys Thr Gln Ala Gln 260 265 270 Leu Ser Phe Met Pro Tyr Ile Gly Lys Tyr Val Leu Glu Thr Ser Val 275 280 285 Val Leu Gly Ser Leu Leu Ile Ala Ala Ile Gln Phe Ala Leu His Asp 290 295 300 Ala Val Thr Ala Val Ala Thr Leu Ser Ile Phe Leu Val Ala Gly Thr 305 310 315 320 Arg Ile Ser Pro Ala Ala Leu Arg Leu Gln Gln Ala Leu Ile Gln Ile 325 330 335 Lys Ser Ser Leu Gly Gly Ser Glu Pro Thr Leu Asp Leu Ile Asp Ala 340 345 350 Leu Arg Asp Thr Leu Pro Ala Thr Ser Val Asn Gln Glu Leu Asp Leu 355 360 365 Thr His Glu Gln Phe Val Pro Arg Ile Gln Ile Gln Asp Ile Ser Phe 370 375 380 Thr Tyr Pro Asn Ser Asp Arg Gln Ala Leu Ser Gly Val Asn Leu Asp 385 390 395 400 Ile Gln Ser Gly Ser Val Val Ala Leu Val Gly Pro Ser Gly Gly Gly 405 410 415 Lys Thr Thr Leu Val Asp Val Ile Leu Gly Ile Ile Glu Pro Asn Ser 420 425 430 Gly Lys Val Leu Ile Ser Asn Leu Thr Pro Ile Asp Ala Ile Gln Ile 435 440 445 Ser Pro Gly Ala Ile Ser Tyr Val Pro Gln Asp Val Ser Ile Ile Asp 450 455 460 Gly Thr Val Arg Glu Asn Ile Ala Met Gly Phe Pro Val Glu Val Ala 465 470 475 480 Thr Asp Glu Leu Val His Asn Ala Ile Glu Leu Ala Gly Leu Lys Glu 485 490 495 Phe Val Ala Thr Leu Pro Asn Gly Leu Asp Thr Tyr Val Gly Glu Lys 500 505 510 Gly Ala Arg Ile Ser Gly Gly Gln Arg Gln Arg Leu Gly Ile Ala Arg 515 520 525 Ala Leu Phe Thr Asn Pro Lys Leu Leu Val Leu Asp Glu Ala Thr Ser 530 535 540 Ala Leu Asp Gly Glu Thr Glu Ser Arg Ile Thr Asp Ser Ile Leu Ser 545 550 555 560 Leu Lys Gly Lys Val Thr Val Leu Met Val Ala His Arg Leu Ser Thr 565 570 575 Val Arg Asn Ala Asp Gln Val Val Tyr Met Ser Glu Gly Ser Ile Lys 580 585 590 Ala Val Gly Thr Phe Glu Ser Val Arg Asn Thr Val Pro Asp Phe Asp 595 600 605 Thr Gln Ala Gln Leu Met Gly Leu 610 615 <210> 77 <211> 1809 <212> DNA <213> Butyrivibrio hungatei XBD2006 <400> 77 atgtcgaata ctgataataa gaaagtatcg ctttttagca agttgcgcta tatctttgat 60 cgcaaacaga aaggccagct cgttatcctc gccgtactga tcttgtttgg gggaatcttt 120 gaaacctttt cgatcagcat gatgatcccg gtgatggccg ggatcatcaa ccaggataaa 180 ttgcaatcgg ctatcgagga taataaggtg ctacgcatca tcgcggaatc gctgaacttg 240 gggactggct cagaactcgc cgccaagctc actgtgtgtc tcatcgtgct cttcctcgtt 300 aagaacgcgt atcagatctt tctgatctac cggcagaata cttttatcac ccgcgcgcgc 360 aatgacatga tctcgcgcgt aatgcgggaa tttctcaatc gcccgtatga ggattattta 420 ggggccgata tcccaacggt gtttcgcatc accgactcgg atatcccccg cacctttact 480 ctgatgcttt ctctgctttc tctgtcgact gaactcgtag tgtcaatggg cctgggcatg 540 gtactgatca tcactgatcc aatcctcact gtgatctgcg tatttgtgtt tgtggcgctt 600 acgctgttta atactaaggt gcttaaaccg aaactgaata aaactggcaa ggagaaccag 660 gaaactcaga gccggatcgc gaaatggcgc ctccaggcga tctatgggct gaaagatgtt 720 aaggtgctca atcgccagga tttctttatc cgcaactatt atgagagcgg aaaggtaggg 780 gcagatctcg cgcgggatta ctcagttctg aataatatgc cacgcacgct gatcgagact 840 gtatttgttg ccgtggtatt gctctatgtg ttgtttttta aactcaatag caatggtgtt 900 caaaacgccg gtgatgtgga taagctcatc atcgcattgg gcttagtggc cacccggctg 960 atgccagcag tgaatcggat caatacgtat atcgctgaga tcgcttataa tcagtactcg 1020 ctggattttg tttataataa cttgactgat agcatgaaaa tggataaagc aatgcgcgca 1080 gagcgcgccg cgatcgcggg gccagagctg catctcgaaa aagagatcga gatcaaggat 1140 atcacgtttg cctatccaga cgccgagact aatatcttta ctggcgcgaa tatggtgatc 1200 ccgaaaggca agagcgtagg gatcatcggc ccgtctgggg cagggaagag cacggttgta 1260 gatatcatct tagggctgct ccatgtccag tcgggagaga tcttgtgcga cggctcgaat 1320 atcttctcga actacgatag ctggctggct cagatcgggt atatcccgca gaccatctat 1380 atggttgatg agtcgatccg cgagaatatc gcgttcggga tcgatgcgga caaaatcgat 1440 gaggaccgca tctgggaagt gatggaagaa gctcagctgg ccgagtttgt taaatcgctg 1500 ccagaaggcc tggacactaa aatcggggac cgcggagtac gcctgagcgg gggccagcgc 1560 cagcggatcg gcatcgcacg cgccctgtat cataacccag agatcctggt atttgatgaa 1620 gccacctcgg ccctggataa tgagactgag gccgctgtga tggaagccgt aaattcgttc 1680 cacggcaaga agaccatgat catcatcgct caccgcttga atacgatcga gaattgtgac 1740 atcatctatg aagtgaaaga cgagaaaatc acccagacga cgttggaagg gcgcaatgtg 1800 atccactga 1809 <210> 78 <211> 602 <212> PRT <213> Butyrivibrio hungatei XBD2006 <400> 78 Met Ser Asn Thr Asp Asn Lys Lys Val Ser Leu Phe Ser Lys Leu Arg 1 5 10 15 Tyr Ile Phe Asp Arg Lys Gln Lys Gly Gln Leu Val Ile Leu Ala Val 20 25 30 Leu Ile Leu Phe Gly Gly Ile Phe Glu Thr Phe Ser Ile Ser Met Met 35 40 45 Ile Pro Val Met Ala Gly Ile Ile Asn Gln Asp Lys Leu Gln Ser Ala 50 55 60 Ile Glu Asp Asn Lys Val Leu Arg Ile Ile Ala Glu Ser Leu Asn Leu 65 70 75 80 Gly Thr Gly Ser Glu Leu Ala Ala Lys Leu Thr Val Cys Leu Ile Val 85 90 95 Leu Phe Leu Val Lys Asn Ala Tyr Gln Ile Phe Leu Ile Tyr Arg Gln 100 105 110 Asn Thr Phe Ile Thr Arg Ala Arg Asn Asp Met Ile Ser Arg Val Met 115 120 125 Arg Glu Phe Leu Asn Arg Pro Tyr Glu Asp Tyr Leu Gly Ala Asp Ile 130 135 140 Pro Thr Val Phe Arg Ile Thr Asp Ser Asp Ile Pro Arg Thr Phe Thr 145 150 155 160 Leu Met Leu Ser Leu Leu Ser Leu Ser Thr Glu Leu Val Val Ser Met 165 170 175 Gly Leu Gly Met Val Leu Ile Ile Thr Asp Pro Ile Leu Thr Val Ile 180 185 190 Cys Val Phe Val Phe Val Ala Leu Thr Leu Phe Asn Thr Lys Val Leu 195 200 205 Lys Pro Lys Leu Asn Lys Thr Gly Lys Glu Asn Gln Glu Thr Gln Ser 210 215 220 Arg Ile Ala Lys Trp Arg Leu Gln Ala Ile Tyr Gly Leu Lys Asp Val 225 230 235 240 Lys Val Leu Asn Arg Gln Asp Phe Phe Ile Arg Asn Tyr Tyr Glu Ser 245 250 255 Gly Lys Val Gly Ala Asp Leu Ala Arg Asp Tyr Ser Val Leu Asn Asn 260 265 270 Met Pro Arg Thr Leu Ile Glu Thr Val Phe Val Ala Val Val Leu Leu 275 280 285 Tyr Val Leu Phe Phe Lys Leu Asn Ser Asn Gly Val Gln Asn Ala Gly 290 295 300 Asp Val Asp Lys Leu Ile Ile Ala Leu Gly Leu Val Ala Thr Arg Leu 305 310 315 320 Met Pro Ala Val Asn Arg Ile Asn Thr Tyr Ile Ala Glu Ile Ala Tyr 325 330 335 Asn Gln Tyr Ser Leu Asp Phe Val Tyr Asn Asn Leu Thr Asp Ser Met 340 345 350 Lys Met Asp Lys Ala Met Arg Ala Glu Arg Ala Ala Ile Ala Gly Pro 355 360 365 Glu Leu His Leu Glu Lys Glu Ile Glu Ile Lys Asp Ile Thr Phe Ala 370 375 380 Tyr Pro Asp Ala Glu Thr Asn Ile Phe Thr Gly Ala Asn Met Val Ile 385 390 395 400 Pro Lys Gly Lys Ser Val Gly Ile Ile Gly Pro Ser Gly Ala Gly Lys 405 410 415 Ser Thr Val Val Asp Ile Ile Leu Gly Leu Leu His Val Gln Ser Gly 420 425 430 Glu Ile Leu Cys Asp Gly Ser Asn Ile Phe Ser Asn Tyr Asp Ser Trp 435 440 445 Leu Ala Gln Ile Gly Tyr Ile Pro Gln Thr Ile Tyr Met Val Asp Glu 450 455 460 Ser Ile Arg Glu Asn Ile Ala Phe Gly Ile Asp Ala Asp Lys Ile Asp 465 470 475 480 Glu Asp Arg Ile Trp Glu Val Met Glu Glu Ala Gln Leu Ala Glu Phe 485 490 495 Val Lys Ser Leu Pro Glu Gly Leu Asp Thr Lys Ile Gly Asp Arg Gly 500 505 510 Val Arg Leu Ser Gly Gly Gln Arg Gln Arg Ile Gly Ile Ala Arg Ala 515 520 525 Leu Tyr His Asn Pro Glu Ile Leu Val Phe Asp Glu Ala Thr Ser Ala 530 535 540 Leu Asp Asn Glu Thr Glu Ala Ala Val Met Glu Ala Val Asn Ser Phe 545 550 555 560 His Gly Lys Lys Thr Met Ile Ile Ile Ala His Arg Leu Asn Thr Ile 565 570 575 Glu Asn Cys Asp Ile Ile Tyr Glu Val Lys Asp Glu Lys Ile Thr Gln 580 585 590 Thr Thr Leu Glu Gly Arg Asn Val Ile His 595 600 <210> 79 <211> 1746 <212> DNA <213> Roseburia intestinalis CAG:13 <400> 79 atgaaagatc ttgttaaatc ggttctaaaa gtctttgatg gcaagcagaa gcggaagctc 60 gtaggcatga tgtttctgat actgatcaac tccggagtat cgctgttagg agtctcagtg 120 ttatcgccgt ttatcaccgc agtgatgaac ccggaagagt tacttaaaaa cgacatcata 180 cgttctgtct atgatggctt tcatatgcag aatacgaacc agctgatcac gctgctttct 240 gtgctgatca tcatcgtgta tatcgcgaaa aacgcattta tcatctttat caataatatg 300 ctgtactgtt tctcgtatta tggcaaacga gagatgcagg accggatgat gaaatattat 360 atctcgcgtg attacacctt tttcttaaat cataattcgg ctgagctgat gcgtgatatc 420 aatacggatc cagagatgtt ttatgcagca gtgttaaata tgcttcagtt agcgtcggaa 480 ctttgtgtat cgctgatctt agttggctat ttattagtta aagatgcact gcttacgtta 540 ggagtcgcat ttgcaatggt agtcatggtt tttatcttta tgaaaaaact gcggagaacg 600 ttagcacgtt tcggtgatga ccgtcgtaaa tacaatgcta atatcctgca gtgcatgcag 660 caggcattcg gtgggatcaa agagatcaag atcgcgaatc gagaggcgta ttttgaaggg 720 gaatttgtta agcagaacgg gttatacacg tatgtaatca aacagaattc tttcttatcg 780 tcgatcccga aaccgatcat ggaagcgctt tgcatcacgg gcttaatggc agcgatcatc 840 gtacgtatca atgcaacctc gacctcgccg gagcagtttg taggcacctt agcggttttt 900 gcagccgcgg cgtttgctct gttaccctct gcgaataaga tgtctgaata tttaggctca 960 atcatccata atggagtagt gatccataag atcggggaag agtatgctgc aatccgggat 1020 atggaaatcc agaccgaaaa agaagaaaac tacaaaaaag ttaccttaga caaagaaatc 1080 aaagtagagg atatgacgtt ccattacccg gatactgagg atgcagtttt agctcatgta 1140 aacgtgacca tcccgaaaaa taagtcggtc gcgtttatcg gcccgtccgg ggcaggcaag 1200 acgacgatgg tagacctgat cttaggagtc ttaaaaccgc aggctggcaa gatcaccgtt 1260 gatgggatgg atatcaaaga atcttaccgt ggctggcatg ataagatcgg gtatatccct 1320 cagactatct acatgcttga cgataccatc cggaataata tcgcgtttgg aaagacggaa 1380 gggatcgatg atgcggatat ctgggaagcg ttaaaacagg cgcaattaga tgagtttgtt 1440 aaatcgttag atgagggatt agatacgatg atcggcgagg ctggagtccg gttatccggg 1500 ggccagcgtc agcgtatcgg gatcgcgcgt gcactatacc ggcgtccaga agtgttagtg 1560 ctggatgagg cgacttcggc gctggatacg gaaaccgaag ctgctgtcat ggaagcgatc 1620 gactcgttgc aggggaagat gaccatgctg atcatcgcgc accggctgtc tacgatcaaa 1680 aactgcgaca tggtttatca ggttgaggga ggatcggtga cccggaaaga aaaggaatcg 1740 gtttga 1746 <210> 80 <211> 581 <212> PRT <213> Roseburia intestinalis CAG:13 <400> 80 Met Lys Asp Leu Val Lys Ser Val Leu Lys Val Phe Asp Gly Lys Gln 1 5 10 15 Lys Arg Lys Leu Val Gly Met Met Phe Leu Ile Leu Ile Asn Ser Gly 20 25 30 Val Ser Leu Leu Gly Val Ser Val Leu Ser Pro Phe Ile Thr Ala Val 35 40 45 Met Asn Pro Glu Glu Leu Leu Lys Asn Asp Ile Ile Arg Ser Val Tyr 50 55 60 Asp Gly Phe His Met Gln Asn Thr Asn Gln Leu Ile Thr Leu Leu Ser 65 70 75 80 Val Leu Ile Ile Ile Val Tyr Ile Ala Lys Asn Ala Phe Ile Ile Phe 85 90 95 Ile Asn Asn Met Leu Tyr Cys Phe Ser Tyr Tyr Gly Lys Arg Glu Met 100 105 110 Gln Asp Arg Met Met Lys Tyr Tyr Ile Ser Arg Asp Tyr Thr Phe Phe 115 120 125 Leu Asn His Asn Ser Ala Glu Leu Met Arg Asp Ile Asn Thr Asp Pro 130 135 140 Glu Met Phe Tyr Ala Ala Val Leu Asn Met Leu Gln Leu Ala Ser Glu 145 150 155 160 Leu Cys Val Ser Leu Ile Leu Val Gly Tyr Leu Leu Val Lys Asp Ala 165 170 175 Leu Leu Thr Leu Gly Val Ala Phe Ala Met Val Val Met Val Phe Ile 180 185 190 Phe Met Lys Lys Leu Arg Arg Thr Leu Ala Arg Phe Gly Asp Asp Arg 195 200 205 Arg Lys Tyr Asn Ala Asn Ile Leu Gln Cys Met Gln Gln Ala Phe Gly 210 215 220 Gly Ile Lys Glu Ile Lys Ile Ala Asn Arg Glu Ala Tyr Phe Glu Gly 225 230 235 240 Glu Phe Val Lys Gln Asn Gly Leu Tyr Thr Tyr Val Ile Lys Gln Asn 245 250 255 Ser Phe Leu Ser Ser Ile Pro Lys Pro Ile Met Glu Ala Leu Cys Ile 260 265 270 Thr Gly Leu Met Ala Ala Ile Ile Val Arg Ile Asn Ala Thr Ser Thr 275 280 285 Ser Pro Glu Gln Phe Val Gly Thr Leu Ala Val Phe Ala Ala Ala Ala 290 295 300 Phe Ala Leu Leu Pro Ser Ala Asn Lys Met Ser Glu Tyr Leu Gly Ser 305 310 315 320 Ile Ile His Asn Gly Val Val Ile His Lys Ile Gly Glu Glu Tyr Ala 325 330 335 Ala Ile Arg Asp Met Glu Ile Gln Thr Glu Lys Glu Glu Asn Tyr Lys 340 345 350 Lys Val Thr Leu Asp Lys Glu Ile Lys Val Glu Asp Met Thr Phe His 355 360 365 Tyr Pro Asp Thr Glu Asp Ala Val Leu Ala His Val Asn Val Thr Ile 370 375 380 Pro Lys Asn Lys Ser Val Ala Phe Ile Gly Pro Ser Gly Ala Gly Lys 385 390 395 400 Thr Thr Met Val Asp Leu Ile Leu Gly Val Leu Lys Pro Gln Ala Gly 405 410 415 Lys Ile Thr Val Asp Gly Met Asp Ile Lys Glu Ser Tyr Arg Gly Trp 420 425 430 His Asp Lys Ile Gly Tyr Ile Pro Gln Thr Ile Tyr Met Leu Asp Asp 435 440 445 Thr Ile Arg Asn Asn Ile Ala Phe Gly Lys Thr Glu Gly Ile Asp Asp 450 455 460 Ala Asp Ile Trp Glu Ala Leu Lys Gln Ala Gln Leu Asp Glu Phe Val 465 470 475 480 Lys Ser Leu Asp Glu Gly Leu Asp Thr Met Ile Gly Glu Ala Gly Val 485 490 495 Arg Leu Ser Gly Gly Gln Arg Gln Arg Ile Gly Ile Ala Arg Ala Leu 500 505 510 Tyr Arg Arg Pro Glu Val Leu Val Leu Asp Glu Ala Thr Ser Ala Leu 515 520 525 Asp Thr Glu Thr Glu Ala Ala Val Met Glu Ala Ile Asp Ser Leu Gln 530 535 540 Gly Lys Met Thr Met Leu Ile Ile Ala His Arg Leu Ser Thr Ile Lys 545 550 555 560 Asn Cys Asp Met Val Tyr Gln Val Glu Gly Gly Ser Val Thr Arg Lys 565 570 575 Glu Lys Glu Ser Val 580 <210> 81 <211> 1827 <212> DNA <213> Pedobacter ginsengisoli <400> 81 atgaaaatat atttccgttt attatcattc gcgaaaccaa tcgaaaagtt tgcgattcca 60 tatgtgatca cgacggtact atcagtgatt tttagcgtgt taaatttaac gttattagcg 120 ccattattcg aaacgttaat cagcgatgag ccgacgaaaa gctcaggttt agcggataac 180 gcagctagcg cgtttaatat tacggcgcag tttaaagagt ttgtgaattc gtcgatcata 240 acgaatggtc aggagaaaac gcttacgtat atatgcctaa ttattgtact aagcgtatta 300 ttatcgaata tcttccgtta ttttagccag cgttcgatgg aagatcttcg ggtgcatacg 360 ttattaaatt tacggaaaac tgtgttcgaa aacgtgatga acttgcatgt tggttatttt 420 aataacgaac ggaaaggtga cattatctcg aaagtgtcgg ccgatgtgca agtggtgcag 480 tttacggtaa cgaatacgct tcaagtggtg tttaaagagc cactaacgtt aattttctat 540 gtgttagtgc tattatcaat tagcatcaag cttacgttat tttcgttatt agtgattccg 600 atatcggcgt ttgtgatcag caaaattgtg aaacgtatca aacatcaagc aaaggaagct 660 catgagtcgt tcgcgaaaat gattggtttt ttagatgaag cattaggggg catcaaaata 720 attaaagcat ttaacgcgtc agagcgaatc aaagaacgtt ttcataacga aaatgtattt 780 tatagcaata tcaatcggaa gatggtgcgg cgacaacagt taggtagccc gttaagcgag 840 tttttaagca ttgtgatggt gtcattcatt gtgtggtatg gtggccggtt aataataagc 900 catcaacccg gtgcgctatc gacgagccag tttatcgcgt atatcgcgat cttttcccag 960 gtgatgcggc cggcgaaggc attaacggat agcttttcgg gtatacatac tggtatcgcg 1020 gcaggcgaac gggtgctaga tttaattgac acgaaagcgg aacaaataaa taagcccgat 1080 gcgaaagaaa tcagcagctt caataactcg ttagtgtttg aaaacgtgtc attttcgtac 1140 gaatcgaaag aagtgttaaa aaatattaat ttaacgattc agaaagggaa aacgatcgca 1200 ttagtgggac caagcggtgg cggcaaaagc actctaatgg atttaatccc acgtttccac 1260 gatccaaaat cgggttcgat caaaattgat ggtttagatt atgcggattt aacggttgag 1320 tcgattcgga gccagcttgg tatggtgaat caagaaagca ttttatttaa tgatacgatc 1380 tttaataata tcgcatttgc gaagccggat gcgacggaag ccgaagtgat tgccgcggcg 1440 aaaattgcga acgcgcatga cttcatactt caaacggaaa acggttatga aacgtatacg 1500 ggtgaccgtg gtaataaact tagcgggggc cagaaacaac ggttatgtat cgcgcgtgcg 1560 attttagcga atccaccgat aatgttatta gacgaagcga cgagcgcgtt agatacggag 1620 tcggaaaagt tagtgcaaga tgcgcttaat aaattaatgg aaaaccggac ttcattagtg 1680 atcgcgcacc gtttaagcac gatccatggt gcggatttaa tagtggtgat tgataagggt 1740 gagataattg aaacgggtac gcatcaagag ttattatcgc ataacggtct atataaaaaa 1800 cttattgaat tgcagacgtt ttcgtaa 1827 <210> 82 <211> 608 <212> PRT <213> Pedobacter ginsengisoli <400> 82 Met Lys Ile Tyr Phe Arg Leu Leu Ser Phe Ala Lys Pro Ile Glu Lys 1 5 10 15 Phe Ala Ile Pro Tyr Val Ile Thr Thr Val Leu Ser Val Ile Phe Ser 20 25 30 Val Leu Asn Leu Thr Leu Leu Ala Pro Leu Phe Glu Thr Leu Ile Ser 35 40 45 Asp Glu Pro Thr Lys Ser Ser Gly Leu Ala Asp Asn Ala Ala Ser Ala 50 55 60 Phe Asn Ile Thr Ala Gln Phe Lys Glu Phe Val Asn Ser Ser Ile Ile 65 70 75 80 Thr Asn Gly Gln Glu Lys Thr Leu Thr Tyr Ile Cys Leu Ile Ile Val 85 90 95 Leu Ser Val Leu Leu Ser Asn Ile Phe Arg Tyr Phe Ser Gln Arg Ser 100 105 110 Met Glu Asp Leu Arg Val His Thr Leu Leu Asn Leu Arg Lys Thr Val 115 120 125 Phe Glu Asn Val Met Asn Leu His Val Gly Tyr Phe Asn Asn Glu Arg 130 135 140 Lys Gly Asp Ile Ile Ser Lys Val Ser Ala Asp Val Gln Val Val Gln 145 150 155 160 Phe Thr Val Thr Asn Thr Leu Gln Val Val Phe Lys Glu Pro Leu Thr 165 170 175 Leu Ile Phe Tyr Val Leu Val Leu Leu Ser Ile Ser Ile Lys Leu Thr 180 185 190 Leu Phe Ser Leu Leu Val Ile Pro Ile Ser Ala Phe Val Ile Ser Lys 195 200 205 Ile Val Lys Arg Ile Lys His Gln Ala Lys Glu Ala His Glu Ser Phe 210 215 220 Ala Lys Met Ile Gly Phe Leu Asp Glu Ala Leu Gly Gly Ile Lys Ile 225 230 235 240 Ile Lys Ala Phe Asn Ala Ser Glu Arg Ile Lys Glu Arg Phe His Asn 245 250 255 Glu Asn Val Phe Tyr Ser Asn Ile Asn Arg Lys Met Val Arg Arg Gln 260 265 270 Gln Leu Gly Ser Pro Leu Ser Glu Phe Leu Ser Ile Val Met Val Ser 275 280 285 Phe Ile Val Trp Tyr Gly Gly Arg Leu Ile Ile Ser His Gln Pro Gly 290 295 300 Ala Leu Ser Thr Ser Gln Phe Ile Ala Tyr Ile Ala Ile Phe Ser Gln 305 310 315 320 Val Met Arg Pro Ala Lys Ala Leu Thr Asp Ser Phe Ser Gly Ile His 325 330 335 Thr Gly Ile Ala Ala Gly Glu Arg Val Leu Asp Leu Ile Asp Thr Lys 340 345 350 Ala Glu Gln Ile Asn Lys Pro Asp Ala Lys Glu Ile Ser Ser Phe Asn 355 360 365 Asn Ser Leu Val Phe Glu Asn Val Ser Phe Ser Tyr Glu Ser Lys Glu 370 375 380 Val Leu Lys Asn Ile Asn Leu Thr Ile Gln Lys Gly Lys Thr Ile Ala 385 390 395 400 Leu Val Gly Pro Ser Gly Gly Gly Lys Ser Thr Leu Met Asp Leu Ile 405 410 415 Pro Arg Phe His Asp Pro Lys Ser Gly Ser Ile Lys Ile Asp Gly Leu 420 425 430 Asp Tyr Ala Asp Leu Thr Val Glu Ser Ile Arg Ser Gln Leu Gly Met 435 440 445 Val Asn Gln Glu Ser Ile Leu Phe Asn Asp Thr Ile Phe Asn Asn Ile 450 455 460 Ala Phe Ala Lys Pro Asp Ala Thr Glu Ala Glu Val Ile Ala Ala Ala 465 470 475 480 Lys Ile Ala Asn Ala His Asp Phe Ile Leu Gln Thr Glu Asn Gly Tyr 485 490 495 Glu Thr Tyr Thr Gly Asp Arg Gly Asn Lys Leu Ser Gly Gly Gln Lys 500 505 510 Gln Arg Leu Cys Ile Ala Arg Ala Ile Leu Ala Asn Pro Pro Ile Met 515 520 525 Leu Leu Asp Glu Ala Thr Ser Ala Leu Asp Thr Glu Ser Glu Lys Leu 530 535 540 Val Gln Asp Ala Leu Asn Lys Leu Met Glu Asn Arg Thr Ser Leu Val 545 550 555 560 Ile Ala His Arg Leu Ser Thr Ile His Gly Ala Asp Leu Ile Val Val 565 570 575 Ile Asp Lys Gly Glu Ile Ile Glu Thr Gly Thr His Gln Glu Leu Leu 580 585 590 Ser His Asn Gly Leu Tyr Lys Lys Leu Ile Glu Leu Gln Thr Phe Ser 595 600 605 <210> 83 <211> 1731 <212> DNA <213> Verrucomicrobia bacterium CG1_02_43_26 <400> 83 atgaaaaaat tatttccata cttagtgtat ttaaaagatg tcaaaatggc atttatctta 60 gcaatcttag ccggtatctt ttatggtgca agcacgggtt taggtatccc agtgttaatc 120 cgttacttat acccaaaaat cttttcgaat gaagcaatct cggttatgac gttaacttta 180 atctgcacgt taccagtgat cgtatcggcc ttccgggctg gtgggaactt cttaaattcg 240 tattatttat catattgcgg gcagtatatc ctccaacaat tacggatcaa ggttttcgcc 300 aagatccaga acttaccaat cgcatttttc cataaacggc aaccagggga cttaatctca 360 cgtgtgagca acgatacgac gatcttgcag caaacgatca tcaatgcatc tcaagagatc 420 ctcaagcagc caatcacgtt attaggggca gtatcgtata tcgtttatat gtgttttcag 480 caaagcgatg tagtattttt aatcatcttt atcttagcaa tcccattatg catcgttcca 540 atccgttata tcgggatcaa aatgcgtaat aaagcacggg caatgcagga acaaacgtcc 600 gagttaactc accggttagc ccagaatctc tcggcagtta aagaaatccg gtcgttttgt 660 ttagaggaat acgagttatc gcgttacgaa gcagtttgcc atgttttacg ggaacgtttt 720 ttaaaagtgg ttaagtatac ttcaatctta agcccatcga tcgaagtcat cgcctcgttt 780 ggagtcgcaa tggcattttg gtattcgtat aaatcgaaga tcgagccaga tgtgtttatc 840 tcgatcgtcg gtgccttata tttatcgtat gaaccaatca agaaattagg tcgattaaac 900 tccgagatgc aacaggggct cgcatcgtta gagcgcctcg aaaatatctt agaagaacca 960 atcacgatcc atgacccagc agtacctcac ccagtcggta aattagaggg caatatccag 1020 tttaagaacg taagctttgc atatgagatg gccccagtct tacgggacgt gacggtccat 1080 ttaacggcca aaaagacgta tgcattagtc ggtccatcgg gtgctggtaa gacgactttt 1140 gctcatttaa tcccacgttt ttacgattta gcagaaggga acggttcgat cacgatcgat 1200 ggtatcaata tcaaagacat gcgattaaaa gacttacggc agaatatcgc attagtgagc 1260 caggatccag tgttatttaa tgatacgatc tataataata tcttagttgg taaaccatcg 1320 gcaagccatg aggaattaat gactgcagcc aaacgggcat ttgctcacca tttcatcctt 1380 gagctcgaga acggttatga tacgttagtt ggtgaaaatg gttcaatgtt atcgggtggc 1440 caaaaacagc gtatcgcctt agcacgtgca tttttaaagg atgccccaat cttaatctta 1500 gatgaagcaa cgagcgcatt agatgcaaat tcggagcagt taatccagca agccttagag 1560 gaattattta aagggaaaac ggtgatcatc atcgctcatc ggttttcgac gatcaagcac 1620 gccgaccgta tctttgtatt taaatcgggt gagatcatcg aagaaggcac gcatgactta 1680 ctctgcgaag ggaaaggttt atacgaagaa ctctacgcca aacagagcta g 1731 <210> 84 <211> 576 <212> PRT <213> Verrucomicrobia bacterium CG1_02_43_26 <400> 84 Met Lys Lys Leu Phe Pro Tyr Leu Val Tyr Leu Lys Asp Val Lys Met 1 5 10 15 Ala Phe Ile Leu Ala Ile Leu Ala Gly Ile Phe Tyr Gly Ala Ser Thr 20 25 30 Gly Leu Gly Ile Pro Val Leu Ile Arg Tyr Leu Tyr Pro Lys Ile Phe 35 40 45 Ser Asn Glu Ala Ile Ser Val Met Thr Leu Thr Leu Ile Cys Thr Leu 50 55 60 Pro Val Ile Val Ser Ala Phe Arg Ala Gly Gly Asn Phe Leu Asn Ser 65 70 75 80 Tyr Tyr Leu Ser Tyr Cys Gly Gln Tyr Ile Leu Gln Gln Leu Arg Ile 85 90 95 Lys Val Phe Ala Lys Ile Gln Asn Leu Pro Ile Ala Phe Phe His Lys 100 105 110 Arg Gln Pro Gly Asp Leu Ile Ser Arg Val Ser Asn Asp Thr Thr Ile 115 120 125 Leu Gln Gln Thr Ile Ile Asn Ala Ser Gln Glu Ile Leu Lys Gln Pro 130 135 140 Ile Thr Leu Leu Gly Ala Val Ser Tyr Ile Val Tyr Met Cys Phe Gln 145 150 155 160 Gln Ser Asp Val Val Phe Leu Ile Ile Phe Ile Leu Ala Ile Pro Leu 165 170 175 Cys Ile Val Pro Ile Arg Tyr Ile Gly Ile Lys Met Arg Asn Lys Ala 180 185 190 Arg Ala Met Gln Glu Gln Thr Ser Glu Leu Thr His Arg Leu Ala Gln 195 200 205 Asn Leu Ser Ala Val Lys Glu Ile Arg Ser Phe Cys Leu Glu Glu Tyr 210 215 220 Glu Leu Ser Arg Tyr Glu Ala Val Cys His Val Leu Arg Glu Arg Phe 225 230 235 240 Leu Lys Val Val Lys Tyr Thr Ser Ile Leu Ser Pro Ser Ile Glu Val 245 250 255 Ile Ala Ser Phe Gly Val Ala Met Ala Phe Trp Tyr Ser Tyr Lys Ser 260 265 270 Lys Ile Glu Pro Asp Val Phe Ile Ser Ile Val Gly Ala Leu Tyr Leu 275 280 285 Ser Tyr Glu Pro Ile Lys Lys Leu Gly Arg Leu Asn Ser Glu Met Gln 290 295 300 Gln Gly Leu Ala Ser Leu Glu Arg Leu Glu Asn Ile Leu Glu Glu Pro 305 310 315 320 Ile Thr Ile His Asp Pro Ala Val Pro His Pro Val Gly Lys Leu Glu 325 330 335 Gly Asn Ile Gln Phe Lys Asn Val Ser Phe Ala Tyr Glu Met Ala Pro 340 345 350 Val Leu Arg Asp Val Thr Val His Leu Thr Ala Lys Lys Thr Tyr Ala 355 360 365 Leu Val Gly Pro Ser Gly Ala Gly Lys Thr Thr Phe Ala His Leu Ile 370 375 380 Pro Arg Phe Tyr Asp Leu Ala Glu Gly Asn Gly Ser Ile Thr Ile Asp 385 390 395 400 Gly Ile Asn Ile Lys Asp Met Arg Leu Lys Asp Leu Arg Gln Asn Ile 405 410 415 Ala Leu Val Ser Gln Asp Pro Val Leu Phe Asn Asp Thr Ile Tyr Asn 420 425 430 Asn Ile Leu Val Gly Lys Pro Ser Ala Ser His Glu Glu Leu Met Thr 435 440 445 Ala Ala Lys Arg Ala Phe Ala His His Phe Ile Leu Glu Leu Glu Asn 450 455 460 Gly Tyr Asp Thr Leu Val Gly Glu Asn Gly Ser Met Leu Ser Gly Gly 465 470 475 480 Gln Lys Gln Arg Ile Ala Leu Ala Arg Ala Phe Leu Lys Asp Ala Pro 485 490 495 Ile Leu Ile Leu Asp Glu Ala Thr Ser Ala Leu Asp Ala Asn Ser Glu 500 505 510 Gln Leu Ile Gln Gln Ala Leu Glu Glu Leu Phe Lys Gly Lys Thr Val 515 520 525 Ile Ile Ile Ala His Arg Phe Ser Thr Ile Lys His Ala Asp Arg Ile 530 535 540 Phe Val Phe Lys Ser Gly Glu Ile Ile Glu Glu Gly Thr His Asp Leu 545 550 555 560 Leu Cys Glu Gly Lys Gly Leu Tyr Glu Glu Leu Tyr Ala Lys Gln Ser 565 570 575 <210> 85 <211> 1671 <212> DNA <213> Brachyspira hampsonii P280/1 <400> 85 atgctcttga ctctgtcttt ctaccttgtt ggcggttttg gactgttcat gtatgggctt 60 aaggtattct cggatggact gcaggagtcg acggagaatg ctctcaagga catcctgcac 120 aaggtcacgc agaacaagat cttagggatc tcgttgggct tcctgatcac cgcgatcgta 180 cagtcaagtt cggcggtcac cgtaatgacg gtttcgttcg ttaatgccaa tttgctgact 240 ttgtcgcagg caattaacat catccttggg gctaacatcg gcacgacggt cacggggtgg 300 atcatctcac tgaacatcga cgtcttagct ctgccatccc tcggaatcgg gtccatcatc 360 gtcatctttg gcagtgaaaa tcgtaagttg cgtttctttg gcgagatcct catgggattc 420 ggaatgatct tttacgggct gatcctgatg aaaacagcgt tcgagggtgt tcgtggctct 480 gaggacttcg agaaggtgtt cttaatcgcc aatgccgaca caatgtatgg tcgtttctta 540 tgtgttgtta tcgggatggt cgtaactgct atcatccaat cgagctccgc ggcccttggc 600 gtaacgatct cgctcgcatc cgtgggcctt atcgattacc ccactggcgt cgctctcatc 660 ctcggacaaa acatcggcac gactattacg gccgtattgg caacactggg tgctagcaca 720 aatgcaaagc gtgctgcttt ggtgcactgt ttgttcaaca tcttcggcgt tatctacatg 780 ttcttcctgt ttccgtacta catcaagctg gtcgacatca ttgtgggttt catgaacatc 840 ggggacccca atctggtcgt aaacaacaaa tacgttaaca tctcattcta catcgcagcc 900 gcgcacacca tgttcaacat tatcaatgtc atcgttttct actttctcac agagaagctc 960 gagaaaatcg tttgttttat tattaaggac aaagaggacg agaaacacgt gtccgtcttg 1020 tcagacaagc tgcttaacat gccagtttct gctgagatcg aggtccgtaa ggaagtaaca 1080 tacatgggag acattgcaaa gaaaatgctg gcgcgtatcg aacaactttt cgacaatcct 1140 tccgagcgtc tgctgactaa aatccgtgac cacgagaaga tgctggacaa cacggaccag 1200 gagattcacg ccttcttgct caagttactg ggcaagaaca cgttaaactc cgcaaacatt 1260 gcttcactca ttaacatctc aacatactac gaaaatcttg gcgacaatct taaggacttg 1320 ggtaaagcaa ttatcaaggg taatgagaag aaaacgagtt tcaatgagac tcaaaaggaa 1380 gatatcatca agatgctgca caacaacaag gacttcatcg actacctggc gggtctgatc 1440 ctggagtact actcacttaa caaggagaaa acttacgacg aagcaatgga gaagtaccac 1500 cagattaagg gtttctacta cgaggcccgt gagcgtcact acgacaatgt cgacaagtcg 1560 ttgatcccag cattgaatgc acacctgtat ggcgacgttc tggtctactt taatcgctcc 1620 atcggtaatc tggtcaacat tgtcgaggca atcacgggta aggacaagtg a 1671 <210> 86 <211> 556 <212> PRT <213> Brachyspira hampsonii P280/1 <400> 86 Met Leu Leu Thr Leu Ser Phe Tyr Leu Val Gly Gly Phe Gly Leu Phe 1 5 10 15 Met Tyr Gly Leu Lys Val Phe Ser Asp Gly Leu Gln Glu Ser Thr Glu 20 25 30 Asn Ala Leu Lys Asp Ile Leu His Lys Val Thr Gln Asn Lys Ile Leu 35 40 45 Gly Ile Ser Leu Gly Phe Leu Ile Thr Ala Ile Val Gln Ser Ser Ser 50 55 60 Ala Val Thr Val Met Thr Val Ser Phe Val Asn Ala Asn Leu Leu Thr 65 70 75 80 Leu Ser Gln Ala Ile Asn Ile Ile Leu Gly Ala Asn Ile Gly Thr Thr 85 90 95 Val Thr Gly Trp Ile Ile Ser Leu Asn Ile Asp Val Leu Ala Leu Pro 100 105 110 Ser Leu Gly Ile Gly Ser Ile Ile Val Ile Phe Gly Ser Glu Asn Arg 115 120 125 Lys Leu Arg Phe Phe Gly Glu Ile Leu Met Gly Phe Gly Met Ile Phe 130 135 140 Tyr Gly Leu Ile Leu Met Lys Thr Ala Phe Glu Gly Val Arg Gly Ser 145 150 155 160 Glu Asp Phe Glu Lys Val Phe Leu Ile Ala Asn Ala Asp Thr Met Tyr 165 170 175 Gly Arg Phe Leu Cys Val Val Ile Gly Met Val Val Thr Ala Ile Ile 180 185 190 Gln Ser Ser Ser Ala Ala Leu Gly Val Thr Ile Ser Leu Ala Ser Val 195 200 205 Gly Leu Ile Asp Tyr Pro Thr Gly Val Ala Leu Ile Leu Gly Gln Asn 210 215 220 Ile Gly Thr Thr Ile Thr Ala Val Leu Ala Thr Leu Gly Ala Ser Thr 225 230 235 240 Asn Ala Lys Arg Ala Ala Leu Val His Cys Leu Phe Asn Ile Phe Gly 245 250 255 Val Ile Tyr Met Phe Phe Leu Phe Pro Tyr Tyr Ile Lys Leu Val Asp 260 265 270 Ile Ile Val Gly Phe Met Asn Ile Gly Asp Pro Asn Leu Val Val Asn 275 280 285 Asn Lys Tyr Val Asn Ile Ser Phe Tyr Ile Ala Ala Ala His Thr Met 290 295 300 Phe Asn Ile Ile Asn Val Ile Val Phe Tyr Phe Leu Thr Glu Lys Leu 305 310 315 320 Glu Lys Ile Val Cys Phe Ile Ile Lys Asp Lys Glu Asp Glu Lys His 325 330 335 Val Ser Val Leu Ser Asp Lys Leu Leu Asn Met Pro Val Ser Ala Glu 340 345 350 Ile Glu Val Arg Lys Glu Val Thr Tyr Met Gly Asp Ile Ala Lys Lys 355 360 365 Met Leu Ala Arg Ile Glu Gln Leu Phe Asp Asn Pro Ser Glu Arg Leu 370 375 380 Leu Thr Lys Ile Arg Asp His Glu Lys Met Leu Asp Asn Thr Asp Gln 385 390 395 400 Glu Ile His Ala Phe Leu Leu Lys Leu Leu Gly Lys Asn Thr Leu Asn 405 410 415 Ser Ala Asn Ile Ala Ser Leu Ile Asn Ile Ser Thr Tyr Tyr Glu Asn 420 425 430 Leu Gly Asp Asn Leu Lys Asp Leu Gly Lys Ala Ile Ile Lys Gly Asn 435 440 445 Glu Lys Lys Thr Ser Phe Asn Glu Thr Gln Lys Glu Asp Ile Ile Lys 450 455 460 Met Leu His Asn Asn Lys Asp Phe Ile Asp Tyr Leu Ala Gly Leu Ile 465 470 475 480 Leu Glu Tyr Tyr Ser Leu Asn Lys Glu Lys Thr Tyr Asp Glu Ala Met 485 490 495 Glu Lys Tyr His Gln Ile Lys Gly Phe Tyr Tyr Glu Ala Arg Glu Arg 500 505 510 His Tyr Asp Asn Val Asp Lys Ser Leu Ile Pro Ala Leu Asn Ala His 515 520 525 Leu Tyr Gly Asp Val Leu Val Tyr Phe Asn Arg Ser Ile Gly Asn Leu 530 535 540 Val Asn Ile Val Glu Ala Ile Thr Gly Lys Asp Lys 545 550 555 <210> 87 <211> 1923 <212> DNA <213> Thermotoga maritima (strain ATCC 43589 / MSB8 / DSM 3109 / JCM 10099) <400> 87 atggaagaac gcgaactgac gctgagcgac atattattga tgtttaaacg ccgttcaaag 60 ctgttttggt tagttttagt tttaacggta ttcgccacgg gaatctactt atttttagcc 120 acgcctcagt atgaagcata tgcccgtgtg aaagtctcta cgcagaaggg tatgcgccta 180 ggcttatcga tagaaggctt attaggcggc ctgtcgtcgc tgttaggagg cggcggctct 240 caggaagatg agatccagat catgctgtca cgccgaaata tcatcgccgt gatcgacgaa 300 ctggatttag ttcataaact gctggacgaa aaagacatcg agaaggccaa gaaaaacgga 360 ctgacggaag atgatttaaa actgagcctg tattcttata tggttgaaaa actgatcacg 420 gtagagccag tgaaaaactc ttcgatctta gaagtcaagg ttacgtggca tgaaccaaaa 480 ttagccgccg aaatcgccaa taaaatcgtt gaaaactata cgaagatctc tgaaaatatc 540 gccaagtcgc agttaggcgc caagatggac ttcctggaag agcaaatccc aaaggttgag 600 caagaactga aagaagccga atcgaaatta aaggtcttta aagagcagaa ccgcatatac 660 agcgttgaag cccagactca ggttttaatc gaccgttatg caagcttatt gcaaaagatg 720 gaagaagccc gcatcgccat ggaagccacg cagaaacaga gcgagttctt ctctaaagaa 780 ctgaaagatc tggacatcga aatcgagcag atcaaagact cgatcacgtt tgatccaatc 840 ataagccaac tgaaatcgaa tatgatcaat atacagatcg agttagcagg cctgatggaa 900 cgatatacgg agactaaccc agcagtggtg cagaaaaaag cagaactgca ggagactcag 960 aaacagctgg aaatcgagct gaaacgctta ctgacgtccc aggtgaagaa aacgggaaac 1020 ccagtctatg aagaagccct gtcatctctg atcaaggccg agtctgagaa aatcttatac 1080 cagagccagt atgaagcctt taagaaactg tatgaggaca tggaaaaaga attatcaaaa 1140 ttaccagaac tggaacagaa attaatcgaa ctggaacgcg actataaggt gaaagaaacg 1200 atctatacga cgttattgca ggccaagtat gagagcctga tctcggaagc cgccatcacg 1260 gccaacgcca acgtcatcga ctgggccgtg ccaccattag aaccatcgaa accaaataaa 1320 aaactgacgc tggccatagg cggcgtttta ggaatctttt taggcatcct ggcagtgttc 1380 ttcgccgagt tttcagaccg ccgtatcaag agcgaatctg aagccgagta cttattagga 1440 ttagaaaaga tcgtcgcccg cgttccacta acgcagaacg aagaagtgat ggaaaaagcc 1500 ttaggcatcc cagccgtgaa atcaggcaag gttacgttta tcacggccct ggaagatggc 1560 gccggcgtgt cgacgctggc caaacatatg gccaaattac tgtcaaagaa ggaaaaggta 1620 ctactgttaa cggaagaaaa agtggaagga acttttgacc gcaaagacgt ttttgactta 1680 ttaaaaaatc cagacgttct ggaagaatta aaagagagat atgacaaaat catcgttgac 1740 gcaccatcgt taaagcgtac gccagacttc ctgccaatag ccgaaaagtc ggacacggtc 1800 tatatcgtga tccgattaga acatacgctg tcggaagatt taaaaacgct gcatactttg 1860 aagaagatcg acggttttat cttaaacgga ttaacgaaga aaaattcaac gtacgtggaa 1920 taa 1923 <210> 88 <211> 640 <212> PRT <213> Thermotoga maritima (strain ATCC 43589 / MSB8 / DSM 3109 / JCM 10099) <400> 88 Met Glu Glu Arg Glu Leu Thr Leu Ser Asp Ile Leu Leu Met Phe Lys 1 5 10 15 Arg Arg Ser Lys Leu Phe Trp Leu Val Leu Val Leu Thr Val Phe Ala 20 25 30 Thr Gly Ile Tyr Leu Phe Leu Ala Thr Pro Gln Tyr Glu Ala Tyr Ala 35 40 45 Arg Val Lys Val Ser Thr Gln Lys Gly Met Arg Leu Gly Leu Ser Ile 50 55 60 Glu Gly Leu Leu Gly Gly Leu Ser Ser Leu Leu Gly Gly Gly Gly Ser 65 70 75 80 Gln Glu Asp Glu Ile Gln Ile Met Leu Ser Arg Arg Asn Ile Ile Ala 85 90 95 Val Ile Asp Glu Leu Asp Leu Val His Lys Leu Leu Asp Glu Lys Asp 100 105 110 Ile Glu Lys Ala Lys Lys Asn Gly Leu Thr Glu Asp Asp Leu Lys Leu 115 120 125 Ser Leu Tyr Ser Tyr Met Val Glu Lys Leu Ile Thr Val Glu Pro Val 130 135 140 Lys Asn Ser Ser Ile Leu Glu Val Lys Val Thr Trp His Glu Pro Lys 145 150 155 160 Leu Ala Ala Glu Ile Ala Asn Lys Ile Val Glu Asn Tyr Thr Lys Ile 165 170 175 Ser Glu Asn Ile Ala Lys Ser Gln Leu Gly Ala Lys Met Asp Phe Leu 180 185 190 Glu Glu Gln Ile Pro Lys Val Glu Gln Glu Leu Lys Glu Ala Glu Ser 195 200 205 Lys Leu Lys Val Phe Lys Glu Gln Asn Arg Ile Tyr Ser Val Glu Ala 210 215 220 Gln Thr Gln Val Leu Ile Asp Arg Tyr Ala Ser Leu Leu Gln Lys Met 225 230 235 240 Glu Glu Ala Arg Ile Ala Met Glu Ala Thr Gln Lys Gln Ser Glu Phe 245 250 255 Phe Ser Lys Glu Leu Lys Asp Leu Asp Ile Glu Ile Glu Gln Ile Lys 260 265 270 Asp Ser Ile Thr Phe Asp Pro Ile Ile Ser Gln Leu Lys Ser Asn Met 275 280 285 Ile Asn Ile Gln Ile Glu Leu Ala Gly Leu Met Glu Arg Tyr Thr Glu 290 295 300 Thr Asn Pro Ala Val Val Gln Lys Lys Ala Glu Leu Gln Glu Thr Gln 305 310 315 320 Lys Gln Leu Glu Ile Glu Leu Lys Arg Leu Leu Thr Ser Gln Val Lys 325 330 335 Lys Thr Gly Asn Pro Val Tyr Glu Glu Ala Leu Ser Ser Leu Ile Lys 340 345 350 Ala Glu Ser Glu Lys Ile Leu Tyr Gln Ser Gln Tyr Glu Ala Phe Lys 355 360 365 Lys Leu Tyr Glu Asp Met Glu Lys Glu Leu Ser Lys Leu Pro Glu Leu 370 375 380 Glu Gln Lys Leu Ile Glu Leu Glu Arg Asp Tyr Lys Val Lys Glu Thr 385 390 395 400 Ile Tyr Thr Thr Leu Leu Gln Ala Lys Tyr Glu Ser Leu Ile Ser Glu 405 410 415 Ala Ala Ile Thr Ala Asn Ala Asn Val Ile Asp Trp Ala Val Pro Pro 420 425 430 Leu Glu Pro Ser Lys Pro Asn Lys Lys Leu Thr Leu Ala Ile Gly Gly 435 440 445 Val Leu Gly Ile Phe Leu Gly Ile Leu Ala Val Phe Phe Ala Glu Phe 450 455 460 Ser Asp Arg Arg Ile Lys Ser Glu Ser Glu Ala Glu Tyr Leu Leu Gly 465 470 475 480 Leu Glu Lys Ile Val Ala Arg Val Pro Leu Thr Gln Asn Glu Glu Val 485 490 495 Met Glu Lys Ala Leu Gly Ile Pro Ala Val Lys Ser Gly Lys Val Thr 500 505 510 Phe Ile Thr Ala Leu Glu Asp Gly Ala Gly Val Ser Thr Leu Ala Lys 515 520 525 His Met Ala Lys Leu Leu Ser Lys Lys Glu Lys Val Leu Leu Leu Thr 530 535 540 Glu Glu Lys Val Glu Gly Thr Phe Asp Arg Lys Asp Val Phe Asp Leu 545 550 555 560 Leu Lys Asn Pro Asp Val Leu Glu Glu Leu Lys Glu Arg Tyr Asp Lys 565 570 575 Ile Ile Val Asp Ala Pro Ser Leu Lys Arg Thr Pro Asp Phe Leu Pro 580 585 590 Ile Ala Glu Lys Ser Asp Thr Val Tyr Ile Val Ile Arg Leu Glu His 595 600 605 Thr Leu Ser Glu Asp Leu Lys Thr Leu His Thr Leu Lys Lys Ile Asp 610 615 620 Gly Phe Ile Leu Asn Gly Leu Thr Lys Lys Asn Ser Thr Tyr Val Glu 625 630 635 640 <210> 89 <211> 747 <212> DNA <213> Clostridium sp. CAG:1013 <400> 89 atgtatgtgt tagaggcgtg tgtagatagc ctggatagcg cactggctgc aaaggaaggg 60 ggagcgaccc gcctggaatt gtgcgcgaat ttaattattg ggggcactac cccggcgctg 120 agcttagtgg aatgggtgaa aagagacact gcactgccag tccatgtact gctgcgccca 180 cgctttggtg attttttgta taccgaagaa gagttcagca tgatgctgga agatgccgcg 240 gcgctgctgg accgaggggc agatgcgatt gtgagcggat ttttgactcc agagggagat 300 ctggatctgt tgcggatgga aaagatggtt gaactgtgcc ataagagagg gaaacggttt 360 actcttcatc gagcgtttga cgcatgccgc gacccgtttc tggcattaga gcagtgccgc 420 gagttaggag tggacactgt gttgaccagc ggccagaaga atacctgcct ggaagggctt 480 ccgctgctga aggaactgtg ggaaaagaga ggagatgtgg aactgttgat aggggcagga 540 gtggacgcag aggcgatacg gcgcattcgg gaagagctgc cgcaggcgag aagctttcat 600 atgagcggca agaaagttgt ggagagcgca atgacttatc ggaaggacgg agtaagcatg 660 ggactgccgg cgttttcaga gtatactttg tggcgaactg acccagagaa attgcgggca 720 gcagggaaag agttaatgcg gcagtaa 747 <210> 90 <211> 248 <212> PRT <213> Clostridium sp. CAG:1013 <400> 90 Met Tyr Val Leu Glu Ala Cys Val Asp Ser Leu Asp Ser Ala Leu Ala 1 5 10 15 Ala Lys Glu Gly Gly Ala Thr Arg Leu Glu Leu Cys Ala Asn Leu Ile 20 25 30 Ile Gly Gly Thr Thr Pro Ala Leu Ser Leu Val Glu Trp Val Lys Arg 35 40 45 Asp Thr Ala Leu Pro Val His Val Leu Leu Arg Pro Arg Phe Gly Asp 50 55 60 Phe Leu Tyr Thr Glu Glu Glu Phe Ser Met Met Leu Glu Asp Ala Ala 65 70 75 80 Ala Leu Leu Asp Arg Gly Ala Asp Ala Ile Val Ser Gly Phe Leu Thr 85 90 95 Pro Glu Gly Asp Leu Asp Leu Leu Arg Met Glu Lys Met Val Glu Leu 100 105 110 Cys His Lys Arg Gly Lys Arg Phe Thr Leu His Arg Ala Phe Asp Ala 115 120 125 Cys Arg Asp Pro Phe Leu Ala Leu Glu Gln Cys Arg Glu Leu Gly Val 130 135 140 Asp Thr Val Leu Thr Ser Gly Gln Lys Asn Thr Cys Leu Glu Gly Leu 145 150 155 160 Pro Leu Leu Lys Glu Leu Trp Glu Lys Arg Gly Asp Val Glu Leu Leu 165 170 175 Ile Gly Ala Gly Val Asp Ala Glu Ala Ile Arg Arg Ile Arg Glu Glu 180 185 190 Leu Pro Gln Ala Arg Ser Phe His Met Ser Gly Lys Lys Val Val Glu 195 200 205 Ser Ala Met Thr Tyr Arg Lys Asp Gly Val Ser Met Gly Leu Pro Ala 210 215 220 Phe Ser Glu Tyr Thr Leu Trp Arg Thr Asp Pro Glu Lys Leu Arg Ala 225 230 235 240 Ala Gly Lys Glu Leu Met Arg Gln 245 <210> 91 <211> 750 <212> DNA <213> Odoribacter splanchnicus DSM 20712 <400> 91 atgcgacgtc aggattttaa aatagaagtc tgcacgaact cggttgagtc ggttcgagcg 60 gcgctcgctg gtggggcaga tcgtatagag ctctgcgcgg gcatgccaga gggcggcacg 120 acgccatcgt atggtgagat ctgcttagtt cgagagttaa tgccagcagg gatgcatgtt 180 atcgttcgtc cccgaggggg cgatttccta taccgtgagg atgaactcga agttatgtac 240 cgggatatag aaatggcacg aaaattaggt gtcgatggcg tcgtcttagg ttgcttaacg 300 cgtgaaggcg aagttgacga aggagtcatg cggaaattaa tggccgcgtg tggcgaaatg 360 tcggttacgt ttcaccgtgc gttcgatatg tgtcgtgatc catttcaggc gttgcagacg 420 atcgaaaagc ttgggtgcgc acgaatctta acgtcgggcc aatcgaactc ggccgaaact 480 ggcgttccat tattaaaaga attagttgcg cgtgcgcgta atgttatcat catgccaggg 540 tgcggagtca acgctgcgaa cgttcgtaag atcgcggaat ctacgggtgc gttcgaattc 600 catctctcgg cgcgtatccg gcttgggtct gatatggtct atcggaaccc ggccgtatca 660 atgggcggca cggttcaagt tgatgagtac ggccgtgaag tttcgtcgtc tgagaaagtt 720 gaagaagtta tccgtcggtt agagtactga 750 <210> 92 <211> 249 <212> PRT <213> Odoribacter splanchnicus DSM 20712 <400> 92 Met Arg Arg Gln Asp Phe Lys Ile Glu Val Cys Thr Asn Ser Val Glu 1 5 10 15 Ser Val Arg Ala Ala Leu Ala Gly Gly Ala Asp Arg Ile Glu Leu Cys 20 25 30 Ala Gly Met Pro Glu Gly Gly Thr Thr Pro Ser Tyr Gly Glu Ile Cys 35 40 45 Leu Val Arg Glu Leu Met Pro Ala Gly Met His Val Ile Val Arg Pro 50 55 60 Arg Gly Gly Asp Phe Leu Tyr Arg Glu Asp Glu Leu Glu Val Met Tyr 65 70 75 80 Arg Asp Ile Glu Met Ala Arg Lys Leu Gly Val Asp Gly Val Val Leu 85 90 95 Gly Cys Leu Thr Arg Glu Gly Glu Val Asp Glu Gly Val Met Arg Lys 100 105 110 Leu Met Ala Ala Cys Gly Glu Met Ser Val Thr Phe His Arg Ala Phe 115 120 125 Asp Met Cys Arg Asp Pro Phe Gln Ala Leu Gln Thr Ile Glu Lys Leu 130 135 140 Gly Cys Ala Arg Ile Leu Thr Ser Gly Gln Ser Asn Ser Ala Glu Thr 145 150 155 160 Gly Val Pro Leu Leu Lys Glu Leu Val Ala Arg Ala Arg Asn Val Ile 165 170 175 Ile Met Pro Gly Cys Gly Val Asn Ala Ala Asn Val Arg Lys Ile Ala 180 185 190 Glu Ser Thr Gly Ala Phe Glu Phe His Leu Ser Ala Arg Ile Arg Leu 195 200 205 Gly Ser Asp Met Val Tyr Arg Asn Pro Ala Val Ser Met Gly Gly Thr 210 215 220 Val Gln Val Asp Glu Tyr Gly Arg Glu Val Ser Ser Ser Glu Lys Val 225 230 235 240 Glu Glu Val Ile Arg Arg Leu Glu Tyr 245 <210> 93 <211> 702 <212> DNA <213> Mitsuaria sp. PDC51 <400> 93 atgactgggg ctccgttatt catcgaagtt atcgccttga ctgctcgcga cgcctgtgag 60 gcagaggcag ccggggcaga ccgtatcgag ttagtcagtg acatggcaca aggcggcctg 120 actccgtctg cccaggttgt ggacgaggta gtacgtcaat gtcgcttgcc tgtcatggta 180 atggtccgtc cgcacgcccg cagcttctgt tacgacgagg cagacatgcg tcaagtacgt 240 gaaggggttg caatggtacg tgacgctggt gcccatggac ttgtctttgg ggcgttaaca 300 gctgatgggg acatcgaccg tgcagctctc gaccaagtct tacgttgggc ggatgggctt 360 cccttaacgt tccatcgtgc attcgacgag gcccgtgatc ccgtacgtgc cttctcagag 420 ctctcagctt atcgtggtgc cgtcacgcag ctgttgtcat ctggcggagc acctatcgca 480 gaagagggag cggaattact tgcacagctg gtaacgcgtt ggcgccttgg tgagggtgta 540 gagcctctgg ttggggcggg agttcacgca ggaaatttag cagcattaca tcgtcgtatc 600 ggtgcccgtc aataccacgt tgggagtgga gctcgcgccg gcggaagttt cgcctcaggg 660 atcgacgcag ctcgtatcgc tgcactccgc caagccttat ga 702 <210> 94 <211> 233 <212> PRT <213> Mitsuaria sp. PDC51 <400> 94 Met Thr Gly Ala Pro Leu Phe Ile Glu Val Ile Ala Leu Thr Ala Arg 1 5 10 15 Asp Ala Cys Glu Ala Glu Ala Ala Gly Ala Asp Arg Ile Glu Leu Val 20 25 30 Ser Asp Met Ala Gln Gly Gly Leu Thr Pro Ser Ala Gln Val Val Asp 35 40 45 Glu Val Val Arg Gln Cys Arg Leu Pro Val Met Val Met Val Arg Pro 50 55 60 His Ala Arg Ser Phe Cys Tyr Asp Glu Ala Asp Met Arg Gln Val Arg 65 70 75 80 Glu Gly Val Ala Met Val Arg Asp Ala Gly Ala His Gly Leu Val Phe 85 90 95 Gly Ala Leu Thr Ala Asp Gly Asp Ile Asp Arg Ala Ala Leu Asp Gln 100 105 110 Val Leu Arg Trp Ala Asp Gly Leu Pro Leu Thr Phe His Arg Ala Phe 115 120 125 Asp Glu Ala Arg Asp Pro Val Arg Ala Phe Ser Glu Leu Ser Ala Tyr 130 135 140 Arg Gly Ala Val Thr Gln Leu Leu Ser Ser Gly Gly Ala Pro Ile Ala 145 150 155 160 Glu Glu Gly Ala Glu Leu Leu Ala Gln Leu Val Thr Arg Trp Arg Leu 165 170 175 Gly Glu Gly Val Glu Pro Leu Val Gly Ala Gly Val His Ala Gly Asn 180 185 190 Leu Ala Ala Leu His Arg Arg Ile Gly Ala Arg Gln Tyr His Val Gly 195 200 205 Ser Gly Ala Arg Ala Gly Gly Ser Phe Ala Ser Gly Ile Asp Ala Ala 210 215 220 Arg Ile Ala Ala Leu Arg Gln Ala Leu 225 230 <210> 95 <211> 678 <212> DNA <213> Prevotella intermedia ATCC 25611 (DSM 20706) <400> 95 atgcccattc tagaagtgtg cacgggcagc ttgcagagcg tgatgaacgc agttaaaggc 60 ggcgcgcaac gtattgaact gtgttcagca ttaagcctgg atggcttaac gccgagcttg 120 ggcctgatta aaactgttcg tacgttattt ccggaattaa ccatccatgc gctgatacgt 180 gttcgtgaag gcgacttctg ttataccgaa gaagaagtaa aagcgatgga aaccgatatc 240 aaagcagttc tgccgtatgc agacgctatc gtgtgcggcg cgcttaccgc ggacggcgat 300 attgatatcg cgaccacgcg tcggttaatc gatgcatgcg aaggcaaacc gtttactttt 360 catcgtgctt tcgacgtgtg ccgtaacccg ttaaaagcgt tagatgaatt agcggcgctt 420 cattgcacgc gtgttttaac gagcggccag accccgactg cagaagcggg cattccggcg 480 ttgaaagaat acgttaaaca tactgaaggc cgtatgacca tattgccggg cggcggcgtg 540 actccgttaa atgctaagaa gattttagcg gaaacgggag caaccgagat tcatggaagc 600 gcgagcggca ttgcggaaaa cggccgtaaa gaaactctga ccgaagttgt tgcgcaaatc 660 ctgcaggaaa ttaaataa 678 <210> 96 <211> 225 <212> PRT <213> Prevotella intermedia ATCC 25611 (DSM 20706) <400> 96 Met Pro Ile Leu Glu Val Cys Thr Gly Ser Leu Gln Ser Val Ile Asn 1 5 10 15 Ala Val Lys Gly Gly Ala Gln Arg Ile Glu Leu Cys Ser Ala Leu Ser 20 25 30 Leu Asp Gly Leu Thr Pro Ser Leu Gly Leu Ile Lys Thr Val Arg Thr 35 40 45 Leu Phe Pro Glu Leu Thr Ile His Ala Leu Ile Arg Val Arg Glu Gly 50 55 60 Asp Phe Cys Tyr Thr Glu Glu Glu Val Lys Ala Met Glu Thr Asp Ile 65 70 75 80 Lys Ala Val Leu Pro Tyr Ala Asp Ala Ile Val Cys Gly Ala Leu Thr 85 90 95 Thr Asp Gly Asp Ile Asp Ile Ala Thr Thr Arg Arg Leu Ile Asp Ala 100 105 110 Cys Glu Gly Lys Pro Phe Thr Phe His Arg Ala Phe Asp Val Cys Arg 115 120 125 Asn Pro Leu Lys Ala Leu Asp Glu Leu Ala Val Leu Asn Cys Thr Arg 130 135 140 Val Leu Thr Ser Gly Gln Ala Thr Thr Ala Glu Ala Gly Ile Pro Ala 145 150 155 160 Leu Lys Glu Tyr Ile Lys His Thr Glu Gly His Met Thr Ile Leu Pro 165 170 175 Gly Gly Gly Val Thr Pro Leu Asn Ala Lys Lys Ile Ile Ala Glu Thr 180 185 190 Gly Ala Thr Glu Ile His Gly Ser Ala Ser Gly Met Thr Glu Ser Gly 195 200 205 Arg Lys Glu Thr Leu Thr Glu Val Val Val Gln Ile Leu Gln Glu Ile 210 215 220 Lys 225 <210> 97 <211> 1719 <212> DNA <213> Actinobaculum suis DSM 20639 <400> 97 atgggcaaat ctcaagaaag cattagcttt aaagagaaat tcgcttacgg tatgggtgac 60 gctgccactg cctttagtgc agtaagcgtt gccagcttct caatgtttta tttcactgat 120 tacgtaggcg tgagtgcgac cgctctcggc acggtgctga tcttcacgcg cgttttcgat 180 gcaatcacca acattattat gggttacgtt gtggaccaga ctcgtaccaa agagggtaaa 240 gcacgtccct gggttaaatg ggcaatcctg cccatgtttg cagctctggt tgcggtcttt 300 gcaattccaa cgggaatgtc ctctaccgca accattgtat ggattacgat tgtggtgaac 360 atctactact tggtctacac tattagcaac atcccctatg ggacccttgg gaccctgatc 420 tcacgtgatc cacaggttcg ctccgagctc acgctgctgc gtatgattgg ataccacgga 480 gtgagcatcc tgctgtcctt tatcacggtc ggtttggttg cctacctggg tggtgggagc 540 aaccgtggct ggatctacac catggttatc tatggtgcca ttatgtcgat tatcttctac 600 tttacctaca gttgtacacg tgagcgcgtc cgctcaacga gtgagatgcg ccgtgatgcc 660 gaacgtgctg cggccgcaga gtccggtgcc gcaaatagta caccacctaa tggtggtcct 720 gaggctggta cgggcacggc acctgcgaag tctgccggtg ctactggaac tgcgccggca 780 aaacctgctc cggcaaaacg tctgggaatc tttgccagca ttggtttgct gttccgtaac 840 aaatactgga tccttatttt cttgatcatg attctgactt ggatcttggt taacctgttt 900 ggtggtgtaa atgtctatta cgctcgtcac atccttggtg acgccaacta cgtcggtgtt 960 cttaacgcag catttacggg agcgcaaatc gtaggtttct ttctggtgag tattcctatc 1020 cgccgctttg gtcgccgccg tactattgta ttcgggcttg ggatgatcat cgtgggctct 1080 ttactggtcc tgacggggcc ccagaacatc tacgtcctgg ctgtagcaag catcatccgt 1140 ggactcggct tttctcctct catgggtact gcatacgcca tgctcgcgga tgtgattgac 1200 tacggtgagt ggaagaatgg tgtccgcaat gaggggatct cttattctgg tggtaccttt 1260 tctaccactg tggggagtgg attggccagc tcggggatcg tctggatcat gggtgcggcg 1320 ggatacatct cagcaaagga cgcagtccag cctgcatctg tactggagtc cattcagttc 1380 ctgttctcgt gggcacccgt tatcatcgca gcattgctgc tcgtactgtt ctacttctac 1440 gaccttgaca ccttctaccc cgagatcgcg cgtgaccttg aacaaggcat taccctgaaa 1500 gatcgtgaga aagatgccgc acgtcaggcg caccacgtgt cgggagttga gccggcgcac 1560 cctgatcacc accaaaacaa tcccgagagc cctgcgggaa gtactcagac tagcgcacag 1620 acaggaacgc agacttctac caaataccgt actgagaagg gcgggcagaa tcgtacaaat 1680 tacagtaccg agagtgaagc cggcaacgcg gttgaataa 1719 <210> 98 <211> 572 <212> PRT <213> Actinobaculum suis DSM 20639 <400> 98 Met Gly Lys Ser Gln Glu Ser Ile Ser Phe Lys Glu Lys Phe Ala Tyr 1 5 10 15 Gly Met Gly Asp Ala Ala Thr Ala Phe Ser Ala Val Ser Val Ala Ser 20 25 30 Phe Ser Met Phe Tyr Phe Thr Asp Tyr Val Gly Val Ser Ala Thr Ala 35 40 45 Leu Gly Thr Val Leu Ile Phe Thr Arg Val Phe Asp Ala Ile Thr Asn 50 55 60 Ile Ile Met Gly Tyr Val Val Asp Gln Thr Arg Thr Lys Glu Gly Lys 65 70 75 80 Ala Arg Pro Trp Val Lys Trp Ala Ile Leu Pro Met Phe Ala Ala Leu 85 90 95 Val Ala Val Phe Ala Ile Pro Thr Gly Met Ser Ser Thr Ala Thr Ile 100 105 110 Val Trp Ile Thr Ile Val Val Asn Ile Tyr Tyr Leu Val Tyr Thr Ile 115 120 125 Ser Asn Ile Pro Tyr Gly Thr Leu Gly Thr Leu Ile Ser Arg Asp Pro 130 135 140 Gln Val Arg Ser Glu Leu Thr Leu Leu Arg Met Ile Gly Tyr His Gly 145 150 155 160 Val Ser Ile Leu Leu Ser Phe Ile Thr Val Gly Leu Val Ala Tyr Leu 165 170 175 Gly Gly Gly Ser Asn Arg Gly Trp Ile Tyr Thr Met Val Ile Tyr Gly 180 185 190 Ala Ile Met Ser Ile Ile Phe Tyr Phe Thr Tyr Ser Cys Thr Arg Glu 195 200 205 Arg Val Arg Ser Thr Ser Glu Met Arg Arg Asp Ala Glu Arg Ala Ala 210 215 220 Ala Ala Glu Ser Gly Ala Ala Asn Ser Thr Pro Pro Asn Gly Gly Pro 225 230 235 240 Glu Ala Gly Thr Gly Thr Ala Pro Ala Lys Ser Ala Gly Ala Thr Gly 245 250 255 Thr Ala Pro Ala Lys Pro Ala Pro Ala Lys Arg Leu Gly Ile Phe Ala 260 265 270 Ser Ile Gly Leu Leu Phe Arg Asn Lys Tyr Trp Ile Leu Ile Phe Leu 275 280 285 Ile Met Ile Leu Thr Trp Ile Leu Val Asn Leu Phe Gly Gly Val Asn 290 295 300 Val Tyr Tyr Ala Arg His Ile Leu Gly Asp Ala Asn Tyr Val Gly Val 305 310 315 320 Leu Asn Ala Ala Phe Thr Gly Ala Gln Ile Val Gly Phe Phe Leu Val 325 330 335 Ser Ile Pro Ile Arg Arg Phe Gly Arg Arg Arg Thr Ile Val Phe Gly 340 345 350 Leu Gly Met Ile Ile Val Gly Ser Leu Leu Val Leu Thr Gly Pro Gln 355 360 365 Asn Ile Tyr Val Leu Ala Val Ala Ser Ile Ile Arg Gly Leu Gly Phe 370 375 380 Ser Pro Leu Met Gly Thr Ala Tyr Ala Met Leu Ala Asp Val Ile Asp 385 390 395 400 Tyr Gly Glu Trp Lys Asn Gly Val Arg Asn Glu Gly Ile Ser Tyr Ser 405 410 415 Gly Gly Thr Phe Ser Thr Thr Val Gly Ser Gly Leu Ala Ser Ser Gly 420 425 430 Ile Val Trp Ile Met Gly Ala Ala Gly Tyr Ile Ser Ala Lys Asp Ala 435 440 445 Val Gln Pro Ala Ser Val Leu Glu Ser Ile Gln Phe Leu Phe Ser Trp 450 455 460 Ala Pro Val Ile Ile Ala Ala Leu Leu Leu Val Leu Phe Tyr Phe Tyr 465 470 475 480 Asp Leu Asp Thr Phe Tyr Pro Glu Ile Ala Arg Asp Leu Glu Gln Gly 485 490 495 Ile Thr Leu Lys Asp Arg Glu Lys Asp Ala Ala Arg Gln Ala His His 500 505 510 Val Ser Gly Val Glu Pro Ala His Pro Asp His His Gln Asn Asn Pro 515 520 525 Glu Ser Pro Ala Gly Ser Thr Gln Thr Ser Ala Gln Thr Gly Thr Gln 530 535 540 Thr Ser Thr Lys Tyr Arg Thr Glu Lys Gly Gly Gln Asn Arg Thr Asn 545 550 555 560 Tyr Ser Thr Glu Ser Glu Ala Gly Asn Ala Val Glu 565 570 <210> 99 <211> 1362 <212> DNA <213> Ruminococcus gnavus <400> 99 atggagaaga aacgttatct caagtggtac aacaaagtgg gctacggctc tggtgacctg 60 gcagggaatg tcgtttacgc tttcttatct tcttttgtta tgctgtactt gacgaacact 120 gtcggcctta atccgggcat tattggaacc ctgattatgg tgtctaaact tttcgatggg 180 attagtgaca tgttcttcgg aaccatgatt gataagacaa agagtaagtt gggtaaggcc 240 cgtccgtgga tgttatacgc gtacattggc tgtgcggtta cactggttgc caacttcgca 300 attcctgatt ccttggggac gacggcgcaa tatgcctggt tcttcattgc ctatacactt 360 ttgaatgcgg ttttcttcac cgctaacaac attgcctacg catcactggt aactttctgt 420 acgaagaact ctcgtgagcg tgtggaaatg ggtagttggc gcttcatttt cgcattctct 480 acatcattac ttattcaatc cgtaacggta caattcgttc gtgcagctgg tggtggggca 540 gcggcatggc gtacggttgc tgtcgtttac gcaattattg gactgattgt caacacgatt 600 tcggttttct caattaagga acttccggaa gaggagttga aggcgggaaa ggatcatacg 660 gaagagaagt actcgctggt agaagcagca aagctgttat tcagtaacaa gtactacctg 720 atgatttgtg cgacctacat ctgtcagcaa atttacagcg cgatgttaaa catgggtatc 780 tactatatga tttacattct gaagaatgag aatttgtaca gcgtgttctc gtgggccatt 840 aacattccgg tgattattgc catgtgcatt acgccgatgc tcgtcgagaa aatgaagggc 900 ttgtaccgta tgaatctggc cggttacatt ctgggtacag caggacgtgt cggcgtaatt 960 ttcgcagggt acatgggctc agtaccgctt atgttggcct ttacggcagt cgctgccctg 1020 ggtatggcac cgtggcaagg tgatatggga gcagtggtag catcatgtag tgagtacacg 1080 tatctgacga agcacaagca tattgatggt actatgtaca gctgtacgtc tttcggaacg 1140 aagattggtg gtggtattgg ggttgctctg tgtggatggt tgctggacgc ctcagggttc 1200 gttaaggaag ccactattca acccgagtca tgccttaaca tgcttcacgt tatgtacttg 1260 tggattccga tggtactcag tctgattatt acgttcatta tgagtcgtat gaatgtcgag 1320 gacgccaatg agaaactgcg taagcaactg gaagaatgtt ga 1362 <210> 100 <211> 453 <212> PRT <213> Ruminococcus gnavus <400> 100 Met Glu Lys Lys Arg Tyr Leu Lys Trp Tyr Asn Lys Val Gly Tyr Gly 1 5 10 15 Ser Gly Asp Leu Ala Gly Asn Val Val Tyr Ala Phe Leu Ser Ser Phe 20 25 30 Val Met Leu Tyr Leu Thr Asn Thr Val Gly Leu Asn Pro Gly Ile Ile 35 40 45 Gly Thr Leu Ile Met Val Ser Lys Leu Phe Asp Gly Ile Ser Asp Met 50 55 60 Phe Phe Gly Thr Met Ile Asp Lys Thr Lys Ser Lys Leu Gly Lys Ala 65 70 75 80 Arg Pro Trp Met Leu Tyr Ala Tyr Ile Gly Cys Ala Val Thr Leu Val 85 90 95 Ala Asn Phe Ala Ile Pro Asp Ser Leu Gly Thr Thr Ala Gln Tyr Ala 100 105 110 Trp Phe Phe Ile Ala Tyr Thr Leu Leu Asn Ala Val Phe Phe Thr Ala 115 120 125 Asn Asn Ile Ala Tyr Ala Ser Leu Val Thr Phe Cys Thr Lys Asn Ser 130 135 140 Arg Glu Arg Val Glu Met Gly Ser Trp Arg Phe Ile Phe Ala Phe Ser 145 150 155 160 Thr Ser Leu Leu Ile Gln Ser Val Thr Val Gln Phe Val Arg Ala Ala 165 170 175 Gly Gly Gly Ala Ala Ala Trp Arg Thr Val Ala Val Val Tyr Ala Ile 180 185 190 Ile Gly Leu Ile Val Asn Thr Ile Ser Val Phe Ser Ile Lys Glu Leu 195 200 205 Pro Glu Glu Glu Leu Lys Ala Gly Lys Asp His Thr Glu Glu Lys Tyr 210 215 220 Ser Leu Val Glu Ala Ala Lys Leu Leu Phe Ser Asn Lys Tyr Tyr Leu 225 230 235 240 Met Ile Cys Ala Thr Tyr Ile Cys Gln Gln Ile Tyr Ser Ala Met Leu 245 250 255 Asn Met Gly Ile Tyr Tyr Met Ile Tyr Ile Leu Lys Asn Glu Asn Leu 260 265 270 Tyr Ser Val Phe Ser Trp Ala Ile Asn Ile Pro Val Ile Ile Ala Met 275 280 285 Cys Ile Thr Pro Met Leu Val Glu Lys Met Lys Gly Leu Tyr Arg Met 290 295 300 Asn Leu Ala Gly Tyr Ile Leu Gly Thr Ala Gly Arg Val Gly Val Ile 305 310 315 320 Phe Ala Gly Tyr Met Gly Ser Val Pro Leu Met Leu Ala Phe Thr Ala 325 330 335 Val Ala Ala Leu Gly Met Ala Pro Trp Gln Gly Asp Met Gly Ala Val 340 345 350 Val Ala Ser Cys Ser Glu Tyr Thr Tyr Leu Thr Lys His Lys His Ile 355 360 365 Asp Gly Thr Met Tyr Ser Cys Thr Ser Phe Gly Thr Lys Ile Gly Gly 370 375 380 Gly Ile Gly Val Ala Leu Cys Gly Trp Leu Leu Asp Ala Ser Gly Phe 385 390 395 400 Val Lys Glu Ala Thr Ile Gln Pro Glu Ser Cys Leu Asn Met Leu His 405 410 415 Val Met Tyr Leu Trp Ile Pro Met Val Leu Ser Leu Ile Ile Thr Phe 420 425 430 Ile Met Ser Arg Met Asn Val Glu Asp Ala Asn Glu Lys Leu Arg Lys 435 440 445 Gln Leu Glu Glu Cys 450 <210> 101 <211> 2061 <212> DNA <213> Curtobacterium sp. 314Chir4.1 <400> 101 atgtcaactg cgaccgctcc agttgaagtg cagcgcggac ggcagtcgag cccggccggc 60 cagccaggga aaccgattat gagccatcgc cagattctgc tggtgattta tggcctgatg 120 gccggcatgt ttctgagcag cctggatcag accattgtgg ggaccgcgat tcgcaccatt 180 ggtgatgatc tgcatggcct ggatcagcag gcctgggtga ccaccgcgta tctgattgcg 240 tcgaccatta ccaccccgat ttatggcaaa ctgagcgatg tgtttgggcg ccggccgctg 300 tatatttttg gcattgcggt gtttattctg ggcagcctgc tgagcaccat gagcaccagc 360 atgattatgc tggccgcgtt tcgagcgttt cagggcattg gcgccggggc gctgatgagc 420 ctgccgctgg cgattatggg cgatattctg gcgccgcggg aacgcgcgaa atatcaaggg 480 tattttttag cggtgtttgg cattagcagc gtgattggcc cgctgattgg cgggctgttt 540 gcgggcgcga gctcgattct gggcattacc ggctggcgct gggtttttct gattaacgtg 600 ccgattggcg tggctgctct gctgatggtg attgcgtttc tgcatctgcc gaaatttggc 660 gatgcgaaag cgaaaccgcg cattgattgg tggggcgcga ccagcgtgat tgtgaccctg 720 gtgccgctgc tgttagtggc cgagcagggc cgcacctggg gctggggcag cgcgggcgcg 780 attgcgtgct atgtgattgg cgcgctgggc ctggttgcgt ttctggtgat tgaaaccctg 840 atgaaagatg atgcgattat tccgctgaaa ctgtttcgca gcggagtgtt tagcatggcg 900 accattctgg gctttttagt gggctttgcg atgtttggcg cgatgctgac cattccgctg 960 tatctgcaga ttgtgaccgg gctgaccccg accgaaagcg gctttgcgac cctgccgatg 1020 attggtgggc tgatgattgc gagcattgcg agcgggcaga ttgtggcgcg caccggcaaa 1080 tatcgtattt ttccggtgat tggcaccgcg ctggtgagca ttggctatgt ggtgctgacc 1140 tttatgacca ttgataaacc gctgtggttt ctgatgattg gcatgtttct gattggcctg 1200 ggcctgggcc agctgatgca gtcgattacc ctggcgagcc agaatagcgt gcagccgcgc 1260 gatatgggag tggcgacctc gagcgcgacc ttttttcgcc agattggggg aaccctgggc 1320 accgcggtgc tgctgtcggt gctgtttagc attatgccgg cgaatattct gcatgcgacc 1380 gcggatcaga aaaacctgtc gtcagcgctg gatgcggcgc tgaacccgac cgtggcgtcg 1440 gcgaaagcga accaaggagt gatggatcag atttggaacc cgattgtgac cccgattaaa 1500 cagcaagtgc agagcgggct ggatgcggcg accgcccagg tgactcaggc gaccgccggt 1560 gctccggaag cggtgcagca gcaggcgctg accgcggccg cggataaagc gcatgcgtcg 1620 gtgcaggatg gcaaactggt tgtggattgg agcgatagcg cgcagcgcac ctattgggtt 1680 gatgatctgg cgccgaccct gagcaaacag attgataaag gcacctcgga taaagctagc 1740 agctcgtcgg aaacctcgga taccagctat ctgaacggcg cggatagcgc gctaacccgt 1800 ccgtttatga ccggctttaa tagcagcgcg gtgaccgtgt attgggttgg ctttgcggtg 1860 attctgctgg cgtttattct gtcgtggttt tttaaagcgc cgccgctgcg caaatcgagc 1920 gctctgcagg aacaggccga taacgatcgc accgcggatg atttagaagt gcaggccgtg 1980 accgcggctg ataccatggg cagcccaacc gcgccagtga ccgggagcat tgcggtgcag 2040 cgtggcagca gcgatgattg a 2061 <210> 102 <211> 686 <212> PRT <213> Curtobacterium sp. 314Chir4.1 <400> 102 Met Ser Thr Ala Thr Ala Pro Val Glu Val Gln Arg Gly Arg Gln Ser 1 5 10 15 Ser Pro Ala Gly Gln Pro Gly Lys Pro Ile Met Ser His Arg Gln Ile 20 25 30 Leu Leu Val Ile Tyr Gly Leu Met Ala Gly Met Phe Leu Ser Ser Leu 35 40 45 Asp Gln Thr Ile Val Gly Thr Ala Ile Arg Thr Ile Gly Asp Asp Leu 50 55 60 His Gly Leu Asp Gln Gln Ala Trp Val Thr Thr Ala Tyr Leu Ile Ala 65 70 75 80 Ser Thr Ile Thr Thr Pro Ile Tyr Gly Lys Leu Ser Asp Val Phe Gly 85 90 95 Arg Arg Pro Leu Tyr Ile Phe Gly Ile Ala Val Phe Ile Leu Gly Ser 100 105 110 Leu Leu Ser Thr Met Ser Thr Ser Met Ile Met Leu Ala Ala Phe Arg 115 120 125 Ala Phe Gln Gly Ile Gly Ala Gly Ala Leu Met Ser Leu Pro Leu Ala 130 135 140 Ile Met Gly Asp Ile Leu Ala Pro Arg Glu Arg Ala Lys Tyr Gln Gly 145 150 155 160 Tyr Phe Leu Ala Val Phe Gly Ile Ser Ser Val Ile Gly Pro Leu Ile 165 170 175 Gly Gly Leu Phe Ala Gly Ala Ser Ser Ile Leu Gly Ile Thr Gly Trp 180 185 190 Arg Trp Val Phe Leu Ile Asn Val Pro Ile Gly Val Ala Ala Leu Leu 195 200 205 Met Val Ile Ala Phe Leu His Leu Pro Lys Phe Gly Asp Ala Lys Ala 210 215 220 Lys Pro Arg Ile Asp Trp Trp Gly Ala Thr Ser Val Ile Val Thr Leu 225 230 235 240 Val Pro Leu Leu Leu Val Ala Glu Gln Gly Arg Thr Trp Gly Trp Gly 245 250 255 Ser Ala Gly Ala Ile Ala Cys Tyr Val Ile Gly Ala Leu Gly Leu Val 260 265 270 Ala Phe Leu Val Ile Glu Thr Leu Met Lys Asp Asp Ala Ile Ile Pro 275 280 285 Leu Lys Leu Phe Arg Ser Gly Val Phe Ser Met Ala Thr Ile Leu Gly 290 295 300 Phe Leu Val Gly Phe Ala Met Phe Gly Ala Met Leu Thr Ile Pro Leu 305 310 315 320 Tyr Leu Gln Ile Val Thr Gly Leu Thr Pro Thr Glu Ser Gly Phe Ala 325 330 335 Thr Leu Pro Met Ile Gly Gly Leu Met Ile Ala Ser Ile Ala Ser Gly 340 345 350 Gln Ile Val Ala Arg Thr Gly Lys Tyr Arg Ile Phe Pro Val Ile Gly 355 360 365 Thr Ala Leu Val Ser Ile Gly Tyr Val Val Leu Thr Phe Met Thr Ile 370 375 380 Asp Lys Pro Leu Trp Phe Leu Met Ile Gly Met Phe Leu Ile Gly Leu 385 390 395 400 Gly Leu Gly Gln Leu Met Gln Ser Ile Thr Leu Ala Ser Gln Asn Ser 405 410 415 Val Gln Pro Arg Asp Met Gly Val Ala Thr Ser Ser Ala Thr Phe Phe 420 425 430 Arg Gln Ile Gly Gly Thr Leu Gly Thr Ala Val Leu Leu Ser Val Leu 435 440 445 Phe Ser Ile Met Pro Ala Asn Ile Leu His Ala Thr Ala Asp Gln Lys 450 455 460 Asn Leu Ser Ser Ala Leu Asp Ala Ala Leu Asn Pro Thr Val Ala Ser 465 470 475 480 Ala Lys Ala Asn Gln Gly Val Met Asp Gln Ile Trp Asn Pro Ile Val 485 490 495 Thr Pro Ile Lys Gln Gln Val Gln Ser Gly Leu Asp Ala Ala Thr Ala 500 505 510 Gln Val Thr Gln Ala Thr Ala Gly Ala Pro Glu Ala Val Gln Gln Gln 515 520 525 Ala Leu Thr Ala Ala Ala Asp Lys Ala His Ala Ser Val Gln Asp Gly 530 535 540 Lys Leu Val Val Asp Trp Ser Asp Ser Ala Gln Arg Thr Tyr Trp Val 545 550 555 560 Asp Asp Leu Ala Pro Thr Leu Ser Lys Gln Ile Asp Lys Gly Thr Ser 565 570 575 Asp Lys Ala Ser Ser Ser Ser Glu Thr Ser Asp Thr Ser Tyr Leu Asn 580 585 590 Gly Ala Asp Ser Ala Leu Thr Arg Pro Phe Met Thr Gly Phe Asn Ser 595 600 605 Ser Ala Val Thr Val Tyr Trp Val Gly Phe Ala Val Ile Leu Leu Ala 610 615 620 Phe Ile Leu Ser Trp Phe Phe Lys Ala Pro Pro Leu Arg Lys Ser Ser 625 630 635 640 Ala Leu Gln Glu Gln Ala Asp Asn Asp Arg Thr Ala Asp Asp Leu Glu 645 650 655 Val Gln Ala Val Thr Ala Ala Asp Thr Met Gly Ser Pro Thr Ala Pro 660 665 670 Val Thr Gly Ser Ile Ala Val Gln Arg Gly Ser Ser Asp Asp 675 680 685 <210> 103 <211> 1665 <212> DNA <213> Niabella drilacis DSM25811 <400> 103 atgtcgaaat tagactttat agtgatctgc gtttttgcga tcttaatggt aatcatcggg 60 ctggttttta cggctcaaag ctcgaaaagc tcgaaatcgt tttttgaggc aggcggctcg 120 actccatggt ggatcaacgg tctgtcgtta tttatctcgt atttctctgc cgccaccttt 180 gtggtgtggg gcagtatcgc gtataaacat ggtttagtgg cgaataccat acaatttacc 240 atgtgtttat cgggtatcgt gaccgcgctg tggatagccg gtcgttggaa gaaaacgggt 300 gcgacgacgg ccgcggaata cctgggtaaa cgatacggga aatcagcgaa acagtacttt 360 agctatatgg tgctgttata tagcctggtt tcgacggccg cgatacttta tgccgttggt 420 aagatcgttt atgtggcgac cccgttttct ttagaaacct gtatcatcgc gatcggtatc 480 actatcatcg tttatacgac gggtggaggc ttatggggag tgttagttac tgatgttgtg 540 caatttgtga tcttatcagc tgcggtaatc atcatcatcc cattatcttt atccgaagtt 600 ggtgggatga ctcagtttct gcaaaaaacg ccagaccgtt tctttgaccc agtgaacgat 660 gaatatacgt tcggttttat gtgctcgttc tttatatacc aggttgttta tatagcgggc 720 aattggtcgt atgtgcaacg gtatacttcg gtgtcctccg cgcggaacgc gaaaaaagtg 780 gcgtggcttt tctccgggtt atacctggtt gcaccaatca tctggatgct ccccccgatg 840 atctaccgtg taatcaatcc gggtctggat ggtgccggtg ccgaaggggc atatatgatg 900 ttatgccaaa aagtgttacc ggccgggtta ataggtctgg tgttatcagg gatgatcgct 960 gcgacgtcaa gcaaagccaa tacgaccatc aataccgctg ccatcatctt tgctcaggat 1020 atctataaag gtgttttctt taagcatacc tctgataaaa agcaaatact ggttgcgcgg 1080 atctttacta tattattcgg tgctgctacg gtgtttctgg ctatcttagt tccagctgcc 1140 gggggaatcg ttgaagtggt gttaagcact gcggctatcg ccgggggcag tttatttggg 1200 ccggtaatat tttcattatt ctcgcggcga caaacggaat cgtcgcttat cgttatctca 1260 atcgtatcag ttgttgtgtc gttattcttt aaagccctgg ctccatcgct gctggacatc 1320 aaattatcgc gtactgtgga aactatcctt ggtgttggtc tgccactggt gctgttagct 1380 ttcttcgaat tatatgctgc cataaaaggt ataaaagtgc catattttat caccgaagcc 1440 ggtgaaagcg ggctgtcacc ggatatcgaa tctgccaaac aaaatatatt cggtacccgg 1500 gtgatcgcgt ggtcggcagg gtttgttggt gttggtatca gcttattagg ttttctggcc 1560 gaaaatggtt cggttgcggt tgttgttggt gccggtatcg taatcatctc agcgttaatc 1620 ttaatccggc aaaaacgggc tgcggcagtt gccgggacct cgtga 1665 <210> 104 <211> 554 <212> PRT <213> Niabella drilacis DSM25811 <400> 104 Met Ser Lys Leu Asp Phe Ile Val Ile Cys Val Phe Ala Ile Leu Met 1 5 10 15 Val Ile Ile Gly Leu Val Phe Thr Ala Gln Ser Ser Lys Ser Ser Lys 20 25 30 Ser Phe Phe Glu Ala Gly Gly Ser Thr Pro Trp Trp Ile Asn Gly Leu 35 40 45 Ser Leu Phe Ile Ser Tyr Phe Ser Ala Ala Thr Phe Val Val Trp Gly 50 55 60 Ser Ile Ala Tyr Lys His Gly Leu Val Ala Asn Thr Ile Gln Phe Thr 65 70 75 80 Met Cys Leu Ser Gly Ile Val Thr Ala Leu Trp Ile Ala Gly Arg Trp 85 90 95 Lys Lys Thr Gly Ala Thr Thr Ala Ala Glu Tyr Leu Gly Lys Arg Tyr 100 105 110 Gly Lys Ser Ala Lys Gln Tyr Phe Ser Tyr Met Val Leu Leu Tyr Ser 115 120 125 Leu Val Ser Thr Ala Ala Ile Leu Tyr Ala Val Gly Lys Ile Val Tyr 130 135 140 Val Ala Thr Pro Phe Ser Leu Glu Thr Cys Ile Ile Ala Ile Gly Ile 145 150 155 160 Thr Ile Ile Val Tyr Thr Thr Gly Gly Gly Leu Trp Gly Val Leu Val 165 170 175 Thr Asp Val Val Gln Phe Val Ile Leu Ser Ala Ala Val Ile Ile Ile 180 185 190 Ile Pro Leu Ser Leu Ser Glu Val Gly Gly Met Thr Gln Phe Leu Gln 195 200 205 Lys Thr Pro Asp Arg Phe Phe Asp Pro Val Asn Asp Glu Tyr Thr Phe 210 215 220 Gly Phe Met Cys Ser Phe Phe Ile Tyr Gln Val Val Tyr Ile Ala Gly 225 230 235 240 Asn Trp Ser Tyr Val Gln Arg Tyr Thr Ser Val Ser Ser Ala Arg Asn 245 250 255 Ala Lys Lys Val Ala Trp Leu Phe Ser Gly Leu Tyr Leu Val Ala Pro 260 265 270 Ile Ile Trp Met Leu Pro Pro Met Ile Tyr Arg Val Ile Asn Pro Gly 275 280 285 Leu Asp Gly Ala Gly Ala Glu Gly Ala Tyr Met Met Leu Cys Gln Lys 290 295 300 Val Leu Pro Ala Gly Leu Ile Gly Leu Val Leu Ser Gly Met Ile Ala 305 310 315 320 Ala Thr Ser Ser Lys Ala Asn Thr Thr Ile Asn Thr Ala Ala Ile Ile 325 330 335 Phe Ala Gln Asp Ile Tyr Lys Gly Val Phe Phe Lys His Thr Ser Asp 340 345 350 Lys Lys Gln Ile Leu Val Ala Arg Ile Phe Thr Ile Leu Phe Gly Ala 355 360 365 Ala Thr Val Phe Leu Ala Ile Leu Val Pro Ala Ala Gly Gly Ile Val 370 375 380 Glu Val Val Leu Ser Thr Ala Ala Ile Ala Gly Gly Ser Leu Phe Gly 385 390 395 400 Pro Val Ile Phe Ser Leu Phe Ser Arg Arg Gln Thr Glu Ser Ser Leu 405 410 415 Ile Val Ile Ser Ile Val Ser Val Val Val Ser Leu Phe Phe Lys Ala 420 425 430 Leu Ala Pro Ser Leu Leu Asp Ile Lys Leu Ser Arg Thr Val Glu Thr 435 440 445 Ile Leu Gly Val Gly Leu Pro Leu Val Leu Leu Ala Phe Phe Glu Leu 450 455 460 Tyr Ala Ala Ile Lys Gly Ile Lys Val Pro Tyr Phe Ile Thr Glu Ala 465 470 475 480 Gly Glu Ser Gly Leu Ser Pro Asp Ile Glu Ser Ala Lys Gln Asn Ile 485 490 495 Phe Gly Thr Arg Val Ile Ala Trp Ser Ala Gly Phe Val Gly Val Gly 500 505 510 Ile Ser Leu Leu Gly Phe Leu Ala Glu Asn Gly Ser Val Ala Val Val 515 520 525 Val Gly Ala Gly Ile Val Ile Ile Ser Ala Leu Ile Leu Ile Arg Gln 530 535 540 Lys Arg Ala Ala Ala Val Ala Gly Thr Ser 545 550 <210> 105 <211> 1539 <212> DNA <213> Saccharicrinis fermentans DSM 9555 = JCM 21142 <400> 105 atgaaaaaag ttattacgtc aatcgggtta attgtgttat gcttaccggt tttatttgcg 60 caaagaccca cgattgcgtc agggcatttt agctcgctta actggattgt gctggttgtt 120 tttctggttg gtacgacggt ttttggagag ctggttaaaa ataaagataa gggcttaaac 180 ggcttctttc gtggcggcaa taacttacca tggtggacgg ttagcttatc attaatcgct 240 acgaaaacga gcgttgcgac gtttattgct gttcctgcct ttgttttttc acttcatggc 300 gatctgtcat atctgcaaat gacgtttggc tttgctttag gtaatatctt aatggtgttt 360 gttttactta aagagtatta tgaggatcat atctacagcc cttatgattt tattcagaac 420 cgtctgggca ttcgtgtgag ccaattaagc cgtacgttct ttatggttgg ggccacgatg 480 agccaaggcg tgcgtttact tggcacggcg cttgtgttaa gcgttattac gggtcagagc 540 acgatattat gcattggcat tattgcggcg tttgcggttg tttggtcgta tattggtggc 600 ataacgacgg tagtttggac ggatgctctg caatttgtta tctttatctt tggcgctctt 660 ttcgcccttt tttatgctat cggtgatatt ccgggcggac tgagcgagat gatcgtaatc 720 gccgatcaga aagcgaagct tacgctgctt gatttatcat tagatcctca taaaacgtat 780 actttatggg ttggcatttt aggttgcacg ttttttgagt ttggctcaaa cgccgtggat 840 caagtggtga cgcagagagc gctttgctgt cggaacctaa aagaagctcg taaagctgtt 900 ggatttagcg ttatcggagt agcgacgacg tggatcatgg cctttgttgg cattggcctg 960 gttgcgtact atcatataaa cccgttaagc ccagaaatca acgcgagcat ggttcaggaa 1020 ccagatcgta tttttccgta ttatgtggtg aattcattac cgaacggcat ttcgggttta 1080 attattgcgg ccatgtttgc ggccggcatc agcacgctag atagcgccct gacggcgtta 1140 tcgcaaacga gcgttatggg tgttggtagc attctgtttc cccgtctgaa gttcatgaat 1200 gaagataaag ttgtgaaaat tagcaagatg gcgattattg tgtggggagg gatcttagcc 1260 ctgttagcgt atggttttag cttctttcaa gatggcggct tattagcgct gggttttaaa 1320 gttcctgggt atgcgtacgg tacgttaata ggtattgcgt ttcttgctct gatgcgacgt 1380 ggcagcttta tgggcatttt aatggggagc ctgctggcga ttgcgtgcat cggatggatg 1440 catatggaag gcataagctt cttctggtgg ttcccagtgg gcgccttcgt tgtgattatg 1500 atggcgatct tttatgatat gatcgtgccg aaaaaataa 1539 <210> 106 <211> 512 <212> PRT <213> Saccharicrinis fermentans DSM 9555 = JCM 21142 <400> 106 Met Lys Lys Val Ile Thr Ser Ile Gly Leu Ile Val Leu Cys Leu Pro 1 5 10 15 Val Leu Phe Ala Gln Arg Pro Thr Ile Ala Ser Gly His Phe Ser Ser 20 25 30 Leu Asn Trp Ile Val Leu Val Val Phe Leu Val Gly Thr Thr Val Phe 35 40 45 Gly Glu Leu Val Lys Asn Lys Asp Lys Gly Leu Asn Gly Phe Phe Arg 50 55 60 Gly Gly Asn Asn Leu Pro Trp Trp Thr Val Ser Leu Ser Leu Ile Ala 65 70 75 80 Thr Lys Thr Ser Val Ala Thr Phe Ile Ala Val Pro Ala Phe Val Phe 85 90 95 Ser Leu His Gly Asp Leu Ser Tyr Leu Gln Met Thr Phe Gly Phe Ala 100 105 110 Leu Gly Asn Ile Leu Met Val Phe Val Leu Leu Lys Glu Tyr Tyr Glu 115 120 125 Asp His Ile Tyr Ser Pro Tyr Asp Phe Ile Gln Asn Arg Leu Gly Ile 130 135 140 Arg Val Ser Gln Leu Ser Arg Thr Phe Phe Met Val Gly Ala Thr Met 145 150 155 160 Ser Gln Gly Val Arg Leu Leu Gly Thr Ala Leu Val Leu Ser Val Ile 165 170 175 Thr Gly Gln Ser Thr Ile Leu Cys Ile Gly Ile Ile Ala Ala Phe Ala 180 185 190 Val Val Trp Ser Tyr Ile Gly Gly Ile Thr Thr Val Val Trp Thr Asp 195 200 205 Ala Leu Gln Phe Val Ile Phe Ile Phe Gly Ala Leu Phe Ala Leu Phe 210 215 220 Tyr Ala Ile Gly Asp Ile Pro Gly Gly Leu Ser Glu Met Ile Val Ile 225 230 235 240 Ala Asp Gln Lys Ala Lys Leu Thr Leu Leu Asp Leu Ser Leu Asp Pro 245 250 255 His Lys Thr Tyr Thr Leu Trp Val Gly Ile Leu Gly Cys Thr Phe Phe 260 265 270 Glu Phe Gly Ser Asn Ala Val Asp Gln Val Val Thr Gln Arg Ala Leu 275 280 285 Cys Cys Arg Asn Leu Lys Glu Ala Arg Lys Ala Val Gly Phe Ser Val 290 295 300 Ile Gly Val Ala Thr Thr Trp Ile Met Ala Phe Val Gly Ile Gly Leu 305 310 315 320 Val Ala Tyr Tyr His Ile Asn Pro Leu Ser Pro Glu Ile Asn Ala Ser 325 330 335 Met Val Gln Glu Pro Asp Arg Ile Phe Pro Tyr Tyr Val Val Asn Ser 340 345 350 Leu Pro Asn Gly Ile Ser Gly Leu Ile Ile Ala Ala Met Phe Ala Ala 355 360 365 Gly Ile Ser Thr Leu Asp Ser Ala Leu Thr Ala Leu Ser Gln Thr Ser 370 375 380 Val Met Gly Val Gly Ser Ile Leu Phe Pro Arg Leu Lys Phe Met Asn 385 390 395 400 Glu Asp Lys Val Val Lys Ile Ser Lys Met Ala Ile Ile Val Trp Gly 405 410 415 Gly Ile Leu Ala Leu Leu Ala Tyr Gly Phe Ser Phe Phe Gln Asp Gly 420 425 430 Gly Leu Leu Ala Leu Gly Phe Lys Val Pro Gly Tyr Ala Tyr Gly Thr 435 440 445 Leu Ile Gly Ile Ala Phe Leu Ala Leu Met Arg Arg Gly Ser Phe Met 450 455 460 Gly Ile Leu Met Gly Ser Leu Leu Ala Ile Ala Cys Ile Gly Trp Met 465 470 475 480 His Met Glu Gly Ile Ser Phe Phe Trp Trp Phe Pro Val Gly Ala Phe 485 490 495 Val Val Ile Met Met Ala Ile Phe Tyr Asp Met Ile Val Pro Lys Lys 500 505 510 <210> 107 <211> 1413 <212> DNA <213> Citrobacter freundii MGH152 <400> 107 atgactgaac ttcctgacag cacccgctgg caactttgga ttgtggcatt tggctttttt 60 atgcagtctc tggataccac catcgtcaat accgcgcttc cttctatggc caaaagcctt 120 ggggaaagcc cactgcatat gcatatggtc attgtgtctt atgtgcttac cgttgccgta 180 atgcttcctg ccagcggctg gctggctgat aaaatcggtg tgcgcaatat attcttcacc 240 gctatcattc tgtttacgct gggatctctt ttttgcgcct ggtcgggaac gctgaatgaa 300 ctggtgatgg ctcgcgtgct ccaaggtgta ggcggcgcga tgatggtgcc ggtcggcaga 360 ttgacggtga tgaaaatcgt cccacgcgag caatatatgg ccgcaatgac tttcgtcacc 420 ttgcctggtc agattggtcc acttctgggc ccggcactcg gcggcattct ggttgagtac 480 gcctcgtggc actggatctt tttgattaat attccggtag gcattgtcgg ggcaatagcg 540 acgctcatgc tgatgcctaa ctataccatg caaactcgcc gtttcgacct ttctggattc 600 atgatgctgg ctgtcggcat ggccgtactt accctcgcgc ttgatggttc aaagggaacc 660 ggcatttcgc atatcacgct ggcagcactg gttatctgtg gagtactggc gatcctgctg 720 tatctgaaac acgcccataa taaccctcgt gcactgttta gcctgcacct gtttcgtact 780 cataccttct ctctcggcct gtttggcagc tttgccggac ggattggtag cgggatgctc 840 ccgttcatga ccccggtatt cctgcagatt ggattgggct tttctccatt tcatgccggt 900 ttgatgatga tcccgatggt gctgggctca atgggaatga aacgcatcgt ggttcaggtc 960 gtcaaccggt ttggttaccg tcgcgtactg gtcaccacca cgcttggcct gtctatggtc 1020 agcttgttgc tgatgagcac cgcgctcctt ggttggtatt acgccctgcc gttcatactg 1080 ttcctccagg gaatggtcaa ttctacccgc ttctcgtcaa tgaatacgct gacgctaaaa 1140 gacctgccgg atgaccttgc gagcagcggc aatagcctgc tgtctatgat catgcaactg 1200 tctatgtcaa tcggagtaac catcgccggt ctgttgctcg gcatgttcgg gcagcaacat 1260 atcgccatcg acagcgcgtc tacgcatacc gtctttatgt atacctggct gtgcattgcg 1320 ttccttatcg cactgcctgc catcattttt gcccgcgtgc cggacgacac gcagaccaac 1380 gcggtgattt cacggcgcaa aaggtcaacc tga 1413 <210> 108 <211> 470 <212> PRT <213> Citrobacter freundii MGH152 <400> 108 Met Thr Glu Leu Pro Asp Ser Thr Arg Trp Gln Leu Trp Ile Val Ala 1 5 10 15 Phe Gly Phe Phe Met Gln Ser Leu Asp Thr Thr Ile Val Asn Thr Ala 20 25 30 Leu Pro Ser Met Ala Lys Ser Leu Gly Glu Ser Pro Leu His Met His 35 40 45 Met Val Ile Val Ser Tyr Val Leu Thr Val Ala Val Met Leu Pro Ala 50 55 60 Ser Gly Trp Leu Ala Asp Lys Ile Gly Val Arg Asn Ile Phe Phe Thr 65 70 75 80 Ala Ile Ile Leu Phe Thr Leu Gly Ser Leu Phe Cys Ala Trp Ser Gly 85 90 95 Thr Leu Asn Glu Leu Val Met Ala Arg Val Leu Gln Gly Val Gly Gly 100 105 110 Ala Met Met Val Pro Val Gly Arg Leu Thr Val Met Lys Ile Val Pro 115 120 125 Arg Glu Gln Tyr Met Ala Ala Met Thr Phe Val Thr Leu Pro Gly Gln 130 135 140 Ile Gly Pro Leu Leu Gly Pro Ala Leu Gly Gly Ile Leu Val Glu Tyr 145 150 155 160 Ala Ser Trp His Trp Ile Phe Leu Ile Asn Ile Pro Val Gly Ile Val 165 170 175 Gly Ala Ile Ala Thr Leu Met Leu Met Pro Asn Tyr Thr Met Gln Thr 180 185 190 Arg Arg Phe Asp Leu Ser Gly Phe Met Met Leu Ala Val Gly Met Ala 195 200 205 Val Leu Thr Leu Ala Leu Asp Gly Ser Lys Gly Thr Gly Ile Ser His 210 215 220 Ile Thr Leu Ala Ala Leu Val Ile Cys Gly Val Leu Ala Ile Leu Leu 225 230 235 240 Tyr Leu Lys His Ala His Asn Asn Pro Arg Ala Leu Phe Ser Leu His 245 250 255 Leu Phe Arg Thr His Thr Phe Ser Leu Gly Leu Phe Gly Ser Phe Ala 260 265 270 Gly Arg Ile Gly Ser Gly Met Leu Pro Phe Met Thr Pro Val Phe Leu 275 280 285 Gln Ile Gly Leu Gly Phe Ser Pro Phe His Ala Gly Leu Met Met Ile 290 295 300 Pro Met Val Leu Gly Ser Met Gly Met Lys Arg Ile Val Val Gln Val 305 310 315 320 Val Asn Arg Phe Gly Tyr Arg Arg Val Leu Val Thr Thr Thr Leu Gly 325 330 335 Leu Ser Met Val Ser Leu Leu Leu Met Ser Thr Ala Leu Leu Gly Trp 340 345 350 Tyr Tyr Ala Leu Pro Phe Ile Leu Phe Leu Gln Gly Met Val Asn Ser 355 360 365 Thr Arg Phe Ser Ser Met Asn Thr Leu Thr Leu Lys Asp Leu Pro Asp 370 375 380 Asp Leu Ala Ser Ser Gly Asn Ser Leu Leu Ser Met Ile Met Gln Leu 385 390 395 400 Ser Met Ser Ile Gly Val Thr Ile Ala Gly Leu Leu Leu Gly Met Phe 405 410 415 Gly Gln Gln His Ile Ala Ile Asp Ser Ala Ser Thr His Thr Val Phe 420 425 430 Met Tyr Thr Trp Leu Cys Ile Ala Phe Leu Ile Ala Leu Pro Ala Ile 435 440 445 Ile Phe Ala Arg Val Pro Asp Asp Thr Gln Thr Asn Ala Val Ile Ser 450 455 460 Arg Arg Lys Arg Ser Thr 465 470 <210> 109 <211> 1413 <212> DNA <213> Citrobacter werkmanii NBRC 105721 <400> 109 atgactgaac ttcctgacag cacccgctgg caactttgga ttgtggcttt cggctttttt 60 atgcagagtc tggataccac catcgtcaat accgcgcttc ctagtatggc cgccagcctt 120 ggggaaagcc cgttgcatat gcatatggtc attgtgtcat atgtattgac cgttgccgta 180 atgctgcctg ccagcggatg gttagcggac aaagttggcg tgcgcaatat cttcttcacc 240 gccatcatcc tgtttacgct tggcagtctg ttttgcgcct ggtcgagcac gcttaacgag 300 ctggtgatgg cgcgcgtctt gcaaggcgtt ggtggcgcga tgatggtgcc ggttggcaga 360 ctaacggtga tgaaaatcgt cccgcgtgag caatatatgg ccgcgatgac gtttgtcacg 420 ttgcctggcc agattggccc attgctgggt ccggcgttgg gcggcgttct ggttgagtat 480 gcctcgtggc actggatatt tttgctgaat attccggttg gcattgtcgg cgcgatagct 540 acgttgatgc tgatgcctaa ctataccatg caaacgcgac gcttcgatct tagtggattc 600 gcgatgctgg ccgtcggcat ggccgtgcta acgctggcgc ttgatggctc taaagggacc 660 ggcatctcgg gtatcacgtt agcggtgctg gttatctgcg gagcgttggc tattgcgcta 720 tatctgaaac acgcccatcg taatccacgc gcgctgtttt ctctgaatct gtttcatact 780 ccaaccttca gtttgggtct gcttggctct tttgccgggc gcatcggcag cggtatgctg 840 ccgtttatga cgccagtgtt tttgcagatt gggcttggtt tttcaccttt tcatgccggg 900 ctgatgatgg tcccgatggt gcttggctct atgggcatga agcgcatcgt ggtccaggtc 960 gttaaccgct ttggctaccg ccgcgtactg gtcactacta cgcttggcct gtctctggtc 1020 agcctgttgc tgatgaccac cgcgctgctt ggctggtatt acgccctgcc ttttgtgctg 1080 ttcttgcaag ggatggtcaa ctcaacgcgt ttttcatcga tgaataccct tactcttaaa 1140 gacctgccag acgatcttgc cagcagcggc aatagcctgc tgagtatgat catgcaattg 1200 agtatgtcta tcggagtgac tatcgctggc ctgttgctag gcatgtttgg tcagcagcat 1260 atcgctatcg acagcggctc tacgcatacc gtctttatgt atacctggct gtgcattgct 1320 ttcattattg ctctgcctgc cattattttt gcccgcgtgc cgaacgacac gcaaactaac 1380 gcggtgatct cacggcgcaa aaggagcacc tga 1413 <210> 110 <211> 470 <212> PRT <213> Citrobacter werkmanii NBRC 105721 <400> 110 Met Thr Glu Leu Pro Asp Ser Thr Arg Trp Gln Leu Trp Ile Val Ala 1 5 10 15 Phe Gly Phe Phe Met Gln Ser Leu Asp Thr Thr Ile Val Asn Thr Ala 20 25 30 Leu Pro Ser Met Ala Ala Ser Leu Gly Glu Ser Pro Leu His Met His 35 40 45 Met Val Ile Val Ser Tyr Val Leu Thr Val Ala Val Met Leu Pro Ala 50 55 60 Ser Gly Trp Leu Ala Asp Lys Val Gly Val Arg Asn Ile Phe Phe Thr 65 70 75 80 Ala Ile Ile Leu Phe Thr Leu Gly Ser Leu Phe Cys Ala Trp Ser Ser 85 90 95 Thr Leu Asn Glu Leu Val Met Ala Arg Val Leu Gln Gly Val Gly Gly 100 105 110 Ala Met Met Val Pro Val Gly Arg Leu Thr Val Met Lys Ile Val Pro 115 120 125 Arg Glu Gln Tyr Met Ala Ala Met Thr Phe Val Thr Leu Pro Gly Gln 130 135 140 Ile Gly Pro Leu Leu Gly Pro Ala Leu Gly Gly Val Leu Val Glu Tyr 145 150 155 160 Ala Ser Trp His Trp Ile Phe Leu Leu Asn Ile Pro Val Gly Ile Val 165 170 175 Gly Ala Ile Ala Thr Leu Met Leu Met Pro Asn Tyr Thr Met Gln Thr 180 185 190 Arg Arg Phe Asp Leu Ser Gly Phe Ala Met Leu Ala Val Gly Met Ala 195 200 205 Val Leu Thr Leu Ala Leu Asp Gly Ser Lys Gly Thr Gly Ile Ser Gly 210 215 220 Ile Thr Leu Ala Val Leu Val Ile Cys Gly Ala Leu Ala Ile Ala Leu 225 230 235 240 Tyr Leu Lys His Ala His Arg Asn Pro Arg Ala Leu Phe Ser Leu Asn 245 250 255 Leu Phe His Thr Pro Thr Phe Ser Leu Gly Leu Leu Gly Ser Phe Ala 260 265 270 Gly Arg Ile Gly Ser Gly Met Leu Pro Phe Met Thr Pro Val Phe Leu 275 280 285 Gln Ile Gly Leu Gly Phe Ser Pro Phe His Ala Gly Leu Met Met Val 290 295 300 Pro Met Val Leu Gly Ser Met Gly Met Lys Arg Ile Val Val Gln Val 305 310 315 320 Val Asn Arg Phe Gly Tyr Arg Arg Val Leu Val Thr Thr Thr Leu Gly 325 330 335 Leu Ser Leu Val Ser Leu Leu Leu Met Thr Thr Ala Leu Leu Gly Trp 340 345 350 Tyr Tyr Ala Leu Pro Phe Val Leu Phe Leu Gln Gly Met Val Asn Ser 355 360 365 Thr Arg Phe Ser Ser Met Asn Thr Leu Thr Leu Lys Asp Leu Pro Asp 370 375 380 Asp Leu Ala Ser Ser Gly Asn Ser Leu Leu Ser Met Ile Met Gln Leu 385 390 395 400 Ser Met Ser Ile Gly Val Thr Ile Ala Gly Leu Leu Leu Gly Met Phe 405 410 415 Gly Gln Gln His Ile Ala Ile Asp Ser Gly Ser Thr His Thr Val Phe 420 425 430 Met Tyr Thr Trp Leu Cys Ile Ala Phe Ile Ile Ala Leu Pro Ala Ile 435 440 445 Ile Phe Ala Arg Val Pro Asn Asp Thr Gln Thr Asn Ala Val Ile Ser 450 455 460 Arg Arg Lys Arg Ser Thr 465 470 <210> 111 <211> 1413 <212> DNA <213> Citrobacter amalonaticus <400> 111 atgactgaat tgcctaatag cacccgctgg caactgtgga tcgtggcttt cggcttcttt 60 atgcagtcgc tggataccac cattgttaat actgcgcttc cttcgatggc gaaaagctta 120 ggggaaagcc cgctgcatat gcatatggtt gtggtttcgt atgtgctgac cgtggccgtt 180 atgctgcccg cgagcggttg gctggccgac aaaattggcg tgcggaatat cttctttacc 240 gcgatcgtac tgtttaccct gggctcgctg ttttgcgctg gttcgggcac gctaaatgaa 300 ctggttatgg cccgggtgct tcaaggcgtc ggcggcgcga tgatggtacc ggttggccgg 360 ctgacggtga tgaagatcgt tccgcgcgag cagtatatgg ccgcgatgac gtttgttacg 420 ctgccgggcc agataggccc gcttctgggc ccggcgctgg gcgggatttt agtggaatat 480 gcgtcgtggc actggatctt cctgattaac cttccggttg gtatcgttgg cgcgattgcg 540 acgctgatgc tgatgcctaa ctataccatg caaacccgac gcttcgattt gtcgggtttt 600 ctgctgctgg ccgctgggat ggccgtcctg accattgcgc tggacggcag caaagggatg 660 ggaatgtcgt cgttcgcgtt gggtgcgtta gtggtgtgcg gcgtggccgc gatccttttg 720 tacctgaagc acgcgaacga taacccgcgg gcgctgttct cattgcacct gttccgcacg 780 cccaccttct cgctgggact gtttggcagc tttgcgggac gcattggcag cggcatgctt 840 cccttcatga cgccggtttt tcttcaaatc ggtttgggct tttcgccgtt tcacgccggg 900 ctgatgatga ttcctatggt gttgggctca atgggaatga aacggatcgt tgtccaggtt 960 gtcaaccgtt ttggctatcg acgggtgctg gttttcacca cgttgggact gtccgtggta 1020 accctgctgt ttatgtcgac tgcgctgctt ggctggtatt acgtgctgcc gctggtgctg 1080 tttgtccagg gcatggttaa ctcgacgcgt ttctcgtcga tgaataccct gaccctgaaa 1140 gatctgccgg atgagcttgc gagcagcggg aatagcctgc tgtcgatgat catgcaattg 1200 tcgatgtcaa ttggcgttac cgtcgccggt ctgctgctag gaatgttcgc gcagcagcat 1260 atgactgtgg atagcggaac gtcgcatacc gtttttatgt atacctggct gtgtatggct 1320 tttattattg cgcttcctgc tgtgattttt gcgcgcgttc ccaacgatac ccataaaaat 1380 gttgttatcg cgcgacgcaa aaggagaacc tga 1413 <210> 112 <211> 470 <212> PRT <213> Citrobacter amalonaticus <400> 112 Met Thr Glu Leu Pro Asn Ser Thr Arg Trp Gln Leu Trp Ile Val Ala 1 5 10 15 Phe Gly Phe Phe Met Gln Ser Leu Asp Thr Thr Ile Val Asn Thr Ala 20 25 30 Leu Pro Ser Met Ala Lys Ser Leu Gly Glu Ser Pro Leu His Met His 35 40 45 Met Val Val Val Ser Tyr Val Leu Thr Val Ala Val Met Leu Pro Ala 50 55 60 Ser Gly Trp Leu Ala Asp Lys Ile Gly Val Arg Asn Ile Phe Phe Thr 65 70 75 80 Ala Ile Val Leu Phe Thr Leu Gly Ser Leu Phe Cys Ala Gly Ser Gly 85 90 95 Thr Leu Asn Glu Leu Val Met Ala Arg Val Leu Gln Gly Val Gly Gly 100 105 110 Ala Met Met Val Pro Val Gly Arg Leu Thr Val Met Lys Ile Val Pro 115 120 125 Arg Glu Gln Tyr Met Ala Ala Met Thr Phe Val Thr Leu Pro Gly Gln 130 135 140 Ile Gly Pro Leu Leu Gly Pro Ala Leu Gly Gly Ile Leu Val Glu Tyr 145 150 155 160 Ala Ser Trp His Trp Ile Phe Leu Ile Asn Leu Pro Val Gly Ile Val 165 170 175 Gly Ala Ile Ala Thr Leu Met Leu Met Pro Asn Tyr Thr Met Gln Thr 180 185 190 Arg Arg Phe Asp Leu Ser Gly Phe Leu Leu Leu Ala Ala Gly Met Ala 195 200 205 Val Leu Thr Ile Ala Leu Asp Gly Ser Lys Gly Met Gly Met Ser Ser 210 215 220 Phe Ala Leu Gly Ala Leu Val Val Cys Gly Val Ala Ala Ile Leu Leu 225 230 235 240 Tyr Leu Lys His Ala Asn Asp Asn Pro Arg Ala Leu Phe Ser Leu His 245 250 255 Leu Phe Arg Thr Pro Thr Phe Ser Leu Gly Leu Phe Gly Ser Phe Ala 260 265 270 Gly Arg Ile Gly Ser Gly Met Leu Pro Phe Met Thr Pro Val Phe Leu 275 280 285 Gln Ile Gly Leu Gly Phe Ser Pro Phe His Ala Gly Leu Met Met Ile 290 295 300 Pro Met Val Leu Gly Ser Met Gly Met Lys Arg Ile Val Val Gln Val 305 310 315 320 Val Asn Arg Phe Gly Tyr Arg Arg Val Leu Val Phe Thr Thr Leu Gly 325 330 335 Leu Ser Val Val Thr Leu Leu Phe Met Ser Thr Ala Leu Leu Gly Trp 340 345 350 Tyr Tyr Val Leu Pro Leu Val Leu Phe Val Gln Gly Met Val Asn Ser 355 360 365 Thr Arg Phe Ser Ser Met Asn Thr Leu Thr Leu Lys Asp Leu Pro Asp 370 375 380 Glu Leu Ala Ser Ser Gly Asn Ser Leu Leu Ser Met Ile Met Gln Leu 385 390 395 400 Ser Met Ser Ile Gly Val Thr Val Ala Gly Leu Leu Leu Gly Met Phe 405 410 415 Ala Gln Gln His Met Thr Val Asp Ser Gly Thr Ser His Thr Val Phe 420 425 430 Met Tyr Thr Trp Leu Cys Met Ala Phe Ile Ile Ala Leu Pro Ala Val 435 440 445 Ile Phe Ala Arg Val Pro Asn Asp Thr His Lys Asn Val Val Ile Ala 450 455 460 Arg Arg Lys Arg Arg Thr 465 470 <210> 113 <211> 1416 <212> DNA <213> Klebsiella oxytoca <400> 113 atgactgatc ttcccgacag cacccgctgg caattgtgga ttgtggcttt cggcttcttt 60 atgcagtcac tggacaccac catcgttaat accgcgcttc cctcaatggc gcaaagcctc 120 ggggaaagcc cgctgaatat gcatatggtc attgtctctt atgtactgac cgttgcggtg 180 atgctgcccg ccagcggctg gctggccgac aaagtcggcg tacgcaatat cttctttacc 240 gccatcgtgc tgtttaccct cggttcgctg ttttgcgcac tttctgccac gttaaacgaa 300 ctgttgcttg ctcgcgcgtt gcaaggcgtt ggcggcgcga tgatggtgcc ggtcggcaga 360 ttaactgtga tgaaaattgt tccgcgtgag caatatatgg ccgcgatgac ctttgttacg 420 ctgcccggtc aggtcggccc tctattgggt ccggcgctcg gcggcctgtt agtggaatac 480 gcgtcttggc actggatctt tttgatcaat ataccggtag ggattatcgg tgcgattgcc 540 acgctgatgt taatgcctaa ctataccatg cagacgcggc gtttcgatct ctctggtttt 600 ttgttgttag cggtcggcat ggccgtatta acgctggcgc tggatggctc gaaaggcacg 660 ggactttcac cgctggcgat tgccggactg gcagcgattg gcgttgtggc actggtgctt 720 tatctgctgc acgccagaaa taataaccgc gccctgttca gcctgaaact gttccgcacc 780 cgtacctttt cgctgggcct ggccgggtcg tttgccggac gcatcggctc gggcatgttg 840 ccctttatga ctccggtttt cttgcagatt ggcctcggtt tctcgccgtt ccatgccgga 900 ctgatgatga tcccgatggt gctcggcagc atgggaatga agcgaattgt agttcaggtt 960 gtgaatcgct ttggctaccg tcgggtatta gtggcgacca cgctgggcct gtcgctggtc 1020 accctgctgt ttatgactac cgcgctgctg ggctggtact atgttttgcc gttcgtcctg 1080 tttttgcaag ggatggtcaa ctcgacgcgt ttctcttcta tgaataccct gacgctgaaa 1140 gatctcccgg acaatctggc gagcagcggc aatagcctgc tatcgatgat tatgcaatta 1200 tcgatgtcga tcggcgtcac tatcgccggg ctgttgctgg gactttttgg ttctcagcat 1260 gtcagcgtcg acagcggcac cactcaaacc gtctttatgt atacctggct tagcatggcg 1320 tttatcatcg cccttccggc gttcatcttt gccagagtgt cgaacgatac gcatcaaaat 1380 gtcgctattt cgcggcgaaa aaggagcgcg caatga 1416 <210> 114 <211> 471 <212> PRT <213> Klebsiella oxytoca <400> 114 Met Thr Asp Leu Pro Asp Ser Thr Arg Trp Gln Leu Trp Ile Val Ala 1 5 10 15 Phe Gly Phe Phe Met Gln Ser Leu Asp Thr Thr Ile Val Asn Thr Ala 20 25 30 Leu Pro Ser Met Ala Gln Ser Leu Gly Glu Ser Pro Leu Asn Met His 35 40 45 Met Val Ile Val Ser Tyr Val Leu Thr Val Ala Val Met Leu Pro Ala 50 55 60 Ser Gly Trp Leu Ala Asp Lys Val Gly Val Arg Asn Ile Phe Phe Thr 65 70 75 80 Ala Ile Val Leu Phe Thr Leu Gly Ser Leu Phe Cys Ala Leu Ser Ala 85 90 95 Thr Leu Asn Glu Leu Leu Leu Ala Arg Ala Leu Gln Gly Val Gly Gly 100 105 110 Ala Met Met Val Pro Val Gly Arg Leu Thr Val Met Lys Ile Val Pro 115 120 125 Arg Glu Gln Tyr Met Ala Ala Met Thr Phe Val Thr Leu Pro Gly Gln 130 135 140 Val Gly Pro Leu Leu Gly Pro Ala Leu Gly Gly Leu Leu Val Glu Tyr 145 150 155 160 Ala Ser Trp His Trp Ile Phe Leu Ile Asn Ile Pro Val Gly Ile Ile 165 170 175 Gly Ala Ile Ala Thr Leu Met Leu Met Pro Asn Tyr Thr Met Gln Thr 180 185 190 Arg Arg Phe Asp Leu Ser Gly Phe Leu Leu Leu Ala Val Gly Met Ala 195 200 205 Val Leu Thr Leu Ala Leu Asp Gly Ser Lys Gly Thr Gly Leu Ser Pro 210 215 220 Leu Ala Ile Ala Gly Leu Ala Ala Ile Gly Val Val Ala Leu Val Leu 225 230 235 240 Tyr Leu Leu His Ala Arg Asn Asn Asn Arg Ala Leu Phe Ser Leu Lys 245 250 255 Leu Phe Arg Thr Arg Thr Phe Ser Leu Gly Leu Ala Gly Ser Phe Ala 260 265 270 Gly Arg Ile Gly Ser Gly Met Leu Pro Phe Met Thr Pro Val Phe Leu 275 280 285 Gln Ile Gly Leu Gly Phe Ser Pro Phe His Ala Gly Leu Met Met Ile 290 295 300 Pro Met Val Leu Gly Ser Met Gly Met Lys Arg Ile Val Val Gln Val 305 310 315 320 Val Asn Arg Phe Gly Tyr Arg Arg Val Leu Val Ala Thr Thr Leu Gly 325 330 335 Leu Ser Leu Val Thr Leu Leu Phe Met Thr Thr Ala Leu Leu Gly Trp 340 345 350 Tyr Tyr Val Leu Pro Phe Val Leu Phe Leu Gln Gly Met Val Asn Ser 355 360 365 Thr Arg Phe Ser Ser Met Asn Thr Leu Thr Leu Lys Asp Leu Pro Asp 370 375 380 Asn Leu Ala Ser Ser Gly Asn Ser Leu Leu Ser Met Ile Met Gln Leu 385 390 395 400 Ser Met Ser Ile Gly Val Thr Ile Ala Gly Leu Leu Leu Gly Leu Phe 405 410 415 Gly Ser Gln His Val Ser Val Asp Ser Gly Thr Thr Gln Thr Val Phe 420 425 430 Met Tyr Thr Trp Leu Ser Met Ala Phe Ile Ile Ala Leu Pro Ala Phe 435 440 445 Ile Phe Ala Arg Val Ser Asn Asp Thr His Gln Asn Val Ala Ile Ser 450 455 460 Arg Arg Lys Arg Ser Ala Gln 465 470 <210> 115 <211> 1407 <212> DNA <213> Escherichia albertii B156 <400> 115 atgactgaac tccccgacag cacccgttgg caactgtgga ttgtggcttt cggcttcttt 60 atgcagtctc tggataccac tatcgttaat accgcgctcc catctatggc gcaaagcctg 120 ggagaatcgc cactgcatat gcatatggtc attgtctcgt atgtgctgac cgttgcggtg 180 atgctgccag ccagcggctg gctggcagac aaagtcggcg tacgtaatat tttctttacc 240 gccatcgtgc tgtttaccct tggttctctg ttttgcgcgc tctctggcac gctgaacgaa 300 ctgttactgg cgcgtgcgtt gcaaggcgtc ggcggcgcga tgatggtacc ggtcggcaga 360 ttaacggtga tgaaaattgt tccgcgtgaa caatatatgg ccgcgatgac ctttgtcacg 420 ctgcccggtc agattggtcc gctgcttggc ccggcacttg gcggcctgct ggtagaatac 480 gcatcttggc actggatctt tttaatcaat attccggtag ggattatcgg tgcgatcgct 540 actctgatgt taatgccgaa ctataccatg cagactcggc gtttcgatct ttctggcttt 600 ctgttactgg ccgtcggcat ggccgtacta acgctggcgc tggatggctc gaaaggcacc 660 gggctgtctc cgctagccat caccgtgctg gttgctgttg gcgtgctagc cattgcgctc 720 tatctgcttc atgccagaaa taatcaccgt gcgctgttct cgctgaaact gttccatact 780 cgtacctttt ctctgggctt agcgggaagc ttcgccggtc gtgtcggcag cggcatgcta 840 ccatttatga cccccgtttt ccttcagatt ggccttggct tttctccgtt tcacgccggg 900 ttaatgatga tcccgatggt gcttggcagc atgggaatga agcgaattgt ggtccaggta 960 gtgaatcggt ttggttaccg tcgagtgtta gtggcaacca cgctgggcct gtctctggtc 1020 accctactgt ttatgactac cgctctgctt ggctggtact atattttacc gttcgtcctg 1080 tttttgcaag ggatggtcaa ctctacccgt ttctcttcta tgaataccct gacgctgaag 1140 gatctgccgg accgactggc gagcagcggc aatagcctgc tgtctatgat tatgcaatta 1200 tctatgtcga tcggcgtcac cattgccggg ctcttactgg gattttttgg ttctcagcat 1260 atcagcggcg ccactcaaac cgtctttatg tatacctggc tcagcatggc gtttatcatc 1320 gccctcccgg cacttgtctt tgccagagtt ccgaatgata cgcatcaaaa tgtggctatt 1380 agtcggcgaa aaaggagcgc gcaatga 1407 <210> 116 <211> 468 <212> PRT <213> Escherichia albertii B156 <400> 116 Met Thr Glu Leu Pro Asp Ser Thr Arg Trp Gln Leu Trp Ile Val Ala 1 5 10 15 Phe Gly Phe Phe Met Gln Ser Leu Asp Thr Thr Ile Val Asn Thr Ala 20 25 30 Leu Pro Ser Met Ala Gln Ser Leu Gly Glu Ser Pro Leu His Met His 35 40 45 Met Val Ile Val Ser Tyr Val Leu Thr Val Ala Val Met Leu Pro Ala 50 55 60 Ser Gly Trp Leu Ala Asp Lys Val Gly Val Arg Asn Ile Phe Phe Thr 65 70 75 80 Ala Ile Val Leu Phe Thr Leu Gly Ser Leu Phe Cys Ala Leu Ser Gly 85 90 95 Thr Leu Asn Glu Leu Leu Leu Ala Arg Ala Leu Gln Gly Val Gly Gly 100 105 110 Ala Met Met Val Pro Val Gly Arg Leu Thr Val Met Lys Ile Val Pro 115 120 125 Arg Glu Gln Tyr Met Ala Ala Met Thr Phe Val Thr Leu Pro Gly Gln 130 135 140 Ile Gly Pro Leu Leu Gly Pro Ala Leu Gly Gly Leu Leu Val Glu Tyr 145 150 155 160 Ala Ser Trp His Trp Ile Phe Leu Ile Asn Ile Pro Val Gly Ile Ile 165 170 175 Gly Ala Ile Ala Thr Leu Met Leu Met Pro Asn Tyr Thr Met Gln Thr 180 185 190 Arg Arg Phe Asp Leu Ser Gly Phe Leu Leu Leu Ala Val Gly Met Ala 195 200 205 Val Leu Thr Leu Ala Leu Asp Gly Ser Lys Gly Thr Gly Leu Ser Pro 210 215 220 Leu Ala Ile Thr Val Leu Val Ala Val Gly Val Leu Ala Ile Ala Leu 225 230 235 240 Tyr Leu Leu His Ala Arg Asn Asn His Arg Ala Leu Phe Ser Leu Lys 245 250 255 Leu Phe His Thr Arg Thr Phe Ser Leu Gly Leu Ala Gly Ser Phe Ala 260 265 270 Gly Arg Val Gly Ser Gly Met Leu Pro Phe Met Thr Pro Val Phe Leu 275 280 285 Gln Ile Gly Leu Gly Phe Ser Pro Phe His Ala Gly Leu Met Met Ile 290 295 300 Pro Met Val Leu Gly Ser Met Gly Met Lys Arg Ile Val Val Gln Val 305 310 315 320 Val Asn Arg Phe Gly Tyr Arg Arg Val Leu Val Ala Thr Thr Leu Gly 325 330 335 Leu Ser Leu Val Thr Leu Leu Phe Met Thr Thr Ala Leu Leu Gly Trp 340 345 350 Tyr Tyr Ile Leu Pro Phe Val Leu Phe Leu Gln Gly Met Val Asn Ser 355 360 365 Thr Arg Phe Ser Ser Met Asn Thr Leu Thr Leu Lys Asp Leu Pro Asp 370 375 380 Arg Leu Ala Ser Ser Gly Asn Ser Leu Leu Ser Met Ile Met Gln Leu 385 390 395 400 Ser Met Ser Ile Gly Val Thr Ile Ala Gly Leu Leu Leu Gly Phe Phe 405 410 415 Gly Ser Gln His Ile Ser Gly Ala Thr Gln Thr Val Phe Met Tyr Thr 420 425 430 Trp Leu Ser Met Ala Phe Ile Ile Ala Leu Pro Ala Leu Val Phe Ala 435 440 445 Arg Val Pro Asn Asp Thr His Gln Asn Val Ala Ile Ser Arg Arg Lys 450 455 460 Arg Ser Ala Gln 465 <210> 117 <211> 1413 <212> DNA <213> Salmonella enterica subsp. Salamae <400> 117 atgactgaac tccctgacag cactcgctgg caactttgga ttgtggcttt cggctttttt 60 atgcagtcgt tggataccac catcgttaat actgcgctgc cttcaatggc gaaaagcctg 120 ggagaaagcc cgctgcatat gcatatggta gtggtgtcat atgtccttac cgttgccgta 180 atgcttcctg ccagcggctg gctggctgac aaaatcggcg tgcgtaatat tttctttgcc 240 gccatcgtgc tgttcactct gggatcgctg ttttgcgccc tttcgggcac gctcaatcaa 300 ctggtattag cgcgagtctt gcaaggcgta ggcggcgcga tgatggtgcc ggttggacgc 360 ctgacggtta tgaaaatcgt gccgcgtgcg caatatatgg ccgcgatgac cttcgttacc 420 ctgccgggac aggtagggcc cttacttggc cctgcgctgg gcggagtgtt agtggaatat 480 gcttcatggc actggatctt tctgatcaat atcccagtgg gaattgttgg cgctatcgcg 540 acctttatgc tgatgcccaa ctataccata gaaacccggc gctttgatct gccagggttc 600 ctgctgttag ccataggcat ggccgtactt acgctggcgc tggacggcag caaaagcatg 660 ggaatctcgc cttggacttt agccggactc gctgcgggcg gcgcggctgc tattctgctt 720 tatcttcttc atgccaagaa gaactcaggc gcgttattca gcctgcgatt gttccgcacg 780 cctacgtttt cactgggatt gctgggctca tttgccgggc gcatcggcag cgggatgctg 840 ccgtttatta cgccggtgtt cttgcaaatt gggcttgggt tttcaccgtt tcatgccggg 900 ttaatgatga tccctatggt gctgggcagc atgggaatga agcggattgt ggtgcagata 960 gtcaaccgtt ttggctatcg tcgggttctg gttgcgacca cgcttggact ggctttggtc 1020 agcctgttgt ttatgtcggt tgcgctgctt ggctggtatt atcttctgcc gctggtactg 1080 ctcttgcagg gaatggtgaa ctcggcgcgt ttttcatcga tgaataccct aacgctaaaa 1140 gacctccctg atacgctggc cagcagcggc aatagcttat tatcaatgat tatgcagctt 1200 tcgatgtcaa tcggcgttac tattgccgga atgttgctgg gcatgtttgg ccaacagcat 1260 atcgggatag actcaagcgc cactcatcac gtgttcttgt atacctggct atgtatggcc 1320 gtcattatcg cgctaccggc gataattttt gcccgcgtgc cgaacgatac tcagcaaaat 1380 atggttattt cacggcgtaa aagaagcctg taa 1413 <210> 118 <211> 470 <212> PRT <213> Salmonella enterica subsp. Salamae <400> 118 Met Thr Glu Leu Pro Asp Ser Thr Arg Trp Gln Leu Trp Ile Val Ala 1 5 10 15 Phe Gly Phe Phe Met Gln Ser Leu Asp Thr Thr Ile Val Asn Thr Ala 20 25 30 Leu Pro Ser Met Ala Lys Ser Leu Gly Glu Ser Pro Leu His Met His 35 40 45 Met Val Val Val Ser Tyr Val Leu Thr Val Ala Val Met Leu Pro Ala 50 55 60 Ser Gly Trp Leu Ala Asp Lys Ile Gly Val Arg Asn Ile Phe Phe Ala 65 70 75 80 Ala Ile Val Leu Phe Thr Leu Gly Ser Leu Phe Cys Ala Leu Ser Gly 85 90 95 Thr Leu Asn Gln Leu Val Leu Ala Arg Val Leu Gln Gly Val Gly Gly 100 105 110 Ala Met Met Val Pro Val Gly Arg Leu Thr Val Met Lys Ile Val Pro 115 120 125 Arg Ala Gln Tyr Met Ala Ala Met Thr Phe Val Thr Leu Pro Gly Gln 130 135 140 Val Gly Pro Leu Leu Gly Pro Ala Leu Gly Gly Val Leu Val Glu Tyr 145 150 155 160 Ala Ser Trp His Trp Ile Phe Leu Ile Asn Ile Pro Val Gly Ile Val 165 170 175 Gly Ala Ile Ala Thr Phe Met Leu Met Pro Asn Tyr Thr Ile Glu Thr 180 185 190 Arg Arg Phe Asp Leu Pro Gly Phe Leu Leu Leu Ala Ile Gly Met Ala 195 200 205 Val Leu Thr Leu Ala Leu Asp Gly Ser Lys Ser Met Gly Ile Ser Pro 210 215 220 Trp Thr Leu Ala Gly Leu Ala Ala Gly Gly Ala Ala Ala Ile Leu Leu 225 230 235 240 Tyr Leu Leu His Ala Lys Lys Asn Ser Gly Ala Leu Phe Ser Leu Arg 245 250 255 Leu Phe Arg Thr Pro Thr Phe Ser Leu Gly Leu Leu Gly Ser Phe Ala 260 265 270 Gly Arg Ile Gly Ser Gly Met Leu Pro Phe Ile Thr Pro Val Phe Leu 275 280 285 Gln Ile Gly Leu Gly Phe Ser Pro Phe His Ala Gly Leu Met Met Ile 290 295 300 Pro Met Val Leu Gly Ser Met Gly Met Lys Arg Ile Val Val Gln Ile 305 310 315 320 Val Asn Arg Phe Gly Tyr Arg Arg Val Leu Val Ala Thr Thr Leu Gly 325 330 335 Leu Ala Leu Val Ser Leu Leu Phe Met Ser Val Ala Leu Leu Gly Trp 340 345 350 Tyr Tyr Leu Leu Pro Leu Val Leu Leu Leu Gln Gly Met Val Asn Ser 355 360 365 Ala Arg Phe Ser Ser Met Asn Thr Leu Thr Leu Lys Asp Leu Pro Asp 370 375 380 Thr Leu Ala Ser Ser Gly Asn Ser Leu Leu Ser Met Ile Met Gln Leu 385 390 395 400 Ser Met Ser Ile Gly Val Thr Ile Ala Gly Met Leu Leu Gly Met Phe 405 410 415 Gly Gln Gln His Ile Gly Ile Asp Ser Ser Ala Thr His His Val Phe 420 425 430 Leu Tyr Thr Trp Leu Cys Met Ala Val Ile Ile Ala Leu Pro Ala Ile 435 440 445 Ile Phe Ala Arg Val Pro Asn Asp Thr Gln Gln Asn Met Val Ile Ser 450 455 460 Arg Arg Lys Arg Ser Leu 465 470 <210> 119 <211> 1416 <212> DNA <213> Klebsiella pneumoniae 30684/NJST258_2 <400> 119 atgactgact taccggcgag cgtgcgctgg cagctatgga tagtggcgtt tggctttttc 60 atgcagtcgc tggacaccac cattgtaaat accgcgttac cttcgatggc gaaaagctta 120 ggggaatcac cgctgcatat gcatatgatc attgtttcgt atgtgctaac ggttgcggtg 180 atgctgccgg cgagcggctg gctggccgac cgggttggag tgcgcaatat cttctttacc 240 gcgattgtgc tgttcaccgc gggatcgctg ttctgcgcgc aggcgagcac cttagaccag 300 ctggtgatgg cgcgagtgct gcaaggagtc ggcggcgcga tgatggtgcc ggttggccgc 360 ctgacggtga tgaagattgt tccgcgcgat cagtatatgg ccgcgatgac ctttgttacc 420 ctgccgggcc aggttggccc gctgttaggc ccggcgctgg gcggagtgct ggttgagtac 480 gcgtcgtggc attggatctt cttaattaat attccggttg ggattgtagg cgcgattgcg 540 accttatgtc tgatgcctaa ctataccatg cagacccggc gctttgattt atcgggcttc 600 ctgctgctgg ccgcgggaat ggcgaccctg accctggcgt tagacggcca gaaagggtta 660 ggcatctcgc ccgcgtggtt agcgggactg gttgcggttg gcttatgcgc gctgctgtta 720 tacctgtggc atgcgcgcgg caacgcgcgg gcgctgttca gccttaacct gttccgcaac 780 cgcacttttt cattaggctt aggcggcagc tttgcgggac gcattggcag cggcatgctg 840 ccgttcatga ccccggtgtt cctgcagatt ggcttaggct tttcgccttt ccatgccggg 900 ctgatgatga ttccgatggt gttaggcagc atgggcatga agcggattgt ggttcaggtt 960 gttaaccgct tcggctaccg acgggtgctg gttgcgagca ccctgggcct ggccgcggtt 1020 agcctgctgt tcatgttcag cgcgctggcc ggctggtatt acgcgctgcc gctggttctg 1080 ttcctgcagg gaatgattaa cgcgagccgc ttttcgtcaa tgaataccct gacgctgaaa 1140 gatttaccgg acgatctggc gagcagcggc aatagcctgc tgtcgatggt gatgcagctg 1200 tcgatgtcaa ttggcgtgac cattgccggg ctgctgctgg gactgtatgg ccagcagcat 1260 atgagcttag acgcggcgag cacccaccag gttttcttat atacctatct gagcatggcc 1320 gcgattattg cgctgccggc gttaattttc tcccgggtac cggatgacgt tggcagcaat 1380 accgttttac ggaggcgcaa taggtcagga tcgtga 1416 <210> 120 <211> 471 <212> PRT <213> Klebsiella pneumoniae 30684/NJST258_2 <400> 120 Met Thr Asp Leu Pro Ala Ser Val Arg Trp Gln Leu Trp Ile Val Ala 1 5 10 15 Phe Gly Phe Phe Met Gln Ser Leu Asp Thr Thr Ile Val Asn Thr Ala 20 25 30 Leu Pro Ser Met Ala Lys Ser Leu Gly Glu Ser Pro Leu His Met His 35 40 45 Met Ile Ile Val Ser Tyr Val Leu Thr Val Ala Val Met Leu Pro Ala 50 55 60 Ser Gly Trp Leu Ala Asp Arg Val Gly Val Arg Asn Ile Phe Phe Thr 65 70 75 80 Ala Ile Val Leu Phe Thr Ala Gly Ser Leu Phe Cys Ala Gln Ala Ser 85 90 95 Thr Leu Asp Gln Leu Val Met Ala Arg Val Leu Gln Gly Val Gly Gly 100 105 110 Ala Met Met Val Pro Val Gly Arg Leu Thr Val Met Lys Ile Val Pro 115 120 125 Arg Asp Gln Tyr Met Ala Ala Met Thr Phe Val Thr Leu Pro Gly Gln 130 135 140 Val Gly Pro Leu Leu Gly Pro Ala Leu Gly Gly Val Leu Val Glu Tyr 145 150 155 160 Ala Ser Trp His Trp Ile Phe Leu Ile Asn Ile Pro Val Gly Ile Val 165 170 175 Gly Ala Ile Ala Thr Leu Cys Leu Met Pro Asn Tyr Thr Met Gln Thr 180 185 190 Arg Arg Phe Asp Leu Ser Gly Phe Leu Leu Leu Ala Ala Gly Met Ala 195 200 205 Thr Leu Thr Leu Ala Leu Asp Gly Gln Lys Gly Leu Gly Ile Ser Pro 210 215 220 Ala Trp Leu Ala Gly Leu Val Ala Val Gly Leu Cys Ala Leu Leu Leu 225 230 235 240 Tyr Leu Trp His Ala Arg Gly Asn Ala Arg Ala Leu Phe Ser Leu Asn 245 250 255 Leu Phe Arg Asn Arg Thr Phe Ser Leu Gly Leu Gly Gly Ser Phe Ala 260 265 270 Gly Arg Ile Gly Ser Gly Met Leu Pro Phe Met Thr Pro Val Phe Leu 275 280 285 Gln Ile Gly Leu Gly Phe Ser Pro Phe His Ala Gly Leu Met Met Ile 290 295 300 Pro Met Val Leu Gly Ser Met Gly Met Lys Arg Ile Val Val Gln Val 305 310 315 320 Val Asn Arg Phe Gly Tyr Arg Arg Val Leu Val Ala Ser Thr Leu Gly 325 330 335 Leu Ala Ala Val Ser Leu Leu Phe Met Phe Ser Ala Leu Ala Gly Trp 340 345 350 Tyr Tyr Ala Leu Pro Leu Val Leu Phe Leu Gln Gly Met Ile Asn Ala 355 360 365 Ser Arg Phe Ser Ser Met Asn Thr Leu Thr Leu Lys Asp Leu Pro Asp 370 375 380 Asp Leu Ala Ser Ser Gly Asn Ser Leu Leu Ser Met Val Met Gln Leu 385 390 395 400 Ser Met Ser Ile Gly Val Thr Ile Ala Gly Leu Leu Leu Gly Leu Tyr 405 410 415 Gly Gln Gln His Met Ser Leu Asp Ala Ala Ser Thr His Gln Val Phe 420 425 430 Leu Tyr Thr Tyr Leu Ser Met Ala Ala Ile Ile Ala Leu Pro Ala Leu 435 440 445 Ile Phe Ser Arg Val Pro Asp Asp Val Gly Ser Asn Thr Val Leu Arg 450 455 460 Arg Arg Asn Arg Ser Gly Ser 465 470 <210> 121 <211> 1416 <212> DNA <213> Klebsiella pneumoniae <400> 121 atgactgact taccgaccag cgtgcgctgg cagctatgga tagtggcgtt tggctttttc 60 atgcagtcgc tggacaccac cattgtaaat accgcgttac cttcgatggc gaaaagctta 120 ggggagagtc cgctgcatat gcatatgatc attgtttcgt atgtgctaac ggttgcggtg 180 atgctgccgg cgagcggctg gctggccgac cgggttggag tgcgcaatat cttctttacc 240 gcgattgtgc tgttcaccgc gggatcgctg ttctgcgcgc aggcgagcac cttagaccag 300 ctggtgatgg cgcgagtgct gcaaggagtc ggcggcgcga tgatggtgcc ggttggccgc 360 ctgacggtga tgaagattgt tccgcgcgat cagtatatgg ccgcgatgac ctttgtaacc 420 ctgccgggcc aggttggccc gctgttaggc ccggcgctgg gcggagtgct ggttgagtac 480 gcgtcatggc actggatctt cttaattaat attccggttg ggattgttgg cgcgattgcg 540 accttatgtc tgatgcctaa ctataccatg cagacccggc gctttgattt atcgggcttc 600 ctgctgctgg ccgccgggat ggcgactctg accctggcgt tagacggcca gaaagggtta 660 ggcatctcgc ccgcgtggtt agcgggatta gtggccgttg gcttatgcgc gctgctgtta 720 tacctgtggc acgcgcgcgg caacgcgcgg gcgctgttca gccttaacct gttccgcaac 780 cgcacctttt cgttaggctt aggcggcagc tttgcgggac gcattggcag cggcatgctg 840 ccgttcatga ccccggtgtt ccttcagatt ggcttaggct tttcgccttt ccacgccggg 900 ctgatgatga ttccgatggt gttaggcagc atgggcatga agcggattgt ggttcaggtt 960 gttaaccgct tcggctaccg acgggtgctg gttgcgagca ccctgggctt agcggccgtt 1020 agcctgctgt tcatgttcag cgcgttagcg ggatggtatt acgcgctgcc gctggttctg 1080 ttcctgcagg gaatgattaa ctcgagccgc ttttcgtcaa tgaataccct gacgctgaaa 1140 gatttaccgg acgatctggc gagcagcggc aatagcctgc tgtcgatggt gatgcagctg 1200 tcgatgtcaa ttggcgtgac cattgccggg ctgctgctgg gactgtatgg ccagcagcat 1260 atgtcattag acgcggcgag cacccatcag gttttcttat atacctatct gagcatggcc 1320 gcgattattg cgctgccggc gttaattttc tcccgggtac cggatgacgt tggcagcaat 1380 accgttttac ggcgacgcaa taggtcagga tcgtga 1416 <210> 122 <211> 471 <212> PRT <213> Klebsiella pneumoniae <400> 122 Met Thr Asp Leu Pro Thr Ser Val Arg Trp Gln Leu Trp Ile Val Ala 1 5 10 15 Phe Gly Phe Phe Met Gln Ser Leu Asp Thr Thr Ile Val Asn Thr Ala 20 25 30 Leu Pro Ser Met Ala Lys Ser Leu Gly Glu Ser Pro Leu His Met His 35 40 45 Met Ile Ile Val Ser Tyr Val Leu Thr Val Ala Val Met Leu Pro Ala 50 55 60 Ser Gly Trp Leu Ala Asp Arg Val Gly Val Arg Asn Ile Phe Phe Thr 65 70 75 80 Ala Ile Val Leu Phe Thr Ala Gly Ser Leu Phe Cys Ala Gln Ala Ser 85 90 95 Thr Leu Asp Gln Leu Val Met Ala Arg Val Leu Gln Gly Val Gly Gly 100 105 110 Ala Met Met Val Pro Val Gly Arg Leu Thr Val Met Lys Ile Val Pro 115 120 125 Arg Asp Gln Tyr Met Ala Ala Met Thr Phe Val Thr Leu Pro Gly Gln 130 135 140 Val Gly Pro Leu Leu Gly Pro Ala Leu Gly Gly Val Leu Val Glu Tyr 145 150 155 160 Ala Ser Trp His Trp Ile Phe Leu Ile Asn Ile Pro Val Gly Ile Val 165 170 175 Gly Ala Ile Ala Thr Leu Cys Leu Met Pro Asn Tyr Thr Met Gln Thr 180 185 190 Arg Arg Phe Asp Leu Ser Gly Phe Leu Leu Leu Ala Ala Gly Met Ala 195 200 205 Thr Leu Thr Leu Ala Leu Asp Gly Gln Lys Gly Leu Gly Ile Ser Pro 210 215 220 Ala Trp Leu Ala Gly Leu Val Ala Val Gly Leu Cys Ala Leu Leu Leu 225 230 235 240 Tyr Leu Trp His Ala Arg Gly Asn Ala Arg Ala Leu Phe Ser Leu Asn 245 250 255 Leu Phe Arg Asn Arg Thr Phe Ser Leu Gly Leu Gly Gly Ser Phe Ala 260 265 270 Gly Arg Ile Gly Ser Gly Met Leu Pro Phe Met Thr Pro Val Phe Leu 275 280 285 Gln Ile Gly Leu Gly Phe Ser Pro Phe His Ala Gly Leu Met Met Ile 290 295 300 Pro Met Val Leu Gly Ser Met Gly Met Lys Arg Ile Val Val Gln Val 305 310 315 320 Val Asn Arg Phe Gly Tyr Arg Arg Val Leu Val Ala Ser Thr Leu Gly 325 330 335 Leu Ala Ala Val Ser Leu Leu Phe Met Phe Ser Ala Leu Ala Gly Trp 340 345 350 Tyr Tyr Ala Leu Pro Leu Val Leu Phe Leu Gln Gly Met Ile Asn Ser 355 360 365 Ser Arg Phe Ser Ser Met Asn Thr Leu Thr Leu Lys Asp Leu Pro Asp 370 375 380 Asp Leu Ala Ser Ser Gly Asn Ser Leu Leu Ser Met Val Met Gln Leu 385 390 395 400 Ser Met Ser Ile Gly Val Thr Ile Ala Gly Leu Leu Leu Gly Leu Tyr 405 410 415 Gly Gln Gln His Met Ser Leu Asp Ala Ala Ser Thr His Gln Val Phe 420 425 430 Leu Tyr Thr Tyr Leu Ser Met Ala Ala Ile Ile Ala Leu Pro Ala Leu 435 440 445 Ile Phe Ser Arg Val Pro Asp Asp Val Gly Ser Asn Thr Val Leu Arg 450 455 460 Arg Arg Asn Arg Ser Gly Ser 465 470 <210> 123 <211> 1416 <212> DNA <213> Pseudocitrobacter faecalis <400> 123 atgactgaat tgcctgccag cgtgcgctgg caattgtgga tagtggcgtt cggcttcttt 60 atgcaatcgc tggacaccac tatcgtcaat accgccttgc cttcaatggc cgcttcactg 120 ggagagagcc cgctgcatat gcatatggtt gtggtatcat acgtgctgac tgtggccgtg 180 atgctccctg cctcgggctg gctggccgac cgagttggcg tacgcaatat cttcttcacc 240 gccattgtcc tgttcaccgc cggctcgctg ttttgttcgc tggcgagcac gttgaatgag 300 ctgctgatgg cgcgtgtact tcaaggcgtc ggcggcgcga tgatggtgcc tgtcgggcgc 360 ctgactgtga tgaaaatcgt cccgcgctct cagtatatgg ccgcgatgac cttcgtcacc 420 ctgcctggtc aggtcggccc gctcctcggc ccggcgttgg gcggcgtgct ggtagaatac 480 gcctcgtggc actggatctt cctgatcaat attccggtcg gcattatcgg cgggatcgcc 540 acgctgatgc tgatgcctaa ctatacgctg caaacccgcc gttttgacct gagcggattt 600 atcgtgctgg cgctgggcat ggccgtgttg actctggcct tggacgggca gaaagggctg 660 ggtatatcaa gcctcacgct ggcgattctg gtcgccgtcg gtgtcgcctc aatactgttt 720 tatttgtggc acgccagggg caatgacaac gcgctgttta gcctgaagct ctttcgcacg 780 cccactttct cgttgggcct ggctggctca ttcgccggac gcatcggtag cggcatgctg 840 ccttttatga cgccggtctt tctccagatt gggctcggat tttcgccgtt tcacgccggg 900 ctgatgatga tcccgatggt gttgggcagc atgggaatga aacggattgt ggttcaggtt 960 gtcaaccgtt ttggttaccg gaatgtgctg gtcaccacca cgattggctt ggcgctggtg 1020 agcctgctgt ttatggcgac ggcgctggct ggctggtatt acgccctgcc gctggtgctg 1080 tttattcagg gaatggtcaa ctcgagccgc ttctcgtcaa tgaatacgct gacgctgaaa 1140 gatctccctg atgagcatgc cagcagcggc aatagcctgc tgtcgatgat catgcagttg 1200 tcaatgtcaa ttggcgtcac cgtagcgggc cttctgctgg gcatgttcgg ccagcagcat 1260 gtcgccgccg atagcgccgt cacgcaccat gtctttatgt atacttattt gtgcatggcg 1320 ctcattatcg ccctgcctgc cctgattttt gcccgcgtac ccgacgacgt caccaaaaac 1380 gtggtcatcg cccgacgaaa aaggtcagaa cagtga 1416 <210> 124 <211> 471 <212> PRT <213> Pseudocitrobacter faecalis <400> 124 Met Thr Glu Leu Pro Ala Ser Val Arg Trp Gln Leu Trp Ile Val Ala 1 5 10 15 Phe Gly Phe Phe Met Gln Ser Leu Asp Thr Thr Ile Val Asn Thr Ala 20 25 30 Leu Pro Ser Met Ala Ala Ser Leu Gly Glu Ser Pro Leu His Met His 35 40 45 Met Val Val Val Ser Tyr Val Leu Thr Val Ala Val Met Leu Pro Ala 50 55 60 Ser Gly Trp Leu Ala Asp Arg Val Gly Val Arg Asn Ile Phe Phe Thr 65 70 75 80 Ala Ile Val Leu Phe Thr Ala Gly Ser Leu Phe Cys Ser Leu Ala Ser 85 90 95 Thr Leu Asn Glu Leu Leu Met Ala Arg Val Leu Gln Gly Val Gly Gly 100 105 110 Ala Met Met Val Pro Val Gly Arg Leu Thr Val Met Lys Ile Val Pro 115 120 125 Arg Ser Gln Tyr Met Ala Ala Met Thr Phe Val Thr Leu Pro Gly Gln 130 135 140 Val Gly Pro Leu Leu Gly Pro Ala Leu Gly Gly Val Leu Val Glu Tyr 145 150 155 160 Ala Ser Trp His Trp Ile Phe Leu Ile Asn Ile Pro Val Gly Ile Ile 165 170 175 Gly Gly Ile Ala Thr Leu Met Leu Met Pro Asn Tyr Thr Leu Gln Thr 180 185 190 Arg Arg Phe Asp Leu Ser Gly Phe Ile Val Leu Ala Leu Gly Met Ala 195 200 205 Val Leu Thr Leu Ala Leu Asp Gly Gln Lys Gly Leu Gly Ile Ser Ser 210 215 220 Leu Thr Leu Ala Ile Leu Val Ala Val Gly Val Ala Ser Ile Leu Phe 225 230 235 240 Tyr Leu Trp His Ala Arg Gly Asn Asp Asn Ala Leu Phe Ser Leu Lys 245 250 255 Leu Phe Arg Thr Pro Thr Phe Ser Leu Gly Leu Ala Gly Ser Phe Ala 260 265 270 Gly Arg Ile Gly Ser Gly Met Leu Pro Phe Met Thr Pro Val Phe Leu 275 280 285 Gln Ile Gly Leu Gly Phe Ser Pro Phe His Ala Gly Leu Met Met Ile 290 295 300 Pro Met Val Leu Gly Ser Met Gly Met Lys Arg Ile Val Val Gln Val 305 310 315 320 Val Asn Arg Phe Gly Tyr Arg Asn Val Leu Val Thr Thr Thr Ile Gly 325 330 335 Leu Ala Leu Val Ser Leu Leu Phe Met Ala Thr Ala Leu Ala Gly Trp 340 345 350 Tyr Tyr Ala Leu Pro Leu Val Leu Phe Ile Gln Gly Met Val Asn Ser 355 360 365 Ser Arg Phe Ser Ser Met Asn Thr Leu Thr Leu Lys Asp Leu Pro Asp 370 375 380 Glu His Ala Ser Ser Gly Asn Ser Leu Leu Ser Met Ile Met Gln Leu 385 390 395 400 Ser Met Ser Ile Gly Val Thr Val Ala Gly Leu Leu Leu Gly Met Phe 405 410 415 Gly Gln Gln His Val Ala Ala Asp Ser Ala Val Thr His His Val Phe 420 425 430 Met Tyr Thr Tyr Leu Cys Met Ala Leu Ile Ile Ala Leu Pro Ala Leu 435 440 445 Ile Phe Ala Arg Val Pro Asp Asp Val Thr Lys Asn Val Val Ile Ala 450 455 460 Arg Arg Lys Arg Ser Glu Gln 465 470 <210> 125 <211> 1236 <212> DNA <213> Yokenella regensburgei ATCC43003 <400> 125 atgcaaaatc ataccctctc gggcaaacgt ctgggtcgtc aggcgctact ctttccgctc 60 tgcttagtac tgtacgaatt ttcgacctat attggaaacg acatgattca gccgggcatg 120 ttagccgtgg ttgagcagta ccaggctggt atcgaatggg tccccacttc gatgaccgct 180 tacttagcgg gcgggatatt cctgcagtgg ttactggggc cgctgtcgga tcgtatcggc 240 cgtcgtccgg tgatgctaac cggagtggtc tggtttatcg tgacctgctt agcgacgctg 300 ctggcgcaga atatcgagca gttcacgttt ctgcgttttc tgcaaggagt gagcctgtgc 360 tttatcggtg ctgtgggcta tgcggcgatt caggagtcgt tcgaagaggc cgtgtgtatt 420 aaaattaccg cgctgatggc gaacgtggcg ctaatcgcgc cgctgttagg tccgttagtg 480 ggcgcggcgt ggattcattt tgcgccgtgg gaaaccatgt ttgtgctgtt cgcggcgctg 540 gccgcgatct cgttttttgg cctgcagcgt gctatgccgg aaacggcgac ccgcataggc 600 gaaaagctgt cgttaaaaga gctaggtcgt gactattcag cggtgctgaa aaacctgcgc 660 tttgtcgcgg gcgcgctggc tacgggcttc gtcagcctgc cgctcctggc gtggatcgcg 720 cagtcaccgg tcatcattat gagcggtgaa cacgcgagca gctacgagta tggtatgctg 780 caagtgccga tcttcggtgc tctgatcatt ggtaatctgg tgctggcgcg tttaacttcg 840 cgccgttcgg tgcgctcgct aatcatcatg ggcggctggc cgatcgtggc tgggctcatt 900 ctcgcggctg cggctactgt ggtatcaagc catgcgtatc tgtggatgac ggccgggtta 960 agcgtgtacg ctttcggtat tggtctggcg aacgcgggac tggtgcgcct gaccttattc 1020 gcgagcgaca tgtcaaaagg cacggtagcc gcggcgatgg gcatgctgca gatgatgatc 1080 ttcaccgtcg ggatcgaagt cagcaagcac gcgtatctgc tcggcggcaa cggcctcttt 1140 agcctgttta atctggccgg tggattagtc tggctggtgc tgatcgtcta ctttctgaaa 1200 gacaaaacgg ttggtgcttc gactaagccc gactag 1236 <210> 126 <211> 411 <212> PRT <213> Yokenella regensburgei ATCC43003 <400> 126 Met Gln Asn His Thr Leu Ser Gly Lys Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln 35 40 45 Ala Gly Ile Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Ile Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys 85 90 95 Leu Ala Thr Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Phe Leu Arg 100 105 110 Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Ile His Phe Ala Pro Trp Glu Thr Met Phe Val Leu 165 170 175 Phe Ala Ala Leu Ala Ala Ile Ser Phe Phe Gly Leu Gln Arg Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Ile Gly Glu Lys Leu Ser Leu Lys Glu Leu 195 200 205 Gly Arg Asp Tyr Ser Ala Val Leu Lys Asn Leu Arg Phe Val Ala Gly 210 215 220 Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Val Ile Ile Met Ser Gly Glu His Ala Ser Ser Tyr Glu 245 250 255 Tyr Gly Met Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ile Gly Asn 260 265 270 Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Ser Val Arg Ser Leu Ile 275 280 285 Ile Met Gly Gly Trp Pro Ile Val Ala Gly Leu Ile Leu Ala Ala Ala 290 295 300 Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Val Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ala Ala Ala 340 345 350 Met Gly Met Leu Gln Met Met Ile Phe Thr Val Gly Ile Glu Val Ser 355 360 365 Lys His Ala Tyr Leu Leu Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn 370 375 380 Leu Ala Gly Gly Leu Val Trp Leu Val Leu Ile Val Tyr Phe Leu Lys 385 390 395 400 Asp Lys Thr Val Gly Ala Ser Thr Lys Pro Asp 405 410 <210> 127 <211> 1233 <212> DNA <213> Cronobacter muytjensii <400> 127 atgcaaactc atgctaaccg aaccggacgg ttaggacgcc aggcgctgct gtttccgtta 60 tgtctggtgt tatacgagtt ctcaacttat attggcaacg atatgattca gccgggaatg 120 ttagcggttg ttgaacagta tcaggccggc gtggaatggg tgccgaccag catgaccgcg 180 tatttagcgg gcggcatgtt ccttcagtgg ctgctcggcc cgttaagcga ccgcattggc 240 cggcgcccgg tgatgctggc cggcgtggtg tggttcattg tgacctgcct cgcgaccctg 300 ctggcgcaga ctattgagca gtttactgtg ctacggtttc ttcagggcat tagcctgtgc 360 ttcattggcg ccgtgggata tgcggctatt caggaaagct tcgaggaagc ggtgtgcatt 420 aaaattaccg cgctaatggc gaacgtggcg ctgatcgcgc cgctgttagg cccgctggtt 480 ggcgcggcct gggtgcacgc ggcgccttgg gaaatgatgt tcgtgctgtt tgcggcgctg 540 gccgcgatct cattttttgg gctgtggcgc gcgatgccgg aaaccgcgac ccggctcggc 600 gaaaaactga gcctgcgcga gctgggacgg gattataaag cggtgctgaa aaacctgcgg 660 ttcgtttcag gcgcgctggc gattggattc gttagcctgc cgctgctggc gtggatcgct 720 cagagcccgg taatcattat tagcggcgaa cagatgagca cctatgagta tgggctgctt 780 caggtgccga tctttggcgc gctgatttta ggcaacctgg tgctggcgaa gttaaccgct 840 cggcgcagcg tgcgcagcct gatcattatg ggcggctggc cgatcatggc cgggctggcg 900 ttagcggcgt ttgcgaccct gttatcgtcg catgcgtatt tatggatgac cgccgggtta 960 tcaatctacg cgtttggcat tggcattgcg aacgcgggcc tggtgcgcct gaccctgttc 1020 gcgagcgata ttagcaaagg caccgtatcc gcggcgatgg gcatgcttca gatgaccatc 1080 tttactgttg gcattgaagt gagcaaacat gcgtggattg gcggcggcaa cggcctgttt 1140 aacctgttca atttagctaa cggactgctg tggctgggcc tgatggtgat ctttctgaaa 1200 gacaaaaccg ttggcgcgag ccgggaagga tga 1233 <210> 128 <211> 410 <212> PRT <213> Cronobacter muytjensii <400> 128 Met Gln Thr His Ala Asn Arg Thr Gly Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln 35 40 45 Ala Gly Val Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Ala Gly Val Val Trp Phe Ile Val Thr Cys 85 90 95 Leu Ala Thr Leu Leu Ala Gln Thr Ile Glu Gln Phe Thr Val Leu Arg 100 105 110 Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Val His Ala Ala Pro Trp Glu Met Met Phe Val Leu 165 170 175 Phe Ala Ala Leu Ala Ala Ile Ser Phe Phe Gly Leu Trp Arg Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Arg Glu Leu 195 200 205 Gly Arg Asp Tyr Lys Ala Val Leu Lys Asn Leu Arg Phe Val Ser Gly 210 215 220 Ala Leu Ala Ile Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Met Ser Thr Tyr Glu 245 250 255 Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Leu Gly Asn 260 265 270 Leu Val Leu Ala Lys Leu Thr Ala Arg Arg Ser Val Arg Ser Leu Ile 275 280 285 Ile Met Gly Gly Trp Pro Ile Met Ala Gly Leu Ala Leu Ala Ala Phe 290 295 300 Ala Thr Leu Leu Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Ile Tyr Ala Phe Gly Ile Gly Ile Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ala Ser Asp Ile Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Thr Ile Phe Thr Val Gly Ile Glu Val Ser 355 360 365 Lys His Ala Trp Ile Gly Gly Gly Asn Gly Leu Phe Asn Leu Phe Asn 370 375 380 Leu Ala Asn Gly Leu Leu Trp Leu Gly Leu Met Val Ile Phe Leu Lys 385 390 395 400 Asp Lys Thr Val Gly Ala Ser Arg Glu Gly 405 410 <210> 129 <211> 1236 <212> DNA <213> Klebsiella oxytoca <400> 129 atgcagaatt attcgctttc aggcaaacgc ttaggacgcc aggcgctgtt atttccgcta 60 tgcctggtgc tatacgagtt ctcgacctat attggcaatg acatgattca gccgggcatg 120 ttatcggttg tggctgaatt tggcgtgggc aacgaatggg tgccgacctc aatgaccgcg 180 tatctggccg gcggaatgtt tcttcagtgg ctgctggggc cgctttcgga ccgcattggc 240 cgtcgtccgg tgatgctgac cggagtagtg tggtttattg taacctgcct ggcgacgctg 300 ctggcgcaaa ctatcgagca gttcacgctg ctgcgctttc ttcagggaat tagcctgtgc 360 tttattggcg cggttggcta tgcggcgata caggagtcat ttgaagaggc cgtgtgcatt 420 aagattaccg cgctgatggc gaacgttgcg ctgatcgcgc cgctgttagg gccgttagtg 480 ggcgcggcct gggtccactt actgccgtgg gaaatgatgt ttgttctgtt tgcggtgtta 540 gcggcgattg cgtttttcgg gcttcagaag gcgatgccgg aaaccgcgac ccgcatgggc 600 gagaagctat cggtaaaaga gctggggcgc gattatcgtg aagtgctgaa aaacctgcgc 660 tttgttgcgg gcgcgctggc gaccgggttt gttagcctgc cgctgctggc gtggatcgcg 720 caatcgccgg tgattattat tagcggcgag caggcgacca gctacgaata tggcctgctg 780 caagtgccga tctttggcgc gctgatcgcg gggaacctgg tgctggcgcg ccagacttca 840 cgcaaaacgg tgcgctcgct gatcatctta ggcggctggc cgatcatgat tggcctgctg 900 atttccgcgg ttgcgacggt tgcgtcgacg catgcgtatc tgtggatgac cgccgggctg 960 agcgtctacg cgttcgggat cgggttagcg aacgcgggac tggtgcgtct gacgctgttt 1020 gcgagcgaga tgtcaaaggg gacggtgtcc gcggcgatgg gaatgctgca aatgctgatt 1080 tttaccgttg ggattgaagt ttcaaagcat gcgtatgagt caggcgggag cggattattc 1140 agcctattaa acctgctgag cggagtgtta tggctggcga tgacggttta cttcctgaag 1200 gataaacgcg tgggcaacgc gcatgaaccg cagtaa 1236 <210> 130 <211> 411 <212> PRT <213> Klebsiella oxytoca <400> 130 Met Gln Asn Tyr Ser Leu Ser Gly Lys Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ser Val Val Ala Glu Phe Gly 35 40 45 Val Gly Asn Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys 85 90 95 Leu Ala Thr Leu Leu Ala Gln Thr Ile Glu Gln Phe Thr Leu Leu Arg 100 105 110 Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Val His Leu Leu Pro Trp Glu Met Met Phe Val Leu 165 170 175 Phe Ala Val Leu Ala Ala Ile Ala Phe Phe Gly Leu Gln Lys Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Met Gly Glu Lys Leu Ser Val Lys Glu Leu 195 200 205 Gly Arg Asp Tyr Arg Glu Val Leu Lys Asn Leu Arg Phe Val Ala Gly 210 215 220 Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Ala Thr Ser Tyr Glu 245 250 255 Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn 260 265 270 Leu Val Leu Ala Arg Gln Thr Ser Arg Lys Thr Val Arg Ser Leu Ile 275 280 285 Ile Leu Gly Gly Trp Pro Ile Met Ile Gly Leu Leu Ile Ser Ala Val 290 295 300 Ala Thr Val Ala Ser Thr His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Val Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser 355 360 365 Lys His Ala Tyr Glu Ser Gly Gly Ser Gly Leu Phe Ser Leu Leu Asn 370 375 380 Leu Leu Ser Gly Val Leu Trp Leu Ala Met Thr Val Tyr Phe Leu Lys 385 390 395 400 Asp Lys Arg Val Gly Asn Ala His Glu Pro Gln 405 410 <210> 131 <211> 1233 <212> DNA <213> Citrobacter koseri (Citrobacter diversus) <400> 131 atgcaaaacc tttctcaaac tggcgttcgg ctcggacgcc aggctctgct tttccctctc 60 tgtctggtgc tttacgaatt ttcaacctat attggcaacg atatgattca gccagggatg 120 ctggccgttg tggaacagta tcaggccggg attgactggg tcccgacctc gatgactgcc 180 tacctggccg gcggaatgtt tcttcagtgg ctgcttgggc cgctgtcgga tcgtattgga 240 cgccgcccgg tgatgcttgc cggcgtgatt tggtttattg ttacctgcct tgccactctg 300 ctggcgcaaa atattgagca gttcaccctg ctgcgttttc ttcaaggagt aagcctgtgc 360 tttattggcg ccgtgggata cgccgccatt caggaatcgt ttgaagaagc ggtgtgtatt 420 aaaattaccg cgctaatggc taacgtcgcc ctgattgcgc cgcttctggg gccgttagtg 480 ggcgccgcct gggtgcatgt cctgccgtgg gaaggaatgt ttgtcctgtt tgccgtactg 540 gccgcgattg cttttgttgg ccttcagcgc gcgatgccgg agactgcgac ccgccttggc 600 gagaagctgt cgcttaaaga actgggacgg gattataccc tggtgctgaa aaacgtgcgg 660 tttgtcgccg gcgcgctggc gctgggattc gttagcctgc cgctgctggc gtggattgcc 720 cagtcgccga ttataattat tagcggggag cagctcagca gctatgaata tggccttctt 780 caggtccctg tttttggcgc gctgattgcc gggaatctgg tgctggcgcg gcttacctcg 840 cggcgaaccg tgcgcgctct tattattatg ggcggctggc cgattgttgc gggacttctg 900 attgccgctg ccgcgaccgt ggtttcatcg catgcgtatc tatggatgac cgccgggctg 960 agcgtttacg cctttggcat tggcgtggcg aacgccgggc tggtgcgtct gaccctgttt 1020 gccagcgata tgagcaaagg caccgtatca gcggcgatgg gaatgcttca gatgctgatt 1080 tttaccgtgg gaattgaagt gagcaagcat gcttatctga gcggcggcaa cggccttttc 1140 agcctcttca acctggcgaa cggcattctc tggctgctgc ttatggtcat tttcctgaaa 1200 gacaaacggg taggggactc acgggaaggg tga 1233 <210> 132 <211> 410 <212> PRT <213> Citrobacter koseri (Citrobacter diversus) <400> 132 Met Gln Asn Leu Ser Gln Thr Gly Val Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln 35 40 45 Ala Gly Ile Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Ala Gly Val Ile Trp Phe Ile Val Thr Cys 85 90 95 Leu Ala Thr Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Leu Leu Arg 100 105 110 Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Val His Val Leu Pro Trp Glu Gly Met Phe Val Leu 165 170 175 Phe Ala Val Leu Ala Ala Ile Ala Phe Val Gly Leu Gln Arg Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Lys Glu Leu 195 200 205 Gly Arg Asp Tyr Thr Leu Val Leu Lys Asn Val Arg Phe Val Ala Gly 210 215 220 Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Ile Ile Ile Ile Ser Gly Glu Gln Leu Ser Ser Tyr Glu 245 250 255 Tyr Gly Leu Leu Gln Val Pro Val Phe Gly Ala Leu Ile Ala Gly Asn 260 265 270 Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ala Leu Ile 275 280 285 Ile Met Gly Gly Trp Pro Ile Val Ala Gly Leu Leu Ile Ala Ala Ala 290 295 300 Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Val Tyr Ala Phe Gly Ile Gly Val Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser 355 360 365 Lys His Ala Tyr Leu Ser Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn 370 375 380 Leu Ala Asn Gly Ile Leu Trp Leu Leu Leu Met Val Ile Phe Leu Lys 385 390 395 400 Asp Lys Arg Val Gly Asp Ser Arg Glu Gly 405 410 <210> 133 <211> 1233 <212> DNA <213> Escherichia marmotae <400> 133 atgcaaaata aattagcaac tggtgccaga cttgggcgcc aggcattact ttttcctctt 60 tgtctggtgc tttacgaatt ctcgacctat atcggcaacg atatgatcca acctggtatg 120 cttgccgtgg ttgagcagta tcaggctggt attgactggg ttcctacttc gatgaccgct 180 tacctggccg gaggaatgtt tttgcagtgg ctgttaggac cactgtcgga tcgtattggt 240 cgccgtccgg taatgttagc tggcgtggtg tggttcataa tcacctgcct ggcgatatta 300 ctggcgcaaa atattgaaca attcacgctg ttacgctttc ttcaagggat aagcctttgt 360 ttcattggcg ctgttggtta cgccgcgatt caggaatctt ttgaagaagc ggtttgtatc 420 aagatcaccg cgctgatggc gaatgtggcg ctgattgctc cgttacttgg gccattagtt 480 ggtgccgcgt ggattcatgt gttaccttgg gaaggaatgt ttgtgttatt tgctgcatta 540 gcggcgatct cattcttcgg tctgcaacgt gcgatgccag aaacggctac gcgcattggc 600 gagaaactgt cgctgaaaga gcttggtcga gactataagc tggtactgaa gaatagccgc 660 tttgttgcag gagcgctggc gctgggattt gtctcgctgc cgttactggc gtggattgcc 720 cagtcaccga ttatcatcat caccggtgaa cagttatcga gctatgaata tggtttactg 780 caagtgccta ttttcggcgc gttaattgcg ggcaatttac tgctggcacg tctgacctcg 840 cgccgtaccg tacgttcgct gattattatg ggtggctggc cgattatgat tggtctgctg 900 gtcgccgcag cggccacggt catctcatcg cacgcgtatt tatggatgac cgccgggtta 960 tcgatttatg cttttggtat tggtctggcg aatgcagggc tggtgcgttt aacgttattc 1020 gcctcggata tgtcgaaagg gacggtatcc gcggcgatgg gaatgttgca aatgctgatc 1080 tttaccgtag gcattgagat ctcgaaacat gcctggctga atggcggcaa tggattattt 1140 aatttattta atcttgccaa cggtgtttta tggctgctgc tgatgtttat ctttttaaaa 1200 gataaacaaa ctggaaattc taacgacgga taa 1233 <210> 134 <211> 410 <212> PRT <213> Escherichia marmotae <400> 134 Met Gln Asn Lys Leu Ala Thr Gly Ala Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln 35 40 45 Ala Gly Ile Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Ala Gly Val Val Trp Phe Ile Ile Thr Cys 85 90 95 Leu Ala Ile Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Leu Leu Arg 100 105 110 Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Ile His Val Leu Pro Trp Glu Gly Met Phe Val Leu 165 170 175 Phe Ala Ala Leu Ala Ala Ile Ser Phe Phe Gly Leu Gln Arg Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Ile Gly Glu Lys Leu Ser Leu Lys Glu Leu 195 200 205 Gly Arg Asp Tyr Lys Leu Val Leu Lys Asn Ser Arg Phe Val Ala Gly 210 215 220 Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Ile Ile Ile Ile Thr Gly Glu Gln Leu Ser Ser Tyr Glu 245 250 255 Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn 260 265 270 Leu Leu Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile 275 280 285 Ile Met Gly Gly Trp Pro Ile Met Ile Gly Leu Leu Val Ala Ala Ala 290 295 300 Ala Thr Val Ile Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Ile Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Ile Ser 355 360 365 Lys His Ala Trp Leu Asn Gly Gly Asn Gly Leu Phe Asn Leu Phe Asn 370 375 380 Leu Ala Asn Gly Val Leu Trp Leu Leu Leu Met Phe Ile Phe Leu Lys 385 390 395 400 Asp Lys Gln Thr Gly Asn Ser Asn Asp Gly 405 410 <210> 135 <211> 1227 <212> DNA <213> Shigella flexneri <400> 135 atgcaaaata aattggctag tggtgccaga ctcggtcgtc aggcgttgct cttccctctc 60 tgtctggtgc tctacgaatt ttcaacctat atcggcaacg atatgatcca acccggtatg 120 ttggccgttg tggaacaata tcaggccggc attgattggg ttcctacttc gatgaccgcg 180 tatctggccg gcggaatgtt tttgcaatgg ctcctggggc cgctgtcgga tcgtattggt 240 cgtcgtccgg tgatgctggc cggtgtggtg tggtttatcg tcacctgtct ggcaatattg 300 ctggcgcaaa atattgaaca attcaccctg ttgcgtttct tgcagggcat aagcttctgt 360 ttcattggcg ctgtgggata cgccgcaatt caggaaagtt tcgaagaagc ggtttgtatc 420 aagatcaccg cgctgatggc gaacgtggcg ctgattgctc cgctactcgg tccgctggtt 480 ggcgcggcgt ggatccatgt gctgccttgg gaaggaatgt ttgttttgtt tgccgcattg 540 gcagcgatca gttttttcgg tctgcaacga gctatgcctg aaaccgccat gcgtataggc 600 gagaaactgt cactgaaaga actcggtcgt gactataagc tggtgctgaa gaacggccgt 660 tttgtggccg gggcgctggg attcgttagc ctgccattgc tggcgtggat cgcccagtcg 720 ccgattatca tcattaccgg ggagcagttg agcagctatg aatatggctt gctgcaagtg 780 cctattttcg gggcgctcat tgccggtaac ttgctgttgg cgcgtctgac ctcgcgtcgt 840 accgtacgtt cgctgattat tatgggcggc tggccgatta tgattggtct gttggtcgct 900 gctgcggcaa cggttatctc atcgcacgcg tatttgtgga tgaccgccgg gttgagtatt 960 tatgctttcg gtattggtct ggcgaatgcg ggactggtgc gattgaccct gtttgccagc 1020 gatatgagta aaggtacggt ttctgcggcg atgggaatgc tgcaaatgct gatctttacc 1080 gtcggtattg aaatcagcaa acatgcctgg ctgaacgggg gcaacggact gtttaatctc 1140 ttcaacctcg tcaacggaat tttgtggctg tcgctgatgg ttatcttttt gaaagataaa 1200 cagatgggaa attctcacgg aggataa 1227 <210> 136 <211> 408 <212> PRT <213> Shigella flexneri <400> 136 Met Gln Asn Lys Leu Ala Ser Gly Ala Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln 35 40 45 Ala Gly Ile Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Ala Gly Val Val Trp Phe Ile Val Thr Cys 85 90 95 Leu Ala Ile Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Leu Leu Arg 100 105 110 Phe Leu Gln Gly Ile Ser Phe Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Ile His Val Leu Pro Trp Glu Gly Met Phe Val Leu 165 170 175 Phe Ala Ala Leu Ala Ala Ile Ser Phe Phe Gly Leu Gln Arg Ala Met 180 185 190 Pro Glu Thr Ala Met Arg Ile Gly Glu Lys Leu Ser Leu Lys Glu Leu 195 200 205 Gly Arg Asp Tyr Lys Leu Val Leu Lys Asn Gly Arg Phe Val Ala Gly 210 215 220 Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala Gln Ser 225 230 235 240 Pro Ile Ile Ile Ile Thr Gly Glu Gln Leu Ser Ser Tyr Glu Tyr Gly 245 250 255 Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn Leu Leu 260 265 270 Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile Ile Met 275 280 285 Gly Gly Trp Pro Ile Met Ile Gly Leu Leu Val Ala Ala Ala Ala Thr 290 295 300 Val Ile Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu Ser Ile 305 310 315 320 Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg Leu Thr 325 330 335 Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala Met Gly 340 345 350 Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Ile Ser Lys His 355 360 365 Ala Trp Leu Asn Gly Gly Asn Gly Leu Phe Asn Leu Phe Asn Leu Val 370 375 380 Asn Gly Ile Leu Trp Leu Ser Leu Met Val Ile Phe Leu Lys Asp Lys 385 390 395 400 Gln Met Gly Asn Ser His Gly Gly 405 <210> 137 <211> 1233 <212> DNA <213> Salmonella enterica subsp. Salamae <400> 137 atgcataatc gtttgcaatc aggcggcaga ctgggtcgtc aggcgctgct ctttcctctt 60 tgtctggtgc tgtacgaatt ttcaacttat attggcaacg acatgatcca gccgggaatg 120 ctggccgtgg tcgcgcagta tcaggcgagc ctggactggg tcccgacgtc gatgaccgct 180 tatctggccg gcggaatgtt cttgcagtgg ctgctcggcc cgttgtcgga ccgtattggc 240 cgtcgtcctg tgatgctggc cggcgttgtg tggtttattg ttacctgcct ggcgacgcta 300 ctggcgaaaa atatcgaaca atttacgttc ctgcgttttt tgcaaggaat tagcttgtgt 360 tttatcggcg ctgtagggta tgccgcgatt caggaatcgt ttgaggaagc ggtatgtata 420 aaaattaccg cgctgatggc gaacgtggcg ttaatcgcgc cgctattggg acccctggtt 480 ggggcagctt gggtgcatgt tctgccgtgg gaaggaatgt ttattttatt tgccgtactg 540 gccgctatcg cctttttcgg gcttcaacgc gctatgccgg agactgccac gcgacggggc 600 gaaacgttat cattcaaagt gctgggccgg gattatcggc tggtgataaa aaaccggcga 660 tttgttgctg gagcgttagc gctgggattt gttagcctgc cgctgttggc ctggattgcg 720 cagtcgccga ttatcatcat tagcggcgaa cagcttagca gctatgaata tgggctgctt 780 caggtgcctg tctttggcgc gctgattgcc gggaatctgg tgttggcgcg tttaacctcg 840 cgacgtacgg tccgctcgct gatcgtaatg ggcggatggc ctattgttgc cgggctgatt 900 atcgccgccg cggcgactgt ggtatcatcg catgcttatt tatggatgac tgcgggatta 960 agcgtatacg cttttggcat tgggctggcg aatgccggac tggtgcggct cacgctattc 1020 tcgagcgata tgtcaaaagg aacggtttcc gcggcgatgg gaatgcttca aatgctgatt 1080 tttaccgtcg gcattgaagt atcaaaacac gcctggttaa gcggcggcaa tgggctattt 1140 agcctgttta atctggctaa cgggattctc tggctactgc tgatgctggt tttcttaaaa 1200 gataagcgga ctggggactc gcaaactggc taa 1233 <210> 138 <211> 410 <212> PRT <213> Salmonella enterica subsp. Salamae <400> 138 Met His Asn Arg Leu Gln Ser Gly Gly Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Ala Gln Tyr Gln 35 40 45 Ala Ser Leu Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Ala Gly Val Val Trp Phe Ile Val Thr Cys 85 90 95 Leu Ala Thr Leu Leu Ala Lys Asn Ile Glu Gln Phe Thr Phe Leu Arg 100 105 110 Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Val His Val Leu Pro Trp Glu Gly Met Phe Ile Leu 165 170 175 Phe Ala Val Leu Ala Ala Ile Ala Phe Phe Gly Leu Gln Arg Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Arg Gly Glu Thr Leu Ser Phe Lys Val Leu 195 200 205 Gly Arg Asp Tyr Arg Leu Val Ile Lys Asn Arg Arg Phe Val Ala Gly 210 215 220 Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Ile Ile Ile Ile Ser Gly Glu Gln Leu Ser Ser Tyr Glu 245 250 255 Tyr Gly Leu Leu Gln Val Pro Val Phe Gly Ala Leu Ile Ala Gly Asn 260 265 270 Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile 275 280 285 Val Met Gly Gly Trp Pro Ile Val Ala Gly Leu Ile Ile Ala Ala Ala 290 295 300 Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Val Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ser Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser 355 360 365 Lys His Ala Trp Leu Ser Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn 370 375 380 Leu Ala Asn Gly Ile Leu Trp Leu Leu Leu Met Leu Val Phe Leu Lys 385 390 395 400 Asp Lys Arg Thr Gly Asp Ser Gln Thr Gly 405 410 <210> 139 <211> 1233 <212> DNA <213> Citrobacter youngae ATCC 29220 <400> 139 atgcagaacc gtctctcatc aggcgcccgg ctgggtcgtc aggctctcct ttttcctctt 60 tgtctggtgc tttacgaatt ctcgacttat atcggcaacg atatgatcca acctggcatg 120 ctcgcggttg tggagcaata taacgccgga ctcgattggg tacctacttc gatgaccgct 180 tatctggccg ggggcatgtt tctccagtgg ctgctcggac cgctgtcgga tcgtattggg 240 cgccgcccgg tgatgctcac cggcgtgctt tggttcattg tgacctgcct tgcgaccctg 300 cttgcgcaga atattgagca atttaccttt ctgcgtttcc tccaagggat aagcctgtgc 360 tttatcggcg cggttggtta cgccgcgatt caggaatcgt ttgaagaagc ggtgtgcata 420 aaaattaccg cgctgatggc taacgtagcg ctgattgcgc cgctgctggg accgctcgtc 480 ggcgctgcct gggtgcatat tctgccgtgg gaaggaatgt ttatcctgtt tgctgccctt 540 gcgtcgatct cgttttttgg tctgcaacgc gcgatgccgg aaacggctac ccggctcggc 600 gaaaagctgt cgattaaaga gctgggtaaa gattataagc tggtgctaaa aaatgggcgc 660 tttgttgccg gtgcgctggc tctcggtttt gtcagcctgc cgctcctggc gtggattgcg 720 caatcgccga ttattatcat cagcggtgaa catcttagca gctacgaata tggcctgctc 780 caggtgccga tttttggcgc tctcattgcc ggtaatctgg cgctggcgcg actgacttcg 840 cgcaagaccg tgcgttcgct gattatcatg ggcggctggc ctatcgccgt cgggctggtg 900 attgccgcgg ccgccacggt tgtgtcatcg catgcgtatc tctggatgac ggccggtctt 960 agcgtctatg cgttcggcat tggtctggcg aatgccgggc tggttcgcct gacgctgttt 1020 gcctcagaaa tgtcaaaggg gacggtttca gcagcaatgg gcatgctcca gatgctgatc 1080 tttaccgtcg gtattgagct gagcaaacac gcttatctgc tgggaggaaa cggcctcttc 1140 agcctgttta atctggctag cggcgtgctg tggctgatac tcatggttat cttcctgaaa 1200 gataaacggg tagggaattc gcggaaaatt taa 1233 <210> 140 <211> 410 <212> PRT <213> Citrobacter youngae ATCC 29220 <400> 140 Met Gln Asn Arg Leu Ser Ser Gly Ala Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Asn 35 40 45 Ala Gly Leu Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Thr Gly Val Leu Trp Phe Ile Val Thr Cys 85 90 95 Leu Ala Thr Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Phe Leu Arg 100 105 110 Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Val His Ile Leu Pro Trp Glu Gly Met Phe Ile Leu 165 170 175 Phe Ala Ala Leu Ala Ser Ile Ser Phe Phe Gly Leu Gln Arg Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Ile Lys Glu Leu 195 200 205 Gly Lys Asp Tyr Lys Leu Val Leu Lys Asn Gly Arg Phe Val Ala Gly 210 215 220 Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Ile Ile Ile Ile Ser Gly Glu His Leu Ser Ser Tyr Glu 245 250 255 Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn 260 265 270 Leu Ala Leu Ala Arg Leu Thr Ser Arg Lys Thr Val Arg Ser Leu Ile 275 280 285 Ile Met Gly Gly Trp Pro Ile Ala Val Gly Leu Val Ile Ala Ala Ala 290 295 300 Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Val Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Leu Ser 355 360 365 Lys His Ala Tyr Leu Leu Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn 370 375 380 Leu Ala Ser Gly Val Leu Trp Leu Ile Leu Met Val Ile Phe Leu Lys 385 390 395 400 Asp Lys Arg Val Gly Asn Ser Arg Lys Ile 405 410 <210> 141 <211> 1233 <212> DNA <213> Citrobacter freundii <400> 141 atgcagaacc gtctttcttc aggcgcccgc ttggggcgcc aggcactcct tttccctctt 60 tgtctggtgc tttacgaatt ctctacttat atcggtaacg atatgatcca acctggaatg 120 ttagcggttg tggagcaata tcaggccggt cttgattggg ttccaacgtc gatgaccgct 180 tatctggcag gcggcatgtt tctccagtgg ttgctcgggc cgctgtctga ccgtgttggt 240 cgtcgtccgg tgatgctcac cggagtggtt tggttcattg tgacctgcct agcaacgctg 300 tttgctcaaa atattgagca atttactttc ctgcgttttc tccaagggat tagcctgtgc 360 tttattggcg cggtcggtta cgccgcaatt caggagtcgt ttgaagaagc ggtgtgcatt 420 aaaatcactg cgctaatggc aaacgtagca ttgattgcac cgcttttggg accgttggtt 480 ggggccgcct gggtccatgt ccttccgtgg gaaggcatgt ttgtcctgtt tgccgcgctg 540 gctgcaattg ccttttttgg cctgcagcgc gcgatgccgg aaacggctac ccgtctgggc 600 gagaagcttt ctatcaaaga gttgggcaaa gattataagc tggtgctaaa gaatgtgcgt 660 tttgtcgcag gcgcactggc attgggcttt gtctcactgc cattgctggc gtggattgcg 720 cagtcgccga tcattattat ctcaggcgaa catcttagca gctacgaata tggcctgctc 780 caggtgccga tttttggtgc actgattgca ggcaacctgg tgctggcgcg tctgacttcg 840 cgccgcacgg tgcgctctct gatcatcatg ggtggctggc caatctccgt gggattgatc 900 attgccgccg cggccacggt tgtttcttct catgcgtatc tgtggatgac ggctggtctt 960 tcactttatg catttggcat tggcgtggcg aatgccgggt tggtgcgcct gacgctgttt 1020 gcctcagaaa tgagcaaagg gactgtttca gcagcaatgg gtatgctgca aatgctgata 1080 tttaccgttg gtattgagct gagcaaacat gcttatctgc tgggtggaaa cggcttgttc 1140 tcactgttta atctggccag cggtgtgctg tggctgattc tgatggttat ctttctgaaa 1200 gataagcgag tagggaattc gcgggaaggc taa 1233 <210> 142 <211> 410 <212> PRT <213> Citrobacter freundii <400> 142 Met Gln Asn Arg Leu Ser Ser Gly Ala Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln 35 40 45 Ala Gly Leu Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Val Gly 65 70 75 80 Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys 85 90 95 Leu Ala Thr Leu Phe Ala Gln Asn Ile Glu Gln Phe Thr Phe Leu Arg 100 105 110 Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Val His Val Leu Pro Trp Glu Gly Met Phe Val Leu 165 170 175 Phe Ala Ala Leu Ala Ala Ile Ala Phe Phe Gly Leu Gln Arg Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Ile Lys Glu Leu 195 200 205 Gly Lys Asp Tyr Lys Leu Val Leu Lys Asn Val Arg Phe Val Ala Gly 210 215 220 Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Ile Ile Ile Ile Ser Gly Glu His Leu Ser Ser Tyr Glu 245 250 255 Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn 260 265 270 Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile 275 280 285 Ile Met Gly Gly Trp Pro Ile Ser Val Gly Leu Ile Ile Ala Ala Ala 290 295 300 Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Leu Tyr Ala Phe Gly Ile Gly Val Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Leu Ser 355 360 365 Lys His Ala Tyr Leu Leu Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn 370 375 380 Leu Ala Ser Gly Val Leu Trp Leu Ile Leu Met Val Ile Phe Leu Lys 385 390 395 400 Asp Lys Arg Val Gly Asn Ser Arg Glu Gly 405 410 <210> 143 <211> 1230 <212> DNA <213> Enterobacter kobei <400> 143 atgcaaaacc attcacttcc cggccgccgt cttggacgcc aggcgcttct ttttccgttg 60 tgtctggtcc tgtacgaatt ctcaacttat attgcgaacg acatgattca gccgggcatg 120 ttagcggttg tagagcagta taacgcgggc attgaatggg taccgacctc gatgaccgcg 180 tatttagcgg gcggaatgtt tcttcagtgg ctgctggggc cgctgtcgga tcgtatcggc 240 cgtcgcccgg tcatgcttac cggcgtggtg tggtttattg tcacctgtct ggctaccctt 300 ctggcgcagg acattgaaca gttcactctg ctgcgctttc ttcaaggcgt gagcctgtgc 360 tttatcggcg ccgtgggcta tgcggcgatc caggagtcgt ttgacgaggc gacctgtatt 420 aagattactg ctcttatggc gaacgtggcg ctgattgcgc ctctgctggg gccgctggtt 480 ggtgcggcct gggtgcatgc tgcgccttgg gaaggcatgt ttgtgctgtt cgcggtactg 540 gccgcgatcg cgtttttcgg cctgcatcgc gcgatgccgg aaaccgcgac gagattaggg 600 gagccccttt cgcttaacgc gctgggccgg gattataaag cggtgctgaa aaatggccgc 660 ttcgttgcgg gcgcgctggc gacgggcttt gtcagcctgc cgctgctggc gtggattgcg 720 cagtcgccga tcattattat tagcgcggaa ggcatgtcga gctatgagta cggtctgctt 780 caggtgccta tctttggcgc gctgatcatt ggtaacctgg tgctggcgcg tctgacctca 840 cgccgtaccg tgagatcgct gatcatcatg ggcggcgggc cgatcgtcgc gggactgctg 900 gtcgcggccg tggctaccgt ggcgtcatcg catgcgtatc tttggatgac cgcgggcctg 960 tcaatctatg cttttggtat cggccttgcg aacgccgggc tggtgcgcct gacgctgttc 1020 gcgagcgata tgtcaaaagg taccgtgtca gcggctatgg gcatgctgca aatggcgatc 1080 ttcaccgtcg gcattgaagt ctcaaaacat gcgtttctgg ccggcggcaa tggcctgttc 1140 agcctgttta atctggcgaa cgggcttatt tggctggcgc tgatggttgt attcctgaag 1200 gataaaacgg tcggcaacgc gctttcataa 1230 <210> 144 <211> 409 <212> PRT <213> Enterobacter kobei <400> 144 Met Gln Asn His Ser Leu Pro Gly Arg Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Ala 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Asn 35 40 45 Ala Gly Ile Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys 85 90 95 Leu Ala Thr Leu Leu Ala Gln Asp Ile Glu Gln Phe Thr Leu Leu Arg 100 105 110 Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Asp Glu Ala Thr Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Val His Ala Ala Pro Trp Glu Gly Met Phe Val Leu 165 170 175 Phe Ala Val Leu Ala Ala Ile Ala Phe Phe Gly Leu His Arg Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Leu Gly Glu Pro Leu Ser Leu Asn Ala Leu 195 200 205 Gly Arg Asp Tyr Lys Ala Val Leu Lys Asn Gly Arg Phe Val Ala Gly 210 215 220 Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Ile Ile Ile Ile Ser Ala Glu Gly Met Ser Ser Tyr Glu 245 250 255 Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ile Gly Asn 260 265 270 Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile 275 280 285 Ile Met Gly Gly Gly Pro Ile Val Ala Gly Leu Leu Val Ala Ala Val 290 295 300 Ala Thr Val Ala Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Ile Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Ala Ile Phe Thr Val Gly Ile Glu Val Ser 355 360 365 Lys His Ala Phe Leu Ala Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn 370 375 380 Leu Ala Asn Gly Leu Ile Trp Leu Ala Leu Met Val Val Phe Leu Lys 385 390 395 400 Asp Lys Thr Val Gly Asn Ala Leu Ser 405 <210> 145 <211> 1236 <212> DNA <213> Enterobacter sp. <400> 145 atgctaaacc ggtcatcatc aggcactcgc ctgggtcggc aggcgctact attcccactg 60 tgcctggtgc tatacgagtt ctcgacctat attgggaacg atatgattca gccaggcatg 120 ttagccgtgg ttgcgcagta taacgcgggc attgaatggg tgccaacctc gatgaccgct 180 tacctggccg gtggcatgtt tcttcagtgg ctgttaggcc cgctgagcga ccggatcggc 240 cgacggccgg tgatgttaac cggtgtggcg tggtttattg ttacctgtct ggcgaccctg 300 ctggcgcaaa ccattgaaca gtttatggtg ctgcggtttc ttcaaggtgt tagcctgtgc 360 tttattggcg cggttggtta cgcggcgatt caggaaagct ttgaagaagc ggtgtgcatt 420 aaaattaccg cgctgatggc taacgtggcg ctgatcgcgc cgctgctggg cccgctggta 480 ggcgcggcct gggtgcatgt tgcgccctgg gaaggcatgt ttgtgctgtt tgcggtgcta 540 gcggcgatta gcttttatgg gctgcatcgg gcgatgccag agactgctac ccgcattggc 600 gagaagttat cactgcagga actgggtcgc gactataaag aagtgctgaa aaacgggcgc 660 tttgtggccg gtgcgctggc gatcggcttt gtttgtctgc cgctgctggc gtggattgcg 720 cagagcccgg tgattattat tagcggcgag aacttaagca gctacgagta tggcctgctc 780 caggtgccga tctttggggc gctgatcgtg gggaatattg tgctggcgcg gctaaccagc 840 cgccggaccg tgcgcagcct gatcatcatg ggcggctggc cgattgtgat cggtctggtt 900 gttgcggccg tggcgactgt tgtttcaagc catgcgtacc tgtggatgac cgccgggtta 960 agcatttacg cgtttgggat cggtctggct aacgcgggcc tggtgcgcct gactctgttt 1020 gcgagcgaag tgagcaaagg tactgtgagc gcggcgatgg gcatgcttca gatgctgatt 1080 tttaccgtgg gcatcgaagt gagcaaacat gcgttcagca gcggcggcaa cggtctgttc 1140 agcctgttta atctggtaaa cggcctgctg tggctggcgc tgatgtttgt tttcctgaaa 1200 gacaagcgag tgggctcaag ccttcaaccg ggataa 1236 <210> 146 <211> 411 <212> PRT <213> Enterobacter sp. <400> 146 Met Leu Asn Arg Ser Ser Ser Gly Thr Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Ala Gln Tyr Asn 35 40 45 Ala Gly Ile Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Thr Gly Val Ala Trp Phe Ile Val Thr Cys 85 90 95 Leu Ala Thr Leu Leu Ala Gln Thr Ile Glu Gln Phe Met Val Leu Arg 100 105 110 Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Val His Val Ala Pro Trp Glu Gly Met Phe Val Leu 165 170 175 Phe Ala Val Leu Ala Ala Ile Ser Phe Tyr Gly Leu His Arg Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Ile Gly Glu Lys Leu Ser Leu Gln Glu Leu 195 200 205 Gly Arg Asp Tyr Lys Glu Val Leu Lys Asn Gly Arg Phe Val Ala Gly 210 215 220 Ala Leu Ala Ile Gly Phe Val Cys Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Asn Leu Ser Ser Tyr Glu 245 250 255 Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Val Gly Asn 260 265 270 Ile Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile 275 280 285 Ile Met Gly Gly Trp Pro Ile Val Ile Gly Leu Val Val Ala Ala Val 290 295 300 Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Ile Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ala Ser Glu Val Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser 355 360 365 Lys His Ala Phe Ser Ser Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn 370 375 380 Leu Val Asn Gly Leu Leu Trp Leu Ala Leu Met Phe Val Phe Leu Lys 385 390 395 400 Asp Lys Arg Val Gly Ser Ser Leu Gln Pro Gly 405 410 <210> 147 <211> 1230 <212> DNA <213> Lelliottia sp. WB101 <400> 147 atgctaaacc gttcatcatc gggtaaccgt ctgggtcgtc aggcgctact ttttcctctg 60 tgtctggtgc tttatgaatt ttcgacctat attggcaatg atatgattca gccgggtatg 120 ttagcggttg tggagcagta taacgccggg attgaatggg taccgacttc gatgaccgcg 180 tacctggctg gcggcatgtt ccttcagtgg ctgctggggc cgctgtcgga tcgcatcggc 240 cgtcgcccgg tgatgctgac tggcgtggtg tggttcattg ttacctgctt agcgatcctg 300 ctggctcaaa cgatcgaaca atttactctg ctgcgatttc ttcaaggagt gagcctgtgc 360 ttcattggcg ccgtgggata cgcggctatc caggagtcgt tcgaggaagc ggtgtgtatt 420 aaaattaccg cgctgatggc gaacgtggcg ctgatcgcgc cgctgttagg cccgttagtg 480 ggcgcggcct gggtgcatgt agcgccgtgg gaaggaatgt tcgtgctgtt tgcggctctt 540 gcggcgatct cgttttttgg ccttcatcgc gctatgcctg aaaccgcgac tcgactgggc 600 gaaaaactgt cgcttaaaga gctggggcgc gactataaag aagtgttaag gaatggccgc 660 ttcgtggccg gcgcgctggc gaccgggttc gttagcctgc cgctgctggc gtggatcgcg 720 cagtcaccgg ttatcatcat cagcggtgag aagttatcaa gctatgaata tggtctactc 780 caggtgcctg tattcggcgc gctgatcatt ggtaacctgg tgctggctcg cttaacttcg 840 cgtcgtagcg tgcgttcgct gattatcatg ggcggctggc cgatcgtggc cgggctggtt 900 gtagctgcgg tagcgaccgt tgcgtcatct catgcgtacc tgtggatgac tgccgggctg 960 tcaatctacg cgttcgggat cgggctggcg aatgccgggc tggtgcgcct gacgctgttc 1020 gcgagcgaga tgtcaaaagg caccgtatcg gccgctatgg gaatgctgca gatgctgatt 1080 ttcaccgtgg gcatcgaagt ttcaaaacat gcgtatagct tcggcggcaa cgggctgttt 1140 agcctgttca acttagcgaa tggcgtgctg tggttagggc tgatggtgat gtttctgaaa 1200 gataaacgcg ttggtagcgc gcttcagtaa 1230 <210> 148 <211> 409 <212> PRT <213> Lelliottia sp. WB101 <400> 148 Met Leu Asn Arg Ser Ser Ser Gly Asn Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Asn 35 40 45 Ala Gly Ile Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys 85 90 95 Leu Ala Ile Leu Leu Ala Gln Thr Ile Glu Gln Phe Thr Leu Leu Arg 100 105 110 Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Val His Val Ala Pro Trp Glu Gly Met Phe Val Leu 165 170 175 Phe Ala Ala Leu Ala Ala Ile Ser Phe Phe Gly Leu His Arg Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Lys Glu Leu 195 200 205 Gly Arg Asp Tyr Lys Glu Val Leu Arg Asn Gly Arg Phe Val Ala Gly 210 215 220 Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Lys Leu Ser Ser Tyr Glu 245 250 255 Tyr Gly Leu Leu Gln Val Pro Val Phe Gly Ala Leu Ile Ile Gly Asn 260 265 270 Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Ser Val Arg Ser Leu Ile 275 280 285 Ile Met Gly Gly Trp Pro Ile Val Ala Gly Leu Val Val Ala Ala Val 290 295 300 Ala Thr Val Ala Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Ile Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser 355 360 365 Lys His Ala Tyr Ser Phe Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn 370 375 380 Leu Ala Asn Gly Val Leu Trp Leu Gly Leu Met Val Met Phe Leu Lys 385 390 395 400 Asp Lys Arg Val Gly Ser Ala Leu Gln 405 <210> 149 <211> 1233 <212> DNA <213> Enterobacter ludwigii EcWSU1 <400> 149 atgcttaacc gttcatcatc aggttcacgt ctgggtcgtc aggcgcttct ctttcctctt 60 tgtctggtgt tatatgaatt ttcaacttat attggcaacg atatgattca gcctggcatg 120 ctggccgtcg ttgaacagta taacgctggg attgaatggg taccgacttc gatgaccgcg 180 tacctggctg gcggcatgtt ccttcagtgg ctgcttgggc cgctgtcgga tcgtatcggc 240 cgtcgtccgg tgatgctgac tggcgtggtg tggttcattg tgacctgctt agcgacgctg 300 ctggcgcaaa atatcgagca attcaccctg ctgcgctttc tgcaaggagt gagcttatgc 360 tttattggtg cggttgggta cgcggcgatt caggaatcgt tcgaggaagc ggtgtgtatt 420 aagatcaccg cgctgatggc gaacgtggcg ctgattgcgc ctctgctggg gccgctggtt 480 ggcgctgcct gggtccatgt cgctccgtgg gaaggaatgt ttgtgctgtt cgcggtgctg 540 gccgcggttg cttttttcgg cctgcatcgc gcgatgccgg aaaccgctac ccgtctgggt 600 gagaaactgt cgctaaaaga gctgggccgg gattataaag aagtgctgaa gaacggccgc 660 ttcgttgcgg gcgcgctagc gactgggttc gtcagcctgc ctctgctggc gtggatcgcg 720 cagtcgccgg ttatcattat tagcggcgag cagttaagca gctacgagta cggcctgctc 780 caggtgccta tcttcggcgc gctgatcatt ggtaacctgg tgctggcgcg tttaacttcg 840 cgccgtacgg tgcgtgcgct tattatcatg ggcggctggc ctatcgctgc cgggctggtc 900 ttagcggccg ttgcgactgt ggtgtcgtcc cacgcgtacc tgtggatgac cgctggactt 960 agcgtctatg cgtttggtat tggtgtggcg aatgccgggc tggtacgcct gacgctgttc 1020 gcgagcgaga tgagcaaagg cacggtgtca gcggcgatgg gcatgcttca aatgctgatc 1080 tttaccgtcg gaattgaagt gagcaaacat gcgtatgctt tcggcggcaa cggtctgttt 1140 agcctgttca atctggctaa cggcgtgtta tgggtcgggc tcattgtggt gtttctgaag 1200 gataaacgcg ttgggaatgc tcttcagccg taa 1233 <210> 150 <211> 410 <212> PRT <213> Enterobacter ludwigii EcWSU1 <400> 150 Met Leu Asn Arg Ser Ser Ser Gly Ser Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Asn 35 40 45 Ala Gly Ile Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys 85 90 95 Leu Ala Thr Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Leu Leu Arg 100 105 110 Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Val His Val Ala Pro Trp Glu Gly Met Phe Val Leu 165 170 175 Phe Ala Val Leu Ala Ala Val Ala Phe Phe Gly Leu His Arg Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Lys Glu Leu 195 200 205 Gly Arg Asp Tyr Lys Glu Val Leu Lys Asn Gly Arg Phe Val Ala Gly 210 215 220 Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Leu Ser Ser Tyr Glu 245 250 255 Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ile Gly Asn 260 265 270 Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ala Leu Ile 275 280 285 Ile Met Gly Gly Trp Pro Ile Ala Ala Gly Leu Val Leu Ala Ala Val 290 295 300 Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Val Tyr Ala Phe Gly Ile Gly Val Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser 355 360 365 Lys His Ala Tyr Ala Phe Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn 370 375 380 Leu Ala Asn Gly Val Leu Trp Val Gly Leu Ile Val Val Phe Leu Lys 385 390 395 400 Asp Lys Arg Val Gly Asn Ala Leu Gln Pro 405 410 <210> 151 <211> 654 <212> DNA <213> Actinoplanes utahensis <400> 151 atgctaaccc atgtgtttgg cctattaggc gcggcgctga gcatgagcat tgcgtggcct 60 caggtgtatc gcagctgcgt gcgtcgtcgt accggcggcc tgagcgcgac cgcgtgcatg 120 ctggccgtgg cgatgccgct gggctgggtg acctatgggc tgctgattgg agaccgattt 180 caagtggtga cgaacgcggt gagcgcgagc accggagtgg cgattctgat tgcgctgctg 240 gtgacccgac cagcggtgcg cagcggccgc gcgctgctgg cgagcgtggg cgcggccgcc 300 ggagtgctgc tggccgtgac ggcgattgcg gcgagcgcgg cgctgcctca ggtgagcggg 360 ccgcgcgccg cggcgatgct gggcaccgtg ctggccgcga ttagctttgt gagcgcgata 420 ccgcagccgt tagcgctgct gcgtgatcgc gatcaggata ttagcgggct gagcccggtg 480 cgttggacgc tcgcggcgag cgcgtgcgcg agctggtttg cgtatggctt aggagtgggg 540 cagccagcgg tgtgggcgag cgcgttagtg ggcctgacca gcgcgctgac cgtgtgcggc 600 gtgctgttta cccgtcgtgc gggcgccggc gtgcgcgtgc tggcgaccgc gtaa 654 <210> 152 <211> 217 <212> PRT <213> Actinoplanes utahensis <400> 152 Met Leu Thr His Val Phe Gly Leu Leu Gly Ala Ala Leu Ser Met Ser 1 5 10 15 Ile Ala Trp Pro Gln Val Tyr Arg Ser Cys Val Arg Arg Arg Thr Gly 20 25 30 Gly Leu Ser Ala Thr Ala Cys Met Leu Ala Val Ala Met Pro Leu Gly 35 40 45 Trp Val Thr Tyr Gly Leu Leu Ile Gly Asp Arg Phe Gln Val Val Thr 50 55 60 Asn Ala Val Ser Ala Ser Thr Gly Val Ala Ile Leu Ile Ala Leu Leu 65 70 75 80 Val Thr Arg Pro Ala Val Arg Ser Gly Arg Ala Leu Leu Ala Ser Val 85 90 95 Gly Ala Ala Ala Gly Val Leu Leu Ala Val Thr Ala Ile Ala Ala Ser 100 105 110 Ala Ala Leu Pro Gln Val Ser Gly Pro Arg Ala Ala Ala Met Leu Gly 115 120 125 Thr Val Leu Ala Ala Ile Ser Phe Val Ser Ala Ile Pro Gln Pro Leu 130 135 140 Ala Leu Leu Arg Asp Arg Asp Gln Asp Ile Ser Gly Leu Ser Pro Val 145 150 155 160 Arg Trp Thr Leu Ala Ala Ser Ala Cys Ala Ser Trp Phe Ala Tyr Gly 165 170 175 Leu Gly Val Gly Gln Pro Ala Val Trp Ala Ser Ala Leu Val Gly Leu 180 185 190 Thr Ser Ala Leu Thr Val Cys Gly Val Leu Phe Thr Arg Arg Ala Gly 195 200 205 Ala Gly Val Arg Val Leu Ala Thr Ala 210 215 <210> 153 <211> 261 <212> DNA <213> Chitinophagaceae bacterium PMG_246 <400> 153 atggataaaa cccagattgt aggcattgtt gcgggcatac tcactgcgag cagcctgctg 60 cctcaggtga ttaaaaccct aaaagaaaag aaggccgccg aagtaagcat tggcatgctg 120 attacgctga tgttaggcgt agcactgtgg attgtatatg gctttctgcg cgatgatctg 180 ccgattattg taacgaactg cttcagcctg ctggtgaatc tgaccatgat tggactgcgg 240 ctgaagtata ggcatcgctg a 261 <210> 154 <211> 86 <212> PRT <213> Chitinophagaceae bacterium PMG_246 <400> 154 Met Asp Lys Thr Gln Ile Val Gly Ile Val Ala Gly Ile Leu Thr Ala 1 5 10 15 Ser Ser Leu Leu Pro Gln Val Ile Lys Thr Leu Lys Glu Lys Lys Ala 20 25 30 Ala Glu Val Ser Ile Gly Met Leu Ile Thr Leu Met Leu Gly Val Ala 35 40 45 Leu Trp Ile Val Tyr Gly Phe Leu Arg Asp Asp Leu Pro Ile Ile Val 50 55 60 Thr Asn Cys Phe Ser Leu Leu Val Asn Leu Thr Met Ile Gly Leu Arg 65 70 75 80 Leu Lys Tyr Arg His Arg 85 <210> 155 <211> 252 <212> DNA <213> Rhizobium sp. PDC82 <400> 155 atgatagatg ctgggctcct ggtcgggtat ttagcgagca tctgcagcgt tgcccggaaa 60 gtggtaaaga ccggggacac tgctgcgatc agcgcgcgca tgtatgtttt aaccgttatt 120 ggcttcgcct tatggaccgg gtttgggcta ttacgcggcg agtggccgat tatcctcacc 180 aatagcattt gcttctgcct gagcggcgtc gtgttatttc gaaaattaac cgcccgcaat 240 cgcgccgggt aa 252 <210> 156 <211> 83 <212> PRT <213> Rhizobium sp. PDC82 <400> 156 Met Ile Asp Ala Gly Leu Leu Val Gly Tyr Leu Ala Ser Ile Cys Ser 1 5 10 15 Val Ala Arg Lys Val Val Lys Thr Gly Asp Thr Ala Ala Ile Ser Ala 20 25 30 Arg Met Tyr Val Leu Thr Val Ile Gly Phe Ala Leu Trp Thr Gly Phe 35 40 45 Gly Leu Leu Arg Gly Glu Trp Pro Ile Ile Leu Thr Asn Ser Ile Cys 50 55 60 Phe Cys Leu Ser Gly Val Val Leu Phe Arg Lys Leu Thr Ala Arg Asn 65 70 75 80 Arg Ala Gly <210> 157 <211> 687 <212> DNA <213> Kineococcus rhizosphaerae DSM 19711 <400> 157 atgccggtga ccaccctaat ttcaagctta ggattattag ccgcgggatt aggcgtgttt 60 tgcggtattc ctcaggttgt gcgcttagtg cgtgatccgg atgcgaccgg cctgagctat 120 ccgagcgcgg tgttaggcgc gttagcgagc gcgacctggt taagctatgg cgtggcgctg 180 cgcgacccgg cgcagttagt ggcgaacgtg ccgggtattg tgtgcgcggt gttaaccgtg 240 gtgttagcgg cgaaacgtct gggcctgccg ctgcgcaccg cggcgtatgc ggccgccggt 300 tgggcgccgt tagttgcggc cgcgtttgcg ttaggtggcg ttgtggttgt tggcgtgctg 360 ggcaccaccg tgagcttagt gaaaatgctg ccgcagattt taaccgtggt gcgccgcgat 420 ccggtgcatg gcctggcgcc ggcgaccttt gtgttaaccc aggtgagcgc gaccctgtgg 480 accgcgtatg gcctggcgac cgggcagtgg agcgttgtgg tgtgcagcgc ggtgaccgtg 540 gtgctggccg gtattgtgct gagccgccgc tgcccgccgt tagcggttgc gcgcgcgctg 600 catgaaggcc gctttggcgt gccgggtcag ttattagtgc gcccgtttgt gctggcgcgt 660 cgtgcgggct taaccctggc cgcgtaa 687 <210> 158 <211> 228 <212> PRT <213> Kineococcus rhizosphaerae DSM 19711 <400> 158 Met Pro Val Thr Thr Leu Ile Ser Ser Leu Gly Leu Leu Ala Ala Gly 1 5 10 15 Leu Gly Val Phe Cys Gly Ile Pro Gln Val Val Arg Leu Val Arg Asp 20 25 30 Pro Asp Ala Thr Gly Leu Ser Tyr Pro Ser Ala Val Leu Gly Ala Leu 35 40 45 Ala Ser Ala Thr Trp Leu Ser Tyr Gly Val Ala Leu Arg Asp Pro Ala 50 55 60 Gln Leu Val Ala Asn Val Pro Gly Ile Val Cys Ala Val Leu Thr Val 65 70 75 80 Val Leu Ala Ala Lys Arg Leu Gly Leu Pro Leu Arg Thr Ala Ala Tyr 85 90 95 Ala Ala Ala Gly Trp Ala Pro Leu Val Ala Ala Ala Phe Ala Leu Gly 100 105 110 Gly Val Val Val Val Gly Val Leu Gly Thr Thr Val Ser Leu Val Lys 115 120 125 Met Leu Pro Gln Ile Leu Thr Val Val Arg Arg Asp Pro Val His Gly 130 135 140 Leu Ala Pro Ala Thr Phe Val Leu Thr Gln Val Ser Ala Thr Leu Trp 145 150 155 160 Thr Ala Tyr Gly Leu Ala Thr Gly Gln Trp Ser Val Val Val Cys Ser 165 170 175 Ala Val Thr Val Val Leu Ala Gly Ile Val Leu Ser Arg Arg Cys Pro 180 185 190 Pro Leu Ala Val Ala Arg Ala Leu His Glu Gly Arg Phe Gly Val Pro 195 200 205 Gly Gln Leu Leu Val Arg Pro Phe Val Leu Ala Arg Arg Ala Gly Leu 210 215 220 Thr Leu Ala Ala 225 <210> 159 <211> 279 <212> DNA <213> Morganella morganii IS15 <400> 159 atgtcggata ctaaacgtcc gccgcacgat catagccgtt ttattcgttg tctcggttgg 60 gttgccacct ttactgcctt ttgcatgtat gttagctata tcccccagat catggataac 120 ctggccgggc ataaaacttc gccgctgcag ccgctggctg cggcctttaa ttgcactctt 180 tgggtgatct acggtcttaa agtgaaagat ctgccggtcg ccgttgcgaa cgcgcccggt 240 gttctgttcg ggctggccgc catgctgact gccttgtag 279 <210> 160 <211> 92 <212> PRT <213> Morganella morganii IS15 <400> 160 Met Ser Asp Thr Lys Arg Pro Pro His Asp His Ser Arg Phe Ile Arg 1 5 10 15 Cys Leu Gly Trp Val Ala Thr Phe Thr Ala Phe Cys Met Tyr Val Ser 20 25 30 Tyr Ile Pro Gln Ile Met Asp Asn Leu Ala Gly His Lys Thr Ser Pro 35 40 45 Leu Gln Pro Leu Ala Ala Ala Phe Asn Cys Thr Leu Trp Val Ile Tyr 50 55 60 Gly Leu Lys Val Lys Asp Leu Pro Val Ala Val Ala Asn Ala Pro Gly 65 70 75 80 Val Leu Phe Gly Leu Ala Ala Met Leu Thr Ala Leu 85 90 <210> 161 <211> 822 <212> DNA <213> Geodermatophilus obscurus (strain ATCC 25078 / DSM 43160 / JCM 3152 / G-20) <400> 161 atgacctcac cggtgattcc cgctgcggtt gcgctgccgc tgaccgatga acgcccggaa 60 ccggcgtgtg gctgtcccgc gcgccgctgg ccgcatccca gccagagcac cagaacggag 120 ccacgcagca ccatgattgc ggcgctgggc agcctggccg cggcgctgag cattaccgtg 180 gtgtggcccc aggtgtggct gagctgccgc catggccgca ccctgggcct gagcccgacg 240 ggcagctggc tggccgtggg cctgaacctg tgctggctga ccagcggcct gctggttggc 300 gataccccgc agattgcgac ccatgccgtg gttggcgcgg gcaataccgc ggtgctggcc 360 gcgctgctgc tgacccagcc gcatgcgcgc agcgcgcaag tgctgctgcg caccgccgcg 420 ggagccgcgg gcctggccgc gctggccgcg ggcggcgttg cggccgtggt gctgggagcg 480 gatacgactc aggtgacgag cgtgctggcg agcgtgacca ccgtggttgg cattgtggcc 540 gcgctgcctc agctgctggg cattctgttt gatcgcgcgc aggatctgag cggcatgagc 600 ccggcgcgct ggtatctggg cgcgggcagc tgcgcgagct ggaccgcgta tggctggctg 660 ctggggcagc cgacggtgtg gctgagcgcg ggctttggcc tggtgtgcgc ggtgaccacc 720 tgcgcggtgc tgcgcacccg ccgcccggcg ccccccgcgg ctccagtggt gccgctgcgc 780 ccggctgctg cgccgcgcag agtgctggcc gccgcggcgt aa 822 <210> 162 <211> 273 <212> PRT <213> Geodermatophilus obscurus (strain ATCC 25078 / DSM 43160 / JCM 3152 / G-20) <400> 162 Met Thr Ser Pro Val Ile Pro Ala Ala Val Ala Leu Pro Leu Thr Asp 1 5 10 15 Glu Arg Pro Glu Pro Ala Cys Gly Cys Pro Ala Arg Arg Trp Pro His 20 25 30 Pro Ser Gln Ser Thr Arg Thr Glu Pro Arg Ser Thr Met Ile Ala Ala 35 40 45 Leu Gly Ser Leu Ala Ala Ala Leu Ser Ile Thr Val Val Trp Pro Gln 50 55 60 Val Trp Leu Ser Cys Arg His Gly Arg Thr Leu Gly Leu Ser Pro Thr 65 70 75 80 Gly Ser Trp Leu Ala Val Gly Leu Asn Leu Cys Trp Leu Thr Ser Gly 85 90 95 Leu Leu Val Gly Asp Thr Pro Gln Ile Ala Thr His Ala Val Val Gly 100 105 110 Ala Gly Asn Thr Ala Val Leu Ala Ala Leu Leu Leu Thr Gln Pro His 115 120 125 Ala Arg Ser Ala Gln Val Leu Leu Arg Thr Ala Ala Gly Ala Ala Gly 130 135 140 Leu Ala Ala Leu Ala Ala Gly Gly Val Ala Ala Val Val Leu Gly Ala 145 150 155 160 Asp Thr Thr Gln Val Thr Ser Val Leu Ala Ser Val Thr Thr Val Val 165 170 175 Gly Ile Val Ala Ala Leu Pro Gln Leu Leu Gly Ile Leu Phe Asp Arg 180 185 190 Ala Gln Asp Leu Ser Gly Met Ser Pro Ala Arg Trp Tyr Leu Gly Ala 195 200 205 Gly Ser Cys Ala Ser Trp Thr Ala Tyr Gly Trp Leu Leu Gly Gln Pro 210 215 220 Thr Val Trp Leu Ser Ala Gly Phe Gly Leu Val Cys Ala Val Thr Thr 225 230 235 240 Cys Ala Val Leu Arg Thr Arg Arg Pro Ala Pro Pro Ala Ala Pro Val 245 250 255 Val Pro Leu Arg Pro Ala Ala Ala Pro Arg Arg Val Leu Ala Ala Ala 260 265 270 Ala <210> 163 <211> 252 <212> DNA <213> Bradyrhizobium sp. BTAi1 <400> 163 atgctgacca ccctgattgg cctgggcgcg gcgacctgca ccacttgcag ctttctgcct 60 caggtgatta aagcgtggcg aagccgcagc acccaggata ttagcgcggg catgtttgtg 120 ctgctgacca ccggcaacgc gatgtggctg ctatacggcg cgctgattaa cgatctgccg 180 ttagtggttg cgaacctgat taccctggcg ttagtggcga ccattctggg cctgaaactg 240 cgctacggct ga 252 <210> 164 <211> 83 <212> PRT <213> Bradyrhizobium sp. BTAi1 <400> 164 Met Leu Thr Thr Leu Ile Gly Leu Gly Ala Ala Thr Cys Thr Thr Cys 1 5 10 15 Ser Phe Leu Pro Gln Val Ile Lys Ala Trp Arg Ser Arg Ser Thr Gln 20 25 30 Asp Ile Ser Ala Gly Met Phe Val Leu Leu Thr Thr Gly Asn Ala Met 35 40 45 Trp Leu Leu Tyr Gly Ala Leu Ile Asn Asp Leu Pro Leu Val Val Ala 50 55 60 Asn Leu Ile Thr Leu Ala Leu Val Ala Thr Ile Leu Gly Leu Lys Leu 65 70 75 80 Arg Tyr Gly <210> 165 <211> 261 <212> DNA <213> Bradyrhizobium japonicum USDA 110 <400> 165 atggatccgt ttcttattaa actgattggc ttcgctgcgg cgacctgcac caccgtggcg 60 tatgcgccgc agtttattaa agtgcttaaa acccgcagcg cgcgcgatat tagcctgggc 120 atgtttctgg tgatggtgct gggcctggcg ctgtggctga tttatggcct gctgagcggc 180 gatgcgccgc tgattgcgag caacgcggtg accatgctgt tagcgggcgg catactggtg 240 atgaaactga gatatggcta a 261 <210> 166 <211> 86 <212> PRT <213> Bradyrhizobium japonicum USDA 110 <400> 166 Met Asp Pro Phe Leu Ile Lys Leu Ile Gly Phe Ala Ala Ala Thr Cys 1 5 10 15 Thr Thr Val Ala Tyr Ala Pro Gln Phe Ile Lys Val Leu Lys Thr Arg 20 25 30 Ser Ala Arg Asp Ile Ser Leu Gly Met Phe Leu Val Met Val Leu Gly 35 40 45 Leu Ala Leu Trp Leu Ile Tyr Gly Leu Leu Ser Gly Asp Ala Pro Leu 50 55 60 Ile Ala Ser Asn Ala Val Thr Met Leu Leu Ala Gly Gly Ile Leu Val 65 70 75 80 Met Lys Leu Arg Tyr Gly 85 <210> 167 <211> 276 <212> DNA <213> Xanthomonas campestris pv. vesicatoria str. 85-10 <400> 167 atgcaatttg ttgatgttgt gggctggtta gcgagcatta ttctgattgc gaccttaatt 60 cggcagattt ataagcaatg gcgctcggat gcggcgcaag gcgttagccg ctggttattt 120 ttaggccaga tttcagctag cgtgttattt attttatatt catacctggt aggcaacgcg 180 gtgttcattg ttagcaatgt gctgattctg ctgacggcgc tgattggcta cgctttgcag 240 cgagttaaac gccgcaggct ggaacgcgct gcgtag 276 <210> 168 <211> 91 <212> PRT <213> Xanthomonas campestris pv. vesicatoria str. 85-10 <400> 168 Met Gln Phe Val Asp Val Val Gly Trp Leu Ala Ser Ile Ile Leu Ile 1 5 10 15 Ala Thr Leu Ile Arg Gln Ile Tyr Lys Gln Trp Arg Ser Asp Ala Ala 20 25 30 Gln Gly Val Ser Arg Trp Leu Phe Leu Gly Gln Ile Ser Ala Ser Val 35 40 45 Leu Phe Ile Leu Tyr Ser Tyr Leu Val Gly Asn Ala Val Phe Ile Val 50 55 60 Ser Asn Val Leu Ile Leu Leu Thr Ala Leu Ile Gly Tyr Ala Leu Gln 65 70 75 80 Arg Val Lys Arg Arg Arg Leu Glu Arg Ala Ala 85 90 <210> 169 <211> 273 <212> DNA <213> Herbaspirillum aquaticum <400> 169 atgagcgacc agattaccga tttaataggc tggggcgcca ccttaatttt actgctgacc 60 attagcagcc aggtgtacga acagtggcgc agccgcagca cgcaaggcgt gagccattgg 120 ttattcgcgg ggcagctagc ggcttcagcc ggctttgtga cctatagcgt gctgcacggt 180 gattgggtat ttgtggtgag caacgtattt ctgttattca ccgcgttact gggccaggtg 240 ctgtatctgc gcaaccggcg ccgccagcag tga 273 <210> 170 <211> 90 <212> PRT <213> Herbaspirillum aquaticum <400> 170 Met Ser Asp Gln Ile Thr Asp Leu Ile Gly Trp Gly Ala Thr Leu Ile 1 5 10 15 Leu Leu Leu Thr Ile Ser Ser Gln Val Tyr Glu Gln Trp Arg Ser Arg 20 25 30 Ser Thr Gln Gly Val Ser His Trp Leu Phe Ala Gly Gln Leu Ala Ala 35 40 45 Ser Ala Gly Phe Val Thr Tyr Ser Val Leu His Gly Asp Trp Val Phe 50 55 60 Val Val Ser Asn Val Phe Leu Leu Phe Thr Ala Leu Leu Gly Gln Val 65 70 75 80 Leu Tyr Leu Arg Asn Arg Arg Arg Gln Gln 85 90 <210> 171 <211> 261 <212> DNA <213> Flavobacteria bacterium MS024-2A <400> 171 atgacgcagt ttcagattga actgattggt atgtttgctg cggtattaac gacgagcgcg 60 tttataccgc aagtatataa aatttggaaa acgcgtgtga gcgatggtgt atcactgagc 120 atgtatttgt cattatttat aggagtggtg agctggtgtg tgtacggcta cctgataggt 180 agcccatcag tgctgatagc gaatattatt gcgggaatgt ttcagctgat gattatttat 240 tttaagctga aatttaaata a 261 <210> 172 <211> 86 <212> PRT <213> Flavobacteria bacterium MS024-2A <400> 172 Met Thr Gln Phe Gln Ile Glu Leu Ile Gly Met Phe Ala Ala Val Leu 1 5 10 15 Thr Thr Ser Ala Phe Ile Pro Gln Val Tyr Lys Ile Trp Lys Thr Arg 20 25 30 Val Ser Asp Gly Val Ser Leu Ser Met Tyr Leu Ser Leu Phe Ile Gly 35 40 45 Val Val Ser Trp Cys Val Tyr Gly Tyr Leu Ile Gly Ser Pro Ser Val 50 55 60 Leu Ile Ala Asn Ile Ile Ala Gly Met Phe Gln Leu Met Ile Ile Tyr 65 70 75 80 Phe Lys Leu Lys Phe Lys 85 <210> 173 <211> 786 <212> DNA <213> Rhizobium sp. Root149 <400> 173 atgctgaatg cgatttggaa ctatcggtat tttattgtta ccagcgttca ggccgatttt 60 cggaaccgcg ttgctcgcag ccgcttaggc ctgctctggt tagtgatcgc cccgttagcg 120 cagattgtga cctatgcgtt cgtcttaagc agcgttatga gccagcggct gccaggcatt 180 gataatacct tcgcgtatgc gatttacctg atggccggct tccagggctg gctcctgttc 240 gtggaaatta ttagccgaag catgaatgtg tttattgaaa gcggcaatgt cctgaaaaaa 300 attgcgttcc cacgcatcgc gctccccctc gttgtggtga ttaccagcgt gataaataac 360 ctgatttttt ttgtcgttct gctggctgtg tttaccttag cgggctttca gatgggatgg 420 aatgtgctgt ggctcccggt cttaatcgcg gtgaatgccg cgttcgccgc gggattaggc 480 gtgaccttag gcgtcctcaa cgtgttcatc cgcgacgtgg ggcagattgt accgattatt 540 atccagtttc tgttttggat gaccccgatt gtgtatgtta aggacatcct gccgccagcg 600 tttcagagca ttattaaagc gaatcccctg ttttggatgg ttgagaatta tcaccgcgtg 660 atggtgtata ataccatgcc ggacctgaaa gttttaggcg ttttagggtt cctggctctg 720 gtctttctcg ctttaggctt caccttattt cgcaaagcta gccctgaaat ggttgatgtt 780 ctataa 786 <210> 174 <211> 261 <212> PRT <213> Rhizobium sp. Root149 <400> 174 Met Leu Asn Ala Ile Trp Asn Tyr Arg Tyr Phe Ile Val Thr Ser Val 1 5 10 15 Gln Ala Asp Phe Arg Asn Arg Val Ala Arg Ser Arg Leu Gly Leu Leu 20 25 30 Trp Leu Val Ile Ala Pro Leu Ala Gln Ile Val Thr Tyr Ala Phe Val 35 40 45 Leu Ser Ser Val Met Ser Gln Arg Leu Pro Gly Ile Asp Asn Thr Phe 50 55 60 Ala Tyr Ala Ile Tyr Leu Met Ala Gly Phe Gln Gly Trp Leu Leu Phe 65 70 75 80 Val Glu Ile Ile Ser Arg Ser Met Asn Val Phe Ile Glu Ser Gly Asn 85 90 95 Val Leu Lys Lys Ile Ala Phe Pro Arg Ile Ala Leu Pro Leu Val Val 100 105 110 Val Ile Thr Ser Val Ile Asn Asn Leu Ile Phe Phe Val Val Leu Leu 115 120 125 Ala Val Phe Thr Leu Ala Gly Phe Gln Met Gly Trp Asn Val Leu Trp 130 135 140 Leu Pro Val Leu Ile Ala Val Asn Ala Ala Phe Ala Ala Gly Leu Gly 145 150 155 160 Val Thr Leu Gly Val Leu Asn Val Phe Ile Arg Asp Val Gly Gln Ile 165 170 175 Val Pro Ile Ile Ile Gln Phe Leu Phe Trp Met Thr Pro Ile Val Tyr 180 185 190 Val Lys Asp Ile Leu Pro Pro Ala Phe Gln Ser Ile Ile Lys Ala Asn 195 200 205 Pro Leu Phe Trp Met Val Glu Asn Tyr His Arg Val Met Val Tyr Asn 210 215 220 Thr Met Pro Asp Leu Lys Val Leu Gly Val Leu Gly Phe Leu Ala Leu 225 230 235 240 Val Phe Leu Ala Leu Gly Phe Thr Leu Phe Arg Lys Ala Ser Pro Glu 245 250 255 Met Val Asp Val Leu 260 <210> 175 <211> 837 <212> DNA <213> Azospirillum brasiliense LMG 04375 <400> 175 atgaccatgg ccgctagcgc tccgcaagta ccgaccggac tagcgggcct gtttacgatg 60 ccatggcacc atcgcgcgct gctgcgccgc ttagtgcgta gggaaattga ggccaggtat 120 cgtggaagcc tgctaggcgt ggtgtgggcg ctcctgaccc cggtgttaat gctggccgtg 180 tttacctttg tgtttagcgt ggtgtttcag gcgcgctggg gcagttcaac cggcggaaaa 240 ggggaatttg cgctgattct gtttgctggc ctgattgtgt ttaatatgtt tagcgaagcg 300 ctgaaccgta gcccaagcct agtactggaa aacccgagct acgtgaaaaa agtggtgttt 360 ccgttagaag tgctgccctg ggtgatggtg ctaagcagcc tgtttcaggt tgtgattagc 420 ctagcgattc tgttagtgtt ccacctagcg gtgtcagggc tgcccccgct gagcgtgctg 480 tttctgccgc tggtgtggct accactgctg ttcttatgcc tgggcaccgg cttcctgttt 540 ggcgcgttag gcgtatacct gcgcgatctg cgaagcatta tgccagtggc tagccagtta 600 ctgatgttct taagcccgct gttttatccg gcgagcgcgc tgccggaaag ctttcgccgc 660 ctgttgcatt taaacccgct gacgggcatt attgaaaata cgcgcacggt gctgttcgct 720 ggcaccccgc cggactggac cgtgttaggc gtgcagattg tggccgggct gttatttgct 780 acctttagct ttcgtctgtt tcgccatcta cgaactggat tcgcggatat agtgtaa 837 <210> 176 <211> 278 <212> PRT <213> Azospirillum brasiliense LMG 04375 <400> 176 Met Thr Met Ala Ala Ser Ala Pro Gln Val Pro Thr Gly Leu Ala Gly 1 5 10 15 Leu Phe Thr Met Pro Trp His His Arg Ala Leu Leu Arg Arg Leu Val 20 25 30 Arg Arg Glu Ile Glu Ala Arg Tyr Arg Gly Ser Leu Leu Gly Val Val 35 40 45 Trp Ala Leu Leu Thr Pro Val Leu Met Leu Ala Val Phe Thr Phe Val 50 55 60 Phe Ser Val Val Phe Gln Ala Arg Trp Gly Ser Ser Thr Gly Gly Lys 65 70 75 80 Gly Glu Phe Ala Leu Ile Leu Phe Ala Gly Leu Ile Val Phe Asn Met 85 90 95 Phe Ser Glu Ala Leu Asn Arg Ser Pro Ser Leu Val Leu Glu Asn Pro 100 105 110 Ser Tyr Val Lys Lys Val Val Phe Pro Leu Glu Val Leu Pro Trp Val 115 120 125 Met Val Leu Ser Ser Leu Phe Gln Val Val Ile Ser Leu Ala Ile Leu 130 135 140 Leu Val Phe His Leu Ala Val Ser Gly Leu Pro Pro Leu Ser Val Leu 145 150 155 160 Phe Leu Pro Leu Val Trp Leu Pro Leu Leu Phe Leu Cys Leu Gly Thr 165 170 175 Gly Phe Leu Phe Gly Ala Leu Gly Val Tyr Leu Arg Asp Leu Arg Ser 180 185 190 Ile Met Pro Val Ala Ser Gln Leu Leu Met Phe Leu Ser Pro Leu Phe 195 200 205 Tyr Pro Ala Ser Ala Leu Pro Glu Ser Phe Arg Arg Leu Leu His Leu 210 215 220 Asn Pro Leu Thr Gly Ile Ile Glu Asn Thr Arg Thr Val Leu Phe Ala 225 230 235 240 Gly Thr Pro Pro Asp Trp Thr Val Leu Gly Val Gln Ile Val Ala Gly 245 250 255 Leu Leu Phe Ala Thr Phe Ser Phe Arg Leu Phe Arg His Leu Arg Thr 260 265 270 Gly Phe Ala Asp Ile Val 275 <210> 177 <211> 1233 <212> DNA <213> Rhizobium sp. Root149 <400> 177 atgaccaatg ttgtgatgac cgtggacaaa gtgggcaaag tcttccggcg ctatcggcac 60 gaactgcatc gcgtcttagg ctggttctca ttaccagtgg ggcagccgga agagcgctgg 120 gtcctgcggg atatttcatt taccgtagag gctgggcagg ccctggccat cgtcgggcgc 180 aatggcgccg gcaaaagcac cctcttaaaa ctgatcaccg gcaccatgcg cgccgcggaa 240 ggcaatattg ggttatcagg caaaattagc gcgattttag aactgggaat gggctttaat 300 ccggattata ccggccgcca gaacgttttt catgccttag gcttaatggg ctaccagcat 360 gccgatatcg cggccgcgat ggaaggcatt gaggccttca gcgaactggg aagctatttt 420 gatcagccgc tgcgagtgta tagcagcggc atgcatatgc ggttagcttt tagcgtggcc 480 actgctttcc ggccagacat cttaattgtg gatgaggcct tatcagtagg cgacgcgtat 540 tttcagcata aaagctttga ccgcattaaa gaattccgcc agcaggggac caccctgatt 600 ttagtcagcc acgaccggat ggccctgtta agcttatgcg accgcgcgat cctgctgcac 660 gaaggagcgg ttgccttaga tggggagccc gaaactgtct tagactatta taacgcgtta 720 ttagggcaga aagaagccca accgatttta accgaagagc gagaggatgg ccgcgtgcag 780 acctcaagcg ggagccgccg ggtcagcatc gtggaagccc ggctggaaga tgcccagggc 840 ggcccaattg ataccttaga tgttggggca gaagtggcga tccgcgttaa agcgaaggcc 900 aatgaagatg ttgaatcatt agtgtttggc tacgccatta aagaccgctt tgggcagacc 960 atgtatggca ccaataccta ttatagcgaa caggccctga ccgatgtaaa agctggcgaa 1020 gagattgagt ttagcgcccg ctttcgggcc gatttaggag tgggcaccta ttcagttgct 1080 ctagccctgg ttgggggcga gaaccatatt gaggataatt atgaatggcg cgatttagcg 1140 attatttttg atgtcgcgaa taccagcaaa cagacctttg acgggcgaat ctatctgccg 1200 agcgagttcc atttaaagcg gaccggtggc tag 1233 <210> 178 <211> 410 <212> PRT <213> Rhizobium sp. Root149 <400> 178 Met Thr Asn Val Val Met Thr Val Asp Lys Val Gly Lys Val Phe Arg 1 5 10 15 Arg Tyr Arg His Glu Leu His Arg Val Leu Gly Trp Phe Ser Leu Pro 20 25 30 Val Gly Gln Pro Glu Glu Arg Trp Val Leu Arg Asp Ile Ser Phe Thr 35 40 45 Val Glu Ala Gly Gln Ala Leu Ala Ile Val Gly Arg Asn Gly Ala Gly 50 55 60 Lys Ser Thr Leu Leu Lys Leu Ile Thr Gly Thr Met Arg Ala Ala Glu 65 70 75 80 Gly Asn Ile Gly Leu Ser Gly Lys Ile Ser Ala Ile Leu Glu Leu Gly 85 90 95 Met Gly Phe Asn Pro Asp Tyr Thr Gly Arg Gln Asn Val Phe His Ala 100 105 110 Leu Gly Leu Met Gly Tyr Gln His Ala Asp Ile Ala Ala Ala Met Glu 115 120 125 Gly Ile Glu Ala Phe Ser Glu Leu Gly Ser Tyr Phe Asp Gln Pro Leu 130 135 140 Arg Val Tyr Ser Ser Gly Met His Met Arg Leu Ala Phe Ser Val Ala 145 150 155 160 Thr Ala Phe Arg Pro Asp Ile Leu Ile Val Asp Glu Ala Leu Ser Val 165 170 175 Gly Asp Ala Tyr Phe Gln His Lys Ser Phe Asp Arg Ile Lys Glu Phe 180 185 190 Arg Gln Gln Gly Thr Thr Leu Ile Leu Val Ser His Asp Arg Met Ala 195 200 205 Leu Leu Ser Leu Cys Asp Arg Ala Ile Leu Leu His Glu Gly Ala Val 210 215 220 Ala Leu Asp Gly Glu Pro Glu Thr Val Leu Asp Tyr Tyr Asn Ala Leu 225 230 235 240 Leu Gly Gln Lys Glu Ala Gln Pro Ile Leu Thr Glu Glu Arg Glu Asp 245 250 255 Gly Arg Val Gln Thr Ser Ser Gly Ser Arg Arg Val Ser Ile Val Glu 260 265 270 Ala Arg Leu Glu Asp Ala Gln Gly Gly Pro Ile Asp Thr Leu Asp Val 275 280 285 Gly Ala Glu Val Ala Ile Arg Val Lys Ala Lys Ala Asn Glu Asp Val 290 295 300 Glu Ser Leu Val Phe Gly Tyr Ala Ile Lys Asp Arg Phe Gly Gln Thr 305 310 315 320 Met Tyr Gly Thr Asn Thr Tyr Tyr Ser Glu Gln Ala Leu Thr Asp Val 325 330 335 Lys Ala Gly Glu Glu Ile Glu Phe Ser Ala Arg Phe Arg Ala Asp Leu 340 345 350 Gly Val Gly Thr Tyr Ser Val Ala Leu Ala Leu Val Gly Gly Glu Asn 355 360 365 His Ile Glu Asp Asn Tyr Glu Trp Arg Asp Leu Ala Ile Ile Phe Asp 370 375 380 Val Ala Asn Thr Ser Lys Gln Thr Phe Asp Gly Arg Ile Tyr Leu Pro 385 390 395 400 Ser Glu Phe His Leu Lys Arg Thr Gly Gly 405 410 <210> 179 <211> 1416 <212> DNA <213> Azospirillum brasiliense LMG 04375 <400> 179 atgaaggatg ataccgctat gcaggatatg ccgagcgatg gcgatgtgag cattcgtgta 60 agcggcgtgg gcaaatgcta ccatatttat gcgcgtccgc aggaccgctt actgcaattt 120 ctgctgcgcg gccgccgtca gttttatcgt gaattttggg ccttaaaaga tattgatctg 180 acgattcgcc gcggggaaag cgtggcgctg attgggcgca acggggccgg caagtcaact 240 ctactccagg tgattagcgg cgtactgcaa ccgaccggag gcagcatgga tgtgcgcggg 300 cgcattgcgc cgctattaga gctaggcagc tcatttaacc cagagtttag cgggatggaa 360 aatattgggc tgagcgcgag cgtattaggc ttaagcgagg aacagattgc ggaacgtcgc 420 gaagcgatta ttgcgtttgc ggatattggc gattttattc accagccggt gaggacctac 480 agcagcggca tgcaggcgcg cctagcgttt gccgtggctg cgcacgtgga tgcggaaatt 540 ctgattgtgg atgaaattct gagcgtgggc gatattgcgt ttacccagaa atgcacccgc 600 tttattcgcg aatttcgcga gcgcggaacg ctgctgtttg tgagccatga cattggcgcg 660 ataaccgcgc tgtgcgatcg cgcggtgtgg ctaagcggag gaacggttgt agcggatggc 720 gtgccgcgcg aagtggctca ccactataaa gcgtggatgg ccggacctca gcagcatatg 780 acggcgcagg attttctgga aaccctgaaa accgcggaag cggaagcgac tgaagtggaa 840 gcggaagcgg aagcggaagc cgcggttgaa gccgaagttg tggtgaccca aggcgggccg 900 gatggcgaaa cggcgctagt gcagacgtta gatgcccagg tgcagaccgt gtttcgccgc 960 gatgtgctga gcagcggcga aggcggggcg aaaatattgc aggcgtggat tgaagatgcg 1020 cgtggcaccc cagtgagcat ggtgaacggc ggcgatttag tgaccctgtg cattgaagcg 1080 gaagcgcagc agaccctgga tagcctgatt gtgggctttg gcgtgaaaga tcgtttaggc 1140 cagacgatgt ttgcgtggga tacgaccaaa accgacttag tgattccgcc ggtgaatgtg 1200 ggcgatcgct ttcgcgccgg gtttcgcttt cattttccat atctgctggg cggcacctat 1260 acgaccaatc tggcgattgc gaacgggacg agcgatatgt atattcagca ccattggatg 1320 tatgatgcgc tggaatttca tgtgcaatgg agcaccgtgg cgcagggcct gtttggcata 1380 ccaatggatg gcgtaagcct ggcgattaac ccctaa 1416 <210> 180 <211> 471 <212> PRT <213> Azospirillum brasiliense LMG 04375 <400> 180 Met Lys Asp Asp Thr Ala Met Gln Asp Met Pro Ser Asp Gly Asp Val 1 5 10 15 Ser Ile Arg Val Ser Gly Val Gly Lys Cys Tyr His Ile Tyr Ala Arg 20 25 30 Pro Gln Asp Arg Leu Leu Gln Phe Leu Leu Arg Gly Arg Arg Gln Phe 35 40 45 Tyr Arg Glu Phe Trp Ala Leu Lys Asp Ile Asp Leu Thr Ile Arg Arg 50 55 60 Gly Glu Ser Val Ala Leu Ile Gly Arg Asn Gly Ala Gly Lys Ser Thr 65 70 75 80 Leu Leu Gln Val Ile Ser Gly Val Leu Gln Pro Thr Gly Gly Ser Met 85 90 95 Asp Val Arg Gly Arg Ile Ala Pro Leu Leu Glu Leu Gly Ser Ser Phe 100 105 110 Asn Pro Glu Phe Ser Gly Met Glu Asn Ile Gly Leu Ser Ala Ser Val 115 120 125 Leu Gly Leu Ser Glu Glu Gln Ile Ala Glu Arg Arg Glu Ala Ile Ile 130 135 140 Ala Phe Ala Asp Ile Gly Asp Phe Ile His Gln Pro Val Arg Thr Tyr 145 150 155 160 Ser Ser Gly Met Gln Ala Arg Leu Ala Phe Ala Val Ala Ala His Val 165 170 175 Asp Ala Glu Ile Leu Ile Val Asp Glu Ile Leu Ser Val Gly Asp Ile 180 185 190 Ala Phe Thr Gln Lys Cys Thr Arg Phe Ile Arg Glu Phe Arg Glu Arg 195 200 205 Gly Thr Leu Leu Phe Val Ser His Asp Ile Gly Ala Ile Thr Ala Leu 210 215 220 Cys Asp Arg Ala Val Trp Leu Ser Gly Gly Thr Val Val Ala Asp Gly 225 230 235 240 Val Pro Arg Glu Val Ala His His Tyr Lys Ala Trp Met Ala Gly Pro 245 250 255 Gln Gln His Met Thr Ala Gln Asp Phe Leu Glu Thr Leu Lys Thr Ala 260 265 270 Glu Ala Glu Ala Thr Glu Val Glu Ala Glu Ala Glu Ala Glu Ala Ala 275 280 285 Val Glu Ala Glu Val Val Val Thr Gln Gly Gly Pro Asp Gly Glu Thr 290 295 300 Ala Leu Val Gln Thr Leu Asp Ala Gln Val Gln Thr Val Phe Arg Arg 305 310 315 320 Asp Val Leu Ser Ser Gly Glu Gly Gly Ala Lys Ile Leu Gln Ala Trp 325 330 335 Ile Glu Asp Ala Arg Gly Thr Pro Val Ser Met Val Asn Gly Gly Asp 340 345 350 Leu Val Thr Leu Cys Ile Glu Ala Glu Ala Gln Gln Thr Leu Asp Ser 355 360 365 Leu Ile Val Gly Phe Gly Val Lys Asp Arg Leu Gly Gln Thr Met Phe 370 375 380 Ala Trp Asp Thr Thr Lys Thr Asp Leu Val Ile Pro Pro Val Asn Val 385 390 395 400 Gly Asp Arg Phe Arg Ala Gly Phe Arg Phe His Phe Pro Tyr Leu Leu 405 410 415 Gly Gly Thr Tyr Thr Thr Asn Leu Ala Ile Ala Asn Gly Thr Ser Asp 420 425 430 Met Tyr Ile Gln His His Trp Met Tyr Asp Ala Leu Glu Phe His Val 435 440 445 Gln Trp Ser Thr Val Ala Gln Gly Leu Phe Gly Ile Pro Met Asp Gly 450 455 460 Val Ser Leu Ala Ile Asn Pro 465 470 <210> 181 <211> 3198 <212> DNA <213> Sinorhizobium medicae WSM419 <400> 181 atgtttctga cacggattag cattaaccac ccggtgtttg ctaccatgat gatggttatg 60 attttagtgt tagggctgtt ctcatatgga cggttaggag tggaccatta cccagaaacc 120 gatctgcccg tggtagttgt ggcgaccacc tacaccgggg caagcccaga gagcgtggag 180 agcgaaattt cacggccgat agaagcggcg ctgaacacaa ttggcgggat tgataccatt 240 accagcgaga gctacgaggg gcgaagcatt gtggttgttc agtttgaagt tgacgtggac 300 tcacaagatg cggctcaaga agttcgcgat cgggtagcgc ggttagagac aaaattccca 360 gatgctgttg cgacccccca ggtgacccgg tacaaaccag agggccaggc tattctgtca 420 gtagctgtta gcagcaccag ccggaccctg ccagagatta ccaccttagc gacacgcgtt 480 attaacaatc gcctgagcgt aataagcggc gtgggccaag tatcactgat aggcagcagc 540 gaacggcaag tactggtagt agttgatccc gaccggttag gggcctacgg cctggctgtg 600 gcgaccgtga ttgaggctat tcggggcgag aaccaggacc gagcggccgg gaccttaaca 660 agcggcatta atcagcggat tgtaaccgtg gaagggcgca tagcgaatac atcagcgttt 720 aaccgcatta ttgtggctca aagaaatggc tatccagtgt acttaagcga agttgctacc 780 atactggata caggcgccga agtaaccagc ttagctaact accaaggcca gaccacactg 840 ggactccata ttgtgaaagt gcaaggcgcg aacaccgttg aagtagcgag cgctgtacgc 900 cgagaagtaa gcgcgctgaa cgctgagctg acaaaagata acgtgcaact gaccattaca 960 cgggataaca gccgcccaat agctagccag gtaagccaag tacagcggac cctggttgag 1020 ggaggagtac tgtcagttct gattgttttt atattcctca acagctggcg aagcaccgta 1080 attaccggct taaccctgcc aatatcagta ataggcacat ttgcggctat atacgctctg 1140 ggctttaccc tgaacattat gacattaatg gctctgagcc tcagcattgg catactgata 1200 gatgacgcga tagtggtacg ggagaacatt acacgccacc tacagatggg caaagacccc 1260 gtacgggccg cgctggacgg gaccaacgaa ataggcttag ctgttctgag cacaacactg 1320 tgcattgtgg ctgttttcct gccggtagcg tttatgggcg ggctgattgg gcgcttcttt 1380 ttacagttcg gcgtaaccgt agcggttgcg gtttttataa gcctgttcgt tagcttcaca 1440 ttagacccga tgctgagcag catatggcgc gacccacaat cacaaaagac agcgaaacga 1500 ggcttttttg ggcaactgat agaacggttt gaccaatggt ttgaagggtt agctagccgc 1560 tatcggagcg taatttactt tacatttgat taccggaaga ccacaatagc tatagtgcta 1620 ggcatgttcg tggtgagcct gctgttagta ccgcgcattg ggacagaatt cctcccgccc 1680 ccagatcagg gagaagttag cataagcctg gaagcgaacg agggcgctag cctggactac 1740 atggccgcca aggttgggca gattgagcgg gctctgcggg aatttaatta tgtgagcagc 1800 acctatagca caattaatag cggggaaatg cgaggcttta acaaagcgct ggttgcggtt 1860 caattagttc atagctcaca acgacggctg aaaaccgcgg agaccctggg gcccattcgc 1920 cgacggttaa gccggattgc gggcttagag atttcagtag ggcagcggag cgaagttgtg 1980 gggagcataa aaccgctaca actcagcatt ctgggagacg gggacgaaga actgcgacgg 2040 attagcgacc aaattaccag cgttttagcg gcgataccgg gcgctaccga aattgagtca 2100 tcaattgaga aattacggcc caccctggct gtacgggttc gccgcgaagc ggcgagcgac 2160 ttaggcgtga gcattgctac cataggcgac acactgcggt cactagttgc gggagacgct 2220 atatcagtat ggaacagccc cgatggggag agccatgacg tggttgttcg cctgccagcg 2280 gccggccggg aaaacgcggc tcagctgcgg aatttaccca ttgcgaccgc tcggatggat 2340 gataatggca aaccgataat ggtgctactg gaccaggtag ccgacgtggt tgaaagcacc 2400 gcgcccgctc agattacccg caaagacctg agccgggata tacgcataag cagcaacata 2460 gagggacgga ccctcggcga tgtagttgcg gacctgaaag cggcgatgac aaaaatggac 2520 attcccgttg ggttccggat atcatttggc ggcgacgcgg aaaacctgac cgaaagcacc 2580 gcgtatgctc tgcagagcct ggcgatggcc gtgattttta tttacataat tctcgcttca 2640 cagtttggca gctttattca gcccattgcg attattatga caatgccgct aagcctcatg 2700 ggagtgctgt taggcttact gttcaccggc agcacactga atatgtttag catgattggc 2760 attctgatgc tgattgggct cgttacaaaa aacgcgattt tactggttga ttacagcaat 2820 ctaggcgtac gcgagggcaa gagcctgcgg cagagcttag ctgacgccgg ggcagtaaga 2880 ctgcggccga ttgttatgac caccctggcg atgatatttg ggatgctgcc cacagcgcta 2940 ggcctcggcg agggcggcgc gcagcgcgcg cccatggcgc acgctattat tggcgggctc 3000 ataagcagca ccctgctgtc actcgtgttc gttcccgtgg ttctgacata tttagacgcg 3060 tttgcgcggc gcgtacggcg ctgggttccc tcacccacag ggagcaatgc tagcgctcag 3120 catgatggga gcgacaaaac aaagacaccc gcttgcgctc tgacaagcca ggaccagtca 3180 gggacaacaa ttatgtaa 3198 <210> 182 <211> 1065 <212> PRT <213> Sinorhizobium medicae WSM419 <400> 182 Met Phe Leu Thr Arg Ile Ser Ile Asn His Pro Val Phe Ala Thr Met 1 5 10 15 Met Met Val Met Ile Leu Val Leu Gly Leu Phe Ser Tyr Gly Arg Leu 20 25 30 Gly Val Asp His Tyr Pro Glu Thr Asp Leu Pro Val Val Val Val Ala 35 40 45 Thr Thr Tyr Thr Gly Ala Ser Pro Glu Ser Val Glu Ser Glu Ile Ser 50 55 60 Arg Pro Ile Glu Ala Ala Leu Asn Thr Ile Gly Gly Ile Asp Thr Ile 65 70 75 80 Thr Ser Glu Ser Tyr Glu Gly Arg Ser Ile Val Val Val Gln Phe Glu 85 90 95 Val Asp Val Asp Ser Gln Asp Ala Ala Gln Glu Val Arg Asp Arg Val 100 105 110 Ala Arg Leu Glu Thr Lys Phe Pro Asp Ala Val Ala Thr Pro Gln Val 115 120 125 Thr Arg Tyr Lys Pro Glu Gly Gln Ala Ile Leu Ser Val Ala Val Ser 130 135 140 Ser Thr Ser Arg Thr Leu Pro Glu Ile Thr Thr Leu Ala Thr Arg Val 145 150 155 160 Ile Asn Asn Arg Leu Ser Val Ile Ser Gly Val Gly Gln Val Ser Leu 165 170 175 Ile Gly Ser Ser Glu Arg Gln Val Leu Val Val Val Asp Pro Asp Arg 180 185 190 Leu Gly Ala Tyr Gly Leu Ala Val Ala Thr Val Ile Glu Ala Ile Arg 195 200 205 Gly Glu Asn Gln Asp Arg Ala Ala Gly Thr Leu Thr Ser Gly Ile Asn 210 215 220 Gln Arg Ile Val Thr Val Glu Gly Arg Ile Ala Asn Thr Ser Ala Phe 225 230 235 240 Asn Arg Ile Ile Val Ala Gln Arg Asn Gly Tyr Pro Val Tyr Leu Ser 245 250 255 Glu Val Ala Thr Ile Leu Asp Thr Gly Ala Glu Val Thr Ser Leu Ala 260 265 270 Asn Tyr Gln Gly Gln Thr Thr Leu Gly Leu His Ile Val Lys Val Gln 275 280 285 Gly Ala Asn Thr Val Glu Val Ala Ser Ala Val Arg Arg Glu Val Ser 290 295 300 Ala Leu Asn Ala Glu Leu Thr Lys Asp Asn Val Gln Leu Thr Ile Thr 305 310 315 320 Arg Asp Asn Ser Arg Pro Ile Ala Ser Gln Val Ser Gln Val Gln Arg 325 330 335 Thr Leu Val Glu Gly Gly Val Leu Ser Val Leu Ile Val Phe Ile Phe 340 345 350 Leu Asn Ser Trp Arg Ser Thr Val Ile Thr Gly Leu Thr Leu Pro Ile 355 360 365 Ser Val Ile Gly Thr Phe Ala Ala Ile Tyr Ala Leu Gly Phe Thr Leu 370 375 380 Asn Ile Met Thr Leu Met Ala Leu Ser Leu Ser Ile Gly Ile Leu Ile 385 390 395 400 Asp Asp Ala Ile Val Val Arg Glu Asn Ile Thr Arg His Leu Gln Met 405 410 415 Gly Lys Asp Pro Val Arg Ala Ala Leu Asp Gly Thr Asn Glu Ile Gly 420 425 430 Leu Ala Val Leu Ser Thr Thr Leu Cys Ile Val Ala Val Phe Leu Pro 435 440 445 Val Ala Phe Met Gly Gly Leu Ile Gly Arg Phe Phe Leu Gln Phe Gly 450 455 460 Val Thr Val Ala Val Ala Val Phe Ile Ser Leu Phe Val Ser Phe Thr 465 470 475 480 Leu Asp Pro Met Leu Ser Ser Ile Trp Arg Asp Pro Gln Ser Gln Lys 485 490 495 Thr Ala Lys Arg Gly Phe Phe Gly Gln Leu Ile Glu Arg Phe Asp Gln 500 505 510 Trp Phe Glu Gly Leu Ala Ser Arg Tyr Arg Ser Val Ile Tyr Phe Thr 515 520 525 Phe Asp Tyr Arg Lys Thr Thr Ile Ala Ile Val Leu Gly Met Phe Val 530 535 540 Val Ser Leu Leu Leu Val Pro Arg Ile Gly Thr Glu Phe Leu Pro Pro 545 550 555 560 Pro Asp Gln Gly Glu Val Ser Ile Ser Leu Glu Ala Asn Glu Gly Ala 565 570 575 Ser Leu Asp Tyr Met Ala Ala Lys Val Gly Gln Ile Glu Arg Ala Leu 580 585 590 Arg Glu Phe Asn Tyr Val Ser Ser Thr Tyr Ser Thr Ile Asn Ser Gly 595 600 605 Glu Met Arg Gly Phe Asn Lys Ala Leu Val Ala Val Gln Leu Val His 610 615 620 Ser Ser Gln Arg Arg Leu Lys Thr Ala Glu Thr Leu Gly Pro Ile Arg 625 630 635 640 Arg Arg Leu Ser Arg Ile Ala Gly Leu Glu Ile Ser Val Gly Gln Arg 645 650 655 Ser Glu Val Val Gly Ser Ile Lys Pro Leu Gln Leu Ser Ile Leu Gly 660 665 670 Asp Gly Asp Glu Glu Leu Arg Arg Ile Ser Asp Gln Ile Thr Ser Val 675 680 685 Leu Ala Ala Ile Pro Gly Ala Thr Glu Ile Glu Ser Ser Ile Glu Lys 690 695 700 Leu Arg Pro Thr Leu Ala Val Arg Val Arg Arg Glu Ala Ala Ser Asp 705 710 715 720 Leu Gly Val Ser Ile Ala Thr Ile Gly Asp Thr Leu Arg Ser Leu Val 725 730 735 Ala Gly Asp Ala Ile Ser Val Trp Asn Ser Pro Asp Gly Glu Ser His 740 745 750 Asp Val Val Val Arg Leu Pro Ala Ala Gly Arg Glu Asn Ala Ala Gln 755 760 765 Leu Arg Asn Leu Pro Ile Ala Thr Ala Arg Met Asp Asp Asn Gly Lys 770 775 780 Pro Ile Met Val Leu Leu Asp Gln Val Ala Asp Val Val Glu Ser Thr 785 790 795 800 Ala Pro Ala Gln Ile Thr Arg Lys Asp Leu Ser Arg Asp Ile Arg Ile 805 810 815 Ser Ser Asn Ile Glu Gly Arg Thr Leu Gly Asp Val Val Ala Asp Leu 820 825 830 Lys Ala Ala Met Thr Lys Met Asp Ile Pro Val Gly Phe Arg Ile Ser 835 840 845 Phe Gly Gly Asp Ala Glu Asn Leu Thr Glu Ser Thr Ala Tyr Ala Leu 850 855 860 Gln Ser Leu Ala Met Ala Val Ile Phe Ile Tyr Ile Ile Leu Ala Ser 865 870 875 880 Gln Phe Gly Ser Phe Ile Gln Pro Ile Ala Ile Ile Met Thr Met Pro 885 890 895 Leu Ser Leu Met Gly Val Leu Leu Gly Leu Leu Phe Thr Gly Ser Thr 900 905 910 Leu Asn Met Phe Ser Met Ile Gly Ile Leu Met Leu Ile Gly Leu Val 915 920 925 Thr Lys Asn Ala Ile Leu Leu Val Asp Tyr Ser Asn Leu Gly Val Arg 930 935 940 Glu Gly Lys Ser Leu Arg Gln Ser Leu Ala Asp Ala Gly Ala Val Arg 945 950 955 960 Leu Arg Pro Ile Val Met Thr Thr Leu Ala Met Ile Phe Gly Met Leu 965 970 975 Pro Thr Ala Leu Gly Leu Gly Glu Gly Gly Ala Gln Arg Ala Pro Met 980 985 990 Ala His Ala Ile Ile Gly Gly Leu Ile Ser Ser Thr Leu Leu Ser Leu 995 1000 1005 Val Phe Val Pro Val Val Leu Thr Tyr Leu Asp Ala Phe Ala Arg 1010 1015 1020 Arg Val Arg Arg Trp Val Pro Ser Pro Thr Gly Ser Asn Ala Ser 1025 1030 1035 Ala Gln His Asp Gly Ser Asp Lys Thr Lys Thr Pro Ala Cys Ala 1040 1045 1050 Leu Thr Ser Gln Asp Gln Ser Gly Thr Thr Ile Met 1055 1060 1065 <210> 183 <211> 1206 <212> DNA <213> Azospirillum brasiliense LMG 04375 <400> 183 atgaggagaa cgccaccgcg catgagcgcg gccgctagcg atcgactacc actggcgagc 60 ctgctggcgt tagcgatggc cgcgtttatt accattttaa ccgaggcgct gccagcggga 120 ctgctgccgc agatggcgca agggttagga gtgaccgaag cctgggttgg ccagaccgtg 180 acgatttatg cggccggaag cttagcggcc gcgattccgc tgaccgcggc gacgcaagga 240 gtgcgccgcc gcccgctgct gctggccgcg attgcgggct ttgtggttgc gaataccgtg 300 acgaccctga gcggcagctt tgcgctgacc atggttgcgc gctttctggc cggcgtgagc 360 gcgggcctga tgtgggcgct gctggccggc tacgcggcgc gcatggtgcc agatcatcag 420 aaaggccgtg cgattgcggt tgcgatggtt ggcgcgccgc tagctctgag cttaggcgta 480 ccgaccggca cctttctggg caatctggtt gattggagag tgtgctttgg attaatgagc 540 gcgctggcgc tggcgttaat gttatgggtg cgcgttgtgg tgccggattt tgcggggcaa 600 gcggccggcc gacgtctgag cccagggcgc gtgtttaccc tggccggcgt gcgcccggtg 660 ctgtttgtgg tactggcgtt tgtgctggcg cataatattt tatataccta tattgcgccg 720 tttctggccg ccgcgggcat ggaagggcgc acggacctgg cgctgctgct gtttggcgtg 780 gcgagcctgc tgggcatttg gattgtgggc gcgctgattg atggccacct gcgtgcgctg 840 acgctggcga gcaccgtgct gtttggactg agcgcgctgg tgttaggcgt ggctggcgac 900 gcgccggccg tggtgctagc ggccgttgcg gcgtggggcc tggcgtttgg cggagcgggg 960 acgctgtttc agacggcgct ggcgaggacg gccggcgatg cggccgacgt ggcgcagagc 1020 atgctggtga ccgcgtggaa tacggcgata gcgggcggcg gcttattagg cggcgtgctg 1080 ttagagcgtt taggcgtggg cgcgtttgcg ccggccgtgc tggtgctgct ggccgcgacg 1140 ctgttagcgg tgtggggagc gaggcgtcat ggcttcccag atcccgcgga tacggccgga 1200 gcgtaa 1206 <210> 184 <211> 401 <212> PRT <213> Azospirillum brasiliense LMG 04375 <400> 184 Met Arg Arg Thr Pro Pro Arg Met Ser Ala Ala Ala Ser Asp Arg Leu 1 5 10 15 Pro Leu Ala Ser Leu Leu Ala Leu Ala Met Ala Ala Phe Ile Thr Ile 20 25 30 Leu Thr Glu Ala Leu Pro Ala Gly Leu Leu Pro Gln Met Ala Gln Gly 35 40 45 Leu Gly Val Thr Glu Ala Trp Val Gly Gln Thr Val Thr Ile Tyr Ala 50 55 60 Ala Gly Ser Leu Ala Ala Ala Ile Pro Leu Thr Ala Ala Thr Gln Gly 65 70 75 80 Val Arg Arg Arg Pro Leu Leu Leu Ala Ala Ile Ala Gly Phe Val Val 85 90 95 Ala Asn Thr Val Thr Thr Leu Ser Gly Ser Phe Ala Leu Thr Met Val 100 105 110 Ala Arg Phe Leu Ala Gly Val Ser Ala Gly Leu Met Trp Ala Leu Leu 115 120 125 Ala Gly Tyr Ala Ala Arg Met Val Pro Asp His Gln Lys Gly Arg Ala 130 135 140 Ile Ala Val Ala Met Val Gly Ala Pro Leu Ala Leu Ser Leu Gly Val 145 150 155 160 Pro Thr Gly Thr Phe Leu Gly Asn Leu Val Asp Trp Arg Val Cys Phe 165 170 175 Gly Leu Met Ser Ala Leu Ala Leu Ala Leu Met Leu Trp Val Arg Val 180 185 190 Val Val Pro Asp Phe Ala Gly Gln Ala Ala Gly Arg Arg Leu Ser Pro 195 200 205 Gly Arg Val Phe Thr Leu Ala Gly Val Arg Pro Val Leu Phe Val Val 210 215 220 Leu Ala Phe Val Leu Ala His Asn Ile Leu Tyr Thr Tyr Ile Ala Pro 225 230 235 240 Phe Leu Ala Ala Ala Gly Met Glu Gly Arg Thr Asp Leu Ala Leu Leu 245 250 255 Leu Phe Gly Val Ala Ser Leu Leu Gly Ile Trp Ile Val Gly Ala Leu 260 265 270 Ile Asp Gly His Leu Arg Ala Leu Thr Leu Ala Ser Thr Val Leu Phe 275 280 285 Gly Leu Ser Ala Leu Val Leu Gly Val Ala Gly Asp Ala Pro Ala Val 290 295 300 Val Leu Ala Ala Val Ala Ala Trp Gly Leu Ala Phe Gly Gly Ala Gly 305 310 315 320 Thr Leu Phe Gln Thr Ala Leu Ala Arg Thr Ala Gly Asp Ala Ala Asp 325 330 335 Val Ala Gln Ser Met Leu Val Thr Ala Trp Asn Thr Ala Ile Ala Gly 340 345 350 Gly Gly Leu Leu Gly Gly Val Leu Leu Glu Arg Leu Gly Val Gly Ala 355 360 365 Phe Ala Pro Ala Val Leu Val Leu Leu Ala Ala Thr Leu Leu Ala Val 370 375 380 Trp Gly Ala Arg Arg His Gly Phe Pro Asp Pro Ala Asp Thr Ala Gly 385 390 395 400 Ala <210> 185 <211> 789 <212> DNA <213> Bradyrhizobium japonicum USDA 110 <400> 185 atggacgacg gatacgcgag cgtgatgccg gctaatgcgt ataattggac cgcggtatgg 60 cgacgaaatt atcttgcttg gcgaaaagtg gcgcttgcta gccttctggg caacctggct 120 gacccaataa ccaatctgtt cggccttggc ttcggactgg gactgatagt gggacgggta 180 gaaggaacta gctatatagc gttccttgcg gccggaatgg ttgcgataag cgctatgact 240 agcgcgacct tcgagactct gtatgctgcg ttcgctcgga tggacgtgaa acgcacctgg 300 gaaggaatac tttttactca gctgaccctt ggcgacattg tactaggaga acttgtgtgg 360 gccgcgtcaa aaagcgtact agcgggaact gctattggaa tagtggctgc gaccctggga 420 tacgctagct ggaccagcgt actttgtgcg ataccgacta ttgcgcttac cggccttgtg 480 tttgcgagcc tggctatggt tgtgatatca cttgcgccca cttatgacta ttttgtgttc 540 tatcagagcc tggtgcttac cccaatggtg tttctttgtg gcgcggtgtt cccgaccagc 600 caaatgccag attcattcca gcatttcgcg ggccttcttc cgctggctca tagcgtggat 660 cttatacgcc ccgtgatgct tgaacgcggc gcggataatg cggcgcttca tgtaggcgcg 720 ctgtgcgtat atgcggtgct tccattcttt gcgagcattg cgctattccg gcgccgcctg 780 ctgcggtaa 789 <210> 186 <211> 262 <212> PRT <213> Bradyrhizobium japonicum USDA 110 <400> 186 Met Asp Asp Gly Tyr Ala Ser Val Met Pro Ala Asn Ala Tyr Asn Trp 1 5 10 15 Thr Ala Val Trp Arg Arg Asn Tyr Leu Ala Trp Arg Lys Val Ala Leu 20 25 30 Ala Ser Leu Leu Gly Asn Leu Ala Asp Pro Ile Thr Asn Leu Phe Gly 35 40 45 Leu Gly Phe Gly Leu Gly Leu Ile Val Gly Arg Val Glu Gly Thr Ser 50 55 60 Tyr Ile Ala Phe Leu Ala Ala Gly Met Val Ala Ile Ser Ala Met Thr 65 70 75 80 Ser Ala Thr Phe Glu Thr Leu Tyr Ala Ala Phe Ala Arg Met Asp Val 85 90 95 Lys Arg Thr Trp Glu Gly Ile Leu Phe Thr Gln Leu Thr Leu Gly Asp 100 105 110 Ile Val Leu Gly Glu Leu Val Trp Ala Ala Ser Lys Ser Val Leu Ala 115 120 125 Gly Thr Ala Ile Gly Ile Val Ala Ala Thr Leu Gly Tyr Ala Ser Trp 130 135 140 Thr Ser Val Leu Cys Ala Ile Pro Thr Ile Ala Leu Thr Gly Leu Val 145 150 155 160 Phe Ala Ser Leu Ala Met Val Val Ile Ser Leu Ala Pro Thr Tyr Asp 165 170 175 Tyr Phe Val Phe Tyr Gln Ser Leu Val Leu Thr Pro Met Val Phe Leu 180 185 190 Cys Gly Ala Val Phe Pro Thr Ser Gln Met Pro Asp Ser Phe Gln His 195 200 205 Phe Ala Gly Leu Leu Pro Leu Ala His Ser Val Asp Leu Ile Arg Pro 210 215 220 Val Met Leu Glu Arg Gly Ala Asp Asn Ala Ala Leu His Val Gly Ala 225 230 235 240 Leu Cys Val Tyr Ala Val Leu Pro Phe Phe Ala Ser Ile Ala Leu Phe 245 250 255 Arg Arg Arg Leu Leu Arg 260 <210> 187 <211> 921 <212> DNA <213> Bradyrhizobium japonicum USDA 110 <400> 187 atgaatatga gcaatatggc gattgatctt gttggcgtga ggaaatcatt tggtgataaa 60 gtaattgtga atgatctgag ctttagcgta gcgcgcggag aatgctttgg actgcttgga 120 cccaatggtg ctggcaagtc aaccatagct cgcatgctgc tgggcatgat aagcccagac 180 cgaggcaaaa taaccgtgct ggacgaaccc gtgcccagcc gcgctcgggc cgcgcgcgtg 240 cgcgtaggcg tggtgccgca gtttgacaac cttgaaccag aatttaccgt gcgggaaaac 300 ctgcttgtgt tcggccgcta ctttggcatg agcgctcgca ccattgaggc cgtagtgcca 360 agccttcttg aattcgcgcg gcttgagagc aaagccgatg tgcgcgtgag ccttcttagc 420 ggaggaatga aacggcgact gaccctggcg cgcgctctga ttaatgaccc ccacctactg 480 gtgatggatg aaccgaccac cggactggac ccgcacgctc gccatctgat ttgggagcgc 540 ctgcgggctc ttcttgcgcg cggcaaaacc attctgctta ccactcattt tatggaagaa 600 gcggagcgcc tttgcgaccg gctatgcgtg cttgaatcag gatgcaagat tgccgagggc 660 aaacccgatg cgcttattga tgaacatatt ggctgcaacg tgattgaaat ttacggcgga 720 gacctagacc aactgcggga actgattcga ccgtacgcgc ggcatattga agtgtcagga 780 gaaacccttt tctgttatgc gcgatgtccg gatgagatta gcgtgcatct gcgcggacga 840 accgatcttc gcgtactgca gcgcccaccg aatctggaag atgtgttcct tcggcttacc 900 ggacgcgaaa tggaaaagta a 921 <210> 188 <211> 306 <212> PRT <213> Bradyrhizobium japonicum USDA 110 <400> 188 Met Asn Met Ser Asn Met Ala Ile Asp Leu Val Gly Val Arg Lys Ser 1 5 10 15 Phe Gly Asp Lys Val Ile Val Asn Asp Leu Ser Phe Ser Val Ala Arg 20 25 30 Gly Glu Cys Phe Gly Leu Leu Gly Pro Asn Gly Ala Gly Lys Ser Thr 35 40 45 Ile Ala Arg Met Leu Leu Gly Met Ile Ser Pro Asp Arg Gly Lys Ile 50 55 60 Thr Val Leu Asp Glu Pro Val Pro Ser Arg Ala Arg Ala Ala Arg Val 65 70 75 80 Arg Val Gly Val Val Pro Gln Phe Asp Asn Leu Glu Pro Glu Phe Thr 85 90 95 Val Arg Glu Asn Leu Leu Val Phe Gly Arg Tyr Phe Gly Met Ser Ala 100 105 110 Arg Thr Ile Glu Ala Val Val Pro Ser Leu Leu Glu Phe Ala Arg Leu 115 120 125 Glu Ser Lys Ala Asp Val Arg Val Ser Leu Leu Ser Gly Gly Met Lys 130 135 140 Arg Arg Leu Thr Leu Ala Arg Ala Leu Ile Asn Asp Pro His Leu Leu 145 150 155 160 Val Met Asp Glu Pro Thr Thr Gly Leu Asp Pro His Ala Arg His Leu 165 170 175 Ile Trp Glu Arg Leu Arg Ala Leu Leu Ala Arg Gly Lys Thr Ile Leu 180 185 190 Leu Thr Thr His Phe Met Glu Glu Ala Glu Arg Leu Cys Asp Arg Leu 195 200 205 Cys Val Leu Glu Ser Gly Cys Lys Ile Ala Glu Gly Lys Pro Asp Ala 210 215 220 Leu Ile Asp Glu His Ile Gly Cys Asn Val Ile Glu Ile Tyr Gly Gly 225 230 235 240 Asp Leu Asp Gln Leu Arg Glu Leu Ile Arg Pro Tyr Ala Arg His Ile 245 250 255 Glu Val Ser Gly Glu Thr Leu Phe Cys Tyr Ala Arg Cys Pro Asp Glu 260 265 270 Ile Ser Val His Leu Arg Gly Arg Thr Asp Leu Arg Val Leu Gln Arg 275 280 285 Pro Pro Asn Leu Glu Asp Val Phe Leu Arg Leu Thr Gly Arg Glu Met 290 295 300 Glu Lys 305 <210> 189 <211> 378 <212> DNA <213> Escherichia coli K12 MG1655 <400> 189 atgaaacata aacaacgttg ggcgggggca atctgctgtt ttgtcctctt cattgtggtg 60 tgcctttttc tggcgacgca catgaaaggc gcttttcggg ctgccgggca tcctgaaatc 120 ggcttgctat ttttcattct tcctggagca gtcgccagct tcttttcaca gcgtagagaa 180 gtcctgaaac ctctgtttgg cgcaatgctg gcggcaccct gttcgatgct cattatgcgg 240 ctgttttttt caccgacgcg ctcattctgg caagagctgg catggttact aagcgcggtg 300 ttctggtgtg cgctgggggc actgtgtttc ttatttatca gtagtttgtt taaaccacag 360 cacagaaaaa atcagtaa 378 <210> 190 <211> 125 <212> PRT <213> Escherichia coli K12 MG1655 <400> 190 Met Lys His Lys Gln Arg Trp Ala Gly Ala Ile Cys Cys Phe Val Leu 1 5 10 15 Phe Ile Val Val Cys Leu Phe Leu Ala Thr His Met Lys Gly Ala Phe 20 25 30 Arg Ala Ala Gly His Pro Glu Ile Gly Leu Leu Phe Phe Ile Leu Pro 35 40 45 Gly Ala Val Ala Ser Phe Phe Ser Gln Arg Arg Glu Val Leu Lys Pro 50 55 60 Leu Phe Gly Ala Met Leu Ala Ala Pro Cys Ser Met Leu Ile Met Arg 65 70 75 80 Leu Phe Phe Ser Pro Thr Arg Ser Phe Trp Gln Glu Leu Ala Trp Leu 85 90 95 Leu Ser Ala Val Phe Trp Cys Ala Leu Gly Ala Leu Cys Phe Leu Phe 100 105 110 Ile Ser Ser Leu Phe Lys Pro Gln His Arg Lys Asn Gln 115 120 125 <210> 191 <211> 369 <212> DNA <213> Enterobacteriaceae bacterium ENNIH1 <400> 191 atgaaacata aacgcggact cgctggcata atttgttgtt ttcttctctt cattgttgtt 60 tgttttcttg aagtgacgaa tatggaaggc gcgtttcgtg cgtcggggca tcctgaactg 120 ggattgttgt tttttactct tcctggcgcg gtcgcgtcta ttttttcacg tcgccgtaaa 180 gtgatgttgc cgctgtttgg cgcgatctta gcggcgccgt tgtgcttcgt tgttatgcgt 240 ctgtttttta ctccggtgcg ttcagtgtgg caggaactgg cgtggttgtt ttctgcggta 300 ttctggtgtg cgctgggcgc tttgtgttat ctgtttatca gctctttctt tggcaacggg 360 acgcgttaa 369 <210> 192 <211> 122 <212> PRT <213> Enterobacteriaceae bacterium ENNIH1 <400> 192 Met Lys His Lys Arg Gly Leu Ala Gly Ile Ile Cys Cys Phe Leu Leu 1 5 10 15 Phe Ile Val Val Cys Phe Leu Glu Val Thr Asn Met Glu Gly Ala Phe 20 25 30 Arg Ala Ser Gly His Pro Glu Leu Gly Leu Leu Phe Phe Thr Leu Pro 35 40 45 Gly Ala Val Ala Ser Ile Phe Ser Arg Arg Arg Lys Val Met Leu Pro 50 55 60 Leu Phe Gly Ala Ile Leu Ala Ala Pro Leu Cys Phe Val Val Met Arg 65 70 75 80 Leu Phe Phe Thr Pro Val Arg Ser Val Trp Gln Glu Leu Ala Trp Leu 85 90 95 Phe Ser Ala Val Phe Trp Cys Ala Leu Gly Ala Leu Cys Tyr Leu Phe 100 105 110 Ile Ser Ser Phe Phe Gly Asn Gly Thr Arg 115 120 <210> 193 <211> 1215 <212> DNA <213> Escherichia coli 113303 <400> 193 atgtcgtata tccgggtcaa taacgtcggt aaggcctatc gtcagtatca ctcgaagacg 60 gggcgactga tcgaatggtt atcaccactg aatacgaaac gtcataattt aaaatggatc 120 cttcgtgaga ttaacttcga agtcgcacca ggtgaggcag tcggtattat cggtatcaat 180 ggtgccggta agtcgacgct gttaaaactt ataacgggga cttcacgacc aactacggga 240 gaaattgaaa tctcaggtcg tgtcgcagcc ttacttgaat tagggatggg atttcattcg 300 gatttcacgg gtcggcagaa cgtttatatg tcggggcaac tgttagggtt atcatcggag 360 aaaataacgg aactgatgcc tcaaattgaa gagtttgcag agattgggga ctatatcgat 420 cagccagttc gtgtctactc atccgggatg caagttcggt tagcattttc ggtcgccact 480 gcaatccgtc cagatgttct aattatcgat gaggccttat cggttggtga tgcctatttc 540 cagcataaaa gctttgagcg tattcggaaa tttcgtcagg aagggacgac tctgttactg 600 gtctctcatg ataaacaagc catccaaagc atttgtgacc gggccatttt attaaataaa 660 ggtcaaattg aaatggaagg cgaaccagaa gccgttatgg attattataa cgccttactg 720 gccgataaac aaaaccagtc aattaaacaa gttgagcata acggtaaaac tcaaacggtt 780 tcgggtacgg gtgaagttac gatctccgaa gttcatttac ttgatgaaca gggtaacgtt 840 acggaatttg tttcagtcgg gcatcgtgtc agcttgcaag tcaatgttga agtcaaggac 900 gatattccag agttagttgt cgggtatatg attaaggatc ggttagggca gccaattttc 960 gggacgaata cttaccatct taaccagacg cttacgtcac tgaaaaaagg ggaaaagcgt 1020 tcattcttat tttcgttcga tgcccggtta ggagtcggtt catattcggt cgcagtcgcc 1080 ttgcatacgt catcgactca ccttggtaaa aattatgaat ggcgtgatct ggccgttgtc 1140 ttcaatgtcg ttaatactga acaacaagag tttgtcggtg tttcatggtt accaccagaa 1200 ctggaaattt cgtaa 1215 <210> 194 <211> 404 <212> PRT <213> Escherichia coli 113303 <400> 194 Met Ser Tyr Ile Arg Val Asn Asn Val Gly Lys Ala Tyr Arg Gln Tyr 1 5 10 15 His Ser Lys Thr Gly Arg Leu Ile Glu Trp Leu Ser Pro Leu Asn Thr 20 25 30 Lys Arg His Asn Leu Lys Trp Ile Leu Arg Glu Ile Asn Phe Glu Val 35 40 45 Ala Pro Gly Glu Ala Val Gly Ile Ile Gly Ile Asn Gly Ala Gly Lys 50 55 60 Ser Thr Leu Leu Lys Leu Ile Thr Gly Thr Ser Arg Pro Thr Thr Gly 65 70 75 80 Glu Ile Glu Ile Ser Gly Arg Val Ala Ala Leu Leu Glu Leu Gly Met 85 90 95 Gly Phe His Ser Asp Phe Thr Gly Arg Gln Asn Val Tyr Met Ser Gly 100 105 110 Gln Leu Leu Gly Leu Ser Ser Glu Lys Ile Thr Glu Leu Met Pro Gln 115 120 125 Ile Glu Glu Phe Ala Glu Ile Gly Asp Tyr Ile Asp Gln Pro Val Arg 130 135 140 Val Tyr Ser Ser Gly Met Gln Val Arg Leu Ala Phe Ser Val Ala Thr 145 150 155 160 Ala Ile Arg Pro Asp Val Leu Ile Ile Asp Glu Ala Leu Ser Val Gly 165 170 175 Asp Ala Tyr Phe Gln His Lys Ser Phe Glu Arg Ile Arg Lys Phe Arg 180 185 190 Gln Glu Gly Thr Thr Leu Leu Leu Val Ser His Asp Lys Gln Ala Ile 195 200 205 Gln Ser Ile Cys Asp Arg Ala Ile Leu Leu Asn Lys Gly Gln Ile Glu 210 215 220 Met Glu Gly Glu Pro Glu Ala Val Met Asp Tyr Tyr Asn Ala Leu Leu 225 230 235 240 Ala Asp Lys Gln Asn Gln Ser Ile Lys Gln Val Glu His Asn Gly Lys 245 250 255 Thr Gln Thr Val Ser Gly Thr Gly Glu Val Thr Ile Ser Glu Val His 260 265 270 Leu Leu Asp Glu Gln Gly Asn Val Thr Glu Phe Val Ser Val Gly His 275 280 285 Arg Val Ser Leu Gln Val Asn Val Glu Val Lys Asp Asp Ile Pro Glu 290 295 300 Leu Val Val Gly Tyr Met Ile Lys Asp Arg Leu Gly Gln Pro Ile Phe 305 310 315 320 Gly Thr Asn Thr Tyr His Leu Asn Gln Thr Leu Thr Ser Leu Lys Lys 325 330 335 Gly Glu Lys Arg Ser Phe Leu Phe Ser Phe Asp Ala Arg Leu Gly Val 340 345 350 Gly Ser Tyr Ser Val Ala Val Ala Leu His Thr Ser Ser Thr His Leu 355 360 365 Gly Lys Asn Tyr Glu Trp Arg Asp Leu Ala Val Val Phe Asn Val Val 370 375 380 Asn Thr Glu Gln Gln Glu Phe Val Gly Val Ser Trp Leu Pro Pro Glu 385 390 395 400 Leu Glu Ile Ser <210> 195 <211> 795 <212> DNA <213> Escherichia coli 113303 <400> 195 atgcgggatt tactaactac tatttatcgt tatcgaggat ttatctggtc gtcggttaaa 60 cgtgattttc aggcccgtta tcaaacgtcg atgctgggtg ccctatggct tgttttgcaa 120 ccactttcga tgattctggt ctatacgctg gttttttcag aagttatgaa ggcccggatg 180 cctgataata ctgggtcatt tgcctattcg atttatcttt gctcaggagt cctgacgtgg 240 ggactcttta ctgagatgct ggataaaggt cagagcgtct ttattaataa cgcaaacctg 300 atcaagaaac tttcgtttcc aaaaatctgc ctgccaatca tcgttacttt atcagccgtt 360 ctaaacttcg ccattatttt ctcgctgttt ctaattttta tcattgtcac gggtaatttc 420 cctggttggc tttttctttc agttatacca gtcctgttat tgcaaatcct gtttgccggt 480 gggctgggaa tgatcttagg tgtcatgaat gtctttttcc gagatgttgg gcaactggtt 540 ggtgttgccc tgcaattctg gttttggttc acgcctattg tttatgtcct gaactcgtta 600 ccagcctggg ccaaaaacct gatgatgtat aatccaatga cgcggatcat gcaatcgtat 660 cagtcaatct tcgcctatca tctggcccct aattggtatt cactatggcc agtcttagca 720 cttgccatta ttttctgcgt catcggtttc cgaatgttcc gtaagcatgc cgccgatatg 780 gttgatgaat tataa 795 <210> 196 <211> 263 <212> PRT <213> Escherichia coli 113303 <400> 196 Met Arg Asp Leu Leu Thr Thr Ile Tyr Arg Tyr Arg Gly Phe Ile Trp 1 5 10 15 Ser Ser Val Lys Arg Asp Phe Gln Ala Arg Tyr Gln Thr Ser Met Leu 20 25 30 Gly Ala Leu Trp Leu Val Leu Gln Pro Leu Ser Met Ile Leu Val Tyr 35 40 45 Thr Leu Val Phe Ser Glu Val Met Lys Ala Arg Met Pro Asp Asn Thr 50 55 60 Gly Ser Phe Ala Tyr Ser Ile Tyr Leu Cys Ser Gly Val Leu Thr Trp 65 70 75 80 Gly Leu Phe Thr Glu Met Leu Asp Lys Gly Gln Ser Val Phe Ile Asn 85 90 95 Asn Ala Asn Leu Ile Lys Lys Leu Ser Phe Pro Lys Ile Cys Leu Pro 100 105 110 Ile Ile Val Thr Leu Ser Ala Val Leu Asn Phe Ala Ile Ile Phe Ser 115 120 125 Leu Phe Leu Ile Phe Ile Ile Val Thr Gly Asn Phe Pro Gly Trp Leu 130 135 140 Phe Leu Ser Val Ile Pro Val Leu Leu Leu Gln Ile Leu Phe Ala Gly 145 150 155 160 Gly Leu Gly Met Ile Leu Gly Val Met Asn Val Phe Phe Arg Asp Val 165 170 175 Gly Gln Leu Val Gly Val Ala Leu Gln Phe Trp Phe Trp Phe Thr Pro 180 185 190 Ile Val Tyr Val Leu Asn Ser Leu Pro Ala Trp Ala Lys Asn Leu Met 195 200 205 Met Tyr Asn Pro Met Thr Arg Ile Met Gln Ser Tyr Gln Ser Ile Phe 210 215 220 Ala Tyr His Leu Ala Pro Asn Trp Tyr Ser Leu Trp Pro Val Leu Ala 225 230 235 240 Leu Ala Ile Ile Phe Cys Val Ile Gly Phe Arg Met Phe Arg Lys His 245 250 255 Ala Ala Asp Met Val Asp Glu 260 <210> 197 <211> 1113 <212> DNA <213> Helicobacter pylori <400> 197 atgtttcagc cgctgctgga tgcatatgtt gaaagcgcaa gcattgaaaa aatggcaagc 60 aaaagtccgc ctccgctgaa aattgcagtt gcaaattggt ggggtgatga agaaatcaaa 120 gagtttaaaa acttcgtcct gtactttatt ctgagccagc gttataccat taccctgcat 180 cagaatccga atgaattttc cgatctggtt tttggtaatc cgctgggtag cgcacgtaaa 240 attctgagct atcagaatgc aaaacgcgtg ttttataccg gtgaaaatga aagcccgaac 300 ttcaacctgt ttgattatgc cattggtttc gatgagctgg attttaatga tcgttatctg 360 cgtatgccgc tgtattataa cgagctgcat atcaaagcag aaagcgttaa tgataccacc 420 gcaccgtata aactgaaaga taatagcctg tacgcactga aaaaaccgag ccattgcttt 480 aaagaaaaac atccgaatct gtgtgccgtg gttaatgatg aaagcgatcc tctgaaacgt 540 ggttttgcaa gctttgttgc aagcaatccg aacgcaccga ttcgtaatgc attctatgat 600 gcactgaata gcattgaacc ggttaccggt ggtggtagcg ttcgtaatac cctgggttat 660 aatgtgaaaa acaaaaacga attcctgagc cagtataaat tcaatctgtg ctttgaaaac 720 acccagggtt atggttatgt gaccgaaaaa atcatcgatg cctatttcag ccataccatt 780 ccgatttatt ggggtagccc gagcgttgca aaagatttca atccgaaaag ctttgtgaac 840 gtgcacgact tcaaaaactt tgatgaagcc atcgattata tcaaatacct gcacacccat 900 aaaaacgcct atctggatat gctgtatgaa aatccgctga atacactgga tggtaaagcc 960 tatttttacc agaacctgag cttcaaaaaa atcctggcct ttttcaaaac catcctggaa 1020 aacgatacca tctatcacga taacccgttt atcttttgcc gtgatctgaa tgaaccgctg 1080 gttaccattg atgatctgcg tgttaattat taa 1113 <210> 198 <211> 370 <212> PRT <213> Helicobacter pylori <400> 198 Met Phe Gln Pro Leu Leu Asp Ala Tyr Val Glu Ser Ala Ser Ile Glu 1 5 10 15 Lys Met Ala Ser Lys Ser Pro Pro Pro Leu Lys Ile Ala Val Ala Asn 20 25 30 Trp Trp Gly Asp Glu Glu Ile Lys Glu Phe Lys Asn Phe Val Leu Tyr 35 40 45 Phe Ile Leu Ser Gln Arg Tyr Thr Ile Thr Leu His Gln Asn Pro Asn 50 55 60 Glu Phe Ser Asp Leu Val Phe Gly Asn Pro Leu Gly Ser Ala Arg Lys 65 70 75 80 Ile Leu Ser Tyr Gln Asn Ala Lys Arg Val Phe Tyr Thr Gly Glu Asn 85 90 95 Glu Ser Pro Asn Phe Asn Leu Phe Asp Tyr Ala Ile Gly Phe Asp Glu 100 105 110 Leu Asp Phe Asn Asp Arg Tyr Leu Arg Met Pro Leu Tyr Tyr Asn Glu 115 120 125 Leu His Ile Lys Ala Glu Ser Val Asn Asp Thr Thr Ala Pro Tyr Lys 130 135 140 Leu Lys Asp Asn Ser Leu Tyr Ala Leu Lys Lys Pro Ser His Cys Phe 145 150 155 160 Lys Glu Lys His Pro Asn Leu Cys Ala Val Val Asn Asp Glu Ser Asp 165 170 175 Pro Leu Lys Arg Gly Phe Ala Ser Phe Val Ala Ser Asn Pro Asn Ala 180 185 190 Pro Ile Arg Asn Ala Phe Tyr Asp Ala Leu Asn Ser Ile Glu Pro Val 195 200 205 Thr Gly Gly Gly Ser Val Arg Asn Thr Leu Gly Tyr Asn Val Lys Asn 210 215 220 Lys Asn Glu Phe Leu Ser Gln Tyr Lys Phe Asn Leu Cys Phe Glu Asn 225 230 235 240 Thr Gln Gly Tyr Gly Tyr Val Thr Glu Lys Ile Ile Asp Ala Tyr Phe 245 250 255 Ser His Thr Ile Pro Ile Tyr Trp Gly Ser Pro Ser Val Ala Lys Asp 260 265 270 Phe Asn Pro Lys Ser Phe Val Asn Val His Asp Phe Lys Asn Phe Asp 275 280 285 Glu Ala Ile Asp Tyr Ile Lys Tyr Leu His Thr His Lys Asn Ala Tyr 290 295 300 Leu Asp Met Leu Tyr Glu Asn Pro Leu Asn Thr Leu Asp Gly Lys Ala 305 310 315 320 Tyr Phe Tyr Gln Asn Leu Ser Phe Lys Lys Ile Leu Ala Phe Phe Lys 325 330 335 Thr Ile Leu Glu Asn Asp Thr Ile Tyr His Asp Asn Pro Phe Ile Phe 340 345 350 Cys Arg Asp Leu Asn Glu Pro Leu Val Thr Ile Asp Asp Leu Arg Val 355 360 365 Asn Tyr 370 <210> 199 <211> 990 <212> DNA <213> Basilea psittacipulmonis JF4266 (DSM 24701) <400> 199 atgtcagtgc tgaaaaaact ggtaagaacg ctgaaaaaga aaaaagatat tcccagcgaa 60 aatcaggaag atattaagcc gcaggaattt ggacatatca aacattatca tttctggcct 120 ctgtcgaacg aaacgttttt taaccaattt gcgcaggaaa aaaaccttga tctgagccag 180 acggccctaa ttagctgctt tggggaacta tcagcgattc ctaaaatccc tgaacggtat 240 aaagtgtttt ttacggggga aaatatctat catccggatc gcatctcata ttcggatccg 300 gagctctatc gcatggtgga tctgtattta ggctttgaat accggacgga accgaagtat 360 ctacgctttc cgctgtgggt ttggtattta tgcggcctga cgaaaaaacc gcatttttca 420 catgaatcaa ttgcggaatt tattcggaaa atgaaccaac ctgagtttcg cctgcagtca 480 tcaaggaatc gcttttgcag ccatattagc agccatgata cgaacggcat tcggaaacgg 540 atgattgatt taattttacc gattgcgtca gtggattgcg ccggcaagtt tatgaacaac 600 acggatgagt taaaagcgaa gtttaatgat gacaagatcg actatctaaa acagtatcgg 660 tttaatctct gtcctgaaaa ctcagaatca gtcgggtata tcacggaaaa gatttttgaa 720 tcaattatgg ccgggtgcat tccaatttat tggggaggag tcaagcagct ttttgtcgaa 780 ccggatattt taaatccgga agcatttatt tactacgaaa aagggaaaga agagcaatta 840 gcgaaacagg ttgaagaact ttggatatca cctaaacggt atgaagagtt tgcagcaatt 900 gccccgttta aagaggacgc agccgaagtg atttatacgt ggattgaaga actggaaaaa 960 cggctacggg catttgaacc aaaagcctaa 990 <210> 200 <211> 329 <212> PRT <213> Basilea psittacipulmonis JF4266 (DSM 24701) <400> 200 Met Ser Val Leu Lys Lys Leu Val Arg Thr Leu Lys Lys Lys Lys Asp 1 5 10 15 Ile Pro Ser Glu Asn Gln Glu Asp Ile Lys Pro Gln Glu Phe Gly His 20 25 30 Ile Lys His Tyr His Phe Trp Pro Leu Ser Asn Glu Thr Phe Phe Asn 35 40 45 Gln Phe Ala Gln Glu Lys Asn Leu Asp Leu Ser Gln Thr Ala Leu Ile 50 55 60 Ser Cys Phe Gly Glu Leu Ser Ala Ile Pro Lys Ile Pro Glu Arg Tyr 65 70 75 80 Lys Val Phe Phe Thr Gly Glu Asn Ile Tyr His Pro Asp Arg Ile Ser 85 90 95 Tyr Ser Asp Pro Glu Leu Tyr Arg Met Val Asp Leu Tyr Leu Gly Phe 100 105 110 Glu Tyr Arg Thr Glu Pro Lys Tyr Leu Arg Phe Pro Leu Trp Val Trp 115 120 125 Tyr Leu Cys Gly Leu Thr Lys Lys Pro His Phe Ser His Glu Ser Ile 130 135 140 Ala Glu Phe Ile Arg Lys Met Asn Gln Pro Glu Phe Arg Leu Gln Ser 145 150 155 160 Ser Arg Asn Arg Phe Cys Ser His Ile Ser Ser His Asp Thr Asn Gly 165 170 175 Ile Arg Lys Arg Met Ile Asp Leu Ile Leu Pro Ile Ala Ser Val Asp 180 185 190 Cys Ala Gly Lys Phe Met Asn Asn Thr Asp Glu Leu Lys Ala Lys Phe 195 200 205 Asn Asp Asp Lys Ile Asp Tyr Leu Lys Gln Tyr Arg Phe Asn Leu Cys 210 215 220 Pro Glu Asn Ser Glu Ser Val Gly Tyr Ile Thr Glu Lys Ile Phe Glu 225 230 235 240 Ser Ile Met Ala Gly Cys Ile Pro Ile Tyr Trp Gly Gly Val Lys Gln 245 250 255 Leu Phe Val Glu Pro Asp Ile Leu Asn Pro Glu Ala Phe Ile Tyr Tyr 260 265 270 Glu Lys Gly Lys Glu Glu Gln Leu Ala Lys Gln Val Glu Glu Leu Trp 275 280 285 Ile Ser Pro Lys Arg Tyr Glu Glu Phe Ala Ala Ile Ala Pro Phe Lys 290 295 300 Glu Asp Ala Ala Glu Val Ile Tyr Thr Trp Ile Glu Glu Leu Glu Lys 305 310 315 320 Arg Leu Arg Ala Phe Glu Pro Lys Ala 325 <210> 201 <211> 900 <212> DNA <213> Helicobacter pylori <400> 201 atggccttta aagttgttca gatttgtggt ggtctgggca atcagatgtt tcagtatgca 60 tttgcaaaaa gcctgcagaa acatagcaat acaccggttc tgctggatat taccagcttt 120 gattggagca atcgtaaaat gcagctggaa ctgtttccga ttgatctgcc gtatgcaagc 180 gaaaaagaaa ttgcaattgc caaaatgcag catctgccga aactggttcg taatgttctg 240 aaatgcatgg gttttgatcg tgtgagccaa gaaatcgtgt ttgaatatga accgaaactg 300 ctgaaaacca gccgtctgac ctatttttat ggctattttc aggatccgcg ttattttgat 360 gcaattagtc cgctgatcaa acagaccttt accctgcctc cgcctccgga aaatggtaat 420 aacaaaaaaa aagaagaaga gtatcatcgt aaactggcac tgattctggc agcaaaaaat 480 agcgtgtttg tgcatattcg tcgcggtgat tatgttggta ttggttgtca gctgggcatc 540 gattatcaga aaaaagcact ggaatacatg gcaaaacgtg ttccgaatat ggaactgttt 600 gtgttttgcg aggacctgga atttacccag aatctggatc tgggctatcc gtttatggat 660 atgaccaccc gtgataaaga ggaagaggca tattgggata tgctgctgat gcagagctgt 720 aaacatggta ttattgccaa cagcacctat agttggtggg cagcatatct gattaataac 780 ccggaaaaaa tcattattgg tccgaaacat tggctgtttg gccatgaaaa catcctgtgt 840 aaagaatggg tgaaaatcga aagccacttt gaagtgaaaa gccagaaata taatgcctaa 900 <210> 202 <211> 299 <212> PRT <213> Helicobacter pylori <400> 202 Met Ala Phe Lys Val Val Gln Ile Cys Gly Gly Leu Gly Asn Gln Met 1 5 10 15 Phe Gln Tyr Ala Phe Ala Lys Ser Leu Gln Lys His Ser Asn Thr Pro 20 25 30 Val Leu Leu Asp Ile Thr Ser Phe Asp Trp Ser Asn Arg Lys Met Gln 35 40 45 Leu Glu Leu Phe Pro Ile Asp Leu Pro Tyr Ala Ser Glu Lys Glu Ile 50 55 60 Ala Ile Ala Lys Met Gln His Leu Pro Lys Leu Val Arg Asn Val Leu 65 70 75 80 Lys Cys Met Gly Phe Asp Arg Val Ser Gln Glu Ile Val Phe Glu Tyr 85 90 95 Glu Pro Lys Leu Leu Lys Thr Ser Arg Leu Thr Tyr Phe Tyr Gly Tyr 100 105 110 Phe Gln Asp Pro Arg Tyr Phe Asp Ala Ile Ser Pro Leu Ile Lys Gln 115 120 125 Thr Phe Thr Leu Pro Pro Pro Pro Glu Asn Gly Asn Asn Lys Lys Lys 130 135 140 Glu Glu Glu Tyr His Arg Lys Leu Ala Leu Ile Leu Ala Ala Lys Asn 145 150 155 160 Ser Val Phe Val His Ile Arg Arg Gly Asp Tyr Val Gly Ile Gly Cys 165 170 175 Gln Leu Gly Ile Asp Tyr Gln Lys Lys Ala Leu Glu Tyr Met Ala Lys 180 185 190 Arg Val Pro Asn Met Glu Leu Phe Val Phe Cys Glu Asp Leu Glu Phe 195 200 205 Thr Gln Asn Leu Asp Leu Gly Tyr Pro Phe Met Asp Met Thr Thr Arg 210 215 220 Asp Lys Glu Glu Glu Ala Tyr Trp Asp Met Leu Leu Met Gln Ser Cys 225 230 235 240 Lys His Gly Ile Ile Ala Asn Ser Thr Tyr Ser Trp Trp Ala Ala Tyr 245 250 255 Leu Ile Asn Asn Pro Glu Lys Ile Ile Ile Gly Pro Lys His Trp Leu 260 265 270 Phe Gly His Glu Asn Ile Leu Cys Lys Glu Trp Val Lys Ile Glu Ser 275 280 285 His Phe Glu Val Lys Ser Gln Lys Tyr Asn Ala 290 295 <210> 203 <211> 1341 <212> DNA <213> Escherichia coli K12 MG1655 <400> 203 atgatgatta ctctgcgcaa acttcctctg gcggttgccg tcgcagcggg cgtaatgtct 60 gctcaggcaa tggctgttga tttccacggc tatgcacgtt ccggtattgg ttggacaggt 120 agcggcggtg aacaacagtg tttccagact accggtgctc aaagtaaata ccgtcttggc 180 aacgaatgtg aaacttatgc tgaattaaaa ttgggtcagg aagtgtggaa agagggcgat 240 aagagcttct atttcgacac taacgtggcc tattccgtcg cacaacagaa tgactgggaa 300 gctaccgatc cggccttccg tgaagcaaac gtgcagggta aaaacctgat cgaatggctg 360 ccaggctcca ccatctgggc aggtaagcgc ttctaccaac gtcatgacgt tcatatgatc 420 gacttctact actgggatat ttctggtcct ggtgccggtc tggaaaacat cgatgttggc 480 ttcggtaaac tctctctggc agcaacccgc tcctctgaag ctggtggttc ttcctctttc 540 gccagcaaca atatttatga ctataccaac gaaaccgcga acgacgtttt cgatgtgcgt 600 ttagcgcaga tggaaatcaa cccgggcggc acattagaac tgggtgtcga ctacggtcgt 660 gccaacttgc gtgataacta tcgtctggtt gatggcgcat cgaaagacgg ctggttattc 720 actgctgaac atactcagag tgtcctgaag ggctttaaca agtttgttgt tcagtacgct 780 actgactcga tgacctcgca gggtaaaggg ctgtcgcagg gttctggcgt tgcatttgat 840 aacgaaaaat ttgcctacaa tatcaacaac aacggtcaca tgctgcgtat cctcgaccac 900 ggtgcgatct ccatgggcga caactgggac atgatgtacg tgggtatgta ccaggatatc 960 aactgggata acgacaacgg caccaagtgg tggaccgtcg gtattcgccc gatgtacaag 1020 tggacgccaa tcatgagcac cgtgatggaa atcggctacg acaacgtcga atcccagcgc 1080 accggcgaca agaacaatca gtacaaaatt accctcgcac aacaatggca ggctggcgac 1140 agcatctggt cacgcccggc tattcgtgta ttcgcaacct acgccaagtg ggatgagaaa 1200 tggggttacg actacaccgg taacgctgat aacaacgcga acttcggcaa agccgttcct 1260 gctgatttca acggcggcag cttcggtcgt ggcgacagcg acgagtggac cttcggtgcc 1320 cagatggaaa tctggtggta a 1341 <210> 204 <211> 446 <212> PRT <213> Escherichia coli K12 MG1655 <400> 204 Met Met Ile Thr Leu Arg Lys Leu Pro Leu Ala Val Ala Val Ala Ala 1 5 10 15 Gly Val Met Ser Ala Gln Ala Met Ala Val Asp Phe His Gly Tyr Ala 20 25 30 Arg Ser Gly Ile Gly Trp Thr Gly Ser Gly Gly Glu Gln Gln Cys Phe 35 40 45 Gln Thr Thr Gly Ala Gln Ser Lys Tyr Arg Leu Gly Asn Glu Cys Glu 50 55 60 Thr Tyr Ala Glu Leu Lys Leu Gly Gln Glu Val Trp Lys Glu Gly Asp 65 70 75 80 Lys Ser Phe Tyr Phe Asp Thr Asn Val Ala Tyr Ser Val Ala Gln Gln 85 90 95 Asn Asp Trp Glu Ala Thr Asp Pro Ala Phe Arg Glu Ala Asn Val Gln 100 105 110 Gly Lys Asn Leu Ile Glu Trp Leu Pro Gly Ser Thr Ile Trp Ala Gly 115 120 125 Lys Arg Phe Tyr Gln Arg His Asp Val His Met Ile Asp Phe Tyr Tyr 130 135 140 Trp Asp Ile Ser Gly Pro Gly Ala Gly Leu Glu Asn Ile Asp Val Gly 145 150 155 160 Phe Gly Lys Leu Ser Leu Ala Ala Thr Arg Ser Ser Glu Ala Gly Gly 165 170 175 Ser Ser Ser Phe Ala Ser Asn Asn Ile Tyr Asp Tyr Thr Asn Glu Thr 180 185 190 Ala Asn Asp Val Phe Asp Val Arg Leu Ala Gln Met Glu Ile Asn Pro 195 200 205 Gly Gly Thr Leu Glu Leu Gly Val Asp Tyr Gly Arg Ala Asn Leu Arg 210 215 220 Asp Asn Tyr Arg Leu Val Asp Gly Ala Ser Lys Asp Gly Trp Leu Phe 225 230 235 240 Thr Ala Glu His Thr Gln Ser Val Leu Lys Gly Phe Asn Lys Phe Val 245 250 255 Val Gln Tyr Ala Thr Asp Ser Met Thr Ser Gln Gly Lys Gly Leu Ser 260 265 270 Gln Gly Ser Gly Val Ala Phe Asp Asn Glu Lys Phe Ala Tyr Asn Ile 275 280 285 Asn Asn Asn Gly His Met Leu Arg Ile Leu Asp His Gly Ala Ile Ser 290 295 300 Met Gly Asp Asn Trp Asp Met Met Tyr Val Gly Met Tyr Gln Asp Ile 305 310 315 320 Asn Trp Asp Asn Asp Asn Gly Thr Lys Trp Trp Thr Val Gly Ile Arg 325 330 335 Pro Met Tyr Lys Trp Thr Pro Ile Met Ser Thr Val Met Glu Ile Gly 340 345 350 Tyr Asp Asn Val Glu Ser Gln Arg Thr Gly Asp Lys Asn Asn Gln Tyr 355 360 365 Lys Ile Thr Leu Ala Gln Gln Trp Gln Ala Gly Asp Ser Ile Trp Ser 370 375 380 Arg Pro Ala Ile Arg Val Phe Ala Thr Tyr Ala Lys Trp Asp Glu Lys 385 390 395 400 Trp Gly Tyr Asp Tyr Thr Gly Asn Ala Asp Asn Asn Ala Asn Phe Gly 405 410 415 Lys Ala Val Pro Ala Asp Phe Asn Gly Gly Ser Phe Gly Arg Gly Asp 420 425 430 Ser Asp Glu Trp Thr Phe Gly Ala Gln Met Glu Ile Trp Trp 435 440 445 <210> 205 <211> 1191 <212> DNA <213> Escherichia coli K12 MG1655 <400> 205 atgaaaataa aaacaggtgc acgcatcctc gcattatccg cattaacgac gatgatgttt 60 tccgcctcgg ctctcgccaa aatcgaagaa ggtaaactgg taatctggat taacggcgat 120 aaaggctata acggtcttgc tgaagtcggt aagaaattcg agaaagatac cggaattaaa 180 gtcaccgttg agcatccgga taaactggaa gagaaattcc cacaggttgc ggcaactggc 240 gatggccctg acattatctt ctgggcacac gaccgctttg gtggctacgc tcaatctggc 300 ctgttggctg aaatcacccc ggacaaagcg ttccaggaca agctgtatcc gtttacctgg 360 gatgccgtac gttacaacgg caagctgatt gcttacccga tcgctgttga agcgttatcg 420 ctgatttata acaaagatct gctgccgaac ccgccaaaaa cctgggaaga gatcccggcg 480 ctggataaag aactgaaagc gaaaggtaag agcgcgctga tgttcaacct gcaagaaccg 540 tacttcacct ggccgctgat tgctgctgac gggggttatg cgttcaagta tgaaaacggc 600 aagtacgaca ttaaagacgt gggcgtggat aacgctggcg cgaaagcggg tctgaccttc 660 ctggttgacc tgattaaaaa caaacacatg aatgcagaca ccgattactc catcgcagaa 720 gctgccttta ataaaggcga aacagcgatg accatcaacg gcccgtgggc atggtccaac 780 atcgacacca gcaaagtgaa ttatggtgta acggtactgc cgaccttcaa gggtcaacca 840 tccaaaccgt tcgttggcgt gctgagcgca ggtattaacg ccgccagtcc gaacaaagag 900 ctggcgaaag agttcctcga aaactatctg ctgactgatg aaggtctgga agcggttaat 960 aaagacaaac cgctgggtgc cgtagcgctg aagtcttacg aggaagagtt ggcgaaagat 1020 ccacgtattg ccgccaccat ggaaaacgcc cagaaaggtg aaatcatgcc gaacatcccg 1080 cagatgtccg ctttctggta tgccgtgcgt actgcggtga tcaacgccgc cagcggtcgt 1140 cagactgtcg atgaagccct gaaagacgcg cagactcgta tcaccaagta a 1191 <210> 206 <211> 396 <212> PRT <213> Escherichia coli K12 MG1655 <400> 206 Met Lys Ile Lys Thr Gly Ala Arg Ile Leu Ala Leu Ser Ala Leu Thr 1 5 10 15 Thr Met Met Phe Ser Ala Ser Ala Leu Ala Lys Ile Glu Glu Gly Lys 20 25 30 Leu Val Ile Trp Ile Asn Gly Asp Lys Gly Tyr Asn Gly Leu Ala Glu 35 40 45 Val Gly Lys Lys Phe Glu Lys Asp Thr Gly Ile Lys Val Thr Val Glu 50 55 60 His Pro Asp Lys Leu Glu Glu Lys Phe Pro Gln Val Ala Ala Thr Gly 65 70 75 80 Asp Gly Pro Asp Ile Ile Phe Trp Ala His Asp Arg Phe Gly Gly Tyr 85 90 95 Ala Gln Ser Gly Leu Leu Ala Glu Ile Thr Pro Asp Lys Ala Phe Gln 100 105 110 Asp Lys Leu Tyr Pro Phe Thr Trp Asp Ala Val Arg Tyr Asn Gly Lys 115 120 125 Leu Ile Ala Tyr Pro Ile Ala Val Glu Ala Leu Ser Leu Ile Tyr Asn 130 135 140 Lys Asp Leu Leu Pro Asn Pro Pro Lys Thr Trp Glu Glu Ile Pro Ala 145 150 155 160 Leu Asp Lys Glu Leu Lys Ala Lys Gly Lys Ser Ala Leu Met Phe Asn 165 170 175 Leu Gln Glu Pro Tyr Phe Thr Trp Pro Leu Ile Ala Ala Asp Gly Gly 180 185 190 Tyr Ala Phe Lys Tyr Glu Asn Gly Lys Tyr Asp Ile Lys Asp Val Gly 195 200 205 Val Asp Asn Ala Gly Ala Lys Ala Gly Leu Thr Phe Leu Val Asp Leu 210 215 220 Ile Lys Asn Lys His Met Asn Ala Asp Thr Asp Tyr Ser Ile Ala Glu 225 230 235 240 Ala Ala Phe Asn Lys Gly Glu Thr Ala Met Thr Ile Asn Gly Pro Trp 245 250 255 Ala Trp Ser Asn Ile Asp Thr Ser Lys Val Asn Tyr Gly Val Thr Val 260 265 270 Leu Pro Thr Phe Lys Gly Gln Pro Ser Lys Pro Phe Val Gly Val Leu 275 280 285 Ser Ala Gly Ile Asn Ala Ala Ser Pro Asn Lys Glu Leu Ala Lys Glu 290 295 300 Phe Leu Glu Asn Tyr Leu Leu Thr Asp Glu Gly Leu Glu Ala Val Asn 305 310 315 320 Lys Asp Lys Pro Leu Gly Ala Val Ala Leu Lys Ser Tyr Glu Glu Glu 325 330 335 Leu Ala Lys Asp Pro Arg Ile Ala Ala Thr Met Glu Asn Ala Gln Lys 340 345 350 Gly Glu Ile Met Pro Asn Ile Pro Gln Met Ser Ala Phe Trp Tyr Ala 355 360 365 Val Arg Thr Ala Val Ile Asn Ala Ala Ser Gly Arg Gln Thr Val Asp 370 375 380 Glu Ala Leu Lys Asp Ala Gln Thr Arg Ile Thr Lys 385 390 395 <210> 207 <211> 1116 <212> DNA <213> Escherichia coli K12 MG1655 <400> 207 atggcgagcg tacagctgca aaatgtaacg aaagcctggg gcgaggtcgt ggtatcgaaa 60 gatatcaatc tcgatatcca tgaaggtgaa ttcgtggtgt ttgtcggacc gtctggctgc 120 ggtaaatcga ctttactgcg catgattgcc gggcttgaga ctatcaccag cggcgacctg 180 ttcatcggtg agaaacggat gaatgacact ccgccagcag aacgcggcgt tggtatggtg 240 tttcagtctt acgcgctcta tccccacctg tcagtagcag aaaacatgtc atttggcctg 300 aaactggctg gcgcaaaaaa agaggtgatt aaccaacgcg ttaaccaggt ggcggaagtg 360 ctacaactgg cgcatttgct ggatcgcaaa ccgaaagcgc tctccggtgg tcagcgtcag 420 cgtgtggcga ttggccgtac gctggtggcc gagccaagcg tatttttgct cgatgaaccg 480 ctctccaacc tcgatgctgc actgcgtgtg caaatgcgta tcgaaatctc ccgtctgcat 540 aaacgcctgg gccgcacaat gatttacgtc acccacgatc aggtcgaagc gatgacgctg 600 gccgacaaaa tcgtggtgct ggacgccggt cgcgtggcgc aggttgggaa accgctggag 660 ctgtaccact atccggcaga ccgttttgtc gccggattta tcggttcgcc aaagatgaac 720 ttcctgccgg taaaagtgac cgccaccgca atcgatcaag tgcaggtgga gctgccgatg 780 ccaaatcgtc agcaagtctg gctgccagtt gaaagccgtg atgtccaggt tggagccaat 840 atgtcgctgg gtattcgccc ggaacatcta ctgccgagtg atatcgctga cgtcatcctt 900 gagggtgaag ttcaggtcgt cgagcaactc ggcaacgaaa ctcaaatcca tatccagatc 960 ccttccattc gtcaaaacct ggtgtaccgc cagaacgacg tggtgttggt agaagaaggt 1020 gccacattcg ctatcggcct gccgccagag cgttgccatc tgttccgtga ggatggcact 1080 gcatgtcgtc gactgcataa ggagccgggc gtttaa 1116 <210> 208 <211> 371 <212> PRT <213> Escherichia coli K12 MG1655 <400> 208 Met Ala Ser Val Gln Leu Gln Asn Val Thr Lys Ala Trp Gly Glu Val 1 5 10 15 Val Val Ser Lys Asp Ile Asn Leu Asp Ile His Glu Gly Glu Phe Val 20 25 30 Val Phe Val Gly Pro Ser Gly Cys Gly Lys Ser Thr Leu Leu Arg Met 35 40 45 Ile Ala Gly Leu Glu Thr Ile Thr Ser Gly Asp Leu Phe Ile Gly Glu 50 55 60 Lys Arg Met Asn Asp Thr Pro Pro Ala Glu Arg Gly Val Gly Met Val 65 70 75 80 Phe Gln Ser Tyr Ala Leu Tyr Pro His Leu Ser Val Ala Glu Asn Met 85 90 95 Ser Phe Gly Leu Lys Leu Ala Gly Ala Lys Lys Glu Val Ile Asn Gln 100 105 110 Arg Val Asn Gln Val Ala Glu Val Leu Gln Leu Ala His Leu Leu Asp 115 120 125 Arg Lys Pro Lys Ala Leu Ser Gly Gly Gln Arg Gln Arg Val Ala Ile 130 135 140 Gly Arg Thr Leu Val Ala Glu Pro Ser Val Phe Leu Leu Asp Glu Pro 145 150 155 160 Leu Ser Asn Leu Asp Ala Ala Leu Arg Val Gln Met Arg Ile Glu Ile 165 170 175 Ser Arg Leu His Lys Arg Leu Gly Arg Thr Met Ile Tyr Val Thr His 180 185 190 Asp Gln Val Glu Ala Met Thr Leu Ala Asp Lys Ile Val Val Leu Asp 195 200 205 Ala Gly Arg Val Ala Gln Val Gly Lys Pro Leu Glu Leu Tyr His Tyr 210 215 220 Pro Ala Asp Arg Phe Val Ala Gly Phe Ile Gly Ser Pro Lys Met Asn 225 230 235 240 Phe Leu Pro Val Lys Val Thr Ala Thr Ala Ile Asp Gln Val Gln Val 245 250 255 Glu Leu Pro Met Pro Asn Arg Gln Gln Val Trp Leu Pro Val Glu Ser 260 265 270 Arg Asp Val Gln Val Gly Ala Asn Met Ser Leu Gly Ile Arg Pro Glu 275 280 285 His Leu Leu Pro Ser Asp Ile Ala Asp Val Ile Leu Glu Gly Glu Val 290 295 300 Gln Val Val Glu Gln Leu Gly Asn Glu Thr Gln Ile His Ile Gln Ile 305 310 315 320 Pro Ser Ile Arg Gln Asn Leu Val Tyr Arg Gln Asn Asp Val Val Leu 325 330 335 Val Glu Glu Gly Ala Thr Phe Ala Ile Gly Leu Pro Pro Glu Arg Cys 340 345 350 His Leu Phe Arg Glu Asp Gly Thr Ala Cys Arg Arg Leu His Lys Glu 355 360 365 Pro Gly Val 370 <210> 209 <211> 1947 <212> DNA <213> Escherichia coli K12 MG1655 <400> 209 atgaatattt taggtttttt ccagcgactc ggtagggcgt tacagctccc tatcgcggtg 60 ctgccggtgg cggcactgtt gctgcgattc ggtcagccag atttacttaa cgttgcgttt 120 attgcccagg cgggcggtgc gatttttgat aacctcgcat taatcttcgc catcggtgtg 180 gcatccagct ggtcgaaaga cagcgctggt gcggcggcgc tggcgggtgc ggtaggttac 240 tttgtgttaa ccaaagcgat ggtgaccatc aacccagaaa ttaacatggg tgtactggcg 300 ggtatcatta ccggtctggt tggtggcgca gcctataacc gttggtccga tattaaactg 360 ccggacttcc tgagcttctt cggcggcaaa cgctttgtgc cgattgccac cggattcttc 420 tgcctggtgc tggcggccat ttttggttac gtctggccgc cggtacagca cgctatccat 480 gcaggcggcg agtggatcgt ttctgcgggc gcgctgggtt ccggtatctt tggtttcatc 540 aaccgtctgc tgatcccaac cggtctgcat caggtactga acaccatcgc ctggttccag 600 attggtgaat tcaccaacgc ggcgggtacg gttttccacg gtgacattaa ccgcttctat 660 gccggtgacg gcaccgcggg gatgttcatg tccggcttct tcccgatcat gatgttcggt 720 ctgccgggtg cggcgctggc gatgtacttc gcagcaccga aagagcgtcg tccgatggtt 780 ggcggtatgc tgctttctgt tgctgttact gcgttcctga ccggtgtgac tgagccgctg 840 gaattcctgt tcatgttcct tgctccgctg ctgtacctcc tgcacgcact gctgaccggt 900 atcagcctgt ttgtggcaac gctgctgggt atccacgcgg gcttctcttt ctctgcgggg 960 gctatcgact acgcgttgat gtataacctg ccggccgcca gccagaacgt ctggatgctg 1020 ctggtgatgg gcgttatctt cttcgctatc tacttcgtgg tgttcagttt ggttatccgc 1080 atgttcaacc tgaaaacgcc gggtcgtgaa gataaagaag atgagatcgt tactgaagaa 1140 gccaacagca acactgaaga aggtctgact caactggcaa ccaactatat tgctgcggtt 1200 ggcggcactg acaacctgaa agcgattgac gcctgtatca cccgtctgcg ccttacagtg 1260 gctgactctg cccgcgttaa cgatacgatg tgtaaacgtc tgggtgcttc tggggtagtg 1320 aaactgaaca aacagactat tcaggtgatt gttggcgcga aagcagaatc catcggcgat 1380 gcgatgaaga aagtcgttgc ccgtggtccg gtagccgctg cgtcagctga agcaactccg 1440 gcaactgccg cgcctgtagc aaaaccgcag gctgtaccaa acgcggtatc tatcgcggag 1500 ctggtatcgc cgattaccgg tgatgtcgtg gcactggatc aggttcctga cgaagcattc 1560 gccagcaaag cggtgggtga cggtgtggcg gtgaaaccga cagataaaat cgtcgtatca 1620 ccagccgcag ggacaatcgt gaaaatcttc aacaccaacc acgcgttctg cctggaaacc 1680 gaaaaaggcg cggagatcgt cgtccatatg ggtatcgaca ccgtagcgct ggaaggtaaa 1740 ggctttaaac gtctggtgga agagggtgcg caggtaagcg cagggcaacc gattctggaa 1800 atggatctgg attacctgaa cgctaacgcc cgctcgatga ttagcccggt ggtttgcagc 1860 aatatcgacg atttcagtgg cttgatcatt aaagctcagg gccatattgt ggcgggtcaa 1920 acaccgctgt atgaaatcaa aaagtaa 1947 <210> 210 <211> 648 <212> PRT <213> Escherichia coli K12 MG1655 <400> 210 Met Asn Ile Leu Gly Phe Phe Gln Arg Leu Gly Arg Ala Leu Gln Leu 1 5 10 15 Pro Ile Ala Val Leu Pro Val Ala Ala Leu Leu Leu Arg Phe Gly Gln 20 25 30 Pro Asp Leu Leu Asn Val Ala Phe Ile Ala Gln Ala Gly Gly Ala Ile 35 40 45 Phe Asp Asn Leu Ala Leu Ile Phe Ala Ile Gly Val Ala Ser Ser Trp 50 55 60 Ser Lys Asp Ser Ala Gly Ala Ala Ala Leu Ala Gly Ala Val Gly Tyr 65 70 75 80 Phe Val Leu Thr Lys Ala Met Val Thr Ile Asn Pro Glu Ile Asn Met 85 90 95 Gly Val Leu Ala Gly Ile Ile Thr Gly Leu Val Gly Gly Ala Ala Tyr 100 105 110 Asn Arg Trp Ser Asp Ile Lys Leu Pro Asp Phe Leu Ser Phe Phe Gly 115 120 125 Gly Lys Arg Phe Val Pro Ile Ala Thr Gly Phe Phe Cys Leu Val Leu 130 135 140 Ala Ala Ile Phe Gly Tyr Val Trp Pro Pro Val Gln His Ala Ile His 145 150 155 160 Ala Gly Gly Glu Trp Ile Val Ser Ala Gly Ala Leu Gly Ser Gly Ile 165 170 175 Phe Gly Phe Ile Asn Arg Leu Leu Ile Pro Thr Gly Leu His Gln Val 180 185 190 Leu Asn Thr Ile Ala Trp Phe Gln Ile Gly Glu Phe Thr Asn Ala Ala 195 200 205 Gly Thr Val Phe His Gly Asp Ile Asn Arg Phe Tyr Ala Gly Asp Gly 210 215 220 Thr Ala Gly Met Phe Met Ser Gly Phe Phe Pro Ile Met Met Phe Gly 225 230 235 240 Leu Pro Gly Ala Ala Leu Ala Met Tyr Phe Ala Ala Pro Lys Glu Arg 245 250 255 Arg Pro Met Val Gly Gly Met Leu Leu Ser Val Ala Val Thr Ala Phe 260 265 270 Leu Thr Gly Val Thr Glu Pro Leu Glu Phe Leu Phe Met Phe Leu Ala 275 280 285 Pro Leu Leu Tyr Leu Leu His Ala Leu Leu Thr Gly Ile Ser Leu Phe 290 295 300 Val Ala Thr Leu Leu Gly Ile His Ala Gly Phe Ser Phe Ser Ala Gly 305 310 315 320 Ala Ile Asp Tyr Ala Leu Met Tyr Asn Leu Pro Ala Ala Ser Gln Asn 325 330 335 Val Trp Met Leu Leu Val Met Gly Val Ile Phe Phe Ala Ile Tyr Phe 340 345 350 Val Val Phe Ser Leu Val Ile Arg Met Phe Asn Leu Lys Thr Pro Gly 355 360 365 Arg Glu Asp Lys Glu Asp Glu Ile Val Thr Glu Glu Ala Asn Ser Asn 370 375 380 Thr Glu Glu Gly Leu Thr Gln Leu Ala Thr Asn Tyr Ile Ala Ala Val 385 390 395 400 Gly Gly Thr Asp Asn Leu Lys Ala Ile Asp Ala Cys Ile Thr Arg Leu 405 410 415 Arg Leu Thr Val Ala Asp Ser Ala Arg Val Asn Asp Thr Met Cys Lys 420 425 430 Arg Leu Gly Ala Ser Gly Val Val Lys Leu Asn Lys Gln Thr Ile Gln 435 440 445 Val Ile Val Gly Ala Lys Ala Glu Ser Ile Gly Asp Ala Met Lys Lys 450 455 460 Val Val Ala Arg Gly Pro Val Ala Ala Ala Ser Ala Glu Ala Thr Pro 465 470 475 480 Ala Thr Ala Ala Pro Val Ala Lys Pro Gln Ala Val Pro Asn Ala Val 485 490 495 Ser Ile Ala Glu Leu Val Ser Pro Ile Thr Gly Asp Val Val Ala Leu 500 505 510 Asp Gln Val Pro Asp Glu Ala Phe Ala Ser Lys Ala Val Gly Asp Gly 515 520 525 Val Ala Val Lys Pro Thr Asp Lys Ile Val Val Ser Pro Ala Ala Gly 530 535 540 Thr Ile Val Lys Ile Phe Asn Thr Asn His Ala Phe Cys Leu Glu Thr 545 550 555 560 Glu Lys Gly Ala Glu Ile Val Val His Met Gly Ile Asp Thr Val Ala 565 570 575 Leu Glu Gly Lys Gly Phe Lys Arg Leu Val Glu Glu Gly Ala Gln Val 580 585 590 Ser Ala Gly Gln Pro Ile Leu Glu Met Asp Leu Asp Tyr Leu Asn Ala 595 600 605 Asn Ala Arg Ser Met Ile Ser Pro Val Val Cys Ser Asn Ile Asp Asp 610 615 620 Phe Ser Gly Leu Ile Ile Lys Ala Gln Gly His Ile Val Ala Gly Gln 625 630 635 640 Thr Pro Leu Tyr Glu Ile Lys Lys 645 <210> 211 <211> 372 <212> DNA <213> Escherichia coli K12 MG1655 <400> 211 atgaccgtta tttatcagac caccatcacc cgtatcggcg cgagtgccat tgacgccctc 60 agtgaccaga tgctcatcac ctttcgtgaa ggcgcgcctg cggacctcga agagtattgc 120 ttcattcatt gccacggcga gttgaaaggt gcactccatc ccggtttgca attttcactc 180 gggcagcatc gctatccggt gaccgctgtt ggcagcgtgg cggaagataa ccttcgcgaa 240 ctgggtcatg tcaccctgcg cttcgatggt ttaaacgaag cggaatttcc gggcactgtc 300 catgtggcag gccctgtccc cgacgatatc gcgccgggat cggttttgaa gtttgaatct 360 gttaaggagt aa 372 <210> 212 <211> 123 <212> PRT <213> Escherichia coli K12 MG1655 <400> 212 Met Thr Val Ile Tyr Gln Thr Thr Ile Thr Arg Ile Gly Ala Ser Ala 1 5 10 15 Ile Asp Ala Leu Ser Asp Gln Met Leu Ile Thr Phe Arg Glu Gly Ala 20 25 30 Pro Ala Asp Leu Glu Glu Tyr Cys Phe Ile His Cys His Gly Glu Leu 35 40 45 Lys Gly Ala Leu His Pro Gly Leu Gln Phe Ser Leu Gly Gln His Arg 50 55 60 Tyr Pro Val Thr Ala Val Gly Ser Val Ala Glu Asp Asn Leu Arg Glu 65 70 75 80 Leu Gly His Val Thr Leu Arg Phe Asp Gly Leu Asn Glu Ala Glu Phe 85 90 95 Pro Gly Thr Val His Val Ala Gly Pro Val Pro Asp Asp Ile Ala Pro 100 105 110 Gly Ser Val Leu Lys Phe Glu Ser Val Lys Glu 115 120 <210> 213 <211> 990 <212> DNA <213> Escherichia coli K12 MG1655 <400> 213 atgcacaaat ttactaaagc cctggcagcc attggtctgg cagccgttat gtcacaatcc 60 gctatggcgg agaacctgaa gctcggtttt ctggtgaagc aaccggaaga gccgtggttc 120 cagaccgaat ggaagtttgc cgataaagcc gggaaggatt tagggtttga ggttattaag 180 attgccgtgc cggatggcga aaaaacattg aacgcgatcg acagcctggc tgccagtggc 240 gcaaaaggtt tcgttatttg tactccggac cccaaactcg gctctgccat cgtcgcgaaa 300 gcgcgtggct acgatatgaa agtcattgcc gtggatgacc agtttgttaa cgccaaaggt 360 aagccaatgg ataccgttcc gctggtgatg atggcggcga ctaaaattgg cgaacgtcag 420 ggccaggaac tgtataaaga gatgcagaaa cgtggctggg atgtcaaaga aagcgcggtg 480 atggcgatta ccgccaacga actggatacc gcccgccgcc gtactacggg atctatggat 540 gcgctgaaag cggccggatt cccggaaaaa caaatttatc aggtacctac caaatctaac 600 gacatcccgg gggcatttga cgctgccaac tcaatgctgg ttcaacatcc ggaagttaaa 660 cattggctga tcgtcggtat gaacgacagc accgtgctgg gcggcgtacg cgcgacggaa 720 ggtcagggct ttaaagcggc cgatatcatc ggcattggca ttaacggtgt ggatgcggtg 780 agcgaactgt ctaaagcaca ggcaaccggc ttctacggtt ccctgctgcc aagcccggac 840 gtacatggct ataaatccag cgaaatgctt tacaactggg tagcaaaaga cgttgaaccg 900 ccaaaattta ccgaagttac cgacgtggta ctgatcacgc gtgacaactt taaagaagaa 960 ctggagaaaa aaggtttagg cggtaagtaa 990 <210> 214 <211> 329 <212> PRT <213> Escherichia coli K12 MG1655 <400> 214 Met His Lys Phe Thr Lys Ala Leu Ala Ala Ile Gly Leu Ala Ala Val 1 5 10 15 Met Ser Gln Ser Ala Met Ala Glu Asn Leu Lys Leu Gly Phe Leu Val 20 25 30 Lys Gln Pro Glu Glu Pro Trp Phe Gln Thr Glu Trp Lys Phe Ala Asp 35 40 45 Lys Ala Gly Lys Asp Leu Gly Phe Glu Val Ile Lys Ile Ala Val Pro 50 55 60 Asp Gly Glu Lys Thr Leu Asn Ala Ile Asp Ser Leu Ala Ala Ser Gly 65 70 75 80 Ala Lys Gly Phe Val Ile Cys Thr Pro Asp Pro Lys Leu Gly Ser Ala 85 90 95 Ile Val Ala Lys Ala Arg Gly Tyr Asp Met Lys Val Ile Ala Val Asp 100 105 110 Asp Gln Phe Val Asn Ala Lys Gly Lys Pro Met Asp Thr Val Pro Leu 115 120 125 Val Met Met Ala Ala Thr Lys Ile Gly Glu Arg Gln Gly Gln Glu Leu 130 135 140 Tyr Lys Glu Met Gln Lys Arg Gly Trp Asp Val Lys Glu Ser Ala Val 145 150 155 160 Met Ala Ile Thr Ala Asn Glu Leu Asp Thr Ala Arg Arg Arg Thr Thr 165 170 175 Gly Ser Met Asp Ala Leu Lys Ala Ala Gly Phe Pro Glu Lys Gln Ile 180 185 190 Tyr Gln Val Pro Thr Lys Ser Asn Asp Ile Pro Gly Ala Phe Asp Ala 195 200 205 Ala Asn Ser Met Leu Val Gln His Pro Glu Val Lys His Trp Leu Ile 210 215 220 Val Gly Met Asn Asp Ser Thr Val Leu Gly Gly Val Arg Ala Thr Glu 225 230 235 240 Gly Gln Gly Phe Lys Ala Ala Asp Ile Ile Gly Ile Gly Ile Asn Gly 245 250 255 Val Asp Ala Val Ser Glu Leu Ser Lys Ala Gln Ala Thr Gly Phe Tyr 260 265 270 Gly Ser Leu Leu Pro Ser Pro Asp Val His Gly Tyr Lys Ser Ser Glu 275 280 285 Met Leu Tyr Asn Trp Val Ala Lys Asp Val Glu Pro Pro Lys Phe Thr 290 295 300 Glu Val Thr Asp Val Val Leu Ile Thr Arg Asp Asn Phe Lys Glu Glu 305 310 315 320 Leu Glu Lys Lys Gly Leu Gly Gly Lys 325 <210> 215 <211> 993 <212> DNA <213> Escherichia coli K12 MG1655 <400> 215 atgaaaataa agaacattct actcaccctt tgcacctcac tcctgcttac caacgttgct 60 gcacacgcca aagaagtcaa aataggtatg gcgattgatg atctccgtct tgaacgctgg 120 caaaaagatc gagatatctt tgtgaaaaag gcagaatctc tcggcgcgaa agtatttgta 180 cagtctgcaa atggcaatga agaaacacaa atgtcgcaga ttgaaaacat gataaaccgg 240 ggtgtcgatg ttcttgtcat tattccgtat aacggtcagg tattaagtaa cgttgtaaaa 300 gaagccaaac aagaaggcat taaagtatta gcttacgacc gtatgattaa cgatgcggat 360 atcgattttt atatttcttt cgataacgaa aaagtcggtg aactgcaggc aaaagccctg 420 gtcgatattg ttccgcaagg taattacttc ctgatgggcg gctcgccggt agataacaac 480 gccaagctgt tccgcgccgg acaaatgaaa gtgttaaaac cttacgttga ttccggaaaa 540 attaaagtcg ttggtgacca atgggttgat ggctggttac cggaaaacgc attgaaaatt 600 atggaaaacg cgctaaccgc caataataac aaaattgatg ctgtagttgc ctcaaacgat 660 gccaccgcag gtggggcaat tcaggcatta agcgcgcaag gtttatcagg gaaagtagca 720 atctccggcc aggatgcgga tctcgcaggt attaaacgta ttgctgccgg tacgcaaact 780 atgacggtgt ataaacctat tacgttgttg gcaaatactg ccgcagaaat tgccgttgag 840 ttgggcaatg gtcaggaacc aaaagcagat accacactga ataatggcct gaaagatgtc 900 ccctcccgcc tcctgacacc gatcgatgtg aataaaaaca acatcaaaga tacggtaatt 960 aaagacggat tccacaaaga gagcgagctg taa 993 <210> 216 <211> 330 <212> PRT <213> Escherichia coli K12 MG1655 <400> 216 Met Lys Ile Lys Asn Ile Leu Leu Thr Leu Cys Thr Ser Leu Leu Leu 1 5 10 15 Thr Asn Val Ala Ala His Ala Lys Glu Val Lys Ile Gly Met Ala Ile 20 25 30 Asp Asp Leu Arg Leu Glu Arg Trp Gln Lys Asp Arg Asp Ile Phe Val 35 40 45 Lys Lys Ala Glu Ser Leu Gly Ala Lys Val Phe Val Gln Ser Ala Asn 50 55 60 Gly Asn Glu Glu Thr Gln Met Ser Gln Ile Glu Asn Met Ile Asn Arg 65 70 75 80 Gly Val Asp Val Leu Val Ile Ile Pro Tyr Asn Gly Gln Val Leu Ser 85 90 95 Asn Val Val Lys Glu Ala Lys Gln Glu Gly Ile Lys Val Leu Ala Tyr 100 105 110 Asp Arg Met Ile Asn Asp Ala Asp Ile Asp Phe Tyr Ile Ser Phe Asp 115 120 125 Asn Glu Lys Val Gly Glu Leu Gln Ala Lys Ala Leu Val Asp Ile Val 130 135 140 Pro Gln Gly Asn Tyr Phe Leu Met Gly Gly Ser Pro Val Asp Asn Asn 145 150 155 160 Ala Lys Leu Phe Arg Ala Gly Gln Met Lys Val Leu Lys Pro Tyr Val 165 170 175 Asp Ser Gly Lys Ile Lys Val Val Gly Asp Gln Trp Val Asp Gly Trp 180 185 190 Leu Pro Glu Asn Ala Leu Lys Ile Met Glu Asn Ala Leu Thr Ala Asn 195 200 205 Asn Asn Lys Ile Asp Ala Val Val Ala Ser Asn Asp Ala Thr Ala Gly 210 215 220 Gly Ala Ile Gln Ala Leu Ser Ala Gln Gly Leu Ser Gly Lys Val Ala 225 230 235 240 Ile Ser Gly Gln Asp Ala Asp Leu Ala Gly Ile Lys Arg Ile Ala Ala 245 250 255 Gly Thr Gln Thr Met Thr Val Tyr Lys Pro Ile Thr Leu Leu Ala Asn 260 265 270 Thr Ala Ala Glu Ile Ala Val Glu Leu Gly Asn Gly Gln Glu Pro Lys 275 280 285 Ala Asp Thr Thr Leu Asn Asn Gly Leu Lys Asp Val Pro Ser Arg Leu 290 295 300 Leu Thr Pro Ile Asp Val Asn Lys Asn Asn Ile Lys Asp Thr Val Ile 305 310 315 320 Lys Asp Gly Phe His Lys Glu Ser Glu Leu 325 330 <210> 217 <211> 957 <212> DNA <213> Escherichia coli K12 MG1655 <400> 217 atgtggaaac gcttacttat agtctctgca gtctcggcag ccatgtcgtc tatggcgttg 60 gccgctccat taaccgttgg attttcgcag gtcggatcgg aatcaggctg gcgtgccgca 120 gaaaccaatg tggcgaaaag tgaagccgaa aagcgcggaa tcacgttgaa aattgccgat 180 ggtcagcaaa agcaggaaaa ccagattaaa gcggtacgtt ccttcgttgc acaaggggtg 240 gatgcgatct ttatcgctcc ggtggtcgcg acaggttggg aaccggtatt aaaagaggcg 300 aaagatgccg aaatcccggt attcttgctc gatcgttcca ttgatgtgaa agacaaatct 360 ctctatatga ccaccgtcac tgccgacaac atcctcgaag gcaagttgat tggtgactgg 420 ctggtaaaag aagtgaatgg caaaccatgc aacgtggtgg agctgcaggg caccgttggg 480 gccagcgtcg ccattgaccg taagaaaggc tttgccgaag ccattaagaa tgcgccaaat 540 atcaaaatca tccgctcgca gtcaggtgac ttcacccgca gtaaaggcaa agaagtcatg 600 gagagcttta tcaaagcgga aaacaacggc aaaaacatct gcatggttta cgcccataac 660 gacgacatgg tgattggtgc aattcaggca attaaagaag cgggcctgaa accgggcaaa 720 gatatcctca cgggttccat tgacggtgta ccggacatct acaaagcgat gatggatggc 780 gaagcgaacg ccagtgttga actgacgccg aatatggcag gtcccgcctt cgacgcgctg 840 gagaaataca aaaaagacgg caccatgcct gaaaagctga cgttaaccaa atccaccctt 900 tacctgcctg ataccgcaaa agaagaatta gagaagaaga aaaatatggg gtattga 957 <210> 218 <211> 318 <212> PRT <213> Escherichia coli K12 MG1655 <400> 218 Met Trp Lys Arg Leu Leu Ile Val Ser Ala Val Ser Ala Ala Met Ser 1 5 10 15 Ser Met Ala Leu Ala Ala Pro Leu Thr Val Gly Phe Ser Gln Val Gly 20 25 30 Ser Glu Ser Gly Trp Arg Ala Ala Glu Thr Asn Val Ala Lys Ser Glu 35 40 45 Ala Glu Lys Arg Gly Ile Thr Leu Lys Ile Ala Asp Gly Gln Gln Lys 50 55 60 Gln Glu Asn Gln Ile Lys Ala Val Arg Ser Phe Val Ala Gln Gly Val 65 70 75 80 Asp Ala Ile Phe Ile Ala Pro Val Val Ala Thr Gly Trp Glu Pro Val 85 90 95 Leu Lys Glu Ala Lys Asp Ala Glu Ile Pro Val Phe Leu Leu Asp Arg 100 105 110 Ser Ile Asp Val Lys Asp Lys Ser Leu Tyr Met Thr Thr Val Thr Ala 115 120 125 Asp Asn Ile Leu Glu Gly Lys Leu Ile Gly Asp Trp Leu Val Lys Glu 130 135 140 Val Asn Gly Lys Pro Cys Asn Val Val Glu Leu Gln Gly Thr Val Gly 145 150 155 160 Ala Ser Val Ala Ile Asp Arg Lys Lys Gly Phe Ala Glu Ala Ile Lys 165 170 175 Asn Ala Pro Asn Ile Lys Ile Ile Arg Ser Gln Ser Gly Asp Phe Thr 180 185 190 Arg Ser Lys Gly Lys Glu Val Met Glu Ser Phe Ile Lys Ala Glu Asn 195 200 205 Asn Gly Lys Asn Ile Cys Met Val Tyr Ala His Asn Asp Asp Met Val 210 215 220 Ile Gly Ala Ile Gln Ala Ile Lys Glu Ala Gly Leu Lys Pro Gly Lys 225 230 235 240 Asp Ile Leu Thr Gly Ser Ile Asp Gly Val Pro Asp Ile Tyr Lys Ala 245 250 255 Met Met Asp Gly Glu Ala Asn Ala Ser Val Glu Leu Thr Pro Asn Met 260 265 270 Ala Gly Pro Ala Phe Asp Ala Leu Glu Lys Tyr Lys Lys Asp Gly Thr 275 280 285 Met Pro Glu Lys Leu Thr Leu Thr Lys Ser Thr Leu Tyr Leu Pro Asp 290 295 300 Thr Ala Lys Glu Glu Leu Glu Lys Lys Lys Asn Met Gly Tyr 305 310 315 <210> 219 <211> 936 <212> DNA <213> Helicobacter sp. MIT 01-6242 <400> 219 atgttttcag ttcgtttaat ggggggctta ggaaaccaga tgtttattta tgcttttgca 60 aaggctataa aggcgcaggg gtatccggtg cgtctatttt attatgatac ggattacaac 120 gtgccgcaga cgcacaacat tcgtaactta gagatagtgg attttggcat tgcgatgtgt 180 atagaaacta tgtgttatga agaaccacag atcaaaaaat ctttctttga gcgtgcgtta 240 ggctttataa aacgtaagtt aaaaatacat tcaccacatt caagctcttt aattagcgat 300 cattgtgaga ttgctttaac taaagatttt cttgatacgt taaacccgaa cgctatgttt 360 aacggttatt tccagaacgt tgtatttttc gatcatcttc gtgaatcatt attaagagat 420 tttactctta aacgtccgct tactccggca aacgaggcgt taaaacatca gatcttacag 480 acgccaaaca gctgctttct acatattcgg cggggggatt atttacaaat tccgatatat 540 gttaaacttg gtagcactta ctacaataac gctatcaagg ctcttaaaga taagatctca 600 aagccacata tctttgtttt tagcaacgac attgcgtggt gcaaggaatt tttcttagat 660 agcttagatc ccttagtgat tgaaaacgtg acttttagct ttatagaaaa taacgatgaa 720 gggaacgcca ttgaggaaat ggaacttatg cggtcatgcc agcacgcaat tattgcgaac 780 agcacgttta gctggtgggc ggcgtattta attgacagcg ctcagaaact ttgcattatg 840 cctaaacact ttttcaatga tccccagcag gaagtagcac acaaactaat tccaccacca 900 cttcatagct tatctcagac tatagtaatt ggttaa 936 <210> 220 <211> 311 <212> PRT <213> Helicobacter sp. MIT 01-6242 <400> 220 Met Phe Ser Val Arg Leu Met Gly Gly Leu Gly Asn Gln Met Phe Ile 1 5 10 15 Tyr Ala Phe Ala Lys Ala Ile Lys Ala Gln Gly Tyr Pro Val Arg Leu 20 25 30 Phe Tyr Tyr Asp Thr Asp Tyr Asn Val Pro Gln Thr His Asn Ile Arg 35 40 45 Asn Leu Glu Ile Val Asp Phe Gly Ile Ala Met Cys Ile Glu Thr Met 50 55 60 Cys Tyr Glu Glu Pro Gln Ile Lys Lys Ser Phe Phe Glu Arg Ala Leu 65 70 75 80 Gly Phe Ile Lys Arg Lys Leu Lys Ile His Ser Pro His Ser Ser Ser 85 90 95 Leu Ile Ser Asp His Cys Glu Ile Ala Leu Thr Lys Asp Phe Leu Asp 100 105 110 Thr Leu Asn Pro Asn Ala Met Phe Asn Gly Tyr Phe Gln Asn Val Val 115 120 125 Phe Phe Asp His Leu Arg Glu Ser Leu Leu Arg Asp Phe Thr Leu Lys 130 135 140 Arg Pro Leu Thr Pro Ala Asn Glu Ala Leu Lys His Gln Ile Leu Gln 145 150 155 160 Thr Pro Asn Ser Cys Phe Leu His Ile Arg Arg Gly Asp Tyr Leu Gln 165 170 175 Ile Pro Ile Tyr Val Lys Leu Gly Ser Thr Tyr Tyr Asn Asn Ala Ile 180 185 190 Lys Ala Leu Lys Asp Lys Ile Ser Lys Pro His Ile Phe Val Phe Ser 195 200 205 Asn Asp Ile Ala Trp Cys Lys Glu Phe Phe Leu Asp Ser Leu Asp Pro 210 215 220 Leu Val Ile Glu Asn Val Thr Phe Ser Phe Ile Glu Asn Asn Asp Glu 225 230 235 240 Gly Asn Ala Ile Glu Glu Met Glu Leu Met Arg Ser Cys Gln His Ala 245 250 255 Ile Ile Ala Asn Ser Thr Phe Ser Trp Trp Ala Ala Tyr Leu Ile Asp 260 265 270 Ser Ala Gln Lys Leu Cys Ile Met Pro Lys His Phe Phe Asn Asp Pro 275 280 285 Gln Gln Glu Val Ala His Lys Leu Ile Pro Pro Pro Leu His Ser Leu 290 295 300 Ser Gln Thr Ile Val Ile Gly 305 310

Claims (68)

  1. 유전자 변형 세포에 의해 푸코실락토스 (fucosyllactose)를 제조하는 방법으로서,
    - 푸코실락토스를 생성할 수 있는 세포를 제공하는 단계로서, 상기 세포는 구아노신-디포스페이트 푸코스 (GDP-푸코스) 공여체로부터의 푸코스 잔기를 락토스 수용체에 전달하여 푸코실락토스를 합성하는 푸코실트란스퍼라제를 코딩하는 핵산 서열을 적어도 1개 포함하고,
    - 상기 세포는 i) 푸코실락토스 수송을 가능하게 하고/하거나 이를 향상시키는 내인성 막 단백질의 변형된 발현 및/또는 ii) 푸코실락토스 수송을 가능하게 하고/하거나 이를 향상시키는 이종 막 단백질의 발현을 추가로 포함하고, 상기 막 단백질은 i) 2019년 7월 4일자로 공개된 InterPro 75.0에 정의되는, interpro 번호 IPR001503 및 IPR002516을 각각 사용하여 GT10 및 GT11 푸코실트란스퍼라제 패밀리의 게놈 인근 (genomic neighbourhood)을 검색하여 발견된 PFAM 도메인들 중 어느 하나의 도메인을 포함하는 막 단백질들의 그룹으로부터 선택되고, 여기서 상기 게놈 인근 윈도우 크기 (genomic neighbourhood window size)는 각 푸코실트란스퍼라제 앞에 14개의 유전자 및 뒤에 14개의 유전자이고, 상기 막 단백질은 SET 패밀리에 속하지 않으며, 또는 ii) 서열번호: 204, 206, 208, 210, 212, 214, 216, 218을 포함하는 막 단백질, 또는 서열번호: 204, 206, 208, 210, 212, 214, 216, 218을 포함하는 막 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 204, 206, 208, 210, 212, 214, 216, 218을 갖는 상기 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 서열의 그룹으로부터 선택되는 것인 단계,
    - 상기 세포를 배지에서 원하는 푸코실락토스의 생성을 허용하는 조건 하에 배양하는 단계,
    - 바람직하게는 상기 푸코실락토스를 배양으로부터 분리하는 단계를 포함하는 푸코실락토스를 제조하는 방법.
  2. 청구항 1에 있어서, 상기 막 단백질은
    a) 포터 (porters);
    b) P-P-결합-가수분해-유도 수송체 (P-P-bond-hydrolysis-driven transporters);
    c) β-배럴 포린 (β-barrel Porins);
    d) 보조 수송 단백질 (auxiliary transport proteins);
    e) 추정 수송 단백질 (putative transport proteins); 및
    f) 포스포트란스퍼-유도 그룹 전위인자 (phosphotransfer-driven group translocators)의 그룹으로부터 선택되는 것인 방법.
  3. 유전자 변형 세포에 의해 푸코실락토스를 제조하는 방법으로서,
    - 푸코실락토스를 생성할 수 있는 세포를 제공하는 단계로서, 상기 세포는 GDP-푸코스 공여체로부터의 푸코스 잔기를 락토스 수용체에 전달하여 푸코실락토스를 합성하는 푸코실트란스퍼라제를 코딩하는 핵산 서열을 적어도 1개 포함하고,
    - 상기 세포는 i) 푸코실락토스 수송을 가능하게 하고/하거나 이를 향상시키는 내인성 막 단백질의 변형된 발현, 및/또는 ii) 푸코실락토스 수송을 가능하게 하고/하거나 이를 향상시키는 이종 막 단백질의 발현을 추가로 포함하고, 상기 막 단백질은
    a) 포터, 여기서 상기 막 단백질은 SET 패밀리에 속하지 않음;
    b) P-P-결합-가수분해-유도 수송체;
    c) β-배럴 포린;
    d) 보조 수송 단백질;
    e) 추정 수송 단백질; 및
    f) 포스포트란스퍼-유도 그룹 전위인자의 그룹으로부터 선택되는 것인 단계,
    - 상기 세포를 배지에서 원하는 푸코실락토스의 생성을 허용하는 조건 하에 배양하는 단계,
    - 바람직하게는, 상기 푸코실락토스를 배양으로부터 분리하는 단계를 포함하는 방법.
  4. 청구항 2 또는 3에 있어서, 상기 포터는 2019년 6월 17일자로 공개된 TCDB.org에 의해 정의되는, TCDB 클래스 2.A.1.1, 2.A.1.12, 2.A.1.15, 2.A.1.2, 2.A.1.3, 2.A.1.36, 2.A.1.38, 2.A.1.46, 2.A.1.68, 2.A.1.7, 2.A.1.81, 2.A.123, 2.A.2, 2.A.21, 2.A.58, 2.A.6.3, 2.A.66 및 2.A.7.1의 그룹으로부터 선택되는 것인 방법.
  5. 청구항 2 또는 3에 있어서, 상기 P-P-결합-가수분해-유도 수송체는 2019년 6월 17일자로 공개된 TCDB.org에 의해 정의되는, TCDB 클래스 3.A.1.1, 3.A.1.2, 3.A.1.10, 3.A.1.11 및 3.A.1.5의 그룹으로부터 선택되는 것인 방법.
  6. 청구항 2 또는 3에 있어서, 상기 β-배럴 포린은 2019년 6월 17일자로 공개된 TCDB.org에 의해 정의되는, TCDB 클래스 1.B.3.1 및 1.B.18로부터 선택되는 것인 방법.
  7. 청구항 2 또는 3에 있어서, 상기 보조 수송 단백질은 2019년 6월 17일자로 공개된 TCDB.org에 의해 정의되는, TCDB 클래스 8.A.3으로부터 선택되는 것인 방법.
  8. 청구항 2 또는 3에 있어서, 상기 추정 수송 단백질은 2019년 6월 17일자로 공개된 TCDB.org에 의해 정의되는, TCDB 클래스 9.B.14 및 9.B.158의 그룹으로부터 선택되는 것인 방법.
  9. 청구항 2 또는 3에 있어서, 상기 포스포트란스퍼-유도 그룹 전위인자는 2019년 6월 17일자로 공개된 TCDB.org에 의해 정의되는, TCDB 클래스 4.A.1.1 및 4.A.4.1의 그룹으로부터 선택되는 것인 방법.
  10. 청구항 2 또는 3에 있어서, 상기 포터는 2017년 11월 3일자로 공개된 eggnogdb 1.0.2에 의해 정의되는, eggnog 패밀리 (eggnog families) 05BZS, 05C0R, 05C2C, 05CT4, 05CXP, 05CZQ, 05D94, 05DXI, 05E5M, 05E5W, 05E8G, 05EAM, 05EDR, 05EGZ, 05F9N, 05JHE, 05PSV, 05W2Y, 05W3H, 05XJ5, 070Q9, 07CWC, 07QF7, 07QNK, 07RBJ, 07RJ1, 07T5E, 07VQ3, 0814C, 088QT, 08H15, 08N8A, 08SC4, 08Z4Q의 그룹으로부터 선택되는 것인 방법.
  11. 청구항 2 또는 3에 있어서, 상기 P-P-결합-가수분해-유도 수송체는 2017년 11월 3일자로 공개된 eggnogdb 1.0.2에 의해 정의되는, eggnog 패밀리 05BZ1, 05CJ1, 05EY8, 05HAC, 05DMK, 05DFW, 05MFV, 07FKK, 07R5U, 07V1T, 08IJ9, 08JQ7, 172T7의 그룹으로부터 선택되는 것인 방법.
  12. 청구항 2 또는 3에 있어서, 상기 β-배럴 포린은 2017년 11월 3일자로 공개된 eggnogdb 1.0.2에 의해 정의되는, eggnog 패밀리 05DAY, 08KDD의 그룹으로부터 선택되는 것인 방법.
  13. 청구항 2 또는 3에 있어서, 상기 보조 수송 단백질은 2017년 11월 3일자로 공개된 eggnogdb 1.0.2에 의해 정의되는, eggnog 패밀리 07SYR의 그룹으로부터 선택되는 것인 방법.
  14. 청구항 2 또는 3에 있어서, 상기 추정 수송 단백질은 2017년 11월 3일자로 공개된 eggnogdb 1.0.2에 의해 정의되는, eggnog 패밀리 05CRE, 05GWF, 06N3A의 그룹으로부터 선택되는 것인 방법.
  15. 청구항 2 또는 3에 있어서, 상기 포스포트란스퍼-유도 그룹 전위인자는 2017년 11월 3일자로 공개된 eggnogdb 1.0.2에 의해 정의되는, eggnog 패밀리 05CI1 및 05VI0의 그룹으로부터 선택되는 것인 방법..
  16. 청구항 2 또는 3에 있어서, 상기 포터는 2018년 9월에 공개된 Pfam 32.0에 의해 정의되는, PFAM 목록 PF00083, PF00474, PF00873, PF00893, PF01895, PF01943, PF02690, PF03083, PF04193, PF05977, PF07690, PF07690, PF13347, PF13440 및 PF14667로부터 선택되는 것인 방법.
  17. 청구항 2 또는 3에 있어서, 상기 P-P-결합-가수분해-유도 수송체는 2018년 9월에 공개된 Pfam 32.0에 의해 정의되는, PFAM 목록 PF00005, PF00532, PF00664, PF01061, PF08352, PF14524, PF13407, PF13416 및 PF17912로부터 선택되는 것인 방법.
  18. 청구항 2 또는 3에 있어서, 상기 β-배럴 포린은 2018년 9월에 공개된 Pfam 32.0에 의해 정의되는, PFAM 목록 PF02264, PF02563, PF10531 및 PF18412로부터 선택되는 것인 방법.
  19. 청구항 2 또는 3에 있어서, 상기 보조 수송 단백질은 2018년 9월에 공개된 Pfam 32.0에 의해 정의되는, PFAM 목록 PF13807 및 PF02706으로부터 선택되는 것인 방법.
  20. 청구항 2 또는 3에 있어서, 상기 추정 수송 단백질은 2018년 9월에 공개된 Pfam 32.0에 의해 정의되는, PFAM 목록 PF01578, PF03932, PF05140 및 PF11045로부터 선택되는 것인 방법.
  21. 청구항 2 또는 3에 있어서, 상기 포스포트란스퍼-유도 그룹 전위인자는 2018년 9월에 공개된 Pfam 32.0에 의해 정의되는, PFAM 목록 PF00367, PF00358, PF02378, PF03829로부터 선택되는 것인 방법.
  22. 청구항 2 또는 3에 있어서, 상기 포터는 2019년 7월 4일자로 공개된 InterPro 75.0에 의해 정의되는, interpro 목록 IPR000390, IPR001036, IPR001411, IPR001734, IPR001927, IPR002797, IPR003663, IPR003841, IPR004316, IPR004633, IPR004638, IPR004734, IPR004812, IPR005275, IPR005828, IPR005829, IPR006603, IPR010290, IPR011701, IPR020846, IPR023008, IPR023721, IPR023722, IPR026022, IPR027417, IPR027463, IPR029303, IPR032896, IPR036259, IPR038078, IPR038377, IPR039672로부터 선택되는 것인 방법.
  23. 청구항 2 또는 3에 있어서, 상기 P-P-결합-가수분해-유도 수송체는 2019년 7월 4일자로 공개된 InterPro 75.0에 의해 정의되는, interpro 목록 IPR000412, IPR001734, IPR001761, IPR003439, IPR003593, IPR005829, IPR005978, IPR005981, IPR006059, IPR006060, IPR006061, IPR008995, IPR011527, IPR011701, IPR013456, IPR013525, IPR013563, IPR015851, IPR015855, IPR017871, IPR019554, IPR020846, IPR025997, IPR026266, IPR027417, IPR028082, IPR029439, IPR033893, IPR036259, IPR036640, IPR038377, IPR039421 및 IPR040582로부터 선택되는 것인 방법.
  24. 청구항 2 또는 3에 있어서, 상기 β-배럴 포린은 2019년 7월 4일자로 공개된 InterPro 75.0에 의해 정의되는, interpro 목록 IPR003192, IPR003715, IPR019554, IPR023738, IPR036998 및 IPR040716으로부터 선택되는 것인 방법.
  25. 청구항 2 또는 3에 있어서, 상기 보조 수송 단백질은 2019년 7월 4일자로 공개된 InterPro 75.0에 의해 정의되는, interpro 목록 IPR003856, IPR020846, IPR027417, IPR032807 및 IPR036259로부터 선택되는 것인 방법.
  26. 청구항 2 또는 3에 있어서, 상기 추정 수송 단백질은 2019년 7월 4일자로 공개된 InterPro 75.0에 의해 정의되는, interpro 목록 IPR002541, IPR003439, IPR003593, IPR004316, IPR005627, IPR006603, IPR007816, IPR017871, IPR020368, IPR020846, IPR023648, IPR027417, IPR036259 및 IPR036822로부터 선택되는 것인 방법.
  27. 청구항 2 또는 3에 있어서, 상기 포스포트란스퍼-유도 그룹 전위인자는 2019년 7월 4일자로 공개된 InterPro 75.0에 의해 정의되는, interpro 목록 IPR001127, IPR001996, IPR003352, IPR004716, IPR010974, IPR011055, IPR013013, IPR018113, IPR018454, IPR036665 및 IPR036878로부터 선택되는 것인 방법.
  28. 청구항 2 또는 3에 있어서, 상기 포터 막 단백질은 서열번호: 02의 대장균 (Escherichia coli) K12 MG1655 유래의 MdfA, 서열번호: 06의 대장균 K12 MG1655 유래의 IceT, 서열번호: 40의 B. 론검 아종 인판티스 (B. longum subsp. Infantis) (균주 ATCC 15697) 유래의 Blon_2331, 서열번호: 42의 B. 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2332, 서열번호: 58의 키티노파가 CF118, 서열번호: 66의 프레보텔라 루미니콜라 (AR32), 서열번호: 64의 락토코커스 라피노락티스 (ATCC 43920), 또는 서열번호: 62의 디아도박터 솔리 DSM 25329 유래의 wzx-유사 단백질, 또는 상기 포터 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 02, 06, 40, 42, 58, 66, 64 또는 62 각각의 상기 MdfA, IceT, Blon_2331, Blon_2332 막 단백질들 또는 wzx-유사 막 단백질 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 서열로부터 선택되는 것인 것인 방법.
  29. 청구항 2 또는 3에 있어서, 상기 P-P-결합-가수분해 유도 수송체 막 단백질은 서열번호: 28의 락토코커스 락티스 균주 SRCM103457 유래의 lmrA, 서열번호: 70 또는 74의 스포로무사 스파에로이데스 DSM 2875, 서열번호: 68 또는 72의 플라보박테리움 스파르탄시이 유래의 LpsE 막 단백질, 서열번호: 76의 칸디다투스 플란크토필라 설포니카 유래의 TolC, 서열번호: 82의 페도박터 긴센기솔리 또는 서열번호: 84의 베루코미크로비아 박테리움 CG1_02_43_26 유래의 MsbA, 서열번호: 206의 대장균 K-12 MG1655 유래의 malE, 서열번호: 208의 대장균 K-12 MG1655 유래의 malK, 서열번호: 214의 대장균 K-12 MG1655 유래의 araF, 서열번호: 216의 대장균 K-12 MG1655 유래의 xylF, 또는 서열번호: 218의 대장균 K-12 MG1655 유래의 ytfQ, 또는 상기 P-P-결합-가수분해 유도 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 28, 70, 74, 68, 72, 76, 82, 84, 206, 208, 214, 216, 또는 218 각각의 상기 lmrA, LpsE, TolC, MsbA, malE, malK, araF, xylF 또는 ytfQ 막 단백질 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 서열로부터 선택되는 것인 방법.
  30. 청구항 2 또는 3에 있어서, 상기 β-배럴 포린은 서열번호: 34의 대장균 K12 MG1655 유래의 Wza 또는 서열번호: 204의 대장균 K12 MG1655 유래의 lamB, 또는 이의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 34 또는 204 각각의 상기 Wza 또는 lamB 막 단백질에 대해 적어도 80%의 서열 동일성을 갖는 서열로부터 선택되는 것인 방법.
  31. 청구항 2 또는 3에 있어서, 상기 보조 수송 단백질은 서열번호: 88의 서모토가 마리티마 (균주 ATCC 43589 / MSB8 / DSM 3109 / JCM 10099) 유래의 Wzc, 또는 이의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 88의 상기 Wzc 막 단백질에 대해 적어도 80%의 서열 동일성을 갖는 서열로부터 선택되는 것인 방법.
  32. 청구항 2 또는 3에 있어서, 상기 추정 수송 단백질은 서열번호: 90의 클로스트리디움 종 CAG: 1013, 서열번호: 92의 오도리박터 스플란크니쿠스 DSM 20712, 서열번호: 94의 미추아리아 종 PDC51 또는 서열번호: 96의 프레보텔라 인테르메디아 ATCC 25611 (DSM 20706) 유래의 CutC, 또는 상기 CutC 막 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 90, 92, 94 또는 96 각각의 상기 CutC 막 단백질에 대해 적어도 80%의 서열 동일성을 갖는 서열로부터 선택되는 것인 방법.
  33. 청구항 2 또는 3에 있어서, 상기 포스포트란스퍼-유도 그룹 전위인자는 서열번호: 210의 대장균 K12 MG1655 유래의 nagE, 서열번호: 212의 대장균 K12 MG1655 유래의 srlB, 또는 상기 nagE 또는 srlB 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 210 또는 212 각각의 상기 nagE 또는 srlB 막 단백질 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 서열로부터 선택되는 것인 방법.
  34. 청구항 2 또는 3에 있어서, 상기 포터 막 단백질은 서열번호: 02의 대장균 K12 MG1655 유래의 MdfA, 서열번호: 06의 대장균 K12 MG1655 유래의 IceT, 서열번호: 04의 대장균 K12 MG1655 유래의 YnfM, 서열번호: 08의 대장균 K12 MG1655 유래의 Yhhs, 서열번호: 10의 대장균 K12 MG1655 유래의 EmrD, 서열번호: 12의 대장균 K12 MG1655 유래의 YdhC, 서열번호: 14의 대장균 K12 MG1655 유래의 YbdA, 서열번호: 16의 대장균 K12 MG1655 유래의 YdeE, 서열번호: 18의 대장균 K12 MG1655 유래의 MhpT, 서열번호: 20의 대장균 K12 MG1655 유래의 YebQ, 서열번호: 22의 대장균 K12 MG1655 유래의 YjhB, 서열번호: 24의 대장균 K12 MG1655 유래의 Bcr, 서열번호: 26의 대장균 K12 MG1655 유래의 FucP, 서열번호: 32의 대장균 K12 MG1655 유래의 WzxE, 서열번호: 38의 대장균 K12 MG1655 유래의 EmrE, 서열번호: 40의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2331, 서열번호: 42의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2332, 서열번호: 46의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0247, 서열번호: 48의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0245, 서열번호: 50의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0345, 서열번호: 52의 뉴로스포라 크라사 OR74A 유래의 CDT2, 서열번호: 54의 아스페르길루스 오리제 RIB40 유래의 CDT2, 서열번호: 58의 키티노파가 종 CF118 유래의 Wzx, 서열번호: 60의 유박테리움 종 CAG:581 유래의 Wzx, 서열번호: 62의 디아도박터 솔리 (DSM 25329) 유래의 Wzx, 서열번호: 64의 락토코커스 라피노락티스 (ATCC 43920) 유래의 Wzx, 서열번호: 66의 프레보텔라 루미니콜라 (AR32) 유래의 Wzx, 서열번호: 86의 브라키스피라 함프소니이 P280/1 유래의 NAPO, 서열번호: 98의 악티노바쿨룸 수이스 (DSM 20639) 유래의 NAm, 서열번호: 100의 루미노코커스 그나부스 유래의 NAm, 서열번호: 102의 쿠르토박테리움 종 314Chir4.1 유래의 NAm, 서열번호: 104의 니아벨라 드릴라시스 (DSM25811) 유래의 Nap, 서열번호: 106의 사카리크리니스 퍼멘탄스 (DSM 9555) 유래의 Nap, 서열번호: 108의 시트로박터 프레운디이 MGH152 유래의 mdtD, 서열번호: 110의 시트로박터 웨르크마니이 NBRC 105721 유래의 mdtD, 서열번호: 112의 시트로박터 아말로나티쿠스 유래의 mdtD, 서열번호: 114의 클레브시엘라 옥시토카 유래의 mdtD, 서열번호: 116의 에스케리치아 알베르티이 B156 유래의 mdtD, 서열번호: 118의 살모넬라 엔테리카 아종 살라메 유래의 yegB, 서열번호: 120의 클레브시엘라 뉴모니에 30684/NJST258_2 유래의 mdtD, 서열번호: 122의 클레브시엘라 뉴모니에 유래의 Tcr_1_D38215, 서열번호: 124의 슈도시트로박터 페칼리스 유래의 mdtD, 서열번호: 126의 요케넬라 레겐스버게이 (ATCC43003) 유래의 Cmr, 서열번호: 128의 크로노박터 무이트젠시이 유래의 MdfA, 서열번호: 130의 클레브시엘라 옥시토카 유래의 MdfA, 서열번호: 132의 시트로박터 코세리 유래의 MFS, 서열번호: 134의 에스케리치아 마르모테 유래의 MdfA, 서열번호: 136의 시겔라 플렉스네리 유래의 Cmr, 서열번호: 138의 살모넬라 엔테리카 아종 살라메 유래의 MdfA, 서열번호: 140의 시트로박터 윤게 (ATCC 29220) 유래의 Cmr, 서열번호: 142의 시트로박터 프레운디이 유래의 MdfA, 서열번호: 144의 엔테로박터 코베이 유래의 MdfA, 서열번호: 146의 엔테로박터 종 유래의 MdfA, 서열번호: 148의 렐리오티아 종 WB101 유래의 MdfA, 서열번호: 150의 엔테로박터 루드위기이 EcWSU1 유래의 MdfA, 서열번호: 152의 악티노플라네스 우타헨시스 유래의 Sweet-유사 단백질, 서열번호: 154의 키티노파가세에 박테리움 PMG_246 유래의 Sweet-유사 단백질, 서열번호: 156의 리조비움 종 PDC82 유래의 Sweet-유사 단백질, 서열번호: 158의 키네오코커스 리조스파에레 (DSM 19711) 유래의 Sweet-유사 단백질, 서열번호: 160의 모르가넬라 모르가니이 IS15 유래의 Sweet-유사 단백질, 서열번호: 162의 게오데르마토필루스 오브스쿠러스 (균주 ATCC 25078) 유래의 Sweet-유사 단백질, 서열번호: 164의 브라디리조비움 종 BTAi1 유래의 Sweet-유사 단백질, 서열번호: 166의 브라디리조비움 자포니쿰 USDA 110 유래의 Sweet-유사 단백질, 서열번호: 168의 크산토모나스 캄페스트리스 pv. 베시카토리아 균주 85-10 유래의 Sweet-유사 단백질, 서열번호: 170의 헤르바스피릴룸 아쿠아티쿰 유래의 Sweet-유사 단백질, 서열번호: 172의 플라보박테리아 박테리움 MS024-2A 유래의 Sweet-유사 단백질, 서열번호: 182의 시노리조비움 메디케 WSM419 유래의 rnd-유사 단백질, 서열번호: 184의 아조스피릴룸 브라실리엔세 LMG 04375 유래의 아라비노스 유출물, 또는 상기 포터 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 02, 06, 04, 08, 10, 12, 14, 16, 18, 20, 22, 24, 26, 32, 38, 40, 42, 46, 48, 50, 52, 54, 58, 60, 62, 64, 66, 86, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164, 166, 168, 170, 172, 182 또는 184 각각의 상기 MdfA, IceT, YnfM, Yhhs, EmrD, YdhC, YbdA, YdeE, MhpT, YebQ, YjhB, Bcr, FucP, WzxE, EmrE, Wzx, Blon_2331, Blon_2232, Blon_0247, Blon_0245, Blon_0345, NAPO, NAm, Nap, mdtD, YegB, Tcr_1_D38215, cmr, MFS, CDT2, rnd, Sweet-유사 또는 아라비노스 유출물 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질로부터 선택되는 것인 방법.
  35. 청구항 2 또는 3에 있어서, 상기 P-P-결합-가수분해-유도 수송체는 서열번호: 28의 락토코커스 락티스 균주 SRCM103457 유래의 LmrA, 서열번호: 30의 대장균 균주 K12 MG1655 유래의 OppF, 서열번호: 36의 헬리코박터 필로리 (균주 ATCC 700392 / 26695) 유래의 Wzk, 서열번호: 44의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2475, 서열번호: 68 또는 72의 플라보박테리움 스파르탄시이 유래의 LpsE, 서열번호: 70 또는 74의 스포로무사 스파에로이데스 DSM 2875 유래의 LpsE, 서열번호: 76의 칸디다투스 플란크토필라 설포니카 유래의 TolC, 서열번호: 78의 부티리비브리오 훈가테이 XBD2006 유래의 TolC, 서열번호: 80의 로세부리아 인테스티날리스 CAG:13 유래의 MsbA, 서열번호: 82의 페도박터 긴센기솔리 유래의 MsbA, 서열번호: 84의 베루코미크로비아 박테리움 CG1_02_43_26 유래의 MsbA, 서열번호: 174의 리조비움 종 Root149 유래의 Wzm, 서열번호: 176의 아조스피릴룸 브라실리엔세 LMG 04375 유래의 Wzm, 서열번호: 196의 대장균 113303 유래의 Wzm, 서열번호: 178의 리조비움 종 Root149 유래의 Wzt, 서열번호: 180의 아조스피릴룸 브라실리엔세 LMG 04375 유래의 Wzt, 서열번호: 194의 대장균 113303 유래의 Wzt, 서열번호: 188 또는 190의 브라디리조비움 자포니쿰 USDA 110 유래의 Nodj, 서열번호: 206의 대장균 K-12 MG1655 유래의 malE, 서열번호: 208의 대장균 K-12 MG1655 유래의 malK, 서열번호: 214의 대장균 K-12 MG1655 유래의 araF, 서열번호: 216의 대장균 K-12 MG1655 유래의 xylF, 또는 서열번호: 218의 대장균 K-12 MG1655 유래의 ytfQ, 또는 상기 P-P-결합-가수분해-유도 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 28, 30, 36, 44, 68, 72, 70, 74, 76, 78, 80, 82, 84, 174, 176, 196, 178, 180, 194, 188, 190, 206, 208, 214, 216 또는 218 각각의 상기 LmrA, OppF, Wzk, Blon_2475, LpsE, TolC, MsbA, Wzm, Wzt, Nodj, malE, malK, araF, xylF 또는 ytfQ 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질로부터 선택되는 것인 방법.
  36. 청구항 2 또는 3에 있어서, 상기 추정 수송 단백질은 서열번호: 56의 헬리코박터 필로리 유래의 사이토크롬 C 생합성 단백질, 서열번호: 90의 클로스트리디움 종 CAG: 1013 유래의 CutC, 서열번호: 92의 오도리박터 스플란크니쿠스 DSM 20712 유래의 CutC, 서열번호: 94의 미추아리아 종 PDC51 유래의 CutC, 서열번호: 96의 프레보텔라 인테르메디아 ATCC 25611 (DSM 20706) 유래의 CutC, 서열번호: 190의 대장균 K12 MG1655 유래의 ybjM, 서열번호: 192의 엔테로박테리아세에 박테리움 ENNIH1 유래의 ybjM, 또는 상기 추정 수송 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 56, 90, 92, 94, 96, 190 또는 192 각각의 상기 CytC, CutC 또는 ybjM 막 단백질 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질로부터 선택되는 것인 방법.
  37. 유전자 변형 세포에 의해 푸코실락토스를 제조하는 방법으로서,
    Figure pct00001
    푸코실락토스를 생성할 수 있는 세포를 제공하는 단계로서, 상기 세포는 GDP-푸코스 공여체로부터의 푸코스 잔기를 락토스 수용체에 전달하여 푸코실락토스를 합성하는 푸코실트란스퍼라제를 코딩하는 핵산 서열을 적어도 1개 포함하고,
    Figure pct00002
    상기 세포는 i) 푸코실락토스 수송을 가능하게 하고/하거나 이를 향상시키는 내인성 막 단백질의 변형된 발현, 및/또는 ii) 푸코실락토스 수송을 가능하게 하고/하거나 이를 향상시키는 이종 막 단백질의 발현을 추가로 포함하고, 상기 막 단백질은 포터 막 단백질인 서열번호: 02의 대장균 K12 MG1655 유래의 MdfA, 서열번호: 06의 대장균 K12 MG1655 유래의 IceT, 서열번호: 04의 대장균 K12 MG1655 유래의 YnfM, 서열번호: 08의 대장균 K12 MG1655 유래의 Yhhs, 서열번호: 10의 대장균 K12 MG1655 유래의 EmrD, 서열번호: 12의 대장균 K12 MG1655 유래의 YdhC, 서열번호: 14의 대장균 K12 MG1655 유래의 YbdA, 서열번호: 16의 대장균 K12 MG1655 유래의 YdeE, 서열번호: 18의 대장균 K12 MG1655 유래의 MhpT, 서열번호: 20의 대장균 K12 MG1655 유래의 YebQ, 서열번호: 22의 대장균 K12 MG1655 유래의 YjhB, 서열번호: 24의 대장균 K12 MG1655 유래의 Bcr, 서열번호: 26의 대장균 K12 MG1655 유래의 FucP, 서열번호: 32의 대장균 K12 MG1655 유래의 WzxE, 서열번호: 38의 대장균 K12 MG1655 유래의 EmrE, 서열번호: 40의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2331, 서열번호: 42의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2332, 서열번호: 46의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0247, 서열번호: 48의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0245, 서열번호: 50의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0345, 서열번호: 52의 뉴로스포라 크라사 OR74A 유래의 CDT2, 서열번호: 54의 아스페르길루스 오리제 RIB40 유래의 CDT2, 서열번호: 58의 키티노파가 종 CF118 유래의 Wzx, 서열번호: 60의 유박테리움 종 CAG:581 유래의 Wzx, 서열번호: 62의 디아도박터 솔리 (DSM 25329) 유래의 Wzx, 서열번호: 64의 락토코커스 라피노락티스 (ATCC 43920) 유래의 Wzx, 서열번호: 66의 프레보텔라 루미니콜라 (AR32) 유래의 Wzx, 서열번호: 86의 브라키스피라 함프소니이 P280/1 유래의 NAPO, 서열번호: 98의 악티노바쿨룸 수이스 (DSM 20639) 유래의 NAm, 서열번호: 100의 루미노코커스 그나부스 유래의 NAm, 서열번호: 102의 쿠르토박테리움 종 314Chir4.1 유래의 NAm, 서열번호: 104의 니아벨라 드릴라시스 (DSM25811) 유래의 Nap, 서열번호: 106의 사카리크리니스 퍼멘탄스 (DSM 9555) 유래의 Nap, 서열번호: 108의 시트로박터 프레운디이 MGH152 유래의 mdtD, 서열번호: 110의 시트로박터 웨르크마니이 NBRC 105721 유래의 mdtD, 서열번호: 112의 시트로박터 아말로나티쿠스 유래의 mdtD, 서열번호: 114의 클레브시엘라 옥시토카 유래의 mdtD, 서열번호: 116의 에스케리치아 알베르티이 B156 유래의 mdtD, 서열번호: 118의 살모넬라 엔테리카 아종 살라메 유래의 yegB, 서열번호: 120의 클레브시엘라 뉴모니에 30684/NJST258_2 유래의 mdtD, 서열번호: 122의 클레브시엘라 뉴모니에 유래의 Tcr_1_D38215, 서열번호: 124의 슈도시트로박터 페칼리스 유래의 mdtD, 서열번호: 126의 요케넬라 레겐스버게이 (ATCC43003) 유래의 Cmr, 서열번호: 128의 크로노박터 무이트젠시이 유래의 MdfA, 서열번호: 130의 클레브시엘라 옥시토카 유래의 MdfA, 서열번호: 132의 시트로박터 코세리 유래의 MFS, 서열번호: 134의 에스케리치아 마르모테 유래의 MdfA, 서열번호: 136의 시겔라 플렉스네리 유래의 Cmr, 서열번호: 138의 살모넬라 엔테리카 아종 살라메 유래의 MdfA, 서열번호: 140의 시트로박터 윤게 (ATCC 29220) 유래의 Cmr, 서열번호: 142의 시트로박터 프레운디이 유래의 MdfA, 서열번호: 144의 엔테로박터 코베이 유래의 MdfA, 서열번호: 146의 엔테로박터 종 유래의 MdfA, 서열번호: 148의 렐리오티아 종 WB101 유래의 MdfA, 서열번호: 150의 엔테로박터 루드위기이 EcWSU1 유래의 MdfA, 서열번호: 152의 악티노플라네스 우타헨시스 유래의 Sweet-유사 단백질, 서열번호: 154의 키티노파가세에 박테리움 PMG_246 유래의 Sweet-유사 단백질, 서열번호: 156의 리조비움 종 PDC82 유래의 Sweet-유사 단백질, 서열번호: 158의 키네오코커스 리조스파에레 (DSM 19711) 유래의 Sweet-유사 단백질, 서열번호: 160의 모르가넬라 모르가니이 IS15 유래의 Sweet-유사 단백질, 서열번호: 162의 게오데르마토필루스 오브스쿠러스 (균주 ATCC 25078) 유래의 Sweet-유사 단백질, 서열번호: 164의 브라디리조비움 종 BTAi1 유래의 Sweet-유사 단백질, 서열번호: 166의 브라디리조비움 자포니쿰 USDA 110 유래의 Sweet-유사 단백질, 서열번호: 168의 크산토모나스 캄페스트리스 pv. 베시카토리아 균주 85-10 유래의 Sweet-유사 단백질, 서열번호: 170의 헤르바스피릴룸 아쿠아티쿰 유래의 Sweet-유사 단백질, 서열번호: 172의 플라보박테리아 박테리움 MS024-2A 유래의 Sweet-유사 단백질, 서열번호: 182의 시노리조비움 메디케 WSM419 유래의 rnd-유사 단백질, 서열번호: 184의 아조스피릴룸 브라실리엔세 LMG 04375 유래의 아라비노스 유출물, 또는 상기 포터 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 02, 06, 04, 08, 10, 12, 14, 16, 18, 20, 22, 24, 26, 32, 38, 40, 42, 46, 48, 50, 52, 54, 58, 60, 62, 64, 66, 86, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164, 166, 168, 170, 172, 182 또는 184 각각의 상기 MdfA, IceT, YnfM, Yhhs, EmrD, YdhC, YbdA, YdeE, MhpT, YebQ, YjhB, Bcr, FucP, WzxE, EmrE, Wzx, Blon_2331, Blon_2232, Blon_0247, Blon_0245, Blon_0345, NAPO, NAm, Nap, mdtD, YegB, Tcr_1_D38215, cmr, MFS, CDT2, rnd, Sweet-유사 또는 아라비노스 유출물 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질; 및 P-P-결합-가수분해-유도 수송체인 서열번호: 28의 락토코커스 락티스 균주 SRCM103457 유래의 LmrA, 서열번호: 30의 대장균 균주 K12 MG1655 유래의 OppF, 서열번호: 36의 헬리코박터 필로리 (균주 ATCC 700392 / 26695) 유래의 Wzk, 서열번호: 44의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2475, 서열번호: 68 또는 72의 플라보박테리움 스파르탄시이 유래의 LpsE, 서열번호: 70 또는 74의 스포로무사 스파에로이데스 DSM 2875 유래의 LpsE, 서열번호: 76의 칸디다투스 플란크토필라 설포니카 유래의 TolC, 서열번호: 78의 부티리비브리오 훈가테이 XBD2006 유래의 TolC, 서열번호: 80의 로세부리아 인테스티날리스 CAG:13 유래의 MsbA, 서열번호: 82의 페도박터 긴센기솔리 유래의 MsbA, 서열번호: 84의 베루코미크로비아 박테리움 CG1_02_43_26 유래의 MsbA, 서열번호: 174의 리조비움 종 Root149 유래의 Wzm, 서열번호: 176의 아조스피릴룸 브라실리엔세 LMG 04375 유래의 Wzm, 서열번호: 196의 대장균 113303 유래의 Wzm, 서열번호: 178의 리조비움 종 Root149 유래의 Wzt, 서열번호: 180의 아조스피릴룸 브라실리엔세 LMG 04375 유래의 Wzt, 서열번호: 194의 대장균 113303 유래의 Wzt, 서열번호: 188 또는 190의 브라디리조비움 자포니쿰 USDA 110 유래의 Nodj, 서열번호: 206의 대장균 K-12 MG1655 유래의 malE, 서열번호: 208의 대장균 K-12 MG1655 유래의 malK, 서열번호: 214의 대장균 K-12 MG1655 유래의 araF, 서열번호: 216의 대장균 K-12 MG1655 유래의 xylF, 또는 서열번호: 218의 대장균 K-12 MG1655 유래의 ytfQ, 또는 상기 P-P-결합-가수분해-유도 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 28, 30, 36, 44, 68, 72, 70, 74, 76, 78, 80, 82, 84, 174, 176, 196, 178, 180, 194, 188, 190, 206, 208, 214, 216, 또는 218 각각의 상기 LmrA, OppF, Wzk, Blon_2475, LpsE, TolC, MsbA, Wzm, Wzt, Nodj, malE, malK, araF, xylF 또는 ytfQ 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질; 및 β-배럴 포린 막 단백질인 서열번호: 34의 대장균 K12 MG1655 유래의 Wza 또는 서열번호: 204의 대장균 K12 MG1655 유래의 lamB, 또는 상기 Wza 또는 lamB 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 34 또는 204 각각의 상기 Wza 또는 lamB 막 단백질 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 서열; 및 보조 수송 단백질인 서열번호: 88의 서모토가 마리티마 (균주 ATCC 43589 / MSB8 / DSM 3109 / JCM 10099) 유래의 Wzc, 또는 이의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 88의 상기 Wzc 막 단백질에 대해 적어도 80%의 서열 동일성을 갖는 서열; 및 추정 수송 단백질인 서열번호: 56의 헬리코박터 필로리 유래의 사이토크롬 C 생합성 단백질, 서열번호: 90의 클로스트리디움 종 CAG: 1013 유래의 CutC, 서열번호: 92의 오도리박터 스플란크니쿠스 DSM 20712 유래의 CutC, 서열번호: 94의 미추아리아 종 PDC51 유래의 CutC, 서열번호: 96의 프레보텔라 인테르메디아 ATCC 25611 (DSM 20706) 유래의 CutC, 서열번호: 190의 대장균 K12 MG1655 유래의 ybjM, 서열번호: 192의 엔테로박테리아세에 박테리움 ENNIH1 유래의 ybjM, 또는 상기 추정 수송 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 56, 90, 92, 94, 96, 190 또는 192 각각의 상기 CytC, CutC 또는 ybjM 막 단백질 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질; 및 포스포트란스퍼-유도 그룹 전위인자인 서열번호: 210의 대장균 K12 MG1655 유래의 nagE, 서열번호: 212의 대장균 K12 MG1655 유래의 srlB, 또는 상기 nagE 또는 srlB 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 210 또는 212 각각의 상기 nagE 또는 srlB 막 단백질 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 서열로 구성된 막 단백질들의 그룹으로부터 선택되는 단계를 포함하는 것인 방법.
  38. 청구항 1 내지 37 중 어느 한 항에 있어서, 상기 막 단백질은 세포벽의 외막을 가로질러 화합물의 수송에 관여하는 수송체 단백질인 것인 푸코실락토스를 제조하는 방법.
  39. 청구항 1 내지 38 중 어느 한 항에 있어서, 상기 방법은 하기 단계들 중 적어도 하나를 추가로 포함하고:
    i) 상기 배양 배지에, 초기 반응기 부피 1 리터 (litre)당 락토스를 적어도 50, 더 바람직하게는 적어도 75, 더 바람직하게는 적어도 100, 더 바람직하게는 적어도 120, 더 바람직하게는 적어도 150 그람 (gram)을 포함하는 락토스 공급물을, 바람직하게는 연속 방식 (continuous manner)으로, 바람직하게는 상기 배양 배지의 최종 부피가 상기 락토스 공급물의 부가 전 배양 배지 부피의 3배 이하, 바람직하게는 2배 이하, 더 바람직하게는 2배 미만이 되도록 부가하는 단계;
    ii) 락토스 공급물을 연속 방식으로 상기 배양 배지에 1일, 2일, 3일, 4일, 5일에 걸쳐 공급 용액에 의해 부가하는 단계;
    iii) 락토스 공급물을 연속 방식으로 배양 배지에 1일, 2일, 3일, 4일, 5일에 걸쳐 공급 용액에 의해 부가하는 단계로서, 상기 락토스 공급 용액의 농도는 50 g/L, 바람직하게는 75 g/L, 더 바람직하게는 100 g/L, 더 바람직하게는 125 g/L, 더 바람직하게는 150 g/L, 더 바람직하게는 175 g/L, 더 바람직하게는 200 g/L, 더 바람직하게는 225 g/L, 더 바람직하게는 250 g/L, 더 바람직하게는 275 g/L, 더 바람직하게는 300 g/L, 더 바람직하게는 325 g/L, 더 바람직하게는 350 g/L, 더 바람직하게는 375 g/L, 더 바람직하게는 400 g/L, 더 바람직하게는 450 g/L, 더 바람직하게는 500 g/L, 더욱 바람직하게는 550 g/L, 가장 바람직하게는 600 g/L이며; 바람직하게는 상기 용액의 pH는 3 내지 7로 설정되고, 바람직하게는 상기 공급 용액의 온도는 20℃ 내지 80℃로 유지되는 것인 단계;
    상기 방법으로 상기 배양 배지의 최종 부피 중에 적어도 50 g/L, 바람직하게는 적어도 75 g/L, 더 바람직하게는 적어도 90 g/L, 더 바람직하게는 적어도 100 g/L, 더 바람직하게는 적어도 125 g/L, 더 바람직하게는 적어도 150 g/L, 더 바람직하게는 적어도 175 g/L, 더 바람직하게는 적어도 200 g/L의 푸코실락토스 농도를 유도하는 것인 푸코실락토스를 제조하는 방법.
  40. 청구항 39에 있어서, 상기 락토스 공급은 배양 초기부터 락토스를 적어도 5 mM의 농도, 바람직하게는 30, 40, 50, 60, 70, 80, 90, 100, 150 mM의 농도, 더 바람직하게는 > 300 mM의 농도로 부가함으로써 달성되는 것인 방법.
  41. 청구항 39 또는 40에 있어서, 상기 락토스 공급은 배양의 생산 단계 (production phase) 전반에 걸쳐 적어도 5 mM, 바람직하게는 10 mM 또는 30 mM의 락토스 농도가 수득되도록 하는 농도로 락토스를 상기 배양 배지에 부가함으로써 달성되는 것인 방법.
  42. 청구항 39, 40 또는 41 중 어느 항에 있어서, 상기 숙주 세포는 적어도 약 60, 80, 100, 또는 약 120시간 동안, 또는 연속 방식으로 배양되는 것인 방법.
  43. 청구항 39 내지 42 중 어느 한 항에 있어서, 탄소 및 에너지 공급원, 바람직하게는 수크로스, 글루코스, 프럭토스, 글리세롤, 말토스, 말토덱스트린, 트레할로스, 폴리올, 전분, 숙시네이트, 말레이트, 피루베이트, 락테이트, 에탄올, 시트레이트, 락토스가 또한 부가되고, 바람직하게는 연속적으로, 바람직하게는 락토스와 함께 상기 배양 배지에 부가되는 것인 방법.
  44. 청구항 39 내지 43 중 어느 한 항에 있어서, 탄소계 기질, 바람직하게는 글루코스 또는 수크로스를 상기 배양 배지에 부가함으로써 제1 지수적 세포 성장 단계가 제공되고, 그 후에 제2 단계에서 락토스가 상기 배양 배지에 부가되는 것인 방법.
  45. 청구항 1 내지 44 중 어느 한 항에 있어서, 상기 방법이 푸코실락토스의 혼합물을 생성하는 것인 방법.
  46. 청구항 1 내지 45 중 어느 한 항에 있어서, 상기 푸코실락토스는 2'-푸코실락토스, 3-푸코실락토스 및/또는 디푸코실락토스인 것인 방법.
  47. 청구항 1 내지 46 중 어느 한 항에 있어서, 상기 유전자 변형 세포는 미생물, 식물 또는 동물 세포로 구성된 그룹으로부터 선택되고, 바람직하게는 상기 미생물은 박테리아, 진균 또는 효모이며, 바람직하게는 상기 식물은 벼, 목화, 유채, 대두, 옥수수 (maize) 또는 옥수수 식물 (corn plant)이고, 바람직하게는 상기 동물은 곤충, 어류, 조류 또는 비-인간 포유동물인 것인 방법.
  48. 청구항 47에 있어서, 상기 세포는 대장균 세포인 것인 방법.
  49. 푸코실락토스 생성을 위해 유전자 변형된 숙주 세포로서, 상기 숙주 세포는 GDP-푸코스 공여체로부터의 푸코스 잔기를 락토스 수용체에 전달하여 푸코실락토스를 합성하는 푸코실트란스퍼라제를 코딩하는 핵산 서열을 적어도 1개 포함하고, - 상기 세포는 i) 푸코실락토스 수송을 가능하게 하고/하거나 이를 향상시킬 수 있는 내인성 막 단백질의 변형된 발현, 및/또는 ii) 푸코실락토스 수송을 가능하게 하고/하거나 이를 향상시킬 수 있는 이종 막 단백질의 발현을 추가로 포함하고, 상기 막 단백질은 i) 2019년 7월 4일자로 공개된 InterPro 75.0에 정의되는, interpro 번호 IPR001503 및 IPR002516을 각각 사용하여 GT10 및 GT11 푸코실트란스퍼라제 패밀리의 게놈 인근을 검색하여 발견된 PFAM 도메인들 중 어느 하나의 도메인을 포함하는 막 단백질들의 그룹으로부터 선택되며, 여기서 상기 게놈 인근 윈도우 크기는 각 푸코실트란스퍼라제 앞에 14개의 유전자 및 뒤에 14개의 유전자이고, 상기 막 단백질은 SET 패밀리에 속하지 않으며, 또는 ii) 서열번호: 204, 206, 208, 210, 212, 214, 216, 218을 포함하는 막 단백질들, 또는 서열번호: 204, 206, 208, 210, 212, 214, 216, 218을 포함하는 막 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 204, 206, 208, 210, 212, 214, 216, 218의 상기 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 서열의 그룹으로부터 선택되는 것인 푸코실락토스 생성을 위해 유전자 변형된 숙주 세포.
  50. 청구항 49에 있어서, 상기 막 단백질은
    a) 포터;
    b) P-P-결합-가수분해-유도 수송체;
    c) β-배럴 포린;
    d) 보조 수송 단백질;
    e) 추정 수송 단백질; 및
    f) 포스포트란스퍼-유도 그룹 전위인자의 그룹으로부터 선택되는 것인 숙주 세포.
  51. 푸코실락토스 생성을 위해 유전자 변형된 숙주 세포로서, 상기 숙주 세포는 GDP-푸코스 공여체로부터의 푸코스 잔기를 락토스 수용체에 전달하여 푸코실락토스를 합성하는 푸코실트란스퍼라제를 코딩하는 핵산 서열을 적어도 1개 포함하고,
    - 상기 세포는 i) 푸코실락토스 수송을 가능하게 하고/하거나 이를 향상시킬 수 있는 내인성 막 단백질의 변형된 발현, 및/또는 ii) 푸코실락토스 수송을 가능하게 하고/하거나 이를 향상시킬 수 있는 이종 막 단백질의 발현을 추가로 포함하고, 상기 막 단백질은
    a) 포터, 여기서 상기 막 단백질은 SET 패밀리에 속하지 않음;
    b) P-P-결합-가수분해-유도 수송체;
    c) β-배럴 포린;
    d) 보조 수송 단백질;
    e) 추정 수송 단백질; 및
    f) 포스포트란스퍼-유도 그룹 전위인자의 그룹으로부터 선택되는 것인 푸코실락토스 생성을 위해 유전자 변형된 숙주 세포.
  52. 청구항 50 또는 51에 있어서, 상기 막 단백질은 청구항 4 내지 38 중 어느 한 항에 정의된 막 단백질들의 그룹으로부터 선택되는 것인 숙주 세포.
  53. 청구항 50 또는 51에 있어서, 상기 포터 막 단백질은 서열번호: 02의 대장균 K12 MG1655 유래의 MdfA, 서열번호: 06의 대장균 K12 MG1655 유래의 IceT, 서열번호: 04의 대장균 K12 MG1655 유래의 YnfM, 서열번호: 08의 대장균 K12 MG1655 유래의 Yhhs, 서열번호: 10의 대장균 K12 MG1655 유래의 EmrD, 서열번호: 12의 대장균 K12 MG1655 유래의 YdhC, 서열번호: 14의 대장균 K12 MG1655 유래의 YbdA, 서열번호: 16의 대장균 K12 MG1655 유래의 YdeE, 서열번호: 18의 대장균 K12 MG1655 유래의 MhpT, 서열번호: 20의 대장균 K12 MG1655 유래의 YebQ, 서열번호: 22의 대장균 K12 MG1655 유래의 YjhB, 서열번호: 24의 대장균 K12 MG1655 유래의 Bcr, 서열번호: 26의 대장균 K12 MG1655 유래의 FucP, 서열번호: 32의 대장균 K12 MG1655 유래의 WzxE, 서열번호: 38의 대장균 K12 MG1655 유래의 EmrE, 서열번호: 40의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2331, 서열번호: 42의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2332, 서열번호: 46의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0247, 서열번호: 48의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0245, 서열번호: 50의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0345, 서열번호: 52의 뉴로스포라 크라사 OR74A 유래의 CDT2, 서열번호: 54의 아스페르길루스 오리제 RIB40 유래의 CDT2, 서열번호: 58의 키티노파가 종 CF118 유래의 Wzx, 서열번호: 60의 유박테리움 종 CAG:581 유래의 Wzx, 서열번호: 62의 디아도박터 솔리 (DSM 25329) 유래의 Wzx, 서열번호: 64의 락토코커스 라피노락티스 (ATCC 43920) 유래의 Wzx, 서열번호: 66의 프레보텔라 루미니콜라 (AR32) 유래의 Wzx, 서열번호: 86의 브라키스피라 함프소니이 P280/1 유래의 NAPO, 서열번호: 98의 악티노바쿨룸 수이스 (DSM 20639) 유래의 NAm, 서열번호: 100의 루미노코커스 그나부스 유래의 NAm, 서열번호: 102의 쿠르토박테리움 종 314Chir4.1 유래의 NAm, 서열번호: 104의 니아벨라 드릴라시스 (DSM25811) 유래의 Nap, 서열번호: 106의 사카리크리니스 퍼멘탄스 (DSM 9555) 유래의 Nap, 서열번호: 108의 시트로박터 프레운디이 MGH152 유래의 mdtD, 서열번호: 110의 시트로박터 웨르크마니이 NBRC 105721 유래의 mdtD, 서열번호: 112의 시트로박터 아말로나티쿠스 유래의 mdtD, 서열번호: 114의 클레브시엘라 옥시토카 유래의 mdtD, 서열번호: 116의 에스케리치아 알베르티이 B156 유래의 mdtD, 서열번호: 118의 살모넬라 엔테리카 아종 살라메 유래의 yegB, 서열번호: 120의 클레브시엘라 뉴모니에 30684/NJST258_2 유래의 mdtD, 서열번호: 122의 클레브시엘라 뉴모니에 유래의 Tcr_1_D38215, 서열번호: 124의 슈도시트로박터 페칼리스 유래의 mdtD, 서열번호: 126의 요케넬라 레겐스버게이 (ATCC43003) 유래의 Cmr, 서열번호: 128의 크로노박터 무이트젠시이 유래의 MdfA, 서열번호: 130의 클레브시엘라 옥시토카 유래의 MdfA, 서열번호: 132의 시트로박터 코세리 유래의 MFS, 서열번호: 134의 에스케리치아 마르모테 유래의 MdfA, 서열번호: 136의 시겔라 플렉스네리 유래의 Cmr, 서열번호: 138의 살모넬라 엔테리카 아종 살라메 유래의 MdfA, 서열번호: 140의 시트로박터 윤게 (ATCC 29220) 유래의 Cmr, 서열번호: 142의 시트로박터 프레운디이 유래의 MdfA, 서열번호: 144의 엔테로박터 코베이 유래의 MdfA, 서열번호: 146의 엔테로박터 종 유래의 MdfA, 서열번호: 148의 렐리오티아 종 WB101 유래의 MdfA, 서열번호: 150의 엔테로박터 루드위기이 EcWSU1 유래의 MdfA, 서열번호: 152의 악티노플라네스 우타헨시스 유래의 Sweet-유사 단백질, 서열번호: 154의 키티노파가세에 박테리움 PMG_246 유래의 Sweet-유사 단백질, 서열번호: 156의 리조비움 종 PDC82 유래의 Sweet-유사 단백질, 서열번호: 158의 키네오코커스 리조스파에레 (DSM 19711) 유래의 Sweet-유사 단백질, 서열번호: 160의 모르가넬라 모르가니이 IS15 유래의 Sweet-유사 단백질, 서열번호: 162의 게오데르마토필루스 오브스쿠러스 (균주 ATCC 25078) 유래의 Sweet-유사 단백질, 서열번호: 164의 브라디리조비움 종 BTAi1 유래의 Sweet-유사 단백질, 서열번호: 166의 브라디리조비움 자포니쿰 USDA 110 유래의 Sweet-유사 단백질, 서열번호: 168의 크산토모나스 캄페스트리스 pv. 베시카토리아 균주 85-10 유래의 Sweet-유사 단백질, 서열번호: 170의 헤르바스피릴룸 아쿠아티쿰 유래의 Sweet-유사 단백질, 서열번호: 172의 플라보박테리아 박테리움 MS024-2A 유래의 Sweet-유사 단백질, 서열번호: 182의 시노리조비움 메디케 WSM419 유래의 rnd-유사 단백질, 서열번호: 184의 아조스피릴룸 브라실리엔세 LMG 04375 유래의 아라비노스 유출물, 또는 상기 포터 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 02, 06, 04, 08, 10, 12, 14, 16, 18, 20, 22, 24, 26, 32, 38, 40, 42, 46, 48, 50, 52, 54, 58, 60, 62, 64, 66, 86, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164, 166, 168, 170, 172, 182 또는 184 각각의 상기 MdfA, IceT, YnfM, Yhhs, EmrD, YdhC, YbdA, YdeE, MhpT, YebQ, YjhB, Bcr, FucP, WzxE, EmrE, Wzx, Blon_2331, Blon_2232, Blon_0247, Blon_0245, Blon_0345, NAPO, NAm, Nap, mdtD, YegB, Tcr_1_D38215, cmr, MFS, CDT2, rnd, Sweet-유사 또는 아라비노스 유출물 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질로부터 선택되는 것인 푸코실락토스 생성을 위해 유전자 변형된 숙주 세포.
  54. 청구항 50 또는 51에 있어서, 상기 P-P-결합-가수분해-유도 수송체는 서열번호: 28의 락토코커스 락티스 균주 SRCM103457 유래의 LmrA, 서열번호: 30의 대장균 균주 K12 MG1655 유래의 OppF, 서열번호: 36의 헬리코박터 필로리 (균주 ATCC 700392 / 26695) 유래의 Wzk, 서열번호: 44의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2475, 서열번호: 68 또는 72의 플라보박테리움 스파르탄시이 유래의 LpsE, 서열번호: 70 또는 74의 스포로무사 스파에로이데스 DSM 2875 유래의 LpsE, 서열번호: 76의 칸디다투스 플란크토필라 설포니카 유래의 TolC, 서열번호: 78의 부티리비브리오 훈가테이 XBD2006 유래의 TolC, 서열번호: 80의 로세부리아 인테스티날리스 CAG:13 유래의 MsbA, 서열번호: 82의 페도박터 긴센기솔리 유래의 MsbA, 서열번호: 84의 베루코미크로비아 박테리움 CG1_02_43_26 유래의 MsbA, 서열번호: 174의 리조비움 종 Root149 유래의 Wzm, 서열번호: 176의 아조스피릴룸 브라실리엔세 LMG 04375 유래의 Wzm, 서열번호: 196의 대장균 113303 유래의 Wzm, 서열번호: 178의 리조비움 종 Root149 유래의 Wzt, 서열번호: 180의 아조스피릴룸 브라실리엔세 LMG 04375 유래의 Wzt, 서열번호: 194의 대장균 113303 유래의 Wzt, 서열번호: 188 또는 190의 브라디리조비움 자포니쿰 USDA 110 유래의 Nodj, 서열번호: 206의 대장균 K-12 MG1655 유래의 malE, 서열번호: 208의 대장균 K-12 MG1655 유래의 malK, 서열번호: 214의 대장균 K-12 MG1655 유래의 araF, 서열번호: 216의 대장균 K-12 MG1655 유래의 xylF, 또는 서열번호: 218의 대장균 K-12 MG1655 유래의 ytfQ, 또는 상기 P-P-결합-가수분해-유도 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 28, 30, 36, 44, 68, 72, 70, 74, 76, 78, 80, 82, 84, 174, 176, 196, 178, 180, 194, 188, 190, 206, 208, 214, 216, 또는 218 각각의 상기 LmrA, OppF, Wzk, Blon_2475, LpsE, TolC, MsbA, Wzm, Wzt, Nodj, malE, malK, araF, xylF 또는 ytfQ 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질로부터 선택되는 것인 숙주 세포.
  55. 청구항 50 또는 51에 있어서, 상기 추정 수송 단백질은 서열번호: 56의 헬리코박터 필로리 유래의 사이토크롬 C 생합성 단백질, 서열번호: 90의 클로스트리디움 종 CAG: 1013 유래의 CutC, 서열번호: 92의 오도리박터 스플란크니쿠스 DSM 20712 유래의 CutC, 서열번호: 94의 미추아리아 종 PDC51 유래의 CutC, 서열번호: 96의 프레보텔라 인테르메디아 ATCC 25611 (DSM 20706) 유래의 CutC, 서열번호: 190의 대장균 K12 MG1655 유래의 ybjM, 서열번호: 192의 엔테로박테리아세에 박테리움 ENNIH1 유래의 ybjM, 또는 상기 추정 수송 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 56, 90, 92, 94, 96, 190 또는 192 각각의 상기 CytC, CutC 또는 ybjM 막 단백질 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질로부터 선택되는 것인 숙주 세포.
  56. 청구항 50 또는 51에 있어서, 상기 β-배럴 포린은 서열번호: 34의 대장균 K12 MG1655 유래의 Wza 또는 서열번호: 204의 대장균 K12 MG1655 유래의 lamB, 또는 상기 Wza 또는 lamB 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 34 또는 204 각각의 상기 Wza 또는 lamB 막 단백질 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 서열로부터 선택되는 것인 숙주 세포.
  57. 청구항 50 또는 51에 있어서, 상기 보조 수송 단백질은 서열번호: 88의 서모토가 마리티마 (균주 ATCC 43589 / MSB8 / DSM 3109 / JCM 10099) 유래의 Wzc, 또는 이의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 88의 상기 Wzc 막 단백질에 대해 적어도 80%의 서열 동일성을 갖는 서열로부터 선택되는 것인 숙주 세포.
  58. 청구항 50 또는 51에 있어서, 상기 포스포트란스퍼-유도 그룹 전위인자는 서열번호: 210의 대장균 K12 MG1655 유래의 nagE 또는 서열번호: 212의 대장균 K12 MG1655 유래의 srlB, 또는 상기 nagE 또는 srlB 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 210 또는 212 각각의 상기 nagE 또는 srlB 막 단백질 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 서열로부터 선택되는 것인 숙주 세포.
  59. 청구항 49 내지 58 중 어느 한 항에 있어서, 상기 막 단백질은 세포벽의 외막을 가로질러 화합물의 수송에 관여하는 수송체 단백질인 것인 세포.
  60. 청구항 49 내지 59 중 어느 한 항에 있어서, 상기 세포가 배지에서 안정하게 배양되는 것인 세포.
  61. 청구항 49 내지 60 중 어느 한 항에 있어서, 상기 세포는 미생물, 식물 또는 동물 세포로 구성된 그룹으로부터 선택되고, 바람직하게는 상기 미생물은 박테리아, 진균 또는 효모이며, 바람직하게는 상기 식물은 벼, 목화, 유채, 대두, 옥수수 또는 옥수수 식물이고, 바람직하게는 상기 동물은 곤충, 어류, 조류 또는 비-인간 포유동물인 것인 세포.
  62. 청구항 61에 있어서, 상기 세포는 대장균 세포인 것인 숙주 세포.
  63. 청구항 49 내지 62 중 어느 한 항에 있어서, 상기 세포는 푸코실락토스 합성에 관여하고/하거나 이의 합성에 필요한, 적어도 부분적으로 불활성화된, 모노사카라이드, 디사카라이드 또는 올리고사카라이드인, 선택된 모노사카라이드, 디사카라이드 또는 올리고사카라이드에 대한 이화 경로 (catabolic pathway)를 포함하는 것인 세포.
  64. 청구항 49 내지 63 중 어느 한 항에 있어서, 상기 푸코실락토스는 2'-푸코실락토스, 3-푸코실락토스 또는 디푸코실락토스인 것인 세포.
  65. 푸코실락토스를 제조하는 방법으로서,
    a) 청구항 49 내지 64 중 어느 한 항에 따른 세포를 제공하는 단계,
    b) 상기 푸코실락토스의 생성을 허용하는 조건 하에 배지에서 상기 세포를 배양하는 단계,
    c) 상기 푸코실락토스를 배양으로부터 분리하는 단계를 포함하는 것인 방법.
  66. 푸코실락토스의 발효 생성에서 푸코실락토스 수송을 위한, 청구항 1 내지 38 중 어느 한 항에 정의된 막 단백질들의 그룹으로부터 선택된 막 단백질의 용도.
  67. 푸코실락토스의 제조를 위한, 청구항 49 내지 64 중 어느 한 항에 따른 세포의 용도.
  68. 청구항 67에 있어서, 상기 푸코실락토스는 2'-푸코실락토스, 3-푸코실락토스 또는 디푸코실락토스인 것인 세포의 용도.
KR1020227005675A 2019-07-19 2020-07-16 숙주 세포에서 푸코실락토스의 제조 KR20220035247A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP19187404 2019-07-19
EP19187404.9 2019-07-19
PCT/EP2020/070209 WO2021013708A1 (en) 2019-07-19 2020-07-16 Production of fucosyllactose in host cells

Publications (1)

Publication Number Publication Date
KR20220035247A true KR20220035247A (ko) 2022-03-21

Family

ID=67438239

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227005675A KR20220035247A (ko) 2019-07-19 2020-07-16 숙주 세포에서 푸코실락토스의 제조

Country Status (9)

Country Link
US (1) US20220259631A1 (ko)
EP (1) EP3999635A1 (ko)
JP (1) JP2022541287A (ko)
KR (1) KR20220035247A (ko)
CN (1) CN114466934A (ko)
AU (1) AU2020317557A1 (ko)
BR (1) BR112022000394A2 (ko)
CA (1) CA3147502A1 (ko)
WO (1) WO2021013708A1 (ko)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022168991A1 (ja) * 2021-02-08 2022-08-11 協和発酵バイオ株式会社 フコース含有糖質の輸送活性を有する蛋白質及びフコース含有糖質の製造法
WO2023120615A1 (ja) * 2021-12-21 2023-06-29 協和発酵バイオ株式会社 コア3糖としてラクト-n-トリオースiiを含む糖質の製造方法および該糖質の結晶の製造方法
WO2024017987A1 (en) * 2022-07-20 2024-01-25 Inbiose N.V. Production of oligosaccharides in host cells
WO2024089131A1 (en) 2022-10-25 2024-05-02 Inbiose N.V. Saccharide importers for lacto-n-triose
CN116179461B (zh) * 2023-02-16 2023-12-15 苏州一兮生物技术有限公司 一种用于生产gdp-l-岩藻糖的基因工程菌及其应用
CN117467594B (zh) * 2023-12-26 2024-04-09 态创生物科技(广州)有限公司 一种生产2'-岩藻糖基乳糖的基因工程菌及其应用

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2517602C2 (ru) * 2009-06-08 2014-05-27 Йенневайн Биотехнологи Гмбх Синтез нмо
DE202011111144U1 (de) 2010-07-12 2021-02-10 Inbiose N.V. Metabolisch veränderte Organismen für die Herstellung von Bioprodukten mit Mehrwert
CN107189954A (zh) * 2011-11-30 2017-09-22 帝斯曼知识产权资产管理有限公司 由乙酸和甘油生产乙醇的工程化酵母菌株
RU2021109889A (ru) 2014-11-14 2021-05-06 Инбиос Н.В. Мутантные микроорганизмы, устойчивые к гибели под действием лактозы
EP3141610A1 (en) * 2015-09-12 2017-03-15 Jennewein Biotechnologie GmbH Production of human milk oligosaccharides in microbial hosts with engineered import / export
US20190160082A1 (en) * 2016-08-04 2019-05-30 Nestec S.A. Nutritional compositions with 2fl and lnnt for use in preventing and/or treating non-rotavirus diarrhea by acting on the gut microbiota dysbiosis
ES2856749T3 (es) * 2016-10-29 2021-09-28 Chr Hansen Hmo Gmbh Proceso para la producción de oligosacáridos fucosilados
EP3425052A1 (en) * 2017-07-07 2019-01-09 Jennewein Biotechnologie GmbH Fucosyltransferases and their use in producing fucosylated oligosaccharides
EP3784791A1 (en) 2018-04-23 2021-03-03 DuPont Nutrition Biosciences ApS Increasing export of 2' fucosyllactose from microbial cells through the expression of a heterologous nucleic acid

Also Published As

Publication number Publication date
CA3147502A1 (en) 2021-01-28
AU2020317557A1 (en) 2022-03-10
EP3999635A1 (en) 2022-05-25
BR112022000394A2 (pt) 2022-03-03
JP2022541287A (ja) 2022-09-22
CN114466934A (zh) 2022-05-10
WO2021013708A1 (en) 2021-01-28
US20220259631A1 (en) 2022-08-18

Similar Documents

Publication Publication Date Title
KR20220035247A (ko) 숙주 세포에서 푸코실락토스의 제조
US20220002773A1 (en) Production of 3-fucosyllactose and lactose converting alpha-1,3-fucosyltransferase enzymes
CN110869508A (zh) 岩藻糖基转移酶及其在生产岩藻糖基化低聚糖中的用途
CN111133112A (zh) 唾液酸转移酶及其在生产唾液酸化低聚糖中的用途
US20230212628A1 (en) Production of Sialylated Oligosaccharide in Host Cells
WO2022034073A1 (en) Production of fucosylated lactose structures by a cell
JP2023506287A (ja) ラクトースを変換するアルファ-1,2-フコシルトランスフェラーゼ酵素
KR20210097723A (ko) 발효에 의한 1,5-디아미노펜탄의 생산을 위한 조작된 생합성 경로
KR20230134558A (ko) 숙주 세포에서 코어 구조로서 ln3을 포함하는 올리고당의생산
TW202221129A (zh) 雙醣及/或寡醣的細胞生產
CN115175994A (zh) 组氨酸、嘌呤途径代谢物和质粒dna的增强的产生
CN115605589A (zh) 改进的用于生产类异戊二烯的方法
KR20220080178A (ko) 숙주 세포에서 바이오산물의 생산
JP2015142549A (ja) フルクトースが付加された糖質の製造方法
CN111548978B (zh) 一种产甘露聚糖的枯草芽孢杆菌及其应用
TW202221137A (zh) 藉由細胞生產岩藻醣化的乳糖結構
CN116635401A (zh) 具有改进性能的基因修饰的甲基菌
DK202200591A1 (en) New sialyltransferases for in vivo synthesis of lst-c
WO2024044761A2 (en) β-1,3-GALACTOSYLTRANSFERASES FOR USE IN THE BIOSYNTHESIS OF OLIGOSACCHARIDES