KR20230134558A - 숙주 세포에서 코어 구조로서 ln3을 포함하는 올리고당의생산 - Google Patents

숙주 세포에서 코어 구조로서 ln3을 포함하는 올리고당의생산 Download PDF

Info

Publication number
KR20230134558A
KR20230134558A KR1020237028215A KR20237028215A KR20230134558A KR 20230134558 A KR20230134558 A KR 20230134558A KR 1020237028215 A KR1020237028215 A KR 1020237028215A KR 20237028215 A KR20237028215 A KR 20237028215A KR 20230134558 A KR20230134558 A KR 20230134558A
Authority
KR
South Korea
Prior art keywords
seq
membrane protein
lacto
mdfa
sequence
Prior art date
Application number
KR1020237028215A
Other languages
English (en)
Inventor
소피 에세르트
유리 보프레
헤르트 페터르스
안널리스 페르카우테런
Original Assignee
인바이오스 엔.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 인바이오스 엔.브이. filed Critical 인바이오스 엔.브이.
Publication of KR20230134558A publication Critical patent/KR20230134558A/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/18Preparation of compounds containing saccharide radicals produced by the action of a glycosyl transferase, e.g. alpha-, beta- or gamma-cyclodextrins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/01Hexosyltransferases (2.4.1)
    • C12Y204/01094Protein N-acetylglucosaminyltransferase (2.4.1.94)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Saccharide Compounds (AREA)
  • Peptides Or Proteins (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

본 발명은 합성 생물학 및 대사 공학의 기술 분야이다. 보다 특히, 본 발명은 대사적으로 조작된 숙주 세포 배양의 기술 분야이다. 본 발명은 유전자 조작된 세포와 배양에 의한 코어 삼당류로서 락토-N-트리오스 (LN3; GlcNAc-베타1,3-Gal-베타1,4-Glc)를 포함하는 올리고당을 제조하는 방법을 비롯하여, 방법에서 사용되는 유전자 조작된 세포를 기술한다. 유전자 조작된 세포는 코어 삼당류로서 LN3을 포함하는 올리고당의 합성에 관여되는 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 및 글리코실트랜스퍼라제를 코딩하는 적어도 하나의 핵산 서열 및 막 단백질을 발현하는 적어도 하나의 핵산 서열을 포함한다. 더 나아가서, 본 발명은 배양으로부터 코어 삼당류로서 LN3을 포함하는 상기 올리고당의 정제를 제공한다.

Description

숙주 세포에서 코어 구조로서 LN3을 포함하는 올리고당의 생산
본 발명은 합성 생물학 및 대사 공학의 기술 분야이다. 보다 특히, 본 발명은 대사적으로 조작된 숙주 세포 배양의 기술 분야이다. 본 발명은 유전자 조작된 세포와 배양에 의해서 코어 삼당류로서 락토-N-트리오스 (LN3; GlcNAc-베타1,3-Gal-베타1,4-Glc)를 포함하는 올리고당을 제조하는 방법을 비롯하여, 방법에서 사용되는 유전자 조작된 세포를 기술한다. 유전자 조작된 세포는 코어 삼당류로서 LN3을 포함하는 올리고당의 합성에 관여되는 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 및 글리코실트랜스퍼라제를 코딩하는 적어도 하나의 핵산 서열 및 막 단백질을 발현하는 적어도 하나의 핵산 서열을 포함한다. 더 나아가서, 본 발명은 배양으로부터 코어 삼당류로서 LN3을 포함하는 상기 올리고당의 정제를 제공한다.
오늘날, 인간 모유 올리고당 (HMO) 패밀리에 속하는 80개 초과의 화합물이 구조적으로 특징규명되었다. 이들 HMO는 프리바이오틱으로서 기능하는 복합 올리고당 클래스를 나타낸다. 추가적으로, 상피 에피토프에 대한 HMO의 구조적 상동성은 박테리아 병원체에 대한 보호 성질을 설명한다. 유아 위장관 내에서, HMO는 선택된 박테리아 균주의 성장에 선택적으로 영양분을 공급하고, 따라서 모유-수유된 유아에서 고유한 장내 마이크로바이오타의 발달에 대비한다. 일부 이들 HMO는 특정 생물학적 활성을 나타낼 가능성이 가장 큰 GlcNAc-베타1,3-Gal-베타1,4-Glc (락토-N-트리오스, LN3)의 코어 구조를 갖는 특정 올리고당 구조의 존재를 요구한다. 이들 올리고당의 생산은 N-아세틸글루코사민 (GlcNAc) 잔기를 UDP-GlcNAc 도너로부터 락토스 억셉터로 전달하여서 LN3을 합성하는 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제의 작용 및 LN3 코어 삼당류를 추가로 변형시키는 다른 글리코실트랜스퍼라제의 추가 작용을 필요로 한다. 미생물의 발효적 생산에서, 코어 삼당류로서 LN3을 갖는 올리고당은 많은 경우에 산업적 생산 숙주의 세포내에서 생산된다. 세포에서 올리고당 생산의 진정한 어려움으로서 당분야에서 확인된 한가지 문제는 생산된 올리고당의 세포내 농후화 및 그들 추출이다. 세포내 농후화는 원하는 올리고당의 생산에 대한 생산물-억제 효과의 원인이 되는 것으로 여겨진다. 합성은 느려질 수 있거나 또는 원하는 올리고당이 세포독성 농도에 도달하여 물질대사 정지 또는 심지어 세포 용해를 일으킬 수 있다.
본 발명의 목적은 코어 삼당류로서 LN3을 갖는 올리고당을 효율적으로, 시간 및 비용 효율적인 방식으로 생산할 수 있고, 높은 양의 원하는 생산물을 산출하는 도구 및 방법을 제공하는 것이다.
본 발명에 따라서, 이러한 목적 및 다른 목적은 코어 삼당류로서 LN3을 갖는 올리고당의 생산을 위한 방법 및 세포를 제공하여 달성되고, 세포는 코어 삼당류로서 LN3을 갖는 올리고당의 생산을 위해서 유전자 변형되고 코어 삼당류로서 LN3을 갖는 올리고당의 합성에 관여되는 효소를 코딩하는 적어도 하나의 핵산 서열을 포함하고, 보다 특히 세포는 LN3을 합성하는 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 및 코어 삼당류로서 LN3을 갖는 올리고당을 합성하는 적어도 하나의 다른 글리코실트랜스퍼라제를 코딩하는 핵산 서열을 포함한다. 더 나아가서 세포는 또한 막 단백질을 발현하고, 보다 특히 세포는 더 나아가서 또한 본 발명에 따른 코어 삼당류로서 LN3을 갖는 올리고당의 생산을 개선시키고/시키거나 유출을 가능하게 하고/하거나 증강시키는 것으로 이전에 알려지지 않은 막 단백질을 발현한다.
놀랍게도, 본 발명에서 사용되는 막 단백질은 새롭게 확인된 막 단백질을 제공하고, 보다 특히 본 발명은 코어 삼당류로서 LN3을 갖는 올리고당의 수송을 가능하게 하고, 상기 코어 삼당류로서 LN3을 갖는 올리고당의 발효적 생산에 대해 긍정적인 효과를 가지며, 상기 코어 삼당류로서 LN3을 갖는 올리고당을 생산하는 숙주 세포를 유전자 조작하는데 사용될 때 더 양호한 수율, 생산성, 비생산성 및/또는 성장 속도를 제공하는 것으로 이전에 알려지지 않은 새롭게 확인된 막 단백질을 제공한다는 것을 이제 확인하였다.
본 발명은 또한 코어 삼당류로서 LN3을 갖는 올리고당을 제조하기 위한 방법을 제공한다. 코어 삼당류로서 LN3을 갖는 올리고당은 본 발명의 막 단백질을 포함하는 숙주 세포에 의해 수득된다.
정의
본 발명 및 이의 다양한 구현예를 설명하기 위해서 본 명세서에서 사용되는 단어는 그들의 일반적으로 정의된 뜻의 의미에서 이해되어야 할뿐만 아니라, 본 명세서 구조에서 특별한 정의를 통해서 일반적으로 정의되는 뜻의 범위를 벗어나는 물질 또는 행위를 포함하는 것으로 이해되어야 한다. 따라서, 본 명세서의 상황에서 성분이 하나 초과의 뜻을 포함하는 것으로 이해될 수 있으면, 청구항에서 이의 사용은 명세서 및 단어 그 자체에 의해 뒷받침되는 모든 가능한 뜻에 대해 포괄적인 것으로 이해되어야만 한다.
본 명세서에 개시되는 본 발명의 다양한 양태 및 양태의 구현예는 본 명세서에서 특별히 설명되는 순서 및 상황을 비롯하여, 임의 순서 및 이의 임의 조합을 포함하는 것으로 이해해야 한다. 상황에서 요구할 때마다, 단수로 사용되는 모든 단어는 복수를 포함하는 것으로 간주되고 그 반대도 마찬가지이다. 달리 정의하지 않으면, 본 명세서에서 사용되는 모든 기술 및 과학 용어는 일반적으로 본 발명이 속하는 분야의 당업자가 통상적으로 이해하는 바와 동일한 의미를 갖는다. 일반적으로, 본 명세서에서 사용되는 명명법 및 본 명세서에 기술된 세포 배양, 분자 유전학, 유기 화학 및 핵산 화학 및 혼성화에서의 실험 절차는 당분야에서 충분히 공지되어서 일반적으로 적용된다. 표준 기술이 핵산 및 펩티드 합성에 사용된다. 일반적으로, 효소 반응 및 정제 단계는 제조사 사양에 따라서 수행된다.
도면 및 명세서에서, 본 발명의 구현예들이 개시되어 있고, 특정한 용어가 적용되지만, 용어들은 설명적인 의미로만 사용되고 제한의 목적이 아니고, 본 발명의 범주는 하기 청구항에 기재된다. 예시된 구현예는 예시의 목적으로만 기재되었고 본 발명을 제한하는 것으로 간주해서는 안된다는 것을 이해해야 한다. 변경, 다른 구현예, 개선, 상세사항, 및 사용은 균등론을 포함하여, 특허법에 따라서 해석되는, 청구항에 의해서만 제한되는, 본 발명의 범주 내에서 본 발명의 문자 및 정신과 일관되게 이루어질 수 있다는 것은 당업자에게 자명할 것이다. 하기의 청구항에서, 청구 범위 단계를 지정하는데 사용되는 참조 부호는 단지 설명의 편이를 위해 제공되고, 단계를 수행하기 위한 임의의 특정 순서를 의미하려는 의도가 아니다.
이 문헌 및 이의 청구항에서, 동사 "포함하다", "가지다" 및 "함유하다", 및 그들 활용형은 그 단어 뒤에 오는 항목을 포함하지만, 특별히 언급되지 않은 항목을 배제하지는 않는다는 것을 의미하기 위해 그들의 비제한적인 의미로 사용된다. 동사 "본질적으로 이루어진다"는 특별히 확인되지 않은 것 이외에 추가 성분(들)이 존재할 수 있다는 것을 의미하고, 상기 추가 성분(들)은 본 발명의 고유한 특징을 변경시키지 않는다. 본 출원 및 청구항 전반에서, 특별히 달리 명시하지 않으면, 동사 "포함하다", "가지다" 및 "함유하다" 및 그들 활용형은 바람직하게 "이루어지다" (및 이의 활용형) 또는 "본질적으로 이루어지다" (및 이의 활용형)으로 대체될 수 있고, 그 반대도 마찬가지이다. 또한, 부정 관사 "한" 또는 "하나"에 의한 성분에 대한 참조는 하나 및 오직 하나의 성분이 존재하는 것을 문맥에서 명확하게 요구하지 않으면, 하나 초과의 성분이 존재할 가능성을 배제하지 않는다. 따라서, 부정 관사 "한" 또는 "하나"는 일반적으로 "적어도 하나"를 의미한다.
본 발명에 따라서, 용어 "폴리뉴클레오티드(들)"는 일반적으로 비변형된 RNA 또는 DNA 또는 변형된 RNA 또는 DNA일 수 있는, 임의의 폴리리보뉴클레오티드 또는 폴리데옥시리보뉴클레오티드를 의미한다. "폴리뉴클레오티드(들)"는 제한없이, 단일-가닥 및 이중-가닥 DNA, 단일-가닥 및 이중-가닥 영역 또는 단일-가닥, 이중-가닥 및 삼중-가닥 영역의 혼합물인 DNA, 단일-가닥 및 이중-가닥 RNA, 및 단일-가닥 및 이중-가닥 영역의 혼합물인 RNA, 단일-가닥일 수 있거나, 또는 보다 전형적으로 이중-가닥, 또는 삼중-가닥 영역, 또는 단일-가닥 및 이중-가닥 영역의 혼합물일 수 있는 DNA 및 RNA를 포함하는 하이브리드 분자를 포함한다. 또한, 본 명세서에서 사용되는, "폴리뉴클레오티드"는 RNA 또는 DNA 또는 RNA 및 DNA 둘 모두를 포함하는 삼중-가닥 영역을 의미한다. 이러한 영역에서 가닥은 동일한 분자 또는 상이한 분자 유래일 수 있다. 영역은 하나 이상의 분자 모두를 포함할 수 있지만, 보다 전형적으로 분자 중 일부의 영역만을 포함한다. 삼중-나선 영역의 분자 중 하나는 종종 올리고뉴클레오티드이다. 본 명세서에서 사용되는, 용어 "폴리뉴클레오티드(들)"는 또한 하나 이상의 변형된 염기를 함유하는 상기 기술된 바와 같은 DNA 또는 RNA를 포함한다. 따라서, 안정성 또는 다른 이유로 변형된 골격을 갖는 DNA 또는 RNA는 본 발명에 따른 "폴리뉴클레오티드(들)"이다. 또한, 특정한 염기, 예컨대, 이노신, 또는 변형된 염기, 예컨대 트리틸화된 염기를 포함하는 DNA 또는 RNA는 용어 "폴리뉴클레오티드"에 포괄되는 것으로 이해한다. 매우 다양한 변형이 DNA 및 RNA에 만들어져서 당업자에게 공지된 많은 유용한 목적을 제공한다는 것을 이해할 것이다. 본 명세서에서 적용되는 바와 같은 용어 "폴리뉴클레오티드(들)"는 예를 들어, 단순 및 복합 세포를 포함한, 세포 및 바이러스의 특징적인 DNA 및 RNA의 화학적 형태를 비롯하여, 폴리뉴클레오티드의 화학적, 효소적, 또는 대사적으로 변형된 형태를 포괄한다. 용어 "폴리뉴클레오티드(들)"는 또한 종종 올리고뉴클레오티드(들)라고 하는 짧은 폴리뉴클레오티드를 포괄한다.
"폴리펩티드(들)"는 펩티드 결합 또는 변형된 펩티드 결합을 통해서 서로에게 연결된 둘 이상의 아미노산을 포함하는 임의의 펩티드 또는 단백질을 의미한다. "폴리펩티드(들)"는 일반적으로 펩티드, 올리고펩티드 및 올리고머라고 하는, 짧은 사슬과, 일반적으로 단백질이라고 하는 보다 긴 사슬을 의미한다. 폴리펩티드는 20개 유전자 코딩되는 아미노산 이외의 아미노산을 함유할 수 있다. "폴리펩티드(들)"는 천연 과정, 예컨대 프로세싱 및 다른 번역후 변형에 의해서 뿐만 아니라, 또한 화학적 변형 기술에 의해서 변형된 것들을 포함한다. 이러한 변형은 기초 교재 및 보다 상세한 논문을 비롯하여, 방대한 연구 문헌에서 충분히 설명되고, 당업자에게 충분히 공지되어 있다. 동일 유형의 변형이 소정 폴리펩티드의 몇개 부위에서 동일하거나 또는 다양한 정도로 존재할 수 있다. 더 나아가서, 소정 펩티드는 많은 유형의 변형을 함유할 수 있다. 변형은 펩티드 골격, 아미노산 측쇄, 및 아미노 또는 카르복실 말단을 포함하여, 폴리펩티드의 어느 곳에서도 발생될 수 있다. 변형은 예를 들어, 아세틸화, 아실화, ADP-리보실화, 아미드화, 플라빈의 공유 부착, 헴 모이어티의 공유 부착, 뉴클레오티드 또는 뉴클레오티드 유도체의 공유 부착, 지질 또는 지질 유도체의 공유 부착, 포스파티딜이노시톨의 공유 부착, 가교 결합, 고리화, 디술피드 결합 형성, 탈메틸화, 공유 가교 결합의 형성, 파이로글루타메이트의 형성, 포르밀화, 감마-카르복실화, 글리코실화, GPI 앵커 형성, 히드록실화, 요오드화, 메틸화, 미리스토일화, 산화, 단백질분해 프로세싱, 인산화, 프레닐화, 라세미화, 지질 부착, 술페이트화, 글루탐산 잔기의 감마-카르복실화, 히드록실화 및 ADP-리보실화, 헬레노일화, 단백질에 아미노산의 전달-RNA 매개 첨가, 예컨대, 아르기닐화, 및 유비퀴틴화를 포함한다. 폴리펩티드는 분지되거나 또는 분지되지 않은, 환형 또는 분지형일 수 있다. 환형, 분지형 및 분지된 원형 폴리펩티드는 번역 후 천연 과정에 의할 수 있고, 또한 완전 합성 방법으로도 만들어질 수 있다.
"단리된"은 이의 천연 상태로부터 "인간의 손에 의해" 변경된 것을 의미하는데, 다시 말해서, 자연에서 발생된 경우에, 이의 본래 환경으로부터 변화 또는 제거되었거나, 또는 둘 모두이다. 예를 들어, 살아있는 유기체에 천연적으로 존재하는 폴리뉴클레오티드 또는 폴리펩티드는 "단리된" 것이 아니지만, 본 명세서에서 이 용어가 적용되는 바와 같이, 이의 천연 상태의 공존 물질로부터 분리된 동일한 폴리뉴클레오티드 또는 폴리펩티드는 "단리된" 것이다. 유사하게, "합성"은 본 명세서에서 이 용어가 사용되는 바와 같이, 천연 공급원으로부터 직접적으로 단리된 것이 아니라 합성적으로 생성된 임의 서열을 의미한다. "합성된"은, 본 명세서에서 이 용어가 사용되는 바와 같이, 천연 공급원으로부터 직접적으로 단리된 것이 아니라 임의의 합성적으로 생성된 서열을 의미한다.
"재조합"은 한 종으로부터 유래한 유전자를 상이한 종의 숙주 유기체의 세포로 이식하거나 또는 스플라이싱하여서 제조된 유전자 조작된 DNA를 의미한다. 이러한 DNA는 숙주의 유전적 구성의 일부가 되어서 복제된다.
본 발명의 상황 내에서 용어 "내생성"은 세포의 천연 부분이고 세포 염색체 내 이의 천연 위치에서 발생되는 임의의 폴리뉴클레오티드, 폴리펩티드 또는 단백질 서열을 의미한다.
폴리뉴클레오티드, 유전자, 핵산, 폴리펩티드, 또는 효소에 대해서 사용될 때 "이종성"은 공급원 유래이거나 또는 숙주 유기체 종 이외의 공급원으로부터 유래되는 폴리뉴클레오티드, 유전자, 핵산, 폴리펩티드, 또는 효소를 의미한다. 대조적으로, "상동성" 폴리뉴클레오티드, 유전자, 핵산, 폴리펩티드, 또는 효소는 숙주 유기체 종으로부터 유래되는 폴리뉴클레오티드, 유전자, 핵산, 폴리펩티드, 또는 효소를 의미하고자 본 명세서에서 사용된다. 유전자 서열을 유지하거나 또는 조작하는데 사용되는 유전자 조절 서열 또는 보조 핵산 서열 (예를 들어, 프로모터, 5' 비번역 영역, 3' 비번역 영역, 폴리A 첨가 서열, 인트론 서열, 스플라이스 부위, 리보솜 결합 부위, 내부 리보솜 진입 서열, 게놈 상동성 영역, 재조합 부위 등)에 대해 언급될 때, "이종성"은 조절 또는 보조 핵산 서열이 구성체, 게놈, 염색체, 또는 에피솜에서 병치되는 유전자와 천연적으로 연관되지 않은 것을 의미한다. 따라서, 이의 천연 상태 (즉, 비-유전자 조작된 유기체의 게놈)에서 작동적으로 연결되지 않은 유전자에 작동적으로 연결된 프로모터는 프로모터가 연결되는 유전자와 동일한 종 (또는 일부 경우에, 동일한 유기체)으로부터 유래될 수 있더라도, 본 명세서에서 "이종성 프로모터"라고 한다.
본 명세서에서 사용되는 용어 "폴리펩티드를 코딩하는 폴리뉴클레오티드"는 본 발명의 폴리펩티드를 코딩하는 서열을 포함하는 폴리뉴클레오티드를 포괄한다. 용어는 또한 코딩 및/또는 비-코딩 서열을 함유할 수도 있는 추가 영역과 함께, (예를 들어, 통합된 파지 또는 삽입 서열 또는 편집에 의해 개재됨) 폴리펩티드를 코딩하는 단일 연속 영역 또는 불연속 영역을 포함하는 폴리뉴클레오티드를 포괄한다.
용어 유전자의 "변형된 발현"은 코어 삼당류로서 LN3을 갖는 올리고당의 생산 과정의 임의 단계에서 상기 유전자의 애샹형 발현과 비교하여 발현의 변화와 관련된다. 상기 변형된 발현은 야생형과 비교하여 더 낮거나 또는 더 높은 발현으로서, 용어 "더 높은 발현"은 또한 내생성 유전자의 경우에 상기 유전자의 "과발현" 또는 야생형 균주에 존재하지 않는 이종성 유전자의 경우에 "발현"으로 정의된다. 더 낮은 발현은 기능성 최종 생산물을 생산하기 위해 "부족한-능력" (즉, 기능성 야생형 유전자와 비교하여 통계적으로 유의하게 '부족한-능력')이 되거나 또는 완전하게 불능 (예컨대, 유전자 녹-아웃)이 되는 방식으로 유전자를 변화시키는데 사용되는 당업자에게 일반적으로 충분히 공지된 기술 (예컨대, siRNA, CrispR, CrispRi, 리콤비니어링, 상동성 재조합, ssDNA 돌연변이유발법, RNAi, miRNA, asRNA, 유전자 돌연변이, 유전자 녹-아웃, 트랜스포존 돌연변이유발법 등의 사용)을 통해서 수득된다. 과발현 또는 발현는 당업자에게 일반적으로 충분히 공지된 기술을 통해서 수득되고, 상기 유전자는 프로모터 서열, 비번역 영역 서열 (리보솜 결합 서열 또는 코작 서열을 함유), 코딩 서열 (예를 들어, 막 단백질 유전자 서열) 및 임의로 전사 종결자가 존재하여, 기능성 활성 단백질의 발현을 일으키는 임의 서열과 관련된 "발현 카세트"의 일부이다. 상기 발현은 항상성이거나 또는 조건적이거나 또는 조절되거나 또는 조율가능하다.
용어 "항상성 발현"은 일정 성장 조건 하에서 RNA 폴리머라제의 서브유닛 (예를 들어, 박테리아 시그마 인자) 이외의 전사 인자에 의해 조절되지 않는 발현으로서 정의된다. 이러한 전사 인자의 비제한적인 예에는 이. 콜라이의 CRP, LacI, ArcA, Cra, IclR, 또는 사카로마이세스 세레비지아에 (Saccharomyces cerevisiae)의 Aft2p, Crz1p, Skn7, 또는 비. 서브틸리스 (B. subtilis)의 DeoR, GntR이 있다. 이들 전사 인자는 특이적 서열에 결합하여서 일정 성장 조건 하에서 발현을 차단할 수 있거나 또는 증강시킬 수 있다. RNA 폴리머라제는 예를 들어 원핵생물 숙주에서 시그마 인자를 통해서, 전사를 개시하기 위한 특이적 서열에 결합한다.
용어 "조절된 발현"은 일정 성장 조건 하에서 RNA 폴리머라제의 서브유닛 (예를 들어, 박테리아 시그마 인자) 이외의 전사 인자에 의해 조절되는 발현으로서 정의된다. 이러한 전사 인자의 예는 상기에 기술되어 있다. 일반적으로 발현 조적은 유도제, 예컨대 제한되지 않지만, IPTG, 아라비노스, 람노스, 푸코스, 알로-락토스 또는 pH 이동, 또는 온도 이동 또는 탄소 고갈 또는 기질 또는 생산된 생성물에 의해 수득된다.
용어 "제어 서열"은 폴리펩티드로 폴리뉴클레오티드 서열의 전사 및 번역을 허용하는, 숙주 세포 전사 및 번역 시스템에 의해 인식되는 서열을 의미한다. 따라서 이러한 DNA 서열은 특정 세포 또는 유기체에서 작동적으로 연결된 코딩 서열의 발현에 필수적이다. 이러한 제어 서열은 프로모터 서열, 리보솜 결합 서열, 샤인 달가르노 서열, 코작 서열, 전사 종결자 서열일 수 있지만, 이에 제한되지 않는다. 예를 들어, 원핵생물에 적합한 제어 서열은 프로모터, 임의로 오퍼레이터 서열, 및 리보솜 결합 부위를 포함한다. 진핵생물 세포는 프로모터, 폴리아데닐화 신호, 및 인핸서를 이용하는 것으로 알려져 있다. 전서열 또는 분비 리더에 대한 DNA는 폴리펩티드의 분비에 관여하는 전단백질로서 발현되는 경우에 폴리펩티드에 대한 DNA에 작동적으로 연결될 수 있고; 프로모터 또는 인핸서는 서열의 전사에 영향을 미치는 경우에 코딩 서열에 작동적으로 연결되거나; 또는 리보솜 결합 부위는 서열의 전사에 미치는 경우에 코딩 서열에 작동적으로 연결되거나; 또는 리보솜 결합 부위는 번역을 촉진하도록 위치되는 경우에 코딩 서열에 작동적으로 연결된다. 상기 제어 서열은 더 나아가서 폴리펩티드로 상기 폴리뉴클레오티드의 전사 또는 번역을 유도하거나 또는 억제하는 유전자 회로를 통해서 또는 유도성 프로모터를 통해서 외부 화학물, 예컨대, 제한없이, IPTG, 아라비노스, 락토스, 알로-락토스, 람노스 또는 푸코스를 사용해 제어될 수 있다.
일반적으로, "작동적으로 연결된"은 연결되는 DNA 서열이 연속적이고, 분비 리더의 경우에, 연속적이고, 판독 상으로 존재한다는 것을 의미한다. 그러나, 인핸서는 연속적일 필요는 없다.
용어 "야생형"은 자연계에서 발생되는 바와 같은 일반적으로 공지된 유전자 또는 표현형 상태를 의미한다.
본 명세서에서 사용되는 용어로서 "변이체(들)"는 기준 폴리뉴클레오티드 또는 폴리펩티드와 각각 상이하지만 필수 성질은 보유하는 폴리뉴클레오티드 또는 폴리펩티드이다. 폴리뉴클레오티드의 전형적인 변이체는 다른, 기준 폴리뉴클레오티드와 뉴클레오티드 서열이 상이하다. 변이체의 뉴클레오티드 서열에서 변화는 기준 폴리뉴클레오티드에 의해 코딩되는 폴리펩티드의 아미노산 서열은 변경시킬 수 있거나 또는 변경시키지 않을 수 있다. 뉴클레오티드 변화는 하기에 논의되는 바와 같이, 기준 서열에 의해 코딩되는 폴리펩티드에 아미노산 치환, 부가, 결실, 융합 및 절두를 일으킬 수 있다. 폴리펩티드의 전형적인 변이체는 다른, 기준 폴리펩티드와 아미노산 서열이 상이하다. 일반적으로, 차이는 기준 폴리펩티드와 변이체의 서열이 전체적으로 밀접하게 유사하고, 많은 영역에서, 동일하도록 제한적이다. 변이체 및 기준 폴리펩티드는 임의 조합의 하나 이상의 치환, 부가, 결실이 아미노산 서열에서 상이할 수 있다. 치환되거나 또는 삽입된 아미노산 잔기는 유전자 코드에 의해 코딩되는 것일 수 있거나 또는 아닐 수도 있다. 폴리뉴클레오티드 또는 폴리펩티드의 변이체는 천연 발생 예컨대 대립유전자 변이체일 수 있거나, 또는 천연적으로 발생되는 것으로 알려지지 않은 변이체일 수 있다. 폴리뉴클레오티드 및 폴리펩티드의 비천연 발생 변이체는 돌연변이유발법 기술에 의해서, 직접 합성에 의해서, 그리고 당업자에게 공지된 다른 재조합 방법에 의해서 만들어질 수 있다.
일부 구현예에서, 본 발명은 본 발명에서 사용되는 막 단백질의 구조를 변형시켜서 기능성 변이체를 만드는 것을 고려한다. 변이체는 아미노산 치환, 결실, 부가, 또는 이의 조합에 의해 제조될 수 있다. 예를 들어, 류신을 이소류신 또는 발린으로, 아스파테이트를 글루타메이트로, 트레오닌을 세린으로 단리된 치환, 또는 아미노산을 구조적으로 관련된 아미노산으로의 유사한 치환 (예를 들어, 보존성 돌연변이)은 최종 분자의 생물학적 활성에 대해 주요한 효과를 갖지 않을 것으로 예상하는 것이 타당하다. 보존성 치환은 그들 측쇄와 관련된 아미노산 패밀리 내에서 일어나는 것이다. 본 발명의 폴리펩티드의 아미노산 서열 변화가 기능성 상동체를 생성시키는지 여부는 변이체없는 세포에 비해서 더 양호한 수율, 생산성, 및/또는 성장 속도를 제공하기 위한 본 발명의 경우에, 야생형 폴리펩티드와 유사한 방식으로 세포에서 반응을 일으키는 변이체 폴리펩티드의 능력을 평가하여 쉽게 결정할 수 있다.
본 명세서에서 사용되는 용어 "기능성 상동체"는 서열 유사성을 갖고 또한 적어도 하나의 기능적 특징, 예컨대, 생화학적 활성을 공유하는 분자를 설명한다. 본 발명의 상황에서, 본 발명에 따른 막 단백질 'Z'의 기능성 상동체 (일반적으로 SEQ ID NO로 표시됨)는 본 발명에 기술된 바와 같은 코어 당류로서 LN3을 갖는 올리고당을 수송할 수 있는 막 단백질을 의미하며, 다시 말해서, 기능성 상동체는 코어 당류로서 LN3을 갖는 올리고당을 수송하는 막 단백질 'Z'의 기능성 특징을 보유한다. 보다 특히, 본 명세서에서 사용되는 "기능성 상동체"는 서열 유사성 (다른 말로, 상동성)을 갖고, 동시에 적어도 하나의 기능적 유사성, 예컨대, 생화학적 활성을 갖는 단백질을 설명한다 (Altenhoff et al., PLoS Comput. Biol. 8 (2012) e1002514).
때때로 기능성 상동체는 오솔로그라고 하며, 여기서 "오솔로그"는 다른 종에서 기준이 되는 유전자 또는 단백질의 기능적으로 동등한 상동성 유전자 또는 단백질을 의미한다. 기능성 상동체는 전형적으로 유사하지만, 반드시 동일하지는 않은 정도로 동일한 특징을 일으키게 된다. 기능적으로 상동성인 단백질은 한 상동체에 의해 생성되는 정량적 측정이 다른 것의 적어도 10%; 보다 전형적으로, 적어도 20%, 약 30%와 약 40% 사이; 예를 들어, 약 50%와 약 60% 사이; 약 70%와 약 80% 사이; 또는 약 90%와 약 95% 사이; 약 98%와 약 100% 사이, 또는 본래 분자에 의해 생성되는 것의 100% 초과인 동일한 특징을 제공한다. 따라서, 분자가 효소적 활성을 갖는 경우에, 기능성 상동체는 본래 효소와 비교하여 상기-언급된 %의 효소적 활성을 갖게 된다. 분자가 DNA-결합 분자 (예를 들어, 폴리펩티드)인 경우에, 상동체는 본래 분자와 비교하여 결합된 분자의 중량으로 측정하여 상기-언급된 %의 결합 친화성을 갖게 된다.
기능성 상동체 및 기준 폴리펩티드는 천연 발생 폴리펩티드일 수 있고, 서열 유사성은 수렴 또는 분기 진화적 사건에 기인할 수 있다.
기능성 상동체는 뉴클레오티드 및 폴리펩티드 서열 정렬의 분석으로 확인될 수 있다. 예를 들어, 뉴클레오티드 또는 폴리펩티드 서열의 데이터베이스 상에서 문의의 수행은 생물량-조절 폴리펩티드의 상동체를 확인할 수 있다. 서열 분석은 기준 서열로서 생물랑-조절 폴리펩티드의 아미노산 서열을 사용하여 비-중복 데이터베이스의 BLAST, 상호 BLAST, 또는 PSI-BLAST 주석을 포함할 수 있다. 아미노산 서열은 일부 예에서, 뉴클레오티드 서열로부터 추론된다. 전형적으로, 40% 초과의 서열 동일성을 갖는 데이터베이스의 폴리펩티드는 생물량-조절 폴리펩티드로서 적합성에 대한 추가 평가를 위한 후보이다. 아미노산 서열 유사성은 보존성 아미노산 치환, 예컨대, 한 소수성 잔기의 다른 것으로의 치환 또는 한 극성 잔기의 다른 것으로의 치환을 허용한다. 원하는 경우에, 이러한 후보의 수동 검사가 추가 평가하려는 후보의 수를 줄이기 위해 수행될 수 있다. 수동 검사는 생산성-조절 폴리펩티드에 존재하는 도메인, 예를 들어, 보존된 기능성 도메인을 갖는 것으로 보이는 후보를 선택하여 수행될 수 있다.
폴리뉴클레오티드에 대한, "단편"은 폴리뉴클레오티드 분자의 클론 또는 임의 부분, 특히 이용가능한, 기능성 특징을 보유하는 폴리뉴클레오티드의 일부를 의미한다. 유용한 단편은 복제, 전사 또는 번역의 조절에서 또는 혼성화 또는 증폭 기술에서 사용될 수 있는 올리고뉴클레오티드 및 폴리뉴클레오티드를 포함한다. "폴리뉴클레오티드 단편"은 폴리뉴클레오티드의 임의의 하위서열, 전형적으로 본 명세서에 제공되는 임의 서열의, 적어도 약 9 연속 뉴클레오티드, 예를 들어, 적어도 약 30 뉴클레오티드 또는 적어도 약 50 뉴클레오티드를 의미한다. 예시적인 단편은 추가적으로 또는 대안적으로 폴리펩티드의 보존된 패밀리 도메인을 코딩하는 영역을 포함하거나, 그로 본질적으로 이루어지거나, 또는 그로 이루어지는 단편을 포함할 수 있다.
예시적인 단편은 추가적으로 또는 대안적으로 폴리펩티드의 보존된 도메인을 포함하는 단편을 포함할 수 있다.
단편은 추가적으로 또는 대안적으로 폴리펩티드 및 단백질 분자의 하위서열, 또는 폴리펩티드의 하위서열을 포함할 수 있다. 일부 경우에, 단편 또는 도메인은 온전한 폴리펩티드와 실질적으로 동일한 방식으로, 또는 유사한 정도까지, 온전한 폴리펩티드의 적어도 하나의 생물학적 기능을 수행하는 폴리펩티드의 하위서열이다. 예를 들어, 폴리펩티드 단편은 인식가능한 구조적 모티프 또는 기능적 도메인 예컨대, DNA-결합 부위 또는 DNA 프로모터 영역에 결합하는 도메인, 활성화 도메인, 또는 단백질-단백질 상호작용을 위한 도메인을 포함할 수 있고, 전사를 개시할 수 있다. 단편은 3 아미노산 잔기만큼 작은 크기부터 온전한 폴리펩티드의 전체 길이까지, 예를 들어, 적어도 약 20 아미노산 잔기 길이, 예를 들어, 적어도 약 30 아미노산 잔기 길이로 다양할 수 있다. 우선적으로, 단편은 유래되는 폴리펩티드의 적어도 하나의 성질 또는 활성을 갖는 기능성 단편이고, 예컨대, 예를 들어, 단편은 폴리펩티드의 기능성 도메인 또는 보존성 도메인을 포함할 수 있다. 따라서, 본 발명의 상황에서, 본 발명에 따른 막 단백질 'Z'의 기능성 단편 (일반적으로, SEQ ID NO로 표시됨)은 코어 당류로서 LN3을 갖는 올리고당을 수송하는 막 단백질 'Z'의 기능적 특징을 보유하는 단편을 의미한다. 도메인은 예를 들어 Pfam (El-Gebali et al., Nucleic Acids Res. 47 (2019) D427-D432), IPR (InterPro 도메인) (Mitchell et al., Nucleic Acids Res. 47 (2019) D351-D360), 단백질 핑거프린트 도메인 (PRINTS) (Attwood et al., Nucleic Acids Res. 31 (2003) 400-402), SUBFAM 도메인 (Gough et al., J. Mol. Biol. 313 (2001) 903-919), TIGRFAM 도메인 (Selengut et al., Nucleic Acids Res. 35 (2007) D260-D264), 보존된 도메인 데이터베이스 (CDD) 지정 (https://www.ncbi.nlm.nih.gov/cdd) (Lu et al., Nucleic Acids Res. 48 (2020) D265-D268), 또는 PTHR 도메인 (http://www.pantherdb.org) (Mi et al., Nucleic Acids. Res. 41 (2013) D377-D386; Thomas et al., Genome Research 13 (2003) 2129-2141)에 의해 특징규명될 수 있다. Pfam 32.0 (2018년 9월 배포), CDD v3.17 (2019년 4월 3일 배포), eggnogdb 4.5.1 (2016년 9월 배포), InterPro 75.0 (2019년 7월 4일 배포) 및 TCDB (2019년 6월 17일 배포)를 포함하는 본 명세서에서 사용되는 데이터베이스 경우에, 각 데이터베이스는 각 배포시에 고정되고 변화되지 않는다는 것을 당업자는 이해해야 한다. 특정 데이터베이스의 내용이 변화되면, 이러한 특정 데이터베이스는 새로운 배포일과 새로운 배포 형태를 받는다. 그들 해당 배포일 및 이들 특정 배포일에 주석달린 특정 내용을 갖는 각 데이터베이스에 대한 모든 배포 형태가 입수가능하고 당업자에게 공지되어 있다.
이와 같이, 폴리펩티드 SEQ ID NO의 단편은 바람직하게 상기 폴리펩티드 SEQ ID NO로부터의 연속 아미노산 잔기의 양을 포함하거나 또는 그로 이루어지고, 당업자가 통상적으로 평가할 수 있는 온전한 폴리펩티드와 실질적으로 동일한 방식으로, 바람직하게 유사하거나 또는 더 큰 정도까지, 온전한 폴리펩티드의 적어도 하나의 생물학적 기능을 수행하는 폴리펩티드를 의미하고, 연속 아미노산 잔기의 상기 양은 바람직하게 상기 폴리펩티드 SEQ ID NO의 적어도 50.0%, 60.0%, 70.0%, 80.0%, 81.0 %, 82.0%, 83.0%, 84.0%, 85.0%, 86.0%, 87.0%, 88.0%, 89.0%, 90.0%, 91.0%, 92.0%, 93.0%, 94.0%, 95.0%, 95.5%, 96.0%, 96.5%, 97.0%, 97.5%, 98.0%, 98.5%, 99.0%, 99.5%, 100%, 바람직하게 적어도 80.0%, 보다 바람직하게 적어도 87.0%, 보다 더 바람직하게 적어도 90.0%, 보다 더 바람직하게 적어도 95.0%, 가장 바람직하게 적어도 97.0%이다. 본 발명의 상황에서, 본 발명에 따른 단백질 'Z'의 기능성 단편 (일반적으로 SEQ ID NO로 표시됨)은 코어 당류로서 LN3을 갖는 올리고당을 수송하는 막 단백질 'Z'의 기능적 특징을 보유하는 단편을 의미한다. 이와 같이, 폴리펩티드 SEQ ID NO의 단편은 바람직하게 상기 폴리펩티드 SEQ ID NO를 포함하거나 또는 그로 이루어지고, 당업자가 통상적으로 평가할 수 있는 온전한 폴리펩티드와 실질적으로 동일한 방식으로, 바람직하게 유사하거나 또는 더 큰 정도까지, 온전한 폴리펩티드의 적어도 하나의 생물학적 기능을 수행하는 폴리펩티드 서열을 의미하고, 연속 아미노산 잔기의 양은 누락되며, 상기 양은 상기 폴리펩티드 SEQ ID NO의 전체 길이의 50.0%, 40.0%, 30.0% 이하, 바람직하게 상기 폴리펩티드 SEQ ID NO의 전체 길이의 20.0%, 15.0%, 10.0%, 9.0%, 8.0%, 7.0%, 6.0%, 5.0%, 4.5%, 4.0%, 3.5%, 3.0%, 2.5%, 2.0%, 1.5%, 1.0%, 0.5% 이하, 보다 바람직하게 15.0% 이하, 보다 더 바람직하게 10.0% 이하, 보다 더 바람직하게 5.0% 이하, 가장 바람직하게 2.5% 이하이다. 둘 이상의 핵산 또는 폴리펩티드 서열의 상황에서 용어 "동일한" 또는 "퍼센트 동일성" 또는 "% 동일성"은 서열 비교 알고리즘을 사용하거나 또는 육안 검사를 통해서 측정하여, 최대 상응도에 대해 비교 및 정렬했을 때, 동일한 뉴클레오티드 또는 아미노산 잔기의 명시된 %를 갖는 둘 이상의 서열 또는 하위서열을 의미한다. 서열 비교를 위해서, 한 서열은 시험 서열이 비교되는 기준 서열로서 작용한다. 서열 비교 알고리즘을 사용할 때, 시험 및 기준 서열은 컴퓨터에 입력되고, 하위서열 좌표가 필요한 경우 지정되고, 서열 알고리즘 프로그램 매개변수가 지정된다. 서열 비교 알고리즘은 지정된 프로그램 매개변수를 기반으로, 기준 서열에 대해서 시험 서열(들)에 대한 서열 동일성%를 계산한다. 퍼센트 동일성은 기준 서열의 전체 길이 상에서 전체적으로 계산되어서, 전체 퍼센트 동일성 점수를 생성시킬 수 있다. 대안적으로, 퍼센트 동일성은 기준 서열의 부분 서열에 대해서 계산되어서, 국소 퍼센트 동일성 점수를 생성시킬 수 있다. 국소 서열 정렬에서 기준 서열의 전체 길이 사용은 시험 서열과 기준 서열 간 전체 퍼센터 동일성 점수를 생성시킨다.
퍼센트 동일성은 예를 들어, BLAST 및 PSI-BLAST (Altschul et al., 1990, J Mol Biol 215:3, 403-410; Altschul et al., 1997, Nucleic Acid Res 25: 17, 3389-402), Clustal Omega 방법 (Sievers et al., 2011, Mol. Syst. Biol. 7:539), MatGAT 방법 (Campanella et al., 2003, BMC Bioinformatics, 4:29) 또는 EMBOSS Needle (https://galaxy-iuc.github.io/emboss-5.0-docs/needle.html) 같은 상이한 알고리즘을 사용해 결정될 수 있다.
BLAST (Basic Local Alignment Search Tool) 정렬 방법은 디폴트 매개변수를 사용해 서열을 비교하기 위해 NCBI (National Center for Biotechnology Information)가 제공하는 알고리즘이다. 이 프로그램은 뉴클레오티드 또는 단백질 서열을 서열 데이터베이스와 비교하여 통계적 유의성을 계산한다. PSI-BLAST (Position-Specific Iterative Basic Local Alignment Search Tool)는 단백질-단백질 BLAST (BLASTp)를 사용해 상기 소정 점수 한계치 이상에서 검출되는 서열의 다수 서열 정렬로부터 위치-특이적 채점 매트릭스 (PSSM) 또는 프로파일을 유도시킨다. BLAST 방법은 쌍별 또는 다수 서열 정렬에 사용될 수 있다. 쌍별 서열 정렬은 2개 생물학적 서열 (단백질 또는 핵산) 간에 기능적, 구조적 및/또는 진화적 관계를 의미할 수 있는 유사성의 영역을 확인하는데 사용된다. BLAST에 대한 웹 인터페이스는 https://blast.ncbi.nlm.nih.gov/Blast.cgi에서 입수가능하다.
Clustal Omega (Clustal Ω)는 3개 이상의 서열 간에 정렬을 생성시키기 위해서 씨딩된 가이드 트리 및 HMM 프로파일-프로파일 기술을 사용하는 다수 서열 정렬 프로그램이다. 분기 서열의 생물학적으로 의미있는 다수 서열 정렬을 생성시킨다. Clustal Ω에 대한 웹 인터페이스는 https://www.ebi.ac.uk/Tools/msa/clustalo/에서 입수가능하다. Clustal Ω를 사용하는 다수 서열 정렬에 대한 디폴트 매개변수 및 단백질 서열의 % 동일성의 계산은 다음과 같다: 입력 서열의 탈-정렬 활성화: FALSE; mbed-유사 클러스터링 가이드-트리 활성화: TRUE; mbed-유사 클러스터링 반복 활성화: TRUE; (조합된 가이드-트리/HMM) 반복 횟수: 디폴트(0); 최대 가이드 트리 반복: 디폴트 [-1]; 최대 HMM 반복: 디폴트 [-1]; 순서: 정렬됨.
MatGAT (Matrix Global Alignment Tool)는 데이터의 사전 정렬 필요없이 DNA 또는 단백질 서열에 대한 유사성/동일성 매트릭스를 생성하는 컴퓨터 어플리케이션이다. 프로그램은 Myers 및 Miller 글로벌 정렬 알고리즘을 사용하여 일련의 쌍별 정렬을 수행하고, 유사성 및 동일성을 계산한 다음에, 그 결과를 거리 매트릭스에 배치한다. 사용자는 그들 단백질 서열 검사에 사용하기 위한 정렬 매트릭스 (예를 들어, BLOSUM50, BLOSUM62, 및 PAM250) 유형을 지정할 수 있다.
EMBOSS Needle (https://galaxy-iuc.github.io/emboss-5.0-docs/needle.html)은 그들의 전체 길이를 고려했을 때 2개 서열의 최적 정렬 (갭 포함)를 찾기 위해 Needleman-Wunsch 글로벌 정렬 알고리즘을 사용한다. 최적 정렬은 모든 가능한 정렬을 탐색하고 최상을 선택하여서 동적 프로그래밍 방법으로 보장된다. Needleman-Wunsch 알고리즘은 최상의 점수를 계산하고 mn 단계 (여기서 'n' 및 'm'은 2개 서열의 길이임)의 순서로 정렬할 수 있는 알고리즘 클래스의 구성원이다. 갭 개방 패널티 (디폴트 10.0)는 갭이 생성될 때 제거되는 점수이다. 디폴트 값은 단백질 서열에 대해 EBLOSUM62 매트릭스를 사용하는 것으로 가정한다. 갭 연장 (디폴트 0.5) 패널티는 갭에서 각각의 염기 또는 잔기에 대한 표준 갭 패널티에 첨가된다. 이것은 얼마나 긴 갭이 패널티를 받는가이다.
본 명세서에서 사용되는, 기준 폴리펩티드 서열의 전체 길이에 대해 적어도 80% 전체 서열 동일성을 갖는 아미노산 서열 (또는 적어도 80% 전체 서열 동일성을 갖는 단백질 서열)을 갖는 폴리펩티드는 서열이 기준 폴리펩티드 서열의 아미노산 서열의 전체 길이에 대해서 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100% 전체 서열 동일성을 갖는다는 것으로 이해해야 한다. 출원 전반에서, 달리 명확하게 명시하지 않으면, 기준 폴리펩티드의 전체 길이 아미노산 서열에 대해 적어도 80% 서열 전체 서열 동일성을 갖는 아미노산 서열을 포함/이루어지는/갖는/그로 표시되는 폴리펩티드는 일반적으로, SEQ ID NO로 표시되고, 바람직하게 전체 길이 기준 서열에 대해서 적어도 85%, 90%, 91%, 92.00%, 93.00%, 94.00%, 95.00%, 96.00%, 97.00%, 98.00% 또는 99.00% 전체 서열 동일성을 갖고, 보다 바람직하게 적어도 85% 전체 서열 동일성을 갖고, 보다 더 바람직하게 적어도 90% 전체 서열 동일성을 갖고, 보다 더 바람직하게 적어도 95.00% 전체 서열 동일성을 갖고, 보다 더 바람직하게 적어도 97.00%,가장 바람직하게 적어도 99.00% 전체 서열 동일성을 갖는다. 본 발명의 상황에서, 기준 막 단백질 'Z'의 전체 서열 길이 (일반적으로 SEQ ID NO로 표시됨)에 대해 예를 들어, 적어도 80% 전체 서열 동일성을 갖는 아미노산 서열 (또는 예를 들어, 적어도 80% 전체 서열 동일성을 갖는 단백질 서열)을 갖는 폴리펩티드는 본 명세서에 기술된 바와 같은 코어 당류로서 LN3을 갖는 올리고당을 수송할 수 있는 폴리펩티드 (즉, 막 단백질)를 의미하고, 다시 말해서, 폴리펩티드는 코어 당류로서 LN3을 갖는 올리고당을 수송하는 기준 막 단백질 'Z'의 기능적 특징을 보유한다.
본 발명의 목적을 위해서, 폴리펩티드의 전체 서열 동일성은 바람직하게 디폴트 매개변수 (치환 매트릭스 EBLOSUM62, 갭 개방 패널티 10, 및 갭 연장 패널티  0.5) 및 바람직하게 성숙한 단백질의 서열 (즉, 분비 신호 또는 수송 펩티드를 고려하지 않음)을 사용한 프로그램 EMBOSS Needle 5.0 (https://galaxy-iuc.github.io/emboss-5.0-docs/needle.html)에 의해 결정된다.
본 명세서에서 사용되는 용어 "글리코실트랜스퍼라제"는 활성화된 도너 분자로부터 특이적 억셉터 분자로 당 모이어티의 전달을 촉매할 수 있어서, 글리코시드 결합을 형성하는 효소를 의미한다. 이와 같이 합성된 올리고당은 선형 또는 분지형일 수 있고, 다수의 단당류 빌딩 블록을 함유할 수 있다. 뉴클레오티드 디포스포-당, 뉴클레오티드 모노포스포-당 및 당 포스페이트를 사용하는 글리코실트랜스퍼라제 및 관련 단백질의 별개 서열-기반 패밀리로의 분류가 기술되어 있고 (Campbell et al., Biochem. J. 326, 929-939 (1997)) CAZy (CArbohydrate-Active EnZymes) 웹사이트 (www.cazy.org)에서 입수가능하다.
본 명세서에서 사용되는 글리코실트랜스퍼라제는 푸코실트랜스퍼라제, 시알릴트랜스퍼라제, 갈락토실트랜스퍼라제, 글루코실트랜스퍼라제, 만노실트랜스퍼라제, N-아세틸글루코사미닐트랜스퍼라제, N-아세틸갈락토사미닐트랜스퍼라제, N-아세틸만노사미닐트랜스퍼라제, 자일로실트랜스퍼라제, 글루쿠로닐트랜스퍼라제, 갈락투로닐트랜스퍼라제, 글루코사미닐트랜스퍼라제, N-글리코릴뉴라미닐트랜스퍼라제, 람노실트랜스퍼라제, N-아세틸람노실트랜스퍼라제, UDP-4-아미노-4,6-디데옥시-N-아세틸-베타-L-알트로사민 트랜스아미나제 및 푸코사미닐트랜스퍼라제를 포함하지만, 이에 제한되지 않은 목록으로부터 선택될 수 있다.
푸코실트랜스퍼라제는 GDP-푸코스 (GDP-Fuc) 도너로부터 글리칸 억셉터로 푸코스 잔기 (Fuc)를 전달하는 글리코실트랜스퍼라제이다. 푸코실트랜스퍼라제는 알파-글리코시드 결합을 통해서 GDP-Fuc로부터 글리칸 억셉터로 Fuc 잔기의 전달을 촉매하는 알파-1,2-푸코실트랜스퍼라제, 알파-1,3-푸코실트랜스퍼라제, 알파-1,4-푸코실트랜스퍼라제 및 알파-1,6-푸코실트랜스퍼라제를 포함한다. 푸코실트랜스퍼라제는 GT10, GT11, GT23, GT65 및 GT68 CAZy 패밀리에서 찾을 수 있지만, 이에 제한되지 않는다. 시알릴트랜스퍼라제는 시알릴 기 (예컨대 Neu5Ac 또는 Neu5Gc)를 도너 (예컨대 CMP-Neu5Ac 또는 CMP-Neu5Gc)로부터 글리칸 억셉터에 전달하는 글리코실트랜스퍼라제이다. 시알릴트랜스퍼라제는 알파-글리코시드 결합을 통해서 글리칸 억셉터로 시알릴 기의 전달을 촉매하는 알파-2,3-시알릴트랜스퍼라제 및 알파-2,6-시알릴트랜스퍼라제를 포함한다. 시알릴트랜스퍼라제는 GT29, GT42, GT80 및 GT97 CAZy 패밀리에서 찾을 수 있지만, 이에 제한되지 않는다. 갈락토실트랜스퍼라제는 갈락토실 기 (Gal)를 UDP-갈락토스 (UDP-Gal) 도너로부터 글리칸 억셉터로 전달하는 글리코실트랜스퍼라제이다. 갈락토실트랜스퍼라제는 알파- 또는 베타-글리코시드 결합을 통해서 글리칸 억셉터로 UDP-Gal로부터 Gal 잔기를 전달하는 베타-1,3-갈락토실트랜스퍼라제, 베타-1,4-갈락토실트랜스퍼라제, 알파-1,3-갈락토실트랜스퍼라제 및 알파-1,4-갈락토실트랜스퍼라제를 포함한다. 갈락토실트랜스퍼라제는 GT2, GT6, GT8, GT25 및 GT92 CAZy 패밀리에서 찾을 수 있지만, 이에 제한되지 않는다. 글루코실트랜스퍼라제는 글루코실 기 (Glc)를 UDP-글루코스 (UDP-Glc) 도너로부터 글리칸 억셉터에 전달하는 글리코실트랜스퍼라제이다. 글루코실트랜스퍼라제는 알파- 또는 베타-글리코시드 결합을 통해서 글리칸 억셉터로 UDP-Glu로부터 Glc 잔기를 전달하는 알파-글루코실트랜스퍼라제, 베타-1,2-글루코실트랜스퍼라제, 베타-1,3-글루코실트랜스퍼라제 및 베타-1,4-글루코실트랜스퍼라제를 포함한다. 글루코실트랜스퍼라제는 GT1, GT4 및 GT25 CAZy 패밀리에서 찾을 수 있지만, 이에 제한되지 않는다. 만노실트랜스퍼라제는 만노스 기 (Man)를 GDP-만노스 (GDP-Man) 도너로부터 글리칸 억셉터로 전달하는 글리코실트랜스퍼라제이다. 만노실트랜스퍼라제는 알파-글리코시드 결합을 통해서 글리칸 억셉터로 GDP-Man으로부터 Man 잔기를 전달하는 알파-1,2-만노실트랜스퍼라제, 알파-1,3-만노실트랜스퍼라제 및 알파-1,6-만노실트랜스퍼라제를 포함한다. 만노실트랜스퍼라제는 GT22, GT39, GT62 및 GT69 CAZy 패밀리에서 찾을 수 있지만, 이에 제한되지 않는다. N-아세틸글루코사미닐트랜스퍼라제는 N-아세틸글루코사민 기 (GlcNAc)를 UDP-N-아세틸글루코사민 (UDP-GlcNAc) 도너로부터 글리칸 억셉터로 전달하는 글리코실트랜스퍼라제이다. N-아세틸글루코사미닐트랜스퍼라제는 GT2 및 GT4 CAZy 패밀리에서 찾을 수 있지만, 이에 제한되지 않는다. N-아세틸갈락토사미닐트랜스퍼라제는 N-아세틸갈락토사민 기 (GalNAc)를 UDP-N-아세틸갈락토사민 (UDP-GalNAc) 도너로부터 글리칸 억셉터로 전달하는 글리코실트랜스퍼라제이다. N-아세틸갈락토사미닐트랜스퍼라제는 GT7, GT12 및 GT27 CAZy 패밀리에서 찾을 수 있지만, 이에 제한되지 않는다. N-아세틸만노사미닐트랜스퍼라제는 N-아세틸만노사민 기 (ManNAc)를 UDP-N-아세틸만노사민 (UDP-ManNAc) 도너로부터 글리칸 억셉터로 전달하는 글리코실트랜스퍼라제이다. 자일로실트랜스퍼라제는 자일로스 잔기 (Xyl)를 UDP-자일로스 (UDP-Xyl) 도너로부터 글리칸 억셉터로 전달하는 글리코실트랜스퍼라제이다. 자일로실트랜스퍼라제는 GT14, GT61 및 GT77 CAZy 패밀리에서 찾을 수 있지만, 이에 제한되지 않는다. 글루쿠로닐트랜스퍼라제는 알파- 또는 베타-글리코시드 결합을 통해서 글리칸 억셉터로 UDP-글루쿠로네이트 도너로부터 글루쿠로네이트를 전달하는 글리코실트랜스퍼라제이다. 글루쿠로닐트랜스퍼라제는 GT4, GT43 및 GT93 CAZy 패밀리에서 찾을 수 있지만, 이에 제한되지 않는다. 갈락투로닐트랜스퍼라제는 갈락투로네이트를 UDP-갈락투로네이트 도너로부터 글리칸 억셉터로 전달하는 글리코실트랜스퍼라제이다. N-글리코릴뉴라미닐트랜스퍼라제는 N-글리코릴뉴라민산 기 (Neu5Gc)를 CMP-Neu5Gc 도너로부터 글리칸 억셉터로 전달하는 글리코실트랜스퍼라제이다. 람노실트랜스퍼라제는 람노스 잔기를 GDP-람노스 도너로부터 글리칸 억셉터로 전달하는 글리코실트랜스퍼라제이다. 람노실트랜스퍼라제는 GT1, GT2 및 GT102 CAZy 패밀리에서 찾을 수 있지만, 이에 제한되지 않는다. N-아세틸람노실트랜스퍼라제는 N-아세틸람노사민 잔기를 UDP-N-아세틸-L-람노사민 도너로부터 글리칸 억셉터로 전달하는 글리코실트랜스퍼라제이다. UDP-4-아미노-4,6-디데옥시-N-아세틸-베타-L-알트로사민 트랜스아미나제는 플라젤린을 변형시키는데 사용되는 시알산-유사 당인, 슈다민산의 생합성에서 UDP-2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스를 사용하는 글리코실트랜스퍼라제이다. 푸코사미닐트랜스퍼라제는 N-아세틸푸코사민 잔기를 dTDP-N-아세틸푸코사민 또는 UDP-N-아세틸푸코사민 도너로부터 글리칸 억셉터로 전달하는 글리코실트랜스퍼라제이다.
용어 "갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제"는 베타-1,3 연결로 락토스의 말단 갈락토스 잔기로 UDP-GlcNAc로부터 N-아세틸글루코사민 (GlcNAc) 잔기을 전달할 수 있는 글리코실트랜스퍼라제를 의미한다.
용어 "뉴클레오티드-당" 또는 "활성화된 당" 또는 "뉴클레오시드"는 본 명세서에서 상호교환적으로 사용되고, 단당류의 활성화된 형태를 의미한다. 활성화된 단당류의 예는 UDP-N-아세틸글루코사민 (UDP-GlcNAc), UDP-N-아세틸갈락토사민 (UDP-GalNAc), UDP-N-아세틸만노사민 (UDP-ManNAc), UDP-글루코스 (UDP-Glc), UDP-갈락토스 (UDP-Gal), GDP-만노스 (GDP-Man), UDP-글루쿠로네이트, UDP-갈락투로네이트, UDP-2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, UDP-2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, UDP-N-아세틸-L-람노사민 (UDP-L-RhaNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-만노스), dTDP-N-아세틸푸코사민, UDP-N-아세틸푸코사민 (UDP-L-FucNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-갈락토스), UDP-N-아세틸-L-뉴모사민 (UDP-L-PneNAC 또는 UDP-2-아세타미도-2,6-디데옥시-L-탈로스), UDP-N-아세틸무람산, UDP-N-아세틸-L-퀴노보사민 (UDP-L-QuiNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-글루코스), GDP-L-퀴노보스, CMP-시알산 (CMP-Neu5Ac 또는 CMP-N-아세틸뉴라민산), CMP-N-글리코릴뉴라민산 (CMP-Neu5Gc), GDP-푸코스 (GDP-Fuc), GDP-람노스 및 UDP-자일로스를 포함하지만, 이에 제한되지 않는다. 뉴클레오티드-당은 글리코실화 반응에서 글리코실 도너로서 작용한다. 글리코실화 반응은 글리코실트랜스퍼라제에 의해 촉매되는 반응이다.
본 명세서에서 사용되는 용어 "단당류"는 가수분해에 의해서 더 단순한 당으로 분해될 수 없고, 알도스 또는 케토스로 분류되며, 분자 당 하나 이상의 히드록실 기를 함유하는 당을 의미한다. 단당류는 오직 하나의 단순 당을 함유하는 당류이다. 단당류의 예는 헥소스, D-글루코피라노스, D-갈락토푸라노스, D-갈락토피라노스, L-갈락토피라노스, D-만노피라노스, D-알로피라노스, L-알트로피라노스, D-굴로피라노스, L-이도피라노스, D-탈로피라노스, D-리보푸라노스, D-리보피라노스, D-아라비노푸라노스, D-아라비노피라노스, L-아라비노푸라노스, L-아라비노피라노스, D-자일로피라노스, D-릭소피라노스, D-에리트로푸라노스, D-트레오푸라노스, 헵토스, L-글리세로-D-만노-헵토피라노스 (LDmanHep), D-글리세로-D-만노-헵토피라노스 (DDmanHep), 6-데옥시-L-알트로피라노스, 6-데옥시-D-굴로피라노스, 6-데옥시-D-탈로피라노스, 6-데옥시-D-갈락토피라노스, 6-데옥시-L-갈락토피라노스, 6-데옥시-D-만노피라노스, 6-데옥시-L-만노피라노스, 6-데옥시-D-글루코피라노스, 2-데옥시-D-아라비노-헥소스, 2-데옥시-D-에리트로-펜토스, 2,6-디데옥시-D-아라비노-헥소피라노스, 3,6-디데옥시-D-아라비노-헥소피라노스, 3,6-디데옥시-L-아라비노-헥소피라노스, 3,6-디데옥시-D-자일로-헥소피라노스, 3,6-디데옥시-D-리보-헥소피라노스, 2,6-디데옥시-D-리보-헥소피라노스, 3,6-디데옥시-L-자일로-헥소피라노스, 2-아미노-2-데옥시-D-글루코피라노스, 2-아미노-2-데옥시-D-갈락토피라노스, 2-아미노-2-데옥시-D-만노피라노스, 2-아미노-2-데옥시-D-알로피라노스, 2-아미노-2-데옥시-L-알트로피라노스, 2-아미노-2-데옥시-D-굴로피라노스, 2-아미노-2-데옥시-L-이도피라노스, 2-아미노-2-데옥시-D-탈로피라노스, 2-아세타미도-2-데옥시-D-글루코피라노스, 2-아세타미도-2-데옥시-D-갈락토피라노스, 2-아세타미도-2-데옥시-D-만노피라노스, 2-아세타미도-2-데옥시-D-알로피라노스, 2-아세타미도-2-데옥시-L-알트로피라노스, 2-아세타미도-2-데옥시-D-굴로피라노스, 2-아세타미도-2-데옥시-L-이도피라노스, 2-아세타미도-2-데옥시-D-탈로피라노스, 2-아세타미도-2,6-디데옥시-D-갈락토피라노스, 2-아세타미도-2,6-디데옥시-L-갈락토피라노스, 2-아세타미도-2,6-디데옥시-L-만노피라노스, 2-아세타미도-2,6-디데옥시-D-글루코피라노스, 2-아세타미도-2,6-디데옥시-L-알트로피라노스, 2-아세타미도-2,6-디데옥시-D-탈로피라노스, D-글루코피라누론산, D-갈락토피라누론산, D-만노피라누론산, D-알로피라누론산, L-알트로피라누론산, D-굴로피라누론산, L-굴로피라누론산, L-이도피라누론산, D-탈로피라누론산, 시알산, 5-아미노-3,5-디데옥시-D-글리세로-D-갈락토-논-2-울로손산, 5-아세타미도-3,5-디데옥시-D-글리세로-D-갈락토-논-2-울로손산, 5-글리콜릴라미도-3,5-디데옥시-D-글리세로-D-갈락토-논-2-울로손산, 에리트리톨, 아라비니톨, 자일리톨, 리비톨, 글루시톨, 갈락티톨, 만니톨, D-리보-헥스-2-울로피라노스, D-아라비노-헥스-2-울로푸라노스 (D-프룩토푸라노스), D-아라비노-헥스-2-울로피라노스, L-자일로-헥스-2-울로피라노스, D-릭소-헥스-2-울로피라노스, D-트레오-펜트-2-울로피라노스, D-알트로-헵트-2-울로피라노스, 3-C-(히드록시메틸)-D-에리토푸라노스, 2,4,6-트리데옥시-2,4-디아미노-D-글루코피라노스, 6-데옥시-3-O-메틸-D-글루코스, 3-O-메틸-D-람노스, 2,6-디데옥시-3-메틸-D-리보-헥소스, 2-아미노-3-O-[(R)-1-카르복시에틸]-2-데옥시-D-글루코피라노스, 2-아세타미도-3-O-[(R)-카르복시에틸]-2-데옥시-D-글루코피라노스, 2-글리콜릴라미도-3-O-[(R)-1-카르복시에틸]-2-데옥시-D-글루코피라노스, 3-데옥시-D-릭소-헵트-2-울로피라노사르산, 3-데옥시-D-만노-옥트-2-울로피라노손산, 3-데옥시-D-글리세로-D-갈락토-논-2-울로피라노손산, 5,7-디아미노-3,5,7,9-테트라데옥시-L-글리세로-L-만노-논-2-울로피라노손산, 5,7-디아미노-3,5,7,9-테트라데옥시-L-글리세로-L-알트로-논-2-울로피라노손산, 5,7-디아미노-3,5,7,9-테트라데옥시-D-글리세로-D-갈락토-논-2-울로피라노손산, 5,7-디아미노-3,5,7,9-테트라데옥시-D-글리세로-D-탈로-논-2-울로피라노손산, 2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, 2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, N-아세틸-L-람노사민, N-아세틸-D-푸코사민, N-아세틸-L-뉴모사민, N-아세틸무람산, N-아세틸-L-퀴노보사민, 글루코스, 갈락토스, N-아세틸글루코사민, 글루코사민, 만노스, 자일로스, N-아세틸만노사민, N-아세틸뉴라민산, N-글리코릴뉴라민산, N-아세틸갈락토사민, 갈락토사민, 푸코스, 람노스, 글루쿠론산, 글루콘산, 프룩토스 및 폴리올을 포함한다.
용어 "올리고당"은 본 명세서에서 사용되고, 일반적으로 당분야에서 이해되는 바와 같으며, 작은 개수, 전형적으로 3개 내지 20개의 단순당, 즉, 단당류를 함유하는 당류 중합체를 의미한다. 본 발명에서 사용되는 올리고당은 선형 구조일 수 있거나 또는 분지를 포함할 수 있다. 2개 당 단위 사이의 연결 (예를 들어, 글리코시드 연결, 갈락토시드 연결, 글루코시드 연결 등)은 예를 들어, 1,4, 1->4, 또는 (1-4)로서 표현될 수 있고, 본 명세서에서 상호교환적으로 사용된다. 각각의 단당류는 환형 형태 (예를 들어, 피라노스 또는 푸라노스 형태)일 수 있다. 올리고당은 알파- 및 베타-글리코시드 결합 둘 모두를 함유할 수 있거나 또는 오직 베타-글리코시드 결합만을 함유할 수 있다. 용어 "글리칸" 및 "다당류"는 상호교환적으로 사용되고, 글리코시드로 연결된 다수의 단당류로 이루어지는 화합물을 의미한다. 용어 글리칸은 10개 초과의 단당류 잔기를 함유하는 화합물에 대해 일반적으로 사용된다.
본 명세서에서 사용되는 용어 "코어 삼당류로서 LN3을 갖는 올리고당"은 추가로 글리코실화되는 락토-N-트리오스를 함유하거나 또는 락토-N-트리오스인 올리고당을 의미한다. 바람직하게, 본 명세서에 기술되는 바와 같은 올리고당은 상기 본 명세서에서 사용되는 바와 같은 목록으로부터 선택되는 단당류를 함유한다. 본 발명의 올리고당의 예는 코어 삼당류로서 LN3을 함유하는, 루이스-유형 항원 올리고당 및 포유동물 모유 올리고당 (MMO), 바람직하게 인간 모유 올리고당 (HMO)을 포함하지만, 이에 제한되지 않는다. 예에는 락토-N-트리오스, 락토-N-테트라오스, 락토-N-네오테트라오스, 락토-N-푸코펜타오스 I, 락토-N-네오푸코펜타오스 I, 락토-N-푸코펜타오스 II, 락토-N-푸코펜타오스 III, 락토-N-푸코펜타오스 V, 락토-N-푸코펜타오스 VI, 락토-N-네오푸코펜타오스 V, 락토-N-디푸코헥사오스 I, 락토-N-디푸코헥사오스 II, 락토-N-헥사오스 (LNH), 락토-N-네오헥사오스 (LNnH), 파라-락토-N-헥사오스 (pLNnH), 파라-락토-N-네오헥사오스 (pLNH), 디푸코실-락토-N-헥사오스, 디푸코실-락토-N-네오헥사오스, 락토-N-펜타오스 (LNP), 락토-N-네오펜타오스, 파라 락토-N-펜타오스, 파라 락토-N-네오펜타오스, 락토-N-노보펜타오스 I, 락토-N-헵타오스, 락토-N-네오헵타오스, 파라 락토-N-네오헵타오스, 파라 락토-N-헵타오스, 락토-N-옥타오스 (LNO), 락토-N-네오옥타오스, 이소 락토-N-옥타오스, 파라 락토-N-옥타오스, 이소 락토-N-네오옥타오스, 노보 락토-N-네오옥타오스, 파라 락토-N-네오옥타오스, 이소 락토-N-노나오스, 노보 락토-N-노나오스, 락토-N-노나오스, 락토-N-데카오스, 이소 락토-N-데카오스, 노보 락토-N-데카오스, 락토-N-네오데카오스, 시알릴-락토-N-테트라오스 a, 시알릴-락토-N-테트라오스 b, 시알릴-락토-N-테트라오스 c, 시알릴-락토-N-테트라오스 d가 포함된다. 바람직하게, 본 발명의 올리고당 (즉, 본 명세서에 정의된 바와 같은 코어 삼당류로서 LN3을 갖는 올리고당)은 포유동물 모유 올리고당 (MMO), 보다 바람직하게 인간 모유 올리고당, 보다 더 바람직하게 코어 사당류로서 LNT 또는 LNnT를 갖는 HMO 또는 MMO, 보다 더 바람직하게 코어 사당류로서 LNT 또는 LNnT, 가장 바람직하게 LNT 또는 LNnT를 갖는 MMO이다. 본 발명의 상기 올리고당은 중성 올리고당 (즉, 상기 올리고당은 카르복실 기로부터 기원하는 음전하를 갖지 않음)인 것이 본 발명의 상황에서 또한 바람직하다.
본 명세서에서 사용되는 용어 "LNT II", "LNT-II", "LN3", "락토-N-트리오스 II", "락토-N-트리오스 II", "락토-N-트리오스", "락토-N-트리오스" 또는 "GlcNAcβ1-3Galβ1-4Glc"는 상호교환적으로 사용된다.
본 발명에서 사용되는 용어 "LNT", "락토-N-테트라오스", "락토-N-테트라오스" 또는 "Galβ1-3GlcNAcβ1-3Galβ1-4Glc"는 상호교환적으로 사용된다.
본 발명에서 사용되는 용어 "LNnT", "락토-N-네오테트라오스", "락토-N-네오테트라오스", "네오-LNT" 또는 "Galβ1-4GlcNAcβ1-3Galβ1-4Glc"는 상호교환적으로 사용된다.
본 발명에서 사용되는 용어 "LSTa", "LS-사당류 a", "시알릴-락토-N-테트라오스 a", "시알릴락토-N-테트라오스 a" 또는 "Neu5Ac-a2,3-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc"는 상호교환적으로 사용된다.
본 발명에서 사용되는 용어 "LSTb", "LS-사당류 b", "시알릴-락토-N-테트라오스 b", "시알릴락토-N-테트라오스 b" 또는 "Gal-b1,3-(Neu5Ac-a2,6)-GlcNAc-b1,3-Gal-b1,4-Glc"는 상호교환적으로 사용된다.
본 발명에서 사용되는 용어 "LSTc", "LS-사당류 c", "시알릴-락토-N-테트라오스 c", "시알릴락토-N-테트라오스 c", "시알릴락토-N-네오테트라오스 c" 또는 "Neu5Ac-a2,6-Gal-b1,4-GlcNAc-b1,3-Gal-b1,4-Glc"는 상호교환적으로 사용된다.
용어 "LSTd", "LS-사당류 d", "시알릴-락토-N-테트라오스 d", "시알릴락토-N-테트라오스 d", "시알릴락토-N-네오테트라오스 d" 또는 "Neu5Ac-a2,3-Gal-b1,4-GlcNAc-b1,3-Gal-b1,4-Glc".
포유동물 모유 올리고당은 인간, 및 소 (보스 타우루스 (Bos Taurus)), 양 (오비스 아리에스 (Ovis aries)), 염소 (카프라 애가그루스 히르쿠스 (Capra aegagrus hircus)), 쌍봉 낙타 (카멜루스 박트리아누스 (Camelus bactrianus)), 말 (에쿠우스 페루스 카발루스 (Equus ferus caballus)), 돼지 (수스 스크로파 (Sus scropha)), 개 (카니스 루푸스 파밀리아리스 (Canis lupus familiaris)), 에조불곰 (우르수스 아르크토스 에소엔시스 (Ursus arctos yesoensis)), 북극곰 (우르수스 마리티무스 (Ursus maritimus)), 일본 흑곰 (우르수스 티베타누스 자포니쿠스 (Ursus thibetanus japonicus)), 등줄무늬 스컹크 (메피티스 메피티스 (Mephitis mephitis)), 두건 물범 (시스토포라 크리스타타 (Cystophora cristata)), 아시아 코끼리 (엘레파스 막시무스 (Elephas maximus)), 아프리카 코끼리 (록소돈타 아프리카나 (Loxodonta africana)), 큰개미핥기 (미르메코파가 트리닥틸라 (Myrmecophaga tridactyla)), 병코돌고래 (투르시옵스 트룬카테스 (Tursiops truncates)), 북방 밍크 고래 (발라에놉테라 아쿠토로스트라타 (Balaenoptera acutorostrata)), 타마 왈라비 (마크로푸스 유게니 (Macropus eugenii)), 붉은 캥거루 (마크로푸스 루푸스 (Macropus rufus)), 주머니 여우 (트리코수루스 불페쿨라 (Trichosurus Vulpecula)), 코알라 (파스콜라르크토스 시네레우스 (Phascolarctos cinereus)), 동부 주머니 고양이 (다시우루스 비베리누스 (Dasyurus viverrinus)), 오리너구리 (오르니토린쿠스 아나티누스 (Ornithorhynchus anatinus))를 포함하지만, 이에 제한되지 않는 포유동물로부터의 초유를 포함하여 수유 중 임의 단계에서 발견되는 모유에 존재하는 올리고당을 포함한다.
본 명세서에서 사용되는 용어 "경로"는 본 명세서에 정의된 바와 같은 올리고당의 합성에 관여되는 효소 및 그들 개별 유전자로 이루어지는 생화학적 경로이다. 올리고당의 생산을 위한 상기 경로는 본 발명의 올리고당을 생성시키기 위한 뉴클레오티드-활성화된 당의 합성 및 억셉터로 상기 뉴클레오티드-활성화된 당의 전달에 관여되는 경로를 포함하지만, 이에 제한되지 않는다. 이러한 경로의 예는푸코실화, 시알릴화, 갈락토실화, N-아세틸글루코사미닐화, N-아세틸갈락토실화, 만노실화, N-아세틸만노시닐화 경로를 포함하지만, 이에 제한되지 않는다.
본 명세서에서 사용되는 '푸코실화 경로'는 α 1,2; α 1,3 α 1,4 또는 α 1,6 푸코실화 올리고당을 생성시키는 프코실트랜스퍼라제와 조합된, 효소 및 그들 개별 유전자, 만노스-6-포스페이트 이소머라제, 포스포만노뮤타제, 만노스-1-포스페이트 구아닐릴트랜스퍼라제, GDP-만노스 4,6-데히드라타제, GDP-L-푸코스 신타제 및/또는 회수 경로 L-푸코티나제/GDP-푸코스 파이로포스포릴라제로 이루어진 생화학적 경로이다.
'시알릴화 경로'는 α 2,3; α 2,6 α 2,8 시알릴화 올리고당을 생성시키는 시알릴트랜스퍼라제와 조합된, 효소 및 그들 개별 유전자, L-글루타민―D-프룩토스-6-포스페이트 아미노트랜스퍼라제, 글루코사민-6-포스페이트 데아미나제, 포스포글루코사민 뮤타제, N-아세틸글루코사민-6-포스페이트 데아세틸라제, N-아세틸글루코사민 에피머라제, UDP-N-아세틸글루코사민 2-에피머라제, N-아세틸글루코사민-6P 2-에피머라제, 글루코사민 6-포스페이트 N-아세틸트랜스퍼라제, N-아세틸글루코사민-6-포스페이트 포스파타제, N-아세틸만노사민-6-포스페이트 포스파타제, N-아세틸만노사민 키나제, 포스포아세틸글루코사민 뮤타제, N-아세틸글루코사민-1-포스페이트 우리딜트랜스퍼라제, 글루코사민-1-포스페이트 아세틸트랜스퍼라제, 시알산 신타제, N-아세틸뉴라미네이트 리아제, N-아실뉴라미네이트-9-포스페이트 신타제, N-아실뉴라미네이트-9-포스페이트 포스파타제, 및/또는 CMP-시알산 신타제로 이루어진 생화학적 경로이다.
본 명세서에서 사용되는 '갈락토실화 경로'는 단당류, 이당류, 또는 올리고당의 2, 3, 4, 6개 히드록실 기에 알파 또는 베타 결합된 갈락토스를 생성시키는 갈락토실트랜스퍼라제와 조합된, 효소 및 그들 개별 유전자, 갈락토스-1-에피머라제, 갈락토키나제, 글루코키나제, 갈락토스-1-포스페이트 우리딜릴트랜스퍼라제, UDP-글루코스 4-에피머라제, 글루코스-1-포스페이트 우리딜릴트랜스퍼라제, 및/또는 글루코포스포뮤타제로 이루어진 생화학적 경로이다.
본 명세서에서 사용되는 'N-아세틸글루코사미닐화 경로'는 단당류, 이당류 또는 올리고당의 3, 4, 6개 히드록실 기에 알파 또는 베타 결합된 N-아세틸글루코사민을 생성시키는 글리코실트랜스퍼라제와 조합된, 효소 및 그들 개별 유전자, L-글루타민―D-프룩토스-6-포스페이트 아미노트랜스퍼라제, 글루코사민-6-포스페이트 데아미나제, 포스포글루코사민 뮤타제, N-아세틸글루코사민-6-포스페이트 데아세틸라제, 글루코사민 6-포스페이트 N-아세틸트랜스퍼라제, N-아세틸글루코사민-1-포스페이트 우리딜트랜스퍼라제, 글루코사민-1-포스페이트 아세틸트랜스퍼라제, 및/또는 글루코사민-1-포스페이트 아세틸트랜스퍼라제로 이루어진 생화학적 경로이다.
본 명세서에서 사용되는 'N-아세틸갈락토실화 경로'는 단당류, 이당류 또는 올리고당에 알파 또는 베타 결합된 N-아세틸갈락토사민을 생성시키는 글리코실트랜스퍼라제와 조합된, 효소 및 그들 개별 유전자, L-글루타민―D-프룩토스-6-포스페이트 아미노트랜스퍼라제, 포스포글루코사민 뮤타제, N-아세틸글루코사민 1-포스페이트 우리딜릴트랜스퍼라제, UDP-N-아세틸글루코사민 4-에피머라제, UDP-갈락토스 4-에피머라제, N-아세틸갈락토사민 키나제 및/또는 UDP-GalNAc 파이로포스포릴라제로 이루어진 생화학적 경로이다.
본 명세서에서 사용되는 '만노실화 경로'는 단당류, 이당류 또는 올리고당에 알파 또는 베타 결합된 만노스를 생성시키는 글리코실트랜스퍼라제와 조합된, 효소 및 그들 개별 유전자, 만노스-6-포스페이트 이소머라제, 포스포만노뮤타제 및/또는 만노스-1-포스페이트 구아닐트랜스퍼라제로 이루어진 생화학적 경로이다.
본 명세서에서 사용되는 'N-아세틸만노시닐화 경로'는 단당류, 이당류 또는 올리고당에 알파 또는 베타 결합된 N-아세틸만노사민을 생성시키는 글리코실트랜스퍼라제와 조합된, 효소 및 그들 개별 유전자, L-글루타민―D-프룩토스-6-포스페이트 아미노트랜스퍼라제, 글루코사민-6-포스페이트 데아미나제, 포스포글루코사민 뮤타제, N-아세틸글루코사민-6-포스페이트 데아세틸라제, 글루코사민 6-포스페이트 N-아세틸트랜스퍼라제, N-아세틸글루코사민-1-포스페이트 우리딜트랜스퍼라제, 글루코사민-1-포스페이트 아세틸트랜스퍼라제, 글루코사민-1-포스페이트 아세틸트랜스퍼라제, UDP-GlcNAc 2-에피머라제 및/또는 ManNAc 키나제로 이루어진 생화학적 경로이다.
본 명세서에서 사용되는 용어 "막 단백질"은 세포 막의 일부이거나 또는 세포막과 상호작용하여 세포를 가로지르는 분자 및 정보의 흐름을 제어하는 단백질이다. 따라서, 막 단백질은 세포 안으로 유입 또는 세포 밖으로 유출시키는 수송에 관여된다.
이러한 단백질은 www.tcdb.org 를 통해서 입수가능한 Saier Lab Bioinformatics Group이 운영하고 선별하여 막 수송체 단백질의 기능적 및 계통학적 분류를 제공하는 수송체 분류 데이터베이스에 의해 정의되는 바와 같이, 운송체, P-P-결합-가수분해-구동 수송체 또는 β-배럴 포린일 수 있다. 이 수송체 분류 데이터베이서는 수송체 분류 (TC) 체계로서 알려진 막 수송체 단백질에 대한 종합적인 IUBMB 승인 분류 체계를 상술한다. 본 명세서에 기술되는 TCDB 분류 검색은 2019년 6월 17일자에 배포된 공개된 TCDB. org를 기반으로 정의된다.
운송체는 캐리어-매개 과정을 이용하는 단일수송체, 동반수송체, 및 역수송체의 집합 명칭이다 (Saier et al., Nucleic Acids Res. 44 (2016) D372-D379). 그들은 전기화학 전위-구동 수송체에 속하고, 또한 2차 캐리어-유형 촉진제라고도 한다. 막 단백질은 그들이 촉진 확산에 의해서 또는 용질이 하전된 경우 막 전위-의존적 과정에 의해 수송될 때 단일수송; 2개 이상의 종이 화학삼투 에너지이외의 에너지의 직접 형태와 결합되지 않고, 밀접하게 결합된 과정으로 반대 방향으로 수송될 때 역수송; 및/또는 2개 이상의 종이, 2차 캐리어의, 화학 삼투 에너지 이외의 에너지의 직접 형태와 결합되지 않고, 밀접하게 결합된 과정으로 동일한 방향으로 함께 수송될 때 동반수송을 촉매하는 캐리어-매개된 과정을 이용할 때 이러한 부류에 포함된다 (Forrest et al., Biochim. Biophys. Acta 1807 (2011) 167-188). 이들 시스템은 일반적으로 입체특이적이다. 용질:용질 역수송은 2차 캐리어의 특징적인 특성이다. 운송체 및 효소의 동적 회합은 전형적으로 세포외 구획으로부터 수득되는 기질을 직접적으로 그들 세포 물질대사에 전달하는 기능성 막 수송체 메타볼론을 생성한다 (Moraes and Reithmeier, Biochim. Biophys. Acta 1818 (2012), 2687-2706). 이러한 운송체 시스템을 통해서 수송되는 용질은 양이온, 유기 음이온, 무기 음이온, 뉴클레오시드, 아미노산, 폴리올, 인산화 당분해 중간체, 삼투질, 시데로포어를 포함하지만, 이에 제한되지 않는다.
막 단백질은 용질 또는 용질들의 능동 흡수 및/또는 압출을 구동시키기 위해서, 무기 파이로포스페이트, ATP, 또는 다른 뉴클레오시드 트리포스페이트의 디포스페이트 결합을 가수분해한다면 P-P-결합 가수분해-구동 수송체의 부류에 포함된다 (Saier et al., Nucleic Acids Res. 44 (2016) D372-D379). 막 단백질은 일시적으로 일시적으로 인산화될 수 있거나 또는 그렇지 않을 수 있지만, 기질은 인산화되지 않는다. P-P-결합 가수분해-구동 수송체의 부류를 통해 수송되는 기질은 양이온, 중금속, 베타-글루칸, UDP-글루코스, 지질다당류, 테이코산을 포함하지만, 이에 제한되지 않는다.
β-배럴 포린 막 단백질은 일반적으로 막을 가로질러스 용질의 에너지 독립적 통과를 허용하는 경막 포어를 형성한다. 이들 단백질의 경막 부분은 β-배럴을 형성하는 β-가닥으로만 이루어진다 (Saier et al., Nucleic Acids Res. 44 (2016) D372-D379). 이들 포린-유형 단백질은 그람-음성 박테리아, 미토콘드리아, 색소체, 및 가능하게 항산성 그람-양성 박테리아의 외막에서 발견된다. 이들 β-배럴 포린 막 단백질을 통해 수송되는 용질은 뉴클레오시드, 라피노스, 글루코스, 베타-글루코시드, 올리고당을 포함하지만, 이에 제한되지 않는다.
용어 "가능한 유출"은 세포질 막 및/또는 세포벽에 걸쳐 용질의 수송 활성을 도입시키는 것을 의미한다. 상기 수송은 본 발명에 기술된 바와 같은 수송체 단백질의 발현을 도입시키고/시키거나 증가시켜서 가능할 수 있다. 용어 "증강된 유출"은 세포질 막 및/또는 세포벽에 걸쳐서 용질의 수송 활성을 개선시키는 것을 의미한다. 상기 수송은 본 발명에 기술된 바와 같은 수송체 단백질이 발현을 도입시키고/시키거나 증가시켜서 증강될 수 있다. 수송체 단백질의 "발현"은 상기 유전자가 내생성 유전자인 경우에 상기 수송체 단백질을 코딩하는 유전자의 "과발현" 또는 상기 수송체 단백질을 코딩하는 유전자가 야생형 균주에 존재하지 않는 이종성 유전자인 경우에 "발현"으로서 정의된다.
본 명세서에서 사용되는, 용어 "세포 생산성 지수 (CPI)"는 배양에서 생산되는 재조합 세포의 질량으로 재조합 세포에 의해 생산된 생산물의 질량을 나눈 것을 의미한다.
코어 삼당류로서 LN3을 갖는 올리고당에 대해서 본 명세서에서 사용되는 용어 "비-천연"은 올리고당이 i) 천연적으로 생산되지 않거나 또는 ii) 세포에 의해 동일한 양으로 천연적으로 생산되지 않을 때; 및 세포가 상기 올리고당을 생산할 수 있거나 또는 올리고당의 더 높은 생산을 갖도록 유전자 변형된 것을 의미한다.
용어 "정제된"은 생물학적 분자의 활성을 방해하는 성분이 실질적으로 또는 본질적으로 없는 물질을 의미한다. 세포, 당류, 핵산, 및 폴리펩티드 경우에, 용어 "정제된"은 이의 천연 상태에서 발견되는 물질을 정상적으로 수반하는 성분이 실질적으로 또는 본질적으로 없는 물질을 의미한다. 전형적으로, 본 발명의 정제된 당류, 올리고당, 단백질 또는 핵산은 은-염색 겔 상에서 밴드 강도를 통해서 또는 순도 결정을 위한 다른 방법으로 측정하여 적어도 약 50%, 55%, 60%, 65%, 70%, 75%, 80% 또는 85% 순수하거나, 일반적으로 적어도 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 순수하다. 순도 또는 균질성은 당분야에 충분히 공지된 많은 수단, 예컨대, 단백질 또는 핵산 샘플의 폴리아크릴아미드 겔 전기영동에 이어서 염색 시 가시화를 통해서 표시될 수 있다. 일정 목적을 위해서 고해상도가 필요할 것이고 HPLC 또는 정제를 위한 유사한 수단이 이용될 것이다. 올리고당 경우에, 순도는 제한없이, 박층 크로마토그래피, 가스 크로마토그래피, NMR, HPLC, 모세관 전기영동 또는 질량 분광법같은 방법을 사용해 결정된다.
용어 "배양"은 세포가 배양되거나 또는 발효배양되는 배양 배지, 세포 그 자체, 및 전체 액체배지, 즉 세포의 내부 (세포내)를 비롯하여 외부 (세포외)에서 세포에 의해 생산된 코어 삼당류로서 LN3을 갖는 올리고당을 의미한다.
본 명세서에서 사용되는 용어 "전구체"는 본 발명에 따른 올리고당의 특별한 생산을 위해 세포가 흡수하거나 또는 합성하는 물질을 의미한다. 이러한 의미에서 전구체는 본 명세서에 정의된 바와 같은 억셉터일 수 있고, 또한 올리고당의 생화학적 합성 경로의 일부로서 세포 내에서 먼저 변형된, 다른 기질일 수도 있다. 이러한 전구체의 예는 본 명세서에 정의된 바와 같은 억셉터, 및/또는 글루코스, 갈락토스, 프룩토스, 글리세롤, 시알산, 푸코스, 만노스, 말토스, 수크로스, 락토스, 글루코스-1-포스페이트, 갈락토스-1-포스페이트, UDP-글루코스, UDP-갈락토스, 글루코스-6-포스페이트, 프룩토스-6-포스페이트, 프룩토스-1,6-비스포스페이트, 글리세롤-3-포스페이트, 디히드록시아세톤, 글리세르알데히드-3-포스페이트, 디히드록시아세톤-포스페이트, 글루코사민-6-포스페이트, 글루코사민, N-아세틸-글루코사민-6-포스페이트, N-아세틸-글루코사민, N-아세틸-만노사민, N-아세틸만노사민-6-포스페이트, UDP-N-아세틸글루코사민, N-아세틸글루코사민-1-포스페이트, N-아세틸뉴라민산 (시알산), N-아세틸-뉴라민산-9-포스페이트, CMP-시알산, 만노스-6-포스페이트, 만노스-1-포스페이트, GDP-만노스, GDP-4-데히드로-6-데옥시-α-D-만노스, 및/또는 GDP-푸코스를 포함한다.
임의로, 세포는 락토스 수송체, N-아세틸뉴라민산 수송체, 푸코스 수송체, 뉴클레오티드-활성화된 당을 위한 수송체로 이루어진 군으로부터 선택되는 단백질을 코딩하는 적어도 하나의 핵산 서열을 포함하도록 형질전환되고, 상기 수송체는 본 발명의 올리고당의 합성을 위해 배지에 첨가된 전구체에 내재화된다.
본 명세서에서 사용되는 용어 "억셉터"는 글리코실트랜스퍼라제에 의해 변형될 수 있는 단당류, 이당류 또는 올리고당을 의미한다. 이러한 억셉터의 예는 글루코스, 갈락토스, 프룩토스, 글리세롤, 시알산, 푸코스, 만노스, 말토스, 수크로스, 락토스, 락토-N-트리오스, 락토-N-테트라오스 (LNT), 락토-N-네오테트라오스 (LNnT), 락토-N-펜타오스 (LNP), 락토-N-네오펜타오스, 파라 락토-N-펜타오스, 파라 락토-N-네오펜타오스, 락토-N-노보펜타오스 I, 락토-N-헥사오스 (LNH), 락토-N-네오헥사오스 (LNnH), 파라 락토-N-네오헥사오스 (pLNnH), 파라 락토-N-헥사오스 (pLNH), 락토-N-헵타오스, 락토-N-네오헵타오스, 파라 락토-N-네오헵타오스, 파라 락토-N-헵타오스, 락토-N-옥타오스 (LNO), 락토-N-네오옥타오스, 이소 락토-N-옥타오스, 파라 락토-N-옥타오스, 이소 락토-N-네오옥타오스, 노보 락토-N-네오옥타오스, 파라 락토-N-네오옥타오스, 이소 락토-N-노나오스, 노보 락토-N-노나오스, 락토-N-노나오스, 락토-N-데카오스, 이소 락토-N-데카오스, 노보 락토-N-데카오스, 락토-N-네오데카오스, 및 1 이상의 N-아세틸락토사민 단위 및/또는 1 이상 락토-N-비오스 단위를 함유하는 올리고당 또는 올리고당으로의 중간체, 이의 푸코실화 및 시알릴화 형태를 포함한다.
제1 양태에서, 본 발명은 본 명세서에 정의된 바와 같은 코어 삼당류로서 LN3을 포함하는 올리고당의 생산을 위한 대사적으로 조작된 세포를 제공한다. 본 명세서에서, 대사적으로 조작된 세포는 N-아세틸글루코사민 (GlcNAc) 잔기를 UDP-GlcNAc 도너로부터 락토스 억셉터로 전달하여 LN3을 합성하는 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제에 대한 적어도 하나의 핵산 서열을 포함하고, i) 내생성 막 단백질의 과발현 및/또는 ii) 이종성 막 단백질의 발현을 더 포함하여서 코어 삼당류로서 LN3을 포함하는 올리고당의 개선된 생산 및/또는 가능 및/또는 증강된 유출을 제공하는 것이 제공된다. 상기 세포는 코어 삼당류로서 LN3을 포함하는 올리고당으로 상기 LN3을 변형시킬 수 있는 글리코실트랜스퍼라제를 코딩하는 적어도 하나의 핵산 서열을 더 포함할 수 있다.
제2 양태에 따라서, 본 발명은 유전자 조작된 세포에 의해서 코어 삼당류로서 LN3을 갖는 올리고당을 제조하기 위한 방법을 제공한다. 방법은 하기 단계를 포함한다:
1) 코어 삼당류로서 LN3을 갖는 올리고당을 생산할 수 있는 세포를 제공하는 단계로서, 상기 세포는 N-아세틸글루코사민 (GlcNAc) 잔기를 UDP-GlcNAc 도너로부터 락토스 억셉터로 전달하여서 LN3을 합성하는 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제에 대한 적어도 하나의 핵산 서열을 포함하고, 상기 세포는 i) 내생성 막 단백질, 보다 특히 코어 삼당류로서 LN3을 갖는 올리고당의 생산 및/또는 유출에 관여되는 내생성 막 단백질, 보다 더 특히 코어 삼당류로서 LN3을 갖는 올리고당의 생산을 가능하게 하고/하거나 증강시키고/시키거나 유출을 가능하게 하고/하거나 증강시키는 내생성 막 단백질의 과발현, 및/또는 ii) 이종성 막 단백질, 보다 특히 코어 삼당류로서 LN3을 갖는 올리고당의 생산 및/또는 유출에 관여되는 이종성 막 단백질, 보다 더 특히 코어 삼당류로서 LN3을 갖는 올리고당의 생산을 가능하게 하고/하거나 증강시키고/시키거나 유출을 가능하게 하고/하거나 증강시키는 이종성 막 단백질의 발현을 더 포함하는 것인, 단계, 및
2) 코어 삼당류로서 LN3을 갖는 바람직한 올리고당의 생산을 허용하는 조건 하에 배지 중에서 세포를 배양하는 단계.
본 출원 전반에서, 달리 명시하지 않으면, "배양하다" (및 이의 활용형)" 및 "배양"은 본 발명의 상황에서 상호교환적으로 사용된다.
본 발명의 상황에서, 본 발명의 상기 내생성 막 단백질 및/또는 상기 이종성 막 단백질은 락토스 퍼미아제 (예를 들어, lacy 유전자 또는 lac12 유전자에 의해 코딩됨)가 아닌것이 바람직하고, 바람직하게 상기 락토스 퍼미아제는 SEQ ID NO 52로 표시된다. 그러나, 이러한 바람직한 구현예는 본 발명의 세포에서 락토스 퍼미아제의 존재를 배제하지 않는다. 당업자는 본 발명에 따른 상기 세포 (내생성 막 단백질 과발현 및/또는 이종성 막 단백질 발현)가 본 명세서에 추가로 기술되는 바와 같은 락토스 퍼미아제 (예를 들어, SEQ ID NO 52)의 도입 및/또는 과발현에 의해서, 세포에 락토스를 유입시키도록 추가적으로 유전자 변형될 수 있다는 것을 이해한다.
바람직하게 상기 세포는 상기 LN3을 변형시킬 수 있는 글리코실트랜스퍼라제를 코딩하는 적어도 하나의 핵산 서열을 더 포함한다.
바람직하게, 코어 삼당류로서 LN3을 갖는 올리고당은 본 명세서에 설명되는 바와 같이 배양으로부터 분리된다.
본 발명의 범주에서, 허용하는 조건은 온도, pH, 압력, 삼투압 및 생산물/전구체/억셉터 농도를 포함하지만, 이에 제한되지 않는 물리적 또는 화학적 매개변수에 관한 조건으로 이해한다.
특정 구현예에서, 허용하는 조건은 30 +/- 20℃의 온도 범위, 7 +/- 3의 pH-범위를 포함할 수 있다.
본 발명의 방법 및/또는 세포의 바람직한 구현예에서, 대사적으로 조작된 세포는 유전자 발현 모듈로 변형되고, 상기 발현 모듈 중 어느 하나로부터의 발현은 항상성이거나 또는 조율가능하다. 상기 발현 모듈은 또한 전사 유닛으로도 알려져 있고, 코딩 유전자 서열 및 코딩 유전자에 작동적으로 연결된 적절한 전사 및/또는 번역 제어 신호를 포함하는 재조합 유전자의 발현을 위한 폴리뉴클레오티드를 포함한다. 상기 제어 신호는 프로모터 서열, 비번역 영역, 리보솜 결합 부위, 종결자 서열을 포함한다. 상기 발현 모듈은 하나의 단일 재조합 유전자의 발현을 위한 성분을 함유할 수 있고 또한 더 많은 재조합 유전자의 발현을 위한 성분을 함유할 수 있거나 또는 둘 이상의 재조합 유전자의 통합된 발현을 위한 오페론 구조로 구성될 수 있다. 상기 폴리뉴클레오티드는 당분야에 충분히 공지된 기술을 사용하는 재조합 DNA 기술에 의해 생산될 수 있다. 발현 모듈을 구축하기 위한 당업자에게 충분히 공지된 방법은 예를 들어, 시험관내 재조합 DNA 기술, 합성 기술, 및 생체내 유전자 재조합을 포함한다. 예를 들어, 기술들은 하기 문헌에 기술된다: Sambrook et al. (2001) Molecular Cloning: a laboratory manual, 3rd Edition, Cold Spring Harbor Laboratory Press, CSH, New York 또는 Current Protocols in Molecular Biology, John Wiley and Sons, N.Y. (1989 및 연간 업데이트).
본 발명의 바람직한 구현예에 따라서, 세포는 하나 이상의 발현 모듈에 의해 변형된다. 발현 모듈은 상기 세포의 게놈에 통합될 수 있거나 또는 벡터 상에서 상기 세포에게 제시될 수 있다. 상기 벡터는 상기 대사적으로 조작된 세포로 안정하게 형질전환/형질감염시키려는, 플라스미드, 코스미드, 파지, 리포솜, 또는 바이러스의 형태로 존재할 수 있다. 이러한 벡터는 특히, 염색체, 에피솜 및 바이러스-유래 벡터, 예를 들어, 플라스미드, 박테리오파지, 트랜스포존, 효모 에피솜, 삽입 성분, 효모 염색체 성분, 바이러스로부터 유래되는 벡터, 및 이의 조합으로부터 유래되는 벡터, 예컨대, 플라스미드 및 박테리오파지 유전자 성분으로부터 유래되는 것들, 예컨대, 코스미드 및 파지미드를 포함한다. 이들 벡터는 선택 마커 예컨대, 항생제 마커, 영양요구성 마커, 독소-항독소 마커, RNA 센서/안티센스 마커를 함유할 수 있지만, 이에 제한되지 않는다. 발현 시스템 구성체는 발현을 일으킬뿐만 아니라 조절하는 제어 영역을 함유할 수 있다. 일반적으로, 숙주에서 폴리뉴클레오티드를 유지, 전파 또는 발현시키고/시키거나 폴리펩티드를 발현시키는데 적합한 임의의 시스템 또는 벡터는 이와 관련하여 발현에 사용될 수 있다. 적절한 DNA 서열은 임의의 다양한 충분히 공지된 통상의 기술, 예컨대, 예를 들어, Sambrook et al. 등에 기재된 것들을 통해서 발현 시스템으로 삽입될 수 있고, 상기를 참조한다. 재조합 생산을 위해서, 세포는 본 발명의 발현 시스템 또는 이의 일부 또는 폴리뉴클레오티드를 도입하도록 유전자 조작될 수 있다. 세포로 폴리뉴클레오티드의 도입은 많은 표준 실험실 매뉴얼, 예컨대, [Davis et al., Basic Methods in Molecular Biology, (1986)], 및 [Sambrook et al., 1989, supra]에 기술된 방법을 통해 실시될 수 있다.
본 명세서에서 사용되는 발현 모듈은 적어도 하나의 재조합 유전자의 발현을 위한 폴리뉴클레오티드를 포함한다. 상기 재조합 유전자은 상기 글리코실화된 생산물의 합성에서 작용하는 폴리펩티드의 발현에 관여되거나; 또는 상기 재조합 유전자는 상기 글리코실화된 생산물의 합성에 관여되지 않는 상기 숙주 세포의 다른 경로와 연결된다. 상기 재조합 유전자는 발현 또는 활성이 변형된 내생성 단백질을 코딩하고, 바람직하게 상기 내생성 단백질은 과발현되거나; 또는 상기 재조합 유전자는 상기 변형된 세포에서 이종으로 도입되어 발현되는, 바람직하게 과발현되는 이종성 단백질을 코딩한다. 내생성 단백질은 이종성 단백질을 또한 발현하는 세포에서 변형된 발현을 가질 수 있다.
본 발명의 바람직한 구현예에 따라서, 상기 발현 모듈의 각각의 발현은 본 명세서에 정의된 바와 같이 항상성이거나 또는 조율가능하다.
본 발명의 방법 및/또는 세포의 바람직한 구현예에 따라서, 세포는 본 명세서에 정의된 바와 같은 코어 삼당류로서 LN3을 갖는 올리고당의 생산을 위한 경로를 포함하도록 대사적으로 조작된다. 추가의 바람직한 구현예에서, 세포는 LN3으로 락토서 또는 중간체를 변형시킬 수 있는 재조합 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제를 포함한다. 보다 추가로 바람직한 구현예에서, 세포는 코어 삼당류로서 LN3을 갖는 올리고당으로 LN3 또는 LN3의 유도체를 변형시킬 수 있는 다른 재조합 글리코실트랜스퍼라제를 포함한다.
방법 및/또는 세포의 다른 바람직한 구현예에서, 세포는 UDP-GlcNAc의 신규 합성을 발현하도록 유전자 변형된다. UDP-GlcNAc는 세포에서 발현되는 효소에 의해서 또는 세포의 물질대사에 의해서 제공될 수 있다. UDP-GlcNAc를 생산하는 이러한 세포는 예를 들어, 세포에 첨가하려는, GlcNAc를 UDP-GlcNAc로 전환시키는 효소를 발현할 수 있다. 이들 효소는 호모 사피엔스 (Homo sapiens), 에스케리치아 콜라이 (Escherichia coli)를 포함한, 몇몇 종 유래의 N-아세틸-D-글루코사민 키나제, N-아세틸글루코사민-6-포스페이트 데아세틸라제, 포스포글루코사민 뮤타제, 및 N-아세틸글루코사민-1-포스페이트 우리딜트랜스퍼라제/글루코사민-1-포스페이트 아세틸트랜스퍼라제일 수 있다. 바람직하게, 세포는 UDP-GlcNAc를 생산하도록 변형된다. 보다 바람직하게, 세포는 증강된 UDP-GlcNAc 생산을 위해 변형된다. 상기 변형은 N-아세틸글루코사민-6-포스페이트 데아세틸라제의 녹-아웃, L-글루타민―D-프룩토스-6-포스페이트 아미노트랜스퍼라제의 과-발현, 포스포글루코사민 뮤타제의 과-발현, 및 N-아세틸글루코사민-1-포스페이트 우리딜트랜스퍼라제/글루코사민-1-포스페이트 아세틸트랜스퍼라제의 과-발현을 포함하는 군으로부터 선택되는 어느 하나 이상일 수 있다.
추가적으로, 또는 대안적으로, 본 명세서에서 사용되는 숙주 세포는 락토스 퍼미아제의 도입 및/또는 과발현에 의해서, 세포에서 락토스를 유입시키도록 임의로 유전자 변형된다. 상기 락토스 퍼미아제는 예를 들어, lacY 유전자 또는 lac12 유전자에 의해 코딩된다.
본 발명의 방법 및/또는 세포에 따라서, 세포는 막 단백질을 발현한다. 막 단백질은 발현이 변형된 내생성 단백질로서, 바람직하게 상기 내생성 단백질은 과발현되거나; 또는 막 단백질은 세포에 의해 이종적으로 발현될 수 있는, 이종성 단백질이다. 이종적으로 발현되는 막 단백질은 도입되어서 발현될 것이고, 바람직하게 과발현될 것이다. 다른 구현예에서, 내생성 단백질은 이종성 막 단백질을 또한 발현하는 세포에서 변형된 발현을 가질 수 있다. 다른 구현예에서, 내생성 막 단백질의 변형된 발현은 상기 내생성 막 단백질의 동일 오페론에서 지도화되고/되거나 발현을 위한 공통 제어 서열을 공유하는 다른 단백질의 변형된 발현을 포함한다. 다른 구현예에서, 막 단백질은 동일 레귤론을 공유하는 인접한 단백질과 함께 발현된다. 다른 구현예에서, 막 단백질이 내막 수송체 (복합체)일 때, 막 단백질은 하나 이상의 외막 수송체(들)와 함께 발현된다. 대안적인 구현예에서, 막 단백질이 외막 수송체일 때, 막 단백질은 하나 이상의 내막 단백질(들)과 함께 발현된다. 대안적인 구현예에서, 막 단백질은 하나 이상의 내막 단백질 및/또는 하나 이상의 외막 단백질과 발현된다. 본 발명의 추가 구현예에 따라서, 막 단백질을 코딩하는 폴리뉴클레오티드는 개별 세포 또는 발현 시스템의 코돈 용법에 적합화된다.
본 발명의 방법 및/또는 세포의 추가의 바람직한 구현예에서, 막 단백질은 운송체, P-P-결합-가수분해-구동 수송체, 및 β-배럴 포린의 군으로부터 선택된다.
방법 및/또는 세포의 바람직한 구현예에서, 막 단백질이 운송체 막 단백질의 군으로부터 선택될 때, 막 단백질은 TCDB 클래스 2.A.1.1, 2.A.1.2, 2.A.1.3, 2.A.1.6, 2.A.2.2, 2.A.7.1 및 2.A.66의 군으로부터 선택된다.
방법 및/또는 세포의 대안적인 바람직한 구현예에서, 막 단백질이 운송체 막 단백질의 군으로부터 선택될 때, 막 단백질은 eggnog 패밀리 05E8G, 05EGZ, 05JHE, 07QF7 07QRN, 07RBJ, 0814C 및 08N8A의 군으로부터 선택된다.
방법 및/또는 세포의 다른 바람직한 구현예에서, 막 단백질이 운송체 막 단백질의 군으로부터 선택될 때, 막 단백질은 PFAM 목록 PF00893, PF01943, PF05977, PF07690 및 PF13347로부터 선택된다.
방법 및/또는 세포의 다른 바람직한 구현예에서, 막 단백질이 운송체 막 단백질의 군으로부터 선택될 때, 막 단백질은 interpro 목록 IPR000390, IPR001411, IPR001927, IPR002797, IPR004638, IPR005829, IPR010290, IPR011701, IPR020846, IPR023721, IPR023722, IPR032896, IPR036259 및 IPR039672로부터 선택된다.
방법 및/또는 세포의 다른 바람직한 구현예에서, 막 단백질이 운송체 막 단백질의 군으로부터 선택될 때, 막 단백질은 SEQ ID NO 01을 갖는 크로노박터 무이트젠시 (Cronobacter muytjensii) 유래 MdfA, SEQ ID NO 02를 갖는 요케넬라 레겐스부르게이 (Yokenella regensburgei) (ATCC43003) 유래 MdfA, SEQ ID NO 03를 갖는 에스케리치아 콜라이 (Escherichia coli) K-12 MG1655 유래 MdfA, SEQ ID NO 04를 갖는 엔테로박터 (Enterobacter) sp. 유래 MdfA, SEQ ID NO 05를 갖는 시트로박터 코세리 (Citrobacter koseri) 유래 MFS, SEQ ID NO 06를 갖는 시트로박터 영애 (Citrobacter youngae) 유래 MdfA, SEQ ID NO 07을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 YbdA, SEQ ID NO 08을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 YjhB, SEQ ID NO 09를 갖는 에스케리치아 콜라이 K-12 MG1655 유래 WzxE, SEQ ID NO 10을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 EmrE, SEQ ID NO 11을 갖는 비피도박테리움 롱검 (Bifidobacterium longum) subsp. 인판티스 (Infantis) (균주 ATCC 15697) 유래 Blon_2331, SEQ ID NO 12를 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_0247, SEQ ID NO 13을 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_0345, SEQ ID NO 14를 갖는 클렙시엘라 뉴모니아에 (Klebsiella pneumoniae) 유래 IceT, SEQ ID NO 53을 갖는 크로노박터 사카자키 (Cronobacter sakazakii) 균주 MOD1_LR753 유래 MdfA, SEQ ID NO 54를 갖는 프란코니박터 풀베리스 (Franconibacter pulveris) LMG 24059 유래 MdfA, SEQ ID NO 55를 갖는 엔테로박터 호르마에케이 (Enterobacter hormaechei) 균주 017 유래 MdfA, SEQ ID NO 56을 갖는 시트로박터 코세리 (Citrobacter koseri) 균주 NCTC10771 유래 MdfA, SEQ ID NO 57를 갖는 살모넬라 엔테리카 (Salmonella enterica) subsp. 아리조나에 (arizonae) 혈청형 41:z4,z23:- 균주 TAMU30EF 유래 MdfA, SEQ ID NO 58을 갖는 시겔라 플렉스네리 (Shigella flexneri) 균주 585219 유래 MdfA, SEQ ID NO 59를 갖는 요케넬라 레겐스부르게이 균주 UMB0819 유래 MdfA, SEQ ID NO 60을 갖는 에스케리치아 콜라이 균주 AMC_967 유래 MdfA, SEQ ID NO 61을 갖는 클렙시엘라 뉴모니아에 (Klebsiella pneumoniae) VAKPC309 유래 MdfA, SEQ ID NO 62를 갖는 클렙시엘라 옥시토카 (Klebsiella oxytoca) 균주 4928STDY7071490 유래 MdfA, SEQ ID NO 63을 갖는 클렙시엘라 미시가넨시스 (Klebsiella michiganensis) 균주 A2 유래 MdfA, SEQ ID NO 64를 갖는 플루랄리박터 게르고비아에 (Pluralibacter gergoviae) 균주 FDAARGOS_186 유래 MdfA, SEQ ID NO 65를 갖는 클루이베라 아스코르바타 (Kluyvera ascorbata) ATCC 33433 유래 MdfA, SEQ ID NO 66을 갖는 엔테로박터 코베이 (Enterobacter kobei) 유래 MdfA, SEQ ID NO 67을 갖는 렐리오티아 (Lelliottia) sp. WB101 유래 MdfA, SEQ ID NO 68을 갖는 시트로박터 프레운디 (Citrobacter freundii) 유래 MdfA, SEQ ID NO 69를 갖는 살모넬라 엔테리카 subsp. 살라마에 (Salamae) 유래 MdfA 또는 SEQ ID NO 70을 갖는 시겔라 플렉스네리 (Shigella flexneri) 유래 MdfA, 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각, SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69 또는 70을 갖는 상기 막 단백질 중 어느 하나의 전체 길이 서열과 적어도 80% 서열 동일성을 갖는 단백질 서열로부터 선택된다. 설명 및 청구항 전반에서, 용어 "적어도 80% 서열 동일성을 갖는 단백질 서열"은 바람직하게 용어 "적어도 80% 서열 동일성을 갖는 단백질" 또는 "적어도 80% 서열 동일성을 갖는 폴리펩티드"로 대체된다.
방법 및/또는 세포의 보다 바람직한 구현예에서, 막 단백질이 운송체 막 단백질의 군으로부터 선택될 때, 막 단백질은 SEQ ID NO 01, 02, 04, 05, 06, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69 또는 70 (즉, 이에 의해 표시), 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 01, 02, 04, 05, 06, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69 또는 70을 갖는 상기 막 단백질의 전체 길이 서열에 대해서 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열로부터 선택된다.
방법 및/또는 세포의 보다 더 바람직한 구현예에서, 막 단백질이 운송체 막 단백질의 군으로부터 선택될 때, 막 단백질은 SEQ ID NO 01, 02, 04, 05, 06, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69 또는 70 (즉, 이에 의해 표시), 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는
- 각각 SEQ ID NO 09, 10, 11, 12 또는 13을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80% 서열 동일성,
- 각각 SEQ ID NO 01, 02, 04, 14, 53, 54, 55, 59, 61, 62, 63, 64, 65, 66, 67 또는 69를 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 90% 서열 동일성,
- 각각 SEQ ID NO 05, 06, 56, 57 또는 68을 갖는 상기 막 단백질의 전체 길이 서열과 적어도 95.00% 서열 동일성, 또는
- 각각 SEQ ID NO 58, 60 또는 70을 갖는 상기 막 단백질의 전체 길이 서열과 적어도 99.00% 서열 동일성
을 갖는 단백질 서열로부터 선택된다.
방법 및/또는 세포의 대안적인 바람직한 구현예에서, 막 단백질이 운송체 막 단백질의 군으로부터 선택될 때, 막 단백질은 SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64, 65, 66, 67, 또는 69 (즉, 이에 의해 표시), 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64, 65, 66, 67, 또는 69를 갖는 상기 막 단백질의 전체 길이 서열과 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열로부터 선택된다. 보다 바람직하게, 막 단백질은 SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64, 65, 66, 67, 또는 69 (즉, 이에 의해 표시), 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64, 65, 66, 67, 또는 69를 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 90%, 바람직하게 적어도 95.00%, 보다 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열에 의해 선택된다.
방법 및/또는 세포의 다른 바람직한 구현예에서, 막 단백질이 운송체 막 단백질의 군으로부터 선택될 때, 막 단백질은 SEQ ID NO 01을 갖는 크로노박터 무이트젠시 (Cronobacter muytjensii) 유래 MdfA, SEQ ID NO 02를 갖는 요케넬라 레겐스부르게이 (Yokenella regensburgei) (ATCC43003) 유래 MdfA, SEQ ID NO 03을 갖는 에스케리치아 콜라이 (Escherichia coli) K-12 MG1655 유래 MdfA, SEQ ID NO 04를 갖는 엔테로박터 (Enterobacter) sp. 유래 MdfA, SEQ ID NO 05를 갖는 시트로박터 코세리 (Citrobacter koseri) 유래 MFS, SEQ ID NO 06을 갖는 시트로박터 영애 (Citrobacter youngae) 유래 MdfA, SEQ ID NO 07을 갖는 에스케리치아 콜라이 (Escherichia coli) K-12 MG1655 유래 YbdA, SEQ ID NO 08을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 YjhB, SEQ ID NO 09를 갖는 에스케리치아 콜라이 K-12 MG1655 유래 WzxE, SEQ ID NO 10을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 EmrE, SEQ ID NO 11을 갖는 비피도박테리움 롱검 (Bifidobacterium longum) subsp. 인판티스 (Infantis) (균주 ATCC 15697) 유래 Blon_2331, SEQ ID NO 12를 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_0247, SEQ ID NO 13을 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_0345, SEQ ID NO 14를 갖는 클렙시엘라 뉴모니아에 (Klebsiella pneumoniae) 유래 IceT, SEQ ID NO 53을 갖는 크로노박터 사카자키 (Cronobacter sakazakii) 균주 MOD1_LR753 유래 MdfA, SEQ ID NO 54를 갖는 프란코니박터 풀베리스 (Franconibacter pulveris) LMG 24059 유래 MdfA, SEQ ID NO 55를 갖는 엔테로박터 호르마에케이 (Enterobacter hormaechei) 균주 017 유래 MdfA, SEQ ID NO 56을 갖는 시트로박터 코세리 (Citrobacter koseri) 균주 NCTC10771 유래 MdfA, SEQ ID NO 57을 갖는 살모넬라 엔테리카 (Salmonella enterica) subsp. 아리조나에 (arizonae) 혈청형 41:z4,z23:- 균주 TAMU30EF 유래 MdfA, SEQ ID NO 58을 갖는 시겔라 플렉스네리 (Shigella flexneri) 균주 585219 유래 MdfA, SEQ ID NO 59를 갖는 요케넬라 레겐스부르게이 (Yokenella regensburgei) 균주 UMB0819 유래 MdfA, SEQ ID NO 60을 갖는 에스케리치아 콜라이 균주 AMC_967 유래 MdfA, SEQ ID NO 61을 갖는 클렙시엘라 뉴모니아에 (Klebsiella pneumoniae) VAKPC309 유래 MdfA, SEQ ID NO 62를 갖는 클렙시엘라 옥시토카 (Klebsiella oxytoca) 균주 4928STDY7071490 유래 MdfA, SEQ ID NO 63을 갖는 클렙시엘라 미시가넨시스 (Klebsiella michiganensis) 균주 A2 유래 MdfA, SEQ ID NO 64를 갖는 플루랄리박터 게르고비아에 (Pluralibacter gergoviae) 균주 FDAARGOS_186 유래 MdfA 또는 SEQ ID NO 65를 갖는 클루이베라 아스코르바타 (Kluyvera ascorbata) ATCC 33433 유래 MdfA, 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64 또는 65를 갖는 상기 막 단백질 중 어느 하나의 전체 길이 서열에 대해 적어도 80% 서열 동일성을 갖는 단백질 서열로부터 선택된다.
방법 및/또는 세포의 보다 바람직한 구현예에서, 막 단백질이 운송체 막 단백질의 군으로부터 선택될 때, 막 단백질은 SEQ ID NO 01, 02, 04, 05, 06, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64 또는 65 (즉, 이에 의해 표시), 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 01, 02, 04, 05, 06, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64 또는 65를 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 간는 단백질 서열로부터 선택된다.
방법 및/또는 세포의 보다 더 바람직한 구현예에서, 막 단백질이 운송체 막 단백질의 군으로부터 선택될 때, 막 단백질은 SEQ ID NO 01, 02, 04, 05, 06, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64 또는 65 (즉, 이에 의해 표시), 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는
- 각각 SEQ ID NO 09, 10, 11, 12 또는 13을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80% 서열 동일성,
- 각각 SEQ ID NO 01, 02, 04, 14, 53, 54, 55, 59, 61, 62, 63, 64 또는 65를 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 90% 서열 동일성,
- 각각 SEQ ID NO 05, 06, 56 또는 57을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 95.00% 서열 동일성, 또는
- 각각 SEQ ID NO 58 또는 60을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 99.00% 서열 동일성
을 갖는 단백질 서열로부터 선택된다.
방법 및/또는 세포의 대안적인 바람직한 구현예에서, 막 단백질이 운송체 막 단백질의 군으로부터 선택될 때, 막 단백질은 SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64 또는 65 (즉, 이에 의해 표시), 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64 또는 65를 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열로부터 선택된다. 보다 바람직하게, 막 단백질은 SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64 또는 65 (즉, 이에 의해 표시), 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64 또는 65를 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 90%, 바람직하게 적어도 95.00%, 보다 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열로부터 선택된다.
이러한 운송체 막 단백질의 아미노산 서열은 첨부된 서열 목록의 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69 또는 70으로부터 선택되고, 바람직하게 SEQ ID NO 01, 02, 04, 05, 06, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69 또는 70으로부터 선택되고, 보다 바람직하게 SEQ ID NO 01, 02, 04, 05, 06, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64 또는 65로부터 선택되고, 보다 더 바람직하게 SEQ ID NO 01, 02, 04, 05, 06, 55, 59, 66 또는 68로부터 선택되고, 가장 바람직하게 SEQ ID NO 01, 02, 04, 05, 06, 55 또는 59로부터 선택되는 서열일 수 있거나, 또는 각각 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67 ,68, 69 또는 70 중 어느 하나의 전체 길이 아미노산 서열에 대해 적어도 80% 서열 동일성, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 91.50%, 92.00%, 92.50%, 93.00%, 93.50%, 94.00%, 94.50%, 95.00%, 95.50%, 96.00%, 96.50%, 97.00%, 97.50%, 98.00%, 98.50%, 99.00%, 99.50%, 99,60%, 99,70%, 99,80%, 99,90%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 보다 더 바람직하게 적어도 97.00%, 가장 바람직하게 적어도 99.00%, 서열 동일성을 갖는 아미노산 서열일 수 있다.
대안적으로, 이러한 운송체 막 단백질의 아미노산 서열은 첨부된 서열 목록의 SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64, 65, 66, 67 또는 69로부터 선택되고, 보다 바람직하게 SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64 또는 65로부터 선택되고, 보다 더 바람직하게 SEQ ID NO 01, 02, 04, 55, 59, 66 또는 68로부터 선택되고, 보다 더 바람직하게 SEQ ID NO 01, 02, 04, 55 또는 59로부터 선택되고, 가장 바람직하게 SEQ ID NO 01, 02 또는 04로부터 선택되고, 보다 더 바람직하게 SEQ ID NO 01 또는 02로부터 선택되고, 가장 바람직하게 SEQ ID NO 01인 서열일 수 있거나, 또는 각각 SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64, 65, 66, 67 또는 69 중 어느 하나의 전체 길이 아미노산 서열에 대해서 적어도 80% 서열 동일성, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 91.50%, 92.00%, 92.50%, 93.00%, 93.50%, 94.00%, 94.50%, 95.00%, 95.50%, 96.00%, 96.50%, 97.00%, 97.50%, 98.00%, 98.50%, 99.00%, 99.50%, 99,60%, 99,70%, 99,80%, 99,90%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 보다 더 바람직하게 적어도 97.00%, 가장 바람직하게 적어도 99.00%, 서열 동일성을 갖는 아미노산 서열일 수 있다.
SEQ ID NO 01, 02, 04, 05, 06, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69 또는 70을 갖는 상기 막 단백질 중 어느 하나의 전체 길이 서열에 대해 적어도 80% 서열 동일성을 갖는 단백질 서열을 갖는 예시적이고 바람직한 막 단백질이 표 1에 제공된다.
방법 및/또는 세포의 바람직한 구현예에서, 막 단백질이 P-P-결합-가수분해-구동 수송체의 군으로부터 선택될 때, 막 단백질은 TCDB 클래스 3.A.1.1 및 3.A.1.2의 군으로부터 선택된다.
방법 및/또는 세포의 다른 바람직한 구현예에서, 막 단백질이 P-P-결합-가수분해-구동 수송체의 군으로부터 선택될 때, 막 단백질은 eggnog 패밀리 05CJ1, 05DFW, 05EZD, 05I1K, 07HR3 및 08IJ9의 군으로부터 선택된다.
방법 및/또는 세포의 다른 바람직한 구현예에서, 막 단백질이 P-P-결합-가수분해-구동 수송체의 군으로부터 선택될 때, 막 단백질은 PFAM 목록 PF00005, PF00528, PF13407 및 PF17912로부터 선택된다.
방법 및/또는 세포의 다른 바람직한 구현예에서, 막 단백질이 P-P-결합-가수분해-구동 수송체의 군으로부터 선택될 때, 막 단백질은 interpro 목록 IPR000515, IPR003439, IPR003593, IPR005978, IPR008995, IPR013456, IPR015851, IPR017871, IPR025997, IPR027417, IPR028082, IPR035906, 및 IPR040582로부터 선택된다.
방법 및/또는 세포의 다른 바람직한 구현예에서, 막 단백질이 P-P-결합-가수분해-구동 수송체의 군으로부터 선택될 때, 막 단백질은 SEQ ID NO 15를 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_2475, SEQ ID NO 16을 갖는 브라디리조비움 자포니쿰 (Bradyrhizobium japonicum) USDA 110 유래 nodi, SEQ ID NO 17을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 xylF, SEQ ID NO 18을 갖는 비피도박테리움 롱검 subsp. 인판티스 Bi-26 유래 TIC77290, SEQ ID NO 19를 갖는 비피도박테리움 롱검 subsp. 인판티스 Bi-26 유래 TIC77291, SEQ ID NO 20을 갖는 비피도박테리움 롱검 subsp. 인판티스 Bi-26 유래 TIC76854 TIC77291, 또는 상기 P-P-결합-가수분해-구동 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 15, 16, 17, 18, 19 또는 20을 갖는 상기 막 단백질 중 어느 하나의 전체 길이 서열에 대해 적어도 80% 서열 동일성을 갖는 단백질 서열로부터 선택된다.
방법 및/또는 세포의 다른 바람직한 구현예에서, 막 단백질이 β-배럴 포린의 군으로부터 선택될 때, 막 단백질은 TCDB 클래스 1.B.18로부터 선택된다.
방법 및/또는 세포의 다른 바람직한 구현예에서, 막 단백질이 β-배럴 포린의 군으로부터 선택될 때, 막 단백질은 eggnog 패밀리 05DAY로부터 선택된다.
방법 및/또는 세포의 다른 바람직한 구현예에서, 막 단백질이 β-배럴 포린의 군으로부터 선택될 때, 막 단백질은 PFAM 목록 PF02563, PF10531 및 PF18412로부터 선택된다.
방법 및/또는 세포의 다른 바람직한 구현예에서, 막 단백질이 β-배럴 포린의 군으로부터 선택될 때, 막 단백질은 interpro 목록 IPR003715, IPR019554 및 IPR040716으로부터 선택된다.
방법 및/또는 세포의 다른 바람직한 구현예에서, 막 단백질이 β-배럴 포린의 군으로부터 선택될 때, 막 단백질은 SEQ ID NO 21을 갖는 에스케리치아 콜라이 K12 MG1655 유래 Wza, 또는 이의 기능성 상동체 또는 기능성 단편, 또는 SEQ ID NO 21를 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80% 서열 동일성을 갖는 단백질 서열이다.
방법 및/또는 세포의 대안적인 바람직한 구현예에서, 막 단백질은 TCDB 클래스 1.B.18, 2.A.1.1, 2.A.1.2, 2.A.1.3, 2.A.1.6, 2.A.2.2, 2.A.7.1, 2.A.66, 3.A.1.1 및 3.A.1.2의 군; eggnog 패밀리 05CJ1, 05DAY, 05DFW, 05E8G, 05EGZ, 05EZD, 05I1K, 05JHE, 07HR3, 07QF7 07QRN, 07RBJ, 0814C, 08IJ9 및 08N8A의 군; PFAM 목록 PF00005, PF00528, PF00893, PF01943, PF02563, PF05977, PF07690, PF10531, PF13347, PF13407, PF17912 및 PF18412; interpro 목록 IPR000390, IPR000515, IPR001411, IPR001927, IPR002797, IPR003439, IPR003593, IPR003715, IPR004638, IPR005829, IPR005978, IPR008995, IPR010290, IPR011701, IPR013456, IPR015851, IPR017871, IPR019554, IPR020846, IPR023721, IPR023722, IPR025997, IPR027417, IPR028082, IPR032896, IPR035906, IPR036259, IPR039672, IPR040582 및 IPR040716; SEQ ID NO 01을 갖는 크로노박터 무이트젠시 (Cronobacter muytjensii) 유래 MdfA, SEQ ID NO 02를 갖는 요케넬라 레겐스부르게이 (Yokenella regensburgei) (ATCC43003) 유래 MdfA, SEQ ID NO 03을 갖는 에스케리치아 콜라이 (Escherichia coli) K-12 MG1655 유래 MdfA, SEQ ID NO 04를 갖는 엔테로박터 (Enterobacter) sp. 유래 MdfA, SEQ ID NO 05를 갖는 시트로박터 코세리 (Citrobacter koseri) 유래 MFS, SEQ ID NO 06을 갖는 시트로박터 영애 (Citrobacter youngae) 유래 MdfA, SEQ ID NO 07을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 YbdA, SEQ ID NO 08을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 YjhB, SEQ ID NO 09를 갖는 에스케리치아 콜라이 K-12 MG1655 유래 WzxE, SEQ ID NO 10을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 EmrE, SEQ ID NO 11을 갖는 비피도박테리움 롱검 (Bifidobacterium longum) subsp. 인판티스 (Infantis) (균주 ATCC 15697) 유래 Blon_2331, SEQ ID NO 12를 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_0247, SEQ ID NO 13을 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_0345, SEQ ID NO 14를 갖는 클렙시엘라 뉴모니아에 (Klebsiella pneumoniae) 유래 IceT, SEQ ID NO 53을 갖는 크로노박터 사카자키 (Cronobacter sakazakii) 균주 MOD1_LR753 유래 MdfA, SEQ ID NO 54를 갖는 프란코니박터 풀베리스 (Franconibacter pulveris) LMG 24059 유래 MdfA, SEQ ID NO 55를 갖는 엔테로박터 호르마에케이 (Enterobacter hormaechei) 균주 017 유래 MdfA, SEQ ID NO 56을 갖는 시트로박터 코세리 (Citrobacter koseri) 균주 NCTC10771 유래 MdfA, SEQ ID NO 57을 갖는 살모넬라 엔테리카 (Salmonella enterica) subsp. 아리조나에 (arizonae) 혈청형 41:z4,z23:- 균주 TAMU30EF 유래 MdfA, SEQ ID NO 58을 갖는 시겔라 플렉스네리 (Shigella flexneri) 균주 585219 유래 MdfA, SEQ ID NO 59를 갖는 요케넬라 레겐스부르게이 (Yokenella regensburgei) 균주 UMB0819 유래 MdfA, SEQ ID NO 60을 갖는 에스케리치아 콜라이 균주 AMC_967 유래 MdfA, SEQ ID NO 61을 갖는 클렙시엘라 뉴모니아에 (Klebsiella pneumoniae) VAKPC309 유래 MdfA, SEQ ID NO 62를 갖는 클렙시엘라 옥시토카 (Klebsiella oxytoca) 균주 4928STDY7071490 유래 MdfA, SEQ ID NO 63을 갖는 클렙시엘라 미시가넨시스 (Klebsiella michiganensis) 균주 A2 유래 MdfA, SEQ ID NO 64를 갖는 플루랄리박터 게르고비아에 (Pluralibacter gergoviae) 균주 FDAARGOS_186 유래 MdfA, SEQ ID NO 65를 갖는 클루이베라 아스코르바타 (Kluyvera ascorbata) ATCC 33433 유래 MdfA, SEQ ID NO 66을 갖는 엔테로박터 코베이 (Enterobacter kobei) 유래 MdfA, SEQ ID NO 67을 갖는 렐리오티아 (Lelliottia) sp. WB101 유래 MdfA, SEQ ID NO 68을 갖는 시트로박터 프레운디 (Citrobacter freundii) 유래 MdfA, SEQ ID NO 69를 갖는 살모넬라 엔테리카 (Salmonella enterica) subsp. 살라마에 (Salamae) 유래 MdfA, SEQ ID NO 70을 갖는 시겔라 플렉스네리 (Shigella flexneri) 유래 MdfA, SEQ ID NO 15를 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_2475, SEQ ID NO 16을 갖는 브라디리조비움 자포니쿰 (Bradyrhizobium japonicum) USDA 110 유래 nodi, SEQ ID NO 17을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 xylF, SEQ ID NO 18을 갖는 비피도박테리움 롱검 subsp. 인판티스 Bi-26 유래 TIC77290, SEQ ID NO 19를 갖는 비피도박테리움 롱검 subsp. 인판티스 Bi-26 유래 TIC77291, SEQ ID NO 20을 갖는 비피도박테리움 롱검 subsp. 인판티스 Bi-26 유래 TIC76854 TIC77291 또는 SEQ ID NO 21을 갖는 에스케리치아 콜라이 K12 MG1655 유래 Wza; 또는 상기 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편; 또는 각각 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 15, 16, 17, 18, 19, 20 또는 21을 갖는 상기 막 단백질 중 어느 하나의 전체 길이 서열에 대해 적어도 80% 서열 동일성을 갖는 단백질 서열로부터 선택된다.
방법 및/또는 세포의 대안적인 바람직한 구현예에서, 막 단백질은 TCDB 클래스 1.B.18, 2.A.1.1, 2.A.1.2, 2.A.1.3, 2.A.1.6, 2.A.2.2, 2.A.7.1, 2.A.66, 3.A.1.1 및 3.A.1.2의 군; eggnog 패밀리 05CJ1, 05DAY, 05DFW, 05E8G, 05EGZ, 05EZD, 05I1K, 05JHE, 07HR3, 07QF7 07QRN, 07RBJ, 0814C, 08IJ9 및 08N8A; PFAM 목록 PF00005, PF00528, PF00893, PF01943, PF02563, PF05977, PF07690, PF10531, PF13347, PF13407, PF17912 및 PF18412의 군; interpro 목록 IPR000390, IPR000515, IPR001411, IPR001927, IPR002797, IPR003439, IPR003593, IPR003715, IPR004638, IPR005829, IPR005978, IPR008995, IPR010290, IPR011701, IPR013456, IPR015851, IPR017871, IPR019554, IPR020846, IPR023721, IPR023722, IPR025997, IPR027417, IPR028082, IPR032896, IPR035906, IPR036259, IPR039672, IPR040582 및 IPR040716; SEQ ID NO 01을 갖는 크로노박터 무이트젠시 (Cronobacter muytjensii) 유래 MdfA, SEQ ID NO 02를 갖는 요케넬라 레겐스부르게이 (Yokenella regensburgei) (ATCC43003) 유래 MdfA, SEQ ID NO 03을 갖는 에스케리치아 콜라이 (Escherichia coli) K-12 MG1655 유래 MdfA, SEQ ID NO 04를 갖는 엔테로박터 (Enterobacter) sp. 유래 MdfA, SEQ ID NO 05를 갖는 시트로박터 코세리 (Citrobacter koseri) 유래 MFS, SEQ ID NO 06을 갖는 시트로박터 영애 (Citrobacter youngae) 유래 MdfA, SEQ ID NO 07을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 YbdA, SEQ ID NO 08을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 YjhB, SEQ ID NO 09를 갖는 에스케리치아 콜라이 K-12 MG1655 유래 WzxE, SEQ ID NO 10을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 EmrE, SEQ ID NO 11을 갖는 비피도박테리움 롱검 (Bifidobacterium longum) subsp. 인판티스 (Infantis) (균주 ATCC 15697) 유래 Blon_2331, SEQ ID NO 12를 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_0247, SEQ ID NO 13을 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_0345, SEQ ID NO 14를 갖는 클렙시엘라 뉴모니아에 (Klebsiella pneumoniae) 유래 IceT, SEQ ID NO 53을 갖는 크로노박터 사카자키 (Cronobacter sakazakii) 균주 MOD1_LR753 유래 MdfA, SEQ ID NO 54를 갖는 프란코니박터 풀베리스 (Franconibacter pulveris) LMG 24059 유래 MdfA, SEQ ID NO 55를 갖는 엔테로박터 호르마에케이 (Enterobacter hormaechei) 균주 017 유래 MdfA, SEQ ID NO 56을 갖는 시트로박터 코세리 (Citrobacter koseri) 균주 NCTC10771 유래 MdfA, SEQ ID NO 57을 갖는 살모넬라 엔테리카 (Salmonella enterica) subsp. 아리조나에 (arizonae) 혈청형 41:z4,z23:- 균주 TAMU30EF 유래 MdfA, SEQ ID NO 58을 갖는 시겔라 플렉스네리 (Shigella flexneri) 균주 585219 유래 MdfA, SEQ ID NO 59를 갖는 요케넬라 레겐스부르게이 (Yokenella regensburgei) 균주 UMB0819 유래 MdfA, SEQ ID NO 60을 갖는 에스케리치아 콜라이 균주 AMC_967 유래 MdfA, SEQ ID NO 61을 갖는 클렙시엘라 뉴모니아에 (Klebsiella pneumoniae) VAKPC309 유래 MdfA, SEQ ID NO 62를 갖는 클렙시엘라 옥시토카 (Klebsiella oxytoca) 균주 4928STDY7071490 유래 MdfA, SEQ ID NO 63을 갖는 클렙시엘라 미시가넨시스 (Klebsiella michiganensis) 균주 A2 유래 MdfA, SEQ ID NO 64를 갖는 플루랄리박터 게르고비아에 (Pluralibacter gergoviae) 균주 FDAARGOS_186 유래 MdfA, SEQ ID NO 65를 갖는 클루이베라 아스코르바타 (Kluyvera ascorbata) ATCC 33433 유래 MdfA, SEQ ID NO 15를 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_2475, SEQ ID NO 16을 갖는 브라디리조비움 자포니쿰 (Bradyrhizobium japonicum) USDA 110 유래 nodi, SEQ ID NO 17을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 xylF, SEQ ID NO 18을 갖는 비피도박테리움 롱검 subsp. 인판티스 Bi-26 유래 TIC77290, SEQ ID NO 19를 갖는 비피도박테리움 롱검 subsp. 인판티스 Bi-26 유래 TIC77291, SEQ ID NO 20을 갖는 비피도박테리움 롱검 subsp. 인판티스 Bi-26 유래 TIC76854 TIC77291 또는 SEQ ID NO 21을 갖는 에스케리치아 콜라이 K12 MG1655 유래 Wza; 또는 상기 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편; 또는 각각 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 15, 16, 17, 18, 19, 20 또는 21을 갖는 상기 막 단백질 중 어느 하나의 전체 길이 서열에 대해 적어도 80% 서열 동일성, 바람직하게 적어도 90% 서열 동일성을 갖는 단백질 서열로부터 선택된다.
상기 TCDB 클래스는 2019년 6월 17일 자에 배포된 TCDB.org 에 정의된 바와 같이 분류된다. 상기 eggnog 패밀리는 2016년 9월 배포된 eggnogdb 4.5.1에 정의된 바와 같이 분류된다. 상기 PFAM 목록은 2018년 9월 배포된 Pfam 32.0에 정의된 바와 같이 분류된다. 상기 interpro 목록은 2019년 7월 4일 배포된 InterPro 75.0에 의해 정의된다.
본 명세서에서 사용되는, 임의의 열거된 막 단백질의 전체 길이 서열에 대해 적어도 80% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질은 서열이 각각의 막 단백질의 아미노산 서열의 전체 길이에 대해 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 91.50%, 92.00%, 92.50%, 93.00%, 93.50%, 94.00%, 94.50%, 95.00%, 95.50%, 96.00%, 96.50%, 97.00%, 97.50%, 98.00%, 98.50%, 99.00%, 99.50%, 99.60%, 99.70%, 99.80%, 99.90% 서열 동일성을 갖는 것으로 이해한다. 본 발명의 상황에서, 기준 막 단백질 'Z'의 전체 길이 서열 (일반적으로 SEQ ID NO로 표시)과 예를 들어 적어도 80% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질/폴리펩티드 (예를 들어, 설명 및 청구항 전반에 개시된 바와 같은 단백질 서열을 갖는 막 단백질)는 본 명세서에 기술된 바와 같이 코어 당류로서 LN3을 갖는 올리고당을 수송할 수 있는 단백질 (즉, 막 단백질)을 의미하고, 다시 마래, 단백질은 코어 당류로서 LN3을 갖는 올리고당을 수송하는 기준 막 단백질 'Z'의 기능적 특징을 보유한다. 유사하게, 기준 막 단백질 'Z'의 전체 길이 서열 (일반적으로 SEQ ID NO로 표시)과 예를 들어 적어도 80% 서열 동일성을 갖는 단백질 서열은 본 명세서에 기술된 바와 같은 코어 당류로서 LN3을 갖는 올리고당을 수송할 수 있는 단백질 (즉, 막 단백질)을 의미하고, 다시 말해, 단백질은 코어 당류로서 LN3을 갖는 올리고당을 수송하는 기준 막 단백질 'Z'의 기능적 특징을 보유한다. 본 명세서에 기술된 바와 같은 코어 당류로서 올리고당을 수송하는 막 단백질의 능력은 예를 들어, 본 발명의 실시예에 기술된 바와 같이, 당업자가 평가할 수 있다.
이러한 막 단백질의 아미노산 서열은 첨부된 서열 목록의 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69 또는 70으로부터 선택되고, 바람직하게 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64 또는 65로부터 선택되고, 보다 바람직하게 SEQ ID NO 01, 02, 04, 05, 06, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69 또는 70으로부터 선택되고, 보다 더 바람직하게 SEQ ID NO 01, 02, 04, 05, 06, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64 또는 65로부터 선택되고, 보다 더 바람직하게 SEQ ID NO 01, 02, 04, 05, 06, 55, 59, 66 또는 68로부터 선택되고, 가장 바람직하게 SEQ ID NO 01, 02, 04, 05, 06, 55 또는 59로부터 선택되는 서열, 또는 각각 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67 ,68, 69 또는 70 중 어느 하나의 전체 길이 아미노산 서열에 대해 적어도 80% 서열 동일성, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 91.50%, 92.00%, 92.50%, 93.00%, 93.50%, 94.00%, 94.50%, 95.00%, 95.50%, 96.00%, 96.50%, 97.00%, 97.50%, 98.00%, 98.50%, 99.00%, 99.50%, 99,60%, 99,70%, 99,80%, 99,90%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 보다 더 바람직하게 적어도 97.00%, 가장 바람직하게 적어도 99.00%, 서열 동일성을 갖는 아미노산 서열일 수 있다.
대안적으로, 이러한 막 단백질의 아미노산 서열은 첨부된 서열 목록의 SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 59, 61, 62, 63, 64, 65, 66, 67 또는 69로부터 선택되고, 바람직하게 SEQ ID NO SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64, 65, 66, 67 또는 69로부터 선택되고, 보다 바람직하게 SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64 또는 65로부터 선택되고, 보다 더 바람직하게 SEQ ID NO 01, 02, 04, 55, 59, 66 또는 68로부터 선택되거, 보다 더 바람직하게 SEQ ID NO 01, 02, 04, 55 또는 59로부터 선택되고, 보다 더 바람직하게 SEQ ID NO 01, 02 또는 04로부터 선택되고, 보다 더 바람직하게 SEQ ID NO 01 또는 02로부터 선택되고, 가장 바람직하게 SEQ ID NO 01인 서열일 수 있거나, 또는 각각 SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 59, 61, 62, 63, 64, 65, 66, 67 또는 69 중 어느 하나의 전체 길이 아미노산 서열에 대해 적어도 80% 서열 동일성, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 91.50%, 92.00%, 92.50%, 93.00%, 93.50%, 94.00%, 94.50%, 95.00%, 95.50%, 96.00%, 96.50%, 97.00%, 97.50%, 98.00%, 98.50%, 99.00%, 99.50%, 99,60%, 99,70%, 99,80%, 99,90%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 보다 더 바람직하게 적어도 97.00%, 가장 바람직하게 적어도 99.00%, 서열 동일성을 갖는 아미노산 서열일 수 있다.
본 발명의 방법 및/또는 세포의 추가 구현예에서, 숙주 세포는 세포벽의 외막을 가로지르는 화합물의 수송에 관여되는 수송체 단백질인 막 단백질을 발현한다. 바람직하게 세포는 락토스 수송체, 글루코스 수송체, 갈락토스 수송체 또는 뉴클레오티드-활성화된 당에 대한 수송체, 예컨대, 예를 들어, UDP-GlcNAc에 대한 수송체를 포함하는 군으로부터 선택되는 단백질을 코딩하는 적어도 하나의 핵산 서열을 포함하도록 형질전환된다.
본 발명의 방법 및/또는 세포의 다른 바람직한 구현예에 따라서, 세포는 하나 초과의 막 단백질을 발현한다.
보다 바람직한 대안적인 구현예에서, 상기 막 단백질이 SEQ ID NO 10을 갖는 비. 롱검 (B. longum) subsp. 인판티스 (Infantis) (균주 ATCC 15697) 유래 Blon_0247일 때, 상기 Blon_0247는 비. 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_0245와 함께 발현된다.
보다 바람직한 대안적인 구현예에서, 상기 막 단백질이 SEQ ID NO 9를 갖는 비. 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon2331일 때, 상기 Blon2331은 Blon2332와 함께 발현된다.
보다 바람직한 대안적인 구현예에서, 상기 막 단백질이 SEQ ID NO 15를 갖는 브라디리조비움 자포니쿰 (Bradyrhizobium japonicum) USDA 110 유래 Bjnodi일 때, 상기 Bjnodi는 결절형성 인자 nodj와 함께 발현된다.
보다 바람직한 대안적인 구현예에서, 상기 막 단백질이 SEQ ID NO 20을 갖는 이.콜라이 K-12 MG1655 유래 wza일 때, 상기 wza는 wzx, wzb 및/또는 wzc 중 어느 하나 이상과 함께 발현된다.
본 발명의 방법 및/또는 세포의 다른 바람직한 구현예에 따라서, 세포는 푸코실트랜스퍼라제, 시알릴트랜스퍼라제, 갈락토실트랜스퍼라제, 글루코실트랜스퍼라제, 만노실트랜스퍼라제, N-아세틸글루코사미닐트랜스퍼라제, N-아세틸갈락토사미닐트랜스퍼라제, N-아세틸만노사미닐트랜스퍼라제, 자일로실트랜스퍼라제, 글루쿠로닐트랜스퍼라제, 갈락투로닐트랜스퍼라제, 글루코사미닐트랜스퍼라제, N-글리코릴뉴라미닐트랜스퍼라제, 람노실트랜스퍼라제, N-아세틸람노실트랜스퍼라제, UDP-4-아미노-4,6-디데옥시-N-아세틸-베타-L-알트로사민 트랜스아미나제, UDP-N-아세틸글루코사민 에놀피루빌 트랜스퍼라제 및 푸코사미닐트랜스퍼라제를 포함하는 목록으로부터 선택되는 글리코실트랜스퍼라제를 발현한다.
본 발명의 방법 및/또는 세포의 바람직한 구현예에서, 세포는 상기 글리코실트랜스퍼라제 중 적어도 하나의 발현 또는 활성이 변형된다. 바람직한 구현예에서, 상기 글리코실트랜스퍼라제는 변형된 발현 또는 활성을 갖는 세포의 내생성 단백질이고, 바람직하게 상기 내생성 글리코실트랜스퍼라제는 과발현되고; 대안적으로 상기 글리코실트랜스퍼라제는 상기 세포에서 이종적으로 도입되어 발현되는, 바람직하게 과발현되는 이종성 단백질이다. 상기 내생성 글리코실트랜스퍼라제는 이종성 글리코실트랜스퍼라제를 또한 발현하는 세포에서 변형된 발현을 가질 수 있다.
본 발명의 방법 및/또는 세포의 추가의 바람직한 구현예에서, 세포는 베타-1,3 연결로 LN3의 말단 GlcNAc 잔기로 UDP-Gal로부터 갈락토스 (Gal)를 전달하여서 락토-N-테트라오스 (LNT; Gal-베타1,3-GlcNAc-베타1,3-Gal-베타1,4-Glc)를 생산하는 N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제를 발현한다.
본 발명의 방법 및/또는 세포의 추가의 바람직한 구현예에서, 세포는 전체 액체배지 및/또는 상청액에서 90 g/L 이상의 LNT를 생산하고/하거나 전체 액체배지 및/또는 상청액 중 상기 LNT는 각각 전체 액체배지 및/또는 상청액 중 상기 세포에 의해 생산된 LNT 및 NL3의 총량에 대해 측정된 적어도 80%의 순도를 갖는다. 바람직하게, 세포는 상청액에서 90 g/L 이상의 LNT를 생산하고, 상기 LNT는 상청액 중 상기 세포에 의해 생산되는 LNT 및 LN3의 총량에 대해 측정된 적어도 80%의 순도를 갖는다. 본 발명의 방법 및/또는 세포의 보다 바람직한 구현예에서, 전체 액체배지 및/또는 상청액 중 상기 90 g/L 이상의 LNT는 배양 과정, 바람직하게 발효배양 과정으로 배양된 상기 세포에 의해 수득된다. 본 발명의 방법 및/또는 세포의 다른 보다 바람직한 구현예에서, 전체 액체배지 및/또는 상청액 중 상기 세포에 의해 생산된 LNT 및 LN3의 총량에 대해 측정된 적어도 80%의 전체 액체배지 및/또는 상청액 중 LNT의 상기 순도는 배양 과정, 바람직하게 발효배양 과정으로 배양된 상기 세포에 의해 수득된다.
전체 액체배지 또는 상청액 중 LNT 및 LN3의 총량에 대한 적어도 80%의 LNT의 순도는 각각 전체 액체배지 또는 상청액 중 세포에 의해 생산된 LNT 및 LN3의 총량에 대해 측정된 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 95.5, 96, 96.5, 97, 97.5, 98, 98.5, 99 또는 99.5%의 LNT를 포함하는, 80% 이상의, 각각 전체 액체배지 또는 상청액 중 LNT 및 LN3의 혼합물 내 상기 LNT의 양으로서 이해해야 한다.
본 발명의 방법 및/또는 세포의 추가 및/또는 대안적인 추가의 바람직한 구현예에서, 세포는 베타-1,4 연결로 LN3의 말단 GlcNAc 잔기로 UDP-Gal 도너로부터 갈락토스 (Gal)를 전달하여서, 락토-N-네오테트라오스 (LNnT; Gal-베타1,4-GlcNAc-베타1,3-Gal-베타1,4-Glc)를 생산하는 N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제를 발현한다.
본 발명의 방법 및/또는 세포의 추가의 바람직한 구현예에서, 세포는 전체 액체배지 및/또는 상청액에서 70 g/L 이상, 바람직하게 90 g/L 이상의 LNnT를 생산하고/하거나, 전체 액체배지 및/또는 상청액 중 상기 LNnT는 각각 전체 액체배지 및/또는 상청액 중에서 상기 세포에 의해 생산되는 LNnT 및 LN3의 총량에 대해 측정된 적어도 80%의 순도를 갖는다. 바람직하게, 세포는 상청액에서 70 g/L 이상, 바람직하게 90 g/L 이상의 LNnT를 생산하고, 상기 LNnT는 상청액 중에서 상기 세포에 의해 생산되는 LNnT 및 LN3의 총량에 대해 측정된 적어도 80%의 순도를 갖는다. 본 발명의 방법 및/또는 세포의 보다 바람직한 구현예에서, 전체 액체 배지 및/또는 상청액 중 상기 70 g/L 이상, 바람직하게 90 g/L 이상의 LNnT는 배양 과정, 바람직하게 발효배양 과정으로 배양된 상기 세포에 의해 수득된다. 본 발명의 방법 및/또는 세포의 다른 보다 바람직한 구현예에서, 전체 액체배지 및/또는 상청액 중에서 상기 세포에 의해 생산된 LNnT 및 LN3의 총량에 대해 측정된 적어도 80%의 전체 액체배지 및/또는 상청액 중 LNnT의 상기 순도는 배양 과정, 바람직하게 발효배양 과정으로 배양된 상기 세포에 의해 수득된다.
전체 액체배지 또는 상청액 중 LNnT 및 LN3의 총량에 대한 적어도 80%의 LNnT의 순도는 각각 전체 액체배지 또는 상청액 중에서 세포에 의해 생산된 LNnT 및 LN3의 총량에 대해 측정된 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 95.5, 96, 96.5, 97, 97.5, 98, 98.5, 99 또는 99.5%의 LNnT를 포함하여, 80% 이상의, 각각 전체 액체배지 또는 상청액 중 LNnT 및 LN3의 혼합물 중 상기 LNnT의 양으로 이해해야 한다.
본 발명의 방법 및/또는 세포의 다른 바람직한 구현예에 따라서, 세포는 코어 삼당류로서 락토-N-트리오스 (LN3; GlcNAc-베타1,3-Gal-베타1,4-Glc)를 포함하는 상기 올리고당의 생산에서 사용하려는 뉴클레오티드-활성화된 당을 합성할 수 있다. 본 발명의 방법 및/또는 세포의 바람직한 구현예에서, 뉴클레오티드-활성화된 당은 UDP-N-아세틸갈락토사민 (UDP-GalNAc), UDP-N-아세틸만노사민 (UDP-ManNAc), UDP-글루코스 (UDP-Glc), UDP-갈락토스 (UDP-Gal), GDP-만노스 (GDP-Man), UDP-글루쿠로네이트, UDP-갈락투로네이트, UDP-2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, UDP-2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, UDP-N-아세틸-L-람노사민 (UDP-L-RhaNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-만노스), dTDP-N-아세틸푸코사민, UDP-N-아세틸푸코사민 (UDP-L-FucNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-갈락토스), UDP-N-아세틸-L-뉴모사민 (UDP-L-PneNAC 또는 UDP-2-아세타미도-2,6-디데옥시-L-탈로스), UDP-N-아세틸무람산, UDP-N-아세틸-L-퀴노보사민 (UDP-L-QuiNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-글루코스), CMP-시알산 (CMP-Neu5Ac), CMP-N-글리코릴뉴라민산 (CMP-Neu5Gc), GDP-푸코스 (GDP-Fuc), GDP-람노스 및 UDP-자일로스를 포함하는 목록으로부터 선택된다.
추가적으로, 또는 대안적으로, 본 명세서에서 사용되는 숙주 세포는 GDP-푸코스의 신규 합성을 발현하도록 임의로 유전자 변형된다. GDP-푸코스는 세포에서 발현되는 효소에 의해서 또는 세포의 물질대사에 의해서 제공될 수 있다. GDP-푸코스를 생산하는 이러한 세포는 예를 들어, 세포에 첨가되는, 푸코스를 GDP-푸코스로 전환시키는 효소를 발현할 수 있다. 이러한 효소는 예를 들어, 이기능성 푸코스 키나제/푸코스-1-포스페이트 구아닐릴트랜스퍼라제, 예컨대 테로이데스 프라질리스 (Bacteroides fragilis) 유래 Fkp, 또는 호모 사피엔스 (Homo sapiens), 수스 스크로파 (Sus scrofa) 및 라투스 노르베지쿠스 (Rattus norvegicus)를 포함한 몇개 종에서 알려진 바와 같은 하나의 별개 푸코스-1-포스페이트 구아닐릴트랜스퍼라제와 함께 하나의 별개 푸코실 키나제의 조합일 수 있다. 바람직하게, 세포는 GDP-푸코스를 생산하도록 변형된다. 보다 바람직하게, 세포는 증강된 GDP-푸코스 생산을 위해 변형된다. 상기 변형은 UDP-글루코스:운데카프레닐-포스페이트 글루코스-1-포스페이트 트랜스퍼라제 코딩 유전자의 녹-아웃, GDP-L-푸코스 신타제 코딩 유전자의 과-발현, GDP-만노스 4,6-데히드라타제 코딩 유전자의 과-발현, 만노스-1-포스페이트 구아닐릴트랜스퍼라제 코딩 유전자의 과-발현, 포스포만노뮤타제 코딩 유전자의 과-발현 및 만노스-6-포스페이트 이소머라제 코딩 유전자의 과-발현을 포함하는 군으로부터 선틱되는 어느 하나 이상일 수 있다.
추가적으로, 또는 대안적으로, 본 명세서에서 사용되는 숙주 세포는 CMP-Neu5Ac의 신규 합성을 발현하도록 임의로 유전자 변형된다. CMP-Neu5Ac는 세포에서 발현되는 효소에 의해 또는 세포의 물질대사에 의해 제공될 수 있다. CMP-Neu5Ac를 생산하는 이러한 세포는 예를 들어, 세포에 첨가되는 시알산을 CMP-Neu5Ac로 전환시키는 효소를 발현할 수 있다. 이러한 효소는 CMP-시알산 신써타제, 예컨대 호모 사피엔스 (Homo sapiens), 네이세리아 메닌지티디스 (Neisseria meningitidis), 및 파스퇴렐라 멀토시다 (Pasteurella multocida)를 포함하는 몇몇 종 유래의 N-아실뉴라미네이트 시티딜릴트랜스퍼라제일 수 있다. 바람직하게, 세포는 CMP-Neu5Ac를 생산하도록 변형된다. 보다 바람직하게, 세포는 증강된 CMP-Neu5Ac 생산을 위해 변형된다. 상기 변형은 N-아세틸글루코사민-6-포스페이트 데아세틸라제의 녹-아웃, 글루코사민-6-포스페이트 데아미나제의 녹-아웃, 시알레이트 신타제 코딩 유전자의 과-발현, 및 N-아세틸-D-글루코사민-2-에피머라제 코딩 유전자의 과-발현을 포함하는 군으로부터 선택되는 어느 하나 이상일 수 있다.
추가적으로, 또는 대안적으로, 본 명세서에서 사용되는 숙주 세포는 UDP-Gal의 신규 합성을 발현하도록 임의로 유전자 변형된다. UDP-Gal은 세포에서 발현되는 효소에 의해서 또는 세포의 물질대사에 의해서 제공될 수 있다. UDP-Gal을 생산하는 이러한 세포는 예를 들어, UDP-글루코스를 UDP-Gal로 전환시키는 효소를 발현할 수 있다. 이러한 효소는 호모 사피엔스, 에스케리치아 콜라이, 및 라투스 노르베지쿠스를 포함한 몇몇 종에서 알려진 바와 같은 예를 들어 UDP-글루코스-4-에피머라제 GalE일 수 있다. 바람직하게, 세포는 UDP-Gal을 생산하도록 변형된다. 보다 바람직하게, 세포는 증강된 UDP-Gal 생산을 위해 변형된다. 상기 변형은 이기능성 5'-뉴클레오티다제/UDP-당 히드롤라제 코딩 유전자의 녹-아웃, 갈락토스-1-포스페이트 우리딜릴트랜스퍼라제 코딩 유전자의 녹-아웃 및 UDP-글루코스-4-에피머라제 코딩 유전자의 과-발현을 포함하는 군으로부터 선택되는 어느 하나 이상일 수 있다.
선택된 단당류, 이당류 또는 올리고당에 대한 세포의 이화 경로는 적어도 부분적으로 불활성화된 것이 일반적으로 바람직하고, 단당류, 이당류 또는 올리고당은 코어 삼당류로서 LN3을 갖는 올리고당의 합성에 관여되고/되거나 필요하다.
본 발명의 방법 및/또는 세포의 다른 바람직한 구현예에 따라서, 코어 삼당류로서 LN3을 포함하는 올리고당은 코어 삼당류로서 LN3을 포함하는 포유동물 모유 올리고당 또는 루이스-유형 항원 올리고당이다.
본 발명의 방법 및/또는 세포의 다른 바람직한 구현예에 따라서, 세포는 코어 삼당류로서 LN3을 포함하는 적어도 하나의 올리고당을 포함하는 올리고당의 혼합물을 합성할 수 있다.
특정 예시적인 구현예에서, 본 발명의 방법은 고수율로 코어 삼당류로서 LN3을 갖는 올리고당의 생산을 제공한다. 방법은 락토스를 함유하는 수성 배양 또는 발효배양 배지에서, 유전자 조작된 세포, 바람직하게 이.콜라이, 보다 바람직하게 LacZ 유전자 및 nagB 유전자를 녹-아웃시켜서 변형된 이. 콜라이 세포를 배양 또는 발효배양하는 단계를 포함한다. 보다 더 바람직하게, 추가적으로 이.콜라이 lacY 유전자, 자이모모나스 모빌리스 (Zymomonas mobilis)로부터 기원하는 프룩토스 키나제 유전자 (frk) 및 비피도박테리움 아돌레센티스 (Bifidobacterium adolescentis)로부터 기원하는 수크로스 포스포릴라제 (SP)는 게놈으로 녹-인되어서 항상적으로 발현될 수 있다. 항상성 프로모터는 De Mey et al. (BMC Biotechnology, 2007) 및 Mutalik et al. (Nat. Methods 2013, No. 10, 354-360)에 의해 기술된 프로모터 라이브러리로부터 기원된다. 추가적으로, 변형된 이. 콜라이 세포는 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제를 코딩하는 재조합 유전자 및 본 발명의 올리고당을 합성하는 LN3을 변형시킬 수 있는 글리코실트랜스퍼라제를 코딩하는 다른 재조합 유전자를 갖는다. 세포는 또한 본 명세서에 기술된 바와 같은 막 단백질 중 어느 하나의 발현을 코딩하는 재조합 유전자를 포함한다.
본 발명의 방법 및/또는 세포의 다른 바람직한 구현예에 따라서, 세포는 코어 삼당류로서 LN3을 포함하는 상기 올리고당의 합성을 위해서 전구체를 사용한다. 방법 및/또는 세포의 바람직한 구현예에서, 막 단백질은 코어 삼당류로서 LN3을 포함하는 상기 올리고당의 합성을 위한 전구체의 흡수에 관여된다. 다른 바람직한 구현예에서, 세포는 코어 삼당류로서 LN3을 포함하는 상기 올리고당의 합성을 위한 전구체를 생산한다.
본 발명의 다른 구현예는 글리코실화된 생산물이 박테리아, 효모 또는 진균, 또는 식물 세포, 동물 세포, 비-인간 포유동물 세포, 곤충 세포 또는 원충으로 이루어진 목록으로부터 선택되는 미생물에서 및/또는 미생물에 의해서 생산되는 방법 및 세포를 제공한다. 후자의 박테리아는 바람직하게 프로테오박테리아 (Proteobacteria) 문 또는 피르미큐테스 (Firmicutes) 문 또는 시아노박테리아 (Cyanobacteria) 문 또는 데이노코쿠스-써무스 (Deinococcus-Thermus) 문에 속한다. 프로테오박테리아 문에 속하는 후자의 박테리아는 바람직하게 엔테로박테리아세아에 과, 바람직하게 에스케리치아 콜라이 (Escherichia coli) 종에 속한다. 후자의 박테리아는 바람직하게 에스케리치아 콜라이 종 예컨대, 제한없이 에스케리치아 콜라이 B, 에스케리치아 콜라이 C, 에스케리치아 콜라이 W, 에스케리치아 콜라이 K12, 에스케리치아 콜라이 니슬 (Nissle)에 속하는 임의 균주와 관련된다. 보다 특히,후자의 용어는 실험실 환경에 충분히 적합화되고, 야생형 균주와 달리, 장에서 생존하는 그들 능력을 상실한 - 이. 콜라이 K12 균주로서 명명된 - 배양된 에스케리치아 콜라이 균주에 관한 것이다. 이.콜라이 K12 균주의 잘 알려진 예는 K12 야생형, W3110, MG1655, M182, MC1000, MC1060, MC1061, MC4100, JM101, NZN111 및 AA200이다. 따라서, 바람직하게 본 발명은 특히 상기 표시된 바와 같은 돌연변이되고/되거나 형질전환된 에스케리치아 콜라이 균주에 관한 것으로서, 상기 이.콜라이 균주는 K12 균주이다. 보다 특히, 본 발명은 상기 표시된 바와 같은 돌연변이되고/되거나 형질전환된 에스케리치아 콜라이 균주에 관한 것으로서, 상기 K12 균주는 이.콜라이 MG1655이다. 피르미큐테스 문에 속하는 후자의 박테리아는 바람직하게 바실리 (Bacilli), 바람직하게 바실러스 (Bacillus) 종, 예컨대, 바실러스 서브틸리스 (Bacillus subtilis) 또는 비. 아밀로리케파시엔스 (B. amyloliquefaciens)에 속한다. 아시네토박테리아 문에 속하는 후자의 박테리아는 바람직하게, 코리네박테리아세아에 (Corynebacteriaceae) 과에 속하는 것으로서, 이의 구성원인 코리네박테리움 글루타미쿰 (Corynebacterium glutamicum) 또는 씨. 아페르멘탄스 (C. afermentans)가 있거나, 또는 스트렙토마이세타세아에 (Streptomycetaceae) 과에 속하는 것으로서, 이의 구성원인 스트렙토마이세스 그리세우스 (Streptomyces griseus) 또는 에스. 프라디아에 (S. fradiae)가 있다. 후자의 효모는 바람직하게 아스코마이코타 (Ascomycota) 문 또는 바시디오마이코타 (Basidiomycota) 문 또는 듀테로마이코타 (Deuteromycota) 문 또는 자이고마이세테스 (Zygomycetes) 문에 속한다. 후자의 효모는 바람직하게 사카로마이세스 (Saccharomyces) (예컨대, 예를 들어, 사카로마이세스 세레비지아에 (Saccharomyces cerevisiae), 에스. 바야누스 (S. bayanus), 에스. 보울라르디 (S. boulardii)) 같은 구성원), 피키아 (Pichia) (예컨대, 예를 들어, 피키아 파스토리스 (Pichia pastoris), 피. 아노말라 (P. anomala), 피. 클루이베리 (P. kluyveri)) 같은 구성원), 코마가타엘라 (Komagataella), 한수넬라 (Hansunella), 클루이베로마이세스 (Kluyveromyces) (예컨대, 예를 들어, 클루이베로마이세스 락티스 (Kluyveromyces lactis), 케이. 마르시아누스 (K. marxianus), 케이. 써모톨레란스 (K. thermotolerans) 같은 구성원), 야로위아 (Yarrowia) (예컨대, 예를 들어, 야로위아 리폴리티카 (Yarrowia lipolytica)), 에레모테시움 (Eremothecium), 자이고사카로마이세스 (Zygosaccharomyces), 스타르메렐라 (Starmerella) (예컨대, 예를 들어, 스타르메렐라 봄비콜라 (Starmerella bombicola)) 또는 데바로마이세스 (Debaromyces)의 속에 속한다. 후자의 효모는 바람직하게피키아 파스토리스, 야로위아 리폴리티카, 사카로마이세스 세레비지아에 , 및 클루이베로마이세스 락티스로부터 선택된다. 후자의 진균은 바람직하게 리조푸스 (Rhizopus), 딕티오스텔리움 (Dictyostelium), 페니실리움 (Penicillium), 무코르 (Mucor) 또는 아스퍼질러스 (Aspergillus)의 속에 속한다. "식물 세포"는 개화 및 비-개화 식물의 세포를 비롯한, 조류 세포, 예를 들어, 클라미도모나스 (Chlamydomonas), 클로렐라 (Chlorella) 등을 포함한다. 바람직하게, 상기 식물 세포는 담배, 알파파, 벼, 목화, 유채, 토마토, 곡물, 옥수수 또는 대두 세포를 포함한다. 후자의 동물 세포는 바람직하게 비-인간 포유동물 (예를 들어, 소, 물소, 돼지, 양, 마우스, 래트), 조류 (예를 들어, 닭, 오리, 타조, 칠면조, 꿩), 어류 (예를 들어, 황새치, 연어, 참치, 농어, 송어, 메기), 무척추동물 (예를 들어, 바닷가재, 게, 새우, 조개, 굴, 홍합, 성게), 파충류 (예를 들어, 뱀, 악어, 거북이), 양서류 (예를 들어, 개구리) 또는 곤충 (예를 들어, 파리, 선충)으로부터 유래되거나 또는 배아 줄기 세포를 제외한 인간 세포로부터 유래되는 유전자 조작된 세포주이다. 인간 및 비-인간 포유동물 세포는 바람직하게 WO21067641에 기술된 바와 같이, 상피 세포 예컨대, 예를 들어, 유선 상피 세포, 배아 신장 세포 (예를 들어, HEK293 또는 HEK 293T 세포), 섬유아세포, COS 세포, 중국 햄스터 난소 (CHO) 세포, 쥐 골수종 세포 예컨대, 예를 들어, N20, SP2/0 또는 YB2/0 세포, NIH-3T3 세포, 비-유선 성체 줄기 세포 또는 이의 유도체를 포함하는 목록으로부터 선택된다. 상기 곤충 세포는 바람직하게 스포돕테라 프루기페르다 (Spodoptera frugiperda) 예컨대, 예를 들어 Sf9 또는 Sf21 세포, 봄빅스 모리 (Bombyx mori), 마메스트라 브라시카에 (Mamestra brassicae), 트리코플루시아 니 (Trichoplusia ni) 예컨대, 예를 들어 BTI-TN-5B1-4 세포 또는 드로소필라 멜라노가스터 (Drosophila melanogaster) 예컨대, 예를 들어, 드로소필라 (Drosophila) S2 세포로부터 유래된다. 후자의 원충 세포는 바람직하게 리슈마니아 타렌톨라에 (Leishmania tarentolae) 세포이다.
바람직한 구현예에서 세포는 미생물의 세포이고, 보다 바람직하게 상기 미생물은 박테리아 또는 효모이다. 보다 바람직한 구현예에서, 미생물은 박테리아, 가장 바람직하게 에스케리치아 콜라이이다. 이러한 이. 콜라이의 사용 예는 본 명세서에 기술된다.
다른 보다 바람직한 구현예에서, 세포는 효모이다.
다른 구현예는 배지에서 안정하게 배양되는 세포를 제공하는 것이고, 상기 배지는 최소 배지, 복합 배지, 또는 예컨대 예를 들어 제한없이 비타민, 미량 원소, 아미노산같은 일정 화합물이 농후화된 성장 배지를 포함한 임의 유형의 성장 배지일 수 있다.
본 명세서에서 사용되는 미생물 또는 세포는 주요 탄소 공급원으로서 단당류, 이당류, 올리고당, 다당류, 폴리올, 복합 배지 또는 이의 혼합물에서 성장할 수 있다. 용어 주요는 관심 올리고당, 생물량 형성, 이산화탄소 및/또는 부산물 형성 (예컨대, 산 및/또는 알콜, 예컨대, 아세테이트, 락테이트, 및/또는 에탄올)를 위해 가장 중요한 탄소 공급원을 의미하고, 다시 말해서, 모든 필요한 탄소의 20, 30, 40, 50, 60, 70, 75, 80, 85, 90, 95, 98, 99%가 상기 표시된 탄소 공급원으로부터 유래된다. 본 발명의 일 구현예에서, 상기 탄소 공급원은 상기 유기체에 대한 유일한 탄소 공급원이고, 다시 말해서, 모든 필요한 탄소의 100%는 상기 표시된 탄소 공급원으로부터 유래된다. 일반적인 주요 탄소 공급원은 글루코스, 글리세롤, 프룩토스, 말토스, 락토스, 아라비노스, 말토-올리고당, 말토트리오스, 솔비톨, 자일로스, 람노스, 수크로스, 갈락토스, 만노스, 메탄올, 에탄올, 트레할로스, 전분, 셀룰로스, 헤미-셀룰로스, 옥수수 침지액, 고-프룩토스 시럽, 아세테이트, 시트레이트, 락테이트 및 피루베이트를 포함하지만, 이에 제한되지 않는다. 용어 복합 배지는 정확한 성분이 결정되지 않은 배지를 의미한다. 예에는 당밀, 옥수수 침지액, 펩톤, 트립톤 또는 효모 추출물이 있다.
추가의 바람직한 구현예에서, 본 명세서에 기술된 미생물 또는 세포는 본 명세서에 참조로 편입되는, WO2012/007481에 기술된 바와 같이 생산 경로 및 생물량 경로를 갖는 분할 물질대사를 사용한다. 상기 유기체는 예를 들어, 포스포글루코이소머라제 유전자, 포스포프룩토키나제 유전자, 프룩토스-6-포스페이트 알돌라제 유전자, 프룩토스 이소머라제 유전자, 및/또는 프룩토스:PEP 포스포트랜스퍼라제 유전자로부터 선택되는 유전자를 변경시켜서 프룩토스-6-포스페이트를 축적하도록 유전자 변형될 수 있다.
추가의 바람직한 구현예에서, 본 명세서에 기술된 바와 같은 코어 삼당류로서 LN3을 갖는 올리고당을 제조하기 위한 방법은 하기 단계 중 적어도 하나를 포함한다:
i) 배양 배지에 초기 반응기 부피 리터 당 적어도 50, 보다 바람직하게 적어도 75, 보다 바람직하게 적어도 100, 보다 바람직하게 적어도 120, 보다 바람직하게 적어도 150 그램의 락토스를 포함하는 락토스 공급물을, 바람직하게 연속 방식으로, 바람직하게 배양 배지의 최종 부피가 상기 락토스 공급물 첨가 전 배양 배지의 3배 이하, 바람직하게 2배 이하, 보다 바람직하게 2배 미만이 되도록 첨가하는 단계로서, 전체 반응기 부피는 250 mL (밀리리터) 내지 10.000 ㎥ (입방 미터) 범위인, 단계;
ii) 락토스 공급물을 연속 방식으로 배양 배지에 1일, 2일, 3일, 4일, 5일의 과정 동안 공급 용액을 통해 첨가하는 단계; 
iii) 락토스 공급물을 연속 방식으로 배양 배지에 1일, 2일, 3일, 4일, 5일의 과정 동안 공급 용액을 통해 첨가하는 단계로서, 상기 락토스 공급 용액의 농도는 50 g/L, 바람직하게 75 g/L, 보다 바람직하게 100 g/L, 보다 바람직하게 125 g/L, 보다 바람직하게 150 g/L, 보다 바람직하게 175 g/L, 보다 바람직하게 200 g/L, 보다 바람직하게 225 g/L, 보다 바람직하게 250 g/L, 보다 바람직하게 275 g/L, 보다 바람직하게 300 g/L, 보다 바람직하게 325 g/L, 보다 바람직하게 350 g/L, 보다 바람직하게 375 g/L, 보다 바람직하게, 400 g/L, 보다 바람직하게 450 g/L, 보다 바람직하게 500 g/L, 보다 더 바람직하게, 550 g/L, 가장 바람직하게 600 g/L이고; 바람직하게 상기 용액의 pH는 3과 7 사이로 설정되고,
바람직하게 상기 공급 용액의 온도는 20℃와 80℃ 사이로 유지되는 것인 단계.
상기 방법은 상기 배양 배지의 최종 부피 중에서 적어도 50 g/L, 바람직하게 적어도 75 g/L, 보다 바람직하게 적어도 90 g/L, 보다 바람직하게 적어도 100 g/L, 보다 바람직하게 적어도 125 g/L, 보다 바람직하게 적어도 150 g/L, 보다 바람직하게 적어도 175 g/L, 보다 바람직하게 적어도 200 g/L의 농도로, 코어 삼당류로서 LN3을 갖는 상기 올리고당을 생성시킨다.
바람직하게, 락토스 공급은 배양의 시작 부터 락토스를 적어도 5 mM의 농도, 바람직하게 30, 40, 50, 60, 70, 80, 90, 100, 150 mM의 농도, 보다 바람직하게 > 300 mM의 농도로 첨가하여 수행된다.
다른 구현예에서 락토스 공급은 배양의 생산 단계 전반에서 적어도 5 mM, 바람직하게 10 mM 또는 30 mM의 락토스 농도가 수득되는, 농도로 배양 배지에 락토스를 첨가하여 수행된다.
본 명세서에 기술된 방법의 추가 구현예에서, 숙주 세포는 적어도 약 60, 80, 100, 또는 약 120시간 동안 또는 연속 방식으로 배양된다.
본 명세서에 기술된 방법의 다른 구현예에서, 탄소 및 에너지 공급원, 바람직하게 글루코스, 글리세롤, 프룩토스, 말토스, 아라비노스, 말토덱스트린, 말토-올리고당, 말토트리오스, 솔비톨, 자일로스, 람노스, 수크로스, 갈락토스, 만노스, 메탄올, 에탄올, 트레할로스, 전분, 셀룰로스, 헤미-셀룰로스, 폴리올, 옥수수 침지액, 고-프룩토스 시럽, 숙시네이트, 말레이트, 아세테이트, 시트레이트, 락테이트, 피루베이트 및/또는 락토스가 또한, 바람직하게 연속으로 배양 배지에, 바람직하게 락토스와 첨가된다.
바람직한 구현예에서, 탄소-기반 기질, 바람직하게 수크로스는 배양 배지에 3일 이상 동안, 바람직하게 7일 까지 제공되고/되거나, 배양 배지에, 초기 배양 리터 당 적어도 100, 유리하게 적어도 105, 보다 유리하게 적어도 110, 보다 더 유리하게 적어도 120 그램의 수크로스를, 연속 방식으로, 배양 배지의 최종 부피가 배양 전 배양 배지 부피의 3배 이하, 유리하게 2배 이하, 보다 유리하게 2배 미만이도록 제공된다.
바람직하게, 본 명세서에 기술된 대로 방법을 수행할 때, 지수적 세포 성장의 제1 단계는 락토스가 배양 배지에 제2 단계에서 첨가되기 전에, 탄소-기반 기질, 바람직하게 글루코스 또는 수크로스를 배양 배지에 첨가하여 제공된다.
대안적인 바람직한 구현예에서, 본 명세서에 기술된 바와 같은 방법에서, 락토스는 탄소-기반 기질과 함께 지수 성장의 제1 단계에서 이미 첨가된다.
본 발명에 따라서, 본 명세서에 기술된 바와 같은 방법은 바람직하게 상기 코어 삼당류로서 LN3을 포함하는 올리고당 또는 코어 삼당류로서 LN3을 포함하는 적어도 하나의 올리고당을 포함하는 올리고당 혼합물을 각각 상기 배양으로부터 분리시키는 단계를 포함한다.
용어 "상기 배양으로부터 분리"는 코어 삼당류로서 LN3을 포함하는 적어도 하나의 올리고당을 포함하는 상기 올리고당 또는 상기 올리고당 혼합물을 세포 및/또는 이의 성장 배지로부터 수확, 수집, 또는 회수하는 것을 의미한다.
코어 삼당류로서 LN3을 포함하는 올리고당 또는 코어 삼당류로서 LN3을 포함하는 적어도 하나의 올리고당을 포함하는 올리고당 혼합물은 세포가 성장된, 수성 배양 배지로부터 통상의 방식으로 분리될 수 있다. 상기 올리고당 또는 상기 올리고당 혼합물이 올리고당 또는 상기 올리고당 혼합물을 생산하는 세포에 여전히 존재하는 경우에, 상기 올리고당 또는 상기 올리고당 혼합물을 세포 밖으로 유리시키거나 또는 추출하기 위한 통상의 방식, 예컨대, 높은 pH, 열충격, 초음파 처리, 프렌치 프레스, 균질화, 효소적 가수분해, 화학적 가수분해, 용매 가수분해, 세제, 가수분해 등을 사용한 세포 파괴가 사용될 수 있다. 배양 배지 및/또는 세포 추출물은 함께 및 분리하여 상기 올리고당 또는 상기 올리고당 혼합물을 분리하기 위해서 추가로 사용될 수 있다.
이것은 바람직하게 현탁 미립자 및 오염물, 특히 유전자 조작된 세포를 배양하여 생산된 세포, 세포 성분, 불용성 대사산물 및 찌꺼기를 제거하기 위해 상기 올리고당 또는 상기 올리고당 혼합물을 청징화시키는 단계를 포함한다. 이 단계에서, 상기 올리고당 또는 상기 올리고당 혼합물은 통상의 방식으로 청징화될 수 있다. 바람직하게, 상기 올리고당 또는 상기 올리고당 혼합물은 원심분리, 응결, 경사법 및/또는 여과에 의해 청징화된다. 코어 삼당류로서 LN3을 포함하는 적어도 하나의 올리고당을 포함하는 상기 올리고당 또는 올리고당 혼합물을 분리시키는 제2 단계는 바람직하게 실질적으로 모든 단백질을 비롯하여, 후속 분리 단계를 방해할 수 있는 펩티드, 아미노산, RNA 및 DNA 및 임의의 내독소 및 당지질을, 바람직하게 청징화된 이후에, 상기 올리고당 또는 상기 올리고당 혼합물로부터 분리시키는 단계를 포함한다. 이 단계에서, 단백질 및 관련 불순물은 통상의 방식으로 상기 올리고당 또는 상기 올리고당 혼합물로부터 제거될 수 있다. 바람직하게, 단백질, 염, 부산물, 색소 및 다른 관련 불순물은 상기 올리고당 또는 상기 올리고당 혼합물로부터 한외여과, 나노여과, 역삼투, 미세여과, 활성 차콜 또는 탄소 처리, 접선 유동 고-성능 여과, 접선 유동 한외여과, 친화성 크로마토그래피, 이온 교환 크로마토그래피 (예컨대, 제한없이 양이온 교환, 음이온 교환, 혼합층 이온 교환), 소수성 상호작용 크로마토그래피 및/또는 겔 여과 (특, 크기 배제 크로마토그래피), 특히 크로마토그래피, 보다 특히 이온 교환 크로마토그래피 또는 소수성 상호작용 크로마토그래피 또는 리간드 교환 크로마토그래피에 의해서 제거된다. 크기 배제 크로마토그래피를 제외하고, 단백질 및 관련 불순물은 크로마토그래피 매질 또는 선택된 막에 유지된다.
추가의 바람직한 구현예에서, 본 명세서에 기술된 바와 같은 방법은 또한 본 발명의 코어 삼당류로서 LN3을 포함하는 올리고당 또는 코어 삼당류로서 LN3을 포함하는 적어도 하나의 올리고당을 포함하는 올리고당 혼합물의 추가 정제를 제공한다. 상기 올리고당 또는 상기 올리고당 혼합물의 추가 정제는 예를 들어 임의의 잔류 DNA, 단백질, LPS, 내독소, 또는 다른 불순물을 제거하기 위해 (활성화된) 차콜 또는 탄소, 나노여과, 한외여과 또는 이온 교환의 사용을 통해 수행될 수 있다. 알콜, 예컨대, 에탄올, 및 수성 알콜 혼합물이 또한 사용될 수 있다. 다른 정제 단계는 상기 올리고당 또는 상기 올리고당 혼합물의 결정화, 증발 또는 침전에 의해 수행된다. 다른 정제 단계는 생산된 올리고당 또는 올리고당 혼합물을 건조, 예를 들어 분무 건조 또는 동결건조하는 것이다.
예시적인 구현예에서, 코어 삼당류로서 LN3을 포함하는 올리고당 또는 코어 삼당류로서 LN3을 포함하는 적어도 하나의 올리고당을 포함하는 올리고당 혼합물의 분리 및 정제는 하기 단계를 임의 순서로 포함하는 방법으로 수행된다:
a) 배양 또는 이의 청징화된 형태를 생산된 올리고당 또는 올리고당 혼합물의 체류를 보장하고, 단백질, 염, 부산물, 색소 및 다른 관련 불순물의 적어도 일부가 통과하도록 허용하는 600-3500 Da의 분자량 컷-오프 (MWCO)를 갖는 나노여과 막과 접촉시키는 단계,
b) 상기 막과 무기 전해질의 수용액을 사용하여, 단계 a)의 체류물에 대해 투석여과를 수행한 이후에, 과량의 전해질을 제거하도록 순수를 사용해 임의적인 투석여과를 수행하는 단계,
c) 및 상기 전해질의 양이온으로부터 염의 형태로 상기 올리고당 또는 상기 올리고당 혼합물로 농후화된 체류물을 수집하는 단계.
대안적인 예시적인 구현예에서, 상기 올리고당 또는 상기 올리고당 혼합물의 분리 및 정제는 임의 순서로 하기 단계를 포함하는 방법으로 수행된다: 배양 또는 이의 청징화된 형태에 대해서 상이한 막을 사용하여 2개 막 여과 단계를 수행하는 단계로서,
- 하나의 막은 약 300 달톤과 약 500 달톤 사이의 분자량 컷-오프를 갖고,
- 다른 막은 약 600 달톤과 약 800 달톤 사이의 분자량 컷-오프를 갖는다.
대안적인 예시적인 구현예에서, 상기 올리고당 또는 상기 올리고당 혼합물의 분리 및 정제는 배양 또는 이의 청징화된 형태를 H+-형태의 강한 양이온 교환 수지 및 유리 염기 형태의 약한 음이온 교환 수지로 처리하는 단계를 포함하는 임의 순서의 하기 단계를 포함하는 방법으로 수행된다.
대안적인 예시적인 구현예에서, 상기 올리고당 또는 상기 올리고당 혼합물의 분리 및 정제는 하기 방식으로 수행된다. 생산된 올리고당, 생물량, 배지 성분 및 오염물을 포함하는 배양으로서, 배양 중 생산된 올리고당 또는 올리고당 혼합물의 순도가 < 80%인 것인, 배양은 하기 정제 단계에 적용된다:
i) 배양으로부터 생물량의 분리 단계,
ii) 양으로 하전된 물질의 제거를 위한 양이온성 이온 교환기 처리 단계,
iii) 음으로 하전된 물질의 제거를 위한 음이온성 이온 교환기 처리 단계,
iv) 나노여과 단계 및/또는 전기투석 단계,
80% 이상의 순도로 생산된 올리고당 또는 올리고당 혼합물을 포함하는 정제된 용액이 제공된다. 임의로 정제된 용액은 분무 건조된다.
대안적인 예시적인 구현예에서, 코어 삼당류로서 LN3을 포함하는 올리고당 또는 코어 삼당류로서 LN3을 포함하는 적어도 하나의 올리고당을 포함하는 올리고당 혼합물의 분리 및 정제는 임의 순서로 하기 단계를 포함하는 방법으로 수행된다: 배양의 효소 처리 단계; 배양으로부터 생물량의 제거 단계; 한외여과 단계; 나노여과 단계; 및 컬럼 크로마토그래피 단계. 바람직하게 이러한 컬럼 크로마토그래피는 단일 컬럼 또는 다수 컬럼이다. 추가로 바람직하게, 컬럼 크로마토그래피 단계는 모의 이동층 크로마토그래피이다. 이러한 모의 이동층 크로마토그래피는 바람직하게 i) 적어도 4개 컬럼으로서, 적어도 하나의 컬럼은 약하거나 또는 강한 양이온 교환 수지를 포함하는 것인 컬럼; 및/또는 ii) 상이한 유속을 갖는 4개 구역 I, II, III 및 IV; 및/또는 iii) 물을 포함하는 용리액; 및/또는 iv) 15℃ 내지 60℃의 작업 온도를 포함한다.
특별한 구현예에서, 본 발명은 분말로 분무-건조된 생산된 코어 삼당류로서 LN3을 포함하는 올리고당 또는 코어 삼당류로서 LN3을 포함하는 적어도 하나의 올리고당을 포함하는 올리고당 혼합물을 제공하고, 분무-건조된 분말은 < 15% -wt.의 물, 바람직하게 < 10% -wt.의 물, 보다 바람직하게 < 7% -wt.의 물, 가장 바람직하게 < 5% -wt.의 물을 함유한다.
본 발명의 다른 양태는 코어 삼당류로서 LN3을 갖는 올리고당 또는 코어 삼당류로서 LN3을 포함하는 적어도 하나의 올리고당을 포함하는 올리고당 혼합물의 발효적 생산에서 본 명세서에 정의된 바와 같은 막 단백질의 군으로부터 선택되는 막 단백질의 용도를 제공한다.
추가 양태에서, 본 발명은 코어 삼당류로서 LN3을 갖는 올리고당 또는 코어 삼당류로서 LN3을 포함하는 적어도 하나의 올리고당을 포함하는 올리고당 혼합물의 제조를 위한 방법에서, 본 명세서에 정의된 바와 같은 세포의 용도를 제공한다
더 나아가서, 본 발명은 또한 본 발명에 따른 방법을 통해 수득된 코어 삼당류로서 LN3을 갖는 올리고당 또는 코어 삼당류로서 LN3을 포함하는 적어도 하나의 올리고당을 포함하는 올리고당 혼합물을 비롯하여, 상기 올리고당 또는 상기 올리고당 혼합물의 생산을 위한 상기 기술된 바와 같은 폴리뉴클레오티드, 벡터, 숙주 세포, 미생물 또는 폴리펩티드의 용도에 관한 것이다. 상기 올리고당 또는 상기 올리고당 혼합물은 이유식, 성인 식품 또는 사료의 보충을 위한, 식품 첨가제, 프리바이오틱, 심바이오틱으로서, 또는 치료적 또는 약학적 활성 화합물로서 사용될 수 있다. 신규 방법을 사용하여, 코어 삼당류로서 LN3을 갖는 올리고당 또는 코어 삼당류로서 LN3을 포함하는 적어도 하나의 올리고당을 포함하는 올리고당 혼합물은 복잡한, 시간 및 비용 소모적인 합성 과정의 필요없이, 쉽게 효율적으로 제공될 수 있다.
본 명세서에 기술된 바와 같은 세포에서 생산되는 올리고당의 확인을 위해서, 단량체 빌딩 블록 (예를 들어, 단당류 또는 글리칸 단위 조성물), 측쇄의 아노머 구성, 치환 기의 존재 및 위치, 중합도/분자량, 및 연결 패턴은 당분야에 공지된 표준 방법, 예컨대, 예를 들어, 메틸화 분석, 환원 절단, 가수분해, GC-MS (가스 크로마토그래피-질량 분광법), MALDI-MS (매트릭스-보조 레이저 탈착/이온화-질량 분광법), ESI-MS (전자분무 이온화-질량 분광법), HPLC (자외선 또는 굴절률 검출 동반 고성능 액상 크로마토그래피), HPAEC-PAD (펄스식 전류측정 검출 동반 고성능 음이온-교환 크로마토그래피), CE (모세관 전기영동), IR (적외선)/라만 분광법, 및 NMR (핵 자기 공명) 분광법 기술에 의해 확인될 수 있다. 결정 구조는 예를 들어, 고체 NMR, FT-IR (퓨리에 변환 적외선 분광법), 및 WAXS (광각 X-선 산란)을 사용하여 해석될 수 있다. 중합도 (DP), DP 분포 및 다분산도는 예를 들어, 점도계 및 SEC (SEC-HPLC, 고성능 크기-배제 크로마토그래피)를 통해 결정될 수 있다. 올리고당의 단량체 성분을 확인하기 위해서, 방법 예컨대, 예를 들어, 산-촉매 가수분해, HPLC (고성능 액상 크로마토그래피) 또는 GLC (기체-액체 크로마토그래피) (알디톨 아세테이트로 전환 이후)가 사용될 수 있다. 글리코시드 연결을 결정하기 위해서, 올리고당은 DMSO 중 요오드화메틸 및 강염기에 의해 메틸화되고, 가수분해가 수행되고, 부분적으로 메틸화된 알디톨로 환원이 달성되며, 메틸화된 알디톨 아세테이트로의 아세틸화가 수행되며, 분석은 GLC/MS (질량 분광법과 결합된 기체-액체 크로마토그래피)에 의해 수행된다. 글리칸 서열을 결정하기 위해서, 부분 해중합이 산 또는 효소를 사용해 수행되어서 구조가 결정된다. 아노머 구성을 확인하기 위해서, 올리고당에 대해서 효소적 분석을 수행하고, 예를 들어, 특정 유형의 연결에 특이적인 효소, 예를 들어 베타-갈락토시다제, 또는 알파-글루코시다제 등과 접촉되고, NMR을 사용해 생산물을 분석할 수 있다.
본 명세서에 기술된 바와 같은 분리되고, 바람직하게 또한 정제된, 코어 삼당류로서 LN3을 갖는 올리고당 또는 코어 삼당류로서 LN3을 갖는 적어도 하나의 올리고당을 포함하는 올리고당 혼합물은 식품 (예를 들어, 인간 식품 또는 사류), 식이 보충물, 약학 성분, 미용 성분 또는 의약품에 혼합된다. 일부 구현예에서, 올리고당 또는 올리고당 혼합물은 식품, 사료, 식이 보충물, 약학 성분, 미용 성분 또는 의약품에 적합한 하나 이상의 성분과 혼합된다.
일부 구현예에서, 식이 보충물은 적어도 하나의 프리바이오틱 성분 및/또는 적어도 하나의 프로바이오틱 성분을 포함한다.
"프리바이오틱"은 숙주에 유익한 미생물, 특히 위장관의 미생물의 성장을 촉진하는 물질이다. 일부 구현예에서, 식이 보충물은 하나 이상의 유익한 미생물의 성장을 촉진하기 위해서, 본 명세서에 개시된 방법으로 생산 및/또는 정제된 프리바이오틱인 올리고당 또는 올리고당 혼합물을 포함하는, 다수의 프리바이오틱을 제공한다. 식이 보충물을 위한 프리바이오틱 성분의 예는 다른 프리바이오틱 분자 (예컨대, HMO) 및 식물 다당류 (예컨대, 이눌린, 펙틴, b-글루칸 및 자일로올리고당)를 포함한다. "프로바이오틱" 생산물은 전형적으로 수용자의 이익을 위해서, 위장관 미생물총에 첨가되거나 또는 대체되는 살아있는 미생물을 함유한다. 이러한 미생물의 예는 락토바실러스 (Lactobacillus) 종 (예를 들어, 엘. 악시도필루스 (L. acidophilus) 및 엘. 불가리쿠스 (L. bulgaricus)), 비피도박테리움 종 (예를 들어, 비. 아니말리스 (B. animalis), 비. 롱검 (B. longum) 및 비. 인판티스 (B. Infantis) (예를 들어, Bi-26)), 및 사카로마이세스 보울라르디 (Saccharomyces boulardii)를 포함한다. 일부 구현예에서, 본 명세서의 방법으로 생산 및/또는 정제된 올리고당 또는 올리고당 혼합물은 이러한 미생물과 조합하여 경구로 투여된다.
식이 보충물을 위한 추가 성분의 예는 이당류 (예컨대, 락토스), 단당류 (예컨대, 글루코스 및 갈락토스), 증점제 (예컨대, 검 아라빅), 산도 조절제 (예컨대, 트리소듐 시트레이트), 물, 탈지유, 및 풍미제를 포함한다.
일부 구현예에서, 코어 삼당류로서 LN3을 포함하는 올리고당 또는 코어 삼당류로서 LN3을 포함하는 적어도 하나의 올리고당을 포함하는 올리고당 혼합물은 인간 이유식 (예를 들어, 영아용 조제식)에 혼입된다. 영아용 조제식은 일반적으로 인간 모유에 대한 완전 또는 부분 대체물로서 영아에게 먹이기 위해 제조된 식품이다. 일부 구현예에서, 영아용 조제식은 분말로서 판매되고, 물과 혼합하여 영아에게 젖병 또는 컵으로 먹이기 위해 제조된다. 영아용 조제식의 조성물은 전형적으로 인간 모유를 대략적으로 모방하도록 디자인된다. 일부 구현예에서, 본 명세서의 방법으로 생산 및/또는 정제된 올리고당 또는 올리고당 혼합물은 인간 모유의 올리고당이 제공하는 것과 유사한 영양적 이득을 제공하기 위해 영아용 조제식에 포함된다. 일부 구현예에서, 올리고당 또는 올리고당 혼합물은 아용 조제식의 하나 이상의 성분과 혼합된다. 영아용 조제식 성분의 예는 무지방유, 탄수화물 공급원 (예를 들어, 락토스), 단백질 공급원 (예를 들어, 농축 유청 단백질 및 카세인), 지방 공급원 (예를 들어, 식물성 오일 - 예컨대, 야자유, 고올레산 홍화유, 유채씨유, 코코넛유 및/또는 해바라기유; 및 어유), 비타민 (예컨대, 비타민 A, Bb, Bi2, C 및 D), 미네랄 (예컨대, 포타슘 시트레이트, 칼슘 시트레이트, 마그네슘 클로라이드, 소듐 클로라이드, 소듐 시트레이트 및 칼슘 포스페이트) 및 가능하게 인간 모유 올리고당 (HMO)을 포함한다. 이러한 HMO는 예를 들어, DiFL, 락토-N-트리오스 II, LNT, LNnT, 락토-N-푸코펜타오스 I, 락토-N-네오푸코펜타오스, 락토-N-푸코펜타오스 II, 락토-N- 푸코펜타오스 III, 락토-N-푸코펜타오스 V, 락토-N-네오푸코펜타오스 V, 락토-N-디푸코헥사오스 I, 락토-N-디푸코헥사오스 II, 6'-갈락토실락토스, 3'-갈락토실락토스, 락토-N-헥사오스 및 락토- N-네오헥사오스를 포함할 수 있다.
일부 구현예에서, 하나 이상의 영아용 조제식 성분은 무지방유, 탄수화물 공급원, 단백질 공급원, 지방 공급원, 및/또는 비타민 및 미네랄을 포함한다.
일부 구현예에서, 하나 이상의 영아용 조제식 성분은 락토스, 농축 유청 단백질 및/또는 고올레산 홍화유를 포함한다.
일부 구현예에서, 영아용 조제식 중 올리고당 또는 올리고당 혼합물의 농도는 일반적으로 인간 모유에 존재하는 올리고당의 농도와 대략 동일한 농도이다.
일부 구현예에서, 올리고당 또는 올리고당 혼합물은 사료 조제물에 혼힙되고, 상기 사료는 반려 동물, 사료, 동물 우유 대체제, 수의학 제품, 이유후 사료, 또는 이유기 보조 사료를 포함하는 목록으로부터 선택된다.
본 명세서의 실시예에 표시되는 바와 같이, 본 발명의 방법 및 세포는
동일한 유전적 배경을 갖지만 이종성 막 단백질의 발현 또는 내생성 막 단백질의 조절된 발현이 결여된 코어 삼당류로서 LN3을 갖는 올리고당 또는 코어 삼당류로서 LN3을 포함하는 적어도 하나의 올리고당을 포함하는 올리고당 혼합물에 대한 생산 균주와 비교했을 때, 본 명세서에 정의된 바와 같은 막 단백질을 사용할 때 하기의 놀라운 장점 중 적어도 하나를 제공한다:
- 코어 삼당류로서 LN3을 갖는 올리고당의 더 나은 적정가 (증강) (g/L),
- 더 나은 생산율 r (g 올리고당 / L/h),
- 더 나은 세포 성능 지수 CPI (g 올리고당 / g X),
- 더 나은 비생산성 Qp (g 올리고당 /g X /h),
- 수크로스에 대한 더 나은 수율 Ys (g 올리고당 / g 수크로스),
- 더 나은 수크로스 흡수/전환율 Qs (g 수크로스 / g X /h),
- 더 나은 락토스 전환/소비율 rs (g 락토스/h),
- 코어 삼당류로서 LN3을 갖는 올리고당의 증강된 분비, 및/또는
- 생산 숙주의 증강된 성장 속도.
본 문맥에서, "X"는 생물량을 의미하고, "g"은 그램을 의미하고, "L"은 리터를 의미하고, "h"는 시간을 의미한다. 상기 "g 올리고당"은 전체 액체배지 및/또는 상청액에서 측정될 수 있다.
바람직하게, 본 발명의 방법 및 세포는 동일한 유전적 배경을 갖지만 이종성 막 단백질의 발현 또는 내생성 막 단백질의 조절된 발현이 결여된 코어 삼당류로서 LN3을 갖는 올리고당 또는 코어 삼당류로서 LN3을 포함하는 적어도 하나의 올리고당을 포함하는 올리고당 혼합물에 대한 생산 숙주와 비교했을 때 본 명세서에 정의된 바와 같은 막 단백질을 사용할 때 하기의 놀라운 장점 중 적어도 하나를 제공한다:
- 코어 삼당류로서 LN3을 갖는 올리고당의 더 나은 적정가 (증강) (g/L),
- 더 나은 생산율 r (g 올리고당 / L/h),
- 더 나은 세포 성능 지수 CPI (g 올리고당 / g X),
- 더 나은 비생산성 Qp (g 올리고당 /g X /h),
- 수크로스에 대한 더 나은 수율 Ys (g 올리고당 / g 수크로스),
- 더 나은 수크로스 흡수/전환율 Qs (g 수크로스 / g X /h),
- 더 나은 락토스 전환/소비율 rs (g 락토스/h), 및/또는
- 코어 삼당류로서 LN3을 갖는 올리고당의 증강된 분비.
또한, 본 발명은 하기 특정 구현예에 관한 것이다:
1. 코어 삼당류로서 락토-N-트리오스 (LN3; GlcNAc-베타1,3-Gal-베타1,4-Glc)를 포함하는 올리고당의 생산을 위해 유전자 변형된 숙주 세포로서, 숙주 세포는 N-아세틸글루코사민 (GlcNAc) 잔기를 UDP-GlcNAc 도너로부터 락토스 억셉터로 전달하여 LN3을 합성하는 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제에 대한 적어도 하나의 핵산 서열을 포함하고 발현하고,
- 상기 세포는 i) 내생성 막 단백질의 과발현 및/또는 ii) 이종성 막 단백질의 발현을 더 포함하여 a) 개선된 생산, 및/또는 b) 코어 삼당류로서 LN3을 포함하는 올리고당의 가능하고/하거나 증강된 유출을 제공하고,
- 바람직하게 상기 세포는 상기 LN3을 변형시킬 수 있는 글리코실트랜스퍼라제를 코딩하는 적어도 하나의 핵산 서열을 더 포함하고 발현한다.
2. 구현예 1에 따른 세포에 있어서, 상기 막 단백질은 운송체, P-P-결합-가수분해-구동 수송체, 및 β-배럴 포린의 군으로부터 선택되고,
a) 상기 막 단백질이 운송체의 군으로부터 선택될 때, 상기 막 단백질은
- TCDB 클래스 2.A.1.1, 2.A.1.2, 2.A.1.3, 2.A.1.6, 2.A.2.2, 2.A.7.1 및 2.A.66의 군, 또는
- eggnog 패밀리 05E8G, 05EGZ, 05JHE, 07QF7 07QRN, 07RBJ, 0814C 및 08N8A의 군,
- PFAM 목록 PF00893, PF01943, PF05977, PF07690 및 PF13347, 또는
- interpro 목록 IPR000390, IPR001411, IPR001927, IPR002797, IPR004638, IPR005829, IPR010290, IPR011701, IPR020846, IPR023721, IPR023722, IPR032896, IPR036259 및 IPR039672, 또는
- SEQ ID NO 01을 갖는 크로노박터 무이트젠시 (Cronobacter muytjensii) 유래 MdfA, SEQ ID NO 02를 갖는 요케넬라 레겐스부르게이 (Yokenella regensburgei) (ATCC43003) 유래 MdfA, SEQ ID NO 03을 갖는 에스케리치아 콜라이 (Escherichia coli) K-12 MG1655 유래 MdfA, SEQ ID NO 04를 갖는 엔테로박터 (Enterobacter) sp. 유래 MdfA, SEQ ID NO 05를 갖는 시트로박터 코세리 (Citrobacter koseri) 유래 MFS, SEQ ID NO 06을 갖는 시트로박터 영애 (Citrobacter youngae) 유래 MdfA, SEQ ID NO 07을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 YbdA, SEQ ID NO 08을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 YjhB, SEQ ID NO 09를 갖는 에스케리치아 콜라이 K-12 MG1655 유래 WzxE, SEQ ID NO 10을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 EmrE, SEQ ID NO 11을 갖는 비피도박테리움 롱검 (Bifidobacterium longum) subsp. 인판티스 (Infantis) (균주 ATCC 15697) 유래 Blon_2331, SEQ ID NO 12를 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_0247, SEQ ID NO 13을 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_0345, SEQ ID NO 14를 갖는 클렙시엘라 뉴모니아에 (Klebsiella pneumoniae) 유래 IceT, SEQ ID NO 53을 갖는 크로노박터 사카자키 (Cronobacter sakazakii) 균주 MOD1_LR753 유래 MdfA, SEQ ID NO 54를 갖는 프란코니박터 풀베리스 (Franconibacter pulveris) LMG 24059 유래 MdfA, SEQ ID NO 55를 갖는 엔테로박터 호르마에케이 (Enterobacter hormaechei) 균주 017 유래 MdfA, SEQ ID NO 56을 갖는 시트로박터 코세리 (Citrobacter koseri) 균주 NCTC10771 유래 MdfA, SEQ ID NO 57을 갖는 살모넬라 엔테리카 (Salmonella enterica) subsp. 아리조나에 (arizonae) 혈청형 41:z4,z23:- 균주 TAMU30EF 유래 MdfA, SEQ ID NO 58을 갖는 시겔라 플렉스네리 (Shigella flexneri) 균주 585219 유래 MdfA, SEQ ID NO 59를 갖는 요케넬라 레겐스부르게이 (Yokenella regensburgei) 균주 UMB0819 유래 MdfA, SEQ ID NO 60을 갖는 에스케리치아 콜라이 균주 AMC_967 유래 MdfA, SEQ ID NO 61을 갖는 클렙시엘라 뉴모니아에 (Klebsiella pneumoniae) VAKPC309 유래 MdfA, SEQ ID NO 62를 갖는 클렙시엘라 옥시토카 (Klebsiella oxytoca) 균주 4928STDY7071490 유래 MdfA, SEQ ID NO 63을 갖는 클렙시엘라 미시가넨시스 (Klebsiella michiganensis) 균주 A2 유래 MdfA, SEQ ID NO 64를 갖는 플루랄리박터 게르고비아에 (Pluralibacter gergoviae) 균주 FDAARGOS_186 유래 MdfA 또는 SEQ ID NO 65를 갖는 클루이베라 아스코르바타 (Kluyvera ascorbata) ATCC 33433 유래 MdfA, 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편 또는 각각 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64 또는 65를 갖는 상기 막 단백질 중 어느 하나의 전체 길이 서열에 대해 적어도 80% 서열 동일성을 갖는 단백질 서열
로부터 선택되거나;
b) 상기 막 단백질이 P-P-결합-가수분해-구동 수송체의 군으로부터 선택될 때, 상기 막 단백질은
- TCDB 클래스 3.A.1.1 및 3.A.1.2의 군, 또는
- eggnog 패밀리 05CJ1, 05DFW, 05EZD, 05I1K, 07HR3 및 08IJ9의 군, 또는
- PFAM 목록 PF00005, PF00528, PF13407 및 PF17912, 또는
- interpro 목록 IPR000515, IPR003439, IPR003593, IPR005978, IPR008995, IPR013456, IPR015851, IPR017871, IPR025997, IPR027417, IPR028082, IPR035906, 및 IPR040582, 또는
- SEQ ID NO 15를 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_2475, SEQ ID NO 16을 갖는 브라디리조비움 자포니쿰 (Bradyrhizobium japonicum) USDA 110 유래 nodi, SEQ ID NO 17을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 xylF, SEQ ID NO 18을 갖는 비피도박테리움 롱검 subsp. 인판티스 Bi-26 유래 TIC77290, SEQ ID NO 19를 갖는 비피도박테리움 롱검 subsp. 인판티스 Bi-26 유래 TIC77291, SEQ ID NO 20을 갖는 비피도박테리움 롱검 subsp. 인판티스 Bi-26 유래 TIC76854 TIC77291, 또는 상기 P-P-결합-가수분해-구동 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편 또는 각각 SEQ ID NO 15, 16, 17, 18, 19 또는 20을 갖는 상기 막 단백질 중 어느 하나의 전체 길이 서열에 대해 적어도 80% 서열 동일성을 갖는 단백질 서열
로부터 선택되거나; 또는
c) 상기 막 단백질이 β-배럴 포린의 군으로부터 선택될 때, 상기 막 단백질은
- TCDB 클래스 1.B.18, 또는
- eggnog 패밀리 05DAY, 또는
- PFAM 목록 PF02563, PF10531 및 PF18412, 또는
- interpro 목록 IPR003715, IPR019554 및 IPR040716, 또는
- SEQ ID NO 21을 갖는 에스케리치아 콜라이 K12 MG1655 유래 Wza 또는 이의 기능성 상동체 또는 기능성 단편, 또는 SEQ ID NO 21을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80% 서열 동일성을 갖는 단백질 서열
로부터 선택되고;
TCDB 클래스는 2019년 6월 17일 배포된 TCDB.org 에 의해 정의되는 바와 같고, eggnog 패밀리는 2016년 9월 배포된 eggnogdb 4.5.1에 의해 정의되는 바와 같고, PFAM 목록은 2018년 9월에 배포된 Pfam 32.0에 의해 정의되는 바와 같고, interpro 목록은 2019년 7월 4일 배포된 InterPro 75.0에 의해 정의되는 바와 같다.
3. 구현예 1 또는 2 중 어느 하나에 따른 세포에 있어서, 상기 막 단백질은 하기로 이루어진 막 단백질의 군으로부터 선택된다:
a) 운송체 막 단백질로서 SEQ ID NO 01을 갖는 크로노박터 무이트젠시 (Cronobacter muytjensii) 유래 MdfA, SEQ ID NO 02를 갖는 요케넬라 레겐스부르게이 (Yokenella regensburgei) (ATCC43003) 유래 MdfA, SEQ ID NO 03을 갖는 에스케리치아 콜라이 (Escherichia coli) K-12 MG1655 유래 MdfA, SEQ ID NO 04를 갖는 엔테로박터 (Enterobacter) sp. 유래 MdfA, SEQ ID NO 05를 갖는 시트로박터 코세리 (Citrobacter koseri) 유래 MFS, SEQ ID NO 06을 갖는 시트로박터 영애 (Citrobacter youngae) 유래 MdfA, SEQ ID NO 07을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 YbdA, SEQ ID NO 08을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 YjhB, SEQ ID NO 09를 갖는 에스케리치아 콜라이 K-12 MG1655 유래 WzxE, SEQ ID NO 10을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 EmrE, SEQ ID NO 11을 갖는 비피도박테리움 롱검 (Bifidobacterium longum) subsp. 인판티스 (Infantis) (균주 ATCC 15697) 유래 Blon_2331, SEQ ID NO 12를 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_0247, SEQ ID NO 13을 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_0345, SEQ ID NO 14를 갖는 클렙시엘라 뉴모니아에 (Klebsiella pneumoniae) 유래 IceT, SEQ ID NO 53을 갖는 크로노박터 사카자키 (Cronobacter sakazakii) 균주 MOD1_LR753 유래 MdfA, SEQ ID NO 54를 갖는 프란코니박터 풀베리스 (Franconibacter pulveris) LMG 24059 유래 MdfA, SEQ ID NO 55를 갖는 엔테로박터 호르마에케이 (Enterobacter hormaechei) 균주 017 유래 MdfA, SEQ ID NO 56을 갖는 시트로박터 코세리 (Citrobacter koseri) 균주 NCTC10771 유래 MdfA, SEQ ID NO 57을 갖는 살모넬라 엔테리카 (Salmonella enterica) subsp. 아리조나에 (arizonae) 혈청형 41:z4,z23:- 균주 TAMU30EF 유래 MdfA, SEQ ID NO 58을 갖는 시겔라 플렉스네리 (Shigella flexneri) 균주 585219 유래 MdfA, SEQ ID NO 59를 갖는 요케넬라 레겐스부르게이 (Yokenella regensburgei) 균주 UMB0819 유래 MdfA, SEQ ID NO 60을 갖는 에스케리치아 콜라이 균주 AMC_967 유래 MdfA, SEQ ID NO 61을 갖는 클렙시엘라 뉴모니아에 (Klebsiella pneumoniae) VAKPC309 유래 MdfA, SEQ ID NO 62를 갖는 클렙시엘라 옥시토카 (Klebsiella oxytoca) 균주 4928STDY7071490 유래 MdfA, SEQ ID NO 63을 갖는 클렙시엘라 미시가넨시스 (Klebsiella michiganensis) 균주 A2 유래 MdfA, SEQ ID NO 64를 갖는 플루랄리박터 게르고비아에 (Pluralibacter gergoviae) 균주 FDAARGOS_186 유래 MdfA 또는 SEQ ID NO 65를 갖는 클루이베라 아스코르바타 (Kluyvera ascorbata) ATCC 33433 유래 MdfA, 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64 또는 65를 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80% 서열 동일성을 갖는 단백질 서열; 및
b) P-P-결합-가수분해-구동 수송체로서 SEQ ID NO 15를 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_2475, SEQ ID NO 16을 갖는 브라디리조비움 자포니쿰 (Bradyrhizobium japonicum) USDA 110 유래 nodi, SEQ ID NO 17을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 xylF, SEQ ID NO 18을 갖는 비피도박테리움 롱검 subsp. 인판티스 Bi-26 유래 TIC77290, SEQ ID NO 19를 갖는 비피도박테리움 롱검 subsp. 인판티스 Bi-26 유래 TIC77291, SEQ ID NO 20을 갖는 비피도박테리움 롱검 subsp. 인판티스 Bi-26 유래 TIC76854 TIC77291, 또는 상기 P-P-결합-가수분해-구동 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 15, 16, 17, 18, 19 또는 20을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80% 서열 동일성을 갖는 단백질 서열; 및
c) β-배럴 포린 막 단백질로서 SEQ ID NO 21을 갖는 에스케리치아 콜라이 K12 MG1655 유래 Wza, 또는 상기 Wza 단백질의 기능성 상동체 또는 기능성 단편, 또는 SEQ ID NO 21을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80% 서열 동일성을 갖는 단백질 서열.
4. 구현예 1 내지 3 중 어느 하나에 따른 세포에 있어서, 상기 막 단백질은 세포벽의 외막을 가로지르는 화합물의 수송에 관여되는 수송체 단백질이다.
5. 이전 구현예 중 어느 하나에 따른 세포에 있어서, 상기 글리코실트랜스퍼라제는 푸코실트랜스퍼라제, 시알릴트랜스퍼라제, 갈락토실트랜스퍼라제, 글루코실트랜스퍼라제, 만노실트랜스퍼라제, N-아세틸글루코사미닐트랜스퍼라제, N-아세틸갈락토사미닐트랜스퍼라제, N-아세틸만노사미닐트랜스퍼라제, 자일로실트랜스퍼라제, 글루쿠로닐트랜스퍼라제, 갈락투로닐트랜스퍼라제, 글루코사미닐트랜스퍼라제, N-글리코릴뉴라미닐트랜스퍼라제, 람노실트랜스퍼라제, N-아세틸람노실트랜스퍼라제, UDP-4-아미노-4,6-디데옥시-N-아세틸-베타-L-알트로사민 트랜스아미나제, UDP-N-아세틸글루코사민 에놀피루빌 트랜스퍼라제 및 푸코사미닐트랜스퍼라제를 포함하는 목록으로부터 선택되고,
바람직하게, 상기 세포는 상기 글리코실트랜스퍼라제 중 적어도 하나의 발현 또는 활성이 변형된다.
6. 이전 구현예 중 어느 하나에 따른 세포에 있어서, 코어 삼당류로서 락토-N-트리오스 (LN3; GlcNAc-베타1,3-Gal-베타1,4-Glc)를 포함하는 상기 올리고당은 락토-N-트리오스, 락토-N-테트라오스, 락토-N-네오테트라오스, 락토-N-푸코펜타오스 I, 락토-N-네오푸코펜타오스 I, 락토-N-푸코펜타오스 II, 락토-N-푸코펜타오스 III, 락토-N-푸코펜타오스 V, 락토-N-푸코펜타오스 VI, 락토-N-네오푸코펜타오스 V, 락토-N-디푸코헥사오스 I, 락토-N-디푸코헥사오스 II, 락토-N-헥사오스 (LNH), 락토-N-네오헥사오스 (LNnH), 파라-락토-N-헥사오스 (pLNnH), 파라-락토-N-네오헥사오스 (pLNH), 디푸코실-락토-N-헥사오스, 디푸코실-락토-N-네오헥사오스, 락토-N-펜타오스 (LNP), 락토-N-네오펜타오스, 파라 락토-N-펜타오스, 파라 락토-N-네오펜타오스, 락토-N-노보펜타오스 I, 락토-N-헵타오스, 락토-N-네오헵타오스, 파라 락토-N-네오헵타오스, 파라 락토-N-헵타오스, 락토-N-옥타오스 (LNO), 락토-N-네오옥타오스, 이소 락토-N-옥타오스, 파라 락토-N-옥타오스, 이소 락토-N-네오옥타오스, 노보 락토-N-네오옥타오스, 파라 락토-N-네오옥타오스, 이소 락토-N-노나오스, 노보 락토-N-노나오스, 락토-N-노나오스, 락토-N-데카오스, 이소 락토-N-데카오스, 노보 락토-N-데카오스, 락토-N-네오데카오스, 시알릴-락토-N-테트라오스 a, 시알릴-락토-N-테트라오스 b, 시알릴-락토-N-테트라오스 c, 시알릴-락토-N-테트라오스 d를 포함하는 목록으로부터 선택된다.
7. 이전 구현예 중 어느 하나에 따른 세포에 있어서, 상기 글리코실트랜스퍼라제는 베타-1,3 또는 베타-1,4 연결로 LN3의 말단 GlcNAc 잔기로 UDP-Gal 도너로부터 갈락토스 (Gal)를 전달하여서, 각각 락토-N-테트라오스 (LNT; Gal-베타1,3-GlcNAc-베타1,3-Gal-베타1,4-Glc) 또는 락토-N-네오테트라오스 (LNnT; Gal-베타1,4-GlcNAc-베타1,3-Gal-베타1,4-Glc)를 생산하는 N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제 또는 N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제이다.
8. 구현예 7에 따른 세포에 있어서, 상기 세포는 전체 액체배지 및/또는 상청액에서 90 g/L 이상의 LNT를 생산하고/하거나, 전체 액체배지 및/또는 상청액 중 상기 LNT는 각각 전체 액체배지 및/또는 상청액에서 상기 세포에 의해 생산되는 LNT 및 LN3의 총량에 대해 측정된 적어도 80%의 순도를 갖는다.
9. 구현예 7에 따른 세포에 있어서, 상기 세포는 전체 액체배지 및/또는 상청액에서 90 g/L 이상의 LNnT를 생산하고/하거나, 전체 액체배지 및/또는 상청액 중 상기 LNnT는 각각 전체 액체배지 및/또는 상청액에서 상기 세포에 의해 생산되는 LNnT 및 LN3의 총량에 대해 측정된 적어도 80%의 순도를 갖는다.
10. 이전 구현예 중 어느 하나에 따른 세포에 있어서, 상기 세포는 코어 삼당류로서 락토-N-트리오스 (LN3; GlcNAc-베타1,3-Gal-베타1,4-Glc)를 포함하는 상기 올리고당의 생산에서 사용하려는 뉴클레오티드-활성화된 당을 추가로 합성할 수 있다.
11. 구현예 10에 따른 세포에 있어서, 상기 뉴클레오티드-활성화된 당은 UDP-N-아세틸갈락토사민 (UDP-GalNAc), UDP-N-아세틸만노사민 (UDP-ManNAc), UDP-글루코스 (UDP-Glc), UDP-갈락토스 (UDP-Gal), GDP-만노스 (GDP-Man), UDP-글루쿠로네이트, UDP-갈락투로네이트, UDP-2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, UDP-2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, UDP-N-아세틸-L-람노사민 (UDP-L-RhaNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-만노스), dTDP-N-아세틸푸코사민, UDP-N-아세틸푸코사민 (UDP-L-FucNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-갈락토스), UDP-N-아세틸-L-뉴모사민 (UDP-L-PneNAC 또는 UDP-2-아세타미도-2,6-디데옥시-L-탈로스), UDP-N-아세틸무람산, UDP-N-아세틸-L-퀴노보사민 (UDP-L-QuiNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-글루코스), CMP-시알산 (CMP-Neu5Ac), CMP-N-글리코릴뉴라민산 (CMP-Neu5Gc), GDP-푸코스 (GDP-Fuc), GDP-람노스 및 UDP-자일로스를 포함하는 목록으로부터 선택된다.
12. 이전 구현예 중 어느 하나에 따른 세포에 있어서, 세포는 적어도 부분적으로 불활성화된 선택된 단당류, 이당류 또는 올리고당에 대한 이화 경로를 포함하고, 단당류, 이당류, 또는 올리고당는 코어 삼당류로서 LN3을 포함하는 올리고당의 합성에 관여되고/되거나 필요하다.
13. 이전 구현예 중 어느 하나에 따른 세포에 있어서, 상기 세포는 코어 삼당류로서 LN3을 포함하는 상기 올리고당의 합성을 위한 전구체를 사용한다.
14. 이전 구현예 중 어느 하나에 따른 세포에 있어서, 상기 막 단백질은 코어 삼당류로서 LN3을 포함하는 상기 올리고당의 합성을 위한 전구체의 흡수에 관여된다.
15. 이전 구현예 중 어느 하나에 따른 세포에 있어서, 상기 세포는 코어 삼당류로서 LN3을 포함하는 상기 올리고당의 합성을 위한 전구체를 생산한다.
16. 이전 구현예 중 어느 하나에 따른 세포에 있어서, 세포는 배지에서 안정하게 배양된다.
17. 이전 구현예 중 어느 하나에 따른 세포에 있어서, 상기 세포는 미생물, 식물, 또는 동물 세포로 이루어진 군으로부터 선택되고, 바람직하게 상기 미생물은 박테리아, 진균 또는 효모이고, 바람직하게 상기 식물은 벼, 목화, 유채, 대두, 옥수수 또는 행운목이고, 바람직하게 상기 동물은 곤충, 어류, 조류 또는 비-인간 포유동물이다.
18. 구현예 17에 따른 세포에 있어서, 상기 세포는 박테리아, 바람직하게 에스케리치아 콜라이 균주, 보다 바람직하게 K-12 균주인 에스케리치아 콜라이 균주의 세포이고, 보다 더 바람직하게 에스케리치아 콜라이 K-12 균주는 이.콜라이 MG1655이다.
19. 이전 구현예 중 어느 하나에 따른 세포에 있어서, 코어 삼당류로서 LN3을 포함하는 상기 올리고당은 포유동물 모유 올리고당 또는 루이스-유형 항원 올리고당이다.
20. 이전 구현예 중 어느 하나에 따른 세포에 있어서, 세포는 코어 삼당류로서 LN3을 포함하는 적어도 하나의 올리고당을 포함하는 올리고당의 혼합물을 합성할 수 있다.
21. 유전자 조작된 세포에 의한 코어 삼당류로서 락토-N-트리오스 (LN3; GlcNAc-베타1,3-Gal-베타1,4-Glc)를 포함하는 올리고당의 제조를 위한 방법으로서, 하기 단계를 포함한다:
a) 구현예 1 내지 20 중 어느 하나에 따른 세포를 제공하는 단계, 및
b) 코어 삼당류로서 LN3을 포함하는 상기 올리고당의 생산을 허용하는 조건 하에 배지에서 세포를 배양하는 단계,
c) 상기 코어 삼당류로서 LN3을 포함하는 올리고당 또는 코어 삼당류로서 LN3을 포함하는 적어도 하나의 올리고당을 포함하는 올리고당 혼합물을 각각 배양으로부터 분리시키는 단계.
22. 구현예 21에 따른 방법에 있어서, 방법은 하기 단계 중 적어도 하나를 더 포함한다:
i) 배양 배지에 초기 반응기 부피의 리터 당 적어도 50, 보다 바람직하게 적어도 75, 보다 바람직하게 적어도 100, 보다 바람직하게 적어도 120, 보다 바람직하게 적어도 150 그램을 포함하는 락토스 공급물을, 바람직하게 연속 방식으로, 바람직하게 배양 배지의 최종 부피가 상기 락토스 공급물의 첨가 전 배양 배지의 부피의 3배 이하, 바람직하게 2배 이하, 보다 바람직하게 2배 미만이도록 첨가하는 단계로서, 반응기 부피는 250 mL 내지 10.000 m3 (입방 미터) 범위인 단계;
ii) 락토스 공급물을 연속 방식으로 배양 배지에 1일, 2일, 3일, 4일, 5일의 과정 동안 공급 용액을 통해 첨가하는 단계;
iii) 락토스 공급물을 연속 방식으로 배양 배지에 1일, 2일, 3일, 4일, 5일의 과정 동안 공급 용액을 통해 첨가하는 단계로서, 상기 락토스 공급 용액의 농도는 50 g/L, 바람직하게 75 g/L, 보다 바람직하게 100 g/L, 보다 바람직하게 125 g/L, 보다 바람직하게 150 g/L, 보다 바람직하게 175 g/L, 보다 바람직하게 200 g/L, 보다 바람직하게 225 g/L, 보다 바람직하게 250 g/L, 보다 바람직하게 275 g/L, 보다 바람직하게 300 g/L, 보다 바람직하게 325 g/L, 보다 바람직하게 350 g/L, 보다 바람직하게 375 g/L, 보다 바람직하게, 400 g/L, 보다 바람직하게 450 g/L, 보다 바람직하게 500 g/L, 보다 더 바람직하게, 550 g/L, 가장 바람직하게 600 g/L 이고; 바람직하게 상기 용액의 pH는 3과 7 사이로 설정되고, 바람직하게 상기 공급 용액의 온도는 20℃와 80℃ 사이로 유지되는 것인 단계;
상기 방법은 상기 배양 배지의 최종 부피 중에 적어도 50 g/L, 바람직하게 적어도 75 g/L, 보다 바람직하게 적어도 90 g/L, 보다 바람직하게 적어도 100 g/L, 보다 바람직하게 적어도 125 g/L, 보다 바람직하게 적어도 150 g/L, 보다 바람직하게 적어도 175 g/L, 보다 바람직하게 적어도 200 g/L의 농도로 코어 삼당류로서 락토-N-트리오스 (LN3; GlcNAc-베타1,3-Gal-베타1,4-Glc)를 포함하는 올리고당을 생성시킨다.
23. 구현예 22에 따른 방법에 있어서, 락토스 공급은 락토스를 배양 시작부터, 적어도 5 mM의 농도, 바람직하게 30, 40, 50, 60, 70, 80, 90, 100, 150 mM의 농도, 보다 바람직하게 > 300 mM의 농도로 첨가하여 수행된다.
24. 구현예 22 또는 23 중 어느 하나에 따른 방법에 있어서, 상기 락토스 공급은, 배양의 생산 단계 전반에서, 적어도 5 mM, 바람직하게 10 mM 또는 30 mM의 락토스 농도가 수득되는, 농도로 배양 배지에 락토스를 첨가하여 수행된다.
25. 구현예 21 내지 24 중 어느 하나에 따른 방법에 있어서, 숙주 세포는 적어도 약 60, 80, 100, 또는 약 120시간 동안 또는 연속 방식으로 배양된다.
26. 구현예 21 내지 25 중 어느 하나에 따른 방법에 있어서, 탄소 및 에너지 공급원, 바람직하게 글루코스, 글리세롤, 프룩토스, 말토스, 아라비노스, 말토덱스트린, 말토-올리고당, 말토트리오스, 솔비톨, 자일로스, 람노스, 수크로스, 갈락토스, 만노스, 메탄올, 에탄올, 트레할로스, 전분, 셀룰로스, 헤미-셀룰로스, 폴리올, 옥수수 침지액, 고-프룩토스 시럽, 숙시네이트, 말레이트, 아세테이트, 시트레이트, 락테이트 및 피루베이트가 또한, 바람직하게 연속적으로, 배양 배지에, 바람직하게 락토스와 첨가된다.
27. 구현예 21 내지 26 중 어느 하나에 따른 방법에 있어서, 지수적 세포 성장의 제1 단계는 락토스가 제2 단계에서 배양 배지에 첨가되기 전에, 탄소-기반 기질, 바람직하게 글루코스 또는 수크로스를 배양 배지에 첨가하여 제공된다.
28. 구현예 21 내지 27 중 어느 하나에 따른 방법에 있어서, 상기 분리는 하기 단계 중 적어도 하나를 포함한다: 청징화, 한외여과, 나노여과, 역삼투, 미세여과, 활성 차콜 또는 탄소 처리, 접선 유동 고-성능 여과, 접선 유동 한외여과, 친화성 크로마토그래피, 이온 교환 크로마토그래피, 소수성 상호작용 크로마토그래피 및/또는 겔 여과, 리간드 교환 크로마토그래피.
29. 구현예 21 내지 28 중 어느 하나에 따른 방법에 있어서, 상기 코어 삼당류로서 LN3을 포함하는 올리고당 또는 코어 삼당류로서 LN3을 포함하는 적어도 하나의 올리고당을 포함하는 올리고당 혼합물을 각각 상기 세포로부터 정제하는 단계를 더 포함한다.
30. 구현예 21 내지 29 중 어느 하나에 따른 방법에 있어서, 상기 정제는 하기 단계 중 적어도 하나를 포함한다: 활성 차콜 또는 탄소의 사용, 차콜의 사용, 나노여과, 한외여과 또는 이온 교환, 알콜의 사용, 수성 알콜 혼합물의 사용, 결정화, 증발, 침전, 건조, 분무 건조 또는 동결건조.
31. 코어 삼당류로서 LN3을 포함하는 올리고당의 발효적 생산에서 구현예 1 내지 4 중 어느 하나에 정의된 바와 같은 막 단백질의 군으로부터 선택되는 막 단백질의 용도.
32. 코어 삼당류로서 LN3을 포함하는 올리고당의 생산을 위한 구현예 1 내지 19 중 어느 하나에 따른 세포의 용도.
33. 코어 삼당류로서 LN3을 포함하는 적어도 하나의 올리고당을 포함하는 올리고당의 혼합물의 생산을 위한 구현예 20에 따른 세포의 용도.
34. 코어 삼당류로서 LN3을 포함하는 올리고당의 생산을 위한 구현예 21 내지 30 중 어느 하나에 따른 방법의 용도.
또한, 본 발명은 하기 바람직한 특정 구현예와 관련된다:
1. 코어 삼당류로서 락토-N-트리오스 (LN3; GlcNAc-베타1,3-Gal-베타1,4-Glc)를 포함하는 올리고당의 생산을 위해 유전자 변형된 숙주 세포로서, 숙주 세포는 N-아세틸글루코사민 (GlcNAc) 잔기를 UDP-GlcNAc 도너로부터 락토스 억셉터로 전달하여 LN3을 합성하는 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제에 대한 적어도 하나의 핵산 서열을 포함하고, 발현하며,
- 상기 세포는 i) 내생성 막 단백질의 과발현 및/또는 ii) 이종성 막 단백질의 발현을 더 포함하여서 코어 삼당류로서 LN3을 포함하는 올리고당의 a) 개선된 생산, 및/또는 b) 가능하고/하거나 증강된 유출을 제공하고, 바람직하게 상기 개선된 생산 및 상기 증강된 유출은 동일한 유전적 배경을 갖지만 내생성 막 단백질의 상기 과발현 및 이종성 막 단백질의 상기 발현이 결여된 숙주 세포와 비교되고,
- 바람직하게 상기 세포는 상기 LN3을 변형시킬 수 있는 글리코실트랜스퍼라제를 코딩하는 적어도 하나의 핵산 서열을 더 포함하고 발현하며,
임의로 상기 개선된 생산은
- 상기 올리고당의 더 나은 적정가 (리터 당 그램 올리고당),
- 더 나은 생산율 r (시간 당 리터 당 그램 올리고당),
- 더 나은 세포 성능 지수 (그램 생물량 당 그램 올리고당),
- 더 나은 비생산성 (시간 당 그램 생물량 당 그램 올리고당),
- 수크로스에 대한 더 나은 수율 (그램 수크로스 당 그램 올리고당), 및/또는
- 더 나은 수크로스 흡수/전환율 (시간 당 그램 당 그램 수크로스),
- 더 나은 락토스 전환/소비율 (시간 당 그램 락토스), 및/또는
- 숙주 세포의 증강된 성장 속도
를 포함한다.
2. 제1항에 따른 세포에 있어서, 상기 막 단백질은 운송체, P-P-결합-가수분해-구동 수송체, 및 β-배럴 포린의 군으로부터 선택되고,
a) 상기 막 단백질이 운송체의 군으로부터 선택될 때, 상기 막 단백질은
- TCDB 클래스 2.A.1.1, 2.A.1.2, 2.A.1.3, 2.A.1.6, 2.A.2.2, 2.A.7.1 및 2.A.66의 군, 또는
- eggnog 패밀리 05E8G, 05EGZ, 05JHE, 07QF7 07QRN, 07RBJ, 0814C 및 08N8A의 군, 또는
- PFAM 목록 PF00893, PF01943, PF05977, PF07690 및 PF13347, 또는
- interpro 목록 IPR000390, IPR001411, IPR001927, IPR002797, IPR004638, IPR005829, IPR010290, IPR011701, IPR020846, IPR023721, IPR023722, IPR032896, IPR036259 및 IPR039672, 또는
- SEQ ID NO 01을 갖는 크로노박터 무이트젠시 (Cronobacter muytjensii) 유래 MdfA, SEQ ID NO 02를 갖는 요케넬라 레겐스부르게이 (Yokenella regensburgei) (ATCC43003) 유래 MdfA, SEQ ID NO 03을 갖는 에스케리치아 콜라이 (Escherichia coli) K-12 MG1655 유래 MdfA, SEQ ID NO 04를 갖는 엔테로박터 (Enterobacter) sp. 유래 MdfA, SEQ ID NO 05를 갖는 시트로박터 코세리 (Citrobacter koseri) 유래 MFS, SEQ ID NO 06을 갖는 시트로박터 영애 (Citrobacter youngae) 유래 MdfA, SEQ ID NO 07을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 YbdA, SEQ ID NO 08을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 YjhB, SEQ ID NO 09를 갖는 에스케리치아 콜라이 K-12 MG1655 유래 WzxE, SEQ ID NO 10을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 EmrE, SEQ ID NO 11을 갖는 비피도박테리움 롱검 (Bifidobacterium longum) subsp. 인판티스 (Infantis) (균주 ATCC 15697) 유래 Blon_2331, SEQ ID NO 12를 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_0247, SEQ ID NO 13을 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_0345, SEQ ID NO 14를 갖는 클렙시엘라 뉴모니아에 (Klebsiella pneumoniae) 유래 IceT, SEQ ID NO 53을 갖는 크로노박터 사카자키 (Cronobacter sakazakii) 균주 MOD1_LR753 유래 MdfA, SEQ ID NO 54를 갖는 프란코니박터 풀베리스 (Franconibacter pulveris) LMG 24059 유래 MdfA, SEQ ID NO 55를 갖는 엔테로박터 호르마에케이 (Enterobacter hormaechei) 균주 017 유래 MdfA, SEQ ID NO 56을 갖는 시트로박터 코세리 (Citrobacter koseri) 균주 NCTC10771 유래 MdfA, SEQ ID NO 57을 갖는 살모넬라 엔테리카 (Salmonella enterica) subsp. 아리조나에 (arizonae) 혈청형 41:z4,z23:- 균주 TAMU30EF 유래 MdfA, SEQ ID NO 58을 갖는 시겔라 플렉스네리 (Shigella flexneri) 균주 585219 유래 MdfA, SEQ ID NO 59를 갖는 요케넬라 레겐스부르게이 (Yokenella regensburgei) 균주 UMB0819 유래 MdfA, SEQ ID NO 60을 갖는 에스케리치아 콜라이 균주 AMC_967 유래 MdfA, SEQ ID NO 61을 갖는 클렙시엘라 뉴모니아에 (Klebsiella pneumoniae) VAKPC309 유래 MdfA, SEQ ID NO 62를 갖는 클렙시엘라 옥시토카 (Klebsiella oxytoca) 균주 4928STDY7071490 유래 MdfA, SEQ ID NO 63을 갖는 클렙시엘라 미시가넨시스 (Klebsiella michiganensis) 균주 A2 유래 MdfA, SEQ ID NO 64를 갖는 플루랄리박터 게르고비아에 (Pluralibacter gergoviae) 균주 FDAARGOS_186 유래 MdfA, SEQ ID NO 65를 갖는 클루이베라 아스코르바타 (Kluyvera ascorbata) ATCC 33433 유래 MdfA, SEQ ID NO 66을 갖는 엔테로박터 코베이 (Enterobacter kobei) 유래 MdfA, SEQ ID NO 67을 갖는 렐리오티아 (Lelliottia) sp. WB101 유래 MdfA, SEQ ID NO 68을 갖는 시트로박터 프레운디 (Citrobacter freundii) 유래 MdfA, SEQ ID NO 69를 갖는 살모넬라 엔테리카 (Salmonella enterica) subsp. 살라마에 (Salamae) 유래 MdfA 또는 SEQ ID NO 70을 갖는 시겔라 플렉스네리 (Shigella flexneri) 유래 MdfA, 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69 또는 70을 갖는 상기 막 단백질 중 어느 하나의 전체 길이 서열에 대해서 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열
로부터 선택되거나;
b) 상기 막 단백질이 P-P-결합-가수분해-구동 수송체의 군으로부터 선택될 때, 상기 막 단백질은
- TCDB 클래스 3.A.1.1 및 3.A.1.2의 군, 또는
- eggnog 패밀리 05CJ1, 05DFW, 05EZD, 05I1K, 07HR3 및 08IJ9의 군, 또는
- PFAM 목록 PF00005, PF00528, PF13407 및 PF17912, 또는
- interpro 목록 IPR000515, IPR003439, IPR003593, IPR005978, IPR008995, IPR013456, IPR015851, IPR017871, IPR025997, IPR027417, IPR028082, IPR035906, 및 IPR040582, 또는
- SEQ ID NO 15를 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_2475, SEQ ID NO 16을 갖는 브라디리조비움 자포니쿰 (Bradyrhizobium japonicum) USDA 110 유래 nodi, SEQ ID NO 17을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 xylF, SEQ ID NO 18을 갖는 비피도박테리움 롱검 subsp. 인판티스 Bi-26 유래 TIC77290, SEQ ID NO 19를 갖는 비피도박테리움 롱검 subsp. 인판티스 Bi-26 유래 TIC77291, SEQ ID NO 20을 갖는 비피도박테리움 롱검 subsp. 인판티스 Bi-26 유래 TIC76854 TIC77291, 또는 상기 P-P-결합-가수분해-구동 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 15, 16, 17, 18, 19 또는 20을 갖는 상기 막 단백질 중 어느 하나의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열
로부터 선택되거나; 또는
c) 상기 막 단백질이 β-배럴 포린의 군으로부터 선택될 때, 상기 막 단백질은
- TCDB 클래스 1.B.18, 또는
- eggnog 패밀리 05DAY, 또는
- PFAM 목록 PF02563, PF10531 및 PF18412, 또는
- interpro 목록 IPR003715, IPR019554 및 IPR040716, 또는
- SEQ ID NO 21을 갖는 에스케리치아 콜라이 K12 MG1655 유래 Wza, 또는 이의 기능성 상동체 또는 기능성 단편, 또는 SEQ ID NO 21을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열
로부터 선택되고;
TCDB 클래스는 2019년 6월 17일 배포된 TCDB.org 에 의해 정의되는 바와 같고, eggnog 패밀리는 2016년 9월 배포된 eggnogdb 4.5.1에 의해 정의되는 바와 같고, PFAM 목록은 2018년 9월에 배포된 Pfam 32.0에 의해 정의되는 바와 같고, interpro 목록은 2019년 7월 4일 배포된 InterPro 75.0에 의해 정의되는 바와 같다.
3. 제1항 또는 제2항 중 어느 하나에 따른 세포에 있어서, 상기 막 단백질은 하기로 이루어진 막 단백질의 군으로부터 선택된다:
a) 운송체 막 단백질로서 SEQ ID NO 01을 갖는 크로노박터 무이트젠시 (Cronobacter muytjensii) 유래 MdfA, SEQ ID NO 02를 갖는 요케넬라 레겐스부르게이 (Yokenella regensburgei) (ATCC43003) 유래 MdfA, SEQ ID NO 03을 갖는 에스케리치아 콜라이 (Escherichia coli) K-12 MG1655 유래 MdfA, SEQ ID NO 04를 갖는 엔테로박터 (Enterobacter) sp. 유래 MdfA, SEQ ID NO 05를 갖는 시트로박터 코세리 (Citrobacter koseri) 유래 MFS, SEQ ID NO 06을 갖는 시트로박터 영애 (Citrobacter youngae) 유래 MdfA, SEQ ID NO 07을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 YbdA, SEQ ID NO 08을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 YjhB, SEQ ID NO 09를 갖는 에스케리치아 콜라이 K-12 MG1655 유래 WzxE, SEQ ID NO 10을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 EmrE, SEQ ID NO 11을 갖는 비피도박테리움 롱검 (Bifidobacterium longum) subsp. 인판티스 (Infantis) (균주 ATCC 15697) 유래 Blon_2331, SEQ ID NO 12를 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_0247, SEQ ID NO 13을 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_0345, SEQ ID NO 14를 갖는 클렙시엘라 뉴모니아에 (Klebsiella pneumoniae) 유래 IceT, SEQ ID NO 53을 갖는 크로노박터 사카자키 (Cronobacter sakazakii) 균주 MOD1_LR753 유래 MdfA, SEQ ID NO 54를 갖는 프란코니박터 풀베리스 (Franconibacter pulveris) LMG 24059 유래 MdfA, SEQ ID NO 55를 갖는 엔테로박터 호르마에케이 (Enterobacter hormaechei) 균주 017 유래 MdfA, SEQ ID NO 56을 갖는 시트로박터 코세리 (Citrobacter koseri) 균주 NCTC10771 유래 MdfA, SEQ ID NO 57을 갖는 살모넬라 엔테리카 (Salmonella enterica) subsp. 아리조나에 (arizonae) 혈청형 41:z4,z23:- 균주 TAMU30EF 유래 MdfA, SEQ ID NO 58을 갖는 시겔라 플렉스네리 (Shigella flexneri) 균주 585219 유래 MdfA, SEQ ID NO 59를 갖는 요케넬라 레겐스부르게이 (Yokenella regensburgei) 균주 UMB0819 유래 MdfA, SEQ ID NO 60을 갖는 에스케리치아 콜라이 균주 AMC_967 유래 MdfA, SEQ ID NO 61을 갖는 클렙시엘라 뉴모니아에 (Klebsiella pneumoniae) VAKPC309 유래 MdfA, SEQ ID NO 62를 갖는 클렙시엘라 옥시토카 (Klebsiella oxytoca) 균주 4928STDY7071490 유래 MdfA, SEQ ID NO 63을 갖는 클렙시엘라 미시가넨시스 (Klebsiella michiganensis) 균주 A2 유래 MdfA, SEQ ID NO 64를 갖는 플루랄리박터 게르고비아에 (Pluralibacter gergoviae) 균주 FDAARGOS_186 유래 MdfA, SEQ ID NO 65를 갖는 클루이베라 아스코르바타 (Kluyvera ascorbata) ATCC 33433 유래 MdfA, SEQ ID NO 66을 갖는 엔테로박터 코베이 (Enterobacter kobei) 유래 MdfA, SEQ ID NO 67을 갖는 렐리오티아 (Lelliottia) sp. WB101 유래 MdfA, SEQ ID NO 68을 갖는 시트로박터 프레운디 (Citrobacter freundii) 유래 MdfA, SEQ ID NO 69를 갖는 살모넬라 엔테리카 (Salmonella enterica) subsp. 살라마에 (Salamae) 유래 MdfA 또는 SEQ ID NO 70을 갖는 시겔라 플렉스네리 (Shigella flexneri) 유래 MdfA, 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69 또는 70을 갖는 상기 막 단백질의 전체 길이 서열에 대해서 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
b) P-P-결합-가수분해-구동 수송체로서 SEQ ID NO 15를 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_2475, SEQ ID NO 16을 갖는 브라디리조비움 자포니쿰 (Bradyrhizobium japonicum) USDA 110 유래 nodi, SEQ ID NO 17을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 xylF, SEQ ID NO 18을 갖는 비피도박테리움 롱검 subsp. 인판티스 Bi-26 유래 TIC77290, SEQ ID NO 19를 갖는 비피도박테리움 롱검 subsp. 인판티스 Bi-26 유래 TIC77291, SEQ ID NO 20을 갖는 비피도박테리움 롱검 subsp. 인판티스 Bi-26 유래 TIC76854 TIC77291 또는 상기 P-P-결합-가수분해-구동 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 15, 16, 17, 18, 19 또는 20을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
c) β-배럴 포린 막 단백질로서 SEQ ID NO 21을 갖는 에스케리치아 콜라이 K12 MG1655 유래 Wza, 또는 상기 Wza 단백질의 기능성 상동체 또는 기능성 단편, 또는 SEQ ID NO 21을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열.
4. 제1항 내지 제3항 중 어느 하나의 항에 따른 세포에 있어서, 상기 막 단백질은 하기로 이루어진 막 단백질의 군으로부터 선택된다:
a) SEQ ID NO 01, 02, 04, 05, 06, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69 또는 70으로 표시되는 운송체 막 단백질, 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 01, 02, 04, 05, 06, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69 또는 70을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
b) SEQ ID NO 15, 16, 17, 18, 19 또는 20으로 표시되는 P-P-결합-가수분해-구동 수송체, 또는 상기 P-P-결합-가수분해-구동 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 15, 16, 17, 18, 19 또는 20을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
c) SEQ ID NO 21로 표시되는 β-배럴 포린 막 단백질, 또는 상기 β-배럴 포린 막 단백질의 기능성 상동체 또는 기능성 단편, 또는 SEQ ID NO 21을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열.
5. 제1항 내지 제4항 중 어느 하나에 따른 세포에 있어서, 상기 막 단백질은 하기로 이루어진 막 단백질의 군으로부터 선택된다:
a) SEQ ID NO 01, 02, 04, 05, 06, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69 또는 70로 표시되는 운송체 막 단백질, 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는
- 각각 SEQ ID NO 09, 10, 11, 12 또는 13을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80% 서열 동일성,
- 각각 SEQ ID NO 01, 02, 04, 14, 53, 54, 55, 59, 61, 62, 63, 64, 65, 66, 67 또는 69를 갖는 상기 막 단백질의 ㅈ언체 길이 서열에 대해 적어도 90% 서열 동일성,
- 각각 SEQ ID NO 05, 06, 56, 57 또는 68을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 95.00% 서열 동일성, 또는
- 각각 SEQ ID NO 58, 60 또는 70을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 99.00% 서열 동일성
을 갖는 단백질 서열; 및
b) SEQ ID NO 15, 16, 17, 18, 19 또는 20으로 표시되는 P-P-결합-가수분해-구동 수송체, 또는 상기 P-P-결합-가수분해-구동 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 15, 16, 17, 18, 19 또는 20을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열, 및
c) SEQ ID NO 21로 표시되는 β-배럴 포린 막 단백질, 또는 상기 β-배럴 포린 막 단백질의 기능성 상동체 또는 기능성 단편, 또는 SEQ ID NO 21을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열.
6. 제1항 내지 제4항 중 어느 하나의 항에 따른 세포에 있어서, 상기 막 단백질은 하기로 이루어진 막 단백질의 군으로부터 선택된다:
a) SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64, 65, 66, 67, 또는 69로 표시되는 운송체 막 단백질, 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64, 65, 66, 67, 또는 69를 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
b) SEQ ID NO 15, 16, 17, 18, 19 또는 20으로 표시되는 P-P-결합-가수분해-구동 수송체, 또는 상기 P-P-결합-가수분해-구동 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 15, 16, 17, 18, 19 또는 20을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
c) SEQ ID NO 21로 표시되는 β-배럴 포린 막 단백질, 또는 상기 β-배럴 포린 막 단백질의 기능성 상동체 또는 기능성 단편, 또는 SEQ ID NO 21을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열.
7. 제1항 내지 제4항 또는 제6항 중 어느 하나의 항에 따른 세포에 있어서, 상기 막 단백질은 하기로 이루어진 막 단백질의 군으로부터 선택된다:
a) SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64, 65, 66, 67, 또는 69로 표시되는 운송체 막 단백질, 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64, 65, 66, 67, 또는 69를 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 90%, 바람직하게 적어도 95.00%, 보다 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
b) SEQ ID NO 15, 16, 17, 18, 19 또는 20으로 표시되는 P-P-결합-가수분해-구동 수송체, 또는 상기 P-P-결합-가수분해-구동 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 15, 16, 17, 18, 19 또는 20을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
c) SEQ ID NO 21로 표시되는 β-배럴 포린 막 단백질, 또는 상기 β-배럴 포린 막 단백질의 기능성 상동체 또는 기능성 단편, 또는 SEQ ID NO 21을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열.
8. 제1항 내지 제3항 중 어느 하나의 항에 따른 세포에 있어서, 상기 막 단백질은 하기로 이루어지는 막 단백질의 군으로부터 선택된다:
a) SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64 또는 65로 표시되는 운송체 막 단백질, 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64 또는 65를 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
b) SEQ ID NO 15, 16, 17, 18, 19 또는 20으로 표시되는 P-P-결합-가수분해-구동 수송체, 또는 상기 P-P-결합-가수분해-구동 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 15, 16, 17, 18, 19 또는 20을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
c) SEQ ID NO 21로 표시되는 β-배럴 포린 막 단백질, 또는 상기 β-배럴 포린 막 단백질의 기능성 상동체 또는 기능성 단편, 또는 SEQ ID NO 21을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열.
9. 제1항 내지 제3항 또는 제8항 중 어느 하나에 따른 세포에 있어서, 상기 막 단백질은 하기로 이루어진 막 단백질의 군으로부터 선택된다:
a) SEQ ID NO 01, 02, 04, 05, 06, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64 또는 65로 표시되는 운송체 막 단백질, 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 01, 02, 04, 05, 06, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64 또는 65를 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
b) SEQ ID NO 15, 16, 17, 18, 19 또는 20으로 표시되는 P-P-결합-가수분해-구동 수송체, 또는 상기 P-P-결합-가수분해-구동 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 15, 16, 17, 18, 19 또는 20을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
c) SEQ ID NO 21로 표시되는 β-배럴 포린 막 단백질, 또는 상기 β-배럴 포린 막 단백질의 기능성 상동체 또는 기능성 단편, 또는 SEQ ID NO 21을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열.
10. 제1항 내지 제3항, 제8항 또는 제9항 중 어느 하나에 따른 세포에 있어서, 상기 막 단백질은 하기로 이루어진 막 단백질의 군으로부터 선택된다:
a) SEQ ID NO 01, 02, 04, 05, 06, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64 또는 65로 표시되는 운송체 막 단백질, 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는
- 각각 SEQ ID NO 09, 10, 11, 12 또는 13을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80% 서열 동일성,
- 각각 SEQ ID NO 01, 02, 04, 14, 53, 54, 55, 59, 61, 62, 63, 64 또는 65를 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 90% 서열 동일성,
- 각각 SEQ ID NO 05, 06, 56 또는 57을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 95.00% 서열 동일성, 또는
- 각각 SEQ ID NO 58 또는 60을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 99.00% 서열 동일성
을 갖는 단백질 서열; 및
b) SEQ ID NO 15, 16, 17, 18, 19 또는 20으로 표시되는 P-P-결합-가수분해-구동 수송체, 또는 상기 P-P-결합-가수분해-구동 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 15, 16, 17, 18, 19 또는 20을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
c) SEQ ID NO 21로 표시되는 β-배럴 포린 막 단백질, 또는 상기 β-배럴 포린 막 단백질의 기능성 상동체 또는 기능성 단편, 또는 SEQ ID NO 21을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열.
11. 제1항 내지 제3항, 제8항 또는 제9항 중 어느 하나에 따른 세포에 있어서, 상기 막 단백질은 하기로 이루어진 막 단백질의 군으로부터 선택된다:
a) SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64 또는 65로 표시되는 운송체 막 단백질, 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64 또는 65를 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
b) SEQ ID NO 15, 16, 17, 18, 19 또는 20으로 표시되는 P-P-결합-가수분해-구동 수송체, 또는 상기 P-P-결합-가수분해-구동 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 15, 16, 17, 18, 19 또는 20을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
c) SEQ ID NO 21로 표시되는 β-배럴 포린 막 단백질, 또는 상기 β-배럴 포린 막 단백질의 기능성 상동체 또는 기능성 단편, 또는 SEQ ID NO 21을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열.
12. 제1항 내지 제3항, 제8항, 제9항 또는 제11항 중 어느 하나에 따른 세포에 있어서, 상기 막 단백질은 하기로 이루어진 막 단백질의 군으로부터 선택된다:
a) SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64 또는 65로 표시되는 운송체 막 단백질, 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64 또는 65를 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 90%, 바람직하게 적어도 95.00%, 보다 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
b) SEQ ID NO 15, 16, 17, 18, 19 또는 20으로 표시되는 P-P-결합-가수분해-구동 수송체, 또는 상기 P-P-결합-가수분해-구동 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 15, 16, 17, 18, 19 또는 20을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
c) SEQ ID NO 21로 표시되는 β-배럴 포린 막 단백질, 또는 상기 β-배럴 포린 막 단백질의 기능성 상동체 또는 기능성 단편, 또는 SEQ ID NO 21을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열.
13. 제1항 내지 제12항 중 어느 하나에 따른 세포에 있어서, 상기 막 단백질은 세포벽의 외막에 걸쳐 화합물의 수송에 관여되는 수송체 단백질이다.
14. 제1항 내지 제13항 중 어느 하나에 따른 세포에 있어서, 상기 글리코실트랜스퍼라제는 푸코실트랜스퍼라제, 시알릴트랜스퍼라제, 갈락토실트랜스퍼라제, 글루코실트랜스퍼라제, 만노실트랜스퍼라제, N-아세틸글루코사미닐트랜스퍼라제, N-아세틸갈락토사미닐트랜스퍼라제, N-아세틸만노사미닐트랜스퍼라제, 자일로실트랜스퍼라제, 글루쿠로닐트랜스퍼라제, 갈락투로닐트랜스퍼라제, 글루코사미닐트랜스퍼라제, N-글리코릴뉴라미닐트랜스퍼라제, 람노실트랜스퍼라제, N-아세틸람노실트랜스퍼라제, UDP-4-아미노-4,6-디데옥시-N-아세틸-베타-L-알트로사민 트랜스아미나제, UDP-N-아세틸글루코사민 에놀피루빌 트랜스퍼라제 및 푸코사미닐트랜스퍼라제를 포함하는 목록으로부터 선택되고,
바람직하게, 상기 세포는 상기 글리코실트랜스퍼라제 중 적어도 하나의 발현 또는 활성이 변형된다.
15. 제1항 내지 제14항 중 어느 하나에 따른 세포에 있어서, 코어 삼당류로서 락토-N-트리오스 (LN3; GlcNAc-베타1,3-Gal-베타1,4-Glc)를 포함하는 상기 올리고당은 포유동물 모유 올리고당 또는 루이스-유형 항원 올리고당이다.
16. 제1항 내지 제15항 중 어느 하나에 따른 세포에 있어서, 코어 삼당류로서 락토-N-트리오스 (LN3; GlcNAc-베타1,3-Gal-베타1,4-Glc)를 포함하는 상기 올리고당은 포유동물 모유 올리고당 (MMO), 바람직하게 인간 모유 올리고당 (HMO), 보다 바람직하게 코어 사당류로서 LNT 또는 LNnT를 갖는 MMO 또는 HMO, 보다 더 바람직하게 코어 사당류로서 LNT 또는 LNnT를 갖는 HMO, 가장 바람직하게 LNT 또는 LNnT이다.
17. 제1항 내지 제16항 중 어느 하나에 따른 세포에 있어서, 코어 삼당류로서 락토-N-트리오스 (LN3; GlcNAc-베타1,3-Gal-베타1,4-Glc)를 포함하는 상기 올리고당은 중성 올리고당이다.
18. 제1항 내지 제17항 중 어느 하나에 따른 세포에 있어서, 코어 삼당류로서 락토-N-트리오스 (LN3; GlcNAc-베타1,3-Gal-베타1,4-Glc)를 포함하는 상기 올리고당은 락토-N-트리오스, 락토-N-테트라오스, 락토-N-네오테트라오스, 락토-N-푸코펜타오스 I, 락토-N-네오푸코펜타오스 I, 락토-N-푸코펜타오스 II, 락토-N-푸코펜타오스 III, 락토-N-푸코펜타오스 V, 락토-N-푸코펜타오스 VI, 락토-N-네오푸코펜타오스 V, 락토-N-디푸코헥사오스 I, 락토-N-디푸코헥사오스 II, 락토-N-헥사오스 (LNH), 락토-N-네오헥사오스 (LNnH), 파라-락토-N-헥사오스 (pLNnH), 파라-락토-N-네오헥사오스 (pLNH), 디푸코실-락토-N-헥사오스, 디푸코실-락토-N-네오헥사오스, 락토-N-펜타오스 (LNP), 락토-N-네오펜타오스, 파라 락토-N-펜타오스, 파라 락토-N-네오펜타오스, 락토-N-노보펜타오스 I, 락토-N-헵타오스, 락토-N-네오헵타오스, 파라 락토-N-네오헵타오스, 파라 락토-N-헵타오스, 락토-N-옥타오스 (LNO), 락토-N-네오옥타오스, 이소 락토-N-옥타오스, 파라 락토-N-옥타오스, 이소 락토-N-네오옥타오스, 노보 락토-N-네오옥타오스, 파라 락토-N-네오옥타오스, 이소 락토-N-노나오스, 노보 락토-N-노나오스, 락토-N-노나오스, 락토-N-데카오스, 이소 락토-N-데카오스, 노보 락토-N-데카오스, 락토-N-네오데카오스, 시알릴-락토-N-테트라오스 a, 시알릴-락토-N-테트라오스 b, 시알릴-락토-N-테트라오스 c, 시알릴-락토-N-테트라오스 d를 포함하는 목록으로부터 선택된다.
19. 제1항 내지 제18항 중 어느 하나에 따른 세포에 있어서, 상기 글리코실트랜스퍼라제는 베타-1,3 또는 베타-1,4 연결로 LN3의 말단 GlcNAc 잔기로 UDP-Gal 도너로부터 갈락토스 (Gal)를 전달하여서, 각각 락토-N-테트라오스 (LNT; Gal-베타1,3-GlcNAc-베타1,3-Gal-베타1,4-Glc) 또는 락토-N-네오테트라오스 (LNnT; Gal-베타1,4-GlcNAc-베타1,3-Gal-베타1,4-Glc)를 생산하는 N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제 또는 N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제이다.
20. 제19항에 따른 세포에 있어서, 상기 세포는 전체 액체배지 및/또는 상청액에서 90 g/L 이상의 LNT를 생산하고/하거나, 전체 액체배지 및/또는 상청액 중 상기 LNT는 각각 전체 액체배지 및/또는 상청액에서 상기 세포에 의해 생산되는 LNT 및 LN3의 총량에 대해 측정된 적어도 80%의 순도를 갖는다.
21. 제19항에 따른 세포에 있어서, 상기 세포는 전체 액체배지 및/또는 상청액에서 70 g/L 이상, 바람직하게 90 g/L 이상의 LNnT를 생산하고/하거나, 전체 액체배지 및/또는 상청액 중 상기 LNnT는 각각 전체 액체배지 및/또는 상청액에서 상기 세포에 의해 생산되는 LNnT 및 LN3의 총량에 대해 측정된 적어도 80%의 순도를 갖는다.
22. 제1항 내지 제12항 중 어느 하나의 항에 따른 세포에 있어서, 상기 세포는 코어 삼당류로서 락토-N-트리오스 (LN3; GlcNAc-베타1,3-Gal-베타1,4-Glc)를 포함하는 상기 올리고당의 생산에서 사용되는 뉴클레오티드-활성화된 당을 추가로 합성할 수 있다.
23. 제22항에 따른 세포에 있어서, 상기 뉴클레오티드-활성화된 당은 UDP-N-아세틸갈락토사민 (UDP-GalNAc), UDP-N-아세틸만노사민 (UDP-ManNAc), UDP-글루코스 (UDP-Glc), UDP-갈락토스 (UDP-Gal), GDP-만노스 (GDP-Man), UDP-글루쿠로네이트, UDP-갈락투로네이트, UDP-2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, UDP-2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, UDP-N-아세틸-L-람노사민 (UDP-L-RhaNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-만노스), dTDP-N-아세틸푸코사민, UDP-N-아세틸푸코사민 (UDP-L-FucNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-갈락토스), UDP-N-아세틸-L-뉴모사민 (UDP-L-PneNAC 또는 UDP-2-아세타미도-2,6-디데옥시-L-탈로스), UDP-N-아세틸무람산, UDP-N-아세틸-L-퀴노보사민 (UDP-L-QuiNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-글루코스), CMP-시알산 (CMP-Neu5Ac), CMP-N-글리코릴뉴라민산 (CMP-Neu5Gc), GDP-푸코스 (GDP-Fuc), GDP-람노스 및 UDP-자일로스를 포함하는 목록으로부터 선택된다.
24. 제1항 내지 제23항 중 어느 하나에 따른 세포에 있어서, 세포는 적어도 부분적으로 불활성화된 선택된 단당류, 이당류 또는 올리고당에 대한 이화 경로를 포함하고, 단당류, 이당류, 또는 올리고당은 코어 삼당류로서 LN3을 포함하는 올리고당의 합성에 관여되고/되거나 필요한 것이다.
25. 제1항 내지 제24항 중 어느 하나에 따른 세포에 있어서, 상기 세포는 코어 삼당류로서 LN3을 포함하는 상기 올리고당의 합성을 위한 전구체를 사용한다.
26. 제1항 내지 제25항 중 어느 하나에 따른 세포에 있어서, 상기 막 단백질은 코어 삼당류로서 LN3을 포함하는 상기 올리고당의 합성을 위한 전구체의 흡수에 관여된다.
27. 제1항 내지 제26항 중 어느 하나에 따른 세포에 있어서, 상기 세포는 코어 삼당류로서 LN3을 포함하는 상기 올리고당의 합성을 위한 전구체를 생산한다.
28. 제1항 내지 제27항 중 어느 하나에 따른 세포에 있어서, 세포는 배지에서 안정하게 배양된다.
29. 제1항 내지 제28항 중 어느 하나에 따른 세포에 있어서, 상기 세포는 미생물, 식물 세포, 동물 세포, 곤충 세포 또는 원충 세포이고, 바람직하게
- 상기 미생물은 박테리아, 진균 또는 효모이고,
- 상기 식물 세포는 담배, 알파파, 벼, 목화, 유채, 대두, 옥수수 또는 곡물, 및/또는 세포이고,
- 상기 동물 세포는 비-인간 포유동물, 조류, 어류, 무척추동물, 파충류, 또는 양서류로부터 유래되거나, 또는 상기 동물 세포는 배아 줄기 세포를 제외한 인간 세포로부터 유래되는 유전자 조작된 세포주이다.
30. 제29항에 따른 세포에 있어서, 상기 세포는 박테리아, 바람직하게 에스케리치아 콜라이 균주, 보다 바람직하게 K-12 균주인 에스케리치아 콜라이 균주의 세포이고, 보다 더 바람직하게 에스케리치아 콜라이 K-12 균주는 이.콜라이 MG1655이다.
31. 제1항 내지 제30항 중 어느 하나에 따른 세포에 있어서, 세포는 코어 삼당류로서 LN3을 포함하는 적어도 하나의 올리고당을 포함하는 올리고당의 혼합물을 합성할 수 있다.
32. 유전자 조작된 세포에 의해서 코어 삼당류로서 락토-N-트리오스 (LN3; GlcNAc-베타1,3-Gal-베타1,4-Glc)를 포함하는 올리고당을 제조하기 위한 방법으로서, 하기 단계를 포함한다:
a) 제1항 내지 제31항 중 어느 하나에 따른 세포를 제공하는 단계, 및
b) 코어 삼당류로서 LN3을 포함하는 상기 올리고당의 생산을 허용하는 조건 하에 배지에서 세포를 배양하는 단계, 및
c) 바람직하게 상기 코어 삼당류로서 LN3을 포함하는 올리고당 또는 코어 삼당류로서 LN3을 포함하는 적어도 하나의 올리고당을 포함하는 올리고당 혼합물을 각각 배양으로부터 분리시키는 단계.
33. 제32항에 따른 방법에 있어서, 방법은 하기 단계 중 적어도 하나를 더 포함한다:
i) 배양 배지에 초기 반응기 부피의 리터 당 적어도 50, 보다 바람직하게 적어도 75, 보다 바람직하게 적어도 100, 보다 바람직하게 적어도 120, 보다 바람직하게 적어도 150 그램의 락토스를 포함하는 락토스 공급물을, 바람직하게 연속 방식으로, 바람직하게 배양 배지의 최종 부피가 상기 락토스 공급물의 첨가 전 배양 배지 부피의 3배 이하, 바람직하게 2배 이하, 보다 바람직하게 2배 미만이 되도록 첨가하는 단계로서, 반응기 부피는 250 mL 내지 10.000 m3 (입방 미터) 범위인 단계;
ii) 락토스 공급물을 연속 방식으로 배양 배지에 1일, 2일, 3일, 4일, 5일의 과정 동안 공급 용액을 통해서 첨가하는 단계;
iii) 락토스 공급물을 연속 방식으로 배양 배지에 1일, 2일, 3일, 4일, 5일의 과정 동안 공급 용액을 통해서 첨가하는 단계로서, 상기 락토스 공급 용액의 농도는 50 g/L, 바람직하게 75 g/L, 보다 바람직하게 100 g/L, 보다 바람직하게 125 g/L, 보다 바람직하게 150 g/L, 보다 바람직하게 175 g/L, 보다 바람직하게 200 g/L, 보다 바람직하게 225 g/L, 보다 바람직하게 250 g/L, 보다 바람직하게 275 g/L, 보다 바람직하게 300 g/L, 보다 바람직하게 325 g/L, 보다 바람직하게 350 g/L, 보다 바람직하게 375 g/L, 보다 바람직하게, 400 g/L, 보다 바람직하게 450 g/L, 보다 바람직하게 500 g/L, 보다 더 바람직하게, 550 g/L, 가장 바람직하게 600 g/L이고; 바람직하게 상기 용액의 pH는 3과 7 사이로 설정되고, 바람직하게 상기 공급 용액의 온도는 20℃와 80℃ 사이로 유지되는 것인 단계;
상기 방법은 상기 배양 배지의 최종 부피 중에 적어도 50 g/L, 바람직하게 적어도 75 g/L, 보다 바람직하게 적어도 90 g/L, 보다 바람직하게 적어도 100 g/L, 보다 바람직하게 적어도 125 g/L, 보다 바람직하게 적어도 150 g/L, 보다 바람직하게 적어도 175 g/L, 보다 바람직하게 적어도 200 g/L의 농도로 코어 삼당류로서 락토-N-트리오스 (LN3; GlcNAc-베타1,3-Gal-베타1,4-Glc)를 포함하는 올리고당을 생성시킨다.
34. 제33항에 따른 방법에 있어서, 락토스 공급물은 배양의 시작부터 락토스를 적어도 5 mM의 농도, 바람직하게 30, 40, 50, 60, 70, 80, 90, 100, 150 mM의 농도, 보다 바람직하게 > 300 mM의 농도로 첨가하여 수행된다.
35. 제33항 또는 제34항에 따른 방법에 있어서, 상기 락토스 공급물은 배양의 생산 단계 전반에서, 적어도 5 mM, 바람직하게 10 mM 또는 30 mM의 락토스 농도가 수득되는, 농도로 배양 배지에 락토스를 첨가하여 수행된다.
36. 제32항 내지 제35항 중 어느 하나에 따른 방법에 있어서, 숙주 세포는 적어도 약 60, 80, 100, 또는 약 120시간 동안 또는 연속 방식으로 배양된다.
37. 제32항 내지 제36항 중 어느 하나에 따른 방법에 있어서, 탄소 및 에너지 공급원, 바람직하게 글루코스, 글리세롤, 프룩토스, 말토스, 아라비노스, 말토덱스트린, 말토-올리고당, 말토트리오스, 솔비톨, 자일로스, 람노스, 수크로스, 갈락토스, 만노스, 메탄올, 에탄올, 트레할로스, 전분, 셀룰로스, 헤미-셀룰로스, 폴리올, 옥수수 침지액, 고-프룩토스 시럽, 숙시네이트, 말레이트, 아세테이트, 시트레이트, 락테이트 및 피루베이트가 또한 바람직하게 연속으로 배양 배지에 바람직하게 락토스와 첨가된다.
38. 제32항 내지 제37항 중 어느 하나에 따른 방법에 있어서, 지수적 세포 성장의 제1 단계는 락토스가 제2 단계에서 배양 배지에 첨가되기 전에 탄소-기반 기질, 바람직하게 글루코스 또는 수크로스를 배양 배지에 첨가하여 제공된다.
39. 제32항 내지 제38항 중 어느 하나에 따른 방법에 있어서, 상기 분리는 하기 단계 중 적어도 하나를 포함한다: 청징화, 한외여과, 나노여과, 역삼투, 미세여과, 활성 차콜 또는 탄소 처리, 접선 유동 고-성능 여과, 접선 유동 한외여과, 친화성 크로마토그래피, 이온 교환 크로마토그래피, 소수성 상호작용 크로마토그래피 및/또는 겔 여과, 리간드 교환 크로마토그래피.
40. 제32항 내지 제39항 중 어느 하나에 따른 방법에 있어서, 상기 코어 삼당류로서 LN3을 포함하는 올리고당 또는 코어 삼당류로서 LN3을 포함하는 적어도 하나의 올리고당을 포함하는 올리고당 혼합물을 각각 상기 세포로부터 정제하는 단계를 더 포함한다.
41. 제32항 내지 제40항 중 어느 하나에 따른 방법에 있어서, 상기 정제는 하기 단계 중 적어도 하나를 포함한다: 활성 차콜 또는 탄소의 사용, 차콜의 사용, 나노여과, 한외여과 또는 이온 교환, 알콜의 사용, 수성 알콜 혼합물의 사용, 결정화, 증발, 침전, 건조, 분무 건조 또는 동결건조.
42. 코어 삼당류로서 LN3을 포함하는 올리고당의 발효적 생산에서 제1항 내지 제12항 중 어느 하나에 정의된 바와 같은 막 단백질의 군으로부터 선택되는 막 단백질의 용도.
43. 코어 삼당류로서 LN3을 포함하는 올리고당의 생산을 위한 제1항 내지 제31항 중 어느 하나에 따른 세포의 용도.
44. 코어 삼당류로서 LN3을 포함하는 적어도 하나의 올리고당을 포함하는 올리고당의 혼합물의 생산을 위한 제31항에 따른 세포의 용도.
45. 코어 삼당류로서 LN3을 포함하는 올리고당의 생산을 위한 제32항 내지 제41항 중 어느 하나에 따른 방법의 용도.
본 발명은 실시예에서 보다 상세히 기술될 것이다. 실시예는 본 발명의 추가 예시 및 설명으로서 제공되고 제한하려는 의도가 아니다.
실시예
실시예 1. 막 단백질 패밀리의 확인
HMM은 프로파일 은닉 마코프 (Markov) 모델이라고 불리는 확률 모델이다. 이것은 위치-특이적 채점 시스템으로 정렬된 단백질 세트를 특징화시킨다. 아미노산은 그들이 발생되는 빈도에 따라서 서열 정렬의 각 위치에서 점수를 제공한다 (Eddy, S.R.1998. Profile hidden Markov models. Bioinformatics. 14: 755-63). HMM은 Pfam, InterPro, SMART, TIGRFAM, PIRSF, PANTHER, SFLD, Superfamily 및 유전자3D를 포함하는, 이러한 단백질 분류 방법을 사용하는 수많은 데이터베이스로부터 분명한 바와 같이 광범위한 유용성을 갖는다.
2019년 6월 13일 배포된 HMMER package 3.2.1의 HMMsearch (http://hmmer.org/)는 서열 상동성에 대해 서열 데이터베이스를 검색하기 위해 이러한 HMM을 사용할 수 있다. 사용할 수 있는 서열 데이터베이스는 예를 들어, NCBI nr 단백질 데이터베이스 (NR; https://www.ncbi.nlm.nih.gov/protein), UniProt Knowledgebase (UniProtKB, https://www.uniprot.org/help/uniprotkb) 및 SWISS-PROT 데이터베이스 (https://web.expasy.org/docs/swiss-prot_guideline.html)이지만, 이에 제한되지 않는다.
막 단백질 패밀리는 2016년 9월에 배포된 eggNOG 데이터베이스 4.5.1 (https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6324079/; http://eggnog.embl.de/#/app/home), 2019년 6월 17일 배포된 TCDB 데이터베이스 (http://www.tcdb.org/public/tcdb), 2019년 7월 4일 배포된 InterPro 75.0 (https://www.ebi.ac.uk/interpro/) 및 2018년 9월 배포된 Pfam 32.0를 사용하는 PFAM 도메인 (https://pfam.xfam.org/)을 기반으로 분류되었다. eggNOG 데이터베이스는 오솔로그 관계, 유전자 진화 이력 및 기능 주석의 공공 데이터베이스이다. 수송체 분류 데이터베이스 (Transporter Classification DataBase) (TCDB)는 효소 분류를 위한 효소 위원회 (Enzyme Commission)(EC) 체계와 유사하고 기능 및 계통발생적 정보 둘 모두를 통합한다. Pfam 및 InterPro 데이터베이스는 단백질 패밀리의 거대 컬렉션이다. 다른 단백질 도메인 예컨대 SMART (http://smart.embl-heidelberg.de/), TIGRFAM (https://www.jcvi.org/tigrfams), PIRSF (https://proteininformationresource.org/pirwww/dbinfo/pirsf.shtml), PANTHER (http://pantherdb.org/), SFLD (http://sfld.rbvi.ucsf.edu/archive/django/index.html), Superfamily (http://supfam.org/) 및 Gene3D (http://gene3d.biochem.ucl.ac.uk/Gene3D/), NCBI 보존 도메인 (https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)이 또한 사용될 수 있다.
eggNOG 패밀리의 확인은 2017년 11월 15일에 배포된 eggNOG-mapper 1.0.3 ( https://github.com/eggnogdb/eggnog-mapper)의 독립 형태를 사용하고 2016년 9월 배포된 eggnogdb 4.5.1을 기반으로 수행되었다. eggNOG 패밀리 각각 경우에, HMM은 eggNOG 웹사이트에서 다운로드할 수 있고, 단백질 데이터베이스에서 HMMsearch를 위해 사용될 수 있다.
TCDB 패밀리의 확인은 2019년 6월 17일에 배포된 TCDB 데이터베이스에서 블라스팅 (blastp)하여 수행되었다. 수득된 패밀리의 새로운 구성원은 웹사이트 (http://www.tcdb.org/download.php)에서 검색될 수 있다. Fasta 파일이 단백질 데이터베이스에 대한 blstp의 입력으로서 사용될 수 있다.
PFAM 도메인의 확인은 2018년 9월에 배포된 https://pfam.xfam.org/search#tabview=tab1 상에서의 온라인 검색을 통해 수행되었다. 수득된 패밀리에 대한 HMM은 'Curation & model'에서 다운로드하였다. 단백질 데이터베이스에 대해 이 모델을 사용한 HMMsearch는 새로운 패밀리 구성원을 확인하게 된다. InterPro 히트를 포함하는 서열은 또한 PFAM 웹사이트로부터 다운로드될 수 있다.
InterPro (수퍼)패밀리, 도메인 및 사이트의 확인은 https://www.ebi.ac.uk/interpro/ 상의 온라인 도구 또는 InterProScan (https://www.ebi.ac.uk/interpro/download.html)의 독립 형태를 사용하여 수행되었고, 둘 모두는 2019년 7월 4일 배포된 InterPro 75.0을 기반으로 한다. InterPro는 단백질 모티프 및 도메인의 많은 데이터베이스의 정보를 조합하는 복합 데이터베이스이다. InterPro 도메인 및/또는 (수퍼)패밀리의 HMM은 InterProScan에서 수득될 수 있고, 단백질 데이터베이스에서 새로운 패밀리 구성원을 확인하는데 사용될 수 있다. InterPro 히트를 포함하는 서열은 또한 InterPro 웹사이트 ('Protein Matched')로부터 다운로드할 수 있거나 또는 UniProt 웹사이트 (https://www.uniprot.org)에서 문의할 수 있다.
실시예 2: 폴리펩티드 서열 간 동일성 백분율의 계산
비교를 위한 서열의 정렬 방법은 당분야에 충분히 공지되어 있고, 이러한 방법은 GAP, BESTFIT, BLAST, FASTA 및 TFASTA를 포함한다. GAP은 일치 개수를 최대화하고 갭의 개수를 최소화하는 2개 서열의 전체 (즉, 전체 길이 서열 포괄) 정렬을 찾기 위해서 Needleman and Wunsch의 알고리즘 (J. Mol. Biol. (1970) 48: 443-453)을 사용한다. BLAST 알고리즘 (Altschul et al., J. Mol. Biol. (1990) 215: 403-10)은 전체 서열 동일성 백분율 (즉, 전체 길이 서열에 대함)을 계산하고, 2개 서열 간 유사성의 통계적 분석을 수행한다. BLAST 분석을 수행하기 위한 소프트웨어는 NCBI를 통해 공공으로 입수가능하다. 상동체는 예를 들어 디폴트 쌍별 정렬 매개변수, 및 백분율 채점 방법을 사용하는, 예를 들어, ClustalW 다중 서열 정렬 알고리즘 (version 1.83)을 사용해 쉽게 확인할 수 있다. 유사성 및 동일성의 전체 백분율 (즉, 전체 길이 서열 포괄됨)은 또한 MatGAT 소프트웨어 패키지 (Campanella et al., BMC Bioinformatics (2003) 4:29)에서 입수가능한 방법 중 하나를 사용해 결정될 수 있다. 당업자에게 자명한 바와 같이, 보존된 모티프 간에 정렬을 최적화하기 위해 약간의 수동 편집을 수행할 수 있다. 더 나아가서, 상동체의 확인을 위해 전체 길이 서열을 사용하는 대신에, 소위 국소 서열 동일성을 결정하기 위해, 특정 도메인을 또한 사용할 수 있다. 서열 동일성 값은 전체 핵산 또는 아미노산 서열 (= 전체 서열 동일성 점수를 생성시키는 전체 길이 서열에 대한 국소 서열 동일성 검색) 상에서 또는 선택된 도메인 또는 보존된 모티프(들) (= 국소 서열 동일성 점수를 생성시키는 부분 서열 상에서 국소 서열 동일성 검색) 상에서, 디폴트 매개변수를 사용하여 상기 언급된 프로그램을 사용해 결정될 수 있다. 국소 정렬 경우, Smith-Waterman 알고리즘이 특히 유용하다 (Smith TF, Waterman MS (1981) J. Mol. Biol 147(1); 195-7).
실시예 3: SEQ ID NO 01을 갖는 막 단백질의 상동체의 확인
수송체 유전자의 상동체는 서열 데이터베이스 예컨대 PATRIC (https://www.patricbrc.org/), Uniprot (https://www.uniprot.org/), NCBI nr 또는 nt 데이터베이스 (https://www.ncbi.nlm.nih.gov/) 등에서 수득될 수 있다. PATRIC (https://www.patricbrc.org/)은 박테리아 병원체에서 검색을 지원하는 상이한 유형의 데이터 및 소프트웨어 도구의 통합본이다.
이 실시예는 SEQ ID NO 01을 코딩하는 전체 길이 유전자에 대해 적어도 80% 서열 동일성을 갖는 단백질 서열을 코딩하는 유전자를 추출하는 방법을 기술한다. SEQ ID NO 01을 갖는 막 단백질은 글로벌 패밀리 PGF_00466006에 속한다. 이러한 패밀리의 구성원은 PATRIC 명령행 인터페이스 (https://docs.patricbrc.org/cli_tutorial/index.html)를 사용해 추출되었다. 아미노산 서열은 디폴트 매개변수의 EMBOSS Needle을 사용해 계산하여 SEQ ID NO 01에 대해 >80% 전체 서열 동일성으로 필터링되었다. 7002의 고유 서열을 나타내는 70477 식별자는 2020년 11월 25일에 추출되었다. 디폴트 매개변수 및 문의로서 SEQ ID NO 01을 사용한 Blastp를 사용하여서 Uniprot (2020년 12월 2일 데이터베이스 배포 데이타)로부터 서열을 추출하였다. 아미노산 서열은 디폴트 매개변수의 EMBOSS Needle을 사용해 계산하여 SEQ ID NO 01에 대해 > 80% 전체 서열 동일성으로 여과되었고 1471 식별자가 생성되었다. 이들 식별자 중에서, 첨부된 서열 목록에 열거된, SEQ ID NO 53, 54, 55, 56, 57, 58, 59, 60, 63, 64, 65, 66, 67 및 68을 갖는 막 단백질을 확인할 수 있었다.
실시예 4. 재료 및 방법 에스케리치아 콜라이
배지
LB (Luria Broth) 배지는 1% 트립톤 펩톤 (Difco, Erembodegem, Belgium), 0.5% 효모 추출물 (Difco) 및 0.5% 소듐 클로라이드 (VWR. Leuven, Belgium)로 이루어졌다. 96-웰 플레이트 또는 진탕 플라스크의 배양 실험에서 사용되는 최소 배지는 2.00 g/L NH4Cl, 5.00 g/L (NH4)2SO4, 2.993 g/L KH2PO4, 7.315 g/L K2HPO4, 8.372 g/L MOPS, 0.5 g/L NaCl, 0.5 g/L MgSO4.7H2O, 30 g/L 수크로스 또는 실시예에 명시될 경우 다른 탄소 공급원, 1 ml/L 비타민 용액, 100 μL/L 몰리브데이트 용액, 및 1 mL/L 셀레늄 용액을 함유하였다. 각 실시예에 명시된 바와 같이, 20 g/L 락토스는 전구체로서 배지에 추가로 첨가되었다. 최소 배지는 1 M KOH을 사용해 7의 pH로 설정되었다. 비타민 용액은 3.6 g/L FeCl2.4H2O, 5 g/L CaCl2.2H2O, 1.3 g/L MnCl2.2H2O, 0.38 g/L CuCl2.2H2O, 0.5 g/L CoCl2.6H2O, 0.94 g/L ZnCl2, 0.0311 g/L H3BO4, 0.4 g/L Na2EDTA.2H2O 및 1.01 g/L 티아민.HCl로 이루어졌다. 몰리브데이트 용액은 0.967 g/L NaMoO4.2H2O를 함유하였다. 셀레늄 용액은 42 g/L Seo2를 함유하였다.
발효배양을 위한 최소 배지는 6.75 g/L NH4Cl, 1.25 g/L (NH4)2SO4, 2.93 g/L KH2PO4 및 7.31 g/L KH2PO4, 0.5 g/L NaCl, 0.5 g/L MgSO4.7H2O, 30 g/L 수크로스, 1 mL/L 비타민 용액, 100 μL/L 몰리브데이트 용액, 및 상기 기술된 동일한 조성의 1 mL/L 셀레늄 용액을 함유하였다. 각 실시예에 명시된 바와 같이, 100 g/L 락토스는 전구체로서 배지에 추가로 첨가되었다.
복합 배지는 오토클레이빙 (121℃, 21')으로 최소 배지는 여과 (0.22 μm Sartorius)를 통해 멸균되었다. 필요할 때, 배지는 항생제 (예를 들어, 클로람페니콜 (20 mg/L), 카르베니실린 (100 mg/L), 스펙티노마이신 (40 mg/L) 및/또는 카나마이신 (50 mg/L))를 첨가하여 선택적으로 만들었다.
플라스미드
pKD46 (Red 헬퍼 플라스미드, 암피실린 내성), pKD3 (FRT-측접 클로람페니콜 내성 (cat) 유전자 함유), pKD4 (FRT-측접 카나마이신 내성 (kan) 유전자 함유), 및 pCP20 (FLP 리콤비나제 활성 발현) 플라스미드는 Prof. R. Cunin (Vrije Universiteit Brussel, Belgium in 2007)로부터 입수하였다. 플라스미드는 Invitrogen에서 구매한 숙주 이.콜라이 DH5알파 (F-, phi80dlacZ델타M15,델타 (lacZYAargF) U169, deoR, recA1, endA1, hsdR17(rk-, mk+), phoA, supE44, lambda-, thi-1, gyrA96, relA1)에서 유지시켰다.
균주 및 돌연변이
에스케리치아 콜라이 K12 MG1655 [람다-, F-, rph-1]는 콜라이 유전자 자원 센터 (Coli Genetic Stock Center) (US)에서 2007년 3월에, CGSC 균주#: 7740를 입수하였다. 유전자 파괴를 비롯한 유전자 도입은 Datsenko and Wanner (PNAS 97 (2000), 6640- 6645)가 공개한 기술을 사용해 수행되었다. 이러한 기술은 람다 Red 리콤비나제를 통해 수행되는 상동성 재조합 이후 항생제 선택을 기반으로 한다. 필리파제 리콤비나제의 후속 촉매는 최종 생산 균주에서 항생제 선택 카세트의 제거를 보장한다.
Red 헬퍼 플라스미드 pKD46을 보유하는 형질전환체는 암피실린 (100 mg/L) 및 L-아라비노스 (10 mM) 존재의 10 mL LB 배지에 30℃에서 0.6의 OD600nm 까지 성장되었다. 세포는 50 mL의 빙냉수로 1회 세척하고, 1 ml 빙내수로 2회 세척하여 전기적격하게 만들었다. 다음으로, 세포는 50 μL의 빙냉수에 재현탁되었다. 전기 천공은 50 μL의 세포 및 10-100 ng의 선형 이중 가닥-DNA 생산물과 유전자 Pulser™ (BioRad) (600 Ω, 25 μFD, 및 250 볼트)를 사용하여 수행되었다. 전기천공 후에, 세포는 1시간 동안 37℃에서 인큐베이션된 1 mL LB에 첨가되었고, 최종적으로 25 mg/L의 클로람페니콜 또는 50 mg/L의 카나마이신을 함유하는 LB-한천 상에 도말되어서 항생제 내성 형질전환체를 선택하였다. 선택된 돌연변이체는 변형된 영역의 상류 및 하류의 프라이머를 사용하는 PCR을 통해 검증되었고 헬퍼 플라스미드의 상실에 대해 42℃에 LB-한천에서 성장시켰다. 돌연변이체는 암피실린 민감도에 대해 시험되었다. 선형 ds-DNA 앰플리콘은 pKD3, pKD4 및 그들 유도체를 주형으로서 사용하는 PCR을 통해 수득되었다. 사용된 플라스미드는 주형에 상보적인 서열의 일부 및 재조합이 일어나야만 하는 염색체 DNA 상의 면에 상보적인 다른 일부를 가졌다. 게놈 녹-아웃 경우, 상동성의 영역은 관심 유전자의 출발 및 중지 코돈의 상류 50-nt 및 하류 50-nt에 디자인하였다. 게놈 녹-인 경우, 전사 출발 지점 (+1)을 준수해야 한다. PCR 생산물은 PCR-정제되었고, Dpnl로 분해되고, 아가로스 겔로부터 재정제되어서 용리 완충액 (5 mM Tris, pH 8.0)에 재현탁된다. 선택된 돌연변이체 (클로람페니콜 또는 카나마이신 내성)는 온도-민감성 복제 및 FLP 합성의 열적 유도를 보이는 암피실린 및 클로람페니콜 내성 플라스미드인 pCP20 플라스미드로 형질전환되었다. 암피실린-내성 형질전환체는 30℃에서 선택되었고, 이후에 42℃에 LB에서 소수가 콜로니 정제된 다음에, 모든 항생제 내성 및 FLP 헬퍼 플라스미드의 상실에 대해 시험되었다. 유전자 녹아웃 및 녹-인은 대조군 프라이머를 사용해 검토되었다.
락토-N-트리오스 (LN3, LNT-II, GlcNAc-b1,3-Gal-b1,4-Glc) 및 락토-N-테트라오스 (LNT) 및 락토-N-네오테트라오스 (LNnT)를 포함하는 이에서 기원된 올리고당을 생산하기 위해서, 돌연변이체 균주는 이.콜라이 K12 MG1655로부터 유래되었고, 이.콜라이 LacZnagB 유전자의 녹-아웃 및 SEQ ID NO 22를 갖는 엔. 메닌지티디스 유래 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 (LgtA)에 대한 항상성 전사 유닛의 게놈 녹-인으로 변형되었다. LNT 또는 LNnT 생산을 위해서, 돌연변이체 균주는 게놈 녹-인을 통해서 또는 발현 플라스미드로부터 균주에 전달될 수 있는 각각 SEQ ID NO 23을 갖는 이.콜라이 O55:H7 유래 N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제 (WbgO) 또는 SEQ ID NO 24를 갖는 엔. 메닌지티디스 유래 N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제 (LgtB)에 대한 항상성 전사 유닛에 의해 추가로 변형된다. 임의로, LgtA, wbgO 및/또는 LgtB 유전자의 다수 카피가 돌연변이체 이.콜라이 균주에 첨가될 수 있다. 이들 균주에서, LNT 및/또는 LNnT 생산은 SEQ ID NO 25를 갖는 이. 콜라이 유래 돌연변이체 L-글루타민-D-프룩토스-6-포스페이트 아미노트랜스퍼라제 glmS*54 (야생형 glmS와 A39T, R250C 및 G472S 돌연변이가 상이)에 대한 항상성 전사 유닛의 하나 이상의 게놈 녹-인에 의한 균주의 변형을 통해서 개선된 UDP-GlcNAc 생산을 통해 증강될 수 있다. 또한, 균주는 임의로 이.콜라이 ushAgalT 유전자의 게놈 녹아웃에 의해 증강된 UDP-갈락토스 생산을 위해 변형될 수 있다. 돌연변이체 이.콜라이 균주는 또한 임의로 SEQ ID NO 26을 갖는 이. 콜라이 유래 UDP-글루코스-4-에피머라제 (galE), SEQ ID NO 27을 갖는 이. 콜라이 유래 포스포글루코사민 뮤타제 (glmM) 및 SEQ ID NO 28을 갖는 이. 콜라이 유래 N-아세틸글루코사민-1-포스페이트 우리딜트랜스퍼라제/글루코사민-1-포스페이트 아세틸트랜스퍼라제 (glmU) 에 대한 항상성 전사 유닛의 게놈 녹-인으로 적합화되었다.
코어 삼당류로서 LN3을 갖는 푸코실화 올리고당의 생산을 위해서, 이.콜라이 균주는 이.콜라이 wcaJthyA 유전자의 녹아웃 및 SEQ ID NO 29를 갖는 에이치. 파일로리 (H. pylori) 알파-1,2-푸코실트랜스퍼라제 (HpFutC) 및/또는 SEQ ID NO 30을 갖는 에이치. 파일로리 알파-1,3-푸코실트랜스퍼라제 (HpFucT)에 대한 항상성 전사 유닛을 포함하는 발현 플라스미드 및 선택 마커로서 SEQ ID NO 31을 갖는 이.콜라이 thyA에 대한 항상성 전사 유닛에 의해 추가로 변형되었다. 푸코실트랜스퍼라제 유전자의 항상성 전사 유닛은 게놈 녹-인을 통해서 돌연변이체 이.콜라이 균주에 존재할 수 있다. GDP-푸코스 생산은 WO2016075243 및 WO2012007481에 기술된 바와 같이 glgC, agp, pfkA, pfkB, pgi, arcA, iclR, pgilon 을 포함하는 이. 콜라이 유전자의 게놈 녹아웃을 통해 추가로 최적화될 수 있다. GDP-푸코스 생산은 SEQ ID NO 32를 갖는 이.콜라이 manA, SEQ ID NO 33을 갖는 manB, SEQ ID NO 34를 갖는 manC, SEQ ID NO 35를 갖는 gmd 및 SEQ ID NO 36을 갖는 fcl에 대한 항상성 전사 유닛의 게놈 녹-인을 포함하여 추가적으로 최적화될 수 있다. GDP-푸코스 생산은 또한 이.콜라이 fucKfucI 유전자의 게놈 녹아웃 및 SEQ ID NO 37을 갖는 이. 콜라이 유래 푸코스 퍼미아제 (fucP) 및 SEQ NO ID 38을 갖는 박테로이데스 프라질리스 (Bacteroides fragilis) 유래 이기능성 푸코스 키나제/푸코스-1-포스페이트 구아닐릴트랜스퍼라제 (fkp)를 함유하는 항상성 전사 유닛의 게놈 녹-인에 의해 수득될 수 있다.
코어 삼당류로서 LN3을 갖는 시알릴화 올리고당의 생산을 위해서, 이.콜라이 균주는 이.콜라이 nagA 유전자의 녹아웃 및 SEQ ID NO 39를 갖는 사카로마이세스 세레비지아에 유래 글루코사민 6-포스페이트 N-아세틸트랜스퍼라제 (GNA1), SEQ ID NO 40을 갖는 박테로이데스 오바투스 (Bacteroides ovatus) 유래 N-아세틸글루코사민 2-에피머라제 (AGE), SEQ ID NO 41을 갖는 네이세리아 메닌지티디스 (Neisseria meningitidis) 유래 N-아세틸뉴라미네이트 (Neu5Ac) 신타제 (NeuB), SEQ ID NO 42를 갖는 파스퇴렐라 멀토시다 (Pasteurella multocida) 유래 N-아실뉴라미네이트 시티딜릴트랜스퍼라제 (NeuA), 및 피. 멀토시다 유래 SEQ ID NO 43 (PmultST3) 및/또는 엔. 메닌지티디스 유래 SEQ ID NO 44 (NmeniST3)를 포함하는 베타-갈락토시드 알파-2,3-시알릴트랜스퍼라제, 및/또는 포토박테리움 담셀라에 (Photobacterium damselae) 유래 SEQ ID NO 45 (PdST6) 및/또는 포토박테리움 (Photobacterium) sp. JT-ISH-224 유래 SEQ ID NO 46 (P-JT-ISH-224-ST6)를 포함하는 베타-갈락토시드 알파-2,6-시알릴트랜스퍼라제를 함유하는 항상성 전사 유닛의 게놈 녹-인에 의해서 추가로 변형되었다. PmNeuA 및 시알릴트랜스퍼라제의 항상성 전사 유닛은 게놈 녹-인을 통해서 또는 발현 플라스미드를 통해서 돌연변이체 균주에게 전달될 수 있다. 시알산 생산은 WO18122225에 기술된 바와 같이 nagC, nagD, nagE, nanA, nanE, nanK, manX, manYmanZ 를 포함하는 이. 콜라이 유전자의 게놈 녹-아웃 및 SEQ ID NO 25를 갖는 이. 콜라이 유래 L-글루타민―D-프룩토스-6-포스페이트 아미노트랜스퍼라제 (glmS*54)의 돌연변이된 변이체 (야생형 이.콜라이 glmS와 A39T, R250C 및 G472S 돌연변이가 상이) 및 SEQ ID NO 47을 갖는 이. 콜라이 유래 포스파타제 yqaB를 포함하는 항상성 전사 유닛의 게놈 녹-인을 갖는 돌연변이체 이. 콜라이 균주에서 추가로 최적화될 수 있다. 시알산 생산은 또한 이.콜라이 nagAnagB 유전자의 녹아웃 및 SEQ ID NO 27을 갖는 이. 콜라이 유래 포스포글루코사민 뮤타제 (glmM), SEQ ID NO 28을 갖는 이. 콜라이 유래 N-아세틸글루코사민-1-포스페이트 우리딜트랜스퍼라제/글루코사민-1-포스페이트 아세틸트랜스퍼라제 (glmU), SEQ ID NO 48을 갖는 캄필로박터 제주니 (Campylobacter jejuni) 유래 UDP-N-아세틸글루코사민 2-에피머라제 (NeuC) 및 SEQ ID NO 41을 갖는 엔. 메닌지티디스 유래 N-아세틸뉴라미네이트 신타제 (NeuB)를 함유하는 항상성 전사 유닛의 게놈 녹-인을 통해 수득될 수 있다. 이러한 돌연변이체 균주에서, 시알산 생산은 SEQ ID NO 25를 갖는 이. 콜라이 유래 돌연변이체 glmS*54 및 SEQ ID NO 47을 갖는 이. 콜라이 유래 포스파타제 yqaB를 포함하는 항상성 전사 유닛의 게놈 녹-인에 의해 추가로 최적화될 수 있다.
모든 돌연변이체 균주는 또한 임의로 SEQ ID NO 49을 갖는 이. 콜라이 W 유래 수크로스 수송체 (CscB) , SEQ ID NO 50을 갖는 지. 모빌리스 (Z. mobilis)로부터 기원하는 프룩토스 키나제 (Frk) 및 SEQ ID NO 51을 갖는 비. 아돌레센티스 (B. adolescentis)로부터 기원하는 수크로스 포스포릴라제를 함유하는 항상성 전사 유닛의 게놈 녹-인을 통해서 수크로스 상에서 성장을 위해 적합화될 수 있다. 더 나아가서, 돌연변이체 균주는 SEQ ID NO 52를 갖는 이. 콜라이 유래 락토스 퍼미아제 lacY에 대한 항상성 전사 유닛의 게놈 녹-인을 통해 증강된 락토스 흡수를 위해서 변형될 수 있다.
더 나아가서, 모든 돌연변이체 균주는 임의로 SEQ ID NO 24를 갖는 엔. 메닌지티디스 유래 lgtB 및 SEQ ID NO 26을 갖는 이. 콜라이 유래 UDP-글루코스 4-에프리머라제 (galE)에 대한 항상성 전사 유닛의 게놈 녹-인과 함께, lacZ, glkgalETKM 오페론의 게놈 녹-아웃에 의해 세포내 락토스 합성에 위해 적합화될 수 있다.
다음 단계에서, 표 2 및 3에 열거된 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 및 98을 갖는 막 단백질은 이.콜라이 K12 MG1655로부터 유래되는 상기 돌연변이체 균주에서 평가될 수 있다. 본 발명에 기술된 다른 단백질은 또한 표 2에 열거된다. 막 단백질 유전자는 pSC101 플라스미드 상에 존재하거나 또는 항상성 전사 유닛으로 숙주 게놈에 통합되어 평가될 수 있다.
반드시는 아니지만 바람직하게, 글리코실트랜스퍼라제는 그들 가용성을 증강시키기 위해 MBP-태그에 N-말단에서 융합되었다 (Fox et al., Protein Sci. 2001, 10(3), 622-630).
모든 항상성 프로모터, UTR 및 종결자 서열은 하기 문헌에 기술된 라이브러리로부터 기원되었다: Cambray et al. (Nucleic Acids Res. 2013, 41(9), 5139-5148), Chen et al. (Nat. Methods 2013, 10(7), 659-664), De Mey et al. (BMC Biotechnol. 2007, 4(34), 1-14), Dunn et al. (Nucleic Acids Res. 1980, 8(10), 2119-2132), Kim and Lee (FEBS Letters 1997, 407(3), 353-356) 및 Mutalik et al. (Nat. Methods 2013, No. 10, 354-360). 모든 유전자는 Twist Bioscience (twistbioscience.com) 또는 IDT (eu.idtdna.com)에서 합성으로 주문하였고 코돈 용법은 공급사의 도구를 사용해 적합화되었다.
모든 균주는 저온바이알 중에 -80℃에서 저장되었다 (밤샘 LB 배양을 1:1 비율로 70% 글리세롤과 혼합함).
배양 조건
96-웰 마이크로타이터 플레이트 실험의 전배양은 150 μL LB 중에, 저온바이알로부터 출발하여서 800 rpm의 회전 진탕기에서 밤새 37℃에서 인큐베이션되었다. 이 배양을 400x로 희석하여 400 μL 최소 배지가 있는, 96웰 사각 마이크로타이터 플레이트에 대한 접종원으로서 사용하였다. 이들 최종 96-웰 배양 플레이트는 72시간, 또는 더 짧거나 또는 더 긴 동안 800 rpm의 회전 진탕기에 37℃에서 인큐베이션되었다. 배양 실험의 종료 시에 당 농도를 측정하기 위해서 전체 액체배지 샘플은 세포를 스핀 다운 하기 전에 60℃에서 15분 동안 배양 액체배지를 끓여서 각 웰로부터 채취하였다 (= 세포내 및 세포외 당 농도의 평균). 또한, 배양의 희석을 수행하여 600 nm에서 광학 밀도를 측정하였다. 세포 성능 지수 또는 CPI는 달리 명시하지 않으면, 기준 균주와 비교하여 상대%로서, 생물량으로 전체 액체배지에서 측정된 코어 삼당류로서 LN3을 갖는 올리고당의 농도를 나누어서 결정되었다. 생물량은 600 nm에서 측정된 광학 밀도의 대략 1/3인 것으로 경험적으로 결정된다. 코어 삼당류로서 LN3을 갖는 올리고당의 이출 비율은 기준 균주와 비교하여 상대%로서, 전체 액채베지에서 측정된 코어 삼당류로서 LN3을 갖는 올리고당의 농도로 상청액에서 측정된 코어 삼당류로서 LN3을 갖는 올리고당의 농도를 나누어서 결정되었다.
생물반응기에 대한 전배양은 일정 균주의 전체 1 mL 저온바이알로부터 출발하여서 1 L 또는 2.5 L 진탕 플라스크의 250 mL 또는 500 mL 최소 배지에 접종하였고 200 rpm으로 회전 진탕기 상에서 24시간 동안 37℃에서 인큐베이션하였다. 5 L 생물반응기에 접종하였고 (2 L 뱃치 배지 중 250 mL 접종원); 과정은 MFCS 제어 소프트웨어 (Sartorius Stedim Biotech, Melsungen, Germany)를 통해 제어하였다. 배양 조건은 37℃, 및 최대 교반으로 설정하였고; 압력 가스 유속은 균주 및 생물반응기에 의존하여 달리하였다. pH는 0.5 M H2S04 및 20% NH4OH를 사용해 6.8로 제어되었다. 배기 가스는 냉각시켰다. 실리콘 소포제의 10% 용액이 발효배양 동안 기포가 생성될 때 첨가되었다.
광학 밀도
배양의 세포 밀도는 600 nm에서 광학 밀도를 측정하여 빈번하게 모니터링되었다 (Implen Nanophotometer NP80, Westburg, Belgium 또는 with a Spark 10M microplate reader, Tecan, Switzerland).
생산성
비생산성 Qp은 전형적으로 시간 단위 당 생물량의 질량 단위 당 생산물의 질량 단위 (= g 올리고당 / g 생물량 / h)로 표시되는, 생산물 (코어 삼당류로서 LN3을 갖는 올리고당)의 특별한 생산율이다. Qp 값은 각 단계의 종료 시에 형성된 생산물 및 생물량의 양 및 각 단계가 지속되는 시간 기간을 측정하여, 발효배양 작업의 각 단계, 즉 뱃치 및 유가식 단계에 대해 결정되었다.
비생산성 Qs은 전형적으로 시간 단위 당 생물량의 질량 단위 당 기질의 질량 단위 (= g 수크로스 / g 생물량 / h)로 표시되는, 기질, 예를 들어 수크로스의 특별한 소비율이다. Qs 값은 각 단계의 종료 시에 형성된 생물량 및 소비된 수크로스의 총량 및 각 단계가 지속된 시간 기간을 측정하여, 발효배양 작업의 각 단계, 즉 뱃치 및 유가식 단계에 대해 결정되었다.
수크로스에 대한 수율 Ys는 기질로부터 만든 생산물의 분획이고, 전형적으로 기질의 질량 단위 당 생산물의 질량 단위 (= g 올리고당 / g 수크로스)로 표시된다. Ys는 각 단계의 종료 시에 생산된 코어 삼당류로서 LN3을 갖는 올리고당의 총량 및 소비된 수크로스의 총량을 측정하여, 발효배양 작업의 각 단계, 즉 뱃치 및 유가 단계에 대해 결정되었다.
생물량에 대한 수율 Yx는 기질로부터 만들어진 생물량의 분획이고, 전형적으로 기질의 질량 단위 당 생물량의 질량 단위 (= g 생물량 / g 수크로스)로 표시된다. Yp는 각 단계의 종료 시에 생산된 생물량의 총량 및 소비된 수크로스의 총량을 측정하여, 발효배양 작업의 각 단계, 즉 뱃치 및 유가 단계에 대해 결정되었다.
비율은 전형적으로 발효배양 작업에서 생산물이 만들어지는 속도이고, 시간 단위 당 만들어진 생산물의 농도 (= g 올리고당 / L/ h)로서 표시된다. 비율은 유가 단계의 종료 시에 만들어진 코어 삼당류로서 LN3을 갖는 올리고당의 농도를 측정하고 총 발효배양 시간으로 이러한 농도를 나누어서 결정된다.
락토스 전환율은 락토스가 발효배양 작업에서 소비되는 속도이고, 전형적으로 시간 단위 당 락토스의 질량 단위 (= g 소비된 락토스 / h)로 표시된다. 락토스 전환율은 총 발효배양 시간으로 나눈, 발효배양 작업 동안 소비된 총 락토스의 측정으로 결정된다.
성장율/속도 측정
최대 성장률 (μMax)은 R 패키지 그로핏을 사용하여 600 nm에서 관찰된 광학 밀도를 기반으로 계산되었다.
분석적 분석
표준, 예컨대, 제한없이 수크로스, 락토스, 락토-N-트리오스 II (LN3), 락토-N-테트라오스 (LNT), 락토-N-네오-테트라오스 (LNnT), LNFP-I, LNFP-II, LNFP-III, LNFP-V, LNFP-VI, LSTa, LSTc 및 LSTd는 Carbosynth (UK), Elicityl (France) 및 IsoSep (Sweden)에서 구매하였다. 다른 화합물은 사내 제조 표준을 사용해 분석되었다.
중성 올리고당은 증발 광산란 검출기 (ELSD) 또는 굴절률 (RI) 검출이 구비된 Waters Acquity H-클래스 UPLC에서 분석되었다. 0.7 μL 샘플 부피는 Acquity UPLC BEH Amide VanGuard 컬럼 (130Å, 2.1 x 5 mm)이 구비된 Waters Acquity UPLC BEH 아미드 컬럼 (2.1 x 100 mm; 130Å; 1.7 μm) 컬럼 상에 주입되었다. 컬럼 온도는 50℃였다. 이동층은 0.2% 트리에틸아민이 첨가된 ¼ 물 및 ¾ 아세토니트릴 용액으로 이루어졌다. 방법은 0.130 mL/분의 유속과 등용매였다. ELS 검출기는 50℃의 드리프트 튜브 온도를 가졌고, N2 가스 압력은 50 psi 였고, 게인 200 및 데이터 속도 10 pps 였다. RI 검출기의 온도는 35℃로 설정되었다.
시알릴화 올리고당은 굴절률 (RI) 검출이 구비된 Waters Acquity H-클래스 UPLC에서 분석되었다. 0. 5 μL 샘플 부피가 Waters Acquity UPLC BEH 아미드 컬럼 (2.1 x 100 mm; 130Å; 1.7 μm)에 주입되었다. 컬럼 온도는 50℃였다. 이동층은 0.05% 피롤리딘이 첨가된 70% 아세토니트릴, 26% 암모늄 아세테이트 완충액 (150 mM) 및 4% 메탄올의 혼합물로 이루어졌다. 방법은 0.150 mL/분의 유속과 등용매였다. RI 검출기의 온도는 35℃로 설정되었다..
중성 및 시알릴화 당은 굴절률 (RI) 검출이 구비된 Waters Acquity H-클래스 UPLC에서 분석되었다. 0.5 μL 샘플의 부피를 Waters Acquity UPLC BEH 아미드 컬럼 (2.1 x 100 mm; 130Å; 1.7 μm)에 주입하였다. 컬럼 온도는 50℃였다. 이동층은 0.1% 트리에틸아민이 첨가된 72% 아세토니트릴 및 28% 암모늄 아세테이트 완충액 (100 mM)의 혼합물로 이루어졌다. 방법은 0.260 mL/분의 유속과 등용매였다. RI 검출기의 온도는 35℃로 설정되었다.
질량 분광계에서 분석을 위해서, 전자 분무 이온화 (ESI)가 구비된 Waters Xevo TQ-MS는 450℃의 탈용매화 온도, 650 L/h의 질소 탈용매화 가스 흐름 및 20 V의 콘 전압으로 사용되었다. MS는 모든 올리고당에 대해 음성 모드에서 선택된 이온 모니터링 (SIM)으로 작동되었다. 분리는 35℃의 Thermo Hypercarb 컬럼 (2.1 x 100 mm; 3 μm)이 구비된 Waters Acquity UPLC에서 수행되었다. 용리액 A는 0.1% 포름산 존재의 초순수이고 용리액 B는 0.1% 포름산 존재의 아세토니트릴인 구배가 사용되었다. 올리고당은 하기 구배를 사용하여 55분에 분리되었다: 21분 동안 2%에서 12%의 용리액 B의 초기 증가, 11분 동안 12%에서 40%의 용리액 B의 제2 증가, 및 5분 동안 40%에서 100%의 용리액 B의 제3 증가. 세척 단계로서 100% 의 용리액 B가 5분 동안 사용되었다. 컬럼 평형화를 위해서 2%의 용리액 B의 초기 조건이 1분 안에 복구되었고 12분 동안 유지되었다.
낮은 농도 (50 mg/L 미만)에서 중성 및 시알화 당은 펄스식 전류측정 검출 (PAD) 구비된 Dionex HPAEC 시스템에서 분석되었다. 5 μL 부피의 샘플은 Dionex CarboPac PA200 guard 컬럼 4 x 50 mm가 구비된 Dionex CarboPac PA200 컬럼 4 x 250 mm에 주입되었다. 컬럼 온도는 30℃로 설정되었다. 용리액 A가 탈이온수이고, 용리액 B가 200 mM 소듐 히드록시드이고, 용리액 C가 500 mM 소듐 아세테이트인 구배가 사용되었다. 올리고당은 하기 구배를 사용하여 25%의 용리액 B의 일정 비율을 유지하면서 60분에 분리되었다: 75%의 용리액 A에서 10분 동안 유지되는 초기 등용매 단계, 8분 동안 0%에서 4%로 용리액 C의 초기 증가, 71%의 용리액 A 및 4%의 용리액 C에서 6분 동안 유지되는 제2 등용매 단계, 2.6분 동안 4%에서 12%로 용리액 C의 제2 증가, 63%의 용리액 A 및 12%의 용리액 C에서 3.4분 동안 유지되는 제3 등용매 단계 및 5분 동안 12%에서 48%로 용리액 C의 제3 증가. 세척 단계로서, 48%의 용리액 C가 3분 동안 사용되었다. 컬럼 평형화를 위해서, 75%의 용리액 A 및 0%의 용리액 C의 초기 조건은 1분 안에 복구되었고, 11분 동안 유지되었다. 적용되는 유속은 0.5 mL/분이었다.
데이터의 정규화
모든 유형의 배양 조건에 대해서, 돌연변이체 균주로부터 수득된 데이터는 돌연변이체 균주와 동일한 유전적 배경을 갖지만 막 단백질 발현 카세트가 결여된 기준 균주 (즉, 설정점)를 사용하여 동일한 배양 조건에서 수득된 데이터에 대해 정규화되었다. 따라서 모든 데이터 (표 4-11의 데이터 포함)는 설정점에 대한 상대%로서 제공된다.
실시예 5. 20 g/L 락토스가 보충된 최소 배지에서 성장 실험으로 72시간 배양된 이. 콜라이 숙주에서 LN3 생산에 대해 시험된 막 단백질
실험은 20 g/L 락토스가 보충된 최소 배지에서 성장하는 숙주 세포의 LN3 생산을 증강시키는 그들 능력에 대해서 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 또는 98을 갖는 막 단백질을 평가하기 위해 설정되었다. 후보 유전자는 LN3 생산 숙주에서 pSC101 플라스미드 상에 존재하였다. 성장 실험은 실시예 4에 제공되는 배양 조건에 따라서 수행되었다. LN3의 생산은 SEQ ID NO 22를 갖는 엔. 메닌지티디스 유래 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 (LgtA)를 발현하는 각각의 LN3 생산 숙주에서 평가되었다.
실시예 6. 20 g/L 락토스가 보충된 최소 배지에서 성장 실험으로 72시간 배양된 이. 콜라이 숙주에서 LN3 및 락토-N-테트라오스 (LNT) 생산을 증강시키는 것으로 확인된 막 단백질
실험은 20 g/L 락토스가 보충된 최소 배지에서 성장하는 숙주 세포의 LN3 ?? 락토-N-테트라오스 (LNT) 생산을 증강시키는 그들 능력에 대해서 SEQ ID NO 01, 03, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 및 21을 갖는 막 단백질을 평가하기 위해 설정되었다. 후보 유전자는 LNT 생산 숙주에서 pSC101 플라스미드 상에 존재하였다. 성장 실험은 실시예 4에 제공된 배양 조건에 따라서 수행되었다.
표 4는 막 단백질이 발현되지 않는 기준 균주와 비교하여 막 단백질을 발현하는 상이한 균주에 대한 LN3 및 LNT의 전체 액체배지 측정을 표시한다. 표 4에 따라서, SEQ ID NO 01, 03, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 21을 갖는 막 단백질의 발현은 SEQ ID NO 22를 갖는 엔. 메닌지티디스 유래 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 (LgtA) 및 SEQ ID NO 23을 갖는 이.콜라이 O55:H7 유래 N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제 (WbgO)를 발현하는 LNT 생산 숙주에서 생산되는 LNT를 비롯해 LN3의 생산을 증강시켰다.
"SD"는 표준 편차 (시험된 동일 균주의 4 복제물)를 나타낸다. "기준 균주"는 표시된 막 단백질 (표시된 SEQ ID NO)이 기준 균주에서 발현되지 않는다는 것을 제외하고, 시험된 균주와 동일하다.
또한, 표 5는 본 실시예에 요약된 바와 같은 막 단백질을 발현하는 상이한 균주에 대한 세포 성능 지수 (CPI)는 상기 막 단백질이 발현되지 않는 기준 균주와 비교하여 더 높다는 것을 보여준다.
"SD"는 표준 편차 (시험된 동일 균주의 4 복제물)를 나타낸다. "기준 균주"는 표시된 막 단백질 (표시된 SEQ ID NO)이 기준 균주에서 발현되지 않는다는 것을 제외하고, 시험된 균주와 동일하다.
실시예 7. 20 g/L 락토스가 보충된 최소 배지에서 성장 실험으로 72시간 배양된 이. 콜라이 숙주에서 락토-N-테트라오스 (LNT) 생산을 증강시키는 것으로 확인된 막 단백질
실험은 20 g/L 락토스가 보충된 최소 배지에서 성장하는 숙주 세포의 락토-N-테트라오스 (LNT) 생산을 증강시키는 그들 능력에 대해서 SEQ ID NO 02, 04, 05, 66, 67 및 68을 갖는 막 단백질을 평가하기 위해 설정되었다. 후보 유전자는 LNT 생산 숙주에서 pSC101 플라스미드 상에 존재하였다. 성장 실험은 실시예 4에 제공된 배양 조건에 따라서 수행되었다. 따라서, 본 실시예에서 균주는 평가되는 막 단백질을 제외하고 실시예 6과 동일하다.
상기 기술된 이들 6개의 상이한 막 단백질로부터의 실험 데이터는 표 6에 표시된다.
모든 6 균주는 배양 배지가 탄소 공급원으로서 수크로스 및 전구체로서 락토스를 함유하는, 실시예 4에 제공되는 배양 조건에 따라서 성장 실험에서 평가될 때 전체 액체배지 샘플 중에서 기준 균주 (발현되는 막 단백질없음)와 비교하여 더 많은 LNT를 생산할 수 있고 더 높은 세포 성능 지수 (CPI)를 보인다. 또한, 이들 균주는 실시예 6에서 사용되는 균주와 대조적으로 LN3의 더 높은 생산 (전체 액체배지에서 측정된, 기준 균주와 비교된 LN3 생산%)을 보이지 않았다. 따라서 실시예 7에 제시되는 균주는 LN3의 분획은 가능한 낮게 유지되어야 하는, LNT의 생산에 특히 유리한데 반해서, 실시예 6의 균주는 LN3 및 LNT의 혼합물을 목적으로 하거나 또는 생산된 올리고당 분획 중 LN3의 상대량이 중요하지 않은 경우에 유용하다.
이 스크리닝에서 사용되는 LNT 생산 숙주는 SEQ ID NO 22를 갖는 엔. 메닌지티디스 유래 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 (LgtA) 및 SEQ ID NO 23을 갖는 엔. 메닌지티디스 유래 N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제 (wbgO)를 발현하였다.
"SD"는 표준 편차 (시험된 동일 균주의 4 복제물)를 나타낸다. "기준 균주"는 표시된 막 단백질 (표시된 SEQ ID NO)이 기준 균주에서 발현되지 않는다는 것을 제외하고, 시험된 균주와 동일하다.
실시예 8. 20 g/L 락토스가 보충된 최소 배지에서 성장 실험으로 72시간 배양된 이. 콜라이 숙주에서 락토-N-네오테트라오스 (LNnT) 생산을 증강시키는 것으로 확인된 막 단백질
실험은 20 g/L 락토스가 보충된 최소 배지에서 성장하는 숙주 세포의 LN3 및/또는 락토-N-네오테트라오스 (LNnT) 생산을 증강시키는 그들 능력에 대해서 SEQ ID NO 01, 02, 03, 05, 66 및 68을 갖는 막 단백질을 평가하기 위해서 설정되었다. 후보 유전자는 LNnT 생산 숙주에서 pSC101 플라스미드 상에 존재한다. 성장 실험은 실시예 4에 제공되는 배양 조건에 따라 수행되었다.
상기 기술된 이들 6개 상이한 막 단백질로부터의 실험 데이터는 표 7에 표시된다.
모든 6 균주는 배양 배지가 탄소 공급원으로서 수크로스 및 전구체로서 락토스를 함유하는, 실시예 4에 제공된 배양 조건에 따라서 성장 실험에서 평가될 때 전체 액체배지 샘플 중에서 기준 균주 (발현되는 막 단백질 없음)와 비교하여 더 많은 LNnT를 생산할 수 있다. 이러한 스크리닝에 사용되는 LNnT 생산 숙주는 SEQ ID NO 22를 갖는 엔. 메닌지티디스 유래 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 (LgtA) 및 SEQ ID NO 24를 갖는 엔. 메닌지티디스 유래 N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제 (LgtB)를 발현하였다.
"SD"는 표준 편차 (시험된 동일 균주의 4 복제물)를 나타낸다. "기준 균주"는 표시된 막 단백질 (표시된 SEQ ID NO)이 기준 균주에서 발현되지 않는다는 것을 제외하고, 시험된 균주와 동일하다.
실시예 9. 5 L 발효배양 작업으로 이. 콜라이 LN3 생산 숙주에서 막 단백질의 평가
실시예 4에 기술된 LN3 생산 숙주는 pSC101 플라스미드로부터 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 또는 98을 갖는 막 단백질을 발현하도록 변형되었다. 변형된 균주는 생물반응기 설정 (5 L 발효기)에서 그들 생산성에 대해 평가되었다. 발효배양 작업은 실시예 4에 제공되는 조건에 따라서 수행되었다. 또한, LN3 생산 숙주와 동일하지만 막 단백질 유전자가 결여된 기준 균주는 동일한 발효배양 설정에서 분석되었다. 발효배양의 종료 시에, 상청액 및 전체 액체배지 샘플에서 측정된 적정가는 막 단백질 유전자를 발현하는 균주에 대해서 80 g/L와 125 g/L 사이로 다양하다. 기준 균주는 상청액 및 전체 액체배지에서 측정된 45 g/L와 65 g/L 사이의 LN3 적정가에 도달하고, 이것은 5 L 발효배양 작업에서 LN3 생산에 대한 SEQ ID 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 및 98을 갖는 막 단백질의 긍정적 효과를 보여준다.
실시예 10. 5 L 발효배양 작업으로 이. 콜라이 LN3 생산 숙주에서 막 단백질의 평가
실시예 4에 기술된 LN3 생산 숙주는 pSC101 플라스미드로부터 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 또는 98을 갖는 막 단백질을 발현하도록 변형되었다. 변형된 균주는 생물반응기 설정 (5 L 발효기)으로 그들 생산성에 대해 평가되었다. 발효배양 작업은 실시예 4에 제공되는 조건에 따라 수행되었다. 또한, LN3 생산 숙주와 동일하지만 막 단백질 유전자가 결여된 기준 균주는 동일한 발효배양 설정에서 분석되었다. 발효배양의 종료 시에, 변형된 균주에서 LN3 생산은 기준 균주과 비교하여 125% 내지 250%였고, 5 L 발효배양 작업에서 LN3 생산에 대한 SEQ ID 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 및 98을 갖는 막 단백질의 긍정적 효과를 뒷받침한다.
실시예 11. 5 L 발효배양 작업으로 이. 콜라이 LNT 생산 숙주에서 막 단백질의 평가
실시예 4에 기술된 LNT 생산 숙주는 pSC101 플라스미드로부터 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65,66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 또는 98을 갖는 막 단백질을 발현하도록 변형되었다. 변형된 균주는 생물반응기 설정 (5 L 발효기)에서 그들 생산성에 대해 평가되었다. 발효배양 작업은 실시예 4에 제공되는 조건에 따라 수행되었다. 또한, LNT 생산 숙주와 동일하지만 막 단백질 유전자가 결여된 기준 균주는 동일한 발효배양 설정에서 분석되었다. 발효배양의 종료 시에, 상청액 및 전체 액체배지 샘플에서 측정된 적정가는 막 단백질 유전자를 발현하는 균주의 경우 90 g/L와 130 g/L 사이로 다양하다. 기준 균주는 상청액 및 전체 액체배지 샘플에서 측정된 50 g/L와 70 g/L 사이의 LNT 적정가에 도달하여서, 5 L 발효배양 작업으로 LNT 생산에 대한 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 및 98을 갖는 막 단백질의 긍정적 효과를 보여준다.
실시예 12. 5 L 발효배양 작업으로 이. 콜라이 LNT 생산 숙주에서 막 단백질의 평가 
실시예 4에 기술된 LNT 생산 숙주는 pSC101 플라스미드로부터 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65,66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 또는 98을 갖는 막 단백질을 발현하도록 변형되었다. 변형된 균주는 생물반응기 설정 (5 L 발효기)에서 그들 생산성에 대해 평가되었다. 발효배양 작업은 실시예 4에 제공되는 조건에 따라 수행되었다. 또한, LNT 생산 숙주와 동일하지만 막 단백질 유전자가 결여된 기준 균주는 동일한 발효배양 설정에서 분석되었다. 발효배양의 종료 시에, 변형된 균주에서 LNT 생산은 기준 균주와 비교하여 135% 내지 265%였고, 5 L 발효배양 작업으로 LNT 생산에 대한 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 및 98을 갖는 막 단백질의 긍정적 효과를 뒷받침한다.
실시예 13. 5 L 발효배양 작업으로 이. 콜라이 LNT 생산 숙주에서 막 단백질의 평가
실시예 4에 기술된 LNT 생산 숙주는 pSC101 플라스미드로부터 SEQ ID NO 01을 갖는 막 단백질을 발현하도록 변형되었다. 변형된 균주는 생물반응기 설정 (5 L 발효기)에서 그들 생산성에 대해 평가되었다. 발효배양 작업은 실시예 4에 제공되는 조건에 따라 수행되었다. 또한, LNT 생산 숙주와 동일하지만 막 단백질 유전자가 결여된 기준 균주는 동일한 발효배양 설정에서 분석되었다. 발효배양으로부터의 실험 데이터는 표 8 및 9에 표시된다.
발효배양의 종료 시에, 상청액 및 전체 액체배지 샘플에서 측정된 적정가는 기준 균주에서 평가된 것보다 더 높았다 (표 8). 기준 균주와 비교하여 LNT 생산의 증가가 전체 액체배지 경우에 비해서 상청액 경우에 더 높았으므로, LNT 분비가 기준 균주와 비교하여 증강되었다는 것을 추가로 관찰하였다. 또한, LNT의 생산율, 락토스 소비율 및 수크로스에 대한 LNT 수율은 기준 균주와 비교하여 더 높았다 (표 9). 전체적으로, 이들 데이터는 5 L 발효배양 작업에서 LNT 생산에 대해 SEQ ID NO 01을 갖는 막 단백질의 긍정적 효과를 보여준다. 
기준 균주"는 표시된 막 단백질 (표시된 SEQ ID NO)이 기준 균주에서 발현되지 않는다는 것을 제외하고, 시험된 균주와 동일하다.
기준 균주"는 표시된 막 단백질 (표시된 SEQ ID NO)이 기준 균주에서 발현되지 않는다는 것을 제외하고, 시험된 균주와 동일하다.
실시예 14. 5 L 발효배양 작업으로 이. 콜라이 LNnT 생산 숙주에서 막 단백질의 평가
실시예 4에 기술된 LNnT 생산 숙주는 pSC101 플라스미드로부터 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 또는 98을 갖는 막 단백질을 발현하도록 변형되었다. 변형된 균주는 생물반응기 설정 (5 L 발효기)에서 그들 생산성에 대해 평가되었다. 발효배양 작업은 실시예 4에 제공되는 조건에 따라 수행되었다. 또한, LNnT 생산 숙주와 동일하지만 막 단백질 유전자가 결여된 기준 균주는 동일한 발효배양 설정에서 분석되었다. 발효배양의 종료 시에, 상청액 및 전체 액체배지 샘플에서 측정된 적정가는 막 단백질 유전자를 발현하는 균주 경우에 70 g/L와 100 g/L 사이로 다양하다. 기준 균주는 상청액 및 전체 액체배지 샘플에서 측정된 40 g/L와 60 g/L 사이의 LNnT 적정가에 도달하여, 5 L 발효배양 작업으로 LNnT 생산에 대한 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 및 98을 갖는 막 단백질의 긍정적 효과를 보여준다. 
실시예 15. 5 L 발효배양 작업으로 이. 콜라이 LNnT 생산 숙주에서 막 단백질의 평가
실시예 4에 기술된 LNnT 생산 숙주는 pSC101 플라스미드로부터 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 또는 98을 갖는 막 단백질을 발현하도록 변형되었다. 변형된 균주는 생물반응기 설정 (5 L 발효기)에서 그들 생산성에 대해 평가되었다. 발효배양 작업은 실시예 4에 제공되는 조건에 따라 수행되었다. 또한, LNnT 생산 숙주와 동일하지만 막 단백질 유전자가 결여된 기준 균주는 동일한 발효배양 설정에서 분석되었다. 발효배양의 종료 시에, 변형된 균주에서 LNnT 생산은 기준 균주와 비교하여 120% 내지 245%여서, 5 L 발효배양 작업으로 LNnT 생산에 대한 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 및 98을 갖는 막 단백질의 긍정적 효과를 뒷받침한다.
실시예 16. 5 L 발효배양 작업으로 이. 콜라이 LNnT 생산 숙주에서 막 단백질의 평가
실시예 4에 기술된 LNnT 생산 숙주는 pSC101 플라스미드로부터 SEQ ID NO 02를 갖는 막 단백질을 발현하도록 변형되었다. 변형된 균주는 생물반응기 설정 (5 L 발효기)에서 이의 생산성에 대해 평가되었다. 발효배양 작업은 실시예 4에 제공되는 조건에 따라 수행되었다. 또한, LNnT 생산 숙주와 동일하지만 막 단백질 유전자가 결여된 기준 균주는 동일한 발효배양 설정에서 분석되었다. 발효배양으로부터의 실험 데이터는 표 10 및 11에 표시된다.
발효배양의 종료 시에, 상청액 및 전체 액체배지 샘플에서 측정된 적정가는 기준 균주에서 측정된 것보다 더 높았다 (표 10). 또한, 기준 균주와 비교하여 더 높은 세포 성능 지수 (CPI)가 수득된다. 기준 균주와 비교하여 LNnT 생산의 증가가 전체 액체배지 경우에 비해 상청액 경우에 더 높으므로, LNnT 분비가 기준 균주와 비교하여 증강되었다는 것을 추가로 관찰하였다. 또한, LNnT의 생산율, 락토스 소비율, 수크로스에 대한 LNnT 수율 및 LNnT의 비생산성은 기준 균주와 비교하여 더 높았다 (표 11). 전체적으로, 이들 데이터는 5 L 발효배양 작업에서 LNnT 생산에 대한 SEQ ID NO 02를 갖는 막 단백질의 긍정적 효과를 보여준다. 
"기준 균주"는 표시된 막 단백질 (표시된 SEQ ID NO)이 기준 균주에서 발현되지 않는다는 것을 제외하고, 시험된 균주와 동일하다.
"기준 균주"는 표시된 막 단백질 (표시된 SEQ ID NO)이 기준 균주에서 발현되지 않는다는 것을 제외하고, 시험된 균주와 동일하다.
실시예 17. 재료 및 방법 사카로마이세스 세레비지아에
배지
균주는 아미노산없는 6.7 g/L 효모 질소 베이스 (YNB w/o AA, Difco), 20 g/L 한천 (Difco) (고체 배양), 22 g/L 글루코스 일수화물 또는 20 g/L 락토스 및 0.79 g/L CSM 또는 0.77 g/L CSM-Ura, 0.77 g/L CSM-Trp, 또는 0.77 g/L CSM-His (MP Biomedicals)를 함유하는 CSM drop-out (SD CSM-Ura, SD CSM-Trp, SD CSM-His) 또는 완전 보충 혼합물 (SD CSM)을 갖는 합성 한정 효모 배지에서 성장되었다.
균주
Euroscarf 배양 컬렉션에서 입수가능한, Brachmann et al. (Yeast (1998) 14:115-32)이 만든, 에스. 세레비지아에 BY4742가 사용되었다. 모든 돌연변이체 균주는 Gietz (Yeast 11:355-360, 1995)의 방법을 사용하는 상동성 재조합 또는 플라스미드 형질전환을 통해서 생성되었다.
플라스미드
UDP-갈락토스를 생산하는 실시예에서, 효모 발현 플라스미드는 HIS3 선택 마커 및 UDP-글루코스-4-에피머라제 예컨대, 예를 들어 이.콜라이 유래 galE (UniProt ID P09147)에 대한 항상성 전사 유닛을 함유하는 pRS420-플라스미드 시리즈 (Christianson et al., 1992, Gene 110: 119-122)로부터 유래될 수 있다. 이러한 플라스미드는 LN3 (락토-N-트리오스, LNT-II)을 생산하도록 락토스 퍼미아제 예컨대, 예를 들어, 케이. 락티스 (K. lactis) 유래 LAC12 (UniProt ID P07921) 및 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 활성 예컨대, 예를 들어, 엔. 메닌지티디스 유래 lgtA (SEQ ID NO 22)에 대한 항상성 전사 유닛에 의해 추가로 변형될 수 있다. LN3-유래 올리고당 예컨대 LNT를 추가로 생산하기 위해서, 돌연변이체 LN3 생산 균주는 N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제 예컨대, 예를 들어 이.콜라이 O55:H7 유래 WbgO (SEQ ID NO 23)에 대한 항상성 전사 유닛에 의해 추가로 변형되었다.
LN3 유도된 올리고당 예컨대 락토-N-네오테트라오스 (LNnT, Gal-b1,4-GlcNAc-b1,3-Gal-b1,4-Glc)의 생산을 위한 실시예에서, 돌연변이체 LN3 생산 균주는 N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제 예컨대, 예를 들어 네이세리아 메닌지티디스 (Neisseria meningitidis) 유래 LgtB (SEQ ID NO 24)에 대한 항상성 전사 유닛에 의해 추가로 변형되었다.
GDP-푸코스를 생산하기 위한 실시예에서, 효모 발현 플라스미드 예컨대 p2a_2μ_Fuc (Chan 2013, 플라스미드 70, 2-17)는 에스. 세레비지아에에서 외래 유전자의 발현에 사용될 수 있다. 이러한 플라스미드는 이. 콜라이에서 선택 및 유지를 허용하도록 암피실린 내성 유전자 및 박테리아 복제 기원 및 효모에서 선택 및 유지를 위한 2μ 효모 ori 및 Ura3 선택 마커를 함유한다. 이러한 플라스미드는 락토스 퍼미아제 예컨대, 예를 들어, 케이. 락티스 유래 LAC12 (UniProt ID P07921), GDP-만노스 4,6-데히드라타제 예컨대, 예를 들어, 이.콜라이 유래 gmd(SEQ ID NO 35) 및 GDP-L-푸코스 신타제 예컨대, 예를 들어, 이.콜라이 유래 fcl (SEQ ID NO 36)에 대한 항상성 전사 유닛에 의해 추가로 변형된다. 효모 발현 플라스미드 p2a_2μ_Fuc2는 암피실린 내성 유전자, 박테리아 ori, 2μ 효모 ori 및 Ura3 선택 옆에, 락토스 퍼미아제 예컨대, 예를 들어, 케이. 락티스 유래 LAC12 (UniProt ID P07921), 푸코스 퍼미아제 예컨대, 예를 들어, 이.콜라이 유래 fucP (SEQ ID NO 37) 및 푸코스 키나제/푸코스-1-포스페이트 구아닐릴트랜스퍼라제 활성을 갖는 이기능성 효소 예컨대, 예를 들어, 박테로이데스 프라질리스 유래 fkp (SEQ ID NO 38)에 대한 항상성 전사 유닛을 포함하는 p2a_2μ_Fuc 플라스미드의 대안 발현 플라스미드로서 사용될 수 있다. 푸코실화 코어 삼당류로서 LN3을 갖는 올리고당을 추가로 생산하기 위해서, p2a_2μ_Fuc 및 이의 변이체 p2a_2μ_Fuc2는 추가적으로 SEQ ID NO 29를 갖는 에이치. 파일로리 알파-1,2-푸코실트랜스퍼라제 (HpFutC) 및/또는 SEQ ID NO 30을 갖는 에이치. 파일로리 알파-1,3-푸코실트랜스퍼라제 (HpFucT)에 대한 항상성 전사 유닛을 함유하였다.
시알산 및 CMP-시알산을 생산하기 위해서, 효모 발현 플라스미드는 TRP1 선택 마커 및 SEQ ID NO 25를 갖는 이. 콜라이 유래 돌연변이체 glmS*54, SEQ ID NO 47을 갖는 이. 콜라이 유래 포스파타제 yqaB, SEQ ID NO 40을 갖는 비. 오바투스 유래 N-아세틸글루코사민 2-에피머라제 (AGE), SEQ ID NO 41을 갖는 엔. 메닌지티디스 유래 N-아세틸뉴라미네이트 신타제 (NeuB) 및 SEQ ID NO 42를 갖는 피. 멀토시다 유래 N-아실뉴라미네이트 시티딜릴트랜스퍼라제 (NeuA)에 대한 항상성 전사 유닛을 함유하는 pRS420-플라스미드 시리즈 (Christianson et al., 1992, Gene 110: 119-122)로부터 유래되었다. 임의로, SEQ ID NO 39를 갖는 에스. 세레비지아에 유래 GNA1에 대한 항상성 전사 유닛이 역시 첨가되었다.
코어 삼당류로서 LN3을 갖는 시알릴화 올리고당의 생산을 위해서, 플라스미드는 케이. 락티스 유래 락토스 퍼미아제 (LAC12) (UniProt ID P07921), 및 피. 멀토시다 유래 SEQ ID NO 43 (PmultST3) 및/또는 엔. 메닌지티디스 유래 SEQ ID NO 44 (NmeniST3)를 포함하는 베타-갈락토시드 알파-2,3-시알릴트랜스퍼라제, 및/또는 포토박테리움 담셀라에 유래 SEQ ID NO 45 (PdST6) 및/또는 포토박테리움 sp. JT-ISH-224 유래 SEQ ID NO 46 (P-JT-ISH-224-ST6)를 포함하는 베타-갈락토시드 알파-2,6-시알릴트랜스퍼라제를 포함하는 하나 이상의 시알릴트랜스퍼라제(들)에 대한 항상성 전사 유닛을 더 포함하였다.
반드시는 아니지만 바람직하게, 뉴클레오티드-활성화된 당 합성에 관여되는 단백질 및/또는 글리코실트랜스퍼라제 중 어느 하나 이상은 그들 가용성을 증강시키기 위해서 SUMOstar 태그 (예를 들어, pYSUMOstar, Life Sensors, Malvern, PA에서 입수)에 N-말단 및/또는 C-말단에서 융합되었다.
임의로, 돌연변이체 효모 균주는 샤페론 단백질 예컨대, 예를 들어, Hsp31, Hsp32, Hsp33, Sno4, Kar2, Ssb1, Sse1, Sse2, Ssa1, Ssa2, Ssa3, Ssa4, Ssb2, Ecm10, Ssc1, Ssq1, Ssz1, Lhs1, Hsp82, Hsc82, Hsp78, Hsp104, Tcp1, Cct4, Cct8, Cct2, Cct3, Cct5, Cct6 또는 Cct7을 코딩하는 항상성 전사 유닛의 게놈 녹-인에 의해 변형되었다 (Gong et al., 2009, Mol. Syst. Biol. 5: 275). 플라스미드는 Invitrogen에서 구매한 숙주 이.콜라이 DH5알파 (F-, phi80dlacZ델타M15, 델타(lacZYA-argF)U169, deoR, recA1, endA1, hsdR17(rk-, mk+), phoA, supE44, 람다-, thi-1, gyrA96, relA1)에서 유지되었다.
다음 단계에서, 표 2 및 3에 열거된 바와 같은 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 및 98을 갖는 막 단백질은 상기 돌연변이체 균주에서 평가될 수 있다. 막 단백질 유전자는 p2a 2μ_Fuc 또는 p2a_2μ_Fuc2 또는 pRS420 (Christianson et al., 1992, Gene 110: 119-122; HIS3 선택 마커 가짐) 플라스미드에 존재하거나 또는 항상성 전사 유닛으로 숙주 게놈여 통합되어서 평가될 수 있다.
유전자는 Blazeck (Biotechnology and Bioengineering, Vol. 109, No. 11, 2012)가 기술한 바와 같이, 합성 항상성 프로모터를 사용해 발현되었다.
플라스미드 또는 게놈으로부터, 발현시키기 위해 필요한 유전자는 하기 회사 중 하나에서 합성적으로 합성되었다: DNA2.0, Gen9, IDT 또는 Twist Bioscience. 발현은 발현 숙주의 코돈 용법에 대해 코돈 용법을 최적화하여 추가로 촉진시킬 수 있었다. 유전자는 공급사의 도구를 사용해 최적화되었다.
배양 조건
일반적으로, 효모 균주는 단일 콜로니를 수득하기 위해 SD CSM 플레이트에서 초기에 성장되었다. 이들 플레이트는 2 내지 3일 동안 30℃에서 성장되었다. 단일 콜로니로부터 출발하여, 전배양은 밤새 5 mL로 30℃에서, 200 rpm으로 진탕하면서 성장되었다. 후속 125 mL 진탕 플라스크 실험은 25 mL 배지 중에 이 전배양의 2%가 접종되었다. 이들 진탕 플라스크는 200 rpm의 회전 진탕으로 30℃에서 인큐베이션되었다.
분석적 분석
실시예 4의 이 섹션을 참조한다.
실시예 18. 에스. 세레비지아에 숙주에서 LN3 생산에 대해 시험된 막 단백질
실험은 실시예 17에 기술된 바와 같이 20 g/L 락토스가 보충된 배지에서 성장하는 숙주 세포의 LN3 생산을 증강시키는 그들 능력에 대해 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 또는 98을 갖는 막 단백질을 평가하도록 설정되었다. 후보 유전자는 LN3 생산 숙주에서 pRS420 플라스미드에 존재하였다. 성장 실험은 실시예 17에 제공되는 배양 조건에 따라 수행되었다. LN3의 생산은 SEQ ID NO 22를 갖는 엔. 메닌지티디스 유래 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 (LgtA)를 발현하는 각각의 LN3 생산 숙주에서 평가되었다.
실시예 19. 에스. 세레비지아에 숙주에서 락토-N-테트라오스 (LNT) 생산에 대해 시험된 막 단백질
실험은 실시예 17에 기술된 바와 같이 20 g/L 락토스가 보충된 배지에서 성장하는 숙주 세포의 LN3 및/또는 락토-N-테트라오스 (LNT) 생산을 증강시키는 그들 증력에 대해 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 또는 98을 갖는 막 단백질을 평가하기 위해 설정되었다. 후보 유전자는 LNT 생산 숙주에서 pRS420 플라스미드에 존재하였다. 성장 실험은 실시예 17에 제공되는 배양 조건에 따라 수행되었다. LN3 및 LNT의 생산은 SEQ ID NO 22를 갖는 엔. 메닌지티디스 유래 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 (LgtA) 및 SEQ ID NO 23을 갖는 엔. 메닌지티디스 유래 N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제 (wbgO)를 발현하는 각각의 LNT 생산 숙주에서 평가되었다.
실시예 20. 에스. 세레비지아에 숙주에서 락토-N-네오테트라오스 (LNnT) 생산을 증강시키는 것으로 확인된 막 단백질
실험은 실시예 17에 기술된 바와 같이 20 g/L 락토스가 보충된 배지에서 성장하는 숙주 세포의 LN3 및/또는 락토-N-네오테트라오스 (LNnT) 생산을 증강시키는 그들 능력에 대해 SEQ ID NO SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 또는 98을 갖는 막 단백질을 평가하기 위해 설정되었다. 후보 유전자는 LNnT 생산 숙주에서 pRS420 플라스미드에 존재하였다. 성장 실험은 실시예 17에 제공되는 배양 조건에 따라 수행되었다. LN3 및 LNnT의 생산은 SEQ ID NO 22를 갖는 엔. 메닌지티디스 유래 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 (LgtA) 및 SEQ ID NO 24를 갖는 엔. 메닌지티디스 유래 N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제 (LgtB)를 발현하는 각각의 LNnT 생산 숙주에서 평가되었다.
실시예 21. 재료 및 방법 클라미도모나스 레인하르드티 (Chlamydomonas reinhardtii)
배지
씨. 레인하르드티 (C. reinhardtii) 세포는 Tris-아세테이트-포스페이트 (TAP) 배지 (pH 7.0)에서 배양되었다. TAP 배지는 1000x 스톡의 Hutner 미량 원소 믹스를 사용한다. Hutner 미량 원소 믹스는 50 g/L Na2EDTA.H2O (Titriplex III), 22 g/L ZnSO4.7H2O, 11.4 g/L H3BO3, 5 g/L MnCl2.4H2O, 5 g/L FeSO4.7H2O, 1.6 g/L CoCl2.6H2O, 1.6 g/L CuSO4.5H2O 및 1.1 g/L (NH4)6MoO3으로 이루어졌다.
TAP 배지는 2.42 g/L Tris (트리스(히드록시메틸)아미노메탄), 25 mg/L 염 스톡 용액, 0.108 g/L K2HPO4, 0.054 g/L KH2PO4 및 1.0 mL/L 빙초산을 함유하였다. 염 스톡 용액은 15 g/L NH4CL, 4 g/L MgSO4.7H2O 및 2 g/L CaCl2.2H2O로 이루어졌다. 단류 합성을 위한 전구체로서, 전구체 예컨대, 예를 들어, 락토스 (e.g. 20 g/L), 갈락토스, 글루코스, 프룩토스, 푸코스, GlcNAc가 첨가될 수 있었다. 배지는 오토클레이빙 (121℃, 21')으로 멸균되었다. 한천 상의 스톡 배양을 위해서, 1% 한천 (정제된 고강도, 1000 g/㎠)을 함유하는 슬랜트 TAP 배지를 사용하였다.
균주
씨. 레인하르드티 야생형 균주 21gr (CC-1690, 야생형, mt+), 6145C (CC-1691, 야생형, mt-), CC-125 (137c, 야생형, mt+), CC-124 (137c, 야생형, mt-)는 클라미도모나스 자원 센터 (Chlamydomonas Resource Center (https://www.chlamycollection.org), University of Minnesota, U.S.A.)에서 입수한 바와 같다.
플라스미드
발현 플라스미드는 클라미도모나스 자원 센터에서 입수한 대로, pSI103으로부터 기원한 것이다. 클로닝은 깁슨 조립, 골든 게이트 조립, 클리바 조립, LCR, 또는 제한 결찰을 사용해 수행되었다. (이종성) 유전자 발현에 적합한 프로모터는 예를 들어, Scranton et al. (Algal Res. 2016, 15: 135-142)에서 유래될 수 있다. 표적화된 유전자 변형 (예컨대 유전자 녹-아웃 또는 유전자 치환)은 예를 들어, Jiang et al. (Eukaryotic Cell 2014, 13(11): 1465-1469)이 기술한 바와 같이 Crispr-Cas 기술을 사용해 수행될 수 있다.
전기천공을 통한 형질전환은 Wang et al. (Biosci. Rep. 2019, 39: BSR2018210)에 기술된 대로 수행되었다. 세포는 세포 밀도가 1.0-2.0 Х 107 세포/mL에 도달할 때까지 8000 Lx의 빛 강도의 연속적인 빛 및 일정 통기 하에서 액체 TAP 배지 중에 성장되었다. 다음으로, 세포는 1.0 Х 106 세포/mL의 농도로 신선한 액체 TAP 배지에 접종되었고, 세포 밀도가 4.0 Х 106 세포/mL에 도달할 때까지 18-20시간 동안 연속적인 빛 아래서 성장되었다. 다음으로, 세포는 실온에서 5분 동안 1250 g의 원심분리를 통해 수집되었고, 세척하고, 60 mM 솔비톨 (Sigma, U.S.A.)을 함유하는 사전 냉각된 액체 TAP 배지에 재현탁시키고, 10분 동안 얼음에 두었다. 다음으로, 250 μL의 세포 현탁물 (5.0 Х 107 세포에 상응)은 100 ng 플라스미드 DNA (400 ng/mL)가 존재하는 사전 냉각된 0.4 cm 전기천공 큐벳에 넣었다. 전기 천공은 BTX ECM830 전기영동 장치 (1575 Ω, 50 μFD)를 사용하여 4 ms의 펄스 길이 및 100 ms의 펄스 간격 시간을 갖고 각각 500 V의 6회 펄스로 수행되었다. 전기천공 후에, 큐벳을 즉시 얼음에 10분 두었다. 마지막으로, 세포 현탁액은 서서히 진탕하면서 희미한 빛에서 밤샘 회수를 위해서 60 mM 솔비톨이 존재하는 10 mL의 신선한 액체 TAP 배지를 함유하는 50 mL 코니칼 원심분리 튜브로 옮겼다. 밤샘 회수 이후에, 세포를 재수집하였고 암피실린 (100 mg/L) 또는 클로람페니콜 (100 mg/L)를 함유하는 선택적 1.5% (w/v) 한천-TAP 플레이트 상에서 전분 포매 방법으로 도말하였다. 다음으로, 플레이트는 8000 Lx의 빛 강도로 연속 조사 하에 23 +-0.5℃에서 인큐베이션되었다. 세포는 5-7일 이후에 분석되었다.
UDP-갈락토스를 생산하기 위한 실시예에서, 씨. 레인하르드티 세포는 갈락토키나제 예컨대, 예를 들어, 아라비돕시스 탈리아나 (Arabidopsis thaliana) 유래의 것 (KIN, UniProt ID Q9SEE5) 및 UDP-당 파이로포스포릴라제 예컨대, 예를 들어, 에이. 탈리아나 유래 USP (UniProt ID Q9C5I1)를 코딩하는 유전자를 포함하는 전사 유닛에 의해 변형된다.
LN3을 생산하기 위한 실시예에서, 항상성 전사 유닛은 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 예컨대, 예를 들어, 엔. 메닌지티디스 유래 lgtA (SEQ ID NO 22)를 포함한다. LNT 생산에 대한 실시예에서, LN3 생산 균주는 N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제 예컨대, 예를 들어, 이.콜라이 O55:H7 유래 WbgO (SEQ ID NO 23)를 포함하는 항상성 전사 유닛에 의해 추가로 변형된다. LNnT 생산에 대한 실시예에서, LN3 생산 균주는 N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제 예컨대, 예를 들어, 엔. 메닌지티디스 유래 lgtB (SEQ ID NO 24)를 포함하는 항상성 전사 유닛에 의해 추가로 변형된다.
GDP-푸코스를 생산하기 위해서, 씨. 레인하르드티 세포는 GDP-푸코스 신타제 예컨대, 예를 들어, 아라비돕시스 탈리아나 유래의 것 (GER1, UniProt ID O49213)에 대한 전사 유닛에 의해 변형된다.
코어 삼당류로서 LN3을 갖는 푸코실화 올리고당을 추가로 생산하기 위해서, 씨. 레인하르드티 세포는 알파-1,2-푸코실트랜스퍼라제 예컨대, 예를 들어, 에이치. 파이로리 유래 HpFutC (SEQ ID NO 29) 및/또는 알파-1,3-푸코실트랜스퍼라제 예컨대, 예를 들어, 에이치. 파이로리 유래 HpFucT (SEQ ID NO 30)에 대한 항상성 전사 유닛을 포함하는 발현 플라스미드에 의해 변형될 수 있다.
다음 단계에서, 표 2 및 3에 열거된 바와 같은 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 및 98을 갖는 막 단백질은 상기 돌연변이체 균주에서 평가될 수 있다. 막 단백질 유전자는 항상성 전사 유닛으로 숙주의 게놈에 통합되거나 또는 적합한 발현 플라스미드에 존재하여 평가될 수 있다..
플라스미드로부터, 또는 게놈으로부터 발현이 필요한 유전자는 하기 회사 중 하나에서 합성적으로 합성되었다: DNA2.0, Gen9, Twist Biosciences 또는 IDT.
발현은 발현 숙주의 코돈 용법에 대해 코돈 용법을 최적화하여 추가로 촉진될 수 있었다. 유전자는 공급사의 도구를 사용해 최적화되었다.
배양 조건
씨. 레인하르드티의 세포는 8000 Lx의 빛 강도로 14/10시간 명암 주기 하에 23 +/- 0.5℃에서 선택적 TAP-한천 플레이트에서 배양되었다. 세포는 5 내지 7일 배양 후에 분석되었다.
고밀도 배양을 위해서, 세포는 밀폐 시스템 예컨대, 예를 들어, Chen et al. (Bioresour. Technol. 2011, 102: 71-81) 및 Johnson et al. (Biotechnol. Prog. 2018, 34: 811-827)에 기술된 바와 같이 수직 또는 수평 광생물반응기, 교반식 탱크 광생물반응기 또는 편평 패널 광생물반응기에서 배양될 수 있다.
분석적 분석
실시예 4의 이 섹션을 참조한다.
실시예 22. 씨. 레인하르드티 숙주에서 LN3 생산을 위해 시험된 막 단백질
실험은 20 g/L 락토스가 보충된 배지 (실시예 21 참조)에서 성장하는 숙주 세포의 LN3 생산을 증강시키는 그들 능력에 대해서 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 또는 98을 갖는 막 단백질을 평가하기 위해 설정되었다. 후보 유전자는 상기 막 단백질 유전자를 포함하는 항상성 전사 유닛의 게놈 녹-인을 통해서 LN3 생산 숙주에 존재하였다. 성장 실험은 실시예 21에 제공되는 배양 조건에 따라 수행되었다. LN3의 생산은 SEQ ID NO 22를 갖는 엔. 메닌지티디스 유래 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 (LgtA)를 발현하는 각각의 LN3 생산 숙주에서 평가되었다.
실시예 23. 씨. 레인하르디티 숙주에서 락토-N-테트라오스 (LNT) 생산에 대해 시험된 막 단백질
실험은 20 g/L 락토스가 보충된 배지 (실시예 21 참조)에서 성장하는 숙주 세포의 LN3 및/또는 락토-N-테트라오스 (LNT) 생산을 증강시키는 그들 능력에 대해 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 또는 98을 갖는 막 단백질을 평가하기 위해 설정되었다. 후보 유전자는 상기 막 단백질 유전자를 포함하는 항상성 전사 유닛의 게놈 녹-인에 의해 LNT 생산 숙주에 존재하였다. 성장 실험은 실시예 21에 제공되는 배양 조건에 따라 수행되었다. LN3 및 LNT의 생산은 SEQ ID NO 22를 갖는 엔. 메닌지티디스 유래 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 (LgtA) 및 SEQ ID NO 23를 갖는 엔. 메닌지티디스 유래 N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제 (wbgO)를 발현하는 각각의 LNT 생산 숙주에서 평가되었다.
실시예 24. 씨. 레인하르드티 숙주에서 락토-N-네오테트라오스 (LNnT) 생산을 증강시키는 것으로 확인된 막 단백질
실험은 20 g/L 락토스가 보충된 배지 (실시예 21 참조)에서 성장하는 숙주 세포의 LN3 및/또는 락토-N-네오테트라오스 (LNnT) 생산을 증강시키는 그들 능력에 대해서 SEQ ID NO SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 또는 98을 갖는 막 단백질을 평가하기 위해 설정되었다. 후보 유전자는 상기 막 단백질 유전자를 포함하는 항상성 전사 유닛의 게놈 녹-인에 의해서 LNnT 생산 숙주에 존재하였다. 성장 실험은 실시예 21에 제공되는 배양 조건에 따라 수행되었다. LN3 및 LNnT의 생산은 SEQ ID NO 22를 갖는 엔. 메닌지티디스 유래 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 (LgtA) 및 SEQ ID NO 24를 갖는 엔. 메닌지티디스 유래 N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제 (LgtB)를 발현하는 각각의 LNnT 생산 숙주에서 평가되었다.
실시예 25. 재료 및 방법 바실러스 서브틸리스
배지
2개 상이한 배지, 즉 풍부 LB (Luria Broth) 및 진탕 플라스크용 최소 배지가 사용된다. 최소 배지는 미량 원소 믹스를 사용한다.
미량 원소 믹스는 0.735 g/L CaCl2.2H2O, 0.1 g/L MnCl2.2H2O, 0.033 g/L CuCl2.2H2O, 0.06 g/L CoCl2.6H2O, 0.17 g/L ZnCl2, 0.0311 g/L H3BO4, 0.4 g/L Na2EDTA.2H2O 및 0.06 g/L Na2MoO4로 이루어졌다. Fe-시트레이트 용액은 0.135 g/L FeCl3.6H2O, 1 g/L Na-시트레이트 (Hoch 1973 PMC1212887)를 함유하였다.
LB 배지는 1% 트립톤 펩톤 (Difco, Erembodegem, Belgium), 0.5% 효모 추출물 (Difco) 및 0.5% 소듐 클로라이드 (VWR. Leuven, Belgium)로 이루어졌다. LBA (Luria Broth agar) 플레이트는 12 g/L 한천 (Difco, Erembodegem, Belgium)이 첨가된 LB 배지로 이루어졌다.
진탕 플라스크 (MMsf) 실험용 최소 배지는 2.00 g/L (NH4)2SO4, 7.5 g/L KH2PO4, 17.5 g/L K2HPO4, 1.25 g/L Na-시트레이트, 0.25 g/L MgSO4.7H2O, 0.05 g/L 트립토판, 10 내지 30 g/L 글루코스 또는 실시예에서 명시할 때 프룩토스, 말토스, 수크로스, 글리세롤 및 말토트리오스를 포함하지만, 이에 제한되지 않는 다른 탄소 공급원, 10 ml/L 미량 원소 믹스 및 10 ml/L Fe-시트레이트 용액을 함유하였다. 배지는 1 M KOH를 사용해 7의 pH로 설정되었다. 실험에 따라서, 락토스 (20 g/L)가 첨가되었다.
복합 배지, 예를 들어 LB는 오토클레이빙 (121℃, 21')으로 최소 배지는 여과 (0.22 μm Sartorius)로 멸균되었다. 필요한 경우, 배지는 항생제 (예를 들어, 제오신 (20 mg/L))를 첨가하여 선택적으로 만들었다.
균주
바실러스 서브틸리스 168은 바실러스 유전자 자원 센터 (Bacillus Genetic Stock Center) (Ohio, USA)에서 입수가능하다.
플라스미드
Popp et al. (Sci. Rep., 2017, 7, 15158)가 기술한 통합 벡터가 발현 벡터로서 사용되었고 필요하면 게놈 통합에 추가로 사용될 수 있었다. 발현에 적합한 프로모터는 part repository (iGem): 서열 id: Bba_K143012, Bba_K823000, Bba_K823002 또는 Bba_K823003로부터 유래될 수 있다. 클로닝은 깁슨 조립, 골든 게이트 조립, 클리바 조립, LCR, 또는 제한 결찰을 사용해 수행되었다. LN3을 생산하기 위한 실시예에서, 바실러스 서브틸리스 돌연변이체 균주는 락토스 임포터 (예컨대, SEQ ID NO 52를 갖는 이.콜라이 lacY)를 코딩하는 유전자를 함유하고 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 예컨대, 예를 들어, 엔. 메닌지티디스 유래 lgtA (SEQ ID NO 22)를 포함하는 항상성 전사 유닛을 더 포함하도록 생성된다. LNT 생산을 위한 실시예에서, LN3 생산 균주는 N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제 예컨대, 예를 들어, 이.콜라이 O55:H7 유래 WbgO (SEQ ID NO 23)를 포함하는 항상성 전사 유닛에 의해 추가로 변형된다. LNnT 생산을 위한 실시예에서, LN3 생산 균주는 N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제 예컨대, 예를 들어, 엔. 메닌지티디스 유래 lgtB (SEQ ID NO 24)를 포함하는 항상성 전사 유닛에 의해 추가로 변형된다. 코어 삼당류로서 LN3을 갖는 푸코실화 올리고당을 추가로 생산하기 위해, 비. 서브틸리스 세포는 알파-1,2-푸코실트랜스퍼라제 예컨대, 예를 들어, 에이치. 파일로리 유래 HpFutC (SEQ ID NO 29) 및/또는 알파-1,3-푸코실트랜스퍼라제 예컨대, 예를 들어, 에이치. 파일로리 유래 HpFucT (SEQ ID NO 30)에 대한 항상성 전사 유닛을 포함하는 발현 플라스미드에 의해 (또는 게놈 녹-인을 통해) 변형될 수 있다.
다음 단계에서, 표 2 및 3에 열거된 바와 같은 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 및 98을 갖는 막 단백질이 상기 돌연변이체 균주에서 평가될 수 있다. 막 단백질 유전자는 본 명세서에 기술된 바와 같은 적합한 발현 플라스미드에 존재하거나 또는 항상성 전사 유닛으로 숙주의 게놈에 통합되어 평가될 수 있다.
플라스미드로부터, 또는 게놈으로부터 발현이 필요한 유전자는 하기 회사 중 하나에서 합성적으로 합성되었다: DNA2.0, Gen9, Twist Biosciences 또는 IDT.
발현은 발현 숙주의 코돈 용법에 대해 코돈 용법을 최적화하여 추가로 촉진될 수 있었다. 유전자는 공급사의 도구를 사용해 최적화되었다.
배양 조건
96-웰 마이크로타이터 플레이트 실험의 전배양은 150 μL LB 중에서, 저온바이알 또는 LB 플레이트의 단일 콜로니로부터 출발하여서, 밤새 37℃에서, 800 rpm의 회전 진탕기에서 인큐베이션하였다. 이 배양은 400x로 희석하여, 400 μL MMsf의 96-웰 사각 마이크로타이터 플레이트에 대한 접종원으로서 사용되었다. 각각의 균주는 생물학적 복제물로서 96-웰 플레이트의 다수 웰에서 성장되었다. 이들 최종 96-웰 배양 플레이트는 72시간, 또는 더 짧거나 또는 더 긴 동안 800 rpm의 회전 진탕기에 37℃에서 인큐베이션되었다.
분석적 분석
실시예 4의 이 섹션을 참조한다.
실시예 26. 비. 서브틸리스 숙주에서 LN3 생산에 대해 시험된 막 단백질
실험은 20 g/L 락토스가 보충된 배지 (실시예 25 참조)에서 성장하는 숙주 세포의 LN3 생산을 증강시키는 그들 능력에 대해 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 또는 98을 갖는 막 단백질을 평가하기 위해 설정되었다. 후보 유전자는 상기 막 단백질 유전자를 포함하는 항상성 전사 유닛의 게놈 녹-인에 의해 LN3 생산 숙주에 존재하였다. 성장 실험은 실시예 25에 제공되는 배양 조건에 따라 수행되었다. LN3의 생산은 SEQ ID NO 22를 갖는 엔. 메닌지티디스 유래 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 (LgtA)를 발현하는 각각의 LN3 생산 숙주에서 평가되었다.
실시예 27. 비. 서브틸리스 숙주에서 락토-N-테트라오스 (LNT) 생산에 대해 시험된 막 단백질
실험은 20 g/L 락토스가 보충된 배지 (실시예 25 참조)에서 성장하는 숙주 세포의 LN3 및/또는 락토-N-테트라오스 (LNT) 생산을 증강시키는 그들 능력에 대해 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 또는 98을 갖는 막 단백질을 평가하기 위해 설정되었다. 후보 유전자는 상기 막 단백질 유전자를 포함하는 항상성 전사 유닛의 게놈 녹-인에 의해 LNT 생산 숙주에 존재하였다. 성장 실험은 실시예 25에 제공되는 배양 조건에 따라 수행되었다. LN3 및 LNT의 생산은 SEQ ID NO 22를 갖는 엔. 메닌지티디스 유래 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 (LgtA) 및 SEQ ID NO 23를 갖는 엔. 메닌지티디스 유래 N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제 (wbgO)를 발현하는 각각의 LNT 생산 숙주에서 평가되었다.
실시예 28. 비. 서브틸리스 숙주에서 락토-N-네오테트라오스 (LNnT) 생산 을 증강시키는 것으로 확인된 막 단백질
실험은 20 g/L 락토스가 보충된 배지 (실시예 25 참조)에서 성장하는 숙주 세포의 LN3 및/또는 락토-N-네오테트라오스 (LNnT) 생산을 증강시키는 그들 능력에 대해 SEQ ID NO SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 또는 98을 갖는 막 단백질을 평가하기 위해 설정되었다. 후보 유전자는 상기 막 단백질 유전자를 포함하는 항상성 전사 유닛의 게놈 녹-인에 의해 LNnT 생산 숙주에 존재하였다. 성장 실험은 실시예 25에 제공되는 배양 조건에 따라 수행되었다. LN3 및 LNnT의 생산은 SEQ ID NO 22를 갖는 엔. 메닌지티디스 유래 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 (LgtA) 및 SEQ ID NO 24를 갖는 엔. 메닌지티디스 유래 N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제 (LgtB)를 발현하는 각각의 LNnT 생산 숙주에서 평가되었다.
실시예 29. 재료 및 방법 코리네박테리움 글루타미쿰 (Corynebacterium glutamicum)
배지
2종의 상이한 배지, 즉 풍부 트립톤-효모 추출물 (TY) 배지 및 진탕 플라스크용 최소 배지 (MMsf)가 사용되었다. 최소 배지는 1000x 스톡 미량 원소 믹스를 사용한다.
미량 원소 믹스는 10 g/L CaCl2, 10 g/L FeSO4.7H2O, 10 g/L MnSO4.H2O, 1 g/L ZnSO4.7H2O, 0.2 g/L CuSO4, 0.02 g/L NiCl2.6H2O, 0.2 g/L 바이오틴 (pH 7.0) 및 0.03 g/L 프로토카테츄산로 이루어졌다.
진탕 플라스크 실험용 최소 배지 (MMsf)는 20 g/L (NH4)2SO4, 5 g/L 우레아, 1 g/L KH2PO4, 1 g/L K2HPO4, 0.25 g/L MgSO4.7H2O, 42 g/L MOPS, 10 내지 30 g/L 글루코스 또는 실시예에 명시될 때 프룩토스, 말토스, 수크로스, 글리세롤 및 말토트리오스를 포함하지만 이에 제한되지 않는 다른 탄소 공급원 및 1 ml/L 미량 원소 믹스를 함유하였다. 실험에 따라서, 락토스 (20 g/L)가 배지에 첨가되었다.
TY 배지는 1.6% 트립톤 (Difco, Erembodegem, Belgium), 1% 효모 추출물 (Difco) 및 0.5% 소듐 클로라이드 (VWR. Leuven, Belgium)로 이루어졌다. TY 한천 (TYA) 플레이트는 12 g/L 한천 (Difco, Erembodegem, Belgium)이 첨가된 TY 배지로 이루어졌다.
복합 배지, 예를 들어, TY는 오토클레이빙 (121℃, 21') 및 최소 배지는 여과 여과 (0.22 μm Sartorius)로 멸균되었다. 필요한 경우, 배지는 항생제 (예를 들어, 카나마이신, 암피실린)를 첨가하여 선택적으로 만들었다.
균주
코리네박테리움 글루타미쿰 ATCC 13032는 미국 생물자원 센터 (American Type Culture Collection)에서 입수가능하다.
플라스미드
Suzuki et al. (Appl. Microbiol. Biotechnol., 2005 Apr, 67(2):225-33)에 기술된 Cre/loxP 기술 기반 통합 플라스미드 벡터 및 Okibe et al. (Journal of Microbiological Methods 85, 2011, 155-163)가 기술한 온도-민감성 셔틀 벡터가 유전자 결실, 돌연변이 및 삽입을 위해 구축된다. (이종성) 유전자 발현에 적합한 프로모터는 Yim et al. (Biotechnol. Bioeng., 2013 Nov, 110(11):2959-69)로부터 유래될 수 있다. 클로닝은 깁슨 조립, 골든 게이트 조립, 클리바 조립, LCR, 또는 제한 결찰을 사용해 수행되었다.
LN3을 생산하기 위한 실시예에서, 씨. 글루타미쿰 (C. glutamicum) 돌연변이체 균주는 락토스 임포터 (예컨대, SEQ ID NO 52 유래 이.콜라이 lacY)를 코딩하는 유전자를 함유하고 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 예컨대, 예를 들어, 엔. 메닌지티디스 유래 lgtA (SEQ ID NO 22)를 포함하는 항상성 전사 유닛을 추가로 함유하도록 생성된다. LNT 생산을 위한 실시예에서, LN3 생산 균주는 N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제 예컨대, 예를 들어, 이.콜라이 O55:H7 유래 WbgO (SEQ ID NO 23)를 포함하는 항상성 전사 유닛에 의해 추가로 변형된다. LNnT 생산을 위한 실시예에서, LN3 생산 균주은 N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제 예컨대, 예를 들어, 엔. 메닌지티디스 유래 lgtB (SEQ ID NO 24)를 포함하는 항상성 전사 유닛에 의해 추가로 변형된다. 코어 삼당류로서 LN3을 갖는 푸코실화 올리고당을 추가로 생산하기 위해서, 씨. 글루타미쿰 세포는 알파-1,2-푸코실트랜스퍼라제 예컨대, 예를 들어, 에이치. 파일로리 유래 HpFutC (SEQ ID NO 29) 및/또는 알파-1,3-푸코실트랜스퍼라제 예컨대, 예를 들어, 에이치. 파일로리 유래 HpFucT (SEQ ID NO 30)에 대한 항상성 전사 유닛을 포함하는 발현 플라스미드에 의해 변형될 수 있다 (또는 게놈 녹-인에 의함).
다음 단계에서, 표 2 및 3에 열거된 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 및 98을 갖는 막 단백질이 상기 돌연변이체 균주에서 평가될 수 있다. 막 단백질 유전자는 본 명세서에 기술된 바와 같은 적합한 발현 플라스미드에 존재하거나 또는 항상성 전사 유닛으로 숙주 게놈에 통합되어 평가될 수 있다.
플라스미드로부터, 또는 게놈으로부터 발현이 필요한 유전자는 하기 회사 중 하나에서 합성적으로 합성되었다: DNA2.0, Gen9, Twist Biosciences 또는 IDT.
발현은 발현 숙주의 코돈 용법에 대해 코돈 용법을 최적화하여 추가로 촉진될 수 있었다. 유전자는 공급사의 도구를 사용해 최적화되었다.
배양 조건
96-웰 마이크로타이터 플레이트 실험의 전배양은 150 μL TY 중에, TY 플레이트의 단일 콜로니 또는 저온 바이알로부터 출발하였고, 800 rpm의 회전 진탕기에서 밤새 37℃에서 인큐베이션되었다. 이 배양은 400x로 희석하여, 400 μL MMsf 배지의 96-웰 사각 마이크로타이터 플레이트에 대한 접종원으로서 사용되었다. 각각의 균주는 생물학적 복제물로서 96-웰 플레이트의 다수 웰에서 성장되었다. 이들 최종 96-웰 배양 플레이트는 72시간, 또는 더 짧거나 또는 더 긴 동안 800 rpm의 회전 진탕기에 37℃에서 인큐베이션되었다.
분석적 분석
실시예 4의 이 섹션을 참조한다.
실시예 30. 씨. 글루타미쿰 숙주에서 LN3 생산에 대해 시험된 막 단백질
실험은 20 g/L 락토스가 보충된 배지 (실시예 29 참조)에서 성장하는 숙주 세포의 LN3 생산을 증강시키는 그들 능력에 대해 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 또는 98을 갖는 막 단백질을 평가하기 위해 설정되었다. 긱 균주는 실시예 29에 기술된 바와 같이 LN3의 생산을 위해 변형된다. 또한, 각각의 균주는 nagB, glmSgamA 유전자의 게놈 녹-아웃 및 이.콜라이 유래 락토스 퍼미아제 (LacY) (SEQ ID NO 52), 천연 프룩토스-6-P-아미노트랜스퍼라제 (UniProt ID Q8NND3), 이.콜라이 W 유래 수크로스 수송체 (CscB) (UniProt ID E0IXR1), 지. 모빌리스 유래 프룩토스 키나제 (Frk) (UniProt ID Q03417) 및 비. 아돌레센트 유래 수크로스 포스포릴라제 (BaSP) (UniProt ID A0ZZH6)를 코딩하는 유전자를 포함하는 항상성 전사 유닛의 게놈 녹-인에 의해 수크로스에서 성장된다. 후보 막 단백질 유전자는 상기 막 단백질 유전자를 포함하는 항상성 전사 유닛의 게놈 녹-인에 의해 LN3 생산 숙주에 존재하였다. 성장 실험은 실시예 29에 제공되는 배양 조건에 따라 수행되었다. LN3의 생산은 SEQ ID NO 22를 갖는 엔. 메닌지티디스 유래 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 (LgtA)를 발현하는 각각의 LN3 생산 숙주에서 평가되었다.
실시예 31. 씨. 글루타미쿰 숙주에서 락토-N-테트라오스 (LNT) 생산에 대해 시험된 막 단백질
실험은 20 g/L 락토스가 보충된 배지 (실시예 29 참조)에서 성장하는 숙주 세포의 LN3 및/또는 락토-N-테트라오스 (LNT) 생산을 증강시키는 그들 능력에 대해 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 또는 98을 갖는 막 단백질을 평가하기 위해 설정되었다. 각각의 균주는 실시예 29에 기술된 바와 같이 LNT의 생산을 위해 변형된다. 또한, 각각의 균주는 nagB, glmSgamA 유전자의 게놈 녹-아웃 및 이.콜라이 유래 락토스 퍼미아제 (LacY) (SEQ ID NO 52), 천연 프룩토스-6-P-아미노트랜스퍼라제 (UniProt ID Q8NND3), 이.콜라이 W 유래 수크로스 수송체 (CscB) (UniProt ID E0IXR1), 지. 모빌리스 유래 프룩토스 키나제 (Frk) (UniProt ID Q03417) 및 비. 아돌레센티스 유래 수크로스 포스포릴라제 (BaSP) (UniProt ID A0ZZH6)를 코딩하는 유전자를 포함하는 항상성 전사 유닛의 게놈 녹-인에 의해 수크로스에서 성장한다. 후보 유전자는 상기 막 단백질 유전자를 포함하는 항상성 전사 유닛의 게놈 녹-인에 의해 LNT 생산 숙주에 존재한다. 성장 실험은 실시예 29에 제공되는 배양 조건에 따라 수행되었다. LN3 및 LNT의 생산은 SEQ ID NO 22를 갖는 엔. 메닌지티디스 유래 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 (LgtA) 및SEQ ID NO 23을 갖는 엔. 메닌지티디스 유래 N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제 (wbgO)를 발현하는 각각의 LNT 생산 숙주에서 평가되었다.
실시예 32. 씨. 글루타미쿰 숙주에서 락토-N-네오테트라오스 (LNnT) 생산을 증강시키는 것으로 확인된 막 단백질
실험은 20 g/L 락토스가 보충된 배지 (실시예 29 참조)에서 성장하는 숙주 세포의 LN3 및/또는 락토-N-네오테트라오스 (LNnT) 생산을 증강시키는 그들 능력에 대해 SEQ ID NO SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 또는 98을 갖는 막 단백질을 평가하기 위해 설정되었다. 각각의 균주는 실시예 29에 기술된 바와 같이 LNnT의 생산을 위해 변형된다. 또한, 각각의 균주는 이.콜라이 유래 락토스 퍼미아제 (LacY) (SEQ ID NO 52), 천연 프룩토스-6-P-아미노트랜스퍼라제 (UniProt ID Q8NND3), 이.콜라이 W 유래 수크로스 수송체 (CscB) (UniProt ID E0IXR1), 지. 모빌리스 유래 프룩토스 키나제 (Frk) (UniProt ID Q03417) 및 비. 아돌레센티스 유래 수크로스 포스포릴라제 (BaSP) (UniProt ID A0ZZH6)를 코딩하는 유전자를 포함하는 항상성 전사 유닛의 게놈 녹-인에 의해 수크로스에서 성장한다. 후보 유전자는 상기 막 단백질 유전자를 포함하는 항상성 전사 유닛의 게놈 녹-인에 의해 LNnT 생산 숙주에 존재하였다. 성장 실험은 실시예 29에 제공되는 배양 조건에 따라 수행되었다. LN3 및 LNnT의 생산은 SEQ ID NO 22를 갖는 엔. 메닌지티디스 유래 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 (LgtA) 및 SEQ ID NO 24를 갖는 엔. 메닌지티디스 유래 N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제 (LgtB)를 발현하는 각각의 LNnT 생산 숙주에서 평가되었다.
실시예 33. 재료 및 방법 동물 세포
상이한 포유동물의 지방 조직으로부터 중간엽 줄기 세포의 단리
신선한 지방 조직은 도살장 (예를 들어, 소, 돼지, 양, 닭, 오리, 메기, 뱀, 개구리) 또는 지방 흡입술 (예를 들어, 인간 경우, 사전 동의 후)로부터 수득되어서, 항생제가 보충된 포스페이트 완충 염수에 유지된다. 지방 조직의 효소 분해를 수행하고 중간엽 줄기 세포를 단리하기 위해 원심분리한다. 단리된 중간엽 줄기 세포를 세포 배양 플라스크로 옮겼고, 표준 성장 조건, 예컨대 37℃, 5% CO2 하에서 성장시킨다. 초기 배양 배지는 DMEM-F12, RPMI, 및 알파-MEM 배지 (15% 태아 소 혈청 보충), 및 1% 항생제를 포함한다. 배양 배지는 후속하여 제1 계대 이후에 10% FBS (태아 소 혈청)-보충된 배지로 대체된다. 예를 들어, 모든 목적을 위해 그 전문이 참조로 본 명헤서에 편입되는 Ahmad and Shakoori (2013, Stem Cell Regen Med. 9(2): 29- 36)는 이 실시예에서 본 명세서에 기술된 방법(들)의 일정 별형(들)을 기술한다.
모유로부터 중간엽 줄기 세포의 단리
이 실시예는 본 명세서에 기술된 바와 같이, 인간 또는 임의의 다른 포유동물(들)로부터 무균 조건 하에서 수집된 모유로부터 중간엽 줄기 세포의 단리를 예시한다. 동일 부피의 포스페이트 완충 염수를 희석된 모유에 첨가하고 나서, 20분 동안 원심분리한다. 세포 펠렛을 포스페이트 완충 염수로 3회 세척하고 세포는 표준 배양 조건 하에서 10% 태아 소 혈청 및 1% 항생제가 보충된 DMEM-F12, RPMI, 및 알파-MEM 배지의 세포 배양 플라스크에 파종한다. 예를 들어, 모든 목적을 위해 그 전문이 참조로 본 명세서에 편입되는, Hassiotou et al. (2012, Stem Cells. 30(10): 2164-2174)는 이 실시예에서 본 명세서에 기술된 방법(들)의 일정 별형(들)을 기술한다.
2D 및 3D 배양 시스템을 사용한 줄기 세포의 분화
단리된 중간엽 세포는 2D 및 3D 배양 시스템에서 유선-유사 상피 및 내강 세포로 분화될 수 있다. 예를 들어, 하기 문헌들을 참조하고 이들 각각은 모든 목적을 위해 그들 전문이 참조로 본 명세서에 편입된다: Huynh et al. 1991. Exp Cell Res. 197(2): 191 -199; Gibson et al. 1991, In Vitro Cell Dev Biol Anim. 27(7): 585-594; Blatchford et al. 1999; Animal Cell Technology': Basic & Applied Aspects, Springer, Dordrecht. 141-145; Williams et al. 2009, Breast Cancer Res 11(3): 26-43; 및 Arevalo et al. 2015, Am J Physiol Cell Physiol. 310(5): C348 - C356.
2D 배양 경우, 단리된 세포는 10 ng/mL 상피 성장 인자 및 5 pg/mL 인슐린이 보충된 성장 배지의 배양 플레이트에 초기에 파종되었다. 합류점에서, 세포는 2% 태아 소 혈청, 1% 페니실린-스트렙토마이신 (100 U/mL 페니실린, 100 ug/mL 스트렙토마이신), 및 5 pg/mL 인슐린이 보충된 성장 배지를 48시간 동안 공급받았다. 분화를 유도하기 위해서, 세포는 5 pg/mL 인슐린, 1 pg/mL 히드로코르티손, 0.65 ng/mL 트리아이오도티로닌, 100 nM 덱사메타손, 및 1 pg/mL 프로락틴을 함유하는 완전 성장 배지를 공급받았다. 24시간 후에, 혈청을 완전 유도 배지에서 제거한다.
3D 배양을 위해서, 단리된 세포는 트립신 처리되어, 마트리겔, 히알루론산, 또는 초-저 부착 표면 배양 플레이트에서 6일 동안 배양되었고 10 ng/mL 상피 성장 인자 및 5 pg/mL 인슐린이 보충된 성장 배지를 첨가하여 분화 및 락테이트를 유도하였다. 합류점에서, 세포는 2% 태아 소 혈청, 1% 페니실린-스트렙토마이신 (100 U/mL 페니실린, 100 ug/mL 스트렙토마이신), 및 5 pg/mL 인슐린이 보충된 성장 배지를 48시간 동안 공급받았다. 분화를 유도하기 위해서, 세포는 5 pg/mL 인슐린, 1 pg/mL 히드로코르티손, 0.65 ng/mL 트리아이오도티로닌, 100 nM 덱사메타손, 및 1 pg/mL 프로락틴을 함유하는 완전 성장 배지를 공급받았다. 24시간 후에, 혈청을 완전 유도 배지에서 제거한다.
유선-유사 세포의 제조 방법
포유동물 세포는 Oct4, Sox2, Klf4, 및 c-Myc를 코딩하는 바이러스 벡터에 의한 재프로그래밍을 통해서 유도 만능성이 된다. 최종 재프로그래밍된 세포는 Mammocult 배지 (Stem Cell Technologies에서 입수), 또는 유선 세포 농후화 배지 (DMEM, 3% FBS, 에스트로겐, 프로게스테론, 헤파린, 히드로코르티손, 인슐린, EGF)에서 배양되어서 그들을 유선-유사로 만들고, 이로부터 선택된 모유 성분의 발현을 유도할 수 있다. 대안적으로, 리모델링 시스템 예컨대, CRISPR/Cas9를 사용하여 후생적 리모델링을 수행하여서, 선택된 관심 유전자, 예컨대, 카세인, a-락트알부민을 항상적으로 활성화시켜서, 그들 개별 단백질의 발현을 허용하고/하거나, 모든 목적을 위해 그 전문이 참조로 본 명세서에 편입되는 예를 들어, WO21067641에 기술된 바와 같이 선택된 내생성 유전자를 하향조절 및/또는 녹-아웃시킬 수 있다.
배양
완전 성장 배지는 고 글루코스 DMEM/F12, 10% FBS, 1% NEAA, 1% pen/strep, 1% ITS-X, 1% F-Glu, 10 ng/mL EGF, 및 5 pg/mL 히드로코르티손을 포함한다. 완전 수유 배지는 고 글루코스 DMEM/F12, 1% NEAA, 1% pen/strep, 1% ITS-X, 1% F-Glu, 10 ng/mL EGF, 5 pg/mL 히드로코르티손, 및 1 pg/mL 프로락틴 (Hyunh 1991에서 5ug/mL)을 포함한다. 세포는 완전 성장 배지가 있는 콜라겐 코팅된 플라스크 상에 20,000 세포/㎠의 밀도로 파종되고, 완전 성장 배지에서 48시간 동안 부착 및 확장되도록 정치시키고, 그 이후에 배지를 완전 수유 배지로 바꿔준다. 수유 배지에 노출 후, 세포는 분화를 시작하고 성장을 멈춘다. 약 1주 이내에, 세포는 우유 지질, 락토스, 카세인 및 유장같은 수유 생산물(들)을 배지로 분비하기 시작한다. 수유 배지의 원하는 농도는 한외여과에 의한 희석 또는 농축으로 획득될 수 있다. 수유 배지의 원하는 염 균형은 예를 들어, 배지로부터 원치않는 대사 산물을 제거하기 위해, 투석을 통해 달성될 수 있다. 사용된 호르몬 및 다른 성장 인자는 수지 정제에 의해서, 예를 들어, His-태그화된 성장 인자를 제거하기 위한 니켈 수지의 사용을 통해서 선택적으로 추출되어서, 락테이트화된 생산물 중 오염물의 수준을 추가로 감소시킬 수 있다.
분석적 분석
실시예 4의 이 섹션을 참조한다.
실시예 34. 비-유선 성체 줄기 세포에서 LN3 생산에 대해 시험된 막 단백질
실험은 LN3 생산을 증강시키는 그들 능력에 대해 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 또는 98을 갖는 막 단백질을 평가하기 위해 설정되었다. 실시예 33에 기술된 바와 같이 유선-유사 세포로 재프로그램된 단리된 중간엽 세포는 호모 사피엔스 유래 GlcN6P 신타제 (UniProt ID Q06210), 호모 사피엔스 유래 글루코사민 6-포스페이트 N-아세틸트랜스퍼라제 (UniProt ID Q96EK6), 호모 사피엔스 유래 포스포아세틸글루코사민 뮤타제 (UniProt ID O95394), UDP-N-아세틸헥소사민 파이로포스포릴라제 (UniProt ID Q16222) 및 SEQ ID NO 22를 갖는 엔. 메닌지티디스 유래 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 LgtA를 과발현시키도록 CRISPR-CAS를 통해서 변형된다. 도입된 모든 유전자는 숙주 세포에 대해 코돈-최적화된다. 또한 후보 막 단백질 유전자는 LN3 생산 숙주 (CRISPR-CAS)에 도입되었다. 성장 실험은 실시예 33에 제공된 배양 조건에 따라 수행되었다. LN3의 생산은 SEQ ID NO 22를 갖는 엔. 메닌지티디스 유래 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 (LgtA)를 발현하는 각각의 LN3 생산 숙주에서 평가되었다.
실시예 35. 비-유선 성체 줄기 세포에서 락토-N-테트라오스 (LNT) 생산에 대해 시험된 막 단백질
실험은 LN3 및/또는 락토-N-테트라오스 (LNT) 생산을 증강시키는 그들 능력에 대해 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 또는 98을 갖는 막 단백질을 평가하기 위해 설정되었다. 실시예 33에 기술된 바와 같이 유선-유사 세포로 재프로그래밍된 단리된 중간엽 세포는 호모 사피엔스 유래 GlcN6P 신타제 (UniProt ID Q06210), 호모 사피엔스 유래 글루코사민 6-포스페이트 N-아세틸트랜스퍼라제 (UniProt ID Q96EK6), 호모 사피엔스 유래 포스포아세틸글루코사민 뮤타제 (UniProt ID O95394), UDP-N-아세틸헥소사민 파이로포스포릴라제 (UniProt ID Q16222), SEQ ID NO 22를 갖는 엔. 메닌지티디스 유래 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 LgtA 및 SEQ ID NO 23을 갖는 엔. 메닌지티디스 유래 N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제 (wbgO)를 과발현하도록 CRISPR-CAS를 통해 변형된다. 도입된 모든 유전자는 숙주 세포에 대해 코돈-최적화된다. 또한, 후보 막 단백질 유전자가 LNT 생산 숙주에 도입되었다 (CRISPR-CAS). 성장 실험은 실시예 33에 제공된 배양 조건에 따라 수행되었다. LN3 및 LNT의 생산은 SEQ ID NO 22를 갖는 엔. 메닌지티디스 유래 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 (LgtA) 및 SEQ ID NO 23을 갖는 엔. 메닌지티디스 유래 N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제 (wbgO)를 발현하는 각각의 LNT 생산 숙주에서 평가되었다.
실시예 36. 비-유선 성체 줄기 세포 에서 락토-N-네오테트라오스 (LNnT) 생산을 증강시키는 것으로 확인된 막 단백질
실험은 LN3 및/또는 락토-N-네오테트라오스 (LNnT) 생산을 증강시키는 그들 능력에 대해 SEQ ID NO SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97 또는 98을 갖는 막 단백질을 평가하기 위해 설정되었다. 실시예 33에 기술된 바와 같이 유선-유사 세포로 재프로그래밍된 단리된 중간엽 세포는 호모 사피엔스 유래 GlcN6P 신타제 (UniProt ID Q06210), 호모 사피엔스 유래 글루코사민 6-포스페이트 N-아세틸트랜스퍼라제 (UniProt ID Q96EK6), 호모 사피엔스 유래 포스포아세틸글루코사민 뮤타제 (UniProt ID O95394), UDP-N-아세틸헥소사민 파이로포스포릴라제 (UniProt ID Q16222), SEQ ID NO 22를 갖는 엔. 메닌지티디스 유래 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 LgtA 및 SEQ ID NO 24를 갖는 엔. 메닌지티디스 유래 N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제 (LgtB)를 과발현하도록 CRISPR-CAS를 통해 변형된다. 도입된 모든 유전자는 숙주 세포에 대해 코돈-최적화된다. 또한 후보 막 단백질 유전자는 LNnT 생산 숙주에 도입되었다 (CRISPR-CAS). 성장 실험은 실시예 33에 제공된 배양 조건에 따라 수행되었다. LN3 및 LNnT의 생산은 SEQ ID NO 22를 갖는 엔. 메닌지티디스 유래 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 (LgtA) 및 SEQ ID NO 24를 갖는 엔. 메닌지티디스 유래 N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제 (LgtB)를 발현하는 각각의 LNnT 생산 숙주에서 평가되었다.
<110> Inbiose N.V. <120> Production of oligosaccharides comprising LN3 as core structure in host cells <130> 035-PCT <150> EP21152592.8 <151> 2021-01-20 <160> 98 <170> PatentIn version 3.5 <210> 1 <211> 410 <212> PRT <213> Cronobacter muytjensii <400> 1 Met Gln Thr His Ala Asn Arg Thr Gly Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln 35 40 45 Ala Gly Val Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Ala Gly Val Val Trp Phe Ile Val Thr Cys 85 90 95 Leu Ala Thr Leu Leu Ala Gln Thr Ile Glu Gln Phe Thr Val Leu Arg 100 105 110 Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Val His Ala Ala Pro Trp Glu Met Met Phe Val Leu 165 170 175 Phe Ala Ala Leu Ala Ala Ile Ser Phe Phe Gly Leu Trp Arg Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Arg Glu Leu 195 200 205 Gly Arg Asp Tyr Lys Ala Val Leu Lys Asn Leu Arg Phe Val Ser Gly 210 215 220 Ala Leu Ala Ile Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Met Ser Thr Tyr Glu 245 250 255 Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Leu Gly Asn 260 265 270 Leu Val Leu Ala Lys Leu Thr Ala Arg Arg Ser Val Arg Ser Leu Ile 275 280 285 Ile Met Gly Gly Trp Pro Ile Met Ala Gly Leu Ala Leu Ala Ala Phe 290 295 300 Ala Thr Leu Leu Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Ile Tyr Ala Phe Gly Ile Gly Ile Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ala Ser Asp Ile Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Thr Ile Phe Thr Val Gly Ile Glu Val Ser 355 360 365 Lys His Ala Trp Ile Gly Gly Gly Asn Gly Leu Phe Asn Leu Phe Asn 370 375 380 Leu Ala Asn Gly Leu Leu Trp Leu Gly Leu Met Val Ile Phe Leu Lys 385 390 395 400 Asp Lys Thr Val Gly Ala Ser Arg Glu Gly 405 410 <210> 2 <211> 411 <212> PRT <213> Yokenella regensburgei (ATCC43003) <400> 2 Met Gln Asn His Thr Leu Ser Gly Lys Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln 35 40 45 Ala Gly Ile Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Ile Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys 85 90 95 Leu Ala Thr Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Phe Leu Arg 100 105 110 Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Ile His Phe Ala Pro Trp Glu Thr Met Phe Val Leu 165 170 175 Phe Ala Ala Leu Ala Ala Ile Ser Phe Phe Gly Leu Gln Arg Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Ile Gly Glu Lys Leu Ser Leu Lys Glu Leu 195 200 205 Gly Arg Asp Tyr Ser Ala Val Leu Lys Asn Leu Arg Phe Val Ala Gly 210 215 220 Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Val Ile Ile Met Ser Gly Glu His Ala Ser Ser Tyr Glu 245 250 255 Tyr Gly Met Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ile Gly Asn 260 265 270 Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Ser Val Arg Ser Leu Ile 275 280 285 Ile Met Gly Gly Trp Pro Ile Val Ala Gly Leu Ile Leu Ala Ala Ala 290 295 300 Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Val Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ala Ala Ala 340 345 350 Met Gly Met Leu Gln Met Met Ile Phe Thr Val Gly Ile Glu Val Ser 355 360 365 Lys His Ala Tyr Leu Leu Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn 370 375 380 Leu Ala Gly Gly Leu Val Trp Leu Val Leu Ile Val Tyr Phe Leu Lys 385 390 395 400 Asp Lys Thr Val Gly Ala Ser Thr Lys Pro Asp 405 410 <210> 3 <211> 410 <212> PRT <213> Escherichia coli strain K12 (MG1655) <400> 3 Met Gln Asn Lys Leu Ala Ser Gly Ala Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln 35 40 45 Ala Gly Ile Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Ala Gly Val Val Trp Phe Ile Val Thr Cys 85 90 95 Leu Ala Ile Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Leu Leu Arg 100 105 110 Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Ile His Val Leu Pro Trp Glu Gly Met Phe Val Leu 165 170 175 Phe Ala Ala Leu Ala Ala Ile Ser Phe Phe Gly Leu Gln Arg Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Ile Gly Glu Lys Leu Ser Leu Lys Glu Leu 195 200 205 Gly Arg Asp Tyr Lys Leu Val Leu Lys Asn Gly Arg Phe Val Ala Gly 210 215 220 Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Ile Ile Ile Ile Thr Gly Glu Gln Leu Ser Ser Tyr Glu 245 250 255 Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn 260 265 270 Leu Leu Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile 275 280 285 Ile Met Gly Gly Trp Pro Ile Met Ile Gly Leu Leu Val Ala Ala Ala 290 295 300 Ala Thr Val Ile Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Ile Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Ile Ser 355 360 365 Lys His Ala Trp Leu Asn Gly Gly Asn Gly Leu Phe Asn Leu Phe Asn 370 375 380 Leu Val Asn Gly Ile Leu Trp Leu Ser Leu Met Val Ile Phe Leu Lys 385 390 395 400 Asp Lys Gln Met Gly Asn Ser His Glu Gly 405 410 <210> 4 <211> 411 <212> PRT <213> Enterobacter sp. <400> 4 Met Leu Asn Arg Ser Ser Ser Gly Thr Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Ala Gln Tyr Asn 35 40 45 Ala Gly Ile Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Thr Gly Val Ala Trp Phe Ile Val Thr Cys 85 90 95 Leu Ala Thr Leu Leu Ala Gln Thr Ile Glu Gln Phe Met Val Leu Arg 100 105 110 Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Val His Val Ala Pro Trp Glu Gly Met Phe Val Leu 165 170 175 Phe Ala Val Leu Ala Ala Ile Ser Phe Tyr Gly Leu His Arg Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Ile Gly Glu Lys Leu Ser Leu Gln Glu Leu 195 200 205 Gly Arg Asp Tyr Lys Glu Val Leu Lys Asn Gly Arg Phe Val Ala Gly 210 215 220 Ala Leu Ala Ile Gly Phe Val Cys Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Asn Leu Ser Ser Tyr Glu 245 250 255 Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Val Gly Asn 260 265 270 Ile Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile 275 280 285 Ile Met Gly Gly Trp Pro Ile Val Ile Gly Leu Val Val Ala Ala Val 290 295 300 Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Ile Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ala Ser Glu Val Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser 355 360 365 Lys His Ala Phe Ser Ser Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn 370 375 380 Leu Val Asn Gly Leu Leu Trp Leu Ala Leu Met Phe Val Phe Leu Lys 385 390 395 400 Asp Lys Arg Val Gly Ser Ser Leu Gln Pro Gly 405 410 <210> 5 <211> 410 <212> PRT <213> Citrobacter koseri (Citrobacter diversus) <400> 5 Met Gln Asn Leu Ser Gln Thr Gly Val Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln 35 40 45 Ala Gly Ile Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Ala Gly Val Ile Trp Phe Ile Val Thr Cys 85 90 95 Leu Ala Thr Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Leu Leu Arg 100 105 110 Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Val His Val Leu Pro Trp Glu Gly Met Phe Val Leu 165 170 175 Phe Ala Val Leu Ala Ala Ile Ala Phe Val Gly Leu Gln Arg Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Lys Glu Leu 195 200 205 Gly Arg Asp Tyr Thr Leu Val Leu Lys Asn Val Arg Phe Val Ala Gly 210 215 220 Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Ile Ile Ile Ile Ser Gly Glu Gln Leu Ser Ser Tyr Glu 245 250 255 Tyr Gly Leu Leu Gln Val Pro Val Phe Gly Ala Leu Ile Ala Gly Asn 260 265 270 Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ala Leu Ile 275 280 285 Ile Met Gly Gly Trp Pro Ile Val Ala Gly Leu Leu Ile Ala Ala Ala 290 295 300 Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Val Tyr Ala Phe Gly Ile Gly Val Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser 355 360 365 Lys His Ala Tyr Leu Ser Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn 370 375 380 Leu Ala Asn Gly Ile Leu Trp Leu Leu Leu Met Val Ile Phe Leu Lys 385 390 395 400 Asp Lys Arg Val Gly Asp Ser Arg Glu Gly 405 410 <210> 6 <211> 410 <212> PRT <213> Citrobacter youngae ATCC 29220 <400> 6 Met Gln Asn Arg Leu Ser Ser Gly Ala Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Asn 35 40 45 Ala Gly Leu Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Thr Gly Val Leu Trp Phe Ile Val Thr Cys 85 90 95 Leu Ala Thr Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Phe Leu Arg 100 105 110 Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Val His Ile Leu Pro Trp Glu Gly Met Phe Ile Leu 165 170 175 Phe Ala Ala Leu Ala Ser Ile Ser Phe Phe Gly Leu Gln Arg Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Ile Lys Glu Leu 195 200 205 Gly Lys Asp Tyr Lys Leu Val Leu Lys Asn Gly Arg Phe Val Ala Gly 210 215 220 Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Ile Ile Ile Ile Ser Gly Glu His Leu Ser Ser Tyr Glu 245 250 255 Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn 260 265 270 Leu Ala Leu Ala Arg Leu Thr Ser Arg Lys Thr Val Arg Ser Leu Ile 275 280 285 Ile Met Gly Gly Trp Pro Ile Ala Val Gly Leu Val Ile Ala Ala Ala 290 295 300 Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Val Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Leu Ser 355 360 365 Lys His Ala Tyr Leu Leu Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn 370 375 380 Leu Ala Ser Gly Val Leu Trp Leu Ile Leu Met Val Ile Phe Leu Lys 385 390 395 400 Asp Lys Arg Val Gly Asn Ser Arg Lys Ile 405 410 <210> 7 <211> 416 <212> PRT <213> Escherichia coli K12 MG1655 <400> 7 Met Asn Lys Gln Ser Trp Leu Leu Asn Leu Ser Leu Leu Lys Thr His 1 5 10 15 Pro Ala Phe Arg Ala Val Phe Leu Ala Arg Phe Ile Ser Ile Val Ser 20 25 30 Leu Gly Leu Leu Gly Val Ala Val Pro Val Gln Ile Gln Met Met Thr 35 40 45 His Ser Thr Trp Gln Val Gly Leu Ser Val Thr Leu Thr Gly Gly Ala 50 55 60 Met Phe Val Gly Leu Met Val Gly Gly Val Leu Ala Asp Arg Tyr Glu 65 70 75 80 Arg Lys Lys Val Ile Leu Leu Ala Arg Gly Thr Cys Gly Ile Gly Phe 85 90 95 Ile Gly Leu Cys Leu Asn Ala Leu Leu Pro Glu Pro Ser Leu Leu Ala 100 105 110 Ile Tyr Leu Leu Gly Leu Trp Asp Gly Phe Phe Ala Ser Leu Gly Val 115 120 125 Thr Ala Leu Leu Ala Ala Thr Pro Ala Leu Val Gly Arg Glu Asn Leu 130 135 140 Met Gln Ala Gly Ala Ile Thr Met Leu Thr Val Arg Leu Gly Ser Val 145 150 155 160 Ile Ser Pro Met Ile Gly Gly Leu Leu Leu Ala Thr Gly Gly Val Ala 165 170 175 Trp Asn Tyr Gly Leu Ala Ala Ala Gly Thr Phe Ile Thr Leu Leu Pro 180 185 190 Leu Leu Ser Leu Pro Ala Leu Pro Pro Pro Pro Gln Pro Arg Glu His 195 200 205 Pro Leu Lys Ser Leu Leu Ala Gly Phe Arg Phe Leu Leu Ala Ser Pro 210 215 220 Leu Val Gly Gly Ile Ala Leu Leu Gly Gly Leu Leu Thr Met Ala Ser 225 230 235 240 Ala Val Arg Val Leu Tyr Pro Ala Leu Ala Asp Asn Trp Gln Met Ser 245 250 255 Ala Ala Gln Ile Gly Phe Leu Tyr Ala Ala Ile Pro Leu Gly Ala Ala 260 265 270 Ile Gly Ala Leu Thr Ser Gly Lys Leu Ala His Ser Ala Arg Pro Gly 275 280 285 Leu Leu Met Leu Leu Ser Thr Leu Gly Ser Phe Leu Ala Ile Gly Leu 290 295 300 Phe Gly Leu Met Pro Met Trp Ile Leu Gly Val Val Cys Leu Ala Leu 305 310 315 320 Phe Gly Trp Leu Ser Ala Val Ser Ser Leu Leu Gln Tyr Thr Met Leu 325 330 335 Gln Thr Gln Thr Pro Glu Ala Met Leu Gly Arg Ile Asn Gly Leu Trp 340 345 350 Thr Ala Gln Asn Val Thr Gly Asp Ala Ile Gly Ala Ala Leu Leu Gly 355 360 365 Gly Leu Gly Ala Met Met Thr Pro Val Ala Ser Ala Ser Ala Ser Gly 370 375 380 Phe Gly Leu Leu Ile Ile Gly Val Leu Leu Leu Leu Val Leu Val Glu 385 390 395 400 Leu Arg His Phe Arg Gln Thr Pro Pro Gln Val Thr Ala Ser Asp Ser 405 410 415 <210> 8 <211> 405 <212> PRT <213> Escherichia coli K12 MG1655 <400> 8 Met Ala Thr Ala Trp Tyr Lys Gln Val Asn Pro Pro Gln Arg Lys Ala 1 5 10 15 Leu Phe Ser Ala Trp Leu Gly Tyr Val Phe Asp Gly Phe Asp Phe Met 20 25 30 Met Ile Phe Tyr Ile Leu His Ile Ile Lys Ala Asp Leu Gly Ile Thr 35 40 45 Asp Ile Gln Ala Thr Leu Ile Gly Thr Val Ala Phe Ile Ala Arg Pro 50 55 60 Ile Gly Gly Gly Phe Phe Gly Ala Met Ala Asp Lys Tyr Gly Arg Lys 65 70 75 80 Pro Met Met Met Trp Ala Ile Phe Ile Tyr Ser Val Gly Thr Gly Leu 85 90 95 Ser Gly Ile Ala Thr Asn Leu Tyr Met Leu Ala Val Cys Arg Phe Ile 100 105 110 Val Gly Leu Gly Met Ser Gly Glu Tyr Ala Cys Ala Ser Thr Tyr Ala 115 120 125 Val Glu Ser Trp Pro Lys Asn Leu Gln Ser Lys Ala Ser Ala Phe Leu 130 135 140 Val Ser Gly Phe Ser Val Gly Asn Ile Ile Ala Ala Gln Ile Ile Pro 145 150 155 160 Gln Phe Ala Glu Val Tyr Gly Trp Arg Asn Ser Phe Phe Ile Gly Leu 165 170 175 Leu Pro Val Leu Leu Val Leu Trp Ile Arg Lys Ser Ala Pro Glu Ser 180 185 190 Gln Glu Trp Ile Glu Asp Lys Tyr Lys Asp Lys Ser Thr Phe Leu Ser 195 200 205 Val Phe Arg Lys Pro His Leu Ser Ile Ser Met Ile Val Phe Leu Val 210 215 220 Cys Phe Cys Leu Phe Gly Ala Asn Trp Pro Ile Asn Gly Leu Leu Pro 225 230 235 240 Ser Tyr Leu Ala Asp Asn Gly Val Asn Thr Val Val Ile Ser Thr Leu 245 250 255 Met Thr Ile Ala Gly Leu Gly Thr Leu Thr Gly Thr Ile Phe Phe Gly 260 265 270 Phe Val Gly Asp Lys Ile Gly Val Lys Lys Ala Phe Val Val Gly Leu 275 280 285 Ile Thr Ser Phe Ile Phe Leu Cys Pro Leu Phe Phe Ile Ser Val Lys 290 295 300 Asn Ser Ser Leu Ile Gly Leu Cys Leu Phe Gly Leu Met Phe Thr Asn 305 310 315 320 Leu Gly Ile Ala Gly Leu Val Pro Lys Phe Ile Tyr Asp Tyr Phe Pro 325 330 335 Thr Lys Leu Arg Gly Leu Gly Thr Gly Leu Ile Tyr Asn Leu Gly Ala 340 345 350 Thr Gly Gly Met Ala Ala Pro Val Leu Ala Thr Tyr Ile Ser Gly Tyr 355 360 365 Tyr Gly Leu Gly Val Ser Leu Phe Ile Val Thr Val Ala Phe Ser Ala 370 375 380 Leu Leu Ile Leu Leu Val Gly Phe Asp Ile Pro Gly Lys Ile Tyr Lys 385 390 395 400 Leu Ser Val Ala Lys 405 <210> 9 <211> 416 <212> PRT <213> Escherichia coli K12 MG1655 <400> 9 Met Ser Leu Ala Lys Ala Ser Leu Trp Thr Ala Ala Ser Thr Leu Val 1 5 10 15 Lys Ile Gly Ala Gly Leu Leu Val Gly Lys Leu Leu Ala Val Ser Phe 20 25 30 Gly Pro Ala Gly Leu Gly Leu Ala Ala Asn Phe Arg Gln Leu Ile Thr 35 40 45 Val Leu Gly Val Leu Ala Gly Ala Gly Ile Phe Asn Gly Val Thr Lys 50 55 60 Tyr Val Ala Gln Tyr His Asp Asn Pro Gln Gln Leu Arg Arg Val Val 65 70 75 80 Gly Thr Ser Ser Ala Met Val Leu Gly Phe Ser Thr Leu Met Ala Leu 85 90 95 Val Phe Val Leu Ala Ala Ala Pro Ile Ser Gln Gly Leu Phe Gly Asn 100 105 110 Thr Asp Tyr Gln Gly Leu Val Arg Leu Val Ala Leu Val Gln Met Gly 115 120 125 Ile Ala Trp Gly Asn Leu Leu Leu Ala Leu Met Lys Gly Phe Arg Asp 130 135 140 Ala Ala Gly Asn Ala Leu Ser Leu Ile Val Gly Ser Leu Ile Gly Val 145 150 155 160 Leu Ala Tyr Tyr Val Ser Tyr Arg Leu Gly Gly Tyr Glu Gly Ala Leu 165 170 175 Leu Gly Leu Ala Leu Ile Pro Ala Leu Val Val Ile Pro Ala Ala Ile 180 185 190 Met Leu Ile Lys Arg Gly Val Ile Pro Leu Ser Tyr Leu Lys Pro Ser 195 200 205 Trp Asp Asn Gly Leu Ala Gly Gln Leu Ser Lys Phe Thr Leu Met Ala 210 215 220 Leu Ile Thr Ser Val Thr Leu Pro Val Ala Tyr Ile Met Met Arg Lys 225 230 235 240 Leu Leu Ala Ala Gln Tyr Ser Trp Asp Glu Val Gly Ile Trp Gln Gly 245 250 255 Val Ser Ser Ile Ser Asp Ala Tyr Leu Gln Phe Ile Thr Ala Ser Phe 260 265 270 Ser Val Tyr Leu Leu Pro Thr Leu Ser Arg Leu Thr Glu Lys Arg Asp 275 280 285 Ile Thr Arg Glu Val Val Lys Ser Leu Lys Phe Val Leu Pro Ala Val 290 295 300 Ala Ala Ala Ser Phe Thr Val Trp Leu Leu Arg Asp Phe Ala Ile Trp 305 310 315 320 Leu Leu Leu Ser Asn Lys Phe Thr Ala Met Arg Asp Leu Phe Ala Trp 325 330 335 Gln Leu Val Gly Asp Val Leu Lys Val Gly Ala Tyr Val Phe Gly Tyr 340 345 350 Leu Val Ile Ala Lys Ala Ser Leu Arg Phe Tyr Ile Leu Ala Glu Val 355 360 365 Ser Gln Phe Thr Leu Leu Met Val Phe Ala His Trp Leu Ile Pro Ala 370 375 380 His Gly Ala Leu Gly Ala Ala Gln Ala Tyr Met Ala Thr Tyr Ile Val 385 390 395 400 Tyr Phe Ser Leu Cys Cys Gly Val Phe Leu Leu Trp Arg Arg Arg Ala 405 410 415 <210> 10 <211> 110 <212> PRT <213> Escherichia coli K12 MG1655 <400> 10 Met Asn Pro Tyr Ile Tyr Leu Gly Gly Ala Ile Leu Ala Glu Val Ile 1 5 10 15 Gly Thr Thr Leu Met Lys Phe Ser Glu Gly Phe Thr Arg Leu Trp Pro 20 25 30 Ser Val Gly Thr Ile Ile Cys Tyr Cys Ala Ser Phe Trp Leu Leu Ala 35 40 45 Gln Thr Leu Ala Tyr Ile Pro Thr Gly Ile Ala Tyr Ala Ile Trp Ser 50 55 60 Gly Val Gly Ile Val Leu Ile Ser Leu Leu Ser Trp Gly Phe Phe Gly 65 70 75 80 Gln Arg Leu Asp Leu Pro Ala Ile Ile Gly Met Met Leu Ile Cys Ala 85 90 95 Gly Val Leu Ile Ile Asn Leu Leu Ser Arg Ser Thr Pro His 100 105 110 <210> 11 <211> 507 <212> PRT <213> Bifidobacterium longum subsp. Infantis (strain ATCC 15697) <400> 11 Met Ser Asn Glu Asn Thr Ala Val Gly Asp Val Arg Lys Lys Gly Gly 1 5 10 15 Leu Gly Gln Arg Ile Ala Tyr Ala Cys Gly Asn Leu Gly Gln Ala Ala 20 25 30 Phe Tyr Asn Ala Met Ser Thr Tyr Phe Val Thr Tyr Val Thr Ser Cys 35 40 45 Leu Phe Val Ser Tyr Ser Lys Ala Leu Ala Ala Gln Met Ile Ala Val 50 55 60 Ile Thr Gly Leu Ile Val Val Ile Arg Ile Ala Glu Ile Phe Ile Asp 65 70 75 80 Pro Leu Leu Gly Asn Leu Val Asp Asn Thr Thr Thr Lys Trp Gly Arg 85 90 95 Phe Arg Pro Trp Gln Phe Ile Gly Gly Leu Val Ser Ser Val Leu Ile 100 105 110 Met Leu Ile Phe Ser Gly Met Phe Gly Leu Val Asn Val Asn Thr Thr 115 120 125 Leu Phe Ile Val Leu Phe Val Ile Thr Phe Ile Val Leu Asp Val Phe 130 135 140 Tyr Ser Leu Arg Asp Ile Ser Tyr Trp Gly Met Ile Pro Ala Leu Ser 145 150 155 160 Ser Asp Ser His Glu Arg Ser Thr Tyr Thr Ala Leu Gly Thr Phe Thr 165 170 175 Gly Ser Ile Gly Tyr Asn Gly Ile Thr Val Ile Val Ile Pro Ile Val 180 185 190 Ser Tyr Phe Thr Trp Thr Phe Thr Gly Ala Lys Gly Gln Gly Gln Ala 195 200 205 Gly Trp Thr Ser Phe Gly Phe Ile Val Ala Leu Leu Gly Leu Ile Thr 210 215 220 Ala Trp Ala Val Ala Phe Gly Thr Lys Glu Ser Thr Asn Ala Leu Arg 225 230 235 240 Ala Lys Ala Gln Lys Asn Gly Asn Pro Phe Glu Ala Phe Lys Ala Leu 245 250 255 Phe Gln Asn Asp Gln Leu Leu Trp Val Ala Leu Ser Tyr Leu Leu Tyr 260 265 270 Ala Ile Ala Asn Val Ile Thr Thr Gly Val Met Tyr Tyr Leu Phe Val 275 280 285 Phe Val Leu Asp Glu Pro Ala Ala Phe Ser Val Thr Gly Ile Ile Pro 290 295 300 Leu Ile Ala Gly Phe Ile Met Ala Pro Leu Tyr Pro Ile Leu Asn Arg 305 310 315 320 Trp Ile Pro Arg Arg Tyr Leu Phe Ala Gly Gly Met Val Ser Met Ile 325 330 335 Ile Gly Tyr Thr Met Leu Ala Leu Phe Ser Ser Asn Leu Pro Val Val 340 345 350 Ile Val Ala Leu Ile Phe Phe Tyr Val Pro Ala Gln Phe Ile Gln Met 355 360 365 Thr Ala Ile Leu Ser Leu Thr Asp Ser Ile Glu Tyr Gly Gln Leu Lys 370 375 380 Asn Gly Lys Arg Asn Glu Ala Val Thr Leu Ser Val Arg Pro Met Leu 385 390 395 400 Asp Lys Ile Gly Gly Ala Met Ser Asn Gly Val Val Gly Ala Val Ala 405 410 415 Leu Ala Ala Gly Met Thr Gly His Ala Thr Ala Ala Asp Met Thr Ala 420 425 430 Ser Asn Ile Thr Thr Phe Lys Thr Phe Ala Phe Tyr Ile Pro Leu Val 435 440 445 Leu Ile Ile Leu Ser Leu Val Val Phe Trp Phe Lys Val Lys Ile Asp 450 455 460 Glu Lys Met His Ala Gln Ile Val Asp Glu Leu Glu Ala Lys Leu Ala 465 470 475 480 Ser Gly Glu Ile Val Asp Asp Glu Ala Gln Thr Val Glu Ala Val Glu 485 490 495 Ala Ile Asn Glu Glu Thr Pro Ala Ala Lys Asn 500 505 <210> 12 <211> 405 <212> PRT <213> Bifidobacterium longum subsp. Infantis (strain ATCC 15697) <400> 12 Met Ala Leu Asp Val Gly Lys Ala Leu Lys Ser Lys Thr Leu Val Val 1 5 10 15 Gly Val Leu Ser Met Ser Leu Leu Met Ser Ala Ser Asn Ala Val Ser 20 25 30 Gly Thr Ile Pro Ala Met Lys Glu Ala Phe Ser Asp Tyr Ser Ala Ala 35 40 45 Asn Val Glu Leu Leu Thr Thr Val Pro Thr Ile Gly Ser Met Val Gly 50 55 60 Thr Ala Leu Thr Gly Leu Phe Ala Asn Ala Ile Gly Arg Lys Lys Ile 65 70 75 80 Ala Met Ala Gly Phe Leu Ile Ser Ala Val Thr Gly Val Ile Pro Ala 85 90 95 Phe Phe Pro Tyr Tyr Trp Pro Ile Leu Ile Ser Arg Met Phe Phe Gly 100 105 110 Phe Gly Ser Ala Leu Phe Val Thr Leu Ser Val Ser Tyr Ile Thr Asp 115 120 125 Leu Tyr Asp Gly Asp Met Gln Arg Lys Leu Leu Gly Trp Arg Gln Ala 130 135 140 Val Gly Asn Leu Gly Asp Val Val Leu Leu Phe Val Ala Ser Leu Leu 145 150 155 160 Ile Thr Ile Asn Trp Gln Ser Thr Tyr Leu Ile Phe Phe Leu Leu Phe 165 170 175 Val Pro Met Val Leu Val Gly Met Phe Ile Pro Lys Glu Phe Asp Asn 180 185 190 Phe Ser Ile Arg Ser Ala Leu Val Asp Asp Glu Gly His Val Val Asp 195 200 205 Lys Ser Ala Ser Gln Lys Gln Thr Thr Asn Trp Gln Val Leu Trp Leu 210 215 220 Ala Phe Ile Phe Leu Val Val Ser Met Leu Tyr Asn Val Met Ser Ile 225 230 235 240 Lys Leu Ala Ser Tyr Val Val Asp Glu Gly Ile Gly Ser Ala Ser Leu 245 250 255 Ala Thr Leu Ile Phe Ser Phe Leu Val Val Ala Thr Ile Leu Ser Gly 260 265 270 Val Leu Phe Asp Lys Val Ala Lys Val Thr Lys Arg Leu Thr Val Thr 275 280 285 Ile Ser Glu Val Val Ile Gly Ile Cys Phe Ile Ala Thr Ala Leu Thr 290 295 300 Lys Asn Val Pro Leu Met Phe Ala Leu Val Leu Ile Ala Gly Phe Ala 305 310 315 320 Trp Gly Ile Ile Asn Pro Ala Leu Thr Ala Arg Phe Val Asp Tyr Ser 325 330 335 Pro Ala His Ser Met Asn Leu Thr Thr Ser Ile Val Ile Ile Gly Ile 340 345 350 Asn Ile Gly Cys Leu Ile Ser Pro Tyr Phe Phe Ala Leu Thr Ala Ser 355 360 365 Ile Phe Gly Asn Ser Ser Ala Gly Phe Ala Ile Ile Val Gly Gly Ala 370 375 380 Leu Tyr Leu Val Met Val Val Ile Glu Leu Ile Thr Leu Lys Val Asp 385 390 395 400 Lys Lys Leu Thr Val 405 <210> 13 <211> 407 <212> PRT <213> Bifidobacterium longum subsp. Infantis (strain ATCC 15697) <400> 13 Met Ser Lys Ile Ile Asn Tyr Ser Glu Val Leu Glu Ser Lys Arg Leu 1 5 10 15 Met Val Gly Val Leu Ser Val Ser Phe Leu Leu Ser Ala Gly Asn Ala 20 25 30 Ile Ser Gly Thr Ile Pro Ala Met Glu Glu Ala Phe Ser Asn Ile Ser 35 40 45 Lys Ala Asn Ile Glu Thr Leu Thr Thr Ile Pro Thr Ala Gly Ile Met 50 55 60 Leu Gly Thr Val Leu Ser Gly Val Phe Ser Asn Tyr Leu Gly Lys Lys 65 70 75 80 Lys Ser Val Leu Ala Gly Leu Ile Ile Ala Leu Val Gly Gly Val Ile 85 90 95 Pro Ala Phe Leu Pro Gln Tyr Trp Pro Ile Phe Ile Ser Arg Phe Leu 100 105 110 Phe Gly Val Gly Met Gly Ile Phe Asn Pro Leu Ser Val Ser Tyr Ile 115 120 125 Thr Asp Leu Tyr Val Gly Asp Arg Gln Arg Ser Leu Leu Gly Tyr Arg 130 135 140 Asn Ala Val Ser Asn Leu Gly Asp Thr Ile Met Leu Phe Val Ala Gly 145 150 155 160 Ile Leu Ile Thr Phe Gly Trp Asn Ile Thr Tyr Leu Val Phe Phe Ala 165 170 175 Leu Leu Ile Pro Ile Val Leu Ile Ile Leu Phe Val Pro Lys Glu Phe 180 185 190 Asp Asn Phe Asp Ile Arg Asn Ser Ala Leu Asp Glu Asn Gly Gln Ile 195 200 205 Ser Asp Ser Val Ser Asp Val Lys Pro Ser Thr Asn Leu Lys Val Ile 210 215 220 Glu Val Gly Val Val Phe Met Val Ile Thr Met Leu Tyr Asn Ala Ile 225 230 235 240 Pro Leu Lys Phe Ala Ser Tyr Ile Val Thr Glu His Ile Gly Thr Ala 245 250 255 Ser Thr Ala Thr Trp Ile Phe Ser Phe Leu Val Leu Ala Gly Ile Phe 260 265 270 Ser Gly Val Leu Phe Glu Lys Ile Ser Lys Val Phe Lys Arg Leu Thr 275 280 285 Val Phe Val Phe Glu Ile Val Ile Gly Val Ala Tyr Ile Thr Ile Ala 290 295 300 Phe Thr Tyr Asn Ile Pro Leu Leu Thr Ala Leu Val Leu Ile Ser Gly 305 310 315 320 Phe Gly Trp Gly Ile Ile Asn Pro Ala Leu Thr Ala Arg Leu Val Asp 325 330 335 Val Ser Pro Ile Asn Ser Met Asn Leu Ser Thr Ser Ile Ile Val Ile 340 345 350 Phe Ile Ser Val Gly Ser Leu Ile Ser Pro Tyr Phe Phe Ala Met Phe 355 360 365 Ala Gly Leu Phe Gly Asn Asp Ser Ala Ala Phe Ala Ile Val Val Gly 370 375 380 Gly Ala Leu Tyr Val Val Met Ala Val Leu Asp Phe Ile Lys Ile Lys 385 390 395 400 Lys Asn Lys Glu Leu Ser Ile 405 <210> 14 <211> 471 <212> PRT <213> Klebsiella pneumoniae <400> 14 Met Thr Glu Leu Pro Asp Ser Thr Arg Trp Gln Leu Trp Ile Val Ala 1 5 10 15 Phe Gly Phe Phe Met Gln Ser Leu Asp Thr Thr Ile Val Asn Thr Ala 20 25 30 Leu Pro Ser Met Ala Leu Ser Leu Gly Glu Ser Pro Leu His Met His 35 40 45 Met Val Val Val Ser Tyr Val Leu Thr Val Ala Val Met Leu Pro Ala 50 55 60 Ser Gly Trp Leu Ala Asp Lys Val Gly Val Arg Asn Ile Phe Phe Thr 65 70 75 80 Ala Ile Val Leu Phe Thr Leu Gly Ser Leu Phe Cys Ala Trp Ser Ser 85 90 95 Thr Leu Asn Glu Leu Val Leu Ala Arg Val Leu Gln Gly Val Gly Gly 100 105 110 Ala Met Met Val Pro Val Gly Arg Leu Thr Val Met Lys Ile Val Pro 115 120 125 Arg Glu Gln Tyr Met Ala Ala Met Thr Phe Val Thr Leu Pro Gly Gln 130 135 140 Val Gly Pro Leu Leu Gly Pro Ala Leu Gly Gly Ile Leu Val Glu Tyr 145 150 155 160 Ala Ser Trp His Trp Ile Phe Leu Ile Asn Ile Pro Val Gly Ile Val 165 170 175 Gly Ala Ile Ala Thr Leu Met Leu Met Pro Asn Tyr Thr Met Gln Thr 180 185 190 Arg Arg Phe Asp Leu Ser Gly Phe Leu Leu Leu Ala Val Gly Met Ala 195 200 205 Val Leu Thr Leu Ala Leu Asp Gly Ser Lys Gly Thr Gly Leu Ser Pro 210 215 220 Leu Ser Leu Gly Ala Leu Val Leu Cys Gly Ile Leu Ala Ile Ala Leu 225 230 235 240 Tyr Leu Lys His Ala Lys Asn Asn Pro Arg Ala Leu Phe Ser Leu Ala 245 250 255 Leu Phe Arg Thr His Thr Phe Ser Leu Gly Leu Ser Gly Ser Phe Ala 260 265 270 Gly Arg Val Gly Ser Gly Met Leu Pro Phe Met Thr Pro Val Phe Leu 275 280 285 Gln Ile Gly Leu Gly Phe Ser Pro Phe His Ala Gly Leu Met Met Ile 290 295 300 Pro Met Val Leu Gly Ser Met Gly Met Lys Arg Ile Val Val Gln Val 305 310 315 320 Val Asn Arg Phe Gly Tyr Arg Arg Val Leu Val Ser Thr Thr Leu Gly 325 330 335 Leu Ser Leu Val Ser Leu Leu Phe Met Ser Val Ala Met Leu Gly Trp 340 345 350 Tyr Tyr Ala Leu Pro Phe Val Leu Phe Leu Gln Gly Met Val Asn Ser 355 360 365 Thr Arg Phe Ser Ser Met Asn Thr Leu Thr Leu Lys Asp Leu Pro Asp 370 375 380 Glu Leu Ala Ser Ser Gly Asn Ser Leu Leu Ser Met Ile Met Gln Leu 385 390 395 400 Ser Met Ser Ile Gly Val Thr Ile Ala Gly Leu Leu Leu Gly Met Phe 405 410 415 Gly Gln Gln His Ile Ala Ala Asp Ser Gly Ala Ser His Thr Val Phe 420 425 430 Met Tyr Thr Trp Leu Cys Met Ala Leu Ile Ile Ala Leu Pro Ala Leu 435 440 445 Ile Phe Ala Arg Val Pro Asn Asp Thr His Lys Asn Ala Val Ile Ser 450 455 460 Arg Arg Lys Arg Ser Thr Gln 465 470 <210> 15 <211> 375 <212> PRT <213> Bifidobacterium longum subsp. Infantis (strain ATCC 15697) <400> 15 Met Ala Glu Val Val Phe Asp His Val Thr Arg Ile Tyr Pro Gly Asn 1 5 10 15 Asp Lys Pro Ser Val Asp Asp Leu Asn Leu Asp Ile Lys Asp Gly Glu 20 25 30 Phe Leu Val Leu Val Gly Pro Ser Gly Cys Gly Lys Ser Thr Thr Leu 35 40 45 Arg Met Leu Ala Gly Leu Glu Glu Val Asn Lys Gly Arg Ile Leu Ile 50 55 60 Gly Gly Lys Asp Val Thr Thr Met Gln Pro Lys Asp Arg Asp Ile Ala 65 70 75 80 Met Val Phe Gln Asn Tyr Ala Leu Tyr Pro His Met Thr Val Ala Asp 85 90 95 Asn Met Gly Phe Ala Leu Lys Ile Ala Gly Thr Pro Lys Asp Glu Ile 100 105 110 Arg Lys Arg Val Glu Lys Ala Ala Glu Ile Leu Asp Leu Thr Glu Tyr 115 120 125 Leu Asp Arg Lys Pro Lys Ala Leu Ser Gly Gly Gln Arg Gln Arg Val 130 135 140 Ala Met Gly Arg Ala Ile Val Arg Glu Pro Lys Val Phe Leu Met Asp 145 150 155 160 Glu Pro Leu Ser Asn Leu Asp Ala Lys Leu Arg Val Gln Thr Arg Thr 165 170 175 Gln Ile Ala Ala Leu Gln Arg Gln Leu Gly Val Thr Thr Leu Tyr Val 180 185 190 Thr His Asp Gln Thr Glu Ala Leu Thr Met Gly Asp Arg Ile Ala Val 195 200 205 Ile Lys Leu Gly Ile Leu Gln Gln Val Gly Ala Pro Thr Glu Leu Tyr 210 215 220 Asp Arg Pro Ala Asn Val Phe Val Ala Gly Phe Ile Gly Ser Pro Ser 225 230 235 240 Met Asn Leu Asn Thr His Pro Val Val Asn Gly Lys Ala Lys Ile Gly 245 250 255 Glu Asp Thr Val Asp Leu Pro Ala Glu Ala Val Asn Lys Leu Thr Ala 260 265 270 Glu Asp Asn Gly Gln Ile Val Val Gly Phe Arg Pro Glu Asp Ala Gly 275 280 285 Leu Ala Pro Val Asp Asp Pro Asn Ala Phe Ser Leu Lys Val Val Asn 290 295 300 Val Glu Asp Leu Gly Ser Asp Gly Tyr Ile Tyr Gly Thr Ile Val Thr 305 310 315 320 Asp Gly Ser Ala Ala Glu Ala Ser Gln Val Met Ser Asp Gln Asn Lys 325 330 335 Leu Thr Thr Ile Arg Val Asn Pro Arg Ala Leu Pro Lys Val Gly Ala 340 345 350 Thr Val Lys Ile Lys Ile Asp Pro Ala Lys Met His Leu Phe Ala Pro 355 360 365 Ser Thr Glu Leu Arg Leu Asn 370 375 <210> 16 <211> 306 <212> PRT <213> Bradyrhizobium japonicum USDA 110 <400> 16 Met Asn Met Ser Asn Met Ala Ile Asp Leu Val Gly Val Arg Lys Ser 1 5 10 15 Phe Gly Asp Lys Val Ile Val Asn Asp Leu Ser Phe Ser Val Ala Arg 20 25 30 Gly Glu Cys Phe Gly Leu Leu Gly Pro Asn Gly Ala Gly Lys Ser Thr 35 40 45 Ile Ala Arg Met Leu Leu Gly Met Ile Ser Pro Asp Arg Gly Lys Ile 50 55 60 Thr Val Leu Asp Glu Pro Val Pro Ser Arg Ala Arg Ala Ala Arg Val 65 70 75 80 Arg Val Gly Val Val Pro Gln Phe Asp Asn Leu Glu Pro Glu Phe Thr 85 90 95 Val Arg Glu Asn Leu Leu Val Phe Gly Arg Tyr Phe Gly Met Ser Ala 100 105 110 Arg Thr Ile Glu Ala Val Val Pro Ser Leu Leu Glu Phe Ala Arg Leu 115 120 125 Glu Ser Lys Ala Asp Val Arg Val Ser Leu Leu Ser Gly Gly Met Lys 130 135 140 Arg Arg Leu Thr Leu Ala Arg Ala Leu Ile Asn Asp Pro His Leu Leu 145 150 155 160 Val Met Asp Glu Pro Thr Thr Gly Leu Asp Pro His Ala Arg His Leu 165 170 175 Ile Trp Glu Arg Leu Arg Ala Leu Leu Ala Arg Gly Lys Thr Ile Leu 180 185 190 Leu Thr Thr His Phe Met Glu Glu Ala Glu Arg Leu Cys Asp Arg Leu 195 200 205 Cys Val Leu Glu Ser Gly Cys Lys Ile Ala Glu Gly Lys Pro Asp Ala 210 215 220 Leu Ile Asp Glu His Ile Gly Cys Asn Val Ile Glu Ile Tyr Gly Gly 225 230 235 240 Asp Leu Asp Gln Leu Arg Glu Leu Ile Arg Pro Tyr Ala Arg His Ile 245 250 255 Glu Val Ser Gly Glu Thr Leu Phe Cys Tyr Ala Arg Cys Pro Asp Glu 260 265 270 Ile Ser Val His Leu Arg Gly Arg Thr Asp Leu Arg Val Leu Gln Arg 275 280 285 Pro Pro Asn Leu Glu Asp Val Phe Leu Arg Leu Thr Gly Arg Glu Met 290 295 300 Glu Lys 305 <210> 17 <211> 330 <212> PRT <213> Escherichia coli K12 MG1655 <400> 17 Met Lys Ile Lys Asn Ile Leu Leu Thr Leu Cys Thr Ser Leu Leu Leu 1 5 10 15 Thr Asn Val Ala Ala His Ala Lys Glu Val Lys Ile Gly Met Ala Ile 20 25 30 Asp Asp Leu Arg Leu Glu Arg Trp Gln Lys Asp Arg Asp Ile Phe Val 35 40 45 Lys Lys Ala Glu Ser Leu Gly Ala Lys Val Phe Val Gln Ser Ala Asn 50 55 60 Gly Asn Glu Glu Thr Gln Met Ser Gln Ile Glu Asn Met Ile Asn Arg 65 70 75 80 Gly Val Asp Val Leu Val Ile Ile Pro Tyr Asn Gly Gln Val Leu Ser 85 90 95 Asn Val Val Lys Glu Ala Lys Gln Glu Gly Ile Lys Val Leu Ala Tyr 100 105 110 Asp Arg Met Ile Asn Asp Ala Asp Ile Asp Phe Tyr Ile Ser Phe Asp 115 120 125 Asn Glu Lys Val Gly Glu Leu Gln Ala Lys Ala Leu Val Asp Ile Val 130 135 140 Pro Gln Gly Asn Tyr Phe Leu Met Gly Gly Ser Pro Val Asp Asn Asn 145 150 155 160 Ala Lys Leu Phe Arg Ala Gly Gln Met Lys Val Leu Lys Pro Tyr Val 165 170 175 Asp Ser Gly Lys Ile Lys Val Val Gly Asp Gln Trp Val Asp Gly Trp 180 185 190 Leu Pro Glu Asn Ala Leu Lys Ile Met Glu Asn Ala Leu Thr Ala Asn 195 200 205 Asn Asn Lys Ile Asp Ala Val Val Ala Ser Asn Asp Ala Thr Ala Gly 210 215 220 Gly Ala Ile Gln Ala Leu Ser Ala Gln Gly Leu Ser Gly Lys Val Ala 225 230 235 240 Ile Ser Gly Gln Asp Ala Asp Leu Ala Gly Ile Lys Arg Ile Ala Ala 245 250 255 Gly Thr Gln Thr Met Thr Val Tyr Lys Pro Ile Thr Leu Leu Ala Asn 260 265 270 Thr Ala Ala Glu Ile Ala Val Glu Leu Gly Asn Gly Gln Glu Pro Lys 275 280 285 Ala Asp Thr Thr Leu Asn Asn Gly Leu Lys Asp Val Pro Ser Arg Leu 290 295 300 Leu Thr Pro Ile Asp Val Asn Lys Asn Asn Ile Lys Asp Thr Val Ile 305 310 315 320 Lys Asp Gly Phe His Lys Glu Ser Glu Leu 325 330 <210> 18 <211> 309 <212> PRT <213> Bifidobacterium longum infantis Bi-26 <400> 18 Met Ser His Ala Thr Ala Thr Lys Thr Ala Ala Lys Lys Pro Ala Lys 1 5 10 15 Lys Lys Val Ser Ala Phe Ser Thr Arg Lys Val Asp Pro Ala Tyr Tyr 20 25 30 Trp Met Val Val Pro Ala Ala Ile Ile Phe Ala Phe Phe Leu Tyr Leu 35 40 45 Pro Phe Leu Asp Gly Val Lys Tyr Ser Phe Thr Asn Ser Gln Gly Tyr 50 55 60 Gly Asp Tyr Lys Phe Ile Gly Leu Lys Asn Tyr Ile Ala Leu Phe Gln 65 70 75 80 Asp Asn Arg Val Gly His Ala Tyr Leu Phe Thr Phe Leu Ile Ala Ile 85 90 95 Leu Ile Thr Val Leu Ile Asn Val Ile Ala Leu Phe Leu Ser Val Leu 100 105 110 Leu Asn Ser Lys Ile Ala Phe Lys Asn Gly Phe Arg Ala Val Phe Phe 115 120 125 Ile Pro Tyr Thr Leu Ser Val Leu Val Ile Gly Tyr Val Phe Lys Tyr 130 135 140 Ile Phe Met Asn Pro Leu Pro Glu Leu Gly Lys Ala Leu Gly Ile Lys 145 150 155 160 Trp Leu Ser Thr Ser Leu Leu Thr Asn Glu Gln Leu Ser Trp Ile Pro 165 170 175 Ile Val Phe Leu Ala Val Trp Gln Gly Ile Ala Tyr Ser Val Leu Ile 180 185 190 Tyr Leu Ala Gly Leu Gln Thr Ile Asp Asp Glu Ile Tyr Glu Ala Ala 195 200 205 Ala Ile Asp Gly Val Asn Ala Trp Gln Lys Phe Trp Lys Ile Thr Phe 210 215 220 Pro Leu Ile Gly Pro Phe Phe Thr Ile Asn Leu Val Leu Ser Met Lys 225 230 235 240 Asn Ala Leu Gly Thr Phe Asp Gln Val Val Ala Leu Thr Glu Gly Gly 245 250 255 Pro Asn Ser Ser Thr Glu Thr Val Thr Tyr Leu Ile Trp Lys Gly Gly 260 265 270 Leu Thr Gly Gly Glu Tyr Ala Tyr Gln Thr Ala Asn Ala Val Leu Phe 275 280 285 Phe Ile Val Leu Ala Ile Ile Ala Phe Val Gln Leu Arg Ile Ser Arg 290 295 300 Ser Gln Glu Gln Ile 305 <210> 19 <211> 288 <212> PRT <213> Bifidobacterium longum infantis Bi-26 <400> 19 Met Thr Thr Ala Thr Val Thr Pro Ser Lys Ser Gly Lys Pro Ala Lys 1 5 10 15 Phe Arg Arg Asp His Lys Ile Asn Trp Trp Leu Thr Ala Ala Val Ala 20 25 30 Val Leu Ser Leu Thr Ile Leu Ile Pro Leu Tyr Phe Thr Ile Val Thr 35 40 45 Ala Leu Lys Thr Pro Ala Glu Ala Gly Thr Phe Ala Leu Pro Thr Ser 50 55 60 Trp Gln Trp His Asn Phe Ala Asp Ala Ser Ala Lys Val Asn Tyr Pro 65 70 75 80 Lys Ala Ala Leu Asn Ser Ala Ile Ile Thr Val Ala Ala Val Val Leu 85 90 95 Thr Leu Leu Thr Asn Thr Phe Val Ala Tyr Ala Val Ala Arg Asn Met 100 105 110 Asp Lys Arg Phe Phe Arg Phe Leu Tyr Tyr Phe Phe Ile Ala Ala Met 115 120 125 Phe Val Pro Phe Pro Val Val Met Leu Pro Ile Ala Lys Gln Met Gly 130 135 140 Ser Leu His Leu Asp Asn Gln Val Gly Leu Ile Ile Leu Tyr Thr Val 145 150 155 160 Leu Gly Leu Gly Thr Asn Leu Phe Ile Ala Thr Gly Phe Ile Arg Ser 165 170 175 Ile Pro Val Ser Leu Glu Glu Ala Ala Arg Ile Asp Gly Ala Ser Thr 180 185 190 Trp Arg Ile Phe Trp Thr Ile Ile Phe Pro Leu Met Ser Pro Ile Asn 195 200 205 Ala Thr Ile Ala Ile Leu Thr Ala Leu Trp Ala Trp Asn Asp Phe Leu 210 215 220 Leu Pro Leu Ile Ile Leu Thr Asp Gln Ser Asn Gln Thr Ile Pro Leu 225 230 235 240 Ala Gln Tyr Val Phe Ser Ser Gln Phe Ala Thr Asn Tyr Pro Met Ala 245 250 255 Phe Ser Ser Tyr Leu Met Ala Met Ala Pro Ile Leu Ile Val Tyr Ile 260 265 270 Phe Ala Gln Lys Trp Val Val Gly Gly Val Met Arg Gly Ala Val Lys 275 280 285 <210> 20 <211> 303 <212> PRT <213> Bifidobacterium longum infantis Bi-26 <400> 20 Met Thr Asn Ala Thr Ala Gln Pro Asp Thr Ser Val Met Arg Lys Pro 1 5 10 15 Lys Arg Gln Tyr Ile Gly Ile Leu Tyr Cys Leu Pro Tyr Val Val Val 20 25 30 Phe Leu Phe Gly Met Ile Val Pro Met Phe Tyr Ala Leu Tyr Leu Ser 35 40 45 Phe Phe Lys Gln Ser Leu Leu Gly Gly Thr Thr Phe Ala Gly Phe Asp 50 55 60 Asn Phe Ile Arg Ala Phe Lys Asp Glu Ala Leu Trp Gly Gly Phe Lys 65 70 75 80 Asn Val Leu Ile Tyr Ala Ala Ile Gln Ile Pro Met Asn Leu Ile Leu 85 90 95 Ser Leu Val Ala Ala Leu Val Leu Asp Ser Gln Arg Ile Arg His Ile 100 105 110 Ala Val Pro Arg Ile Leu Leu Phe Leu Pro Tyr Ala Val Pro Gly Val 115 120 125 Ile Ala Ala Leu Met Trp Gly Tyr Ile Tyr Gly Asp Lys Tyr Gly Leu 130 135 140 Phe Gly Gln Ile Ala Gly Met Phe Gly Val Ala Ala Pro Asn Met Leu 145 150 155 160 Ser Lys Gln Leu Met Leu Phe Ala Ile Ala Asn Ile Cys Thr Trp Cys 165 170 175 Phe Leu Gly Tyr Asn Met Leu Ile Tyr Tyr Ser Ala Leu Ile Gly Ile 180 185 190 Pro Asn Asp Leu Tyr Glu Ser Ala Arg Ile Asp Gly Ala Ser Glu Leu 195 200 205 Arg Ile Ala Trp Ser Val Lys Ile Pro Gln Ile Lys Ser Thr Ile Val 210 215 220 Met Thr Val Leu Phe Ser Val Ile Gly Thr Leu Gln Leu Phe Asn Glu 225 230 235 240 Pro Asn Ile Leu Arg Thr Ser Ala Pro Asp Val Ile Asn Ser Ser Tyr 245 250 255 Thr Pro Asn Ile Tyr Thr Tyr Asn Leu Ala Phe Asn Gly Gln Asn Val 260 265 270 Asn Tyr Ala Ala Ala Val Ser Leu Val Ile Gly Ile Ile Val Met Ala 275 280 285 Leu Val Ala Val Val Lys Ile Ile Gly Asn Lys Trp Glu Asn Lys 290 295 300 <210> 21 <211> 379 <212> PRT <213> Escherichia coli K12 MG1655 <400> 21 Met Met Lys Ser Lys Met Lys Leu Met Pro Leu Leu Val Ser Val Thr 1 5 10 15 Leu Ile Ser Gly Cys Thr Val Leu Pro Gly Ser Asn Met Ser Thr Met 20 25 30 Gly Lys Asp Val Ile Lys Gln Gln Asp Ala Asp Phe Asp Leu Asp Lys 35 40 45 Met Val Asn Val Tyr Pro Leu Thr Pro Arg Leu Ile Asp Gln Leu Arg 50 55 60 Pro Arg Pro Asn Val Ala Arg Pro Asn Met Thr Leu Glu Ser Glu Ile 65 70 75 80 Ala Asn Tyr Gln Tyr Arg Val Gly Pro Gly Asp Val Leu Asn Val Thr 85 90 95 Val Trp Asp His Pro Glu Leu Thr Thr Pro Ala Gly Gln Tyr Arg Ser 100 105 110 Ser Ser Asp Thr Gly Asn Trp Val Gln Pro Asp Gly Thr Met Phe Tyr 115 120 125 Pro Tyr Ile Gly Lys Val His Val Val Gly Lys Thr Leu Ala Glu Ile 130 135 140 Arg Ser Asp Ile Thr Gly Arg Leu Ala Thr Tyr Ile Ala Asp Pro Gln 145 150 155 160 Val Asp Val Asn Ile Ala Ala Phe Arg Ser Gln Lys Ala Tyr Ile Ser 165 170 175 Gly Gln Val Asn Lys Ser Gly Gln Gln Ala Ile Thr Asn Val Pro Leu 180 185 190 Thr Ile Leu Asp Ala Ile Asn Ala Ala Gly Gly Leu Thr Asp Thr Ala 195 200 205 Asp Trp Arg Asn Val Val Leu Thr His Asn Gly Arg Glu Glu Arg Ile 210 215 220 Ser Leu Gln Ala Leu Met Gln Asn Gly Asp Leu Asn Gln Asn Arg Leu 225 230 235 240 Leu Tyr Pro Gly Asp Ile Leu Tyr Val Pro Arg Asn Asp Asp Leu Lys 245 250 255 Val Phe Val Met Gly Glu Val Lys Lys Gln Ser Thr Leu Lys Met Asp 260 265 270 Phe Ser Gly Met Thr Leu Thr Glu Ala Leu Gly Asn Ala Glu Gly Ile 275 280 285 Asp Met Thr Thr Ser Asn Ala Ser Gly Ile Phe Val Ile Arg Pro Leu 290 295 300 Lys Gly Glu Gly Gly Arg Asn Gly Lys Ile Ala Asn Ile Tyr Gln Leu 305 310 315 320 Asp Met Ser Asp Ala Thr Ser Leu Val Met Ala Thr Glu Phe Arg Leu 325 330 335 Gln Pro Tyr Asp Val Val Tyr Val Thr Thr Ala Pro Val Ser Arg Trp 340 345 350 Asn Arg Leu Ile Asn Gln Leu Leu Pro Thr Ile Ser Gly Val Arg Tyr 355 360 365 Met Thr Asp Thr Ala Ser Asp Ile His Asn Trp 370 375 <210> 22 <211> 348 <212> PRT <213> Neisseria meningitidis <400> 22 Met Pro Ser Glu Ala Phe Arg Arg His Arg Ala Tyr Arg Glu Asn Lys 1 5 10 15 Leu Gln Pro Leu Val Ser Val Leu Ile Cys Ala Tyr Asn Val Glu Lys 20 25 30 Tyr Phe Ala Gln Ser Leu Ala Ala Val Val Asn Gln Thr Trp Cys Asn 35 40 45 Leu Asp Ile Leu Ile Val Asp Asp Gly Ser Thr Asp Gly Thr Leu Ala 50 55 60 Ile Ala Gln Arg Phe Gln Glu Gln Asp Gly Arg Ile Lys Ile Leu Ala 65 70 75 80 Gln Ala Gln Asn Ser Gly Leu Ile Pro Ser Leu Asn Ile Gly Leu Asp 85 90 95 Glu Leu Ala Lys Ser Gly Met Gly Glu Tyr Ile Ala Arg Thr Asp Ala 100 105 110 Asp Asp Ile Ala Ala Pro Asp Trp Ile Glu Lys Ile Val Gly Glu Met 115 120 125 Glu Lys Asp Arg Ser Ile Ile Ala Met Gly Ala Trp Leu Glu Val Leu 130 135 140 Ser Glu Glu Lys Asp Gly Asn Arg Leu Ala Arg His His Glu His Gly 145 150 155 160 Lys Ile Trp Lys Lys Pro Thr Arg His Glu Asp Ile Ala Asp Phe Phe 165 170 175 Pro Phe Gly Asn Pro Ile His Asn Asn Thr Met Ile Met Arg Arg Ser 180 185 190 Val Ile Asp Gly Gly Leu Arg Tyr Asn Thr Glu Arg Asp Trp Ala Glu 195 200 205 Asp Tyr Gln Phe Trp Tyr Asp Val Ser Lys Leu Gly Arg Leu Ala Tyr 210 215 220 Tyr Pro Glu Ala Leu Val Lys Tyr Arg Leu His Ala Asn Gln Val Ser 225 230 235 240 Ser Lys Tyr Ser Ile Arg Gln His Glu Ile Ala Gln Gly Ile Gln Lys 245 250 255 Thr Ala Arg Asn Asp Phe Leu Gln Ser Met Gly Phe Lys Thr Arg Phe 260 265 270 Asp Ser Leu Glu Tyr Arg Gln Ile Lys Ala Val Ala Tyr Glu Leu Leu 275 280 285 Glu Lys His Leu Pro Glu Glu Asp Phe Glu Arg Ala Arg Arg Phe Leu 290 295 300 Tyr Gln Cys Phe Lys Arg Thr Asp Thr Leu Pro Ala Gly Val Trp Leu 305 310 315 320 Asp Phe Ala Ala Asn Gly Arg Met Arg Arg Leu Phe Thr Leu Arg Gln 325 330 335 Tyr Phe Gly Ile Leu His Arg Leu Leu Lys Asn Arg 340 345 <210> 23 <211> 265 <212> PRT <213> Escherichia coli O55:H7 <400> 23 Met Ile Ile Asp Glu Ala Glu Ser Ala Glu Ser Thr His Pro Val Val 1 5 10 15 Ser Val Ile Leu Pro Val Asn Lys Lys Asn Pro Phe Leu Asp Glu Ala 20 25 30 Ile Asn Ser Ile Leu Ser Gln Thr Phe Ser Ser Phe Glu Ile Ile Ile 35 40 45 Val Ala Asn Cys Cys Thr Asp Asp Phe Tyr Asn Glu Leu Lys His Lys 50 55 60 Val Asn Asp Lys Ile Lys Leu Ile Arg Thr Asn Ile Ala Tyr Leu Pro 65 70 75 80 Tyr Ser Leu Asn Lys Ala Ile Asp Leu Ser Asn Gly Glu Phe Ile Ala 85 90 95 Arg Met Asp Ser Asp Asp Ile Ser His Pro Asp Arg Phe Thr Lys Gln 100 105 110 Val Asp Phe Leu Lys Asn Asn Pro Tyr Val Asp Val Val Gly Thr Asn 115 120 125 Ala Ile Phe Ile Asp Asp Lys Gly Arg Glu Ile Asn Lys Thr Lys Leu 130 135 140 Pro Glu Glu Asn Leu Asp Ile Val Lys Asn Leu Pro Tyr Lys Cys Cys 145 150 155 160 Ile Val His Pro Ser Val Met Phe Arg Lys Lys Val Ile Ala Ser Ile 165 170 175 Gly Gly Tyr Met Phe Ser Asn Tyr Ser Glu Asp Tyr Glu Leu Trp Asn 180 185 190 Arg Leu Ser Leu Ala Lys Ile Lys Phe Gln Asn Leu Pro Glu Tyr Leu 195 200 205 Phe Tyr Tyr Arg Leu His Glu Gly Gln Ser Thr Ala Lys Lys Asn Leu 210 215 220 Tyr Met Val Met Val Asn Asp Leu Val Ile Lys Met Lys Cys Phe Phe 225 230 235 240 Leu Thr Gly Asn Ile Asn Tyr Leu Phe Gly Gly Ile Arg Thr Ile Ala 245 250 255 Ser Phe Ile Tyr Cys Lys Tyr Ile Lys 260 265 <210> 24 <211> 275 <212> PRT <213> Neisseria meningitidis MC58 <400> 24 Met Gln Asn His Val Ile Ser Leu Ala Ser Ala Ala Glu Arg Arg Ala 1 5 10 15 His Ile Ala Asp Thr Phe Gly Arg His Gly Ile Pro Phe Gln Phe Phe 20 25 30 Asp Ala Leu Met Pro Ser Glu Arg Leu Glu Gln Ala Met Ala Glu Leu 35 40 45 Val Pro Gly Leu Ser Ala His Pro Tyr Leu Ser Gly Val Glu Lys Ala 50 55 60 Cys Phe Met Ser His Ala Val Leu Trp Lys Gln Ala Leu Asp Glu Gly 65 70 75 80 Leu Pro Tyr Ile Thr Val Phe Glu Asp Asp Val Leu Leu Gly Glu Gly 85 90 95 Ala Glu Lys Phe Leu Ala Glu Asp Ala Trp Leu Gln Glu Arg Phe Asp 100 105 110 Pro Asp Thr Ala Phe Ile Val Arg Leu Glu Thr Met Phe Met His Val 115 120 125 Leu Thr Ser Pro Ser Gly Val Ala Asp Tyr Cys Gly Arg Ala Phe Pro 130 135 140 Leu Leu Glu Ser Glu His Trp Gly Thr Ala Gly Tyr Ile Ile Ser Arg 145 150 155 160 Lys Ala Met Arg Phe Phe Leu Asp Arg Phe Ala Ala Leu Pro Pro Glu 165 170 175 Gly Leu His Pro Val Asp Leu Met Met Phe Ser Asp Phe Phe Asp Arg 180 185 190 Glu Gly Met Pro Val Cys Gln Leu Asn Pro Ala Leu Cys Ala Gln Glu 195 200 205 Leu His Tyr Ala Lys Phe His Asp Gln Asn Ser Ala Leu Gly Ser Leu 210 215 220 Ile Glu His Asp Arg Leu Leu Asn Arg Lys Gln Gln Arg Arg Asp Ser 225 230 235 240 Pro Ala Asn Thr Phe Lys His Arg Leu Ile Arg Ala Leu Thr Lys Ile 245 250 255 Ser Arg Glu Arg Glu Lys Arg Arg Gln Arg Arg Glu Gln Phe Ile Val 260 265 270 Pro Phe Gln 275 <210> 25 <211> 609 <212> PRT <213> Escherichia coli K12 MG1655 <400> 25 Met Cys Gly Ile Val Gly Ala Ile Ala Gln Arg Asp Val Ala Glu Ile 1 5 10 15 Leu Leu Glu Gly Leu Arg Arg Leu Glu Tyr Arg Gly Tyr Asp Ser Ala 20 25 30 Gly Leu Ala Val Val Asp Thr Glu Gly His Met Thr Arg Leu Arg Arg 35 40 45 Leu Gly Lys Val Gln Met Leu Ala Gln Ala Ala Glu Glu His Pro Leu 50 55 60 His Gly Gly Thr Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Glu 65 70 75 80 Pro Ser Glu Val Asn Ala His Pro His Val Ser Glu His Ile Val Val 85 90 95 Val His Asn Gly Ile Ile Glu Asn His Glu Pro Leu Arg Glu Glu Leu 100 105 110 Lys Ala Arg Gly Tyr Thr Phe Val Ser Glu Thr Asp Thr Glu Val Ile 115 120 125 Ala His Leu Val Asn Trp Glu Leu Lys Gln Gly Gly Thr Leu Arg Glu 130 135 140 Ala Val Leu Arg Ala Ile Pro Gln Leu Arg Gly Ala Tyr Gly Thr Val 145 150 155 160 Ile Met Asp Ser Arg His Pro Asp Thr Leu Leu Ala Ala Arg Ser Gly 165 170 175 Ser Pro Leu Val Ile Gly Leu Gly Met Gly Glu Asn Phe Ile Ala Ser 180 185 190 Asp Gln Leu Ala Leu Leu Pro Val Thr Arg Arg Phe Ile Phe Leu Glu 195 200 205 Glu Gly Asp Ile Ala Glu Ile Thr Arg Arg Ser Val Asn Ile Phe Asp 210 215 220 Lys Thr Gly Ala Glu Val Lys Arg Gln Asp Ile Glu Ser Asn Leu Gln 225 230 235 240 Tyr Asp Ala Gly Asp Lys Gly Ile Tyr Cys His Tyr Met Gln Lys Glu 245 250 255 Ile Tyr Glu Gln Pro Asn Ala Ile Lys Asn Thr Leu Thr Gly Arg Ile 260 265 270 Ser His Gly Gln Val Asp Leu Ser Glu Leu Gly Pro Asn Ala Asp Glu 275 280 285 Leu Leu Ser Lys Val Glu His Ile Gln Ile Leu Ala Cys Gly Thr Ser 290 295 300 Tyr Asn Ser Gly Met Val Ser Arg Tyr Trp Phe Glu Ser Leu Ala Gly 305 310 315 320 Ile Pro Cys Asp Val Glu Ile Ala Ser Glu Phe Arg Tyr Arg Lys Ser 325 330 335 Ala Val Arg Arg Asn Ser Leu Met Ile Thr Leu Ser Gln Ser Gly Glu 340 345 350 Thr Ala Asp Thr Leu Ala Gly Leu Arg Leu Ser Lys Glu Leu Gly Tyr 355 360 365 Leu Gly Ser Leu Ala Ile Cys Asn Val Pro Gly Ser Ser Leu Val Arg 370 375 380 Glu Ser Asp Leu Ala Leu Met Thr Asn Ala Gly Thr Glu Ile Gly Val 385 390 395 400 Ala Ser Thr Lys Ala Phe Thr Thr Gln Leu Thr Val Leu Leu Met Leu 405 410 415 Val Ala Lys Leu Ser Arg Leu Lys Gly Leu Asp Ala Ser Ile Glu His 420 425 430 Asp Ile Val His Gly Leu Gln Ala Leu Pro Ser Arg Ile Glu Gln Met 435 440 445 Leu Ser Gln Asp Lys Arg Ile Glu Ala Leu Ala Glu Asp Phe Ser Asp 450 455 460 Lys His His Ala Leu Phe Leu Ser Arg Gly Asp Gln Tyr Pro Ile Ala 465 470 475 480 Leu Glu Gly Ala Leu Lys Leu Lys Glu Ile Ser Tyr Ile His Ala Glu 485 490 495 Ala Tyr Ala Ala Gly Glu Leu Lys His Gly Pro Leu Ala Leu Ile Asp 500 505 510 Ala Asp Met Pro Val Ile Val Val Ala Pro Asn Asn Glu Leu Leu Glu 515 520 525 Lys Leu Lys Ser Asn Ile Glu Glu Val Arg Ala Arg Gly Gly Gln Leu 530 535 540 Tyr Val Phe Ala Asp Gln Asp Ala Gly Phe Val Ser Ser Asp Asn Met 545 550 555 560 His Ile Ile Glu Met Pro His Val Glu Glu Val Ile Ala Pro Ile Phe 565 570 575 Tyr Thr Val Pro Leu Gln Leu Leu Ala Tyr His Val Ala Leu Ile Lys 580 585 590 Gly Thr Asp Val Asp Gln Pro Arg Asn Leu Ala Lys Ser Val Thr Val 595 600 605 Glu <210> 26 <211> 338 <212> PRT <213> Escherichia coli K12 MG1655 <400> 26 Met Arg Val Leu Val Thr Gly Gly Ser Gly Tyr Ile Gly Ser His Thr 1 5 10 15 Cys Val Gln Leu Leu Gln Asn Gly His Asp Val Ile Ile Leu Asp Asn 20 25 30 Leu Cys Asn Ser Lys Arg Ser Val Leu Pro Val Ile Glu Arg Leu Gly 35 40 45 Gly Lys His Pro Thr Phe Val Glu Gly Asp Ile Arg Asn Glu Ala Leu 50 55 60 Met Thr Glu Ile Leu His Asp His Ala Ile Asp Thr Val Ile His Phe 65 70 75 80 Ala Gly Leu Lys Ala Val Gly Glu Ser Val Gln Lys Pro Leu Glu Tyr 85 90 95 Tyr Asp Asn Asn Val Asn Gly Thr Leu Arg Leu Ile Ser Ala Met Arg 100 105 110 Ala Ala Asn Val Lys Asn Phe Ile Phe Ser Ser Ser Ala Thr Val Tyr 115 120 125 Gly Asp Gln Pro Lys Ile Pro Tyr Val Glu Ser Phe Pro Thr Gly Thr 130 135 140 Pro Gln Ser Pro Tyr Gly Lys Ser Lys Leu Met Val Glu Gln Ile Leu 145 150 155 160 Thr Asp Leu Gln Lys Ala Gln Pro Asp Trp Ser Ile Ala Leu Leu Arg 165 170 175 Tyr Phe Asn Pro Val Gly Ala His Pro Ser Gly Asp Met Gly Glu Asp 180 185 190 Pro Gln Gly Ile Pro Asn Asn Leu Met Pro Tyr Ile Ala Gln Val Ala 195 200 205 Val Gly Arg Arg Asp Ser Leu Ala Ile Phe Gly Asn Asp Tyr Pro Thr 210 215 220 Glu Asp Gly Thr Gly Val Arg Asp Tyr Ile His Val Met Asp Leu Ala 225 230 235 240 Asp Gly His Val Val Ala Met Glu Lys Leu Ala Asn Lys Pro Gly Val 245 250 255 His Ile Tyr Asn Leu Gly Ala Gly Val Gly Asn Ser Val Leu Asp Val 260 265 270 Val Asn Ala Phe Ser Lys Ala Cys Gly Lys Pro Val Asn Tyr His Phe 275 280 285 Ala Pro Arg Arg Glu Gly Asp Leu Pro Ala Tyr Trp Ala Asp Ala Ser 290 295 300 Lys Ala Asp Arg Glu Leu Asn Trp Arg Val Thr Arg Thr Leu Asp Glu 305 310 315 320 Met Ala Gln Asp Thr Trp His Trp Gln Ser Arg His Pro Gln Gly Tyr 325 330 335 Pro Asp <210> 27 <211> 445 <212> PRT <213> Escherichia coli K12 MG1655 <400> 27 Met Ser Asn Arg Lys Tyr Phe Gly Thr Asp Gly Ile Arg Gly Arg Val 1 5 10 15 Gly Asp Ala Pro Ile Thr Pro Asp Phe Val Leu Lys Leu Gly Trp Ala 20 25 30 Ala Gly Lys Val Leu Ala Arg His Gly Ser Arg Lys Ile Ile Ile Gly 35 40 45 Lys Asp Thr Arg Ile Ser Gly Tyr Met Leu Glu Ser Ala Leu Glu Ala 50 55 60 Gly Leu Ala Ala Ala Gly Leu Ser Ala Leu Phe Thr Gly Pro Met Pro 65 70 75 80 Thr Pro Ala Val Ala Tyr Leu Thr Arg Thr Phe Arg Ala Glu Ala Gly 85 90 95 Ile Val Ile Ser Ala Ser His Asn Pro Phe Tyr Asp Asn Gly Ile Lys 100 105 110 Phe Phe Ser Ile Asp Gly Thr Lys Leu Pro Asp Ala Val Glu Glu Ala 115 120 125 Ile Glu Ala Glu Met Glu Lys Glu Ile Ser Cys Val Asp Ser Ala Glu 130 135 140 Leu Gly Lys Ala Ser Arg Ile Val Asp Ala Ala Gly Arg Tyr Ile Glu 145 150 155 160 Phe Cys Lys Ala Thr Phe Pro Asn Glu Leu Ser Leu Ser Glu Leu Lys 165 170 175 Ile Val Val Asp Cys Ala Asn Gly Ala Thr Tyr His Ile Ala Pro Asn 180 185 190 Val Leu Arg Glu Leu Gly Ala Asn Val Ile Ala Ile Gly Cys Glu Pro 195 200 205 Asn Gly Val Asn Ile Asn Ala Glu Val Gly Ala Thr Asp Val Arg Ala 210 215 220 Leu Gln Ala Arg Val Leu Ala Glu Lys Ala Asp Leu Gly Ile Ala Phe 225 230 235 240 Asp Gly Asp Gly Asp Arg Val Ile Met Val Asp His Glu Gly Asn Lys 245 250 255 Val Asp Gly Asp Gln Ile Met Tyr Ile Ile Ala Arg Glu Gly Leu Arg 260 265 270 Gln Gly Gln Leu Arg Gly Gly Ala Val Gly Thr Leu Met Ser Asn Met 275 280 285 Gly Leu Glu Leu Ala Leu Lys Gln Leu Gly Ile Pro Phe Ala Arg Ala 290 295 300 Lys Val Gly Asp Arg Tyr Val Leu Glu Lys Met Gln Glu Lys Gly Trp 305 310 315 320 Arg Ile Gly Ala Glu Asn Ser Gly His Val Ile Leu Leu Asp Lys Thr 325 330 335 Thr Thr Gly Asp Gly Ile Val Ala Gly Leu Gln Val Leu Ala Ala Met 340 345 350 Ala Arg Asn His Met Ser Leu His Asp Leu Cys Ser Gly Met Lys Met 355 360 365 Phe Pro Gln Ile Leu Val Asn Val Arg Tyr Thr Ala Gly Ser Gly Asp 370 375 380 Pro Leu Glu His Glu Ser Val Lys Ala Val Thr Ala Glu Val Glu Ala 385 390 395 400 Ala Leu Gly Asn Arg Gly Arg Val Leu Leu Arg Lys Ser Gly Thr Glu 405 410 415 Pro Leu Ile Arg Val Met Val Glu Gly Glu Asp Glu Ala Gln Val Thr 420 425 430 Glu Phe Ala His Arg Ile Ala Asp Ala Val Lys Ala Val 435 440 445 <210> 28 <211> 456 <212> PRT <213> Escherichia coli K12 MG1655 <400> 28 Met Leu Asn Asn Ala Met Ser Val Val Ile Leu Ala Ala Gly Lys Gly 1 5 10 15 Thr Arg Met Tyr Ser Asp Leu Pro Lys Val Leu His Thr Leu Ala Gly 20 25 30 Lys Ala Met Val Gln His Val Ile Asp Ala Ala Asn Glu Leu Gly Ala 35 40 45 Ala His Val His Leu Val Tyr Gly His Gly Gly Asp Leu Leu Lys Gln 50 55 60 Ala Leu Lys Asp Asp Asn Leu Asn Trp Val Leu Gln Ala Glu Gln Leu 65 70 75 80 Gly Thr Gly His Ala Met Gln Gln Ala Ala Pro Phe Phe Ala Asp Asp 85 90 95 Glu Asp Ile Leu Met Leu Tyr Gly Asp Val Pro Leu Ile Ser Val Glu 100 105 110 Thr Leu Gln Arg Leu Arg Asp Ala Lys Pro Gln Gly Gly Ile Gly Leu 115 120 125 Leu Thr Val Lys Leu Asp Asp Pro Thr Gly Tyr Gly Arg Ile Thr Arg 130 135 140 Glu Asn Gly Lys Val Thr Gly Ile Val Glu His Lys Asp Ala Thr Asp 145 150 155 160 Glu Gln Arg Gln Ile Gln Glu Ile Asn Thr Gly Ile Leu Ile Ala Asn 165 170 175 Gly Ala Asp Met Lys Arg Trp Leu Ala Lys Leu Thr Asn Asn Asn Ala 180 185 190 Gln Gly Glu Tyr Tyr Ile Thr Asp Ile Ile Ala Leu Ala Tyr Gln Glu 195 200 205 Gly Arg Glu Ile Val Ala Val His Pro Gln Arg Leu Ser Glu Val Glu 210 215 220 Gly Val Asn Asn Arg Leu Gln Leu Ser Arg Leu Glu Arg Val Tyr Gln 225 230 235 240 Ser Glu Gln Ala Glu Lys Leu Leu Leu Ala Gly Val Met Leu Arg Asp 245 250 255 Pro Ala Arg Phe Asp Leu Arg Gly Thr Leu Thr His Gly Arg Asp Val 260 265 270 Glu Ile Asp Thr Asn Val Ile Ile Glu Gly Asn Val Thr Leu Gly His 275 280 285 Arg Val Lys Ile Gly Thr Gly Cys Val Ile Lys Asn Ser Val Ile Gly 290 295 300 Asp Asp Cys Glu Ile Ser Pro Tyr Thr Val Val Glu Asp Ala Asn Leu 305 310 315 320 Ala Ala Ala Cys Thr Ile Gly Pro Phe Ala Arg Leu Arg Pro Gly Ala 325 330 335 Glu Leu Leu Glu Gly Ala His Val Gly Asn Phe Val Glu Met Lys Lys 340 345 350 Ala Arg Leu Gly Lys Gly Ser Lys Ala Gly His Leu Thr Tyr Leu Gly 355 360 365 Asp Ala Glu Ile Gly Asp Asn Val Asn Ile Gly Ala Gly Thr Ile Thr 370 375 380 Cys Asn Tyr Asp Gly Ala Asn Lys Phe Lys Thr Ile Ile Gly Asp Asp 385 390 395 400 Val Phe Val Gly Ser Asp Thr Gln Leu Val Ala Pro Val Thr Val Gly 405 410 415 Lys Gly Ala Thr Ile Ala Ala Gly Thr Thr Val Thr Arg Asn Val Gly 420 425 430 Glu Asn Ala Leu Ala Ile Ser Arg Val Pro Gln Thr Gln Lys Glu Gly 435 440 445 Trp Arg Arg Pro Val Lys Lys Lys 450 455 <210> 29 <211> 299 <212> PRT <213> Helicobacter pylori UA1234 <400> 29 Met Ala Phe Lys Val Val Gln Ile Cys Gly Gly Leu Gly Asn Gln Met 1 5 10 15 Phe Gln Tyr Ala Phe Ala Lys Ser Leu Gln Lys His Ser Asn Thr Pro 20 25 30 Val Leu Leu Asp Ile Thr Ser Phe Asp Trp Ser Asn Arg Lys Met Gln 35 40 45 Leu Glu Leu Phe Pro Ile Asp Leu Pro Tyr Ala Ser Glu Lys Glu Ile 50 55 60 Ala Ile Ala Lys Met Gln His Leu Pro Lys Leu Val Arg Asn Val Leu 65 70 75 80 Lys Cys Met Gly Phe Asp Arg Val Ser Gln Glu Ile Val Phe Glu Tyr 85 90 95 Glu Pro Lys Leu Leu Lys Thr Ser Arg Leu Thr Tyr Phe Tyr Gly Tyr 100 105 110 Phe Gln Asp Pro Arg Tyr Phe Asp Ala Ile Ser Pro Leu Ile Lys Gln 115 120 125 Thr Phe Thr Leu Pro Pro Pro Pro Glu Asn Gly Asn Asn Lys Lys Lys 130 135 140 Glu Glu Glu Tyr His Arg Lys Leu Ala Leu Ile Leu Ala Ala Lys Asn 145 150 155 160 Ser Val Phe Val His Ile Arg Arg Gly Asp Tyr Val Gly Ile Gly Cys 165 170 175 Gln Leu Gly Ile Asp Tyr Gln Lys Lys Ala Leu Glu Tyr Met Ala Lys 180 185 190 Arg Val Pro Asn Met Glu Leu Phe Val Phe Cys Glu Asp Leu Glu Phe 195 200 205 Thr Gln Asn Leu Asp Leu Gly Tyr Pro Phe Met Asp Met Thr Thr Arg 210 215 220 Asp Lys Glu Glu Glu Ala Tyr Trp Asp Met Leu Leu Met Gln Ser Cys 225 230 235 240 Lys His Gly Ile Ile Ala Asn Ser Thr Tyr Ser Trp Trp Ala Ala Tyr 245 250 255 Leu Ile Asn Asn Pro Glu Lys Ile Ile Ile Gly Pro Lys His Trp Leu 260 265 270 Phe Gly His Glu Asn Ile Leu Cys Lys Glu Trp Val Lys Ile Glu Ser 275 280 285 His Phe Glu Val Lys Ser Gln Lys Tyr Asn Ala 290 295 <210> 30 <211> 478 <212> PRT <213> Helicobacter pylori UA1234 <400> 30 Met Phe Gln Pro Leu Leu Asp Ala Tyr Val Glu Ser Ala Ser Ile Glu 1 5 10 15 Lys Met Ala Ser Lys Ser Pro Pro Pro Leu Lys Ile Ala Val Ala Asn 20 25 30 Trp Trp Gly Asp Glu Glu Ile Lys Glu Phe Lys Asn Ser Val Leu Tyr 35 40 45 Phe Ile Leu Ser Gln Arg Tyr Thr Ile Thr Leu His Gln Asn Pro Asn 50 55 60 Glu Phe Ser Asp Leu Val Phe Gly Asn Pro Leu Gly Ser Ala Arg Lys 65 70 75 80 Ile Leu Ser Tyr Gln Asn Ala Lys Arg Val Phe Tyr Thr Gly Glu Asn 85 90 95 Glu Ser Pro Asn Phe Asn Leu Phe Asp Tyr Ala Ile Gly Phe Asp Glu 100 105 110 Leu Asp Phe Asn Asp Arg Tyr Leu Arg Met Pro Leu Tyr Tyr Asp Arg 115 120 125 Leu His His Lys Ala Glu Ser Val Asn Asp Thr Thr Ala Pro Tyr Lys 130 135 140 Leu Lys Asp Asn Ser Leu Tyr Ala Leu Lys Lys Pro Ser His Cys Phe 145 150 155 160 Lys Glu Lys His Pro Asn Leu Cys Ala Val Val Asn Asp Glu Ser Asp 165 170 175 Pro Leu Lys Arg Gly Phe Ala Ser Phe Val Ala Ser Asn Pro Asn Ala 180 185 190 Pro Ile Arg Asn Ala Phe Tyr Asp Ala Leu Asn Ser Ile Glu Pro Val 195 200 205 Thr Gly Gly Gly Ser Val Arg Asn Thr Leu Gly Tyr Asn Val Lys Asn 210 215 220 Lys Asn Glu Phe Leu Ser Gln Tyr Lys Phe Asn Leu Cys Phe Glu Asn 225 230 235 240 Thr Gln Gly Tyr Gly Tyr Val Thr Glu Lys Ile Ile Asp Ala Tyr Phe 245 250 255 Ser His Thr Ile Pro Ile Tyr Trp Gly Ser Pro Ser Val Ala Lys Asp 260 265 270 Phe Asn Pro Lys Ser Phe Val Asn Val His Asp Phe Lys Asn Phe Asp 275 280 285 Glu Ala Ile Asp Tyr Ile Lys Tyr Leu His Thr His Lys Asn Ala Tyr 290 295 300 Leu Asp Met Leu Tyr Glu Asn Pro Leu Asn Thr Leu Asp Gly Lys Ala 305 310 315 320 Tyr Phe Tyr Gln Asn Leu Ser Phe Lys Lys Ile Leu Ala Phe Phe Lys 325 330 335 Thr Ile Leu Glu Asn Asp Thr Ile Tyr His Asp Asn Pro Phe Ile Phe 340 345 350 Cys Arg Asp Leu Asn Glu Pro Leu Val Thr Ile Asp Asp Leu Arg Val 355 360 365 Asn Tyr Asp Asp Leu Arg Val Asn Tyr Asp Asp Leu Arg Ile Asn Tyr 370 375 380 Asp Asp Leu Arg Val Asn Tyr Asp Asp Leu Arg Ile Asn Tyr Asp Asp 385 390 395 400 Leu Arg Val Asn Tyr Asp Asp Leu Arg Val Asn Tyr Asp Asp Leu Arg 405 410 415 Ile Asn Tyr Asp Asp Leu Arg Val Asn Tyr Asp Asp Leu Arg Val Asn 420 425 430 Tyr Glu Arg Leu Leu Ser Lys Ala Thr Pro Leu Leu Glu Leu Ser Gln 435 440 445 Asn Thr Thr Ser Lys Ile Tyr Arg Lys Ala Tyr Gln Lys Ser Leu Pro 450 455 460 Leu Leu Arg Ala Ile Arg Arg Trp Val Lys Lys Leu Gly Leu 465 470 475 <210> 31 <211> 264 <212> PRT <213> Escherichia coli K12 MG1655 <400> 31 Met Lys Gln Tyr Leu Glu Leu Met Gln Lys Val Leu Asp Glu Gly Thr 1 5 10 15 Gln Lys Asn Asp Arg Thr Gly Thr Gly Thr Leu Ser Ile Phe Gly His 20 25 30 Gln Met Arg Phe Asn Leu Gln Asp Gly Phe Pro Leu Val Thr Thr Lys 35 40 45 Arg Cys His Leu Arg Ser Ile Ile His Glu Leu Leu Trp Phe Leu Gln 50 55 60 Gly Asp Thr Asn Ile Ala Tyr Leu His Glu Asn Asn Val Thr Ile Trp 65 70 75 80 Asp Glu Trp Ala Asp Glu Asn Gly Asp Leu Gly Pro Val Tyr Gly Lys 85 90 95 Gln Trp Arg Ala Trp Pro Thr Pro Asp Gly Arg His Ile Asp Gln Ile 100 105 110 Thr Thr Val Leu Asn Gln Leu Lys Asn Asp Pro Asp Ser Arg Arg Ile 115 120 125 Ile Val Ser Ala Trp Asn Val Gly Glu Leu Asp Lys Met Ala Leu Ala 130 135 140 Pro Cys His Ala Phe Phe Gln Phe Tyr Val Ala Asp Gly Lys Leu Ser 145 150 155 160 Cys Gln Leu Tyr Gln Arg Ser Cys Asp Val Phe Leu Gly Leu Pro Phe 165 170 175 Asn Ile Ala Ser Tyr Ala Leu Leu Val His Met Met Ala Gln Gln Cys 180 185 190 Asp Leu Glu Val Gly Asp Phe Val Trp Thr Gly Gly Asp Thr His Leu 195 200 205 Tyr Ser Asn His Met Asp Gln Thr His Leu Gln Leu Ser Arg Glu Pro 210 215 220 Arg Pro Leu Pro Lys Leu Ile Ile Lys Arg Lys Pro Glu Ser Ile Phe 225 230 235 240 Asp Tyr Arg Phe Glu Asp Phe Glu Ile Glu Gly Tyr Asp Pro His Pro 245 250 255 Gly Ile Lys Ala Pro Val Ala Ile 260 <210> 32 <211> 391 <212> PRT <213> Escherichia coli K12 MG1655 <400> 32 Met Gln Lys Leu Ile Asn Ser Val Gln Asn Tyr Ala Trp Gly Ser Lys 1 5 10 15 Thr Ala Leu Thr Glu Leu Tyr Gly Met Glu Asn Pro Ser Ser Gln Pro 20 25 30 Met Ala Glu Leu Trp Met Gly Ala His Pro Lys Ser Ser Ser Arg Val 35 40 45 Gln Asn Ala Ala Gly Asp Ile Val Ser Leu Arg Asp Val Ile Glu Ser 50 55 60 Asp Lys Ser Thr Leu Leu Gly Glu Ala Val Ala Lys Arg Phe Gly Glu 65 70 75 80 Leu Pro Phe Leu Phe Lys Val Leu Cys Ala Ala Gln Pro Leu Ser Ile 85 90 95 Gln Val His Pro Asn Lys His Asn Ser Glu Ile Gly Phe Ala Lys Glu 100 105 110 Asn Ala Ala Gly Ile Pro Met Asp Ala Ala Glu Arg Asn Tyr Lys Asp 115 120 125 Pro Asn His Lys Pro Glu Leu Val Phe Ala Leu Thr Pro Phe Leu Ala 130 135 140 Met Asn Ala Phe Arg Glu Phe Ser Glu Ile Val Ser Leu Leu Gln Pro 145 150 155 160 Val Ala Gly Ala His Pro Ala Ile Ala His Phe Leu Gln Gln Pro Asp 165 170 175 Ala Glu Arg Leu Ser Glu Leu Phe Ala Ser Leu Leu Asn Met Gln Gly 180 185 190 Glu Glu Lys Ser Arg Ala Leu Ala Ile Leu Lys Ser Ala Leu Asp Ser 195 200 205 Gln Gln Gly Glu Pro Trp Gln Thr Ile Arg Leu Ile Ser Glu Phe Tyr 210 215 220 Pro Glu Asp Ser Gly Leu Phe Ser Pro Leu Leu Leu Asn Val Val Lys 225 230 235 240 Leu Asn Pro Gly Glu Ala Met Phe Leu Phe Ala Glu Thr Pro His Ala 245 250 255 Tyr Leu Gln Gly Val Ala Leu Glu Val Met Ala Asn Ser Asp Asn Val 260 265 270 Leu Arg Ala Gly Leu Thr Pro Lys Tyr Ile Asp Ile Pro Glu Leu Val 275 280 285 Ala Asn Val Lys Phe Glu Ala Lys Pro Ala Asn Gln Leu Leu Thr Gln 290 295 300 Pro Val Lys Gln Gly Ala Glu Leu Asp Phe Pro Ile Pro Val Asp Asp 305 310 315 320 Phe Ala Phe Ser Leu His Asp Leu Ser Asp Lys Glu Thr Thr Ile Ser 325 330 335 Gln Gln Ser Ala Ala Ile Leu Phe Cys Val Glu Gly Asp Ala Thr Leu 340 345 350 Trp Lys Gly Ser Gln Gln Leu Gln Leu Lys Pro Gly Glu Ser Ala Phe 355 360 365 Ile Ala Ala Asn Glu Ser Pro Val Thr Val Lys Gly His Gly Arg Leu 370 375 380 Ala Arg Val Tyr Asn Lys Leu 385 390 <210> 33 <211> 456 <212> PRT <213> Escherichia coli K12 MG1655 <400> 33 Met Lys Lys Leu Thr Cys Phe Lys Ala Tyr Asp Ile Arg Gly Lys Leu 1 5 10 15 Gly Glu Glu Leu Asn Glu Asp Ile Ala Trp Arg Ile Gly Arg Ala Tyr 20 25 30 Gly Glu Phe Leu Lys Pro Lys Thr Ile Val Leu Gly Gly Asp Val Arg 35 40 45 Leu Thr Ser Glu Thr Leu Lys Leu Ala Leu Ala Lys Gly Leu Gln Asp 50 55 60 Ala Gly Val Asp Val Leu Asp Ile Gly Met Ser Gly Thr Glu Glu Ile 65 70 75 80 Tyr Phe Ala Thr Phe His Leu Gly Val Asp Gly Gly Ile Glu Val Thr 85 90 95 Ala Ser His Asn Pro Met Asp Tyr Asn Gly Met Lys Leu Val Arg Glu 100 105 110 Gly Ala Arg Pro Ile Ser Gly Asp Thr Gly Leu Arg Asp Val Gln Arg 115 120 125 Leu Ala Glu Ala Asn Asp Phe Pro Pro Val Asp Glu Thr Lys Arg Gly 130 135 140 Arg Tyr Gln Gln Ile Asn Leu Arg Asp Ala Tyr Val Asp His Leu Phe 145 150 155 160 Gly Tyr Ile Asn Val Lys Asn Leu Thr Pro Leu Lys Leu Val Ile Asn 165 170 175 Ser Gly Asn Gly Ala Ala Gly Pro Val Val Asp Ala Ile Glu Ala Arg 180 185 190 Phe Lys Ala Leu Gly Ala Pro Val Glu Leu Ile Lys Val His Asn Thr 195 200 205 Pro Asp Gly Asn Phe Pro Asn Gly Ile Pro Asn Pro Leu Leu Pro Glu 210 215 220 Cys Arg Asp Asp Thr Arg Asn Ala Val Ile Lys His Gly Ala Asp Met 225 230 235 240 Gly Ile Ala Phe Asp Gly Asp Phe Asp Arg Cys Phe Leu Phe Asp Glu 245 250 255 Lys Gly Gln Phe Ile Glu Gly Tyr Tyr Ile Val Gly Leu Leu Ala Glu 260 265 270 Ala Phe Leu Glu Lys Asn Pro Gly Ala Lys Ile Ile His Asp Pro Arg 275 280 285 Leu Ser Trp Asn Thr Val Asp Val Val Thr Ala Ala Gly Gly Thr Pro 290 295 300 Val Met Ser Lys Thr Gly His Ala Phe Ile Lys Glu Arg Met Arg Lys 305 310 315 320 Glu Asp Ala Ile Tyr Gly Gly Glu Met Ser Ala His His Tyr Phe Arg 325 330 335 Asp Phe Ala Tyr Cys Asp Ser Gly Met Ile Pro Trp Leu Leu Val Ala 340 345 350 Glu Leu Val Cys Leu Lys Asp Lys Thr Leu Gly Glu Leu Val Arg Asp 355 360 365 Arg Met Ala Ala Phe Pro Ala Ser Gly Glu Ile Asn Ser Lys Leu Ala 370 375 380 Gln Pro Val Glu Ala Ile Asn Arg Val Glu Gln His Phe Ser Arg Glu 385 390 395 400 Ala Leu Ala Val Asp Arg Thr Asp Gly Ile Ser Met Thr Phe Ala Asp 405 410 415 Trp Arg Phe Asn Leu Arg Thr Ser Asn Thr Glu Pro Val Val Arg Leu 420 425 430 Asn Val Glu Ser Arg Gly Asp Val Pro Leu Met Glu Ala Arg Thr Arg 435 440 445 Thr Leu Leu Thr Leu Leu Asn Glu 450 455 <210> 34 <211> 478 <212> PRT <213> Escherichia coli K12 MG1655 <400> 34 Met Ala Gln Ser Lys Leu Tyr Pro Val Val Met Ala Gly Gly Ser Gly 1 5 10 15 Ser Arg Leu Trp Pro Leu Ser Arg Val Leu Tyr Pro Lys Gln Phe Leu 20 25 30 Cys Leu Lys Gly Asp Leu Thr Met Leu Gln Thr Thr Ile Cys Arg Leu 35 40 45 Asn Gly Val Glu Cys Glu Ser Pro Val Val Ile Cys Asn Glu Gln His 50 55 60 Arg Phe Ile Val Ala Glu Gln Leu Arg Gln Leu Asn Lys Leu Thr Glu 65 70 75 80 Asn Ile Ile Leu Glu Pro Ala Gly Arg Asn Thr Ala Pro Ala Ile Ala 85 90 95 Leu Ala Ala Leu Ala Ala Lys Arg His Ser Pro Glu Ser Asp Pro Leu 100 105 110 Met Leu Val Leu Ala Ala Asp His Val Ile Ala Asp Glu Asp Ala Phe 115 120 125 Arg Ala Ala Val Arg Asn Ala Met Pro Tyr Ala Glu Ala Gly Lys Leu 130 135 140 Val Thr Phe Gly Ile Val Pro Asp Leu Pro Glu Thr Gly Tyr Gly Tyr 145 150 155 160 Ile Arg Arg Gly Glu Val Ser Ala Gly Glu Gln Asp Met Val Ala Phe 165 170 175 Glu Val Ala Gln Phe Val Glu Lys Pro Asn Leu Glu Thr Ala Gln Ala 180 185 190 Tyr Val Ala Ser Gly Glu Tyr Tyr Trp Asn Ser Gly Met Phe Leu Phe 195 200 205 Arg Ala Gly Arg Tyr Leu Glu Glu Leu Lys Lys Tyr Arg Pro Asp Ile 210 215 220 Leu Asp Ala Cys Glu Lys Ala Met Ser Ala Val Asp Pro Asp Leu Asn 225 230 235 240 Phe Ile Arg Val Asp Glu Glu Ala Phe Leu Ala Cys Pro Glu Glu Ser 245 250 255 Val Asp Tyr Ala Val Met Glu Arg Thr Ala Asp Ala Val Val Val Pro 260 265 270 Met Asp Ala Gly Trp Ser Asp Val Gly Ser Trp Ser Ser Leu Trp Glu 275 280 285 Ile Ser Ala His Thr Ala Glu Gly Asn Val Cys His Gly Asp Val Ile 290 295 300 Asn His Lys Thr Glu Asn Ser Tyr Val Tyr Ala Glu Ser Gly Leu Val 305 310 315 320 Thr Thr Val Gly Val Lys Asp Leu Val Val Val Gln Thr Lys Asp Ala 325 330 335 Val Leu Ile Ala Asp Arg Asn Ala Val Gln Asp Val Lys Lys Val Val 340 345 350 Glu Gln Ile Lys Ala Asp Gly Arg His Glu His Arg Val His Arg Glu 355 360 365 Val Tyr Arg Pro Trp Gly Lys Tyr Asp Ser Ile Asp Ala Gly Asp Arg 370 375 380 Tyr Gln Val Lys Arg Ile Thr Val Lys Pro Gly Glu Gly Leu Ser Val 385 390 395 400 Gln Met His His His Arg Ala Glu His Trp Val Val Val Ala Gly Thr 405 410 415 Ala Lys Val Thr Ile Asp Gly Asp Ile Lys Leu Leu Gly Glu Asn Glu 420 425 430 Ser Ile Tyr Ile Pro Leu Gly Ala Thr His Cys Leu Glu Asn Pro Gly 435 440 445 Lys Ile Pro Leu Asp Leu Ile Glu Val Arg Ser Gly Ser Tyr Leu Glu 450 455 460 Glu Asp Asp Val Val Arg Phe Ala Asp Arg Tyr Gly Arg Val 465 470 475 <210> 35 <211> 373 <212> PRT <213> Escherichia coli K12 MG1655 <400> 35 Met Ser Lys Val Ala Leu Ile Thr Gly Val Thr Gly Gln Asp Gly Ser 1 5 10 15 Tyr Leu Ala Glu Phe Leu Leu Glu Lys Gly Tyr Glu Val His Gly Ile 20 25 30 Lys Arg Arg Ala Ser Ser Phe Asn Thr Glu Arg Val Asp His Ile Tyr 35 40 45 Gln Asp Pro His Thr Cys Asn Pro Lys Phe His Leu His Tyr Gly Asp 50 55 60 Leu Ser Asp Thr Ser Asn Leu Thr Arg Ile Leu Arg Glu Val Gln Pro 65 70 75 80 Asp Glu Val Tyr Asn Leu Gly Ala Met Ser His Val Ala Val Ser Phe 85 90 95 Glu Ser Pro Glu Tyr Thr Ala Asp Val Asp Ala Met Gly Thr Leu Arg 100 105 110 Leu Leu Glu Ala Ile Arg Phe Leu Gly Leu Glu Lys Lys Thr Arg Phe 115 120 125 Tyr Gln Ala Ser Thr Ser Glu Leu Tyr Gly Leu Val Gln Glu Ile Pro 130 135 140 Gln Lys Glu Thr Thr Pro Phe Tyr Pro Arg Ser Pro Tyr Ala Val Ala 145 150 155 160 Lys Leu Tyr Ala Tyr Trp Ile Thr Val Asn Tyr Arg Glu Ser Tyr Gly 165 170 175 Met Tyr Ala Cys Asn Gly Ile Leu Phe Asn His Glu Ser Pro Arg Arg 180 185 190 Gly Glu Thr Phe Val Thr Arg Lys Ile Thr Arg Ala Ile Ala Asn Ile 195 200 205 Ala Gln Gly Leu Glu Ser Cys Leu Tyr Leu Gly Asn Met Asp Ser Leu 210 215 220 Arg Asp Trp Gly His Ala Lys Asp Tyr Val Lys Met Gln Trp Met Met 225 230 235 240 Leu Gln Gln Glu Gln Pro Glu Asp Phe Val Ile Ala Thr Gly Val Gln 245 250 255 Tyr Ser Val Arg Gln Phe Val Glu Met Ala Ala Ala Gln Leu Gly Ile 260 265 270 Lys Leu Arg Phe Glu Gly Thr Gly Val Glu Glu Lys Gly Ile Val Val 275 280 285 Ser Val Thr Gly His Asp Ala Pro Gly Val Lys Pro Gly Asp Val Ile 290 295 300 Ile Ala Val Asp Pro Arg Tyr Phe Arg Pro Ala Glu Val Glu Thr Leu 305 310 315 320 Leu Gly Asp Pro Thr Lys Ala His Glu Lys Leu Gly Trp Lys Pro Glu 325 330 335 Ile Thr Leu Arg Glu Met Val Ser Glu Met Val Ala Asn Asp Leu Glu 340 345 350 Ala Ala Lys Lys His Ser Leu Leu Lys Ser His Gly Tyr Asp Val Ala 355 360 365 Ile Ala Leu Glu Ser 370 <210> 36 <211> 321 <212> PRT <213> Escherichia coli K12 MG1655 <400> 36 Met Ser Lys Gln Arg Val Phe Ile Ala Gly His Arg Gly Met Val Gly 1 5 10 15 Ser Ala Ile Arg Arg Gln Leu Glu Gln Arg Gly Asp Val Glu Leu Val 20 25 30 Leu Arg Thr Arg Asp Glu Leu Asn Leu Leu Asp Ser Arg Ala Val His 35 40 45 Asp Phe Phe Ala Ser Glu Arg Ile Asp Gln Val Tyr Leu Ala Ala Ala 50 55 60 Lys Val Gly Gly Ile Val Ala Asn Asn Thr Tyr Pro Ala Asp Phe Ile 65 70 75 80 Tyr Gln Asn Met Met Ile Glu Ser Asn Ile Ile His Ala Ala His Gln 85 90 95 Asn Asp Val Asn Lys Leu Leu Phe Leu Gly Ser Ser Cys Ile Tyr Pro 100 105 110 Lys Leu Ala Lys Gln Pro Met Ala Glu Ser Glu Leu Leu Gln Gly Thr 115 120 125 Leu Glu Pro Thr Asn Glu Pro Tyr Ala Ile Ala Lys Ile Ala Gly Ile 130 135 140 Lys Leu Cys Glu Ser Tyr Asn Arg Gln Tyr Gly Arg Asp Tyr Arg Ser 145 150 155 160 Val Met Pro Thr Asn Leu Tyr Gly Pro His Asp Asn Phe His Pro Ser 165 170 175 Asn Ser His Val Ile Pro Ala Leu Leu Arg Arg Phe His Glu Ala Thr 180 185 190 Ala Gln Asn Ala Pro Asp Val Val Val Trp Gly Ser Gly Thr Pro Met 195 200 205 Arg Glu Phe Leu His Val Asp Asp Met Ala Ala Ala Ser Ile His Val 210 215 220 Met Glu Leu Ala His Glu Val Trp Leu Glu Asn Thr Gln Pro Met Leu 225 230 235 240 Ser His Ile Asn Val Gly Thr Gly Val Asp Cys Thr Ile Arg Glu Leu 245 250 255 Ala Gln Thr Ile Ala Lys Val Val Gly Tyr Lys Gly Arg Val Val Phe 260 265 270 Asp Ala Ser Lys Pro Asp Gly Thr Pro Arg Lys Leu Leu Asp Val Thr 275 280 285 Arg Leu His Gln Leu Gly Trp Tyr His Glu Ile Ser Leu Glu Ala Gly 290 295 300 Leu Ala Ser Thr Tyr Gln Trp Phe Leu Glu Asn Gln Asp Arg Phe Arg 305 310 315 320 Gly <210> 37 <211> 438 <212> PRT <213> Escherichia coli K12 MG1655 <400> 37 Met Gly Asn Thr Ser Ile Gln Thr Gln Ser Tyr Arg Ala Val Asp Lys 1 5 10 15 Asp Ala Gly Gln Ser Arg Ser Tyr Ile Ile Pro Phe Ala Leu Leu Cys 20 25 30 Ser Leu Phe Phe Leu Trp Ala Val Ala Asn Asn Leu Asn Asp Ile Leu 35 40 45 Leu Pro Gln Phe Gln Gln Ala Phe Thr Leu Thr Asn Phe Gln Ala Gly 50 55 60 Leu Ile Gln Ser Ala Phe Tyr Phe Gly Tyr Phe Ile Ile Pro Ile Pro 65 70 75 80 Ala Gly Ile Leu Met Lys Lys Leu Ser Tyr Lys Ala Gly Ile Ile Thr 85 90 95 Gly Leu Phe Leu Tyr Ala Leu Gly Ala Ala Leu Phe Trp Pro Ala Ala 100 105 110 Glu Ile Met Asn Tyr Thr Leu Phe Leu Val Gly Leu Phe Ile Ile Ala 115 120 125 Ala Gly Leu Gly Cys Leu Glu Thr Ala Ala Asn Pro Phe Val Thr Val 130 135 140 Leu Gly Pro Glu Ser Ser Gly His Phe Arg Leu Asn Leu Ala Gln Thr 145 150 155 160 Phe Asn Ser Phe Gly Ala Ile Ile Ala Val Val Phe Gly Gln Ser Leu 165 170 175 Ile Leu Ser Asn Val Pro His Gln Ser Gln Asp Val Leu Asp Lys Met 180 185 190 Ser Pro Glu Gln Leu Ser Ala Tyr Lys His Ser Leu Val Leu Ser Val 195 200 205 Gln Thr Pro Tyr Met Ile Ile Val Ala Ile Val Leu Leu Val Ala Leu 210 215 220 Leu Ile Met Leu Thr Lys Phe Pro Ala Leu Gln Ser Asp Asn His Ser 225 230 235 240 Asp Ala Lys Gln Gly Ser Phe Ser Ala Ser Leu Ser Arg Leu Ala Arg 245 250 255 Ile Arg His Trp Arg Trp Ala Val Leu Ala Gln Phe Cys Tyr Val Gly 260 265 270 Ala Gln Thr Ala Cys Trp Ser Tyr Leu Ile Arg Tyr Ala Val Glu Glu 275 280 285 Ile Pro Gly Met Thr Ala Gly Phe Ala Ala Asn Tyr Leu Thr Gly Thr 290 295 300 Met Val Cys Phe Phe Ile Gly Arg Phe Thr Gly Thr Trp Leu Ile Ser 305 310 315 320 Arg Phe Ala Pro His Lys Val Leu Ala Ala Tyr Ala Leu Ile Ala Met 325 330 335 Ala Leu Cys Leu Ile Ser Ala Phe Ala Gly Gly His Val Gly Leu Ile 340 345 350 Ala Leu Thr Leu Cys Ser Ala Phe Met Ser Ile Gln Tyr Pro Thr Ile 355 360 365 Phe Ser Leu Gly Ile Lys Asn Leu Gly Gln Asp Thr Lys Tyr Gly Ser 370 375 380 Ser Phe Ile Val Met Thr Ile Ile Gly Gly Gly Ile Val Thr Pro Val 385 390 395 400 Met Gly Phe Val Ser Asp Ala Ala Gly Asn Ile Pro Thr Ala Glu Leu 405 410 415 Ile Pro Ala Leu Cys Phe Ala Val Ile Phe Ile Phe Ala Arg Phe Arg 420 425 430 Ser Gln Thr Ala Thr Asn 435 <210> 38 <211> 949 <212> PRT <213> Bacteroides fragilis NCTC 9343 <400> 38 Met Gln Lys Leu Leu Ser Leu Pro Ser Asn Leu Val Gln Ser Phe His 1 5 10 15 Glu Leu Glu Arg Val Asn Arg Thr Asp Trp Phe Cys Thr Ser Asp Pro 20 25 30 Val Gly Lys Lys Leu Gly Ser Gly Gly Gly Thr Ser Trp Leu Leu Glu 35 40 45 Glu Cys Tyr Asn Glu Tyr Ser Asp Gly Ala Thr Phe Gly Glu Trp Leu 50 55 60 Glu Lys Glu Lys Arg Ile Leu Leu His Ala Gly Gly Gln Ser Arg Arg 65 70 75 80 Leu Pro Gly Tyr Ala Pro Ser Gly Lys Ile Leu Thr Pro Val Pro Val 85 90 95 Phe Arg Trp Glu Arg Gly Gln His Leu Gly Gln Asn Leu Leu Ser Leu 100 105 110 Gln Leu Pro Leu Tyr Glu Lys Ile Met Ser Leu Ala Pro Asp Lys Leu 115 120 125 His Thr Leu Ile Ala Ser Gly Asp Val Tyr Ile Arg Ser Glu Lys Pro 130 135 140 Leu Gln Ser Ile Pro Glu Ala Asp Val Val Cys Tyr Gly Leu Trp Val 145 150 155 160 Asp Pro Ser Leu Ala Thr His His Gly Val Phe Ala Ser Asp Arg Lys 165 170 175 His Pro Glu Gln Leu Asp Phe Met Leu Gln Lys Pro Ser Leu Ala Glu 180 185 190 Leu Glu Ser Leu Ser Lys Thr His Leu Phe Leu Met Asp Ile Gly Ile 195 200 205 Trp Leu Leu Ser Asp Arg Ala Val Glu Ile Leu Met Lys Arg Ser His 210 215 220 Lys Glu Ser Ser Glu Glu Leu Lys Tyr Tyr Asp Leu Tyr Ser Asp Phe 225 230 235 240 Gly Leu Ala Leu Gly Thr His Pro Arg Ile Glu Asp Glu Glu Val Asn 245 250 255 Thr Leu Ser Val Ala Ile Leu Pro Leu Pro Gly Gly Glu Phe Tyr His 260 265 270 Tyr Gly Thr Ser Lys Glu Leu Ile Ser Ser Thr Leu Ser Val Gln Asn 275 280 285 Lys Val Tyr Asp Gln Arg Arg Ile Met His Arg Lys Val Lys Pro Asn 290 295 300 Pro Ala Met Phe Val Gln Asn Ala Val Val Arg Ile Pro Leu Cys Ala 305 310 315 320 Glu Asn Ala Asp Leu Trp Ile Glu Asn Ser His Ile Gly Pro Lys Trp 325 330 335 Lys Ile Ala Ser Arg His Ile Ile Thr Gly Val Pro Glu Asn Asp Trp 340 345 350 Ser Leu Ala Val Pro Ala Gly Val Cys Val Asp Val Val Pro Met Gly 355 360 365 Asp Lys Gly Phe Val Ala Arg Pro Tyr Gly Leu Asp Asp Val Phe Lys 370 375 380 Gly Asp Leu Arg Asp Ser Lys Thr Thr Leu Thr Gly Ile Pro Phe Gly 385 390 395 400 Glu Trp Met Ser Lys Arg Gly Leu Ser Tyr Thr Asp Leu Lys Gly Arg 405 410 415 Thr Asp Asp Leu Gln Ala Val Ser Val Phe Pro Met Val Asn Ser Val 420 425 430 Glu Glu Leu Gly Leu Val Leu Arg Trp Met Leu Ser Glu Pro Glu Leu 435 440 445 Glu Glu Gly Lys Asn Ile Trp Leu Arg Ser Glu His Phe Ser Ala Asp 450 455 460 Glu Ile Ser Ala Gly Ala Asn Leu Lys Arg Leu Tyr Ala Gln Arg Glu 465 470 475 480 Glu Phe Arg Lys Gly Asn Trp Lys Ala Leu Ala Val Asn His Glu Lys 485 490 495 Ser Val Phe Tyr Gln Leu Asp Leu Ala Asp Ala Ala Glu Asp Phe Val 500 505 510 Arg Leu Gly Leu Asp Met Pro Glu Leu Leu Pro Glu Asp Ala Leu Gln 515 520 525 Met Ser Arg Ile His Asn Arg Met Leu Arg Ala Arg Ile Leu Lys Leu 530 535 540 Asp Gly Lys Asp Tyr Arg Pro Glu Glu Gln Ala Ala Phe Asp Leu Leu 545 550 555 560 Arg Asp Gly Leu Leu Asp Gly Ile Ser Asn Arg Lys Ser Thr Pro Lys 565 570 575 Leu Asp Val Tyr Ser Asp Gln Ile Val Trp Gly Arg Ser Pro Val Arg 580 585 590 Ile Asp Met Ala Gly Gly Trp Thr Asp Thr Pro Pro Tyr Ser Leu Tyr 595 600 605 Ser Gly Gly Asn Val Val Asn Leu Ala Ile Glu Leu Asn Gly Gln Pro 610 615 620 Pro Leu Gln Val Tyr Val Lys Pro Cys Lys Asp Phe His Ile Val Leu 625 630 635 640 Arg Ser Ile Asp Met Gly Ala Met Glu Ile Val Ser Thr Phe Asp Glu 645 650 655 Leu Gln Asp Tyr Lys Lys Ile Gly Ser Pro Phe Ser Ile Pro Lys Ala 660 665 670 Ala Leu Ser Leu Ala Gly Phe Ala Pro Ala Phe Ser Ala Val Ser Tyr 675 680 685 Ala Ser Leu Glu Glu Gln Leu Lys Asp Phe Gly Ala Gly Ile Glu Val 690 695 700 Thr Leu Leu Ala Ala Ile Pro Ala Gly Ser Gly Leu Gly Thr Ser Ser 705 710 715 720 Ile Leu Ala Ser Thr Val Leu Gly Ala Ile Asn Asp Phe Cys Gly Leu 725 730 735 Ala Trp Asp Lys Asn Glu Ile Cys Gln Arg Thr Leu Val Leu Glu Gln 740 745 750 Leu Leu Thr Thr Gly Gly Gly Trp Gln Asp Gln Tyr Gly Gly Val Leu 755 760 765 Gln Gly Val Lys Leu Leu Gln Thr Glu Ala Gly Phe Ala Gln Ser Pro 770 775 780 Leu Val Arg Trp Leu Pro Asp His Leu Phe Thr His Pro Glu Tyr Lys 785 790 795 800 Asp Cys His Leu Leu Tyr Tyr Thr Gly Ile Thr Arg Thr Ala Lys Gly 805 810 815 Ile Leu Ala Glu Ile Val Ser Ser Met Phe Leu Asn Ser Ser Leu His 820 825 830 Leu Asn Leu Leu Ser Glu Met Lys Ala His Ala Leu Asp Met Asn Glu 835 840 845 Ala Ile Gln Arg Gly Ser Phe Val Glu Phe Gly Arg Leu Val Gly Lys 850 855 860 Thr Trp Glu Gln Asn Lys Ala Leu Asp Ser Gly Thr Asn Pro Pro Ala 865 870 875 880 Val Glu Ala Ile Ile Asp Leu Ile Lys Asp Tyr Thr Leu Gly Tyr Lys 885 890 895 Leu Pro Gly Ala Gly Gly Gly Gly Tyr Leu Tyr Met Val Ala Lys Asp 900 905 910 Pro Gln Ala Ala Val Arg Ile Arg Lys Ile Leu Thr Glu Asn Ala Pro 915 920 925 Asn Pro Arg Ala Arg Phe Val Glu Met Thr Leu Ser Asp Lys Gly Phe 930 935 940 Gln Val Ser Arg Ser 945 <210> 39 <211> 159 <212> PRT <213> Saccharomyces cerevisiae <400> 39 Met Ser Leu Pro Asp Gly Phe Tyr Ile Arg Arg Met Glu Glu Gly Asp 1 5 10 15 Leu Glu Gln Val Thr Glu Thr Leu Lys Val Leu Thr Thr Val Gly Thr 20 25 30 Ile Thr Pro Glu Ser Phe Ser Lys Leu Ile Lys Tyr Trp Asn Glu Ala 35 40 45 Thr Val Trp Asn Asp Asn Glu Asp Lys Lys Ile Met Gln Tyr Asn Pro 50 55 60 Met Val Ile Val Asp Lys Arg Thr Glu Thr Val Ala Ala Thr Gly Asn 65 70 75 80 Ile Ile Ile Glu Arg Lys Ile Ile His Glu Leu Gly Leu Cys Gly His 85 90 95 Ile Glu Asp Ile Ala Val Asn Ser Lys Tyr Gln Gly Gln Gly Leu Gly 100 105 110 Lys Leu Leu Ile Asp Gln Leu Val Thr Ile Gly Phe Asp Tyr Gly Cys 115 120 125 Tyr Lys Ile Ile Leu Asp Cys Asp Glu Lys Asn Val Lys Phe Tyr Glu 130 135 140 Lys Cys Gly Phe Ser Asn Ala Gly Val Glu Met Gln Ile Arg Lys 145 150 155 <210> 40 <211> 421 <212> PRT <213> Bacteroides ovatus <400> 40 Met Asp Ser Lys Asn Asn Ile Gly His Ser Ala Asp Ile Ser Leu Thr 1 5 10 15 Ala Glu Leu Pro Ile Pro Ile Tyr Asn Gly Asn Thr Ile Met Asp Phe 20 25 30 Lys Lys Leu Ala Ser Leu Tyr Lys Asp Glu Leu Leu Asp Asn Val Leu 35 40 45 Pro Phe Trp Leu Glu His Ser Gln Asp His Glu Tyr Gly Gly Tyr Phe 50 55 60 Thr Cys Leu Asp Arg Glu Gly Lys Val Phe Asp Thr Asp Lys Phe Ile 65 70 75 80 Trp Leu Gln Ser Arg Glu Val Trp Met Phe Ser Met Leu Tyr Asn Lys 85 90 95 Val Glu Lys Arg Gln Glu Trp Leu Asp Cys Ala Ile Gln Gly Gly Glu 100 105 110 Phe Leu Lys Lys Tyr Gly His Asp Gly Asn Tyr Asn Trp Tyr Phe Ser 115 120 125 Leu Asp Arg Ser Gly Arg Pro Leu Val Glu Pro Tyr Asn Ile Phe Ser 130 135 140 Tyr Thr Phe Ala Thr Met Ala Phe Gly Gln Leu Ser Leu Thr Thr Gly 145 150 155 160 Asn Gln Glu Tyr Ala Asp Ile Ala Lys Lys Thr Phe Asp Ile Ile Leu 165 170 175 Ser Lys Val Asp Asn Pro Lys Gly Arg Trp Asn Lys Leu His Pro Gly 180 185 190 Thr Arg Asn Leu Lys Asn Phe Ala Leu Pro Met Ile Leu Cys Asn Leu 195 200 205 Ala Leu Glu Ile Glu His Leu Leu Asp Glu Thr Tyr Leu Arg Glu Thr 210 215 220 Met Asp Thr Cys Ile His Glu Val Met Glu Val Phe Tyr Arg Pro Glu 225 230 235 240 Leu Gly Gly Ile Ile Val Glu Asn Val Asp Ile Asp Gly Asn Leu Val 245 250 255 Asp Cys Phe Glu Gly Arg Gln Val Thr Pro Gly His Ala Ile Glu Ala 260 265 270 Met Trp Phe Ile Met Asp Leu Gly Lys Arg Leu Asn Arg Pro Glu Leu 275 280 285 Ile Glu Lys Ala Lys Glu Thr Thr Leu Thr Met Leu Asn Tyr Gly Trp 290 295 300 Asp Lys Gln Tyr Gly Gly Ile Tyr Tyr Phe Met Asp Arg Asn Gly Cys 305 310 315 320 Pro Pro Gln Gln Leu Glu Trp Asp Gln Lys Leu Trp Trp Val His Ile 325 330 335 Glu Thr Leu Ile Ser Leu Leu Lys Gly Tyr Gln Leu Thr Gly Asp Lys 340 345 350 Lys Cys Leu Glu Trp Phe Glu Lys Val His Asp Tyr Thr Trp Glu His 355 360 365 Phe Lys Asp Lys Glu Tyr Pro Glu Trp Tyr Gly Tyr Leu Asn Arg Arg 370 375 380 Gly Glu Val Leu Leu Pro Leu Lys Gly Gly Lys Trp Lys Gly Cys Phe 385 390 395 400 His Val Pro Arg Gly Leu Tyr Gln Cys Trp Lys Thr Leu Glu Glu Ile 405 410 415 Lys Asn Ile Val Ser 420 <210> 41 <211> 349 <212> PRT <213> Neisseria meningitidis <400> 41 Met Gln Asn Asn Asn Glu Phe Lys Ile Gly Asn Arg Ser Val Gly Tyr 1 5 10 15 Asn His Glu Pro Leu Ile Ile Cys Glu Ile Gly Ile Asn His Glu Gly 20 25 30 Ser Leu Lys Thr Ala Phe Glu Met Val Asp Ala Ala Tyr Asn Ala Gly 35 40 45 Ala Glu Val Val Lys His Gln Thr His Ile Val Glu Asp Glu Met Ser 50 55 60 Asp Glu Ala Lys Gln Val Ile Pro Gly Asn Ala Asp Val Ser Ile Tyr 65 70 75 80 Glu Ile Met Glu Arg Cys Ala Leu Asn Glu Glu Asp Glu Ile Lys Leu 85 90 95 Lys Glu Tyr Val Glu Ser Lys Gly Met Ile Phe Ile Ser Thr Pro Phe 100 105 110 Ser Arg Ala Ala Ala Leu Arg Leu Gln Arg Met Asp Ile Pro Ala Tyr 115 120 125 Lys Ile Gly Ser Gly Glu Cys Asn Asn Tyr Pro Leu Ile Lys Leu Val 130 135 140 Ala Ser Phe Gly Lys Pro Ile Ile Leu Ser Thr Gly Met Asn Ser Ile 145 150 155 160 Glu Ser Ile Lys Lys Ser Val Glu Ile Ile Arg Glu Ala Gly Val Pro 165 170 175 Tyr Ala Leu Leu His Cys Thr Asn Ile Tyr Pro Thr Pro Tyr Glu Asp 180 185 190 Val Arg Leu Gly Gly Met Asn Asp Leu Ser Glu Ala Phe Pro Asp Ala 195 200 205 Ile Ile Gly Leu Ser Asp His Thr Leu Asp Asn Tyr Ala Cys Leu Gly 210 215 220 Ala Val Ala Leu Gly Gly Ser Ile Leu Glu Arg His Phe Thr Asp Arg 225 230 235 240 Met Asp Arg Pro Gly Pro Asp Ile Val Cys Ser Met Asn Pro Asp Thr 245 250 255 Phe Lys Glu Leu Lys Gln Gly Ala His Ala Leu Lys Leu Ala Arg Gly 260 265 270 Gly Lys Lys Asp Thr Ile Ile Ala Gly Glu Lys Pro Thr Lys Asp Phe 275 280 285 Ala Phe Ala Ser Val Val Ala Asp Lys Asp Ile Lys Lys Gly Glu Leu 290 295 300 Leu Ser Gly Asp Asn Leu Trp Val Lys Arg Pro Gly Asn Gly Asp Phe 305 310 315 320 Ser Val Asn Glu Tyr Glu Thr Leu Phe Gly Lys Val Ala Ala Cys Asn 325 330 335 Ile Arg Lys Gly Ala Gln Ile Lys Lys Thr Asp Ile Glu 340 345 <210> 42 <211> 223 <212> PRT <213> Pasteurella multocida <400> 42 Met Thr Asn Ile Ala Ile Ile Pro Ala Arg Ala Gly Ser Lys Gly Ile 1 5 10 15 Pro Asp Lys Asn Leu Gln Pro Val Gly Gly His Ser Leu Ile Gly Arg 20 25 30 Ala Ile Leu Ala Ala Lys Asn Ala Asp Val Phe Asp Met Ile Val Val 35 40 45 Thr Ser Asp Gly Asp Asn Ile Leu Arg Glu Ala Glu Lys Tyr Gly Ala 50 55 60 Leu Ala Leu Lys Arg Pro Ala Glu Leu Ala Gln Asp Asn Ser Arg Thr 65 70 75 80 Ile Asp Ala Ile Leu His Ala Leu Glu Ser Leu Asn Ile Arg Glu Gly 85 90 95 Thr Cys Thr Leu Leu Gln Pro Thr Ser Pro Leu Arg Asp His Leu Asp 100 105 110 Ile Lys Asn Ala Met Asp Met Tyr Val Asn Gly Gly Val His Ser Val 115 120 125 Val Ser Ala Cys Glu Cys Glu His His Pro Tyr Lys Ala Phe Ala Leu 130 135 140 Ser Lys Asp His Glu Val Leu Pro Val Arg Glu Ile Ala Asp Phe Glu 145 150 155 160 Ala Ala Arg Gln Thr Leu Pro Lys Met Tyr Arg Ala Asn Gly Ala Ile 165 170 175 Tyr Ile Asn Asp Ile Ala Gln Leu Leu Lys Glu Lys Tyr Phe Phe Ile 180 185 190 Pro Pro Leu Lys Phe Tyr Leu Met Pro Thr Tyr Arg Ser Val Asp Ile 195 200 205 Asp Val Lys Gln Asp Leu Glu Leu Ala Glu Ile Leu Ser Asn Lys 210 215 220 <210> 43 <211> 268 <212> PRT <213> Pasteurella multocida <400> 43 Met Asp Lys Phe Ala Glu His Glu Ile Pro Lys Ala Val Ile Val Ala 1 5 10 15 Gly Asn Gly Glu Ser Leu Ser Gln Ile Asp Tyr Arg Leu Leu Pro Lys 20 25 30 Asn Tyr Asp Val Phe Arg Cys Asn Gln Phe Tyr Phe Glu Glu Arg Tyr 35 40 45 Phe Leu Gly Asn Lys Ile Lys Ala Val Phe Phe Thr Pro Gly Val Phe 50 55 60 Leu Glu Gln Tyr Tyr Thr Leu Tyr His Leu Lys Arg Asn Asn Glu Tyr 65 70 75 80 Phe Val Asp Asn Val Ile Leu Ser Ser Phe Asn His Pro Thr Val Asp 85 90 95 Leu Glu Lys Ser Gln Lys Ile Gln Ala Leu Phe Ile Asp Val Ile Asn 100 105 110 Gly Tyr Glu Lys Tyr Leu Ser Lys Leu Thr Ala Phe Asp Val Tyr Leu 115 120 125 Arg Tyr Lys Glu Leu Tyr Glu Asn Gln Arg Ile Thr Ser Gly Val Tyr 130 135 140 Met Cys Ala Val Ala Ile Ala Met Gly Tyr Thr Asp Ile Tyr Leu Thr 145 150 155 160 Gly Ile Asp Phe Tyr Gln Ala Ser Glu Glu Asn Tyr Ala Phe Asp Asn 165 170 175 Lys Lys Pro Asn Ile Ile Arg Leu Leu Pro Asp Phe Arg Lys Glu Lys 180 185 190 Thr Leu Phe Ser Tyr His Ser Lys Asp Ile Asp Leu Glu Ala Leu Ser 195 200 205 Phe Leu Gln Gln His Tyr His Val Asn Phe Tyr Ser Ile Ser Pro Met 210 215 220 Ser Pro Leu Ser Lys His Phe Pro Ile Pro Thr Val Glu Asp Asp Cys 225 230 235 240 Glu Thr Thr Phe Val Ala Pro Leu Lys Glu Asn Tyr Ile Asn Asp Ile 245 250 255 Leu Leu Pro Pro His Phe Val Tyr Glu Lys Leu Gly 260 265 <210> 44 <211> 371 <212> PRT <213> Neisseria meningitidis <400> 44 Met Gly Leu Lys Lys Ala Cys Leu Thr Val Leu Cys Leu Ile Val Phe 1 5 10 15 Cys Phe Gly Ile Phe Tyr Thr Phe Asp Arg Val Asn Gln Gly Glu Arg 20 25 30 Asn Ala Val Ser Leu Leu Lys Glu Lys Leu Phe Asn Glu Glu Gly Glu 35 40 45 Pro Val Asn Leu Ile Phe Cys Tyr Thr Ile Leu Gln Met Lys Val Ala 50 55 60 Glu Arg Ile Met Ala Gln His Pro Gly Glu Arg Phe Tyr Val Val Leu 65 70 75 80 Met Ser Glu Asn Arg Asn Glu Lys Tyr Asp Tyr Tyr Phe Asn Gln Ile 85 90 95 Lys Asp Lys Ala Glu Arg Ala Tyr Phe Phe His Leu Pro Tyr Gly Leu 100 105 110 Asn Lys Ser Phe Asn Phe Ile Pro Thr Met Ala Glu Leu Lys Val Lys 115 120 125 Ser Met Leu Leu Pro Lys Val Lys Arg Ile Tyr Leu Ala Ser Leu Glu 130 135 140 Lys Val Ser Ile Ala Ala Phe Leu Ser Thr Tyr Pro Asp Ala Glu Ile 145 150 155 160 Lys Thr Phe Asp Asp Gly Thr Gly Asn Leu Ile Gln Ser Ser Ser Tyr 165 170 175 Leu Gly Asp Glu Phe Ser Val Asn Gly Thr Ile Lys Arg Asn Phe Ala 180 185 190 Arg Met Met Ile Gly Asp Trp Ser Ile Ala Lys Thr Arg Asn Ala Ser 195 200 205 Asp Glu His Tyr Thr Ile Phe Lys Gly Leu Lys Asn Ile Met Asp Asp 210 215 220 Gly Arg Arg Lys Met Thr Tyr Leu Pro Leu Phe Asp Ala Ser Glu Leu 225 230 235 240 Lys Thr Gly Asp Glu Thr Gly Gly Thr Val Arg Ile Leu Leu Gly Ser 245 250 255 Pro Asp Lys Glu Met Lys Glu Ile Ser Glu Lys Ala Ala Lys Asn Phe 260 265 270 Lys Ile Gln Tyr Val Ala Pro His Pro Arg Gln Thr Tyr Gly Leu Ser 275 280 285 Gly Val Thr Thr Leu Asn Ser Pro Tyr Val Ile Glu Asp Tyr Ile Leu 290 295 300 Arg Glu Ile Lys Lys Asn Pro His Thr Arg Tyr Glu Ile Tyr Thr Phe 305 310 315 320 Phe Ser Gly Ala Ala Leu Thr Met Lys Asp Phe Pro Asn Val His Val 325 330 335 Tyr Ala Leu Lys Pro Ala Ser Leu Pro Glu Asp Tyr Trp Leu Lys Pro 340 345 350 Val Tyr Ala Leu Phe Thr Gln Ser Gly Ile Pro Ile Leu Thr Phe Asp 355 360 365 Asp Lys Asn 370 <210> 45 <211> 391 <212> PRT <213> Photobacterium damselae <400> 45 Met Thr Val Val Ala Pro Thr Leu Glu Val Tyr Ile Asp His Ala Ser 1 5 10 15 Leu Pro Ser Leu Gln Gln Leu Ile His Ile Ile Gln Ala Lys Asp Glu 20 25 30 Tyr Pro Ser Asn Gln Arg Phe Val Ser Trp Lys Arg Val Thr Val Asp 35 40 45 Ala Asp Asn Ala Asn Lys Leu Asn Ile His Thr Tyr Pro Leu Lys Gly 50 55 60 Asn Asn Thr Ser Pro Glu Met Val Ala Ala Ile Asp Glu Tyr Ala Gln 65 70 75 80 Ser Lys Asn Arg Leu Asn Ile Glu Phe Tyr Thr Asn Thr Ala His Val 85 90 95 Phe Asn Asn Leu Pro Pro Ile Ile Gln Pro Leu Tyr Asn Asn Glu Lys 100 105 110 Val Lys Ile Ser His Ile Ser Leu Tyr Asp Asp Gly Ser Ser Glu Tyr 115 120 125 Val Ser Leu Tyr Gln Trp Lys Asp Thr Pro Asn Lys Ile Glu Thr Leu 130 135 140 Glu Gly Glu Val Ser Leu Leu Ala Asn Tyr Leu Ala Gly Thr Ser Pro 145 150 155 160 Asp Ala Pro Lys Gly Met Gly Asn Arg Tyr Asn Trp His Lys Leu Tyr 165 170 175 Asp Thr Asp Tyr Tyr Phe Leu Arg Glu Asp Tyr Leu Asp Val Glu Ala 180 185 190 Asn Leu His Asp Leu Arg Asp Tyr Leu Gly Ser Ser Ala Lys Gln Met 195 200 205 Pro Trp Asp Glu Phe Ala Lys Leu Ser Asp Ser Gln Gln Thr Leu Phe 210 215 220 Leu Asp Ile Val Gly Phe Asp Lys Glu Gln Leu Gln Gln Gln Tyr Ser 225 230 235 240 Gln Ser Pro Leu Pro Asn Phe Ile Phe Thr Gly Thr Thr Thr Trp Ala 245 250 255 Gly Gly Glu Thr Lys Glu Tyr Tyr Ala Gln Gln Gln Val Asn Val Ile 260 265 270 Asn Asn Ala Ile Asn Glu Thr Ser Pro Tyr Tyr Leu Gly Lys Asp Tyr 275 280 285 Asp Leu Phe Phe Lys Gly His Pro Ala Gly Gly Val Ile Asn Asp Ile 290 295 300 Ile Leu Gly Ser Phe Pro Asp Met Ile Asn Ile Pro Ala Lys Ile Ser 305 310 315 320 Phe Glu Val Leu Met Met Thr Asp Met Leu Pro Asp Thr Val Ala Gly 325 330 335 Ile Ala Ser Ser Leu Tyr Phe Thr Ile Pro Ala Asp Lys Val Asn Phe 340 345 350 Ile Val Phe Thr Ser Ser Asp Thr Ile Thr Asp Arg Glu Glu Ala Leu 355 360 365 Lys Ser Pro Leu Val Gln Val Met Leu Thr Leu Gly Ile Val Lys Glu 370 375 380 Lys Asp Val Leu Phe Trp Ala 385 390 <210> 46 <211> 498 <212> PRT <213> Photobacterium sp. JT-ISH-224 <400> 46 Met Ser Glu Glu Asn Thr Gln Ser Ile Ile Lys Asn Asp Ile Asn Lys 1 5 10 15 Thr Ile Ile Asp Glu Glu Tyr Val Asn Leu Glu Pro Ile Asn Gln Ser 20 25 30 Asn Ile Ser Phe Thr Lys His Ser Trp Val Gln Thr Cys Gly Thr Gln 35 40 45 Gln Leu Leu Thr Glu Gln Asn Lys Glu Ser Ile Ser Leu Ser Val Val 50 55 60 Ala Pro Arg Leu Asp Asp Asp Glu Lys Tyr Cys Phe Asp Phe Asn Gly 65 70 75 80 Val Ser Asn Lys Gly Glu Lys Tyr Ile Thr Lys Val Thr Leu Asn Val 85 90 95 Val Ala Pro Ser Leu Glu Val Tyr Val Asp His Ala Ser Leu Pro Thr 100 105 110 Leu Gln Gln Leu Met Asp Ile Ile Lys Ser Glu Glu Glu Asn Pro Thr 115 120 125 Ala Gln Arg Tyr Ile Ala Trp Gly Arg Ile Val Pro Thr Asp Glu Gln 130 135 140 Met Lys Glu Leu Asn Ile Thr Ser Phe Ala Leu Ile Asn Asn His Thr 145 150 155 160 Pro Ala Asp Leu Val Gln Glu Ile Val Lys Gln Ala Gln Thr Lys His 165 170 175 Arg Leu Asn Val Lys Leu Ser Ser Asn Thr Ala His Ser Phe Asp Asn 180 185 190 Leu Val Pro Ile Leu Lys Glu Leu Asn Ser Phe Asn Asn Val Thr Val 195 200 205 Thr Asn Ile Asp Leu Tyr Asp Asp Gly Ser Ala Glu Tyr Val Asn Leu 210 215 220 Tyr Asn Trp Arg Asp Thr Leu Asn Lys Thr Asp Asn Leu Lys Ile Gly 225 230 235 240 Lys Asp Tyr Leu Glu Asp Val Ile Asn Gly Ile Asn Glu Asp Thr Ser 245 250 255 Asn Thr Gly Thr Ser Ser Val Tyr Asn Trp Gln Lys Leu Tyr Pro Ala 260 265 270 Asn Tyr His Phe Leu Arg Lys Asp Tyr Leu Thr Leu Glu Pro Ser Leu 275 280 285 His Glu Leu Arg Asp Tyr Ile Gly Asp Ser Leu Lys Gln Met Gln Trp 290 295 300 Asp Gly Phe Lys Lys Phe Asn Ser Lys Gln Gln Glu Leu Phe Leu Ser 305 310 315 320 Ile Val Asn Phe Asp Lys Gln Lys Leu Gln Asn Glu Tyr Asn Ser Ser 325 330 335 Asn Leu Pro Asn Phe Val Phe Thr Gly Thr Thr Val Trp Ala Gly Asn 340 345 350 His Glu Arg Glu Tyr Tyr Ala Lys Gln Gln Ile Asn Val Ile Asn Asn 355 360 365 Ala Ile Asn Glu Ser Ser Pro His Tyr Leu Gly Asn Ser Tyr Asp Leu 370 375 380 Phe Phe Lys Gly His Pro Gly Gly Gly Ile Ile Asn Thr Leu Ile Met 385 390 395 400 Gln Asn Tyr Pro Ser Met Val Asp Ile Pro Ser Lys Ile Ser Phe Glu 405 410 415 Val Leu Met Met Thr Asp Met Leu Pro Asp Ala Val Ala Gly Ile Ala 420 425 430 Ser Ser Leu Tyr Phe Thr Ile Pro Ala Glu Lys Ile Lys Phe Ile Val 435 440 445 Phe Thr Ser Thr Glu Thr Ile Thr Asp Arg Glu Thr Ala Leu Arg Ser 450 455 460 Pro Leu Val Gln Val Met Ile Lys Leu Gly Ile Val Lys Glu Glu Asn 465 470 475 480 Val Leu Phe Trp Ala Asp Leu Pro Asn Cys Glu Thr Gly Val Cys Ile 485 490 495 Ala Val <210> 47 <211> 188 <212> PRT <213> Escherichia coli K12 MG1655 <400> 47 Met Tyr Glu Arg Tyr Ala Gly Leu Ile Phe Asp Met Asp Gly Thr Ile 1 5 10 15 Leu Asp Thr Glu Pro Thr His Arg Lys Ala Trp Arg Glu Val Leu Gly 20 25 30 His Tyr Gly Leu Gln Tyr Asp Ile Gln Ala Met Ile Ala Leu Asn Gly 35 40 45 Ser Pro Thr Trp Arg Ile Ala Gln Ala Ile Ile Glu Leu Asn Gln Ala 50 55 60 Asp Leu Asp Pro His Ala Leu Ala Arg Glu Lys Thr Glu Ala Val Arg 65 70 75 80 Ser Met Leu Leu Asp Ser Val Glu Pro Leu Pro Leu Val Asp Val Val 85 90 95 Lys Ser Trp His Gly Arg Arg Pro Met Ala Val Gly Thr Gly Ser Glu 100 105 110 Ser Ala Ile Ala Glu Ala Leu Leu Ala His Leu Gly Leu Arg His Tyr 115 120 125 Phe Asp Ala Val Val Ala Ala Asp His Val Lys His His Lys Pro Ala 130 135 140 Pro Asp Thr Phe Leu Leu Cys Ala Gln Arg Met Gly Val Gln Pro Thr 145 150 155 160 Gln Cys Val Val Phe Glu Asp Ala Asp Phe Gly Ile Gln Ala Ala Arg 165 170 175 Ala Ala Gly Met Asp Ala Val Asp Val Arg Leu Leu 180 185 <210> 48 <211> 373 <212> PRT <213> Campylobacter jejuni <400> 48 Met Val Lys Lys Ile Leu Phe Ile Thr Gly Ser Arg Ala Asp Tyr Ser 1 5 10 15 Lys Ile Lys Ser Leu Met Tyr Arg Val Gln Asn Ser Ser Glu Phe Glu 20 25 30 Leu Tyr Ile Phe Ala Thr Gly Met His Leu Ser Lys Asn Phe Gly Tyr 35 40 45 Thr Val Lys Glu Leu Tyr Lys Asn Gly Phe Lys Asn Ile Tyr Glu Phe 50 55 60 Ile Asn Tyr Asp Lys Tyr Tyr Gln Thr Asp Lys Ala Leu Ala Thr Thr 65 70 75 80 Ile Asp Gly Phe Ser Arg Tyr Ala Asn Glu Leu Lys Pro Asp Leu Ile 85 90 95 Val Val His Gly Asp Arg Ile Glu Pro Leu Ala Ala Ala Ile Val Gly 100 105 110 Ala Leu Asn Asn Ile Leu Val Ala His Ile Glu Gly Gly Glu Ile Ser 115 120 125 Gly Thr Ile Asp Asp Ser Leu Arg His Ala Ile Ser Lys Leu Ala His 130 135 140 Ile His Leu Val Asn Asp Glu Phe Ala Lys Arg Arg Leu Met Gln Leu 145 150 155 160 Gly Glu Asp Glu Lys Ser Ile Phe Ile Ile Gly Ser Pro Asp Leu Glu 165 170 175 Leu Leu Asn Asp Asn Lys Ile Ser Leu Ser Glu Ala Lys Lys Tyr Tyr 180 185 190 Asp Ile Asn Tyr Glu Asn Tyr Ala Leu Leu Met Phe His Pro Val Thr 195 200 205 Thr Glu Ile Thr Ser Ile Lys Asn Gln Ala Asp Asn Leu Val Lys Ala 210 215 220 Leu Ile Gln Ser Asn Lys Asn Tyr Ile Val Ile Tyr Pro Asn Asn Asp 225 230 235 240 Leu Gly Phe Glu Leu Ile Leu Gln Ser Tyr Glu Glu Phe Lys Asn Asn 245 250 255 Pro Arg Phe Lys Leu Phe Pro Ser Leu Arg Phe Glu Tyr Phe Ile Thr 260 265 270 Leu Leu Lys Asn Ala Asp Phe Ile Ile Gly Asn Ser Ser Cys Ile Leu 275 280 285 Lys Glu Ala Leu Tyr Leu Lys Thr Ala Gly Ile Leu Val Gly Ser Arg 290 295 300 Gln Asn Gly Arg Leu Gly Asn Glu Asn Thr Leu Lys Val Asn Ala Asn 305 310 315 320 Ser Asp Glu Ile Leu Lys Ala Ile Asn Thr Ile His Lys Lys Gln Asp 325 330 335 Leu Phe Ser Ala Lys Leu Glu Ile Leu Asp Ser Ser Lys Leu Phe Phe 340 345 350 Glu Tyr Leu Gln Ser Gly Asp Phe Phe Lys Leu Ser Thr Gln Lys Val 355 360 365 Phe Lys Asp Ile Lys 370 <210> 49 <211> 415 <212> PRT <213> Escherichia coli W <400> 49 Met Ala Leu Asn Ile Pro Phe Arg Asn Ala Tyr Tyr Arg Phe Ala Ser 1 5 10 15 Ser Tyr Ser Phe Leu Phe Phe Ile Ser Trp Ser Leu Trp Trp Ser Leu 20 25 30 Tyr Ala Ile Trp Leu Lys Gly His Leu Gly Leu Thr Gly Thr Glu Leu 35 40 45 Gly Thr Leu Tyr Ser Val Asn Gln Phe Thr Ser Ile Leu Phe Met Met 50 55 60 Phe Tyr Gly Ile Val Gln Asp Lys Leu Gly Leu Lys Lys Pro Leu Ile 65 70 75 80 Trp Cys Met Ser Phe Ile Leu Val Leu Thr Gly Pro Phe Met Ile Tyr 85 90 95 Val Tyr Glu Pro Leu Leu Gln Ser Asn Phe Ser Val Gly Leu Ile Leu 100 105 110 Gly Ala Leu Phe Phe Gly Leu Gly Tyr Leu Ala Gly Cys Gly Leu Leu 115 120 125 Asp Ser Phe Thr Glu Lys Met Ala Arg Asn Phe His Phe Glu Tyr Gly 130 135 140 Thr Ala Arg Ala Trp Gly Ser Phe Gly Tyr Ala Ile Gly Ala Phe Phe 145 150 155 160 Ala Gly Ile Phe Phe Ser Ile Ser Pro His Ile Asn Phe Trp Leu Val 165 170 175 Ser Leu Phe Gly Ala Val Phe Met Met Ile Asn Met Arg Phe Lys Asp 180 185 190 Lys Asp His Gln Cys Val Ala Ala Asp Ala Gly Gly Val Lys Lys Glu 195 200 205 Asp Phe Ile Ala Val Phe Lys Asp Arg Asn Phe Trp Val Phe Val Ile 210 215 220 Phe Ile Val Gly Thr Trp Ser Phe Tyr Asn Ile Phe Asp Gln Gln Leu 225 230 235 240 Phe Pro Val Phe Tyr Ser Gly Leu Phe Glu Ser His Asp Val Gly Thr 245 250 255 Arg Leu Tyr Gly Tyr Leu Asn Ser Phe Gln Val Val Leu Glu Ala Leu 260 265 270 Cys Met Ala Ile Ile Pro Phe Phe Val Asn Arg Val Gly Pro Lys Asn 275 280 285 Ala Leu Leu Ile Gly Val Val Ile Met Ala Leu Arg Ile Leu Ser Cys 290 295 300 Ala Leu Phe Val Asn Pro Trp Ile Ile Ser Leu Val Lys Leu Leu His 305 310 315 320 Ala Ile Glu Val Pro Leu Cys Val Ile Ser Val Phe Lys Tyr Ser Val 325 330 335 Ala Asn Phe Asp Lys Arg Leu Ser Ser Thr Ile Phe Leu Ile Gly Phe 340 345 350 Gln Ile Ala Ser Ser Leu Gly Ile Val Leu Leu Ser Thr Pro Thr Gly 355 360 365 Ile Leu Phe Asp His Ala Gly Tyr Gln Thr Val Phe Phe Ala Ile Ser 370 375 380 Gly Ile Val Cys Leu Met Leu Leu Phe Gly Ile Phe Phe Leu Ser Lys 385 390 395 400 Lys Arg Glu Gln Ile Val Met Glu Thr Pro Val Pro Ser Ala Ile 405 410 415 <210> 50 <211> 301 <212> PRT <213> Zymomonas mobilis <400> 50 Met Lys Asn Asp Lys Lys Ile Tyr Gly Cys Ile Glu Gly Gly Gly Thr 1 5 10 15 Lys Phe Met Leu Ala Leu Ile Asp Ser Asp Arg Lys Met Leu Ala Val 20 25 30 Glu Arg Val Pro Thr Thr Thr Pro Glu Glu Thr Leu Gly Lys Ser Val 35 40 45 Glu Phe Phe Lys Lys Ala Leu Pro Gln Tyr Ala Asp Ser Phe Ala Ser 50 55 60 Phe Gly Ile Ala Ser Phe Gly Pro Leu Cys Leu Asp Arg Lys Ser Pro 65 70 75 80 Lys Trp Gly Tyr Ile Thr Asn Thr Pro Lys Pro Phe Trp Pro Asn Thr 85 90 95 Asp Val Val Thr Pro Phe Lys Glu Ala Phe Gly Cys Pro Val Glu Ile 100 105 110 Asp Thr Asp Val Asn Gly Ala Ala Leu Ala Glu Asn Phe Trp Gly Ala 115 120 125 Ser Lys Gly Thr His Thr Ser Val Tyr Val Thr Val Gly Thr Gly Phe 130 135 140 Gly Gly Gly Val Leu Ile Asp Gly Lys Pro Ile His Gly Leu Ala His 145 150 155 160 Pro Glu Met Gly His Gly Ile Pro Ile Arg His Pro Asp Asp Arg Asp 165 170 175 Phe Glu Gly Cys Cys Pro Tyr His Gly Gly Cys Tyr Glu Gly Leu Ala 180 185 190 Ser Gly Thr Ala Ile Arg Lys Arg Trp Gly Lys Ala Leu Asn Glu Met 195 200 205 Glu Pro Ala Glu Phe Glu Lys Ala Arg Glu Ile Ile Ala Phe Tyr Leu 210 215 220 Ala His Phe Asn Val Thr Leu Gln Ala Phe Ile Ser Pro Glu Arg Ile 225 230 235 240 Val Phe Gly Gly Gly Val Met His Val Asp Gly Met Leu Ala Ser Val 245 250 255 Arg Arg Gln Thr Ala Glu Ile Ala Asn Ser Tyr Phe Glu Gly Ala Asp 260 265 270 Phe Glu Lys Ile Ile Val Leu Pro Gly Leu Gly Asp Gln Ala Gly Met 275 280 285 Met Gly Ala Phe Ala Leu Ala Leu Ala Ala Glu Asn Lys 290 295 300 <210> 51 <211> 504 <212> PRT <213> Bifidobacterium adolescentis <400> 51 Met Lys Asn Lys Val Gln Leu Ile Thr Tyr Ala Asp Arg Leu Gly Asp 1 5 10 15 Gly Thr Ile Lys Ser Met Thr Asp Ile Leu Arg Thr Arg Phe Asp Gly 20 25 30 Val Tyr Asp Gly Val His Ile Leu Pro Phe Phe Thr Pro Phe Asp Gly 35 40 45 Ala Asp Ala Gly Phe Asp Pro Ile Asp His Thr Lys Val Asp Glu Arg 50 55 60 Leu Gly Ser Trp Asp Asp Val Ala Glu Leu Ser Lys Thr His Asn Ile 65 70 75 80 Met Val Asp Ala Ile Val Asn His Met Ser Trp Glu Ser Lys Gln Phe 85 90 95 Gln Asp Val Leu Ala Lys Gly Glu Glu Ser Glu Tyr Tyr Pro Met Phe 100 105 110 Leu Thr Met Ser Ser Val Phe Pro Asn Gly Ala Thr Glu Glu Asp Leu 115 120 125 Ala Gly Ile Tyr Arg Pro Arg Pro Gly Leu Pro Phe Thr His Tyr Lys 130 135 140 Phe Ala Gly Lys Thr Arg Leu Val Trp Val Ser Phe Thr Pro Gln Gln 145 150 155 160 Val Asp Ile Asp Thr Asp Ser Asp Lys Gly Trp Glu Tyr Leu Met Ser 165 170 175 Ile Phe Asp Gln Met Ala Ala Ser His Val Ser Tyr Ile Arg Leu Asp 180 185 190 Ala Val Gly Tyr Gly Ala Lys Glu Ala Gly Thr Ser Cys Phe Met Thr 195 200 205 Pro Lys Thr Phe Lys Leu Ile Ser Arg Leu Arg Glu Glu Gly Val Lys 210 215 220 Arg Gly Leu Glu Ile Leu Ile Glu Val His Ser Tyr Tyr Lys Lys Gln 225 230 235 240 Val Glu Ile Ala Ser Lys Val Asp Arg Val Tyr Asp Phe Ala Leu Pro 245 250 255 Pro Leu Leu Leu His Ala Leu Ser Thr Gly His Val Glu Pro Val Ala 260 265 270 His Trp Thr Asp Ile Arg Pro Asn Asn Ala Val Thr Val Leu Asp Thr 275 280 285 His Asp Gly Ile Gly Val Ile Asp Ile Gly Ser Asp Gln Leu Asp Arg 290 295 300 Ser Leu Lys Gly Leu Val Pro Asp Glu Asp Val Asp Asn Leu Val Asn 305 310 315 320 Thr Ile His Ala Asn Thr His Gly Glu Ser Gln Ala Ala Thr Gly Ala 325 330 335 Ala Ala Ser Asn Leu Asp Leu Tyr Gln Val Asn Ser Thr Tyr Tyr Ser 340 345 350 Ala Leu Gly Cys Asn Asp Gln His Tyr Ile Ala Ala Arg Ala Val Gln 355 360 365 Phe Phe Leu Pro Gly Val Pro Gln Val Tyr Tyr Val Gly Ala Leu Ala 370 375 380 Gly Lys Asn Asp Met Glu Leu Leu Arg Lys Thr Asn Asn Gly Arg Asp 385 390 395 400 Ile Asn Arg His Tyr Tyr Ser Thr Ala Glu Ile Asp Glu Asn Leu Lys 405 410 415 Arg Pro Val Val Lys Ala Leu Asn Ala Leu Ala Lys Phe Arg Asn Glu 420 425 430 Leu Asp Ala Phe Asp Gly Thr Phe Ser Tyr Thr Thr Asp Asp Asp Thr 435 440 445 Ser Ile Ser Phe Thr Trp Arg Gly Glu Thr Ser Gln Ala Thr Leu Thr 450 455 460 Phe Glu Pro Lys Arg Gly Leu Gly Val Asp Asn Thr Thr Pro Val Ala 465 470 475 480 Met Leu Glu Trp Glu Asp Ser Ala Gly Asp His Arg Ser Asp Asp Leu 485 490 495 Ile Ala Asn Pro Pro Val Val Ala 500 <210> 52 <211> 417 <212> PRT <213> Escherichia coli K12 MG1655 <400> 52 Met Tyr Tyr Leu Lys Asn Thr Asn Phe Trp Met Phe Gly Leu Phe Phe 1 5 10 15 Phe Phe Tyr Phe Phe Ile Met Gly Ala Tyr Phe Pro Phe Phe Pro Ile 20 25 30 Trp Leu His Asp Ile Asn His Ile Ser Lys Ser Asp Thr Gly Ile Ile 35 40 45 Phe Ala Ala Ile Ser Leu Phe Ser Leu Leu Phe Gln Pro Leu Phe Gly 50 55 60 Leu Leu Ser Asp Lys Leu Gly Leu Arg Lys Tyr Leu Leu Trp Ile Ile 65 70 75 80 Thr Gly Met Leu Val Met Phe Ala Pro Phe Phe Ile Phe Ile Phe Gly 85 90 95 Pro Leu Leu Gln Tyr Asn Ile Leu Val Gly Ser Ile Val Gly Gly Ile 100 105 110 Tyr Leu Gly Phe Cys Phe Asn Ala Gly Ala Pro Ala Val Glu Ala Phe 115 120 125 Ile Glu Lys Val Ser Arg Arg Ser Asn Phe Glu Phe Gly Arg Ala Arg 130 135 140 Met Phe Gly Cys Val Gly Trp Ala Leu Cys Ala Ser Ile Val Gly Ile 145 150 155 160 Met Phe Thr Ile Asn Asn Gln Phe Val Phe Trp Leu Gly Ser Gly Cys 165 170 175 Ala Leu Ile Leu Ala Val Leu Leu Phe Phe Ala Lys Thr Asp Ala Pro 180 185 190 Ser Ser Ala Thr Val Ala Asn Ala Val Gly Ala Asn His Ser Ala Phe 195 200 205 Ser Leu Lys Leu Ala Leu Glu Leu Phe Arg Gln Pro Lys Leu Trp Phe 210 215 220 Leu Ser Leu Tyr Val Ile Gly Val Ser Cys Thr Tyr Asp Val Phe Asp 225 230 235 240 Gln Gln Phe Ala Asn Phe Phe Thr Ser Phe Phe Ala Thr Gly Glu Gln 245 250 255 Gly Thr Arg Val Phe Gly Tyr Val Thr Thr Met Gly Glu Leu Leu Asn 260 265 270 Ala Ser Ile Met Phe Phe Ala Pro Leu Ile Ile Asn Arg Ile Gly Gly 275 280 285 Lys Asn Ala Leu Leu Leu Ala Gly Thr Ile Met Ser Val Arg Ile Ile 290 295 300 Gly Ser Ser Phe Ala Thr Ser Ala Leu Glu Val Val Ile Leu Lys Thr 305 310 315 320 Leu His Met Phe Glu Val Pro Phe Leu Leu Val Gly Cys Phe Lys Tyr 325 330 335 Ile Thr Ser Gln Phe Glu Val Arg Phe Ser Ala Thr Ile Tyr Leu Val 340 345 350 Cys Phe Cys Phe Phe Lys Gln Leu Ala Met Ile Phe Met Ser Val Leu 355 360 365 Ala Gly Asn Met Tyr Glu Ser Ile Gly Phe Gln Gly Ala Tyr Leu Val 370 375 380 Leu Gly Leu Val Ala Leu Gly Phe Thr Leu Ile Ser Val Phe Thr Leu 385 390 395 400 Ser Gly Pro Gly Pro Leu Ser Leu Leu Arg Arg Gln Val Asn Glu Val 405 410 415 Ala <210> 53 <211> 410 <212> PRT <213> Cronobacter sakazakii strain MOD1_LR753 <400> 53 Met Gln Thr His Ala Asn Arg Thr Gly Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln 35 40 45 Ala Gly Val Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Ala Gly Val Ala Trp Phe Ile Val Thr Cys 85 90 95 Leu Ala Thr Leu Leu Ala Arg Asp Ile Glu Gln Phe Thr Val Leu Arg 100 105 110 Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Val His Ala Ala Pro Trp Glu Met Met Phe Val Leu 165 170 175 Phe Ala Ala Leu Ala Ala Ile Ser Phe Phe Gly Leu Trp Arg Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Arg Glu Leu 195 200 205 Gly Arg Asp Tyr Lys Ala Val Leu Lys Asn Leu Arg Phe Val Ser Gly 210 215 220 Ala Leu Ala Ile Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Met Ser Thr Tyr Glu 245 250 255 Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ile Gly Asn 260 265 270 Leu Val Leu Ala Lys Leu Thr Ala Arg Arg Ser Val Arg Ser Leu Ile 275 280 285 Val Met Gly Gly Trp Pro Met Met Phe Gly Leu Ala Leu Ala Ala Leu 290 295 300 Ala Thr Val Ile Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Ile Tyr Ala Phe Gly Ile Gly Ile Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ala Ser Asp Ile Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Thr Ile Phe Thr Val Gly Ile Glu Ile Ser 355 360 365 Lys His Ala Trp Leu Gly Gly Gly Asn Ala Leu Phe Asn Leu Phe Asn 370 375 380 Phe Ala Ser Gly Leu Leu Trp Leu Gly Leu Met Val Ile Phe Leu Lys 385 390 395 400 Asp Lys Thr Val Gly Thr Arg Pro Glu Ala 405 410 <210> 54 <211> 411 <212> PRT <213> Franconibacter pulveris LMG 24059 <400> 54 Met Gln Asn Lys Thr Met Thr Lys Lys Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln 35 40 45 Ala Gly Met Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys 85 90 95 Leu Ala Thr Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Ala Leu Arg 100 105 110 Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Val His Met Ala Pro Trp Glu Met Met Phe Val Leu 165 170 175 Phe Ala Val Leu Ala Ala Ile Ala Tyr Tyr Gly Leu Trp Arg Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Lys Glu Leu 195 200 205 Gly Arg Asp Tyr Lys Ala Val Met Lys Asn Ala Arg Phe Val Ala Gly 210 215 220 Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Leu Ser Ser Tyr Glu 245 250 255 Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn 260 265 270 Leu Ala Leu Ala Lys Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile 275 280 285 Ile Leu Gly Gly Trp Pro Ile Thr Leu Gly Leu Val Ile Ala Ala Leu 290 295 300 Ala Thr Leu Leu Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Val Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ala Ser Asp Ile Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser 355 360 365 Lys His Ala Tyr Leu Ala Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn 370 375 380 Leu Leu Asn Gly Leu Leu Trp Leu Gly Met Met Val Ile Phe Leu Lys 385 390 395 400 Asp Lys Thr Val Gly Asn Ser Leu Gln Pro Gln 405 410 <210> 55 <211> 410 <212> PRT <213> Enterobacter hormaechei strain 017 <400> 55 Met Ile Asn Arg Ser Ser Ser Gly Asn Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Asn 35 40 45 Ala Gly Ile Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys 85 90 95 Leu Ala Thr Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Leu Leu Arg 100 105 110 Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Val His Val Ala Pro Trp Glu Gly Met Phe Val Leu 165 170 175 Phe Ala Ala Leu Ala Ala Ile Ser Phe Phe Gly Leu His Arg Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Lys Glu Leu 195 200 205 Gly Arg Asp Tyr Lys Ala Val Leu Lys Asn Gly Arg Phe Val Ala Gly 210 215 220 Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Leu Ser Ser Tyr Glu 245 250 255 Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ile Gly Asn 260 265 270 Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile 275 280 285 Ile Met Gly Gly Trp Pro Ile Ala Ala Gly Leu Ile Ile Ala Ala Val 290 295 300 Ala Thr Val Ala Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Ile Tyr Ala Phe Gly Ile Gly Val Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser 355 360 365 Lys His Ala Tyr Ala Phe Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn 370 375 380 Leu Ala Asn Gly Val Leu Trp Val Gly Leu Met Val Val Phe Leu Lys 385 390 395 400 Asp Lys Arg Val Gly Asn Ala Leu Gln Pro 405 410 <210> 56 <211> 410 <212> PRT <213> Citrobacter koseri strain NCTC10771 <400> 56 Met Gln Asn Leu Ser Gln Thr Gly Val Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln 35 40 45 Ala Gly Ile Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Ala Gly Val Ile Trp Phe Ile Val Thr Cys 85 90 95 Leu Ala Thr Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Leu Leu Arg 100 105 110 Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Val His Val Leu Pro Trp Glu Glu Met Phe Val Leu 165 170 175 Phe Ala Val Leu Ala Ala Ile Ala Phe Val Gly Leu Gln Arg Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Lys Glu Leu 195 200 205 Gly Arg Asp Tyr Lys Leu Val Leu Lys Asn Val Arg Phe Val Ala Gly 210 215 220 Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Ile Ile Ile Ile Ser Gly Glu Gln Leu Ser Ser Tyr Glu 245 250 255 Tyr Gly Leu Leu Gln Val Pro Val Phe Gly Ala Leu Ile Ala Gly Asn 260 265 270 Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ala Leu Ile 275 280 285 Ile Met Gly Gly Trp Pro Ile Val Ala Gly Leu Leu Ile Ala Ala Ala 290 295 300 Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Val Tyr Ala Phe Gly Ile Gly Val Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser 355 360 365 Lys His Ala Tyr Leu Ser Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn 370 375 380 Leu Ala Asn Gly Ile Leu Trp Leu Leu Leu Met Val Ile Phe Leu Lys 385 390 395 400 Asp Lys Arg Val Gly Asp Ser Arg Glu Gly 405 410 <210> 57 <211> 410 <212> PRT <213> Salmonella enterica subsp. arizonae serovar 41:z4,z23:- strain TAMU30EF <400> 57 Met His Asn Arg Leu Gln Ser Gly Val Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln 35 40 45 Ala Gly Leu Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Ala Gly Val Val Trp Phe Ile Val Thr Cys 85 90 95 Leu Ala Thr Leu Leu Ala Lys Asn Ile Glu Gln Phe Thr Phe Leu Arg 100 105 110 Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Val His Val Leu Pro Trp Glu Gly Met Phe Ile Leu 165 170 175 Phe Ala Ala Leu Ala Ala Ile Ala Phe Phe Gly Leu Gln Arg Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Arg Gly Glu Thr Leu Ser Phe Lys Ala Leu 195 200 205 Gly Arg Asp Tyr Arg Leu Val Ile Lys Asn Arg Arg Phe Val Ala Gly 210 215 220 Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Ile Ile Ile Ile Ser Gly Glu Gln Leu Ser Ser Tyr Glu 245 250 255 Tyr Gly Leu Leu Gln Val Pro Val Phe Gly Ala Leu Ile Ala Gly Asn 260 265 270 Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile 275 280 285 Val Met Gly Gly Trp Pro Ile Val Ala Gly Leu Val Ile Ala Ala Ala 290 295 300 Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Val Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ser Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser 355 360 365 Lys His Ala Trp Leu Ser Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn 370 375 380 Leu Ala Asn Gly Ile Leu Trp Leu Leu Leu Met Leu Val Phe Leu Lys 385 390 395 400 Asp Lys Arg Thr Gly Asn Leu His Thr Val 405 410 <210> 58 <211> 408 <212> PRT <213> Shigella flexneri strain 585219 <400> 58 Met Gln Asn Lys Leu Ala Ser Gly Ala Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln 35 40 45 Ala Gly Ile Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Ala Gly Val Leu Trp Phe Ile Val Thr Cys 85 90 95 Leu Ala Ile Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Met Leu Arg 100 105 110 Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Val Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Ile His Val Leu Pro Trp Glu Gly Met Phe Val Leu 165 170 175 Phe Ala Ala Leu Ala Ala Ile Ser Phe Phe Gly Leu Gln Arg Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Ile Gly Glu Lys Leu Ser Leu Lys Glu Leu 195 200 205 Gly Arg Asp Tyr Lys Leu Val Leu Lys Asn Gly Arg Phe Val Ala Gly 210 215 220 Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala Gln Ser 225 230 235 240 Pro Ile Ile Ile Ile Thr Gly Glu Gln Leu Ser Ser Tyr Glu Tyr Gly 245 250 255 Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn Leu Leu 260 265 270 Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile Ile Met 275 280 285 Gly Gly Trp Pro Ile Met Ile Gly Leu Leu Val Ala Ala Ala Ala Thr 290 295 300 Val Ile Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu Ser Ile 305 310 315 320 Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg Leu Thr 325 330 335 Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala Met Gly 340 345 350 Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Ile Ser Lys His 355 360 365 Ala Trp Leu Asn Gly Gly Asn Gly Leu Phe Asn Leu Phe Asn Leu Val 370 375 380 Asn Gly Ile Leu Trp Leu Ser Leu Met Val Ile Phe Leu Lys Asp Lys 385 390 395 400 Gln Met Gly Asn Ser His Glu Gly 405 <210> 59 <211> 410 <212> PRT <213> Yokenella regensburgei strain UMB0819 <400> 59 Met Leu Asn Arg Ser Ser Ser Gly Ser Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Ala Gln Tyr Asn 35 40 45 Ala Gly Ile Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys 85 90 95 Leu Ala Thr Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Leu Leu Arg 100 105 110 Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Val His Val Ala Pro Trp Glu Gly Met Phe Val Leu 165 170 175 Phe Ala Val Leu Ala Ala Ile Ala Phe Phe Gly Leu His Arg Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Lys Glu Leu 195 200 205 Gly Arg Asp Tyr Lys Ala Val Leu Gln Asn Gly Arg Phe Val Ala Gly 210 215 220 Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Lys Leu Ser Ser Tyr Glu 245 250 255 Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ile Gly Asn 260 265 270 Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile 275 280 285 Ile Met Gly Gly Trp Pro Ile Ala Ala Gly Leu Ile Leu Ala Ala Val 290 295 300 Ala Thr Val Ala Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Ile Tyr Ala Phe Gly Ile Gly Val Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser 355 360 365 Lys His Ala Tyr Ala Leu Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn 370 375 380 Leu Ala Asn Gly Val Leu Trp Val Gly Leu Met Val Val Phe Leu Lys 385 390 395 400 Asp Lys Arg Val Gly Asn Ala Leu Gln Pro 405 410 <210> 60 <211> 410 <212> PRT <213> Escherichia coli strain AMC_967 <400> 60 Met Gln Asn Lys Leu Ala Ser Gly Ala Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln 35 40 45 Ala Gly Ile Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Ala Gly Val Val Trp Phe Ile Ile Thr Cys 85 90 95 Leu Ala Ile Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Leu Leu Arg 100 105 110 Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Ile His Val Leu Pro Trp Glu Gly Met Phe Val Leu 165 170 175 Phe Ala Ala Leu Ala Ala Ile Ser Phe Phe Gly Leu Gln Arg Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Ile Gly Glu Lys Leu Ser Leu Lys Glu Leu 195 200 205 Gly Arg Asp Tyr Lys Leu Val Leu Lys Asn Gly Arg Phe Val Ala Gly 210 215 220 Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Ile Ile Ile Ile Thr Gly Glu Gln Leu Ser Ser Tyr Glu 245 250 255 Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn 260 265 270 Leu Leu Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile 275 280 285 Ile Met Gly Gly Trp Pro Ile Met Ile Gly Leu Leu Val Ala Ala Ala 290 295 300 Ala Thr Val Ile Ser Ser His Ala Tyr Leu Trp Met Ala Ala Gly Leu 305 310 315 320 Ser Leu Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Ile Ser 355 360 365 Lys His Ala Trp Leu Asn Gly Gly Asn Gly Leu Phe Asn Leu Phe Asn 370 375 380 Leu Val Asn Gly Ile Leu Trp Leu Leu Leu Met Val Ile Phe Leu Lys 385 390 395 400 Asp Lys Gln Met Gly Asn Ser His Glu Gly 405 410 <210> 61 <211> 410 <212> PRT <213> Klebsiella pneumoniae VAKPC309 <400> 61 Met Gln Asn Tyr Ser Leu Ser Gly Arg Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Gln Glu Phe Gln 35 40 45 Val Gly Asn Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys 85 90 95 Leu Ala Thr Leu Leu Ala Gln Thr Ile Glu Gln Phe Thr Leu Leu Arg 100 105 110 Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Val His Val Leu Pro Trp Glu Met Met Phe Val Leu 165 170 175 Phe Ala Val Leu Ala Ala Ile Ser Phe Phe Gly Leu Gln Arg Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Val Lys Glu Leu 195 200 205 Gly Arg Asp Tyr Arg Leu Val Leu Lys Asn Leu Arg Phe Val Ala Gly 210 215 220 Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Ala Thr Ser Tyr Glu 245 250 255 Tyr Gly Met Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn 260 265 270 Leu Val Leu Ala Arg Leu Thr Ala Arg Arg Thr Val Arg Ser Leu Ile 275 280 285 Ile Met Gly Gly Trp Pro Ile Met Phe Gly Leu Ile Leu Ser Ala Ala 290 295 300 Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Phe Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Leu Ser 355 360 365 Lys His Ala Tyr Glu Leu Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn 370 375 380 Leu Leu Gly Gly Val Leu Trp Leu Gly Leu Met Ile Tyr Phe Leu Lys 385 390 395 400 Asp Lys Ser Val Gly Asn Ser Gln Gln Gly 405 410 <210> 62 <211> 411 <212> PRT <213> Klebsiella oxytoca strain 4928STDY7071490 <400> 62 Met His Asn Ser Ser Leu Ser Gly Lys Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ala Thr Tyr Ile Gly 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ser Val Val Glu Glu Phe Gly 35 40 45 Val Gly Asn Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys 85 90 95 Leu Ala Thr Leu Leu Ala Gln Thr Ile Glu Gln Phe Thr Leu Leu Arg 100 105 110 Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Val His Ile Leu Pro Trp Glu Met Met Phe Val Leu 165 170 175 Phe Ala Val Leu Ala Ala Ile Ala Phe Phe Gly Leu Gln Arg Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Met Gly Glu Lys Leu Ser Val Lys Glu Leu 195 200 205 Gly Arg Asp Tyr Arg Glu Val Leu Lys Asn Leu Arg Phe Val Ala Gly 210 215 220 Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Ala Thr Ser Tyr Glu 245 250 255 Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn 260 265 270 Leu Val Leu Ala Arg Gln Thr Ser Arg Lys Thr Val Arg Ser Leu Ile 275 280 285 Ile Leu Gly Gly Trp Pro Ile Met Leu Gly Leu Leu Ile Ser Ala Val 290 295 300 Ala Thr Val Ala Ser Thr His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Val Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser 355 360 365 Lys His Ala Tyr Glu Ser Gly Gly Ser Gly Leu Phe Ser Leu Leu Asn 370 375 380 Leu Leu Ser Gly Val Leu Trp Leu Ala Met Met Val Tyr Phe Leu Lys 385 390 395 400 Asp Lys Arg Val Gly Ser Ser Leu Glu Pro Gln 405 410 <210> 63 <211> 411 <212> PRT <213> Klebsiella michiganensis strain A2 <400> 63 Met His Asn Ser Ser Leu Ser Gly Lys Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ala Thr Tyr Ile Gly 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ser Val Val Glu Glu Phe Gly 35 40 45 Val Gly Asn Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys 85 90 95 Leu Ala Thr Leu Leu Ala Gln Thr Ile Glu Gln Phe Thr Leu Leu Arg 100 105 110 Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Val His Leu Leu Leu Trp Glu Met Met Phe Val Leu 165 170 175 Phe Ala Val Leu Ala Ala Ile Ala Phe Phe Gly Leu Gln Lys Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Met Gly Glu Lys Leu Ser Val Lys Glu Leu 195 200 205 Gly Arg Asp Tyr Arg Glu Val Leu Lys Asn Leu Arg Phe Val Ala Gly 210 215 220 Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Ala Thr Ser Tyr Glu 245 250 255 Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn 260 265 270 Leu Val Leu Ala Arg Gln Thr Ser Arg Lys Thr Val Arg Ser Leu Ile 275 280 285 Ile Leu Gly Gly Trp Pro Ile Met Ile Gly Leu Leu Ile Ser Ala Val 290 295 300 Ala Thr Val Ala Ser Thr His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Val Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser 355 360 365 Lys His Ala Tyr Glu Ala Gly Gly Ser Gly Leu Phe Ser Leu Leu Asn 370 375 380 Leu Leu Ser Gly Val Leu Trp Leu Ala Met Thr Val Tyr Phe Leu Lys 385 390 395 400 Asp Lys Arg Val Gly Ser Ser Leu Glu Pro Gln 405 410 <210> 64 <211> 409 <212> PRT <213> Pluralibacter gergoviae strain FDAARGOS_186 <400> 64 Met Gln Asn His Ala Leu Ser Gly Lys Arg Leu Gly Arg Ser Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Ala Glu Phe Gln 35 40 45 Ala Ser Thr Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Val Gly 65 70 75 80 Arg Arg Pro Val Met Leu Ala Gly Val Val Trp Phe Ile Leu Thr Cys 85 90 95 Leu Ala Thr Leu Leu Val Gln Asn Ile Glu Gln Phe Thr Leu Leu Arg 100 105 110 Phe Leu Gln Gly Cys Gly Leu Cys Phe Val Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Tyr Glu Glu Ala Val Ser Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Val His Ala Ala Ser Trp Glu Ser Met Phe Val Leu 165 170 175 Phe Ala Ala Leu Ala Ala Val Ala Phe Val Gly Leu Gln Arg Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Leu Gly Glu Arg Leu Ser Leu Lys Glu Leu 195 200 205 Gly His Asp Tyr Gly Leu Val Leu Lys Asn Leu Arg Phe Val Ala Gly 210 215 220 Ala Leu Ala Thr Gly Phe Ile Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Ala Ser Ser Tyr Glu 245 250 255 Tyr Gly Met Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn 260 265 270 Leu Val Leu Ala Lys Leu Thr Ala Arg Cys Ser Val Arg Trp Leu Ile 275 280 285 Ile Ala Gly Gly Trp Pro Ala Met Thr Gly Leu Leu Val Ala Ala Leu 290 295 300 Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Ile Tyr Ala Phe Gly Ile Gly Ile Ser Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ser Ala 340 345 350 Met Gly Val Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Ile Ser 355 360 365 Lys His Ala Tyr Gln Leu Gly Gly Ser Gly Leu Phe Ser Leu Phe Asn 370 375 380 Leu Leu Ser Gly Ala Leu Trp Leu Gly Leu Ile Ile Tyr Phe Leu Lys 385 390 395 400 Asp Lys Arg Val Gly Ser Gly Asn Arg 405 <210> 65 <211> 410 <212> PRT <213> Kluyvera ascorbata ATCC 33433 <400> 65 Met Asp Thr Ser Ser Ser Arg Lys Arg Leu Gly Arg Lys Ala Ile Leu 1 5 10 15 Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly Asn 20 25 30 Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Lys Glu Phe Asn Ala 35 40 45 Gly Asn Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly Gly 50 55 60 Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly Arg 65 70 75 80 Arg Pro Val Met Leu Thr Gly Val Ile Trp Phe Ile Val Thr Cys Leu 85 90 95 Ala Thr Leu Leu Val Asn Asn Ile Glu Gln Phe Thr Phe Leu Arg Phe 100 105 110 Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala Ala 115 120 125 Ile Gln Glu Ser Phe Asp Glu Ala Thr Cys Ile Lys Ile Thr Ala Leu 130 135 140 Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val Gly 145 150 155 160 Ala Ala Trp Ile His Val Ala Arg Trp Glu Gly Met Phe Val Leu Phe 165 170 175 Ala Ala Leu Ser Ala Ile Ala Phe Val Gly Leu Phe Lys Ser Met Pro 180 185 190 Glu Thr Ala Thr Arg Ile Gly Glu Thr Leu Ser Leu Lys Ala Leu Gly 195 200 205 Arg Asp Tyr Arg Glu Val Leu Lys Asn Gly Arg Phe Val Ala Gly Ala 210 215 220 Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala Gln 225 230 235 240 Ser Pro Val Ile Ile Ile Ser Gly Glu His Ala Ser Ser Tyr Glu Tyr 245 250 255 Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Leu Gly Asn Leu 260 265 270 Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ala Leu Ile Ile 275 280 285 Ala Gly Gly Tyr Pro Ile Met Phe Gly Leu Val Leu Ala Ala Ala Ala 290 295 300 Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu Ser 305 310 315 320 Phe Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg Leu 325 330 335 Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala Met 340 345 350 Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Leu Ser Lys 355 360 365 His Cys Tyr Glu Leu Gly Gly Ile Gly Leu Phe Ser Leu Phe Asn Leu 370 375 380 Ala Gly Gly Leu Leu Trp Leu Gly Leu Met Thr Met Phe Leu Arg Asp 385 390 395 400 Lys Ala Val Gly Ser Gly Leu Gln Pro Gln 405 410 <210> 66 <211> 409 <212> PRT <213> Enterobacter kobei <400> 66 Met Gln Asn His Ser Leu Pro Gly Arg Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Ala 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Asn 35 40 45 Ala Gly Ile Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys 85 90 95 Leu Ala Thr Leu Leu Ala Gln Asp Ile Glu Gln Phe Thr Leu Leu Arg 100 105 110 Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Asp Glu Ala Thr Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Val His Ala Ala Pro Trp Glu Gly Met Phe Val Leu 165 170 175 Phe Ala Val Leu Ala Ala Ile Ala Phe Phe Gly Leu His Arg Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Leu Gly Glu Pro Leu Ser Leu Asn Ala Leu 195 200 205 Gly Arg Asp Tyr Lys Ala Val Leu Lys Asn Gly Arg Phe Val Ala Gly 210 215 220 Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Ile Ile Ile Ile Ser Ala Glu Gly Met Ser Ser Tyr Glu 245 250 255 Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ile Gly Asn 260 265 270 Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile 275 280 285 Ile Met Gly Gly Gly Pro Ile Val Ala Gly Leu Leu Val Ala Ala Val 290 295 300 Ala Thr Val Ala Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Ile Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Ala Ile Phe Thr Val Gly Ile Glu Val Ser 355 360 365 Lys His Ala Phe Leu Ala Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn 370 375 380 Leu Ala Asn Gly Leu Ile Trp Leu Ala Leu Met Val Val Phe Leu Lys 385 390 395 400 Asp Lys Thr Val Gly Asn Ala Leu Ser 405 <210> 67 <211> 409 <212> PRT <213> Lelliottia sp. WB101 <400> 67 Met Leu Asn Arg Ser Ser Ser Gly Asn Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Asn 35 40 45 Ala Gly Ile Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys 85 90 95 Leu Ala Ile Leu Leu Ala Gln Thr Ile Glu Gln Phe Thr Leu Leu Arg 100 105 110 Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Val His Val Ala Pro Trp Glu Gly Met Phe Val Leu 165 170 175 Phe Ala Ala Leu Ala Ala Ile Ser Phe Phe Gly Leu His Arg Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Lys Glu Leu 195 200 205 Gly Arg Asp Tyr Lys Glu Val Leu Arg Asn Gly Arg Phe Val Ala Gly 210 215 220 Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Lys Leu Ser Ser Tyr Glu 245 250 255 Tyr Gly Leu Leu Gln Val Pro Val Phe Gly Ala Leu Ile Ile Gly Asn 260 265 270 Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Ser Val Arg Ser Leu Ile 275 280 285 Ile Met Gly Gly Trp Pro Ile Val Ala Gly Leu Val Val Ala Ala Val 290 295 300 Ala Thr Val Ala Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Ile Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser 355 360 365 Lys His Ala Tyr Ser Phe Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn 370 375 380 Leu Ala Asn Gly Val Leu Trp Leu Gly Leu Met Val Met Phe Leu Lys 385 390 395 400 Asp Lys Arg Val Gly Ser Ala Leu Gln 405 <210> 68 <211> 410 <212> PRT <213> Citrobacter freundii <400> 68 Met Gln Asn Arg Leu Ser Ser Gly Ala Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln 35 40 45 Ala Gly Leu Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Val Gly 65 70 75 80 Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys 85 90 95 Leu Ala Thr Leu Phe Ala Gln Asn Ile Glu Gln Phe Thr Phe Leu Arg 100 105 110 Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Val His Val Leu Pro Trp Glu Gly Met Phe Val Leu 165 170 175 Phe Ala Ala Leu Ala Ala Ile Ala Phe Phe Gly Leu Gln Arg Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Ile Lys Glu Leu 195 200 205 Gly Lys Asp Tyr Lys Leu Val Leu Lys Asn Val Arg Phe Val Ala Gly 210 215 220 Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Ile Ile Ile Ile Ser Gly Glu His Leu Ser Ser Tyr Glu 245 250 255 Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn 260 265 270 Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile 275 280 285 Ile Met Gly Gly Trp Pro Ile Ser Val Gly Leu Ile Ile Ala Ala Ala 290 295 300 Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Leu Tyr Ala Phe Gly Ile Gly Val Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Leu Ser 355 360 365 Lys His Ala Tyr Leu Leu Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn 370 375 380 Leu Ala Ser Gly Val Leu Trp Leu Ile Leu Met Val Ile Phe Leu Lys 385 390 395 400 Asp Lys Arg Val Gly Asn Ser Arg Glu Gly 405 410 <210> 69 <211> 410 <212> PRT <213> Salmonella enterica subsp. Salamae <400> 69 Met His Asn Arg Leu Gln Ser Gly Gly Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Ala Gln Tyr Gln 35 40 45 Ala Ser Leu Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Ala Gly Val Val Trp Phe Ile Val Thr Cys 85 90 95 Leu Ala Thr Leu Leu Ala Lys Asn Ile Glu Gln Phe Thr Phe Leu Arg 100 105 110 Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Val His Val Leu Pro Trp Glu Gly Met Phe Ile Leu 165 170 175 Phe Ala Val Leu Ala Ala Ile Ala Phe Phe Gly Leu Gln Arg Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Arg Gly Glu Thr Leu Ser Phe Lys Val Leu 195 200 205 Gly Arg Asp Tyr Arg Leu Val Ile Lys Asn Arg Arg Phe Val Ala Gly 210 215 220 Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Ile Ile Ile Ile Ser Gly Glu Gln Leu Ser Ser Tyr Glu 245 250 255 Tyr Gly Leu Leu Gln Val Pro Val Phe Gly Ala Leu Ile Ala Gly Asn 260 265 270 Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile 275 280 285 Val Met Gly Gly Trp Pro Ile Val Ala Gly Leu Ile Ile Ala Ala Ala 290 295 300 Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Val Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ser Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser 355 360 365 Lys His Ala Trp Leu Ser Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn 370 375 380 Leu Ala Asn Gly Ile Leu Trp Leu Leu Leu Met Leu Val Phe Leu Lys 385 390 395 400 Asp Lys Arg Thr Gly Asp Ser Gln Thr Gly 405 410 <210> 70 <211> 408 <212> PRT <213> Shigella flexneri <400> 70 Met Gln Asn Lys Leu Ala Ser Gly Ala Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln 35 40 45 Ala Gly Ile Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Ala Gly Val Val Trp Phe Ile Val Thr Cys 85 90 95 Leu Ala Ile Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Leu Leu Arg 100 105 110 Phe Leu Gln Gly Ile Ser Phe Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Ile His Val Leu Pro Trp Glu Gly Met Phe Val Leu 165 170 175 Phe Ala Ala Leu Ala Ala Ile Ser Phe Phe Gly Leu Gln Arg Ala Met 180 185 190 Pro Glu Thr Ala Met Arg Ile Gly Glu Lys Leu Ser Leu Lys Glu Leu 195 200 205 Gly Arg Asp Tyr Lys Leu Val Leu Lys Asn Gly Arg Phe Val Ala Gly 210 215 220 Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala Gln Ser 225 230 235 240 Pro Ile Ile Ile Ile Thr Gly Glu Gln Leu Ser Ser Tyr Glu Tyr Gly 245 250 255 Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn Leu Leu 260 265 270 Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile Ile Met 275 280 285 Gly Gly Trp Pro Ile Met Ile Gly Leu Leu Val Ala Ala Ala Ala Thr 290 295 300 Val Ile Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu Ser Ile 305 310 315 320 Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg Leu Thr 325 330 335 Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala Met Gly 340 345 350 Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Ile Ser Lys His 355 360 365 Ala Trp Leu Asn Gly Gly Asn Gly Leu Phe Asn Leu Phe Asn Leu Val 370 375 380 Asn Gly Ile Leu Trp Leu Ser Leu Met Val Ile Phe Leu Lys Asp Lys 385 390 395 400 Gln Met Gly Asn Ser His Gly Gly 405 <210> 71 <211> 410 <212> PRT <213> Cronobacter sakazakii strain MOD1_LR634 <400> 71 Met Gln Thr His Ala Asn Arg Thr Gly Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln 35 40 45 Ala Gly Val Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Ala Gly Val Ala Trp Phe Ile Val Ala Cys 85 90 95 Leu Ala Thr Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Val Leu Arg 100 105 110 Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Val His Ala Ala Pro Trp Glu Met Met Phe Val Leu 165 170 175 Phe Ala Val Leu Ala Thr Ile Ser Phe Phe Gly Leu Trp Arg Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Arg Glu Leu 195 200 205 Gly Arg Asp Tyr Lys Ala Val Leu Lys Asn Leu Arg Phe Val Ser Gly 210 215 220 Ala Leu Ala Ile Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Met Ser Thr Tyr Glu 245 250 255 Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Val Gly Asn 260 265 270 Leu Val Leu Ala Lys Leu Thr Ala Arg Arg Ser Val Arg Ser Leu Ile 275 280 285 Val Met Gly Gly Trp Pro Met Met Phe Gly Leu Ala Leu Ala Ala Leu 290 295 300 Ala Thr Val Ile Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Ile Tyr Ala Phe Gly Ile Gly Ile Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ala Ser Asp Ile Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Thr Ile Phe Thr Val Gly Ile Glu Ile Ser 355 360 365 Lys His Ala Trp Leu Gly Gly Gly Asn Ala Leu Phe Asn Leu Phe Asn 370 375 380 Phe Ala Ser Gly Leu Leu Trp Leu Gly Leu Met Val Ile Phe Leu Lys 385 390 395 400 Asp Lys Thr Val Gly Thr Arg Pro Glu Ala 405 410 <210> 72 <211> 410 <212> PRT <213> Cronobacter condimenti strain s37 <400> 72 Met Gln Thr His Ala Asn Arg Thr Gly Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln 35 40 45 Ala Gly Val Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Ala Gly Val Val Trp Phe Ile Val Thr Cys 85 90 95 Leu Ala Thr Leu Leu Ala Gln Thr Ile Glu Gln Phe Thr Val Leu Arg 100 105 110 Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Val His Ala Ala Pro Trp Glu Met Met Phe Val Leu 165 170 175 Phe Ala Ala Leu Ala Ala Ile Ser Phe Phe Gly Leu Trp Arg Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Arg Glu Leu 195 200 205 Gly Arg Asp Tyr Lys Ala Val Leu Lys Asn Leu Arg Phe Val Ser Gly 210 215 220 Ala Leu Ala Ile Gly Phe Ile Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Met Ser Thr Tyr Glu 245 250 255 Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Val Gly Asn 260 265 270 Leu Leu Leu Ala Lys Leu Thr Ala Arg Arg Ser Val Arg Ser Leu Ile 275 280 285 Ile Met Gly Gly Trp Pro Met Met Ile Gly Leu Ala Leu Ala Ala Leu 290 295 300 Ala Thr Val Leu Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Ile Tyr Ala Phe Gly Ile Gly Ile Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ala Ser Asp Ile Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Thr Ile Phe Thr Val Gly Ile Glu Val Ser 355 360 365 Lys His Ala Trp Ile Ile Gly Gly Asn Ala Leu Phe Asn Leu Phe Ser 370 375 380 Phe Ala Ser Gly Leu Leu Trp Leu Gly Leu Met Val Ile Phe Leu Lys 385 390 395 400 Asp Lys Thr Val Gly Ala Ser Arg Gly Gly 405 410 <210> 73 <211> 410 <212> PRT <213> Cronobacter sp. EKM102R <400> 73 Met Gln Thr His Ala Asn Arg Thr Gly Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln 35 40 45 Ala Gly Val Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Ala Gly Val Val Trp Phe Ile Val Thr Cys 85 90 95 Leu Ala Thr Leu Leu Ala Gln Thr Ile Glu Gln Phe Thr Val Leu Arg 100 105 110 Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Val His Ala Ala Pro Trp Glu Met Met Phe Val Leu 165 170 175 Phe Ala Ala Leu Ala Ala Ile Ser Phe Phe Gly Leu Trp Arg Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Arg Glu Leu 195 200 205 Gly Arg Asp Tyr Lys Ala Val Leu Lys Asn Leu Arg Phe Val Ser Gly 210 215 220 Ala Leu Ala Ile Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Met Ser Thr Tyr Glu 245 250 255 Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Leu Gly Asn 260 265 270 Leu Val Leu Ala Lys Leu Thr Ala Arg Arg Ala Val Arg Ser Leu Ile 275 280 285 Val Met Gly Gly Trp Pro Ile Val Ala Gly Leu Ala Leu Ala Ala Leu 290 295 300 Ala Thr Val Ile Ser Ser His Ser Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Ile Tyr Ala Phe Gly Ile Gly Ile Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ala Ser Asp Ile Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Thr Ile Phe Thr Val Gly Ile Glu Val Ser 355 360 365 Lys His Ala Trp Ile Gly Gly Gly Asn Ala Leu Phe Asn Leu Phe Asn 370 375 380 Phe Ala Ser Gly Leu Leu Trp Leu Gly Leu Met Val Ile Phe Leu Lys 385 390 395 400 Asp Lys Thr Val Gly Thr Arg Pro Glu Gly 405 410 <210> 74 <211> 410 <212> PRT <213> Cronobacter universalis NCTC 9529 <400> 74 Met Gln Thr His Ala Asn Arg Thr Gly Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln 35 40 45 Ala Gly Val Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Ala Gly Val Val Trp Phe Ile Val Thr Cys 85 90 95 Leu Ala Thr Leu Leu Ala Gln Thr Ile Glu Gln Phe Thr Val Leu Arg 100 105 110 Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Val His Ala Ala Pro Trp Glu Met Met Phe Val Leu 165 170 175 Phe Ala Ala Leu Ala Ala Ile Ser Phe Phe Gly Leu Trp Arg Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Arg Glu Leu 195 200 205 Gly Arg Asp Tyr Lys Ala Val Leu Lys Asn Leu Arg Phe Val Ser Gly 210 215 220 Ala Leu Ala Ile Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Met Ser Thr Tyr Glu 245 250 255 Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ile Gly Asn 260 265 270 Leu Val Leu Ala Lys Leu Thr Ala Arg Arg Ser Val Arg Ser Leu Ile 275 280 285 Val Met Gly Gly Trp Pro Met Met Ala Gly Leu Ala Leu Ala Ala Leu 290 295 300 Ala Thr Val Ile Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Ile Tyr Ala Phe Gly Ile Gly Ile Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ala Ser Asp Ile Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Thr Ile Phe Thr Val Gly Ile Glu Val Ser 355 360 365 Lys His Ala Trp Leu Gly Gly Gly Asn Ala Leu Phe Asn Leu Phe Asn 370 375 380 Phe Ala Ser Gly Leu Leu Trp Leu Gly Leu Met Ala Ile Phe Leu Lys 385 390 395 400 Asp Lys Thr Val Gly Thr Arg Pro Glu Gly 405 410 <210> 75 <211> 411 <212> PRT <213> Salmonella enterica strain 413_SENT <400> 75 Met Gln Asn Asn Ser Leu Thr Lys Lys Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln 35 40 45 Ala Gly Val Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys 85 90 95 Leu Ala Thr Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Ala Leu Arg 100 105 110 Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Val His Val Ala Pro Trp Glu Met Met Phe Val Leu 165 170 175 Phe Ala Val Leu Ala Ala Ile Ser Trp Tyr Gly Leu Trp Arg Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Gly Glu Leu 195 200 205 Gly Arg Asp Tyr Lys Ala Val Met Lys Asn Ala Arg Phe Val Ala Gly 210 215 220 Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Leu Ser Ser Tyr Glu 245 250 255 Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn 260 265 270 Leu Val Leu Ala Lys Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile 275 280 285 Ile Leu Gly Gly Trp Pro Ile Ala Phe Gly Leu Ala Met Ala Ala Leu 290 295 300 Ala Thr Leu Phe Ser Ala His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Val Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ala Ser Asp Ile Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser 355 360 365 Lys His Ala Tyr Leu Ala Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn 370 375 380 Leu Leu Asn Gly Leu Leu Trp Val Ala Met Met Val Ile Phe Leu Lys 385 390 395 400 Asp Lys Thr Val Gly Asn Ser Leu Gln Pro Gln 405 410 <210> 76 <211> 393 <212> PRT <213> Klebsiella pneumoniae subsp. pneumoniae strain NCTC11695 <400> 76 Met Gln Asn Tyr Ser Leu Ser Gly Arg Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Gln Glu Phe Gln 35 40 45 Val Gly Asn Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys 85 90 95 Leu Ala Thr Leu Leu Ala Gln Thr Ile Glu Gln Phe Thr Leu Leu Arg 100 105 110 Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Val His Val Leu Pro Trp Glu Met Met Phe Val Leu 165 170 175 Phe Ala Val Leu Ala Ala Ile Ser Phe Val Gly Leu Gln Arg Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Val Lys Glu Leu 195 200 205 Gly Arg Asp Tyr Arg Leu Val Leu Lys Asn Leu Arg Phe Val Ala Gly 210 215 220 Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Ala Thr Ser Tyr Glu 245 250 255 Tyr Gly Met Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn 260 265 270 Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile 275 280 285 Ile Met Gly Gly Trp Pro Ile Met Phe Gly Leu Ile Leu Ser Ala Ala 290 295 300 Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Phe Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Leu Ser 355 360 365 Lys His Ala Tyr Glu Leu Gly Ala Thr Ala Cys Ser Ala Cys Leu Thr 370 375 380 Cys Trp Ala Glu Tyr Cys Gly Trp Gly 385 390 <210> 77 <211> 410 <212> PRT <213> Klebsiella aerogenes strain 4928STDY7071344 <400> 77 Met Gln Asn Tyr Ser Leu Ser Gly Lys Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Gln Glu Phe Gln 35 40 45 Val Gly Asn Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys 85 90 95 Leu Ala Thr Leu Leu Ala Gln Thr Ile Glu Gln Phe Thr Leu Leu Arg 100 105 110 Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Val His Met Leu Pro Trp Glu Met Met Phe Val Leu 165 170 175 Phe Ala Val Leu Ala Ala Ile Ser Phe Ile Gly Leu Gln Arg Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Met Gly Glu Lys Leu Ser Val Lys Glu Leu 195 200 205 Gly Arg Asp Tyr Arg Leu Val Leu Lys Asn Leu Arg Phe Val Ala Gly 210 215 220 Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Ala Thr Ser Tyr Glu 245 250 255 Tyr Gly Met Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn 260 265 270 Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Ser Val Arg Ser Leu Ile 275 280 285 Ile Met Gly Gly Trp Pro Ile Met Phe Gly Leu Leu Leu Ser Ala Ala 290 295 300 Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Phe Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Leu Ser 355 360 365 Lys His Ala Tyr Glu Leu Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn 370 375 380 Leu Leu Gly Gly Val Leu Trp Leu Gly Leu Ile Ile Tyr Phe Leu Lys 385 390 395 400 Asp Lys Ser Val Gly Ser Ser Gln Gln Ala 405 410 <210> 78 <211> 412 <212> PRT <213> Raoultella planticola strain FDAARGOS_283 <400> 78 Met Gln Asn Tyr Ser Leu Ser Gly Lys Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ser Val Val Glu Glu Phe Gln 35 40 45 Val Gly Asn Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys 85 90 95 Leu Ala Thr Leu Leu Ala Gln Thr Ile Glu Gln Phe Thr Leu Leu Arg 100 105 110 Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Glu Glu Ala Met Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Val His Ile Leu Pro Trp Glu Met Met Phe Val Leu 165 170 175 Phe Ala Val Leu Ala Ala Ile Ala Phe Val Gly Leu Gln Arg Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Met Gly Glu Lys Leu Ser Met Lys Glu Leu 195 200 205 Gly Arg Asp Tyr Gly Leu Val Leu Lys Asn Leu Arg Phe Val Ala Gly 210 215 220 Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Lys Ala Thr Ser Tyr Glu 245 250 255 Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn 260 265 270 Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile 275 280 285 Ile Leu Gly Gly Trp Pro Ile Met Phe Gly Leu Leu Leu Ser Ala Val 290 295 300 Ala Thr Val Val Ser Thr His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Val Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser 355 360 365 Lys His Ala Tyr Glu Leu Gly Gly Ser Gly Val Phe Ser Leu Phe Asn 370 375 380 Leu Leu Ser Gly Val Met Trp Leu Ala Met Ile Val Tyr Phe Leu Lys 385 390 395 400 Asp Lys Ser Val Gly Asn Ser Asn Asp Pro Gln Ala 405 410 <210> 79 <211> 411 <212> PRT <213> Klebsiella sp. 2680 <400> 79 Met His Asn Tyr Ser Leu Ala Gly Lys Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ser Val Val Asp Ala Phe Gly 35 40 45 Val Gly Asn Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Ala Thr Cys 85 90 95 Leu Ala Thr Leu Leu Ala Gln Thr Ile Glu Gln Phe Thr Leu Leu Arg 100 105 110 Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Val His Phe Leu Pro Trp Glu Met Met Phe Val Leu 165 170 175 Phe Ala Val Leu Ala Thr Ile Ala Phe Val Gly Leu Gln Arg Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Gln Gly Glu Lys Leu Ser Val Lys Ala Leu 195 200 205 Gly Arg Asp Tyr Arg Asp Val Leu Lys Asn Arg Arg Phe Val Ala Gly 210 215 220 Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Ala Thr Ser Tyr Glu 245 250 255 Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn 260 265 270 Leu Val Leu Ala Arg Gln Thr Ser Arg Lys Thr Val Arg Ser Leu Ile 275 280 285 Ile Leu Gly Gly Trp Pro Ile Ile Thr Gly Leu Leu Ile Ser Ala Ala 290 295 300 Ala Thr Val Val Ser Ala His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Val Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser 355 360 365 Lys His Ala Trp Glu Phe Gly Gly Ser Gly Leu Phe Ser Leu Leu Asn 370 375 380 Leu Leu Ser Gly Ala Leu Trp Leu Val Met Thr Ala Tyr Phe Leu Lys 385 390 395 400 Asp Lys Arg Ala Gly Asn Ser Arg Glu Pro Gln 405 410 <210> 80 <211> 411 <212> PRT <213> Kluyvera georgiana strain HRGM_Genome_0064 <400> 80 Met Asp Thr Leu Ser Ser Ser Arg Lys Arg Leu Gly Arg Lys Ala Ile 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Lys Glu Phe Asn 35 40 45 Ala Gly Asp Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys 85 90 95 Leu Ala Thr Leu Leu Val Gln Asn Ile Glu Gln Phe Thr Phe Leu Arg 100 105 110 Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Tyr Asp Glu Ala Thr Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Ile His Val Ala Arg Trp Glu Ser Met Phe Val Leu 165 170 175 Phe Ala Ala Leu Ala Ala Leu Ala Tyr Ile Gly Leu His Lys Glu Met 180 185 190 Pro Glu Thr Ala Thr Arg Ile Gly Glu Lys Leu Ser Leu Lys Glu Leu 195 200 205 Gly Arg Asp Tyr Arg Glu Val Leu Lys Asn Gly Arg Phe Val Ala Gly 210 215 220 Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gly Ala Ser Ser Tyr Glu 245 250 255 Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Leu Gly Asn 260 265 270 Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ala Leu Ile 275 280 285 Val Ala Gly Gly Tyr Pro Ile Met Phe Gly Leu Ile Leu Ala Ala Ala 290 295 300 Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Phe Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Leu Ser 355 360 365 Lys His Met Tyr Leu Leu Gly Gly Ile Gly Leu Phe Ser Leu Phe Asn 370 375 380 Leu Ala Gly Gly Leu Leu Trp Leu Gly Leu Met Val Met Phe Leu Arg 385 390 395 400 Asp Lys Thr Val Gly Ser Gly Leu Gln Pro Gln 405 410 <210> 81 <211> 411 <212> PRT <213> Kluyvera intermedia strain NCTC12125 <400> 81 Met Asp Thr Ser Ser Ser Ser Arg Lys Arg Leu Gly Arg Lys Ala Ile 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Ala 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Lys Glu Phe Asn 35 40 45 Ala Gly Asp Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Thr Gly Val Ile Trp Phe Ile Val Thr Cys 85 90 95 Leu Ala Thr Leu Met Val Gln Asn Ile Glu Gln Phe Thr Phe Leu Arg 100 105 110 Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Asp Glu Ala Thr Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Ile His Leu Ala Arg Trp Glu Ser Met Phe Val Leu 165 170 175 Phe Ala Val Leu Ala Ala Ile Ala Tyr Val Gly Leu Phe Lys Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Lys Thr Leu 195 200 205 Gly Gln Asp Tyr Arg Glu Val Leu Lys Asn Gly Arg Phe Val Ala Gly 210 215 220 Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Asn Ala Ser Ser Tyr Glu 245 250 255 Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Leu Gly Asn 260 265 270 Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ala Leu Ile 275 280 285 Ile Ala Gly Gly Tyr Pro Ile Met Phe Gly Leu Ile Leu Ala Ala Ala 290 295 300 Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Phe Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Leu Ser 355 360 365 Lys His Ser Tyr Gln Met Gly Gly Ile Gly Leu Phe Ser Leu Phe Asn 370 375 380 Leu Ala Gly Gly Val Leu Trp Leu Val Leu Met Val Met Phe Leu Arg 385 390 395 400 Asp Lys Thr Val Gly Ser Gly Leu Gln Pro Glu 405 410 <210> 82 <211> 431 <212> PRT <213> Salmonella enterica strain 2014K-0203 <400> 82 Met His Asn Arg Leu Gln Ser Gly Val Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln 35 40 45 Val Ser Leu Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Ala Gly Ile Val Trp Phe Ile Ala Thr Cys 85 90 95 Leu Ala Thr Leu Leu Ala Lys Asn Ile Glu Gln Phe Thr Phe Leu Arg 100 105 110 Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Val His Val Leu Pro Trp Glu Gly Met Phe Val Leu 165 170 175 Phe Ala Ala Leu Ala Ala Ile Ala Phe Phe Gly Leu Gln Arg Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Arg Gly Glu Thr Leu Ser Leu Lys Ala Leu 195 200 205 Gly Arg Asp Tyr Arg Leu Val Ile Lys Asn Arg Arg Phe Val Ala Gly 210 215 220 Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Ile Ile Ile Ile Ser Gly Glu Gln Leu Ser Ser Tyr Glu 245 250 255 Tyr Gly Leu Leu Gln Val Pro Val Phe Gly Ala Leu Ile Ala Gly Asn 260 265 270 Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile 275 280 285 Val Met Gly Gly Trp Pro Ile Val Val Gly Leu Ile Ile Ala Ala Ala 290 295 300 Ala Ala Val Val Ser Ser His Ala Tyr Leu Trp Met Met Ala Gly Leu 305 310 315 320 Ser Val Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ser Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser 355 360 365 Lys His Ala Trp Leu Ser Gly Gly Asn Glu Leu Phe Ser Leu Phe Asn 370 375 380 Leu Ala Asn Gly Ile Leu Trp Leu Leu Leu Met Leu Val Phe Leu Lys 385 390 395 400 Asp Lys Arg Ala Gly Ile Arg Lys Gln Ala Lys Arg Ala Ala Met Pro 405 410 415 Asp Lys Pro Ser Val Ile Arg His Arg Glu Ala Ser Ala Lys Arg 420 425 430 <210> 83 <211> 416 <212> PRT <213> Salmonella bongori strain 85-0051 <400> 83 Met His Asn Arg Thr Gln Ser Gly Ala Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln 35 40 45 Ala Gly Leu Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Ala Gly Val Ile Trp Phe Ile Val Thr Cys 85 90 95 Leu Ala Thr Leu Leu Ala Lys Asn Ile Glu Gln Phe Thr Phe Leu Arg 100 105 110 Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Val His Val Leu Pro Trp Glu Gly Met Phe Ile Leu 165 170 175 Phe Ala Ala Leu Ala Ala Ile Ala Phe Phe Gly Leu Gln Arg Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Arg Gly Glu Thr Leu Ser Leu Lys Asp Leu 195 200 205 Gly Arg Asp Tyr Gln Arg Val Ile Lys Asn Arg Arg Phe Val Ala Gly 210 215 220 Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Ile Ile Ile Ile Ser Gly Glu Gln Leu Ser Ser Tyr Glu 245 250 255 Tyr Gly Leu Leu Gln Val Pro Val Phe Gly Ala Leu Ile Ala Gly Asn 260 265 270 Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile 275 280 285 Val Met Gly Gly Trp Pro Ile Val Ala Gly Leu Ile Ile Ala Ala Ala 290 295 300 Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Ile Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser 355 360 365 Lys His Ala Trp Leu Ser Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn 370 375 380 Leu Ala Asn Gly Ile Phe Trp Leu Leu Leu Met Leu Val Phe Leu Lys 385 390 395 400 Asn Lys Arg Thr Gly Asp Ser Gln Thr Asp Pro Glu Ser Gly Tyr Ala 405 410 415 <210> 84 <211> 412 <212> PRT <213> Salmonella enterica subsp. enterica serovar Hillingdon strain S01-0588 <400> 84 Met Val Cys Arg Ile Val Tyr Asn Gln Ala Ala Gly Trp Asp Val Arg 1 5 10 15 Arg Cys Phe Phe Leu Ser Val Trp Cys Cys Thr Ser Phe Ser Thr Tyr 20 25 30 Ile Gly Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln 35 40 45 Tyr Gln Ala Gly Leu Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu 50 55 60 Ala Gly Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg 65 70 75 80 Ile Gly Arg Arg Pro Val Met Leu Ala Gly Val Val Trp Phe Ile Val 85 90 95 Thr Cys Leu Ala Thr Leu Leu Ala Lys Asn Ile Glu Gln Phe Thr Phe 100 105 110 Leu Arg Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly 115 120 125 Tyr Ala Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile 130 135 140 Thr Ala Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro 145 150 155 160 Leu Val Gly Ala Ala Trp Val His Val Leu Pro Trp Glu Gly Met Phe 165 170 175 Ile Leu Phe Ala Ala Leu Ala Ala Ile Ala Phe Phe Gly Leu Gln Arg 180 185 190 Ala Met Pro Glu Thr Ala Thr Arg Arg Gly Glu Thr Leu Ser Phe Lys 195 200 205 Ala Leu Gly Arg Asp Tyr Arg Leu Val Ile Lys Asn Arg Arg Phe Val 210 215 220 Ala Gly Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp 225 230 235 240 Ile Ala Gln Ser Pro Ile Ile Ile Ile Ser Gly Glu Gln Leu Ser Ser 245 250 255 Tyr Glu Tyr Gly Leu Leu Gln Val Pro Val Phe Gly Ala Leu Ile Ala 260 265 270 Gly Asn Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser 275 280 285 Leu Ile Val Met Gly Gly Trp Pro Ile Val Ala Gly Leu Ile Ile Ala 290 295 300 Ala Ala Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala 305 310 315 320 Gly Leu Ser Val Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu 325 330 335 Val Arg Leu Thr Leu Phe Ser Ser Asp Met Ser Lys Gly Thr Val Ser 340 345 350 Ala Ala Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu 355 360 365 Val Ser Lys His Ala Trp Leu Ser Gly Gly Asn Gly Leu Phe Ser Leu 370 375 380 Phe Asn Leu Ala Asn Gly Ile Leu Trp Leu Leu Leu Met Leu Val Phe 385 390 395 400 Leu Lys Asp Lys Arg Thr Gly Asn Leu Gln Thr Val 405 410 <210> 85 <211> 410 <212> PRT <213> Citrobacter youngae strain TE1 <400> 85 Met Gln Asn Arg Leu Ser Ser Gly Ala Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Ala 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln 35 40 45 Ala Gly Ile Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Ala Gly Val Val Trp Phe Ile Val Thr Cys 85 90 95 Leu Ala Thr Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Phe Leu Arg 100 105 110 Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Val His Val Leu Pro Trp Glu Gly Met Phe Val Leu 165 170 175 Phe Ala Val Leu Ala Ala Phe Ala Phe Phe Gly Leu Gln Arg Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Ile Gly Glu Lys Leu Ser Leu Lys Glu Leu 195 200 205 Trp Arg Asp Tyr Lys Leu Val Leu Lys Asn Val Arg Phe Val Ala Gly 210 215 220 Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Ile Ile Ile Ile Ser Gly Glu Gln Leu Ser Ser Tyr Glu 245 250 255 Tyr Gly Leu Leu Gln Val Pro Val Phe Gly Ala Leu Ile Ala Gly Asn 260 265 270 Leu Val Leu Ala Arg Leu Thr Ala Arg Arg Thr Val Arg Ser Leu Ile 275 280 285 Ile Met Gly Gly Trp Pro Ile Met Leu Gly Leu Ile Leu Ala Ala Ala 290 295 300 Ala Thr Val Ala Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Leu Tyr Ala Phe Gly Ile Gly Val Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser 355 360 365 Lys Tyr Ala Tyr Leu Gly Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn 370 375 380 Leu Ala Asn Gly Ile Leu Trp Leu Leu Leu Met Phe Ile Phe Leu Lys 385 390 395 400 Asp Lys Gln Val Gly Ala Ser Arg Gly Gly 405 410 <210> 86 <211> 410 <212> PRT <213> Citrobacter sp. RHB21-C01 <400> 86 Met Gln Asn Arg Leu Gln Gln Gly Ala Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Ala Gln Tyr Gln 35 40 45 Ala Gly Ile Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Ala Gly Val Val Trp Phe Ile Val Thr Cys 85 90 95 Leu Ala Thr Leu Leu Ala Gln Thr Ile Glu Gln Phe Thr Leu Leu Arg 100 105 110 Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Val His Val Leu Pro Trp Glu Gly Met Phe Val Leu 165 170 175 Phe Ala Val Leu Ala Ala Met Ala Phe Phe Gly Leu Gln Arg Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Ile Gly Glu Pro Leu Ser Leu Lys Ala Leu 195 200 205 Gly Arg Asp Tyr Gln Gln Val Met Lys Asn Gly Arg Phe Val Ala Gly 210 215 220 Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Ile Ile Ile Ile Ser Gly Glu Gln Leu Ser Ser Tyr Gln 245 250 255 Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn 260 265 270 Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile 275 280 285 Ile Ile Gly Gly Trp Pro Ile Val Leu Gly Leu Ile Leu Ala Ala Ala 290 295 300 Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Val Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Leu Ile Phe Thr Leu Gly Ile Glu Val Ser 355 360 365 Lys Tyr Ala Tyr Leu Ser Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn 370 375 380 Leu Thr Asn Gly Ile Leu Trp Leu Leu Leu Met Val Ile Phe Leu Lys 385 390 395 400 Asp Lys Gln Val Gly Asn Thr Arg Glu Gly 405 410 <210> 87 <211> 410 <212> PRT <213> Citrobacter werkmanii strain MGYG-HGUT-02535 <400> 87 Met His Asn Arg Leu Ser Ser Gly Ala Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln 35 40 45 Ala Gly Leu Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys 85 90 95 Leu Ala Thr Leu Phe Ala Gln Asn Ile Glu Gln Phe Thr Phe Leu Arg 100 105 110 Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Val His Val Leu Pro Trp Glu Gly Met Phe Val Leu 165 170 175 Phe Ala Val Leu Ala Ala Ile Ala Phe Val Gly Leu Gln Arg Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Leu Gly Glu Thr Leu Ser Ile Lys Glu Leu 195 200 205 Gly Lys Asp Tyr Lys Leu Val Leu Lys Asn Val Arg Phe Val Ala Gly 210 215 220 Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Ile Ile Ile Ile Ser Gly Glu Gln Leu Ser Ser Tyr Glu 245 250 255 Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn 260 265 270 Leu Val Leu Ala Arg Leu Thr Ala Arg Arg Thr Val Arg Ser Leu Ile 275 280 285 Ile Met Gly Gly Trp Pro Ile Ala Val Gly Leu Ile Ile Ala Ala Ala 290 295 300 Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Val Tyr Ala Phe Gly Ile Gly Val Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Leu Ser 355 360 365 Lys His Ala Tyr Leu Leu Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn 370 375 380 Leu Ala Ser Gly Ile Leu Trp Leu Ala Leu Met Phe Ile Phe Leu Lys 385 390 395 400 Asp Lys Arg Val Gly Asp Ser Arg Glu Gly 405 410 <210> 88 <211> 409 <212> PRT <213> Enterobacteriaceae bacterium UBA3109 <400> 88 Met Gln Asn His Ser Leu Ser Gly Gly Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Ala 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr His 35 40 45 Ala Gly Ile Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Leu Thr Cys 85 90 95 Leu Ala Thr Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Ile Leu Arg 100 105 110 Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Asp Glu Ala Thr Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Val His Ala Ala Pro Trp Glu Gly Met Phe Ile Leu 165 170 175 Phe Ala Val Leu Ala Ala Ile Ala Phe Phe Gly Leu Gln Arg Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Leu Gly Glu Pro Leu Ser Leu Lys Ala Leu 195 200 205 Gly Arg Asp Tyr Lys Ala Val Leu Lys Asn Val Arg Phe Val Ala Gly 210 215 220 Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Ile Ile Ile Ile Ser Gly Glu Gly Met Ser Ser Tyr Glu 245 250 255 Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ile Gly Asn 260 265 270 Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ala Leu Ile 275 280 285 Ile Phe Gly Gly Trp Pro Ile Val Phe Gly Leu Ala Leu Ala Ala Val 290 295 300 Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Leu Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Ala Ile Phe Thr Val Gly Ile Glu Leu Ser 355 360 365 Lys His Ala Tyr Leu Ser Gly Gly Ser Gly Leu Phe Ser Leu Phe Asn 370 375 380 Leu Val Asn Gly Val Leu Trp Val Ala Leu Met Val Val Phe Leu Arg 385 390 395 400 Asp Lys Ser Val Gly Asn Ala Leu Ser 405 <210> 89 <211> 409 <212> PRT <213> Enterobacteriaceae bacterium UBA6698 <400> 89 Met Pro Asn His Ala Leu Pro Gly Arg Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Ala 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Asn 35 40 45 Ala Gly Ile Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys 85 90 95 Leu Ala Thr Leu Leu Ala Gln Asp Ile Glu Gln Phe Thr Ile Leu Arg 100 105 110 Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Asp Glu Ala Thr Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Val His Ala Ala Pro Trp Glu Gly Met Phe Val Leu 165 170 175 Phe Ala Val Leu Ala Ala Ile Ala Phe Phe Gly Leu His Arg Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Leu Gly Glu Pro Leu Ser Leu Asn Ala Leu 195 200 205 Gly Arg Asp Tyr Lys Ala Val Met Lys Asn Gly Arg Phe Val Ala Gly 210 215 220 Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Ile Ile Ile Ile Ser Ala Glu Gly Met Ser Ser Tyr Glu 245 250 255 Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ile Gly Asn 260 265 270 Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile 275 280 285 Ile Met Gly Gly Gly Pro Ile Val Ala Gly Leu Leu Leu Ala Ala Val 290 295 300 Ala Thr Val Ala Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Ile Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Ala Ile Phe Thr Val Gly Ile Glu Val Ser 355 360 365 Lys His Ala Phe Leu Ala Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn 370 375 380 Leu Ala Asn Gly Leu Ile Trp Leu Val Leu Met Val Val Phe Leu Lys 385 390 395 400 Asp Lys Ser Val Gly Asn Ala Leu Ser 405 <210> 90 <211> 411 <212> PRT <213> Leclercia sp. 4-9-1-25 <400> 90 Met Leu Asn Arg Ser Ser Ser Gly Asn Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Asn 35 40 45 Ala Gly Ile Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys 85 90 95 Leu Ala Ile Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Phe Leu Arg 100 105 110 Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Val His Val Ala Pro Trp Glu Gly Met Phe Ile Leu 165 170 175 Phe Ala Leu Leu Ala Ala Ile Ser Phe Phe Gly Leu Trp Lys Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Leu Gly Glu Thr Leu Ser Met Arg Glu Leu 195 200 205 Gly Arg Asp Tyr Lys Ala Val Met Lys Asn Val Arg Phe Val Ala Gly 210 215 220 Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Leu Ser Ser Tyr Glu 245 250 255 Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ile Gly Asn 260 265 270 Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile 275 280 285 Ile Met Gly Gly Trp Pro Ile Thr Leu Gly Leu Leu Leu Ala Ala Val 290 295 300 Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Leu Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser 355 360 365 Lys His Ala Phe Ser Phe Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn 370 375 380 Leu Ala Asn Gly Leu Leu Trp Leu Val Leu Met Val Ile Phe Leu Lys 385 390 395 400 Asp Lys Arg Val Gly Asn Ala Leu Gln Pro Asp 405 410 <210> 91 <211> 411 <212> PRT <213> Lelliottia amnigena strain TZW14 <400> 91 Met Leu Asn Arg Ser Ser Ser Ser Gly His Arg Leu Gly Arg Gln Ala 1 5 10 15 Leu Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile 20 25 30 Ala Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Ala Gln Tyr 35 40 45 Asn Ala Gly Ile Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala 50 55 60 Gly Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile 65 70 75 80 Gly Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr 85 90 95 Cys Leu Ala Ile Leu Leu Ala Gln Thr Ile Glu Gln Phe Met Val Leu 100 105 110 Arg Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr 115 120 125 Ala Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr 130 135 140 Ala Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu 145 150 155 160 Val Gly Ala Ala Trp Val His Val Ala Pro Trp Glu Gly Met Phe Ile 165 170 175 Leu Phe Ala Leu Leu Ala Ala Ile Ser Trp Tyr Gly Leu His Arg Ala 180 185 190 Met Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Lys Glu 195 200 205 Leu Gly Arg Asp Tyr Lys Glu Val Leu Lys Asn Val Arg Phe Val Ala 210 215 220 Gly Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile 225 230 235 240 Ala Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Lys Leu Ser Ser Tyr 245 250 255 Glu Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ile Gly 260 265 270 Asn Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Ser Val Arg Ser Leu 275 280 285 Ile Ile Leu Gly Gly Trp Pro Ile Ala Gly Gly Leu Ile Leu Ala Ala 290 295 300 Val Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly 305 310 315 320 Leu Ser Ile Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val 325 330 335 Arg Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala 340 345 350 Ala Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val 355 360 365 Ser Lys His Ala Tyr Ile Ile Gly Gly Asn Gly Leu Phe Ser Leu Phe 370 375 380 Asn Leu Ala Asn Gly Val Leu Trp Val Gly Leu Met Val Ile Phe Leu 385 390 395 400 Lys Asn Lys Arg Val Gly Asn Ala Leu Gln Pro 405 410 <210> 92 <211> 409 <212> PRT <213> Lelliottia aquatilis strain TZW17 <400> 92 Met Leu Asn Arg Ser Ser Ser Gly Asn Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Phe Asn 35 40 45 Ala Gly Ile Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys 85 90 95 Leu Ala Ile Leu Leu Ala Gln Thr Ile Glu Gln Phe Thr Ile Leu Arg 100 105 110 Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Val His Val Ala Pro Trp Glu Gly Met Phe Val Leu 165 170 175 Phe Ala Leu Leu Ala Ala Ile Ser Phe Phe Gly Leu His Arg Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Lys Glu Leu 195 200 205 Gly Arg Asp Tyr Lys Glu Val Leu Arg Asn Val Arg Phe Val Ala Gly 210 215 220 Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Lys Leu Ser Ser Tyr Glu 245 250 255 Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ile Gly Asn 260 265 270 Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Ser Val Arg Ser Leu Ile 275 280 285 Ile Met Gly Gly Trp Pro Ile Met Ala Gly Leu Val Val Ala Ala Val 290 295 300 Ala Thr Val Ala Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Ile Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser 355 360 365 Lys His Ala Tyr Ser Phe Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn 370 375 380 Leu Ala Asn Gly Ile Leu Trp Leu Gly Leu Met Val Val Phe Leu Lys 385 390 395 400 Asp Lys Arg Val Gly Ser Ala Leu Gln 405 <210> 93 <211> 410 <212> PRT <213> Enterobacter sp. RHBSTW-00901 <400> 93 Met Leu Asn Arg Ser Ser Ser Gly Thr Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Asn 35 40 45 Ala Gly Ile Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys 85 90 95 Leu Ala Thr Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Leu Leu Arg 100 105 110 Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Glu Glu Ala Met Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Ile His Val Ala Pro Trp Glu Gly Met Phe Val Leu 165 170 175 Phe Ala Ala Phe Ala Ala Ile Ala Phe Phe Gly Leu His Arg Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Leu Gly Glu Thr Leu Ser Leu Lys Glu Leu 195 200 205 Gly Arg Asp Tyr Lys Leu Val Leu Lys Asn Val Arg Phe Val Ala Gly 210 215 220 Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Lys Leu Ser Ser Tyr Glu 245 250 255 Tyr Gly Met Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ile Gly Asn 260 265 270 Leu Thr Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile 275 280 285 Ile Met Gly Gly Trp Pro Ile Val Ala Gly Leu Ile Met Ala Ala Val 290 295 300 Ala Thr Val Ala Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Val Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser 355 360 365 Lys His Ala Tyr Ala Met Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn 370 375 380 Leu Ala Asn Gly Val Leu Trp Leu Gly Leu Met Val Val Phe Leu Lys 385 390 395 400 Asp Lys Arg Val Gly Asn Ala Leu Gln Pro 405 410 <210> 94 <211> 410 <212> PRT <213> Enterobacter cloacae subsp. dissolvens strain GN05902 <400> 94 Met Leu Asn Arg Ser Ser Ser Gly Thr Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Ala Gln Tyr Asn 35 40 45 Ala Gly Ile Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys 85 90 95 Leu Ala Thr Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Leu Leu Arg 100 105 110 Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Val His Val Ala Pro Trp Glu Gly Met Phe Val Leu 165 170 175 Phe Ala Val Leu Ala Ala Ile Ala Phe Phe Gly Leu His Arg Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Leu Gly Glu Thr Leu Ser Leu Lys Glu Leu 195 200 205 Gly Arg Asp Tyr Lys Ala Val Leu Lys Asn Gly Arg Phe Val Ala Gly 210 215 220 Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Leu Ser Ser Tyr Glu 245 250 255 Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ile Gly Asn 260 265 270 Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile 275 280 285 Ile Met Gly Gly Trp Pro Ile Ala Ala Gly Leu Thr Val Ala Ala Val 290 295 300 Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Ile Tyr Ala Phe Gly Ile Gly Val Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser 355 360 365 Lys His Thr Tyr Ala Leu Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn 370 375 380 Leu Ala Asn Gly Val Leu Trp Val Val Leu Met Val Met Phe Leu Lys 385 390 395 400 Asp Lys Arg Val Gly Asn Ala Leu Gln Pro 405 410 <210> 95 <211> 410 <212> PRT <213> Enterobacter mori strain JGM37 <400> 95 Met Leu Asn Arg Ser Ser Ser Gly Asn Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Asn 35 40 45 Ala Gly Ile Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys 85 90 95 Leu Ala Thr Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Leu Leu Arg 100 105 110 Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Val His Val Ala Pro Trp Glu Gly Met Phe Ile Leu 165 170 175 Phe Ala Ala Leu Ala Ala Ile Ser Phe Phe Gly Leu His Arg Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Lys Glu Leu 195 200 205 Gly Arg Asp Tyr Lys Glu Val Leu Lys Asn Gly Arg Phe Val Ala Gly 210 215 220 Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Lys Leu Ser Ser Tyr Glu 245 250 255 Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn 260 265 270 Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile 275 280 285 Ile Met Gly Gly Trp Pro Ile Ala Ala Gly Leu Val Met Ala Ala Val 290 295 300 Ala Thr Val Ala Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Val Tyr Ala Phe Gly Ile Gly Val Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser 355 360 365 Lys His Ala Tyr Ala Phe Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn 370 375 380 Leu Ala Asn Gly Val Leu Trp Val Gly Leu Met Val Val Phe Leu Lys 385 390 395 400 Asp Lys Arg Ile Gly Ser Ala Leu Gln Pro 405 410 <210> 96 <211> 410 <212> PRT <213> Kosakonia sacchari strain BO-1 <400> 96 Met Gln Asn His Thr Leu Thr Ser Gln Arg Leu Gly Arg Arg Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Ala 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Asn 35 40 45 Ala Gly Ile Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys 85 90 95 Leu Ala Thr Leu Leu Ala Gln Asp Ile Glu Gln Phe Thr Leu Leu Arg 100 105 110 Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Val His Ala Ala Pro Trp Gln Gly Met Phe Val Leu 165 170 175 Phe Ala Leu Leu Ala Ala Phe Ala Phe Phe Gly Leu Gln Arg Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Phe Lys Ala Leu 195 200 205 Trp Arg Asp Tyr Ala Asp Val Met Lys Asn Leu Arg Phe Val Ala Gly 210 215 220 Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Ile Ile Ile Ile Ser Gly Glu Gln Leu Ser Ser Tyr Glu 245 250 255 Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ile Gly Asn 260 265 270 Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ala Leu Ile 275 280 285 Ile Met Gly Gly Trp Pro Ile Ala Ala Gly Leu Leu Leu Ala Ala Val 290 295 300 Ala Thr Val Ala Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Leu Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Phe Ile Phe Thr Val Gly Ile Glu Ile Ser 355 360 365 Lys His Ala Trp Leu Ser Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn 370 375 380 Leu Ala Asn Gly Val Leu Trp Leu Gly Leu Met Val Val Phe Leu Arg 385 390 395 400 Asp Lys Arg Val Gly Asn Ser Leu Glu Gly 405 410 <210> 97 <211> 410 <212> PRT <213> Cronobacter malonaticus strain MOD1-Md25g <400> 97 Met Gln Thr His Ala Asn Arg Thr Gly Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln 35 40 45 Ala Gly Val Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Ala Gly Val Ala Trp Phe Ile Val Thr Cys 85 90 95 Leu Ala Thr Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Val Leu Arg 100 105 110 Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Val His Ala Ala Pro Trp Glu Met Met Phe Val Leu 165 170 175 Phe Ala Val Leu Ala Ala Ile Ser Phe Phe Gly Leu Trp Arg Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Arg Glu Leu 195 200 205 Gly Arg Asp Tyr Lys Ala Val Leu Lys Asn Leu Arg Phe Val Ser Gly 210 215 220 Ala Leu Ala Ile Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Met Ser Thr Tyr Glu 245 250 255 Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ile Gly Asn 260 265 270 Leu Val Leu Ala Lys Leu Thr Ala Arg Arg Ser Val Arg Ser Leu Ile 275 280 285 Val Met Gly Gly Trp Pro Met Met Phe Gly Leu Ala Leu Ala Ala Leu 290 295 300 Ala Thr Val Ile Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Ile Tyr Ala Phe Gly Ile Gly Ile Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ala Ser Asp Ile Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Thr Ile Phe Thr Val Gly Ile Glu Val Ser 355 360 365 Lys His Ala Trp Ile Gly Gly Gly Asn Ala Leu Phe Asn Leu Phe Asn 370 375 380 Phe Ala Ser Gly Leu Leu Trp Leu Gly Leu Met Val Ile Phe Leu Lys 385 390 395 400 Asp Lys Thr Val Gly Thr Arg Pro Glu Ala 405 410 <210> 98 <211> 410 <212> PRT <213> Cronobacter dublinensis 582 <400> 98 Met Gln Thr His Ala Asn Arg Thr Gly Arg Leu Gly Arg Gln Ala Leu 1 5 10 15 Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly 20 25 30 Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln 35 40 45 Ala Gly Val Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly 50 55 60 Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly 65 70 75 80 Arg Arg Pro Val Met Leu Ala Gly Val Val Trp Phe Ile Val Thr Cys 85 90 95 Leu Ala Thr Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Val Leu Arg 100 105 110 Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala 115 120 125 Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala 130 135 140 Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val 145 150 155 160 Gly Ala Ala Trp Val His Ala Ala Pro Trp Glu Met Met Phe Val Leu 165 170 175 Phe Ala Val Leu Ala Ala Ile Ser Phe Phe Gly Leu Trp Arg Ala Met 180 185 190 Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Arg Glu Leu 195 200 205 Gly Arg Asp Tyr Lys Lys Val Leu Lys Asn Leu Arg Phe Val Ser Gly 210 215 220 Ala Leu Ala Ile Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala 225 230 235 240 Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Met Ser Thr Tyr Glu 245 250 255 Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ile Gly Asn 260 265 270 Leu Val Leu Ala Lys Leu Thr Ala Arg Arg Ser Val Arg Ser Leu Ile 275 280 285 Val Met Gly Gly Trp Pro Ile Met Ala Gly Leu Ala Leu Ala Ala Phe 290 295 300 Ala Thr Val Ile Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu 305 310 315 320 Ser Ile Tyr Ala Phe Gly Ile Gly Ile Ala Asn Ala Gly Leu Val Arg 325 330 335 Leu Thr Leu Phe Ala Ser Asp Ile Ser Lys Gly Thr Val Ser Ala Ala 340 345 350 Met Gly Met Leu Gln Met Thr Ile Phe Thr Val Gly Ile Glu Val Ser 355 360 365 Lys His Ala Trp Thr Gly Gly Gly Asn Gly Leu Phe Asn Leu Phe Asn 370 375 380 Phe Ala Ser Gly Leu Leu Trp Leu Gly Leu Thr Val Ile Phe Leu Lys 385 390 395 400 Asp Lys Thr Val Gly Ala Ser Arg Glu Gly 405 410

Claims (45)

  1. 코어 삼당류로서 락토-N-트리오스 (LN3; GlcNAc-베타1,3-Gal-베타1,4-Glc)를 포함하는 올리고당의 생산을 위해 유전자 변형된 숙주 세포로서, 숙주 세포는 N-아세틸글루코사민 (GlcNAc) 잔기를 UDP-GlcNAc 도너로부터 락토스 억셉터로 전달하여 LN3을 합성하는 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제에 대한 적어도 하나의 핵산 서열을 포함하고 발현하며,
    - 상기 세포는 i) 내생성 막 단백질의 과발현 및/또는 ii) 이종성 막 단백질의 발현을 더 포함하여 코어 삼당류로서 LN3을 포함하는 올리고당의 a) 개선된 생산, 및/또는 b) 가능하고/하거나 증강된 유출을 제공하고, 바람직하게 상기 개선된 생산 및 상기 증강된 유출은 동일한 유전적 배경을 갖지만 내생성 막 단백질의 상기 과발현 및 이종성 막 단백질의 상기 발현이 결여된 숙주 세포와 비교된 것이고,
    - 바람직하게 상기 세포는 상기 LN3을 변형시킬 수 있는 글리코실트랜스퍼라제를 코딩하는 적어도 하나의 핵산 서열을 더 포함하고 발현하고,
    임의로 상기 개선된 생산은
    - 상기 올리고당의 더 나은 적정가 (리터 당 그램 올리고당),
    - 더 나은 생산율 r (시간 당 리터 당 그램 올리고당),
    - 더 나은 세포 성능 지수 (그램 생물량 당 그램 올리고당),
    - 더 나은 비생산성 (시간 당 그램 생물량 당 그램 올리고당),
    - 수크로스에 대한 더 나은 수율 (그램 수크로스 당 그램 올리고당), 및/또는
    - 더 나은 수크로스 흡수/전환율 (시간 당 그램 당 그램 수크로스),
    - 더 나은 락토스 전환/소비율 (시간 당 그램 락토스), 및/또는
    - 숙주 세포의 증강된 성장 속도
    를 포함하는 것인 세포.
  2. 제1항에 있어서, 상기 막 단백질은 운송체, P-P-결합-가수분해-구동 수송체, 및 β-배럴 포린의 군으로부터 선택되고,
    a) 상기 막 단백질이 운송체의 군으로부터 선택될 때, 상기 막 단백질은
    - TCDB 클래스 2.A.1.1, 2.A.1.2, 2.A.1.3, 2.A.1.6, 2.A.2.2, 2.A.7.1 및 2.A.66의 군, 또는
    - eggnog 패밀리 05E8G, 05EGZ, 05JHE, 07QF7 07QRN, 07RBJ, 0814C 및 08N8A의 군, 또는
    - PFAM 목록 PF00893, PF01943, PF05977, PF07690 및 PF13347, 또는
    - interpro 목록 IPR000390, IPR001411, IPR001927, IPR002797, IPR004638, IPR005829, IPR010290, IPR011701, IPR020846, IPR023721, IPR023722, IPR032896, IPR036259 및 IPR039672, 또는
    - SEQ ID NO 01을 갖는 크로노박터 무이트젠시 (Cronobacter muytjensii) 유래 MdfA, SEQ ID NO 02를 갖는 요케넬라 레겐스부르게이 (Yokenella regensburgei) (ATCC43003) 유래 MdfA, SEQ ID NO 03을 갖는 에스케리치아 콜라이 (Escherichia coli) K-12 MG1655 유래 MdfA, SEQ ID NO 04를 갖는 엔테로박터 (Enterobacter) sp. 유래 MdfA, SEQ ID NO 05를 갖는 시트로박터 코세리 (Citrobacter koseri) 유래 MFS, SEQ ID NO 06을 갖는 시트로박터 영애 (Citrobacter youngae) 유래 MdfA, SEQ ID NO 07을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 YbdA, SEQ ID NO 08을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 YjhB, SEQ ID NO 09를 갖는 에스케리치아 콜라이 K-12 MG1655 유래 WzxE, SEQ ID NO 10을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 EmrE, SEQ ID NO 11을 갖는 비피도박테리움 롱검 (Bifidobacterium longum) subsp. 인판티스 (Infantis) (균주 ATCC 15697) 유래 Blon_2331, SEQ ID NO 12를 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_0247, SEQ ID NO 13을 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_0345, SEQ ID NO 14를 갖는 클렙시엘라 뉴모니아에 (Klebsiella pneumoniae) 유래 IceT, SEQ ID NO 53을 갖는 크로노박터 사카자키 (Cronobacter sakazakii) 균주 MOD1_LR753 유래 MdfA, SEQ ID NO 54를 갖는 프란코니박터 풀베리스 (Franconibacter pulveris) LMG 24059 유래 MdfA, SEQ ID NO 55를 갖는 엔테로박터 호르마에케이 (Enterobacter hormaechei) 균주 017 유래 MdfA, SEQ ID NO 56을 갖는 시트로박터 코세리 (Citrobacter koseri) 균주 NCTC10771 유래 MdfA, SEQ ID NO 57을 갖는 살모넬라 엔테리카 (Salmonella enterica) subsp. 아리조나에 (arizonae) 혈청형 41:z4,z23:- 균주 TAMU30EF 유래 MdfA, SEQ ID NO 58을 갖는 시겔라 플렉스네리 (Shigella flexneri) 균주 585219 유래 MdfA, SEQ ID NO 59를 갖는 요케넬라 레겐스부르게이 (Yokenella regensburgei) 균주 UMB0819 유래 MdfA, SEQ ID NO 60을 갖는 에스케리치아 콜라이 균주 AMC_967 유래 MdfA, SEQ ID NO 61을 갖는 클렙시엘라 뉴모니아에 (Klebsiella pneumoniae) VAKPC309 유래 MdfA, SEQ ID NO 62를 갖는 클렙시엘라 옥시토카 (Klebsiella oxytoca) 균주 4928STDY7071490 유래 MdfA, SEQ ID NO 63을 갖는 클렙시엘라 미시가넨시스 (Klebsiella michiganensis) 균주 A2 유래 MdfA, SEQ ID NO 64를 갖는 플루랄리박터 게르고비아에 (Pluralibacter gergoviae) 균주 FDAARGOS_186 유래 MdfA, SEQ ID NO 65를 갖는 클루이베라 아스코르바타 (Kluyvera ascorbata) ATCC 33433 유래 MdfA, SEQ ID NO 66을 갖는 엔테로박터 코베이 (Enterobacter kobei) 유래 MdfA, SEQ ID NO 67을 갖는 렐리오티아 (Lelliottia) sp. WB101 유래 MdfA, SEQ ID NO 68을 갖는 시트로박터 프레운디 (Citrobacter freundii) 유래 MdfA, SEQ ID NO 69를 갖는 살모넬라 엔테리카 (Salmonella enterica) subsp. 살라마에 (Salamae) 유래 MdfA 또는 SEQ ID NO 70을 갖는 시겔라 플렉스네리 (Shigella flexneri) 유래 MdfA, 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편 또는 각각 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69 또는 70을 갖는 상기 막 단백질 중 어느 하나의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열
    로부터 선택되거나;
    b) 상기 막 단백질이 P-P-결합-가수분해-구동 수송체의 군으로부터 선택될 때, 상기 막 단백질은
    - TCDB 클래스 3.A.1.1 및 3.A.1.2의 군, 또는
    - eggnog 패밀리 05CJ1, 05DFW, 05EZD, 05I1K, 07HR3 및 08IJ9의 군, 또는
    - PFAM 목록 PF00005, PF00528, PF13407 및 PF17912, 또는
    - interpro 목록 IPR000515, IPR003439, IPR003593, IPR005978, IPR008995, IPR013456, IPR015851, IPR017871, IPR025997, IPR027417, IPR028082, IPR035906, 및 IPR040582, 또는
    - SEQ ID NO 15를 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_2475, SEQ ID NO 16을 갖는 브라디리조비움 자포니쿰 (Bradyrhizobium japonicum) USDA 110 유래 nodi, SEQ ID NO 17을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 xylF, SEQ ID NO 18을 갖는 비피도박테리움 롱검 subsp. 인판티스 Bi-26 유래 TIC77290, SEQ ID NO 19를 갖는 비피도박테리움 롱검 subsp. 인판티스 Bi-26 유래 TIC77291, SEQ ID NO 20을 갖는 비피도박테리움 롱검 subsp. 인판티스 Bi-26 유래 TIC76854 TIC77291, 또는 상기 P-P-결합-가수분해-구동 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 15, 16, 17, 18, 19 또는 20을 갖는 상기 막 단백질 중 어느 하나의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열
    로부터 선택되거나; 또는
    c) 상기 막 단백질이 β-배럴 포린의 군으로부터 선택될 때, 상기 막 단백질은
    - TCDB 클래스 1.B.18, 또는
    - eggnog 패밀리 05DAY, 또는
    - PFAM 목록 PF02563, PF10531 및 PF18412, 또는
    - interpro 목록 IPR003715, IPR019554 및 IPR040716, 또는
    - SEQ ID NO 21을 갖는 에스케리치아 콜라이 K12 MG1655 유래 Wza, 또는 이의 기능성 상동체 또는 기능성 단편, 또는 SEQ ID NO 21을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열
    로부터 선택되고;
    TCDB 클래스는 2019년 6월 17일 배포된 TCDB.org 에 의해 정의되는 바와 같고, eggnog 패밀리는 2016년 9월 배포된 eggnogdb 4.5.1에 의해 정의되는 바와 같고, PFAM 목록은 2018년 9월에 배포된 Pfam 32.0에 의해 정의되는 바와 같고, interpro 목록은 2019년 7월 4일 배포된 InterPro 75.0에 의해 정의되는 바와 같은 것인, 세포.
  3. 제1항 또는 제2항에 있어서, 상기 막 단백질은 하기로 이루어진 막 단백질의 군으로부터 선택되는 것인 세포:
    a) 운송체 막 단백질로서 SEQ ID NO 01을 갖는 크로노박터 무이트젠시 (Cronobacter muytjensii) 유래 MdfA, SEQ ID NO 02를 갖는 요케넬라 레겐스부르게이 (Yokenella regensburgei) (ATCC43003) 유래 MdfA, SEQ ID NO 03을 갖는 에스케리치아 콜라이 (Escherichia coli) K-12 MG1655 유래 MdfA, SEQ ID NO 04를 갖는 엔테로박터 (Enterobacter) sp. 유래 MdfA, SEQ ID NO 05를 갖는 시트로박터 코세리 (Citrobacter koseri) 유래 MFS, SEQ ID NO 06을 갖는 시트로박터 영애 (Citrobacter youngae) 유래 MdfA, SEQ ID NO 07을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 YbdA, SEQ ID NO 08을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 YjhB, SEQ ID NO 09를 갖는 에스케리치아 콜라이 K-12 MG1655 유래 WzxE, SEQ ID NO 10을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 EmrE, SEQ ID NO 11을 갖는 비피도박테리움 롱검 (Bifidobacterium longum) subsp. 인판티스 (Infantis) (균주 ATCC 15697) 유래 Blon_2331, SEQ ID NO 12를 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_0247, SEQ ID NO 13을 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_0345, SEQ ID NO 14를 갖는 클렙시엘라 뉴모니아에 (Klebsiella pneumoniae) 유래 IceT, SEQ ID NO 53을 갖는 크로노박터 사카자키 (Cronobacter sakazakii) 균주 MOD1_LR753 유래 MdfA, SEQ ID NO 54를 갖는 프란코니박터 풀베리스 (Franconibacter pulveris) LMG 24059 유래 MdfA, SEQ ID NO 55를 갖는 엔테로박터 호르마에케이 (Enterobacter hormaechei) 균주 017 유래 MdfA, SEQ ID NO 56을 갖는 시트로박터 코세리 (Citrobacter koseri) 균주 NCTC10771 유래 MdfA, SEQ ID NO 57을 갖는 살모넬라 엔테리카 (Salmonella enterica) subsp. 아리조나에 (arizonae) 혈청형 41:z4,z23:- 균주 TAMU30EF 유래 MdfA, SEQ ID NO 58을 갖는 시겔라 플렉스네리 (Shigella flexneri) 균주 585219 유래 MdfA, SEQ ID NO 59를 갖는 요케넬라 레겐스부르게이 (Yokenella regensburgei) 균주 UMB0819 유래 MdfA, SEQ ID NO 60을 갖는 에스케리치아 콜라이 균주 AMC_967 유래 MdfA, SEQ ID NO 61을 갖는 클렙시엘라 뉴모니아에 (Klebsiella pneumoniae) VAKPC309 유래 MdfA, SEQ ID NO 62를 갖는 클렙시엘라 옥시토카 (Klebsiella oxytoca) 균주 4928STDY7071490 유래 MdfA, SEQ ID NO 63을 갖는 클렙시엘라 미시가넨시스 (Klebsiella michiganensis) 균주 A2 유래 MdfA, SEQ ID NO 64를 갖는 플루랄리박터 게르고비아에 (Pluralibacter gergoviae) 균주 FDAARGOS_186 유래 MdfA, SEQ ID NO 65를 갖는 클루이베라 아스코르바타 (Kluyvera ascorbata) ATCC 33433 유래 MdfA, SEQ ID NO 66을 갖는 엔테로박터 코베이 (Enterobacter kobei) 유래 MdfA, SEQ ID NO 67을 갖는 렐리오티아 (Lelliottia) sp. WB101 유래 MdfA, SEQ ID NO 68을 갖는 시트로박터 프레운디 (Citrobacter freundii) 유래 MdfA, SEQ ID NO 69를 갖는 살모넬라 엔테리카 (Salmonella enterica) subsp. 살라마에 (Salamae) 유래 MdfA 또는 SEQ ID NO 70을 갖는 시겔라 플렉스네리 (Shigella flexneri) 유래 MdfA, 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69 또는 70을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
    b) P-P-결합-가수분해-구동 수송체로서 SEQ ID NO 15를 갖는 비피도박테리움 롱검 subsp. 인판티스 (균주 ATCC 15697) 유래 Blon_2475, SEQ ID NO 16을 갖는 브라디리조비움 자포니쿰 (Bradyrhizobium japonicum) USDA 110 유래 nodi, SEQ ID NO 17을 갖는 에스케리치아 콜라이 K-12 MG1655 유래 xylF, SEQ ID NO 18을 갖는 비피도박테리움 롱검 subsp. 인판티스 Bi-26 유래 TIC77290, SEQ ID NO 19를 갖는 비피도박테리움 롱검 subsp. 인판티스 Bi-26 유래 TIC77291, SEQ ID NO 20을 갖는 비피도박테리움 롱검 subsp. 인판티스 Bi-26 유래 TIC76854 TIC77291 또는 상기 P-P-결합-가수분해-구동 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 15, 16, 17, 18, 19 또는 20을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
    c) β-배럴 포린 막 단백질로서 SEQ ID NO 21을 갖는 에스케리치아 콜라이 K12 MG1655 유래 Wza, 또는 상기 Wza 단백질의 기능성 상동체 또는 기능성 단편, 또는 SEQ ID NO 21을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열.
  4. 제1항 내지 제3항 중 어느 하나의 항에 있어서, 상기 막 단백질은 하기로 이루어진 막 단백질의 군으로부터 선택되는 것인 세포:
    a) SEQ ID NO 01, 02, 04, 05, 06, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69 또는 70으로 표시되는 운송체 막 단백질, 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 01, 02, 04, 05, 06, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69 또는 70을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
    b) SEQ ID NO 15, 16, 17, 18, 19 또는 20으로 표시되는 P-P-결합-가수분해-구동 수송체, 또는 상기 P-P-결합-가수분해-구동 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 15, 16, 17, 18, 19 또는 20을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
    c) SEQ ID NO 21로 표시되는 β-배럴 포린 막 단백질, 또는 상기 β-배럴 포린 막 단백질의 기능성 상동체 또는 기능성 단편, 또는 SEQ ID NO 21을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열.
  5. 제1항 내지 제4항 중 어느 하나의 항에 있어서, 상기 막 단백질은 하기로 이루어진 막 단백질의 군으로부터 선택되는 것인 세포:
    a) SEQ ID NO 01, 02, 04, 05, 06, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69 또는 70으로 표시되는 운송체 막 단백질, 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는
    - 각각 SEQ ID NO 09, 10, 11, 12 또는 13을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80% 서열 동일성,
    - 각각 SEQ ID NO 01, 02, 04, 14, 53, 54, 55, 59, 61, 62, 63, 64, 65, 66, 67 또는 69를 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 90% 서열 동일성,
    - 각각 SEQ ID NO 05, 06, 56, 57 또는 68을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 95.00% 서열 동일성, 또는
    - 각각 SEQ ID NO 58, 60 또는 70을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 99.00% 서열 동일성
    을 갖는 단백질 서열; 및
    b) SEQ ID NO 15, 16, 17, 18, 19 또는 20으로 표시되는 P-P-결합-가수분해-구동 수송체, 또는 상기 P-P-결합-가수분해-구동 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 15, 16, 17, 18, 19 또는 20을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
    c) SEQ ID NO 21로 표시되는 β-배럴 포린 막 단백질, 또는 상기 β-배럴 포린 막 단백질의 기능성 상동체 또는 기능성 단편, 또는 SEQ ID NO 21을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열.
  6. 제1항 내지 제4항 중 어느 하나의 항에 있어서, 상기 막 단백질은 하기로 이루어진 막 단백질의 군으로부터 선택되는 것인 세포:
    a) SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64, 65, 66, 67, 또는 69로 표시되는 운송체 막 단백질, 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64, 65, 66, 67, 또는 69를 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
    b) SEQ ID NO 15, 16, 17, 18, 19 또는 20으로 표시되는 P-P-결합-가수분해-구동 수송체, 또는 상기 P-P-결합-가수분해-구동 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는각각 SEQ ID NO 15, 16, 17, 18, 19 또는 20을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
    c) SEQ ID NO 21로 표시되는 β-배럴 포린 막 단백질, 또는 상기 β-배럴 포린 막 단백질의 기능성 상동체 또는 기능성 단편, 또는 SEQ ID NO 21을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열.
  7. 제1항 내지 제4항 또는 제6항 중 어느 하나의 항에 있어서, 상기 막 단백질은 하기로 이루어진 막 단백질의 군으로부터 선택되는 것인 세포:
    a) SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64, 65, 66, 67, 또는 69로 표시되는 운송체 막 단백질, 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64, 65, 66, 67, 또는 69를 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 90%, 바람직하게 적어도 95.00%, 보다 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
    b) SEQ ID NO 15, 16, 17, 18, 19 또는 20으로 표시되는 P-P-결합-가수분해-구동 수송체, 또는 상기 P-P-결합-가수분해-구동 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 15, 16, 17, 18, 19 또는 20을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
    c) SEQ ID NO 21로 표시되는 β-배럴 포린 막 단백질, 또는 상기 β-배럴 포린 막 단백질의 기능성 상동체 또는 기능성 단편, 또는 SEQ ID NO 21을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열.
  8. 제1항 내지 제3항 중 어느 하나의 항에 있어서, 상기 막 단백질은 하기로 이루어진 막 단백질의 군으로부터 선택되는 것인 세포:
    a) SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64 또는 65로 표시되는 운송체 막 단백질, 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64 또는 65를 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
    b) SEQ ID NO 15, 16, 17, 18, 19 또는 20으로 표시되는 P-P-결합-가수분해-구동 수송체, 또는 상기 P-P-결합-가수분해-구동 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 15, 16, 17, 18, 19 또는 20을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
    c) SEQ ID NO 21로 표시되는 β-배럴 포린 막 단백질, 또는 상기 β-배럴 포린 막 단백질의 기능성 상동체 또는 기능성 단편, 또는 SEQ ID NO 21을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열.
  9. 제1항 내지 제3항 또는 제8항 중 어느 하나의 항에 있어서, 상기 막 단백질은 하기로 이루어진 막 단백질의 군으로부터 선택되는 것인 세포:
    a) SEQ ID NO 01, 02, 04, 05, 06, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64 또는 65로 표시되는 운송체 막 단백질, 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 01, 02, 04, 05, 06, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64 또는 65를 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
    b) SEQ ID NO 15, 16, 17, 18, 19 또는 20으로 표시되는 P-P-결합-가수분해-구동 수송체, 또는 상기 P-P-결합-가수분해-구동 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 15, 16, 17, 18, 19 또는 20을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
    c) SEQ ID NO 21로 표시되는 β-배럴 포린 막 단백질, 또는 상기 β-배럴 포린 막 단백질의 기능성 상동체 또는 기능성 단편, 또는 SEQ ID NO 21을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열.
  10. 제1항 내지 제3항, 제8항 또는 제9항 중 어느 하나의 항에 있어서, 상기 막 단백질은 하기로 이루어진 막 단백질의 군으로부터 선택되는 것인 세포:
    a) SEQ ID NO 01, 02, 04, 05, 06, 09, 10, 11, 12, 13, 14, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64 또는 65로 표시되는 운송체 막 단백질, 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는
    - 각각 SEQ ID NO 09, 10, 11, 12 또는 13을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80% 서열 동일성,
    - 각각 SEQ ID NO 01, 02, 04, 14, 53, 54, 55, 59, 61, 62, 63, 64 또는 65를 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 90% 서열 동일성,
    - 각각 SEQ ID NO 05, 06, 56 또는 57을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 95.00% 서열 동일성, 또는
    - 각각 SEQ ID NO 58 또는 60을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 99.00% 서열 동일성
    을 갖는 단백질 서열; 및
    b) SEQ ID NO 15, 16, 17, 18, 19 또는 20으로 표시되는 P-P-결합-가수분해-구동 수송체, 또는 상기 P-P-결합-가수분해-구동 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 15, 16, 17, 18, 19 또는 20을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
    c) SEQ ID NO 21로 표시되는 β-배럴 포린 막 단백질, 또는 상기 β-배럴 포린 막 단백질의 기능성 상동체 또는 기능성 단편, 또는 SEQ ID NO 21을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열.
  11. 제1항 내지 제3항, 제8항 또는 제9항 중 어느 하나의 항에 있어서, 상기 막 단백질은 하기로 이루어진 막 단백질의 군으로부터 선택되는 것인 세포:
    a) SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64 또는 65로 표시되는 운송체 막 단백질, 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64 또는 65를 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
    b) SEQ ID NO 15, 16, 17, 18, 19 또는 20으로 표시되는 P-P-결합-가수분해-구동 수송체, 또는 상기 P-P-결합-가수분해-구동 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 15, 16, 17, 18, 19 또는 20을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
    c) SEQ ID NO 21로 표시되는 β-배럴 포린 막 단백질, 또는 상기 β-배럴 포린 막 단백질의 기능성 상동체 또는 기능성 단편, 또는 SEQ ID NO 21을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열.
  12. 제1항 내지 제3항, 제8항, 제9항 또는 제11항 중 어느 하나의 항에 있어서, 상기 막 단백질은 하기로 이루어진 막 단백질의 군으로부터 선택되는 것인 세포:
    a) SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64 또는 65로 표시되는 운송체 막 단백질, 또는 상기 운송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 01, 02, 04, 09, 10, 11, 12, 13, 14, 53, 54, 55, 59, 61, 62, 63, 64 또는 65를 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 90%, 바람직하게 적어도 95.00%, 보다 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
    b) SEQ ID NO 15, 16, 17, 18, 19 또는 20으로 표시되는 P-P-결합-가수분해-구동 수송체, 또는 상기 P-P-결합-가수분해-구동 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 각각 SEQ ID NO 15, 16, 17, 18, 19 또는 20을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열; 및
    c) SEQ ID NO 21로 표시되는 β-배럴 포린 막 단백질, 또는 상기 β-배럴 포린 막 단백질의 기능성 상동체 또는 기능성 단편, 또는 SEQ ID NO 21을 갖는 상기 막 단백질의 전체 길이 서열에 대해 적어도 80%, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95.00%, 가장 바람직하게 적어도 97.00%, 서열 동일성을 갖는 단백질 서열.
  13. 제1항 내지 제12항 중 어느 하나의 항에 있어서, 상기 막 단백질은 세포벽의 외막을 가로지르는 화합물의 수송에 관여되는 수송체 단백질인 세포.
  14. 제1항 내지 제13항 중 어느 하나의 항에 있어서, 상기 글리코실트랜스퍼라제는 푸코실트랜스퍼라제, 시알릴트랜스퍼라제, 갈락토실트랜스퍼라제, 글루코실트랜스퍼라제, 만노실트랜스퍼라제, N-아세틸글루코사미닐트랜스퍼라제, N-아세틸갈락토사미닐트랜스퍼라제, N-아세틸만노사미닐트랜스퍼라제, 자일로실트랜스퍼라제, 글루쿠로닐트랜스퍼라제, 갈락투로닐트랜스퍼라제, 글루코사미닐트랜스퍼라제, N-글리코릴뉴라미닐트랜스퍼라제, 람노실트랜스퍼라제, N-아세틸람노실트랜스퍼라제, UDP-4-아미노-4,6-디데옥시-N-아세틸-베타-L-알트로사민 트랜스아미나제, UDP-N-아세틸글루코사민 에놀피루빌 트랜스퍼라제 및 푸코사미닐트랜스퍼라제를 포함하는 목록으로부터 선택되고,
    바람직하게, 상기 세포는 상기 글리코실트랜스퍼라제 중 적어도 하나의 발현 또는 활성이 변형되는 것인 세포.
  15. 제1항 내지 제14항 중 어느 하나의 항에 있어서, 상기 코어 삼당류로서 락토-N-트리오스 (LN3; GlcNAc-베타1,3-Gal-베타1,4-Glc)를 포함하는 올리고당은 포유동물 모유 올리고당 또는 루이스-유형 항원 올리고당인 세포.
  16. 제1항 내지 제15항 중 어느 하나의 항에 있어서, 상기 코어 삼당류로서 락토-N-트리오스 (LN3; GlcNAc-베타1,3-Gal-베타1,4-Glc)를 포함하는 올리고당은 포유동물 모유 올리고당 (MMO), 바람직하게 인간 모유 올리고당 (HMO), 보다 바람직하게 코어 사당류로서 LNT 또는 LNnT를 갖는 MMO 또는 HMO, 보다 더 바람직하게 코어 사당류로서 LNT 또는 LNnT를 갖는 HMO, 가장 바람직하게 LNT 또는 LNnT인 세포.
  17. 제1항 내지 제16항 중 어느 하나의 항에 있어서, 상기 코어 삼당류로서 락토-N-트리오스 (LN3; GlcNAc-베타1,3-Gal-베타1,4-Glc)를 포함하는 올리고당은 중성 올리고당인 세포.
  18. 제1항 내지 제17항 중 어느 하나의 항에 있어서, 상기 코어 삼당류로서 락토-N-트리오스 (LN3; GlcNAc-베타1,3-Gal-베타1,4-Glc)를 포함하는 올리고당은 락토-N-트리오스, 락토-N-테트라오스, 락토-N-네오테트라오스, 락토-N-푸코펜타오스 I, 락토-N-네오푸코펜타오스 I, 락토-N-푸코펜타오스 II, 락토-N-푸코펜타오스 III, 락토-N-푸코펜타오스 V, 락토-N-푸코펜타오스 VI, 락토-N-네오푸코펜타오스 V, 락토-N-디푸코헥사오스 I, 락토-N-디푸코헥사오스 II, 락토-N-헥사오스 (LNH), 락토-N-네오헥사오스 (LNnH), 파라-락토-N-헥사오스 (pLNnH), 파라-락토-N-네오헥사오스 (pLNH), 디푸코실-락토-N-헥사오스, 디푸코실-락토-N-네오헥사오스, 락토-N-펜타오스 (LNP), 락토-N-네오펜타오스, 파라 락토-N-펜타오스, 파라 락토-N-네오펜타오스, 락토-N-노보펜타오스 I, 락토-N-헵타오스, 락토-N-네오헵타오스, 파라 락토-N-네오헵타오스, 파라 락토-N-헵타오스, 락토-N-옥타오스 (LNO), 락토-N-네오옥타오스, 이소 락토-N-옥타오스, 파라 락토-N-옥타오스, 이소 락토-N-네오옥타오스, 노보 락토-N-네오옥타오스, 파라 락토-N-네오옥타오스, 이소 락토-N-노나오스, 노보 락토-N-노나오스, 락토-N-노나오스, 락토-N-데카오스, 이소 락토-N-데카오스, 노보 락토-N-데카오스, 락토-N-네오데카오스, 시알릴-락토-N-테트라오스 a, 시알릴-락토-N-테트라오스 b, 시알릴-락토-N-테트라오스 c, 시알릴-락토-N-테트라오스 d를 포함하는 목록으로부터 선택되는 것인 세포.
  19. 제1항 내지 제18항 중 어느 하나의 항에 있어서, 상기 글리코실트랜스퍼라제는 베타-1,3 또는 베타-1,4 연결로 LN3의 말단 GlcNAc 잔기로 UDP-Gal 도너로부터 갈락토스 (Gal)를 전달하여서, 각각 락토-N-테트라오스 (LNT; Gal-베타1,3-GlcNAc-베타1,3-Gal-베타1,4-Glc) 또는 락토-N-네오테트라오스 (LNnT; Gal-베타1,4-GlcNAc-베타1,3-Gal-베타1,4-Glc)를 생산하는 N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제 또는 N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제인 세포.
  20. 제19항에 있어서, 상기 세포는 전체 액체배지 및/또는 상청액에서 90 g/L 이상의 LNT를 생산하고/하거나, 전체 액체배지 및/또는 상청액 중 상기 LNT는 각각 전체 액체배지 및/또는 상청액에서 상기 세포에 의해 생산되는 LNT 및 LN3의 총량에 대해 측정된 적어도 80%의 순도를 갖는 것인 세포.
  21. 제19항에 있어서, 상기 세포는 전체 액체배지 및/또는 상청액에서 70 g/L 이상, 바람직하게 90 g/L 이상의 LNnT를 생산하고/하거나, 전체 액체배지 및/또는 상청액 중 상기 LNnT는 각각 전체 액체배지 및/또는 상청액에서 상기 세포에 의해 생산되는 LNnT 및 LN3의 총량에 대해 측정된 적어도 80%의 순도를 갖는 것인 세포.
  22. 제1항 내지 제12항 중 어느 하나의 항에 있어서, 상기 세포는 코어 삼당류로서 락토-N-트리오스 (LN3; GlcNAc-베타1,3-Gal-베타1,4-Glc)를 포함하는 상기 올리고당의 생산에서 사용되는 뉴클레오티드-활성화된 당을 추가로 합성할 수 있는 것인 세포.
  23. 제22항에 있어서, 상기 뉴클레오티드-활성화된 당은 UDP-N-아세틸갈락토사민 (UDP-GalNAc), UDP-N-아세틸만노사민 (UDP-ManNAc), UDP-글루코스 (UDP-Glc), UDP-갈락토스 (UDP-Gal), GDP-만노스 (GDP-Man), UDP-글루쿠로네이트, UDP-갈락투로네이트, UDP-2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, UDP-2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, UDP-N-아세틸-L-람노사민 (UDP-L-RhaNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-만노스), dTDP-N-아세틸푸코사민, UDP-N-아세틸푸코사민 (UDP-L-FucNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-갈락토스), UDP-N-아세틸-L-뉴모사민 (UDP-L-PneNAC 또는 UDP-2-아세타미도-2,6-디데옥시-L-탈로스), UDP-N-아세틸무람산, UDP-N-아세틸-L-퀴노보사민 (UDP-L-QuiNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-글루코스), CMP-시알산 (CMP-Neu5Ac), CMP-N-글리코릴뉴라민산 (CMP-Neu5Gc), GDP-푸코스 (GDP-Fuc), GDP-람노스 및 UDP-자일로스를 포함하는 목록으로부터 선택되는 것인 세포.
  24. 제1항 내지 제23항 중 어느 하나의 항에 있어서, 세포는 적어도 부분적으로 불활성화된 선택된 단당류, 이당류 또는 올리고당에 대한 이화 경로를 포함하고, 단당류, 이당류, 또는 올리고당은 코어 삼당류로서 LN3을 포함하는 올리고당의 합성에 관여되고/되거나 필요한 것인 세포.
  25. 제1항 내지 제24항 중 어느 하나의 항에 있어서, 상기 세포는 상기 코어 삼당류로서 LN3을 포함하는 올리고당의 합성을 위한 전구체를 사용하는 것인 세포.
  26. 제1항 내지 제25항 중 어느 하나의 항에 있어서, 상기 막 단백질은 상기 코어 삼당류로서 LN3을 포함하는 올리고당의 합성을 위한 전구체의 흡수에 관여되는 것인 세포.
  27. 제1항 내지 제26항 중 어느 하나의 항에 있어서, 상기 세포는 상기 코어 삼당류로서 LN3을 포함하는 올리고당의 합성을 위한 전구체를 생산하는 것인 세포.
  28. 제1항 내지 제27항 중 어느 하나의 항에 있어서, 세포는 배지에서 안정하게 배양되는 것인 세포.
  29. 제1항 내지 제28항 중 어느 하나의 항에 있어서, 상기 세포는 미생물, 식물 세포, 동물 세포, 곤충 세포 또는 원충 세포이고, 바람직하게
    - 상기 미생물은 박테리아, 진균 또는 효모이고,
    - 상기 식물 세포는 담배, 알파파, 벼, 목화, 유채, 대두, 옥수수 또는 곡물, 및/또는 세포이고
    - 상기 동물 세포는 비-인간 포유동물, 조류, 어류, 무척추동물, 파충류, 또는 양서류로부터 유래되거나, 또는 상기 동물 세포는 배아 줄기 세포를 제외한 인간 세포로부터 유래되는 유전자 조작된 세포주인 세포.
  30. 제29항에 있어서, 상기 세포는 박테리아, 바람직하게 에스케리치아 콜라이 (Escherichia coli) 균주, 보다 바람직하게 K-12 균주인 에스케리치아 콜라이의 세포이고, 보다 더 바람직하게 에스케리치아 콜라이 K-12 균주는 이.콜라이 MG1655인 세포.
  31. 제1항 내지 제30항 중 어느 하나의 항에 있어서, 세포는 코어 삼당류로서 LN3을 포함하는 적어도 하나의 올리고당을 포함하는 올리고당의 혼합물을 합성할 수 있는 것인 세포.
  32. 유전자 조작된 세포에 의해서 코어 삼당류로서 락토-N-트리오스 (LN3; GlcNAc-베타1,3-Gal-베타1,4-Glc)를 포함하는 올리고당의 제조를 위한 방법으로서,
    a) 제1항 내지 제31항 중 어느 하나의 항에 따른 세포를 제공하는 단계, 및
    b) 상기 코어 삼당류로서 LN3을 포함하는 올리고당의 생산을 허용하는 조건 하에 배지에서 세포를 배양하는 단계, 및
    c) 바람직하게 상기 코어 삼당류로서 LN3을 포함하는 올리고당 또는 코어 삼당류로서 LN3을 포함하는 적어도 하나의 올리고당을 포함하는 올리고당 혼합물을 각각 배양으로부터 분리시키는 단계
    를 포함하는 것인 제조 방법.
  33. 제32항에 있어서, 방법은
    i) 배양 배지에 초기 반응기 부피의 리터 당 적어도 50, 보다 바람직하게 적어도 75, 보다 바람직하게 적어도 100, 보다 바람직하게 적어도 120, 보다 바람직하게 적어도 150 그램의 락토스를 포함하는 락토스 공급물을, 바람직하게 연속 방식으로, 바람직하게 배양 배지의 최종 부피가 상기 락토스 공급물의 첨가 전 배양 배지 부피의 3배 이하, 바람직하게 2배 이하, 보다 바람직하게 2배 미만이 되도록 첨가하는 단계로서, 반응기 부피는 250 mL 내지 10.000 ㎥ (입방 미터) 범위인, 단계;
    ii) 락토스 공급물을 연속 방식으로 배양 배지에 1일, 2일, 3일, 4일, 5일의 과정 동안 공급 용액을 통해서 첨가하는 단계;
    iii) 락토스 공급물을 연속 방식으로 배양 배지에 1일, 2일, 3일, 4일, 5일의 과정 동안 공급 용액을 통해서 첨가하는 단계로서, 상기 락토스 공급 용액의 농도는 50 g/L, 바람직하게 75 g/L, 보다 바람직하게 100 g/L, 보다 바람직하게 125 g/L, 보다 바람직하게 150 g/L, 보다 바람직하게 175 g/L, 보다 바람직하게 200 g/L, 보다 바람직하게 225 g/L, 보다 바람직하게 250 g/L, 보다 바람직하게 275 g/L, 보다 바람직하게 300 g/L, 보다 바람직하게 325 g/L, 보다 바람직하게 350 g/L, 보다 바람직하게 375 g/L, 보다 바람직하게, 400 g/L, 보다 바람직하게 450 g/L, 보다 바람직하게 500 g/L, 보다 더 바람직하게, 550 g/L, 가장 바람직하게 600 g/L이고; 바람직하게 상기 용액의 pH는 3과 7 사이로 설정되고, 바람직하게 상기 공급 용액의 온도는 20℃와 80℃ 사이로 유지되는 것인 단계
    중 적어도 하나를 더 포함하고,
    상기 방법은 상기 배양 배지의 최종 부피 중에 적어도 50 g/L, 바람직하게 적어도 75 g/L, 보다 바람직하게 적어도 90 g/L, 보다 바람직하게 적어도 100 g/L, 보다 바람직하게 적어도 125 g/L, 보다 바람직하게 적어도 150 g/L, 보다 바람직하게 적어도 175 g/L, 보다 바람직하게 적어도 200 g/L의 농도로 코어 삼당류로서 락토-N-트리오스 (LN3; GlcNAc-베타1,3-Gal-베타1,4-Glc)를 포함하는 올리고당을 생성시키는 것인 제조 방법.
  34. 제33항에 있어서, 락토스 공급은 배양의 시작부터 적어도 5 mM의 농도, 바람직하게 30, 40, 50, 60, 70, 80, 90, 100, 150 mM의 농도, 보다 바람직하게 > 300 mM의 농도로 락토스를 첨가하여 수행되는 것인 제조 방법.
  35. 제33항 또는 제34항에 있어서, 상기 락토스 공급은 배양의 생산 단계 전반에서, 적어도 5 mM, 바람직하게 10 mM 또는 30 mM의 락토스 농도가 수득되는, 농도로 배양 배지에 락토스를 첨가하여 수행되는 것인 제조 방법.
  36. 제32항 내지 제35항 중 어느 하나의 항에 있어서, 숙주 세포는 적어도 약 60, 80, 100, 또는 약 120시간 동안 또는 연속 방식으로 배양되는 것인 제조 방법.
  37. 제32항 내지 제36항 중 어느 하나의 항에 있어서, 탄소 및 에너지 공급원, 바람직하게 글루코스, 글리세롤, 프룩토스, 말토스, 아라비노스, 말토덱스트린, 말토-올리고당, 말토트리오스, 솔비톨, 자일로스, 람노스, 수크로스, 갈락토스, 만노스, 메탄올, 에탄올, 트레할로스, 전분, 셀룰로스, 헤미-셀룰로스, 폴리올, 옥수수 침지액, 고-프룩토스 시럽, 숙시네이트, 말레이트, 아세테이트, 시트레이트, 락테이트 및 피루베이트가 또한 바람직하게 연속적으로 배양 배지에, 바람직하게 락토스와 함께, 첨가되는 것인 제조 방법.
  38. 제32항 내지 제37항 중 어느 하나의 항에 있어서, 지수적 세포 성장의 제1 단계는 락토스가 제2 단계에서 배양 배지에 첨가되기 전에 탄소-기반 기질, 바람직하게 글루코스 또는 수크로스를 배양 배지에 첨가하여 제공되는 것인 제조 방법.
  39. 제32항 내지 제38항 중 어느 하나의 항에 있어서, 상기 분리는 하기 단계 중 적어도 하나를 포함하는 것인 제조 방법: 청징화, 한외여과, 나노여과, 역삼투, 미세여과, 활성 차콜 또는 탄소 처리, 접선 유동 고-성능 여과, 접선 유동 한외여과, 친화성 크로마토그래피, 이온 교환 크로마토그래피, 소수성 상호작용 크로마토그래피 및/또는 겔 여과, 리간드 교환 크로마토그래피.
  40. 제32항 내지 제39항 중 어느 하나의 항에 있어서, 상기 코어 삼당류로서 LN3을 포함하는 올리고당 또는 코어 삼당류로서 LN3을 포함하는 적어도 하나의 올리고당을 포함하는 올리고당 혼합물의 각각 상기 세포로부터의 정제 단계를 더 포함하는 것인 제조 방법.
  41. 제32항 내지 제40항 중 어느 하나의 항에 있어서, 상기 정제는 하기 단계 중 적어도 하나를 포함하는 것인 제조 방법: 활성 차콜 또는 탄소의 사용, 차콜의 사용, 나노여과, 한외여과 또는 이온 교환, 알콜의 사용, 수성 알콜 혼합물의 사용, 결정화, 증발, 침전, 건조, 분무 건조 또는 동결건조.
  42. 코어 삼당류로서 LN3을 포함하는 올리고당의 발효적 생산에서 제1항 내지 제12항 중 어느 하나의 항에 정의된 바와 같은 막 단백질의 군으로부터 선택되는 막 단백질의 용도.
  43. 코어 삼당류로서 LN3을 포함하는 올리고당의 생산을 위한 제1항 내지 제31항 중 어느 하나의 항에 따른 세포의 용도.
  44. 코어 삼당류로서 LN3을 포함하는 적어도 하나의 올리고당을 포함하는 올리고당의 혼합물의 생산을 위한 제31항에 따른 세포의 용도.
  45. 코어 삼당류로서 LN3을 포함하는 올리고당의 생산을 위한 제32항 내지 제41항 중 어느 하나의 항에 따른 방법의 용도.
KR1020237028215A 2021-01-20 2022-01-20 숙주 세포에서 코어 구조로서 ln3을 포함하는 올리고당의생산 KR20230134558A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP21152592.8 2021-01-20
EP21152592 2021-01-20
PCT/EP2022/051163 WO2022157213A1 (en) 2021-01-20 2022-01-20 Production of oligosaccharides comprising ln3 as core structure in host cells

Publications (1)

Publication Number Publication Date
KR20230134558A true KR20230134558A (ko) 2023-09-21

Family

ID=74194595

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020237028215A KR20230134558A (ko) 2021-01-20 2022-01-20 숙주 세포에서 코어 구조로서 ln3을 포함하는 올리고당의생산

Country Status (7)

Country Link
US (1) US20240117398A1 (ko)
EP (1) EP4281577A1 (ko)
KR (1) KR20230134558A (ko)
CN (1) CN116745430A (ko)
AU (1) AU2022210808A1 (ko)
TW (1) TW202246496A (ko)
WO (1) WO2022157213A1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023120615A1 (ja) * 2021-12-21 2023-06-29 協和発酵バイオ株式会社 コア3糖としてラクト-n-トリオースiiを含む糖質の製造方法および該糖質の結晶の製造方法
CN115369064B (zh) * 2022-09-30 2023-07-07 海南师范大学 一种增强生防贝莱斯芽孢杆菌根际定殖和防效的多功能复合菌剂的开发和应用
WO2024089131A1 (en) 2022-10-25 2024-05-02 Inbiose N.V. Saccharide importers for lacto-n-triose

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3235907B1 (en) 2010-07-12 2023-06-21 Inbiose N.V. Metabolically engineered organisms for the production of added value bio-products
RU2746410C2 (ru) 2014-11-14 2021-04-13 Инбиос Н.В. Мутантные микроорганизмы, устойчивые к гибели под действием лактозы
EP3141610A1 (en) * 2015-09-12 2017-03-15 Jennewein Biotechnologie GmbH Production of human milk oligosaccharides in microbial hosts with engineered import / export
WO2017182965A1 (en) * 2016-04-19 2017-10-26 Glycom A/S Separation of oligosaccharides from fermentation broth
CA3048521A1 (en) 2016-12-27 2018-07-05 Inbiose N.V. In vivo synthesis of sialylated compounds
EP3569713A1 (en) * 2018-05-16 2019-11-20 Jennewein Biotechnologie GmbH Use of glycosidases in the production of oligosaccharides
CA3115210A1 (en) * 2018-10-02 2020-04-09 Zimitech, Inc. Use of substrate importers for the export of oligosaccharides
AU2020358725A1 (en) 2019-10-03 2022-04-14 Turtletree Labs Pte. Ltd. Nutrient compositions and methods, kits, and cell compositions for producing the same
WO2021148614A1 (en) * 2020-01-23 2021-07-29 Glycom A/S Hmo production

Also Published As

Publication number Publication date
WO2022157213A1 (en) 2022-07-28
TW202246496A (zh) 2022-12-01
EP4281577A1 (en) 2023-11-29
CN116745430A (zh) 2023-09-12
AU2022210808A1 (en) 2023-08-31
US20240117398A1 (en) 2024-04-11

Similar Documents

Publication Publication Date Title
WO2022034076A2 (en) Production of galactosylated di- and oligosaccharides
KR20230134558A (ko) 숙주 세포에서 코어 구조로서 ln3을 포함하는 올리고당의생산
EP4192946A1 (en) Cellular production of di- and/or oligosaccharides
EP4192945A1 (en) Cellular production of sialylated di- and/or oligosaccharides
KR20240008322A (ko) 발효 생산
WO2022219188A1 (en) Cellular production of sialylated di- and/or oligosaccharides
KR20230172003A (ko) 바이오산물의 세포 생산
WO2023175079A1 (en) Sialyltransferases for the production of sialylated oligosaccharides
KR20240035566A (ko) 락토-n-바이오스 전환 푸코실트랜스퍼라제
WO2023111141A1 (en) Sialyltransferases for the production of sialylated oligosaccharides
KR20230132539A (ko) 글리코실화된 생산물의 세포 생산
TW202221134A (zh) 半乳糖化雙醣與寡醣的產生