KR20220035247A - 숙주 세포에서 푸코실락토스의 제조 - Google Patents
숙주 세포에서 푸코실락토스의 제조 Download PDFInfo
- Publication number
- KR20220035247A KR20220035247A KR1020227005675A KR20227005675A KR20220035247A KR 20220035247 A KR20220035247 A KR 20220035247A KR 1020227005675 A KR1020227005675 A KR 1020227005675A KR 20227005675 A KR20227005675 A KR 20227005675A KR 20220035247 A KR20220035247 A KR 20220035247A
- Authority
- KR
- South Korea
- Prior art keywords
- seq
- coli
- protein
- fucosyllactose
- blon
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/18—Preparation of compounds containing saccharide radicals produced by the action of a glycosyl transferase, e.g. alpha-, beta- or gamma-cyclodextrins
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/24—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Enterobacteriaceae (F), e.g. Citrobacter, Serratia, Proteus, Providencia, Morganella, Yersinia
- C07K14/245—Escherichia (G)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/67—General methods for enhancing the expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1048—Glycosyltransferases (2.4)
- C12N9/1051—Hexosyltransferases (2.4.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y204/00—Glycosyltransferases (2.4)
- C12Y204/01—Hexosyltransferases (2.4.1)
- C12Y204/01065—3-Galactosyl-N-acetylglucosaminide 4-alpha-L-fucosyltransferase (2.4.1.65), i.e. alpha-1-3 fucosyltransferase
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Biophysics (AREA)
- General Chemical & Material Sciences (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Medicinal Chemistry (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
Abstract
본 발명은 합성 생물학 및 대사 공학의 기술 분야에 관한 것이다. 더 구체적으로, 본 발명은 대사 조작된 숙주 세포의 발효 기술 분야에 관한 것이다. 본 발명은 유전자 변형 세포를 이용한 발효에 의해 푸코실락토스를 제조하는 방법, 및 이러한 방법에 사용되는 유전자 변형 세포를 개시한다. 상기 유전자 변형 세포는 푸코실락토스 합성에 관여하는 효소를 코딩하는 핵산 서열을 적어도 1개 포함하고, 더 구체적으로 상기 세포는 푸코실락토스를 합성하는 푸코실트란스퍼라제를 코딩하는 핵산 서열 및 막 단백질을 발현하는 적어도 하나의 핵산, 더 구체적으로는 푸코실락토스 수송을 가능하게 하는 막 단백질을 발현하는 핵산 서열을 포함한다.
Description
본 발명은 합성 생물학 및 대사 공학의 기술 분야에 관한 것이다. 더 구체적으로, 본 발명은 대사 조작된 숙주 세포의 발효 기술 분야에 관한 것이다. 본 발명은 유전자 변형 세포를 이용한 발효에 의해 푸코실락토스 (fucosyllactose)를 제조하는 방법, 및 이러한 방법에 사용되는 유전자 변형 세포를 개시한다. 상기 유전자 변형 세포는 푸코실락토스 합성에 관여하는 효소를 코딩하는 핵산 서열을 적어도 1개 포함하고, 더 구체적으로 상기 세포는 푸코실락토스를 합성하는 푸코실트란스퍼라제를 코딩하는 핵산 서열 및 막 단백질을 발현하는 적어도 하나의 핵산, 더 구체적으로는 푸코실락토스 수송을 가능하게 하는 막 단백질을 발현하는 핵산 서열을 포함한다.
오늘날, HMO (Human Milk Oligosaccharides) 계열에 속하는 80개 이상의 화합물들이 구조적으로 특성 규명되었다. 이러한 HMO는 프리바이오틱스 (prebiotics)로 기능하는 복합 올리고사카라이드의 부류를 나타낸다. 또한, HMO의 상피 에피토프에 대한 구조적 상동성은 박테리아 병원체에 대한 보호 특성을 설명한다. 유아 위장관 내에서, HMO는 선택된 박테리아 균주의 성장에 선택적으로 영양을 공급하여, 모유를 먹은 유아에서 독특한 장내 미생물의 발달을 촉진한다.
이러한 HMO들 중 일부는 특정 생물학적 활성을 나타낼 가능성이 가장 높은 특정 푸코실화 구조의 존재를 필요로 한다. 이러한 푸코실화 올리고사카라이드의 생성은 푸코실트란스퍼라제의 작용을 필요로 한다. 글리코실트란스퍼라제 (glycosyltransferases)의 효소 패밀리에 속하는 이러한 푸코실트란스퍼라제는 척추동물, 무척추동물, 식물, 진균, 효모 및 박테리아에서 널리 발현된다. 이들은 공여체, 일반적으로 구아노신-디포스페이트 푸코스 (GDP-푸코스)로부터의 푸코스 잔기를, 올리고사카라이드, (당)단백질 및 (당)지질을 포함하는 수용체로 전달하는 것을 촉매한다. 따라서 푸코실화 수용체 기질은 다양한 생물학적 및 병리학적 과정에 관여한다.
푸코실락토스 (FL)의 미생물 발효 제조에서, 상기 FL은 많은 경우에 산업적 생산 숙주에서 세포내에 생성된다. 당해 분야에서 올리고사카라이드를 세포에서 생성하는데 있어 진정한 어려움으로 확인된 한 가지 문제는 생성된 올리고사카라이드의 세포내 농축 및 이의 추출이다. 상기 세포내 농축은 원하는 올리고사카라이드의 생성에 대한 생성물-억제 효과에 대한 책임이 있는 것으로 여겨진다. 합성이 느려지거나, 또는 원하는 올리고사카라이드가 세포독성 농도에 도달하여, 대사 정지 또는 세포 용해가 발생할 수 있다.
본 발명의 목적은 푸코실락토스가 효율적이고, 시간 및 비용-효과적인 방식으로 생성될 수 있고, 원하는 생성물을 더 많은 양으로 수득하는 수단 및 방법을 제공하는 것이다.
본 발명에 따르면, 이러한 목적 및 다른 목적은 푸코실락토스 제조를 위한 방법 및 세포를 제공함으로써 달성되며, 여기서 상기 세포는 푸코실락토스 생성을 위해 유전자 변형되고, 푸코실락토스 합성에 관여하는 효소를 코딩하는 핵산 서열을 적어도 1개 포함하며, 더 구체적으로 상기 세포는 푸코실락토스를 합성하는, 푸코실트란스퍼라제를 코딩하는 핵산 서열을 포함한다. 상기 세포는 또한 본 발명에 따른 막 단백질을 발현하고, 더 구체적으로 상기 세포는 또한 푸코실락토스 수송을 가능하게 하기 위해 이전에 알려지지 않은 막 단백질을 발현한다.
발명의 요약
놀랍게도, 본 발명에서 사용된 막 단백질은 새롭게 확인된 막 단백질을 제공하고, 더 구체적으로 본 발명은 푸코실락토스 수송을 가능하게 하고 푸코실락토스의 발효 제조에 긍정적인 효과를 갖는, 이전에 알려지지 않은 새롭게 확인된 막 단백질을 제공하여, 푸코실락토스를 생성하는 숙주 세포를 유전자 조작하는데 사용하는 경우 수율, 생산성, 비생산성 및/또는 성장 속도가 더 양호한 것을 발견하였다.
본 발명은 또한 푸코실락토스를 제조하는 방법을 제공한다. 상기 푸코실락토스는 본 발명의 막 단백질을 포함하는 숙주 세포를 사용하여 수득된다.
정의
본 명세서에서 본 발명 및 이의 다양한 구체예를 설명하기 위해 사용된 단어는 이들의 통상적으로 정의된 의미로 이해될 뿐만 아니라, 본 명세서에서 통상적으로 정의된 범위를 넘어선 구조, 물질 또는 작용의 특별한 정의가 포함되는 것으로 이해되어야 한다. 따라서, 일 요소가 본 명세서의 맥락에서 하나 초과의 의미를 포함하는 것으로 이해될 수 있다면, 청구항에서 이의 사용은 명세서 및 단어 자체에 의해 뒷받침되는 모든 가능한 의미를 포괄하는 것으로 이해되어야 한다.
본원에 개시된 본 발명의 다양한 구체예 및 구체예의 양상은 본 명세서에서 구체적으로 기재된 순서 및 문맥으로 이해될 뿐만 아니라 임의의 순서 및 이들의 임의의 조합을 포함하는 것으로 이해되어야 한다. 문맥에 따라, 단수로 사용되는 모든 단어는 복수를 포함하는 것으로 간주되어야 하며, 그 반대의 경우도 마찬가지이다. 달리 정의되지 않는 한, 본원에 사용되는 모든 기술 및 과학 용어는 본 발명이 속하는 기술 분야의 통상의 기술자에 의해 통상적으로 이해되는 것과 동일한 의미를 갖는다. 일반적으로, 본원에서 사용된 명명법 및 본원에 기재된 세포 배양, 분자 유전학, 유기 화학 및 핵산 화학 및 혼성화의 실험실 절차는 당해 분야에 잘 알려져 있고, 일반적으로 사용되는 것이다. 핵산 및 펩티드 합성에 대한 표준 기술이 사용된다. 일반적으로, 효소 반응 및 정제 단계는 제조자의 명세서에 따라 수행된다.
도면 및 명세서에는 본 발명의 구체예가 개시되어 있으며, 특정 용어가 사용되더라도, 이러한 용어는 설명적인 의미로만 사용되고, 제한의 목적이 아니며, 본 발명의 범위는 하기 청구항에 명시되어 있다. 예시된 구체예는 단지 예시의 목적을 위해 제시되었으며 본 발명을 제한하는 것으로 간주되어서는 안된다는 것을 이해해야 한다. 당업자에게는 변경, 다른 구체예, 개선, 세부 사항 및 사용이 본원의 개시내용 및 정신과 일치하고, 청구항에 의해서만 제한되는 본 개시내용의 범위 내에서 이루어질 수 있으며, 균등물의 원칙을 포함하여 특허법에 따라 해석될 수 있다는 것이 명백할 것이다. 하기 청구 범위에서, 청구 단계를 지정하는데 사용되는 참조 문자는 설명의 편의를 위해서만 제공되며, 단계를 수행하기 위한 임의의 특정 순서를 의미하지는 않는다.
본 발명에 따르면, 용어 "폴리뉴클레오티드(들)"는 일반적으로 임의의 폴리리보뉴클레오티드 또는 폴리데옥시리보뉴클레오티드를 지칭하며, 이는 비변형된 RNA 또는 DNA, 또는 변형된 RNA 또는 DNA일 수 있다. "폴리뉴클레오티드(들)"에는 단일가닥 및 이중가닥 DNA, 단일가닥 및 이중가닥 영역의 혼합물 또는 단일가닥, 이중가닥 및 삼중가닥 영역인 DNA, 단일가닥 및 이중가닥 RNA, 및 단일가닥 및 이중가닥 영역의 혼합물인 RNA, 단일가닥 또는 더 전형적으로 이중가닥 또는 삼중가닥 영역, 또는 단일가닥 및 이중가닥 영역의 혼합물일 수 있는 DNA 및 RNA를 포함하는 혼성 분자를 제한 없이 포함한다. 또한, 본원에서 사용되는 "폴리뉴클레오티드"는 RNA, 또는 DNA, 또는 RNA 및 DNA 둘 다를 포함하는 삼중가닥 영역을 지칭한다. 이러한 영역 내의 가닥은 동일한 분자 또는 상이한 분자로부터 유래될 수 있다. 상기 영역은 하나 이상의 분자들 모두를 포함할 수 있지만, 더 전형적으로 일부 분자의 영역만을 포함할 수 있다. 삼중-나선 영역의 분자들 중 하나는 종종 올리고뉴클레오티드이다. 본원에서 사용된, 용어 "폴리뉴클레오티드(들)"는 또한 하나 이상의 변형된 염기를 함유하는 상기 기재된 DNA 또는 RNA를 포함한다. 따라서, 안정성 또는 기타 이유로 변형된 백본을 가진 DNA 또는 RNA가 본 발명에 따른 "폴리뉴클레오티드(들)"이다. 더욱이, 비정상적인 염기 예컨대 이노신 또는 변형된 염기 예컨대 트리틸화 염기를 포함하는 DNA 또는 RNA는 용어 "폴리뉴클레오티드"에 포함되는 것으로 이해되어야 한다. DNA 및 RNA에 대해 매우 다양한 변형이 이루어질 수 있다는 것을 이해할 것이며, 이는 당업자에게 알려진 많은 유용한 목적을 제공한다. 본원에서 사용된 용어 "폴리뉴클레오티드(들)"는 화학적, 효소적 또는 대사적으로 변형된 형태의 폴리뉴클레오티드뿐만 아니라, 예를 들어 단순 및 복합 세포를 포함하는 바이러스 및 세포의 특징적인 DNA 및 RNA의 화학적 형태를 포함한다. 용어 "폴리뉴클레오티드(들)"는 또한 올리고뉴클레오티드(들)로 종종 지칭되는 짧은 폴리뉴클레오티드를 포함한다.
"폴리펩티드(들)"는 2개 이상의 아미노산이 펩티드 결합 또는 변형된 펩티드 결합에 의해 서로 연결된 임의의 펩티드 또는 단백질을 지칭한다. "폴리펩티드(들)"는 통상 펩티드, 올리고펩티드 및 올리고머로 지칭되는 짧은 사슬 및 일반적으로 단백질로 지칭되는 더 긴 사슬 모두를 지칭한다. 폴리펩티드는 20개의 유전자 코딩된 아미노산 이외의 다른 아미노산을 함유할 수 있다. "폴리펩티드(들)"에는 처리과정 및 다른 번역 후 변형과 같은 자연 과정에 의해 변형된 것뿐만 아니라 화학적 변형 기술에 의해 변형된 것을 포함한다. 이러한 변형은 방대한 연구 문헌뿐만 아니라 기본 교과서 및 더 자세한 단행본에 잘 설명되어 있으며, 이는 당업자에게 잘 알려져 있다. 동일한 타입의 변형이 해당 폴리펩티드의 여러 부위에서 동일하거나 또는 다양한 정도로 존재할 수 있다. 또한, 해당 폴리펩티드는 많은 타입의 변형을 함유할 수 있다. 변형은 펩티드 백본, 아미노산 측쇄, 및 아미노 또는 카복실 말단을 포함하여, 폴리펩티드의 어느 곳에서나 발생할 수 있다. 변형에는 예를 들어 아세틸화, 아실화, ADP-리보실화, 아미드화, 플라빈의 공유 부착, 헴 (heme) 모이어티의 공유 부착, 뉴클레오티드 또는 뉴클레오티드 유도체의 공유 부착, 지질 또는 지질 유도체의 공유 부착, 포스포티딜이노시톨의 공유 부착, 가교, 고리화, 이황화 결합 형성, 탈메틸화, 공유 가교 형성, 피로글루타메이트 형성, 포르밀화, 감마-카복실화, 글리코실화, GPI 앵커 형성, 하이드록실화, 요오드화, 메틸화, 미리스토일화, 산화, 단백질분해 처리, 인산화, 프레닐화, 라세미화, 지질 부착, 황산화, 글루탐산 잔기의 감마-카복실화, 하이드록실화 및 ADP-리보실화, 셀레노일화, 아미노산의 단백질로의 전달-RNA 매개 부가 예컨대 아르기닐화, 및 유비퀴틴화를 포함한다. 폴리펩티드는 분지형이거나, 또는 분지 (branching)가 있거나 또는 없는 고리형일 수 있다. 고리형, 분지형 및 분지된 원형 폴리펩티드는 번역 후 자연 과정으로부터 유래될 수 있으며, 전체적으로 합성 방법으로도 만들어질 수 있다.
"단리된"은 이의 자연 상태로부터 "인간의 손에 의해" 변경된 것을 의미하며, 즉 자연에서 나타나는 경우, 이의 원래 환경으로부터 변경되거나 또는 제거되는, 또는 이들 모두를 의미한다. 예를 들어, 살아있는 유기체에 자연적으로 존재하는 폴리뉴클레오티드 또는 폴리펩티드는 "단리"된 것은 아니고, 상기 용어가 본원에서 사용되는 바와 같이, 이의 자연 상태의 공존하는 물질들로부터 분리된 동일한 폴리뉴클레오티드 또는 폴리펩티드는 "단리"된다. 유사하게, 본원에서 사용되는 "합성" 서열은 합성으로 생성되고 자연 공급원으로부터 직접 단리되지 않는 임의의 서열을 의미한다. 본원에서 사용되는 용어 "합성된"은 자연 공급원으로부터 직접 단리되지 않고 임의의 합성으로 생성된 서열을 의미한다.
"재조합"은 하나의 종 유래의 유전자를 다른 종의 숙주 유기체의 세포로 이식하거나 또는 스플라이싱하여 제조된 유전자 조작된 DNA를 의미한다. 이러한 DNA는 숙주의 유전적 구성의 일부가 되어 복제된다.
본 개시내용의 맥락에서 용어 "내인성"은 세포의 천연 부분이고 세포 염색체의 천연 위치에서 나타나는 임의의 폴리뉴클레오티드, 폴리펩티드 또는 단백질 서열을 지칭한다.
용어 "이종"은 폴리뉴클레오티드, 유전자, 핵산, 폴리펩티드 또는 효소와 관련하여 사용되는 경우 숙주 유기체 종 이외의 출처로부터 유래되거나 또는 출처 유래의 폴리뉴클레오티드, 유전자, 핵산, 폴리펩티드 또는 효소를 지칭한다. 대조적으로, "상동" 폴리뉴클레오티드, 유전자, 핵산, 폴리펩티드 또는 효소는 숙주 유기체 종으로부터 유래된 폴리뉴클레오티드, 유전자, 핵산, 폴리펩티드 또는 효소를 나타내기 위해 본원에서 사용된다. 유전자 서열을 유지 또는 조작하는데 사용되는 유전자 조절 서열 또는 보조 핵산 서열 (예: 프로모터, 5' 비번역 영역, 3' 비번역 영역, 폴리 A 부가 서열, 인트론 서열, 스플라이스 부위, 리보솜 결합 부위, 내부 리보솜 진입 서열, 게놈 상동성 영역, 재조합 부위 등)을 언급하는 경우, "이종"은 상기 조절 또는 보조 핵산 서열이 구조체, 게놈, 염색체 또는 에피솜에서 병치되는 유전자와 상기 조절 서열 또는 보조 서열이 자연적으로 결합되지 않음을 의미한다. 따라서, 자연 상태 (즉, 비-유전자 조작된 유기체의 게놈)에서 작동 가능하게 연결되지 않은 유전자에 프로모터가 작동 가능하게 연결되면, 상기 프로모터가 연결되는 유전자와 동일한 종 (또는 일부 경우에, 동일한 유기체)으로부터 유래될 수 있더라도 본원에서 "이종 프로모터"로 지칭된다.
본원에서 사용된 용어 "폴리펩티드를 코딩하는 폴리뉴클레오티드"는 본 발명의 폴리펩티드를 코딩하는 서열을 포함하는 폴리뉴클레오티드를 포함한다. 상기 용어는 또한 코딩 및/또는 비-코딩 서열을 함유할 수 있는 추가 영역과 함께 폴리펩티드를 코딩하는 단일 연속 영역 또는 불연속 영역 (예를 들어, 통합 파지 또는 삽입 서열 또는 편집에 의해 중단됨)을 포함하는 폴리뉴클레오티드를 포함한다.
유전자의 "변형된 발현"이라는 용어는 푸코실락토스 제조 방법의 임의의 단계에서 상기 유전자의 야생형 발현과 비교하여 발현의 변화에 관한 것이다. 상기 변형된 발현은 야생형과 비교하여 발현이 더 낮거나 또는 더 높으며, 여기서 용어 "더 높은 발현"은 또한 내인성 유전자의 경우 상기 유전자의 "과발현"으로 또는 야생형 균주에 존재하지 않는 이종 유전자의 경우 "발현"으로 정의된다. 보다 낮은 발현은 기능적인 최종 산물을 생성하는 능력이 떨어지거나 (즉, 기능적 야생형 유전자와 비교하여 통계적으로 유의미하게 '능력이 떨어짐 (less-able)') 또는 이를 전혀 이용할 수 없는 (예컨대 녹-아웃 유전자) 방식으로 유전자를 변경하는데 사용되는 당업자에게 잘 알려져 있는 기술 (예: siRNA, CrispR, CrispRi, 재조합 기술 (recombineering), 상동 재조합 (homologous recombination), ssDNA 돌연변이 유발 (mutagenesis), RNAi, miRNA, asRNA, 돌연변이 유전자 (mutating genes), 녹-아웃 유전자 (knocking-out genes), 트란스포존 돌연변이 유발 (transposon mutagenesis), ...의 사용)에 의해 수득된다. 과발현 또는 발현은 당업자에게 통상적으로 잘 알려진 기술에 의해 수득되며, 여기서 상기 유전자는 "발현 카세트"의 일부이고, 이는 프로모터 서열, 비-번역 영역 서열 (리보솜 결합 서열 또는 Kozak 서열 함유), 코딩 서열 (예를 들어, 막 단백질 유전자 서열) 및 선택적으로 전사 종결인자가 존재하고, 기능적 활성 단백질의 발현을 유도하는 임의의 서열과 관련이 있다. 상기 표현은 항시적 또는 조건적이거나 또는 조절된다.
용어 "항시적 발현"은 소정의 성장 조건 하에 RNA 폴리머라제의 서브유닛 (예: 박테리아 시그마 인자) 이외의 전사 인자에 의해 조절되지 않는 발현으로 정의된다. 이러한 전사 인자의 비-제한적인 예로는 대장균 (E. coli)에서 CRP, LacI, ArcA, Cra, IclR, 또는 사카로마이세스 세레비지에 (Saccharomyces cerevisiae)에서 Aft2p, Crz1p, Skn7, 또는 B. 서브틸리스 (B. subtilis.)에서 DeoR, GntR, Fur가 있다. 이들 전사 인자는 특정 서열에 결합하고, 소정의 성장 조건에서 발현을 차단하거나 또는 향상시킬 수 있다. RNA 폴리머라제는 예를 들어 원핵생물 숙주에서 시그마 인자를 통해 전사를 개시하기 위해 특정 서열에 결합한다.
용어 "조절된 발현"은 소정의 성장 조건하에 RNA 폴리머라제의 서브유닛 (예: 박테리아 시그마 인자) 이외의 전사 인자에 의해 조절되는 발현으로 정의된다. 이러한 전사 인자의 예가 상기에 기재되어 있다. 통상 발현 조절은 유도제 예컨대 이에 한정되지 않는 IPTG, 아라비노스, 람노스, 푸코스, 알로-락토스 또는 pH 이동, 또는 온도 이동 또는 탄소 고갈 또는 기질 또는 생성된 산물에 의해 수득된다.
용어 "야생형"은 자연에서 발생하는 통상 알려진 유전형 또는 표현형 상황을 나타낸다.
본원에서 사용된 용어 "변이체(들)"는 참조 폴리뉴클레오티드 또는 폴리펩티드와 상이하지만, 필수적인 특성을 유지하는 폴리뉴클레오티드 또는 폴리펩티드이다. 폴리뉴클레오티드의 전형적인 변이체는 다른 참조 폴리뉴클레오티드와 뉴클레오티드 서열이 상이하다. 상기 변이체의 뉴클레오티드 서열의 변화는 참조 폴리뉴클레오티드에 의해 코딩된 폴리펩티드의 아미노산 서열을 변경하거나 또는 변경하지 않을 수 있다. 뉴클레오티드 변화는 하기에 논의된 바와 같이 참조 서열에 의해 코딩된 폴리펩티드에서 아미노산 치환, 추가, 결실, 융합 및 절단을 초래할 수 있다. 폴리펩티드의 전형적인 변이체는 다른 참조 폴리펩티드와 아미노산 서열이 상이하다. 일반적으로, 참조 폴리펩티드 및 변이체의 서열이 전체적으로 매우 유사하고 많은 영역에서 동일하도록 차이가 제한된다. 변이체 및 참조 폴리펩티드는 하나 이상의 치환, 추가, 결실의 임의의 조합에 의해 아미노산 서열이 상이할 수 있다. 치환되거나 또는 삽입된 아미노산 잔기는 유전자 코드에 의해 코딩된 아미노산 잔기일 수도 있거나 또는 아닐 수 있다. 폴리뉴클레오티드 또는 폴리펩티드의 변이체는 대립 유전자 변이체와 같이 자연적으로 발생하거나, 또는 자연적으로 발생하는 것으로 알려지지 않은 변이체일 수 있다. 폴리뉴클레오티드 및 폴리펩티드의 비-자연적으로 발생하는 변이체는 돌연변이유발 기술, 직접 합성 및 당업자에게 알려진 다른 재조합 방법에 의해 제조될 수 있다.
일부 구체예에서, 본 개시내용은 본 발명에서 사용되는 막 단백질의 구조를 변형함으로써 기능적 변이체를 제조하는 것을 고려한다. 변이체는 아미노산 치환, 결실, 추가 또는 이들의 조합에 의해 생성될 수 있다. 예를 들어, 류신을 이소류신 또는 발린으로, 아스파르테이트를 글루타메이트로, 트레오닌을 세린으로의 단리된 대체, 또는 아미노산을 구조적으로 관련된 아미노산으로 유사한 대체 (예: 보존적 돌연변이)는 생성된 분자의 생물학적 활성에 큰 영향을 미치지 않을 것으로 기대된다. 보존적 대체는 아미노산의 측쇄와 관련된 아미노산 패밀리 내에서 일어나는 것이다. 본 개시내용의 폴리펩티드의 아미노산 서열의 변화가 기능적 상동체를 초래하는지 여부는 야생형 폴리펩티드와 유사한 방식으로 세포에서 반응을 생성하는, 본 발명의 경우는 변이체가 없는 세포보다 더 나은 수율, 생산성 및/또는 성장 속도를 제공하는, 변이체 폴리펩티드의 능력을 평가함으로써 용이하게 결정될 수 있다.
본원에서 사용된 용어 "기능적 상동체"는 서열 유사성을 갖고 또한 생화학적 활성과 같은 적어도 하나의 기능적 특성을 공유하는 분자를 설명한다. 더 구체적으로, 본원에서 사용된 용어 "기능적 상동체"는 서열 유사성 (즉, 상동성)을 갖고, 동시에 생화학적 활성과 같은 기능적 유사성을 적어도 하나 갖는 단백질을 설명한다 (Altenhoff et al., PLoS Comput. Biol. 8 (2012) e1002514).
기능적 상동체는 때때로 오르토로그 (orthologs)로 지칭되며, 여기서 "오르토로그"는 다른 종의 참조 유전자 또는 단백질과 기능적으로 동등한 상동 유전자 또는 단백질을 지칭한다. 기능적 상동체는 전형적으로 동일한 특성에 대해 유사하지만 반드시 동일하지는 않은 정도까지 특성을 야기할 것이다. 기능적으로 상동성 단백질은 하나의 상동체에 의해 생성된 정량적 측정이 다른 상동체의 적어도 10%; 더 전형적으로, 원래 분자에 의해 생성된 것의 적어도 20%, 약 30% 내지 약 40%; 예를 들어, 약 50% 내지 약 60%; 약 70% 내지 약 80%; 또는 약 90% 내지 약 95%; 약 98% 내지 약 100%, 또는 100% 초과인 경우 동일한 특성을 제공한다. 따라서, 상기 분자가 효소 활성을 갖는 경우, 기능적 상동체는 원래 효소에 비해 상기 언급한 효소 활성 퍼센트를 가질 것이다. 상기 분자가 DNA-결합 분자 (예: 폴리펩티드)인 경우, 상동체는 원래 분자와 비교하여 결합된 분자의 중량으로 측정하여 상기 언급된 결합 친화도 퍼센트를 가질 것이다.
기능적 상동체 및 참조 폴리펩티드는 자연 발생 폴리펩티드일 수 있고, 상기 서열 유사성은 수렴 또는 발산 전개 이벤트에 기인할 수 있다.
기능적 상동체는 뉴클레오티드 및 폴리펩티드 서열 정렬의 분석에 의해 확인될 수 있다. 예를 들어, 뉴클레오티드 또는 폴리펩티드 서열의 데이터베이스에서 쿼리를 수행하면 바이오매스-조절 폴리펩티드의 상동체를 확인할 수 있다. 서열 분석은 참조 서열로서 바이오매스-조절 폴리펩티드의 아미노산 서열을 사용하는 비-중복 데이터베이스의 BLAST, Reciprocal BLAST 또는 PSI-BLAST 분석을 포함할 수 있다. 아미노산 서열은 일부 경우에 뉴클레오티드 서열로부터 추정된다. 전형적으로, 40% 초과의 서열 동일성을 갖는 데이터베이스의 폴리펩티드는 바이오매스-조절 폴리펩티드로서의 적합성에 대한 추가 평가를 위한 후보이다. 아미노산 서열 유사성은 보존적 아미노산 치환, 예컨대 하나의 소수성 잔기의 다른 소수성 잔기에 대한 치환 또는 하나의 극성 잔기의 다른 극성 잔기에 대한 치환을 허용한다. 원하는 경우, 추가 평가할 후보의 수를 좁히기 위해 이러한 후보에 대한 수동 검사를 수행할 수 있다. 생산성-조절 폴리펩티드에 존재하는 도메인, 예를 들어 보존된 기능성 도메인을 갖는 것으로 보이는 후보를 선택함으로써 수동 검사가 수행될 수 있다.
폴리뉴클레오티드와 관련하여 "단편"은 클론 또는 폴리뉴클레오티드 분자의 임의의 부분, 특히 사용 가능한 기능적 특성을 유지하는 폴리뉴클레오티드의 일부를 지칭한다. 유용한 단편에는 혼성화 또는 증폭 기술 또는 복제, 전사 또는 번역의 조절에 사용될 수 있는 올리고뉴클레오티드 및 폴리뉴클레오티드를 포함한다. "폴리뉴클레오티드 단편"은 폴리뉴클레오티드의 임의의 서브서열, 전형적으로 본원에 제공된 임의의 서열의 적어도 약 9개의 연속 뉴클레오티드, 예를 들어 적어도 약 30개의 뉴클레오티드 또는 적어도 약 50개의 뉴클레오티드의 임의의 서브서열을 지칭한다. 예시되는 단편은 추가로 또는 대안으로서 폴리펩티드의 보존된 패밀리 도메인을 코딩하는 영역을 포함하거나, 이로 필수적으로 구성되거나, 또는 이로 구성되는 단편을 포함할 수 있다. 예시되는 단편은 추가로 또는 대안으로서 폴리펩티드의 보존된 도메인을 포함하는 단편을 포함할 수 있다.
단편은 추가로 또는 대안으로서 폴리펩티드 및 단백질 분자의 서브서열, 또는 폴리펩티드의 서브서열을 포함할 수 있다. 일부 경우에, 상기 단편 또는 도메인은 온전한 폴리펩티드와 마찬가지로 실질적으로 동일한 방식으로 또는 유사한 정도로 온전한 폴리펩티드의 적어도 하나의 생물학적 기능을 수행하는 폴리펩티드의 서브서열이다. 예를 들어, 폴리펩티드 단편은 DNA 프로모터 영역, 활성화 도메인 또는 단백질-단백질 상호작용을 위한 도메인에 결합하는 DNA-결합 부위 또는 도메인과 같은 인식 가능한 구조적 모티프 또는 기능적 도메인을 포함할 수 있고, 전사를 개시할 수 있다. 단편은 최소 3개의 아미노산 잔기로부터 온전한 폴리펩티드의 전체 길이까지, 예를 들어 길이가 적어도 약 20개의 아미노산 잔기, 예를 들어 길이가 적어도 약 30개인 아미노산 잔기까지 크기가 다양할 수 있다. 바람직하게는 단편은 이들이 유래된 폴리펩티드의 적어도 하나의 특성 또는 활성을 갖는 기능적 단편이며, 예를 들어 상기 단편은 폴리펩티드의 기능적 도메인 또는 보존된 도메인을 포함할 수 있다. 도메인은 예를 들어 Pfam (https://pfam.xfam.org/) (El-Gebali et al., Nucleic Acids Res. 47 (2019) D427-D432) 또는 보존된 도메인 데이터베이스 (Conserved Domain Database: CDD) (https://www.ncbi.nlm.nih.gov/cdd) (Lu et al., Nucleic Acids Res. 48 (2020) D265-D268) 지정으로 특성 규명될 수 있다. 본원에서 사용된 Pfam 데이터베이스는 2018년 9월에 공개된 Pfam database Pfam 32.0을 나타내고, 본원에서 사용된 CDD 데이터베이스는 2019년 4월 3일자로 공개된 CDD database v3.17을 나타낸다.
본원에서 사용된 용어 "푸코실락토스", "푸코실 락토스" 및 "FL"은 상호교환 가능하게 사용되며, 푸코스 잔기 및 락토스 잔기를 포함하는 올리고사카라이드를 지칭한다. 이러한 푸코실락토스는 2'-푸코실락토스, 3-푸코실락토스, 또는 디푸코실락토스 또는 이들의 임의의 조합을 지칭하고; 푸코실락토스는 2'-푸코실락토스, 3-푸코실락토스 또는 디푸코실락토스 중 임의의 적어도 2개의 조합을 지칭한다.
본 발명에서 사용된 용어 "알파-1,2'-푸코실트란스퍼라제", "알파 1,2' 푸코실트란스퍼라제", "2'-푸코실트란스퍼라제, "α-1,2'-푸코실트란스퍼라제", "α 1,2' 푸코실트란스퍼라제", "2'푸코실트란스퍼라제', "2'-FT" 또는 "2'FT"는 상호교환 가능하게 사용되며, 알파-1,2-연결에서 공여체 기질 GDP-L-푸코스로부터의 푸코스를 수용체 분자 락토스로의 전달을 촉매하는 글리코실트란스퍼라제를 지칭한다. "알파-1,2-푸코실트란스퍼라제" 또는 상기 용어 중 임의의 것을 코딩하는 폴리뉴클레오티드는 알파-1,2-연결에서 공여체 기질 GDP-L-푸코스로부터의 푸코스를 수용체 분자 락토스로의 전달을 촉매하는 이러한 글리코실트란스퍼라제를 코딩하는 폴리뉴클레오티드를 지칭한다.
본 발명에서 사용된 용어 "2'-푸코실락토스", "알파-1,2'-푸코실락토스", "알파 1,2' 푸코실락토스", "α-1,2'-푸코실락토스", "α 1,2' 푸코실락토스", "Fucα1-2Galβ1-4Glc", 2'FL" 또는 "2'-FL"은 상호교환 가능하게 사용된다. 바람직한 일 구체예에서, 이들 용어는 알파-1,2'-연결에서 GDP-L-푸코스로부터의 푸코스 잔기를 락토스에 전달하는 알파-1,2'-푸코실트란스퍼라제의 촉매작용에 의해 수득된 생성물을 지칭한다.
본 발명에서 사용된 용어 "알파-1,3-푸코실트란스퍼라제", "알파 1,3 푸코실트란스퍼라제", "3-푸코실트란스퍼라제", "α-1,3-푸코실트란스퍼라제", "α 1,3 푸코실트란스퍼라제", "3 푸코실트란스퍼라제, "3-FT" 또는 "3FT"는 상호교환 가능하게 사용되며, 알파-1,3-연결에서 공여체 기질 GDP-L-푸코스로부터의 푸코스를 수용체 분자 락토스로의 전달을 촉매하는 글리코실트란스퍼라제를 지칭한다. "알파-1,3-푸코실트란스퍼라제"를 코딩하는 폴리뉴클레오티드 또는 임의의 상기 용어는 알파-1,3-연결에서 공여체 기질 GDP-L-푸코스로부터의 푸코스를 수용체 분자 락토스로의 전달을 촉매하는 이러한 글리코실트란스퍼라제를 코딩하는 폴리뉴클레오티드를 지칭한다.
본 발명에서 사용된, 용어 "3-푸코실락토스", "알파-1,3-푸코실락토스", "알파 1,3 푸코실락토스", "α-1,3-푸코실락토스", "α 1,3 푸코실락토스", "Galβ1-4 (Fucα1-3)Glc", "3FL" 또는 "3-FL"은 상호교환 가능하게 사용된다. 바람직한 일 구체예에서, 이들 용어는 알파-1,3-연결에서 GDP-L-푸코스로부터의 푸코스 잔기를 락토스로 전달하는 알파-1,3-푸코실트란스퍼라제의 촉매 작용에 의해 수득된 생성물을 지칭한다.
본 발명에서 사용된 용어 "디푸코실락토스", "디-푸코실락토스", "락토디푸코테트라오스", "2',3-디푸코실락토스", "2',3 디푸코실락토스", "α-2',3-푸코실락토스", "α 2',3 푸코실락토스, "Fucα1-2Galβ 1-4(Fucα1-3)Glc", "DFLac", 2',3 diFL", "DFL" 또는 "diFL"은 상호교환 가능하게 사용된다. 바람직한 일 구체예에서, 이들 용어는 푸코스 잔기를 2'FL로 전달하여 2',3-디푸코실락토스를 생성하는 알파-1,3-푸코실트란스퍼라제의 촉매작용에 의해 수득된 생성물을 지칭하거나, 또는 푸코스 잔기를 3FL로 전달하여 2',3 디푸코실락토스를 생성하는 알파-1,2-푸코실트란스퍼라제의 촉매작용에 의해 수득된 생성물을 지칭한다.
본원에서 사용되는 용어 "올리고사카라이드"는 당해 분야에서 일반적으로 이해되는 바와 같고, 단당, 즉 모노사카라이드를 적은 수, 전형적으로 3 내지 10개 함유하는 사카라이드 폴리머를 지칭한다.
본원에서 사용된 "SET" 또는 "Sugar Efflux Transporter"는 InterPro 75.0 (공개일 2019.07.04)에 의해 정의되는 InterPRO 도메인 IPR001214를 갖는 단백질 및/또는 Eggnogdb 1.0.2 데이터베이스 (공개일 2017.11.03)에 의해 정의되는 eggNOGv4.5 패밀리 ENOG410XTE9에 속하는 단백질인 SET 패밀리의 막 단백질을 지칭한다. InterPro 도메인의 확인은 https://www.ebi.ac.uk/interpro/의 온라인 수단 또는 디폴트 값 (default values)을 사용하는 InterProScan (https://www.ebi.ac.uk/interpro/download.html)의 독립형 버젼 (standalone version)을 사용하여 수행될 수 있다. 오르톨로지 패밀리 (orthology family)의 eggNOGv4.5에서의 확인은 eggNOG-mapperv1 (http://eggnogdb.embl.de/#/app/home)의 독립형 버젼 또는 온라인 버젼을 사용하여 수행될 수 있다.
본원에서 사용된 용어 "막 단백질"은 세포막의 일부이거나 또는 세포막과 상호작용하여, 세포를 가로지르는 분자 및 정보의 흐름을 제어하는 단백질을 지칭한다. 따라서 상기 막 단백질은 세포로 내수송되거나 또는 외수송되는, 수송에 관여한다.
이러한 막 단백질은 www.tcdb.org에서 이용 가능한 Saier Lab Bioinformatics Group에 의해 운영 및 큐레이트되고, 막 수송 단백질의 기능적 및 계통 발생학적 분류를 제공하는 Transporter Classification Database에 의해 정의되는, 포터 (porters), P-P-결합-가수분해-유도 수송자 (P-P-bond-hydrolysis-driven transporters), β-Barrel 포린 (β-Barrel Porins), 보조 수송 단백질 (auxiliary transport proteins), 추정 수송 단백질 (putative transport proteins) 또는 포스포트란스퍼-유도 그룹 전위인자 (phosphotransfer-driven group translocators)일 수 있다. 이러한 Transporter Classification Database는 Transporter Classification (TC) 시스템으로 알려진 막 수송 단백질에 대한 포괄적 IUBMB 승인된 분류 시스템을 자세히 설명한다. 본원에 기재된 TCDB 분류 검색은 2019년 6월 17일자로 공개된 TCDB. org에 기반하여 정의된다.
포터는 운반체-매개 과정을 이용하는 유니포터 (uniporters), 심포터 (symporters) 및 안티포터 (antiporters)의 집합적인 이름이다 (Saier et al., Nucleic Acids Res. 44 (2016) D372-D379). 이들은 전기화학적 전위-유도 수송체에 속하며, 또한 2차 운반체-타입 촉진제 (secondary carrier-type facilitators)로 알려져 있다. 막 단백질이 하기를 촉매하는 운반체-매개 과정을 이용하는 경우 상기 막 단백질은 이러한 부류에 포함된다: 단일 종이 촉진 확산에 의해 수송되거나 또는 용질이 하전된 경우 막 전위-의존적 과정에서 수송되는 경우 유니포트; 2개 이상의 종이 화학삼투 에너지 이외의 직접적인 형태의 에너지에 커플링되지 않고, 밀접하게 커플링된 과정에서 반대 방향으로 수송되는 경우 안티포트; 및/또는 2개 이상의 종이 화학삼투 에너지 이외의 직접적인 형태의 에너지에 커플링되지 않고, 2차 운반체의 밀접하게 커플링된 과정에서 동일 방향으로 함께 수송되는 경우 심포트 (Forrest et al., Biochim. Biophys. Acta 1807 (2011) 167-188). 이러한 시스템은 통상 입체특이적이다. 용질:용질 역수송은 2차 운반체의 특징적인 특성이다. 포터 및 효소의 동적 회합은 전형적으로 세포외 구획으로부터 수득된 기질을 이의 세포 대사작용으로 직접 전달하는 기능적 막 수송 대사체를 형성한다 (Moraes and Reithmeier, Biochim. Biophys. Acta 1818 (2012), 2687-2706). 이러한 포터 시스템을 통해 수송된 용질에는 양이온, 유기 음이온, 무기 음이온, 뉴클레오사이드, 아미노산, 폴리올, 인산화된 해당 중간체, 오스몰라이트 (osmolites), 사이드로포어 (siderophores)를 포함하지만 이에 한정되지 않는다.
막 단백질이 무기 피로포스페이트, ATP 또는 다른 뉴클레오사이드 트리포스페이트의 디포스페이트 결합을 가수분해하여 용질 또는 용질들의 활성 흡수 및/또는 압출을 유도하는 경우 이는 P-P-결합 가수분해-유도 수송체의 부류에 포함된다 (Saier et al., Nucleic Acids Res. 44 (2016) D372-D379). 상기 막 단백질은 일시적으로 인산화될 수 있거나 또는 인산화되지 않을 수 있지만, 상기 기질은 인산화되지 않는다. P-P-결합 가수분해-유도 수송체 부류를 통해 수송되는 기질은 양이온, 중금속, 베타-글루칸, UDP-글루코스, 리포폴리사카라이드, 테이코산을 포함하지만 이에 한정되지 않는다.
상기 β-배럴 포린 막 단백질은 통상 막을 가로질러 용질의 에너지 비의존적 통과를 가능하게 하는 막횡단 포어 (transmembrane pores)를 형성한다. 이들 단백질의 막횡단 부분은 β-배럴을 형성하는 β-가닥으로만 구성된다 (Saier et al., Nucleic Acids Res. 44 (2016) D372-D379). 이러한 포린-타입 단백질은 그람-음성 박테리아, 미토콘드리아, 플라스티드 (plastids), 및 가능하게는 항-산 그람-양성 박테리아 (acid-fast Gram-positive bacteria)의 외막에서 발견된다. 이러한 β-배럴 포린 막 단백질을 통해 수송되는 용질에는 뉴클레오사이드, 라피노스, 글루코스, 베타-글루코사이드, 올리고사카라이드를 포함하지만 이에 한정되지 않는다.
상기 보조 수송 단백질은 하나 이상의 생물학적 막을 가로질러 수송을 촉진하지만, 수송에 직접 참여하지 않는 단백질로 정의된다. 이들 막 단백질은 항상 외막 인자 (outer membrane factor: OMF), 폴리사카라이드 (PST) 포터, ATP-결합 카세트 (ABC)-타입 수송체와 같은 하나 이상의 확립된 수송 시스템과 함께 기능한다. 이들은 수송에 커플링된 에너지와 연결된 기능을 제공하고, 복합체 형성에서 구조적 역할을 하며, 생물학적 또는 안정성 기능 또는 조절 기능을 제공할 수 있다 (Saier et al., Nucleic Acids Res. 44 (2016) D372-D379). 보조 수송 단백질의 예는 폴리사카라이드 수송에 관여하는 폴리사카라이드 코폴리머라제 패밀리, 박테리오신 및 화학적 독소 수송에 관여하는 막 융합 단백질 패밀리를 포함하지만 이에 한정되지 않는다.
추정 수송 단백질은 구성원의 수송 기능이 확립되는 경우 분류되거나, 또는 제안된 수송 기능이 입증되지 않는 경우 Transporter Classification 시스템으로부터 제거될 패밀리를 포함한다. 이러한 패밀리에는 수송 기능이 제시된 구성원 또는 구성원들을 포함하지만, 그러한 기능에 대한 증거는 아직 설득력이 없다 (Saier et al., Nucleic Acids Res. 44 (2016) D372-D379). 2019년 6월 17일자로 공개된 TCDB 시스템에 따라 이 그룹으로 분류된 추정 수송체의 예는 구리 수송체를 포함하지만 이에 한정되지 않는다.
상기 포스포트란스퍼-유도 그룹 전위인자는 또한 박테리아 포스포에놀피루베이트:당 포스포트란스퍼라제 시스템 (PTS)의 PEP-의존성 포스포릴 전달-유도 그룹 전위인자로 알려져 있다. 세포외 당으로부터 유래된 반응의 산물은 세포질 당-포스페이트이다. 당 인산화를 촉매하는 효소 성분은 밀접하게 커플링된 과정 중 수송 과정에 중첩된다. 상기 PTS 시스템은 조절 및 주화성, 생물막 형성 및 발병기전을 포함하는 많은 다양한 양상에 관여한다 (Lengeler, J. Mol. Microbiol. Biotechnol. 25 (2015) 79-93; Saier, J. Mol. Microbiol. Biotechnol. 25 (2015) 73-78). 2019년 6월 17일자로 공개된 TCDB 시스템에 따라 포스포트란스퍼-유도 그룹 전위인자내에 분류된 막 단백질 패밀리에는 글루코스-글루코사이드, 프럭토스-만니톨, 락토스-N,N'-디아세틸키토바이오스-베타-글루코사이드, 글루시톨, 갈락티톨, 만노스-프럭토스-소르보스 및 아스코르베이트의 수송과 연결된 PTS 시스템을 포함한다.
당업자는 Pfam 32.0 (2018.09 공개), CDD v3.17 (2019.04.03 공개), eggnoddb 1.0.2 (2017.11.03 공개), InterPro 75.0 (2019.07.04 공개) 및 TCDB (2019.06.17 공개)를 포함하는 본원에서 사용된 데이터베이스의 경우, 각 데이터베이스의 내용은 각 공개 시에 확정되고, 변경되지 않았다. 특정 데이터베이스의 내용이 변경되는 경우, 이러한 특정 데이터베이스는 새로운 공개 날짜의 새로운 공개 버젼을 받았다. 해당 공개 날짜 및 이러한 특정 공개 날짜에 주석이 달린 특정 콘텐츠가 있는 각 데이터베이스에 대한 모든 공개 버젼이 이용 가능하고, 당업자에게 알려져 있다.
용어 "수송 가능"은 세포질 막 및/또는 세포벽을 통한 용질의 수송 활성을 도입하는 것을 의미한다. 상기 수송은 본 발명에 기재된 수송체 단백질의 발현을 도입 및/또는 증가시킴으로써 가능해질 수 있다. 용어 "수송 향상"은 세포질 막 및/또는 세포벽을 통한 용질의 수송 활성을 개선하는 것을 의미한다. 상기 수송은 본 발명에 기재된 수송 단백질의 발현을 도입 및/또는 증가시킴으로써 향상될 수 있다. 수송체 단백질의 "발현"은 상기 유전자가 내인성 유전자인 경우 상기 수송체 단백질을 코딩하는 유전자의 "과발현" 또는 상기 수송체 단백질을 코딩하는 유전자가 아생형 균주에는 존재하지 않는 이종성 유전자인 경우 "발현"으로 정의된다.
혼성화
본원에서 정의된 용어 "혼성화"는 실질적으로 상동인 상보적 뉴클레오티드 서열들이 서로 어닐링되는 과정이다. 상기 혼성화 과정은 용액에서 전체적으로 일어날 수 있고, 즉 두 상보적 핵산이 모두 용액 중에 있다. 상기 혼성화 과정은 또한 자기 비드, 세파로스 비드 또는 임의의 다른 수지와 같은 매트릭스에 고정된 상보적 핵산들 중 하나를 사용하여 일어날 수 있다. 상기 혼성화 과정은 또한 니트로-셀룰로스 또는 나일론 막과 같은 고체 지지체에 고정되거나 또는 예를 들어 포토리소그래피에 의해 예를 들어 규산질 유리 지지체 (후자는 핵산 어레이 또는 마이크로어레이 또는 핵산 칩으로 알려짐)에 고정된 상보적 핵산들 중 하나를 사용하여 일어날 수 있다. 혼성화가 일어나도록 하기 위해, 상기 핵산 분자는 일반적으로 열적으로 또는 화학적으로 변성되어 이중 가닥을 2개의 단일 가닥으로 용융시키고/시키거나 단일 가닥 핵산으로부터 헤어핀 또는 다른 2차 구조를 제거한다. 용어 "엄격성"은 혼성화가 일어나는 조건을 의미한다. 혼성화의 엄격성은 온도, 염 농도, 이온 강도 및 혼성화 버퍼 조성과 같은 조건에 의해 영향을 받는다. 일반적으로, 낮은 엄격성 조건은 정의된 이온 강도 및 pH에서 특정 서열에 대한 열 용융점 (Tm)보다 약 30℃ 낮게 선택된다. 중간 엄격성 조건은 온도가 Tm보다 20℃ 낮은 경우이고, 높은 엄격성 조건은 온도가 Tm보다 10℃ 낮은 경우이다. 높은 엄격성 혼성화 조건은 표적 핵산 서열과 높은 서열 유사성을 갖는 혼성화 서열을 단리하기 위해 전형적으로 사용된다. 그러나, 핵산은 유전자 코드의 축퇴성으로 인해, 서열이 다를 수 있고, 여전히 실질적으로 동일한 폴리펩티드를 코딩할 수 있다. 그러므로, 이러한 핵산 분자를 식별하기 위해 중간 엄격성 혼성화 조건이 때때로 필요할 수 있다.
상기 Tm은 표적 서열의 50%가 완벽하게 일치하는 프로브에 혼성화되는, 정의된 이온 강도 및 pH 하의 온도이다. 상기 Tm은 용액 상태, 및 염기 조성 및 프로브의 길이에 따라 달라진다. 예를 들어, 더 긴 서열은 특히 더 높은 온도에서 혼성화된다. 혼성화의 최대 속도는 Tm보다 약 16℃ 내지 최대 32℃ 낮게 수득된다. 상기 혼성화 용액 중에 1가 양이온이 존재하면 2개의 핵산 가닥들 사이의 정전기적 반발이 감소하고, 이에 의해 혼성체 형성을 촉진하며; 이러한 효과는 최대 0.4M의 나트륨 농도에서 볼 수 있다 (더 높은 농도의 경우, 이 효과를 무시할 수 있다). 포름아미드는 각 % 포름아미드에 대해 0.6 내지 0.7℃로 DNA-DNA 및 DNA-RNA 듀플렉스의 용융 온도를 낮추고, 50% 포름아미드를 부가하면 혼성화 속도가 더 낮아지더라도, 혼성화가 30 내지 45℃에서 수행될 수 있다. 염기쌍 미스매치 (mismatches)는 듀플렉스의 혼성화 속도 및 열 안정성을 감소시킨다. 평균 및 큰 프로브의 경우, Tm은 염기 미스매치 %당 약 1℃ 감소한다. 상기 Tm은 혼성체의 타입에 따라, 하기 식을 사용하여 계산할 수 있다:
1) DNA-DNA 혼성체 (Meinkoth and Wahl, Anal. Biochem., 138: 267-284, 1984):
Tm= 81.5℃ + 16.6x(log10[Na+]a) + 0.41x (% [G+Cb] - 500x[Lc]-1 - 0.61x (% 포름아미드)
2) DNA-RNA 또는 RNA-RNA 혼성체:
Tm= 79.8℃+ 18.5x(log10[Na+]a) + 0.58x(% [G+Cb]) + 11.8x(% [G+Cb])2 - 820x[Lc]-1
3) 올리고-DNA 또는 올리고-RNAd 혼성체:
< 20개의 뉴클레오티드의 경우: Tm = 2/n
20 - 35개의 뉴클레오티드의 경우: Tm = 22 + 1.46/n
여기에서:
a: 또는 다른 1가 양이온의 경우, 0.01-0.4 M 범위에서만 정확하다.
b: 30% 내지 75% 범위의 % GC에 대해서만 정확하다.
c: L = 염기쌍에서의 듀플렉스 길이,
d: 올리고, 올리고뉴클레오티드,
n: 프라이머의 유효 길이 = 2x(G+C의 수)+(A+T의 수).
비-특이적 결합은 가령 예를 들어, 상기 막의 단백질 함유 용액으로의 차단, 이종 RNA, DNA 및 SDS의 혼성화 버퍼로의 부가, 및 Rnase로의 처리와 같은 다수의 알려진 기술들 중 어느 하나의 기술을 사용하여 제어될 수 있다. 비-상동성 프로브의 경우, 계열 혼성화는 (i) 어닐링 온도의 점진적 저하 (예: 68℃에서 42℃로) 또는 (ii) 포름아미드 농도의 점진적 저하 (예: 50%에서 0%로) 중 하나를 가변시킴으로써 수행될 수 있다. 당업자는 혼성화 중에 변경될 수 있고, 엄격성 조건을 유지하거나 또는 변경할 다양한 파라미터를 알고 있다.
혼성화 조건 외에도, 혼성화의 특이성은 또한 전형적으로 혼성화 후 세척의 기능에 따라 달라진다. 비-특이적 혼성화로 인한 배경을 제거하기 위해, 샘플을 묽은 염 용액으로 세척하였다. 이러한 세척의 중요한 요인에는 최종 세척 용액의 이온 강도 및 온도를 포함하며; 염 농도를 낮추고 세척 온도를 높이면, 세척의 엄격성이 높아진다. 세척 조건은 전형적으로 혼성화 엄격성에서 또는 그 이하에서 수행된다. 양성 혼성화는 배경 신호의 적어도 2배인 신호를 제공한다. 일반적으로, 핵산 혼성화 분석 또는 유전자 증폭 검출 절차에 적합한 엄격성 조건은 상기 제시된 바와 같다. 다소의 엄격성 조건이 또한 선택될 수 있다. 당업자는 세척 중에 변경될 수 있고, 엄격성 조건을 유지하거나 또는 변경하는 다양한 파라미터를 알고 있다.
예를 들어, 50개 초과의 뉴클레오티드의 DNA 혼성체에 대한 전형적으로 높은 엄격성 혼성화 조건은 1x SSC에서 65℃ 또는 1x SSC 및 50% 포름아미드에서 42℃에서 혼성화한 다음에, 0.3x SSC에서 65℃에서 세척하는 것을 포함한다. 50개 초과의 뉴클레오티드의 DNA 혼성체에 대한 중간 엄격성 혼성화 조건의 예로는 4x SSC에서 50℃ 또는 6x SSC 및 50% 포름아미드에서 40℃에서 혼성화한 다음에, 2x SSC에서 50℃에서 세척하는 것을 포함한다. 혼성체의 길이는 혼성화 핵산의 예상 길이이다. 알려진 서열의 핵산이 혼성화되는 경우, 혼성체 길이는 서열들을 정렬하고, 본원에 기재된 보존 영역을 확인함으로써 결정될 수 있다. 1x SSC는 0.15M NaCl 및 15mM 시트르산 나트륨이고; 상기 혼성화 용액 및 세척 용액은 5x Denhardt 시약, 0.5-1.0% SDS, 100 μg/ml 변성, 단편화된 연어 정자 DNA, 0.5% 소듐 피로포스페이트를 추가로 포함할 수 있다.
엄격성의 수준을 정의하기 위해, Sambrook et al. (2001) Molecular Cloning: a laboratory manual, 3rd Edition, Cold Spring Harbor Laboratory Press, CSH, New York or to Current Protocols in Molecular Biology, John Wiley and Sons, N.Y. (1989 and yearly updates)를 참조할 수 있다.
용어 "엄격한 조건"은 프로브가 이의 표적 서브서열에 혼성화되지만 다른 서열에는 혼성화되지 않는 조건을 지칭한다. 엄격한 조건은 서열-의존성이고, 상황에 따라 다를 것이다. 더 긴 서열은 더 높은 온도에서 특이적으로 혼성화된다. 일반적으로, 엄격한 조건은 정의된 이온 강도 및 pH에서 특정 서열에 대한 열 용융점 (Tm)보다 약 15℃ 낮게 선택된다. 상기 Tm은 표적 서열에 상보적인 프로브의 50%가 평형에서 표적 서열에 혼성화되는 온도 (정의된 이온 강도, pH 및 핵산 농도 하에)이다. 예시되는 엄격한 혼성화 조건은 하기와 같을 수 있다: 50% 포름아미드, 5xSSC, 및 1% SDS, 42℃에서 인큐베이션, 또는 5x SSC, 1% SDS, 65℃에서 인큐베이션, 0.2x SSC 및 0.1% SDS 65℃에서 세척.
용어 "정제된"은 생물학적 분자의 활성을 방해하는 성분이 실질적으로 또는 본질적으로 유리된 물질을 지칭한다. 세포, 사카라이드, 핵산 및 폴리펩티드의 경우, 용어 "정제된"은 이의 자연 상태에서 발견되는 물질에 통상 동반되는 성분이 실질적으로 또는 본질적으로 유리된 물질을 지칭한다. 전형적으로, 본 발명의 정제된 사카라이드, 올리고사카라이드, 단백질 또는 핵산은 은 염색된 겔에서 밴드 세기 또는 다른 순도 결정 방법에 의해 측정하여, 적어도 약 50%, 55%, 60%, 65%, 70%, 75%, 80% 또는 85% 순수하고, 통상적으로 적어도 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 순수하다. 순도 (purity) 또는 균질성 (homogeneity)은 당해 분야에 잘 알려진 여러 수단, 예컨대 단백질 또는 핵산 샘플의 폴리아크릴아미드 겔 전기 영동에 이어 염색에 의한 시각화로 표시될 수 있다. 소정의 목적을 위해, 고해상도가 필요하고, HPLC 또는 유사한 정제 수단이 사용된다. 올리고사카라이드, 예를 들어 3-푸코실락토스의 경우, 순도는 이에 한정되는 것은 아니지만, 박막 크로마토그래피, 기체 크로마토그래피, NMR, HPLC, 모세관 전기영동 또는 질량 분광법과 같은 방법을 사용하여 결정될 수 있다.
2개 이상의 핵산 또는 폴리펩티드 서열과 관련하여 용어 "동일한" 또는 "동일성" 퍼센트 또는 "동일성" %는 서열 비교 알고리즘을 사용하거나 또는 육안 검사로 측정하여, 2개 이상의 서열들 또는 서브서열들이 비교되고 최대 일치를 위해 정렬되는 경우, 동일하거나, 또는 동일한 아미노산 잔기 또는 뉴클레오티드의 특정 퍼센트를 갖는 것을 지칭한다. 서열 비교를 위해, 하나의 서열은 테스트 서열이 비교되는 참조 서열로 작용한다. 서열 비교 알고리즘을 사용하는 경우, 테스트 및 참조 서열을 컴퓨터에 입력하고, 필요에 따라 서브서열 좌표를 지정하고, 서열 알고리즘 프로그램 파라미터가 지정된다. 그 다음에 서열 비교 알고리즘은 지정된 프로그램 파라미터에 기반하여, 참조 서열에 대한 테스트 서열(들)에 대한 서열 동일성 퍼센트를 계산한다. 동일성 퍼센트는 BLAST 및 PSI-BLAST를 사용하여 결정될 수 있다 (Altschul et al., 1990, J Mol Biol 215:3, 403- 410; Altschul et al., 1997, Nucleic Acids Res 25: 17, 3389-402). 본 발명의 목적을 위해, 동일성 퍼센트는 MatGAT2.01을 사용하여 결정된다 (Campanella et al., 2003, BMC Bioinformatics 4:29). 단백질에 대한 하기 디폴트 파라미터가 사용된다: (1) Gap cost Existence: 12 및 Extension: 2; (2) 사용된 Matrix는 BLOSUM50임.
용어 "조절 서열"은 폴리뉴클레오티드 서열의 폴리펩티드로의 전사 및 번역을 허용하는 숙주 세포 전사 및 번역 시스템에 의해 인식되는 서열을 지칭한다. 따라서 이러한 DNA 서열은 특정 숙주 세포 또는 유기체에서 작동 가능하게 연결된 코딩 서열의 발현에 필요하다. 이러한 조절 서열은 프로모터 서열, 리보솜 결합 서열, Shine Dalgarno 서열, Kozak 서열, 전사 종결인자 서열일 수 있지만, 이에 한정되지 않는다. 예를 들어, 원핵생물에 적합한 조절 서열은 프로모터, 선택적으로 작동인자 서열 및 리보솜 결합 부위를 포함한다. 진핵 세포는 프로모터, 폴리아데닐화 신호 및 인핸서를 이용하는 것으로 알려져 있다. 프리서열 (presequence) 또는 분비 리더 (secretory leader)에 대한 DNA는 폴리펩티드의 분비에 관여하는 전단백질 (preprotein)로 발현되는 경우 폴리펩티드에 대한 DNA에 작동 가능하게 연결될 수 있다; 프로모터 또는 인핸서가 서열의 전사에 영향을 미치는 경우 이는 코딩 서열에 작동 가능하게 연결되거나; 또는 리보솜 결합 부위가 서열의 전사에 영향을 미치는 경우 이는 코딩 서열에 작동 가능하게 연결되거나; 또는 리보솜 결합 부위가 번역을 촉진하기 위해 위치되는 경우 이는 코딩 서열에 작동 가능하게 연결된다. 상기 제어 서열은 추가로 상기 폴리뉴클레오티드의 폴리펩티드로의 전사 또는 번역을 유도 또는 억제하는 유전자 회로 (genetic circuit)를 통해 또는 유도성 프로모터 (inducible promoter)를 통해 외부 화학물질, 예컨대 이에 한정되는 것은 아니지만, IPTG, 아라비노스, 락토스, 알로락토스, 람노스 또는 푸코스로 제어될 수 있다.
일반적으로, "작동 가능하게 연결된"은 연결되는 DNA 서열들이 연속적이며 분비 리더의 경우 연속적이며 판독 단계에 있음을 의미한다. 그러나 인핸서는 연속적일 필요는 없다.
본원에서 사용된, 용어 "세포 생산성 지수 (cell productivity index: CPI)"는 배양물에서 생성된 재조합 세포의 질량으로 재조합 세포에 의해 생성된 생성물의 질량을 나눈 것을 지칭한다.
발명의 상세한 설명
제1 구체예에서, 본 발명은 유전자 변형 세포에 의해 푸코실락토스를 제조하는 방법을 제공한다. 상기 방법은 하기 단계를 포함한다:
- 푸코실락토스를 생성할 수 있는 세포를 제공하는 단계로서, 상기 세포는 푸코실락토스 합성에 관여하는 효소를 코딩하는 핵산 서열을 적어도 1개 포함하고, 더 구체적으로 상기 세포는 구아노신-디포스페이트 푸코스 (GDP-푸코스) 공여체로부터의 푸코스 잔기를 락토스 수용체에 전달하여 푸코실락토스를 합성하는 푸코실트란스퍼라제를 코딩하는 핵산 서열을 적어도 1개 포함하며,
- 상기 세포는 i) 내인성 막 단백질, 더 구체적으로 푸코실락토스 수송에 관여하는 내인성 막 단백질, 더욱 구체적으로 푸코실락토스 수송을 가능하게 하고/하거나 이를 향상시키는 내인성 막 단백질의 변형된 발현, 및/또는 ii) 이종 막 단백질, 더 구체적으로 푸코실락토스 수송에 관여하는 이종 막 단백질, 더욱 구체적으로 푸코실락토스 수송을 가능하게 하고/하거나 이를 향상시키는 이종 막 단백질의 발현을 추가로 포함하고, 상기 막 단백질은 i) 2019년 7월 4일자로 공개된 InterPro 75.0에 정의되는, interpro 번호 IPR001503 및 IPR002516을 각각 사용하여 GT10 및 GT11 푸코실트란스퍼라제 패밀리의 게놈 인근 (genome neighborhood)을 검색하여 발견된 PFAM 도메인들 중 어느 하나의 도메인을 포함하는 막 단백질들의 그룹으로부터 선택되고, 여기서 상기 게놈 인근 윈도우 크기 (genomic neighbourhood window size)는 각 푸코실트란스퍼라제 앞에 14개의 유전자 및 뒤에 14개의 유전자이고, 상기 막 단백질은 SET 패밀리에 속하지 않으며, 또는 ii) 서열번호: 204, 206, 208, 210, 212, 214, 216, 218을 포함하는 막 단백질, 또는 서열번호: 204, 206, 208, 210, 212, 214, 216, 218을 포함하는 막 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 204, 206, 208, 210, 212, 214, 216, 218을 갖는 상기 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 서열의 그룹으로부터 선택되는 것인 단계, 및 상기 세포를 배지에서 원하는 푸코실락토스의 생성을 허용하는 조건 하에 배양하는 단계. 바람직하게는 상기 푸코실락토스는 본원에서 설명된 바와 같이 배양으로부터 분리된다.
본 발명의 바람직한 일 구체예에서, 상기 숙주 세포는 하기 그룹으로부터 선택되는 막 단백질을 포함한다:
a) 포터;
b) P-P-결합-가수분해-유도 수송체;
c) β-배럴 포린;
d) 보조 수송 단백질;
e) 추정 수송 단백질; 및
f) 포스포트란스퍼-유도 그룹 전위인자.
다른 구체예는 하기 단계를 포함하는, 유전자 변형 세포에 의해 푸코실락토스를 제조하는 방법을 제공한다:
- 푸코실락토스를 생성할 수 있는 세포를 제공하는 단계로서, 상기 세포는 푸코실락토스 합성에 관여하는 효소, 더 구체적으로 GDP-푸코스 공여체로부터의 푸코스 잔기를 락토스 수용체에 전달하여 푸코실락토스를 합성하는 푸코실트란스퍼라제를 코딩하는 핵산 서열을 적어도 1개 포함하고,
- 상기 세포는 i) 푸코실락토스 수송에 관여하고, 더 구체적으로 푸코실락토스 수송을 가능하게 하고/하거나 이를 향상시키는 내인성 막 단백질의 변형된 발현, 및/또는 ii) 푸코실락토스 수송에 관여하고, 더 구체적으로 푸코실락토스 수송을 가능하게 하고/하거나 이를 향상시키는 이종 막 단백질의 발현을 추가로 포함하고, 상기 막 단백질은
a) SET를 제외한 포터;
b) P-P-결합-가수분해-유도 수송체;
c) β-배럴 포린;
d) 보조 수송 단백질;
e) 추정 수송 단백질; 및
f) 포스포트란스퍼-유도 그룹 전위인자의 그룹으로부터 선택되는 단계;
- 상기 세포를 배지에서 원하는 푸코실락토스의 생성을 허용하는 조건 하에 배양하는 단계. 바람직하게는 상기 생성된 푸코실락토스는 본원에서 설명된 바와 같이 배양으로부터 분리된다.
본원에 기재된 본 발명의 방법에서, 상기 막 단백질은 변형된 발현을 갖는 내인성 단백질로, 바람직하게는 과발현되는 내인성 단백질이거나; 또는 상기 막 단백질은 세포에 의해 이종 발현될 수 있는 이종 단백질이다. 그 다음에, 상기 이종 발현된 막 단백질이 도입되어 발현될 것이며, 바람직하게는 과발현될 것이다. 다른 구체예에서, 상기 내인성 단백질은 이종 막 단백질을 또한 발현하는 세포에서 변형된 발현을 가질 수 있다.
본원에서 사용되는 숙주 세포는 바람직하게는 푸코실락토스 생성을 위해 유전자 변형된다. 추가의 바람직한 구체예에서, 본원에서 사용된 세포는 락토스 또는 중간체를 푸코실락토스로 변형시킬 수 있는 재조합 푸코실트란스퍼라제를 포함한다.
본원에서 사용된 숙주 세포는 푸코실락토스 생성을 위해 선택적으로 유전자 변형되며, 상기 숙주 세포는 GDP-푸코스의 데 노보 (de novo) 합성을 발현하도록 변형된다. 상기 GDP-푸코스의 데 노보 합성은 만노스-6-포스페이트 이소머라제, 포스포만노뮤타제 코딩 유전자, 만노스-1-포스페이트 구아노실트란스퍼라제, GDP-만노스-4,6-데하이드라타제 및 GDP-L-푸코스 신타제 효소에 의해 촉매된다. 바람직하게는, 상기 숙주 세포는 GDP-푸코스의 데 노보 합성의 효소를 코딩하는 하나 이상의 유전자를 발현하도록 추가로 변형된다.
본원에서 사용된 숙주 세포는 락토스 퍼미아제의 도입 및/또는 과발현에 의해, 세포에서 락토스를 내수송하도록 선택적으로 유전자 변형된다. 상기 락토스 퍼미아제는 예를 들어 lacY 유전자 또는 lac12 유전자에 의해 코딩된다.
본 발명의 추가 양상에 따르면, 상기 막 단백질을 코딩하는 폴리뉴클레오티드는 각 세포 또는 발현 시스템의 코돈 사용에 적응된다.
상기 구체예의 바람직한 일 양상에서, 상기 포터는 TCDB 클래스 2.A.1.1, 2.A.1.12, 2.A.1.15, 2.A.1.2, 2.A.1.3, 2.A.1.36, 2.A.1.38, 2.A.1.46, 2.A.1.68, 2.A.1.7, 2.A.1.81, 2.A.123, 2.A.2, 2.A.21, 2.A.58, 2.A.6.3, 2.A.66 및 2.A.7.1의 그룹으로부터 선택되고; 상기 P-P-결합-가수분해-유도 수송체는 TCDB 클래스 3.A.1.1, 3.A.1.2, 3.A.1.10, 3.A.1.11 및 3.A.1.5의 그룹으로부터 선택되며; 상기 β-배럴 포린은 TCDB 클래스 1.B.18 및 1.B.3.1로부터 선택되고; 상기 보조 수송 단백질은 TCDB 클래스 8.A.3으로부터 선택되며; 상기 추정 수송 단백질은 TCDB 클래스 9.B.14 및 9.B.158의 그룹으로부터 선택되거나; 또는 포스포트란스퍼-유도 그룹 전위인자는 TCDB 클래스 4.A.1.1 및 4.A.4.1의 그룹으로부터 선택된다. 상기 TCDB 클래스는 2019년 6월 17일자로 공개된 TCDB.org에 정의되는 바와 같이 분류된다.
상기 구체예의 다른 바람직한 양상에서, 상기 포터는 eggnog 패밀리 (eggnog families) 05BZS, 05C0R, 05C2C, 05CT4, 05CXP, 05CZQ, 05D94, 05DXI, 05E5M, 05E5W, 05E8G, 05EAM, 05EDR, 05EGZ, 05F9N, 05JHE, 05PSV, 05W2Y, 05W3H, 05XJ5, 070Q9, 07CWC, 07QF7, 07QNK, 07RBJ, 07RJ1, 07T5E, 07VQ3, 0814C, 088QT, 08H15, 08N8A, 08SC4, 08Z4Q의 그룹으로부터 선택되고; 상기 P-P-결합-가수분해-유도 수송체는 eggnog 패밀리 05BZ1, 05CJ1, 05DMK, 05DFW, 05EY8, 05HAC, 05MFV, 07FKK, 07R5U, 07V1T, 08IJ9, 08JQ7, 172T7의 그룹으로부터 선택되며; 상기 β-배럴 포린은 eggnog 패밀리 05DAY, 08KDD의 그룹으로부터 선택되고; 상기 보조 수송 단백질은 eggnog 패밀리 07SYR의 그룹으로부터 선택되며; 추정 수송 단백질은 eggnog 패밀리 05CRE, 05GWF, 06N3A의 그룹으로부터 선택되거나; 또는 포스포트란스퍼-유도 그룹 전위인자 단백질은 eggnog 패밀리 05CI1, 05VI0의 그룹으로부터 선택된다. 상기 eggnog 패밀리는 2017년 11월 3일자로 공개된 eggnogdb 1.0.2에 정의되는 바와 같이 분류된다.
상기 구체예의 다른 바람직한 양상에서, 상기 포터는 PFAM 목록 PF00083, PF00474, PF00873, PF00893, PF01895, PF01943, PF02690, PF03083, PF04193, PF05977, PF07690, PF07690, PF13347, PF13440, PF14667로부터 선택되고; 상기 P-P-결합-가수분해-유도 수송체는 PFAM 목록 PF00005, PF00532, PF00664, PF01061, PF08352, PF14524, PF13407, PF13416, PF17912로부터 선택되며; 상기 β-배럴 포린은 PFAM 목록 PF02264, PF02563, PF10531, PF18412로부터 선택되고; 상기 보조 수송 단백질은 PFAM 목록 PF13807, PF02706으로부터 선택되며; 상기 추정 수송 단백질은 PFAM 목록 PF01578, PF03932, PF05140, PF11045로부터 선택되고, 및/또는 상기 포스포트란스퍼-유도 그룹 전위인자 단백질은 PFAM 목록 PF00367, PF00358, PF02378, PF03829로부터 선택된다. 상기 PFAM 목록은 2018년 9월에 공개된 Pfam 32.0에 정의되는 바와 같이 분류된다.
상기 구체예의 다른 바람직한 양상에서, 상기 포터는 interpro 목록 IPR000390, IPR001036, IPR001411, IPR001734, IPR001927, IPR002797, IPR003663, IPR003841, IPR004316, IPR004633, IPR004638, IPR004734, IPR004812, IPR005275, IPR005828, IPR005829, IPR006603, IPR010290, IPR011701, IPR020846, IPR023008, IPR023721, IPR023722, IPR026022, IPR027417, IPR027463, IPR029303, IPR032896, IPR036259, IPR038078, IPR038377, IPR039672로부터 선택되고; 상기 P-P-결합-가수분해-유도 수송체는 interpro 목록 IPR000412, IPR001734, IPR001761, IPR003439, IPR003593, IPR005829, IPR005978, IPR005981, IPR006059, IPR006060, IPR006061, IPR008995, IPR011527, IPR011701, IPR013456, IPR013525, IPR013563, IPR015851, IPR015855, IPR017871, IPR019554, IPR020846, IPR025997, IPR026266, IPR027417, IPR028082, IPR029439, IPR033893, IPR036259, IPR036640, IPR038377, IPR039421, IPR040582로부터 선택되며; 상기 β-배럴 포린은 interpro 목록 IPR003192, IPR003715, IPR019554, IPR023738, IPR036998, IPR040716으로부터 선택되고; 상기 보조 수송 단백질은 interpro 목록 IPR003856, IPR020846, IPR027417, IPR032807, IPR036259로부터 선택되고; 상기 추정 수송 단백질은 interpro 목록 IPR002541, IPR003439, IPR003593, IPR004316, IPR005627, IPR006603, IPR007816, IPR017871, IPR020368, IPR020846, IPR023648, IPR027417, IPR036259, IPR036822로부터 선택되거나; 또는 상기 포스포트란스퍼-유도 그룹 전위인자 단백질은 interpro 목록 IPR001127, IPR001996, IPR003352, IPR004716, IPR010974, IPR011055, IPR013013, IPR018113, IPR018454, IPR036665, IPR036878로부터 선택된다. 상기 interpro 목록은 2019년 7월 4일자로 공개된 InterPro 75.0에 정의되는 바와 같이 분류된다.
본 발명의 바람직한 일 양상에서, 본원에 기재된 방법은 하기로부터 선택되는 포터 막 단백질 발현 숙주 세포를 사용한다: 서열번호: 02의 대장균 (Escherichia coli) K12 MG1655 유래의 MdfA, 서열번호: 06의 대장균 K12 MG1655 유래의 IceT, 서열번호: 40의 B. 론검 아종 인판티스 (B. longum subsp. Infantis) (균주 ATCC 15697) 유래의 Blon_2331, 서열번호: 42의 B. 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2332, 서열번호: 58의 키티노파가 종 (Chitinophaga sp.) CF118, 서열번호: 66의 프레보텔라 루미니콜라 (Prevotella ruminicola) (AR32), 서열번호: 64의 락토코커스 라피노락티스 (Lactococcus raffinolactis) (ATCC 43920), 또는 서열번호: 62의 디아도박터 솔리 (Dyadobacter soli) DSM 25329의 wzx-유사 단백질, 또는 상기 포터 막 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 02, 06, 40, 42, 58, 66, 64 또는 62 각각의 상기 MdfA, IceT, Blon_2331, Blon_2332 막 단백질 또는 wzx-유사 막 단백질 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 서열. 다른 바람직한 양상에서, 본원에 기재된 방법은 하기로부터 선택된 P-P-결합-가수분해 유도 수송체 막 단백질 발현 숙주 세포를 사용한다: 서열번호: 28의 락토코커스 락티스 (Lactococcus lactis) SRCM103457 유래의 lmrA, 서열번호: 70 및 74의 스포로무사 스파에로이데스 (Sporomusa sphaeroides) DSM 2875, 또는 서열번호: 68 및 72의 플라보박테리움 스파르탄시이 (Flavobacterium spartansii) 유래의 LpsE 막 단백질, 서열번호: 76의 칸디다투스 플란크토필라 설포니카 (Candidatus Planktophila sulfonica) 유래의 TolC, 서열번호: 82의 페도박터 긴센기솔리 (Pedobacter ginsengisoli), 서열번호: 84의 베루코미크로비아 박테리움 (Verrucomicrobia bacterium) CG1_02_43_26 유래의 MsbA, 서열번호: 206의 대장균 K-12 MG1655 유래의 malE, 서열번호: 208의 대장균 K-12 MG1655 유래의 malK, 서열번호: 214의 대장균 K-12 MG1655 유래의 araF, 서열번호: 216의 대장균 K-12 MG1655 유래의 xylF, 또는 서열번호: 218의 대장균 K-12 MG1655 유래의 ytfQ, 또는 상기 P-P-결합-가수분해 유도 수송체 막 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 28, 70, 74, 68, 72, 76, 82, 84, 206, 208, 214, 216 또는 218 각각의 상기 lmrA, LpsE, TolC, MsbA, malE, malK, araF, xylF 또는 ytfQ 막 단백질 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 서열.
또 다른 바람직한 양상에서, 본원에 기재된 방법은 하기로부터 선택된 β-배럴 포린 발현 숙주 세포를 사용한다: 서열번호: 34의 대장균 K12 MG1655 유래의 Wza 또는 서열번호: 204의 대장균 K-12 MG1655 유래의 lamB, 또는 이의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 34 또는 204 각각의 상기 Wza 또는 lamB 막 단백질에 대해 적어도 80%의 서열 동일성을 갖는 서열.
대안의 바람직한 일 양상에서, 본원에 기재된 방법은 하기로부터 선택되는 보조 수송 단백질 발현 숙주 세포를 사용한다: 서열번호: 88의 서모토가 마리티마 (Thermotoga maritima) (균주 ATCC 43589 / MSB8 / DSM 3109 / JCM 10099) 유래의 Wzc, 또는 이의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 88의 상기 Wzc 막 단백질에 대해 적어도 80%의 서열 동일성을 갖는 서열.
다른 대안의 바람직한 양상에서, 본원에 기재된 방법은 하기로부터 선택되는 추정 수송 단백질 발현 숙주 세포를 사용한다: 서열번호: 90의 클로스트리디움 종 (Clostridium sp.) CAG: 1013, 서열번호: 92의 오도리박터 스플란크니쿠스 (Odoribacter splanchnicus) DSM 20712, 서열번호: 94의 미추아리아 종 (Mitsuaria sp.) PDC51 또는 서열번호: 96의 프레보텔라 인테르메디아 (Prevotella intermedia) ATCC 25611 (DSM 20706) 유래의 CutC, 또는 상기 CutC 막 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 90, 92, 94 또는 96 각각의 상기 CutC 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 서열.
다른 대안의 바람직한 양상에서, 본원에 기재된 방법은 하기로부터 선택되는 포스포트란스퍼-유도 그룹 전위인자 발현 숙주 세포를 사용한다: 서열번호: 210의 대장균 K-12 MG1655 유래의 nagE 또는 서열번호: 212의 대장균 K-12 MG1655 유래의 srlB, 또는 이의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 210 또는 212 각각의 상기 nagE 또는 srlB 막 단백질에 대해 적어도 80%의 서열 동일성을 갖는 서열.
추가 대안의 바람직한 양상에서, 본원에 기재된 방법은 하기를 발현하는 숙주 세포를 사용한다: 포터 막 단백질인 서열번호: 02의 대장균 K12 MG1655 유래의 MdfA, 서열번호: 06의 대장균 K12 MG1655 유래의 IceT, 서열번호: 04의 대장균 K12 MG1655 유래의 YnfM, 서열번호: 08의 대장균 K12 MG1655 유래의 Yhhs, 서열번호: 10의 대장균 K12 MG1655 유래의 EmrD, 서열번호: 12의 대장균 K12 MG1655 유래의 YdhC, 서열번호: 14의 대장균 K12 MG1655 유래의 YbdA, 서열번호: 16의 대장균 K12 MG1655 유래의 YdeE, 서열번호: 18의 대장균 K12 MG1655 유래의 MhpT, 서열번호: 20의 대장균 K12 MG1655 유래의 YebQ, 서열번호: 22의 대장균 K12 MG1655 유래의 YjhB, 서열번호: 24의 대장균 K12 MG1655 유래의 Bcr, 서열번호: 26의 대장균 K12 MG1655 유래의 FucP, 서열번호: 32의 대장균 K12 MG1655 유래의 WzxE, 서열번호: 38의 대장균 K12 MG1655 유래의 EmrE, 서열번호: 40의 비피도박테리움 론검 아종 인판티스 (Bifidobacterium longum subsp. Infantis) (균주 ATCC 15697) 유래의 Blon_2331, 서열번호: 42의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2332, 서열번호: 46의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0247, 서열번호: 48의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0245, 서열번호: 50의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0345, 서열번호: 52의 뉴로스포라 크라사 (Neurospora crassa) OR74A 유래의 CDT2, 서열번호: 54의 아스페르길루스 오리제 (Aspergillus oryzae) RIB40 유래의 CDT2, 서열번호: 58의 키티노파가 종 CF118 유래의 Wzx, 서열번호: 60의 유박테리움 종 (Eubacterium sp.) CAG:581 유래의 Wzx, 서열번호: 62의 디아도박터 솔리 (DSM 25329) 유래의 Wzx, 서열번호: 64의 락토코커스 라피노락티스 (ATCC 43920) 유래의 Wzx, 서열번호: 66의 프레보텔라 루미니콜라 (AR32) 유래의 Wzx, 서열번호: 86의 브라키스피라 함프소니이 (Brachyspira hampsonii) P280/1 유래의 NAPO, 서열번호: 98의 악티노바쿨룸 수이스 (Actinobaculum suis) (DSM 20639) 유래의 NAm, 서열번호: 100의 루미노코커스 그나부스 (Ruminococcus gnavus) 유래의 NAm, 서열번호: 102의 쿠르토박테리움 종 (Curtobacterium sp.) 314Chir4.1 유래의 NAm, 서열번호: 104의 니아벨라 드릴라시스 (Niabella drilacis) (DSM25811) 유래의 Nap, 서열번호: 106의 사카리크리니스 퍼멘탄스 (Saccharicrinis fermentans) (DSM 9555) 유래의 Nap, 서열번호: 108의 시트로박터 프레운디이 (Citrobacter freundii) MGH152 유래의 mdtD, 서열번호: 110의 시트로박터 웨르크마니이 (Citrobacter werkmanii) NBRC 105721 유래의 mdtD, 서열번호: 112의 시트로박터 아말로나티쿠스 (Citrobacter amalonaticus) 유래의 mdtD, 서열번호: 114의 클레브시엘라 옥시토카 (Klebsiella oxytoca) 유래의 mdtD, 서열번호: 116의 에스케리치아 알베르티이 (Escherichia albertii) B156 유래의 mdtD, 서열번호: 118의 살모넬라 엔테리카 아종 살라메 (Salmonella enterica subsp. Salamae) 유래의 yegB, 서열번호: 120의 클레브시엘라 뉴모니에 (Klebsiella pneumoniae) 30684/NJST258_2 유래의 mdtD, 서열번호: 122의 클레브시엘라 뉴모니에 유래의 Tcr_1_D38215, 서열번호: 124의 슈도시트로박터 페칼리스 (Pseudocitrobacter faecalis) 유래의 mdtD, 서열번호: 126의 요케넬라 레겐스버게이 (Yokenella regensburgei) (ATCC43003) 유래의 Cmr, 서열번호: 128의 크로노박터 무이트젠시이 (Cronobacter muytjensii) 유래의 MdfA, 서열번호: 130의 클레브시엘라 옥시토카 유래의 MdfA, 서열번호: 132의 시트로박터 코세리 (Citrobacter koseri) 유래의 MFS, 서열번호: 134의 에스케리치아 마르모테 (Escherichia marmotae) 유래의 MdfA, 서열번호: 136의 시겔라 플렉스네리 (Shigella flexneri) 유래의 Cmr, 서열번호: 138의 살모넬라 엔테리카 아종 살라메 유래의 MdfA, 서열번호: 140의 시트로박터 윤게 (Citrobacter youngae) (ATCC 29220) 유래의 Cmr, 서열번호: 142의 시트로박터 프레운디이 유래의 MdfA, 서열번호: 144의 엔테로박터 코베이 (Enterobacter kobei) 유래의 MdfA, 서열번호: 146의 엔테로박터 종 (Enterobacter sp.) 유래의 MdfA, 서열번호: 148의 렐리오티아 종 (Lelliottia sp.) WB101 유래의 MdfA, 서열번호: 150의 엔테로박터 루드위기이 (Enterobacter ludwigii) EcWSU1 유래의 MdfA, 서열번호: 152의 악티노플라네스 우타헨시스 (Actinoplanes utahensis) 유래의 Sweet-유사 단백질, 서열번호: 154의 키티노파가세에 박테리움 (Chitinophagaceae bacterium) PMG_246 유래의 Sweet-유사 단백질, 서열번호: 156의 리조비움 종 (Rhizobium sp.) PDC82 유래의 Sweet-유사 단백질, 서열번호: 158의 키네오코커스 리조스파에레 (Kineococcus rhizosphaerae) (DSM 19711) 유래의 Sweet-유사 단백질, 서열번호: 160의 모르가넬라 모르가니이 (Morganella morganii) IS15 유래의 Sweet-유사 단백질, 서열번호: 162의 게오데르마토필루스 오브스쿠러스 (Geodermatophilus obscurus) (균주 ATCC 25078) 유래의 Sweet-유사 단백질, 서열번호: 164의 브라디리조비움 종 (Bradyrhizobium sp.) BTAi1 유래의 Sweet-유사 단백질, 서열번호: 166의 브라디리조비움 자포니쿰 (Bradyrhizobium japonicum) USDA 110 유래의 Sweet-유사 단백질, 서열번호: 168의 크산토모나스 캄페스트리스 pv. 베시카토리아 균주 (Xanthomonas campestris pv. vesicatoria str.) 85-10 유래의 Sweet-유사 단백질, 서열번호: 170의 헤르바스피릴룸 아쿠아티쿰 (Herbaspirillum aquaticum) 유래의 Sweet-유사 단백질, 서열번호: 172의 플라보박테리아 박테리움 (Flavobacteria bacterium) MS024-2A 유래의 Sweet-유사 단백질, 서열번호: 182의 시노리조비움 메디케 (Sinorhizobium medicae) WSM419 유래의 rnd-유사 단백질, 서열번호: 184의 아조스피릴룸 브라실리엔세 (Azospirillum brasiliense) LMG 04375 유래의 아라비노스 유출물 (arabinose efflux), 또는 상기 포터 막 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 02, 06, 04, 08, 10, 12, 14, 16, 18, 20, 22, 24, 26, 32, 38, 40, 42, 46, 48, 50, 52, 54, 58, 60, 62, 64, 66, 86, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164, 166, 168, 170, 172, 182 또는 184 각각의 상기 MdfA, IceT, YnfM, Yhhs, EmrD, YdhC, YbdA, YdeE, MhpT, YebQ, YjhB, Bcr, FucP, WzxE, EmrE, Wzx, Blon_2331, Blon_2232, Blon_0247, Blon_0245, Blon_0345, NAPO, NAm, Nap, mdtD, YegB, Tcr_1_D38215, cmr, MFS, CDT2, rnd, Sweet-유사 또는 아라비노스 유출물 막 단백질 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질; P-P-결합-가수분해-유도 수송체인 서열번호: 28의 락토코커스 락티스 균주 SRCM103457 유래의 LmrA, 서열번호: 30의 대장균 균주 K12 MG1655 유래의 OppF, 서열번호: 36의 헬리코박터 필로리 (Helicobacter pylori) (균주 ATCC 700392 / 26695) 유래의 Wzk, 서열번호: 44의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2475, 서열번호: 68 또는 72의 플라보박테리움 스파르탄시이 유래의 LpsE, 서열번호: 70 또는 74의 스포로무사 스파에로이데스 DSM 2875 유래의 LpsE, 서열번호: 76의 칸디다투스 플란크토필라 설포니카 유래의 TolC, 서열번호: 78의 부티리비브리오 훈가테이 (Butyrivibrio hungatei) XBD2006 유래의 TolC, 서열번호: 80의 로세부리아 인테스티날리스 (Roseburia intestinalis) CAG:13 유래의 MsbA, 서열번호: 82의 페도박터 긴센기솔리 유래의 MsbA, 서열번호: 84의 베루코미크로비아 박테리움 CG1_02_43_26 유래의 MsbA, 서열번호: 174의 리조비움 종 Root149 유래의 Wzm, 서열번호: 176의 아조스피릴룸 브라실리엔세 LMG 04375 유래의 Wzm, 서열번호: 196의 대장균 113303 유래의 Wzm, 서열번호: 178의 리조비움 종 Root149 유래의 Wzt, 서열번호: 180의 아조스피릴룸 브라실리엔세 LMG 04375 유래의 Wzt, 서열번호: 194의 대장균 113303 유래의 Wzt, 서열번호: 188 또는 190의 브라디리조비움 자포니쿰 USDA 110 유래의 Nodj, 서열번호: 206의 대장균 K-12 MG1655 유래의 malE, 서열번호: 208의 대장균 K-12 MG1655 유래의 malK, 서열번호: 214의 대장균 K-12 MG1655 유래의 araF, 서열번호: 216의 대장균 K-12 MG1655 유래의 xylF, 또는 서열번호: 218의 대장균 K-12 MG1655 유래의 ytfQ, 또는 상기 P-P-결합-가수분해-유도 수송체 막 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 28, 30, 36, 44, 68, 72, 70, 74, 76, 78, 80, 82, 84, 174, 176, 196, 178, 180, 194, 188, 190, 206, 208, 214, 216 또는 218 각각의 상기 LmrA, OppF, Wzk, Blon_2475, LpsE, TolC, MsbA, Wzm, Wzt 또는 Nodj 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질; 추정 수송 단백질인 서열번호: 56의 헬리코박터 필로리 유래의 사이토크롬 C 생합성 단백질, 서열번호: 90의 클로스트리디움 종 CAG: 1013 유래의 CutC, 서열번호: 92의 오도리박터 스플란크니쿠스 DSM 20712 유래의 CutC, 서열번호: 94의 미추아리아 종 PDC51 유래의 CutC, 서열번호: 96의 프레보텔라 인테르메디아 ATCC 25611 (DSM 20706) 유래의 CutC, 서열번호: 190의 대장균 K12 MG1655 유래의 ybjM, 서열번호: 192의 엔테로박테리아세에 박테리움 (Enterobacteriaceae bacterium) ENNIH1 유래의 ybjM, 또는 상기 추정 수송 단백질들 중 어느 하나를 코딩하는 폴리뉴클레이티드의 기능성 상동체 또는 기능성 단편; 또는 서열번호: 56, 90, 92, 94, 96, 190 또는 192 각각의 상기 CytC, CutC 또는 ybjM 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질.
본원에서 사용된 바와 같이, 열거된 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질은 상기 서열이 각 막 단백질의 아미노산 서열의 전장에 대해 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.5%, 99.6%, 99.7%, 99.8%, 99.9%의 서열 동일성을 갖는 것으로 이해된다.
이러한 막 단백질의 아미노산 서열은 첨부된 서열목록의 서열번호: 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164, 166, 168, 170, 172, 174, 176, 178, 180, 182, 184, 186, 188, 190, 192, 194, 196, 204, 206, 208, 210, 212, 214, 216 또는 218로부터 선택되는 서열일 수 있고, 또는 서열번호: 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164, 166, 168, 170, 172, 174, 176, 178, 180, 182, 184, 186, 188, 190, 192, 194, 196, 204, 206, 208, 210, 212, 214, 216 또는 218 중 어느 하나의 전장의 아미노산 서열에 대해 적어도 80%의 서열 동일성, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.5%의 서열 동일성을 갖는 아미노산 서열일 수 있다.
본 발명의 추가 양상에서, 본원에 기재된 방법은 세포벽의 외막을 가로질러 화합물의 수송에 관여하는 수송체 단백질인 막 단백질 발현 숙주 세포를 사용한다.
추가의 바람직한 일 양상에서, 본원에 기재된 푸코실락토스의 제조 방법은 하기 단계들 중 적어도 하나를 추가로 포함하고:
i) 상기 배양 배지에, 초기 반응기 부피 1 리터 (litre)당 락토스를 적어도 50, 더 바람직하게는 적어도 75, 더 바람직하게는 적어도 100, 더 바람직하게는 적어도 120, 더 바람직하게는 적어도 150 그람 (gram)을 포함하는 락토스 공급물을, 바람직하게는 연속 방식 (continuous manner)으로, 바람직하게는 상기 배양 배지의 최종 부피가 상기 락토스 공급물의 부가 전 배양 배지 부피의 3배 이하, 바람직하게는 2배 이하, 더 바람직하게는 2배 미만이 되도록 부가하는 단계로서, 여기서 전체 반응기 부피는 250 mL (밀리리터) 내지 10.000 m3 (입방 미터)의 범위인 것이 단계;
ii) 락토스 공급물을 연속 방식으로 상기 배양 배지에 1일, 2일, 3일, 4일, 5일에 걸쳐 공급 용액에 의해 부가하는 단계;
iii) 락토스 공급물을 연속 방식으로 배양 배지에 1일, 2일, 3일, 4일, 5일에 걸쳐 공급 용액에 의해 부가하는 단계로서, 상기 락토스 공급 용액의 농도는 50 g/L, 바람직하게는 75 g/L, 더 바람직하게는 100 g/L, 더 바람직하게는 125 g/L, 더 바람직하게는 150 g/L, 더 바람직하게는 175 g/L, 더 바람직하게는 200 g/L, 더 바람직하게는 225 g/L, 더 바람직하게는 250 g/L, 더 바람직하게는 275 g/L, 더 바람직하게는 300 g/L, 더 바람직하게는 325 g/L, 더 바람직하게는 350 g/L, 더 바람직하게는 375 g/L, 더 바람직하게는 400 g/L, 더 바람직하게는 450 g/L, 더 바람직하게는 500 g/L, 더욱 바람직하게는 550 g/L, 가장 바람직하게는 600 g/L이며; 바람직하게는 상기 용액의 pH는 3 내지 7로 설정되고, 바람직하게는 상기 공급 용액의 온도는 20℃ 내지 80℃로 유지되는 것인 단계;
상기 방법으로 상기 배양 배지의 최종 부피 중에 적어도 50 g/L, 바람직하게는 적어도 75 g/L, 더 바람직하게는 적어도 90 g/L, 더 바람직하게는 적어도 100 g/L, 더 바람직하게는 적어도 125 g/L, 더 바람직하게는 적어도 150 g/L, 더 바람직하게는 적어도 175 g/L, 더 바람직하게는 적어도 200 g/L의 푸코실락토스 농도가 수득된다.
바람직하게는 상기 락토스 공급은 배양 초기부터 락토스를 적어도 5 mM의 농도, 바람직하게는 30, 40, 50, 60, 70, 80, 90, 100, 150 mM의 농도, 더 바람직하게는 > 300 mM의 농도로 부가함으로써 달성된다.
다른 양상에서, 상기 락토스 공급은 배양의 생산 단계 전체에 걸쳐 적어도 5 mM, 바람직하게는 10 mM 또는 30 mM의 락토스 농도가 수득되도록 하는 농도로 락토스를 상기 배양 배지에 부가함으로써 달성된다.
본원에 기재된 방법의 추가 일 구체예에서, 상기 숙주 세포는 적어도 약 60, 80, 100, 또는 약 120시간 동안, 또는 연속 방식으로 배양된다.
본원에 기재된 방법의 다른 구체예에서, 탄소 및 에너지 공급원, 바람직하게는 수크로스, 글루코스, 프럭토스, 글리세롤, 말토스, 말토덱스트린, 트레할로스, 폴리올, 전분, 숙시네이트, 말레이트, 피루베이트, 락테이트, 에탄올, 시트레이트 및/또는 락토스가 또한 부가되고, 바람직하게는 연속적으로, 바람직하게는 락토스와 함께 상기 배양 배지에 부가된다.
바람직한 일 구체예에서, 탄소계 기질, 바람직하게는 수크로스가 배양 배지에서 3일 이상, 바람직하게는 최대 7일 동안 제공되고; 및/또는 상기 배양 배지의 최종 부피가 배양 전 배양 배지 부피의 3배 이하, 유리하게는 2배 이하, 더욱 유리하게는 2배 미만이 되도록, 배양 배지에 연속 방식으로 초기 배양 부피 1 리터당 수크로스가 적어도 100, 유리하게는 적어도 105, 더 유리하게는 적어도 110, 더욱 유리하게는 적어도 120 g 제공된다.
바람직하게는, 본원에 기재된 방법을 수행하는 경우, 탄소계 기질, 바람직하게는 글루코스 또는 수크로스를 상기 배양 배지에 부가함으로써 제1 지수적 세포 성장 단계가 제공되고, 그 후에 제2 단계에서 락토스가 상기 배양 배지에 부가된다.
대안의 바람직한 구체예에서, 본원에 기재된 방법에서, 상기 락토스는 탄소계 기질과 함께 제1 지수적 성장 단계에서 이미 부가된다.
다른 구체예에서, 본원에 기재된 방법은 2'-푸코실락토스, 3-푸코실락토스 및 디푸코실락토스로 구성된 그룹 중 푸코실락토스만을 단독으로 생성한다.
대안의 구체예에서, 본원에 기재된 방법은 푸코실락토스의 혼합물을 생성한다.
이러한 혼합물은 2'-푸코실락토스, 3-푸코실락토스 및 디푸코실락토스로 구성된 그룹 중 적어도 2개를 포함할 수 있다.
본원에 기재된 방법에서, 상기 유전자 변형 세포는 미생물, 식물 또는 동물 세포로 구성된 그룹으로부터 선택되고, 바람직하게는 상기 미생물은 박테리아, 진균 또는 효모이며, 바람직하게는 상기 식물은 벼, 목화, 유채, 대두, 옥수수 (maize) 또는 옥수수 식물 (corn plant)이고, 바람직하게는 상기 동물은 곤충, 어류, 조류 또는 비-인간 포유동물이고, 모두 본원에 기재된 바와 같다.
특정 예시되는 구체예에서, 본 발명의 방법은 푸코실락토스를 고수율로 제조하는 방법을 제공한다. 상기 방법은 락토스를 함유하는 수성 배양 또는 발효 배지에서, 유전자 변형 세포, 바람직하게는 대장균, 더 바람직하게는 유전자 lacZ, lacY lacA, glgC, agp, pfkA, pfkB, pgi, arcA, iclR, wcaJ, lon 및 thyA를 녹아웃 (knock out)시킴으로써 변형된 대장균 세포를 배양하거나 또는 발효시키는 단계를 포함한다. 더욱 바람직하게는, 추가로 대장균 lacY 유전자, 지모모나스 모빌리스 (Zymomonas mobilis) 유래의 프럭토스 키나제 유전자 (frk) 및 비피도박테리움 아돌레센티스 (Bifidobacterium adolescentis) 유래의 수크로스 포스포릴라제 (SP)가 게놈 내로 녹인 (knock in)될 수 있고, 항시적으로 발현될 수 있다. 상기 항시성 프로모터는 De Mey 등에 의해 기재된 프로모터 라이브러리로부터 기원한다 (BMC Biotechnology, 2007). 이러한 유전자 변형은 또한 WO2016075243 및 WO2012007481에 기재되어 있다. 추가로, 상기 변형된 대장균 세포는 단일 푸코실트란스퍼라제를 코딩하는 재조합 유전자를 가지며, 예시되는 구체예에서 이는 3-푸코실락토스 (3-FL)를 생성하기 위해 락토스를 변형시킬 수 있는, α-1,3-푸코실트란스퍼라제일 수 있다. 상기 세포는 또한 본원에 기재된 막 단백질들 중 어느 하나의 발현을 코딩하는 재조합 유전자를 포함한다.
본 발명의 다른 양상은 푸코실락토스 생성을 위해 유전자 변형된 숙주 세포를 제공하며, 상기 숙주 세포는 푸코실락토스 합성에 관여하는 효소, 더 구체적으로 GDP-푸코스 공여체로부터의 푸코스 잔기를 락토스 수용체에 전달하여 푸코실락토스를 합성하는 푸코실트란스퍼라제를 코딩하는 핵산 서열을 적어도 1개 포함하고, 상기 세포는 i) 푸코실락토스 수송에 관여하는, 더 구체적으로 푸코실락토스 수송을 가능하게 하고/하거나 이를 향상시킬 수 있는 내인성 막 단백질의 변형된 발현, 및/또는 ii) 푸코실락토스 수송에 관여하는, 더 구체적으로 푸코실락토스 수송을 가능하게 하고/하거나 이를 향상시킬 수 있는 이종 막 단백질의 발현을 추가로 포함한다. 상기 막 단백질은 i) 2019년 7월 4일자로 공개된 InterPro 75.0에 정의되는, interpro 번호 IPR001503 및 IPR002516을 각각 사용하여 GT10 및 GT11 푸코실트란스퍼라제 패밀리의 게놈 인근을 검색하여 발견된 PFAM 도메인들 중 어느 하나를 포함하는 막 단백질들의 그룹으로부터 선택되며, 여기서 상기 게놈 인근 윈도우 크기는 각 푸코실트란스퍼라제 앞에 14개의 유전자 및 뒤에 14개의 유전자이고, 상기 막 단백질은 SET 패밀리에 속하지 않으며, 또는 ii) 서열번호: 204, 206, 208, 210, 212, 214, 216, 218을 포함하는 막 단백질들, 또는 서열번호: 204, 206, 208, 210, 212, 214, 216, 218을 포함하는 막 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 204, 206, 208, 210, 212, 214, 216, 218의 상기 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 서열의 그룹으로부터 선택된다.
대안으로서 또는 바람직하게는, 상기 막 단백질은 하기 그룹으로부터 선택된다:
a) SET를 제외한 포터;
b) P-P-결합-가수분해-유도 수송체;
c) β-배럴 포린;
d) 보조 수송 단백질;
e) 추정 수송 단백질; 및
f) 포스포트란스퍼-유도 그룹 전위인자.
대안으로서 또는 바람직하게는, 상기 막 단백질은 하기 그룹으로부터 선택된다: i) 포터 막 단백질인 서열번호: 02의 대장균 K12 MG1655 유래의 MdfA, 서열번호: 06의 대장균 K12 MG1655 유래의 IceT, 서열번호: 04의 대장균 K12 MG1655 유래의 YnfM, 서열번호: 08의 대장균 K12 MG1655 유래의 Yhhs, 서열번호: 10의 대장균 K12 MG1655 유래의 EmrD, 서열번호: 12의 대장균 K12 MG1655 유래의 YdhC, 서열번호: 14의 대장균 K12 MG1655 유래의 YbdA, 서열번호: 16의 대장균 K12 MG1655 유래의 YdeE, 서열번호: 18의 대장균 K12 MG1655 유래의 MhpT, 서열번호: 20의 대장균 K12 MG1655 유래의 YebQ, 서열번호: 22의 대장균 K12 MG1655 유래의 YjhB, 서열번호: 24의 대장균 K12 MG1655 유래의 Bcr, 서열번호: 26의 대장균 K12 MG1655 유래의 FucP, 서열번호: 32의 대장균 K12 MG1655 유래의 WzxE, 서열번호: 38의 대장균 K12 MG1655 유래의 EmrE, 서열번호: 40의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2331, 서열번호: 42의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2332, 서열번호: 46의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0247, 서열번호: 48의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0245, 서열번호: 50의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0345, 서열번호: 52의 뉴로스포라 크라사 OR74A 유래의 CDT2, 서열번호: 54의 아스페르길루스 오리제 RIB40 유래의 CDT2, 서열번호: 58의 키티노파가 종 CF118 유래의 Wzx, 서열번호: 60의 유박테리움 종 CAG:581 유래의 Wzx, 서열번호: 62의 디아도박터 솔리 (DSM 25329) 유래의 Wzx, 서열번호: 64의 락토코커스 라피노락티스 (ATCC 43920) 유래의 Wzx, 서열번호: 66의 프레보텔라 루미니콜라 (AR32) 유래의 Wzx, 서열번호: 86의 브라키스피라 함프소니이 P280/1 유래의 NAPO, 서열번호: 98의 악티노바쿨룸 수이스 (DSM 20639) 유래의 NAm, 서열번호: 100의 루미노코커스 그나부스 유래의 NAm, 서열번호: 102의 쿠르토박테리움 종 314Chir4.1 유래의 NAm, 서열번호: 104의 니아벨라 드릴라시스 (DSM25811) 유래의 Nap, 서열번호: 106의 사카리크리니스 퍼멘탄스 (DSM 9555) 유래의 Nap, 서열번호: 108의 시트로박터 프레운디이 MGH152 유래의 mdtD, 서열번호: 110의 시트로박터 웨르크마니이 NBRC 105721 유래의 mdtD, 서열번호: 112의 시트로박터 아말로나티쿠스 유래의 mdtD, 서열번호: 114의 클레브시엘라 옥시토카 유래의 mdtD, 서열번호: 116의 에스케리치아 알베르티이 B156 유래의 mdtD, 서열번호: 118의 살모넬라 엔테리카 아종 살라메 유래의 yegB, 서열번호: 120의 클레브시엘라 뉴모니에 30684/NJST258_2 유래의 mdtD, 서열번호: 122의 클레브시엘라 뉴모니에 유래의 Tcr_1_D38215, 서열번호: 124의 슈도시트로박터 페칼리스 유래의 mdtD, 서열번호: 126의 요케넬라 레겐스버게이 (ATCC43003) 유래의 Cmr, 서열번호: 128의 크로노박터 무이트젠시이 유래의 MdfA, 서열번호: 130의 클레브시엘라 옥시토카 유래의 MdfA, 서열번호: 132의 시트로박터 코세리 유래의 MFS, 서열번호: 134의 에스케리치아 마르모테 유래의 MdfA, 서열번호: 136의 시겔라 플렉스네리 유래의 Cmr, 서열번호: 138의 살모넬라 엔테리카 아종 살라메 유래의 MdfA, 서열번호: 140의 시트로박터 윤게 (ATCC 29220) 유래의 Cmr, 서열번호: 142의 시트로박터 프레운디이 유래의 MdfA, 서열번호: 144의 엔테로박터 코베이 유래의 MdfA, 서열번호: 146의 엔테로박터 종 유래의 MdfA, 서열번호: 148의 렐리오티아 종 WB101 유래의 MdfA, 서열번호: 150의 엔테로박터 루드위기이 EcWSU1 유래의 MdfA, 서열번호: 152의 악티노플라네스 우타헨시스 유래의 Sweet-유사 단백질, 서열번호: 154의 키티노파가세에 박테리움 PMG_246 유래의 Sweet-유사 단백질, 서열번호: 156의 리조비움 종 PDC82 유래의 Sweet-유사 단백질, 서열번호: 158의 키네오코커스 리조스파에레 (DSM 19711) 유래의 Sweet-유사 단백질, 서열번호: 160의 모르가넬라 모르가니이 IS15 유래의 Sweet-유사 단백질, 서열번호: 162의 게오데르마토필루스 오브스쿠러스 (균주 ATCC 25078) 유래의 Sweet-유사 단백질, 서열번호: 164의 브라디리조비움 종 BTAi1 유래의 Sweet-유사 단백질, 서열번호: 166의 브라디리조비움 자포니쿰 USDA 110 유래의 Sweet-유사 단백질, 서열번호: 168의 크산토모나스 캄페스트리스 pv. 베시카토리아 균주 85-10 유래의 Sweet-유사 단백질, 서열번호: 170의 헤르바스피릴룸 아쿠아티쿰 유래의 Sweet-유사 단백질, 서열번호: 172의 플라보박테리아 박테리움 MS024-2A 유래의 Sweet-유사 단백질, 서열번호: 182의 시노리조비움 메디케 WSM419 유래의 rnd-유사 단백질, 서열번호: 184의 아조스피릴룸 브라실리엔세 LMG 04375 유래의 아라비노스 유출물, 또는 상기 포터 막 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 02, 06, 04, 08, 10, 12, 14, 16, 18, 20, 22, 24, 26, 32, 38, 40, 42, 46, 48, 50, 52, 54, 58, 60, 62, 64, 66, 86, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164, 166, 168, 170, 172, 182 또는 184 각각의 상기 MdfA, IceT, YnfM, Yhhs, EmrD, YdhC, YbdA, YdeE, MhpT, YebQ, YjhB, Bcr, FucP, WzxE, EmrE, Wzx, Blon_2331, Blon_2232, Blon_0247, Blon_0245, Blon_0345, NAPO, NAm, Nap, mdtD, YegB, Tcr_1_D38215, cmr, MFS, CDT2, rnd, Sweet-유사 또는 아라비노스 유출물 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질; ii) P-P-결합-가수분해-유도 수송체인 서열번호: 28의 락토코커스 락티스 균주 SRCM103457 유래의 LmrA, 서열번호: 30의 대장균 균주 K12 MG1655 유래의 OppF, 서열번호: 36의 헬리코박터 필로리 (균주 ATCC 700392 / 26695) 유래의 Wzk, 서열번호: 44의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2475, 서열번호: 68 또는 72의 플라보박테리움 스파르탄시이 유래의 LpsE, 서열번호: 70 또는 74의 스포로무사 스파에로이데스 DSM 2875 유래의 LpsE, 서열번호: 76의 칸디다투스 플란크토필라 설포니카 유래의 TolC, 서열번호: 78의 부티리비브리오 훈가테이 XBD2006 유래의 TolC, 서열번호: 80의 로세부리아 인테스티날리스 CAG:13 유래의 MsbA, 서열번호: 82의 페도박터 긴센기솔리 유래의 MsbA, 서열번호: 84의 베루코미크로비아 박테리움 CG1_02_43_26 유래의 MsbA, 서열번호: 174의 리조비움 종 Root149 유래의 Wzm, 서열번호: 176의 아조스피릴룸 브라실리엔세 LMG 04375 유래의 Wzm, 서열번호: 196의 대장균 113303 유래의 Wzm, 서열번호: 178의 리조비움 종 Root149 유래의 Wzt, 서열번호: 180의 아조스피릴룸 브라실리엔세 LMG 04375 유래의 Wzt, 서열번호: 194의 대장균 113303 유래의 Wzt, 서열번호: 186 또는 188의 브라디리조비움 자포니쿰 USDA 110 유래의 Nodj, 서열번호: 206의 대장균 K-12 MG1655 유래의 malE, 서열번호: 208의 대장균 K-12 MG1655 유래의 malK, 서열번호: 214의 대장균 K-12 MG1655 유래의 araF, 서열번호: 216의 대장균 K-12 MG1655 유래의 xylF, 또는 서열번호: 218의 대장균 K-12 MG1655 유래의 ytfQ, 또는 상기 P-P-결합-가수분해-유도 수송체 막 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 28, 30, 36, 44, 68, 72, 70, 74, 76, 78, 80, 82, 84, 174, 176, 196, 178, 180, 194, 188, 190, 206, 208, 214, 216 또는 218 각각의 상기 LmrA, OppF, Wzk, Blon_2475, LpsE, TolC, MsbA, Wzm, Wzt, Nodj, malE, malK, araF, xylF 또는 ytfQ 막 단백질들에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질; iii) 추정 수송 단백질인 서열번호: 56의 헬리코박터 필로리 유래의 사이토크롬 C 생합성 단백질, 서열번호: 90의 클로스트리디움 종 CAG: 1013 유래의 CutC, 서열번호: 92의 오도리박터 스플란크니쿠스 DSM 20712 유래의 CutC, 서열번호: 94의 미추아리아 종 PDC51 유래의 CutC, 서열번호: 96의 프레보텔라 인테르메디아 ATCC 25611 (DSM 20706) 유래의 CutC, 서열번호: 190의 대장균 K12 MG1655 유래의 ybjM, 서열번호: 192의 엔테로박테리아세에 박테리움 ENNIH1 유래의 ybjM, 또는 상기 추정 수송 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 56, 90, 92, 94, 96, 190 또는 192 각각의 상기 CytC, CutC 또는 ybjM 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질; iv) β-배럴 포린인 서열번호: 34의 대장균 K12 MG1655 유래의 Wza 또는 서열번호: 204의 대장균 K12 MG1655 유래의 lamB, 또는 이의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 34 또는 204 각각의 상기 Wza 또는 lamB 막 단백질에 대해 적어도 80%의 서열 동일성을 갖는 서열; v) 보조 수송 단백질인 서열번호: 88의 서모토가 마리티마 (균주 ATCC 43589 / MSB8 / DSM 3109 / JCM 10099) 유래의 Wzc, 또는 이의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 88의 상기 Wzc 막 단백질에 대해 적어도 80%의 서열 동일성을 갖는 서열; vi) 포스포트란스퍼-유도 그룹 전위인자인 서열번호: 210의 대장균 K12 MG1655 유래의 nagE 또는 서열번호: 212의 대장균 K12 MG1655 유래의 srlB, 또는 이의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 210 또는 212 각각의 상기 nagE 또는 srlB 막 단백질에 대해 적어도 80%의 서열 동일성을 갖는 서열.
본 발명의 추가 양상에서, 본원에 기재된 세포는 세포벽의 외막을 가로질러 화합물의 수송에 관여하는 수송체 단백질인 막 단백질을 발현한다.
다른 양상은 배지에서 안정적으로 배양되는 세포를 제공하며, 상기 배지는 최소 배지, 복합 배지, 또는 예를 들어 이에 한정되는 것은 아니지만 비타민, 미량 원소, 아미노산과 같은 소정의 화합물이 풍부한 성장 배지를 포함하는 임의의 타입의 성장 배지일 수 있다.
바람직하게는, 상기 세포는 락토스 수송체, 푸코스 수송체, 뉴클레오티드-활성화된 당에 대한 수송체로 구성된 그룹으로부터 선택된 단백질을 코딩하는 핵산 서열을 적어도 1개 포함하도록 형질전환된다.
본원에 기재된 방법에서, 상기 세포는 임의의 유기체의 세포일 수 있다. 본원에서 사용된 용어 '유기체' 또는 '세포'는 박테리아, 효모 또는 진균으로 구성된 목록으로부터 선택된 미생물을 지칭하거나, 또는 식물 세포, 동물 세포, 포유동물 세포, 곤충 세포 및 원생동물 세포를 지칭한다. 후자의 박테리아는 바람직하게는 프로테오박테리아 (Proteobacteria) 문 또는 피르미쿠테스 (Firmicutes) 문 또는 시아노박테리아 (Cyanobacteria) 문 또는 데이노코커스-서무스 (Deinococcus-Thermus) 문에 속한다. 프로테오박테리아 문에 속하는 후자의 박테리아는 엔테로박테리아세에 (Enterobacteriaceae) 과, 바람직하게는 대장균 종에 속한다. 상기 후자 박테리아는 바람직하게는 대장균 종 예컨대 이에 한정되는 것은 아니지만 대장균 B, 대장균 C, 대장균 W, 대장균 K12, 대장균 니슬 (Escherichia coli Nissle)에 속하는 임의의 균주에 관한 것이다. 더 구체적으로, 후자의 용어는 실험실 환경에 잘 적응하고, 야생형 균주와 달리 장에서 번성하는 능력을 상실한 배양된 대장균 균주, 예컨대 대장균 K12 균주에 관한 것이다. 대장균 K12 균주의 잘 알려진 예로는 K12 야생형, W3110, MG1655, M182, MC1000, MC1060, MC1061, MC4100, JM101, NZN111 및 AA200이다. 그러므로, 바람직하게는 본 발명은 구체적으로 상기에 나타낸 돌연변이 및/또는 형질전환된 대장균 균주에 관한 것으로서, 상기 대장균 균주가 K12 균주이다. 더 구체적으로, 본 발명은 상기에 나타낸 돌연변이 및/또는 형질전환된 대장균 균주에 관한 것으로서, 상기 K12 균주는 대장균 MG1655이다. 피르미쿠테스 문에 속하는 후자의 박테리아는 바실리 (Bacilli), 바람직하게는 바실러스 (Bacillus) 종에 속한다. 후자 효모는 바람직하게는 아스코마이코타 (Ascomycota) 문 또는 바시디오마이코타 (Basidiomycota) 문 또는 듀테로마이코타 (Deuteromycota) 문 또는 지고마이세테스 (Zygomycetes) 문에 속한다. 후자 효모는 바람직하게는 사카로마이세스 (Saccharomyces), 피치아 (Pichia), 한수넬라 (Hansunella), 클루이베로마이세스 (Kluyveromyces), 야로위아 (Yarrowia), 에레모테시움 (Eremothecium), 지고사카로마이세스 (Zygosaccharomyces) 또는 데바로마이세스 (Debaromyces) 속에 속한다. 후자 진균은 바람직하게는 리조푸스 (Rhizopus), 딕티오스텔리움 (Dictyostelium) 또는 아스페르길루스 (Aspergillus) 속에 속한다. "식물 세포"는 개화 (flowering) 및 비-개화 (non-flowering) 식물의 세포, 뿐만 아니라 조류 세포, 예를 들어 클라미도모나스 (Chlamydomonas), 클로렐라 등을 포함한다. 바람직하게는, 상기 식물 세포는 담배, 알팔파, 벼, 토마토, 옥수수 (corn), 옥수수 (maize) 또는 대두 세포이고; 상기 포유동물 세포는 CHO 세포 또는 HEK 세포이며; 상기 곤충 세포는 S. 프루기페르다 (S. frugiperda) 세포 및 상기 원생동물 세포는 L. 타렌톨레 (L. tarentolae) 세포이다.
바람직한 일 구체예에서, 상기 세포는 미생물의 세포이고, 더 바람직하게는 상기 미생물은 박테리아 또는 효모이다. 더 바람직한 일 구체예에서, 상기 미생물은 박테리아, 가장 바람직하게는 대장균이다. 이러한 대장균을 사용하는 예가 본원에 기재되어 있다.
다른 더 바람직한 구체예에서, 상기 박테리아는 효모이다. 푸코실락토스 생성을 위한 효모 및 본 발명에 사용할 수 있는 예는 예를 들어 Hollands et al. (Metabolic Engineering 52 (2019) 232-242)에 기재되어 있다.
일반적으로, 선택된 모노사카라이드, 디사카라이드 또는 올리고사카라이드에 대한 세포의 이화 경로 (catabolic pathway)는 푸코실락토스 합성에 관여하고/하거나 이의 합성에 필요한 적어도 부분적으로 불활성화된, 모노사카라이드, 디사카라이드 또는 올리고사카라이드인 것이 바람직하다.
추가 일 구체예에서, 본 발명은 푸코실락토스를 제조하는 방법을 제공하며, 상기 푸코실락토스의 생성을 허용하는 조건 하에 배지에서 배양하기 위해, 본원에 기재된 세포가 사용된다. 그 다음에, 상기 푸코실락토스는 배양으로부터 분리된다. 본원에서 사용되는, 생성에 허용되는 조건은 온도, pH, 압력, 삼투압 및 생성물/유리체 농도를 포함하지만 이에 한정되지 않는, 살아있는 세포 및 이의 성장을 가능하게 하는 물리적 또는 화학적 파라미터와 관련된 조건인 것으로 이해되어야 한다. 바람직하게는, 이러한 허용 조건은 30+/-20℃ 범위의 온도, 7+/-3 범위의 pH를 포함할 수 있다.
본 발명에 따른 세포는 푸코실락토스를 생성한다. 상기 푸코실락토스는 2'-푸코실락토스, 3-푸코실락토스 및 디푸코실락토스로 구성된 그룹으로부터 선택된다.
본 발명의 다른 양상은 푸코실락토스의 발효 생성에서 본원에 정의된 막 단백질들의 그룹으로부터 선택된 막 단백질의 용도를 제공한다. 상기 푸코실락토스는 2'-푸코실락토스, 3-푸코실락토스 및 디푸코실락토스로 구성된 그룹으로부터 선택된다.
추가 일 양상에서, 본 발명은 푸코실락토스의 제조 방법에서, 본원에 정의된 세포의 용도를 제공한다.
또 다른 양상에서, 본 발명은 상기 푸코실락토스가 2'-푸코실락토스, 3-푸코실락토스 및/또는 디푸코실락토스인, 본원에 정의된 세포의 용도를 제공한다.
또한, 본 발명은 또한 본 발명에 따른 방법에 의해 수득된 푸코실락토스, 뿐만 아니라 푸코실락토스의 제조를 위한 상기 기재된 폴리뉴클레오티드, 벡터, 숙주 세포, 미생물 또는 폴리펩티드의 용도에 관한 것이다. 상기 푸코실락토스는 유아식, 성인용 식품 또는 사료의 보충을 위한 식품 첨가제, 프리바이오틱 (prebiotic), 심바이오틱 (symbiotic)으로서, 또는 치료학적으로 또는 약학적으로 활성인 화합물로서 사용될 수 있다. 상기 새로운 방법을 사용하면, 복잡하고 시간과 비용이 많이 드는 합성 과정 없이, 푸코실락토스를 쉽고 효과적으로 제공할 수 있다.
본원에서 사용된 용어 "분리"는 본원에 설명된 바와 같이 숙주 세포 및/또는 이의 성장 배지로부터 푸코실락토스를 수확, 수집 또는 회수하는 것을 의미한다.
푸코실락토스는 혼합물이 만들어진, 배양 또는 수성 배양 배지로부터 통상적인 방식으로 분리될 수 있다. 상기 푸코실락토스가 푸코실락토스를 생성하는 세포에 여전히 존재하는 경우, 상기 세포로부터 푸코실락토스를 유리 또는 추출하는 통상적인 방법으로, 예컨대 높은 pH, 열 충격, 초음파 처리, 프렌치 프레스 (French press), 균질화, 효소적 가수분해, 화학적 가수분해, 용매 가수분해, 세제, 가수분해 등을 사용한 세포 파괴를 사용할 수 있다. 그 다음에 푸코실락토스 함유 혼합물 또는 배양물로 함께 및 개별적으로 불리는 배양 배지, 반응 혼합물 및/또는 세포 추출물이 푸코실락토스를 분리하는데 추가로 사용될 수 있다.
전형적으로 올리고사카라이드, 및 올리고사카라이드인 푸코실락토스는 먼저 거대 성분들, 즉 세포 및 세포 데브리스를 제거한 다음에 더 작은 성분들, 즉 단백질, 내독소 및 1000 Da 내지 1000 kDa의 기타 성분들을 제거한 다음에, 올리고사카라이드를 제1 단계에서 나노여과막 또는 전기투석으로, 및 제2 단계에서 이온 교환 크로마토그래피로도 알려진 이온 교환으로 유지함으로써 올리고사카라이드를 탈염하고, 이는 양이온 교환 수지 및 음이온 교환 수지로 구성되며, 여기서 가장 바람직하게는 양이온 교환 크로마토그래피는 음이온 교환 크로마토그래피 전에 수행된다. 이러한 단계는 중합도의 작은 차이로 당을 서로 분리하지 못한다. 상기 분리는 예를 들어 크로마토그래피 분리에 의해 수행된다.
이는 바람직하게는 푸코실락토스 함유 혼합물을 정화하여 현탁 입자 및 오염물, 특히 유전자 변형 세포를 배양하고 및/또는 효소 반응을 수행함으로써 생성된 세포, 세포 성분, 불용성 대사산물 및 데브리스를 제거하는 단계를 포함한다. 이러한 단계에서, 상기 푸코실락토스 함유 혼합물은 통상적인 방식으로 정화될 수 있다. 바람직하게는, 상기 푸코실락토스 함유 혼합물은 원심 분리, 응집, 경사 분리 및/또는 여과에 의해 정화된다. 상기 푸코실락토스 함유 혼합물로부터 푸코실락토스을 분리하는 제2 단계는 바람직하게는 정화되어진 후에, 실질적으로 모든 단백질뿐만 아니라 펩티드, 아미노산, RNA 및 DNA 및 후속 분리 단계를 방해할 수 있는 임의의 내독소 및 당지질을 상기 푸코실락토스 함유 혼합물로부터 제거하는 단계를 포함한다. 이러한 단계에서, 단백질 및 관련 불순물은 통상적인 방식으로 푸코실락토스 함유 혼합물로부터 제거될 수 있다. 바람직하게는, 단백질, 염, 부산물, 착색제 및 다른 관련 불순물이 한외여과, 나노여과, 역삼투, 미세여과, 활성탄 또는 탄소 처리, 고성능 접선 흐름 여과 (tangential flow high-performance filtration), 접선 흐름 한외여과 (tangential flow ultrafiltration), 친화도 크로마토그래피, 이온 교환 크로마토그래피 (예: 양이온 교환, 음이온 교환, 혼합층 이온 교환을 포함하지만, 이에 한정되지 않음), 소수성 상호작용 크로마토그래피 및/또는 겔 여과 (즉, 크기 배제 크로마토그래피), 특히 크로마토그래피, 더 구체적으로 이온 교환 크로마토그래피 또는 소수성 상호작용 크로마토그래피 또는 리간드 교환 크로마토그래피에 의해 푸코실락토스 함유 혼합물로부터 제거된다. 크기 배제 크로마토그래피를 제외하고, 단백질 및 관련 불순물은 크로마토그래피 매질 또는 선택된 멤브레인에 의해 유지되는 반면, 푸코실락토스는 푸코실락토스 함유 혼합물 중에 남아 있다.
분자량이 1000 Da (dalton) 이상인 오염 화합물은 컷-오프 (cut-off)가 1000 Da 이상 내지 약 1000 kDa인 한외여과막을 통해 제거된다. 상기 멤브레인에는 오염 물질이 유지되고, 올리고사카라이드는 여과액으로 이동한다. 전형적인 한외여과 원리는 당해 분야에 잘 알려져 있고, 관형 모듈 (Tubular modules), 중공 파이버 (Hollow fiber), 나선형으로 감긴 플레이트 또는 플레이트에 기반하며; 이들은 횡류 조건 (cross flow conditions)에서 또는 전량 여과 (dead-end filtration)에서 사용된다. 상기 멤브레인 조성은 잘 알려져 있고, 여러 공급업체로부터 입수 가능하고, PES (Polyethylene sulfone), 폴리비닐피롤리돈, PAN (Polyacrylonitrile), PA (Poly-amide), 폴리비닐리덴 디플루오라이드 (PVDF), NC (Nitrocellulose), 세라믹 재료 또는 이들의 조합으로 이루어진다.
올리고사카라이드보다 작은 성분, 예를 들어 모노사카라이드, 염, 디사카라이드, 산, 염기, 매질 성분은 나노여과 또는/및 전기투석을 통해 분리된다. 이러한 멤브레인은 100 Da 내지 1000 Da 사이의 분자량 컷오프를 갖는다. 올리고사카라이드 예컨대 2'-푸코실락토스의 경우, 최적의 컷오프는 300 Da 내지 500 Da이며, 여과액의 손실을 최소화한다. 전형적인 멤브레인 조성은 잘 알려져 있으며, 예를 들어 폴리아미드 (PA), TFC, PA-TFC, 폴리피페라진-아미드, PES, 셀룰로스 아세테이트 또는 이들의 조합이다.
푸코실락토스는 증발, 동결건조, 결정화, 침전 및/또는 건조, 분무 건조에 의한 추가 정제 단계를 포함하거나 또는 포함하지 않고, 배양 배지 및/또는 세포로부터 추가로 단리된다. 상기 추가 정제 단계는 다른 올리고사카라이드 및/또는 생성물과 조합된 푸코실락토스의 제제화를 가능하게 하지만, 예를 들어 분무-건조, 건조 또는 동결건조에 의한 공동-제제화 또는 액체 형태의 증발에 의한 농축에 제한되지 않는다.
추가의 양상에서, 본 발명은 또한 푸코실락토스의 추가 정제를 제공한다. 상기 푸코실락토스의 추가 정제는 예를 들어 (활성화된) 챠콜 또는 탄소, 나노여과, 한외여과 또는 이온교환을 사용하여 임의의 남아있는 DNA, 단백질, LPS, 내독소 또는 다른 불순물을 제거함으로써 수행될 수 있다. 에탄올과 같은 알코올 및 수성 알코올 혼합물이 또한 사용될 수 있다. 다른 정제 단계는 생성물의 결정화 또는 침전에 의해 수행된다. 다른 정제 단계는 푸코실락토스를 분무 건조 또는 동결 건조하는 것이다.
분리되고 바람직하게는 또한 정제된 푸코실락토스는 유아용 조제 분유의 보충제로서 사용될 수 있고, 신생아의 다양한 질병 치료에 사용될 수 있다.
본원의 실시예에서 개시되는 바와 같이, 본 발명의 방법 및 세포는 본원에 정의된 막 단백질을 사용하는 경우에, 동일한 유전자 배경을 갖지만 이종 막 단백질의 발현 또는 내인성 막 단백질의 조절된 발현이 결여된 푸코실락토스 생산 숙주와 비교하여, 하기와 같은 놀라운 이점들 중 적어도 하나를 제공한다:
- 더 우수한 푸코실락토스 역가 (향상) (g/L),
- 더 우수한 생성율 r (g 푸코실락토스/L/h),
- 더 우수한 세포 성능 지수 CPI (g 푸코실락토스/g X),
- 더 우수한 비생산성 Qp (g 푸코실락토스 /g X /h),
- 수크로스에 대한 더 우수한 수율 Ys (g 푸코실락토스/g 수크로스),
- 더 우수한 수크로스 흡수율/전환율 Qs (g 수크로스/g X/h),
- 더 우수한 락토스 전환율/소비율 rs (g 락토스/h),
- 푸코실락토스 분비 향상, 및/또는
- 생산 숙주의 성장 속도 향상.
또한, 본 발명은 하기 특정 구체예에 관한 것이다:
1. 유전자 변형 세포에 의해 푸코실락토스를 제조하는 방법으로서,
- 푸코실락토스를 생성할 수 있는 세포를 제공하는 단계로서, 상기 세포는 푸코실락토스 합성에 관여하는 효소를 코딩하는 핵산 서열을 적어도 1개 포함하고,
- 상기 세포는 i) 내인성 막 단백질의 변형된 발현 및/또는 ii) 이종 막 단백질의 발현을 추가로 포함하고, 상기 막 단백질은 interpro 번호 IPR001503 및 IPR002516을 각각 사용하여 GT10 및 GT11 푸코실트란스퍼라제 패밀리의 게놈 인근을 검색하여 발견된 PFAM 도메인들 중 어느 하나의 도메인을 포함하는 막 단백질들의 그룹으로부터 선택되고, 여기서 상기 게놈 인근 윈도우 크기는 각 푸코실트란스퍼라제 앞에 14개의 유전자 및 뒤에 14개의 유전자이고, 상기 막 단백질은 SET 패밀리에 속하지 않는 것인 단계,
- 상기 세포를 배지에서 원하는 푸코실락토스의 생성을 허용하는 조건 하에 배양하는 단계
- 바람직하게는 상기 푸코실락토스를 상기 배양으로부터 분리하는 단계를 포함하는 푸코실락토스를 제조하는 방법.
2. 구체예 1에 있어서, 상기 막 단백질은
a) 포터;
b) P-P-결합-가수분해-유도 수송체;
c) β-배럴 포린;
d) 보조 수송 단백질; 및
e) 추정 수송 단백질의 그룹으로부터 선택되는 것인 방법.
3. 유전자 변형 세포에 의해 푸코실락토스를 제조하는 방법으로서,
- 푸코실락토스를 생성할 수 있는 세포를 제공하는 단계로서, 상기 세포는 푸코실락토스 합성에 관여하는 효소를 코딩하는 핵산 서열을 적어도 1개 포함하고,
- 상기 세포는 i) 내인성 막 단백질의 변형된 발현 및/또는 ii) 이종 막 단백질의 발현을 추가로 포함하고, 상기 막 단백질은
a) 포터, 여기서 상기 막 단백질은 SET 패밀리에 속하는 않음;
b) P-P-결합-가수분해-유도 수송체;
c) β-배럴 포린;
d) 보조 수송 단백질; 및
e) 추정 수송 단백질의 그룹으로부터 선택되는 것인 단계,
- 상기 세포를 배지에서 원하는 푸코실락토스의 생성을 허용하는 조건 하에 배양하는 단계
- 바람직하게는 상기 푸코실락토스를 상기 배양으로부터 분리하는 단계를 포함하는 푸코실락토스를 제조하는 방법.
4. 구체예 2 또는 3에 있어서, 상기 포터는 TCDB 클래스 2.A.1.1, 2.A.1.12, 2.A.1.15, 2.A.1.2, 2.A.1.3, 2.A.1.36, 2.A.1.38, 2.A.1.46, 2.A.1.68, 2.A.1.7, 2.A.1.81, 2.A.123, 2.A.2, 2.A.21, 2.A.58, 2.A.6.3, 2.A.66 및 2.A.7.1의 그룹으로부터 선택되는 것인 방법.
5. 구체예 2 또는 3에 있어서, 상기 P-P-결합-가수분해-유도 수송체는 TCDB 클래스 3.A.1.1, 3.A.1.10, 3.A.1.11 및 3.A.1.5의 그룹으로부터 선택되는 것인 방법.
6. 구체예 2 또는 3에 있어서, 상기 β-배럴 포린은 TCDB 클래스 1.B.18로부터 선택되는 것인 방법.
7. 구체예 2 또는 3에 있어서, 상기 보조 수송 단백질은 TCDB 클래스 8.A.3으로부터 선택되는 것인 방법.
8. 구체예 2 또는 3에 있어서, 상기 추정 수송 단백질은 TCDB 클래스 9.B.14 및 9.B.158의 그룹으로부터 선택되는 것인 방법.
9. 구체예 2 또는 3에 있어서, 상기 포터는 eggnog 패밀리 05BZS, 05C0R, 05C2C, 05CT4, 05CXP, 05CZQ, 05D94, 05DXI, 05E5M, 05E5W, 05E8G, 05EAM, 05EDR, 05EGZ, 05F9N, 05JHE, 05PSV, 05W2Y, 05W3H, 05XJ5, 070Q9, 07CWC, 07QF7, 07QNK, 07RBJ, 07RJ1, 07T5E, 07VQ3, 0814C, 088QT, 08H15, 08N8A, 08SC4, 08Z4Q의 그룹으로부터 선택되는 것인 방법.
10. 구체예 2 또는 3에 있어서, 상기 P-P-결합-가수분해-유도 수송체는 eggnog 패밀리 05BZ1, 05CJ1, 05EY8, 05HAC, 05MFV, 07V1T, 08IJ9, 08JQ7의 그룹으로부터 선택되는 것인 방법.
11. 구체예 2 또는 3에 있어서, 상기 β-배럴 포린은 eggnog 패밀리 05DAY의 그룹으로부터 선택되는 것인 방법.
12. 구체예 2 또는 3에 있어서, 상기 보조 수송 단백질은 eggnog 패밀리 07SYR의 그룹으로부터 선택되는 것인 방법.
13. 구체예 2 또는 3에 있어서, 상기 추정 수송 단백질은 eggnog 패밀리 05CRE, 05GWF, 06N3A의 그룹으로부터 선택되는 것인 방법.
14. 구체예 2 또는 3에 있어서, 상기 포터는 PFAM 목록 PF00083, PF00474, PF00873, PF00893, PF01895, PF01943, PF02690, PF03083, PF04193, PF05977, PF07690, PF07690, PF13347, PF13440 및 PF14667로부터 선택되는 것인 방법.
15. 구체예 2 또는 3에 있어서, 상기 P-P-결합-가수분해-유도 수송체는 PFAM 목록 PF00005, PF00664, PF01061, PF08352, PF14524 및 PF17912로부터 선택되는 것인 방법.
16. 구체예 2 또는 3에 있어서, 상기 β-배럴 포린은 PFAM 목록 PF02563, PF10531 및 PF18412로부터 선택되는 것인 방법.
17. 구체예 2 또는 3에 있어서, 상기 보조 수송 단백질은 PFAM 목록 PF13807 및 PF02706으로부터 선택되는 것인 방법.
18. 구체예 2 또는 3에 있어서, 상기 추정 수송 단백질은 PFAM 목록 PF01578, PF03932, PF05140 및 PF11045로부터 선택되는 것인 방법.
19. 구체예 2 또는 3에 있어서, 상기 포터는 interpro 목록 IPR000390, IPR001036, IPR001411, IPR001734, IPR001927, IPR002797, IPR003663, IPR003841, IPR004316, IPR004633, IPR004638, IPR004734, IPR004812, IPR005275, IPR005828, IPR005829, IPR006603, IPR010290, IPR011701, IPR020846, IPR023008, IPR023721, IPR023722, IPR026022, IPR027417, IPR027463, IPR029303, IPR032896, IPR036259, IPR038078, IPR038377, IPR039672로부터 선택되는 것인 방법.
20. 구체예 2 또는 3에 있어서, 상기 P-P-결합-가수분해-유도 수송체는 interpro 목록 IPR000412, IPR001734, IPR003439, IPR003593, IPR005829, IPR005978, IPR005981, IPR008995, IPR011527, IPR011701, IPR013525, IPR013563, IPR015851, IPR017871, IPR019554, IPR020846, IPR027417, IPR029439, IPR036259, IPR036640, IPR038377, IPR039421 및 IPR040582로부터 선택되는 것인 방법.
21. 구체예 2 또는 3에 있어서, 상기 β-배럴 포린은 interpro 목록 IPR003715, IPR019554 및 IPR040716으로부터 선택되는 것인 방법.
22. 구체예 2에 있어서, 상기 보조 수송 단백질는 interpro 목록 IPR003856, IPR020846, IPR027417, IPR032807 및 IPR036259로부터 선택되는 것인 방법.
23. 구체예 2 또는 3에 있어서, 상기 추정 수송 단백질은 interpro 목록 IPR002541, IPR003439, IPR003593, IPR004316, IPR005627, IPR006603, IPR007816, IPR017871, IPR020368, IPR020846, IPR023648, IPR027417, IPR036259 및 IPR036822로부터 선택되는 것인 방법.
24. 구체예 2 또는 3에 있어서, 상기 포터 막 단백질은 대장균 K12 MG1655 유래의 MdfA, 대장균 K12 MG1655 유래의 IceT, B. 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2331, B. 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2332, 키티노파가 종 CF118, 프레보텔라 루미니콜라 (AR32), 락토코커스 라피노락티스 (ATCC 43920), 또는 디아도박터 솔리 DSM 25329의 wzx-유사 단백질, 또는 상기 포터 막 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 상기 MdfA, IceT, Blon_2331, Blon_2332 막 단백질들 또는 wzx-유사 막 단백질 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 서열로부터 선택되는 것인 방법.
25. 구체예 2 또는 3에 있어서, 상기 P-P-결합-가수분해 유도 수송체 막 단백질은 락토코커스 락티스 아종 락티스 bv. 디아세틸락티스 (Lactococcus lactis subsp. lactis bv. Diacetylactis) 유래의 lmrA, 스포로무사 스파에로이데스 DSM 2875, 플라보박테리움 스파르탄시이 유래의 LpsE 막 단백질, 칸디다투스 플란크토필라 설포니카 유래의 TolC, 페도박터 긴센기솔리 또는 베루코미크로비아 박테리움 CG1_02_43_26 유래의 MsbA, 또는 상기 P-P-결합-가수분해 유도 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 상기 lmrA, LpsE, TolC 또는 MsbA 막 단백질 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 서열로부터 선택되는 것인 방법.
26. 구체예 2 또는 3에 있어서, 상기 β-배럴 포린은 대장균 K12 MG1655 유래의 Wza, 또는 이의 기능성 상동체 또는 기능성 단편, 또는 상기 Wza 막 단백질에 대해 적어도 80%의 서열 동일성을 갖는 서열로부터 선택되는 것인 방법.
27. 구체예 2 또는 3에 있어서, 상기 보조 수송 단백질은 서모토가 마리티마 (균주 ATCC 43589 / MSB8 / DSM 3109 / JCM 10099) 유래의 Wzc, 또는 이의 기능성 상동체 또는 기능성 단편, 또는 상기 Wzc 막 단백질에 대해 적어도 80%의 서열 동일성을 갖는 서열로부터 선택되는 것인 방법.
28. 구체예 2 또는 3에 있어서, 상기 추정 수송 단백질은 클로스트리디움 종 CAG: 1013, 오도리박터 스플란크니쿠스 DSM 20712, 미추아리아 종 PDC51 또는 프레보텔라 인테르메디아 ATCC 25611 (DSM 20706) 유래의 CutC, 또는 상기 CutC 막 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 상기 CutC 막 단백질 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 서열로부터 선택되는 것인 방법.
29. 구체예 2 또는 3에 있어서, 상기 포터 막 단백질은 대장균 K12 MG1655 유래의 MdfA, 대장균 K12 MG1655 유래의 IceT, 대장균 K12 MG1655 유래의 YnfM, 대장균 K12 MG1655 유래의 Yhhs, 대장균 K12 MG1655 유래의 EmrD, 대장균 K12 MG1655 유래의 YdhC, 대장균 K12 MG1655 유래의 YbdA, 대장균 K12 MG1655 유래의 YdeE, 대장균 K12 MG1655 유래의 MhpT, 대장균 K12 MG1655 유래의 YebQ, 대장균 K12 MG1655 유래의 YjhB, 대장균 K12 MG1655 유래의 Bcr, 대장균 K12 MG1655 유래의 FucP, 대장균 K12 MG1655 유래의 WzxE, 대장균 K12 MG1655 유래의 EmrE, 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2331, 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2332, 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0247, 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0245, 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0345, 뉴로스포라 크라사 OR74A 유래의 CDT2, 아스페르길루스 오리제 RIB40 유래의 CDT2, 키티노파가 종 CF118 유래의 Wzx, 유박테리움 종 CAG:581 유래의 Wzx, 디아도박터 솔리 (DSM 25329) 유래의 Wzx, 락토코커스 라피노락티스 (ATCC 43920) 유래의 Wzx, 프레보텔라 루미니콜라 (AR32) 유래의 Wzx, 브라키스피라 함프소니이 P280/1 유래의 NAPO, 악티노바쿨룸 수이스 (DSM 20639) 유래의 NAm, 루미노코커스 그나부스 유래의 NAm, 쿠르토박테리움 종 314Chir4.1 유래의 NAm, 플란크토마이세테스 박테리움 (Planctomycetes bacterium) GWF2_42_9 유래의 NAm, 니아벨라 드릴라시스 (DSM25811) 유래의 Nap, 사카리크리니스 퍼멘탄스 (DSM 9555) 유래의 Nap, 시트로박터 프레운디이 MGH152 유래의 mdtD, 시트로박터 웨르크마니이 NBRC 105721 유래의 mdtD, 시트로박터 아말로나티쿠스 유래의 mdtD, 클레브시엘라 옥시토카 유래의 mdtD, 에스케리치아 알베르티이 B156 유래의 mdtD, 살모넬라 엔테리카 아종 살라메 유래의 yegB, 클레브시엘라 뉴모니에 30684/NJST258_2 유래의 mdtD, 클레브시엘라 뉴모니에 유래의 Tcr_1_D38215, 슈도시트로박터 페칼리스 유래의 mdtD, 요케넬라 레겐스버게이 (ATCC43003) 유래의 Cmr, 크로노박터 무이트젠시이 유래의 MdfA, 클레브시엘라 옥시토카 유래의 MdfA, 시트로박터 코세리 유래의 MFS, 에스케리치아 마르모테 유래의 MdfA, 시겔라 플렉스네리 유래의 Cmr, 살모넬라 엔테리카 아종 살라메 유래의 MdfA, 시트로박터 윤게 (ATCC 29220) 유래의 Cmr, 시트로박터 프레운디이 유래의 MdfA, 엔테로박터 코베이 유래의 MdfA, 엔테로박터 종 유래의 MdfA, 렐리오티아 종 WB101 유래의 MdfA, 엔테로박터 루드위기이 EcWSU1 유래의 MdfA, 악티노플라네스 우타헨시스 유래의 Sweet-유사 단백질, 키티노파가세에 박테리움 PMG_246 유래의 Sweet-유사 단백질, 리조비움 종 PDC82 유래의 Sweet-유사 단백질, 키네오코커스 리조스파에레 (DSM 19711) 유래의 Sweet-유사 단백질, 모르가넬라 모르가니이 IS15 유래의 Sweet-유사 단백질, 게오데르마토필루스 오브스쿠러스 (균주 ATCC 25078) 유래의 Sweet-유사 단백질, 브라디리조비움 종 BTAi1 유래의 Sweet-유사 단백질, 브라디리조비움 자포니쿰 USDA 110 유래의 Sweet-유사 단백질, 크산토모나스 캄페스트리스 pv. 베시카토리아 균주 85-10 유래의 Sweet-유사 단백질, 헤르바스피릴룸 아쿠아티쿰 유래의 Sweet-유사 단백질, 플라보박테리아 박테리움 MS024-2A 유래의 Sweet-유사 단백질, 시노리조비움 메디케 WSM419 유래의 rnd-유사, 아조스피릴룸 브라실리엔세 LMG 04375 유래의 아라비노스 유출물, 또는 상기 포터 막 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 상기 MdfA, IceT, YnfM, Yhhs, EmrD, YdhC, YbdA, YdeE, MhpT, YebQ, YjhB, Bcr, FucP, WzxE, EmrE, Wzx, Blon_2331, Blon_2232, Blon_0247, Blon_0245, Blon_0345, NAPO, NAm, Nap, mdtD, YegB, Tcr_1_D38215, cmr, MFS, CDT2, rnd, Sweet-유사 또는 아라비노스 유출물 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질로부터 선택되는 것인 방법.
30. 구체예 2 또는 3에 있어서, 상기 P-P-결합-가수분해-유도 수송체는 락토코커스 락티스 균주 SRCM103457 유래의 LmrA, 대장균 균주 K12 MG1655 유래의 OppF, 헬리코박터 필로리 (균주 ATCC 700392 / 26695) 유래의 Wzk, 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2475, 플라보박테리움 스파르탄시이 유래의 LpsE, 스포로무사 스파에로이데스 DSM 2875 유래의 LpsE, 칸디다투스 플란크토필라 설포니카 유래의 TolC, 부티리비브리오 훈가테이 XBD2006 유래의 TolC, 로세부리아 인테스티날리스 CAG:13 유래의 MsbA, 페도박터 긴센기솔리 유래의 MsbA, 베루코미크로비아 박테리움 CG1_02_43_26 유래의 MsbA, 리조비움 종 Root149 유래의 Wzm, 아조스피릴룸 브라실리엔세 LMG 04375 유래의 Wzm, 대장균 113303 유래의 Wzm, 리조비움 종 Root149 유래의 Wzt, 아조스피릴룸 브라실리엔세 LMG 04375 유래의 Wzt, 대장균 113303 유래의 Wzt, 브라디리조비움 자포니쿰 USDA 110 유래의 Nodj, 또는 상기 P-P-결합-가수분해-유도 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 상기 LmrA, OppF, Wzk, Blon_2475, LpsE, TolC, MsbA, Wzm, Wzt 또는 Nodj 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질로부터 선택되는 것인 방법.
31. 구체예 2 또는 3에 있어서, 상기 추정 수송 단백질은 헬리코박터 필로리 유래의 사이토크롬 C 생합성 단백질, 클로스트리디움 종 CAG: 1013 유래의 CutC, 오도리박터 스플란크니쿠스 DSM 20712 유래의 CutC, 미추아리아 종 PDC51 유래의 CutC, 프레보텔라 인테르메디아 ATCC 25611 (DSM 20706) 유래의 CutC, 대장균 K12 MG1655 유래의 ybjM, 엔테로박테리아세에 박테리움 ENNIH1 유래의 ybjM, 또는 상기 추정 수송 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 상기 CytC, CutC 또는 ybjM 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질로부터 선택되는 것인 방법.
32. 유전자 변형 세포에 의해 푸코실락토스를 제조하는 방법으로서,
- 푸코실락토스를 생성할 수 있는 세포를 제공하는 단계로서, 상기 세포는 푸코실락토스 합성에 관여하는 효소를 코딩하는 핵산 서열을 적어도 1개 포함하고,
- 상기 세포는 i) 내인성 막 단백질의 변형된 발현 및/또는 ii) 이종 막 단백질의 발현을 추가로 포함하고, 상기 막 단백질은 포터 막 단백질인 대장균 K12 MG1655 유래의 MdfA, 대장균 K12 MG1655 유래의 IceT, 대장균 K12 MG1655 유래의 YnfM, 대장균 K12 MG1655 유래의 Yhhs, 대장균 K12 MG1655 유래의 EmrD, 대장균 K12 MG1655 유래의 YdhC, 대장균 K12 MG1655 유래의 YbdA, 대장균 K12 MG1655 유래의 YdeE, 대장균 K12 MG1655 유래의 MhpT, 대장균 K12 MG1655 유래의 YebQ, 대장균 K12 MG1655 유래의 YjhB, 대장균 K12 MG1655 유래의 Bcr, 대장균 K12 MG1655 유래의 FucP, 대장균 K12 MG1655 유래의 WzxE, 대장균 K12 MG1655 유래의 EmrE, 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2331, 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2332, 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0247, 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0245, 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0345, 뉴로스포라 크라사 OR74A 유래의 CDT2, 아스페르길루스 오리제 RIB40 유래의 CDT2, 키티노파가 종 CF118 유래의 Wzx, 유박테리움 종 CAG:581 유래의 Wzx, 디아도박터 솔리 (DSM 25329) 유래의 Wzx, 락토코커스 라피노락티스 (ATCC 43920) 유래의 Wzx, 프레보텔라 루미니콜라 (AR32) 유래의 Wzx, 브라키스피라 함프소니이 P280/1 유래의 NAPO, 악티노바쿨룸 수이스 (DSM 20639) 유래의 NAm, 루미노코커스 그나부스 유래의 NAm, 쿠르토박테리움 종 314Chir4.1 유래의 NAm, 플란크토마이세테스 박테리움 GWF2_42_9 유래의 NAm, 니아벨라 드릴라시스 (DSM25811) 유래의 Nap, 사카리크리니스 퍼멘탄스 (DSM 9555) 유래의 Nap,시트로박터 프레운디이 MGH152 유래의 mdtD, 시트로박터 웨르크마니이 NBRC 105721 유래의 mdtD, 시트로박터 아말로나티쿠스 유래의 mdtD, 클레브시엘라 옥시토카 유래의 mdtD, 에스케리치아 알베르티이 B156 유래의 mdtD, 살모넬라 엔테리카 아종 살라메 유래의 yegB, 클레브시엘라 뉴모니에 30684/NJST258_2 유래의 mdtD, 클레브시엘라 뉴모니에 유래의 Tcr_1_D38215, 슈도시트로박터 페칼리스 유래의 mdtD, 요케넬라 레겐스버게이 (ATCC43003) 유래의 Cmr, 크로노박터 무이트젠시이 유래의 MdfA, 클레브시엘라 옥시토카 유래의 MdfA, 시트로박터 코세리 유래의 MFS, 에스케리치아 마르모테 유래의 MdfA, 시겔라 플렉스네리 유래의 Cmr, 살모넬라 엔테리카 아종 살라메 유래의 MdfA, 시트로박터 윤게 (ATCC 29220) 유래의 Cmr, 시트로박터 프레운디이 유래의 MdfA, 엔테로박터 코베이 유래의 MdfA, 엔테로박터 종 유래의 MdfA, 렐리오티아 종 WB101 유래의 MdfA, 엔테로박터 루드위기이 EcWSU1 유래의 MdfA, 악티노플라네스 우타헨시스 유래의 Sweet-유사 단백질, 키티노파가세에 박테리움 PMG_246 유래의 Sweet-유사 단백질, 리조비움 종 PDC82 유래의 Sweet-유사 단백질, 키네오코커스 리조스파에레 (DSM 19711) 유래의 Sweet-유사 단백질, 모르가넬라 모르가니이 IS15 유래의 Sweet-유사 단백질, 게오데르마토필루스 오브스쿠러스 (균주 ATCC 25078) 유래의 Sweet-유사 단백질, 브라디리조비움 종 BTAi1 유래의 Sweet-유사 단백질, 브라디리조비움 자포니쿰 USDA 110 유래의 Sweet-유사 단백질, 크산토모나스 캄페스트리스 pv. 베시카토리아 균주 85-10 유래의 Sweet-유사 단백질, 헤르바스피릴룸 아쿠아티쿰 유래의 Sweet-유사 단백질, 플라보박테리아 박테리움 MS024-2A 유래의 Sweet-유사 단백질, 시노리조비움 메디케 WSM419 유래의 rnd-유사, 아조스피릴룸 브라실리엔세 LMG 04375 유래의 아라비노스 유출물, 또는 상기 포터 막 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 상기 MdfA, IceT, YnfM, Yhhs, EmrD, YdhC, YbdA, YdeE, MhpT, YebQ, YjhB, Bcr, FucP, WzxE, EmrE, Wzx, Blon_2331, Blon_2232, Blon_0247, Blon_0245, Blon_0345, NAPO, NAm, Nap, mdtD, YegB, Tcr_1_D38215, cmr, MFS, CDT2, rnd, Sweet-유사 또는 아라비노스 유출물 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질; 및 P-P-결합-가수분해-유도 수송체인 락토코커스 락티스 균주 SRCM103457 유래의 LmrA, 대장균 균주 K12 MG1655 유래의 OppF, 헬리코박터 필로리 (균주 ATCC 700392 / 26695) 유래의 Wzk, 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2475, 플라보박테리움 스파르탄시이 유래의 LpsE, 스포로무사 스파에로이데스 DSM 2875 유래의 LpsE, 칸디다투스 플란크토필라 설포니카 유래의 TolC, 부티리비브리오 훈가테이 XBD2006 유래의 TolC, 로세부리아 인테스티날리스 CAG:13 유래의 MsbA, 페도박터 긴센기솔리 유래의 MsbA, 베루코미크로비아 박테리움 CG1_02_43_26 유래의 MsbA, 리조비움 종 Root149 유래의 Wzm, 아조스피릴룸 브라실리엔세 LMG 04375 유래의 Wzm, 대장균 113303 유래의 Wzm, 리조비움 종 Root149 유래의 Wzt, 아조스피릴룸 브라실리엔세 LMG 04375 유래의 Wzt, 대장균 113303 유래의 Wzt, 브라디리조비움 자포니쿰 USDA 110 유래의 Nodj, 또는 상기 P-P-결합-가수분해-유도 수송체 막 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 상기 LmrA, OppF, Wzk, Blon_2475, LpsE, TolC, MsbA, Wzm, Wzt 또는 Nodj 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질; 및 β-배럴 포린 막 단백질인 대장균 K12 MG1655 유래의 Wza, 또는 이의 기능성 상동체 또는 기능성 단편, 또는 상기 Wza 막 단백질에 대해 적어도 80%의 서열 동일성을 갖는 서열; 및 보조 수송 단백질인 서모토가 마리티마 (균주 ATCC 43589 / MSB8 / DSM 3109 / JCM 10099) 유래의 Wzc, 또는 이의 기능성 상동체 또는 기능성 단편, 또는 상기 Wzc 막 단백질에 대해 적어도 80%의 서열 동일성을 갖는 서열; 및 추정 수송 단백질인 헬리코박터 필로리 유래의 사이토크롬 C 생합성 단백질, 클로스트리디움 종 CAG: 1013 유래의 CutC, 오도리박터 스플란크니쿠스 DSM 20712 유래의 CutC, 미추아리아 종 PDC51 유래의 CutC, 프레보텔라 인테르메디아 ATCC 25611 (DSM 20706) 유래의 CutC, 대장균 K12 MG1655 유래의 ybjM, 엔테로박테리아세에 박테리움 ENNIH1 유래의 ybjM, 또는 상기 추정 수송 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 상기 CytC, CutC 또는 ybjM 막 단백질 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질로 구성된 막 단백질들의 그룹으로부터 선택되는 것인 단계를 포함하는 방법.
33. 구체예 1 내지 32 중 어느 한 구체예에 있어서, 상기 방법은 하기 단계들 중 적어도 하나를 추가로 포함하는 것인 푸코실락토스를 제조하는 방법:
i) 상기 배양 배지에, 초기 반응기 부피 당 락토스를 적어도 50, 더 바람직하게는 적어도 75, 더 바람직하게는 적어도 100, 더 바람직하게는 적어도 120, 더 바람직하게는 적어도 150 그람 (gram)을 포함하는 락토스 공급물을, 바람직하게는 연속 방식 (continuous manner)으로, 바람직하게는 상기 배양 배지의 최종 부피가 상기 락토스 공급물의 부가 전 배양 배지 부피의 3배 이하, 바람직하게는 2배 이하, 더 바람직하게는 2배 미만이 되도록 부가하는 단계;
ii) 락토스 공급물을 연속 방식으로 상기 배양 배지에 1일, 2일, 3일, 4일, 5일에 걸쳐 공급 용액에 의해 부가하는 단계;
iii) 락토스 공급물을 연속 방식으로 배양 배지에 1일, 2일, 3일, 4일, 5일에 걸쳐 공급 용액에 의해 부가하는 단계로서, 상기 락토스 공급 용액의 농도는 50 g/L, 바람직하게는 75 g/L, 더 바람직하게는 100 g/L, 더 바람직하게는 125 g/L, 더 바람직하게는 150 g/L, 더 바람직하게는 175 g/L, 더 바람직하게는 200 g/L, 더 바람직하게는 225 g/L, 더 바람직하게는 250 g/L, 더 바람직하게는 275 g/L, 더 바람직하게는 300 g/L, 더 바람직하게는 325 g/L, 더 바람직하게는 350 g/L, 더 바람직하게는 375 g/L, 더 바람직하게는 400 g/L, 더 바람직하게는 450 g/L, 더 바람직하게는 500 g/L, 더욱 바람직하게는 550 g/L, 가장 바람직하게는 600 g/L이며; 바람직하게는 상기 용액의 pH는 3 내지 7로 설정되고, 바람직하게는 상기 공급 용액의 온도는 20℃ 내지 80℃로 유지되는 것인 단계;
iv) 상기 방법으로 상기 배양 배지의 최종 부피 중에 적어도 50 g/L, 바람직하게는 적어도 75 g/L, 더 바람직하게는 적어도 90 g/L, 더 바람직하게는 적어도 100 g/L, 더 바람직하게는 적어도 125 g/L, 더 바람직하게는 적어도 150 g/L, 더 바람직하게는 적어도 175 g/L, 더 바람직하게는 적어도 200 g/L의 푸코실락토스 농도가 유도된다.
34. 구체예 33에 있어서, 상기 락토스 공급은 배양 초기부터 락토스를 적어도 5 mM의 농도, 바람직하게는 30, 40, 50, 60, 70, 80, 90, 100, 150 mM의 농도, 더 바람직하게는 > 300 mM의 농도로 부가함으로써 달성되는 것인 방법.
35. 구체예 33 또는 34에 있어서, 상기 락토스 공급은 배양의 생산 단계 (production phase) 전반에 걸쳐 적어도 5 mM, 바람직하게는 10 mM 또는 30 mM의 락토스 농도가 수득되도록 하는 농도로 락토스를 상기 배양 배지에 부가함으로써 달성되는 것인 방법.
36. 구체예 33, 34 또는 35 중 어느 구체예에 있어서, 상기 숙주 세포는 적어도 약 60, 80, 100, 또는 약 120시간 동안, 또는 연속 방식으로 배양되는 것인 방법.
37. 구체예 33 내지 36 중 어느 한 구체예에 있어서, 탄소 및 에너지 공급원, 바람직하게는 수크로스, 글루코스, 프럭토스, 글리세롤, 말토스, 말토덱스트린, 트레할로스, 폴리올, 전분, 숙시네이트, 말레이트, 피루베이트, 락테이트, 에탄올, 시트레이트, 락토스가 또한 부가되고, 바람직하게는 연속적으로, 바람직하게는 락토스와 함께 상기 배양 배지에 부가되는 것인 방법.
38. 구체예 33 내지 37 중 어느 한 구체예에 있어서, 탄소계 기질, 바람직하게는 글루코스 또는 수크로스를 상기 배양 배지에 부가함으로써 제1 지수적 세포 성장 단계가 제공되고, 그 후에 제2 단계에서 락토스가 상기 배양 배지에 부가되는 것인 방법.
39. 구체예 1 내지 38 중 어느 한 구체예에 있어서, 상기 방법이 푸코실락토스의 혼합물을 생성하는 것인 방법.
40. 구체예 1 내지 39 중 어느 한 구체예에 있어서, 상기 푸코실락토스는 2'-푸코실락토스, 3-푸코실락토스 및/또는 디푸코실락토스인 것인 방법.
41. 구체예 1 내지 40 중 어느 한 구체예에 있어서, 상기 유전자 변형 세포는 미생물, 식물 또는 동물 세포로 구성된 그룹으로부터 선택되고, 바람직하게는 상기 미생물은 박테리아, 진균 또는 효모이며, 바람직하게는 상기 식물은 벼, 목화, 유채, 대두, 옥수수 (maize) 또는 옥수수 식물 (corn plant)이고, 바람직하게는 상기 동물은 곤충, 어류, 조류 또는 비-인간 포유동물인 것인 방법.
42. 구체예 41에 있어서, 상기 세포는 대장균 세포인 것인 방법.
43. 푸코실락토스를 생산하도록 유전자 변형된 숙주 세포로서, 상기 숙주 세포는 푸코실락토스 합성에 관여하는 효소를 코딩하는 핵산 서열을 적어도 1개 포함하고,
- 상기 세포는 i) 내인성 막 단백질의 변형된 발현 및/또는 ii) 이종 막 단백질의 발현을 추가로 포함하고, 상기 막 단백질은 interpro 번호 IPR001503 및 IPR002516을 각각 사용하여 GT10 및 GT11 푸코실트란스퍼라제 패밀리의 게놈 인근을 검색하여 발견된 PFAM 도메인들 중 어느 하나의 도메인을 포함하는 막 단백질들의 그룹으로부터 선택되고, 여기서 상기 게놈 인근 윈도우 크기는 각 푸코실트란스퍼라제 앞에 14개의 유전자 및 뒤에 14개의 유전자이고, 상기 막 단백질은 SET 패밀리에 속하지 않는 것인 숙주 세포.
44. 구체예 43에 있어서, 상기 막 단백질은
a) 포터;
b) P-P-결합-가수분해-유도 수송체;
c) β-배럴 포린;
d) 보조 수송 단백질; 및
e) 추정 수송 단백질의 그룹으로부터 선택되는 것인 숙주 세포.
45. 푸코실락토스를 생산하도록 유전자 변형된 숙주 세포로서, 상기 숙주 세포는 푸코실락토스 합성에 관여하는 효소를 코딩하는 핵산 서열을 적어도 1개 포함하고,
- 상기 세포는 i) 내인성 막 단백질의 변형된 발현 및/또는 ii) 이종 막 단백질의 발현을 추가로 포함하고, 상기 막 단백질은
a) 포터, 여기서 상기 막 단백질은 SET 패밀리에 속하는 않음;
b) P-P-결합-가수분해-유도 수송체;
c) β-배럴 포린;
d) 보조 수송 단백질; 및
e) 추정 수송 단백질의 그룹으로부터 선택되는 것인 숙주 세포.
46. 구체예 44 또는 45에 있어서, 상기 막 단백질은 구체예 4 내지 32 중 어느 한 구체예에 정의된 막 단백질들의 그룹으로부터 선택되는 것인 숙주 세포.
47. 구체예 44 또는 45에 있어서, 상기 포터 막 단백질은 대장균 K12 MG1655 유래의 MdfA, 대장균 K12 MG1655 유래의 IceT, 대장균 K12 MG1655 유래의 YnfM, 대장균 K12 MG1655 유래의 Yhhs, 대장균 K12 MG1655 유래의 EmrD, 대장균 K12 MG1655 유래의 YdhC, 대장균 K12 MG1655 유래의 YbdA, 대장균 K12 MG1655 유래의 YdeE, 대장균 K12 MG1655 유래의 MhpT, 대장균 K12 MG1655 유래의 YebQ, 대장균 K12 MG1655 유래의 YjhB, 대장균 K12 MG1655 유래의 Bcr, 대장균 K12 MG1655 유래의 FucP, 대장균 K12 MG1655 유래의 WzxE, 대장균 K12 MG1655 유래의 EmrE, 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2331, 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2332, 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0247, 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0245, 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0345, 뉴로스포라 크라사 OR74A 유래의 CDT2, 아스페르길루스 오리제 RIB40 유래의 CDT2, 키티노파가 종 CF118 유래의 Wzx, 유박테리움 종 CAG:581 유래의 Wzx, 디아도박터 솔리 (DSM 25329) 유래의 Wzx, 락토코커스 라피노락티스 (ATCC 43920) 유래의 Wzx, 프레보텔라 루미니콜라 (AR32) 유래의 Wzx, 브라키스피라 함프소니이 P280/1 유래의 NAPO, 악티노바쿨룸 수이스 (DSM 20639) 유래의 NAm, 루미노코커스 그나부스 유래의 NAm, 쿠르토박테리움 종 314Chir4.1 유래의 NAm, 플란크토마이세테스 박테리움 GWF2_42_9 유래의 NAm, 니아벨라 드릴라시스 (DSM25811) 유래의 Nap, 사카리크리니스 퍼멘탄스 (DSM 9555) 유래의 Nap,시트로박터 프레운디이 MGH152 유래의 mdtD, 시트로박터 웨르크마니이 NBRC 105721 유래의 mdtD, 시트로박터 아말로나티쿠스 유래의 mdtD, 클레브시엘라 옥시토카 유래의 mdtD, 에스케리치아 알베르티이 B156 유래의 mdtD, 살모넬라 엔테리카 아종 살라메 유래의 yegB, 클레브시엘라 뉴모니에 30684/NJST258_2 유래의 mdtD, 클레브시엘라 뉴모니에 유래의 Tcr_1_D38215, 슈도시트로박터 페칼리스 유래의 mdtD, 요케넬라 레겐스버게이 (ATCC43003) 유래의 Cmr, 크로노박터 무이트젠시이 유래의 MdfA, 클레브시엘라 옥시토카 유래의 MdfA, 시트로박터 코세리 유래의 MFS, 에스케리치아 마르모테 유래의 MdfA, 시겔라 플렉스네리 유래의 Cmr, 살모넬라 엔테리카 아종 살라메 유래의 MdfA, 시트로박터 윤게 (ATCC 29220) 유래의 Cmr, 시트로박터 프레운디이 유래의 MdfA, 엔테로박터 코베이 유래의 MdfA, 엔테로박터 종 유래의 MdfA, 렐리오티아 종 WB101 유래의 MdfA, 엔테로박터 루드위기이 EcWSU1 유래의 MdfA, 악티노플라네스 우타헨시스 유래의 Sweet-유사 단백질, 키티노파가세에 박테리움 PMG_246 유래의 Sweet-유사 단백질, 리조비움 종 PDC82 유래의 Sweet-유사 단백질, 키네오코커스 리조스파에레 (DSM 19711) 유래의 Sweet-유사 단백질, 모르가넬라 모르가니이 IS15 유래의 Sweet-유사 단백질, 게오데르마토필루스 오브스쿠러스 (균주 ATCC 25078) 유래의 Sweet-유사 단백질, 브라디리조비움 종 BTAi1 유래의 Sweet-유사 단백질, 브라디리조비움 자포니쿰 USDA 110 유래의 Sweet-유사 단백질, 크산토모나스 캄페스트리스 pv. 베시카토리아 균주 85-10 유래의 Sweet-유사 단백질, 헤르바스피릴룸 아쿠아티쿰 유래의 Sweet-유사 단백질, 플라보박테리아 박테리움 MS024-2A 유래의 Sweet-유사 단백질, 시노리조비움 메디케 WSM419 유래의 rnd-유사, 아조스피릴룸 브라실리엔세 LMG 04375 유래의 아라비노스 유출물, 또는 상기 포터 막 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 상기 MdfA, IceT, YnfM, Yhhs, EmrD, YdhC, YbdA, YdeE, MhpT, YebQ, YjhB, Bcr, FucP, WzxE, EmrE, Wzx, Blon_2331, Blon_2232, Blon_0247, Blon_0245, Blon_0345, NAPO, NAm, Nap, mdtD, YegB, Tcr_1_D38215, cmr, MFS, CDT2, rnd, Sweet-유사 또는 아라비노스 유출물 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질로부터 선택되는 것인 푸코실락토스를 생산하도록 유전자 변형된 숙주 세포.
48. 구체예 44 또는 45에 있어서, 상기 P-P-결합-가수분해-유도 수송체는 락토코커스 락티스 균주 SRCM103457 유래의 LmrA, 대장균 균주 K12 MG1655 유래의 OppF, 헬리코박터 필로리 (균주 ATCC 700392 / 26695) 유래의 Wzk, 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2475, 플라보박테리움 스파르탄시이 유래의 LpsE, 스포로무사 스파에로이데스 DSM 2875 유래의 LpsE, 칸디다투스 플란크토필라 설포니카 유래의 TolC, 부티리비브리오 훈가테이 XBD2006 유래의 TolC, 로세부리아 인테스티날리스 CAG:13 유래의 MsbA, 페도박터 긴센기솔리 유래의 MsbA, 베루코미크로비아 박테리움 CG1_02_43_26 유래의 MsbA, 리조비움 종 Root149 유래의 Wzm, 아조스피릴룸 브라실리엔세 LMG 04375 유래의 Wzm, 대장균 113303 유래의 Wzm, 리조비움 종 Root149 유래의 Wzt, 아조스피릴룸 브라실리엔세 LMG 04375 유래의 Wzt, 대장균 113303 유래의 Wzt, 브라디리조비움 자포니쿰 USDA 110 유래의 Nodj, 또는 상기 P-P-결합-가수분해-유도 수송체 막 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 상기 LmrA, OppF, Wzk, Blon_2475, LpsE, TolC, MsbA, Wzm, Wzt 또는 Nodj 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질로부터 선택되는 것인 숙주 세포.
49. 구체예 44 또는 45에 있어서, 상기 추정 수송 단백질은 헬리코박터 필로리 유래의 사이토크롬 C 생합성 단백질, 클로스트리디움 종 CAG: 1013 유래의 CutC, 오도리박터 스플란크니쿠스 DSM 20712 유래의 CutC, 미추아리아 종 PDC51 유래의 CutC, 프레보텔라 인테르메디아 ATCC 25611 (DSM 20706) 유래의 CutC, 대장균 K12 MG1655 유래의 ybjM, 엔테로박테리아세에 박테리움 ENNIH1 유래의 ybjM, 또는 상기 추정 수송 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 상기 CytC, CutC 또는 ybjM 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질로부터 선택되는 것인 숙주 세포.
50. 구체예 44 또는 45에 있어서, 상기 β-배럴 포린은 대장균 K12 MG1655 유래의 Wza, 또는 이의 기능성 상동체 또는 기능성 단편, 또는 상기 Wza 막 단백질에 대해 적어도 80%의 서열 동일성을 갖는 서열로부터 선택되는 것인 숙주 세포.
51. 구체예 44 또는 45에 있어서, 상기 보조 수송 단백질은 서모토가 마리티마 (균주 ATCC 43589 / MSB8 / DSM 3109 / JCM 10099) 유래의 Wzc, 또는 이의 기능성 상동체 또는 기능성 단편, 또는 상기 Wzc 막 단백질에 대해 적어도 80%의 서열 동일성을 갖는 서열로부터 선택되는 것인 숙주 세포.
52. 배지에서 안정하게 배양되는 세포로서, 상기 세포는 푸코실락토스의 생성을 위해 조정되고, 상기 세포는 푸코실락토스 합성에 관여하는 효소를 코딩하는 핵산 서열을 적어도 1개 포함하도록 형질전환되며, 상기 세포는 i) 내인성 막 단백질의 변형된 발현 및/또는 ii) 이종 막 단백질의 발현을 추가로 포함하고, 상기 막 단백질은 구체예 1 내지 33 중 어느 한 구체예에 정의된 바와 같은 것을 특징으로 하는 세포.
53. 구체예 43 내지 52 중 어느 한 구체예에 있어서, 상기 세포는 미생물, 식물 또는 동물 세포로 구성된 그룹으로부터 선택되고, 바람직하게는 상기 미생물은 박테리아, 진균 또는 효모이며, 바람직하게는 상기 식물은 벼, 목화, 유채, 대두, 옥수수 또는 옥수수 식물이고, 바람직하게는 상기 동물은 곤충, 어류, 조류 또는 비-인간 포유동물인 것인 세포.
54. 구체예 53에 있어서, 상기 세포는 대장균 세포인 것인 숙주 세포.
55. 구체예 43 내지 54 중 어느 한 구체예에 있어서, 상기 세포는 푸코실락토스 합성에 관여하고/하거나 이의 합성에 필요한, 적어도 부분적으로 불활성화된, 모노사카라이드, 디사카라이드 또는 올리고사카라이드인, 선택된 모노사카라이드, 디사카라이드 또는 올리고사카라이드에 대한 이화 경로를 포함하는 것인 세포.
56. 구체예 43 내지 55 중 어느 한 구체예에 있어서, 상기 푸코실락토스는 2'-푸코실락토스, 3-푸코실락토스 및/또는 디푸코실락토스인 것인 세포.
57. 푸코실락토스를 제조하는 방법으로서,
a) 구체예 43 내지 56 중 어느 한 구체예에 따른 세포를 제공하는 단계,
b) 상기 푸코실락토스의 생성을 허용하는 조건 하에 배지에서 상기 세포를 배양하는 단계,
c) 상기 푸코실락토스를 배양으로부터 분리하는 단계를 포함하는 방법.
58. 푸코실락토스의 발효 생성에서 구체예 1 내지 31 중 어느 한 구체예에 정의된 막 단백질들의 그룹으로부터 선택된 막 단백질의 용도.
59. 푸코실락토스의 제조 방법에서 구체예 43 내지 56 중 어느 한 구체예에 따른 세포의 용도.
60. 구체예 59에 있어서, 상기 푸코실락토스는 2'-푸코실락토스, 3-푸코실락토스 및/또는 디푸코실락토스인 것인 세포의 용도.
또한, 본 발명은 하기 바람직한 특정 구체예에 관한 것이다:
1. 유전자 변형 세포에 의해 푸코실락토스를 제조하는 방법으로서,
- 푸코실락토스를 생성할 수 있는 세포를 제공하는 단계로서, 상기 세포는 구아노신-디포스페이트 푸코스 (GDP-푸코스) 공여체로부터의 푸코스 잔기를 락토스 수용체에 전달하여 푸코실락토스를 합성하는 푸코실트란스퍼라제를 코딩하는 핵산 서열을 적어도 1개 포함하고,
- 상기 세포는 i) 푸코실락토스 수송을 가능하게 하고/하거나 이를 향상시키는 내인성 막 단백질의 변형된 발현 및/또는 ii) 푸코실락토스 수송을 가능하게 하고/하거나 이를 향상시키는 이종 막 단백질의 발현을 추가로 포함하고, 상기 막 단백질은 i) 2019년 7월 4일자로 공개된 InterPro 75.0에 정의되는, interpro 번호 IPR001503 및 IPR002516을 각각 사용하여 GT10 및 GT11 푸코실트란스퍼라제 패밀리의 게놈 인근을 검색하여 발견된 PFAM 도메인들 중 어느 하나의 도메인을 포함하는 막 단백질들의 그룹으로부터 선택되고, 여기서 상기 게놈 인근 윈도우 크기는 각 푸코실트란스퍼라제 앞에 14개의 유전자 및 뒤에 14개의 유전자이고, 상기 막 단백질은 SET 패밀리에 속하지 않으며, 또는 ii) 서열번호: 204, 206, 208, 210, 212, 214, 216, 218을 포함하는 막 단백질, 또는 서열번호: 204, 206, 208, 210, 212, 214, 216, 218을 포함하는 막 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 204, 206, 208, 210, 212, 214, 216, 218을 갖는 상기 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 서열의 그룹으로부터 선택되는 것인 단계,
- 상기 세포를 배지에서 원하는 푸코실락토스의 생성을 허용하는 조건 하에 배양하는 단계
- 바람직하게는 상기 푸코실락토스를 배양으로부터 분리하는 단계를 포함하는 푸코실락토스를 제조하는 방법.
2. 특정 구체예 1에 있어서, 상기 막 단백질은
a) 포터;
b) P-P-결합-가수분해-유도 수송체;
c) β-배럴 포린;
d) 보조 수송 단백질;
e) 추정 수송 단백질; 및
f) 포스포트란스퍼-유도 그룹 전위인자의 그룹으로부터 선택되는 것인 방법.
3. 유전자 변형 세포에 의해 푸코실락토스를 제조하는 방법으로서,
- 푸코실락토스를 생성할 수 있는 세포를 제공하는 단계로서, 상기 세포는 GDP-푸코스 공여체로부터의 푸코스 잔기를 락토스 수용체에 전달하여 푸코실락토스를 합성하는 푸코실트란스퍼라제를 코딩하는 핵산 서열을 적어도 1개 포함하고,
- 상기 세포는 i) 푸코실락토스 수송을 가능하게 하고/하거나 이를 향상시키는 내인성 막 단백질의 변형된 발현, 및/또는 ii) 푸코실락토스 수송을 가능하게 하고/하거나 이를 향상시키는 이종 막 단백질의 발현을 추가로 포함하고, 상기 막 단백질은
a) 포터, 여기서 상기 막 단백질은 SET 패밀리에 속하지 않음;
b) P-P-결합-가수분해-유도 수송체;
c) β-배럴 포린;
d) 보조 수송 단백질;
e) 추정 수송 단백질; 및
f) 포스포트란스퍼-유도 그룹 전위인자의 그룹으로부터 선택되는 것인 단계;
- 상기 세포를 배지에서 원하는 푸코실락토스의 생성을 허용하는 조건 하에 배양하는 단계
- 바람직하게는, 상기 푸코실락토스를 배양으로부터 분리하는 단계를 포함하는 방법.
4. 특정 구체예 2 또는 3에 있어서, 상기 포터는 2019년 6월 17일자로 공개된 TCDB.org에 의해 정의되는, TCDB 클래스 2.A.1.1, 2.A.1.12, 2.A.1.15, 2.A.1.2, 2.A.1.3, 2.A.1.36, 2.A.1.38, 2.A.1.46, 2.A.1.68, 2.A.1.7, 2.A.1.81, 2.A.123, 2.A.2, 2.A.21, 2.A.58, 2.A.6.3, 2.A.66 및 2.A.7.1의 그룹으로부터 선택되는 것인 방법.
5. 특정 구체예 2 또는 3에 있어서, 상기 P-P-결합-가수분해-유도 수송체는 2019년 6월 17일자로 공개된 TCDB.org에 의해 정의되는, TCDB 클래스 3.A.1.1, 3.A.1.2, 3.A.1.10, 3.A.1.11 및 3.A.1.5의 그룹으로부터 선택되는 것인 방법.
6. 특정 구체예 2 또는 3에 있어서, 상기 β-배럴 포린은 2019년 6월 17일자로 공개된 TCDB.org에 의해 정의되는, TCDB 클래스 1.B.3.1 및 1.B.18로부터 선택되는 것인 방법.
7. 특정 구체예 2 또는 3에 있어서, 상기 보조 수송 단백질은 2019년 6월 17일자로 공개된 TCDB.org에 의해 정의되는, TCDB 클래스 8.A.3으로부터 선택되는 것인 방법.
8. 특정 구체예 2 또는 3에 있어서, 상기 추정 수송 단백질은 2019년 6월 17일자로 공개된 TCDB.org에 의해 정의되는, TCDB 클래스 9.B.14 및 9.B.158의 그룹으로부터 선택되는 것인 방법.
9. 특정 구체예 2 또는 3에 있어서, 상기 포스포트란스퍼-유도 그룹 전위인자는 2019년 6월 17일자로 공개된 TCDB.org에 의해 정의되는, TCDB 클래스 4.A.1.1 및 4.A.4.1의 그룹으로부터 선택되는 것인 방법.
10. 특정 구체예 2 또는 3에 있어서, 상기 포터는 2017년 11월 3일자로 공개된 eggnogdb 1.0.2에 의해 정의되는, eggnog 패밀리 05BZS, 05C0R, 05C2C, 05CT4, 05CXP, 05CZQ, 05D94, 05DXI, 05E5M, 05E5W, 05E8G, 05EAM, 05EDR, 05EGZ, 05F9N, 05JHE, 05PSV, 05W2Y, 05W3H, 05XJ5, 070Q9, 07CWC, 07QF7, 07QNK, 07RBJ, 07RJ1, 07T5E, 07VQ3, 0814C, 088QT, 08H15, 08N8A, 08SC4, 08Z4Q의 그룹으로부터 선택되는 것인 방법.
11. 특정 구체예 2 또는 3에 있어서, 상기 P-P-결합-가수분해-유도 수송체는 2017년 11월 3일자로 공개된 eggnogdb 1.0.2에 의해 정의되는, eggnog 패밀리 05BZ1, 05CJ1, 05EY8, 05HAC, 05DMK, 05DFW, 05MFV, 07FKK, 07R5U, 07V1T, 08IJ9, 08JQ7, 172T7의 그룹으로부터 선택되는 것인 방법.
12. 특정 구체예 2 또는 3에 있어서, 상기 β-배럴 포린은 2017년 11월 3일자로 공개된 eggnogdb 1.0.2에 의해 정의되는, eggnog 패밀리 05DAY, 08KDD의 그룹으로부터 선택되는 것인 방법.
13. 특정 구체예 2 또는 3에 있어서, 상기 보조 수송 단백질은 2017년 11월 3일자로 공개된 eggnogdb 1.0.2에 의해 정의되는, eggnog 패밀리 07SYR의 그룹으로부터 선택되는 것인 방법.
14. 특정 구체예 2 또는 3에 있어서, 상기 추정 수송 단백질은 2017년 11월 3일자로 공개된 eggnogdb 1.0.2에 의해 정의되는, eggnog 패밀리 05CRE, 05GWF, 06N3A의 그룹으로부터 선택되는 것인 방법.
15. 특정 구체예 2 또는 3에 있어서, 상기 포스포트란스퍼-유도 그룹 전위인자는 2017년 11월 3일자로 공개된 eggnogdb 1.0.2에 의해 정의되는, eggnog 패밀리 05CI1 및 05VI0의 그룹으로부터 선택되는 것인 방법.
16. 특정 구체예 2 또는 3에 있어서, 상기 포터는 2018년 9월에 공개된 Pfam 32.0에 의해 정의되는, PFAM 목록 PF00083, PF00474, PF00873, PF00893, PF01895, PF01943, PF02690, PF03083, PF04193, PF05977, PF07690, PF07690, PF13347, PF13440 및 PF14667로부터 선택되는 것인 방법.
17. 특정 구체예 2 또는 3에 있어서, 상기 P-P-결합-가수분해-유도 수송체는 2018년 9월에 공개된 Pfam 32.0에 의해 정의되는, PFAM 목록 PF00005, PF00532, PF00664, PF01061, PF08352, PF14524, PF13407, PF13416 및 PF17912로부터 선택되는 것인 방법.
18. 특정 구체예 2 또는 3에 있어서, 상기 β-배럴 포린은 2018년 9월에 공개된 Pfam 32.0에 의해 정의되는, PFAM 목록 PF02264, PF02563, PF10531 및 PF18412로부터 선택되는 것인 방법.
19. 특정 구체예 2 또는 3에 있어서, 상기 보조 수송 단백질은 2018년 9월에 공개된 Pfam 32.0에 의해 정의되는, PFAM 목록 PF13807 및 PF02706으로부터 선택되는 것인 방법.
20. 특정 구체예 2 또는 3에 있어서, 상기 추정 수송 단백질은 2018년 9월에 공개된 Pfam 32.0에 의해 정의되는, PFAM 목록 PF01578, PF03932, PF05140 및 PF11045로부터 선택되는 것인 방법.
21. 특정 구체예 2 또는 3에 있어서, 상기 포스포트란스퍼-유도 그룹 전위인자는 2018년 9월에 공개된 Pfam 32.0에 의해 정의되는, PFAM 목록 PF00367, PF00358, PF02378, PF03829로부터 선택되는 것인 방법.
22. 특정 구체예 2 또는 3에 있어서, 상기 포터는 2019년 7월 4일자로 공개된 InterPro 75.0에 의해 정의되는, interpro 목록 IPR000390, IPR001036, IPR001411, IPR001734, IPR001927, IPR002797, IPR003663, IPR003841, IPR004316, IPR004633, IPR004638, IPR004734, IPR004812, IPR005275, IPR005828, IPR005829, IPR006603, IPR010290, IPR011701, IPR020846, IPR023008, IPR023721, IPR023722, IPR026022, IPR027417, IPR027463, IPR029303, IPR032896, IPR036259, IPR038078, IPR038377, IPR039672로부터 선택되는 것인 방법.
23. 특정 구체예 2 또는 3에 있어서, 상기 P-P-결합-가수분해-유도 수송체는 2019년 7월 4일자로 공개된 InterPro 75.0에 의해 정의되는, interpro 목록 IPR000412, IPR001734, IPR001761, IPR003439, IPR003593, IPR005829, IPR005978, IPR005981, IPR006059, IPR006060, IPR006061, IPR008995, IPR011527, IPR011701, IPR013456, IPR013525, IPR013563, IPR015851, IPR015855, IPR017871, IPR019554, IPR020846, IPR025997, IPR026266, IPR027417, IPR028082, IPR029439, IPR033893, IPR036259, IPR036640, IPR038377, IPR039421 및 IPR040582로부터 선택되는 것인 방법.
24. 특정 구체예 2 또는 3에 있어서, 상기 β-배럴 포린은 2019년 7월 4일자로 공개된 InterPro 75.0에 의해 정의되는, interpro 목록 IPR003192, IPR003715, IPR019554, IPR023738, IPR036998 및 IPR040716으로부터 선택되는 것인 방법.
25. 특정 구체예 2 또는 3에 있어서, 상기 보조 수송 단백질은 2019년 7월 4일자로 공개된 InterPro 75.0에 의해 정의되는, interpro 목록 IPR003856, IPR020846, IPR027417, IPR032807 및 IPR036259로부터 선택되는 것인 방법.
26. 특정 구체예 2 또는 3에 있어서, 상기 추정 수송 단백질은 2019년 7월 4일자로 공개된 InterPro 75.0에 의해 정의되는, interpro 목록 IPR002541, IPR003439, IPR003593, IPR004316, IPR005627, IPR006603, IPR007816, IPR017871, IPR020368, IPR020846, IPR023648, IPR027417, IPR036259 및 IPR036822로부터 선택되는 것인 방법.
27. 특정 구체예 2 또는 3에 있어서, 상기 포스포트란스퍼-유도 그룹 전위인자는 2019년 7월 4일자로 공개된 InterPro 75.0에 의해 정의되는, interpro 목록 IPR001127, IPR001996, IPR003352, IPR004716, IPR010974, IPR011055, IPR013013, IPR018113, IPR018454, IPR036665 및 IPR036878로부터 선택되는 것인 방법.
28. 특정 구체예 2 또는 3에 있어서, 상기 포터 막 단백질은 서열번호: 02의 대장균 K12 MG1655 유래의 MdfA, 서열번호: 06의 대장균 K12 MG1655 유래의 IceT, 서열번호: 40의 B. 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2331, 서열번호: 42의 B. 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2332, 서열번호: 58의 키티노파가 종 CF118, 서열번호: 66의 프레보텔라 루미니콜라 (AR32), 서열번호: 64의 락토코커스 라피노락티스 (ATCC 43920), 또는 서열번호: 62의 디아도박터 솔리 DSM 25329의 wzx-유사 단백질, 또는 상기 포터 막 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 02, 06, 40, 42, 58, 66, 64 또는 62 각각의 상기 MdfA, IceT, Blon_2331, Blon_2332 막 단백질들 또는 wzx-유사 막 단백질 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 서열로부터 선택되는 것인 방법.
29. 특정 구체예 2 또는 3에 있어서, 상기 P-P-결합-가수분해 유도 수송체 막 단백질은 서열번호: 28의 락토코커스 락티스 균주 SRCM103457 유래의 lmrA, 서열번호: 70 또는 74의 스포로무사 스파에로이데스 DSM 2875, 서열번호: 68 또는 72의 플라보박테리움 스파르탄시이 유래의 LpsE 막 단백질, 서열번호: 76의 칸디다투스 플란크토필라 설포니카 유래의 TolC, 서열번호: 82의 페도박터 긴센기솔리 또는 서열번호: 84의 베루코미크로비아 박테리움 CG1_02_43_26 유래의 MsbA, 서열번호: 206의 대장균 K-12 MG1655 유래의 malE, 서열번호: 208의 대장균 K-12 MG1655 유래의 malK, 서열번호: 214의 대장균 K-12 MG1655 유래의 araF, 서열번호: 216의 대장균 K-12 MG1655 유래의 xylF, 또는 서열번호: 218의 대장균 K-12 MG1655 유래의 ytfQ, 또는 상기 P-P-결합-가수분해 유도 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 28, 70, 74, 68, 72, 76, 82, 84, 206, 208, 214, 216, 또는 218 각각의 상기 lmrA, LpsE, TolC, MsbA, malE, malK, araF, xylF 또는 ytfQ 막 단백질에 대해 적어도 80%의 서열 동일성을 갖는 서열로부터 선택되는 것인 방법.
30. 특정 구체예 2 또는 3에 있어서, 상기 β-배럴 포린은 서열번호: 34의 대장균 K12 MG1655 유래의 Wza 또는 서열번호: 204의 대장균 K12 MG1655 유래의 lamB, 또는 이의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 34 또는 204 각각의 상기 Wza 또는 lamB 막 단백질에 대해 적어도 80%의 서열 동일성을 갖는 서열로부터 선택되는 것인 방법.
31. 특정 구체예 2 또는 3에 있어서, 상기 보조 수송 단백질은 서열번호: 88의 서모토가 마리티마 (균주 ATCC 43589 / MSB8 / DSM 3109 / JCM 10099) 유래의 Wzc, 또는 이의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 88의 상기 Wzc 막 단백질에 대해 적어도 80%의 서열 동일성을 갖는 서열로부터 선택되는 것인 방법.
32. 특정 구체예 2 또는 3에 있어서, 상기 추정 수송 단백질은 서열번호: 90의 클로스트리디움 종 CAG: 1013, 서열번호: 92의 오도리박터 스플란크니쿠스 DSM 20712, 서열번호: 94의 미추아리아 종 PDC51 또는 서열번호: 96의 프레보텔라 인테르메디아 ATCC 25611 (DSM 20706) 유래의 CutC, 또는 상기 CutC 막 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 90, 92, 94 또는 96 각각의 상기 CutC 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 서열로부터 선택되는 것인 방법.
33. 특정 구체예 2 또는 3에 있어서, 상기 포스포트란스퍼-유도 그룹 전위인자는 서열번호: 210의 대장균 K12 MG1655 유래의 nagE, 서열번호: 212의 대장균 K12 MG1655 유래의 srlB, 또는 상기 nagE 또는 srlB 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 210 또는 212 각각의 상기 nagE 또는 srlB 막 단백질 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 서열로부터 선택되는 것인 방법.
34. 특정 구체예 2 또는 3에 있어서, 상기 포터 막 단백질은 서열번호: 02의 대장균 K12 MG1655 유래의 MdfA, 서열번호: 06의 대장균 K12 MG1655 유래의 IceT, 서열번호: 04의 대장균 K12 MG1655 유래의 YnfM, 서열번호: 08의 대장균 K12 MG1655 유래의 Yhhs, 서열번호: 10의 대장균 K12 MG1655 유래의 EmrD, 서열번호: 12의 대장균 K12 MG1655 유래의 YdhC, 서열번호: 14의 대장균 K12 MG1655 유래의 YbdA, 서열번호: 16의 대장균 K12 MG1655 유래의 YdeE, 서열번호: 18의 대장균 K12 MG1655 유래의 MhpT, 서열번호: 20의 대장균 K12 MG1655 유래의 YebQ, 서열번호: 22의 대장균 K12 MG1655 유래의 YjhB, 서열번호: 24의 대장균 K12 MG1655 유래의 Bcr, 서열번호: 26의 대장균 K12 MG1655 유래의 FucP, 서열번호: 32의 대장균 K12 MG1655 유래의 WzxE, 서열번호: 38의 대장균 K12 MG1655 유래의 EmrE, 서열번호: 40의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2331, 서열번호: 42의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2332, 서열번호: 46의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0247, 서열번호: 48의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0245, 서열번호: 50의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0345, 서열번호: 52의 뉴로스포라 크라사 OR74A 유래의 CDT2, 서열번호: 54의 아스페르길루스 오리제 RIB40 유래의 CDT2, 서열번호: 58의 키티노파가 종 CF118 유래의 Wzx, 서열번호: 60의 유박테리움 종 CAG:581 유래의 Wzx, 서열번호: 62의 디아도박터 솔리 (DSM 25329) 유래의 Wzx, 서열번호: 64의 락토코커스 라피노락티스 (ATCC 43920) 유래의 Wzx, 서열번호: 66의 프레보텔라 루미니콜라 (AR32) 유래의 Wzx, 서열번호: 86의 브라키스피라 함프소니이 P280/1 유래의 NAPO, 서열번호: 98의 악티노바쿨룸 수이스 (DSM 20639) 유래의 NAm, 서열번호: 100의 루미노코커스 그나부스 유래의 NAm, 서열번호: 102의 쿠르토박테리움 종 314Chir4.1 유래의 NAm, 서열번호: 104의 니아벨라 드릴라시스 (DSM25811) 유래의 Nap, 서열번호: 106의 사카리크리니스 퍼멘탄스 (DSM 9555) 유래의 Nap, 서열번호: 108의 시트로박터 프레운디이 MGH152 유래의 mdtD, 서열번호: 110의 시트로박터 웨르크마니이 NBRC 105721 유래의 mdtD, 서열번호: 112의 시트로박터 아말로나티쿠스 유래의 mdtD, 서열번호: 114의 클레브시엘라 옥시토카 유래의 mdtD, 서열번호: 116의 에스케리치아 알베르티이 B156 유래의 mdtD, 서열번호: 118의 살모넬라 엔테리카 아종 살라메 유래의 yegB, 서열번호: 120의 클레브시엘라 뉴모니에 30684/NJST258_2 유래의 mdtD, 서열번호: 122의 클레브시엘라 뉴모니에 유래의 Tcr_1_D38215, 서열번호: 124의 슈도시트로박터 페칼리스 유래의 mdtD, 서열번호: 126의 요케넬라 레겐스버게이 (ATCC43003) 유래의 Cmr, 서열번호: 128의 크로노박터 무이트젠시이 유래의 MdfA, 서열번호: 130의 클레브시엘라 옥시토카 유래의 MdfA, 서열번호: 132의 시트로박터 코세리 유래의 MFS, 서열번호: 134의 에스케리치아 마르모테 유래의 MdfA, 서열번호: 136의 시겔라 플렉스네리 유래의 Cmr, 서열번호: 138의 살모넬라 엔테리카 아종 살라메 유래의 MdfA, 서열번호: 140의 시트로박터 윤게 (ATCC 29220) 유래의 Cmr, 서열번호: 142의 시트로박터 프레운디이 유래의 MdfA, 서열번호: 144의 엔테로박터 코베이 유래의 MdfA, 서열번호: 146의 엔테로박터 종 유래의 MdfA, 서열번호: 148의 렐리오티아 종 WB101 유래의 MdfA, 서열번호: 150의 엔테로박터 루드위기이 EcWSU1 유래의 MdfA, 서열번호: 152의 악티노플라네스 우타헨시스 유래의 Sweet-유사 단백질, 서열번호: 154의 키티노파가세에 박테리움 PMG_246 유래의 Sweet-유사 단백질, 서열번호: 156의 리조비움 종 PDC82 유래의 Sweet-유사 단백질, 서열번호: 158의 키네오코커스 리조스파에레 (DSM 19711) 유래의 Sweet-유사 단백질, 서열번호: 160의 모르가넬라 모르가니이 IS15 유래의 Sweet-유사 단백질, 서열번호: 162의 게오데르마토필루스 오브스쿠러스 (균주 ATCC 25078) 유래의 Sweet-유사 단백질, 서열번호: 164의 브라디리조비움 종 BTAi1 유래의 Sweet-유사 단백질, 서열번호: 166의 브라디리조비움 자포니쿰 USDA 110 유래의 Sweet-유사 단백질, 서열번호: 168의 크산토모나스 캄페스트리스 pv. 베시카토리아 균주 85-10 유래의 Sweet-유사 단백질, 서열번호: 170의 헤르바스피릴룸 아쿠아티쿰 유래의 Sweet-유사 단백질, 서열번호: 172의 플라보박테리아 박테리움 MS024-2A 유래의 Sweet-유사 단백질, 서열번호: 182의 시노리조비움 메디케 WSM419 유래의 rnd-유사 단백질, 서열번호: 184의 아조스피릴룸 브라실리엔세 LMG 04375 유래의 아라비노스 유출물, 또는 상기 포터 막 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 02, 06, 04, 08, 10, 12, 14, 16, 18, 20, 22, 24, 26, 32, 38, 40, 42, 46, 48, 50, 52, 54, 58, 60, 62, 64, 66, 86, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164, 166, 168, 170, 172, 182 또는 184 각각의 상기 MdfA, IceT, YnfM, Yhhs, EmrD, YdhC, YbdA, YdeE, MhpT, YebQ, YjhB, Bcr, FucP, WzxE, EmrE, Wzx, Blon_2331, Blon_2232, Blon_0247, Blon_0245, Blon_0345, NAPO, NAm, Nap, mdtD, YegB, Tcr_1_D38215, cmr, MFS, CDT2, rnd, Sweet-유사 또는 아라비노스 유출물 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질로부터 선택되는 것인 방법.
35. 특정 구체예 2 또는 3에 있어서, 상기 P-P-결합-가수분해-유도 수송체는 서열번호: 28의 락토코커스 락티스 균주 SRCM103457 유래의 LmrA, 서열번호: 30의 대장균 균주 K12 MG1655 유래의 OppF, 서열번호: 36의 헬리코박터 필로리 (균주 ATCC 700392 / 26695) 유래의 Wzk, 서열번호: 44의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2475, 서열번호: 68 또는 72의 플라보박테리움 스파르탄시이 유래의 LpsE, 서열번호: 70 또는 74의 스포로무사 스파에로이데스 DSM 2875 유래의 LpsE, 서열번호: 76의 칸디다투스 플란크토필라 설포니카 유래의 TolC, 서열번호: 78의 부티리비브리오 훈가테이 XBD2006 유래의 TolC, 서열번호: 80의 로세부리아 인테스티날리스 CAG:13 유래의 MsbA, 서열번호: 82의 페도박터 긴센기솔리 유래의 MsbA, 서열번호: 84의 베루코미크로비아 박테리움 CG1_02_43_26 유래의 MsbA, 서열번호: 174의 리조비움 종 Root149 유래의 Wzm, 서열번호: 176의 아조스피릴룸 브라실리엔세 LMG 04375 유래의 Wzm, 서열번호: 196의 대장균 113303 유래의 Wzm, 서열번호: 178의 리조비움 종 Root149 유래의 Wzt, 서열번호: 180의 아조스피릴룸 브라실리엔세 LMG 04375 유래의 Wzt, 서열번호: 194의 대장균 113303 유래의 Wzt, 서열번호: 188 또는 190의 브라디리조비움 자포니쿰 USDA 110 유래의 Nodj, 서열번호: 206의 대장균 K-12 MG1655 유래의 malE, 서열번호: 208의 대장균 K-12 MG1655 유래의 malK, 서열번호: 214의 대장균 K-12 MG1655 유래의 araF, 서열번호: 216의 대장균 K-12 MG1655 유래의 xylF, 또는 서열번호: 218의 대장균 K-12 MG1655 유래의 ytfQ, 또는 상기 P-P-결합-가수분해-유도 수송체 막 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 28, 30, 36, 44, 68, 72, 70, 74, 76, 78, 80, 82, 84, 174, 176, 196, 178, 180, 194, 188, 190, 206, 208, 214, 216 또는 218 각각의 상기 LmrA, OppF, Wzk, Blon_2475, LpsE, TolC, MsbA, Wzm, Wzt, Nodj, malE, malK, araF, xylF 또는 ytfQ 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질로부터 선택되는 것인 방법.
36. 특정 구체예 2 또는 3에 있어서, 상기 추정 수송 단백질은 서열번호: 56의 헬리코박터 필로리 유래의 사이토크롬 C 생합성 단백질, 서열번호: 90의 클로스트리디움 종 CAG: 1013 유래의 CutC, 서열번호: 92의 오도리박터 스플란크니쿠스 DSM 20712 유래의 CutC, 서열번호: 94의 미추아리아 종 PDC51 유래의 CutC, 서열번호: 96의 프레보텔라 인테르메디아 ATCC 25611 (DSM 20706) 유래의 CutC, 서열번호: 190의 대장균 K12 MG1655 유래의 ybjM, 서열번호: 192의 엔테로박테리아세에 박테리움 ENNIH1 유래의 ybjM, 또는 상기 추정 수송 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 56, 90, 92, 94, 96, 190 또는 192 각각의 상기 CytC, CutC 또는 ybjM 막 단백질 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질로부터 선택되는 것인 방법.
37. 유전자 변형 세포에 의해 푸코실락토스를 제조하는 방법으로서,
- 푸코실락토스를 생성할 수 있는 세포를 제공하는 단계로서, 상기 세포는 GDP-푸코스 공여체로부터의 푸코스 잔기를 락토스 수용체에 전달하여 푸코실락토스를 합성하는 푸코실트란스퍼라제를 코딩하는 핵산 서열을 적어도 1개 포함하고,
- 상기 세포는 i) 푸코실락토스 수송을 가능하게 하고/하거나 이를 향상시키는 내인성 막 단백질의 변형된 발현, 및/또는 ii) 푸코실락토스 수송을 가능하게 하고/하거나 이를 향상시키는 이종 막 단백질의 발현을 추가로 포함하고, 상기 막 단백질은 포터 막 단백질인 서열번호: 02의 대장균 K12 MG1655 유래의 MdfA, 서열번호: 06의 대장균 K12 MG1655 유래의 IceT, 서열번호: 04의 대장균 K12 MG1655 유래의 YnfM, 서열번호: 08의 대장균 K12 MG1655 유래의 Yhhs, 서열번호: 10의 대장균 K12 MG1655 유래의 EmrD, 서열번호: 12의 대장균 K12 MG1655 유래의 YdhC, 서열번호: 14의 대장균 K12 MG1655 유래의 YbdA, 서열번호: 16의 대장균 K12 MG1655 유래의 YdeE, 서열번호: 18의 대장균 K12 MG1655 유래의 MhpT, 서열번호: 20의 대장균 K12 MG1655 유래의 YebQ, 서열번호: 22의 대장균 K12 MG1655 유래의 YjhB, 서열번호: 24의 대장균 K12 MG1655 유래의 Bcr, 서열번호: 26의 대장균 K12 MG1655 유래의 FucP, 서열번호: 32의 대장균 K12 MG1655 유래의 WzxE, 서열번호: 38의 대장균 K12 MG1655 유래의 EmrE, 서열번호: 40의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2331, 서열번호: 42의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2332, 서열번호: 46의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0247, 서열번호: 48의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0245, 서열번호: 50의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0345, 서열번호: 52의 뉴로스포라 크라사 OR74A 유래의 CDT2, 서열번호: 54의 아스페르길루스 오리제 RIB40 유래의 CDT2, 서열번호: 58의 키티노파가 종 CF118 유래의 Wzx, 서열번호: 60의 유박테리움 종 CAG:581 유래의 Wzx, 서열번호: 62의 디아도박터 솔리 (DSM 25329) 유래의 Wzx, 서열번호: 64의 락토코커스 라피노락티스 (ATCC 43920) 유래의 Wzx, 서열번호: 66의 프레보텔라 루미니콜라 (AR32) 유래의 Wzx, 서열번호: 86의 브라키스피라 함프소니이 P280/1 유래의 NAPO, 서열번호: 98의 악티노바쿨룸 수이스 (DSM 20639) 유래의 NAm, 서열번호: 100의 루미노코커스 그나부스 유래의 NAm, 서열번호: 102의 쿠르토박테리움 종 314Chir4.1 유래의 NAm, 서열번호: 104의 니아벨라 드릴라시스 (DSM25811) 유래의 Nap, 서열번호: 106의 사카리크리니스 퍼멘탄스 (DSM 9555) 유래의 Nap, 서열번호: 108의 시트로박터 프레운디이 MGH152 유래의 mdtD, 서열번호: 110의 시트로박터 웨르크마니이 NBRC 105721 유래의 mdtD, 서열번호: 112의 시트로박터 아말로나티쿠스 유래의 mdtD, 서열번호: 114의 클레브시엘라 옥시토카 유래의 mdtD, 서열번호: 116의 에스케리치아 알베르티이 B156 유래의 mdtD, 서열번호: 118의 살모넬라 엔테리카 아종 살라메 유래의 yegB, 서열번호: 120의 클레브시엘라 뉴모니에 30684/NJST258_2 유래의 mdtD, 서열번호: 122의 클레브시엘라 뉴모니에 유래의 Tcr_1_D38215, 서열번호: 124의 슈도시트로박터 페칼리스 유래의 mdtD, 서열번호: 126의 요케넬라 레겐스버게이 (ATCC43003) 유래의 Cmr, 서열번호: 128의 크로노박터 무이트젠시이 유래의 MdfA, 서열번호: 130의 클레브시엘라 옥시토카 유래의 MdfA, 서열번호: 132의 시트로박터 코세리 유래의 MFS, 서열번호: 134의 에스케리치아 마르모테 유래의 MdfA, 서열번호: 136의 시겔라 플렉스네리 유래의 Cmr, 서열번호: 138의 살모넬라 엔테리카 아종 살라메 유래의 MdfA, 서열번호: 140의 시트로박터 윤게 (ATCC 29220) 유래의 Cmr, 서열번호: 142의 시트로박터 프레운디이 유래의 MdfA, 서열번호: 144의 엔테로박터 코베이 유래의 MdfA, 서열번호: 146의 엔테로박터 종 유래의 MdfA, 서열번호: 148의 렐리오티아 종 WB101 유래의 MdfA, 서열번호: 150의 엔테로박터 루드위기이 EcWSU1 유래의 MdfA, 서열번호: 152의 악티노플라네스 우타헨시스 유래의 Sweet-유사 단백질, 서열번호: 154의 키티노파가세에 박테리움 PMG_246 유래의 Sweet-유사 단백질, 서열번호: 156의 리조비움 종 PDC82 유래의 Sweet-유사 단백질, 서열번호: 158의 키네오코커스 리조스파에레 (DSM 19711) 유래의 Sweet-유사 단백질, 서열번호: 160의 모르가넬라 모르가니이 IS15 유래의 Sweet-유사 단백질, 서열번호: 162의 게오데르마토필루스 오브스쿠러스 (균주 ATCC 25078) 유래의 Sweet-유사 단백질, 서열번호: 164의 브라디리조비움 종 BTAi1 유래의 Sweet-유사 단백질, 서열번호: 166의 브라디리조비움 자포니쿰 USDA 110 유래의 Sweet-유사 단백질, 서열번호: 168의 크산토모나스 캄페스트리스 pv. 베시카토리아 균주 85-10 유래의 Sweet-유사 단백질, 서열번호: 170의 헤르바스피릴룸 아쿠아티쿰 유래의 Sweet-유사 단백질, 서열번호: 172의 플라보박테리아 박테리움 MS024-2A 유래의 Sweet-유사 단백질, 서열번호: 182의 시노리조비움 메디케 WSM419 유래의 rnd-유사 단백질, 서열번호: 184의 아조스피릴룸 브라실리엔세 LMG 04375 유래의 아라비노스 유출물, 또는 상기 포터 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 02, 06, 04, 08, 10, 12, 14, 16, 18, 20, 22, 24, 26, 32, 38, 40, 42, 46, 48, 50, 52, 54, 58, 60, 62, 64, 66, 86, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164, 166, 168, 170, 172, 182 또는 184 각각의 상기 MdfA, IceT, YnfM, Yhhs, EmrD, YdhC, YbdA, YdeE, MhpT, YebQ, YjhB, Bcr, FucP, WzxE, EmrE, Wzx, Blon_2331, Blon_2232, Blon_0247, Blon_0245, Blon_0345, NAPO, NAm, Nap, mdtD, YegB, Tcr_1_D38215, cmr, MFS, CDT2, rnd, Sweet-유사 또는 아라비노스 유출물 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질; 및 P-P-결합-가수분해-유도 수송체인 서열번호: 28의 락토코커스 락티스 균주 SRCM103457 유래의 LmrA, 서열번호: 30의 대장균 균주 K12 MG1655 유래의 OppF, 서열번호: 36의 헬리코박터 필로리 (균주 ATCC 700392 / 26695) 유래의 Wzk, 서열번호: 44의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2475, 서열번호: 68 또는 72의 플라보박테리움 스파르탄시이 유래의 LpsE, 서열번호: 70 또는 74의 스포로무사 스파에로이데스 DSM 2875 유래의 LpsE, 서열번호: 76의 칸디다투스 플란크토필라 설포니카 유래의 TolC, 서열번호: 78의 부티리비브리오 훈가테이 XBD2006 유래의 TolC, 서열번호: 80의 로세부리아 인테스티날리스 CAG:13 유래의 MsbA, 서열번호: 82의 페도박터 긴센기솔리 유래의 MsbA, 서열번호: 84의 베루코미크로비아 박테리움 CG1_02_43_26 유래의 MsbA, 서열번호: 174의 리조비움 종 Root149 유래의 Wzm, 서열번호: 176의 아조스피릴룸 브라실리엔세 LMG 04375 유래의 Wzm, 서열번호: 196의 대장균 113303 유래의 Wzm, 서열번호: 178의 리조비움 종 Root149 유래의 Wzt, 서열번호: 180의 아조스피릴룸 브라실리엔세 LMG 04375 유래의 Wzt, 서열번호: 194의 대장균 113303 유래의 Wzt, 서열번호: 188 또는 190의 브라디리조비움 자포니쿰 USDA 110 유래의 Nodj, 서열번호: 206의 대장균 K-12 MG1655 유래의 malE, 서열번호: 208의 대장균 K-12 MG1655 유래의 malK, 서열번호: 214의 대장균 K-12 MG1655 유래의 araF, 서열번호: 216의 대장균 K-12 MG1655 유래의 xylF, 또는 서열번호: 218의 대장균 K-12 MG1655 유래의 ytfQ, 또는 상기 P-P-결합-가수분해-유도 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 28, 30, 36, 44, 68, 72, 70, 74, 76, 78, 80, 82, 84, 174, 176, 196, 178, 180, 194, 188, 190, 206, 208, 214, 216, 또는 218 각각의 상기 LmrA, OppF, Wzk, Blon_2475, LpsE, TolC, MsbA, Wzm, Wzt, Nodj, malE, malK, araF, xylF 또는 ytfQ 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질; 및 β-배럴 포린 막 단백질인 서열번호: 34의 대장균 K12 MG1655 유래의 Wza 또는 서열번호: 204의 대장균 K12 MG1655 유래의 lamB, 또는 상기 Wza 또는 lamB 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 34 또는 204 각각의 상기 Wza 또는 lamB 막 단백질 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 서열; 및 보조 수송 단백질인 서열번호: 88의 서모토가 마리티마 (균주 ATCC 43589 / MSB8 / DSM 3109 / JCM 10099) 유래의 Wzc, 또는 이의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 88의 상기 Wzc 막 단백질에 대해 적어도 80%의 서열 동일성을 갖는 서열; 및 추정 수송 단백질인 서열번호: 56의 헬리코박터 필로리 유래의 사이토크롬 C 생합성 단백질, 서열번호: 90의 클로스트리디움 종 CAG: 1013 유래의 CutC, 서열번호: 92의 오도리박터 스플란크니쿠스 DSM 20712 유래의 CutC, 서열번호: 94의 미추아리아 종 PDC51 유래의 CutC, 서열번호: 96의 프레보텔라 인테르메디아 ATCC 25611 (DSM 20706) 유래의 CutC, 서열번호: 190의 대장균 K12 MG1655 유래의 ybjM, 서열번호: 192의 엔테로박테리아세에 박테리움 ENNIH1 유래의 ybjM, 또는 상기 추정 수송 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 56, 90, 92, 94, 96, 190 또는 192 각각의 상기 CytC, CutC 또는 ybjM 막 단백질 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질; 및 포스포트란스퍼-유도 그룹 전위인자인 서열번호: 210의 대장균 K12 MG1655 유래의 nagE, 서열번호: 212의 대장균 K12 MG1655 유래의 srlB, 또는 상기 nagE 또는 srlB 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 210 또는 212 각각의 상기 nagE 또는 srlB 막 단백질 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 서열로 구성된 막 단백질들의 그룹으로부터 선택되는 단계를 포함하는 것인 방법.
38. 특정 구체예 1 내지 37 중 어느 한 구체예에 있어서, 상기 막 단백질은 세포벽의 외막을 가로질러 화합물의 수송에 관여하는 수송체 단백질인 것인 푸코실락토스를 제조하는 방법.
39. 특정 구체예 1 내지 38 중 어느 한 구체예에 있어서, 상기 방법은 하기 단계들 중 적어도 하나를 추가로 포함하고:
i) 상기 배양 배지에, 초기 반응기 부피 1 리터 (litre)당 락토스를 적어도 50, 더 바람직하게는 적어도 75, 더 바람직하게는 적어도 100, 더 바람직하게는 적어도 120, 더 바람직하게는 적어도 150 그람 (gram)을 포함하는 락토스 공급물을, 바람직하게는 연속 방식 (continuous manner)으로, 바람직하게는 상기 배양 배지의 최종 부피가 상기 락토스 공급물의 부가 전 배양 배지 부피의 3배 이하, 바람직하게는 2배 이하, 더 바람직하게는 2배 미만이 되도록 부가하는 단계;
ii) 락토스 공급물을 연속 방식으로 상기 배양 배지에 1일, 2일, 3일, 4일, 5일에 걸쳐 공급 용액에 의해 부가하는 단계;
iii) 락토스 공급물을 연속 방식으로 배양 배지에 1일, 2일, 3일, 4일, 5일에 걸쳐 공급 용액에 의해 부가하는 단계로서, 상기 락토스 공급 용액의 농도는 50 g/L, 바람직하게는 75 g/L, 더 바람직하게는 100 g/L, 더 바람직하게는 125 g/L, 더 바람직하게는 150 g/L, 더 바람직하게는 175 g/L, 더 바람직하게는 200 g/L, 더 바람직하게는 225 g/L, 더 바람직하게는 250 g/L, 더 바람직하게는 275 g/L, 더 바람직하게는 300 g/L, 더 바람직하게는 325 g/L, 더 바람직하게는 350 g/L, 더 바람직하게는 375 g/L, 더 바람직하게는 400 g/L, 더 바람직하게는 450 g/L, 더 바람직하게는 500 g/L, 더욱 바람직하게는 550 g/L, 가장 바람직하게는 600 g/L이며; 바람직하게는 상기 용액의 pH는 3 내지 7로 설정되고, 바람직하게는 상기 공급 용액의 온도는 20℃ 내지 80℃로 유지되는 것인 단계;
iv) 상기 방법으로 상기 배양 배지의 최종 부피 중에 적어도 50 g/L, 바람직하게는 적어도 75 g/L, 더 바람직하게는 적어도 90 g/L, 더 바람직하게는 적어도 100 g/L, 더 바람직하게는 적어도 125 g/L, 더 바람직하게는 적어도 150 g/L, 더 바람직하게는 적어도 175 g/L, 더 바람직하게는 적어도 200 g/L의 푸코실락토스 농도를 유도하는 것인 푸코실락토스를 제조하는 방법.
40. 특정 구체예 39에 있어서, 상기 락토스 공급은 배양 초기부터 락토스를 적어도 5 mM의 농도, 바람직하게는 30, 40, 50, 60, 70, 80, 90, 100, 150 mM의 농도, 더 바람직하게는 > 300 mM의 농도로 부가함으로써 달성되는 것인 방법.
41. 특정 구체예 39 또는 40에 있어서, 상기 락토스 공급은 배양의 생산 단계 전반에 걸쳐 적어도 5 mM, 바람직하게는 10 mM 또는 30 mM의 락토스 농도가 수득되도록 하는 농도로 락토스를 상기 배양 배지에 부가함으로써 달성되는 것인 방법.
42. 특정 구체예 39, 40 또는 41 중 어느 구체예에 있어서, 상기 숙주 세포는 적어도 약 60, 80, 100, 또는 약 120시간 동안, 또는 연속 방식으로 배양되는 것인 방법.
43. 특정 구체예 39 내지 42 중 어느 한 구체예에 있어서, 탄소 및 에너지 공급원, 바람직하게는 수크로스, 글루코스, 프럭토스, 글리세롤, 말토스, 말토덱스트린, 트레할로스, 폴리올, 전분, 숙시네이트, 말레이트, 피루베이트, 락테이트, 에탄올, 시트레이트, 락토스가 또한 부가되고, 바람직하게는 연속적으로, 바람직하게는 락토스와 함께 상기 배양 배지에 부가되는 것인 방법.
44. 특정 구체예 39 내지 43 중 어느 한 구체예에 있어서, 탄소계 기질, 바람직하게는 글루코스 또는 수크로스를 상기 배양 배지에 부가함으로써 제1 지수적 세포 성장 단계가 제공되고, 그 후에 제2 단계에서 락토스가 상기 배양 배지에 부가되는 것인 방법.
45. 특정 구체예 1 내지 44 중 어느 한 구체예에 있어서, 상기 방법이 푸코실락토스의 혼합물을 생성하는 것인 방법.
46. 특정 구체예 1 내지 45 중 어느 한 구체예에 있어서, 상기 푸코실락토스는 2'-푸코실락토스, 3-푸코실락토스 및/또는 디푸코실락토스인 것인 방법.
47. 특정 구체예 1 내지 46 중 어느 한 구체예에 있어서, 상기 유전자 변형 세포는 미생물, 식물 또는 동물 세포로 구성된 그룹으로부터 선택되고, 바람직하게는 상기 미생물은 박테리아, 진균 또는 효모이며, 바람직하게는 상기 식물은 벼, 목화, 유채, 대두, 옥수수 또는 옥수수 식물이고, 바람직하게는 상기 동물은 곤충, 어류, 조류 또는 비-인간 포유동물인 것인 방법.
48. 특정 구체예 47에 있어서, 상기 세포는 대장균 세포인 것인 방법.
49. 푸코실락토스 생성을 위해 유전자 변형된 숙주 세포로서, 상기 숙주 세포는 GDP-푸코스 공여체로부터의 푸코스 잔기를 락토스 수용체에 전달하여 푸코실락토스를 합성하는 푸코실트란스퍼라제를 코딩하는 핵산 서열을 적어도 1개 포함하고, - 상기 세포는 i) 푸코실락토스 수송을 가능하게 하고/하거나 이를 향상시킬 수 있는 내인성 막 단백질의 변형된 발현, 및/또는 ii) 푸코실락토스 수송을 가능하게 하고/하거나 이를 향상시킬 수 있는 이종 막 단백질의 발현을 추가로 포함하고, 상기 막 단백질은 i) 2019년 7월 4일자로 공개된 InterPro 75.0에 정의되는, interpro 번호 IPR001503 및 IPR002516을 각각 사용하여 GT10 및 GT11 푸코실트란스퍼라제 패밀리의 게놈 인근을 검색하여 발견된 PFAM 도메인들 중 어느 하나를 포함하는 막 단백질들의 그룹으로부터 선택되며, 여기서 상기 게놈 인근 윈도우 크기는 각 푸코실트란스퍼라제 앞에 14개의 유전자 및 뒤에 14개의 유전자이고, 상기 막 단백질은 SET 패밀리에 속하지 않으며, 또는 ii) 서열번호: 204, 206, 208, 210, 212, 214, 216, 218을 포함하는 막 단백질들, 또는 서열번호: 204, 206, 208, 210, 212, 214, 216, 218을 포함하는 막 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 204, 206, 208, 210, 212, 214, 216, 218의 상기 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 서열의 그룹으로부터 선택되는 것인 푸코실락토스 생성을 위해 유전자 변형된 숙주 세포.
50. 특정 구체예 49에 있어서, 상기 막 단백질
a) 포터;
b) P-P-결합-가수분해-유도 수송체;
c) β-배럴 포린;
d) 보조 수송 단백질;
e) 추정 수송 단백질; 및
f) 포스포트란스퍼-유도 그룹 전위인자의 그룹으로부터 선택되는 것인 숙주 세포.
51. 푸코실락토스 생성을 위해 유전자 변형된 숙주 세포로서, 상기 숙주 세포는 GDP-푸코스 공여체로부터의 푸코스 잔기를 락토스 수용체에 전달하여 푸코실락토스를 합성하는 푸코실트란스퍼라제를 코딩하는 핵산 서열을 적어도 1개 포함하고,
- 상기 세포는 i) 푸코실락토스 수송을 가능하게 하고/하거나 이를 향상시킬 수 있는 내인성 막 단백질의 변형된 발현, 및/또는 ii) 푸코실락토스 수송을 가능하게 하고/하거나 이를 향상시킬 수 있는 이종 막 단백질의 발현을 추가로 포함하고, 상기 막 단백질은
a) 포터, 여기서 상기 막 단백질은 SET 패밀리에 속하지 않음;
b) P-P-결합-가수분해-유도 수송체;
c) β-배럴 포린;
d) 보조 수송 단백질;
e) 추정 수송 단백질; 및
f) 포스포트란스퍼-유도 그룹 전위인자의 그룹으로부터 선택되는 것인 푸코실락토스 생성을 위해 유전자 변형된 숙주 세포.
52. 특정 구체예 50 또는 51에 있어서, 상기 막 단백질은 특정 구체예 4 내지 38 중 어느 한 구체예에 정의된 막 단백질들의 그룹으로부터 선택되는 것인 숙주 세포.
53. 특정 구체예 50 또는 51에 있어서, 상기 포터 막 단백질은 서열번호: 02의 대장균 K12 MG1655 유래의 MdfA, 서열번호: 06의 대장균 K12 MG1655 유래의 IceT, 서열번호: 04의 대장균 K12 MG1655 유래의 YnfM, 서열번호: 08의 대장균 K12 MG1655 유래의 Yhhs, 서열번호: 10의 대장균 K12 MG1655 유래의 EmrD, 서열번호: 12의 대장균 K12 MG1655 유래의 YdhC, 서열번호: 14의 대장균 K12 MG1655 유래의 YbdA, 서열번호: 16의 대장균 K12 MG1655 유래의 YdeE, 서열번호: 18의 대장균 K12 MG1655 유래의 MhpT, 서열번호: 20의 대장균 K12 MG1655 유래의 YebQ, 서열번호: 22의 대장균 K12 MG1655 유래의 YjhB, 서열번호: 24의 대장균 K12 MG1655 유래의 Bcr, 서열번호: 26의 대장균 K12 MG1655 유래의 FucP, 서열번호: 32의 대장균 K12 MG1655 유래의 WzxE, 서열번호: 38의 대장균 K12 MG1655 유래의 EmrE, 서열번호: 40의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2331, 서열번호: 42의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2332, 서열번호: 46의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0247, 서열번호: 48의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0245, 서열번호: 50의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0345, 서열번호: 52의 뉴로스포라 크라사 OR74A 유래의 CDT2, 서열번호: 54의 아스페르길루스 오리제 RIB40 유래의 CDT2, 서열번호: 58의 키티노파가 종 CF118 유래의 Wzx, 서열번호: 60의 유박테리움 종 CAG:581 유래의 Wzx, 서열번호: 62의 디아도박터 솔리 (DSM 25329) 유래의 Wzx, 서열번호: 64의 락토코커스 라피노락티스 (ATCC 43920) 유래의 Wzx, 서열번호: 66의 프레보텔라 루미니콜라 (AR32) 유래의 Wzx, 서열번호: 86의 브라키스피라 함프소니이 P280/1 유래의 NAPO, 서열번호: 98의 악티노바쿨룸 수이스 (DSM 20639) 유래의 NAm, 서열번호: 100의 루미노코커스 그나부스 유래의 NAm, 서열번호: 102의 쿠르토박테리움 종 314Chir4.1 유래의 NAm, 서열번호: 104의 니아벨라 드릴라시스 (DSM25811) 유래의 Nap, 서열번호: 106의 사카리크리니스 퍼멘탄스 (DSM 9555) 유래의 Nap, 서열번호: 108의 시트로박터 프레운디이 MGH152 유래의 mdtD, 서열번호: 110의 시트로박터 웨르크마니이 NBRC 105721 유래의 mdtD, 서열번호: 112의 시트로박터 아말로나티쿠스 유래의 mdtD, 서열번호: 114의 클레브시엘라 옥시토카 유래의 mdtD, 서열번호: 116의 에스케리치아 알베르티이 B156 유래의 mdtD, 서열번호: 118의 살모넬라 엔테리카 아종 살라메 유래의 yegB, 서열번호: 120의 클레브시엘라 뉴모니에 30684/NJST258_2 유래의 mdtD, 서열번호: 122의 클레브시엘라 뉴모니에 유래의 Tcr_1_D38215, 서열번호: 124의 슈도시트로박터 페칼리스 유래의 mdtD, 서열번호: 126의 요케넬라 레겐스버게이 (ATCC43003) 유래의 Cmr, 서열번호: 128의 크로노박터 무이트젠시이 유래의 MdfA, 서열번호: 130의 클레브시엘라 옥시토카 유래의 MdfA, 서열번호: 132의 시트로박터 코세리 유래의 MFS, 서열번호: 134의 에스케리치아 마르모테 유래의 MdfA, 서열번호: 136의 시겔라 플렉스네리 유래의 Cmr, 서열번호: 138의 살모넬라 엔테리카 아종 살라메 유래의 MdfA, 서열번호: 140의 시트로박터 윤게 (ATCC 29220) 유래의 Cmr, 서열번호: 142의 시트로박터 프레운디이 유래의 MdfA, 서열번호: 144의 엔테로박터 코베이 유래의 MdfA, 서열번호: 146의 엔테로박터 종 유래의 MdfA, 서열번호: 148의 렐리오티아 종 WB101 유래의 MdfA, 서열번호: 150의 엔테로박터 루드위기이 EcWSU1 유래의 MdfA, 서열번호: 152의 악티노플라네스 우타헨시스 유래의 Sweet-유사 단백질, 서열번호: 154의 키티노파가세에 박테리움 PMG_246 유래의 Sweet-유사 단백질, 서열번호: 156의 리조비움 종 PDC82 유래의 Sweet-유사 단백질, 서열번호: 158의 키네오코커스 리조스파에레 (DSM 19711) 유래의 Sweet-유사 단백질, 서열번호: 160의 모르가넬라 모르가니이 IS15 유래의 Sweet-유사 단백질, 서열번호: 162의 게오데르마토필루스 오브스쿠러스 (균주 ATCC 25078) 유래의 Sweet-유사 단백질, 서열번호: 164의 브라디리조비움 종 BTAi1 유래의 Sweet-유사 단백질, 서열번호: 166의 브라디리조비움 자포니쿰 USDA 110 유래의 Sweet-유사 단백질, 서열번호: 168의 크산토모나스 캄페스트리스 pv. 베시카토리아 균주 85-10 유래의 Sweet-유사 단백질, 서열번호: 170의 헤르바스피릴룸 아쿠아티쿰 유래의 Sweet-유사 단백질, 서열번호: 172의 플라보박테리아 박테리움 MS024-2A 유래의 Sweet-유사 단백질, 서열번호: 182의 시노리조비움 메디케 WSM419 유래의 rnd-유사 단백질, 서열번호: 184의 아조스피릴룸 브라실리엔세 LMG 04375 유래의 아라비노스 유출물, 또는 상기 포터 막 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 02, 06, 04, 08, 10, 12, 14, 16, 18, 20, 22, 24, 26, 32, 38, 40, 42, 46, 48, 50, 52, 54, 58, 60, 62, 64, 66, 86, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164, 166, 168, 170, 172, 182 또는 184 각각의 상기 MdfA, IceT, YnfM, Yhhs, EmrD, YdhC, YbdA, YdeE, MhpT, YebQ, YjhB, Bcr, FucP, WzxE, EmrE, Wzx, Blon_2331, Blon_2232, Blon_0247, Blon_0245, Blon_0345, NAPO, NAm, Nap, mdtD, YegB, Tcr_1_D38215, cmr, MFS, CDT2, rnd, Sweet-유사 또는 아라비노스 유출물 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질로부터 선택되는 것인 푸코실락토스 생성을 위해 유전자 변형된 숙주 세포.
54. 특정 구체예 50 또는 51에 있어서, 상기 P-P-결합-가수분해-유도 수송체는 서열번호: 28의 락토코커스 락티스 균주 SRCM103457 유래의 LmrA, 서열번호: 30의 대장균 균주 K12 MG1655 유래의 OppF, 서열번호: 36의 헬리코박터 필로리 (균주 ATCC 700392 / 26695) 유래의 Wzk, 서열번호: 44의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2475, 서열번호: 68 또는 72의 플라보박테리움 스파르탄시이 유래의 LpsE, 서열번호: 70 또는 74의 스포로무사 스파에로이데스 DSM 2875 유래의 LpsE, 서열번호: 76의 칸디다투스 플란크토필라 설포니카 유래의 TolC, 서열번호: 78의 부티리비브리오 훈가테이 XBD2006 유래의 TolC, 서열번호: 80의 로세부리아 인테스티날리스 CAG:13 유래의 MsbA, 서열번호: 82의 페도박터 긴센기솔리 유래의 MsbA, 서열번호: 84의 베루코미크로비아 박테리움 CG1_02_43_26 유래의 MsbA, 서열번호: 174의 리조비움 종 Root149 유래의 Wzm, 서열번호: 176의 아조스피릴룸 브라실리엔세 LMG 04375 유래의 Wzm, 서열번호: 196의 대장균 113303 유래의 Wzm, 서열번호: 178의 리조비움 종 Root149 유래의 Wzt, 서열번호: 180의 아조스피릴룸 브라실리엔세 LMG 04375 유래의 Wzt, 서열번호: 194의 대장균 113303 유래의 Wzt, 서열번호: 188 또는 190의 브라디리조비움 자포니쿰 USDA 110 유래의 Nodj, 서열번호: 206의 대장균 K-12 MG1655 유래의 malE, 서열번호: 208의 대장균 K-12 MG1655 유래의 malK, 서열번호: 214의 대장균 K-12 MG1655 유래의 araF, 서열번호: 216의 대장균 K-12 MG1655 유래의 xylF, 또는 서열번호: 218의 대장균 K-12 MG1655 유래의 ytfQ, 또는 상기 P-P-결합-가수분해-유도 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 28, 30, 36, 44, 68, 72, 70, 74, 76, 78, 80, 82, 84, 174, 176, 196, 178, 180, 194, 188, 190, 206, 208, 214, 216, 또는 218 각각의 상기 LmrA, OppF, Wzk, Blon_2475, LpsE, TolC, MsbA, Wzm, Wzt, Nodj, malE, malK, araF, xylF 또는 ytfQ 막 단백질 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질로부터 선택되는 것인 숙주 세포.
55. 특정 구체예 50 또는 51에 있어서, 상기 추정 수송 단백질은 서열번호: 56의 헬리코박터 필로리 유래의 사이토크롬 C 생합성 단백질, 서열번호: 90의 클로스트리디움 종 CAG: 1013 유래의 CutC, 서열번호: 92의 오도리박터 스플란크니쿠스 DSM 20712 유래의 CutC, 서열번호: 94의 미추아리아 종 PDC51 유래의 CutC, 서열번호: 96의 프레보텔라 인테르메디아 ATCC 25611 (DSM 20706) 유래의 CutC, 서열번호: 190의 대장균 K12 MG1655 유래의 ybjM, 서열번호: 192의 엔테로박테리아세에 박테리움 ENNIH1 유래의 ybjM, 또는 상기 추정 수송 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 56, 90, 92, 94, 96, 190 또는 192 각각의 상기 CytC, CutC 또는 ybjM 막 단백질 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질로부터 선택되는 것인 숙주 세포.
56. 특정 구체예 50 또는 51에 있어서, 상기 β-배럴 포린은 서열번호: 34의 대장균 K12 MG1655 유래의 Wza 또는 서열번호: 204의 대장균 K12 MG1655 유래의 lamB, 또는 상기 Wza 또는 lamB 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 34 또는 204 각각의 상기 Wza 또는 lamB 막 단백질 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 서열로부터 선택되는 것인 숙주 세포.
57. 특정 구체예 50 또는 51에 있어서, 상기 보조 수송 단백질은 서열번호: 88의 서모토가 마리티마 (균주 ATCC 43589 / MSB8 / DSM 3109 / JCM 10099) 유래의 Wzc, 또는 이의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 88의 상기 Wzc 막 단백질에 대해 적어도 80%의 서열 동일성을 갖는 서열로부터 선택되는 것인 숙주 세포.
58. 특정 구체예 50 또는 51에 있어서, 상기 포스포트란스퍼-유도 그룹 전위인자는 서열번호: 210의 대장균 K12 MG1655 유래의 nagE 또는 서열번호: 212의 대장균 K12 MG1655 유래의 srlB, 또는 상기 nagE 또는 srlB 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 210 또는 212 각각의 상기 nagE 또는 srlB 막 단백질 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 서열로부터 선택되는 것인 숙주 세포.
59. 특정 구체예 49 내지 58 중 어느 한 구체예에 있어서, 상기 막 단백질은 세포벽의 외막을 가로질러 화합물의 수송에 관여하는 수송체 단백질인 것인 세포.
60. 특정 구체예 49 내지 59 중 어느 한 구체예에 있어서, 상기 세포가 배지에서 안정하게 배양되는 것인 세포.
61. 특정 구체예 49 내지 60 중 어느 한 구체예에 있어서, 상기 세포는 미생물, 식물 또는 동물 세포로 구성된 그룹으로부터 선택되고, 바람직하게는 상기 미생물은 박테리아, 진균 또는 효모이며, 바람직하게는 상기 식물은 벼, 목화, 유채, 대두, 옥수수 또는 옥수수 식물이고, 바람직하게는 상기 동물은 곤충, 어류, 조류 또는 비-인간 포유동물인 것인 세포.
62. 특정 구체예 61에 있어서, 상기 세포는 대장균 세포인 것인 숙주 세포.
63. 특정 구체예 49 내지 62 중 어느 한 구체예에 있어서, 상기 세포는 푸코실락토스 합성에 관여하고/하거나 이의 합성에 필요한, 적어도 부분적으로 불활성화된, 모노사카라이드, 디사카라이드 또는 올리고사카라이드인, 선택된 모노사카라이드, 디사카라이드 또는 올리고사카라이드에 대한 이화 경로를 포함하는 것인 세포.
64. 특정 구체예 49 내지 63 중 어느 한 구체예에 있어서, 상기 푸코실락토스는 2'-푸코실락토스, 3-푸코실락토스 또는 디푸코실락토스인 것인 세포.
65. 푸코실락토스를 제조하는 방법으로서,
a) 특정 구체예 49 내지 64 중 어느 한 구체예에 따른 세포를 제공하는 단계,
b) 상기 푸코실락토스의 생성을 허용하는 조건 하에 배지에서 상기 세포를 배양하는 단계,
c) 상기 푸코실락토스를 배양으로부터 분리하는 단계를 포함하는 것인 방법.
66. 푸코실락토스의 발효 생성에서 푸코실락토스 수송을 위한, 특정 구체예 1 내지 38 중 어느 한 구체예에 정의된 막 단백질들의 그룹으로부터 선택된 막 단백질의 용도.
67. 푸코실락토스의 제조를 위한, 특정 구체예 49 내지 64 중 어느 한 구체예에 따른 세포의 용도.
68. 특정 구체예 67에 있어서, 상기 푸코실락토스는 2'-푸코실락토스, 3-푸코실락토스 또는 디푸코실락토스인 것인 세포의 용도.
하기 도면 및 실시예는 본 발명의 추가 예시 및 설명을 제공할 것이며, 제한하려는 의도는 아니다.
도 1: TU2에서 서열번호: 58 내지 서열번호: 96 (서열번호: 90 제외), TU3에서 서열번호: 90 또는 TU10에서 서열번호: 02 내지 서열번호: 44의 막 단백질을 발현하고 α1,3-푸코실트란스퍼라제를 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 CPI. 서열번호: 04 내지 서열번호: 34의 막 단백질을 가진 균주는 FT1로부터 3-FL을 생성하는 반면에, 서열번호: 02 및 서열번호: 40 내지 서열번호: 96의 막 단백질들을 가진 균주는 FT2로부터 3-FL을 생성한다. 상기 CPI 데이터는 전체 배양액 샘플 중 3-FL 측정값을 나타낸다. 상기 성장 실험은 3-FL의 전구체로서 20 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 2: TU2에서 서열번호: 58 내지 서열번호: 104 (서열번호: 90 제외), TU3에서 서열번호: 90 또는 TU10에서 서열번호: 02 내지 서열번호: 34의 막 단백질을 발현하고 α1,3-푸코실트란스퍼라제를 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 3-FL 외수송 비율 (export ratio). 서열번호: 08 내지 서열번호: 30의 막 단백질을 가진 균주는 FT1로부터 3-FL을 생성하는 반면에, 서열번호: 58 내지 서열번호: 104의 막 단백질을 가진 균주는 FT2로부터 3-FL을 생성한다. 서열번호: 2의 막 단백질을 가진 균주는 FT1 또는 FT2와 조합하여 테스트되었다. 상기 성장 실험은 3-FL의 전구체로서 20 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 3: TU10에서 서열번호: 08, 14, 18 또는 22의 막 단백질을 발현하고 α1,3-푸코실 트란스퍼라제 FT1을 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 성장 속도. 상기 성장 실험은 3-FL의 전구체로서 20 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 4: TU10에서 서열번호: 28의 막 단백질을 발현하고 α1,3-푸코실 트란스퍼라제 FT1을 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 3-FL 외수송 비율. 상기 성장 실험은 3-FL의 전구체로서 45 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 5: TU10에서 서열번호: 28의 막 단백질을 발현하고 α1,3-푸코실 트란스퍼라제 FT1을 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 CPI. 상기 CPI 데이터는 전체 배양액 샘플 중 3-FL 측정값을 나타낸다. 상기 성장 실험은 3-FL의 전구체로서 90 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 6: TU10에서 서열번호: 10 또는 16의 막 단백질을 발현하고 α1,3-푸코실트란스퍼라제 FT1을 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 3-FL 외수송 비율. 상기 성장 실험은 3-FL의 전구체로서 90 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 7: TU10에서 서열번호: 10, 16 또는 28의 막 단백질을 발현하고 α1,3-푸코실 트란스퍼라제 FT1을 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 CPI. 상기 성장 실험은 3-FL의 전구체로서 100 g/L 수크로스 및 90 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 8: TU10에서 서열번호: 28의 막 단백질을 발현하고 α1,3-푸코실 트란스퍼라제 FT1을 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 성장 속도. 상기 성장 실험은 3-FL의 전구체로서 100 g/L 수크로스 및 90 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 9: TU10에서 서열번호: 22의 막 단백질을 발현하고 α1,3-푸코실 트란스퍼라제 FT1을 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 CPI. 상기 성장 실험은 3-FL의 전구체로서 5 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 10: 숙주 게놈 유래의 TU10에서 서열번호: 02 또는 28의 막 단백질을 발현하고 플라스미드 유래의 α1,3-푸코실 트란스퍼라제인 FT1 또는 FT2를 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 CPI. 이에 의해, 서열번호: 01을 갖는 유전자는 EcLdhA 유전자좌에 통합되었고, 서열번호: 27을 갖는 유전자는 EcSetA 유전자좌에 통합되었다. 상기 성장 실험은 3-FL의 전구체로서 20 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 11: 숙주 게놈 유래의 TU10에서 서열번호: 02 또는 28의 막 단백질을 발현하고 플라스미드 유래의 α1,3-푸코실 트란스퍼라제 FT2를 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 3-FL 외수송 비율. 이에 의해, 서열번호: 01을 갖는 유전자는 EcLdhA 유전자좌에 통합되었고, 서열번호: 27을 갖는 유전자는 EcSetA 유전자좌에 통합되었다. 상기 성장 실험은 3-FL의 전구체로서 20 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 12: 플라스미드 유래의 상이한 전사 유닛 (transcriptional units: TU)의 서열번호: 02, 06, 10, 16, 22, 28, 32, 34, 36, 38, 40, 42, 44 또는 50의 막 단백질을 발현하고, 플라스미드 유래의 α1,3-푸코실 트란스퍼라제 FT2를 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 CPI. 상기 성장 실험은 3-FL의 전구체로서 20 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 13: 플라스미드 유래의 상이한 전사 유닛 (TU)의 서열번호: 02, 06, 10, 16, 22, 28, 32, 34, 36, 38, 40, 42, 44 또는 50의 막 단백질을 발현하고, 플라스미드 유래의 α1,3-푸코실 트란스퍼라제 FT2를 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 3-FL 외수송 비율. 상기 성장 실험은 3-FL의 전구체로서 20 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 14: TU10에서 단일 유전자로 클로닝되거나 또는 이의 네이티브 전사 오페론 구조 함유 2개의 막 단백질 유전자에 클로닝되어 플라스미드에 제시되는, 서열번호 40, 42, 46 또는 48의 막 단백질을 발현하고, 플라스미드 유래의 α1,3-푸코실 트란스퍼라제 FT2를 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 CPI (좌측 패널) 및 3-FL 외수송 비율 (우측 패널). 상기 성장 실험은 3-FL의 전구체로서 20 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 15: 숙주 게놈에서 EcSetA 유전자좌 (서열번호: 28의 막 단백질의 경우) 또는 EcLdhA 유전자좌 (서열번호: 02 및 06의 막 단백질의 경우)에 통합되는, TU10에서 서열번호: 02, 06 또는 28의 막 단백질을 발현하고, 플라스미드 유래의 α1,2-푸코실 트란스퍼라제 FT3을 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 2'FL이 생성된 숙주의 CPI (패널 A) 또는 DiFL이 생성된 숙주의 CPI (패널 B) 및 DiFL 외수송 비율 (패널 C). 상기 성장 실험은 2'-FL 및 DiFL의 전구체로서 20 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 16: 게놈 유래의 서열번호: 02의 막 단백질 및 플라스미드 유래의 α1,3-푸코실 트란스퍼라제 FT2를 과발현하는 3-FL 대장균 생산 숙주를 사용하여 수행된 8개의 독립적인 발효 실행에서 측정된 회분식 (batch) 및 유가식 (fed-batch) 단계에서 향상된 생산성 파라미터. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다. 참조 발효는 막 단백질 유전자의 과발현 카세트가 결여된 동일한 균주로 수행되었다. 발효는 실시예 3에 기재된 바와 같이 수행되었다. CPI, 세포 성능 지수 (g 3-FL/g 바이오매스); br, 전체 배양액; sn, 상등액; Qp, 비생산성 (g 3-FL/g 바이오매스/h); Qs, 비생산성 (g 수크로스/g 바이오매스/h); Ys, 수크로스에 대한 수율 (g 3-FL/g 수크로스); Yx, 바이오매스 수율 (g 바이오매스/g 수크로스); 속도, 생성율 (g 3-FL / L / h); lac_rate, 락토스 전환율 (g 락토스 소비량/h).
도 17: 제1 플라스미드 유래의 서열번호: 06의 막 단백질 및 제2 플라스미드 유래의 α1,3-푸코실 트란스퍼라제 FT2를 과발현하는 3-FL 대장균 생산 숙주를 사용하여 수행된 발효 실행에서 측정된 회분식 및 유가식 단계에서 향상된 생산성 파라미터. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다. 특정 참조 발효는 막 단백질 유전자가 결여된 동일한 균주로 수행되었다. 발효는 실시예 3에 기재된 바와 같이 수행되었다. CPI, 세포 성능 지수 (g 3-FL/g 바이오매스); br, 전체 배양액; sn, 상등액; Ys, 수크로스에 대한 수율 (g 3-FL/g 수크로스); Yx, 바이오매스 수율 (g 바이오매스/g 수크로스).
도 18: 서열번호: 02, 06, 120, 126, 128, 140, 146 또는 150의 막 단백질을 발현하고 플라스미드 유래의 α1,3-푸코실 트란스퍼라제 FT1 (서열번호: 02 및 서열번호: 06의 막 단백질의 경우) 또는 FT2 (다른 막 단백질의 경우)를 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 CPI. 서열번호: 02 및 서열번호: 06의 막 단백질은 TU10에 클로닝되었다. 서열번호: 126의 막 단백질은 TU2에 클로닝되었다. 서열번호: 120, 140 및 150의 막 단백질은 TU3에 클로닝되었다. 서열번호: 128 및 서열번호: 146의 막 단백질은 TU2 (버젼 v1) 또는 TU3 (버젼 v2)에 클로닝되었다. 상기 CPI 데이터는 전체 배양액 샘플 중 3-FL 측정값을 나타낸다. 상기 성장 실험은 3-FL의 전구체로서 20 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 19: TU2에 클로닝된 서열번호: 126 및 서열번호: 128 (버젼 v1), TU3에 클로닝된 서열번호: 128 (버젼 2) 및 TU10에 클로닝된 서열번호: 02의 막 단백질을 발현하고 플라스미드 유래의 α1,3-푸코실 트란스퍼라제 FT1 (서열번호: 02의 막 단백질을 가진 균주의 경우) 또는 FT2 (서열번호: 126 및 128의 막 단백질을 가진 균주의 경우)를 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 3-FL 외수송 비율. 상기 성장 실험은 3-FL의 전구체로서 20 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 20: TU3에서 서열번호: 120 및 140의 막 단백질을 발현하고 플라스미드 유래의 α1,3-푸코실 트란스퍼라제 FT2를 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 성장 속도. 상기 성장 실험은 3-FL의 전구체로서 20 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 21: EcMdfA와 관련된 실시예 20의 MATGAT 표.
도 22: EcIceT와 관련된 실시예 20의 MATGAT 표.
도 23: TU1에 클로닝된 서열번호: 54, TU2에 클로닝된 서열번호: 62, 66, 70, 76, 84, 92, 96, 104, TU3에 클로닝된 서열번호: 58, 64, 72, 74, 94, TU11에 클로닝된 서열번호: 184, 204, 208, TU12에 클로닝된 서열번호: 52, 56, 60, 80, 82, 88, 90, 98의 막 단백질을 발현하고 α1,3-푸코실트란스퍼라제 FT2를 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 CPI. 상기 CPI 데이터는 전체 배양액 샘플 중 3-FL 측정값을 나타낸다. 상기 성장 실험은 3-FL의 전구체로서 20 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 24: TU11에 클로닝된 서열번호: 204 또는 214의 막 단백질을 발현하고 α1,2-푸코실트란스퍼라제 FT4를 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 CPI. 상기 CPI 데이터는 전체 배양액 샘플 중 2'-FL 측정값을 나타낸다. 상기 성장 실험은 2'-FL의 전구체로서 20 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 25: TU11에 클로닝된 서열번호: 206, 208, 214, 216, 218의 막 단백질을 발현하고 α1,2-푸코실트란스퍼라제 FT4를 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 2'-FL 외수송 비율. 상기 성장 실험은 2'-FL의 전구체로서 20 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 2: TU2에서 서열번호: 58 내지 서열번호: 104 (서열번호: 90 제외), TU3에서 서열번호: 90 또는 TU10에서 서열번호: 02 내지 서열번호: 34의 막 단백질을 발현하고 α1,3-푸코실트란스퍼라제를 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 3-FL 외수송 비율 (export ratio). 서열번호: 08 내지 서열번호: 30의 막 단백질을 가진 균주는 FT1로부터 3-FL을 생성하는 반면에, 서열번호: 58 내지 서열번호: 104의 막 단백질을 가진 균주는 FT2로부터 3-FL을 생성한다. 서열번호: 2의 막 단백질을 가진 균주는 FT1 또는 FT2와 조합하여 테스트되었다. 상기 성장 실험은 3-FL의 전구체로서 20 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 3: TU10에서 서열번호: 08, 14, 18 또는 22의 막 단백질을 발현하고 α1,3-푸코실 트란스퍼라제 FT1을 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 성장 속도. 상기 성장 실험은 3-FL의 전구체로서 20 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 4: TU10에서 서열번호: 28의 막 단백질을 발현하고 α1,3-푸코실 트란스퍼라제 FT1을 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 3-FL 외수송 비율. 상기 성장 실험은 3-FL의 전구체로서 45 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 5: TU10에서 서열번호: 28의 막 단백질을 발현하고 α1,3-푸코실 트란스퍼라제 FT1을 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 CPI. 상기 CPI 데이터는 전체 배양액 샘플 중 3-FL 측정값을 나타낸다. 상기 성장 실험은 3-FL의 전구체로서 90 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 6: TU10에서 서열번호: 10 또는 16의 막 단백질을 발현하고 α1,3-푸코실트란스퍼라제 FT1을 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 3-FL 외수송 비율. 상기 성장 실험은 3-FL의 전구체로서 90 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 7: TU10에서 서열번호: 10, 16 또는 28의 막 단백질을 발현하고 α1,3-푸코실 트란스퍼라제 FT1을 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 CPI. 상기 성장 실험은 3-FL의 전구체로서 100 g/L 수크로스 및 90 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 8: TU10에서 서열번호: 28의 막 단백질을 발현하고 α1,3-푸코실 트란스퍼라제 FT1을 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 성장 속도. 상기 성장 실험은 3-FL의 전구체로서 100 g/L 수크로스 및 90 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 9: TU10에서 서열번호: 22의 막 단백질을 발현하고 α1,3-푸코실 트란스퍼라제 FT1을 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 CPI. 상기 성장 실험은 3-FL의 전구체로서 5 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 10: 숙주 게놈 유래의 TU10에서 서열번호: 02 또는 28의 막 단백질을 발현하고 플라스미드 유래의 α1,3-푸코실 트란스퍼라제인 FT1 또는 FT2를 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 CPI. 이에 의해, 서열번호: 01을 갖는 유전자는 EcLdhA 유전자좌에 통합되었고, 서열번호: 27을 갖는 유전자는 EcSetA 유전자좌에 통합되었다. 상기 성장 실험은 3-FL의 전구체로서 20 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 11: 숙주 게놈 유래의 TU10에서 서열번호: 02 또는 28의 막 단백질을 발현하고 플라스미드 유래의 α1,3-푸코실 트란스퍼라제 FT2를 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 3-FL 외수송 비율. 이에 의해, 서열번호: 01을 갖는 유전자는 EcLdhA 유전자좌에 통합되었고, 서열번호: 27을 갖는 유전자는 EcSetA 유전자좌에 통합되었다. 상기 성장 실험은 3-FL의 전구체로서 20 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 12: 플라스미드 유래의 상이한 전사 유닛 (transcriptional units: TU)의 서열번호: 02, 06, 10, 16, 22, 28, 32, 34, 36, 38, 40, 42, 44 또는 50의 막 단백질을 발현하고, 플라스미드 유래의 α1,3-푸코실 트란스퍼라제 FT2를 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 CPI. 상기 성장 실험은 3-FL의 전구체로서 20 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 13: 플라스미드 유래의 상이한 전사 유닛 (TU)의 서열번호: 02, 06, 10, 16, 22, 28, 32, 34, 36, 38, 40, 42, 44 또는 50의 막 단백질을 발현하고, 플라스미드 유래의 α1,3-푸코실 트란스퍼라제 FT2를 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 3-FL 외수송 비율. 상기 성장 실험은 3-FL의 전구체로서 20 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 14: TU10에서 단일 유전자로 클로닝되거나 또는 이의 네이티브 전사 오페론 구조 함유 2개의 막 단백질 유전자에 클로닝되어 플라스미드에 제시되는, 서열번호 40, 42, 46 또는 48의 막 단백질을 발현하고, 플라스미드 유래의 α1,3-푸코실 트란스퍼라제 FT2를 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 CPI (좌측 패널) 및 3-FL 외수송 비율 (우측 패널). 상기 성장 실험은 3-FL의 전구체로서 20 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 15: 숙주 게놈에서 EcSetA 유전자좌 (서열번호: 28의 막 단백질의 경우) 또는 EcLdhA 유전자좌 (서열번호: 02 및 06의 막 단백질의 경우)에 통합되는, TU10에서 서열번호: 02, 06 또는 28의 막 단백질을 발현하고, 플라스미드 유래의 α1,2-푸코실 트란스퍼라제 FT3을 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 2'FL이 생성된 숙주의 CPI (패널 A) 또는 DiFL이 생성된 숙주의 CPI (패널 B) 및 DiFL 외수송 비율 (패널 C). 상기 성장 실험은 2'-FL 및 DiFL의 전구체로서 20 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 16: 게놈 유래의 서열번호: 02의 막 단백질 및 플라스미드 유래의 α1,3-푸코실 트란스퍼라제 FT2를 과발현하는 3-FL 대장균 생산 숙주를 사용하여 수행된 8개의 독립적인 발효 실행에서 측정된 회분식 (batch) 및 유가식 (fed-batch) 단계에서 향상된 생산성 파라미터. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다. 참조 발효는 막 단백질 유전자의 과발현 카세트가 결여된 동일한 균주로 수행되었다. 발효는 실시예 3에 기재된 바와 같이 수행되었다. CPI, 세포 성능 지수 (g 3-FL/g 바이오매스); br, 전체 배양액; sn, 상등액; Qp, 비생산성 (g 3-FL/g 바이오매스/h); Qs, 비생산성 (g 수크로스/g 바이오매스/h); Ys, 수크로스에 대한 수율 (g 3-FL/g 수크로스); Yx, 바이오매스 수율 (g 바이오매스/g 수크로스); 속도, 생성율 (g 3-FL / L / h); lac_rate, 락토스 전환율 (g 락토스 소비량/h).
도 17: 제1 플라스미드 유래의 서열번호: 06의 막 단백질 및 제2 플라스미드 유래의 α1,3-푸코실 트란스퍼라제 FT2를 과발현하는 3-FL 대장균 생산 숙주를 사용하여 수행된 발효 실행에서 측정된 회분식 및 유가식 단계에서 향상된 생산성 파라미터. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다. 특정 참조 발효는 막 단백질 유전자가 결여된 동일한 균주로 수행되었다. 발효는 실시예 3에 기재된 바와 같이 수행되었다. CPI, 세포 성능 지수 (g 3-FL/g 바이오매스); br, 전체 배양액; sn, 상등액; Ys, 수크로스에 대한 수율 (g 3-FL/g 수크로스); Yx, 바이오매스 수율 (g 바이오매스/g 수크로스).
도 18: 서열번호: 02, 06, 120, 126, 128, 140, 146 또는 150의 막 단백질을 발현하고 플라스미드 유래의 α1,3-푸코실 트란스퍼라제 FT1 (서열번호: 02 및 서열번호: 06의 막 단백질의 경우) 또는 FT2 (다른 막 단백질의 경우)를 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 CPI. 서열번호: 02 및 서열번호: 06의 막 단백질은 TU10에 클로닝되었다. 서열번호: 126의 막 단백질은 TU2에 클로닝되었다. 서열번호: 120, 140 및 150의 막 단백질은 TU3에 클로닝되었다. 서열번호: 128 및 서열번호: 146의 막 단백질은 TU2 (버젼 v1) 또는 TU3 (버젼 v2)에 클로닝되었다. 상기 CPI 데이터는 전체 배양액 샘플 중 3-FL 측정값을 나타낸다. 상기 성장 실험은 3-FL의 전구체로서 20 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 19: TU2에 클로닝된 서열번호: 126 및 서열번호: 128 (버젼 v1), TU3에 클로닝된 서열번호: 128 (버젼 2) 및 TU10에 클로닝된 서열번호: 02의 막 단백질을 발현하고 플라스미드 유래의 α1,3-푸코실 트란스퍼라제 FT1 (서열번호: 02의 막 단백질을 가진 균주의 경우) 또는 FT2 (서열번호: 126 및 128의 막 단백질을 가진 균주의 경우)를 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 3-FL 외수송 비율. 상기 성장 실험은 3-FL의 전구체로서 20 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 20: TU3에서 서열번호: 120 및 140의 막 단백질을 발현하고 플라스미드 유래의 α1,3-푸코실 트란스퍼라제 FT2를 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 성장 속도. 상기 성장 실험은 3-FL의 전구체로서 20 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 21: EcMdfA와 관련된 실시예 20의 MATGAT 표.
도 22: EcIceT와 관련된 실시예 20의 MATGAT 표.
도 23: TU1에 클로닝된 서열번호: 54, TU2에 클로닝된 서열번호: 62, 66, 70, 76, 84, 92, 96, 104, TU3에 클로닝된 서열번호: 58, 64, 72, 74, 94, TU11에 클로닝된 서열번호: 184, 204, 208, TU12에 클로닝된 서열번호: 52, 56, 60, 80, 82, 88, 90, 98의 막 단백질을 발현하고 α1,3-푸코실트란스퍼라제 FT2를 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 CPI. 상기 CPI 데이터는 전체 배양액 샘플 중 3-FL 측정값을 나타낸다. 상기 성장 실험은 3-FL의 전구체로서 20 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 24: TU11에 클로닝된 서열번호: 204 또는 214의 막 단백질을 발현하고 α1,2-푸코실트란스퍼라제 FT4를 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 CPI. 상기 CPI 데이터는 전체 배양액 샘플 중 2'-FL 측정값을 나타낸다. 상기 성장 실험은 2'-FL의 전구체로서 20 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
도 25: TU11에 클로닝된 서열번호: 206, 208, 214, 216, 218의 막 단백질을 발현하고 α1,2-푸코실트란스퍼라제 FT4를 발현하는 균주를 사용한 성장 실험에서 수득된 상대 퍼센트 (%)의 2'-FL 외수송 비율. 상기 성장 실험은 2'-FL의 전구체로서 20 g/L 락토스가 보충된 최소 배지에서 수행되었다. 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다.
실시예
실시예 1: 막 단백질 패밀리의 확인
HMM은 프로파일 히든 Markov 모델 (profile hidden Markov model)이라고 하는 확률 모델이다. 이는 정렬된 단백질 세트를 위치-특이적 스코어링 시스템으로 특성화한다. 아미노산은 발생 빈도에 따라 서열 정렬의 각 위치에 스코어가 부여된다 (Eddy, S.R.1998. Profile hidden Markov models. Bioinformatics. 14: 755-63). HMM은 Pfam, InterPro, SMART, TIGRFAM, PIRSF, PANTHER, SFLD, Superfamily 및 Gene3D를 포함하여, 이러한 단백질 분류 방법을 사용하는 수많은 데이터베이스로부터 알 수 있는 바와 같이, 광범위한 유용성을 가지고 있다.
2019년 6월 13일자로 공개된 HMMER 패키지 3.2.1 (http://hmmer.org/)의 HMMsearch는 이러한 HMM을 사용하여 서열 상동체에 대한 서열 데이터베이스를 검색할 수 있다. 사용될 수 있는 서열 데이터베이스는 예를 들어 NCBI nr Protein Database (NR; https://www.ncbi.nlm.nih.gov/protein), UniProt Knowledgebase (UniProtKB, https://www.uniprot.org/help/uniprotkb) 및 SWISS-PROT database (https://web.expasy.org/docs/swiss-prot_guideline.html)가 있으며 이에 한정되지 않는다.
막 단백질 패밀리는 2017년 11월 3일자로 공개된 eggNOG 데이터베이스 1.0.2 (https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6324079/; http://eggnog.embl.de/#/app/home), 2019년 6월 17일자로 공개된 TCDB 데이터베이스 (http://www.tcdb.org/public/tcdb), 2019년 7월 4일자로 공개된 InterPro 75.0 (https://www.ebi.ac.uk/interpro/) 및 2018년 9월 공개된 Pfam 32.0을 사용하는 PFAM 도메인 (https://pfam.xfam.org/)에 기반하여 분류되었다. 상기 eggNOG 데이터베이스는 오르톨로지 관계, 유전자 진화 이력 및 기능 주석을 갖는 공개 데이터베이스이다. TCDB (Transporter Classification DataBase)는 효소 분류를 위한 EC (Enzyme Commission) 시스템과 유사하며, 기능 및 계통 발생 정보를 모두 포함한다. Pfam 및 InterPro 데이터베이스는 단백질 패밀리의 대규모 컬렉션이다. 다른 단백질 도메인 예컨대 SMART (http://smart.embl-heidelberg.de/), TIGRFAM (https://www.jcvi.org/tigrfams), PIRSF (https://proteininformationresource.org/pirwww/dbinfo/pirsf.shtml), PANTHER (http://pantherdb.org/), SFLD (http://sfld.rbvi.ucsf.edu/archive/django/index.html), Superfamily (http://supfam.org/) 및 Gene3D (http://gene3d.biochem.ucl.ac.uk/Gene3D/), NCBI Conserved Domains (https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)가 또한 사용될 수 있다.
eggNOG 패밀리의 확인은 2017년 11월 3일자로 공개된 eggnogdb 1.0.2를 기반으로 하는 eggNOG-mapper의 독립 버젼 (https://github.com/eggnogdb/eggnog-mapper)을 사용하여 수행하였다. 각 eggNOG 패밀리에 대해, HMM은 eggNOG 웹사이트에서 다운로드할 수 있으며, 단백질 데이터베이스에 대한 HMMsearch에 사용할 수 있다.
TCDB 패밀리의 확인은 2019년 6월 17일자로 공개된 TCDB 데이터베이스에 블라스팅 (blastp)하여 수행하였다. 수득한 패밀리의 새로운 멤버는 웹사이트 (http://www.tcdb.org/download.php)에서 검색할 수 있다. Fasta 파일은 단백질 데이터베이스에 대한 blastp에서 입력으로 사용될 수 있다.
PFAM 도메인의 확인은 2018년 9월에 공개된 https://pfam.xfam.org/search#tabview=tab1에서 온라인 검색을 통해 수행하였다. 수득한 패밀리에 대한 HMM은 'Curation & model'에서 다운로드하였다. 이 모델을 사용하여 단백질 데이터베이스에 대한 HMMsearches는 새로운 패밀리 멤버를 확인할 것이다. InterPro 히트 (hit)를 포함하는 서열은 PFAM 웹사이트로부터 다운로드할 수 있다.
InterPro (super)패밀리, 도메인 및 사이트의 확인은 https://www.ebi.ac.uk/interpro/ 또는 InterProScan의 독립 버젼 (https://www.ebi.ac.uk/interpro/download.html)의 온라인 툴을 사용하여 수행하였고, 이들은 모두 2019년 7월 4일자로 공개된 InterPro 75.0을 기반으로 한다. InterPro는 단백질 모티프 및 도메인의 많은 데이터베이스의 정보를 조합한 복합 데이터베이스이다. InterPro 도메인 및/또는 (수퍼)패밀리의 HMM은 InterProScan으로부터 수득할 수 있고, 단백질 데이터베이스에서 새로운 패밀리 멤버를 확인하는데 사용할 수 있다. InterPro 히트를 포함하는 서열은 또한 InterPro 웹사이트 ('Protein Matched')로부터 다운로드하거나, 또는 UniProt 웹사이트 (https://www.uniprot.org)에서 쿼리를 수행할 수 있다.
실시예 2: 본 발명의 방법에 유용한 막 단백질 또는 단백질 서열의 확인
실시예 1에 예시된 바와 같이, 푸코실트란스퍼라제 인근에서 발견되는 막 단백질의 PFAM 도메인을 확인하고, 확인된 PFAM 도메인들 중 어느 하나를 갖는 막 단백질을 선택함으로써, 막 단백질 또는 단백질 서열의 제1 세트를 발견하였다. 푸코실트란스퍼라제 패밀리 IPR001053 (GT10) 및 IPR002516 (GT11)에 속하는 단백질 식별자는 2019년 7월 4일자로 공개된 InterPro 75.0에 의해 정의되는, UniProtKB/trembl로부터 추출되었다. 이러한 식별자는 2019년 6월 19일자로 공개된 게놈 인근 툴 (genome neighborhood tool) https://efi.igb.illinois.edu/efi-gnt/에서 입력으로 사용되었다. EFI-GNT (EFI Genome Neighborhood Tool)를 사용하여 게놈 인근을 탐색할 수 있으며, 단백질 패밀리 및 슈퍼패밀리를 게놈 컨텍스트에 배치하는데 중점을 두었다. SSN (sequence similarity network)이 입력으로 사용된다. SSN내 각 서열은 이의 게놈 인근의 질의에 대한 쿼리로 사용된다. EFI-GNT는 기능 배정을 용이하게 하기 위해 SSN 클러스터에서 서열에 대한 게놈 인근 탐색을 가능하게 한다.
인근 윈도우 크기 (neighborhood window size) 14가 선택되었다. 인근 유전자는 PFAM 도메인에 기반하여 분류되었다. 하기 PFAM 도메인을 가진 막 단백질은 GT10 (IPR001503) 및 GT11 (IPR002516) 푸코실트란스퍼라제 인근에 존재한다: PF00005, PF00006, PF00023, PF00083, PF00092, PF00115, PF00116, PF00122, PF00209, PF00213, PF00230, PF00231, PF00254, PF00359, PF00375, PF00381, PF00391, PF00401, PF00403, PF00474, PF00484, PF00520, PF00528, PF00529, PF00543, PF00571, PF00593, PF00625, PF00654, PF00664, PF00689, PF00690, PF00702, PF00860, PF00873, PF00892, PF00893, PF00902, PF00909, PF00916, PF00939, PF00999, PF01032, PF01061, PF01103, PF01203, PF01235, PF01384, PF01496, PF01544, PF01547, PF01554, PF01566, PF01578, PF01614, PF01618, PF01656, PF01699, PF01740, PF01741, PF01758, PF01810, PF01813, PF01891, PF01895, PF01899, PF01943, PF02026, PF02080, PF02133, PF02136, PF02225, PF02254, PF02277, PF02302, PF02321, PF02355, PF02378, PF02386, PF02417, PF02447, PF02501, PF02563, PF02632, PF02652, PF02653, PF02690, PF02706, PF02874, PF02896, PF03030, PF03083, PF03186, PF03222, PF03412, PF03459, PF03471, PF03544, PF03547, PF03548, PF03567, PF03605, PF03606, PF03610, PF03616, PF03814, PF03840, PF03865, PF03932, PF04193, PF04277, PF04389, PF04966, PF05134, PF05140, PF05524, PF05552, PF05977, PF06251, PF06826, PF06835, PF07264, PF07549, PF07660, PF07670, PF07685, PF07690, PF07715, PF07885, PF07969, PF08239, PF08279, PF08334, PF08352, PF08402, PF08479, PF10531, PF11356, PF11612, PF12156, PF12399, PF12796, PF12822, PF12848, PF12974, PF13306, PF13347, PF13409, PF13410, PF13416, PF13417, PF13440, PF13442, PF13462, PF13466, PF13473, PF13499, PF13505, PF13520, PF13531, PF13599, PF13609, PF13637, PF13807, PF13855, PF14524, PF14667, PF16327, PF17912 및 PF18412.
실시예 3: 재료 및 방법 대장균
배지
LB (Luria Broth) 배지는 1% 트립톤 펩톤 (Difco, Erembodegem, Belgium), 0.5% 효모 추출물 (Difco) 및 0.5% 염화나트륨 (VWR. Leuven, Belgium)으로 구성되었다. 96-웰 플레이트 또는 진탕 플라스크 배양 실험에 사용된 최소 배지는 2.00 g/L NH4Cl, 5.00 g/L (NH4)2SO4, 2.993 g/L KH2PO4, 7.315 g/L K2HPO4, 8.372 g/L MOPS, 0.5 g/L NaCl, 0.5 g/L MgSO4.7H2O, 30 g/L 수크로스 또는 실시예에서 특정되는 경우 다른 탄소원, 1 ml/L 비타민 용액, 100 μL/L 몰리브데이트 용액, 및 1 mL/L 셀레늄 용액을 함유하였다. 각 실시예에서 특정되는 바와 같이, 20 또는 45 g/L 락토스를 전구체로서 상기 배지에 추가로 부가하였다. 상기 배지는 1M KOH로 pH 7로 설정하였다. 비타민 용액은 3.6 g/L FeCl2.4H2O, 5 g/L CaCl2.2H2O, 1.3 g/L MnCl2.2H2O, 0.38 g/L CuCl2.2H2O, 0.5 g/L CoCl2.6H2O, 0.94 g/L ZnCl2, 0.0311 g/L H3BO4, 0.4 g/L Na2EDTA.2H2O 및 1.01 g/L 티아민.HCl로 구성되었다. 상기 몰리브데이트 용액은 0.967 g/L NaMoO4.2H2O를 함유하였다. 상기 셀레늄 용액은 42 g/L SeO2를 함유하였다.
발효를 위한 최소 배지에는 상기에 기재된 바와 같은 동일한 조성으로, 6.75 g/L NH4Cl, 1.25 g/L (NH4)2SO4, 2.93 g/L KH2PO4 및 7.31 g/L KH2PO4, 0.5 g/L NaCl, 0.5 g/L MgSO4.7H2O, 30 g/L 수크로스, 1 mL/L 비타민 용액, 100 μL/L 몰리브데이트 용액, 및 1 mL/L 셀레늄 용액을 함유하였다. 각 실시예에서 특정되는 바와 같이, 20 g/L 락토스를 전구체로서 상기 배지에 추가로 부가하였다.
복합 배지는 오토클레이브 (121℃, 21')로 멸균하였고, 최소 배지는 여과 (0.22 μm Sartorius)로 멸균하였다. 필요한 경우, 항생제 (예: 클로람페니콜 (20 mg/L), 카르베니실린 (100 mg/L), 스펙티노마이신 (40 mg/L) 및/또는 카나마이신 (50 mg/L))를 부가하여 상기 배지를 선택적으로 만들었다.
플라스미드
pKD46 (Red helper plasmid, 암피실린 저항성), pKD3 (FRT-플랭킹된 클로람페니콜 저항성 (cat) 유전자 함유), pKD4 (FRT-플랭킹된 카나마이신 저항성 (kan) 유전자 함유), 및 pCP20 (FLP 재조합효소 활성 발현) 플라스미드는 R. Cunin 교수 (Vrije Universiteit Brussel, Belgium in 2007)로부터 입수하였다.
막 단백질 및 푸코실트란스퍼라제 발현을 위한 플라스미드는 Golden Gate assembly를 사용하여 각각 백본 벡터를 포함하는 pSC101 ori (Rep10-v3) 및 pMB1 ori에서 구축되었다. 모든 막 단백질 및 푸코실트란스퍼라제 코딩 유전자는 Twist Biosciences (San Francisco, USA)에서 합성으로 합성되었다. 막 단백질의 폴리뉴클레오티드 서열 및 상응하는 막 단백질 폴리펩티드는 서열번호: 1 내지 196 및 서열번호: 204 내지 218에 제시되었고, 표 1에 기재되어 있다. 첨부된 실시예에 사용된 푸코실트란스퍼라제는 각각 서열번호: 197 및 198의 핵산 및 단백질 서열을 갖는 3-푸코실트란스퍼라제 FT1, 및 서열번호: 199 및 200을 갖는 FT2이다. 사용된 2-푸코실트란스퍼라제는 본원에서 FT3으로 지칭되는 서열번호: 201 및 202를 갖는 HpFutC, 및 서열번호: 219 및 220의 핵산 및 단백질 서열을 갖는 FT4이다. 막 단백질 및 푸코실트란스퍼라제 유전자는 표 2에 나열된 특정 프로모터, UTR 및 종결인자 조합을 사용하여 상이한 전사 유닛 (TU)으로 발현되었다. 상기 유전자는 프로모터 MutalikP5 (PROM0005_MutalikP5"), MutalikP12 (PROM0012_MutalikP12"), apFAB146 ("PROM0032") 및 MutalikP10 ("PROM0010_MutalikP10") (Mutalik 등에 의해 기재된 바와 같음 (Nat. Methods 2013, No. 10, 354-360)) 및 프로모터 p22 (PROM0015_p22) 및 p14 (PROM0016_p14) (모두는 De Mey 등에 의해 기재된 바와 같음 (BMC Biotechnology 2007, 7:34))를 사용하여 발현되었다. 사용된 UTR은 Gene10-LeuAB-BCD2 ("UTR0002_Gene10-LeuAB-BCD2"), BCD1 ("UTR003_BCD1"), Gene10_LeuL ("UTR0011_Gene10_LeuL"), ThrA_BCD2 ("UTR0013_ThrA_BCD2"), GalE_LeuAB ("UTR0014_GalE_LeuAB"), GalE_lptFG ("UTR0038_GalE_IptFG") 및 uspF_iptFG ("UTR0055_uspF_iptFG") (Mutalik 등에 의해 기재된 바와 같음 (Nat. Methods 2013, No. 10, 354-360))를 포함한다. 실시예에 사용된 종결인자는 Dunn 등에 기재된 바와 같은 TER0010_T7 Early이다 (Nucleic Acids Res. 1980, 8(10), 2119-32). 표 3은 상기 프로모터 UTR 및 종결인자의 조합에 의한 실시예에서 사용된 전사 유닛의 개요를 나타낸다. 발현 숙주의 코돈 사용에 대해 코돈 사용을 최적화함으로써 발현이 더욱 촉진될 수 있다. 유전자는 공급자의 툴을 사용하여 최적화되었다.
서열번호 (단백질) |
명칭 /
TCDB 그룹 |
유기체 | 기원 | 디지털 서열 정보의 기원 국가 |
2 | EcMdfA | 대장균 K12 MG1655 | 합성 | 미국 |
4 | EcYnfM | 대장균 K12 MG1655 | 합성 | 미국 |
6 | EcIceT | 대장균 K12 MG1655 | 합성 | 미국 |
8 | EcYhhs | 대장균 K12 MG1655 | 합성 | 미국 |
10 | EcEmrD | 대장균 K12 MG1655 | 합성 | 미국 |
12 | EcYdhC | 대장균 K12 MG1655 | 합성 | 미국 |
14 | EcYbdA | 대장균 K12 MG1655 | 합성 | 미국 |
16 | EcYdeE | 대장균 K12 MG1655 | 합성 | 미국 |
18 | EcMhpT | 대장균 K12 MG1655 | 합성 | 미국 |
20 | EcYebQ | 대장균 K12 MG1655 | 합성 | 미국 |
22 | EcYjhB | 대장균 K12 MG1655 | 합성 | 미국 |
24 | EcBcr | 대장균 K12 MG1655 | 합성 | 미국 |
26 | EcFucP | 대장균 K12 MG1655 | 합성 | 미국 |
28 | LllmrA | 락토코커스 락티스 균주 SRCM103457 | 합성 | 대한민국 |
30 | EcOppF | 대장균 균주 K12 (MG1655) | 합성 | 미국 |
32 | EcWzxE | 대장균 균주 K12 (MG1655) | 합성 | 미국 |
34 | EcWza | 대장균 균주 K12 (MG1655) | 합성 | 미국 |
36 | HpWzk | 헬리코박터 필로리 균주 ATCC 700392 / 26695 | 합성 | 영국 |
38 | EcEmrE | 대장균 균주 K12 | 합성 | 미국 |
40 | Blon_2331 | B. 론검 아종 인판티스 (균주 ATCC 15697) | 합성 | 독일 |
42 | Blon_2332 | B. 론검 아종 인판티스 (균주 ATCC 15697) | 합성 | 독일 |
44 | Blon_2475 | B. 론검 아종 인판티스 (균주 ATCC 15697) | 합성 | 독일 |
46 | Blon_0247 | B. 론검 아종 인판티스 (균주 ATCC 15697) | 합성 | 독일 |
48 | Blon_0245 | B. 론검 아종 인판티스 (균주 ATCC 15697) | 합성 | 독일 |
50 | Blon_0345 | B. 론검 아종 인판티스 (균주 ATCC 15697) | 합성 | 독일 |
52 | NcCDT2 | 뉴로스포라 크라사 OR74A | 합성 | 미국 |
54 | AoCDT2 | 아스페르길루스 오리제 RIB40 | 합성 | 일본 |
56 | HpCytC | 헬리코박터 필로리 (캄필로박터 필로리 (Campylobacter pylori)) | 합성 |
영국 |
58 | ChWzx | 키티노파가 종 CF118 | 합성 | 미국 |
60 | EuWzx | 유박테리움 종 CAG:581 | 합성 | 덴마크 |
62 | DsWzx | 디아도박터 솔리 DSM 25329 contig Ga0069981_102 | 합성 | 대한민국 |
64 | LrWzx | 락토코커스 라피노락티스 (ATCC 43920) | 합성 | 알려지지 않음 |
66 | PrWzx | 프레보텔라 루미니콜라 (AR32) | 합성 | 미국 |
68 | FsLpsE | 플라보박테리움 스파르탄시이 | 합성 | 미국 |
70 | SsLpsE | 스포로무사 스파에로이데스 DSM 2875 | 합성 | 독일 |
72 | FsLpsE | 플라보박테리움 스파르탄시이 | 합성 | 미국 |
74 | SsLpsE | 스포로무사 스파에로이데스 DSM 2875 | 합성 | 독일 |
76 | PsTolC | 칸디다투스 플란크토필라 설포니카 | 합성 | 스위스 |
78 | BhTolC | 부티리비브리오 훈가테이 XBD2006 | 합성 | 미국 |
80 | RiMsbA | 로세부리아 인테스티날리스 CAG:13 | 합성 | 덴마크 |
82 | PgMsbA | 페도박터 긴센기솔리 | 합성 | 대한민국 |
84 | VbMsbA | 베루코미크로비아 박테리움 CG1_02_43_26 | 합성 | 미국 |
86 | BhNAPO | 브라키스피라 함프소니이 P280/1 | 합성 | 영국 |
88 | TmWzc | 서모토가 마리티마 (균주 ATCC 43589 / MSB8 / DSM 3109 / JCM 10099) | 합성 | 이탈리아 |
90 | ClCutC | 클로스트리디움 종 CAG:1013 | 합성 | 덴마크 |
92 | OsCutC | 오도리박터 스플란크니쿠스 DSM 20712 | 합성 | 알려지지 않음 |
94 | MiCutC | 미추아리아 종 PDC51 | 합성 | 미국 |
96 | PiCutC | 프레보텔라 인테르메디아 ATCC 25611 (DSM 20706) | 합성 | 미국 |
98 | AsNAm | 악티노바쿨룸 수이스 DSM 20639 | 합성 | 알려지지 않음 |
100 | RgNAm | 루미노코커스 그나부스 | 합성 | 미국 |
102 | CuNAm | 쿠르토박테리움 종 314Chir4.1 | 합성 | 미국 |
104 | NdNap | 니아벨라 드릴라시스DSM25811 | 합성 | 독일 |
106 | SfNap | 사카리크리니스 퍼멘탄스 DSM 9555 = JCM 21142 | 합성 | 알려지지 않음 |
108 | mdtD | 시트로박터 프레운디이 MGH152 | 합성 | 미국 |
110 | mdtD | 시트로박터 웨르크마니이 NBRC 105721 | 합성 | 벨기에, 추가로 명시되지 않음 |
112 | mdtD | 시트로박터 아말로나티쿠스 | 합성 | 미국 |
114 | mdtD | 클레브시엘라 옥시토카 | 합성 | 영국 |
116 | mdtD | 에스케리치아 알베르티이 B156 | 합성 | 미국 |
118 | yegB | 살모넬라 엔테리카 아종 살라메 | 합성 | 영국 |
120 | mdtD | 클레브시엘라 뉴모니에 30684/NJST258_2 | 합성 | 미국 |
122 | Tcr_1_D38215 | 클레브시엘라 뉴모니에 | 합성 | 미국 |
124 | mdtD | 슈도시트로박터 페칼리스 | 합성 | 미국 |
126 | Cmr | 요케넬라 레겐스버게이 ATCC43003 | 합성 | 영국 |
128 | MdfA | 크로노박터 무이트젠시이 | 합성 | 미국 |
130 | MdfA | 클레브시엘라 옥시토카 | 합성 | 스웨덴 (Zweden) |
132 | MFS | 시트로박터 코세리 (시트로박터 디베르서스 (Citrobacter diversus)) | 합성 | 미국 |
134 | MdfA | 에스케리치아 마르모테 | 합성 | 미국 |
136 | Cmr | 시겔라 플렉스네리 | 합성 | 영국 |
138 | MdfA | 살모넬라 엔테리카 아종 살라메 | 합성 | 덴마크 |
140 | Cmr/MdfA | 시트로박터 윤게 ATCC 29220 | 합성 | 미국 |
142 | MdfA | 시트로박터 프레운디이 | 합성 | 미국 |
144 | MdfA/DHA1/MFS | 엔테로박터 코베이 | 합성 | 미국 |
146 | MdfA | 엔테로박터 종 | 합성 | 호주 |
148 | MdfA | 렐리오티아 종 WB101 | 합성 | 미국 |
150 | MdfA | 엔테로박터 루드위기이 EcWSU1 | 합성 | 미국 |
152 | Sweet-유사 | 악티노플라네스 우타헨시스 | 합성 | 미국 |
154 | Sweet-유사 | 키티노파가세에 박테리움 PMG_246 | 합성 | 영국 |
156 | Sweet-유사 | 리조비움 종 PDC82 | 합성 | 미국 |
158 | Sweet-유사 | 키네오코커스 리조스파에레 DSM 19711 | 합성 | 대한민국 |
160 | Sweet-유사 | 모르가넬라 모르가니이 IS15 | 합성 | 오스트리아 |
162 | Sweet-유사 | 게오데르마토필루스 오브스쿠러스 (균주 ATCC 25078 / DSM 43160 / JCM 3152 / G-20) | 합성 | 미국 |
164 | Sweet-유사 | 브라디리조비움 종 BTAi1 | 합성 | 미국 |
166 | Sweet-유사 | 브라디리조비움 자포니쿰 USDA 110 | 합성 | 미국 |
168 | Sweet-유사 | 크산토모나스 캄페스트리스 pv. 베시카토리아 균주 85-10 | 합성 | 대한민국 |
170 | Sweet-유사 | 헤르바스피릴룸 아쿠아티쿰 | 합성 | 미국 |
172 | Sweet-유사 | 플라보박테리아 박테리움 MS024-2A | 합성 | 미국 |
174 | wzm | 리조비움 종 Root149 | 합성 | 독일 |
176 | wzm | 아조스피릴룸 브라실리엔세 LMG 04375 | 합성 | 벨기에, 플랑드르 |
178 | wzt | 리조비움 종 Root149 | 합성 | 독일 |
180 | wzt | 아조스피릴룸 브라실리엔세 LMG 4375 | 합성 | 벨기에, 플랑드르 |
182 | rnd-유사 | 시노리조비움 메디케 WSM419 | 합성 | 미국 |
184 | 아라비노스 유출물 | 아조스피릴룸 브라실리엔세 LMG 4375 | 합성 | 벨기에, 플랑드르 |
186 | nodj | 브라디리조비움 자포니쿰 USDA 110 | 합성 | 미국 |
188 | nodi | 브라디리조비움 자포니쿰 USDA 110 | 합성 | 미국 |
190 | ybjM | 대장균 K12 MG1655 | 합성 | 미국 |
192 | ybjM-유사 | 엔테로박테리아세에 박테리움 ENNIH1 | 합성 | 미국 |
194 | wzt | 대장균 113303 | 합성 | 미국 |
196 | wzm | 대장균 113303 | 합성 | 미국 |
198 | FT1 | 헬리코박터 필로리 | 합성 | 호주 |
200 | FT2 | 바실레아 피차시풀모니스 (Basilea psittacipulmonis) JF4266 (DSM 24701) | 합성 | 스위스 |
202 | HpFutC (FT3) | 헬리코박터 필로리 | 합성 | 호주 |
204 | lamB | 대장균 K12 MG1655 | 합성 | 미국 |
206 | malE | 대장균 K12 MG1655 | 합성 | 미국 |
208 | malK | 대장균 K12 MG1655 | 합성 | 미국 |
210 | nagE | 대장균 K12 MG1655 | 합성 | 미국 |
212 | srlB | 대장균 K12 MG1655 | 합성 | 미국 |
214 | araF | 대장균 K12 MG1655 | 합성 | 미국 |
216 | xylF | 대장균 K12 MG1655 | 합성 | 미국 |
218 | ytfQ | 대장균 K12 MG1655 | 합성 | 미국 |
220 | FT4 | 헬리코박터 종 (Helicobacter sp.) MIT 01-6242 | 합성 | 미국 |
서열번호 (단백질) | 패밀리 | EggNOG | PFAM | Interpro | TCDB |
2 | 포터 | 07QF7 | PF07690 | IPR011701 IPR020846 IPR036259 IPR005829 | 2.A.1.2 |
4 | 포터 | 05D94 | PF07690 | IPR011701 IPR020846 IPR036259 IPR005829 | 2.A.1.36 |
6 | 포터 | 05C0R | PF07690 | IPR004638 IPR011701 IPR020846 IPR036259 IPR023721 IPR001411 | 2.A.1.3 |
8 | 포터 | 05F9N | PF07690 | IPR011701 IPR020846 IPR036259 IPR023008 | 2.A.1.46 |
10 | 포터 | 05E5M | PF07690 | IPR011701 IPR020846 IPR036259 IPR004734 | 2.A.1.2 |
12 | 포터 | 05CZQ | PF07690 | IPR004812 IPR011701 IPR020846 IPR036259 | 2.A.1.2 |
14 | 포터 | 05E8G | PF05977 | IPR023722 IPR020846 IPR036259 IPR010290 | 2.A.1.38 |
16 | 포터 | 05E5W | PF07690 | IPR011701 IPR020846 IPR036259 | 2.A.1.2 |
18 | 포터 | 08SC4 | PF07690 | IPR011701 IPR020846 IPR036259 IPR005829 | 2.A.1.15 |
20 | 포터 | 08H15 | PF07690 | IPR011701 IPR020846 IPR036259 IPR001411 | 2.A.1.3 |
22 | 포터 | 05JHE | PF07690 | IPR011701 IPR020846 IPR036259 | 2.A.1.12 |
24 | 포터 | 05C2C | PF07690 | IPR004812 IPR011701 IPR020846 IPR036259 IPR004734 | 2.A.1.2 |
26 | 포터 | 05EDR | PF07690 | IPR005275 IPR011701 IPR020846 IPR036259 | 2.A.1.7 |
28 | P-P-결합-가수분해-유도 수송체 | 05BZ1 | PF00664 PF00005 | IPR003593 IPR011527 IPR036640 IPR003439 IPR017871 IPR027417 IPR039421 | 3.A.1.11 |
30 | P-P-결합-가수분해-유도 수송체 | 08JQ7 | PF00005 PF08352 | IPR003593 IPR003439 IPR017871 IPR013563 IPR027417 | 3.A.1.5 |
32 | 포터 | 05EGZ | PF01943 | IPR002797 IPR032896 | 2.A.66 |
34 | β-배럴 포린 | 05DAY | PF02563 PF10531 PF18412 | IPR003715 IPR019554 IPR040716 | 1.B.18 |
36 | P-P-결합-가수분해-유도 수송체 | 05BZ1 | PF00005 | IPR003593 IPR011527 IPR036640 IPR003439 IPR017871 IPR027417 IPR039421 | 3.A.1.10 |
38 | 포터 | 0814C | PF00893 | IPR000390 | 2.A.7.1 |
40 | 포터 | 07RBJ | PF13347 | IPR039672 IPR036259 IPR001927 | 2.A.2 |
42 | 포터 | 07RBJ | PF13347 | IPR039672 IPR036259 IPR001927 | 2.A.2 |
44 | P-P-결합-가수분해-유도 수송체 | 08IJ9 | PF00005 PF17912 | IPR003593 IPR003439 IPR017871 IPR008995 IPR040582 IPR027417 | 3.A.1.1 |
46 | 포터 | 08N8A | PF07690 | IPR011701 IPR020846 IPR036259 | 2.A.1.68 |
48 | 포터 | 05DXI | PF07690 | IPR011701 IPR020846 IPR036259 | 2.A.1.81 |
50 | 포터 | 08N8A | PF07690 | IPR011701 IPR020846 IPR036259 | 2.A.1.68 |
52 | 포터 | 07QNK | PF00083 | IPR020846 IPR005828 IPR036259 IPR003663 IPR005829 | 2.A.1.1 |
54 | 포터 | 07QNK | PF00083 | IPR020846 IPR005828 IPR036259 | 2.A.1.1 |
56 | 추정 수송 단백질 | 05CRE | PF01578 PF05140 | IPR002541 IPR007816 | 9.B.14 |
58 | 포터 | 07T5E | PF14667 PF13440 | IPR029303 | 2.A.66 |
60 | 포터 | 07VQ3 | PF01943 PF14667 | IPR029303 IPR002797 | 2.A.66 |
62 | 포터 | 08Z4Q | PF13440 | 2.A.66 | |
64 | 포터 | 07VQ3 | PF01943 | IPR002797 | 2.A.66 |
66 | 포터 | 05PSV | PF13440 | 2.A.66 | |
68 | P-P-결합-가수분해-유도 수송체 | 05EY8 | PF00005 PF14524 | IPR003593 IPR003439 IPR027417 IPR029439 | 3.A.1.10 |
70 | P-P-결합-가수분해-유도 수송체 | 05EY8 | PF00005 | IPR003593 IPR003439 IPR027417 | 3.A.1.10 |
72 | P-P-결합-가수분해-유도 수송체 | 07V1T | PF01061 | IPR013525 IPR000412 | 3.A.1.10 |
74 | P-P-결합-가수분해-유도 수송체 | 07V1T | PF01061 | IPR013525 IPR000412 | 3.A.1.10 |
76 | P-P-결합-가수분해-유도 수송체 | 05BZ1 | PF00005 | IPR003593 IPR011527 IPR036640 IPR003439 IPR017871 IPR027417 IPR039421 | 3.A.1.11 |
78 | P-P-결합-가수분해-유도 수송체 | 05BZ1 | PF00664 PF00005 | IPR003593 IPR011527 IPR036640 IPR003439 IPR017871 IPR027417 IPR039421 | 3.A.1.10 |
80 | P-P-결합-가수분해-유도 수송체 | 05BZ1 | PF00664 PF00005 | IPR003593 IPR011527 IPR036640 IPR003439 IPR017871 IPR027417 IPR039421 | 3.A.1.10 |
82 | P-P-결합-가수분해-유도 수송체 | 05BZ1 | PF00664 PF00005 | IPR003593 IPR011527 IPR036640 IPR003439 IPR017871 IPR027417 | 3.A.1.10 |
84 | P-P-결합-가수분해-유도 수송체 | 05BZ1 | PF00664 PF00005 | IPR003593 IPR011527 IPR036640 IPR003439 IPR017871 IPR027417 | 3.A.1.10 |
86 | 포터 | 05EAM | PF02690 PF01895 | IPR003841 IPR004633 IPR038078 IPR026022 | 2.A.58 |
88 | 보조 수송 단백질 | 07SYR | PF13807 PF02706 | IPR032807 IPR003856 IPR027417 | 8.A.3 |
90 | 추정 수송 단백질 | 06N3A | PF03932 | IPR005627 IPR023648 IPR036822 | 9.B.158 |
92 | 추정 수송 단백질 | 06N3A | PF03932 | IPR005627 IPR023648 IPR036822 | 9.B.158 |
94 | 추정 수송 단백질 | 06N3A | PF03932 | IPR005627 IPR023648 IPR036822 | 9.B.158 |
96 | 추정 수송 단백질 | 06N3A | PF03932 | IPR005627 IPR023648 IPR036822 | 9.B.158 |
98 | 포터 | 05CT4 | PF13347 | IPR039672 IPR020846 IPR036259 | 2.A.2 |
100 | 포터 | 088QT | PF13347 | IPR039672 IPR020846 IPR036259 IPR001927 | 2.A.2 |
102 | 포터 | 05C0R | PF07690 | IPR004638 IPR011701 IPR020846 IPR036259 IPR001411 | 2.A.1.3 |
104 | 포터 | 07CWC | PF00474 | IPR038377 IPR001734 | 2.A.21 |
106 | 포터 | 07RJ1 | PF00474 | IPR038377 IPR001734 | 2.A.21 |
108 | 포터 | 05C0R | PF07690 | IPR011701 IPR020846 IPR036259 IPR023721 IPR001411 | 2.A.1.3 |
110 | 포터 | 05C0R | PF07690 | IPR004638 IPR011701 IPR020846 IPR036259 IPR023721 IPR001411 | 2.A.1.3 |
112 | 포터 | 05C0R | PF07690 | IPR011701 IPR020846 IPR036259 IPR023721 IPR001411 | 2.A.1.3 |
114 | 포터 | 05C0R | PF07690 | IPR004638 IPR011701 IPR020846 IPR036259 IPR023721 IPR001411 | 2.A.1.3 |
116 | 포터 | 05C0R | PF07690 | IPR004638 IPR011701 IPR020846 IPR036259 IPR023721 IPR001411 | 2.A.1.3 |
118 | 포터 | 05C0R | PF07690 | IPR011701 IPR020846 IPR036259 IPR023721 IPR001411 | 2.A.1.3 |
120 | 포터 | 05C0R | PF07690 | IPR011701 IPR020846 IPR036259 IPR023721 IPR001411 | 2.A.1.3 |
122 | 포터 | 05C0R | PF07690 | IPR004638 IPR011701 IPR020846 IPR036259 IPR023721 IPR001411 | 2.A.1.3 |
124 | 포터 | 05C0R | PF07690 | IPR004638 IPR011701 IPR020846 IPR036259 IPR023721 IPR001411 | 2.A.1.3 |
126 | 포터 | 07QF7 | PF07690 PF07690 | IPR011701 IPR011701 IPR020846 IPR020846 IPR036259 IPR036259 IPR005829 IPR005829 | 2.A.1.2 |
128 | 포터 | 07QF7 | PF07690 | IPR011701 IPR020846 IPR036259 IPR005829 | 2.A.1.2 |
130 | 포터 | 07QF7 | PF07690 | IPR011701 IPR020846 IPR036259 IPR005829 | 2.A.1.2 |
132 | 포터 | 07QF7 | PF07690 | IPR011701 IPR020846 IPR036259 IPR005829 | 2.A.1.2 |
134 | 포터 | 07QF7 | PF07690 | IPR011701 IPR020846 IPR036259 IPR005829 | 2.A.1.2 |
136 | 포터 | 07QF7 | PF07690 | IPR011701 IPR020846 IPR036259 IPR005829 | 2.A.1.2 |
138 | 포터 | 07QF7 | PF07690 | IPR011701 IPR020846 IPR036259 IPR005829 | 2.A.1.2 |
140 | 포터 | 07QF7 | PF07690 | IPR011701 IPR020846 IPR036259 IPR005829 | 2.A.1.2 |
142 | 포터 | 07QF7 | PF07690 | IPR011701 IPR020846 IPR036259 IPR005829 | 2.A.1.2 |
144 | 포터 | 07QF7 | PF07690 | IPR011701 IPR020846 IPR036259 IPR005829 | 2.A.1.2 |
146 | 포터 | 07QF7 | PF07690 | IPR011701 IPR020846 IPR036259 IPR005829 | 2.A.1.2 |
148 | 포터 | 07QF7 | PF07690 | IPR011701 IPR020846 IPR036259 IPR005829 | 2.A.1.2 |
150 | 포터 | 07QF7 | PF07690 | IPR011701 IPR020846 IPR036259 IPR005829 | 2.A.1.2 |
152 | 포터 | 070Q9 | PF04193 | IPR006603 | 2.A.123 |
154 | 포터 | 05W3H | PF04193 | IPR006603 | 2.A.123 |
156 | 포터 | 05W3H | PF03083 | IPR004316 | 2.A.123 |
158 | 포터 | 05W3H | PF03083 PF04193 | IPR006603 IPR004316 | 2.A.123 |
160 | 포터 | 05W2Y | PF03083 | IPR004316 | 2.A.123 |
162 | 포터 | 070Q9 | PF04193 | IPR006603 | 2.A.123 |
164 | 포터 | 05W3H | PF04193 | IPR006603 | 2.A.123 |
166 | 포터 | 05W3H | PF04193 | IPR006603 | 2.A.123 |
168 | 포터 | 05XJ5 | PF04193 | IPR006603 | 2.A.123 |
170 | 포터 | 05XJ5 | PF03083 | IPR004316 | 2.A.123 |
172 | 포터 | 05W3H | PF04193 | IPR006603 | 2.A.123 |
174 | P-P-결합-가수분해-유도 수송체 | 05MFV | PF01061 | IPR013525 IPR000412 | 3.A.1.10 |
176 | P-P-결합-가수분해-유도 수송체 | 05MFV | PF01061 | IPR013525 IPR000412 | 3.A.1.10 |
178 | P-P-결합-가수분해-유도 수송체 | 05EY8 | PF00005 PF14524 | IPR003593 IPR003439 IPR027417 IPR029439 | 3.A.1.10 |
180 | P-P-결합-가수분해-유도 수송체 | 05EY8 | PF14524 | IPR003593 IPR003439 IPR017871 IPR027417 IPR029439 | 3.A.1.10 |
182 | 포터 | 05BZS | PF00873 | IPR027463 IPR001036 | 2.A.6.3 |
184 | 포터 | 05CXP | PF07690 | IPR011701 IPR020846 IPR036259 | 2.A.1.2 |
186 | P-P-결합-가수분해-유도 수송체 | 05HAC | PF01061 | IPR013525 IPR000412 IPR005981 | 3.A.1.10 |
188 | P-P-결합-가수분해-유도 수송체 | 05CJ1 | PF00005 | IPR003593 IPR003439 IPR017871 IPR015851 IPR005978 IPR027417 | 3.A.1.10 |
190 | 추정 수송 단백질 | 05GWF | PF11045 | IPR020368 | N/A |
192 | 추정 수송 단백질 | 05GWF | PF11045 | IPR020368 | N/A |
194 | P-P-결합-가수분해-유도 수송체 | 05EY8 | PF00005 PF14524 | IPR003593 IPR003439 IPR017871 IPR027417 IPR029439 | 3.A.1.10 |
196 | P-P-결합-가수분해-유도 수송체 | 05MFV | PF01061 | IPR013525 IPR000412 | 3.A.1.10 |
204 | β-배럴 포린 | 08KDD | PF02264 | IPR003192 IPR023738 IPR036998 | 1.B.3.1 |
206 | P-P-결합-가수분해-유도 수송체 | 07FKK | PF13416 | IPR006059 IPR006060 IPR006061 | 3.A.1.1 |
208 | P-P-결합-가수분해-유도 수송체 | 172T7 | PF00005 PF17912 | IPR003439 IPR003593 IPR008995 IPR015855 IPR017871 IPR027417 IPR040582 | 3.A.1.1 |
210 | 포스포트란스퍼-유도 그룹 전위인자 | 05CI1 | PF00367 PF00358 PF02378 | IPR001127 IPR001996 IPR003352 IPR010974 IPR011055 IPR013013 IPR018113 IPR036878 | 4.A.1.1 |
212 | 포스포트란스퍼-유도 그룹 전위인자 | 05VI0 | PF03829 | IPR004716 IPR018454 IPR036665 | 4.A.4.1 |
214 | P-P-결합-가수분해-유도 수송체 | 05DMK | PF00532 | IPR001761 IPR026266 IPR028082 | 3.A.1.2 |
216 | P-P-결합-가수분해-유도 수송체 | 05DFW | PF13407 | IPR013456 IPR025997 IPR028082 | 3.A.1.2 |
218 | P-P-결합-가수분해-유도 수송체 | 07R5U | PF13407 | IPR025997 IPR028082 IPR033893 | 3.A.1.2 |
막 단백질 유전자의 발현을 위한 전사 유닛 | |||
TU 번호 | 프로모터 부분 | UTR 부분 | 종결인자 부분 |
TU1 | PROM0005_MutalikP5 | UTR0014_GalE_LeuAB | TER0010_T7early |
TU2 | PROM0005_MutalikP5 | UTR0038_GalE_IptFG | TER0010_T7early |
TU3 | PROM0005_MutalikP5 | UTR0055_uspF_iptFG | TER0010_T7early |
TU4 | PROM0012_MutalikP12 | UTR0014_GalE_LeuAB | TER0010_T7early |
TU5 | PROM0012_MutalikP12 | UTR0038_GalE_IptFG | TER0010_T7early |
TU6 | PROM0012_MutalikP12 | UTR0055_uspF_iptFG | TER0010_T7early |
TU7 | PROM0032_apFAB146 | UTR0014_GalE_LeuAB | TER0010_T7early |
TU8 | PROM0032_apFAB146 | UTR0038_GalE_IptFG | TER0010_T7early |
TU9 | PROM0032_apFAB146 | UTR0055_uspF_iptFG | TER0010_T7early |
TU10 | PROM0015_p22 | UTR0003_BCD1 | TER0010_T7early |
TU11 | PROM0010_MutalikP10 | UTR0013_ThrA_BCD2 | TER0010_T7early |
TU12 | PROM0005_MutalikP5 | UTR0011_Gene10_LeuL | TER0010_T7early |
푸코실트란스퍼라제 유전자의 발현을 위한 전사 유닛 | |||
TU 번호 | 프로모터 부분 | UTR 부분 | 종결인자 부분 |
TU13 | PROM0016_p14 | UTR0002_Gene10-LeuAB-BCD2 | TER0010_T7early |
플라스미드는 Invitrogen으로부터 구입한 숙주인 대장균 DH5alpha (F-, phi80dlacZdeltaM15, delta(lacZYAargF) U169, deoR, recA1, endA1, hsdR17(rk-, mk+), phoA, supE44, lambda-, thi-1, gyrA96, relA1)에서 유지되었다.
균주 및 돌연변이
대장균 K12 MG1655 [lambda-, F-, rph-1]는 2007년 3월에 the Coli Genetic Stock Center (US), CGSC Strain#: 7740으로부터 입수하였다. 유전자 파괴 및 유전자 도입은 Datsenko 및 Wanner가 발표한 기술을 사용하여 수행하였다 (PNAS 97 (2000), 6640- 6645). 이러한 기술은 람다 Red 재조합효소에 의해 수행된 상동성 재조합 후에 항생제 선택에 기반한다. 플립파제 (flippase) 재조합효소의 후속 촉매 작용은 최종 생산 균주에서 항생제 선택 카세트의 제거를 보장한다.
Red 헬퍼 플라스미드 pKD46을 보유하는 형질전환체를 암피실린 (100 mg/L) 및 L-아라비노스 (10 mM)를 함유하는 LB 배지 10 ml에서 30℃에서 OD6oonm이 0.6이 될 때까지 성장시켰다. 상기 세포를 먼저 50 ml의 빙냉수로 세척하고, 두번째로 1 ml의 빙냉수로 세척하여 상기 세포가 전기적격 (electrocompetent)이 되도록 만들었다. 그 다음에, 상기 세포를 50 μl의 빙냉수에 재현탁하였다. Gene Pulser™ (BioRad) (600 Ω, 25 μFD, 및 250 볼트)를 사용하여 50 μl의 세포 및 10-100 ng의 선형 이중가닥 DNA 산물로 전기천공을 수행하였다.
전기천공 후에, 세포를 1 ml의 LB 배지에 부가하고, 37℃에서 1시간 동안 인큐베이션하고, 마지막으로 25 mg/L의 클로람페니콜 또는 50 mg/L의 카나마이신을 함유하는 LB-아가에 도말하여 항생제 저항성 형질전환체를 선택하였다. 선택된 돌연변이체는 변형된 영역의 업스트림 및 다운스트림에 프라이머를 사용하여 PCR에 의해 확인하였고, 헬퍼 플라스미드의 결실을 위해 42℃에서 LB-아가에서 성장시켰다. 상기 돌연변이체를 암피실린 감수성에 대해 테스트하였다.
상기 선형 ds-DNA 앰플리콘은 pKD3, pKD4 및 이의 유도체를 주형으로 사용하여 PCR에 의해 수득하였다. 사용된 프라이머는 주형에 상보적인 서열의 일부 및 재조합이 발생되는 염색체 DNA의 측면에 상보적인 다른 부분을 갖는다. 게놈 녹-아웃 (genomic knock-out)의 경우, 상동성 영역은 관심 유전자의 개시 및 정지 코돈의 50-nt 업스트림 및 50-nt 다운스트림에 디자인되었다. 게놈 녹-인 (genomic knock-in)의 경우, 전사 개시점 (+1)이 고려되어야 한다. PCR 산물을 PCR-정제하고, Dpnl로 소화하고, 아가로스 겔로부터 재정제하고, 용출 버퍼 (5 mM Tris, pH 8.0)에 현탁하였다.
선택된 돌연변이체 (클로람페니콜 또는 카나마이신 저항성)는 온도-민감성 복제 및 FLP 합성의 열 유도를 나타내는 암피실린 및 클로람페니콜 저항성 플라스미드인 pCP20 플라스미드로 형질전환되었다. 상기 암피실린-저항성 형질전환체는 30℃에서 선택되었고, 그 후에 42℃의 LB에서 몇 개의 콜로니를 정제한 다음에, 모든 항생제 저항성 및 FLP 헬퍼 플라스미드의 결실을 테스트하였다. 상기 유전자 녹-아웃 및 녹-인은 대조군 프라이머 (Fw/Rv-gene-out)로 확인하였다.
대장균 K12 MG1655 유래의 돌연변이체 균주는 유전자 lacZ, lacY lacA, glgC, agp, pfkA, pfkB, pgi, arcA, iclR, wcaJ, lon 및 thyA를 녹-아웃하여 형성되었다. 또한, 대장균 lacY 유전자, 지모모나스 모빌리스 (Zymomonas mobilis) 유래의 프럭토스 키나제 유전자 (frk), 대장균 W 수크로스 수송체 (cscB) 및 비피도박테리움 아돌레센티스 (Bifidobacterium adolescentis) 유래의 수크로스 포스포릴라제 (SP)가 게놈에 녹-인되고, 항시적으로 발현되었다. 상기 항시성 프로모터는 De Mey 등 (BMC Biotechnology, 2007)이 개시한 프로모터 라이브러리로부터 유래한다. 이러한 유전자 변형은 또한 WO2016075243 및 WO2012007481에 기재되어 있다.
상기 α1,3- 또는 α1,2-푸코실트란스퍼라제 유전자는 상기 기재된 바와 같이 플라스미드로부터 돌연변이체 균주로 제시되었다. 모든 막 단백질 유전자를 대장균 K12 MG1655 유래의 이러한 돌연변이체 균주에서 평가하였다. 플라스미드에 존재하거나, 또는 숙주 게놈 (setA 또는 ldhA 유전자좌)에 통합된 막 단백질 유전자를 평가하였다. 모든 균주는 -80℃의 저온바이알 (cryovials)에 저장된다 (70% 글리세롤과 1:1 비율로 혼합된 LB 배양물 중에 밤새).
대체 돌연변이체 균주는 유전자 lacZ, rcsA 및 wcaJ가 녹-아웃된 대장균 K12 JM109로부터 유래될 수 있다. α1,3- 또는 α1,2-푸코실트란스퍼라제 유전자를 상기 기재된 바와 같은 플라스미드로부터 상기 돌연변이체 균주에 제시하여 2'푸코실락토스, 3-푸코실락토스 또는 2',3-디푸코실락토스의 생성을 유도하였다. 막 단백질 유전자는 상기에 기재된 것과 동일한 방식으로 평가된다. 상기 균주는 알로-락토스 (allo-lactose) 또는 IPTG를 통해 락토스를 내재화하여 락토스 퍼미아제 유전자 lacY를 유도할 수 있다.
다른 대체 돌연변이체 균주는 대장균 BL21로부터 유래될 수 있다. 유전자 lacZ, fucI, fucK 및 wzxC-wcaJ가 상기 균주에서 녹-아웃된다. 상기 돌연변이체 균주에서 GDP-푸코스의 합성을 개선하기 위해, 포스포만노뮤타제 (manB), 만노스-1-포스페이트 구아노실트란스퍼라제 (manC), GDP-만노스-4,6-데하이드라타제 (gmd) 및 대장균 K12 유래의 GDP-L-푸코스 신타제 (wcaG)를 코딩하는 유전자들이 상기 기재된 것과 유사한 방식으로 과발현되었다. 세포내 락토스 합성은 lgtB 유전자에 의해 코딩되는 베타-1,4-갈락토실트란스퍼라제를 코딩하는 유전자의 과발현에 의해 달성된다. UDP-갈락토스의 합성을 향상시키기 위해, galETKM을 코딩하는 오페론을 녹-아웃시키고, UDP-글루코스 에피머라제를 코딩하는 유전자를 과발현시켰다. α1,3- 또는 α1,2-푸코실트란스퍼라제 유전자를 상기 기재된 바와 같은 플라스미드로부터 상기 돌연변이체 균주에 제시하여 2'푸코실락토스, 3-푸코실락토스 또는 2',3-디푸코실락토스의 생성을 유도하였다. 막 단백질 유전자는 상기 기재된 것과 동일한 방식으로 평가된다.
다른 대체 돌연변이체 균주는 대장균 K12로부터 유래될 수 있다. 유전자 lacZ, fucI, fucK 및 wzxC-wcaJ가 상기 균주에서 녹-아웃된다. 상기 돌연변이체 균주에서 GDP-푸코스의 합성을 개선하기 위해, 포스포만노뮤타제 (manB), 만노스-1-포스페이트 구아노실트란스퍼라제 (manC), GDP-만노스-4,6-데하이드라타제 (gmd) 및 대장균 K12 유래의 GDP-L-푸코스 신타제 (wcaG)를 코딩하는 유전자들이 상기 기재된 것과 유사한 방식으로 과발현되었다. 또한 상기 균주는 대장균 유래의 푸코스 퍼미아제 (fucP) 유전자 및 박테로이데스 프라길리스 (Bacteroides fragilis) 유래의 이관능성 푸코스 키나제/푸코스-1-포스페이트 구아닐일트란스퍼라제 (fkp) 유전자의 게놈 녹-인에 의해 변형된다. α1,3- 또는 α1,2-푸코실트란스퍼라제 유전자를 상기 기재된 바와 같은 플라스미드로부터 상기 돌연변이체 균주에 제시하여 2'푸코실락토스, 3-푸코실락토스 또는 2',3-디푸코실락토스의 생성을 유도하였다. 막 단백질 유전자는 상기 기재된 것과 동일한 방식으로 평가된다. 상기 균주는 알로-락토스 또는 IPTG를 통해 락토스를 내재화하여 락토스 퍼미아제 유전자 lacY를 유도할 수 있다.
다른 대체 돌연변이체 균주는 대장균 K12로부터 유래될 수 있다. 유전자 lacZ, 및 wzxC-wcaJ가 상기 균주에서 녹-아웃된다. 상기 돌연변이체 균주에서 GDP-푸코스의 합성을 개선하기 위해, 포스포만노뮤타제 (manB), 만노스-1-포스페이트 구아노실트란스퍼라제 (manC), GDP-만노스-4,6-데하이드라타제 (gmd) 및 대장균 K12 유래의 GDP-L-푸코스 신타제 (wcaG)를 코딩하는 유전자들을 상기 기재된 것과 유사한 방식으로 과발현시켰다. 글루코스신생합성 기질 (gluconeogenic substrate) 예컨대 글리세롤, 아세테이트, 락테이트, 에탄올, 숙시네이트, 피루베이트 유래의 플럭토스-6-포스페이트의 형성을 개선하기 위해, 포스포프럭토키나제 (pfkA 및 pfkB)를 코딩하는 유전자를 녹-아웃시키고, 프럭토스-1,6-비스포스페이트 알돌라제 (fbaB) 및 피숨 사티붐 (Pisum sativum) 유래의 이종 프럭토스-1,6-비스포스페이트 포스파타제 (fbpase)를 코딩하는 유전자를 과발현시켰다. α1,3- 또는 α1,2-푸코실트란스퍼라제 유전자를 상기 기재된 바와 같은 플라스미드로부터 상기 돌연변이체 균주에 제시하여 2'푸코실락토스, 3-푸코실락토스 또는 2',3-디푸코실락토스의 생성을 유도하였다. 막 단백질 유전자는 상기 기재된 것과 동일한 방식으로 평가된다.
배양 조건
96 웰 마이크로타이터 플레이트 실험의 전배양 (preculture)을 150 μL의 LB에서 저온바이알로부터 개시하여, 800 rpm의 오비탈 진탕기 (orbital shaker)에서 37℃로 밤새 인큐베이션하였다. 이러한 배양물은 400x 희석하여 400 μL 최소 배지를 사용하여, 96웰 사각형 마이크로타이터 플레이트에 접종물로 사용하였다. 각 균주를 생물학적 복제물로서 96-웰 플레이트의 다중 웰에서 성장시켰다. 그 다음에 이러한 최종 96-웰 배양 플레이트를 72시간 또는 더 짧거나 또는 더 긴 시간 동안 800 rpm의 오비탈 진탕기에서 37℃로 인큐베이션하였다. 배양 실험의 종료 시에, 각 웰로부터 샘플을 채취하여 배양액 상등액에서 당 농도 (세포를 5회 회전 침강시킨 후에, 세포외 당 농도)를 측정하거나, 또는 배양액을 90℃에서 15분 동안 끓인 후에 세포를 회전 침강시켜서 당 농도 (= 전체 배양액 측정, 세포내 및 세포외 당 농도의 평균)를 측정하였다.
또한 배양물을 희석하여 600 nm에서 광학 밀도를 측정하였다. 세포 성능 지수 또는 CPI는 전체 배양액에서 측정된 푸코실락토스 농도를 바이오매스로 나누어, 참조 균주와 비교한 상대 퍼센트로 결정하였다. 상기 바이오매스는 600 nm에서 측정된 광학 밀도의 약 1/3로 경험적으로 결정된다. 푸코실락토스 외수송 비율은 상등액에서 측정된 푸코실락토스 농도를 전체 배양액에서 측정된 푸코실락토스 농도로 나누어, 참조 균주와 비교한 상대 퍼센트로 결정하였다.
생물반응기의 전배양물은 소정의 균주의 전체 1 mL 저온바이알로부터 개시하여, 1 L 또는 2.5 L 진탕 플라스크에 250 mL 또는 500 mL의 최소 배지에 접종하고, 200 rpm의 오비탈 진탕기에서 37℃에서 24시간 동안 인큐베이션하였다. 그 다음에 5 L 생물반응기에 접종하였다 (2 L 회분식 배지 중에 250 mL 접종); 상기 공정은 MFCS 제어 소프트웨어 (Sartorius Stedim Biotech, Melsungen, Germany)에 의해 제어되었다. 배양 조건은 37℃로 설정하고, 최대 교반; 압력 기체 유속은 균주 및 생물반응기에 따라 좌우된다. pH는 0.5M H2SO4 및 20% NH4OH를 사용하여 6.8로 조절되었다. 배출 기체는 냉각되었다. 발효 중에 거품이 발생하는 경우 실리콘 소포제의 10% 용액을 부가하였다.
광학 밀도
배양물의 세포 밀도는 600 nm에서 광학 밀도를 측정하여 자주 모니터링하였다 (Implen Nanophotometer NP80, Westburg, Belgium or with a Spark 10M microplate reader, Tecan, Switzerland).
생산성
비생산성 (specific productivity) Qp는 푸코실락토스 생성물의 비생성율 (specific production rate)이며, 전형적으로 시간 단위당 바이오매스의 질량 단위당 생성물의 질량 단위 (= g 푸코실락토스/g 바이오매스/h)로 표시된다. 상기 Qp 값은 발효 실행의 각 단계, 즉 배치 및 유가식 단계에 대해, 각 단계의 종료 시에 및 각 단계가 지속되는 시간 프레임에서, 형성된 생성물 및 바이오매스의 양을 모두 측정하여 결정되었다.
비생산성 Qs는 기질, 예컨대 수크로스의 비소비율 (specific consumption rate)이며, 전형적으로 시간 단위당 바이오매스의 질량 단위당 기질의 질량 단위 (= g 수크로스/g 바이오매스/h)로 표시된다. 상기 Qs 값은 발효 실행의 각 단계, 즉 배치 및 유가식 단계에 대해, 각 단계의 종료 시에 및 각 단계가 지속되는 기간 프레임에서, 소비된 수크로스 및 형성된 바이오매스의 총량을 모두 측정하여 결정되었다.
수크로스에 대한 수율 Ys은 기질로부터 만들어진 생성물의 분율이며, 전형적으로 기질의 질량 단위당 생성물의 질량 단위 (= g 푸코실락토스/g 수크로스)로 표시된다. Ys는 발효 실행의 각 단계, 즉 배치 및 유가식 단계에 대해, 각 단계의 종료 시에 생성된 푸코실락토스의 총량 및 소비된 수크로스의 총량을 모두 측정하여 결정되었다.
바이오매스에 대한 수율 Yx은 기질로부터 만들어진 바이오매스의 분율이며, 전형적으로 기질의 질량 단위당 바이오매스의 질량 단위 (= g 바이오매스/g 수크로스)로 표시된다. 상기 Yp는 발효 실행의 각 단계, 즉 배치 및 유가식 단계에 대해, 각 단계의 종료 시에 생성된 바이오매스의 총량 및 소비된 수크로스의 총량을 모두 측정하여 결정되었다.
속도는 발효 실행에서 생성물이 제조되는 속도이며, 전형적으로 시간 단위당 생성된 생성물의 농도 (= g 푸코실락토스/L/h)로 표시된다. 상기 속도는 유가식 단계 종료 시에 제조된 푸코실락토스의 농도를 측정하고, 이 농도를 총 발효 시간으로 나누어 결정되었다.
상기 락토스 전환율은 발효 실행에서 락토스가 소비되는 속도이며, 전형적으로 시간 단위당 락토스의 질량 단위 (= 소모된 락토스 g/h)로 표시된다. 상기 락토스 전환율은 발효 실행 중에 소비된 총 락토스를 총 발효 시간으로 나눈 값으로 결정되었다.
성장률/속도 측정
최대 성장률 (μMax)은 R 패키지 grofit을 사용하여 600 nm에서 관찰된 광학 밀도에 기반하여 계산되었다.
액체 크로마토그래피
2'-푸코실락토스, 3-푸코실락토스 및 2',3-디푸코실락토스에 대한 표준을 자체적으로 합성하였다. 다른 표준 예컨대 이에 한정되는 것은 아니지만, 락토스, 수크로스, 글루코스, 글리세롤, 프럭토스는 Sigma로부터 구입하였다. 탄수화물은 HPLC-RI (Waters, USA) 방법을 통해 분석하였고, 이에 의해 RI (굴절률)는 샘플을 포함하는 경우 이동상의 굴절률 변화를 검출하였다. X-Bridge 컬럼 (Waters X-bridge HPLC column, USA) 및 75 ml의 아세토니트릴과 25 ml의 초순수 및 0.15 ml의 트리에틸아민을 함유하는 이동상을 사용하여 등용매 흐름 (isocratic flow)에서 당을 분리하였다. 컬럼 크기는 4.6 x 150 mm이고, 입자 크기는 3.5 μm이다. 상기 컬럼의 온도는 35℃로 설정되었고, 펌프 유속은 1 mL/분이었다.
데이터의 정규화
모든 타입의 배양 조건에 대해, 돌연변이체 균주로부터 수득된 데이터를 돌연변이체 균주와 동일한 유전적 배경을 갖지만 막 단백질 발현 카세트가 결여된 참조 균주를 사용하여 동일한 배양 조건에서 수득된 데이터에 대해 정규화하였다. 실시예에 표시된 각 플롯의 수평 파선은 모든 조정이 정규화된 설정점을 나타낸다. 모든 데이터는 해당 설정값에 대한 상대 퍼센트로 제공된다.
실시예 4: 20 g/L 락토스가 보충된 최소 배지에서의 성장 실험에서 72시간 배양된 대장균 숙주에서 3-푸코실락토스 (3-FL) 생성을 향상시키는 막 단백질 확인
20 g/L 락토스가 보충된 최소 배지에서 성장하는 숙주 세포의 푸코실락토스 생성을 향상시키는 능력에 대해 막 단백질을 평가하기 위한 실험을 설정하였다. 서열번호: 02, 04, 06, 18, 20, 22, 26, 28, 30, 32, 34, 40, 42, 44, 58, 62, 64, 66, 70, 72, 74, 82, 84, 90, 92, 94 및 96의 막 단백질은 α1,3-푸코실 트란스퍼라제 FT1 또는 FT2를 발현하는 3-FL 생산 숙주에서 생성되는 3-FL 생성을 향상시킬 수 있음을 보여주었다. 후보 유전자가 전사 유닛 TU2, TU3 또는 TU10에서 조합되었고, pSC101 플라스미드로 3-FL 생산 숙주에 제시되었다. 실시예 3에 제공된 배양 조건에 따라 성장 실험을 수행하였다. 도 1은 각 참조 균주와 비교하여 상대 퍼센트로, 균주의 CPI를 나타낸다.
실시예 5: 20 g/L 락토스가 보충된 최소 배지에서의 성장 실험에서 72시간 배양된 대장균 숙주에서 3-FL 분비를 향상시키는 막 단백질 확인
20 g/L 락토스가 보충된 최소 배지에서 성장하는 숙주 세포의 푸코실락토스 분비를 향상시키는 능력에 대해 막 단백질을 평가하기 위한 실험을 설정하였다. 서열번호: 02, 08, 10, 14, 16, 18, 20, 22, 24, 26, 28, 30, 34, 58, 62, 64, 66, 70, 72, 74, 76, 82, 84, 90, 92, 94, 96 및 104의 막 단백질은 α1,3-푸코실 트란스퍼라제 FT1 또는 FT2를 발현하는 3-FL 박테리아 생산 숙주에서 세포내 생성되는 3-FL의 분비를 향상시킬 수 있음을 보여주었다. 후보 유전자가 전사 유닛 TU2, TU3 또는 TU10에서 조합되었고, pSC101 플라스미드로 3-FL 생산 숙주에 제시되었다. 실시예 3에 제공된 배양 조건에 따라 성장 실험을 수행하였다. 도 2는 각 참조 균주와 비교하여 상대 퍼센트로, 균주에서 3-FL의 외수송 비율을 나타낸다.
실시예 6: 20 g/L 락토스가 보충된 최소 배지에서의 성장 실험에서 72시간 배양된 대장균 숙주에서 성장 속도를 향상시키는 막 단백질 확인
20 g/L 락토스가 보충된 최소 배지에서 성장하는 숙주 세포의 성장 속도에 영향을 미치는 능력에 대해 막 단백질을 평가하기 위한 실험을 설정하였다. 서열번호: 08, 14, 18 및 22의 막 단백질은 α1,3-푸코실 트란스퍼라제 FT1 또는 FT2를 발현하는 3-FL 생산 숙주의 성장 속도를 향상시킬 수 있음을 보여주었다. 후보 유전자가 전사 유닛 TU2, TU3 또는 TU10에서 조합되었고, pSC101 플라스미드로 3-FL 생산 숙주에 제시되었다. 실시예 3에 제공된 배양 조건에 따라 성장 실험을 수행하였다. 도 3은 각 참조 균주와 비교하여 상대 퍼센트로, 균주의 성장 속도를 나타낸다.
실시예 7: 45 g/L 락토스가 보충된 최소 배지에서의 성장 실험에서 72시간 배양된 대장균 숙주에서 3-FL 분비를 향상시키는 막 단백질 확인
45 g/L 락토스가 보충된 최소 배지에서 성장하는 숙주 세포에 의해 푸코실락토스 분비를 향상시키는 다양한 확인된 막 단백질들의 효능을 평가하기 위한 실험을 설정하였다. 서열번호: 28의 막 단백질은 α1,3-푸코실 트란스퍼라제 FT1을 발현하는 3-FL 생산 숙주에서 3-FL의 분비를 향상시킬 수 있음을 보여주었다. 서열번호: 27의 유전자는 전사 유닛 TU10에서 조합되었고, pSC101 플라스미드로 3-FL 생산 숙주에 제시되었다. 실시예 3에 제공된 배양 조건에 따라, 45 g/L 락토스가 보충된 최소 배지를 사용하여 성장 실험을 수행하였다. 도 4는 각 참조 균주와 비교하여 상대 퍼센트로, 균주의 CPI를 나타낸다.
실시예 8: 90 g/L 락토스가 보충된 최소 배지에서의 성장 실험에서 72시간 배양된 대장균 숙주에서 3-FL 생성을 향상시키는 막 단백질 확인
90 g/L 락토스가 보충된 최소 배지에서 푸코실락토스 생성을 향상시키는 다양한 막 단백질들의 능력을 평가하기 위한 실험을 설정하였다. 서열번호: 28의 막 단백질은 α1,3-푸코실 트란스퍼라제 FT1을 발현하는 3-FL 생산 숙주에서 3-FL 생성을 향상시킬 수 있음을 보여주었다. 서열번호: 27의 유전자는 전사 유닛 TU10에서 조합되었고, pSC101 플라스미드로 3-FL 생산 숙주에 제시되었다. 실시예 3에 제공된 배양 조건에 따라, 90 g/L 락토스가 보충된 최소 배지를 사용하여 성장 실험을 수행하였다. 도 5는 각 참조 균주와 비교하여 상대 퍼센트로, CPI를 나타낸다.
실시예 9: 90 g/L 락토스가 보충된 최소 배지에서의 성장 실험에서 72시간 배양된 대장균 숙주에서 3-FL 분비를 증가시키는 막 단백질 확인
90 g/L 락토스가 보충된 최소 배지에서 성장하는 숙주 세포에 의해 푸코실락토스 분비를 증가시키는 다양한 막 단백질들의 능력을 평가하기 위한 실험을 설정하였다. 서열번호: 10 및 16의 막 단백질은 α1,3-푸코실 트란스퍼라제 FT1을 발현하는 3-FL 생산 숙주에서 3-FL의 분비를 향상시킬 수 있음을 보여주었다. 후보 유전자가 전사 유닛 TU10에서 조합되었고, pSC101 플라스미드로 3-FL 생산 숙주에 제시되었다. 실시예 3에 제공된 배양 조건에 따라, 90 g/L 락토스가 보충된 최소 배지를 사용하여 성장 실험을 수행하였다. 도 6은 각 참조 균주와 비교하여 상대 퍼센트로, 3-FL의 외수송 비율을 나타낸다.
실시예 10: 100 g/L 수크로스 및 90 g/L 락토스가 보충된 최소 배지에서의 성장 실험에서 72시간 배양된 대장균 숙주에서 3-FL 생성을 증가시키는 막 단백질 확인
100 g/L 수크로스 및 90 g/L 락토스가 보충된 최소 배지에서 성장하는 숙주 세포에서 푸코실락토스 생성을 증가시키는 다양한 막 단백질들의 능력을 평가하기 위한 실험을 설정하였다. 서열번호: 10, 16 및 28의 막 단백질은 α1,3-푸코실 트란스퍼라제 효소 FT1을 발현하는 3-FL 생산 숙주에서 3-FL 생성을 향상시킬 수 있음을 보여주었다. 모든 후보 유전자들은 전사 유닛 TU10에서 조합되었고, pSC101 플라스미드로 3-FL 생산 숙주에 제시되었다. 실시예 3에 제공된 배양 조건에 따라, 100 g/L 수크로스 및 90 g/L 락토스가 보충된 최소 배지를 사용하여 성장 실험을 수행하였다. 도 7은 각 참조 균주와 비교하여 상대 퍼센트로, CPI를 나타낸다.
실시예 11: 100 g/L 수크로스 및 90 g/L 락토스가 보충된 최소 배지에서의 성장 실험에서 72시간 배양하는 경우 대장균 숙주에서 성장 속도를 증가시키는 막 단백질 확인
100 g/L 수크로스 및 90 g/L 락토스가 보충된 최소 배지에서 성장하는 숙주 세포의 성장 속도에 영향을 주는 막 단백질의 능력에 대해 평가하기 위한 실험을 설정하였다. 서열번호: 28의 막 단백질은 α1,3-푸코실 트란스퍼라제 효소 FT1을 발현하는 3-FL 생산 숙주에서 성장 속도를 향상시킬 수 있음을 보여주었다. 서열번호: 27의 유전자는 전사 유닛 TU10에서 조합되었고, pSC101 플라스미드로 3-FL 생산 숙주에 제시되었다. 실시예 3에 제공된 배양 조건에 따라, 100 g/L 수크로스 및 90 g/L 락토스가 보충된 최소 배지를 사용하여 성장 실험을 수행하였다. 도 8은 각 참조 균주와 비교하여 상대 퍼센트로, 성장 속도를 나타낸다.
실시예 12: 5 g/L 락토스가 보충된 최소 배지에서의 성장 실험에서 72시간 배양된 대장균 숙주에서 3-FL 생성을 증가시키는 막 단백질 확인
5 g/L 락토스가 보충된 최소 배지에서 성장하는 숙주 세포에 의해 푸코실락토스 생성에 영향을 주는 막 단백질의 능력에 대해 평가하기 위한 실험을 설정하였다. 서열번호: 22의 막 단백질은 α1,3-푸코실 트란스퍼라제 효소 FT1을 발현하는 3-FL 생산 숙주에서 3-FL 생성을 향상시킬 수 있음을 보여주었다. 서열번호: 21의 유전자는 전사 유닛 TU10에서 조합되었고, pSC101 플라스미드로 3-FL 생산 숙주에 제시되었다. 실시예 3에 제공된 배양 조건에 따라, 5 g/L 락토스가 보충된 최소 배지를 사용하여 성장 실험을 수행하였다. 도 9는 각 참조 균주와 비교하여 상대 퍼센트로, CPI를 나타낸다.
실시예 13: 숙주의 게놈에 통합되는 경우, 20 g/L 락토스가 보충된 최소 배지에서의 성장 실험에서 72시간 배양된 대장균 숙주에서 3-FL 생성 및/또는 분비를 증가시키는 막 단백질 확인
20 g/L 락토스가 보충된 최소 배지에서 72시간 동안 배양된 숙주 세포에서/숙주 세포에 의해 푸코실락토스 생성 및/또는 분비를 증가시키는, 게놈에 통합된 막 단백질의 능력을 평가하기 위한 다른 계열 실험을 설정하였다. 서열번호: 02 및 28의 막 단백질들은 α1,3-푸코실 트란스퍼라제 효소 FT1 또는 FT2를 발현하는 3-FL 생산 숙주에서 세포내 생성되는 3-FL 생성 및/또는 3-FL 분비를 향상시킬 수 있음을 보여주었다. 서열번호: 01 및 27의 유전자들이 전사 유닛 TU10에서 조합되었고, 각각 EcLdhA 또는 EcSetA 유전자좌에서 게놈 KI로서 3-FL 생산 숙주의 게놈에 제시되었다. 실시예 3에 제공된 배양 조건에 따라 성장 실험을 수행하였다. 각 참조 균주와 비교하여 상대 퍼센트로, 도 10은 CPI를 나타내고, 도 11은 3-FL 외수송을 나타낸다.
실시예 14: 클로닝된 전사 유닛과 독립적으로, 대장균 숙주에서 3-FL 생성 및/또는 3-FL 분비를 향상시키는 막 단백질
숙주 세포의 푸코실락토스 생성 및/또는 분비에 영향을 주는 막 단백질의 능력을 평가하기 위한 다른 계열 실험을 설정하였다. 본 실시예에서는 클로닝에 사용되는 여러 전사 유닛이 있다. 서열번호: 02, 06, 10, 16, 22, 28, 32, 34, 36, 38, 40, 42, 44 및 50의 막 단백질은 α1,3-푸코실 트란스퍼라제 효소 FT2에 의해 3-FL 생산 숙주에서 세포내 생성되는 3-FL 생성 및/또는 3-FL 분비를 향상시킬 수 있음을 보여주었다. 외수송 유전자가 다른 전사 유닛에 클로닝되었고, 3-FL 생산 숙주에 클론 벡터 (pSC101 ori)로 제시되었다. 실시예 3에 제공된 배양 조건에 따라 성장 실험을 수행하였다. 각 참조 균주와 비교하여 상대 퍼센트로, 도 12는 CPI를 나타내고, 도 13은 3-FL 외수송을 나타낸다.
실시예 15: 네이티브 전사 오페론 구조에 클로닝되는 경우, 20 g/L 락토스가 보충된 최소 배지에서의 성장 실험에서 72시간 배양된 대장균 숙주에서 3-FL 생성 및/또는 3-FL 분비를 향상시키는 막 단백질 확인
20 g/L 락토스가 보충된 최소 배지에서 72시간 동안 배양된 숙주 세포의 푸코실락토스 생성 및/또는 분비를 향상시키는 막 단백질의 능력을 평가하기 위한 실험을 설정하였다. 이때 상기 막 단백질은 네이티브 전사 오페론 구조에 클로닝되었다. 서열번호: 40, 42, 46 및 48의 막 단백질은 α1,3-푸코실 트란스퍼라제 효소 FT2를 발현하는 3-FL 생산 숙주에서 3-FL 생성 및/또는 3-FL 분비를 향상시킬 수 있음을 보여주었다. 모든 후보 외수송 유전자는 TU10에 단일 유전자로서 클로닝되거나 또는 2개의 막 단백질 유전자를 함유하는 네이티브 전사 오페론 구조에 클로닝되었고, pSC101 플라스미드로 3-FL 생산 숙주에 제시되었다. 실시예 3에 제공된 배양 조건에 따라 성장 실험을 수행하였다. 도 14는 각 참조 균주와 비교하여 상대 퍼센트로, CPI (좌측 패널) 및 3-FL 외수송 비율 (우측 패널)을 나타낸다.
실시예 16: 20 g/L 락토스가 보충된 최소 배지에서의 성장 실험에서 72시간 배양된 2'-FL 대장균 숙주에서 2'-FL 및/또는 DiFL 생성, 및/또는 DiFL 분비를 향상시키는 막 단백질 확인
20 g/L 락토스가 보충된 최소 배지에서 72시간 동안 배양된 숙주 세포의 푸코실락토스 생성 및/또는 분비를 향상시키는 다양한 막 단백질들의 능력을 평가하기 위한 실험을 설정하였다. 이때 막 단백질을 2'-FL 및/또는 diFL 생성에 대해 테스트하였다. 서열번호: 02, 06 및 28의 막 단백질은 α1,2-푸코실트란스퍼라제 FT3을 발현하는 2'-FL 생산 숙주에서 2'FL 및/또는 DiFL 생성 및/또는 DiFL 분비를 향상시킬 수 있음을 보여주었다. 후보 유전자는 상이한 TU들에 클로닝되었고, SetA 유전자좌 (서열번호: 27의 유전자의 경우) 또는 ldhA 유전자좌 (서열번호: 01 및 05의 유전자의 경우)를 사용하여, 2'-FL 생산 숙주의 게놈에 제시되었다. 실시예 3에 제공된 배양 조건에 따라 성장 실험을 수행하였다. 도 15는 각 참조 균주와 비교하여 상대 퍼센트로, 2'FL을 생성하는 숙주의 CPI (패널 A) 또는 DiFL을 생성하는 숙주의 CPI (패널 B), 및 DiFL 외수송 비율 (패널 C)을 나타낸다.
실시예 17: (30L) 발효 실행에서 3-FL 생산 대장균 숙주의 생산성을 향상시키는 막 단백질 MdfA.
TU1에서 발현되고, 숙주 게놈의 EcldhA 유전자좌에 존재하며, 플라스미드 유래의 α1,3-푸코실 트란스퍼라제 FT2를 발현하는 서열번호: 01의 막 단백질 유전자를 가진 3-FL 생산 대장균을 생물반응기 설정에서 이의 생산성에 대해 평가하였다. 실시예 3에 제공된 조건에 따라 8회의 발효 실행을 수행하였다. 또한, 3-FL 생산 숙주와 동일하지만 막 단백질 유전자가 결여된 참조 균주를 동일한 발효 설정에서 분석하였다. 도 16은 이러한 참조 균주와 비교하여, 8개의 상이한 발효 실행에서 서열번호: 02의 막 단백질 EcMdfA를 과발현하는 균주의 향상된 생산성을 나타낸다.
실시예 18: (30L) 발효 실행에서 3-FL 생산 대장균 숙주의 생산성을 향상시키는 막 단백질 IceT.
막 단백질을 발현하는 다른 3-FL 생산 대장균 숙주를 30L 생물반응기에서 이의 생산성에 대해 평가하였다. 상기 3-FL 균주는 제1 플라스미드 유래의 TU3에서 발현되는 서열번호: 05의 막 단백질 유전자 EcIceT 및 제2 플라스미드로부터 발현된 α1,3-푸코실 트란스퍼라제 FT2를 갖는다. 3-FL 생산 숙주와 동일하지만 막 단백질 유전자 구조체가 결여된 특정 참조 균주를 사용하여 동일한 발효 설정에서 3-FL 생산성을 분석하였다. 도 17은 특정 참조 균주와 비교하여 막 단백질을 과발현시키는 균주의 생산성이 향상되었음을 나타낸다.
실시예 19: 20 g/L 락토스가 보충된 최소 배지에서의 성장 실험에서 72시간 배양된 3-FL 대장균 숙주에서 3-FL 생성, 및/또는 3-FL 분비, 및/또는 성장 속도를 향상시키는, EcMdfA 또는 EcIceT에 상동인 막 단백질.
α1,3-푸코실 트란스퍼라제 효소 FT1 또는 FT2에 의해 3-FL 생산 숙주에서 세포내 생성되는 3-FL 생성 및/또는 3-FL의 분비를 향상시킬 수 있고 및/또는 3-FL 대장균 숙주의 성장 속도를 향상시키는, 서열번호: 120의 막 단백질 (서열번호: 06의 EcIceT에 상동), 및 서열번호: 126, 128, 140, 146 및 150의 막 단백질 (서열번호: 02의 막 단백질 EcMdfA에 상동)을 평가하기 위한 실험을 설정하였다. 외수송 유전자가 다른 전사 유닛에 클로닝되었고, 3-FL 생산 숙주에 클론 벡터 (pSC101 ori)로 제시되었다. 실시예 3에 제공된 배양 조건에 따라 성장 실험을 수행하였다. 각 참조 균주와 비교하여 상대 퍼센트로, 도 18은 CPI를 나타내고, 도 19는 3-FL 외수송을 나타내며, 도 20은 성장 속도가 향상된 숙주를 나타내었다.
실시예 20: 폴리펩티드 서열들 간의 전체 동일성 퍼센트의 계산.
서열들의 비교를 위한 정렬 방법은 당해 분야에 잘 알려져 있으며, 이러한 방법은 GAP, BESTFIT, BLAST, FASTA 및 TFASTA를 포함한다. GAP는 Needleman 및 Wunsch의 알고리즘 ((1970) J Mol Biol 48: 443-453)을 사용하여, 두 서열들의 매치되는 수를 최대화하고 갭 (gap)의 수를 최소화하는, 두 서열들의 전체 (즉, 전체 서열에 걸쳐) 정렬을 찾는다. BLAST 알고리즘 (Altschul et al. (1990) J Mol Biol 215: 403-10)은 서열 동일성 퍼센트를 계산하고, 두 서열들 간의 유사성에 대한 통계적 분석을 수행하였다. BLAST 분석을 수행하기 위한 소프트웨어는 NCBI (National Centre for Biotechnology Information)를 통해 공개적으로 이용 가능하다. 상동체는 예를 들어 디폴트 쌍별 정렬 파라미터 (default pairwise alignment parameters), 및 퍼센트로 표시되는 스코어링 방법 (scoring method)을 사용하는, ClustalW 다중 서열 정렬 알고리즘 (ClustalW multiple sequence alignment algorithm) (버젼 1.83)을 사용하여 쉽게 확인될 수 있다. 유사성 및 동일성의 전체 퍼센트는 MatGAT 소프트웨어 패키지 (Campanella et al., BMC Bioinformatics. 2003 Jul 10;4:29. MatGAT: an application that generates similarity/identity matrices using protein or DNA sequences.)에서 이용 가능한 방법들 중 한 방법을 사용하여 결정될 수 있다. 당업자에게 명백한 바와 같이, 보존된 모티프들 간의 정렬을 최적화하기 위해 약간의 수동 편집이 수행될 수 있다. 또한, 상동체 확인을 위해 전장 서열을 사용하는 대신에, 특정 도메인이 또한 사용될 수 있다. 서열 동일성 값은 디폴트 파라미터를 사용하는 상기 언급한 프로그램을 사용하여, 전체 핵산 또는 아미노산 서열, 또는 선택된 도메인 또는 보존된 모티프(들)에 대해 결정될 수 있다. 국소 정렬의 경우, Smith-Waterman 알고리즘이 특히 유용하다 (Smith TF, Waterman MS (1981) J. Mol. Biol 147(1);195-7).
본 발명의 방법을 수행하는데 유용한 전장 폴리펩티드 서열들 간의 유사성 및 동일성의 전체 퍼센트는 MatGAT (Matrix Global Alignment Tool) 소프트웨어 (BMC Bioinformatics. 2003 4:29. MatGAT: an application that generates similarity/identity matrices using protein or DNA sequences. Campanella JJ, Bitincka L, S malley J; software hosted by Ledion Bitincka)를 사용하여 결정하였다. MatGAT는 데이터를 사전 정렬할 필요 없이 DNA 또는 단백질 서열에 대한 유사성/동일성 매트릭스를 생성한다. 이 프로그램은 Myers 및 Miller 전체 정렬 알고리즘을 사용하여 계열 쌍별 정렬을 수행하고, 유사성 및 동일성을 계산한 다음에, 결과를 거리 매트릭스. 1. CYP704-유사 폴리펩티드 (distance matrix. 1. CYP704-like polypeptides)에 배치하였다.
예시되는 분석 결과는 EcMdfA (서열번호: 2) 및 EcIceT (서열번호: 6)와 관련된 폴리펩티드 서열의 전장에 걸쳐 전체 동일성에 대해 도 21 및 22에 제시하였다. 서열 동일성은 대각선 구분선의 위쪽 절반에 표시된다. 비교에 사용된 파라미터는 하기와 같다: 스코어링 매트릭스 (Scoring matrix): Blosum62, 제1 갭 (First Gap): 12, 연장 갭 (Extending Gap): 2. 본 발명의 방법을 수행하는데 유용한 EcMdfA 막 단백질 및 이의 상동체 간의 서열 동일성 (퍼센트)은 일반적으로 80% 초과이다. 본 발명의 방법을 수행하는데 유용한 EcIceT 막 단백질 및 이의 상동체 간의 서열 동일성 퍼센트는 일반적으로 80% 초과이다.
실시예 21: 20 g/L 락토스가 보충된 최소 배지에서의 성장 실험에서 72시간 배양된 대장균 숙주에서 3-푸코실락토스 (3-FL) 생성을 향상시키는 막 단백질 확인
20 g/L 락토스가 보충된 최소 배지에서 성장하는 숙주 세포의 푸코실락토스 생성을 향상시키는 능력에 대해 막 단백질을 평가하기 위한 실험을 설정하였다. 서열번호: 52, 54, 56, 58, 60, 62, 64, 66, 70, 72, 74, 76, 80, 82, 84, 88, 90, 92, 94, 96, 98, 104, 184, 204 및 208의 막 단백질은 α1,3-푸코실트란스퍼라제 FT2를 발현하는 3-FL 생산 숙주에서 생성되는 3-FL 생성을 향상시킬 수 있음을 보여주었다. 후보 유전자가 전사 유닛 TU1, TU2, TU3, TU11 또는 TU12에서 조합되었고, pSC101 플라스미드로 3-FL 생산 숙주에 제시되었다. 실시예 3에 제공된 배양 조건에 따라 성장 실험을 수행하였다. 도 23은 각 참조 균주와 비교하여 상대 퍼센트로, 균주의 CPI를 나타낸다.
실시예 22: 20 g/L 락토스가 보충된 최소 배지에서의 성장 실험에서 72시간 배양된 대장균 숙주에서 2'-푸코실락토스 (2'-FL) 생성을 향상시키는 막 단백질 확인
20 g/L 락토스가 보충된 최소 배지에서 성장하는 숙주 세포의 푸코실락토스 생성을 향상시키는 능력에 대해 막 단백질을 평가하기 위한 실험을 설정하였다. 서열번호: 204 및 214의 막 단백질은 α1,2-푸코실트란스퍼라제 FT4를 발현하는 2'-FL 생산 숙주에서 생성되는 2'-FL 생성을 향상시킬 수 있음을 보여주었다. 후보 유전자가 전사 유닛 TU11에서 조합되었고, pSC101 플라스미드로 2'-FL 생산 숙주에 제시되었다. 실시예 3에 제공된 배양 조건에 따라 성장 실험을 수행하였다. 도 24는 각 참조 균주와 비교하여 상대 퍼센트로, 균주의 CPI를 나타낸다.
실시예 23: 20 g/L 락토스가 보충된 최소 배지에서의 성장 실험에서 72시간 배양된 대장균 숙주에서 2'-FL 분비를 향상시키는 막 단백질 확인
20 g/L 락토스가 보충된 최소 배지에서 성장하는 숙주 세포의 푸코실락토스 분비를 향상시키는 능력에 대해 막 단백질을 평가하기 위한 실험을 설정하였다. 서열번호: 206, 208, 214, 216 및 218의 막 단백질은 α1,2-푸코실트란스퍼라제 FT4를 발현하는 2'-FL 박테리아 생산 숙주에서 세포내 생성되는 2'-FL의 분비를 향상시킬 수 있음을 보여주었다. 후보 유전자가 전사 유닛 TU11에서 조합되었고, pSC101 플라스미드로 2'-FL 생산 숙주에 제시되었다. 실시예 3에 제공된 배양 조건에 따라 성장 실험을 수행하였다. 도 25는 각 참조 균주와 비교하여 상대 퍼센트로, 균주에서 2'-FL의 외수송 비율을 나타낸다.
SEQUENCE LISTING
<110> Inbiose N.V.
<120> Production of fucosyllactose in host cells
<130> 007-pcT
<150> 19187404.9
<151> 2019-07-19
<160> 220
<170> PatentIn version 3.5
<210> 1
<211> 1233
<212> DNA
<213> Escherichia coli K12 MG1655
<400> 1
atgcaaaata aattagcttc cggtgccagg cttggacgtc aggcgttact tttccctctc 60
tgtctggtgc tttacgaatt ttcaacctat atcggcaacg atatgattca acccggtatg 120
ttggccgtgg tggaacaata tcaggcgggc attgattggg ttcctacttc gatgaccgcg 180
tatctggcgg gcgggatgtt tttacaatgg ctgctggggc cgctgtcgga tcgtattggt 240
cgccgtccgg tgatgctggc gggagtggtg tggtttatcg tcacctgtct ggcaatattg 300
ctggcgcaaa acattgaaca attcaccctg ttgcgcttct tgcagggcat aagcctctgt 360
ttcattggcg ctgtgggata cgccgcaatt caggaatcct tcgaagaggc ggtttgtatc 420
aagatcaccg cgctgatggc gaacgtggcg ctgattgctc cgctacttgg tccgctggtg 480
ggcgcggcgt ggatccatgt gctgccctgg gaggggatgt ttgttttgtt tgccgcattg 540
gcagcgatct cctttttcgg tctgcaacga gccatgcctg aaaccgccac gcgtataggc 600
gagaaactgt cactgaaaga actcggtcgt gactataagc tggtgctgaa gaacggccgc 660
tttgtggcgg gggcgctggc gctgggattc gttagtctgc cgttgctggc gtggatcgcc 720
cagtcgccga ttatcatcat taccggcgag cagttgagca gctatgaata tggcttgctg 780
caagtgccta ttttcggggc gttaattgcg ggtaacttgc tgttagcgcg tctgacctcg 840
cgccgcaccg tacgttcgct gattattatg ggcggctggc cgattatgat tggtctattg 900
gtcgctgctg cggcaacggt tatctcatcg cacgcgtatt tatggatgac tgccgggtta 960
agtatttatg ctttcggtat tggtctggcg aatgcgggac tggtgcgatt aaccctgttt 1020
gccagcgata tgagtaaagg tacggtttct gccgcgatgg gaatgctgca aatgctgatc 1080
tttaccgttg gtattgaaat cagcaaacat gcctggctga acgggggcaa cggactgttt 1140
aatctcttca accttgtcaa cggaattttg tggctgtcgc tgatggttat ctttttaaaa 1200
gataaacaga tgggaaattc tcacgaaggg taa 1233
<210> 2
<211> 410
<212> PRT
<213> Escherichia coli K12 MG1655
<400> 2
Met Gln Asn Lys Leu Ala Ser Gly Ala Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln
35 40 45
Ala Gly Ile Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Ala Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Ile Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Leu Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Ile His Val Leu Pro Trp Glu Gly Met Phe Val Leu
165 170 175
Phe Ala Ala Leu Ala Ala Ile Ser Phe Phe Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Ile Gly Glu Lys Leu Ser Leu Lys Glu Leu
195 200 205
Gly Arg Asp Tyr Lys Leu Val Leu Lys Asn Gly Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Ile Ile Ile Ile Thr Gly Glu Gln Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn
260 265 270
Leu Leu Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Ile Met Ile Gly Leu Leu Val Ala Ala Ala
290 295 300
Ala Thr Val Ile Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Ile Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Ile Ser
355 360 365
Lys His Ala Trp Leu Asn Gly Gly Asn Gly Leu Phe Asn Leu Phe Asn
370 375 380
Leu Val Asn Gly Ile Leu Trp Leu Ser Leu Met Val Ile Phe Leu Lys
385 390 395 400
Asp Lys Gln Met Gly Asn Ser His Glu Gly
405 410
<210> 3
<211> 1254
<212> DNA
<213> Escherichia coli K12 MG1655
<400> 3
atgagccgta ctacaactgt tgatggcgct ccggcaagcg acactgacaa gcaaagcatt 60
tctcagccaa atcaatttat taaacgcggt acgccgcaat ttatgcgcgt caccctggcg 120
ctgttctctg ccggactggc aacatttgca cttctctatt gtgtgcagcc tatccttccg 180
gtgctttcgc aggagtttgg cttaaccccc gcgaacagta gtatttcact gtccatttcc 240
acggcgatgt tggctattgg tttgctgttt actggcccgc tatccgatgc cattggtcgc 300
aaaccagtga tggtcacggc gctactgttg gcctccattt gtacgttact ttcgacaatg 360
atgaccagct ggcacggcat tttgattatg cgcgccttga ttgggctttc gttaagtggc 420
gtggcagctg ttggcatgac ttatcttagc gaggaaatcc atcccagttt cgtggccttt 480
tcaatggggt tgtatatcag cggcaactca attggcggca tgagcggacg cttaattagc 540
ggtgtcttca cggacttttt caactggcga attgctctgg cggcaatcgg ttgtttcgcg 600
ctggcctcgg cgttgatgtt ctggaaaatc ctccctgaat cacgccattt tcgcccgact 660
tcgctgcgcc ctaagacgtt gtttatcaac tttcgtctgc actggcgtga ccggggatta 720
ccgttattgt tcgcagaagg ctttttgctg atggggtcgt tcgtcacgct gtttaattac 780
atcggctatc ggttgatgct ctccccctgg catgtcagtc aggccgtggt tggcttatta 840
tcgctggctt atttgaccgg tacatggagc tcacccaaag ccggaaccat gaccacccgc 900
tatgggcgtg gtccagtgat gttgttttcg acgggggtta tgctgtttgg tttactgatg 960
accttattca gctcgctgtg gctgatcttt gccggaatgt tactcttctc agcaggattc 1020
ttcgcagccc actcagtagc cagcagctgg atcggccccc gcgcaaaacg cgctaaaggc 1080
caggcctcct cgctgtatct gttcagttac tatctggggt cgagtattgc cgggacgctg 1140
ggtggtgttt tctggcataa ctatggctgg aacggcgtcg gcgcatttat tgctctgatg 1200
ctggtcattg ctctgctggt cgggacgcgt ttgcatcgtc gtctgcacgc ctaa 1254
<210> 4
<211> 417
<212> PRT
<213> Escherichia coli K12 MG1655
<400> 4
Met Ser Arg Thr Thr Thr Val Asp Gly Ala Pro Ala Ser Asp Thr Asp
1 5 10 15
Lys Gln Ser Ile Ser Gln Pro Asn Gln Phe Ile Lys Arg Gly Thr Pro
20 25 30
Gln Phe Met Arg Val Thr Leu Ala Leu Phe Ser Ala Gly Leu Ala Thr
35 40 45
Phe Ala Leu Leu Tyr Cys Val Gln Pro Ile Leu Pro Val Leu Ser Gln
50 55 60
Glu Phe Gly Leu Thr Pro Ala Asn Ser Ser Ile Ser Leu Ser Ile Ser
65 70 75 80
Thr Ala Met Leu Ala Ile Gly Leu Leu Phe Thr Gly Pro Leu Ser Asp
85 90 95
Ala Ile Gly Arg Lys Pro Val Met Val Thr Ala Leu Leu Leu Ala Ser
100 105 110
Ile Cys Thr Leu Leu Ser Thr Met Met Thr Ser Trp His Gly Ile Leu
115 120 125
Ile Met Arg Ala Leu Ile Gly Leu Ser Leu Ser Gly Val Ala Ala Val
130 135 140
Gly Met Thr Tyr Leu Ser Glu Glu Ile His Pro Ser Phe Val Ala Phe
145 150 155 160
Ser Met Gly Leu Tyr Ile Ser Gly Asn Ser Ile Gly Gly Met Ser Gly
165 170 175
Arg Leu Ile Ser Gly Val Phe Thr Asp Phe Phe Asn Trp Arg Ile Ala
180 185 190
Leu Ala Ala Ile Gly Cys Phe Ala Leu Ala Ser Ala Leu Met Phe Trp
195 200 205
Lys Ile Leu Pro Glu Ser Arg His Phe Arg Pro Thr Ser Leu Arg Pro
210 215 220
Lys Thr Leu Phe Ile Asn Phe Arg Leu His Trp Arg Asp Arg Gly Leu
225 230 235 240
Pro Leu Leu Phe Ala Glu Gly Phe Leu Leu Met Gly Ser Phe Val Thr
245 250 255
Leu Phe Asn Tyr Ile Gly Tyr Arg Leu Met Leu Ser Pro Trp His Val
260 265 270
Ser Gln Ala Val Val Gly Leu Leu Ser Leu Ala Tyr Leu Thr Gly Thr
275 280 285
Trp Ser Ser Pro Lys Ala Gly Thr Met Thr Thr Arg Tyr Gly Arg Gly
290 295 300
Pro Val Met Leu Phe Ser Thr Gly Val Met Leu Phe Gly Leu Leu Met
305 310 315 320
Thr Leu Phe Ser Ser Leu Trp Leu Ile Phe Ala Gly Met Leu Leu Phe
325 330 335
Ser Ala Gly Phe Phe Ala Ala His Ser Val Ala Ser Ser Trp Ile Gly
340 345 350
Pro Arg Ala Lys Arg Ala Lys Gly Gln Ala Ser Ser Leu Tyr Leu Phe
355 360 365
Ser Tyr Tyr Leu Gly Ser Ser Ile Ala Gly Thr Leu Gly Gly Val Phe
370 375 380
Trp His Asn Tyr Gly Trp Asn Gly Val Gly Ala Phe Ile Ala Leu Met
385 390 395 400
Leu Val Ile Ala Leu Leu Val Gly Thr Arg Leu His Arg Arg Leu His
405 410 415
Ala
<210> 5
<211> 1416
<212> DNA
<213> Escherichia coli K12 MG1655
<400> 5
atgacagatc ttcccgacag cacccgttgg caattgtgga ttgtggcttt cggcttcttt 60
atgcagtcgc tggacaccac catcgtaaac accgcccttc cctcaatggc gcaaagcctc 120
ggggaaagtc cgttgcatat gcacatggtc attgtctctt atgtgctgac cgtggcggtg 180
atgctgcccg ccagcggctg gctggcggac aaagtcggcg tgcgcaatat tttctttacc 240
gccatcgtgc tgtttactct cggttcactg ttttgcgcgc tttccggcac gctgaacgaa 300
ctgttgctgg cacgcgcgtt acagggcgtt ggcggcgcga tgatggtgcc ggtcggcaga 360
ttgacggtga tgaaaatcgt accgcgcgag caatatatgg cggcgatgac ctttgtcacg 420
ttacccggtc aggtcggtcc gctgctcggt ccggcgctcg gcggtctgct ggtggagtac 480
gcatcgtggc actggatctt tttgatcaac attccggtgg ggattatcgg tgcgatcgcc 540
acattgctgt taatgccgaa ctacaccatg cagacgcggc gctttgatct ctccggattt 600
ttattgctgg cggttggcat ggcggtatta accctggcgc tggacggcag taaaggtaca 660
ggtttatcgc cgctgacgat tgcaggcctg gtcgcagttg gcgtggtggc actggtgctt 720
tatctgctgc acgccagaaa taacaaccgt gccctgttca gtctgaaact gttccgtact 780
cgtacctttt cgctgggcct ggcggggagc tttgccggac gtattggcag tggcatgttg 840
ccctttatga caccggtttt cctgcaaatt ggcctcggtt tctcgccgtt tcatgccgga 900
ctgatgatga tcccgatggt gcttggcagc atgggaatga agcgaattgt ggtacaggtg 960
gtgaatcgct ttggttatcg tcgggtactg gtagcgacca cgctgggtct gtcgctggtc 1020
accctgttgt ttatgactac cgccctgctg ggctggtact acgttttgcc gttcgtcctg 1080
tttttacaag ggatggtcaa ctcgacgcgt ttctcctcca tgaacaccct gacgctgaaa 1140
gatctcccgg acaatctggc gagcagcggc aacagcctgc tgtcgatgat tatgcaattg 1200
tcgatgagta tcggcgtcac tatcgccggg ctgttgctgg gactttttgg ttcacagcat 1260
gtcagcgtcg acagcggcac cacacaaacc gtctttatgt acacctggct tagcatggcg 1320
ttgatcatcg cccttccggc gttcatcttt gccagagtgc cgaacgatac gcatcaaaat 1380
gtagctattt cgcggcgaaa aaggagcgcg caataa 1416
<210> 6
<211> 471
<212> PRT
<213> Escherichia coli K12 MG1655
<400> 6
Met Thr Asp Leu Pro Asp Ser Thr Arg Trp Gln Leu Trp Ile Val Ala
1 5 10 15
Phe Gly Phe Phe Met Gln Ser Leu Asp Thr Thr Ile Val Asn Thr Ala
20 25 30
Leu Pro Ser Met Ala Gln Ser Leu Gly Glu Ser Pro Leu His Met His
35 40 45
Met Val Ile Val Ser Tyr Val Leu Thr Val Ala Val Met Leu Pro Ala
50 55 60
Ser Gly Trp Leu Ala Asp Lys Val Gly Val Arg Asn Ile Phe Phe Thr
65 70 75 80
Ala Ile Val Leu Phe Thr Leu Gly Ser Leu Phe Cys Ala Leu Ser Gly
85 90 95
Thr Leu Asn Glu Leu Leu Leu Ala Arg Ala Leu Gln Gly Val Gly Gly
100 105 110
Ala Met Met Val Pro Val Gly Arg Leu Thr Val Met Lys Ile Val Pro
115 120 125
Arg Glu Gln Tyr Met Ala Ala Met Thr Phe Val Thr Leu Pro Gly Gln
130 135 140
Val Gly Pro Leu Leu Gly Pro Ala Leu Gly Gly Leu Leu Val Glu Tyr
145 150 155 160
Ala Ser Trp His Trp Ile Phe Leu Ile Asn Ile Pro Val Gly Ile Ile
165 170 175
Gly Ala Ile Ala Thr Leu Leu Leu Met Pro Asn Tyr Thr Met Gln Thr
180 185 190
Arg Arg Phe Asp Leu Ser Gly Phe Leu Leu Leu Ala Val Gly Met Ala
195 200 205
Val Leu Thr Leu Ala Leu Asp Gly Ser Lys Gly Thr Gly Leu Ser Pro
210 215 220
Leu Thr Ile Ala Gly Leu Val Ala Val Gly Val Val Ala Leu Val Leu
225 230 235 240
Tyr Leu Leu His Ala Arg Asn Asn Asn Arg Ala Leu Phe Ser Leu Lys
245 250 255
Leu Phe Arg Thr Arg Thr Phe Ser Leu Gly Leu Ala Gly Ser Phe Ala
260 265 270
Gly Arg Ile Gly Ser Gly Met Leu Pro Phe Met Thr Pro Val Phe Leu
275 280 285
Gln Ile Gly Leu Gly Phe Ser Pro Phe His Ala Gly Leu Met Met Ile
290 295 300
Pro Met Val Leu Gly Ser Met Gly Met Lys Arg Ile Val Val Gln Val
305 310 315 320
Val Asn Arg Phe Gly Tyr Arg Arg Val Leu Val Ala Thr Thr Leu Gly
325 330 335
Leu Ser Leu Val Thr Leu Leu Phe Met Thr Thr Ala Leu Leu Gly Trp
340 345 350
Tyr Tyr Val Leu Pro Phe Val Leu Phe Leu Gln Gly Met Val Asn Ser
355 360 365
Thr Arg Phe Ser Ser Met Asn Thr Leu Thr Leu Lys Asp Leu Pro Asp
370 375 380
Asn Leu Ala Ser Ser Gly Asn Ser Leu Leu Ser Met Ile Met Gln Leu
385 390 395 400
Ser Met Ser Ile Gly Val Thr Ile Ala Gly Leu Leu Leu Gly Leu Phe
405 410 415
Gly Ser Gln His Val Ser Val Asp Ser Gly Thr Thr Gln Thr Val Phe
420 425 430
Met Tyr Thr Trp Leu Ser Met Ala Leu Ile Ile Ala Leu Pro Ala Phe
435 440 445
Ile Phe Ala Arg Val Pro Asn Asp Thr His Gln Asn Val Ala Ile Ser
450 455 460
Arg Arg Lys Arg Ser Ala Gln
465 470
<210> 7
<211> 1218
<212> DNA
<213> Escherichia coli K12 MG1655
<400> 7
atgcccgaac ccgtagccga acccgcgcta aacggattgc gcctgaattt gcgcattgtc 60
tctatagtca tgtttaactt cgccagctac ctcaccatcg ggttgccgct cgctgtatta 120
ccgggctatg tccatgatgt gatgggcttt agcgccttct gggcaggatt ggttatcagc 180
ctgcaatatt tcgccacctt gctgagccgc cctcatgccg gacgttacgc cgattcgctg 240
ggacccaaaa agattgtcgt cttcggttta tgcggctgct ttttgagcgg tctggggtat 300
ctgacggcag gattaaccgc cagtctgcct gtcatcagcc tgttattact ttgcctgggg 360
cgcgtcatcc ttgggattgg gcaaagtttt gccggaacgg gatcgaccct atggggcgtt 420
ggcgtggttg gctcgctgca tatcgggcgg gtgatttcgt ggaacggcat tgtcacttac 480
ggggcgatgg cgatgggtgc gccgttaggc gtcgtgtttt atcactgggg cggcttgcag 540
gcgttagcgt taatcattat gggcgtggcg ctggtggcca ttttgttggc gatcccgcgt 600
ccgacggtaa aagccagtaa aggcaaaccg ctgccgtttc gcgcggtgct tgggcgcgtc 660
tggctgtacg gtatggcgct ggcactggct tccgccggat ttggcgtcat cgccaccttt 720
atcacgctgt tttatgacgc taaaggttgg gacggtgcgg ctttcgcgct gacgctgttt 780
agctgtgcgt ttgtcggtac gcgtttgtta ttccctaacg gcattaaccg tatcggtggc 840
ttaaacgtag cgatgatttg ctttagcgtt gagataatcg gcctgctact ggttggcgtg 900
gcgactatgc cgtggatggc gaaaatcggc gtcttactgg cgggggccgg gttttcgctg 960
gtgttcccgg cattgggtgt agtggcggta aaagcggttc cgcagcaaaa tcagggggcg 1020
gcgctggcaa cttacaccgt atttatggat ttatcgcttg gcgtgactgg accactggct 1080
gggctggtga tgagctgggc gggcgtaccg gtgatttatc tggcggcggc gggactggtc 1140
gcaatcgcgt tattactgac gtggcgatta aaaaaacggc ctccggaaca cgtccctgag 1200
gccgcctcat catcttaa 1218
<210> 8
<211> 405
<212> PRT
<213> Escherichia coli K12 MG1655
<400> 8
Met Pro Glu Pro Val Ala Glu Pro Ala Leu Asn Gly Leu Arg Leu Asn
1 5 10 15
Leu Arg Ile Val Ser Ile Val Met Phe Asn Phe Ala Ser Tyr Leu Thr
20 25 30
Ile Gly Leu Pro Leu Ala Val Leu Pro Gly Tyr Val His Asp Val Met
35 40 45
Gly Phe Ser Ala Phe Trp Ala Gly Leu Val Ile Ser Leu Gln Tyr Phe
50 55 60
Ala Thr Leu Leu Ser Arg Pro His Ala Gly Arg Tyr Ala Asp Ser Leu
65 70 75 80
Gly Pro Lys Lys Ile Val Val Phe Gly Leu Cys Gly Cys Phe Leu Ser
85 90 95
Gly Leu Gly Tyr Leu Thr Ala Gly Leu Thr Ala Ser Leu Pro Val Ile
100 105 110
Ser Leu Leu Leu Leu Cys Leu Gly Arg Val Ile Leu Gly Ile Gly Gln
115 120 125
Ser Phe Ala Gly Thr Gly Ser Thr Leu Trp Gly Val Gly Val Val Gly
130 135 140
Ser Leu His Ile Gly Arg Val Ile Ser Trp Asn Gly Ile Val Thr Tyr
145 150 155 160
Gly Ala Met Ala Met Gly Ala Pro Leu Gly Val Val Phe Tyr His Trp
165 170 175
Gly Gly Leu Gln Ala Leu Ala Leu Ile Ile Met Gly Val Ala Leu Val
180 185 190
Ala Ile Leu Leu Ala Ile Pro Arg Pro Thr Val Lys Ala Ser Lys Gly
195 200 205
Lys Pro Leu Pro Phe Arg Ala Val Leu Gly Arg Val Trp Leu Tyr Gly
210 215 220
Met Ala Leu Ala Leu Ala Ser Ala Gly Phe Gly Val Ile Ala Thr Phe
225 230 235 240
Ile Thr Leu Phe Tyr Asp Ala Lys Gly Trp Asp Gly Ala Ala Phe Ala
245 250 255
Leu Thr Leu Phe Ser Cys Ala Phe Val Gly Thr Arg Leu Leu Phe Pro
260 265 270
Asn Gly Ile Asn Arg Ile Gly Gly Leu Asn Val Ala Met Ile Cys Phe
275 280 285
Ser Val Glu Ile Ile Gly Leu Leu Leu Val Gly Val Ala Thr Met Pro
290 295 300
Trp Met Ala Lys Ile Gly Val Leu Leu Ala Gly Ala Gly Phe Ser Leu
305 310 315 320
Val Phe Pro Ala Leu Gly Val Val Ala Val Lys Ala Val Pro Gln Gln
325 330 335
Asn Gln Gly Ala Ala Leu Ala Thr Tyr Thr Val Phe Met Asp Leu Ser
340 345 350
Leu Gly Val Thr Gly Pro Leu Ala Gly Leu Val Met Ser Trp Ala Gly
355 360 365
Val Pro Val Ile Tyr Leu Ala Ala Ala Gly Leu Val Ala Ile Ala Leu
370 375 380
Leu Leu Thr Trp Arg Leu Lys Lys Arg Pro Pro Glu His Val Pro Glu
385 390 395 400
Ala Ala Ser Ser Ser
405
<210> 9
<211> 1185
<212> DNA
<213> Escherichia coli K12 MG1655
<400> 9
atgaaaaggc aaagaaacgt caatttgtta ttgatgttgg tattactcgt ggccgtcggt 60
cagatggcgc aaaccattta tattccagct attgccgata tggcgcgcga tctcaacgtc 120
cgtgaagggg cggtgcagag cgtaatgggc gcttatctgc tgacttacgg tgtctcacag 180
ctgttttatg gcccgatttc cgaccgcgtg ggccgccgac cggtgatcct cgtcggaatg 240
tccattttta tgctggcaac gctggtcgcg gtcacgacct ccagtttgac ggtgttgatt 300
gccgccagcg cgatgcaggg gatgggcacc ggcgttggcg gcgtaatggc gcgtacttta 360
ccgcgagatt tatatgaacg gacacagttg cgccatgcta acagcctgtt aaacatgggg 420
attctcgtca gtccgttgct cgcaccgcta atcggcggtc tgctggatac gatgtggaac 480
tggcgcgcct gttatctctt tttgttggtt ctttgtgctg gtgtgacctt cagtatggcc 540
cgctggatgc cggaaacgcg tccggtcgat gcaccgcgca cgcgcctgct taccagttat 600
aaaacgcttt tcggtaacag cggttttaac tgttatttgc tgatgctgat tggcggtctg 660
gccgggattg ccgcctttga agcctgctcc ggcgtgctga tgggcgcggt gttagggctg 720
agcagtatga cggtcagtat tttgtttatt ctgccgattc cggcagcgtt ttttggcgca 780
tggtttgccg gacgtcccaa taaacgcttc tccacgttaa tgtggcagtc ggttatctgc 840
tgcctgctgg ctggcttgct gatgtggatc cccgactggt ttggcgtgat gaatgtctgg 900
acgctgctcg ttcccgccgc gctgttcttt ttcggtgccg ggatgctgtt tccgctggcg 960
accagcggcg cgatggagcc gttccccttc ctggcgggca cggctggcgc gctggtcggc 1020
ggtctgcaaa acattggttc cggcgtgctg gcgtcgctct ctgcgatgtt gccgcaaacc 1080
ggtcagggca gcctggggtt gttgatgacc ttaatgggat tgttgatcgt gctgtgctgg 1140
ctgccgctgg cgacgcggat gtcgcatcag gggcagcccg tttaa 1185
<210> 10
<211> 394
<212> PRT
<213> Escherichia coli K12 MG1655
<400> 10
Met Lys Arg Gln Arg Asn Val Asn Leu Leu Leu Met Leu Val Leu Leu
1 5 10 15
Val Ala Val Gly Gln Met Ala Gln Thr Ile Tyr Ile Pro Ala Ile Ala
20 25 30
Asp Met Ala Arg Asp Leu Asn Val Arg Glu Gly Ala Val Gln Ser Val
35 40 45
Met Gly Ala Tyr Leu Leu Thr Tyr Gly Val Ser Gln Leu Phe Tyr Gly
50 55 60
Pro Ile Ser Asp Arg Val Gly Arg Arg Pro Val Ile Leu Val Gly Met
65 70 75 80
Ser Ile Phe Met Leu Ala Thr Leu Val Ala Val Thr Thr Ser Ser Leu
85 90 95
Thr Val Leu Ile Ala Ala Ser Ala Met Gln Gly Met Gly Thr Gly Val
100 105 110
Gly Gly Val Met Ala Arg Thr Leu Pro Arg Asp Leu Tyr Glu Arg Thr
115 120 125
Gln Leu Arg His Ala Asn Ser Leu Leu Asn Met Gly Ile Leu Val Ser
130 135 140
Pro Leu Leu Ala Pro Leu Ile Gly Gly Leu Leu Asp Thr Met Trp Asn
145 150 155 160
Trp Arg Ala Cys Tyr Leu Phe Leu Leu Val Leu Cys Ala Gly Val Thr
165 170 175
Phe Ser Met Ala Arg Trp Met Pro Glu Thr Arg Pro Val Asp Ala Pro
180 185 190
Arg Thr Arg Leu Leu Thr Ser Tyr Lys Thr Leu Phe Gly Asn Ser Gly
195 200 205
Phe Asn Cys Tyr Leu Leu Met Leu Ile Gly Gly Leu Ala Gly Ile Ala
210 215 220
Ala Phe Glu Ala Cys Ser Gly Val Leu Met Gly Ala Val Leu Gly Leu
225 230 235 240
Ser Ser Met Thr Val Ser Ile Leu Phe Ile Leu Pro Ile Pro Ala Ala
245 250 255
Phe Phe Gly Ala Trp Phe Ala Gly Arg Pro Asn Lys Arg Phe Ser Thr
260 265 270
Leu Met Trp Gln Ser Val Ile Cys Cys Leu Leu Ala Gly Leu Leu Met
275 280 285
Trp Ile Pro Asp Trp Phe Gly Val Met Asn Val Trp Thr Leu Leu Val
290 295 300
Pro Ala Ala Leu Phe Phe Phe Gly Ala Gly Met Leu Phe Pro Leu Ala
305 310 315 320
Thr Ser Gly Ala Met Glu Pro Phe Pro Phe Leu Ala Gly Thr Ala Gly
325 330 335
Ala Leu Val Gly Gly Leu Gln Asn Ile Gly Ser Gly Val Leu Ala Ser
340 345 350
Leu Ser Ala Met Leu Pro Gln Thr Gly Gln Gly Ser Leu Gly Leu Leu
355 360 365
Met Thr Leu Met Gly Leu Leu Ile Val Leu Cys Trp Leu Pro Leu Ala
370 375 380
Thr Arg Met Ser His Gln Gly Gln Pro Val
385 390
<210> 11
<211> 1212
<212> DNA
<213> Escherichia coli K12 MG1655
<400> 11
atgcaacctg ggaaaagatt tttagtctgg ctggcgggtt tgagcgtact cggttttctg 60
gcaaccgata tgtatctgcc tgctttcgcc gccatacagg ccgacctgca aacgcctgcg 120
tctgctgtca gtgccagcct tagtctgttc cttgccggtt ttgccgcagc ccagcttctg 180
tgggggccgc tctccgaccg ttatggtcgt aaaccggtat tattaatcgg cctgacaatt 240
tttgcgttag gtagtctggg gatgctgtgg gtagaaaacg ccgctacgct gctggtattg 300
cgttttgtac aggctgtggg tgtctgcgcc gcggcggtta tctggcaagc attagtgaca 360
gattattatc cttcacagaa agttaaccgt atttttgcgg ccatcatgcc gctggtgggt 420
ctatctccgg cactggctcc tctgttagga agctggctgc tggtccattt ttcctggcag 480
gcgattttcg ccaccctgtt tgccattacc gtggtgctga ttctgcctat tttctggctc 540
aaacccacga cgaaggcccg taacaatagt caggatggtc tgacctttac cgacctgcta 600
cgttctaaaa cctatcgcgg caacgtgctg atatacgcag cctgttcagc cagttttttt 660
gcatggctga ccggttcacc gttcatcctt agtgaaatgg gctacagccc ggcagttatt 720
ggtttaagtt atgtcccgca aactatcgcg tttctgattg gtggttatgg ctgtcgcgcc 780
gcgctgcaga aatggcaagg caagcagtta ttaccgtggt tgctggtgct gtttgctgtc 840
agcgtcattg cgacctgggc tgcgggcttc attagccatg tgtcgctggt cgaaatcctg 900
atcccattct gtgtgatggc gattgccaat ggcgcgatct accctattgt tgtcgcccag 960
gcgctgcgtc ccttcccaca cgcaactggt cgcgccgcag cgttgcagaa cactcttcaa 1020
ctgggtctgt gcttcctcgc aagtctggta gtttcctggc tgatcagtat cagcacgcca 1080
ttgctcacca ccaccagcgt gatgttatca acagtagtgc tggtcgcgct gggttacatg 1140
atgcaacgtt gtgaagaagt tggctgccag aatcatggca atgccgaagt cgctcatagc 1200
gaatcacact aa 1212
<210> 12
<211> 403
<212> PRT
<213> Escherichia coli K12 MG1655
<400> 12
Met Gln Pro Gly Lys Arg Phe Leu Val Trp Leu Ala Gly Leu Ser Val
1 5 10 15
Leu Gly Phe Leu Ala Thr Asp Met Tyr Leu Pro Ala Phe Ala Ala Ile
20 25 30
Gln Ala Asp Leu Gln Thr Pro Ala Ser Ala Val Ser Ala Ser Leu Ser
35 40 45
Leu Phe Leu Ala Gly Phe Ala Ala Ala Gln Leu Leu Trp Gly Pro Leu
50 55 60
Ser Asp Arg Tyr Gly Arg Lys Pro Val Leu Leu Ile Gly Leu Thr Ile
65 70 75 80
Phe Ala Leu Gly Ser Leu Gly Met Leu Trp Val Glu Asn Ala Ala Thr
85 90 95
Leu Leu Val Leu Arg Phe Val Gln Ala Val Gly Val Cys Ala Ala Ala
100 105 110
Val Ile Trp Gln Ala Leu Val Thr Asp Tyr Tyr Pro Ser Gln Lys Val
115 120 125
Asn Arg Ile Phe Ala Ala Ile Met Pro Leu Val Gly Leu Ser Pro Ala
130 135 140
Leu Ala Pro Leu Leu Gly Ser Trp Leu Leu Val His Phe Ser Trp Gln
145 150 155 160
Ala Ile Phe Ala Thr Leu Phe Ala Ile Thr Val Val Leu Ile Leu Pro
165 170 175
Ile Phe Trp Leu Lys Pro Thr Thr Lys Ala Arg Asn Asn Ser Gln Asp
180 185 190
Gly Leu Thr Phe Thr Asp Leu Leu Arg Ser Lys Thr Tyr Arg Gly Asn
195 200 205
Val Leu Ile Tyr Ala Ala Cys Ser Ala Ser Phe Phe Ala Trp Leu Thr
210 215 220
Gly Ser Pro Phe Ile Leu Ser Glu Met Gly Tyr Ser Pro Ala Val Ile
225 230 235 240
Gly Leu Ser Tyr Val Pro Gln Thr Ile Ala Phe Leu Ile Gly Gly Tyr
245 250 255
Gly Cys Arg Ala Ala Leu Gln Lys Trp Gln Gly Lys Gln Leu Leu Pro
260 265 270
Trp Leu Leu Val Leu Phe Ala Val Ser Val Ile Ala Thr Trp Ala Ala
275 280 285
Gly Phe Ile Ser His Val Ser Leu Val Glu Ile Leu Ile Pro Phe Cys
290 295 300
Val Met Ala Ile Ala Asn Gly Ala Ile Tyr Pro Ile Val Val Ala Gln
305 310 315 320
Ala Leu Arg Pro Phe Pro His Ala Thr Gly Arg Ala Ala Ala Leu Gln
325 330 335
Asn Thr Leu Gln Leu Gly Leu Cys Phe Leu Ala Ser Leu Val Val Ser
340 345 350
Trp Leu Ile Ser Ile Ser Thr Pro Leu Leu Thr Thr Thr Ser Val Met
355 360 365
Leu Ser Thr Val Val Leu Val Ala Leu Gly Tyr Met Met Gln Arg Cys
370 375 380
Glu Glu Val Gly Cys Gln Asn His Gly Asn Ala Glu Val Ala His Ser
385 390 395 400
Glu Ser His
<210> 13
<211> 1251
<212> DNA
<213> Escherichia coli K12 MG1655
<400> 13
atgaataaac aatcctggct gcttaacctc agcctgttga aaacgcaccc ggcgtttcgc 60
gcagtattcc tcgctcgttt catctcaatt gtgtctctgg gtttgctcgg cgtcgcggtg 120
ccggtgcaga tccagatgat gacacattcc acctggcagg tggggctttc ggtgacgctg 180
accggcggcg cgatgtttgt tggcctgatg gtcggcggtg tgctggcgga tcgctatgag 240
cgcaaaaaag tgattttgct ggcgcgcggc acctgtggca ttggcttcat tggactgtgc 300
cttaatgcac tgctgccgga gccgtcattg ctggcaatct atttacttgg tttatgggat 360
ggttttttcg catcgcttgg cgttacggcg ctattggcgg cgacaccagc actggtaggg 420
cgtgaaaact taatgcaggc cggggcgatc accatgttga ccgtgcgtct ggggtcggtg 480
atttcgccca tgattggcgg tttattgctg gcgaccggtg gcgtagcctg gaactacggg 540
ctggcggcgg cgggcacgtt tattaccttg ctaccgttgt taagccttcc ggcgttgcca 600
ccgccaccgc agccgcgtga gcatccgttg aaatcattac tggcaggatt tcgttttctg 660
cttgccagcc cgctggtggg cgggattgcg ctgctgggtg gtttattgac gatggcgagc 720
gcggtgcggg tactgtatcc ggcgctggct gacaactggc agatgtcagc ggcacagatt 780
ggttttctct acgcggcgat cccgctcggc gcggctattg gtgcgttaac cagcgggaag 840
ctggcacata gtgcgcgacc agggttattg atgctgctct ccacgctggg atcgttcctc 900
gccattggtc tgtttggcct gatgccgatg tggattttag gcgtggtttg tctggcgctg 960
ttcggctggt tgagtgcggt cagctcgttg ctgcaataca caatgctgca aacgcaaacc 1020
ccggaagcga tgttagggcg gattaacggt ttgtggacgg cgcagaacgt gacgggcgat 1080
gccataggcg cggcgctgct gggtggtttg ggcgcgatga tgacaccggt tgcttccgca 1140
agcgcgagcg gttttggttt gttgattatc ggcgtgttgt tattgctggt gctggtggag 1200
ttgcgacatt ttcgccagac gccgccgcag gtgacagcgt ccgacagtta a 1251
<210> 14
<211> 416
<212> PRT
<213> Escherichia coli K12 MG1655
<400> 14
Met Asn Lys Gln Ser Trp Leu Leu Asn Leu Ser Leu Leu Lys Thr His
1 5 10 15
Pro Ala Phe Arg Ala Val Phe Leu Ala Arg Phe Ile Ser Ile Val Ser
20 25 30
Leu Gly Leu Leu Gly Val Ala Val Pro Val Gln Ile Gln Met Met Thr
35 40 45
His Ser Thr Trp Gln Val Gly Leu Ser Val Thr Leu Thr Gly Gly Ala
50 55 60
Met Phe Val Gly Leu Met Val Gly Gly Val Leu Ala Asp Arg Tyr Glu
65 70 75 80
Arg Lys Lys Val Ile Leu Leu Ala Arg Gly Thr Cys Gly Ile Gly Phe
85 90 95
Ile Gly Leu Cys Leu Asn Ala Leu Leu Pro Glu Pro Ser Leu Leu Ala
100 105 110
Ile Tyr Leu Leu Gly Leu Trp Asp Gly Phe Phe Ala Ser Leu Gly Val
115 120 125
Thr Ala Leu Leu Ala Ala Thr Pro Ala Leu Val Gly Arg Glu Asn Leu
130 135 140
Met Gln Ala Gly Ala Ile Thr Met Leu Thr Val Arg Leu Gly Ser Val
145 150 155 160
Ile Ser Pro Met Ile Gly Gly Leu Leu Leu Ala Thr Gly Gly Val Ala
165 170 175
Trp Asn Tyr Gly Leu Ala Ala Ala Gly Thr Phe Ile Thr Leu Leu Pro
180 185 190
Leu Leu Ser Leu Pro Ala Leu Pro Pro Pro Pro Gln Pro Arg Glu His
195 200 205
Pro Leu Lys Ser Leu Leu Ala Gly Phe Arg Phe Leu Leu Ala Ser Pro
210 215 220
Leu Val Gly Gly Ile Ala Leu Leu Gly Gly Leu Leu Thr Met Ala Ser
225 230 235 240
Ala Val Arg Val Leu Tyr Pro Ala Leu Ala Asp Asn Trp Gln Met Ser
245 250 255
Ala Ala Gln Ile Gly Phe Leu Tyr Ala Ala Ile Pro Leu Gly Ala Ala
260 265 270
Ile Gly Ala Leu Thr Ser Gly Lys Leu Ala His Ser Ala Arg Pro Gly
275 280 285
Leu Leu Met Leu Leu Ser Thr Leu Gly Ser Phe Leu Ala Ile Gly Leu
290 295 300
Phe Gly Leu Met Pro Met Trp Ile Leu Gly Val Val Cys Leu Ala Leu
305 310 315 320
Phe Gly Trp Leu Ser Ala Val Ser Ser Leu Leu Gln Tyr Thr Met Leu
325 330 335
Gln Thr Gln Thr Pro Glu Ala Met Leu Gly Arg Ile Asn Gly Leu Trp
340 345 350
Thr Ala Gln Asn Val Thr Gly Asp Ala Ile Gly Ala Ala Leu Leu Gly
355 360 365
Gly Leu Gly Ala Met Met Thr Pro Val Ala Ser Ala Ser Ala Ser Gly
370 375 380
Phe Gly Leu Leu Ile Ile Gly Val Leu Leu Leu Leu Val Leu Val Glu
385 390 395 400
Leu Arg His Phe Arg Gln Thr Pro Pro Gln Val Thr Ala Ser Asp Ser
405 410 415
<210> 15
<211> 1188
<212> DNA
<213> Escherichia coli K12 MG1655
<400> 15
atgaacttat ccctacgacg ctctaccagc gcccttcttg cctcgtcgtt gttattaacc 60
atcggacgcg gcgctacgct gccatttatg accatttact tgagtcgcca gtacagcctg 120
agtgtcgatc taatcggtta tgcgatgaca attgcgctca ctattggcgt cgtttttagc 180
ctcggttttg gtatcctggc ggataagttc gacaagaaac gctatatgtt actggcaatt 240
accgccttcg ccagcggttt tattgccatt actttagtga ataacgtgac gctggttgtg 300
ctcttttttg ccctcattaa ctgcgcctat tctgtttttg ctaccgtgct gaaagcctgg 360
tttgccgaca atctttcgtc caccagcaaa acgaaaatct tctcaatcaa ctacaccatg 420
ctaaacattg gctggaccat cggtccgccg ctcggcacgc tgttggtaat gcagagcatc 480
aatctgccct tctggctggc agctatctgt tccgcgtttc ccatgctttt cattcaaatt 540
tgggtaaagc gcagcgagaa aatcatcgcc acggaaacag gcagtgtctg gtcgccgaaa 600
gttttattac aagataaagc actgttgtgg tttacctgct ctggttttct ggcttctttt 660
gtaagcggcg catttgcttc atgcatttca caatatgtga tggtgattgc tgatggggat 720
tttgccgaaa aggtggtcgc ggttgttctt ccggtgaatg ctgccatggt ggttacgttg 780
caatattccg tgggccgccg acttaacccg gctaacatcc gcgcgctgat gacagcaggc 840
accctctgtt tcgtcatcgg tctggtcggt tttatttttt ccggcaacag cctgctattg 900
tggggtatgt cagctgcggt atttactgtc ggtgaaatca tttatgcgcc gggcgagtat 960
atgttgattg accatattgc gccgccagaa atgaaagcca gctatttttc cgcccagtct 1020
ttaggctggc ttggtgccgc gattaaccca ttagtgagtg gcgtagtgct aaccagcctg 1080
ccgccttcct cgctgtttgt catcttagcg ttggtgatca ttgctgcgtg ggtgctgatg 1140
ttaaaaggga ttcgagcaag accgtggggg cagcccgcgc tttgttaa 1188
<210> 16
<211> 395
<212> PRT
<213> Escherichia coli K12 MG1655
<400> 16
Met Asn Leu Ser Leu Arg Arg Ser Thr Ser Ala Leu Leu Ala Ser Ser
1 5 10 15
Leu Leu Leu Thr Ile Gly Arg Gly Ala Thr Leu Pro Phe Met Thr Ile
20 25 30
Tyr Leu Ser Arg Gln Tyr Ser Leu Ser Val Asp Leu Ile Gly Tyr Ala
35 40 45
Met Thr Ile Ala Leu Thr Ile Gly Val Val Phe Ser Leu Gly Phe Gly
50 55 60
Ile Leu Ala Asp Lys Phe Asp Lys Lys Arg Tyr Met Leu Leu Ala Ile
65 70 75 80
Thr Ala Phe Ala Ser Gly Phe Ile Ala Ile Thr Leu Val Asn Asn Val
85 90 95
Thr Leu Val Val Leu Phe Phe Ala Leu Ile Asn Cys Ala Tyr Ser Val
100 105 110
Phe Ala Thr Val Leu Lys Ala Trp Phe Ala Asp Asn Leu Ser Ser Thr
115 120 125
Ser Lys Thr Lys Ile Phe Ser Ile Asn Tyr Thr Met Leu Asn Ile Gly
130 135 140
Trp Thr Ile Gly Pro Pro Leu Gly Thr Leu Leu Val Met Gln Ser Ile
145 150 155 160
Asn Leu Pro Phe Trp Leu Ala Ala Ile Cys Ser Ala Phe Pro Met Leu
165 170 175
Phe Ile Gln Ile Trp Val Lys Arg Ser Glu Lys Ile Ile Ala Thr Glu
180 185 190
Thr Gly Ser Val Trp Ser Pro Lys Val Leu Leu Gln Asp Lys Ala Leu
195 200 205
Leu Trp Phe Thr Cys Ser Gly Phe Leu Ala Ser Phe Val Ser Gly Ala
210 215 220
Phe Ala Ser Cys Ile Ser Gln Tyr Val Met Val Ile Ala Asp Gly Asp
225 230 235 240
Phe Ala Glu Lys Val Val Ala Val Val Leu Pro Val Asn Ala Ala Met
245 250 255
Val Val Thr Leu Gln Tyr Ser Val Gly Arg Arg Leu Asn Pro Ala Asn
260 265 270
Ile Arg Ala Leu Met Thr Ala Gly Thr Leu Cys Phe Val Ile Gly Leu
275 280 285
Val Gly Phe Ile Phe Ser Gly Asn Ser Leu Leu Leu Trp Gly Met Ser
290 295 300
Ala Ala Val Phe Thr Val Gly Glu Ile Ile Tyr Ala Pro Gly Glu Tyr
305 310 315 320
Met Leu Ile Asp His Ile Ala Pro Pro Glu Met Lys Ala Ser Tyr Phe
325 330 335
Ser Ala Gln Ser Leu Gly Trp Leu Gly Ala Ala Ile Asn Pro Leu Val
340 345 350
Ser Gly Val Val Leu Thr Ser Leu Pro Pro Ser Ser Leu Phe Val Ile
355 360 365
Leu Ala Leu Val Ile Ile Ala Ala Trp Val Leu Met Leu Lys Gly Ile
370 375 380
Arg Ala Arg Pro Trp Gly Gln Pro Ala Leu Cys
385 390 395
<210> 17
<211> 1212
<212> DNA
<213> Escherichia coli K12 MG1655
<400> 17
atgtcgactc gtaccccttc atcatcttca tcccgcctga tgctgaccat cgggctttgt 60
tttttggtcg ctctgatgga agggctggat cttcaggcgg ctggcattgc ggcgggtggc 120
atcgcccagg ctttcgcact cgataaaatg caaatgggct ggatatttag cgccggaata 180
ctcggtttgc tacccggcgc gttggttggc ggaatgctgg cggaccgtta tggtcgcaag 240
cgcattttga ttggctcagt tgcgctgttt ggtttgttct cactggcaac ggcgattgcc 300
tgggatttcc cctcactggt ctttgcgcgg ctgatgaccg gtgtcgggct gggggcggcg 360
ttgccgaatc ttatcgccct gacgtctgaa gccgcgggtc cacgttttcg tgggacggca 420
gtgagcctga tgtattgcgg tgttcccatt ggcgcggcgc tggcggcgac actgggtttc 480
gcgggggcaa acttagcatg gcaaacggtg ttttgggtag gtggtgtggt gccgttgatt 540
ctggtgccgc tattaatgcg ctggctgccg gagtcggcgg ttttcgctgg cgaaaaacag 600
tctgcgccac cactgcgtgc cttatttgcg ccagaaacgg caaccgcgac gctgctgctg 660
tggttgtgtt atttcttcac tctgctggtg gtctacatgt tgatcaactg gctaccgcta 720
cttttggtgg agcaaggatt ccagccatcg caggcggcag gggtgatgtt tgccctgcaa 780
atgggggcgg caagcgggac gttaatgttg ggcgcattga tggataagct gcgtccagta 840
accatgtcgc tactgattta tagcggcatg ttagcttcgc tgctggcgct tggaacggtg 900
tcgtcattta acggtatgtt gctggcggga tttgtcgcgg ggttgtttgc gacaggtggg 960
caaagcgttt tgtatgccct ggcaccgttg ttttacagtt cgcagatccg cgcaacaggt 1020
gtgggaacag ccgtggcggt agggcgtctg ggggctatga gcggtccgtt actggccggg 1080
aaaatgctgg cattaggcac tggcacggtc ggcgtaatgg ccgcttctgc accgggtatt 1140
cttgttgctg ggttggcggt gtttattttg atgagccgga gatcacgaat acagccgtgc 1200
gccgatgcct aa 1212
<210> 18
<211> 403
<212> PRT
<213> Escherichia coli K12 MG1655
<400> 18
Met Ser Thr Arg Thr Pro Ser Ser Ser Ser Ser Arg Leu Met Leu Thr
1 5 10 15
Ile Gly Leu Cys Phe Leu Val Ala Leu Met Glu Gly Leu Asp Leu Gln
20 25 30
Ala Ala Gly Ile Ala Ala Gly Gly Ile Ala Gln Ala Phe Ala Leu Asp
35 40 45
Lys Met Gln Met Gly Trp Ile Phe Ser Ala Gly Ile Leu Gly Leu Leu
50 55 60
Pro Gly Ala Leu Val Gly Gly Met Leu Ala Asp Arg Tyr Gly Arg Lys
65 70 75 80
Arg Ile Leu Ile Gly Ser Val Ala Leu Phe Gly Leu Phe Ser Leu Ala
85 90 95
Thr Ala Ile Ala Trp Asp Phe Pro Ser Leu Val Phe Ala Arg Leu Met
100 105 110
Thr Gly Val Gly Leu Gly Ala Ala Leu Pro Asn Leu Ile Ala Leu Thr
115 120 125
Ser Glu Ala Ala Gly Pro Arg Phe Arg Gly Thr Ala Val Ser Leu Met
130 135 140
Tyr Cys Gly Val Pro Ile Gly Ala Ala Leu Ala Ala Thr Leu Gly Phe
145 150 155 160
Ala Gly Ala Asn Leu Ala Trp Gln Thr Val Phe Trp Val Gly Gly Val
165 170 175
Val Pro Leu Ile Leu Val Pro Leu Leu Met Arg Trp Leu Pro Glu Ser
180 185 190
Ala Val Phe Ala Gly Glu Lys Gln Ser Ala Pro Pro Leu Arg Ala Leu
195 200 205
Phe Ala Pro Glu Thr Ala Thr Ala Thr Leu Leu Leu Trp Leu Cys Tyr
210 215 220
Phe Phe Thr Leu Leu Val Val Tyr Met Leu Ile Asn Trp Leu Pro Leu
225 230 235 240
Leu Leu Val Glu Gln Gly Phe Gln Pro Ser Gln Ala Ala Gly Val Met
245 250 255
Phe Ala Leu Gln Met Gly Ala Ala Ser Gly Thr Leu Met Leu Gly Ala
260 265 270
Leu Met Asp Lys Leu Arg Pro Val Thr Met Ser Leu Leu Ile Tyr Ser
275 280 285
Gly Met Leu Ala Ser Leu Leu Ala Leu Gly Thr Val Ser Ser Phe Asn
290 295 300
Gly Met Leu Leu Ala Gly Phe Val Ala Gly Leu Phe Ala Thr Gly Gly
305 310 315 320
Gln Ser Val Leu Tyr Ala Leu Ala Pro Leu Phe Tyr Ser Ser Gln Ile
325 330 335
Arg Ala Thr Gly Val Gly Thr Ala Val Ala Val Gly Arg Leu Gly Ala
340 345 350
Met Ser Gly Pro Leu Leu Ala Gly Lys Met Leu Ala Leu Gly Thr Gly
355 360 365
Thr Val Gly Val Met Ala Ala Ser Ala Pro Gly Ile Leu Val Ala Gly
370 375 380
Leu Ala Val Phe Ile Leu Met Ser Arg Arg Ser Arg Ile Gln Pro Cys
385 390 395 400
Ala Asp Ala
<210> 19
<211> 1374
<212> DNA
<213> Escherichia coli K12 MG1655
<400> 19
atgccaaaag ttcaggccga cggcctgcca ttgccccagc gatacggtgc gatattaacc 60
attgtgattg gtatttcgat ggccgtcctt gacggcgcaa tcgccaacgt cgccctgcca 120
acaatcgcca cggaccttca tgccacgcca gccagttcca tctgggtagt gaacgcctat 180
caaatcgcca ttgtcatctc cctgctctcg ttttcgtttc tgggcgatat gtttggctat 240
cgacgtattt ataaatgcgg tctggtcgtt tttctgttgt cttcactgtt ctgcgccctt 300
tctgattcgc tgcaaatgct cacccttgcg cgtgtcatac aaggtttcgg cggtgcagcg 360
ttgatgagcg ttaataccgc acttatccgc ctgatctatc cacaacgttt tctgggtaga 420
gggatgggca taaactcgtt tattgttgcc gtctcttctg ctgccgggcc gacaattgct 480
gcagcaatcc tctccatcgc atcctggaaa tggttatttt taatcaacgt accgttaggt 540
attatcgccc tgcttctggc gatgcgtttt ctgccaccca atggttctcg cgccagtaaa 600
ccccgtttcg acctgcccag cgccgtgatg aacgcgttaa ccttcggcct gcttatcact 660
gcgttgagtg gtttcgctca ggggcaatcg ctgacgttaa ttgctgcgga actggtggta 720
atggttgttg ttggtatttt ctttattcgc cgccagcttt ctcttcccgt accgctgcta 780
ccggtggatt tactgcgtat cccgctgttt tcactttcta tttgcacatc tgtttgctct 840
ttctgcgcac aaatgctggc aatggtttcc ctgccctttt acctgcaaac cgtgctcggg 900
cgtagtgaag tcgaaacagg tttacttctg acaccgtggc cgttagcaac gatggtgatg 960
gctccgctgg caggctattt gattgaacgc gtacatgcag gattgctggg ggctttaggg 1020
ttgttcatca tggctgcggg gcttttttcc ctggttctgc tgcccgcgtc acctgcggat 1080
atcaatatta tctggccgat gatcttatgt ggtgctggat ttggcttatt ccagtcaccc 1140
aataaccaca ccattattac ctccgcgcct cgcgaacgta gcggtggagc cagtggcatg 1200
ttaggaacgg ctcgtctact gggtcagagt agcggcgcgg cgctggtggc gctgatgcta 1260
aatcagtttg gagataatgg tacacacgtc tcgctgatgg ctgcggctat tctggcagtg 1320
attgctgcct gtgtcagtgg tttacgtatc actcagccac gatccagggc ataa 1374
<210> 20
<211> 457
<212> PRT
<213> Escherichia coli K12 MG1655
<400> 20
Met Pro Lys Val Gln Ala Asp Gly Leu Pro Leu Pro Gln Arg Tyr Gly
1 5 10 15
Ala Ile Leu Thr Ile Val Ile Gly Ile Ser Met Ala Val Leu Asp Gly
20 25 30
Ala Ile Ala Asn Val Ala Leu Pro Thr Ile Ala Thr Asp Leu His Ala
35 40 45
Thr Pro Ala Ser Ser Ile Trp Val Val Asn Ala Tyr Gln Ile Ala Ile
50 55 60
Val Ile Ser Leu Leu Ser Phe Ser Phe Leu Gly Asp Met Phe Gly Tyr
65 70 75 80
Arg Arg Ile Tyr Lys Cys Gly Leu Val Val Phe Leu Leu Ser Ser Leu
85 90 95
Phe Cys Ala Leu Ser Asp Ser Leu Gln Met Leu Thr Leu Ala Arg Val
100 105 110
Ile Gln Gly Phe Gly Gly Ala Ala Leu Met Ser Val Asn Thr Ala Leu
115 120 125
Ile Arg Leu Ile Tyr Pro Gln Arg Phe Leu Gly Arg Gly Met Gly Ile
130 135 140
Asn Ser Phe Ile Val Ala Val Ser Ser Ala Ala Gly Pro Thr Ile Ala
145 150 155 160
Ala Ala Ile Leu Ser Ile Ala Ser Trp Lys Trp Leu Phe Leu Ile Asn
165 170 175
Val Pro Leu Gly Ile Ile Ala Leu Leu Leu Ala Met Arg Phe Leu Pro
180 185 190
Pro Asn Gly Ser Arg Ala Ser Lys Pro Arg Phe Asp Leu Pro Ser Ala
195 200 205
Val Met Asn Ala Leu Thr Phe Gly Leu Leu Ile Thr Ala Leu Ser Gly
210 215 220
Phe Ala Gln Gly Gln Ser Leu Thr Leu Ile Ala Ala Glu Leu Val Val
225 230 235 240
Met Val Val Val Gly Ile Phe Phe Ile Arg Arg Gln Leu Ser Leu Pro
245 250 255
Val Pro Leu Leu Pro Val Asp Leu Leu Arg Ile Pro Leu Phe Ser Leu
260 265 270
Ser Ile Cys Thr Ser Val Cys Ser Phe Cys Ala Gln Met Leu Ala Met
275 280 285
Val Ser Leu Pro Phe Tyr Leu Gln Thr Val Leu Gly Arg Ser Glu Val
290 295 300
Glu Thr Gly Leu Leu Leu Thr Pro Trp Pro Leu Ala Thr Met Val Met
305 310 315 320
Ala Pro Leu Ala Gly Tyr Leu Ile Glu Arg Val His Ala Gly Leu Leu
325 330 335
Gly Ala Leu Gly Leu Phe Ile Met Ala Ala Gly Leu Phe Ser Leu Val
340 345 350
Leu Leu Pro Ala Ser Pro Ala Asp Ile Asn Ile Ile Trp Pro Met Ile
355 360 365
Leu Cys Gly Ala Gly Phe Gly Leu Phe Gln Ser Pro Asn Asn His Thr
370 375 380
Ile Ile Thr Ser Ala Pro Arg Glu Arg Ser Gly Gly Ala Ser Gly Met
385 390 395 400
Leu Gly Thr Ala Arg Leu Leu Gly Gln Ser Ser Gly Ala Ala Leu Val
405 410 415
Ala Leu Met Leu Asn Gln Phe Gly Asp Asn Gly Thr His Val Ser Leu
420 425 430
Met Ala Ala Ala Ile Leu Ala Val Ile Ala Ala Cys Val Ser Gly Leu
435 440 445
Arg Ile Thr Gln Pro Arg Ser Arg Ala
450 455
<210> 21
<211> 1218
<212> DNA
<213> Escherichia coli K12 MG1655
<400> 21
atggcaacag catggtataa acaagttaat ccaccacaac ggaaagctct tttttccgca 60
tggcttggat atgtatttga tggctttgat tttatgatga tattttacat tcttcatatt 120
ataaaagcag atcttggcat tacggatatt caggctactt taatagggac agtggccttc 180
atagccagac ctattggagg tggttttttt ggtgccatgg ctgataaata tggtcgtaag 240
ccaatgatga tgtgggcaat tttcatttac tcagtcggaa caggccttag cggtattgct 300
acaaacttat atatgctcgc agtttgccgt tttattgttg gcttagggat gtctggtgaa 360
tatgcatgtg cttcaactta tgcggtagaa agttggccta aaaatcttca atctaaagct 420
agtgcttttt tggtaagtgg tttttctgtt ggaaatatta ttgcggcaca aataatccct 480
cagtttgctg aagtatatgg atggagaaac tcttttttta taggcctgtt accagtttta 540
ctagttcttt ggatcagaaa aagtgctcca gaaagtcagg agtggattga agataaatat 600
aaggataaat caacattttt gtctgtcttc agaaaaccac atctttcaat ctctatgatc 660
gttttcctcg tctgtttttg tctatttggt gcaaactggc cgataaacgg actacttcct 720
tcctacctgg cagataatgg agttaataca gtggtcattt caactctgat gacaatagca 780
ggtttaggaa cactgacagg tacaatattt tttggttttg ttggtgataa gattggtgta 840
aaaaaagcct ttgtagtcgg tctaataact tcatttattt tcctttgtcc tctttttttt 900
atttctgtga aaaactcttc tcttatagga ttatgtctct ttggattaat gtttacaaat 960
ttaggtattg cagggttggt tccaaaattt atatatgatt actttccaac aaaattaaga 1020
ggattaggga ccggtcttat ttataactta ggggcaactg gaggaatggc cgcacctgta 1080
ttagctacat acatttcagg atattatggc ttaggtgttt cattattcat tgttacggtt 1140
gcattctctg ccttattaat tttgttagtt ggttttgata ttccaggtaa aatttataaa 1200
ctatccgtgg ctaaataa 1218
<210> 22
<211> 405
<212> PRT
<213> Escherichia coli K12 MG1655
<400> 22
Met Ala Thr Ala Trp Tyr Lys Gln Val Asn Pro Pro Gln Arg Lys Ala
1 5 10 15
Leu Phe Ser Ala Trp Leu Gly Tyr Val Phe Asp Gly Phe Asp Phe Met
20 25 30
Met Ile Phe Tyr Ile Leu His Ile Ile Lys Ala Asp Leu Gly Ile Thr
35 40 45
Asp Ile Gln Ala Thr Leu Ile Gly Thr Val Ala Phe Ile Ala Arg Pro
50 55 60
Ile Gly Gly Gly Phe Phe Gly Ala Met Ala Asp Lys Tyr Gly Arg Lys
65 70 75 80
Pro Met Met Met Trp Ala Ile Phe Ile Tyr Ser Val Gly Thr Gly Leu
85 90 95
Ser Gly Ile Ala Thr Asn Leu Tyr Met Leu Ala Val Cys Arg Phe Ile
100 105 110
Val Gly Leu Gly Met Ser Gly Glu Tyr Ala Cys Ala Ser Thr Tyr Ala
115 120 125
Val Glu Ser Trp Pro Lys Asn Leu Gln Ser Lys Ala Ser Ala Phe Leu
130 135 140
Val Ser Gly Phe Ser Val Gly Asn Ile Ile Ala Ala Gln Ile Ile Pro
145 150 155 160
Gln Phe Ala Glu Val Tyr Gly Trp Arg Asn Ser Phe Phe Ile Gly Leu
165 170 175
Leu Pro Val Leu Leu Val Leu Trp Ile Arg Lys Ser Ala Pro Glu Ser
180 185 190
Gln Glu Trp Ile Glu Asp Lys Tyr Lys Asp Lys Ser Thr Phe Leu Ser
195 200 205
Val Phe Arg Lys Pro His Leu Ser Ile Ser Met Ile Val Phe Leu Val
210 215 220
Cys Phe Cys Leu Phe Gly Ala Asn Trp Pro Ile Asn Gly Leu Leu Pro
225 230 235 240
Ser Tyr Leu Ala Asp Asn Gly Val Asn Thr Val Val Ile Ser Thr Leu
245 250 255
Met Thr Ile Ala Gly Leu Gly Thr Leu Thr Gly Thr Ile Phe Phe Gly
260 265 270
Phe Val Gly Asp Lys Ile Gly Val Lys Lys Ala Phe Val Val Gly Leu
275 280 285
Ile Thr Ser Phe Ile Phe Leu Cys Pro Leu Phe Phe Ile Ser Val Lys
290 295 300
Asn Ser Ser Leu Ile Gly Leu Cys Leu Phe Gly Leu Met Phe Thr Asn
305 310 315 320
Leu Gly Ile Ala Gly Leu Val Pro Lys Phe Ile Tyr Asp Tyr Phe Pro
325 330 335
Thr Lys Leu Arg Gly Leu Gly Thr Gly Leu Ile Tyr Asn Leu Gly Ala
340 345 350
Thr Gly Gly Met Ala Ala Pro Val Leu Ala Thr Tyr Ile Ser Gly Tyr
355 360 365
Tyr Gly Leu Gly Val Ser Leu Phe Ile Val Thr Val Ala Phe Ser Ala
370 375 380
Leu Leu Ile Leu Leu Val Gly Phe Asp Ile Pro Gly Lys Ile Tyr Lys
385 390 395 400
Leu Ser Val Ala Lys
405
<210> 23
<211> 1191
<212> DNA
<213> Escherichia coli K12 MG1655
<400> 23
atgaccaccc gacagcattc gtcgtttgct attgttttta tccttggcct gctggccatg 60
ttgatgccgc tgtcgattga tatgtatctg cccgcgctac cggtaatttc agcgcagttt 120
ggcgtaccgg cgggcagtac gcagatgacc ctcagtactt atattctggg ctttgcgttg 180
gggcagttaa tctacgggcc gatggcagac agcttcgggc gtaagccggt ggtgctcggc 240
ggtacgctgg tgtttgccgc cgccgcggtg gcgtgtgcgt tggcaaacac catcgatcag 300
ctgattgtga tgcgtttctt ccacgggctg gctgcggctg cggccagcgt ggtcattaac 360
gccctgatgc gcgatattta cccgaaagaa gagttctcgc ggatgatgtc gtttgtcatg 420
ctggtgacaa ccattgcacc gctgatggca ccgatagttg gcggctgggt gctggtgtgg 480
ctgagctggc attacatctt ctggatcctg gcattagcgg cgattctggc ttcggcaatg 540
attttcttcc tgattaaaga aaccttacca ccggagcgtc gtcagccatt tcacattcgt 600
accactattg gtaactttgc ggcgctgttc cgccataaac gtgtcctgag ctacatgctt 660
gccagtggtt tcagctttgc cgggatgttc tcattcttaa gcgccggacc gtttgtttat 720
attgaaatta accacgtcgc gccggaaaac tttggttatt actttgcgct aaacattgtt 780
tttctgttcg tgatgaccat ctttaacagc cgcttcgtcc gccgcattgg cgcgttaaat 840
atgttccgct cggggttgtg gatacaattt attatggcag cgtggatggt catcagtgcg 900
ctgctggggc tgggattttg gtcgctggtg gttggcgttg cggcgtttgt gggctgcgtg 960
tcgatggtgt catccaatgc gatggcggtc attcttgatg agtttcccca tatggcggga 1020
acggcatctt cgctggcagg aaccttccgt tttggcatag gggcaattgt tggcgcattg 1080
ctttctcttg cgacctttaa ctctgcatgg ccgatgattt ggtcaattgc attctgcgca 1140
accagctcca ttctcttctg tctgtacgcc agtcggccga aaaaacggta a 1191
<210> 24
<211> 396
<212> PRT
<213> Escherichia coli K12 MG1655
<400> 24
Met Thr Thr Arg Gln His Ser Ser Phe Ala Ile Val Phe Ile Leu Gly
1 5 10 15
Leu Leu Ala Met Leu Met Pro Leu Ser Ile Asp Met Tyr Leu Pro Ala
20 25 30
Leu Pro Val Ile Ser Ala Gln Phe Gly Val Pro Ala Gly Ser Thr Gln
35 40 45
Met Thr Leu Ser Thr Tyr Ile Leu Gly Phe Ala Leu Gly Gln Leu Ile
50 55 60
Tyr Gly Pro Met Ala Asp Ser Phe Gly Arg Lys Pro Val Val Leu Gly
65 70 75 80
Gly Thr Leu Val Phe Ala Ala Ala Ala Val Ala Cys Ala Leu Ala Asn
85 90 95
Thr Ile Asp Gln Leu Ile Val Met Arg Phe Phe His Gly Leu Ala Ala
100 105 110
Ala Ala Ala Ser Val Val Ile Asn Ala Leu Met Arg Asp Ile Tyr Pro
115 120 125
Lys Glu Glu Phe Ser Arg Met Met Ser Phe Val Met Leu Val Thr Thr
130 135 140
Ile Ala Pro Leu Met Ala Pro Ile Val Gly Gly Trp Val Leu Val Trp
145 150 155 160
Leu Ser Trp His Tyr Ile Phe Trp Ile Leu Ala Leu Ala Ala Ile Leu
165 170 175
Ala Ser Ala Met Ile Phe Phe Leu Ile Lys Glu Thr Leu Pro Pro Glu
180 185 190
Arg Arg Gln Pro Phe His Ile Arg Thr Thr Ile Gly Asn Phe Ala Ala
195 200 205
Leu Phe Arg His Lys Arg Val Leu Ser Tyr Met Leu Ala Ser Gly Phe
210 215 220
Ser Phe Ala Gly Met Phe Ser Phe Leu Ser Ala Gly Pro Phe Val Tyr
225 230 235 240
Ile Glu Ile Asn His Val Ala Pro Glu Asn Phe Gly Tyr Tyr Phe Ala
245 250 255
Leu Asn Ile Val Phe Leu Phe Val Met Thr Ile Phe Asn Ser Arg Phe
260 265 270
Val Arg Arg Ile Gly Ala Leu Asn Met Phe Arg Ser Gly Leu Trp Ile
275 280 285
Gln Phe Ile Met Ala Ala Trp Met Val Ile Ser Ala Leu Leu Gly Leu
290 295 300
Gly Phe Trp Ser Leu Val Val Gly Val Ala Ala Phe Val Gly Cys Val
305 310 315 320
Ser Met Val Ser Ser Asn Ala Met Ala Val Ile Leu Asp Glu Phe Pro
325 330 335
His Met Ala Gly Thr Ala Ser Ser Leu Ala Gly Thr Phe Arg Phe Gly
340 345 350
Ile Gly Ala Ile Val Gly Ala Leu Leu Ser Leu Ala Thr Phe Asn Ser
355 360 365
Ala Trp Pro Met Ile Trp Ser Ile Ala Phe Cys Ala Thr Ser Ser Ile
370 375 380
Leu Phe Cys Leu Tyr Ala Ser Arg Pro Lys Lys Arg
385 390 395
<210> 25
<211> 1317
<212> DNA
<213> Escherichia coli K12 MG1655
<400> 25
atgggaaaca catcaataca aacgcagagt taccgtgcgg tagataaaga tgcagggcaa 60
agcagaagtt acattattcc attcgcgctg ctgtgctcac tgttttttct ttgggcggta 120
gccaataacc ttaacgacat tttattacct caattccagc aggcttttac gctgacaaat 180
ttccaggctg gcctgatcca atcggccttt tactttggtt atttcattat cccaatccct 240
gctgggatat tgatgaaaaa actcagttat aaagcaggga ttattaccgg gttattttta 300
tatgccttgg gtgctgcatt attctggccc gccgcagaaa taatgaacta caccttgttt 360
ttagttggcc tatttattat tgcagccgga ttaggttgtc tggaaactgc cgcaaaccct 420
tttgttacgg tattagggcc ggaaagtagt ggtcacttcc gcttaaatct tgcgcaaaca 480
tttaactcgt ttggcgcaat tatcgcggtt gtctttgggc aaagtcttat tttgtctaac 540
gtgccacatc aatcgcaaga cgttctcgat aaaatgtctc cagagcaatt gagtgcgtat 600
aaacacagcc tggtattatc ggtacagaca ccttatatga tcatcgtggc tatcgtgtta 660
ctggtcgccc tgctgatcat gctgacgaaa ttcccggcat tgcagagtga taatcacagt 720
gacgccaaac aaggatcgtt ctccgcatcg ctttctcgcc tggcgcgtat tcgccactgg 780
cgctgggcgg tattagcgca attctgctat gtcggcgcac aaacggcctg ctggagctat 840
ttgattcgct acgctgtaga agaaattcca ggtatgactg caggctttgc cgctaactat 900
ttaaccggaa ccatggtgtg cttctttatt ggtcgtttca ccggtacctg gctcatcagt 960
cgcttcgcac cacacaaagt cctggccgcc tacgcattaa tcgctatggc actgtgcctg 1020
atctcagcct tcgctggcgg tcatgtgggc ttaatagccc tgactttatg cagcgccttt 1080
atgtcgattc agtacccaac aatcttctcg ctgggcatta agaatctcgg ccaggacacc 1140
aaatatggtt cgtccttcat cgttatgacc attattggcg gcggtattgt cactccggtc 1200
atgggttttg tcagtgacgc ggcgggcaac atccccactg ctgaactgat ccccgcactc 1260
tgcttcgcgg tcatctttat ctttgcccgt ttccgttctc aaacggcaac taactaa 1317
<210> 26
<211> 438
<212> PRT
<213> Escherichia coli K12 MG1655
<400> 26
Met Gly Asn Thr Ser Ile Gln Thr Gln Ser Tyr Arg Ala Val Asp Lys
1 5 10 15
Asp Ala Gly Gln Ser Arg Ser Tyr Ile Ile Pro Phe Ala Leu Leu Cys
20 25 30
Ser Leu Phe Phe Leu Trp Ala Val Ala Asn Asn Leu Asn Asp Ile Leu
35 40 45
Leu Pro Gln Phe Gln Gln Ala Phe Thr Leu Thr Asn Phe Gln Ala Gly
50 55 60
Leu Ile Gln Ser Ala Phe Tyr Phe Gly Tyr Phe Ile Ile Pro Ile Pro
65 70 75 80
Ala Gly Ile Leu Met Lys Lys Leu Ser Tyr Lys Ala Gly Ile Ile Thr
85 90 95
Gly Leu Phe Leu Tyr Ala Leu Gly Ala Ala Leu Phe Trp Pro Ala Ala
100 105 110
Glu Ile Met Asn Tyr Thr Leu Phe Leu Val Gly Leu Phe Ile Ile Ala
115 120 125
Ala Gly Leu Gly Cys Leu Glu Thr Ala Ala Asn Pro Phe Val Thr Val
130 135 140
Leu Gly Pro Glu Ser Ser Gly His Phe Arg Leu Asn Leu Ala Gln Thr
145 150 155 160
Phe Asn Ser Phe Gly Ala Ile Ile Ala Val Val Phe Gly Gln Ser Leu
165 170 175
Ile Leu Ser Asn Val Pro His Gln Ser Gln Asp Val Leu Asp Lys Met
180 185 190
Ser Pro Glu Gln Leu Ser Ala Tyr Lys His Ser Leu Val Leu Ser Val
195 200 205
Gln Thr Pro Tyr Met Ile Ile Val Ala Ile Val Leu Leu Val Ala Leu
210 215 220
Leu Ile Met Leu Thr Lys Phe Pro Ala Leu Gln Ser Asp Asn His Ser
225 230 235 240
Asp Ala Lys Gln Gly Ser Phe Ser Ala Ser Leu Ser Arg Leu Ala Arg
245 250 255
Ile Arg His Trp Arg Trp Ala Val Leu Ala Gln Phe Cys Tyr Val Gly
260 265 270
Ala Gln Thr Ala Cys Trp Ser Tyr Leu Ile Arg Tyr Ala Val Glu Glu
275 280 285
Ile Pro Gly Met Thr Ala Gly Phe Ala Ala Asn Tyr Leu Thr Gly Thr
290 295 300
Met Val Cys Phe Phe Ile Gly Arg Phe Thr Gly Thr Trp Leu Ile Ser
305 310 315 320
Arg Phe Ala Pro His Lys Val Leu Ala Ala Tyr Ala Leu Ile Ala Met
325 330 335
Ala Leu Cys Leu Ile Ser Ala Phe Ala Gly Gly His Val Gly Leu Ile
340 345 350
Ala Leu Thr Leu Cys Ser Ala Phe Met Ser Ile Gln Tyr Pro Thr Ile
355 360 365
Phe Ser Leu Gly Ile Lys Asn Leu Gly Gln Asp Thr Lys Tyr Gly Ser
370 375 380
Ser Phe Ile Val Met Thr Ile Ile Gly Gly Gly Ile Val Thr Pro Val
385 390 395 400
Met Gly Phe Val Ser Asp Ala Ala Gly Asn Ile Pro Thr Ala Glu Leu
405 410 415
Ile Pro Ala Leu Cys Phe Ala Val Ile Phe Ile Phe Ala Arg Phe Arg
420 425 430
Ser Gln Thr Ala Thr Asn
435
<210> 27
<211> 1755
<212> DNA
<213> Lactococcus lactis strain SRCM103457
<400> 27
atggctaacc gcatagaagg caaagctgtg gacaaaacct caattaaaca tttcataaaa 60
ttaattcgcg cggcgaagcc gcgctattta ttctttataa ttggaattct tgcgggcata 120
gtgggcaccc ttattcagct gcaggtaccc aaaatggtgc agccgttagt gaacagcttt 180
ggccatggcg tcaatggcgg aaaagtggct ctggtgatag cgttatatat tggcagcgcg 240
gcggtgtcag cgattgcggc gattgtatta ggaatatttg gcgaaagcgt ggtcaaaaac 300
cttagaacac gcgtatggga taaaatgatt catctaccgg tcaaatattt tgatgaagtg 360
aaaaccggcg aaatgagcag ccgcctggct aatgatacaa cacaggtgaa aaacttaatt 420
gcgaatagca ttccgcaggc gtttacaagc attctgttat tagtgggcag cattgtattc 480
atgttacaaa tgcagtggcg cttaacatta gctatgatta ttgcggtgcc ggtcgtgatg 540
cttattatgt tccccattat gacctttgga cagaaaattg gacggacccg gcaggatagc 600
ctggcgaact tccagggaat tgcgagcgaa agcctgagcg aaattcggct ggtcaaaagc 660
agcaacgcgg aaaaacaggc tagcaaaaaa gcggaaaacg atgtaaacgc tttatataaa 720
attggagtca aagaagctat atttgatggc ttaatgagcc cggtgatgat gctgagcatg 780
atgctaatga tatttggctt attagcgtac ggcatttatc ttataagcac cggcgtaatg 840
agcttaggaa ccttattagg catgatgatg tatttaatga atctgatagg agctgtcccg 900
accgtagcga ccttctttac cgaattagcg aaagcgagcg gcagcaccgg ccgcttaaca 960
gaactgttag atgaagaaca ggaagtctta catcagggcg aaagcttaga tttagaaggc 1020
aaaacactta gcgcgcggca tgtggacttt gcgtatgatg atagcgaaca gattctgcgc 1080
gatataagct ttgaagcgca gccgaacagc attattgctt ttgctggccc gagcggcggc 1140
ggcaaaagca ccattttcag cttactggaa cgcttttatc agccgacagc gggcgaaatt 1200
accattgatg gccagcccat tgataacatt agcttagaaa actggcgaag ccagattggc 1260
tttgtaagcc aggatagcgc gattatggcg ggcacaattc gcgaaaacct gacctatggc 1320
ttagaaggcg actataccga tgaagactta tggcaggtgt tagacctggc gtttgcgcgg 1380
tcatttgtgg aaaacatgcc ggatcagtta aacacagaag tgggcgaacg gggcgtaaaa 1440
ataagcggcg gccagcggca gcgcctggcg attgcgcgcg cgttcttacg gaacccgaaa 1500
atactaatgt tagatgaagc gacagcgagc ctggatagcg aaagcgaaag catggtgcag 1560
aaggcgctgg atagcttaat gaaaggccgg accacacttg tcattgctca tcggttaagc 1620
accattgtgg atgctgataa gatttacttc attgaaaaag gccagataac cggaagcgga 1680
aaacataacg aattagtggc tacccatccg ctttatgcga agtatgtgag cgaacagtta 1740
accgtgggcc agtaa 1755
<210> 28
<211> 584
<212> PRT
<213> Lactococcus lactis strain SRCM103457
<400> 28
Met Ala Asn Arg Ile Glu Gly Lys Ala Val Asp Lys Thr Ser Ile Lys
1 5 10 15
His Phe Ile Lys Leu Ile Arg Ala Ala Lys Pro Arg Tyr Leu Phe Phe
20 25 30
Ile Ile Gly Ile Leu Ala Gly Ile Val Gly Thr Leu Ile Gln Leu Gln
35 40 45
Val Pro Lys Met Val Gln Pro Leu Val Asn Ser Phe Gly His Gly Val
50 55 60
Asn Gly Gly Lys Val Ala Leu Val Ile Ala Leu Tyr Ile Gly Ser Ala
65 70 75 80
Ala Val Ser Ala Ile Ala Ala Ile Val Leu Gly Ile Phe Gly Glu Ser
85 90 95
Val Val Lys Asn Leu Arg Thr Arg Val Trp Asp Lys Met Ile His Leu
100 105 110
Pro Val Lys Tyr Phe Asp Glu Val Lys Thr Gly Glu Met Ser Ser Arg
115 120 125
Leu Ala Asn Asp Thr Thr Gln Val Lys Asn Leu Ile Ala Asn Ser Ile
130 135 140
Pro Gln Ala Phe Thr Ser Ile Leu Leu Leu Val Gly Ser Ile Val Phe
145 150 155 160
Met Leu Gln Met Gln Trp Arg Leu Thr Leu Ala Met Ile Ile Ala Val
165 170 175
Pro Val Val Met Leu Ile Met Phe Pro Ile Met Thr Phe Gly Gln Lys
180 185 190
Ile Gly Arg Thr Arg Gln Asp Ser Leu Ala Asn Phe Gln Gly Ile Ala
195 200 205
Ser Glu Ser Leu Ser Glu Ile Arg Leu Val Lys Ser Ser Asn Ala Glu
210 215 220
Lys Gln Ala Ser Lys Lys Ala Glu Asn Asp Val Asn Ala Leu Tyr Lys
225 230 235 240
Ile Gly Val Lys Glu Ala Ile Phe Asp Gly Leu Met Ser Pro Val Met
245 250 255
Met Leu Ser Met Met Leu Met Ile Phe Gly Leu Leu Ala Tyr Gly Ile
260 265 270
Tyr Leu Ile Ser Thr Gly Val Met Ser Leu Gly Thr Leu Leu Gly Met
275 280 285
Met Met Tyr Leu Met Asn Leu Ile Gly Ala Val Pro Thr Val Ala Thr
290 295 300
Phe Phe Thr Glu Leu Ala Lys Ala Ser Gly Ser Thr Gly Arg Leu Thr
305 310 315 320
Glu Leu Leu Asp Glu Glu Gln Glu Val Leu His Gln Gly Glu Ser Leu
325 330 335
Asp Leu Glu Gly Lys Thr Leu Ser Ala Arg His Val Asp Phe Ala Tyr
340 345 350
Asp Asp Ser Glu Gln Ile Leu Arg Asp Ile Ser Phe Glu Ala Gln Pro
355 360 365
Asn Ser Ile Ile Ala Phe Ala Gly Pro Ser Gly Gly Gly Lys Ser Thr
370 375 380
Ile Phe Ser Leu Leu Glu Arg Phe Tyr Gln Pro Thr Ala Gly Glu Ile
385 390 395 400
Thr Ile Asp Gly Gln Pro Ile Asp Asn Ile Ser Leu Glu Asn Trp Arg
405 410 415
Ser Gln Ile Gly Phe Val Ser Gln Asp Ser Ala Ile Met Ala Gly Thr
420 425 430
Ile Arg Glu Asn Leu Thr Tyr Gly Leu Glu Gly Asp Tyr Thr Asp Glu
435 440 445
Asp Leu Trp Gln Val Leu Asp Leu Ala Phe Ala Arg Ser Phe Val Glu
450 455 460
Asn Met Pro Asp Gln Leu Asn Thr Glu Val Gly Glu Arg Gly Val Lys
465 470 475 480
Ile Ser Gly Gly Gln Arg Gln Arg Leu Ala Ile Ala Arg Ala Phe Leu
485 490 495
Arg Asn Pro Lys Ile Leu Met Leu Asp Glu Ala Thr Ala Ser Leu Asp
500 505 510
Ser Glu Ser Glu Ser Met Val Gln Lys Ala Leu Asp Ser Leu Met Lys
515 520 525
Gly Arg Thr Thr Leu Val Ile Ala His Arg Leu Ser Thr Ile Val Asp
530 535 540
Ala Asp Lys Ile Tyr Phe Ile Glu Lys Gly Gln Ile Thr Gly Ser Gly
545 550 555 560
Lys His Asn Glu Leu Val Ala Thr His Pro Leu Tyr Ala Lys Tyr Val
565 570 575
Ser Glu Gln Leu Thr Val Gly Gln
580
<210> 29
<211> 1005
<212> DNA
<213> Escherichia coli K12 MG1655
<400> 29
atgaatgctg taactgaagg aagaaaagtc ctccttgaaa tcgccgatct taaagtgcac 60
tttgaaatca aagatggcaa acagtggttc tggcaaccgc cgaaaacgct caaagccgtc 120
gatggtgtca ctcttcgcct gtatgaaggg gaaacattag gtgtggtagg ggaatcggga 180
tgcggtaagt ccacctttgc tcgcgccatc atcggtttgg tcaaggcgac cgacggtcat 240
gttgcctggt taggtaaaga gttgctgggc atgaaacccg atgaatggcg tgccgttcgc 300
agtgatattc agatgatttt ccaggatccg ttggcatcgc taaacccgcg tatgaccatc 360
ggcgagatca tcgctgaacc actgcgtact tatcatccga aaatgtcacg ccaggaagtt 420
cgcgagcgcg tgaaggcgat gatgctgaaa gtcgggttat tgcctaacct gattaaccgc 480
tatccgcatg agttctctgg tgggcagtgc cagcgtatcg ggattgcgcg tgctcttatt 540
cttgaaccga agctgattat ctgtgatgag ccggtgtcgg cgctggacgt gtcaattcag 600
gcacaggtgg tcaacctgct ccagcaattg caacgtgaga tgggattgtc attaattttt 660
atcgctcatg acctggccgt ggtaaaacac atttccgatc gtgtgttggt gatgtatctc 720
ggccatgcgg tagaactggg gacctatgat gaggtctacc acaatccact acatccttac 780
accagggcat tgatgtcggc agtccccata cctgatccgg atctggagaa gaacaaaacc 840
atccagttac tggaagggga attaccgtcg ccgatcaacc cgccttccgg ttgtgttttc 900
cgtacccgtt gcccgattgc cggtccagag tgcgccaaaa cacgtcctgt tctggagggg 960
agtttcagac actccgtttc ttgcctgaaa gtcgatccgc tttaa 1005
<210> 30
<211> 334
<212> PRT
<213> Escherichia coli K12 MG1655
<400> 30
Met Asn Ala Val Thr Glu Gly Arg Lys Val Leu Leu Glu Ile Ala Asp
1 5 10 15
Leu Lys Val His Phe Glu Ile Lys Asp Gly Lys Gln Trp Phe Trp Gln
20 25 30
Pro Pro Lys Thr Leu Lys Ala Val Asp Gly Val Thr Leu Arg Leu Tyr
35 40 45
Glu Gly Glu Thr Leu Gly Val Val Gly Glu Ser Gly Cys Gly Lys Ser
50 55 60
Thr Phe Ala Arg Ala Ile Ile Gly Leu Val Lys Ala Thr Asp Gly His
65 70 75 80
Val Ala Trp Leu Gly Lys Glu Leu Leu Gly Met Lys Pro Asp Glu Trp
85 90 95
Arg Ala Val Arg Ser Asp Ile Gln Met Ile Phe Gln Asp Pro Leu Ala
100 105 110
Ser Leu Asn Pro Arg Met Thr Ile Gly Glu Ile Ile Ala Glu Pro Leu
115 120 125
Arg Thr Tyr His Pro Lys Met Ser Arg Gln Glu Val Arg Glu Arg Val
130 135 140
Lys Ala Met Met Leu Lys Val Gly Leu Leu Pro Asn Leu Ile Asn Arg
145 150 155 160
Tyr Pro His Glu Phe Ser Gly Gly Gln Cys Gln Arg Ile Gly Ile Ala
165 170 175
Arg Ala Leu Ile Leu Glu Pro Lys Leu Ile Ile Cys Asp Glu Pro Val
180 185 190
Ser Ala Leu Asp Val Ser Ile Gln Ala Gln Val Val Asn Leu Leu Gln
195 200 205
Gln Leu Gln Arg Glu Met Gly Leu Ser Leu Ile Phe Ile Ala His Asp
210 215 220
Leu Ala Val Val Lys His Ile Ser Asp Arg Val Leu Val Met Tyr Leu
225 230 235 240
Gly His Ala Val Glu Leu Gly Thr Tyr Asp Glu Val Tyr His Asn Pro
245 250 255
Leu His Pro Tyr Thr Arg Ala Leu Met Ser Ala Val Pro Ile Pro Asp
260 265 270
Pro Asp Leu Glu Lys Asn Lys Thr Ile Gln Leu Leu Glu Gly Glu Leu
275 280 285
Pro Ser Pro Ile Asn Pro Pro Ser Gly Cys Val Phe Arg Thr Arg Cys
290 295 300
Pro Ile Ala Gly Pro Glu Cys Ala Lys Thr Arg Pro Val Leu Glu Gly
305 310 315 320
Ser Phe Arg His Ser Val Ser Cys Leu Lys Val Asp Pro Leu
325 330
<210> 31
<211> 1251
<212> DNA
<213> Escherichia coli K12 MG1655
<400> 31
atgtcgttgg caaaagcgtc cttgtggacg gcggccagta cactggtcaa gattggtgcc 60
gggttactgg tcggtaagtt gctggcggtg tcatttggtc cggcggggct tgggctggcg 120
gcaaatttcc gccagttgat taccgtgctc ggcgtgcttg ccggggctgg catctttaac 180
ggtgtaacca aatacgttgc ccagtaccat gataatccgc aacagctgcg ccgcgtggtc 240
ggcacttcat cagcgatggt acttggtttc tctacgctga tggcgctggt ttttgtgctg 300
gcagctgcgc caatcagcca gggattgttt ggtaataccg actatcaggg gctggtgcgt 360
ttagtggcgc tggtgcaaat ggggatcgcc tggggcaacc tgttactggc gctgatgaaa 420
ggctttcgcg atgccgcagg taatgcgtta tcgctgattg tcggcagctt gattggcgtt 480
ctcgcgtact acgtcagtta ccgtttgggc ggttatgaag gggcgttgct gggtctggcg 540
ctgattcccg cgctggtggt aattcctgcc gccatcatgt tgatcaaacg tggtgtcatc 600
ccgttaagct atctgaaacc cagctgggat aacggtctgg cagggcagtt gagcaaattt 660
acgctcatgg cgttgattac gtcggtgacc ttgcctgttg cttacatcat gatgcgtaaa 720
ctgctggcgg cgcagtatag ctgggatgag gtggggatct ggcaaggggt gagcagtatt 780
tccgatgcct acctgcaatt tattacggca tcgttcagcg tatatttgct gcccacgttg 840
tcgcggctaa cggaaaagcg cgatatcacc cgggaagtgg ttaaatcgct gaaattcgtc 900
ttaccggcag tggcggcggc gagttttacc gtctggctgc tgcgtgattt tgctatctgg 960
ctgctgttgt cgaataaatt taccgctatg cgcgatctct ttgcctggca gttagtgggt 1020
gatgtgttaa aagtgggcgc ttatgtcttt ggttatctgg tgatcgccaa agcgtcactg 1080
cggttttata ttctggcgga agtcagccag ttcactttat tgatggtatt tgcccactgg 1140
ctaatccctg cgcatggtgc actgggcgcg gcgcaggcat atatggcaac ttatatcgtc 1200
tatttttctc tttgttgtgg cgtgttttta ctctggcgta ggcgggcatg a 1251
<210> 32
<211> 416
<212> PRT
<213> Escherichia coli K12 MG1655
<400> 32
Met Ser Leu Ala Lys Ala Ser Leu Trp Thr Ala Ala Ser Thr Leu Val
1 5 10 15
Lys Ile Gly Ala Gly Leu Leu Val Gly Lys Leu Leu Ala Val Ser Phe
20 25 30
Gly Pro Ala Gly Leu Gly Leu Ala Ala Asn Phe Arg Gln Leu Ile Thr
35 40 45
Val Leu Gly Val Leu Ala Gly Ala Gly Ile Phe Asn Gly Val Thr Lys
50 55 60
Tyr Val Ala Gln Tyr His Asp Asn Pro Gln Gln Leu Arg Arg Val Val
65 70 75 80
Gly Thr Ser Ser Ala Met Val Leu Gly Phe Ser Thr Leu Met Ala Leu
85 90 95
Val Phe Val Leu Ala Ala Ala Pro Ile Ser Gln Gly Leu Phe Gly Asn
100 105 110
Thr Asp Tyr Gln Gly Leu Val Arg Leu Val Ala Leu Val Gln Met Gly
115 120 125
Ile Ala Trp Gly Asn Leu Leu Leu Ala Leu Met Lys Gly Phe Arg Asp
130 135 140
Ala Ala Gly Asn Ala Leu Ser Leu Ile Val Gly Ser Leu Ile Gly Val
145 150 155 160
Leu Ala Tyr Tyr Val Ser Tyr Arg Leu Gly Gly Tyr Glu Gly Ala Leu
165 170 175
Leu Gly Leu Ala Leu Ile Pro Ala Leu Val Val Ile Pro Ala Ala Ile
180 185 190
Met Leu Ile Lys Arg Gly Val Ile Pro Leu Ser Tyr Leu Lys Pro Ser
195 200 205
Trp Asp Asn Gly Leu Ala Gly Gln Leu Ser Lys Phe Thr Leu Met Ala
210 215 220
Leu Ile Thr Ser Val Thr Leu Pro Val Ala Tyr Ile Met Met Arg Lys
225 230 235 240
Leu Leu Ala Ala Gln Tyr Ser Trp Asp Glu Val Gly Ile Trp Gln Gly
245 250 255
Val Ser Ser Ile Ser Asp Ala Tyr Leu Gln Phe Ile Thr Ala Ser Phe
260 265 270
Ser Val Tyr Leu Leu Pro Thr Leu Ser Arg Leu Thr Glu Lys Arg Asp
275 280 285
Ile Thr Arg Glu Val Val Lys Ser Leu Lys Phe Val Leu Pro Ala Val
290 295 300
Ala Ala Ala Ser Phe Thr Val Trp Leu Leu Arg Asp Phe Ala Ile Trp
305 310 315 320
Leu Leu Leu Ser Asn Lys Phe Thr Ala Met Arg Asp Leu Phe Ala Trp
325 330 335
Gln Leu Val Gly Asp Val Leu Lys Val Gly Ala Tyr Val Phe Gly Tyr
340 345 350
Leu Val Ile Ala Lys Ala Ser Leu Arg Phe Tyr Ile Leu Ala Glu Val
355 360 365
Ser Gln Phe Thr Leu Leu Met Val Phe Ala His Trp Leu Ile Pro Ala
370 375 380
His Gly Ala Leu Gly Ala Ala Gln Ala Tyr Met Ala Thr Tyr Ile Val
385 390 395 400
Tyr Phe Ser Leu Cys Cys Gly Val Phe Leu Leu Trp Arg Arg Arg Ala
405 410 415
<210> 33
<211> 1140
<212> DNA
<213> Escherichia coli K12 MG1655
<400> 33
atgatgaaat ccaaaatgaa attgatgcca ttattggtgt cagtaacctt gataagcggt 60
tgcacagtac ttccgggcag caatatgtcg acgatgggca aagacgtcat caaacagcag 120
gacgctgatt tcgatctcga caaaatggtg aatgtttatc cgctgacccc gcgcctgatt 180
gaccaattac gcccacgccc gaatgtagcg cgccccaata tgacgctgga aagtgagatc 240
gcgaattacc agtatcgcgt cgggccgggg gacgttctta atgtcaccgt ctgggatcac 300
ccggaactca ccacgccagc cggtcagtac cgcagctcca gcgacaccgg caactgggta 360
cagcctgacg gcactatgtt ttacccgtat atcggcaagg tccacgtagt cgggaaaacg 420
ctcgctgaaa tccgcagtga tattaccggg cgcttagcga cgtacatcgc tgacccgcag 480
gtggacgtta atatcgccgc cttccgctca caaaaggcct atatctccgg tcaggtgaat 540
aaatccggtc aacaggcgat caccaacgtg ccactgacta ttctcgacgc catcaacgcc 600
gcaggtggcc tgaccgacac cgctgactgg cgcaacgtgg tgctaacaca caatggtcgt 660
gaagagcgca tttctttgca ggcgctgatg caaaacggcg acctcaacca gaatcgcctg 720
ctttaccccg gcgatattct ctacgtgcca cgtaatgatg atctgaaagt atttgtgatg 780
ggtgaagtga agaaacagag caccctgaaa atggacttta gcggcatgac cctgactgaa 840
gccctgggca atgctgaagg catcgacatg accacctcca acgccagcgg catctttgtc 900
attcgtccgc tgaaaggcga gggcgggcgt aacggcaaga ttgccaatat ctaccagctg 960
gatatgtccg atgccacgtc gctggtgatg gcgacagaat tccgcctgca accttatgac 1020
gtggtgtatg tcaccaccgc cccggtttcc cgctggaacc gtctgatcaa tcagttgctg 1080
ccaactatta gcggtgtccg ttacatgacg gatacagcca gcgacattca taactggtaa 1140
<210> 34
<211> 379
<212> PRT
<213> Escherichia coli K12 MG1655
<400> 34
Met Met Lys Ser Lys Met Lys Leu Met Pro Leu Leu Val Ser Val Thr
1 5 10 15
Leu Ile Ser Gly Cys Thr Val Leu Pro Gly Ser Asn Met Ser Thr Met
20 25 30
Gly Lys Asp Val Ile Lys Gln Gln Asp Ala Asp Phe Asp Leu Asp Lys
35 40 45
Met Val Asn Val Tyr Pro Leu Thr Pro Arg Leu Ile Asp Gln Leu Arg
50 55 60
Pro Arg Pro Asn Val Ala Arg Pro Asn Met Thr Leu Glu Ser Glu Ile
65 70 75 80
Ala Asn Tyr Gln Tyr Arg Val Gly Pro Gly Asp Val Leu Asn Val Thr
85 90 95
Val Trp Asp His Pro Glu Leu Thr Thr Pro Ala Gly Gln Tyr Arg Ser
100 105 110
Ser Ser Asp Thr Gly Asn Trp Val Gln Pro Asp Gly Thr Met Phe Tyr
115 120 125
Pro Tyr Ile Gly Lys Val His Val Val Gly Lys Thr Leu Ala Glu Ile
130 135 140
Arg Ser Asp Ile Thr Gly Arg Leu Ala Thr Tyr Ile Ala Asp Pro Gln
145 150 155 160
Val Asp Val Asn Ile Ala Ala Phe Arg Ser Gln Lys Ala Tyr Ile Ser
165 170 175
Gly Gln Val Asn Lys Ser Gly Gln Gln Ala Ile Thr Asn Val Pro Leu
180 185 190
Thr Ile Leu Asp Ala Ile Asn Ala Ala Gly Gly Leu Thr Asp Thr Ala
195 200 205
Asp Trp Arg Asn Val Val Leu Thr His Asn Gly Arg Glu Glu Arg Ile
210 215 220
Ser Leu Gln Ala Leu Met Gln Asn Gly Asp Leu Asn Gln Asn Arg Leu
225 230 235 240
Leu Tyr Pro Gly Asp Ile Leu Tyr Val Pro Arg Asn Asp Asp Leu Lys
245 250 255
Val Phe Val Met Gly Glu Val Lys Lys Gln Ser Thr Leu Lys Met Asp
260 265 270
Phe Ser Gly Met Thr Leu Thr Glu Ala Leu Gly Asn Ala Glu Gly Ile
275 280 285
Asp Met Thr Thr Ser Asn Ala Ser Gly Ile Phe Val Ile Arg Pro Leu
290 295 300
Lys Gly Glu Gly Gly Arg Asn Gly Lys Ile Ala Asn Ile Tyr Gln Leu
305 310 315 320
Asp Met Ser Asp Ala Thr Ser Leu Val Met Ala Thr Glu Phe Arg Leu
325 330 335
Gln Pro Tyr Asp Val Val Tyr Val Thr Thr Ala Pro Val Ser Arg Trp
340 345 350
Asn Arg Leu Ile Asn Gln Leu Leu Pro Thr Ile Ser Gly Val Arg Tyr
355 360 365
Met Thr Asp Thr Ala Ser Asp Ile His Asn Trp
370 375
<210> 35
<211> 1737
<212> DNA
<213> Helicobacter pylori strain ATCC 700392 / 26695
<400> 35
atggctaaaa agaaacataa aattagcacg ctgaaatact ttttacgtag cctgaagcag 60
atctatatgc ttatcacgtt caaggagaaa atggtttttt tcctattagt gctaatggcc 120
gtttttagca gctttgttga agtgatgagc cttacgcttc taatgccgtt tatcacgctt 180
gcgtcagatc cgaaccgtgc gctggacgat aaagattgga aaatggttta tgattttttc 240
catttttcaa gcccagttcg gttaatgtat ttcttttctt tttgcttagt gggcatttat 300
ttattccgta tgttttatgg cgtgagcttc acgtatttaa aaggccggtt ttcaaataag 360
aaagcatatc agatcaagca gcagttattt ctgcaacata ttaaaagcaa ttacctttct 420
cacttaaatc ataatttaga tagcctgcgt gacattatca ataataaagc tgaaggcatg 480
tttatgagct ttaatgcttt cctgagctta cttacggaaa taacggtgat cgtttttttc 540
tactcaacgc ttatactgac gaattggaaa ataacgcttg tttttacgat gatccttgca 600
ctgcagattt ttttaattgt aaagaaagta acggttctta tcaagaaaaa gggagagatg 660
gccgcaaaat caaaagccca gacgttaaaa gttttttcaa aatttttcag caacttcaaa 720
atcacgaaac ttaaagacaa tcacgaagaa gctcataagc tttttggaga aaatagccgg 780
aaagctcatg acactgagat tatttacgcg acgttgcaag tagtaccacg ttattcaata 840
gaaacggttg gttttagctt attaattctg gccgtagcgt atattctttt caaatacggt 900
gaagcgaaaa tggtgcttcc gacgattagc atgtatgcgc ttgccttata tcgtatactt 960
ccgagcgtga cgggaatgat caattactat aacgaaatcg cgtataatca attagccacg 1020
aatatggttt ttaaaagctt aagcaaaacg atcgttgaag aggatctggt accgctggac 1080
tttaacgaga aaatcacgtt gcagaatatt tcattcgcgt ataagtcaaa gcatcccgtt 1140
ttaaaagatt ttaatcttac gattcagcgt gggcaaaaag tagcgcttat aggtcattct 1200
ggctgcggca aatcaacgct tgccgatatt attatgggct taacgtaccc gaaaagcggc 1260
gaaattttta ttgataatac gttactgacg aataaaaatc gtcgttcatg gcgaaaaaag 1320
ataggttata tccctcagaa tatttactta tttgatggta cggttggcga taatatcgcg 1380
tttggctctg caatagatga aaaacgttta attaaggtgt gcaaaatggc gcatatttat 1440
gattttctgt gcgagcatga aggcttaaaa acgcaagtgg gcgaaggcgg ggcgaagtta 1500
agcggtgggc agaaacaacg tataggtatt gctcgtgcac tgtacgataa tccggaaatt 1560
ttagttctgg atgaagcaac gtcagcactt gacaatgaaa cggagtctaa aatcatggat 1620
gaaatctatc agatcgcgaa aaataaaacg ctaatcgtta tcgctcaccg tctgagcacg 1680
attgaacgtt gtgaagtaat cattgacatg agccagcata aagacaacct tggttaa 1737
<210> 36
<211> 578
<212> PRT
<213> Helicobacter pylori strain ATCC 700392 / 26695
<400> 36
Met Ala Lys Lys Lys His Lys Ile Ser Thr Leu Lys Tyr Phe Leu Arg
1 5 10 15
Ser Leu Lys Gln Ile Tyr Met Leu Ile Thr Phe Lys Glu Lys Met Val
20 25 30
Phe Phe Leu Leu Val Leu Met Ala Val Phe Ser Ser Phe Val Glu Val
35 40 45
Met Ser Leu Thr Leu Leu Met Pro Phe Ile Thr Leu Ala Ser Asp Pro
50 55 60
Asn Arg Ala Leu Asp Asp Lys Asp Trp Lys Met Val Tyr Asp Phe Phe
65 70 75 80
His Phe Ser Ser Pro Val Arg Leu Met Tyr Phe Phe Ser Phe Cys Leu
85 90 95
Val Gly Ile Tyr Leu Phe Arg Met Phe Tyr Gly Val Ser Phe Thr Tyr
100 105 110
Leu Lys Gly Arg Phe Ser Asn Lys Lys Ala Tyr Gln Ile Lys Gln Gln
115 120 125
Leu Phe Leu Gln His Ile Lys Ser Asn Tyr Leu Ser His Leu Asn His
130 135 140
Asn Leu Asp Ser Leu Arg Asp Ile Ile Asn Asn Lys Ala Glu Gly Met
145 150 155 160
Phe Met Ser Phe Asn Ala Phe Leu Ser Leu Leu Thr Glu Ile Thr Val
165 170 175
Ile Val Phe Phe Tyr Ser Thr Leu Ile Leu Thr Asn Trp Lys Ile Thr
180 185 190
Leu Val Phe Thr Met Ile Leu Ala Leu Gln Ile Phe Leu Ile Val Lys
195 200 205
Lys Val Thr Val Leu Ile Lys Lys Lys Gly Glu Met Ala Ala Lys Ser
210 215 220
Lys Ala Gln Thr Leu Lys Val Phe Ser Lys Phe Phe Ser Asn Phe Lys
225 230 235 240
Ile Thr Lys Leu Lys Asp Asn His Glu Glu Ala His Lys Leu Phe Gly
245 250 255
Glu Asn Ser Arg Lys Ala His Asp Thr Glu Ile Ile Tyr Ala Thr Leu
260 265 270
Gln Val Val Pro Arg Tyr Ser Ile Glu Thr Val Gly Phe Ser Leu Leu
275 280 285
Ile Leu Ala Val Ala Tyr Ile Leu Phe Lys Tyr Gly Glu Ala Lys Met
290 295 300
Val Leu Pro Thr Ile Ser Met Tyr Ala Leu Ala Leu Tyr Arg Ile Leu
305 310 315 320
Pro Ser Val Thr Gly Met Ile Asn Tyr Tyr Asn Glu Ile Ala Tyr Asn
325 330 335
Gln Leu Ala Thr Asn Met Val Phe Lys Ser Leu Ser Lys Thr Ile Val
340 345 350
Glu Glu Asp Leu Val Pro Leu Asp Phe Asn Glu Lys Ile Thr Leu Gln
355 360 365
Asn Ile Ser Phe Ala Tyr Lys Ser Lys His Pro Val Leu Lys Asp Phe
370 375 380
Asn Leu Thr Ile Gln Arg Gly Gln Lys Val Ala Leu Ile Gly His Ser
385 390 395 400
Gly Cys Gly Lys Ser Thr Leu Ala Asp Ile Ile Met Gly Leu Thr Tyr
405 410 415
Pro Lys Ser Gly Glu Ile Phe Ile Asp Asn Thr Leu Leu Thr Asn Lys
420 425 430
Asn Arg Arg Ser Trp Arg Lys Lys Ile Gly Tyr Ile Pro Gln Asn Ile
435 440 445
Tyr Leu Phe Asp Gly Thr Val Gly Asp Asn Ile Ala Phe Gly Ser Ala
450 455 460
Ile Asp Glu Lys Arg Leu Ile Lys Val Cys Lys Met Ala His Ile Tyr
465 470 475 480
Asp Phe Leu Cys Glu His Glu Gly Leu Lys Thr Gln Val Gly Glu Gly
485 490 495
Gly Ala Lys Leu Ser Gly Gly Gln Lys Gln Arg Ile Gly Ile Ala Arg
500 505 510
Ala Leu Tyr Asp Asn Pro Glu Ile Leu Val Leu Asp Glu Ala Thr Ser
515 520 525
Ala Leu Asp Asn Glu Thr Glu Ser Lys Ile Met Asp Glu Ile Tyr Gln
530 535 540
Ile Ala Lys Asn Lys Thr Leu Ile Val Ile Ala His Arg Leu Ser Thr
545 550 555 560
Ile Glu Arg Cys Glu Val Ile Ile Asp Met Ser Gln His Lys Asp Asn
565 570 575
Leu Gly
<210> 37
<211> 333
<212> DNA
<213> Escherichia coli K12
<400> 37
atgaaccctt atatttatct tggtggtgca atacttgcag aggtcattgg tacaacctta 60
atgaagtttt cagaaggttt tacacggtta tggccatctg ttggtacaat tatttgttat 120
tgtgcatcat tctggttatt agctcagacg ctggcttata ttcctacagg gattgcttat 180
gctatctggt caggagtcgg tattgtcctg attagcttac tgtcatgggg atttttcggc 240
caacggctgg acctgccagc cattataggc atgatgttga tttgtgccgg tgtgttgatt 300
attaatttat tgtcacgaag cacaccacat taa 333
<210> 38
<211> 110
<212> PRT
<213> Escherichia coli K12
<400> 38
Met Asn Pro Tyr Ile Tyr Leu Gly Gly Ala Ile Leu Ala Glu Val Ile
1 5 10 15
Gly Thr Thr Leu Met Lys Phe Ser Glu Gly Phe Thr Arg Leu Trp Pro
20 25 30
Ser Val Gly Thr Ile Ile Cys Tyr Cys Ala Ser Phe Trp Leu Leu Ala
35 40 45
Gln Thr Leu Ala Tyr Ile Pro Thr Gly Ile Ala Tyr Ala Ile Trp Ser
50 55 60
Gly Val Gly Ile Val Leu Ile Ser Leu Leu Ser Trp Gly Phe Phe Gly
65 70 75 80
Gln Arg Leu Asp Leu Pro Ala Ile Ile Gly Met Met Leu Ile Cys Ala
85 90 95
Gly Val Leu Ile Ile Asn Leu Leu Ser Arg Ser Thr Pro His
100 105 110
<210> 39
<211> 1524
<212> DNA
<213> Bifidobacterium longum subsp. infantis (strain ATCC 15697)
<400> 39
atgtcgaacg agaataccgc cgtgggcgat gtgcgcaaga aaggcggatt aggccagcgc 60
attgcgtatg cttgcggcaa cttagggcag gccgcgtttt ataacgctat gtcgacgtat 120
tttgtgacgt atgtgacctc gtgcctgttt gtgtcgtatt cgaaagcttt agcggcgcag 180
atgattgcgg tgattaccgg cctgattgta gtaattcgca ttgcggaaat ttttattgac 240
ccgttactgg gcaacttagt ggataatacc accaccaaat ggggccggtt tcgcccgtgg 300
cagtttattg gcgggctggt gagcagcgtg ctgattatgt taattttttc aggaatgttt 360
ggactggtga acgtgaatac cacgctgttt attgtgctgt ttgtgattac gtttattgtg 420
cttgatgtgt tttatagcct gcgggatatt agctattggg gcatgattcc ggccttaagc 480
agcgatagcc atgagcggag cacctatacc gcgttaggca cctttaccgg cagcattggc 540
tataacggca ttaccgtgat tgtgattccg attgtgtcgt attttacctg gacttttacc 600
ggcgcgaaag gccagggcca ggccggatgg accagctttg gctttattgt ggccttatta 660
ggcctgatta ccgcgtgggc cgtggcgttt ggcaccaaag agtcgaccaa cgccctgcgc 720
gcgaaagcgc agaaaaacgg caacccgttt gaagccttta aagcgctgtt tcagaacgat 780
cagctgttat gggttgcgct gagctatctg ctgtatgcga ttgctaacgt gattacgacc 840
ggagtgatgt attatttatt tgtgtttgtg cttgatgaac cggccgcgtt tagcgtgacc 900
gggattattc cgctgattgc gggatttatt atggccccgc tgtatccgat attaaaccgc 960
tggataccac ggcgctatct gtttgcgggc ggcatggtga gcatgattat tggctatacg 1020
atgttagcgc tgtttagctc gaacctgccg gttgtgattg tggcgctgat ttttttttac 1080
gtgcccgccc agtttattca gatgaccgcc attctgagcc tgaccgatag cattgaatat 1140
ggccagctga aaaacggcaa acgcaacgaa gccgtgaccc tgagcgtgcg gccaatgtta 1200
gataaaattg gcggcgccat gagcaacgga gtggttggag cggtagcgtt agccgctggc 1260
atgaccgggc acgcgacggc tgcggatatg accgccagca atattaccac gtttaaaacc 1320
tttgcgtttt atattccgct tgtattaatt attttatcgt tagtggtgtt ttggtttaaa 1380
gtgaaaattg atgagaaaat gcatgcccag attgtagatg aattagaggc gaaattagct 1440
agcggcgaaa ttgtggatga cgaagcccag accgtggaag cggttgaagc gattaacgaa 1500
gaaacgccgg ccgcgaaaaa ctaa 1524
<210> 40
<211> 507
<212> PRT
<213> Bifidobacterium longum subsp. infantis (strain ATCC 15697)
<400> 40
Met Ser Asn Glu Asn Thr Ala Val Gly Asp Val Arg Lys Lys Gly Gly
1 5 10 15
Leu Gly Gln Arg Ile Ala Tyr Ala Cys Gly Asn Leu Gly Gln Ala Ala
20 25 30
Phe Tyr Asn Ala Met Ser Thr Tyr Phe Val Thr Tyr Val Thr Ser Cys
35 40 45
Leu Phe Val Ser Tyr Ser Lys Ala Leu Ala Ala Gln Met Ile Ala Val
50 55 60
Ile Thr Gly Leu Ile Val Val Ile Arg Ile Ala Glu Ile Phe Ile Asp
65 70 75 80
Pro Leu Leu Gly Asn Leu Val Asp Asn Thr Thr Thr Lys Trp Gly Arg
85 90 95
Phe Arg Pro Trp Gln Phe Ile Gly Gly Leu Val Ser Ser Val Leu Ile
100 105 110
Met Leu Ile Phe Ser Gly Met Phe Gly Leu Val Asn Val Asn Thr Thr
115 120 125
Leu Phe Ile Val Leu Phe Val Ile Thr Phe Ile Val Leu Asp Val Phe
130 135 140
Tyr Ser Leu Arg Asp Ile Ser Tyr Trp Gly Met Ile Pro Ala Leu Ser
145 150 155 160
Ser Asp Ser His Glu Arg Ser Thr Tyr Thr Ala Leu Gly Thr Phe Thr
165 170 175
Gly Ser Ile Gly Tyr Asn Gly Ile Thr Val Ile Val Ile Pro Ile Val
180 185 190
Ser Tyr Phe Thr Trp Thr Phe Thr Gly Ala Lys Gly Gln Gly Gln Ala
195 200 205
Gly Trp Thr Ser Phe Gly Phe Ile Val Ala Leu Leu Gly Leu Ile Thr
210 215 220
Ala Trp Ala Val Ala Phe Gly Thr Lys Glu Ser Thr Asn Ala Leu Arg
225 230 235 240
Ala Lys Ala Gln Lys Asn Gly Asn Pro Phe Glu Ala Phe Lys Ala Leu
245 250 255
Phe Gln Asn Asp Gln Leu Leu Trp Val Ala Leu Ser Tyr Leu Leu Tyr
260 265 270
Ala Ile Ala Asn Val Ile Thr Thr Gly Val Met Tyr Tyr Leu Phe Val
275 280 285
Phe Val Leu Asp Glu Pro Ala Ala Phe Ser Val Thr Gly Ile Ile Pro
290 295 300
Leu Ile Ala Gly Phe Ile Met Ala Pro Leu Tyr Pro Ile Leu Asn Arg
305 310 315 320
Trp Ile Pro Arg Arg Tyr Leu Phe Ala Gly Gly Met Val Ser Met Ile
325 330 335
Ile Gly Tyr Thr Met Leu Ala Leu Phe Ser Ser Asn Leu Pro Val Val
340 345 350
Ile Val Ala Leu Ile Phe Phe Tyr Val Pro Ala Gln Phe Ile Gln Met
355 360 365
Thr Ala Ile Leu Ser Leu Thr Asp Ser Ile Glu Tyr Gly Gln Leu Lys
370 375 380
Asn Gly Lys Arg Asn Glu Ala Val Thr Leu Ser Val Arg Pro Met Leu
385 390 395 400
Asp Lys Ile Gly Gly Ala Met Ser Asn Gly Val Val Gly Ala Val Ala
405 410 415
Leu Ala Ala Gly Met Thr Gly His Ala Thr Ala Ala Asp Met Thr Ala
420 425 430
Ser Asn Ile Thr Thr Phe Lys Thr Phe Ala Phe Tyr Ile Pro Leu Val
435 440 445
Leu Ile Ile Leu Ser Leu Val Val Phe Trp Phe Lys Val Lys Ile Asp
450 455 460
Glu Lys Met His Ala Gln Ile Val Asp Glu Leu Glu Ala Lys Leu Ala
465 470 475 480
Ser Gly Glu Ile Val Asp Asp Glu Ala Gln Thr Val Glu Ala Val Glu
485 490 495
Ala Ile Asn Glu Glu Thr Pro Ala Ala Lys Asn
500 505
<210> 41
<211> 1533
<212> DNA
<213> Bifidobacterium longum subsp. infantis (strain ATCC 15697)
<400> 41
atgtcgaacg agaatgtggc cgatggtgat gtgcgccgaa aaggcggact aggccagcgc 60
attgcgtatg cctttggcaa cttagggcag gccgcgtttt ataacgccat gtcgacgtat 120
tttattgtgt atgtgacctc gtgcctgttt agcggcgtag ataaagccct tgccgcgaaa 180
ctgattggcg tgattacctc gttagtggtg attattcgca ttgcggaaat ttttgtggac 240
ccgctgctgg gcaacctggt tgataatacc aataccaaat ggggccggtt tcgcccgtgg 300
cagttttttg gcggactggt gagcagcgtg ctgcttgccg tggtattttc gggcatgttc 360
ggcctggtga acgtaaatag cactttattt attgtggtgt ttgtgattac gtttattgtg 420
cttgatgtgt tttatagcct gcgggatatt agctattggg gcatgattcc ggccttaagc 480
agcgatagcc atgaacggag cacctatact gcgttaggca gctttaccgg cagcattggc 540
ggcaacgcga ttaccatttt agtgataccg gttgtgacct atttttcctg ggtttttacc 600
ggcgaaaacg cggaacatca gagcggatgg accgcttttg gcattattgt ggccgtgtta 660
ggcattatga ccgcgtggac cgtggcgttt ggcacccgag agaaccaatc ggcgcttcgc 720
gcgaacgccg aggataacgg gggaccgttg caggccttta aagcggtgtt tcagaacgat 780
cagctgttat gggttgcgct gagctatctg ctgtatgcga ttgccaacgt gaccaccacc 840
ggagtgcttt tatttctgtt taaatttgtg cttgataatc aggccgcttt tagcgccacc 900
ggagtgattg cgatgattgc cggcctggtg atgagcccgc tgtatccgat actgaaccga 960
tatataccgc gccgctatct gtatattggc ggcatggtga gcatgattgt ggcttacgtg 1020
atgttagcgc tgtttagctc gaatattgtg ctggtgttta ttgccctggt gttattttat 1080
gtaccaggca cgttaattat gatgacggtg attttaagcc tgaccgatag cattgaatat 1140
ggccagctga aaaacggcaa acgcaacgaa gcggtaacgc ttagcattcg cccgatgtta 1200
gacaaaattg ggggcgctct gagcaacggc atagtgggct ttattgcgct tgccgcgggc 1260
atgacgggcg acgctaccgc cgcggacatg accccgacga atattcatgt gtttaaaatt 1320
tgcgcctttt acgcgccgtt aattctgatt gtgttatcgc tggttgtgtt tgtgagcaaa 1380
gtgaaaatta ccgagaaaat gcatgcccag attgtagatg aattagaggc gaaattagct 1440
agcggcgaaa ttgtggatga cgaagcccag ccagtggaag ccgcggaagc cgcggctgcg 1500
gttggcgacg aaacgcagac tgtgaaaaac taa 1533
<210> 42
<211> 510
<212> PRT
<213> Bifidobacterium longum subsp. infantis (strain ATCC 15697)
<400> 42
Met Ser Asn Glu Asn Val Ala Asp Gly Asp Val Arg Arg Lys Gly Gly
1 5 10 15
Leu Gly Gln Arg Ile Ala Tyr Ala Phe Gly Asn Leu Gly Gln Ala Ala
20 25 30
Phe Tyr Asn Ala Met Ser Thr Tyr Phe Ile Val Tyr Val Thr Ser Cys
35 40 45
Leu Phe Ser Gly Val Asp Lys Ala Leu Ala Ala Lys Leu Ile Gly Val
50 55 60
Ile Thr Ser Leu Val Val Ile Ile Arg Ile Ala Glu Ile Phe Val Asp
65 70 75 80
Pro Leu Leu Gly Asn Leu Val Asp Asn Thr Asn Thr Lys Trp Gly Arg
85 90 95
Phe Arg Pro Trp Gln Phe Phe Gly Gly Leu Val Ser Ser Val Leu Leu
100 105 110
Ala Val Val Phe Ser Gly Met Phe Gly Leu Val Asn Val Asn Ser Thr
115 120 125
Leu Phe Ile Val Val Phe Val Ile Thr Phe Ile Val Leu Asp Val Phe
130 135 140
Tyr Ser Leu Arg Asp Ile Ser Tyr Trp Gly Met Ile Pro Ala Leu Ser
145 150 155 160
Ser Asp Ser His Glu Arg Ser Thr Tyr Thr Ala Leu Gly Ser Phe Thr
165 170 175
Gly Ser Ile Gly Gly Asn Ala Ile Thr Ile Leu Val Ile Pro Val Val
180 185 190
Thr Tyr Phe Ser Trp Val Phe Thr Gly Glu Asn Ala Glu His Gln Ser
195 200 205
Gly Trp Thr Ala Phe Gly Ile Ile Val Ala Val Leu Gly Ile Met Thr
210 215 220
Ala Trp Thr Val Ala Phe Gly Thr Arg Glu Asn Gln Ser Ala Leu Arg
225 230 235 240
Ala Asn Ala Glu Asp Asn Gly Gly Pro Leu Gln Ala Phe Lys Ala Val
245 250 255
Phe Gln Asn Asp Gln Leu Leu Trp Val Ala Leu Ser Tyr Leu Leu Tyr
260 265 270
Ala Ile Ala Asn Val Thr Thr Thr Gly Val Leu Leu Phe Leu Phe Lys
275 280 285
Phe Val Leu Asp Asn Gln Ala Ala Phe Ser Ala Thr Gly Val Ile Ala
290 295 300
Met Ile Ala Gly Leu Val Met Ser Pro Leu Tyr Pro Ile Leu Asn Arg
305 310 315 320
Tyr Ile Pro Arg Arg Tyr Leu Tyr Ile Gly Gly Met Val Ser Met Ile
325 330 335
Val Ala Tyr Val Met Leu Ala Leu Phe Ser Ser Asn Ile Val Leu Val
340 345 350
Phe Ile Ala Leu Val Leu Phe Tyr Val Pro Gly Thr Leu Ile Met Met
355 360 365
Thr Val Ile Leu Ser Leu Thr Asp Ser Ile Glu Tyr Gly Gln Leu Lys
370 375 380
Asn Gly Lys Arg Asn Glu Ala Val Thr Leu Ser Ile Arg Pro Met Leu
385 390 395 400
Asp Lys Ile Gly Gly Ala Leu Ser Asn Gly Ile Val Gly Phe Ile Ala
405 410 415
Leu Ala Ala Gly Met Thr Gly Asp Ala Thr Ala Ala Asp Met Thr Pro
420 425 430
Thr Asn Ile His Val Phe Lys Ile Cys Ala Phe Tyr Ala Pro Leu Ile
435 440 445
Leu Ile Val Leu Ser Leu Val Val Phe Val Ser Lys Val Lys Ile Thr
450 455 460
Glu Lys Met His Ala Gln Ile Val Asp Glu Leu Glu Ala Lys Leu Ala
465 470 475 480
Ser Gly Glu Ile Val Asp Asp Glu Ala Gln Pro Val Glu Ala Ala Glu
485 490 495
Ala Ala Ala Ala Val Gly Asp Glu Thr Gln Thr Val Lys Asn
500 505 510
<210> 43
<211> 1128
<212> DNA
<213> Bifidobacterium longum subsp. infantis (strain ATCC 15697)
<400> 43
atggctgaag tggtatttga tcatgtgact cggatttatc cgggcaacga caaaccaagc 60
gtggacgacc tgaatcttga cattaaagac ggcgaatttt tagtgttagt gggccccagc 120
ggctgtggga aatcaacgac ccttcgaatg ttagcgggcc tggaagaagt gaataaaggc 180
cgcattttaa ttgggggcaa agacgtgacc acgatgcagc cgaaagatcg cgatattgct 240
atggtgtttc agaactatgc tctgtatccg catatgaccg tagcggataa tatgggcttt 300
gcgctgaaaa ttgcgggcac tccgaaagat gaaattcgca aacgcgtgga aaaagcggct 360
gaaattttag atctgaccga atatttagat cgcaaaccga aagctctgag cggtgggcag 420
cggcagcgag tggcgatggg gcgagctatt gtgcgggaac cgaaagtgtt tttaatggac 480
gaaccgctga gcaacttaga tgcgaaatta cgggtgcaga cccggaccca gattgcggct 540
ctgcagcggc agttaggcgt gaccaccctg tatgtgaccc atgaccagac cgaagcgctg 600
acgatgggcg accgcattgc ggtgattaaa ttaggcattc tgcaacaggt tggcgcgccg 660
accgagctgt acgaccggcc ggcgaacgtg tttgtggccg gctttattgg cagcccgagc 720
atgaacctga atacccatcc ggttgtgaac ggcaaagcca aaattgggga agataccgtg 780
gacctgccgg ccgaagcggt gaataaatta accgccgagg ataacggcca gattgttgtg 840
ggctttcggc cagaagatgc cggcctggcc ccggttgacg atccgaacgc gtttagcctg 900
aaagtagtga acgtggaaga tctgggcagc gacggctata tttatgggac cattgtgacc 960
gacggaagcg cggccgaagc gagccaggtg atgagcgatc agaataaatt aaccacgata 1020
cgggtgaatc cgcgggccct gccgaaagta ggcgccaccg tgaaaattaa aattgatccg 1080
gcgaaaatgc atctgtttgc tccgagcact gaactgcggc tgaactga 1128
<210> 44
<211> 375
<212> PRT
<213> Bifidobacterium longum subsp. infantis (strain ATCC 15697)
<400> 44
Met Ala Glu Val Val Phe Asp His Val Thr Arg Ile Tyr Pro Gly Asn
1 5 10 15
Asp Lys Pro Ser Val Asp Asp Leu Asn Leu Asp Ile Lys Asp Gly Glu
20 25 30
Phe Leu Val Leu Val Gly Pro Ser Gly Cys Gly Lys Ser Thr Thr Leu
35 40 45
Arg Met Leu Ala Gly Leu Glu Glu Val Asn Lys Gly Arg Ile Leu Ile
50 55 60
Gly Gly Lys Asp Val Thr Thr Met Gln Pro Lys Asp Arg Asp Ile Ala
65 70 75 80
Met Val Phe Gln Asn Tyr Ala Leu Tyr Pro His Met Thr Val Ala Asp
85 90 95
Asn Met Gly Phe Ala Leu Lys Ile Ala Gly Thr Pro Lys Asp Glu Ile
100 105 110
Arg Lys Arg Val Glu Lys Ala Ala Glu Ile Leu Asp Leu Thr Glu Tyr
115 120 125
Leu Asp Arg Lys Pro Lys Ala Leu Ser Gly Gly Gln Arg Gln Arg Val
130 135 140
Ala Met Gly Arg Ala Ile Val Arg Glu Pro Lys Val Phe Leu Met Asp
145 150 155 160
Glu Pro Leu Ser Asn Leu Asp Ala Lys Leu Arg Val Gln Thr Arg Thr
165 170 175
Gln Ile Ala Ala Leu Gln Arg Gln Leu Gly Val Thr Thr Leu Tyr Val
180 185 190
Thr His Asp Gln Thr Glu Ala Leu Thr Met Gly Asp Arg Ile Ala Val
195 200 205
Ile Lys Leu Gly Ile Leu Gln Gln Val Gly Ala Pro Thr Glu Leu Tyr
210 215 220
Asp Arg Pro Ala Asn Val Phe Val Ala Gly Phe Ile Gly Ser Pro Ser
225 230 235 240
Met Asn Leu Asn Thr His Pro Val Val Asn Gly Lys Ala Lys Ile Gly
245 250 255
Glu Asp Thr Val Asp Leu Pro Ala Glu Ala Val Asn Lys Leu Thr Ala
260 265 270
Glu Asp Asn Gly Gln Ile Val Val Gly Phe Arg Pro Glu Asp Ala Gly
275 280 285
Leu Ala Pro Val Asp Asp Pro Asn Ala Phe Ser Leu Lys Val Val Asn
290 295 300
Val Glu Asp Leu Gly Ser Asp Gly Tyr Ile Tyr Gly Thr Ile Val Thr
305 310 315 320
Asp Gly Ser Ala Ala Glu Ala Ser Gln Val Met Ser Asp Gln Asn Lys
325 330 335
Leu Thr Thr Ile Arg Val Asn Pro Arg Ala Leu Pro Lys Val Gly Ala
340 345 350
Thr Val Lys Ile Lys Ile Asp Pro Ala Lys Met His Leu Phe Ala Pro
355 360 365
Ser Thr Glu Leu Arg Leu Asn
370 375
<210> 45
<211> 1218
<212> DNA
<213> Bifidobacterium longum subsp. infantis (strain ATCC 15697)
<400> 45
atggctctag acgtaggcaa ggccttaaag agcaaaacct tagtggttgg cgtgttaagc 60
atgagcttac tgatgagcgc gtcgaatgct gtgtcgggca ccataccggc catgaaagaa 120
gcctttagcg attatagcgc cgccaacgtt gagctgctga ccacggtgcc gacgattggc 180
agcatggttg gcacggcttt aaccggccta tttgcgaatg cgattggccg aaagaagatt 240
gccatggccg gatttttaat aagcgcggtg actggcgtga taccggcctt ttttccgtat 300
tactggccga tattaataag ccgaatgttt tttggctttg gaagcgccct gtttgtgacc 360
ttatcagtga gctatattac cgatctgtac gatggcgaca tgcaacgcaa actgcttgga 420
tggagacagg ccgtgggcaa tcttggcgat gtggtgctgc tgtttgtggc gtcactgctg 480
attaccatta actggcaaag cacgtattta attttttttc tgttatttgt gccaatggtg 540
ttagtgggca tgtttatacc gaaagaattt gacaactttt cgatacgctc ggccttagtg 600
gatgacgaag gccatgttgt ggataaatcg gcgagccaga aacagacgac gaactggcaa 660
gtgctgtggc tggcctttat ttttctggtt gtgagcatgc tttataacgt gatgagcatt 720
aaattagcgt cgtacgtggt tgacgagggc attgggagcg ctagcttagc gactttaatt 780
ttttcgtttt tagttgtggc gaccatttta agcggcgtgt tatttgataa agtggcgaaa 840
gtgaccaaac gcctgacggt gaccattagc gaagtggtga ttggcatttg ttttattgcg 900
actgccctga cgaaaaacgt gccgctgatg tttgcgctgg tgctgatagc gggctttgct 960
tggggcatta ttaacccagc cctgaccgct cggtttgtgg attatagccc agcccatagc 1020
atgaacctga ccacgagcat tgtgataatt ggcattaata ttggctgtct gattagcccg 1080
tatttttttg ccctgacggc ttcgattttt ggcaatagca gcgcgggatt tgcgattatt 1140
gtgggagggg ccttatattt agtgatggtt gtgattgaac tgattacctt aaaagtggat 1200
aagaaattaa cggtgtaa 1218
<210> 46
<211> 405
<212> PRT
<213> Bifidobacterium longum subsp. infantis (strain ATCC 15697)
<400> 46
Met Ala Leu Asp Val Gly Lys Ala Leu Lys Ser Lys Thr Leu Val Val
1 5 10 15
Gly Val Leu Ser Met Ser Leu Leu Met Ser Ala Ser Asn Ala Val Ser
20 25 30
Gly Thr Ile Pro Ala Met Lys Glu Ala Phe Ser Asp Tyr Ser Ala Ala
35 40 45
Asn Val Glu Leu Leu Thr Thr Val Pro Thr Ile Gly Ser Met Val Gly
50 55 60
Thr Ala Leu Thr Gly Leu Phe Ala Asn Ala Ile Gly Arg Lys Lys Ile
65 70 75 80
Ala Met Ala Gly Phe Leu Ile Ser Ala Val Thr Gly Val Ile Pro Ala
85 90 95
Phe Phe Pro Tyr Tyr Trp Pro Ile Leu Ile Ser Arg Met Phe Phe Gly
100 105 110
Phe Gly Ser Ala Leu Phe Val Thr Leu Ser Val Ser Tyr Ile Thr Asp
115 120 125
Leu Tyr Asp Gly Asp Met Gln Arg Lys Leu Leu Gly Trp Arg Gln Ala
130 135 140
Val Gly Asn Leu Gly Asp Val Val Leu Leu Phe Val Ala Ser Leu Leu
145 150 155 160
Ile Thr Ile Asn Trp Gln Ser Thr Tyr Leu Ile Phe Phe Leu Leu Phe
165 170 175
Val Pro Met Val Leu Val Gly Met Phe Ile Pro Lys Glu Phe Asp Asn
180 185 190
Phe Ser Ile Arg Ser Ala Leu Val Asp Asp Glu Gly His Val Val Asp
195 200 205
Lys Ser Ala Ser Gln Lys Gln Thr Thr Asn Trp Gln Val Leu Trp Leu
210 215 220
Ala Phe Ile Phe Leu Val Val Ser Met Leu Tyr Asn Val Met Ser Ile
225 230 235 240
Lys Leu Ala Ser Tyr Val Val Asp Glu Gly Ile Gly Ser Ala Ser Leu
245 250 255
Ala Thr Leu Ile Phe Ser Phe Leu Val Val Ala Thr Ile Leu Ser Gly
260 265 270
Val Leu Phe Asp Lys Val Ala Lys Val Thr Lys Arg Leu Thr Val Thr
275 280 285
Ile Ser Glu Val Val Ile Gly Ile Cys Phe Ile Ala Thr Ala Leu Thr
290 295 300
Lys Asn Val Pro Leu Met Phe Ala Leu Val Leu Ile Ala Gly Phe Ala
305 310 315 320
Trp Gly Ile Ile Asn Pro Ala Leu Thr Ala Arg Phe Val Asp Tyr Ser
325 330 335
Pro Ala His Ser Met Asn Leu Thr Thr Ser Ile Val Ile Ile Gly Ile
340 345 350
Asn Ile Gly Cys Leu Ile Ser Pro Tyr Phe Phe Ala Leu Thr Ala Ser
355 360 365
Ile Phe Gly Asn Ser Ser Ala Gly Phe Ala Ile Ile Val Gly Gly Ala
370 375 380
Leu Tyr Leu Val Met Val Val Ile Glu Leu Ile Thr Leu Lys Val Asp
385 390 395 400
Lys Lys Leu Thr Val
405
<210> 47
<211> 1206
<212> DNA
<213> Bifidobacterium longum subsp. infantis (strain ATCC 15697)
<400> 47
atgatacagc gctactctca aggaacgtca gctagaagaa tttttccaat attactgata 60
gccgagggac tatgcctaag cggcatgtcc gtggacctga ctattacctc actgaccggg 120
agcagcttag cccccgctcc ctggatggct acttttccga tagcctgcat atttattggg 180
acggtgattg gcactccggc tatgggacgc ttagtgggac ggtttggcta ccggcaagta 240
tttgtgtttg gcgcgcttct agcggtgtta gggggaataa gctcagcgac ggctttacgg 300
tttcatcagt ttcccttatt atgtatagga acgttttgtg tgggcatata tcagagcgga 360
acgaactatt atcggtacgc ggctgcggac agcatgccag gcaaggagtc gaaagctatt 420
aacggaattc taagcgctgg agcgatagct tcgattattg gcccggtact ggccactttt 480
tttggcactg ccaccaatat tgagtatgaa ggatcatact atgtggtgtc ggtgttagcg 540
gcgtgcgccg taattgtgct gctggcctta ccgaagatac agagccccac tccagcccat 600
atgcgcgata aggctaccgc ctcgactacc ccaaattacc cggctttact gacccggcca 660
cggtttgtgc tgggcgccac catttcgttt gtggcttcat ttgtgatggt gttagtgatg 720
tcgggcgctc caatagtgtt agaatcgacg tttagccaaa acgcccaaac cagaatggtt 780
gcgatgcaac tgcatatggt tggcatgtat ctgcccaccc tgtttgcgat ttttatattt 840
cataaaaaga actccgagat ggcccaggcc ttaacgggat taattattgg catgttaggc 900
actgtggttg ctttagcggc cagcgctagc tacgcggtga ctctggacct gctgctgatt 960
ggaataagct ggagcctgtg ctatgcggct ggctcggcgc tgttaactaa gagctatacg 1020
gaaagcgagc gaagctgggc ccgaggcgtg ggcgagttag ctccagtatt agggcaagtg 1080
ctgggatcag tgttagctgg cgtgctgctg gccgccggat ggaaaaccgt atttgtgacc 1140
gtgctggcca tgattgtatg cgccttaatt gcgatggctg gataccgcaa taagattaaa 1200
tcataa 1206
<210> 48
<211> 401
<212> PRT
<213> Bifidobacterium longum subsp. infantis (strain ATCC 15697)
<400> 48
Met Ile Gln Arg Tyr Ser Gln Gly Thr Ser Ala Arg Arg Ile Phe Pro
1 5 10 15
Ile Leu Leu Ile Ala Glu Gly Leu Cys Leu Ser Gly Met Ser Val Asp
20 25 30
Leu Thr Ile Thr Ser Leu Thr Gly Ser Ser Leu Ala Pro Ala Pro Trp
35 40 45
Met Ala Thr Phe Pro Ile Ala Cys Ile Phe Ile Gly Thr Val Ile Gly
50 55 60
Thr Pro Ala Met Gly Arg Leu Val Gly Arg Phe Gly Tyr Arg Gln Val
65 70 75 80
Phe Val Phe Gly Ala Leu Leu Ala Val Leu Gly Gly Ile Ser Ser Ala
85 90 95
Thr Ala Leu Arg Phe His Gln Phe Pro Leu Leu Cys Ile Gly Thr Phe
100 105 110
Cys Val Gly Ile Tyr Gln Ser Gly Thr Asn Tyr Tyr Arg Tyr Ala Ala
115 120 125
Ala Asp Ser Met Pro Gly Lys Glu Ser Lys Ala Ile Asn Gly Ile Leu
130 135 140
Ser Ala Gly Ala Ile Ala Ser Ile Ile Gly Pro Val Leu Ala Thr Phe
145 150 155 160
Phe Gly Thr Ala Thr Asn Ile Glu Tyr Glu Gly Ser Tyr Tyr Val Val
165 170 175
Ser Val Leu Ala Ala Cys Ala Val Ile Val Leu Leu Ala Leu Pro Lys
180 185 190
Ile Gln Ser Pro Thr Pro Ala His Met Arg Asp Lys Ala Thr Ala Ser
195 200 205
Thr Thr Pro Asn Tyr Pro Ala Leu Leu Thr Arg Pro Arg Phe Val Leu
210 215 220
Gly Ala Thr Ile Ser Phe Val Ala Ser Phe Val Met Val Leu Val Met
225 230 235 240
Ser Gly Ala Pro Ile Val Leu Glu Ser Thr Phe Ser Gln Asn Ala Gln
245 250 255
Thr Arg Met Val Ala Met Gln Leu His Met Val Gly Met Tyr Leu Pro
260 265 270
Thr Leu Phe Ala Ile Phe Ile Phe His Lys Lys Asn Ser Glu Met Ala
275 280 285
Gln Ala Leu Thr Gly Leu Ile Ile Gly Met Leu Gly Thr Val Val Ala
290 295 300
Leu Ala Ala Ser Ala Ser Tyr Ala Val Thr Leu Asp Leu Leu Leu Ile
305 310 315 320
Gly Ile Ser Trp Ser Leu Cys Tyr Ala Ala Gly Ser Ala Leu Leu Thr
325 330 335
Lys Ser Tyr Thr Glu Ser Glu Arg Ser Trp Ala Arg Gly Val Gly Glu
340 345 350
Leu Ala Pro Val Leu Gly Gln Val Leu Gly Ser Val Leu Ala Gly Val
355 360 365
Leu Leu Ala Ala Gly Trp Lys Thr Val Phe Val Thr Val Leu Ala Met
370 375 380
Ile Val Cys Ala Leu Ile Ala Met Ala Gly Tyr Arg Asn Lys Ile Lys
385 390 395 400
Ser
<210> 49
<211> 1224
<212> DNA
<213> Bifidobacterium longum subsp. infantis (strain ATCC 15697)
<400> 49
atgtcaaaga taataaatta ctcagaagta ctggagagca agcggctgat ggtaggcgtg 60
ttaagcgtgt catttctatt aagcgctggg aatgctatat cgggaacgat accagccatg 120
gaagaggcct ttagcaatat aagcaaggcg aatatagaaa ctctaacgac cataccgact 180
gccggaataa tgttaggaac cgtgttaagc ggagtattta gcaattacct aggaaagaaa 240
aagagcgtgt tagccgggtt aataattgct ttagtaggcg gagtaattcc agcctttctg 300
ccccaatatt ggcccatttt cataagccgg tttttattcg gcgtgggcat gggaattttc 360
aatccgcttt cagtgagcta tattaccgac ctgtacgtgg gcgaccggca gcggtcactt 420
cttggatatc gcaatgccgt atcgaatctg ggagacacca ttatgctttt tgtagctggg 480
attttaataa ccttcggatg gaatattacc tacctggtgt tttttgcgtt actgataccg 540
atagtactaa taatattatt tgtacccaaa gagtttgaca attttgacat tcgaaactca 600
gctctggacg aaaatgggca gatatcagat tcagtgtcag acgtgaagcc ctcaacgaat 660
ttaaaagtga ttgaagtagg cgtagtattc atggtaatta ctatgctata taacgccatt 720
ccgctgaagt tcgcctcgta tatagtgacg gaacatattg gcactgcgag caccgcgact 780
tggatttttt cgtttctggt gttagccggc atatttagcg gcgtgctgtt tgagaaaata 840
agcaaagtat ttaaacggtt aacggtgttt gtatttgaaa tagtaatagg cgtggcgtat 900
attacgatag cctttaccta taatataccg ttactgacgg ctttagtgtt aatttcaggc 960
ttcggatggg gaataattaa cccggcttta actgcccggt tagtagacgt gagcccgata 1020
aactcaatga atctgtcaac ttcaataata gtaattttca tttcagtagg gtcacttata 1080
agcccgtatt tttttgctat gtttgccggc ttatttggga acgacagcgc tgcctttgct 1140
atagtagttg ggggagcgct gtacgtggtg atggccgtgc ttgactttat taagataaag 1200
aagaataaag aactgtcgat ttaa 1224
<210> 50
<211> 407
<212> PRT
<213> Bifidobacterium longum subsp. infantis (strain ATCC 15697)
<400> 50
Met Ser Lys Ile Ile Asn Tyr Ser Glu Val Leu Glu Ser Lys Arg Leu
1 5 10 15
Met Val Gly Val Leu Ser Val Ser Phe Leu Leu Ser Ala Gly Asn Ala
20 25 30
Ile Ser Gly Thr Ile Pro Ala Met Glu Glu Ala Phe Ser Asn Ile Ser
35 40 45
Lys Ala Asn Ile Glu Thr Leu Thr Thr Ile Pro Thr Ala Gly Ile Met
50 55 60
Leu Gly Thr Val Leu Ser Gly Val Phe Ser Asn Tyr Leu Gly Lys Lys
65 70 75 80
Lys Ser Val Leu Ala Gly Leu Ile Ile Ala Leu Val Gly Gly Val Ile
85 90 95
Pro Ala Phe Leu Pro Gln Tyr Trp Pro Ile Phe Ile Ser Arg Phe Leu
100 105 110
Phe Gly Val Gly Met Gly Ile Phe Asn Pro Leu Ser Val Ser Tyr Ile
115 120 125
Thr Asp Leu Tyr Val Gly Asp Arg Gln Arg Ser Leu Leu Gly Tyr Arg
130 135 140
Asn Ala Val Ser Asn Leu Gly Asp Thr Ile Met Leu Phe Val Ala Gly
145 150 155 160
Ile Leu Ile Thr Phe Gly Trp Asn Ile Thr Tyr Leu Val Phe Phe Ala
165 170 175
Leu Leu Ile Pro Ile Val Leu Ile Ile Leu Phe Val Pro Lys Glu Phe
180 185 190
Asp Asn Phe Asp Ile Arg Asn Ser Ala Leu Asp Glu Asn Gly Gln Ile
195 200 205
Ser Asp Ser Val Ser Asp Val Lys Pro Ser Thr Asn Leu Lys Val Ile
210 215 220
Glu Val Gly Val Val Phe Met Val Ile Thr Met Leu Tyr Asn Ala Ile
225 230 235 240
Pro Leu Lys Phe Ala Ser Tyr Ile Val Thr Glu His Ile Gly Thr Ala
245 250 255
Ser Thr Ala Thr Trp Ile Phe Ser Phe Leu Val Leu Ala Gly Ile Phe
260 265 270
Ser Gly Val Leu Phe Glu Lys Ile Ser Lys Val Phe Lys Arg Leu Thr
275 280 285
Val Phe Val Phe Glu Ile Val Ile Gly Val Ala Tyr Ile Thr Ile Ala
290 295 300
Phe Thr Tyr Asn Ile Pro Leu Leu Thr Ala Leu Val Leu Ile Ser Gly
305 310 315 320
Phe Gly Trp Gly Ile Ile Asn Pro Ala Leu Thr Ala Arg Leu Val Asp
325 330 335
Val Ser Pro Ile Asn Ser Met Asn Leu Ser Thr Ser Ile Ile Val Ile
340 345 350
Phe Ile Ser Val Gly Ser Leu Ile Ser Pro Tyr Phe Phe Ala Met Phe
355 360 365
Ala Gly Leu Phe Gly Asn Asp Ser Ala Ala Phe Ala Ile Val Val Gly
370 375 380
Gly Ala Leu Tyr Val Val Met Ala Val Leu Asp Phe Ile Lys Ile Lys
385 390 395 400
Lys Asn Lys Glu Leu Ser Ile
405
<210> 51
<211> 1578
<212> DNA
<213> Neurospora crassa OR74A
<400> 51
atgggcattt ttaataaaaa accagttgcc caggccgtgg atttaaatca gatacaggaa 60
gaagcccctc agttcgaacg ggttgattgg aaaaaagatc caggtttacg taaattatat 120
ttttatgcgt ttatcttatg catcgcctcg gcgaccaccg gttatgacgg catgtttttt 180
aactcggttc agaactttga aacctggatc aaatatttcg gcgatccacg gggaagcgaa 240
ttaggtttat taggtgcctt atatcagatc ggtagcatcg gcagcattcc attcgtgcca 300
ttattaaccg ataacttcgg ccgtaaaacc ccaattatta ttggctgcgt tattatgatt 360
gttggtgcgg ttttgcaggc gacggcgaaa aacttagaca cttttatggg cggccggacc 420
atgttaggct tcggcaatag cttagcgcag attgcgagcc caatgttatt aaccgaatta 480
gcgcaccctc aacatcgtgc ccggttaacc accatttata actgcttatg gaacgttggt 540
gcgttagtgg tgtcgtggtt agcgttcggc accaactata ttaataacga ttggtcatgg 600
cgtatcccag cgttattgca ggcctttcca agcattatcc agttattagg tatttggtgg 660
gttccagaat ccccacggtt tttaattgcg aaagataaac atgatgaagc gttgcatatt 720
ttagcgaaat atcatgcgaa cggcgatcca aaccatccaa ccgtgcagtt cgaatttcgt 780
gaaattaaag aaaccattcg tttagaaatg gagtcgacca aaaactcgtc gtatttagat 840
ttctttaaat cgcgtggcaa ccgttatcgt ttagcgattt tattatcgtt aggctttttt 900
agccaatgga gcggcaacgc gattattagc aactatagca gcaaattata tgaaaccgcc 960
ggcgtgaccg atagcaccgc gaagttaggt ttaagcgcgg ggcagaccgg tttagcatta 1020
attgttagcg tgaccatggc attattagtg gataaattag gtcggcgatt agccttttta 1080
gccagcacgg gcggcatgtg cggcaccttc gtgatctgga ctttaactgc gggcttatat 1140
ggcgaacatc gtttaaaagg cgcggataaa gcgatgattt tcttcatttg ggtttttggc 1200
attttttatt cgttagcgtg gtccgggtta ttagtgggct atgcgattga gattttacca 1260
tatcggttac gtggcaaagg gttaatggtg atgaatatgt cggttcagtg cgcattaacg 1320
ttaaatactt acgcaaaccc agttgcattc gactatttcg gtccagacca ttcgtggaaa 1380
ttatacttaa tctatacttg ctggattgcg gccgaatttg tgtttgtgtt ttttatgtat 1440
gtggaaacca aaggcccaac gttagaagaa ttagcgaaag tgatcgacgg cgacgaagcc 1500
gacgttgcgc atattgatat ccatcaggtt gaaaaagaag ttgaaatcca tgaacacgaa 1560
ggcaaatccg ttgcctga 1578
<210> 52
<211> 525
<212> PRT
<213> Neurospora crassa OR74A
<400> 52
Met Gly Ile Phe Asn Lys Lys Pro Val Ala Gln Ala Val Asp Leu Asn
1 5 10 15
Gln Ile Gln Glu Glu Ala Pro Gln Phe Glu Arg Val Asp Trp Lys Lys
20 25 30
Asp Pro Gly Leu Arg Lys Leu Tyr Phe Tyr Ala Phe Ile Leu Cys Ile
35 40 45
Ala Ser Ala Thr Thr Gly Tyr Asp Gly Met Phe Phe Asn Ser Val Gln
50 55 60
Asn Phe Glu Thr Trp Ile Lys Tyr Phe Gly Asp Pro Arg Gly Ser Glu
65 70 75 80
Leu Gly Leu Leu Gly Ala Leu Tyr Gln Ile Gly Ser Ile Gly Ser Ile
85 90 95
Pro Phe Val Pro Leu Leu Thr Asp Asn Phe Gly Arg Lys Thr Pro Ile
100 105 110
Ile Ile Gly Cys Val Ile Met Ile Val Gly Ala Val Leu Gln Ala Thr
115 120 125
Ala Lys Asn Leu Asp Thr Phe Met Gly Gly Arg Thr Met Leu Gly Phe
130 135 140
Gly Asn Ser Leu Ala Gln Ile Ala Ser Pro Met Leu Leu Thr Glu Leu
145 150 155 160
Ala His Pro Gln His Arg Ala Arg Leu Thr Thr Ile Tyr Asn Cys Leu
165 170 175
Trp Asn Val Gly Ala Leu Val Val Ser Trp Leu Ala Phe Gly Thr Asn
180 185 190
Tyr Ile Asn Asn Asp Trp Ser Trp Arg Ile Pro Ala Leu Leu Gln Ala
195 200 205
Phe Pro Ser Ile Ile Gln Leu Leu Gly Ile Trp Trp Val Pro Glu Ser
210 215 220
Pro Arg Phe Leu Ile Ala Lys Asp Lys His Asp Glu Ala Leu His Ile
225 230 235 240
Leu Ala Lys Tyr His Ala Asn Gly Asp Pro Asn His Pro Thr Val Gln
245 250 255
Phe Glu Phe Arg Glu Ile Lys Glu Thr Ile Arg Leu Glu Met Glu Ser
260 265 270
Thr Lys Asn Ser Ser Tyr Leu Asp Phe Phe Lys Ser Arg Gly Asn Arg
275 280 285
Tyr Arg Leu Ala Ile Leu Leu Ser Leu Gly Phe Phe Ser Gln Trp Ser
290 295 300
Gly Asn Ala Ile Ile Ser Asn Tyr Ser Ser Lys Leu Tyr Glu Thr Ala
305 310 315 320
Gly Val Thr Asp Ser Thr Ala Lys Leu Gly Leu Ser Ala Gly Gln Thr
325 330 335
Gly Leu Ala Leu Ile Val Ser Val Thr Met Ala Leu Leu Val Asp Lys
340 345 350
Leu Gly Arg Arg Leu Ala Phe Leu Ala Ser Thr Gly Gly Met Cys Gly
355 360 365
Thr Phe Val Ile Trp Thr Leu Thr Ala Gly Leu Tyr Gly Glu His Arg
370 375 380
Leu Lys Gly Ala Asp Lys Ala Met Ile Phe Phe Ile Trp Val Phe Gly
385 390 395 400
Ile Phe Tyr Ser Leu Ala Trp Ser Gly Leu Leu Val Gly Tyr Ala Ile
405 410 415
Glu Ile Leu Pro Tyr Arg Leu Arg Gly Lys Gly Leu Met Val Met Asn
420 425 430
Met Ser Val Gln Cys Ala Leu Thr Leu Asn Thr Tyr Ala Asn Pro Val
435 440 445
Ala Phe Asp Tyr Phe Gly Pro Asp His Ser Trp Lys Leu Tyr Leu Ile
450 455 460
Tyr Thr Cys Trp Ile Ala Ala Glu Phe Val Phe Val Phe Phe Met Tyr
465 470 475 480
Val Glu Thr Lys Gly Pro Thr Leu Glu Glu Leu Ala Lys Val Ile Asp
485 490 495
Gly Asp Glu Ala Asp Val Ala His Ile Asp Ile His Gln Val Glu Lys
500 505 510
Glu Val Glu Ile His Glu His Glu Gly Lys Ser Val Ala
515 520 525
<210> 53
<211> 1590
<212> DNA
<213> Aspergillus oryzae RIB40
<400> 53
atgatcgctg taggcaaaca acgggaagaa gatgtgtctg atccagtgtt agccaactta 60
ttagcggaag atcggacccc atggtataaa aaaccaaact tacggcgatt atacttaatt 120
ttatttccag cttgcatggg tatcgaaatt acctctgggt tcgattctca gattattaat 180
actgtgcaga ttgtgtatac ctggaataag tactttgggc gacttacggg agacaccgtg 240
gacgggatgc cagaatacga agtggagcct aatttaaagg gtttccttgg tgcagcttat 300
agccttggtg cgattctttc gttaccattc gtgccatggg taaatcaacg gttcggtcgg 360
cgatggacgg taatgtttgg gtcgtgcatt tcgttagttg gggcacttct tcaagggttt 420
tctaacggtg ttggtatgta tatagtagcg cggatgctac ttggtttcgg gatcccatac 480
tgcattgtgg ccgggtcgtg cttaattggg gaattagggt acccaaaaga gcggccaatt 540
ttaacgagct tattcaactc tagctacttt atcgggcaaa ttgttgcggc cgccgttggt 600
ttaggtacgg tgactattgc ttcgaactgg gcatggcgaa ttccatcttt attgcagtta 660
gcgccagcga tggtgcaagt ggtgttcgta tttttcttac cagaatcgcc acggtactta 720
atttcgaagg atcggcatga agaggccttt ggtatcttag ccaagtacca cgccgaaggc 780
gatcggaata gcgtaattgt gcgggcagaa atcgcccaga tcgagcggac cattaaatta 840
gaattagagg aagcaaagca atcgtggtgg gatatgtttc ggaccgcagg gatgcggcga 900
cggttattaa ttagcgcatt cttaggttta ttcacccaat ggagcggtaa taccttaatc 960
tcttactact tatcggattt attagacatg gttggtatta ccgattcagt gaccaaaagc 1020
aaaattaata ttgggatcgc gtgctgggga ctcgtgtcgg gtaccgccct agcgcttacg 1080
gcaccattat ttaaacggcg aacgatgtac ctaacctgtg caacttcttt actttgcgtg 1140
tatatcggtt ggactatcag catggaacgg tttatgacta ctgaagtgcg ggcagccgct 1200
attttaacta ttttcttcat tttcgcctat agccctgctt ataaccttgg ttataatgcg 1260
ttaacttata cttacttaat cgagattttt ccatactttg ggcgatcgcg gggcctcagc 1320
tggtttcagt tctacggtcg gggcagtgct ttcttcgcga cttacgtgaa tccagttggg 1380
ttagaccgga tttcgtggcg atggttatta gtatactgct gttggcttgc ctttgaatta 1440
gtattcattt actttctttt tcctgagact tcgggtcgga ctttagaaga attatctttc 1500
atgtttgaag gcaaggagaa ggccaatgaa gtggccgcgg ctgtgcataa acagattgaa 1560
gtggacggga aaactgaggg ccaggcgtaa 1590
<210> 54
<211> 529
<212> PRT
<213> Aspergillus oryzae RIB40
<400> 54
Met Ile Ala Val Gly Lys Gln Arg Glu Glu Asp Val Ser Asp Pro Val
1 5 10 15
Leu Ala Asn Leu Leu Ala Glu Asp Arg Thr Pro Trp Tyr Lys Lys Pro
20 25 30
Asn Leu Arg Arg Leu Tyr Leu Ile Leu Phe Pro Ala Cys Met Gly Ile
35 40 45
Glu Ile Thr Ser Gly Phe Asp Ser Gln Ile Ile Asn Thr Val Gln Ile
50 55 60
Val Tyr Thr Trp Asn Lys Tyr Phe Gly Arg Leu Thr Gly Asp Thr Val
65 70 75 80
Asp Gly Met Pro Glu Tyr Glu Val Glu Pro Asn Leu Lys Gly Phe Leu
85 90 95
Gly Ala Ala Tyr Ser Leu Gly Ala Ile Leu Ser Leu Pro Phe Val Pro
100 105 110
Trp Val Asn Gln Arg Phe Gly Arg Arg Trp Thr Val Met Phe Gly Ser
115 120 125
Cys Ile Ser Leu Val Gly Ala Leu Leu Gln Gly Phe Ser Asn Gly Val
130 135 140
Gly Met Tyr Ile Val Ala Arg Met Leu Leu Gly Phe Gly Ile Pro Tyr
145 150 155 160
Cys Ile Val Ala Gly Ser Cys Leu Ile Gly Glu Leu Gly Tyr Pro Lys
165 170 175
Glu Arg Pro Ile Leu Thr Ser Leu Phe Asn Ser Ser Tyr Phe Ile Gly
180 185 190
Gln Ile Val Ala Ala Ala Val Gly Leu Gly Thr Val Thr Ile Ala Ser
195 200 205
Asn Trp Ala Trp Arg Ile Pro Ser Leu Leu Gln Leu Ala Pro Ala Met
210 215 220
Val Gln Val Val Phe Val Phe Phe Leu Pro Glu Ser Pro Arg Tyr Leu
225 230 235 240
Ile Ser Lys Asp Arg His Glu Glu Ala Phe Gly Ile Leu Ala Lys Tyr
245 250 255
His Ala Glu Gly Asp Arg Asn Ser Val Ile Val Arg Ala Glu Ile Ala
260 265 270
Gln Ile Glu Arg Thr Ile Lys Leu Glu Leu Glu Glu Ala Lys Gln Ser
275 280 285
Trp Trp Asp Met Phe Arg Thr Ala Gly Met Arg Arg Arg Leu Leu Ile
290 295 300
Ser Ala Phe Leu Gly Leu Phe Thr Gln Trp Ser Gly Asn Thr Leu Ile
305 310 315 320
Ser Tyr Tyr Leu Ser Asp Leu Leu Asp Met Val Gly Ile Thr Asp Ser
325 330 335
Val Thr Lys Ser Lys Ile Asn Ile Gly Ile Ala Cys Trp Gly Leu Val
340 345 350
Ser Gly Thr Ala Leu Ala Leu Thr Ala Pro Leu Phe Lys Arg Arg Thr
355 360 365
Met Tyr Leu Thr Cys Ala Thr Ser Leu Leu Cys Val Tyr Ile Gly Trp
370 375 380
Thr Ile Ser Met Glu Arg Phe Met Thr Thr Glu Val Arg Ala Ala Ala
385 390 395 400
Ile Leu Thr Ile Phe Phe Ile Phe Ala Tyr Ser Pro Ala Tyr Asn Leu
405 410 415
Gly Tyr Asn Ala Leu Thr Tyr Thr Tyr Leu Ile Glu Ile Phe Pro Tyr
420 425 430
Phe Gly Arg Ser Arg Gly Leu Ser Trp Phe Gln Phe Tyr Gly Arg Gly
435 440 445
Ser Ala Phe Phe Ala Thr Tyr Val Asn Pro Val Gly Leu Asp Arg Ile
450 455 460
Ser Trp Arg Trp Leu Leu Val Tyr Cys Cys Trp Leu Ala Phe Glu Leu
465 470 475 480
Val Phe Ile Tyr Phe Leu Phe Pro Glu Thr Ser Gly Arg Thr Leu Glu
485 490 495
Glu Leu Ser Phe Met Phe Glu Gly Lys Glu Lys Ala Asn Glu Val Ala
500 505 510
Ala Ala Val His Lys Gln Ile Glu Val Asp Gly Lys Thr Glu Gly Gln
515 520 525
Ala
<210> 55
<211> 2811
<212> DNA
<213> Helicobacter pylori (Campylobacter pylori)
<400> 55
atgaagaacc ttaaaagcct attaagcttt ttactagcga gcttttgggt agcgatcccg 60
ctgatcgccc tttacgcgtg tgcctgtgcc atagcaacgt ttatagaaaa tgattacggc 120
acgagcacgt caaaggcgat tgtgtataat acgccgtggt ttaacttctt gcatgcctat 180
ttattagtgg ttctgatagg cactttcatt aaaagcaaag cgctggagcg taaacggtat 240
gccagcttat ttttccatag ctcattaatt ttcatcattc tgggcgctgc catcacgcgt 300
ttctttggga tagaaggctt aatgcatgtg cgagaaaata gcgcccagag cagctttgaa 360
agcgccgaca cgtacttaaa tatcacgtta aacgacacga cgaaattaag cctgaaaacg 420
ccgctgacgt tttattattc aaaacgactg cgtccaattc atgcaacgct ggatcataag 480
ccgctgattc tggaaccgtt agagatctat aagcagaatg caattaaaaa agatgacgcg 540
acgattctgg tgctgaaagc cacgtataat ggcgtgagcc gtaaattcaa tcttattaaa 600
aataatcgga acgaaggcat agaagaaagc gaagtgttta aagacgacaa gcttagcctg 660
tcatttggat cagcgtatat tgaattacca tttcagatca aactaaagcg gtttgaactg 720
gagcggtacg caggcagcat gtcaccgtca agctacgcgt cagaagttga agttttaaaa 780
ttagataata cgctgatcaa gccgtatcgg atttttatga atcatgttct ggactatgaa 840
ggctatcgtt ttttccagag ctcatatgac acggatgaaa aaggcacgat cttaagcgta 900
aataaagacc ccgggaaaat cccaacgtat ctgggctatg ccatgttaat tttaggcgcg 960
ttatggttat tattagataa gaatggccgg tttctgaagt tatcacgttt tctgaaatct 1020
caacaggttg cgtcattcct gcttgcgctg attcttgtaa gcccgtttgc gagctcattc 1080
gcaaacgaag gccagattga catgcatggc ggcaaaagcg cgaaaattga gcggcagagc 1140
gtagaaaacc cagcgaataa agaagatagc aaaagcgcca ttctggagcg gctaaagcat 1200
ttacgtgagt attcaaaaga ccacctgaaa gcatttcagc ggctccaggt ccaggatttt 1260
gatggccgga tcaagccgct ggacacgatt agcattgaat atattcataa gattctgaaa 1320
aaagatgatt ttcagggcct taatgcaatg caagtgttac tgggcatcat gtttttccca 1380
aacgattggc gaagcgttaa aatgatttat acgagcaata aagcactgcg taagttaatc 1440
ggcacgccgc tggacgaaag ccggatcgcg tttcgtgatg cctttgatag ccgaggctat 1500
aaactgaaaa acctagttga agaagtaaac cagaaatcac caaacgcccg taatgagtta 1560
gataaagatg tactgaaagt agatgaacgt atcaatctgg tatatacgtt atttagcgcg 1620
cagttcctgc gtattttccc gagcgataaa acgacggcgt ggctttcacc aattgaagcc 1680
atcaatagcc caaataaaga aatttcaagc gtggctacgg aatttctgaa aaatattttt 1740
agcggctttg atgacgcgct gaaagcaaac cagtgggata aagtagaaaa aacgcttaaa 1800
aacctgagcg tatatcaaca ggagcatgca aaaaatcttt atctgagcag cagcaaagtg 1860
gatagcgaaa tttttctgaa tcatacgaac ttttttaata gcctaacgtt accgtatatc 1920
ttacttggcc tgttattatt tatcgttgtg atcagcagct tagttaaaaa tacgattcct 1980
aatatttggc taacgaaaat cttatatgca gcgatcttat tatgcgccat cgcgcatagc 2040
atgggcctta ttttacgttg gtatgtgagc ggccattcac cgtggagcaa tgcgtatgag 2100
tcaatgttat atatcgcttg ggcgagcgtt atcgctggct ttattctgcg ttcaaaactt 2160
gccctttcag cgagcagctt tctggcaggg atcgcccttt ttgtggcgca tctgggcttt 2220
atggacccgc agatcggcca tctggtgccc gtattaaaat catattggct taatatccat 2280
gtaagcgtaa tcacggcgtc atatgggttt ctaggcttat gttttgtgct tggcatttta 2340
tcattagttt tatttatctt acgtaaacag ggccggttca acctggacaa aacgattctt 2400
tcaattagcg cgatcaacga aatgagcatg attctgggcc tattcatgct tactgcaggc 2460
aacttcctgg gcggcgtgtg ggccaacgaa agctggggac gctattgggg ctgggacccg 2520
aaagaaacgt gggccttaat tagcatttgc gtatatgcgc tgatcttgca tttacggttt 2580
ctggggagcc ataactggcc atttattctg gccagcagca gcgtgcttgg cttttattca 2640
gttctgatga cgtattttgg cgtgaactac tacttaagcg gcttgcatag ctatgcagct 2700
ggcgatccat tacccatccc gacgtttctg tactttttag tagccatacc gtttgcgctt 2760
gtgatcttag cctatttcaa acgtcattta tcattaccga aactggttta a 2811
<210> 56
<211> 936
<212> PRT
<213> Helicobacter pylori (Campylobacter pylori)
<400> 56
Met Lys Asn Leu Lys Ser Leu Leu Ser Phe Leu Leu Ala Ser Phe Trp
1 5 10 15
Val Ala Ile Pro Leu Ile Ala Leu Tyr Ala Cys Ala Cys Ala Ile Ala
20 25 30
Thr Phe Ile Glu Asn Asp Tyr Gly Thr Ser Thr Ser Lys Ala Ile Val
35 40 45
Tyr Asn Thr Pro Trp Phe Asn Phe Leu His Ala Tyr Leu Leu Val Val
50 55 60
Leu Ile Gly Thr Phe Ile Lys Ser Lys Ala Leu Glu Arg Lys Arg Tyr
65 70 75 80
Ala Ser Leu Phe Phe His Ser Ser Leu Ile Phe Ile Ile Leu Gly Ala
85 90 95
Ala Ile Thr Arg Phe Phe Gly Ile Glu Gly Leu Met His Val Arg Glu
100 105 110
Asn Ser Ala Gln Ser Ser Phe Glu Ser Ala Asp Thr Tyr Leu Asn Ile
115 120 125
Thr Leu Asn Asp Thr Thr Lys Leu Ser Leu Lys Thr Pro Leu Thr Phe
130 135 140
Tyr Tyr Ser Lys Arg Leu Arg Pro Ile His Ala Thr Leu Asp His Lys
145 150 155 160
Pro Leu Ile Leu Glu Pro Leu Glu Ile Tyr Lys Gln Asn Ala Ile Lys
165 170 175
Lys Asp Asp Ala Thr Ile Leu Val Leu Lys Ala Thr Tyr Asn Gly Val
180 185 190
Ser Arg Lys Phe Asn Leu Ile Lys Asn Asn Arg Asn Glu Gly Ile Glu
195 200 205
Glu Ser Glu Val Phe Lys Asp Asp Lys Leu Ser Leu Ser Phe Gly Ser
210 215 220
Ala Tyr Ile Glu Leu Pro Phe Gln Ile Lys Leu Lys Arg Phe Glu Leu
225 230 235 240
Glu Arg Tyr Ala Gly Ser Met Ser Pro Ser Ser Tyr Ala Ser Glu Val
245 250 255
Glu Val Leu Lys Leu Asp Asn Thr Leu Ile Lys Pro Tyr Arg Ile Phe
260 265 270
Met Asn His Val Leu Asp Tyr Glu Gly Tyr Arg Phe Phe Gln Ser Ser
275 280 285
Tyr Asp Thr Asp Glu Lys Gly Thr Ile Leu Ser Val Asn Lys Asp Pro
290 295 300
Gly Lys Ile Pro Thr Tyr Leu Gly Tyr Ala Met Leu Ile Leu Gly Ala
305 310 315 320
Leu Trp Leu Leu Leu Asp Lys Asn Gly Arg Phe Leu Lys Leu Ser Arg
325 330 335
Phe Leu Lys Ser Gln Gln Val Ala Ser Phe Leu Leu Ala Leu Ile Leu
340 345 350
Val Ser Pro Phe Ala Ser Ser Phe Ala Asn Glu Gly Gln Ile Asp Met
355 360 365
His Gly Gly Lys Ser Ala Lys Ile Glu Arg Gln Ser Val Glu Asn Pro
370 375 380
Ala Asn Lys Glu Asp Ser Lys Ser Ala Ile Leu Glu Arg Leu Lys His
385 390 395 400
Leu Arg Glu Tyr Ser Lys Asp His Leu Lys Ala Phe Gln Arg Leu Gln
405 410 415
Val Gln Asp Phe Asp Gly Arg Ile Lys Pro Leu Asp Thr Ile Ser Ile
420 425 430
Glu Tyr Ile His Lys Ile Leu Lys Lys Asp Asp Phe Gln Gly Leu Asn
435 440 445
Ala Met Gln Val Leu Leu Gly Ile Met Phe Phe Pro Asn Asp Trp Arg
450 455 460
Ser Val Lys Met Ile Tyr Thr Ser Asn Lys Ala Leu Arg Lys Leu Ile
465 470 475 480
Gly Thr Pro Leu Asp Glu Ser Arg Ile Ala Phe Arg Asp Ala Phe Asp
485 490 495
Ser Arg Gly Tyr Lys Leu Lys Asn Leu Val Glu Glu Val Asn Gln Lys
500 505 510
Ser Pro Asn Ala Arg Asn Glu Leu Asp Lys Asp Val Leu Lys Val Asp
515 520 525
Glu Arg Ile Asn Leu Val Tyr Thr Leu Phe Ser Ala Gln Phe Leu Arg
530 535 540
Ile Phe Pro Ser Asp Lys Thr Thr Ala Trp Leu Ser Pro Ile Glu Ala
545 550 555 560
Ile Asn Ser Pro Asn Lys Glu Ile Ser Ser Val Ala Thr Glu Phe Leu
565 570 575
Lys Asn Ile Phe Ser Gly Phe Asp Asp Ala Leu Lys Ala Asn Gln Trp
580 585 590
Asp Lys Val Glu Lys Thr Leu Lys Asn Leu Ser Val Tyr Gln Gln Glu
595 600 605
His Ala Lys Asn Leu Tyr Leu Ser Ser Ser Lys Val Asp Ser Glu Ile
610 615 620
Phe Leu Asn His Thr Asn Phe Phe Asn Ser Leu Thr Leu Pro Tyr Ile
625 630 635 640
Leu Leu Gly Leu Leu Leu Phe Ile Val Val Ile Ser Ser Leu Val Lys
645 650 655
Asn Thr Ile Pro Asn Ile Trp Leu Thr Lys Ile Leu Tyr Ala Ala Ile
660 665 670
Leu Leu Cys Ala Ile Ala His Ser Met Gly Leu Ile Leu Arg Trp Tyr
675 680 685
Val Ser Gly His Ser Pro Trp Ser Asn Ala Tyr Glu Ser Met Leu Tyr
690 695 700
Ile Ala Trp Ala Ser Val Ile Ala Gly Phe Ile Leu Arg Ser Lys Leu
705 710 715 720
Ala Leu Ser Ala Ser Ser Phe Leu Ala Gly Ile Ala Leu Phe Val Ala
725 730 735
His Leu Gly Phe Met Asp Pro Gln Ile Gly His Leu Val Pro Val Leu
740 745 750
Lys Ser Tyr Trp Leu Asn Ile His Val Ser Val Ile Thr Ala Ser Tyr
755 760 765
Gly Phe Leu Gly Leu Cys Phe Val Leu Gly Ile Leu Ser Leu Val Leu
770 775 780
Phe Ile Leu Arg Lys Gln Gly Arg Phe Asn Leu Asp Lys Thr Ile Leu
785 790 795 800
Ser Ile Ser Ala Ile Asn Glu Met Ser Met Ile Leu Gly Leu Phe Met
805 810 815
Leu Thr Ala Gly Asn Phe Leu Gly Gly Val Trp Ala Asn Glu Ser Trp
820 825 830
Gly Arg Tyr Trp Gly Trp Asp Pro Lys Glu Thr Trp Ala Leu Ile Ser
835 840 845
Ile Cys Val Tyr Ala Leu Ile Leu His Leu Arg Phe Leu Gly Ser His
850 855 860
Asn Trp Pro Phe Ile Leu Ala Ser Ser Ser Val Leu Gly Phe Tyr Ser
865 870 875 880
Val Leu Met Thr Tyr Phe Gly Val Asn Tyr Tyr Leu Ser Gly Leu His
885 890 895
Ser Tyr Ala Ala Gly Asp Pro Leu Pro Ile Pro Thr Phe Leu Tyr Phe
900 905 910
Leu Val Ala Ile Pro Phe Ala Leu Val Ile Leu Ala Tyr Phe Lys Arg
915 920 925
His Leu Ser Leu Pro Lys Leu Val
930 935
<210> 57
<211> 1290
<212> DNA
<213> Chitinophaga sp. CF118
<400> 57
atgagcttta acgtaaaaaa ccggatcgcg gaattatttt cgaaacggat cttccgtgat 60
agtttttatt atactatcgg tgcattctta gtcaaaggga tcaacttctt cttagtccca 120
gtgtatacgt cgtacctgtc gccatcggaa tatggtatct tagatttata cctgacgttt 180
acgaatatct taacgatctt ttgctcgtta ggtttatctc aattaatctt cgtcgaattt 240
tataagatca aaggtgagga acggaagcgg ttcttctcgg tcatcttttt tgggtatgcc 300
ttatttgggt taatcatctg cgctatcggt ggagtgatct tccattttgc gagcgaatat 360
ttcactaaag ttgccctggc gagcatgcta agcgtcatct tatcgtcggc aatcgcgtat 420
atcacgttct atcaaacgaa cttctttaac tatttacggc tagccggtcg gtcgaagtta 480
tttgtttact tcagtatcat cactggtgtc gttaacgccg gtctgaatat cttatttgtc 540
gtcaaaggta atatgggtta taacggtatc cttttaggta atatcatcgt tttattcgcg 600
tcggttgtgt ttggtttctt cgtgatcaaa gataagatcg actttaagtt taatatcgac 660
ttaaaggttt tttcgggtta tacgaaaatc ggtttagcct ttatcttatc gtcgttatgc 720
cagtggttaa tcaacggtgc ggatagatgg atcgtgctga acgctttaaa tacgactgag 780
ttaggtatct atgctttagc gtttaagttt tcgtcatttg tcgatccatt aatcatcacg 840
ccaatcacgt atgcctatct tccatatatc tttaaaaagt atgctgaaaa cgattatagc 900
gaaaagttaa tgaaaatcgc cggtttagtg tttctgatct ttctgccaat cgctttatta 960
gtaccatatt tactaccaat ggtaatcagt aataaggatt attatatggc agtccaactg 1020
atcccattcc tgatcatcgc ttattatttt tatttcatca gtcaattagc cgggaacgtc 1080
ttagtatatt taaagaagat ccggtgcctg gtgcagaata tcatcatcag cgggatcagc 1140
aatatcatct taaattatat cttagttaga aagatgggaa tcatcgggtg cgcgtatgcc 1200
tatttaatct cgaatatcat ctgggcaatc ttaaatatct attaccgtaa tatgtattta 1260
agtagcctta agaacgaaaa atcgaactaa 1290
<210> 58
<211> 429
<212> PRT
<213> Chitinophaga sp. CF118
<400> 58
Met Ser Phe Asn Val Lys Asn Arg Ile Ala Glu Leu Phe Ser Lys Arg
1 5 10 15
Ile Phe Arg Asp Ser Phe Tyr Tyr Thr Ile Gly Ala Phe Leu Val Lys
20 25 30
Gly Ile Asn Phe Phe Leu Val Pro Val Tyr Thr Ser Tyr Leu Ser Pro
35 40 45
Ser Glu Tyr Gly Ile Leu Asp Leu Tyr Leu Thr Phe Thr Asn Ile Leu
50 55 60
Thr Ile Phe Cys Ser Leu Gly Leu Ser Gln Leu Ile Phe Val Glu Phe
65 70 75 80
Tyr Lys Ile Lys Gly Glu Glu Arg Lys Arg Phe Phe Ser Val Ile Phe
85 90 95
Phe Gly Tyr Ala Leu Phe Gly Leu Ile Ile Cys Ala Ile Gly Gly Val
100 105 110
Ile Phe His Phe Ala Ser Glu Tyr Phe Thr Lys Val Ala Leu Ala Ser
115 120 125
Met Leu Ser Val Ile Leu Ser Ser Ala Ile Ala Tyr Ile Thr Phe Tyr
130 135 140
Gln Thr Asn Phe Phe Asn Tyr Leu Arg Leu Ala Gly Arg Ser Lys Leu
145 150 155 160
Phe Val Tyr Phe Ser Ile Ile Thr Gly Val Val Asn Ala Gly Leu Asn
165 170 175
Ile Leu Phe Val Val Lys Gly Asn Met Gly Tyr Asn Gly Ile Leu Leu
180 185 190
Gly Asn Ile Ile Val Leu Phe Ala Ser Val Val Phe Gly Phe Phe Val
195 200 205
Ile Lys Asp Lys Ile Asp Phe Lys Phe Asn Ile Asp Leu Lys Val Phe
210 215 220
Ser Gly Tyr Thr Lys Ile Gly Leu Ala Phe Ile Leu Ser Ser Leu Cys
225 230 235 240
Gln Trp Leu Ile Asn Gly Ala Asp Arg Trp Ile Val Leu Asn Ala Leu
245 250 255
Asn Thr Thr Glu Leu Gly Ile Tyr Ala Leu Ala Phe Lys Phe Ser Ser
260 265 270
Phe Val Asp Pro Leu Ile Ile Thr Pro Ile Thr Tyr Ala Tyr Leu Pro
275 280 285
Tyr Ile Phe Lys Lys Tyr Ala Glu Asn Asp Tyr Ser Glu Lys Leu Met
290 295 300
Lys Ile Ala Gly Leu Val Phe Leu Ile Phe Leu Pro Ile Ala Leu Leu
305 310 315 320
Val Pro Tyr Leu Leu Pro Met Val Ile Ser Asn Lys Asp Tyr Tyr Met
325 330 335
Ala Val Gln Leu Ile Pro Phe Leu Ile Ile Ala Tyr Tyr Phe Tyr Phe
340 345 350
Ile Ser Gln Leu Ala Gly Asn Val Leu Val Tyr Leu Lys Lys Ile Arg
355 360 365
Cys Leu Val Gln Asn Ile Ile Ile Ser Gly Ile Ser Asn Ile Ile Leu
370 375 380
Asn Tyr Ile Leu Val Arg Lys Met Gly Ile Ile Gly Cys Ala Tyr Ala
385 390 395 400
Tyr Leu Ile Ser Asn Ile Ile Trp Ala Ile Leu Asn Ile Tyr Tyr Arg
405 410 415
Asn Met Tyr Leu Ser Ser Leu Lys Asn Glu Lys Ser Asn
420 425
<210> 59
<211> 1413
<212> DNA
<213> Eubacterium sp. CAG:581
<400> 59
atgaaccgaa ataaaaagtt aggcattaac gtggtgttaa tgagcataag cagctttggc 60
agcaaattat taaccttctt cttagtgccg ttatatacta gctatctcac caccgcggaa 120
tatggcgtga gcgatctcat aaccaccacc accagcctct tagcgccgat ttttaccgcg 180
accataggcg aagcggtatt acgctatgcg ctggaaaaag atatagataa gtatcaagtg 240
tttcgcattg gattatttat acatatggtt gggtttattg ctttaatgtg ctttagcccg 300
ttactcctga tgataaagtt actcaaaccg tattatgtgt tctttatatt atattatttt 360
agctttacct tttatagctt ctttagccta ttttgccgcg ggataaataa agtggttgcg 420
ttcaccatta gcgggattat acagacccta gtgatggttg ggaccaatat agtaagcctc 480
attttcttag atatgggaat atatgggtac ctcctgagct ttattgtgag caactttgcg 540
ggcatgattc tcttagtgac tttaggcaaa atgcatgtat attttaaaat aggcaaaatt 600
gataagaaat taatgaagaa aatgttattt tatagcctgc cgatgataac caactcaatt 660
agctggtgga ttagcaatag cagcgataag tatattttaa ccttcttatg cggcgcgacc 720
ataaacggca tttatagcgt ggcgtataaa attccgacca tattaagcgt atgctatggc 780
gtgtttatga gcgcgtggcg cctcagcgct gtggatgatt ttgggagcga agaaaccgat 840
cgcttttata gccaaatatt aactaagatg accaaggcgc tgataattgt gggcgcgggc 900
attgtgttat ttaataaaat tttagcgaaa tttttatatg cgaaggattt ctttagcgcg 960
cgcgaatttg tgcccgtgtt agtgattgcg tttttattgc atgggttagg cgaattctat 1020
ggcagcgtgt ataccagcgc gaaatgcacc aagatgctct tttatagcag cctcgcgggc 1080
gcggtgtgca atatagtact caactttgcg ttaataccgg aatttcaggc gatgggcgcg 1140
gctattgcga ccatgattag ctatggcgtg atactcgcga tacgcgcgat tcatagccgc 1200
accattatga agatgaccat tccggtgacc aatattacca ttagcagcgt gatttttata 1260
accatggcga ttattcagac catagatttc caaggcagct ttattattag cgcgatttta 1320
ttctgtataa ttgcgttttt caaccgcgat atggtagttg agattataaa taccgtgtta 1380
aaaaagaaac cgaagaaaac cgcgaaacag taa 1413
<210> 60
<211> 470
<212> PRT
<213> Eubacterium sp. CAG:581
<400> 60
Met Asn Arg Asn Lys Lys Leu Gly Ile Asn Val Val Leu Met Ser Ile
1 5 10 15
Ser Ser Phe Gly Ser Lys Leu Leu Thr Phe Phe Leu Val Pro Leu Tyr
20 25 30
Thr Ser Tyr Leu Thr Thr Ala Glu Tyr Gly Val Ser Asp Leu Ile Thr
35 40 45
Thr Thr Thr Ser Leu Leu Ala Pro Ile Phe Thr Ala Thr Ile Gly Glu
50 55 60
Ala Val Leu Arg Tyr Ala Leu Glu Lys Asp Ile Asp Lys Tyr Gln Val
65 70 75 80
Phe Arg Ile Gly Leu Phe Ile His Met Val Gly Phe Ile Ala Leu Met
85 90 95
Cys Phe Ser Pro Leu Leu Leu Met Ile Lys Leu Leu Lys Pro Tyr Tyr
100 105 110
Val Phe Phe Ile Leu Tyr Tyr Phe Ser Phe Thr Phe Tyr Ser Phe Phe
115 120 125
Ser Leu Phe Cys Arg Gly Ile Asn Lys Val Val Ala Phe Thr Ile Ser
130 135 140
Gly Ile Ile Gln Thr Leu Val Met Val Gly Thr Asn Ile Val Ser Leu
145 150 155 160
Ile Phe Leu Asp Met Gly Ile Tyr Gly Tyr Leu Leu Ser Phe Ile Val
165 170 175
Ser Asn Phe Ala Gly Met Ile Leu Leu Val Thr Leu Gly Lys Met His
180 185 190
Val Tyr Phe Lys Ile Gly Lys Ile Asp Lys Lys Leu Met Lys Lys Met
195 200 205
Leu Phe Tyr Ser Leu Pro Met Ile Thr Asn Ser Ile Ser Trp Trp Ile
210 215 220
Ser Asn Ser Ser Asp Lys Tyr Ile Leu Thr Phe Leu Cys Gly Ala Thr
225 230 235 240
Ile Asn Gly Ile Tyr Ser Val Ala Tyr Lys Ile Pro Thr Ile Leu Ser
245 250 255
Val Cys Tyr Gly Val Phe Met Ser Ala Trp Arg Leu Ser Ala Val Asp
260 265 270
Asp Phe Gly Ser Glu Glu Thr Asp Arg Phe Tyr Ser Gln Ile Leu Thr
275 280 285
Lys Met Thr Lys Ala Leu Ile Ile Val Gly Ala Gly Ile Val Leu Phe
290 295 300
Asn Lys Ile Leu Ala Lys Phe Leu Tyr Ala Lys Asp Phe Phe Ser Ala
305 310 315 320
Arg Glu Phe Val Pro Val Leu Val Ile Ala Phe Leu Leu His Gly Leu
325 330 335
Gly Glu Phe Tyr Gly Ser Val Tyr Thr Ser Ala Lys Cys Thr Lys Met
340 345 350
Leu Phe Tyr Ser Ser Leu Ala Gly Ala Val Cys Asn Ile Val Leu Asn
355 360 365
Phe Ala Leu Ile Pro Glu Phe Gln Ala Met Gly Ala Ala Ile Ala Thr
370 375 380
Met Ile Ser Tyr Gly Val Ile Leu Ala Ile Arg Ala Ile His Ser Arg
385 390 395 400
Thr Ile Met Lys Met Thr Ile Pro Val Thr Asn Ile Thr Ile Ser Ser
405 410 415
Val Ile Phe Ile Thr Met Ala Ile Ile Gln Thr Ile Asp Phe Gln Gly
420 425 430
Ser Phe Ile Ile Ser Ala Ile Leu Phe Cys Ile Ile Ala Phe Phe Asn
435 440 445
Arg Asp Met Val Val Glu Ile Ile Asn Thr Val Leu Lys Lys Lys Pro
450 455 460
Lys Lys Thr Ala Lys Gln
465 470
<210> 61
<211> 1350
<212> DNA
<213> Dyadobacter soli DSM 25329 contig Ga0069981_102
<400> 61
atggctttgc agttacttca gaaattacgg aataaacatt tcttaagcct ggccgggaac 60
ggcatcatga gcgtgttagg gatgctcaat atgattattc tgtatcgtgc attaccagta 120
gcgagcatcg gaatgtgggt cttttttctg agcatattat tactggtaga cacctttcgg 180
agcggctttt taacgacggc gtttattaaa ttctatgcag gcgccagcga tgcgcggaag 240
cgtgaagtcg tcgggagcgc gtggttcatt ggcggggcga tcacgggcat cttagccctg 300
attaatatcc cggcctttct gttcagcgac tggtttaaga acccatccgt ggtgctgttt 360
gtagaatggt ttggcatcat ttatatcgcg agcctgccgt actttattgc tagctgcgtg 420
gtgcaggccg agcagcggtt tgatcagtta ctatgcattc gttttttaag ccagggattc 480
tttatcttat tcgtcatggt aatggctttt accaaaaccg cgaatttgca gaatattatt 540
tatgcatatt taggcggcgc cgcattaacg agcatcttta cgatcgtaat gggctggtca 600
cggttaggca actttaagga ccgtacttca gaaagcatca aggaaatttt tcacttcggg 660
aaattctcag tcgggaccac tttatcatcg aatttattcg ggacttcgaa tacgatgatt 720
attaacttta tgttaggccc ggccgcatta gcggtgttta acttagggca gcggctgatg 780
gaaattattg aaataccatt acgaagcttt gcggcgaccg gcatgccaga attatccgcg 840
gcgtataatg aaggcaaccg tccaaaagtg attgaaacca tgaagcggta tgccggctta 900
attaccatgg cattactacc ggcgtgcatc ggcgccgtga ttttagccga cgtcgcgata 960
catattatag ggggagaaaa atatatcaat tcggaagcgg ccaatattat gcgtttatat 1020
atgacctttg ccctgctgta tccgttagat cgtttctttg cattaacttt agatgtcatt 1080
caccagccaa aaattaattt tgtcaaagta ctgattatgt tagcagggag cgtcattgct 1140
tcagtgacgg cgatctatat taccggctca atctatggcg tagcgatcgc cggcgtggtc 1200
ccgacgttaa ttggcgtggg cattgggtac tggggactca accggttcca gccattttca 1260
attctgagcg tctttacgac gggctacgcc gaggccgtgt cactggtgcg gctatggtgg 1320
ggcaagctga tggtccataa gtctcaataa 1350
<210> 62
<211> 449
<212> PRT
<213> Dyadobacter soli DSM 25329 contig Ga0069981_102
<400> 62
Met Ala Leu Gln Leu Leu Gln Lys Leu Arg Asn Lys His Phe Leu Ser
1 5 10 15
Leu Ala Gly Asn Gly Ile Met Ser Val Leu Gly Met Leu Asn Met Ile
20 25 30
Ile Leu Tyr Arg Ala Leu Pro Val Ala Ser Ile Gly Met Trp Val Phe
35 40 45
Phe Leu Ser Ile Leu Leu Leu Val Asp Thr Phe Arg Ser Gly Phe Leu
50 55 60
Thr Thr Ala Phe Ile Lys Phe Tyr Ala Gly Ala Ser Asp Ala Arg Lys
65 70 75 80
Arg Glu Val Val Gly Ser Ala Trp Phe Ile Gly Gly Ala Ile Thr Gly
85 90 95
Ile Leu Ala Leu Ile Asn Ile Pro Ala Phe Leu Phe Ser Asp Trp Phe
100 105 110
Lys Asn Pro Ser Val Val Leu Phe Val Glu Trp Phe Gly Ile Ile Tyr
115 120 125
Ile Ala Ser Leu Pro Tyr Phe Ile Ala Ser Cys Val Val Gln Ala Glu
130 135 140
Gln Arg Phe Asp Gln Leu Leu Cys Ile Arg Phe Leu Ser Gln Gly Phe
145 150 155 160
Phe Ile Leu Phe Val Met Val Met Ala Phe Thr Lys Thr Ala Asn Leu
165 170 175
Gln Asn Ile Ile Tyr Ala Tyr Leu Gly Gly Ala Ala Leu Thr Ser Ile
180 185 190
Phe Thr Ile Val Met Gly Trp Ser Arg Leu Gly Asn Phe Lys Asp Arg
195 200 205
Thr Ser Glu Ser Ile Lys Glu Ile Phe His Phe Gly Lys Phe Ser Val
210 215 220
Gly Thr Thr Leu Ser Ser Asn Leu Phe Gly Thr Ser Asn Thr Met Ile
225 230 235 240
Ile Asn Phe Met Leu Gly Pro Ala Ala Leu Ala Val Phe Asn Leu Gly
245 250 255
Gln Arg Leu Met Glu Ile Ile Glu Ile Pro Leu Arg Ser Phe Ala Ala
260 265 270
Thr Gly Met Pro Glu Leu Ser Ala Ala Tyr Asn Glu Gly Asn Arg Pro
275 280 285
Lys Val Ile Glu Thr Met Lys Arg Tyr Ala Gly Leu Ile Thr Met Ala
290 295 300
Leu Leu Pro Ala Cys Ile Gly Ala Val Ile Leu Ala Asp Val Ala Ile
305 310 315 320
His Ile Ile Gly Gly Glu Lys Tyr Ile Asn Ser Glu Ala Ala Asn Ile
325 330 335
Met Arg Leu Tyr Met Thr Phe Ala Leu Leu Tyr Pro Leu Asp Arg Phe
340 345 350
Phe Ala Leu Thr Leu Asp Val Ile His Gln Pro Lys Ile Asn Phe Val
355 360 365
Lys Val Leu Ile Met Leu Ala Gly Ser Val Ile Ala Ser Val Thr Ala
370 375 380
Ile Tyr Ile Thr Gly Ser Ile Tyr Gly Val Ala Ile Ala Gly Val Val
385 390 395 400
Pro Thr Leu Ile Gly Val Gly Ile Gly Tyr Trp Gly Leu Asn Arg Phe
405 410 415
Gln Pro Phe Ser Ile Leu Ser Val Phe Thr Thr Gly Tyr Ala Glu Ala
420 425 430
Val Ser Leu Val Arg Leu Trp Trp Gly Lys Leu Met Val His Lys Ser
435 440 445
Gln
<210> 63
<211> 1233
<212> DNA
<213> Lactococcus raffinolactis (ATCC 43920)
<400> 63
atgtttttag ccgtatggga aggcatttta cggttcggct taaacgaaaa taaccgggaa 60
aaattaacga gcttaattag caccaccgta ttttttgggt taggggcaac gatattttgg 120
gctattattt taccttttcc atatttacgg atctttaata cgttaccgta tgttcactta 180
ttcattatta gcttattatt gcagcctatt ttatcaacgt tgcagattgc ggtccgaggg 240
attaaggagt cgaagaacta tgtgatatca ggcattatca gcacttttgt taacgtgggc 300
ttattaattt tcttagtggt gttcttacgg ttagggttat taggcttact cttatcattt 360
ttaattggca accttgtgaa cgtgttatat ttattatttg gctcatcact cttaaaatat 420
atttcattta aagccatcga taaaaacctc ttaaagaagt tattaaaatt cagctggcca 480
ttaattttta acttagtatt tgtgtggttt ctcggtggct atgttatgtt ttatttaggc 540
tcgtttgtag gcagcgatga aaccggcttt ttcagctttg cgaataaatt tgcctcaatt 600
gtggcgatgt ttgggagcgt gttaggcatg gccactatag aagatactat tattacttcg 660
gaaaacgata actttattga aagctttgct aagaagaata cggaaatgtt taagatgttt 720
ttaaacgtgg gcatattact cttaccagta attggcatgt actatttcac cttaggcaat 780
agcgcgtatc agaatactct tataattgtc ccgttcttat taatggcgtc aatttttcaa 840
gccatggcta ccaacgtggg caatattatg attgtgcatc agaaaactaa ggctattgcc 900
gtggcgtcgt tattagtggg catatttaac gccatcttct gctttgtagg gtaccacttt 960
ctcggcttaa ccggcgtgtg cattgcctat ctctttgctt catttttatt atttttattc 1020
cggtataaga tggggcaaaa aattcagaac tataacttaa aatggcgctt tattgtagtg 1080
ctcgcggtca tattcattat gttaggctta ttaatacagt ttgaaaacgt gattatcaat 1140
agcattttag tcttagtcac tgcggtgttt gagatattta tttatcggca tattatatta 1200
aaaatactca accgcattat tgggcgagcg taa 1233
<210> 64
<211> 410
<212> PRT
<213> Lactococcus raffinolactis (ATCC 43920)
<400> 64
Met Phe Leu Ala Val Trp Glu Gly Ile Leu Arg Phe Gly Leu Asn Glu
1 5 10 15
Asn Asn Arg Glu Lys Leu Thr Ser Leu Ile Ser Thr Thr Val Phe Phe
20 25 30
Gly Leu Gly Ala Thr Ile Phe Trp Ala Ile Ile Leu Pro Phe Pro Tyr
35 40 45
Leu Arg Ile Phe Asn Thr Leu Pro Tyr Val His Leu Phe Ile Ile Ser
50 55 60
Leu Leu Leu Gln Pro Ile Leu Ser Thr Leu Gln Ile Ala Val Arg Gly
65 70 75 80
Ile Lys Glu Ser Lys Asn Tyr Val Ile Ser Gly Ile Ile Ser Thr Phe
85 90 95
Val Asn Val Gly Leu Leu Ile Phe Leu Val Val Phe Leu Arg Leu Gly
100 105 110
Leu Leu Gly Leu Leu Leu Ser Phe Leu Ile Gly Asn Leu Val Asn Val
115 120 125
Leu Tyr Leu Leu Phe Gly Ser Ser Leu Leu Lys Tyr Ile Ser Phe Lys
130 135 140
Ala Ile Asp Lys Asn Leu Leu Lys Lys Leu Leu Lys Phe Ser Trp Pro
145 150 155 160
Leu Ile Phe Asn Leu Val Phe Val Trp Phe Leu Gly Gly Tyr Val Met
165 170 175
Phe Tyr Leu Gly Ser Phe Val Gly Ser Asp Glu Thr Gly Phe Phe Ser
180 185 190
Phe Ala Asn Lys Phe Ala Ser Ile Val Ala Met Phe Gly Ser Val Leu
195 200 205
Gly Met Ala Thr Ile Glu Asp Thr Ile Ile Thr Ser Glu Asn Asp Asn
210 215 220
Phe Ile Glu Ser Phe Ala Lys Lys Asn Thr Glu Met Phe Lys Met Phe
225 230 235 240
Leu Asn Val Gly Ile Leu Leu Leu Pro Val Ile Gly Met Tyr Tyr Phe
245 250 255
Thr Leu Gly Asn Ser Ala Tyr Gln Asn Thr Leu Ile Ile Val Pro Phe
260 265 270
Leu Leu Met Ala Ser Ile Phe Gln Ala Met Ala Thr Asn Val Gly Asn
275 280 285
Ile Met Ile Val His Gln Lys Thr Lys Ala Ile Ala Val Ala Ser Leu
290 295 300
Leu Val Gly Ile Phe Asn Ala Ile Phe Cys Phe Val Gly Tyr His Phe
305 310 315 320
Leu Gly Leu Thr Gly Val Cys Ile Ala Tyr Leu Phe Ala Ser Phe Leu
325 330 335
Leu Phe Leu Phe Arg Tyr Lys Met Gly Gln Lys Ile Gln Asn Tyr Asn
340 345 350
Leu Lys Trp Arg Phe Ile Val Val Leu Ala Val Ile Phe Ile Met Leu
355 360 365
Gly Leu Leu Ile Gln Phe Glu Asn Val Ile Ile Asn Ser Ile Leu Val
370 375 380
Leu Val Thr Ala Val Phe Glu Ile Phe Ile Tyr Arg His Ile Ile Leu
385 390 395 400
Lys Ile Leu Asn Arg Ile Ile Gly Arg Ala
405 410
<210> 65
<211> 1305
<212> DNA
<213> Prevotella ruminicola (AR32)
<400> 65
atgactgaaa gccggatgaa gcggtcgctg actggtacgt tttggtcgat gacggagcga 60
ttcgctaaaa tgggaataca gatagtttgc acgtttatca tcgcccagtt tgttgcaccc 120
tcggaatttg ggctggtgag catgatgagc atctttttag cgttttcgac gatcttaata 180
gatagcggct tttcgcaggc actgatccat gagcagaacg taactcctca agatgaaagc 240
tcgatatttt ggttcaatat cggtctaggg tgcgctgtct atggcatatt ttggctgatc 300
gctccattaa tcgcgaactt ttataacgaa cctcagctaa ctctactaat ccgagtggcc 360
tttttagcac tgatatttca atcgttaatc gttgttcagc aaggactatt atttaaaagc 420
gttgacttta aagcggtgtc gaagatctcg ttttgggctg ttttattatc gggtatcgcc 480
ggtatcgtgg tgagctatat ccggaaagat gtgtggggcc taatcgttca aaacctgctg 540
ttcgccttac ttcaaactgt tttatactgg gtttattcgc gttggcgtcc aagcttaatc 600
tttaaaatgc aatgtgtgcg aaagtactta cgattttcga tgaatctgct gggtagcaat 660
atgctggcag cgataacgga taatctggcg aacctgttcg tcgggaaggc gtataatgcg 720
acgatattag ggcattatac tatggcgaat aaaataccat atttaacgtc ggggacggtt 780
tgttatggta tcaagcgtgt gagctattcg atcatgtcga cgttccagaa cgataacgag 840
caactagcgc ggtattcgca acgtgtggtt gggacggcgt tctggatctt atcgccagtt 900
atgatcttaa tgctggttct ggcagagccc ttcatctcgt ggctatttcc agaggagtgg 960
gctccagccg caatatatct gcgttatttt tgtgtgatag ggctggtgta ctgctttgcc 1020
gatgttaatc aggatatcct gctagtgaaa ggacgcacgg atatcctatt tcgtttagat 1080
atcgtgcgac ggacggtgtt agttgcactg ctgatcatcg gtatacaata ctcgatggaa 1140
acgtttttac tgctgttagt gatatataat atactaaacg cgatcatcgt gagctatata 1200
gcaggccgac tgatagattg ttcgttatgg cgacagatac gactggttgg gtcgacgcca 1260
ctatatttcc taactaatat caaccaacgg cgagagaaac ggtga 1305
<210> 66
<211> 434
<212> PRT
<213> Prevotella ruminicola (AR32)
<400> 66
Met Thr Glu Ser Arg Met Lys Arg Ser Leu Thr Gly Thr Phe Trp Ser
1 5 10 15
Met Thr Glu Arg Phe Ala Lys Met Gly Ile Gln Ile Val Cys Thr Phe
20 25 30
Ile Ile Ala Gln Phe Val Ala Pro Ser Glu Phe Gly Leu Val Ser Met
35 40 45
Met Ser Ile Phe Leu Ala Phe Ser Thr Ile Leu Ile Asp Ser Gly Phe
50 55 60
Ser Gln Ala Leu Ile His Glu Gln Asn Val Thr Pro Gln Asp Glu Ser
65 70 75 80
Ser Ile Phe Trp Phe Asn Ile Gly Leu Gly Cys Ala Val Tyr Gly Ile
85 90 95
Phe Trp Leu Ile Ala Pro Leu Ile Ala Asn Phe Tyr Asn Glu Pro Gln
100 105 110
Leu Thr Leu Leu Ile Arg Val Ala Phe Leu Ala Leu Ile Phe Gln Ser
115 120 125
Leu Ile Val Val Gln Gln Gly Leu Leu Phe Lys Ser Val Asp Phe Lys
130 135 140
Ala Val Ser Lys Ile Ser Phe Trp Ala Val Leu Leu Ser Gly Ile Ala
145 150 155 160
Gly Ile Val Val Ser Tyr Ile Arg Lys Asp Val Trp Gly Leu Ile Val
165 170 175
Gln Asn Leu Leu Phe Ala Leu Leu Gln Thr Val Leu Tyr Trp Val Tyr
180 185 190
Ser Arg Trp Arg Pro Ser Leu Ile Phe Lys Met Gln Cys Val Arg Lys
195 200 205
Tyr Leu Arg Phe Ser Met Asn Leu Leu Gly Ser Asn Met Leu Ala Ala
210 215 220
Ile Thr Asp Asn Leu Ala Asn Leu Phe Val Gly Lys Ala Tyr Asn Ala
225 230 235 240
Thr Ile Leu Gly His Tyr Thr Met Ala Asn Lys Ile Pro Tyr Leu Thr
245 250 255
Ser Gly Thr Val Cys Tyr Gly Ile Lys Arg Val Ser Tyr Ser Ile Met
260 265 270
Ser Thr Phe Gln Asn Asp Asn Glu Gln Leu Ala Arg Tyr Ser Gln Arg
275 280 285
Val Val Gly Thr Ala Phe Trp Ile Leu Ser Pro Val Met Ile Leu Met
290 295 300
Leu Val Leu Ala Glu Pro Phe Ile Ser Trp Leu Phe Pro Glu Glu Trp
305 310 315 320
Ala Pro Ala Ala Ile Tyr Leu Arg Tyr Phe Cys Val Ile Gly Leu Val
325 330 335
Tyr Cys Phe Ala Asp Val Asn Gln Asp Ile Leu Leu Val Lys Gly Arg
340 345 350
Thr Asp Ile Leu Phe Arg Leu Asp Ile Val Arg Arg Thr Val Leu Val
355 360 365
Ala Leu Leu Ile Ile Gly Ile Gln Tyr Ser Met Glu Thr Phe Leu Leu
370 375 380
Leu Leu Val Ile Tyr Asn Ile Leu Asn Ala Ile Ile Val Ser Tyr Ile
385 390 395 400
Ala Gly Arg Leu Ile Asp Cys Ser Leu Trp Arg Gln Ile Arg Leu Val
405 410 415
Gly Ser Thr Pro Leu Tyr Phe Leu Thr Asn Ile Asn Gln Arg Arg Glu
420 425 430
Lys Arg
<210> 67
<211> 1284
<212> DNA
<213> Flavobacterium spartansii
<400> 67
atggaaaaag atataatact gaaggcagaa aatattagca aacagtatcg tctgggccag 60
gttggtactg gcactctgtc gcatgacatt aaccgttggt ggcataagat tcgcggtaaa 120
gagaatccgt atctgaaaat tggagacacg aacgatcgtt caacgaaagg caatagcgat 180
tatgtatggg ccttgcagga cattaacttt gaagtggaac ggggcgaagt gctaggcatt 240
attggtaaaa atggcgctgg caaaagcacg ttactgaaga tattaagcaa agtgacggcg 300
ccaacgactg gctcgataaa atcacgtggc cgtattgcga gcttattaga agtaggcacg 360
ggtttcaacg gcgaaatgac tggccgcgaa aatatttttc ttaacggtgc aattttaggc 420
atgactaaaa aagaaattag cagcaagtta gatgaaatta tagaatttag cggttgcgaa 480
cgttatatag atacgcccgt gaaacgctac tcaagcggca tgacggtacg tctggcgttt 540
gctgtggctg cgtttttaga acccgaaatt ttagttgtgg atgaagtgtt agctgtgggc 600
gatgcagaat ttcagaagaa ggcgattggt aaaatgcaag atattagcaa aggtgaaggc 660
cgtactgtgc tgtttgtgtc tcataatatg gccgcggtga agtcgctgtg cacgcgcggc 720
atagtgctag aaaacggaaa aattaaattt aacggcgata ttgatgaggc gttagatgtg 780
tatagcaata acggtaatag cacggatcat acggttgtgt ttgatagcga tacgaaacgg 840
acgggatcac gcaatataga gtttataagc gttgagatac gcgatcagaa tcagaagcca 900
tcgcatgaat tcagcattgg cgatgatctg attattaaat tccgccttca gaataatacg 960
aatgaagcga aaagcgaagt aggcatacaa atacgcagca gcgacgaaat gccgattttt 1020
catattatgg gtcgcgatag caactttgaa ctgactcatg tggaaaaaca ggaagagtat 1080
gtggtgtcga taaaagacat acgcttattt cccggaatgt atactatttc atttacgtcg 1140
aatacgacga ctggccacca aatatttgac tgcattgaaa acgcgttaag ctttcagatt 1200
atagatggcg gcaaatatac tattcgctcg ttaccacgcg cggcaggctt attctttctg 1260
aacccagaat ggaaaaaatt ataa 1284
<210> 68
<211> 427
<212> PRT
<213> Flavobacterium spartansii
<400> 68
Met Glu Lys Asp Ile Ile Leu Lys Ala Glu Asn Ile Ser Lys Gln Tyr
1 5 10 15
Arg Leu Gly Gln Val Gly Thr Gly Thr Leu Ser His Asp Ile Asn Arg
20 25 30
Trp Trp His Lys Ile Arg Gly Lys Glu Asn Pro Tyr Leu Lys Ile Gly
35 40 45
Asp Thr Asn Asp Arg Ser Thr Lys Gly Asn Ser Asp Tyr Val Trp Ala
50 55 60
Leu Gln Asp Ile Asn Phe Glu Val Glu Arg Gly Glu Val Leu Gly Ile
65 70 75 80
Ile Gly Lys Asn Gly Ala Gly Lys Ser Thr Leu Leu Lys Ile Leu Ser
85 90 95
Lys Val Thr Ala Pro Thr Thr Gly Ser Ile Lys Ser Arg Gly Arg Ile
100 105 110
Ala Ser Leu Leu Glu Val Gly Thr Gly Phe Asn Gly Glu Met Thr Gly
115 120 125
Arg Glu Asn Ile Phe Leu Asn Gly Ala Ile Leu Gly Met Thr Lys Lys
130 135 140
Glu Ile Ser Ser Lys Leu Asp Glu Ile Ile Glu Phe Ser Gly Cys Glu
145 150 155 160
Arg Tyr Ile Asp Thr Pro Val Lys Arg Tyr Ser Ser Gly Met Thr Val
165 170 175
Arg Leu Ala Phe Ala Val Ala Ala Phe Leu Glu Pro Glu Ile Leu Val
180 185 190
Val Asp Glu Val Leu Ala Val Gly Asp Ala Glu Phe Gln Lys Lys Ala
195 200 205
Ile Gly Lys Met Gln Asp Ile Ser Lys Gly Glu Gly Arg Thr Val Leu
210 215 220
Phe Val Ser His Asn Met Ala Ala Val Lys Ser Leu Cys Thr Arg Gly
225 230 235 240
Ile Val Leu Glu Asn Gly Lys Ile Lys Phe Asn Gly Asp Ile Asp Glu
245 250 255
Ala Leu Asp Val Tyr Ser Asn Asn Gly Asn Ser Thr Asp His Thr Val
260 265 270
Val Phe Asp Ser Asp Thr Lys Arg Thr Gly Ser Arg Asn Ile Glu Phe
275 280 285
Ile Ser Val Glu Ile Arg Asp Gln Asn Gln Lys Pro Ser His Glu Phe
290 295 300
Ser Ile Gly Asp Asp Leu Ile Ile Lys Phe Arg Leu Gln Asn Asn Thr
305 310 315 320
Asn Glu Ala Lys Ser Glu Val Gly Ile Gln Ile Arg Ser Ser Asp Glu
325 330 335
Met Pro Ile Phe His Ile Met Gly Arg Asp Ser Asn Phe Glu Leu Thr
340 345 350
His Val Glu Lys Gln Glu Glu Tyr Val Val Ser Ile Lys Asp Ile Arg
355 360 365
Leu Phe Pro Gly Met Tyr Thr Ile Ser Phe Thr Ser Asn Thr Thr Thr
370 375 380
Gly His Gln Ile Phe Asp Cys Ile Glu Asn Ala Leu Ser Phe Gln Ile
385 390 395 400
Ile Asp Gly Gly Lys Tyr Thr Ile Arg Ser Leu Pro Arg Ala Ala Gly
405 410 415
Leu Phe Phe Leu Asn Pro Glu Trp Lys Lys Leu
420 425
<210> 69
<211> 1305
<212> DNA
<213> Sporomusa sphaeroides DSM 2875
<400> 69
atgtcagata ctgttataaa ggttgagaac ttatcaaagc aatatcaatt aggtactatt 60
ggttcgggta ctttatatcg tgatttgcag tcgtggtggg ctcggttaaa gggtaaagaa 120
gatccgaatt caaagctagg tcaatgggat gtttctcaga taggcgaaga taatagcttt 180
tgggctttac gagatgtatc atttgagatt aaccaagggg acattgttgg tattattggt 240
cgtaacgggg caggcaaatc aactttatta aagatattat cacgggttac tgggccaact 300
tcggggcaga taaaaataaa gggtcgggtt gcatcgttat tagaagttgg tactggtttt 360
catccggaac tgactgggcg agaaaatgtt tatctaaacg gggccattct aggtatgcgg 420
aaggccgaga tagatcgtaa atttgacgag atagttgact tcgctgaaat atcaaagttt 480
atagatactc cagttaaacg gtattcatca ggaatgtatg ttcggttagc ctttgccgtt 540
gccgctcatc tagatccaga aattttaatt gtagatgaag ttctggccgt tggggacata 600
gagtttcaaa agaagtgctt aggcaagatg aaagatgttg gccaacaggg gcgaactgtt 660
ttatttgttt cgcataatat ggttgccatt gaacaattat gctcatcggc tattctgatc 720
gaaaatgggc aaataaaaag caaatcgttt actgttcggg atattattaa ggattattta 780
tataaaaacg aatatagcca atttactcta tgggagaata aggagaaaga atttagcaac 840
ccatattttt atccagttaa aatgtatatt ggtgataaag atggtaagtt actacctacc 900
ccaatacgta acgatcaaga tgccttcatt tttatagaag cccagattaa gaagattgat 960
aaagcattaa ctgttggtta tgctatatat actgattcgg gtgagtgctt atattggtca 1020
tatcagactg acgagagcga agaagaatgg cctactctaa tagttggctc aaacgtttta 1080
tattcaaacc tgccaaaacg gttattaaac gaagggaaat atcggattga attaattggt 1140
ggagtccatt ttcgaaagtg gttatttcag ccattaaaat caccgccttc gatttcgtta 1200
gaaattgttg gtggcttatc ggattcacca tatctattat ataagcggcc aactgtttta 1260
aaccctataa ttcgatggaa ctcatttaat cgaaaggttg agtaa 1305
<210> 70
<211> 434
<212> PRT
<213> Sporomusa sphaeroides DSM 2875
<400> 70
Met Ser Asp Thr Val Ile Lys Val Glu Asn Leu Ser Lys Gln Tyr Gln
1 5 10 15
Leu Gly Thr Ile Gly Ser Gly Thr Leu Tyr Arg Asp Leu Gln Ser Trp
20 25 30
Trp Ala Arg Leu Lys Gly Lys Glu Asp Pro Asn Ser Lys Leu Gly Gln
35 40 45
Trp Asp Val Ser Gln Ile Gly Glu Asp Asn Ser Phe Trp Ala Leu Arg
50 55 60
Asp Val Ser Phe Glu Ile Asn Gln Gly Asp Ile Val Gly Ile Ile Gly
65 70 75 80
Arg Asn Gly Ala Gly Lys Ser Thr Leu Leu Lys Ile Leu Ser Arg Val
85 90 95
Thr Gly Pro Thr Ser Gly Gln Ile Lys Ile Lys Gly Arg Val Ala Ser
100 105 110
Leu Leu Glu Val Gly Thr Gly Phe His Pro Glu Leu Thr Gly Arg Glu
115 120 125
Asn Val Tyr Leu Asn Gly Ala Ile Leu Gly Met Arg Lys Ala Glu Ile
130 135 140
Asp Arg Lys Phe Asp Glu Ile Val Asp Phe Ala Glu Ile Ser Lys Phe
145 150 155 160
Ile Asp Thr Pro Val Lys Arg Tyr Ser Ser Gly Met Tyr Val Arg Leu
165 170 175
Ala Phe Ala Val Ala Ala His Leu Asp Pro Glu Ile Leu Ile Val Asp
180 185 190
Glu Val Leu Ala Val Gly Asp Ile Glu Phe Gln Lys Lys Cys Leu Gly
195 200 205
Lys Met Lys Asp Val Gly Gln Gln Gly Arg Thr Val Leu Phe Val Ser
210 215 220
His Asn Met Val Ala Ile Glu Gln Leu Cys Ser Ser Ala Ile Leu Ile
225 230 235 240
Glu Asn Gly Gln Ile Lys Ser Lys Ser Phe Thr Val Arg Asp Ile Ile
245 250 255
Lys Asp Tyr Leu Tyr Lys Asn Glu Tyr Ser Gln Phe Thr Leu Trp Glu
260 265 270
Asn Lys Glu Lys Glu Phe Ser Asn Pro Tyr Phe Tyr Pro Val Lys Met
275 280 285
Tyr Ile Gly Asp Lys Asp Gly Lys Leu Leu Pro Thr Pro Ile Arg Asn
290 295 300
Asp Gln Asp Ala Phe Ile Phe Ile Glu Ala Gln Ile Lys Lys Ile Asp
305 310 315 320
Lys Ala Leu Thr Val Gly Tyr Ala Ile Tyr Thr Asp Ser Gly Glu Cys
325 330 335
Leu Tyr Trp Ser Tyr Gln Thr Asp Glu Ser Glu Glu Glu Trp Pro Thr
340 345 350
Leu Ile Val Gly Ser Asn Val Leu Tyr Ser Asn Leu Pro Lys Arg Leu
355 360 365
Leu Asn Glu Gly Lys Tyr Arg Ile Glu Leu Ile Gly Gly Val His Phe
370 375 380
Arg Lys Trp Leu Phe Gln Pro Leu Lys Ser Pro Pro Ser Ile Ser Leu
385 390 395 400
Glu Ile Val Gly Gly Leu Ser Asp Ser Pro Tyr Leu Leu Tyr Lys Arg
405 410 415
Pro Thr Val Leu Asn Pro Ile Ile Arg Trp Asn Ser Phe Asn Arg Lys
420 425 430
Val Glu
<210> 71
<211> 864
<212> DNA
<213> Flavobacterium spartansii
<400> 71
atgaataata actcacccaa cgattggtta tttgaaataa cgccgaaaaa taagttcttc 60
tcactgaatc tgaaagaagt gtggcaatat cgtgacctgc tgtttttatt cgtgaaacgt 120
gacgtgataa cggtgtataa gcagacggtg ctgggaccat tatggtattt gattcaacca 180
ttatttacga gcgtgacgtt tacgataata ttcaataacg tggcaggcat tgagactggc 240
acggtgccgc catttctgtt taacttggct ggcataacgg tgtggaacta ttttacggca 300
tgtttgacgg gaacgagcga cacgtttaag gcgaacgcag ctatttttgg caaagtgtat 360
tttccacgaa taattacgcc gttgtcagtg gtgattagca acttagtgaa gtttggcata 420
cagtttctga tttttattgg cttctatatt ttctactatt ttcagggcgc ggatctgtcg 480
cttaacggtt tagtgctgtt ttttccggtg ctgataataa taatgggcat tctgggctta 540
ggactaggta tgttaataag cgctatggtg acgaaatatc gtgacttttc gcatctgatt 600
ggttttggaa tacagctgtt aatgtatctg agcgcggtga tgtatccgat ggaattaatt 660
aaagataaac tgccaagcta cggatggtta gtggtgtata acccactggc gtatattatt 720
gagactgcac gttttatgct gttaaacgtt ggtgatattt cagtgttagg cttaacgtat 780
acgctgattg tgacgataac ggtgtttttt ataggcctgt tggtgtttaa taaaactgag 840
aaatcgttta tagatacggt gtaa 864
<210> 72
<211> 287
<212> PRT
<213> Flavobacterium spartansii
<400> 72
Met Asn Asn Asn Ser Pro Asn Asp Trp Leu Phe Glu Ile Thr Pro Lys
1 5 10 15
Asn Lys Phe Phe Ser Leu Asn Leu Lys Glu Val Trp Gln Tyr Arg Asp
20 25 30
Leu Leu Phe Leu Phe Val Lys Arg Asp Val Ile Thr Val Tyr Lys Gln
35 40 45
Thr Val Leu Gly Pro Leu Trp Tyr Leu Ile Gln Pro Leu Phe Thr Ser
50 55 60
Val Thr Phe Thr Ile Ile Phe Asn Asn Val Ala Gly Ile Glu Thr Gly
65 70 75 80
Thr Val Pro Pro Phe Leu Phe Asn Leu Ala Gly Ile Thr Val Trp Asn
85 90 95
Tyr Phe Thr Ala Cys Leu Thr Gly Thr Ser Asp Thr Phe Lys Ala Asn
100 105 110
Ala Ala Ile Phe Gly Lys Val Tyr Phe Pro Arg Ile Ile Thr Pro Leu
115 120 125
Ser Val Val Ile Ser Asn Leu Val Lys Phe Gly Ile Gln Phe Leu Ile
130 135 140
Phe Ile Gly Phe Tyr Ile Phe Tyr Tyr Phe Gln Gly Ala Asp Leu Ser
145 150 155 160
Leu Asn Gly Leu Val Leu Phe Phe Pro Val Leu Ile Ile Ile Met Gly
165 170 175
Ile Leu Gly Leu Gly Leu Gly Met Leu Ile Ser Ala Met Val Thr Lys
180 185 190
Tyr Arg Asp Phe Ser His Leu Ile Gly Phe Gly Ile Gln Leu Leu Met
195 200 205
Tyr Leu Ser Ala Val Met Tyr Pro Met Glu Leu Ile Lys Asp Lys Leu
210 215 220
Pro Ser Tyr Gly Trp Leu Val Val Tyr Asn Pro Leu Ala Tyr Ile Ile
225 230 235 240
Glu Thr Ala Arg Phe Met Leu Leu Asn Val Gly Asp Ile Ser Val Leu
245 250 255
Gly Leu Thr Tyr Thr Leu Ile Val Thr Ile Thr Val Phe Phe Ile Gly
260 265 270
Leu Leu Val Phe Asn Lys Thr Glu Lys Ser Phe Ile Asp Thr Val
275 280 285
<210> 73
<211> 852
<212> DNA
<213> Sporomusa sphaeroides DSM 2875
<400> 73
atgcatctag aacaggaaca atggacttcg attattaaac cttcgaacgg atggtttgat 60
attgatttta aagggttatg gcactatcgg gatttaattg caatgatggt taaacgggat 120
tttgttgcct tttataaaca aaccatctta gggcctctat ggtttttact gcagccgtta 180
ttaactacta ttgtttttac tattgttttt ggccagattg ccaaattacc tactaacggg 240
ttacctcaag tattatttta tttatcaggg actgttatgt ggaactactt tgctgcctgc 300
ttaaatacta cctcaaatac ctttgttgcg aacgccggta tttttggtaa agtttatttt 360
ccacggctag ttataccaat tggcgttgtt attaccaata tgttatcatt cgggattcaa 420
tttgcactat ttttagctct actaatcttc tttatgcttc aaggggcagc agttgcccca 480
aacttatgga tcttagttac tcctttatta gttctgcaaa tgggctgctt agggctaggt 540
tgtggtatta tagtttcatc aatgactacc aaataccggg acttatcatt attagttact 600
tttggtgccc agttatggat gtatgcgact ccggttgttt atcctgtttc gatggcatcc 660
gggttcatga gctgggtttt agtattaaac ccaatgactg ctattatcga aatctttcgt 720
tacgcgtttt taggtgggca gatgattcca ttatggtact ggttagttag cggtgcaatt 780
accgttattt tattcatggt tggtattatt ctattctcga aagttgagaa aaattttatg 840
gatactgttt ga 852
<210> 74
<211> 283
<212> PRT
<213> Sporomusa sphaeroides DSM 2875
<400> 74
Met His Leu Glu Gln Glu Gln Trp Thr Ser Ile Ile Lys Pro Ser Asn
1 5 10 15
Gly Trp Phe Asp Ile Asp Phe Lys Gly Leu Trp His Tyr Arg Asp Leu
20 25 30
Ile Ala Met Met Val Lys Arg Asp Phe Val Ala Phe Tyr Lys Gln Thr
35 40 45
Ile Leu Gly Pro Leu Trp Phe Leu Leu Gln Pro Leu Leu Thr Thr Ile
50 55 60
Val Phe Thr Ile Val Phe Gly Gln Ile Ala Lys Leu Pro Thr Asn Gly
65 70 75 80
Leu Pro Gln Val Leu Phe Tyr Leu Ser Gly Thr Val Met Trp Asn Tyr
85 90 95
Phe Ala Ala Cys Leu Asn Thr Thr Ser Asn Thr Phe Val Ala Asn Ala
100 105 110
Gly Ile Phe Gly Lys Val Tyr Phe Pro Arg Leu Val Ile Pro Ile Gly
115 120 125
Val Val Ile Thr Asn Met Leu Ser Phe Gly Ile Gln Phe Ala Leu Phe
130 135 140
Leu Ala Leu Leu Ile Phe Phe Met Leu Gln Gly Ala Ala Val Ala Pro
145 150 155 160
Asn Leu Trp Ile Leu Val Thr Pro Leu Leu Val Leu Gln Met Gly Cys
165 170 175
Leu Gly Leu Gly Cys Gly Ile Ile Val Ser Ser Met Thr Thr Lys Tyr
180 185 190
Arg Asp Leu Ser Leu Leu Val Thr Phe Gly Ala Gln Leu Trp Met Tyr
195 200 205
Ala Thr Pro Val Val Tyr Pro Val Ser Met Ala Ser Gly Phe Met Ser
210 215 220
Trp Val Leu Val Leu Asn Pro Met Thr Ala Ile Ile Glu Ile Phe Arg
225 230 235 240
Tyr Ala Phe Leu Gly Gly Gln Met Ile Pro Leu Trp Tyr Trp Leu Val
245 250 255
Ser Gly Ala Ile Thr Val Ile Leu Phe Met Val Gly Ile Ile Leu Phe
260 265 270
Ser Lys Val Glu Lys Asn Phe Met Asp Thr Val
275 280
<210> 75
<211> 1851
<212> DNA
<213> Candidatus Planktophila sulfonica
<400> 75
atgattgaat tccttagcaa accaaagttc agcatactta ctaaatcccc gatttatcga 60
gccagccgcg tattatccgt taaggaccgg cgaaagatta gccttgtgat tgtggttcag 120
gtttgccttg gtctgtttga tttagccggt gtagcggtgt ttggtgtaat gggtagctta 180
gcggtaagcg gagtgcagag ccagagcccg aactcacggg taggccaggt tcttgatgcg 240
attggaatag ccaacctgcc gttccaaaag caggccgcga ttctggcgat tctggctact 300
tgcttcctta tggcccggac cttccttact gtagtggtaa cgaaacggac tatgcttttc 360
ctgtcccgac gaggcgccgc tattagctca gatttagtag ctcgactgct gagcaagtca 420
ttacttttca ttcaggagcg aacgactcaa cagacgcttt tcgctctgac gcaaggtgtg 480
agcacgctta ctataggtgt acttgctacc gtggtaacga tgattagcga tacgagcctt 540
cttattttac ttactgcggg ccttttcgta gtggatcccg cgatagctat atccacgtta 600
gtggtattcg gtagcattat tctgttcatg tataaaaacc ttcataataa agctaaaacg 660
ctgggtttcg cggaaagcac tcttcatata aagtccaacg aaaaggttct tgaagtgtta 720
aactcatacc gggaaagcgt agttcgaaat cgcaggaact attatagcga gcaaattggt 780
atgttacgat tcgatcttgc taagacccag gcgcagttat cctttatgcc ctatattggt 840
aagtatgtat tagagactag cgtagtatta ggttcacttt taattgcggc gattcagttc 900
gcgttgcacg atgctgttac cgccgtggcc acgctttcaa tatttcttgt ggctggtacg 960
cgcattagcc cagctgcttt aaggctgcaa caggcgctta ttcagattaa gagctcactg 1020
ggtggctcag aaccgactct tgatttaatt gatgcccttc gtgacaccct tccagcgacg 1080
tccgttaatc aagagctgga ccttacgcat gaacagttcg taccccgaat tcagattcag 1140
gatatatcat ttacgtaccc caactcagat cggcaggcct taagcggtgt taaccttgat 1200
attcagtccg gttccgtggt tgccctggta ggcccatcag gtggcggcaa gacgacgctt 1260
gttgatgtaa ttttaggtat tattgaaccc aatagcggta aagtattaat ttcaaatctt 1320
acccccattg atgctattca gatttcaccg ggtgcgattt catacgtgcc ccaagatgtg 1380
tcaattattg atggtacggt acgagaaaat attgcgatgg gtttccccgt tgaagtggct 1440
accgatgagc ttgtgcataa tgctattgaa ttagctggat taaaagaatt cgttgctacg 1500
ctgccgaatg gtcttgacac gtacgtaggc gaaaaaggtg ctcggatttc aggtggccaa 1560
cggcagcgcc tgggaattgc tagggcgctc ttcacgaacc cgaaattact ggtactggat 1620
gaagctactt ccgccttaga tggtgaaacg gagagccgaa ttacggatag catactgtcc 1680
ttaaagggta aagttacggt attaatggtt gctcataggc tgtccacggt acgcaacgcc 1740
gatcaagttg tgtatatgtc agaaggcagc attaaagctg taggcacttt cgagagcgtg 1800
aggaatacgg tgccggattt cgatacgcag gcccaactta tgggattatg a 1851
<210> 76
<211> 616
<212> PRT
<213> Candidatus Planktophila sulfonica
<400> 76
Met Ile Glu Phe Leu Ser Lys Pro Lys Phe Ser Ile Leu Thr Lys Ser
1 5 10 15
Pro Ile Tyr Arg Ala Ser Arg Val Leu Ser Val Lys Asp Arg Arg Lys
20 25 30
Ile Ser Leu Val Ile Val Val Gln Val Cys Leu Gly Leu Phe Asp Leu
35 40 45
Ala Gly Val Ala Val Phe Gly Val Met Gly Ser Leu Ala Val Ser Gly
50 55 60
Val Gln Ser Gln Ser Pro Asn Ser Arg Val Gly Gln Val Leu Asp Ala
65 70 75 80
Ile Gly Ile Ala Asn Leu Pro Phe Gln Lys Gln Ala Ala Ile Leu Ala
85 90 95
Ile Leu Ala Thr Cys Phe Leu Met Ala Arg Thr Phe Leu Thr Val Val
100 105 110
Val Thr Lys Arg Thr Met Leu Phe Leu Ser Arg Arg Gly Ala Ala Ile
115 120 125
Ser Ser Asp Leu Val Ala Arg Leu Leu Ser Lys Ser Leu Leu Phe Ile
130 135 140
Gln Glu Arg Thr Thr Gln Gln Thr Leu Phe Ala Leu Thr Gln Gly Val
145 150 155 160
Ser Thr Leu Thr Ile Gly Val Leu Ala Thr Val Val Thr Met Ile Ser
165 170 175
Asp Thr Ser Leu Leu Ile Leu Leu Thr Ala Gly Leu Phe Val Val Asp
180 185 190
Pro Ala Ile Ala Ile Ser Thr Leu Val Val Phe Gly Ser Ile Ile Leu
195 200 205
Phe Met Tyr Lys Asn Leu His Asn Lys Ala Lys Thr Leu Gly Phe Ala
210 215 220
Glu Ser Thr Leu His Ile Lys Ser Asn Glu Lys Val Leu Glu Val Leu
225 230 235 240
Asn Ser Tyr Arg Glu Ser Val Val Arg Asn Arg Arg Asn Tyr Tyr Ser
245 250 255
Glu Gln Ile Gly Met Leu Arg Phe Asp Leu Ala Lys Thr Gln Ala Gln
260 265 270
Leu Ser Phe Met Pro Tyr Ile Gly Lys Tyr Val Leu Glu Thr Ser Val
275 280 285
Val Leu Gly Ser Leu Leu Ile Ala Ala Ile Gln Phe Ala Leu His Asp
290 295 300
Ala Val Thr Ala Val Ala Thr Leu Ser Ile Phe Leu Val Ala Gly Thr
305 310 315 320
Arg Ile Ser Pro Ala Ala Leu Arg Leu Gln Gln Ala Leu Ile Gln Ile
325 330 335
Lys Ser Ser Leu Gly Gly Ser Glu Pro Thr Leu Asp Leu Ile Asp Ala
340 345 350
Leu Arg Asp Thr Leu Pro Ala Thr Ser Val Asn Gln Glu Leu Asp Leu
355 360 365
Thr His Glu Gln Phe Val Pro Arg Ile Gln Ile Gln Asp Ile Ser Phe
370 375 380
Thr Tyr Pro Asn Ser Asp Arg Gln Ala Leu Ser Gly Val Asn Leu Asp
385 390 395 400
Ile Gln Ser Gly Ser Val Val Ala Leu Val Gly Pro Ser Gly Gly Gly
405 410 415
Lys Thr Thr Leu Val Asp Val Ile Leu Gly Ile Ile Glu Pro Asn Ser
420 425 430
Gly Lys Val Leu Ile Ser Asn Leu Thr Pro Ile Asp Ala Ile Gln Ile
435 440 445
Ser Pro Gly Ala Ile Ser Tyr Val Pro Gln Asp Val Ser Ile Ile Asp
450 455 460
Gly Thr Val Arg Glu Asn Ile Ala Met Gly Phe Pro Val Glu Val Ala
465 470 475 480
Thr Asp Glu Leu Val His Asn Ala Ile Glu Leu Ala Gly Leu Lys Glu
485 490 495
Phe Val Ala Thr Leu Pro Asn Gly Leu Asp Thr Tyr Val Gly Glu Lys
500 505 510
Gly Ala Arg Ile Ser Gly Gly Gln Arg Gln Arg Leu Gly Ile Ala Arg
515 520 525
Ala Leu Phe Thr Asn Pro Lys Leu Leu Val Leu Asp Glu Ala Thr Ser
530 535 540
Ala Leu Asp Gly Glu Thr Glu Ser Arg Ile Thr Asp Ser Ile Leu Ser
545 550 555 560
Leu Lys Gly Lys Val Thr Val Leu Met Val Ala His Arg Leu Ser Thr
565 570 575
Val Arg Asn Ala Asp Gln Val Val Tyr Met Ser Glu Gly Ser Ile Lys
580 585 590
Ala Val Gly Thr Phe Glu Ser Val Arg Asn Thr Val Pro Asp Phe Asp
595 600 605
Thr Gln Ala Gln Leu Met Gly Leu
610 615
<210> 77
<211> 1809
<212> DNA
<213> Butyrivibrio hungatei XBD2006
<400> 77
atgtcgaata ctgataataa gaaagtatcg ctttttagca agttgcgcta tatctttgat 60
cgcaaacaga aaggccagct cgttatcctc gccgtactga tcttgtttgg gggaatcttt 120
gaaacctttt cgatcagcat gatgatcccg gtgatggccg ggatcatcaa ccaggataaa 180
ttgcaatcgg ctatcgagga taataaggtg ctacgcatca tcgcggaatc gctgaacttg 240
gggactggct cagaactcgc cgccaagctc actgtgtgtc tcatcgtgct cttcctcgtt 300
aagaacgcgt atcagatctt tctgatctac cggcagaata cttttatcac ccgcgcgcgc 360
aatgacatga tctcgcgcgt aatgcgggaa tttctcaatc gcccgtatga ggattattta 420
ggggccgata tcccaacggt gtttcgcatc accgactcgg atatcccccg cacctttact 480
ctgatgcttt ctctgctttc tctgtcgact gaactcgtag tgtcaatggg cctgggcatg 540
gtactgatca tcactgatcc aatcctcact gtgatctgcg tatttgtgtt tgtggcgctt 600
acgctgttta atactaaggt gcttaaaccg aaactgaata aaactggcaa ggagaaccag 660
gaaactcaga gccggatcgc gaaatggcgc ctccaggcga tctatgggct gaaagatgtt 720
aaggtgctca atcgccagga tttctttatc cgcaactatt atgagagcgg aaaggtaggg 780
gcagatctcg cgcgggatta ctcagttctg aataatatgc cacgcacgct gatcgagact 840
gtatttgttg ccgtggtatt gctctatgtg ttgtttttta aactcaatag caatggtgtt 900
caaaacgccg gtgatgtgga taagctcatc atcgcattgg gcttagtggc cacccggctg 960
atgccagcag tgaatcggat caatacgtat atcgctgaga tcgcttataa tcagtactcg 1020
ctggattttg tttataataa cttgactgat agcatgaaaa tggataaagc aatgcgcgca 1080
gagcgcgccg cgatcgcggg gccagagctg catctcgaaa aagagatcga gatcaaggat 1140
atcacgtttg cctatccaga cgccgagact aatatcttta ctggcgcgaa tatggtgatc 1200
ccgaaaggca agagcgtagg gatcatcggc ccgtctgggg cagggaagag cacggttgta 1260
gatatcatct tagggctgct ccatgtccag tcgggagaga tcttgtgcga cggctcgaat 1320
atcttctcga actacgatag ctggctggct cagatcgggt atatcccgca gaccatctat 1380
atggttgatg agtcgatccg cgagaatatc gcgttcggga tcgatgcgga caaaatcgat 1440
gaggaccgca tctgggaagt gatggaagaa gctcagctgg ccgagtttgt taaatcgctg 1500
ccagaaggcc tggacactaa aatcggggac cgcggagtac gcctgagcgg gggccagcgc 1560
cagcggatcg gcatcgcacg cgccctgtat cataacccag agatcctggt atttgatgaa 1620
gccacctcgg ccctggataa tgagactgag gccgctgtga tggaagccgt aaattcgttc 1680
cacggcaaga agaccatgat catcatcgct caccgcttga atacgatcga gaattgtgac 1740
atcatctatg aagtgaaaga cgagaaaatc acccagacga cgttggaagg gcgcaatgtg 1800
atccactga 1809
<210> 78
<211> 602
<212> PRT
<213> Butyrivibrio hungatei XBD2006
<400> 78
Met Ser Asn Thr Asp Asn Lys Lys Val Ser Leu Phe Ser Lys Leu Arg
1 5 10 15
Tyr Ile Phe Asp Arg Lys Gln Lys Gly Gln Leu Val Ile Leu Ala Val
20 25 30
Leu Ile Leu Phe Gly Gly Ile Phe Glu Thr Phe Ser Ile Ser Met Met
35 40 45
Ile Pro Val Met Ala Gly Ile Ile Asn Gln Asp Lys Leu Gln Ser Ala
50 55 60
Ile Glu Asp Asn Lys Val Leu Arg Ile Ile Ala Glu Ser Leu Asn Leu
65 70 75 80
Gly Thr Gly Ser Glu Leu Ala Ala Lys Leu Thr Val Cys Leu Ile Val
85 90 95
Leu Phe Leu Val Lys Asn Ala Tyr Gln Ile Phe Leu Ile Tyr Arg Gln
100 105 110
Asn Thr Phe Ile Thr Arg Ala Arg Asn Asp Met Ile Ser Arg Val Met
115 120 125
Arg Glu Phe Leu Asn Arg Pro Tyr Glu Asp Tyr Leu Gly Ala Asp Ile
130 135 140
Pro Thr Val Phe Arg Ile Thr Asp Ser Asp Ile Pro Arg Thr Phe Thr
145 150 155 160
Leu Met Leu Ser Leu Leu Ser Leu Ser Thr Glu Leu Val Val Ser Met
165 170 175
Gly Leu Gly Met Val Leu Ile Ile Thr Asp Pro Ile Leu Thr Val Ile
180 185 190
Cys Val Phe Val Phe Val Ala Leu Thr Leu Phe Asn Thr Lys Val Leu
195 200 205
Lys Pro Lys Leu Asn Lys Thr Gly Lys Glu Asn Gln Glu Thr Gln Ser
210 215 220
Arg Ile Ala Lys Trp Arg Leu Gln Ala Ile Tyr Gly Leu Lys Asp Val
225 230 235 240
Lys Val Leu Asn Arg Gln Asp Phe Phe Ile Arg Asn Tyr Tyr Glu Ser
245 250 255
Gly Lys Val Gly Ala Asp Leu Ala Arg Asp Tyr Ser Val Leu Asn Asn
260 265 270
Met Pro Arg Thr Leu Ile Glu Thr Val Phe Val Ala Val Val Leu Leu
275 280 285
Tyr Val Leu Phe Phe Lys Leu Asn Ser Asn Gly Val Gln Asn Ala Gly
290 295 300
Asp Val Asp Lys Leu Ile Ile Ala Leu Gly Leu Val Ala Thr Arg Leu
305 310 315 320
Met Pro Ala Val Asn Arg Ile Asn Thr Tyr Ile Ala Glu Ile Ala Tyr
325 330 335
Asn Gln Tyr Ser Leu Asp Phe Val Tyr Asn Asn Leu Thr Asp Ser Met
340 345 350
Lys Met Asp Lys Ala Met Arg Ala Glu Arg Ala Ala Ile Ala Gly Pro
355 360 365
Glu Leu His Leu Glu Lys Glu Ile Glu Ile Lys Asp Ile Thr Phe Ala
370 375 380
Tyr Pro Asp Ala Glu Thr Asn Ile Phe Thr Gly Ala Asn Met Val Ile
385 390 395 400
Pro Lys Gly Lys Ser Val Gly Ile Ile Gly Pro Ser Gly Ala Gly Lys
405 410 415
Ser Thr Val Val Asp Ile Ile Leu Gly Leu Leu His Val Gln Ser Gly
420 425 430
Glu Ile Leu Cys Asp Gly Ser Asn Ile Phe Ser Asn Tyr Asp Ser Trp
435 440 445
Leu Ala Gln Ile Gly Tyr Ile Pro Gln Thr Ile Tyr Met Val Asp Glu
450 455 460
Ser Ile Arg Glu Asn Ile Ala Phe Gly Ile Asp Ala Asp Lys Ile Asp
465 470 475 480
Glu Asp Arg Ile Trp Glu Val Met Glu Glu Ala Gln Leu Ala Glu Phe
485 490 495
Val Lys Ser Leu Pro Glu Gly Leu Asp Thr Lys Ile Gly Asp Arg Gly
500 505 510
Val Arg Leu Ser Gly Gly Gln Arg Gln Arg Ile Gly Ile Ala Arg Ala
515 520 525
Leu Tyr His Asn Pro Glu Ile Leu Val Phe Asp Glu Ala Thr Ser Ala
530 535 540
Leu Asp Asn Glu Thr Glu Ala Ala Val Met Glu Ala Val Asn Ser Phe
545 550 555 560
His Gly Lys Lys Thr Met Ile Ile Ile Ala His Arg Leu Asn Thr Ile
565 570 575
Glu Asn Cys Asp Ile Ile Tyr Glu Val Lys Asp Glu Lys Ile Thr Gln
580 585 590
Thr Thr Leu Glu Gly Arg Asn Val Ile His
595 600
<210> 79
<211> 1746
<212> DNA
<213> Roseburia intestinalis CAG:13
<400> 79
atgaaagatc ttgttaaatc ggttctaaaa gtctttgatg gcaagcagaa gcggaagctc 60
gtaggcatga tgtttctgat actgatcaac tccggagtat cgctgttagg agtctcagtg 120
ttatcgccgt ttatcaccgc agtgatgaac ccggaagagt tacttaaaaa cgacatcata 180
cgttctgtct atgatggctt tcatatgcag aatacgaacc agctgatcac gctgctttct 240
gtgctgatca tcatcgtgta tatcgcgaaa aacgcattta tcatctttat caataatatg 300
ctgtactgtt tctcgtatta tggcaaacga gagatgcagg accggatgat gaaatattat 360
atctcgcgtg attacacctt tttcttaaat cataattcgg ctgagctgat gcgtgatatc 420
aatacggatc cagagatgtt ttatgcagca gtgttaaata tgcttcagtt agcgtcggaa 480
ctttgtgtat cgctgatctt agttggctat ttattagtta aagatgcact gcttacgtta 540
ggagtcgcat ttgcaatggt agtcatggtt tttatcttta tgaaaaaact gcggagaacg 600
ttagcacgtt tcggtgatga ccgtcgtaaa tacaatgcta atatcctgca gtgcatgcag 660
caggcattcg gtgggatcaa agagatcaag atcgcgaatc gagaggcgta ttttgaaggg 720
gaatttgtta agcagaacgg gttatacacg tatgtaatca aacagaattc tttcttatcg 780
tcgatcccga aaccgatcat ggaagcgctt tgcatcacgg gcttaatggc agcgatcatc 840
gtacgtatca atgcaacctc gacctcgccg gagcagtttg taggcacctt agcggttttt 900
gcagccgcgg cgtttgctct gttaccctct gcgaataaga tgtctgaata tttaggctca 960
atcatccata atggagtagt gatccataag atcggggaag agtatgctgc aatccgggat 1020
atggaaatcc agaccgaaaa agaagaaaac tacaaaaaag ttaccttaga caaagaaatc 1080
aaagtagagg atatgacgtt ccattacccg gatactgagg atgcagtttt agctcatgta 1140
aacgtgacca tcccgaaaaa taagtcggtc gcgtttatcg gcccgtccgg ggcaggcaag 1200
acgacgatgg tagacctgat cttaggagtc ttaaaaccgc aggctggcaa gatcaccgtt 1260
gatgggatgg atatcaaaga atcttaccgt ggctggcatg ataagatcgg gtatatccct 1320
cagactatct acatgcttga cgataccatc cggaataata tcgcgtttgg aaagacggaa 1380
gggatcgatg atgcggatat ctgggaagcg ttaaaacagg cgcaattaga tgagtttgtt 1440
aaatcgttag atgagggatt agatacgatg atcggcgagg ctggagtccg gttatccggg 1500
ggccagcgtc agcgtatcgg gatcgcgcgt gcactatacc ggcgtccaga agtgttagtg 1560
ctggatgagg cgacttcggc gctggatacg gaaaccgaag ctgctgtcat ggaagcgatc 1620
gactcgttgc aggggaagat gaccatgctg atcatcgcgc accggctgtc tacgatcaaa 1680
aactgcgaca tggtttatca ggttgaggga ggatcggtga cccggaaaga aaaggaatcg 1740
gtttga 1746
<210> 80
<211> 581
<212> PRT
<213> Roseburia intestinalis CAG:13
<400> 80
Met Lys Asp Leu Val Lys Ser Val Leu Lys Val Phe Asp Gly Lys Gln
1 5 10 15
Lys Arg Lys Leu Val Gly Met Met Phe Leu Ile Leu Ile Asn Ser Gly
20 25 30
Val Ser Leu Leu Gly Val Ser Val Leu Ser Pro Phe Ile Thr Ala Val
35 40 45
Met Asn Pro Glu Glu Leu Leu Lys Asn Asp Ile Ile Arg Ser Val Tyr
50 55 60
Asp Gly Phe His Met Gln Asn Thr Asn Gln Leu Ile Thr Leu Leu Ser
65 70 75 80
Val Leu Ile Ile Ile Val Tyr Ile Ala Lys Asn Ala Phe Ile Ile Phe
85 90 95
Ile Asn Asn Met Leu Tyr Cys Phe Ser Tyr Tyr Gly Lys Arg Glu Met
100 105 110
Gln Asp Arg Met Met Lys Tyr Tyr Ile Ser Arg Asp Tyr Thr Phe Phe
115 120 125
Leu Asn His Asn Ser Ala Glu Leu Met Arg Asp Ile Asn Thr Asp Pro
130 135 140
Glu Met Phe Tyr Ala Ala Val Leu Asn Met Leu Gln Leu Ala Ser Glu
145 150 155 160
Leu Cys Val Ser Leu Ile Leu Val Gly Tyr Leu Leu Val Lys Asp Ala
165 170 175
Leu Leu Thr Leu Gly Val Ala Phe Ala Met Val Val Met Val Phe Ile
180 185 190
Phe Met Lys Lys Leu Arg Arg Thr Leu Ala Arg Phe Gly Asp Asp Arg
195 200 205
Arg Lys Tyr Asn Ala Asn Ile Leu Gln Cys Met Gln Gln Ala Phe Gly
210 215 220
Gly Ile Lys Glu Ile Lys Ile Ala Asn Arg Glu Ala Tyr Phe Glu Gly
225 230 235 240
Glu Phe Val Lys Gln Asn Gly Leu Tyr Thr Tyr Val Ile Lys Gln Asn
245 250 255
Ser Phe Leu Ser Ser Ile Pro Lys Pro Ile Met Glu Ala Leu Cys Ile
260 265 270
Thr Gly Leu Met Ala Ala Ile Ile Val Arg Ile Asn Ala Thr Ser Thr
275 280 285
Ser Pro Glu Gln Phe Val Gly Thr Leu Ala Val Phe Ala Ala Ala Ala
290 295 300
Phe Ala Leu Leu Pro Ser Ala Asn Lys Met Ser Glu Tyr Leu Gly Ser
305 310 315 320
Ile Ile His Asn Gly Val Val Ile His Lys Ile Gly Glu Glu Tyr Ala
325 330 335
Ala Ile Arg Asp Met Glu Ile Gln Thr Glu Lys Glu Glu Asn Tyr Lys
340 345 350
Lys Val Thr Leu Asp Lys Glu Ile Lys Val Glu Asp Met Thr Phe His
355 360 365
Tyr Pro Asp Thr Glu Asp Ala Val Leu Ala His Val Asn Val Thr Ile
370 375 380
Pro Lys Asn Lys Ser Val Ala Phe Ile Gly Pro Ser Gly Ala Gly Lys
385 390 395 400
Thr Thr Met Val Asp Leu Ile Leu Gly Val Leu Lys Pro Gln Ala Gly
405 410 415
Lys Ile Thr Val Asp Gly Met Asp Ile Lys Glu Ser Tyr Arg Gly Trp
420 425 430
His Asp Lys Ile Gly Tyr Ile Pro Gln Thr Ile Tyr Met Leu Asp Asp
435 440 445
Thr Ile Arg Asn Asn Ile Ala Phe Gly Lys Thr Glu Gly Ile Asp Asp
450 455 460
Ala Asp Ile Trp Glu Ala Leu Lys Gln Ala Gln Leu Asp Glu Phe Val
465 470 475 480
Lys Ser Leu Asp Glu Gly Leu Asp Thr Met Ile Gly Glu Ala Gly Val
485 490 495
Arg Leu Ser Gly Gly Gln Arg Gln Arg Ile Gly Ile Ala Arg Ala Leu
500 505 510
Tyr Arg Arg Pro Glu Val Leu Val Leu Asp Glu Ala Thr Ser Ala Leu
515 520 525
Asp Thr Glu Thr Glu Ala Ala Val Met Glu Ala Ile Asp Ser Leu Gln
530 535 540
Gly Lys Met Thr Met Leu Ile Ile Ala His Arg Leu Ser Thr Ile Lys
545 550 555 560
Asn Cys Asp Met Val Tyr Gln Val Glu Gly Gly Ser Val Thr Arg Lys
565 570 575
Glu Lys Glu Ser Val
580
<210> 81
<211> 1827
<212> DNA
<213> Pedobacter ginsengisoli
<400> 81
atgaaaatat atttccgttt attatcattc gcgaaaccaa tcgaaaagtt tgcgattcca 60
tatgtgatca cgacggtact atcagtgatt tttagcgtgt taaatttaac gttattagcg 120
ccattattcg aaacgttaat cagcgatgag ccgacgaaaa gctcaggttt agcggataac 180
gcagctagcg cgtttaatat tacggcgcag tttaaagagt ttgtgaattc gtcgatcata 240
acgaatggtc aggagaaaac gcttacgtat atatgcctaa ttattgtact aagcgtatta 300
ttatcgaata tcttccgtta ttttagccag cgttcgatgg aagatcttcg ggtgcatacg 360
ttattaaatt tacggaaaac tgtgttcgaa aacgtgatga acttgcatgt tggttatttt 420
aataacgaac ggaaaggtga cattatctcg aaagtgtcgg ccgatgtgca agtggtgcag 480
tttacggtaa cgaatacgct tcaagtggtg tttaaagagc cactaacgtt aattttctat 540
gtgttagtgc tattatcaat tagcatcaag cttacgttat tttcgttatt agtgattccg 600
atatcggcgt ttgtgatcag caaaattgtg aaacgtatca aacatcaagc aaaggaagct 660
catgagtcgt tcgcgaaaat gattggtttt ttagatgaag cattaggggg catcaaaata 720
attaaagcat ttaacgcgtc agagcgaatc aaagaacgtt ttcataacga aaatgtattt 780
tatagcaata tcaatcggaa gatggtgcgg cgacaacagt taggtagccc gttaagcgag 840
tttttaagca ttgtgatggt gtcattcatt gtgtggtatg gtggccggtt aataataagc 900
catcaacccg gtgcgctatc gacgagccag tttatcgcgt atatcgcgat cttttcccag 960
gtgatgcggc cggcgaaggc attaacggat agcttttcgg gtatacatac tggtatcgcg 1020
gcaggcgaac gggtgctaga tttaattgac acgaaagcgg aacaaataaa taagcccgat 1080
gcgaaagaaa tcagcagctt caataactcg ttagtgtttg aaaacgtgtc attttcgtac 1140
gaatcgaaag aagtgttaaa aaatattaat ttaacgattc agaaagggaa aacgatcgca 1200
ttagtgggac caagcggtgg cggcaaaagc actctaatgg atttaatccc acgtttccac 1260
gatccaaaat cgggttcgat caaaattgat ggtttagatt atgcggattt aacggttgag 1320
tcgattcgga gccagcttgg tatggtgaat caagaaagca ttttatttaa tgatacgatc 1380
tttaataata tcgcatttgc gaagccggat gcgacggaag ccgaagtgat tgccgcggcg 1440
aaaattgcga acgcgcatga cttcatactt caaacggaaa acggttatga aacgtatacg 1500
ggtgaccgtg gtaataaact tagcgggggc cagaaacaac ggttatgtat cgcgcgtgcg 1560
attttagcga atccaccgat aatgttatta gacgaagcga cgagcgcgtt agatacggag 1620
tcggaaaagt tagtgcaaga tgcgcttaat aaattaatgg aaaaccggac ttcattagtg 1680
atcgcgcacc gtttaagcac gatccatggt gcggatttaa tagtggtgat tgataagggt 1740
gagataattg aaacgggtac gcatcaagag ttattatcgc ataacggtct atataaaaaa 1800
cttattgaat tgcagacgtt ttcgtaa 1827
<210> 82
<211> 608
<212> PRT
<213> Pedobacter ginsengisoli
<400> 82
Met Lys Ile Tyr Phe Arg Leu Leu Ser Phe Ala Lys Pro Ile Glu Lys
1 5 10 15
Phe Ala Ile Pro Tyr Val Ile Thr Thr Val Leu Ser Val Ile Phe Ser
20 25 30
Val Leu Asn Leu Thr Leu Leu Ala Pro Leu Phe Glu Thr Leu Ile Ser
35 40 45
Asp Glu Pro Thr Lys Ser Ser Gly Leu Ala Asp Asn Ala Ala Ser Ala
50 55 60
Phe Asn Ile Thr Ala Gln Phe Lys Glu Phe Val Asn Ser Ser Ile Ile
65 70 75 80
Thr Asn Gly Gln Glu Lys Thr Leu Thr Tyr Ile Cys Leu Ile Ile Val
85 90 95
Leu Ser Val Leu Leu Ser Asn Ile Phe Arg Tyr Phe Ser Gln Arg Ser
100 105 110
Met Glu Asp Leu Arg Val His Thr Leu Leu Asn Leu Arg Lys Thr Val
115 120 125
Phe Glu Asn Val Met Asn Leu His Val Gly Tyr Phe Asn Asn Glu Arg
130 135 140
Lys Gly Asp Ile Ile Ser Lys Val Ser Ala Asp Val Gln Val Val Gln
145 150 155 160
Phe Thr Val Thr Asn Thr Leu Gln Val Val Phe Lys Glu Pro Leu Thr
165 170 175
Leu Ile Phe Tyr Val Leu Val Leu Leu Ser Ile Ser Ile Lys Leu Thr
180 185 190
Leu Phe Ser Leu Leu Val Ile Pro Ile Ser Ala Phe Val Ile Ser Lys
195 200 205
Ile Val Lys Arg Ile Lys His Gln Ala Lys Glu Ala His Glu Ser Phe
210 215 220
Ala Lys Met Ile Gly Phe Leu Asp Glu Ala Leu Gly Gly Ile Lys Ile
225 230 235 240
Ile Lys Ala Phe Asn Ala Ser Glu Arg Ile Lys Glu Arg Phe His Asn
245 250 255
Glu Asn Val Phe Tyr Ser Asn Ile Asn Arg Lys Met Val Arg Arg Gln
260 265 270
Gln Leu Gly Ser Pro Leu Ser Glu Phe Leu Ser Ile Val Met Val Ser
275 280 285
Phe Ile Val Trp Tyr Gly Gly Arg Leu Ile Ile Ser His Gln Pro Gly
290 295 300
Ala Leu Ser Thr Ser Gln Phe Ile Ala Tyr Ile Ala Ile Phe Ser Gln
305 310 315 320
Val Met Arg Pro Ala Lys Ala Leu Thr Asp Ser Phe Ser Gly Ile His
325 330 335
Thr Gly Ile Ala Ala Gly Glu Arg Val Leu Asp Leu Ile Asp Thr Lys
340 345 350
Ala Glu Gln Ile Asn Lys Pro Asp Ala Lys Glu Ile Ser Ser Phe Asn
355 360 365
Asn Ser Leu Val Phe Glu Asn Val Ser Phe Ser Tyr Glu Ser Lys Glu
370 375 380
Val Leu Lys Asn Ile Asn Leu Thr Ile Gln Lys Gly Lys Thr Ile Ala
385 390 395 400
Leu Val Gly Pro Ser Gly Gly Gly Lys Ser Thr Leu Met Asp Leu Ile
405 410 415
Pro Arg Phe His Asp Pro Lys Ser Gly Ser Ile Lys Ile Asp Gly Leu
420 425 430
Asp Tyr Ala Asp Leu Thr Val Glu Ser Ile Arg Ser Gln Leu Gly Met
435 440 445
Val Asn Gln Glu Ser Ile Leu Phe Asn Asp Thr Ile Phe Asn Asn Ile
450 455 460
Ala Phe Ala Lys Pro Asp Ala Thr Glu Ala Glu Val Ile Ala Ala Ala
465 470 475 480
Lys Ile Ala Asn Ala His Asp Phe Ile Leu Gln Thr Glu Asn Gly Tyr
485 490 495
Glu Thr Tyr Thr Gly Asp Arg Gly Asn Lys Leu Ser Gly Gly Gln Lys
500 505 510
Gln Arg Leu Cys Ile Ala Arg Ala Ile Leu Ala Asn Pro Pro Ile Met
515 520 525
Leu Leu Asp Glu Ala Thr Ser Ala Leu Asp Thr Glu Ser Glu Lys Leu
530 535 540
Val Gln Asp Ala Leu Asn Lys Leu Met Glu Asn Arg Thr Ser Leu Val
545 550 555 560
Ile Ala His Arg Leu Ser Thr Ile His Gly Ala Asp Leu Ile Val Val
565 570 575
Ile Asp Lys Gly Glu Ile Ile Glu Thr Gly Thr His Gln Glu Leu Leu
580 585 590
Ser His Asn Gly Leu Tyr Lys Lys Leu Ile Glu Leu Gln Thr Phe Ser
595 600 605
<210> 83
<211> 1731
<212> DNA
<213> Verrucomicrobia bacterium CG1_02_43_26
<400> 83
atgaaaaaat tatttccata cttagtgtat ttaaaagatg tcaaaatggc atttatctta 60
gcaatcttag ccggtatctt ttatggtgca agcacgggtt taggtatccc agtgttaatc 120
cgttacttat acccaaaaat cttttcgaat gaagcaatct cggttatgac gttaacttta 180
atctgcacgt taccagtgat cgtatcggcc ttccgggctg gtgggaactt cttaaattcg 240
tattatttat catattgcgg gcagtatatc ctccaacaat tacggatcaa ggttttcgcc 300
aagatccaga acttaccaat cgcatttttc cataaacggc aaccagggga cttaatctca 360
cgtgtgagca acgatacgac gatcttgcag caaacgatca tcaatgcatc tcaagagatc 420
ctcaagcagc caatcacgtt attaggggca gtatcgtata tcgtttatat gtgttttcag 480
caaagcgatg tagtattttt aatcatcttt atcttagcaa tcccattatg catcgttcca 540
atccgttata tcgggatcaa aatgcgtaat aaagcacggg caatgcagga acaaacgtcc 600
gagttaactc accggttagc ccagaatctc tcggcagtta aagaaatccg gtcgttttgt 660
ttagaggaat acgagttatc gcgttacgaa gcagtttgcc atgttttacg ggaacgtttt 720
ttaaaagtgg ttaagtatac ttcaatctta agcccatcga tcgaagtcat cgcctcgttt 780
ggagtcgcaa tggcattttg gtattcgtat aaatcgaaga tcgagccaga tgtgtttatc 840
tcgatcgtcg gtgccttata tttatcgtat gaaccaatca agaaattagg tcgattaaac 900
tccgagatgc aacaggggct cgcatcgtta gagcgcctcg aaaatatctt agaagaacca 960
atcacgatcc atgacccagc agtacctcac ccagtcggta aattagaggg caatatccag 1020
tttaagaacg taagctttgc atatgagatg gccccagtct tacgggacgt gacggtccat 1080
ttaacggcca aaaagacgta tgcattagtc ggtccatcgg gtgctggtaa gacgactttt 1140
gctcatttaa tcccacgttt ttacgattta gcagaaggga acggttcgat cacgatcgat 1200
ggtatcaata tcaaagacat gcgattaaaa gacttacggc agaatatcgc attagtgagc 1260
caggatccag tgttatttaa tgatacgatc tataataata tcttagttgg taaaccatcg 1320
gcaagccatg aggaattaat gactgcagcc aaacgggcat ttgctcacca tttcatcctt 1380
gagctcgaga acggttatga tacgttagtt ggtgaaaatg gttcaatgtt atcgggtggc 1440
caaaaacagc gtatcgcctt agcacgtgca tttttaaagg atgccccaat cttaatctta 1500
gatgaagcaa cgagcgcatt agatgcaaat tcggagcagt taatccagca agccttagag 1560
gaattattta aagggaaaac ggtgatcatc atcgctcatc ggttttcgac gatcaagcac 1620
gccgaccgta tctttgtatt taaatcgggt gagatcatcg aagaaggcac gcatgactta 1680
ctctgcgaag ggaaaggttt atacgaagaa ctctacgcca aacagagcta g 1731
<210> 84
<211> 576
<212> PRT
<213> Verrucomicrobia bacterium CG1_02_43_26
<400> 84
Met Lys Lys Leu Phe Pro Tyr Leu Val Tyr Leu Lys Asp Val Lys Met
1 5 10 15
Ala Phe Ile Leu Ala Ile Leu Ala Gly Ile Phe Tyr Gly Ala Ser Thr
20 25 30
Gly Leu Gly Ile Pro Val Leu Ile Arg Tyr Leu Tyr Pro Lys Ile Phe
35 40 45
Ser Asn Glu Ala Ile Ser Val Met Thr Leu Thr Leu Ile Cys Thr Leu
50 55 60
Pro Val Ile Val Ser Ala Phe Arg Ala Gly Gly Asn Phe Leu Asn Ser
65 70 75 80
Tyr Tyr Leu Ser Tyr Cys Gly Gln Tyr Ile Leu Gln Gln Leu Arg Ile
85 90 95
Lys Val Phe Ala Lys Ile Gln Asn Leu Pro Ile Ala Phe Phe His Lys
100 105 110
Arg Gln Pro Gly Asp Leu Ile Ser Arg Val Ser Asn Asp Thr Thr Ile
115 120 125
Leu Gln Gln Thr Ile Ile Asn Ala Ser Gln Glu Ile Leu Lys Gln Pro
130 135 140
Ile Thr Leu Leu Gly Ala Val Ser Tyr Ile Val Tyr Met Cys Phe Gln
145 150 155 160
Gln Ser Asp Val Val Phe Leu Ile Ile Phe Ile Leu Ala Ile Pro Leu
165 170 175
Cys Ile Val Pro Ile Arg Tyr Ile Gly Ile Lys Met Arg Asn Lys Ala
180 185 190
Arg Ala Met Gln Glu Gln Thr Ser Glu Leu Thr His Arg Leu Ala Gln
195 200 205
Asn Leu Ser Ala Val Lys Glu Ile Arg Ser Phe Cys Leu Glu Glu Tyr
210 215 220
Glu Leu Ser Arg Tyr Glu Ala Val Cys His Val Leu Arg Glu Arg Phe
225 230 235 240
Leu Lys Val Val Lys Tyr Thr Ser Ile Leu Ser Pro Ser Ile Glu Val
245 250 255
Ile Ala Ser Phe Gly Val Ala Met Ala Phe Trp Tyr Ser Tyr Lys Ser
260 265 270
Lys Ile Glu Pro Asp Val Phe Ile Ser Ile Val Gly Ala Leu Tyr Leu
275 280 285
Ser Tyr Glu Pro Ile Lys Lys Leu Gly Arg Leu Asn Ser Glu Met Gln
290 295 300
Gln Gly Leu Ala Ser Leu Glu Arg Leu Glu Asn Ile Leu Glu Glu Pro
305 310 315 320
Ile Thr Ile His Asp Pro Ala Val Pro His Pro Val Gly Lys Leu Glu
325 330 335
Gly Asn Ile Gln Phe Lys Asn Val Ser Phe Ala Tyr Glu Met Ala Pro
340 345 350
Val Leu Arg Asp Val Thr Val His Leu Thr Ala Lys Lys Thr Tyr Ala
355 360 365
Leu Val Gly Pro Ser Gly Ala Gly Lys Thr Thr Phe Ala His Leu Ile
370 375 380
Pro Arg Phe Tyr Asp Leu Ala Glu Gly Asn Gly Ser Ile Thr Ile Asp
385 390 395 400
Gly Ile Asn Ile Lys Asp Met Arg Leu Lys Asp Leu Arg Gln Asn Ile
405 410 415
Ala Leu Val Ser Gln Asp Pro Val Leu Phe Asn Asp Thr Ile Tyr Asn
420 425 430
Asn Ile Leu Val Gly Lys Pro Ser Ala Ser His Glu Glu Leu Met Thr
435 440 445
Ala Ala Lys Arg Ala Phe Ala His His Phe Ile Leu Glu Leu Glu Asn
450 455 460
Gly Tyr Asp Thr Leu Val Gly Glu Asn Gly Ser Met Leu Ser Gly Gly
465 470 475 480
Gln Lys Gln Arg Ile Ala Leu Ala Arg Ala Phe Leu Lys Asp Ala Pro
485 490 495
Ile Leu Ile Leu Asp Glu Ala Thr Ser Ala Leu Asp Ala Asn Ser Glu
500 505 510
Gln Leu Ile Gln Gln Ala Leu Glu Glu Leu Phe Lys Gly Lys Thr Val
515 520 525
Ile Ile Ile Ala His Arg Phe Ser Thr Ile Lys His Ala Asp Arg Ile
530 535 540
Phe Val Phe Lys Ser Gly Glu Ile Ile Glu Glu Gly Thr His Asp Leu
545 550 555 560
Leu Cys Glu Gly Lys Gly Leu Tyr Glu Glu Leu Tyr Ala Lys Gln Ser
565 570 575
<210> 85
<211> 1671
<212> DNA
<213> Brachyspira hampsonii P280/1
<400> 85
atgctcttga ctctgtcttt ctaccttgtt ggcggttttg gactgttcat gtatgggctt 60
aaggtattct cggatggact gcaggagtcg acggagaatg ctctcaagga catcctgcac 120
aaggtcacgc agaacaagat cttagggatc tcgttgggct tcctgatcac cgcgatcgta 180
cagtcaagtt cggcggtcac cgtaatgacg gtttcgttcg ttaatgccaa tttgctgact 240
ttgtcgcagg caattaacat catccttggg gctaacatcg gcacgacggt cacggggtgg 300
atcatctcac tgaacatcga cgtcttagct ctgccatccc tcggaatcgg gtccatcatc 360
gtcatctttg gcagtgaaaa tcgtaagttg cgtttctttg gcgagatcct catgggattc 420
ggaatgatct tttacgggct gatcctgatg aaaacagcgt tcgagggtgt tcgtggctct 480
gaggacttcg agaaggtgtt cttaatcgcc aatgccgaca caatgtatgg tcgtttctta 540
tgtgttgtta tcgggatggt cgtaactgct atcatccaat cgagctccgc ggcccttggc 600
gtaacgatct cgctcgcatc cgtgggcctt atcgattacc ccactggcgt cgctctcatc 660
ctcggacaaa acatcggcac gactattacg gccgtattgg caacactggg tgctagcaca 720
aatgcaaagc gtgctgcttt ggtgcactgt ttgttcaaca tcttcggcgt tatctacatg 780
ttcttcctgt ttccgtacta catcaagctg gtcgacatca ttgtgggttt catgaacatc 840
ggggacccca atctggtcgt aaacaacaaa tacgttaaca tctcattcta catcgcagcc 900
gcgcacacca tgttcaacat tatcaatgtc atcgttttct actttctcac agagaagctc 960
gagaaaatcg tttgttttat tattaaggac aaagaggacg agaaacacgt gtccgtcttg 1020
tcagacaagc tgcttaacat gccagtttct gctgagatcg aggtccgtaa ggaagtaaca 1080
tacatgggag acattgcaaa gaaaatgctg gcgcgtatcg aacaactttt cgacaatcct 1140
tccgagcgtc tgctgactaa aatccgtgac cacgagaaga tgctggacaa cacggaccag 1200
gagattcacg ccttcttgct caagttactg ggcaagaaca cgttaaactc cgcaaacatt 1260
gcttcactca ttaacatctc aacatactac gaaaatcttg gcgacaatct taaggacttg 1320
ggtaaagcaa ttatcaaggg taatgagaag aaaacgagtt tcaatgagac tcaaaaggaa 1380
gatatcatca agatgctgca caacaacaag gacttcatcg actacctggc gggtctgatc 1440
ctggagtact actcacttaa caaggagaaa acttacgacg aagcaatgga gaagtaccac 1500
cagattaagg gtttctacta cgaggcccgt gagcgtcact acgacaatgt cgacaagtcg 1560
ttgatcccag cattgaatgc acacctgtat ggcgacgttc tggtctactt taatcgctcc 1620
atcggtaatc tggtcaacat tgtcgaggca atcacgggta aggacaagtg a 1671
<210> 86
<211> 556
<212> PRT
<213> Brachyspira hampsonii P280/1
<400> 86
Met Leu Leu Thr Leu Ser Phe Tyr Leu Val Gly Gly Phe Gly Leu Phe
1 5 10 15
Met Tyr Gly Leu Lys Val Phe Ser Asp Gly Leu Gln Glu Ser Thr Glu
20 25 30
Asn Ala Leu Lys Asp Ile Leu His Lys Val Thr Gln Asn Lys Ile Leu
35 40 45
Gly Ile Ser Leu Gly Phe Leu Ile Thr Ala Ile Val Gln Ser Ser Ser
50 55 60
Ala Val Thr Val Met Thr Val Ser Phe Val Asn Ala Asn Leu Leu Thr
65 70 75 80
Leu Ser Gln Ala Ile Asn Ile Ile Leu Gly Ala Asn Ile Gly Thr Thr
85 90 95
Val Thr Gly Trp Ile Ile Ser Leu Asn Ile Asp Val Leu Ala Leu Pro
100 105 110
Ser Leu Gly Ile Gly Ser Ile Ile Val Ile Phe Gly Ser Glu Asn Arg
115 120 125
Lys Leu Arg Phe Phe Gly Glu Ile Leu Met Gly Phe Gly Met Ile Phe
130 135 140
Tyr Gly Leu Ile Leu Met Lys Thr Ala Phe Glu Gly Val Arg Gly Ser
145 150 155 160
Glu Asp Phe Glu Lys Val Phe Leu Ile Ala Asn Ala Asp Thr Met Tyr
165 170 175
Gly Arg Phe Leu Cys Val Val Ile Gly Met Val Val Thr Ala Ile Ile
180 185 190
Gln Ser Ser Ser Ala Ala Leu Gly Val Thr Ile Ser Leu Ala Ser Val
195 200 205
Gly Leu Ile Asp Tyr Pro Thr Gly Val Ala Leu Ile Leu Gly Gln Asn
210 215 220
Ile Gly Thr Thr Ile Thr Ala Val Leu Ala Thr Leu Gly Ala Ser Thr
225 230 235 240
Asn Ala Lys Arg Ala Ala Leu Val His Cys Leu Phe Asn Ile Phe Gly
245 250 255
Val Ile Tyr Met Phe Phe Leu Phe Pro Tyr Tyr Ile Lys Leu Val Asp
260 265 270
Ile Ile Val Gly Phe Met Asn Ile Gly Asp Pro Asn Leu Val Val Asn
275 280 285
Asn Lys Tyr Val Asn Ile Ser Phe Tyr Ile Ala Ala Ala His Thr Met
290 295 300
Phe Asn Ile Ile Asn Val Ile Val Phe Tyr Phe Leu Thr Glu Lys Leu
305 310 315 320
Glu Lys Ile Val Cys Phe Ile Ile Lys Asp Lys Glu Asp Glu Lys His
325 330 335
Val Ser Val Leu Ser Asp Lys Leu Leu Asn Met Pro Val Ser Ala Glu
340 345 350
Ile Glu Val Arg Lys Glu Val Thr Tyr Met Gly Asp Ile Ala Lys Lys
355 360 365
Met Leu Ala Arg Ile Glu Gln Leu Phe Asp Asn Pro Ser Glu Arg Leu
370 375 380
Leu Thr Lys Ile Arg Asp His Glu Lys Met Leu Asp Asn Thr Asp Gln
385 390 395 400
Glu Ile His Ala Phe Leu Leu Lys Leu Leu Gly Lys Asn Thr Leu Asn
405 410 415
Ser Ala Asn Ile Ala Ser Leu Ile Asn Ile Ser Thr Tyr Tyr Glu Asn
420 425 430
Leu Gly Asp Asn Leu Lys Asp Leu Gly Lys Ala Ile Ile Lys Gly Asn
435 440 445
Glu Lys Lys Thr Ser Phe Asn Glu Thr Gln Lys Glu Asp Ile Ile Lys
450 455 460
Met Leu His Asn Asn Lys Asp Phe Ile Asp Tyr Leu Ala Gly Leu Ile
465 470 475 480
Leu Glu Tyr Tyr Ser Leu Asn Lys Glu Lys Thr Tyr Asp Glu Ala Met
485 490 495
Glu Lys Tyr His Gln Ile Lys Gly Phe Tyr Tyr Glu Ala Arg Glu Arg
500 505 510
His Tyr Asp Asn Val Asp Lys Ser Leu Ile Pro Ala Leu Asn Ala His
515 520 525
Leu Tyr Gly Asp Val Leu Val Tyr Phe Asn Arg Ser Ile Gly Asn Leu
530 535 540
Val Asn Ile Val Glu Ala Ile Thr Gly Lys Asp Lys
545 550 555
<210> 87
<211> 1923
<212> DNA
<213> Thermotoga maritima (strain ATCC 43589 / MSB8 / DSM 3109 / JCM 10099)
<400> 87
atggaagaac gcgaactgac gctgagcgac atattattga tgtttaaacg ccgttcaaag 60
ctgttttggt tagttttagt tttaacggta ttcgccacgg gaatctactt atttttagcc 120
acgcctcagt atgaagcata tgcccgtgtg aaagtctcta cgcagaaggg tatgcgccta 180
ggcttatcga tagaaggctt attaggcggc ctgtcgtcgc tgttaggagg cggcggctct 240
caggaagatg agatccagat catgctgtca cgccgaaata tcatcgccgt gatcgacgaa 300
ctggatttag ttcataaact gctggacgaa aaagacatcg agaaggccaa gaaaaacgga 360
ctgacggaag atgatttaaa actgagcctg tattcttata tggttgaaaa actgatcacg 420
gtagagccag tgaaaaactc ttcgatctta gaagtcaagg ttacgtggca tgaaccaaaa 480
ttagccgccg aaatcgccaa taaaatcgtt gaaaactata cgaagatctc tgaaaatatc 540
gccaagtcgc agttaggcgc caagatggac ttcctggaag agcaaatccc aaaggttgag 600
caagaactga aagaagccga atcgaaatta aaggtcttta aagagcagaa ccgcatatac 660
agcgttgaag cccagactca ggttttaatc gaccgttatg caagcttatt gcaaaagatg 720
gaagaagccc gcatcgccat ggaagccacg cagaaacaga gcgagttctt ctctaaagaa 780
ctgaaagatc tggacatcga aatcgagcag atcaaagact cgatcacgtt tgatccaatc 840
ataagccaac tgaaatcgaa tatgatcaat atacagatcg agttagcagg cctgatggaa 900
cgatatacgg agactaaccc agcagtggtg cagaaaaaag cagaactgca ggagactcag 960
aaacagctgg aaatcgagct gaaacgctta ctgacgtccc aggtgaagaa aacgggaaac 1020
ccagtctatg aagaagccct gtcatctctg atcaaggccg agtctgagaa aatcttatac 1080
cagagccagt atgaagcctt taagaaactg tatgaggaca tggaaaaaga attatcaaaa 1140
ttaccagaac tggaacagaa attaatcgaa ctggaacgcg actataaggt gaaagaaacg 1200
atctatacga cgttattgca ggccaagtat gagagcctga tctcggaagc cgccatcacg 1260
gccaacgcca acgtcatcga ctgggccgtg ccaccattag aaccatcgaa accaaataaa 1320
aaactgacgc tggccatagg cggcgtttta ggaatctttt taggcatcct ggcagtgttc 1380
ttcgccgagt tttcagaccg ccgtatcaag agcgaatctg aagccgagta cttattagga 1440
ttagaaaaga tcgtcgcccg cgttccacta acgcagaacg aagaagtgat ggaaaaagcc 1500
ttaggcatcc cagccgtgaa atcaggcaag gttacgttta tcacggccct ggaagatggc 1560
gccggcgtgt cgacgctggc caaacatatg gccaaattac tgtcaaagaa ggaaaaggta 1620
ctactgttaa cggaagaaaa agtggaagga acttttgacc gcaaagacgt ttttgactta 1680
ttaaaaaatc cagacgttct ggaagaatta aaagagagat atgacaaaat catcgttgac 1740
gcaccatcgt taaagcgtac gccagacttc ctgccaatag ccgaaaagtc ggacacggtc 1800
tatatcgtga tccgattaga acatacgctg tcggaagatt taaaaacgct gcatactttg 1860
aagaagatcg acggttttat cttaaacgga ttaacgaaga aaaattcaac gtacgtggaa 1920
taa 1923
<210> 88
<211> 640
<212> PRT
<213> Thermotoga maritima (strain ATCC 43589 / MSB8 / DSM 3109 / JCM 10099)
<400> 88
Met Glu Glu Arg Glu Leu Thr Leu Ser Asp Ile Leu Leu Met Phe Lys
1 5 10 15
Arg Arg Ser Lys Leu Phe Trp Leu Val Leu Val Leu Thr Val Phe Ala
20 25 30
Thr Gly Ile Tyr Leu Phe Leu Ala Thr Pro Gln Tyr Glu Ala Tyr Ala
35 40 45
Arg Val Lys Val Ser Thr Gln Lys Gly Met Arg Leu Gly Leu Ser Ile
50 55 60
Glu Gly Leu Leu Gly Gly Leu Ser Ser Leu Leu Gly Gly Gly Gly Ser
65 70 75 80
Gln Glu Asp Glu Ile Gln Ile Met Leu Ser Arg Arg Asn Ile Ile Ala
85 90 95
Val Ile Asp Glu Leu Asp Leu Val His Lys Leu Leu Asp Glu Lys Asp
100 105 110
Ile Glu Lys Ala Lys Lys Asn Gly Leu Thr Glu Asp Asp Leu Lys Leu
115 120 125
Ser Leu Tyr Ser Tyr Met Val Glu Lys Leu Ile Thr Val Glu Pro Val
130 135 140
Lys Asn Ser Ser Ile Leu Glu Val Lys Val Thr Trp His Glu Pro Lys
145 150 155 160
Leu Ala Ala Glu Ile Ala Asn Lys Ile Val Glu Asn Tyr Thr Lys Ile
165 170 175
Ser Glu Asn Ile Ala Lys Ser Gln Leu Gly Ala Lys Met Asp Phe Leu
180 185 190
Glu Glu Gln Ile Pro Lys Val Glu Gln Glu Leu Lys Glu Ala Glu Ser
195 200 205
Lys Leu Lys Val Phe Lys Glu Gln Asn Arg Ile Tyr Ser Val Glu Ala
210 215 220
Gln Thr Gln Val Leu Ile Asp Arg Tyr Ala Ser Leu Leu Gln Lys Met
225 230 235 240
Glu Glu Ala Arg Ile Ala Met Glu Ala Thr Gln Lys Gln Ser Glu Phe
245 250 255
Phe Ser Lys Glu Leu Lys Asp Leu Asp Ile Glu Ile Glu Gln Ile Lys
260 265 270
Asp Ser Ile Thr Phe Asp Pro Ile Ile Ser Gln Leu Lys Ser Asn Met
275 280 285
Ile Asn Ile Gln Ile Glu Leu Ala Gly Leu Met Glu Arg Tyr Thr Glu
290 295 300
Thr Asn Pro Ala Val Val Gln Lys Lys Ala Glu Leu Gln Glu Thr Gln
305 310 315 320
Lys Gln Leu Glu Ile Glu Leu Lys Arg Leu Leu Thr Ser Gln Val Lys
325 330 335
Lys Thr Gly Asn Pro Val Tyr Glu Glu Ala Leu Ser Ser Leu Ile Lys
340 345 350
Ala Glu Ser Glu Lys Ile Leu Tyr Gln Ser Gln Tyr Glu Ala Phe Lys
355 360 365
Lys Leu Tyr Glu Asp Met Glu Lys Glu Leu Ser Lys Leu Pro Glu Leu
370 375 380
Glu Gln Lys Leu Ile Glu Leu Glu Arg Asp Tyr Lys Val Lys Glu Thr
385 390 395 400
Ile Tyr Thr Thr Leu Leu Gln Ala Lys Tyr Glu Ser Leu Ile Ser Glu
405 410 415
Ala Ala Ile Thr Ala Asn Ala Asn Val Ile Asp Trp Ala Val Pro Pro
420 425 430
Leu Glu Pro Ser Lys Pro Asn Lys Lys Leu Thr Leu Ala Ile Gly Gly
435 440 445
Val Leu Gly Ile Phe Leu Gly Ile Leu Ala Val Phe Phe Ala Glu Phe
450 455 460
Ser Asp Arg Arg Ile Lys Ser Glu Ser Glu Ala Glu Tyr Leu Leu Gly
465 470 475 480
Leu Glu Lys Ile Val Ala Arg Val Pro Leu Thr Gln Asn Glu Glu Val
485 490 495
Met Glu Lys Ala Leu Gly Ile Pro Ala Val Lys Ser Gly Lys Val Thr
500 505 510
Phe Ile Thr Ala Leu Glu Asp Gly Ala Gly Val Ser Thr Leu Ala Lys
515 520 525
His Met Ala Lys Leu Leu Ser Lys Lys Glu Lys Val Leu Leu Leu Thr
530 535 540
Glu Glu Lys Val Glu Gly Thr Phe Asp Arg Lys Asp Val Phe Asp Leu
545 550 555 560
Leu Lys Asn Pro Asp Val Leu Glu Glu Leu Lys Glu Arg Tyr Asp Lys
565 570 575
Ile Ile Val Asp Ala Pro Ser Leu Lys Arg Thr Pro Asp Phe Leu Pro
580 585 590
Ile Ala Glu Lys Ser Asp Thr Val Tyr Ile Val Ile Arg Leu Glu His
595 600 605
Thr Leu Ser Glu Asp Leu Lys Thr Leu His Thr Leu Lys Lys Ile Asp
610 615 620
Gly Phe Ile Leu Asn Gly Leu Thr Lys Lys Asn Ser Thr Tyr Val Glu
625 630 635 640
<210> 89
<211> 747
<212> DNA
<213> Clostridium sp. CAG:1013
<400> 89
atgtatgtgt tagaggcgtg tgtagatagc ctggatagcg cactggctgc aaaggaaggg 60
ggagcgaccc gcctggaatt gtgcgcgaat ttaattattg ggggcactac cccggcgctg 120
agcttagtgg aatgggtgaa aagagacact gcactgccag tccatgtact gctgcgccca 180
cgctttggtg attttttgta taccgaagaa gagttcagca tgatgctgga agatgccgcg 240
gcgctgctgg accgaggggc agatgcgatt gtgagcggat ttttgactcc agagggagat 300
ctggatctgt tgcggatgga aaagatggtt gaactgtgcc ataagagagg gaaacggttt 360
actcttcatc gagcgtttga cgcatgccgc gacccgtttc tggcattaga gcagtgccgc 420
gagttaggag tggacactgt gttgaccagc ggccagaaga atacctgcct ggaagggctt 480
ccgctgctga aggaactgtg ggaaaagaga ggagatgtgg aactgttgat aggggcagga 540
gtggacgcag aggcgatacg gcgcattcgg gaagagctgc cgcaggcgag aagctttcat 600
atgagcggca agaaagttgt ggagagcgca atgacttatc ggaaggacgg agtaagcatg 660
ggactgccgg cgttttcaga gtatactttg tggcgaactg acccagagaa attgcgggca 720
gcagggaaag agttaatgcg gcagtaa 747
<210> 90
<211> 248
<212> PRT
<213> Clostridium sp. CAG:1013
<400> 90
Met Tyr Val Leu Glu Ala Cys Val Asp Ser Leu Asp Ser Ala Leu Ala
1 5 10 15
Ala Lys Glu Gly Gly Ala Thr Arg Leu Glu Leu Cys Ala Asn Leu Ile
20 25 30
Ile Gly Gly Thr Thr Pro Ala Leu Ser Leu Val Glu Trp Val Lys Arg
35 40 45
Asp Thr Ala Leu Pro Val His Val Leu Leu Arg Pro Arg Phe Gly Asp
50 55 60
Phe Leu Tyr Thr Glu Glu Glu Phe Ser Met Met Leu Glu Asp Ala Ala
65 70 75 80
Ala Leu Leu Asp Arg Gly Ala Asp Ala Ile Val Ser Gly Phe Leu Thr
85 90 95
Pro Glu Gly Asp Leu Asp Leu Leu Arg Met Glu Lys Met Val Glu Leu
100 105 110
Cys His Lys Arg Gly Lys Arg Phe Thr Leu His Arg Ala Phe Asp Ala
115 120 125
Cys Arg Asp Pro Phe Leu Ala Leu Glu Gln Cys Arg Glu Leu Gly Val
130 135 140
Asp Thr Val Leu Thr Ser Gly Gln Lys Asn Thr Cys Leu Glu Gly Leu
145 150 155 160
Pro Leu Leu Lys Glu Leu Trp Glu Lys Arg Gly Asp Val Glu Leu Leu
165 170 175
Ile Gly Ala Gly Val Asp Ala Glu Ala Ile Arg Arg Ile Arg Glu Glu
180 185 190
Leu Pro Gln Ala Arg Ser Phe His Met Ser Gly Lys Lys Val Val Glu
195 200 205
Ser Ala Met Thr Tyr Arg Lys Asp Gly Val Ser Met Gly Leu Pro Ala
210 215 220
Phe Ser Glu Tyr Thr Leu Trp Arg Thr Asp Pro Glu Lys Leu Arg Ala
225 230 235 240
Ala Gly Lys Glu Leu Met Arg Gln
245
<210> 91
<211> 750
<212> DNA
<213> Odoribacter splanchnicus DSM 20712
<400> 91
atgcgacgtc aggattttaa aatagaagtc tgcacgaact cggttgagtc ggttcgagcg 60
gcgctcgctg gtggggcaga tcgtatagag ctctgcgcgg gcatgccaga gggcggcacg 120
acgccatcgt atggtgagat ctgcttagtt cgagagttaa tgccagcagg gatgcatgtt 180
atcgttcgtc cccgaggggg cgatttccta taccgtgagg atgaactcga agttatgtac 240
cgggatatag aaatggcacg aaaattaggt gtcgatggcg tcgtcttagg ttgcttaacg 300
cgtgaaggcg aagttgacga aggagtcatg cggaaattaa tggccgcgtg tggcgaaatg 360
tcggttacgt ttcaccgtgc gttcgatatg tgtcgtgatc catttcaggc gttgcagacg 420
atcgaaaagc ttgggtgcgc acgaatctta acgtcgggcc aatcgaactc ggccgaaact 480
ggcgttccat tattaaaaga attagttgcg cgtgcgcgta atgttatcat catgccaggg 540
tgcggagtca acgctgcgaa cgttcgtaag atcgcggaat ctacgggtgc gttcgaattc 600
catctctcgg cgcgtatccg gcttgggtct gatatggtct atcggaaccc ggccgtatca 660
atgggcggca cggttcaagt tgatgagtac ggccgtgaag tttcgtcgtc tgagaaagtt 720
gaagaagtta tccgtcggtt agagtactga 750
<210> 92
<211> 249
<212> PRT
<213> Odoribacter splanchnicus DSM 20712
<400> 92
Met Arg Arg Gln Asp Phe Lys Ile Glu Val Cys Thr Asn Ser Val Glu
1 5 10 15
Ser Val Arg Ala Ala Leu Ala Gly Gly Ala Asp Arg Ile Glu Leu Cys
20 25 30
Ala Gly Met Pro Glu Gly Gly Thr Thr Pro Ser Tyr Gly Glu Ile Cys
35 40 45
Leu Val Arg Glu Leu Met Pro Ala Gly Met His Val Ile Val Arg Pro
50 55 60
Arg Gly Gly Asp Phe Leu Tyr Arg Glu Asp Glu Leu Glu Val Met Tyr
65 70 75 80
Arg Asp Ile Glu Met Ala Arg Lys Leu Gly Val Asp Gly Val Val Leu
85 90 95
Gly Cys Leu Thr Arg Glu Gly Glu Val Asp Glu Gly Val Met Arg Lys
100 105 110
Leu Met Ala Ala Cys Gly Glu Met Ser Val Thr Phe His Arg Ala Phe
115 120 125
Asp Met Cys Arg Asp Pro Phe Gln Ala Leu Gln Thr Ile Glu Lys Leu
130 135 140
Gly Cys Ala Arg Ile Leu Thr Ser Gly Gln Ser Asn Ser Ala Glu Thr
145 150 155 160
Gly Val Pro Leu Leu Lys Glu Leu Val Ala Arg Ala Arg Asn Val Ile
165 170 175
Ile Met Pro Gly Cys Gly Val Asn Ala Ala Asn Val Arg Lys Ile Ala
180 185 190
Glu Ser Thr Gly Ala Phe Glu Phe His Leu Ser Ala Arg Ile Arg Leu
195 200 205
Gly Ser Asp Met Val Tyr Arg Asn Pro Ala Val Ser Met Gly Gly Thr
210 215 220
Val Gln Val Asp Glu Tyr Gly Arg Glu Val Ser Ser Ser Glu Lys Val
225 230 235 240
Glu Glu Val Ile Arg Arg Leu Glu Tyr
245
<210> 93
<211> 702
<212> DNA
<213> Mitsuaria sp. PDC51
<400> 93
atgactgggg ctccgttatt catcgaagtt atcgccttga ctgctcgcga cgcctgtgag 60
gcagaggcag ccggggcaga ccgtatcgag ttagtcagtg acatggcaca aggcggcctg 120
actccgtctg cccaggttgt ggacgaggta gtacgtcaat gtcgcttgcc tgtcatggta 180
atggtccgtc cgcacgcccg cagcttctgt tacgacgagg cagacatgcg tcaagtacgt 240
gaaggggttg caatggtacg tgacgctggt gcccatggac ttgtctttgg ggcgttaaca 300
gctgatgggg acatcgaccg tgcagctctc gaccaagtct tacgttgggc ggatgggctt 360
cccttaacgt tccatcgtgc attcgacgag gcccgtgatc ccgtacgtgc cttctcagag 420
ctctcagctt atcgtggtgc cgtcacgcag ctgttgtcat ctggcggagc acctatcgca 480
gaagagggag cggaattact tgcacagctg gtaacgcgtt ggcgccttgg tgagggtgta 540
gagcctctgg ttggggcggg agttcacgca ggaaatttag cagcattaca tcgtcgtatc 600
ggtgcccgtc aataccacgt tgggagtgga gctcgcgccg gcggaagttt cgcctcaggg 660
atcgacgcag ctcgtatcgc tgcactccgc caagccttat ga 702
<210> 94
<211> 233
<212> PRT
<213> Mitsuaria sp. PDC51
<400> 94
Met Thr Gly Ala Pro Leu Phe Ile Glu Val Ile Ala Leu Thr Ala Arg
1 5 10 15
Asp Ala Cys Glu Ala Glu Ala Ala Gly Ala Asp Arg Ile Glu Leu Val
20 25 30
Ser Asp Met Ala Gln Gly Gly Leu Thr Pro Ser Ala Gln Val Val Asp
35 40 45
Glu Val Val Arg Gln Cys Arg Leu Pro Val Met Val Met Val Arg Pro
50 55 60
His Ala Arg Ser Phe Cys Tyr Asp Glu Ala Asp Met Arg Gln Val Arg
65 70 75 80
Glu Gly Val Ala Met Val Arg Asp Ala Gly Ala His Gly Leu Val Phe
85 90 95
Gly Ala Leu Thr Ala Asp Gly Asp Ile Asp Arg Ala Ala Leu Asp Gln
100 105 110
Val Leu Arg Trp Ala Asp Gly Leu Pro Leu Thr Phe His Arg Ala Phe
115 120 125
Asp Glu Ala Arg Asp Pro Val Arg Ala Phe Ser Glu Leu Ser Ala Tyr
130 135 140
Arg Gly Ala Val Thr Gln Leu Leu Ser Ser Gly Gly Ala Pro Ile Ala
145 150 155 160
Glu Glu Gly Ala Glu Leu Leu Ala Gln Leu Val Thr Arg Trp Arg Leu
165 170 175
Gly Glu Gly Val Glu Pro Leu Val Gly Ala Gly Val His Ala Gly Asn
180 185 190
Leu Ala Ala Leu His Arg Arg Ile Gly Ala Arg Gln Tyr His Val Gly
195 200 205
Ser Gly Ala Arg Ala Gly Gly Ser Phe Ala Ser Gly Ile Asp Ala Ala
210 215 220
Arg Ile Ala Ala Leu Arg Gln Ala Leu
225 230
<210> 95
<211> 678
<212> DNA
<213> Prevotella intermedia ATCC 25611 (DSM 20706)
<400> 95
atgcccattc tagaagtgtg cacgggcagc ttgcagagcg tgatgaacgc agttaaaggc 60
ggcgcgcaac gtattgaact gtgttcagca ttaagcctgg atggcttaac gccgagcttg 120
ggcctgatta aaactgttcg tacgttattt ccggaattaa ccatccatgc gctgatacgt 180
gttcgtgaag gcgacttctg ttataccgaa gaagaagtaa aagcgatgga aaccgatatc 240
aaagcagttc tgccgtatgc agacgctatc gtgtgcggcg cgcttaccgc ggacggcgat 300
attgatatcg cgaccacgcg tcggttaatc gatgcatgcg aaggcaaacc gtttactttt 360
catcgtgctt tcgacgtgtg ccgtaacccg ttaaaagcgt tagatgaatt agcggcgctt 420
cattgcacgc gtgttttaac gagcggccag accccgactg cagaagcggg cattccggcg 480
ttgaaagaat acgttaaaca tactgaaggc cgtatgacca tattgccggg cggcggcgtg 540
actccgttaa atgctaagaa gattttagcg gaaacgggag caaccgagat tcatggaagc 600
gcgagcggca ttgcggaaaa cggccgtaaa gaaactctga ccgaagttgt tgcgcaaatc 660
ctgcaggaaa ttaaataa 678
<210> 96
<211> 225
<212> PRT
<213> Prevotella intermedia ATCC 25611 (DSM 20706)
<400> 96
Met Pro Ile Leu Glu Val Cys Thr Gly Ser Leu Gln Ser Val Ile Asn
1 5 10 15
Ala Val Lys Gly Gly Ala Gln Arg Ile Glu Leu Cys Ser Ala Leu Ser
20 25 30
Leu Asp Gly Leu Thr Pro Ser Leu Gly Leu Ile Lys Thr Val Arg Thr
35 40 45
Leu Phe Pro Glu Leu Thr Ile His Ala Leu Ile Arg Val Arg Glu Gly
50 55 60
Asp Phe Cys Tyr Thr Glu Glu Glu Val Lys Ala Met Glu Thr Asp Ile
65 70 75 80
Lys Ala Val Leu Pro Tyr Ala Asp Ala Ile Val Cys Gly Ala Leu Thr
85 90 95
Thr Asp Gly Asp Ile Asp Ile Ala Thr Thr Arg Arg Leu Ile Asp Ala
100 105 110
Cys Glu Gly Lys Pro Phe Thr Phe His Arg Ala Phe Asp Val Cys Arg
115 120 125
Asn Pro Leu Lys Ala Leu Asp Glu Leu Ala Val Leu Asn Cys Thr Arg
130 135 140
Val Leu Thr Ser Gly Gln Ala Thr Thr Ala Glu Ala Gly Ile Pro Ala
145 150 155 160
Leu Lys Glu Tyr Ile Lys His Thr Glu Gly His Met Thr Ile Leu Pro
165 170 175
Gly Gly Gly Val Thr Pro Leu Asn Ala Lys Lys Ile Ile Ala Glu Thr
180 185 190
Gly Ala Thr Glu Ile His Gly Ser Ala Ser Gly Met Thr Glu Ser Gly
195 200 205
Arg Lys Glu Thr Leu Thr Glu Val Val Val Gln Ile Leu Gln Glu Ile
210 215 220
Lys
225
<210> 97
<211> 1719
<212> DNA
<213> Actinobaculum suis DSM 20639
<400> 97
atgggcaaat ctcaagaaag cattagcttt aaagagaaat tcgcttacgg tatgggtgac 60
gctgccactg cctttagtgc agtaagcgtt gccagcttct caatgtttta tttcactgat 120
tacgtaggcg tgagtgcgac cgctctcggc acggtgctga tcttcacgcg cgttttcgat 180
gcaatcacca acattattat gggttacgtt gtggaccaga ctcgtaccaa agagggtaaa 240
gcacgtccct gggttaaatg ggcaatcctg cccatgtttg cagctctggt tgcggtcttt 300
gcaattccaa cgggaatgtc ctctaccgca accattgtat ggattacgat tgtggtgaac 360
atctactact tggtctacac tattagcaac atcccctatg ggacccttgg gaccctgatc 420
tcacgtgatc cacaggttcg ctccgagctc acgctgctgc gtatgattgg ataccacgga 480
gtgagcatcc tgctgtcctt tatcacggtc ggtttggttg cctacctggg tggtgggagc 540
aaccgtggct ggatctacac catggttatc tatggtgcca ttatgtcgat tatcttctac 600
tttacctaca gttgtacacg tgagcgcgtc cgctcaacga gtgagatgcg ccgtgatgcc 660
gaacgtgctg cggccgcaga gtccggtgcc gcaaatagta caccacctaa tggtggtcct 720
gaggctggta cgggcacggc acctgcgaag tctgccggtg ctactggaac tgcgccggca 780
aaacctgctc cggcaaaacg tctgggaatc tttgccagca ttggtttgct gttccgtaac 840
aaatactgga tccttatttt cttgatcatg attctgactt ggatcttggt taacctgttt 900
ggtggtgtaa atgtctatta cgctcgtcac atccttggtg acgccaacta cgtcggtgtt 960
cttaacgcag catttacggg agcgcaaatc gtaggtttct ttctggtgag tattcctatc 1020
cgccgctttg gtcgccgccg tactattgta ttcgggcttg ggatgatcat cgtgggctct 1080
ttactggtcc tgacggggcc ccagaacatc tacgtcctgg ctgtagcaag catcatccgt 1140
ggactcggct tttctcctct catgggtact gcatacgcca tgctcgcgga tgtgattgac 1200
tacggtgagt ggaagaatgg tgtccgcaat gaggggatct cttattctgg tggtaccttt 1260
tctaccactg tggggagtgg attggccagc tcggggatcg tctggatcat gggtgcggcg 1320
ggatacatct cagcaaagga cgcagtccag cctgcatctg tactggagtc cattcagttc 1380
ctgttctcgt gggcacccgt tatcatcgca gcattgctgc tcgtactgtt ctacttctac 1440
gaccttgaca ccttctaccc cgagatcgcg cgtgaccttg aacaaggcat taccctgaaa 1500
gatcgtgaga aagatgccgc acgtcaggcg caccacgtgt cgggagttga gccggcgcac 1560
cctgatcacc accaaaacaa tcccgagagc cctgcgggaa gtactcagac tagcgcacag 1620
acaggaacgc agacttctac caaataccgt actgagaagg gcgggcagaa tcgtacaaat 1680
tacagtaccg agagtgaagc cggcaacgcg gttgaataa 1719
<210> 98
<211> 572
<212> PRT
<213> Actinobaculum suis DSM 20639
<400> 98
Met Gly Lys Ser Gln Glu Ser Ile Ser Phe Lys Glu Lys Phe Ala Tyr
1 5 10 15
Gly Met Gly Asp Ala Ala Thr Ala Phe Ser Ala Val Ser Val Ala Ser
20 25 30
Phe Ser Met Phe Tyr Phe Thr Asp Tyr Val Gly Val Ser Ala Thr Ala
35 40 45
Leu Gly Thr Val Leu Ile Phe Thr Arg Val Phe Asp Ala Ile Thr Asn
50 55 60
Ile Ile Met Gly Tyr Val Val Asp Gln Thr Arg Thr Lys Glu Gly Lys
65 70 75 80
Ala Arg Pro Trp Val Lys Trp Ala Ile Leu Pro Met Phe Ala Ala Leu
85 90 95
Val Ala Val Phe Ala Ile Pro Thr Gly Met Ser Ser Thr Ala Thr Ile
100 105 110
Val Trp Ile Thr Ile Val Val Asn Ile Tyr Tyr Leu Val Tyr Thr Ile
115 120 125
Ser Asn Ile Pro Tyr Gly Thr Leu Gly Thr Leu Ile Ser Arg Asp Pro
130 135 140
Gln Val Arg Ser Glu Leu Thr Leu Leu Arg Met Ile Gly Tyr His Gly
145 150 155 160
Val Ser Ile Leu Leu Ser Phe Ile Thr Val Gly Leu Val Ala Tyr Leu
165 170 175
Gly Gly Gly Ser Asn Arg Gly Trp Ile Tyr Thr Met Val Ile Tyr Gly
180 185 190
Ala Ile Met Ser Ile Ile Phe Tyr Phe Thr Tyr Ser Cys Thr Arg Glu
195 200 205
Arg Val Arg Ser Thr Ser Glu Met Arg Arg Asp Ala Glu Arg Ala Ala
210 215 220
Ala Ala Glu Ser Gly Ala Ala Asn Ser Thr Pro Pro Asn Gly Gly Pro
225 230 235 240
Glu Ala Gly Thr Gly Thr Ala Pro Ala Lys Ser Ala Gly Ala Thr Gly
245 250 255
Thr Ala Pro Ala Lys Pro Ala Pro Ala Lys Arg Leu Gly Ile Phe Ala
260 265 270
Ser Ile Gly Leu Leu Phe Arg Asn Lys Tyr Trp Ile Leu Ile Phe Leu
275 280 285
Ile Met Ile Leu Thr Trp Ile Leu Val Asn Leu Phe Gly Gly Val Asn
290 295 300
Val Tyr Tyr Ala Arg His Ile Leu Gly Asp Ala Asn Tyr Val Gly Val
305 310 315 320
Leu Asn Ala Ala Phe Thr Gly Ala Gln Ile Val Gly Phe Phe Leu Val
325 330 335
Ser Ile Pro Ile Arg Arg Phe Gly Arg Arg Arg Thr Ile Val Phe Gly
340 345 350
Leu Gly Met Ile Ile Val Gly Ser Leu Leu Val Leu Thr Gly Pro Gln
355 360 365
Asn Ile Tyr Val Leu Ala Val Ala Ser Ile Ile Arg Gly Leu Gly Phe
370 375 380
Ser Pro Leu Met Gly Thr Ala Tyr Ala Met Leu Ala Asp Val Ile Asp
385 390 395 400
Tyr Gly Glu Trp Lys Asn Gly Val Arg Asn Glu Gly Ile Ser Tyr Ser
405 410 415
Gly Gly Thr Phe Ser Thr Thr Val Gly Ser Gly Leu Ala Ser Ser Gly
420 425 430
Ile Val Trp Ile Met Gly Ala Ala Gly Tyr Ile Ser Ala Lys Asp Ala
435 440 445
Val Gln Pro Ala Ser Val Leu Glu Ser Ile Gln Phe Leu Phe Ser Trp
450 455 460
Ala Pro Val Ile Ile Ala Ala Leu Leu Leu Val Leu Phe Tyr Phe Tyr
465 470 475 480
Asp Leu Asp Thr Phe Tyr Pro Glu Ile Ala Arg Asp Leu Glu Gln Gly
485 490 495
Ile Thr Leu Lys Asp Arg Glu Lys Asp Ala Ala Arg Gln Ala His His
500 505 510
Val Ser Gly Val Glu Pro Ala His Pro Asp His His Gln Asn Asn Pro
515 520 525
Glu Ser Pro Ala Gly Ser Thr Gln Thr Ser Ala Gln Thr Gly Thr Gln
530 535 540
Thr Ser Thr Lys Tyr Arg Thr Glu Lys Gly Gly Gln Asn Arg Thr Asn
545 550 555 560
Tyr Ser Thr Glu Ser Glu Ala Gly Asn Ala Val Glu
565 570
<210> 99
<211> 1362
<212> DNA
<213> Ruminococcus gnavus
<400> 99
atggagaaga aacgttatct caagtggtac aacaaagtgg gctacggctc tggtgacctg 60
gcagggaatg tcgtttacgc tttcttatct tcttttgtta tgctgtactt gacgaacact 120
gtcggcctta atccgggcat tattggaacc ctgattatgg tgtctaaact tttcgatggg 180
attagtgaca tgttcttcgg aaccatgatt gataagacaa agagtaagtt gggtaaggcc 240
cgtccgtgga tgttatacgc gtacattggc tgtgcggtta cactggttgc caacttcgca 300
attcctgatt ccttggggac gacggcgcaa tatgcctggt tcttcattgc ctatacactt 360
ttgaatgcgg ttttcttcac cgctaacaac attgcctacg catcactggt aactttctgt 420
acgaagaact ctcgtgagcg tgtggaaatg ggtagttggc gcttcatttt cgcattctct 480
acatcattac ttattcaatc cgtaacggta caattcgttc gtgcagctgg tggtggggca 540
gcggcatggc gtacggttgc tgtcgtttac gcaattattg gactgattgt caacacgatt 600
tcggttttct caattaagga acttccggaa gaggagttga aggcgggaaa ggatcatacg 660
gaagagaagt actcgctggt agaagcagca aagctgttat tcagtaacaa gtactacctg 720
atgatttgtg cgacctacat ctgtcagcaa atttacagcg cgatgttaaa catgggtatc 780
tactatatga tttacattct gaagaatgag aatttgtaca gcgtgttctc gtgggccatt 840
aacattccgg tgattattgc catgtgcatt acgccgatgc tcgtcgagaa aatgaagggc 900
ttgtaccgta tgaatctggc cggttacatt ctgggtacag caggacgtgt cggcgtaatt 960
ttcgcagggt acatgggctc agtaccgctt atgttggcct ttacggcagt cgctgccctg 1020
ggtatggcac cgtggcaagg tgatatggga gcagtggtag catcatgtag tgagtacacg 1080
tatctgacga agcacaagca tattgatggt actatgtaca gctgtacgtc tttcggaacg 1140
aagattggtg gtggtattgg ggttgctctg tgtggatggt tgctggacgc ctcagggttc 1200
gttaaggaag ccactattca acccgagtca tgccttaaca tgcttcacgt tatgtacttg 1260
tggattccga tggtactcag tctgattatt acgttcatta tgagtcgtat gaatgtcgag 1320
gacgccaatg agaaactgcg taagcaactg gaagaatgtt ga 1362
<210> 100
<211> 453
<212> PRT
<213> Ruminococcus gnavus
<400> 100
Met Glu Lys Lys Arg Tyr Leu Lys Trp Tyr Asn Lys Val Gly Tyr Gly
1 5 10 15
Ser Gly Asp Leu Ala Gly Asn Val Val Tyr Ala Phe Leu Ser Ser Phe
20 25 30
Val Met Leu Tyr Leu Thr Asn Thr Val Gly Leu Asn Pro Gly Ile Ile
35 40 45
Gly Thr Leu Ile Met Val Ser Lys Leu Phe Asp Gly Ile Ser Asp Met
50 55 60
Phe Phe Gly Thr Met Ile Asp Lys Thr Lys Ser Lys Leu Gly Lys Ala
65 70 75 80
Arg Pro Trp Met Leu Tyr Ala Tyr Ile Gly Cys Ala Val Thr Leu Val
85 90 95
Ala Asn Phe Ala Ile Pro Asp Ser Leu Gly Thr Thr Ala Gln Tyr Ala
100 105 110
Trp Phe Phe Ile Ala Tyr Thr Leu Leu Asn Ala Val Phe Phe Thr Ala
115 120 125
Asn Asn Ile Ala Tyr Ala Ser Leu Val Thr Phe Cys Thr Lys Asn Ser
130 135 140
Arg Glu Arg Val Glu Met Gly Ser Trp Arg Phe Ile Phe Ala Phe Ser
145 150 155 160
Thr Ser Leu Leu Ile Gln Ser Val Thr Val Gln Phe Val Arg Ala Ala
165 170 175
Gly Gly Gly Ala Ala Ala Trp Arg Thr Val Ala Val Val Tyr Ala Ile
180 185 190
Ile Gly Leu Ile Val Asn Thr Ile Ser Val Phe Ser Ile Lys Glu Leu
195 200 205
Pro Glu Glu Glu Leu Lys Ala Gly Lys Asp His Thr Glu Glu Lys Tyr
210 215 220
Ser Leu Val Glu Ala Ala Lys Leu Leu Phe Ser Asn Lys Tyr Tyr Leu
225 230 235 240
Met Ile Cys Ala Thr Tyr Ile Cys Gln Gln Ile Tyr Ser Ala Met Leu
245 250 255
Asn Met Gly Ile Tyr Tyr Met Ile Tyr Ile Leu Lys Asn Glu Asn Leu
260 265 270
Tyr Ser Val Phe Ser Trp Ala Ile Asn Ile Pro Val Ile Ile Ala Met
275 280 285
Cys Ile Thr Pro Met Leu Val Glu Lys Met Lys Gly Leu Tyr Arg Met
290 295 300
Asn Leu Ala Gly Tyr Ile Leu Gly Thr Ala Gly Arg Val Gly Val Ile
305 310 315 320
Phe Ala Gly Tyr Met Gly Ser Val Pro Leu Met Leu Ala Phe Thr Ala
325 330 335
Val Ala Ala Leu Gly Met Ala Pro Trp Gln Gly Asp Met Gly Ala Val
340 345 350
Val Ala Ser Cys Ser Glu Tyr Thr Tyr Leu Thr Lys His Lys His Ile
355 360 365
Asp Gly Thr Met Tyr Ser Cys Thr Ser Phe Gly Thr Lys Ile Gly Gly
370 375 380
Gly Ile Gly Val Ala Leu Cys Gly Trp Leu Leu Asp Ala Ser Gly Phe
385 390 395 400
Val Lys Glu Ala Thr Ile Gln Pro Glu Ser Cys Leu Asn Met Leu His
405 410 415
Val Met Tyr Leu Trp Ile Pro Met Val Leu Ser Leu Ile Ile Thr Phe
420 425 430
Ile Met Ser Arg Met Asn Val Glu Asp Ala Asn Glu Lys Leu Arg Lys
435 440 445
Gln Leu Glu Glu Cys
450
<210> 101
<211> 2061
<212> DNA
<213> Curtobacterium sp. 314Chir4.1
<400> 101
atgtcaactg cgaccgctcc agttgaagtg cagcgcggac ggcagtcgag cccggccggc 60
cagccaggga aaccgattat gagccatcgc cagattctgc tggtgattta tggcctgatg 120
gccggcatgt ttctgagcag cctggatcag accattgtgg ggaccgcgat tcgcaccatt 180
ggtgatgatc tgcatggcct ggatcagcag gcctgggtga ccaccgcgta tctgattgcg 240
tcgaccatta ccaccccgat ttatggcaaa ctgagcgatg tgtttgggcg ccggccgctg 300
tatatttttg gcattgcggt gtttattctg ggcagcctgc tgagcaccat gagcaccagc 360
atgattatgc tggccgcgtt tcgagcgttt cagggcattg gcgccggggc gctgatgagc 420
ctgccgctgg cgattatggg cgatattctg gcgccgcggg aacgcgcgaa atatcaaggg 480
tattttttag cggtgtttgg cattagcagc gtgattggcc cgctgattgg cgggctgttt 540
gcgggcgcga gctcgattct gggcattacc ggctggcgct gggtttttct gattaacgtg 600
ccgattggcg tggctgctct gctgatggtg attgcgtttc tgcatctgcc gaaatttggc 660
gatgcgaaag cgaaaccgcg cattgattgg tggggcgcga ccagcgtgat tgtgaccctg 720
gtgccgctgc tgttagtggc cgagcagggc cgcacctggg gctggggcag cgcgggcgcg 780
attgcgtgct atgtgattgg cgcgctgggc ctggttgcgt ttctggtgat tgaaaccctg 840
atgaaagatg atgcgattat tccgctgaaa ctgtttcgca gcggagtgtt tagcatggcg 900
accattctgg gctttttagt gggctttgcg atgtttggcg cgatgctgac cattccgctg 960
tatctgcaga ttgtgaccgg gctgaccccg accgaaagcg gctttgcgac cctgccgatg 1020
attggtgggc tgatgattgc gagcattgcg agcgggcaga ttgtggcgcg caccggcaaa 1080
tatcgtattt ttccggtgat tggcaccgcg ctggtgagca ttggctatgt ggtgctgacc 1140
tttatgacca ttgataaacc gctgtggttt ctgatgattg gcatgtttct gattggcctg 1200
ggcctgggcc agctgatgca gtcgattacc ctggcgagcc agaatagcgt gcagccgcgc 1260
gatatgggag tggcgacctc gagcgcgacc ttttttcgcc agattggggg aaccctgggc 1320
accgcggtgc tgctgtcggt gctgtttagc attatgccgg cgaatattct gcatgcgacc 1380
gcggatcaga aaaacctgtc gtcagcgctg gatgcggcgc tgaacccgac cgtggcgtcg 1440
gcgaaagcga accaaggagt gatggatcag atttggaacc cgattgtgac cccgattaaa 1500
cagcaagtgc agagcgggct ggatgcggcg accgcccagg tgactcaggc gaccgccggt 1560
gctccggaag cggtgcagca gcaggcgctg accgcggccg cggataaagc gcatgcgtcg 1620
gtgcaggatg gcaaactggt tgtggattgg agcgatagcg cgcagcgcac ctattgggtt 1680
gatgatctgg cgccgaccct gagcaaacag attgataaag gcacctcgga taaagctagc 1740
agctcgtcgg aaacctcgga taccagctat ctgaacggcg cggatagcgc gctaacccgt 1800
ccgtttatga ccggctttaa tagcagcgcg gtgaccgtgt attgggttgg ctttgcggtg 1860
attctgctgg cgtttattct gtcgtggttt tttaaagcgc cgccgctgcg caaatcgagc 1920
gctctgcagg aacaggccga taacgatcgc accgcggatg atttagaagt gcaggccgtg 1980
accgcggctg ataccatggg cagcccaacc gcgccagtga ccgggagcat tgcggtgcag 2040
cgtggcagca gcgatgattg a 2061
<210> 102
<211> 686
<212> PRT
<213> Curtobacterium sp. 314Chir4.1
<400> 102
Met Ser Thr Ala Thr Ala Pro Val Glu Val Gln Arg Gly Arg Gln Ser
1 5 10 15
Ser Pro Ala Gly Gln Pro Gly Lys Pro Ile Met Ser His Arg Gln Ile
20 25 30
Leu Leu Val Ile Tyr Gly Leu Met Ala Gly Met Phe Leu Ser Ser Leu
35 40 45
Asp Gln Thr Ile Val Gly Thr Ala Ile Arg Thr Ile Gly Asp Asp Leu
50 55 60
His Gly Leu Asp Gln Gln Ala Trp Val Thr Thr Ala Tyr Leu Ile Ala
65 70 75 80
Ser Thr Ile Thr Thr Pro Ile Tyr Gly Lys Leu Ser Asp Val Phe Gly
85 90 95
Arg Arg Pro Leu Tyr Ile Phe Gly Ile Ala Val Phe Ile Leu Gly Ser
100 105 110
Leu Leu Ser Thr Met Ser Thr Ser Met Ile Met Leu Ala Ala Phe Arg
115 120 125
Ala Phe Gln Gly Ile Gly Ala Gly Ala Leu Met Ser Leu Pro Leu Ala
130 135 140
Ile Met Gly Asp Ile Leu Ala Pro Arg Glu Arg Ala Lys Tyr Gln Gly
145 150 155 160
Tyr Phe Leu Ala Val Phe Gly Ile Ser Ser Val Ile Gly Pro Leu Ile
165 170 175
Gly Gly Leu Phe Ala Gly Ala Ser Ser Ile Leu Gly Ile Thr Gly Trp
180 185 190
Arg Trp Val Phe Leu Ile Asn Val Pro Ile Gly Val Ala Ala Leu Leu
195 200 205
Met Val Ile Ala Phe Leu His Leu Pro Lys Phe Gly Asp Ala Lys Ala
210 215 220
Lys Pro Arg Ile Asp Trp Trp Gly Ala Thr Ser Val Ile Val Thr Leu
225 230 235 240
Val Pro Leu Leu Leu Val Ala Glu Gln Gly Arg Thr Trp Gly Trp Gly
245 250 255
Ser Ala Gly Ala Ile Ala Cys Tyr Val Ile Gly Ala Leu Gly Leu Val
260 265 270
Ala Phe Leu Val Ile Glu Thr Leu Met Lys Asp Asp Ala Ile Ile Pro
275 280 285
Leu Lys Leu Phe Arg Ser Gly Val Phe Ser Met Ala Thr Ile Leu Gly
290 295 300
Phe Leu Val Gly Phe Ala Met Phe Gly Ala Met Leu Thr Ile Pro Leu
305 310 315 320
Tyr Leu Gln Ile Val Thr Gly Leu Thr Pro Thr Glu Ser Gly Phe Ala
325 330 335
Thr Leu Pro Met Ile Gly Gly Leu Met Ile Ala Ser Ile Ala Ser Gly
340 345 350
Gln Ile Val Ala Arg Thr Gly Lys Tyr Arg Ile Phe Pro Val Ile Gly
355 360 365
Thr Ala Leu Val Ser Ile Gly Tyr Val Val Leu Thr Phe Met Thr Ile
370 375 380
Asp Lys Pro Leu Trp Phe Leu Met Ile Gly Met Phe Leu Ile Gly Leu
385 390 395 400
Gly Leu Gly Gln Leu Met Gln Ser Ile Thr Leu Ala Ser Gln Asn Ser
405 410 415
Val Gln Pro Arg Asp Met Gly Val Ala Thr Ser Ser Ala Thr Phe Phe
420 425 430
Arg Gln Ile Gly Gly Thr Leu Gly Thr Ala Val Leu Leu Ser Val Leu
435 440 445
Phe Ser Ile Met Pro Ala Asn Ile Leu His Ala Thr Ala Asp Gln Lys
450 455 460
Asn Leu Ser Ser Ala Leu Asp Ala Ala Leu Asn Pro Thr Val Ala Ser
465 470 475 480
Ala Lys Ala Asn Gln Gly Val Met Asp Gln Ile Trp Asn Pro Ile Val
485 490 495
Thr Pro Ile Lys Gln Gln Val Gln Ser Gly Leu Asp Ala Ala Thr Ala
500 505 510
Gln Val Thr Gln Ala Thr Ala Gly Ala Pro Glu Ala Val Gln Gln Gln
515 520 525
Ala Leu Thr Ala Ala Ala Asp Lys Ala His Ala Ser Val Gln Asp Gly
530 535 540
Lys Leu Val Val Asp Trp Ser Asp Ser Ala Gln Arg Thr Tyr Trp Val
545 550 555 560
Asp Asp Leu Ala Pro Thr Leu Ser Lys Gln Ile Asp Lys Gly Thr Ser
565 570 575
Asp Lys Ala Ser Ser Ser Ser Glu Thr Ser Asp Thr Ser Tyr Leu Asn
580 585 590
Gly Ala Asp Ser Ala Leu Thr Arg Pro Phe Met Thr Gly Phe Asn Ser
595 600 605
Ser Ala Val Thr Val Tyr Trp Val Gly Phe Ala Val Ile Leu Leu Ala
610 615 620
Phe Ile Leu Ser Trp Phe Phe Lys Ala Pro Pro Leu Arg Lys Ser Ser
625 630 635 640
Ala Leu Gln Glu Gln Ala Asp Asn Asp Arg Thr Ala Asp Asp Leu Glu
645 650 655
Val Gln Ala Val Thr Ala Ala Asp Thr Met Gly Ser Pro Thr Ala Pro
660 665 670
Val Thr Gly Ser Ile Ala Val Gln Arg Gly Ser Ser Asp Asp
675 680 685
<210> 103
<211> 1665
<212> DNA
<213> Niabella drilacis DSM25811
<400> 103
atgtcgaaat tagactttat agtgatctgc gtttttgcga tcttaatggt aatcatcggg 60
ctggttttta cggctcaaag ctcgaaaagc tcgaaatcgt tttttgaggc aggcggctcg 120
actccatggt ggatcaacgg tctgtcgtta tttatctcgt atttctctgc cgccaccttt 180
gtggtgtggg gcagtatcgc gtataaacat ggtttagtgg cgaataccat acaatttacc 240
atgtgtttat cgggtatcgt gaccgcgctg tggatagccg gtcgttggaa gaaaacgggt 300
gcgacgacgg ccgcggaata cctgggtaaa cgatacggga aatcagcgaa acagtacttt 360
agctatatgg tgctgttata tagcctggtt tcgacggccg cgatacttta tgccgttggt 420
aagatcgttt atgtggcgac cccgttttct ttagaaacct gtatcatcgc gatcggtatc 480
actatcatcg tttatacgac gggtggaggc ttatggggag tgttagttac tgatgttgtg 540
caatttgtga tcttatcagc tgcggtaatc atcatcatcc cattatcttt atccgaagtt 600
ggtgggatga ctcagtttct gcaaaaaacg ccagaccgtt tctttgaccc agtgaacgat 660
gaatatacgt tcggttttat gtgctcgttc tttatatacc aggttgttta tatagcgggc 720
aattggtcgt atgtgcaacg gtatacttcg gtgtcctccg cgcggaacgc gaaaaaagtg 780
gcgtggcttt tctccgggtt atacctggtt gcaccaatca tctggatgct ccccccgatg 840
atctaccgtg taatcaatcc gggtctggat ggtgccggtg ccgaaggggc atatatgatg 900
ttatgccaaa aagtgttacc ggccgggtta ataggtctgg tgttatcagg gatgatcgct 960
gcgacgtcaa gcaaagccaa tacgaccatc aataccgctg ccatcatctt tgctcaggat 1020
atctataaag gtgttttctt taagcatacc tctgataaaa agcaaatact ggttgcgcgg 1080
atctttacta tattattcgg tgctgctacg gtgtttctgg ctatcttagt tccagctgcc 1140
gggggaatcg ttgaagtggt gttaagcact gcggctatcg ccgggggcag tttatttggg 1200
ccggtaatat tttcattatt ctcgcggcga caaacggaat cgtcgcttat cgttatctca 1260
atcgtatcag ttgttgtgtc gttattcttt aaagccctgg ctccatcgct gctggacatc 1320
aaattatcgc gtactgtgga aactatcctt ggtgttggtc tgccactggt gctgttagct 1380
ttcttcgaat tatatgctgc cataaaaggt ataaaagtgc catattttat caccgaagcc 1440
ggtgaaagcg ggctgtcacc ggatatcgaa tctgccaaac aaaatatatt cggtacccgg 1500
gtgatcgcgt ggtcggcagg gtttgttggt gttggtatca gcttattagg ttttctggcc 1560
gaaaatggtt cggttgcggt tgttgttggt gccggtatcg taatcatctc agcgttaatc 1620
ttaatccggc aaaaacgggc tgcggcagtt gccgggacct cgtga 1665
<210> 104
<211> 554
<212> PRT
<213> Niabella drilacis DSM25811
<400> 104
Met Ser Lys Leu Asp Phe Ile Val Ile Cys Val Phe Ala Ile Leu Met
1 5 10 15
Val Ile Ile Gly Leu Val Phe Thr Ala Gln Ser Ser Lys Ser Ser Lys
20 25 30
Ser Phe Phe Glu Ala Gly Gly Ser Thr Pro Trp Trp Ile Asn Gly Leu
35 40 45
Ser Leu Phe Ile Ser Tyr Phe Ser Ala Ala Thr Phe Val Val Trp Gly
50 55 60
Ser Ile Ala Tyr Lys His Gly Leu Val Ala Asn Thr Ile Gln Phe Thr
65 70 75 80
Met Cys Leu Ser Gly Ile Val Thr Ala Leu Trp Ile Ala Gly Arg Trp
85 90 95
Lys Lys Thr Gly Ala Thr Thr Ala Ala Glu Tyr Leu Gly Lys Arg Tyr
100 105 110
Gly Lys Ser Ala Lys Gln Tyr Phe Ser Tyr Met Val Leu Leu Tyr Ser
115 120 125
Leu Val Ser Thr Ala Ala Ile Leu Tyr Ala Val Gly Lys Ile Val Tyr
130 135 140
Val Ala Thr Pro Phe Ser Leu Glu Thr Cys Ile Ile Ala Ile Gly Ile
145 150 155 160
Thr Ile Ile Val Tyr Thr Thr Gly Gly Gly Leu Trp Gly Val Leu Val
165 170 175
Thr Asp Val Val Gln Phe Val Ile Leu Ser Ala Ala Val Ile Ile Ile
180 185 190
Ile Pro Leu Ser Leu Ser Glu Val Gly Gly Met Thr Gln Phe Leu Gln
195 200 205
Lys Thr Pro Asp Arg Phe Phe Asp Pro Val Asn Asp Glu Tyr Thr Phe
210 215 220
Gly Phe Met Cys Ser Phe Phe Ile Tyr Gln Val Val Tyr Ile Ala Gly
225 230 235 240
Asn Trp Ser Tyr Val Gln Arg Tyr Thr Ser Val Ser Ser Ala Arg Asn
245 250 255
Ala Lys Lys Val Ala Trp Leu Phe Ser Gly Leu Tyr Leu Val Ala Pro
260 265 270
Ile Ile Trp Met Leu Pro Pro Met Ile Tyr Arg Val Ile Asn Pro Gly
275 280 285
Leu Asp Gly Ala Gly Ala Glu Gly Ala Tyr Met Met Leu Cys Gln Lys
290 295 300
Val Leu Pro Ala Gly Leu Ile Gly Leu Val Leu Ser Gly Met Ile Ala
305 310 315 320
Ala Thr Ser Ser Lys Ala Asn Thr Thr Ile Asn Thr Ala Ala Ile Ile
325 330 335
Phe Ala Gln Asp Ile Tyr Lys Gly Val Phe Phe Lys His Thr Ser Asp
340 345 350
Lys Lys Gln Ile Leu Val Ala Arg Ile Phe Thr Ile Leu Phe Gly Ala
355 360 365
Ala Thr Val Phe Leu Ala Ile Leu Val Pro Ala Ala Gly Gly Ile Val
370 375 380
Glu Val Val Leu Ser Thr Ala Ala Ile Ala Gly Gly Ser Leu Phe Gly
385 390 395 400
Pro Val Ile Phe Ser Leu Phe Ser Arg Arg Gln Thr Glu Ser Ser Leu
405 410 415
Ile Val Ile Ser Ile Val Ser Val Val Val Ser Leu Phe Phe Lys Ala
420 425 430
Leu Ala Pro Ser Leu Leu Asp Ile Lys Leu Ser Arg Thr Val Glu Thr
435 440 445
Ile Leu Gly Val Gly Leu Pro Leu Val Leu Leu Ala Phe Phe Glu Leu
450 455 460
Tyr Ala Ala Ile Lys Gly Ile Lys Val Pro Tyr Phe Ile Thr Glu Ala
465 470 475 480
Gly Glu Ser Gly Leu Ser Pro Asp Ile Glu Ser Ala Lys Gln Asn Ile
485 490 495
Phe Gly Thr Arg Val Ile Ala Trp Ser Ala Gly Phe Val Gly Val Gly
500 505 510
Ile Ser Leu Leu Gly Phe Leu Ala Glu Asn Gly Ser Val Ala Val Val
515 520 525
Val Gly Ala Gly Ile Val Ile Ile Ser Ala Leu Ile Leu Ile Arg Gln
530 535 540
Lys Arg Ala Ala Ala Val Ala Gly Thr Ser
545 550
<210> 105
<211> 1539
<212> DNA
<213> Saccharicrinis fermentans DSM 9555 = JCM 21142
<400> 105
atgaaaaaag ttattacgtc aatcgggtta attgtgttat gcttaccggt tttatttgcg 60
caaagaccca cgattgcgtc agggcatttt agctcgctta actggattgt gctggttgtt 120
tttctggttg gtacgacggt ttttggagag ctggttaaaa ataaagataa gggcttaaac 180
ggcttctttc gtggcggcaa taacttacca tggtggacgg ttagcttatc attaatcgct 240
acgaaaacga gcgttgcgac gtttattgct gttcctgcct ttgttttttc acttcatggc 300
gatctgtcat atctgcaaat gacgtttggc tttgctttag gtaatatctt aatggtgttt 360
gttttactta aagagtatta tgaggatcat atctacagcc cttatgattt tattcagaac 420
cgtctgggca ttcgtgtgag ccaattaagc cgtacgttct ttatggttgg ggccacgatg 480
agccaaggcg tgcgtttact tggcacggcg cttgtgttaa gcgttattac gggtcagagc 540
acgatattat gcattggcat tattgcggcg tttgcggttg tttggtcgta tattggtggc 600
ataacgacgg tagtttggac ggatgctctg caatttgtta tctttatctt tggcgctctt 660
ttcgcccttt tttatgctat cggtgatatt ccgggcggac tgagcgagat gatcgtaatc 720
gccgatcaga aagcgaagct tacgctgctt gatttatcat tagatcctca taaaacgtat 780
actttatggg ttggcatttt aggttgcacg ttttttgagt ttggctcaaa cgccgtggat 840
caagtggtga cgcagagagc gctttgctgt cggaacctaa aagaagctcg taaagctgtt 900
ggatttagcg ttatcggagt agcgacgacg tggatcatgg cctttgttgg cattggcctg 960
gttgcgtact atcatataaa cccgttaagc ccagaaatca acgcgagcat ggttcaggaa 1020
ccagatcgta tttttccgta ttatgtggtg aattcattac cgaacggcat ttcgggttta 1080
attattgcgg ccatgtttgc ggccggcatc agcacgctag atagcgccct gacggcgtta 1140
tcgcaaacga gcgttatggg tgttggtagc attctgtttc cccgtctgaa gttcatgaat 1200
gaagataaag ttgtgaaaat tagcaagatg gcgattattg tgtggggagg gatcttagcc 1260
ctgttagcgt atggttttag cttctttcaa gatggcggct tattagcgct gggttttaaa 1320
gttcctgggt atgcgtacgg tacgttaata ggtattgcgt ttcttgctct gatgcgacgt 1380
ggcagcttta tgggcatttt aatggggagc ctgctggcga ttgcgtgcat cggatggatg 1440
catatggaag gcataagctt cttctggtgg ttcccagtgg gcgccttcgt tgtgattatg 1500
atggcgatct tttatgatat gatcgtgccg aaaaaataa 1539
<210> 106
<211> 512
<212> PRT
<213> Saccharicrinis fermentans DSM 9555 = JCM 21142
<400> 106
Met Lys Lys Val Ile Thr Ser Ile Gly Leu Ile Val Leu Cys Leu Pro
1 5 10 15
Val Leu Phe Ala Gln Arg Pro Thr Ile Ala Ser Gly His Phe Ser Ser
20 25 30
Leu Asn Trp Ile Val Leu Val Val Phe Leu Val Gly Thr Thr Val Phe
35 40 45
Gly Glu Leu Val Lys Asn Lys Asp Lys Gly Leu Asn Gly Phe Phe Arg
50 55 60
Gly Gly Asn Asn Leu Pro Trp Trp Thr Val Ser Leu Ser Leu Ile Ala
65 70 75 80
Thr Lys Thr Ser Val Ala Thr Phe Ile Ala Val Pro Ala Phe Val Phe
85 90 95
Ser Leu His Gly Asp Leu Ser Tyr Leu Gln Met Thr Phe Gly Phe Ala
100 105 110
Leu Gly Asn Ile Leu Met Val Phe Val Leu Leu Lys Glu Tyr Tyr Glu
115 120 125
Asp His Ile Tyr Ser Pro Tyr Asp Phe Ile Gln Asn Arg Leu Gly Ile
130 135 140
Arg Val Ser Gln Leu Ser Arg Thr Phe Phe Met Val Gly Ala Thr Met
145 150 155 160
Ser Gln Gly Val Arg Leu Leu Gly Thr Ala Leu Val Leu Ser Val Ile
165 170 175
Thr Gly Gln Ser Thr Ile Leu Cys Ile Gly Ile Ile Ala Ala Phe Ala
180 185 190
Val Val Trp Ser Tyr Ile Gly Gly Ile Thr Thr Val Val Trp Thr Asp
195 200 205
Ala Leu Gln Phe Val Ile Phe Ile Phe Gly Ala Leu Phe Ala Leu Phe
210 215 220
Tyr Ala Ile Gly Asp Ile Pro Gly Gly Leu Ser Glu Met Ile Val Ile
225 230 235 240
Ala Asp Gln Lys Ala Lys Leu Thr Leu Leu Asp Leu Ser Leu Asp Pro
245 250 255
His Lys Thr Tyr Thr Leu Trp Val Gly Ile Leu Gly Cys Thr Phe Phe
260 265 270
Glu Phe Gly Ser Asn Ala Val Asp Gln Val Val Thr Gln Arg Ala Leu
275 280 285
Cys Cys Arg Asn Leu Lys Glu Ala Arg Lys Ala Val Gly Phe Ser Val
290 295 300
Ile Gly Val Ala Thr Thr Trp Ile Met Ala Phe Val Gly Ile Gly Leu
305 310 315 320
Val Ala Tyr Tyr His Ile Asn Pro Leu Ser Pro Glu Ile Asn Ala Ser
325 330 335
Met Val Gln Glu Pro Asp Arg Ile Phe Pro Tyr Tyr Val Val Asn Ser
340 345 350
Leu Pro Asn Gly Ile Ser Gly Leu Ile Ile Ala Ala Met Phe Ala Ala
355 360 365
Gly Ile Ser Thr Leu Asp Ser Ala Leu Thr Ala Leu Ser Gln Thr Ser
370 375 380
Val Met Gly Val Gly Ser Ile Leu Phe Pro Arg Leu Lys Phe Met Asn
385 390 395 400
Glu Asp Lys Val Val Lys Ile Ser Lys Met Ala Ile Ile Val Trp Gly
405 410 415
Gly Ile Leu Ala Leu Leu Ala Tyr Gly Phe Ser Phe Phe Gln Asp Gly
420 425 430
Gly Leu Leu Ala Leu Gly Phe Lys Val Pro Gly Tyr Ala Tyr Gly Thr
435 440 445
Leu Ile Gly Ile Ala Phe Leu Ala Leu Met Arg Arg Gly Ser Phe Met
450 455 460
Gly Ile Leu Met Gly Ser Leu Leu Ala Ile Ala Cys Ile Gly Trp Met
465 470 475 480
His Met Glu Gly Ile Ser Phe Phe Trp Trp Phe Pro Val Gly Ala Phe
485 490 495
Val Val Ile Met Met Ala Ile Phe Tyr Asp Met Ile Val Pro Lys Lys
500 505 510
<210> 107
<211> 1413
<212> DNA
<213> Citrobacter freundii MGH152
<400> 107
atgactgaac ttcctgacag cacccgctgg caactttgga ttgtggcatt tggctttttt 60
atgcagtctc tggataccac catcgtcaat accgcgcttc cttctatggc caaaagcctt 120
ggggaaagcc cactgcatat gcatatggtc attgtgtctt atgtgcttac cgttgccgta 180
atgcttcctg ccagcggctg gctggctgat aaaatcggtg tgcgcaatat attcttcacc 240
gctatcattc tgtttacgct gggatctctt ttttgcgcct ggtcgggaac gctgaatgaa 300
ctggtgatgg ctcgcgtgct ccaaggtgta ggcggcgcga tgatggtgcc ggtcggcaga 360
ttgacggtga tgaaaatcgt cccacgcgag caatatatgg ccgcaatgac tttcgtcacc 420
ttgcctggtc agattggtcc acttctgggc ccggcactcg gcggcattct ggttgagtac 480
gcctcgtggc actggatctt tttgattaat attccggtag gcattgtcgg ggcaatagcg 540
acgctcatgc tgatgcctaa ctataccatg caaactcgcc gtttcgacct ttctggattc 600
atgatgctgg ctgtcggcat ggccgtactt accctcgcgc ttgatggttc aaagggaacc 660
ggcatttcgc atatcacgct ggcagcactg gttatctgtg gagtactggc gatcctgctg 720
tatctgaaac acgcccataa taaccctcgt gcactgttta gcctgcacct gtttcgtact 780
cataccttct ctctcggcct gtttggcagc tttgccggac ggattggtag cgggatgctc 840
ccgttcatga ccccggtatt cctgcagatt ggattgggct tttctccatt tcatgccggt 900
ttgatgatga tcccgatggt gctgggctca atgggaatga aacgcatcgt ggttcaggtc 960
gtcaaccggt ttggttaccg tcgcgtactg gtcaccacca cgcttggcct gtctatggtc 1020
agcttgttgc tgatgagcac cgcgctcctt ggttggtatt acgccctgcc gttcatactg 1080
ttcctccagg gaatggtcaa ttctacccgc ttctcgtcaa tgaatacgct gacgctaaaa 1140
gacctgccgg atgaccttgc gagcagcggc aatagcctgc tgtctatgat catgcaactg 1200
tctatgtcaa tcggagtaac catcgccggt ctgttgctcg gcatgttcgg gcagcaacat 1260
atcgccatcg acagcgcgtc tacgcatacc gtctttatgt atacctggct gtgcattgcg 1320
ttccttatcg cactgcctgc catcattttt gcccgcgtgc cggacgacac gcagaccaac 1380
gcggtgattt cacggcgcaa aaggtcaacc tga 1413
<210> 108
<211> 470
<212> PRT
<213> Citrobacter freundii MGH152
<400> 108
Met Thr Glu Leu Pro Asp Ser Thr Arg Trp Gln Leu Trp Ile Val Ala
1 5 10 15
Phe Gly Phe Phe Met Gln Ser Leu Asp Thr Thr Ile Val Asn Thr Ala
20 25 30
Leu Pro Ser Met Ala Lys Ser Leu Gly Glu Ser Pro Leu His Met His
35 40 45
Met Val Ile Val Ser Tyr Val Leu Thr Val Ala Val Met Leu Pro Ala
50 55 60
Ser Gly Trp Leu Ala Asp Lys Ile Gly Val Arg Asn Ile Phe Phe Thr
65 70 75 80
Ala Ile Ile Leu Phe Thr Leu Gly Ser Leu Phe Cys Ala Trp Ser Gly
85 90 95
Thr Leu Asn Glu Leu Val Met Ala Arg Val Leu Gln Gly Val Gly Gly
100 105 110
Ala Met Met Val Pro Val Gly Arg Leu Thr Val Met Lys Ile Val Pro
115 120 125
Arg Glu Gln Tyr Met Ala Ala Met Thr Phe Val Thr Leu Pro Gly Gln
130 135 140
Ile Gly Pro Leu Leu Gly Pro Ala Leu Gly Gly Ile Leu Val Glu Tyr
145 150 155 160
Ala Ser Trp His Trp Ile Phe Leu Ile Asn Ile Pro Val Gly Ile Val
165 170 175
Gly Ala Ile Ala Thr Leu Met Leu Met Pro Asn Tyr Thr Met Gln Thr
180 185 190
Arg Arg Phe Asp Leu Ser Gly Phe Met Met Leu Ala Val Gly Met Ala
195 200 205
Val Leu Thr Leu Ala Leu Asp Gly Ser Lys Gly Thr Gly Ile Ser His
210 215 220
Ile Thr Leu Ala Ala Leu Val Ile Cys Gly Val Leu Ala Ile Leu Leu
225 230 235 240
Tyr Leu Lys His Ala His Asn Asn Pro Arg Ala Leu Phe Ser Leu His
245 250 255
Leu Phe Arg Thr His Thr Phe Ser Leu Gly Leu Phe Gly Ser Phe Ala
260 265 270
Gly Arg Ile Gly Ser Gly Met Leu Pro Phe Met Thr Pro Val Phe Leu
275 280 285
Gln Ile Gly Leu Gly Phe Ser Pro Phe His Ala Gly Leu Met Met Ile
290 295 300
Pro Met Val Leu Gly Ser Met Gly Met Lys Arg Ile Val Val Gln Val
305 310 315 320
Val Asn Arg Phe Gly Tyr Arg Arg Val Leu Val Thr Thr Thr Leu Gly
325 330 335
Leu Ser Met Val Ser Leu Leu Leu Met Ser Thr Ala Leu Leu Gly Trp
340 345 350
Tyr Tyr Ala Leu Pro Phe Ile Leu Phe Leu Gln Gly Met Val Asn Ser
355 360 365
Thr Arg Phe Ser Ser Met Asn Thr Leu Thr Leu Lys Asp Leu Pro Asp
370 375 380
Asp Leu Ala Ser Ser Gly Asn Ser Leu Leu Ser Met Ile Met Gln Leu
385 390 395 400
Ser Met Ser Ile Gly Val Thr Ile Ala Gly Leu Leu Leu Gly Met Phe
405 410 415
Gly Gln Gln His Ile Ala Ile Asp Ser Ala Ser Thr His Thr Val Phe
420 425 430
Met Tyr Thr Trp Leu Cys Ile Ala Phe Leu Ile Ala Leu Pro Ala Ile
435 440 445
Ile Phe Ala Arg Val Pro Asp Asp Thr Gln Thr Asn Ala Val Ile Ser
450 455 460
Arg Arg Lys Arg Ser Thr
465 470
<210> 109
<211> 1413
<212> DNA
<213> Citrobacter werkmanii NBRC 105721
<400> 109
atgactgaac ttcctgacag cacccgctgg caactttgga ttgtggcttt cggctttttt 60
atgcagagtc tggataccac catcgtcaat accgcgcttc ctagtatggc cgccagcctt 120
ggggaaagcc cgttgcatat gcatatggtc attgtgtcat atgtattgac cgttgccgta 180
atgctgcctg ccagcggatg gttagcggac aaagttggcg tgcgcaatat cttcttcacc 240
gccatcatcc tgtttacgct tggcagtctg ttttgcgcct ggtcgagcac gcttaacgag 300
ctggtgatgg cgcgcgtctt gcaaggcgtt ggtggcgcga tgatggtgcc ggttggcaga 360
ctaacggtga tgaaaatcgt cccgcgtgag caatatatgg ccgcgatgac gtttgtcacg 420
ttgcctggcc agattggccc attgctgggt ccggcgttgg gcggcgttct ggttgagtat 480
gcctcgtggc actggatatt tttgctgaat attccggttg gcattgtcgg cgcgatagct 540
acgttgatgc tgatgcctaa ctataccatg caaacgcgac gcttcgatct tagtggattc 600
gcgatgctgg ccgtcggcat ggccgtgcta acgctggcgc ttgatggctc taaagggacc 660
ggcatctcgg gtatcacgtt agcggtgctg gttatctgcg gagcgttggc tattgcgcta 720
tatctgaaac acgcccatcg taatccacgc gcgctgtttt ctctgaatct gtttcatact 780
ccaaccttca gtttgggtct gcttggctct tttgccgggc gcatcggcag cggtatgctg 840
ccgtttatga cgccagtgtt tttgcagatt gggcttggtt tttcaccttt tcatgccggg 900
ctgatgatgg tcccgatggt gcttggctct atgggcatga agcgcatcgt ggtccaggtc 960
gttaaccgct ttggctaccg ccgcgtactg gtcactacta cgcttggcct gtctctggtc 1020
agcctgttgc tgatgaccac cgcgctgctt ggctggtatt acgccctgcc ttttgtgctg 1080
ttcttgcaag ggatggtcaa ctcaacgcgt ttttcatcga tgaataccct tactcttaaa 1140
gacctgccag acgatcttgc cagcagcggc aatagcctgc tgagtatgat catgcaattg 1200
agtatgtcta tcggagtgac tatcgctggc ctgttgctag gcatgtttgg tcagcagcat 1260
atcgctatcg acagcggctc tacgcatacc gtctttatgt atacctggct gtgcattgct 1320
ttcattattg ctctgcctgc cattattttt gcccgcgtgc cgaacgacac gcaaactaac 1380
gcggtgatct cacggcgcaa aaggagcacc tga 1413
<210> 110
<211> 470
<212> PRT
<213> Citrobacter werkmanii NBRC 105721
<400> 110
Met Thr Glu Leu Pro Asp Ser Thr Arg Trp Gln Leu Trp Ile Val Ala
1 5 10 15
Phe Gly Phe Phe Met Gln Ser Leu Asp Thr Thr Ile Val Asn Thr Ala
20 25 30
Leu Pro Ser Met Ala Ala Ser Leu Gly Glu Ser Pro Leu His Met His
35 40 45
Met Val Ile Val Ser Tyr Val Leu Thr Val Ala Val Met Leu Pro Ala
50 55 60
Ser Gly Trp Leu Ala Asp Lys Val Gly Val Arg Asn Ile Phe Phe Thr
65 70 75 80
Ala Ile Ile Leu Phe Thr Leu Gly Ser Leu Phe Cys Ala Trp Ser Ser
85 90 95
Thr Leu Asn Glu Leu Val Met Ala Arg Val Leu Gln Gly Val Gly Gly
100 105 110
Ala Met Met Val Pro Val Gly Arg Leu Thr Val Met Lys Ile Val Pro
115 120 125
Arg Glu Gln Tyr Met Ala Ala Met Thr Phe Val Thr Leu Pro Gly Gln
130 135 140
Ile Gly Pro Leu Leu Gly Pro Ala Leu Gly Gly Val Leu Val Glu Tyr
145 150 155 160
Ala Ser Trp His Trp Ile Phe Leu Leu Asn Ile Pro Val Gly Ile Val
165 170 175
Gly Ala Ile Ala Thr Leu Met Leu Met Pro Asn Tyr Thr Met Gln Thr
180 185 190
Arg Arg Phe Asp Leu Ser Gly Phe Ala Met Leu Ala Val Gly Met Ala
195 200 205
Val Leu Thr Leu Ala Leu Asp Gly Ser Lys Gly Thr Gly Ile Ser Gly
210 215 220
Ile Thr Leu Ala Val Leu Val Ile Cys Gly Ala Leu Ala Ile Ala Leu
225 230 235 240
Tyr Leu Lys His Ala His Arg Asn Pro Arg Ala Leu Phe Ser Leu Asn
245 250 255
Leu Phe His Thr Pro Thr Phe Ser Leu Gly Leu Leu Gly Ser Phe Ala
260 265 270
Gly Arg Ile Gly Ser Gly Met Leu Pro Phe Met Thr Pro Val Phe Leu
275 280 285
Gln Ile Gly Leu Gly Phe Ser Pro Phe His Ala Gly Leu Met Met Val
290 295 300
Pro Met Val Leu Gly Ser Met Gly Met Lys Arg Ile Val Val Gln Val
305 310 315 320
Val Asn Arg Phe Gly Tyr Arg Arg Val Leu Val Thr Thr Thr Leu Gly
325 330 335
Leu Ser Leu Val Ser Leu Leu Leu Met Thr Thr Ala Leu Leu Gly Trp
340 345 350
Tyr Tyr Ala Leu Pro Phe Val Leu Phe Leu Gln Gly Met Val Asn Ser
355 360 365
Thr Arg Phe Ser Ser Met Asn Thr Leu Thr Leu Lys Asp Leu Pro Asp
370 375 380
Asp Leu Ala Ser Ser Gly Asn Ser Leu Leu Ser Met Ile Met Gln Leu
385 390 395 400
Ser Met Ser Ile Gly Val Thr Ile Ala Gly Leu Leu Leu Gly Met Phe
405 410 415
Gly Gln Gln His Ile Ala Ile Asp Ser Gly Ser Thr His Thr Val Phe
420 425 430
Met Tyr Thr Trp Leu Cys Ile Ala Phe Ile Ile Ala Leu Pro Ala Ile
435 440 445
Ile Phe Ala Arg Val Pro Asn Asp Thr Gln Thr Asn Ala Val Ile Ser
450 455 460
Arg Arg Lys Arg Ser Thr
465 470
<210> 111
<211> 1413
<212> DNA
<213> Citrobacter amalonaticus
<400> 111
atgactgaat tgcctaatag cacccgctgg caactgtgga tcgtggcttt cggcttcttt 60
atgcagtcgc tggataccac cattgttaat actgcgcttc cttcgatggc gaaaagctta 120
ggggaaagcc cgctgcatat gcatatggtt gtggtttcgt atgtgctgac cgtggccgtt 180
atgctgcccg cgagcggttg gctggccgac aaaattggcg tgcggaatat cttctttacc 240
gcgatcgtac tgtttaccct gggctcgctg ttttgcgctg gttcgggcac gctaaatgaa 300
ctggttatgg cccgggtgct tcaaggcgtc ggcggcgcga tgatggtacc ggttggccgg 360
ctgacggtga tgaagatcgt tccgcgcgag cagtatatgg ccgcgatgac gtttgttacg 420
ctgccgggcc agataggccc gcttctgggc ccggcgctgg gcgggatttt agtggaatat 480
gcgtcgtggc actggatctt cctgattaac cttccggttg gtatcgttgg cgcgattgcg 540
acgctgatgc tgatgcctaa ctataccatg caaacccgac gcttcgattt gtcgggtttt 600
ctgctgctgg ccgctgggat ggccgtcctg accattgcgc tggacggcag caaagggatg 660
ggaatgtcgt cgttcgcgtt gggtgcgtta gtggtgtgcg gcgtggccgc gatccttttg 720
tacctgaagc acgcgaacga taacccgcgg gcgctgttct cattgcacct gttccgcacg 780
cccaccttct cgctgggact gtttggcagc tttgcgggac gcattggcag cggcatgctt 840
cccttcatga cgccggtttt tcttcaaatc ggtttgggct tttcgccgtt tcacgccggg 900
ctgatgatga ttcctatggt gttgggctca atgggaatga aacggatcgt tgtccaggtt 960
gtcaaccgtt ttggctatcg acgggtgctg gttttcacca cgttgggact gtccgtggta 1020
accctgctgt ttatgtcgac tgcgctgctt ggctggtatt acgtgctgcc gctggtgctg 1080
tttgtccagg gcatggttaa ctcgacgcgt ttctcgtcga tgaataccct gaccctgaaa 1140
gatctgccgg atgagcttgc gagcagcggg aatagcctgc tgtcgatgat catgcaattg 1200
tcgatgtcaa ttggcgttac cgtcgccggt ctgctgctag gaatgttcgc gcagcagcat 1260
atgactgtgg atagcggaac gtcgcatacc gtttttatgt atacctggct gtgtatggct 1320
tttattattg cgcttcctgc tgtgattttt gcgcgcgttc ccaacgatac ccataaaaat 1380
gttgttatcg cgcgacgcaa aaggagaacc tga 1413
<210> 112
<211> 470
<212> PRT
<213> Citrobacter amalonaticus
<400> 112
Met Thr Glu Leu Pro Asn Ser Thr Arg Trp Gln Leu Trp Ile Val Ala
1 5 10 15
Phe Gly Phe Phe Met Gln Ser Leu Asp Thr Thr Ile Val Asn Thr Ala
20 25 30
Leu Pro Ser Met Ala Lys Ser Leu Gly Glu Ser Pro Leu His Met His
35 40 45
Met Val Val Val Ser Tyr Val Leu Thr Val Ala Val Met Leu Pro Ala
50 55 60
Ser Gly Trp Leu Ala Asp Lys Ile Gly Val Arg Asn Ile Phe Phe Thr
65 70 75 80
Ala Ile Val Leu Phe Thr Leu Gly Ser Leu Phe Cys Ala Gly Ser Gly
85 90 95
Thr Leu Asn Glu Leu Val Met Ala Arg Val Leu Gln Gly Val Gly Gly
100 105 110
Ala Met Met Val Pro Val Gly Arg Leu Thr Val Met Lys Ile Val Pro
115 120 125
Arg Glu Gln Tyr Met Ala Ala Met Thr Phe Val Thr Leu Pro Gly Gln
130 135 140
Ile Gly Pro Leu Leu Gly Pro Ala Leu Gly Gly Ile Leu Val Glu Tyr
145 150 155 160
Ala Ser Trp His Trp Ile Phe Leu Ile Asn Leu Pro Val Gly Ile Val
165 170 175
Gly Ala Ile Ala Thr Leu Met Leu Met Pro Asn Tyr Thr Met Gln Thr
180 185 190
Arg Arg Phe Asp Leu Ser Gly Phe Leu Leu Leu Ala Ala Gly Met Ala
195 200 205
Val Leu Thr Ile Ala Leu Asp Gly Ser Lys Gly Met Gly Met Ser Ser
210 215 220
Phe Ala Leu Gly Ala Leu Val Val Cys Gly Val Ala Ala Ile Leu Leu
225 230 235 240
Tyr Leu Lys His Ala Asn Asp Asn Pro Arg Ala Leu Phe Ser Leu His
245 250 255
Leu Phe Arg Thr Pro Thr Phe Ser Leu Gly Leu Phe Gly Ser Phe Ala
260 265 270
Gly Arg Ile Gly Ser Gly Met Leu Pro Phe Met Thr Pro Val Phe Leu
275 280 285
Gln Ile Gly Leu Gly Phe Ser Pro Phe His Ala Gly Leu Met Met Ile
290 295 300
Pro Met Val Leu Gly Ser Met Gly Met Lys Arg Ile Val Val Gln Val
305 310 315 320
Val Asn Arg Phe Gly Tyr Arg Arg Val Leu Val Phe Thr Thr Leu Gly
325 330 335
Leu Ser Val Val Thr Leu Leu Phe Met Ser Thr Ala Leu Leu Gly Trp
340 345 350
Tyr Tyr Val Leu Pro Leu Val Leu Phe Val Gln Gly Met Val Asn Ser
355 360 365
Thr Arg Phe Ser Ser Met Asn Thr Leu Thr Leu Lys Asp Leu Pro Asp
370 375 380
Glu Leu Ala Ser Ser Gly Asn Ser Leu Leu Ser Met Ile Met Gln Leu
385 390 395 400
Ser Met Ser Ile Gly Val Thr Val Ala Gly Leu Leu Leu Gly Met Phe
405 410 415
Ala Gln Gln His Met Thr Val Asp Ser Gly Thr Ser His Thr Val Phe
420 425 430
Met Tyr Thr Trp Leu Cys Met Ala Phe Ile Ile Ala Leu Pro Ala Val
435 440 445
Ile Phe Ala Arg Val Pro Asn Asp Thr His Lys Asn Val Val Ile Ala
450 455 460
Arg Arg Lys Arg Arg Thr
465 470
<210> 113
<211> 1416
<212> DNA
<213> Klebsiella oxytoca
<400> 113
atgactgatc ttcccgacag cacccgctgg caattgtgga ttgtggcttt cggcttcttt 60
atgcagtcac tggacaccac catcgttaat accgcgcttc cctcaatggc gcaaagcctc 120
ggggaaagcc cgctgaatat gcatatggtc attgtctctt atgtactgac cgttgcggtg 180
atgctgcccg ccagcggctg gctggccgac aaagtcggcg tacgcaatat cttctttacc 240
gccatcgtgc tgtttaccct cggttcgctg ttttgcgcac tttctgccac gttaaacgaa 300
ctgttgcttg ctcgcgcgtt gcaaggcgtt ggcggcgcga tgatggtgcc ggtcggcaga 360
ttaactgtga tgaaaattgt tccgcgtgag caatatatgg ccgcgatgac ctttgttacg 420
ctgcccggtc aggtcggccc tctattgggt ccggcgctcg gcggcctgtt agtggaatac 480
gcgtcttggc actggatctt tttgatcaat ataccggtag ggattatcgg tgcgattgcc 540
acgctgatgt taatgcctaa ctataccatg cagacgcggc gtttcgatct ctctggtttt 600
ttgttgttag cggtcggcat ggccgtatta acgctggcgc tggatggctc gaaaggcacg 660
ggactttcac cgctggcgat tgccggactg gcagcgattg gcgttgtggc actggtgctt 720
tatctgctgc acgccagaaa taataaccgc gccctgttca gcctgaaact gttccgcacc 780
cgtacctttt cgctgggcct ggccgggtcg tttgccggac gcatcggctc gggcatgttg 840
ccctttatga ctccggtttt cttgcagatt ggcctcggtt tctcgccgtt ccatgccgga 900
ctgatgatga tcccgatggt gctcggcagc atgggaatga agcgaattgt agttcaggtt 960
gtgaatcgct ttggctaccg tcgggtatta gtggcgacca cgctgggcct gtcgctggtc 1020
accctgctgt ttatgactac cgcgctgctg ggctggtact atgttttgcc gttcgtcctg 1080
tttttgcaag ggatggtcaa ctcgacgcgt ttctcttcta tgaataccct gacgctgaaa 1140
gatctcccgg acaatctggc gagcagcggc aatagcctgc tatcgatgat tatgcaatta 1200
tcgatgtcga tcggcgtcac tatcgccggg ctgttgctgg gactttttgg ttctcagcat 1260
gtcagcgtcg acagcggcac cactcaaacc gtctttatgt atacctggct tagcatggcg 1320
tttatcatcg cccttccggc gttcatcttt gccagagtgt cgaacgatac gcatcaaaat 1380
gtcgctattt cgcggcgaaa aaggagcgcg caatga 1416
<210> 114
<211> 471
<212> PRT
<213> Klebsiella oxytoca
<400> 114
Met Thr Asp Leu Pro Asp Ser Thr Arg Trp Gln Leu Trp Ile Val Ala
1 5 10 15
Phe Gly Phe Phe Met Gln Ser Leu Asp Thr Thr Ile Val Asn Thr Ala
20 25 30
Leu Pro Ser Met Ala Gln Ser Leu Gly Glu Ser Pro Leu Asn Met His
35 40 45
Met Val Ile Val Ser Tyr Val Leu Thr Val Ala Val Met Leu Pro Ala
50 55 60
Ser Gly Trp Leu Ala Asp Lys Val Gly Val Arg Asn Ile Phe Phe Thr
65 70 75 80
Ala Ile Val Leu Phe Thr Leu Gly Ser Leu Phe Cys Ala Leu Ser Ala
85 90 95
Thr Leu Asn Glu Leu Leu Leu Ala Arg Ala Leu Gln Gly Val Gly Gly
100 105 110
Ala Met Met Val Pro Val Gly Arg Leu Thr Val Met Lys Ile Val Pro
115 120 125
Arg Glu Gln Tyr Met Ala Ala Met Thr Phe Val Thr Leu Pro Gly Gln
130 135 140
Val Gly Pro Leu Leu Gly Pro Ala Leu Gly Gly Leu Leu Val Glu Tyr
145 150 155 160
Ala Ser Trp His Trp Ile Phe Leu Ile Asn Ile Pro Val Gly Ile Ile
165 170 175
Gly Ala Ile Ala Thr Leu Met Leu Met Pro Asn Tyr Thr Met Gln Thr
180 185 190
Arg Arg Phe Asp Leu Ser Gly Phe Leu Leu Leu Ala Val Gly Met Ala
195 200 205
Val Leu Thr Leu Ala Leu Asp Gly Ser Lys Gly Thr Gly Leu Ser Pro
210 215 220
Leu Ala Ile Ala Gly Leu Ala Ala Ile Gly Val Val Ala Leu Val Leu
225 230 235 240
Tyr Leu Leu His Ala Arg Asn Asn Asn Arg Ala Leu Phe Ser Leu Lys
245 250 255
Leu Phe Arg Thr Arg Thr Phe Ser Leu Gly Leu Ala Gly Ser Phe Ala
260 265 270
Gly Arg Ile Gly Ser Gly Met Leu Pro Phe Met Thr Pro Val Phe Leu
275 280 285
Gln Ile Gly Leu Gly Phe Ser Pro Phe His Ala Gly Leu Met Met Ile
290 295 300
Pro Met Val Leu Gly Ser Met Gly Met Lys Arg Ile Val Val Gln Val
305 310 315 320
Val Asn Arg Phe Gly Tyr Arg Arg Val Leu Val Ala Thr Thr Leu Gly
325 330 335
Leu Ser Leu Val Thr Leu Leu Phe Met Thr Thr Ala Leu Leu Gly Trp
340 345 350
Tyr Tyr Val Leu Pro Phe Val Leu Phe Leu Gln Gly Met Val Asn Ser
355 360 365
Thr Arg Phe Ser Ser Met Asn Thr Leu Thr Leu Lys Asp Leu Pro Asp
370 375 380
Asn Leu Ala Ser Ser Gly Asn Ser Leu Leu Ser Met Ile Met Gln Leu
385 390 395 400
Ser Met Ser Ile Gly Val Thr Ile Ala Gly Leu Leu Leu Gly Leu Phe
405 410 415
Gly Ser Gln His Val Ser Val Asp Ser Gly Thr Thr Gln Thr Val Phe
420 425 430
Met Tyr Thr Trp Leu Ser Met Ala Phe Ile Ile Ala Leu Pro Ala Phe
435 440 445
Ile Phe Ala Arg Val Ser Asn Asp Thr His Gln Asn Val Ala Ile Ser
450 455 460
Arg Arg Lys Arg Ser Ala Gln
465 470
<210> 115
<211> 1407
<212> DNA
<213> Escherichia albertii B156
<400> 115
atgactgaac tccccgacag cacccgttgg caactgtgga ttgtggcttt cggcttcttt 60
atgcagtctc tggataccac tatcgttaat accgcgctcc catctatggc gcaaagcctg 120
ggagaatcgc cactgcatat gcatatggtc attgtctcgt atgtgctgac cgttgcggtg 180
atgctgccag ccagcggctg gctggcagac aaagtcggcg tacgtaatat tttctttacc 240
gccatcgtgc tgtttaccct tggttctctg ttttgcgcgc tctctggcac gctgaacgaa 300
ctgttactgg cgcgtgcgtt gcaaggcgtc ggcggcgcga tgatggtacc ggtcggcaga 360
ttaacggtga tgaaaattgt tccgcgtgaa caatatatgg ccgcgatgac ctttgtcacg 420
ctgcccggtc agattggtcc gctgcttggc ccggcacttg gcggcctgct ggtagaatac 480
gcatcttggc actggatctt tttaatcaat attccggtag ggattatcgg tgcgatcgct 540
actctgatgt taatgccgaa ctataccatg cagactcggc gtttcgatct ttctggcttt 600
ctgttactgg ccgtcggcat ggccgtacta acgctggcgc tggatggctc gaaaggcacc 660
gggctgtctc cgctagccat caccgtgctg gttgctgttg gcgtgctagc cattgcgctc 720
tatctgcttc atgccagaaa taatcaccgt gcgctgttct cgctgaaact gttccatact 780
cgtacctttt ctctgggctt agcgggaagc ttcgccggtc gtgtcggcag cggcatgcta 840
ccatttatga cccccgtttt ccttcagatt ggccttggct tttctccgtt tcacgccggg 900
ttaatgatga tcccgatggt gcttggcagc atgggaatga agcgaattgt ggtccaggta 960
gtgaatcggt ttggttaccg tcgagtgtta gtggcaacca cgctgggcct gtctctggtc 1020
accctactgt ttatgactac cgctctgctt ggctggtact atattttacc gttcgtcctg 1080
tttttgcaag ggatggtcaa ctctacccgt ttctcttcta tgaataccct gacgctgaag 1140
gatctgccgg accgactggc gagcagcggc aatagcctgc tgtctatgat tatgcaatta 1200
tctatgtcga tcggcgtcac cattgccggg ctcttactgg gattttttgg ttctcagcat 1260
atcagcggcg ccactcaaac cgtctttatg tatacctggc tcagcatggc gtttatcatc 1320
gccctcccgg cacttgtctt tgccagagtt ccgaatgata cgcatcaaaa tgtggctatt 1380
agtcggcgaa aaaggagcgc gcaatga 1407
<210> 116
<211> 468
<212> PRT
<213> Escherichia albertii B156
<400> 116
Met Thr Glu Leu Pro Asp Ser Thr Arg Trp Gln Leu Trp Ile Val Ala
1 5 10 15
Phe Gly Phe Phe Met Gln Ser Leu Asp Thr Thr Ile Val Asn Thr Ala
20 25 30
Leu Pro Ser Met Ala Gln Ser Leu Gly Glu Ser Pro Leu His Met His
35 40 45
Met Val Ile Val Ser Tyr Val Leu Thr Val Ala Val Met Leu Pro Ala
50 55 60
Ser Gly Trp Leu Ala Asp Lys Val Gly Val Arg Asn Ile Phe Phe Thr
65 70 75 80
Ala Ile Val Leu Phe Thr Leu Gly Ser Leu Phe Cys Ala Leu Ser Gly
85 90 95
Thr Leu Asn Glu Leu Leu Leu Ala Arg Ala Leu Gln Gly Val Gly Gly
100 105 110
Ala Met Met Val Pro Val Gly Arg Leu Thr Val Met Lys Ile Val Pro
115 120 125
Arg Glu Gln Tyr Met Ala Ala Met Thr Phe Val Thr Leu Pro Gly Gln
130 135 140
Ile Gly Pro Leu Leu Gly Pro Ala Leu Gly Gly Leu Leu Val Glu Tyr
145 150 155 160
Ala Ser Trp His Trp Ile Phe Leu Ile Asn Ile Pro Val Gly Ile Ile
165 170 175
Gly Ala Ile Ala Thr Leu Met Leu Met Pro Asn Tyr Thr Met Gln Thr
180 185 190
Arg Arg Phe Asp Leu Ser Gly Phe Leu Leu Leu Ala Val Gly Met Ala
195 200 205
Val Leu Thr Leu Ala Leu Asp Gly Ser Lys Gly Thr Gly Leu Ser Pro
210 215 220
Leu Ala Ile Thr Val Leu Val Ala Val Gly Val Leu Ala Ile Ala Leu
225 230 235 240
Tyr Leu Leu His Ala Arg Asn Asn His Arg Ala Leu Phe Ser Leu Lys
245 250 255
Leu Phe His Thr Arg Thr Phe Ser Leu Gly Leu Ala Gly Ser Phe Ala
260 265 270
Gly Arg Val Gly Ser Gly Met Leu Pro Phe Met Thr Pro Val Phe Leu
275 280 285
Gln Ile Gly Leu Gly Phe Ser Pro Phe His Ala Gly Leu Met Met Ile
290 295 300
Pro Met Val Leu Gly Ser Met Gly Met Lys Arg Ile Val Val Gln Val
305 310 315 320
Val Asn Arg Phe Gly Tyr Arg Arg Val Leu Val Ala Thr Thr Leu Gly
325 330 335
Leu Ser Leu Val Thr Leu Leu Phe Met Thr Thr Ala Leu Leu Gly Trp
340 345 350
Tyr Tyr Ile Leu Pro Phe Val Leu Phe Leu Gln Gly Met Val Asn Ser
355 360 365
Thr Arg Phe Ser Ser Met Asn Thr Leu Thr Leu Lys Asp Leu Pro Asp
370 375 380
Arg Leu Ala Ser Ser Gly Asn Ser Leu Leu Ser Met Ile Met Gln Leu
385 390 395 400
Ser Met Ser Ile Gly Val Thr Ile Ala Gly Leu Leu Leu Gly Phe Phe
405 410 415
Gly Ser Gln His Ile Ser Gly Ala Thr Gln Thr Val Phe Met Tyr Thr
420 425 430
Trp Leu Ser Met Ala Phe Ile Ile Ala Leu Pro Ala Leu Val Phe Ala
435 440 445
Arg Val Pro Asn Asp Thr His Gln Asn Val Ala Ile Ser Arg Arg Lys
450 455 460
Arg Ser Ala Gln
465
<210> 117
<211> 1413
<212> DNA
<213> Salmonella enterica subsp. Salamae
<400> 117
atgactgaac tccctgacag cactcgctgg caactttgga ttgtggcttt cggctttttt 60
atgcagtcgt tggataccac catcgttaat actgcgctgc cttcaatggc gaaaagcctg 120
ggagaaagcc cgctgcatat gcatatggta gtggtgtcat atgtccttac cgttgccgta 180
atgcttcctg ccagcggctg gctggctgac aaaatcggcg tgcgtaatat tttctttgcc 240
gccatcgtgc tgttcactct gggatcgctg ttttgcgccc tttcgggcac gctcaatcaa 300
ctggtattag cgcgagtctt gcaaggcgta ggcggcgcga tgatggtgcc ggttggacgc 360
ctgacggtta tgaaaatcgt gccgcgtgcg caatatatgg ccgcgatgac cttcgttacc 420
ctgccgggac aggtagggcc cttacttggc cctgcgctgg gcggagtgtt agtggaatat 480
gcttcatggc actggatctt tctgatcaat atcccagtgg gaattgttgg cgctatcgcg 540
acctttatgc tgatgcccaa ctataccata gaaacccggc gctttgatct gccagggttc 600
ctgctgttag ccataggcat ggccgtactt acgctggcgc tggacggcag caaaagcatg 660
ggaatctcgc cttggacttt agccggactc gctgcgggcg gcgcggctgc tattctgctt 720
tatcttcttc atgccaagaa gaactcaggc gcgttattca gcctgcgatt gttccgcacg 780
cctacgtttt cactgggatt gctgggctca tttgccgggc gcatcggcag cgggatgctg 840
ccgtttatta cgccggtgtt cttgcaaatt gggcttgggt tttcaccgtt tcatgccggg 900
ttaatgatga tccctatggt gctgggcagc atgggaatga agcggattgt ggtgcagata 960
gtcaaccgtt ttggctatcg tcgggttctg gttgcgacca cgcttggact ggctttggtc 1020
agcctgttgt ttatgtcggt tgcgctgctt ggctggtatt atcttctgcc gctggtactg 1080
ctcttgcagg gaatggtgaa ctcggcgcgt ttttcatcga tgaataccct aacgctaaaa 1140
gacctccctg atacgctggc cagcagcggc aatagcttat tatcaatgat tatgcagctt 1200
tcgatgtcaa tcggcgttac tattgccgga atgttgctgg gcatgtttgg ccaacagcat 1260
atcgggatag actcaagcgc cactcatcac gtgttcttgt atacctggct atgtatggcc 1320
gtcattatcg cgctaccggc gataattttt gcccgcgtgc cgaacgatac tcagcaaaat 1380
atggttattt cacggcgtaa aagaagcctg taa 1413
<210> 118
<211> 470
<212> PRT
<213> Salmonella enterica subsp. Salamae
<400> 118
Met Thr Glu Leu Pro Asp Ser Thr Arg Trp Gln Leu Trp Ile Val Ala
1 5 10 15
Phe Gly Phe Phe Met Gln Ser Leu Asp Thr Thr Ile Val Asn Thr Ala
20 25 30
Leu Pro Ser Met Ala Lys Ser Leu Gly Glu Ser Pro Leu His Met His
35 40 45
Met Val Val Val Ser Tyr Val Leu Thr Val Ala Val Met Leu Pro Ala
50 55 60
Ser Gly Trp Leu Ala Asp Lys Ile Gly Val Arg Asn Ile Phe Phe Ala
65 70 75 80
Ala Ile Val Leu Phe Thr Leu Gly Ser Leu Phe Cys Ala Leu Ser Gly
85 90 95
Thr Leu Asn Gln Leu Val Leu Ala Arg Val Leu Gln Gly Val Gly Gly
100 105 110
Ala Met Met Val Pro Val Gly Arg Leu Thr Val Met Lys Ile Val Pro
115 120 125
Arg Ala Gln Tyr Met Ala Ala Met Thr Phe Val Thr Leu Pro Gly Gln
130 135 140
Val Gly Pro Leu Leu Gly Pro Ala Leu Gly Gly Val Leu Val Glu Tyr
145 150 155 160
Ala Ser Trp His Trp Ile Phe Leu Ile Asn Ile Pro Val Gly Ile Val
165 170 175
Gly Ala Ile Ala Thr Phe Met Leu Met Pro Asn Tyr Thr Ile Glu Thr
180 185 190
Arg Arg Phe Asp Leu Pro Gly Phe Leu Leu Leu Ala Ile Gly Met Ala
195 200 205
Val Leu Thr Leu Ala Leu Asp Gly Ser Lys Ser Met Gly Ile Ser Pro
210 215 220
Trp Thr Leu Ala Gly Leu Ala Ala Gly Gly Ala Ala Ala Ile Leu Leu
225 230 235 240
Tyr Leu Leu His Ala Lys Lys Asn Ser Gly Ala Leu Phe Ser Leu Arg
245 250 255
Leu Phe Arg Thr Pro Thr Phe Ser Leu Gly Leu Leu Gly Ser Phe Ala
260 265 270
Gly Arg Ile Gly Ser Gly Met Leu Pro Phe Ile Thr Pro Val Phe Leu
275 280 285
Gln Ile Gly Leu Gly Phe Ser Pro Phe His Ala Gly Leu Met Met Ile
290 295 300
Pro Met Val Leu Gly Ser Met Gly Met Lys Arg Ile Val Val Gln Ile
305 310 315 320
Val Asn Arg Phe Gly Tyr Arg Arg Val Leu Val Ala Thr Thr Leu Gly
325 330 335
Leu Ala Leu Val Ser Leu Leu Phe Met Ser Val Ala Leu Leu Gly Trp
340 345 350
Tyr Tyr Leu Leu Pro Leu Val Leu Leu Leu Gln Gly Met Val Asn Ser
355 360 365
Ala Arg Phe Ser Ser Met Asn Thr Leu Thr Leu Lys Asp Leu Pro Asp
370 375 380
Thr Leu Ala Ser Ser Gly Asn Ser Leu Leu Ser Met Ile Met Gln Leu
385 390 395 400
Ser Met Ser Ile Gly Val Thr Ile Ala Gly Met Leu Leu Gly Met Phe
405 410 415
Gly Gln Gln His Ile Gly Ile Asp Ser Ser Ala Thr His His Val Phe
420 425 430
Leu Tyr Thr Trp Leu Cys Met Ala Val Ile Ile Ala Leu Pro Ala Ile
435 440 445
Ile Phe Ala Arg Val Pro Asn Asp Thr Gln Gln Asn Met Val Ile Ser
450 455 460
Arg Arg Lys Arg Ser Leu
465 470
<210> 119
<211> 1416
<212> DNA
<213> Klebsiella pneumoniae 30684/NJST258_2
<400> 119
atgactgact taccggcgag cgtgcgctgg cagctatgga tagtggcgtt tggctttttc 60
atgcagtcgc tggacaccac cattgtaaat accgcgttac cttcgatggc gaaaagctta 120
ggggaatcac cgctgcatat gcatatgatc attgtttcgt atgtgctaac ggttgcggtg 180
atgctgccgg cgagcggctg gctggccgac cgggttggag tgcgcaatat cttctttacc 240
gcgattgtgc tgttcaccgc gggatcgctg ttctgcgcgc aggcgagcac cttagaccag 300
ctggtgatgg cgcgagtgct gcaaggagtc ggcggcgcga tgatggtgcc ggttggccgc 360
ctgacggtga tgaagattgt tccgcgcgat cagtatatgg ccgcgatgac ctttgttacc 420
ctgccgggcc aggttggccc gctgttaggc ccggcgctgg gcggagtgct ggttgagtac 480
gcgtcgtggc attggatctt cttaattaat attccggttg ggattgtagg cgcgattgcg 540
accttatgtc tgatgcctaa ctataccatg cagacccggc gctttgattt atcgggcttc 600
ctgctgctgg ccgcgggaat ggcgaccctg accctggcgt tagacggcca gaaagggtta 660
ggcatctcgc ccgcgtggtt agcgggactg gttgcggttg gcttatgcgc gctgctgtta 720
tacctgtggc atgcgcgcgg caacgcgcgg gcgctgttca gccttaacct gttccgcaac 780
cgcacttttt cattaggctt aggcggcagc tttgcgggac gcattggcag cggcatgctg 840
ccgttcatga ccccggtgtt cctgcagatt ggcttaggct tttcgccttt ccatgccggg 900
ctgatgatga ttccgatggt gttaggcagc atgggcatga agcggattgt ggttcaggtt 960
gttaaccgct tcggctaccg acgggtgctg gttgcgagca ccctgggcct ggccgcggtt 1020
agcctgctgt tcatgttcag cgcgctggcc ggctggtatt acgcgctgcc gctggttctg 1080
ttcctgcagg gaatgattaa cgcgagccgc ttttcgtcaa tgaataccct gacgctgaaa 1140
gatttaccgg acgatctggc gagcagcggc aatagcctgc tgtcgatggt gatgcagctg 1200
tcgatgtcaa ttggcgtgac cattgccggg ctgctgctgg gactgtatgg ccagcagcat 1260
atgagcttag acgcggcgag cacccaccag gttttcttat atacctatct gagcatggcc 1320
gcgattattg cgctgccggc gttaattttc tcccgggtac cggatgacgt tggcagcaat 1380
accgttttac ggaggcgcaa taggtcagga tcgtga 1416
<210> 120
<211> 471
<212> PRT
<213> Klebsiella pneumoniae 30684/NJST258_2
<400> 120
Met Thr Asp Leu Pro Ala Ser Val Arg Trp Gln Leu Trp Ile Val Ala
1 5 10 15
Phe Gly Phe Phe Met Gln Ser Leu Asp Thr Thr Ile Val Asn Thr Ala
20 25 30
Leu Pro Ser Met Ala Lys Ser Leu Gly Glu Ser Pro Leu His Met His
35 40 45
Met Ile Ile Val Ser Tyr Val Leu Thr Val Ala Val Met Leu Pro Ala
50 55 60
Ser Gly Trp Leu Ala Asp Arg Val Gly Val Arg Asn Ile Phe Phe Thr
65 70 75 80
Ala Ile Val Leu Phe Thr Ala Gly Ser Leu Phe Cys Ala Gln Ala Ser
85 90 95
Thr Leu Asp Gln Leu Val Met Ala Arg Val Leu Gln Gly Val Gly Gly
100 105 110
Ala Met Met Val Pro Val Gly Arg Leu Thr Val Met Lys Ile Val Pro
115 120 125
Arg Asp Gln Tyr Met Ala Ala Met Thr Phe Val Thr Leu Pro Gly Gln
130 135 140
Val Gly Pro Leu Leu Gly Pro Ala Leu Gly Gly Val Leu Val Glu Tyr
145 150 155 160
Ala Ser Trp His Trp Ile Phe Leu Ile Asn Ile Pro Val Gly Ile Val
165 170 175
Gly Ala Ile Ala Thr Leu Cys Leu Met Pro Asn Tyr Thr Met Gln Thr
180 185 190
Arg Arg Phe Asp Leu Ser Gly Phe Leu Leu Leu Ala Ala Gly Met Ala
195 200 205
Thr Leu Thr Leu Ala Leu Asp Gly Gln Lys Gly Leu Gly Ile Ser Pro
210 215 220
Ala Trp Leu Ala Gly Leu Val Ala Val Gly Leu Cys Ala Leu Leu Leu
225 230 235 240
Tyr Leu Trp His Ala Arg Gly Asn Ala Arg Ala Leu Phe Ser Leu Asn
245 250 255
Leu Phe Arg Asn Arg Thr Phe Ser Leu Gly Leu Gly Gly Ser Phe Ala
260 265 270
Gly Arg Ile Gly Ser Gly Met Leu Pro Phe Met Thr Pro Val Phe Leu
275 280 285
Gln Ile Gly Leu Gly Phe Ser Pro Phe His Ala Gly Leu Met Met Ile
290 295 300
Pro Met Val Leu Gly Ser Met Gly Met Lys Arg Ile Val Val Gln Val
305 310 315 320
Val Asn Arg Phe Gly Tyr Arg Arg Val Leu Val Ala Ser Thr Leu Gly
325 330 335
Leu Ala Ala Val Ser Leu Leu Phe Met Phe Ser Ala Leu Ala Gly Trp
340 345 350
Tyr Tyr Ala Leu Pro Leu Val Leu Phe Leu Gln Gly Met Ile Asn Ala
355 360 365
Ser Arg Phe Ser Ser Met Asn Thr Leu Thr Leu Lys Asp Leu Pro Asp
370 375 380
Asp Leu Ala Ser Ser Gly Asn Ser Leu Leu Ser Met Val Met Gln Leu
385 390 395 400
Ser Met Ser Ile Gly Val Thr Ile Ala Gly Leu Leu Leu Gly Leu Tyr
405 410 415
Gly Gln Gln His Met Ser Leu Asp Ala Ala Ser Thr His Gln Val Phe
420 425 430
Leu Tyr Thr Tyr Leu Ser Met Ala Ala Ile Ile Ala Leu Pro Ala Leu
435 440 445
Ile Phe Ser Arg Val Pro Asp Asp Val Gly Ser Asn Thr Val Leu Arg
450 455 460
Arg Arg Asn Arg Ser Gly Ser
465 470
<210> 121
<211> 1416
<212> DNA
<213> Klebsiella pneumoniae
<400> 121
atgactgact taccgaccag cgtgcgctgg cagctatgga tagtggcgtt tggctttttc 60
atgcagtcgc tggacaccac cattgtaaat accgcgttac cttcgatggc gaaaagctta 120
ggggagagtc cgctgcatat gcatatgatc attgtttcgt atgtgctaac ggttgcggtg 180
atgctgccgg cgagcggctg gctggccgac cgggttggag tgcgcaatat cttctttacc 240
gcgattgtgc tgttcaccgc gggatcgctg ttctgcgcgc aggcgagcac cttagaccag 300
ctggtgatgg cgcgagtgct gcaaggagtc ggcggcgcga tgatggtgcc ggttggccgc 360
ctgacggtga tgaagattgt tccgcgcgat cagtatatgg ccgcgatgac ctttgtaacc 420
ctgccgggcc aggttggccc gctgttaggc ccggcgctgg gcggagtgct ggttgagtac 480
gcgtcatggc actggatctt cttaattaat attccggttg ggattgttgg cgcgattgcg 540
accttatgtc tgatgcctaa ctataccatg cagacccggc gctttgattt atcgggcttc 600
ctgctgctgg ccgccgggat ggcgactctg accctggcgt tagacggcca gaaagggtta 660
ggcatctcgc ccgcgtggtt agcgggatta gtggccgttg gcttatgcgc gctgctgtta 720
tacctgtggc acgcgcgcgg caacgcgcgg gcgctgttca gccttaacct gttccgcaac 780
cgcacctttt cgttaggctt aggcggcagc tttgcgggac gcattggcag cggcatgctg 840
ccgttcatga ccccggtgtt ccttcagatt ggcttaggct tttcgccttt ccacgccggg 900
ctgatgatga ttccgatggt gttaggcagc atgggcatga agcggattgt ggttcaggtt 960
gttaaccgct tcggctaccg acgggtgctg gttgcgagca ccctgggctt agcggccgtt 1020
agcctgctgt tcatgttcag cgcgttagcg ggatggtatt acgcgctgcc gctggttctg 1080
ttcctgcagg gaatgattaa ctcgagccgc ttttcgtcaa tgaataccct gacgctgaaa 1140
gatttaccgg acgatctggc gagcagcggc aatagcctgc tgtcgatggt gatgcagctg 1200
tcgatgtcaa ttggcgtgac cattgccggg ctgctgctgg gactgtatgg ccagcagcat 1260
atgtcattag acgcggcgag cacccatcag gttttcttat atacctatct gagcatggcc 1320
gcgattattg cgctgccggc gttaattttc tcccgggtac cggatgacgt tggcagcaat 1380
accgttttac ggcgacgcaa taggtcagga tcgtga 1416
<210> 122
<211> 471
<212> PRT
<213> Klebsiella pneumoniae
<400> 122
Met Thr Asp Leu Pro Thr Ser Val Arg Trp Gln Leu Trp Ile Val Ala
1 5 10 15
Phe Gly Phe Phe Met Gln Ser Leu Asp Thr Thr Ile Val Asn Thr Ala
20 25 30
Leu Pro Ser Met Ala Lys Ser Leu Gly Glu Ser Pro Leu His Met His
35 40 45
Met Ile Ile Val Ser Tyr Val Leu Thr Val Ala Val Met Leu Pro Ala
50 55 60
Ser Gly Trp Leu Ala Asp Arg Val Gly Val Arg Asn Ile Phe Phe Thr
65 70 75 80
Ala Ile Val Leu Phe Thr Ala Gly Ser Leu Phe Cys Ala Gln Ala Ser
85 90 95
Thr Leu Asp Gln Leu Val Met Ala Arg Val Leu Gln Gly Val Gly Gly
100 105 110
Ala Met Met Val Pro Val Gly Arg Leu Thr Val Met Lys Ile Val Pro
115 120 125
Arg Asp Gln Tyr Met Ala Ala Met Thr Phe Val Thr Leu Pro Gly Gln
130 135 140
Val Gly Pro Leu Leu Gly Pro Ala Leu Gly Gly Val Leu Val Glu Tyr
145 150 155 160
Ala Ser Trp His Trp Ile Phe Leu Ile Asn Ile Pro Val Gly Ile Val
165 170 175
Gly Ala Ile Ala Thr Leu Cys Leu Met Pro Asn Tyr Thr Met Gln Thr
180 185 190
Arg Arg Phe Asp Leu Ser Gly Phe Leu Leu Leu Ala Ala Gly Met Ala
195 200 205
Thr Leu Thr Leu Ala Leu Asp Gly Gln Lys Gly Leu Gly Ile Ser Pro
210 215 220
Ala Trp Leu Ala Gly Leu Val Ala Val Gly Leu Cys Ala Leu Leu Leu
225 230 235 240
Tyr Leu Trp His Ala Arg Gly Asn Ala Arg Ala Leu Phe Ser Leu Asn
245 250 255
Leu Phe Arg Asn Arg Thr Phe Ser Leu Gly Leu Gly Gly Ser Phe Ala
260 265 270
Gly Arg Ile Gly Ser Gly Met Leu Pro Phe Met Thr Pro Val Phe Leu
275 280 285
Gln Ile Gly Leu Gly Phe Ser Pro Phe His Ala Gly Leu Met Met Ile
290 295 300
Pro Met Val Leu Gly Ser Met Gly Met Lys Arg Ile Val Val Gln Val
305 310 315 320
Val Asn Arg Phe Gly Tyr Arg Arg Val Leu Val Ala Ser Thr Leu Gly
325 330 335
Leu Ala Ala Val Ser Leu Leu Phe Met Phe Ser Ala Leu Ala Gly Trp
340 345 350
Tyr Tyr Ala Leu Pro Leu Val Leu Phe Leu Gln Gly Met Ile Asn Ser
355 360 365
Ser Arg Phe Ser Ser Met Asn Thr Leu Thr Leu Lys Asp Leu Pro Asp
370 375 380
Asp Leu Ala Ser Ser Gly Asn Ser Leu Leu Ser Met Val Met Gln Leu
385 390 395 400
Ser Met Ser Ile Gly Val Thr Ile Ala Gly Leu Leu Leu Gly Leu Tyr
405 410 415
Gly Gln Gln His Met Ser Leu Asp Ala Ala Ser Thr His Gln Val Phe
420 425 430
Leu Tyr Thr Tyr Leu Ser Met Ala Ala Ile Ile Ala Leu Pro Ala Leu
435 440 445
Ile Phe Ser Arg Val Pro Asp Asp Val Gly Ser Asn Thr Val Leu Arg
450 455 460
Arg Arg Asn Arg Ser Gly Ser
465 470
<210> 123
<211> 1416
<212> DNA
<213> Pseudocitrobacter faecalis
<400> 123
atgactgaat tgcctgccag cgtgcgctgg caattgtgga tagtggcgtt cggcttcttt 60
atgcaatcgc tggacaccac tatcgtcaat accgccttgc cttcaatggc cgcttcactg 120
ggagagagcc cgctgcatat gcatatggtt gtggtatcat acgtgctgac tgtggccgtg 180
atgctccctg cctcgggctg gctggccgac cgagttggcg tacgcaatat cttcttcacc 240
gccattgtcc tgttcaccgc cggctcgctg ttttgttcgc tggcgagcac gttgaatgag 300
ctgctgatgg cgcgtgtact tcaaggcgtc ggcggcgcga tgatggtgcc tgtcgggcgc 360
ctgactgtga tgaaaatcgt cccgcgctct cagtatatgg ccgcgatgac cttcgtcacc 420
ctgcctggtc aggtcggccc gctcctcggc ccggcgttgg gcggcgtgct ggtagaatac 480
gcctcgtggc actggatctt cctgatcaat attccggtcg gcattatcgg cgggatcgcc 540
acgctgatgc tgatgcctaa ctatacgctg caaacccgcc gttttgacct gagcggattt 600
atcgtgctgg cgctgggcat ggccgtgttg actctggcct tggacgggca gaaagggctg 660
ggtatatcaa gcctcacgct ggcgattctg gtcgccgtcg gtgtcgcctc aatactgttt 720
tatttgtggc acgccagggg caatgacaac gcgctgttta gcctgaagct ctttcgcacg 780
cccactttct cgttgggcct ggctggctca ttcgccggac gcatcggtag cggcatgctg 840
ccttttatga cgccggtctt tctccagatt gggctcggat tttcgccgtt tcacgccggg 900
ctgatgatga tcccgatggt gttgggcagc atgggaatga aacggattgt ggttcaggtt 960
gtcaaccgtt ttggttaccg gaatgtgctg gtcaccacca cgattggctt ggcgctggtg 1020
agcctgctgt ttatggcgac ggcgctggct ggctggtatt acgccctgcc gctggtgctg 1080
tttattcagg gaatggtcaa ctcgagccgc ttctcgtcaa tgaatacgct gacgctgaaa 1140
gatctccctg atgagcatgc cagcagcggc aatagcctgc tgtcgatgat catgcagttg 1200
tcaatgtcaa ttggcgtcac cgtagcgggc cttctgctgg gcatgttcgg ccagcagcat 1260
gtcgccgccg atagcgccgt cacgcaccat gtctttatgt atacttattt gtgcatggcg 1320
ctcattatcg ccctgcctgc cctgattttt gcccgcgtac ccgacgacgt caccaaaaac 1380
gtggtcatcg cccgacgaaa aaggtcagaa cagtga 1416
<210> 124
<211> 471
<212> PRT
<213> Pseudocitrobacter faecalis
<400> 124
Met Thr Glu Leu Pro Ala Ser Val Arg Trp Gln Leu Trp Ile Val Ala
1 5 10 15
Phe Gly Phe Phe Met Gln Ser Leu Asp Thr Thr Ile Val Asn Thr Ala
20 25 30
Leu Pro Ser Met Ala Ala Ser Leu Gly Glu Ser Pro Leu His Met His
35 40 45
Met Val Val Val Ser Tyr Val Leu Thr Val Ala Val Met Leu Pro Ala
50 55 60
Ser Gly Trp Leu Ala Asp Arg Val Gly Val Arg Asn Ile Phe Phe Thr
65 70 75 80
Ala Ile Val Leu Phe Thr Ala Gly Ser Leu Phe Cys Ser Leu Ala Ser
85 90 95
Thr Leu Asn Glu Leu Leu Met Ala Arg Val Leu Gln Gly Val Gly Gly
100 105 110
Ala Met Met Val Pro Val Gly Arg Leu Thr Val Met Lys Ile Val Pro
115 120 125
Arg Ser Gln Tyr Met Ala Ala Met Thr Phe Val Thr Leu Pro Gly Gln
130 135 140
Val Gly Pro Leu Leu Gly Pro Ala Leu Gly Gly Val Leu Val Glu Tyr
145 150 155 160
Ala Ser Trp His Trp Ile Phe Leu Ile Asn Ile Pro Val Gly Ile Ile
165 170 175
Gly Gly Ile Ala Thr Leu Met Leu Met Pro Asn Tyr Thr Leu Gln Thr
180 185 190
Arg Arg Phe Asp Leu Ser Gly Phe Ile Val Leu Ala Leu Gly Met Ala
195 200 205
Val Leu Thr Leu Ala Leu Asp Gly Gln Lys Gly Leu Gly Ile Ser Ser
210 215 220
Leu Thr Leu Ala Ile Leu Val Ala Val Gly Val Ala Ser Ile Leu Phe
225 230 235 240
Tyr Leu Trp His Ala Arg Gly Asn Asp Asn Ala Leu Phe Ser Leu Lys
245 250 255
Leu Phe Arg Thr Pro Thr Phe Ser Leu Gly Leu Ala Gly Ser Phe Ala
260 265 270
Gly Arg Ile Gly Ser Gly Met Leu Pro Phe Met Thr Pro Val Phe Leu
275 280 285
Gln Ile Gly Leu Gly Phe Ser Pro Phe His Ala Gly Leu Met Met Ile
290 295 300
Pro Met Val Leu Gly Ser Met Gly Met Lys Arg Ile Val Val Gln Val
305 310 315 320
Val Asn Arg Phe Gly Tyr Arg Asn Val Leu Val Thr Thr Thr Ile Gly
325 330 335
Leu Ala Leu Val Ser Leu Leu Phe Met Ala Thr Ala Leu Ala Gly Trp
340 345 350
Tyr Tyr Ala Leu Pro Leu Val Leu Phe Ile Gln Gly Met Val Asn Ser
355 360 365
Ser Arg Phe Ser Ser Met Asn Thr Leu Thr Leu Lys Asp Leu Pro Asp
370 375 380
Glu His Ala Ser Ser Gly Asn Ser Leu Leu Ser Met Ile Met Gln Leu
385 390 395 400
Ser Met Ser Ile Gly Val Thr Val Ala Gly Leu Leu Leu Gly Met Phe
405 410 415
Gly Gln Gln His Val Ala Ala Asp Ser Ala Val Thr His His Val Phe
420 425 430
Met Tyr Thr Tyr Leu Cys Met Ala Leu Ile Ile Ala Leu Pro Ala Leu
435 440 445
Ile Phe Ala Arg Val Pro Asp Asp Val Thr Lys Asn Val Val Ile Ala
450 455 460
Arg Arg Lys Arg Ser Glu Gln
465 470
<210> 125
<211> 1236
<212> DNA
<213> Yokenella regensburgei ATCC43003
<400> 125
atgcaaaatc ataccctctc gggcaaacgt ctgggtcgtc aggcgctact ctttccgctc 60
tgcttagtac tgtacgaatt ttcgacctat attggaaacg acatgattca gccgggcatg 120
ttagccgtgg ttgagcagta ccaggctggt atcgaatggg tccccacttc gatgaccgct 180
tacttagcgg gcgggatatt cctgcagtgg ttactggggc cgctgtcgga tcgtatcggc 240
cgtcgtccgg tgatgctaac cggagtggtc tggtttatcg tgacctgctt agcgacgctg 300
ctggcgcaga atatcgagca gttcacgttt ctgcgttttc tgcaaggagt gagcctgtgc 360
tttatcggtg ctgtgggcta tgcggcgatt caggagtcgt tcgaagaggc cgtgtgtatt 420
aaaattaccg cgctgatggc gaacgtggcg ctaatcgcgc cgctgttagg tccgttagtg 480
ggcgcggcgt ggattcattt tgcgccgtgg gaaaccatgt ttgtgctgtt cgcggcgctg 540
gccgcgatct cgttttttgg cctgcagcgt gctatgccgg aaacggcgac ccgcataggc 600
gaaaagctgt cgttaaaaga gctaggtcgt gactattcag cggtgctgaa aaacctgcgc 660
tttgtcgcgg gcgcgctggc tacgggcttc gtcagcctgc cgctcctggc gtggatcgcg 720
cagtcaccgg tcatcattat gagcggtgaa cacgcgagca gctacgagta tggtatgctg 780
caagtgccga tcttcggtgc tctgatcatt ggtaatctgg tgctggcgcg tttaacttcg 840
cgccgttcgg tgcgctcgct aatcatcatg ggcggctggc cgatcgtggc tgggctcatt 900
ctcgcggctg cggctactgt ggtatcaagc catgcgtatc tgtggatgac ggccgggtta 960
agcgtgtacg ctttcggtat tggtctggcg aacgcgggac tggtgcgcct gaccttattc 1020
gcgagcgaca tgtcaaaagg cacggtagcc gcggcgatgg gcatgctgca gatgatgatc 1080
ttcaccgtcg ggatcgaagt cagcaagcac gcgtatctgc tcggcggcaa cggcctcttt 1140
agcctgttta atctggccgg tggattagtc tggctggtgc tgatcgtcta ctttctgaaa 1200
gacaaaacgg ttggtgcttc gactaagccc gactag 1236
<210> 126
<211> 411
<212> PRT
<213> Yokenella regensburgei ATCC43003
<400> 126
Met Gln Asn His Thr Leu Ser Gly Lys Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln
35 40 45
Ala Gly Ile Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Ile Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Phe Leu Arg
100 105 110
Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Ile His Phe Ala Pro Trp Glu Thr Met Phe Val Leu
165 170 175
Phe Ala Ala Leu Ala Ala Ile Ser Phe Phe Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Ile Gly Glu Lys Leu Ser Leu Lys Glu Leu
195 200 205
Gly Arg Asp Tyr Ser Ala Val Leu Lys Asn Leu Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Met Ser Gly Glu His Ala Ser Ser Tyr Glu
245 250 255
Tyr Gly Met Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ile Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Ser Val Arg Ser Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Ile Val Ala Gly Leu Ile Leu Ala Ala Ala
290 295 300
Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Val Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ala Ala Ala
340 345 350
Met Gly Met Leu Gln Met Met Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Tyr Leu Leu Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Ala Gly Gly Leu Val Trp Leu Val Leu Ile Val Tyr Phe Leu Lys
385 390 395 400
Asp Lys Thr Val Gly Ala Ser Thr Lys Pro Asp
405 410
<210> 127
<211> 1233
<212> DNA
<213> Cronobacter muytjensii
<400> 127
atgcaaactc atgctaaccg aaccggacgg ttaggacgcc aggcgctgct gtttccgtta 60
tgtctggtgt tatacgagtt ctcaacttat attggcaacg atatgattca gccgggaatg 120
ttagcggttg ttgaacagta tcaggccggc gtggaatggg tgccgaccag catgaccgcg 180
tatttagcgg gcggcatgtt ccttcagtgg ctgctcggcc cgttaagcga ccgcattggc 240
cggcgcccgg tgatgctggc cggcgtggtg tggttcattg tgacctgcct cgcgaccctg 300
ctggcgcaga ctattgagca gtttactgtg ctacggtttc ttcagggcat tagcctgtgc 360
ttcattggcg ccgtgggata tgcggctatt caggaaagct tcgaggaagc ggtgtgcatt 420
aaaattaccg cgctaatggc gaacgtggcg ctgatcgcgc cgctgttagg cccgctggtt 480
ggcgcggcct gggtgcacgc ggcgccttgg gaaatgatgt tcgtgctgtt tgcggcgctg 540
gccgcgatct cattttttgg gctgtggcgc gcgatgccgg aaaccgcgac ccggctcggc 600
gaaaaactga gcctgcgcga gctgggacgg gattataaag cggtgctgaa aaacctgcgg 660
ttcgtttcag gcgcgctggc gattggattc gttagcctgc cgctgctggc gtggatcgct 720
cagagcccgg taatcattat tagcggcgaa cagatgagca cctatgagta tgggctgctt 780
caggtgccga tctttggcgc gctgatttta ggcaacctgg tgctggcgaa gttaaccgct 840
cggcgcagcg tgcgcagcct gatcattatg ggcggctggc cgatcatggc cgggctggcg 900
ttagcggcgt ttgcgaccct gttatcgtcg catgcgtatt tatggatgac cgccgggtta 960
tcaatctacg cgtttggcat tggcattgcg aacgcgggcc tggtgcgcct gaccctgttc 1020
gcgagcgata ttagcaaagg caccgtatcc gcggcgatgg gcatgcttca gatgaccatc 1080
tttactgttg gcattgaagt gagcaaacat gcgtggattg gcggcggcaa cggcctgttt 1140
aacctgttca atttagctaa cggactgctg tggctgggcc tgatggtgat ctttctgaaa 1200
gacaaaaccg ttggcgcgag ccgggaagga tga 1233
<210> 128
<211> 410
<212> PRT
<213> Cronobacter muytjensii
<400> 128
Met Gln Thr His Ala Asn Arg Thr Gly Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln
35 40 45
Ala Gly Val Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Ala Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Thr Ile Glu Gln Phe Thr Val Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Ala Ala Pro Trp Glu Met Met Phe Val Leu
165 170 175
Phe Ala Ala Leu Ala Ala Ile Ser Phe Phe Gly Leu Trp Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Arg Glu Leu
195 200 205
Gly Arg Asp Tyr Lys Ala Val Leu Lys Asn Leu Arg Phe Val Ser Gly
210 215 220
Ala Leu Ala Ile Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Met Ser Thr Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Leu Gly Asn
260 265 270
Leu Val Leu Ala Lys Leu Thr Ala Arg Arg Ser Val Arg Ser Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Ile Met Ala Gly Leu Ala Leu Ala Ala Phe
290 295 300
Ala Thr Leu Leu Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Ile Tyr Ala Phe Gly Ile Gly Ile Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Ile Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Thr Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Trp Ile Gly Gly Gly Asn Gly Leu Phe Asn Leu Phe Asn
370 375 380
Leu Ala Asn Gly Leu Leu Trp Leu Gly Leu Met Val Ile Phe Leu Lys
385 390 395 400
Asp Lys Thr Val Gly Ala Ser Arg Glu Gly
405 410
<210> 129
<211> 1236
<212> DNA
<213> Klebsiella oxytoca
<400> 129
atgcagaatt attcgctttc aggcaaacgc ttaggacgcc aggcgctgtt atttccgcta 60
tgcctggtgc tatacgagtt ctcgacctat attggcaatg acatgattca gccgggcatg 120
ttatcggttg tggctgaatt tggcgtgggc aacgaatggg tgccgacctc aatgaccgcg 180
tatctggccg gcggaatgtt tcttcagtgg ctgctggggc cgctttcgga ccgcattggc 240
cgtcgtccgg tgatgctgac cggagtagtg tggtttattg taacctgcct ggcgacgctg 300
ctggcgcaaa ctatcgagca gttcacgctg ctgcgctttc ttcagggaat tagcctgtgc 360
tttattggcg cggttggcta tgcggcgata caggagtcat ttgaagaggc cgtgtgcatt 420
aagattaccg cgctgatggc gaacgttgcg ctgatcgcgc cgctgttagg gccgttagtg 480
ggcgcggcct gggtccactt actgccgtgg gaaatgatgt ttgttctgtt tgcggtgtta 540
gcggcgattg cgtttttcgg gcttcagaag gcgatgccgg aaaccgcgac ccgcatgggc 600
gagaagctat cggtaaaaga gctggggcgc gattatcgtg aagtgctgaa aaacctgcgc 660
tttgttgcgg gcgcgctggc gaccgggttt gttagcctgc cgctgctggc gtggatcgcg 720
caatcgccgg tgattattat tagcggcgag caggcgacca gctacgaata tggcctgctg 780
caagtgccga tctttggcgc gctgatcgcg gggaacctgg tgctggcgcg ccagacttca 840
cgcaaaacgg tgcgctcgct gatcatctta ggcggctggc cgatcatgat tggcctgctg 900
atttccgcgg ttgcgacggt tgcgtcgacg catgcgtatc tgtggatgac cgccgggctg 960
agcgtctacg cgttcgggat cgggttagcg aacgcgggac tggtgcgtct gacgctgttt 1020
gcgagcgaga tgtcaaaggg gacggtgtcc gcggcgatgg gaatgctgca aatgctgatt 1080
tttaccgttg ggattgaagt ttcaaagcat gcgtatgagt caggcgggag cggattattc 1140
agcctattaa acctgctgag cggagtgtta tggctggcga tgacggttta cttcctgaag 1200
gataaacgcg tgggcaacgc gcatgaaccg cagtaa 1236
<210> 130
<211> 411
<212> PRT
<213> Klebsiella oxytoca
<400> 130
Met Gln Asn Tyr Ser Leu Ser Gly Lys Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ser Val Val Ala Glu Phe Gly
35 40 45
Val Gly Asn Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Thr Ile Glu Gln Phe Thr Leu Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Leu Leu Pro Trp Glu Met Met Phe Val Leu
165 170 175
Phe Ala Val Leu Ala Ala Ile Ala Phe Phe Gly Leu Gln Lys Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Met Gly Glu Lys Leu Ser Val Lys Glu Leu
195 200 205
Gly Arg Asp Tyr Arg Glu Val Leu Lys Asn Leu Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Ala Thr Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn
260 265 270
Leu Val Leu Ala Arg Gln Thr Ser Arg Lys Thr Val Arg Ser Leu Ile
275 280 285
Ile Leu Gly Gly Trp Pro Ile Met Ile Gly Leu Leu Ile Ser Ala Val
290 295 300
Ala Thr Val Ala Ser Thr His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Val Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Tyr Glu Ser Gly Gly Ser Gly Leu Phe Ser Leu Leu Asn
370 375 380
Leu Leu Ser Gly Val Leu Trp Leu Ala Met Thr Val Tyr Phe Leu Lys
385 390 395 400
Asp Lys Arg Val Gly Asn Ala His Glu Pro Gln
405 410
<210> 131
<211> 1233
<212> DNA
<213> Citrobacter koseri (Citrobacter diversus)
<400> 131
atgcaaaacc tttctcaaac tggcgttcgg ctcggacgcc aggctctgct tttccctctc 60
tgtctggtgc tttacgaatt ttcaacctat attggcaacg atatgattca gccagggatg 120
ctggccgttg tggaacagta tcaggccggg attgactggg tcccgacctc gatgactgcc 180
tacctggccg gcggaatgtt tcttcagtgg ctgcttgggc cgctgtcgga tcgtattgga 240
cgccgcccgg tgatgcttgc cggcgtgatt tggtttattg ttacctgcct tgccactctg 300
ctggcgcaaa atattgagca gttcaccctg ctgcgttttc ttcaaggagt aagcctgtgc 360
tttattggcg ccgtgggata cgccgccatt caggaatcgt ttgaagaagc ggtgtgtatt 420
aaaattaccg cgctaatggc taacgtcgcc ctgattgcgc cgcttctggg gccgttagtg 480
ggcgccgcct gggtgcatgt cctgccgtgg gaaggaatgt ttgtcctgtt tgccgtactg 540
gccgcgattg cttttgttgg ccttcagcgc gcgatgccgg agactgcgac ccgccttggc 600
gagaagctgt cgcttaaaga actgggacgg gattataccc tggtgctgaa aaacgtgcgg 660
tttgtcgccg gcgcgctggc gctgggattc gttagcctgc cgctgctggc gtggattgcc 720
cagtcgccga ttataattat tagcggggag cagctcagca gctatgaata tggccttctt 780
caggtccctg tttttggcgc gctgattgcc gggaatctgg tgctggcgcg gcttacctcg 840
cggcgaaccg tgcgcgctct tattattatg ggcggctggc cgattgttgc gggacttctg 900
attgccgctg ccgcgaccgt ggtttcatcg catgcgtatc tatggatgac cgccgggctg 960
agcgtttacg cctttggcat tggcgtggcg aacgccgggc tggtgcgtct gaccctgttt 1020
gccagcgata tgagcaaagg caccgtatca gcggcgatgg gaatgcttca gatgctgatt 1080
tttaccgtgg gaattgaagt gagcaagcat gcttatctga gcggcggcaa cggccttttc 1140
agcctcttca acctggcgaa cggcattctc tggctgctgc ttatggtcat tttcctgaaa 1200
gacaaacggg taggggactc acgggaaggg tga 1233
<210> 132
<211> 410
<212> PRT
<213> Citrobacter koseri (Citrobacter diversus)
<400> 132
Met Gln Asn Leu Ser Gln Thr Gly Val Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln
35 40 45
Ala Gly Ile Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Ala Gly Val Ile Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Leu Leu Arg
100 105 110
Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Val Leu Pro Trp Glu Gly Met Phe Val Leu
165 170 175
Phe Ala Val Leu Ala Ala Ile Ala Phe Val Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Lys Glu Leu
195 200 205
Gly Arg Asp Tyr Thr Leu Val Leu Lys Asn Val Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Ile Ile Ile Ile Ser Gly Glu Gln Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Val Phe Gly Ala Leu Ile Ala Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ala Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Ile Val Ala Gly Leu Leu Ile Ala Ala Ala
290 295 300
Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Val Tyr Ala Phe Gly Ile Gly Val Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Tyr Leu Ser Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Ala Asn Gly Ile Leu Trp Leu Leu Leu Met Val Ile Phe Leu Lys
385 390 395 400
Asp Lys Arg Val Gly Asp Ser Arg Glu Gly
405 410
<210> 133
<211> 1233
<212> DNA
<213> Escherichia marmotae
<400> 133
atgcaaaata aattagcaac tggtgccaga cttgggcgcc aggcattact ttttcctctt 60
tgtctggtgc tttacgaatt ctcgacctat atcggcaacg atatgatcca acctggtatg 120
cttgccgtgg ttgagcagta tcaggctggt attgactggg ttcctacttc gatgaccgct 180
tacctggccg gaggaatgtt tttgcagtgg ctgttaggac cactgtcgga tcgtattggt 240
cgccgtccgg taatgttagc tggcgtggtg tggttcataa tcacctgcct ggcgatatta 300
ctggcgcaaa atattgaaca attcacgctg ttacgctttc ttcaagggat aagcctttgt 360
ttcattggcg ctgttggtta cgccgcgatt caggaatctt ttgaagaagc ggtttgtatc 420
aagatcaccg cgctgatggc gaatgtggcg ctgattgctc cgttacttgg gccattagtt 480
ggtgccgcgt ggattcatgt gttaccttgg gaaggaatgt ttgtgttatt tgctgcatta 540
gcggcgatct cattcttcgg tctgcaacgt gcgatgccag aaacggctac gcgcattggc 600
gagaaactgt cgctgaaaga gcttggtcga gactataagc tggtactgaa gaatagccgc 660
tttgttgcag gagcgctggc gctgggattt gtctcgctgc cgttactggc gtggattgcc 720
cagtcaccga ttatcatcat caccggtgaa cagttatcga gctatgaata tggtttactg 780
caagtgccta ttttcggcgc gttaattgcg ggcaatttac tgctggcacg tctgacctcg 840
cgccgtaccg tacgttcgct gattattatg ggtggctggc cgattatgat tggtctgctg 900
gtcgccgcag cggccacggt catctcatcg cacgcgtatt tatggatgac cgccgggtta 960
tcgatttatg cttttggtat tggtctggcg aatgcagggc tggtgcgttt aacgttattc 1020
gcctcggata tgtcgaaagg gacggtatcc gcggcgatgg gaatgttgca aatgctgatc 1080
tttaccgtag gcattgagat ctcgaaacat gcctggctga atggcggcaa tggattattt 1140
aatttattta atcttgccaa cggtgtttta tggctgctgc tgatgtttat ctttttaaaa 1200
gataaacaaa ctggaaattc taacgacgga taa 1233
<210> 134
<211> 410
<212> PRT
<213> Escherichia marmotae
<400> 134
Met Gln Asn Lys Leu Ala Thr Gly Ala Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln
35 40 45
Ala Gly Ile Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Ala Gly Val Val Trp Phe Ile Ile Thr Cys
85 90 95
Leu Ala Ile Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Leu Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Ile His Val Leu Pro Trp Glu Gly Met Phe Val Leu
165 170 175
Phe Ala Ala Leu Ala Ala Ile Ser Phe Phe Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Ile Gly Glu Lys Leu Ser Leu Lys Glu Leu
195 200 205
Gly Arg Asp Tyr Lys Leu Val Leu Lys Asn Ser Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Ile Ile Ile Ile Thr Gly Glu Gln Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn
260 265 270
Leu Leu Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Ile Met Ile Gly Leu Leu Val Ala Ala Ala
290 295 300
Ala Thr Val Ile Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Ile Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Ile Ser
355 360 365
Lys His Ala Trp Leu Asn Gly Gly Asn Gly Leu Phe Asn Leu Phe Asn
370 375 380
Leu Ala Asn Gly Val Leu Trp Leu Leu Leu Met Phe Ile Phe Leu Lys
385 390 395 400
Asp Lys Gln Thr Gly Asn Ser Asn Asp Gly
405 410
<210> 135
<211> 1227
<212> DNA
<213> Shigella flexneri
<400> 135
atgcaaaata aattggctag tggtgccaga ctcggtcgtc aggcgttgct cttccctctc 60
tgtctggtgc tctacgaatt ttcaacctat atcggcaacg atatgatcca acccggtatg 120
ttggccgttg tggaacaata tcaggccggc attgattggg ttcctacttc gatgaccgcg 180
tatctggccg gcggaatgtt tttgcaatgg ctcctggggc cgctgtcgga tcgtattggt 240
cgtcgtccgg tgatgctggc cggtgtggtg tggtttatcg tcacctgtct ggcaatattg 300
ctggcgcaaa atattgaaca attcaccctg ttgcgtttct tgcagggcat aagcttctgt 360
ttcattggcg ctgtgggata cgccgcaatt caggaaagtt tcgaagaagc ggtttgtatc 420
aagatcaccg cgctgatggc gaacgtggcg ctgattgctc cgctactcgg tccgctggtt 480
ggcgcggcgt ggatccatgt gctgccttgg gaaggaatgt ttgttttgtt tgccgcattg 540
gcagcgatca gttttttcgg tctgcaacga gctatgcctg aaaccgccat gcgtataggc 600
gagaaactgt cactgaaaga actcggtcgt gactataagc tggtgctgaa gaacggccgt 660
tttgtggccg gggcgctggg attcgttagc ctgccattgc tggcgtggat cgcccagtcg 720
ccgattatca tcattaccgg ggagcagttg agcagctatg aatatggctt gctgcaagtg 780
cctattttcg gggcgctcat tgccggtaac ttgctgttgg cgcgtctgac ctcgcgtcgt 840
accgtacgtt cgctgattat tatgggcggc tggccgatta tgattggtct gttggtcgct 900
gctgcggcaa cggttatctc atcgcacgcg tatttgtgga tgaccgccgg gttgagtatt 960
tatgctttcg gtattggtct ggcgaatgcg ggactggtgc gattgaccct gtttgccagc 1020
gatatgagta aaggtacggt ttctgcggcg atgggaatgc tgcaaatgct gatctttacc 1080
gtcggtattg aaatcagcaa acatgcctgg ctgaacgggg gcaacggact gtttaatctc 1140
ttcaacctcg tcaacggaat tttgtggctg tcgctgatgg ttatcttttt gaaagataaa 1200
cagatgggaa attctcacgg aggataa 1227
<210> 136
<211> 408
<212> PRT
<213> Shigella flexneri
<400> 136
Met Gln Asn Lys Leu Ala Ser Gly Ala Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln
35 40 45
Ala Gly Ile Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Ala Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Ile Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Leu Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Phe Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Ile His Val Leu Pro Trp Glu Gly Met Phe Val Leu
165 170 175
Phe Ala Ala Leu Ala Ala Ile Ser Phe Phe Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Met Arg Ile Gly Glu Lys Leu Ser Leu Lys Glu Leu
195 200 205
Gly Arg Asp Tyr Lys Leu Val Leu Lys Asn Gly Arg Phe Val Ala Gly
210 215 220
Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala Gln Ser
225 230 235 240
Pro Ile Ile Ile Ile Thr Gly Glu Gln Leu Ser Ser Tyr Glu Tyr Gly
245 250 255
Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn Leu Leu
260 265 270
Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile Ile Met
275 280 285
Gly Gly Trp Pro Ile Met Ile Gly Leu Leu Val Ala Ala Ala Ala Thr
290 295 300
Val Ile Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu Ser Ile
305 310 315 320
Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg Leu Thr
325 330 335
Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala Met Gly
340 345 350
Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Ile Ser Lys His
355 360 365
Ala Trp Leu Asn Gly Gly Asn Gly Leu Phe Asn Leu Phe Asn Leu Val
370 375 380
Asn Gly Ile Leu Trp Leu Ser Leu Met Val Ile Phe Leu Lys Asp Lys
385 390 395 400
Gln Met Gly Asn Ser His Gly Gly
405
<210> 137
<211> 1233
<212> DNA
<213> Salmonella enterica subsp. Salamae
<400> 137
atgcataatc gtttgcaatc aggcggcaga ctgggtcgtc aggcgctgct ctttcctctt 60
tgtctggtgc tgtacgaatt ttcaacttat attggcaacg acatgatcca gccgggaatg 120
ctggccgtgg tcgcgcagta tcaggcgagc ctggactggg tcccgacgtc gatgaccgct 180
tatctggccg gcggaatgtt cttgcagtgg ctgctcggcc cgttgtcgga ccgtattggc 240
cgtcgtcctg tgatgctggc cggcgttgtg tggtttattg ttacctgcct ggcgacgcta 300
ctggcgaaaa atatcgaaca atttacgttc ctgcgttttt tgcaaggaat tagcttgtgt 360
tttatcggcg ctgtagggta tgccgcgatt caggaatcgt ttgaggaagc ggtatgtata 420
aaaattaccg cgctgatggc gaacgtggcg ttaatcgcgc cgctattggg acccctggtt 480
ggggcagctt gggtgcatgt tctgccgtgg gaaggaatgt ttattttatt tgccgtactg 540
gccgctatcg cctttttcgg gcttcaacgc gctatgccgg agactgccac gcgacggggc 600
gaaacgttat cattcaaagt gctgggccgg gattatcggc tggtgataaa aaaccggcga 660
tttgttgctg gagcgttagc gctgggattt gttagcctgc cgctgttggc ctggattgcg 720
cagtcgccga ttatcatcat tagcggcgaa cagcttagca gctatgaata tgggctgctt 780
caggtgcctg tctttggcgc gctgattgcc gggaatctgg tgttggcgcg tttaacctcg 840
cgacgtacgg tccgctcgct gatcgtaatg ggcggatggc ctattgttgc cgggctgatt 900
atcgccgccg cggcgactgt ggtatcatcg catgcttatt tatggatgac tgcgggatta 960
agcgtatacg cttttggcat tgggctggcg aatgccggac tggtgcggct cacgctattc 1020
tcgagcgata tgtcaaaagg aacggtttcc gcggcgatgg gaatgcttca aatgctgatt 1080
tttaccgtcg gcattgaagt atcaaaacac gcctggttaa gcggcggcaa tgggctattt 1140
agcctgttta atctggctaa cgggattctc tggctactgc tgatgctggt tttcttaaaa 1200
gataagcgga ctggggactc gcaaactggc taa 1233
<210> 138
<211> 410
<212> PRT
<213> Salmonella enterica subsp. Salamae
<400> 138
Met His Asn Arg Leu Gln Ser Gly Gly Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Ala Gln Tyr Gln
35 40 45
Ala Ser Leu Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Ala Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Lys Asn Ile Glu Gln Phe Thr Phe Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Val Leu Pro Trp Glu Gly Met Phe Ile Leu
165 170 175
Phe Ala Val Leu Ala Ala Ile Ala Phe Phe Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Arg Gly Glu Thr Leu Ser Phe Lys Val Leu
195 200 205
Gly Arg Asp Tyr Arg Leu Val Ile Lys Asn Arg Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Ile Ile Ile Ile Ser Gly Glu Gln Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Val Phe Gly Ala Leu Ile Ala Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile
275 280 285
Val Met Gly Gly Trp Pro Ile Val Ala Gly Leu Ile Ile Ala Ala Ala
290 295 300
Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Val Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ser Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Trp Leu Ser Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Ala Asn Gly Ile Leu Trp Leu Leu Leu Met Leu Val Phe Leu Lys
385 390 395 400
Asp Lys Arg Thr Gly Asp Ser Gln Thr Gly
405 410
<210> 139
<211> 1233
<212> DNA
<213> Citrobacter youngae ATCC 29220
<400> 139
atgcagaacc gtctctcatc aggcgcccgg ctgggtcgtc aggctctcct ttttcctctt 60
tgtctggtgc tttacgaatt ctcgacttat atcggcaacg atatgatcca acctggcatg 120
ctcgcggttg tggagcaata taacgccgga ctcgattggg tacctacttc gatgaccgct 180
tatctggccg ggggcatgtt tctccagtgg ctgctcggac cgctgtcgga tcgtattggg 240
cgccgcccgg tgatgctcac cggcgtgctt tggttcattg tgacctgcct tgcgaccctg 300
cttgcgcaga atattgagca atttaccttt ctgcgtttcc tccaagggat aagcctgtgc 360
tttatcggcg cggttggtta cgccgcgatt caggaatcgt ttgaagaagc ggtgtgcata 420
aaaattaccg cgctgatggc taacgtagcg ctgattgcgc cgctgctggg accgctcgtc 480
ggcgctgcct gggtgcatat tctgccgtgg gaaggaatgt ttatcctgtt tgctgccctt 540
gcgtcgatct cgttttttgg tctgcaacgc gcgatgccgg aaacggctac ccggctcggc 600
gaaaagctgt cgattaaaga gctgggtaaa gattataagc tggtgctaaa aaatgggcgc 660
tttgttgccg gtgcgctggc tctcggtttt gtcagcctgc cgctcctggc gtggattgcg 720
caatcgccga ttattatcat cagcggtgaa catcttagca gctacgaata tggcctgctc 780
caggtgccga tttttggcgc tctcattgcc ggtaatctgg cgctggcgcg actgacttcg 840
cgcaagaccg tgcgttcgct gattatcatg ggcggctggc ctatcgccgt cgggctggtg 900
attgccgcgg ccgccacggt tgtgtcatcg catgcgtatc tctggatgac ggccggtctt 960
agcgtctatg cgttcggcat tggtctggcg aatgccgggc tggttcgcct gacgctgttt 1020
gcctcagaaa tgtcaaaggg gacggtttca gcagcaatgg gcatgctcca gatgctgatc 1080
tttaccgtcg gtattgagct gagcaaacac gcttatctgc tgggaggaaa cggcctcttc 1140
agcctgttta atctggctag cggcgtgctg tggctgatac tcatggttat cttcctgaaa 1200
gataaacggg tagggaattc gcggaaaatt taa 1233
<210> 140
<211> 410
<212> PRT
<213> Citrobacter youngae ATCC 29220
<400> 140
Met Gln Asn Arg Leu Ser Ser Gly Ala Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Asn
35 40 45
Ala Gly Leu Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Leu Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Phe Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Ile Leu Pro Trp Glu Gly Met Phe Ile Leu
165 170 175
Phe Ala Ala Leu Ala Ser Ile Ser Phe Phe Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Ile Lys Glu Leu
195 200 205
Gly Lys Asp Tyr Lys Leu Val Leu Lys Asn Gly Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Ile Ile Ile Ile Ser Gly Glu His Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn
260 265 270
Leu Ala Leu Ala Arg Leu Thr Ser Arg Lys Thr Val Arg Ser Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Ile Ala Val Gly Leu Val Ile Ala Ala Ala
290 295 300
Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Val Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Leu Ser
355 360 365
Lys His Ala Tyr Leu Leu Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Ala Ser Gly Val Leu Trp Leu Ile Leu Met Val Ile Phe Leu Lys
385 390 395 400
Asp Lys Arg Val Gly Asn Ser Arg Lys Ile
405 410
<210> 141
<211> 1233
<212> DNA
<213> Citrobacter freundii
<400> 141
atgcagaacc gtctttcttc aggcgcccgc ttggggcgcc aggcactcct tttccctctt 60
tgtctggtgc tttacgaatt ctctacttat atcggtaacg atatgatcca acctggaatg 120
ttagcggttg tggagcaata tcaggccggt cttgattggg ttccaacgtc gatgaccgct 180
tatctggcag gcggcatgtt tctccagtgg ttgctcgggc cgctgtctga ccgtgttggt 240
cgtcgtccgg tgatgctcac cggagtggtt tggttcattg tgacctgcct agcaacgctg 300
tttgctcaaa atattgagca atttactttc ctgcgttttc tccaagggat tagcctgtgc 360
tttattggcg cggtcggtta cgccgcaatt caggagtcgt ttgaagaagc ggtgtgcatt 420
aaaatcactg cgctaatggc aaacgtagca ttgattgcac cgcttttggg accgttggtt 480
ggggccgcct gggtccatgt ccttccgtgg gaaggcatgt ttgtcctgtt tgccgcgctg 540
gctgcaattg ccttttttgg cctgcagcgc gcgatgccgg aaacggctac ccgtctgggc 600
gagaagcttt ctatcaaaga gttgggcaaa gattataagc tggtgctaaa gaatgtgcgt 660
tttgtcgcag gcgcactggc attgggcttt gtctcactgc cattgctggc gtggattgcg 720
cagtcgccga tcattattat ctcaggcgaa catcttagca gctacgaata tggcctgctc 780
caggtgccga tttttggtgc actgattgca ggcaacctgg tgctggcgcg tctgacttcg 840
cgccgcacgg tgcgctctct gatcatcatg ggtggctggc caatctccgt gggattgatc 900
attgccgccg cggccacggt tgtttcttct catgcgtatc tgtggatgac ggctggtctt 960
tcactttatg catttggcat tggcgtggcg aatgccgggt tggtgcgcct gacgctgttt 1020
gcctcagaaa tgagcaaagg gactgtttca gcagcaatgg gtatgctgca aatgctgata 1080
tttaccgttg gtattgagct gagcaaacat gcttatctgc tgggtggaaa cggcttgttc 1140
tcactgttta atctggccag cggtgtgctg tggctgattc tgatggttat ctttctgaaa 1200
gataagcgag tagggaattc gcgggaaggc taa 1233
<210> 142
<211> 410
<212> PRT
<213> Citrobacter freundii
<400> 142
Met Gln Asn Arg Leu Ser Ser Gly Ala Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Gln
35 40 45
Ala Gly Leu Asp Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Val Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Phe Ala Gln Asn Ile Glu Gln Phe Thr Phe Leu Arg
100 105 110
Phe Leu Gln Gly Ile Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Val Leu Pro Trp Glu Gly Met Phe Val Leu
165 170 175
Phe Ala Ala Leu Ala Ala Ile Ala Phe Phe Gly Leu Gln Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Ile Lys Glu Leu
195 200 205
Gly Lys Asp Tyr Lys Leu Val Leu Lys Asn Val Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Leu Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Ile Ile Ile Ile Ser Gly Glu His Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ala Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Ile Ser Val Gly Leu Ile Ile Ala Ala Ala
290 295 300
Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Leu Tyr Ala Phe Gly Ile Gly Val Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Leu Ser
355 360 365
Lys His Ala Tyr Leu Leu Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Ala Ser Gly Val Leu Trp Leu Ile Leu Met Val Ile Phe Leu Lys
385 390 395 400
Asp Lys Arg Val Gly Asn Ser Arg Glu Gly
405 410
<210> 143
<211> 1230
<212> DNA
<213> Enterobacter kobei
<400> 143
atgcaaaacc attcacttcc cggccgccgt cttggacgcc aggcgcttct ttttccgttg 60
tgtctggtcc tgtacgaatt ctcaacttat attgcgaacg acatgattca gccgggcatg 120
ttagcggttg tagagcagta taacgcgggc attgaatggg taccgacctc gatgaccgcg 180
tatttagcgg gcggaatgtt tcttcagtgg ctgctggggc cgctgtcgga tcgtatcggc 240
cgtcgcccgg tcatgcttac cggcgtggtg tggtttattg tcacctgtct ggctaccctt 300
ctggcgcagg acattgaaca gttcactctg ctgcgctttc ttcaaggcgt gagcctgtgc 360
tttatcggcg ccgtgggcta tgcggcgatc caggagtcgt ttgacgaggc gacctgtatt 420
aagattactg ctcttatggc gaacgtggcg ctgattgcgc ctctgctggg gccgctggtt 480
ggtgcggcct gggtgcatgc tgcgccttgg gaaggcatgt ttgtgctgtt cgcggtactg 540
gccgcgatcg cgtttttcgg cctgcatcgc gcgatgccgg aaaccgcgac gagattaggg 600
gagccccttt cgcttaacgc gctgggccgg gattataaag cggtgctgaa aaatggccgc 660
ttcgttgcgg gcgcgctggc gacgggcttt gtcagcctgc cgctgctggc gtggattgcg 720
cagtcgccga tcattattat tagcgcggaa ggcatgtcga gctatgagta cggtctgctt 780
caggtgccta tctttggcgc gctgatcatt ggtaacctgg tgctggcgcg tctgacctca 840
cgccgtaccg tgagatcgct gatcatcatg ggcggcgggc cgatcgtcgc gggactgctg 900
gtcgcggccg tggctaccgt ggcgtcatcg catgcgtatc tttggatgac cgcgggcctg 960
tcaatctatg cttttggtat cggccttgcg aacgccgggc tggtgcgcct gacgctgttc 1020
gcgagcgata tgtcaaaagg taccgtgtca gcggctatgg gcatgctgca aatggcgatc 1080
ttcaccgtcg gcattgaagt ctcaaaacat gcgtttctgg ccggcggcaa tggcctgttc 1140
agcctgttta atctggcgaa cgggcttatt tggctggcgc tgatggttgt attcctgaag 1200
gataaaacgg tcggcaacgc gctttcataa 1230
<210> 144
<211> 409
<212> PRT
<213> Enterobacter kobei
<400> 144
Met Gln Asn His Ser Leu Pro Gly Arg Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Ala
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Asn
35 40 45
Ala Gly Ile Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Asp Ile Glu Gln Phe Thr Leu Leu Arg
100 105 110
Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Asp Glu Ala Thr Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Ala Ala Pro Trp Glu Gly Met Phe Val Leu
165 170 175
Phe Ala Val Leu Ala Ala Ile Ala Phe Phe Gly Leu His Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Pro Leu Ser Leu Asn Ala Leu
195 200 205
Gly Arg Asp Tyr Lys Ala Val Leu Lys Asn Gly Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Ile Ile Ile Ile Ser Ala Glu Gly Met Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ile Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile
275 280 285
Ile Met Gly Gly Gly Pro Ile Val Ala Gly Leu Leu Val Ala Ala Val
290 295 300
Ala Thr Val Ala Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Ile Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Asp Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Ala Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Phe Leu Ala Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Ala Asn Gly Leu Ile Trp Leu Ala Leu Met Val Val Phe Leu Lys
385 390 395 400
Asp Lys Thr Val Gly Asn Ala Leu Ser
405
<210> 145
<211> 1236
<212> DNA
<213> Enterobacter sp.
<400> 145
atgctaaacc ggtcatcatc aggcactcgc ctgggtcggc aggcgctact attcccactg 60
tgcctggtgc tatacgagtt ctcgacctat attgggaacg atatgattca gccaggcatg 120
ttagccgtgg ttgcgcagta taacgcgggc attgaatggg tgccaacctc gatgaccgct 180
tacctggccg gtggcatgtt tcttcagtgg ctgttaggcc cgctgagcga ccggatcggc 240
cgacggccgg tgatgttaac cggtgtggcg tggtttattg ttacctgtct ggcgaccctg 300
ctggcgcaaa ccattgaaca gtttatggtg ctgcggtttc ttcaaggtgt tagcctgtgc 360
tttattggcg cggttggtta cgcggcgatt caggaaagct ttgaagaagc ggtgtgcatt 420
aaaattaccg cgctgatggc taacgtggcg ctgatcgcgc cgctgctggg cccgctggta 480
ggcgcggcct gggtgcatgt tgcgccctgg gaaggcatgt ttgtgctgtt tgcggtgcta 540
gcggcgatta gcttttatgg gctgcatcgg gcgatgccag agactgctac ccgcattggc 600
gagaagttat cactgcagga actgggtcgc gactataaag aagtgctgaa aaacgggcgc 660
tttgtggccg gtgcgctggc gatcggcttt gtttgtctgc cgctgctggc gtggattgcg 720
cagagcccgg tgattattat tagcggcgag aacttaagca gctacgagta tggcctgctc 780
caggtgccga tctttggggc gctgatcgtg gggaatattg tgctggcgcg gctaaccagc 840
cgccggaccg tgcgcagcct gatcatcatg ggcggctggc cgattgtgat cggtctggtt 900
gttgcggccg tggcgactgt tgtttcaagc catgcgtacc tgtggatgac cgccgggtta 960
agcatttacg cgtttgggat cggtctggct aacgcgggcc tggtgcgcct gactctgttt 1020
gcgagcgaag tgagcaaagg tactgtgagc gcggcgatgg gcatgcttca gatgctgatt 1080
tttaccgtgg gcatcgaagt gagcaaacat gcgttcagca gcggcggcaa cggtctgttc 1140
agcctgttta atctggtaaa cggcctgctg tggctggcgc tgatgtttgt tttcctgaaa 1200
gacaagcgag tgggctcaag ccttcaaccg ggataa 1236
<210> 146
<211> 411
<212> PRT
<213> Enterobacter sp.
<400> 146
Met Leu Asn Arg Ser Ser Ser Gly Thr Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Ala Gln Tyr Asn
35 40 45
Ala Gly Ile Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Ala Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Thr Ile Glu Gln Phe Met Val Leu Arg
100 105 110
Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Val Ala Pro Trp Glu Gly Met Phe Val Leu
165 170 175
Phe Ala Val Leu Ala Ala Ile Ser Phe Tyr Gly Leu His Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Ile Gly Glu Lys Leu Ser Leu Gln Glu Leu
195 200 205
Gly Arg Asp Tyr Lys Glu Val Leu Lys Asn Gly Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Ile Gly Phe Val Cys Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Asn Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Val Gly Asn
260 265 270
Ile Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ser Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Ile Val Ile Gly Leu Val Val Ala Ala Val
290 295 300
Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Ile Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Glu Val Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Phe Ser Ser Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Val Asn Gly Leu Leu Trp Leu Ala Leu Met Phe Val Phe Leu Lys
385 390 395 400
Asp Lys Arg Val Gly Ser Ser Leu Gln Pro Gly
405 410
<210> 147
<211> 1230
<212> DNA
<213> Lelliottia sp. WB101
<400> 147
atgctaaacc gttcatcatc gggtaaccgt ctgggtcgtc aggcgctact ttttcctctg 60
tgtctggtgc tttatgaatt ttcgacctat attggcaatg atatgattca gccgggtatg 120
ttagcggttg tggagcagta taacgccggg attgaatggg taccgacttc gatgaccgcg 180
tacctggctg gcggcatgtt ccttcagtgg ctgctggggc cgctgtcgga tcgcatcggc 240
cgtcgcccgg tgatgctgac tggcgtggtg tggttcattg ttacctgctt agcgatcctg 300
ctggctcaaa cgatcgaaca atttactctg ctgcgatttc ttcaaggagt gagcctgtgc 360
ttcattggcg ccgtgggata cgcggctatc caggagtcgt tcgaggaagc ggtgtgtatt 420
aaaattaccg cgctgatggc gaacgtggcg ctgatcgcgc cgctgttagg cccgttagtg 480
ggcgcggcct gggtgcatgt agcgccgtgg gaaggaatgt tcgtgctgtt tgcggctctt 540
gcggcgatct cgttttttgg ccttcatcgc gctatgcctg aaaccgcgac tcgactgggc 600
gaaaaactgt cgcttaaaga gctggggcgc gactataaag aagtgttaag gaatggccgc 660
ttcgtggccg gcgcgctggc gaccgggttc gttagcctgc cgctgctggc gtggatcgcg 720
cagtcaccgg ttatcatcat cagcggtgag aagttatcaa gctatgaata tggtctactc 780
caggtgcctg tattcggcgc gctgatcatt ggtaacctgg tgctggctcg cttaacttcg 840
cgtcgtagcg tgcgttcgct gattatcatg ggcggctggc cgatcgtggc cgggctggtt 900
gtagctgcgg tagcgaccgt tgcgtcatct catgcgtacc tgtggatgac tgccgggctg 960
tcaatctacg cgttcgggat cgggctggcg aatgccgggc tggtgcgcct gacgctgttc 1020
gcgagcgaga tgtcaaaagg caccgtatcg gccgctatgg gaatgctgca gatgctgatt 1080
ttcaccgtgg gcatcgaagt ttcaaaacat gcgtatagct tcggcggcaa cgggctgttt 1140
agcctgttca acttagcgaa tggcgtgctg tggttagggc tgatggtgat gtttctgaaa 1200
gataaacgcg ttggtagcgc gcttcagtaa 1230
<210> 148
<211> 409
<212> PRT
<213> Lelliottia sp. WB101
<400> 148
Met Leu Asn Arg Ser Ser Ser Gly Asn Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Asn
35 40 45
Ala Gly Ile Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Ile Leu Leu Ala Gln Thr Ile Glu Gln Phe Thr Leu Leu Arg
100 105 110
Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Val Ala Pro Trp Glu Gly Met Phe Val Leu
165 170 175
Phe Ala Ala Leu Ala Ala Ile Ser Phe Phe Gly Leu His Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Lys Glu Leu
195 200 205
Gly Arg Asp Tyr Lys Glu Val Leu Arg Asn Gly Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Lys Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Val Phe Gly Ala Leu Ile Ile Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Ser Val Arg Ser Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Ile Val Ala Gly Leu Val Val Ala Ala Val
290 295 300
Ala Thr Val Ala Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Ile Tyr Ala Phe Gly Ile Gly Leu Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Tyr Ser Phe Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Ala Asn Gly Val Leu Trp Leu Gly Leu Met Val Met Phe Leu Lys
385 390 395 400
Asp Lys Arg Val Gly Ser Ala Leu Gln
405
<210> 149
<211> 1233
<212> DNA
<213> Enterobacter ludwigii EcWSU1
<400> 149
atgcttaacc gttcatcatc aggttcacgt ctgggtcgtc aggcgcttct ctttcctctt 60
tgtctggtgt tatatgaatt ttcaacttat attggcaacg atatgattca gcctggcatg 120
ctggccgtcg ttgaacagta taacgctggg attgaatggg taccgacttc gatgaccgcg 180
tacctggctg gcggcatgtt ccttcagtgg ctgcttgggc cgctgtcgga tcgtatcggc 240
cgtcgtccgg tgatgctgac tggcgtggtg tggttcattg tgacctgctt agcgacgctg 300
ctggcgcaaa atatcgagca attcaccctg ctgcgctttc tgcaaggagt gagcttatgc 360
tttattggtg cggttgggta cgcggcgatt caggaatcgt tcgaggaagc ggtgtgtatt 420
aagatcaccg cgctgatggc gaacgtggcg ctgattgcgc ctctgctggg gccgctggtt 480
ggcgctgcct gggtccatgt cgctccgtgg gaaggaatgt ttgtgctgtt cgcggtgctg 540
gccgcggttg cttttttcgg cctgcatcgc gcgatgccgg aaaccgctac ccgtctgggt 600
gagaaactgt cgctaaaaga gctgggccgg gattataaag aagtgctgaa gaacggccgc 660
ttcgttgcgg gcgcgctagc gactgggttc gtcagcctgc ctctgctggc gtggatcgcg 720
cagtcgccgg ttatcattat tagcggcgag cagttaagca gctacgagta cggcctgctc 780
caggtgccta tcttcggcgc gctgatcatt ggtaacctgg tgctggcgcg tttaacttcg 840
cgccgtacgg tgcgtgcgct tattatcatg ggcggctggc ctatcgctgc cgggctggtc 900
ttagcggccg ttgcgactgt ggtgtcgtcc cacgcgtacc tgtggatgac cgctggactt 960
agcgtctatg cgtttggtat tggtgtggcg aatgccgggc tggtacgcct gacgctgttc 1020
gcgagcgaga tgagcaaagg cacggtgtca gcggcgatgg gcatgcttca aatgctgatc 1080
tttaccgtcg gaattgaagt gagcaaacat gcgtatgctt tcggcggcaa cggtctgttt 1140
agcctgttca atctggctaa cggcgtgtta tgggtcgggc tcattgtggt gtttctgaag 1200
gataaacgcg ttgggaatgc tcttcagccg taa 1233
<210> 150
<211> 410
<212> PRT
<213> Enterobacter ludwigii EcWSU1
<400> 150
Met Leu Asn Arg Ser Ser Ser Gly Ser Arg Leu Gly Arg Gln Ala Leu
1 5 10 15
Leu Phe Pro Leu Cys Leu Val Leu Tyr Glu Phe Ser Thr Tyr Ile Gly
20 25 30
Asn Asp Met Ile Gln Pro Gly Met Leu Ala Val Val Glu Gln Tyr Asn
35 40 45
Ala Gly Ile Glu Trp Val Pro Thr Ser Met Thr Ala Tyr Leu Ala Gly
50 55 60
Gly Met Phe Leu Gln Trp Leu Leu Gly Pro Leu Ser Asp Arg Ile Gly
65 70 75 80
Arg Arg Pro Val Met Leu Thr Gly Val Val Trp Phe Ile Val Thr Cys
85 90 95
Leu Ala Thr Leu Leu Ala Gln Asn Ile Glu Gln Phe Thr Leu Leu Arg
100 105 110
Phe Leu Gln Gly Val Ser Leu Cys Phe Ile Gly Ala Val Gly Tyr Ala
115 120 125
Ala Ile Gln Glu Ser Phe Glu Glu Ala Val Cys Ile Lys Ile Thr Ala
130 135 140
Leu Met Ala Asn Val Ala Leu Ile Ala Pro Leu Leu Gly Pro Leu Val
145 150 155 160
Gly Ala Ala Trp Val His Val Ala Pro Trp Glu Gly Met Phe Val Leu
165 170 175
Phe Ala Val Leu Ala Ala Val Ala Phe Phe Gly Leu His Arg Ala Met
180 185 190
Pro Glu Thr Ala Thr Arg Leu Gly Glu Lys Leu Ser Leu Lys Glu Leu
195 200 205
Gly Arg Asp Tyr Lys Glu Val Leu Lys Asn Gly Arg Phe Val Ala Gly
210 215 220
Ala Leu Ala Thr Gly Phe Val Ser Leu Pro Leu Leu Ala Trp Ile Ala
225 230 235 240
Gln Ser Pro Val Ile Ile Ile Ser Gly Glu Gln Leu Ser Ser Tyr Glu
245 250 255
Tyr Gly Leu Leu Gln Val Pro Ile Phe Gly Ala Leu Ile Ile Gly Asn
260 265 270
Leu Val Leu Ala Arg Leu Thr Ser Arg Arg Thr Val Arg Ala Leu Ile
275 280 285
Ile Met Gly Gly Trp Pro Ile Ala Ala Gly Leu Val Leu Ala Ala Val
290 295 300
Ala Thr Val Val Ser Ser His Ala Tyr Leu Trp Met Thr Ala Gly Leu
305 310 315 320
Ser Val Tyr Ala Phe Gly Ile Gly Val Ala Asn Ala Gly Leu Val Arg
325 330 335
Leu Thr Leu Phe Ala Ser Glu Met Ser Lys Gly Thr Val Ser Ala Ala
340 345 350
Met Gly Met Leu Gln Met Leu Ile Phe Thr Val Gly Ile Glu Val Ser
355 360 365
Lys His Ala Tyr Ala Phe Gly Gly Asn Gly Leu Phe Ser Leu Phe Asn
370 375 380
Leu Ala Asn Gly Val Leu Trp Val Gly Leu Ile Val Val Phe Leu Lys
385 390 395 400
Asp Lys Arg Val Gly Asn Ala Leu Gln Pro
405 410
<210> 151
<211> 654
<212> DNA
<213> Actinoplanes utahensis
<400> 151
atgctaaccc atgtgtttgg cctattaggc gcggcgctga gcatgagcat tgcgtggcct 60
caggtgtatc gcagctgcgt gcgtcgtcgt accggcggcc tgagcgcgac cgcgtgcatg 120
ctggccgtgg cgatgccgct gggctgggtg acctatgggc tgctgattgg agaccgattt 180
caagtggtga cgaacgcggt gagcgcgagc accggagtgg cgattctgat tgcgctgctg 240
gtgacccgac cagcggtgcg cagcggccgc gcgctgctgg cgagcgtggg cgcggccgcc 300
ggagtgctgc tggccgtgac ggcgattgcg gcgagcgcgg cgctgcctca ggtgagcggg 360
ccgcgcgccg cggcgatgct gggcaccgtg ctggccgcga ttagctttgt gagcgcgata 420
ccgcagccgt tagcgctgct gcgtgatcgc gatcaggata ttagcgggct gagcccggtg 480
cgttggacgc tcgcggcgag cgcgtgcgcg agctggtttg cgtatggctt aggagtgggg 540
cagccagcgg tgtgggcgag cgcgttagtg ggcctgacca gcgcgctgac cgtgtgcggc 600
gtgctgttta cccgtcgtgc gggcgccggc gtgcgcgtgc tggcgaccgc gtaa 654
<210> 152
<211> 217
<212> PRT
<213> Actinoplanes utahensis
<400> 152
Met Leu Thr His Val Phe Gly Leu Leu Gly Ala Ala Leu Ser Met Ser
1 5 10 15
Ile Ala Trp Pro Gln Val Tyr Arg Ser Cys Val Arg Arg Arg Thr Gly
20 25 30
Gly Leu Ser Ala Thr Ala Cys Met Leu Ala Val Ala Met Pro Leu Gly
35 40 45
Trp Val Thr Tyr Gly Leu Leu Ile Gly Asp Arg Phe Gln Val Val Thr
50 55 60
Asn Ala Val Ser Ala Ser Thr Gly Val Ala Ile Leu Ile Ala Leu Leu
65 70 75 80
Val Thr Arg Pro Ala Val Arg Ser Gly Arg Ala Leu Leu Ala Ser Val
85 90 95
Gly Ala Ala Ala Gly Val Leu Leu Ala Val Thr Ala Ile Ala Ala Ser
100 105 110
Ala Ala Leu Pro Gln Val Ser Gly Pro Arg Ala Ala Ala Met Leu Gly
115 120 125
Thr Val Leu Ala Ala Ile Ser Phe Val Ser Ala Ile Pro Gln Pro Leu
130 135 140
Ala Leu Leu Arg Asp Arg Asp Gln Asp Ile Ser Gly Leu Ser Pro Val
145 150 155 160
Arg Trp Thr Leu Ala Ala Ser Ala Cys Ala Ser Trp Phe Ala Tyr Gly
165 170 175
Leu Gly Val Gly Gln Pro Ala Val Trp Ala Ser Ala Leu Val Gly Leu
180 185 190
Thr Ser Ala Leu Thr Val Cys Gly Val Leu Phe Thr Arg Arg Ala Gly
195 200 205
Ala Gly Val Arg Val Leu Ala Thr Ala
210 215
<210> 153
<211> 261
<212> DNA
<213> Chitinophagaceae bacterium PMG_246
<400> 153
atggataaaa cccagattgt aggcattgtt gcgggcatac tcactgcgag cagcctgctg 60
cctcaggtga ttaaaaccct aaaagaaaag aaggccgccg aagtaagcat tggcatgctg 120
attacgctga tgttaggcgt agcactgtgg attgtatatg gctttctgcg cgatgatctg 180
ccgattattg taacgaactg cttcagcctg ctggtgaatc tgaccatgat tggactgcgg 240
ctgaagtata ggcatcgctg a 261
<210> 154
<211> 86
<212> PRT
<213> Chitinophagaceae bacterium PMG_246
<400> 154
Met Asp Lys Thr Gln Ile Val Gly Ile Val Ala Gly Ile Leu Thr Ala
1 5 10 15
Ser Ser Leu Leu Pro Gln Val Ile Lys Thr Leu Lys Glu Lys Lys Ala
20 25 30
Ala Glu Val Ser Ile Gly Met Leu Ile Thr Leu Met Leu Gly Val Ala
35 40 45
Leu Trp Ile Val Tyr Gly Phe Leu Arg Asp Asp Leu Pro Ile Ile Val
50 55 60
Thr Asn Cys Phe Ser Leu Leu Val Asn Leu Thr Met Ile Gly Leu Arg
65 70 75 80
Leu Lys Tyr Arg His Arg
85
<210> 155
<211> 252
<212> DNA
<213> Rhizobium sp. PDC82
<400> 155
atgatagatg ctgggctcct ggtcgggtat ttagcgagca tctgcagcgt tgcccggaaa 60
gtggtaaaga ccggggacac tgctgcgatc agcgcgcgca tgtatgtttt aaccgttatt 120
ggcttcgcct tatggaccgg gtttgggcta ttacgcggcg agtggccgat tatcctcacc 180
aatagcattt gcttctgcct gagcggcgtc gtgttatttc gaaaattaac cgcccgcaat 240
cgcgccgggt aa 252
<210> 156
<211> 83
<212> PRT
<213> Rhizobium sp. PDC82
<400> 156
Met Ile Asp Ala Gly Leu Leu Val Gly Tyr Leu Ala Ser Ile Cys Ser
1 5 10 15
Val Ala Arg Lys Val Val Lys Thr Gly Asp Thr Ala Ala Ile Ser Ala
20 25 30
Arg Met Tyr Val Leu Thr Val Ile Gly Phe Ala Leu Trp Thr Gly Phe
35 40 45
Gly Leu Leu Arg Gly Glu Trp Pro Ile Ile Leu Thr Asn Ser Ile Cys
50 55 60
Phe Cys Leu Ser Gly Val Val Leu Phe Arg Lys Leu Thr Ala Arg Asn
65 70 75 80
Arg Ala Gly
<210> 157
<211> 687
<212> DNA
<213> Kineococcus rhizosphaerae DSM 19711
<400> 157
atgccggtga ccaccctaat ttcaagctta ggattattag ccgcgggatt aggcgtgttt 60
tgcggtattc ctcaggttgt gcgcttagtg cgtgatccgg atgcgaccgg cctgagctat 120
ccgagcgcgg tgttaggcgc gttagcgagc gcgacctggt taagctatgg cgtggcgctg 180
cgcgacccgg cgcagttagt ggcgaacgtg ccgggtattg tgtgcgcggt gttaaccgtg 240
gtgttagcgg cgaaacgtct gggcctgccg ctgcgcaccg cggcgtatgc ggccgccggt 300
tgggcgccgt tagttgcggc cgcgtttgcg ttaggtggcg ttgtggttgt tggcgtgctg 360
ggcaccaccg tgagcttagt gaaaatgctg ccgcagattt taaccgtggt gcgccgcgat 420
ccggtgcatg gcctggcgcc ggcgaccttt gtgttaaccc aggtgagcgc gaccctgtgg 480
accgcgtatg gcctggcgac cgggcagtgg agcgttgtgg tgtgcagcgc ggtgaccgtg 540
gtgctggccg gtattgtgct gagccgccgc tgcccgccgt tagcggttgc gcgcgcgctg 600
catgaaggcc gctttggcgt gccgggtcag ttattagtgc gcccgtttgt gctggcgcgt 660
cgtgcgggct taaccctggc cgcgtaa 687
<210> 158
<211> 228
<212> PRT
<213> Kineococcus rhizosphaerae DSM 19711
<400> 158
Met Pro Val Thr Thr Leu Ile Ser Ser Leu Gly Leu Leu Ala Ala Gly
1 5 10 15
Leu Gly Val Phe Cys Gly Ile Pro Gln Val Val Arg Leu Val Arg Asp
20 25 30
Pro Asp Ala Thr Gly Leu Ser Tyr Pro Ser Ala Val Leu Gly Ala Leu
35 40 45
Ala Ser Ala Thr Trp Leu Ser Tyr Gly Val Ala Leu Arg Asp Pro Ala
50 55 60
Gln Leu Val Ala Asn Val Pro Gly Ile Val Cys Ala Val Leu Thr Val
65 70 75 80
Val Leu Ala Ala Lys Arg Leu Gly Leu Pro Leu Arg Thr Ala Ala Tyr
85 90 95
Ala Ala Ala Gly Trp Ala Pro Leu Val Ala Ala Ala Phe Ala Leu Gly
100 105 110
Gly Val Val Val Val Gly Val Leu Gly Thr Thr Val Ser Leu Val Lys
115 120 125
Met Leu Pro Gln Ile Leu Thr Val Val Arg Arg Asp Pro Val His Gly
130 135 140
Leu Ala Pro Ala Thr Phe Val Leu Thr Gln Val Ser Ala Thr Leu Trp
145 150 155 160
Thr Ala Tyr Gly Leu Ala Thr Gly Gln Trp Ser Val Val Val Cys Ser
165 170 175
Ala Val Thr Val Val Leu Ala Gly Ile Val Leu Ser Arg Arg Cys Pro
180 185 190
Pro Leu Ala Val Ala Arg Ala Leu His Glu Gly Arg Phe Gly Val Pro
195 200 205
Gly Gln Leu Leu Val Arg Pro Phe Val Leu Ala Arg Arg Ala Gly Leu
210 215 220
Thr Leu Ala Ala
225
<210> 159
<211> 279
<212> DNA
<213> Morganella morganii IS15
<400> 159
atgtcggata ctaaacgtcc gccgcacgat catagccgtt ttattcgttg tctcggttgg 60
gttgccacct ttactgcctt ttgcatgtat gttagctata tcccccagat catggataac 120
ctggccgggc ataaaacttc gccgctgcag ccgctggctg cggcctttaa ttgcactctt 180
tgggtgatct acggtcttaa agtgaaagat ctgccggtcg ccgttgcgaa cgcgcccggt 240
gttctgttcg ggctggccgc catgctgact gccttgtag 279
<210> 160
<211> 92
<212> PRT
<213> Morganella morganii IS15
<400> 160
Met Ser Asp Thr Lys Arg Pro Pro His Asp His Ser Arg Phe Ile Arg
1 5 10 15
Cys Leu Gly Trp Val Ala Thr Phe Thr Ala Phe Cys Met Tyr Val Ser
20 25 30
Tyr Ile Pro Gln Ile Met Asp Asn Leu Ala Gly His Lys Thr Ser Pro
35 40 45
Leu Gln Pro Leu Ala Ala Ala Phe Asn Cys Thr Leu Trp Val Ile Tyr
50 55 60
Gly Leu Lys Val Lys Asp Leu Pro Val Ala Val Ala Asn Ala Pro Gly
65 70 75 80
Val Leu Phe Gly Leu Ala Ala Met Leu Thr Ala Leu
85 90
<210> 161
<211> 822
<212> DNA
<213> Geodermatophilus obscurus (strain ATCC 25078 / DSM 43160 / JCM 3152 / G-20)
<400> 161
atgacctcac cggtgattcc cgctgcggtt gcgctgccgc tgaccgatga acgcccggaa 60
ccggcgtgtg gctgtcccgc gcgccgctgg ccgcatccca gccagagcac cagaacggag 120
ccacgcagca ccatgattgc ggcgctgggc agcctggccg cggcgctgag cattaccgtg 180
gtgtggcccc aggtgtggct gagctgccgc catggccgca ccctgggcct gagcccgacg 240
ggcagctggc tggccgtggg cctgaacctg tgctggctga ccagcggcct gctggttggc 300
gataccccgc agattgcgac ccatgccgtg gttggcgcgg gcaataccgc ggtgctggcc 360
gcgctgctgc tgacccagcc gcatgcgcgc agcgcgcaag tgctgctgcg caccgccgcg 420
ggagccgcgg gcctggccgc gctggccgcg ggcggcgttg cggccgtggt gctgggagcg 480
gatacgactc aggtgacgag cgtgctggcg agcgtgacca ccgtggttgg cattgtggcc 540
gcgctgcctc agctgctggg cattctgttt gatcgcgcgc aggatctgag cggcatgagc 600
ccggcgcgct ggtatctggg cgcgggcagc tgcgcgagct ggaccgcgta tggctggctg 660
ctggggcagc cgacggtgtg gctgagcgcg ggctttggcc tggtgtgcgc ggtgaccacc 720
tgcgcggtgc tgcgcacccg ccgcccggcg ccccccgcgg ctccagtggt gccgctgcgc 780
ccggctgctg cgccgcgcag agtgctggcc gccgcggcgt aa 822
<210> 162
<211> 273
<212> PRT
<213> Geodermatophilus obscurus (strain ATCC 25078 / DSM 43160 / JCM 3152 / G-20)
<400> 162
Met Thr Ser Pro Val Ile Pro Ala Ala Val Ala Leu Pro Leu Thr Asp
1 5 10 15
Glu Arg Pro Glu Pro Ala Cys Gly Cys Pro Ala Arg Arg Trp Pro His
20 25 30
Pro Ser Gln Ser Thr Arg Thr Glu Pro Arg Ser Thr Met Ile Ala Ala
35 40 45
Leu Gly Ser Leu Ala Ala Ala Leu Ser Ile Thr Val Val Trp Pro Gln
50 55 60
Val Trp Leu Ser Cys Arg His Gly Arg Thr Leu Gly Leu Ser Pro Thr
65 70 75 80
Gly Ser Trp Leu Ala Val Gly Leu Asn Leu Cys Trp Leu Thr Ser Gly
85 90 95
Leu Leu Val Gly Asp Thr Pro Gln Ile Ala Thr His Ala Val Val Gly
100 105 110
Ala Gly Asn Thr Ala Val Leu Ala Ala Leu Leu Leu Thr Gln Pro His
115 120 125
Ala Arg Ser Ala Gln Val Leu Leu Arg Thr Ala Ala Gly Ala Ala Gly
130 135 140
Leu Ala Ala Leu Ala Ala Gly Gly Val Ala Ala Val Val Leu Gly Ala
145 150 155 160
Asp Thr Thr Gln Val Thr Ser Val Leu Ala Ser Val Thr Thr Val Val
165 170 175
Gly Ile Val Ala Ala Leu Pro Gln Leu Leu Gly Ile Leu Phe Asp Arg
180 185 190
Ala Gln Asp Leu Ser Gly Met Ser Pro Ala Arg Trp Tyr Leu Gly Ala
195 200 205
Gly Ser Cys Ala Ser Trp Thr Ala Tyr Gly Trp Leu Leu Gly Gln Pro
210 215 220
Thr Val Trp Leu Ser Ala Gly Phe Gly Leu Val Cys Ala Val Thr Thr
225 230 235 240
Cys Ala Val Leu Arg Thr Arg Arg Pro Ala Pro Pro Ala Ala Pro Val
245 250 255
Val Pro Leu Arg Pro Ala Ala Ala Pro Arg Arg Val Leu Ala Ala Ala
260 265 270
Ala
<210> 163
<211> 252
<212> DNA
<213> Bradyrhizobium sp. BTAi1
<400> 163
atgctgacca ccctgattgg cctgggcgcg gcgacctgca ccacttgcag ctttctgcct 60
caggtgatta aagcgtggcg aagccgcagc acccaggata ttagcgcggg catgtttgtg 120
ctgctgacca ccggcaacgc gatgtggctg ctatacggcg cgctgattaa cgatctgccg 180
ttagtggttg cgaacctgat taccctggcg ttagtggcga ccattctggg cctgaaactg 240
cgctacggct ga 252
<210> 164
<211> 83
<212> PRT
<213> Bradyrhizobium sp. BTAi1
<400> 164
Met Leu Thr Thr Leu Ile Gly Leu Gly Ala Ala Thr Cys Thr Thr Cys
1 5 10 15
Ser Phe Leu Pro Gln Val Ile Lys Ala Trp Arg Ser Arg Ser Thr Gln
20 25 30
Asp Ile Ser Ala Gly Met Phe Val Leu Leu Thr Thr Gly Asn Ala Met
35 40 45
Trp Leu Leu Tyr Gly Ala Leu Ile Asn Asp Leu Pro Leu Val Val Ala
50 55 60
Asn Leu Ile Thr Leu Ala Leu Val Ala Thr Ile Leu Gly Leu Lys Leu
65 70 75 80
Arg Tyr Gly
<210> 165
<211> 261
<212> DNA
<213> Bradyrhizobium japonicum USDA 110
<400> 165
atggatccgt ttcttattaa actgattggc ttcgctgcgg cgacctgcac caccgtggcg 60
tatgcgccgc agtttattaa agtgcttaaa acccgcagcg cgcgcgatat tagcctgggc 120
atgtttctgg tgatggtgct gggcctggcg ctgtggctga tttatggcct gctgagcggc 180
gatgcgccgc tgattgcgag caacgcggtg accatgctgt tagcgggcgg catactggtg 240
atgaaactga gatatggcta a 261
<210> 166
<211> 86
<212> PRT
<213> Bradyrhizobium japonicum USDA 110
<400> 166
Met Asp Pro Phe Leu Ile Lys Leu Ile Gly Phe Ala Ala Ala Thr Cys
1 5 10 15
Thr Thr Val Ala Tyr Ala Pro Gln Phe Ile Lys Val Leu Lys Thr Arg
20 25 30
Ser Ala Arg Asp Ile Ser Leu Gly Met Phe Leu Val Met Val Leu Gly
35 40 45
Leu Ala Leu Trp Leu Ile Tyr Gly Leu Leu Ser Gly Asp Ala Pro Leu
50 55 60
Ile Ala Ser Asn Ala Val Thr Met Leu Leu Ala Gly Gly Ile Leu Val
65 70 75 80
Met Lys Leu Arg Tyr Gly
85
<210> 167
<211> 276
<212> DNA
<213> Xanthomonas campestris pv. vesicatoria str. 85-10
<400> 167
atgcaatttg ttgatgttgt gggctggtta gcgagcatta ttctgattgc gaccttaatt 60
cggcagattt ataagcaatg gcgctcggat gcggcgcaag gcgttagccg ctggttattt 120
ttaggccaga tttcagctag cgtgttattt attttatatt catacctggt aggcaacgcg 180
gtgttcattg ttagcaatgt gctgattctg ctgacggcgc tgattggcta cgctttgcag 240
cgagttaaac gccgcaggct ggaacgcgct gcgtag 276
<210> 168
<211> 91
<212> PRT
<213> Xanthomonas campestris pv. vesicatoria str. 85-10
<400> 168
Met Gln Phe Val Asp Val Val Gly Trp Leu Ala Ser Ile Ile Leu Ile
1 5 10 15
Ala Thr Leu Ile Arg Gln Ile Tyr Lys Gln Trp Arg Ser Asp Ala Ala
20 25 30
Gln Gly Val Ser Arg Trp Leu Phe Leu Gly Gln Ile Ser Ala Ser Val
35 40 45
Leu Phe Ile Leu Tyr Ser Tyr Leu Val Gly Asn Ala Val Phe Ile Val
50 55 60
Ser Asn Val Leu Ile Leu Leu Thr Ala Leu Ile Gly Tyr Ala Leu Gln
65 70 75 80
Arg Val Lys Arg Arg Arg Leu Glu Arg Ala Ala
85 90
<210> 169
<211> 273
<212> DNA
<213> Herbaspirillum aquaticum
<400> 169
atgagcgacc agattaccga tttaataggc tggggcgcca ccttaatttt actgctgacc 60
attagcagcc aggtgtacga acagtggcgc agccgcagca cgcaaggcgt gagccattgg 120
ttattcgcgg ggcagctagc ggcttcagcc ggctttgtga cctatagcgt gctgcacggt 180
gattgggtat ttgtggtgag caacgtattt ctgttattca ccgcgttact gggccaggtg 240
ctgtatctgc gcaaccggcg ccgccagcag tga 273
<210> 170
<211> 90
<212> PRT
<213> Herbaspirillum aquaticum
<400> 170
Met Ser Asp Gln Ile Thr Asp Leu Ile Gly Trp Gly Ala Thr Leu Ile
1 5 10 15
Leu Leu Leu Thr Ile Ser Ser Gln Val Tyr Glu Gln Trp Arg Ser Arg
20 25 30
Ser Thr Gln Gly Val Ser His Trp Leu Phe Ala Gly Gln Leu Ala Ala
35 40 45
Ser Ala Gly Phe Val Thr Tyr Ser Val Leu His Gly Asp Trp Val Phe
50 55 60
Val Val Ser Asn Val Phe Leu Leu Phe Thr Ala Leu Leu Gly Gln Val
65 70 75 80
Leu Tyr Leu Arg Asn Arg Arg Arg Gln Gln
85 90
<210> 171
<211> 261
<212> DNA
<213> Flavobacteria bacterium MS024-2A
<400> 171
atgacgcagt ttcagattga actgattggt atgtttgctg cggtattaac gacgagcgcg 60
tttataccgc aagtatataa aatttggaaa acgcgtgtga gcgatggtgt atcactgagc 120
atgtatttgt cattatttat aggagtggtg agctggtgtg tgtacggcta cctgataggt 180
agcccatcag tgctgatagc gaatattatt gcgggaatgt ttcagctgat gattatttat 240
tttaagctga aatttaaata a 261
<210> 172
<211> 86
<212> PRT
<213> Flavobacteria bacterium MS024-2A
<400> 172
Met Thr Gln Phe Gln Ile Glu Leu Ile Gly Met Phe Ala Ala Val Leu
1 5 10 15
Thr Thr Ser Ala Phe Ile Pro Gln Val Tyr Lys Ile Trp Lys Thr Arg
20 25 30
Val Ser Asp Gly Val Ser Leu Ser Met Tyr Leu Ser Leu Phe Ile Gly
35 40 45
Val Val Ser Trp Cys Val Tyr Gly Tyr Leu Ile Gly Ser Pro Ser Val
50 55 60
Leu Ile Ala Asn Ile Ile Ala Gly Met Phe Gln Leu Met Ile Ile Tyr
65 70 75 80
Phe Lys Leu Lys Phe Lys
85
<210> 173
<211> 786
<212> DNA
<213> Rhizobium sp. Root149
<400> 173
atgctgaatg cgatttggaa ctatcggtat tttattgtta ccagcgttca ggccgatttt 60
cggaaccgcg ttgctcgcag ccgcttaggc ctgctctggt tagtgatcgc cccgttagcg 120
cagattgtga cctatgcgtt cgtcttaagc agcgttatga gccagcggct gccaggcatt 180
gataatacct tcgcgtatgc gatttacctg atggccggct tccagggctg gctcctgttc 240
gtggaaatta ttagccgaag catgaatgtg tttattgaaa gcggcaatgt cctgaaaaaa 300
attgcgttcc cacgcatcgc gctccccctc gttgtggtga ttaccagcgt gataaataac 360
ctgatttttt ttgtcgttct gctggctgtg tttaccttag cgggctttca gatgggatgg 420
aatgtgctgt ggctcccggt cttaatcgcg gtgaatgccg cgttcgccgc gggattaggc 480
gtgaccttag gcgtcctcaa cgtgttcatc cgcgacgtgg ggcagattgt accgattatt 540
atccagtttc tgttttggat gaccccgatt gtgtatgtta aggacatcct gccgccagcg 600
tttcagagca ttattaaagc gaatcccctg ttttggatgg ttgagaatta tcaccgcgtg 660
atggtgtata ataccatgcc ggacctgaaa gttttaggcg ttttagggtt cctggctctg 720
gtctttctcg ctttaggctt caccttattt cgcaaagcta gccctgaaat ggttgatgtt 780
ctataa 786
<210> 174
<211> 261
<212> PRT
<213> Rhizobium sp. Root149
<400> 174
Met Leu Asn Ala Ile Trp Asn Tyr Arg Tyr Phe Ile Val Thr Ser Val
1 5 10 15
Gln Ala Asp Phe Arg Asn Arg Val Ala Arg Ser Arg Leu Gly Leu Leu
20 25 30
Trp Leu Val Ile Ala Pro Leu Ala Gln Ile Val Thr Tyr Ala Phe Val
35 40 45
Leu Ser Ser Val Met Ser Gln Arg Leu Pro Gly Ile Asp Asn Thr Phe
50 55 60
Ala Tyr Ala Ile Tyr Leu Met Ala Gly Phe Gln Gly Trp Leu Leu Phe
65 70 75 80
Val Glu Ile Ile Ser Arg Ser Met Asn Val Phe Ile Glu Ser Gly Asn
85 90 95
Val Leu Lys Lys Ile Ala Phe Pro Arg Ile Ala Leu Pro Leu Val Val
100 105 110
Val Ile Thr Ser Val Ile Asn Asn Leu Ile Phe Phe Val Val Leu Leu
115 120 125
Ala Val Phe Thr Leu Ala Gly Phe Gln Met Gly Trp Asn Val Leu Trp
130 135 140
Leu Pro Val Leu Ile Ala Val Asn Ala Ala Phe Ala Ala Gly Leu Gly
145 150 155 160
Val Thr Leu Gly Val Leu Asn Val Phe Ile Arg Asp Val Gly Gln Ile
165 170 175
Val Pro Ile Ile Ile Gln Phe Leu Phe Trp Met Thr Pro Ile Val Tyr
180 185 190
Val Lys Asp Ile Leu Pro Pro Ala Phe Gln Ser Ile Ile Lys Ala Asn
195 200 205
Pro Leu Phe Trp Met Val Glu Asn Tyr His Arg Val Met Val Tyr Asn
210 215 220
Thr Met Pro Asp Leu Lys Val Leu Gly Val Leu Gly Phe Leu Ala Leu
225 230 235 240
Val Phe Leu Ala Leu Gly Phe Thr Leu Phe Arg Lys Ala Ser Pro Glu
245 250 255
Met Val Asp Val Leu
260
<210> 175
<211> 837
<212> DNA
<213> Azospirillum brasiliense LMG 04375
<400> 175
atgaccatgg ccgctagcgc tccgcaagta ccgaccggac tagcgggcct gtttacgatg 60
ccatggcacc atcgcgcgct gctgcgccgc ttagtgcgta gggaaattga ggccaggtat 120
cgtggaagcc tgctaggcgt ggtgtgggcg ctcctgaccc cggtgttaat gctggccgtg 180
tttacctttg tgtttagcgt ggtgtttcag gcgcgctggg gcagttcaac cggcggaaaa 240
ggggaatttg cgctgattct gtttgctggc ctgattgtgt ttaatatgtt tagcgaagcg 300
ctgaaccgta gcccaagcct agtactggaa aacccgagct acgtgaaaaa agtggtgttt 360
ccgttagaag tgctgccctg ggtgatggtg ctaagcagcc tgtttcaggt tgtgattagc 420
ctagcgattc tgttagtgtt ccacctagcg gtgtcagggc tgcccccgct gagcgtgctg 480
tttctgccgc tggtgtggct accactgctg ttcttatgcc tgggcaccgg cttcctgttt 540
ggcgcgttag gcgtatacct gcgcgatctg cgaagcatta tgccagtggc tagccagtta 600
ctgatgttct taagcccgct gttttatccg gcgagcgcgc tgccggaaag ctttcgccgc 660
ctgttgcatt taaacccgct gacgggcatt attgaaaata cgcgcacggt gctgttcgct 720
ggcaccccgc cggactggac cgtgttaggc gtgcagattg tggccgggct gttatttgct 780
acctttagct ttcgtctgtt tcgccatcta cgaactggat tcgcggatat agtgtaa 837
<210> 176
<211> 278
<212> PRT
<213> Azospirillum brasiliense LMG 04375
<400> 176
Met Thr Met Ala Ala Ser Ala Pro Gln Val Pro Thr Gly Leu Ala Gly
1 5 10 15
Leu Phe Thr Met Pro Trp His His Arg Ala Leu Leu Arg Arg Leu Val
20 25 30
Arg Arg Glu Ile Glu Ala Arg Tyr Arg Gly Ser Leu Leu Gly Val Val
35 40 45
Trp Ala Leu Leu Thr Pro Val Leu Met Leu Ala Val Phe Thr Phe Val
50 55 60
Phe Ser Val Val Phe Gln Ala Arg Trp Gly Ser Ser Thr Gly Gly Lys
65 70 75 80
Gly Glu Phe Ala Leu Ile Leu Phe Ala Gly Leu Ile Val Phe Asn Met
85 90 95
Phe Ser Glu Ala Leu Asn Arg Ser Pro Ser Leu Val Leu Glu Asn Pro
100 105 110
Ser Tyr Val Lys Lys Val Val Phe Pro Leu Glu Val Leu Pro Trp Val
115 120 125
Met Val Leu Ser Ser Leu Phe Gln Val Val Ile Ser Leu Ala Ile Leu
130 135 140
Leu Val Phe His Leu Ala Val Ser Gly Leu Pro Pro Leu Ser Val Leu
145 150 155 160
Phe Leu Pro Leu Val Trp Leu Pro Leu Leu Phe Leu Cys Leu Gly Thr
165 170 175
Gly Phe Leu Phe Gly Ala Leu Gly Val Tyr Leu Arg Asp Leu Arg Ser
180 185 190
Ile Met Pro Val Ala Ser Gln Leu Leu Met Phe Leu Ser Pro Leu Phe
195 200 205
Tyr Pro Ala Ser Ala Leu Pro Glu Ser Phe Arg Arg Leu Leu His Leu
210 215 220
Asn Pro Leu Thr Gly Ile Ile Glu Asn Thr Arg Thr Val Leu Phe Ala
225 230 235 240
Gly Thr Pro Pro Asp Trp Thr Val Leu Gly Val Gln Ile Val Ala Gly
245 250 255
Leu Leu Phe Ala Thr Phe Ser Phe Arg Leu Phe Arg His Leu Arg Thr
260 265 270
Gly Phe Ala Asp Ile Val
275
<210> 177
<211> 1233
<212> DNA
<213> Rhizobium sp. Root149
<400> 177
atgaccaatg ttgtgatgac cgtggacaaa gtgggcaaag tcttccggcg ctatcggcac 60
gaactgcatc gcgtcttagg ctggttctca ttaccagtgg ggcagccgga agagcgctgg 120
gtcctgcggg atatttcatt taccgtagag gctgggcagg ccctggccat cgtcgggcgc 180
aatggcgccg gcaaaagcac cctcttaaaa ctgatcaccg gcaccatgcg cgccgcggaa 240
ggcaatattg ggttatcagg caaaattagc gcgattttag aactgggaat gggctttaat 300
ccggattata ccggccgcca gaacgttttt catgccttag gcttaatggg ctaccagcat 360
gccgatatcg cggccgcgat ggaaggcatt gaggccttca gcgaactggg aagctatttt 420
gatcagccgc tgcgagtgta tagcagcggc atgcatatgc ggttagcttt tagcgtggcc 480
actgctttcc ggccagacat cttaattgtg gatgaggcct tatcagtagg cgacgcgtat 540
tttcagcata aaagctttga ccgcattaaa gaattccgcc agcaggggac caccctgatt 600
ttagtcagcc acgaccggat ggccctgtta agcttatgcg accgcgcgat cctgctgcac 660
gaaggagcgg ttgccttaga tggggagccc gaaactgtct tagactatta taacgcgtta 720
ttagggcaga aagaagccca accgatttta accgaagagc gagaggatgg ccgcgtgcag 780
acctcaagcg ggagccgccg ggtcagcatc gtggaagccc ggctggaaga tgcccagggc 840
ggcccaattg ataccttaga tgttggggca gaagtggcga tccgcgttaa agcgaaggcc 900
aatgaagatg ttgaatcatt agtgtttggc tacgccatta aagaccgctt tgggcagacc 960
atgtatggca ccaataccta ttatagcgaa caggccctga ccgatgtaaa agctggcgaa 1020
gagattgagt ttagcgcccg ctttcgggcc gatttaggag tgggcaccta ttcagttgct 1080
ctagccctgg ttgggggcga gaaccatatt gaggataatt atgaatggcg cgatttagcg 1140
attatttttg atgtcgcgaa taccagcaaa cagacctttg acgggcgaat ctatctgccg 1200
agcgagttcc atttaaagcg gaccggtggc tag 1233
<210> 178
<211> 410
<212> PRT
<213> Rhizobium sp. Root149
<400> 178
Met Thr Asn Val Val Met Thr Val Asp Lys Val Gly Lys Val Phe Arg
1 5 10 15
Arg Tyr Arg His Glu Leu His Arg Val Leu Gly Trp Phe Ser Leu Pro
20 25 30
Val Gly Gln Pro Glu Glu Arg Trp Val Leu Arg Asp Ile Ser Phe Thr
35 40 45
Val Glu Ala Gly Gln Ala Leu Ala Ile Val Gly Arg Asn Gly Ala Gly
50 55 60
Lys Ser Thr Leu Leu Lys Leu Ile Thr Gly Thr Met Arg Ala Ala Glu
65 70 75 80
Gly Asn Ile Gly Leu Ser Gly Lys Ile Ser Ala Ile Leu Glu Leu Gly
85 90 95
Met Gly Phe Asn Pro Asp Tyr Thr Gly Arg Gln Asn Val Phe His Ala
100 105 110
Leu Gly Leu Met Gly Tyr Gln His Ala Asp Ile Ala Ala Ala Met Glu
115 120 125
Gly Ile Glu Ala Phe Ser Glu Leu Gly Ser Tyr Phe Asp Gln Pro Leu
130 135 140
Arg Val Tyr Ser Ser Gly Met His Met Arg Leu Ala Phe Ser Val Ala
145 150 155 160
Thr Ala Phe Arg Pro Asp Ile Leu Ile Val Asp Glu Ala Leu Ser Val
165 170 175
Gly Asp Ala Tyr Phe Gln His Lys Ser Phe Asp Arg Ile Lys Glu Phe
180 185 190
Arg Gln Gln Gly Thr Thr Leu Ile Leu Val Ser His Asp Arg Met Ala
195 200 205
Leu Leu Ser Leu Cys Asp Arg Ala Ile Leu Leu His Glu Gly Ala Val
210 215 220
Ala Leu Asp Gly Glu Pro Glu Thr Val Leu Asp Tyr Tyr Asn Ala Leu
225 230 235 240
Leu Gly Gln Lys Glu Ala Gln Pro Ile Leu Thr Glu Glu Arg Glu Asp
245 250 255
Gly Arg Val Gln Thr Ser Ser Gly Ser Arg Arg Val Ser Ile Val Glu
260 265 270
Ala Arg Leu Glu Asp Ala Gln Gly Gly Pro Ile Asp Thr Leu Asp Val
275 280 285
Gly Ala Glu Val Ala Ile Arg Val Lys Ala Lys Ala Asn Glu Asp Val
290 295 300
Glu Ser Leu Val Phe Gly Tyr Ala Ile Lys Asp Arg Phe Gly Gln Thr
305 310 315 320
Met Tyr Gly Thr Asn Thr Tyr Tyr Ser Glu Gln Ala Leu Thr Asp Val
325 330 335
Lys Ala Gly Glu Glu Ile Glu Phe Ser Ala Arg Phe Arg Ala Asp Leu
340 345 350
Gly Val Gly Thr Tyr Ser Val Ala Leu Ala Leu Val Gly Gly Glu Asn
355 360 365
His Ile Glu Asp Asn Tyr Glu Trp Arg Asp Leu Ala Ile Ile Phe Asp
370 375 380
Val Ala Asn Thr Ser Lys Gln Thr Phe Asp Gly Arg Ile Tyr Leu Pro
385 390 395 400
Ser Glu Phe His Leu Lys Arg Thr Gly Gly
405 410
<210> 179
<211> 1416
<212> DNA
<213> Azospirillum brasiliense LMG 04375
<400> 179
atgaaggatg ataccgctat gcaggatatg ccgagcgatg gcgatgtgag cattcgtgta 60
agcggcgtgg gcaaatgcta ccatatttat gcgcgtccgc aggaccgctt actgcaattt 120
ctgctgcgcg gccgccgtca gttttatcgt gaattttggg ccttaaaaga tattgatctg 180
acgattcgcc gcggggaaag cgtggcgctg attgggcgca acggggccgg caagtcaact 240
ctactccagg tgattagcgg cgtactgcaa ccgaccggag gcagcatgga tgtgcgcggg 300
cgcattgcgc cgctattaga gctaggcagc tcatttaacc cagagtttag cgggatggaa 360
aatattgggc tgagcgcgag cgtattaggc ttaagcgagg aacagattgc ggaacgtcgc 420
gaagcgatta ttgcgtttgc ggatattggc gattttattc accagccggt gaggacctac 480
agcagcggca tgcaggcgcg cctagcgttt gccgtggctg cgcacgtgga tgcggaaatt 540
ctgattgtgg atgaaattct gagcgtgggc gatattgcgt ttacccagaa atgcacccgc 600
tttattcgcg aatttcgcga gcgcggaacg ctgctgtttg tgagccatga cattggcgcg 660
ataaccgcgc tgtgcgatcg cgcggtgtgg ctaagcggag gaacggttgt agcggatggc 720
gtgccgcgcg aagtggctca ccactataaa gcgtggatgg ccggacctca gcagcatatg 780
acggcgcagg attttctgga aaccctgaaa accgcggaag cggaagcgac tgaagtggaa 840
gcggaagcgg aagcggaagc cgcggttgaa gccgaagttg tggtgaccca aggcgggccg 900
gatggcgaaa cggcgctagt gcagacgtta gatgcccagg tgcagaccgt gtttcgccgc 960
gatgtgctga gcagcggcga aggcggggcg aaaatattgc aggcgtggat tgaagatgcg 1020
cgtggcaccc cagtgagcat ggtgaacggc ggcgatttag tgaccctgtg cattgaagcg 1080
gaagcgcagc agaccctgga tagcctgatt gtgggctttg gcgtgaaaga tcgtttaggc 1140
cagacgatgt ttgcgtggga tacgaccaaa accgacttag tgattccgcc ggtgaatgtg 1200
ggcgatcgct ttcgcgccgg gtttcgcttt cattttccat atctgctggg cggcacctat 1260
acgaccaatc tggcgattgc gaacgggacg agcgatatgt atattcagca ccattggatg 1320
tatgatgcgc tggaatttca tgtgcaatgg agcaccgtgg cgcagggcct gtttggcata 1380
ccaatggatg gcgtaagcct ggcgattaac ccctaa 1416
<210> 180
<211> 471
<212> PRT
<213> Azospirillum brasiliense LMG 04375
<400> 180
Met Lys Asp Asp Thr Ala Met Gln Asp Met Pro Ser Asp Gly Asp Val
1 5 10 15
Ser Ile Arg Val Ser Gly Val Gly Lys Cys Tyr His Ile Tyr Ala Arg
20 25 30
Pro Gln Asp Arg Leu Leu Gln Phe Leu Leu Arg Gly Arg Arg Gln Phe
35 40 45
Tyr Arg Glu Phe Trp Ala Leu Lys Asp Ile Asp Leu Thr Ile Arg Arg
50 55 60
Gly Glu Ser Val Ala Leu Ile Gly Arg Asn Gly Ala Gly Lys Ser Thr
65 70 75 80
Leu Leu Gln Val Ile Ser Gly Val Leu Gln Pro Thr Gly Gly Ser Met
85 90 95
Asp Val Arg Gly Arg Ile Ala Pro Leu Leu Glu Leu Gly Ser Ser Phe
100 105 110
Asn Pro Glu Phe Ser Gly Met Glu Asn Ile Gly Leu Ser Ala Ser Val
115 120 125
Leu Gly Leu Ser Glu Glu Gln Ile Ala Glu Arg Arg Glu Ala Ile Ile
130 135 140
Ala Phe Ala Asp Ile Gly Asp Phe Ile His Gln Pro Val Arg Thr Tyr
145 150 155 160
Ser Ser Gly Met Gln Ala Arg Leu Ala Phe Ala Val Ala Ala His Val
165 170 175
Asp Ala Glu Ile Leu Ile Val Asp Glu Ile Leu Ser Val Gly Asp Ile
180 185 190
Ala Phe Thr Gln Lys Cys Thr Arg Phe Ile Arg Glu Phe Arg Glu Arg
195 200 205
Gly Thr Leu Leu Phe Val Ser His Asp Ile Gly Ala Ile Thr Ala Leu
210 215 220
Cys Asp Arg Ala Val Trp Leu Ser Gly Gly Thr Val Val Ala Asp Gly
225 230 235 240
Val Pro Arg Glu Val Ala His His Tyr Lys Ala Trp Met Ala Gly Pro
245 250 255
Gln Gln His Met Thr Ala Gln Asp Phe Leu Glu Thr Leu Lys Thr Ala
260 265 270
Glu Ala Glu Ala Thr Glu Val Glu Ala Glu Ala Glu Ala Glu Ala Ala
275 280 285
Val Glu Ala Glu Val Val Val Thr Gln Gly Gly Pro Asp Gly Glu Thr
290 295 300
Ala Leu Val Gln Thr Leu Asp Ala Gln Val Gln Thr Val Phe Arg Arg
305 310 315 320
Asp Val Leu Ser Ser Gly Glu Gly Gly Ala Lys Ile Leu Gln Ala Trp
325 330 335
Ile Glu Asp Ala Arg Gly Thr Pro Val Ser Met Val Asn Gly Gly Asp
340 345 350
Leu Val Thr Leu Cys Ile Glu Ala Glu Ala Gln Gln Thr Leu Asp Ser
355 360 365
Leu Ile Val Gly Phe Gly Val Lys Asp Arg Leu Gly Gln Thr Met Phe
370 375 380
Ala Trp Asp Thr Thr Lys Thr Asp Leu Val Ile Pro Pro Val Asn Val
385 390 395 400
Gly Asp Arg Phe Arg Ala Gly Phe Arg Phe His Phe Pro Tyr Leu Leu
405 410 415
Gly Gly Thr Tyr Thr Thr Asn Leu Ala Ile Ala Asn Gly Thr Ser Asp
420 425 430
Met Tyr Ile Gln His His Trp Met Tyr Asp Ala Leu Glu Phe His Val
435 440 445
Gln Trp Ser Thr Val Ala Gln Gly Leu Phe Gly Ile Pro Met Asp Gly
450 455 460
Val Ser Leu Ala Ile Asn Pro
465 470
<210> 181
<211> 3198
<212> DNA
<213> Sinorhizobium medicae WSM419
<400> 181
atgtttctga cacggattag cattaaccac ccggtgtttg ctaccatgat gatggttatg 60
attttagtgt tagggctgtt ctcatatgga cggttaggag tggaccatta cccagaaacc 120
gatctgcccg tggtagttgt ggcgaccacc tacaccgggg caagcccaga gagcgtggag 180
agcgaaattt cacggccgat agaagcggcg ctgaacacaa ttggcgggat tgataccatt 240
accagcgaga gctacgaggg gcgaagcatt gtggttgttc agtttgaagt tgacgtggac 300
tcacaagatg cggctcaaga agttcgcgat cgggtagcgc ggttagagac aaaattccca 360
gatgctgttg cgacccccca ggtgacccgg tacaaaccag agggccaggc tattctgtca 420
gtagctgtta gcagcaccag ccggaccctg ccagagatta ccaccttagc gacacgcgtt 480
attaacaatc gcctgagcgt aataagcggc gtgggccaag tatcactgat aggcagcagc 540
gaacggcaag tactggtagt agttgatccc gaccggttag gggcctacgg cctggctgtg 600
gcgaccgtga ttgaggctat tcggggcgag aaccaggacc gagcggccgg gaccttaaca 660
agcggcatta atcagcggat tgtaaccgtg gaagggcgca tagcgaatac atcagcgttt 720
aaccgcatta ttgtggctca aagaaatggc tatccagtgt acttaagcga agttgctacc 780
atactggata caggcgccga agtaaccagc ttagctaact accaaggcca gaccacactg 840
ggactccata ttgtgaaagt gcaaggcgcg aacaccgttg aagtagcgag cgctgtacgc 900
cgagaagtaa gcgcgctgaa cgctgagctg acaaaagata acgtgcaact gaccattaca 960
cgggataaca gccgcccaat agctagccag gtaagccaag tacagcggac cctggttgag 1020
ggaggagtac tgtcagttct gattgttttt atattcctca acagctggcg aagcaccgta 1080
attaccggct taaccctgcc aatatcagta ataggcacat ttgcggctat atacgctctg 1140
ggctttaccc tgaacattat gacattaatg gctctgagcc tcagcattgg catactgata 1200
gatgacgcga tagtggtacg ggagaacatt acacgccacc tacagatggg caaagacccc 1260
gtacgggccg cgctggacgg gaccaacgaa ataggcttag ctgttctgag cacaacactg 1320
tgcattgtgg ctgttttcct gccggtagcg tttatgggcg ggctgattgg gcgcttcttt 1380
ttacagttcg gcgtaaccgt agcggttgcg gtttttataa gcctgttcgt tagcttcaca 1440
ttagacccga tgctgagcag catatggcgc gacccacaat cacaaaagac agcgaaacga 1500
ggcttttttg ggcaactgat agaacggttt gaccaatggt ttgaagggtt agctagccgc 1560
tatcggagcg taatttactt tacatttgat taccggaaga ccacaatagc tatagtgcta 1620
ggcatgttcg tggtgagcct gctgttagta ccgcgcattg ggacagaatt cctcccgccc 1680
ccagatcagg gagaagttag cataagcctg gaagcgaacg agggcgctag cctggactac 1740
atggccgcca aggttgggca gattgagcgg gctctgcggg aatttaatta tgtgagcagc 1800
acctatagca caattaatag cggggaaatg cgaggcttta acaaagcgct ggttgcggtt 1860
caattagttc atagctcaca acgacggctg aaaaccgcgg agaccctggg gcccattcgc 1920
cgacggttaa gccggattgc gggcttagag atttcagtag ggcagcggag cgaagttgtg 1980
gggagcataa aaccgctaca actcagcatt ctgggagacg gggacgaaga actgcgacgg 2040
attagcgacc aaattaccag cgttttagcg gcgataccgg gcgctaccga aattgagtca 2100
tcaattgaga aattacggcc caccctggct gtacgggttc gccgcgaagc ggcgagcgac 2160
ttaggcgtga gcattgctac cataggcgac acactgcggt cactagttgc gggagacgct 2220
atatcagtat ggaacagccc cgatggggag agccatgacg tggttgttcg cctgccagcg 2280
gccggccggg aaaacgcggc tcagctgcgg aatttaccca ttgcgaccgc tcggatggat 2340
gataatggca aaccgataat ggtgctactg gaccaggtag ccgacgtggt tgaaagcacc 2400
gcgcccgctc agattacccg caaagacctg agccgggata tacgcataag cagcaacata 2460
gagggacgga ccctcggcga tgtagttgcg gacctgaaag cggcgatgac aaaaatggac 2520
attcccgttg ggttccggat atcatttggc ggcgacgcgg aaaacctgac cgaaagcacc 2580
gcgtatgctc tgcagagcct ggcgatggcc gtgattttta tttacataat tctcgcttca 2640
cagtttggca gctttattca gcccattgcg attattatga caatgccgct aagcctcatg 2700
ggagtgctgt taggcttact gttcaccggc agcacactga atatgtttag catgattggc 2760
attctgatgc tgattgggct cgttacaaaa aacgcgattt tactggttga ttacagcaat 2820
ctaggcgtac gcgagggcaa gagcctgcgg cagagcttag ctgacgccgg ggcagtaaga 2880
ctgcggccga ttgttatgac caccctggcg atgatatttg ggatgctgcc cacagcgcta 2940
ggcctcggcg agggcggcgc gcagcgcgcg cccatggcgc acgctattat tggcgggctc 3000
ataagcagca ccctgctgtc actcgtgttc gttcccgtgg ttctgacata tttagacgcg 3060
tttgcgcggc gcgtacggcg ctgggttccc tcacccacag ggagcaatgc tagcgctcag 3120
catgatggga gcgacaaaac aaagacaccc gcttgcgctc tgacaagcca ggaccagtca 3180
gggacaacaa ttatgtaa 3198
<210> 182
<211> 1065
<212> PRT
<213> Sinorhizobium medicae WSM419
<400> 182
Met Phe Leu Thr Arg Ile Ser Ile Asn His Pro Val Phe Ala Thr Met
1 5 10 15
Met Met Val Met Ile Leu Val Leu Gly Leu Phe Ser Tyr Gly Arg Leu
20 25 30
Gly Val Asp His Tyr Pro Glu Thr Asp Leu Pro Val Val Val Val Ala
35 40 45
Thr Thr Tyr Thr Gly Ala Ser Pro Glu Ser Val Glu Ser Glu Ile Ser
50 55 60
Arg Pro Ile Glu Ala Ala Leu Asn Thr Ile Gly Gly Ile Asp Thr Ile
65 70 75 80
Thr Ser Glu Ser Tyr Glu Gly Arg Ser Ile Val Val Val Gln Phe Glu
85 90 95
Val Asp Val Asp Ser Gln Asp Ala Ala Gln Glu Val Arg Asp Arg Val
100 105 110
Ala Arg Leu Glu Thr Lys Phe Pro Asp Ala Val Ala Thr Pro Gln Val
115 120 125
Thr Arg Tyr Lys Pro Glu Gly Gln Ala Ile Leu Ser Val Ala Val Ser
130 135 140
Ser Thr Ser Arg Thr Leu Pro Glu Ile Thr Thr Leu Ala Thr Arg Val
145 150 155 160
Ile Asn Asn Arg Leu Ser Val Ile Ser Gly Val Gly Gln Val Ser Leu
165 170 175
Ile Gly Ser Ser Glu Arg Gln Val Leu Val Val Val Asp Pro Asp Arg
180 185 190
Leu Gly Ala Tyr Gly Leu Ala Val Ala Thr Val Ile Glu Ala Ile Arg
195 200 205
Gly Glu Asn Gln Asp Arg Ala Ala Gly Thr Leu Thr Ser Gly Ile Asn
210 215 220
Gln Arg Ile Val Thr Val Glu Gly Arg Ile Ala Asn Thr Ser Ala Phe
225 230 235 240
Asn Arg Ile Ile Val Ala Gln Arg Asn Gly Tyr Pro Val Tyr Leu Ser
245 250 255
Glu Val Ala Thr Ile Leu Asp Thr Gly Ala Glu Val Thr Ser Leu Ala
260 265 270
Asn Tyr Gln Gly Gln Thr Thr Leu Gly Leu His Ile Val Lys Val Gln
275 280 285
Gly Ala Asn Thr Val Glu Val Ala Ser Ala Val Arg Arg Glu Val Ser
290 295 300
Ala Leu Asn Ala Glu Leu Thr Lys Asp Asn Val Gln Leu Thr Ile Thr
305 310 315 320
Arg Asp Asn Ser Arg Pro Ile Ala Ser Gln Val Ser Gln Val Gln Arg
325 330 335
Thr Leu Val Glu Gly Gly Val Leu Ser Val Leu Ile Val Phe Ile Phe
340 345 350
Leu Asn Ser Trp Arg Ser Thr Val Ile Thr Gly Leu Thr Leu Pro Ile
355 360 365
Ser Val Ile Gly Thr Phe Ala Ala Ile Tyr Ala Leu Gly Phe Thr Leu
370 375 380
Asn Ile Met Thr Leu Met Ala Leu Ser Leu Ser Ile Gly Ile Leu Ile
385 390 395 400
Asp Asp Ala Ile Val Val Arg Glu Asn Ile Thr Arg His Leu Gln Met
405 410 415
Gly Lys Asp Pro Val Arg Ala Ala Leu Asp Gly Thr Asn Glu Ile Gly
420 425 430
Leu Ala Val Leu Ser Thr Thr Leu Cys Ile Val Ala Val Phe Leu Pro
435 440 445
Val Ala Phe Met Gly Gly Leu Ile Gly Arg Phe Phe Leu Gln Phe Gly
450 455 460
Val Thr Val Ala Val Ala Val Phe Ile Ser Leu Phe Val Ser Phe Thr
465 470 475 480
Leu Asp Pro Met Leu Ser Ser Ile Trp Arg Asp Pro Gln Ser Gln Lys
485 490 495
Thr Ala Lys Arg Gly Phe Phe Gly Gln Leu Ile Glu Arg Phe Asp Gln
500 505 510
Trp Phe Glu Gly Leu Ala Ser Arg Tyr Arg Ser Val Ile Tyr Phe Thr
515 520 525
Phe Asp Tyr Arg Lys Thr Thr Ile Ala Ile Val Leu Gly Met Phe Val
530 535 540
Val Ser Leu Leu Leu Val Pro Arg Ile Gly Thr Glu Phe Leu Pro Pro
545 550 555 560
Pro Asp Gln Gly Glu Val Ser Ile Ser Leu Glu Ala Asn Glu Gly Ala
565 570 575
Ser Leu Asp Tyr Met Ala Ala Lys Val Gly Gln Ile Glu Arg Ala Leu
580 585 590
Arg Glu Phe Asn Tyr Val Ser Ser Thr Tyr Ser Thr Ile Asn Ser Gly
595 600 605
Glu Met Arg Gly Phe Asn Lys Ala Leu Val Ala Val Gln Leu Val His
610 615 620
Ser Ser Gln Arg Arg Leu Lys Thr Ala Glu Thr Leu Gly Pro Ile Arg
625 630 635 640
Arg Arg Leu Ser Arg Ile Ala Gly Leu Glu Ile Ser Val Gly Gln Arg
645 650 655
Ser Glu Val Val Gly Ser Ile Lys Pro Leu Gln Leu Ser Ile Leu Gly
660 665 670
Asp Gly Asp Glu Glu Leu Arg Arg Ile Ser Asp Gln Ile Thr Ser Val
675 680 685
Leu Ala Ala Ile Pro Gly Ala Thr Glu Ile Glu Ser Ser Ile Glu Lys
690 695 700
Leu Arg Pro Thr Leu Ala Val Arg Val Arg Arg Glu Ala Ala Ser Asp
705 710 715 720
Leu Gly Val Ser Ile Ala Thr Ile Gly Asp Thr Leu Arg Ser Leu Val
725 730 735
Ala Gly Asp Ala Ile Ser Val Trp Asn Ser Pro Asp Gly Glu Ser His
740 745 750
Asp Val Val Val Arg Leu Pro Ala Ala Gly Arg Glu Asn Ala Ala Gln
755 760 765
Leu Arg Asn Leu Pro Ile Ala Thr Ala Arg Met Asp Asp Asn Gly Lys
770 775 780
Pro Ile Met Val Leu Leu Asp Gln Val Ala Asp Val Val Glu Ser Thr
785 790 795 800
Ala Pro Ala Gln Ile Thr Arg Lys Asp Leu Ser Arg Asp Ile Arg Ile
805 810 815
Ser Ser Asn Ile Glu Gly Arg Thr Leu Gly Asp Val Val Ala Asp Leu
820 825 830
Lys Ala Ala Met Thr Lys Met Asp Ile Pro Val Gly Phe Arg Ile Ser
835 840 845
Phe Gly Gly Asp Ala Glu Asn Leu Thr Glu Ser Thr Ala Tyr Ala Leu
850 855 860
Gln Ser Leu Ala Met Ala Val Ile Phe Ile Tyr Ile Ile Leu Ala Ser
865 870 875 880
Gln Phe Gly Ser Phe Ile Gln Pro Ile Ala Ile Ile Met Thr Met Pro
885 890 895
Leu Ser Leu Met Gly Val Leu Leu Gly Leu Leu Phe Thr Gly Ser Thr
900 905 910
Leu Asn Met Phe Ser Met Ile Gly Ile Leu Met Leu Ile Gly Leu Val
915 920 925
Thr Lys Asn Ala Ile Leu Leu Val Asp Tyr Ser Asn Leu Gly Val Arg
930 935 940
Glu Gly Lys Ser Leu Arg Gln Ser Leu Ala Asp Ala Gly Ala Val Arg
945 950 955 960
Leu Arg Pro Ile Val Met Thr Thr Leu Ala Met Ile Phe Gly Met Leu
965 970 975
Pro Thr Ala Leu Gly Leu Gly Glu Gly Gly Ala Gln Arg Ala Pro Met
980 985 990
Ala His Ala Ile Ile Gly Gly Leu Ile Ser Ser Thr Leu Leu Ser Leu
995 1000 1005
Val Phe Val Pro Val Val Leu Thr Tyr Leu Asp Ala Phe Ala Arg
1010 1015 1020
Arg Val Arg Arg Trp Val Pro Ser Pro Thr Gly Ser Asn Ala Ser
1025 1030 1035
Ala Gln His Asp Gly Ser Asp Lys Thr Lys Thr Pro Ala Cys Ala
1040 1045 1050
Leu Thr Ser Gln Asp Gln Ser Gly Thr Thr Ile Met
1055 1060 1065
<210> 183
<211> 1206
<212> DNA
<213> Azospirillum brasiliense LMG 04375
<400> 183
atgaggagaa cgccaccgcg catgagcgcg gccgctagcg atcgactacc actggcgagc 60
ctgctggcgt tagcgatggc cgcgtttatt accattttaa ccgaggcgct gccagcggga 120
ctgctgccgc agatggcgca agggttagga gtgaccgaag cctgggttgg ccagaccgtg 180
acgatttatg cggccggaag cttagcggcc gcgattccgc tgaccgcggc gacgcaagga 240
gtgcgccgcc gcccgctgct gctggccgcg attgcgggct ttgtggttgc gaataccgtg 300
acgaccctga gcggcagctt tgcgctgacc atggttgcgc gctttctggc cggcgtgagc 360
gcgggcctga tgtgggcgct gctggccggc tacgcggcgc gcatggtgcc agatcatcag 420
aaaggccgtg cgattgcggt tgcgatggtt ggcgcgccgc tagctctgag cttaggcgta 480
ccgaccggca cctttctggg caatctggtt gattggagag tgtgctttgg attaatgagc 540
gcgctggcgc tggcgttaat gttatgggtg cgcgttgtgg tgccggattt tgcggggcaa 600
gcggccggcc gacgtctgag cccagggcgc gtgtttaccc tggccggcgt gcgcccggtg 660
ctgtttgtgg tactggcgtt tgtgctggcg cataatattt tatataccta tattgcgccg 720
tttctggccg ccgcgggcat ggaagggcgc acggacctgg cgctgctgct gtttggcgtg 780
gcgagcctgc tgggcatttg gattgtgggc gcgctgattg atggccacct gcgtgcgctg 840
acgctggcga gcaccgtgct gtttggactg agcgcgctgg tgttaggcgt ggctggcgac 900
gcgccggccg tggtgctagc ggccgttgcg gcgtggggcc tggcgtttgg cggagcgggg 960
acgctgtttc agacggcgct ggcgaggacg gccggcgatg cggccgacgt ggcgcagagc 1020
atgctggtga ccgcgtggaa tacggcgata gcgggcggcg gcttattagg cggcgtgctg 1080
ttagagcgtt taggcgtggg cgcgtttgcg ccggccgtgc tggtgctgct ggccgcgacg 1140
ctgttagcgg tgtggggagc gaggcgtcat ggcttcccag atcccgcgga tacggccgga 1200
gcgtaa 1206
<210> 184
<211> 401
<212> PRT
<213> Azospirillum brasiliense LMG 04375
<400> 184
Met Arg Arg Thr Pro Pro Arg Met Ser Ala Ala Ala Ser Asp Arg Leu
1 5 10 15
Pro Leu Ala Ser Leu Leu Ala Leu Ala Met Ala Ala Phe Ile Thr Ile
20 25 30
Leu Thr Glu Ala Leu Pro Ala Gly Leu Leu Pro Gln Met Ala Gln Gly
35 40 45
Leu Gly Val Thr Glu Ala Trp Val Gly Gln Thr Val Thr Ile Tyr Ala
50 55 60
Ala Gly Ser Leu Ala Ala Ala Ile Pro Leu Thr Ala Ala Thr Gln Gly
65 70 75 80
Val Arg Arg Arg Pro Leu Leu Leu Ala Ala Ile Ala Gly Phe Val Val
85 90 95
Ala Asn Thr Val Thr Thr Leu Ser Gly Ser Phe Ala Leu Thr Met Val
100 105 110
Ala Arg Phe Leu Ala Gly Val Ser Ala Gly Leu Met Trp Ala Leu Leu
115 120 125
Ala Gly Tyr Ala Ala Arg Met Val Pro Asp His Gln Lys Gly Arg Ala
130 135 140
Ile Ala Val Ala Met Val Gly Ala Pro Leu Ala Leu Ser Leu Gly Val
145 150 155 160
Pro Thr Gly Thr Phe Leu Gly Asn Leu Val Asp Trp Arg Val Cys Phe
165 170 175
Gly Leu Met Ser Ala Leu Ala Leu Ala Leu Met Leu Trp Val Arg Val
180 185 190
Val Val Pro Asp Phe Ala Gly Gln Ala Ala Gly Arg Arg Leu Ser Pro
195 200 205
Gly Arg Val Phe Thr Leu Ala Gly Val Arg Pro Val Leu Phe Val Val
210 215 220
Leu Ala Phe Val Leu Ala His Asn Ile Leu Tyr Thr Tyr Ile Ala Pro
225 230 235 240
Phe Leu Ala Ala Ala Gly Met Glu Gly Arg Thr Asp Leu Ala Leu Leu
245 250 255
Leu Phe Gly Val Ala Ser Leu Leu Gly Ile Trp Ile Val Gly Ala Leu
260 265 270
Ile Asp Gly His Leu Arg Ala Leu Thr Leu Ala Ser Thr Val Leu Phe
275 280 285
Gly Leu Ser Ala Leu Val Leu Gly Val Ala Gly Asp Ala Pro Ala Val
290 295 300
Val Leu Ala Ala Val Ala Ala Trp Gly Leu Ala Phe Gly Gly Ala Gly
305 310 315 320
Thr Leu Phe Gln Thr Ala Leu Ala Arg Thr Ala Gly Asp Ala Ala Asp
325 330 335
Val Ala Gln Ser Met Leu Val Thr Ala Trp Asn Thr Ala Ile Ala Gly
340 345 350
Gly Gly Leu Leu Gly Gly Val Leu Leu Glu Arg Leu Gly Val Gly Ala
355 360 365
Phe Ala Pro Ala Val Leu Val Leu Leu Ala Ala Thr Leu Leu Ala Val
370 375 380
Trp Gly Ala Arg Arg His Gly Phe Pro Asp Pro Ala Asp Thr Ala Gly
385 390 395 400
Ala
<210> 185
<211> 789
<212> DNA
<213> Bradyrhizobium japonicum USDA 110
<400> 185
atggacgacg gatacgcgag cgtgatgccg gctaatgcgt ataattggac cgcggtatgg 60
cgacgaaatt atcttgcttg gcgaaaagtg gcgcttgcta gccttctggg caacctggct 120
gacccaataa ccaatctgtt cggccttggc ttcggactgg gactgatagt gggacgggta 180
gaaggaacta gctatatagc gttccttgcg gccggaatgg ttgcgataag cgctatgact 240
agcgcgacct tcgagactct gtatgctgcg ttcgctcgga tggacgtgaa acgcacctgg 300
gaaggaatac tttttactca gctgaccctt ggcgacattg tactaggaga acttgtgtgg 360
gccgcgtcaa aaagcgtact agcgggaact gctattggaa tagtggctgc gaccctggga 420
tacgctagct ggaccagcgt actttgtgcg ataccgacta ttgcgcttac cggccttgtg 480
tttgcgagcc tggctatggt tgtgatatca cttgcgccca cttatgacta ttttgtgttc 540
tatcagagcc tggtgcttac cccaatggtg tttctttgtg gcgcggtgtt cccgaccagc 600
caaatgccag attcattcca gcatttcgcg ggccttcttc cgctggctca tagcgtggat 660
cttatacgcc ccgtgatgct tgaacgcggc gcggataatg cggcgcttca tgtaggcgcg 720
ctgtgcgtat atgcggtgct tccattcttt gcgagcattg cgctattccg gcgccgcctg 780
ctgcggtaa 789
<210> 186
<211> 262
<212> PRT
<213> Bradyrhizobium japonicum USDA 110
<400> 186
Met Asp Asp Gly Tyr Ala Ser Val Met Pro Ala Asn Ala Tyr Asn Trp
1 5 10 15
Thr Ala Val Trp Arg Arg Asn Tyr Leu Ala Trp Arg Lys Val Ala Leu
20 25 30
Ala Ser Leu Leu Gly Asn Leu Ala Asp Pro Ile Thr Asn Leu Phe Gly
35 40 45
Leu Gly Phe Gly Leu Gly Leu Ile Val Gly Arg Val Glu Gly Thr Ser
50 55 60
Tyr Ile Ala Phe Leu Ala Ala Gly Met Val Ala Ile Ser Ala Met Thr
65 70 75 80
Ser Ala Thr Phe Glu Thr Leu Tyr Ala Ala Phe Ala Arg Met Asp Val
85 90 95
Lys Arg Thr Trp Glu Gly Ile Leu Phe Thr Gln Leu Thr Leu Gly Asp
100 105 110
Ile Val Leu Gly Glu Leu Val Trp Ala Ala Ser Lys Ser Val Leu Ala
115 120 125
Gly Thr Ala Ile Gly Ile Val Ala Ala Thr Leu Gly Tyr Ala Ser Trp
130 135 140
Thr Ser Val Leu Cys Ala Ile Pro Thr Ile Ala Leu Thr Gly Leu Val
145 150 155 160
Phe Ala Ser Leu Ala Met Val Val Ile Ser Leu Ala Pro Thr Tyr Asp
165 170 175
Tyr Phe Val Phe Tyr Gln Ser Leu Val Leu Thr Pro Met Val Phe Leu
180 185 190
Cys Gly Ala Val Phe Pro Thr Ser Gln Met Pro Asp Ser Phe Gln His
195 200 205
Phe Ala Gly Leu Leu Pro Leu Ala His Ser Val Asp Leu Ile Arg Pro
210 215 220
Val Met Leu Glu Arg Gly Ala Asp Asn Ala Ala Leu His Val Gly Ala
225 230 235 240
Leu Cys Val Tyr Ala Val Leu Pro Phe Phe Ala Ser Ile Ala Leu Phe
245 250 255
Arg Arg Arg Leu Leu Arg
260
<210> 187
<211> 921
<212> DNA
<213> Bradyrhizobium japonicum USDA 110
<400> 187
atgaatatga gcaatatggc gattgatctt gttggcgtga ggaaatcatt tggtgataaa 60
gtaattgtga atgatctgag ctttagcgta gcgcgcggag aatgctttgg actgcttgga 120
cccaatggtg ctggcaagtc aaccatagct cgcatgctgc tgggcatgat aagcccagac 180
cgaggcaaaa taaccgtgct ggacgaaccc gtgcccagcc gcgctcgggc cgcgcgcgtg 240
cgcgtaggcg tggtgccgca gtttgacaac cttgaaccag aatttaccgt gcgggaaaac 300
ctgcttgtgt tcggccgcta ctttggcatg agcgctcgca ccattgaggc cgtagtgcca 360
agccttcttg aattcgcgcg gcttgagagc aaagccgatg tgcgcgtgag ccttcttagc 420
ggaggaatga aacggcgact gaccctggcg cgcgctctga ttaatgaccc ccacctactg 480
gtgatggatg aaccgaccac cggactggac ccgcacgctc gccatctgat ttgggagcgc 540
ctgcgggctc ttcttgcgcg cggcaaaacc attctgctta ccactcattt tatggaagaa 600
gcggagcgcc tttgcgaccg gctatgcgtg cttgaatcag gatgcaagat tgccgagggc 660
aaacccgatg cgcttattga tgaacatatt ggctgcaacg tgattgaaat ttacggcgga 720
gacctagacc aactgcggga actgattcga ccgtacgcgc ggcatattga agtgtcagga 780
gaaacccttt tctgttatgc gcgatgtccg gatgagatta gcgtgcatct gcgcggacga 840
accgatcttc gcgtactgca gcgcccaccg aatctggaag atgtgttcct tcggcttacc 900
ggacgcgaaa tggaaaagta a 921
<210> 188
<211> 306
<212> PRT
<213> Bradyrhizobium japonicum USDA 110
<400> 188
Met Asn Met Ser Asn Met Ala Ile Asp Leu Val Gly Val Arg Lys Ser
1 5 10 15
Phe Gly Asp Lys Val Ile Val Asn Asp Leu Ser Phe Ser Val Ala Arg
20 25 30
Gly Glu Cys Phe Gly Leu Leu Gly Pro Asn Gly Ala Gly Lys Ser Thr
35 40 45
Ile Ala Arg Met Leu Leu Gly Met Ile Ser Pro Asp Arg Gly Lys Ile
50 55 60
Thr Val Leu Asp Glu Pro Val Pro Ser Arg Ala Arg Ala Ala Arg Val
65 70 75 80
Arg Val Gly Val Val Pro Gln Phe Asp Asn Leu Glu Pro Glu Phe Thr
85 90 95
Val Arg Glu Asn Leu Leu Val Phe Gly Arg Tyr Phe Gly Met Ser Ala
100 105 110
Arg Thr Ile Glu Ala Val Val Pro Ser Leu Leu Glu Phe Ala Arg Leu
115 120 125
Glu Ser Lys Ala Asp Val Arg Val Ser Leu Leu Ser Gly Gly Met Lys
130 135 140
Arg Arg Leu Thr Leu Ala Arg Ala Leu Ile Asn Asp Pro His Leu Leu
145 150 155 160
Val Met Asp Glu Pro Thr Thr Gly Leu Asp Pro His Ala Arg His Leu
165 170 175
Ile Trp Glu Arg Leu Arg Ala Leu Leu Ala Arg Gly Lys Thr Ile Leu
180 185 190
Leu Thr Thr His Phe Met Glu Glu Ala Glu Arg Leu Cys Asp Arg Leu
195 200 205
Cys Val Leu Glu Ser Gly Cys Lys Ile Ala Glu Gly Lys Pro Asp Ala
210 215 220
Leu Ile Asp Glu His Ile Gly Cys Asn Val Ile Glu Ile Tyr Gly Gly
225 230 235 240
Asp Leu Asp Gln Leu Arg Glu Leu Ile Arg Pro Tyr Ala Arg His Ile
245 250 255
Glu Val Ser Gly Glu Thr Leu Phe Cys Tyr Ala Arg Cys Pro Asp Glu
260 265 270
Ile Ser Val His Leu Arg Gly Arg Thr Asp Leu Arg Val Leu Gln Arg
275 280 285
Pro Pro Asn Leu Glu Asp Val Phe Leu Arg Leu Thr Gly Arg Glu Met
290 295 300
Glu Lys
305
<210> 189
<211> 378
<212> DNA
<213> Escherichia coli K12 MG1655
<400> 189
atgaaacata aacaacgttg ggcgggggca atctgctgtt ttgtcctctt cattgtggtg 60
tgcctttttc tggcgacgca catgaaaggc gcttttcggg ctgccgggca tcctgaaatc 120
ggcttgctat ttttcattct tcctggagca gtcgccagct tcttttcaca gcgtagagaa 180
gtcctgaaac ctctgtttgg cgcaatgctg gcggcaccct gttcgatgct cattatgcgg 240
ctgttttttt caccgacgcg ctcattctgg caagagctgg catggttact aagcgcggtg 300
ttctggtgtg cgctgggggc actgtgtttc ttatttatca gtagtttgtt taaaccacag 360
cacagaaaaa atcagtaa 378
<210> 190
<211> 125
<212> PRT
<213> Escherichia coli K12 MG1655
<400> 190
Met Lys His Lys Gln Arg Trp Ala Gly Ala Ile Cys Cys Phe Val Leu
1 5 10 15
Phe Ile Val Val Cys Leu Phe Leu Ala Thr His Met Lys Gly Ala Phe
20 25 30
Arg Ala Ala Gly His Pro Glu Ile Gly Leu Leu Phe Phe Ile Leu Pro
35 40 45
Gly Ala Val Ala Ser Phe Phe Ser Gln Arg Arg Glu Val Leu Lys Pro
50 55 60
Leu Phe Gly Ala Met Leu Ala Ala Pro Cys Ser Met Leu Ile Met Arg
65 70 75 80
Leu Phe Phe Ser Pro Thr Arg Ser Phe Trp Gln Glu Leu Ala Trp Leu
85 90 95
Leu Ser Ala Val Phe Trp Cys Ala Leu Gly Ala Leu Cys Phe Leu Phe
100 105 110
Ile Ser Ser Leu Phe Lys Pro Gln His Arg Lys Asn Gln
115 120 125
<210> 191
<211> 369
<212> DNA
<213> Enterobacteriaceae bacterium ENNIH1
<400> 191
atgaaacata aacgcggact cgctggcata atttgttgtt ttcttctctt cattgttgtt 60
tgttttcttg aagtgacgaa tatggaaggc gcgtttcgtg cgtcggggca tcctgaactg 120
ggattgttgt tttttactct tcctggcgcg gtcgcgtcta ttttttcacg tcgccgtaaa 180
gtgatgttgc cgctgtttgg cgcgatctta gcggcgccgt tgtgcttcgt tgttatgcgt 240
ctgtttttta ctccggtgcg ttcagtgtgg caggaactgg cgtggttgtt ttctgcggta 300
ttctggtgtg cgctgggcgc tttgtgttat ctgtttatca gctctttctt tggcaacggg 360
acgcgttaa 369
<210> 192
<211> 122
<212> PRT
<213> Enterobacteriaceae bacterium ENNIH1
<400> 192
Met Lys His Lys Arg Gly Leu Ala Gly Ile Ile Cys Cys Phe Leu Leu
1 5 10 15
Phe Ile Val Val Cys Phe Leu Glu Val Thr Asn Met Glu Gly Ala Phe
20 25 30
Arg Ala Ser Gly His Pro Glu Leu Gly Leu Leu Phe Phe Thr Leu Pro
35 40 45
Gly Ala Val Ala Ser Ile Phe Ser Arg Arg Arg Lys Val Met Leu Pro
50 55 60
Leu Phe Gly Ala Ile Leu Ala Ala Pro Leu Cys Phe Val Val Met Arg
65 70 75 80
Leu Phe Phe Thr Pro Val Arg Ser Val Trp Gln Glu Leu Ala Trp Leu
85 90 95
Phe Ser Ala Val Phe Trp Cys Ala Leu Gly Ala Leu Cys Tyr Leu Phe
100 105 110
Ile Ser Ser Phe Phe Gly Asn Gly Thr Arg
115 120
<210> 193
<211> 1215
<212> DNA
<213> Escherichia coli 113303
<400> 193
atgtcgtata tccgggtcaa taacgtcggt aaggcctatc gtcagtatca ctcgaagacg 60
gggcgactga tcgaatggtt atcaccactg aatacgaaac gtcataattt aaaatggatc 120
cttcgtgaga ttaacttcga agtcgcacca ggtgaggcag tcggtattat cggtatcaat 180
ggtgccggta agtcgacgct gttaaaactt ataacgggga cttcacgacc aactacggga 240
gaaattgaaa tctcaggtcg tgtcgcagcc ttacttgaat tagggatggg atttcattcg 300
gatttcacgg gtcggcagaa cgtttatatg tcggggcaac tgttagggtt atcatcggag 360
aaaataacgg aactgatgcc tcaaattgaa gagtttgcag agattgggga ctatatcgat 420
cagccagttc gtgtctactc atccgggatg caagttcggt tagcattttc ggtcgccact 480
gcaatccgtc cagatgttct aattatcgat gaggccttat cggttggtga tgcctatttc 540
cagcataaaa gctttgagcg tattcggaaa tttcgtcagg aagggacgac tctgttactg 600
gtctctcatg ataaacaagc catccaaagc atttgtgacc gggccatttt attaaataaa 660
ggtcaaattg aaatggaagg cgaaccagaa gccgttatgg attattataa cgccttactg 720
gccgataaac aaaaccagtc aattaaacaa gttgagcata acggtaaaac tcaaacggtt 780
tcgggtacgg gtgaagttac gatctccgaa gttcatttac ttgatgaaca gggtaacgtt 840
acggaatttg tttcagtcgg gcatcgtgtc agcttgcaag tcaatgttga agtcaaggac 900
gatattccag agttagttgt cgggtatatg attaaggatc ggttagggca gccaattttc 960
gggacgaata cttaccatct taaccagacg cttacgtcac tgaaaaaagg ggaaaagcgt 1020
tcattcttat tttcgttcga tgcccggtta ggagtcggtt catattcggt cgcagtcgcc 1080
ttgcatacgt catcgactca ccttggtaaa aattatgaat ggcgtgatct ggccgttgtc 1140
ttcaatgtcg ttaatactga acaacaagag tttgtcggtg tttcatggtt accaccagaa 1200
ctggaaattt cgtaa 1215
<210> 194
<211> 404
<212> PRT
<213> Escherichia coli 113303
<400> 194
Met Ser Tyr Ile Arg Val Asn Asn Val Gly Lys Ala Tyr Arg Gln Tyr
1 5 10 15
His Ser Lys Thr Gly Arg Leu Ile Glu Trp Leu Ser Pro Leu Asn Thr
20 25 30
Lys Arg His Asn Leu Lys Trp Ile Leu Arg Glu Ile Asn Phe Glu Val
35 40 45
Ala Pro Gly Glu Ala Val Gly Ile Ile Gly Ile Asn Gly Ala Gly Lys
50 55 60
Ser Thr Leu Leu Lys Leu Ile Thr Gly Thr Ser Arg Pro Thr Thr Gly
65 70 75 80
Glu Ile Glu Ile Ser Gly Arg Val Ala Ala Leu Leu Glu Leu Gly Met
85 90 95
Gly Phe His Ser Asp Phe Thr Gly Arg Gln Asn Val Tyr Met Ser Gly
100 105 110
Gln Leu Leu Gly Leu Ser Ser Glu Lys Ile Thr Glu Leu Met Pro Gln
115 120 125
Ile Glu Glu Phe Ala Glu Ile Gly Asp Tyr Ile Asp Gln Pro Val Arg
130 135 140
Val Tyr Ser Ser Gly Met Gln Val Arg Leu Ala Phe Ser Val Ala Thr
145 150 155 160
Ala Ile Arg Pro Asp Val Leu Ile Ile Asp Glu Ala Leu Ser Val Gly
165 170 175
Asp Ala Tyr Phe Gln His Lys Ser Phe Glu Arg Ile Arg Lys Phe Arg
180 185 190
Gln Glu Gly Thr Thr Leu Leu Leu Val Ser His Asp Lys Gln Ala Ile
195 200 205
Gln Ser Ile Cys Asp Arg Ala Ile Leu Leu Asn Lys Gly Gln Ile Glu
210 215 220
Met Glu Gly Glu Pro Glu Ala Val Met Asp Tyr Tyr Asn Ala Leu Leu
225 230 235 240
Ala Asp Lys Gln Asn Gln Ser Ile Lys Gln Val Glu His Asn Gly Lys
245 250 255
Thr Gln Thr Val Ser Gly Thr Gly Glu Val Thr Ile Ser Glu Val His
260 265 270
Leu Leu Asp Glu Gln Gly Asn Val Thr Glu Phe Val Ser Val Gly His
275 280 285
Arg Val Ser Leu Gln Val Asn Val Glu Val Lys Asp Asp Ile Pro Glu
290 295 300
Leu Val Val Gly Tyr Met Ile Lys Asp Arg Leu Gly Gln Pro Ile Phe
305 310 315 320
Gly Thr Asn Thr Tyr His Leu Asn Gln Thr Leu Thr Ser Leu Lys Lys
325 330 335
Gly Glu Lys Arg Ser Phe Leu Phe Ser Phe Asp Ala Arg Leu Gly Val
340 345 350
Gly Ser Tyr Ser Val Ala Val Ala Leu His Thr Ser Ser Thr His Leu
355 360 365
Gly Lys Asn Tyr Glu Trp Arg Asp Leu Ala Val Val Phe Asn Val Val
370 375 380
Asn Thr Glu Gln Gln Glu Phe Val Gly Val Ser Trp Leu Pro Pro Glu
385 390 395 400
Leu Glu Ile Ser
<210> 195
<211> 795
<212> DNA
<213> Escherichia coli 113303
<400> 195
atgcgggatt tactaactac tatttatcgt tatcgaggat ttatctggtc gtcggttaaa 60
cgtgattttc aggcccgtta tcaaacgtcg atgctgggtg ccctatggct tgttttgcaa 120
ccactttcga tgattctggt ctatacgctg gttttttcag aagttatgaa ggcccggatg 180
cctgataata ctgggtcatt tgcctattcg atttatcttt gctcaggagt cctgacgtgg 240
ggactcttta ctgagatgct ggataaaggt cagagcgtct ttattaataa cgcaaacctg 300
atcaagaaac tttcgtttcc aaaaatctgc ctgccaatca tcgttacttt atcagccgtt 360
ctaaacttcg ccattatttt ctcgctgttt ctaattttta tcattgtcac gggtaatttc 420
cctggttggc tttttctttc agttatacca gtcctgttat tgcaaatcct gtttgccggt 480
gggctgggaa tgatcttagg tgtcatgaat gtctttttcc gagatgttgg gcaactggtt 540
ggtgttgccc tgcaattctg gttttggttc acgcctattg tttatgtcct gaactcgtta 600
ccagcctggg ccaaaaacct gatgatgtat aatccaatga cgcggatcat gcaatcgtat 660
cagtcaatct tcgcctatca tctggcccct aattggtatt cactatggcc agtcttagca 720
cttgccatta ttttctgcgt catcggtttc cgaatgttcc gtaagcatgc cgccgatatg 780
gttgatgaat tataa 795
<210> 196
<211> 263
<212> PRT
<213> Escherichia coli 113303
<400> 196
Met Arg Asp Leu Leu Thr Thr Ile Tyr Arg Tyr Arg Gly Phe Ile Trp
1 5 10 15
Ser Ser Val Lys Arg Asp Phe Gln Ala Arg Tyr Gln Thr Ser Met Leu
20 25 30
Gly Ala Leu Trp Leu Val Leu Gln Pro Leu Ser Met Ile Leu Val Tyr
35 40 45
Thr Leu Val Phe Ser Glu Val Met Lys Ala Arg Met Pro Asp Asn Thr
50 55 60
Gly Ser Phe Ala Tyr Ser Ile Tyr Leu Cys Ser Gly Val Leu Thr Trp
65 70 75 80
Gly Leu Phe Thr Glu Met Leu Asp Lys Gly Gln Ser Val Phe Ile Asn
85 90 95
Asn Ala Asn Leu Ile Lys Lys Leu Ser Phe Pro Lys Ile Cys Leu Pro
100 105 110
Ile Ile Val Thr Leu Ser Ala Val Leu Asn Phe Ala Ile Ile Phe Ser
115 120 125
Leu Phe Leu Ile Phe Ile Ile Val Thr Gly Asn Phe Pro Gly Trp Leu
130 135 140
Phe Leu Ser Val Ile Pro Val Leu Leu Leu Gln Ile Leu Phe Ala Gly
145 150 155 160
Gly Leu Gly Met Ile Leu Gly Val Met Asn Val Phe Phe Arg Asp Val
165 170 175
Gly Gln Leu Val Gly Val Ala Leu Gln Phe Trp Phe Trp Phe Thr Pro
180 185 190
Ile Val Tyr Val Leu Asn Ser Leu Pro Ala Trp Ala Lys Asn Leu Met
195 200 205
Met Tyr Asn Pro Met Thr Arg Ile Met Gln Ser Tyr Gln Ser Ile Phe
210 215 220
Ala Tyr His Leu Ala Pro Asn Trp Tyr Ser Leu Trp Pro Val Leu Ala
225 230 235 240
Leu Ala Ile Ile Phe Cys Val Ile Gly Phe Arg Met Phe Arg Lys His
245 250 255
Ala Ala Asp Met Val Asp Glu
260
<210> 197
<211> 1113
<212> DNA
<213> Helicobacter pylori
<400> 197
atgtttcagc cgctgctgga tgcatatgtt gaaagcgcaa gcattgaaaa aatggcaagc 60
aaaagtccgc ctccgctgaa aattgcagtt gcaaattggt ggggtgatga agaaatcaaa 120
gagtttaaaa acttcgtcct gtactttatt ctgagccagc gttataccat taccctgcat 180
cagaatccga atgaattttc cgatctggtt tttggtaatc cgctgggtag cgcacgtaaa 240
attctgagct atcagaatgc aaaacgcgtg ttttataccg gtgaaaatga aagcccgaac 300
ttcaacctgt ttgattatgc cattggtttc gatgagctgg attttaatga tcgttatctg 360
cgtatgccgc tgtattataa cgagctgcat atcaaagcag aaagcgttaa tgataccacc 420
gcaccgtata aactgaaaga taatagcctg tacgcactga aaaaaccgag ccattgcttt 480
aaagaaaaac atccgaatct gtgtgccgtg gttaatgatg aaagcgatcc tctgaaacgt 540
ggttttgcaa gctttgttgc aagcaatccg aacgcaccga ttcgtaatgc attctatgat 600
gcactgaata gcattgaacc ggttaccggt ggtggtagcg ttcgtaatac cctgggttat 660
aatgtgaaaa acaaaaacga attcctgagc cagtataaat tcaatctgtg ctttgaaaac 720
acccagggtt atggttatgt gaccgaaaaa atcatcgatg cctatttcag ccataccatt 780
ccgatttatt ggggtagccc gagcgttgca aaagatttca atccgaaaag ctttgtgaac 840
gtgcacgact tcaaaaactt tgatgaagcc atcgattata tcaaatacct gcacacccat 900
aaaaacgcct atctggatat gctgtatgaa aatccgctga atacactgga tggtaaagcc 960
tatttttacc agaacctgag cttcaaaaaa atcctggcct ttttcaaaac catcctggaa 1020
aacgatacca tctatcacga taacccgttt atcttttgcc gtgatctgaa tgaaccgctg 1080
gttaccattg atgatctgcg tgttaattat taa 1113
<210> 198
<211> 370
<212> PRT
<213> Helicobacter pylori
<400> 198
Met Phe Gln Pro Leu Leu Asp Ala Tyr Val Glu Ser Ala Ser Ile Glu
1 5 10 15
Lys Met Ala Ser Lys Ser Pro Pro Pro Leu Lys Ile Ala Val Ala Asn
20 25 30
Trp Trp Gly Asp Glu Glu Ile Lys Glu Phe Lys Asn Phe Val Leu Tyr
35 40 45
Phe Ile Leu Ser Gln Arg Tyr Thr Ile Thr Leu His Gln Asn Pro Asn
50 55 60
Glu Phe Ser Asp Leu Val Phe Gly Asn Pro Leu Gly Ser Ala Arg Lys
65 70 75 80
Ile Leu Ser Tyr Gln Asn Ala Lys Arg Val Phe Tyr Thr Gly Glu Asn
85 90 95
Glu Ser Pro Asn Phe Asn Leu Phe Asp Tyr Ala Ile Gly Phe Asp Glu
100 105 110
Leu Asp Phe Asn Asp Arg Tyr Leu Arg Met Pro Leu Tyr Tyr Asn Glu
115 120 125
Leu His Ile Lys Ala Glu Ser Val Asn Asp Thr Thr Ala Pro Tyr Lys
130 135 140
Leu Lys Asp Asn Ser Leu Tyr Ala Leu Lys Lys Pro Ser His Cys Phe
145 150 155 160
Lys Glu Lys His Pro Asn Leu Cys Ala Val Val Asn Asp Glu Ser Asp
165 170 175
Pro Leu Lys Arg Gly Phe Ala Ser Phe Val Ala Ser Asn Pro Asn Ala
180 185 190
Pro Ile Arg Asn Ala Phe Tyr Asp Ala Leu Asn Ser Ile Glu Pro Val
195 200 205
Thr Gly Gly Gly Ser Val Arg Asn Thr Leu Gly Tyr Asn Val Lys Asn
210 215 220
Lys Asn Glu Phe Leu Ser Gln Tyr Lys Phe Asn Leu Cys Phe Glu Asn
225 230 235 240
Thr Gln Gly Tyr Gly Tyr Val Thr Glu Lys Ile Ile Asp Ala Tyr Phe
245 250 255
Ser His Thr Ile Pro Ile Tyr Trp Gly Ser Pro Ser Val Ala Lys Asp
260 265 270
Phe Asn Pro Lys Ser Phe Val Asn Val His Asp Phe Lys Asn Phe Asp
275 280 285
Glu Ala Ile Asp Tyr Ile Lys Tyr Leu His Thr His Lys Asn Ala Tyr
290 295 300
Leu Asp Met Leu Tyr Glu Asn Pro Leu Asn Thr Leu Asp Gly Lys Ala
305 310 315 320
Tyr Phe Tyr Gln Asn Leu Ser Phe Lys Lys Ile Leu Ala Phe Phe Lys
325 330 335
Thr Ile Leu Glu Asn Asp Thr Ile Tyr His Asp Asn Pro Phe Ile Phe
340 345 350
Cys Arg Asp Leu Asn Glu Pro Leu Val Thr Ile Asp Asp Leu Arg Val
355 360 365
Asn Tyr
370
<210> 199
<211> 990
<212> DNA
<213> Basilea psittacipulmonis JF4266 (DSM 24701)
<400> 199
atgtcagtgc tgaaaaaact ggtaagaacg ctgaaaaaga aaaaagatat tcccagcgaa 60
aatcaggaag atattaagcc gcaggaattt ggacatatca aacattatca tttctggcct 120
ctgtcgaacg aaacgttttt taaccaattt gcgcaggaaa aaaaccttga tctgagccag 180
acggccctaa ttagctgctt tggggaacta tcagcgattc ctaaaatccc tgaacggtat 240
aaagtgtttt ttacggggga aaatatctat catccggatc gcatctcata ttcggatccg 300
gagctctatc gcatggtgga tctgtattta ggctttgaat accggacgga accgaagtat 360
ctacgctttc cgctgtgggt ttggtattta tgcggcctga cgaaaaaacc gcatttttca 420
catgaatcaa ttgcggaatt tattcggaaa atgaaccaac ctgagtttcg cctgcagtca 480
tcaaggaatc gcttttgcag ccatattagc agccatgata cgaacggcat tcggaaacgg 540
atgattgatt taattttacc gattgcgtca gtggattgcg ccggcaagtt tatgaacaac 600
acggatgagt taaaagcgaa gtttaatgat gacaagatcg actatctaaa acagtatcgg 660
tttaatctct gtcctgaaaa ctcagaatca gtcgggtata tcacggaaaa gatttttgaa 720
tcaattatgg ccgggtgcat tccaatttat tggggaggag tcaagcagct ttttgtcgaa 780
ccggatattt taaatccgga agcatttatt tactacgaaa aagggaaaga agagcaatta 840
gcgaaacagg ttgaagaact ttggatatca cctaaacggt atgaagagtt tgcagcaatt 900
gccccgttta aagaggacgc agccgaagtg atttatacgt ggattgaaga actggaaaaa 960
cggctacggg catttgaacc aaaagcctaa 990
<210> 200
<211> 329
<212> PRT
<213> Basilea psittacipulmonis JF4266 (DSM 24701)
<400> 200
Met Ser Val Leu Lys Lys Leu Val Arg Thr Leu Lys Lys Lys Lys Asp
1 5 10 15
Ile Pro Ser Glu Asn Gln Glu Asp Ile Lys Pro Gln Glu Phe Gly His
20 25 30
Ile Lys His Tyr His Phe Trp Pro Leu Ser Asn Glu Thr Phe Phe Asn
35 40 45
Gln Phe Ala Gln Glu Lys Asn Leu Asp Leu Ser Gln Thr Ala Leu Ile
50 55 60
Ser Cys Phe Gly Glu Leu Ser Ala Ile Pro Lys Ile Pro Glu Arg Tyr
65 70 75 80
Lys Val Phe Phe Thr Gly Glu Asn Ile Tyr His Pro Asp Arg Ile Ser
85 90 95
Tyr Ser Asp Pro Glu Leu Tyr Arg Met Val Asp Leu Tyr Leu Gly Phe
100 105 110
Glu Tyr Arg Thr Glu Pro Lys Tyr Leu Arg Phe Pro Leu Trp Val Trp
115 120 125
Tyr Leu Cys Gly Leu Thr Lys Lys Pro His Phe Ser His Glu Ser Ile
130 135 140
Ala Glu Phe Ile Arg Lys Met Asn Gln Pro Glu Phe Arg Leu Gln Ser
145 150 155 160
Ser Arg Asn Arg Phe Cys Ser His Ile Ser Ser His Asp Thr Asn Gly
165 170 175
Ile Arg Lys Arg Met Ile Asp Leu Ile Leu Pro Ile Ala Ser Val Asp
180 185 190
Cys Ala Gly Lys Phe Met Asn Asn Thr Asp Glu Leu Lys Ala Lys Phe
195 200 205
Asn Asp Asp Lys Ile Asp Tyr Leu Lys Gln Tyr Arg Phe Asn Leu Cys
210 215 220
Pro Glu Asn Ser Glu Ser Val Gly Tyr Ile Thr Glu Lys Ile Phe Glu
225 230 235 240
Ser Ile Met Ala Gly Cys Ile Pro Ile Tyr Trp Gly Gly Val Lys Gln
245 250 255
Leu Phe Val Glu Pro Asp Ile Leu Asn Pro Glu Ala Phe Ile Tyr Tyr
260 265 270
Glu Lys Gly Lys Glu Glu Gln Leu Ala Lys Gln Val Glu Glu Leu Trp
275 280 285
Ile Ser Pro Lys Arg Tyr Glu Glu Phe Ala Ala Ile Ala Pro Phe Lys
290 295 300
Glu Asp Ala Ala Glu Val Ile Tyr Thr Trp Ile Glu Glu Leu Glu Lys
305 310 315 320
Arg Leu Arg Ala Phe Glu Pro Lys Ala
325
<210> 201
<211> 900
<212> DNA
<213> Helicobacter pylori
<400> 201
atggccttta aagttgttca gatttgtggt ggtctgggca atcagatgtt tcagtatgca 60
tttgcaaaaa gcctgcagaa acatagcaat acaccggttc tgctggatat taccagcttt 120
gattggagca atcgtaaaat gcagctggaa ctgtttccga ttgatctgcc gtatgcaagc 180
gaaaaagaaa ttgcaattgc caaaatgcag catctgccga aactggttcg taatgttctg 240
aaatgcatgg gttttgatcg tgtgagccaa gaaatcgtgt ttgaatatga accgaaactg 300
ctgaaaacca gccgtctgac ctatttttat ggctattttc aggatccgcg ttattttgat 360
gcaattagtc cgctgatcaa acagaccttt accctgcctc cgcctccgga aaatggtaat 420
aacaaaaaaa aagaagaaga gtatcatcgt aaactggcac tgattctggc agcaaaaaat 480
agcgtgtttg tgcatattcg tcgcggtgat tatgttggta ttggttgtca gctgggcatc 540
gattatcaga aaaaagcact ggaatacatg gcaaaacgtg ttccgaatat ggaactgttt 600
gtgttttgcg aggacctgga atttacccag aatctggatc tgggctatcc gtttatggat 660
atgaccaccc gtgataaaga ggaagaggca tattgggata tgctgctgat gcagagctgt 720
aaacatggta ttattgccaa cagcacctat agttggtggg cagcatatct gattaataac 780
ccggaaaaaa tcattattgg tccgaaacat tggctgtttg gccatgaaaa catcctgtgt 840
aaagaatggg tgaaaatcga aagccacttt gaagtgaaaa gccagaaata taatgcctaa 900
<210> 202
<211> 299
<212> PRT
<213> Helicobacter pylori
<400> 202
Met Ala Phe Lys Val Val Gln Ile Cys Gly Gly Leu Gly Asn Gln Met
1 5 10 15
Phe Gln Tyr Ala Phe Ala Lys Ser Leu Gln Lys His Ser Asn Thr Pro
20 25 30
Val Leu Leu Asp Ile Thr Ser Phe Asp Trp Ser Asn Arg Lys Met Gln
35 40 45
Leu Glu Leu Phe Pro Ile Asp Leu Pro Tyr Ala Ser Glu Lys Glu Ile
50 55 60
Ala Ile Ala Lys Met Gln His Leu Pro Lys Leu Val Arg Asn Val Leu
65 70 75 80
Lys Cys Met Gly Phe Asp Arg Val Ser Gln Glu Ile Val Phe Glu Tyr
85 90 95
Glu Pro Lys Leu Leu Lys Thr Ser Arg Leu Thr Tyr Phe Tyr Gly Tyr
100 105 110
Phe Gln Asp Pro Arg Tyr Phe Asp Ala Ile Ser Pro Leu Ile Lys Gln
115 120 125
Thr Phe Thr Leu Pro Pro Pro Pro Glu Asn Gly Asn Asn Lys Lys Lys
130 135 140
Glu Glu Glu Tyr His Arg Lys Leu Ala Leu Ile Leu Ala Ala Lys Asn
145 150 155 160
Ser Val Phe Val His Ile Arg Arg Gly Asp Tyr Val Gly Ile Gly Cys
165 170 175
Gln Leu Gly Ile Asp Tyr Gln Lys Lys Ala Leu Glu Tyr Met Ala Lys
180 185 190
Arg Val Pro Asn Met Glu Leu Phe Val Phe Cys Glu Asp Leu Glu Phe
195 200 205
Thr Gln Asn Leu Asp Leu Gly Tyr Pro Phe Met Asp Met Thr Thr Arg
210 215 220
Asp Lys Glu Glu Glu Ala Tyr Trp Asp Met Leu Leu Met Gln Ser Cys
225 230 235 240
Lys His Gly Ile Ile Ala Asn Ser Thr Tyr Ser Trp Trp Ala Ala Tyr
245 250 255
Leu Ile Asn Asn Pro Glu Lys Ile Ile Ile Gly Pro Lys His Trp Leu
260 265 270
Phe Gly His Glu Asn Ile Leu Cys Lys Glu Trp Val Lys Ile Glu Ser
275 280 285
His Phe Glu Val Lys Ser Gln Lys Tyr Asn Ala
290 295
<210> 203
<211> 1341
<212> DNA
<213> Escherichia coli K12 MG1655
<400> 203
atgatgatta ctctgcgcaa acttcctctg gcggttgccg tcgcagcggg cgtaatgtct 60
gctcaggcaa tggctgttga tttccacggc tatgcacgtt ccggtattgg ttggacaggt 120
agcggcggtg aacaacagtg tttccagact accggtgctc aaagtaaata ccgtcttggc 180
aacgaatgtg aaacttatgc tgaattaaaa ttgggtcagg aagtgtggaa agagggcgat 240
aagagcttct atttcgacac taacgtggcc tattccgtcg cacaacagaa tgactgggaa 300
gctaccgatc cggccttccg tgaagcaaac gtgcagggta aaaacctgat cgaatggctg 360
ccaggctcca ccatctgggc aggtaagcgc ttctaccaac gtcatgacgt tcatatgatc 420
gacttctact actgggatat ttctggtcct ggtgccggtc tggaaaacat cgatgttggc 480
ttcggtaaac tctctctggc agcaacccgc tcctctgaag ctggtggttc ttcctctttc 540
gccagcaaca atatttatga ctataccaac gaaaccgcga acgacgtttt cgatgtgcgt 600
ttagcgcaga tggaaatcaa cccgggcggc acattagaac tgggtgtcga ctacggtcgt 660
gccaacttgc gtgataacta tcgtctggtt gatggcgcat cgaaagacgg ctggttattc 720
actgctgaac atactcagag tgtcctgaag ggctttaaca agtttgttgt tcagtacgct 780
actgactcga tgacctcgca gggtaaaggg ctgtcgcagg gttctggcgt tgcatttgat 840
aacgaaaaat ttgcctacaa tatcaacaac aacggtcaca tgctgcgtat cctcgaccac 900
ggtgcgatct ccatgggcga caactgggac atgatgtacg tgggtatgta ccaggatatc 960
aactgggata acgacaacgg caccaagtgg tggaccgtcg gtattcgccc gatgtacaag 1020
tggacgccaa tcatgagcac cgtgatggaa atcggctacg acaacgtcga atcccagcgc 1080
accggcgaca agaacaatca gtacaaaatt accctcgcac aacaatggca ggctggcgac 1140
agcatctggt cacgcccggc tattcgtgta ttcgcaacct acgccaagtg ggatgagaaa 1200
tggggttacg actacaccgg taacgctgat aacaacgcga acttcggcaa agccgttcct 1260
gctgatttca acggcggcag cttcggtcgt ggcgacagcg acgagtggac cttcggtgcc 1320
cagatggaaa tctggtggta a 1341
<210> 204
<211> 446
<212> PRT
<213> Escherichia coli K12 MG1655
<400> 204
Met Met Ile Thr Leu Arg Lys Leu Pro Leu Ala Val Ala Val Ala Ala
1 5 10 15
Gly Val Met Ser Ala Gln Ala Met Ala Val Asp Phe His Gly Tyr Ala
20 25 30
Arg Ser Gly Ile Gly Trp Thr Gly Ser Gly Gly Glu Gln Gln Cys Phe
35 40 45
Gln Thr Thr Gly Ala Gln Ser Lys Tyr Arg Leu Gly Asn Glu Cys Glu
50 55 60
Thr Tyr Ala Glu Leu Lys Leu Gly Gln Glu Val Trp Lys Glu Gly Asp
65 70 75 80
Lys Ser Phe Tyr Phe Asp Thr Asn Val Ala Tyr Ser Val Ala Gln Gln
85 90 95
Asn Asp Trp Glu Ala Thr Asp Pro Ala Phe Arg Glu Ala Asn Val Gln
100 105 110
Gly Lys Asn Leu Ile Glu Trp Leu Pro Gly Ser Thr Ile Trp Ala Gly
115 120 125
Lys Arg Phe Tyr Gln Arg His Asp Val His Met Ile Asp Phe Tyr Tyr
130 135 140
Trp Asp Ile Ser Gly Pro Gly Ala Gly Leu Glu Asn Ile Asp Val Gly
145 150 155 160
Phe Gly Lys Leu Ser Leu Ala Ala Thr Arg Ser Ser Glu Ala Gly Gly
165 170 175
Ser Ser Ser Phe Ala Ser Asn Asn Ile Tyr Asp Tyr Thr Asn Glu Thr
180 185 190
Ala Asn Asp Val Phe Asp Val Arg Leu Ala Gln Met Glu Ile Asn Pro
195 200 205
Gly Gly Thr Leu Glu Leu Gly Val Asp Tyr Gly Arg Ala Asn Leu Arg
210 215 220
Asp Asn Tyr Arg Leu Val Asp Gly Ala Ser Lys Asp Gly Trp Leu Phe
225 230 235 240
Thr Ala Glu His Thr Gln Ser Val Leu Lys Gly Phe Asn Lys Phe Val
245 250 255
Val Gln Tyr Ala Thr Asp Ser Met Thr Ser Gln Gly Lys Gly Leu Ser
260 265 270
Gln Gly Ser Gly Val Ala Phe Asp Asn Glu Lys Phe Ala Tyr Asn Ile
275 280 285
Asn Asn Asn Gly His Met Leu Arg Ile Leu Asp His Gly Ala Ile Ser
290 295 300
Met Gly Asp Asn Trp Asp Met Met Tyr Val Gly Met Tyr Gln Asp Ile
305 310 315 320
Asn Trp Asp Asn Asp Asn Gly Thr Lys Trp Trp Thr Val Gly Ile Arg
325 330 335
Pro Met Tyr Lys Trp Thr Pro Ile Met Ser Thr Val Met Glu Ile Gly
340 345 350
Tyr Asp Asn Val Glu Ser Gln Arg Thr Gly Asp Lys Asn Asn Gln Tyr
355 360 365
Lys Ile Thr Leu Ala Gln Gln Trp Gln Ala Gly Asp Ser Ile Trp Ser
370 375 380
Arg Pro Ala Ile Arg Val Phe Ala Thr Tyr Ala Lys Trp Asp Glu Lys
385 390 395 400
Trp Gly Tyr Asp Tyr Thr Gly Asn Ala Asp Asn Asn Ala Asn Phe Gly
405 410 415
Lys Ala Val Pro Ala Asp Phe Asn Gly Gly Ser Phe Gly Arg Gly Asp
420 425 430
Ser Asp Glu Trp Thr Phe Gly Ala Gln Met Glu Ile Trp Trp
435 440 445
<210> 205
<211> 1191
<212> DNA
<213> Escherichia coli K12 MG1655
<400> 205
atgaaaataa aaacaggtgc acgcatcctc gcattatccg cattaacgac gatgatgttt 60
tccgcctcgg ctctcgccaa aatcgaagaa ggtaaactgg taatctggat taacggcgat 120
aaaggctata acggtcttgc tgaagtcggt aagaaattcg agaaagatac cggaattaaa 180
gtcaccgttg agcatccgga taaactggaa gagaaattcc cacaggttgc ggcaactggc 240
gatggccctg acattatctt ctgggcacac gaccgctttg gtggctacgc tcaatctggc 300
ctgttggctg aaatcacccc ggacaaagcg ttccaggaca agctgtatcc gtttacctgg 360
gatgccgtac gttacaacgg caagctgatt gcttacccga tcgctgttga agcgttatcg 420
ctgatttata acaaagatct gctgccgaac ccgccaaaaa cctgggaaga gatcccggcg 480
ctggataaag aactgaaagc gaaaggtaag agcgcgctga tgttcaacct gcaagaaccg 540
tacttcacct ggccgctgat tgctgctgac gggggttatg cgttcaagta tgaaaacggc 600
aagtacgaca ttaaagacgt gggcgtggat aacgctggcg cgaaagcggg tctgaccttc 660
ctggttgacc tgattaaaaa caaacacatg aatgcagaca ccgattactc catcgcagaa 720
gctgccttta ataaaggcga aacagcgatg accatcaacg gcccgtgggc atggtccaac 780
atcgacacca gcaaagtgaa ttatggtgta acggtactgc cgaccttcaa gggtcaacca 840
tccaaaccgt tcgttggcgt gctgagcgca ggtattaacg ccgccagtcc gaacaaagag 900
ctggcgaaag agttcctcga aaactatctg ctgactgatg aaggtctgga agcggttaat 960
aaagacaaac cgctgggtgc cgtagcgctg aagtcttacg aggaagagtt ggcgaaagat 1020
ccacgtattg ccgccaccat ggaaaacgcc cagaaaggtg aaatcatgcc gaacatcccg 1080
cagatgtccg ctttctggta tgccgtgcgt actgcggtga tcaacgccgc cagcggtcgt 1140
cagactgtcg atgaagccct gaaagacgcg cagactcgta tcaccaagta a 1191
<210> 206
<211> 396
<212> PRT
<213> Escherichia coli K12 MG1655
<400> 206
Met Lys Ile Lys Thr Gly Ala Arg Ile Leu Ala Leu Ser Ala Leu Thr
1 5 10 15
Thr Met Met Phe Ser Ala Ser Ala Leu Ala Lys Ile Glu Glu Gly Lys
20 25 30
Leu Val Ile Trp Ile Asn Gly Asp Lys Gly Tyr Asn Gly Leu Ala Glu
35 40 45
Val Gly Lys Lys Phe Glu Lys Asp Thr Gly Ile Lys Val Thr Val Glu
50 55 60
His Pro Asp Lys Leu Glu Glu Lys Phe Pro Gln Val Ala Ala Thr Gly
65 70 75 80
Asp Gly Pro Asp Ile Ile Phe Trp Ala His Asp Arg Phe Gly Gly Tyr
85 90 95
Ala Gln Ser Gly Leu Leu Ala Glu Ile Thr Pro Asp Lys Ala Phe Gln
100 105 110
Asp Lys Leu Tyr Pro Phe Thr Trp Asp Ala Val Arg Tyr Asn Gly Lys
115 120 125
Leu Ile Ala Tyr Pro Ile Ala Val Glu Ala Leu Ser Leu Ile Tyr Asn
130 135 140
Lys Asp Leu Leu Pro Asn Pro Pro Lys Thr Trp Glu Glu Ile Pro Ala
145 150 155 160
Leu Asp Lys Glu Leu Lys Ala Lys Gly Lys Ser Ala Leu Met Phe Asn
165 170 175
Leu Gln Glu Pro Tyr Phe Thr Trp Pro Leu Ile Ala Ala Asp Gly Gly
180 185 190
Tyr Ala Phe Lys Tyr Glu Asn Gly Lys Tyr Asp Ile Lys Asp Val Gly
195 200 205
Val Asp Asn Ala Gly Ala Lys Ala Gly Leu Thr Phe Leu Val Asp Leu
210 215 220
Ile Lys Asn Lys His Met Asn Ala Asp Thr Asp Tyr Ser Ile Ala Glu
225 230 235 240
Ala Ala Phe Asn Lys Gly Glu Thr Ala Met Thr Ile Asn Gly Pro Trp
245 250 255
Ala Trp Ser Asn Ile Asp Thr Ser Lys Val Asn Tyr Gly Val Thr Val
260 265 270
Leu Pro Thr Phe Lys Gly Gln Pro Ser Lys Pro Phe Val Gly Val Leu
275 280 285
Ser Ala Gly Ile Asn Ala Ala Ser Pro Asn Lys Glu Leu Ala Lys Glu
290 295 300
Phe Leu Glu Asn Tyr Leu Leu Thr Asp Glu Gly Leu Glu Ala Val Asn
305 310 315 320
Lys Asp Lys Pro Leu Gly Ala Val Ala Leu Lys Ser Tyr Glu Glu Glu
325 330 335
Leu Ala Lys Asp Pro Arg Ile Ala Ala Thr Met Glu Asn Ala Gln Lys
340 345 350
Gly Glu Ile Met Pro Asn Ile Pro Gln Met Ser Ala Phe Trp Tyr Ala
355 360 365
Val Arg Thr Ala Val Ile Asn Ala Ala Ser Gly Arg Gln Thr Val Asp
370 375 380
Glu Ala Leu Lys Asp Ala Gln Thr Arg Ile Thr Lys
385 390 395
<210> 207
<211> 1116
<212> DNA
<213> Escherichia coli K12 MG1655
<400> 207
atggcgagcg tacagctgca aaatgtaacg aaagcctggg gcgaggtcgt ggtatcgaaa 60
gatatcaatc tcgatatcca tgaaggtgaa ttcgtggtgt ttgtcggacc gtctggctgc 120
ggtaaatcga ctttactgcg catgattgcc gggcttgaga ctatcaccag cggcgacctg 180
ttcatcggtg agaaacggat gaatgacact ccgccagcag aacgcggcgt tggtatggtg 240
tttcagtctt acgcgctcta tccccacctg tcagtagcag aaaacatgtc atttggcctg 300
aaactggctg gcgcaaaaaa agaggtgatt aaccaacgcg ttaaccaggt ggcggaagtg 360
ctacaactgg cgcatttgct ggatcgcaaa ccgaaagcgc tctccggtgg tcagcgtcag 420
cgtgtggcga ttggccgtac gctggtggcc gagccaagcg tatttttgct cgatgaaccg 480
ctctccaacc tcgatgctgc actgcgtgtg caaatgcgta tcgaaatctc ccgtctgcat 540
aaacgcctgg gccgcacaat gatttacgtc acccacgatc aggtcgaagc gatgacgctg 600
gccgacaaaa tcgtggtgct ggacgccggt cgcgtggcgc aggttgggaa accgctggag 660
ctgtaccact atccggcaga ccgttttgtc gccggattta tcggttcgcc aaagatgaac 720
ttcctgccgg taaaagtgac cgccaccgca atcgatcaag tgcaggtgga gctgccgatg 780
ccaaatcgtc agcaagtctg gctgccagtt gaaagccgtg atgtccaggt tggagccaat 840
atgtcgctgg gtattcgccc ggaacatcta ctgccgagtg atatcgctga cgtcatcctt 900
gagggtgaag ttcaggtcgt cgagcaactc ggcaacgaaa ctcaaatcca tatccagatc 960
ccttccattc gtcaaaacct ggtgtaccgc cagaacgacg tggtgttggt agaagaaggt 1020
gccacattcg ctatcggcct gccgccagag cgttgccatc tgttccgtga ggatggcact 1080
gcatgtcgtc gactgcataa ggagccgggc gtttaa 1116
<210> 208
<211> 371
<212> PRT
<213> Escherichia coli K12 MG1655
<400> 208
Met Ala Ser Val Gln Leu Gln Asn Val Thr Lys Ala Trp Gly Glu Val
1 5 10 15
Val Val Ser Lys Asp Ile Asn Leu Asp Ile His Glu Gly Glu Phe Val
20 25 30
Val Phe Val Gly Pro Ser Gly Cys Gly Lys Ser Thr Leu Leu Arg Met
35 40 45
Ile Ala Gly Leu Glu Thr Ile Thr Ser Gly Asp Leu Phe Ile Gly Glu
50 55 60
Lys Arg Met Asn Asp Thr Pro Pro Ala Glu Arg Gly Val Gly Met Val
65 70 75 80
Phe Gln Ser Tyr Ala Leu Tyr Pro His Leu Ser Val Ala Glu Asn Met
85 90 95
Ser Phe Gly Leu Lys Leu Ala Gly Ala Lys Lys Glu Val Ile Asn Gln
100 105 110
Arg Val Asn Gln Val Ala Glu Val Leu Gln Leu Ala His Leu Leu Asp
115 120 125
Arg Lys Pro Lys Ala Leu Ser Gly Gly Gln Arg Gln Arg Val Ala Ile
130 135 140
Gly Arg Thr Leu Val Ala Glu Pro Ser Val Phe Leu Leu Asp Glu Pro
145 150 155 160
Leu Ser Asn Leu Asp Ala Ala Leu Arg Val Gln Met Arg Ile Glu Ile
165 170 175
Ser Arg Leu His Lys Arg Leu Gly Arg Thr Met Ile Tyr Val Thr His
180 185 190
Asp Gln Val Glu Ala Met Thr Leu Ala Asp Lys Ile Val Val Leu Asp
195 200 205
Ala Gly Arg Val Ala Gln Val Gly Lys Pro Leu Glu Leu Tyr His Tyr
210 215 220
Pro Ala Asp Arg Phe Val Ala Gly Phe Ile Gly Ser Pro Lys Met Asn
225 230 235 240
Phe Leu Pro Val Lys Val Thr Ala Thr Ala Ile Asp Gln Val Gln Val
245 250 255
Glu Leu Pro Met Pro Asn Arg Gln Gln Val Trp Leu Pro Val Glu Ser
260 265 270
Arg Asp Val Gln Val Gly Ala Asn Met Ser Leu Gly Ile Arg Pro Glu
275 280 285
His Leu Leu Pro Ser Asp Ile Ala Asp Val Ile Leu Glu Gly Glu Val
290 295 300
Gln Val Val Glu Gln Leu Gly Asn Glu Thr Gln Ile His Ile Gln Ile
305 310 315 320
Pro Ser Ile Arg Gln Asn Leu Val Tyr Arg Gln Asn Asp Val Val Leu
325 330 335
Val Glu Glu Gly Ala Thr Phe Ala Ile Gly Leu Pro Pro Glu Arg Cys
340 345 350
His Leu Phe Arg Glu Asp Gly Thr Ala Cys Arg Arg Leu His Lys Glu
355 360 365
Pro Gly Val
370
<210> 209
<211> 1947
<212> DNA
<213> Escherichia coli K12 MG1655
<400> 209
atgaatattt taggtttttt ccagcgactc ggtagggcgt tacagctccc tatcgcggtg 60
ctgccggtgg cggcactgtt gctgcgattc ggtcagccag atttacttaa cgttgcgttt 120
attgcccagg cgggcggtgc gatttttgat aacctcgcat taatcttcgc catcggtgtg 180
gcatccagct ggtcgaaaga cagcgctggt gcggcggcgc tggcgggtgc ggtaggttac 240
tttgtgttaa ccaaagcgat ggtgaccatc aacccagaaa ttaacatggg tgtactggcg 300
ggtatcatta ccggtctggt tggtggcgca gcctataacc gttggtccga tattaaactg 360
ccggacttcc tgagcttctt cggcggcaaa cgctttgtgc cgattgccac cggattcttc 420
tgcctggtgc tggcggccat ttttggttac gtctggccgc cggtacagca cgctatccat 480
gcaggcggcg agtggatcgt ttctgcgggc gcgctgggtt ccggtatctt tggtttcatc 540
aaccgtctgc tgatcccaac cggtctgcat caggtactga acaccatcgc ctggttccag 600
attggtgaat tcaccaacgc ggcgggtacg gttttccacg gtgacattaa ccgcttctat 660
gccggtgacg gcaccgcggg gatgttcatg tccggcttct tcccgatcat gatgttcggt 720
ctgccgggtg cggcgctggc gatgtacttc gcagcaccga aagagcgtcg tccgatggtt 780
ggcggtatgc tgctttctgt tgctgttact gcgttcctga ccggtgtgac tgagccgctg 840
gaattcctgt tcatgttcct tgctccgctg ctgtacctcc tgcacgcact gctgaccggt 900
atcagcctgt ttgtggcaac gctgctgggt atccacgcgg gcttctcttt ctctgcgggg 960
gctatcgact acgcgttgat gtataacctg ccggccgcca gccagaacgt ctggatgctg 1020
ctggtgatgg gcgttatctt cttcgctatc tacttcgtgg tgttcagttt ggttatccgc 1080
atgttcaacc tgaaaacgcc gggtcgtgaa gataaagaag atgagatcgt tactgaagaa 1140
gccaacagca acactgaaga aggtctgact caactggcaa ccaactatat tgctgcggtt 1200
ggcggcactg acaacctgaa agcgattgac gcctgtatca cccgtctgcg ccttacagtg 1260
gctgactctg cccgcgttaa cgatacgatg tgtaaacgtc tgggtgcttc tggggtagtg 1320
aaactgaaca aacagactat tcaggtgatt gttggcgcga aagcagaatc catcggcgat 1380
gcgatgaaga aagtcgttgc ccgtggtccg gtagccgctg cgtcagctga agcaactccg 1440
gcaactgccg cgcctgtagc aaaaccgcag gctgtaccaa acgcggtatc tatcgcggag 1500
ctggtatcgc cgattaccgg tgatgtcgtg gcactggatc aggttcctga cgaagcattc 1560
gccagcaaag cggtgggtga cggtgtggcg gtgaaaccga cagataaaat cgtcgtatca 1620
ccagccgcag ggacaatcgt gaaaatcttc aacaccaacc acgcgttctg cctggaaacc 1680
gaaaaaggcg cggagatcgt cgtccatatg ggtatcgaca ccgtagcgct ggaaggtaaa 1740
ggctttaaac gtctggtgga agagggtgcg caggtaagcg cagggcaacc gattctggaa 1800
atggatctgg attacctgaa cgctaacgcc cgctcgatga ttagcccggt ggtttgcagc 1860
aatatcgacg atttcagtgg cttgatcatt aaagctcagg gccatattgt ggcgggtcaa 1920
acaccgctgt atgaaatcaa aaagtaa 1947
<210> 210
<211> 648
<212> PRT
<213> Escherichia coli K12 MG1655
<400> 210
Met Asn Ile Leu Gly Phe Phe Gln Arg Leu Gly Arg Ala Leu Gln Leu
1 5 10 15
Pro Ile Ala Val Leu Pro Val Ala Ala Leu Leu Leu Arg Phe Gly Gln
20 25 30
Pro Asp Leu Leu Asn Val Ala Phe Ile Ala Gln Ala Gly Gly Ala Ile
35 40 45
Phe Asp Asn Leu Ala Leu Ile Phe Ala Ile Gly Val Ala Ser Ser Trp
50 55 60
Ser Lys Asp Ser Ala Gly Ala Ala Ala Leu Ala Gly Ala Val Gly Tyr
65 70 75 80
Phe Val Leu Thr Lys Ala Met Val Thr Ile Asn Pro Glu Ile Asn Met
85 90 95
Gly Val Leu Ala Gly Ile Ile Thr Gly Leu Val Gly Gly Ala Ala Tyr
100 105 110
Asn Arg Trp Ser Asp Ile Lys Leu Pro Asp Phe Leu Ser Phe Phe Gly
115 120 125
Gly Lys Arg Phe Val Pro Ile Ala Thr Gly Phe Phe Cys Leu Val Leu
130 135 140
Ala Ala Ile Phe Gly Tyr Val Trp Pro Pro Val Gln His Ala Ile His
145 150 155 160
Ala Gly Gly Glu Trp Ile Val Ser Ala Gly Ala Leu Gly Ser Gly Ile
165 170 175
Phe Gly Phe Ile Asn Arg Leu Leu Ile Pro Thr Gly Leu His Gln Val
180 185 190
Leu Asn Thr Ile Ala Trp Phe Gln Ile Gly Glu Phe Thr Asn Ala Ala
195 200 205
Gly Thr Val Phe His Gly Asp Ile Asn Arg Phe Tyr Ala Gly Asp Gly
210 215 220
Thr Ala Gly Met Phe Met Ser Gly Phe Phe Pro Ile Met Met Phe Gly
225 230 235 240
Leu Pro Gly Ala Ala Leu Ala Met Tyr Phe Ala Ala Pro Lys Glu Arg
245 250 255
Arg Pro Met Val Gly Gly Met Leu Leu Ser Val Ala Val Thr Ala Phe
260 265 270
Leu Thr Gly Val Thr Glu Pro Leu Glu Phe Leu Phe Met Phe Leu Ala
275 280 285
Pro Leu Leu Tyr Leu Leu His Ala Leu Leu Thr Gly Ile Ser Leu Phe
290 295 300
Val Ala Thr Leu Leu Gly Ile His Ala Gly Phe Ser Phe Ser Ala Gly
305 310 315 320
Ala Ile Asp Tyr Ala Leu Met Tyr Asn Leu Pro Ala Ala Ser Gln Asn
325 330 335
Val Trp Met Leu Leu Val Met Gly Val Ile Phe Phe Ala Ile Tyr Phe
340 345 350
Val Val Phe Ser Leu Val Ile Arg Met Phe Asn Leu Lys Thr Pro Gly
355 360 365
Arg Glu Asp Lys Glu Asp Glu Ile Val Thr Glu Glu Ala Asn Ser Asn
370 375 380
Thr Glu Glu Gly Leu Thr Gln Leu Ala Thr Asn Tyr Ile Ala Ala Val
385 390 395 400
Gly Gly Thr Asp Asn Leu Lys Ala Ile Asp Ala Cys Ile Thr Arg Leu
405 410 415
Arg Leu Thr Val Ala Asp Ser Ala Arg Val Asn Asp Thr Met Cys Lys
420 425 430
Arg Leu Gly Ala Ser Gly Val Val Lys Leu Asn Lys Gln Thr Ile Gln
435 440 445
Val Ile Val Gly Ala Lys Ala Glu Ser Ile Gly Asp Ala Met Lys Lys
450 455 460
Val Val Ala Arg Gly Pro Val Ala Ala Ala Ser Ala Glu Ala Thr Pro
465 470 475 480
Ala Thr Ala Ala Pro Val Ala Lys Pro Gln Ala Val Pro Asn Ala Val
485 490 495
Ser Ile Ala Glu Leu Val Ser Pro Ile Thr Gly Asp Val Val Ala Leu
500 505 510
Asp Gln Val Pro Asp Glu Ala Phe Ala Ser Lys Ala Val Gly Asp Gly
515 520 525
Val Ala Val Lys Pro Thr Asp Lys Ile Val Val Ser Pro Ala Ala Gly
530 535 540
Thr Ile Val Lys Ile Phe Asn Thr Asn His Ala Phe Cys Leu Glu Thr
545 550 555 560
Glu Lys Gly Ala Glu Ile Val Val His Met Gly Ile Asp Thr Val Ala
565 570 575
Leu Glu Gly Lys Gly Phe Lys Arg Leu Val Glu Glu Gly Ala Gln Val
580 585 590
Ser Ala Gly Gln Pro Ile Leu Glu Met Asp Leu Asp Tyr Leu Asn Ala
595 600 605
Asn Ala Arg Ser Met Ile Ser Pro Val Val Cys Ser Asn Ile Asp Asp
610 615 620
Phe Ser Gly Leu Ile Ile Lys Ala Gln Gly His Ile Val Ala Gly Gln
625 630 635 640
Thr Pro Leu Tyr Glu Ile Lys Lys
645
<210> 211
<211> 372
<212> DNA
<213> Escherichia coli K12 MG1655
<400> 211
atgaccgtta tttatcagac caccatcacc cgtatcggcg cgagtgccat tgacgccctc 60
agtgaccaga tgctcatcac ctttcgtgaa ggcgcgcctg cggacctcga agagtattgc 120
ttcattcatt gccacggcga gttgaaaggt gcactccatc ccggtttgca attttcactc 180
gggcagcatc gctatccggt gaccgctgtt ggcagcgtgg cggaagataa ccttcgcgaa 240
ctgggtcatg tcaccctgcg cttcgatggt ttaaacgaag cggaatttcc gggcactgtc 300
catgtggcag gccctgtccc cgacgatatc gcgccgggat cggttttgaa gtttgaatct 360
gttaaggagt aa 372
<210> 212
<211> 123
<212> PRT
<213> Escherichia coli K12 MG1655
<400> 212
Met Thr Val Ile Tyr Gln Thr Thr Ile Thr Arg Ile Gly Ala Ser Ala
1 5 10 15
Ile Asp Ala Leu Ser Asp Gln Met Leu Ile Thr Phe Arg Glu Gly Ala
20 25 30
Pro Ala Asp Leu Glu Glu Tyr Cys Phe Ile His Cys His Gly Glu Leu
35 40 45
Lys Gly Ala Leu His Pro Gly Leu Gln Phe Ser Leu Gly Gln His Arg
50 55 60
Tyr Pro Val Thr Ala Val Gly Ser Val Ala Glu Asp Asn Leu Arg Glu
65 70 75 80
Leu Gly His Val Thr Leu Arg Phe Asp Gly Leu Asn Glu Ala Glu Phe
85 90 95
Pro Gly Thr Val His Val Ala Gly Pro Val Pro Asp Asp Ile Ala Pro
100 105 110
Gly Ser Val Leu Lys Phe Glu Ser Val Lys Glu
115 120
<210> 213
<211> 990
<212> DNA
<213> Escherichia coli K12 MG1655
<400> 213
atgcacaaat ttactaaagc cctggcagcc attggtctgg cagccgttat gtcacaatcc 60
gctatggcgg agaacctgaa gctcggtttt ctggtgaagc aaccggaaga gccgtggttc 120
cagaccgaat ggaagtttgc cgataaagcc gggaaggatt tagggtttga ggttattaag 180
attgccgtgc cggatggcga aaaaacattg aacgcgatcg acagcctggc tgccagtggc 240
gcaaaaggtt tcgttatttg tactccggac cccaaactcg gctctgccat cgtcgcgaaa 300
gcgcgtggct acgatatgaa agtcattgcc gtggatgacc agtttgttaa cgccaaaggt 360
aagccaatgg ataccgttcc gctggtgatg atggcggcga ctaaaattgg cgaacgtcag 420
ggccaggaac tgtataaaga gatgcagaaa cgtggctggg atgtcaaaga aagcgcggtg 480
atggcgatta ccgccaacga actggatacc gcccgccgcc gtactacggg atctatggat 540
gcgctgaaag cggccggatt cccggaaaaa caaatttatc aggtacctac caaatctaac 600
gacatcccgg gggcatttga cgctgccaac tcaatgctgg ttcaacatcc ggaagttaaa 660
cattggctga tcgtcggtat gaacgacagc accgtgctgg gcggcgtacg cgcgacggaa 720
ggtcagggct ttaaagcggc cgatatcatc ggcattggca ttaacggtgt ggatgcggtg 780
agcgaactgt ctaaagcaca ggcaaccggc ttctacggtt ccctgctgcc aagcccggac 840
gtacatggct ataaatccag cgaaatgctt tacaactggg tagcaaaaga cgttgaaccg 900
ccaaaattta ccgaagttac cgacgtggta ctgatcacgc gtgacaactt taaagaagaa 960
ctggagaaaa aaggtttagg cggtaagtaa 990
<210> 214
<211> 329
<212> PRT
<213> Escherichia coli K12 MG1655
<400> 214
Met His Lys Phe Thr Lys Ala Leu Ala Ala Ile Gly Leu Ala Ala Val
1 5 10 15
Met Ser Gln Ser Ala Met Ala Glu Asn Leu Lys Leu Gly Phe Leu Val
20 25 30
Lys Gln Pro Glu Glu Pro Trp Phe Gln Thr Glu Trp Lys Phe Ala Asp
35 40 45
Lys Ala Gly Lys Asp Leu Gly Phe Glu Val Ile Lys Ile Ala Val Pro
50 55 60
Asp Gly Glu Lys Thr Leu Asn Ala Ile Asp Ser Leu Ala Ala Ser Gly
65 70 75 80
Ala Lys Gly Phe Val Ile Cys Thr Pro Asp Pro Lys Leu Gly Ser Ala
85 90 95
Ile Val Ala Lys Ala Arg Gly Tyr Asp Met Lys Val Ile Ala Val Asp
100 105 110
Asp Gln Phe Val Asn Ala Lys Gly Lys Pro Met Asp Thr Val Pro Leu
115 120 125
Val Met Met Ala Ala Thr Lys Ile Gly Glu Arg Gln Gly Gln Glu Leu
130 135 140
Tyr Lys Glu Met Gln Lys Arg Gly Trp Asp Val Lys Glu Ser Ala Val
145 150 155 160
Met Ala Ile Thr Ala Asn Glu Leu Asp Thr Ala Arg Arg Arg Thr Thr
165 170 175
Gly Ser Met Asp Ala Leu Lys Ala Ala Gly Phe Pro Glu Lys Gln Ile
180 185 190
Tyr Gln Val Pro Thr Lys Ser Asn Asp Ile Pro Gly Ala Phe Asp Ala
195 200 205
Ala Asn Ser Met Leu Val Gln His Pro Glu Val Lys His Trp Leu Ile
210 215 220
Val Gly Met Asn Asp Ser Thr Val Leu Gly Gly Val Arg Ala Thr Glu
225 230 235 240
Gly Gln Gly Phe Lys Ala Ala Asp Ile Ile Gly Ile Gly Ile Asn Gly
245 250 255
Val Asp Ala Val Ser Glu Leu Ser Lys Ala Gln Ala Thr Gly Phe Tyr
260 265 270
Gly Ser Leu Leu Pro Ser Pro Asp Val His Gly Tyr Lys Ser Ser Glu
275 280 285
Met Leu Tyr Asn Trp Val Ala Lys Asp Val Glu Pro Pro Lys Phe Thr
290 295 300
Glu Val Thr Asp Val Val Leu Ile Thr Arg Asp Asn Phe Lys Glu Glu
305 310 315 320
Leu Glu Lys Lys Gly Leu Gly Gly Lys
325
<210> 215
<211> 993
<212> DNA
<213> Escherichia coli K12 MG1655
<400> 215
atgaaaataa agaacattct actcaccctt tgcacctcac tcctgcttac caacgttgct 60
gcacacgcca aagaagtcaa aataggtatg gcgattgatg atctccgtct tgaacgctgg 120
caaaaagatc gagatatctt tgtgaaaaag gcagaatctc tcggcgcgaa agtatttgta 180
cagtctgcaa atggcaatga agaaacacaa atgtcgcaga ttgaaaacat gataaaccgg 240
ggtgtcgatg ttcttgtcat tattccgtat aacggtcagg tattaagtaa cgttgtaaaa 300
gaagccaaac aagaaggcat taaagtatta gcttacgacc gtatgattaa cgatgcggat 360
atcgattttt atatttcttt cgataacgaa aaagtcggtg aactgcaggc aaaagccctg 420
gtcgatattg ttccgcaagg taattacttc ctgatgggcg gctcgccggt agataacaac 480
gccaagctgt tccgcgccgg acaaatgaaa gtgttaaaac cttacgttga ttccggaaaa 540
attaaagtcg ttggtgacca atgggttgat ggctggttac cggaaaacgc attgaaaatt 600
atggaaaacg cgctaaccgc caataataac aaaattgatg ctgtagttgc ctcaaacgat 660
gccaccgcag gtggggcaat tcaggcatta agcgcgcaag gtttatcagg gaaagtagca 720
atctccggcc aggatgcgga tctcgcaggt attaaacgta ttgctgccgg tacgcaaact 780
atgacggtgt ataaacctat tacgttgttg gcaaatactg ccgcagaaat tgccgttgag 840
ttgggcaatg gtcaggaacc aaaagcagat accacactga ataatggcct gaaagatgtc 900
ccctcccgcc tcctgacacc gatcgatgtg aataaaaaca acatcaaaga tacggtaatt 960
aaagacggat tccacaaaga gagcgagctg taa 993
<210> 216
<211> 330
<212> PRT
<213> Escherichia coli K12 MG1655
<400> 216
Met Lys Ile Lys Asn Ile Leu Leu Thr Leu Cys Thr Ser Leu Leu Leu
1 5 10 15
Thr Asn Val Ala Ala His Ala Lys Glu Val Lys Ile Gly Met Ala Ile
20 25 30
Asp Asp Leu Arg Leu Glu Arg Trp Gln Lys Asp Arg Asp Ile Phe Val
35 40 45
Lys Lys Ala Glu Ser Leu Gly Ala Lys Val Phe Val Gln Ser Ala Asn
50 55 60
Gly Asn Glu Glu Thr Gln Met Ser Gln Ile Glu Asn Met Ile Asn Arg
65 70 75 80
Gly Val Asp Val Leu Val Ile Ile Pro Tyr Asn Gly Gln Val Leu Ser
85 90 95
Asn Val Val Lys Glu Ala Lys Gln Glu Gly Ile Lys Val Leu Ala Tyr
100 105 110
Asp Arg Met Ile Asn Asp Ala Asp Ile Asp Phe Tyr Ile Ser Phe Asp
115 120 125
Asn Glu Lys Val Gly Glu Leu Gln Ala Lys Ala Leu Val Asp Ile Val
130 135 140
Pro Gln Gly Asn Tyr Phe Leu Met Gly Gly Ser Pro Val Asp Asn Asn
145 150 155 160
Ala Lys Leu Phe Arg Ala Gly Gln Met Lys Val Leu Lys Pro Tyr Val
165 170 175
Asp Ser Gly Lys Ile Lys Val Val Gly Asp Gln Trp Val Asp Gly Trp
180 185 190
Leu Pro Glu Asn Ala Leu Lys Ile Met Glu Asn Ala Leu Thr Ala Asn
195 200 205
Asn Asn Lys Ile Asp Ala Val Val Ala Ser Asn Asp Ala Thr Ala Gly
210 215 220
Gly Ala Ile Gln Ala Leu Ser Ala Gln Gly Leu Ser Gly Lys Val Ala
225 230 235 240
Ile Ser Gly Gln Asp Ala Asp Leu Ala Gly Ile Lys Arg Ile Ala Ala
245 250 255
Gly Thr Gln Thr Met Thr Val Tyr Lys Pro Ile Thr Leu Leu Ala Asn
260 265 270
Thr Ala Ala Glu Ile Ala Val Glu Leu Gly Asn Gly Gln Glu Pro Lys
275 280 285
Ala Asp Thr Thr Leu Asn Asn Gly Leu Lys Asp Val Pro Ser Arg Leu
290 295 300
Leu Thr Pro Ile Asp Val Asn Lys Asn Asn Ile Lys Asp Thr Val Ile
305 310 315 320
Lys Asp Gly Phe His Lys Glu Ser Glu Leu
325 330
<210> 217
<211> 957
<212> DNA
<213> Escherichia coli K12 MG1655
<400> 217
atgtggaaac gcttacttat agtctctgca gtctcggcag ccatgtcgtc tatggcgttg 60
gccgctccat taaccgttgg attttcgcag gtcggatcgg aatcaggctg gcgtgccgca 120
gaaaccaatg tggcgaaaag tgaagccgaa aagcgcggaa tcacgttgaa aattgccgat 180
ggtcagcaaa agcaggaaaa ccagattaaa gcggtacgtt ccttcgttgc acaaggggtg 240
gatgcgatct ttatcgctcc ggtggtcgcg acaggttggg aaccggtatt aaaagaggcg 300
aaagatgccg aaatcccggt attcttgctc gatcgttcca ttgatgtgaa agacaaatct 360
ctctatatga ccaccgtcac tgccgacaac atcctcgaag gcaagttgat tggtgactgg 420
ctggtaaaag aagtgaatgg caaaccatgc aacgtggtgg agctgcaggg caccgttggg 480
gccagcgtcg ccattgaccg taagaaaggc tttgccgaag ccattaagaa tgcgccaaat 540
atcaaaatca tccgctcgca gtcaggtgac ttcacccgca gtaaaggcaa agaagtcatg 600
gagagcttta tcaaagcgga aaacaacggc aaaaacatct gcatggttta cgcccataac 660
gacgacatgg tgattggtgc aattcaggca attaaagaag cgggcctgaa accgggcaaa 720
gatatcctca cgggttccat tgacggtgta ccggacatct acaaagcgat gatggatggc 780
gaagcgaacg ccagtgttga actgacgccg aatatggcag gtcccgcctt cgacgcgctg 840
gagaaataca aaaaagacgg caccatgcct gaaaagctga cgttaaccaa atccaccctt 900
tacctgcctg ataccgcaaa agaagaatta gagaagaaga aaaatatggg gtattga 957
<210> 218
<211> 318
<212> PRT
<213> Escherichia coli K12 MG1655
<400> 218
Met Trp Lys Arg Leu Leu Ile Val Ser Ala Val Ser Ala Ala Met Ser
1 5 10 15
Ser Met Ala Leu Ala Ala Pro Leu Thr Val Gly Phe Ser Gln Val Gly
20 25 30
Ser Glu Ser Gly Trp Arg Ala Ala Glu Thr Asn Val Ala Lys Ser Glu
35 40 45
Ala Glu Lys Arg Gly Ile Thr Leu Lys Ile Ala Asp Gly Gln Gln Lys
50 55 60
Gln Glu Asn Gln Ile Lys Ala Val Arg Ser Phe Val Ala Gln Gly Val
65 70 75 80
Asp Ala Ile Phe Ile Ala Pro Val Val Ala Thr Gly Trp Glu Pro Val
85 90 95
Leu Lys Glu Ala Lys Asp Ala Glu Ile Pro Val Phe Leu Leu Asp Arg
100 105 110
Ser Ile Asp Val Lys Asp Lys Ser Leu Tyr Met Thr Thr Val Thr Ala
115 120 125
Asp Asn Ile Leu Glu Gly Lys Leu Ile Gly Asp Trp Leu Val Lys Glu
130 135 140
Val Asn Gly Lys Pro Cys Asn Val Val Glu Leu Gln Gly Thr Val Gly
145 150 155 160
Ala Ser Val Ala Ile Asp Arg Lys Lys Gly Phe Ala Glu Ala Ile Lys
165 170 175
Asn Ala Pro Asn Ile Lys Ile Ile Arg Ser Gln Ser Gly Asp Phe Thr
180 185 190
Arg Ser Lys Gly Lys Glu Val Met Glu Ser Phe Ile Lys Ala Glu Asn
195 200 205
Asn Gly Lys Asn Ile Cys Met Val Tyr Ala His Asn Asp Asp Met Val
210 215 220
Ile Gly Ala Ile Gln Ala Ile Lys Glu Ala Gly Leu Lys Pro Gly Lys
225 230 235 240
Asp Ile Leu Thr Gly Ser Ile Asp Gly Val Pro Asp Ile Tyr Lys Ala
245 250 255
Met Met Asp Gly Glu Ala Asn Ala Ser Val Glu Leu Thr Pro Asn Met
260 265 270
Ala Gly Pro Ala Phe Asp Ala Leu Glu Lys Tyr Lys Lys Asp Gly Thr
275 280 285
Met Pro Glu Lys Leu Thr Leu Thr Lys Ser Thr Leu Tyr Leu Pro Asp
290 295 300
Thr Ala Lys Glu Glu Leu Glu Lys Lys Lys Asn Met Gly Tyr
305 310 315
<210> 219
<211> 936
<212> DNA
<213> Helicobacter sp. MIT 01-6242
<400> 219
atgttttcag ttcgtttaat ggggggctta ggaaaccaga tgtttattta tgcttttgca 60
aaggctataa aggcgcaggg gtatccggtg cgtctatttt attatgatac ggattacaac 120
gtgccgcaga cgcacaacat tcgtaactta gagatagtgg attttggcat tgcgatgtgt 180
atagaaacta tgtgttatga agaaccacag atcaaaaaat ctttctttga gcgtgcgtta 240
ggctttataa aacgtaagtt aaaaatacat tcaccacatt caagctcttt aattagcgat 300
cattgtgaga ttgctttaac taaagatttt cttgatacgt taaacccgaa cgctatgttt 360
aacggttatt tccagaacgt tgtatttttc gatcatcttc gtgaatcatt attaagagat 420
tttactctta aacgtccgct tactccggca aacgaggcgt taaaacatca gatcttacag 480
acgccaaaca gctgctttct acatattcgg cggggggatt atttacaaat tccgatatat 540
gttaaacttg gtagcactta ctacaataac gctatcaagg ctcttaaaga taagatctca 600
aagccacata tctttgtttt tagcaacgac attgcgtggt gcaaggaatt tttcttagat 660
agcttagatc ccttagtgat tgaaaacgtg acttttagct ttatagaaaa taacgatgaa 720
gggaacgcca ttgaggaaat ggaacttatg cggtcatgcc agcacgcaat tattgcgaac 780
agcacgttta gctggtgggc ggcgtattta attgacagcg ctcagaaact ttgcattatg 840
cctaaacact ttttcaatga tccccagcag gaagtagcac acaaactaat tccaccacca 900
cttcatagct tatctcagac tatagtaatt ggttaa 936
<210> 220
<211> 311
<212> PRT
<213> Helicobacter sp. MIT 01-6242
<400> 220
Met Phe Ser Val Arg Leu Met Gly Gly Leu Gly Asn Gln Met Phe Ile
1 5 10 15
Tyr Ala Phe Ala Lys Ala Ile Lys Ala Gln Gly Tyr Pro Val Arg Leu
20 25 30
Phe Tyr Tyr Asp Thr Asp Tyr Asn Val Pro Gln Thr His Asn Ile Arg
35 40 45
Asn Leu Glu Ile Val Asp Phe Gly Ile Ala Met Cys Ile Glu Thr Met
50 55 60
Cys Tyr Glu Glu Pro Gln Ile Lys Lys Ser Phe Phe Glu Arg Ala Leu
65 70 75 80
Gly Phe Ile Lys Arg Lys Leu Lys Ile His Ser Pro His Ser Ser Ser
85 90 95
Leu Ile Ser Asp His Cys Glu Ile Ala Leu Thr Lys Asp Phe Leu Asp
100 105 110
Thr Leu Asn Pro Asn Ala Met Phe Asn Gly Tyr Phe Gln Asn Val Val
115 120 125
Phe Phe Asp His Leu Arg Glu Ser Leu Leu Arg Asp Phe Thr Leu Lys
130 135 140
Arg Pro Leu Thr Pro Ala Asn Glu Ala Leu Lys His Gln Ile Leu Gln
145 150 155 160
Thr Pro Asn Ser Cys Phe Leu His Ile Arg Arg Gly Asp Tyr Leu Gln
165 170 175
Ile Pro Ile Tyr Val Lys Leu Gly Ser Thr Tyr Tyr Asn Asn Ala Ile
180 185 190
Lys Ala Leu Lys Asp Lys Ile Ser Lys Pro His Ile Phe Val Phe Ser
195 200 205
Asn Asp Ile Ala Trp Cys Lys Glu Phe Phe Leu Asp Ser Leu Asp Pro
210 215 220
Leu Val Ile Glu Asn Val Thr Phe Ser Phe Ile Glu Asn Asn Asp Glu
225 230 235 240
Gly Asn Ala Ile Glu Glu Met Glu Leu Met Arg Ser Cys Gln His Ala
245 250 255
Ile Ile Ala Asn Ser Thr Phe Ser Trp Trp Ala Ala Tyr Leu Ile Asp
260 265 270
Ser Ala Gln Lys Leu Cys Ile Met Pro Lys His Phe Phe Asn Asp Pro
275 280 285
Gln Gln Glu Val Ala His Lys Leu Ile Pro Pro Pro Leu His Ser Leu
290 295 300
Ser Gln Thr Ile Val Ile Gly
305 310
Claims (68)
- 유전자 변형 세포에 의해 푸코실락토스 (fucosyllactose)를 제조하는 방법으로서,
- 푸코실락토스를 생성할 수 있는 세포를 제공하는 단계로서, 상기 세포는 구아노신-디포스페이트 푸코스 (GDP-푸코스) 공여체로부터의 푸코스 잔기를 락토스 수용체에 전달하여 푸코실락토스를 합성하는 푸코실트란스퍼라제를 코딩하는 핵산 서열을 적어도 1개 포함하고,
- 상기 세포는 i) 푸코실락토스 수송을 가능하게 하고/하거나 이를 향상시키는 내인성 막 단백질의 변형된 발현 및/또는 ii) 푸코실락토스 수송을 가능하게 하고/하거나 이를 향상시키는 이종 막 단백질의 발현을 추가로 포함하고, 상기 막 단백질은 i) 2019년 7월 4일자로 공개된 InterPro 75.0에 정의되는, interpro 번호 IPR001503 및 IPR002516을 각각 사용하여 GT10 및 GT11 푸코실트란스퍼라제 패밀리의 게놈 인근 (genomic neighbourhood)을 검색하여 발견된 PFAM 도메인들 중 어느 하나의 도메인을 포함하는 막 단백질들의 그룹으로부터 선택되고, 여기서 상기 게놈 인근 윈도우 크기 (genomic neighbourhood window size)는 각 푸코실트란스퍼라제 앞에 14개의 유전자 및 뒤에 14개의 유전자이고, 상기 막 단백질은 SET 패밀리에 속하지 않으며, 또는 ii) 서열번호: 204, 206, 208, 210, 212, 214, 216, 218을 포함하는 막 단백질, 또는 서열번호: 204, 206, 208, 210, 212, 214, 216, 218을 포함하는 막 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 204, 206, 208, 210, 212, 214, 216, 218을 갖는 상기 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 서열의 그룹으로부터 선택되는 것인 단계,
- 상기 세포를 배지에서 원하는 푸코실락토스의 생성을 허용하는 조건 하에 배양하는 단계,
- 바람직하게는 상기 푸코실락토스를 배양으로부터 분리하는 단계를 포함하는 푸코실락토스를 제조하는 방법. - 청구항 1에 있어서, 상기 막 단백질은
a) 포터 (porters);
b) P-P-결합-가수분해-유도 수송체 (P-P-bond-hydrolysis-driven transporters);
c) β-배럴 포린 (β-barrel Porins);
d) 보조 수송 단백질 (auxiliary transport proteins);
e) 추정 수송 단백질 (putative transport proteins); 및
f) 포스포트란스퍼-유도 그룹 전위인자 (phosphotransfer-driven group translocators)의 그룹으로부터 선택되는 것인 방법. - 유전자 변형 세포에 의해 푸코실락토스를 제조하는 방법으로서,
- 푸코실락토스를 생성할 수 있는 세포를 제공하는 단계로서, 상기 세포는 GDP-푸코스 공여체로부터의 푸코스 잔기를 락토스 수용체에 전달하여 푸코실락토스를 합성하는 푸코실트란스퍼라제를 코딩하는 핵산 서열을 적어도 1개 포함하고,
- 상기 세포는 i) 푸코실락토스 수송을 가능하게 하고/하거나 이를 향상시키는 내인성 막 단백질의 변형된 발현, 및/또는 ii) 푸코실락토스 수송을 가능하게 하고/하거나 이를 향상시키는 이종 막 단백질의 발현을 추가로 포함하고, 상기 막 단백질은
a) 포터, 여기서 상기 막 단백질은 SET 패밀리에 속하지 않음;
b) P-P-결합-가수분해-유도 수송체;
c) β-배럴 포린;
d) 보조 수송 단백질;
e) 추정 수송 단백질; 및
f) 포스포트란스퍼-유도 그룹 전위인자의 그룹으로부터 선택되는 것인 단계,
- 상기 세포를 배지에서 원하는 푸코실락토스의 생성을 허용하는 조건 하에 배양하는 단계,
- 바람직하게는, 상기 푸코실락토스를 배양으로부터 분리하는 단계를 포함하는 방법. - 청구항 2 또는 3에 있어서, 상기 포터는 2019년 6월 17일자로 공개된 TCDB.org에 의해 정의되는, TCDB 클래스 2.A.1.1, 2.A.1.12, 2.A.1.15, 2.A.1.2, 2.A.1.3, 2.A.1.36, 2.A.1.38, 2.A.1.46, 2.A.1.68, 2.A.1.7, 2.A.1.81, 2.A.123, 2.A.2, 2.A.21, 2.A.58, 2.A.6.3, 2.A.66 및 2.A.7.1의 그룹으로부터 선택되는 것인 방법.
- 청구항 2 또는 3에 있어서, 상기 P-P-결합-가수분해-유도 수송체는 2019년 6월 17일자로 공개된 TCDB.org에 의해 정의되는, TCDB 클래스 3.A.1.1, 3.A.1.2, 3.A.1.10, 3.A.1.11 및 3.A.1.5의 그룹으로부터 선택되는 것인 방법.
- 청구항 2 또는 3에 있어서, 상기 β-배럴 포린은 2019년 6월 17일자로 공개된 TCDB.org에 의해 정의되는, TCDB 클래스 1.B.3.1 및 1.B.18로부터 선택되는 것인 방법.
- 청구항 2 또는 3에 있어서, 상기 보조 수송 단백질은 2019년 6월 17일자로 공개된 TCDB.org에 의해 정의되는, TCDB 클래스 8.A.3으로부터 선택되는 것인 방법.
- 청구항 2 또는 3에 있어서, 상기 추정 수송 단백질은 2019년 6월 17일자로 공개된 TCDB.org에 의해 정의되는, TCDB 클래스 9.B.14 및 9.B.158의 그룹으로부터 선택되는 것인 방법.
- 청구항 2 또는 3에 있어서, 상기 포스포트란스퍼-유도 그룹 전위인자는 2019년 6월 17일자로 공개된 TCDB.org에 의해 정의되는, TCDB 클래스 4.A.1.1 및 4.A.4.1의 그룹으로부터 선택되는 것인 방법.
- 청구항 2 또는 3에 있어서, 상기 포터는 2017년 11월 3일자로 공개된 eggnogdb 1.0.2에 의해 정의되는, eggnog 패밀리 (eggnog families) 05BZS, 05C0R, 05C2C, 05CT4, 05CXP, 05CZQ, 05D94, 05DXI, 05E5M, 05E5W, 05E8G, 05EAM, 05EDR, 05EGZ, 05F9N, 05JHE, 05PSV, 05W2Y, 05W3H, 05XJ5, 070Q9, 07CWC, 07QF7, 07QNK, 07RBJ, 07RJ1, 07T5E, 07VQ3, 0814C, 088QT, 08H15, 08N8A, 08SC4, 08Z4Q의 그룹으로부터 선택되는 것인 방법.
- 청구항 2 또는 3에 있어서, 상기 P-P-결합-가수분해-유도 수송체는 2017년 11월 3일자로 공개된 eggnogdb 1.0.2에 의해 정의되는, eggnog 패밀리 05BZ1, 05CJ1, 05EY8, 05HAC, 05DMK, 05DFW, 05MFV, 07FKK, 07R5U, 07V1T, 08IJ9, 08JQ7, 172T7의 그룹으로부터 선택되는 것인 방법.
- 청구항 2 또는 3에 있어서, 상기 β-배럴 포린은 2017년 11월 3일자로 공개된 eggnogdb 1.0.2에 의해 정의되는, eggnog 패밀리 05DAY, 08KDD의 그룹으로부터 선택되는 것인 방법.
- 청구항 2 또는 3에 있어서, 상기 보조 수송 단백질은 2017년 11월 3일자로 공개된 eggnogdb 1.0.2에 의해 정의되는, eggnog 패밀리 07SYR의 그룹으로부터 선택되는 것인 방법.
- 청구항 2 또는 3에 있어서, 상기 추정 수송 단백질은 2017년 11월 3일자로 공개된 eggnogdb 1.0.2에 의해 정의되는, eggnog 패밀리 05CRE, 05GWF, 06N3A의 그룹으로부터 선택되는 것인 방법.
- 청구항 2 또는 3에 있어서, 상기 포스포트란스퍼-유도 그룹 전위인자는 2017년 11월 3일자로 공개된 eggnogdb 1.0.2에 의해 정의되는, eggnog 패밀리 05CI1 및 05VI0의 그룹으로부터 선택되는 것인 방법..
- 청구항 2 또는 3에 있어서, 상기 포터는 2018년 9월에 공개된 Pfam 32.0에 의해 정의되는, PFAM 목록 PF00083, PF00474, PF00873, PF00893, PF01895, PF01943, PF02690, PF03083, PF04193, PF05977, PF07690, PF07690, PF13347, PF13440 및 PF14667로부터 선택되는 것인 방법.
- 청구항 2 또는 3에 있어서, 상기 P-P-결합-가수분해-유도 수송체는 2018년 9월에 공개된 Pfam 32.0에 의해 정의되는, PFAM 목록 PF00005, PF00532, PF00664, PF01061, PF08352, PF14524, PF13407, PF13416 및 PF17912로부터 선택되는 것인 방법.
- 청구항 2 또는 3에 있어서, 상기 β-배럴 포린은 2018년 9월에 공개된 Pfam 32.0에 의해 정의되는, PFAM 목록 PF02264, PF02563, PF10531 및 PF18412로부터 선택되는 것인 방법.
- 청구항 2 또는 3에 있어서, 상기 보조 수송 단백질은 2018년 9월에 공개된 Pfam 32.0에 의해 정의되는, PFAM 목록 PF13807 및 PF02706으로부터 선택되는 것인 방법.
- 청구항 2 또는 3에 있어서, 상기 추정 수송 단백질은 2018년 9월에 공개된 Pfam 32.0에 의해 정의되는, PFAM 목록 PF01578, PF03932, PF05140 및 PF11045로부터 선택되는 것인 방법.
- 청구항 2 또는 3에 있어서, 상기 포스포트란스퍼-유도 그룹 전위인자는 2018년 9월에 공개된 Pfam 32.0에 의해 정의되는, PFAM 목록 PF00367, PF00358, PF02378, PF03829로부터 선택되는 것인 방법.
- 청구항 2 또는 3에 있어서, 상기 포터는 2019년 7월 4일자로 공개된 InterPro 75.0에 의해 정의되는, interpro 목록 IPR000390, IPR001036, IPR001411, IPR001734, IPR001927, IPR002797, IPR003663, IPR003841, IPR004316, IPR004633, IPR004638, IPR004734, IPR004812, IPR005275, IPR005828, IPR005829, IPR006603, IPR010290, IPR011701, IPR020846, IPR023008, IPR023721, IPR023722, IPR026022, IPR027417, IPR027463, IPR029303, IPR032896, IPR036259, IPR038078, IPR038377, IPR039672로부터 선택되는 것인 방법.
- 청구항 2 또는 3에 있어서, 상기 P-P-결합-가수분해-유도 수송체는 2019년 7월 4일자로 공개된 InterPro 75.0에 의해 정의되는, interpro 목록 IPR000412, IPR001734, IPR001761, IPR003439, IPR003593, IPR005829, IPR005978, IPR005981, IPR006059, IPR006060, IPR006061, IPR008995, IPR011527, IPR011701, IPR013456, IPR013525, IPR013563, IPR015851, IPR015855, IPR017871, IPR019554, IPR020846, IPR025997, IPR026266, IPR027417, IPR028082, IPR029439, IPR033893, IPR036259, IPR036640, IPR038377, IPR039421 및 IPR040582로부터 선택되는 것인 방법.
- 청구항 2 또는 3에 있어서, 상기 β-배럴 포린은 2019년 7월 4일자로 공개된 InterPro 75.0에 의해 정의되는, interpro 목록 IPR003192, IPR003715, IPR019554, IPR023738, IPR036998 및 IPR040716으로부터 선택되는 것인 방법.
- 청구항 2 또는 3에 있어서, 상기 보조 수송 단백질은 2019년 7월 4일자로 공개된 InterPro 75.0에 의해 정의되는, interpro 목록 IPR003856, IPR020846, IPR027417, IPR032807 및 IPR036259로부터 선택되는 것인 방법.
- 청구항 2 또는 3에 있어서, 상기 추정 수송 단백질은 2019년 7월 4일자로 공개된 InterPro 75.0에 의해 정의되는, interpro 목록 IPR002541, IPR003439, IPR003593, IPR004316, IPR005627, IPR006603, IPR007816, IPR017871, IPR020368, IPR020846, IPR023648, IPR027417, IPR036259 및 IPR036822로부터 선택되는 것인 방법.
- 청구항 2 또는 3에 있어서, 상기 포스포트란스퍼-유도 그룹 전위인자는 2019년 7월 4일자로 공개된 InterPro 75.0에 의해 정의되는, interpro 목록 IPR001127, IPR001996, IPR003352, IPR004716, IPR010974, IPR011055, IPR013013, IPR018113, IPR018454, IPR036665 및 IPR036878로부터 선택되는 것인 방법.
- 청구항 2 또는 3에 있어서, 상기 포터 막 단백질은 서열번호: 02의 대장균 (Escherichia coli) K12 MG1655 유래의 MdfA, 서열번호: 06의 대장균 K12 MG1655 유래의 IceT, 서열번호: 40의 B. 론검 아종 인판티스 (B. longum subsp. Infantis) (균주 ATCC 15697) 유래의 Blon_2331, 서열번호: 42의 B. 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2332, 서열번호: 58의 키티노파가 종 CF118, 서열번호: 66의 프레보텔라 루미니콜라 (AR32), 서열번호: 64의 락토코커스 라피노락티스 (ATCC 43920), 또는 서열번호: 62의 디아도박터 솔리 DSM 25329 유래의 wzx-유사 단백질, 또는 상기 포터 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 02, 06, 40, 42, 58, 66, 64 또는 62 각각의 상기 MdfA, IceT, Blon_2331, Blon_2332 막 단백질들 또는 wzx-유사 막 단백질 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 서열로부터 선택되는 것인 것인 방법.
- 청구항 2 또는 3에 있어서, 상기 P-P-결합-가수분해 유도 수송체 막 단백질은 서열번호: 28의 락토코커스 락티스 균주 SRCM103457 유래의 lmrA, 서열번호: 70 또는 74의 스포로무사 스파에로이데스 DSM 2875, 서열번호: 68 또는 72의 플라보박테리움 스파르탄시이 유래의 LpsE 막 단백질, 서열번호: 76의 칸디다투스 플란크토필라 설포니카 유래의 TolC, 서열번호: 82의 페도박터 긴센기솔리 또는 서열번호: 84의 베루코미크로비아 박테리움 CG1_02_43_26 유래의 MsbA, 서열번호: 206의 대장균 K-12 MG1655 유래의 malE, 서열번호: 208의 대장균 K-12 MG1655 유래의 malK, 서열번호: 214의 대장균 K-12 MG1655 유래의 araF, 서열번호: 216의 대장균 K-12 MG1655 유래의 xylF, 또는 서열번호: 218의 대장균 K-12 MG1655 유래의 ytfQ, 또는 상기 P-P-결합-가수분해 유도 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 28, 70, 74, 68, 72, 76, 82, 84, 206, 208, 214, 216, 또는 218 각각의 상기 lmrA, LpsE, TolC, MsbA, malE, malK, araF, xylF 또는 ytfQ 막 단백질 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 서열로부터 선택되는 것인 방법.
- 청구항 2 또는 3에 있어서, 상기 β-배럴 포린은 서열번호: 34의 대장균 K12 MG1655 유래의 Wza 또는 서열번호: 204의 대장균 K12 MG1655 유래의 lamB, 또는 이의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 34 또는 204 각각의 상기 Wza 또는 lamB 막 단백질에 대해 적어도 80%의 서열 동일성을 갖는 서열로부터 선택되는 것인 방법.
- 청구항 2 또는 3에 있어서, 상기 보조 수송 단백질은 서열번호: 88의 서모토가 마리티마 (균주 ATCC 43589 / MSB8 / DSM 3109 / JCM 10099) 유래의 Wzc, 또는 이의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 88의 상기 Wzc 막 단백질에 대해 적어도 80%의 서열 동일성을 갖는 서열로부터 선택되는 것인 방법.
- 청구항 2 또는 3에 있어서, 상기 추정 수송 단백질은 서열번호: 90의 클로스트리디움 종 CAG: 1013, 서열번호: 92의 오도리박터 스플란크니쿠스 DSM 20712, 서열번호: 94의 미추아리아 종 PDC51 또는 서열번호: 96의 프레보텔라 인테르메디아 ATCC 25611 (DSM 20706) 유래의 CutC, 또는 상기 CutC 막 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 90, 92, 94 또는 96 각각의 상기 CutC 막 단백질에 대해 적어도 80%의 서열 동일성을 갖는 서열로부터 선택되는 것인 방법.
- 청구항 2 또는 3에 있어서, 상기 포스포트란스퍼-유도 그룹 전위인자는 서열번호: 210의 대장균 K12 MG1655 유래의 nagE, 서열번호: 212의 대장균 K12 MG1655 유래의 srlB, 또는 상기 nagE 또는 srlB 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 210 또는 212 각각의 상기 nagE 또는 srlB 막 단백질 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 서열로부터 선택되는 것인 방법.
- 청구항 2 또는 3에 있어서, 상기 포터 막 단백질은 서열번호: 02의 대장균 K12 MG1655 유래의 MdfA, 서열번호: 06의 대장균 K12 MG1655 유래의 IceT, 서열번호: 04의 대장균 K12 MG1655 유래의 YnfM, 서열번호: 08의 대장균 K12 MG1655 유래의 Yhhs, 서열번호: 10의 대장균 K12 MG1655 유래의 EmrD, 서열번호: 12의 대장균 K12 MG1655 유래의 YdhC, 서열번호: 14의 대장균 K12 MG1655 유래의 YbdA, 서열번호: 16의 대장균 K12 MG1655 유래의 YdeE, 서열번호: 18의 대장균 K12 MG1655 유래의 MhpT, 서열번호: 20의 대장균 K12 MG1655 유래의 YebQ, 서열번호: 22의 대장균 K12 MG1655 유래의 YjhB, 서열번호: 24의 대장균 K12 MG1655 유래의 Bcr, 서열번호: 26의 대장균 K12 MG1655 유래의 FucP, 서열번호: 32의 대장균 K12 MG1655 유래의 WzxE, 서열번호: 38의 대장균 K12 MG1655 유래의 EmrE, 서열번호: 40의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2331, 서열번호: 42의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2332, 서열번호: 46의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0247, 서열번호: 48의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0245, 서열번호: 50의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0345, 서열번호: 52의 뉴로스포라 크라사 OR74A 유래의 CDT2, 서열번호: 54의 아스페르길루스 오리제 RIB40 유래의 CDT2, 서열번호: 58의 키티노파가 종 CF118 유래의 Wzx, 서열번호: 60의 유박테리움 종 CAG:581 유래의 Wzx, 서열번호: 62의 디아도박터 솔리 (DSM 25329) 유래의 Wzx, 서열번호: 64의 락토코커스 라피노락티스 (ATCC 43920) 유래의 Wzx, 서열번호: 66의 프레보텔라 루미니콜라 (AR32) 유래의 Wzx, 서열번호: 86의 브라키스피라 함프소니이 P280/1 유래의 NAPO, 서열번호: 98의 악티노바쿨룸 수이스 (DSM 20639) 유래의 NAm, 서열번호: 100의 루미노코커스 그나부스 유래의 NAm, 서열번호: 102의 쿠르토박테리움 종 314Chir4.1 유래의 NAm, 서열번호: 104의 니아벨라 드릴라시스 (DSM25811) 유래의 Nap, 서열번호: 106의 사카리크리니스 퍼멘탄스 (DSM 9555) 유래의 Nap, 서열번호: 108의 시트로박터 프레운디이 MGH152 유래의 mdtD, 서열번호: 110의 시트로박터 웨르크마니이 NBRC 105721 유래의 mdtD, 서열번호: 112의 시트로박터 아말로나티쿠스 유래의 mdtD, 서열번호: 114의 클레브시엘라 옥시토카 유래의 mdtD, 서열번호: 116의 에스케리치아 알베르티이 B156 유래의 mdtD, 서열번호: 118의 살모넬라 엔테리카 아종 살라메 유래의 yegB, 서열번호: 120의 클레브시엘라 뉴모니에 30684/NJST258_2 유래의 mdtD, 서열번호: 122의 클레브시엘라 뉴모니에 유래의 Tcr_1_D38215, 서열번호: 124의 슈도시트로박터 페칼리스 유래의 mdtD, 서열번호: 126의 요케넬라 레겐스버게이 (ATCC43003) 유래의 Cmr, 서열번호: 128의 크로노박터 무이트젠시이 유래의 MdfA, 서열번호: 130의 클레브시엘라 옥시토카 유래의 MdfA, 서열번호: 132의 시트로박터 코세리 유래의 MFS, 서열번호: 134의 에스케리치아 마르모테 유래의 MdfA, 서열번호: 136의 시겔라 플렉스네리 유래의 Cmr, 서열번호: 138의 살모넬라 엔테리카 아종 살라메 유래의 MdfA, 서열번호: 140의 시트로박터 윤게 (ATCC 29220) 유래의 Cmr, 서열번호: 142의 시트로박터 프레운디이 유래의 MdfA, 서열번호: 144의 엔테로박터 코베이 유래의 MdfA, 서열번호: 146의 엔테로박터 종 유래의 MdfA, 서열번호: 148의 렐리오티아 종 WB101 유래의 MdfA, 서열번호: 150의 엔테로박터 루드위기이 EcWSU1 유래의 MdfA, 서열번호: 152의 악티노플라네스 우타헨시스 유래의 Sweet-유사 단백질, 서열번호: 154의 키티노파가세에 박테리움 PMG_246 유래의 Sweet-유사 단백질, 서열번호: 156의 리조비움 종 PDC82 유래의 Sweet-유사 단백질, 서열번호: 158의 키네오코커스 리조스파에레 (DSM 19711) 유래의 Sweet-유사 단백질, 서열번호: 160의 모르가넬라 모르가니이 IS15 유래의 Sweet-유사 단백질, 서열번호: 162의 게오데르마토필루스 오브스쿠러스 (균주 ATCC 25078) 유래의 Sweet-유사 단백질, 서열번호: 164의 브라디리조비움 종 BTAi1 유래의 Sweet-유사 단백질, 서열번호: 166의 브라디리조비움 자포니쿰 USDA 110 유래의 Sweet-유사 단백질, 서열번호: 168의 크산토모나스 캄페스트리스 pv. 베시카토리아 균주 85-10 유래의 Sweet-유사 단백질, 서열번호: 170의 헤르바스피릴룸 아쿠아티쿰 유래의 Sweet-유사 단백질, 서열번호: 172의 플라보박테리아 박테리움 MS024-2A 유래의 Sweet-유사 단백질, 서열번호: 182의 시노리조비움 메디케 WSM419 유래의 rnd-유사 단백질, 서열번호: 184의 아조스피릴룸 브라실리엔세 LMG 04375 유래의 아라비노스 유출물, 또는 상기 포터 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 02, 06, 04, 08, 10, 12, 14, 16, 18, 20, 22, 24, 26, 32, 38, 40, 42, 46, 48, 50, 52, 54, 58, 60, 62, 64, 66, 86, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164, 166, 168, 170, 172, 182 또는 184 각각의 상기 MdfA, IceT, YnfM, Yhhs, EmrD, YdhC, YbdA, YdeE, MhpT, YebQ, YjhB, Bcr, FucP, WzxE, EmrE, Wzx, Blon_2331, Blon_2232, Blon_0247, Blon_0245, Blon_0345, NAPO, NAm, Nap, mdtD, YegB, Tcr_1_D38215, cmr, MFS, CDT2, rnd, Sweet-유사 또는 아라비노스 유출물 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질로부터 선택되는 것인 방법.
- 청구항 2 또는 3에 있어서, 상기 P-P-결합-가수분해-유도 수송체는 서열번호: 28의 락토코커스 락티스 균주 SRCM103457 유래의 LmrA, 서열번호: 30의 대장균 균주 K12 MG1655 유래의 OppF, 서열번호: 36의 헬리코박터 필로리 (균주 ATCC 700392 / 26695) 유래의 Wzk, 서열번호: 44의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2475, 서열번호: 68 또는 72의 플라보박테리움 스파르탄시이 유래의 LpsE, 서열번호: 70 또는 74의 스포로무사 스파에로이데스 DSM 2875 유래의 LpsE, 서열번호: 76의 칸디다투스 플란크토필라 설포니카 유래의 TolC, 서열번호: 78의 부티리비브리오 훈가테이 XBD2006 유래의 TolC, 서열번호: 80의 로세부리아 인테스티날리스 CAG:13 유래의 MsbA, 서열번호: 82의 페도박터 긴센기솔리 유래의 MsbA, 서열번호: 84의 베루코미크로비아 박테리움 CG1_02_43_26 유래의 MsbA, 서열번호: 174의 리조비움 종 Root149 유래의 Wzm, 서열번호: 176의 아조스피릴룸 브라실리엔세 LMG 04375 유래의 Wzm, 서열번호: 196의 대장균 113303 유래의 Wzm, 서열번호: 178의 리조비움 종 Root149 유래의 Wzt, 서열번호: 180의 아조스피릴룸 브라실리엔세 LMG 04375 유래의 Wzt, 서열번호: 194의 대장균 113303 유래의 Wzt, 서열번호: 188 또는 190의 브라디리조비움 자포니쿰 USDA 110 유래의 Nodj, 서열번호: 206의 대장균 K-12 MG1655 유래의 malE, 서열번호: 208의 대장균 K-12 MG1655 유래의 malK, 서열번호: 214의 대장균 K-12 MG1655 유래의 araF, 서열번호: 216의 대장균 K-12 MG1655 유래의 xylF, 또는 서열번호: 218의 대장균 K-12 MG1655 유래의 ytfQ, 또는 상기 P-P-결합-가수분해-유도 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 28, 30, 36, 44, 68, 72, 70, 74, 76, 78, 80, 82, 84, 174, 176, 196, 178, 180, 194, 188, 190, 206, 208, 214, 216 또는 218 각각의 상기 LmrA, OppF, Wzk, Blon_2475, LpsE, TolC, MsbA, Wzm, Wzt, Nodj, malE, malK, araF, xylF 또는 ytfQ 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질로부터 선택되는 것인 방법.
- 청구항 2 또는 3에 있어서, 상기 추정 수송 단백질은 서열번호: 56의 헬리코박터 필로리 유래의 사이토크롬 C 생합성 단백질, 서열번호: 90의 클로스트리디움 종 CAG: 1013 유래의 CutC, 서열번호: 92의 오도리박터 스플란크니쿠스 DSM 20712 유래의 CutC, 서열번호: 94의 미추아리아 종 PDC51 유래의 CutC, 서열번호: 96의 프레보텔라 인테르메디아 ATCC 25611 (DSM 20706) 유래의 CutC, 서열번호: 190의 대장균 K12 MG1655 유래의 ybjM, 서열번호: 192의 엔테로박테리아세에 박테리움 ENNIH1 유래의 ybjM, 또는 상기 추정 수송 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 56, 90, 92, 94, 96, 190 또는 192 각각의 상기 CytC, CutC 또는 ybjM 막 단백질 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질로부터 선택되는 것인 방법.
- 유전자 변형 세포에 의해 푸코실락토스를 제조하는 방법으로서,
푸코실락토스를 생성할 수 있는 세포를 제공하는 단계로서, 상기 세포는 GDP-푸코스 공여체로부터의 푸코스 잔기를 락토스 수용체에 전달하여 푸코실락토스를 합성하는 푸코실트란스퍼라제를 코딩하는 핵산 서열을 적어도 1개 포함하고,
상기 세포는 i) 푸코실락토스 수송을 가능하게 하고/하거나 이를 향상시키는 내인성 막 단백질의 변형된 발현, 및/또는 ii) 푸코실락토스 수송을 가능하게 하고/하거나 이를 향상시키는 이종 막 단백질의 발현을 추가로 포함하고, 상기 막 단백질은 포터 막 단백질인 서열번호: 02의 대장균 K12 MG1655 유래의 MdfA, 서열번호: 06의 대장균 K12 MG1655 유래의 IceT, 서열번호: 04의 대장균 K12 MG1655 유래의 YnfM, 서열번호: 08의 대장균 K12 MG1655 유래의 Yhhs, 서열번호: 10의 대장균 K12 MG1655 유래의 EmrD, 서열번호: 12의 대장균 K12 MG1655 유래의 YdhC, 서열번호: 14의 대장균 K12 MG1655 유래의 YbdA, 서열번호: 16의 대장균 K12 MG1655 유래의 YdeE, 서열번호: 18의 대장균 K12 MG1655 유래의 MhpT, 서열번호: 20의 대장균 K12 MG1655 유래의 YebQ, 서열번호: 22의 대장균 K12 MG1655 유래의 YjhB, 서열번호: 24의 대장균 K12 MG1655 유래의 Bcr, 서열번호: 26의 대장균 K12 MG1655 유래의 FucP, 서열번호: 32의 대장균 K12 MG1655 유래의 WzxE, 서열번호: 38의 대장균 K12 MG1655 유래의 EmrE, 서열번호: 40의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2331, 서열번호: 42의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2332, 서열번호: 46의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0247, 서열번호: 48의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0245, 서열번호: 50의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0345, 서열번호: 52의 뉴로스포라 크라사 OR74A 유래의 CDT2, 서열번호: 54의 아스페르길루스 오리제 RIB40 유래의 CDT2, 서열번호: 58의 키티노파가 종 CF118 유래의 Wzx, 서열번호: 60의 유박테리움 종 CAG:581 유래의 Wzx, 서열번호: 62의 디아도박터 솔리 (DSM 25329) 유래의 Wzx, 서열번호: 64의 락토코커스 라피노락티스 (ATCC 43920) 유래의 Wzx, 서열번호: 66의 프레보텔라 루미니콜라 (AR32) 유래의 Wzx, 서열번호: 86의 브라키스피라 함프소니이 P280/1 유래의 NAPO, 서열번호: 98의 악티노바쿨룸 수이스 (DSM 20639) 유래의 NAm, 서열번호: 100의 루미노코커스 그나부스 유래의 NAm, 서열번호: 102의 쿠르토박테리움 종 314Chir4.1 유래의 NAm, 서열번호: 104의 니아벨라 드릴라시스 (DSM25811) 유래의 Nap, 서열번호: 106의 사카리크리니스 퍼멘탄스 (DSM 9555) 유래의 Nap, 서열번호: 108의 시트로박터 프레운디이 MGH152 유래의 mdtD, 서열번호: 110의 시트로박터 웨르크마니이 NBRC 105721 유래의 mdtD, 서열번호: 112의 시트로박터 아말로나티쿠스 유래의 mdtD, 서열번호: 114의 클레브시엘라 옥시토카 유래의 mdtD, 서열번호: 116의 에스케리치아 알베르티이 B156 유래의 mdtD, 서열번호: 118의 살모넬라 엔테리카 아종 살라메 유래의 yegB, 서열번호: 120의 클레브시엘라 뉴모니에 30684/NJST258_2 유래의 mdtD, 서열번호: 122의 클레브시엘라 뉴모니에 유래의 Tcr_1_D38215, 서열번호: 124의 슈도시트로박터 페칼리스 유래의 mdtD, 서열번호: 126의 요케넬라 레겐스버게이 (ATCC43003) 유래의 Cmr, 서열번호: 128의 크로노박터 무이트젠시이 유래의 MdfA, 서열번호: 130의 클레브시엘라 옥시토카 유래의 MdfA, 서열번호: 132의 시트로박터 코세리 유래의 MFS, 서열번호: 134의 에스케리치아 마르모테 유래의 MdfA, 서열번호: 136의 시겔라 플렉스네리 유래의 Cmr, 서열번호: 138의 살모넬라 엔테리카 아종 살라메 유래의 MdfA, 서열번호: 140의 시트로박터 윤게 (ATCC 29220) 유래의 Cmr, 서열번호: 142의 시트로박터 프레운디이 유래의 MdfA, 서열번호: 144의 엔테로박터 코베이 유래의 MdfA, 서열번호: 146의 엔테로박터 종 유래의 MdfA, 서열번호: 148의 렐리오티아 종 WB101 유래의 MdfA, 서열번호: 150의 엔테로박터 루드위기이 EcWSU1 유래의 MdfA, 서열번호: 152의 악티노플라네스 우타헨시스 유래의 Sweet-유사 단백질, 서열번호: 154의 키티노파가세에 박테리움 PMG_246 유래의 Sweet-유사 단백질, 서열번호: 156의 리조비움 종 PDC82 유래의 Sweet-유사 단백질, 서열번호: 158의 키네오코커스 리조스파에레 (DSM 19711) 유래의 Sweet-유사 단백질, 서열번호: 160의 모르가넬라 모르가니이 IS15 유래의 Sweet-유사 단백질, 서열번호: 162의 게오데르마토필루스 오브스쿠러스 (균주 ATCC 25078) 유래의 Sweet-유사 단백질, 서열번호: 164의 브라디리조비움 종 BTAi1 유래의 Sweet-유사 단백질, 서열번호: 166의 브라디리조비움 자포니쿰 USDA 110 유래의 Sweet-유사 단백질, 서열번호: 168의 크산토모나스 캄페스트리스 pv. 베시카토리아 균주 85-10 유래의 Sweet-유사 단백질, 서열번호: 170의 헤르바스피릴룸 아쿠아티쿰 유래의 Sweet-유사 단백질, 서열번호: 172의 플라보박테리아 박테리움 MS024-2A 유래의 Sweet-유사 단백질, 서열번호: 182의 시노리조비움 메디케 WSM419 유래의 rnd-유사 단백질, 서열번호: 184의 아조스피릴룸 브라실리엔세 LMG 04375 유래의 아라비노스 유출물, 또는 상기 포터 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 02, 06, 04, 08, 10, 12, 14, 16, 18, 20, 22, 24, 26, 32, 38, 40, 42, 46, 48, 50, 52, 54, 58, 60, 62, 64, 66, 86, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164, 166, 168, 170, 172, 182 또는 184 각각의 상기 MdfA, IceT, YnfM, Yhhs, EmrD, YdhC, YbdA, YdeE, MhpT, YebQ, YjhB, Bcr, FucP, WzxE, EmrE, Wzx, Blon_2331, Blon_2232, Blon_0247, Blon_0245, Blon_0345, NAPO, NAm, Nap, mdtD, YegB, Tcr_1_D38215, cmr, MFS, CDT2, rnd, Sweet-유사 또는 아라비노스 유출물 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질; 및 P-P-결합-가수분해-유도 수송체인 서열번호: 28의 락토코커스 락티스 균주 SRCM103457 유래의 LmrA, 서열번호: 30의 대장균 균주 K12 MG1655 유래의 OppF, 서열번호: 36의 헬리코박터 필로리 (균주 ATCC 700392 / 26695) 유래의 Wzk, 서열번호: 44의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2475, 서열번호: 68 또는 72의 플라보박테리움 스파르탄시이 유래의 LpsE, 서열번호: 70 또는 74의 스포로무사 스파에로이데스 DSM 2875 유래의 LpsE, 서열번호: 76의 칸디다투스 플란크토필라 설포니카 유래의 TolC, 서열번호: 78의 부티리비브리오 훈가테이 XBD2006 유래의 TolC, 서열번호: 80의 로세부리아 인테스티날리스 CAG:13 유래의 MsbA, 서열번호: 82의 페도박터 긴센기솔리 유래의 MsbA, 서열번호: 84의 베루코미크로비아 박테리움 CG1_02_43_26 유래의 MsbA, 서열번호: 174의 리조비움 종 Root149 유래의 Wzm, 서열번호: 176의 아조스피릴룸 브라실리엔세 LMG 04375 유래의 Wzm, 서열번호: 196의 대장균 113303 유래의 Wzm, 서열번호: 178의 리조비움 종 Root149 유래의 Wzt, 서열번호: 180의 아조스피릴룸 브라실리엔세 LMG 04375 유래의 Wzt, 서열번호: 194의 대장균 113303 유래의 Wzt, 서열번호: 188 또는 190의 브라디리조비움 자포니쿰 USDA 110 유래의 Nodj, 서열번호: 206의 대장균 K-12 MG1655 유래의 malE, 서열번호: 208의 대장균 K-12 MG1655 유래의 malK, 서열번호: 214의 대장균 K-12 MG1655 유래의 araF, 서열번호: 216의 대장균 K-12 MG1655 유래의 xylF, 또는 서열번호: 218의 대장균 K-12 MG1655 유래의 ytfQ, 또는 상기 P-P-결합-가수분해-유도 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 28, 30, 36, 44, 68, 72, 70, 74, 76, 78, 80, 82, 84, 174, 176, 196, 178, 180, 194, 188, 190, 206, 208, 214, 216, 또는 218 각각의 상기 LmrA, OppF, Wzk, Blon_2475, LpsE, TolC, MsbA, Wzm, Wzt, Nodj, malE, malK, araF, xylF 또는 ytfQ 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질; 및 β-배럴 포린 막 단백질인 서열번호: 34의 대장균 K12 MG1655 유래의 Wza 또는 서열번호: 204의 대장균 K12 MG1655 유래의 lamB, 또는 상기 Wza 또는 lamB 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 34 또는 204 각각의 상기 Wza 또는 lamB 막 단백질 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 서열; 및 보조 수송 단백질인 서열번호: 88의 서모토가 마리티마 (균주 ATCC 43589 / MSB8 / DSM 3109 / JCM 10099) 유래의 Wzc, 또는 이의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 88의 상기 Wzc 막 단백질에 대해 적어도 80%의 서열 동일성을 갖는 서열; 및 추정 수송 단백질인 서열번호: 56의 헬리코박터 필로리 유래의 사이토크롬 C 생합성 단백질, 서열번호: 90의 클로스트리디움 종 CAG: 1013 유래의 CutC, 서열번호: 92의 오도리박터 스플란크니쿠스 DSM 20712 유래의 CutC, 서열번호: 94의 미추아리아 종 PDC51 유래의 CutC, 서열번호: 96의 프레보텔라 인테르메디아 ATCC 25611 (DSM 20706) 유래의 CutC, 서열번호: 190의 대장균 K12 MG1655 유래의 ybjM, 서열번호: 192의 엔테로박테리아세에 박테리움 ENNIH1 유래의 ybjM, 또는 상기 추정 수송 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 56, 90, 92, 94, 96, 190 또는 192 각각의 상기 CytC, CutC 또는 ybjM 막 단백질 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질; 및 포스포트란스퍼-유도 그룹 전위인자인 서열번호: 210의 대장균 K12 MG1655 유래의 nagE, 서열번호: 212의 대장균 K12 MG1655 유래의 srlB, 또는 상기 nagE 또는 srlB 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 210 또는 212 각각의 상기 nagE 또는 srlB 막 단백질 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 서열로 구성된 막 단백질들의 그룹으로부터 선택되는 단계를 포함하는 것인 방법. - 청구항 1 내지 37 중 어느 한 항에 있어서, 상기 막 단백질은 세포벽의 외막을 가로질러 화합물의 수송에 관여하는 수송체 단백질인 것인 푸코실락토스를 제조하는 방법.
- 청구항 1 내지 38 중 어느 한 항에 있어서, 상기 방법은 하기 단계들 중 적어도 하나를 추가로 포함하고:
i) 상기 배양 배지에, 초기 반응기 부피 1 리터 (litre)당 락토스를 적어도 50, 더 바람직하게는 적어도 75, 더 바람직하게는 적어도 100, 더 바람직하게는 적어도 120, 더 바람직하게는 적어도 150 그람 (gram)을 포함하는 락토스 공급물을, 바람직하게는 연속 방식 (continuous manner)으로, 바람직하게는 상기 배양 배지의 최종 부피가 상기 락토스 공급물의 부가 전 배양 배지 부피의 3배 이하, 바람직하게는 2배 이하, 더 바람직하게는 2배 미만이 되도록 부가하는 단계;
ii) 락토스 공급물을 연속 방식으로 상기 배양 배지에 1일, 2일, 3일, 4일, 5일에 걸쳐 공급 용액에 의해 부가하는 단계;
iii) 락토스 공급물을 연속 방식으로 배양 배지에 1일, 2일, 3일, 4일, 5일에 걸쳐 공급 용액에 의해 부가하는 단계로서, 상기 락토스 공급 용액의 농도는 50 g/L, 바람직하게는 75 g/L, 더 바람직하게는 100 g/L, 더 바람직하게는 125 g/L, 더 바람직하게는 150 g/L, 더 바람직하게는 175 g/L, 더 바람직하게는 200 g/L, 더 바람직하게는 225 g/L, 더 바람직하게는 250 g/L, 더 바람직하게는 275 g/L, 더 바람직하게는 300 g/L, 더 바람직하게는 325 g/L, 더 바람직하게는 350 g/L, 더 바람직하게는 375 g/L, 더 바람직하게는 400 g/L, 더 바람직하게는 450 g/L, 더 바람직하게는 500 g/L, 더욱 바람직하게는 550 g/L, 가장 바람직하게는 600 g/L이며; 바람직하게는 상기 용액의 pH는 3 내지 7로 설정되고, 바람직하게는 상기 공급 용액의 온도는 20℃ 내지 80℃로 유지되는 것인 단계;
상기 방법으로 상기 배양 배지의 최종 부피 중에 적어도 50 g/L, 바람직하게는 적어도 75 g/L, 더 바람직하게는 적어도 90 g/L, 더 바람직하게는 적어도 100 g/L, 더 바람직하게는 적어도 125 g/L, 더 바람직하게는 적어도 150 g/L, 더 바람직하게는 적어도 175 g/L, 더 바람직하게는 적어도 200 g/L의 푸코실락토스 농도를 유도하는 것인 푸코실락토스를 제조하는 방법. - 청구항 39에 있어서, 상기 락토스 공급은 배양 초기부터 락토스를 적어도 5 mM의 농도, 바람직하게는 30, 40, 50, 60, 70, 80, 90, 100, 150 mM의 농도, 더 바람직하게는 > 300 mM의 농도로 부가함으로써 달성되는 것인 방법.
- 청구항 39 또는 40에 있어서, 상기 락토스 공급은 배양의 생산 단계 (production phase) 전반에 걸쳐 적어도 5 mM, 바람직하게는 10 mM 또는 30 mM의 락토스 농도가 수득되도록 하는 농도로 락토스를 상기 배양 배지에 부가함으로써 달성되는 것인 방법.
- 청구항 39, 40 또는 41 중 어느 항에 있어서, 상기 숙주 세포는 적어도 약 60, 80, 100, 또는 약 120시간 동안, 또는 연속 방식으로 배양되는 것인 방법.
- 청구항 39 내지 42 중 어느 한 항에 있어서, 탄소 및 에너지 공급원, 바람직하게는 수크로스, 글루코스, 프럭토스, 글리세롤, 말토스, 말토덱스트린, 트레할로스, 폴리올, 전분, 숙시네이트, 말레이트, 피루베이트, 락테이트, 에탄올, 시트레이트, 락토스가 또한 부가되고, 바람직하게는 연속적으로, 바람직하게는 락토스와 함께 상기 배양 배지에 부가되는 것인 방법.
- 청구항 39 내지 43 중 어느 한 항에 있어서, 탄소계 기질, 바람직하게는 글루코스 또는 수크로스를 상기 배양 배지에 부가함으로써 제1 지수적 세포 성장 단계가 제공되고, 그 후에 제2 단계에서 락토스가 상기 배양 배지에 부가되는 것인 방법.
- 청구항 1 내지 44 중 어느 한 항에 있어서, 상기 방법이 푸코실락토스의 혼합물을 생성하는 것인 방법.
- 청구항 1 내지 45 중 어느 한 항에 있어서, 상기 푸코실락토스는 2'-푸코실락토스, 3-푸코실락토스 및/또는 디푸코실락토스인 것인 방법.
- 청구항 1 내지 46 중 어느 한 항에 있어서, 상기 유전자 변형 세포는 미생물, 식물 또는 동물 세포로 구성된 그룹으로부터 선택되고, 바람직하게는 상기 미생물은 박테리아, 진균 또는 효모이며, 바람직하게는 상기 식물은 벼, 목화, 유채, 대두, 옥수수 (maize) 또는 옥수수 식물 (corn plant)이고, 바람직하게는 상기 동물은 곤충, 어류, 조류 또는 비-인간 포유동물인 것인 방법.
- 청구항 47에 있어서, 상기 세포는 대장균 세포인 것인 방법.
- 푸코실락토스 생성을 위해 유전자 변형된 숙주 세포로서, 상기 숙주 세포는 GDP-푸코스 공여체로부터의 푸코스 잔기를 락토스 수용체에 전달하여 푸코실락토스를 합성하는 푸코실트란스퍼라제를 코딩하는 핵산 서열을 적어도 1개 포함하고, - 상기 세포는 i) 푸코실락토스 수송을 가능하게 하고/하거나 이를 향상시킬 수 있는 내인성 막 단백질의 변형된 발현, 및/또는 ii) 푸코실락토스 수송을 가능하게 하고/하거나 이를 향상시킬 수 있는 이종 막 단백질의 발현을 추가로 포함하고, 상기 막 단백질은 i) 2019년 7월 4일자로 공개된 InterPro 75.0에 정의되는, interpro 번호 IPR001503 및 IPR002516을 각각 사용하여 GT10 및 GT11 푸코실트란스퍼라제 패밀리의 게놈 인근을 검색하여 발견된 PFAM 도메인들 중 어느 하나의 도메인을 포함하는 막 단백질들의 그룹으로부터 선택되며, 여기서 상기 게놈 인근 윈도우 크기는 각 푸코실트란스퍼라제 앞에 14개의 유전자 및 뒤에 14개의 유전자이고, 상기 막 단백질은 SET 패밀리에 속하지 않으며, 또는 ii) 서열번호: 204, 206, 208, 210, 212, 214, 216, 218을 포함하는 막 단백질들, 또는 서열번호: 204, 206, 208, 210, 212, 214, 216, 218을 포함하는 막 단백질들 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 204, 206, 208, 210, 212, 214, 216, 218의 상기 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 서열의 그룹으로부터 선택되는 것인 푸코실락토스 생성을 위해 유전자 변형된 숙주 세포.
- 청구항 49에 있어서, 상기 막 단백질은
a) 포터;
b) P-P-결합-가수분해-유도 수송체;
c) β-배럴 포린;
d) 보조 수송 단백질;
e) 추정 수송 단백질; 및
f) 포스포트란스퍼-유도 그룹 전위인자의 그룹으로부터 선택되는 것인 숙주 세포. - 푸코실락토스 생성을 위해 유전자 변형된 숙주 세포로서, 상기 숙주 세포는 GDP-푸코스 공여체로부터의 푸코스 잔기를 락토스 수용체에 전달하여 푸코실락토스를 합성하는 푸코실트란스퍼라제를 코딩하는 핵산 서열을 적어도 1개 포함하고,
- 상기 세포는 i) 푸코실락토스 수송을 가능하게 하고/하거나 이를 향상시킬 수 있는 내인성 막 단백질의 변형된 발현, 및/또는 ii) 푸코실락토스 수송을 가능하게 하고/하거나 이를 향상시킬 수 있는 이종 막 단백질의 발현을 추가로 포함하고, 상기 막 단백질은
a) 포터, 여기서 상기 막 단백질은 SET 패밀리에 속하지 않음;
b) P-P-결합-가수분해-유도 수송체;
c) β-배럴 포린;
d) 보조 수송 단백질;
e) 추정 수송 단백질; 및
f) 포스포트란스퍼-유도 그룹 전위인자의 그룹으로부터 선택되는 것인 푸코실락토스 생성을 위해 유전자 변형된 숙주 세포. - 청구항 50 또는 51에 있어서, 상기 막 단백질은 청구항 4 내지 38 중 어느 한 항에 정의된 막 단백질들의 그룹으로부터 선택되는 것인 숙주 세포.
- 청구항 50 또는 51에 있어서, 상기 포터 막 단백질은 서열번호: 02의 대장균 K12 MG1655 유래의 MdfA, 서열번호: 06의 대장균 K12 MG1655 유래의 IceT, 서열번호: 04의 대장균 K12 MG1655 유래의 YnfM, 서열번호: 08의 대장균 K12 MG1655 유래의 Yhhs, 서열번호: 10의 대장균 K12 MG1655 유래의 EmrD, 서열번호: 12의 대장균 K12 MG1655 유래의 YdhC, 서열번호: 14의 대장균 K12 MG1655 유래의 YbdA, 서열번호: 16의 대장균 K12 MG1655 유래의 YdeE, 서열번호: 18의 대장균 K12 MG1655 유래의 MhpT, 서열번호: 20의 대장균 K12 MG1655 유래의 YebQ, 서열번호: 22의 대장균 K12 MG1655 유래의 YjhB, 서열번호: 24의 대장균 K12 MG1655 유래의 Bcr, 서열번호: 26의 대장균 K12 MG1655 유래의 FucP, 서열번호: 32의 대장균 K12 MG1655 유래의 WzxE, 서열번호: 38의 대장균 K12 MG1655 유래의 EmrE, 서열번호: 40의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2331, 서열번호: 42의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2332, 서열번호: 46의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0247, 서열번호: 48의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0245, 서열번호: 50의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_0345, 서열번호: 52의 뉴로스포라 크라사 OR74A 유래의 CDT2, 서열번호: 54의 아스페르길루스 오리제 RIB40 유래의 CDT2, 서열번호: 58의 키티노파가 종 CF118 유래의 Wzx, 서열번호: 60의 유박테리움 종 CAG:581 유래의 Wzx, 서열번호: 62의 디아도박터 솔리 (DSM 25329) 유래의 Wzx, 서열번호: 64의 락토코커스 라피노락티스 (ATCC 43920) 유래의 Wzx, 서열번호: 66의 프레보텔라 루미니콜라 (AR32) 유래의 Wzx, 서열번호: 86의 브라키스피라 함프소니이 P280/1 유래의 NAPO, 서열번호: 98의 악티노바쿨룸 수이스 (DSM 20639) 유래의 NAm, 서열번호: 100의 루미노코커스 그나부스 유래의 NAm, 서열번호: 102의 쿠르토박테리움 종 314Chir4.1 유래의 NAm, 서열번호: 104의 니아벨라 드릴라시스 (DSM25811) 유래의 Nap, 서열번호: 106의 사카리크리니스 퍼멘탄스 (DSM 9555) 유래의 Nap, 서열번호: 108의 시트로박터 프레운디이 MGH152 유래의 mdtD, 서열번호: 110의 시트로박터 웨르크마니이 NBRC 105721 유래의 mdtD, 서열번호: 112의 시트로박터 아말로나티쿠스 유래의 mdtD, 서열번호: 114의 클레브시엘라 옥시토카 유래의 mdtD, 서열번호: 116의 에스케리치아 알베르티이 B156 유래의 mdtD, 서열번호: 118의 살모넬라 엔테리카 아종 살라메 유래의 yegB, 서열번호: 120의 클레브시엘라 뉴모니에 30684/NJST258_2 유래의 mdtD, 서열번호: 122의 클레브시엘라 뉴모니에 유래의 Tcr_1_D38215, 서열번호: 124의 슈도시트로박터 페칼리스 유래의 mdtD, 서열번호: 126의 요케넬라 레겐스버게이 (ATCC43003) 유래의 Cmr, 서열번호: 128의 크로노박터 무이트젠시이 유래의 MdfA, 서열번호: 130의 클레브시엘라 옥시토카 유래의 MdfA, 서열번호: 132의 시트로박터 코세리 유래의 MFS, 서열번호: 134의 에스케리치아 마르모테 유래의 MdfA, 서열번호: 136의 시겔라 플렉스네리 유래의 Cmr, 서열번호: 138의 살모넬라 엔테리카 아종 살라메 유래의 MdfA, 서열번호: 140의 시트로박터 윤게 (ATCC 29220) 유래의 Cmr, 서열번호: 142의 시트로박터 프레운디이 유래의 MdfA, 서열번호: 144의 엔테로박터 코베이 유래의 MdfA, 서열번호: 146의 엔테로박터 종 유래의 MdfA, 서열번호: 148의 렐리오티아 종 WB101 유래의 MdfA, 서열번호: 150의 엔테로박터 루드위기이 EcWSU1 유래의 MdfA, 서열번호: 152의 악티노플라네스 우타헨시스 유래의 Sweet-유사 단백질, 서열번호: 154의 키티노파가세에 박테리움 PMG_246 유래의 Sweet-유사 단백질, 서열번호: 156의 리조비움 종 PDC82 유래의 Sweet-유사 단백질, 서열번호: 158의 키네오코커스 리조스파에레 (DSM 19711) 유래의 Sweet-유사 단백질, 서열번호: 160의 모르가넬라 모르가니이 IS15 유래의 Sweet-유사 단백질, 서열번호: 162의 게오데르마토필루스 오브스쿠러스 (균주 ATCC 25078) 유래의 Sweet-유사 단백질, 서열번호: 164의 브라디리조비움 종 BTAi1 유래의 Sweet-유사 단백질, 서열번호: 166의 브라디리조비움 자포니쿰 USDA 110 유래의 Sweet-유사 단백질, 서열번호: 168의 크산토모나스 캄페스트리스 pv. 베시카토리아 균주 85-10 유래의 Sweet-유사 단백질, 서열번호: 170의 헤르바스피릴룸 아쿠아티쿰 유래의 Sweet-유사 단백질, 서열번호: 172의 플라보박테리아 박테리움 MS024-2A 유래의 Sweet-유사 단백질, 서열번호: 182의 시노리조비움 메디케 WSM419 유래의 rnd-유사 단백질, 서열번호: 184의 아조스피릴룸 브라실리엔세 LMG 04375 유래의 아라비노스 유출물, 또는 상기 포터 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 02, 06, 04, 08, 10, 12, 14, 16, 18, 20, 22, 24, 26, 32, 38, 40, 42, 46, 48, 50, 52, 54, 58, 60, 62, 64, 66, 86, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164, 166, 168, 170, 172, 182 또는 184 각각의 상기 MdfA, IceT, YnfM, Yhhs, EmrD, YdhC, YbdA, YdeE, MhpT, YebQ, YjhB, Bcr, FucP, WzxE, EmrE, Wzx, Blon_2331, Blon_2232, Blon_0247, Blon_0245, Blon_0345, NAPO, NAm, Nap, mdtD, YegB, Tcr_1_D38215, cmr, MFS, CDT2, rnd, Sweet-유사 또는 아라비노스 유출물 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질로부터 선택되는 것인 푸코실락토스 생성을 위해 유전자 변형된 숙주 세포.
- 청구항 50 또는 51에 있어서, 상기 P-P-결합-가수분해-유도 수송체는 서열번호: 28의 락토코커스 락티스 균주 SRCM103457 유래의 LmrA, 서열번호: 30의 대장균 균주 K12 MG1655 유래의 OppF, 서열번호: 36의 헬리코박터 필로리 (균주 ATCC 700392 / 26695) 유래의 Wzk, 서열번호: 44의 비피도박테리움 론검 아종 인판티스 (균주 ATCC 15697) 유래의 Blon_2475, 서열번호: 68 또는 72의 플라보박테리움 스파르탄시이 유래의 LpsE, 서열번호: 70 또는 74의 스포로무사 스파에로이데스 DSM 2875 유래의 LpsE, 서열번호: 76의 칸디다투스 플란크토필라 설포니카 유래의 TolC, 서열번호: 78의 부티리비브리오 훈가테이 XBD2006 유래의 TolC, 서열번호: 80의 로세부리아 인테스티날리스 CAG:13 유래의 MsbA, 서열번호: 82의 페도박터 긴센기솔리 유래의 MsbA, 서열번호: 84의 베루코미크로비아 박테리움 CG1_02_43_26 유래의 MsbA, 서열번호: 174의 리조비움 종 Root149 유래의 Wzm, 서열번호: 176의 아조스피릴룸 브라실리엔세 LMG 04375 유래의 Wzm, 서열번호: 196의 대장균 113303 유래의 Wzm, 서열번호: 178의 리조비움 종 Root149 유래의 Wzt, 서열번호: 180의 아조스피릴룸 브라실리엔세 LMG 04375 유래의 Wzt, 서열번호: 194의 대장균 113303 유래의 Wzt, 서열번호: 188 또는 190의 브라디리조비움 자포니쿰 USDA 110 유래의 Nodj, 서열번호: 206의 대장균 K-12 MG1655 유래의 malE, 서열번호: 208의 대장균 K-12 MG1655 유래의 malK, 서열번호: 214의 대장균 K-12 MG1655 유래의 araF, 서열번호: 216의 대장균 K-12 MG1655 유래의 xylF, 또는 서열번호: 218의 대장균 K-12 MG1655 유래의 ytfQ, 또는 상기 P-P-결합-가수분해-유도 수송체 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 28, 30, 36, 44, 68, 72, 70, 74, 76, 78, 80, 82, 84, 174, 176, 196, 178, 180, 194, 188, 190, 206, 208, 214, 216, 또는 218 각각의 상기 LmrA, OppF, Wzk, Blon_2475, LpsE, TolC, MsbA, Wzm, Wzt, Nodj, malE, malK, araF, xylF 또는 ytfQ 막 단백질들 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질로부터 선택되는 것인 숙주 세포.
- 청구항 50 또는 51에 있어서, 상기 추정 수송 단백질은 서열번호: 56의 헬리코박터 필로리 유래의 사이토크롬 C 생합성 단백질, 서열번호: 90의 클로스트리디움 종 CAG: 1013 유래의 CutC, 서열번호: 92의 오도리박터 스플란크니쿠스 DSM 20712 유래의 CutC, 서열번호: 94의 미추아리아 종 PDC51 유래의 CutC, 서열번호: 96의 프레보텔라 인테르메디아 ATCC 25611 (DSM 20706) 유래의 CutC, 서열번호: 190의 대장균 K12 MG1655 유래의 ybjM, 서열번호: 192의 엔테로박테리아세에 박테리움 ENNIH1 유래의 ybjM, 또는 상기 추정 수송 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 56, 90, 92, 94, 96, 190 또는 192 각각의 상기 CytC, CutC 또는 ybjM 막 단백질 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열을 갖는 단백질로부터 선택되는 것인 숙주 세포.
- 청구항 50 또는 51에 있어서, 상기 β-배럴 포린은 서열번호: 34의 대장균 K12 MG1655 유래의 Wza 또는 서열번호: 204의 대장균 K12 MG1655 유래의 lamB, 또는 상기 Wza 또는 lamB 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 34 또는 204 각각의 상기 Wza 또는 lamB 막 단백질 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 서열로부터 선택되는 것인 숙주 세포.
- 청구항 50 또는 51에 있어서, 상기 보조 수송 단백질은 서열번호: 88의 서모토가 마리티마 (균주 ATCC 43589 / MSB8 / DSM 3109 / JCM 10099) 유래의 Wzc, 또는 이의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 88의 상기 Wzc 막 단백질에 대해 적어도 80%의 서열 동일성을 갖는 서열로부터 선택되는 것인 숙주 세포.
- 청구항 50 또는 51에 있어서, 상기 포스포트란스퍼-유도 그룹 전위인자는 서열번호: 210의 대장균 K12 MG1655 유래의 nagE 또는 서열번호: 212의 대장균 K12 MG1655 유래의 srlB, 또는 상기 nagE 또는 srlB 막 단백질 중 어느 하나의 기능성 상동체 또는 기능성 단편, 또는 서열번호: 210 또는 212 각각의 상기 nagE 또는 srlB 막 단백질 중 어느 하나에 대해 적어도 80%의 서열 동일성을 갖는 서열로부터 선택되는 것인 숙주 세포.
- 청구항 49 내지 58 중 어느 한 항에 있어서, 상기 막 단백질은 세포벽의 외막을 가로질러 화합물의 수송에 관여하는 수송체 단백질인 것인 세포.
- 청구항 49 내지 59 중 어느 한 항에 있어서, 상기 세포가 배지에서 안정하게 배양되는 것인 세포.
- 청구항 49 내지 60 중 어느 한 항에 있어서, 상기 세포는 미생물, 식물 또는 동물 세포로 구성된 그룹으로부터 선택되고, 바람직하게는 상기 미생물은 박테리아, 진균 또는 효모이며, 바람직하게는 상기 식물은 벼, 목화, 유채, 대두, 옥수수 또는 옥수수 식물이고, 바람직하게는 상기 동물은 곤충, 어류, 조류 또는 비-인간 포유동물인 것인 세포.
- 청구항 61에 있어서, 상기 세포는 대장균 세포인 것인 숙주 세포.
- 청구항 49 내지 62 중 어느 한 항에 있어서, 상기 세포는 푸코실락토스 합성에 관여하고/하거나 이의 합성에 필요한, 적어도 부분적으로 불활성화된, 모노사카라이드, 디사카라이드 또는 올리고사카라이드인, 선택된 모노사카라이드, 디사카라이드 또는 올리고사카라이드에 대한 이화 경로 (catabolic pathway)를 포함하는 것인 세포.
- 청구항 49 내지 63 중 어느 한 항에 있어서, 상기 푸코실락토스는 2'-푸코실락토스, 3-푸코실락토스 또는 디푸코실락토스인 것인 세포.
- 푸코실락토스를 제조하는 방법으로서,
a) 청구항 49 내지 64 중 어느 한 항에 따른 세포를 제공하는 단계,
b) 상기 푸코실락토스의 생성을 허용하는 조건 하에 배지에서 상기 세포를 배양하는 단계,
c) 상기 푸코실락토스를 배양으로부터 분리하는 단계를 포함하는 것인 방법. - 푸코실락토스의 발효 생성에서 푸코실락토스 수송을 위한, 청구항 1 내지 38 중 어느 한 항에 정의된 막 단백질들의 그룹으로부터 선택된 막 단백질의 용도.
- 푸코실락토스의 제조를 위한, 청구항 49 내지 64 중 어느 한 항에 따른 세포의 용도.
- 청구항 67에 있어서, 상기 푸코실락토스는 2'-푸코실락토스, 3-푸코실락토스 또는 디푸코실락토스인 것인 세포의 용도.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP19187404 | 2019-07-19 | ||
EP19187404.9 | 2019-07-19 | ||
PCT/EP2020/070209 WO2021013708A1 (en) | 2019-07-19 | 2020-07-16 | Production of fucosyllactose in host cells |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220035247A true KR20220035247A (ko) | 2022-03-21 |
Family
ID=67438239
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227005675A KR20220035247A (ko) | 2019-07-19 | 2020-07-16 | 숙주 세포에서 푸코실락토스의 제조 |
Country Status (9)
Country | Link |
---|---|
US (1) | US20220259631A1 (ko) |
EP (1) | EP3999635A1 (ko) |
JP (1) | JP2022541287A (ko) |
KR (1) | KR20220035247A (ko) |
CN (1) | CN114466934A (ko) |
AU (1) | AU2020317557A1 (ko) |
BR (1) | BR112022000394A2 (ko) |
CA (1) | CA3147502A1 (ko) |
WO (1) | WO2021013708A1 (ko) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022168991A1 (ja) * | 2021-02-08 | 2022-08-11 | 協和発酵バイオ株式会社 | フコース含有糖質の輸送活性を有する蛋白質及びフコース含有糖質の製造法 |
WO2023120615A1 (ja) * | 2021-12-21 | 2023-06-29 | 協和発酵バイオ株式会社 | コア3糖としてラクト-n-トリオースiiを含む糖質の製造方法および該糖質の結晶の製造方法 |
WO2024017987A1 (en) * | 2022-07-20 | 2024-01-25 | Inbiose N.V. | Production of oligosaccharides in host cells |
WO2024089131A1 (en) | 2022-10-25 | 2024-05-02 | Inbiose N.V. | Saccharide importers for lacto-n-triose |
CN116179461B (zh) * | 2023-02-16 | 2023-12-15 | 苏州一兮生物技术有限公司 | 一种用于生产gdp-l-岩藻糖的基因工程菌及其应用 |
CN117467594B (zh) * | 2023-12-26 | 2024-04-09 | 态创生物科技(广州)有限公司 | 一种生产2'-岩藻糖基乳糖的基因工程菌及其应用 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2517602C2 (ru) * | 2009-06-08 | 2014-05-27 | Йенневайн Биотехнологи Гмбх | Синтез нмо |
DE202011111144U1 (de) | 2010-07-12 | 2021-02-10 | Inbiose N.V. | Metabolisch veränderte Organismen für die Herstellung von Bioprodukten mit Mehrwert |
CN107189954A (zh) * | 2011-11-30 | 2017-09-22 | 帝斯曼知识产权资产管理有限公司 | 由乙酸和甘油生产乙醇的工程化酵母菌株 |
RU2021109889A (ru) | 2014-11-14 | 2021-05-06 | Инбиос Н.В. | Мутантные микроорганизмы, устойчивые к гибели под действием лактозы |
EP3141610A1 (en) * | 2015-09-12 | 2017-03-15 | Jennewein Biotechnologie GmbH | Production of human milk oligosaccharides in microbial hosts with engineered import / export |
US20190160082A1 (en) * | 2016-08-04 | 2019-05-30 | Nestec S.A. | Nutritional compositions with 2fl and lnnt for use in preventing and/or treating non-rotavirus diarrhea by acting on the gut microbiota dysbiosis |
ES2856749T3 (es) * | 2016-10-29 | 2021-09-28 | Chr Hansen Hmo Gmbh | Proceso para la producción de oligosacáridos fucosilados |
EP3425052A1 (en) * | 2017-07-07 | 2019-01-09 | Jennewein Biotechnologie GmbH | Fucosyltransferases and their use in producing fucosylated oligosaccharides |
EP3784791A1 (en) | 2018-04-23 | 2021-03-03 | DuPont Nutrition Biosciences ApS | Increasing export of 2' fucosyllactose from microbial cells through the expression of a heterologous nucleic acid |
-
2020
- 2020-07-16 JP JP2022503521A patent/JP2022541287A/ja active Pending
- 2020-07-16 WO PCT/EP2020/070209 patent/WO2021013708A1/en unknown
- 2020-07-16 AU AU2020317557A patent/AU2020317557A1/en active Pending
- 2020-07-16 CA CA3147502A patent/CA3147502A1/en active Pending
- 2020-07-16 US US17/627,088 patent/US20220259631A1/en active Pending
- 2020-07-16 KR KR1020227005675A patent/KR20220035247A/ko unknown
- 2020-07-16 BR BR112022000394A patent/BR112022000394A2/pt unknown
- 2020-07-16 EP EP20746119.5A patent/EP3999635A1/en active Pending
- 2020-07-16 CN CN202080051719.1A patent/CN114466934A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
CA3147502A1 (en) | 2021-01-28 |
AU2020317557A1 (en) | 2022-03-10 |
EP3999635A1 (en) | 2022-05-25 |
BR112022000394A2 (pt) | 2022-03-03 |
JP2022541287A (ja) | 2022-09-22 |
CN114466934A (zh) | 2022-05-10 |
WO2021013708A1 (en) | 2021-01-28 |
US20220259631A1 (en) | 2022-08-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20220035247A (ko) | 숙주 세포에서 푸코실락토스의 제조 | |
US20220002773A1 (en) | Production of 3-fucosyllactose and lactose converting alpha-1,3-fucosyltransferase enzymes | |
CN110869508A (zh) | 岩藻糖基转移酶及其在生产岩藻糖基化低聚糖中的用途 | |
CN111133112A (zh) | 唾液酸转移酶及其在生产唾液酸化低聚糖中的用途 | |
US20230212628A1 (en) | Production of Sialylated Oligosaccharide in Host Cells | |
WO2022034073A1 (en) | Production of fucosylated lactose structures by a cell | |
JP2023506287A (ja) | ラクトースを変換するアルファ-1,2-フコシルトランスフェラーゼ酵素 | |
KR20210097723A (ko) | 발효에 의한 1,5-디아미노펜탄의 생산을 위한 조작된 생합성 경로 | |
KR20230134558A (ko) | 숙주 세포에서 코어 구조로서 ln3을 포함하는 올리고당의생산 | |
TW202221129A (zh) | 雙醣及/或寡醣的細胞生產 | |
CN115175994A (zh) | 组氨酸、嘌呤途径代谢物和质粒dna的增强的产生 | |
CN115605589A (zh) | 改进的用于生产类异戊二烯的方法 | |
KR20220080178A (ko) | 숙주 세포에서 바이오산물의 생산 | |
JP2015142549A (ja) | フルクトースが付加された糖質の製造方法 | |
CN111548978B (zh) | 一种产甘露聚糖的枯草芽孢杆菌及其应用 | |
TW202221137A (zh) | 藉由細胞生產岩藻醣化的乳糖結構 | |
CN116635401A (zh) | 具有改进性能的基因修饰的甲基菌 | |
DK202200591A1 (en) | New sialyltransferases for in vivo synthesis of lst-c | |
WO2024044761A2 (en) | β-1,3-GALACTOSYLTRANSFERASES FOR USE IN THE BIOSYNTHESIS OF OLIGOSACCHARIDES |