KR20230104755A - 시알일화 화합물의 인 비보 합성 - Google Patents

시알일화 화합물의 인 비보 합성 Download PDF

Info

Publication number
KR20230104755A
KR20230104755A KR1020237021715A KR20237021715A KR20230104755A KR 20230104755 A KR20230104755 A KR 20230104755A KR 1020237021715 A KR1020237021715 A KR 1020237021715A KR 20237021715 A KR20237021715 A KR 20237021715A KR 20230104755 A KR20230104755 A KR 20230104755A
Authority
KR
South Korea
Prior art keywords
leu
ala
gly
asp
val
Prior art date
Application number
KR1020237021715A
Other languages
English (en)
Inventor
조에리 보프레즈
피터 쿠스몽
에르페 드리스 반
제르 피터스
아넬리스 베르카투른
Original Assignee
인바이오스 엔.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 인바이오스 엔.브이. filed Critical 인바이오스 엔.브이.
Publication of KR20230104755A publication Critical patent/KR20230104755A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1025Acyltransferases (2.3)
    • C12N9/1029Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1085Transferases (2.) transferring alkyl or aryl groups other than methyl groups (2.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1205Phosphotransferases with an alcohol group as acceptor (2.7.1), e.g. protein kinases
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • C12N9/80Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5) acting on amide bonds in linear amides (3.5.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/90Isomerases (5.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/18Preparation of compounds containing saccharide radicals produced by the action of a glycosyl transferase, e.g. alpha-, beta- or gamma-cyclodextrins

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

본 발명은 합성 생물학 및 대사 공학의 기술 분야에 있다. 보다 구체적으로, 본 발명은 대사 조작된 미생물 발효의 기술 분야에 있다. 본 발명은 세포내 생합성 경로를 통해 시알일화 화합물을 합성할 수 있도록 조작된 미생물을 개시하였다. 상기 미생물은 N-아세틸글루코사민-6-포스페이트를 N-아세틸 글루코사민으로 탈인산화하고, 상기 N-아세틸글루코사민을 N-아세틸만노사민으로 전환할 수 있다. 상기 미생물은 또한 N-아세틸만노사민을 N-아세틸-뉴라미네이트로 전환시키는 능력을 갖는다. 더욱이, 본 발명은 선택적으로 외인성 전구물질로, 예컨대 이에 한정되는 것은 아니지만 락토스, 락토N비오스, N-아세틸락토사민 및/또는 아글리콘을 포함하는 배양 배지에서 미생물을 배양하여, 시알일화 화합물의 대규모 인 비보 합성 방법을 제공하며, 상기 미생물은 세포내에서 N-아세틸글루코사민-6-포스페이트를 N-아세틸글루코사민으로 탈인산화하고, N-아세틸글루코사민을 N-아세틸만노사민으로 전환하며, 이를 N-아세틸-뉴라미네이트로 추가로 전환시킨다.

Description

시알일화 화합물의 인 비보 합성{In vivo synthesis of sialylated compounds}
본 발명은 합성 생물학 및 대사 공학의 기술 분야에 있다. 보다 구체적으로, 본 발명은 대사 조작된 미생물 발효의 기술 분야에 있다. 본 발명은 세포내 생합성 경로를 통해 시알일화 화합물을 합성할 수 있도록 조작된 미생물을 개시하였다. 상기 미생물은 N-아세틸글루코사민-6-포스페이트를 N-아세틸 글루코사민으로 탈인산화하고, 상기 N-아세틸글루코사민을 N-아세틸만노사민으로 전환할 수 있다. 상기 미생물은 또한 N-아세틸만노사민을 N-아세틸-뉴라미네이트로 전환시키는 능력을 갖는다. 더욱이, 본 발명은 선택적으로 외인성 전구물질로, 예컨대 이에 한정되는 것은 아니지만 락토스, 락토-N-비오스 (lacto-N-biose), N-아세틸락토사민 및/또는 아글리콘을 포함하는 배양 배지에서 미생물을 배양하여, 시알일화 화합물의 대규모 인 비보 (in vivo) 합성 방법을 제공하며, 상기 미생물은 세포내에서 N-아세틸글루코사민-6-포스페이트를 N-아세틸글루코사민으로 탈인산화하고, N-아세틸글루코사민을 N-아세틸만노사민으로 전환하며, 이를 N-아세틸-뉴라미네이트로 추가로 전환시킨다.
시알일화 화합물, 예컨대 시알산 및 시알일화 올리고사카리드는 최근에 이들의 적용 범위가 광범위하기 때문에 주목을 받았다. 예를 들어, 시알산은 항-바이러스성 전구물질로서 고려되었다. 시알일화 올리고사카리드는 인간 우유의 필수 부분을 형성하고, 접착 방지성 및 면역조절 특성을 부여하며; 그 외에 이들이 뇌 발달에 관여한다고 개시되었다. 일반적으로, 단백질, 지질 또는 아글리콘의 시알일화 (sialylation)는 항암 약물 및 신경계 질환의 치료에서 사용된다.
시알산은 진핵 세포의 세포 표면에서 우세하게 발견되는 산성 당류 (acidic sugar)의 큰 패밀리를 설명하는데 사용되는 일반적인 용어이다. 가장 일반적인 시알산은, 시알산 패밀리의 구성원을 생성하기 위해 여러 변형을 거친 산성 9탄당인 N-아세틸뉴라민산 또는 Neu5Ac이다. 예컨대 WO2008097366의 도 1에서 볼 수 있는 바와 같이, 시알산 패밀리의 다양성은 50개 이상의 알려져 있는 구성원으로 나타낸다. 시알산은 N-아세틸뉴라민산 또는 Neu5Ac로 불리는, 산성 9개 탄소의 모체 화합물로부터 유래되는 세포-표면 탄수화물의 큰 패밀리를 나타낸다. Neu5Ac는 종종 아세틸, 포스페이트, 메틸, 술페이트 및 락틸 기를 가지며, 이는 시알산에 의해 매개되는 바람직한 세포 신호전달 및 세포 접착 이벤트에 필요하다고 기재되어 있다.
시알산 및 시알일화 화합물은 보존된 생합성 경로에서 이들을 생산하는 고등 진핵 생물체에서는 일반적이다. 이러한 경로는 내인성 UDP-N-아세틸글루코사민으로부터 시작하여, UDP-N-아세틸글루코사민 2-에피머라제 (가수분해) (EC 3.2.1.183), N-아실만노사민 키나제 (EC 2.7.1.60), N-아실뉴라미네이트-9-포스페이트 신타제 (EC 2.5.1.57) 및 Neu5Ac-9-P 포스파타제 (EC 3.1.3.29)의 작용을 통해 시알산으로 전환된다. 상기 시알산은 그 후에 활성화되고, 원하는 수용체로 CMP-시알산 신타제 (EC 2.7.7.43), 예컨대 시알일트란스퍼라제를 통해 전달될 수 있다.
다른 진핵 생물체에서 상기 생합성 경로를 발현시키려는 노력이 이루어졌지만, 원핵생물 시스템에서는 보고되지 않았다. 상기 경로는 효모 (피키아 파스토리스 (Pichia pastoris)) 및 식물 (아라비돕시스 탈리아나 (Arabidopsis thaliana))에서 기능적으로 발현되어 시알일화 N-글리칸을 생산하였다. 그러나, 시알일화 올리고사카리드의 대규모 생산은 보고되지 않았다. 원핵생물 시스템에서 진핵생물 유전자의 기능적 과발현은 특정 샤페론 (chaperone)의 결여, 효소 접힘 (enzyme folding) 결함 및 세포기관 소실로 인해 소정의 결과 없이 어려운 과제로 남아 있다. 그 외에 세포 성장에 필요한 세포간 UDP-GlcNAc (UDP-N-아세틸글루코사민)의 고갈 및 경로에 대한 막대한 에너지 요구가 남아있다.
시알일화 화합물의 효소적, 화학적뿐만 아니라 발효적 생산에 기반한 과정이 존재한다. 그러나, 이들 모두는 상당한 단점을 갖는다. 예를 들어, 화학적 합성은 다수의 순차적인 화학적 단계를 필요로 하고, 효소적 합성은 고가의 전구물질을 필요로 하며, 반면에 발효적 공정은 여전히 힘들게 개발 중에 있다. 그럼에도 불구하고, 후자는 산업적 생산 가능성이 가장 높다.
기재된 발효적 생산 과정의 일 타입은 시알산 또는 시알일화 화합물을 천연 생산하는 캄필로박터 제주니 (Campylobacter jejuni)와 같은 원핵생물로부터 기원하는 생합성 경로를 사용한다. 상기 생합성 경로는 세포가 이들의 세포벽에 사용하는 내인성 UDP-N-아세틸글루코사민으로부터 출발한다. 이들은 N-아세틸만노사민 및 N-아세틸뉴라미네이트로 UDP-N-아세틸글루코사민 에피머라제 (일반적으로 neuC라고 함) 및 시알산 신타제 (일반적으로 neuB라고 함)의 작용에 의해 전환된다.
이러한 원핵생물 생합성 경로의 일부만을 사용하여, Priem 등 (Glycobiology 12, 2002, 235-240)은 살아있는 박테리아 세포를 사용하여 시알일올리고사카리드를 생산하는 것을 개시하였다. 상기 방법에서, 알파-2,3-시알일트란스퍼라제 및 CMP-Neu5Ac 신타제에 대한 네이세리아 메닌기티디스 (Neisseria meningitidis) 유전자를 과발현하는 대사 조작된 에스케리치아 콜리 (Escherichia coli) 균주 세포를 성장시켜서 시알일락토스가 직접 생산되고, 상기 균주는 부가로 베타-갈락토시다제 및 N-아세틸뉴라민산 (Neu5Ac) 알돌라제 활성이 존재하지 않았다. 상기 미생물은 탄소 및 에너지원으로 글리세롤과 함께 높은 세포 밀도로 성장하였고, 외인성 락토스 및 Neu5Ac가 시알일락토스 합성을 위한 전구물질로서 공급되었다. 성장하는 동안, 락토스 및 Neu5Ac는 이. 콜리 (E. coli) 갈락토시드 및 외인성 Neu5Ac 퍼미아제 (permease) 발현의 유도로 내재된다. 락토스 및 Neu5Ac는 세포질 내에 축적되고, 여기서 Neu5Ac는 그 후에 CMP-Neu5Ac로 전환되고 추가로 락토스 상에 전달되어 시알일락토스를 형성하였다. 상기 미생물 방법에 의한 시알일올리고사카리드의 대규모 생산은 전구물질로서 중요한 양의 Neu5Ac를 필요로 한다.
시알일올리고사카리드 생산을 위해 시알산의 외래 공급을 필요로 하지 않는 다른 미생물 시스템이 개발되었다. WO2007101862에서는 CMP-Neu5Ac 신테타제 (synthetase), 시알산 신타제, UDP-GlcNAc-6-포스페이트 2-에피머라제 및 시알일트란스퍼라제를 코딩하는 이종 유전자를 포함하지만, 시알산 알돌라제 (NanA) 및 ManNAc 키나제 (NanK)를 코딩하는 내인성 유전자는 결실 또는 불활성화되어 있는 미생물로 시알일화 올리고사카리드를 생산하는 방법을 개시하였다. 이러한 원핵생물 생합성 경로의 사용은 세포에 대해 매우 에너지 집약적이다. 더욱이, 개시된 시알일화 올리고사카리드를 생산하는 경로는 세포 자신의 펩티도글리칸 합성에 필수적인 UDP-GlcNAc와 경쟁한다. 이러한 개념을 바탕으로, Kang 등은 시알산 신타제가 아닌, 내인성 시알산 알돌라제를 사용하는 생산 숙주를 만들었고, 이는 덜 유리한 화학적 형형을 갖는다 (Metabolic engineering 14, 2012, 623-629).
EP1484406은 N-아세틸글루코사민 2-에피머라제 및 Neu5Ac 신타제를 과발현하는 이. 콜리를 사용한 Neu5Ac의 생산을 개시하였지만, 외래 전구물질로서 N-아세틸글루코사민 (GlcNAc)을 필요로 한다. 개시된 방법에서, GlcNAc는 그대로 사용될 필요가 있다. 그러므로, EP1484406에서의 세포는 GlcNAc가 GlcNAc-2-에피머라제에 의해 직접 사용될 수 있도록 파괴될 필요가 있다. Lundgren 등 (Org. Biomol. Chem., 2007, 5, 1903 - 1909)에 의해 개시된 바와 같이, 온전한 세포는 들어오는 GlcNAc를 N-아세틸글루코사민-6-포스페이트 (GlcNAc-6-P)로 전환하여 세포가 세포 성장을 위해 사용할 것이다. 상기 GlcNAc-6-P는 세포간에 이용가능하지 않으며, 그러므로 ManNAc로 에피머화 (epimerisation)를 위해 비-포스포릴화 GlcNAc를 필요로 하는 GlcNAc-2-에피머라제를 사용할 수 없다. 이는 EP1484406의 세포 투과 (permeabilization)가 필요가 이유를 설명한다. Lundgren 등에 의해 설명되는 바와 같이, Neu5Ac를 제조하는데 GlcNAc-6-P가 사용될 수 있지만, 이는 중간체로서 UDP-GlcNAc를 포함하는 다른 합성 경로를 필요로 하고, 이는 WO2007101862에 개시되어 있다. 결과의 경로는 GlcNAc의 우리딜화 (uridylation)가 여분의 ATP를 필요로하기 때문에 후자의 특허에 기재된 것과 비교하여 에너지 수요를 추가로 증가시켰다.
Deng 등 (Metabolic Engineering 7 (2005), 201-214)은 GlcNAc-6-P의 세포내 생산을 통해 GlcNAc를 생산하고, 그 다음에 효율적으로 탈인산화되어 배지에 GlcNAc로서 분비되는 것을 개시하였다. Deng 등에 따르면, 상기 탈인산화는 유출 (export)시에 발생하고, 보다 구체적으로 에스케리치아 콜리의 원형질에서 발생한다. 상기 방법에 개시된 세포외 생산된 GlcNAc는 세포내 전환을 위해 이용가능하지 않다. 이러한 GlcNAc를 생산하는 방법은 포스포릴화 아미노 당 (amino sugar)의 저해 효과를 최소로 하기 위해, 2-단계 유가식 과정 (fed batch process)인, 즉 세포 성장 단계 그 다음에, 배양물이 높은 세포 밀도에 도달한 후에만 유도되는 GlcNAc 생산 단계를 필요로 한다.
포스파타제를 이종으로 발현시켜서 상기를 수행하려는 다른 시도가 있었고, 이는 감소된 성장과 강한 대사 부담의 문제를 겪었다 (Lee and Oh, Metabolic engineering, 2015, 143-150). 상기 성장/바이오매스 (biomass) 형성 감소에 대한 주된 이유는 도입되는 포스파타제의 비-특이성에 있고, 이는 다른 필수적인 포스포릴화 화합물을 탈인산화한다. 그러므로 이러한 변형은 적합도 (fitness)를 감소시키고, 특정 생산성을 더 낮췄다. 이는 또한 생산하는 동안 생산 경로를 돌연변이화하는 선택적으로 압력을 초래하여, 전체 공정 안정성을 저하시켰다.
시알산 및 시알일화 올리고사카리드의 생산 경로는 높은 수준의 포스포릴화 (예컨대 GlcNAc-6-P) 및 뉴클레오티드 경로 중간체의 형성을 필요로 한다. 이러한 형성은 비특이적 포스파타제의 활성화에 의해 상기 중간체의 비특이적 분해를 유도하여, 결국 적합도 감소를 초래하는 것으로 통상적으로 이해된다. 생산 숙주의 성장에서 대사 경로의 발현 효과를 회피하기 위해서, 유도성 발현 시스템을 사용하는 것이 표준이다. 이러한 방법에서, 먼저 바이오매스가 형성되고, 후속하는 생산 과정에서 생산 경로가 예를 들어 IPTG에 의해 활성화된다. 이는 시알산 및 시알일화 올리고사카리드의 생산을 위해 다른 사람들에 의해 적용되었다 (WO2007101862; Priem et al. Glycobiology 12, 2002, 235-240; Kang et al., Metabolic engineering 14, 2012, 623-629; Yang et al., Metabolic engineering 43, 2017, 21-28). 생산성 및 역가 (titer) 손실 외에도, 유도성 시스템 사용에서 또 다른 단점은 GlcNAc 및 ManNAc와 같은 중간체 경로 대사산물의 배출에 있다. 이는 정제를 위해 가외의 다운스트림 프로세싱 단계의 필요성을 야기하여, 시알산, 시알일락토스 또는 다른 시알일화 화합물의 생산에서 더 높은 생산 비용을 초래한다.
상기에 토의된 시알일화 화합물을 생산하는 방법은 생물공학, 약학 및 의학 산업에서 대규모 수요를 만족시키기에는 여전히 충분하지 않다. 상기에 언급된 문제를 성공적으로 극복한 대사 공학적 접근법은 당 분야에서 유의하고 오래 기다려온 진보를 나타낼 것이다.
놀랍게도, 본 발명자는 유도를 필요로 하지 않고, UDP-GlcNAc 에피머라제를 필요로 하지 않지만, 대사 경로를 잘 조절하여 생산은 향상시키고 생산 과정 중에 부산물 형성은 감소시킬 수 있는 항시성 발현을 허용하는 생산 경로를 형성할 수 있었다.
본 발명의 일 구현예에 따르면, 유도를 필요로 하지 않는, 미생물에 의한 시알일화 화합물 생산 방법을 제공한다.
본 발명의 부가의 구현예에 따르면, UDP-GlcNAc 에피머라제를 필요로 하지 않고, 당 분야에서 이전에 개시된 바와 같이 세포에 대사 부담을 가중하지 않는 포스파타제의 발현을 조절하는 단계를 포함하는 생산 경로를 제공한다. 본 발명의 부가의 구현예는 또한 포스파타제 발현을 조절하여 증가된 시알일화 화합물 생산을 제공한다.
다른 부가의 구현예에서, 상기 방법은, 대사 경로 중 유전자의 항시성 발현과 조합될 때, 대사 경로를 더 잘 조절하여, 생산 과정 중에 부산물 형성을 감소시킨다.
본 발명은 미생물을 사용하여 시알일화 화합물을 생산하기 위한 경제적이고, 보다 효율적이며 대안의 생합성 경로를 개시한다.
본 발명은 미생물 발효 성장에 의한 시알일화 화합물을 생산하는 방법을 제공한다.
구체적으로, 본 발명은 시알일화 화합물의 생산 방법에 관한 것으로서, 상기 방법은 미생물을 배양 배지에서 배양하는 단계를 포함한다. 상기 미생물은 세포내에서 하기 반응: N-아세틸글루코사민-6-포스페이트를 N-아세틸글루코사민으로, N-아세틸글루코사민을 N-아세틸만노사민으로, 및 N-아세틸만노사민을 N-아세틸-뉴라미네이트로 전환시켰다. 또한, 상기 미생물은 i) N-아세틸글루코사민-6-P를 글루코사민-6-P로 전환, ii) N-아세틸글루코사민을 N-아세틸글루코사민-6-P로 전환, 및 iii) N-아세틸-뉴라미네이트를 N-아세틸-만노사민으로 전환시킬 수 없다.
바람직하게, N-아세틸글루코사민-6-포스페이트를 N-아세틸글루코사민으로 전환하는 것은 세포내 발현된 포스파타제의 작용에 의해 수득되었다. 다른 바람직한 구현예에서, 상기 N-아세틸글루코사민은 N-아세틸만노사민으로 세포내 발현된 N-아세틸만노사민 에피머라제에 의해 전환된다. 대안의 바람직한 구현예에서, 상기 N-아세틸만노사민은 세포내 발현된 시알산 신타제에 의해 N-아세틸-뉴라미네이트로 전환된다. 보다 더 바람직하게, 상기 미생물은 모두 3개의 효소를 포함하여, 상기 미생물은 i) 세포내 발현된 포스파타제의 작용에 의해 N-아세틸글루코사민-6-포스페이트를 N-아세틸글루코사민으로, ii) 세포내 발현된 N-아세틸만노사민 에피머라제에 의해 N-아세틸글루코사민을 N-아세틸만노사민으로; 또한 iii) 세포내 발현된 시알산 신타제에 의해 N-아세틸만노사민을 N-아세틸-뉴라미네이트로 전환시킨다.
바람직하게, 본 발명의 방법에서 사용된 미생물은 하기 효소를 생산할 수 없다: i) N-아세틸글리코사민-6-포스페이트 데아세틸라제, ii) N-아세틸글루코사민 키나제, 및 iii) N-아세틸뉴라미네이트 알돌라제.
본 발명은 또한 i) N-아세틸글루코사민-6-포스페이트를 N-아세틸글루코사민으로 탈인산화하는 포스파타제 (EC 3.1.3.), ii) N-아세틸글루코사민 (GlcNAc)을 N-아세틸만노사민 (manNac)으로 전환시키는 GlcNAc 2-에피머라제 (EC 5.1.3.8), 및 iii) N-아세틸만노사민 (ManNAc)으로부터 N-아세틸-뉴라미네이트 (Neu5Ac)를 합성하는 시알산 신테타제 (EC 2.5.1.56)를 발현하는 미생물을 제공한다. 또한, 상기 미생물은 i) N-아세틸글루코사민-6-P를 글루코사민-6-P로 전환, ii) N-아세틸-글루코사민을 N-아세틸-글루코사민-6-P로 전환, 및 iii) N-아세틸-뉴라미네이트를 N-아세틸-만노사민으로 전환시킬 수 없다.
일 양상에서, 본 발명은 하기 반응을 촉매화할 수 있는 미생물을 제공한다: N-아세틸글루코사민-6-포스페이트의 N-아세틸글루코사민으로의 세포내 전환, N-아세틸글루코사민의 N-아세틸만노사민으로의 세포내 전환, 및 N-아세틸만노사민의 시알산으로의 세포내 전환.
N-아세틸글루코사민-6-포스페이트는 세포 밖으로 본래 효율적으로 배출되고, 원형질에서 포스파타제에 의해 탈인산화되는 것으로 일반적으로 받아들여지고 있다 (p. 212, second column, Deng et al., Metabolic Engineering 7 (2005), 201-214 참조). 그러므로, 본 발명이 없다면, 이렇게 배출된 산물은 시알산으로의 전환을 위해 이용가능하지 않을 것이다. 또한, 재-내재화(re-internalization)는 N-아세틸글루코사민을 포스포릴화하는 수송 단백질을 통해 일어난다.
세포내 N-아세틸글루코사민-2-에피머라제의 사용으로, (UDP-N-아세틸글루코사민을 통한) 고전적 원핵생물 경로보다 에너지 (ATP) 소비를 더 적게 한다. 이는 더 건강하고 보다 효율적인 균주에 의해 시알산, 시알일화 올리고사카리드 및/또는 시알일화 산물을 보다 효율적으로 생산할 수 있다. 발현 수준을 최적화하여, 바람직하지 않은 화학적 평형을 극복하고, 문헌에서와 같이 다량의 유리 N-아세틸글루코사민을 필요로 하지 않는다. 실제로, 당 분야에서, 상기 효소는 N-아세틸만노사민을 생산하기 위해 고농도의 N-아세틸글루코사민을 사용하는 효소 반응에서 단독으로 사용된다. 그러므로 에피머라제를 사용하면 배지에 방출되는 것으로 나타나는 세포내 형성된 다량의 GlcNAc를 필요로 한다는 것이 논리적일 것이며 (상기에 개시된 Deng 참조), 그러나 본 발명은 이를 피할 수 있다는 것을 입증하였다. 효소 방법에 대해 본 발명의 다른 이점은 예를 들어 글루코스, 갈락토스 또는 프룩토스와 같은 모노사카리드, 수크로스 또는 말토스와 같은 디사카리드 또는 이에 한정되는 것은 아니지만 글리세롤과 같은 폴리올과 같이 저가의 기질이 본 발명에서 사용될 수 있다. 이는 발효에 의해 경제적인 생산 방법을 가능하게 한다.
N-아세틸글루코사민-6-포스페이트를 N-아세틸글루코사민으로 전환하는 다른 포스파타제 (EC 3.1.3.)가 당 분야에 개시되어 있고, 본 발명에서 사용될 수 있다. HAD 상위패밀리 및 HAD-유사 패밀리로부터의 포스파타제가 당 분야에 개시되어 있다. 상기 패밀리로부터의 예로는 에스케리치아 콜리 유래의 유전자 yqaB, inhX, yniC, ybiV, yidA, ybjI, yigL 또는 cof로부터 발현된 효소에서 발견될 수 있다. 상기 반응을 촉매화하는 하나의 포스파타제가 블라스토클라디엘라 에머소니이 (Blastocladiella emersonii)에서 동정되었다. 포스파타제는 일반적으로 비특이적이고, 활성은 일반적으로 패밀리 또는 구조와 관련이 없다. 그러므로 다른 예를 모든 포스파타제 패밀리에서 찾을 수 있다. 특정 포스파타제는 Fahs 등 (ACS Chem. Biol., 2016, 11 (11), 2944-2961)에 의해 개시된 바와 같이 잘 알려져 있는 방법에 의해 용이하게 동정 및 스크리닝된다.
바람직하게, 본 발명의 포스파타제는 HAD-유사 포스파타제이다. 본원에 정의되는 HAD-유사 포스파타제는 하기를 포함하는 임의의 포스파타제 폴리펩티드를 나타낸다:
- 하기에 정의되는 하기 모티프 중 하나 이상:
모티프 1: hDxDx[TV] (서열번호: 73), 또는
모티프 2: [GSTDE][DSEN]x(1-2)[hP] x(1-2) [DGTS] (서열번호: 74, 75, 76, 77),
상기 h는 소수성 아미노산 (A, I, L, M, F, V, P, G)을 의미하고, x는 임의의 별개의 아미노산일 수 있다.
다른 바람직한 구현예에서, HAD-유사 폴리펩티드는 통상적으로 서열번호: 43, 44, 45, 47, 48, 50, 51, 52, 54, 55 또는 57로 표시되는 폴리펩티드 중 어느 하나에 대해 선호도 오름 차순으로 적어도 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 또는 99 %의 전체 서열 동일성을 갖는다. 바람직하게, 상기 폴리펩티드는 또한 상기 확인된 모티프 중 적어도 하나를 포함한다. 보다 바람직하게, 이들은 모티프 모두를 포함한다.
상기 전체 서열 동일성은, 바람직하게 디폴트 파라미터 (default parameter) 및 바람직하게 성숙한 단백질 (즉 분비 신호 또는 수송 펩티드 (transit peptide)를 고려하지 않음)의 서열을 가지고, 프로그램 GAP (GCG Wisconsin Package, Accelrys)의 Needleman Wunsch 알고리즘과 같은 글로벌 정렬 알고리즘 (global alignment algorithm)을 사용하여 결정된다. 전체 서열 동일성과 비교하여, 서열 동일성은 보존된 도메인 또는 모티프 만이 고려될 때 일반적으로 더 높을 것이다.
바람직한 일 구현예에서, 상기 HAD-유사 폴리펩티드는 서열번호: 43, 44, 45, 47, 48, 50, 51, 52, 54, 55 또는 57 중 어느 하나를 포함한다.
다른 바람직한 구현예에서, 상기 포스파타제는 HAD 상위패밀리 또는 HAD-유사 포스파타제 패밀리로부터 선택된다. 보다 바람직하게, 상기 포스파타제는 하기를 포함하는 그룹으로부터 선택된다: i) 에스케리치아 콜리 유래의 유전자 yqaB, inhX, yniC, ybiV, yidA, ybjI, yigL 또는 cof에 의해 발현되는 효소, ii) 블라스토클라디엘라 에머소니이 포스파타제 및 iii) 다른 포스파타제 패밀리.
N-아세틸-D-글루코스민-2-에피머라제 (EC 5.1.3.8)의 예는 원핵생물 및 진핵생물에서 찾을 수 있다. 원핵생물에 대한 예는 시아노박테리아 (cyanobacteria) 가령 예를 들어 아카리오클로리스 마리나 (Acaryochloris marina), 아나베나 바리아빌리스 (Anabaena variabilis), 아나베나 마리나 (Anabaena marina), 노스톡 펀크티포메 (Nostoc punctiforme), 아카리오클로리스 종, 아나베나 종, 노스톡 종 및 시네코시스티스 (Synechocystis) 종에서 찾을 수 있다. 이들은 또한 박테로이데스 (Bacteroides) 종 가령 예를 들어 박테로이데스 오바투스 (Bacteroides ovatus) 및 박테로이데스 테타이오타오미크론 (Bacteroides thetaiotaomicron)에서 및 캅노시토파가 카니모르수스 (Capnocytophaga canimorsus) 및 모빌룬쿠스 물리에리스 (Mobiluncus mulieris)에서 찾을 수 있다. 진핵생물에서, N-아세틸-D-글루코스민-2-에피머라제는 글리신 막스 (Glycin max), 무스 무스쿨루스 (Mus musculus), 호모 사피엔스 (Homo sapiens), 라투스 노르베기쿠스 (Rattus norvegicus), 보스 타우루스 (Bos Taurus), 수스 스크로파 (Sus scrofa), 카니스 루푸스 (Canis lupus)에서 찾을 수 있다. 바람직하게, 본 발명의 방법 및 미생물에서, N-아세틸만노사민-2-에피머라제는 i) 시아노박테리아, 보다 구체적으로 아카리오클로리스 마리나, 아나베나 바리아빌리스, 아나베나 마리나, 노스톡 펀크티포메, 아카리오클로리스 종, 아나베나 종, 노스톡 종 및 시네코시스티스 종 유래의 N-아세틸만노사민-2-에피머라제; ii) 박테로이데스 종, 보다 구체적으로 박테로이데스 오바투스, 박테로이데스 테타이오타오미크론, 캅노시토파가 카니모르수스모빌룬쿠스 물리에리스 유래의 N-아세틸만노사민-2-에피머라제; iii) 글리신 막스, 무스 무스쿨루스, 호모 사피엔스, 라투스 노르베기쿠스, 보스 타우루스, 수스 스크로파 또는 카니스 루푸스 유래의 N-아세틸-D-글루코스민-2-에피머라제를 포함하는 그룹으로부터 선택된다.
N-아세틸 뉴라미네이트 신타제 (또한 당 분야에서 시알산 신타제라고 함) (EC 2.5.1.56) 활성은 여러 원핵 생물체 가령 예를 들어 스트렙토코쿠스 아갈라티에 (Streptococcus agalatiae), 바실루스 서브틸리스 (Bacillus subtilis), 레지오넬라 뉴모필라 (Legionella pneumophilla), 캄필로박터 제주니, 이디오마리나 로이히엔시스 (Idiomarina loihiensis), 모리텔라 비스코사 (Moritella viscosa), 알리이비브리오 살모니시다 (Aliivibrio salmonicida), 에스케리치아 콜리, 메타노칼도코쿠스 잔나스키 (Methanocaldococcus jannaschi), 클로스트리디움 소르델리이 (Clostridium sordellii), 부티리비브리오 프로테오클라스티쿠스 (Butyrivibrio proteoclasticus), 미크로모나스 콤모다 (Micromonas commoda) 또는 네이세리아 메닌기티스 (Neisseria meningitis)에서 찾을 수 있다. 바람직하게, 본 발명의 방법 및 미생물에서, 상기 시알산 (또는 N-아세틸 뉴라미네이트) 신타제는 스트렙토코쿠스 아갈라티에, 바실루스 서브틸리스, 레지오넬라 뉴모필라, 캄필로박터 제주니, 이디오마리나 로이히엔시스, 모리텔라 비스코사, 알리이비브리오 살모니시다, 에스케리치아 콜리, 메타노칼도코쿠스 잔나스키, 클로스트리디움 소르델리이, 부티리비브리오 프로테오클라스티쿠스, 미크로모나스 콤모다 또는 네이세리아 메닌기티스 유래의 시알산 신타제를 포함하는 그룹으로부터 선택된다.
바람직한 일 양상에서, 포스파타제, N-아세틸만노사민 에피머라제 및 시알산 신타제 중 임의의 하나 이상이 상기 미생물에서 과발현된다. 대안의 바람직한 양상에서, 포스파타제, N-아세틸만노사민 에피머라제 및 시알산 신타제 중 임의의 하나 이상이 미생물에 도입 및 발현된다.
다른 양상에서, 상기 미생물은 하기 효소를 코딩하는 유전자가 결여되어 있다: i) N-아세틸글리코사민-6-포스페이트 데아세틸라제, ii) N-아세틸글루코사민 키나제, 및 iii) N-아세틸뉴라미네이트 알돌라제. 다른 바람직한 양상에서, 하기 효소 i) N-아세틸글리코사민-6-포스페이트 데아세틸라제, ii) N-아세틸글루코사민 키나제, 및 iii) N-아세틸뉴라미네이트 알돌라제를 코딩하는 유전자는 활성이 감소되었고, 바람직하게 상기 유전자는 미생물에서 결실 또는 녹아웃 (knocked-out)되어 있다.
다른 바람직한 양상에서, 상기 미생물은 락토스 흡수를 촉진하고 락토스를 대사작용하는 효소가 결여된 단백질을 추가로 코딩한다. 락토스 사멸에 저항하는 미생물을 생산하는 방법 및 결과의 미생물이 WO2016/075243에 개시되어 있고, 이는 본원에 참고로 포함된다.
바람직한 일 양상에서, 본 발명의 미생물 및 본 발명의 방법에서 사용되는 미생물은 또한 CMP-시알산 신타제 (EC 2.7.7.43) 및 시알일트란스퍼라제 (EC 2.4.99.1)를 발현하여 상기 시알산을 활성화하고 이를 원하는 화합물에 전달한다.
바람직한 일 양상에서, 상기 N-아세틸글루코사민-6-포스페이트는 기질로서 세포내 글루코사민-6-포스페이트를 사용하는 글루코사민-포스페이트 N-아세틸트란스퍼라제 (EC 2.3.1.4)를 도입하여 수득된다. 대부분의 미생물에서, 글루코사민-6-포스페이트는 세포에서 본래 존재하지만, 예컨대 그람 양성 박테리아에 존재하는, 천연 효소를 스크리닝하거나 또는 단백질 조작을 통해서 수득되는, L-글루타민:D-프룩토스-6-포스페이트 아미노트란스퍼라제를 저해 없이 발현시킴으로써, 세포내 생산이 증가될 수 있다 (Deng et al., Metabolic Engineering 7 (2005), 201-214).
본 발명에서, N-아세틸글루코사민-6-포스페이트를 N-아세틸-뉴라미네이트 또는 시알산으로 전환시키는 유전자의 발현은 N-아세틸글루코사민-6-포스페이트의 세포내 탈인산화할 수 있고, N-아세틸글루코사민-6-포스페이트의 독성 축적을 방지하며, N-아세틸글루코사민 및/또는 N-아세틸만노사민의 배출을 방지하는 방식으로 최적화된다. 상기 최적화는 생산 경로 중 유전자의 항시성 발현의 사용 결과이다. 바람직한 일 구현예에서, 본 발명은 형성된 N-아세틸글루코사민 및/또는 N-아세틸만노사민의 적어도 10%, 20%, 30%, 35%, 40%, 45%, 50%, 또는 60%의 배출을 방지한다. 부가의 바람직한 구현예에서, 상기 미생물은 시알일화 화합물보다 세포외 N-아세틸글루코사민 및/또는 N-아세틸만노사민을 덜 생산한다. 보다 바람직하게, 상기 미생물은 시알일화 화합물보다 50%, 40%, 30%, 20%, 10%, 5%, 2% 미만의 세포외 N-아세틸글루코사민 및/또는 N-아세틸만노사민을 생산한다. 본 발명의 다른 바람직한 구현예에서, 상기 미생물은 전체 세포외 탄수화물에 대해 50%, 60%, 70%, 80%, 90%, 95%, 98% 이상의 세포외 시알일화 화합물을 생산한다.
특정 양상에서, 본 발명은 배양 배지에 임의의 외인성 시알산을 첨가하지 않고, 시알일화 화합물을 합성하는 방법에 관한 것이다.
상기 시알일화 화합물은 N-아세틸뉴람산, 시알일화 올리고사카리드, 시알일화 지질, 시알일화 당지질 (예컨대, 강글리오시드, 세라미드로, 이에 한정되지 않음), 시알일화 단백질 또는 시알일화 아글리콘일 수 있다.
시알일화 올리고사카리드는 올리고사카리드를 포함하는 대전된 시알산, 즉 시알산 잔기를 갖는 올리고사카리드이다. 이는 산성 특성을 갖는다. 일부 예로는 3-SL (3-시알일락토스), 3-시알일락토사민, 6-SL (6-시알일락토스 또는 n-아세틸뉴라미네이트 알파 2,6 갈락토실 베타 1,4 글루코스), 6-시알일락토사민, 6-시알일락토스를 포함하는 올리고사카리드, SGG 헥사사카리드 (Neu5Ac 알파-2,3Gal 베타 -1,3GalNac 베타-1,3Gala-1,4Gal 베타 -1,4Gal), 시알일화 테트라사카리드 (Neu5Ac-알파-2,3Gal 베타 -1,4GlcNAc 베타 -14GlcNAc), 펜타사카리드 LSTD (Neu5Ac 알파-2,3Gal 베타 -1,4GlcNAc 베타 -1,3Gal 베타 -1,4Glc), 시알일화 락토-N-트리오스, 시알일화 락토-N-테트라오스, 시알일락토-N-네오테트라오스, 모노시알일락토-N-헥사오스, 디시알일락토-N-헥사오스 I, 모노시알일락토-N-네오헥사오스 I, 모노시알일락토-N-네오헥사오스 II, 디시알일락토-N-네오헥사오스, 디시알일락토-N-테트라오스, 디시알일락토-N-헥사오스 II, 시알일락토-N-테트라오스 a, 디시알일락토-N-헥사오스 I, 시알일락토-N-테트라오스 b, 3-시알일-3-푸코실락토스, 디시알로모노푸코실락토-N-네오헥사오스, 모노푸코실모노시알일락토-N-옥타오스 (시알일 Lea), 시알일락토-N-푸코헥사오스 II, 디시알일락토-N-푸코펜타오스 II, 모노푸코실디시알일락토-N-테트라오스 및 하나 또는 수개의 시알산 잔기(들)를 갖는 올리고사카리드로, 이에 한정되는 것은 아니지만: GM3으로부터 선택된 강글리오시드의 올리고사카리드 모이어티 (3시알일락토스, Neu5Aca-2,3Gal 베타-4Glc) 및 GM3 모티프, GD3 Neu5Aca-2,8Neu5Aca-2,3Gal 베타 -1,4Glc GT3 (Neu5Aca-2,8Neu5Aca-2,8Neu5Aca-2,3Gal 베타 -1,4Glc)를 포함하는 올리고사카리드; GM2 GalNAc 베타 -1,4(Neu5Aca-2,3)Gal 베타 -1,4Glc, GM1 Gal 베타 -1,3GalNAc 베타 -1,4(Neu5Aca-2,3)Gal 베타 -1,4Glc, GD1a Neu5Aca-2,3Gal 베타 -1,3GalNAc 베타 -1,4(Neu5Aca-2,3)Gal 베타 -1,4Glc GT1a Neu5Aca-2,8Neu5Aca-2,3Gal 베타 -1,3GalNAc 베타 -1,4(Neu5Aca-2,3)Gal 베타 -1,4Glc GD2 GalNAc 베타 -1,4(Neu5Aca-2,8Neu5Aca2,3)Gal 베타 -1,4Glc GT2 GspalNAc 베타 -1,4(Neu5Aca-2,8Neu5Aca-2,8Neu5Aca2,3)Gal 베타 -1,4Glc GD1b, Gal 베타 -1,3GalNAc 베타 -1,4(Neu5Aca-2,8Neu5Aca2,3)Gal 베타 -1,4Glc GT1b Neu5Aca-2,3Gal 베타 -1,3GalNAc 베타 -1,4(Neu5Aca-2,8Neu5Aca2,3)Gal 베타-1,4Glc GQ1b Neu5Aca-2,8Neu5Aca-2,3Gal 베타 -1,3GalNAc 베타 -1,4(Neu5Aca-2,8Neu5Aca2,3)Gal 베타 -1,4Glc GT1c Gal 베타 -1,3GalNAc 베타 -1,4(Neu5Aca-2,8Neu5Aca-2,8Neu5Aca2,3)Gal 베타 -1,4Glc GQ1c, Neu5Aca-2,3Gal 베타 -1,3GalNAc 베타 -1,4(Neu5Aca-2,8Neu5Aca-2,8Neu5Aca2,3)Gal 베타 -1,4Glc GP1c Neu5Aca-2,8Neu5Aca-2,3Gal 베타 -1,3GalNAc 베타 -1,4(Neu5Aca-2,8Neu5Aca-2,8Neu5Aca2,3)Gal 베타 -1,4Glc GD1a Neu5Aca-2,3Gal 베타 -1,3(Neu5Aca-2,6)GalNAc 베타 -1,4Gal 베타 -1,4Glc 푸코실-GM1 Fuca-1,2Gal 베타 -1,3GalNAc 베타 -1,4(Neu5Aca-2,3)Gal 베타 -1,4Glc이고; 모두는 상기 올리고사카리드 모이어티를 세라미드와 반응시키거나 또는 상기 올리고사카리드를 세라미드에서 합성시킴으로써 해당하는 강글리오시드 생산으로 확장될 수 있다.
상기에서 언급된 용어 미생물 또는 생물체 또는 세포는 박테리아, 효모 또는 진균류를 포함하는 목록으로부터 선택된 미생물을 지칭하거나, 또는 식물 또는 동물 세포를 지칭한다. 후자의 박테리아는 바람직하게 프로테오박테리아 (Proteobacteria) 문 (phylum) 또는 피르미쿠테스 (Firmicutes) 문 또는 시아노박테리아 문 또는 데이노코쿠스-서무스 (Deinococcus-Thermus) 문에 속한다. 프로테오박테리아 문에 속하는 후자의 박테리아는 바람직하게 엔테로박테리아세에 (Enterobacteriaceae) 과, 바람직하게는 에스케리치아 콜리 속에 속한다. 후자의 박테리아는 바람직하게 예컨대 이에 한정되는 것은 아니지만, 에스케리치아 콜리 B, 에스케리치아 콜리 C, 에스케리치아 콜리 W, 에스케리치아 콜리 K12, 에스케리치아 콜리 니슬 (Nissle)과 같은 에스케리치아 콜리 속에 속하는 임의의 균주와 관련이 있다. 보다 구체적으로, 후자의 용어는 이. 콜리 K12 균주로 명명된 배양된 에스케리치아 콜리 균주에 관한 것이고, 이는 실험실 환경에 잘 적응하고, 야생형 균주와 달리, 장에서 성장하는 능력은 상실하였다. 이. 콜리 K12 균주의 잘 알려져 있는 예로는 K12 야생형, W3110, MG1655, M182, MC1000, MC1060, MC1061, MC4100, JM101, NZN111 및 AA200이 있다. 그러므로, 본 발명은 구체적으로 상기에 언급된 바와 같이 돌연변이된 및/또는 형질전환된 에스케리치아 콜리 균주에 관한 것이고, 상기 이. 콜리 균주는 K12 균주이다. 보다 구체적으로, 본 발명은 상기에 언급된 바와 같이 돌연변이된 및/또는 형질전환된 에스케리치아 콜리 균주에 관한 것이고, 상기 K12 균주는 이. 콜리 MG1655이다. 피르미쿠테스 문에 속하는 후자의 박테리아는 바람직하게 구성원으로 예컨대 락토바실루스 락티스 (Lactobacillus lactis), 로이코노스톡 메센테로이데스 (Leuconostoc mesenteroides)를 갖는 바실리 (Bacilli), 바람직하게는 락토바실리알레스 (Lactobacilliales), 또는 구성원으로 바실루스 종인 바실루스 서브틸리스 또는 비. 아밀로리퀘파시엔스 (B. amyloliquefaciens)를 갖는 바실랄레스 (Bacillales)에 속한다. 악티노박테리아 (Actinobacteria) 문에 속하는 후자의 박테리아는 바람직하게 코리네박테리아세에 (Corynebacteriaceae) 과에 속하고, 구성원은 코리네박테리움 글루타미쿰 (Corynebacterium glutamicum) 또는 시. 아페르멘탄스 (C. afermentans)이거나, 또는 스트렙토미세타세에 (Streptomycetaceae) 과에 속하고, 구성원은 스트렙토미세스 그리세우스 또는 에스. 프라디에 (S. fradiae)이다. 후자의 효모는 바람직하게 아스코미코타 (Ascomycota) 문 또는 바시디오미코타 (Basidiomycota) 문 또는 듀테로미코타 (Deuteromycota) 문 또는 지고미세테스 (Zygomycetes) 문에 속한다. 후자의 효모는 바람직하게 사카로미세스 (Saccharomyces), 피키아 (Pichia), 한세눌라 (Hansenula), 클루이베로미세스 (Kluyveromyces), 야로위아 (Yarrowia) 또는 스타르메렐라 (Starmerella) 속에 속한다. 후자의 진균류는 바람직하게 리조푸스 (Rhizopus), 딕티오스텔리움 (Dictyostelium), 페니실리움 (Penicillium), 무코르 (Mucor) 또는 아스페르길루스 (Aspergillus) 속에 속한다.
생산 숙주를 위한 배양 배지는 선택적으로 외인성 전구물질을 포함할 수 있거나, 또는 균주 자체에 의해 상기 전구물질 예컨대 글리칸 가령 예를 들어 락토스, 락토사민, 락토-N-트리오스, 락토-N-테트라오스, 락토-N-네오테트라오스; 올리고사카리드; 펩티드; 지질 또는 아글리콘이 생성될 수 있다. 하나의 특정 양상에서, 본 발명의 방법은 외인성 전구물질, 가령 예를 들어 모노, 디 또는 트리-사카리드, 보다 구체적으로 락토스, N-아세틸락토사민, 락토-N-비오스, 갈락토스, 베타-갈락토시드, 및 알파-갈락토시드 예컨대 이에 한정되는 것은 아니지만 글로보트리오스 (Gal-알파-1,4Gal-베타-1,4Glc)로부터 선택된 외인성 전구물질의 능동 흡수에 기반하고, 상기 미생물은 예컨대 디사카리드 가령 수크로스 또는 말토스와 같은 저가의 탄소 기질에서 성장한다. 더욱이, 상기 미생물은 글루코스, 프룩토스 또는 글리세롤에서 성장할 수 있다. 발현 외인성 전구물질은 미생물에 의해 내재되는 본 발명에 따른 산물의 생합성 경로에 관여되는 화합물을 나타낸다.
일 양상에서, 본 발명은 락토-N-트리오스, 락토-N-테트라오스 또는 락토-N-네오테트라오스의 시알일화 형태의 생산 방법을 제공한다. 상기 3개의 분자들 중 어느 하나는, 바람직하게 호모 사피엔스, 보스 타우루스, 무스 물라타 (Mus mulatta), 갈루스 갈루스 (Gallus gallus), 다니오 레리오 (Danio rerio), 헬리코박터 필로리 (Helicobacter pylori) 및 헤모필루스 듀크레이 (Haemophilus ducrey)를 포함하는 그룹으로부터 기원하는 갈락토실트란스퍼라제 (EC 2.4.1.38) 및/또는 바람직하게 보스 타우루스, 호모 사피엔스무스 무스쿨루스를 포함하는 그룹으로부터 기원하는 N-아세틸글루코사미닐트란스퍼라제 (EC 2.4.1.90)의 활성을 통해 미생물을 의해 합성된다. 상기 올리고사카리드의 형성을 향상시키기 위해서, UDP 당 히드롤라제 및 갈락토스-1-포스페이트 우리딜일트란스퍼라제를 코딩하는 유전자가 결여되어 있어서, 활성이 감소되거나 상기 미생물이 녹아웃되었다.
다른 양상에서, 시알일화 올리고사카리드를 생산하는 방법에 제공되고, 상기 방법은 전술한 바와 같이 미생물을 배양하는 단계를 포함하고, 상기 미생물은 시알일트란스퍼라제에 대한 공여체 기질로서 내부적으로 활성화된 N-아세틸뉴라미네이트를 생산하고; 또한 상기 방법은 락토스, N-아세틸락토사민, 락토-N-비오스, 갈락토스, 베타-갈락토시드, 및 알파-갈락토시드 예컨대 이에 한정되는 것은 아니지만 글로보트리오스 (Gal-알파-1,4Gal-베타-1,4Glc)갈락토스로 구성된 그룹으로부터 선택되는 외인성 전구물질을 포함하는 배양 배지에서 상기 미생물을 배양하는 단계를 더 포함한다. 상기 외인성 전구물질은 상기 미생물로 능동적으로 흡수되고, 상기 외인성 전구물질은 시알일화 올리고사카리드를 생산하기 위한 시알일트란스퍼라제에 대한 수용체 기질이다.
부가의 일 양상에서, 본 발명에 따른 방법은 3시알일락토스 또는 6시알일락토스의 생산을 제공한다. 상기 방법에서, 상기 미생물은 탄소 기질, 예컨대 글루코스 또는 글리세롤에서 높은 세포 밀도로 배양되고, 락토스가 공급된다. 상기 락토스는 락토스 퍼미아제에 의해 내재되고, N-아세틸글루코사민으로부터 내인성으로 생성된 CMP- N-아세틸-뉴라미네이트를 사용하여 재조합 시알일트란스퍼라제에 의해 시알일화된다.
본 발명의 미생물 또는 세포는 주요 탄소원으로서 모노사카리드, 디사카리드, 올리고사카리드, 폴리사카리드, 폴리올, 복합 배지 또는 그의 혼합물에서 성장할 수 있다. 상기 용어 주요 (main)는 바이오매스 형성, 이산화탄소 및/또는 부산물 형성 (예컨대 산 및/또는 알콜, 예컨대 아세테이트, 락테이트, 및/또는 에탄올)을 위한 가장 중요한 탄소원을 의미하며, 즉 모든 요구되는 탄소의 20, 30, 40, 50, 60, 70, 75, 80, 85, 90, 95, 98, 99 %가 상기 언급된 탄소원으로부터 유래된다. 본 발명의 일 구현예에서, 상기 탄소원은 상기 생물체에 대한 유일한 탄소원이고, 즉 모든 요구되는 탄소의 100 %가 상기 언급된 탄소원으로부터 유래된다.
부가의 바람직한 구현예에서, 본 발명의 미생물 또는 세포는 WO2012/007481에 개시된 생산 경로 및 바이오매스 경로를 갖는 분할 대사작용 (split metabolism)을 사용하며, 이는 본원에 참고로 포함된다. 상기 생물체는, 예를 들어 포스포글루코이소머라제 유전자, 포스포프룩토키나제 유전자, 프룩토스-6-포스페이트 알돌라제 유전자, 프룩토스 이소머라제 유전자, 및/또는 프룩토스:PEP 포스포트란스퍼라제 유전자로부터 선택된 유전자를 변경하는, 유전적으로 변형되어 프룩토스-6-포스페이트를 축적할 수 있다.
용어 모노사카리드는 가수분해에 의해 더 간단한 당으로 분해가능하지 않은 당을 의미하며, 알도스 또는 케토스로 분류되며, 또한 분자당 하나 이상의 히드록실기를 포함한다. 예로는 글루코스, 프룩토스, 갈락토스, 만노스, 리보스 및/또는 아라비노스가 있다.
용어 디사카리드는 화학적으로 결합되어 있는 2개의 모노사카리드로 이루어진 당을 의미하다. 예로는 말토스, 수크로스, 락토스, 트레할로스, 셀로비오스 및/또는 키토비오스가 있다.
용어 올리고사카리드는 화학적으로 결합되어 있는 3개 내지 10개의 모노사카리드로 이루어진 당을 의미한다. 예로는 말토트리오스, 프룩토-올리고사카리드, 갈락토-올리고사카리드, 만난 올리고사카리드, 이소말토올리고사카리드, 인간 우유 올리고사카리드 및/또는 글루코올리고사카리드가 있다.
용어 폴리올은 다수의 히드록실기를 포함하는 알콜을 의미한다. 예를 들어 글리세롤, 소르비톨, 또는 만니톨.
용어 복합 배지는 정확한 구성이 결정되지 않은 배지를 의미한다. 예로는 당밀 (molasses), 옥수수 침지액 (corn steep liquor), 펩톤, 트립톤 또는 효모 추출물이 있다.
시알일화 화합물의 생산은 N-아세틸글루소사민, N-아세틸만노사민, 글루타민, 글루타메이트, 포스포에놀피루베이트 및/또는 피루베이트와 같은 전구물질을 배지에 첨가하여 증가될 수 있다.
상기에 기재된 바와 같이 본 발명의 방법에서 생산된 시알일화 화합물은 당 분야에 알려져 있는 다양한 방법, 또는 이의 조합을 사용하여 회수될 수 있다. 생산된 시알일화 화합물에 따라, 상기 화합물은 세포외 분획물로 이용가능하거나 또는 세포에 보유된다. 상기 생산된 시알일화 화합물이 세포내에 보유되는 경우, 상기 시알일화 화합물은 먼저 세포 파괴에 의해 세포로부터 분비될 것이다. 다시 생산된 시알일화 화합물에 따라, 상기 세포는 세포외 분획물로부터 분리될 수 있다. 다른 사례에서, 세포는 먼저 상기 세포외 분획물로부터 분리 없이 파괴되고, 상기 세포는 예컨대, 이에 한정되는 것은 아니지만, 가열, 동결 해동 및/또는 초음파에 의한 전단 스트레스, 혼합 및/또는 French 프레스와 같은 기술에 의해 파괴된다. 세포외 및/또는 세포내 분획물은 원심분리, 여과, 미세여과 (microfiltration) 및 나노여과 (nanofiltration)에 의해 세포 및/또는 세포 조직파편 (debris)으로부터 분리될 수 있다. 산물 분리를 돕기 위해 응집제 (flocculating agent)가 사용될 수 있다. 세포외 또는 세포내 분획물 중에 시알일화 화합물은 이온 교환, 한외- 또는 나노여과, 전기투석, 크로마토그래피 예컨대 크기 배제, 이온 크로마토그래피 및 모사 이동상 (simulated moving bed)에 의해 추출될 수 있다. 액체 상으로부터 시알일화 화합물을 여과하는 다른 예로는 면 및 활성탄 또는 탄소 필터를 구비한 딥 베드 필터를 사용한 여과에 의한 것이고, 여기서 상기 투과액이 카본 폴리셔 (carbon polisher) 그 다음에 예컨대 0.2 마이크론 미세여과 막 시스템을 통과한 후에, 색상, 미생물 및 현탁하는 탄소 입자를 제거하였다. 그 후에 상기 시알일화 화합물은 진공 증발기에서 농축되어 농축물을 수득할 수 있다. 상기 농축물은 침전 및/또는 열 건조, 분무 건조 및/또는 동결건조를 통해 건조되어 고순도의 시알일화 화합물을 수득할 수 있다. 그 다음에 무정형의 분말이 수득될 수 있다. 이러한 무정형 분말은 추가로 결정화되어 결정 시알일화 화합물을 수득할 수 있다.
예시되는 구현예에서, 시알일화 화합물은 발효 분야에 알려져 있는 방법을 사용하여 배양 배지로부터 단리될 수 있다. 예를 들어, 세포는 원심분리, 여과, 응집, 경사 (decantation) 등에 의해 배양 배지로부터 제거될 수 있다. 그 다음에, 상기 시알일화 화합물은 이온-교환과 같은 방법을 사용하여 세포외 분획물로부터 단리될 수 있다. 상기 시알일화 화합물의 추가의 정제가 예를 들어 나노여과 또는 한외여과 또는 이온 교환에 의해 수행되어 임의의 남아있는 DNA, 단백질, LPS (내독소) 또는 기타 불순물을 제거할 수 있다.
다른 예시되는 구현예에서, 시알일락토스는 발효 분야에 알려져 있는 방법을 사용하여 배양 배지로부터 단리될 수 있다. 예를 들어, 세포는 원심분리, 여과, 응집, 경사 등에 의해 배양 배지로부터 제거될 수 있다. 그 다음에, 상기 시알일락토스는 이온-교환과 같은 방법을 사용하여 세포외 분획물로부터 단리될 수 있다. 상기 시알일락토스의 추가의 정제는 예를 들어 나노여과 또는 한외여과 또는 이온 교환에 의해 수행되어 임의의 남아있는 DNA, 단백질, LPS (내독소), 또는 기타 불순물을 제거할 수 있다. 또 다른 정제 및 제제화 단계는 산물의 결정화 또는 침전에 의해 수행된다. 또 다른 제제화 단계는 시알일락토스를 분무 건조 또는 동결 건조하는 것이다.
상기 시알일화 화합물은 반대 이온, 예컨대 양성자, 나트륨 이온, 칼륨과 같은 1가 이온, 칼슘, 마그네슘, 철과 같은 2가 이온, 철과 같은 3가 이온, 또는 이온들의 조합을 포함할 수 있다.
본 개시내용의 개시내용에서, 용어 시알산, N-아세틸 뉴라미네이트 및 N-아세틸 뉴라민산은 상호교환 가능하게 사용된다.
본원에서 사용되는, 용어 세포내 또는 세포내에서, 예컨대 세포내 전환, 세포내 생산, 세포내 발현, 세포내 형성은 미생물 세포내를 의미하는 것으로 이해해야 한다. 용어 세포외는 세포 밖을 의미하는 것으로 이해해야 한다.
추가의 정의가 본 명세서에서 사용된다.
상동체(들)
단백질의 "상동체"는 문제의 변형되지 않은 단백질에 비해 아미노산 치환, 결실 및/또는 삽입을 가지며, 또한 이들이 유래되는 변형되지 않은 단백질과 유사한 생물학적 및 기능적 활성을 갖는 펩티드, 올리고펩티드, 폴리펩티드, 단백질 및 효소를 포함한다.
결실은 단백질로부터 하나 이상의 아미노산의 제거를 나타낸다.
삽입은 단백질에서 미리결정된 부위로 도입되는 하나 이상의 아미노산 잔기를 나타낸다. 삽입은 단일 또는 다수의 아미노산의 서열내 삽입뿐만 아니라 N-말단 및/또는 C-말단 융합을 포함할 수 있다. 일반적으로, 아미노산 서열 내로의 삽입은 약 1 내지 10개의 잔기 정도로, N- 또는 C-말단 융합보다 더 작을 것이다. N- 또는 C-말단 융합 단백질 또는 펩티드의 예로는 효모에서 사용되는 2-혼성체 시스템 (two-hybrid system), 파지 코트 단백질, (히스티딘)-6-태그, 글루타티온 S- 트란스퍼라제-태그, 단백질 A, 말토스-결합 단백질, 디히드로폴레이트 리덕타제 (reductase), 태그》100 에피토프, c-myc 에피토프, FLAG(R)-에피토프, lacZ, CMP (칼모듈린-결합 펩티드), HA 에피토프, 단백질 C 에피토프 및 VSV 에피토프와 같은 전사 활성인자의 결합 도메인 또는 활성화 도메인을 포함한다.
치환은 단백질 중 아미노산을 유사한 특성 (예컨대 유사한 소수성, 친수성, 항원성, a-나선 구조 또는 베타-시트 구조를 형성 또는 절단하는 경향)을 갖는 다른 아미노산으로 대체하는 것을 나타낸다. 아미노산 치환은 통상적으로 단일 잔기의 치환이고, 그러나 폴리펩티드 상에 놓인 기능적 제약에 따라 클러스트될 수 있고, 1 내지 10개의 아미노산 범위일 수 있으며; 삽입은 통상 약 1 내지 10개의 아미노산 잔기 정도일 것이다. 상기 아미노산 치환은 바람직하게 보존적 아미노산 치환이다. 보존적 치환 표는 당 분야에 잘 알려져 있다 (예를 들어 Creighton (1984) Proteins. W.H. Freeman and Company (Eds) 및 하기 표 1 참조)
Figure pat00001
아미노산 치환, 결실 및/또는 삽입은 당 분야에 잘 알려져 있는 펩티드 합성 기술, 예컨대 고체상 펩티드 합성 등을 사용하거나, 또는 재조합 DNA 조작에 의해 용이하게 수행될 수 있다. 단백질의 치환, 삽입 또는 결실 변이체를 생산하기 위한 DNA 서열의 조작 방법은 당 분야에 잘 알려져 있다. 예를 들어, DNA에서 미리결정된 부위에서 치환 돌연변이를 제조하는 기술은 당업자에게 잘 알려져 있고, M13 돌연변이유발 (mutagenesis), 17- Gen 인 비트로 돌연변이유발 (USB, Cleveland, OH), QuickChange 부위 지정 돌연변이유발 (Stratagene, San Diego, CA), PCR-매개된 부위-지정 돌연변이유발 또는 다른 부위-지정 돌연변이유발 프로토콜을 포함한다.
유도체
"유도체"는 자연-발생하는 형태의 단백질, 예컨대 관심있는 단백질의 아미노산 서열과 비교하여, 아미노산을 비-자연 발생하는 아미노산 잔기로 치환, 또는 비-자연 발생하는 아미노산 잔기의 부가를 포함할 수 있는 펩티드, 올리고펩티드, 폴리펩티드를 포함한다. 단백질의 "유도체"는 또한 자연-발생하는 형태의 폴리펩티드의 아미노산 서열과 비교하여 자연 발생적으로 변경된 (글리코실화, 아실화, 프레닐화 (prenylated), 포스포릴화, 미리스토일화 (myristoylated), 술페이트화 등) 또는 비-자연적으로 변경된 아미노산 잔기를 포함하는 펩티드, 올리고펩티드, 폴리펩티드를 포함한다. 유도체는 또한 유래되는 아미노산 서열과 비교하여 하나 이상의 비-아미노산 치환체 또는 부가, 예를 들어 아미노산 서열에 공유적 또는 비-공유적으로 결합된 리포터 분자 또는 다른 리간드, 예컨대 검출을 용이하게 하기 위해 결합된 리포터 분자, 및 자연-발생하는 단백질의 아미노산 서열에 비해 비-자연 발생하는 아미노산 잔기를 포함할 수 있다. 더욱이, "유도체"는 또한 자연-발생하는 형태의 단백질과 태그 펩티드 예컨대 FLAG, HIS6 또는 티오레독신 (thioredoxin)의 융합을 포함한다 (태그 펩티드 검토를 위해, Terpe, Appl. Microbiol. Biotechnol. 60, 523-533, 2003 참조).
오르토로그(들)/파라로그(들)
오르토로그 (orthologues) 및 파라로그 (paralogues)는 유전자의 조상 상관관계를 설명하는데 사용되는 진화적 개념을 포함한다. 파라로그는 조상 유전자의 중복을 통해 기원한 동일한 종내의 유전자이고; 오르토로그는 종 형성 (speciation)을 통해 기원한 상이한 생물체 유래의 유전자이고, 또한 공통 조상 유전자로부터 유래된다.
도메인, 모티프/컨센서스 서열/시그니쳐
용어 "도메인"은 진화적으로 관련된 단백질의 서열의 정렬과 함께 특정 위치에 보존된 아미노산 세트를 나타낸다. 다른 위치의 아미노산은 상동체 사이에서 다양할 수 있고, 특정 위치에서 고도로 보전된 아미노산은 단백질의 구조, 안정성 또는 기능에서 필수적인 아미노산을 나타낸다. 단백질 상동체 패밀리의 정렬된 서열에서 이들의 높은 보존도로 확인하여, 문제의 폴리펩티드가 이전에 확인된 폴리펩티드 패밀리에 속하는지를 결정하기 위해 이들은 식별자 (identifier)로서 사용될 수 있다.
용어 "모티프 또는 "컨센서스 서열" 또는 "시그니쳐"는 진화적으로 관련된 단백질의 서열에서 짧게 보존된 영역을 나타낸다. 모티프는 종종 고도로 보존된 도메인 부분이고, 또한 상기 도메인의 일부 만을 포함할 수 있거나, 또는 보존된 도메인 밖 (모티프의 아미노산 모두가 정의된 도메인 밖에 속하는 경우)에 위치할 수 있다.
도메인 확인을 위한 전문가 데이터베이스, 예를 들어, SMART (Schultz et al. (1998) Proc. Natl. Acad. Sci. USA 95, 5857-5864; Letunic et al. (2002) Nucleic Acids Res 30, 242-244), InterPro (Mulder et al., (2003) Nucl. Acids. Res. 31, 315-318), Prosite (Bucher and Bairoch (1994), A generalized profile syntax for biomolecular sequences motifs and its function in automatic sequence interpretation. (In) ISMB-94; Proceedings 2nd International Conference on Intelligent Systems for Molecular Biology. Altman R., Brutlag D., Karp P., Lathrop R., Searls D., Eds., pp53-61, AAAI Press, Menlo Park; Hulo et al., Nucl. Acids. Res. 32:D134-D137, (2004)), 또는 Pfam (Bateman et al., Nucleic Acids Research 30(1): 276-280 (2002))가 존재한다. 단백질 서열의 인 실리코 (in silico) 분석을 위한 툴 세트는 ExPASy proteomics 서버 (Swiss Institute of Bioinformatics (Gasteiger et al., ExPASy: the proteomics server for in-depth protein knowledge and analysis, Nucleic Acids Res. 31:3784-3788(2003))에서 이용가능하다. 도메인 또는 모티프는 통상적인 기술 예컨대 서열 정렬을 사용하여 확인될 수 있다.
서열 비교를 위한 정렬 방법은 당 분야에 잘 알려져 있고, 이러한 방법으로는 GAP, BESTFIT, BLAST, FASTA 및 TFASTA를 포함한다. GAP는 Needleman 및 Wunsch의 알고리즘 ((1970) J Mol Biol 48: 443-453)을 사용하여 매칭 수를 최대로 하고 갭의 수를 최소화하는 2개 서열의 글로벌 (즉 완전한 서열들을 스패닝 (spanning)하는) 정렬을 찾을 수 있다. BLAST 알고리즘 (Altschul et al. (1990) J Mol Biol 215: 403-10)은 서열 동일성 퍼센트를 산출하고, 2개 서열들 사이의 유사성의 통계적 분석을 수행한다. BLAST 분석을 수행하는 소프트웨어는 the National Centre for Biotechnology Information (NCBI)를 통해 공개적으로 이용가능하다. 상동체는 예를 들어, 디폴트 페어와이즈 정렬 파라미터 (default pairwise alignment parameters), 및 퍼센트의 스코어링 방법 (scoring method)을 구비하는 ClustalW 다중 서열 정렬 알고리즘 (버전 1.83)을 사용하여 용이하게 확인될 수 있다. 유사성 및 동일성의 글로벌 퍼센트는 MatGAT 소프트웨어 패키지 (Campanella et al., BMC Bioinformatics. 2003 Jul 10;4:29. MatGAT: 단백질 또는 DNA 서열을 사용하여 유사성/동일성 매트릭스를 생성하는 어플리케이션)에서 이용가능한 방법들 중 하나를 사용하여 결정될 수 있다. 당업자에게 명백할 수 있는 바와 같이, 보존된 모티프들 사이의 정렬을 최적화하기 위해 마이너 수동 편집 (Minor manual editing)을 수행할 수 있다. 부가로, 상동체 확인을 위해 전장 서열을 사용하는 대신에, 특정 도메인이 또한 사용될 수 있다. 서열 동일성 값은 디폴트 파라미터를 사용하는 전술한 프로그램을 사용하여, 전체 핵산 또는 아미노산 서열에 대해 또는 선택된 도메인 또는 보존된 모티프(들)에 대해 결정될 수 있다. 국소 정렬을 위해, Smith-Waterman 알고리즘이 특히 유용하다 (Smith TF, Waterman MS (1981) J. Mol. Biol 147(1);195-7).
상호간 BLAST (Reciprocal BLAST)
통상적으로, 이는 공개적으로 이용가능한 NCBI 데이터베이스와 같은 임의의 서열 데이터베이스에 대해 (예를 들어 하기 실시예 섹션의 표 A에 열거된 임의의 서열을 사용하여) 질의 서열 (query sequence)을 BLAST화 하는 것을 포함하는 제1 BLAST를 포함한다. BLASTN 또는 TBLASTX (표준 디폴트 값을 사용)는 일반적으로 뉴클레오티드 서열로부터 시작할 때 사용되고, BLASTP 또는 TBLASTN (표준 디폴트 값을 사용)은 단백질 서열로부터 시작할 때 사용된다. 상기 BLAST 결과는 선택적으로 필터될 수 있다. 그 다음에 상기 필터된 결과 또는 필터되지 않은 결과의 전장 서열은 질의 서열이 유래되는 생물체 유래의 서열에 대해 역 BLAST화 된다 (제2 BLAST). 그 다음에 상기 제1 및 제2 BLAST의 결과를 비교하였다. 제1 blast의 고-순위 적중이 질의 서열이 유래되는 것과 동일한 종으로부터 유래되고, 그 다음에 역 BLAST로 최대 적중 중 질의 서열을 이상적으로 유도하는 경우 파라로그로 확인되고; 제1 BLAST의 고-순위 적중이 질의 서열이 유래되는 것과 동일한 종으로부터 유래되지 않고, 바람직하게는 역 BLAST로 최고 적중 중 질의 서열을 유도하는 경우 오르토로그로 확인된다.
고-순위 적중은 낮은 E-값을 갖는 것이다. 상기 E-값이 낮아지면, 점수는 상당히 높아진다 (또는 즉 적중이 우연히 발견될 기회는 더 적어진다). E-값의 계산은 당 분야에 잘 알려져 있다. E-값 이외에, 비교는 동일성 퍼센트로 채점된다. 동일성 퍼센트는 2개의 비교되는 핵산 (또는 폴리펩티드) 서열 사이에서 특정 길이에 대해 동일한 뉴클레오티드 (또는 아미노산)의 수를 나타낸다. 큰 패밀리의 경우에, ClustalW, 그 다음에 계통수 (neighbour joining tree)를 사용하여, 관련된 유전자의 클러스터를 시각화하고, 오르토로그 및 파라로그를 확인하는데 도움을 줄 수 있다.
구조체
부가의 조절 요소는 전사뿐만 아니라 번역 인헨서 (enhancer)를 포함할 수 있다. 당업자는 본 발명을 수행하는데 사용하기에 적합할 수 있는 종결인자 및 인헨서 서열을 알 것이다. 또한 인트론 (intron) 서열은, 정의 섹션에서 기재된 바와 같이 5 비번역된 영역 (untranslated region: UTR)에 또는 코딩 서열 내에 첨가되어 시토솔에 축적되는 성숙한 메세지의 양을 증가시킬 수 있다. 다른 제어 서열 (프로모터, 인헨서, 사일렌서, 인트론 서열, 3UTR 및/또는 5UTR 영역 이외)은 단백질 및/또는 RNA 안정화 요소일 수 있다. 이러한 서열은 당업자에게 알려져 있거나 또는 당업자에 의해 용이하게 입수될 수 있다.
본 발명의 유전자 구조체는 특정 세포 타입에서 유지 및/또는 복제에 필요한 복제 서열의 기원을 더 포함할 수 있다. 일례로는 유전자 구조체가 에피솜 유전 요소 (예컨대 플라스미드 또는 코스미드 분자)로서 박테리아 세포내에 유지될 필요가 있는 경우이다.
본 발명의 방법에서 사용되는 핵산 서열의 성공적인 전달의 검출 및/또는 이러한 핵산을 포함하는 유전자이식 미생물의 선택을 위해, 마커 유전자 (또는 리포터 유전자)를 사용하는 것이 유익하다. 그러므로, 유전자 구조체는 선택적으로 선택가능한 마커 유전자를 포함할 수 있다. 상기 마커 유전자는 이들이 더 이상 필요하지 않다면 유전자이식 세포부터 제거 또는 삭제될 수 있다. 마커 제거 기술은 당분야에 알려져 있고, 유용한 기술은 상기 정의 섹션에 기재되어 있다.
조절 요소/제어 서열/프로모터
용어 "조절 요소", "제어 서열" 및 "프로모터"는 모두 본원에서 상호교환 가능하게 사용되고, 이들이 결찰되는 서열의 발현을 수행할 수 있는 조절 핵산 서열을 지칭하는 것으로 광의적으로 채택된다. 용어 "프로모터"는 통상적으로 유전자의 전사 개시로부터 상류에 위치하고, RNA 폴리머라제 및 기타 단백질을 인식 및 결합하여, 이로 인해 작동가능하게 연결된 핵산의 전사를 유도하는 것에 관여하는 핵산 제어 서열을 지칭한다. 전술한 용어는 고전적 진핵생물 게놈 유전자 유래의 전사 조절 서열 (CCAAT 박스 서열을 갖거나 또는 갖지 않는, 정확한 전사 개시를 위해 필요로 하는 TATA 박스를 포함) 및 전개 및/또는 외부 자극에 반응하거나, 또는 조직-특이적 방식으로 유전자 발현을 변경하는 부가의 조절 요소 (즉 상류 활성화 서열, 인헨서 및 사일렌서)를 포함한다. 또한, 상기 용어내에 고전적 원핵생물 유전자의 전사 조절 서열이 포함되고, 이 경우에는 -35 박스 서열 및/또는 -10 박스 전사 조절 서열을 포함할 수 있다. 용어 "조절 요소"는 또한 세포, 조직 또는 기관내에서 핵산 분자의 발현을 부여, 활성화 또는 증강시키는 합성 융합 분자 또는 유도체를 포함한다.
항시성 프로모터
"항시성 프로모터 (constitutive promoter)"는 적어도 하나의 세포, 조직 또는 기관내에서 성장 및 발전 단계 대부분, 그러나 반드시 전부는 아닌 기간 동안 및 대부분의 환경 조건하에 전사적으로 활성인 프로모터를 지칭한다.
유전자이식/이식유전자/재조합체
본 발명의 목적을 위해, "유전자이식", "이식유전자" 또는 "재조합체"는 예를 들어, 핵산 서열, 발현 카세트, 유전자 구조체 또는 핵산 서열을 포함하는 벡터 또는 본 발명에 따른 핵산 서열, 발현 카세트 또는 벡터로 형질전환된 생물체와 관련한 의미이고, 상기 모든 구조체는 재조합 방법에 의해 유도되고,
(a) 본 발명의 방법에 유용한 단백질을 코딩하는 핵산 서열, 또는
(b) 본 발명에 따른 핵산 서열과 작동가능하게 연결된 유전자 제어 서열(들), 예를 들어 프로모터, 또는
(c) 상기 a) 및 b)가 이들의 본래의 유전자 환경에 위치하지 않거나 또는 재조합 방법에 의해 변형되어지고, 예를 들어, 하나 이상의 뉴클레오티드 잔기의 치환, 부가, 결실, 역전 또는 삽입 형태의 변형이 가능하다. 상기 본래의 유전자 환경은 원 미생물에서 본래의 게놈 또는 크로모좀 유전자좌 또는 게놈 라이브러리의 존재를 의미하는 것으로 이해된다. 게놈 라이브러리의 경우에, 상기 핵산 서열의 본래의 유전자 환경은 바람직하게 적어도 일부 유지된다. 상기 환경은 상기 핵산 서열에 적어도 한쪽 면에 플랭크 (flank)되고, 적어도 50 bp, 바람직하게는 적어도 500 bp, 특히 바람직하게는 적어도 1000 bp, 가장 바람직하게는 적어도 5000 bp의 서열 길이를 갖는다. 자연 발생하는 발현 카세트 - 예를 들어 상기에 정의된 바와 같이, 본 발명의 방법에 유용한 폴리펩티드를 코딩하는 해당하는 핵산 서열과 상기 핵산 서열의 본래 프로모터의 자연 발생하는 조합 -은 상기 발현 카세트가 비-자연, 합성 ("인공") 방법, 가령 예를 들어, 돌연변이화 처리에 의해 변형되는 경우 유전자이식 발현 카세트가 된다. 적합한 방법은 예를 들어 US 5,565,350 또는 WO 00/15815에 기재되어 있다.
그러므로, 본 발명의 목적을 위한 유전자이식 미생물은 상기에서와 같이, 본 발명의 방법에 사용되는 핵산이 상기 미생물의 게놈에 존재하지 않거나 또는 이로부터 유래되지 않거나, 또는 상기 미생물의 게놈에 존재하지만 상기 미생물의 게놈에서 그의 본래의 유전자좌에 존재하지 않는 것을 의미하는 것으로 이해되고, 상기 핵산은 상동 또는 이종으로 발현될 수 있다. 그러나, 언급된 바와 같이, 유전자이식은 또한. 본 발명에 따른 또는 본 발명의 방법에서 사용되는 핵산이 미생물 게놈의 그의 본래 위치에 존재하고, 상기 서열은 본래 서열에 대해 변형되었고, 및/또는 상기 본래 서열의 조절 서열이 변형되어진 것을 의미한다. 유전자이식은 바람직하게 게놈의 본래 유전자좌가 아닌 위치에서 본 발명에 따른 핵산의 발현, 즉 핵산의 상동, 또는 바람직하게는 이종 발현이 일어나는 것을 의미하는 것으로 이해된다. 바람직한 유전자이식 미생물이 본원에 언급되어 있다.
본 발명의 문맥에서, 용어 "단리된 핵산" 또는 "단리된 폴리펩티드"는 일부 예에서 각각 "재조합 핵산" 또는 "재조합 폴리펩티드"와 동의어로 간주될 수 있고, 그의 본래의 유전자 환경에 위치하지 않고 및/또는 재조합 방법에 의해 변형되어진 핵산 또는 폴리펩티드를 지칭하는 것임을 유의해야 한다.
조정
용어 "조정 (modulation)"은 발현 또는 유전자 발현과 관련하여, 발현 수준이 대조군 미생물과 비교하여 상기 유전자 발현에 의해 변경되고, 상기 발현 수준은 증가 또는 감소될 수 있는 과정을 의미한다. 원래의, 비조정된 발현은 구조적 RNA (rRNA, tRNA) 또는 mRNA와 후속하는 번역과 관련된 모든 종류의 발현일 수 있다. 본 발명의 목적을 위해, 원래의 비조정된 발현은 또한 임의의 발현이 부재할 수 있다. 용어 "활성 조정"은 본 발명의 핵산 서열 또는 코딩된 단백질의 발현을 임의로 변경하여, 생산 수득율을 증가시키고 및/또는 미생물 성장을 증가시키는 것을 의미한다. 상기 발현은 0 (발현의 부재 또는 측정불가능)으로부터 소정의 양으로 증가할 수 있거나, 또는 소정의 양으로부터 측정불가능한 소량 또는 0으로 감소할 수 있다.
발현
용어 "발현" 또는 "유전자 발현"은 특정 유전자 또는 특정 유전자들 또는 특정 유전자 구조체의 전사를 의미한다. 용어 "발현" 또는 "유전자 발현"은 구체적으로 유전자 또는 유전자들 또는 유전자 구조체를 구조적 RNA (rRNA, tRNA) 또는mRNA가 단백질로의 후속하는 번역을 포함하거나 또는 포함하지 않는 mRNA의 전사를 의미한다. 상기 과정은 DNA의 전사 및 결과의 mRNA 산물의 프로세싱을 포함한다.
증가된 발현/과발현
본원에서 사용되는 용어 "증가된 발현" 또는 "과발현"은 원래의 야생형 발현 수준에 부가하는 발현의 임의의 형태를 의미한다. 본 발명의 목적을 위해, 원래의 야생형 발현 수준은 또한 0, 즉 발현의 부재 또는 측정불가능한 발현일 수 있다.
유전자 또는 유전자 산물의 발현을 증가시키는 방법은 당 분야에 잘 문서화되어 있고, 예를 들어, 적절한 프로모터, 전사 인헨서 또는 번역 인헨서의 사용에 의해 유도된 과발현을 포함한다. 프로모터 또는 인헨서 요소로 제공되는 단리된 핵산은 비-이종 형태의 폴리뉴클레오티드의 적절한 위치 (통상적으로 상류)에 도입되어 관심있는 폴리펩티드를 코딩하는 핵산의 발현을 상향조절할 수 있다. 예를 들어, 내인성 프로모터는 인 비보에서 돌연변이화, 결실 및/또는 치환에 의해 변경될 수 있고 (Kmiec, US 5,565,350; Zarling et al., W09322443 참조), 또는 단리된 프로모터는 본 발명의 유전자로부터의 적절한 배향 및 거리로 미생물 세포에 도입되어 상기 유전자의 발현을 조절할 수 있다.
폴리펩티드 발현를 원하는 경우, 일반적으로 폴리뉴클레오티드 코딩 영역의 3-말단에 폴리아데닐화 영역을 포함하는 것이 바람직하다. 상기 폴리아데닐화 영역은 본래의 유전자, 다양한 다른 미생물 유전자, 또는 T-DNA로부터 유래될 수 있다.
더욱이, 본 발명은 하기 특정 구현예에 관한 것이다:
1. 시알일화 화합물을 생산하는 방법으로서,
- 미생물을 배양 배지에서 배양하는 단계를 포함하고, 상기 배양 배지는 선택적으로 외인성 전구물질을 포함하며,
- 상기 미생물은 세포내에서 N-아세틸글루코사민-6-포스페이트를 N-아세틸글루코사민으로, 상기 N-아세틸글루코사민을 N-아세틸만노사민으로, 및 상기 N-아세틸만노사민을 N-아세틸-뉴라미네이트로 전환하고;
- 상기 미생물은 i) N-아세틸글루코사민-6-P를 글루코사민-6-P로 전환, ii) N-아세틸-글루코사민을 N-아세틸-글루코사민-6-P로 전환, 및 iii) N-아세틸-뉴라미네이트를 N-아세틸-만노사민으로 전환시킬 수 없는 것인 방법.
2. 구현예 1에 있어서,
i) 상기 N-아세틸글루코사민-6-포스페이트를 N-아세틸글루코사민으로의 전환은 세포내 발현된 포스파타제의 작용에 의해 수득되고,
ii) 상기 N-아세틸글루코사민을 N-아세틸만노사민으로의 전환은 세포내 발현된 N-아세틸만노사민 에피머라제에 의해 수행되며;
iii) 세포내 발현된 시알산 신타제는 상기 N-아세틸만노사민을 N-아세틸-뉴라미네이트로 전환시키는 것인 방법.
3. 구현예 1 또는 2에 있어서, 상기 생물체는 하기 효소인 i) N-아세틸글리코사민-6-포스페이트 데아세틸라제, ii) N-아세틸글루코사민 키나제, 및 iii) N-아세틸뉴라미네이트 알돌라제를 생산할 수 없는 것인 방법.
4. 구현예 1 내지 3 중 어느 하나에 있어서, 상기 모든 전환은 항시적으로 발현되는 유전자에 의해 코딩된 효소에 의해 촉매화되는 것인 방법.
5. 구현예 2에 있어서, 상기 포스파타제는 HAD 상위패밀리 또는 HAD-유사 포스파타제 패밀리로부터 선택되고, 바람직하게 상기 포스파타제는 하기를 포함하는 그룹으로부터 선택되는 것인 방법:i) 에스케리치아 콜리 유래의 유전자 yqaB, inhX, yniC, ybiV, yidA, ybjI, yigL 또는 cof에 의해 발현된 효소, ii) 블라스토클라디엘라 에머소니이의 포스파타제 및 iii) 기타 포스파타제 패밀리, 보다 바람직하게 상기 포스파타제는 청구항에서 정의된 바와 같은 HAD-유사 포스파타제 폴리펩티드인 것인 방법.
6. 구현예 2, 3, 4 또는 5 중 어느 하나에 있어서, 상기 N-아세틸만노사민-2-에피머라제는 i) 시아노박테리아, 보다 구체적으로 아카리오클로리스 마리나, 아나베나 바리아빌리스, 아나베나 마리나, 노스톡 펀크티포메, 아카리오클로리스 종, 아나베나 종, 노스톡 종 및 시네코시스티스 종 유래의 N-아세틸만노사민-2-에피머라제; ii) 박테로이데스 종, 보다 구체적으로 박테로이데스 오바투스, 박테로이데스 테타이오타오미크론, 캅노시토파가 카니모르수스모빌룬쿠스 물리에리스 유래의 N-아세틸만노사민-2-에피머라제; iii) 글리신 막스, 무스 무스쿨루스, 호모 사피엔스, 라투스 노르베기쿠스, 보스 타우루스, 수스 스크로파 또는 카니스 루푸스 유래의 N-아세틸-D-글루코스민-2-에피머라제를 포함하는 그룹으로부터 선택되는 것인 방법.
7. 구현예 2, 3, 4, 5 또는 6 중 어느 하나에 있어서, 상기 시알산 신타제는 스트렙토코쿠스 아갈라티에, 바실루스 서브틸리스, 레지오넬라 뉴모필라, 캄필로박터 제주니, 이디오마리나 로이히엔시스, 모리텔라 비스코사, 알리이비브리오 살모니시다, 에스케리치아 콜리, 메타노칼도코쿠스 잔나스키, 클로스트리디움 소르델리이, 부티리비브리오 프로테오클라스티쿠스, 미크로모나스 콤모다 또는 네이세리아 메닌기티스 유래의 시알산 신타제를 포함하는 그룹으로부터 선택되는 것인 방법.
8. 구현예 1 내지 7 중 어느 하나에 있어서, 상기 시알일화 화합물은 N-아세틸뉴람산, 시알일화 올리고사카리드, 시알일화 지질, 시알일화 단백질, 시알일화 아글리콘으로 구성된 그룹으로부터 선택되는 것인 방법.
9. 구현예 8에 있어서, 상기 시알일화 화합물은 시알일화 올리고사카리드인 것인 방법.
10. 구현예 9에 있어서, 상기 시알일화 올리고사카리드는 시알일락토스, 바람직하게는 3-SL 또는 6-SL 중 어느 하나인 것인 방법.
11. 구현예 9에 있어서, 상기 시알일화 올리고사카리드는 디시알일 락토-N-테트라오스인 것인 방법.
12. 구현예 8에 있어서, 상기 시알일화 화합물은 N-아세틸뉴라민산인 것인 방법.
13. 구현예 1 내지 10 중 어느 하나에 있어서, 상기 시알일화 화합물은 시알일화 락토-N-트리오스, 락토-N-테트라오스 또는 락토-N-네오테트라오스이고, 상기 미생물은 갈락토실트란스퍼라제 (EC 2.4.1.38)의 활성을 더 포함하고, 바람직하게 상기 갈락토실트란스퍼라제는 호모 사피엔스, 보스 타우루스, 무스 물라타, 갈루스 갈루스, 다니오 레리오, 헬리코박터 필로리헤모필루스 듀크레이를 포함하는 그룹으로부터 기원하며; 및/또는 상기 미생물은 N-아세틸글루코사미닐트란스퍼라제 (EC 2.4.1.90)의 활성을 포함하고, 바람직하게 상기 N-아세틸글루코사미닐트란스퍼라제는 보스 타우루스, 호모 사피엔스무스 무스쿨루스를 포함하는 그룹으로부터 기원하는 것인 방법.
14. 구현예 13에 있어서, 상기 미생물은 UDP 당 히드롤라제 및 갈락토스-1-포스페이트 우리딜일트란스퍼라제를 코딩하는 유전자를 발현할 수 없는 것인 방법.
15. 구현예 1 내지 14 중 어느 하나에 있어서, 상기 미생물은 시알일화 화합물보다 50%, 40%, 30%, 20%, 10%, 5%, 2% 미만의 세포외 N-아세틸글루코사민 및/또는 N-아세틸만노사민을 생산하고 및/또는 상기 미생물은 전체 탄수화물에 대해 50%, 60%, 70%, 80%, 90%, 95%, 98% 이상의 시알일화 화합물을 생산하는 것인 방법.
16. 시알일화 올리고사카리드를 생산하는 방법으로서,
a) 구현예 1 내지 7, 14 및 15 중 어느 하나의 방법에 따라 미생물을 배양하는 단계로서, 상기 미생물은 시알일트란스퍼라제에 대한 공여체 기질로서 내부적으로, 활성화된 N-아세틸뉴라미네이트를 생산하는 것인 단계; 및
b) 락토스, N-아세틸락토사민, 락토-N-비오스, 갈락토스, 베타-갈락토시드, 및 알파-갈락토시드 예컨대 이에 한정되는 것은 아니지만, 글로보트리오스 (Gal-알파-1,4Gal-베타-1,4Glc)갈락토스로 구성된 그룹으로부터 선택된 외인성 전구물질을 포함하는 배양 배지에서 상기 미생물을 배양하는 단계로서, 상기 미생물로 상기 외인성 전구물질의 능동 흡수가 일어나고, 상기 외인성 전구물질은 시알일화 올리고사카리드를 생산하기 위한 상기 시알일트란스퍼라제에 대한 수용체 기질인 것인 단계;를 포함하는 방법.
17. 구현예 2에 있어서, 상기 포스파타제, N-아세틸만노사민 에피머라제 및 시알산 신타제 중 임의의 하나 이상이 상기 미생물에서 과발현되는 것인 방법.
18. 구현예 2에 있어서, 상기 포스파타제, N-아세틸만노사민 에피머라제 및 시알산 신타제 중 임의의 하나 이상이 상기 미생물에 도입 및 발현되는 것인 방법.
19. 구현예 3에 있어서, 상기 미생물은 하기 효소인 i) N-아세틸글리코사민-6-포스페이트 데아세틸라제, ii) N-아세틸글루코사민 키나제, 및 iii) N-아세틸뉴라미네이트 알돌라제를 코딩하는 유전자가 결여되어 있는 것인 방법.
20. 구현예 3에 있어서, 상기 미생물에서, 하기 효소인 i) N-아세틸글리코사민-6-포스페이트 데아세틸라제, ii) N-아세틸글루코사민 키나제, 및 iii) N-아세틸뉴라미네이트 알돌라제를 코딩하는 유전자는 활성이 감소되고, 바람직하게 상기 유전자는 결실 또는 녹아웃된 것인 방법.
21. 구현예 1 내지 20 중 어느 하나에 있어서, 상기 미생물은 락토스 흡수를 촉진하고, 락토스를 대사작용하는 효소가 결여되어 있는 단백질을 더 코딩하는 것인 방법.
22. 구현예 1 내지 21 중 어느 하나에 있어서, 상기 미생물은 박테리아, 바람직하게는 에스케리치아 콜리 균주, 보다 바람직하게는 에스케리치아 콜리 균주인 K12 균주, 보다 더 바람직하게는 에스케리치아 콜리 K12 균주인 에스케리치아 콜리 MG1655인 것인 방법.
23. 구현예 1 내지 21 중 어느 하나에 있어서, 상기 미생물은 효모인 것인 방법.
24. 구현예 1 내지 23 중 어느 하나에 있어서, 상기 외인성 전구물질은 락토스, 갈락토스, 베타-갈락토시드, 및 알파-갈락토시드, 예컨대 글로보트리오스 (Gal-알파-1,4Gal-베타-1,4Glc)를 포함하는 그룹으로부터 선택되는 것인 방법.
25. 시알일화 화합물의 생산을 위한 미생물로서, 상기 미생물은
- N-아세틸글루코사민-6-포스페이트를 N-아세틸글루코사민으로, 상기 N-아세틸글루코사민을 N-아세틸만노사민으로 및 상기 N-아세틸만노사민을 N-아세틸-뉴라미네이트로 세포내에서 전환시키고;
- i) N-아세틸글루코사민-6-P를 글루코사민-6-P로 전환, ii) N-아세틸-글루코사민을 N-아세틸-글루코사민-6-P로 전환, 및 iii) N-아세틸-뉴라미네이트를 N-아세틸-만노사민으로 전환시킬 수 없는 것인 미생물.
26. 시알일화 화합물의 생산을 위한 미생물로서, 상기 미생물은 구현예 2 내지 24 중 어느 하나에 정의된 것인 미생물.
27. 전구물질로서 락토스 및 구현예 25 또는 26의 미생물을 포함하는 세포 배양 배지.
28. 구현예 1 내지 24 중 하나에 있어서, 3시알일락토스 또는 6시알일락토스를 생산하기 위해, 상기 미생물은 탄소 기질, 예컨대 글루코스 또는 글리세롤에서 높은 세포 밀도로 재배되고, 락토스가 공급되어, 락토스 퍼미아제에 의해 내재되며 N-아세틸글루코사민으로부터 내인성으로 생성되는 CMP- N-아세틸-뉴라미네이트를 사용하여 상기 재조합 시알일트란스퍼라제에 의해 시알일화되는 것인 방법.
29. 구현예 1 내지 24 중 어느 하나에 있어서, 상기 시알일화 화합물은 상기 배양 배지로부터 원심분리, 여과, 미세여과, 한외여과, 나노여과, 이온 교환, 전기투석, 크로마토그래피, 모사 이동상, 증발, 침전, 결정화, 동결건조 및/또는 분무 건조의 그룹으로부터 선택된 유닛 작동에 의해 단리되는 것인 방법.
30. 구현예 1 내지 24 중 어느 하나에 기재된 방법에 따라 생산되는 시알일화 화합물로서, 상기 시알일화 화합물은 원심분리 및/또는 여과, 이온-교환, 증발 또는 나노여과를 통한 농축, 결정화 또는 분무건조 또는 동결건조를 통한 제제화에 의해 정제되는 것인 시알일화 화합물.
31. 구현예 1 내지 24 중 어느 하나에 기재된 방법에 따라 생산되는 시알일화 화합물로서, 상기 시알일화 화합물은 식품 제제, 사료 제제, 의약품 제제, 화장료 제제, 또는 농화학 제제에 첨가되는 것인 시알일화 화합물.
32. 구현예 1 내지 24 중 어느 하나에 있어서, 상기 배양 배지는 하기 중 임의의 하나 이상을 포함하는 것인 방법: 주 탄소원으로서 모노사카리드, 디사카리드, 올리고사카리드, 폴리사카리드, 폴리올, 복합 배지.
33. 구현예 32에 있어서, 상기 주 탄소원은 상기 미생물 성장을 위해 모든 요구되는 탄소의 적어도 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 100%를 제공하는 것인 방법.
34. 구현예 32에 있어서, 상기 모노사카리드는 글루코스, 프룩토스, 갈락토스, 만노스, 리보스 또는 아라비노스를 포함하는 그룹으로부터 선택되는 것인 방법.
35. 구현예 32에 있어서, 상기 디사카리드는 말토스, 수크로스, 락토스, 트레할로스, 셀로비오스 또는 키토비오스를 포함하는 그룹으로부터 선택되는 것인 방법.
36. 구현예 32에 있어서, 상기 올리고사카리드는 말토트리오스, 프룩토-올리고사카리드, 갈락토-올리고사카리드, 만난 올리고사카리드, 이소말토올리고사카리드 또는 글루코올리고사카리드를 포함하는 그룹으로부터 선택되는 것인 방법.
37. 구현예 32에 있어서, 상기 폴리올은 글리세롤을 포함하는 그룹으로부터 선택되는 것인 방법.
38. 구현예 32에 있어서, 상기 복합 배지는 당밀, 옥수수 침지액, 펩톤, 트립톤 또는 효모 추출물을 포함하는 그룹으로부터 선택되는 것인 방법.
바람직한 양상에서, 본 발명은 하기 바람직한 특정 구현예에 관한 것이다:
1. 미생물에서 시알일화 화합물을 생산하는 방법으로서,
- 미생물을 배양 배지에서 배양하는 단계로서, 상기 배양 배지는 선택적으로 외인성 전구물질을 포함하고,
상기 미생물은 포스파타제를 코딩하는 적어도 하나의 핵산, N-아세틸만노사민 에피머라제를 코딩하는 적어도 하나의 핵산; 및 시알산 신타제를 코딩하는 적어도 하나의 핵산을 포함하며,
상기 미생물은 i) N-아세틸글루코사민-6-P를 글루코사민-6-P로 전환, ii) N-아세틸-글루코사민을 N-아세틸-글루코사민-6-P로 전환, 및 iii) N-아세틸-뉴라미네이트를 N-아세틸-만노사민으로 전환시킬 수 없는 것인 단계; 및
- 상기 미생물에서 HAD-유사 포스파타제 폴리펩티드를 코딩하는 핵산의 발현을 조정하는 단계로서, 상기 HAD-유사 포스파타제 폴리펩티드는:
- 하기 모티프들 중 적어도 하나:
모티프 1: hDxDx[TV] (서열번호: 73), 또는
모티프 2: [GSTDE][DSEN]x(1-2)[hP] x(1-2) [DGTS] (서열번호: 74, 75, 76, 77)
상기 h는 소수성 아미노산 (A, I, L, M, F, V, P, G)을 의미하고, x는 임의의 별개의 아미노산일 수 있음;
- 또는 상기 폴리펩티드에 대해 적어도 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 또는 99 %의 전체 서열 동일성을 갖는 서열번호: 43, 44, 45, 47, 48, 50, 51, 52, 54, 55 또는 57 중 어느 하나의 상동체 또는 유도체를 포함하는 것인 단계;를 포함하는 방법.
2. 바람직한 구현예 1에 있어서, 상기 HAD-유사 폴리펩티드는 서열번호: 43, 44, 45, 47, 48, 50, 51, 52, 54, 55, 57 중 어느 하나를 포함하는 것인 방법.
3. 바람직한 구현예 1에 있어서, 상기 조정된 발현은 HAD-유사 폴리펩티드를 코딩하는 핵산을 미생물에 도입 및 발현시켜서 수행되는 것인 방법.
4. 바람직한 구현예 1에 있어서, 상기 조정된 발현은 항시성 프로모터의 작용에 의해 수행되는 것인 방법.
5. 바람직한 구현예 1 내지 4 중 어느 하나에 있어서, 상기 시알일화 화합물은 N-아세틸뉴람산, 시알일화 올리고사카리드, 시알일화 지질, 시알일화 단백질, 시알일화 아글리콘으로 구성된 그룹으로부터 선택되는 것인 방법.
6. 바람직한 구현예 5에 있어서, 상기 시알일화 화합물은 시알일화 올리고사카리드인 것인 방법.
7. 바람직한 구현예 8에 있어서, 상기 시알일화 올리고사카리드는 시알일락토스인 것인 방법.
8. 바람직한 구현예 8에 있어서, 상기 시알일화 올리고사카리드는 디시알일 락토-N-테트라오스인 것인 방법.
9. 바람직한 구현예 7에 있어서, 상기 시알일화 화합물은 N-아세틸뉴라민산인 것인 방법.
10. 바람직한 구현예 1 내지 9 중 어느 하나에 있어서, 상기 시알일화 화합물은 시알일화 락토-N-트리오스, 락토-N-테트라오스 또는 락토-N-네오테트라오스이고, 상기 미생물은 갈락토실트란스퍼라제 (EC 2.4.1.38)의 활성을 더 포함하고, 바람직하게 상기 갈락토실트란스퍼라제는 호모 사피엔스, 보스 타우루스, 무스 물라타, 갈루스 갈루스, 다니오 레리오, 헬리코박터 필로리헤모필루스 듀크레이를 포함하는 그룹으로부터 기원하며; 및/또는 상기 미생물은 N-아세틸글루코사미닐트란스퍼라제 (EC 2.4.1.90)의 활성을 포함하고, 바람직하게 상기 N-아세틸글루코사미닐트란스퍼라제는 보스 타우루스, 호모 사피엔스무스 무스쿨루스를 포함하는 그룹으로부터 기원하는 것인 방법.
11. 바람직한 구현예 12에 있어서, 상기 미생물은 UDP 당 히드롤라제 및 갈락토스-1-포스페이트 우리딜일트란스퍼라제를 코딩하는 유전자를 발현할 수 없는 것인 방법.
12. 바람직한 구현예 1 내지 13 중 어느 하나에 있어서, 상기 미생물은 시알일화 화합물보다 50%, 40%, 30%, 20%, 10%, 5%, 2% 미만의 세포외 N-아세틸글루코사민 및/또는 N-아세틸만노사민을 생산하고 및/또는 상기 미생물은 전체 탄수화물에 대해 50%, 60%, 70%, 80%, 90%, 95%, 98% 이상의 시알일화 화합물을 생산하는 것인 방법.
13. 시알일화 올리고사카리드를 생산하는 방법으로서,
a) 바람직한 구현예 1 내지 12 중 어느 하나의 방법에 따라 미생물을 배양하는 단계로서, 상기 미생물은 시알일트란스퍼라제에 대한 공여체 기질로서 내부적으로, 활성화된 N-아세틸뉴라미네이트를 생산하는 것인 단계; 및
b) 락토스, N-아세틸락토사민, 락토-N-비오스, 갈락토스, 베타-갈락토시드, 및 알파-갈락토시드 예컨대 이에 한정되는 것은 아니지만, 글로보트리오스 (Gal-알파-1,4Gal-베타-1,4Glc)갈락토스로 구성된 그룹으로부터 선택된 외인성 전구물질을 포함하는 배양 배지에서 상기 미생물을 배양하는 단계로서, 상기 미생물로 상기 외인성 전구물질의 능동 흡수가 일어나고, 상기 외인성 전구물질은 시알일화 올리고사카리드를 생산하기 위한 상기 시알일트란스퍼라제에 대한 수용체 기질인 것인 단계;를 포함하는 방법.
14. 바람직한 구현예 1에 있어서, 상기 N-아세틸만노사민 에피머라제 및 시알산 신타제 중 임의의 하나 이상이 상기 미생물에서 과발현되는 것인 방법.
15. 바람직한 구현예 1에 있어서, 상기 N-아세틸만노사민 에피머라제 및 시알산 신타제 중 임의의 하나 이상이 상기 미생물에 도입 및 발현되는 것인 방법.
16. 바람직한 구현예 1에 있어서, 상기 미생물은 하기 효소인 i) N-아세틸글리코사민-6-포스페이트 데아세틸라제, ii) N-아세틸글루코사민 키나제, 및 iii) N-아세틸뉴라미네이트 알돌라제를 코딩하는 유전자가 결여되어 있는 것인 방법.
17. 바람직한 구현예 1에 있어서, 상기 미생물에서 하기 효소인 i) N-아세틸글리코사민-6-포스페이트 데아세틸라제, ii) N-아세틸글루코사민 키나제, 및 iii) N-아세틸뉴라미네이트 알돌라제를 코딩하는 유전자는 활성이 감소되고, 바람직하게 상기 유전자는 결실 또는 녹아웃되어 있는 것인 방법.
18. 바람직한 구현예 1 내지 17 중 어느 하나에 있어서, 상기 미생물은 락토스 흡수를 촉진하고 락토스를 대사작용하는 효소가 결여되어 있는 단백질을 더 코딩하는 것인 방법.
19. 바람직한 구현예 1 내지 18 중 어느 하나에 있어서, 상기 미생물은 박테리아, 바람직하게는 에스케리치아 콜리 균주, 보다 바람직하게는 에스케리치아 콜리 균주인 K12 균주, 보다 더 바람직하게는 에스케리치아 콜리 K12 균주인 에스케리치아 콜리 MG1655인 것인 방법.
20. 바람직한 구현예 1 내지 18 중 어느 하나에 있어서, 상기 미생물은 효모인 것인 방법.
21. 바람직한 구현예 1 내지 20 중 어느 하나에 있어서, 상기 외인성 전구물질은 락토스, 갈락토스, 베타-갈락토시드, 및 알파-갈락토시드, 예컨대 글로보트리오스 (Gal-알파-1,4Gal-베타-1,4Glc)를 포함하는 그룹으로부터 선택되는 것인 방법.
22. 청구항 1 내지 21 중 어느 하나에 따른 방법에 의해 수득가능한 미생물로서, 상기 미생물은 HAD-유사 폴리펩티드를 코딩하는 재조합 핵산을 포함하는 것인 미생물.
23. 시알일화 화합물의 생산을 위한 미생물로서, 상기 미생물은 포스파타제를 코딩하는 적어도 하나의 핵산, N-아세틸만노사민 에피머라제를 코딩하는 적어도 하나의 핵산; 및 시알산 신타제를 코딩하는 적어도 하나의 핵산을 포함하고, 상기 미생물은 i) N-아세틸글루코사민-6-P를 글루코사민-6-P로 전환, ii) N-아세틸-글루코사민을 N-아세틸-글루코사민-6-P로 전환, 및 iii) N-아세틸-뉴라미네이트를 N-아세틸-만노사민으로 전환시킬 수 없고; 상기 미생물은 바람직한 구현예 1에서 정의된 바와 같은 HAD-유사 포스파타제 폴리펩티드를 코딩하는 핵산의 조정된 발현을 포함하는 것을 특징으로 하는 미생물.
24. 하기를 포함하는 구조체:
(i) 바람직한 구현예 1 또는 2에 정의된 바와 같은 HAD-유사 폴리펩티드를 코딩하는 핵산;
(ii) 상기 (i)의 핵산 서열의 발현을 유도할 수 있는 하나 이상의 제어 서열; 및 선택적으로
(iii) 전사 종결 서열.
25. 바람직한 구현예 24에 있어서, 상기 제어 서열 중 하나는 항시성 프로모터인 것인 구조체.
26. 시알일화 화합물을 생산하는 방법에 있어서 바람직한 구현예 24 또는 25에 따른 구조체의 용도.
27. 바람직한 구현예 1 내지 21 중 어느 하나에 기재된 방법에 따라 생산된 시알일화 화합물로서, 상기 시알일화 화합물은 식품 제제, 사료 제제, 의약품 제제, 화장료 제제, 또는 농화학 제제에 첨가되는 것인 시알일화 화합물.
28. 시알일화 화합물의 생산을 위한 미생물로서, 상기 미생물은 구현예 2 내지 21 중 어느 하나에 정의된 것인 미생물.
29. 전구물질로서 락토스 및 구현예 22, 23 또는 28 중 어느 하나의 미생물을 포함하는 세포 배양 배지.
30. 구현예 1 내지 21 중 하나에 있어서, 3시알일락토스 또는 6시알일락토스를 생산하기 위해, 상기 미생물은 탄소 기질, 예컨대 글루코스 또는 글리세롤 또는 수크로스에 대해 높은 세포 밀도로 재배되고, 락토스가 공급되어, 락토스 퍼미아제에 의해 내재되고 N-아세틸글루코사민으로부터 내인성으로 생성된 CMP- N-아세틸-뉴라미네이트를 사용하여 상기 재조합 시알일트란스퍼라제에 의해 시알일화되는 것인 방법.
31. 구현예 1 내지 21 중 어느 하나에 있어서, 상기 시알일화 화합물은 상기 배양 배지로부터 원심분리, 여과, 미세여과, 한외여과, 나노여과, 이온 교환, 전기투석, 크로마토그래피, 모사 이동상, 증발, 침전, 결정화, 동결건조 및/또는 분무 건조의 그룹으로부터 선택된 유닛 작동에 의해 단리되는 것인 방법.
32. 구현예 1 내지 21 중 어느 하나에 기재된 방법에 따라 생산된 시알일화 화합물로서, 상기 시알일화 화합물은 원심분리 및/또는 여과, 이온-교환, 증발 또는 나노여과를 통한 농축, 결정화 또는 분무건조 또는 동결건조를 통한 제제화에 의해 정제되는 것인 시알일화 화합물.
33. 구현예 1 내지 21 중 어느 하나에 기재된 방법에 따라 생산된 시알일화 화합물로서, 상기 시알일화 화합물은 식품 제제, 사료 제제, 의약품 제제, 화장료 제제, 또는 농화학 제제에 첨가되는 것인 시알일화 화합물.
34. 구현예 1 내지 21 중 어느 하나에 있어서, 상기 배양 배지는 주 탄소원으로서 모노사카리드, 디사카리드, 올리고사카리드, 폴리사카리드, 폴리올, 복합 배지 중 어느 하나 이상을 포함하는 것인 방법.
35. 구현예 34에 있어서, 상기 주 탄소원은 상기 미생물 성장을 위해 모든 필요한 탄소의 적어도 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 100%를 제공하는 것인 방법.
36. 구현예 34에 있어서, 상기 모노사카리드는 글루코스, 프룩토스, 갈락토스, 만노스, 리보스 또는 아라비노스를 포함하는 그룹으로부터 선택되는 것인 방법.
37. 구현예 34에 있어서, 상기 디사카리드는 말토스, 수크로스, 락토스, 트레할로스, 셀로비오스 또는 키토비오스를 포함하는 그룹으로부터 선택되는 것인 방법.
38. 구현예 34에 있어서, 상기 올리고사카리드는 말토트리오스, 프룩토-올리고사카리드, 갈락토-올리고사카리드, 만난 올리고사카리드, 이소말토올리고사카리드 또는 글루코올리고사카리드를 포함하는 그룹으로부터 선택되는 것인 방법.
39. 구현예 34에 있어서, 상기 폴리올은 글리세롤을 포함하는 그룹으로부터 선택되는 것인 방법.
40. 구현예 34에 있어서, 상기 복합 배지는 당밀, 옥수수 침지액, 펩톤, 트립톤 또는 효모 추출물을 포함하는 그룹으로부터 선택되는 것인 방법.
하기 도면 및 실시예는 본 발명을 추가로 예시하고 명확하게 하기 위해 제공될 것이며, 본 발명을 한정하려는 것은 아니다.
도 1은 본 발명에 따른 시알산 생산을 위해 실시예 2에서 사용된 예시되는 경로를 보여준다. 도 1a는 모든 KO 및 과발현 신호가 없는 경로를 보여준다. 도 1b는 표시된 효소 다음에 상향 화살표로 십자형으로 표시된 녹아웃 및 과발현된 실시예 2에서 사용된 경로를 보여준다.
도 2는 실시예 2에 기재된 바와 같이 시알산을 생산할 수 있는 에스케리치아 콜리 균주의 생산 결과를 보여준다.
도 3은 본 발명의 방법으로 생산될 수 있는 상이한 시알일화 화합물의 예를 보여준다.
도 4는 표시된 포스파타제가 보충된 균주의 광학 밀도 및 시알산 생산을 보여준다.
도 5는 표시된 포스파타제가 보충된 균주의 성장율을 보여준다.
도 6은 실시예에서 테스트된 포스파타제의 정렬 부분을 나타낸다.
실시예 1: 물질 및 방법
방법 및 물질 에스케리치아 콜리
배지
3개의 상이한 배지, 즉 rich Luria 브로스 (Luria Broth: LB), 진탕 플라스크용 최소 배지 (minimal medium for shake flask: MMsf) 및 발효용 최소 배지 (minimal medium for fermentation: MMf)를 사용하였다. 최소 배지 모두는 미량 원소 믹스를 사용한다.
미량 원소 믹스는 3.6 g/L FeCl2.4H20, 5 g/L CaCl2.2H20, 1.3 g/L MnCl2.2H20, 0.38 g/L CuCl2.2H20, 0.5 g/L CoCl2.6H20, 0.94 g/L ZnCl2, 0.0311 g/L H3B04, 0.4 g/L Na2EDTA.2H20 및 1.01 g/L 티아민.HCl로 구성되었다. 몰리브데이트 (molybdate) 용액은 0.967 g/L Na2Mo04.2H20를 포함하였다. 셀레늄 용액은 42 g/L Se02를 포함하였다.
Luria 브로스 (LB) 배지는 1% 트립톤 펩톤 (Difco, Erembodegem, Belgium), 0.5 % 효모 추출물 (Difco) 및 0.5% 소듐 클로리드 (VWR, Leuven, Belgium)로 구성되었다.
Luria 브로스 아가 (Luria Broth agar: LBA) 플레이트는 LB 배지로 구성되었고, 12 g/L의 아가 (Difco, Erembodegem, Belgium)가 첨가되었다.
진탕 플라스크 실험용 최소 배지 (MMsf)는 2.00 g/L NH4Cl, 5.00 g/L (NH4)2S04, 2.993 g/L KH2P04, 7.315 g/L K2HP04, 8.372 g/L MOPS, 0.5 g/L NaCl, 0.5 g/L MgS04.7H20를 포함하였다. 이에 한정되는 것은 아니지만, 글루코스, 프룩토스, 말토스, 글리세롤 및 말토트리오스로부터 선택된 탄소원이 사용되었다. 상기 농도는 디폴트로 15 g/L이지만, 이는 실험에 따라 변경되었다. 1 mL/L 미량 원소 믹스, 100 μL/L 몰리브데이트 용액, 및 1 mL/L 셀레늄 용액. 상기 배지는 1M KOH에 의해 pH 7로 설정되었다. 실험에 따라, 락토스가 전구물질로서 첨가될 수 있다.
발효용 최소 배지는 6.75 g/L NH4Cl, 1.25 g/L (NH4)2S04, 1.15 g/L KH2P04 (저 포스페이트 배지) 또는 2.93 g/L KH2P04 및 7.31 g/L KH2P04 (고 포스페이트 배지), 0.5 g/L NaCl, 0.5 g/L MgS04.7H20, 탄소원으로서 이에 한정되는 것은 아니지만, 글루코스, 수크로스, 프룩토스, 말토스, 글리세롤 및 말토트리오스를 포함하는 탄소원, 1 mL/L 미량 원소 믹스, 100 μL/L 몰리브데이트 용액, 및 1 mL/L 셀레늄 용액을 상기에 기재된 것과 동일한 조성으로 포함하였다.
복합 배지, 예컨대 LB는 오토클레이브 (121 ℃, 21)에 의해 멸균되고, 최소 배지 (MMsf 및 MMf)는 여과 (0.22 μm Sartorius)에 의해 멸균되었다. 필요하다면, 상기 배지는 항생제 (예컨대 암피실린 (100mg/L), 클로람페니콜 (20 mg/L), 카르베니실린 (100mg/L), 스펙티노마이신 (40mg/L) 및/또는 카나마이신 (50mg/L))를 첨가하여 선택적으로 제조되었다.
균주
에스케리치아 콜리 MG1655 [lambda-, F-, rph-1]를 Coli Genetic Stock Center (US), CGSC Strain#: 7740 in March 2007로부터 입수하였다. 돌연변이체 균주는 Datsenko and Wanner (PNAS 97 (2000), 6640-6645)에 기재된 바와 같이, 동종 재조합을 사용하여 제작되었다.
플라스미드
pKD46 (Red 헬퍼 플라스미드, 암피실린 저항), pKD3 (FRT-플랭크된 클로람페니콜 저항 (cat) 유전자 포함), pKD4 (FRT-플랭크된 카나마이신 저항 (kan) 유전자 포함), 및 pCP20 (FLP 리콤비나제 (recombinase) 활성 발현) 플라스미드를 Prof. R. Cunin (Vrije Universiteit Brussel, Belgium in 2007)으로부터 입수하였다.
플라스미드 pCX-CjneuB는 Gibson 어젬블리 (assembly)를 사용하여 제작되었다. 유전자 CjneuB1은 Aerts 등 (Eng. Life Sci. 2011, 11, No. 1, 10-19)에 의해 기재된 바와 같이 발현 벡터를 사용하여 발현되었다.
플라스미드 pCX-CjneuB-NmneuA-Pdbst는 Gibson 어젬블리를 사용하여 제작되었다. 유전자 CjneuB1, NmneuAPdbst는 Aerts 등 (Eng. Life Sci. 2011, 11, No. 1, 10-19)에 의해 기재된 바와 같이 발현 벡터를 사용하여 발현되었다.
포스파타제 발현을 위한 플라스미드는 Golden Gate 어젬블리를 사용하여 제작되었다. 상기 포스파타제 (EcAphA, EcCof, EcHisB, EcOtsB, EcSurE, EcYaed, EcYcjU, EcYedP, EcYfbT, EcYidA, EcYigB, EcYihX, EcYniC, EcYqaB, EcYrbL 및 PsMupP)는 프로모터 apFAB87 및 apFAB346 및 UTRs 유전자10_SD2-junction_HisHA 및 UTR1 AATTCGCCGGAGGGATATTAAAAtgaatggaaaattgAAACATCTTAATCATGCTAAGGAGGTTTTCTAATG (서열번호: 41)을 사용하여 발현되었다. 모든 프로모터 및 UTR1을 제외한 UTR은 Mutalik 등 (Nat. Methods 2013, No. 10, 354-360)에 의해 개시되었다. 또한, 포스파타제 EcAppA, EcGph, EcSerB, EcNagD, EcYbhA, EcYbiV, EcYbjL, EcYfbR, EcYieH, EcYjgL, Ec YjjG, EcYrfG, EcYbiU, ScDOG1 및 BsAraL은 동일한 프로모터 및 UTR을 사용하여 발현되었다.
플라스미드 pBR322-NmneuB는 Golden Gate 어젬블리를 통해 pBR322 벡터를 사용하여 제작되었다. NmNeuB의 발현에 사용되는 프로모터 및 UTR은 프로모터 apFAB299 및 UTR galE_SD2-junction_BCD12이다. 플라스미드 pSC101-NmneuA-Pdbst는 Golden Gate 어젬블리를 통해 pSC101 벡터를 사용하여 제작되었다. NmneuA의 발현에 사용되는 프로모터 및 UTR은 프로모터 apFAB37 및 UTR galE_SD2-junction_BCD18이다. Pdbst의 발현에 사용되는 프로모터 및 UTR은 프로모터 apFAB339 및 UTR galE_SD2-junction_BCD12이다. 모든 프로모터 및 UTR은 Mutalik 등 (Nat. Methods 2013, No. 10, 354-360)에 의해 개시되었다.
플라스미드는 숙주 이. 콜리 DH5알파 (F-, phi80dlacZdeltaM15, delta(lacZYA-argF) U169, deoR, recA1, endA1, hsdR17(rk-, mk+), phoA, supE44, lambda-, thi-1, gyrA96, relA1)에서 유지되었다. Invitrogen으로부터 구입하였다.
유전자 파괴
유전자 파괴 (Gene disruption)뿐만 아니라 유전자 도입은 Datsenko 및 Wanner (PNAS 97 (2000), 6640-6645)에 의해 공개된 기술을 사용하여 수행되었다. 상기 기술은 lambda Red 리콤비나제에 의해 수행된 상동성 재조합 후에 항생제 선택에 기반한다. 후속하는 플립파제 리콤비나제 (flippase recombinase)의 촉매화로 최종 생산 균주에서 항생제 선택 카세트를 제거한다.
표 A에서, 유전자 파괴 카세트의 제작을 위해 필요한 프라이머가 열거되어 있다.
표 A: 표적 유전자에 대한 파괴 카세트를 제작하기 위한 프라이머 목록.
Figure pat00002
이전에 논의된 유전자 파괴에 사용된 것과 동일한 기술에 기반하여 생산 숙주 게놈으로 필요한 유전자의 게놈 통합을 위해, 상기 파괴 카세트에 대해 특정 변경을 갖는다. 상동성 부위와 파괴 카세트의 FRT 부위 사이에, 통합되는 구조체가 위치한다. 이는 상동성 부위에 의해 지시된 영역내에 구조체의 통합을 가능하게 한다.
이러한 워크플로우를 사용하면, 직접 유전자 파괴 및 게놈 통합이 가능하다. 특정 부위에 표적 통합을 위해 사용되는 프라이머가 표 B에 열거되어 있다.
표 B: 게놈 통합을 위해 사용된 프라이머.
Figure pat00003
온도 민감성 pKD46 헬퍼 플라스미드를 갖는 클론을 30 ℃에서 암피실린 (100 mg/L) 및 L-아라비노스 (10 mM)를 갖는 10 mL LB 배지에서 0.6의 OD600nm로 성장시켰다. 상기 세포를 순차적 세척으로, 한번은 50 mL, 및 한번은 1 mL의 빙냉 탈염수 세척에 의해 전기 적합성으로 만들었다. 다음에, 상기 세포를 50 μL의 빙냉수에 재현탁시켰다. 마지막으로, 10-100 ng의 파괴/통합 카세트를 전기천공 (electroporation)을 위해 세척된 세포 용액 50 μL에 첨가하였다. 전기천공법은 Gene Pulser (trademark of BioRad) (600 Ohm 25 μFD, 및 250 V)를 사용하여 수행되었다.
전기천공 후에, 세포를 37 ℃에서 1시간 동안 1 mL LB 배지에서 부활시켰고 (resuscitated), 마지막으로 항생제 저항 형질전환체를 선택하기 위해 25 mg/L의 클로람페니콜 또는 50 mg/L의 카나마이신을 포함하는 LB-아가 상에 플레이팅하였다. 선택된 돌연변이체는 변형된 영역의 상류 및 하류의 프라이머로 PCR에 의해 확인되었고, 후속하여 pKD46 헬퍼 플라스미드 소실을 위해 42 ℃에서 LB-아가에서 성장시켰다. 상기 돌연변이체는 마지막으로 암피실린 민감성에 대해 테스트되었다.
선택된 돌연변이체 (클로람페니콜 또는 카나마이신 저항)를 pCP20 플라스미드로 형질전환시켰고, 이는 온도-민감성 복제 및 FLP 합성의 열 유도를 보이는 암피실린 및 클로람페니콜 저항 플라스미드이다. 상기 암피실린-저항 형질전환체를 30 ℃에서 선택하였고, 그 후에 42 ℃의 LB에서 몇 개의 콜로니를 정제하였고, 그 다음에 모든 항생제 저항성 및 또한 FLP 헬퍼 플라스미드의 손실에 대해 테스트하였다. 유전자 파괴 및/또는 유전자 통합을 조절 프라이머로 확인하였고, 시퀀싱하였다. 상기 프라이머를 표 C에 열거하였다.
표 C: 특정 유전자 표적에 대한 유전자 파괴 및/또는 게놈 통합을 검증하기 위한 프라이머.
Figure pat00004
이종 및 동종 발현
플라스미드 또는 게놈으로부터 유래되는, 발현될 필요가 있는 유전자를 하기 회사들인 DNA2.0, Gen9 또는 IDT 중 하나에 의해 합성으로 합성하였다.
예컨대, 포스파타제와 같이 에스케리치아 콜리 네이티브 유전자를 이. 콜리 K-12 MG1655 게놈으로부터 선택하였다. 다른 유전자의 기원은 관련 표에 나타내었다.
코돈 사용을 발현 숙주의 코돈 사용으로 최적화하여 발현을 더 촉진시킬 수 있다. 유전자는 공급자의 툴을 사용하여 최적화되었다.
재배 조건
96웰 마이크로타이터 플레이트 (microtiter plate) 실험의 전배양 (preculture)을 175 μL의 LB 플레이트에서 단일 콜로니로부터 시작하였고, 800 rpm의 오비탈 진탕기 (orbital shaker)에서 37 ℃에서 8시간 동안 인큐베이트하였다. 이러한 배양물을, 300x로 희석시켜서, 175 μL MMsf 배지로, 96웰 마이크로타이터 플레이트용 접종물 (inoculum)로서 사용하였다. 상기 배양물을 다시 300x로 희석하여, 96웰 플레이트에서 최종 실험을 위한 전배양물로 사용하였다. 상기 96웰 플레이트는 175 μL의 배양물 부피를 갖는, 마이크로타이터 플레이트이거나 또는 3mL의 배양물 부피를 갖는 24웰 딥웰 (deepwell) 플레이트일 수 있다.
진탕 플라스크 실험을 위한 전배양물은 5 mL LB 배지에서 LB-플레이트 상에 단일 콜로니로부터 시작하였고, 200 rpm의 오비탈 진탕기에서 37 ℃에서 8시간 동안 인큐베이트하였다. 상기 배양물로부터, 1 mL을 500 mL 진탕 플라스크 내에 100 mL 최소 배지 (MMsf)로 옮겼고, 200 rpm의 오비탈 진탕기에서 37 ℃에서 인큐베이트하였다. 이러한 셋업을 진탕 플라스크 실험을 위해 사용하였다.
16시간 동안 성장시킨 진탕 플라스크 실험은 또한 생물반응기 (bioreactor)용 접종물로서 사용될 수 있다. 상기 세포 용액 중 4%를 MFCS 제어 소프트웨어 (Sartorius Stedim Biotech, Melsungen, Germany)에 의해 제어되는, 4 L 작업 부피를 갖는 2L Biostat Dcu-B를 접종하는 것이다. 배양 조건을 37 ℃, 800 rpm 교반, 및 1.5 L/min의 기체 유속으로 설정하였다. pH는 0.5 M H2S04 및 25% NH4OH를 사용하여 7로 조절하였다. 배출 기체를 냉각시켰다. 10%의 실리콘 소포제 용액을 발효 중에 거품이 올라오면 첨가하였다 (대략 10 6L). 모든 유전자가 항시적으로 발현되기 때문에 유도제의 사용은 필요하지 않다.
물질 및 방법 사카로미세스 세레비지에 ( Saccharomyces cerevisae )
배지
6.7 g/L 아미노산이 없는 효모 질소 베이스 (Yeast Nitrogen Base) (YNB w/o AA, Difco), 20 g/L 아가 (Difco) (고체 배양물), 22 g/L 글루코스 모노히드레이트 또는 20 g/L 락토스 및 0.79 g/L CSM 또는 0.77 g/L CSM-Ura (MP Biomedicals)를 포함하는 완전 보충 혼합물 (Complete Supplement Mixture) (SD CSM) 또는 CSM 드롭-아웃 (drop-out) (SD CSM-Ura)을 갖는 Synthetic Defined 효모 배지에서 균주를 성장시켰다.
균주
Bachmann 등 (Yeast (1998) 14:115-32)에 의해 형성된 사카로미세스 세레비지에 BY4742는 Euroscarf culture collection에서 입수가능하였다. 모든 돌연변이체 균주를 Gietz의 방법 (Yeast 11:355-360, 1995)을 사용하여 동종 재조합 또는 플라스미드 형질전환에 의해 형성되었다. 클루이베로미세스 마륵시아누스 락티스 (Kluyveromyces marxianus lactis)는 LMG culture collection (Ghent, Belgium)에서 입수가능하다.
플라스미드
효모 발현 플라스미드 p2a_2μ_sia_GFA1 (Chan 2013 (Plasmid 70 (2013) 2-17))을 사카로미세스 세레비지에에서 외래 유전자의 발현을 위해 사용하였다. 상기 플라스미드는 암피실린 저항 유전자 및 박테리아 복제 기원을 포함하여 이. 콜리에서 선택 및 유지되도록 한다. 상기 플라스미드는 효모에서 선택 및 유지를 위해 2μ 효모 ori 및 Ura3 선택 마커를 더 포함한다. 마지막으로, 상기 플라스미드는 베타-갈락토시다제 발현 카세트를 포함할 수 있다. 다음, 상기 플라스미드는 또한 N-아세틸글루코사민-2-에피머라제 (예를 들어 박테로이데스 오바투스 유래 (BoAGE)) 및 시알산 신타제 (예를 들어 캄필로박터 제주니 유래 (CjneuB))를 포함한다. 마지막으로, 이는 또한 사카로미세스 세레비지에 유래 프룩토스-6-P-아미노트란스퍼라제, ScGFA1을 포함한다.
효모 발현 플라스미드 p2a_2μ_sia_glmS는 p2a_2μ_sia에 기반하지만, 또한 glmS*54 (에스케리치아 콜리 유래의 프룩토스-6-P-아미노트란스퍼라제)가 발현되는 방식으로 변형된다.
효모 발현 플라스미드 p2a_2μ_sia_glmS_phospha는 p2a_2μ_sia_glmS에 기반하지만, 또한 EcAphA (서열번호: 42), EcCof (서열번호: 43), EcHisB (서열번호: 44), EcOtsB (서열번호: 45), EcSurE (서열번호: 46), EcYaed (서열번호: 47), EcYcjU (서열번호: 48), EcYedP (서열번호: 49), EcYfbT (서열번호: 50), EcYidA (서열번호: 51), EcYigB (서열번호: 52), EcYihX (서열번호: 53), EcYniC (서열번호: 54), EcYqaB (서열번호: 55), EcYrbL (서열번호: 56), PsMupP (서열번호: 57), EcAppA (서열번호: 58), EcGph (서열번호: 59), EcSerB (서열번호: 60), EcNagD (서열번호: 61), EcYbhA (서열번호: 62), EcYbiV (서열번호: 63), EcYbjL (서열번호: 64), EcYfbR (서열번호: 65), EcYieH (서열번호: 66), EcYjgL (서열번호: 67), Ec YjjG (서열번호: 68), EcYrfG (서열번호: 69), EcYbiU (서열번호: 70), ScDOG1 (서열번호: 71) 및 BsAraL (서열번호: 72)이 발현되는 방식으로 변형된다.
효모 발현 플라스미드 p2a_2μ_SL-glmS는 p2a_2μ_sia에 기반하지만, 또한 KlLAC12 (클루이베로미세스 락티스 유래의 락토스 퍼미아제), NmneuA (네이세리아 메닌기티데스 유래의 CMP-시알산 신타제) 및 Pdbst (포토박테리움 담셀라에 유래의 시알일트란스퍼라제)가 발현되는 방식으로 변형된다.
플라스미드는 숙주 이. 콜리 DH5알파 (F-, phi80dlacZdeltaM15, delta(lacZYA-argF)U169, deoR, recA1, endA1, hsdR17(rk-, mk+), phoA, supE44, lambda-, thi-1, gyrA96, relA1)에서 유지되었다. Invitrogen으로부터 구입하였다.
유전자 발현 프로모터
유전자는 Blazeck (Biotechnology and Bioengineering, Vol. 109, No. 11, 2012)에 개시된 바와 같이 합성 항시성 프로모터를 사용하여 발현되었다.
이종 및 동종 발현
플라스미드 또는 게놈 유래의 발현될 필요가 있는 유전자를 하기 회사인 DNA2.0, Gen9 또는 IDT 중 하나에 의해 합성으로 합성하였다.
코돈 사용을 발현 숙주의 코돈 사용으로 최적화하여 발현을 더 촉진시킬 수 있다. 유전자는 공급자의 툴을 사용하여 최적화되었다.
재배 조건
일반적으로, 효모 균주를 초기에 SD CSM 플레이트에서 성장시켜서 단일 콜로니를 수득하였다. 상기 플레이트를 30 ℃에서 2-3일 동안 성장시켰다.
단일 콜로니로부터 시작하여, 전배양물을 200rpm으로 진탕시키면서, 5 mL로 30 ℃에서 밤새 성장시켰다. 후속하여 500 mL 진탕 플라스크 실험은, 100 mL 배지 중에 2%의 상기 전배양물을 접종시켰다. 상기 진탕 플라스크를 30 ℃에서 200 rpm의 오비탈 진탕으로 인큐베이트하였다. 모든 유전자가 항시적으로 발현되기 때문에 유도제의 사용은 필요하지 않다.
물질 및 방법 바실루스 서브틸리스
배지
2개의 상이한 배지, 즉 rich Luria 브로스 (LB), 진탕 플라스크용 최소 배지 (MMsf)가 사용되었다. 상기 최소 배지는 미량 원소 믹스를 사용하였다.
미량 원소 믹스는 0.735 g/L CaCl2.2H20, 0.1 g/L MnCl2.2H20, 0.033 g/L CuCl2.2H20, 0.06 g/L CoCl2.6H20, 0.17 g/L ZnCl2, XX g/L H3B04, XX g/L Na2EDTA.2H20 및 0.06 g/L Na2Mo04로 구성되었다. Fe-시트레이트 용액은 0.135 g/L FeCl3.6H20, 1 g/L Na-시트레이트 (Hoch 1973 PMC1212887)를 포함하였다.
Luria 브로스 (LB) 배지는 1% 트립톤 펩톤 (Difco, Erembodegem, Belgium), 0.5% 효모 추출물 (Difco) 및 0.5% 소듐 클로리드 (VWR, Leuven, Belgium)로 구성되었다.
Luria 브로스 아가 (LBA) 플레이트는 12 g/L 아가 (Difco, Erembodegem, Belgium)가 첨가된, LB 배지로 구성되었다.
진탕 플라스크 실험용 최소 배지 (MMsf)는 2 g/L (NH4)2S04, 7.5 g/L KH2P04, 17.5 g/L K2HP04, 1.25 g/L Na-시트레이트, 0.25 g/L MgS04.7H20, 0.05g/L 트립토판, 10 내지 30 g/L 글루코스 또는 다른 탄소원으로서, 이에 한정되는 것은 아니지만 글루코스, 프룩토스, 말토스, 글리세롤 및 말토트리오스를 포함하는 탄소원, 10 mL/L 미량 원소 믹스, 및 10 mL/L Fe-시트레이트 용액을 포함하였다. 상기 배지는 1M KOH로 pH 7로 설정되었다.
복합 배지, 예컨대 LB는 오토클레이브 (121 ℃, 21)로 멸균되었고, 최소 배지 (MMsf)는 여과 (0.22 μm Sartorius)로 멸균되었다. 필요하다면, 상기 배지는 항생제 (예컨대 제오신 (20mg/L))를 첨가하여 선택적으로 제조하였다.
균주
바실루스 서브틸리스 168은 Bacillus Genetic Stock Center (Ohio, USA)에서 입수가능하다.
플라스미드 및 유전자 과발현
Cre/lox를 통한 유전자 결실용 플라스미드를 Yan 등 (Appl & environm microbial, sept 2008, p5556-5562)에 의해 개시된 바와 같이 제작하였다.
발현 벡터는 Mobitec (독일), 또는 ATCC (ATCC® number 87056)에서 찾을 수 있다. 유전자 BsglmS, ScGNA1CjneuB는 상기 발현 벡터에 클로닝되었다. 발현에 적합한 프로모터는 part repository (iGem)로부터 유래될 수 있다: 서열 id: BBa_K143012, BBa_K823000, BBa_K823002 또는 BBa_K823003. 클로닝은 Gibson 어젬블리, Golden Gate 어젬블리, Cliva 어젬블리, LCR 또는 제한 결찰을 사용하여 수행될 수 있다.
플라스미드는 숙주 이. 콜리 DH5알파 (F-, phi 80dlacZdeltaM15, delta(lacZYA-argF)U169, deoR, recA1, endA1, hsdR17(rk-, mk+), phoA, supE44, lambda-, thi-1, gyrA96, relA1)에서 유지되었다. Invitrogen으로부터 구입하였다.
유전자 파괴
Xue 등 (J. microb. Meth. 34 (1999) 183-191)에 기재된 바와 같이 전기천공을 통한 형질전환 및 선형 DNA에 의한 동종 재조합을 통해 유전자 파괴가 수행되었다. 유전자 녹아웃 방법은 Liu 등 (Metab. Engine. 24 (2014) 61-69)에 의해 개시되어 있다. 상기 방법은 표적 유전자의 상류 및 하류에 1000bp 상동체를 사용한다. 본 발명에서 사용되는 상동체는 표 D에 열거되어 있다. 변형 이후에, 상기 돌연변이체는 변형된 영역의 상류 및 하류의 프라이머를 사용하여 확인되었다. 상기 프라이머는 표 E에 제공되었다. 다음, 상기 변형은 시퀀싱에 의해 확인되었다 (LGC Genomics (LGC group, Germany)에서 수행됨).
표 D
Figure pat00005
Figure pat00006
Figure pat00007
표 E
Figure pat00008
이종 및 동종 발현
플라스미드 또는 게놈 유래의 발현될 필요가 있는 유전자는 하기 회사인 DNA2.0, Gen9 또는 IDT 중 하나에 의해 합성으로 합성되었다.
코돈 사용을 발현 숙주의 코돈 사용으로 최적화하여 발현을 더 촉진시킬 수 있다. 유전자는 공급자의 툴을 사용하여 최적화되었다.
재배 조건
5 mL LB 배지 중에, LB-플레이트 상에 단일 콜로니로부터의 전배양물을 200 rpm의 오비탈 진탕기에서 37 ℃에서 8시간 동안 인큐베이트하였다. 상기 배양물로부터, 1 mL을 500 mL 진탕 플라스크 중에 100 mL 최소 배지 (MMsf)로 옮겼고, 200 rpm의 오비탈 진탕기에서 37 ℃에서 인큐베이트하였다. 이러한 셋업을 진탕 플라스크 실험에 사용하였다. 모든 유전자가 항시성으로 발현되기 때문에 유도제의 사용은 필요하지 않다.
분석 방법
광학 밀도
상기 배양물의 세포 밀도는 600 nm에서 광학 밀도를 측정하여 자주 모니터링되었다 (Implen Nanophotometer NP80, Westburg, Belgium). 세포 건조 중량은 사전-건조되고 가중된 팔콘 (falcon)에서 20 g 반응기 브로스의 원심분리 (10 min, 5000 g, Legend X1R Thermo Scientific, Belgium)에 의해 수득되었다. 그 후에 펠렛을 20 mL 생리학적 용액 (9 g/L NaCl)으로 한번 세척하였고, 70 ℃에서 일정 중량으로 건조시켰다. OD6oonm 측정을 바이오매스 농도로 전환시키기 위해, 바이오매스 농도에 대한 OD6oonm의 상관관계 곡선을 만들었다.
세포 건조 중량의 측정
브로스 (broth) 시료로부터, 4 x 10 g을 원신분리 튜브로 옮겼고, 상기 세포를 회전 침강시켰고 (5000g, 4 ℃, 5분), 세포를 0.9% NaCl 용액으로 2번 세척하였다. 세포 펠렛을 포함하는 원심분리 튜브를 70 ℃ 오븐에서 48시간 동안 일정 중량이 될 때까지 건조시켰다. 세포 건조 중량은 중량측정법으로 수득되었고; 튜브는 칭량하기 전에 건조기 (desiccator)에서 냉각시켰다.
액체 크로마토그래피
탄수화물 예컨대, 이에 한정되는 것은 아니지만 글루코스, 프룩토스 및 락토스의 농도를, 이동상으로서 0.2% 트리에틸아민 (0.130 mL/min)을 갖는 75/25 아세토니트릴/물 용액을 사용하고, 35 ℃로 가열된 Acquity UPLC BEH 아미드, 130 Å, 1.7 μm, 2.1 mm x 50 mm를 사용하는, ELSD 검출기를 구비한 Waters Acquity UPLC H-클래스 시스템으로 결정하였다.
시알일락토스는 동일한 컬럼을 갖는, 동일한 기기에서 정량화되었다. 그러나, 용리액은 1% 포름산을 갖는 75/25 아세토니트릴/물 용액으로 변형시켰다. 유속은 0.130 mL/min으로 설정되었고, 컬럼 온도는 35 ℃로 하였다.
시알산은 REZEX ROA 컬럼 (300 x 7.8 mm ID)을 사용하는, 동일한 기기에서 정량화되었다. 상기 용리액은 수중 0.08% 아세트산이다. 유속은 0.5 mL/min으로 설정되었고, 컬럼 온도는 65 ℃로 설정되었다. GlcNAc 및 ManNAc는 또한 상기 방법을 사용하여 측정되었다.
성장율 측정
최대 성장율 (μMax)은 R package grofit를 사용하여 600nm에서 관찰된 광학 밀도에 기반하여 산출되었다.
실시예 2: 에스케리치아 콜리 에서 시알산의 생산
제1 예로 N-아세틸뉴라미네이트 (시알산)를 생산할 수 있는 에스케리치아 콜리 균주를 제공하였다 (도 1b 참조).
탄소원으로서 수크로스를 사용하여 글루코사민-6-포스페이트를 축적할 수 있는 균주를 N-아세틸뉴라미네이트를 생산할 수 있도록 추가로 조작하였다. 기본 균주는 비피도박테리움 아돌레센티스 (Bifidobacterium adolescentis) 유래의 수크로스 포스포릴라제 (BaSP), 지모모나스 모빌리스 (Zymomonas mobilis) 유래의 프룩토키나제 (Zmfrk), 돌연변이체 프룩토스-6-P-아미노트란스퍼라제 (EcglmS*54, Deng et al. (Biochimie 88, 419-429 (2006))에 개시된 바와 같음)를 과발현하였다. 유전자가 시알산을 생산하도록 하기 위해서, 오페론 nagABCDE, nanATEKmanXYZ를 파괴하였다. BaSPZmfrknagABCDE의 위치에 도입되었고, EcglmS*54nanATEK의 위치에 도입되었다. 이러한 변형은 실시예 1에 기재된 바와 같이 수행되었고, Datsenko & Wanner의 원리 (PNAS USA 97, 6640-6645 (2000))에 기반하였다.
상기 균주에서, 본 발명에 기재된 바와 같이 시알산을 생산하기 위한 생합성 경로는 사카로미세스 세레비지에 유래의 글루코사민-6-P-아미노트란스퍼라제 (ScGNA1), 박테로이데스 오바투스 유래의 N-아세틸글루코사민-2-에피머라제 (BoAGE) 및 캄필로박터 제주니 유래의 시알산 신타제 (CjneuB)를 과발현시켜서 수행되었다. ScGNA1BoAGE는 각각 nagABCDEmanXYZ 위치에서 발현되었다. CjneuB는 고 카피의 플라스미드 pCX-CjneuB를 사용하여 발현되었다.
상기 균주는 실시예 1 (물질 및 방법)에 기재된 바와 같이 배양되었다. 간단하게, 5mL LB 전배양물을 접종하였고, 37 ℃에서 밤새 성장시켰다. 상기 배양물은, 10g/L 수크로스를 포함하는 100mL 배지로 진탕 플라스크 실험에서 접종물로 사용되었고, 실시예 1에 기재된 바와 같이 제조되었다. 규칙적으로 시료를 채취하였고, 실시예 1에 기재된 바와 같이 분석하였다. 도 2에서 볼 수 있는 바와 같이, 바이오매스, 수크로스 및 시알산의 농도의 전개 (evolution)가 용이하게 따르고, 0.22g/L N-아세틸뉴라미네이트의 최종 농도가 세포외에서 생산되었다.
동일한 생물체는 또한 탄소원으로서 글루코스, 말토스 또는 글리세롤에 기반하여 N-아세틸뉴라미네이트를 생산하였다.
실시예 3: 에스케리치아 콜리 에서 6-시알일락토스의 생산
본 발명에 따른 다른 예는 6-시알일락토스의 생산을 위한 방법 및 균주의 사용이다.
실시예 3의 균주는 실시예 2에서 사용된 균주의 딸 (daughter) 균주이다. 상기 균주는 에스케리치아 콜리 유래의 락토스 퍼미아제 EclacY (본원에 참고로 포함되는 WO 2016/075243의 실시예 1에 기재되고 입증됨), 네이세리아 메닌기티데스 유래의 CMP-시알산 신테타제 (NmneuA) 및 포토박테리움 담셀라에 유래의 시알일트란스퍼라제 (Pdbst)를 과발현하여 추가로 변형되었다. 그 외에, lacZ가 파괴되었다.
유전자 NmneuA 및 Pdbst는 CjneuB와 함께 플라스미드로부터 발현되었다. 상기 플라스미드는 pCX-CjneuB-NmneuA-Pdbst이고, 실시예 1에 기재된 바와 같이 제조되었다.
상기 균주는 실시예 1에 기재된 바와 같이 5ml LB 배지로 구성된 전배양물로서 접종되었다. 그 후에 인큐베이터에서 37℃로 밤새 성장시켰다. 상기 전배양물의 1%를 탄소원으로서 10g/l 수크로스 및 전구물질로서 10 g/l 락토스를 포함하는 100ml 배지 (MMsf)를 포함하는 진탕 플라스크에 접종하였다. 상기 균주를 37℃에서 300시간 동안 성장시켰다.
상기 균주는 다량의 6-시알일락토스를 생산하였다.
실시예 4: 이종 프룩토스-6-P-아미노트란스퍼라제를 사용하여 사카로미세스 세레비지에 에서 시알산의 생산
다른 예로 본 발명을 위해 사카로미세스 세레비지에 형태의 진핵 생물체의 사용을 제공하였다. 본 발명의 경로를 이용하는 방법은 N-아세틸글루코사민-2-에피머라제 (예를 들어 박테로이데스 오바투스 유래 (BoAGE)) 및 시알산 신타제 (예를 들어 캄필로박터 제주니 유래 (CjneuB))를 도입 및 발현시킴으로써 사카로미세스 세레비지에에서 수득될 것이다.
출발점으로서, N-아세틸글루코사민-6-포스페이트에 대해 증가된 대사 플럭스 (metabolic flux)를 갖는 균주가 필요하다. 이는 에스케리치아 콜리 유래의 프룩토스-6-P-아미노트란스퍼라제 돌연변이체 (EcglmS*54)를 과발현시킴으로써 수득되었다.
본 발명에 따라 N-아세틸뉴라미네이트 생산 사카로미세스 세레비지에를 형성하기 위해, 상기 유전자는 2-미크론 플라스미드 (Chan 2013 (Plasmid 70 (2013) 2-17))를 통해 도입되었고, 상기 유전자는 실시예 1에 또한 기재된 바와 같이 합성 항시성 프로모터 (Blazeck 2012 (Biotechnology and Bioengineering, Vol. 109, No. 11))를 사용하여 발현되었다. 본 구현예에서 사용된 특정 플라스미드는 p2a_2μ_sia_glmS이다. 상기 플라스미드는 Gietz 및 Woods (2002, PMID 12073338)에 의해 개시된 형질전환 기술을 사용하여 사카로미세스 세레비지에로 도입되었고, 돌연변이체 균주가 수득되었다.
상기 균주는 프룩토스-6-포스페이트를 글루코사민-6-포스페이트로 전환하고, 그 후에 글루코사민-6-포스페이트를 N-아세틸글루코사민-6-포스페이트로 전환을 수행할 수 있다. 상기 N-아세틸글루코사민-6-포스페이트 모이어티는 N-아세틸글루코사민으로, 상기 N-아세틸글루코사민을 N-아세틸만노사민으로, 마지막으로 상기 N-아세틸만노사민을 N-아세틸뉴라미네이트로 전환시켰다.
상기 균주의 전배양물은 22 g/L 글루코스를 포함하는 합성 정의된 배지 SD-CSM 5mL 중에 제조되었고, 실시예 1에 기재된 바와 같이 30℃에서 성장시켰다. 상기 전배양물은 단독 탄소원으로서 10g/L 수크로스를 갖는 진탕 플라스크 중 100mL 배지에 접종되었고, 30℃에서 성장시켰다. 규칙적으로 시료를 채취하였고, N-아세틸뉴라미네이트의 생산은 실시예 1에 기재된 바와 같이 측정되었다. 상기 균주 및 방법으로 다량의 N-아세틸뉴라미네이트를 생산하였다.
동일한 생물체는 또한 탄소원으로서 글루코스, 말토스 또는 글리세롤에 기반하여 N-아세틸뉴라미네이트를 생산하였다.
실시예 5: 사카로미세스 세레비지에 에서 6-시알일락토스의 생산
다른 예로 본 발명을 위해 사카로미세스 세레비지에 형태의 진핵 생물체의 사용을 제공하였다. 본 발명의 경로를 이용하는 방법은 N-아세틸글루코사민-2-에피머라제 (예를 들어 박테로이데스 오바투스 유래 (BoAGE)) 및 시알산 신타제 (예를 들어 캄필로박터 제주니 유래 (CjneuB))를 도입 및 발현시킴으로써 사카로미세스 세레비지에에서 수득될 것이다.
그 외에, 6시알일락토스를 생산하기 위해 추가적 변형이 만들어졌다. 이러한 변형은 락토스 퍼미아제, CMP-시알산 신타제 및 시알일트란스퍼라제의 첨가를 포함한다. 상기 바람직한 락토스 퍼미아제는 클루이베로미세스 락티스 유래의 KlLAC12 유전자 (WO 2016/075243)이다. 바람직한 CMP-시알산 신타제 및 시알일트란스퍼라제는 실시예 3에 또한 기재된 바와 같이, 각각 네이세리아 메닌기티데스 유래의 NmneuA포토박테리움 담셀라에 유래의 Pdbst이다.
출발점으로서, N-아세틸글루코사민-6-포스페이트에 대해 증가된 대사 플럭스를 갖는 균주가 필요하다. 이는 에스케리치아 콜리 유래의 프룩토스-6-P-아미노트란스퍼라제 돌연변이체 (EcglmS*54)를 과발현시킴으로써 수득되었다.
본 발명에 따라 N-아세틸뉴라미네이트 생산 사카로미세스 세레비지에를 형성하기 위해, 상기 유전자는 2-미크론 플라스미드 (Chan 2013 (Plasmid 70 (2013) 2-17))를 통해 도입되었고, 상기 유전자는 실시예 1에 또한 기재된 바와 같이 합성 항시성 프로모터 (Blazeck 2012 (Biotechnology and Bioengineering, Vol. 109, No. 11))를 사용하여 발현되었다. 본 구현예에서 사용된 특정 플라스미드는 p2a_2μ_sia_glmS이다. 상기 플라스미드는 Gietz 및 Woods (2002)에 의해 개시된 형질전환 기술을 사용하여 사카로미세스 세레비지에로 도입되었고, 돌연변이체 균주가 수득되었다.
상기 균주는 프룩토스-6-포스페이트를 글루코사민-6-포스페이트로, 상기 글루코사민-6-포스페이트를 N-아세틸글루코사민-6-포스페이트로, 상기 N-아세틸글루코사민-6-포스페이트를 N-아세틸글루코사민으로, 상기 N-아세틸글루코사민을 N-아세틸만노사민으로, 마지막으로 상기 N-아세틸만노사민을 N-아세틸뉴라미네이트로 전환시킬 수 있다. 상기 N-아세틸만노사민은 그 후에 CMP-시알산으로 전환되고, 락토스로 전달되어 6시알일락토스를 수득하였다.
상기 균주의 전배양물은 22 g/L 글루코스를 포함하는 합성 정의된 배지 SD-CSM 5mL 중에 제조되었고, 실시예 1에 기재된 바와 같이 30℃에서 성장시켰다. 상기 전배양물은 단독 탄소원으로서 10g/L 수크로스를 갖는 진탕 플라스크 중 100mL 배지에 접종되었고, 30℃에서 성장시켰다. 규칙적으로 시료를 채취하였고, N-아세틸뉴라미네이트의 생산은 실시예 1에 기재된 바와 같이 측정되었다. 상기 균주 및 방법으로 다량의 6시알일락토스를 생산하였다.
동일한 생물체는 또한 탄소원으로서 글루코스, 말토스 또는 글리세롤에 기반하여 N-아세틸뉴라미네이트를 생산하였다.
실시예 6: 자가 프룩토스-6-P-아미노트란스퍼라제를 사용하여 사카로미세스 세레비지에 에서 시알산의 생산
다른 예로 본 발명을 위해 사카로미세스 세레비지에 형태의 진핵 생물체의 사용을 제공하였다. 본 발명의 경로를 이용하는 방법은 N-아세틸글루코사민-2-에피머라제 (예를 들어 박테로이데스 오바투스 유래 (BoAGE)) 및 시알산 신타제 (예를 들어 캄필로박터 제주니 유래 (CjneuB))를 도입 및 발현시킴으로써 사카로미세스 세레비지에에서 수득될 것이다.
출발점으로서, N-아세틸글루코사민-6-포스페이트에 대해 증가된 대사 플럭스를 갖는 균주가 필요하다. 이는 네이티브 프룩토스-6-P-아미노트란스퍼라제 ScGFA1을 과발현시킴으로써 수득되었다.
본 발명에 따라 N-아세틸뉴라미네이트 생성 사카로미세스 세레비지에를 형성하기 위해, 유전자는 2-미크론 플라스미드 (Chan 2013 (Plasmid 70 (2013) 2-17))를 통해 도입되었고, 상기 유전자는 실시예 1에 또한 기재된 바와 같이 합성 항시성 프로모터 (Blazeck 2012 (Biotechnology and Bioengineering, Vol. 109, No. 11))를 사용하여 발현되었다. 본 구현예에서 사용된 특정 플라스미드는 p2a_2μ_sia_GFA1이다. 상기 플라스미드는 Gietz 및 Woods (2002)에 의해 개시된 형질전환 기술을 사용하여 사카로미세스 세레비지에에 도입되었고, 돌연변이체 균주가 수득되었다.
상기 균주는 프룩토스-6-포스페이트를 글루코사민-6-포스페이트로, 상기 글루코사민-6-포스페이트를 N-아세틸글루코사민-6-포스페이트로, 상기 N-아세틸글루코사민-6-포스페이트를 N-아세틸글루코사민으로, 상기 N-아세틸글루코사민을 N-아세틸만노사민으로, 마지막으로 상기 N-아세틸만노사민을 N-아세틸뉴라미네이트로 전환시킬 수 있다.
상기 균주의 전배양물은 22 g/L 글루코스를 포함하는 합성 정의된 배지 SD-CSM 5mL 중에 제조되었고, 실시예 1에 기재된 바와 같이 30℃에서 성장시켰다. 상기 전배양물은 단독 탄소원으로서 10g/L 수크로스를 갖는 진탕 플라스크 중 100mL 배지에 접종되었고, 30℃에서 성장시켰다. 규칙적으로 시료를 채취하였고, N-아세틸뉴라미네이트의 생산은 실시예 1에 기재된 바와 같이 측정되었다. 상기 균주 및 방법으로 다량의 N-아세틸뉴라미네이트를 생산하였다.
동일한 생물체는 또한 탄소원으로서 글루코스, 말토스 또는 글리세롤에 기반하여 N-아세틸뉴라미네이트를 생산하였다.
실시예 7: 시알일락토스 및 다른 시알일화 화합물의 생산
실시예 3의 대체 구현예에서, 시알일트란스퍼라제를 상이한 활성을 갖는 다른 시알일트란스퍼라제로 변경하였다. 이는 알파-2,3-시알일트란스퍼라제 알파-2,6-시알일트란스퍼라제, 알파-2,8-시알일트란스퍼라제 또는 이의 조합일 수 있다. 이러한 시알일트란스퍼라제는 자연에서 광범위하게 입수가능하고, 주석이 잘 달려 있다.
이러한 방식으로, 예를 들어 6-시알일락토스, 3-시알일락토스 또는 그의 혼합물과 같은 상이한 시알일락토스의 생산이 수득될 수 있다.
균주는 실시예 1 및 실시예 3에 언급된 바와 같이 재배되었다.
실시예 2 내지 7에서 형성된 경로는 또한 시알일-락토-N-트리오스, 시알일락토-N-테트라오스, 디시알일락토스-N-테트라오스, 시알일락토-N-네오테트라오스, 및 디시알일락토스-N-네오테트라오스와 같은 더 큰 올리고사카리드의 합성을 위한 다른 경로와 조합될 수 있다. 이를 위해, 이러한 글리코시드 결합 (glycosidic bond)을 합성하기 위한 트란스퍼라제가, CMP-시알산을 형성하는 경로 유전자 및 상기 올리고사카리드를 시알일화하는 트란스퍼라제 (전술한 바와 같음)와 공동-발현된다.
이러한 시알일트란스퍼라제의 예로는 Datta (Current Drug Targets, 2009, 10, 483-498) 및 Harduin-Lepers (Biochimie 83 (2001) 727-737)에 개시된 바와 같이, ST6GalI, ST6GalII, ST3GalI 내지 VI, ST6GalNAc I 내지 VI 및 ST8Sia I 내지 VI이 있다. 해양 생물체로부터 기원하는 추가의 예가 Yamamoto (Mar. Drugs 2010, 8, 2781-2794)에 의해 개시되어 있다.
실시예 8: 시알일화 락토- N -네오테트라오스의 생산
본 실험의 목적은 다른 시알일화 올리고사카리드, 본 경우에 시알일화 락토-N-네오테트라오스 생산의 본 발명의 관능성을 입증하는데 있다.
락토-N-네오테트라오스 생산 균주는 실시예 1에 기재된 프로토콜에 따라 개발되었다. 생산을 위해, N-아세틸글루코사미닐트란스퍼라제 및 갈락토실트란스퍼라제의 발현이 필요하고, 이는 모두 네이세리아 메닌기티데스 유래의 유전자 NmlgtANmlgtB 각각의 도입에 의해 수득되었다. 다음, 에스케리치아 콜리 유래의 락토스 임포터 (importer) EclacY (또한 본원에 참고로 포함되는 WO 2016/075243의 실시예 1에 기재되고 입증됨)가 있다. 마지막으로, 유전자 ushAgalT를 녹아웃시켰다. 이러한 방식으로, 락토-N-네오테트라오스 생산 균주가 수득되었다.
락토스에서 성장하고, N-아세틸글루코사민-6-포스페이트를 생산하기 위해, 비피도박테리움 아돌레센티스 유래의 수크로스 포스포릴라제 (BaSP), 지모모나스 모빌리스 유래의 프룩토키나제 (frk) 및 돌연변이체 프룩토스-6-P-아미노트란스퍼라제 (EcglmS*54, Deng et al (Biochimie 88, 419-429 (2006))에 의해 개시됨)를 실시예 1에 기재된 바와 같이 과발현시켰다.
상기 균주에서, 본 발명에 기재된 바와 같이 시알산을 생산하는 방법은, 사카로미세스 세레비지에 유래의 글루코사민-6-P-아미노트란스퍼라제 (ScGNA1), 박테로이데스 오바투스 유래의 N-아세틸글루코사민-2-에피머라제 (BoAGE) 및 캄필로박터 제주니 유래의 시알산 신타제 (CjneuB)를 과발현시킴으로써 수행되었다. ScGNA1BoAGE는 각각 nagABCDEmanXYZ 위치에서 발현되었다. CjneuB는 플라스미드 pCX-CjneuB-NmneuA-Pdbst로부터 발현되었다.
락토-N-네오테트라오스 모이어티의 시알일화는 CMP 시알산 신테타제, 예컨대 네이세리아 메닌기티데스 유래의 NmneuA, 후속하여 시알일 트란스퍼라제, 예컨대 포토박테리움 담셀라에 유래의 Pdbst에 의해 시알산을 CMP-시알산으로 전환시킴으로써 수행되었다. 이러한 유전자 (NmneuAPdbst)는 고 카피의 플라스미드 pCX-CjneuB-NmneuA-Pdbst로부터 발현되었다.
균주는 실시예 1 (물질 및 방법)에 기재된 바와 같이 배양되었다. 간단하게, 5mL LB 전배양물이 접종되었고, 37℃에서 밤새 성장시켰다. 상기 배양물은, 탄소 및 에너지 원으로서 10g/L 수크로스, 전구물질로서 10g/L 락토스를 포함하는 100mL 배지로 진탕 플라스크 실험에서 접종물로 사용되었고, 실시예 1에서의 설명에 따라 제조되었다. 규칙적으로 시료를 채취하였고, 분석하였다. 상기 균주는 다량의 시알일화 락토-N-네오테트라오스를 생산하였다.
대체 글리코실트란스퍼라제가 가능하다. 예를 들어, EcWgbO (에스케리치아 콜리 O55:H7 유래)가 NmlgtB 대신에 발현되는 경우, 시알일화 락토-N-테트라오스가 생산되었다.
실시예 9: 바실루스 서브틸리스 에 의한 시알산의 생산
다른 구현예에서, 본 발명은 또 다른 박테리아 생산 숙주인 바실루스 서브틸리스에서 N-아세틸뉴라미네이트의 생산에 사용될 수 있다.
N-아세틸뉴라미네이트 생산 균주는 본 발명을 통해, 세포내에서 글루코사민-6-포스페이트를 과다생산할 수 있는 균주로 출발하여 수득되었다. 이를 위해, 네이티브 프룩토스-6-P-아미노트란스퍼라제 (BsglmS)가 과발현되었다. 하기 효소 활성은 유전자 nagA, nagB 및 gamA를 녹아웃시킴으로써 파괴되었다: N-아세틸글루코사민-6-포스페이트 데아세틸라제 및 글루코사민-6-포스페이트 이소머라제.
상기 균주에서, 본 발명에 기재된 바와 같이 시알산을 생산하는 방법은 사카로미세스 세레비지에 유래의 글루코사민-6-P-아미노트란스퍼라제 (ScGNA1), 박테로이데스 오바투스 유래의 N-아세틸글루코사민-2-에피머라제 (BoAGE) 및 캄필로박터 제주니 유래의 시알산 신타제 (CjneuB)를 과발현시킴으로써 수행되었다. 상기 유전자는 실시예 1에 기재된 바와 같이 플라스미드를 통해 도입되었다.
상기 균주는 실시예 1 (물질 및 방법)에 기재된 바와 같이 배양하였다. 간단하게, 5mL LB 전배양물이 접종되었고, 30 ℃에서 밤새 성장시켰다. 상기 배양물은 10g/L 수크로스를 포함하는 100mL 배지로 진탕 플라스크 실험에서 접종물로 사용되었고, 실시예 1에서의 설명에 따라 제조되었다. 상기 균주는 다량의 N-아세틸뉴라민산을 생산하였다.
실시예 10: GlcNAc, ManNAc 또는 시알산을 배출하지 않는 6-시알일락토스 생산 균주의 발효
본 발명에 따른 다른 예로 6-시알일락토스의 생산을 위한 방법 및 균주의 사용을 제공하였다.
탄소원으로서 수크로스를 사용하여 글루코사민-6-포스페이트를 축적할 수 있는 에스케리치아 콜리 균주는 N-아세틸뉴라미네이트를 생산하도록 추가로 조작되었다. 상기 기본 균주는 비피도박테리움 아돌레센티스 유래의 수크로스 포스포릴라제 (BaSP), 지모모나스 모빌리스 유래의 프룩토키나제 (Zmfrk), 돌연변이체 프룩토스-6-P-아미노트란스퍼라제 (EcglmS*54, Deng 등 (Biochimie 88, 419-429 (2006)에 의해 개시됨)를 과발현하였다. 6-시알일락토스를 생산하기 위해, 오페론 nagABCDE, nanATEKmanXYZ를 파괴하였다. BaSPZmfrknagABCDE 위치에 도입되었고, EcglmS*54는 nanATEK 위치에 도입되었다. 이러한 변형은 실시예 1에 기재된 바와 같이 수행되었고, Datsenko & Wanner의 원리 (PNAS USA 97, 6640-6645 (2000))에 기반한다.
상기 균주에서, 본 발명에 기재된 바와 같이 6-시알일락토스를 생산하는 생합성 경로는, 사카로미세스 세레비지에 유래의 글루코사민-6-P-아미노트란스퍼라제 (ScGNA1), 박테로이데스 오바투스 유래의 N-아세틸글루코사민-2-에피머라제 (BoAGE) 및 네이세리아 메닌기티데스 유래의 시알산 신타제 (NmneuB)를 과발현시킴으로써 수행되었다. ScGNA1BoAGE를 각각 nagABCDEmanXYZ 위치에서 발현되었다. NmNeuB는 고 카피의 플라스미드 pBR322-NmNeuB를 사용하여 발현되었다. 상기 균주는 에스케리치아 콜리 유래의 락토스 퍼미아제 EclacY (또한 본원에서 참고로 포함되는 WO 2016/075243의 실시예 1에 기재 및 입증됨), 네이세리아 메닌기티데스 유래의 CMP-시알산 신테타제 (NmNeuA) 및 포토박테리움 담셀라에 유래의 시알일트란스퍼라제 (Pdbst)를 과발현시킴으로써 추가로 변형되었다. 그 외에, lacZ가 파괴되었다. NmNeuAPdbst는 저 카피의 플라스미드 pSC101-NmneuA-Pdbst를 사용하여 발현되었다.
상기 균주는 실시예 1 (물질 및 방법)에 기재된 바와 같이 생물반응기에서 배양되었다. 간단하게, 5mL LB 전배양물이 접종되었고, 37 ℃에서 밤새 성장시켰다. 상기 배양물은 10g/L 수크로스를 포함하는 500mL 배지로 진탕 플라스크 실험에서 접종물로 사용되었고, 실시예 1에 기재된 바와 같이 제조되었다. 상기 배양물은 2L 생물반응기 실험에서 접종물로 사용되었다. 규칙적으로 시료를 채취하였고, 실시예 1에 기재된 바와 같이 분석되었다. 6-시알일락토스의 최종 농도는 30.5 g/L이었다. 발효 중에 및 최종 브로스 중에 세포외 GlcNAc, ManNAc 및 시알산은 검출되지 않았다.
동일한 생물체는 또한 탄소원으로서 글루코스, 말토스 또는 글리세롤에 기반하여 6-시알일락토스를 생산하였다.
실시예 11: 성장 및 시알산 생산에 대한 포스파타제의 효과
추가적 예로 N-아세틸뉴라미네이트 (시알산)를 생산할 수 있는 몇 가지 에스케리치아 콜리 균주의 성장 결과 및 시알산 생산을 제공하였고, 상기 균주는 하기에 개시된 바와 같이 가외의 포스파타제를 발현하고 있다.
기본 균주는 돌연변이체 프룩토스-6-P-아미노트란스퍼라제 (EcglmS*54, Deng et al. (Biochimie 88, 419-429 (2006)에 의해 개시됨), 사카로미세스 세레비지에 유래의 글루코사민-6-P-아미노트란스퍼라제 (ScGNA1), 박테로이데스 오바투스 유래의 N-아세틸글루코사민-2-에피머라제 (BoAGE) 및 캄필로박터 제주니 유래의 시알산 신타제 (CjneuB)를 과발현하였다. 유전자가 시알산을 생산하기 위해, 오페론 nagABCDEnanATEK. 상기 lacYZA 오페론은, 실시예 10에 기재된 바와 같이 시알일락토스의 생산을 위해 필요로 하는 네이티브 lacY인 단일 유전자 오페론으로만 대체되었다. 이러한 변형은 실시예 1에 기재된 바와 같이 수행되었고, Datsenko & Wanner 원리 (PNAS USA 97, 6640-6645 (2000))에 기반한다.
그 다음에 성장 및 시알산 생산에서 포스파타제의 효과를 비교하기 위해 상이한 포스파타제 함유 플라스미드를 상기 기본 균주에 보충하였다. 상기 기본 균주는 비교에서 블랭크로 사용되었다. 상기 플라스미드는, 포스파타제 및 상기 포스파타제의 발현을 유도하는 프로모터 이외에, pSC101 ori 및 스펙토마이신 (spectomycin) 저항 마커로 구성되었다. 하기 포스파타제가 발현되었다: EcAphA (서열번호: 42), EcCof (서열번호: 43), EcHisB (서열번호: 44), EcOtsB (서열번호: 45), EcSurE (서열번호: 46), EcYaed (서열번호: 47), EcYcjU (서열번호: 48), EcYedP (서열번호: 49), EcYfbT (서열번호: 50), EcYidA (서열번호: 51), EcYigB (서열번호: 52), EcYihX (서열번호: 53), EcYniC (서열번호: 54), EcYqaB (서열번호: 55), EcYrbL (서열번호: 56) 및 PsMupP (서열번호: 57). 발현되는 다른 포스파타제는 EcAppA (서열번호: 58), EcGph (서열번호: 59), EcSerB (서열번호: 60), EcNagD (서열번호: 61), EcYbhA (서열번호: 62), EcYbiV (서열번호: 63), EcYbjL (서열번호: 64), EcYfbR (서열번호: 65), EcYieH (서열번호: 66), EcYjgL (서열번호: 67), Ec YjjG (서열번호: 68), EcYrfG (서열번호: 69), EcYbiU (서열번호: 70), ScDOG1 (서열번호: 71) 및 BsAraL (서열번호: 72)이다.
제1 실험에서, 전술한 균주의 서브세트가 사용되었다. 제2 실험에서, 전술한 균주의 제2 서브세트가 테스트되었다.
각 균주는 실시예 1 (물질 및 방법)에 기재된 바와 같이 배양되었다. 간단하게, 워크플로우는 3개의 성장 단계로 구성되었다: LB에서 제1 성장, 그 다음에 15 g/L 글리세롤을 갖는 MMsf에서 성장, 및 마지막으로 15g/L 글리세롤 MMsf를 사용하는 성장 단계. 상기 제1 단계는 웰 당 175 μL LB를 사용하여, 96웰 플레이트에서 수행되었고, 37 ℃에서 밤새 인큐베이트되었다. 상기 제2 단계는 175 μL 배지를 사용하여 96웰 플레이트에서 수행되었고, 37 ℃에서 24시간 동안 인큐베이트되었다. 최종 성장 단계는 하기와 같이 수행되었다: i) 175 μL 배지를 사용하여 96웰 플레이트에서, 37 ℃에서 인큐베이트하여 제1 실험에 대한 μMax를 결정함 (도 5 참조) 및 ii) 3 mL do를 사용하여 24웰 딥웰 플레이트에서 제2 실험에 대한 시알산 생산 및 광학 밀도를 결정함 (도 4 참조).
도 4 및 5에 대한 참조 표:
Figure pat00009
도 4 및 5에 기반하여, 블랭크 균주보다 더 잘 성장하고 (크리플된 (crippled) 성장 없음) 블랭크 균주보다 시알산을 보다 많이 생산할 수 있는 포스파타제를 갖는 균주가 선택될 수 있다.
상기에 기반하여, 적어도 모티프 1 및 모티프 2를 포함하는 포스파타제는 블랭크 균주보다 균주가 크리플되지 않고 시알산을 보다 많이 생산할 수 있는 것으로 밝혀졌다.
실시예 12: 본 발명의 방법에 사용된 포스파타제와 관련된 추가 서열의 동정
서열번호: 43, 44, 45, 47, 48, 49, 50, 51, 52, 54, 55 및 57에 관련된 서열 (폴리펩티드)이, Basic Local Alignment Tool (BLAST)과 같은 데이터베이스 서열 검색 툴을 사용하여 National Center for Biotechnology Information (NCBI)의 Entrez 뉴클레오티드 데이터베이스에 유지된 것들 중에서 동정되었다 (Altschul et al. (1990) J. Mol. Biol. 215:403-410; and Altschul et al. (1997) Nucleic Acids Res. 25:3389-3402). 상기 프로그램은, 서열 데이터베이스에 대해 핵산 또는 폴리펩티드 서열을 비교하고, 매칭의 통계적 유의성을 계산하여 서열들 사이에서 국소 유사성의 영역을 찾기 위해 사용되었다. 상기 분석 결과는 pairwise 비교에 의해 볼 수 있고, 확률 점수 (E-값)에 따라 순위를 매겼고, 여기서 점수는 특정 정렬이 우연이 일어날 확률을 반영하였다 (E-값이 낮을수록, 유의한 적중률이 높아진다). E-값 이외에, 또한 동일성 퍼센트에 의해 비교가 채점되었다. 동일성 퍼센트는 특정 길이에 대해 2개의 비교되는 폴리펩티드 서열 사이에서 동일한 아미노산의 수를 나타낸다. 일부 예에서, 디폴트 파라미터가 검색 엄격성을 변경하기 위해 조정될 수 있다. 예를 들어 상기 E-값은 덜 엄격한 매치를 보여주기 위해 증가될 수 있다. 이렇게 하면, 거의 정확한 짧은 매치가 확인될 수 있다.
표 1A 내지 1K는 각각 서열번호: 43, 44, 45, 47, 48, 50, 51, 52, 54, 55 및 57과 관련된 동종 폴리펩티드 서열의 목록을 제공한다.
Figure pat00010
Figure pat00011
Figure pat00012
Figure pat00013
Figure pat00014
Figure pat00015
Figure pat00016
Figure pat00017
Figure pat00018
Figure pat00019
Figure pat00020
The Institute for Genomic Research (TIGR; beginning with TA)와 같은 연구 기관에 의해 서열이 시험적으로 조립되고 공개적으로 개시되어 있다. Eukaryotic Gene Orthologs (EGO) 데이터베이스를 사용하여, 관심있는 핵산 서열 또는 폴리펩티드 서열로 키보드 검색 또는 BLAST 알고리즘을 사용하여, 이러한 관련된 서열을 확인할 수 있다. Joint Genome Institute에 의해 특정 생물체에 대한 특정 핵산 서열 데이터베이스가 형성되어 있다.
실시예 13: 본 발명의 방법을 수행하는데 유용한 폴리펩티드 서열에 포함된 도메인 및 모티프의 확인
단백질 패밀리, 도메인 및 부위의 통합된 리소스 (InterPro) 데이터베이스는 문자- 및 서열- 기반 검색을 위해 통상적으로 사용된 시그니쳐 데이터베이스에 대한 통합된 인터페이스이다. 상기 InterPro 데이터베이스는 이러한 데이터베이스들과 조합되고, 이는 단백질 시그니쳐를 유도하기 위해 잘-특성화된 단백질에 대한 생물학적 정보의 다양한 정도 및 상이한 방법을 사용한다. 공동작업 데이터베이스는 SWISS-PROT, PROSITE, TrEMBL, PRINTS, ProDom 및 Pfam, Smart 및 TIGRFAMs을 포함한다. Pfam은 다수의 공통 단백질 도메인 및 패밀리를 포함하는 다수의 서열 정렬 및 히든 Markov 모델의 대규모 콜렉션이다. Pfam은 영국 Sanger Institute 서버에 주소를 두고 있다. Interpro는 영국 the European Bioinformatics Institute에 주소를 두고 있다.
서열번호: 43, 44, 45, 47, 48, 49, 50, 51, 52, 54 및 55로 표시되는 폴리펩티드 서열의 InterPro 스캔의 결과를 표 2에 나타내었다.
서열번호: 43, 44, 45, 47, 48, 49, 50, 51, 52, 54 및 55로 표시되는 폴리펩티드 서열의 InterPro 스캔 결과 (주요 기탁 번호)
데이터베이스 기탁번호 기탁명
Interpro IPR023214 HAD 상위패밀리
테스트된 포스파타제 폴리펩티드의 정렬을 수행하였고, 도 6은 상기 정렬의 일부를 보여주었다. 모티프 1 및 모티프 2를 박스로 표시하였다. 정렬은 clustalomega를 사용하여 이루어졌다.
실시예 14: 사카로미세스 세레비지에 의 성장 및 시알산 생산에 대한 포스파타제의 효과
N-아세틸뉴라미네이트 (시알산)를 생산할 수 있는 몇가지 사카로미세스 세레비지에 균주의 시알산 생산의 추가 예로서, 상기 균주는 하기에 개시된 바와 같이 가외의 포스파타제를 발현하고 있다.
본원에서 사용되는 균주는 실시예 4에 기재된 균주로부터 유래되었다. 본 발명에 따라 사카로미세스 세레비지에에서 성장 및 시알산 생산을 향상시키기 위해, 상기 포스파타제 유전자가 2-미크론 플라스미드 (Chan 2013 (Plasmid 70 (2013) 2-17))를 통해 도입되고, 상기 유전자는 실시예 1에 또한 기재된 바와 같이 합성 항시성 프로모터 (Blazeck 2012 (Biotechnology and Bioengineering, Vol. 109, No. 11))를 사용하여 발현되었다. 본 구현예에서 사용된 특정 플라스미드는 p2a_2μ_sia_glmS-phospha이다. 플라스미드 p2a_2μ_sia_glmS 플라스미드에 기반한 플라스미드가 실시예 1에 기재되어 있다. 이는 Gietz 및 Woods (2002, PMID 12073338)에 개시된 형질전환 기술을 사용하여 사카로미세스 세레비지에에 도입되었고, 돌연변이체 균주가 수득되었다. 상기 돌연변이체의 성장 및 시알산 생산에 대한 포스파타제 발현의 효과는 실시예 11에 기재된 바와 같이 평가되었다.
실시예 15: 바실루스 서브틸리스 의 성장 및 시알산 생산에 대한 포스파타제의 효과
다른 구현예에서, 본 발명은 또 다른 박테리아 생산 숙주인 바실루스 서브틸리스의 성장 및 시알산 생산을 증가시키기 위해 사용될 수 있다.
본원에서 사용된 균주는 실시예 9에 기재된 균주로부터 유래되었다. 또한, 실시예 9에 기재된 변경에 대해, 포스파타제 유전자 EcAphA (서열번호: 42), EcCof (서열번호: 43), EcHisB (서열번호: 44), EcOtsB (서열번호: 45), EcSurE (서열번호: 46), EcYaed (서열번호: 47), EcYcjU (서열번호: 48), EcYedP (서열번호: 49), EcYfbT (서열번호: 50), EcYidA (서열번호: 51), EcYigB (서열번호: 52), EcYihX (서열번호: 53), EcYniC (서열번호: 54), EcYqaB (서열번호: 55), EcYrbL (서열번호: 56), PsMupP (서열번호: 57), EcAppA (서열번호: 58), EcGph (서열번호: 59), EcSerB (서열번호: 60), EcNagD (서열번호: 61), EcYbhA (서열번호: 62), EcYbiV (서열번호: 63), EcYbjL (서열번호: 64), EcYfbR (서열번호: 65), EcYieH (서열번호: 66), EcYjgL (서열번호: 67), Ec YjjG (서열번호: 68), EcYrfG (서열번호: 69), EcYbiU (서열번호: 70), ScDOG1 (서열번호: 71) 및 BsAraL (서열번호: 72)이 실시예 1에 기재된 바와 같이 플라스미드에서 과발현되었다. 후속하여, 상기 플라스미드가 바실루스 서브틸리스에 도입되었다. 형성된 돌연변이체의 성장 및 시알산 생산에 대한 포스파타제 발현 효과는 실시예 11에 기재된 바와 같이 평가되었다.
SEQUENCE LISTING <110> Inbiose N.V. <120> IN VIVO SYNTHESIS OF SIALYLATED COMPOUNDS <130> Sia/004/PCT <150> EP16206916.5 <151> 2016-12-27 <160> 154 <170> PatentIn version 3.5 <210> 1 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> Synthetic DNA <400> 1 gctgaacttg taggcctgat aagcgcagcg tatcaggcaa tttttataat cttcatttaa 60 atggcgcgc 69 <210> 2 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> Synthetic DNA <400> 2 gcgcaacgca attaatgtga gttagctcac tcattaggca ccccaggctt cgcctacctg 60 tgacggaag 69 <210> 3 <211> 75 <212> DNA <213> Artificial Sequence <220> <223> Synthetic DNA <400> 3 cgcttaaaga tgcctaatcc gccaacggct tacattttac ttattgaggt gaatagtgta 60 ggctggagct gcttc 75 <210> 4 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 4 ggcgtttgtc atcagagcca accacgtccg cagacgtggt tgctatcata tgaatatcct 60 ccttag 66 <210> 5 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 5 taatgcgccg ccagtaaatc aacatgaaat gccgctggct ccgtgtaggc tggagctgct 60 tc 62 <210> 6 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 6 ccaacaacaa gcactggata aagcgagtct gcgtcgcctg gttcagttca catatgaata 60 tcctccttag 70 <210> 7 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 7 aaaatacatc tggcacgttg aggtgttaac gataataaag gaggtagcaa gtgtaggctg 60 gagctgcttc 70 <210> 8 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 8 cctccagata aaaaaacggg gccaaaaggc cccggtagtg tacaacagtc catatgaata 60 tcctccttag 70 <210> 9 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 9 gtttggcgtt tgtcatcaga gccaaccacg tccgcagacg tggttgctat gtgtaggctg 60 gagctgcttc 70 <210> 10 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Synthetic DNA <400> 10 ttgtcattgt tggatgcgac gctcaagcgt cgcatcaggc ataaagcaga cttaagcgac 60 ttcattcacc 70 <210> 11 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Synthetic DNA <400> 11 catggcggta atgcgccgcc agtaaatcaa catgaaatgc cgctggctcc gtgtaggctg 60 gagctgcttc 70 <210> 12 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 12 ccaacaacaa gcactggata aagcgagtct gcgtcgcctg gttcagttca cttaagcgac 60 ttcattcacc 70 <210> 13 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 13 aaaatacatc tggcacgttg aggtgttaac gataataaag gaggtagcaa gtgtaggctg 60 gagctgcttc 70 <210> 14 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 14 cctccagata aaaaaacggg gccaaaaggc cccggtagtg tacaacagtc cttaagcgac 60 ttcattcacc 70 <210> 15 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 15 gcgcaacgca attaatgtga gttagctcac tcattaggca ccccaggctt gtgtaggctg 60 gagctgcttc 70 <210> 16 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 16 gctgaacttg taggcctgat aagcgcagcg tatcaggcaa tttttataat cttaagcgac 60 ttcattcacc 70 <210> 17 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 17 caaaaagcgg tcaaattata cggtgcgccc ccgtgatttc aaacaataag gtgtaggctg 60 gagctgcttc 70 <210> 18 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 18 ataacgtggc tttttttggt aagcagaaaa taagtcatta gtgaaaatat cttaagcgac 60 ttcattcacc 70 <210> 19 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 19 caggtttccc gactggaaag 20 <210> 20 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 20 tgtgcgtcgt tgggctgatg 20 <210> 21 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 21 cgcttgtcat tgttggatgc 20 <210> 22 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 22 gctgacaaag tgcgatttgt tc 22 <210> 23 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 23 gtcgccctgt aattcgtaac 20 <210> 24 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 24 ctttcggtca gaccaccaac 20 <210> 25 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 25 acgcctctga tttggcaaag 20 <210> 26 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 26 agccagtgcg cttaataacc 20 <210> 27 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 27 gctgaacagc aatccacttg 20 <210> 28 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 28 tgaacgatat ggtgagctgg 20 <210> 29 <211> 500 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 29 agatggaatg gcgattttca ctctaaattt taaaaattgc ctctttacaa tagcgaattt 60 cctaaccctt tttttttttt gttgattgcc tattgctcgt tcacttccca tttattttct 120 ctcgaatttc accaaaagtt gatgtggata atcaatcatc gggcctattc ctgcgggtaa 180 aacgcagggc ccaactcagg atagggttta atattatttt agaggactta caagaaggaa 240 gttatatggt ttaaaaattg taacaaagtt agaacacatt tatttagcag gtctaattta 300 gggctgcaac tatctttttg gttattcata taaaatataa ttttttattt atatagagaa 360 tacaagtgga atcatcttta acgccagctt gtagtgcgca ttgcagaata atggaagttc 420 aaaaattaaa agcgaaggag aagtgatagt agaaagacgg atgggaggct gggggacgaa 480 gagaaagtaa aagggttaat 500 <210> 30 <211> 500 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 30 ttttttataa aagttgctgt tgatttgctc gagaacttat tgcttatttg gccctgataa 60 ctatataaga aaagaaatac agttattcct tgtttatgct ggctttttgt ccactttttc 120 tcaactatat aactatgatg ttggaaagga caccggttct gtaactttgc agtgaaaata 180 agtgtgatgg atgactgaga atgctttctt gtaagcgaaa agaagtacgt gttccaaaaa 240 taaagcagaa aggcgaaaag ggtcgaatgt aagacactaa ataaatattt taagaagagg 300 aaaagtcgcc tcagaaacgc taaaatgcat ccgatttccc aaagaggaag tctaatgttt 360 tcgatttgtg aaaaaaagat aaaaatcgaa gaaaatgtag ggagccgcgc gttacccgga 420 ttgatatttg agtgatcgac ggcgtcacaa aagaaagaat gcttggctaa tcaagaaaag 480 tatgtggttt gtttcatcta 500 <210> 31 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 31 gcaggtctaa tttagggctg 20 <210> 32 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 32 agaaagcatt ctcagtcatc 20 <210> 33 <211> 1000 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 33 gactgcaaga tttcggcctg ggcggacggg aatcgtcagt tttgtaattt ctgtatcaat 60 gattttcatg gtctcttcct caagtccgag ccggtcgtat tgcttgccct gctcccagag 120 ttcaagattc atgacaatcg tgattcgttt attgcttctg accgcgccag cgccaaatag 180 cgtcatcaca ttgataatgc caaggcccct gatctcaaga aggtgctcaa ttaattccgg 240 agcgtttccc acaagagtat cctgatcctc ctgccgtatt tcaacgcaat catcggcaac 300 aaggcgatgc cctcttttca caagctctag cgctgtttcg ctttttccga cgccgctttt 360 tcctgtgatc agcacgccga caccatatat atcgacaaga acgccatgaa ttgctgtggt 420 aggcgccagc ctgctctcaa ggaagttggt taaacggctt gacagtcttg tcgttttcag 480 cggcgatctg aggacaggca ccccattttt ctcggaggcg tcaatcagct cctgcgggat 540 gggcatatct ctagaaagaa taatagctgg tgttacatca gtgcacagag aatccattcg 600 ctgctttttc tcctcttcag gaagctgttc aaagaaagaa agctctgttt ttccgagaag 660 ctgcacgcgc tccctcgggt aatatgtaaa atatccggca atttcaatac ctggtcttga 720 taggtcactc attgtaatcg ggcggttaat tccttcttct ccgctgatta attccaaatt 780 gaactgttcc attacgtctt ttgtgcgaac ctttgccacg atatgttcct cctgttccgg 840 gctgccccga gcttgctcac aatactttca ttttatcact ttcgggcttg aacctaaaac 900 agattttata aaagggggga aaacacctca gctggtctag atcactagtc tgaaaaagag 960 taaaataaag gtattcaaat tccagaaagg cggatcatct 1000 <210> 34 <211> 1000 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 34 aaggaacatg ctgacttatg aatatcaata aacaatcgcc tattccgatt tactatcaga 60 ttatggagca attaaaaacc caaattaaga acggagagct gcagccggat atgcctcttc 120 cttctgagcg cgaatatgcc gaacaattcg ggatcagccg gatgacagtt cgccaggcgc 180 tttctaattt agttaatgaa ggcttgctct atcgcctgaa agggcggggc acctttgtca 240 gcaagccaaa aatggaacaa gcacttcaag ggctgacaag ctttaccgag gatatgaaaa 300 gccgcgggat gacaccgggc agcaggctca ttgattatca gcttattgat tcaactgagg 360 agctcgcggc tatattaggc tgcgggcacc cctcctctat ccataaaatc actcgggtgc 420 ggctggcaaa tgatattccg atggcgattg agtcctcaca tattccgttt gagcttgcgg 480 gtgaattgaa cgaatcgcat tttcagtcgt cgatctatga tcatattgaa aggtacaaca 540 gcataccgat ttcccgtgca aaacaggagc ttgagccaag cgctgccacc acggaagaag 600 cgaatattct tggtattcaa aagggagcgc ctgtcctatt aattaaacga acaacatatc 660 tgcagaacgg aactgctttt gagcatgcaa aatccgtata cagaggcgac cgttatacat 720 ttgtccacta tatggatcgt ctttcataaa aaaagcctcc aacccttttt aaggattgga 780 gacatggcga aaatcaaact ggtctggtgc cggacgatat gtttcttttt tcgtcttgaa 840 cttccagatc ggtgatttcg ttttgccgtt aaaactgtct tccactataa tgtaccaata 900 ataaacagac tgcggttcaa gatgatccca gcggaattca gctgtgtccc cgctcttcac 960 ttgctcccgt tttccgagct cttcattggt atatacgtta 1000 <210> 35 <211> 1000 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 35 tggcggacat ggaataaatc acaaacgaca aagatgacgc cggcaagaat agagttaatc 60 aaatagagca cgggcgcaac gaacaagaaa gaaaactcaa ccggttctgt aattccggtc 120 agcatagatg tgagcgccgc agaaatcatc acgccggaga tcattttttt cttttccgga 180 cgcgcggtat ggataatggc aagagcaacg gccggcagac agaaaatcat gtaagggaaa 240 tcccccatca taaagcgccc ggctgtcggg tctcccgcga aaaaccttgt caggtcgccg 300 gttacggtgt tgcctgttga tgggtctgtg tattctccca tcataaaata gaaaggcgta 360 taaaaaatat gatgcaggcc aaaaggaatc agcaaacgat agatcgttgc ataaaagaac 420 aggccgactg ttgaatcggc aattaaactg ctggctgcgt taattccgtt ttggatcagc 480 ggccaaacga atgagaaaat gacgccgatc accaatgaac tgacggaagt aatgatcggg 540 acaaagcgtt ttccagagaa aaatccaagg accggatgca gctcgattga tgaaaatcgc 600 ttatataaat aggcggcgag aagcccgata atgattcctc cgaaaacccc catatcaatc 660 aggtgctcgg ctccttcata cggaggctga aggccgagta attttcccat attgtcgagg 720 gtgacggtta aaattaagta tccgatgaca gcggcaagtc cggctacacc ttctccgccg 780 gctaatccga tcgcgacccc cacggcgaaa atcagcggaa ggttatcgaa tacaacgccg 840 cccgcatcct ttataatagg gatgttcagt aaatccttgt ctccgaaacg gagcaaaaga 900 cctgctgccg gcaggacggc aaccggagtc atcaacgcgc ggccaagctg ctgcagaatt 960 tgaaatgcct ttttaaacat gacagtctcc ttttattgtg 1000 <210> 36 <211> 1000 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 36 gtgacacccc ctcaaagaga tagacaagca ccatatttgt tatgaccaat ttatgatact 60 tgtcattacg aatttagcac cgcccttatc aaactgtcaa tattaatttc tgaaaatttg 120 ttataaaaga aggatacaaa tctttcatat tgggagggca aatggtatta tggtctcaat 180 gaaaaagaac ggattgcata cagaatgggg agaatgaaat gacagcttta tattctgtta 240 tcaagtttaa aatcattgag ttaattaaat cgggcaaata tcaggcgaat gatcagctgc 300 cgacggagag tgagttttgc gaacaatatg atgtcagcag aacaactgtg agactggctc 360 tgcagcagct agagcttgag ggatatatta aaagaattca aggaaaaggg acatttgtat 420 cggcggccaa aatacaaacg ccgattccgc ataagattac gagctttgca gaacaaatga 480 gaggacttcg ttctgaatca aaagtgcttg agcttgtggt gattcctgcc gatcattcca 540 tcgccgagct tttgaaaatg aaagagaatg aacctgtcaa caagcttgtc agagtcagat 600 acgccgaggg ggaacctttg cagtatcata cctcatatat tccctggaag gcggcaccgg 660 ggctggcgca ggaggaatgc accggctcgc tgtttgaatt gttaaggaca aaatacaata 720 ttgaaatcag caggggcacg gaatcgatcg aaccgatttt aacggatgaa acgatcagcg 780 gacacttatt aaccaatgtc ggagcgcctg cgtttttatc agaatccctt acctatgata 840 aaaatgaaga agtggtggaa tatgcgcaaa ttattacacg gggagaccga acgaaattca 900 ccgtagaaca gtcatatcat tcataaagca atgtgtttta agaagggaat ggtggttcta 960 tgtttttatt tacgaatgga aaagtgctgt ggggagcagt 1000 <210> 37 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 37 tgtaatcggg cggttaattc 20 <210> 38 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 38 gccctttcag gcgatagag 19 <210> 39 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 39 acggcgaaaa tcagcggaag 20 <210> 40 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic DNA <400> 40 tcactctccg tcggcagctg 20 <210> 41 <211> 72 <212> DNA <213> artificial <220> <223> UTR1 <400> 41 aattcgccgg agggatatta aaatgaatgg aaaattgaaa catcttaatc atgctaagga 60 ggttttctaa tg 72 <210> 42 <211> 237 <212> PRT <213> Escherichia coli <400> 42 Met Arg Lys Ile Thr Gln Ala Ile Ser Ala Val Cys Leu Leu Phe Ala 1 5 10 15 Leu Asn Ser Ser Ala Val Ala Leu Ala Ser Ser Pro Ser Pro Leu Asn 20 25 30 Pro Gly Thr Asn Val Ala Arg Leu Ala Glu Gln Ala Pro Ile His Trp 35 40 45 Val Ser Val Ala Gln Ile Glu Asn Ser Leu Ala Gly Arg Pro Pro Met 50 55 60 Ala Val Gly Phe Asp Ile Asp Asp Thr Val Leu Phe Ser Ser Pro Gly 65 70 75 80 Phe Trp Arg Gly Lys Lys Thr Phe Ser Pro Glu Ser Glu Asp Tyr Leu 85 90 95 Lys Asn Pro Val Phe Trp Glu Lys Met Asn Asn Gly Trp Asp Glu Phe 100 105 110 Ser Ile Pro Lys Glu Val Ala Arg Gln Leu Ile Asp Met His Val Arg 115 120 125 Arg Gly Asp Ala Ile Phe Phe Val Thr Gly Arg Ser Pro Thr Lys Thr 130 135 140 Glu Thr Val Ser Lys Thr Leu Ala Asp Asn Phe His Ile Pro Ala Thr 145 150 155 160 Asn Met Asn Pro Val Ile Phe Ala Gly Asp Lys Pro Gly Gln Asn Thr 165 170 175 Lys Ser Gln Trp Leu Gln Asp Lys Asn Ile Arg Ile Phe Tyr Gly Asp 180 185 190 Ser Asp Asn Asp Ile Thr Ala Ala Arg Asp Val Gly Ala Arg Gly Ile 195 200 205 Arg Ile Leu Arg Ala Ser Asn Ser Thr Tyr Lys Pro Leu Pro Gln Ala 210 215 220 Gly Ala Phe Gly Glu Glu Val Ile Val Asn Ser Glu Tyr 225 230 235 <210> 43 <211> 272 <212> PRT <213> Escherichia coli <400> 43 Met Ala Arg Leu Ala Ala Phe Asp Met Asp Gly Thr Leu Leu Met Pro 1 5 10 15 Asp His His Leu Gly Glu Lys Thr Leu Ser Thr Leu Ala Arg Leu Arg 20 25 30 Glu Arg Asp Ile Thr Leu Thr Phe Ala Thr Gly Arg His Ala Leu Glu 35 40 45 Met Gln His Ile Leu Gly Ala Leu Ser Leu Asp Ala Tyr Leu Ile Thr 50 55 60 Gly Asn Gly Thr Arg Val His Ser Leu Glu Gly Glu Leu Leu His Arg 65 70 75 80 Asp Asp Leu Pro Ala Asp Val Ala Glu Leu Val Leu Tyr Gln Gln Trp 85 90 95 Asp Thr Arg Ala Ser Met His Ile Phe Asn Asp Asp Gly Trp Phe Thr 100 105 110 Gly Lys Glu Ile Pro Ala Leu Leu Gln Ala Phe Val Tyr Ser Gly Phe 115 120 125 Arg Tyr Gln Ile Ile Asp Val Lys Lys Met Pro Leu Gly Ser Val Thr 130 135 140 Lys Ile Cys Phe Cys Gly Asp His Asp Asp Leu Thr Arg Leu Gln Ile 145 150 155 160 Gln Leu Tyr Glu Ala Leu Gly Glu Arg Ala His Leu Cys Phe Ser Ala 165 170 175 Thr Asp Cys Leu Glu Val Leu Pro Val Gly Cys Asn Lys Gly Ala Ala 180 185 190 Leu Thr Val Leu Thr Gln His Leu Gly Leu Ser Leu Arg Asp Cys Met 195 200 205 Ala Phe Gly Asp Ala Met Asn Asp Arg Glu Met Leu Val Ser Val Gly 210 215 220 Ser Gly Phe Ile Met Gly Asn Ala Met Pro Gln Leu Arg Ala Glu Leu 225 230 235 240 Pro His Leu Pro Val Ile Gly His Cys Arg Asn Gln Ala Val Ser His 245 250 255 Tyr Leu Thr His Trp Leu Asp Tyr Pro His Leu Pro Tyr Ser Pro Glu 260 265 270 <210> 44 <211> 355 <212> PRT <213> Escherichia coli <400> 44 Met Ser Gln Lys Tyr Leu Phe Ile Asp Arg Asp Gly Thr Leu Ile Ser 1 5 10 15 Glu Pro Pro Ser Asp Phe Gln Val Asp Arg Phe Asp Lys Leu Ala Phe 20 25 30 Glu Pro Gly Val Ile Pro Glu Leu Leu Lys Leu Gln Lys Ala Gly Tyr 35 40 45 Lys Leu Val Met Ile Thr Asn Gln Asp Gly Leu Gly Thr Gln Ser Phe 50 55 60 Pro Gln Ala Asp Phe Asp Gly Pro His Asn Leu Met Met Gln Ile Phe 65 70 75 80 Thr Ser Gln Gly Val Gln Phe Asp Glu Val Leu Ile Cys Pro His Leu 85 90 95 Pro Ala Asp Glu Cys Asp Cys Arg Lys Pro Lys Val Lys Leu Val Glu 100 105 110 Arg Tyr Leu Ala Glu Gln Ala Met Asp Arg Ala Asn Ser Tyr Val Ile 115 120 125 Gly Asp Arg Ala Thr Asp Ile Gln Leu Ala Glu Asn Met Gly Ile Thr 130 135 140 Gly Leu Arg Tyr Asp Arg Glu Thr Leu Asn Trp Pro Met Ile Gly Glu 145 150 155 160 Gln Leu Thr Arg Arg Asp Arg Tyr Ala His Val Val Arg Asn Thr Lys 165 170 175 Glu Thr Gln Ile Asp Val Gln Val Trp Leu Asp Arg Glu Gly Gly Ser 180 185 190 Lys Ile Asn Thr Gly Val Gly Phe Phe Asp His Met Leu Asp Gln Ile 195 200 205 Ala Thr His Gly Gly Phe Arg Met Glu Ile Asn Val Lys Gly Asp Leu 210 215 220 Tyr Ile Asp Asp His His Thr Val Glu Asp Thr Gly Leu Ala Leu Gly 225 230 235 240 Glu Ala Leu Lys Ile Ala Leu Gly Asp Lys Arg Gly Ile Cys Arg Phe 245 250 255 Gly Phe Val Leu Pro Met Asp Glu Cys Leu Ala Arg Cys Ala Leu Asp 260 265 270 Ile Ser Gly Arg Pro His Leu Glu Tyr Lys Ala Glu Phe Thr Tyr Gln 275 280 285 Arg Val Gly Asp Leu Ser Thr Glu Met Ile Glu His Phe Phe Arg Ser 290 295 300 Leu Ser Tyr Thr Met Gly Val Thr Leu His Leu Lys Thr Lys Gly Lys 305 310 315 320 Asn Asp His His Arg Val Glu Ser Leu Phe Lys Ala Phe Gly Arg Thr 325 330 335 Leu Arg Gln Ala Ile Arg Val Glu Gly Asp Thr Leu Pro Ser Ser Lys 340 345 350 Gly Val Leu 355 <210> 45 <211> 266 <212> PRT <213> Escherichia coli <400> 45 Met Thr Glu Pro Leu Thr Glu Thr Pro Glu Leu Ser Ala Lys Tyr Ala 1 5 10 15 Trp Phe Phe Asp Leu Asp Gly Thr Leu Ala Glu Ile Lys Pro His Pro 20 25 30 Asp Gln Val Val Val Pro Asp Asn Ile Leu Gln Gly Leu Gln Leu Leu 35 40 45 Ala Thr Ala Ser Asp Gly Ala Leu Ala Leu Ile Ser Gly Arg Ser Met 50 55 60 Val Glu Leu Asp Ala Leu Ala Lys Pro Tyr Arg Phe Pro Leu Ala Gly 65 70 75 80 Val His Gly Ala Glu Arg Arg Asp Ile Asn Gly Lys Thr His Ile Val 85 90 95 His Leu Pro Asp Ala Ile Ala Arg Asp Ile Ser Val Gln Leu His Thr 100 105 110 Val Ile Ala Gln Tyr Pro Gly Ala Glu Leu Glu Ala Lys Gly Met Ala 115 120 125 Phe Ala Leu His Tyr Arg Gln Ala Pro Gln His Glu Asp Ala Leu Met 130 135 140 Thr Leu Ala Gln Arg Ile Thr Gln Ile Trp Pro Gln Met Ala Leu Gln 145 150 155 160 Gln Gly Lys Cys Val Val Glu Ile Lys Pro Arg Gly Thr Ser Lys Gly 165 170 175 Glu Ala Ile Ala Ala Phe Met Gln Glu Ala Pro Phe Ile Gly Arg Thr 180 185 190 Pro Val Phe Leu Gly Asp Asp Leu Thr Asp Glu Ser Gly Phe Ala Val 195 200 205 Val Asn Arg Leu Gly Gly Met Ser Val Lys Ile Gly Thr Gly Ala Thr 210 215 220 Gln Ala Ser Trp Arg Leu Ala Gly Val Pro Asp Val Trp Ser Trp Leu 225 230 235 240 Glu Met Ile Thr Thr Ala Leu Gln Gln Lys Arg Glu Asn Asn Arg Ser 245 250 255 Asp Asp Tyr Glu Ser Phe Ser Arg Ser Ile 260 265 <210> 46 <211> 253 <212> PRT <213> Escherichia coli <400> 46 Met Arg Ile Leu Leu Ser Asn Asp Asp Gly Val His Ala Pro Gly Ile 1 5 10 15 Gln Thr Leu Ala Lys Ala Leu Arg Glu Phe Ala Asp Val Gln Val Val 20 25 30 Ala Pro Asp Arg Asn Arg Ser Gly Ala Ser Asn Ser Leu Thr Leu Glu 35 40 45 Ser Ser Leu Arg Thr Phe Thr Phe Glu Asn Gly Asp Ile Ala Val Gln 50 55 60 Met Gly Thr Pro Thr Asp Cys Val Tyr Leu Gly Val Asn Ala Leu Met 65 70 75 80 Arg Pro Arg Pro Asp Ile Val Val Ser Gly Ile Asn Ala Gly Pro Asn 85 90 95 Leu Gly Asp Asp Val Ile Tyr Ser Gly Thr Val Ala Ala Ala Met Glu 100 105 110 Gly Arg His Leu Gly Phe Pro Ala Leu Ala Val Ser Leu Asp Gly His 115 120 125 Lys His Tyr Asp Thr Ala Ala Ala Val Thr Cys Ser Ile Leu Arg Ala 130 135 140 Leu Cys Lys Glu Pro Leu Arg Thr Gly Arg Ile Leu Asn Ile Asn Val 145 150 155 160 Pro Asp Leu Pro Leu Asp Gln Ile Lys Gly Ile Arg Val Thr Arg Cys 165 170 175 Gly Thr Arg His Pro Ala Asp Gln Val Ile Pro Gln Gln Asp Pro Arg 180 185 190 Gly Asn Thr Leu Tyr Trp Ile Gly Pro Pro Gly Gly Lys Cys Asp Ala 195 200 205 Gly Pro Gly Thr Asp Phe Ala Ala Val Asp Glu Gly Tyr Val Ser Ile 210 215 220 Thr Pro Leu His Val Asp Leu Thr Ala His Ser Ala Gln Asp Val Val 225 230 235 240 Ser Asp Trp Leu Asn Ser Val Gly Val Gly Thr Gln Trp 245 250 <210> 47 <211> 191 <212> PRT <213> Escherichia coli <400> 47 Met Ala Lys Ser Val Pro Ala Ile Phe Leu Asp Arg Asp Gly Thr Ile 1 5 10 15 Asn Val Asp His Gly Tyr Val His Glu Ile Asp Asn Phe Glu Phe Ile 20 25 30 Asp Gly Val Ile Asp Ala Met Arg Glu Leu Lys Lys Met Gly Phe Ala 35 40 45 Leu Val Val Val Thr Asn Gln Ser Gly Ile Ala Arg Gly Lys Phe Thr 50 55 60 Glu Ala Gln Phe Glu Thr Leu Thr Glu Trp Met Asp Trp Ser Leu Ala 65 70 75 80 Asp Arg Asp Val Asp Leu Asp Gly Ile Tyr Tyr Cys Pro His His Pro 85 90 95 Gln Gly Ser Val Glu Glu Phe Arg Gln Val Cys Asp Cys Arg Lys Pro 100 105 110 His Pro Gly Met Leu Leu Ser Ala Arg Asp Tyr Leu His Ile Asp Met 115 120 125 Ala Ala Ser Tyr Met Val Gly Asp Lys Leu Glu Asp Met Gln Ala Ala 130 135 140 Val Ala Ala Asn Val Gly Thr Lys Val Leu Val Arg Thr Gly Lys Pro 145 150 155 160 Ile Thr Pro Glu Ala Glu Asn Ala Ala Asp Trp Val Leu Asn Ser Leu 165 170 175 Ala Asp Leu Pro Gln Ala Ile Lys Lys Gln Gln Lys Pro Ala Gln 180 185 190 <210> 48 <211> 219 <212> PRT <213> Escherichia coli <400> 48 Met Lys Leu Gln Gly Val Ile Phe Asp Leu Asp Gly Val Ile Thr Asp 1 5 10 15 Thr Ala His Leu His Phe Gln Ala Trp Gln Gln Ile Ala Ala Glu Ile 20 25 30 Gly Ile Ser Ile Asp Ala Gln Phe Asn Glu Ser Leu Lys Gly Ile Ser 35 40 45 Arg Asp Glu Ser Leu Arg Arg Ile Leu Gln His Gly Gly Lys Glu Gly 50 55 60 Asp Phe Asn Ser Gln Glu Arg Ala Gln Leu Ala Tyr Arg Lys Asn Leu 65 70 75 80 Leu Tyr Val His Ser Leu Arg Glu Leu Thr Val Asn Ala Val Leu Pro 85 90 95 Gly Ile Arg Ser Leu Leu Ala Asp Leu Arg Ala Gln Gln Ile Ser Val 100 105 110 Gly Leu Ala Ser Val Ser Leu Asn Ala Pro Thr Ile Leu Ala Ala Leu 115 120 125 Glu Leu Arg Glu Phe Phe Thr Phe Cys Ala Asp Ala Ser Gln Leu Lys 130 135 140 Asn Ser Lys Pro Asp Pro Glu Ile Phe Leu Ala Ala Cys Ala Gly Leu 145 150 155 160 Gly Val Pro Pro Gln Ala Cys Ile Gly Ile Glu Asp Ala Gln Ala Gly 165 170 175 Ile Asp Ala Ile Asn Ala Ser Gly Met Arg Ser Val Gly Ile Gly Ala 180 185 190 Gly Leu Thr Gly Ala Gln Leu Leu Leu Pro Ser Thr Glu Ser Leu Thr 195 200 205 Trp Pro Arg Leu Ser Ala Phe Trp Gln Asn Val 210 215 <210> 49 <211> 271 <212> PRT <213> Escherichia coli <400> 49 Met Phe Ser Ile Gln Gln Pro Leu Leu Val Phe Ser Asp Leu Asp Gly 1 5 10 15 Thr Leu Leu Asp Ser His Ser Tyr Asp Trp Gln Pro Ala Ala Pro Trp 20 25 30 Leu Thr Arg Leu Arg Glu Ala Asn Val Pro Val Ile Leu Cys Ser Ser 35 40 45 Lys Thr Ser Ala Glu Met Leu Tyr Leu Gln Lys Thr Leu Gly Leu Gln 50 55 60 Gly Leu Pro Leu Ile Ala Glu Asn Gly Ala Val Ile Gln Leu Ala Glu 65 70 75 80 Gln Trp Gln Glu Ile Asp Gly Phe Pro Arg Ile Ile Ser Gly Ile Ser 85 90 95 His Gly Glu Ile Ser Leu Val Leu Asn Thr Leu Arg Glu Lys Glu His 100 105 110 Phe Lys Phe Thr Thr Phe Asp Asp Val Asp Asp Ala Thr Ile Ala Glu 115 120 125 Trp Thr Gly Leu Ser Arg Ser Gln Ala Ala Leu Thr Gln Leu His Glu 130 135 140 Ala Ser Val Thr Leu Ile Trp Arg Asp Ser Asp Glu Arg Met Ala Gln 145 150 155 160 Phe Thr Ala Arg Leu Asn Glu Leu Gly Leu Gln Phe Met Gln Gly Ala 165 170 175 Arg Phe Trp His Val Leu Asp Ala Ser Ala Gly Lys Asp Gln Ala Ala 180 185 190 Asn Trp Ile Ile Ala Thr Tyr Gln Gln Leu Ser Gly Lys Arg Pro Thr 195 200 205 Thr Leu Gly Leu Gly Asp Gly Pro Asn Asp Ala Pro Leu Leu Glu Val 210 215 220 Met Asp Tyr Ala Val Ile Val Lys Gly Leu Asn Arg Glu Gly Val His 225 230 235 240 Leu His Asp Glu Asp Pro Ala Arg Val Trp Arg Thr Gln Arg Glu Gly 245 250 255 Pro Glu Gly Trp Arg Glu Gly Leu Asp His Phe Phe Ser Ala Arg 260 265 270 <210> 50 <211> 216 <212> PRT <213> Escherichia coli <400> 50 Met Arg Cys Lys Gly Phe Leu Phe Asp Leu Asp Gly Thr Leu Val Asp 1 5 10 15 Ser Leu Pro Ala Val Glu Arg Ala Trp Ser Asn Trp Ala Arg Arg His 20 25 30 Gly Leu Ala Pro Glu Glu Val Leu Ala Phe Ile His Gly Lys Gln Ala 35 40 45 Ile Thr Ser Leu Arg His Phe Met Ala Gly Lys Ser Glu Ala Asp Ile 50 55 60 Ala Ala Glu Phe Thr Arg Leu Glu His Ile Glu Ala Thr Glu Thr Glu 65 70 75 80 Gly Ile Thr Ala Leu Pro Gly Ala Ile Ala Leu Leu Ser His Leu Asn 85 90 95 Lys Ala Gly Ile Pro Trp Ala Ile Val Thr Ser Gly Ser Met Pro Val 100 105 110 Ala Arg Ala Arg His Lys Ile Ala Gly Leu Pro Ala Pro Glu Val Phe 115 120 125 Val Thr Ala Glu Arg Val Lys Arg Gly Lys Pro Glu Pro Asp Ala Tyr 130 135 140 Leu Leu Gly Ala Gln Leu Leu Gly Leu Ala Pro Gln Glu Cys Val Val 145 150 155 160 Val Glu Asp Ala Pro Ala Gly Val Leu Ser Gly Leu Ala Ala Gly Cys 165 170 175 His Val Ile Ala Val Asn Ala Pro Ala Asp Thr Pro Arg Leu Asn Glu 180 185 190 Val Asp Leu Val Leu His Ser Leu Glu Gln Ile Thr Val Thr Lys Gln 195 200 205 Pro Asn Gly Asp Val Ile Ile Gln 210 215 <210> 51 <211> 270 <212> PRT <213> Escherichia coli <400> 51 Met Ala Ile Lys Leu Ile Ala Ile Asp Met Asp Gly Thr Leu Leu Leu 1 5 10 15 Pro Asp His Thr Ile Ser Pro Ala Val Lys Asn Ala Ile Ala Ala Ala 20 25 30 Arg Ala Arg Gly Val Asn Val Val Leu Thr Thr Gly Arg Pro Tyr Ala 35 40 45 Gly Val His Asn Tyr Leu Lys Glu Leu His Met Glu Gln Pro Gly Asp 50 55 60 Tyr Cys Ile Thr Tyr Asn Gly Ala Leu Val Gln Lys Ala Ala Asp Gly 65 70 75 80 Ser Thr Val Ala Gln Thr Ala Leu Ser Tyr Asp Asp Tyr Arg Phe Leu 85 90 95 Glu Lys Leu Ser Arg Glu Val Gly Ser His Phe His Ala Leu Asp Arg 100 105 110 Thr Thr Leu Tyr Thr Ala Asn Arg Asp Ile Ser Tyr Tyr Thr Val His 115 120 125 Glu Ser Phe Val Ala Thr Ile Pro Leu Val Phe Cys Glu Ala Glu Lys 130 135 140 Met Asp Pro Asn Thr Gln Phe Leu Lys Val Met Met Ile Asp Glu Pro 145 150 155 160 Ala Ile Leu Asp Gln Ala Ile Ala Arg Ile Pro Gln Glu Val Lys Glu 165 170 175 Lys Tyr Thr Val Leu Lys Ser Ala Pro Tyr Phe Leu Glu Ile Leu Asp 180 185 190 Lys Arg Val Asn Lys Gly Thr Gly Val Lys Ser Leu Ala Asp Val Leu 195 200 205 Gly Ile Lys Pro Glu Glu Ile Met Ala Ile Gly Asp Gln Glu Asn Asp 210 215 220 Ile Ala Met Ile Glu Tyr Ala Gly Val Gly Val Ala Met Asp Asn Ala 225 230 235 240 Ile Pro Ser Val Lys Glu Val Ala Asn Phe Val Thr Lys Ser Asn Leu 245 250 255 Glu Asp Gly Val Ala Phe Ala Ile Glu Lys Tyr Val Leu Asn 260 265 270 <210> 52 <211> 238 <212> PRT <213> Escherichia coli <400> 52 Met Arg Phe Tyr Arg Pro Leu Gly Arg Ile Ser Ala Leu Thr Phe Asp 1 5 10 15 Leu Asp Asp Thr Leu Tyr Asp Asn Arg Pro Val Ile Leu Arg Thr Glu 20 25 30 Arg Glu Ala Leu Thr Phe Val Gln Asn Tyr His Pro Ala Leu Arg Ser 35 40 45 Phe Gln Asn Glu Asp Leu Gln Arg Leu Arg Gln Ala Val Arg Glu Ala 50 55 60 Glu Pro Glu Ile Tyr His Asp Val Thr Arg Trp Arg Phe Arg Ser Ile 65 70 75 80 Glu Gln Ala Met Leu Asp Ala Gly Leu Ser Ala Glu Glu Ala Ser Ala 85 90 95 Gly Ala His Ala Ala Met Ile Asn Phe Ala Lys Trp Arg Ser Arg Ile 100 105 110 Asp Val Pro Gln Gln Thr His Asp Thr Leu Lys Gln Leu Ala Lys Lys 115 120 125 Trp Pro Leu Val Ala Ile Thr Asn Gly Asn Ala Gln Pro Glu Leu Phe 130 135 140 Gly Leu Gly Asp Tyr Phe Glu Phe Val Leu Arg Ala Gly Pro His Gly 145 150 155 160 Arg Ser Lys Pro Phe Ser Asp Met Tyr Phe Leu Ala Ala Glu Lys Leu 165 170 175 Asn Val Pro Ile Gly Glu Ile Leu His Val Gly Asp Asp Leu Thr Thr 180 185 190 Asp Val Gly Gly Ala Ile Arg Ser Gly Met Gln Ala Cys Trp Ile Arg 195 200 205 Pro Glu Asn Gly Asp Leu Met Gln Thr Trp Asp Ser Arg Leu Leu Pro 210 215 220 His Leu Glu Ile Ser Arg Leu Ala Ser Leu Thr Ser Leu Ile 225 230 235 <210> 53 <211> 199 <212> PRT <213> Escherichia coli <400> 53 Met Leu Tyr Ile Phe Asp Leu Gly Asn Val Ile Val Asp Ile Asp Phe 1 5 10 15 Asn Arg Val Leu Gly Ala Trp Ser Asp Leu Thr Arg Ile Pro Leu Ala 20 25 30 Ser Leu Lys Lys Ser Phe His Met Gly Glu Ala Phe His Gln His Glu 35 40 45 Arg Gly Glu Ile Ser Asp Glu Ala Phe Ala Glu Ala Leu Cys His Glu 50 55 60 Met Ala Leu Pro Leu Ser Tyr Glu Gln Phe Ser His Gly Trp Gln Ala 65 70 75 80 Val Phe Val Ala Leu Arg Pro Glu Val Ile Ala Ile Met His Lys Leu 85 90 95 Arg Glu Gln Gly His Arg Val Val Val Leu Ser Asn Thr Asn Arg Leu 100 105 110 His Thr Thr Phe Trp Pro Glu Glu Tyr Pro Glu Ile Arg Asp Ala Ala 115 120 125 Asp His Ile Tyr Leu Ser Gln Asp Leu Gly Met Arg Lys Pro Glu Ala 130 135 140 Arg Ile Tyr Gln His Val Leu Gln Ala Glu Gly Phe Ser Pro Ser Asp 145 150 155 160 Thr Val Phe Phe Asp Asp Asn Ala Asp Asn Ile Glu Gly Ala Asn Gln 165 170 175 Leu Gly Ile Thr Ser Ile Leu Val Lys Asp Lys Thr Thr Ile Pro Asp 180 185 190 Tyr Phe Ala Lys Val Leu Cys 195 <210> 54 <211> 222 <212> PRT <213> Escherichia coli <400> 54 Met Ser Thr Pro Arg Gln Ile Leu Ala Ala Ile Phe Asp Met Asp Gly 1 5 10 15 Leu Leu Ile Asp Ser Glu Pro Leu Trp Asp Arg Ala Glu Leu Asp Val 20 25 30 Met Ala Ser Leu Gly Val Asp Ile Ser Arg Arg Asn Glu Leu Pro Asp 35 40 45 Thr Leu Gly Leu Arg Ile Asp Met Val Val Asp Leu Trp Tyr Ala Arg 50 55 60 Gln Pro Trp Asn Gly Pro Ser Arg Gln Glu Val Val Glu Arg Val Ile 65 70 75 80 Ala Arg Ala Ile Ser Leu Val Glu Glu Thr Arg Pro Leu Leu Pro Gly 85 90 95 Val Arg Glu Ala Val Ala Leu Cys Lys Glu Gln Gly Leu Leu Val Gly 100 105 110 Leu Ala Ser Ala Ser Pro Leu His Met Leu Glu Lys Val Leu Thr Met 115 120 125 Phe Asp Leu Arg Asp Ser Phe Asp Ala Leu Ala Ser Ala Glu Lys Leu 130 135 140 Pro Tyr Ser Lys Pro His Pro Gln Val Tyr Leu Asp Cys Ala Ala Lys 145 150 155 160 Leu Gly Val Asp Pro Leu Thr Cys Val Ala Leu Glu Asp Ser Val Asn 165 170 175 Gly Met Ile Ala Ser Lys Ala Ala Arg Met Arg Ser Ile Val Val Pro 180 185 190 Ala Pro Glu Ala Gln Asn Asp Pro Arg Phe Val Leu Ala Asp Val Lys 195 200 205 Leu Ser Ser Leu Thr Glu Leu Thr Ala Lys Asp Leu Leu Gly 210 215 220 <210> 55 <211> 188 <212> PRT <213> Escherichia coli <400> 55 Met Tyr Glu Arg Tyr Ala Gly Leu Ile Phe Asp Met Asp Gly Thr Ile 1 5 10 15 Leu Asp Thr Glu Pro Thr His Arg Lys Ala Trp Arg Glu Val Leu Gly 20 25 30 His Tyr Gly Leu Gln Tyr Asp Ile Gln Ala Met Ile Ala Leu Asn Gly 35 40 45 Ser Pro Thr Trp Arg Ile Ala Gln Ala Ile Ile Glu Leu Asn Gln Ala 50 55 60 Asp Leu Asp Pro His Ala Leu Ala Arg Glu Lys Thr Glu Ala Val Arg 65 70 75 80 Ser Met Leu Leu Asp Ser Val Glu Pro Leu Pro Leu Val Asp Val Val 85 90 95 Lys Ser Trp His Gly Arg Arg Pro Met Ala Val Gly Thr Gly Ser Glu 100 105 110 Ser Ala Ile Ala Glu Ala Leu Leu Ala His Leu Gly Leu Arg His Tyr 115 120 125 Phe Asp Ala Val Val Ala Ala Asp His Val Lys His His Lys Pro Ala 130 135 140 Pro Asp Thr Phe Leu Leu Cys Ala Gln Arg Met Gly Val Gln Pro Thr 145 150 155 160 Gln Cys Val Val Phe Glu Asp Ala Asp Phe Gly Ile Gln Ala Ala Arg 165 170 175 Ala Ala Gly Met Asp Ala Val Asp Val Arg Leu Leu 180 185 <210> 56 <211> 188 <212> PRT <213> Escherichia coli <400> 56 Met Ser Lys Ala Gly Ala Ser Leu Ala Thr Cys Tyr Gly Pro Val Ser 1 5 10 15 Ala Asp Val Ile Ala Lys Ala Glu Asn Ile Arg Leu Leu Ile Leu Asp 20 25 30 Val Asp Gly Val Leu Ser Asp Gly Leu Ile Tyr Met Gly Asn Asn Gly 35 40 45 Glu Glu Leu Lys Ala Phe Asn Val Arg Asp Gly Tyr Gly Ile Arg Cys 50 55 60 Ala Leu Thr Ser Asp Ile Glu Val Ala Ile Ile Thr Gly Arg Lys Ala 65 70 75 80 Lys Leu Val Glu Asp Arg Cys Ala Thr Leu Gly Ile Thr His Leu Tyr 85 90 95 Gln Gly Gln Ser Asn Lys Leu Ile Ala Phe Ser Asp Leu Leu Glu Lys 100 105 110 Leu Ala Ile Ala Pro Glu Asn Val Ala Tyr Val Gly Asp Asp Leu Ile 115 120 125 Asp Trp Pro Val Met Glu Lys Val Gly Leu Ser Val Ala Val Ala Asp 130 135 140 Ala His Pro Leu Leu Ile Pro Arg Ala Asp Tyr Val Thr Arg Ile Ala 145 150 155 160 Gly Gly Arg Gly Ala Val Arg Glu Val Cys Asp Leu Leu Leu Leu Ala 165 170 175 Gln Gly Lys Leu Asp Glu Ala Lys Gly Gln Ser Ile 180 185 <210> 57 <211> 223 <212> PRT <213> Pseudomonas putida <400> 57 Met Arg Leu Arg Ala Val Leu Phe Asp Met Asp Gly Thr Leu Leu Asp 1 5 10 15 Thr Ala Pro Asp Phe Ile Ala Ile Cys Gln Ala Met Leu Ala Glu Arg 20 25 30 Gly Leu Pro Ala Val Asp Asp Asn Leu Ile Arg Gly Val Ile Ser Gly 35 40 45 Gly Ala Arg Ala Met Val Ala Thr Ala Phe Ala Met Asp Pro Glu Ala 50 55 60 Asp Gly Phe Glu Ala Leu Arg Leu Glu Phe Leu Glu Arg Tyr Gln Arg 65 70 75 80 Asp Cys Ala Val His Ser Lys Leu Phe Glu Gly Met Ala Glu Leu Leu 85 90 95 Ala Asp Ile Glu Lys Gly Asn Leu Leu Trp Gly Val Val Thr Asn Lys 100 105 110 Pro Val Arg Phe Ala Glu Pro Ile Met Gln Gln Leu Gly Leu Ala Glu 115 120 125 Arg Ser Ala Leu Leu Ile Cys Pro Asp His Val Lys Asn Ser Lys Pro 130 135 140 Asp Pro Glu Pro Leu Ile Leu Ala Cys Lys Thr Leu Asn Leu Asp Pro 145 150 155 160 Ala Ser Val Leu Phe Val Gly Asp Asp Leu Arg Asp Ile Glu Ser Gly 165 170 175 Arg Asp Ala Gly Thr Arg Thr Ala Ala Val Arg Tyr Gly Tyr Ile His 180 185 190 Pro Glu Asp Asn Pro Asn Asn Trp Gly Ala Asp Val Val Val Asp His 195 200 205 Pro Leu Glu Leu Arg Lys Val Ile Asp Ser Ala Leu Cys Gly Cys 210 215 220 <210> 58 <211> 432 <212> PRT <213> Escherichia coli <400> 58 Met Lys Ala Ile Leu Ile Pro Phe Leu Ser Leu Leu Ile Pro Leu Thr 1 5 10 15 Pro Gln Ser Ala Phe Ala Gln Ser Glu Pro Glu Leu Lys Leu Glu Ser 20 25 30 Val Val Ile Val Ser Arg His Gly Val Arg Ala Pro Thr Lys Ala Thr 35 40 45 Gln Leu Met Gln Asp Val Thr Pro Asp Ala Trp Pro Thr Trp Pro Val 50 55 60 Lys Leu Gly Trp Leu Thr Pro Arg Gly Gly Glu Leu Ile Ala Tyr Leu 65 70 75 80 Gly His Tyr Gln Arg Gln Arg Leu Val Ala Asp Gly Leu Leu Ala Lys 85 90 95 Lys Gly Cys Pro Gln Ser Gly Gln Val Ala Ile Ile Ala Asp Val Asp 100 105 110 Glu Arg Thr Arg Lys Thr Gly Glu Ala Phe Ala Ala Gly Leu Ala Pro 115 120 125 Asp Cys Ala Ile Thr Val His Thr Gln Ala Asp Thr Ser Ser Pro Asp 130 135 140 Pro Leu Phe Asn Pro Leu Lys Thr Gly Val Cys Gln Leu Asp Asn Ala 145 150 155 160 Asn Val Thr Asp Ala Ile Leu Ser Arg Ala Gly Gly Ser Ile Ala Asp 165 170 175 Phe Thr Gly His Arg Gln Thr Ala Phe Arg Glu Leu Glu Arg Val Leu 180 185 190 Asn Phe Pro Gln Ser Asn Leu Cys Leu Lys Arg Glu Lys Gln Asp Glu 195 200 205 Ser Cys Ser Leu Thr Gln Ala Leu Pro Ser Glu Leu Lys Val Ser Ala 210 215 220 Asp Asn Val Ser Leu Thr Gly Ala Val Ser Leu Ala Ser Met Leu Thr 225 230 235 240 Glu Ile Phe Leu Leu Gln Gln Ala Gln Gly Met Pro Glu Pro Gly Trp 245 250 255 Gly Arg Ile Thr Asp Ser His Gln Trp Asn Thr Leu Leu Ser Leu His 260 265 270 Asn Ala Gln Phe Tyr Leu Leu Gln Arg Thr Pro Glu Val Ala Arg Ser 275 280 285 Arg Ala Thr Pro Leu Leu Asp Leu Ile Lys Thr Ala Leu Thr Pro His 290 295 300 Pro Pro Gln Lys Gln Ala Tyr Gly Val Thr Leu Pro Thr Ser Val Leu 305 310 315 320 Phe Ile Ala Gly His Asp Thr Asn Leu Ala Asn Leu Gly Gly Ala Leu 325 330 335 Glu Leu Asn Trp Thr Leu Pro Gly Gln Pro Asp Asn Thr Pro Pro Gly 340 345 350 Gly Glu Leu Val Phe Glu Arg Trp Arg Arg Leu Ser Asp Asn Ser Gln 355 360 365 Trp Ile Gln Val Ser Leu Val Phe Gln Thr Leu Gln Gln Met Arg Asp 370 375 380 Lys Thr Pro Leu Ser Leu Asn Thr Pro Pro Gly Glu Val Lys Leu Thr 385 390 395 400 Leu Ala Gly Cys Glu Glu Arg Asn Ala Gln Gly Met Cys Ser Leu Ala 405 410 415 Gly Phe Thr Gln Ile Val Asn Glu Ala Arg Ile Pro Ala Cys Ser Leu 420 425 430 <210> 59 <211> 252 <212> PRT <213> Escherichia coli <400> 59 Met Asn Lys Phe Glu Asp Ile Arg Gly Val Ala Phe Asp Leu Asp Gly 1 5 10 15 Thr Leu Val Asp Ser Ala Pro Gly Leu Ala Ala Ala Val Asp Met Ala 20 25 30 Leu Tyr Ala Leu Glu Leu Pro Val Ala Gly Glu Glu Arg Val Ile Thr 35 40 45 Trp Ile Gly Asn Gly Ala Asp Val Leu Met Glu Arg Ala Leu Thr Trp 50 55 60 Ala Arg Gln Glu Arg Ala Thr Gln Arg Lys Thr Met Gly Lys Pro Pro 65 70 75 80 Val Asp Asp Asp Ile Pro Ala Glu Glu Gln Val Arg Ile Leu Arg Lys 85 90 95 Leu Phe Asp Arg Tyr Tyr Gly Glu Val Ala Glu Glu Gly Thr Phe Leu 100 105 110 Phe Pro His Val Ala Asp Thr Leu Gly Ala Leu Gln Ala Lys Gly Leu 115 120 125 Pro Leu Gly Leu Val Thr Asn Lys Pro Thr Pro Phe Val Ala Pro Leu 130 135 140 Leu Glu Ala Leu Asp Ile Ala Lys Tyr Phe Ser Val Val Ile Gly Gly 145 150 155 160 Asp Asp Val Gln Asn Lys Lys Pro His Pro Asp Pro Leu Leu Leu Val 165 170 175 Ala Glu Arg Met Gly Ile Ala Pro Gln Gln Met Leu Phe Val Gly Asp 180 185 190 Ser Arg Asn Asp Ile Gln Ala Ala Lys Ala Ala Gly Cys Pro Ser Val 195 200 205 Gly Leu Thr Tyr Gly Tyr Asn Tyr Gly Glu Ala Ile Asp Leu Ser Gln 210 215 220 Pro Asp Val Ile Tyr Gln Ser Ile Asn Asp Leu Leu Pro Ala Leu Gly 225 230 235 240 Leu Pro His Ser Glu Asn Gln Glu Ser Lys Asn Asp 245 250 <210> 60 <211> 322 <212> PRT <213> Escherichia coli <400> 60 Met Pro Asn Ile Thr Trp Cys Asp Leu Pro Glu Asp Val Ser Leu Trp 1 5 10 15 Pro Gly Leu Pro Leu Ser Leu Ser Gly Asp Glu Val Met Pro Leu Asp 20 25 30 Tyr His Ala Gly Arg Ser Gly Trp Leu Leu Tyr Gly Arg Gly Leu Asp 35 40 45 Lys Gln Arg Leu Thr Gln Tyr Gln Ser Lys Leu Gly Ala Ala Met Val 50 55 60 Ile Val Ala Ala Trp Cys Val Glu Asp Tyr Gln Val Ile Arg Leu Ala 65 70 75 80 Gly Ser Leu Thr Ala Arg Ala Thr Arg Leu Ala His Glu Ala Gln Leu 85 90 95 Asp Val Ala Pro Leu Gly Lys Ile Pro His Leu Arg Thr Pro Gly Leu 100 105 110 Leu Val Met Asp Met Asp Ser Thr Ala Ile Gln Ile Glu Cys Ile Asp 115 120 125 Glu Ile Ala Lys Leu Ala Gly Thr Gly Glu Met Val Ala Glu Val Thr 130 135 140 Glu Arg Ala Met Arg Gly Glu Leu Asp Phe Thr Ala Ser Leu Arg Ser 145 150 155 160 Arg Val Ala Thr Leu Lys Gly Ala Asp Ala Asn Ile Leu Gln Gln Val 165 170 175 Arg Glu Asn Leu Pro Leu Met Pro Gly Leu Thr Gln Leu Val Leu Lys 180 185 190 Leu Glu Thr Leu Gly Trp Lys Val Ala Ile Ala Ser Gly Gly Phe Thr 195 200 205 Phe Phe Ala Glu Tyr Leu Arg Asp Lys Leu Arg Leu Thr Ala Val Val 210 215 220 Ala Asn Glu Leu Glu Ile Met Asp Gly Lys Phe Thr Gly Asn Val Ile 225 230 235 240 Gly Asp Ile Val Asp Ala Gln Tyr Lys Ala Lys Thr Leu Thr Arg Leu 245 250 255 Ala Gln Glu Tyr Glu Ile Pro Leu Ala Gln Thr Val Ala Ile Gly Asp 260 265 270 Gly Ala Asn Asp Leu Pro Met Ile Lys Ala Ala Gly Leu Gly Ile Ala 275 280 285 Tyr His Ala Lys Pro Lys Val Asn Glu Lys Ala Glu Val Thr Ile Arg 290 295 300 His Ala Asp Leu Met Gly Val Phe Cys Ile Leu Ser Gly Ser Leu Asn 305 310 315 320 Gln Lys <210> 61 <211> 250 <212> PRT <213> Escherichia coli <400> 61 Met Thr Ile Lys Asn Val Ile Cys Asp Ile Asp Gly Val Leu Met His 1 5 10 15 Asp Asn Val Ala Val Pro Gly Ala Ala Glu Phe Leu His Gly Ile Met 20 25 30 Asp Lys Gly Leu Pro Leu Val Leu Leu Thr Asn Tyr Pro Ser Gln Thr 35 40 45 Gly Gln Asp Leu Ala Asn Arg Phe Ala Thr Ala Gly Val Asp Val Pro 50 55 60 Asp Ser Val Phe Tyr Thr Ser Ala Met Ala Thr Ala Asp Phe Leu Arg 65 70 75 80 Arg Gln Glu Gly Lys Lys Ala Tyr Val Val Gly Glu Gly Ala Leu Ile 85 90 95 His Glu Leu Tyr Lys Ala Gly Phe Thr Ile Thr Asp Val Asn Pro Asp 100 105 110 Phe Val Ile Val Gly Glu Thr Arg Ser Tyr Asn Trp Asp Met Met His 115 120 125 Lys Ala Ala Tyr Phe Val Ala Asn Gly Ala Arg Phe Ile Ala Thr Asn 130 135 140 Pro Asp Thr His Gly Arg Gly Phe Tyr Pro Ala Cys Gly Ala Leu Cys 145 150 155 160 Ala Gly Ile Glu Lys Ile Ser Gly Arg Lys Pro Phe Tyr Val Gly Lys 165 170 175 Pro Ser Pro Trp Ile Ile Arg Ala Ala Leu Asn Lys Met Gln Ala His 180 185 190 Ser Glu Glu Thr Val Ile Val Gly Asp Asn Leu Arg Thr Asp Ile Leu 195 200 205 Ala Gly Phe Gln Ala Gly Leu Glu Thr Ile Leu Val Leu Ser Gly Val 210 215 220 Ser Ser Leu Asp Asp Ile Asp Ser Met Pro Phe Arg Pro Ser Trp Ile 225 230 235 240 Tyr Pro Ser Val Ala Glu Ile Asp Val Ile 245 250 <210> 62 <211> 272 <212> PRT <213> Escherichia coli <400> 62 Met Thr Thr Arg Val Ile Ala Leu Asp Leu Asp Gly Thr Leu Leu Thr 1 5 10 15 Pro Lys Lys Thr Leu Leu Pro Ser Ser Ile Glu Ala Leu Ala Arg Ala 20 25 30 Arg Glu Ala Gly Tyr Gln Leu Ile Ile Val Thr Gly Arg His His Val 35 40 45 Ala Ile His Pro Phe Tyr Gln Ala Leu Ala Leu Asp Thr Pro Ala Ile 50 55 60 Cys Cys Asn Gly Thr Tyr Leu Tyr Asp Tyr His Ala Lys Thr Val Leu 65 70 75 80 Glu Ala Asp Pro Met Pro Val Ile Lys Ala Leu Gln Leu Ile Glu Met 85 90 95 Leu Asn Glu His His Ile His Gly Leu Met Tyr Val Asp Asp Ala Met 100 105 110 Val Tyr Glu His Pro Thr Gly His Val Ile Arg Thr Ser Asn Trp Ala 115 120 125 Gln Thr Leu Pro Pro Glu Gln Arg Pro Thr Phe Thr Gln Val Ala Ser 130 135 140 Leu Ala Glu Thr Ala Gln Gln Val Asn Ala Val Trp Lys Phe Ala Leu 145 150 155 160 Thr His Asp Asp Leu Pro Gln Leu Gln His Phe Gly Lys His Val Glu 165 170 175 His Glu Leu Gly Leu Glu Cys Glu Trp Ser Trp His Asp Gln Val Asp 180 185 190 Ile Ala Arg Gly Gly Asn Ser Lys Gly Lys Arg Leu Thr Lys Trp Val 195 200 205 Glu Ala Gln Gly Trp Ser Met Glu Asn Val Val Ala Phe Gly Asp Asn 210 215 220 Phe Asn Asp Ile Ser Met Leu Glu Ala Ala Gly Thr Gly Val Ala Met 225 230 235 240 Gly Asn Ala Asp Asp Ala Val Lys Ala Arg Ala Asn Ile Val Ile Gly 245 250 255 Asp Asn Thr Thr Asp Ser Ile Ala Gln Phe Ile Tyr Ser His Leu Ile 260 265 270 <210> 63 <211> 271 <212> PRT <213> Escherichia coli <400> 63 Met Ser Val Lys Val Ile Val Thr Asp Met Asp Gly Thr Phe Leu Asn 1 5 10 15 Asp Ala Lys Thr Tyr Asn Gln Pro Arg Phe Met Ala Gln Tyr Gln Glu 20 25 30 Leu Lys Lys Arg Gly Ile Lys Phe Val Val Ala Ser Gly Asn Gln Tyr 35 40 45 Tyr Gln Leu Ile Ser Phe Phe Pro Glu Leu Lys Asp Glu Ile Ser Phe 50 55 60 Val Ala Glu Asn Gly Ala Leu Val Tyr Glu His Gly Lys Gln Leu Phe 65 70 75 80 His Gly Glu Leu Thr Arg His Glu Ser Arg Ile Val Ile Gly Glu Leu 85 90 95 Leu Lys Asp Lys Gln Leu Asn Phe Val Ala Cys Gly Leu Gln Ser Ala 100 105 110 Tyr Val Ser Glu Asn Ala Pro Glu Ala Phe Val Ala Leu Met Ala Lys 115 120 125 His Tyr His Arg Leu Lys Pro Val Lys Asp Tyr Gln Glu Ile Asp Asp 130 135 140 Val Leu Phe Lys Phe Ser Leu Asn Leu Pro Asp Glu Gln Ile Pro Leu 145 150 155 160 Val Ile Asp Lys Leu His Val Ala Leu Asp Gly Ile Met Lys Pro Val 165 170 175 Thr Ser Gly Phe Gly Phe Ile Asp Leu Ile Ile Pro Gly Leu His Lys 180 185 190 Ala Asn Gly Ile Ser Arg Leu Leu Lys Arg Trp Asp Leu Ser Pro Gln 195 200 205 Asn Val Val Ala Ile Gly Asp Ser Gly Asn Asp Ala Glu Met Leu Lys 210 215 220 Met Ala Arg Tyr Ser Phe Ala Met Gly Asn Ala Ala Glu Asn Ile Lys 225 230 235 240 Gln Ile Ala Arg Tyr Ala Thr Asp Asp Asn Asn His Glu Gly Ala Leu 245 250 255 Asn Val Ile Gln Ala Val Leu Asp Asn Thr Ser Pro Phe Asn Ser 260 265 270 <210> 64 <211> 561 <212> PRT <213> Escherichia coli <400> 64 Met Asn Ile Asn Val Ala Glu Leu Leu Asn Gly Asn Tyr Ile Leu Leu 1 5 10 15 Leu Phe Val Val Leu Ala Leu Gly Leu Cys Leu Gly Lys Leu Arg Leu 20 25 30 Gly Ser Ile Gln Leu Gly Asn Ser Ile Gly Val Leu Val Val Ser Leu 35 40 45 Leu Leu Gly Gln Gln His Phe Ser Ile Asn Thr Asp Ala Leu Asn Leu 50 55 60 Gly Phe Met Leu Phe Ile Phe Cys Val Gly Val Glu Ala Gly Pro Asn 65 70 75 80 Phe Phe Ser Ile Phe Phe Arg Asp Gly Lys Asn Tyr Leu Met Leu Ala 85 90 95 Leu Val Met Val Gly Ser Ala Leu Val Ile Ala Leu Gly Leu Gly Lys 100 105 110 Leu Phe Gly Trp Asp Ile Gly Leu Thr Ala Gly Met Leu Ala Gly Ser 115 120 125 Met Thr Ser Thr Pro Val Leu Val Gly Ala Gly Asp Thr Leu Arg His 130 135 140 Ser Gly Met Glu Ser Arg Gln Leu Ser Leu Ala Leu Asp Asn Leu Ser 145 150 155 160 Leu Gly Tyr Ala Leu Thr Tyr Leu Ile Gly Leu Val Ser Leu Ile Val 165 170 175 Gly Ala Arg Tyr Leu Pro Lys Leu Gln His Gln Asp Leu Gln Thr Ser 180 185 190 Ala Gln Gln Ile Ala Arg Glu Arg Gly Leu Asp Thr Asp Ala Asn Arg 195 200 205 Lys Val Tyr Leu Pro Val Ile Arg Ala Tyr Arg Val Gly Pro Glu Leu 210 215 220 Val Ala Trp Thr Asp Gly Lys Asn Leu Arg Glu Leu Gly Ile Tyr Arg 225 230 235 240 Gln Thr Gly Cys Tyr Ile Glu Arg Ile Arg Arg Asn Gly Ile Leu Ala 245 250 255 Asn Pro Asp Gly Asp Ala Val Leu Gln Met Gly Asp Glu Ile Ala Leu 260 265 270 Val Gly Tyr Pro Asp Ala His Ala Arg Leu Asp Pro Ser Phe Arg Asn 275 280 285 Gly Lys Glu Val Phe Asp Arg Asp Leu Leu Asp Met Arg Ile Val Thr 290 295 300 Glu Glu Val Val Val Lys Asn His Asn Ala Val Gly Lys Arg Leu Ala 305 310 315 320 Gln Leu Lys Leu Thr Asp His Gly Cys Phe Leu Asn Arg Val Ile Arg 325 330 335 Ser Gln Ile Glu Met Pro Ile Asp Asp Asn Val Val Leu Asn Lys Gly 340 345 350 Asp Val Leu Gln Val Ser Gly Asp Ala Arg Arg Val Lys Thr Ile Ala 355 360 365 Asp Arg Ile Gly Phe Ile Ser Ile His Ser Gln Val Thr Asp Leu Leu 370 375 380 Ala Phe Cys Ala Phe Phe Val Ile Gly Leu Met Ile Gly Met Ile Thr 385 390 395 400 Phe Gln Phe Ser Thr Phe Ser Phe Gly Met Gly Asn Ala Ala Gly Leu 405 410 415 Leu Phe Ala Gly Ile Met Leu Gly Phe Met Arg Ala Asn His Pro Thr 420 425 430 Phe Gly Tyr Ile Pro Gln Gly Ala Leu Ser Met Val Lys Glu Phe Gly 435 440 445 Leu Met Val Phe Met Ala Gly Val Gly Leu Ser Ala Gly Ser Gly Ile 450 455 460 Asn Asn Gly Leu Gly Ala Ile Gly Gly Gln Met Leu Ile Ala Gly Leu 465 470 475 480 Ile Val Ser Leu Val Pro Val Val Ile Cys Phe Leu Phe Gly Ala Tyr 485 490 495 Val Leu Arg Met Asn Arg Ala Leu Leu Phe Gly Ala Met Met Gly Ala 500 505 510 Arg Thr Cys Ala Pro Ala Met Glu Ile Ile Ser Asp Thr Ala Arg Ser 515 520 525 Asn Ile Pro Ala Leu Gly Tyr Ala Gly Thr Tyr Ala Ile Ala Asn Val 530 535 540 Leu Leu Thr Leu Ala Gly Thr Ile Ile Val Met Val Trp Pro Gly Leu 545 550 555 560 Gly <210> 65 <211> 199 <212> PRT <213> Escherichia coli <400> 65 Met Lys Gln Ser His Phe Phe Ala His Leu Ser Arg Leu Lys Leu Ile 1 5 10 15 Asn Arg Trp Pro Leu Met Arg Asn Val Arg Thr Glu Asn Val Ser Glu 20 25 30 His Ser Leu Gln Val Ala Met Val Ala His Ala Leu Ala Ala Ile Lys 35 40 45 Asn Arg Lys Phe Gly Gly Asn Val Asn Ala Glu Arg Ile Ala Leu Leu 50 55 60 Ala Met Tyr His Asp Ala Ser Glu Val Leu Thr Gly Asp Leu Pro Thr 65 70 75 80 Pro Val Lys Tyr Phe Asn Ser Gln Ile Ala Gln Glu Tyr Lys Ala Ile 85 90 95 Glu Lys Ile Ala Gln Gln Lys Leu Val Asp Met Val Pro Glu Glu Leu 100 105 110 Arg Asp Ile Phe Ala Pro Leu Ile Asp Glu His Ala Tyr Ser Asp Glu 115 120 125 Glu Lys Ser Leu Val Lys Gln Ala Asp Ala Leu Cys Ala Tyr Leu Lys 130 135 140 Cys Leu Glu Glu Leu Ala Ala Gly Asn Asn Glu Phe Leu Leu Ala Lys 145 150 155 160 Thr Arg Leu Glu Ala Thr Leu Glu Ala Arg Arg Ser Gln Glu Met Asp 165 170 175 Tyr Phe Met Glu Ile Phe Val Pro Ser Phe His Leu Ser Leu Asp Glu 180 185 190 Ile Ser Gln Asp Ser Pro Leu 195 <210> 66 <211> 221 <212> PRT <213> Escherichia coli <400> 66 Met Ser Arg Ile Glu Ala Val Phe Phe Asp Cys Asp Gly Thr Leu Val 1 5 10 15 Asp Ser Glu Val Ile Cys Ser Arg Ala Tyr Val Thr Met Phe Gln Glu 20 25 30 Phe Gly Ile Thr Leu Asp Pro Glu Glu Val Phe Lys Arg Phe Lys Gly 35 40 45 Val Lys Leu Tyr Glu Ile Ile Asp Ile Val Ser Leu Glu His Gly Val 50 55 60 Thr Leu Ala Lys Thr Glu Ala Glu His Val Tyr Arg Ala Glu Val Ala 65 70 75 80 Arg Leu Phe Asp Ser Glu Leu Glu Ala Ile Glu Gly Ala Gly Ala Leu 85 90 95 Leu Ser Ala Ile Thr Ala Pro Met Cys Val Val Ser Asn Gly Pro Asn 100 105 110 Asn Lys Met Gln His Ser Met Gly Lys Leu Asn Met Leu His Tyr Phe 115 120 125 Pro Asp Lys Leu Phe Ser Gly Tyr Asp Ile Gln Arg Trp Lys Pro Asp 130 135 140 Pro Ala Leu Met Phe His Ala Ala Lys Ala Met Asn Val Asn Val Glu 145 150 155 160 Asn Cys Ile Leu Val Asp Asp Ser Val Ala Gly Ala Gln Ser Gly Ile 165 170 175 Asp Ala Gly Met Glu Val Phe Tyr Phe Cys Ala Asp Pro His Asn Lys 180 185 190 Pro Ile Val His Pro Lys Val Thr Thr Phe Thr His Leu Ser Gln Leu 195 200 205 Pro Glu Leu Trp Lys Ala Arg Gly Trp Asp Ile Thr Ala 210 215 220 <210> 67 <211> 604 <212> PRT <213> Escherichia coli <400> 67 Met Ser Lys Ile Ser Asp Leu Asn Tyr Ser Gln His Ile Thr Leu Ala 1 5 10 15 Asp Asn Phe Lys Gln Lys Ser Glu Val Leu Asn Thr Trp Arg Val Gly 20 25 30 Met Asn Asp Phe Ala Arg Ile Ala Gly Gly Gln Asp Asn Arg Arg Asn 35 40 45 Ile Leu Ser Pro Gly Ala Phe Leu Glu Phe Leu Ala Lys Ile Phe Thr 50 55 60 Leu Gly Tyr Val Asp Phe Ser Lys Arg Ser Asn Glu Ala Gly Arg Asn 65 70 75 80 Met Met Ala His Ile Lys Ser Ser Ser Tyr Ser Lys Asp Thr Asn Gly 85 90 95 Asn Glu Lys Met Lys Phe Tyr Met Asn Asn Pro Val Gly Glu Arg Ala 100 105 110 Asp Ser Pro Lys Val Ile Ile Glu Ile Ser Leu Ser Thr Ile Thr Thr 115 120 125 Met Gly Thr Arg Gln Gly His Thr Ala Ile Ile Phe Pro Gln Pro Asp 130 135 140 Gly Ser Thr Asn Arg Tyr Glu Gly Lys Ser Phe Glu Arg Lys Asp Glu 145 150 155 160 Ser Ser Leu His Leu Ile Thr Asn Lys Val Leu Ala Cys Tyr Gln Ser 165 170 175 Glu Ala Asn Lys Lys Ile Ala Arg Leu Leu Asn Asn Asn Gln Glu Leu 180 185 190 Asn Asn Leu Gln Lys Leu Asn Asn Leu Gln Lys Leu Asn Asn Leu Leu 195 200 205 Lys Leu Asn Asn Ile Gln Gly Leu Asn Asn Pro Gln Glu Leu Asn Asn 210 215 220 Pro Gln Asn Leu Asn Asp Ser Gln Glu Leu Asn Asn Ser Gln Glu Leu 225 230 235 240 Asn Ser Pro Gln Glu Leu Asn Asp Pro Gln Glu Leu Asn Asn Ser Gln 245 250 255 Asp Leu Asn Asn Ser Lys Val Ser Cys Thr Val Ser Val Asp Ser Thr 260 265 270 Ile Thr Gly Leu Leu Lys Glu Pro Leu Asn Asn Ala Leu Leu Ala Ile 275 280 285 Arg Asn Glu His Leu Leu Leu Met Pro His Val Cys Asp Glu Ser Ile 290 295 300 Ser Tyr Leu Leu Gly Glu Lys Gly Ile Leu Glu Glu Ile Asp Lys Leu 305 310 315 320 Tyr Ala Leu Asn Asp His Gly Ile Asp Asn Asp Lys Val Gly Asn Asn 325 330 335 Glu Ile Asn Asp Ile Lys Val Asn Leu Ser His Ile Leu Ile Asp Ser 340 345 350 Leu Asp Asp Ala Lys Val Asn Leu Thr Pro Val Ile Asp Ser Ile Leu 355 360 365 Glu Thr Phe Ser Lys Ser Pro Tyr Ile Asn Asp Val Arg Ile Leu Asp 370 375 380 Trp Cys Phe Asn Lys Ser Met Gln Tyr Phe Asp Asp Thr Lys Lys Ile 385 390 395 400 Lys His Ala Cys Ser Val Ile Asn His Ile Asn Leu Arg Ser Asp Gln 405 410 415 Ser Lys Ile Ala Glu Thr Leu Phe Phe Asn Leu Asp Lys Glu Pro Tyr 420 425 430 Lys Asn Ser Pro Glu Leu Gln Gly Leu Ile Trp Asn Lys Leu Val Val 435 440 445 Tyr Val Asn Glu Phe Asn Leu Ser Asn Arg Glu Lys Thr Asn Leu Ile 450 455 460 Gln Arg Leu Phe Asp Asn Val Glu Ser Ile Phe Asn Glu Val Pro Val 465 470 475 480 Ser Ile Leu Val Asn Asp Ile Phe Met Asn Asp Phe Phe Met Lys Asn 485 490 495 Pro Glu Met Ile Asn Trp Tyr Phe Pro Gln Leu Leu Lys Ser Tyr Glu 500 505 510 Gly Glu Lys Ile Tyr Phe Asp Asn Leu Lys Tyr Asp Leu Asn Asp Asn 515 520 525 Asp Lys Glu Ser Asn Lys Glu Ile Leu Lys Asn Gln Pro Asp Asn Val 530 535 540 Ile Lys Glu Lys Leu Asn Asn Glu Tyr Lys Leu Arg Phe Arg Met Met 545 550 555 560 Gln Thr Ile Leu Gln Ser Arg Val Asn Val Leu Pro Tyr Ile Asn Glu 565 570 575 Gln Arg Leu Asn Lys Leu Asn Pro Pro Glu Asn Leu Arg Ile Ala Ile 580 585 590 Glu His Phe Gly Trp Lys Asn Arg Pro Ile Thr Ala 595 600 <210> 68 <211> 225 <212> PRT <213> Escherichia coli <400> 68 Met Lys Trp Asp Trp Ile Phe Phe Asp Ala Asp Glu Thr Leu Phe Thr 1 5 10 15 Phe Asp Ser Phe Thr Gly Leu Gln Arg Met Phe Leu Asp Tyr Ser Val 20 25 30 Thr Phe Thr Ala Glu Asp Phe Gln Asp Tyr Gln Ala Val Asn Lys Pro 35 40 45 Leu Trp Val Asp Tyr Gln Asn Gly Ala Ile Thr Ser Leu Gln Leu Gln 50 55 60 His Gly Arg Phe Glu Ser Trp Ala Glu Arg Leu Asn Val Glu Pro Gly 65 70 75 80 Lys Leu Asn Glu Ala Phe Ile Asn Ala Met Ala Glu Ile Cys Thr Pro 85 90 95 Leu Pro Gly Ala Val Ser Leu Leu Asn Ala Ile Arg Gly Asn Ala Lys 100 105 110 Ile Gly Ile Ile Thr Asn Gly Phe Ser Ala Leu Gln Gln Val Arg Leu 115 120 125 Glu Arg Thr Gly Leu Arg Asp Tyr Phe Asp Leu Leu Val Ile Ser Glu 130 135 140 Glu Val Gly Val Ala Lys Pro Asn Lys Lys Ile Phe Asp Tyr Ala Leu 145 150 155 160 Glu Gln Ala Gly Asn Pro Asp Arg Ser Arg Val Leu Met Val Gly Asp 165 170 175 Thr Ala Glu Ser Asp Ile Leu Gly Gly Ile Asn Ala Gly Leu Ala Thr 180 185 190 Cys Trp Leu Asn Ala His His Arg Glu Gln Pro Glu Gly Ile Ala Pro 195 200 205 Thr Trp Thr Val Ser Ser Leu His Glu Leu Glu Gln Leu Leu Cys Lys 210 215 220 His 225 <210> 69 <211> 222 <212> PRT <213> Escherichia coli <400> 69 Met His Ile Asn Ile Ala Trp Gln Asp Val Asp Thr Val Leu Leu Asp 1 5 10 15 Met Asp Gly Thr Leu Leu Asp Leu Ala Phe Asp Asn Tyr Phe Trp Gln 20 25 30 Lys Leu Val Pro Glu Thr Trp Gly Ala Lys Asn Gly Val Thr Pro Gln 35 40 45 Glu Ala Met Glu Tyr Met Arg Gln Gln Tyr His Asp Val Gln His Thr 50 55 60 Leu Asn Trp Tyr Cys Leu Asp Tyr Trp Ser Glu Gln Leu Gly Leu Asp 65 70 75 80 Ile Cys Ala Met Thr Thr Glu Met Gly Pro Arg Ala Val Leu Arg Glu 85 90 95 Asp Thr Ile Pro Phe Leu Glu Ala Leu Lys Ala Ser Gly Lys Gln Arg 100 105 110 Ile Leu Leu Thr Asn Ala His Pro His Asn Leu Ala Val Lys Leu Glu 115 120 125 His Thr Gly Leu Asp Ala His Leu Asp Leu Leu Leu Ser Thr His Thr 130 135 140 Phe Gly Tyr Pro Lys Glu Asp Gln Arg Leu Trp His Ala Val Ala Glu 145 150 155 160 Ala Thr Gly Leu Lys Ala Glu Arg Thr Leu Phe Ile Asp Asp Ser Glu 165 170 175 Ala Ile Leu Asp Ala Ala Ala Gln Phe Gly Ile Arg Tyr Cys Leu Gly 180 185 190 Val Thr Asn Pro Asp Ser Gly Ile Ala Glu Lys Gln Tyr Gln Arg His 195 200 205 Pro Ser Leu Asn Asp Tyr Arg Arg Leu Ile Pro Ser Leu Met 210 215 220 <210> 70 <211> 421 <212> PRT <213> Escherichia coli <400> 70 Met Ala Ser Thr Phe Thr Ser Asp Thr Leu Pro Ala Asp His Lys Ala 1 5 10 15 Ala Ile Arg Gln Met Lys His Ala Leu Arg Ala Gln Leu Gly Asp Val 20 25 30 Gln Gln Ile Phe Asn Gln Leu Ser Asp Asp Ile Ala Thr Arg Val Ala 35 40 45 Glu Ile Asn Ala Leu Lys Ala Gln Gly Asp Ala Val Trp Pro Val Leu 50 55 60 Ser Tyr Ala Asp Ile Lys Ala Gly His Val Thr Ala Glu Gln Arg Glu 65 70 75 80 Gln Ile Lys Arg Arg Gly Cys Ala Val Ile Lys Gly His Phe Pro Arg 85 90 95 Glu Gln Ala Leu Gly Trp Asp Gln Ser Met Leu Asp Tyr Leu Asp Arg 100 105 110 Asn Arg Phe Asp Glu Val Tyr Lys Gly Pro Gly Asp Asn Phe Phe Gly 115 120 125 Thr Leu Ser Ala Ser Arg Pro Glu Ile Tyr Pro Ile Tyr Trp Ser Gln 130 135 140 Ala Gln Met Gln Ala Arg Gln Ser Glu Glu Met Ala Asn Ala Gln Ser 145 150 155 160 Phe Leu Asn Arg Leu Trp Thr Phe Glu Ser Asp Gly Lys Gln Trp Phe 165 170 175 Asn Pro Asp Val Ser Val Ile Tyr Pro Asp Arg Ile Arg Arg Arg Pro 180 185 190 Pro Gly Thr Thr Ser Lys Gly Leu Gly Ala His Thr Asp Ser Gly Ala 195 200 205 Leu Glu Arg Trp Leu Leu Pro Ala Tyr Gln Arg Val Phe Ala Asn Val 210 215 220 Phe Asn Gly Asn Leu Ala Gln Tyr Asp Pro Trp His Ala Ala His Arg 225 230 235 240 Thr Glu Val Glu Glu Tyr Thr Val Asp Asn Thr Thr Lys Cys Ser Val 245 250 255 Phe Arg Thr Phe Gln Gly Trp Thr Ala Leu Ser Asp Met Leu Pro Gly 260 265 270 Gln Gly Leu Leu His Val Val Pro Ile Pro Glu Ala Met Ala Tyr Val 275 280 285 Leu Leu Arg Pro Leu Leu Asp Asp Val Pro Glu Asp Glu Leu Cys Gly 290 295 300 Val Ala Pro Gly Arg Val Leu Pro Val Ser Glu Gln Trp His Pro Leu 305 310 315 320 Leu Ile Glu Ala Leu Thr Ser Ile Pro Lys Leu Glu Ala Gly Asp Ser 325 330 335 Val Trp Trp His Cys Asp Val Ile His Ser Val Ala Pro Val Glu Asn 340 345 350 Gln Gln Gly Trp Gly Asn Val Met Tyr Ile Pro Ala Ala Pro Met Cys 355 360 365 Glu Lys Asn Leu Ala Tyr Ala His Lys Val Lys Ala Ala Leu Glu Lys 370 375 380 Gly Ala Ser Pro Gly Asp Phe Pro Arg Glu Asp Tyr Glu Thr Asn Trp 385 390 395 400 Glu Gly Arg Phe Thr Leu Ala Asp Leu Asn Ile His Gly Lys Arg Ala 405 410 415 Leu Gly Met Asp Val 420 <210> 71 <211> 246 <212> PRT <213> Saccharomyces cerevisiae <400> 71 Met Ala Glu Phe Ser Ala Asp Leu Cys Leu Phe Asp Leu Asp Gly Thr 1 5 10 15 Ile Val Ser Thr Thr Val Ala Ala Glu Lys Ala Trp Thr Lys Leu Cys 20 25 30 Tyr Glu Tyr Gly Val Asp Pro Ser Glu Leu Phe Lys His Ser His Gly 35 40 45 Ala Arg Thr Gln Glu Val Leu Arg Arg Phe Phe Pro Lys Leu Asp Asp 50 55 60 Thr Asp Asn Lys Gly Val Leu Ala Leu Glu Lys Asp Ile Ala His Ser 65 70 75 80 Tyr Leu Asp Thr Val Ser Leu Ile Pro Gly Ala Glu Asn Leu Leu Leu 85 90 95 Ser Leu Asp Val Asp Thr Glu Thr Gln Lys Lys Leu Pro Glu Arg Lys 100 105 110 Trp Ala Ile Val Thr Ser Gly Ser Pro Tyr Leu Ala Phe Ser Trp Phe 115 120 125 Glu Thr Ile Leu Lys Asn Val Gly Lys Pro Lys Val Phe Ile Thr Gly 130 135 140 Phe Asp Val Lys Asn Gly Lys Pro Asp Pro Glu Gly Tyr Ser Arg Ala 145 150 155 160 Arg Asp Leu Leu Arg Gln Asp Leu Gln Leu Thr Gly Lys Gln Asp Leu 165 170 175 Lys Tyr Val Val Phe Glu Asp Ala Pro Val Gly Ile Lys Ala Gly Lys 180 185 190 Ala Met Gly Ala Ile Thr Val Gly Ile Thr Ser Ser Tyr Asp Lys Ser 195 200 205 Val Leu Phe Asp Ala Gly Ala Asp Tyr Val Val Cys Asp Leu Thr Gln 210 215 220 Val Ser Val Val Lys Asn Asn Glu Asn Gly Ile Val Ile Gln Val Asn 225 230 235 240 Asn Pro Leu Thr Arg Ala 245 <210> 72 <211> 272 <212> PRT <213> Bacillus subtilis <400> 72 Met Arg Ile Met Ala Ser His Asp Thr Pro Val Ser Pro Ala Gly Ile 1 5 10 15 Leu Ile Asp Leu Asp Gly Thr Val Phe Arg Gly Asn Glu Leu Ile Glu 20 25 30 Gly Ala Arg Glu Ala Ile Lys Thr Leu Arg Arg Met Gly Lys Lys Ile 35 40 45 Val Phe Leu Ser Asn Arg Gly Asn Ile Ser Arg Ala Met Cys Arg Lys 50 55 60 Lys Leu Leu Gly Ala Gly Ile Glu Thr Asp Val Asn Asp Ile Val Leu 65 70 75 80 Ser Ser Ser Val Thr Ala Ala Phe Leu Lys Lys His Tyr Arg Phe Ser 85 90 95 Lys Val Trp Val Leu Gly Glu Gln Gly Leu Val Asp Glu Leu Arg Leu 100 105 110 Ala Gly Val Gln Asn Ala Ser Glu Pro Lys Glu Ala Asp Trp Leu Val 115 120 125 Ile Ser Leu His Glu Thr Leu Thr Tyr Asp Asp Leu Asn Gln Ala Phe 130 135 140 Gln Ala Ala Ala Gly Gly Ala Arg Ile Ile Ala Thr Asn Lys Asp Arg 145 150 155 160 Ser Phe Pro Asn Glu Asp Gly Asn Ala Ile Asp Val Ala Gly Met Ile 165 170 175 Gly Ala Ile Glu Thr Ser Ala Gln Ala Lys Thr Glu Leu Val Val Gly 180 185 190 Lys Pro Ser Trp Leu Met Ala Glu Ala Ala Cys Thr Ala Met Gly Leu 195 200 205 Ser Ala His Glu Cys Met Ile Ile Gly Asp Ser Ile Glu Ser Asp Ile 210 215 220 Ala Met Gly Lys Leu Tyr Gly Met Lys Ser Ala Leu Val Leu Thr Gly 225 230 235 240 Ser Ala Lys Gln Gly Glu Gln Arg Leu Tyr Thr Pro Asp Tyr Val Leu 245 250 255 Asp Ser Ile Lys Asp Val Thr Lys Leu Ala Glu Glu Gly Ile Leu Ile 260 265 270 <210> 73 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Motif 1: hDxDx[TV] <220> <221> MISC_FEATURE <222> (1)..(1) <223> X is an hydrophobic amino acid (A, I, L, M, F, V, P or G) <220> <221> MISC_FEATURE <222> (3)..(3) <223> X can be any amino acid <220> <221> MISC_FEATURE <222> (5)..(5) <223> X can be any amino acid <220> <221> MISC_FEATURE <222> (6)..(6) <223> X can be T or V <400> 73 Xaa Asp Xaa Asp Xaa Xaa 1 5 <210> 74 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Motif 2: [GSTDE][DSEN]x[hP]x[DGTS] <220> <221> MISC_FEATURE <222> (1)..(1) <223> X can be G, S, T, D or E <220> <221> MISC_FEATURE <222> (2)..(2) <223> X can be D, S, E or N <220> <221> MISC_FEATURE <222> (3)..(3) <223> X can be any amino acid <220> <221> MISC_FEATURE <222> (4)..(4) <223> X can be a hydrophobic amino acid (A, I, L, M, F, V, P or G) or P <220> <221> MISC_FEATURE <222> (5)..(5) <223> X can be any amino acid <220> <221> MISC_FEATURE <222> (6)..(6) <223> X can be D, G, T or S <400> 74 Xaa Xaa Xaa Xaa Xaa Xaa 1 5 <210> 75 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> [GSTDE][DSEN]xx[hP]x[DGTS] <220> <221> MISC_FEATURE <222> (1)..(1) <223> X can be G, S, T, D or E <220> <221> MISC_FEATURE <222> (2)..(2) <223> X can be D, S, E or N <220> <221> MISC_FEATURE <222> (3)..(4) <223> X can be any amino acid <220> <221> MISC_FEATURE <222> (5)..(5) <223> X can be a hydrophobic amino acid (A, I, L, M, F, V, P or G) or P <220> <221> MISC_FEATURE <222> (6)..(6) <223> X can be any amino acid <220> <221> MISC_FEATURE <222> (7)..(7) <223> X can be D, G, T or S <400> 75 Xaa Xaa Xaa Xaa Xaa Xaa Xaa 1 5 <210> 76 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> [GSTDE][DSEN]x[hP]xx[DGTS] <220> <221> MISC_FEATURE <222> (1)..(1) <223> X can be G, S, T, D or E <220> <221> MISC_FEATURE <222> (2)..(2) <223> X can be D, S, E or N <220> <221> MISC_FEATURE <222> (3)..(3) <223> X can be any amino acid <220> <221> MISC_FEATURE <222> (4)..(4) <223> X can be a hydrophobic amino acid (A, I, L, M, F, V, P or G) or P <220> <221> MISC_FEATURE <222> (5)..(6) <223> X can be any amino acid <220> <221> MISC_FEATURE <222> (7)..(7) <223> X can be D, G, T or S <400> 76 Xaa Xaa Xaa Xaa Xaa Xaa Xaa 1 5 <210> 77 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> [GSTDE][DSEN]xx[hP]xx[DGTS] <220> <221> MISC_FEATURE <222> (1)..(1) <223> X can be G, S, T, D or E <220> <221> MISC_FEATURE <222> (2)..(2) <223> X can be D, S, E or N <220> <221> MISC_FEATURE <222> (3)..(4) <223> X can be any amino acid <220> <221> MISC_FEATURE <222> (5)..(5) <223> X can be a hydrophobic amino acid (A, I, L, M, F, V, P or G) or P <220> <221> MISC_FEATURE <222> (6)..(7) <223> X can be any amino acid <220> <221> MISC_FEATURE <222> (8)..(8) <223> X can be a D, G, T or S <400> 77 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 1 5 <210> 78 <211> 272 <212> PRT <213> Shigella flexneri <400> 78 Met Ala Arg Leu Ala Ala Phe Asp Met Asp Gly Thr Leu Leu Met Pro 1 5 10 15 Asp His His Leu Gly Glu Lys Thr Leu Ser Thr Leu Ala Arg Leu Arg 20 25 30 Glu Arg Asp Ile Thr Leu Thr Phe Ala Thr Gly Arg His Ala Leu Glu 35 40 45 Met Gln His Ile Leu Gly Ala Leu Ser Leu Asp Ala Tyr Leu Ile Thr 50 55 60 Gly Asn Gly Thr Arg Val His Ser Leu Glu Gly Glu Leu Leu His Arg 65 70 75 80 Asp Asp Leu Pro Ala Asp Val Ala Glu Leu Val Leu Tyr Gln Gln Trp 85 90 95 Asp Thr Arg Ala Ser Met His Ile Phe Asn Asp Asp Gly Trp Phe Thr 100 105 110 Gly Lys Glu Ile Pro Ala Leu Leu Gln Ala Phe Val Tyr Ser Gly Phe 115 120 125 Arg Tyr Gln Ile Ile Asp Val Lys Lys Met Pro Leu Gly Ser Val Thr 130 135 140 Lys Ile Cys Phe Cys Gly Asp His Asp Asp Leu Thr Arg Leu Gln Ile 145 150 155 160 Gln Leu Tyr Glu Ala Leu Gly Glu Arg Ala His Leu Cys Phe Ser Ala 165 170 175 Thr Asp Cys Leu Glu Val Leu Pro Val Gly Cys Asn Lys Gly Ala Ala 180 185 190 Leu Thr Val Leu Thr Gln His Leu Asp Leu Ser Leu Arg Asp Cys Met 195 200 205 Ala Phe Gly Asp Ala Met Asn Asp Arg Glu Met Leu Val Ser Val Gly 210 215 220 Ser Gly Phe Ile Met Gly Asn Ala Met Pro Gln Leu Arg Ala Glu Leu 225 230 235 240 Pro His Leu Pro Val Ile Gly His Cys Arg Asn Gln Ala Val Ser His 245 250 255 Tyr Leu Thr His Trp Leu Asp Tyr Pro His Leu Pro Tyr Ser Pro Glu 260 265 270 <210> 79 <211> 272 <212> PRT <213> Shigella boydii <400> 79 Met Ala Arg Leu Ala Ala Phe Asp Met Asp Gly Thr Leu Leu Met Pro 1 5 10 15 Asp His His Leu Gly Glu Lys Thr Leu Ser Thr Leu Ala Arg Leu Arg 20 25 30 Glu Arg Asp Ile Thr Leu Thr Phe Ala Thr Gly Arg His Ala Leu Glu 35 40 45 Met Gln His Ile Leu Gly Ala Leu Ser Leu Asp Ala Tyr Leu Ile Thr 50 55 60 Gly Asn Gly Thr Arg Val His Ser Leu Glu Gly Glu Leu Leu His Arg 65 70 75 80 Asp Asp Leu Pro Ala Asp Val Ala Glu Leu Val Leu Tyr Gln Gln Trp 85 90 95 Asp Thr Arg Ala Ser Met His Ile Phe Asn Asp Asp Gly Trp Phe Thr 100 105 110 Gly Lys Glu Ile Pro Ala Leu Leu Gln Ala Phe Val Tyr Asn Gly Phe 115 120 125 Arg Tyr Gln Ile Ile Asp Val Lys Lys Met Pro Leu Gly Ser Val Thr 130 135 140 Lys Ile Cys Phe Cys Gly Asp His Asp Asp Leu Thr Arg Leu Gln Ile 145 150 155 160 Gln Leu Tyr Glu Ala Leu Gly Glu Arg Ala His Leu Cys Phe Ser Ala 165 170 175 Thr Asp Cys Leu Glu Val Leu Pro Val Gly Cys Asn Lys Gly Ala Ala 180 185 190 Leu Thr Val Leu Thr Gln His Leu Gly Leu Ser Leu Arg Asp Cys Met 195 200 205 Ala Phe Gly Asp Ala Met Asn Asp Arg Glu Met Leu Gly Ser Val Gly 210 215 220 Ser Gly Phe Ile Met Gly Asn Ala Met Pro Gln Leu Arg Ala Glu Leu 225 230 235 240 Pro His Leu Pro Val Ile Gly His Cys Arg Asn Gln Ala Val Ser His 245 250 255 Tyr Leu Thr His Trp Leu Asp Tyr Pro His Leu Pro Tyr Ser Pro Glu 260 265 270 <210> 80 <211> 272 <212> PRT <213> Escherichia fergusonii <400> 80 Met Ala Arg Leu Ala Ala Phe Asp Met Asp Gly Thr Leu Leu Met Pro 1 5 10 15 Asp His His Leu Gly Glu Lys Thr Leu Ser Thr Leu Ala Arg Leu Arg 20 25 30 Glu Arg Asp Ile Thr Leu Thr Phe Ala Thr Gly Arg His Ala Leu Glu 35 40 45 Met Gln His Ile Leu Gly Ala Leu Ser Leu Asp Ala Tyr Leu Ile Thr 50 55 60 Gly Asn Gly Thr Arg Val His Ser Leu Glu Gly Glu Leu Leu His Arg 65 70 75 80 Asp Asp Leu Pro Ala Asp Val Ala Glu Leu Val Leu Tyr Gln Gln Trp 85 90 95 Asp Thr Arg Ala Ser Met His Ile Phe Asn Asp Asp Gly Trp Phe Thr 100 105 110 Gly Lys Glu Ile Pro Ala Leu Leu Gln Ala Phe Val Tyr Ser Gly Phe 115 120 125 Arg Tyr Gln Ile Ile Asp Val Lys Lys Met Pro Leu Asp Arg Val Thr 130 135 140 Lys Ile Cys Phe Cys Gly Asp His Asp Asp Leu Thr Arg Leu Gln Ile 145 150 155 160 Gln Leu His Glu Ala Leu Gly Glu Arg Ala His Leu Cys Phe Ser Ala 165 170 175 Thr Asp Cys Leu Glu Val Leu Pro Val Gly Cys Asn Lys Gly Ala Ala 180 185 190 Leu Thr Val Leu Thr Gln His Leu Gly Leu Ser Leu Arg Glu Cys Met 195 200 205 Ala Phe Gly Asp Ala Met Asn Asp Arg Glu Met Leu Gly Ser Val Gly 210 215 220 Ser Gly Phe Ile Met Gly Asn Ala Met Pro Gln Leu Arg Ala Glu Leu 225 230 235 240 Pro His Leu Pro Val Ile Gly His Cys Arg Asn Gln Ala Val Ser His 245 250 255 Tyr Leu Thr His Trp Leu Asp Tyr Pro His Leu Pro Tyr Ser Pro Glu 260 265 270 <210> 81 <211> 245 <212> PRT <213> Staphylococcus aureus <400> 81 Met Ala Arg Leu Ala Ala Phe Asp Met Asp Gly Thr Leu Leu Val Pro 1 5 10 15 Asp His His Leu Gly Glu Lys Thr Leu Ser Thr Leu Ala Arg Leu Arg 20 25 30 Glu Arg Asp Ile Thr Leu Thr Phe Ala Thr Gly Arg His Ala Leu Glu 35 40 45 Met Gln His Ile Leu Gly Ala Leu Ser Leu Asp Ala Tyr Leu Ile Thr 50 55 60 Gly Asn Gly Thr Arg Val His Ser Leu Glu Gly Glu Leu Leu His Arg 65 70 75 80 Asp Asp Leu Pro Ala Asp Val Ala Glu Leu Val Leu Tyr Gln Gln Trp 85 90 95 Asp Thr Arg Ala Ser Met His Ile Phe Asn Asp Asp Gly Trp Phe Thr 100 105 110 Gly Lys Glu Ile Pro Ala Leu Leu Gln Ala Phe Val Tyr Ser Gly Phe 115 120 125 Arg Tyr Gln Ile Ile Asp Val Lys Lys Met Pro Leu Gly Ser Val Thr 130 135 140 Lys Ile Cys Phe Cys Gly Asp His Asp Asp Leu Thr Arg Leu Gln Ile 145 150 155 160 Gln Leu Tyr Glu Ala Leu Gly Glu Arg Ala His Leu Cys Phe Ser Ala 165 170 175 Thr Asp Cys Leu Glu Val Leu Pro Val Gly Cys Asn Lys Gly Ala Ala 180 185 190 Leu Thr Val Leu Thr Gln His Leu Gly Leu Ser Leu Arg Asp Cys Thr 195 200 205 Ala Phe Gly Asp Ala Met Asn Asp Arg Glu Met Leu Val Ser Val Gly 210 215 220 Ser Gly Phe Ile Met Gly Asn Ala Met Pro Gln Leu Arg Ala Glu Leu 225 230 235 240 Pro His Leu Pro Val 245 <210> 82 <211> 272 <212> PRT <213> unknown <220> <223> Escherichia albertii <400> 82 Met Ala Arg Leu Ala Ala Phe Asp Met Asp Gly Thr Leu Leu Met Pro 1 5 10 15 Asp His His Leu Gly Glu Lys Thr Leu Ser Thr Leu Ala Arg Leu Arg 20 25 30 Asp Arg Asp Ile Thr Leu Thr Phe Ala Thr Gly Arg His Ala Leu Glu 35 40 45 Met Arg His Ile Leu Gly Thr Phe Ala Leu Asp Ala Tyr Leu Ile Thr 50 55 60 Gly Asn Gly Thr Arg Val His Ser Gln Glu Gly Asp Leu Leu Tyr Arg 65 70 75 80 Asp Asp Leu Pro Ala Asp Val Ala Glu Arg Val Leu His Gln Lys Trp 85 90 95 Asp Thr Gln Ala Ser Met His Ile Phe Asn Asp Asp Gly Trp Phe Thr 100 105 110 Gly Gln Glu Met Pro Ser Leu Leu Gln Ala Phe Val Tyr Ser Gly Phe 115 120 125 Arg Tyr Gln Ile Ile Asp Val Lys Lys Met Pro Leu Asp Arg Val Thr 130 135 140 Lys Ile Cys Phe Cys Gly Asp His Asp Asp Leu Thr Arg Leu Gln Ile 145 150 155 160 Gln Leu Asn Glu Ala Leu Gly Asp Arg Ala His Leu Cys Phe Ser Ala 165 170 175 Ile Asn Cys Leu Glu Val Leu Pro Val Gly Cys Asn Lys Gly Ala Ala 180 185 190 Leu Ala Val Leu Ala Asp Tyr Leu Gly Phe Ser Leu Arg Asp Cys Met 195 200 205 Ala Phe Gly Asp Ala Met Asn Asp Arg Glu Met Leu Gly Ser Val Gly 210 215 220 Asn Gly Phe Ile Met Gly Asn Ala Met Pro Gln Leu Leu Ala Glu Leu 225 230 235 240 Pro His Leu Pro Val Ile Gly His Cys Arg Asn Gln Ala Val Ser His 245 250 255 Tyr Leu Thr His Trp Leu Asp Asn Pro His Leu Pro Tyr Ser Pro Glu 260 265 270 <210> 83 <211> 272 <212> PRT <213> Citrobacter amalonaticus <400> 83 Met Ala Arg Leu Ala Ala Phe Asp Met Asp Gly Thr Leu Leu Met Pro 1 5 10 15 Asn His Leu Leu Gly Asp Glu Thr Leu Ser Thr Leu Ala Arg Leu Arg 20 25 30 Glu Arg Asp Ile Thr Leu Thr Phe Ala Thr Gly Arg His Val Leu Glu 35 40 45 Met Arg His Ile Leu Gly Thr Phe Ser Leu Asp Ala Phe Leu Ile Thr 50 55 60 Gly Asn Gly Thr Arg Ile His Ser Leu Glu Gly Glu Val Leu His Arg 65 70 75 80 Gln Asp Leu Glu Pro Ala Val Ala Glu Ile Val Leu His Gln Arg Trp 85 90 95 Asp Thr Gln Ala Ser Met His Ile Phe Asn Asp Asn Gly Trp Phe Thr 100 105 110 Gly Gln Glu Ile Pro Glu Met Leu His Ala His Val Tyr Ser Gly Phe 115 120 125 Arg Tyr Gln Ile Val Asp Val Ala Arg Ile Pro Ala Asp Arg Val Thr 130 135 140 Lys Val Cys Phe Cys Gly Asp His Asp Asp Leu Thr Arg Leu Lys Ile 145 150 155 160 Gln Leu Glu Glu Val Leu Gly Ala Arg Ala His Leu Cys Phe Ser Ala 165 170 175 Val Asp Cys Leu Glu Val Leu Pro Val Gly Cys Asn Lys Gly Ser Ala 180 185 190 Leu Glu Val Leu Ser Gly His Leu Gly Leu Ser Leu Ala Glu Cys Met 195 200 205 Ala Phe Gly Asp Ala Met Asn Asp Arg Glu Met Leu Gly Ser Val Gly 210 215 220 Arg Gly Leu Ile Met Gly Asn Ala Met Pro Gln Leu Ile Ala Glu Leu 225 230 235 240 Pro His Leu Pro Val Ile Gly His Cys Arg Asn Gln Ala Val Ser His 245 250 255 Phe Leu Thr His Trp Leu Asp Tyr Pro Asn Leu Pro Tyr Ser Pro Glu 260 265 270 <210> 84 <211> 272 <212> PRT <213> Salmonella enterica <400> 84 Met Ala Arg Leu Ala Ala Phe Asp Met Asp Gly Thr Leu Leu Met Pro 1 5 10 15 Asp His His Leu Gly Lys Glu Thr Leu Ala Thr Leu Ala Arg Leu Arg 20 25 30 Glu Arg Asp Ile Thr Leu Thr Phe Ala Thr Gly Arg His Val Leu Glu 35 40 45 Met Arg His Ile Leu Gly Thr Leu Ser Leu Asp Ala Tyr Leu Ile Thr 50 55 60 Gly Asn Gly Thr Arg Ile His Ser Leu Glu Gly Asp Val Leu His Arg 65 70 75 80 Gln Asp Leu Asp Pro Gln Val Ala Asp Thr Val Met His His Ala Trp 85 90 95 Asp Thr Arg Ala Ser Met His Val Phe Asn Asp Asn Gly Trp Phe Thr 100 105 110 Gly Gln Glu Ile Pro Ala Leu Leu Gln Ala His Val Tyr Ser Gly Phe 115 120 125 Arg Tyr Gln Val Ile Asp Ile Lys Ser Ile Pro Ala His Gln Val Thr 130 135 140 Lys Ile Cys Phe Cys Gly Asp His Asp Asp Leu Ile Arg Leu Arg Ile 145 150 155 160 Gln Leu Asn Glu Ala Leu Glu Glu Arg Ala His Leu Cys Phe Ser Ala 165 170 175 Val Asp Cys Leu Glu Val Leu Pro Leu Gly Cys Asn Lys Gly Ser Ala 180 185 190 Leu Ala Val Leu Ser Asn His Leu Gly Leu Ser Leu Ala Asp Cys Met 195 200 205 Ala Phe Gly Asp Ala Met Asn Asp Arg Glu Met Leu Gly Ser Val Gly 210 215 220 Arg Gly Leu Ile Met Gly Asn Ala Met Pro Gln Leu Ile Ala Ala Leu 225 230 235 240 Pro His Leu Ser Val Ile Gly His Cys Gly Asn Gln Ala Val Ser His 245 250 255 Phe Leu Thr His Trp Leu Asp Asn Pro His Leu Pro Tyr Ser Pro Glu 260 265 270 <210> 85 <211> 220 <212> PRT <213> Escherichia coli <400> 85 Leu Gly Ala Leu Ser Leu Asp Ala Tyr Leu Ile Thr Gly Asn Gly Thr 1 5 10 15 Arg Val His Ser Leu Glu Gly Glu Leu Leu His Arg Asp Asp Leu Pro 20 25 30 Ala Asp Val Ala Glu Leu Val Leu Tyr Gln Gln Trp Asp Thr Arg Ala 35 40 45 Ser Met His Ile Phe Asn Asp Asp Gly Trp Phe Thr Gly Lys Glu Ile 50 55 60 Pro Ala Leu Leu Gln Ala Phe Val Tyr Ser Gly Phe Arg Tyr Gln Ile 65 70 75 80 Ile Asp Val Lys Lys Met Pro Leu Gly Ser Val Thr Lys Ile Cys Phe 85 90 95 Cys Gly Asp His Asp Asp Leu Thr Arg Leu Gln Ile Gln Leu Tyr Glu 100 105 110 Ala Leu Gly Glu Arg Ala His Leu Cys Phe Ser Ala Thr Asp Cys Leu 115 120 125 Glu Val Leu Pro Val Gly Cys Asn Lys Gly Ala Ala Leu Thr Val Leu 130 135 140 Thr Gln His Leu Gly Leu Ser Leu Arg Asp Cys Met Ala Phe Gly Asp 145 150 155 160 Ala Met Asn Asp Arg Glu Met Leu Gly Ser Val Gly Ser Gly Phe Ile 165 170 175 Met Gly Asn Ala Met Pro Gln Leu Arg Ala Glu Leu Pro His Leu Pro 180 185 190 Val Ile Gly His Cys Arg Asn Gln Ala Val Ser His Tyr Leu Thr His 195 200 205 Trp Leu Asp Tyr Pro His Leu Pro Tyr Ser Pro Glu 210 215 220 <210> 86 <211> 355 <212> PRT <213> Shigella flexneri <400> 86 Met Ser Gln Lys Tyr Leu Phe Ile Asp Arg Asp Gly Thr Leu Ile Ser 1 5 10 15 Glu Pro Pro Ser Asp Phe Gln Val Asp Arg Phe Asp Lys Leu Ala Phe 20 25 30 Glu Pro Gly Val Ile Pro Glu Leu Leu Lys Leu Gln Lys Ala Gly Tyr 35 40 45 Lys Leu Val Met Ile Thr Asn Gln Asp Gly Leu Gly Thr Gln Ser Phe 50 55 60 Pro Gln Ala Asp Phe Asp Gly Pro His Asn Leu Met Met Gln Ile Phe 65 70 75 80 Thr Ser Gln Gly Val Gln Phe Asp Glu Val Leu Ile Cys Pro His Leu 85 90 95 Pro Ala Asp Glu Cys Asp Cys Arg Lys Pro Lys Val Lys Leu Val Glu 100 105 110 Arg Tyr Leu Ala Glu Gln Ala Met Asp Arg Ala Asn Ser Tyr Val Ile 115 120 125 Gly Asp Arg Ala Thr Asp Ile Gln Leu Ala Glu Asn Met Gly Ile Thr 130 135 140 Gly Leu Arg Tyr Asp Arg Glu Thr Leu Asn Trp Pro Met Ile Gly Glu 145 150 155 160 Gln Leu Thr Lys Arg Asp Arg Tyr Ala His Val Val Arg Asn Thr Lys 165 170 175 Glu Thr Gln Ile Asp Val Gln Val Trp Leu Asp Arg Glu Gly Gly Ser 180 185 190 Lys Ile Asn Thr Gly Val Gly Phe Phe Asp His Met Leu Asp Gln Ile 195 200 205 Ala Thr His Gly Gly Phe Arg Met Glu Ile Asn Val Lys Gly Asp Leu 210 215 220 Tyr Ile Asp Asp His His Thr Val Glu Asp Thr Gly Leu Ala Leu Gly 225 230 235 240 Glu Ala Leu Lys Ile Ala Leu Gly Asp Lys Arg Gly Ile Cys Arg Phe 245 250 255 Gly Phe Val Leu Pro Met Asp Glu Cys Leu Ala Arg Cys Ala Leu Asp 260 265 270 Ile Ser Gly Arg Pro His Leu Glu Tyr Lys Ala Glu Phe Thr Tyr Gln 275 280 285 Arg Val Gly Asp Leu Ser Thr Glu Met Ile Glu His Phe Phe Arg Ser 290 295 300 Leu Ser Tyr Thr Met Gly Val Thr Leu His Leu Lys Thr Lys Gly Lys 305 310 315 320 Asn Asp His His Arg Val Glu Ser Leu Phe Lys Ala Phe Gly Arg Thr 325 330 335 Leu Arg Gln Ala Met Arg Val Glu Gly Asp Thr Leu Pro Ser Ser Lys 340 345 350 Gly Val Leu 355 <210> 87 <211> 355 <212> PRT <213> Escherichia albertii <400> 87 Met Ser Gln Lys Tyr Leu Phe Ile Asp Arg Asp Gly Thr Leu Ile Ser 1 5 10 15 Glu Pro Pro Ser Asp Phe Gln Val Asp Arg Phe Asp Lys Leu Ala Phe 20 25 30 Glu Pro Gly Val Ile Pro Glu Leu Leu Lys Leu Gln Lys Ala Gly Tyr 35 40 45 Lys Leu Val Met Ile Thr Asn Gln Asp Gly Leu Gly Thr Gln Ser Phe 50 55 60 Pro Gln Ala Asp Phe Asp Gly Pro His Asn Leu Met Met Gln Ile Phe 65 70 75 80 Thr Ser Gln Gly Val Gln Phe Asp Glu Val Leu Ile Cys Pro His Leu 85 90 95 Pro Ala Asp Glu Cys Asp Cys Arg Lys Pro Lys Val Lys Leu Val Glu 100 105 110 Arg Tyr Leu Ala Glu Gln Ala Met Asp Arg Ala Asn Ser Tyr Val Ile 115 120 125 Gly Asp Arg Ala Thr Asp Ile Gln Leu Ala Glu Asn Met Gly Ile Thr 130 135 140 Gly Leu Arg Tyr Asp Arg Glu Thr Leu Asn Trp Pro Met Ile Gly Glu 145 150 155 160 Gln Leu Thr Lys Arg Asp Arg Tyr Ala His Val Val Arg Asn Thr Lys 165 170 175 Glu Thr Gln Ile Asp Val Gln Val Trp Leu Asp Arg Glu Gly Asp Ser 180 185 190 Lys Ile Asn Thr Gly Val Gly Phe Phe Asp His Met Leu Asp Gln Ile 195 200 205 Ala Thr His Gly Gly Phe Arg Met Glu Ile Asn Val Lys Gly Asp Leu 210 215 220 Tyr Ile Asp Asp His His Thr Val Glu Asp Thr Gly Leu Ala Leu Gly 225 230 235 240 Glu Ala Leu Lys Ile Ala Leu Gly Asp Lys Arg Gly Ile Cys Arg Phe 245 250 255 Gly Phe Val Leu Pro Met Asp Glu Cys Leu Ala Arg Cys Ala Met Asp 260 265 270 Ile Ser Gly Arg Pro His Leu Glu Tyr Lys Ala Glu Phe Thr Tyr Gln 275 280 285 Arg Val Gly Asp Leu Ser Thr Glu Met Ile Glu His Phe Phe Arg Ser 290 295 300 Leu Ser Tyr Thr Met Gly Val Thr Leu His Leu Lys Thr Lys Gly Lys 305 310 315 320 Asn Asp His His Arg Val Glu Ser Leu Phe Lys Ala Phe Gly Arg Thr 325 330 335 Leu Arg Gln Ala Ile Arg Val Glu Gly Asp Thr Leu Pro Ser Ser Lys 340 345 350 Gly Val Leu 355 <210> 88 <211> 355 <212> PRT <213> Shigella flexneri <400> 88 Met Ser Gln Lys Tyr Leu Phe Ile Asp Arg Asp Gly Thr Leu Ile Ser 1 5 10 15 Glu Pro Pro Ser Asp Phe Gln Val Asp Arg Phe Asp Lys Leu Ala Phe 20 25 30 Glu Pro Gly Val Ile Pro Glu Leu Leu Lys Leu Gln Lys Ala Gly Tyr 35 40 45 Lys Leu Val Met Ile Thr Asn Gln Asp Gly Leu Gly Thr Gln Ser Phe 50 55 60 Pro Gln Ala Asp Phe Asp Gly Pro His Asn Leu Met Met Gln Ile Phe 65 70 75 80 Thr Ser Gln Gly Val Gln Phe Asp Glu Val Leu Ile Cys Pro His Leu 85 90 95 Pro Ala Asp Glu Cys Asp Cys Arg Lys Pro Lys Val Lys Leu Val Glu 100 105 110 Gly Tyr Leu Ala Glu Gln Ala Met Asp Arg Ala Asn Ser Tyr Val Ile 115 120 125 Gly Asp Arg Ala Thr Asp Ile Gln Leu Ala Glu Asn Met Gly Ile Asn 130 135 140 Gly Leu Arg Tyr Asp Arg Glu Thr Leu Asn Trp Pro Met Ile Gly Glu 145 150 155 160 Gln Leu Thr Lys Arg Asp Arg Tyr Ala His Val Val Arg Asn Thr Lys 165 170 175 Glu Thr Gln Ile Asp Val Gln Val Trp Leu Asp Arg Glu Gly Gly Ser 180 185 190 Lys Ile Asn Thr Gly Val Gly Phe Phe Asp His Met Leu Asp Gln Ile 195 200 205 Ala Thr His Gly Gly Phe Arg Met Glu Ile Asn Val Lys Gly Asp Leu 210 215 220 Tyr Ile Asp Asp His His Thr Val Glu Asp Thr Gly Leu Ala Leu Gly 225 230 235 240 Glu Ala Leu Lys Ile Ala Leu Gly Asp Lys Arg Gly Ile Cys Arg Phe 245 250 255 Gly Phe Val Leu Pro Met Asp Glu Cys Leu Ala Arg Cys Ala Leu Asp 260 265 270 Ile Ser Gly Arg Pro His Leu Glu Tyr Lys Ala Glu Phe Thr Tyr Gln 275 280 285 Arg Val Gly Asp Leu Ser Thr Glu Met Ile Glu His Phe Phe Arg Ser 290 295 300 Leu Ser Tyr Thr Met Gly Val Thr Leu His Leu Lys Thr Lys Gly Lys 305 310 315 320 Asn Asp His His Arg Val Glu Ser Leu Phe Lys Ala Phe Gly Arg Thr 325 330 335 Leu Arg Gln Ala Leu Arg Val Glu Gly Asp Thr Leu Pro Ser Ser Lys 340 345 350 Gly Val Leu 355 <210> 89 <211> 355 <212> PRT <213> Shigella sonnei <400> 89 Met Ser Gln Lys Tyr Leu Phe Ile Asp Arg Asp Gly Thr Leu Ile Ser 1 5 10 15 Glu Pro Pro Ser Asp Phe Gln Val Asp Arg Phe Asp Lys Leu Ala Phe 20 25 30 Glu Pro Gly Val Ile Pro Glu Leu Leu Lys Leu Gln Lys Ala Gly Tyr 35 40 45 Lys Leu Val Met Ile Thr Asn Gln Asp Gly Leu Gly Thr Gln Ser Phe 50 55 60 Pro Gln Ala Asp Phe Asp Gly Pro His Asn Leu Met Met Gln Ile Phe 65 70 75 80 Thr Ser Gln Gly Val Gln Phe Asp Glu Val Leu Ile Cys Pro Pro Leu 85 90 95 Pro Ala Asp Glu Cys Asp Cys Arg Lys Pro Lys Val Lys Leu Val Glu 100 105 110 Arg Tyr Leu Ala Glu Gln Ala Met Asp Arg Ala Asn Ser Tyr Val Ile 115 120 125 Gly Asp Arg Ala Thr Asp Ile Gln Leu Ala Glu Asn Met Gly Ile Asn 130 135 140 Gly Leu Arg Tyr Asp Arg Glu Ile Leu Asn Trp Pro Met Ile Gly Glu 145 150 155 160 Gln Leu Thr Lys Arg Asp Arg Tyr Ala His Val Val Arg Asn Thr Lys 165 170 175 Glu Thr Gln Ile Asp Val Gln Val Trp Leu Asp Arg Glu Gly Gly Ser 180 185 190 Lys Ile Asn Thr Gly Val Gly Phe Phe Asp His Met Leu Asp Gln Ile 195 200 205 Ala Thr His Gly Gly Phe Arg Met Glu Ile Asn Val Lys Gly Asp Leu 210 215 220 Tyr Ile Asp Asp His His Thr Val Glu Asp Thr Gly Leu Ala Leu Gly 225 230 235 240 Glu Ala Leu Lys Met Ala Leu Gly Asp Lys Arg Gly Ile Cys Arg Phe 245 250 255 Gly Phe Val Leu Pro Met Asp Glu Cys Leu Ala Arg Cys Ala Leu Asp 260 265 270 Ile Ser Gly Arg Pro His Leu Glu Tyr Lys Ala Glu Phe Thr Tyr Gln 275 280 285 Arg Val Gly Asp Leu Ser Thr Glu Met Ile Glu His Phe Phe Arg Ser 290 295 300 Leu Ser Tyr Thr Met Gly Val Thr Leu His Leu Lys Thr Lys Gly Lys 305 310 315 320 Asn Asp His His Arg Val Glu Ser Leu Phe Lys Ala Phe Gly Arg Thr 325 330 335 Leu Arg Gln Ala Ile Arg Val Glu Gly Asp Thr Leu Pro Ser Ser Lys 340 345 350 Gly Val Leu 355 <210> 90 <211> 355 <212> PRT <213> Escherichia coli <400> 90 Met Ser Gln Lys Tyr Leu Phe Ile Asp Arg Asp Gly Thr Leu Ile Ser 1 5 10 15 Glu Pro Pro Ser Asp Phe Gln Val Asp Arg Phe Asp Lys Leu Ala Phe 20 25 30 Glu Pro Gly Val Ile Pro Gln Leu Leu Lys Leu Gln Lys Ala Gly Tyr 35 40 45 Lys Leu Val Met Ile Thr Asn Gln Asp Gly Leu Gly Thr Gln Ser Phe 50 55 60 Pro Gln Ala Asp Phe Asp Gly Pro His Asn Leu Met Met Gln Ile Phe 65 70 75 80 Thr Ser Gln Gly Val Gln Phe Asp Glu Val Leu Ile Cys Pro His Leu 85 90 95 Pro Ser Asp Glu Cys Asp Cys Arg Lys Pro Lys Val Lys Leu Val Glu 100 105 110 Arg Tyr Leu Ala Glu Gln Ala Met Asp Arg Ala Asn Ser Tyr Val Ile 115 120 125 Gly Asp Arg Ala Thr Asp Ile Gln Leu Ala Glu Asn Met Gly Ile Asn 130 135 140 Gly Leu Arg Tyr Asp Arg Glu Thr Leu Asn Trp Pro Met Ile Gly Glu 145 150 155 160 Gln Leu Ile Lys Arg Asp Arg Tyr Ala His Val Val Arg Asn Thr Lys 165 170 175 Glu Thr Gln Ile Asp Val Gln Val Trp Leu Asp Arg Glu Gly Gly Ser 180 185 190 Lys Ile Asn Thr Gly Val Gly Phe Phe Asp His Met Leu Asp Gln Ile 195 200 205 Ala Thr His Gly Gly Phe Arg Met Glu Ile Asn Val Lys Gly Asp Leu 210 215 220 Tyr Ile Asp Asp His His Thr Val Glu Asp Thr Gly Leu Ala Leu Gly 225 230 235 240 Glu Ala Leu Lys Ile Ala Leu Gly Asp Lys Arg Gly Ile Cys Arg Phe 245 250 255 Gly Phe Val Leu Pro Met Asp Glu Cys Leu Ala Arg Cys Ala Leu Asp 260 265 270 Ile Ser Gly Arg Pro His Leu Glu Tyr Lys Ala Glu Phe Thr Tyr Gln 275 280 285 Arg Val Gly Asp Leu Ser Thr Glu Met Ile Glu His Phe Phe Arg Ser 290 295 300 Leu Ser Tyr Thr Met Gly Val Thr Leu His Leu Lys Thr Lys Gly Lys 305 310 315 320 Asn Asp His His Arg Val Glu Ser Leu Phe Lys Ala Phe Gly Arg Thr 325 330 335 Leu Arg Gln Ala Ile Arg Val Glu Gly Asp Thr Leu Pro Ser Ser Lys 340 345 350 Gly Val Leu 355 <210> 91 <211> 355 <212> PRT <213> Shigella dysenteriae <400> 91 Met Ser Gln Lys Tyr Leu Phe Ile Asp Arg Asp Gly Thr Leu Ile Ser 1 5 10 15 Glu Pro Pro Ser Asp Phe Gln Val Asp Arg Phe Asp Lys Leu Ala Phe 20 25 30 Glu Pro Gly Val Ile Pro Glu Leu Leu Lys Leu Gln Lys Ala Gly Tyr 35 40 45 Lys Leu Val Met Ile Thr Asn Gln Asp Gly Leu Gly Thr Gln Ser Phe 50 55 60 Pro Gln Ala Asp Phe Asp Gly Pro His Asn Leu Met Met Gln Ile Phe 65 70 75 80 Thr Ser Gln Gly Val Gln Phe Asp Glu Val Leu Ile Cys Pro His Leu 85 90 95 Pro Ala Asp Glu Cys Asp Cys Arg Lys Pro Lys Val Lys Leu Val Glu 100 105 110 Arg Tyr Leu Ala Glu Gln Ala Met Asp Arg Ala Asn Ser Tyr Val Ile 115 120 125 Gly Asp Arg Ala Thr Asp Ile Gln Leu Ala Glu Asn Met Gly Ile Asn 130 135 140 Gly Leu Arg Tyr Asp Cys Glu Ile Leu Ser Trp Pro Met Ile Gly Glu 145 150 155 160 Gln Leu Thr Lys Arg Asp Arg Tyr Ala His Val Val Arg Asn Thr Lys 165 170 175 Glu Thr Gln Ile Asp Val Arg Val Trp Leu Asp Arg Glu Gly Gly Ser 180 185 190 Lys Ile Asn Thr Gly Val Gly Phe Phe Asp His Met Leu Asp Gln Ile 195 200 205 Ala Thr His Gly Gly Phe Arg Met Glu Ile Asn Val Lys Gly Asp Leu 210 215 220 Tyr Ile Asp Asp His His Thr Val Glu Asp Thr Gly Leu Ala Leu Gly 225 230 235 240 Glu Ala Leu Lys Met Ala Leu Gly Asp Lys Arg Gly Ile Cys Arg Phe 245 250 255 Gly Phe Val Leu Pro Met Asp Glu Cys Leu Ala Arg Cys Ala Leu Asp 260 265 270 Ile Ser Gly Arg Pro His Leu Glu Tyr Lys Ala Glu Phe Thr Tyr Gln 275 280 285 Arg Val Gly Asp Leu Ser Thr Glu Met Ile Glu His Phe Phe Arg Ser 290 295 300 Leu Ser Tyr Thr Met Gly Val Thr Leu His Leu Lys Thr Lys Gly Lys 305 310 315 320 Asn Asp His His Arg Val Glu Ser Leu Phe Lys Ala Phe Gly Arg Thr 325 330 335 Leu Arg Gln Ala Ile Arg Val Glu Gly Asp Thr Leu Pro Ser Ser Lys 340 345 350 Gly Val Leu 355 <210> 92 <211> 355 <212> PRT <213> Escherichia marmotae <400> 92 Met Ser Gln Lys Tyr Leu Phe Ile Asp Arg Asp Gly Thr Leu Ile Ser 1 5 10 15 Glu Pro Pro Ser Asp Phe Gln Val Asp Arg Phe Asp Lys Leu Ala Phe 20 25 30 Glu Pro Gly Val Ile Pro Glu Leu Leu Lys Leu Gln Lys Ala Gly Tyr 35 40 45 Lys Leu Val Met Ile Thr Asn Gln Asp Gly Leu Gly Thr Gln Arg Phe 50 55 60 Pro Gln Ala Asp Phe Asp Gly Pro His Asn Leu Met Met Gln Ile Phe 65 70 75 80 Thr Ser Gln Gly Val Gln Phe Asp Glu Val Leu Ile Cys Pro His Leu 85 90 95 Pro Asp Asp Glu Cys Asp Cys Arg Lys Pro Lys Val Lys Leu Val Glu 100 105 110 Arg Tyr Leu Ala Glu Gln Ala Met Asp Arg Ala Ser Ser Tyr Val Ile 115 120 125 Gly Asp Arg Ala Thr Asp Ile Gln Leu Ala Glu Asn Met Gly Ile Asn 130 135 140 Gly Leu Arg Tyr Asn Arg Glu Thr Leu Asn Trp Pro Met Ile Gly Glu 145 150 155 160 Gln Leu Thr Lys Arg Asn Arg Tyr Ala His Val Val Arg Asn Thr Lys 165 170 175 Glu Thr Gln Ile Asp Val Gln Val Trp Leu Asp Arg Glu Gly Gly Ser 180 185 190 Lys Ile Asn Thr Gly Val Gly Phe Phe Asp His Met Leu Asp Gln Ile 195 200 205 Ala Thr His Gly Gly Phe Arg Met Glu Ile Asn Val Lys Gly Asp Leu 210 215 220 Tyr Ile Asp Asp His His Thr Val Glu Asp Thr Gly Leu Ala Leu Gly 225 230 235 240 Glu Ala Leu Lys Ile Ala Leu Gly Asp Lys Arg Gly Ile Cys Arg Phe 245 250 255 Gly Phe Val Leu Pro Met Asp Glu Cys Leu Ala Arg Cys Ala Leu Asp 260 265 270 Ile Ser Gly Arg Pro His Leu Glu Tyr Lys Ala Glu Phe Thr Tyr Gln 275 280 285 Arg Val Gly Asp Leu Ser Thr Glu Met Ile Glu His Phe Phe Arg Ser 290 295 300 Leu Ser Tyr Thr Met Gly Val Thr Leu His Leu Lys Thr Lys Gly Lys 305 310 315 320 Asn Asp His His Arg Val Glu Ser Leu Phe Lys Ala Phe Gly Arg Thr 325 330 335 Leu Arg Gln Ala Ile Arg Val Glu Gly Asp Thr Leu Pro Ser Ser Lys 340 345 350 Gly Val Leu 355 <210> 93 <211> 355 <212> PRT <213> Salmonella bongori <400> 93 Met Ser Gln Lys Tyr Leu Phe Ile Asp Arg Asp Gly Thr Leu Ile Ser 1 5 10 15 Glu Pro Pro Ser Asp Phe Gln Val Asp Arg Phe Asp Lys Leu Ala Phe 20 25 30 Glu Pro Glu Val Ile Pro Val Leu Leu Lys Leu Gln Lys Ala Gly Phe 35 40 45 Lys Leu Val Met Ile Thr Asn Gln Asp Gly Leu Gly Thr Gln Ser Phe 50 55 60 Pro Gln Ala Asp Phe Asp Gly Pro His Asn Leu Met Met Gln Val Phe 65 70 75 80 Thr Ser Gln Gly Val His Phe Asp Glu Val Leu Ile Cys Pro His Leu 85 90 95 Pro Ala Asp Glu Cys Asp Cys Arg Lys Pro Lys Ile Lys Leu Val Glu 100 105 110 Arg Tyr Leu Ala Glu Gln Ala Met Asp Ser Ala Asn Ser Tyr Val Ile 115 120 125 Gly Asp Arg Ala Thr Asp Val Gln Leu Ala Asp Asn Met Gly Ile Thr 130 135 140 Gly Leu Arg Tyr His Arg Glu Thr Leu Asn Trp Ser Met Ile Gly Glu 145 150 155 160 Gln Leu Thr Lys Arg Asp Arg Tyr Ala His Val Ile Arg Asn Thr Lys 165 170 175 Glu Thr Gln Ile Asp Val Arg Val Trp Leu Asp Arg Glu Gly Asn Ser 180 185 190 Lys Ile Asn Thr Gly Val Gly Phe Phe Asp His Met Leu Asp Gln Ile 195 200 205 Ala Thr His Gly Gly Phe Arg Met Asp Val Thr Val Lys Gly Asp Leu 210 215 220 Tyr Ile Asp Asp His His Thr Val Glu Asp Thr Gly Leu Ala Leu Gly 225 230 235 240 Glu Ala Leu Lys Leu Ala Leu Gly Asp Lys Arg Gly Ile Cys Arg Phe 245 250 255 Gly Phe Val Leu Pro Met Asp Glu Cys Leu Ala Arg Cys Ala Leu Asp 260 265 270 Ile Ser Gly Arg Pro His Leu Glu Tyr Lys Ala Glu Phe Thr Tyr Gln 275 280 285 Arg Val Gly Asp Leu Ser Thr Glu Met Ile Glu His Phe Phe Arg Ser 290 295 300 Leu Ser Tyr Thr Met Gly Val Thr Leu His Leu Lys Thr Lys Gly Lys 305 310 315 320 Asn Asp His His Arg Val Glu Ser Leu Phe Lys Ala Phe Gly Arg Thr 325 330 335 Leu Arg Gln Ala Ile Arg Val Glu Gly Asp Thr Leu Pro Ser Ser Lys 340 345 350 Gly Val Leu 355 <210> 94 <211> 266 <212> PRT <213> Shigella sonnei <400> 94 Met Thr Glu Pro Leu Thr Glu Thr Pro Glu Leu Ser Ala Lys Tyr Ala 1 5 10 15 Trp Phe Phe Asp Leu Asp Gly Thr Leu Ala Glu Ile Lys Pro His Pro 20 25 30 Asp Gln Val Val Val Pro Asp Asn Ile Leu Gln Gly Leu Gln Leu Leu 35 40 45 Ala Thr Ala Ser Asp Gly Ala Leu Ala Leu Ile Ser Gly Arg Ser Met 50 55 60 Val Glu Leu Asp Ala Leu Ala Lys Pro Tyr Arg Phe Pro Leu Ala Gly 65 70 75 80 Val His Gly Ala Glu Arg Arg Asp Ile Asn Gly Lys Thr His Ile Val 85 90 95 His Leu Pro Asp Ala Ile Ala Arg Asp Ile Ser Val Gln Leu His Thr 100 105 110 Val Ile Ala Gln Tyr Pro Gly Ala Glu Leu Glu Ala Lys Gly Met Ala 115 120 125 Phe Ala Leu His Tyr Arg Gln Ala Pro Gln His Glu Asp Ala Leu Met 130 135 140 Thr Leu Ala Gln Arg Ile Thr Gln Ile Trp Pro Gln Met Ala Leu Gln 145 150 155 160 Gln Gly Lys Cys Val Val Glu Ile Lys Pro Arg Gly Thr Ser Lys Gly 165 170 175 Glu Ala Ile Ala Ala Phe Met Gln Glu Ala Pro Phe Ile Gly Arg Thr 180 185 190 Pro Val Phe Leu Gly Asp Asp Leu Thr Asp Glu Ser Gly Phe Ala Val 195 200 205 Val Asn Arg Leu Gly Gly Met Ser Val Lys Ile Gly Thr Gly Ala Thr 210 215 220 Gln Ala Ser Trp Arg Leu Ala Gly Val Pro Asp Val Trp Ser Trp Leu 225 230 235 240 Glu Met Ile Ser Thr Ala Leu Gln Gln Lys Arg Glu Asn Asn Arg Ser 245 250 255 Asp Asp Tyr Glu Ser Phe Ser Arg Ser Ile 260 265 <210> 95 <211> 266 <212> PRT <213> Escherichia coli <400> 95 Met Thr Glu Pro Leu Thr Glu Thr Pro Glu Leu Ser Ala Lys Tyr Ala 1 5 10 15 Trp Phe Phe Asp Leu Asp Gly Thr Leu Ala Glu Ile Lys Pro His Pro 20 25 30 Asp Gln Val Val Val Pro Asp Asn Ile Leu Gln Gly Leu Gln Leu Leu 35 40 45 Ala Thr Ala Ser Asp Gly Ala Leu Ala Leu Ile Ser Gly Arg Ser Met 50 55 60 Val Glu Leu Asp Ala Leu Ala Lys Pro Tyr Arg Phe Pro Leu Ala Gly 65 70 75 80 Val His Gly Ala Glu Arg Arg Asp Ile Asn Gly Lys Thr His Ile Val 85 90 95 His Leu Pro Asp Ala Ile Ala Arg Asp Ile Ser Val Gln Leu His Thr 100 105 110 Val Ile Ala Gln Tyr Pro Gly Ala Glu Leu Glu Ala Lys Gly Met Ala 115 120 125 Phe Ala Leu His Tyr Arg Gln Ala Pro Gln His Glu Asp Ala Leu Met 130 135 140 Thr Leu Ala Gln Arg Ile Thr Gln Ile Trp Pro Gln Met Ala Leu Gln 145 150 155 160 Gln Gly Lys Cys Val Val Glu Ile Lys Pro Arg Gly Thr Ser Lys Gly 165 170 175 Glu Ala Ile Ala Ala Phe Met Gln Glu Ala Pro Phe Ile Gly Arg Thr 180 185 190 Pro Val Phe Leu Gly Asp Asp Leu Thr Asp Glu Ser Gly Phe Ala Val 195 200 205 Val Asn Arg Leu Gly Gly Met Ser Ile Lys Ile Gly Thr Gly Ala Thr 210 215 220 Gln Ala Ser Trp Arg Leu Ala Gly Val Pro Asp Val Trp Ser Trp Leu 225 230 235 240 Glu Met Ile Thr Thr Ala Leu Gln Gln Lys Arg Glu Asn Asn Arg Ser 245 250 255 Asp Asp Tyr Glu Ser Phe Ser Arg Ser Ile 260 265 <210> 96 <211> 266 <212> PRT <213> Shigella flexneri <400> 96 Met Thr Glu Pro Leu Thr Glu Thr Pro Glu Leu Ser Ala Lys Tyr Ala 1 5 10 15 Trp Phe Phe Asp Leu Asp Gly Thr Leu Ala Glu Ile Lys Pro His Pro 20 25 30 Asp Gln Val Val Val Pro Asp Asn Ile Leu Gln Gly Leu Gln Leu Leu 35 40 45 Ala Thr Ala Ser Asp Gly Ala Leu Ala Leu Ile Ser Gly Arg Ser Met 50 55 60 Val Glu Leu Asp Ala Leu Ala Lys Pro Tyr Arg Phe Pro Leu Ala Gly 65 70 75 80 Val His Gly Ala Glu Arg Arg Asp Ile Asn Gly Lys Thr His Ile Val 85 90 95 His Leu Pro Asp Ala Ile Ala Arg Asp Ile Ser Val Gln Leu His Thr 100 105 110 Val Ile Ala Gln Tyr Pro Gly Ala Glu Leu Glu Ala Lys Gly Met Ala 115 120 125 Phe Ala Leu His Tyr Arg Gln Ala Pro Gln His Glu Asp Ala Leu Met 130 135 140 Thr Leu Ala Gln Arg Ile Thr Gln Ile Trp Pro Gln Met Ala Leu Gln 145 150 155 160 Gln Gly Lys Cys Val Val Glu Ile Lys Pro Arg Gly Thr Ser Lys Gly 165 170 175 Glu Ala Ile Ala Ala Phe Met Gln Glu Ala Pro Phe Ile Gly Arg Thr 180 185 190 Pro Val Phe Leu Gly Asp Asp Leu Thr Asp Glu Ser Gly Phe Ala Val 195 200 205 Val Asn Arg Leu Gly Gly Met Ser Val Lys Ile Gly Thr Gly Ala Thr 210 215 220 Gln Ala Ser Trp Arg Leu Ala Gly Val Pro Asp Val Trp Ser Trp Leu 225 230 235 240 Lys Met Ile Thr Ala Ala Leu Gln Gln Lys Arg Glu Asn Asn Arg Ser 245 250 255 Asp Asp Tyr Glu Ser Phe Ser Arg Ser Ile 260 265 <210> 97 <211> 265 <212> PRT <213> Escherichia albertii <400> 97 Met Thr Glu Pro Leu Thr Ala Leu Pro Glu Leu Ser Ala Lys Tyr Ala 1 5 10 15 Trp Phe Phe Asp Leu Asp Gly Thr Leu Ala Glu Ile Lys Pro His Pro 20 25 30 Asp Gln Val Ala Val Pro Asp Lys Ile Leu Gln Gly Leu Gln Arg Leu 35 40 45 Ala Thr Ile Ser His Gly Ala Leu Ala Leu Ile Ser Gly Arg Ser Met 50 55 60 Val Glu Leu Asp Ala Leu Val Asn Pro Tyr Arg Phe Pro Leu Ala Gly 65 70 75 80 Val His Gly Ala Glu Arg Arg Asp Ile Asn Gly Lys Thr His Ile Val 85 90 95 His Leu Pro Lys Ala Met Ala Arg Asp Ile Cys Val Gln Leu His Met 100 105 110 Ala Ile Ala Arg Phe Pro Gly Ala Glu Leu Glu Glu Lys Gly Met Ala 115 120 125 Phe Ala Leu His Tyr Arg Gln Val Pro Gln Tyr Glu Asp Ala Leu Leu 130 135 140 Thr Leu Ala Arg His Ile Thr Gln Thr Trp Pro Gln Met Val Leu Gln 145 150 155 160 Gln Gly Lys Cys Val Val Glu Ile Lys Pro Gly Gly Thr Ser Lys Gly 165 170 175 Glu Ala Ile Val Ala Phe Met Gln Glu Thr Pro Phe Ile Gly Arg Lys 180 185 190 Pro Val Phe Leu Gly Asp Asp Leu Thr Asp Glu Ser Gly Phe Ala Val 195 200 205 Val Asn Arg Leu Gly Gly Ile Ser Val Lys Ile Gly Thr Gly Ala Thr 210 215 220 Gln Ala Ser Trp Arg Met Ala Gly Val Pro Asp Val Trp Arg Trp Leu 225 230 235 240 Glu Met Ile Thr His Ala Leu Gln Lys Arg Ala Asn Asp Arg Ser Asp 245 250 255 Asn Asp Glu Pro Phe Ser Arg Ser Ile 260 265 <210> 98 <211> 267 <212> PRT <213> Escherichia fergusonii <400> 98 Met Thr Lys Pro Leu Thr Glu Ala Pro Glu Leu Ser Ala Lys Tyr Ala 1 5 10 15 Trp Phe Phe Asp Leu Asp Gly Thr Leu Ala Glu Ile Lys Pro His Pro 20 25 30 Asp Gln Val Ala Ile Pro Asp Ala Ile Leu Gln Gly Leu Gln Gln Leu 35 40 45 Ala Val His Ser Asp Gly Ala Leu Ala Leu Ile Ser Gly Arg Ser Met 50 55 60 Val Glu Leu Asp Thr Leu Ala Lys Pro Tyr Arg Phe Pro Leu Ala Gly 65 70 75 80 Val His Gly Ala Glu Arg Arg Asp Ile Asn Gly Lys Thr His Ile Val 85 90 95 Arg Leu Pro Asp Ala Met Val Arg Asp Ile Ser Val Gln Leu His Thr 100 105 110 Thr Leu Ala Gly Leu Thr Gly Val Glu Ile Glu Glu Lys Gly Met Ala 115 120 125 Phe Ala Leu His Tyr Arg Gln Ala Pro Gln His Glu Ala Leu Leu Phe 130 135 140 Thr Leu Ala Gln Arg Ile Thr Gln Ile Trp Pro Gln Met Ala Leu Gln 145 150 155 160 Gln Gly Lys Cys Val Val Glu Ile Lys Pro Arg Gly Thr Cys Lys Gly 165 170 175 Asp Ala Ile Ala Glu Phe Met Gln Glu Thr Pro Phe Val Gly Arg Ile 180 185 190 Pro Ile Phe Trp Gly Asp Asp Leu Thr Asp Glu Ser Gly Phe Ala Val 195 200 205 Val Asn Gln Ala Gly Gly Ile Ser Val Lys Ile Gly Ala Gly Glu Thr 210 215 220 Gln Ala Lys Trp Arg Leu Ala Gly Val Pro Asp Val Trp Arg Trp Leu 225 230 235 240 Ala Val Ile Thr Asn Ser Leu Gln Glu Gln Lys Leu Glu Glu Asn Arg 245 250 255 Ser Asp Asp Tyr Glu Ser Phe Ser Arg Ser Ile 260 265 <210> 99 <211> 191 <212> PRT <213> Escherichia fergusonii <400> 99 Met Ala Lys Ser Val Pro Ala Ile Phe Leu Asp Arg Asp Gly Thr Ile 1 5 10 15 Asn Val Asp His Gly Tyr Val His Glu Ile Asp Asn Phe Glu Phe Ile 20 25 30 Asp Gly Val Ile Asp Ala Met Arg Glu Leu Lys Lys Met Gly Phe Ala 35 40 45 Leu Val Val Val Thr Asn Gln Ser Gly Ile Ala Arg Gly Lys Phe Thr 50 55 60 Glu Ala Gln Phe Glu Thr Leu Thr Glu Trp Met Asp Trp Ser Leu Ala 65 70 75 80 Asp Arg Asp Val Asp Leu Asp Gly Ile Tyr Tyr Cys Pro His His Pro 85 90 95 Gln Gly Ser Val Glu Glu Phe Arg Gln Val Cys Asp Cys Arg Lys Pro 100 105 110 His Pro Gly Met Leu Leu Ser Ala Arg Asp Tyr Leu His Ile Asp Met 115 120 125 Ala Ala Ser Tyr Met Val Gly Asp Lys Leu Glu Asp Met Gln Ala Ala 130 135 140 Thr Ala Ala Asn Val Gly Thr Lys Val Leu Val Arg Thr Gly Lys Pro 145 150 155 160 Ile Thr Pro Glu Ala Glu Asn Ala Ala Asp Trp Val Leu Asn Ser Leu 165 170 175 Ala Asp Leu Pro Gln Ala Ile Lys Lys Gln Gln Lys Pro Ala Gln 180 185 190 <210> 100 <211> 191 <212> PRT <213> Shigella sonnei <400> 100 Met Ala Lys Ser Val Pro Ala Ile Phe Leu Asp Arg Asp Gly Thr Ile 1 5 10 15 Asn Val Asp His Gly Tyr Val His Glu Ile Asp Asn Phe Glu Phe Ile 20 25 30 Asp Gly Val Ile Asp Ala Met Arg Glu Leu Lys Lys Met Gly Phe Ala 35 40 45 Leu Val Val Val Thr Asn Gln Ser Gly Ile Ala Arg Gly Lys Phe Thr 50 55 60 Glu Ala Gln Phe Glu Thr Leu Thr Glu Trp Met Asp Trp Ser Leu Ala 65 70 75 80 Asp Arg Asp Val Asp Leu Asp Gly Ile Tyr Tyr Cys Pro His His Pro 85 90 95 Gln Gly Ser Val Glu Glu Phe Arg Gln Val Cys Asp Cys Arg Lys Pro 100 105 110 His Pro Gly Met Leu Leu Ser Ala Arg Asp Tyr Leu His Ile Asp Met 115 120 125 Ala Ala Ser Tyr Met Val Gly Asp Lys Leu Glu Asp Met Gln Ala Ala 130 135 140 Val Ala Ala Asn Val Gly Thr Lys Val Leu Val Arg Thr Gly Lys Pro 145 150 155 160 Ile Thr Pro Glu Ala Glu Asn Ala Ala Asp Trp Met Leu Asn Ser Leu 165 170 175 Ala Asp Leu Pro Gln Ala Ile Lys Lys Gln Gln Lys Pro Ala Gln 180 185 190 <210> 101 <211> 191 <212> PRT <213> Escherichia coli <400> 101 Met Ala Lys Ser Val Pro Ala Ile Phe Leu Asp Arg Asp Gly Thr Ile 1 5 10 15 Asn Val Asp His Gly Tyr Val His Glu Ile Asp Asn Phe Glu Phe Ile 20 25 30 Asp Gly Val Ile Asp Ala Met Arg Glu Leu Lys Lys Met Gly Phe Ala 35 40 45 Leu Val Val Val Thr Asn Gln Ser Gly Ile Ala Arg Gly Lys Phe Thr 50 55 60 Glu Ala Gln Phe Glu Thr Leu Thr Glu Trp Met Asp Trp Ser Leu Ala 65 70 75 80 Asp Arg Asp Val Asp Leu Asp Gly Ile Tyr Tyr Cys Pro His His Pro 85 90 95 Gln Gly Ser Val Glu Glu Phe Arg Gln Leu Cys Asp Cys Arg Lys Pro 100 105 110 His Pro Gly Met Leu Leu Ser Ala Arg Asp Tyr Leu His Ile Asp Met 115 120 125 Ala Ala Ser Tyr Met Val Gly Asp Lys Leu Glu Asp Met Gln Ala Ala 130 135 140 Val Ala Ala Asn Val Gly Thr Lys Val Leu Val Arg Thr Gly Lys Pro 145 150 155 160 Ile Thr Pro Glu Ala Glu Asn Ala Ala Asp Trp Val Leu Asn Ser Leu 165 170 175 Ala Asp Leu Pro Gln Ala Ile Lys Lys Gln Gln Lys Pro Ala Arg 180 185 190 <210> 102 <211> 188 <212> PRT <213> Escherichia albertii <400> 102 Met Ala Lys Ser Val Pro Ala Ile Phe Leu Asp Arg Asp Gly Thr Ile 1 5 10 15 Asn Val Asp His Gly Tyr Val His Glu Ile Asp Asn Phe Glu Phe Ile 20 25 30 Asp Gly Val Ile Asp Ala Met Arg Glu Leu Lys Lys Met Gly Phe Ala 35 40 45 Leu Val Val Val Thr Asn Gln Ser Gly Ile Ala Arg Gly Lys Phe Thr 50 55 60 Glu Ala Gln Phe Glu Thr Leu Thr Glu Trp Met Asp Trp Ser Leu Ala 65 70 75 80 Asp Arg Asp Val Asp Leu Asp Gly Ile Tyr Tyr Cys Pro His His Pro 85 90 95 Gln Gly Ser Val Glu Glu Phe Arg Gln Val Cys Asp Cys Arg Lys Pro 100 105 110 His Pro Gly Met Leu Ile Ser Ala Arg Asp Tyr Leu His Ile Asp Met 115 120 125 Thr Ala Ser Tyr Met Val Gly Asp Lys Leu Glu Asp Met Gln Ala Ala 130 135 140 Ser Ala Ala Asn Val Gly Thr Lys Val Leu Val Arg Thr Gly Lys Pro 145 150 155 160 Val Thr Pro Glu Ala Glu Asp Ala Ala Asp Trp Val Leu Asn Ser Leu 165 170 175 Ala Asp Leu Pro Gln Ala Ile Lys Lys Gln Gln Lys 180 185 <210> 103 <211> 188 <212> PRT <213> Kluyvera intermedia <400> 103 Met Ala Lys Ser Val Pro Ala Ile Phe Leu Asp Arg Asp Gly Thr Ile 1 5 10 15 Asn Val Asp His Gly Tyr Val His Glu Ile Asp Asn Phe Glu Phe Ile 20 25 30 Glu Gly Val Ile Asp Ala Met Arg Glu Leu Lys Ala Met Gly Phe Ala 35 40 45 Leu Val Val Val Thr Asn Gln Ser Gly Ile Ala Arg Gly Lys Phe Thr 50 55 60 Glu Ala Gln Phe Glu Thr Leu Thr Glu Trp Met Asp Trp Ser Leu Ala 65 70 75 80 Asp Arg Asp Val Asp Leu Asp Gly Ile Tyr Tyr Cys Pro His His Pro 85 90 95 Gln Gly Thr Val Glu Glu Phe Arg Gln Val Cys Asp Cys Arg Lys Pro 100 105 110 His Pro Gly Met Leu Ile Ser Ala Arg Asp Tyr Leu His Ile Asp Met 115 120 125 Ser Ala Ser Tyr Met Val Gly Asp Lys Leu Glu Asp Met Gln Ala Ala 130 135 140 Ala Ala Ala Asp Val Gly Thr Lys Val Leu Val Arg Thr Gly Lys Pro 145 150 155 160 Val Thr Pro Glu Ala Glu Asn Ala Ala Asp Trp Val Ile Asn Ser Leu 165 170 175 Ala Asp Leu Pro Ala Ala Ile Lys Lys Gln Gln Lys 180 185 <210> 104 <211> 188 <212> PRT <213> Citrobacter koseri <400> 104 Met Ala Lys Ser Val Pro Ala Ile Phe Leu Asp Arg Asp Gly Thr Ile 1 5 10 15 Asn Val Asp His Gly Tyr Val His Glu Ile Asp Glu Phe Glu Phe Ile 20 25 30 Glu Gly Val Ile Asp Ala Met Arg Glu Leu Lys Lys Met Gly Phe Ala 35 40 45 Leu Val Val Val Thr Asn Gln Ser Gly Ile Ala Arg Gly Lys Phe Thr 50 55 60 Glu Ala Gln Phe Glu Thr Leu Thr Glu Trp Met Asp Trp Ser Leu Ala 65 70 75 80 Asp Arg Asp Val Asp Leu Asp Gly Ile Tyr Tyr Cys Pro His His Pro 85 90 95 Gln Gly Ser Val Glu Glu Phe Arg Gln Ala Cys Asp Cys Arg Lys Pro 100 105 110 His Pro Gly Met Leu Ile Ser Ala Arg Asp Phe Leu His Ile Asp Met 115 120 125 Ala Ala Ser Tyr Met Val Gly Asp Lys Ile Glu Asp Met Gln Ala Ala 130 135 140 Ala Ala Ala Asn Val Gly Thr Lys Val Leu Val Arg Thr Gly Lys Pro 145 150 155 160 Val Thr Pro Glu Ala Glu Asn Ala Ala Asp Trp Val Leu Asn Ser Leu 165 170 175 Ala Asp Leu Pro Ser Ala Ile Arg Lys Gln Gln Lys 180 185 <210> 105 <211> 188 <212> PRT <213> Kosakonia arachidis <400> 105 Met Thr Lys Ser Val Pro Ala Ile Phe Leu Asp Arg Asp Gly Thr Ile 1 5 10 15 Asn Val Asp His Gly Tyr Val His Glu Ile Asp Asn Phe Glu Phe Ile 20 25 30 Asp Gly Val Ile Asp Ala Met Arg Glu Leu Lys Glu Met Gly Tyr Ala 35 40 45 Leu Val Leu Val Thr Asn Gln Ser Gly Ile Ala Arg Gly Lys Phe Thr 50 55 60 Glu Ala Gln Phe Glu Thr Leu Thr Glu Trp Met Asp Trp Ser Leu Ala 65 70 75 80 Asp Arg Gly Val Asp Leu Asp Gly Ile Tyr Tyr Cys Pro His His Pro 85 90 95 Gln Gly Thr Val Glu Glu Phe Arg Gln Val Cys Asp Cys Arg Lys Pro 100 105 110 His Pro Gly Met Leu Ile Ser Ala Arg Asp Phe Leu His Ile Asp Met 115 120 125 Ser Ala Ser Tyr Met Val Gly Asp Lys Ile Glu Asp Met Gln Ala Ala 130 135 140 Gln Ala Ala Gln Val Gly Thr Lys Val Leu Val Arg Thr Gly Lys Pro 145 150 155 160 Ile Thr Pro Glu Ala Glu Lys Ser Ala Asp Trp Val Ile Asn Ser Leu 165 170 175 Ala Glu Leu Pro Leu Ala Ile Lys Lys His Gln Lys 180 185 <210> 106 <211> 187 <212> PRT <213> Kluyvera cryocrescens <400> 106 Met Ala Lys Ser Val Pro Ala Ile Phe Leu Asp Arg Asp Gly Thr Ile 1 5 10 15 Asn Val Asp His Gly Tyr Val His Glu Ile Asp Asp Phe Glu Phe Ile 20 25 30 Asp Gly Val Ile Asp Ala Met Arg Glu Leu Lys Glu Met Gly Tyr Ala 35 40 45 Leu Val Leu Val Thr Asn Gln Ser Gly Ile Ala Arg Gly Lys Phe Thr 50 55 60 Glu Ala Gln Phe Glu Thr Leu Thr Glu Trp Met Asp Trp Ser Leu Ala 65 70 75 80 Asp Arg Gly Val Asp Leu Asp Gly Ile Tyr Phe Cys Pro His His Pro 85 90 95 Gln Gly Thr Val Glu Glu Tyr Arg Gln Val Cys Asp Cys Arg Lys Pro 100 105 110 His Pro Gly Met Leu Lys Ser Ala Gln Glu Tyr Leu His Ile Asp Met 115 120 125 Ser Ser Ser Tyr Met Val Gly Asp Lys Ile Glu Asp Met Gln Ala Ala 130 135 140 Ala Ala Ala Asn Val Gly Thr Lys Val Leu Val Arg Thr Gly Lys Pro 145 150 155 160 Val Thr Glu Asp Ala Glu Lys Ala Ala Asp Trp Val Ile Asn Ser Leu 165 170 175 Ala Asp Leu Pro Ala Met Ile Lys Lys Gln Lys 180 185 <210> 107 <211> 188 <212> PRT <213> Leclercia adecarboxylata <400> 107 Met Ala Lys Ser Val Pro Ala Ile Phe Leu Asp Arg Asp Gly Thr Ile 1 5 10 15 Asn Val Asp His Gly Tyr Val His Glu Ile Asp Glu Phe Glu Phe Ile 20 25 30 Glu Gly Val Ile Glu Ala Met Arg Glu Leu Lys Glu Met Gly Phe Ala 35 40 45 Leu Val Val Val Thr Asn Gln Ser Gly Ile Ala Arg Gly Lys Phe Thr 50 55 60 Glu Ala Gln Phe Glu Thr Leu Thr Glu Trp Met Asp Trp Ser Leu Ala 65 70 75 80 Asp Arg Gly Val Asp Leu Asp Gly Ile Tyr Tyr Cys Pro His His Pro 85 90 95 Gln Gly Thr Val Glu Glu Tyr Arg Gln Thr Cys Asp Cys Arg Lys Pro 100 105 110 His Pro Gly Met Phe Ile Ser Ala Gln Glu Phe Leu His Ile Asp Met 115 120 125 Ser Ala Ser Tyr Met Val Gly Asp Lys Leu Glu Asp Met Gln Ala Ala 130 135 140 Ala Ala Ala Gly Val Gly His Lys Ile Leu Val Arg Thr Gly Lys Pro 145 150 155 160 Val Thr Pro Glu Ala Glu Asn Ala Ala Asp Cys Val Ile Asn Ser Leu 165 170 175 Ala Ala Leu Pro Glu Thr Ile Lys Lys Gln Gln Lys 180 185 <210> 108 <211> 219 <212> PRT <213> Shigella sonnei <400> 108 Met Lys Leu Gln Gly Val Ile Phe Asp Leu Asp Gly Val Ile Thr Asp 1 5 10 15 Thr Ala His Leu His Phe Gln Ala Trp Gln Gln Ile Ala Ala Glu Ile 20 25 30 Gly Ile Ser Ile Asp Ala Gln Phe Asn Glu Ser Leu Lys Gly Ile Ser 35 40 45 Arg Asp Glu Ser Leu Arg Arg Ile Leu Gln His Gly Gly Lys Glu Gly 50 55 60 Asp Phe Asn Ser Gln Glu Arg Ala Gln Leu Ala Tyr Arg Lys Asn Leu 65 70 75 80 Leu Tyr Val His Ser Leu Arg Glu Leu Thr Val Asn Ala Val Leu Pro 85 90 95 Gly Ile Arg Ser Leu Leu Ala Asp Leu Arg Ala Gln Gln Ile Ser Val 100 105 110 Gly Leu Ala Ser Val Ser Leu Asn Ala Pro Thr Ile Leu Ala Ala Leu 115 120 125 Glu Leu Arg Lys Phe Phe Thr Phe Cys Ala Asp Ala Ser Gln Leu Lys 130 135 140 Asn Ser Lys Pro Asp Pro Glu Ile Phe Leu Ala Ala Cys Ala Gly Leu 145 150 155 160 Gly Val Pro Pro Gln Ala Cys Ile Gly Ile Glu Asp Ala Gln Ala Gly 165 170 175 Ile Asp Ala Ile Asn Ala Ser Gly Met Arg Ser Val Gly Ile Gly Ala 180 185 190 Gly Leu Thr Gly Ala Gln Leu Leu Leu Pro Ser Thr Glu Ser Leu Thr 195 200 205 Trp Pro Arg Leu Ser Ala Phe Trp Gln Asn Val 210 215 <210> 109 <211> 219 <212> PRT <213> Escherichia coli <400> 109 Met Lys Leu Gln Gly Val Ile Phe Asp Leu Asp Gly Val Ile Thr Asp 1 5 10 15 Thr Ala His Leu His Phe Lys Ala Trp Gln Gln Ile Ala Ala Glu Ile 20 25 30 Gly Ile Ser Ile Asp Ala Gln Phe Asn Glu Ser Leu Lys Gly Ile Ser 35 40 45 Arg Asp Glu Ser Leu Arg Arg Ile Leu Gln His Gly Gly Lys Glu Gly 50 55 60 Asp Phe Asn Pro Gln Glu Arg Ala Gln Leu Ala Tyr Arg Lys Asn Leu 65 70 75 80 Leu Tyr Val His Ser Leu Arg Glu Leu Thr Val Asn Ala Val Leu Pro 85 90 95 Gly Ile Arg Asn Leu Leu Ala Asp Leu Arg Ala Gln Gln Ile Pro Val 100 105 110 Gly Leu Ala Ser Val Ser Leu Asn Ala Pro Thr Ile Leu Ala Ala Leu 115 120 125 Glu Leu Arg Glu Phe Phe Thr Phe Cys Ala Asp Ala Ser Gln Leu Lys 130 135 140 Asn Ser Lys Pro Asp Pro Glu Ile Phe Leu Ala Ala Cys Ala Gly Leu 145 150 155 160 Gly Val Pro Pro Gln Ala Cys Ile Gly Ile Glu Asp Ala Gln Ala Gly 165 170 175 Ile Asp Ala Ile Asn Ala Ser Gly Met Arg Ser Val Gly Ile Gly Ala 180 185 190 Gly Leu Thr Gly Ala Gln Leu Leu Leu Pro Ser Thr Asp Ser Leu Thr 195 200 205 Trp Pro Arg Leu Ser Ala Phe Trp Gln Asn Val 210 215 <210> 110 <211> 219 <212> PRT <213> Escherichia coli <400> 110 Met Lys Leu Gln Gly Val Ile Phe Asp Leu Asp Gly Val Ile Thr Asp 1 5 10 15 Thr Ala His Leu His Phe Gln Ala Trp Gln Gln Ile Ala Ala Glu Ile 20 25 30 Gly Ile Gly Ile Asp Val Gln Phe Asn Glu Thr Leu Lys Gly Ile Ser 35 40 45 Arg Asp Glu Ser Leu Arg Arg Ile Leu Gln His Gly Gly Lys Glu Gly 50 55 60 Asp Phe Asn Val Gln Glu Arg Ala Gln Leu Ala Tyr Arg Lys Asn Leu 65 70 75 80 Leu Tyr Val His Ser Leu Arg Glu Leu Thr Val Asn Ala Val Leu Pro 85 90 95 Gly Ile Arg Pro Leu Leu Ala Asp Leu Arg Ala Gln Gly Ile Pro Val 100 105 110 Gly Leu Ala Ser Val Ser Leu Asn Ala Pro Thr Ile Leu Ala Ala Leu 115 120 125 Glu Leu Arg Glu Phe Phe Thr Phe Cys Ala Asp Ala Ser Gln Leu Lys 130 135 140 His Ser Lys Pro Asp Pro Glu Ile Phe Leu Ala Ala Cys Ala Gly Leu 145 150 155 160 Gly Val Pro Pro Gln Ala Cys Ile Gly Ile Glu Asp Ala Gln Ala Gly 165 170 175 Ile Asp Ala Ile Asn Ala Ser Gly Met Arg Ser Val Gly Ile Gly Thr 180 185 190 Ser Leu Thr Gly Ala Gln Leu Leu Leu Pro Ser Thr Glu Ser Leu Thr 195 200 205 Trp Pro Arg Leu Ser Ala Phe Trp Gln Asn Val 210 215 <210> 111 <211> 208 <212> PRT <213> Shigella flexneri <400> 111 Met Lys Leu Gln Gly Val Ile Phe Asp Leu Asp Gly Val Ile Thr Asp 1 5 10 15 Thr Ala His Leu His Phe Gln Ala Trp Gln Gln Ile Ala Ala Glu Ile 20 25 30 Gly Ile Ser Ile Asp Ala Gln Phe Asn Glu Ser Leu Lys Gly Ile Ser 35 40 45 Arg Asp Glu Ser Leu Arg Arg Ile Leu Gln His Gly Gly Lys Glu Gly 50 55 60 Asp Phe Asn Pro Gln Glu Arg Ala Gln Leu Ala Tyr Arg Lys Asn Leu 65 70 75 80 Leu Tyr Val His Ser Leu Arg Glu Leu Thr Val Asn Ala Val Leu Pro 85 90 95 Gly Ile Arg Asn Leu Leu Ala Glu Leu Arg Ala Gln Gln Ile Pro Val 100 105 110 Gly Leu Ala Ser Val Ser Leu Asn Ala Pro Thr Ile Leu Ala Ala Leu 115 120 125 Glu Leu Arg Glu Phe Phe Thr Phe Cys Ala Asp Ala Ser Gln Leu Lys 130 135 140 Asn Ser Lys Pro Asp Pro Glu Ile Phe Leu Ala Ala Cys Ala Gly Leu 145 150 155 160 Gly Val Pro Pro Gln Ala Cys Ile Gly Ile Glu Asp Ala Gln Ala Gly 165 170 175 Ile Asp Ala Ile Asn Ala Ser Gly Met Arg Ser Val Gly Ile Gly Ala 180 185 190 Gly Leu Thr Gly Ala Gln Leu Leu Leu Pro Ser Thr Asp Ser Leu Thr 195 200 205 <210> 112 <211> 216 <212> PRT <213> Shigella sonnei <400> 112 Met Arg Cys Lys Gly Phe Leu Phe Asp Leu Asp Gly Thr Leu Val Asp 1 5 10 15 Ser Leu Pro Ala Val Glu Arg Ala Trp Ser Asn Trp Ser Arg Arg His 20 25 30 Gly Leu Ala Pro Glu Glu Val Leu Ala Phe Ile His Gly Lys Gln Ala 35 40 45 Ile Thr Ser Leu Arg His Phe Met Ala Gly Lys Ser Glu Ala Asp Ile 50 55 60 Ala Ala Glu Phe Thr Arg Leu Glu His Ile Glu Ala Thr Glu Thr Glu 65 70 75 80 Gly Ile Thr Ala Leu Pro Gly Ala Ile Ala Leu Leu Ser His Leu Asn 85 90 95 Lys Ala Gly Ile Pro Trp Ala Ile Val Thr Ser Gly Ser Met Pro Val 100 105 110 Ala Arg Ala Arg His Lys Ile Ala Gly Leu Pro Ala Pro Glu Val Phe 115 120 125 Val Thr Ala Glu Arg Val Lys Arg Gly Lys Pro Glu Pro Asp Ala Tyr 130 135 140 Leu Leu Gly Ala Gln Leu Leu Gly Leu Ala Pro Gln Glu Cys Val Val 145 150 155 160 Val Glu Asp Ala Pro Ala Gly Val Leu Ser Gly Leu Ala Ala Gly Cys 165 170 175 His Val Ile Ala Val Asn Ala Pro Ala Asp Thr Pro Gly Leu Asn Glu 180 185 190 Val Asp Leu Val Leu His Ser Leu Glu Gln Ile Thr Val Thr Lys Gln 195 200 205 Pro Asn Gly Asp Val Ile Ile Gln 210 215 <210> 113 <211> 215 <212> PRT <213> Citrobacter werkmanii NBRC 105721 <400> 113 Met Gln Cys Lys Gly Phe Leu Phe Asp Leu Asp Gly Thr Leu Val Asp 1 5 10 15 Ser Leu Pro Ala Val Glu Arg Ala Trp Cys Asn Trp Ala Asp Arg Phe 20 25 30 Gly Leu Asp His Ala Glu Val Leu Gly Phe Ile His Gly Lys Gln Ala 35 40 45 Ile Thr Ser Leu Arg His Phe Met Val Gly Lys Ser Glu Ala Glu Ile 50 55 60 Ala Ala Glu Phe Thr Arg Leu Glu Gln Ile Glu Ala Thr Glu Thr Ala 65 70 75 80 Gly Ile Thr Ala Leu Pro Gly Ala Val Asp Leu Leu Asn His Leu Asn 85 90 95 Lys Ala Gly Ile Pro Trp Ala Ile Val Thr Ser Gly Ser Met Pro Val 100 105 110 Ala Arg Ala Arg His Arg Val Ala Gly Leu Pro Ala Pro Glu Val Phe 115 120 125 Val Thr Ala Glu Arg Val Lys Arg Gly Lys Pro Glu Pro Asp Ala Tyr 130 135 140 Leu Leu Gly Ala Gln Leu Leu Gly Leu Ala Pro Gln Glu Cys Ala Val 145 150 155 160 Val Glu Asp Ala Pro Ala Gly Val Leu Ser Gly Leu Ala Ala Gly Cys 165 170 175 His Val Ile Ala Val Asn Ala Pro Ala Asp Thr Pro Arg Leu Asp Glu 180 185 190 Val Asp Phe Ser Leu Thr Ser Leu Glu Gln Ile Ser Val Thr Lys Gln 195 200 205 Pro Asn Gly Asn Val Val Val 210 215 <210> 114 <211> 215 <212> PRT <213> Citrobacter freundii <400> 114 Met Gln Cys Lys Gly Phe Leu Phe Asp Leu Asp Gly Thr Leu Val Asp 1 5 10 15 Ser Leu Pro Ala Val Glu Arg Ala Trp Cys Asn Trp Ala Asp Arg Phe 20 25 30 Gly Leu Asp His Ala Glu Val Leu Gly Phe Ile His Gly Lys Gln Ala 35 40 45 Ile Thr Ser Leu Arg His Phe Met Val Gly Lys Ser Glu Ala Glu Ile 50 55 60 Ala Ala Glu Phe Thr Arg Leu Glu Gln Ile Glu Ala Thr Glu Thr Ala 65 70 75 80 Gly Ile Thr Ala Leu Pro Gly Ala Val Asp Leu Leu Asn His Leu Asn 85 90 95 Lys Ala Gly Ile Pro Trp Ala Ile Val Thr Ser Gly Ser Met Pro Val 100 105 110 Ala Arg Ala Arg His Arg Val Ala Gly Leu Pro Ala Pro Glu Val Phe 115 120 125 Val Thr Ala Glu Arg Val Lys Arg Gly Lys Pro Glu Pro Asp Ala Tyr 130 135 140 Leu Leu Gly Ala Gln Leu Leu Gly Val Ala Pro Gln Glu Cys Ala Val 145 150 155 160 Val Glu Asp Ala Pro Ala Gly Val Leu Ser Gly Leu Ala Ala Gly Cys 165 170 175 His Val Ile Ala Val Asn Ala Pro Ala Asp Thr Pro Arg Leu Asp Glu 180 185 190 Val Asp Phe Ser Leu Thr Ser Leu Glu His Ile Ser Val Thr Lys Gln 195 200 205 Pro Asn Gly Asn Val Val Val 210 215 <210> 115 <211> 215 <212> PRT <213> Citrobacter amalonaticus <400> 115 Met Gln Cys Lys Gly Phe Leu Phe Asp Leu Asp Gly Thr Leu Val Asp 1 5 10 15 Ser Leu Pro Ala Val Glu Arg Ala Trp Cys Asn Trp Ala Asp Arg Phe 20 25 30 Gly Leu Ala His Asp Asp Val Leu Ser Phe Val His Gly Lys Gln Ala 35 40 45 Ile Thr Ser Leu Arg His Phe Met Ala Gly Lys Pro Glu Ala Glu Ile 50 55 60 Val Ala Glu Phe Thr Arg Leu Glu Lys Ile Glu Ala Thr Glu Thr Ala 65 70 75 80 Gly Ile Thr Ala Leu Pro Gly Ala Val Ala Leu Leu Asn His Leu Asn 85 90 95 Lys Ala Gly Ile Pro Trp Ala Ile Val Thr Ser Gly Ser Met Pro Val 100 105 110 Ala Arg Ala Arg His Gln Val Ala Asn Leu Pro Ala Pro Glu Val Phe 115 120 125 Val Thr Ala Glu Arg Val Lys Arg Gly Lys Pro Glu Pro Asp Ala Tyr 130 135 140 Leu Leu Gly Ala Gln Leu Leu Gly Leu Ser Pro His Glu Cys Val Val 145 150 155 160 Val Glu Asp Ala Pro Ala Gly Val Leu Ser Gly Leu Ala Ala Gly Cys 165 170 175 His Val Ile Ala Val Asn Ala Pro Ala Asp Thr Pro Arg Leu Asp Glu 180 185 190 Val Asp Phe Val Leu Thr Ser Leu Glu Gln Leu Ser Val Thr Lys Gln 195 200 205 Pro Asn Gly Asp Val Val Val 210 215 <210> 116 <211> 215 <212> PRT <213> Salmonella enterica <400> 116 Val Gln Cys Lys Gly Phe Leu Phe Asp Leu Asp Gly Thr Leu Val Asp 1 5 10 15 Ser Leu Pro Ala Val Glu Arg Ala Trp Cys Ser Trp Ala Asp Arg Phe 20 25 30 Asn Leu Ala His Asp Glu Val Leu Gly Phe Ile His Gly Lys Gln Ala 35 40 45 Ile Thr Ser Leu Arg His Phe Met Ala Gly Lys Ser Glu Ala Glu Ile 50 55 60 Ala Ala Glu Phe Thr Arg Leu Glu Gln Ile Glu Ala Thr Glu Thr Ala 65 70 75 80 Gly Ile Thr Ala Leu Pro Gly Ala Val Asp Leu Leu Asn His Leu Asn 85 90 95 Lys Ala Gly Ile Pro Trp Ala Ile Val Thr Ser Gly Ser Met Pro Val 100 105 110 Ala Arg Ala Arg His Gln Val Ala Gly Leu Pro Ala Pro Glu Val Phe 115 120 125 Val Thr Ala Glu Arg Val Lys Arg Gly Lys Pro Glu Pro Asp Ala Tyr 130 135 140 Leu Leu Gly Ala Gln Leu Leu Gly Leu Val Pro Gln Glu Cys Val Val 145 150 155 160 Val Glu Asp Ala Pro Ala Gly Val Leu Ser Gly Leu Ala Ala Gly Cys 165 170 175 His Val Ile Ala Val Asn Ala Pro Ala Asp Thr Pro Arg Leu Ala Asp 180 185 190 Val Asp Phe Ala Leu Asn Ser Leu Thr Gln Leu Ser Val Ala Lys Gln 195 200 205 Pro Asn Gly Asp Val Val Val 210 215 <210> 117 <211> 216 <212> PRT <213> Escherichia fergusonii <400> 117 Met Arg Cys Lys Gly Phe Leu Phe Asp Leu Asp Gly Thr Leu Val Asp 1 5 10 15 Ser Leu Pro Ala Val Glu Arg Ala Trp Cys Asn Trp Ala Asp Arg Phe 20 25 30 Gly Ile Asp His His Glu Leu Leu Ser Phe Ile His Gly Lys Gln Ala 35 40 45 Ile Thr Ser Leu Arg His Phe Met Pro Gly Arg Pro Glu Glu Glu Ile 50 55 60 Leu Ala Glu Phe Thr Arg Leu Glu Gln Ile Glu Ala Thr Gln Thr Glu 65 70 75 80 Gly Ile Thr Ala Leu Pro Gly Ala Ile Glu Leu Leu Thr His Leu Asn 85 90 95 Lys Ser Gly Ile Pro Trp Ala Ile Val Thr Ser Gly Ser Met Pro Val 100 105 110 Ala Arg Ala Arg His Gln Val Ala Gly Leu Pro Phe Pro Glu Val Phe 115 120 125 Val Thr Ala Glu Arg Val Lys Arg Gly Lys Pro Glu Pro Asp Ala Tyr 130 135 140 Leu Leu Gly Ala Gln Leu Leu Gly Leu Glu Pro Lys Glu Cys Val Val 145 150 155 160 Val Glu Asp Ala Pro Ala Gly Val Leu Ser Gly Leu Ala Ala Gly Cys 165 170 175 His Val Ile Ala Val Asn Thr Pro Ala Asp Thr Pro Arg Leu Ser Glu 180 185 190 Val Asp Phe Val Leu Thr Ser Leu Gln Gln Ile Thr Val Thr Lys Gln 195 200 205 Pro Asn Gly Glu Val Ile Ile Gln 210 215 <210> 118 <211> 215 <212> PRT <213> Salmonella enterica subsp. enterica serovar Hadar <400> 118 Val Gln Cys Lys Gly Phe Leu Phe Asp Leu Asp Gly Thr Leu Val Asp 1 5 10 15 Ser Leu Pro Ala Val Glu Arg Ala Trp Cys Ser Trp Ala Asp Arg Phe 20 25 30 Asn Leu Ala His Asp Glu Val Leu Gly Phe Ile His Gly Lys Gln Ala 35 40 45 Ile Thr Ser Leu Arg His Phe Met Ala Gly Lys Ser Glu Ala Glu Ile 50 55 60 Ala Ala Glu Phe Thr Arg Leu Glu Gln Ile Glu Ala Thr Glu Thr Ala 65 70 75 80 Gly Ile Thr Ala Leu Pro Gly Ala Val Asp Leu Leu Asn His Leu Asn 85 90 95 Lys Ala Gly Ile Pro Trp Ala Ile Val Thr Ser Gly Ser Met Pro Val 100 105 110 Ala Arg Ala Arg His Gln Val Ala Gly Leu Pro Ala Pro Glu Val Phe 115 120 125 Val Thr Ala Glu Arg Val Lys Arg Gly Lys Pro Glu Pro Asp Ala Tyr 130 135 140 Leu Leu Gly Ala Gln Leu Leu Gly Leu Ser Pro Gln Glu Cys Val Val 145 150 155 160 Val Glu Asp Ala Pro Ala Gly Val Leu Ser Gly Leu Ala Ala Gly Cys 165 170 175 His Val Ile Ala Val Asn Ala Pro Ala Asp Thr Pro Arg Leu Ala Asp 180 185 190 Val Asp Phe Ala Leu Asp Ser Leu Thr Gln Leu Ser Val Ala Lys Gln 195 200 205 Pro Asn Gly Asp Val Val Val 210 215 <210> 119 <211> 270 <212> PRT <213> Escherichia coli <400> 119 Met Ala Ile Lys Leu Ile Ala Ile Asp Met Asp Gly Thr Leu Leu Leu 1 5 10 15 Pro Asp His Thr Ile Ser Pro Ala Val Lys Asn Ala Ile Ala Ala Ala 20 25 30 Arg Ala Arg Gly Val Asn Val Val Leu Thr Thr Gly Arg Pro Tyr Ala 35 40 45 Gly Val His Asn Tyr Leu Lys Glu Leu His Met Glu Gln Pro Gly Asp 50 55 60 Tyr Cys Ile Thr Tyr Asn Gly Ala Leu Val Gln Lys Ala Ala Asp Gly 65 70 75 80 Ser Thr Val Ala Gln Thr Ala Leu Ser Tyr Asp Asp Tyr Arg Phe Leu 85 90 95 Glu Lys Leu Ser Arg Glu Val Gly Ser His Phe His Ala Leu Asp Arg 100 105 110 Thr Thr Leu Tyr Thr Ala Asn Arg Asp Ile Ser Tyr Tyr Thr Val His 115 120 125 Glu Ser Phe Val Ala Thr Ile Pro Leu Val Phe Cys Glu Ala Glu Lys 130 135 140 Met Asp Pro Asn Thr Gln Phe Leu Lys Val Met Met Ile Asp Glu Pro 145 150 155 160 Ala Ile Leu Asp Gln Ala Ile Ala Arg Ile Pro Gln Glu Val Lys Glu 165 170 175 Lys Tyr Thr Val Leu Lys Ser Ala Pro Tyr Phe Leu Glu Ile Leu Asp 180 185 190 Lys Arg Val Asn Lys Gly Thr Gly Val Lys Ser Leu Ala Asp Val Leu 195 200 205 Gly Ile Lys Pro Glu Glu Ile Met Ala Ile Gly Asp Gln Glu Asn Asp 210 215 220 Ile Ala Met Ile Glu Tyr Ala Gly Ile Gly Val Ala Met Asp Asn Ala 225 230 235 240 Ile Pro Ser Val Lys Glu Val Ala Asn Phe Val Thr Lys Ser Asn Leu 245 250 255 Glu Asp Gly Val Ala Phe Ala Ile Glu Lys Tyr Val Leu Asn 260 265 270 <210> 120 <211> 270 <212> PRT <213> Escherichia fergusonii <400> 120 Met Ala Ile Lys Leu Ile Ala Ile Asp Met Asp Gly Thr Leu Leu Leu 1 5 10 15 Pro Asp His Thr Ile Ser Pro Ala Val Lys Asn Ala Ile Ala Ala Ala 20 25 30 Arg Ala Arg Gly Val Asn Val Val Leu Thr Thr Gly Arg Pro Tyr Ala 35 40 45 Gly Val His Asn Tyr Leu Lys Glu Leu His Met Glu Gln Pro Gly Asp 50 55 60 Tyr Cys Ile Thr Tyr Asn Gly Ala Leu Val Gln Lys Ala Ala Asp Gly 65 70 75 80 Ser Thr Val Ala Gln Thr Ala Leu Ser Tyr Glu Asp Tyr Arg Phe Leu 85 90 95 Glu Lys Leu Ser Arg Glu Val Gly Ser His Phe His Ala Leu Asp Arg 100 105 110 Thr Thr Leu Tyr Thr Ala Asn Arg Asp Ile Ser Tyr Tyr Thr Val His 115 120 125 Glu Ser Phe Val Ala Thr Ile Pro Leu Val Phe Cys Glu Ala Glu Lys 130 135 140 Met Asp Pro Asn Thr Gln Phe Leu Lys Val Met Met Ile Asp Glu Pro 145 150 155 160 Thr Ile Leu Asp Gln Ala Ile Ala Arg Ile Pro Gln Glu Val Lys Glu 165 170 175 Lys Tyr Thr Val Leu Lys Ser Ala Pro Tyr Phe Leu Glu Ile Leu Asp 180 185 190 Lys Arg Val Asn Lys Gly Thr Gly Val Lys Ser Leu Ala Asp Val Leu 195 200 205 Gly Ile Lys Pro Glu Glu Ile Met Ala Ile Gly Asp Gln Glu Asn Asp 210 215 220 Ile Ala Met Ile Glu Tyr Ala Gly Val Gly Val Ala Met Asp Asn Ala 225 230 235 240 Ile Pro Ser Val Lys Glu Val Ala Asn Phe Val Thr Lys Ser Asn Leu 245 250 255 Glu Asp Gly Val Ala Phe Ala Ile Glu Lys Tyr Val Leu Asn 260 265 270 <210> 121 <211> 270 <212> PRT <213> Shigella sonnei <400> 121 Met Ala Ile Lys Leu Ile Ala Ile Asp Met Asp Gly Thr Leu Leu Leu 1 5 10 15 Pro Asp His Thr Ile Ser Pro Ala Val Lys Asn Ala Ile Ala Ala Ala 20 25 30 Arg Ala Arg Gly Val Asn Val Val Leu Thr Thr Gly Arg Pro Tyr Ala 35 40 45 Gly Val His Asn Tyr Leu Lys Glu Leu His Met Glu Leu Pro Gly Asp 50 55 60 Tyr Cys Ile Thr Tyr Asn Gly Ala Leu Val Gln Lys Ala Ala Asp Gly 65 70 75 80 Ser Thr Val Ala Gln Thr Ala Leu Ser Tyr Asp Asp Tyr Arg Phe Leu 85 90 95 Glu Lys Leu Ser Arg Glu Val Gly Ser His Phe His Ala Leu Asp Arg 100 105 110 Thr Thr Leu Tyr Thr Ala Asn Arg Asp Ile Ser Tyr Tyr Thr Val His 115 120 125 Glu Ser Phe Val Ala Thr Ile Pro Leu Val Phe Cys Glu Ala Glu Lys 130 135 140 Met Asp Pro Asn Thr Gln Phe Leu Lys Val Met Met Ile Asp Glu Pro 145 150 155 160 Ala Ile Leu Asp Gln Ala Ile Ala Arg Ile Pro Gln Glu Val Lys Glu 165 170 175 Lys Tyr Thr Val Leu Lys Ser Ala Pro Tyr Phe Leu Glu Ile Leu Asp 180 185 190 Lys Arg Val Asn Lys Ser Thr Gly Val Lys Ser Leu Ala Asp Val Leu 195 200 205 Gly Ile Lys Pro Glu Glu Ile Met Ala Ile Gly Asp Gln Glu Asn Asp 210 215 220 Ile Ala Met Ile Glu Tyr Ala Gly Val Gly Val Ala Met Asp Asn Ala 225 230 235 240 Ile Pro Ser Val Lys Glu Val Ala Asn Phe Val Thr Lys Ser Asn Leu 245 250 255 Glu Asp Gly Val Ala Phe Ala Ile Glu Lys Tyr Val Leu Asn 260 265 270 <210> 122 <211> 269 <212> PRT <213> Trabulsiella guamensis <400> 122 Met Ala Ile Lys Leu Ile Ala Ile Asp Met Asp Gly Thr Leu Leu Leu 1 5 10 15 Pro Asp His Thr Ile Ser Pro Ala Val Lys Asn Ala Ile Ala Ala Ala 20 25 30 Arg Met Arg Gly Val Asn Val Val Leu Thr Thr Gly Arg Pro Tyr Ala 35 40 45 Gly Val His His Tyr Leu Lys Glu Leu His Met Glu Gln Pro Gly Asp 50 55 60 Tyr Cys Ile Thr Tyr Asn Gly Ala Leu Val Gln Lys Ala Ser Asp Gly 65 70 75 80 Ser Thr Val Ala Gln Thr Ala Leu Ser Tyr Asp Asp Tyr Arg Phe Leu 85 90 95 Glu Lys Leu Ser Arg Glu Val Gly Ser His Phe His Ala Leu Asp Arg 100 105 110 Asn Thr Leu Tyr Thr Ala Asn Arg Asp Ile Ser Tyr Tyr Thr Val His 115 120 125 Glu Ser Tyr Val Ala Thr Ile Pro Leu Val Phe Cys Glu Ala Glu Lys 130 135 140 Met Asp Pro Ala Thr Gln Phe Leu Lys Val Met Met Ile Asp Glu Pro 145 150 155 160 Val Val Leu Asp Lys Ala Ile Ala Arg Ile Pro Ala Glu Val Lys Glu 165 170 175 Lys Tyr Thr Val Leu Lys Ser Ala Pro Tyr Phe Leu Glu Ile Leu Asp 180 185 190 Lys Arg Val Asn Lys Gly Thr Gly Val Lys Ser Leu Ala Asp Val Leu 195 200 205 Gly Ile Gln Pro Asp Glu Ile Met Ala Ile Gly Asp Gln Glu Asn Asp 210 215 220 Ile Ala Met Ile Glu Tyr Ala Gly Val Gly Val Ala Met Asp Asn Ala 225 230 235 240 Ile Pro Ser Val Lys Glu Val Ala Asn Phe Ile Thr Lys Ser Asn Leu 245 250 255 Glu Asp Gly Val Ala Tyr Ala Ile Glu Lys Tyr Val Leu 260 265 <210> 123 <211> 270 <212> PRT <213> Citrobacter amalonaticus <400> 123 Met Ala Ile Lys Leu Ile Ala Ile Asp Met Asp Gly Thr Leu Leu Leu 1 5 10 15 Pro Asp His Thr Ile Ser Pro Ala Val Lys Arg Ala Ile Ala Ala Ala 20 25 30 Arg Glu Lys Gly Val Asn Val Val Leu Thr Thr Gly Arg Pro Tyr Ala 35 40 45 Gly Val His Ser Tyr Leu Lys Glu Leu His Met Glu Gln Pro Gly Asp 50 55 60 Tyr Cys Ile Thr Tyr Asn Gly Ala Leu Val Gln Lys Ala Gly Asp Gly 65 70 75 80 Ser Thr Val Ala Gln Thr Ala Leu Ser Tyr Asp Asp Tyr Arg Tyr Leu 85 90 95 Glu Lys Leu Ser Arg Glu Val Gly Ser His Phe His Ala Leu Asp Arg 100 105 110 Thr Thr Leu Tyr Thr Ala Asn Arg Asp Ile Ser Tyr Tyr Thr Val His 115 120 125 Glu Ser Tyr Val Ala Thr Ile Pro Leu Val Phe Cys Glu Ala Glu Lys 130 135 140 Met Asp Pro Lys Thr Gln Phe Leu Lys Val Met Met Ile Asp Glu Pro 145 150 155 160 Ala Ile Leu Asp Gln Ala Ile Ala Arg Ile Pro Ala Glu Val Lys Glu 165 170 175 Lys Tyr Thr Val Leu Lys Ser Ala Pro Tyr Phe Leu Glu Ile Leu Asp 180 185 190 Lys Arg Val Asn Lys Gly Thr Gly Val Lys Ser Leu Ala Asp Ala Leu 195 200 205 Gly Ile Lys Pro Glu Glu Ile Met Ala Ile Gly Asp Gln Glu Asn Asp 210 215 220 Ile Ala Met Ile Glu Tyr Ala Gly Leu Gly Val Ala Met Asp Asn Ala 225 230 235 240 Ile Pro Ser Val Lys Glu Ile Ala Asn Phe Val Thr Lys Ser Asn Leu 245 250 255 Glu Asp Gly Val Ala Tyr Ala Ile Glu Gln His Val Leu Lys 260 265 270 <210> 124 <211> 269 <212> PRT <213> Klebsiella pneumoniae <400> 124 Met Ala Ile Lys Leu Ile Ala Ile Asp Met Asp Gly Thr Leu Leu Leu 1 5 10 15 Pro Asp His Thr Ile Ser Pro Ala Val Lys Thr Ala Ile Ala Ala Ala 20 25 30 Arg Glu Arg Gly Val Asn Val Val Leu Thr Thr Gly Arg Pro Tyr Ala 35 40 45 Gly Val His Ser Tyr Leu Lys Glu Leu His Met Glu Gln Pro Gly Asp 50 55 60 Tyr Cys Ile Thr Tyr Asn Gly Ala Leu Val Gln Lys Ala Gly Asp Gly 65 70 75 80 Ser Thr Val Ala Gln Thr Ala Leu Ser Tyr Asp Asp Tyr Arg Phe Leu 85 90 95 Glu Gln Leu Ser Arg Glu Val Gly Ser His Phe His Ala Leu Asp Arg 100 105 110 Asn Thr Leu Tyr Thr Ala Asn Arg Asp Ile Ser Tyr Tyr Thr Val His 115 120 125 Glu Ser Tyr Val Ala Thr Ile Pro Leu Val Phe Cys Glu Ala Glu Lys 130 135 140 Met Asp Pro Glu Ile Gln Leu Leu Lys Val Met Met Ile Asp Glu Pro 145 150 155 160 Ala Ile Leu Asp Gln Ala Ile Ala Arg Ile Pro Ala Glu Val Lys Glu 165 170 175 Lys Tyr Thr Val Leu Lys Ser Ala Pro Tyr Phe Leu Glu Ile Leu Asp 180 185 190 Lys Arg Val Asn Lys Gly Thr Gly Val Lys Ser Leu Ala Asp Ala Leu 195 200 205 Gly Ile Lys Pro Glu Glu Ile Met Ala Ile Gly Asp Gln Glu Asn Asp 210 215 220 Ile Ala Met Ile Glu Phe Ala Gly Val Gly Val Ala Met Asp Asn Ala 225 230 235 240 Ile Pro Ala Val Lys Glu Ala Ala Asn Phe Ile Thr Lys Ser Asn Leu 245 250 255 Glu Asp Gly Val Ala Phe Ala Ile Glu Lys Tyr Val Leu 260 265 <210> 125 <211> 269 <212> PRT <213> Trabulsiella odontotermitis <400> 125 Met Ala Ile Lys Leu Ile Ala Ile Asp Met Asp Gly Thr Leu Leu Leu 1 5 10 15 Pro Asp His Thr Ile Ser Pro Ala Val Lys Asn Ala Ile Ala Ala Ala 20 25 30 Arg Met Arg Gly Val Asn Val Val Leu Thr Thr Gly Arg Pro Tyr Ala 35 40 45 Gly Val His His Tyr Leu Lys Glu Leu His Met Glu Gln Pro Gly Asp 50 55 60 Tyr Cys Ile Thr Tyr Asn Gly Ala Leu Val Gln Lys Ala Ser Asp Gly 65 70 75 80 Ser Thr Val Ala Gln Thr Ala Leu Ser Tyr Asp Asp Tyr Arg Tyr Leu 85 90 95 Glu Lys Leu Ser Arg Glu Val Gly Ser His Phe His Ala Leu Asp Arg 100 105 110 Asn Thr Leu Tyr Thr Ala Asn Arg Asp Ile Ser Tyr Tyr Thr Val His 115 120 125 Glu Ser Tyr Val Ala Thr Ile Pro Leu Val Phe Cys Glu Ala Glu Lys 130 135 140 Met Asp Pro Ala Thr Gln Phe Leu Lys Val Met Met Ile Asp Glu Pro 145 150 155 160 Val Val Leu Asp Lys Ala Ile Ala Arg Ile Pro Ala Glu Val Lys Glu 165 170 175 Lys Tyr Thr Val Leu Lys Ser Ala Pro Tyr Phe Leu Glu Ile Leu Asp 180 185 190 Lys Arg Val Asn Lys Gly Thr Gly Val Lys Ser Leu Ala Glu Ala Leu 195 200 205 Gly Ile Gln Pro Asp Glu Ile Met Ala Ile Gly Asp Gln Glu Asn Asp 210 215 220 Ile Ala Met Ile Glu Tyr Ala Gly Val Gly Val Ala Met Asp Asn Ala 225 230 235 240 Ile Pro Ser Val Lys Glu Val Ala Asn Phe Ile Thr Lys Ser Asn Leu 245 250 255 Glu Asp Gly Val Ala Tyr Ala Ile Glu Lys Tyr Val Leu 260 265 <210> 126 <211> 270 <212> PRT <213> Enterobacter kobei <400> 126 Met Ala Ile Lys Leu Ile Ala Ile Asp Met Asp Gly Thr Leu Leu Leu 1 5 10 15 Pro Asp His Thr Ile Ser Pro Ala Val Lys Lys Ala Ile Ala Ala Ala 20 25 30 Arg Glu Lys Gly Val Asn Val Val Leu Thr Thr Gly Arg Pro Tyr Ala 35 40 45 Gly Val His Asn Tyr Leu Arg Glu Leu His Met Asp Lys Pro Gly Asp 50 55 60 Tyr Cys Ile Thr Tyr Asn Gly Ala Leu Val Gln Lys Ala Ser Asp Gly 65 70 75 80 Ser Thr Val Ala Gln Thr Thr Leu Ser Tyr Asp Asp Tyr Arg Tyr Leu 85 90 95 Glu Gln Leu Ser Arg Glu Val Gly Ser His Phe His Ala Leu Asp Arg 100 105 110 Asn Thr Leu Tyr Thr Ala Asn Arg Asp Ile Ser Tyr Tyr Thr Val His 115 120 125 Glu Ser Tyr Val Ala Thr Ile Pro Leu Val Phe Cys Glu Ala Glu Lys 130 135 140 Met Asp Pro Ala Ile Gln Leu Leu Lys Val Met Met Ile Asp Glu Pro 145 150 155 160 Ala Ile Leu Asp Lys Ala Ile Ala Arg Ile Pro Ala Glu Val Lys Glu 165 170 175 Lys Tyr Thr Val Leu Lys Ser Ala Pro Tyr Phe Leu Glu Ile Leu Asp 180 185 190 Lys Arg Val Asn Lys Gly Thr Gly Val Lys Ser Leu Ala Asp Thr Leu 195 200 205 Gly Ile Thr Pro Asp Glu Ile Met Thr Leu Gly Asp Gln Glu Asn Asp 210 215 220 Ile Ala Met Ile Glu Tyr Ala Gly Leu Gly Val Ala Met Asp Asn Ala 225 230 235 240 Ile Asp Ser Val Lys Glu Val Ala Asp Phe Val Thr Lys Ser Asn Leu 245 250 255 Glu Asp Gly Val Ala Tyr Ala Ile Glu Lys Phe Val Leu Asn 260 265 270 <210> 127 <211> 238 <212> PRT <213> Shigella sonnei <400> 127 Met Arg Phe Tyr Arg Pro Leu Gly Arg Ile Ser Ala Leu Thr Phe Asp 1 5 10 15 Leu Asp Asp Thr Leu Tyr Asp Asn Arg Pro Val Ile Leu Arg Thr Glu 20 25 30 Arg Glu Ala Leu Thr Phe Val Gln Asn Tyr His Pro Ala Leu Arg Ser 35 40 45 Phe Gln Asn Glu Asp Leu Gln Arg Leu Arg Gln Ala Val Arg Glu Ala 50 55 60 Glu Pro Glu Ile Tyr His Asp Val Thr Arg Trp Arg Phe Arg Ser Ile 65 70 75 80 Glu Gln Ala Met Leu Asp Ala Gly Leu Ser Ala Glu Glu Ala Ser Ala 85 90 95 Gly Ala His Ala Ala Met Ile Asn Phe Ala Lys Trp Arg Ser Arg Ile 100 105 110 Asp Val Pro Gln Gln Thr His Asp Thr Leu Lys Gln Leu Ala Lys Lys 115 120 125 Trp Pro Leu Val Ala Ile Thr Asn Gly Asn Ala Gln Pro Glu Leu Phe 130 135 140 Gly Leu Gly Asp Tyr Phe Glu Phe Val Leu Arg Ala Gly Pro His Gly 145 150 155 160 Arg Ser Lys Pro Phe Ser Asp Met Tyr Phe Leu Ala Ala Glu Lys Leu 165 170 175 Asn Val Pro Ile Gly Glu Ile Leu His Val Gly Asp Asp Leu Thr Thr 180 185 190 Asp Val Gly Gly Ala Ile Arg Ser Gly Met Gln Ala Cys Trp Ile Lys 195 200 205 Pro Glu Asn Gly Asp Leu Met Gln Thr Trp Asp Ser Arg Leu Leu Pro 210 215 220 His Leu Glu Ile Ser Arg Leu Ala Ser Leu Thr Ser Leu Ile 225 230 235 <210> 128 <211> 223 <212> PRT <213> Shigella sonnei <400> 128 Met Arg Phe Tyr Arg Pro Leu Gly Arg Ile Ser Ala Leu Thr Phe Asp 1 5 10 15 Leu Asp Asp Thr Leu Tyr Asp Asn Arg Pro Val Ile Leu Arg Thr Glu 20 25 30 Arg Glu Ala Leu Thr Phe Val Gln Asn Tyr His Pro Ala Leu Arg Ser 35 40 45 Phe Gln Asn Glu Asp Leu Gln Arg Leu Arg Gln Ala Val Arg Glu Ala 50 55 60 Glu Pro Glu Ile Tyr His Asp Val Thr Arg Trp Arg Phe Arg Ser Ile 65 70 75 80 Glu Gln Ala Met Leu Asp Ala Gly Leu Ser Ala Glu Glu Ala Ser Ala 85 90 95 Gly Ala His Ala Ala Met Ile Asn Phe Ala Lys Trp Arg Ser Arg Ile 100 105 110 Asp Val Pro Gln Gln Thr His Asp Thr Leu Lys Gln Leu Ala Lys Lys 115 120 125 Trp Pro Leu Val Ala Ile Thr Asn Gly Asn Ala Gln Pro Glu Leu Phe 130 135 140 Gly Leu Gly Asp Tyr Phe Glu Phe Val Leu Arg Ala Gly Pro His Gly 145 150 155 160 Arg Ser Lys Pro Phe Ser Asp Met Tyr Phe Leu Ala Ala Glu Lys Leu 165 170 175 Asn Val Pro Ile Gly Glu Ile Leu His Val Gly Asp Asp Leu Thr Thr 180 185 190 Asp Val Gly Gly Ala Ile Arg Ser Gly Met Gln Ala Cys Trp Ile Arg 195 200 205 Pro Glu Asn Gly Asp Leu Met Gln Thr Trp Asp Ser Arg Leu Leu 210 215 220 <210> 129 <211> 238 <212> PRT <213> Salmonella enterica <400> 129 Met Arg Phe Tyr Arg Pro Leu Gly Arg Ile Ala Ala Leu Thr Phe Asp 1 5 10 15 Leu Asp Asp Thr Leu Tyr Asp Asn Arg Pro Val Ile Leu Arg Thr Glu 20 25 30 Gln Glu Ala Leu Ala Phe Met Gln Asn Tyr His Pro Ser Leu Arg Ser 35 40 45 Phe Gln Asn Val Asp Leu Gln Arg Ile Arg Gln Ala Val Arg Glu Ala 50 55 60 Glu Pro Glu Ile Tyr His Asp Val Thr Arg Trp Arg His Arg Ala Ile 65 70 75 80 Glu Gln Ala Met Arg Asp Ala Gly Leu Ser Ala Gln Glu Ala Ile Ala 85 90 95 Gly Ala Asn Ala Ala Met Met His Phe Ala Lys Trp Arg Ser Gln Ile 100 105 110 Glu Val Pro Gln Ala Thr His Glu Thr Leu Gln Gln Leu Ala Lys Lys 115 120 125 Trp Pro Leu Val Ala Ile Thr Asn Gly Asn Ala Gln Pro Glu Leu Phe 130 135 140 Gly Leu Gly Asp Tyr Phe Lys Phe Val Leu Arg Ala Gly Pro Asp Gly 145 150 155 160 Arg Ser Lys Pro Phe Ser Asp Met Tyr Phe Leu Val Ala Glu Lys Leu 165 170 175 His Val Pro Ile Gly Glu Ile Leu His Val Gly Asp Asp Leu Thr Thr 180 185 190 Asp Val Ala Gly Ala Ile Arg Cys Gly Met Gln Ala Cys Trp Ile Lys 195 200 205 Pro Glu Asn Ala Asp Leu Met Arg Thr Gln Asp Ser Arg Leu Leu Pro 210 215 220 His Ile Glu Ile Ser Arg Leu Ala Ser Leu Thr Ser Leu Ile 225 230 235 <210> 130 <211> 238 <212> PRT <213> Citrobacter braakii <400> 130 Met Arg Phe Tyr Arg Pro Leu Gly Arg Ile Ser Ala Leu Thr Phe Asp 1 5 10 15 Leu Asp Asp Thr Leu Tyr Asp Asn Arg Pro Val Ile Thr Arg Thr Glu 20 25 30 Gln Glu Ala Leu Ala Phe Val Gln Asn Tyr His Pro Ala Leu Asn Ser 35 40 45 Leu Gln Asn Ser Asp Leu Gln Arg Leu Arg Gln Ala Val Arg Asp Ala 50 55 60 Glu Pro Glu Ile Tyr His Asp Val Thr Gln Trp Arg His Arg Ala Val 65 70 75 80 Glu Arg Ala Met Leu Glu Ala Gly Leu Ser Glu Ala Glu Ala Lys Met 85 90 95 Gly Ala Asn Ala Ala Met Met Asn Phe Ala Lys Trp Arg Ser Arg Ile 100 105 110 Asp Val Pro Gln Ser Thr His Asp Thr Leu Lys Thr Leu Ala Arg Lys 115 120 125 Trp Pro Leu Val Ala Ile Thr Asn Gly Asn Ala Gln Pro Glu Leu Phe 130 135 140 Gly Leu Gly Asp Tyr Phe Glu Phe Val Leu Arg Ala Gly Pro Asp Gly 145 150 155 160 Arg Ser Lys Pro Phe Ser Asp Met Tyr Ala Leu Ala Ala Glu Lys Leu 165 170 175 Lys Met Pro Val Gly Glu Ile Leu His Val Gly Asp Asp Leu Thr Thr 180 185 190 Asp Val Ala Gly Ala Ile Arg Cys Gly Met Gln Ala Cys Trp Ile Lys 195 200 205 Pro Glu Asn Ala Asp Leu Met Gln Thr Ala Asp Ser Arg Leu Leu Pro 210 215 220 His Ile Glu Ile Ser Gln Leu Ala Ser Leu Thr Ser Leu Ile 225 230 235 <210> 131 <211> 238 <212> PRT <213> Enterobacter hormaechei <400> 131 Met Arg Phe Tyr Arg Pro Leu Gly Gln Ile Ser Ala Leu Thr Phe Asp 1 5 10 15 Leu Asp Asp Thr Leu Tyr Asp Asn Arg Pro Val Ile Leu Arg Thr Glu 20 25 30 Gln Glu Ser Leu Ala Phe Val Gln Asn Tyr His Pro Ala Leu Lys Thr 35 40 45 Met Gln Asn Lys Asp Phe Gln Lys Leu Arg Gln Ser Leu Arg Glu Thr 50 55 60 Glu Pro Asp Ile Tyr His Asp Val Thr Glu Trp Arg Arg Arg Ala Val 65 70 75 80 Glu Gln Ala Met Leu Asn Val Gly Leu Ser Ser Gln Asp Ala Ala Ile 85 90 95 Gly Ala Glu Ala Ala Met Glu Asn Phe Ala Lys Trp Arg Ser Arg Val 100 105 110 Asp Val Pro Gln Glu Thr His Asp Thr Leu Ala Lys Leu Ala Glu Lys 115 120 125 Trp Pro Leu Val Ala Ile Thr Asn Gly Asn Ala Gln Pro Glu Leu Phe 130 135 140 Gly Leu Gly Asp Tyr Phe Glu Phe Val Leu Arg Ala Gly Pro His Gly 145 150 155 160 Arg Ser Lys Pro Phe Ser Asp Met Tyr His Leu Ala Ala Glu Lys Leu 165 170 175 Asn Leu Pro Leu Gly Glu Ile Leu His Val Gly Asp Asp Leu Thr Thr 180 185 190 Asp Val Ala Gly Ala Ile Arg Cys Gly Met Gln Ala Cys Trp Ile Lys 195 200 205 Pro Glu Asn Ala Ser Leu Met Thr Thr Pro Asp Ser Arg Leu Leu Pro 210 215 220 His Leu Glu Ile Ser Arg Leu Ala Ser Leu Thr Thr Leu Ile 225 230 235 <210> 132 <211> 238 <212> PRT <213> Lelliottia amnigena <400> 132 Met Arg Phe Tyr Arg Pro Leu Gly Gln Ile Ser Ala Leu Thr Phe Asp 1 5 10 15 Leu Asp Asp Thr Leu Tyr Asp Asn Arg Gln Val Ile Leu Arg Thr Glu 20 25 30 Gln Glu Ala Leu Ala Phe Val Gln Asn Tyr His Pro Ser Leu Lys Thr 35 40 45 Leu Gln Asn Thr Asp Phe Gln Arg Leu Arg Gln Ala Leu Arg Glu Thr 50 55 60 Glu Pro Asp Ile Tyr His Asp Val Thr Glu Trp Arg Arg Arg Ala Val 65 70 75 80 Glu Gln Ala Met Ile Asn Ala Gly Leu Thr Ala Ala Glu Ala Ala Leu 85 90 95 Gly Ala Glu Ala Ser Met Ala Asn Phe Ala Lys Trp Arg Ser Arg Ile 100 105 110 Asp Val Pro Gln Glu Thr His Asp Thr Leu Ala Lys Leu Ala Glu Lys 115 120 125 Trp Pro Leu Val Ala Ile Thr Asn Gly Asn Ala Gln Pro Glu Leu Phe 130 135 140 Gly Leu Gly Asp Tyr Phe Thr Phe Val Phe Arg Ala Gly Pro His Gly 145 150 155 160 Arg Ser Lys Pro Phe Ser Asp Met Tyr His Leu Ala Ala Glu Lys Leu 165 170 175 Asp Leu Pro Leu Gly Glu Ile Leu His Val Gly Gly Asp Leu Thr Thr 180 185 190 Asp Val Ala Gly Ala Ile Arg Cys Gly Met Gln Ala Cys Trp Ile Lys 195 200 205 Pro Glu Asn Ala Asp Leu Met His Thr Ile Asp Ser Arg Leu Leu Pro 210 215 220 His Val Glu Ile Ser Arg Leu Ala Ser Leu Thr Thr Leu Ile 225 230 235 <210> 133 <211> 238 <212> PRT <213> Leclercia adecarboxylata <400> 133 Met Arg Phe Tyr Arg Pro Leu Gly Gln Ile Ser Ala Leu Thr Phe Asp 1 5 10 15 Leu Asp Asp Thr Leu Tyr Asp Asn Arg Gln Val Ile Leu Arg Thr Glu 20 25 30 Gln Glu Ala Leu Thr Phe Val Gln Asn Tyr His Pro Ala Leu Lys Thr 35 40 45 Leu Glu Asn Lys Glu Phe His Arg Leu Arg Gln Ala Leu Arg Gln Thr 50 55 60 Glu Pro Glu Ile Tyr His Asp Val Thr Glu Trp Arg Arg Arg Ala Val 65 70 75 80 Glu Leu Ala Met Leu Asn Ala Gly Leu Thr Ala Ala Glu Ala Ala Leu 85 90 95 Gly Ala Glu Ala Ser Met Ala His Phe Ala Gln Trp Arg Ser Arg Ile 100 105 110 Asp Val Pro Gln Glu Thr His Asp Thr Leu Ala Ala Leu Ala Glu Lys 115 120 125 Trp Pro Leu Val Ala Ile Thr Asn Gly Asn Ala Gln Pro Glu Leu Phe 130 135 140 Gly Leu Gly Asp Tyr Phe Gln Phe Val Leu Arg Ala Gly Pro His Gly 145 150 155 160 Arg Ser Lys Pro Phe Asn Asp Met Tyr His Leu Ala Ala Glu Lys Leu 165 170 175 Ser Leu Pro Leu Gly Gln Ile Leu His Val Gly Asp Asp Leu Thr Thr 180 185 190 Asp Val Ala Gly Ala Ile Arg Cys Gly Met Gln Ala Cys Trp Ile Lys 195 200 205 Pro Glu Asn Ala Asp Leu Met Gln Thr Ala Asp Ser Arg Leu Leu Pro 210 215 220 His Ile Glu Ile Ser Arg Leu Ala Ser Leu Thr Thr Leu Ile 225 230 235 <210> 134 <211> 190 <212> PRT <213> Shigella flexneri <400> 134 Met Ser Thr Pro Arg Gln Ile Leu Ala Ala Ile Phe Asp Met Asp Gly 1 5 10 15 Leu Leu Ile Asp Ser Glu Pro Leu Trp Asp Arg Ala Glu Leu Asp Val 20 25 30 Met Ala Ser Leu Gly Val Asp Ile Ser Arg Arg Asn Glu Leu Pro Asp 35 40 45 Thr Leu Gly Leu Arg Ile Asp Met Val Val Asp Leu Trp Tyr Ala Arg 50 55 60 Gln Pro Trp Asn Gly Pro Ser Arg Gln Glu Val Val Glu Arg Val Ile 65 70 75 80 Ala Arg Ala Ile Ser Leu Val Glu Glu Thr Arg Pro Leu Leu Pro Gly 85 90 95 Val Arg Glu Ala Val Ala Leu Cys Lys Glu Gln Gly Leu Leu Val Gly 100 105 110 Leu Ala Ser Ala Ser Pro Leu His Met Leu Glu Lys Val Leu Thr Met 115 120 125 Phe Asp Leu Arg Asp Ser Phe Asp Ala Leu Ala Ser Ala Glu Lys Leu 130 135 140 Pro Tyr Ser Lys Pro His Pro Gln Val Tyr Leu Asp Cys Ala Ala Lys 145 150 155 160 Leu Gly Val Asp Pro Leu Thr Cys Val Ala Leu Glu Asp Ser Val Asn 165 170 175 Gly Met Ile Ala Ser Lys Ala Ala Arg Met Arg Ser Ile Val 180 185 190 <210> 135 <211> 222 <212> PRT <213> Kosakonia sacchari <400> 135 Met Thr Thr Pro Arg Gln Ile Leu Ala Ala Ile Phe Asp Met Asp Gly 1 5 10 15 Leu Leu Ile Asp Ser Glu Pro Leu Trp Asp Arg Ala Glu Leu Glu Val 20 25 30 Val Ala Ser Leu Gly Val Asp Ile Thr Arg Arg His Glu Leu Pro Asp 35 40 45 Thr Leu Gly Leu Arg Ile Asp Met Val Val Glu Leu Trp Tyr Ala Gln 50 55 60 Gln Pro Trp Asn Gly Pro Asp Arg Gln Glu Val Thr Glu Cys Ile Ile 65 70 75 80 Gln Arg Ala Ile Ser Leu Val Glu Glu Lys Arg Pro Leu Leu Pro Gly 85 90 95 Val Arg Glu Ala Ile Ala Leu Cys Lys Ala Asn Gly Leu Leu Val Gly 100 105 110 Leu Ala Ser Ala Ser Pro Leu His Met Leu Glu Lys Val Leu Ala Met 115 120 125 Phe Glu Leu Arg Asp Ser Phe Asp Ala Leu Ala Ser Ala Glu Lys Leu 130 135 140 Pro Tyr Ser Lys Pro His Pro Gln Val Tyr Leu Asp Cys Ala Ala Lys 145 150 155 160 Leu Gly Val Asp Pro Leu Thr Cys Val Ala Leu Glu Asp Ser Val Asn 165 170 175 Gly Met Ile Ala Ser Lys Ala Ala Arg Met Arg Ser Ile Val Val Pro 180 185 190 Asp Glu Glu His Arg Ala Asp Pro Arg Tyr Val Leu Ala Asn Val Lys 195 200 205 Leu Thr Ser Leu Glu Gln Leu Thr Leu Ala His Pro Ile Gly 210 215 220 <210> 136 <211> 222 <212> PRT <213> Enterobacter mori <400> 136 Met Ser Thr Pro Arg Gln Ile Leu Ala Ala Ile Phe Asp Met Asp Gly 1 5 10 15 Leu Leu Ile Asp Ser Glu Pro Leu Trp Asp Arg Ala Glu Leu Asp Val 20 25 30 Met Ala Ser Leu Gly Val Asp Ile Ser Arg Arg Asn Glu Leu Pro Asp 35 40 45 Thr Leu Gly Leu Arg Ile Asp Met Val Val Asp Leu Trp Tyr Ala His 50 55 60 Gln Pro Trp Val Gly Pro Gly Arg Asp Glu Val Ile Ala Arg Ile Ile 65 70 75 80 Asn Arg Ala Ile Thr Leu Val Glu Glu Gln Lys Pro Leu Leu Pro Gly 85 90 95 Val Arg Asp Ala Ile Ala Leu Cys Lys Ala Gln Gly Leu Lys Val Gly 100 105 110 Leu Ala Ser Ala Ser Pro Leu His Met Leu Glu Lys Val Leu Ser Leu 115 120 125 Phe Glu Leu Arg Asp Ser Phe Asp Ala Leu Ala Ser Ala Glu Lys Leu 130 135 140 Pro Tyr Ser Lys Pro His Pro Gln Val Tyr Met Asp Cys Ala Ala Lys 145 150 155 160 Leu Gly Leu Asp Pro Leu Thr Cys Val Ala Leu Glu Asp Ser Val Asn 165 170 175 Gly Met Val Ala Ser Lys Ala Ala Arg Met Arg Ser Ile Val Val Pro 180 185 190 Ala Glu Glu Gly Arg His Asp Pro Arg Phe Ala Leu Ala Asp Val Lys 195 200 205 Leu Ala Ser Leu Glu Asp Leu Thr Val Ala His Leu Arg Gly 210 215 220 <210> 137 <211> 222 <212> PRT <213> Lelliottia amnigena <400> 137 Met Ser Thr Ser Arg Gln Ile Val Ala Ala Ile Phe Asp Met Asp Gly 1 5 10 15 Leu Leu Ile Asp Ser Glu Pro Leu Trp Asp Arg Ala Glu Leu Asp Val 20 25 30 Met Glu Ser Leu Gly Val Asp Ile Arg Arg Arg Asn Glu Leu Pro Asp 35 40 45 Thr Leu Gly Leu Arg Ile Asp Met Val Val Glu Leu Trp Tyr Ala His 50 55 60 Gln Pro Trp Asn Gly Pro Ser Arg Gln Glu Val Thr Asp Arg Ile Ile 65 70 75 80 Ser Arg Ala Leu Thr Leu Val Glu Ala Ser Arg Pro Leu Leu Pro Gly 85 90 95 Val Arg Glu Ala Val Ala Leu Cys Lys Ala Gln Gly Leu Lys Val Gly 100 105 110 Leu Ala Ser Ala Ser Pro Leu His Met Leu Glu Lys Val Leu Ala Met 115 120 125 Phe Asp Leu Arg Glu Ser Phe Asp Ala Leu Ala Ser Ala Glu Lys Leu 130 135 140 Pro Tyr Ser Lys Pro His Pro Gln Val Tyr Met Asp Cys Ala Ala Lys 145 150 155 160 Leu Gly Val Asp Thr Leu Ala Cys Val Ala Leu Glu Asp Ser Val Asn 165 170 175 Gly Met Ile Ala Ser Lys Ala Ala Arg Met Arg Ser Val Val Val Pro 180 185 190 Ala Glu Glu Gly Gln His Asp Pro Arg Phe Ala Leu Ala Asp Val Lys 195 200 205 Leu Ala Thr Leu Ala Asp Leu Thr Pro Ala His Leu Arg Gly 210 215 220 <210> 138 <211> 222 <212> PRT <213> Enterobacter sp. 638 <400> 138 Met Ser Thr Pro His Gln Ile Val Ala Ala Ile Phe Asp Met Asp Gly 1 5 10 15 Leu Leu Ile Asp Ser Glu Pro Leu Trp Asp Arg Ala Glu Leu Asp Val 20 25 30 Met Ala Ser Leu Gly Val Asp Ile Ser Arg Arg Gly Glu Leu Pro Asp 35 40 45 Thr Leu Gly Leu Arg Ile Asp Met Val Val Glu Leu Trp Phe Ala His 50 55 60 Gln Pro Trp Ser Gly Pro Ser Arg Glu Glu Val Thr Ala Arg Val Ile 65 70 75 80 Ser Arg Ala Ile Ala Leu Val Glu Glu Lys Arg Pro Leu Leu Pro Gly 85 90 95 Ala Arg Glu Ala Ile Ala Leu Cys Lys Ala Gln Gly Leu Lys Val Gly 100 105 110 Leu Ala Ser Ala Ser Pro Leu His Met Leu Glu Lys Val Leu Glu Met 115 120 125 Phe Asp Leu Arg Asp Ser Phe Asp Ala Leu Ala Ser Ala Glu Lys Leu 130 135 140 Pro Tyr Ser Lys Pro His Pro Gln Val Tyr Met Asp Cys Ala Ala Lys 145 150 155 160 Leu Gly Val Asp Pro Leu Ala Cys Val Ala Leu Glu Asp Ser Val Asn 165 170 175 Gly Met Val Ala Ser Lys Ala Ala Arg Met Arg Ser Ile Val Val Pro 180 185 190 Ala Glu Glu Gly Gln His Asp Pro Arg Phe Ala Leu Ala Asn Ala Lys 195 200 205 Leu Thr Ser Leu Val Asp Leu Thr Pro Ala His Leu Phe Gly 210 215 220 <210> 139 <211> 222 <212> PRT <213> Kosakonia radicincitans <400> 139 Met Thr Ala Pro Arg Gln Ile Leu Ala Ala Ile Phe Asp Met Asp Gly 1 5 10 15 Leu Leu Ile Asp Ser Glu Pro Leu Trp Asp Arg Ala Glu Leu Glu Val 20 25 30 Val Ala Ser Leu Gly Val Asp Ile Asn Arg Arg His Glu Leu Pro Asp 35 40 45 Thr Leu Gly Leu Arg Ile Asp Met Val Val Glu Leu Trp Tyr Ala Gln 50 55 60 Gln Pro Trp Asn Gly Pro Asp Arg Lys Glu Val Thr Glu Arg Ile Ile 65 70 75 80 Gln Arg Ala Ile Ser Leu Val Glu Glu Lys Arg Pro Leu Leu Pro Gly 85 90 95 Val Arg Glu Ala Ile Ala Leu Cys Lys Ala Asn Gly Leu Leu Val Gly 100 105 110 Leu Ala Ser Ala Ser Pro Leu His Met Leu Glu Lys Val Leu Ala Met 115 120 125 Phe Glu Leu Arg Asp Ser Phe Asp Ala Leu Ala Ser Ala Glu Asn Leu 130 135 140 Pro Tyr Ser Lys Pro His Pro Gln Val Tyr Leu Asp Cys Ala Ala Lys 145 150 155 160 Leu Gly Ile Asp Pro Leu Thr Cys Val Ala Leu Glu Asp Ser Val Asn 165 170 175 Gly Met Ile Ala Ser Lys Ala Ala Arg Met Arg Ser Ile Val Val Pro 180 185 190 Asp Glu Glu His Arg Thr Asp Pro Arg Tyr Val Leu Ala Asn Val Lys 195 200 205 Leu Thr Ser Leu Glu Gln Leu Thr Leu Ala His Leu Ile Gly 210 215 220 <210> 140 <211> 209 <212> PRT <213> Salmonella enterica subsp. enterica serovar Newport str. <400> 140 Met Asp Gly Leu Leu Ile Asp Ser Glu Pro Leu Trp Asp Arg Ala Glu 1 5 10 15 Leu Asp Val Met Ala Ser Leu Gly Val Asp Ile Thr Arg Arg His Glu 20 25 30 Leu Pro Asp Thr Leu Gly Leu Arg Ile Asp Met Val Val Asp Leu Trp 35 40 45 Phe Ala Gln Gln Pro Trp Asn Gly Pro Asp Arg Gln Glu Val Thr Asn 50 55 60 Arg Val Ile Ala Arg Ala Ile Thr Leu Ile Glu Glu Thr Arg Pro Leu 65 70 75 80 Leu Pro Gly Val Arg Glu Ala Val Ala Leu Cys Lys Ala Gln Gly Leu 85 90 95 Leu Val Gly Leu Ala Ser Ala Ser Pro Leu His Met Leu Glu Lys Val 100 105 110 Leu Thr Met Phe Glu Leu Arg Asp Ser Phe Asp Ala Leu Ala Ser Ala 115 120 125 Glu Lys Leu Pro Tyr Ser Lys Pro His Pro Gln Val Tyr Leu Asp Cys 130 135 140 Ala Ala Lys Leu Gly Val Asp Pro Leu Thr Cys Val Ala Leu Glu Asp 145 150 155 160 Ser Val Asn Gly Leu Ile Ala Ala Lys Ala Ala Arg Met Arg Ala Ile 165 170 175 Val Val Pro Ala Glu Glu Asn Gln His Asp Pro Arg Phe Ala Leu Ala 180 185 190 Asn Val Lys Leu Asn Ser Leu Thr Glu Leu Thr Ala Ala His Leu Leu 195 200 205 Gly <210> 141 <211> 188 <212> PRT <213> Shigella flexneri <400> 141 Met Tyr Glu Arg Tyr Ala Gly Leu Ile Phe Asp Met Asp Gly Thr Ile 1 5 10 15 Leu Asp Thr Glu Pro Thr His Arg Lys Ala Trp Arg Glu Val Leu Gly 20 25 30 His Tyr Gly Leu Gln Tyr Asp Val Gln Ala Met Ile Ala Leu Asn Gly 35 40 45 Ser Pro Thr Trp Arg Ile Ala Gln Ala Ile Ile Glu Leu Asn Gln Ala 50 55 60 Asp Leu Asp Pro His Ala Leu Ala Arg Glu Lys Thr Glu Ala Val Arg 65 70 75 80 Ser Met Leu Leu Asp Ser Val Glu Pro Leu Pro Leu Val Glu Val Val 85 90 95 Lys Ser Trp His Gly Arg Arg Pro Met Ala Val Gly Thr Gly Ser Glu 100 105 110 Ser Ala Ile Ala Glu Ala Leu Leu Ala His Leu Gly Leu Arg Arg Tyr 115 120 125 Phe Asp Ala Val Val Ala Ala Asp His Val Lys His His Lys Pro Ala 130 135 140 Pro Asp Thr Phe Leu Leu Cys Ala Gln Arg Met Gly Val Gln Pro Thr 145 150 155 160 Gln Cys Val Val Phe Glu Asp Ala Asp Phe Gly Ile Gln Ala Ala Arg 165 170 175 Ala Ala Gly Met Asp Ala Val Asp Ile Arg Leu Leu 180 185 <210> 142 <211> 188 <212> PRT <213> Escherichia albertii <400> 142 Met Tyr Glu Arg Tyr Ala Gly Leu Ile Phe Asp Met Asp Gly Thr Ile 1 5 10 15 Leu Asp Thr Glu Pro Thr His Arg Lys Ala Trp Arg Glu Val Leu Gly 20 25 30 Arg Tyr Gly Leu Arg Tyr Asn Val Gln Ala Met Ile Ala Leu Asn Gly 35 40 45 Ser Pro Thr Trp Arg Ile Ala Gln Ala Ile Ile Glu Leu Asn Gln Ala 50 55 60 Asp Leu Asp Pro Tyr Ala Leu Ala Arg Glu Lys Thr Glu Ala Val Arg 65 70 75 80 Ser Met Leu Leu Asp Ser Val Glu Pro Leu Pro Leu Val Glu Val Val 85 90 95 Lys Ser Trp Tyr Gly Arg Arg Pro Met Ala Val Gly Thr Gly Ser Glu 100 105 110 Ser Ala Ile Ala Glu Ala Leu Leu Thr His Leu Gly Leu Arg Arg Tyr 115 120 125 Phe Asp Thr Val Val Ala Ala Asp His Val Lys His His Lys Pro Ala 130 135 140 Pro Asp Thr Phe Leu Leu Cys Ala Gln His Met Gly Val Gln Pro Ala 145 150 155 160 Gln Cys Val Val Phe Glu Asp Ala Asp Phe Gly Ile Gln Ala Ala Arg 165 170 175 Ala Ala Gly Met Asp Ala Val Asp Val Arg Leu Leu 180 185 <210> 143 <211> 188 <212> PRT <213> Salmonella enterica <400> 143 Met Tyr Ala Arg Tyr Ala Gly Leu Ile Phe Asp Met Asp Gly Thr Leu 1 5 10 15 Leu Asp Thr Glu Pro Thr His Arg Lys Ala Trp Arg Glu Val Leu Gly 20 25 30 His Tyr Gly Leu Arg Phe Asp Glu Gln Ala Met Val Ala Leu Asn Gly 35 40 45 Ser Pro Thr Trp Leu Ile Ala Gln Ser Ile Ile Glu Leu Asn His Ala 50 55 60 Asp Leu Asp Pro Leu Ser Leu Ala Arg Glu Lys Thr Asp Ala Val Lys 65 70 75 80 Ser Ile Leu Leu Asp Cys Val Glu Pro Leu Pro Leu Val Glu Val Val 85 90 95 Lys Ala Trp His Gly Arg Arg Pro Met Ser Val Gly Thr Gly Ser Glu 100 105 110 Ser Ala Ile Ala Glu Ala Leu Leu Ala His Leu Gly Leu Arg Arg Tyr 115 120 125 Phe Asp Ala Val Val Ala Ala Asp His Val Gln His His Lys Pro Ala 130 135 140 Pro Asp Thr Phe Leu Leu Cys Ala Gln Arg Met Gly Val Met Pro Thr 145 150 155 160 Gln Cys Val Val Phe Glu Asp Ala Asp Phe Gly Leu Gln Ala Ala Arg 165 170 175 Ala Ala Gly Met Asp Ala Val Asp Val Arg Leu Leu 180 185 <210> 144 <211> 188 <212> PRT <213> Kluyvera intermedia <400> 144 Met Tyr Glu Arg Tyr Asp Gly Leu Ile Phe Asp Met Asp Gly Thr Ile 1 5 10 15 Leu Asp Thr Glu Pro Thr His Arg Lys Ala Trp His Asp Val Leu Gly 20 25 30 His Tyr Gly Leu Arg Tyr Asp Ile Gln Ala Met Ile Ala Leu Asn Gly 35 40 45 Ser Pro Thr Trp Arg Ile Ala Gln Ser Val Ile Glu Leu Asn Gln Ala 50 55 60 Asp Leu Asp Pro Tyr Ala Leu Ala Arg Glu Lys Thr Glu Ala Val Lys 65 70 75 80 Ala Met Leu Leu Asp Thr Val Arg Pro Leu Pro Leu Ile Asp Val Val 85 90 95 Lys Ala Trp Tyr Gly Arg Arg Pro Leu Ser Val Gly Thr Gly Ser Glu 100 105 110 Ser Ala Ile Ala Glu Ala Leu Leu Ser His Leu Gly Leu Arg His Tyr 115 120 125 Phe Ala Ala Val Val Ala Ala Glu His Val Lys Asn His Lys Pro Ala 130 135 140 Pro Asp Thr Phe Leu Leu Cys Ala Glu Lys Met Gly Val Ala Pro Gln 145 150 155 160 Lys Cys Val Val Phe Glu Asp Ala Asp Phe Gly Leu Gln Ala Ala Arg 165 170 175 Ser Ala Gly Met Asp Ala Val Asp Val Arg Leu Leu 180 185 <210> 145 <211> 188 <212> PRT <213> Trabulsiella odontotermitis <400> 145 Met Tyr Glu Arg Tyr Ala Gly Leu Ile Phe Asp Met Asp Gly Thr Ile 1 5 10 15 Leu Asp Thr Glu Pro Thr His Arg Lys Ala Trp His Glu Val Leu Gly 20 25 30 Arg Tyr Gly Ile Arg Phe Asp Glu Gln Ser Ile Ile Ala Leu Asn Gly 35 40 45 Ser Pro Thr Trp Arg Ile Ala Gln Glu Ile Ile Thr Leu Asn Gln Ala 50 55 60 Asp Leu Asp Pro His Ala Leu Ala Arg Glu Lys Thr Asp Ala Val Lys 65 70 75 80 Ile Met Leu Leu Asp Ser Val Gln Pro Leu Pro Leu Ile Asp Val Val 85 90 95 Lys Ala Trp His Gly Arg Arg Pro Met Ser Val Gly Thr Gly Ser Glu 100 105 110 Ser Ala Ile Ala Glu Ala Leu Leu Ala His Leu Gly Leu Arg His Tyr 115 120 125 Phe Ser Ala Val Val Ala Ala Asp His Val Arg His His Lys Pro Ala 130 135 140 Pro Asp Thr Phe Leu Leu Cys Ala Glu Arg Met Gly Val Glu Pro Ala 145 150 155 160 Lys Cys Ile Val Phe Glu Asp Ala Asp Phe Gly Leu Gln Ala Ala Ala 165 170 175 Ser Ala Gly Met Asp Val Val Asp Val Arg Leu Leu 180 185 <210> 146 <211> 188 <212> PRT <213> Yokenella regensburgei <400> 146 Met Tyr Glu Arg Tyr Ala Gly Leu Ile Phe Asp Met Asp Gly Thr Ile 1 5 10 15 Leu Asp Thr Glu Pro Thr His Cys Lys Ala Trp His Asp Val Leu Gly 20 25 30 Arg Tyr Gly Met His Phe Asp Glu Gln Ala Met Thr Ala Leu Asn Gly 35 40 45 Ser Pro Thr Trp Arg Ile Ala Gln Ser Ile Ile Glu Leu Asn Gln Ala 50 55 60 Thr Leu Asp Pro His Gln Leu Ala Arg Glu Lys Thr Asp Ala Val Lys 65 70 75 80 Ala Met Leu Leu Asp Thr Val Arg Pro Leu Pro Leu Ile Asp Val Val 85 90 95 Lys Ala Trp His Gly Arg Arg Pro Met Ala Val Gly Thr Gly Ser Glu 100 105 110 Ser Ala Ile Ala Glu Ala Leu Leu Ala His Leu Gly Leu Arg Glu Tyr 115 120 125 Phe Thr Ala Val Val Ala Ala Asp His Val Lys His His Lys Pro Ala 130 135 140 Pro Asp Thr Phe Leu Leu Cys Ala Glu Leu Met Gly Val Ala Ala Asn 145 150 155 160 Gln Cys Val Val Phe Glu Asp Ala Asp Phe Gly Leu Gln Ala Ala Arg 165 170 175 Ser Ala Gly Met Asp Val Val Asp Val Arg Leu Leu 180 185 <210> 147 <211> 188 <212> PRT <213> Raoultella terrigena <400> 147 Met Tyr Glu Arg Tyr Ala Gly Leu Ile Phe Asp Met Asp Gly Thr Ile 1 5 10 15 Leu Asp Thr Glu Pro Thr His Arg Lys Ala Trp His Glu Val Leu Gly 20 25 30 Arg Tyr Gly Met Arg Phe Asp Glu Gln Ala Met Val Ala Leu Asn Gly 35 40 45 Ser Pro Thr Trp Arg Ile Ala Gln Val Ile Ile Glu Leu Asn Gln Ala 50 55 60 Asp Leu Asp Pro His Arg Leu Ala Leu Glu Lys Thr Asn Ala Val Lys 65 70 75 80 Ala Met Leu Leu Asp Ser Val Arg Pro Leu Pro Leu Ile Glu Val Val 85 90 95 Lys Glu Trp His Gly Arg Arg Pro Met Ser Val Gly Thr Gly Ser Glu 100 105 110 Ser Ala Val Ala Glu Ala Leu Leu Ala His Leu Gly Leu Arg His Tyr 115 120 125 Phe Ser Ala Val Ile Ala Ala Asp His Val Thr Asn His Lys Pro Ala 130 135 140 Pro Asp Thr Phe Leu Leu Cys Ala Glu Arg Met Gly Val Ala Pro Glu 145 150 155 160 Lys Cys Val Val Phe Glu Asp Ala Asp Phe Gly Leu Gln Ala Ala Arg 165 170 175 Arg Ala Gly Met Asp Ala Val Asp Val Arg Leu Leu 180 185 <210> 148 <211> 188 <212> PRT <213> Klebsiella pneumoniae <400> 148 Met Tyr Glu Gly Tyr Ala Gly Leu Ile Phe Asp Met Asp Gly Thr Ile 1 5 10 15 Leu Asp Thr Glu Pro Thr His Arg Gln Ala Trp Asn Glu Val Leu Gly 20 25 30 Arg Tyr Gly Met Arg Phe Asp Glu Gln Ala Met Val Ala Leu Asn Gly 35 40 45 Ser Pro Thr Trp Arg Ile Ala Gln Ala Ile Ile Glu Leu Asn Gln Ala 50 55 60 Asp Leu Asp Pro His Arg Leu Ala Gln Glu Lys Thr Gln Ala Val Lys 65 70 75 80 Ala Met Leu Leu Asp Ser Val Arg Pro Leu Pro Leu Ile Glu Val Val 85 90 95 Lys Ala Trp His Gly Cys Arg Pro Met Ser Val Gly Thr Gly Ser Glu 100 105 110 Ser Ala Val Ala Glu Ala Leu Leu Ala His Leu Gly Leu Arg His Tyr 115 120 125 Phe Ser Ala Val Val Ala Ala Asp His Val Val Asn His Lys Pro Ala 130 135 140 Pro Asp Thr Phe Leu Leu Cys Ala Glu Arg Met Gly Val Ala Pro Glu 145 150 155 160 Lys Cys Val Val Phe Glu Asp Ala Asp Phe Gly Leu Gln Ala Ala Lys 165 170 175 Arg Ala Gly Met Asp Ala Val Asp Val Arg Leu Leu 180 185 <210> 149 <211> 223 <212> PRT <213> Pseudomonas putida <400> 149 Met Arg Leu Arg Ala Val Leu Phe Asp Met Asp Gly Thr Leu Leu Asp 1 5 10 15 Thr Ala Pro Asp Phe Ile Ala Ile Cys Gln Ala Met Leu Ala Asp Arg 20 25 30 Gly Leu Pro Ala Ile Asp Asp Ala Arg Ile Arg Glu Val Ile Ser Gly 35 40 45 Gly Ala Arg Ala Met Val Ala Ala Thr Phe Ala Met Asn Pro Glu Ala 50 55 60 Asp Gly Phe Glu Ala Leu Arg Leu Glu Phe Leu Glu Arg Tyr Gln Arg 65 70 75 80 Asp Cys Ala Val His Ser Lys Leu Phe Asp Gly Met Pro Glu Leu Leu 85 90 95 Ala Asp Ile Glu Lys Gly Asn Leu Leu Trp Gly Val Val Thr Asn Lys 100 105 110 Pro Val Arg Phe Ala Glu Pro Ile Met Gln Arg Leu Gly Leu Ala Glu 115 120 125 Arg Ser Ala Leu Leu Ile Cys Pro Asp His Val Lys Asn Ser Lys Pro 130 135 140 Asp Pro Glu Pro Leu Ile Leu Ala Cys Lys Thr Leu Gly Leu Asp Pro 145 150 155 160 Ala Ser Val Leu Phe Val Gly Asp Asp Leu Arg Asp Ile Glu Ser Gly 165 170 175 Arg Asp Ala Gly Thr Arg Thr Ala Ala Val Arg Tyr Gly Tyr Ile His 180 185 190 Pro Glu Asp Asn Pro Asn Asn Trp Gly Ala Asp Val Val Val Asp His 195 200 205 Pro Leu Glu Leu Arg Lys Val Ile Asp Ser Ala Leu Cys Gly Cys 210 215 220 <210> 150 <211> 223 <212> PRT <213> Pseudomonas sp. GM84 <400> 150 Met Arg Leu Arg Ala Val Leu Phe Asp Met Asp Gly Thr Leu Leu Asp 1 5 10 15 Thr Ala Pro Asp Phe Ile Ala Ile Cys Gln Ala Met Leu Ala Glu Arg 20 25 30 Gly Leu Pro Ala Ile Asp Asp Lys Leu Ile Arg Asp Val Ile Ser Gly 35 40 45 Gly Ala Arg Ala Met Val Ala Ala Thr Phe Ala Met Asn Pro Asp Asp 50 55 60 Asp Gly Phe Glu Pro Leu Arg Leu Glu Phe Leu Glu Arg Tyr Gln Arg 65 70 75 80 Asp Cys Ala Val His Ser Lys Leu Phe Asp Gly Met Gly Glu Leu Leu 85 90 95 Ala Asp Ile Glu Lys Gly Asn Leu Leu Trp Gly Val Val Thr Asn Lys 100 105 110 Pro Val Arg Phe Ala Glu Pro Ile Met Gln Arg Leu Gly Leu Ala Glu 115 120 125 Arg Ser Ala Leu Leu Ile Cys Pro Asp His Val Lys Asn Ser Lys Pro 130 135 140 Asp Pro Glu Pro Leu Ile Leu Ala Cys Lys Thr Leu Asn Leu Asp Pro 145 150 155 160 Ala Ser Val Leu Phe Val Gly Asp Asp Leu Arg Asp Ile Glu Ser Gly 165 170 175 Arg Asp Ala Gly Thr Arg Thr Ala Ala Val Arg Tyr Gly Tyr Ile His 180 185 190 Pro Glu Asp Asn Pro Asn Asn Trp Gly Ala Asp Val Val Val Asp His 195 200 205 Pro Leu Glu Leu Arg Lys Val Ile Asp Ser Ala Leu Cys Gly Cys 210 215 220 <210> 151 <211> 223 <212> PRT <213> Pseudomonas entomophila <400> 151 Met Arg Leu Arg Ala Val Leu Phe Asp Met Asp Gly Thr Leu Leu Asp 1 5 10 15 Thr Ala Pro Asp Phe Ile Ala Ile Cys Gln Ala Met Leu Thr Asp Arg 20 25 30 Gly Leu Pro Thr Ile Asp Asp Ala Arg Ile Arg Asp Val Ile Ser Gly 35 40 45 Gly Ala Arg Ala Met Val Ala Ala Thr Phe Ala Met Asp Pro Asp Ala 50 55 60 Glu Gly Phe Glu Ala Leu Arg Leu Glu Phe Leu Glu Arg Tyr Gln Arg 65 70 75 80 Asp Cys Ala Val His Ser Lys Leu Phe Asp Gly Met Pro Glu Leu Leu 85 90 95 Ala Asp Ile Glu Lys Gly Asn Leu Leu Trp Gly Val Val Thr Asn Lys 100 105 110 Pro Val Arg Phe Ala Glu Pro Ile Met Gln Arg Leu Gly Leu Ala Glu 115 120 125 Arg Ser Ala Leu Leu Ile Cys Pro Asp His Val Lys Asn Ser Lys Pro 130 135 140 Asp Pro Glu Pro Leu Ile Leu Ala Cys Lys Thr Leu Asp Leu Asp Pro 145 150 155 160 Ala Ser Val Leu Phe Val Gly Asp Asp Leu Arg Asp Ile Glu Ser Gly 165 170 175 Arg Asp Ala Gly Thr Arg Thr Ala Ala Val Arg Tyr Gly Tyr Ile His 180 185 190 Pro Glu Asp Asn Pro Asn Asn Trp Gly Ala Asp Val Val Val Asp His 195 200 205 Pro Leu Glu Leu Arg Lys Val Ile Asp Ser Ala Leu Cys Gly Cys 210 215 220 <210> 152 <211> 223 <212> PRT <213> Pseudomonas vranovensis <400> 152 Met Arg Leu Arg Ala Val Leu Phe Asp Met Asp Gly Thr Leu Leu Asp 1 5 10 15 Thr Ala Pro Asp Phe Ile Ala Ile Cys Gln Ala Met Leu Ala Asp Arg 20 25 30 Gly Leu Pro Ala Ile Asp Asp Gln Arg Ile Arg Asp Val Ile Ser Gly 35 40 45 Gly Ala Arg Ala Met Val Glu Val Thr Phe Gly Ile Thr Pro Glu Val 50 55 60 Ala Glu Phe Glu Ala Leu Arg Leu Glu Phe Leu Glu Arg Tyr Gln Arg 65 70 75 80 Asp Cys Ala Val His Ser Lys Leu Phe Asp Gly Met Ala Glu Leu Leu 85 90 95 Ala Asp Ile Glu Lys Gly Asn Leu Leu Trp Gly Val Val Thr Asn Lys 100 105 110 Pro Val Arg Phe Ala Glu Pro Ile Met Gln Arg Leu Gly Leu Ala Glu 115 120 125 Arg Ser Ala Leu Leu Ile Cys Pro Asp His Val Lys Asn Ser Lys Pro 130 135 140 Asp Pro Glu Pro Leu Ile Leu Ala Cys Lys Thr Leu Asn Leu Asp Pro 145 150 155 160 Ala Ser Val Leu Phe Val Gly Asp Asp Leu Arg Asp Ile Glu Ser Gly 165 170 175 Arg Asp Ala Gly Thr Arg Thr Ala Ala Val Arg Tyr Gly Tyr Ile His 180 185 190 Pro Glu Asp Asn Pro Asn Asn Trp Gly Ala Asp Val Val Val Asp His 195 200 205 Pro Leu Glu Leu Arg Lys Val Leu Asp Ser Ala Leu Cys Gly Cys 210 215 220 <210> 153 <211> 223 <212> PRT <213> Pseudomonas cannabina <400> 153 Met Arg Leu Arg Ala Val Leu Phe Asp Met Asp Gly Thr Leu Leu Asp 1 5 10 15 Thr Ala Pro Asp Phe Ile Ala Ile Ala Gln Ala Met Leu Ala Asp Arg 20 25 30 Gly Leu Pro Ala Val Ala Asp Lys Leu Ile Arg Asp Glu Ile Ser Gly 35 40 45 Gly Ala Lys Ala Met Val Ala Ala Ala Phe Ala Leu Ser Pro Glu Ala 50 55 60 Pro Glu Phe Glu Ala Leu Arg Leu Glu Phe Leu Glu Arg Tyr Gln Arg 65 70 75 80 Asp Cys Ala Thr His Ser Arg Leu Phe Asn Gly Met Pro Glu Leu Leu 85 90 95 Ala Asp Ile Glu Lys Ala Gly Leu Ile Trp Gly Val Val Thr Asn Lys 100 105 110 Pro Val Arg Phe Ala Gln Pro Ile Met Glu Gln Leu Lys Leu Ala Glu 115 120 125 Arg Ser Ala Val Leu Ile Cys Pro Asp His Val Thr His Ser Lys Pro 130 135 140 His Pro Glu Pro Met Ile Leu Ala Cys Lys Leu Leu Asp Leu Asp Pro 145 150 155 160 Ala Ser Val Leu Phe Val Gly Asp Asp Leu Arg Asp Ile Glu Ser Gly 165 170 175 Arg Asp Ala Gly Thr Lys Thr Ala Ala Val Arg Tyr Gly Tyr Ile His 180 185 190 Pro Asp Asp Asn Pro Asp His Trp Gly Ala Asp Val Val Val Asp His 195 200 205 Pro Leu Glu Leu Arg Lys Val Leu Asp Asn Ala Leu Cys Ser Cys 210 215 220 <210> 154 <211> 223 <212> PRT <213> Pseudomonas monteilii <400> 154 Met Arg Leu Arg Ala Val Leu Phe Asp Met Asp Gly Thr Leu Leu Asp 1 5 10 15 Thr Ala Pro Asp Phe Ile Ala Ile Cys Gln Ala Met Leu Ala Glu Arg 20 25 30 Gly Leu Pro Ala Ile Asp Asp Gln Ala Ile Arg Asp Val Ile Ser Gly 35 40 45 Gly Ala Arg Ala Met Val Ala Ala Thr Phe Ala Met Asn Pro Glu Asp 50 55 60 Glu Gly Phe Glu Ala Leu Arg Leu Glu Phe Leu Glu Arg Tyr Gln Arg 65 70 75 80 Asp Cys Ala Val His Ser Lys Leu Phe Asp Gly Met Gly Glu Leu Leu 85 90 95 Ala Asp Leu Glu Lys Gly Lys Leu Leu Trp Gly Val Val Thr Asn Lys 100 105 110 Pro Val Arg Phe Ala Glu Pro Ile Met Gln Gln Leu Gly Leu Ala Glu 115 120 125 Arg Ser Ala Leu Leu Ile Cys Pro Asp His Val Lys Asn Ser Lys Pro 130 135 140 Asp Pro Glu Pro Leu Ile Leu Ala Cys Lys Thr Leu Asn Leu Asp Pro 145 150 155 160 Ala Ser Val Leu Phe Val Gly Asp Asp Leu Arg Asp Ile Glu Ser Gly 165 170 175 Arg Asp Ala Gly Thr Arg Thr Ala Ala Val Arg Tyr Gly Tyr Ile His 180 185 190 Pro Asp Asp Asn Pro Asn His Trp Gly Ala Asp Val Val Val Asp His 195 200 205 Pro Leu Glu Leu Arg Lys Val Ile Asp Ser Ala Leu Cys Gly Cys 210 215 220

Claims (50)

  1. 미생물에서 시알일화 화합물을 생산하는 방법으로서,
    - 미생물을 배양 배지에서 배양하는 단계로서, 상기 배양 배지는 선택적으로 외인성 전구물질을 포함하고,
    상기 미생물은 포스파타제를 코딩하는 적어도 하나의 핵산, N-아세틸만노사민 에피머라제를 코딩하는 적어도 하나의 핵산; 및 시알산 신타제를 코딩하는 적어도 하나의 핵산을 포함하며,
    상기 미생물은 i) N-아세틸글루코사민-6-P를 글루코사민-6-P로 전환, ii) N-아세틸-글루코사민을 N-아세틸-글루코사민-6-P로 전환, 및 iii) N-아세틸-뉴라미네이트를 N-아세틸-만노사민으로 전환시킬 수 없는 것인 단계; 및
    - 상기 미생물에서 상기 포스파타제를 코딩하는 핵산의 발현을 증가시키는 단계로서, 상기 포스파타제는:
    - 모티프 2: [GSTDE][DSEN]x(1-2)[hP]x(1-2)[DGTS] (서열번호: 74, 75, 76, 77), 여기서 h는 소수성 아미노산 (A, I, L, M, F, V, P, G)을 의미하고, x는 임의의 별개의 아미노산일 수 있고;
    - 또는, 서열번호: 46, 52, 69, 70, 57, 42, 47, 43, 50, 59, 65, 54, 60, 45, 67, 44, 48, 51, 또는 55 중 어느 하나 폴리펩티드에 대해 적어도 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 또는 99 %의 전체 서열 동일성 및 포스파타제 활성을 갖는, 상기 폴리펩티드의 상동체 또는 유도체를 포함하는 것인 단계;를 포함하는 방법.
  2. 청구항 1에 있어서, 상기 포스파타제는 서열번호: 46, 52, 69, 70, 57, 42, 47, 43, 50, 59, 65, 54, 58, 60, 45, 67, 44, 48, 51 또는 55 중 어느 하나를 포함하는 것인 방법.
  3. 청구항 1에 있어서, 상기 증가된 발현은 상기 포스파타제를 코딩하는 핵산을 미생물에 도입 및 발현시켜 수행되는 것인 방법.
  4. 청구항 1에 있어서, 상기 증가된 발현은 항시성 프로모터의 작용에 의해 수행되는 것인 방법.
  5. 청구항 1 내지 4 중 어느 한 항에 있어서, 상기 시알일화 화합물은 N-아세틸뉴람산, 시알일화 올리고사카리드, 시알일화 지질, 시알일화 단백질, 시알일화 아글리콘으로 구성된 그룹으로부터 선택되는 것인 방법.
  6. 시알일화 올리고사카리드를 생산하는 방법으로서,
    - 미생물을 배양 배지에서 배양하는 단계로서, 상기 배양 배지는 선택적으로 외인성 전구물질을 포함하고,
    상기 미생물은 포스파타제를 코딩하는 적어도 하나의 핵산, N-아세틸만노사민 에피머라제를 코딩하는 적어도 하나의 핵산; 시알릴트랜스퍼라제를 코딩하는 적어도 하나의 핵산; 및 시알산 신타제를 코딩하는 적어도 하나의 핵산을 포함하며,
    상기 미생물은 i) N-아세틸글루코사민-6-P를 글루코사민-6-P로 전환, ii) N-아세틸-글루코사민을 N-아세틸-글루코사민-6-P로 전환, 및 iii) N-아세틸-뉴라미네이트를 N-아세틸-만노사민으로 전환시킬 수 없고; 상기 미생물은 캄필로박터 제주니 또는 네이세리아 메닌기티데스 유래 시알산 신타제 폴리펩티드를 코딩하는 핵산, 바람직하게는 각각 CjNeuB 또는 NmNeuB 을 포함하는 것에 특징이 있는, 방법.
  7. 청구항 6에 있어서, 상기 미생물은 포스파타제를 코딩하는 핵산의 증가된 발현을 포함하고, 바람직하게는 상기 포스파타제는:
    - 서열번호: 46, 52, 69, 70, 57, 42, 47, 43, 50, 59, 65, 54, 58, 60, 45, 67, 44, 48, 51 또는 55 중 어느 하나;
    - 또는 상기 포스파타제에 대해 적어도 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 또는 99 %의 전체 서열 동일성 및 포스파타제 활성을 갖는 서열번호: 46, 52, 69, 70, 57, 42, 47, 43, 50, 59, 65, 54, 58, 60, 45, 67, 44, 48, 51 또는 55 중 어느 하나의 상동체 또는 유도체로서, 바람직하게는 상기 상동체 또는 유도체는 시알산 및/또는 바이오매스 생산을 참조 균주에 비해 증가시키는 것인 상동체 또는 유도체를 포함하는 것인 방법.
  8. 청구항 1 내지 7 중 어느 한 항에 있어서, 상기 시알일화 화합물은 시알일화 올리고사카리드이고, 바람직하게는 상기 시알일화 올리고사카리드는 시알일락토스, 디시알일 락토-N-테트라오스, 또는 N-아세틸뉴라민산인 것인 방법.
  9. 청구항 1 내지 8 중 어느 한 항에 있어서, 상기 시알일화 화합물은 시알일화 락토-N-트리오스, 락토-N-테트라오스 또는 락토-N-네오테트라오스이고, 상기 미생물은 갈락토실트란스퍼라제 (EC 2.4.1.38)의 활성을 더 포함하는 것인 방법.
  10. 청구항 9에 있어서, 상기 미생물은 UDP 당 히드롤라제 및 갈락토스-1-포스페이트 우리딜일트란스퍼라제를 코딩하는 유전자를 발현할 수 없는 것인 방법.
  11. 청구항 1 내지 8 중 어느 한 항에 있어서, 상기 미생물은 시알일화 화합물보다 50%, 40%, 30%, 20%, 10%, 5%, 2% 미만의 세포외 N-아세틸글루코사민을 생산하는 것인 방법.
  12. 시알일화 올리고사카리드를 생산하는 방법으로서,
    a) 청구항 1 내지 12 중 어느 한 항의 방법에 따라 미생물을 배양하는 단계로서, 상기 미생물은 시알일트란스퍼라제에 대한 공여체 기질로서 내부적으로, 활성화된 N-아세틸뉴라미네이트를 생산하는 것인 단계; 및
    b) 락토스, N-아세틸락토사민, 락토-N-비오스, 갈락토스, 베타-갈락토시드, 및 알파-갈락토시드 예컨대 이에 한정되는 것은 아니지만, 글로보트리오스 (Gal-알파-1,4Gal- 베타-1,4Glc)갈락토스로 구성된 그룹으로부터 선택된 외인성 전구물질을 포함하는 배양 배지에서 상기 미생물을 배양하는 단계로서, 상기 미생물로 상기 외인성 전구물질의 능동 흡수가 일어나고, 상기 외인성 전구물질은 시알일화 올리고사카리드를 생산하기 위한 상기 시알일트란스퍼라제에 대한 수용체 기질인 것인 단계;를 포함하는 방법.
  13. 청구항 1에 있어서, 상기 N-아세틸만노사민 에피머라제 및 시알산 신타제 중 어느 하나 이상이 상기 미생물에서 과발현되는 것인 방법.
  14. 청구항 1에 있어서, 상기 N-아세틸만노사민 에피머라제 및 시알산 신타제 중 어느 하나 이상이 상기 미생물에 도입 및 발현되는 것인 방법.
  15. 청구항 1 내지 14 중 어느 한 항에 있어서, 상기 미생물은 하기 효소 i) N-아세틸글리코사민-6-포스페이트 데아세틸라제, ii) N-아세틸글루코사민 키나제, 및 iii) N-아세틸뉴라미네이트 알돌라제를 코딩하는 유전자를 결여한 것인 방법.
  16. 청구항 1 내지 14 중 어느 한 항에 있어서, 상기 미생물에서, 하기 효소 i) N-아세틸글리코사민-6-포스페이트 데아세틸라제, ii) N-아세틸글루코사민 키나제, 및 iii) N-아세틸뉴라미네이트 알돌라제를 코딩하는 유전자가 활성이 감소하고, 바람직하게는 상기 유전자는 결실 또는 녹아웃 (knocked-out)된 방법.
  17. 청구항 1 내지 16 중 어느 한 항에 있어서, 상기 미생물은 락토스 흡수를 촉진하는 단백질을 추가로 코딩하고, 락토스를 대사작용하는 효소가 결여된 것인 방법.
  18. 청구항 1 내지 17 중 어느 한 항에 있어서, 상기 미생물은 박테리아, 바람직하게는 에스케리치아 콜리 (Escherichia coli) 균주, 보다 바람직하게는 에스케리치아 콜리 균주인 K12 균주, 보다 더 바람직하게는 상기 에스케리치아 콜리 K12 균주는 에스케리치아 콜리 MG1655 이거나,
    상기 미생물 균주는 이스트인 방법.
  19. 청구항 6 내지 18 중 어느 한 항에 있어서, 상기 외인성 전구물질은 락토스, 갈락토스, 베타-갈락토시드, 및 알파-갈락토시드 예컨대 글로보트리오스 (Gal-알파-1,4Gal-베타-1,4Glc)를 포함하는 그룹으로부터 선택되는 것인 방법.
  20. 청구항 1 내지 19 중 어느 한 항에 있어서, 3-시알일락토스 또는 6-시알일락토스 생산을 위해, 상기 미생물은 탄소 기질, 예컨대 글루코스 또는 글리세롤 또는 수크로스 상에서 높은 세포 밀도로 배양되고, 락토스가 공급되고, 상기 락토스는 락토스 퍼미아제에 의해 내재화되고, N-아세틸글루코사민으로부터 내인성으로 생성된 CMP- N-아세틸-뉴라미네이트를 사용하여 상기 재조합 시알일트란스퍼라제에 의해 시알일화되는 것인 방법.
  21. 청구항 1 내지 20 중 어느 한 항에 있어서, 상기 시알일화 화합물이 원심분리, 여과, 미세여과, 한외여과, 나노여과, 이온 교환, 전기투석, 크로마토그래피, 모사 이동상, 증발, 침전, 결정화, 동결건조 및/또는 분무 건조의 그룹으로부터 선택된 유닛 작동에 의해 상기 배양 배지로부터 단리되는 것인 방법.
  22. 청구항 1 내지 21 중 어느 한 항에 있어서, 상기 배양 배지는 주 탄소원으로서 모노사카리드, 디사카리드, 올리고사카리드, 폴리사카리드, 폴리올, 복합 배지 중 어느 하나 이상을 포함하는 것인 방법.
  23. 청구항 22에 있어서, 상기 주 탄소원은 상기 미생물 성장을 위해 모든 필요한 탄소의 적어도 20%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 100%를 제공하는 것인 방법.
  24. 청구항 22 또는 23에 있어서, 상기 모노사카리드는 글루코스, 프룩토스, 갈락토스, 만노스, 리보스 또는 아라비노스를 포함하는 그룹으로부터 선택되는 것인 방법.
  25. 청구항 22 또는 23에 있어서, 상기 디사카리드는 말토스, 수크로스, 락토스, 트레할로스, 셀로비오스 또는 키토비오스를 포함하는 그룹으로부터 선택되는 것인 방법.
  26. 청구항 22 또는 23에 있어서, 상기 올리고사카리드는 말토트리오스, 프룩토-올리고사카리드, 갈락토-올리고사카리드, 만난 올리고사카리드, 이소말토올리고사카리드 또는 글루코올리고사카리드를 포함하는 그룹으로부터 선택되는 것인 방법.
  27. 청구항 22 또는 23에 있어서, 상기 폴리올은 글리세롤을 포함하는 그룹으로부터 선택되는 것인 방법.
  28. 청구항 22 또는 23에 있어서, 상기 복합 배지는 당밀, 옥수수 침지액, 펩톤, 트립톤 또는 효모 추출물을 포함하는 그룹으로부터 선택되는 것인 방법.
  29. 하기를 포함하는 구조체:
    (i) 청구항 1 또는 2에 정의된 바와 같은 포스파타제를 코딩하는 핵산;
    (ii) 상기 (i)의 핵산 서열의 발현을 유도할 수 있는 하나 이상의 제어 서열; 및 선택적으로
    (iii) 전사 종결 서열.
  30. 시알일화 화합물을 생산하는 방법에 있어서 청구항 29에 따른 구조체의 용도.
  31. 청구항 1 내지 28 중 어느 한 항에 기재된 방법에 따라 생산된 시알일화 화합물로서, 상기 시알일화 화합물은 원심분리 및/또는 여과, 이온-교환, 증발 또는 나노여과를 통한 농축, 결정화 또는 분무건조 또는 동결건조를 통한 제제화에 의해 정제되는 것인 시알일화 화합물.
  32. 청구항 1 내지 28 중 어느 한 항에 기재된 방법에 따라 생산된 시알일화 화합물로서, 상기 시알일화 화합물은 식품 제제, 사료 제제, 의약품 제제, 화장료 제제, 또는 농화학 제제에 첨가되는 것인 시알일화 화합물.
  33. 청구항 1 내지 18 중 어느 한 항에 따른 방법에 의해 수득가능한 미생물로서, 상기 미생물은 포스파타제, 바람직하게는 청구항 1 또는 2에서 정의된 포스파타제를 코딩하는 재조합 핵산을 포함하는 것인 미생물.
  34. 시알일화 화합물의 생산을 위한 미생물로서, 상기 미생물은 포스파타제를 코딩하는 적어도 하나의 핵산, N-아세틸만노사민 에피머라제를 코딩하는 적어도 하나의 핵산; 및 시알산 신타제를 코딩하는 적어도 하나의 핵산을 포함하고, 상기 미생물은 i) N-아세틸글루코사민-6-P를 글루코사민-6-P로 전환, ii) N-아세틸-글루코사민을 N-아세틸-글루코사민-6-P로 전환, 및 iii) N-아세틸-뉴라미네이트를 N-아세틸-만노사민으로 전환시킬 수 없고;
    상기 미생물은 상기 포스파타제를 코딩하는 핵산의 증가된 발현을 포함하고, 바람직하게는 상기 포스파타제는:
    - 서열번호: 46, 52, 69, 70, 57, 42, 47, 43, 50, 59, 65, 54, 58, 60, 45, 67, 44, 48, 51 또는 55 중 어느 하나;
    - 또는 상기 포스파타제에 대해 적어도 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 또는 99 %의 전체 서열 동일성 및 포스파타제 활성을 갖는 서열번호: 46, 52, 69, 70, 57, 42, 47, 43, 50, 59, 65, 54, 58, 60, 45, 67, 44, 48, 51 또는 55 중 어느 하나의 상동체 또는 유도체로서, 바람직하게는 상기 상동체 또는 유도체는 시알산 및/또는 바이오매스 생산을 참조 균주에 비해 증가시키는 것인 상동체 또는 유도체를 포함하는 것인 미생물.
  35. 시알일화 화합물의 생산을 위한 미생물로서, 상기 미생물은
    - N-아세틸글루코사민-6-포스페이트를 N-아세틸글루코사민으로, 상기 N-아세틸글루코사민을 N-아세틸만노사민으로 및 상기 N-아세틸만노사민을 N-아세틸-뉴라미네이트로 세포내에서 전환시키고;
    - i) N-아세틸글루코사민-6-P를 글루코사민-6-P로 전환, ii) N-아세틸-글루코사민을 N-아세틸-글루코사민-6-P로 전환, 및 iii) N-아세틸-뉴라미네이트를 N-아세틸-만노사민으로 전환시킬 수 없는 것인 미생물.
  36. 청구항 35에 있어서, N-아세틸-뉴라미네이트(시알산)의 생산을 위한 미생물로서, 상기 미생물은 시알산을 생합성 경로를 포함하고, 상기 미생물에서 자연 발생 시알산 이화 경로가 비활성화 되고, 여기서 시알산의 발효 생산 동안 탄소원으로서 사용되지 않는 당류의 유입을 위한 적어도 하나의 포스포에놀피루베이트:당 포스포트랜스퍼라제 시스템이 비활성화되었고; 바람직하게는 상기 적어도 하나의 포스포에놀피루베이트:당 포스포트랜스퍼라제 시스템은 manX, manY, manZ, nagE를 코딩하는 유전자 목록에서 선택된 적어도 하나의 유전자에 의해 코딩되는 것인, 미생물.
  37. N-아세틸뉴라미네이트(시알산) 생산을 위한 미생물로서, 상기 미생물이 시알산 생합성 경로를 포함하고, 상기 미생물에서 자연 발생 시알산 이화 경로가 비활성화 되고, 여기서 시알산의 발효 생산 동안 탄소원으로서 사용되지 않는 당류의 유입을 위한 적어도 하나의 포스포에놀피루베이트:당 포스포트랜스퍼라제 시스템이 비활성화되고, 바람직하게는 상기 적어도 하나의 포스포에놀피루베이트:당 포스포트랜스퍼라제 시스템은 manX, manY, manZ, nagE를 코딩하는 유전자 목록에서 선택된 적어도 하나의 유전자에 의해 코딩되고; 및/또는 바람직하게는 상기 비활성화된 시알산 생합성 경로는, 상기 미생물이 i) N-아세틸글루코사민-6-P를 글루코사민-6-P로 전환, ii) N-아세틸-글루코사민을 N-아세틸-글루코사민-6-P로 전환, 및 iii) N-아세틸-뉴라미네이트를 N-아세틸-만노사민으로 전환시킬 수 없는 상태로 제공되는 것인 미생물.
  38. 청구항 36 또는 37에 있어서, 상기 미생물은 상기 외인성 탄소원의 획득을 위해 포스포에놀피루베이트:당 포스포트랜퍼라제 시스템을 사용하지 않고 유일한 탄소원으로서 발효 브로쓰에 존재하는 외인성 탄소원을 이용할 수 있고, 바람직하게는 상기 탄소원은 수크로스, 글루코스, 말토스, 글리세롤인 것인 미생물.
  39. 청구항 35에 있어서, 시알일화 올리고사카리드의 생산을 위한 미생물로서, 상기 미생물은 포스파타제를 코딩하는 적어도 하나의 핵산, N-아세틸만노사민 에피머라제를 코딩하는 적어도 하나의 핵산, 시알릴트랜스퍼라제를 코딩하는 적어도 하나의 핵산; 및 시알산 신타제를 코딩하는 적어도 하나의 핵산을 포함하며, 상기 미생물은 캄필로박터 제주니 또는 네이세리아 메닌기티스 에서 유래하는 시알산 신타제 폴리펩티드를 코딩하는 핵산, 바람직하게는 각각 CjNeuB 또는 NmNeuB을 포함하는 것인 미생물.
  40. 청구항 39에 있어서, 상기 미생물은 포스파타제를 코딩하는 핵산의 증가된 발현을 포함하고, 바람직하게는 상기 포스파타제는:
    - 서열번호: 46, 52, 69, 70, 57, 42, 47, 43, 50, 59, 65, 54, 58, 60, 45, 67, 44, 48, 51 또는 55 중 어느 하나;
    - 또는 상기 포스파타제에 대해 적어도 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 또는 99 %의 전체 서열 동일성 및 포스파타제 활성을 갖는 서열번호: 46, 52, 69, 70, 57, 42, 47, 43, 50, 59, 65, 54, 58, 60, 45, 67, 44, 48, 51 또는 55 중 어느 하나의 상동체 또는 유도체로서, 바람직하게는 상기 상동체 또는 유도체는 시알산 및/또는 바이오매스 생산을 참조 균주에 비해 증가시키는 상동체 또는 유도체를 포함하는 것인 미생물.
  41. 청구항 35, 39, 또는 40 중 어느 한 항에 있어서, 상기 시알일화 화합물은 시알일락토스, 디시알일 락토-N-테트라오스, 시알릴화 락토-N-트리오스, 시알릴화 락토-N-테트라오스 및 시알릴화 락토-N-네오테트라오스를 포함하는 목록에서 선택된 시알일화 올리고사카리드인 것인 미생물.
  42. 청구항 41에 있어서, 상기 시알일화 화합물은 시알릴화 락토-N-트리오스, 시알릴화 락토-N-테트라오스, 또는 시알릴화 락토-N-네오테트라오스이고, 상기 미생물은 갈락토실트란스퍼라제 (EC 2.4.1.38) 활성을 더욱 포함하고, 바람직하게는 상기 갈락토실트란스퍼라제는 호모 사피엔스, 보스 타우루스, 무스 물라타 (Mus mulatta), 갈루스 갈루스 (Gallus gallus), 다니오 레리오 (Danio rerio), 헬리코박터 필로리 (Helicobacter pylori) 및 헤모필루스 듀크레이 (Haemophilus ducrey)를 포함하는 그룹으로부터 기원하고; 및/또는 상기 미생물은 N-아세틸글루코사미닐트란스퍼라제 (EC 2.4.1.90)의 활성을 포함하고, 바람직하게는 상기 N-아세틸글루코사미닐트란스퍼라제는 보스 타우루스, 호모 사피엔스무스 무스쿨루스를 포함하는 그룹으로부터 기원하는 것인 미생물.
  43. 청구항 42에 있어서, 상기 미생물은 UDP 당 히드롤라제 및 갈락토스-1-포스페이트 우리딜일트란스퍼라제를 코딩하는 유전자를 발현할 수 없는 미생물.
  44. 청구항 35 내지 43 중 어느 한 항에 있어서, 상기 N-아세틸만노사민 에피머라제 및 시알산 신타제 중 어느 하나 이상이 미생물에서 과발현되는 미생물.
  45. 청구항 35 내지 43 중 어느 한 항에 있어서, 상기 N-아세틸만노사민 에피머라제 및 시알산 신타제 중 어느 하나 이상이 미생물에 도입되어 발현되는 미생물.
  46. 청구항 35 내지 45 중 어느 한 항에 있어서, 상기 미생물은 i) N-아세틸글리코사민-6-포스페이트 데아세틸라제, ii) N-아세틸글루코사민 키나제, 및 iii) N-아세틸뉴라미네이트 알돌라제 효소를 코딩하는 유전자가 결여되어 있는 미생물.
  47. 청구항 35 내지 46 중 어느 한 항에 있어서, 상기 미생물에서 i) N-아세틸글리코사민-6-포스페이트 데아세틸라제, ii) N-아세틸글루코사민 키나제, 및 iii) N-아세틸뉴라미네이트 알돌라제 효소를 코딩하는 유전자가 활성 감소, 바람직하게는 상기 유전자가 결실되거나 녹아웃된 것인 미생물.
  48. 청구항 35 내지 47 중 어느 한 항에 있어서, 상기 미생물이 락토오스의 흡수를 촉진하는 단백질을 추가로 암호화하고, 락토오스를 대사하는 효소가 결여된 것인 미생물.
  49. 청구항 35 내지 48 중 어느 한 항에 있어서, 상기 미생물이 박테리아, 바람직하게는 에스케리치아 콜리 균주, 보다 바람직하게는 K12 균주인 에스케리치아 콜리 균주, 더욱 더 바람직하게는 에스케리치아 콜리 K12 균주는 에스케리치아 콜리 MG1655인 미생물, 또는 상기 미생물은 효모인 미생물.
  50. 전구체로서 락토스 및 청구항 35 내지 49 중 어느 한 항의 미생물을 포함하는 세포 배양 배지.
KR1020237021715A 2016-12-27 2017-12-26 시알일화 화합물의 인 비보 합성 KR20230104755A (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
EP16206916 2016-12-27
EP16206916.5 2016-12-27
KR1020197022137A KR20190098246A (ko) 2016-12-27 2017-12-26 시알일화 화합물의 인 비보 합성
PCT/EP2017/084593 WO2018122225A1 (en) 2016-12-27 2017-12-26 In vivo synthesis of sialylated compounds

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020197022137A Division KR20190098246A (ko) 2016-12-27 2017-12-26 시알일화 화합물의 인 비보 합성

Publications (1)

Publication Number Publication Date
KR20230104755A true KR20230104755A (ko) 2023-07-10

Family

ID=57749740

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020237021715A KR20230104755A (ko) 2016-12-27 2017-12-26 시알일화 화합물의 인 비보 합성
KR1020197022137A KR20190098246A (ko) 2016-12-27 2017-12-26 시알일화 화합물의 인 비보 합성

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020197022137A KR20190098246A (ko) 2016-12-27 2017-12-26 시알일화 화합물의 인 비보 합성

Country Status (10)

Country Link
US (2) US11535878B2 (ko)
EP (1) EP3562951A1 (ko)
JP (1) JP2020503066A (ko)
KR (2) KR20230104755A (ko)
CN (1) CN110114469A (ko)
AU (2) AU2017385601B2 (ko)
BR (1) BR112019013211A2 (ko)
CA (1) CA3048521A1 (ko)
RU (1) RU2019117393A (ko)
WO (1) WO2018122225A1 (ko)

Families Citing this family (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3473644A1 (en) 2017-10-17 2019-04-24 Jennewein Biotechnologie GmbH Fermentative production of n-acetylneuraminic acid
FI3575404T3 (fi) * 2018-05-28 2023-01-13 Sialyloitujen sakkaridejen fermentatiivinen tuotanto
CN109182201B (zh) * 2018-09-30 2020-06-23 浙江工业大学 河生肠杆菌生物ⅰ型zjb-17002及其应用
CN110396532A (zh) * 2019-08-23 2019-11-01 中国科学院合肥物质科学研究院 一种制备唾液酸乳糖的方法
EP3789495A1 (en) * 2019-09-03 2021-03-10 Jennewein Biotechnologie GmbH Production of sialylated oligosaccharides in bacillus cells
US20220049280A1 (en) * 2019-11-26 2022-02-17 Jiangnan University Method for promoting n-acetylglucosamine synthesis by using glcn6p responsive element
WO2021123113A1 (en) 2019-12-18 2021-06-24 Inbiose N.V. Production of sialylated oligosaccharide in host cells
EP3848471A1 (en) * 2020-01-10 2021-07-14 Chr. Hansen HMO GmbH Sequential fermentative production of oligosaccharides
WO2021160830A1 (en) 2020-02-14 2021-08-19 Inbiose N.V. Glycominimized bacterial host cells
US20220396817A1 (en) 2020-02-14 2022-12-15 Inbiose N.V. Production of glycosylated product in host cells
CN111394292B (zh) * 2020-03-30 2022-08-09 江南大学 一种多途径复合产神经氨酸枯草芽孢杆菌及其应用
EP3954769A1 (en) 2020-08-10 2022-02-16 Inbiose N.V. Production of oligosaccharide mixtures by a cell
CN111621437B (zh) * 2020-06-04 2022-01-04 江西禾一生物科技有限公司 分离自猪场氧化塘的旱獭埃希氏菌lm-dk及其应用
WO2022034077A1 (en) 2020-08-10 2022-02-17 Inbiose N.V. Production of alpha-1,3 glycosylated form of fuc-a1,2-gal-r
CN116323930A (zh) 2020-08-10 2023-06-23 因比奥斯公司 唾液酸化双糖及/或寡糖的细胞生产
TW202221129A (zh) 2020-08-10 2022-06-01 比利時商因比奧斯公司 雙醣及/或寡醣的細胞生產
CN116171329A (zh) 2020-08-10 2023-05-26 因比奥斯公司 通过细胞培养或微生物发酵产生的寡糖溶液的纯化方法
CN116171328A (zh) 2020-08-10 2023-05-26 因比奥斯公司 藉由细胞培养或微生物发酵产生的不同寡糖的纯化混合物的制造方法
WO2022089707A1 (en) 2020-10-30 2022-05-05 Mille International Aps A method of producing a human milk oligosaccharide (hmo)
WO2022129470A1 (en) 2020-12-18 2022-06-23 Inbiose N.V. Variant sucrose permease polypeptides
CN116783291A (zh) 2021-01-18 2023-09-19 因比奥斯公司 糖基化产物的细胞生产
TW202246496A (zh) 2021-01-20 2022-12-01 比利時商因比奥斯公司 在宿主細胞中產生包含ln3作為核心結構的寡醣
WO2022219187A1 (en) 2021-04-16 2022-10-20 Inbiose N.V. Cellular production of bioproducts
US20240200021A1 (en) 2021-04-16 2024-06-20 Inbiose N.V. Cellular production of sialylated di- and/or oligosaccharides
AU2022258873A1 (en) 2021-04-16 2023-11-30 Inbiose N.V. Fermentative production
WO2022242860A1 (en) 2021-05-20 2022-11-24 Chr. Hansen A/S Sequential fermentative production of oligosaccharides
WO2023285650A1 (en) 2021-07-16 2023-01-19 Inbiose N.V. Lacto-n-biose converting fucosyltransferases
CN114196693B (zh) * 2021-10-25 2023-11-24 福州一诺维生物科技有限公司 一种n-乙酰神经氨酸的制备方法
WO2023110995A1 (en) 2021-12-14 2023-06-22 Inbiose N.V. Production of alpha-1,3-fucosylated compounds
WO2023110994A1 (en) 2021-12-14 2023-06-22 Inbiose N.V. Production of alpha-1,4-fucosylated compounds
WO2023111140A1 (en) 2021-12-15 2023-06-22 Inbiose N.V. Novel drying method for oligosaccharides
WO2023111141A1 (en) 2021-12-15 2023-06-22 Inbiose N.V. Sialyltransferases for the production of sialylated oligosaccharides
WO2023175079A1 (en) 2022-03-16 2023-09-21 Inbiose N.V. Sialyltransferases for the production of sialylated oligosaccharides
WO2023187109A1 (en) 2022-04-01 2023-10-05 Inbiose N.V. Sialyltransferases for the production of sialylated oligosaccharides
WO2024017987A1 (en) 2022-07-20 2024-01-25 Inbiose N.V. Production of oligosaccharides in host cells
WO2024047096A1 (en) 2022-08-30 2024-03-07 Inbiose N.V. Process for purification of an oligosaccharide
WO2024052406A1 (en) 2022-09-06 2024-03-14 Inbiose N.V. Baked nutritional compositions comprising human milk oligosaccharides
WO2024052405A1 (en) 2022-09-06 2024-03-14 Inbiose N.V. Encapsulated milk saccharides
WO2024089131A1 (en) 2022-10-25 2024-05-02 Inbiose N.V. Saccharide importers for lacto-n-triose
WO2024121153A1 (en) 2022-12-05 2024-06-13 Inbiose N.V. Use of a sialylated saccharide for maintaining or improving mobility in a healthy subject
WO2024121171A1 (en) 2022-12-05 2024-06-13 Inbiose N.V. Sialylated saccharide for use in the prevention or treatment of an inflammatory disease and/or autoimmune disease
CN116731934B (zh) * 2023-08-08 2023-10-13 欧铭庄生物科技(天津)有限公司滨海新区分公司 一株大肠埃希氏菌及其在生产氨基葡萄糖中的应用

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2118513A1 (en) 1992-04-24 1993-11-11 David A. Zarling In vivo homologous sequence targeting in eukaryotic cells
CN1048254C (zh) 1993-12-09 2000-01-12 托马斯杰弗逊大学 用于将预定的改变引入靶基因中的化合物
US6555732B1 (en) 1998-09-14 2003-04-29 Pioneer Hi-Bred International, Inc. Rac-like genes and methods of use
AU2003220850A1 (en) 2002-02-28 2003-09-09 Kyowa Hakko Kogyo Co., Ltd. Process for producing n-acetylneuraminic acid
CN101273139A (zh) * 2005-09-27 2008-09-24 味之素株式会社 产生l-氨基酸的细菌和用于产生l-氨基酸的方法
US8507227B2 (en) * 2006-03-09 2013-08-13 Centre National De La Recherche Scientifique (Cnrs) Method of producing sialylated oligosaccharides
WO2008097366A2 (en) * 2006-09-26 2008-08-14 Syracuse University Metabolically engineered escherichia coli for enchanced production of sialic acid
EP3235907B1 (en) 2010-07-12 2023-06-21 Inbiose N.V. Metabolically engineered organisms for the production of added value bio-products
AT510299B1 (de) 2010-12-22 2012-03-15 Univ Wien Tech Verfahren und mittel zur herstellung von n-acetylneuraminsäure (neunac)
CN103602627B (zh) * 2013-11-25 2015-03-18 武汉中科光谷绿色生物技术有限公司 一种产n-乙酰神经氨酸大肠杆菌工程菌及其构建方法和应用
EP2927316B1 (en) 2014-03-31 2018-11-07 Jennewein Biotechnologie GmbH Total fermentation of oligosaccharides
KR101683773B1 (ko) * 2014-06-30 2016-12-08 고려대학교 산학협력단 인공 자살 유전자 회로를 이용한 목적 대사산물을 과생산하는 변이균주의 스크리닝 방법
CN107075506B (zh) 2014-11-14 2022-06-03 因比奥斯公司 抵抗乳糖杀伤的突变体微生物
CN106190938B (zh) * 2016-07-18 2019-05-14 南开大学 一种构建的重组大肠杆菌及生物合成3’-唾液乳糖的方法

Also Published As

Publication number Publication date
US11535878B2 (en) 2022-12-27
AU2017385601A1 (en) 2019-08-08
AU2022275482A1 (en) 2023-01-19
AU2017385601B2 (en) 2022-08-25
US20190338328A1 (en) 2019-11-07
BR112019013211A2 (pt) 2019-12-10
WO2018122225A1 (en) 2018-07-05
CA3048521A1 (en) 2018-07-05
JP2020503066A (ja) 2020-01-30
US20230399670A1 (en) 2023-12-14
RU2019117393A3 (ko) 2021-05-20
EP3562951A1 (en) 2019-11-06
KR20190098246A (ko) 2019-08-21
RU2019117393A (ru) 2020-12-07
CN110114469A (zh) 2019-08-09

Similar Documents

Publication Publication Date Title
US20230399670A1 (en) In vivo synthesis of sialylated compounds
AU2018296557B2 (en) Fucosyltransferases and their use in producing fucosylated oligosaccharides
JP7069007B2 (ja) 取り込み/排出を改変した微生物宿主におけるヒトミルクオリゴ糖の生産
US20210087599A1 (en) Sialyltransferases and their use in producing sialylated oligosaccharides
AU2019278599B2 (en) Fermentative production of sialylated saccharides
US20220002773A1 (en) Production of 3-fucosyllactose and lactose converting alpha-1,3-fucosyltransferase enzymes
US20230416796A1 (en) Production of galactosylated di- and oligosaccharides
US20230212628A1 (en) Production of Sialylated Oligosaccharide in Host Cells
US20230348944A1 (en) Lactose converting alpha-1,2-fucosyltransferase enzymes
KR101123062B1 (ko) 우리딘 5&#39;-디인산-n-아세틸갈락토사민의 제조법
JP2022546825A (ja) バチルス属細胞におけるシアリル化オリゴ糖の生産
KR20230170961A (ko) 시알릴화 이당 및/또는 올리고당의 세포 생산
KR20240008322A (ko) 발효 생산
KR20230124995A (ko) 6&#39;-시알릴락토스의 생산을 위한 시알릴트랜스퍼라제
NZ796027A (en) In vivo synthesis of sialylated compounds
NZ755558A (en) In vivo synthesis of sialylated compounds
RU2818835C2 (ru) Фукозилтрансферазы и их применение для получения фукозилированных олигосахаридов

Legal Events

Date Code Title Description
A107 Divisional application of patent
E902 Notification of reason for refusal