KR20200040247A - 시알릴트랜스퍼라제 및 시알릴화 올리고당류 생산에서의 그의 용도 - Google Patents

시알릴트랜스퍼라제 및 시알릴화 올리고당류 생산에서의 그의 용도 Download PDF

Info

Publication number
KR20200040247A
KR20200040247A KR1020207005518A KR20207005518A KR20200040247A KR 20200040247 A KR20200040247 A KR 20200040247A KR 1020207005518 A KR1020207005518 A KR 1020207005518A KR 20207005518 A KR20207005518 A KR 20207005518A KR 20200040247 A KR20200040247 A KR 20200040247A
Authority
KR
South Korea
Prior art keywords
leu
ile
lys
glu
phe
Prior art date
Application number
KR1020207005518A
Other languages
English (en)
Inventor
스테판 제네바인
더크 바르텐베르그
Original Assignee
젠와인 바이오테크놀로지 게엠바하
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 젠와인 바이오테크놀로지 게엠바하 filed Critical 젠와인 바이오테크놀로지 게엠바하
Publication of KR20200040247A publication Critical patent/KR20200040247A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/18Preparation of compounds containing saccharide radicals produced by the action of a glycosyl transferase, e.g. alpha-, beta- or gamma-cyclodextrins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23LFOODS, FOODSTUFFS, OR NON-ALCOHOLIC BEVERAGES, NOT COVERED BY SUBCLASSES A21D OR A23B-A23J; THEIR PREPARATION OR TREATMENT, e.g. COOKING, MODIFICATION OF NUTRITIVE QUALITIES, PHYSICAL TREATMENT; PRESERVATION OF FOODS OR FOODSTUFFS, IN GENERAL
    • A23L33/00Modifying nutritive qualities of foods; Dietetic products; Preparation or treatment thereof
    • A23L33/10Modifying nutritive qualities of foods; Dietetic products; Preparation or treatment thereof using additives
    • A23L33/125Modifying nutritive qualities of foods; Dietetic products; Preparation or treatment thereof using additives containing carbohydrate syrups; containing sugars; containing sugar alcohols; containing starch hydrolysates
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23LFOODS, FOODSTUFFS, OR NON-ALCOHOLIC BEVERAGES, NOT COVERED BY SUBCLASSES A21D OR A23B-A23J; THEIR PREPARATION OR TREATMENT, e.g. COOKING, MODIFICATION OF NUTRITIVE QUALITIES, PHYSICAL TREATMENT; PRESERVATION OF FOODS OR FOODSTUFFS, IN GENERAL
    • A23L33/00Modifying nutritive qualities of foods; Dietetic products; Preparation or treatment thereof
    • A23L33/40Complete food formulations for specific consumer groups or specific purposes, e.g. infant formula
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1085Transferases (2.) transferring alkyl or aryl groups other than methyl groups (2.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/99Glycosyltransferases (2.4) transferring other glycosyl groups (2.4.99)
    • C12Y204/99001Beta-galactoside alpha-2,6-sialyltransferase (2.4.99.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/99Glycosyltransferases (2.4) transferring other glycosyl groups (2.4.99)
    • C12Y204/99004Beta-galactoside alpha-2,3-sialyltransferase (2.4.99.4)
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23VINDEXING SCHEME RELATING TO FOODS, FOODSTUFFS OR NON-ALCOHOLIC BEVERAGES AND LACTIC OR PROPIONIC ACID BACTERIA USED IN FOODSTUFFS OR FOOD PREPARATION
    • A23V2002/00Food compositions, function of food ingredients or processes for food or foodstuffs

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biomedical Technology (AREA)
  • Mycology (AREA)
  • Nutrition Science (AREA)
  • Food Science & Technology (AREA)
  • Polymers & Plastics (AREA)
  • Pediatric Medicine (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Coloring Foods And Improving Nutritive Qualities (AREA)

Abstract

시알릴화 올리고당류를 생산하기 위한 방법, 유전자 조작된 세포, 시알릴트랜스퍼라제 및 상기 시알릴트랜스퍼라제를 코딩하는 핵산 분자뿐만 아니라 영양 조성물을 제공하기 위한 상기 시알릴화 올리고당류의 용도가 개시되어 있다.

Description

시알릴트랜스퍼라제 및 시알릴화 올리고당류 생산에서의 그의 용도
본 발명은 시알릴트랜스퍼라제, 시알릴화 올리고당류(sialylated oligosaccharide) 생산에서의 그의 용도, 및 영양 제제(nutritional formulation) 제공에서의 상기 시알릴화 올리고당류의 용도에 관한 것이다.
지금까지 150종 초과의 구조적으로 구별되는 모유 올리고당류(human milk oligosaccharide) (HMO)가 동정되었다. 비록 HMO가 단지 소량의 총 모유 영양소를 나타내긴 하지만, 모유 영양아의 발달에 대한 그의 매우 유익한 효과는 지난 수십년에 걸쳐 분명해졌다.
모유 중 총 HMO 함량의 최대 20%가 산성이다. 따라서, 이들 HMO 분자는 적어도 하나의 시알산 모이어티를 보유한다. 모유에 함유된 시알산의 단지 3%가 유리 형태로 이용 가능하지만, 23% 및 74%는 각각 (당-)단백질 및 올리고당류에 결합되어 있다. 시알산 패밀리의 가장 흔한 구성원은 N-아세틸뉴라민산 (Neu5Ac)이다. 올리고당류계(oligomeric saccharide)의 일부로서, N-아세틸뉴라민산은 종종 상 기당류의 생물학적 활성의 이유가 된다.
시알릴화 HMO (SHMO)는 병원체뿐만 아니라 장에 대한 내성을 뒷받침하는 것으로 관찰되었다. 흥미롭게도, 최근 연구는 괴사성 장염에 대한 장쇄화(long-chained) SHMO의 보호 효과를 추가로 입증하였으며, 이는 조산아에서 가장 흔하고 치명적인 질환 중 하나이다. 게다가, SHMO는 영아의 두뇌 발달 및 그의 인지 능력을 뒷받침하는 것으로 여겨진다.
비록 상이한 공여체 사이의 HMO 프로파일에서의 광범위한 변화가 산성 올리고당류의 절대 정량화를 방해하여, 특별히 시알릴락토-N-테트라오스의 구조 이성질체에 영향을 미치긴 하지만, 가장 풍부한 산성 HMO는 3'-시알릴락토스 (3'-SL), 6'-시알릴락토스 (6'-SL), 시알릴락토-N-테트라오스 a (LST-a), 시알릴락토-N-테트라오스 b (LST-b), 시알릴락토-N-테트라오스 c (LST-c) 및 디시알릴락토-N-테트라오스 (DSLNT)이다.
시알릴화 HMO의 구조적 복잡성 (도 1)과 관련하여, 그의 화학적 또는 (화학-)효소적 합성은 도전적이고 광범위한 어려움, 예를 들어 입체화학의 제어, 특정 연결의 형성, 공급원료의 이용 가능성과 연관된다. 최종적으로, 이러한 합성 공정의 어셈블리가 일부 SHMO에 대해 성공적이었음에도 불구하고, 그의 소중함 및 만족스럽지 않은 수율은 상업적 목적으로 시알릴화 HMO의 비용-효율적 생산을 제한한다.
일반적으로 말하면, HMO를 생산하는 미생물의 대사 공학은 산업 규모로 HMO를 생산하는 가장 유망한 접근법을 나타내며, 이미 2'-푸코실락토스, 3-푸코실락토스 및 3'-시알릴락토스를 위해 개발되었다.
그럼에도 불구하고, HMO의 생산을 위한 공학적 생합성 경로는, 특별히 이종 발현 시스템(heterologous expression system) 예컨대 재조합 박테리아 세포내에서, 원하는 HMO, 예를 들어 푸코실-, 갈락토실-, N-아세틸-글루코사미닐- 또는 시알릴트랜스퍼라제의 생합성에 관여하는 글리코실트랜스퍼라제의 활성 및 특이성에 의해 종종 제한된다.
불행하게도, 인간 시알릴트랜스퍼라제를 코딩하는 유전자는 원핵 미생물에서 거의 발현되지 않는다. 따라서, 이들 유전자 및 효소는 시알릴화 HMO를 생산하기 위해 유전자 조작된 박테리아 균주 예컨대 에쉐리키아 콜라이(Escherichia coli)를 사용하는 생명공학 공정에서는 적용할 수 없다.
박테리아 종, 예를 들어 나이세리아(Neisseria), 캄필로박터(Campylobacter), 파스퇴렐라(Pasteurella), 헬리코박터(Helicobacter) 및 포토박테리움(Photobacterium)으로부터, 뿐만 아니라 포유동물 및 바이러스로부터의 몇몇 시알릴트랜스퍼라제 (SiaT)가 지금까지 동정되고 특성화되었다. 시알릴트랜스퍼라제는 단백질 서열 유사성을 기준으로 하여, 6종의 글리코실트랜스퍼라제 (GT) 패밀리로 일반적으로 분류되었다. 거기에서, 모든 진핵 및 바이러스 시알릴트랜스퍼라제는 GT 패밀리 29로 그룹화되며, 한편 박테리아 SiaT는 군 GT4, GT38, GT42, GT52 또는 GT80으로 구성된다. 게다가, 시알릴트랜스퍼라제 및 폴리시알릴트랜스퍼라제는 그들이 형성하는 연결로 인해, 예를 들어 α-2,3-, α-2,6- 및 α-2,8-시알릴트랜스퍼라제로 구별될 수 있다. 모든 이들 시알릴트랜스퍼라제는 시알사 잔기를 시티딘 5'-모노포스페이트 시알산 (예를 들어 CMP-Neu5Ac)으로부터 여러 가지의 수용체 분자, 통상 갈락토스- (Gal), N-아세틸갈락토사민- (GalNAc) 또는 N-아세틸글루코사민 (GlcNAc) 모이어티 또는 또 다른 시알산 (Sia) 모이어티로 전달한다.
몇몇 박테리아 시알릴트랜스퍼라제는 과거에 잘 특성화되었으며 이미 3'-SL 또는 6'-SL의 생산에 적합한 것으로 입증되어 있다. 시알릴화 오당류 또는 육당류 예컨대 LST-a, LST-b 또는 DSLNT의 합성을 가능하게 하는 시알릴트랜스퍼라제에 대한 어떠한 지식도 거의 달성할 수 없었을 것이므로, 이들 SHMO 중 어느 하나에 대한 생산 공정의 확립을 제한한다. 결과적으로, 이들 원하는 올리고당류의 매우 순수한 양의 이용 불가능성은 그의 건강에 유익한 특성의 광범위한 과학적 평가를 방해한다.
따라서, 하나 이상의 SHMO, 특별히 1 또는 2개의 시알산 잔기를 보유하는 사당류, 오당류 및 육당류를 다량 및 고순도로 생산하기 위한 비용-효율적 방법이 필요하다.
상기 목적은, 특히, 신규한 시알릴트랜스퍼라제의 동정 및 특성화 및 전체 세포 발효 또는 생체촉매반응에 의한 시알릴화 모유 올리고당류의 생산에서 그의 사용에 의해 해결된다.
제1 측면에 따르면, 시알릴화 올리고당류를 생산하는 방법으로서, 여기서 유전자 조작된 세포가 상기 시알릴화 올리고당류를 생산하기 위해 사용되는 것인, 시알릴화 올리고당류를 생산하는 방법이 제공된다. 상기 유전자 조작된 세포는 시알산 잔기를 공여체 기질로부터 수용체 분자로 전달할 수 있는 적어도 하나의 이종 시알릴트랜스퍼라제를 포함하고, 여기서 상기 수용체 분자가 락토스, LNT-II 및 모유 올리고당류로 이루어진 군으로부터 선택된다.
제2 측면에 따르면, 시알릴화 올리고당류를 생산하는 방법에서 사용하기 위한 유전자 조작된 세포로서, 여기서 상기 유전자 조작된 세포가 시알산 잔기를 공여체 기질로부터 수용체 분자로 전달할 수 있는 이종 시알릴트랜스퍼라제를 발현하도록 유전자 조작되었으며, 여기서 상기 수용체 분자가 락토스, LNT-II 및 모유 올리고당류로 이루어진 군으로부터 선택된 것인, 시알릴화 올리고당류를 생산하는 방법에서 사용하기 위한 유전자 조작된 세포가 제공된다.
제3 측면에 따르면, 세포에서 전파될 때 이종 시알릴트랜스퍼라제를 발현하기 위한 재조합 핵산 분자로서, 여기서 상기 시알릴트랜스퍼라제가 시알산 잔기를 공여체 기질로부터 수용체 분자로 전달할 수 있고, 여기서 상기 수용체 분자가 락토스, LNT-II 및 모유 올리고당류로 이루어진 군으로부터 선택된 것인, 세포에서 전파될 때 이종 시알릴트랜스퍼라제를 발현하기 위한 재조합 핵산 분자가 제공된다.
제4 측면에 따르면, 시알산 잔기를 공여체 기질로부터 수용체 분자로 전달할 수 있는 시알릴트랜스퍼라제로서, 여기서 상기 수용체 분자가 락토스, LNT-II 및 모유 올리고당류로 이루어진 군으로부터 선택된 것인, 시알산 잔기를 공여체 기질로부터 수용체 분자로 전달할 수 있는 시알릴트랜스퍼라제가 제공된다.
제5 측면에 따르면, 시알릴화 올리고당류를 생산하기 위한, 시알산 잔기를 공여체 기질로부터 수용체 분자로 전달할 수 있는 시알릴트랜스퍼라제의 용도로서, 여기서 상기 수용체 분자가 락토스, LNT-II 및 모유 올리고당류로 이루어진 군으로부터 선택된 것인, 상기 용도가 제공된다.
제6 측면에 따르면, 시험관내 생체촉매반응에 의해 시알릴화 올리고당류를 생산하는 방법으로서, 여기서 시알릴트랜스퍼라제가 사용되며, 상기 시알릴트랜스퍼라제는 시알산 잔기를 상기 공여체 기질로부터 수용체 분자로 전달할 수 있으며, 여기서 상기 수용체 분자가 락토스, LNT-II 및 모유 올리고당류로 이루어진 군으로부터 선택된 것인, 시험관내 생체촉매반응에 의해 시알릴화 올리고당류를 생산하는 방법이 제공된다.
제7 측면에 따르면, 제1 측면에 따른 방법 또는 제6 측면에 따른 방법에 의해 생산된 시알릴화 올리고당류가 제공된다.
제8 측면에 따르면, 영양 조성물을 제조하기 위한 제7 측면에 따른 시알릴화 올리고당류의 용도가 제공된다.
제9 측면에 따르면, 제7 측면에 따른 적어도 하나의 시알릴화 올리고당류를 함유하는 영양 조성물이 제공된다.
제10 측면에 따르면, 적어도 하나의 시알릴화 모유 올리고당류를 함유하는 영아용 조제식이 제공된다.
도 1은 모유에서 가장 풍부한 산성 올리고당류의 화학 구조를 도시한다: 3'-SL (A), 6'-SL (B), LST-a (C), LST-b (D), LST-c (E), 및 DSLNT (F).
도 2는 시알릴트랜스퍼라제 유전자를 과발현하는 플라스미드 pDEST14 및 pET11a의 지도를 나타낸다.
도 3은 박층 크로마토그래피에 의한 siaT9- 또는 siaT19-과발현 이. 콜라이(E. coli) BL21(DE3) #2130 세포의 세포내 분획의 분리가 도시된다는 점에서 적합한 시알릴트랜스퍼라제의 과발현으로 인한 시알릴락토-N-테트라오스-a 및 시알릴락토-N-테트라오스-b의 생체내 생산 (화살표로 표시)을 나타낸다.
시알릴화 HMO의 제조 공정에서 사용하기에 적합한 시알릴트랜스퍼라제를 동정하려는 시도에서, 핵산 데이터베이스 및 단백질 데이터베이스가 검색되었다. 100개의 추정 시알릴트랜스퍼라제가 공지된 글리코실트랜스퍼라제와 서열 유사성에 의해 동정되었다. 상기 추정 시알릴트랜스퍼라제는 시알릴트랜스퍼라제 활성에 대해 평가되었다.
제1 측면에 따르면, 시알릴화 올리고당류를 생산하는 방법으로서,
a) 이종 시알릴트랜스퍼라제를 포함하는 적어도 하나의 유전자 조작된 세포를 제공하는 단계로서, 상기 이종 시알릴트랜스퍼라제가 시알산 잔기를 공여체 기질로서 CMP-활성화된 형태로부터, 락토스, LNT-II 및 모유 올리고당류로 이루어진 군으로부터 선택된 수용체 분자로 전달하기 위한 α-2,3-시알릴트랜스퍼라제 활성 및/또는 α-2,6-시알릴트랜스퍼라제 활성을 보유할 수 있는 것인 단계;
b) 발효액 중에서 및 상기 시알릴화 올리고당류의 생산에 허용되는 조건 하에 상기 적어도 하나의 유전자 조작된 세포를 배양하는 단계; 및
c) 상기 시알릴화 올리고당류를 회수하는 단계
를 포함하는, 시알릴화 올리고당류를 생산하는 방법이 제공된다.
상기 방법은 시알릴화 올리고당류를 생산하는 방법이다.
본원에 사용된 바와 같은 용어 "올리고당류"는 단당류 잔기의 중합체를 지칭하며, 여기서 상기 중합체는 적어도 3개의 단당류 잔기, 그러나 10개 이하의 단당류 잔기, 바람직하게는 7개 이하의 단당류 잔기를 포함한다. 올리고당류는 단당류의 선형 쇄이거나 분지형이다. 게다가, 올리고당류의 단당류 잔기는 다수의 화학적 변형을 특징으로 할 수 있다. 따라서, 올리고당류는 하나 이상의 비-당류 모이어티를 포함할 수 있다.
본원에 사용된 바와 같은 용어 "시알릴화 올리고당류"는 하나 이상의 시알산 잔기를 포함하는 올리고당류를 지칭한다. 바람직한 실시양태에서, 시알산 잔기는 N-아세틸뉴라민산 (Neu5Ac) 잔기이다. N-아세틸뉴라민산 잔기는 전형적으로 공여체 기질로서 CMP-Neu5Ac로부터 수용체 분자로 전달된다.
시알릴화 올리고당류를 생산하는 방법은 α-2,3-시알릴트랜스퍼라제 활성 및/또는 α-2,6-시알릴트랜스퍼라제 활성을 보유할 수 있는 이종 시알릴트랜스퍼라제를 포함하는 유전자 조작된 세포를 제공하는 단계를 포함한다.
유전자 조작된 세포는 원핵 세포 또는 진핵 세포이다. 바람직하게는, 유전자 조작된 세포는 미생물 세포이다. 적절한 미생물 세포는 효모 세포, 박테리아 세포, 아르키박테리아 세포(archaebacterial cell), 조류 세포, 및 진균 세포를 포함한다.
추가적 및/또는 대안적 실시양태에서, 미생물 세포는 원핵 세포, 바람직하게는 박테리아 세포, 보다 바람직하게는 바실러스(Bacillus), 락토바실러스(Lactobacillus), 락토코쿠스(Lactococcus), 엔테로코쿠스(Enterococcus), 비피도박테리움(Bifido-bacterium), 스포로락토바실러스 종(Sporolactobacillus spp. ), 마이크로모모스포라 종(Micromomospora spp.), 마이크로코쿠스 종(Micrococcus spp.), 로도코쿠스 종(Rhodococcus spp.), 및 슈도모나스(Pseudomonas)로 이루어진 군으로부터 선택된 박테리아 세포이다. 적합한 박테리아 종은 바실러스 서브틸리스(Bacillus subtilis), 바실러스 리체니포르미스(Bacillus licheniformis), 바실러스 코아굴란즈(Bacillus coagulans), 바실러스 써모필루스(Bacillus thermophilus), 바실러스 래터로스포루스(Bacillus laterosporus), 바실러스 메가테리움(Bacillus megaterium), 바실러스 미코이데스(Bacillus mycoides), 바실러스 푸밀루스(Bacillus pumilus), 바실러스 렌투스(Bacillus lentus), 바실러스 세레우스(Bacillus cereus), 바실러스 서쿨란즈(Bacillus circulans), 비피도박테리움 롱굼(Bifidobacterium longum, 비피도박테리움 인펀티스(Bifidobacterium infantis), 비피도박테리움 비피둠(Bifidobacterium bifidum), 시트로박터 프레운디이(Citrobacter freundii), 클로스트리디움 셀룰로리티쿰(Clostridium cellulolyticum), 클로스트리디움 륭달리이(Clostridium ljungdahlii), 클로스트리디움 오토에타노게눔(Clostridium autoethanogenum), 클로스트리디움 아세토부틸리쿰(Clostridium acetobutylicum), 코리네박테리움 글루타미쿰(Corynebacterium glutamicum), 엔테로코쿠스 파에시움(Enterococcus faecium), 엔테로코쿠스 써모필레스(Enterococcus thermophiles), 에쉐리키아 콜라이, 에르위니아 하이르비콜라(Erwinia herbicola) (판토에아 아글로메란스(Pantoea agglomerans)), 락토바실러스 악시도필루스(Lactobacillus acidophilus), 락토바실러스 살리바리우스(Lactobacillus salivarius), 락토바실러스 플란타룸(Lactobacillus plantarum), 락토바실러스 헬베티쿠스(Lactobacillus helveticus), 락토바실러스 델브루엑키이(Lactobacillus delbrueckii), 락토바실러스 램모수스(Lactobacillus rhamnosus), 락토바실러스 불가리쿠스(Lactobacillus bulgaricus), 락토바실러스 크리스파투스(Lactobacillus crispatus), 락토바실러스 가세리(Lactobacillus gasseri), 락토바실러스 카세이(Lactobacillus casei), 락토바실러스 류테리(Lactobacillus reuteri), 락토바실러스 젠세니이(Lactobacillus jensenii), 락토코쿠스 락티스(Lactococcus lactis), 판토에아 시트레아(Pantoea citrea), 펙토박테리움 카로토보룸(Pectobacterium carotovorum), 프로프리온박테리움 프레우덴레이키이(Proprionibacterium freudenreichii), 슈도모나스 플루오레센스(Pseudomonas fluorescens), 슈도모나스 아에루기노사(Pseudomonas aeruginosa), 스트렙토코쿠스 써모필레스(Streptococcus thermophiles) 및 크산토모나스 캄페스트리스(Xanthomonas campestris)로 이루어진 군으로부터 선택된다.
대안적 실시양태에서, 진핵 세포는 효모 세포, 곤충 세포, 식물 세포 또는 포유동물 세포이다. 효모 세포는 바람직하게는 사카로마이세스(Saccharomyces) 종, 특히 사카로마이세스 세레비지아에(Saccharomyces cerevisiae), 사카로마이콥시스(Saccharomycopsis) 종, 피치아(Pichia) 종, 특히 피치아 파스토리스(Pichia pastoris), 한세눌라(Hansenula) 종, 클루이베로마이세스(Kluyveromyces) 종, 야로위아(Yarrowia) 종, 로도토룰라(Rhodotorula) 종, 및 스키조사카로마이세스(Schizosaccharomyces) 종으로 이루어진 군으로부터 선택된다.
유전자 조작된 세포는 이종 시알릴트랜스퍼라제를 포함하도록 유전자 조작되었다.
본원에 사용된 바와 같은 용어 "유전자 조작된"은 분자 생물학적 방법을 사용한 세포의 유전자 구성(genetic make-up)의 변형을 지칭한다. 세포의 유전자 구성의 변형은 종 경계 내에서 및/또는 종 경계를 가로질러 유전자의 전달, 뉴클레오티드, 삼중항, 유전자, 오픈 리딩 프레임(open reading frame), 프로모터(promoter), 인핸서(enhancer), 터미네이터(terminator) 및 유전자 발현을 매개 및/또는 제어하는 기타 뉴클레오티드 서열의 삽입, 결실, 대체 및/또는 변형을 포함할 수 있다. 세포의 유전자 구성의 변형은 특정한, 원하는 특성을 보유하는 유전자 변형된 유기체를 생성하는 것을 목표로 한다. 유전자 조작된 세포는 세포의 고유(native) (유전자 조작되지 않은) 형태로 존재하지 않는 하나 이상의 유전자를 함유할 수 있다. 세포의 유전 정보의 뉴클레오티드 서열을 삽입, 결실 또는 변경시키기 위해 외인성 핵산 분자 (재조합, 이종)를 세포의 유전 정보에 삽입하는 기술 및/또는 외인성 핵산 분자를 도입하는 기술은 통상의 기술자에게 공지되어 있다. 유전자 조작된 세포는 세포의 고유 형태로 존재하는 하나 이상의 유전자를 함유할 수 있으며, 여기서 상기 유전자는 변형되고 인공 수단에 의해 세포 내로 재도입된다. 용어 "유전자 조작된"은 또한 세포에 내인성인 핵산 분자를 함유하고, 세포로부터 핵산 분자를 제거하지 않고 변형된 세포를 포함한다. 이러한 변형은 유전자 대체, 부위-특이적 돌연변이, 및 관련 기술에 의해 수득된 변형을 포함한다.
유전자 조작된 세포는 이종 시알릴트랜스퍼라제를 포함한다.
본원에 사용된 바와 같은 용어 "시알릴트랜스퍼라제"는 시알릴트랜스퍼라제 활성을 보유할 수 있는 폴리펩티드를 지칭한다. "시알릴트랜스퍼라제 활성"은 시알산 잔기, 바람직하게는 N-아세틸뉴라민산 (Neu5Ac) 잔기의, 공여체 기질로부터 수용체 분자로의 전달을 지칭한다. 용어 "시알릴트랜스퍼라제"는 본원에 기재된 시알릴트랜스퍼라제의 기능성 단편, 본원에 기재된 시알릴트랜스퍼라제의 기능성 변이체, 및 기능성 변이체의 기능성 단편을 포함한다. 이와 관련하여 "기능성"은 단편 및/또는 변이체가 시알릴트랜스퍼라제 활성을 보유함을 의미한다. 시알릴트랜스퍼라제의 기능성 단편은 그것 자연 발생 유전자에 의해 코딩된 바와 같은 시알릴트랜스퍼라제의 말단절단된 버전을 포함하며, 이 말단절단된 버전은 시알릴트랜스퍼라제 활성을 보유할 수 있다. 말단절단된 버전의 예는 전형적으로 폴리펩티드를 특정 세포하(subcellular) 위치로 지향하게 하는 소위 리더(leader) 서열을 포함하지 않는 시알릴트랜스퍼라제이다. 전형적으로, 이러한 리더 서열은 그의 세포하 수송 동안에 폴리펩티드로부터 제거되고, 또한 자연 발생 성숙 시알릴트랜스퍼라제에 부재한다.
이종 시알릴트랜스퍼라제는 시알산 잔기를 공여체 기질로부터 수용체 분자로 전달할 수 있다. 이종 시알릴트랜스퍼라제와 관련하여 용어 "할 수 있는"은 이종 시알릴트랜스퍼라제의 시알릴트랜스퍼라제 활성 및 이종 시알릴트랜스퍼라제가 그의 효소 활성을 보유하기 위해 적합한 반응 조건이 요구되는 규정을 지칭한다. 적합한 반응 조건의 부재 하에, 이종 시알릴트랜스퍼라제는 그의 효소 활성을 보유하는 것이 아니라, 적합한 반응 조건이 회복되는 경우 그의 효소 활성을 유지하고 그의 효소 활성을 보유한다. 적합한 반응 조건은 적합한 공여체 기질의 존재, 적합한 수용체 분자의 존재, 필수 보조인자 예컨대 - 예를 들어 - 1가 또는 2가 이온의 존재, 적절한 범위의 pH 값, 적합한 온도 등을 포함한다. 이종 시알릴트랜스퍼라제의 효소 반응을 수행하는 각각의 및 모든 인자에 대한 최적의 값이 반드시 충족될 필요는 없는 것이나, 반응 조건은 이종 시알릴트랜스퍼라제가 그의 효소 활성을 수행하도록 하는 것이어야 한다. 따라서, 용어 "할 수 있는"은 이종 시알릴트랜스퍼라제의 효소 활성이 비가역적으로 손상되는 임의의 조건을 제외하고, 이종 시알릴트랜스퍼라제의 임의의 이러한 조건에의 노출을 또한 제외한다. 대신에, "할 수 있는"은 시알릴트랜스퍼라제가 효소적으로 활성, 즉 허용 가능한 반응 조건 (시알릴트랜스퍼라제가 그의 효소 활성을 수행하기 위해 필요한 모든 요건)이 시알릴트랜스퍼라제에 제공되는 경우, 그의 시알릴트랜스퍼라제 활성을 보유함을 의미한다.
시알릴트랜스퍼라제는 그들이 형성하는 당 연결의 유형으로 구별될 수 있다. 본원에 사용된 바와 같이, 용어 "α-2,3-시알릴트랜스퍼라제" 및 "α-2,3-시알릴트랜스퍼라제 활성"은 수용체 분자의 갈락토스 또는 갈락토스 잔기에 알파-2,3 연결을 가진 시알산 잔기를 첨가하는 폴리펩티드 및 그의 효소 활성을 지칭한다. 마찬가지로, 용어 "α-2,6-시알릴트랜스퍼라제" 및 "α-2,6-시알릴트랜스퍼라제 활성"은 수용체 분자의 갈락토스, N-아세틸갈락토사민 및/또는 N-아세틸글루코사민, 갈락토스 잔기 또는 N-아세틸갈락토사민 잔기 및/또는 N-아세틸글루코사민 잔기에 알파-2,6 연결을 가진 시알산 잔기를 첨가하는 폴리펩티드 및 그의 효소 활성을 지칭한다. 마찬가지로, 용어 "α-2,8-시알릴트랜스퍼라제" 및 "α-2,8-시알릴트랜스퍼라제 활성"은 수용체 분자의 갈락토스, N-아세틸갈락토사민 및/또는 N-아세틸글루코사민, 갈락토스 잔기 또는 N-아세틸갈락토사민 잔기 및/또는 N-아세틸글루코사민 잔기에 알파-2,8 연결을 가진 시알산 잔기를 첨가하는 폴리펩티드 및 그의 효소 활성을 지칭한다.
본원에 사용된 바와 같은 용어 "이종"은 세포 또는 유기체에 외래인 폴리펩티드, 아미노산 서열, 핵산 분자 또는 뉴클레오티드 서열, 즉 상기 세포 또는 유기체에서 자연적으로 발생하지 않는 폴리펩티드, 아미노산 서열, 핵산 분자 또는 뉴클레오티드 서열을 지칭한다. 본원에 사용된 바와 같은 "이종 서열" 또는 "이종 핵산" 또는 "이종 폴리펩티드"는, 특정한 숙주 세포에 대한 외래 공급원 (예를 들어, 다른 종으로부터)으로부터 유래하거나, 또는 동일한 공급원으로부터 유래한 것인 경우, 그의 원래 형태로부터 변형된 것이다. 따라서, 프로모터에 작동 가능하게 연결된 이종 핵산은 그로부터 프로모터가 유래된 것과 상이한 공급원으로부터이거나, 또는 동일한 공급원으로부터 유래한 것인 경우, 그의 원래 형태로부터 변형된 것이다. 이종 서열은, 예를 들어 형질감염, 형질전환, 접합 또는 형질도입에 의해, 숙주 미생물 숙주 세포의 게놈 내로 안정적으로 도입되어, 유전자 변형된 숙주 세포를 나타낼 수 있다. 서열이 도입될 숙주 세포에 의존할 기술이 적용될 수 있다. 다양한 기술이 관련 기술분야의 통상의 기술자에게 공지되어 있고, 예를 들어, 문헌 [Sambrook et al., Molecular Cloning: A Laboratory Manual, 2nd Ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (1989)]에 개시되어 있다. 따라서, "이종 폴리펩티드"는 세포에서 자연적으로 발생하지 않는 폴리펩티드이고, "이종 시알릴트랜스퍼라제"는 세포에서 자연적으로 발생하지 않는 시알릴트랜스퍼라제이다.
이종 시알릴트랜스퍼라제는 시알산 잔기, 예를 들어 N-아세틸뉴라민산 (Neu5Ac) 잔기를, 공여체 기질, 예를 들어 CMP-Neu5Ac로부터, 수용체 분자로 전달할 수 있다. 수용체 분자는 락토스, 락토-N-트리오스 II (LNT-II) 또는 모유 올리고당류로 이루어진 군으로부터 선택된 올리고당류이다.
추가적 및/또는 대안적 실시양태에서, 수용체 분자는 삼당류, 사당류 및 오당류로 이루어진 군으로부터 선택된 모유 올리고당류이다.
추가적 및/또는 대안적 실시양태에서, 수용체 분자는 락토-N-테트라오스, 락토-N-네오테트라오스, LST-a 및 LST-b로 이루어진 군으로부터 선택된 모유 올리고당류이다.
일 실시양태에서, 이종 시알릴트랜스퍼라제는,
I. 서열번호: 1 내지 33 중 어느 하나로 표시되는 바와 같은 아미노산 서열을 포함하거나 그로 이루어진 폴리펩티드;
II. 서열번호: 1 내지 33 중 어느 하나로 표시되는 바와 같은 아미노산 서열 중 어느 하나와 적어도 80%의 서열 유사성을 갖는 아미노산 서열을 포함하거나 그로 이루어진 폴리펩티드; 및
III. I. 및 II.의 폴리펩티드 중 어느 하나의 단편
으로 이루어진 군으로부터 선택된다.
추가적 및/또는 대안적 실시양태에서, 유전자 조작된 세포는 이종 시알릴트랜스퍼라제를 코딩하는 뉴클레오티드 서열을 포함하는 핵산 분자를 함유하도록 형질전환되었다. 바람직하게는, 뉴클레오티드 서열은,
i. 서열번호: 1 내지 33 중 어느 하나로 표시되는 바와 같은 폴리펩티드를 코딩하는 뉴클레오티드 서열;
ii. 서열번호: 34 내지 66 중 어느 하나로 표시되는 바와 같은 뉴클레오티드 서열;
iii. 서열번호: 1 내지 33 중 어느 하나로 표시되는 바와 같은 폴리펩티드를 코딩하는 뉴클레오티드 서열 중 하나와 뉴클레오티드 서열 중 하나와 적어도 80% 서열 유사성을 갖는 뉴클레오티드 서열;
iv. 서열번호: 34 내지 66으로 표시되는 뉴클레오티드 서열 중 하나와 적어도 80%의 서열 유사성을 갖는 뉴클레오티드 서열;
v. i., ii., iii. 및 iv의 뉴클레오티드 서열 중 어느 하나와 상보적인 뉴클레오티드 서열; 및
vi. i., ii., iii., iv. 및 v.의 뉴클레오티드 서열 중 어느 하나의 단편
으로 이루어진 군으로부터 선택된다.
표현 "서열번호: 1 내지 33 중 어느 하나"는 서열번호: 1, 서열번호: 2, 서열번호: 3, 서열번호: 4, 서열번호: 5, 서열번호: 6, 서열번호: 7, 서열번호: 8, 서열번호: 9, 서열번호: 10, 서열번호: 11, 서열번호: 12, 서열번호: 13. 서열번호: 14. 서열번호: 15, 서열번호: 16, 서열번호: 17, 서열번호: 18, 서열번호: 19, 서열번호: 20, 서열번호: 21, 서열번호: 22, 서열번호: 23, 서열번호: 24, 서열번호: 25, 서열번호: 26, 서열번호: 27, 서열번호: 28, 서열번호: 29, 서열번호: 30, 서열번호: 31, 서열번호: 32, 및 서열번호: 33으로 이루어진 군 중 어느 하나를 지칭한다. 표현 "서열번호: 34 내지 66 중 어느 하나"에도 동일한 원리가 적용된다. 일반적으로 말하면, "X" 및 "Z"가 자연수를 나타내는 것인, 표현 "서열번호: X 내지 Z 중 어느 하나"는, X 내지 Z의 식별번호를 포함하는 "서열번호" 중 어느 하나로 표시되는 모든 서열 (뉴클레오티드 서열 또는 아미노산 서열)을 지칭한다.
게다가, 유전자 조작된 세포는 이종 시알릴트랜스퍼라제를 코딩하는 뉴클레오티드 서열을 발현하도록 유전자 조작되었다. 이를 위해, 이종 시알릴트랜스퍼라제를 코딩하는 뉴클레오티드 서열은 유전자 조작된 세포에서 이종 시알릴트랜스퍼라제를 코딩하는 상기 뉴클레오티드 서열의 전사 및/또는 번역을 수행하는 적어도 하나의 핵산 발현 제어에 작동 가능하게 연결된다.
본원에 사용된 바와 같은 용어 "작동 가능하게 연결된"은, 이종 시알릴트랜스퍼라제를 코딩하는 뉴클레오티드 서열과 제2 뉴클레오티드 서열, 핵산 발현 제어 서열 (예를 들어, 프로모터, 오퍼레이터, 인핸서, 조절인자, 전사 인자 결합 부위의 어레이, 전사 터미네이터, 리보솜 결합 부위) 사이의 기능적 연결을 지칭하며, 여기서 발현 제어 서열은 이종 시알릴트랜스퍼라제를 코딩하는 뉴클레오티드 서열에 상응하는 핵산의 전사 및/또는 번역에 영향을 미친다. 따라서, 용어 "프로모터"는 통상 DNA 중합체에서 유전자에 "선행"하고 mRNA로의 전사의 개시 부위를 제공하는 DNA 서열을 지정한다. 주어진 DNA 중합체에서 유전자의 통상 "상류" (즉, 선행하는)인 "조절인자" DNA 서열은, 전사 개시의 빈도 (또는 속도)를 결정하는 단백질에 결합한다. 총괄적으로 "프로모터/조절인자" 또는 "제어" DNA 서열로 지칭되어, 기능성 DNA 중합체에서 선택된 유전자 (또는 일련의 유전자)에 선행하는 이들 서열은 유전자의 전사 (및 궁극적인 발현)가 발생할지 여부를 결정하기 위해 협력한다. DNA 중합체에서 유전자를 "따르고" 전사를 mRNA로의 전사의 종결 신호를 제공하는 DNA 서열은 전사 "터미네이터" 서열로 지칭된다.
일 실시양태에서, 유전자 조작된 세포는 α-2,3-시알릴트랜스퍼라제 활성을 보유할 수 있는 이종 시알릴트랜스퍼라제를 포함하고, 모유 올리고당류는 LNT이다. 이렇게 생산된 시알릴화 올리고당류는 LST-a이다.
추가적 및/또는 대안적 실시양태에서, α-2,3-시알릴트랜스퍼라제 활성을 보유할 수 있는 이종 시알릴트랜스퍼라제는,
I. 서열번호: 1 내지 27 중 어느 하나로 표시되는 바와 같은 아미노산 서열을 포함하거나 그로 이루어진 폴리펩티드;
II. 서열번호: 1 내지 27 중 어느 하나로 표시되는 바와 같은 아미노산 서열 중 임의의 것과 적어도 80%의 서열 유사성을 갖는 아미노산 서열을 포함하거나 그로 이루어진 폴리펩티드; 및
III. I. 및 II.의 폴리펩티드 중 어느 하나의 단편
으로 이루어진 군으로부터 선택된다.
추가적 및/또는 대안적 실시양태에서, 유전자 조작된 세포는 상기 α-2,3-시알릴트랜스퍼라제 활성을 보유할 수 있는 상기 이종 시알릴트랜스퍼라제를 코딩하는 적어도 하나의 뉴클레오티드 서열을 포함하는 재조합 또는 합성 핵산 분자를 포함하며, 여기서 상기 적어도 하나의 뉴클레오티드 서열은,
i. 서열번호: 1 내지 27 중 어느 하나로 표시되는 바와 같은 폴리펩티드를 코딩하는 뉴클레오티드 서열;
ii. 서열번호: 34 내지 60 중 어느 하나로 표시되는 바와 같은 뉴클레오티드 서열;
iii. 서열번호: 1 내지 27 중 어느 하나로 표시되는 바와 같은 폴리펩티드를 코딩하는 뉴클레오티드 서열 중 하나와 적어도 80% 서열 유사성을 갖는 뉴클레오티드 서열;
iv. 서열번호: 34 내지 60으로 표시되는 뉴클레오티드 서열 중 어느 하나와 적어도 80%의 서열 유사성을 갖는 뉴클레오티드 서열;
v. i., ii., iii. 및 iv의 뉴클레오티드 서열 중 어느 하나와 상보적인 뉴클레오티드 서열; 및
vi. i., ii., iii., iv. 및 v.의 뉴클레오티드 서열 중 어느 하나의 단편
으로 이루어진 군으로부터 선택된다.
추가적 및/또는 대안적 실시양태에서, α-2,3-시알릴트랜스퍼라제 활성을 보유할 수 있는 이종 시알릴트랜스퍼라제는 실시예 5에 기재된 바와 같은 방법에 따라 LC-MS/MS를 사용한 LNT 시알릴화의 정량 분석에 의한 서열번호: 27로 표시되는 바와 같은 SiaT16의 상대 효능과 비교하여, 적어도 100-배, 적어도 200-배, 적어도 300-배, 적어도 1000-배, 적어도 10,000-배의 상대 효능을 갖는다.
또 다른 실시양태에서, 이종 시알릴트랜스퍼라제는 α-2,6-시알릴트랜스퍼라제 활성을 보유할 수 있고, 모유 올리고당류는 LNT이다. 이렇게 생산된 시알릴화 올리고당류는 LST-b이다.
추가적 실시양태에서, α-2,6-시알릴트랜스퍼라제 활성을 보유할 수 있는 이종 시알릴트랜스퍼라제는,
I. 서열번호: 28 내지 33 중 어느 하나로 표시되는 바와 같은 아미노산 서열을 포함하거나 그로 이루어진 폴리펩티드;
II. 서열번호: 28 내지 33 중 어느 하나로 표시되는 바와 같은 아미노산 서열 중 임의의 것과 적어도 80%의 유사성을 갖는 아미노산 서열을 포함하거나 그로 이루어진 폴리펩티드; 및
III. I. 및 II.의 폴리펩티드 중 어느 하나의 단편
으로 이루어진 군으로부터 선택된다.
추가적 및/또는 대안적 실시양태에서, 유전자 조작된 세포는 α-2,6-시알릴트랜스퍼라제 활성을 보유할 수 있는 상기 이종 시알릴트랜스퍼라제를 코딩하는 적어도 하나의 뉴클레오티드 서열을 포함하는 재조합 또는 합성 핵산 분자를 포함하며, 여기서 상기 적어도 하나의 뉴클레오티드 서열은,
i. 서열번호: 28 내지 33 중 어느 하나로 표시되는 바와 같은 폴리펩티드를 코딩하는 뉴클레오티드 서열;
ii. 서열번호: 61 내지 66 중 어느 하나로 표시되는 바와 같은 뉴클레오티드 서열;
iii. 서열번호: 28 내지 33 중 어느 하나로 표시되는 바와 같은 폴리펩티드를 코딩하는 뉴클레오티드 서열 중 하나와 적어도 80% 서열 유사성을 갖는 뉴클레오티드 서열;
iv. 서열번호: 61 내지 66으로 표시되는 뉴클레오티드 서열 중 어느 하나와 적어도 80%의 서열 유사성을 갖는 뉴클레오티드 서열;
v. i., ii., iii. 및 iv의 뉴클레오티드 서열 중 어느 하나와 상보적인 뉴클레오티드 서열; 및
vi. i., ii., iii., iv. 및 v.의 뉴클레오티드 서열 중 어느 하나의 단편
으로 이루어진 군으로부터 선택된다.
추가적 및/또는 대안적 실시양태에서, α-2,3-시알릴트랜스퍼라제 활성을 보유할 수 있는 이종 시알릴트랜스퍼라제는 실시예 5에 기재된 바와 같은 방법에 따라 LC-MS/MS를 사용한 LNT 시알릴화의 정량 분석에 의한 서열번호: 33으로 표시되는 바와 같은 SiaT5의 상대 효능과 비교하여, 적어도 100-배, 보다 바람직하게는 적어도 200-배, 가장 바람직하게는 적어도 300-배의 상대 효능을 갖는다.
추가적 및/또는 대안적 실시양태에서, 적어도 하나의 유전자 조작된 세포는 CMP-N-아세틸뉴라민산, UDP-N-아세틸글루코사민, UDP-갈락토스 및 GDP-푸코스로 이루어진 군으로부터 선택된 하나 이상의 뉴클레오티드-활성화된 당류의 생산 증가를 보유한다. 바람직하게는, 적어도 하나의 유전자 조작된 세포는 상기 뉴클레오티드-활성화된 당류 중 하나 이상의 생산 증가를 보유하도록 추가로 유전자 조작되었다. 상기 뉴클레오티드 활성화된 당류 중 적어도 하나의 생산은 상기 뉴클레오티드-활성화된 당류의 적어도 하나의 생산 증가를 보유하도록 추가로 유전자 조작되기 이전에 추가로 유전자 조작된 세포의 전구 세포에서 동일한 뉴클레오티드-활성화된 당(류)의 생산과 비교하여 추가로 유전자 조작된 세포에서 증가된다.
추가적 및/또는 대안적 실시양태에서, 적어도 하나의 세포는 L-글루타민:D-프럭토스-6-포스페이트 아미노트랜스퍼라제, N-아세틸글루코사민-1-포스페이트 우리딜트랜스퍼라제, 글루코사민-1-포스페이트 아세틸 트랜스퍼라제, 포스포글루코사민 뮤타제, 글루코사민-6-포스페이트-N-아세틸-트랜스퍼라제, N-아세틸글루코사민-2-에피머라제, UDP-N-아세틸글루코사민-2-에피머라제, 시알산 신타제(synthase), 포스포에놀피루베이트 신타제, CMP-시알산 신세타제(synthetase), UDP-갈락토스-4-에피머라제, 갈락토스-1-포스페이트 우리딜릴트랜스퍼라제, 포스포글루코뮤타제, 글루코스-1-포스페이트 우리딜릴트랜스퍼라제, 포스포만노뮤타제, 만노스-1-포스페이트 구아노실트랜스퍼라제, GDP-만노스-4,6-데히드라타제, GDP-L-푸코스 신타제 및 푸코스 키나제/L-푸코스-1-포스페이트-구아닐트랜스퍼라제로 이루어진 군으로부터 선택된 효소 활성을 보유할 수 있는 폴리펩티드를 코딩하는 하나 이상의 유전자를 과발현하도록 추가로 유전자 조작되었다. 상기 유전자 중 하나 이상의 과발현은 상기 하나 이상의 유전자의 과발현을 보유하도록 추가로 유전자 조작되기 이전에 추가로 유전자 조작된 세포의 전구 세포와 비교하여 과발현이다.
상기 유전자 중 하나 이상의 과발현은 유전자 조작된 세포에서 상응하는 효소(들)의 양을 증가시키고, 따라서 상기 뉴클레오티드-활성화된 당류 중 적어도 하나의 세포내 생산을 향상시키기 위해 세포에서 상응하는 효소 활성을 증가시킨다.
추가적 및/또는 대안적 실시양태에서, 적어도 하나의 유전자 조작된 세포는, 유전자 조작되기 이전의 세포와 비교하여, β-갈락토시다제 활성, 글루코사민-6-포스페이트 데아미나제, N-아세틸글루코사민-6-포스페이트 데아세틸라제, N-아세틸만노사민 키나제, N-아세틸만노사민-6-포스페이트 에피머라제 및 N-아세틸뉴라민산 알도라제로 이루어진 군으로부터 선택된 하나 이상의 효소 활성이 없거나 그의 감소된 활성을 보유한다.
추가적 및/또는 대안적 실시양태에서, β-갈락토시다제, 글루코사민-6-포스페이트 데아미나제, N-아세틸글루코사민-6-포스페이트 데아세틸라제, N-아세틸만노사민 키나제, N-아세틸만노사민-6-포스페이트 에피머라제 및 N-아세틸뉴라민산 알도라제를 코딩하는 유전자 중 하나 이상은 유전자 조작된 세포의 게놈으로부터 결실되었거나 β-갈락토시다제, 글루코사민-6-포스페이트 데아미나제, N-아세틸글루코사민-6-포스페이트 데아세틸라제, N-아세틸만노사민 키나제, N-아세틸만노사민-6-포스페이트 에피머라제 및 N-아세틸뉴라민산 알도라제를 코딩하는 유전자 중 하나 이상의 발현이 세포의 추가 유전자 조작에 의해 유전자 조작된 세포에서 불활성화되었거나 적어도 감소된다. 상기 유전자의 발현은 상기 유전자의 감소된 발현을 보유하도록 추가로 유전자 조작되기 이전에 추가로 유전자 조작된 세포의 전구 세포와 비교하여 추가로 유전자 조작된 세포에서 감소된다.
추가적 및/또는 대안적 실시양태에서, 적어도 하나의 유전자 조작된 세포는 기능성 락토스 투과효소, 기능성 푸코스 투과효소 및 기능성 시알산 수송체 (내수송체(importer))로 이루어진 군으로부터 선택된 적어도 하나를 포함하고, 바람직하게는 기능성 락토스 투과효소, 기능성 푸코스 투과효소 및 기능성 시알산 수송체 (내수송체)로 이루어진 군으로부터 선택된 하나를 코딩하는 적어도 하나의 뉴클레오티드 서열을 포함하고 발현한다.
추가적 및/또는 대안적 실시양태에서, 유전자 조작된 세포는 β-1,3-N-아세틸글루코사미닐트랜스퍼라제, β-1,3-갈락토실트랜스퍼라제, β-1,4-갈락토실트랜스퍼라제, α-2,3-시알릴트랜스퍼라제 및 α-2,6-시알릴트랜스퍼라제로 이루어진 군으로부터 선택된 적어도 하나의 글리코실트랜스퍼라제의 활성을 보유한다.
추가적 및/또는 대안적 실시양태에서, 적어도 하나의 유전자 조작된 세포는 발효액 중에서 및 상기 시알릴화 올리고당류의 생산에 허용되는 조건 하에 배양된다
발효액은 유전자 조작된 세포를 위한 적어도 하나의 탄소 공급원을 함유한다. 적어도 하나의 탄소 공급원은 바람직하게는 글루코스, 프럭토스, 수크로스, 글리세롤, 및 그의 조합물로 이루어진 군으로부터 선택된다.
추가적 및/또는 대안적 실시양태에서, 발효액은 N-아세틸글루코사민, 갈락토스 및 시알산으로 이루어진 군으로부터 선택된 적어도 하나를 함유한다.
적어도 하나의 유전자 조작된 세포가 N-아세틸글루코사민, 갈락토스 및 시알산으로 이루어진 군으로부터 선택된 하나 이상의 부재 하에 및/또는 첨가 없이 배양되는 추가적 및/또는 대안적 실시양태에서, 적어도 하나의 유전자 조작된 세포는 락토스, 락토-N-트리오스 II (LNT-II) 또는 적어도 하나의 HMO, 바람직하게는 삼당류, 사당류 및 오당류로 이루어진 군으로부터 선택된 HMO, 보다 바람직하게는 LNT 및 LNnT로 이루어진 군으로부터 선택된 HMO의 존재하에 배양된다.
상기 방법은 발효액에서 그의 배양 동안에 적어도 하나의 유전자 조작된 세포에 의해 생산된 시알릴화 올리고당류를 회수하는 임의적 단계를 포함한다. 시알릴화 올리고당류는 유전자 조작된 세포가, 예를 들어 원심분리에 의해 제거된 후 발효액으로부터 회수될 수 있고/거나, 예를 들어 세포가 원심분리에 의해 발효액으로부터 수확된다는 점에서 세포로부터 회수될 수 있고, 세포 용해 단계를 거친다. 후속적으로, 시알릴화 올리고당류는 통상의 기술자에게 공지된 적합한 기술에 의해 발효액 및/또는 세포 용해물로부터 추가로 정제될 수 있다. 적합한 기술은 미세여과, 한외여과, 정용여과(diafiltration), 모의 이동층형 크로마토그래피, 전기투석, 역삼투, 겔 여과, 음이온 교환 크로마토그래피, 양이온 교환 크로마토그래피 등을 포함한다.
제2 측면에 따르면, 시알릴화 올리고당류를 생산하는 방법에서 사용하기 위한 유전자 조작된 세포가 제공된다. 상기 유전자 조작된 세포 및 상기 유전자 조작된 세포의 바람직한 실시양태는 상기 방법과 관련하여 앞서 본원에 기재되었다. 따라서, 유전자 조작된 세포는 이종 시알릴트랜스퍼라제를 포함하고, 상기 이종 시알릴트랜스퍼라제는 시알산 잔기, 예를 들어 N-아세틸뉴라민산 (Neu5Ac) 잔기를 공여체 기질로서 뉴클레오티드-활성화된 형태, 예를 들어 CMP-Neu5Ac로부터 수용체 분자로 전달하기 위한 α-2,3-시알릴트랜스퍼라제 활성 및/또는 α-2,6-시알릴트랜스퍼라제 활성을 보유할 수 있고, 여기서 수용체 분자가 락토스, 락토-N-트리오스 II 및 모유 올리고당류로 이루어진 군으로부터 선택된다.
제3 측면에 따르면, 세포에서 전파될 때 시알릴트랜스퍼라제를 발현하기 위한 재조합 핵산 분자로서, 상기 시알릴트랜스퍼라제가 세포에서 발현될 때 이종 시알릴트랜스퍼라제인, 세포에서 전파될 때 시알릴트랜스퍼라제를 발현하기 위한 재조합 핵산 분자가 제공된다. 재조합 핵산 분자(들)는 시알산 잔기, 예를 들어 a N-아세틸뉴라민산 잔기를 공여체 기질로부터 수용체 분자로 전달할 수 있는 시알릴트랜스퍼라제를 코딩하는 뉴클레오티드 서열을 포함하고, 여기서 상기 수용체 분자가 락토스, 락토-N-트리오스 II 및 모유 올리고당류로 이루어진 군으로부터 선택된다.
시알산 잔기를 공여체 기질로부터 수용체 분자 (여기서 상기 수용체 분자가 락토스, 락토-N-트리오스 II 및 모유 올리고당류로 이루어진 군으로부터 선택된다)로 전달할 수 있는 시알릴트랜스퍼라제를 코딩하는 뉴클레오티드 서열의 바람직한 실시양태, 예컨대 바람직한 뉴클레오티드 서열은, 시알릴화 올리고당류의 생산 방법과 관련하여 앞서 본원에 개시되어 있다. 예를 들어, 시알릴트랜스퍼라제는 N-아세틸뉴라민산 잔기를 CMP-Neu5Ac로부터 락토스, 락토-N-트리오스 II 또는 모유 올리고당류로 전달할 수 있다.
시알릴트랜스퍼라제를 코딩하는 뉴클레오티드 서열은 적어도 하나의 발현 제어 서열에 작동 가능하게 연결된다. 따라서, 추가적 및/또는 대안적 실시양태에서, 재조합 핵산 분자는 상기 재조합 핵산 분자가 세포에서 전파될 때 시알릴트랜스퍼라제를 코딩하는 뉴클레오티드 서열의 전사 및/또는 번역을 매개하는 적어도 하나의 발현 제어 서열을 포함한다.
제4 측면에 따르면, 시알산 잔기, 예를 들어 N-아세틸뉴라민산 잔기를 공여체 기질, 예를 들어 CMP-Neu5Ac로부터, 수용체 분자로 전달하는 α-2,3-시알릴트랜스퍼라제 활성 및/또는 α-2,6-시알릴트랜스퍼라제 활성을 보유할 수 있는 시알릴트랜스퍼라제로서, 여기서 상기 수용체 분자가 락토스, 락토-N-트리오스 II 또는 모유 올리고당류인 시알릴트랜스퍼라제가 제공된다.
일 실시양태에서, 수용체 분자는 삼당류, 사당류 및 오당류로 이루어진 군으로부터 선택된다. 추가적 및/또는 대안적 실시양태에서, 수용체 분자는 LST-a 및 LST-b로 이루어진 군으로부터 선택된다.
추가적 및/또는 대안적 실시양태에서, 시알릴트랜스퍼라제는,
I. 서열번호: 1 내지 33 중 어느 하나로 표시되는 바와 같은 아미노산 서열을 포함하거나 그로 이루어진 폴리펩티드;
II. 서열번호: 1 내지 33 중 어느 하나로 표시되는 바와 같은 아미노산 서열 중 어느 하나와 적어도 80%의 서열 유사성을 갖는 아미노산 서열을 포함하거나 그로 이루어진 폴리펩티드; 및
III. I. 및 II.의 폴리펩티드 중 어느 하나의 단편
으로 이루어진 군으로부터 선택된다.
제5 측면에 따르면, 시알릴화 올리고당류를 생산하기 위한, 앞서 본원에 기재되어 있으며 시알산 잔기를 공여체 기질로부터, 예를 들어 N-아세틸뉴라민산 잔기를 CMP Neu5AC로부터, 수용체 분자로 전달할 수 있는 시알릴트랜스퍼라제의 용도로서, 여기서 상기 수용체 분자가 락토스, 락토-N-트리오스 II 또는 모유 올리고당류인 상기 용도가 제공된다.
상기 시알릴트랜스퍼라제는 시알산 잔기를 모유 올리고당류인 수용체 분자로 전달할 수 있음으로써, 시알릴화 올리고당류를 생산한다.
모유 올리고당류는 중성 올리고당류 또는 산성 올리고당류일 수 있고, 즉 모유 올리고당류는 적어도 하나의 시알산 잔기를 포함한다.
앞서 본원에 기재된 바와 같은 시알릴트랜스퍼라제를 사용함으로써 생산된 시알릴화 올리고당류는, 모유 올리고당류일 수 있거나 자연 발생 모유에서 발견되지 않은 시알릴화 올리고당류일 수 있다.
제6 측면에 따르면, 시험관내 생체촉매반응에 의해 시알릴화 올리고당류를 생산하는 방법으로서, 여기서 시알릴트랜스퍼라제가 사용되며, 상기 시알릴트랜스퍼라제는 시알산 잔기를 공여체 기질로부터, 예를 들어 N-아세틸뉴라민산 잔기를 CMP Neu5AC로부터, 수용체 분자로 전달할 수 있으며, 여기서 상기 수용체 분자가 모유 올리고당류인, 시험관내 생체촉매반응에 의해 시알릴화 올리고당류를 생산하는 방법이 제공된다.
상기 방법은,
- 반응 혼합물에 - 시알산 잔기, 바람직하게는 N-아세틸뉴라민산을 공여체 기질로부터 수용체 분자로 전달할 수 있는 시알릴트랜스퍼라제, 공여체 기질, 및 수용체 분자를 제공하는 단계;
- 시알릴트랜스퍼라제가 시알산 잔기를 공여체 기질로부터 수용체 분자로 전달하여 시알릴화 올리고당류를 수득하게 하는 단계; 및
- 반응 혼합물로부터 시알릴화 올리고당류를 회수하는 단계
를 포함한다.
제7 측면에 따르면, 제1 측면에 따른 방법 또는 제6 측면에 따른 방법에 의해 생산된 시알릴화 올리고당류가 제공된다.
일 실시양태에서, 시알릴화 올리고당류는 모유 올리고당류, 바람직하게는 사당류, 오당류 또는 육당류, 보다 바람직하게는 LST-a, LST-b 및 DSLNT로 이루어진 군으로부터 선택된 시알릴화 올리고당류이다.
제8 측면에 따르면, 영양 조성물을 제조하기 위한 앞서 본원에 기재된 바와 같은 전체 세포 발효 접근법 또는 시험관내 생체촉매반응에 의해 생산되는 시알릴화 올리고당류의 용도가 제공된다. 상기 영양 조성물은 앞서 본원에 개시된 바와 같은 방법에 의해 생산된 적어도 하나의 시알릴화 올리고당류를 함유한다.
따라서, 제9 측면에 따르면, 앞서 본원에 개시된 바와 같은 방법에 의해 생산된 적어도 하나의 시알릴화 올리고당류를 함유하는 영양 조성물이 제공된다. 바람직하게는, 적어도 하나의 시알릴화 올리고당류는 3'-시알릴락토스, 6'-시알릴락토스, LST-a, LST-b, LST-c 또는 DSLNT이다.
추가적 및/또는 대안적 실시양태에서, 영양 조성물은 적어도 하나의 중성 HMO, 바람직하게는 2'-FL를 추가로 함유한다.
추가적 및/또는 대안적 실시양태에서, 영양 조성물은 3-SL, 6-SL 및 2'-FL를 함유한다.
추가적 실시양태에서, 영양 조성물은 의약 제제, 영아용 조제식 및 식이 보조제로 이루어진 군으로부터 선택된다.
영양 조성물은 분말, 과립, 플레이크 및 펠렛을 포함하나 이에 제한되지는 않는 액체 형태 또는 고체 형태로 존재할 수 있다.
제10 측면에 따르면, 적어도 하나의 시알릴화 HMO를 함유하는 영아용 조제식이 제공된다. 상기 시알릴화 HMO는 앞서 본원에 기재된 바와 같이 생산된 시알릴화 올리고당류의 군으로부터 선택된 HMO이다.
일 실시양태에서, 영아용 조제식에 함유된 적어도 하나의 시알릴화 HMO는 3-SL, 6-SL, LST-a, LST-b, LST-c 및 DSLNT로 이루어진 군으로부터 선택된다.
추가적 및/또는 대안적 실시양태에서, 영아용 조제식은 적어도 하나의 시알릴화 HMO 및 하나 이상의 중성 HMO를 함유한다.
추가적 및/또는 대안적 실시양태에서, 영아용 조제식은 3-SL, 6-SL 및 2'-FL을 함유한다.
본 발명은 특정한 실시양태에 관하여 그리고 도면을 참조하여 설명될 것이나, 본 발명은 이에 제한되는 것이 아니라 청구범위에 의해서만 제한된다. 더욱이, 상기 설명 및 청구범위에서의 용어 제1, 제2 등은, 유사한 요소를 구별하기 위해 사용되며 반드시 일시적으로, 공간적으로, 순위적으로 또는 임의의 다른 방식으로 순서를 설명할 필요는 없다. 그렇게 사용된 용어는 적절한 환경 하에 상호 교환 가능하고, 본원에 기재된 본 발명의 실시양태는 본원에 기재되거나 도시된 것과 다른 순서로 조작할 수 있음을 이해하여야 한다.
청구범위에 사용된, 용어 "포함하는"은 그 이후에 열거된 수단으로 제한되는 것으로 해석되어서는 안되며; 이는 다른 요소 또는 단계를 제외하지 않음을 주목하여야 한다. 따라서, 이는 언급된 바와 같은 특징, 정수, 단계 또는 구성요소의 존재를 구체화하는 것으로 해석되어야 하나, 하나 이상의 다른 특징, 정수, 단계 또는 구성요소, 또는 그의 군의 존재 또는 추가를 배제하지는 않는다. 따라서, 표현 "수단 A 및 B를 포함하는 장치"의 범위는 구성요소 A 및 B로만 이루어진 장치로 제한되어서는 안된다. 이는 본 발명에 관하여, 장치의 유일한 관련 구성요소는 A 및 B임을 의미한다.
본 명세서 전체에 걸쳐 "한 실시양태" 또는 "일 실시양태"에 대한 언급은 실시양태와 관련하여 기재된 특정한 특징, 구조 또는 특성이 본 발명의 적어도 한 실시양태에 포함됨을 의미한다. 따라서, 본 명세서 전체에 걸쳐 다양한 곳에서 어구 "한 실시양태" 또는 "일 실시양태"의 출현이 반드시 모두 동일한 실시양태를 지칭하는 것은 아니나, 지칭할 수도 있다. 더욱이, 특정한 특징, 구조 또는 특성은 하나 이상의 실시양태에서, 본 개시내용으로부터 관련 기술분야에서 통상의 기술자에게 분명한 바와 같이, 임의의 적합한 방식으로 조합될 수 있다.
유사하게, 본 발명의 예시적인 실시양태의 설명에서, 본 발명의 다양한 특징은 때때로 본 개시내용을 간소화하고 다양한 발명의 측면 중 하나 이상의 이해를 돕기 위해 그의 단일 실시양태, 도면, 또는 설명에서 함께 그룹화된다는 것을 인식하여야 한다. 그러나, 개시내용의 이 방법은, 청구된 발명이 각각의 청구범위에 명시적으로 나열된 것보다 더 많은 특징을 필요로 한다는 의도를 반영하는 것으로 해석되지 않아야 한다. 오히려, 하기 청구범위가 반영하는 바와 같이, 본 발명의 측면은 단일의 전술한 개시된 실시양태의 모든 특징보다 적은 상태로 있다. 따라서, 상세한 설명에 따른 청구범위는 이 상세한 설명에 명시적으로 이에 의하여 포함되며, 각각의 청구범위는 본 발명의 별도의 실시양태로서 독립적이다.
더욱이, 본원에 기재된 일부 실시양태는 일부를 포함하는 것이지 다른 실시양태에 포함된 다른 특징을 포함하는 것이 아니지만, 상이한 실시양태의 특징의 조합은, 관련 기술분야의 통상의 기술자가 이해하는 바와 같이, 본 발명의 범위 내에 있으며, 상이한 실시양태를 형성하는 것으로 여겨진다. 예를 들어, 하기 청구범위에서, 청구된 실시양태 중 임의의 것이 임의의 조합으로 사용될 수 있다.
더욱이, 실시양태의 일부는 컴퓨터 시스템의 프로세서에 의해 또는 기능을 수행하는 다른 수단에 의해 구현될 수 있는 방법 또는 방법의 요소의 조합으로서 본원에 기재된다. 따라서, 이러한 방법 또는 방법의 요소를 수행하기 위해 필요한 지시를 가진 프로세서는 방법 또는 방법의 요소를 수행하기 위한 수단을 형성한다. 더욱이, 장치 실시양태의 본원에 기재된 요소는 본 발명을 수행하기 위해 요소에 의해 수행되는 기능을 수행하기 위한 수단의 예이다.
본원에 제공된 설명 및 도면에서, 수많은 구체적 세부사항이 설명된다. 그러나, 본 발명의 실시양태는 이들 구체적 세부사항 없이도 실시될 수 있는 것으로 이해된다. 다른 경우에, 널리 공지된 방법, 구조 및 기술은 이 설명의 이해를 모호하게 하지 않기 위해 상세히 나타내지 않았다.
본 발명은 이제 본 발명의 몇몇 실시양태의 상세한 설명에 의해 설명될 것이다. 본 발명의 다른 실시양태는 본 발명의 진정한 사상 또는 기술적 교시를 벗어나지 않고 관련 기술분야의 통상의 기술자의 지식에 따라 구성될 수 있으며, 본 발명은 첨부된 청구범위의 용어에 의해서만 제한된다는 것이 분명하다.
실시예
실시예 1: 락토스를 수용체로서 사용하여 시알릴트랜스퍼라제의 생체내 스크리닝을 가능하게 하는 이. 콜라이 Neu5Ac 생산 균주의 개발
대사 공학은 돌연변이유발 및 특이 유전자의 결실 각각, 및 이종 유전자의 게놈 통합을 포함하였다. 유전자 lacZaraA는 문헌 [Ellis et al., (Proc. Natl. Acad. Sci. USA 98: 6742-6746 (2001))]에 기재된 바와 같이 미스매치-올리고뉴클레오티드를 사용하여 돌연변이유발에 의해 불활성화되었다.
문헌 [Datsenko and Wanner (Proc. Natl. Acad. Sci. USA 97:6640-6645 (2000))]의 방법에 따라 게놈 결실을 수행하였다. N-아세틸뉴라민산의 세포내 분해를 방지하기 위해, N-아세틸글루코사민-6-포스페이트 데아세틸라제 (nagA) 및 글루코사민-6-포스페이트 데아미나제 (nagB)를 코딩하는 유전자뿐만 아니라 N-아세틸만노사민 키나제 (nanK), N-아세틸만노사민-6-포스페이트 에피머라제 (nanE), N-아세틸뉴라민산 알도라제 (nanA) 및 시알산 투과효소 (nanT)를 코딩하는 전체 N-아세틸뉴라민산 이화 유전자 클러스터를 이. 콜라이 균주 BL21 (DE3) 균주의 게놈으로부터 결실시켰다. 또한, 유전자 wzxC-wcaJ를 결실시켰다. WcaJ는 콜라닌산 합성에서 제1 단계를 촉매하는 UDP-글루코스:운데카프레닐 포스페이트 글루코스-1-포스페이트 트랜스퍼라제를 코딩한다 (Stevenson et al., J. Bacteriol. 1996, 178:4885-4893). 게다가, L-푸코스 이소머라제 및 L-푸쿨로스 키나제를 각각 코딩하는 유전자 fucIfucK를 제거하였다.
이종 유전자의 게놈 통합은 전위(transposition)에 의해 수행하였다. EZ-Tn5™ 트랜스포사제 (에피센터(Epicentre), 미국)를 사용하여 선형 DNA-단편을 통합하거나 매리너(mariner) 트랜스포사제 Himar1의 과활성 C9-돌연변이체 (Lampe et al., Proc. Natl. Acad. Sci. 1999, USA 96:11428-11433)를 전위에 이용하였다. EZ-Tn5 트랜스포솜을 생산하기 위해, 관심 유전자를 FRT-부위 플랭킹된 항생제 내성 마커와 함께 프라이머 1119 및 1120으로 증폭시켰고 (사용된 모든 프라이머는 하기 표 3에 열거됨); 생성된 PCR-생성물은 EZ-Tn5 트랜스포사제에 대한 19-bp 모자이크 말단(Mosaic End) 인식 부위를 두 부위 모두에 운반되었다. Himar1 트랜스포사제를 사용한 통합을 위해, 관심 발현 구축물 (오페론)을 FRT-부위 플랭킹된 항생제 내성 마커와 함께 pEcomar 벡터 내로 유사하게 클로닝하였다. pEcomar 벡터는 아라비노스 유도성 프로모터 ParaB의 제어 하에 매리너 트랜스포사제 Himar1의 과활성 C9-돌연변이체를 코딩한다. 발현 단편 <Ptet-lacY-FRT-aadA-FRT> (서열번호: 67)을 EZ-Tn5 트랜스포사제를 사용하여 통합하였다. 이. 콜라이 K12 TG1 (수탁번호 ABN72583)로부터의 락토스 내수송체 LacY에 대한 유전자의 성공적인 통합 후, 플라스미드 pCP20 상에 코딩된 FLP 레콤비나제에 의해 스트렙토마이신 내성 클론으로부터 내성 유전자가 제거되어 (Datsenko and Wanner, Proc. Natl. Acad. Sci. 2000, USA 97:6640-6645), 균주 #534를 생성하였다. 게다가, 단독 탄소 공급원으로서 수크로스 상에서 균주가 성장할 수 있게 하는, 수크로스 투과효소, 프럭토키나제, 수크로스 히드롤라제, 및 전사 리프레서에 대한 유전자 (각각 유전자 cscB, cscK, cscA, 및 cscR)를 포함하는 이. 콜라이 W (수탁번호 CP002185.1)의 csc-유전자 클러스를 게놈에 삽입하였다. 이 csc-클러스터를 플라스미드 pEcomar-cscABKR을 사용하여 전위에 의해 이. 콜라이 BL21(DE3) 균주의 게놈에 통합하였다. UDP-N-아세틸글루코사민의 데 노보 합성을 향상시키기 위해, L-글루타민:D-프럭토스-6-포스페이트 아미노트랜스퍼라제 (glmS), 이. 콜라이 K-12 substr. MG1655로부터 포스포글루코사민 뮤타제 (glmM) 및 이. 콜라이 K-12 substr. MG1655로부터 N-아세틸글루코사민-1-포스페이트 우리딜트랜스퍼라제/ 글루코사민-1-포스페이트 아세틸트랜스퍼라제 (glmU) (각각 수탁번호 NP_418185, NP_417643, NP_418186)를 코딩하는 유전자를 코돈-최적화하고 유전자 합성에 의해 수득하였다. 오페론 glmUM은 구성적 테트라시클린 프로모터 Ptet의 제어 하에 클로닝하였으며 한편 glmS는 구성적 PT5 프로모터 하에 클로닝하였다. 매리너-유사 요소 Himar1 트랜스포사제에 의해 특이적으로 인식된 역전된 말단 반복부에 의해 플랭킹된, 트랜스포손 카세트 <Ptet-glmUM-PT5-glmS-FRT-dhfr-FRT> (서열번호: 68)는 pEcomar-glmUM-glmS로부터 삽입되었다. 전체적으로 보아, 기재된 게놈 변형은 균주 개발을 위한 섀시(chassis)를 나타내는, 이. 콜라이 BL21(DE3) 균주 #942로 이어졌다. 표 1, 표 2 및 표 3은 클로닝에 사용된 모든 균주, 올리고뉴클레오티드뿐만 아니라 본 연구에서 사용된 일반적인 플라스미드를 각각 포함한다.
균주 #942는 발현 카세트 <Ptet-glmSm-gna1-FRT-aacC1-FRT> (서열번호: 69), <Ptet-slr1975-FRT-cat-FRT> (서열번호: 70), <Ptet-neuBC-FRT-kan-FRT> (서열번호: 71) 및 <Ptet-ppsA-FRT-aad1-FRT> (서열번호: 72)의 게놈 통합에 의해 시알산의 생산을 위해 변형되었다. 이. 콜라이에서의 발현을 위해 모든 유전자를 코돈-최적화하고 진스크립트(GenScript) 협력에 의해 합성적으로 제조하였다. GlmSm은 GlmS의 돌연변이화된 버전을 나타내므로, 글루코사민-6-포스페이트에 의한 피드백 억제를 제거한다. 유전자 gna1은 사카로마이세스 세레비지아에로부터 유래된 글루코사민-6-포스페이트 아세틸트랜스퍼라제를 코딩한다. 유전자를 구성적 프로모터 Ptet 뒤에 오페론으로서 서브클로닝하고 프라이머 glmSm/gna1_1-8을 사용하여 FRT-부위 플랭킹된 젠타마이신 내성 유전자에 융합시켰다. 유사하게, 둘 다 캄필로박터 제주니(Campylobacter jejuni)로부터 유래된, 시알산 신타제를 코딩하는 유전자 neuB (수탁번호 AF305571) 및 UDP-N-아세틸글루코사민-2-에피머라제를 코딩하는 유전자 neuC (수탁번호 AF305571)를, 구성적 프로모터 Ptet 뒤에 오페론으로서 서브클로닝하고 프라이머 neuBC_1-6을 사용하여 FRT-부위 플랭킹된 카나마이신 내성 유전자에 융합시켰다. 또한 구성적 프로모터 Ptet 뒤에 클로닝되고 프라이머 slr_1-4를 사용하여 FRT-부위 플랭킹된 클로람페니콜 내성 유전자에 융합된 유전자 slr1975 (수탁번호 BAL35720)는, 시네코시스티스(Synechocystis) 종 PCC6803으로부터 N-아세틸글루코사민 2-에피머라제를 코딩한다. 이. 콜라이 BL21(DE3)의 포스포에놀피루베이트 신타제를 코딩하는 유전자 ppsA (수탁번호 ACT43527)를 구성적 발현을 위해 유사하게 클로닝하고 프라이머 ppsA_1-4를 사용하여 FRT-부위 플랭킹된 스트렙토마이신 내성 유전자에 융합시켰다. 게놈 통합은 최종적으로 Neu5Ac 생산 균주 #1363을 야기하였으며, 이는 시알릴트랜스퍼라제 1 내지 26의 스크리닝에 사용되었다.
사용된 박테리아 균주의 목록.
균주 유전자형 참조
이. 콜라이 BL21(DE3) F- ompT hsdSB(rB-, mB-) gal dcm (DE3) 메르크 카게아(Merck KgaA), 독일 다름슈타트
이. 콜라이 BL21(DE3) #287 이. 콜라이 BL21(DE3) ΔlacZ 본 연구
이. 콜라이 BL21(DE3) #534 galETKM, lacy의 게놈 통합을 보유하는 이. 콜라이 BL21(DE3) ΔlacZ Δara ΔwcaJ ΔfucIK ΔnagAB 본 연구
이. 콜라이 BL21(DE3) #942 galETKM, lacy, cscBKAR, glmUM-glmS-dhfr의 게놈 통합을 보유하는 이. 콜라이 BL21(DE3) ΔlacZ Δara ΔwcaJ ΔfucIK ΔnagAB ΔnanKETA::zeo 본 연구
이. 콜라이 BL21(DE3) #1363 galETKM, lacy, cscBKAR, glmUM-glmS-dhfr, glmSm-gna1-aacC1, slr1975-cat, neuBC-kan, ppsA-aad1의 게놈 통합을 보유하는 이. 콜라이 BL21(DE3) ΔlacZ Δara ΔwcaJ ΔfucIK ΔnagAB ΔnanKETA::zeo 본 연구
이. 콜라이 BL21(DE3) #1730 galETKM, lacy, cscBKAR, glmUM-glmS-dhfr, neuA-nanT-kan의 게놈 통합을 보유하는 이. 콜라이 BL21(DE3) ΔlacZ Δara ΔwcaJ ΔfucIK ΔnagAB ΔnanKETA::zeo 본 연구
이. 콜라이 BL21(DE3) #2130 galETKM, lacY, lgtA-galT-kan, glmUM-glmS-dhfr, wbdO-galE-cat, neuA-nanT-aacC1의 게놈 통합을 보유하는 이. 콜라이 BL21(DE3) ΔlacZ Δara ΔwcaJ ΔfucIK ΔnagAB ΔnanKETA 본 연구
PCR에 사용된 올리고뉴클레오티드의 목록
프라이머 서열 5'-3' 서열번호:
1119 P-CTGTCTCTTATACACATCTCCTGAAATTGGCCA GATGATTAATTCCTAATTTTTGTTG 74
1120 P-CTGTCTCTTATACACATCTCAGCATTACACGTC TTGAGCGATTGTGTAGG 75
slr_1 CCTGACGACGGTGAGCGATCATTTGTATATCTCCTTCTTAAAGTTAAACAAAATTATTTC 76
slr_2 AACCCTGCAACTGCCGGTCTCTTAAAATAACTAGCATAACCCCTTGGGGCCTCTAAACG 77
slr_3 AACTTTAAGAAGGAGATATACAAATGATCGCTCACCGTCGTCAGGAACTGGCTCAACAG 78
slr_4 AGGCCCCAAGGGGTTATGCTAGTTATTTTAAGAGACCGGCAGTTGCAGGGTTTCGGC 79
glmSm/gna1_1 GCCCCAAGGGGTTATGCTAGTTATTTTATTCCACGGTCACGGATTTCGCCAGGTTACGCGGC 80
glmSm/gna1_2 AGCACCAACGATACCGCACATTTGTATATCTCCTTCTTAAAGTTAAACAAAATTATTTCTAG 81
glmSm/gna1_3 GCGAAATCCGTGACCGTGGAATAAAATAACTAGCATAACCCCTTGGGGCCTCTAAACGGGTC 82
glmSm/gna1_4 CTTTAAGAAGGAGATATACAAATGTGCGGTATCGTTGGTGCTATCGCACAGCGTGATG 83
glmSm/gna1_5 CGTGGAAATGCAAATTAGAAAATAGAATAACTAGCATAACCCCTTGGGGCCTCTAAACGG 84
glmSm/gna1_6 TATAAAATCCATCGGGTAAGCTCATGGTTCTATCTCCTTCGTTATTCCACGGTCACGGATTTCG 85
glmSm/gna1_7 ATCCGTGACCGTGGAATAACGAAGGAGATAGAACCATGAGCTTACCCGATGGATTTTATATAAGG 86
glmSm/gna1_8 CCGTTTAGAGGCCCCAAGGGGTTATGCTAGTTATTCTATTTTCTAATTTGCATTTCCACG 87
ppsA_1 CTGGTTAAGCCTGGCTGAACTGAAGAAATAAAATAACTAGCATAACCCCTTGGGGCCTC 88
ppsA_2 TAGAGGCCCCAAGGGGTTATGCTAGTTATTTTATTTCTTCAGTTCAGCCAGGCTTAACC 89
ppsA_3 TTTGTTTGGCGTCGAGAAGGAGATAGAACCATGTCCAACAATGGCTCGTCACCGCTGGTG 90
ppsA_4 AAGCACCAGCGGTGACGAGCCATTGTTGGACATGGTTCTATCTCCTTCTCGACGCCAAAC 91
neuBC_1 CTACCCAGAAAGTGTTCAAAGATATTAAATAAAATAACTAGCATAACCCCTTGGGGCCTC 92
neuBC_2 TTTAGAGGCCCCAAGGGGTTATGCTAGTTATTTTATTTAATATCTTTGAACACTTTCTGGG 93
neuBC_3 GATGATGATGTTCTGGATTTTGATTTCTTTCATTTGTATATCTCCTTCTTAAAGTTAAAC 94
neuBC_4 TTTGTTTAACTTTAAGAAGGAGATATACAAATGAAAGAAATCAAAATCCAGAACATCATC 95
neuBC_5 AGCTGTCTTATGAAGATTTCGCCTAATCGAAGGAGATACAACCATGAAGAAAATTCTGTTTATCACCGGC 96
neuBC_6 TGCCGGTGATAAACAGAATTTTCTTCATGGTTGTATCTCCTTCGATTAGGCGAAATCTTCATAAGACAGC 97
neuA/nanT_1 TAATTTTGTTTAACTTTAAGAAGGAGATATACATGAGCCTGGCCATTATCCCGGCACGTG 98
neuA/nanT_2 TGCCGGGATAATGGCCAGGCTCATGTATATCTCCTTCTTAAAGTTAAACAAAATTATTTC 99
neuA/nanT_3 AAAATAAGAGCTCGAGTCGAAGGAGATAGAACCATGAGTACTACAACCCAGAATATCCCG 100
neuA/nanT_4 TAGTACTCATGGTTCTATCTCCTTCGACTCGAGCTCTTATTTTTTCCAGATCTGTTCCAC 101
neuA/nanT_5 AAAACGATTTAGTCAAAACCAAAAGTTAATAAATCGATACTAGCATAACCCCTTGGGGCC 102
neuA/nanT_6 AAGGGGTTATGCTAGTATCGATTTATTAACTTTTGGTTTTGACTAAATCGTTTTTG 103
6192 nst-neuA attB1 GGGGACAAGTTTGTACAAAAAAGCAGGCTAGAAGGAGGTATACAAATGGGCCTGAAAAAAGCCTGCCTGACCG 104
6193 cst-neuA attB1 GGGGACAAGTTTGTACAAAAAAGCAGGCTAGAAGGAGATATACAAATGACCCGCACCCGTATGGAAAACGAACTG 105
6194 siaT-neuA attB2 GGGGACCACTTTGTACAAGAAAGCTGGGTTTATTTTTTCCAGATCTGTTCCACTTTTTTCAG 106
6559 siaT3 for AAAAAGCAGGCTAGAAGGAGGTATACAAATGGGCAAAAAAGTGATTATTGCGGGCAACGGCCCGAGCC 107
6560 siaT3 rev AGGCTCATAATTGTACCTCCTTCGAGGTTTAGTTGATGTTTTTGCTGAATTTGCCATACGCTTCGC 108
6561 neuA (siaT3) for TGGCAAATTCAGCAAAAACATCAACTAAACCTCGAAGGAGGTACAATTATGAGCCTGGCCATTATCCC 109
6562 pDest (siaT3) rev TGCCCGCAATAATCACTTTTTTGCCCATTTGTATACCTCCTTCTAGCCTGCTTTTTTGTACAAACTTG 110
6563 siaT4 for AAAAGCAGGCTAGAAGGAGGTATACAAATGAATAAGAAACCGCTGATTATTGCTGGCAACGGGCC 111
6564 siaT4 rev AGGCTCATAATTGTACCTCCTTCGAGGTTTATCTCTTCAGGAATGCTTTAATGATTGACTTTAGCGCC 112
6565 neuA (siaT4) for ATCATTAAAGCATTCCTGAAGAGATAAACCTCGAAGGAGGTACAATTATGAGCCTGGCCATTATC 113
6566 pDest (siaT4) rev AGCAATAATCAGCGGTTTCTTATTCATTTGTATACCTCCTTCTAGCCTGCTTTTTTGTACAAACTTGTG 114
6567 siaT5 for AAAAGCAGGCTAGAAGGAGGTATACAAATGGGGACCATTAAAAAGCCCTTAATCATAGCAGGAAATGG 115
6568 siaT5 rev AGGCTCATAATTGTACCTCCTTCGAGGTTTATGCAGCTCCCCAACGGAAACTAACTTTTAATGTTGGG 116
6569 neuA (siaT5) for TAGTTTCCGTTGGGGAGCTGCATAAACCTCGAAGGAGGTACAATTATGAGCCTGGCCATTATCCCGGC 117
6570 pDest (siaT5) rev ATTAAGGGCTTTTTAATGGTCCCCATTTGTATACCTCCTTCTAGCCTGCTTTTTTGTACAAACTTGTG 118
6748 siaT6 for AAAAGCAGGCTAGAAGGAGGTATACAAATGAGTGAAGAAAACACCCAGTCCATTATTAAAAACGAC 119
6749 siaT6 rev AGGCTCATAATTGTACCTCCTTCGAGGTTCAGACAGCAATACAGACACCCGTTTCGCAATTCGGCAGG 120
6750 neuA (siaT6) for AAACGGGTGTCTGTATTGCTGTCTGAACCTCGAAGGAGGTACAATTATGAGCCTGGCCATTATCCCG 121
6751 pDest (siaT6) rev ATGGACTGGGTGTTTTCTTCACTCATTTGTATACCTCCTTCTAGCCTGCTTTTTTGTACAAACTTGTG 122
6752 siaT7 for AAAAGCAGGCTAGAAGGAGGTATACAAATGACCATTTACCTGGACCCGGCGTCTCTGCCGACCC 123
6753 siaT7rev AGGCTCATAATTGTACCTCCTTCGAGGTTTACAGTTGTTTCAGAGAATCCCAGAAGATAATTTGGC 124
6754 neuA (siaT7) for TTCTGGGATTCTCTGAAACAACTGTAAACCTCGAAGGAGGTACAATTATGAGCCTGGCCATTATCCC 125
6755 pDest (siaT7) rev ACGCCGGGTCCAGGTAAATGGTCATTTGTATACCTCCTTCTAGCCTGCTTTTTTGTACAAACTTGTG 126
6483 siaT8 for AAAGCAGGCTAGAAGGAGGTATACAAATGGGCTGTAATAGCGACTCCAACCACAACAACTCCGACGG 127
6484 siaT8 rev AGGCTCATAATTGTACCTCCTTCGAGGTTTATTGCAGGTCCGAGATCAGTTTCACATCATTACGG 128
6485 neuA (siaT8) for TGAAACTGATCTCGGACCTGCAATAAACCTCGAAGGAGGTACAATTATGAGCCTGGCCATTATCCC 129
6486 pDest (siaT8) rev TGGTTGGAGTCGCTATTACAGCCCATTTGTATACCTCCTTCTAGCCTGCTTTTTTGTACAAACTTGTG 130
6487 siaT9 for AAAGCAGGCTAGAAGGAGGTATACAAATGAACAACGACAACTCCACGACCACCAACAATAACGC 131
6488 siaT9 rev CTCATAATTGTACCTCCTTCGAGGTTTAAATGTCAGAGATCAGTTTAATATTATCGCGGTTAATCAG 132
6489 neuA (siaT9) for ATATTAAACTGATCTCTGACATTTAAACCTCGAAGGAGGTACAATTATGAGCCTGGCCATTATCCCG 133
6490 pDest (siaT9) rev TGGTCGTGGAGTTGTCGTTGTTCATTTGTATACCTCCTTCTAGCCTGCTTTTTTGTACAAACTTGTG 134
6491 siaT10 for AAAGCAGGCTAGAAGGAGGTATACAAATGAAAACGATTACCCTGTATCTGGACCCGGCGTCCCTGCC 135
6492 siaT10 rev AGGCTCATAATTGTACCTCCTTCGAGGTTTACAGCTGTTTCAGGCTGTCCCAAAAGATCACTTGCG 136
6493 neuA (siaT10) for TTTGGGACAGCCTGAAACAGCTGTAAACCTCGAAGGAGGTACAATTATGAGCCTGGCCATTATCCCG 137
6494 pDest (siaT10) rev TCCAGATACAGGGTAATCGTTTTCATTTGTATACCTCCTTCTAGCCTGCTTTTTTGTACAAACTTGTG 138
6495 siaT11 for AAAGCAGGCTAGAAGGAGGTATACAAATGAAAAAGATCCTGACCGTCCTGAGCATCTTTATCCTGAGC 139
6496 siaT11 rev AGGCTCATAATTGTACCTCCTTCGAGGTTTAGTCCAGCATCGTACCGAAGTCATCCGGTTTGGTGTGG 140
6497 neuA (siaT11) for ATGACTTCGGTACGATGCTGGACTAAACCTCGAAGGAGGTACAATTATGAGCCTGGCCATTATCCCG 141
6498 pDest (siaT11) rev TGCTCAGGACGGTCAGGATCTTTTTCATTTGTATACCTCCTTCTAGCCTGCTTTTTTGTACAAACTTGTG 142
6503 siaT13 for AAAGCAGGCTAGAAGGAGGTATACAAATGACGAATCGCAAAATCTATGTCTGCCACACCCTGTACC 143
6504 siaT13 rev AGGCTCATAATTGTACCTCCTTCGAGGTTTATTTAATGTCTTTCAGATCAACCAGCGTAATTTTCTTGTC 144
6505 neuA (siaT13) for TGGTTGATCTGAAAGACATTAAATAAACCTCGAAGGAGGTACAATTATGAGCCTGGCCATTATCCC 145
6506 pDest (siaT13) rev AGACATAGATTTTGCGATTCGTCATTTGTATACCTCCTTCTAGCCTGCTTTTTTGTACAAACTTGTG 146
6507 siaT14 for AAAGCAGGCTAGAAGGAGGTATACAAATGTTCCGTGAAGACAATATGAACCTGATTATCTGCTGTACG 147
6508 siaT14 rev AGGCTCATAATTGTACCTCCTTCGAGGTTTAGATGTCGATAACTTTGATACCGAAATCTTTCAGG 148
6509 neuA (siaT14) for TCGGTATCAAAGTTATCGACATCTAAACCTCGAAGGAGGTACAATTATGAGCCTGGCCATTATCCCG 149
6510 pDest (siaT14) rev AGGTTCATATTGTCTTCACGGAACATTTGTATACCTCCTTCTAGCCTGCTTTTTTGTACAAACTTGTG 150
6511 siaT15 for AAAGCAGGCTAGAAGGAGGTATACAAATGAAAGAAATCGCCATCATCTCCAACCAACGCATGTTCTTCC 151
6512 siaT15 rev AGGCTCATAATTGTACCTCCTTCGAGGTTTAGTCAAAGAAATCCAGCAGTTTCGGATGCACCGCGGTGC 152
6513 neuA (siaT15) for TCCGAAACTGCTGGATTTCTTTGACTAAACCTCGAAGGAGGTACAATTATGAGCCTGGCCATTATCCC 153
6514 pDest (siaT15) rev TTGGAGATGATGGCGATTTCTTTCATTTGTATACCTCCTTCTAGCCTGCTTTTTTGTACAAACTTGTG 154
6515 siaT16 for AAAGCAGGCTAGAAGGAGGTATACAAATGCTGATTCAACAGAACCTGGAAATCTACCTGGACTACGC 155
6516 siaT16 rev AGGCTCATAATTGTACCTCCTTCGAGGTTTAATTGTGAATGGTGCACATAAACGCCTGATCTTCGTTG 156
6517 neuA (siaT16) for AGGCGTTTATGTGCACCATTCACAATTAAACCTCGAAGGAGGTACAATTATGAGCCTGGCCATTATCC 157
6518 pDest (siaT16) rev ATTTCCAGGTTCTGTTGAATCAGCATTTGTATACCTCCTTCTAGCCTGCTTTTTTGTACAAACTTGTG 158
6519 siaT17 for AAAGCAGGCTAGAAGGAGGTATACAAATGGGCTGTAACTCCGATAGCAAACACAATAACAGTGATGGC 159
6520 siaT17 rev AGGCTCATAATTGTACCTCCTTCGAGGTTTATTGCAGGTCACTAATCAGTTTCACATCATTGCGG 160
6521 neuA (siaT17) for TGAAACTGATTAGTGACCTGCAATAAACCTCGAAGGAGGTACAATTATGAGCCTGGCCATTATCCCGG 161
6522 pDest (siaT17) rev TGTTTGCTATCGGAGTTACAGCCCATTTGTATACCTCCTTCTAGCCTGCTTTTTTGTACAAACTTGTG 162
6523 siaT18 for AAAGCAGGCTAGAAGGAGGTATACAAATGTGTAACGATAATCAAAATACGGTCGATGTTGTTGTGAGC 163
6524 siaT18 rev AGGCTCATAATTGTACCTCCTTCGAGGTTTAATACTGAGCAATACAAACACCCGAGGAACAATCCGGC 164
6525 neuA (siaT18) for TCGGGTGTTTGTATTGCTCAGTATTAAACCTCGAAGGAGGTACAATTATGAGCCTGGCCATTATCCC 165
6526 pDest (siaT18) rev ACCGTATTTTGATTATCGTTACACATTTGTATACCTCCTTCTAGCCTGCTTTTTTGTACAAACTTGTG 166
6807 siaT19 for AAAAGCAGGCTAGAAGGAGGTATACAAATGAACGATAATCAAAATACGGTGGACGTGGTGGTCTC 167
6808 siaT19 rev AGGCTCATAATTGTACCTCCTTCGAGGTTTAGCACCAGAACAGCACATCTTTTTCTTTCACAATGCC 168
6809 neuA (siaT19) for AAAAAGATGTGCTGTTCTGGTGCTAAACCTCGAAGGAGGTACAATTATGAGCCTGGCCATTATCCCG 169
6810 pDest (siaT19) rev TCCACCGTATTTTGATTATCGTTCATTTGTATACCTCCTTCTAGCCTGCTTTTTTGTACAAACTTGTG 170
6811 siaT20 for AAAAGCAGGCTAGAAGGAGGTATACAAATGCAAAACGTCATTATCGCTGGTAACGGTCCGAGCCTGC 171
6812 siaT20 rev AGGCTCATAATTGTACCTCCTTCGAGGTTTATTTCTTTTTGTATTCTTTCTTCAGTTTTTTGATTTCG 172
6813 neuA (siaT20) for TGAAGAAAGAATACAAAAAGAAATAAACCTCGAAGGAGGTACAATTATGAGCCTGGCCATTATCCCGG 173
6814 pDest (siaT20) rev TTACCAGCGATAATGACGTTTTGCATTTGTATACCTCCTTCTAGCCTGCTTTTTTGTACAAACTTGTG 174
6815 siaT21 for AAAAGCAGGCTAGAAGGAGGTATACAAATGGATTCTTCGCCGGAAAACACCAGCTCTACGCTGG 175
6816 siaT21 rev AGGCTCATAATTGTACCTCCTTCGAGGTTTATTTGATGTCCGTCGTAAAGCGCACTTTTTCGTCCG 176
6817 neuA (siaT21) for TGCGCTTTACGACGGACATCAAATAAACCTCGAAGGAGGTACAATTATGAGCCTGGCCATTATCCCG 177
6818 pDest (siaT21) rev TGGTGTTTTCCGGCGAAGAATCCATTTGTATACCTCCTTCTAGCCTGCTTTTTTGTACAAACTTGTG 178
6652 siaT22 for AAAAGCAGGCTAGAAGGAGGTATACAAATGAAGAAAGTCTACTTCTGCCATACGGTCTACCATCTGC 179
6653 siaT22 rev AGGCTCATAATTGTACCTCCTTCGAGGTTTAACTATTTGCTTTCATTTGTTTCAGGGTGATTTTC 180
6654 neuA (siaT22) for TGAAACAAATGAAAGCAAATAGTTAAACCTCGAAGGAGGTACAATTATGAGCCTGGCCATTATCCCG 181
6655 pDest (siaT22) rev TATGGCAGAAGTAGACTTTCTTCATTTGTATACCTCCTTCTAGCCTGCTTTTTTGTACAAACTTGTG 182
6819 siaT24 for AAAGCAGGCTAGAAGGAGGTATACAAATGCGTAAAATCATCACCTTCTTCAGCCTGTTCTTCTCG 183
6820 siaT24 rev AGGCTCATAATTGTACCTCCTTCGAGGTTTAAAAGTTAATCGGGTTCGGCATTTCTTCAAAGAAAATCTG 184
6821 neuA (siaT24) for AAATGCCGAACCCGATTAACTTTTAAACCTCGAAGGAGGTACAATTATGAGCCTGGCCATTATCCCG 185
6822 pDest (siaT24) rev TGAAGAAGGTGATGATTTTACGCATTTGTATACCTCCTTCTAGCCTGCTTTTTTGTACAAACTTGTG 186
실시예 2: 락토스를 수용체로서 사용하나 시알산의 외인성 첨가를 필요로 하는 시알릴트랜스퍼라제의 생체내 스크리닝을 가능하게 하는 이. 콜라이 균주의 개발
에쉐리키아 콜라이 BL21(DE3) 균주 #942를 사용하여 플라스미드 코딩된 시알릴트랜스퍼라제 27 내지 100에 대한 스크리닝 균주를 구축하였다. 따라서, 시알산의 흡수 및 뉴클레오티드-활성화를 가능하게하기 위해, 유전자 nanTneuA 각각이 통합하였다. 이. 콜라이 Neu5Ac 주요 촉진자(facilitator) 슈퍼패밀리 수송체를 코딩하는 nanT 유전자 (수탁번호 B21_03035)는, 이. 콜라이 BL21(DE3)의 게놈 DNA로부터 증폭되었고, 캄필로박터 제주니로부터 유래된 neuA 유전자 (수탁번호 AF305571)를 코돈-최적화하고 유전자 합성에 의해 수득하였다. 유전자를 구성적 테트라시클린 프로모터 Ptet의 제어 하에 오페론으로서 클로닝하였으며 생성된 발현 단편 <Ptet-neuA-nanT-lox66-kan-lox72> (서열번호: 73)은 EZ-Tn5 트랜스포사제를 사용하여 통합되어, 스크리닝 균주 #1730을 산출하였다.
사용된 통상적인 플라스미드의 목록
플라스미드 관련 유전자형 참조
pCP20 rep, FLP, bla, cat Datsenko and Wanner, 2002
pEcomar-cscABKR 벡터 pEcomar 내로 통합된 이. 콜라이 W cscB, cscK, cscA, 및 cscR; bla 본 연구
pEcomar-glmUM-glmS 벡터 pEcomar 내로 통합된 에쉐리키아 콜라이 K12의 glmU, glmM glmS; dhfr, bla 본 연구
pEcomar-lgtA-galT 벡터 pEcomar 내로 통합된 나이세리아 메닝기티디스(Neisseria meningitides)의 lgtA 및 에쉐리키아 콜라이 K12의 galT; kan, bla 본 연구
pEcomar-wbdO-galE 살모넬라 엔테리카(Salmonella enterica) 아종 살라메(salamae) 혈청형(serovar) 그린사이드(Greenside) wbdO 벡터 pEcomar 내로 통합된 에쉐리키아 콜라이 K12의 galE; cat, bla 본 연구
pDEST14 bla, cat, ccdB 써모 피셔 사이언티픽(Thermo Fisher Scientific), 미국 매사추세츠주 월섬
실시예 3: 시알릴트랜스퍼라제를 코딩하는 플라스미드 수집의 생성
특성화 또는 추정 시알릴트랜스퍼라제의 유전자 서열은 문헌 및 공개 데이터베이스로부터 수령하였다. 시알릴트랜스퍼라제는 그의 신호 펩티드가 결실될 때 보다 높은 활성을 나타내는 것으로 종종 기재되기 때문에, 본 발명자들은 온라인 예측 툴(tool) 시그널(Signal)P에 의해 상응하는 단백질 서열을 분석하였다 (Petersen et al., Nature Methods, 2011 Sep 29;8(10):785-6). 유전자는 주석이 달린 바와 같이, 전장 형태로 또는, 신호 펩티드가 예측될 때, N-말단 신호 펩티드가 없는 말단절단된 변이체로서, 진스크립트 협력에 의해 합성적으로 합성되었다 (표 4).
시알릴트랜스퍼라제 1 내지 26을 유전자 특이적 프라이머 (표 2)를 사용하여 SLIC에 의해 pDEST14로 neuA를 가진 오페론으로서 각각 서브클로닝하여, pDEST14-siaT-neuA의 일반적인 종류의 플라스미드를 산출하였다. 나머지 시알릴트랜스퍼라제 27 내지 100은 제한 부위 NdeI 및 BamHI를 사용하여 플라스미드 pET11a로 진스크립트 협력에 의해 직접 서브클로닝하였다. 두 발현 시스템 모두 IPTG-유도성 유전자 발현을 허용한다 (도 2). 생체내 활성 스크리닝을 위해, 플라스미드를 균주 #1363 또는 #1730으로 형질전환시켰으며, 한편 이. 콜라이 BL21 (DE3) 야생형 또는 그의 lacZ-결핍 변이체 (균주 #287)를 시험관내 검정에 사용하였다.
시알릴트랜스퍼라제-코딩 플라스미드의 목록
플라스미드 시알릴트랜스퍼라제 유전자의 기원 시알릴트랜스퍼라제 유전자의 수탁 번호 전장 (FL) 유전자로서 또는 신호 펩티드 (Δ) 없이 클로닝됨
pDEST14-siaT1-neuA 나이세리아 메닝기티디스 U60660 FL (서열번호: 5)
pDEST14-siaT2-neuA 캄필로박터 제주니 균주 OH4384 AF130466 FL (서열번호: 10)
pDEST14-siaT3-neuA 캄필로박터 제주니 균주 OH4384 AX934425 FL (서열번호: 12)
pDEST14-siaT4-neuA 헬리코박터 악시노니치스 (Helicobacter acinonychis) NC_008229 FL (서열번호: 11)
pDEST14-siaT5-neuA 헬리코박터 악시노니치스 NC_008229 FL (서열번호: 33)
pDEST14-siaT6-neuA 포토박테리움 종 JT-ISH-224 BAF92026 Δ17 (서열번호: 29)
pDEST14-siaT7-neuA 파스퇴렐라 다그마티스 (Pasteurella dagmatis) 균주 DSM 22969 AFY98851 FL (서열번호: 7)
pDEST14-siaT8-neuA 포토박테리움 종 JT-ISH-224 BAF92025 Δ20 (서열번호: 3)
pDEST14-siaT9-neuA 비브리오(Vibrio) 종 JT-FAJ-16 BAF91160 Δ22 (서열번호: 2)
pDEST14-siaT10-neuA 파스퇴렐라 물토시다 (Pasteurella multocida) PM70 AAK02272 Δ25 (서열번호: 4)
pDEST14-siaT11-neuA 포토박테리움 담셀라에(Photobacterium damselae) JT0160 BAA25316 FL (서열번호: 31)
pDEST14-siaT13-neuA 스트렙토코쿠스 아갈락치아에(Streptococcus agalactiae) AB050723 FL (서열번호: 17)
pDEST14-siaT14-neuA 하에모필루스-솜누스(Haemophilus-somnus)-2336 ACA31578 FL (서열번호: 26)
pDEST14-siaT15-neuA 하에모필루스 두크레이이(Haemophilus ducreyi) 35000HP AF101047 FL (서열번호: 14)
pDEST14-siaT16-neuA 하에모필루스 두크레이이 35000HP AAP95068 FL (서열번호: 27)
pDEST14-siaT17-neuA 포토박테리움 포스포레움 (Photobacterium phosphoreum) JT-ISH-467 BAF63530 Δ20 (서열번호: 8)
pDEST14-siaT18-neuA 포토박테리움 레이오그나티 (Photobacterium leiognathi) JT-SHIZ-119 AB500947 Δ15 (서열번호: 28)
pDEST14-siaT19-neuA 포토박테리움 레이오그나티 JT-SHIZ-145 BAF91416 Δ15 (서열번호: 30)
pDEST14-siaT20-neuA 캄필로박터 콜라이(Campylobacter coli) YP_008473374 FL (서열번호: 1)
pDEST14-siaT21-neuA 비브리오 하베이이(Vibrio harveyi) WP_017817635 Δ24 (서열번호: 21)
pDEST14-siaT22-neuA 스트렙토코쿠스 엔테리쿠스(Streptococcus entericus) WP_018369230 FL (서열번호: 13)
pDEST14-siaT24-neuA 아비박테리움 파라갈리나룸(Avibacterium paragallinarum) WP_021724759 FL (서열번호: 9)
pET11a-siaT30 하에모필루스 파라하에몰리티쿠스(Haemophilus parahaemolyticus) HK385 EIJ71207 FL (서열번호: 19)
pET11a-siaT31 알리스티페스(Alistipes) 종 CAG:268 CDC95697 Δ17 (서열번호: 22)
pET11a-siaT32 알리스티페스 종 AL-1 WP_032134786 FL (서열번호: 15)
pET11a-siaT34 파스퇴렐라 물토시다 PM70 NC_002663 FL (서열번호: 6)
pET11a-siaT37 캄필로박터 제주니 균주 81-176 AAL09368 FL (서열번호: 16)
pET11a-siaT39 알리스티페스 샤히이(Alistipes shahii) WAL 8301 YP_007816735 Δ21 (서열번호: 23)
pET11a-siaT41 악티노바실루스 수이스(Actinobacillus suis) ATCC 33415 AIJ32009 FL (서열번호: 24)
pET11a-siaT42 악티노바실루스 캡술라투스(Actinobacillus capsulatus) DSM 19761 WP_018652686 FL (서열번호: 25)
pET11a-siaT43 비베르스테이니아 트레할로시(Bibersteinia trehalosi) USDA-ARS-USMARC-189 AHG84654 FL (서열번호: 18)
pET11a-siaT51 포토박테리움 담셀라에 아종 담셀라에 CIP 102761 EEZ40509 FL (서열번호: 32)
pET11a-siaT73 하에모필루스 솜누스(Haemophilus somnus) 2336 ACA31170 FL (서열번호: 20)
시알릴트랜스퍼라제 1 내지 11, 13 내지 21 및 24는 캄필로박터 제주니의 neuA (수탁번호 AY102622)를 가진 오페론으로서 클로닝되었다. 시알릴트랜스퍼라제 30 내지 32, 34, 37, 39, 41, 42, 51 및 73의 클로닝은 부위 NdeI 및 BamHI를 통해 발생하였다. 시알릴트랜스퍼라제 유전자는 전장 구축물 (FL)로서 또는 예측된 신호 펩티드 (Δ) 없이 클로닝되었다. Δ 뒤의 숫자는 상응하는 서열로부터 결실된 N-말단 아미노산을 나타낸다.
실시예 4: 수용체 기질로서 락토스를 사용하여 α-2,3- 및 α-2,6-시알릴트랜스퍼라제의 동정 및 특성화
100개의 시알릴트랜스퍼라제를 코딩하는 플라스미드를 보유하는 에쉐리키아 콜라이 BL21(DE3) #1363 및 #1730를 2% (wt/vol) 글루코스, 암피실린 100 μg ml-1, 카나마이신 15 μg ml-1 및 제오신 40 μg ml-1이 보충된 20 ml의 미네랄 염 배지 (Samain et al., J. Biotech. 1999, 72:33-47)로 채워진 100 ml 진탕 플라스크에서 30℃에서 성장시켰다. 배양물이 0.1 내지 0.3의 OD600에 도달했을 때, 0.3 mM IPTG의 첨가에 의해 유전자 발현을 유도하였다. 1시간 동안 인큐베이션한 후, 1.5 mM 락토스를 #1363 배양물에 첨가하였고 한편 1.5 mM 락토스뿐만 아니라 1.5 mM 시알산을 #1730 배양물에 첨가하였다. 인큐베이션은 72 내지 96 시간 동안 계속하였다. 이어서, 세포를 원심분리에 의해 수확하고 유리 비드를 사용하여 규정된 부피로 기계적으로 파괴시켰다. 후속적으로, 샘플을 실리카 겔 60 F254 (메르크 카게아, 독일 다름슈타트) 상의 박층 크로마토그래피 (TLC)에 적용하였다. 부탄올: 아세톤: 아세트산:H2O (35/35/7/23 (v/v/v/v))의 혼합물을 이동상으로서 사용하였다. 분리된 물질을 검출하기 위해, TLC 플레이트를 티몰 시약 (95 ml 에탄올에 용해된 0.5 g 티몰, 5 ml 황산 첨가)으로 침지시키고 가열하였다.
결과는 표 5에 요약되어 있다. 전체 스크리닝에서, 32개의 유전자가 α-2,3-시알릴트랜스퍼라제를 코딩하여, 3'-SL을 생산하는 것으로 동정되었다. 19개의 효소가 6'-SL을 합성하였고 α-2,6-시알릴트랜스퍼라제로 서술되었다. α-2,3-뿐만 아니라 α-2,6-시알릴트랜스퍼라제 활성은 3개의 효소에 대해서만 관찰될 수 있을 것이다. 따라서, 46개의 효소의 발현은 시알릴락토스 형성을 결과하지 않았다. 스크리닝은, 광범위하게 특성화된 시알릴트랜스퍼라제, 예를 들어 SiaT1 (Gilbert et al., J Biol Chem. 1996 Nov 8;271(45):28271-6; Gilbert et al., Eur J Biochem. 1997 Oct 1;249(1):187-94), SiaT6 (Tsukamoto et al., J Biochem. 2008 Feb;143(2):187-97) 및 SiaT1 (Yamamoto et al., J Biochem. 1996 Jul;120(1):104-10)의 기재된 활성을 확인할 수 있었으므로, 매우 적합해 보였다. 생성물 형성과 관련하여, 실험 설정은 스크리닝된 효소의 반-정량적(semi-quantitative) 비교를 허용하였다. 그러나 그의 동역학적 특성에 대한 더 깊은 지식을 달성하기 위해, 잠재적으로 최상의 성능을 발휘하는 3개의 α-2,3- 및 α-2,6-시알릴트랜스퍼라제를 시험관내 검정에 적용하였다.
시알릴트랜스퍼라제 (SiaT)의 생성물 스펙트럼의 특성화.
SiaT # 시알릴락토-N-테트라오스의 시험관내 생산에 관한 시알릴트랜스퍼라제의 상대 효능 생체내 시알릴락토스의 생산 서열번호:
LST-a LST-b aa nt
1 2.98 x 103 n.d. 3'-SL 38 5
2 749 n.d. 3'-SL 43 10
3 605 n.d. 45 12
4 654 n.d. 44 11
5 n.d. 1 66 33
6 n.d. 300 6'-SL 62 29
7 2.25 x 103 n.d. 40 7
8 4.00 x 103 n.d. 36 3
9 8.39 x 103 n.d. 3'-SL 35 2
10 3.18 x 103 n.d. 3'-SL, 6'-SL 37 4
11 n.d. 13 64 31
13 24 n.d. 3'-SL 50 17
14 2 n.d. 3'-SL 59 26
15 204 n.d. 3'-SL 47 14
16 1 n.d. 3'-SL 60 27
17 1.24 x 103 n.d. 3'-SL 41 8
18 n.d. 303 6'-SL 61 28
19 n.d. 157 6'-SL 63 30
20 1.00 x 104 n.d. 3'-SL 34 1
21 12 n.d. 3'-SL 54 21
22 564 n.d. 3'-SL 46 13
24 835 n.d. 3'-SL 42 9
30 17 n.d. 3'-SL 52 19
31 4 n.d. 3'-SL 55 22
32 64 n.d. 3'-SL, 6'-SL 48 15
34 2.34 x 103 n.d. 3'-SL 39 6
37 40 n.d. 3'-SL 49 16
39 4 n.d. 3'-SL 56 23
41 3 n.d. 3'-SL 57 24
42 3 n.d. 3'-SL 58 25
43 21 n.d. 3'-SL 51 18
51 n.d. 10 6'-SL 65 32
73 15 n.d. 3'-SL 53 20
활성은 각각 글리칸 기질로서 락토스 또는 LNT를 사용하는 생체내 또는 시험관내 실험에 의해 결정되었다. 시알릴화 락토스의 동정은 박층 크로마토 그래피를 통해 정성적으로 발생하였다. LNT의 시알릴화 생성물은 LC-MS/MS를 통해 정량화하였다. 최상의 성능을 발휘하는 효소에 대한 LST-a 또는 -b의 상대적인 양이 도시되어 있다. (n.d.: 검출할 수 없음).
실시예 5: 수용체 기질로서 락토-N-테트라오스를 사용한 α-2,3- 및 α-2,6- 시알릴트랜스퍼라제의 동정 및 특성
100개의 시알릴트랜스퍼라제를 코딩하는 플라스미드를 보유하는 에쉐리키아 콜라이 BL21(DE3)를 암피실린 100 μg ml-1이 보충된 20 ml의 2YT 배지로 채워진 100 ml 진탕 플라스크에서 30℃에서 성장시켰다. 배양물이 0.1 내지 0.3의 OD600에 도달했을 때, 0.3 mM IPTG의 첨가에 의해 유전자 발현을 유도하고 12 내지 16 시간 동안 인큐베이션을 계속하였다. 세포를 원심분리에 의해 수확하고 유리 비드를 사용하여 규정된 부피의 50 mM Tris-HCl pH7.5로 기계적으로 파괴시켰다. 검정이 시작될 때까지 단백질 추출물을 얼음 위에 두었다. 시험관내 검정은 50 mM Tris-HCl pH7.5, 5 mM MgCl2, 10 mM CMP-Neu5Ac 및 5 mM LNT를 포함하여 총 부피 25 μl에서 수행하였다. 검정은 3 μl 단백질 추출물의 첨가로 시작하여 16시간 동안 계속하였다. 생성물 형성은 질량 분석법에 의해 결정하였다.
LC 삼중-사중극자 MS 검출 시스템을 사용하여 MRM (다중 반응 모니터링)에 의해 질량 분석법 분석을 수행하였다. 전구체 이온은 사중극자 1에서 선택되고 분석되고, CID 가스로서 아르곤을 사용하여 충돌 셀에서 단편화가 발생하고, 사중극자 3에서 단편 이온의 선택이 수행되었다. H2O (LC/MS 등급)로 배양 상청액 1:100의 희석 후에 락토스, 3'-시알릴락토스 및 6'-시알릴락토스의 크로마토그래피 분리를, 엑스브릿지(XBridge) 아미드 HPLC 칼럼 (3.5 μm, 2.1 × 50 mm (워터스(Waters), 미국)과 엑스브릿지 아미드 가드(guard) 카트리지 (3.5 μm, 2.1 × 10 mm) (워터스, 미국) 상에서 수행하였다. HPLC 시스템의 칼럼 오븐 온도는 50℃였다. 이동상은 10 mM 아세트산암모늄을 가진 아세토니트릴:H2O로 구성되었다. 1 μl 샘플을 기기에 주입하고; 400 μl/분의 유량으로 3.60분 동안 시행을 수행하였다. 3'-시알릴락토스 및 6'-시알릴락토스를 ESI 포지티브 이온화 모드에서 MRM에 의해 분석하였다. 질량 분석계는 단위 해상도에서 조작하였다. 시알릴락토스는 m/z 656.2 [M+Na]의 이온을 형성한다. 시알릴락토스의 전구체 이온은 충돌 셀에서 단편 이온 m/z 612.15, m/z 365.15 및 m/z 314.15로 추가로 단편화하였다. 충돌 에너지, Q1 및 Q3 프리 바이어스(Pre Bias)는 각각의 분석물에 대해 개별적으로 최적화되었다. H2O (LC/MS 등급)로 1:50 무입자(particle-free) 생체촉매-반응 또는 조 추출물 각각의 희석 후에 락토스, LNT-II, LNT 및 LST-a 또는 -b의 크로마토그래피 분리를, 엑스브릿지 아미드 HPLC 칼럼 (3.5 μm, 2.1 × 50 mm (워터스, 미국)과 엑스브릿지 아미드 가드 카트리지 (3.5 μm, 2.1 × 10 mm) (워터스, 미국) 상에서 수행하였다. 칼럼 오븐 온도는 35℃였다. 이동상은 0.1% 수산화암모늄을 가진 아세토니트릴:H2O로 구성되었다. 1 μl 샘플을 기기에 주입하고; 300 μl/분의 유량으로 3.50분 동안 시행을 수행하였다. 락토스, LNT-II, LNT뿐만 아니라 LST-a 및 -b는 ESI 네거티브 이온화 모드에서 MRM에 의해 분석하였다. 질량 분석계는 단위 해상도에서 조작하였다. 락토스는 m/z 341.00 [M-H]의 이온을 형성한다. 락토스의 전구체 이온은 충돌 셀에서 단편 이온 m/z 179.15, m/z 161.15 및 m/z 101.05로 추가로 단편화하였다. LNT-II는 m/z 544.20 [M-H]의 이온을 형성한다. LNT-II의 전구체 이온은 단편 이온 m/z 382.10, m/z 161.00 및 m/z 112.90으로 추가로 단편화하였다. LNT는 m/z 706.20 [M-H]의 이온을 형성한다. LNT의 전구체 이온은 단편 이온 m/z 382.10, m/z 202.10 및 m/z 142.00으로 추가로 단편화하였다. LST-a 및 -b는 m/z 997.20 [M-H]의 이온을 형성한다. LST-a 및 b의 전구체 이온은 단편 이온 m/z 290.15, m/z 202.15 및 m/z 142.15로 추가로 단편화하였다. 충돌 에너지, Q1 및 Q3 프리 바이어스는 각각의 분석물에 대해 개별적으로 최적화되었다. 시판되는 표준물 (카르보신쓰(Carbosynth), 영국 콤튼)을 사용하여 정량화 방법을 확립하였다.
시험관내 스크리닝의 결과는 표 5에 요약되어 있다. 28개의 유전자가 LST-a를 생산하는 것으로 동정되었으며, 한편 단지 6개의 효소가 LST-b를 합성하였다. 따라서, 66개의 효소의 발현은 LST-a 또는 LST-b의 형성을 결과하지 않았다. 검정은 LNT를 시알릴화하는 것으로 이미 기재된 SiaT1의 활성 (Gilbert et al., J Biol Chem. 1996 Nov 8;271(45):28271-6; Gilbert et al., Eur J Biochem. 1997 Oct 1;249(1):187-94)이 검증될 수 있기 때문에 정확한 것으로 간주된다. 단백질 과발현 수준에 관계 없이, 가장 잘 생산된 시알릴트랜스퍼라제는 K m V max 의 결정을 위해 선택되었다.
실시예 6: 선택된 시알릴트랜스퍼라제의 동역학적 특성의 특성화
최상의 성능을 발휘하는 시알릴트랜스퍼라제를 등급화하기 위해, 공여체 및 수용체 기질에 대한 그의 K m 값을 시험관내에서 결정하였다. 에쉐리키아 콜라이 BL21(DE3) 균주 #287을 효소의 과잉생산에 사용하였다. 세포는 0.3의 OD600에 도달 할 때까지 30℃에서 100 μg ml-1 암피실린이 보충된 진탕 플라스크에서 100 ml 2YT 배지에서 인큐베이션하였다. 이어서, 0.3 mM IPTG를 첨가하고 인큐베이션을 12 내지 16 시간 동안 계속하였다. 세포를 원심분리에 의해 수확하고 유리 비드를 사용하여 규정된 부피의 50 mM Tris-HCl pH7.5로 기계적으로 파괴시켰다. 검정이 시작될 때까지 단백질 추출물을 얼음 위에 두었다. 시험관내 검정은 50 mM Tris-HCl pH7.5, 5 mM MgCl2 및 다양한 농도의 CMP-Neu5Ac (0.05-30 mM)뿐만 아니라 락토스 또는 LNT (0.1-50 mM)를 포함하여 총 부피 50 μl에서 수행하였다. 검정은 35 내지 750 μg 단백질 추출물의 첨가로 시작하였다. 30℃에서 1 내지 10 분 동안 인큐베이션한 후, 검정을 95℃에서 5분 동안 불활성화하였다. 생성물 형성은 질량 분석법에 의해 결정하였다. 시그마플롯(SigmaPlot) v12.5의 효소 동역학 모듈을 사용하여 K m V max 를 계산하여 데이터를 평가하였다.
스크리닝 동안에, LST-α 생산을 위한 최상의 성능을 발휘하는 α-2,3-시알릴트랜스퍼라제는 SiaT8, SiaT9 및 SiaT20인 것으로 나타났다. 대조적으로, SiaT6, SiaT18 및 SiaT19는 시험된 α-2,6-시알릴트랜스퍼라제 중에서 LNT를 가장 효율적으로 시알릴화하는 것으로 관찰되었다. CMP-Neu5Ac 및 LNT뿐만 아니라 락토스에 대한 그의 동역학 파라미터는 표 6에 도시되어 있다. 단독으로 SiaT20은 미카엘리스-멘텐 속도론(Michaelis-Menten kinetic) 운동을 따르지 않는다.
공여체 기질로서 CMP-Neu5Ac 및 수용체 기질로서 LNT뿐만 아니라 락토스를 사용하는 선택된 시알릴트랜스퍼라제에 대한 K m V max .
활성 SiaT# CMP-Neu5Ac 락토스 LNT
    K m [mM] V max [μmol/min] K m [mM] V max [μmol/min] K m [mM] V max [μmol/min]
α2,3 SiaT8 4.0 0.35 4.3 0.37 4.2 0.32
  SiaT9 0.96 0.16 2.9 0.18 2.9 0.15
α2,6 SiaT6 2 0.16 5.6 0.20 5.5 0.13
SiaT18 2.8 0.21 7.6 0.21 5.2 0.14
  SiaT19 1.1 0.09 3 0.09 2.9 0.04
실시예 7: 수용체 기질로서 LNT를 사용하여 시알릴트랜스퍼라제의 생체내 활성을 스크리닝하기 위한 락토-N-테트라오스-생산 균주의 생성
에쉐리키아 콜라이 BL21(DE3) 균주 #534를 사용하여 락토-N-테트라오스 (LNT) 생산 균주를 구축하였다. 나이세리아 메닝기티디스 MC58 (수탁번호 NP_274923)로부터의 β-1,3-N-아세틸글루코사미닐트랜스퍼라제 유전자 lgtA를 이. 콜라이에서의 발현을 위해 코돈-최적화하고 유전자 합성에 의해 합성적으로 제조하였다. 이. 콜라이 K-12 substr. MG1655로부터 갈락토스-1-포스페이트 우리딜릴트랜스퍼라제를 코딩하는 유전자 galT (수탁번호 NP_415279)와 함께 (이는 유전자 합성에 의해 유사하게 수득하였다), lgtA를 플라스미드 pEcomar-lgtA-galT를 사용하여 전위 (서열번호: 188)에 의해 삽입하였다. UDP-N-아세틸-글루코사민의 데 노보 합성을 향상시키기 위해, L-글루타민:D-프럭토스-6-포스페이트 아미노트랜스퍼라제 (glmS), 이. 콜라이 K-12 substr. MG1655로부터 포스포글루코사민 뮤타제 (glmM) 및 이. 콜라이 K-12 substr. MG1655로부터 N-아세틸글루코사민-1-포스페이트 우리딜트랜스퍼라제/ 글루코사민-1-포스페이트 아세틸트랜스퍼라제 (glmU)를 코딩하는 유전자 (각각 수탁번호 NP_418185, NP_417643, NP_418186)를 코돈-최적화하고 유전자 합성에 의해 수득하였다. 오페론 glmUM을 구성적 테트라시클린 프로모터 Ptet의 제어 하에 클로닝하였으며 한편 glmS 는 구성적 PT5 프로모터 하에 클로닝하였다. 매리너-유사 요소 Himar1 트랜스포사제에 의해 특이적으로 인식된 역전된 말단 반복부에 의해 플랭킹된, 트랜스포손 카세트 <Ptet-glmUM-PT5-glmS-FRT-dhfr-FRT>는 pEcomar-glmUM-glmS로부터 삽입되어 락토-N-트리오스 II 생산 균주를 나타냈다. 대사 공학은 매리너-유사 요소 Himar1 트랜스포사제에 의해 특이적으로 인식된 역전된 말단 반복부에 의해 플랭킹된 트랜스포손 카세트 <Ptet-wbdO-PT5-galE-FRT-cat-FRT> (서열번호: 187)의 게놈 통합을 추가로 포함하였으며, 상기 카세트는 pEcomar-wbdO-galE로부터 삽입되었다. N-아세틸뉴라민산의 세포내 분해를 방지하기 위해 nanKETA 유전자 클러스터를 문헌 [Datsenko and Wanne (Proc. Natl. Acad. Sci. USA 97:6640-6645 (2000))]의 방법에 따라 이. 콜라이 균주 BL21(DE3) 균주의 게놈으로부터 결실시켰다. LNT의 시알릴화에 충분한 공여체 기질 (CMP-Neu5Ac)을 제공하기 위해, 시알산에 대한 흡수 메카니즘뿐만 아니라 그의 뉴클레오티드-활성화에 대한 능력이 이. 콜라이 균주로 시행되었다. 상기에 기재된 바와 같이, 유전자 nanTneuA는 구성적 테트라시클린 프로모터 Ptet의 제어 하에 오페론으로서 (프라이머 neuA/nanT_1-6을 사용하여) 클로닝하였으며 생성된 발현 단편 <Ptet-neuA-nanT-lox66-kan-lox72>을 EZ-Tn5 트랜스포사제를 사용하여 통합하여, 최종적으로 균주 #2130을 생성하였다.
실시예 8: 상이한 시알릴트랜스퍼라제를 발현하는 이. 콜라이 BL21(DE3) #2130의 배치 발효
시알릴트랜스퍼라제 SiaT9 또는 SiaT19를 코딩하는 발현 플라스미드를 보유하는 에쉐리키아 콜라이 BL21(DE3) #2130 세포를 2% (wt/vol) 글루코스, 5 g/l NH4Cl, 암피실린 100 μg ml-1, 카나마이신 15 μg ml-1 및 젠타마이신 5 μg ml-1이 보충된 25 ml의 미네랄 염 배지 (Samain et al., J. Biotech. 1999, 72:33-47)로 채워진 100 ml 진탕 플라스크에서 30℃에서 성장시켰다. 배양물이 0.5 내지 1의 OD600에 도달했을 때, 3 mM 락토스를 첨가하였다. 24시간 동안 인큐베이션한 후, 0.3 mM IPTG를 첨가하여 시알릴트랜스퍼라제 유전자 발현을 유도하였다. 부수적으로, 3 mM의 시알산을 배양물에 첨가하였다. 인큐베이션은 48시간 동안 계속하였다. 이어서, 세포를 원심분리에 의해 수확하고 유리 비드를 사용하여 규정된 부피에서 기계적으로 파괴시켰다. 후속적으로, 시알릴락토-N-테트라오스-a 및 -b의 세포내 형성을 확인하기 위해 박층 크로마토그래피 (TLC)를 수행하였다. 도 3에 나타낸 바와 같이, 균주 #2130에서 siaT9 또는 siaT19의 발현은 각각 LST-a 및 LST-b의 형성을 결과하였다. 질량 분석법에 의해 결과를 확인하였다.
SEQUENCE LISTING <110> Jennewein Biotechnologie GmbH <120> Sialyltransferases and their use in producing sialylated oligosaccharides <130> P 1703 WO <160> 188 <170> PatentIn version 3.5 <210> 1 <211> 1410 <212> DNA <213> Campylobacter coli <400> 1 atgcaaaacg tcattatcgc tggtaacggt ccgagcctgc aatcaatcaa ctatcaacgc 60 ctgccgaaag aatacgacat cttccgctgc aaccagttct acttcgaaga taaatactac 120 ctgggcaaaa acatcaaagc ggcctttttc aatccgtatc cgttcctgca gcaataccat 180 accgcgaaac agctggtgtt caacaacgaa tacaaaatcg aaaacatctt ttgtagcacg 240 ttcaatctgc cgttcatcga aaaagataac ttcatcaaca aattttacga tttctttccg 300 gacgctaaac tgggtcacaa aatcatcgaa aacctgaaag aattttacgc gtacatcaaa 360 tacaacgaaa tctacctgaa caaacgtatt accagcggca tctatatgtg cgcaattgct 420 atcgcgctgg gttataaaaa catttacctg tgtggcatcg atttctatga aggtgaaacg 480 atctacccgt tcaaagccat gtctaaaaac attaagaaaa tttttccgtg gatcaaagat 540 ttcaacccga gtaacttcca ttccaaagaa tacgacatcg aaatcctgaa actgctggaa 600 tcaatctaca aagttaacat ctacgcactg tgcgataact cggccctggc aaattacttc 660 ccgctgctgg tgaacaccga caattcattt gttctggaaa acaaatcgga tgactgtatc 720 aacgatatcc tgctgaccaa caatacgccg ggcattaact tctataaaag ccagatccaa 780 gtcaacaata ccgaaattct gctgctgaac tttcagaata tgatcagcgc caaagaaaac 840 gaaatttcta acctgaacaa aatcctgcaa gactcataca aaaccatcaa cacgaaagaa 900 aacgaaatta gtaatctgaa taaaatcctg caggattcct ataaaacgat taataccaaa 960 gaaaatgaaa tttcgaatct gaacaaaatc ctgcaggata aagacaaact gctgatcgtt 1020 aaagaaaacc tgctgaattt caaaagccgt catggtaaag ccaaatttcg cattcagaac 1080 caactgtctt ataaactggg ccaggcaatg atggtcaata gcaaatctct gctgggttat 1140 atccgtatgc cgtttgtgct gagttacatc aaagacaaac acaaacagga acaaaaaatc 1200 tatcaggaaa aaattaagaa agatccgagc ctgaccctgc cgccgctgga agattatccg 1260 gactacaaag aagctctgaa agaaaaagaa tgcctgacct atcgcctggg ccagacgctg 1320 attaaagcgg atcaagaatg gtacaaaggt ggctatgtga aaatgtggtt cgaaatcaaa 1380 aaactgaaga aagaatacaa aaagaaataa 1410 <210> 2 <211> 1146 <212> DNA <213> Vibrio sp. <400> 2 atgaacaacg acaactccac gaccaccaac aataacgcta ttgaaatcta tgtggatcgt 60 gcgaccctgc cgacgatcca gcaaatgacc aaaattgtta gccagaaaac gtctaacaaa 120 aaactgatct catggtcgcg ctacccgatt accgataaaa gcctgctgaa gaaaattaac 180 gcggaatttt tcaaagaaca atttgaactg acggaaagcc tgaaaaacat catcctgtct 240 gaaaacatcg ataacctgat cattcatggc aataccctgt ggagtattga tgtggttgac 300 attatcaaag aagtcaacct gctgggcaaa aatattccga tcgaactgca cttttatgat 360 gacggttccg ccgaatacgt tcgtatctac gaatttagta aactgccgga atccgaacag 420 aaatacaaaa ccagcctgtc taaaaacaac atcaaattct caatcgatgg caccgactcg 480 ttcaaaaaca cgatcgaaaa catctacggt ttcagccaac tgtatccgac cacgtaccac 540 atgctgcgtg cagatatctt cgacaccacg ctgaaaatta acccgctgcg cgaactgctg 600 tcaaacaaca tcaaacagat gaaatgggat tacttcaaag acttcaacta caaacaaaaa 660 gatatctttt actcactgac caacttcaac ccgaaagaaa tccaggaaga cttcaacaaa 720 aactcgaaca aaaacttcat cttcatcggc agtaactccg cgaccgccac ggcagaagaa 780 caaatcaata ttatcagcga agcgaagaaa gaaaacagca gcattatcac caattcaatt 840 tcggattatg acctgttttt caaaggtcat ccgtctgcca cgtttaacga acagattatc 900 aatgcacacg atatgatcga aatcaacaac aaaatcccgt tcgaagctct gatcatgacc 960 ggcattctgc cggatgccgt tggcggtatg ggtagttccg tctttttcag tatcccgaaa 1020 gaagtcaaaa acaaattcgt gttctataaa agtggtacgg atatcgaaaa taactccctg 1080 attcaggtga tgctgaaact gaatctgatt aaccgcgata atattaaact gatctctgac 1140 atttaa 1146 <210> 3 <211> 1173 <212> DNA <213> Photobacterium sp. <400> 3 atgggctgta atagcgactc caaccacaac aactccgacg gcaacatcac caaaaacaaa 60 acgatcgaag tttatgtcga tcgtgcaacc ctgccgacga ttcagcaaat gacccagatc 120 atcaacgaaa atagcaacaa caaaaaactg atttcatggt cgcgctaccc gatcaatgat 180 gaagaactgc tggaatcaat taacggctcg tttttcaaaa acaactctga actgatcaaa 240 agtctggatt ccatgattct gaccaatgac attaagaaag tgatcatcaa cggtaacacg 300 ctgtgggcgg ccgatgtggt taacatcatc aaatcaatcg aagcgttcgg caagaaaacc 360 gaaatcgaac tgaactttta tgatgacggt tcggccgaat atgtgcgtct gtacgacttt 420 agcaaactgc cggaatctga acaggaatac aaaattagcc tgtctaaaga taacattctg 480 agcagcatca acggcaccca gccgttcgaa aacgtcgtgg aaaacatcta cggtttcagt 540 caactgtacc cgaccacgta ccacatgctg cgtgccgata tctttgaaac caatctgccg 600 ctgcgcagtc tgaaaggcgt tctgtccaac aacatcaaac agatgaaatg ggattacttc 660 aaaaccttca acagccagca aaaagacaaa ttctacaact tcacgggttt taacccggat 720 gaaattatgg aacaatacaa agcaagcccg aacaaaaatt ttatcttcgt cggcaccaat 780 tctggcaccg caacggctga acagcaaatt gatatcctga ccgaagctaa aaacccgaac 840 agcccgatta tcacgaaatc gatccagggc ttcgacctgt ttttcaaagg tcatccgtct 900 gcaacctaca acaaacaaat catcgatgct cacaacatga tcgaaatcta caacaaaatc 960 ccgttcgaag cgctgatcat gaccgatgcc ctgccggatg cggtgggcgg tatgggcagc 1020 agcgtgtttt tcagcctgcc gaataccgtg gaaaacaaat tcattttcta taaatccgat 1080 acggacattg aaaacaatgc cctgatccag gttatgattg aactgaatat cgtgaaccgt 1140 aatgatgtga aactgatctc ggacctgcaa taa 1173 <210> 4 <211> 1167 <212> DNA <213> Pasteurella multocida <400> 4 atgaaaacga ttaccctgta tctggacccg gcgtccctgc cggcactgaa ccaactgatg 60 gattttacgc agaacaatga agacaaaacc catccgcgta tctttggcct gtctcgcttc 120 aaaattccgg ataacattat cacccaatat cagaatatcc actttgttga actgaaagac 180 aatcgtccga cggaagccct gttcaccatt ctggatcagt acccgggtaa cattgaactg 240 gacatccatc tgaatattgc tcacagcgtc cagctgattc gtccgatcct ggcgtatcgc 300 tttaaacatc tggatcgtgt gtccatccag cgcctgaacc tgtatgatga cggctcaatg 360 gaatacgttg atctggaaaa agaagaaaac aaagacatct cggcagaaat taaacaagct 420 gaaaaacagc tgagccatta tctgctgacg ggtaaaatca aattcgataa cccgaccatt 480 gcgcgctacg tttggcagtc tgcctttccg gtcaaatatc acttcctgag tacggactac 540 tttgaaaaag cagaatttct gcaaccgctg aaagaatatc tggcggaaaa ttaccagaaa 600 atggattgga cggcctatca gcaactgacc ccggaacagc aagcatttta cctgaccctg 660 gttggcttca acgacgaagt caaacagagt ctggaagtgc agcaagcgaa atttattttc 720 acgggcacca cgacctggga aggtaatacc gatgttcgtg aatattacgc ccagcaacag 780 ctgaacctgc tgaatcattt tacccaggcg ggcggcgacc tgtttattgg tgaccattac 840 aaaatttact tcaaaggtca cccgcgcggc ggtgaaatca acgattacat cctgaacaac 900 gcaaaaaaca tcacgaatat cccggctaat atctctttcg aagtgctgat gatgaccggc 960 ctgctgccgg ataaagtcgg cggtgtggct agctctctgt acttcagtct gccgaaagaa 1020 aaaattagtc acatcatctt caccagcaac aaacaggtca aatcaaaaga agatgccctg 1080 aacaatccgt acgtgaaagt tatgcgtcgc ctgggtatta tcgatgaatc gcaagtgatc 1140 ttttgggaca gcctgaaaca gctgtaa 1167 <210> 5 <211> 1116 <212> DNA <213> Neisseria meningitidis <400> 5 atgggcctga aaaaagcctg cctgaccgtg ctgtgtctga tcgtgttttg cttcggcatc 60 ttttatacgt tcgatcgtgt gaaccagggt gaacgcaatg cagttagtct gctgaaagaa 120 aaactgttta acgaagaagg cgaaccggtg aatctgatct tctgttacac cattctgcaa 180 atgaaagttg ccgaacgtat tatggcacag catccgggtg aacgctttta tgtggttctg 240 atgagcgaaa accgtaacga aaaatacgat tactacttca accagatcaa agataaagcg 300 gaacgcgcct atttctttca cctgccgtac ggcctgaaca aaagttttaa tttcattccg 360 acgatggcgg aactgaaagt gaaaagcatg ctgctgccga aagttaaacg tatctatctg 420 gcaagcctgg aaaaagtgtc tattgcggcc tttctgagca cctacccgga tgcggaaatc 480 aaaaccttcg atgatggcac gggtaatctg attcagagct ctagttatct gggcgatgaa 540 ttttctgtta acggtacgat caaacgtaat ttcgcccgca tgatgatcgg tgattggtct 600 attgcgaaaa cccgcaacgc cagtgatgaa cattacacga tcttcaaagg cctgaaaaac 660 atcatggatg atggtcgtcg caaaatgacc tacctgccgc tgttcgatgc gtctgaactg 720 aaaacgggcg atgaaaccgg cggtacggtg cgtattctgc tgggtagccc ggataaagaa 780 atgaaagaaa tctctgaaaa agcagcgaaa aacttcaaaa tccagtatgt tgccccgcac 840 ccgcgtcaga cctacggcct gagtggtgtg accacgctga acagcccgta tgttattgaa 900 gattacatcc tgcgtgaaat taagaaaaac ccgcataccc gctatgaaat ctacacgttt 960 ttcagcggcg ccgcactgac catgaaagat tttccgaacg tgcacgttta tgcactgaaa 1020 ccggcgtctc tgccggaaga ttattggctg aaaccggtgt acgcgctgtt tacccagagt 1080 ggtattccga tcctgacgtt cgatgataaa aattaa 1116 <210> 6 <211> 852 <212> DNA <213> Pasteurella multocida <400> 6 atggataaat ttgcagaaca tgaaattccg aaagcagtga tcgttgctgg caacggtgaa 60 agtctgtccc agattgatta tcgtctgctg ccgaaaaact acgacgtctt ccgttgcaac 120 caattctact tcgaagaacg ctacttcctg ggcaataaaa tcaaagccgt gtttttcacc 180 ccgggtgttt ttctggaaca gtattacacg ctgtatcatc tgaaacgcaa caatgaatac 240 tttgtcgata acgtgattct gagctctttc aatcacccga ccgtggacct ggaaaaatca 300 cagaaaatcc aagcactgtt catcgatgtt atcaacggct acgaaaaata cctgtcgaaa 360 ctgaccgctt tcgatgttta tctgcgttac aaagaactgt atgaaaatca gcgcattacg 420 agcggtgttt acatgtgcgc tgtcgcgatc gccatgggct ataccgatat ttacctgacg 480 ggtatcgact tttatcaagc gtctgaagaa aactacgcct tcgataacaa aaaaccgaat 540 attatccgtc tgctgccgga ctttcgcaaa gaaaaaaccc tgttcagcta tcattctaaa 600 gatattgacc tggaagcgct gtcatttctg cagcaacatt accacgtgaa cttctactca 660 atctcgccga tgagtccgct gtccaaacat tttccgatcc cgacggttga agatgactgt 720 gaaaccacgt tcgtcgcccc gctgaaagaa aactatatta atgacatcct gctgccgccg 780 cactttgtct atgaaaaact gggcgtggat aaactggcgg ccgcactgga acatcaccat 840 caccatcact aa 852 <210> 7 <211> 1158 <212> DNA <213> Pasteurella dagmatis <400> 7 atgaccattt acctggaccc ggcgtctctg ccgaccctga accaactgat gcattttacg 60 aaagaaagcg aagacaaaga aaccgcacgt atttttggct tctctcgctt taaactgccg 120 gaaaaaatca cggaacagta caacaacatc catttcgtgg aaatcaaaaa caatcgtccg 180 acggaagata ttttcaccat cctggaccag tacccggaaa aactggaact ggatctgcat 240 ctgaacattg cacacagcat ccagctgttt catccgattc tgcaatatcg tttcaaacac 300 ccggatcgca ttagtatcaa atccctgaac ctgtatgatg acggcaccat ggaatacgtt 360 gatctggaaa aagaagaaaa caaagacatc aaaagtgcga tcaaaaaagc cgaaaaacag 420 ctgtccgatt atctgctgac gggtaaaatt aactttgaca atccgaccct ggcacgctac 480 gtttggcagt cacaatatcc ggtcaaatac catttcctgt cgacggaata ttttgaaaaa 540 gctgaattcc tgcagccgct gaaaacctat ctggcgggca aataccaaaa aatggattgg 600 tcagcctatg aaaaactgtc gccggaacag caaacgtttt acctgaaact ggtcggtttc 660 agtgatgaaa ccaaacagct gtttcacacg gaacaaacca aatttatttt cacgggcacc 720 acgacctggg agggtaacac cgatatccgt gaatattacg cgaaacagca actgaatctg 780 ctgaaacatt ttacccacag cgaaggcgac ctgtttatcg gtgaccagta caaaatctac 840 ttcaaaggcc atccgcgcgg cggtgatatt aacgactata tcctgaaaca cgcaaaagat 900 attacgaaca tcccggctaa tattagcttc gaaatcctga tgatgaccgg tctgctgccg 960 gacaaagtcg gcggtgtggc gagctctctg tacttctctc tgccgaaaga aaaaatcagc 1020 cacattatct tcacctctaa caagaaaatt aaaaacaaag aagatgccct gaatgacccg 1080 tacgtgcgtg ttatgctgcg tctgggtatg attgacaaaa gccaaattat cttctgggat 1140 tctctgaaac aactgtaa 1158 <210> 8 <211> 1173 <212> DNA <213> Photobacterium phosphoreum <400> 8 atgggctgta actccgatag caaacacaat aacagtgatg gcaatattac caaaaacaaa 60 acgatcgaag tctatgtgga ccgtgcgacc ctgccgacga ttcagcaaat gacccagatc 120 atcaacgaaa atagcaacaa caaaaaactg atttcatggt cgcgttaccc gatcaatgat 180 gaaacgctgc tggaatcaat taatggctcg tttttcaaaa accgcccgga actgatcaaa 240 agtctggatt ccatgattct gaccaacgaa attaagaaag tgatcatcaa cggtaacacg 300 ctgtgggcag ttgacgtggt taatattatc aaaagcattg aagctctggg caagaaaacc 360 gaaatcgaac tgaacttcta tgatgacggt tctgcggaat atgtgcgtct gtacgatttt 420 agccgcctgc cggaatctga acaggaatac aaaattagcc tgtctaaaga taacattcag 480 agcagcatca acggcaccca accgttcgac aacagcatcg aaaacatcta cggtttctct 540 cagctgtatc cgaccacgta ccacatgctg cgtgccgata tctttgaaac caatctgccg 600 ctgacgagtc tgaaacgcgt tatctccaac aacatcaaac agatgaaatg ggattacttc 660 accacgttca attcccagca gaaaaacaaa ttttacaact tcaccggctt caacccggaa 720 aaaatcaaag aacaatacaa agcgagtccg cacgaaaatt ttattttcat tggcaccaac 780 tccggcaccg ccaccgcaga acagcaaatt gatatcctga ccgaagccaa aaaaccggac 840 tcaccgatta tcaccaacag cattcagggc ctggacctgt ttttcaaagg tcatccgtct 900 gcgacctata accagcaaat tatcgacgcc cacaacatga tcgaaatcta caacaaaatc 960 ccgttcgaag cactgatcat gaccgatgca ctgccggacg ctgttggcgg tatgggtagt 1020 tccgtctttt tctcactgcc gaataccgtc gaaaacaaat tcattttcta taaatcggat 1080 acggacattg aaaacaatgc tctgatccag gttatgatcg aactgaatat cgtgaaccgc 1140 aatgatgtga aactgattag tgacctgcaa taa 1173 <210> 9 <211> 1254 <212> DNA <213> Avibacterium paragallinarum <400> 9 atgcgtaaaa tcatcacctt cttcagcctg ttcttctcga tctcagcgtg gtgtcaaaaa 60 atggaaatct acctggacta tgcgtcgctg ccgagcctga acatgatcct gaacctggtt 120 gaaaacaaaa acaacgaaaa agtcgaacgt attatcggct tcgaacgctt tgatttcaac 180 aaagaaattc tgaatagctt ctctaaagaa cgtatcgaat ttagtaaagt ctccattctg 240 gatatcaaag aattttcaga caaactgtac ctgaacattg aaaaatcgga tacgccggtg 300 gacctgatta tccataccaa tctggatcac tcagttcgtt cgctgctgag catctttaaa 360 accctgagtc cgctgttcca taaaatcaac atcgaaaaac tgtacctgta cgatgacggc 420 agcggtaact atgttgatct gtaccagcac cgccaagaaa atatttctgc gattctgatc 480 gaagcccaga aaaaactgaa agacgcgctg gaaaatcgtg aaacggatac cgacaaactg 540 catagcctga cgcgctatac ctggcacaaa atctttccga cggaatatat cctgctgcgt 600 ccggattacc tggatattga cgaaaaaatg caaccgctga aacatttcct gagcgatacc 660 atcgtgtcta tggacctgtc tcgctttagt catttctcca aaaaccagaa agaactgttt 720 ctgaaaatca cgcacttcga tcaaaacatc ttcaacgaac tgaacatcgg caccaaaaac 780 aaagaataca aaacgttcat cttcaccggc accacgacct gggaaaaaga taagaaaaaa 840 cgtctgaaca acgcgaaact gcagacggaa attctggaat cttttatcaa accgaacggc 900 aaattctacc tgggtaacga tatcaaaatc tttttcaaag gccacccgaa aggtgatgac 960 attaacgact acattatccg caaaaccggc gcagaaaaaa ttccggctaa catcccgttt 1020 gaagttctga tgatgacgaa tagtctgccg gattatgtcg gcggtattat gagtaccgtg 1080 tacttttccc tgccgccgaa aaatattgat aaagtggttt tcctgggttc cgaaaaaatc 1140 aaaaacgaaa acgacgccaa atcacagacc ctgtcgaaac tgatgctgat gctgaacgtc 1200 atcacgccgg aacagatttt ctttgaagaa atgccgaacc cgattaactt ttaa 1254 <210> 10 <211> 1293 <212> DNA <213> Campylobacter jejuni <400> 10 atgacccgca cccgtatgga aaacgaactg attgtgagca aaaacatgca gaacattatt 60 atcgccggta acggtccgag cctgaaaaat attaactata aacgtctgcc gcgcgaatac 120 gatgtgttcc gttgcaacca gttctacttc gaagacaaat actacctggg caagaaaatt 180 aaagccgtgt ttttcaatcc gggcgtgttt ctgcaacaat atcataccgc aaaacagctg 240 attctgaaaa acgaatacga aatcaaaaac atcttttgta gcaccttcaa tctgccgttt 300 atcgaatcta acgatttcct gcaccaattt tataactttt tcccggacgc taaactgggc 360 tacgaagtca tcgaaaacct gaaagaattt tacgcgtaca tcaaatacaa cgaaatctac 420 ttcaacaaac gcatcacctc tggcgtgtat atgtgcgcga ttgccatcgc actgggttat 480 aaaacgattt acctgtgtgg catcgatttc tatgaaggtg acgttattta cccgtttgaa 540 gcaatgagta ccaacattaa aacgatcttc ccgggtatca aagatttcaa accgagtaac 600 tgccattcca aagaatatga catcgaagcg ctgaaactgc tgaaaagcat ctacaaagtt 660 aacatctacg ccctgtgtga tgacagtatt ctggcaaatc atttcccgct gtccattaac 720 atcaacaaca acttcaccct ggaaaacaaa cacaacaact caatcaacga tattctgctg 780 accgacaata cgccgggcgt ctcgttttat aaaaatcagc tgaaagccga taacaaaatc 840 atgctgaact tctacaacat cctgcatagc aaagataacc tgatcaaatt cctgaacaaa 900 gaaatcgctg ttctgaaaaa acagaccacg caacgtgcta aagcgcgcat tcagaaccac 960 ctgagctata aactgggcca agccctgatt atcaatagca aatctgtcct gggtttcctg 1020 tctctgccgt ttattatcct gtcaattgtg atctcgcaca aacaggaaca aaaagcgtat 1080 aaattcaaag tgaagaaaaa cccgaacctg gcactgccgc cgctggaaac ctatccggat 1140 tacaacgaag ccctgaaaga aaaagaatgc ttcacgtaca aactgggcga agaatttatc 1200 aaagcaggta aaaactggta tggcgaaggt tacatcaaat ttatcttcaa agatgttccg 1260 cgtctgaaac gtgaatttga aaaaggcgaa taa 1293 <210> 11 <211> 1188 <212> DNA <213> Heliobacter acinonychis <400> 11 atgaataaga aaccgctgat tattgctggc aacgggccaa gcatcaaaga cttagattat 60 gcgttgttcc cgaaagactt tgatgtattc cgatgtaatc aattctactt cgaggacaaa 120 tactatttag ggcgggaaat aaaaggggtg ttctttaacg cgcacgtctt cgatctccaa 180 atgaagatca ctaaagccat agtcaaaaac ggggaatatc acccggacca catatattgc 240 acacatgtcg aaccgtacgg ttacgttaac ggaaaccagc aactcatgca agagtacctg 300 gaaaaacatt ttgtgggagt ccgaagcacg tacgcatacc tgaaagatct agagccattc 360 tttattctgc acagtaagta tcgcaacttc tacgaccagc acttcacaac gggcatcatg 420 atgctactgg tggccatcca attgggatac aaagaaatat acctgtgcgg aatagacttc 480 tacgaaaacg gattcggaca tttctacgag aaccaagggg gattctttga agaggatagc 540 gatccgatgc acgataagaa catagacatc caagcactgg aactggcaaa gaaatacgcg 600 aaaatctacg cactggtacc gaacagcgcc ctagtgaaaa tgattccgtt gagcagccaa 660 aaaggagttc tggaaaaggt gaaggaccgg atcgggttgg gcgagtttaa gagagagaaa 720 ttcgggcaaa aagaattgga aagacagaag gaattagaac gacaaaaaga gctcgaacgc 780 caaaaggagc ttgaacgtca aaaggaactt gaacgacaaa aagagttgga gaggcagaaa 840 gaactcgaac gccaaaaaga attagagaga cagaaggaat tagagcgcca aaaggagctt 900 gagcgtcaaa aagaattaga gaggcagaag gagttagaaa ggcagaaaga actggagaga 960 cagaaagaac tcgaaaggca gaaggagttg gaacgccaaa aagaactaga attagaacga 1020 tccttaaaag cacgattgaa agcggtactc gcgagcaaag gcatccgcgg cgacaacctg 1080 ataatcgtaa gtttaaaaga cacctaccga ctgtttaaag ggggatttgc gttactcttg 1140 gacctgaagg cgctaaagtc aatcattaaa gcattcctga agagataa 1188 <210> 12 <211> 783 <212> DNA <213> Campylobacter jejuni <400> 12 atgggcaaaa aagtgattat tgcgggcaac ggcccgagcc tgaaagaaat tgattatagc 60 cgtctgccga acgattttga tgtgtttcgc tgcaaccagt tttatttcga agataaatat 120 tacctgggca aaaaatgcaa agcggtgttc tataatccga tcctgttctt cgaacagtat 180 tacaccctga aacatctgat tcagaaccag gaatatgaaa ccgaactgat catgtgcagc 240 aactataacc aggcgcatct ggaaaacgaa aactttgtga aaaccttcta cgattatttt 300 ccggatgcgc atctgggcta tgattttttc aaacagctga aagatttcaa cgcgtacttc 360 aaattccacg aaatctattt caaccagcgt attaccagcg gcgtgtatat gtgcgcggtg 420 gcgattgcgc tgggctataa agaaatttat ctgagcggca tcgattttta tcagaacggc 480 agcagctatg cgtttgatac caaacagaaa aacctgctga aactggcccc gaactttaaa 540 aacgataaca gccactatat tggccatagc aaaaacaccg atatcaaagc gctggaattt 600 ctggaaaaaa cctataaaat caaactgtat tgcctgtgcc cgaacagcct gctggccaac 660 tttattgaac tggcaccgaa tctgaacagc aacttcatca tccaggaaaa aaacaactat 720 accaaagata ttctgattcc gagcagcgaa gcgtatggca aattcagcaa aaacatcaac 780 taa 783 <210> 13 <211> 897 <212> DNA <213> Streptococcus entericus <400> 13 atgaagaaag tctacttctg ccatacggtc taccatctgc tgattaccct gtgcaaaatt 60 agcgttgaag aacaagttga aattattgtg ttcgataccg ttagtaatca tgaactgatt 120 gtccagaaaa tccgcgacgt gtttgttaac accacggtgc tgttcgcaga acaaaatacc 180 gatttttcca ttctggaaat cgatcgcgct acggacattt atgtgttcaa cgactggacc 240 ccgatcggcg cgtatctgcg taaaaacaaa ctgttttacc atctgatcga agatggttat 300 aactaccacg aatataacgt ttacgcgaat gccctgacca tgaaacgtcg cctgctgaac 360 ttcgtgctgc gtcgcgaaga accgtcaggc ttttcgcgtt atgttcgcag cattgaagtt 420 aaccgtgtca aatacctgcc gaatgattgc cgcaaaagca aatgggttga aaaaccgcgt 480 tctgccctgt tcgaaaatct ggtcccggaa cataaacaga aaatcatcac gatcttcggc 540 ctggaaaact atcaagatag cctgcgcggt gtcctggtgc tgacccagcc gctggtgcaa 600 gactactggg atcgcgacat taccacggaa gaagaacagc tggaatttta tcgtcaaatc 660 gtggaatctt acggcgaagg tgaacaggtg tttttcaaaa ttcacccgcg tgataaagtt 720 gactatagct ctctgaccaa cgtcattttt ctgaagaaaa acgtcccgat ggaagtgtac 780 gaactgattg ccgattgtca ttttaccaaa ggtatcacgc acagttccac cgcactggac 840 ttcctgtcct gtgtggataa gaaaatcacc ctgaaacaaa tgaaagcaaa tagttaa 897 <210> 14 <211> 888 <212> DNA <213> Haemophilus ducreyi <400> 14 atgaaagaaa tcgccatcat ctccaaccaa cgcatgttct tcctgtactg tctgctgacc 60 aataaaaatg tcgaagacgt gttcttcatt tttgaaaaag gcgcgatgcc gaacaatctg 120 accagcattt ctcatttcat cgtgctggat cacagtaaat ccgaatgcta tgactttttc 180 tacttcaact tcatcagttg taaatatcgt ctgcgcggcc tggatgttta cggtgcagac 240 catatcaaag gcgctaaatt tttcctggaa cgtcaccgct ttttcgtggt tgaagatggt 300 atgatgaact acagcaaaaa catgtacgca ttctctctgt tccgtacccg caatccggtg 360 attctgccgg gcggttttca tccgaacgtt aaaaccatct tcctgacgaa agataatccg 420 attccggacc agatcgctca caaacgtgaa atcatcaaca tcaaaaccct gtggcaagcg 480 aaaaccgcca cggaaaaaac gaaaattctg agctttttcg aaatcgatat gcaggaaatt 540 tcagttatca aaaaccgctc gtttgtcctg tatacccaac cgctgtcaga agataaactg 600 ctgacggaag cggaaaaaat tgacatctat cgtaccattc tgacgaaata caaccattcg 660 cagaccgtta tcaaaccgca cccgcgcgat aaaacggact ataaacaact gtttccggat 720 gcctatgtca tgaaaggcac ctacccgagt gaactgctga cgctgctggg tgtcaacttc 780 aacaaagtga tcaccctgtt ttccacggcg gtcttcgatt atccgaaaga aaaaatcgac 840 ttctacggca ccgcggtgca tccgaaactg ctggatttct ttgactaa 888 <210> 15 <211> 1467 <212> DNA <213> Alistipes sp. <400> 15 atggccctgc tgagcggtac cgccgcatgc tcagatgacg aagtctcgca gaacctgatc 60 gtgattaatg gcggtgaaca ttttctgagc ctggatggtc tggcccgtgc aggtaaaatt 120 agcgtgctgg caccggctcc gtggcgtgtt acgaaagcag ctggtgatac ctggtttcgc 180 ctgagcgcaa ccgaaggtcc ggctggttac agcgaagtgg aactgtctct ggatgaaaat 240 ccgggtgccg cacgtagcgc acagctggcg tttgcctgtg gtgatgcgat tgtgccgttc 300 cgcctgagtc aaggcgcact gtccgctggt tatgattcac cggactatta cttttacgtt 360 accttcggca cgatgccgac cctgtatgcc ggtatccatc tgctgagcca cgataaaccg 420 ggctatgtct tttactcacg ttcgaaaacg tttgacccgg ccgaattccc ggcacgtgct 480 gaagttacca ccgcagctga tcgtaccgcc gatgcaaccc aggccgaaat ggaagcaatg 540 gctcgcgaaa tgaaacgtcg catcctggaa attaactctg cggatccgac cgccgtgttt 600 ggcctgtatg ttgatgacct gcgttgccgc attggctacg attggttcgt ggcgcagggt 660 atcgacagtg cccgtgtcaa agtgagcatg ctgtctgatg gcaccggcac gtacaacaat 720 ttttataact acttcggtga cgcggccacg gcggaacaaa attgggaaag ttatgcgtcc 780 gaagttgaag ccctggattg gaatcacggc ggtcgttatc cggaaacccg ctcgctgccg 840 gaatttgaaa gctacacgtg gccgtattac ctgtctaccc gtccggatta tcgcctggtg 900 gttcaggacg gcagtctgct ggaaagctct tgtccgttta ttaccgaaaa actgggtgaa 960 atggaaatcg aatccattca accgtatgaa atgctgtcag ccctgccgga aagttcccgt 1020 aaacgctttt atgatatggc aggcttcgat tacgacaaat ttgcagctct gttcgatgcg 1080 tccccgaaga aaaacctgat tatcattggt acctctcatg cggatgatgc cagtgcacgt 1140 ctgcagcgtg attacgttgc acgcatcatg gaacagtatg gcgctcaata cgatgtcttt 1200 ttcaaaccgc acccggcaga caccacgtca gctggttatg aaacggaatt tccgggcctg 1260 accctgctgc cgggtcaaat gccgtttgaa atcttcgttt ggtccctgat tgatcgtgtc 1320 gacatgatcg gcggttatcc gtcaacggtc tttctgaccg ttccggtcga taaagtgcgc 1380 tttatttttg ccgcggatgc agcttctctg gtgcgtccgc tgaatatcct gttccgcgat 1440 gcgaccgacg ttgaatggat gcagtaa 1467 <210> 16 <211> 876 <212> DNA <213> Campylobacter jejuni <400> 16 atgaagaaag tgattatcgc cggcaatggt ccgagcctga aagaaattga ttattctcgt 60 ctgccgaatg atttcgacgt ctttcgctgc aaccagttct actttgaaga caaatattac 120 ctgggcaaaa aatgtaaagc cgtgttttat accccgaact ttttctttga acagtattac 180 acgctgaaac atctgattca gaaccaagaa tatgaaaccg aactgatcat gtgctcaaac 240 tacaatcaag cacatctgga aaacgaaaac ttcgtcaaaa cgttctacga ttacttcccg 300 gacgctcacc tgggttacga tttctttaaa cagctgaaag aattcaacgc gtacttcaaa 360 ttccacgaaa tctacttcaa ccaacgtatc acctcaggcg tgtatatgtg tgcggttgcc 420 attgcactgg gttataaaga aatttacctg tcgggcatcg atttttatca gaatggtagc 480 tcttacgcct tcgacacgaa acaagaaaat ctgctgaaac tggcaccgga ttttaaaaac 540 gaccgctcac attatattgg ccactcgaaa aacaccgata tcaaagctct ggaattcctg 600 gaaaaaacgt acaaaatcaa actgtactgc ctgtgtccga atagtctgct ggctaacttt 660 atcgaactgg cgccgaacct gaattccaac ttcatcatcc aggagaaaaa caactacacc 720 aaagatatcc tgatcccgag ttccgaagcg tacggcaaat ttagcaaaaa catcaacttc 780 aagaaaatta aaatcaaaga aaacgtgtat tacaaactga ttaaagatct gctgcgtctg 840 ccgtctgaca tcaaacatta ttttaaaggt aaataa 876 <210> 17 <211> 939 <212> DNA <213> Streptococcus agalactiae <400> 17 atgacgaatc gcaaaatcta tgtctgccac accctgtacc atctgctgat ctgcctgtat 60 aaagaagaaa tctactcaaa tctggaaatt atcctgagca gcagcattcc ggatgtggac 120 aacctggaga aaaaactgaa aagcaaaacc atcaacatcc atattctgga agaatcctca 180 ggcgaatctg aagaactgct gagtgttctg aaagatgcag gtctgtctta cagtaaattc 240 gatagcaact gcttcatctt caacgacgct accccgattg gccgtacgct gatcaaacac 300 ggtatttatt acaatctgat cgaagatggc ctgaactgtt ttacctactc gattttcagc 360 cagaaactgt ggaaatacta cgtgaaaaaa tacatcctgc ataaaattca accgcacggc 420 ttttcccgct actgcctggg tatcgaagtg aacagtctgg ttaatctgcc gaaagatccg 480 cgttacaaaa aattcatcga agtcccgcgc aaagaactgt tcgacaatgt tacggaatac 540 cagaaagaaa tggcgatcaa cctgtttggc gccgtccgtg tgtctattaa atccccgtca 600 gttctggtcc tgacccagcc gctgtccatc gataaagaat ttatgtcata caacaacaaa 660 atcgaaacgt cggaagaaca attcaacttc tacaaaagca tcgtgaacga atacatcaac 720 aaaggttaca acgtctacct gaaagtgcat ccgcgtgatg tggttgacta ttctaaactg 780 ccggttgaac tgctgccgag taacgtcccg atggaaatta tcgaactgat gctgaccggc 840 cgctttgaat gcggtattac ccatagcagc accgccctgg atttcctgac ctgtgtggac 900 aagaaaatta cgctggttga tctgaaagac attaaataa 939 <210> 18 <211> 1233 <212> DNA <213> Bibersteinia trehalosi <400> 18 atggaattct gcaaaatggc aacgacgcaa aaaatctgtg tctacctgga ctatgctacg 60 atcccgagcc tgaactacat cctgcacttt gcgcaacatt tcgaagatca ggaaaccatt 120 cgtctgtttg gcctgtcccg cttccacatt ccggaatcag tcatccagcg ctatccgaaa 180 ggtgtggttc aattttaccc gaaccaggaa aaagacttca gcgcgctgct gctggccctg 240 aaaaacatcc tgatcgaagt taaacagcaa cagcgtaaat gcgaaatcga actgcatctg 300 aacctgtttc actatcagct gctgctgctg ccgttcctga gtctgtatct ggatacccag 360 gactactgtc atctgacgct gaaattttac gatgacggct ctgaagcgat tagtgccctg 420 caggaactgg cactggctcc ggatctggcg gcccaaatcc agtttgaaaa acaacagttc 480 gacgaactgg tcgtgaaaaa atcgtttaaa ctgtcgctgc tgagccgcta tttttggggt 540 aaactgttcg aaagcgaata catttggttc aatcaagcaa tcctgcagaa agctgaactg 600 caaattctga aacaggaaat cagctctagt cgtcagatgg attttgcaat ttatcaacag 660 atgtccgacg aacaaaaaca gctggtgctg gaaattctga acatcgatct gaataaagtt 720 gcttacctga aacaactgat ggaaaaccag ccgtcttttc tgttcctggg caccacgctg 780 tttaatatta cccaggaaac caaaacgtgg ctgatgcaga tgcatgtgga tctgatccaa 840 cagtattgcc tgccgagcgg ccagtttttc aacaataaag ccggctatct gtgtttttac 900 aaaggtcacc cgaacgaaaa agaaatgaac caaatgatcc tgtctcagtt caaaaacctg 960 atcgcgctgc cggatgacat tccgctggaa atcctgctgc tgctgggcgt tattccgagt 1020 aaagtcggcg gttttgcatc ctcagctctg tttaacttca ccccggcgca gatcgaaaat 1080 attatctttt tcacgccgcg ttatttcgaa aaagataatc gcctgcacgc cacgcaatac 1140 cgtctgatgc agggcctgat tgaactgggt tatctggacg ctgaaaaatc tgtgacccac 1200 tttgaaatca tgcaactgct gacgaaagaa taa 1233 <210> 19 <211> 1221 <212> DNA <213> Haemophilus parahaemolyticus <400> 19 atgaccgaac agtacatcaa aaacgtggaa gtttacctgg attacgcgac catcccgacg 60 ctgaactact tctaccattt caccgaaaac aaagatgaca tcgccacgat tcgtctgttt 120 ggcctgggtc gcttcaacat cagtaaatcc atcatcgaaa gctacccgga aggcattatc 180 cgttactgcc cgattatctt tgaagatcaa accgcatttc agcaactgtt cattaccctg 240 ctgacggaag acagtttttg tcagtatcgc tttaacttcc atattaacct gtttcactcc 300 tggaaaatgc tgatcccgct gctgcatatt atctggcagt ttaaacacaa agtcctggat 360 attaaactga acttctatga tgacggcagt gaaggtctgg tgacgctgtc caaaatcgaa 420 cagaactaca gctctgaaat cctgcaaaaa atcatcgata tcgactcaca gtcgttttat 480 gcagataaac tgtctttcct ggatgaagac attgctcgtt acctgtggaa cagtctgttt 540 gaatcccatt attacctgct gaacgacttc ctgctgaaaa acgaaaaact gtcactgctg 600 aaaaactcga tcaaatactg ccacatcatg gatctggaac gctacctgca gtttacccaa 660 gaagaaaaag actttttcaa cgaactgctg ggcatcaaca tccagagtct ggaagataaa 720 atcaaaatct tccagcagaa gaaaaccttt attttcacgg gtaccacgat cttcagcctg 780 ccgaaagaag aagaagaaac cctgtatcgt ctgcatctga acgcaatcct gaattatatt 840 cacccgaacg gcaaatactt tattggcgat ggtttcacgc tggttatcaa aggtcatccg 900 caccagaaag aaatgaacag ccgcctggaa aaatcttttg aaaaagctgt catgctgccg 960 gataatatcc cgttcgaaat tctgtatctg atcggctgca aaccggacaa aattggcggt 1020 tttgtgagca cctcttactt cagctgtgat aagaaaaaca ttgcggacct gctgtttatc 1080 tctgcccgtc aagaagaagt tcgcaaaaac gattacctgt ttaacatcca gtaccaactg 1140 cgtgacatga tgattaaaac cggttttatc caggaagaaa aaacgcactt ctactcagat 1200 atcccgatct tcatctcgta a 1221 <210> 20 <211> 903 <212> DNA <213> Haemophilus somnus <400> 20 atgaaatata acatcaaaat taaagctatc gtcatcgtgt cgagcctgcg tatgctgctg 60 atcttcctga tgctgaataa ataccacctg gatgaagttc tgtttgtctt caacgaaggc 120 ttcgaactgc ataaaaaata caaaatcaaa cactatgtgg cgattaaaaa gaaaattacc 180 aaattctggc gtctgtacta caaactgtac ttctaccgtt tcaaaattga ccgcatcccg 240 gtttatggcg cagatcatct gggttggacc gactattttc tgaaatactt cgatttctac 300 ctgattgaag acggcatcgc taacttctcc ccgaaacgtt acgaaattaa cctgacgcgc 360 aatatcccgg tctttggttt ccataaaacc gtgaagaaaa tttacctgac gagtctggaa 420 aatgttccgt ccgatattcg tcataaagtc gaactgatca gcctggaaca cctgtggaaa 480 acccgcacgg cgcaggaaca acacaacatc ctggatttct ttgcctttaa tctggacagc 540 ctgatctctc tgaaaatgaa aaaatacatc ctgttcaccc agtgcctgtc agaagatcgc 600 gtcatttcgg aacaggaaaa aatcgcgatc taccaacata tcatcaaaaa ctacgatgaa 660 cgtctgctgg ttatcaaacc gcacccgcgc gaaaccacgg actatcagaa atactttgaa 720 aatgtcttcg tgtaccaaga tgtggttccg agcgaactgt ttgaactgct ggacgtgaac 780 ttcgaacgtg ttattaccct gttttctacg gccgtgttca aatatgatcg caatatcgtt 840 gacttctacg gtacgcgcat ccacgacaaa atctatcaat ggttcggcga catcaaattc 900 taa 903 <210> 21 <211> 1146 <212> DNA <213> Vibrio harveyi <400> 21 atggattctt cgccggaaaa caccagctct acgctggaaa tttacatcga ttcagcaacc 60 ctgccgtcgc tgcagcacat ggtgaaaatt atcgacgaac aaagtggcaa caaaaaactg 120 atcaactgga aacgttatcc gatcgatgac gaactgctgc tggataaaat caacgctctg 180 agcttttctg ataccacgga cctgacccgt tatatggaaa gtattctgct gatcggcgat 240 attaaacgcg tggttattaa cggtaatagt ctgtccaact acaatattgt cggcgtgatg 300 cgctccatca acgccctggg tctggatctg gacgttgaaa tcaattttta tgatgacggt 360 tcagcagaat atgtccgtct gtacaacttc tcgcagctgc cggaagctga acgcgaactg 420 ctggtgtcaa tgtcgaaaaa caatattctg gcggccgtta acggcatcgg ttcttatgat 480 agcggctctc cggaaaatat ttacggtttt gcgcagattt atccggccac ctaccacatg 540 ctgcgtgcgg acattttcga tacggacctg gaaatcggcc tgattcgcga tatcctgggt 600 gacaacgtca aacagatgaa atggggccaa tttctgggtt tcaacgaaga acagaaagaa 660 ctgttttatc aactgaccag cttcaacccg gataaaatcc aggcgcaata caaagaatct 720 ccgaacaaaa acttcgtttt cgtcggcacc aacagtcgtt ccgcaacggc tgaacagcaa 780 atcaacatca tcaaagaagc caaaaaactg gatagcgaaa ttatcccgaa cagcatcgat 840 ggctatgacc tgtttttcaa aggtcatccg agcgcgacct acaaccagca aattgttgat 900 gcccacgaca tgaccgaaat ctataatcgc acgccgtttg aagtcctggc aatgacgagt 960 tccctgccgg atgctgtggg cggtatgggc tcatcgctgt ttttctcact gccgaaaacc 1020 gtggaaacga aattcatttt ctataaaagt ggcaccgata ttgaatccaa tgcgctgatc 1080 caggttatgc tgaaactggg tatcattacg gacgaaaaag tgcgctttac gacggacatc 1140 aaataa 1146 <210> 22 <211> 1452 <212> DNA <213> Alistipes sp. <400> 22 atggccagct gttctgatga cgataaagaa cagacgggtt ttcaaatcga cgatggctct 60 ggtttcctga gtctggatgc agctgcgcgt agtggctcca ttgccatcac cgcaaacaat 120 tcatggtcgg tgacgcagga taaagacagc gaatggctga ccctgagcac cacgtctggt 180 gcagcaggtc gtaccgaaat tggtatcatg ctggaagcga acccgggcga agctcgtaat 240 gcgggtctga cctttaactc tggcggtcgc acgtatccgt tcgtgattac ccagagtgcc 300 catgttacgg cagattttga cgatgctgac cactgctttt atatcacctt tggtaccctg 360 ccgaccctgt atgcaggtct gcatgtgctg tcccacgata aaccgtcata tgtgtttttc 420 cagcgttccc aaacctttcg cccggaagaa ttcccggccc atgcagaagt tacgattgct 480 gcggatccgt cagctaatgc gaccgatgaa gacatggaac gtatgcgcac ggccatgaaa 540 cagcaaattc tgaaaatcaa cgttgaagat ccgaccgcag tttttggcct gtatgtcgac 600 gatctgcgtt gtggcattgg ttacgattgg ttcgtcgccc agggtatcga cagtacccgc 660 gtgaaagtta gtatgctgtc cgatggcacc ggcacgtaca acaacttcta caactacttc 720 ggcgatccgg ccaccgcaga acaaaactgg gaaaattacg ccgcacaggt ggaagcgctg 780 gattggcaac acggcggtcg ttttccggaa acccgcatgc cggatggttt tgacttctat 840 gaatggccgt attacctggc aacgcgtccg aactaccgcc tggttctgca ggacgatgac 900 ctgctggaag cgacgtctcc gtttatgacc gaacgtctgc agcaaatgcg caccgaatcg 960 aaacagccgt atgaactgct ggccagcctg ccggctgaag cccgtcaacg ctttttccgt 1020 atggctggct ttgattacga cgcgtttgct gcgctgttcg atgccagccc gaagaaaaac 1080 ctggtcatta tcggcacgtc acatacctcg gaagaaagcg aagcacagca agccgcatat 1140 gtggaacgta ttatcggcga ttatggtacc gcctacgaca ttttctttaa accgcacccg 1200 gcagatagct ctagttccaa ctacgaagaa cgctttgaag gtctgaccct gctgccgggt 1260 cagatgccgt ttgaaatttt cgtctggtcg ctgctggata aagtggacct gatcggcggt 1320 tattcatcga cggtgtttct gaccgtcccg gtggaaaaaa ccggctttat tttcgctgcg 1380 aatgctgaaa gcctgccgcg cccgctgaac gttctgttcc gtaatgcgga acatgtccgc 1440 tggatccagt aa 1452 <210> 23 <211> 1452 <212> DNA <213> Alistipes shahii <400> 23 atggacgatg gcaccccgag tgtcagcatc aacggcggca ccgacttcct gagcctggac 60 cacctggcac gcagcggcaa aatcacggtc aacgcaccgg ctccgtggtc tgtgaccctg 120 gccccggaaa attacggcca ggatgaaaaa ccggactggc tgaccctgag cgccgaagaa 180 ggcccggcag gttatagcga aatcgatgtt acctttgcgg aaaacccggg tccggcccgt 240 tccgcatcac tgctgttcag ctgcgatggt aaaaccctgg cctttacggt ttcgcagagc 300 gcaggcggta cgggtttcga tgctccggac tattactttt atatttcggt cggcaccatg 360 ccgacgctgt actcgggtct gcatctgctg agccacgata aaccgtctta tgttagttac 420 gaacgtgcga gcacctttga tgcggccgaa ttcccggacc gcgcgtttgt ctatccggtg 480 gccgatccga ccggtcatgc aaccaacgaa gaactgcgtg cgatgagcga agccatgaaa 540 cgtcgcatcc tggaaattaa tgcagaagat ccgaccgctg ttttcggtct gtgggtcgat 600 gacctgcgtt gccgcctggg ctacgattgg tttgtggctc aaggtatcga ctctgcgcgc 660 gtgaaagtta cgatgctgag tgatggcacc gcgacgtata acaattttca taactacttc 720 ggtgacgcag ctaccgccga acagaactgg aatgattatg cggccgaagt tgaagcactg 780 gactggaatc atggcggtcg ttatccggaa acccgtgccc cggaagaatt cgcctcctac 840 acctggccgt attacctgtc aacgcgtccg gattatcgcc tgatgctgca aaacagctct 900 ctgatggaaa gttcctgtcc gtttatcgca gatcgcctgg cagctatgaa aatggaatcc 960 gtgcagccgt atgaactgct gacggcactg ccggaagctt caaaacagca attctatcgt 1020 atggccaaat ttgattacgc acgctttgct ggcctgttcg acctgtctcc gaagaaaaac 1080 ctgattatca ttggtacctc tcattcatcg gcggccagtg aacagcaaca ggcagcttac 1140 gtcgaacgta tcattcaaca gtatggcagt gattacgaca ttttctttaa accgcacccg 1200 gcagatagct ctagtgctgg ttatccggac cgctttgaag gtctgaccct gctgccgggt 1260 cagatgccgt ttgaaatctt cgtttgggcg ctgctggata aaatcgacat gattggcggt 1320 tatccgtcca ccacgtttat ttcagtgccg ctggataaag ttggctttct gttcgcggcc 1380 gatgccgacg gtctggtccg cccgctgaat atcctgttcc gtgacgctgc aaatgtcgaa 1440 tggattcaat aa 1452 <210> 24 <211> 1206 <212> DNA <213> Actinobacillus suis <400> 24 atggaacgca cgccgcaact gcaagcggtg gacatttaca ttgacttcgc aacgatcccg 60 agcctgagct actttctgca ctttctgaaa cataaacacg atgatcagcg tctgcgtctg 120 ttcagcctgg cccgttttga aatgccgcaa accctgattg aacagtatga aggcattatc 180 cagttctcgc gcaacgtgga acataatgtt gaaccgctgc tggaacagct gcaaacgatc 240 ctgtcacaag aaggtaaaca gtttgaactg catctgcacc tgaacctgtt tcattcgttc 300 gaaatgtttc tgaatctgag cccgacctac acgcagtaca aagaaaaaat ctctaaaatc 360 gttctgcacc tgtatgatga cggcagtgaa ggtgtcatga aacagtacca actgcagaaa 420 agctctagtc tggtgcagga tctggcggcc accaaagcat ctctggttag cctgttcgaa 480 aacggcgaag gttcgtttag ccagattgat ctgatccgtt atgtctggaa tgctgtgctg 540 gaaacccatt attacctgct gtctgatcac tttctgctgg acgaaaaact gcagccgctg 600 aaagcagaac tgggccatta ccaactgctg aacctgagtg cttatcagta cctgtcctca 660 gaagatctgc tgtggctgaa acagattctg aaaatcgaca ccgaactgga aagcctgatg 720 caaaaactga cggcgcagcc ggtgtatttc tttagcggta ccacgttttt caacatcagt 780 ttcgaagata aacaacgtct ggcgaatatc catgccattc tgatccgcga acacctggac 840 ccgaactccc agctgtttat tggcgaaccg tacctgtttg tcttcaaagg tcatccgaac 900 tcaccggaaa ttaatcaggc cctgcgtgaa tattacccga acgttatctt cctgccggaa 960 aatattccgt ttgaaatcct gaccctgctg ggcttctccc cgcaaaaaat tggcggtttt 1020 gcgtcaacga tccacgttaa ttccgaacag tcaaaactgg ccaaactgtt tttcctgacc 1080 tcgacggatg aacaagaacg ccagctgagc gacggttata ttaaacaata cgcactggct 1140 caggctatgc tggaaatgca actggtctcg caagaacaag tctattactg ctcgctgtcg 1200 tcgtaa 1206 <210> 25 <211> 1206 <212> DNA <213> Actinobacillus capsulatus <400> 25 atggaacgca tcccgcaact gcaagctgtc gatatttaca ttgacttcgc cacgatcccg 60 agcctgtcct actttctgca ctttctgaaa cataaacacg atcatcagcg tctgcgcctg 120 ttcagcctgg cgcgttttga aatgccgcag accgtcattg aacaatatga aggcattatc 180 cagttctcac gcaacgtgga acacaatgtt gaacaactgc tggaacagct gcaaacgatc 240 ctgtcgcagg aaggtaaaca atttgaactg cacctgcatc tgaacctgtt tcacagtttc 300 gaaatgtttc tgaatctgtc cccgacctac acgaaataca aagaaaaaat ctcaaaaatc 360 gttctgcatc tgtatgatga cggctcggaa ggtgtcatga aacagtacca actgcagcaa 420 agtaactccc tggcacagga tctggctagc accaaagcgt cactggtttc gctgttcaaa 480 aacggcgaag gtgccttttc tcagattgat ctgatccgtt atgtctggaa tgcagtgctg 540 gaaacccact attacctgct gtcagaccac tttctggccc atgaaaaact gcagccgctg 600 aaaattgaac tgggccatta ccagctgctg aatctgtctg cctatcaata cctgagctct 660 gaagatctgc tgtggctgaa acaaattctg aaaatcgacg cagaactgga aagtctgatg 720 cataaactga ccacgcagcc ggtgtatttc tttagcggta ccacgttttt caacatttcg 780 ttcgaagata aacagcgtct ggccaatatc cacgcaattc tgatccgcga acatctggac 840 ccgaacagtc agctgtttat cggcgaaccg tacctgtttg ttttcaaagg tcacccgaac 900 tccccggaaa ttaatcaggc tctgcgcgaa tattacccga acgcgatctt cctgccggaa 960 aatattccgt ttgaaatcct gaccctgctg ggcttcagcc cgcagaaaat tggcggtttt 1020 gcttctacga tccatgtgaa cagcgaacaa tctaaactgg cgaaactgtt tttcctgacc 1080 agtacggatg aacaggaacg taatcgctcc gacggttata ttaaacagta cgcgctggcc 1140 caagcaatgc tggaaatgca actggtctcg caagaacaag tctactactg ctcgctgtcg 1200 tcgtaa 1206 <210> 26 <211> 936 <212> DNA <213> Haemophilus somnus <400> 26 atgttccgtg aagacaatat gaacctgatt atctgctgta cgccgctgca agtgattatc 60 gccgaaaaaa ttatcgaacg ctatccggaa cagaaatttt atggcgttat gctggaatca 120 ttctacaacg ataaattcga cttctacgaa aacaaactga aacatctgtg ccacgaattt 180 ttctgtatca aaatcgcacg tttcaaactg gaacgctata aaaacctgct gtcactgctg 240 aaaatcaaaa acaaaacctt cgatcgtgtc ttcctggcta acatcgaaaa acgctacatc 300 catatcatcc tgtcgaacat tttctttaaa gaactgtaca ccttcgatga cggcacggcg 360 aacatcgccc cgaatagtca tctgtatcaa gaatacgatc actccctgaa aaaacgtatt 420 accgacatcc tgctgccgaa ccattacaac agcaacaaag tgaaaaacat cagcaaactg 480 cactactcta tctaccgctg caaaaacaac atcatcgata acatcgaata catgccgctg 540 tttaacctgg agaaaaaata cacggcacag gataaaagta tttccatcct gctgggtcaa 600 ccgattttct atgacgaaga gaaaaacatt cgtctgatca aagaagtcat cgccaaattc 660 aaaatcgatt actacttccc gcacccgcgc gaagattact acatcgacaa cgtgtcttac 720 atcaaaaccc cgctgatctt tgaagaattt tacgcggaac gttcaatcga aaattcgatc 780 aaaatctata cctttttcag ctctgccgtg ctgaacatcg ttacgaaaga aaatattgat 840 cgcatctacg cactgaaacc gaaactgacg gaaaaagcgt atctggattg ttacgacatc 900 ctgaaagatt tcggtatcaa agttatcgac atctaa 936 <210> 27 <211> 1200 <212> DNA <213> Haemophilus ducreyi <400> 27 atgctgattc aacagaacct ggaaatctac ctggactacg caaccatccc gagcctggcc 60 tgctttatgc acttcattca acacaaagat gacgtcgata gtattcgtct gtttggcctg 120 gcacgcttcg atatcccgca gtccattatc gaccgttacc cggctaacca cctgttttat 180 cacaacatcg ataatcgcga cctgaccgca gtgctgaacc agctggcgga tattctggcc 240 caggaaaata aacgttttca aatcaacctg catctgaacc tgtttcacag cattgacctg 300 tttttcgcta tttatccgat ctaccagcaa tatcagcata aaatttctac catccagctg 360 caactgtacg atgacggcag cgaaggtatt gttacgcagc attctctgtg caaaattgcg 420 gatctggaac agctgatcct gcaacacaaa aacgtgctgc tggaactgct gaccaaaggc 480 acggccaacg ttccgaatcc gaccctgctg cgttatctgt ggaacaatat tatcgattca 540 cagtttcatc tgatctcgga ccattttctg caacacccga aactgcaacc gctgaaacgt 600 ctgctgaaac gctacaccat tctggatttt acgtgttatc cgcgcttcaa tgccgaacag 660 aaacaactgc tgaaagaaat tctgcatatc tcaaacgaac tggaaaatct gctgaaactg 720 ctgaaacagc acaacacctt tctgttcacg ggcaccacgg cgtttaatct ggatcaggaa 780 aaactggacc tgctgaccca actgcatatc ctgctgctga acgaacacca gaatccgcat 840 tcaacgcact acattggcaa caattatctg ctgctgatca aaggtcatgc aaactcgccg 900 gctctgaatc ataccctggc gctgcacttt ccggatgcga ttttcctgcc ggccaatatt 960 ccgtttgaaa tcttcgcgat gctgggcttt acgccgaaca aaatgggcgg tttcgccagc 1020 acctcttaca ttaattatcc gacggaaaac atcaatcacc tgtttttcct gaccagtgat 1080 cagccgtcca ttcgcacgaa atggctggac tacgaaaaac aatttggtct gatgtattcc 1140 ctgctggcaa tgcagaaaat caacgaagat caggcgttta tgtgcaccat tcacaattaa 1200 <210> 28 <211> 1494 <212> DNA <213> Photobacterium leiognathi <400> 28 atgtgtaacg ataatcaaaa tacggtcgat gttgttgtga gcaccgttaa cgataacgtc 60 atcgaaaaca acacgtacca agttaaaccg atcgataccc cgaccacgtt tgacagttac 120 tcctggattc agacgtgcgg caccccgatc ctgaaagatg acgaaaaata ttcactgtcg 180 tttgatttcg tcgccccgga actggatcag gacgaaaaat tctgtttcga atttaccggc 240 gatgttgacg gtaaacgtta tgtcacgcag accaacctga cggtggttgc accgaccctg 300 gaagtttacg tcgatcatgc tagtctgccg tccctgcagc aactgatgaa aatcatccag 360 cagaaaaacg aatactcaca gaatgaacgt ttcatttcgt ggggccgcat cggtctgacg 420 gaagataacg cggaaaaact gaatgcccat atttatccgc tggcaggcaa caatacctca 480 caggaactgg tggatgcagt gatcgattac gctgactcga aaaaccgtct gaatctggaa 540 ctgaacacga ataccgcgca cagctttccg aacctggccc cgattctgcg cattatcagc 600 tctaaaagca acatcctgat ctctaacatc aacctgtacg atgacggcag tgctgaatat 660 gtgaacctgt acaattggaa agataccgaa gacaaatccg tgaaactgag cgattctttc 720 ctggttctga aagactactt taacggtatt agttccgaaa aaccgagcgg catctatggt 780 cgctacaact ggcatcaact gtataatacg tcttattact tcctgcgtaa agattacctg 840 accgttgaac cgcagctgca cgacctgcgc gaatatctgg gcggtagtct gaaacaaatg 900 tcctgggatg gcttttcaca gctgtcgaaa ggtgacaaag aactgttcct gaacattgtc 960 ggctttgatc aggaaaaact gcagcaagaa taccagcaat cagaactgcc gaatttcgtg 1020 tttacgggca ccacgacctg ggcaggcggt gaaaccaaag aatattacgc tcagcaacag 1080 gtgaacgtcg tgaacaatgc gattaatgaa accagcccgt attacctggg ccgtgaacat 1140 gacctgtttt tcaaaggtca cccgcgcggc ggtattatca atgatattat cctgggcagt 1200 ttcaacaata tgattgacat cccggccaaa gtgtcctttg aagttctgat gatgacgggt 1260 atgctgccgg ataccgtggg cggtattgcg tcatcgctgt attttagcat cccggccgaa 1320 aaagtctctt tcattgtgtt taccagctct gatacgatca ccgatcgtga agacgcgctg 1380 aaatctccgc tggtgcaggt tatgatgacc ctgggcattg ttaaagaaaa agatgtgctg 1440 ttctggtcgg atctgccgga ttgttcctcg ggtgtttgta ttgctcagta ttaa 1494 <210> 29 <211> 1497 <212> DNA <213> Photobacterium sp. <400> 29 atgagtgaag aaaacaccca gtccattatt aaaaacgaca tcaacaaaac catcatcgat 60 gaagaatacg ttaacctgga accgatcaac cagtctaaca tcagttttac caaacatagc 120 tgggtccaga cctgcggtac gcagcaactg ctgacggaac aaaacaaaga atcaatttcg 180 ctgagcgtgg ttgcgccgcg tctggatgac gatgaaaaat actgtttcga tttcaacggt 240 gttagtaata aaggcgaaaa atacatcacc aaagtcacgc tgaatgtcgt ggcaccgtct 300 ctggaagttt atgtggatca tgctagtctg ccgaccctgc aacaactgat ggatattatc 360 aaatcggaag aagaaaaccc gaccgcacag cgttacattg cttggggccg catcgtgccg 420 acggacgaac agatgaaaga actgaatatt accagctttg cgctgatcaa caatcacacg 480 ccggccgatc tggttcagga aattgtcaaa caggcgcaaa ccaaacatcg tctgaacgtg 540 aaactgagca gcaatacggc ccactcgttt gacaatctgg ttccgattct gaaagaactg 600 aacagcttca acaatgtgac cgttacgaat atcgatctgt atgacgatgg cagcgcggaa 660 tatgttaacc tgtacaattg gcgcgacacc ctgaacaaaa cggataatct gaaaattggc 720 aaagactatc tggaagatgt cattaacggt atcaatgaag ataccagcaa caccggcacg 780 agttccgtgt acaattggca gaaactgtat ccggctaact accattttct gcgtaaagat 840 tatctgaccc tggaaccgtc cctgcacgaa ctgcgcgact acattggtga ttcactgaaa 900 cagatgcaat gggacggctt caaaaaattc aactcgaaac agcaagaact gtttctgagc 960 atcgtgaatt tcgataaaca gaaactgcaa aacgaataca attcatcgaa cctgccgaat 1020 tttgtgttca ccggtaccac ggtttgggca ggcaaccacg aacgcgaata ctacgctaaa 1080 cagcaaatca acgttatcaa caacgccatc aacgaaagct ctccgcatta tctgggtaat 1140 tcctacgacc tgtttttcaa aggccacccg ggcggtggca ttatcaacac cctgatcatg 1200 cagaattatc cgtcaatggt cgatattccg tccaaaatct catttgaagt gctgatgatg 1260 accgacatgc tgccggatgc cgtggcaggt attgcgagtt ccctgtactt cacgatcccg 1320 gccgaaaaaa tcaaattcat cgttttcacc tctacggaaa ccattacgga tcgtgaaacc 1380 gccctgcgta gtccgctggt ccaggtgatg attaaactgg gcatcgtgaa agaagaaaat 1440 gtgctgttct gggcggacct gccgaattgc gaaacgggtg tctgtattgc tgtctga 1497 <210> 30 <211> 1449 <212> DNA <213> Photobacterium leiognathi <400> 30 atgaacgata atcaaaatac ggtggacgtg gtggtctcaa ccgtcaacga taacgtgatc 60 gaaaacaaca cgtaccaagt caaaccgatc gataccccga ccacgttcga ctcatactcg 120 tggattcaga cgtgcggcac cccgatcctg aaagatgacg aaaaatatag cctgtctttt 180 gatttcgttg ccccggaact ggatcaagac gaaaaattct gtttcgaatt taccggcgat 240 gtggatggta aacgttatgt gacgcagacc aacctgacgg tggttgcacc gaccctggaa 300 gtttacgtcg atcatgcttc actgccgtcg ctgcagcaac tgatgaaaat catccagcag 360 aaaaacgaat acagccagaa tgaacgcttt atttcttggg gccgtatccg cctgacggaa 420 gataacgcgg aaaaactgaa tgcccatatt tatccgctgg caggcaacaa taccagccag 480 gaactggtgg acgcagttat cgattacgct gactctaaaa accgtctgaa tctggaactg 540 aacacgaata ccggccacag tttccgtaac attgcgccga tcctgcgcgc caccagctct 600 aaaaacaaca tcctgatctc caacatcaac ctgtacgatg acggtagtgc tgaatatgtg 660 tccctgtaca actggaaaga taccgacaat aaatcacaga aactgagtga ttcctttctg 720 gttctgaaag actacctgaa tggcatcagt tccgaaaaac cgaacggtat ttatagcatc 780 tacaattggc atcagctgta tcactcatcg tattacttcc tgcgtaaaga ttacctgacg 840 gtggaaacca aactgcacga cctgcgcgaa tatctgggcg gttcactgaa acaaatgtcg 900 tgggatacct ttagccagct gtctaaaggc gacaaagaac tgttcctgaa cattgttggt 960 tttgatcagg aaaaactgca gcaagaatac cagcaaagcg aactgccgaa tttcgtcttt 1020 acgggcacca cgacctgggc aggcggtgaa accaaagaat attacgctca gcaacaggtg 1080 aacgtcgtga acaatgcgat taatgaaacc tctccgtatt acctgggccg tgaacatgac 1140 ctgtttttca aaggtcaccc gcgcggcggt attatcaatg atattatcct gggctcattc 1200 aacaatatga ttgacatccc ggccaaagtt tcgtttgaag tcctgatgat gacgggtatg 1260 ctgccggata ccgttggcgg tattgcgagc agcctgtatt ttagtatccc ggccgaaaaa 1320 gtgtccttca ttgtttttac cagttccgat acgatcaccg atcgcgaaga cgcgctgaaa 1380 agtccgctgg tccaagtgat gatgaccctg ggcattgtga aagaaaaaga tgtgctgttc 1440 tggtgctaa 1449 <210> 31 <211> 2028 <212> DNA <213> Photobacterium damsela <400> 31 atgaaaaaga tcctgaccgt cctgagcatc tttatcctga gcgcctgtaa tagcgacaac 60 acctctctga aagaaaccgt ctccagcaac agcgcggatg tggttgaaac ggaaacctat 120 cagctgaccc cgattgacgc cccgagcagc tttctgagcc attcttggga acagacgtgc 180 ggcaccccga tcctgaatga aagtgataaa caagcgattt cctttgactt cgtggccccg 240 gaactgaaac aggatgaaaa atactgtttc acgttcaaag gcatcaccgg tgaccaccgc 300 tacattacga acaccaccct gaccgttgtg gcaccgacgc tggaagtgta tatcgatcat 360 gctagtctgc cgagcctgca acaactgatt cacattatcc aggcgaaaga tgaatacccg 420 tcaaaccaac gctttgtttc gtggaaacgt gttaccgtcg atgcggacaa cgccaataaa 480 ctgaatattc atacctatcc gctgaaaggc aacaatacgt caccggaaat ggttgcggcc 540 atcgatgaat atgcacaatc gaaaaaccgc ctgaatattg aattttacac gaataccgct 600 catgtcttca acaatctgcc gccgattatc cagccgctgt acaacaacga aaaagtcaaa 660 atttcacaca tctcgctgta cgatgacggt agttccgaat atgtgagtct gtaccagtgg 720 aaagataccc cgaacaaaat tgaaacgctg gaaggcgaag tgagcctgct ggcaaattat 780 ctggctggca ccagcccgga tgcaccgaaa ggcatgggta accgttataa ttggcataaa 840 ctgtacgata ccgactatta ctttctgcgc gaagattatc tggacgtgga agcgaacctg 900 cacgatctgc gtgactacct gggttcatcg gcaaaacaga tgccgtggga tgaatttgct 960 aaactgagtg actcccagca aaccctgttt ctggatatcg ttggcttcga caaagaacag 1020 ctgcaacaac agtattcaca atcgccgctg ccgaatttta tttttaccgg caccaccacc 1080 tgggcgggcg gtgaaacgaa agaatattac gcccaacagc aagtgaacgt tattaacaat 1140 gccatcaatg aaaccagccc gtattacctg ggcaaagatt acgacctgtt tttcaaaggt 1200 catccggcag gcggtgtgat caacgatatt atcctgggca gttttccgga catgattaat 1260 atcccggcta aaatttcctt cgaagtgctg atgatgaccg atatgctgcc ggacacggtt 1320 gcaggtatcg ctagctctct gtattttacc attccggcgg ataaagtgaa ctttatcgtt 1380 ttcacgagtt ccgatacgat taccgaccgt gaagaagccc tgaaaagccc gctggtccag 1440 gtgatgctga ccctgggcat cgtcaaagaa aaagatgtgc tgttctgggc agaccacaaa 1500 gttaatagca tggaagtcgc gattgatgaa gcctgcaccc gcattatcgc aaaacgtcag 1560 ccgacggctt ctgatctgcg cctggtgatt gcgattatca aaacgatcac cgatctggaa 1620 cgtattggcg acgttgccga atctattgcg aaagtcgcgc tggaatcttt ttctaacaaa 1680 cagtacaatc tgctggttag cctggaatct ctgggtcaac ataccgtgcg catgctgcac 1740 gaagttctgg atgcattcgc tcgtatggac gtcaaagcag ctatcgaagt gtatcaggaa 1800 gatgaccgca tcgatcaaga atacgaaagt attgtccgtc agctgatggc ccacatgatg 1860 gaagatccgt catcgattcc gaacgttatg aaagtcatgt gggcggcccg ttccatcgaa 1920 cgcgttggtg atcgttgcca gaatatttgt gaatacatca tctacttcgt gaaaggcaaa 1980 gatgttcgcc acaccaaacc ggatgacttc ggtacgatgc tggactaa 2028 <210> 32 <211> 1533 <212> DNA <213> Photobacterium damsela <400> 32 atgaaaaaga tcctgaccgt cctgagcatc tttatcctga gcgcctgtaa tagcgacaac 60 acctctctga aagaaaccgt ctccagcaac agcgcggatg tggttgaaac ggaaacctat 120 cagctgaccc cgattgacgc cccgagcagc tttctgagcc attcttggga acagacgtgc 180 ggcaccccga tcctgaatga aagtgataaa caagcgattt cctttgactt cgtggccccg 240 gaactgaaac aggatgaaaa atactgtttc acgttcaaag gcatcaccgg tgaccaccgc 300 tacattacga acaccaccct gaccgttgtg gcaccgacgc tggaagtgta tatcgatcat 360 gctagtctgc cgagcctgca acaactgatt cacattatcc aggcgaaaga tgaatacccg 420 tcaaaccaac gctttgtttc gtggaaacgt gttaccgtcg atgcggacaa cgccaataaa 480 ctgaatattc atacctatcc gctgaaaggc aacaatacgt caccggaaat ggttgcggcc 540 atcgatgaat atgcacaatc gaaaaaccgc ctgaatattg aattttacac gaataccgct 600 catgtcttca acaatctgcc gccgattatc cagccgctgt acaacaacga aaaagtcaaa 660 atttcacaca tctcgctgta cgatgacggt agttccgaat atgtgagtct gtaccagtgg 720 aaagataccc cgaacaaaat tgaaacgctg gaaggcgaag tgagcctgct ggcaaattat 780 ctggctggca ccagcccgga tgcaccgaaa ggcatgggta accgttataa ttggcataaa 840 ctgtacgata ccgactatta ctttctgcgc gaagattatc tggacgtgga agcgaacctg 900 cacgatctgc gtgactacct gggttcatcg gcaaaacaga tgccgtggga tgaatttgct 960 aaactgagtg actcccagca aaccctgttt ctggatatcg ttggcttcga caaagaacag 1020 ctgcaacaac agtattcaca atcgccgctg ccgaatttta tttttaccgg caccaccacc 1080 tgggcgggcg gtgaaacgaa agaatattac gcccaacagc aagtgaacgt tattaacaat 1140 gccatcaatg aaaccagccc gtattacctg ggcaaagatt acgacctgtt tttcaaaggt 1200 catccggcag gcggtgtgat caacgatatt atcctgggca gttttccgga catgattaat 1260 atcccggcta aaatttcctt cgaagtgctg atgatgaccg atatgctgcc ggacacggtt 1320 gcaggtatcg ctagctctct gtattttacc attccggcgg ataaagtgaa ctttatcgtt 1380 ttcacgagtt ccgatacgat taccgaccgt gaagaagccc tgaaaagccc gctggtccag 1440 gtgatgctga ccctgggcat cgtcaaagaa aaagatgtgc tgttctgggc agacctgccg 1500 gactgctcgt ctggtgtgtg tatcgacaaa taa 1533 <210> 33 <211> 1269 <212> DNA <213> Heliobacter acinonychis <400> 33 atggggacca ttaaaaagcc cttaatcata gcaggaaatg gtccatcaat taaggaccta 60 gactatgctt tatttccaaa agacttcgat gtctttcgct gcaaccagtt ttacttcgag 120 gataaatatt acctaggacg cgaaataaaa ggagtgttct ttaacccttg tgtattaagc 180 agtcaaatgc aaacagtgca ataccttatg gacaatggcg aatatagcat agaacgcttc 240 ttttgcagtg tttcaacaga tcgccacgat tttgatgggg attaccaaac gattttaccg 300 gtagacggtt atttaaaagc acactatccg ttcgtctgcg atacattcag cttattcaaa 360 ggtcacgaag aaatcttaaa acacgtgaaa taccacctga aaacgtacag caaagaactt 420 agtgcgggtg tcttaatgtt attgagtgca gtggtattag gatacaaaga aatataccta 480 gtaggaatcg acttcggcgc ctcatcttgg gggcacttct atgacgaaag ccaatcccaa 540 cactttagca atcacatggc agattgtcac aatatctatt acgacatgct gactatttgt 600 ctctgtcaaa agtatgcaaa attgtacgca ttagcaccca attcaccatt atcacatttg 660 cttacactaa atccacaggc caaataccca tttgaactat tagataaacc tatcgggtat 720 actagcgacc taattattag tagcccgttg gaagagaagt tgctcgaatt taagaatatc 780 gaagagaagt tgcttgagtt caaaaacata gaagagaaac tcttagagtt caagaatatt 840 gaagagaaac tattagaatt taaaaacatc gaggaaaaac ttttggagtt caaaaatata 900 gaagagaaac tcctagagtt caagaacatt gaggaaaagt tgcttgagtt caaaaatatt 960 gaggaaaagt tgctcgaatt taagaatatc gaggaaaaac ttttggaatt taagaacata 1020 gaagaaaagt tactcgaatt taaaaacatt gaagagaaac tattggaatt taaaaatata 1080 gaggaaaagt tacttgagtt caaaaacata gaggaaaagt tacttgaatt taagaacata 1140 gaagagaaac ttctcgcaag ccgactgaac aacattctac gtaaaatcaa gcggaaaata 1200 cttccattct tttggggcgg aggtgtaacc ccaacattaa aagttagttt ccgttgggga 1260 gctgcataa 1269 <210> 34 <211> 469 <212> PRT <213> Campylobacter coli <400> 34 Met Gln Asn Val Ile Ile Ala Gly Asn Gly Pro Ser Leu Gln Ser Ile 1 5 10 15 Asn Tyr Gln Arg Leu Pro Lys Glu Tyr Asp Ile Phe Arg Cys Asn Gln 20 25 30 Phe Tyr Phe Glu Asp Lys Tyr Tyr Leu Gly Lys Asn Ile Lys Ala Ala 35 40 45 Phe Phe Asn Pro Tyr Pro Phe Leu Gln Gln Tyr His Thr Ala Lys Gln 50 55 60 Leu Val Phe Asn Asn Glu Tyr Lys Ile Glu Asn Ile Phe Cys Ser Thr 65 70 75 80 Phe Asn Leu Pro Phe Ile Glu Lys Asp Asn Phe Ile Asn Lys Phe Tyr 85 90 95 Asp Phe Phe Pro Asp Ala Lys Leu Gly His Lys Ile Ile Glu Asn Leu 100 105 110 Lys Glu Phe Tyr Ala Tyr Ile Lys Tyr Asn Glu Ile Tyr Leu Asn Lys 115 120 125 Arg Ile Thr Ser Gly Ile Tyr Met Cys Ala Ile Ala Ile Ala Leu Gly 130 135 140 Tyr Lys Asn Ile Tyr Leu Cys Gly Ile Asp Phe Tyr Glu Gly Glu Thr 145 150 155 160 Ile Tyr Pro Phe Lys Ala Met Ser Lys Asn Ile Lys Lys Ile Phe Pro 165 170 175 Trp Ile Lys Asp Phe Asn Pro Ser Asn Phe His Ser Lys Glu Tyr Asp 180 185 190 Ile Glu Ile Leu Lys Leu Leu Glu Ser Ile Tyr Lys Val Asn Ile Tyr 195 200 205 Ala Leu Cys Asp Asn Ser Ala Leu Ala Asn Tyr Phe Pro Leu Leu Val 210 215 220 Asn Thr Asp Asn Ser Phe Val Leu Glu Asn Lys Ser Asp Asp Cys Ile 225 230 235 240 Asn Asp Ile Leu Leu Thr Asn Asn Thr Pro Gly Ile Asn Phe Tyr Lys 245 250 255 Ser Gln Ile Gln Val Asn Asn Thr Glu Ile Leu Leu Leu Asn Phe Gln 260 265 270 Asn Met Ile Ser Ala Lys Glu Asn Glu Ile Ser Asn Leu Asn Lys Ile 275 280 285 Leu Gln Asp Ser Tyr Lys Thr Ile Asn Thr Lys Glu Asn Glu Ile Ser 290 295 300 Asn Leu Asn Lys Ile Leu Gln Asp Ser Tyr Lys Thr Ile Asn Thr Lys 305 310 315 320 Glu Asn Glu Ile Ser Asn Leu Asn Lys Ile Leu Gln Asp Lys Asp Lys 325 330 335 Leu Leu Ile Val Lys Glu Asn Leu Leu Asn Phe Lys Ser Arg His Gly 340 345 350 Lys Ala Lys Phe Arg Ile Gln Asn Gln Leu Ser Tyr Lys Leu Gly Gln 355 360 365 Ala Met Met Val Asn Ser Lys Ser Leu Leu Gly Tyr Ile Arg Met Pro 370 375 380 Phe Val Leu Ser Tyr Ile Lys Asp Lys His Lys Gln Glu Gln Lys Ile 385 390 395 400 Tyr Gln Glu Lys Ile Lys Lys Asp Pro Ser Leu Thr Leu Pro Pro Leu 405 410 415 Glu Asp Tyr Pro Asp Tyr Lys Glu Ala Leu Lys Glu Lys Glu Cys Leu 420 425 430 Thr Tyr Arg Leu Gly Gln Thr Leu Ile Lys Ala Asp Gln Glu Trp Tyr 435 440 445 Lys Gly Gly Tyr Val Lys Met Trp Phe Glu Ile Lys Lys Leu Lys Lys 450 455 460 Glu Tyr Lys Lys Lys 465 <210> 35 <211> 381 <212> PRT <213> Vibrio sp. <400> 35 Met Asn Asn Asp Asn Ser Thr Thr Thr Asn Asn Asn Ala Ile Glu Ile 1 5 10 15 Tyr Val Asp Arg Ala Thr Leu Pro Thr Ile Gln Gln Met Thr Lys Ile 20 25 30 Val Ser Gln Lys Thr Ser Asn Lys Lys Leu Ile Ser Trp Ser Arg Tyr 35 40 45 Pro Ile Thr Asp Lys Ser Leu Leu Lys Lys Ile Asn Ala Glu Phe Phe 50 55 60 Lys Glu Gln Phe Glu Leu Thr Glu Ser Leu Lys Asn Ile Ile Leu Ser 65 70 75 80 Glu Asn Ile Asp Asn Leu Ile Ile His Gly Asn Thr Leu Trp Ser Ile 85 90 95 Asp Val Val Asp Ile Ile Lys Glu Val Asn Leu Leu Gly Lys Asn Ile 100 105 110 Pro Ile Glu Leu His Phe Tyr Asp Asp Gly Ser Ala Glu Tyr Val Arg 115 120 125 Ile Tyr Glu Phe Ser Lys Leu Pro Glu Ser Glu Gln Lys Tyr Lys Thr 130 135 140 Ser Leu Ser Lys Asn Asn Ile Lys Phe Ser Ile Asp Gly Thr Asp Ser 145 150 155 160 Phe Lys Asn Thr Ile Glu Asn Ile Tyr Gly Phe Ser Gln Leu Tyr Pro 165 170 175 Thr Thr Tyr His Met Leu Arg Ala Asp Ile Phe Asp Thr Thr Leu Lys 180 185 190 Ile Asn Pro Leu Arg Glu Leu Leu Ser Asn Asn Ile Lys Gln Met Lys 195 200 205 Trp Asp Tyr Phe Lys Asp Phe Asn Tyr Lys Gln Lys Asp Ile Phe Tyr 210 215 220 Ser Leu Thr Asn Phe Asn Pro Lys Glu Ile Gln Glu Asp Phe Asn Lys 225 230 235 240 Asn Ser Asn Lys Asn Phe Ile Phe Ile Gly Ser Asn Ser Ala Thr Ala 245 250 255 Thr Ala Glu Glu Gln Ile Asn Ile Ile Ser Glu Ala Lys Lys Glu Asn 260 265 270 Ser Ser Ile Ile Thr Asn Ser Ile Ser Asp Tyr Asp Leu Phe Phe Lys 275 280 285 Gly His Pro Ser Ala Thr Phe Asn Glu Gln Ile Ile Asn Ala His Asp 290 295 300 Met Ile Glu Ile Asn Asn Lys Ile Pro Phe Glu Ala Leu Ile Met Thr 305 310 315 320 Gly Ile Leu Pro Asp Ala Val Gly Gly Met Gly Ser Ser Val Phe Phe 325 330 335 Ser Ile Pro Lys Glu Val Lys Asn Lys Phe Val Phe Tyr Lys Ser Gly 340 345 350 Thr Asp Ile Glu Asn Asn Ser Leu Ile Gln Val Met Leu Lys Leu Asn 355 360 365 Leu Ile Asn Arg Asp Asn Ile Lys Leu Ile Ser Asp Ile 370 375 380 <210> 36 <211> 390 <212> PRT <213> Photobacterium sp. <400> 36 Met Gly Cys Asn Ser Asp Ser Asn His Asn Asn Ser Asp Gly Asn Ile 1 5 10 15 Thr Lys Asn Lys Thr Ile Glu Val Tyr Val Asp Arg Ala Thr Leu Pro 20 25 30 Thr Ile Gln Gln Met Thr Gln Ile Ile Asn Glu Asn Ser Asn Asn Lys 35 40 45 Lys Leu Ile Ser Trp Ser Arg Tyr Pro Ile Asn Asp Glu Glu Leu Leu 50 55 60 Glu Ser Ile Asn Gly Ser Phe Phe Lys Asn Asn Ser Glu Leu Ile Lys 65 70 75 80 Ser Leu Asp Ser Met Ile Leu Thr Asn Asp Ile Lys Lys Val Ile Ile 85 90 95 Asn Gly Asn Thr Leu Trp Ala Ala Asp Val Val Asn Ile Ile Lys Ser 100 105 110 Ile Glu Ala Phe Gly Lys Lys Thr Glu Ile Glu Leu Asn Phe Tyr Asp 115 120 125 Asp Gly Ser Ala Glu Tyr Val Arg Leu Tyr Asp Phe Ser Lys Leu Pro 130 135 140 Glu Ser Glu Gln Glu Tyr Lys Ile Ser Leu Ser Lys Asp Asn Ile Leu 145 150 155 160 Ser Ser Ile Asn Gly Thr Gln Pro Phe Glu Asn Val Val Glu Asn Ile 165 170 175 Tyr Gly Phe Ser Gln Leu Tyr Pro Thr Thr Tyr His Met Leu Arg Ala 180 185 190 Asp Ile Phe Glu Thr Asn Leu Pro Leu Arg Ser Leu Lys Gly Val Leu 195 200 205 Ser Asn Asn Ile Lys Gln Met Lys Trp Asp Tyr Phe Lys Thr Phe Asn 210 215 220 Ser Gln Gln Lys Asp Lys Phe Tyr Asn Phe Thr Gly Phe Asn Pro Asp 225 230 235 240 Glu Ile Met Glu Gln Tyr Lys Ala Ser Pro Asn Lys Asn Phe Ile Phe 245 250 255 Val Gly Thr Asn Ser Gly Thr Ala Thr Ala Glu Gln Gln Ile Asp Ile 260 265 270 Leu Thr Glu Ala Lys Asn Pro Asn Ser Pro Ile Ile Thr Lys Ser Ile 275 280 285 Gln Gly Phe Asp Leu Phe Phe Lys Gly His Pro Ser Ala Thr Tyr Asn 290 295 300 Lys Gln Ile Ile Asp Ala His Asn Met Ile Glu Ile Tyr Asn Lys Ile 305 310 315 320 Pro Phe Glu Ala Leu Ile Met Thr Asp Ala Leu Pro Asp Ala Val Gly 325 330 335 Gly Met Gly Ser Ser Val Phe Phe Ser Leu Pro Asn Thr Val Glu Asn 340 345 350 Lys Phe Ile Phe Tyr Lys Ser Asp Thr Asp Ile Glu Asn Asn Ala Leu 355 360 365 Ile Gln Val Met Ile Glu Leu Asn Ile Val Asn Arg Asn Asp Val Lys 370 375 380 Leu Ile Ser Asp Leu Gln 385 390 <210> 37 <211> 388 <212> PRT <213> Pasteurella multocida <400> 37 Met Lys Thr Ile Thr Leu Tyr Leu Asp Pro Ala Ser Leu Pro Ala Leu 1 5 10 15 Asn Gln Leu Met Asp Phe Thr Gln Asn Asn Glu Asp Lys Thr His Pro 20 25 30 Arg Ile Phe Gly Leu Ser Arg Phe Lys Ile Pro Asp Asn Ile Ile Thr 35 40 45 Gln Tyr Gln Asn Ile His Phe Val Glu Leu Lys Asp Asn Arg Pro Thr 50 55 60 Glu Ala Leu Phe Thr Ile Leu Asp Gln Tyr Pro Gly Asn Ile Glu Leu 65 70 75 80 Asp Ile His Leu Asn Ile Ala His Ser Val Gln Leu Ile Arg Pro Ile 85 90 95 Leu Ala Tyr Arg Phe Lys His Leu Asp Arg Val Ser Ile Gln Arg Leu 100 105 110 Asn Leu Tyr Asp Asp Gly Ser Met Glu Tyr Val Asp Leu Glu Lys Glu 115 120 125 Glu Asn Lys Asp Ile Ser Ala Glu Ile Lys Gln Ala Glu Lys Gln Leu 130 135 140 Ser His Tyr Leu Leu Thr Gly Lys Ile Lys Phe Asp Asn Pro Thr Ile 145 150 155 160 Ala Arg Tyr Val Trp Gln Ser Ala Phe Pro Val Lys Tyr His Phe Leu 165 170 175 Ser Thr Asp Tyr Phe Glu Lys Ala Glu Phe Leu Gln Pro Leu Lys Glu 180 185 190 Tyr Leu Ala Glu Asn Tyr Gln Lys Met Asp Trp Thr Ala Tyr Gln Gln 195 200 205 Leu Thr Pro Glu Gln Gln Ala Phe Tyr Leu Thr Leu Val Gly Phe Asn 210 215 220 Asp Glu Val Lys Gln Ser Leu Glu Val Gln Gln Ala Lys Phe Ile Phe 225 230 235 240 Thr Gly Thr Thr Thr Trp Glu Gly Asn Thr Asp Val Arg Glu Tyr Tyr 245 250 255 Ala Gln Gln Gln Leu Asn Leu Leu Asn His Phe Thr Gln Ala Gly Gly 260 265 270 Asp Leu Phe Ile Gly Asp His Tyr Lys Ile Tyr Phe Lys Gly His Pro 275 280 285 Arg Gly Gly Glu Ile Asn Asp Tyr Ile Leu Asn Asn Ala Lys Asn Ile 290 295 300 Thr Asn Ile Pro Ala Asn Ile Ser Phe Glu Val Leu Met Met Thr Gly 305 310 315 320 Leu Leu Pro Asp Lys Val Gly Gly Val Ala Ser Ser Leu Tyr Phe Ser 325 330 335 Leu Pro Lys Glu Lys Ile Ser His Ile Ile Phe Thr Ser Asn Lys Gln 340 345 350 Val Lys Ser Lys Glu Asp Ala Leu Asn Asn Pro Tyr Val Lys Val Met 355 360 365 Arg Arg Leu Gly Ile Ile Asp Glu Ser Gln Val Ile Phe Trp Asp Ser 370 375 380 Leu Lys Gln Leu 385 <210> 38 <211> 371 <212> PRT <213> Neisseria meningitidis <400> 38 Met Gly Leu Lys Lys Ala Cys Leu Thr Val Leu Cys Leu Ile Val Phe 1 5 10 15 Cys Phe Gly Ile Phe Tyr Thr Phe Asp Arg Val Asn Gln Gly Glu Arg 20 25 30 Asn Ala Val Ser Leu Leu Lys Glu Lys Leu Phe Asn Glu Glu Gly Glu 35 40 45 Pro Val Asn Leu Ile Phe Cys Tyr Thr Ile Leu Gln Met Lys Val Ala 50 55 60 Glu Arg Ile Met Ala Gln His Pro Gly Glu Arg Phe Tyr Val Val Leu 65 70 75 80 Met Ser Glu Asn Arg Asn Glu Lys Tyr Asp Tyr Tyr Phe Asn Gln Ile 85 90 95 Lys Asp Lys Ala Glu Arg Ala Tyr Phe Phe His Leu Pro Tyr Gly Leu 100 105 110 Asn Lys Ser Phe Asn Phe Ile Pro Thr Met Ala Glu Leu Lys Val Lys 115 120 125 Ser Met Leu Leu Pro Lys Val Lys Arg Ile Tyr Leu Ala Ser Leu Glu 130 135 140 Lys Val Ser Ile Ala Ala Phe Leu Ser Thr Tyr Pro Asp Ala Glu Ile 145 150 155 160 Lys Thr Phe Asp Asp Gly Thr Gly Asn Leu Ile Gln Ser Ser Ser Tyr 165 170 175 Leu Gly Asp Glu Phe Ser Val Asn Gly Thr Ile Lys Arg Asn Phe Ala 180 185 190 Arg Met Met Ile Gly Asp Trp Ser Ile Ala Lys Thr Arg Asn Ala Ser 195 200 205 Asp Glu His Tyr Thr Ile Phe Lys Gly Leu Lys Asn Ile Met Asp Asp 210 215 220 Gly Arg Arg Lys Met Thr Tyr Leu Pro Leu Phe Asp Ala Ser Glu Leu 225 230 235 240 Lys Thr Gly Asp Glu Thr Gly Gly Thr Val Arg Ile Leu Leu Gly Ser 245 250 255 Pro Asp Lys Glu Met Lys Glu Ile Ser Glu Lys Ala Ala Lys Asn Phe 260 265 270 Lys Ile Gln Tyr Val Ala Pro His Pro Arg Gln Thr Tyr Gly Leu Ser 275 280 285 Gly Val Thr Thr Leu Asn Ser Pro Tyr Val Ile Glu Asp Tyr Ile Leu 290 295 300 Arg Glu Ile Lys Lys Asn Pro His Thr Arg Tyr Glu Ile Tyr Thr Phe 305 310 315 320 Phe Ser Gly Ala Ala Leu Thr Met Lys Asp Phe Pro Asn Val His Val 325 330 335 Tyr Ala Leu Lys Pro Ala Ser Leu Pro Glu Asp Tyr Trp Leu Lys Pro 340 345 350 Val Tyr Ala Leu Phe Thr Gln Ser Gly Ile Pro Ile Leu Thr Phe Asp 355 360 365 Asp Lys Asn 370 <210> 39 <211> 283 <212> PRT <213> Pasteurella multocida <400> 39 Met Asp Lys Phe Ala Glu His Glu Ile Pro Lys Ala Val Ile Val Ala 1 5 10 15 Gly Asn Gly Glu Ser Leu Ser Gln Ile Asp Tyr Arg Leu Leu Pro Lys 20 25 30 Asn Tyr Asp Val Phe Arg Cys Asn Gln Phe Tyr Phe Glu Glu Arg Tyr 35 40 45 Phe Leu Gly Asn Lys Ile Lys Ala Val Phe Phe Thr Pro Gly Val Phe 50 55 60 Leu Glu Gln Tyr Tyr Thr Leu Tyr His Leu Lys Arg Asn Asn Glu Tyr 65 70 75 80 Phe Val Asp Asn Val Ile Leu Ser Ser Phe Asn His Pro Thr Val Asp 85 90 95 Leu Glu Lys Ser Gln Lys Ile Gln Ala Leu Phe Ile Asp Val Ile Asn 100 105 110 Gly Tyr Glu Lys Tyr Leu Ser Lys Leu Thr Ala Phe Asp Val Tyr Leu 115 120 125 Arg Tyr Lys Glu Leu Tyr Glu Asn Gln Arg Ile Thr Ser Gly Val Tyr 130 135 140 Met Cys Ala Val Ala Ile Ala Met Gly Tyr Thr Asp Ile Tyr Leu Thr 145 150 155 160 Gly Ile Asp Phe Tyr Gln Ala Ser Glu Glu Asn Tyr Ala Phe Asp Asn 165 170 175 Lys Lys Pro Asn Ile Ile Arg Leu Leu Pro Asp Phe Arg Lys Glu Lys 180 185 190 Thr Leu Phe Ser Tyr His Ser Lys Asp Ile Asp Leu Glu Ala Leu Ser 195 200 205 Phe Leu Gln Gln His Tyr His Val Asn Phe Tyr Ser Ile Ser Pro Met 210 215 220 Ser Pro Leu Ser Lys His Phe Pro Ile Pro Thr Val Glu Asp Asp Cys 225 230 235 240 Glu Thr Thr Phe Val Ala Pro Leu Lys Glu Asn Tyr Ile Asn Asp Ile 245 250 255 Leu Leu Pro Pro His Phe Val Tyr Glu Lys Leu Gly Val Asp Lys Leu 260 265 270 Ala Ala Ala Leu Glu His His His His His His 275 280 <210> 40 <211> 385 <212> PRT <213> Pasteurella dagmatis <400> 40 Met Thr Ile Tyr Leu Asp Pro Ala Ser Leu Pro Thr Leu Asn Gln Leu 1 5 10 15 Met His Phe Thr Lys Glu Ser Glu Asp Lys Glu Thr Ala Arg Ile Phe 20 25 30 Gly Phe Ser Arg Phe Lys Leu Pro Glu Lys Ile Thr Glu Gln Tyr Asn 35 40 45 Asn Ile His Phe Val Glu Ile Lys Asn Asn Arg Pro Thr Glu Asp Ile 50 55 60 Phe Thr Ile Leu Asp Gln Tyr Pro Glu Lys Leu Glu Leu Asp Leu His 65 70 75 80 Leu Asn Ile Ala His Ser Ile Gln Leu Phe His Pro Ile Leu Gln Tyr 85 90 95 Arg Phe Lys His Pro Asp Arg Ile Ser Ile Lys Ser Leu Asn Leu Tyr 100 105 110 Asp Asp Gly Thr Met Glu Tyr Val Asp Leu Glu Lys Glu Glu Asn Lys 115 120 125 Asp Ile Lys Ser Ala Ile Lys Lys Ala Glu Lys Gln Leu Ser Asp Tyr 130 135 140 Leu Leu Thr Gly Lys Ile Asn Phe Asp Asn Pro Thr Leu Ala Arg Tyr 145 150 155 160 Val Trp Gln Ser Gln Tyr Pro Val Lys Tyr His Phe Leu Ser Thr Glu 165 170 175 Tyr Phe Glu Lys Ala Glu Phe Leu Gln Pro Leu Lys Thr Tyr Leu Ala 180 185 190 Gly Lys Tyr Gln Lys Met Asp Trp Ser Ala Tyr Glu Lys Leu Ser Pro 195 200 205 Glu Gln Gln Thr Phe Tyr Leu Lys Leu Val Gly Phe Ser Asp Glu Thr 210 215 220 Lys Gln Leu Phe His Thr Glu Gln Thr Lys Phe Ile Phe Thr Gly Thr 225 230 235 240 Thr Thr Trp Glu Gly Asn Thr Asp Ile Arg Glu Tyr Tyr Ala Lys Gln 245 250 255 Gln Leu Asn Leu Leu Lys His Phe Thr His Ser Glu Gly Asp Leu Phe 260 265 270 Ile Gly Asp Gln Tyr Lys Ile Tyr Phe Lys Gly His Pro Arg Gly Gly 275 280 285 Asp Ile Asn Asp Tyr Ile Leu Lys His Ala Lys Asp Ile Thr Asn Ile 290 295 300 Pro Ala Asn Ile Ser Phe Glu Ile Leu Met Met Thr Gly Leu Leu Pro 305 310 315 320 Asp Lys Val Gly Gly Val Ala Ser Ser Leu Tyr Phe Ser Leu Pro Lys 325 330 335 Glu Lys Ile Ser His Ile Ile Phe Thr Ser Asn Lys Lys Ile Lys Asn 340 345 350 Lys Glu Asp Ala Leu Asn Asp Pro Tyr Val Arg Val Met Leu Arg Leu 355 360 365 Gly Met Ile Asp Lys Ser Gln Ile Ile Phe Trp Asp Ser Leu Lys Gln 370 375 380 Leu 385 <210> 41 <211> 390 <212> PRT <213> Photobacterium phosphoreum <400> 41 Met Gly Cys Asn Ser Asp Ser Lys His Asn Asn Ser Asp Gly Asn Ile 1 5 10 15 Thr Lys Asn Lys Thr Ile Glu Val Tyr Val Asp Arg Ala Thr Leu Pro 20 25 30 Thr Ile Gln Gln Met Thr Gln Ile Ile Asn Glu Asn Ser Asn Asn Lys 35 40 45 Lys Leu Ile Ser Trp Ser Arg Tyr Pro Ile Asn Asp Glu Thr Leu Leu 50 55 60 Glu Ser Ile Asn Gly Ser Phe Phe Lys Asn Arg Pro Glu Leu Ile Lys 65 70 75 80 Ser Leu Asp Ser Met Ile Leu Thr Asn Glu Ile Lys Lys Val Ile Ile 85 90 95 Asn Gly Asn Thr Leu Trp Ala Val Asp Val Val Asn Ile Ile Lys Ser 100 105 110 Ile Glu Ala Leu Gly Lys Lys Thr Glu Ile Glu Leu Asn Phe Tyr Asp 115 120 125 Asp Gly Ser Ala Glu Tyr Val Arg Leu Tyr Asp Phe Ser Arg Leu Pro 130 135 140 Glu Ser Glu Gln Glu Tyr Lys Ile Ser Leu Ser Lys Asp Asn Ile Gln 145 150 155 160 Ser Ser Ile Asn Gly Thr Gln Pro Phe Asp Asn Ser Ile Glu Asn Ile 165 170 175 Tyr Gly Phe Ser Gln Leu Tyr Pro Thr Thr Tyr His Met Leu Arg Ala 180 185 190 Asp Ile Phe Glu Thr Asn Leu Pro Leu Thr Ser Leu Lys Arg Val Ile 195 200 205 Ser Asn Asn Ile Lys Gln Met Lys Trp Asp Tyr Phe Thr Thr Phe Asn 210 215 220 Ser Gln Gln Lys Asn Lys Phe Tyr Asn Phe Thr Gly Phe Asn Pro Glu 225 230 235 240 Lys Ile Lys Glu Gln Tyr Lys Ala Ser Pro His Glu Asn Phe Ile Phe 245 250 255 Ile Gly Thr Asn Ser Gly Thr Ala Thr Ala Glu Gln Gln Ile Asp Ile 260 265 270 Leu Thr Glu Ala Lys Lys Pro Asp Ser Pro Ile Ile Thr Asn Ser Ile 275 280 285 Gln Gly Leu Asp Leu Phe Phe Lys Gly His Pro Ser Ala Thr Tyr Asn 290 295 300 Gln Gln Ile Ile Asp Ala His Asn Met Ile Glu Ile Tyr Asn Lys Ile 305 310 315 320 Pro Phe Glu Ala Leu Ile Met Thr Asp Ala Leu Pro Asp Ala Val Gly 325 330 335 Gly Met Gly Ser Ser Val Phe Phe Ser Leu Pro Asn Thr Val Glu Asn 340 345 350 Lys Phe Ile Phe Tyr Lys Ser Asp Thr Asp Ile Glu Asn Asn Ala Leu 355 360 365 Ile Gln Val Met Ile Glu Leu Asn Ile Val Asn Arg Asn Asp Val Lys 370 375 380 Leu Ile Ser Asp Leu Gln 385 390 <210> 42 <211> 417 <212> PRT <213> Avibacterium paragallinarum <400> 42 Met Arg Lys Ile Ile Thr Phe Phe Ser Leu Phe Phe Ser Ile Ser Ala 1 5 10 15 Trp Cys Gln Lys Met Glu Ile Tyr Leu Asp Tyr Ala Ser Leu Pro Ser 20 25 30 Leu Asn Met Ile Leu Asn Leu Val Glu Asn Lys Asn Asn Glu Lys Val 35 40 45 Glu Arg Ile Ile Gly Phe Glu Arg Phe Asp Phe Asn Lys Glu Ile Leu 50 55 60 Asn Ser Phe Ser Lys Glu Arg Ile Glu Phe Ser Lys Val Ser Ile Leu 65 70 75 80 Asp Ile Lys Glu Phe Ser Asp Lys Leu Tyr Leu Asn Ile Glu Lys Ser 85 90 95 Asp Thr Pro Val Asp Leu Ile Ile His Thr Asn Leu Asp His Ser Val 100 105 110 Arg Ser Leu Leu Ser Ile Phe Lys Thr Leu Ser Pro Leu Phe His Lys 115 120 125 Ile Asn Ile Glu Lys Leu Tyr Leu Tyr Asp Asp Gly Ser Gly Asn Tyr 130 135 140 Val Asp Leu Tyr Gln His Arg Gln Glu Asn Ile Ser Ala Ile Leu Ile 145 150 155 160 Glu Ala Gln Lys Lys Leu Lys Asp Ala Leu Glu Asn Arg Glu Thr Asp 165 170 175 Thr Asp Lys Leu His Ser Leu Thr Arg Tyr Thr Trp His Lys Ile Phe 180 185 190 Pro Thr Glu Tyr Ile Leu Leu Arg Pro Asp Tyr Leu Asp Ile Asp Glu 195 200 205 Lys Met Gln Pro Leu Lys His Phe Leu Ser Asp Thr Ile Val Ser Met 210 215 220 Asp Leu Ser Arg Phe Ser His Phe Ser Lys Asn Gln Lys Glu Leu Phe 225 230 235 240 Leu Lys Ile Thr His Phe Asp Gln Asn Ile Phe Asn Glu Leu Asn Ile 245 250 255 Gly Thr Lys Asn Lys Glu Tyr Lys Thr Phe Ile Phe Thr Gly Thr Thr 260 265 270 Thr Trp Glu Lys Asp Lys Lys Lys Arg Leu Asn Asn Ala Lys Leu Gln 275 280 285 Thr Glu Ile Leu Glu Ser Phe Ile Lys Pro Asn Gly Lys Phe Tyr Leu 290 295 300 Gly Asn Asp Ile Lys Ile Phe Phe Lys Gly His Pro Lys Gly Asp Asp 305 310 315 320 Ile Asn Asp Tyr Ile Ile Arg Lys Thr Gly Ala Glu Lys Ile Pro Ala 325 330 335 Asn Ile Pro Phe Glu Val Leu Met Met Thr Asn Ser Leu Pro Asp Tyr 340 345 350 Val Gly Gly Ile Met Ser Thr Val Tyr Phe Ser Leu Pro Pro Lys Asn 355 360 365 Ile Asp Lys Val Val Phe Leu Gly Ser Glu Lys Ile Lys Asn Glu Asn 370 375 380 Asp Ala Lys Ser Gln Thr Leu Ser Lys Leu Met Leu Met Leu Asn Val 385 390 395 400 Ile Thr Pro Glu Gln Ile Phe Phe Glu Glu Met Pro Asn Pro Ile Asn 405 410 415 Phe <210> 43 <211> 430 <212> PRT <213> Campylobacter jejuni <400> 43 Met Thr Arg Thr Arg Met Glu Asn Glu Leu Ile Val Ser Lys Asn Met 1 5 10 15 Gln Asn Ile Ile Ile Ala Gly Asn Gly Pro Ser Leu Lys Asn Ile Asn 20 25 30 Tyr Lys Arg Leu Pro Arg Glu Tyr Asp Val Phe Arg Cys Asn Gln Phe 35 40 45 Tyr Phe Glu Asp Lys Tyr Tyr Leu Gly Lys Lys Ile Lys Ala Val Phe 50 55 60 Phe Asn Pro Gly Val Phe Leu Gln Gln Tyr His Thr Ala Lys Gln Leu 65 70 75 80 Ile Leu Lys Asn Glu Tyr Glu Ile Lys Asn Ile Phe Cys Ser Thr Phe 85 90 95 Asn Leu Pro Phe Ile Glu Ser Asn Asp Phe Leu His Gln Phe Tyr Asn 100 105 110 Phe Phe Pro Asp Ala Lys Leu Gly Tyr Glu Val Ile Glu Asn Leu Lys 115 120 125 Glu Phe Tyr Ala Tyr Ile Lys Tyr Asn Glu Ile Tyr Phe Asn Lys Arg 130 135 140 Ile Thr Ser Gly Val Tyr Met Cys Ala Ile Ala Ile Ala Leu Gly Tyr 145 150 155 160 Lys Thr Ile Tyr Leu Cys Gly Ile Asp Phe Tyr Glu Gly Asp Val Ile 165 170 175 Tyr Pro Phe Glu Ala Met Ser Thr Asn Ile Lys Thr Ile Phe Pro Gly 180 185 190 Ile Lys Asp Phe Lys Pro Ser Asn Cys His Ser Lys Glu Tyr Asp Ile 195 200 205 Glu Ala Leu Lys Leu Leu Lys Ser Ile Tyr Lys Val Asn Ile Tyr Ala 210 215 220 Leu Cys Asp Asp Ser Ile Leu Ala Asn His Phe Pro Leu Ser Ile Asn 225 230 235 240 Ile Asn Asn Asn Phe Thr Leu Glu Asn Lys His Asn Asn Ser Ile Asn 245 250 255 Asp Ile Leu Leu Thr Asp Asn Thr Pro Gly Val Ser Phe Tyr Lys Asn 260 265 270 Gln Leu Lys Ala Asp Asn Lys Ile Met Leu Asn Phe Tyr Asn Ile Leu 275 280 285 His Ser Lys Asp Asn Leu Ile Lys Phe Leu Asn Lys Glu Ile Ala Val 290 295 300 Leu Lys Lys Gln Thr Thr Gln Arg Ala Lys Ala Arg Ile Gln Asn His 305 310 315 320 Leu Ser Tyr Lys Leu Gly Gln Ala Leu Ile Ile Asn Ser Lys Ser Val 325 330 335 Leu Gly Phe Leu Ser Leu Pro Phe Ile Ile Leu Ser Ile Val Ile Ser 340 345 350 His Lys Gln Glu Gln Lys Ala Tyr Lys Phe Lys Val Lys Lys Asn Pro 355 360 365 Asn Leu Ala Leu Pro Pro Leu Glu Thr Tyr Pro Asp Tyr Asn Glu Ala 370 375 380 Leu Lys Glu Lys Glu Cys Phe Thr Tyr Lys Leu Gly Glu Glu Phe Ile 385 390 395 400 Lys Ala Gly Lys Asn Trp Tyr Gly Glu Gly Tyr Ile Lys Phe Ile Phe 405 410 415 Lys Asp Val Pro Arg Leu Lys Arg Glu Phe Glu Lys Gly Glu 420 425 430 <210> 44 <211> 395 <212> PRT <213> Heliobacter acinonychis <400> 44 Met Asn Lys Lys Pro Leu Ile Ile Ala Gly Asn Gly Pro Ser Ile Lys 1 5 10 15 Asp Leu Asp Tyr Ala Leu Phe Pro Lys Asp Phe Asp Val Phe Arg Cys 20 25 30 Asn Gln Phe Tyr Phe Glu Asp Lys Tyr Tyr Leu Gly Arg Glu Ile Lys 35 40 45 Gly Val Phe Phe Asn Ala His Val Phe Asp Leu Gln Met Lys Ile Thr 50 55 60 Lys Ala Ile Val Lys Asn Gly Glu Tyr His Pro Asp His Ile Tyr Cys 65 70 75 80 Thr His Val Glu Pro Tyr Gly Tyr Val Asn Gly Asn Gln Gln Leu Met 85 90 95 Gln Glu Tyr Leu Glu Lys His Phe Val Gly Val Arg Ser Thr Tyr Ala 100 105 110 Tyr Leu Lys Asp Leu Glu Pro Phe Phe Ile Leu His Ser Lys Tyr Arg 115 120 125 Asn Phe Tyr Asp Gln His Phe Thr Thr Gly Ile Met Met Leu Leu Val 130 135 140 Ala Ile Gln Leu Gly Tyr Lys Glu Ile Tyr Leu Cys Gly Ile Asp Phe 145 150 155 160 Tyr Glu Asn Gly Phe Gly His Phe Tyr Glu Asn Gln Gly Gly Phe Phe 165 170 175 Glu Glu Asp Ser Asp Pro Met His Asp Lys Asn Ile Asp Ile Gln Ala 180 185 190 Leu Glu Leu Ala Lys Lys Tyr Ala Lys Ile Tyr Ala Leu Val Pro Asn 195 200 205 Ser Ala Leu Val Lys Met Ile Pro Leu Ser Ser Gln Lys Gly Val Leu 210 215 220 Glu Lys Val Lys Asp Arg Ile Gly Leu Gly Glu Phe Lys Arg Glu Lys 225 230 235 240 Phe Gly Gln Lys Glu Leu Glu Arg Gln Lys Glu Leu Glu Arg Gln Lys 245 250 255 Glu Leu Glu Arg Gln Lys Glu Leu Glu Arg Gln Lys Glu Leu Glu Arg 260 265 270 Gln Lys Glu Leu Glu Arg Gln Lys Glu Leu Glu Arg Gln Lys Glu Leu 275 280 285 Glu Arg Gln Lys Glu Leu Glu Arg Gln Lys Glu Leu Glu Arg Gln Lys 290 295 300 Glu Leu Glu Arg Gln Lys Glu Leu Glu Arg Gln Lys Glu Leu Glu Arg 305 310 315 320 Gln Lys Glu Leu Glu Arg Gln Lys Glu Leu Glu Arg Gln Lys Glu Leu 325 330 335 Glu Leu Glu Arg Ser Leu Lys Ala Arg Leu Lys Ala Val Leu Ala Ser 340 345 350 Lys Gly Ile Arg Gly Asp Asn Leu Ile Ile Val Ser Leu Lys Asp Thr 355 360 365 Tyr Arg Leu Phe Lys Gly Gly Phe Ala Leu Leu Leu Asp Leu Lys Ala 370 375 380 Leu Lys Ser Ile Ile Lys Ala Phe Leu Lys Arg 385 390 395 <210> 45 <211> 260 <212> PRT <213> Campylobacter jejuni <400> 45 Met Gly Lys Lys Val Ile Ile Ala Gly Asn Gly Pro Ser Leu Lys Glu 1 5 10 15 Ile Asp Tyr Ser Arg Leu Pro Asn Asp Phe Asp Val Phe Arg Cys Asn 20 25 30 Gln Phe Tyr Phe Glu Asp Lys Tyr Tyr Leu Gly Lys Lys Cys Lys Ala 35 40 45 Val Phe Tyr Asn Pro Ile Leu Phe Phe Glu Gln Tyr Tyr Thr Leu Lys 50 55 60 His Leu Ile Gln Asn Gln Glu Tyr Glu Thr Glu Leu Ile Met Cys Ser 65 70 75 80 Asn Tyr Asn Gln Ala His Leu Glu Asn Glu Asn Phe Val Lys Thr Phe 85 90 95 Tyr Asp Tyr Phe Pro Asp Ala His Leu Gly Tyr Asp Phe Phe Lys Gln 100 105 110 Leu Lys Asp Phe Asn Ala Tyr Phe Lys Phe His Glu Ile Tyr Phe Asn 115 120 125 Gln Arg Ile Thr Ser Gly Val Tyr Met Cys Ala Val Ala Ile Ala Leu 130 135 140 Gly Tyr Lys Glu Ile Tyr Leu Ser Gly Ile Asp Phe Tyr Gln Asn Gly 145 150 155 160 Ser Ser Tyr Ala Phe Asp Thr Lys Gln Lys Asn Leu Leu Lys Leu Ala 165 170 175 Pro Asn Phe Lys Asn Asp Asn Ser His Tyr Ile Gly His Ser Lys Asn 180 185 190 Thr Asp Ile Lys Ala Leu Glu Phe Leu Glu Lys Thr Tyr Lys Ile Lys 195 200 205 Leu Tyr Cys Leu Cys Pro Asn Ser Leu Leu Ala Asn Phe Ile Glu Leu 210 215 220 Ala Pro Asn Leu Asn Ser Asn Phe Ile Ile Gln Glu Lys Asn Asn Tyr 225 230 235 240 Thr Lys Asp Ile Leu Ile Pro Ser Ser Glu Ala Tyr Gly Lys Phe Ser 245 250 255 Lys Asn Ile Asn 260 <210> 46 <211> 298 <212> PRT <213> Streptococcus entericus <400> 46 Met Lys Lys Val Tyr Phe Cys His Thr Val Tyr His Leu Leu Ile Thr 1 5 10 15 Leu Cys Lys Ile Ser Val Glu Glu Gln Val Glu Ile Ile Val Phe Asp 20 25 30 Thr Val Ser Asn His Glu Leu Ile Val Gln Lys Ile Arg Asp Val Phe 35 40 45 Val Asn Thr Thr Val Leu Phe Ala Glu Gln Asn Thr Asp Phe Ser Ile 50 55 60 Leu Glu Ile Asp Arg Ala Thr Asp Ile Tyr Val Phe Asn Asp Trp Thr 65 70 75 80 Pro Ile Gly Ala Tyr Leu Arg Lys Asn Lys Leu Phe Tyr His Leu Ile 85 90 95 Glu Asp Gly Tyr Asn Tyr His Glu Tyr Asn Val Tyr Ala Asn Ala Leu 100 105 110 Thr Met Lys Arg Arg Leu Leu Asn Phe Val Leu Arg Arg Glu Glu Pro 115 120 125 Ser Gly Phe Ser Arg Tyr Val Arg Ser Ile Glu Val Asn Arg Val Lys 130 135 140 Tyr Leu Pro Asn Asp Cys Arg Lys Ser Lys Trp Val Glu Lys Pro Arg 145 150 155 160 Ser Ala Leu Phe Glu Asn Leu Val Pro Glu His Lys Gln Lys Ile Ile 165 170 175 Thr Ile Phe Gly Leu Glu Asn Tyr Gln Asp Ser Leu Arg Gly Val Leu 180 185 190 Val Leu Thr Gln Pro Leu Val Gln Asp Tyr Trp Asp Arg Asp Ile Thr 195 200 205 Thr Glu Glu Glu Gln Leu Glu Phe Tyr Arg Gln Ile Val Glu Ser Tyr 210 215 220 Gly Glu Gly Glu Gln Val Phe Phe Lys Ile His Pro Arg Asp Lys Val 225 230 235 240 Asp Tyr Ser Ser Leu Thr Asn Val Ile Phe Leu Lys Lys Asn Val Pro 245 250 255 Met Glu Val Tyr Glu Leu Ile Ala Asp Cys His Phe Thr Lys Gly Ile 260 265 270 Thr His Ser Ser Thr Ala Leu Asp Phe Leu Ser Cys Val Asp Lys Lys 275 280 285 Ile Thr Leu Lys Gln Met Lys Ala Asn Ser 290 295 <210> 47 <211> 295 <212> PRT <213> Haemophilus ducreyi <400> 47 Met Lys Glu Ile Ala Ile Ile Ser Asn Gln Arg Met Phe Phe Leu Tyr 1 5 10 15 Cys Leu Leu Thr Asn Lys Asn Val Glu Asp Val Phe Phe Ile Phe Glu 20 25 30 Lys Gly Ala Met Pro Asn Asn Leu Thr Ser Ile Ser His Phe Ile Val 35 40 45 Leu Asp His Ser Lys Ser Glu Cys Tyr Asp Phe Phe Tyr Phe Asn Phe 50 55 60 Ile Ser Cys Lys Tyr Arg Leu Arg Gly Leu Asp Val Tyr Gly Ala Asp 65 70 75 80 His Ile Lys Gly Ala Lys Phe Phe Leu Glu Arg His Arg Phe Phe Val 85 90 95 Val Glu Asp Gly Met Met Asn Tyr Ser Lys Asn Met Tyr Ala Phe Ser 100 105 110 Leu Phe Arg Thr Arg Asn Pro Val Ile Leu Pro Gly Gly Phe His Pro 115 120 125 Asn Val Lys Thr Ile Phe Leu Thr Lys Asp Asn Pro Ile Pro Asp Gln 130 135 140 Ile Ala His Lys Arg Glu Ile Ile Asn Ile Lys Thr Leu Trp Gln Ala 145 150 155 160 Lys Thr Ala Thr Glu Lys Thr Lys Ile Leu Ser Phe Phe Glu Ile Asp 165 170 175 Met Gln Glu Ile Ser Val Ile Lys Asn Arg Ser Phe Val Leu Tyr Thr 180 185 190 Gln Pro Leu Ser Glu Asp Lys Leu Leu Thr Glu Ala Glu Lys Ile Asp 195 200 205 Ile Tyr Arg Thr Ile Leu Thr Lys Tyr Asn His Ser Gln Thr Val Ile 210 215 220 Lys Pro His Pro Arg Asp Lys Thr Asp Tyr Lys Gln Leu Phe Pro Asp 225 230 235 240 Ala Tyr Val Met Lys Gly Thr Tyr Pro Ser Glu Leu Leu Thr Leu Leu 245 250 255 Gly Val Asn Phe Asn Lys Val Ile Thr Leu Phe Ser Thr Ala Val Phe 260 265 270 Asp Tyr Pro Lys Glu Lys Ile Asp Phe Tyr Gly Thr Ala Val His Pro 275 280 285 Lys Leu Leu Asp Phe Phe Asp 290 295 <210> 48 <211> 488 <212> PRT <213> Alistipes sp. <400> 48 Met Ala Leu Leu Ser Gly Thr Ala Ala Cys Ser Asp Asp Glu Val Ser 1 5 10 15 Gln Asn Leu Ile Val Ile Asn Gly Gly Glu His Phe Leu Ser Leu Asp 20 25 30 Gly Leu Ala Arg Ala Gly Lys Ile Ser Val Leu Ala Pro Ala Pro Trp 35 40 45 Arg Val Thr Lys Ala Ala Gly Asp Thr Trp Phe Arg Leu Ser Ala Thr 50 55 60 Glu Gly Pro Ala Gly Tyr Ser Glu Val Glu Leu Ser Leu Asp Glu Asn 65 70 75 80 Pro Gly Ala Ala Arg Ser Ala Gln Leu Ala Phe Ala Cys Gly Asp Ala 85 90 95 Ile Val Pro Phe Arg Leu Ser Gln Gly Ala Leu Ser Ala Gly Tyr Asp 100 105 110 Ser Pro Asp Tyr Tyr Phe Tyr Val Thr Phe Gly Thr Met Pro Thr Leu 115 120 125 Tyr Ala Gly Ile His Leu Leu Ser His Asp Lys Pro Gly Tyr Val Phe 130 135 140 Tyr Ser Arg Ser Lys Thr Phe Asp Pro Ala Glu Phe Pro Ala Arg Ala 145 150 155 160 Glu Val Thr Thr Ala Ala Asp Arg Thr Ala Asp Ala Thr Gln Ala Glu 165 170 175 Met Glu Ala Met Ala Arg Glu Met Lys Arg Arg Ile Leu Glu Ile Asn 180 185 190 Ser Ala Asp Pro Thr Ala Val Phe Gly Leu Tyr Val Asp Asp Leu Arg 195 200 205 Cys Arg Ile Gly Tyr Asp Trp Phe Val Ala Gln Gly Ile Asp Ser Ala 210 215 220 Arg Val Lys Val Ser Met Leu Ser Asp Gly Thr Gly Thr Tyr Asn Asn 225 230 235 240 Phe Tyr Asn Tyr Phe Gly Asp Ala Ala Thr Ala Glu Gln Asn Trp Glu 245 250 255 Ser Tyr Ala Ser Glu Val Glu Ala Leu Asp Trp Asn His Gly Gly Arg 260 265 270 Tyr Pro Glu Thr Arg Ser Leu Pro Glu Phe Glu Ser Tyr Thr Trp Pro 275 280 285 Tyr Tyr Leu Ser Thr Arg Pro Asp Tyr Arg Leu Val Val Gln Asp Gly 290 295 300 Ser Leu Leu Glu Ser Ser Cys Pro Phe Ile Thr Glu Lys Leu Gly Glu 305 310 315 320 Met Glu Ile Glu Ser Ile Gln Pro Tyr Glu Met Leu Ser Ala Leu Pro 325 330 335 Glu Ser Ser Arg Lys Arg Phe Tyr Asp Met Ala Gly Phe Asp Tyr Asp 340 345 350 Lys Phe Ala Ala Leu Phe Asp Ala Ser Pro Lys Lys Asn Leu Ile Ile 355 360 365 Ile Gly Thr Ser His Ala Asp Asp Ala Ser Ala Arg Leu Gln Arg Asp 370 375 380 Tyr Val Ala Arg Ile Met Glu Gln Tyr Gly Ala Gln Tyr Asp Val Phe 385 390 395 400 Phe Lys Pro His Pro Ala Asp Thr Thr Ser Ala Gly Tyr Glu Thr Glu 405 410 415 Phe Pro Gly Leu Thr Leu Leu Pro Gly Gln Met Pro Phe Glu Ile Phe 420 425 430 Val Trp Ser Leu Ile Asp Arg Val Asp Met Ile Gly Gly Tyr Pro Ser 435 440 445 Thr Val Phe Leu Thr Val Pro Val Asp Lys Val Arg Phe Ile Phe Ala 450 455 460 Ala Asp Ala Ala Ser Leu Val Arg Pro Leu Asn Ile Leu Phe Arg Asp 465 470 475 480 Ala Thr Asp Val Glu Trp Met Gln 485 <210> 49 <211> 291 <212> PRT <213> Campylobacter jejuni <400> 49 Met Lys Lys Val Ile Ile Ala Gly Asn Gly Pro Ser Leu Lys Glu Ile 1 5 10 15 Asp Tyr Ser Arg Leu Pro Asn Asp Phe Asp Val Phe Arg Cys Asn Gln 20 25 30 Phe Tyr Phe Glu Asp Lys Tyr Tyr Leu Gly Lys Lys Cys Lys Ala Val 35 40 45 Phe Tyr Thr Pro Asn Phe Phe Phe Glu Gln Tyr Tyr Thr Leu Lys His 50 55 60 Leu Ile Gln Asn Gln Glu Tyr Glu Thr Glu Leu Ile Met Cys Ser Asn 65 70 75 80 Tyr Asn Gln Ala His Leu Glu Asn Glu Asn Phe Val Lys Thr Phe Tyr 85 90 95 Asp Tyr Phe Pro Asp Ala His Leu Gly Tyr Asp Phe Phe Lys Gln Leu 100 105 110 Lys Glu Phe Asn Ala Tyr Phe Lys Phe His Glu Ile Tyr Phe Asn Gln 115 120 125 Arg Ile Thr Ser Gly Val Tyr Met Cys Ala Val Ala Ile Ala Leu Gly 130 135 140 Tyr Lys Glu Ile Tyr Leu Ser Gly Ile Asp Phe Tyr Gln Asn Gly Ser 145 150 155 160 Ser Tyr Ala Phe Asp Thr Lys Gln Glu Asn Leu Leu Lys Leu Ala Pro 165 170 175 Asp Phe Lys Asn Asp Arg Ser His Tyr Ile Gly His Ser Lys Asn Thr 180 185 190 Asp Ile Lys Ala Leu Glu Phe Leu Glu Lys Thr Tyr Lys Ile Lys Leu 195 200 205 Tyr Cys Leu Cys Pro Asn Ser Leu Leu Ala Asn Phe Ile Glu Leu Ala 210 215 220 Pro Asn Leu Asn Ser Asn Phe Ile Ile Gln Glu Lys Asn Asn Tyr Thr 225 230 235 240 Lys Asp Ile Leu Ile Pro Ser Ser Glu Ala Tyr Gly Lys Phe Ser Lys 245 250 255 Asn Ile Asn Phe Lys Lys Ile Lys Ile Lys Glu Asn Val Tyr Tyr Lys 260 265 270 Leu Ile Lys Asp Leu Leu Arg Leu Pro Ser Asp Ile Lys His Tyr Phe 275 280 285 Lys Gly Lys 290 <210> 50 <211> 312 <212> PRT <213> Streptococcus agalactiae <400> 50 Met Thr Asn Arg Lys Ile Tyr Val Cys His Thr Leu Tyr His Leu Leu 1 5 10 15 Ile Cys Leu Tyr Lys Glu Glu Ile Tyr Ser Asn Leu Glu Ile Ile Leu 20 25 30 Ser Ser Ser Ile Pro Asp Val Asp Asn Leu Glu Lys Lys Leu Lys Ser 35 40 45 Lys Thr Ile Asn Ile His Ile Leu Glu Glu Ser Ser Gly Glu Ser Glu 50 55 60 Glu Leu Leu Ser Val Leu Lys Asp Ala Gly Leu Ser Tyr Ser Lys Phe 65 70 75 80 Asp Ser Asn Cys Phe Ile Phe Asn Asp Ala Thr Pro Ile Gly Arg Thr 85 90 95 Leu Ile Lys His Gly Ile Tyr Tyr Asn Leu Ile Glu Asp Gly Leu Asn 100 105 110 Cys Phe Thr Tyr Ser Ile Phe Ser Gln Lys Leu Trp Lys Tyr Tyr Val 115 120 125 Lys Lys Tyr Ile Leu His Lys Ile Gln Pro His Gly Phe Ser Arg Tyr 130 135 140 Cys Leu Gly Ile Glu Val Asn Ser Leu Val Asn Leu Pro Lys Asp Pro 145 150 155 160 Arg Tyr Lys Lys Phe Ile Glu Val Pro Arg Lys Glu Leu Phe Asp Asn 165 170 175 Val Thr Glu Tyr Gln Lys Glu Met Ala Ile Asn Leu Phe Gly Ala Val 180 185 190 Arg Val Ser Ile Lys Ser Pro Ser Val Leu Val Leu Thr Gln Pro Leu 195 200 205 Ser Ile Asp Lys Glu Phe Met Ser Tyr Asn Asn Lys Ile Glu Thr Ser 210 215 220 Glu Glu Gln Phe Asn Phe Tyr Lys Ser Ile Val Asn Glu Tyr Ile Asn 225 230 235 240 Lys Gly Tyr Asn Val Tyr Leu Lys Val His Pro Arg Asp Val Val Asp 245 250 255 Tyr Ser Lys Leu Pro Val Glu Leu Leu Pro Ser Asn Val Pro Met Glu 260 265 270 Ile Ile Glu Leu Met Leu Thr Gly Arg Phe Glu Cys Gly Ile Thr His 275 280 285 Ser Ser Thr Ala Leu Asp Phe Leu Thr Cys Val Asp Lys Lys Ile Thr 290 295 300 Leu Val Asp Leu Lys Asp Ile Lys 305 310 <210> 51 <211> 410 <212> PRT <213> Bibersteinia trehalosi <400> 51 Met Glu Phe Cys Lys Met Ala Thr Thr Gln Lys Ile Cys Val Tyr Leu 1 5 10 15 Asp Tyr Ala Thr Ile Pro Ser Leu Asn Tyr Ile Leu His Phe Ala Gln 20 25 30 His Phe Glu Asp Gln Glu Thr Ile Arg Leu Phe Gly Leu Ser Arg Phe 35 40 45 His Ile Pro Glu Ser Val Ile Gln Arg Tyr Pro Lys Gly Val Val Gln 50 55 60 Phe Tyr Pro Asn Gln Glu Lys Asp Phe Ser Ala Leu Leu Leu Ala Leu 65 70 75 80 Lys Asn Ile Leu Ile Glu Val Lys Gln Gln Gln Arg Lys Cys Glu Ile 85 90 95 Glu Leu His Leu Asn Leu Phe His Tyr Gln Leu Leu Leu Leu Pro Phe 100 105 110 Leu Ser Leu Tyr Leu Asp Thr Gln Asp Tyr Cys His Leu Thr Leu Lys 115 120 125 Phe Tyr Asp Asp Gly Ser Glu Ala Ile Ser Ala Leu Gln Glu Leu Ala 130 135 140 Leu Ala Pro Asp Leu Ala Ala Gln Ile Gln Phe Glu Lys Gln Gln Phe 145 150 155 160 Asp Glu Leu Val Val Lys Lys Ser Phe Lys Leu Ser Leu Leu Ser Arg 165 170 175 Tyr Phe Trp Gly Lys Leu Phe Glu Ser Glu Tyr Ile Trp Phe Asn Gln 180 185 190 Ala Ile Leu Gln Lys Ala Glu Leu Gln Ile Leu Lys Gln Glu Ile Ser 195 200 205 Ser Ser Arg Gln Met Asp Phe Ala Ile Tyr Gln Gln Met Ser Asp Glu 210 215 220 Gln Lys Gln Leu Val Leu Glu Ile Leu Asn Ile Asp Leu Asn Lys Val 225 230 235 240 Ala Tyr Leu Lys Gln Leu Met Glu Asn Gln Pro Ser Phe Leu Phe Leu 245 250 255 Gly Thr Thr Leu Phe Asn Ile Thr Gln Glu Thr Lys Thr Trp Leu Met 260 265 270 Gln Met His Val Asp Leu Ile Gln Gln Tyr Cys Leu Pro Ser Gly Gln 275 280 285 Phe Phe Asn Asn Lys Ala Gly Tyr Leu Cys Phe Tyr Lys Gly His Pro 290 295 300 Asn Glu Lys Glu Met Asn Gln Met Ile Leu Ser Gln Phe Lys Asn Leu 305 310 315 320 Ile Ala Leu Pro Asp Asp Ile Pro Leu Glu Ile Leu Leu Leu Leu Gly 325 330 335 Val Ile Pro Ser Lys Val Gly Gly Phe Ala Ser Ser Ala Leu Phe Asn 340 345 350 Phe Thr Pro Ala Gln Ile Glu Asn Ile Ile Phe Phe Thr Pro Arg Tyr 355 360 365 Phe Glu Lys Asp Asn Arg Leu His Ala Thr Gln Tyr Arg Leu Met Gln 370 375 380 Gly Leu Ile Glu Leu Gly Tyr Leu Asp Ala Glu Lys Ser Val Thr His 385 390 395 400 Phe Glu Ile Met Gln Leu Leu Thr Lys Glu 405 410 <210> 52 <211> 406 <212> PRT <213> Haemophilus parahaemolyticus <400> 52 Met Thr Glu Gln Tyr Ile Lys Asn Val Glu Val Tyr Leu Asp Tyr Ala 1 5 10 15 Thr Ile Pro Thr Leu Asn Tyr Phe Tyr His Phe Thr Glu Asn Lys Asp 20 25 30 Asp Ile Ala Thr Ile Arg Leu Phe Gly Leu Gly Arg Phe Asn Ile Ser 35 40 45 Lys Ser Ile Ile Glu Ser Tyr Pro Glu Gly Ile Ile Arg Tyr Cys Pro 50 55 60 Ile Ile Phe Glu Asp Gln Thr Ala Phe Gln Gln Leu Phe Ile Thr Leu 65 70 75 80 Leu Thr Glu Asp Ser Phe Cys Gln Tyr Arg Phe Asn Phe His Ile Asn 85 90 95 Leu Phe His Ser Trp Lys Met Leu Ile Pro Leu Leu His Ile Ile Trp 100 105 110 Gln Phe Lys His Lys Val Leu Asp Ile Lys Leu Asn Phe Tyr Asp Asp 115 120 125 Gly Ser Glu Gly Leu Val Thr Leu Ser Lys Ile Glu Gln Asn Tyr Ser 130 135 140 Ser Glu Ile Leu Gln Lys Ile Ile Asp Ile Asp Ser Gln Ser Phe Tyr 145 150 155 160 Ala Asp Lys Leu Ser Phe Leu Asp Glu Asp Ile Ala Arg Tyr Leu Trp 165 170 175 Asn Ser Leu Phe Glu Ser His Tyr Tyr Leu Leu Asn Asp Phe Leu Leu 180 185 190 Lys Asn Glu Lys Leu Ser Leu Leu Lys Asn Ser Ile Lys Tyr Cys His 195 200 205 Ile Met Asp Leu Glu Arg Tyr Leu Gln Phe Thr Gln Glu Glu Lys Asp 210 215 220 Phe Phe Asn Glu Leu Leu Gly Ile Asn Ile Gln Ser Leu Glu Asp Lys 225 230 235 240 Ile Lys Ile Phe Gln Gln Lys Lys Thr Phe Ile Phe Thr Gly Thr Thr 245 250 255 Ile Phe Ser Leu Pro Lys Glu Glu Glu Glu Thr Leu Tyr Arg Leu His 260 265 270 Leu Asn Ala Ile Leu Asn Tyr Ile His Pro Asn Gly Lys Tyr Phe Ile 275 280 285 Gly Asp Gly Phe Thr Leu Val Ile Lys Gly His Pro His Gln Lys Glu 290 295 300 Met Asn Ser Arg Leu Glu Lys Ser Phe Glu Lys Ala Val Met Leu Pro 305 310 315 320 Asp Asn Ile Pro Phe Glu Ile Leu Tyr Leu Ile Gly Cys Lys Pro Asp 325 330 335 Lys Ile Gly Gly Phe Val Ser Thr Ser Tyr Phe Ser Cys Asp Lys Lys 340 345 350 Asn Ile Ala Asp Leu Leu Phe Ile Ser Ala Arg Gln Glu Glu Val Arg 355 360 365 Lys Asn Asp Tyr Leu Phe Asn Ile Gln Tyr Gln Leu Arg Asp Met Met 370 375 380 Ile Lys Thr Gly Phe Ile Gln Glu Glu Lys Thr His Phe Tyr Ser Asp 385 390 395 400 Ile Pro Ile Phe Ile Ser 405 <210> 53 <211> 300 <212> PRT <213> Haemophilus somnus <400> 53 Met Lys Tyr Asn Ile Lys Ile Lys Ala Ile Val Ile Val Ser Ser Leu 1 5 10 15 Arg Met Leu Leu Ile Phe Leu Met Leu Asn Lys Tyr His Leu Asp Glu 20 25 30 Val Leu Phe Val Phe Asn Glu Gly Phe Glu Leu His Lys Lys Tyr Lys 35 40 45 Ile Lys His Tyr Val Ala Ile Lys Lys Lys Ile Thr Lys Phe Trp Arg 50 55 60 Leu Tyr Tyr Lys Leu Tyr Phe Tyr Arg Phe Lys Ile Asp Arg Ile Pro 65 70 75 80 Val Tyr Gly Ala Asp His Leu Gly Trp Thr Asp Tyr Phe Leu Lys Tyr 85 90 95 Phe Asp Phe Tyr Leu Ile Glu Asp Gly Ile Ala Asn Phe Ser Pro Lys 100 105 110 Arg Tyr Glu Ile Asn Leu Thr Arg Asn Ile Pro Val Phe Gly Phe His 115 120 125 Lys Thr Val Lys Lys Ile Tyr Leu Thr Ser Leu Glu Asn Val Pro Ser 130 135 140 Asp Ile Arg His Lys Val Glu Leu Ile Ser Leu Glu His Leu Trp Lys 145 150 155 160 Thr Arg Thr Ala Gln Glu Gln His Asn Ile Leu Asp Phe Phe Ala Phe 165 170 175 Asn Leu Asp Ser Leu Ile Ser Leu Lys Met Lys Lys Tyr Ile Leu Phe 180 185 190 Thr Gln Cys Leu Ser Glu Asp Arg Val Ile Ser Glu Gln Glu Lys Ile 195 200 205 Ala Ile Tyr Gln His Ile Ile Lys Asn Tyr Asp Glu Arg Leu Leu Val 210 215 220 Ile Lys Pro His Pro Arg Glu Thr Thr Asp Tyr Gln Lys Tyr Phe Glu 225 230 235 240 Asn Val Phe Val Tyr Gln Asp Val Val Pro Ser Glu Leu Phe Glu Leu 245 250 255 Leu Asp Val Asn Phe Glu Arg Val Ile Thr Leu Phe Ser Thr Ala Val 260 265 270 Phe Lys Tyr Asp Arg Asn Ile Val Asp Phe Tyr Gly Thr Arg Ile His 275 280 285 Asp Lys Ile Tyr Gln Trp Phe Gly Asp Ile Lys Phe 290 295 300 <210> 54 <211> 381 <212> PRT <213> Vibrio harveyi <400> 54 Met Asp Ser Ser Pro Glu Asn Thr Ser Ser Thr Leu Glu Ile Tyr Ile 1 5 10 15 Asp Ser Ala Thr Leu Pro Ser Leu Gln His Met Val Lys Ile Ile Asp 20 25 30 Glu Gln Ser Gly Asn Lys Lys Leu Ile Asn Trp Lys Arg Tyr Pro Ile 35 40 45 Asp Asp Glu Leu Leu Leu Asp Lys Ile Asn Ala Leu Ser Phe Ser Asp 50 55 60 Thr Thr Asp Leu Thr Arg Tyr Met Glu Ser Ile Leu Leu Ile Gly Asp 65 70 75 80 Ile Lys Arg Val Val Ile Asn Gly Asn Ser Leu Ser Asn Tyr Asn Ile 85 90 95 Val Gly Val Met Arg Ser Ile Asn Ala Leu Gly Leu Asp Leu Asp Val 100 105 110 Glu Ile Asn Phe Tyr Asp Asp Gly Ser Ala Glu Tyr Val Arg Leu Tyr 115 120 125 Asn Phe Ser Gln Leu Pro Glu Ala Glu Arg Glu Leu Leu Val Ser Met 130 135 140 Ser Lys Asn Asn Ile Leu Ala Ala Val Asn Gly Ile Gly Ser Tyr Asp 145 150 155 160 Ser Gly Ser Pro Glu Asn Ile Tyr Gly Phe Ala Gln Ile Tyr Pro Ala 165 170 175 Thr Tyr His Met Leu Arg Ala Asp Ile Phe Asp Thr Asp Leu Glu Ile 180 185 190 Gly Leu Ile Arg Asp Ile Leu Gly Asp Asn Val Lys Gln Met Lys Trp 195 200 205 Gly Gln Phe Leu Gly Phe Asn Glu Glu Gln Lys Glu Leu Phe Tyr Gln 210 215 220 Leu Thr Ser Phe Asn Pro Asp Lys Ile Gln Ala Gln Tyr Lys Glu Ser 225 230 235 240 Pro Asn Lys Asn Phe Val Phe Val Gly Thr Asn Ser Arg Ser Ala Thr 245 250 255 Ala Glu Gln Gln Ile Asn Ile Ile Lys Glu Ala Lys Lys Leu Asp Ser 260 265 270 Glu Ile Ile Pro Asn Ser Ile Asp Gly Tyr Asp Leu Phe Phe Lys Gly 275 280 285 His Pro Ser Ala Thr Tyr Asn Gln Gln Ile Val Asp Ala His Asp Met 290 295 300 Thr Glu Ile Tyr Asn Arg Thr Pro Phe Glu Val Leu Ala Met Thr Ser 305 310 315 320 Ser Leu Pro Asp Ala Val Gly Gly Met Gly Ser Ser Leu Phe Phe Ser 325 330 335 Leu Pro Lys Thr Val Glu Thr Lys Phe Ile Phe Tyr Lys Ser Gly Thr 340 345 350 Asp Ile Glu Ser Asn Ala Leu Ile Gln Val Met Leu Lys Leu Gly Ile 355 360 365 Ile Thr Asp Glu Lys Val Arg Phe Thr Thr Asp Ile Lys 370 375 380 <210> 55 <211> 483 <212> PRT <213> Alistipes sp. <400> 55 Met Ala Ser Cys Ser Asp Asp Asp Lys Glu Gln Thr Gly Phe Gln Ile 1 5 10 15 Asp Asp Gly Ser Gly Phe Leu Ser Leu Asp Ala Ala Ala Arg Ser Gly 20 25 30 Ser Ile Ala Ile Thr Ala Asn Asn Ser Trp Ser Val Thr Gln Asp Lys 35 40 45 Asp Ser Glu Trp Leu Thr Leu Ser Thr Thr Ser Gly Ala Ala Gly Arg 50 55 60 Thr Glu Ile Gly Ile Met Leu Glu Ala Asn Pro Gly Glu Ala Arg Asn 65 70 75 80 Ala Gly Leu Thr Phe Asn Ser Gly Gly Arg Thr Tyr Pro Phe Val Ile 85 90 95 Thr Gln Ser Ala His Val Thr Ala Asp Phe Asp Asp Ala Asp His Cys 100 105 110 Phe Tyr Ile Thr Phe Gly Thr Leu Pro Thr Leu Tyr Ala Gly Leu His 115 120 125 Val Leu Ser His Asp Lys Pro Ser Tyr Val Phe Phe Gln Arg Ser Gln 130 135 140 Thr Phe Arg Pro Glu Glu Phe Pro Ala His Ala Glu Val Thr Ile Ala 145 150 155 160 Ala Asp Pro Ser Ala Asn Ala Thr Asp Glu Asp Met Glu Arg Met Arg 165 170 175 Thr Ala Met Lys Gln Gln Ile Leu Lys Ile Asn Val Glu Asp Pro Thr 180 185 190 Ala Val Phe Gly Leu Tyr Val Asp Asp Leu Arg Cys Gly Ile Gly Tyr 195 200 205 Asp Trp Phe Val Ala Gln Gly Ile Asp Ser Thr Arg Val Lys Val Ser 210 215 220 Met Leu Ser Asp Gly Thr Gly Thr Tyr Asn Asn Phe Tyr Asn Tyr Phe 225 230 235 240 Gly Asp Pro Ala Thr Ala Glu Gln Asn Trp Glu Asn Tyr Ala Ala Gln 245 250 255 Val Glu Ala Leu Asp Trp Gln His Gly Gly Arg Phe Pro Glu Thr Arg 260 265 270 Met Pro Asp Gly Phe Asp Phe Tyr Glu Trp Pro Tyr Tyr Leu Ala Thr 275 280 285 Arg Pro Asn Tyr Arg Leu Val Leu Gln Asp Asp Asp Leu Leu Glu Ala 290 295 300 Thr Ser Pro Phe Met Thr Glu Arg Leu Gln Gln Met Arg Thr Glu Ser 305 310 315 320 Lys Gln Pro Tyr Glu Leu Leu Ala Ser Leu Pro Ala Glu Ala Arg Gln 325 330 335 Arg Phe Phe Arg Met Ala Gly Phe Asp Tyr Asp Ala Phe Ala Ala Leu 340 345 350 Phe Asp Ala Ser Pro Lys Lys Asn Leu Val Ile Ile Gly Thr Ser His 355 360 365 Thr Ser Glu Glu Ser Glu Ala Gln Gln Ala Ala Tyr Val Glu Arg Ile 370 375 380 Ile Gly Asp Tyr Gly Thr Ala Tyr Asp Ile Phe Phe Lys Pro His Pro 385 390 395 400 Ala Asp Ser Ser Ser Ser Asn Tyr Glu Glu Arg Phe Glu Gly Leu Thr 405 410 415 Leu Leu Pro Gly Gln Met Pro Phe Glu Ile Phe Val Trp Ser Leu Leu 420 425 430 Asp Lys Val Asp Leu Ile Gly Gly Tyr Ser Ser Thr Val Phe Leu Thr 435 440 445 Val Pro Val Glu Lys Thr Gly Phe Ile Phe Ala Ala Asn Ala Glu Ser 450 455 460 Leu Pro Arg Pro Leu Asn Val Leu Phe Arg Asn Ala Glu His Val Arg 465 470 475 480 Trp Ile Gln <210> 56 <211> 483 <212> PRT <213> Alistipes shahii <400> 56 Met Asp Asp Gly Thr Pro Ser Val Ser Ile Asn Gly Gly Thr Asp Phe 1 5 10 15 Leu Ser Leu Asp His Leu Ala Arg Ser Gly Lys Ile Thr Val Asn Ala 20 25 30 Pro Ala Pro Trp Ser Val Thr Leu Ala Pro Glu Asn Tyr Gly Gln Asp 35 40 45 Glu Lys Pro Asp Trp Leu Thr Leu Ser Ala Glu Glu Gly Pro Ala Gly 50 55 60 Tyr Ser Glu Ile Asp Val Thr Phe Ala Glu Asn Pro Gly Pro Ala Arg 65 70 75 80 Ser Ala Ser Leu Leu Phe Ser Cys Asp Gly Lys Thr Leu Ala Phe Thr 85 90 95 Val Ser Gln Ser Ala Gly Gly Thr Gly Phe Asp Ala Pro Asp Tyr Tyr 100 105 110 Phe Tyr Ile Ser Val Gly Thr Met Pro Thr Leu Tyr Ser Gly Leu His 115 120 125 Leu Leu Ser His Asp Lys Pro Ser Tyr Val Ser Tyr Glu Arg Ala Ser 130 135 140 Thr Phe Asp Ala Ala Glu Phe Pro Asp Arg Ala Phe Val Tyr Pro Val 145 150 155 160 Ala Asp Pro Thr Gly His Ala Thr Asn Glu Glu Leu Arg Ala Met Ser 165 170 175 Glu Ala Met Lys Arg Arg Ile Leu Glu Ile Asn Ala Glu Asp Pro Thr 180 185 190 Ala Val Phe Gly Leu Trp Val Asp Asp Leu Arg Cys Arg Leu Gly Tyr 195 200 205 Asp Trp Phe Val Ala Gln Gly Ile Asp Ser Ala Arg Val Lys Val Thr 210 215 220 Met Leu Ser Asp Gly Thr Ala Thr Tyr Asn Asn Phe His Asn Tyr Phe 225 230 235 240 Gly Asp Ala Ala Thr Ala Glu Gln Asn Trp Asn Asp Tyr Ala Ala Glu 245 250 255 Val Glu Ala Leu Asp Trp Asn His Gly Gly Arg Tyr Pro Glu Thr Arg 260 265 270 Ala Pro Glu Glu Phe Ala Ser Tyr Thr Trp Pro Tyr Tyr Leu Ser Thr 275 280 285 Arg Pro Asp Tyr Arg Leu Met Leu Gln Asn Ser Ser Leu Met Glu Ser 290 295 300 Ser Cys Pro Phe Ile Ala Asp Arg Leu Ala Ala Met Lys Met Glu Ser 305 310 315 320 Val Gln Pro Tyr Glu Leu Leu Thr Ala Leu Pro Glu Ala Ser Lys Gln 325 330 335 Gln Phe Tyr Arg Met Ala Lys Phe Asp Tyr Ala Arg Phe Ala Gly Leu 340 345 350 Phe Asp Leu Ser Pro Lys Lys Asn Leu Ile Ile Ile Gly Thr Ser His 355 360 365 Ser Ser Ala Ala Ser Glu Gln Gln Gln Ala Ala Tyr Val Glu Arg Ile 370 375 380 Ile Gln Gln Tyr Gly Ser Asp Tyr Asp Ile Phe Phe Lys Pro His Pro 385 390 395 400 Ala Asp Ser Ser Ser Ala Gly Tyr Pro Asp Arg Phe Glu Gly Leu Thr 405 410 415 Leu Leu Pro Gly Gln Met Pro Phe Glu Ile Phe Val Trp Ala Leu Leu 420 425 430 Asp Lys Ile Asp Met Ile Gly Gly Tyr Pro Ser Thr Thr Phe Ile Ser 435 440 445 Val Pro Leu Asp Lys Val Gly Phe Leu Phe Ala Ala Asp Ala Asp Gly 450 455 460 Leu Val Arg Pro Leu Asn Ile Leu Phe Arg Asp Ala Ala Asn Val Glu 465 470 475 480 Trp Ile Gln <210> 57 <211> 401 <212> PRT <213> Actinobacillus suis <400> 57 Met Glu Arg Thr Pro Gln Leu Gln Ala Val Asp Ile Tyr Ile Asp Phe 1 5 10 15 Ala Thr Ile Pro Ser Leu Ser Tyr Phe Leu His Phe Leu Lys His Lys 20 25 30 His Asp Asp Gln Arg Leu Arg Leu Phe Ser Leu Ala Arg Phe Glu Met 35 40 45 Pro Gln Thr Leu Ile Glu Gln Tyr Glu Gly Ile Ile Gln Phe Ser Arg 50 55 60 Asn Val Glu His Asn Val Glu Pro Leu Leu Glu Gln Leu Gln Thr Ile 65 70 75 80 Leu Ser Gln Glu Gly Lys Gln Phe Glu Leu His Leu His Leu Asn Leu 85 90 95 Phe His Ser Phe Glu Met Phe Leu Asn Leu Ser Pro Thr Tyr Thr Gln 100 105 110 Tyr Lys Glu Lys Ile Ser Lys Ile Val Leu His Leu Tyr Asp Asp Gly 115 120 125 Ser Glu Gly Val Met Lys Gln Tyr Gln Leu Gln Lys Ser Ser Ser Leu 130 135 140 Val Gln Asp Leu Ala Ala Thr Lys Ala Ser Leu Val Ser Leu Phe Glu 145 150 155 160 Asn Gly Glu Gly Ser Phe Ser Gln Ile Asp Leu Ile Arg Tyr Val Trp 165 170 175 Asn Ala Val Leu Glu Thr His Tyr Tyr Leu Leu Ser Asp His Phe Leu 180 185 190 Leu Asp Glu Lys Leu Gln Pro Leu Lys Ala Glu Leu Gly His Tyr Gln 195 200 205 Leu Leu Asn Leu Ser Ala Tyr Gln Tyr Leu Ser Ser Glu Asp Leu Leu 210 215 220 Trp Leu Lys Gln Ile Leu Lys Ile Asp Thr Glu Leu Glu Ser Leu Met 225 230 235 240 Gln Lys Leu Thr Ala Gln Pro Val Tyr Phe Phe Ser Gly Thr Thr Phe 245 250 255 Phe Asn Ile Ser Phe Glu Asp Lys Gln Arg Leu Ala Asn Ile His Ala 260 265 270 Ile Leu Ile Arg Glu His Leu Asp Pro Asn Ser Gln Leu Phe Ile Gly 275 280 285 Glu Pro Tyr Leu Phe Val Phe Lys Gly His Pro Asn Ser Pro Glu Ile 290 295 300 Asn Gln Ala Leu Arg Glu Tyr Tyr Pro Asn Val Ile Phe Leu Pro Glu 305 310 315 320 Asn Ile Pro Phe Glu Ile Leu Thr Leu Leu Gly Phe Ser Pro Gln Lys 325 330 335 Ile Gly Gly Phe Ala Ser Thr Ile His Val Asn Ser Glu Gln Ser Lys 340 345 350 Leu Ala Lys Leu Phe Phe Leu Thr Ser Thr Asp Glu Gln Glu Arg Gln 355 360 365 Leu Ser Asp Gly Tyr Ile Lys Gln Tyr Ala Leu Ala Gln Ala Met Leu 370 375 380 Glu Met Gln Leu Val Ser Gln Glu Gln Val Tyr Tyr Cys Ser Leu Ser 385 390 395 400 Ser <210> 58 <211> 401 <212> PRT <213> Actinobacillus capsulatus <400> 58 Met Glu Arg Ile Pro Gln Leu Gln Ala Val Asp Ile Tyr Ile Asp Phe 1 5 10 15 Ala Thr Ile Pro Ser Leu Ser Tyr Phe Leu His Phe Leu Lys His Lys 20 25 30 His Asp His Gln Arg Leu Arg Leu Phe Ser Leu Ala Arg Phe Glu Met 35 40 45 Pro Gln Thr Val Ile Glu Gln Tyr Glu Gly Ile Ile Gln Phe Ser Arg 50 55 60 Asn Val Glu His Asn Val Glu Gln Leu Leu Glu Gln Leu Gln Thr Ile 65 70 75 80 Leu Ser Gln Glu Gly Lys Gln Phe Glu Leu His Leu His Leu Asn Leu 85 90 95 Phe His Ser Phe Glu Met Phe Leu Asn Leu Ser Pro Thr Tyr Thr Lys 100 105 110 Tyr Lys Glu Lys Ile Ser Lys Ile Val Leu His Leu Tyr Asp Asp Gly 115 120 125 Ser Glu Gly Val Met Lys Gln Tyr Gln Leu Gln Gln Ser Asn Ser Leu 130 135 140 Ala Gln Asp Leu Ala Ser Thr Lys Ala Ser Leu Val Ser Leu Phe Lys 145 150 155 160 Asn Gly Glu Gly Ala Phe Ser Gln Ile Asp Leu Ile Arg Tyr Val Trp 165 170 175 Asn Ala Val Leu Glu Thr His Tyr Tyr Leu Leu Ser Asp His Phe Leu 180 185 190 Ala His Glu Lys Leu Gln Pro Leu Lys Ile Glu Leu Gly His Tyr Gln 195 200 205 Leu Leu Asn Leu Ser Ala Tyr Gln Tyr Leu Ser Ser Glu Asp Leu Leu 210 215 220 Trp Leu Lys Gln Ile Leu Lys Ile Asp Ala Glu Leu Glu Ser Leu Met 225 230 235 240 His Lys Leu Thr Thr Gln Pro Val Tyr Phe Phe Ser Gly Thr Thr Phe 245 250 255 Phe Asn Ile Ser Phe Glu Asp Lys Gln Arg Leu Ala Asn Ile His Ala 260 265 270 Ile Leu Ile Arg Glu His Leu Asp Pro Asn Ser Gln Leu Phe Ile Gly 275 280 285 Glu Pro Tyr Leu Phe Val Phe Lys Gly His Pro Asn Ser Pro Glu Ile 290 295 300 Asn Gln Ala Leu Arg Glu Tyr Tyr Pro Asn Ala Ile Phe Leu Pro Glu 305 310 315 320 Asn Ile Pro Phe Glu Ile Leu Thr Leu Leu Gly Phe Ser Pro Gln Lys 325 330 335 Ile Gly Gly Phe Ala Ser Thr Ile His Val Asn Ser Glu Gln Ser Lys 340 345 350 Leu Ala Lys Leu Phe Phe Leu Thr Ser Thr Asp Glu Gln Glu Arg Asn 355 360 365 Arg Ser Asp Gly Tyr Ile Lys Gln Tyr Ala Leu Ala Gln Ala Met Leu 370 375 380 Glu Met Gln Leu Val Ser Gln Glu Gln Val Tyr Tyr Cys Ser Leu Ser 385 390 395 400 Ser <210> 59 <211> 311 <212> PRT <213> Haemophilus somnus <400> 59 Met Phe Arg Glu Asp Asn Met Asn Leu Ile Ile Cys Cys Thr Pro Leu 1 5 10 15 Gln Val Ile Ile Ala Glu Lys Ile Ile Glu Arg Tyr Pro Glu Gln Lys 20 25 30 Phe Tyr Gly Val Met Leu Glu Ser Phe Tyr Asn Asp Lys Phe Asp Phe 35 40 45 Tyr Glu Asn Lys Leu Lys His Leu Cys His Glu Phe Phe Cys Ile Lys 50 55 60 Ile Ala Arg Phe Lys Leu Glu Arg Tyr Lys Asn Leu Leu Ser Leu Leu 65 70 75 80 Lys Ile Lys Asn Lys Thr Phe Asp Arg Val Phe Leu Ala Asn Ile Glu 85 90 95 Lys Arg Tyr Ile His Ile Ile Leu Ser Asn Ile Phe Phe Lys Glu Leu 100 105 110 Tyr Thr Phe Asp Asp Gly Thr Ala Asn Ile Ala Pro Asn Ser His Leu 115 120 125 Tyr Gln Glu Tyr Asp His Ser Leu Lys Lys Arg Ile Thr Asp Ile Leu 130 135 140 Leu Pro Asn His Tyr Asn Ser Asn Lys Val Lys Asn Ile Ser Lys Leu 145 150 155 160 His Tyr Ser Ile Tyr Arg Cys Lys Asn Asn Ile Ile Asp Asn Ile Glu 165 170 175 Tyr Met Pro Leu Phe Asn Leu Glu Lys Lys Tyr Thr Ala Gln Asp Lys 180 185 190 Ser Ile Ser Ile Leu Leu Gly Gln Pro Ile Phe Tyr Asp Glu Glu Lys 195 200 205 Asn Ile Arg Leu Ile Lys Glu Val Ile Ala Lys Phe Lys Ile Asp Tyr 210 215 220 Tyr Phe Pro His Pro Arg Glu Asp Tyr Tyr Ile Asp Asn Val Ser Tyr 225 230 235 240 Ile Lys Thr Pro Leu Ile Phe Glu Glu Phe Tyr Ala Glu Arg Ser Ile 245 250 255 Glu Asn Ser Ile Lys Ile Tyr Thr Phe Phe Ser Ser Ala Val Leu Asn 260 265 270 Ile Val Thr Lys Glu Asn Ile Asp Arg Ile Tyr Ala Leu Lys Pro Lys 275 280 285 Leu Thr Glu Lys Ala Tyr Leu Asp Cys Tyr Asp Ile Leu Lys Asp Phe 290 295 300 Gly Ile Lys Val Ile Asp Ile 305 310 <210> 60 <211> 399 <212> PRT <213> Haemophilus ducreyi <400> 60 Met Leu Ile Gln Gln Asn Leu Glu Ile Tyr Leu Asp Tyr Ala Thr Ile 1 5 10 15 Pro Ser Leu Ala Cys Phe Met His Phe Ile Gln His Lys Asp Asp Val 20 25 30 Asp Ser Ile Arg Leu Phe Gly Leu Ala Arg Phe Asp Ile Pro Gln Ser 35 40 45 Ile Ile Asp Arg Tyr Pro Ala Asn His Leu Phe Tyr His Asn Ile Asp 50 55 60 Asn Arg Asp Leu Thr Ala Val Leu Asn Gln Leu Ala Asp Ile Leu Ala 65 70 75 80 Gln Glu Asn Lys Arg Phe Gln Ile Asn Leu His Leu Asn Leu Phe His 85 90 95 Ser Ile Asp Leu Phe Phe Ala Ile Tyr Pro Ile Tyr Gln Gln Tyr Gln 100 105 110 His Lys Ile Ser Thr Ile Gln Leu Gln Leu Tyr Asp Asp Gly Ser Glu 115 120 125 Gly Ile Val Thr Gln His Ser Leu Cys Lys Ile Ala Asp Leu Glu Gln 130 135 140 Leu Ile Leu Gln His Lys Asn Val Leu Leu Glu Leu Leu Thr Lys Gly 145 150 155 160 Thr Ala Asn Val Pro Asn Pro Thr Leu Leu Arg Tyr Leu Trp Asn Asn 165 170 175 Ile Ile Asp Ser Gln Phe His Leu Ile Ser Asp His Phe Leu Gln His 180 185 190 Pro Lys Leu Gln Pro Leu Lys Arg Leu Leu Lys Arg Tyr Thr Ile Leu 195 200 205 Asp Phe Thr Cys Tyr Pro Arg Phe Asn Ala Glu Gln Lys Gln Leu Leu 210 215 220 Lys Glu Ile Leu His Ile Ser Asn Glu Leu Glu Asn Leu Leu Lys Leu 225 230 235 240 Leu Lys Gln His Asn Thr Phe Leu Phe Thr Gly Thr Thr Ala Phe Asn 245 250 255 Leu Asp Gln Glu Lys Leu Asp Leu Leu Thr Gln Leu His Ile Leu Leu 260 265 270 Leu Asn Glu His Gln Asn Pro His Ser Thr His Tyr Ile Gly Asn Asn 275 280 285 Tyr Leu Leu Leu Ile Lys Gly His Ala Asn Ser Pro Ala Leu Asn His 290 295 300 Thr Leu Ala Leu His Phe Pro Asp Ala Ile Phe Leu Pro Ala Asn Ile 305 310 315 320 Pro Phe Glu Ile Phe Ala Met Leu Gly Phe Thr Pro Asn Lys Met Gly 325 330 335 Gly Phe Ala Ser Thr Ser Tyr Ile Asn Tyr Pro Thr Glu Asn Ile Asn 340 345 350 His Leu Phe Phe Leu Thr Ser Asp Gln Pro Ser Ile Arg Thr Lys Trp 355 360 365 Leu Asp Tyr Glu Lys Gln Phe Gly Leu Met Tyr Ser Leu Leu Ala Met 370 375 380 Gln Lys Ile Asn Glu Asp Gln Ala Phe Met Cys Thr Ile His Asn 385 390 395 <210> 61 <211> 497 <212> PRT <213> Photobacterium leiognathi <400> 61 Met Cys Asn Asp Asn Gln Asn Thr Val Asp Val Val Val Ser Thr Val 1 5 10 15 Asn Asp Asn Val Ile Glu Asn Asn Thr Tyr Gln Val Lys Pro Ile Asp 20 25 30 Thr Pro Thr Thr Phe Asp Ser Tyr Ser Trp Ile Gln Thr Cys Gly Thr 35 40 45 Pro Ile Leu Lys Asp Asp Glu Lys Tyr Ser Leu Ser Phe Asp Phe Val 50 55 60 Ala Pro Glu Leu Asp Gln Asp Glu Lys Phe Cys Phe Glu Phe Thr Gly 65 70 75 80 Asp Val Asp Gly Lys Arg Tyr Val Thr Gln Thr Asn Leu Thr Val Val 85 90 95 Ala Pro Thr Leu Glu Val Tyr Val Asp His Ala Ser Leu Pro Ser Leu 100 105 110 Gln Gln Leu Met Lys Ile Ile Gln Gln Lys Asn Glu Tyr Ser Gln Asn 115 120 125 Glu Arg Phe Ile Ser Trp Gly Arg Ile Gly Leu Thr Glu Asp Asn Ala 130 135 140 Glu Lys Leu Asn Ala His Ile Tyr Pro Leu Ala Gly Asn Asn Thr Ser 145 150 155 160 Gln Glu Leu Val Asp Ala Val Ile Asp Tyr Ala Asp Ser Lys Asn Arg 165 170 175 Leu Asn Leu Glu Leu Asn Thr Asn Thr Ala His Ser Phe Pro Asn Leu 180 185 190 Ala Pro Ile Leu Arg Ile Ile Ser Ser Lys Ser Asn Ile Leu Ile Ser 195 200 205 Asn Ile Asn Leu Tyr Asp Asp Gly Ser Ala Glu Tyr Val Asn Leu Tyr 210 215 220 Asn Trp Lys Asp Thr Glu Asp Lys Ser Val Lys Leu Ser Asp Ser Phe 225 230 235 240 Leu Val Leu Lys Asp Tyr Phe Asn Gly Ile Ser Ser Glu Lys Pro Ser 245 250 255 Gly Ile Tyr Gly Arg Tyr Asn Trp His Gln Leu Tyr Asn Thr Ser Tyr 260 265 270 Tyr Phe Leu Arg Lys Asp Tyr Leu Thr Val Glu Pro Gln Leu His Asp 275 280 285 Leu Arg Glu Tyr Leu Gly Gly Ser Leu Lys Gln Met Ser Trp Asp Gly 290 295 300 Phe Ser Gln Leu Ser Lys Gly Asp Lys Glu Leu Phe Leu Asn Ile Val 305 310 315 320 Gly Phe Asp Gln Glu Lys Leu Gln Gln Glu Tyr Gln Gln Ser Glu Leu 325 330 335 Pro Asn Phe Val Phe Thr Gly Thr Thr Thr Trp Ala Gly Gly Glu Thr 340 345 350 Lys Glu Tyr Tyr Ala Gln Gln Gln Val Asn Val Val Asn Asn Ala Ile 355 360 365 Asn Glu Thr Ser Pro Tyr Tyr Leu Gly Arg Glu His Asp Leu Phe Phe 370 375 380 Lys Gly His Pro Arg Gly Gly Ile Ile Asn Asp Ile Ile Leu Gly Ser 385 390 395 400 Phe Asn Asn Met Ile Asp Ile Pro Ala Lys Val Ser Phe Glu Val Leu 405 410 415 Met Met Thr Gly Met Leu Pro Asp Thr Val Gly Gly Ile Ala Ser Ser 420 425 430 Leu Tyr Phe Ser Ile Pro Ala Glu Lys Val Ser Phe Ile Val Phe Thr 435 440 445 Ser Ser Asp Thr Ile Thr Asp Arg Glu Asp Ala Leu Lys Ser Pro Leu 450 455 460 Val Gln Val Met Met Thr Leu Gly Ile Val Lys Glu Lys Asp Val Leu 465 470 475 480 Phe Trp Ser Asp Leu Pro Asp Cys Ser Ser Gly Val Cys Ile Ala Gln 485 490 495 Tyr <210> 62 <211> 498 <212> PRT <213> Photobacterium sp. <400> 62 Met Ser Glu Glu Asn Thr Gln Ser Ile Ile Lys Asn Asp Ile Asn Lys 1 5 10 15 Thr Ile Ile Asp Glu Glu Tyr Val Asn Leu Glu Pro Ile Asn Gln Ser 20 25 30 Asn Ile Ser Phe Thr Lys His Ser Trp Val Gln Thr Cys Gly Thr Gln 35 40 45 Gln Leu Leu Thr Glu Gln Asn Lys Glu Ser Ile Ser Leu Ser Val Val 50 55 60 Ala Pro Arg Leu Asp Asp Asp Glu Lys Tyr Cys Phe Asp Phe Asn Gly 65 70 75 80 Val Ser Asn Lys Gly Glu Lys Tyr Ile Thr Lys Val Thr Leu Asn Val 85 90 95 Val Ala Pro Ser Leu Glu Val Tyr Val Asp His Ala Ser Leu Pro Thr 100 105 110 Leu Gln Gln Leu Met Asp Ile Ile Lys Ser Glu Glu Glu Asn Pro Thr 115 120 125 Ala Gln Arg Tyr Ile Ala Trp Gly Arg Ile Val Pro Thr Asp Glu Gln 130 135 140 Met Lys Glu Leu Asn Ile Thr Ser Phe Ala Leu Ile Asn Asn His Thr 145 150 155 160 Pro Ala Asp Leu Val Gln Glu Ile Val Lys Gln Ala Gln Thr Lys His 165 170 175 Arg Leu Asn Val Lys Leu Ser Ser Asn Thr Ala His Ser Phe Asp Asn 180 185 190 Leu Val Pro Ile Leu Lys Glu Leu Asn Ser Phe Asn Asn Val Thr Val 195 200 205 Thr Asn Ile Asp Leu Tyr Asp Asp Gly Ser Ala Glu Tyr Val Asn Leu 210 215 220 Tyr Asn Trp Arg Asp Thr Leu Asn Lys Thr Asp Asn Leu Lys Ile Gly 225 230 235 240 Lys Asp Tyr Leu Glu Asp Val Ile Asn Gly Ile Asn Glu Asp Thr Ser 245 250 255 Asn Thr Gly Thr Ser Ser Val Tyr Asn Trp Gln Lys Leu Tyr Pro Ala 260 265 270 Asn Tyr His Phe Leu Arg Lys Asp Tyr Leu Thr Leu Glu Pro Ser Leu 275 280 285 His Glu Leu Arg Asp Tyr Ile Gly Asp Ser Leu Lys Gln Met Gln Trp 290 295 300 Asp Gly Phe Lys Lys Phe Asn Ser Lys Gln Gln Glu Leu Phe Leu Ser 305 310 315 320 Ile Val Asn Phe Asp Lys Gln Lys Leu Gln Asn Glu Tyr Asn Ser Ser 325 330 335 Asn Leu Pro Asn Phe Val Phe Thr Gly Thr Thr Val Trp Ala Gly Asn 340 345 350 His Glu Arg Glu Tyr Tyr Ala Lys Gln Gln Ile Asn Val Ile Asn Asn 355 360 365 Ala Ile Asn Glu Ser Ser Pro His Tyr Leu Gly Asn Ser Tyr Asp Leu 370 375 380 Phe Phe Lys Gly His Pro Gly Gly Gly Ile Ile Asn Thr Leu Ile Met 385 390 395 400 Gln Asn Tyr Pro Ser Met Val Asp Ile Pro Ser Lys Ile Ser Phe Glu 405 410 415 Val Leu Met Met Thr Asp Met Leu Pro Asp Ala Val Ala Gly Ile Ala 420 425 430 Ser Ser Leu Tyr Phe Thr Ile Pro Ala Glu Lys Ile Lys Phe Ile Val 435 440 445 Phe Thr Ser Thr Glu Thr Ile Thr Asp Arg Glu Thr Ala Leu Arg Ser 450 455 460 Pro Leu Val Gln Val Met Ile Lys Leu Gly Ile Val Lys Glu Glu Asn 465 470 475 480 Val Leu Phe Trp Ala Asp Leu Pro Asn Cys Glu Thr Gly Val Cys Ile 485 490 495 Ala Val <210> 63 <211> 482 <212> PRT <213> Photobacterium leiognathi <400> 63 Met Asn Asp Asn Gln Asn Thr Val Asp Val Val Val Ser Thr Val Asn 1 5 10 15 Asp Asn Val Ile Glu Asn Asn Thr Tyr Gln Val Lys Pro Ile Asp Thr 20 25 30 Pro Thr Thr Phe Asp Ser Tyr Ser Trp Ile Gln Thr Cys Gly Thr Pro 35 40 45 Ile Leu Lys Asp Asp Glu Lys Tyr Ser Leu Ser Phe Asp Phe Val Ala 50 55 60 Pro Glu Leu Asp Gln Asp Glu Lys Phe Cys Phe Glu Phe Thr Gly Asp 65 70 75 80 Val Asp Gly Lys Arg Tyr Val Thr Gln Thr Asn Leu Thr Val Val Ala 85 90 95 Pro Thr Leu Glu Val Tyr Val Asp His Ala Ser Leu Pro Ser Leu Gln 100 105 110 Gln Leu Met Lys Ile Ile Gln Gln Lys Asn Glu Tyr Ser Gln Asn Glu 115 120 125 Arg Phe Ile Ser Trp Gly Arg Ile Arg Leu Thr Glu Asp Asn Ala Glu 130 135 140 Lys Leu Asn Ala His Ile Tyr Pro Leu Ala Gly Asn Asn Thr Ser Gln 145 150 155 160 Glu Leu Val Asp Ala Val Ile Asp Tyr Ala Asp Ser Lys Asn Arg Leu 165 170 175 Asn Leu Glu Leu Asn Thr Asn Thr Gly His Ser Phe Arg Asn Ile Ala 180 185 190 Pro Ile Leu Arg Ala Thr Ser Ser Lys Asn Asn Ile Leu Ile Ser Asn 195 200 205 Ile Asn Leu Tyr Asp Asp Gly Ser Ala Glu Tyr Val Ser Leu Tyr Asn 210 215 220 Trp Lys Asp Thr Asp Asn Lys Ser Gln Lys Leu Ser Asp Ser Phe Leu 225 230 235 240 Val Leu Lys Asp Tyr Leu Asn Gly Ile Ser Ser Glu Lys Pro Asn Gly 245 250 255 Ile Tyr Ser Ile Tyr Asn Trp His Gln Leu Tyr His Ser Ser Tyr Tyr 260 265 270 Phe Leu Arg Lys Asp Tyr Leu Thr Val Glu Thr Lys Leu His Asp Leu 275 280 285 Arg Glu Tyr Leu Gly Gly Ser Leu Lys Gln Met Ser Trp Asp Thr Phe 290 295 300 Ser Gln Leu Ser Lys Gly Asp Lys Glu Leu Phe Leu Asn Ile Val Gly 305 310 315 320 Phe Asp Gln Glu Lys Leu Gln Gln Glu Tyr Gln Gln Ser Glu Leu Pro 325 330 335 Asn Phe Val Phe Thr Gly Thr Thr Thr Trp Ala Gly Gly Glu Thr Lys 340 345 350 Glu Tyr Tyr Ala Gln Gln Gln Val Asn Val Val Asn Asn Ala Ile Asn 355 360 365 Glu Thr Ser Pro Tyr Tyr Leu Gly Arg Glu His Asp Leu Phe Phe Lys 370 375 380 Gly His Pro Arg Gly Gly Ile Ile Asn Asp Ile Ile Leu Gly Ser Phe 385 390 395 400 Asn Asn Met Ile Asp Ile Pro Ala Lys Val Ser Phe Glu Val Leu Met 405 410 415 Met Thr Gly Met Leu Pro Asp Thr Val Gly Gly Ile Ala Ser Ser Leu 420 425 430 Tyr Phe Ser Ile Pro Ala Glu Lys Val Ser Phe Ile Val Phe Thr Ser 435 440 445 Ser Asp Thr Ile Thr Asp Arg Glu Asp Ala Leu Lys Ser Pro Leu Val 450 455 460 Gln Val Met Met Thr Leu Gly Ile Val Lys Glu Lys Asp Val Leu Phe 465 470 475 480 Trp Cys <210> 64 <211> 675 <212> PRT <213> Photobacterium damsela <400> 64 Met Lys Lys Ile Leu Thr Val Leu Ser Ile Phe Ile Leu Ser Ala Cys 1 5 10 15 Asn Ser Asp Asn Thr Ser Leu Lys Glu Thr Val Ser Ser Asn Ser Ala 20 25 30 Asp Val Val Glu Thr Glu Thr Tyr Gln Leu Thr Pro Ile Asp Ala Pro 35 40 45 Ser Ser Phe Leu Ser His Ser Trp Glu Gln Thr Cys Gly Thr Pro Ile 50 55 60 Leu Asn Glu Ser Asp Lys Gln Ala Ile Ser Phe Asp Phe Val Ala Pro 65 70 75 80 Glu Leu Lys Gln Asp Glu Lys Tyr Cys Phe Thr Phe Lys Gly Ile Thr 85 90 95 Gly Asp His Arg Tyr Ile Thr Asn Thr Thr Leu Thr Val Val Ala Pro 100 105 110 Thr Leu Glu Val Tyr Ile Asp His Ala Ser Leu Pro Ser Leu Gln Gln 115 120 125 Leu Ile His Ile Ile Gln Ala Lys Asp Glu Tyr Pro Ser Asn Gln Arg 130 135 140 Phe Val Ser Trp Lys Arg Val Thr Val Asp Ala Asp Asn Ala Asn Lys 145 150 155 160 Leu Asn Ile His Thr Tyr Pro Leu Lys Gly Asn Asn Thr Ser Pro Glu 165 170 175 Met Val Ala Ala Ile Asp Glu Tyr Ala Gln Ser Lys Asn Arg Leu Asn 180 185 190 Ile Glu Phe Tyr Thr Asn Thr Ala His Val Phe Asn Asn Leu Pro Pro 195 200 205 Ile Ile Gln Pro Leu Tyr Asn Asn Glu Lys Val Lys Ile Ser His Ile 210 215 220 Ser Leu Tyr Asp Asp Gly Ser Ser Glu Tyr Val Ser Leu Tyr Gln Trp 225 230 235 240 Lys Asp Thr Pro Asn Lys Ile Glu Thr Leu Glu Gly Glu Val Ser Leu 245 250 255 Leu Ala Asn Tyr Leu Ala Gly Thr Ser Pro Asp Ala Pro Lys Gly Met 260 265 270 Gly Asn Arg Tyr Asn Trp His Lys Leu Tyr Asp Thr Asp Tyr Tyr Phe 275 280 285 Leu Arg Glu Asp Tyr Leu Asp Val Glu Ala Asn Leu His Asp Leu Arg 290 295 300 Asp Tyr Leu Gly Ser Ser Ala Lys Gln Met Pro Trp Asp Glu Phe Ala 305 310 315 320 Lys Leu Ser Asp Ser Gln Gln Thr Leu Phe Leu Asp Ile Val Gly Phe 325 330 335 Asp Lys Glu Gln Leu Gln Gln Gln Tyr Ser Gln Ser Pro Leu Pro Asn 340 345 350 Phe Ile Phe Thr Gly Thr Thr Thr Trp Ala Gly Gly Glu Thr Lys Glu 355 360 365 Tyr Tyr Ala Gln Gln Gln Val Asn Val Ile Asn Asn Ala Ile Asn Glu 370 375 380 Thr Ser Pro Tyr Tyr Leu Gly Lys Asp Tyr Asp Leu Phe Phe Lys Gly 385 390 395 400 His Pro Ala Gly Gly Val Ile Asn Asp Ile Ile Leu Gly Ser Phe Pro 405 410 415 Asp Met Ile Asn Ile Pro Ala Lys Ile Ser Phe Glu Val Leu Met Met 420 425 430 Thr Asp Met Leu Pro Asp Thr Val Ala Gly Ile Ala Ser Ser Leu Tyr 435 440 445 Phe Thr Ile Pro Ala Asp Lys Val Asn Phe Ile Val Phe Thr Ser Ser 450 455 460 Asp Thr Ile Thr Asp Arg Glu Glu Ala Leu Lys Ser Pro Leu Val Gln 465 470 475 480 Val Met Leu Thr Leu Gly Ile Val Lys Glu Lys Asp Val Leu Phe Trp 485 490 495 Ala Asp His Lys Val Asn Ser Met Glu Val Ala Ile Asp Glu Ala Cys 500 505 510 Thr Arg Ile Ile Ala Lys Arg Gln Pro Thr Ala Ser Asp Leu Arg Leu 515 520 525 Val Ile Ala Ile Ile Lys Thr Ile Thr Asp Leu Glu Arg Ile Gly Asp 530 535 540 Val Ala Glu Ser Ile Ala Lys Val Ala Leu Glu Ser Phe Ser Asn Lys 545 550 555 560 Gln Tyr Asn Leu Leu Val Ser Leu Glu Ser Leu Gly Gln His Thr Val 565 570 575 Arg Met Leu His Glu Val Leu Asp Ala Phe Ala Arg Met Asp Val Lys 580 585 590 Ala Ala Ile Glu Val Tyr Gln Glu Asp Asp Arg Ile Asp Gln Glu Tyr 595 600 605 Glu Ser Ile Val Arg Gln Leu Met Ala His Met Met Glu Asp Pro Ser 610 615 620 Ser Ile Pro Asn Val Met Lys Val Met Trp Ala Ala Arg Ser Ile Glu 625 630 635 640 Arg Val Gly Asp Arg Cys Gln Asn Ile Cys Glu Tyr Ile Ile Tyr Phe 645 650 655 Val Lys Gly Lys Asp Val Arg His Thr Lys Pro Asp Asp Phe Gly Thr 660 665 670 Met Leu Asp 675 <210> 65 <211> 510 <212> PRT <213> Photobacterium damsela <400> 65 Met Lys Lys Ile Leu Thr Val Leu Ser Ile Phe Ile Leu Ser Ala Cys 1 5 10 15 Asn Ser Asp Asn Thr Ser Leu Lys Glu Thr Val Ser Ser Asn Ser Ala 20 25 30 Asp Val Val Glu Thr Glu Thr Tyr Gln Leu Thr Pro Ile Asp Ala Pro 35 40 45 Ser Ser Phe Leu Ser His Ser Trp Glu Gln Thr Cys Gly Thr Pro Ile 50 55 60 Leu Asn Glu Ser Asp Lys Gln Ala Ile Ser Phe Asp Phe Val Ala Pro 65 70 75 80 Glu Leu Lys Gln Asp Glu Lys Tyr Cys Phe Thr Phe Lys Gly Ile Thr 85 90 95 Gly Asp His Arg Tyr Ile Thr Asn Thr Thr Leu Thr Val Val Ala Pro 100 105 110 Thr Leu Glu Val Tyr Ile Asp His Ala Ser Leu Pro Ser Leu Gln Gln 115 120 125 Leu Ile His Ile Ile Gln Ala Lys Asp Glu Tyr Pro Ser Asn Gln Arg 130 135 140 Phe Val Ser Trp Lys Arg Val Thr Val Asp Ala Asp Asn Ala Asn Lys 145 150 155 160 Leu Asn Ile His Thr Tyr Pro Leu Lys Gly Asn Asn Thr Ser Pro Glu 165 170 175 Met Val Ala Ala Ile Asp Glu Tyr Ala Gln Ser Lys Asn Arg Leu Asn 180 185 190 Ile Glu Phe Tyr Thr Asn Thr Ala His Val Phe Asn Asn Leu Pro Pro 195 200 205 Ile Ile Gln Pro Leu Tyr Asn Asn Glu Lys Val Lys Ile Ser His Ile 210 215 220 Ser Leu Tyr Asp Asp Gly Ser Ser Glu Tyr Val Ser Leu Tyr Gln Trp 225 230 235 240 Lys Asp Thr Pro Asn Lys Ile Glu Thr Leu Glu Gly Glu Val Ser Leu 245 250 255 Leu Ala Asn Tyr Leu Ala Gly Thr Ser Pro Asp Ala Pro Lys Gly Met 260 265 270 Gly Asn Arg Tyr Asn Trp His Lys Leu Tyr Asp Thr Asp Tyr Tyr Phe 275 280 285 Leu Arg Glu Asp Tyr Leu Asp Val Glu Ala Asn Leu His Asp Leu Arg 290 295 300 Asp Tyr Leu Gly Ser Ser Ala Lys Gln Met Pro Trp Asp Glu Phe Ala 305 310 315 320 Lys Leu Ser Asp Ser Gln Gln Thr Leu Phe Leu Asp Ile Val Gly Phe 325 330 335 Asp Lys Glu Gln Leu Gln Gln Gln Tyr Ser Gln Ser Pro Leu Pro Asn 340 345 350 Phe Ile Phe Thr Gly Thr Thr Thr Trp Ala Gly Gly Glu Thr Lys Glu 355 360 365 Tyr Tyr Ala Gln Gln Gln Val Asn Val Ile Asn Asn Ala Ile Asn Glu 370 375 380 Thr Ser Pro Tyr Tyr Leu Gly Lys Asp Tyr Asp Leu Phe Phe Lys Gly 385 390 395 400 His Pro Ala Gly Gly Val Ile Asn Asp Ile Ile Leu Gly Ser Phe Pro 405 410 415 Asp Met Ile Asn Ile Pro Ala Lys Ile Ser Phe Glu Val Leu Met Met 420 425 430 Thr Asp Met Leu Pro Asp Thr Val Ala Gly Ile Ala Ser Ser Leu Tyr 435 440 445 Phe Thr Ile Pro Ala Asp Lys Val Asn Phe Ile Val Phe Thr Ser Ser 450 455 460 Asp Thr Ile Thr Asp Arg Glu Glu Ala Leu Lys Ser Pro Leu Val Gln 465 470 475 480 Val Met Leu Thr Leu Gly Ile Val Lys Glu Lys Asp Val Leu Phe Trp 485 490 495 Ala Asp Leu Pro Asp Cys Ser Ser Gly Val Cys Ile Asp Lys 500 505 510 <210> 66 <211> 422 <212> PRT <213> Heliobacter acinonychis <400> 66 Met Gly Thr Ile Lys Lys Pro Leu Ile Ile Ala Gly Asn Gly Pro Ser 1 5 10 15 Ile Lys Asp Leu Asp Tyr Ala Leu Phe Pro Lys Asp Phe Asp Val Phe 20 25 30 Arg Cys Asn Gln Phe Tyr Phe Glu Asp Lys Tyr Tyr Leu Gly Arg Glu 35 40 45 Ile Lys Gly Val Phe Phe Asn Pro Cys Val Leu Ser Ser Gln Met Gln 50 55 60 Thr Val Gln Tyr Leu Met Asp Asn Gly Glu Tyr Ser Ile Glu Arg Phe 65 70 75 80 Phe Cys Ser Val Ser Thr Asp Arg His Asp Phe Asp Gly Asp Tyr Gln 85 90 95 Thr Ile Leu Pro Val Asp Gly Tyr Leu Lys Ala His Tyr Pro Phe Val 100 105 110 Cys Asp Thr Phe Ser Leu Phe Lys Gly His Glu Glu Ile Leu Lys His 115 120 125 Val Lys Tyr His Leu Lys Thr Tyr Ser Lys Glu Leu Ser Ala Gly Val 130 135 140 Leu Met Leu Leu Ser Ala Val Val Leu Gly Tyr Lys Glu Ile Tyr Leu 145 150 155 160 Val Gly Ile Asp Phe Gly Ala Ser Ser Trp Gly His Phe Tyr Asp Glu 165 170 175 Ser Gln Ser Gln His Phe Ser Asn His Met Ala Asp Cys His Asn Ile 180 185 190 Tyr Tyr Asp Met Leu Thr Ile Cys Leu Cys Gln Lys Tyr Ala Lys Leu 195 200 205 Tyr Ala Leu Ala Pro Asn Ser Pro Leu Ser His Leu Leu Thr Leu Asn 210 215 220 Pro Gln Ala Lys Tyr Pro Phe Glu Leu Leu Asp Lys Pro Ile Gly Tyr 225 230 235 240 Thr Ser Asp Leu Ile Ile Ser Ser Pro Leu Glu Glu Lys Leu Leu Glu 245 250 255 Phe Lys Asn Ile Glu Glu Lys Leu Leu Glu Phe Lys Asn Ile Glu Glu 260 265 270 Lys Leu Leu Glu Phe Lys Asn Ile Glu Glu Lys Leu Leu Glu Phe Lys 275 280 285 Asn Ile Glu Glu Lys Leu Leu Glu Phe Lys Asn Ile Glu Glu Lys Leu 290 295 300 Leu Glu Phe Lys Asn Ile Glu Glu Lys Leu Leu Glu Phe Lys Asn Ile 305 310 315 320 Glu Glu Lys Leu Leu Glu Phe Lys Asn Ile Glu Glu Lys Leu Leu Glu 325 330 335 Phe Lys Asn Ile Glu Glu Lys Leu Leu Glu Phe Lys Asn Ile Glu Glu 340 345 350 Lys Leu Leu Glu Phe Lys Asn Ile Glu Glu Lys Leu Leu Glu Phe Lys 355 360 365 Asn Ile Glu Glu Lys Leu Leu Glu Phe Lys Asn Ile Glu Glu Lys Leu 370 375 380 Leu Ala Ser Arg Leu Asn Asn Ile Leu Arg Lys Ile Lys Arg Lys Ile 385 390 395 400 Leu Pro Phe Phe Trp Gly Gly Gly Val Thr Pro Thr Leu Lys Val Ser 405 410 415 Phe Arg Trp Gly Ala Ala 420 <210> 67 <211> 2851 <212> DNA <213> Artificial Sequence <220> <223> Expression fragment < Ptet-lacY-FRT-add1-FRT> <400> 67 tggccagatg attaattcct aatttttgtt gacactctat cattgataga gttattttac 60 cactccctat cagtgataga gaaaagtgaa atgaatagtt cgacaaaaat ctagaaataa 120 ttttgtttaa ctttaagaag gagatataca aatgtactat ttaaaaaaca caaacttttg 180 gatgttcggt ttattctttt tcttttactt ttttatcatg ggagcctact tcccgttttt 240 cccgatttgg ctacatgaca tcaaccatat cagcaaaagt gatacgggta ttatttttgc 300 cgctatttct ctgttctcgc tattattcca accgctgttt ggtctgcttt ctgacaaact 360 cgggctgcgc aaatacctgc tgtggattat taccggcatg ttagtgatgt ttgcgccgtt 420 ctttattttt atcttcgggc cactgttaca atacaacatt ttagtaggat cgattgttgg 480 tggtatttat ctaggctttt gttttaacgc cggtgcgcca gcagtagagg catttattga 540 gaaagtcagc cgtcgcagta atttcgaatt tggtcgcgcg cggatgtttg gctgtgttgg 600 ctgggcgctg tgtgcctcga ttgtcggcat catgttcacc atcaataatc agtttgtttt 660 ctggctgggc tctggctgtg cactcatcct cgccgtttta ctctttttcg ccaaaacgga 720 tgcgccctct tctgccacgg ttgccaatgc ggtaggtgcc aaccattcgg catttagcct 780 taagctggca ctggaactgt tcagacagcc aaaactgtgg tttttgtcac tgtatgttat 840 tggcgtttcc tgcacctacg atgtttttga ccaacagttt gctaatttct ttacttcgtt 900 ctttgctacc ggtgaacagg gtacgcgggt atttggctac gtaacgacaa tgggcgaatt 960 acttaacgcc tcgattatgt tctttgcgcc actgatcatt aatcgcatcg gtgggaaaaa 1020 cgccctgctg ctggctggca ctattatgtc tgtacgtatt attggctcat cgttcgccac 1080 ctcagcgctg gaagtggtta ttctgaaaac gctgcatatg tttgaagtac cgttcctgct 1140 ggtgggctgc tttaaatata ttaccagcca gtttgaagtg cgtttttcag cgacgattta 1200 tctggtctgt ttctgcttct ttaagcaact ggcgatgatt tttatgtctg tactggcggg 1260 caatatgtat gaaagcatcg gtttccaggg cgcttatctg gtgctgggtc tggtggcgct 1320 gggcttcacc ttaatttccg tgttcacgct tagcggcccc ggcccgcttt ccctgctgcg 1380 tcgtcaggtg aatgaagtcg ctgggagcta agcggccgcg tcgacacgca aaaaggccat 1440 ccgtcaggat ggccttctgc ttaatttgat gcctggcagt ttatggcggg cgtcctgccc 1500 gccaccctcc gggccgttgc ttcgcaacgt tcaaatccgc tcccggcgga tttgtcctac 1560 tcaggagagc gttcaccgac aaacaacaga taaaacgaaa ggcccagtct ttcgactgag 1620 cctttcgttt tatttgatgc ctggcagttc cctactctcg catggggaga ccccacacta 1680 ccatcatgta tgaatatcct ccttagttcc tattccgaag ttcctattct ctagaaagta 1740 taggaacttc ggcgcgtcct acctgtgaca cgcgtgccgc agtctcacgc ccggagcgta 1800 gcgaccgagt gagctagcta tttgtttatt tttctaaata cattcaaata tgtatccgct 1860 catgagacaa taaccctgat aaatgcttca ataatattga aaaaggaaga gtatgaggga 1920 agcggtgatc gccgaagtat cgactcaact atcagaggta gttggcgtca tcgagcgcca 1980 tctcgaaccg acgttgctgg ccgtacattt gtacggctcc gcagtggatg gcggcctgaa 2040 gccacacagt gatattgatt tgctggttac ggtgaccgta aggcttgatg aaacaacgcg 2100 gcgagctttg atcaacgacc ttttggaaac ttcggcttcc cctggagaga gcgagattct 2160 ccgcgctgta gaagtcacca ttgttgtgca cgacgacatc attccgtggc gttatccagc 2220 taagcgcgaa ctgcaatttg gagaatggca gcgcaatgac attcttgcag gtatcttcga 2280 gccagccacg atcgacattg atctggctat cttgctgaca aaagcaagag aacatagcgt 2340 tgccttggta ggtccagcgg cggaggaact ctttgatccg gttcctgaac aggatctatt 2400 tgaggcgcta aatgaaacct taacgctatg gaactcgccg cccgactggg ctggcgatga 2460 gcgaaatgta gtgcttacgt tgtcccgcat ttggtacagc gcagtaaccg gcaaaatcgc 2520 gccgaaggat gtcgctgccg actgggcaat ggagcgcctg ccggcccagt atcagcccgt 2580 catacttgaa gctagacagg cttatcttgg acaagaagaa gatcgcttgg cctcgcgcgc 2640 agatcagttg gaagaatttg tccactacgt gaaaggcgag atcaccaagg tagtcggcaa 2700 ataatgtcta acaattcgtt caagccgagg ggccgcaaga tccggccacg atgacccggt 2760 cgtcgggtac cggcagggcg gggcgtaagg cgcgccattt aaatgaagtt cctattccga 2820 agttcctatt ctctagaaag tataggaact t 2851 <210> 68 <211> 6521 <212> DNA <213> Artificial Sequence <220> <223> Transposon cassette <Ptet-glmUM-PT5-glmS-FRT-dhfr-FRT> <400> 68 acaggttggc tgataagtcc ccggtctagc ttgcatgcag attgcagcat tacacgtctt 60 gagcgattgt gtaggctgga gctgcttcga aattaatacg actcactata ggggaattga 120 ttctggtacc aaatgagtcg accggccaga tgattaattc ctaatttttg ttgacactct 180 atcattgata gagttatttt accactccct atcagtgata gagaaaagtg aaatgaatag 240 ttcgacaaaa atctagaaat aattttgttt aactttaaga aggagatata caaatgctga 300 acaacgcgat gtctgttgtt atcctggcgg cgggtaaagg tacccgtatg tactctgacc 360 tgccgaaagt tctgcacacc ctggcgggta aagcgatggt tcagcacgtt atcgacgcgg 420 cgaacgaact gggtgcggcg cacgttcacc tggtttacgg tcacggtggt gacctgctga 480 aacaggcgct gaaagacgac aacctgaact gggttctgca ggcggaacag ctgggtaccg 540 gtcacgcgat gcagcaggcg gcgccgttct tcgcggacga cgaagacatc ctgatgctgt 600 acggtgacgt tccgctgatc tctgttgaaa ccctgcagcg tctgcgtgac gcgaaaccgc 660 agggtggtat cggtctgctg accgttaaac tggacgaccc gaccggttac ggtcgtatca 720 cccgtgaaaa cggtaaagta accggtatcg ttgaacacaa agacgcgacc gacgaacagc 780 gtcagatcca ggagatcaac accggtatcc tgatcgcgaa cggtgcagac atgaaacgtt 840 ggctggcgaa actgaccaac aacaacgcgc agggtgaata ctacatcacc gacatcatcg 900 cgctggcgta ccaggaaggt cgtgaaatcg ttgcggttca cccgcagcgt ctgtctgaag 960 ttgaaggtgt taacaaccgt ctgcagctgt ctcgtctgga acgtgtttac cagtctgaac 1020 aggcggaaaa actgctgctg gcgggtgtta tgctgcgtga cccggcgcgt ttcgacctgc 1080 gtggtaccct gacccacggt cgtgacgttg aaatcgacac caacgttatc atcgaaggta 1140 acgttaccct gggtcaccgt gtaaaaatcg gcaccggttg cgttatcaaa aactctgtta 1200 tcggtgacga ctgcgaaatc tctccgtaca ccgttgttga agacgcgaac ctggcggcgg 1260 cgtgcaccat cggtccgttc gcgcgtctgc gtccgggtgc ggaactgctg gaaggtgcgc 1320 acgttggtaa cttcgttgaa atgaaaaaag cgcgtctggg taaaggttct aaagcgggtc 1380 acctgaccta cctgggtgac gcggaaatcg gtgacaacgt taacatcggt gcgggtacca 1440 tcacctgcaa ctacgacggt gcgaacaaat tcaaaaccat catcggtgac gacgttttcg 1500 ttggttctga cacccagctg gttgcgccgg ttaccgttgg taaaggtgcg accatcgcgg 1560 cgggtaccac cgttacccgt aacgttggtg aaaacgcgct ggcgatctct cgtgttccgc 1620 agacccagaa agaaggttgg cgtcgtccgg ttaaaaaaaa ataacgaagg agatagaacc 1680 atgtccaacc gtaaatactt cggtacggac ggtatccgtg gtcgtgtagg tgatgctccg 1740 attacgccgg atttcgtcct gaaactcggt tgggcagcgg gtaaagttct cgcacgtcac 1800 ggctctcgta aaatcatcat cggtaaagac acccgtatct ctggttacat gctcgaatct 1860 gcactggaag cgggtctggc tgcagctggt ctgtctgcac tgttcacggg tccgatgcca 1920 accccagctg tagcgtacct gactcgcact ttccgtgcag aagcaggtat cgtgatctct 1980 gcctctcaca acccgttcta cgacaacggt atcaaattct tcagcatcga tggtaccaaa 2040 ctcccagacg cggttgaaga ggctatcgaa gcggaaatgg agaaagaaat ctcttgtgta 2100 gactctgccg aactcggtaa agcgtctcgt atcgttgatg cagcgggtcg ttacatcgag 2160 ttctgcaaag ccacctttcc gaacgaactg agcctgtctg agctgaaaat cgtcgtagac 2220 tgtgccaacg gtgcgactta ccacattgcc ccaaacgtac tgcgtgagct gggtgctaac 2280 gtcatcgcga tcggttgtga accgaacggt gtcaacatca acgcggaagt aggtgcgacc 2340 gatgttcgtg cactgcaggc tcgtgtactc gcggagaaag cggatctcgg tatcgccttt 2400 gacggtgatg gtgaccgtgt tatcatggtt gaccacgaag gtaacaaagt ggatggtgac 2460 cagatcatgt acatcattgc ccgtgaaggt ctgcgtcagg gtcagctgcg tggtggtgca 2520 gtaggtaccc tcatgagcaa catgggtctg gaactggccc tgaaacagct gggtatccca 2580 ttcgctcgtg ctaaagtagg cgaccgttac gttctggaga aaatgcagga gaaaggttgg 2640 cgtatcggtg ccgaaaactc tggtcacgtc atcctgctgg acaaaaccac taccggtgac 2700 ggtatcgtag caggtctgca ggtactcgcc gctatggccc gtaaccacat gtccctccat 2760 gacctctgct ctggtatgaa aatgttcccg cagatcctgg ttaacgttcg ttacaccgca 2820 ggttctggtg atccgctgga acacgagtct gtgaaagccg ttaccgcaga agtggaagcg 2880 gccctgggta accgtggtcg tgtactgctg cgtaaatccg gtactgagcc actgatccgt 2940 gttatggttg agggcgaaga tgaagcccag gtcaccgaat ttgcgcaccg tattgccgac 3000 gcagtcaaag cggtttaatt tcgtcgacac acaggaaaca tattaaaaat taaaacctgc 3060 aggagtttaa acgcggccgc gatatcgttg taaaacgacg gccagtgcaa gaatcataaa 3120 aaatttattt gctttcagga aaatttttct gtataataga ttcataaatt tgagagagga 3180 gtttttgtga gcggataaca attccccatc ttagtatatt agttaagtat aaatacacaa 3240 ggagatatac atatgtgcgg tatcgttggt gctatcgcac agcgtgatgt agcggagatc 3300 ctcctggaag gtctgcgtcg tctcgaatac cgtggttacg actctgccgg tctggcagta 3360 gtggatgcag aaggtcacat gactcgtctg cgtcgtctgg gtaaagtgca gatgctcgcg 3420 caggcggcgg aagaacaccc actccacggt ggtacgggta tcgcacacac tcgttgggca 3480 acccacggtg aaccgtctga ggtcaacgca cacccgcatg ttagcgagca catcgtagtc 3540 gttcacaacg gtatcatcga gaaccacgaa ccactccgtg aggaactcaa agcccgtggt 3600 tacaccttcg taagcgaaac cgacacggaa gttatcgccc acctcgttaa ctgggaactc 3660 aaacagggtg gtactctgcg tgaagcagtt ctgcgtgcca ttccacagct gcgtggtgca 3720 tacggtaccg tgatcatgga ctctcgtcat ccggataccc tgctcgccgc acgttctggt 3780 tctccactcg ttatcggtct gggtatgggt gagaacttca tcgcctctga tcagctggcc 3840 ctgctcccag ttacccgtcg cttcatcttc ctggaagagg gtgacatcgc cgaaatcacc 3900 cgtcgttccg ttaacatctt cgacaaaacg ggtgcggaag ttaaacgtca ggacatcgag 3960 tctaacctgc agtatgacgc tggtgacaaa ggcatctacc gtcactacat gcagaaagag 4020 atctacgaac agccgaacgc gatcaaaaac accctgaccg gtcgtatctc tcacggtcag 4080 gttgacctgt ctgagctggg tccaaacgcg gacgaactcc tgtccaaagt cgagcacatc 4140 cagatcctgg cttgtggtac ctcttacaac tccggtatgg tttctcgtta ctggttcgaa 4200 tctctggcag gtatcccatg cgacgttgaa atcgcctccg aattccgtta tcgtaaatct 4260 gcggtacgtc gtaactccct catgatcacc ctgtctcagt ctggtgaaac cgctgatact 4320 ctggcaggtc tgcgtctcag caaagaactg ggttacctgg gttctctggc catctgcaac 4380 gttccgggtt ctagcctggt tcgtgagtct gacctggctc tgatgaccaa cgcgggtacg 4440 gagatcggtg ttgcctctac caaagcgttc actacccagc tcactgtcct gctgatgctg 4500 gttgccaaac tgtctcgtct caaaggcctc gacgctagca tcgaacacga catcgtacac 4560 ggtctgcagg ccctcccatc tcgtatcgag cagatgctgt ctcaggacaa acgtatcgaa 4620 gcactggcag aagacttcag cgacaaacac cacgcgctgt ttctgggtcg tggtgaccag 4680 tacccaattg cgctggaagg tgccctgaaa ctgaaagaga tcagctacat ccatgcagag 4740 gcatacgcag cgggtgagct gaaacatggt ccactggccc tgatcgacgc agatatgccg 4800 gttattgtgg ttgctccgaa caacgaactg ctggagaaac tgaaatccaa catcgaggaa 4860 gtacgtgcgc gtggtggtca gctgtacgtg tttgctgacc aggacgcggg tttcgtttcc 4920 agcgacaaca tgcacatcat cgaaatgccg catgttgaag aggtaatcgc gccaatcttc 4980 tacaccgtac cgctgcagct gctggcgtac catgtagccc tgatcaaagg tacggacgtt 5040 gaccagccgc gtaacctggc gaaatccgtg accgtggaat aacgcggagg cgcgccattt 5100 aaatcaacct cagcggtcat agctgtttcc tgtgactgag caataactag cataacccct 5160 tggggcctct aaacgggtct tgaggggttt tttgctgaaa ccaatttgcc tggcggcagt 5220 agcgcggtgg tcccacctga ccccatgccg aactcagaag tgaaacgccg tagcgccgat 5280 ggtagtgtgg ggtctcccca tgcgagagta gggaactgcc aggcatcaaa taaaacgaaa 5340 ggctcagtcg aaagactggg cctttcggga tccaggccgg cctgttaacg aattaatctt 5400 ccgcggcggt atcgataagc ttgatatcga attccgaagt tcctattctc tagaaagtat 5460 aggaacttca ggtctgaaga ggagtttacg tccagccaag ctagcttggc tgcaggtcgt 5520 cgaaattcta ccgggtaggg gaggcgcttt tcccaaggca gtctggagca tgcgctttag 5580 cagccccgct gggcacttgg cgctacacaa gtggcctctg gcctcgcaca cattccacat 5640 ccaccggtag gcgccaaccg gctccgttct ttggtggccc cttcgcgcca ccttctactc 5700 ctcccctagt caggaagttc ccccccgccc cgcagctcgc gtcgtgcagg acgtgacaaa 5760 tggaagtagc acgtctcact agtctcgtgc agatggacag caccgctgag caatggaagc 5820 gggtaggcct ttggggcagc ggccaatagc agctttgctc cttcgctttc tgggctcaga 5880 ggctgggaag gggtgggtcc gggggcgggc tcaggggcgg gctcaggggc ggggcgggcg 5940 cccgaaggtc ctccggaggc ccggcattct gcacgcttca aaagcgcacg tctgccgcgc 6000 tgttctcctc ttcctcatct ccgggccttt cgacctgcag cctgttgaca attaatcatc 6060 ggcatagtat atcggcatag tataatacga caaggtgagg aactaaacca tgggtcaaag 6120 tagcgatgaa gccaacgctc ccgttgcagg gcagtttgcg cttcccctga gtgccacctt 6180 tggcttaggg gatcgcgtac gcaagaaatc tggtgccgct tggcagggtc aagtcgtcgg 6240 ttggtattgc acaaaactca ctcctgaagg ctatgcggtc gagtccgaat cccacccagg 6300 ctcagtgcaa atttatcctg tggctgcact tgaacgtgtg gcctaatgag gggatcaatt 6360 ctctagagct cgctgatcag aagttcctat tctctagaaa gtataggaac ttcgatggcg 6420 cctcatccct gaagccaata caacaaaaat taggaattaa tcatctggcc aatttcaggt 6480 ggcacttttc gggcagaccg gggacttatc agccaacctg t 6521 <210> 69 <211> 3919 <212> DNA <213> Artificial Sequence <220> <223> Expression cassette <Ptet-glmSm-gna1-FRT-aacC1-FRT> <400> 69 ggtacccaaa tatgcataat cgaaattaat acgactcact ataggggaat tgattctggt 60 accaaatgag tcgaccggcc agatgattaa ttcctaattt ttgttgacac tctatcattg 120 atagagttat tttaccactc cctatcagtg atagagaaaa gtgaaatgaa tagttcgaca 180 aaaatctaga aataattttg tttaacttta agaaggagat atacaaatgt gcggtatcgt 240 tggtgctatc gcacagcgtg atgtagcgaa aatcctcctg gaaggtctgc gtcgtctcga 300 ataccgtggt tacgactctg ccggtctggc agtagtggat gcagaaggtc acatgactcg 360 tctgcgtcgt ctgggtaaag tgcagatgct cgcgcaggcg gcggaagaac acccactcca 420 cggtggtacg ggtatcgcac acactcgttg ggcaacccac ggtgaaccgt ctgaggtcaa 480 cgcacacccg catgttagcg agcacatcgt agtcgttcac aacggtatca tcgagaacca 540 cgaaccactc cgtgaggaac tcaaagcccg tggttacacc ttcgtaagcg aaaccgacac 600 ggaagttatc gcccacctcg ttaactggga actcaaacag ggtggtactc tgcgtgaagc 660 agttctgcgt gccattccac agctgcgtgg tgcatacggt accgtgatca tggactctcg 720 tcatccggat accctgctcg ccgcacgttc tggttctcca ctcgttatcg gtctgggtat 780 gggtgagaac ttcatcgcct ctgatcagct ggccctgctc ccagttaccc gtcgcttcat 840 cttcctggaa gagggtgaca tcgccgaaat cacccgtcgt tccgttaaca tcttcgacaa 900 aacgggtgcg gaagttaaac gtcaggacat cgagtctaac ctgcagtatg acgctggtga 960 caaaggcatc taccgtcact acatgcagaa agagatctac gaacagccga acgcgatcaa 1020 aaacaccctg accggtcgta tctctcacgg tcaggttgac ctgtctgagc tgggtccaaa 1080 cgcggacgaa ctcctgtcca aagtcgagca catccagatc ctggcttgtg gtacctctta 1140 caactccggt atggtttctc gttactggtt cgaatctctg gcaggtatcc catgcgacgt 1200 tgaaatcgcc tccgaattcc gttatcgtaa atctgcggta cgtcgtaact ccctcatgat 1260 caccctgtct cagtctggtg aaaccgctga tactctggca ggtctgcgtc tcagcaaaga 1320 actgggttac ctgggttctc tggccatctg caacgttccg ggttctagcc tggttcgtga 1380 gtctgtgctg gctctgatga ccaacgcggg tacggagatc ggtgttgcct ctaccaaagc 1440 gttcactacc cagctcactg tcctgctgat gctggttgcc aaactgtctc gtctcaaagg 1500 cctcgacgct agcatcgaac acgacatcgt acacggtctg caggccctcc catctcgtat 1560 cgagcagatg ctgccgcagg acaaacgtat cgaagcactg gcagaagact tcagcgacaa 1620 acaccacgcg ctgtttctgg gtcgtggtga ccagtaccca attgcgctgg aaggtgccct 1680 gaaactgaaa gagatcagct acatccatgc agaggcatac gcagcgggtg agctgaaaca 1740 tggtccactg gccctgatcg acgcagatat gccggttatt gtggttgctc cgaacaacgg 1800 cctgctggag aaactgaaat ccaacatcga ggaagtacgt gcgcgtggtg gtcagctgta 1860 cgtgtttgct gaccaggacg cgggtttcgt ttccagcgac aacatgcaca tcatcgaaat 1920 gccgcatgtt gaagaggtaa tcgcgccaat cttctacacc gtaccgctgc agctgctggc 1980 gtaccatgta gccctgatca aaggtacgga cgttgaccag ccgcgtaacc tggcgaaatc 2040 cgtgaccgtg gaataacgaa ggagatagaa ccatgagctt acccgatgga ttttatataa 2100 ggcgaatgga agagggggat ttggaacagg tcactgagac gctaaaggtt ttgaccaccg 2160 tgggcactat tacccccgaa tccttcagca aactcataaa atactggaat gaagccacag 2220 tatggaatga taacgaagat aaaaaaataa tgcaatataa ccccatggtg attgtggaca 2280 agcgcaccga gacggttgcc gctacgggga atatcatcat cgaaagaaag atcattcatg 2340 aactggggct atgtggccac atcgaggaca ttgcagtaaa ctccaagtat cagggccaag 2400 gtttgggcaa gctcttgatt gatcaattgg taactatcgg ctttgactac ggttgttata 2460 agattatttt agattgcgat gagaaaaatg tcaaattcta tgaaaaatgt gggtttagca 2520 acgcaggcgt ggaaatgcaa attagaaaat agaataacta gcataacccc ttggggcctc 2580 taaacgggtc ttgaggggtt ttttgctgaa accaatttgc ctggcggcag tagcgcggtg 2640 gtcccacctg accccatgcc gaactcagaa gtgaaacgcc gtagcgccga tggtagtgtg 2700 gggtctcccc atgcgagagt agggaactgc caggcatcaa ataaaacgaa aggctcagtc 2760 gaaagactgg gcctttcggg atccaggccg gcctgttaac gaattaatct tccgcggcgg 2820 tatcgataag cttgatatcg aattccgaag ttcctattct ctagaaagta taggaacttc 2880 aggtctgaag aggagtttac gtccagccaa gctagcttgg ctgcaggtcg tcgaaattct 2940 acgatctcgg cttgaacgaa ttgttaggtg gcggtacttg ggtcgatatc aaagtgcatc 3000 acttcttccc gtatgcccaa ctttgtatag agagccactg cgggatcgtc accgtaatct 3060 gcttgcacgt agatcacata agcaccaagc gcgttggcct catgcttgag gagattgatg 3120 agcgcggtgg caatgccctg cctccggtgc tcgccggaga ctgcgagatc atagatatag 3180 atctcactac gcggctgctc aaacctgggc agaacgtaag ccgcgagagc gccaacaacc 3240 gcttcttggt cgaaggcagc aagcgcgatg aatgtcttac tacggagcaa gttcccgagg 3300 taatcggagt ccggctgatg ttgggagtag gtggctacgt ctccgaactc acgaccgaaa 3360 agatcaagag cagcccgcat ggatttgact tggtcagggc cgagcctaca tgtgcgaatg 3420 atgcccatac ttgagccacc taactttgtt ttagggcgac tgccctgctg cgtaacatcg 3480 ttgctgctgc gtaacatcgt tgctgctcca taacatcaaa catcgaccca cggcgtaacg 3540 cgcttgctgc ttggatgccc gaggcataga ctgtacaaaa aaacagtcat aacaagccat 3600 gaaaaccgcc actgcgccgt taccaccgct gcgttcggtc aaggttctgg accagttgcg 3660 tgagcgcata cgctacttgc attacagttt acgaaccgaa caggcttatg tcaactgggt 3720 tcgtgccttc atccgtttcc acggtgtgcg ctgcacttga acgtgtggcc taatgagggg 3780 atcaattctc tagagctcgc tgatcagaag ttcctattct ctagaaagta taggaacttc 3840 gatggcgcct catccctgaa gccaataggg ataacagggt aatgatcgga tcccgggccc 3900 gtcgactgca gaggcctgc 3919 <210> 70 <211> 2850 <212> DNA <213> Artificial Sequence <220> <223> Expression cassette <Ptet-slr1975-FRT-cat-FRT> <400> 70 atgcataatc gaaattaata cgactcacta taggggaatt gattctggta ccaaatgagt 60 cgaccggcca gatgattaat tcctaatttt tgttgacact ctatcattga tagagttatt 120 ttaccactcc ctatcagtga tagagaaaag tgaaatgaat agttcgacaa aaatctagaa 180 ataattttgt ttaactttaa gaaggagata tacaaatgat cgctcaccgt cgtcaggaac 240 tggctcaaca gtattatcag gctctgcacc aagatgtgct gccgttctgg gaaaagtatt 300 cgctggatcg tcaaggcggt ggctatttta cctgcctgga ccgcaagggt caggtttttg 360 atacggacaa gttcatttgg ctgcaaaacc gtcaagtgtg gcaatttgcg gttttctaca 420 atcgcctgga accgaaaccg cagtggctgg aaatcgctcg tcatggtgcg gattttctgg 480 cacgtcacgg tcgtgatcag gacggtaact ggtatttcgc cctggatcag gaaggcaaac 540 cgctgcgcca accgtacaat gtgttttccg actgtttcgc ggcgatggcg tttagccagt 600 atgcactggc ttctggtgct caagaagcga aggccattgc actgcaagcg tataacaatg 660 ttctgcgtcg ccagcataac ccgaaaggtc aatatgaaaa gagttacccg ggtacccgtc 720 cgctgaaatc cctggcagtg ccgatgatcc tggctaatct gacgctggaa atggaatggc 780 tgctgccgcc gaccacggtc gaagaagtgc tggcccagac cgttcgtgaa gtcatgacgg 840 attttctgga cccggaaatt ggcctgatgc gcgaagcagt taccccgacg ggtgaatttg 900 tcgattcatt cgaaggccgc ctgctgaacc cgggtcatgg cattgaagcg atgtggttta 960 tgatggatat tgcccagcgt tcgggtgacc gccagctgca agaacaggct attgcggtgg 1020 ttctgaatac cctggaatat gcatgggatg aagaatttgg tggcatcttt tacttcctgg 1080 accgtcaagg tcacccgccg cagcaactgg aatgggatca gaaactgtgg tgggtccatc 1140 tggaaaccct ggtggccctg gcaaaaggtc accaggcgac gggccaagaa aagtgctggc 1200 agtggtttga acgcgtgcat gattatgcat ggagccactt tgctgacccg gaatatggtg 1260 aatggttcgg ctacctgaac cgtcgcggtg aagtgctgct gaatctgaaa ggtggcaaat 1320 ggaagggctg cttccacgtt ccgcgtgcgc tgtggctgtg tgccgaaacc ctgcaactgc 1380 cggtctctta aaataactag cataacccct tggggcctct aaacgggtct tgaggggttt 1440 tttgctgaaa ccaatttgcc tggcggcagt agcgcggtgg tcccacctga ccccatgccg 1500 aactcagaag tgaaacgccg tagcgccgat ggtagtgtgg ggtctcccca tgcgagagta 1560 gggaactgcc aggcatcaaa taaaacgaaa ggctcagtcg aaagactggg cctttcggga 1620 tccaggccgg cctgttaacg aattaatctt ccgcggcggt atcgataagc ttgatatcga 1680 ggctgacatg ggaattagcc atggtccata tgaatatcct ccttagttcc tattccgaag 1740 ttcctattct ctagaaagta taggaacttc ggcgcgccta cctgtgacgg aagatcactt 1800 cgcagaataa ataaatcctg gtgtccctgt tgataccggg aagccctggg ccaacttttg 1860 gcgaaaatga gacgttgatc ggcacgtaag aggttccaac tttcaccata atgaaataag 1920 atcactaccg ggcgtatttt ttgagttgtc gagattttca ggagctaagg aagctaaaat 1980 ggagaaaaaa atcactggat ataccaccgt tgatatatcc caatggcatc gtaaagaaca 2040 ttttgaggca tttcagtcag ttgctcaatg tacctataac cagaccgttc agctggatat 2100 tacggccttt ttaaagaccg taaagaaaaa taagcacaag ttttatccgg cctttattca 2160 cattcttgcc cgcctgatga atgctcatcc ggaattacgt atggcaatga aagacggtga 2220 gctggtgata tgggatagtg ttcacccttg ttacaccgtt ttccatgagc aaactgaaac 2280 gttttcatcg ctctggagtg aataccacga cgatttccgg cagtttctac acatatattc 2340 gcaagatgtg gcgtgttacg gtgaaaacct ggcctatttc cctaaagggt ttattgagaa 2400 tatgtttttc gtctcagcca atccctgggt gagtttcacc agttttgatt taaacgtggc 2460 caatatggac aacttcttcg cccccgtttt caccatgggc aaatattata cgcaaggcga 2520 caaggtgctg atgccgctgg cgattcaggt tcatcatgcc gtttgtgatg gcttccatgt 2580 cggcagatgc ttaatgaata caacagtact gcgatgagtg gcagggcggg gcgtaaggcg 2640 cgccatttaa atgaagttcc tattccgaag ttcctattct ctagaaagta taggaacttc 2700 gaagcagctc cagcctacac aatcgctcaa gacgtgtaat gctgcaatct gcatgcaagc 2760 ttggcactgg cgatggcgcc tcatccctga agccaatagg gataacaggg taatgatcgg 2820 atcccgggcc cgtcgactgc agaggcctgc 2850 <210> 71 <211> 4360 <212> DNA <213> Artificial Sequence <220> <223> Expression cassette <Ptet-neuBC-FRT-kan-FRT> <400> 71 ggtacccaaa tatgcataat cgaaattaat acgactcact ataggggaat tgattctggt 60 accaaatgag tcgaccggcc agatgattaa ttcctaattt ttgttgacac tctatcattg 120 atagagttat tttaccactc cctatcagtg atagagaaaa gtgaaatgaa tagttcgaca 180 aaaatctaga aataattttg tttaacttta agaaggagat atacaaatga aagaaatcaa 240 aatccagaac atcatcatca gcgaagaaaa agcgccgctg gttgtgccgg aaatcggcat 300 taaccataat ggtagtctgg aactggcaaa aatcatggtg gatgcggcct ttagcgccgg 360 tgcaaaaatc attaaacatc agacccacat tgtggaagat gaaatgtcta aagcagcgaa 420 aaaagttatc ccgggcaacg cgaaaatcag tatctacgaa atcatgcaga aatgcgcgct 480 ggattacaaa gatgaactgg ccctgaaaga atataccgaa aaactgggtc tggtgtacct 540 gtctaccccg tttagtcgtg cgggtgcaaa ccgtctggaa gatatgggtg ttagtgcgtt 600 caaaatcggc agcggtgaat gtaacaatta tccgctgatc aaacatattg ccgcatttaa 660 aaaaccgatg attgttagca ccggcatgaa tagcatcgaa tctattaaac cgacggtgaa 720 aatcctgctg gataacgaaa ttccgtttgt tctgatgcat accacgaatc tgtacccgac 780 cccgcacaac ctggtgcgtc tgaatgccat gctggaactg aaaaaagaat tctcttgcat 840 ggttggtctg agtgatcaca ccacggataa tctggcatgc ctgggtgcag tggttctggg 900 tgcgtgtgtg ctggaacgtc atttcaccga tagcatgcac cgctctggtc cggatattgt 960 ttgtagtatg gatacgaaag cactgaaaga actgatcatt cagagcgaac agatggcgat 1020 cattcgcggc aacaatgaat ctaaaaaagc ggccaaacag gaacaggtga ccatcgattt 1080 tgcattcgcg agtgtggtta gcatcaaaga tatcaaaaaa ggcgaagtgc tgagcatgga 1140 taatatttgg gttaaacgtc cgggtctggg cggtatctct gcagcggaat ttgaaaacat 1200 tctgggcaaa aaagcactgc gcgatattga aaatgatgcg cagctgtctt atgaagattt 1260 cgcctaatcg aaggagatac aaccatgaag aaaattctgt ttatcaccgg cagccgtgca 1320 gattacagta aaatcaaaag cctgatgtac cgcgtgcaga acagctctga atttgaactg 1380 tatattttcg cgaccggcat gcatctgagc aaaaacttcg gttacacggt taaagaactg 1440 tacaaaaacg gtttcaaaaa catctacgaa ttcatcaact acgataaata ctaccagacc 1500 gataaagcgc tggccaccac gatcgatggt ttcagccgtt acgccaatga actgaaaccg 1560 gatctgattg tggttcacgg cgatcgtatt gaaccgctgg cggcggcaat tgtgggtgca 1620 ctgaacaata ttctggttgc gcatatcgaa ggcggtgaaa tttctggtac gatcgatgat 1680 agtctgcgtc acgcaattag caaactggcg catatccacc tggtgaacga tgaatttgcg 1740 aaacgtcgcc tgatgcagct gggcgaagat gaaaaatcta tcttcatcat cggtagtccg 1800 gatctggaac tgctgaacga taataaaatc agcctgtctg aagcgaaaaa atactacgat 1860 atcaactacg aaaactacgc cctgctgatg tttcatccgg ttaccacgga aattaccagt 1920 atcaaaaacc aggccgataa tctggtgaaa gcactgatcc agagcaacaa aaactacatc 1980 gttatctacc cgaacaacga tctgggcttt gaactgattc tgcagtctta tgaagaattc 2040 aaaaacaatc cgcgttttaa actgttcccg agtctgcgct ttgaatactt cattaccctg 2100 ctgaaaaacg ccgattttat tatcggtaat agtagctgca tcctgaaaga agcgctgtat 2160 ctgaaaacgg ccggcattct ggtgggtagc cgtcagaatg gtcgtctggg taacgaaaat 2220 accctgaaag ttaacgccaa ctctgatgaa atcctgaaag caatcaacac gatccacaaa 2280 aaacaggatc tgtttagcgc aaaactggaa attctggatt ctagtaaact gtttttcgaa 2340 tatctgcaga gcggcgattt ctttaaactg tctacccaga aagtgttcaa agatattaaa 2400 taaaataact agcataaccc cttggggcct ctaaacgggt cttgaggggt tttttgctga 2460 aaccaatttg cctggcggca gtagcgcggt ggtcccacct gaccccatgc cgaactcaga 2520 agtgaaacgc cgtagcgccg atggtagtgt ggggtctccc catgcgagag tagggaactg 2580 ccaggcatca aataaaacga aaggctcagt cgaaagactg ggcctttcgg gatccaggcc 2640 ggcctgttaa cgaattaatc ttccgcggcg gtatcgataa gcttgatatc gaggctgaca 2700 tgggaattag ccatggtcca tatgaatatc ctccttagtt cctattccga agttcctatt 2760 ctctagaaag tataggaact tcggcgcgtc ctacctgtga cacgcgtcaa gatcccctca 2820 cgctgccgca agcactcagg gcgcaagggc tgctaaagga agcggaacac gtagaaagcc 2880 agtccgcaga aacggtgctg accccggatg aatgtcagct actgggctat ctggacaagg 2940 gaaaacgcaa gcgcaaagag aaagcaggta gcttgcagtg ggcttacatg gcgatagcta 3000 gactgggcgg ttttatggac agcaagcgaa ccggaattgc cagctggggc gccctctggt 3060 aaggttggga agccctgcaa agtaaactgg atggctttct tgccgccaag gatctgatgg 3120 cgcaggggat caagatctga tcaagagaca ggatgaggat cgtttcgcat gattgaacaa 3180 gatggattgc acgcaggttc tccggccgct tgggtggaga ggctattcgg ctatgactgg 3240 gcacaacaga caatcggctg ctctgatgcc gccgtgttcc ggctgtcagc gcaggggcgc 3300 ccggttcttt ttgtcaagac cgacctgtcc ggtgccctga atgaactgca ggacgaggca 3360 gcgcggctat cgtggctggc cacgacgggc gttccttgcg cagctgtgct cgacgttgtc 3420 actgaagcgg gaagggactg gctgctattg ggcgaagtgc cggggcagga tctcctgtca 3480 tctcaccttg ctcctgccga gaaagtatcc atcatggctg atgcaatgcg gcggctgcat 3540 acgcttgatc cggctacctg cccattcgac caccaagcga aacatcgcat cgagcgagca 3600 cgtactcgga tggaagccgg tcttgtcgat caggatgatc tggacgaaga gcatcagggg 3660 ctcgcgccag ccgaactgtt cgccaggctc aaggcgcgca tgcccgacgg cgaggatctc 3720 gtcgtgaccc atggcgatgc ctgcttgccg aatatcatgg tggaaaatgg ccgcttttct 3780 ggattcatcg actgtggccg gctgggtgtg gcggaccgct atcaggacat agcgttggct 3840 acccgtgata ttgctgaaga gcttggcggc gaatgggctg accgcttcct cgtgctttac 3900 ggtatcgccg ctcccgattc gcagcgcatc gccttctatc gccttcttga cgagttcttc 3960 tgagcgggac tctggggttc gaaatgaccg accaagcgac gcccaacctg ccatcacgag 4020 atttcgattc caccgccgcc ttctatgaaa ggttgggctt cggaatcgtt ttccgggacg 4080 ccggctggat gatcctccag cgcggggatc tcatgctgga gttcttcgcc caccccagct 4140 tcaaaagcgc tctcggtacc ggcagggcgg ggcgtaaggc gcgccattta aatgaagaag 4200 ttcctattcc gaagttccta ttctctagaa agtataggaa cttcgaagca gctccagcct 4260 acacaatcgc tcaagacgtg taatgctgca atctgcatgc aagcttggca ctggcgatgg 4320 cgcctcatcc ctgaagccaa tagggataac agggtaatga 4360 <210> 72 <211> 3981 <212> DNA <213> Artificial Sequence <220> <223> Expression cassette <Ptet-ppsA-FRT-aad1-FRT> <400> 72 attctggtac caaatgagtc gaccggccag atgattaatt cctaattttt gttgacactc 60 tatcattgat agagttattt taccactccc tatcagtgat agagaaaagt gaaatgaata 120 gttcgacaaa aatctagaaa taattttgtt tggcgtcgag aaggagatag aaccatgtcc 180 aacaatggct cgtcaccgct ggtgctttgg tataaccaac tcggcatgaa tgatgtagac 240 agggttgggg gcaaaaatgc ctccctgggt gaaatgatta ctaacctttc cggaatgggt 300 gtttccgttc cgaatggttt cgccacaacc gccgacgcgt ttaaccagtt tctggaccaa 360 agcggcgtaa accagcgcat ttatgaactg ctggataaaa cggatattga cgatgttact 420 cagcttgcga aagcgggcgc gcaaatccgc cagtggatta tcgacactcc cttccagcct 480 gagctggaaa acgccatcag cgaagcctat gcacagcttt ctgccgatga cgaaaacgcc 540 tcttttgcgg tgcgctcctc cgccaccgca gaagatatgc cggacgcttc ttttgccggt 600 cagcaggaaa ccttcctcaa cgttcagggt tttgacgccg ttctcgtggc agtgaaacat 660 gtatttgctt ctctgtttaa cgatcgcgcc atctcttatc gtgtgcacca gggttacgat 720 caccgtggtg tggcgctctc cgccggtgtt caacggatgg tgcgctctga cctcgcatca 780 tctggcgtga tgttctccat tgataccgaa tccggctttg accaggtggt gtttatcact 840 tccgcatggg gccttggtga gatggtcgtg cagggtgcgg ttaacccgga tgagttttac 900 gtgcataaac cgacactggc ggcgaatcgc ccggctatcg tgcgccgcac catggggtcg 960 aaaaaaatcc gcatggttta cgcgccgacc caggagcacg gcaagcaggt taaaatcgaa 1020 gacgtaccgc aggaacagcg tgacatcttc tcgctgacca acgaagaagt gcaggaactg 1080 gcaaaacagg ccgtacaaat tgagaaacac tacggtcgcc cgatggatat tgagtgggcg 1140 aaagatggcc acaccggtaa actgttcatt gtgcaggcgc gtccggaaac cgtgcgctca 1200 cgcggtcagg tcatggagcg ttatacgctg cattcacagg gtaagattat cgccgaaggc 1260 cgtgctatcg gtcatcgcat cggtgcgggt ccggtgaaag tcatccatga tatcagcgaa 1320 atgaaccgca tcgaacctgg tgacgtgctg gtcactgaca tgaccgaccc ggactgggaa 1380 ccgatcatga agaaagcatc tgccatcgtc accaaccgtg gcggtcgtac ctgtcacgcg 1440 gcgatcatcg ctcgtgaact gggcattccg gcggtagtgg gctgtggtga tgcaacagaa 1500 cggatgaaag acggtgagaa cgtcactgtt tcttgtgccg aaggtgatac cggttacgtc 1560 tatgcggagt tgctggaatt tagcgtgaaa agctccagcg tagaaacgat gccggatctg 1620 ccgttgaaag tgatgatgaa cgtcggtaac ccggaccgag ctttcgactt cgcctgtctg 1680 ccgaacgaag gcgtgggact tgcgcgtctg gaatttatca tcaaccgtat gattggcgtc 1740 cacccacgcg cactgcttga gtttgacgat caggaaccgc agttgcaaaa cgaaatccgc 1800 gagatgatga aaggttttga ttctccgcgt gaattttacg ttggtcgtct gactgaaggg 1860 atcgcgacgc tgggtgccgc gttttatccg aagcgcgtca ttgtccgtct ctctgatttt 1920 aaatcgaacg aatatgccaa cctggtcggt ggtgagcgtt acgagccaga tgaagagaac 1980 ccgatgctcg gcttccgtgg cgcgggacgc tatatttccg acagcttccg cgactgtttc 2040 gcgctggagt gcgaagcagt gaaacgtgtg cgcaacgaca tggggctgac caacgttgag 2100 atcatgatcc cgttcgtgcg aaccgtagat caggcgaaag cggtggttga ggaactggcg 2160 cgtcaggggc tgaaacgtgg tgagaacggg ctgaaaatca tcatgatgtg tgaaatcccg 2220 tccaacgcct tgctggccga gcagttcctc gaatatttcg acggcttctc aattggctca 2280 aacgacatga cgcagctggc gctcggtctg gatcgtgact ccggcgtggt gtctgaactg 2340 ttcgatgagc gcaacgatgc ggtgaaagca ctgctgtcga tggcgattcg tgccgcgaag 2400 aaacagggca aatatgtcgg gatttgcggt cagggtccgt ccgaccacga agactttgcc 2460 gcatggttga tggaagaggg gatcgatagc ctgtctctga acccggacac cgtggtgcaa 2520 acctggttaa gcctggctga actgaagaaa taaaataact agcataaccc cttggggcct 2580 ctaaacgggt cttgaggggt tttttgctga aaccaatttg cctggcggca gtagcgcggt 2640 ggtcccacct gaccccatgc cgaactcaga agtgaaacgc cgtagcgccg atggtagtgt 2700 ggggtctccc catgcgagag tagggaactg ccaggcatca aataaaacga aaggctcagt 2760 cgaaagactg ggcctttcgg gatccaggcc ggcctgttaa cgaattaatc ttccgcggcg 2820 gtatcgataa gcttgatatc gaggctgaca tgggaattag ccatggtcca tatgaatatc 2880 ctccttagtt cctattccga agttcctatt ctctagaaag tataggaact tccgagctct 2940 agagaatgat ccctaaatgc ttcaataata ttgaaaaagg aagagtatga gggaagcggt 3000 gatcgccgaa gtatcgactc aactatcaga ggtagttggc gtcatcgagc gccatctcga 3060 accgacgttg ctggccgtac atttgtacgg ctccgcagtg gatggcggcc tgaagccaca 3120 cagtgatatt gatttgctgg ttacggtgac cgtaaggctt gatgaaacaa cgcggcgagc 3180 tttgatcaac gaccttttgg aaacttcggc ttcccctgga gagagcgaga ttctccgcgc 3240 tgtagaagtc accattgttg tgcacgacga catcattccg tggcgttatc cagctaagcg 3300 cgaactgcaa tttggagaat ggcagcgcaa tgacattctt gcaggtatct tcgagccagc 3360 cacgatcgac attgatctgg ctatcttgct gacaaaagca agagaacata gcgttgcctt 3420 ggtaggtcca gcggcggagg aactctttga tccggttcct gaacaggatc tatttgaggc 3480 gctaaatgaa accttaacgc tatggaactc gccgcccgac tgggctggcg atgagcgaaa 3540 tgtagtgctt acgttgtccc gcatttggta cagcgcagta accggcaaaa tcgcgccgaa 3600 ggatgtcgct gccgactggg caatggagcg cctgccggcc cagtatcagc ccgtcatact 3660 tgaagctaga caggcttatc ttggacaaga agaagatcgc ttggcctcgc gcgcagatca 3720 gttggaagaa tttgtccact acgtgaaagg cgagatcacc aaggtagtcg gcaaataata 3780 gcgggactct gggaatttcg acgacctgca gccaagcgaa gttcctattc cgaagttcct 3840 attctctaga aagtatagga acttcgaagc agctccagcc tacacaatcg ctcaagacgt 3900 gtaatgctgc aatctgcatg caagcttggc actggcgatg gcgcctcatc cctgaagcca 3960 atagggataa cagggtaatg a 3981 <210> 73 <211> 4097 <212> DNA <213> Artificial Sequence <220> <223> Expression fragment <Ptet-neuA-nanT-lox66-kan-lox72> <400> 73 tgagcgattg tgtaggctgg agctgcttgg ccagatgatt aattcctaat ttttgttgac 60 actctatcat tgatagagtt attttaccac tccctatcag tgatagagaa aagtgaaatg 120 aatagttcga caaaaatcta gaaataattt tgtttaactt taagaaggag atatacatga 180 gcctggccat tatcccggca cgtggcggtt ctaaaggcat caaaaacaaa aacctggttc 240 tgctgaacaa taaaccgctg atttattaca ccatcaaagc ggccctgaac gccaaaagta 300 ttagcaaagt ggttgtgagc tctgattctg atgaaatcct gaactacgca aaaagtcaga 360 acgttgatat cctgaaacgt ccgatcagtc tggcacagga tgataccacg agcgataaag 420 tgctgctgca tgcgctgaaa ttctacaaag attacgaaga tgttgtgttc ctgcagccga 480 ccagcccgct gcgtacgaat attcacatca acgaagcgtt caacctgtac aaaaacagca 540 acgcaaacgc gctgatttct gttagtgaat gcgataacaa aatcctgaaa gcgtttgtgt 600 gcaatgattg tggcgatctg gccggtattt gtaacgatga atacccgttc atgccgcgcc 660 agaaactgcc gaaaacctat atgagcaatg gtgccatcta catcctgaaa atcaaagaat 720 tcctgaacaa cccgagcttc ctgcagtcta aaacgaaaca tttcctgatg gatgaaagta 780 gctctctgga tattgattgc ctggaagatc tgaaaaaagt ggaacagatc tggaaaaaat 840 aagagctcga gtcgaaggag atagaaccat gagtactaca acccagaata tcccgtggta 900 tcgccatctc aaccgtgcac aatggcgcgc attttccgct gcctggttgg gatatctgct 960 tgacggtttt gatttcgttt taatcgccct ggtactcacc gaagtacaag gtgaattcgg 1020 gctgacgacg gtgcaggcgg caagtctgat ctctgcagcc tttatctctc gctggttcgg 1080 cggcctgatg ctcggcgcta tgggtgaccg ctacgggcgt cgtctggcaa tggtcaccag 1140 catcgttctc ttctcggccg ggacgctggc ctgcggcttt gcgccaggct acatcaccat 1200 gtttatcgct cgtctggtca tcggcatggg gatggcgggt gaatacggtt ccagcgccac 1260 ctatgtcatt gaaagctggc caaaacatct gcgtaacaaa gccagtggtt ttttgatttc 1320 aggcttctct gtgggggccg tcgttgccgc tcaggtctat agcctggtgg ttccggtctg 1380 gggctggcgt gcgctgttct ttatcggcat tttgccaatc atctttgctc tctggctgcg 1440 taaaaacatc ccggaagcgg aagactggaa agagaaacac gcaggtaaag caccagtacg 1500 cacaatggtg gatattctct accgtggtga acatcgcatt gccaatatcg taatgacact 1560 ggcggcggct actgcgctgt ggttctgctt cgccggtaac ctgcaaaatg ccgcgatcgt 1620 cgctgttctt gggctgttat gcgccgcaat ctttatcagc tttatggtgc agagtgcagg 1680 caaacgctgg ccaacgggcg taatgctgat ggtggtcgtg ttgtttgctt tcctctactc 1740 atggccgatt caggcgctgc tgccaacgta tctgaaaacc gatctggctt ataacccgca 1800 tactgtagcc aatgtgctgt tctttagtgg ctttggcgcg gcggtgggat gctgcgtagg 1860 tggcttcctc ggtgactggc tgggaacccg caaagcgtac gtttgtagcc tgctggcctc 1920 gcagctgctg attattccgg tatttgcgat tggcggcgca aacgtctggg tgctcggtct 1980 gttactgttc ttccagcaaa tgcttggaca agggatcgcc gggatcttac caaaactgat 2040 tggcggttat ttcgataccg accagcgtgc agcgggcctg ggctttacct acaacgttgg 2100 cgcattgggc ggtgcactgg ccccaatcat cggcgcgttg atcgctcaac gtctggatct 2160 gggtactgcg ctggcatcgc tctcgttcag tctgacgttc gtggtgatcc tgctgattgg 2220 gctggatatg ccttctcgcg ttcagcgttg gttgcgcccg gaagcgttgc gtactcatga 2280 cgctatcgac ggtaaaccat tcagcggtgc cgtgccgttt ggcagcgcca aaaacgattt 2340 agtcaaaacc aaaagttaat aaatcgatac tagcataacc ccttggggcc tctaaacgcg 2400 tcgacacgca aaaaggccat ccgtcaggat ggccttctgc ttaatttgat gcctggcagt 2460 ttatggcggg cgtcctgccc gccaccctcc gggccgttgc ttcgcaacgt tcaaatccgc 2520 tcccggcgga tttgtcctac tcaggagagc gttcaccgac aaacaacaga taaaacgaaa 2580 ggcccagtct ttcgactgag cctttcgttt tatttgatgc ctggcagttc cctactctcg 2640 catggggaga ccccacacta ccatccggta tcgataagct tgatggcgaa agggggatgt 2700 gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg 2760 acggccagtg aattcgagct cggtacctac cgttcgtata atgtatgcta tacgaagtta 2820 tcgagctcta gagaatgatc ccctccctca cgctgccgca agcactcagg gcgcaagggc 2880 tgctaaagga agcggaacac gtagaaagcc agtccgcaga aacggtgctg accccggatg 2940 aatgtcagct actgggctat ctggacaagg gaaaacgcaa gcgcaaagag aaagcaggta 3000 gcttgcagtg ggcttacatg gcgatagcta gactgggcgg ttttatggac agcaagcgaa 3060 ccggaattgc cagctggggc gccctctggt aaggttggga agccctgcaa agtaaactgg 3120 atggctttct tgccgccaag gatctgatgg cgcaggggat caagatctga tcaagagaca 3180 ggatgaggat cgtttcgcat gattgaacaa gatggattgc acgcaggttc tccggccgct 3240 tgggtggaga ggctattcgg ctatgactgg gcacaacaga caatcggctg ctctgatgcc 3300 gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac cgacctgtcc 3360 ggtgccctga atgaactgca ggacgaggca gcgcggctat cgtggctggc cacgacgggc 3420 gttccttgcg cagctgtgct cgacgttgtc actgaagcgg gaagggactg gctgctattg 3480 ggcgaagtgc cggggcagga tctcctgtca tctcaccttg ctcctgccga gaaagtatcc 3540 atcatggctg atgcaatgcg gcggctgcat acgcttgatc cggctacctg cccattcgac 3600 caccaagcga aacatcgcat cgagcgagca cgtactcgga tggaagccgg tcttgtcgat 3660 caggatgatc tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt cgccaggctc 3720 aaggcgcgca tgcccgacgg cgaggatctc gtcgtgaccc atggcgatgc ctgcttgccg 3780 aatatcatgg tggaaaatgg ccgcttttct ggattcatcg actgtggccg gctgggtgtg 3840 gcggaccgct atcaggacat agcgttggct acccgtgata ttgctgaaga gcttggcggc 3900 gaatgggctg accgcttcct cgtgctttac ggtatcgccg ctcccgattc gcagcgcatc 3960 gccttctatc gccttcttga cgagttcttc tgagcgggac tctgggaatt tcgacgacct 4020 gcagccaagc ataacttcgt ataatgtatg ctatacgaac ggtaggatcc tctagagtcg 4080 acctgcaggc atgcaag 4097 <210> 74 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 74 ctgtctctta tacacatctc ctgaaattgg ccagatgatt aattcctaat ttttgttg 58 <210> 75 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 75 ctgtctctta tacacatctc agcattacac gtcttgagcg attgtgtagg 50 <210> 76 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 76 cctgacgacg gtgagcgatc atttgtatat ctccttctta aagttaaaca aaattatttc 60 <210> 77 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 77 aaccctgcaa ctgccggtct cttaaaataa ctagcataac cccttggggc ctctaaacg 59 <210> 78 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 78 aactttaaga aggagatata caaatgatcg ctcaccgtcg tcaggaactg gctcaacag 59 <210> 79 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 79 aggccccaag gggttatgct agttatttta agagaccggc agttgcaggg tttcggc 57 <210> 80 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 80 gccccaaggg gttatgctag ttattttatt ccacggtcac ggatttcgcc aggttacgcg 60 gc 62 <210> 81 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 81 agcaccaacg ataccgcaca tttgtatatc tccttcttaa agttaaacaa aattatttct 60 ag 62 <210> 82 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 82 gcgaaatccg tgaccgtgga ataaaataac tagcataacc ccttggggcc tctaaacggg 60 tc 62 <210> 83 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 83 ctttaagaag gagatataca aatgtgcggt atcgttggtg ctatcgcaca gcgtgatg 58 <210> 84 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 84 cgtggaaatg caaattagaa aatagaataa ctagcataac cccttggggc ctctaaacgg 60 <210> 85 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 85 tataaaatcc atcgggtaag ctcatggttc tatctccttc gttattccac ggtcacggat 60 ttcg 64 <210> 86 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 86 atccgtgacc gtggaataac gaaggagata gaaccatgag cttacccgat ggattttata 60 taagg 65 <210> 87 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 87 ccgtttagag gccccaaggg gttatgctag ttattctatt ttctaatttg catttccacg 60 <210> 88 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 88 ctggttaagc ctggctgaac tgaagaaata aaataactag cataacccct tggggcctc 59 <210> 89 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 89 tagaggcccc aaggggttat gctagttatt ttatttcttc agttcagcca ggcttaacc 59 <210> 90 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 90 tttgtttggc gtcgagaagg agatagaacc atgtccaaca atggctcgtc accgctggtg 60 <210> 91 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 91 aagcaccagc ggtgacgagc cattgttgga catggttcta tctccttctc gacgccaaac 60 <210> 92 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 92 ctacccagaa agtgttcaaa gatattaaat aaaataacta gcataacccc ttggggcctc 60 <210> 93 <211> 61 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 93 tttagaggcc ccaaggggtt atgctagtta ttttatttaa tatctttgaa cactttctgg 60 g 61 <210> 94 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 94 gatgatgatg ttctggattt tgatttcttt catttgtata tctccttctt aaagttaaac 60 <210> 95 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 95 tttgtttaac tttaagaagg agatatacaa atgaaagaaa tcaaaatcca gaacatcatc 60 <210> 96 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 96 agctgtctta tgaagatttc gcctaatcga aggagataca accatgaaga aaattctgtt 60 tatcaccggc 70 <210> 97 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 97 tgccggtgat aaacagaatt ttcttcatgg ttgtatctcc ttcgattagg cgaaatcttc 60 ataagacagc 70 <210> 98 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 98 taattttgtt taactttaag aaggagatat acatgagcct ggccattatc ccggcacgtg 60 <210> 99 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 99 tgccgggata atggccaggc tcatgtatat ctccttctta aagttaaaca aaattatttc 60 <210> 100 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 100 aaaataagag ctcgagtcga aggagataga accatgagta ctacaaccca gaatatcccg 60 <210> 101 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 101 tagtactcat ggttctatct ccttcgactc gagctcttat tttttccaga tctgttccac 60 <210> 102 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 102 aaaacgattt agtcaaaacc aaaagttaat aaatcgatac tagcataacc ccttggggcc 60 <210> 103 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 103 aaggggttat gctagtatcg atttattaac ttttggtttt gactaaatcg tttttg 56 <210> 104 <211> 73 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 104 ggggacaagt ttgtacaaaa aagcaggcta gaaggaggta tacaaatggg cctgaaaaaa 60 gcctgcctga ccg 73 <210> 105 <211> 75 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 105 ggggacaagt ttgtacaaaa aagcaggcta gaaggagata tacaaatgac ccgcacccgt 60 atggaaaacg aactg 75 <210> 106 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 106 ggggaccact ttgtacaaga aagctgggtt tattttttcc agatctgttc cacttttttc 60 ag 62 <210> 107 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 107 aaaaagcagg ctagaaggag gtatacaaat gggcaaaaaa gtgattattg cgggcaacgg 60 cccgagcc 68 <210> 108 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 108 aggctcataa ttgtacctcc ttcgaggttt agttgatgtt tttgctgaat ttgccatacg 60 cttcgc 66 <210> 109 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 109 tggcaaattc agcaaaaaca tcaactaaac ctcgaaggag gtacaattat gagcctggcc 60 attatccc 68 <210> 110 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 110 tgcccgcaat aatcactttt ttgcccattt gtatacctcc ttctagcctg cttttttgta 60 caaacttg 68 <210> 111 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 111 aaaagcaggc tagaaggagg tatacaaatg aataagaaac cgctgattat tgctggcaac 60 gggcc 65 <210> 112 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 112 aggctcataa ttgtacctcc ttcgaggttt atctcttcag gaatgcttta atgattgact 60 ttagcgcc 68 <210> 113 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 113 atcattaaag cattcctgaa gagataaacc tcgaaggagg tacaattatg agcctggcca 60 ttatc 65 <210> 114 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 114 agcaataatc agcggtttct tattcatttg tatacctcct tctagcctgc ttttttgtac 60 aaacttgtg 69 <210> 115 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 115 aaaagcaggc tagaaggagg tatacaaatg gggaccatta aaaagccctt aatcatagca 60 ggaaatgg 68 <210> 116 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 116 aggctcataa ttgtacctcc ttcgaggttt atgcagctcc ccaacggaaa ctaactttta 60 atgttggg 68 <210> 117 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 117 tagtttccgt tggggagctg cataaacctc gaaggaggta caattatgag cctggccatt 60 atcccggc 68 <210> 118 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 118 attaagggct ttttaatggt ccccatttgt atacctcctt ctagcctgct tttttgtaca 60 aacttgtg 68 <210> 119 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 119 aaaagcaggc tagaaggagg tatacaaatg agtgaagaaa acacccagtc cattattaaa 60 aacgac 66 <210> 120 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 120 aggctcataa ttgtacctcc ttcgaggttc agacagcaat acagacaccc gtttcgcaat 60 tcggcagg 68 <210> 121 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 121 aaacgggtgt ctgtattgct gtctgaacct cgaaggaggt acaattatga gcctggccat 60 tatcccg 67 <210> 122 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 122 atggactggg tgttttcttc actcatttgt atacctcctt ctagcctgct tttttgtaca 60 aacttgtg 68 <210> 123 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 123 aaaagcaggc tagaaggagg tatacaaatg accatttacc tggacccggc gtctctgccg 60 accc 64 <210> 124 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 124 aggctcataa ttgtacctcc ttcgaggttt acagttgttt cagagaatcc cagaagataa 60 tttggc 66 <210> 125 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 125 ttctgggatt ctctgaaaca actgtaaacc tcgaaggagg tacaattatg agcctggcca 60 ttatccc 67 <210> 126 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 126 acgccgggtc caggtaaatg gtcatttgta tacctccttc tagcctgctt ttttgtacaa 60 acttgtg 67 <210> 127 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 127 aaagcaggct agaaggaggt atacaaatgg gctgtaatag cgactccaac cacaacaact 60 ccgacgg 67 <210> 128 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 128 aggctcataa ttgtacctcc ttcgaggttt attgcaggtc cgagatcagt ttcacatcat 60 tacgg 65 <210> 129 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 129 tgaaactgat ctcggacctg caataaacct cgaaggaggt acaattatga gcctggccat 60 tatccc 66 <210> 130 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 130 tggttggagt cgctattaca gcccatttgt atacctcctt ctagcctgct tttttgtaca 60 aacttgtg 68 <210> 131 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 131 aaagcaggct agaaggaggt atacaaatga acaacgacaa ctccacgacc accaacaata 60 acgc 64 <210> 132 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 132 ctcataattg tacctccttc gaggtttaaa tgtcagagat cagtttaata ttatcgcggt 60 taatcag 67 <210> 133 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 133 atattaaact gatctctgac atttaaacct cgaaggaggt acaattatga gcctggccat 60 tatcccg 67 <210> 134 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 134 tggtcgtgga gttgtcgttg ttcatttgta tacctccttc tagcctgctt ttttgtacaa 60 acttgtg 67 <210> 135 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 135 aaagcaggct agaaggaggt atacaaatga aaacgattac cctgtatctg gacccggcgt 60 ccctgcc 67 <210> 136 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 136 aggctcataa ttgtacctcc ttcgaggttt acagctgttt caggctgtcc caaaagatca 60 cttgcg 66 <210> 137 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 137 tttgggacag cctgaaacag ctgtaaacct cgaaggaggt acaattatga gcctggccat 60 tatcccg 67 <210> 138 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 138 tccagataca gggtaatcgt tttcatttgt atacctcctt ctagcctgct tttttgtaca 60 aacttgtg 68 <210> 139 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 139 aaagcaggct agaaggaggt atacaaatga aaaagatcct gaccgtcctg agcatcttta 60 tcctgagc 68 <210> 140 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 140 aggctcataa ttgtacctcc ttcgaggttt agtccagcat cgtaccgaag tcatccggtt 60 tggtgtgg 68 <210> 141 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 141 atgacttcgg tacgatgctg gactaaacct cgaaggaggt acaattatga gcctggccat 60 tatcccg 67 <210> 142 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 142 tgctcaggac ggtcaggatc tttttcattt gtatacctcc ttctagcctg cttttttgta 60 caaacttgtg 70 <210> 143 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 143 aaagcaggct agaaggaggt atacaaatga cgaatcgcaa aatctatgtc tgccacaccc 60 tgtacc 66 <210> 144 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 144 aggctcataa ttgtacctcc ttcgaggttt atttaatgtc tttcagatca accagcgtaa 60 ttttcttgtc 70 <210> 145 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 145 tggttgatct gaaagacatt aaataaacct cgaaggaggt acaattatga gcctggccat 60 tatccc 66 <210> 146 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 146 agacatagat tttgcgattc gtcatttgta tacctccttc tagcctgctt ttttgtacaa 60 acttgtg 67 <210> 147 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 147 aaagcaggct agaaggaggt atacaaatgt tccgtgaaga caatatgaac ctgattatct 60 gctgtacg 68 <210> 148 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 148 aggctcataa ttgtacctcc ttcgaggttt agatgtcgat aactttgata ccgaaatctt 60 tcagg 65 <210> 149 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 149 tcggtatcaa agttatcgac atctaaacct cgaaggaggt acaattatga gcctggccat 60 tatcccg 67 <210> 150 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 150 aggttcatat tgtcttcacg gaacatttgt atacctcctt ctagcctgct tttttgtaca 60 aacttgtg 68 <210> 151 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 151 aaagcaggct agaaggaggt atacaaatga aagaaatcgc catcatctcc aaccaacgca 60 tgttcttcc 69 <210> 152 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 152 aggctcataa ttgtacctcc ttcgaggttt agtcaaagaa atccagcagt ttcggatgca 60 ccgcggtgc 69 <210> 153 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 153 tccgaaactg ctggatttct ttgactaaac ctcgaaggag gtacaattat gagcctggcc 60 attatccc 68 <210> 154 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 154 ttggagatga tggcgatttc tttcatttgt atacctcctt ctagcctgct tttttgtaca 60 aacttgtg 68 <210> 155 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 155 aaagcaggct agaaggaggt atacaaatgc tgattcaaca gaacctggaa atctacctgg 60 actacgc 67 <210> 156 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 156 aggctcataa ttgtacctcc ttcgaggttt aattgtgaat ggtgcacata aacgcctgat 60 cttcgttg 68 <210> 157 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 157 aggcgtttat gtgcaccatt cacaattaaa cctcgaagga ggtacaatta tgagcctggc 60 cattatcc 68 <210> 158 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 158 atttccaggt tctgttgaat cagcatttgt atacctcctt ctagcctgct tttttgtaca 60 aacttgtg 68 <210> 159 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 159 aaagcaggct agaaggaggt atacaaatgg gctgtaactc cgatagcaaa cacaataaca 60 gtgatggc 68 <210> 160 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 160 aggctcataa ttgtacctcc ttcgaggttt attgcaggtc actaatcagt ttcacatcat 60 tgcgg 65 <210> 161 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 161 tgaaactgat tagtgacctg caataaacct cgaaggaggt acaattatga gcctggccat 60 tatcccgg 68 <210> 162 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 162 tgtttgctat cggagttaca gcccatttgt atacctcctt ctagcctgct tttttgtaca 60 aacttgtg 68 <210> 163 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 163 aaagcaggct agaaggaggt atacaaatgt gtaacgataa tcaaaatacg gtcgatgttg 60 ttgtgagc 68 <210> 164 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 164 aggctcataa ttgtacctcc ttcgaggttt aatactgagc aatacaaaca cccgaggaac 60 aatccggc 68 <210> 165 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 165 tcgggtgttt gtattgctca gtattaaacc tcgaaggagg tacaattatg agcctggcca 60 ttatccc 67 <210> 166 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 166 accgtatttt gattatcgtt acacatttgt atacctcctt ctagcctgct tttttgtaca 60 aacttgtg 68 <210> 167 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 167 aaaagcaggc tagaaggagg tatacaaatg aacgataatc aaaatacggt ggacgtggtg 60 gtctc 65 <210> 168 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 168 aggctcataa ttgtacctcc ttcgaggttt agcaccagaa cagcacatct ttttctttca 60 caatgcc 67 <210> 169 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 169 aaaaagatgt gctgttctgg tgctaaacct cgaaggaggt acaattatga gcctggccat 60 tatcccg 67 <210> 170 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 170 tccaccgtat tttgattatc gttcatttgt atacctcctt ctagcctgct tttttgtaca 60 aacttgtg 68 <210> 171 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 171 aaaagcaggc tagaaggagg tatacaaatg caaaacgtca ttatcgctgg taacggtccg 60 agcctgc 67 <210> 172 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 172 aggctcataa ttgtacctcc ttcgaggttt atttcttttt gtattctttc ttcagttttt 60 tgatttcg 68 <210> 173 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 173 tgaagaaaga atacaaaaag aaataaacct cgaaggaggt acaattatga gcctggccat 60 tatcccgg 68 <210> 174 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 174 ttaccagcga taatgacgtt ttgcatttgt atacctcctt ctagcctgct tttttgtaca 60 aacttgtg 68 <210> 175 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 175 aaaagcaggc tagaaggagg tatacaaatg gattcttcgc cggaaaacac cagctctacg 60 ctgg 64 <210> 176 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 176 aggctcataa ttgtacctcc ttcgaggttt atttgatgtc cgtcgtaaag cgcacttttt 60 cgtccg 66 <210> 177 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 177 tgcgctttac gacggacatc aaataaacct cgaaggaggt acaattatga gcctggccat 60 tatcccg 67 <210> 178 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 178 tggtgttttc cggcgaagaa tccatttgta tacctccttc tagcctgctt ttttgtacaa 60 acttgtg 67 <210> 179 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 179 aaaagcaggc tagaaggagg tatacaaatg aagaaagtct acttctgcca tacggtctac 60 catctgc 67 <210> 180 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 180 aggctcataa ttgtacctcc ttcgaggttt aactatttgc tttcatttgt ttcagggtga 60 ttttc 65 <210> 181 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 181 tgaaacaaat gaaagcaaat agttaaacct cgaaggaggt acaattatga gcctggccat 60 tatcccg 67 <210> 182 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 182 tatggcagaa gtagactttc ttcatttgta tacctccttc tagcctgctt ttttgtacaa 60 acttgtg 67 <210> 183 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 183 aaagcaggct agaaggaggt atacaaatgc gtaaaatcat caccttcttc agcctgttct 60 tctcg 65 <210> 184 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 184 aggctcataa ttgtacctcc ttcgaggttt aaaagttaat cgggttcggc atttcttcaa 60 agaaaatctg 70 <210> 185 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 185 aaatgccgaa cccgattaac ttttaaacct cgaaggaggt acaattatga gcctggccat 60 tatcccg 67 <210> 186 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 186 tgaagaaggt gatgatttta cgcatttgta tacctccttc tagcctgctt ttttgtacaa 60 acttgtg 67 <210> 187 <211> 3856 <212> DNA <213> Artificial Sequence <220> <223> Expression cassette <Ptet-wbdO-PT5-galE-FRT-cat-FRT> <400> 187 acaggttggc tgataagtcc ccggtctgcc cgaaaagtgc cacctgaaat tggccagatg 60 attaattcct aatttttgtt gattctggta ccaaatgagt cgaccggcca gatgattaat 120 tcctaatttt tgttgacact ctatcattga tagagttatt ttaccactcc ctatcagtga 180 tagagaaaag tgaaatgaat agttcgacaa aaatctagaa ataattttgt ttaactttaa 240 gaaggagata tacaaatgct gacggaagtg cgcccggtct ctacgacgaa accgctggtg 300 tctgtgattc tgccggtgaa caaattcaac ccgtatctgg atcgtgcaat tcattcaatc 360 ctgagtcagt cctatccgtc gattgaactg attatcattg caaacaattg caccaatgac 420 tttttcgatg ctctgaaaaa acgtgaatgt gaaaccatta aagtgctgcg cacgaacatc 480 gcgtatctgc cgtactgcct gaataaaggc ctggatctgt gtaacggtga ctttgttgcc 540 cgcatggatt cagatgacat ttcgcacccg gaacgtatcg atcgccaggt cgacttcctg 600 attaacaatc cggacatcga tgtggttggc accaatgcag tctatattga tgaagatgac 660 atcgaactgg aaaaaagcaa cctgccggtg aacaataacg ctattcgtaa aatgctgccg 720 tataaatgct gtctggtgca tccgtctgtt atgtttcgca aaaatgtcgt gatcaccagc 780 ggcggttaca tgttcgcgaa ttattctgaa gattacgaac tgtggaaccg tctggccgtt 840 gaaggccgca atttttataa cctgagcgaa tacctgctgt attaccgtct gcacaataac 900 caatcaacgt cgaaaaataa cctgtttatg gtgatggcga acgatgtcgc cattaaagtg 960 aaatatttcc tgctgaccaa gaaaattagc tacctgctgg gtatcattcg cacggtcttt 1020 tctgtgttct attgcaaata catcaaatga tttcgtcgac acacaggaaa catattaaaa 1080 attaaaacct gcaggagttt aaacgcggcc gcgatatcgt tgtaaaacga cggccagtgc 1140 aagaatcata aaaaatttat ttgctttcag gaaaattttt ctgtataata gattcataaa 1200 tttgagagag gagtttttgt gagcggataa caattcccca tcttagtata ttagttaagt 1260 ataaatacac cgcggaggcg tcgaaggaga tacaaccatg agagttctgg ttaccggtgg 1320 tagcggttac attggaagtc atacctgtgt gcaattactg caaaacggtc atgatgtcat 1380 cattcttgat aacctctgta acagtaagcg cagcgtactg cctgttatcg agcgtttagg 1440 cggcaaacat ccaacgtttg ttgaaggcga tattcgtaac gaagcgttga tgaccgagat 1500 cctgcacgat cacgctatcg acaccgtgat ccacttcgcc gggctgaaag ccgtgggcga 1560 atcggtacaa aaaccgctgg aatattacga caacaatgtc aacggcactc tgcgcctgat 1620 tagcgccatg cgcgccgcta acgtcaaaaa ctttattttt agctcctccg ccaccgttta 1680 tggcgatcag cccaaaattc catacgttga aagcttcccg accggcacac cgcaaagccc 1740 ttacggcaaa agcaagctga tggtggaaca gatcctcacc gatctgcaaa aagcccagcc 1800 ggactggagc attgccctgc tgcgctactt caacccggtt ggcgcgcatc cgtcgggcga 1860 tatgggcgaa gatccgcaag gcattccgaa taacctgatg ccatacatcg cccaggttgc 1920 tgtaggccgt cgcgactcgc tggcgatttt tggtaacgat tatccgaccg aagatggtac 1980 tggcgtacgc gattacatcc acgtaatgga tctggcggac ggtcacgtcg tggcgatgga 2040 aaaactggcg aacaagccag gcgtacacat ctacaacctc ggcgctggcg taggcaacag 2100 cgtgctggac gtggttaatg ccttcagcaa agcctgcggc aaaccggtta attatcattt 2160 tgcaccgcgt cgcgagggcg accttccggc ctactgggcg gacgccagca aagccgaccg 2220 tgaactgaac tggcgcgtaa cgcgcacact cgatgaaatg gcgcaggaca cctggcactg 2280 gcagtcacgc catccacagg gatatcccga ttaacgccat ttaaatcaac ctcagcggtc 2340 atagctgttt cctgtgactg agcaataact agcataaccc cttggggcct ctaaacgggt 2400 cttgaggggt tttttgctga aaccaatttg cctggcggca gtagcgcggt ggtcccacct 2460 gaccccatgc cgaactcaga agtgaaacgc cgtagcgccg atggtagtgt ggggtctccc 2520 catgcgagag tagggaactg ccaggcatca aataaaacga aaggctcagt cgaaagactg 2580 ggcctttcgg gatccaggcc ggcctgttaa cgaattaatc ttccgcggcg gtatcgataa 2640 gcttgatatc gaggctgaca tgggaattag ccatggtcca tatgaatatc ctccttagtt 2700 cctattccga agttcctatt ctctagaaag tataggaact tcggcgcgcc tacctgtgac 2760 ggaagatcac ttcgcagaat aaataaatcc tggtgtccct gttgataccg ggaagccctg 2820 ggccaacttt tggcgaaaat gagacgttga tcggcacgta agaggttcca actttcacca 2880 taatgaaata agatcactac cgggcgtatt ttttgagttg tcgagatttt caggagctaa 2940 ggaagctaaa atggagaaaa aaatcactgg atataccacc gttgatatat cccaatggca 3000 tcgtaaagaa cattttgagg catttcagtc agttgctcaa tgtacctata accagaccgt 3060 tcagctggat attacggcct ttttaaagac cgtaaagaaa aataagcaca agttttatcc 3120 ggcctttatt cacattcttg cccgcctgat gaatgctcat ccggaattac gtatggcaat 3180 gaaagacggt gagctggtga tatgggatag tgttcaccct tgttacaccg ttttccatga 3240 gcaaactgaa acgttttcat cgctctggag tgaataccac gacgatttcc ggcagtttct 3300 acacatatat tcgcaagatg tggcgtgtta cggtgaaaac ctggcctatt tccctaaagg 3360 gtttattgag aatatgtttt tcgtctcagc caatccctgg gtgagtttca ccagttttga 3420 tttaaacgtg gccaatatgg acaacttctt cgcccccgtt ttcaccatgg gcaaatatta 3480 tacgcaaggc gacaaggtgc tgatgccgct ggcgattcag gttcatcatg ccgtttgtga 3540 tggcttccat gtcggcagat gcttaatgaa tacaacagta ctgcgatgag tggcagggcg 3600 gggcgtaagg cgcgccattt aaatgaagtt cctattccga agttcctatt ctctagaaag 3660 tataggaact tcgaagcagc tccagcctac acaatcgctc aagacgtgta atgctgcaat 3720 ctgcatgcaa gcttggcact ggcgatggcg cctcatccct gaagccaata agcagctcca 3780 gcctacacaa tcgctcaaga cgtgtaatgc tgcaatctgc atgcaagcta gaccggggac 3840 ttatcagcca acctgt 3856 <210> 188 <211> 4568 <212> DNA <213> Artificial Sequence <220> <223> Expression cassette <Ptet-lgtA-PT5-galT-FRT-kan-FRT>. <400> 188 acaggttggc tgataagtcc ccggtctagc ttgcatgcag attgcagcat tacacgtctt 60 gagcgattgt gtaggctgga gctgcttcga agttcctata ctttctagag aataggaact 120 tcggaatagg aacttcattt aaatggcgcg ccttacgccc cgccctgccg gtaccgagag 180 cgcttttgaa gctggggtgg gcgaagaact ccagcatgag atccccgcgc tggaggatca 240 tccagccggc gtcccggaaa acgattccga agcccaacct ttcatagaag gcggcggtgg 300 aatcgaaatc tcgtgatggc aggttgggcg tcgcttggtc ggtcatttcg aaccccagag 360 tcccgctcag aagaactcgt caagaaggcg atagaaggcg atgcgctgcg aatcgggagc 420 ggcgataccg taaagcacga ggaagcggtc agcccattcg ccgccaagct cttcagcaat 480 atcacgggta gccaacgcta tgtcctgata gcggtccgcc acacccagcc ggccacagtc 540 gatgaatcca gaaaagcggc cattttccac catgatattc ggcaagcagg catcgccatg 600 ggtcacgacg agatcctcgc cgtcgggcat gcgcgccttg agcctggcga acagttcggc 660 tggcgcgagc ccctgatgct cttcgtccag atcatcctga tcgacaagac cggcttccat 720 ccgagtacgt gctcgctcga tgcgatgttt cgcttggtgg tcgaatgggc aggtagccgg 780 atcaagcgta tgcagccgcc gcattgcatc agccatgatg gatactttct cggcaggagc 840 aaggtgagat gacaggagat cctgccccgg cacttcgccc aatagcagcc agtcccttcc 900 cgcttcagtg acaacgtcga gcacagctgc gcaaggaacg cccgtcgtgg ccagccacga 960 tagccgcgct gcctcgtcct gcagttcatt cagggcaccg gacaggtcgg tcttgacaaa 1020 aagaaccggg cgcccctgcg ctgacagccg gaacacggcg gcatcagagc agccgattgt 1080 ctgttgtgcc cagtcatagc cgaatagcct ctccacccaa gcggccggag aacctgcgtg 1140 caatccatct tgttcaatca tgcgaaacga tcctcatcct gtctcttgat cagatcttga 1200 tcccctgcgc catcagatcc ttggcggcaa gaaagccatc cagtttactt tgcagggctt 1260 cccaacctta ccagagggcg ccccagctgg caattccggt tcgcttgctg tccataaaac 1320 cgcccagtct agctatcgcc atgtaagccc actgcaagct acctgctttc tctttgcgct 1380 tgcgttttcc cttgtccaga tagcccagta gctgacattc atccggggtc agcaccgttt 1440 ctgcggactg gctttctacg tgttccgctt cctttagcag cccttgcgcc ctgagtgctt 1500 gcggcagcgt gaggggatct tgacgcgtgt cacaggtagg acgcgccgaa gttcctatac 1560 tttctagaga ataggaactt cggaatagga actaaggagg atattcatac atgatggtag 1620 tgttcgaaat taatacgact cactataggg gaattgattc tggtaccaaa tgagtcgacc 1680 ggccagatga ttaattccta atttttgttg acactctatc attgatagag ttattttacc 1740 actccctatc agtgatagag aaaagtgaaa tgaatagttc gacaaaaatc tagaaataat 1800 tttgtttaac tttaagaagg agatatacaa atgccgtccg aagcattccg tcgtcaccgt 1860 gcttatcgcg aaaacaaact gcagccactg gtctctgtcc tgatctgcgc atacaacgtt 1920 gagaaatact tcgcacagtc tctggcagct gtagttaacc agacctggcg taacctggat 1980 atcctgatcg tagatgacgg ctctacggat ggtacgctgg cgatcgcaca gcgtttccag 2040 gaacaggacg gtcgtatccg cattctcgct cagccgcgta actctggtct gatcccgtct 2100 ctgaacatcg gtctggacga actggccaaa tctggtggtg gtggcgaata catcgcccgt 2160 actgacgccg acgacattgc ggccccggat tggatcgaaa aaatcgtagg tgaaatggag 2220 aaagaccgct ctatcatcgc gatgggtgct tggctggaag ttctgtccga agagaaagac 2280 ggtaaccgtc tggcccgtca ccatgaacac ggcaaaatct ggaaaaaacc gacccgtcac 2340 gaagatatcg cggacttctt cccgttcggt aacccgatcc ataacaacac catgatcatg 2400 cgtcgtagcg taatcgacgg tggtctgcgt tacaacaccg aacgtgattg ggcagaagac 2460 taccagtttt ggtatgacgt gtctaaactg ggtcgtctgg cttactaccc agaagcgctg 2520 gttaaatacc gtctgcacgc caaccaggtt agctccaaat actccatccg tcagcacgaa 2580 atcgcacagg gtatccagaa aacggctcgt aacgacttcc tgcagtccat gggtttcaaa 2640 acccgtttcg actctctgga gtaccgtcag atcaaagcgg ttgcgtatga gctgctggag 2700 aaacacctgc cggaagagga ctttgaacgt gcgcgtcgtt tcctgtacca gtgcttcaaa 2760 cgtaccgaca ctctgccggc gggtgcatgg ctcgactttg cagcggatgg tcgtatgcgt 2820 cgtctgttta ccctgcgtca gtacttcggt atcctgcatc gtctcctgaa aaaccgctaa 2880 tgatttcgtc gacacacagg aaacatatta aaaattaaaa cctgcaggag tttaaacgcg 2940 gccgcgatat cgttgtaaaa cgacggccag tgcaagaatc ataaaaaatt tatttgcttt 3000 caggaaaatt tttctgtata atagattcat aaatttgaga gaggagtttt tgtgagcgga 3060 taacaattcc ccatcttagt atattagtta agtataaata cacaaggaga tataccatga 3120 cgcaatttaa tcccgttgat catccacatc gccgctacaa cccgctcacc gggcaatgga 3180 ttctggtttc accgcaccgc gctaagcgcc cctggcaggg ggcgcaggaa acgccagcca 3240 aacaggtgtt acctgcgcac gatccagatt gcttcctctg cgcaggtaat gtgcgggtga 3300 caggcgataa aaaccccgat tacaccggga cttacgtttt cactaatgac tttgcggctt 3360 tgatgtctga cacgccagat gcgccagaaa gtcacgatcc gctgatgcgt tgccagagcg 3420 cgcgcggcac cagccgggtg atctgctttt caccggatca cagtaaaacg ctgccagagc 3480 tcagcgttgc agcattgacg gaaatcgtca aaacctggca ggagcaaacc gcagaactgg 3540 ggaaaacgta cccatgggtg caggtttttg aaaacaaagg cgcggcgatg ggctgctcta 3600 acccgcatcc gcacggtcag atttgggcaa atagcttcct gcctaacgaa gctgagcgcg 3660 aagaccgcct gcaaaaagaa tattttgccg aacagaaatc accaatgctg gtggattatg 3720 ttcagcgcga gctggcagac ggtagccgta ccgttgtcga aaccgaacac tggttagccg 3780 tcgtgcctta ctgggctgcc tggccgttcg aaacgctact gctgcccaaa gcccacgttt 3840 tacggatcac cgatttgacc gacgcccagc gcagcgatct ggcgctggcg ttgaaaaagc 3900 tgaccagtcg ttatgacaac ctcttccagt gctccttccc ctactctatg ggctggcacg 3960 gcgcgccatt taatggcgaa gagaatcaac actggcagct gcacgcgcac ttttatccgc 4020 ctctgctgcg ctccgccacc gtacgtaaat ttatggttgg ttatgaaatg ctggcagaga 4080 cccagcgaga cctgaccgca gaacaggcag cagagcgttt gcgcgcagtc agcgatatcc 4140 attttcgcga atccggagtg taacgcggag gcgcgccatt taaatcaacc tcagcggtca 4200 tagctgtttc ctgtgactga gcaataacta gcataacccc ttggggcctc taaacgggtc 4260 ttgaggggtt ttttgctgaa accaatttgc ctggcggcag tagcgcggtg gtcccacctg 4320 accccatgcc gaactcagaa gtgaaacgcc gtagcgccga tggtagtgtg gggtctcccc 4380 atgcgagagt agggaactgc caggcatcaa ataaaacgaa aggctcagtc gaaagactgg 4440 gcctttcggg atccaggccg gcctgttaac gaattaatct tccgcggcaa caaaaattag 4500 gaattaatca tctggccaat ttcaggtggc acttttcggg cagaccgggg acttatcagc 4560 caacctgt 4568

Claims (20)

  1. 시알릴화 올리고당류(sialylated oligosaccharides)를 생산하는 방법으로서, 이러한 방법이
    a) 이종 시알릴트랜스퍼라제를 포함하는 적어도 하나의 유전자 조작된 세포를 제공하는 단계로서, 상기 이종 시알릴트랜스퍼라제가 시알산 잔기를 공여체 기질(donor substrate)로서 그의 뉴클레오티드-활성화된 형태로부터 수용체 분자(acceptor molecule)로 전달하기 위한 α-2,3-시알릴트랜스퍼라제 활성 및/또는 α-2,6-시알릴트랜스퍼라제 활성을 보유할 수 있고, 여기서 수용체 분자가 락토스, 락토-N-트리오스 II 및 모유 올리고당류로 이루어진 군으로부터 선택된 것인 단계;
    b) 발효액 중에서 및 상기 시알릴화 올리고당류의 생산에 허용되는 조건 하에 상기 적어도 하나의 세포를 배양하는 단계; 및 임의로
    c) 상기 시알릴화 올리고당류를 회수하는 단계
    를 포함하는, 시알릴화 올리고당류를 생산하는 방법.
  2. 제1항에 있어서, 시알릴화 올리고당류가 3'-시알릴락토스, 6'-시알릴락토스, LST-a, LST-b, LST-c 및 DSLNT로 이루어진 군으로부터 선택된 것인 방법.
  3. 제1항 또는 제2항에 있어서, 발효액이 적어도 하나의 탄소 공급원을 함유하고, 적어도 하나의 탄소 공급원이 바람직하게는 글루코스, 프럭토스, 수크로스, 글리세롤, 및 그의 조합물로 이루어진 군으로부터 선택된 것인 방법.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 발효액이 N-아세틸글루코사민, 갈락토스 및 시알산으로 이루어진 군으로부터 선택된 적어도 하나를 함유하는 것인 방법.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 적어도 하나의 세포가 N-아세틸글루코사민, 갈락토스 및 시알산으로 이루어진 군으로부터 선택된 하나 이상의 부재 하에 및/또는 첨가 없이 배양되는 것인 방법.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 적어도 하나의 세포가 락토스, 락토-N-트리오스 II, LNT 및 LNnt로 이루어진 군으로부터 선택된 적어도 하나의 존재 하에 배양되는 것인 방법.
  7. 시알릴화 올리고당류를 생산하기 위한 유전자 조작된 세포로서, 여기서 유전자 조작된 세포가 이종 시알릴트랜스퍼라제를 포함하고, 상기 이종 시알릴트랜스퍼라제가 시알산 잔기를 공여체 기질로서 그의 뉴클레오티드-활성화된 형태로부터 수용체 분자로 전달하기 위한 α-2,3-시알릴트랜스퍼라제 활성 및/또는 α-2,6-시알릴트랜스퍼라제 활성을 보유할 수 있고, 여기서 수용체 분자가 락토스, 락토-N-트리오스 II 및 모유 올리고당류로 이루어진 군으로부터 선택된 것인, 시알릴화 올리고당류를 생산하기 위한 유전자 조작된 세포.
  8. 제1항 내지 제6항 중 어느 한 항에 있어서; 또는 제7항에 있어서, 수용체 분자가 삼당류, 사당류 및 오당류로 이루어진 군으로부터 선택된, 바람직하게는 3-푸코실락토스, 락토-N-테트라오스, 락토-N-네오테트라오스, 시알릴락토-N-테트라오스 a, 시알릴락토-N-테트라오스 b, 락토-N-푸코펜타오스 I 및 락토-N-푸코펜타오스 II로 이루어진 군으로부터 선택된 모유 올리고당류인, 방법; 또는 유전자 조작된 세포.
  9. 제1항 내지 제6항 또는 제8항 중 어느 한 항에 있어서; 또는 제7항 또는 제8항에 있어서, 이종 시알릴트랜스퍼라제가,
    i.  서열번호: 1 내지 33 중 어느 하나로 표시되는 바와 같은 아미노산 서열을 포함하거나 그로 이루어진 폴리펩티드;
    ii.  서열번호: 1 내지 33 중 어느 하나로 표시되는 바와 같은 아미노산 서열 중 어느 하나와 적어도 80%의 서열 유사성을 갖는 아미노산 서열을 포함하거나 그로 이루어진 폴리펩티드; 및
    iii.  i. 및 ii.의 폴리펩티드 중 어느 하나의 단편
    으로 이루어진 군으로부터 선택된 것인, 방법; 또는 유전자 조작된 세포.
  10. 제1항 내지 제6항 또는 제8항 및 제9항 중 어느 한 항에 있어서; 또는 제7항 내지 제9항 중 어느 한 항에 있어서, 유전자 조작된 세포가 이종 시알릴트랜스퍼라제를 코딩하는 뉴클레오티드 서열을 포함하는 핵산 분자를 포함하며, 상기 뉴클레오티드 서열이,
    i. 서열번호: 1 내지 33 중 어느 하나로 표시되는 바와 같은 폴리펩티드를 코딩하는 뉴클레오티드 서열;
    ii. 서열번호: 34 내지 66 중 어느 하나로 표시되는 바와 같은 뉴클레오티드 서열;
    iii. 서열번호: 1 내지 33 중 어느 하나로 표시되는 바와 같은 폴리펩티드를 코딩하는 뉴클레오티드 서열 중 하나와 적어도 80% 서열 유사성을 갖는 뉴클레오티드 서열;
    iv. 서열번호: 34 내지 66으로 표시되는 뉴클레오티드 서열 중 어느 하나와 적어도 80%의 서열 유사성을 갖는 뉴클레오티드 서열;
    v. i., ii., iii. 및 iv.의 뉴클레오티드 서열 중 어느 하나와 상보적인 뉴클레오티드 서열; 및
    vi. i., ii., iii., iv. 및 v.의 뉴클레오티드 서열 중 어느 하나의 단편
    으로 이루어진 군으로부터 선택되며,
    여기서 상기 뉴클레오티드 서열이 유전자 조작된 세포에서 이종 시알릴트랜스퍼라제를 코딩하는 상기 뉴클레오티드 서열의 전사 및/또는 번역을 수행하는 적어도 하나의 핵산 발현 제어 서열에 작동 가능하게 연결되는 것인, 방법; 또는 유전자 조작된 세포.
  11. 제1항 내지 제6항 또는 제8항 내지 제10항 중 어느 한 항에 있어서; 또는 제7항 내지 제10항 중 어느 한 항에 있어서, 유전자 조작된 세포가 유전자 조작되기 이전의 세포와 비교하여 CMP-N-아세틸뉴라민산, UDP-N-아세틸글루코사민, UDP-갈락토스 및 GDP-푸코스로 이루어진 군으로부터 선택된 하나 이상의 뉴클레오티드-활성화된 당류(sugars)의 생산 증가를 보유하는 것인, 방법; 또는 유전자 조작된 세포.
  12. 제1항 내지 제6항 또는 제8항 내지 제11항 중 어느 한 항에 있어서; 또는 제7항 내지 제11항 중 어느 한 항에 있어서, 유전자 조작된 세포가, 유전자 조작되기 이전의 세포와 비교하여, L-글루타민:D-프럭토스-6-포스페이트 아미노트랜스퍼라제, N-아세틸글루코사민-1-포스페이트 우리딜트랜스퍼라제, 글루코사민-1-포스페이트 아세틸 트랜스퍼라제, 포스포글루코사민 뮤타제, 글루코사민-6-포스페이트-N-아세틸트랜스퍼라제, N-아세틸글루코사민-2-에피머라제, UDP-N-아세틸글루코사민-2-에피머라제, 시알산 신타제, 포스포에놀피루베이트 신타제, CMP-시알산 신세타제, UDP-갈락토스-4-에피머라제, 갈락토스-1-포스페이트 우리딜릴트랜스퍼라제, 포스포글루코뮤타제, 글루코스-1-포스페이트 우리딜릴트랜스퍼라제, 포스포만노뮤타제, 만노스-1-포스페이트 구아노실트랜스퍼라제, GDP-만노스-4,6-데히드라타제, GDP-L-푸코스 신타제 및 푸코스키나제/L-푸코스-1-포스페이트-구아닐트랜스퍼라제로 이루어진 군으로부터 선택된 효소 활성을 보유할 수 있는 폴리펩티드를 코딩하는 하나 이상의 유전자의 과발현을 보유하는 것인, 방법; 또는 유전자 조작된 세포.
  13. 제1항 내지 제6항 또는 제8항 내지 제12항 중 어느 한 항에 있어서; 또는 제7항 내지 제12항 중 어느 한 항에 있어서, 세포가, 유전자 조작되기 이전과 비교하여, β-갈락토시다제, 글루코사민-6-포스페이트 데아미나제, N-아세틸글루코사민-6-포스페이트 데아세틸라제, N-아세틸만노사민 키나제, N-아세틸만노사민-6-포스페이트 에피머라제 및 N-아세틸뉴라민산 알도라제로 이루어진 군으로부터 선택된 하나 이상의 효소 활성이 없거나 그의 감소된 활성을 보유하는 것인, 방법; 또는 유전자 조작된 세포.
  14. 제1항 내지 제6항 또는 제8항 내지 제13항 중 어느 한 항에 있어서; 또는 제7항 내지 제13항 중 어느 한 항에 있어서, β-갈락토시다제, 글루코사민-6-포스페이트 데아미나제, N-아세틸글루코사민-6-포스페이트 데아세틸라제, N-아세틸만노사민 키나제, N-아세틸만노사민-6-포스페이트 에피머라제 및 N-아세틸뉴라민산 알도라제를 코딩하는 유전자 중 하나 이상이 유전자 조작된 세포에서 결실되었거나 그의 발현이 불활성화된 것인, 방법; 또는 유전자 조작된 세포.
  15. 제1항 내지 제6항 또는 제8항 내지 제14항 중 어느 한 항에 있어서; 또는 제7항 내지 제14항 중 어느 한 항에 있어서, 적어도 하나의 세포가 기능성 락토스 투과효소, 기능성 푸코스 투과효소 및 기능성 시알산 수송체 (내수송체(importer))로 이루어진 군으로부터 선택된 적어도 하나를 포함하고, 바람직하게는 기능성 락토스 투과효소, 기능성 푸코스 투과효소 및 기능성 시알산 수송체 (내수송체)로 이루어진 군으로부터 선택된 하나를 코딩하는 적어도 하나의 뉴클레오티드 서열을 포함하고 발현하는 것인, 방법; 또는 유전자 조작된 세포.
  16. 제1항 내지 제6항 또는 제8항 내지 제15항 중 어느 한 항에 있어서; 또는 제7항 내지 제15항 중 어느 한 항에 있어서, 세포가 β-1,3-N-아세틸글루코사미닐트랜스퍼라제, β-1,3-갈락토실트랜스퍼라제, β-1,4-갈락토실트랜스퍼라제, α-2,3-시알릴트랜스퍼라제 및 α-2,6-시알릴트랜스퍼라제로 이루어진 군으로부터 선택된 적어도 하나의 글리코실트랜스퍼라제의 활성을 보유하는 것인, 방법; 또는 유전자 조작된 세포.
  17. 시알릴화 올리고당류를 생산하는 방법으로서,
    a) 반응 혼합물에 시알릴트랜스퍼라제를 제공하는 단계로서, 시알릴트랜스퍼라제가 시알산 잔기를 공여체 기질로서 그의 뉴클레오티드-활성화된 형태로부터 수용체 분자로 전달하기 위한 α-2,3-시알릴트랜스퍼라제 활성 및/또는 α-2,6-시알릴트랜스퍼라제 활성을 보유할 수 있고, 여기서 수용체 분자가 락토스, 락토-N-트리오스 II 및 모유 올리고당류로 이루어진 군으로부터 선택된 것인 단계;
    b) 상기 시알릴트랜스퍼라제를 공여체 기질 및 수용체 분자와 접촉시키는 단계로서, 여기서 수용체 분자가 락토스, 락토-N-트리오스 II 및 모유 올리고당류로 이루어진 군으로부터 선택된 것인 단계
    를 포함하는, 시알릴화 올리고당류를 생산하는 방법.
  18. 영양 조성물, 바람직하게는 영아용 조성물(infant compostition)을 제조하기 위한, 제1항 내지 제6항 및 제8항 내지 제17항 중 어느 한 항에 따른 방법에 의해 생산된 시알릴화 올리고당류의 용도.
  19. 적어도 하나의 시알릴화 올리고당류를 포함하는 영양 조성물로서, 여기서 상기 적어도 하나의 시알릴화 올리고당류가 제1항 내지 제6항 및 제8항 내지 제17항 중 어느 한 항에 따른 방법에 의해 생산된 것인 영양 조성물.
  20. 제19항에 있어서, 적어도 하나의 중성 HMO와 조합하여 3'-SL 및/또는 6'-SL을 함유하며, 상기 적어도 하나의 중성 HMO가 바람직하게는 2'-FL인 영양 조성물.
KR1020207005518A 2017-07-26 2018-07-25 시알릴트랜스퍼라제 및 시알릴화 올리고당류 생산에서의 그의 용도 KR20200040247A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP17183391 2017-07-26
EP17183391.6 2017-07-26
PCT/EP2018/070214 WO2019020707A1 (en) 2017-07-26 2018-07-25 SIALYL-TRANSFERASES AND THEIR USE IN THE PRODUCTION OF SIALYLATED OLIGOSACCHARIDES

Publications (1)

Publication Number Publication Date
KR20200040247A true KR20200040247A (ko) 2020-04-17

Family

ID=59506067

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020207005518A KR20200040247A (ko) 2017-07-26 2018-07-25 시알릴트랜스퍼라제 및 시알릴화 올리고당류 생산에서의 그의 용도

Country Status (12)

Country Link
US (1) US20210087599A1 (ko)
EP (1) EP3658678A1 (ko)
JP (2) JP2020528280A (ko)
KR (1) KR20200040247A (ko)
CN (1) CN111133112A (ko)
AU (1) AU2018305183A1 (ko)
BR (1) BR112020001628A2 (ko)
MX (1) MX2020000969A (ko)
PH (1) PH12020550039A1 (ko)
RU (1) RU2020105821A (ko)
SG (1) SG11202000640RA (ko)
WO (1) WO2019020707A1 (ko)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA3085931A1 (en) * 2017-12-15 2019-06-20 Glycosyn LLC Sialyltransferases and uses thereof
PL3575404T3 (pl) 2018-05-28 2023-02-06 Chr. Hansen HMO GmbH Fermentacyjna produkcja sacharydów sialilowanych
EP3954769A1 (en) * 2020-08-10 2022-02-16 Inbiose N.V. Production of oligosaccharide mixtures by a cell
WO2022034067A1 (en) * 2020-08-10 2022-02-17 Inbiose N.V. Production of an oligosaccharide mixture by a cell
CN111979168B (zh) * 2020-08-17 2022-07-22 江南大学 一种提高乳酰-n-三糖ii产量的基因工程菌及生产方法
EP4281564A1 (en) * 2021-01-22 2023-11-29 Glycom A/S New major facilitator superfamily (mfs) protein (fred) in production of sialylated hmos
KR20230170961A (ko) * 2021-04-16 2023-12-19 인바이오스 엔.브이. 시알릴화 이당 및/또는 올리고당의 세포 생산
CN116200316A (zh) * 2021-11-30 2023-06-02 虹摹生物科技(上海)有限公司 一种基因工程菌及其在制备唾液酸乳糖中的应用
WO2023166035A2 (en) 2022-03-02 2023-09-07 Dsm Ip Assets B.V. New sialyltransferases for in vivo synthesis of 3'sl and 6'sl
DK181319B1 (en) 2022-03-02 2023-08-10 Dsm Ip Assets Bv Genetically engineered cells and methods comprising use of a sialyltransferase for in vivo synthesis of 3’sl
DK202270078A1 (en) 2022-03-02 2023-12-04 Dsm Ip Assets Bv New sialyltransferases for in vivo synthesis of lst-a
WO2023238843A1 (ja) * 2022-06-06 2023-12-14 協和発酵バイオ株式会社 3'-シアリルラクトースの生産性が向上した微生物および3'-シアリルラクトースの製造方法
CN114874966A (zh) * 2022-06-15 2022-08-09 江南大学 一种高产3′-唾液酸乳糖的大肠杆菌工程菌株的构建方法及应用
DK202200591A1 (en) 2022-06-20 2024-02-15 Dsm Ip Assets Bv New sialyltransferases for in vivo synthesis of lst-c
DK202200588A1 (en) 2022-06-20 2024-02-23 Dsm Ip Assets Bv Mixture of fucosylated HMOs

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6030815A (en) * 1995-04-11 2000-02-29 Neose Technologies, Inc. Enzymatic synthesis of oligosaccharides
US6096529A (en) * 1996-06-10 2000-08-01 National Research Council Of Canada Recombinant α-2,3-sialyltransferases and their uses
JP2002530087A (ja) * 1998-11-18 2002-09-17 ネオーズ テクノロジーズ, インコーポレイテッド オリゴ糖の安価な産生
AU2001248749A1 (en) * 2000-04-11 2001-10-23 Kyowa Hakko Kogyo Co. Ltd. Modified alpha2,3-sialyltransferase gene and process for producing alpha2,3-sialyltransferase and complex saccharide containing sialic acid
DE60234374D1 (de) * 2001-09-26 2009-12-24 Kyowa Hakko Bio Co Ltd Verfahren zur herstellung sialsäure enthaltendem komplexem zucker
US20080145899A1 (en) 2004-09-17 2008-06-19 Neose Technologies Inc Production of Oligosaccharides By Microorganisms
WO2006029538A1 (en) * 2004-09-17 2006-03-23 National Research Council Of Canada Sialyltransferases comprising conserved sequence motifs
WO2006043305A1 (ja) * 2004-10-18 2006-04-27 Japan Tobacco Inc. 糖転移酵素の酵素活性を向上させる方法
WO2006112025A1 (ja) * 2005-04-15 2006-10-26 Japan Tobacco Inc. 新規なβ-ガラクトシド-α2,3-シアル酸転移酵素、それをコードする遺伝子およびその製造方法
US7820422B2 (en) 2005-06-16 2010-10-26 Centre National De La Recherche Scientifique (Cnrs) Efficient production of oligosaccharides using metabolically engineered microorganisms
US7968310B2 (en) * 2006-02-01 2011-06-28 Biogenerix Ag Tagged sialyltransferase proteins
ES2456292T3 (es) 2006-03-09 2014-04-21 Centre National De La Recherche Scientifique (Cnrs) Procedimiento de producción de oligosacáridos sialilados
KR100886650B1 (ko) * 2007-04-13 2009-03-06 주식회사 진켐 신규 2,3―시알릭 전이효소 및 이를 이용한 말단에갈락토오스를 포함하는 물질의 제조방법
BRPI0816103A2 (pt) * 2007-08-28 2020-08-18 Japan Tobacco Inc. método para ligar proteínas a carregadores por fazer uso de tamavidinas.
KR20120028304A (ko) * 2009-06-12 2012-03-22 니뽄 다바코 산교 가부시키가이샤 신규 단백질 및 그것을 코드하는 유전자
WO2013022836A2 (en) * 2011-08-05 2013-02-14 The Regents Of The University Of California Pmst1 mutants for chemoenzymatic synthesis of sialyl lewis x compounds
DK2970872T3 (da) * 2013-03-14 2019-01-02 Glycosyn LLC Mikroorganismer og fremgangsmåder til fremstilling af sialylerede og N-acetylglucosamin-holdige oligosaccharider
KR101525230B1 (ko) * 2013-05-31 2015-06-01 주식회사 진켐 시알산 유도체의 제조방법
ES2715010T3 (es) * 2014-03-31 2019-05-31 Jennewein Biotechnologie Gmbh Fermentación total de oligosacáridos
US9938510B2 (en) * 2014-12-16 2018-04-10 The Regents Of The University Of California Photobacterium sp. alpha-2-6-sialyltransferase variants
EP3307882B1 (en) * 2015-06-09 2020-04-15 Glycom A/S Mutated photobacterium transsialidases
ES2870973T3 (es) * 2015-06-09 2021-10-28 Glycom As Mezclas ternarias de 6'-SL, LNnT y LST c
EP3141610A1 (en) * 2015-09-12 2017-03-15 Jennewein Biotechnologie GmbH Production of human milk oligosaccharides in microbial hosts with engineered import / export
WO2017101958A1 (en) * 2015-12-18 2017-06-22 Glycom A/S Fermentative production of oligosaccharides
EP3569713A1 (en) * 2018-05-16 2019-11-20 Jennewein Biotechnologie GmbH Use of glycosidases in the production of oligosaccharides
EP3789495A1 (en) * 2019-09-03 2021-03-10 Jennewein Biotechnologie GmbH Production of sialylated oligosaccharides in bacillus cells

Also Published As

Publication number Publication date
RU2020105821A3 (ko) 2021-11-19
JP2020528280A (ja) 2020-09-24
SG11202000640RA (en) 2020-02-27
RU2020105821A (ru) 2021-08-26
WO2019020707A1 (en) 2019-01-31
CN111133112A (zh) 2020-05-08
EP3658678A1 (en) 2020-06-03
JP2024010049A (ja) 2024-01-23
US20210087599A1 (en) 2021-03-25
AU2018305183A1 (en) 2020-02-13
MX2020000969A (es) 2020-09-28
BR112020001628A2 (pt) 2020-07-21
PH12020550039A1 (en) 2020-12-07

Similar Documents

Publication Publication Date Title
KR20200040247A (ko) 시알릴트랜스퍼라제 및 시알릴화 올리고당류 생산에서의 그의 용도
AU2017351657B2 (en) Improved process for the production of fucosylated oligosaccharides
CN110869508A (zh) 岩藻糖基转移酶及其在生产岩藻糖基化低聚糖中的用途
EP3141610A1 (en) Production of human milk oligosaccharides in microbial hosts with engineered import / export
KR20200067176A (ko) N-아세틸뉴라민산의 발효적 생산
KR20210023842A (ko) 시알릴화 사카라이드의 발효 생산
KR20130117753A (ko) 포스포케톨라아제를 포함하는 재조합 숙주 세포
CN113195509A (zh) 生产3-岩藻糖基乳糖和转化乳糖的α-1,3-岩藻糖基转移酶
TW201111512A (en) Improved isoprene production using the DXP and MVA pathway
JP2018522569A (ja) 組換え宿主内でのステビオールグリコシドの産生
KR20130027063A (ko) Fe-s 클러스터 요구성 단백질의 활성 향상
KR20220035247A (ko) 숙주 세포에서 푸코실락토스의 제조
KR20230111189A (ko) 재프로그램 가능한 iscb 뉴클레아제 및 이의 용도
KR20220042350A (ko) 단풍당밀뇨증 (msud)의 치료에 사용하기 위한 효소의 생합성
KR20200134333A (ko) 발효에 의한 히스타민 생산을 위해 조작된 생합성 경로
CN117321210A (zh) 产生以lnfp-i和lnt作为主要化合物的hmo共混物的方法
JP5882415B2 (ja) フルクトースが付加された糖質の製造方法
KR20230012530A (ko) 이소프레노이드의 생산을 위한 개선된 방법
RU2819876C2 (ru) Ферментативное получение сиалилированных сахаридов
JP5361433B2 (ja) タンパク質を微生物の細胞表層に提示する方法
KR102669217B1 (ko) 메탄자화균에서 사용하기 위한 발현 벡터
KR20120095962A (ko) 강화된 수크로스 뮤타제 활성을 가지는 미생물
DK202200591A1 (en) New sialyltransferases for in vivo synthesis of lst-c
KR20230088715A (ko) 장에서 섬유 합성 효소의 발현을 위한 조작된 프로바이오틱스
CN116635401A (zh) 具有改进性能的基因修饰的甲基菌

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal