KR20150127266A - 디포신류 및 이들의 사용 방법 - Google Patents
디포신류 및 이들의 사용 방법 Download PDFInfo
- Publication number
- KR20150127266A KR20150127266A KR1020157028954A KR20157028954A KR20150127266A KR 20150127266 A KR20150127266 A KR 20150127266A KR 1020157028954 A KR1020157028954 A KR 1020157028954A KR 20157028954 A KR20157028954 A KR 20157028954A KR 20150127266 A KR20150127266 A KR 20150127266A
- Authority
- KR
- South Korea
- Prior art keywords
- asn
- ile
- lys
- ser
- leu
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/33—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Clostridium (G)
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/02—Bacterial antigens
- A61K39/08—Clostridium, e.g. Clostridium tetani
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/04—Antibacterial agents
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Medicinal Chemistry (AREA)
- Genetics & Genomics (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Biochemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Animal Behavior & Ethology (AREA)
- Pharmacology & Pharmacy (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Gastroenterology & Hepatology (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Oncology (AREA)
- Communicable Diseases (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
- Engineering & Computer Science (AREA)
- Peptides Or Proteins (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Microbiology (AREA)
- Zoology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Wood Science & Technology (AREA)
- Plant Pathology (AREA)
- Immunology (AREA)
- Mycology (AREA)
- Epidemiology (AREA)
- Physics & Mathematics (AREA)
- Heterocyclic Carbon Compounds Containing A Hetero Ring Having Oxygen Or Sulfur (AREA)
Abstract
본 개시내용은 위험한 병원체인 클로스트리듐 디피실레 박테리아를 특이적으로 사멸하는 R-형 고분자량 박테리오신을 인코딩하는 유전자의 전체 클러스터의 발견 및 단리에 관한 것이다. 또한 개시내용은 무해한 호기성 생산자 세포 내에서 R-형 박테리오신을 생산하는 방법이다. 개시내용은 또한 디포신류 안으로 편입되어 변경된 사멸 스펙트럼을 갖는 조작된 또는 변이체 디포신류를 형성하는, 소분자의 비-ORF1374 수용체 결합 도메인(RBDs)이다. 본 명세서에서 제공된 변이체 디포신류는 이종성 RBD 및 그의 동족 기저판 부착 영역 (BPAR), 또는 융합된 BPAR을 포함할 수 있다. 본 발명은, C. 디피실레 박테리아가 감염된 환자 또는 농장 동물의 큰 피해 및 심지어는 사망을 야기할수 있는, 위장관의 환경에서 이들 박테리아를 선택적으로 사멸하기 위해, 증가된 열적 및 pH 안정성을 갖는 강력한 살균제 및 이를 생산하는 방법을 제공한다.
Description
보조금 정보
본 발명은 알러지와 감염성 질환을 위한 국립연구소인, 미국 국립보건원에 의해 수여된 과제 번호 R43AI098186-01 하에 정부 지원을 받아 만들어졌다. 미국정부는 본 발명에서의 특정한 권리를 가진다.
서열 목록
본원은 ASCII 포맷으로 전자적으로 제출되고 그리고 이로써 그 전체가 참고로 편입된 서열목록을 포함한다. 2014년 3월 6일자로 생성된 상기 ASCII 사본은 CF210341_SL.txt로 명명되고 그리고 크기는 476,921 바이트이다.
발명의 분야
본원은 일반적으로 박테리오신, 더 구체적으로는 클로스트리듐 디피실레를 특이적으로 사멸시키는 R-형 고분자량 박테리오신을 생성하기에 충분한 유전자의 클러스터의 동정 및 단리, 그리고 그의 살균 특이성의 변경, 이것을 생성 및 이용하는 방법에 관한 것이다.
클로스트리듐 디피실레는 인간 및 다른 포유동물에 대한 널리 알려져 있는 병원체인 편성 혐기성, 포자-형성, 그람 양성 박테리움이다(Bartlett 등, 1977; Bartlett 등, 1979; Keel 등, 2007; Sunenshine & McDonald, 2006). 저밀도 C. 디 피실레는 포유류 위장(GI) 관 내에 무해하게 잔류할 수 있으나, C. 디피실레 박테리아는 팽창에 의해, 종종 공생 박테리아를 감소시키는 항생제 투여의 결과로서, 중등의 설사 질환으로부터 특히 노인 및 유의미한 동반이환을 갖는 다른 사람들에게 생명을 위협하는 특징적인 가성-막성 대장염까지의 다양한 범위의 질환을 야기하기에 충분한 외독소를 생성한다(Bartlett, 2002]).
이러한 병원체에 의해 형성된 포자가 광범위하게 퍼지고, 병원 및 만성 질환 관리 시설에서 근절시키거나 불활성화시키기 어렵기 때문에, 환자의 C. 디피실레의 대량서식 개연성은 이러한 시설에 환자의 들어감에 의해 급격하게 증가한다(Bartlett, 2007). 사실상, C. 디피실레의 고독성의 독소생성 균주인 C. 디피실 레의 상대적으로 새로운 균주인, BI/NAP1/027은 엄청난 집단발병 설정에서 심각한 질환을 야기하며, 최근에 문서로 잘 기록되었다(Spigaglia 등, 2002; 등, 2004; McDonald 등, 2005; Muto 등, 2005; Loo 등, 2005; Belmares 등, 2009). 이전에는 위험이 낮았던 소아에서의 C. 디피실레 연관된 질환(CDAD)의 발생 정도가 또한 실질적으로 증가되었다(Benson 등, 2007; Zilberberg 등, 2010)..
무증상 보균자 또는 대량서식 대상체에서 항생제의 투여에 의한 예방적으로 병원체를 제거하는 것은 C. 디피실레 연관된 질환을 유도하는 높은 위험 때문에 강력하게 사용이 금지된다.
그람 음성 박테리아에 의해 만들어지는 R-형 박테리오신이 기재되어 있으며, 이는 다른 경쟁적 그람 음성 균주, 심지어 일부 상황에서는, 그람 음성 음성박테리아의 다른 종 또는 속을 사멸시키기 위해 이러한 박테리아에 의해 전개된다(Kageyama 등, 1964; Kageyama 등, 1964a; Kingsbury, D, 1966; Blackwell and Law, 1981; Blackwell 등, 1982; Campagnari 등, 1994; Strauch 등, 2001; Jabrane 등, 2002). R-형 피오신의 기저판 부착 영역(BPAR)의 이종성 수용체 결합 도메인(RBD)으로의 융합은 그람 음성 박테리아에 대한 신규한 살균 특이성을 갖는 신규한 R-형 피오신의 생성을 야기하는 것으로 기재되어 있다(Williams 등, 2008; Scholl 등, 2009).
다른 고-분자-중량 박테리오신 또는 R-형 박테리오신이 그람-양성 박테리아에 기재되어 있다(Coetzee 등, 1968; Thompson and Pattee, 1981; Zink 등, 1995). 그러나, 그람 양성 박테리아에 의해 생성되는 R-형 고분자량 박테리오신 구조에 대해서는 거의 알려져 있지 않다. 그러나, 이러한 것이 기재되어 있지만, 유전자 수준에서 특성화되거나 유용한 제제의 개발을 지원하거나 이에 필요한 방식으로 조작된 것이 없다. 고분자량 박테리오신은 2종의 클로스트리듐종, 즉 보 툴리늄 및 페르프린겐스에 대하여 기재되어 있다(Ellison 및 Kautter, 1970; Anastasio 등, 1971; Nieves 등, 1981). C. 디피실레에 의해 생성되거나 C. 디피실레를 사멸시키는 것은 기재된 것이 없다.
발명의 요약
본 발명은 다른 C. 디피실레의 균주에 대하여 살균성인 C. 디피실레-특이적 R-형 박테리오신(여기서 "디포신류"로 명명됨)을 인코딩하는 전체 유전자좌 또는 유전자 클러스터의 단리; 호기성 박테리아에서 디포신 유전자 클러스터의 발현 및 디포신류의 생성; 및 디포신 유전자 클러스터의 열린 해독틀(ORF) 1374가 C. 디피실레 균주에 대한 그 디포신의 살균 스펙트럼을 결정한다는 발견에 기초한다. 본 발명은 신규한 디포신류를 생성하기 위해 유전공학에 의해 디포신류의 특이성을 변경시키고 그리고 인간을 포함한 대량서식 동물의 위장(GI) 관으로부터 C. 디피실레를 제거하기 위해 직접적으로 또는 간접적으로 디포신류 제조하고 투여하는 실질적인 수단을 제공한다. 디포신류의 투여는 전통적 항생제가 그러한 것처럼, 양호한 건강에 필요한 공생적 GI 박테리아를 손상함이 없이, C. 디피실레 감염의 발생 및 관련 질환을 치료하거나 예방할 수 있다.
본 발명에 따르면, R-형 고분자량(hmw) 박테리오신을 인코딩하는 단리된 핵산 분자가 제공된다. 일 구현예에서, R-형 고분자량(hmw) 박테리오신을 인코딩하는 단리된 핵산 분자가 제공되며, 여기서, 상기 핵산 분자는 클로스트리듐 디피실레의 균주의 게놈으로부터의 것이며, 상기 R-형 hmw 박테리오신은 서열번호: 4-16, 18, 19, 및 66-80로 이루어진 군으로부터 선택되는 폴리펩타이드에 적어도 80% 동일한 폴리펩타이드를 포함하고, 그리고 R-형 hmw 박테리오신은 적어도 하나의 다른 C. 디피실레의 균주의 수용체에 결합하는 수용체 결합 도메인(RBD)을 가지며, 이에 따라 다른 C. 디피실레의 균주(들)에 대한 살균활성을 갖는다. 특정 구현예에서, 핵산분자는 Cd4, Cd16, Cd19108, Cd19123, Cd19126, Cd19145 및 ATCC 수탁 번호 43593으로 이루어진 군으로부터 선택된 클로스트리듐 디피실레의 균주의 게놈으로부터의 것이다. 일부 구현예에서, 균주는 Cd16이며, 핵산 분자는 서열 번호: 1을 포함하거나, 균주는 Cd4이고, 핵산 분자는 서열 번호: 61을 포함한다.
또 하나의 구현예에서, R-형 고분자량 (hmw) 박테리오신을 인코딩하는 단리된 핵산분자가 제공되며, 상기 핵산분자는 클로스트리듐 디피실레의 제1 균주의 게놈으로부터의 것이고, 그리고 서열번호: 66-77을 인코딩하는 폴리뉴클레오타이드에 적어도 80% 동일한 제1 폴리뉴클레오타이드 서열을 포함하고, 상기 핵산분자는 더욱이 C. 디피실레를 감염하는 박테리오파아지의 RBD 또는 C. 디피실레의 제2 균주의 게놈으로부터 프로파아지 또는 잔여 프로파아지의 수용체 결합 도메인 (RBD)을 인코딩하는 이종성 서열을 포함하고, 그리고 상기 R-형 hmw 박테리오신은 서열번호: 78의 폴리펩타이드에 적어도 80% 동일한 제1 기저판 부착 영역 (BPAR) 폴리펩타이드의 아미노 말단 부분의 적어도 50개의 인접 아미노산을 포함하고, 그리고 상기 R-형 hmw 박테리오신은 C. 디피실레의 적어도 하나의 균주에 대해 살균활성을 가진다.
본 발명의 또 하나의 구현예에서, 본 발명의 핵산분자에 의해 인코딩되는 단리된 R-형 박테리오신이 제공된다. 일 측면에서, R-형 박테리오신은 호기성 생산자 박테리움에서 발현된다. 일부 구현예에서, R-형 박테리오신은 동물에 경구로 퉁되어 질 수 있고 그리고 여전히 살균활성을 나타내는 형태로 배설물 안에 배출될 수 있다. 특정 구현예에서, R-형 박테리오신은 25 ℃에서 30분 동안 약 2.5 내지 10.6 사이의 pH에서 인큐베이션 후 얼마간의 살균활성을 보유한다. 일 측면에서, R-형 박테리오신은 25 ℃에서 30분 동안 약 3.4 내지 9 사이의 pH에서 인큐베이션 후 얼마간의 살균활성을 보유한다. 다른 구현예에서, R-형 박테리오신은 45 ℃에서 60분 동안 인큐베이션 후 얼마간의 살균활성을 보유한다.
본 발명의 또 하나의 구현예에서, 살균활성을 갖는 단리된 R-형 고분자량 (hmw) 박테리오신이 제공되며, 상기 R-형 hmw 박테리오신은 속 클로스트리듐의 박테리아의 제1 균주 또는 제1 종의 기저판 부착 영역 (BPAR), 및 클로스트리듐 종을 감염하는 박테리오파아지 또는 속 클로스트리듐의 제2종으로부터 또는 제1종의 제2 균주로부터 수용체 결합 도메인 (RBD) 또는 RBD의 변형된 형태를 포함하고, 상기 박테리오신은 클로스트리듐 디피실레의 적어도 하나의 균주에 대해 살균활성을 가진다. 특정 구현예에서, 상기 BPAR은 클로스트리듐 디피실레의 제1 균주로부터의 것이고 그리고 상기 RBD는 클로스트리듐 디피실레.를 감염하는 박테리오파아지로부터의 것이나 클로스트리듐 디피실레의 제2 균주로부터의 것이다. 일부 구현예에서, 상기 BPAR는 서열번호:16, 54-56 및 78의 하나 이상의 상응하는 분절에 적어도 80% 동일하다. 어떤 구현예에서, 상기 BPAR은 서열번호: 16 또는 78의 50 또는 그 이상의 인접 아미노산을 함유하거나 또는 서열번호: 54-56의 50 또는 그 이상의 인접 아미노산을 함유하는 폴리펩타이드에 적어도 80% 동일하다. 일부 구현예에서, 상기 BPAR은 서열번호: 78에 적어도 80% 동일한 제1 BPAR의 아미노-말단부와 이종성 RBD에 동족인 제2 BPAR의 C-말단부의 융합이다.
일부 구현예에서, 상기 RBD는 서열번호:17, 및 49-56의 하나 이상의 상응하는 분절에 적어도 80% 동일하다. 다른 구현예에서, 상기 인코딩된 RBD는 서열번호: 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 및 116으로 구성된 그룹으로부터 선택된 RBD에 적어도 80% 동일하다.
본 발명의 또 하나의 구현예에서, 본 발명의 핵산분자를 함유하는 발현 카세트가 제공된다. 발현 카세트는 발현 벡터, 예컨대 플라스미드 내에 포함될 수 있거나, 또는 생산자 세포의 염색체 내에 포함될 수 있다. 일부 구현예에서, 상기 발현 카세트는 R-형 박테리오신을 인코딩하는 핵산 분자에 작동가능하게 연결된 이종성 프로모터를 포함한다. 상기 프로모터는 유도성, 억제성, 또는 구성적으로 활성일 수 있다. 일 측면에서, 상기 프로모터는 유도성이고; 또 하나의 측면에서 상기 프로모터는 억제성이다. 일부 구현예에서, 상기 프로모터는 소분자 유발제, 억제인자, 또는 탈-억제인자를 부가하거나 제거함에 의해 유도된다. 일 측면에서, 상기 프로모터는 소분자 유발제 또는 탈-억제인자에 의해 유도된다. 일부 구현예에서, 상기 소분자 유발제 또는 탈-억제인자는 반응성 산소종 (ROS) 또는 ROS의 생성자이다. 일 측면에서, 상기 ROS는 인간 또는 다른 동물에 비독성인 퍼옥사이드이다. 일 예에서, 상기 퍼옥사이드는 과산화수소이다. 특정한 측면에서, 상기 카세트의 발현은 구성적으로 활성인 RecA 단백질을 인코딩하는 작동 가능하게 연결된 recA recA 유전자에 의해, 그리고 소분자 유발제 또는 탈-억제인자에 대하여 반응성인 이종성 프로모터의 제어 하에서 조절된다.
본 발명의 또 하나의 구현예에서, 본 발명의 상기 발현 카세트를 함유하는 생산자 세포가 제공된다. 상기 발현 카세트는 생산자 세포 내의 에피솜 발현 벡터에 포함될 수 있다. 대안적으로, 상기 생산자 세포는 그것의 염색체 내에 본 발명의 핵산분자 또는 발현 카세트를 포함할 수 있다. 어떤 구현예에서, 상기 생산자 세포는 비-병원성이고 편성 혐기성 박테리움이 아니다. 일부 구현예에서, 상기 비-병원성 및 편성 혐기성 박테리움이 아닌 것은 바실러스 , 락토바실러스, 및 리스테리아로 구성된 군으로부터 선택된 박테리아의 속으로부터의 종이다. 어떤 구현예에서, 상기 비-병원성 및 편성 혐기성 박테리움이 아닌 것은 바실러스 속으로부터의 것이다. 일부 측면에서, 상기 박테리움은 바실러스 서브틸리스이다. 특정한 측면에서, 상기 B. 서브틸리스는 PBSX 유전자 클러스터가 결여되어 있다. 또 하나의 구현예에서 상기 생산자 세포는 편성 혐기성이지만 비-병원성 박테리움이다.
본 발명의 또 하나의 구현예에서, 본 발명의 R-형 hmw 박테리오신을 생성하는 방법이 제공된다. 이 방법은 유도제 또는 억제제에 감수성인 유도가능한 또는 탈억제가능한 프로모터에 작동가능하게 연결된 본 발명의 핵산 서열을 함유하는 생산자 세포를 R-형 박테리오신의 발현을 유도하기에 효과적인 농도로 유도제 또는 억제제에 노출시키는 것, 및 발현된 R-형 박테리오신을 정제하는 것을 포함한다. 일부 구현예에서, 상기 R-형 박테리오신을 인코딩하는 핵산분자는 생산자 세포의 게놈에 대해 이종성이다. 특별한 측면에 있어서, 상기 핵산분자는 생산자 세포의 염색체 내에 포함되거나, 생산자 세포 내의 염색체외 발현 벡터에 포함된다. 어떤 구현예에서, 상기 생산자 세포는 비-병원성이고 편성 혐기성 박테리움이 아니다. 일부 구현예에서, 상기 비-병원성 및 편성 혐기성 박테리움이 아닌 것은 바실러스 , 락토바실러스, 및 리스테리아로 구성된 군으로부터 선택된 박테리아의 속으로부터의 종이다. 어떤 구현예에서, 상기 비-병원성 및 편성 혐기성 박테리움이 아닌 것은 바실러스 속으로부터의 것이다. 일부 측면에서, 상기 박테리움은 바실러스 서브틸리스이다. 특정한 측면에서, B. 서브틸리스는 유도되어 R-형 박테리오신을 생성하는 경우 용해되 추가의 측면에서, B. 서브틸리스는 PBSX 유전자 클러스터가 결여되어 있다.
본 발명의 추가 구현예에서, 병원성 박테리움을 사멸시키는 방법이 제공된다. 이 방법은 병원성 박테리움을 본 발명의 R-형 박테리오신과 접촉하는 것을 포함하고, 이에 의해 R-형 박테리오신이 병원성 박테리움과 결합하고 이를 사멸키는 것이다. 일 측면에서, 상기 병원체 박테리움은 클로스트리듐 디피실레이다. 일 측면에서, 상기 클로스트리듐 디피실레는 동물 내에 존재하며 R-형 박테리오신의 살균 양이 동물에 투여된다.
본 발명의 또 하나의 구현예에서, 동물 내의 클로스트리듐 디피실레의 질환-유발 감염의 치료 또는 예방 방법이 제공된다. 이 방법은 살균 량의 본 발명의 R-형 박테리오신을 그를 필요로 하는 동물에게 직접적으로 투여하거나, 또는 생산자 세포를 투여하거나, 또는 천연 디포신류를 생성하나 독소를 생성하지 않도록 유전적으로 변형된 C. 디피실레 박테리아의 포자를 투여함으로써 간접적으로 작용제를 투여하는 것을 포함한다. 특정 구현예에서, 동물 내에 클로스트리듐 디피실레의 감염은 살균 량의 박테리오신을 생성하도록 하는 양의 본 발명의 생산자 세포를 이를 필요로 하는 동물에게 투여함에 의해, 그에 의해 감염을 치료함으로써 치료된다. 일 측면에서, 박테리오신을 인코딩하는 핵산은 lac 프로모터의 조절하에 있으며, 동물은 락토오스가 투여된다. 일부 구현예에서, 상기 동물 포유동물이다. 일 측면에서, 상기 포유동물은 인간이다.
도면의 간단한 설명
도 1은 서열번호: 1-80의 핵산 또는 아미노산 서열을 제공한다.
도 2. 임상적 C. 디피실레 분리주에서의 디포신류의 살균활성. 표시 균주 번호는 매트릭스의 상단을 따라 나타내었으며; 별표-표시된 균주는 NAP1/027/BI 균주이다. 시험된 디포신류의 C. 디피실레 공급원의 동일성은 좌측 경계를 따라 나타내었다. 균주는 엘씨 포르티어(4 및 16), ATCC(43593) 또는 미국 캘리포니아주 쿨버 시티 소재의 알엠 알덴 리서치 랩으로부터 수득되었다.
도 3은 dif16의 스캐닝 전자현미경 사진을 나타낸다. 꽃-유사 테일 섬유 부속지를 주목하길 바란다.
도 4는 표적 균주 Cd19135 상의 dif4의 스폿 시험의 결과의 사진을 나타낸다. 정제된 디포신은 10-배 연속적으로 희석되었으며, 희석물의 5 μl 분취량이 표적 C. 디피실레 박테리아의 론 상에 스폿팅되었다. 37 ℃ 밤새워 혐기성 인큐베이션 후에, 론 상에서의 성장의 제거에 의해 디포신 사멸이 나타났다.
도 5는 dif4 ("4") 및 dif16 ("16")의 여과된 ("F") 및 비여과된 ("UF") 제제 양자의 은 염색된 SDS-PAGE의 사진을 나타낸다. 화살표는 잘라내고 질량 분광분석법에 의해 확인한 밴드를 나타낸다.
도 6은 Cd630 및 Cd16의 디포신 유전자 클러스터의 개략도를 나타낸다. 유전자좌는 마이오바이러스과 파아지 테일 기구에 전형적인 구조적 어셈블리 단백질 및 구조적 단백질을 인코딩하는 ORF, ORF1362 내지 ORF1375로 이루어지고 아래 맵에 나타내어 졌다. 이들 유전자를 플랭킹하는 것은 추정의 파아지-유사 조절 단백질을 인코딩하는 유전자였다. 하측 화살표는 ORF가 전사되는 방향을 나타내며, ORF의 추정적인 기능은 맵 상측에 명시되어 졌다.
도 7은 C. 디피실레 균주 19099의 론(lawn) 상에서 시험된 바실러스 서브틸리스 BDR123-488(섹터 1) 및 BDR123-491(섹터 2)에 의해 생산된 dif16의 스폿 시험의 이미지이다.
도 8은 활성 디포신류를 생산하는 C. 디피실레 5개 균주의 각각으로부터의 ORF1374 유전자에 의해 인코딩된 부분 아미노산 서열(출현의 순서로, 각각 서열번호: 81-86)의 ClustalW 분석의 결과를 제공한다. 정렬된 서열의 각각의 줄 아래의 "*"는 모든 5개 유전자에 의해 인코딩된 그 위치에서의 아미노산 동일성을 나타내며, ":"는 모든 5개 유전자에 의해 인코딩된 그 위치에서의 매우 유사한 아미노산을 나타내며, "."는 모든 5개 유전자에 의해 인코딩된 그 위치에서의 어느 정도 유사한 아미노산을 나타내며; 서열 정렬 내의 주어진 위치에서의 블랭크는 모든 5개 유전자에 의해 인코딩된 아미노산 유사성이 없음을 나타낸다.
도 9는 BDR123-580 및 "Dif 4-16"에 의해 생산된 "Dif4"의 스폿 시험의 이미지이다. 후자는 바실러스 서브틸리스 BDR123-587에 의해 생성되며, 여기서, dif4의 orf1374(서열번호: 49)를 dif16의 ORF1374(서열번호:17)로 전환시켰다. B . 서브틸리스에 의해 생산된 이들 2개의 디포신류는 양자가 명시된 바와 같이 균주 19137 및 19145의 론 상에서 시험되었다. "Dif4-16"에 의한 사멸의 특이성은 dif4의 것으로부터 dif16의 것으로 전환되었다.
도 10은 이종성 디포신류로 처리된 마우스 내에 C. 디피실레 부하를 미처리된 마우스의 것과 비교한 그래프를 나타낸다. 신규한 디포신류인, 비-1374-기재 RBD는 생체내에서 CDI를 감소하는 작용을 했다. C. 디피실레 포자 ("no Diff")로 챌린지된 미처리된 마우스에 비교된 바와 같이, C. 디피실레 포자로 챌린지되고 신규한 디포신류 ("+Diff")인 비-1374-기재 RBD가 경구로 투여된 마우스는 배설물 내에서 C. 디피실레 정량 넘침의 통계적으로 유의미한 (스튜던트 t-시험에 의해 p < 0.05) 감소/환원을 나타냈다.
도 11은 서열번호: 87-163의 핵산 또는 아미노산 서열을 제공한다.
발명의 상세한 설명
정의
본원에서 사용된 바와 같이, "R-형 고분자량 (hmw) 박테리오신"은 단순하게 "R-형 박테리오신"으로도 알려져 있으며, R-형 피오신, 디포신류, 모노신, 엔테로콜리티신, 메닝고신, 또는 박테리오파아지의 마이오바이러스과 패밀리와 구조적으로 또는 유전적으로 관련된 기타 고분자량(hmw) 박테리오신을 포함한다. R-형 박테리오신은 R-형 피오신, 디포신류, 엔테로콜리티신, 모노신 및 메닝고신의 변형된 버전을 포함한다(Williams 등 2008; Strauch 등, 2001; Kingsbury, 1966; Zink 등 1995).
본원에서 사용된 바와 같이 용어 "디포신"은 클로스트리듐 디피실레로부터 단리되거나 그로부터 유래된 R-형 고분자량 박테리오신을 지칭하며, C. 디피실레로부터 수득되는 천연의 입자뿐 아니라 비-천연 생산자 세포에서의 디포신 유전자 클러스터의 발현을 통해 수득되는 입자를 포함한다. 디포신은 또한 C . 디피실레의 하나 이상의 균주로부터 유도된 유전자에 의해 인코딩된 폴리펩타이드로 이루어진 조작된 입자일 수 있으며, 서열번호: 2-23, 49 및 62-80의 1 이상의 폴리펩타이드와 80% 또는 이를 초과하여 동일할 수 있다.
본 발명의 R-형 박테리오신은 열불안정일 수 있고, 약한 내산성, 트립신 내성일 수 있고, 약 65,000 x g에서 원심분리에 의해 침전가능할 수 있으며, 전자 현미경 검사에 의한 분해할 수 있다(Kageyama 등, 1962; Bradley, 1967; Daw 등, 1996; Jabrane 등, 2002; Fortier 등, 2007). 많은 사례에서, 여기에 개시된 조작된 R-형 박테리오신은 1 이상의 이들 특성을 임의의 조합으로 갖는다. 본 명세서에 개시된 R-형 박테리오신에 공통의 추가의 특성은 이들이 핵산을 함유하지 않으며, 그리고 따라서 복제 결핍이어서, 이들이 많은 박테리오파아지가 할 수 있는 것처럼, 표적 박테리움의 사멸 후에 또는 그 동안에 그들 자체를 재생시킬 수 없다는 점이다. 이들은 순수하게 단백질이며, 유기체가 아니다.
본 명세서에 개시된 R-형 박테리오신은 다중단백질, 또는 폴리펩타이드, 서브유닛을 포함하는 복합 분자이고, 마이오바이러스과 패밀리의 박테리오파아지의 테일 구조와 유사하다. 천연 발생 R-형 박테리오신에 있어서, 서브유닛 구조는 박테리아 게놈, 예컨대 C. 디피실레 또는 P. 에어루기노사의 게놈에 의해 인코딩되며, 다른 박테리아에 대한 천연 방어로 작용하는 R-형 박테리오신을 형성한다(Kageyama, 1975). 민감성 표적 세균은 전형적으로 단일의 R-형 박테리오신 분자에 의해 사멸될 수 있다(Kageyama 등, 1964; Kageyama 등, 1964a; Morse 등, 1980; Strauch 등, 2001).
"표적 박테리움" 또는 "표적 박테리아"는 본 개시내용의 R-형 박테리오신에 의해 결합된 및/또는 그의 성장, 생존 또는 복제가 그에 의해 억제되는 박테리움 또는 박테리아를 지칭한다. 일부 구현예에서, 표적 박테리움은 클로스트리듐 속으로부터의 것이다. 특정 구현예에서, 박테리움은 클로스트리듐 디피실레이다. 일 측면에서, C. 디피실레의 1 초과 균주가 표적화된다. C . 디피실레의 예시적인 균주는 비제한적으로 NAP1/BI/리보타입 027뿐만 아니라 도 2에 열거된 것을 포함한다.
용어 "성장억제" 또는 이들의 변형체는 박테리아 세포 분할의 속도를 늦추거나 중단하는 것이나 박테리아 세포 분할의 중단 또는 박테리움 또는 박테리아의 사멸을 지칭한다.
본원에서 사용된 바와 같이, "핵산" 또는 "핵산분자"는 전형적으로 단일- 또는 이중-가닥 형태의 데옥시리보뉴클레오타이드 또는 리보뉴클레오타이드폴리머(순수 또는 혼합형)를 지칭한다. 상기 용어는 상기 용어는 합성이며, 천연 발생 및 비-천연 발생이고, 참조 핵산과 유사한 결합, 구조적 또는 기능적 특성을 가지며, 참조 뉴클레오타이드에 유사한 방식으로 대사작용되는 뉴클레오타이드 유사체 또는 변형된 골격 잔기 또는 결합을 함유하는 핵산을 포함할 수 있다. 이러한 유사체의 예는, 비제한적으로, 포스포로티오에이트, 포스포르아미데이트, 메틸포스포네이트, 키랄-메틸포스포네이트, 2-0-메틸리보뉴클레오타이드, 및 펩타이드-핵산(PNAs)을 포함한다. 상기 용어 핵산은 일부 상황에서 유전자, cDNA, mRNA, 올리고뉴클레오타이드 및 폴리뉴클레오타이드와 상호교환적으로 사용될 수 있다.
특정한 핵산서열은 또한 보존적으로 변형된 그의 변이체(예컨대, 퇴행성 코돈 치환) 및 상보적 서열뿐 아니라 명백하게 명시된 서열을 포함한다. 특이적으로, 퇴행성 코돈 치환은 1 이상의 선택된 (또는 모든) 코돈의 제3("wobble") 위치가 혼합형-염기 및/또는 데옥시이노신 잔기로 치환되는 서열을 생성함으로써 달성될 수있다. 따라서, 본 명세서에 개시된 단백질 서열을 인코딩하는 핵산 서열은 또한 본원에 기재된 바와 같이 그의 변형된 변이체를 포함한다.
아미노산 서열에 대한 참고로 본원에서 사용된 바와 같이 용어 "분절"은 길이에서 10, 12, 15, 20, 25, 50, 또는 100 아미노산 잔기일 수 있는 아미노산의 인접서열을 지칭한다.
단백질 또는 핵산서열의 부분에 대한 참고로 사용되는 경우, 본원에서 사용된 바와 같이, 용어 "이종성"은 서열이 천연에서 서로 동일한 관계에 있는 것으로 통상 관찰되지 않는 2개 이상의 하위 서열을 포함하는 것을 나타낸다. 일 예에서, 상기 이종성 서열은 상이한 종의 박테리아로부터의 것이다. 또 하나의 예에서, 이종성 서열은 동일한 종의 박테리아의 상이한 균주로부터의 것이다. 일 측면에서, 상기 이종성 서열은 C. 디피실레의 상이한 균주로부터의 것이다. 또 하나의 측면에서, 상기 이종성 서열은 박테리움 및 박테리오파아지 또는 프로파아지로부터의 것이거나, 박테리움 및 합성, 비-천연 DNA의 서열로부터의 것이다.
용어들 "폴리펩타이드", "펩타이드", 및 "단백질"은 전형적으로 아미노산 잔기의 폴리머를 지칭하기 위하여 본 명세서에서 상호교환적으로 사용된다. 아미노산은 본 명세서에서 그것의 통상적으로 공지되어 있는 3-문자 기호로, 또는 IUPAC-IUB 생화학 명명법 협회에 의해 권고되는 1-문자 기호로 지칭될 수 있다.
발병력 인자는 유기체의 병원성에 기여하나 필연적으로 그의 일반적인 생존력에 기여하는 것은 아닌 분자이다. 발병력 인자의 소실에 의해, 유기체는 병원성이 더 적으나, 필연적으로 덜 생존가능한 것은 아니다. 발병력 인자는 수많은 기능, 예컨대 유전자 발현 조절, 부착 또는 이동 제공, 독소 제공, 독소 주입, 항생제 배출 또는 바이오 필름을 포함한 보호 코팅물 형성 중 임의의 하나를 가질 수 있다.
적합성 인자는 유기체의 일반적인 생존력, 성장률, 또는 그의 환경에서의 경쟁력에 기여하는 분자이다. 적합성 인자의 소실에 의해, 유기체는 덜 생존가능하거나 덜 경쟁적이며, 그리고 이러한 절충 때문에, 간접적으로 거의 병원성이 아니다. 적합성 인자는 또한 수많은 기능, 예컨대 영양소, 이온 또는 물의 획득, 세포막 또는 세포벽의 성분 또는 보호제 형성, 핵산의 복제, 수선 또는 돌연변이 유발, 환경적인 또는 경쟁적인 손상으로부터의 방어 또는 그에 대한 공격 제공 중 임의의 하나를 가질 수 있다.
본원에서 사용된 바와 같은 용어 "생산자 세포"는 디포신-인코딩 핵산 분자를 생성하거나 발현할 수 있으며, 이러한 핵산 분자를 천연적으로 함유하지 않는 세포를 지칭한다. 생성자 세포는 산소의 존재 하에서 생존하고 성장할 수 있으며, 디포신을 인코딩하는 핵산 분자를 함유하는 벡터로 형질전환되며, 이 벡터는 생성자 세포의 염색체 내로 통합되거나 에피솜일 수 있다. 상기 생산자 세포는 그람 양성 박테리움일 수 있다. 어떤 구현예에서, 상기 생산자 세포는 바실러스, 락토바실러스, 락토구균, 클로스트리듐, 또는 리스테리아 속으로부터의 박테리움일 수 있다. 바람직한 구현예에서, 상기 생산자 세포 바실러스, 락토바실러스, 락토구균, 또는 리스테리아 . 속으로부터의 박테리움이다. 일부 구현예에서, 상기 박테리움은 서브틸리스, 아밀롤리쿠에파시엔스, 및 메가테리움으로 이루어지는 군으로부터 선택된 바실러스 속으로부터의 종이다. 일 측면에서, 상기 박테리움은 바실러스 서브틸리스이다. 특정한 측면에서, 상기 생산자 세포는 PBSX 유전자 클러스터가 결여된 B. 서브틸리스 균주이다. 다른 구현예에서, 상기 박테리움은 악시도필러스, 카세이, 및 불가리쿠스로 이루어지는 군으로부터 선택된 락토바실러스 속으로부터의 종이다. 또 다른 구현예에서, 상기 박테리움은 리스테리아이노쿠아이다. 또 하나의 구현예에서, 상기 비-병원성 생산자 세포는 에스케리치아 콜리 또는 클로스트리듐 속의 것일 수 있다.
본 개시내용을 실행하는 방법의 상세한 설명
C. 디피실레 로부터 단리된 R-형 박테리오신은 살균활성을 가진다.
살균활성에 대한 시험을 위하여, 엄격한 혐기성 조건 하에서 세포를 중간-대수 증식에 대해 성장시킨 다음, 배양물을 3 μg/ml의 미토마이신 C에 노출시킴에 의해 2개의 C. 디피실레균주인, Cd4 및 Cd16(엘씨 포르티어로부터)의 용해물을 만들었다. 박테리아 세포를 용해 후, 용해물 중의 입자는 농축되고, 고속원심분리로 정제되었다(실시예 1 참조). 이들 제제는 전자 현미경에 의해 농축된 머리가 없는 파아지-유사 입자를 함유하는 것으로 나타났다(도 3). 농축 및 정제 후에, 제제는 스폿 플레이트 방법에 의하여 살균활성에 대하여 평가되었고, 이에 의해 샘플은 다시 엄격한 혐기성 조건 하에서 표적 C. 디피실레 박테리아의 오버레이 론에 적용되었다. 대부분의 파아지 테일-유사 박테리오신이 전형적으로 생성 박테리아와 상이한 균주를 표적화하기 때문에, 처음에 29개의 C. 디피실레 임상적 분리주의 패널로 이루어진 표적 균주가 시험되었다. 밤새 인큐베이션 후, 플레이트는 정제된 물질을 스폿한 C. 디피실레 박테리아의 론에서의 제거에 의해 명시된 바와 같은 사멸 활성의 존재에 대하여 시험되었다. 도 4는 C. 디피실레 균주인, Cd19135 상에 스폿된 Cd4로부터의 디포신(dif 4)의 전형적인 스폿 검정을 나타낸다.
Dif4(Cd4로부터의 디포신) 및 dif16(Cd16으로부터의 디포신)은 스폿 검정에 기초하여 상이한 세균 스펙트럼을 실증하였다(도 2). Dif4는 29개의 C. 디피실레 임상적 분리 균주 중 10개 상에서 살균활성을 보여주는 한편, dif16은 29개 균주 중 8개에 대하여 활성을 가졌다. 양자의 디포신류에 감수성인 균주의 일부 중첩이 존재하였으나, 두 개 디포신류는 뚜렷이 다른 살균 스펙트럼을 가졌다. Cd108 및 Cd 43593으로부터의 디포신류는 매우 유사한 사멸 스펙트럼을 가졌으며, 29개의 C. 디피실레 임상적 분리주의 패널에서 10개 NAP1/027/BI 고독성 균주 중 적어도 9개를 사멸시켰다. 추가로 시험하는 경우, dif43593은 모든 18개의 추가의 독립적인 NAP1/027/BI 분리주를 사멸시켰다. 따라서, dif43593은 NAP1/027/BI C. 디피실레,의 모든 28개의 시험된 균주를 사멸켰다, 도 2 참조.
디포신 유전자좌의 동정.
Cd4 균주로부터 단리되고 정제된 디포신 입자는 변성되고, 그리고 소듐 도데실 설페이트 폴리아크릴아미드 겔 전기영동(SDS PAGE)에 의해 단백질 성분이 분리되고, 은 염색에 의해 검출되었다(도 5). 두 개의 개별적 밴드인, ~200 kD 및 ~40 kD가 잘려지고, 질량 분광분석법으로 분석되었다. 40 kD 밴드로부터의 펩타이드는 참조 균주 Cd630(유전자은행 Acc. No. NC_009089.1)을 포함하여 완전한 게놈이 시퀀싱된 몇몇의 C. 디피실레 균주에 인코딩된 두 개의 C. 디피실레 전사 해독틀 (ORF)로부터의 예상된 생성물과 부합하는 것으로 밝혀졌다. 이들 중 제1의 것은 ORF1363(서열번호: 5)로, 39,192 달톤 파아지-유사 단백질이었다. 이 밴드에서 제2의 우세한 폴리펩타이드는 ORF1371(서열번호: 14)로, 39,565 달톤 파아지-유사 기저판 단백질에 해당하였다. 이들 단백질은 공교롭게도 분자량이 매우 유사하기 때문에, 이들은 동일한 SDS PAGE 밴드로 이동하였다. 200 kD 밴드는 두 개의 다른 파아지-유사 ORF의 인접한 다운스트림인 ORF 1374(서열번호: 17)의 C-말단의 부분에 해당하는 지배적인 폴리펩타이드를 생산하였다.
이들 ORF가 Cd630 게놈 내에서 매우 근접한 부근에 맵핑되기 때문에, 주변 영역이 분석되었다. 프로파아지-유사 요소가 염기 1574593과 1596384 사이에 관찰되었으며, 이는 ORF1360A-1379를 포함한다(도 6 및 서열번호: 1-23). 이러한 영역에서 인코딩된 구조 유전자는 전형적인 마이오바이러스과 파아지의 테일 구조의 성분에만 해당되며; 캡시드, 캡시드 어셈블리 단백질 또는 관문 단백질에 대한 유전자가 관찰되지 않았음을 특히 주목하였다. 또한, 추정적인 DNA 복제 또는 DNA 패키징 기작을 암호화하는 어떤 ORF은 부재였다. 따라서, 이 유전자좌는 R-형(마이오바이러스과파아지 테일-유사) 박테리오신의 것과 일치하였다. 구조 유전자를 프랭킹하는 것은 추정적 파아지-유사 조절 단백질을 인코딩하는 몇몇 ORF였다. 이 유전자좌로부터의 몇몇 ORF가 디포신 입자에서 관찰되는 폴리펩타이드를 인코딩하며, 유전자 클러스터가 R-형 박테리오신의 것과 유사한 사실 때문에, 본 발명자들은 디포신 유전자좌를 이 영역에 배정하였다.
구조 유전자는 모두 한 가닥 상에 인코딩되었으며, 동일한 방향으로 전사되었다. 상기 유전자의 구성은 R-형 피오신 및 많은 마이오바이러스과 파아지의 유전자의 구성과 유사하였다. 몇몇의 구조 단백질은 파아지 Φ119 및 ΦC2를 포함한 공지된 C. 디피실레 박테리오파아지에 대하여 서열 유사성을 나타내었다(Goh 등, 2007; Govind 등, 2006). C. 디피실레 균주 Cd630은 또한 2개의 온전한 프로파아지를 인코딩하는 것으로 알려져 있으며, 이들 둘 모두는 유도 가능한 것으로 공지되어 있다(Goh 등, 2007). 몇몇 디포신 ORF는 C. 디피실레 균주 Cd630의 프로파아지 1 및 2에 대하여 서열 유사성을 가졌으며, 이는 이들 C. 디피실레 마이오바이러스과 파아지 및 디포신류가 공통의 선조를 공유함을 시사한다.
디포신의 ORF 1374 (서열번호:17)를 특히 주목하였다. 이 유전자는 ORF1374가 R-형 박테리오신 테일 섬유, 즉 수용체 결합 도메인(RBD)의 부분이었음을 나타내는 클러스터 내의 소정의 위치인, ORF1373, 서열번호: 16의 인접한 다운스트림에 위치하는 큰 폴리펩타이드를 인코딩하였다. 디포신류로 지정된 것의 전자 현미경사진에 의해 테일 섬유 영역 내의 큰 꽃 유사 구조가 드러났기 때문에, 이러한 구조가 큰 단백질을 포함하는 것이 명백하였다. ORF 1373 (서열번호:16)은 디포신 테일 섬유의 기저판 부착 영역, BPAR을 인코딩하였으며, C. 디피실레 파아지에 ORF1374가 결여되어 있는 것을 고려하면, 이는 RBD뿐 아니라 BPAR을 인코딩하는 이러한 파아지에서의 유사한 ORF1373의 끝이 잘린 형태인 것으로 보인다. 따라서, 천연 발생 디포신류의 테일 섬유는 두 개의 단백질, ORF1373 및 ORF1374로 이루어지며, 이들은 연결된 테일 섬유를 형성하는 한편, C. 디피실레의 박테리오파아지는 단일 단백질, 즉 BPAR 및 RBD 기능을 제공하는 어느 정도 더 긴 ORF1373으로 이루어진 테일 섬유를 갖는다. 이러한 이해와 함께, ORF1373 (서열번호:16) 또는 ORF1374 (서열번호:17) 중 어느 하나를 인코딩하는 핵산이 본 명세서에서 새로운 RBD 특이성 기능을 조작하기 위한 것으로부터 기질로 전개되었다.
디포신류는
C.
디피실레
분리주
중에 광범위하게 분포되어 진다.
C. 디피실레의 일련의 독립적인 임상적 분리주가 상이한 살균 스펙트럼을 가질 수 있는 디포신 입자를 생성하는 능력에 대하여 시험되었다. 임상적 분리주 Cd19123, Cd19145, Cd19126, Cd19108(미국 캘리포니아주 쿨버 시티 소재 알엠 알덴 리서치 랩으로부터의 것) 및 ATCC Cd43593이 엄격한 혐기성 조건 하에서 미토마이신 C로 유도되었고, 그 다음 생성된 입자의 정제 및 농축이 따랐다. 그런 다음, 정제된 물질을 임상적 집단에서 다른 C. 디피실레 균주의 론 상에 따로 스폿팅하여, 살균활성을 검출하였다. 상기 결과는 이들 각각의 분리주가 상이한 살균 스펙트럼을 갖는 입자(각각 임상적 분리주 Cd19123, Cd19145, Cd19126, Cd19108 및 ATCC Cd43593으로부터의 dif123, dif145, dif126, dif108 및 dif43593로 명명되는 디포신류)를 생성하였음을 보여준다(도 2). Dif108 및 dif43593은 매우 유사하고 넓은 스펙트럼을 갖는 반면, 균주 Cd19145는 좁은 살균 삵균 스펙트럼을 갖는 입자를 생성하였다. Cd19113 및 Cd19150을 포함하는 유도에 대하여 시험한 몇몇 분리주는 미토마이신에 대한 노출 후에 용해되었만, 검출가능한 디포신 입자를 생성하지 않았다.
실험실 균주 Cd630을 시퀀싱한 게놈이 디포신 유전자좌를 인코딩하며; 그리고 사실상, 이 게놈을 본 명세서에서 사용하여 디포신 유전자를 동정하는 것이 본 명세서에서 인식되었다. 그러나, 균주 Cd630은 미토마이신 C로의 유도 후에 용해되는 반면, 검출가능한 디포신 입자를 생성하지는 않았다. 대신에, 소량의 프로파아지 1 및 프로파아지 2가 생성되었다.
디포신 클러스터의 동정 및 클로닝.
Cd630은 미토마이신 C에 의한 용해의 유도 시에 검출가능한 디포신 입자를 생성하지 않았다. 따라서, 대신에 Cd16으로부터 디포신 유전자 클러스터가 클로닝되었다. Cd16의 드래프트 게놈 서열을 먼저 수득하였다. Cd630의 것과 유사한 디포신 유전자좌를 동정하고, 주석을 달았다. 생산자 균주 Cd16으로부터의 전체 디포신 유전자 클러스터는 BAC 안으로 클로닝되었으며(서열번호: 1), 그리고 차후에 비-병원성 미생물 및 편성 혐기성이 아닌 것에서 활성 디포신을 생성하는데 필요한 모든 유전자를 포함하는 것으로 증명되었다. C. 디피실레는 병원성이면서 편성 혐기성 박테리움이며, 이는 천연 디포신류 또는 재조합 DNA 조작에 의해 변형된 디포신류를 위한 비현실적인 생성 세포이게 한다. 단리된 디포신 클러스터는 또한 재조합 DNA 기법에 의해 조작될 수 있어 그의 발현이 생산자 미생물의 배양물 또는 유도 배지에 첨가되는 비독성 소분자 유발제 또는 탈-억제인자에 반응하는 이종 프로모터에 의해 조절되게 할 수 있다. 이러한 소분자는 비제한적으로, 테트라사이클린, 안하이드로테트라사이클린, 락토오스, 아라비노오스, 자일로스 및 이들의 비-대사작용된 유사체, 예컨대 락토오스를 대체하기 위한 IPTG를 포함한다.
디포신류
디포신류는 클로스트리듐 디피실레로부터 단리된 R-형 hmw 박테리오신이며, 이는 다른 C. 디피실레의 균주에 대하여 살균성이다. 디포신류는 미토마이신 C의 존재 하에서 혐기성 조건 하에서 성장하는 C. 디피실레 균주로부터 단리할 수 있다. 일부 구현예에서, 디포신은 C. 디피실레 임상학적 분리주 Cd4, Cd16, Cd19123, Cd19145, Cd19126, Cd19108 또는 ATCC Cd43593로부터의 것이다(각각 dif4, dif16, dif123, dif145, dif126, dif108 및 dif43593으로 명명됨). 일 측면에서, 디포신은 Cd4로부터의 것이며; 또 하나의 측면에서 디포신은 Cd16으로부터의 것이다.
본 발명의 또 하나의 구현예에서, 속 클로스트리듐 박테리아의 게놈으로부터 유도된 디포신류를 인코딩하는 단리된 핵산분자가 제공된다. 일 측면에서, 상기 핵산분자는 서열번호: 1의 유전자 클러스터를 함유한다. 또 하나의 측면에서, 상기 핵산분자는 서열번호: 61의 유전자 클러스터를 함유한다 다른 구현예에서, 상기 핵산분자는 서열번호: 2-23; 49, 62-80로 이루어진 군으로부터 선택되는 하나 이상의 폴리펩타이드를 포함하는 디포신을 인코딩한다. 또 다른 구현예에서, 상기 핵산분자는 서열번호: 4-16, 18, 19, 및 66-80로 이루어진 군으로부터 선택되는 하나 이상의 폴리펩타이드를 포함하는 디포신을 인코딩한다. 일 측면에서, 상기 핵산분자는 서열번호: 2-23의 폴리펩타이드를 인코딩한다. 또 하나의 측면에서, 상기 핵산분자는 서열번호: 49 및 62-80의 폴리펩타이드를 인코딩한다.
또한 변이체 디포신류가 제공된다. 변이체 디포신류는 서열번호: 4-16, 18, 19, 및 66-80로 이루어진 군으로부터 선택되는 폴리펩타이드에 적어도 80% 동일한 아미노산 서열을 갖는 디포신류의 것을 포함한다. 다른 구현예에서, 상기 변이체 디포신는 서열번호: 4-16, 18, 19, 및 66-80로 이루어진 군으로부터 선택되는 폴리펩타이드에 적어도 85%, 88%, 89%, 90%, 95%, 96%, 97%, 98%, 또는 더욱이는 99% 동일한 아미노산 서열을 갖는다.
일부 구현예에서, 상기 변이체 디포신은 이종성 기저판 부착 영역 (BPAR)을 포함할 수 있고, 상기 BPAR은 서열번호: 16, 54-56, 및 78의 하나 이상의 상응하는 분절에 적어도 80% 동일하다. 또 하나의 구현예에서, 상기 BPAR은 서열번호: 16, 54-56, 및 78의 하나 이상의 상응하는 분절에 적어도 85% 동일하다. 또 하나의 구현예에서, 상기 BPAR은 서열번호: 16, 54-56, 및 78의 하나 이상의 상응하는 분절에 적어도 89% 동일하다. 또 하나의 구현예에서, 상기 BPAR은 서열번호: 16, 54-56, 및 78의 하나 이상의 상응하는 분절에 적어도 90% 동일하다. 또 하나의 구현예에서, 상기 BPAR은 서열번호: 16, 54-56, 및 78의 하나 이상의 상응하는 분절에 적어도 95% 동일하다. 또 하나의 구현예에서, 상기 BPAR은 서열번호: 16, 54-56, 및 78의 하나 이상의 상응하는 분절에 적어도 98% 동일하다. 추가 구현예에서, 상기 BPAR은 서열번호: 16, 54-56, 및 78의 하나 이상의 상응하는 분절에 적어도 99% 동일하다.
일부 구현예에서, 상기 변이체 디포신은 원상태 BPAR 폴리펩타이드의 아미노 말단 부분의 적어도 50 인접 아미노산을 포함한다. 추가 구현예에서, 상기 변이체 디포신은 원상태 BPAR 폴리펩타이드의 아미노 말단 부분의 적어도 100 인접 아미노산을 포함한다. 특정 구현예에서, 상기 적어도 50 인접 아미노산은 서열번호: 78의 폴리펩타이드에 적어도 80% 동일한 BPAR의 아미노 말단 부분으로부터의 것이다. 어떤 측면에서, 상기 적어도 50 인접 아미노산은 서열번호: 78의 폴리펩타이드에 적어도 85%, 90%, 95%, 또는 98% 동일한 BPAR의 아미노 말단 부분으로부터의 것이다. 어떤 다른 측면에서, 상기 적어도 100 인접 아미노산은 서열번호: 78의 폴리펩타이드에 적어도 85%, 88%, 89%, 90%, 95%, 96%, 97%, 98%, 또는 심지어 99% 동일한 BPAR의 아미노 말단 부분으로부터의 것이다.
다른 구현예에서, 상기 변이체 디포신은 RBD에 동족인 BPAR을 함유한다. 본원에서 사용된 바와 같이, "RBD에 동족인 BPAR" 또는 "동족 BPAR"은 천연 디포신, C. 디피실레 게놈, 박테리오파아지, 또는 프로파아지에서 함께 발생하는 BPAR 및 RBD 쌍을 지칭한다. 특정 구현예에서, RBD 및 이의 동족 BPAR은 디포신 분자의 나머지에 이종성이다. 일 측면에서 동족 BPAR은 디포신의 원상태 BPAR의 아미노 말단 부분에 융합되어 "융합된 BPAR"를 형성한다. 따라서, 일부 구현예에서, 상기 변이체 디포신은 융합된 BPAR을 포함한다. 어떤 구현예에서, 상기 변이체 디포신은 이종성 RBD 및 이의 동족 BPAR을 함유한다. 일부 구현예에서, 상기 융합된 BPAR은 서열번호: 88, 91, 93, 95, 97, 99, 101, 103, 105, 107, 109, 111, 및 115로 이루어지는 군으로부터 선택된 서열에 적어도 80% 동일하다. 다른 구현예에서, 상기 융합된 BPAR은 서열번호: 88, 91, 93, 95, 97, 99, 101, 103, 105, 107, 109, 111, 및 115로 이루어지는 군으로부터 선택된 서열에 적어도 85%, 88%, 89%, 90%, 95%, 96%, 97%, 98%, 또는 심지어 99% 동일하다.
추가 구현예에서, 상기 변이체 디포신은 이종성 수용체 결합 도메인(RBD)을 포함할 수 있으며, 여기서, 상기 RBD는 서열번호: 17 및 49-53 중 하나 이상에 상응하는 분절에 적어도 80% 동일하거나 서열번호: 54-56으로 이루어진 군으로부터 선택되는 폴리펩타이드의 수용체 결합 도메인(RBD)을 함유하는 폴리펩타이드에 적어도 80% 동일하다. 또 하나의 구현예에서, 상기 RBD는 서열번호: 17 및 49-53 중 하나 이상에 상응하는 분절에 적어도 85% 동일하거나 서열번호: 54-56으로 이루어진 군으로부터 선택되는 폴리펩타이드의 수용체 결합 도메인(RBD)을 함유하는 폴리펩타이드에 적어도 85% 동일하다. 또 하나의 구현예에서, 상기 RBD는 서열번호: 17 및 49-53 중 하나 이상에 상응하는 분절에 적어도 89% 동일하거나 서열번호: 54-56으로 이루어진 군으로부터 선택되는 폴리펩타이드의 수용체 결합 도메인(RBD)을 함유하는 폴리펩타이드에 적어도 89% 동일하다. 또 하나의 구현예에서, 상기 RBD는 서열번호: 17 및 49-53 중 하나 이상에 상응하는 분절에 적어도 90% 동일하거나 서열번호: 54-56으로 이루어진 군으로부터 선택되는 폴리펩타이드의 수용체 결합 도메인(RBD)을 함유하는 폴리펩타이드에 적어도 90% 동일하다. 또 하나의 구현예에서, 상기 RBD는 서열번호: 17 및 49-53 중 하나 이상에 상응하는 분절에 적어도 95% 동일하거나 서열번호: 54-56으로 이루어진 군으로부터 선택되는 폴리펩타이드의 수용체 결합 도메인(RBD)을 함유하는 폴리펩타이드에 적어도 95% 동일하다. 또 하나의 구현예에서, 상기 RBD는 서열번호: 17 및 49-53 중 하나 이상에 상응하는 분절에 적어도 98% 동일하거나 서열번호: 54-56으로 이루어진 군으로부터 선택되는 폴리펩타이드의 수용체 결합 도메인(RBD)을 함유하는 폴리펩타이드에 적어도 98% 동일하다. 또 하나의 구현예에서, 상기 RBD는 서열번호: 17 및 49-53 중 하나 이상에 상응하는 분절에 적어도 99% 동일하거나 서열번호: 54-56으로 이루어진 군으로부터 선택되는 폴리펩타이드의 수용체 결합 도메인(RBD)을 함유하는 폴리펩타이드에 적어도 99% 동일하다. 일부 구현예에서, 상기 수용체 결합 도메인 (RBD) 영역은 서열번호:54, 55, 또는 56의 아미노산 잔기 51 내지 카르복시-말단 잔기를 포함한다.
또 다른 구현예에서, 상기 RBD는 C. 디피실레 게놈, C. 디피실레 게놈 내에 함유된 박테리오파아지, 프로파아지 삽입물 또는 프로파아지 잔여물로부터의 것이다. "프로파아지 잔여물" 또는 프로파아지 요소 또는 부분은 전체 파아지 분자보다는 단지 파아지 또는 불연속 파아지 단백질(들)의 일 부분을 인코딩하는 서열을 지칭한다. 따라서, 일부 구현예에서, 프로파아지 잔여물은, 예를 들면, RBD 및 그의 동족 BPAR, 및 기저판 유전자를 인코딩하는 서열을 포함할 수 있다. 일부 구현예에서, 상기 RBD는 서열번호: 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 및 116으로 이루어지는 군으로부터 선택된 RBD에 적어도 80% 동일하다. 다른 구현예에서, 상기 RBD는 서열번호로 이루어지는 군으로부터 선택된 RBD에 적어도 85%, 88%, 89%, 90%, 95%, 96%, 97%, 98%, 또는 심지어 99% 동일하다: 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 및 116.
또 하나의 구현예에서, 디포신류는 파아지 테일 RBD를 디포신 ORF 1373의 생성물에 융합함에 의해 변경된 살균 스펙트럼을 가지도록 조작될 수 있다. ORF 1374는 천연 디포신류의 일차 스펙트럼 결정 인자 또는 RBD를 인코딩하지만, 이 매우 큰단백질은 ORF 1373 단백질과 복합되고 그리고 ORF 1373 단백질은 BPAR을 제공, 즉, 이것은 디포신 기저판 구조에 ORF 1374 단백질의 RBD를 부착한다. ORF 1373은 마이오바이러스과 박테리오파아지 예컨대 ΦCD2 (서열번호:54), ΦCD119 (서열번호:55), 및 ΦCD27 (서열번호:56)의 테일 섬유 유전자뿐 아니라 R-형 피오신의 테일 섬유와 유사하고, 이와 아미노산 서열 동일성을 공유한다. 디포신류의 상기 ORF 1373 (예를 들면, 서열번호:16 또는 78)은 특히, BPAR 또는 N-말단 부분의 처음 160개 아미노산에서 C. 디피실레 마이오바이러스과 파아지, ΦCD2 (서열번호:54)의 테일 섬유와 유의미한 서열 동일성을 공유한다. 그러나, 파아지 테일 섬유는 디포신 ORF1373 단백질보다 더 길고, 이들의 박테리아 표적을 인식하기 위한 C-말단 RBD를 함유한다. 디포신류의 ORF 1373 단백질은 이 후자 도메인을 함유하지 않으며, 그의 RBD 기능은 ORF1374에 의해 인코딩되는 별개의 폴리펩타이드에 의해 대체된다. 따라서, ORF1374는 디포신 클러스터로부터 완전히 결실될 수 있으며, 파아지 테일 섬유의 RBD, 예컨대 ΦCD2의 것은 ORF1373에 의해 인코딩되는 디포신 BPAR에 융합될 수 있어, 이에 의해 파아지 테일 섬유-유사 단백질을 가지며 이에 따라 공여체 파아지의 숙주 범위와 관련된 살균 스펙트럼을 갖는 디포신을 생성할 수 있다. 중요하게, C. 디피실레 파아지 테일 섬유와 ORF1373 단백질 간의 아미노산 서열 상동성의 영역이 둘 사이의 성공적인 기능적 융합을 가능하게 할 수 있기 때문에, 돌연변이되거나 돌연변이되지 않은 C. 디피실레 파아지로부터의 숙주-범위 변이체를 선택할 수 있으며, 이것은 이어서 신규한 살균 스펙트럼을 갖는 변형된 디포신류를 생성하기 위한 신규한 RBD의 공급원일 수 있다는 점이다.
조작된 디포신의 일 구현예에서, RBD가 다른 균주의 C. 디피실레로부터의 RBD 또는 C. 디피실레를 감염시키는 박테리오파아지로부터의 RBD로 대체된 디포신이 제공된다. 일 예에서, 핵산 분자는 서열번호: 16 또는 78을 암호화하는 서열을 포함하나, 상응하는 원상태 RBD(즉, 각각 서열번호 17 또는 49를 인코딩하는 서열)는 함유하지 않으며; 대신에, 원상태 RBD는 RBD를 인코딩하는 이종성 서열로 대체된다. 특정 구현예에서, 상기 핵산분자는 C. 디피실레의 상이한 균주의 R-형 박테리오신의 수용체 결합 도메인 (RBD)을 인코딩하는 이종성 서열을 포함한다. 일 측면에서, 상기 핵산분자는 서열번호:16 또는 78을 인코딩하는 서열 및 서열번호: 49-53로 구성되는 군으로부터 선택된 폴리펩타이드를 인코딩하는 서열을 함유하거나 또는 서열번호: 54-56으로 구성되는 군으로부터 선택된 폴리펩타이드의 수용체 결합 영역을 함유한다. 또 하나의 측면에서, 상기 핵산분자는 서열번호:2-16 및 18-23 또는 서열번호: 17 및 49-56를 인코딩하는 서열로 이루어지고: 62-80, 그리고 서열번호로 구성되는 군으로부터 선택된 폴리펩타이드로부터 RBD를 인코딩하는 이종성 서열로 이루어진다.
조작된 디포신의 다른 구현예에서, 상기 디포신의 RBD는 원상태 RBD의 변형된 형태로 대체될 수 있다. "원상태 RBD"는 C. 디피실레의 균주로부터 또는 C. 디피실레를 감염시키는 박테리오파지로부터 단리되거나 클로닝된 RBD와 동일한 아미노산 서열을 갖는 RBD를 지칭한다. 수 많은 C. 디피실레 균주로부터 예시적인 원상태 RBD는 서열번호: 17 및 49-53를 포함한다. C. 디피실레를 감염시키는 박테리오파아지로부터의 예시적인 원상태 RBD는 서열번호를 포함한다: 54-56(예를 들면, 아미노산 잔기 51 내지 카복시 말단 잔기). 일부 구현예에서, 변형된 RBD는 원상태 RBD에 대해 RBD의 아미노산 서열에서의 변화를 포함한다. 아미노산 서열에서의 변화의 비-제한적인 예는 하나 이상의 아미노산의 치환, 삽입(또는 부가), 또는 결실을 포함한다. 추가 구현예에서, 디포신은 2006년 6월 8일 공개된 미국 특허 출원 공개 제2006-0121450호(본 명세서에 전체가 기재된 것처럼 참고로 포함됨)에 기재된 바와 같이, 다양성 생성 레트로엘리먼트(DGR)를 배치함으로써 구조를 다양화한 유기체로부터 유도된 RBD로의 치환 또는 이의 삽입을 포함한다.
일부 구현예에서, 상기 변형된 형태는 상응하는 비변형된 또는 원상태 RBD와 상이한 살균 스펙트럼을 갖는다. 특정 구현예에서, 상기 변형된 형태는 원상태 RBD에 적어도 80% 동일하다. 다른 구현예에서, 상기 RBD는 서열번호: 17 및 49-53로 구성되는 군으로부터 선택된 폴리펩타이드에 적어도 85%, 88%, 89%, 90%, 95%, 96%, 97%, 98%, 또는 심지어 99% 동일한 아미노산 서열을 가지거나 서열번호: 54-56으로 구성되는 군으로부터 선택된 폴리펩타이드의 수용체 결합 영역을 가지고 그리고 상기 변형된 RBD는 상응하는 비변형된 또는 원상태 RBD와 상이한 살균스펙트럼을 가진다.
일부 구현예에서, 상기 핵산분자는 더욱이 RBD의 동족 샤페론 단백질을 인코딩하는 폴리뉴클레오타이드를 포함한다. 일 측면에서, 상기 동족 차페론은 서열번호: 89, 90, 113, 114, 및 117로 이루어진 군으로부터 선택된다.
표적 박테리아
환자로부터 단리된 클로스트리듐 디피실레 균주는 펄스 겔 전기영동에 의해 광범위하게 달라지며, 그의 병원성이 매우 다양하다. 독소를 과다 생성하는 BI/NAP1 또는 리보타입 027 균주는 특히 독소 A 및 독소 B의 발현 수준을 부정적으로 조절하는 유전자 tcdC의 기능을 소실하는 것의 결과로서 악성이다(McDonald 등,2005).
사실상, tcdC 유전자의 특정 돌연변이 대립유전자를 지니는 C. 디피실레 균주는 건강관리 시설 내에서, 그리고 그 사이에 유행성으로 퍼지는 것으로 보인다. 이들 유행병 및 고도의 악성 균주는 전통적인 항생제 요법의 시작 전에 또는 직후에 디포신류의 경구 적용에 의해 보균 환자의 GI 관으로부터 예방적으로 제거될 수 있는 특히 중요한 표적 박테리아이다. 야생형 수준의 독소 A 및 B를 생성하는 C. 디피실레 박테리아는 중요한 표적 병원체인데, 이는 그들이 또한 특히 50세가 넘거나 동반 질환이 있는 환자에게 잠재적으로 치명적이기 때문이다(Bartlett JG, 2002).
과다생성자이든지 아니든지, C. 디피실레 균주에서 유행하는 표면 접근가능한 발병력 또는 적합 인자, 예컨대, S-층 단백질을 표적화하는 것은 이러한 병원체가 그들이 표적화된 R-형 박테리오신에 내성이 있는 것으로 나타난다면, 그들의 발병력 또는 적합성을 절충하게 만드는 매력적인 수단을 제공한다. 디포신류의 RBD 의 높은 특이성 때문에, C. 디피실레를 제외한 유기체는 표적이 아니며, 그들이 GI 관의 공생적 박테리아 정상의 GI 기능 및 우수한 건강에 필요한 박테리아에 대한 부차적인 손상을 야기하지 않을 것이기 때문에 디포신류의 독특하고 강력한 이점이 있다.
"감염"은 예컨대 대상체 또는 조직 또는 비- 박테리아 세포에서의 박테리아의 성장을 언급하며, 여기서, 상기 박테리아는 상기 대상체, 조직 또는 비-박테리아 세포에서 질환 또는 증상을 실제적으로 또는 잠재적으로 야기할 수 있다. 감염의 치료는 디포신류, 예컨대 dif43593을 생성할 수 있는 탈독성화된 C. 디피실레 박테리아의 기질, 물질, 생산자 세포 또는 포자로 예방적 치료를 포함할 수 있다. 치료되는 대상체의 비-제한적인 예는 기증된 기관, 조직 및 세포; 인공호흡기 또는 투석 장치와 같은 의료 장비; 또는 상처, 예컨대 수술 동안 또는 수술 후의 상처를 포함한다. 다른 용도는 추가의 성장 시에 문제를 야기할 수 있는 표적 박테리아의 제거를 포함한다. 추가 구현예에서, hmw 박테리오신이 사용되어, 박테리아 감염 또는 오염이 있는 음식물, 공장 또는 공장의 수집된 부분을 처리하거나 또는 예컨대 병원 또는 상업의 환경에서 표적 박테리아의 환경적인 발생을 처리한다.
본원에 기재된 바와 같이, 항균 R-형 박테리오신은 특정한 박테리움의 성장, 생존, 또는 복제를 저해하기 위해 사용될 수 있다. 상기 박테리움은 병원성 또는 환경적으로 유해한 균주이거나 예방적 방식으로 처리될 수 있다. 병원성 미생물은 일반적으로 때때로 특정 상황에서만 질환을 야기한다.
디포신류의
제조 및 용도
디포신류는 대략 1000만 달톤의 입자이며, 이에 따라 분별 원심분리, 분별 여과, 수성 2-상 분리, 폴리에틸렌 글리콜(PEG) 침전 및/또는 이온 교환 크로마토그래피에 의해 단리하고 정제되어 생물 약제학적 등급의 경구 항균제를 생성할 수 있다. R-형 박테리오신은 동결-융해에 안정적인 것으로 밝혀졌으며, 안정적인 제형을 생성하기 위해 분무 건조되어질 수 있다.
본 발명의 일부 구현예에서, R-형 hmw 박테리오신의 생성 방법이 제공된다. 상기 방법은 생산자 세포를 R-형 박테리오신의 발현을 유발하는 농도의 유도제에 대하여 감수성인 유도가능한 프로모터에 작동가능하게 연결된 R-형 hmw 박테리오신을 인코딩하는 핵산 서열에 노출시키고, 발현된 R-형 박테리오신을 정제하는 것을 포함한다. 일 측면에서, R-형 고분자량(hmw) 박테리오신은 서열번호:2-23 또는 서열번호:49 및 62-80으로 이루어진 군으로부터 선택되는 하나 이상의 폴리펩타이드를 함유한다. 핵산 분자는 생산자 세포의 천연 핵산에 대하여 이종성이며, 생산자 세포의 염색체에 함유될 수 있거나, 에피솜 발현 벡터 내에 함유될 수 있다.
표적화된, 강력한 항균제인 디포신류가 인간 및 다른 동물의 하부 GI 관으로부터 C. 디피실레를 제거하거나 탈집락화시키기 위하여 사용하여, CDAD를 예방할 것이다. 광범위 항생제로 치료된 동물 및 인간은 그들이 C. 디피실레에 의해 집락화된다면, 유력한 치사의 CDAD가 발생할 위험이 높다. 탈집락화는 그것의 건강한 GI 미생물총을 남기기 때문에, 특히 매력적인 디포신류의 유용성이다. 또한, 디포신류는 디포신을 생성할 수 있는 탈독소화된 C. 디피실레 박테리아의 투여된 생산자 세포 또는 포자를 통하여 직접적으로 또는 간접적으로 투여되어 질 수 있어 급성 CDAD에서의 병원체 로드를 감소시키고 및/또는 다른 양상에 의한 성공적인 치료 후에 CDAD의 높은 발병 또는 재발이나 반복을 감소시킨다.
투여 방식
R-형 박테리오신은 위 및 십이지장 상부에 공급되는 정상적으로 기능하는 산도인 pH 4.0 또는 그이하에 의해 불활성화된다. 그러나, 디포신류는 상부 GI 관을 통과하여 하부 GI 관에 주로 집락화된 표적화된 박테리아 병원체에 도달해야 한다. 따라서, 디포신류는 상부 GI 관의 산 및 프로테아제로부터 취약한 작용제를 보호하고 활성 상태의 이러한 제제를 원위의 상부 GI 관 또는 하부 GI 관에 전달하는 하나 또는 몇몇의 공지되어 있는 방법에 의해 제형화될 수 있다. 또한, 동물은 항히스타민제, 예컨대 시메티딘 또는 양성자 펌프 억제제로 처리될 수 있어, R-형 박테리오신의 경구 투여 전에 위 산성화를 예방한다. 따라서, 적절하게 제형화된 디포신류, 디포신류를 생성할 수 있는 생산자 세포 또는 디포신을 생성하는 탈독소화된 C. 디피실레 박테리아의 포자의 정상의 위가 있는 인간 또는 동물 또는 산성화가 약제학적으로 예방된 인간 또는 동물로의 경구 투여는 집락화된 장의 부분으로의 전달을 가능하게 하여, 그렇게 함으로써 효과적으로 할 수 있다. 장 통과 시간에 기초하여, 무증상 사람 또는 동물을 탈집락화시키기 위한 직접적으로 또는 간접적으로 디포신류의 경구 투여 당의 빈도는 매 6시간, 매 12시간, 매 18시간, 매 24시간, 매주 또는 매달일 수 있다. 디포신류는 또한 CDAD가 있는 환자 또는 최근에 CDAD가 "치유"된 환자에게 동일하거나 더 빈번한 빈도로 투여될 수 있다. 특히, 활성이 있는 CDAD의 관리를 위하여, 디포신류가 제형될 수 있고 그리고 좌약, 관장 또는 결장 관류에 의해 직장에 대하여 직접적으로 또는 간접적으로 투여될 수 있다.
본 개시내용의 조작된 디포신은 디포신에 감수성인 박테리아에 의한 감염 또는 오염을 앓거나, 이를 앓는 것으로 진단되거나, 또는 이를 앓는 것으로 의심되는 임의의 대상체에 투여될 수 있다. 이러한 대상체의 비-제한적인 예는 동물(포유동물, 파충류, 양성류, 조류 및 어류) 종뿐 아니라 곤충, 식물 및 진균류를 포함한다. 포유동물 종의 대표적이고 비제한적인 예는 인간; 비-인간 영장류; 농업상 관련된 종, 예컨대 소, 돼지, 염소 및 양; 설치류, 예컨대, 마우스 및 랫트; 교제, 전시 또는 쇼를 위한 포유동물, 예컨대, 개, 고양이, 기니아 피그, 토끼 및 말; 및 노동을 위한 포유동물, 예컨대 개 및 말을 포함한다. 조류 종의 대표적이고 비제한적인 예는 교제 또는 쇼를 위한 닭, 오리, 거위 및 새, 예컨대 앵무새 및 잉꼬를 포함한다. 본 개시내용의 조작된 디포신으로 처리된 동물 대상체는 또한 네발동물, 두발동물, 수생 동물, 척추동물 또는 곤충을 포함하는 무척추동물일 수 있다.
일부 구현예에서, 처리되는 상기 대상체는 아직 성숙하지 않은 소아 또는 다른 어린 동물이다. 따라서, 본 개시내용은 본 개시내용의 디포신에 감수성인 박테리아 또는 다른 미생물로의 감염을 포함하는 소아과 증상의 치료를 포함한다.
본 개시내용은 또한 기회 감염, 예컨대, 인간 대상체 또는 비-인간 동물의 미생물 총에 존재하는 박테리아의 바람직하지 않은 성장으로부터 야기되는 기회 감염의 치료 또는 예방을 위해 제공된다. 기회 감염은 대상체에서의 면역 억제된 증상의 결과 또는 비뇨생식기(GU) 또는 위장(GI) 관의 공생 미생물총을 변경시키는 항생체 처리의 결과일 수 있다. 따라서, 본 개시내용은 또한 면역 억제된 대상체 및 다른 약제에 노출된 대상체의 치료 또는 예방을 위해 제공된다. 그의 항균활성이 있는 디포신은 다른 항균제 또는 항미생물제, 예컨대 비제한적인 예로서 항생제 또는 항진균제와 병용하여 사용될 수 있다. "항-미생물제"는 단일 세포의 유기체의 성장을 억제하거나 사멸시키는데 사용될 수 있는 작용제 또는 화합물이다. 항-미생물제는 항생제, 화학치료제, 항체(보체가 있거나 없는), DNA, RNA, 단백질, 지질 또는 세포벽 합성 또는 기능의 화학적 억제제를 포함한다.
일부 구현예에서, 디포신류, 디포신류를 생산할 수 있는 탈독성화된 C. 디피실레 박테리아의 생산자 세포, 또는 포자는 "약제학적으로 허용가능한" 부형제, 장용 코팅제 또는 담체와 함께 제형화된다. 이러한 성분은 과도한 불리한 부작용 없이 인간, 동물 및/또는 식물에 사용하기에 적합한 것이다. 불리한 부작용의 비-제한적인 예는 독성, 자극 및/또는 알러지 반응을 포함한다. 부형제 또는 담체는 전형적으로 합리적인 유익/유해 비율에 적합한 것이다. 비제한적인 약제학적으로 적절한 담체는 멸균 수성 또는 비-수성 용액, 현탁액 및 에멀젼을 포함한다. 예는, 비제한적으로 표준 약제학적 부형제, 예컨대 포스페이트 완충된 염수 용액, 물, 에멀젼, 예컨대 유/수 에멀젼 및 다양한 유형의 습윤제를 포함한다. 비-수성 용매의 예는 프로필렌 글리콜, 폴리에틸렌 글리콜, 식물성 오일, 예컨대 올리브 오일 및 주사 가능한 유기 에스테르, 예컨대 에틸올레에이트이다. 수성 담체는 염수 및 완충된 매질을 포함하는 물, 알코올성/수성 용액, 에멀젼 또는 현탁액을 포함한다. 비경구 비히클은 염화나트륨 용액, 링거 덱스트로오스, 덱스트로오스 및 염화나트륨, 락테이트화된 링거 또는 고정유를 포함한다. 정맥내 비히클은 유체 및 영양소 보충제, 전해질 보충제(예컨대, 링거 덱스트로오스를 기반으로 한 것) 등을 포함한다.
본 명세서에 개시된 추가의 제형 및 약제학적 조성물은 박테리아 병원체에 특이적인 단리된 디포신; 동일한 박테리아 병원체를 표적화하는 디포신류를 생성할 수 있는 탈독소화된 C. 디피실레 박테리아의 2, 3, 5, 10 또는 20개 이상의 상이한 디포신류, 생산자 세포 또는 포자의 혼합물; 및 상이한 박테리아 병원체 또는 동일한 박테리아 병원체의 상이한 균주를 표적화하는 2, 3, 5, 10 또는 20개 이상의 혼합물을 포함한다.
임의로, 본 개시내용의 디포신 또는 생산자 세포를 포함하는 조성물은 또한 해당 분야에 잘 알려져 있는 방식을 사용하여 분무 건조시키거나 동결 건조될 수 있다. 차후의 재구성 및 사용은 본 분야에 알려져 있는 바와 같이 실시될 수 있다.
디포신은 전형적으로 "안전하며 효율적인" 양 또는 농도로 사용되며, 이는 상술된 것과 같은 과도한 불리한 부작용 없이 원하는 치료적 반응을 생성하는데 충분한 양을 지칭한다. 디포신은 또한 "치료적으로 효과적인" 양 또는 농도로 사용될 수 있으며, 이는 원하는 치료적 반응, 예컨대, 비제한적으로, 박테리아 세포 분열 속도를 늦추거나, 박테리아 세포 분열의 중단을 야기하거나 박테리아의 집단 성장의 사망을 야기하거나 그 속도를 감소시키는데 유효한 양을 언급한다. 안전하고 유효한 양, 또는 치료적으로 또는 예방적으로 효과적인 량은 다양한 인자에따라 달라질 것이나, 과도한 실험 과정 없이, 당업자에 의해 용이하게 결정될 수 있다. 비-제한적인 인자의 예는 치료되는 특정 증상, 상기 대상체의 신체 조건, 치료될 대상체의 유형, 치료의 지속기간, 동시요법의 성질(존재한다면) 및 사용되는 특정 제형을 포함한다.
이제 본 발명의 요지가 일반적으로 기재되었으며, 본 발명은 예시로 제공된 하기의 실시예를 참조하여 더욱 용이하게 이해될 것이며, 달리 특정되지 않는 한 개시내용을 제한하는 것으로 의도되지 않는다.
실시예
1.
디포신류의 살균활성의 결정
C. 디피실레 배양물이 10% CO2, 10% H2, 80% N2 의 분위기로 포르마 사이언티픽 환경 챔버 내에서 엄격한 혐기성 조건 하에서 성장되었다. 모든 배지, 완충액 및 플레이트가 사용 전에 적어도 24시간 동안 이 분위기에서 환원되었다. 배양물은 C. 디피실레 선택적 아가 플레이트 상에 스트리킹되고(BD 디아그노스틱스, BBL Cat. 222228), 그리고 37 ℃에서 2일 동안 배양되었다. 이들 플레이트는 그런 다음 저장용으로서 주위 온도에서 혐기적으로 보관된다.
디포신류를 유도하기 위하여, C. 디피실레 박테리아가 브루셀라 배지(디프코)를 사용하여 액체 배양물에서, 쉐이킹하지 않고 37 ℃에서 성장되었다. 대략 0.2의 OD600에서, 미토마이신 C가 3 μg/ml의 최종 농도로 첨가되었다. 배양물은 그런 다음 3 내지 16시간 동안 인큐베이션되었다. 박테리아 용해물은 배양물의 시각적인 제거에 의해 검출되었다.
배양물은 혐기성 챔버로부터 제거되고, 그리고 세포성 잔해는 5,000 xg에서의 원심분리에 의해 제거되었다. 상층액은 그런 다음 0.2 μ셀룰로오스 아세테이트 주사기 필터를 통해 통과되었다. 여액은 90,000 xg에서 2시간 동안 원심분리되어, 디포신 입자를 펠렛화하였다. 펠렛은 1/50의 최초 배양 부피로 10 mM Tris pH 7.5, 50 mM NaCl, 3% 만니톨에 재현탁되었다.
표적 균주는 37 ℃에서 브루셀라 액체 배지에서 밤새 성장되었다. 100 μl의 배양 부피가 5 ml의 예열되고 환원된 브루셀라 오버레이 한천(0.5% 한천)에 부가되고, 한천 플레이트(1.5% 한천)에 부어 지고, 정치되었다. 디포신 제제의 5 μl의 샘플이 플레이트 상에 스폿팅되고, 공기 건조되게 하였다(약 30분). 플레이트는 그런 다음 37 ℃에서 밤새 혐기적으로 인큐베이션되었다. 살균활성이 샘플을 론에 적용한 위치 또는 스폿에서의 박테리아 성장의 제거 또는 결여에 의해 결정되었다.
2.
Cd16 디포신 유전자좌의 클로닝.
C. 디피실레 균주 Cd16의 드래프트 게놈 서열이 게놈 DNA의 454 기기 서열 분석에 의해 수득되었다. 전체 dif16 유전자좌 또는 클러스터(서열번호: 1)는 균주 Cd630(상기 참조)과의 비교에 의해 동정되었다.
골격 BAC 벡터의 제조. 개시 벡터는 pETcoco1(Novagen)이었다. 이를 변형시켜, BbsI 말단을 갖는 프라이머 AV1419(서열번호: 24) 및 AV1420(서열번호: 25)을 사용하여 2개의 XhoI 부위를 제거하였다. 이를 행하기 위하여, 특정 영역을 이들 프라이머를 사용하여 pETcoco1 DNA로부터 증폭시키고, 그런 다음, PCR 생성물을 BbsI로 절단하고, 사전에 XhoI으로 절단한 더 큰 pETcoco1 벡터 단편에 다시 결찰시켰다. 이 결찰은 pETcoco1의 2개의 XhoI 부위를 파괴하였다. 이 후자의 플라스미드는 그런 다음 유사한 전략에 의해 추가로 변형되어, 프라이머 AV1416(서열번호: 26) 및 AV1245 (서열번호: 27)를 사용하여 EcoRI 부위를 파괴하였다. 수득된 벡터를 SW251로 명명하였다.
디포신 클러스터의 단편을 수용하기 위한 pUC19 벡터의 제조. pUC19(New England BioLabs)의 폴리링커를 EcoRI 및 HindIII으로의 분해 및 올리고 AV1372 (서열번호: 28), AV1373 (서열번호: 29), AV1374 (서열번호: 30), 및 AV1375 (서열번호: 31)에서의 결찰함에 의해 변형하였다. 이는 폴리링커를 NotI-NheI-KpnI-XhoI-EcoRV-Bst바이-BbsI-EcoRI-NsiI-SphI-BamHI-AscI로 변경시켰다. 이를 SW232로 명명하였다.
SW232 내로 디포신 클러스터의 클로닝. 디포신 클러스터, 서열번호 1의 3개의 단편을 Cd16 DNA로부터 PCR에 의해 개별적으로 증폭시켰다. 5' 단편(서열번호: 32)을 각각 Not1 및 Xho1 말단을 갖는 프라이머 1368 (서열번호: 35) 및 1289 (서열번호: 36)를 사용하여 증폭시켰다. 중간의 단편(서열번호: 33)을 각각 Xho1 및 EcoR1 말단을 갖는 프라이머 AV1288 (서열번호: 37) 및 AV1366 (서열번호: 38)을 사용하여 증폭시켰다. 3' 단편, 서열번호: 34를 각각 EcoR1 및 BamH1 말단을 갖는 프라이머 AV1367 (서열번호: 39) 및 AV1300 (서열번호: 40)을 사용하여 증폭시켰다. 이들 3개의 PCR 단편을 별도로 SW232 내로 클로닝하고, 각각 5', 중간 및 3' 부분에 대하여 SW241, SW242 및 SW243으로 명명하였다.
BAC SW251 내로 디포신 클러스터의 클로닝. E . 콜라이 내에서 클로닝에 의해 증식되고, 정제된 각각의 디포신 클러스터의 3개의 단편(SW241, SW242 및 SW243 내)을 SW241, SW242 및 SW243 벡터로부터 잘라냈다. SW241을 NotI 및 XhoI로 분해하고, SW242를 XhoI 및 EcoRI로 분해하고, SW243을 EcoRI 및 AscI로 분해하였다. (이 AscI 부위가 상술된 변형 SW232 폴리링커의 부분이었음을 주의한다.)
이들 3개의 단편을 먼저 NotI 및 AscI으로 분해한 SW251 내로 조합하였다. 수득한 플라스미드를 DG461로 명명하였으며, 이에는 전체 dif16 클러스터가 함유되어 있다. 이를 E. 콜라이에서 증폭시켰다.
B. 서브틸리스 내에서 발현을 위한 디포신 통합 벡터 제조. 클로닝/프로모터 영역 및 스펙티노마이신-내성 유전자를 플랭킹하는 amyE 유전자의 부분을 포함하는 B. 서브틸리스 통합 벡터, pDR111을 사용하였다.
pDR111 폴리링커를 HindIII 및 SphI을 사용하여 벡터를 분해시키고, 올리고 DG1(서열번호: 41) 및 DG2(서열번호: 42)에서 결찰시킴으로써 변형시켰다. 이것은 NotI 및 AscI 부위를 pDR111에 부가하였다. 변형된 폴리링커를 갖는 전체 amyE 프론트 및 백 영역을 함유하는 영역을 그런 다음프라이머 DG9(서열번호: 43) 및 DG10(서열번호: 44)을 사용하여 증폭시켰으며, 이 양자는 BsaI 말단을 갖는다. 이 단편을 SW251의 NotI 및 AscI 부위 내로 결찰시키고(두 부위의 파괴를 야기), DG487을 생성하였다. pDR111-유래의 삽입물의 변형된 폴리링커에 의하여 DG487 내로 도입된 새로운 NotI 및 AscI 부위가 존재함을 주목하길 바란다.
E. coli 내에서 DG487의 증식 후에, DG461로부터의 디포신 클러스터를 함유하는 NotI/AscI 단편을 그런 다음 잘라내고, 그리고 DG487의 NotI/AscI 부위 내로 클로닝하였다. 이 새로운 작제물을 DG488로 명명하였으며, 그리고 전체 디포신 유전자 클러스터를 B. 서브틸리스에 도입하는데 사용된 벡터였다(하기).
3.
바실러스
서브틸리스
내에
디포신
유전자 클러스터의 발현.
천연 디포신 생산자는 편성 혐기성 생물인 C. 디피실레이다. C. 디피실레 박테리아는 심지어 미량의 산소에 노출된다면, 포자를 형성하고 즉시 죽는다. 배양된 C. 디피실레로부터 심지어 미량의 디포신을 생성하는 능력은 어렵고 아주 힘든 것이며, 예방 또는 치료적 응용에 유용한 양의 디포신의 생성은 요구되는 엄격한 혐기성 조건에 따라 실용적이지 못하다. 따라서, C. 디피실레로부터의 전체 디포신 유전자 클러스터를 먼저 동정한 다음, 분자 클로닝에 의해 단리하고, 추가의 조작 및 생산을 위하여 이 클러스터를 호기성 그람 양성 박테리움인, 바실러스 서브틸리스에 도입시켰다.
바실러스 서브틸리스 통합벡터, DG488을 실시예 2에 기재된 바와 같이 만들었으며, 이는 전체 22,827개 염기 디포신 유전자좌(서열번호: 1)를 포함한다. 이 벡터를 사용하여 디포신 유전자좌를 바실러스 서브틸리스 게놈 내로 재조합시켰다.
수여자 바실러스서브틸리스 균주는 BDR123이었으며, 이는 amyE 유전자 내에 삽입된 클로르암페니콜 내성 마커를 가졌다. 이 균주를 DG488로 형질전환시키는 경우, 벡터 내의 프론트 및 백 amyE 서열과 게놈 g1>amyE 서열 사이에 재조합이 발생하였다. 이는 디포신 유전자좌 및 스펙티노마이신 내성 유전자를 포함하는 DG488의 프론트 및 백 amyE 영역 사이의 모든 서열의 BDR123 게놈 내로의 삽입을 야기하였다. 성공적인 재조합체는 스펙티노마이신 내성이었으나, 재조합의 결과로서 게놈 마커의 소실 때문에, 클로르암페니콜-민감성이 되었다. 이 B. 서브틸리스 균주를 BDR123-488로 명명하였다.
전체 디포신 유전자좌를 DG488 벡터 내로 삽입하였기 때문에(실시예 2), 이에 따라 그 전체가 BDR123-488 내로 삽입되었다. 클로스트리듐 내에서의 정상적인 발현에 필요한 조절 유전자 및 구조적 디포신 입자 유전자 모두를 포함하는 이 삽입된 디포신 유전자좌는 이들 유전자 및/또는 조절 인자의 제어 하에 있었다. 바실러스 및 클로스트리듐이 관련 있는 박테리아이기 때문에, 이들 디포신 조절 인자가 바실러스 배경에서 작용할 것이며, 그의 천연 상태에서, RecA-매개 메커니즘을 통한 DNA 손상에 의해 유도될 것으로 예상되었다. 이는 사실이었으며, DNA 손상제제 미토마이신 C와의 접촉에 의해 디포신 입자 생산을 BDR123-488에서 유도하였으며, 균주 Cd19099를 사멸시켰으며, 도 7을 참조하길 바람.
디포신 조절 유전자(ORF1359, 1360, 1361)는 구조 유전자와 비교하여 유전자좌의 5' 영역 내에 위치하였다. 또한, 구조 유전자와 비교하여 다운스트림, 3'에 위치한 조절 유전자(ORF1377(서열번호: 20), 1378 (서열번호: 21), 및 1379 (서열번호: 23))도 존재하였다. 이들 후자의 조절 유전자를 제거하기 위하여, 단일 3 방식 결찰에서 DG491을 DG488로부터 생산하였다. 하나의 PCR 단편을 프라이머 DG13(서열번호: 45) 및 DG14(서열번호: 46)를 사용한 PCR 증폭에 의하여 DG488로부터 만들고, 그리고 다른 하나를 프라이머 DG15(서열번호: 47) 및 DG16(서열번호: 48)을 사용한 PCR 증폭에 의해 만들었다. 양자 PCR 단편은 AscI 및 SphI.로 분해되었다DG488을 그런 다음 SphI으로 분해하고, 그리고 2개의 분해된 PCR 단편을 SphI-분해된 DG488로부터의 큰 벡터 단편 내로 결찰시켜, DG491을 생산하였다. DG491을 BDR123 내로 형질전환시켜(BDR123-491), ORFs1377 (서열번호: 20), 1378 (서열번호: 21), 및 1379 (서열번호:23)가 결여된 디포신 유전자 클러스터를 함유하는 재조합 B. 서브틸리스를 생성하였다. 이들 ORF가 결여된 변형된 디포신 클러스터는 BDR123-488에서 야생형 디포신 클러스터가 그러한 것처럼, 미토마이신 C에 대한 노출 시에 활성 디포신류를 발현하였다(도 7).
4.
다중 디포신류로부터 살균 스펙트럼-결정 서열의 특성규명
Cd16 디포신 유전자좌(서열번호: 1)와 Cd630뿐 아니라 시퀀싱된 다른 Cd 균주(QCD-66c26; QCD-23m63; QCD-32g58; QCD-63q42) 및 Cd4(서열번호: 61)의 디포신 유전자좌의 비교에 의해, 하나의 예외를 제외하고, 모든 전사 해독틀(서열번호: 1 및 61)이 89-100% 아미노산 서열 동일성을 공유하는 것으로 나타났다. 상기의 예외는 ORF 1374였다. 이 예외적 서열은 모든 시퀀싱된 디포신 간에 가변/변수이었으며, 그리고 크기가 유사함에도, 30%만큼 적은 서열 동일성을 공유하였다. 디포신 클러스터 내의 ORF1374의 위치는 수용체 결합 도메인의 위치와 일치하였다. 단리된 활성 디포신류의 ORF1374의 서열을 결정하고, 이들은 서열에 있어 매우 고도로 가변/변수인 것을 알아냈다(서열번호: 17, 49-53). 이들 서열의 비교는 도 8에 나타내었다. 더욱이, 단리된 디포신류의 스펙트럼(도 2)은 ORF1374 아미노산 서열의 유사성 또는 비유사성을 반영하였으며, 도 8을 참조하길 바란다. 예를 들어, dif16(서열번호: 17) 및 dif126(서열번호: 52)의 ORF1374의 서열은 오직 1개의 아미노산만이 상이하며, 그들의 살균 스펙트럼은 거의 동일하였다. 반면에 dif16(서열번호: 17) 및 dif108(서열번호: 50)의 서열은 188개의 아미노산이 상이하고, 그들의 살균 스펙트럼은 거의 중첩되는 것 없이 매우 달랐다. 이러한 이유로, 그리고 ORF1374가 유전자 클러스터 내의 유일한 가변/변수 단백질이었기 때문에, ORF1374가 표적 인식 결정인자이며, 각각의 특정한 디포신의 독특한 스펙트럼의 원인이 되는 것으로 결론지었다.
5.
B.
서브틸리스
내에
Dif4의
클로닝
및
발현.
디포신 4 유전자좌를 디포신 16에 대한 것과 유사한 방법으로 Cd4로부터 클로닝하였다. 그러나, dif4 유전자 클러스터, 서열번호: 61 내의 EcoR1 부위의 부재 때문에, 일부 변형이 필요하였다. 플라스미드 SW251(상기 실시예 2 참조)을 올리고 DG211, 서열번호: 57 및 DG212, 서열번호: 58을 사용하여 폴리링커 내에 XhoI 부위를 갖도록 변형시켜, 각각 NotI 및 AscI 부위를 도입하였다. 이것은 벡터 DG577을 생성하였다.
Cd4 DNA로부터 디포신 클러스터를 3개의 단편으로 증폭시켰다. 제1 단편은 프라이머 DG210(서열번호: 59) 및 AV1288(서열번호: 37)을 사용하여 XhoI 및 NcoI 부위를 도입하였다. 제2 단편은 프라이머 DG209(서열번호: 60) 및 DG15(서열번호: 47)를 사용하여 NcoI 및 AscI 부위를 도입하였다. 이들 2개의 단편을 사전에 XhoI/ AscI으로 절단한 DG577 내로 클로닝하여, DG578을 생성하였다. 제3 단편을 AV1368(서열번호: 35) 및 AV1289(서열번호: 36)를 사용하여 증폭시켜, XhoI 및 NotI 부위를 도입하고, 사전에 XhoI 및 NotI으로 절단한 DG578 내로 클로닝하여 DG579를 생성하였다. dif4 클러스터(서열번호: 61)를 함유하는 이 후자의 작제물은 dif16를 위한 DG491의 등가물이었으며, 다시 말하면, 이것은 ORF1377, ORF1378 및 ORF1379, 즉, 디포신에 대한 구조 유전자의 불필요한 추정의 다운스트림 조절 서열이 결여되어 있었다. dif4 클러스터를 B. 서브틸리스로 도입하기 위한 통합 벡터는 DG579로부터 NotI AscI 단편을 취하고, 이를 DG487 내로 클로닝함으로써 만들었다(상기 실시예 2 참조). 이러한 작제물된 플라스미드는 DG580이었다.
B. 서브틸리스에서 dif4를 발현하기 위하여, ORF1377-1379 없이 dif4 유전자좌를 함유하는 DG580(서열번호: 61)을 바실러스 서브틸리스 게놈 내로 재조합시켰다. 수여자 바실러스서브틸리스 균주는 BDR123이었으며, 이는 amyE 유전자 내에 삽입된 클로르암페니콜 내성 마커를 가졌다. 이 균주를 DG580으로 형질전환시키는 경우, 벡터 내의 프론트 및 백 amyE 서열과 게놈 amyE 서열 사이에 재조합이 발생하였다. 이는 디포신 유전자좌 및 스펙티노마이신 내성 유전자를 포함하는 DG580의 프론트 및 백 amyE 영역 사이의 서열 모두의 BDR123 게놈 내로의 삽입을 야기하였다. 성공적인 재조합체는 스펙티노마이신 내성이었으나, 재조합의 결과로서 게놈 마커의 소실 때문에, 클로르암페니콜-민감성이 되었다. 이 B. 서브틸리스 균주를 BDR123-580으로 명명하였다.
이 통합된 dif4 유전자좌는 C. 디피실레에서의 정상의 디포신의 발현에 필요한 모든 조절 유전자를 포함하였으며, 예상되는 바와 같이, 그리고 B. 서브틸리스에서 dif16에 대하여 이전에 나타낸 바와 같이, dif4 입자 생성은 미토마이신 C와의 접촉에 의해 BDR123-580에서 유도되었으며, 도 9를 참조하길 바란다. 따라서, 본 실시예는 dif4 및 dif16 양자에 대한 유전자좌의 클로닝 및 비-병원성 호기성 생산 박테리움의 일 예인 B. 서브틸리스에서의 각각의 발현을 제공한다.
6.
ORF1374는 디포신류의 살균 스펙트럼을 결정한다.
ORF1374는 질량 분광분석법에 의해 정제된 디포신 구조의 부분인 것으로 보이는 예측된 큰 폴리펩타이드(~ 200 kDa)를 인코딩한다. 디포신 16 및 디포신 4의 유전자 클러스터를 비교하는 경우, 대부분의 유전자 생성물, 특히 구조적 성분인 것으로 예상되는 것은 아미노산 수준에서 거의 동일하다. 2가지 클러스터 간의 주요한 아미노산 서열 차이는 ORF1374이다. 이러한 이유 및 후술되는 다른 이유로, 이 유전자 생성물이 디포신류의 표적 특이성을 부여하는 것으로 추측하였다. 이를 시험하기 위하여, dif4의 ORF1374(즉, 서열번호: 49를 인코딩하는 서열)를 DG580에서, Cd16으로부터의 ORF1374(즉, 서열번호: 17을 인코딩하는 서열)로 대체하여, DG587을 생성하였다. DG587을 B. 서브틸리스 BDR123의 게놈 내로 통합하여, dif16 및 dif4에 대하여 상기에 제공된 바와 같이 BDR123-587 재조합체를 만들었다. 수득한 BDR123-587을 미토마이신에 노출시키고, 용해물을 처리하여, 디포신을 제조하였다. 수득한 디포신 입자는 디포신 16에 대하여 민감성인 C. 디피실레 균주 19145에 대하여 살균활성을 가졌으며, dif4에 대하여 민감성인 균주 19137를 사멸시키는 능력을 소실하였다(도 9).
이 실험을 추가로 개선하였다. DG587의 컨스트럭션은 Cd4 및 Cd16의 키메라인 ORF1373에서 수득하였다. DG587의 ORF 1373이 원래 Cd41373, 서열번호: 78과 100% 동일하게 복원되도록 작제물을 만들어, 이에 따라, 오직 ORF1374, 서열번호: 17만을 정확한 재배치인 작제물을 생성하였다. 이 작제물은 DG603으로 명명하였다. 이 작제물을 B. 서브틸리스 BDR123 게놈 내로 통합하고, 상술된 바와 같이 미토마이신 C로 유도하였다. 수득한 디포신 입자는 균주 19099 및 19145에 대하여 살균활성을 가졌으며, 19137을 사멸시키는 능력을 소실하였다. 따라서, 디포신류의 살균 스펙트럼을 ORF1374에 의해 인코딩된 단백질에 의해 결정하였으며, 본 명세서에서 증명된 바와 같이, ORF1374의 변화에 의해 디포신의 살균 스펙트럼이 변경되었다.
7.
RecA가 활성화될 때 용해되지 않는 PBSX가 없는 생산자 세포
PBSX 프로파아지는 야생형 바실러스 서브틸리스에서 아주 흔하다. 유도되는 경우, 프로파아지는 그것이 저해된 헤드 구조를 가지며, 오직 작은 랜덤한 단편의 DNA를 함유한다는 점에서 결함이 있다. 이는 RecA의 조절 하에 있으며, 따라서, 이는 DNA 손상 제제, 예를 들면 미토마이신 C 및 박테리움에 대한 다른 형태의 심각한 스트레스에 의해 유도된다. 유도되는 경우, 이는 박테리움의 용해를 야기하고 PBSX 입자를 방출한다. 배양 배지의 PBSX 입자로의 오염을 피하고, 바실러스 서브틸리스 생산자 박테리아의 용해를 제거하기 위하여, 디포신류의 발현이 recA 또는 dinR / lexA 활성의 변형에 의해 조절되는 경우, PBSX 유전자 클러스터를 바실러스 서브틸리스 BDR11 박테리아으로부터 제거하였다.
PBSX 녹아웃을 Liu et al에 의해 개괄된 절차를 따라 작제하였다. 간단히 기술하면, Liu 논문에 사용된 프라이머 및 오버랩핑 연장 PCR 기법을 사용하여, 모 균주 BDR11의 araR 유전자를 결실시키고, 바실러스아라비노오스 프로모터 하의 네오마이신/카나마이신-내성 유전자, P araA - neo R 로 대체하여, 균주 BDG2를 만들었다. 이 araR 유전자의 결실을 PCR 및 카나마이신에 대한 내성의 부여에 의해 확인하였다.
다음으로, PBSX 유전자좌 그 자체를 결실시켜 DNA 작제물을 제작하였다. 이 작제물을 제작하기 위하여, 하기의 5개의 PCR 생성물을 오버랩핑 연장 PCR에 의해 하나의 큰 생성물로 스플라이싱시켰다: BDR11로부터 증폭된 xylB 유전자의 5' 서열 1kb; BDR11로부터 증폭된 xylA 유전자의 3' 서열 1kb; 플라스미드 pJW034로부터 증폭된 클로르암페니콜 내성 유전자, cat; BDR11로부터 증폭된 araR , ; 및 마지막으로, BDR11로부터 증폭된 xylB 유전자를 함유하는 서열 1kb. 오버랩핑 연장 PCR 생성물을 pUC19의 XmaI 및 SpeI 부위 내로 클로닝하였다. 이 작제물은 그런 다음 SacII를 사용하여 선형화시키고, 균주 BDG2 박테리아 내로 형질전환시켰으며, μ클로르암페니콜/ml이 보충된 LB 아가 플레이트 상에 도말하였다. 이 플레이트로부터 콜로니를 고르고, 5 μ클로르암페니콜/ml 또는 20 μ카나마이신/ml 중 어느 하나가 보충된 LB 아가 플레이트 상에 패치시켰다. 클로르암페니콜 내성이며 카나마이신 민감성이었던 균주를 항생제 선택 없이 LB 액체배지에서 4시간 동안 성장시킨 다음, 20 μ카나마이신/ml이 보충된 LB 아가 플레이트 상에 도말하였다. 이들 플레이트 상에서 성장시킨 콜로니를 PBSX 유전자의 존재에 대하여 콜로니 PCR에 의해 시험하였다. PBSX 유전자 클러스터의 결실을 wt 균주 BD123 내의 PBSX 유전자의 부위를 스패닝하는 PCR 생성물 서열분석에 의해 균주 BDG9에서 확인하였다. 추가의 분석에 의해 BDG9가 바실러스 서브틸리스 균주 BD123 또는 BDG2와 달리, 3 μ미토마이신 C/ml의 존재 하에서 PBSX 입자를 용해시키거나 생성하지 않음이 나타났다.
PBSX 결실 균주, BDG9를 플라스미드 DG580으로 형질전환시켜, BDG27을 생성하였다. Cd4 디포신 클러스터의 통합을 스펙티노마이신 내성에 의해 확인하였다. BDG27을 성장시키고, 상기에서 기재된 바와 같이 미토마이신 C로 유도하였다. 16시간 후에, 세포를 수집하고, PBSX 없이 디포신류가 세포 내로 축적될 것으로 본 발명자 등은예상하였기 때문에, 버그버스터(Novagen)를 사용하여 세포를 용해시켜, 세포를 파괴하였다. 세포를 버그버스터로 용해시킨 후에, 잔해를 원심분리에 의해 제거하고, 상청액을 균주 19137에 대한 살균활성에 대하여 시험하였다. BDG27에 의해 생산된 디포신은 Cd19137에 대하여 활성을 보였으나, Cd19099에 대해서는 그렇지 않았으며, 따라서, 디포신 4가 이 비분해적, PBSX 결실된 균주에서 생산되었음이 입증되었다.
8.
B.
서브틸리스
내
소분자
유발제, 과산화수소, 유도된
디포신
발현.
실시예 3에서는, 미토마이신 C를 B. 서브틸리스 균주 BDR123 내에 디포신류을 유도하기 위해 사용하였다. 미토마이신 C는 DNA 손상 제제 및 발암원이기 때문에, 대안적인 소분자 유발제를 모색하였다. 과산화수소 (H2O2)는 미토마이신 C에 유사한 방식으로 SOS 반응을 야기하는 것으로 밝혀졌으나 (Imlay and Linn, 1987)); 그러나, H2O2 는 일반적으로 U.S. FDA에 의해 안전한 것으로 간주된다(GRAS). 또한, H2O2 는 E. 콜라이 and B. 서브틸리스를 포함하는 몇 개의 호기성 박테리아 종에서 프로파아지 유도를 야지하는 것으로 밝혀졌다(Imlay and Linn, 1987; Bol and Yasbin, 1990). C. 디피실레가 편성 혐기성이고 그리고 정상적으로는 H2O2를 함유하지 않는 위장관 내 틈새에 잔류하기 때문에, C. 디피실레에서 프로파아지 및/또는 디포신 생산에 대한 H2O2 의 효과는 공지되어 있지 않다.
H2O2 가 B. 서브틸리스 내에서 디포신 생산을 유도할 수 있는지를 결정하기 위해, B. 서브틸리스 균주 BDG45 내에서 디포신을 유도하는 미토마이신 C와 H2O2 의 능력을 비교하는 연구를 개시하였다. BDG45는 그의 게놈에 디포신4 유전자 클러스터 (서열번호: 61)를 함유하고 이는 amyE 서열 내에 통합된 클로르암페니콜 내성 유전자에 연결된다. BDG45 배양물을 밤새 성장시키고, 백-희석하고, 그리고 약 1.0의 OD600에 도달할 때까지 성장시켰다. 그때, 배양물을 처리하지 않거나 또는 0.5ug /mL 미토마이신 C, 0.2mM H2O2, 또는 1mM H2O2 로 처리하고 그리고 28 ℃에서 배양하였다. 샘플은 유도 21시간후에 취해지고, 그리고 디포신 제제가 디포신 펠렛을 10 mM Hepes pH 7.4, 50mM NaCl (HN50) 에서 재현탁시키는 것을 제외하고 실시예 1에서와 같이 제조되었다. 제제의 살균활성은 디포신4에 민감성인 분리주(19137)를 함유하는 박테리아 론 상에 스폿되어 지기 전에 HN50에 일련으로 희석된(5-배) 샘플로 실시예 1에서와 같이 결정되었다. 살균성 검정의 결과는 표 I에 나타냈다. 21시간 유도 후, 미토마이신 C 및 1 mM H2O2 처리 양자는 각각 625-배 및 3,125-배 희석 후 쉽게 검출가능한 디포신 살균활성을 생성했다. 0.2 mM H2O2 는 완만하게 디포신 생산을 유도했다. 차후의 연구는 H2O2 0.2mM 내지 20mM 농도로 디포신 생산을 유도하였다는 것을 실증하였다.
표 I. 미토마이신 C (Mito-C) 또는 과산화수소 (H2O2)의 어느 하나로 B. 서브틸리스에서 유도된 디포신류의 일련의 5-배 희석에 대한 스폿 검정 결과
9.
C.
디피실레
게놈,
파아지
및
프로파아지로부터
단리된
핵산은
이종성
디
포신류에 대해 기능적 RBD 단백질을 인코딩한다.
M68 C. 디피실레 분리주로부터 제조된 디포신 제제는 넓은 살균스펙트럼을 가지진다(표 II). 디포신4 ORF1374 (서열번호: 49)가 이종성 ORF1374 (서열번호: 87)으로 대체되고 이는 균주 M68로부터의 것이고 그리고 3' 부분의 디포신4 BPAR (서열번호: 78)을 3' 말단의 동족 BPAR (서열번호: 88)로 대체하고 이는 균주 M68로부터의 것이고 ATCC43593 (서열번호: 89 및 90)으로부터의 차페론과 함께되고 그리고 실시예 6에 기재된 바와 같이 B. 서브틸리스에서 발현되어, 수득한 디포신, Diff4_M68-1374는 미토마이신 C-유도 M68 균주로부터 직접적으로 단리된 디포신 제제보다 좁은 살균스펙트럼을 가진다. 비록 다른 디포신 유전자 클러스터가 M68 게놈 서열에서 발견되지 않았지만, 공지된 마이오바이러스과 파아지에 상동성을 갖는 몇몇의 추정 프로파아지 유전자 삽입물이 발견되었다. 디포신 클러스터 내의 몇몇 유전자가 C. 디피실레 마이오바이러스과 파아지의 수축성 테일 내의 유전자와 상동성을 공유하기 때문에, 비제한적으로 프로파아지 서열을 포함하는 C. 디피실레 파아지 및 C. 디피실레 게놈으로부터의 유전자가 디포신류에 대해 다시 직접적으로 표적하는 이종성 RBD의 공급원으로 기능할 수 있다는 가설을 제기했다 그러나, 어떤 C. 디피실레 파아지, 프로파아지 또는 그의 게놈 서열 내 기타 ORF에 대한 스펙트럼 결정 인자 또는 RBD 유전자의 이전의 확인은 없었다.
표 II. 이종성 디포신류 및 천연 M68 디포신의 제제에 대한 균주 C. 디피실레의 민감성
M68 내 추정 프로파아지 삽입물로부터의 ORF에 대한 디포신 유전자 클러스터로부터의 ORF의 비교는 많은 유사한 유전자 및 유사한 유전자 클러스터 구조를 나타냈다. 그러나, ORF 다음 전형적인 디포신 RBD에 대한 ~1700 아미노산 잔기를 인코딩하는 위치에서, 예상된 기저판 J 어셈블리단백질 및 BPAR에 대한 상동성을 갖는 ORF의 다운스트림은, 전형적인 디포신 RBD (예를 들면: 서열번호 17, 49-53)가 전형적으로 잔류하여, 보다 짧은 ORF가 인코딩하는 단백질의 400-560 아미노산 잔기(표 III 및 서열번호: 92, 94, 96, 98)로 이는 전형적인 디포신 RBD와 상동성을 공유하지 않는 것이 밝혀졌다.
표 III. 전략 I, II, 또는 III에 의해 작제물된 이종성 RBD, BPAR 융합, 및 이종성 디포신류의 차페론에 대한 서열번호.
추정 프로파아지 BPAR에 대한 이들 ORF 다운스트림의 서열분석은 이들이 다음 ORF에 대하여 그리고 적어도 하나의 3도메인 (N-말단, 중간-섹션, 및 C-말단)에서 상호 상동성을 공유하였다는 것이 밝혀졌고 그리고 ORF (서열번호: 92) 다운스트림은 phiC2 파아지로, 서열번호: 54에서 BPAR로 각주됨. 흥미롭게도, phiC2에서 서열번호: 92를 인코딩하는 DNA 서열은 phiC2 파아지에서 예상된 단백질로 주석을 달지 않는다. 파아지 및 프로파아지 서열 내에서 BPAR의 ORF 즉시 다운스트림은 도메인-유사 방식에서 상동성을 공유하고 그리고 ORF1374를 인코딩하는 유전자와 같이 BPAR 동족체의 다운스트림을 모두 발견하였기 때문에, 이들 ORF가 잠재적 RBD를 인코딩하는 것이 예측되었다. 여기에서 제시된 바와 같이, C. 디피실레 M68으로부터의 최초관찰 이래로 C. 디피실레를 감염하는 파아지 내 또는 다른 C. 디피실레 분리주의 게놈에서 추정 BPAR의 잠재적 RBD 다운스트림을 인코딩하는 보다 많은 DNA 서열이 확인되었다. 기능적 이종성 디포신류를 제작하기 위해 사용된 RBD에 대한 서열번호는 (표 III)에 열거된다.
이전에 미공지된 기능을 갖는 이들 새로 확인된 ORF가 새로운 C. 디피실레 표적 균주에 대해 직접적인 디포신 사멸을 할 수 있는가를 결정하기 위해, 신규한 이종성 디포신류가 디포신4 ORF 1374 (서열번호: 49)를 추정 RBD를 인코딩하는 ORF로 대체함에 의해 조작되었다. 추정 RBD를 인코딩하는 핵산서열 및 그의 동족 BPAR을 인코딩하는 ORF의 인접한 3' 부분은 다음의 Diff4 유전자 클러스터를 함유하는 (실시예 2에 기재된) 벡터 내에 클로닝되고, 상기 Diff4 유전자 클러스터 (서열번호: 61),는 전체 디포신4 ORF 1374를 대체하고(서열번호: 49) 그리고 C-말단부의 디포신4 BPAR을 대체한다(서열번호: 78). 융합된 BPAR의 아미노산 잔기에 대한 서열번호는 표 III에 제공된다. 본 발명자 등은 그의 동족 BPAR의 적어도 C-말단 절반의 함입이 없이 이종성 디포신4 안으로 편입된 주어진 추정 RBD가 최소의 살균활성을 생성하거나 또는 하지 않는 것을 관측하였다. 삽입물은 벡터 골격 내에 양립가능한 클로닝 부위를 가지지 않기 때문에 3가지 클로닝 전략이 고안되어 이 장애를 극복하였다.
전략 I로 제작된 작제물을 위해, 중첩 말단을 함유하는 3개 이중-가닥 DNA 분절(업스트림 분절, 중간-분절, 및 다운스트림 분절로 지칭됨)이 PCR에 의해 생성되었다(표 IV; 패널 A, B 및 C). 업스트림 분절 (표 IV, 패널 A)은 서열번호: 61 내의 특정 BstBI 부위 내지 서열번호: 78를 인코딩하는 BPAR 유전자의 5' 말단으로 구성된다. 중간-분절 (표 IV, 패널 B)는 추정 RBD의 전체 ORF와 그의 3' 업스트림 동족 BPAR의 절반으로 구성된다. 다운스트림 분절 (표 IV, 패널 C)은 서열번호: 49의 즉시 다운스트림 영역으로 구성되고 그리고 서열번호: 79 및 80를 인코딩하고 상기 실시예 2에서 기재된 벡터 폴리링커 내의 특정한 Asc I 제한 부위로 신장한다. 모든 3개 분절은 조합을 적잘하게 할 수 있도록 하기 위해 주형에 대해 상보적이고 인접한 단편에 대해 상보적인 오버행을 함유하는 올리고뉴클레오타이드를 사용하여 제작된다. 각 작제물을 증폭하기 위해 사용된 코딩 가닥 및 비-코딩 가닥 올리고뉴클레오타이드는 표 IV에서 서열번호에 의해 열거되었다. 각 PCR 반응을 위한 DNA tem플레이트 또한 표 IV에 열거되었다. 다음으로, 각 컨스트럭션을 위한 3개 분절이 조합되고 업스트림 분절 내 코딩 가닥과 다운스트림 분절 내 비-코딩 가닥에 대해 상보적인 올리고뉴클레오타이드를 사용한 PCR에 의해 단일 단편 내에서 증폭되었다(표 IV의 서열번호참고). 수득한, 조합된 단일 PCR 단편은 그런 다음 BstBI 및 AscI로 잘단되고 그리고 BstBI 및 AscI로 미리-분해된 Diff4 벡터 골격에 결찰되어 열거된 작제물을 만든다. 각 작제물은 그런 다음 B. 서브틸리스 안으로 형질전환되고 그리고 0.5 mM H2O2 가 소분자 유발제로 사용된 것을 제외하고는 실시예 3에서 기술된 바와 같이 발현된다.
전략 II로 제작된 작제물을 위해, 업스트림 분절, RBD 영역을 함유하는 중간-분절 및 다운스트림 분절에 상보적인 중첩 PCR 생성물이 올리고뉴클레오타이드를 사용하여 전략 I에서 기재된 바와 같이 제작되었고 그리고 각 작제물에 대한 주형은 표 IV에 열거되었다. 다음으로, 중첩 PCR 생성물은 서열번호: 61를 함유하는 (실시예 4에 기재된) 벡터골격과 혼합되고, 상기 서열번호는 BstBI 및 AscI로 미리-분해되고 그리고 Gibson 방법에 의해 단일 작제물 안으로 조립된다 (Gibson 등 2009). 각각의 얻어진 작제물은 그런 다음 개별적으로 B. 서브틸리스 안으로 형질전환되고 그리고 0.5 mM H2O2 가 소분자 유발제로 사용된 것을 제외하고는 실시예 3에서 기술된 바와 같이 발현된다.
전략 III 작제물은 다운스트림 분절이 생성되지 않는 것으르 제외하고는 전략 II에 동일한 방식으로 제작되었다. 대신에, RBD 영역을 함유하는 중간-분절이 확장되어 추정 RBD (표 IV에 각 작제물에 대해 열거된 서열번호)의 ORF 즉시 다운스트림을 포함하고 그리고 벡터 골격 AscI 부위로 오버랩되었다. 그 결과, 서열번호 79-80를 인코딩하는 DNA, 디포신4 테일 구조 어셈블리에 대한 추정 차페론은 동족 추정 RBD의 ORF의 발견 즉시 다운스트림을 인코딩하는 DNA 서열로 대체되고 그리고 추정, 동족 RBD의 어셈블리에 대한 차페론이 될 수 있다는 것이 고려된다. 각각의 얻어진 작제물은 그런 다음 B. 서브틸리스 안으로 형질전환되고 그리고 0.5 mM H2O2 가 소분자 유발제로 사용된 것을 제외하고는 실시예 3에서 기술된 바와 같이 발현된다.
표 IV. 이종성 디포신류를 작제하기 위해 사용된 올리고뉴클레오타이드 및 그것의 서열번호, 주형, 및 전략. (패널 A) 업스트림 분절용. (패널 B) 중간-분절용. (패널 C) 다운스트림 분절용.
패널 A
패널 B
패널 C
전략 I-III으로부터의 각 발현된 이종성 디포신 DNA 컨스트럭션으로부터 디포신 제제가 제작되고 그리고 C. 디피실레 분리주의 패널에 대한 살균활성에 대해 검정되었다. 각 이종성 디포신 컨스트럭션의 살균활성에 민감성인 분리주가 표 II에 열거되었다. 보다 강력한 사멸 활성이 Diff4_R20291-RBD1+ Diff4_R20291-RBD1 컨스트럭션에 비교된 바와 같이 R20291-RBD1에 대한 동족 차페론(서열번호: 113, 114)을 함유하는 작제물에 대해 관측되었고, 천연 디포신4 차페론을 함유했다(서열번호: 79-80).
10.
신규한, 비-1374-기재 RBD를 함유하는 이종성 디포신류의 증가된 안정성.
디포신류는 효과적으로 제조되고 그리고 필요에 따라 동물에 전달되도록 하기 위해 많은 상이한물리적 환경에서 활성을 유지하는 것을 요구한다. 이를 염두에 두고, 천연 발생 및 이종성 디포신류의 물리적특성을 조사하였다. 디포신류는 제조된 디포신류의 원심펠렛이 각 연구에 대해 적절한 버퍼에 재현탁시키는 것을 제외하고 실시예 9에 기재된 바와 같이 제조되었다.
온도 안정성 연구(표 V)를 위해, 디포신류를 HN50 (pH 7.4)에 재현탁시키고 그리고 명시된 온도 및 시간에서 배양하였다.
표 V. 스폿 검정에 의해 결정된 것으로 천연 디포신4 및 이종성 디포신류의 열적 민감성. 도시된 것은 살균활성이 각 열적 조건에서 관측된 다수의 일련의 5-배 희석이다.
pH 민감성 연구(표 VI)를 위해, 디포신류는 명시된 산성 pH로 시트르산으로 산성화된 5mM 소디움 시트레이트 용액이나 12.5 mM 중탄산나트륨/HN50 (또는 명시된 알칼리성 pH로 NaOH로 알카리화된 디포신4 용액에 대해 TN50)의 어느 하나에서 재현탁시켰다. 명시된 pH에서, 샘플은 30분 동안 실온에서 인큐베이션되었다.
표 VI. 스폿 검정에 의해 결정된 것으로 산(패널 A) 및 알칼리성 용액(패널 B)에 대한 천연 디포신4 및 이종성 디포신류의 민감성. 도시된 것은 살균활성이 각 pH 조건에서 관측된 다수의 일련의 5-배 희석이다.
패널 A
패널 B
양자 연구를 위해, 샘플은 그런 다음 HN50 내에 연속으로 (5-배) 희석되고 그리고 민감성 C. 디피실레 분리주 상에 스폿 검정에 의해 살균활성에 대해 검정되었다. (각 디포신에 대한 살균활성을 분석하기 위해 사용된 민감성 균주가 표 V 및 VI에 명시되었다). 연구된 디포신류는 다음을 포함했다: 천연 디포신4 (서열번호: 61에 의해 인코딩된 것) 이종성 Diff4_43593-1374 (서열번호:53에 의해 인코딩된 RBD), 이종성 Diff4_M68-RBD1 (서열번호:91 및 92에 의해 인코딩된 BPAR 및 RBD), 이종성 Diff4_M68-RBD4 (서열번호:95 및 96에 의해 인코딩된 BPAR 및 RBD), 이종성 Diff4_M68-RBD5 (서열번호:97 및 98에 의해 인코딩된 BPAR 및 RBD).
파아지 RBD를 함유하는 이종성 디포신류는 RBD와 같은 ORF1374 단백질을 함유하는 천연 디포신류 또는 이종성 디포신류보다 높은 온도에서 더 길게 안정하였다(표 V). 신규한 RBD M68-RBD1 (서열번호: 91, 92), M68-RBD4 (서열번호: 95, 96) 및 M68_RBD5 (서열번호: 97, 98)를 함유하는 이종성 디포신류의 제제는 37 ℃에서 15분 동안 인큐베이션된 때에 비교하여 45 ℃에서 1시간 동안 인큐베이션된 때에 활성 유지했거나 증가했다(표 V). 흥미롭게도, CD1374 RBD, 예컨대 천연 디포신4 RBD (서열번호: 49) 및 이종성 Diff4_43593-1374의 RBD (서열번호: 53)를 함유하는 디포신류는 동일한 열적 조건 하에서 신규한, 더 작은, 비-1374-기재 RBD를 갖는 이종성 디포신류에 의해 유지된 것에 비교할만한 활성을 보유하지 않는다(표 V). 1374-기재 RBD를 갖는 이들 두 개의 이전 디포신류는 45 ℃에서 1시간 동안 가열될 때, 이들은 각각 80% 및 95%보다 더 많이 살균활성을 소실하였다.
증가된 열적 안정성을 나타내는 것에 부가하여, RBD M68-RBD4 (서열번호: 96)을 함유하는 이종성 디포신은 ORF1374를 함유하는 천연 디포신 4보다 더 큰 pH 범위에 걸쳐 안정하였다(표 VI). 살균 스폿 검정에 대한 결과는 Diff4_M68-RBD4가 pH 3.4부터 pH 9까지 활성을 유지하였고 그리고 더욱이 아래로 pH 2.5 및 최대 pH 10.6까지 검출가능한 얼마간의 잔류 활성을 유지하였다는 것을 보여준다. 디포신4는 단지 pH 5.5 내지 pH 10에서만 활성을 유지했다. 팽창된 pH 범위를 갖는 디포신류는 이들이 산성 환경 예컨대 위에 직면하기 쉬운 곳인 생체내에서 작용하기에 보다 더 적절하다. 이들 결과는 신규한 분류의 비-1374로부터 RBD인, 더 작은 RBD를 함유하는 이종성 디포신류가 천연 디포신류 또는 큰 이종성 1374-기재 RBD를 갖는 디포신류의 것과 비교하여 보다 강력하고 그리고 따라서 효율적인 생산 및 치료적 적용에 대해 이점을 가지는 것을 명시한다.
11.
신규한 RBD를 함유하는 이종성 디포신류의 살균활성은 뮤어라인 GI 관에서 지속했다.
생체내에서 생존하는 경구로 투여된 디포신류의 능력이 마우스 내에서 평가되었다. 다음으로 구성된 칵테일, 즉 천연 디포신4 (서열번호: 61으로 인코딩된 것), 이종성 Diff4_M68-RBD4, 및 관련없는조작된 R-형 박테리오신, AvR2-V10로 된 양성 대조군 (Scholl 등, 2009)이 12.5 mM 중탄산나트륨 내에서 제형화되고 그리고 정상의 건강한 마우스(n=3)에 경구 위관영양법을 통해 투여된다. 위관영양법 두 시간 전에, 마우스에는 H2 수용체 길항제인, 라니티딘 (100mg/kg)으로 주사되어, 위의 산성화를 방지하거나 최소화하였다. 배설물을 8시간 동안 매 시간 수집하였고, 프로테아제 억제제를 함유하는 HN50에서 균질화하였고 그리고 원심분리하여 잔해를 제거했다. 상청액을 0.45 마이크론 필터를 통해 여과하고, HN50 내에서 연속으로 5-배 희석하였고 그리고 그 다음 감수성 C. 디피실레 분리주의 론 상에서 스폿 검정을 통해 살균 활성에 대해 분석하였다. C. 디피실레 균주 19137은 디포신4에 의한 사멸에 대해 독특하게 민감성이기 때문에, C. 디피실레 균주 CF5는 디포신4_M68-RBD4에 의한 사멸에 대해 독특하게 민감성이고, 그리고 에스케리치아 콜리 EDL933은 AvR2-V10에 의한 사멸에 대해 독특하게 민감성이고, 상대적인 회수는 투여된 칵테일 내에서 각각의 독특한 살균성분에 대해 특이적으로 관측될 수 있다. 각 감수성 균주에 대한 살균 검정 결과는 각 시험된 마우스로부터의 배설물에 대해 나란히 도시되었다. 투여된 칵테일의 분취량이 보존되고 그리고 각 박테리아 론 상에 양성 대조군과 평행하게 스폿되었다.
배설물 샘플 내에서 살균활성이 이종성 Diff4_M68-RBD4에 대해서는 회복되었지만, 천연 디포신 4에 대해서는 되지 않았다(표 VII).
표 VII. 경구 투여 후 마우스의 배설물 내 천연 디포신 4 및 이종성 Diff4_M68-RBD4의 살균활성의 회복. 살균활성이 각 지시된 시점에서 스폿 검정에 의해 관측된 다수의 일련의 5-배 희석이 도시되었다.
마우스 사이의 활성을 비교하여, Diff4_M68-RBD4 활성이 이르면 위관영양법 2시간 후에 그리고 늦어면 8시간 후에 관측되었다. 활성의 피크 회복은 25-배 희석 후 관측된 살균활성으로 위관영양법 3 내지 4시간 후 관측되었다. 천연 디포신 4의 활성은 어떤 시점에서 배설물 내에서 회복되지 않았다. 균주 19137에 대한 칵테일 용액의 보유된 분취량의 활성은 투여된 칵테일 내 천연 디포신4가 투여 시간에서 활성이었다는 것을 확인하였다. 이들 결과와 실시예 10에서의 것은 천연 디포신류에 비교하여 신규한, 비-1374-기재 RBD를 함유하는 이종성 디포신류가 더 높은 온도에서 그리고 보다 산성 환경에서 안정하였다는 것을 보여준다. 경구로 투여될 때, 더욱이 그리고 유사하게 관련된 이들의 살균활성은 C. 디피실레 증식 및 발병 부위인 동물 GI 관에 노출에 대해 생존하였다.
12.
이종성 디포신은 생체내에서 CDI를 감소했다.
C. 디피실레 감염에 대한 디포신의 효과가 C. 디피실레 포자로 챌린지된 마우스를 사용하여 조사되었다. 두 그룹의 마우스(그룹 당 6마리)을 충분한 세포 페라존 (0.5mg/mL)을 함유하는 음료수로 5일 동안 전처리하여, 위장 미생물총을 파괴하고 그리고 마우스를 경구로 투여된 포자로 챌린지로부터 C. 디피실레 감염에 감수성으로 하였다. 양자의 그룹은 그런 다음 음료수 내 라니티딘을 섭취하기 전 36시간 동안 회복하도록 허용되었다 (용량: 100mg/kg/일) 라니티딘 투여 시작 12시간 후, 처리 그룹은 12.5 mM 중탄산나트륨 용액 내 경구 위관영양법을 통해 이종성 디포신4_M68-RBD4를 섭취하였다(용량: 1011 사멸 단위 Gebhart 등, 2012; Ritchie 등, 2011; Scholl 등, 2009에 기재되고 정의된 사멸 단위를 가짐). 두 시간 후 마우스의 양 그룹은 균주 CD630으로부터 제조된 C. 디피실레 포자의 2x105 CFU로 챌린지되었다. 처리 그룹은 포자 챌린지 후 4시간에 시작하여 그런 다음 매 6시간 마다 위관영양법에 의해 디포신을 섭취하는 것을 계속했다. 포자 챌린지 후 24시간에, 양 그룹 안의 마우스로부터의 배설물이 수집되고, 정량되고, 균질화되고 그리고 발육을 증진하기 위해 0.05% 소디움 타우로콜레이트를 함유하는 C. 디피실레 선택적 제제 플레이트 상에서 일련의 10-배 희석으로 도말되었다. 샘플 당 총 CFU가 계수되고 그리고 CFU/g 배설물로 전환되었다(도 10). 기하학적 평균 CFU/g 배설물이 각 그룹에 대해 계산되고 그리고 스튜던트 t-시험에 의해 비교되었다.
데이터의 분석은 이종성 디포신인, Diff4_M68-RBD4가 생체내에서 활성이어서, 쉐딩을 감소하고 그리고 따라서 C. 디피실레 균주 CD630의 군집화를 감소한다는 것을 보여주었다. 디포신을 섭취하기 않은 마우스는 6.9x105 CFU/g 배설물 (기하학적 평균)에서 C. 디피실레를 쉐딩하는 반면, C. 디피실레 챌린지 전에 또는 그 동안 이종성 디포신을 섭취한 마우스는 3.7x104 CFU/g 배설물 (기하학적 평균) C. 디피실레를 쉐딩하였다. 이것은 C. 디피실레 쉐딩에서 18.6-배 감소를 나타냈다. 스튜던트 t-시험에 의한 쉐딩 결과의 비교는 무가치한 가설 p-값< 0.05을 제공하고, 그리고 디포신에 의해 야기된 쉐딩에서의 차이는 통계적으로 유의미하였다는 것을 명시하였다. 이 실험은 신규한 비-1374-기재 RBD를 갖는 이종성 디포신류는 생체내에서 활성이었고 그리고 C. 디피실레 쉐딩과 군집화를 감소하였다는 것을 실증하였다.
"구비하는", "함유하는" 또는 "특징으로 하는"과 상호교환적으로 사용되는 용어 "포함하는"은 포괄적이거나 한정적이지 않은 언어이며, 추가의 언급되지 않은 요소 또는 방법 단계를 배제하지 않는다. 어구 "로 이루어진"은 특허청구범위에 명시되지 않은 임의의 요소, 단계 또는 성분을 배제한다. 어구 "본질적으로 ~로 이루어진"은 특허청구범위의 범주를 명시된 물질 또는 단계 및 청구된 발명의 기본적이며 신규한 특징에 실질적으로 영향을 주지 않는 것들로 제한한다. 본 개시내용에서, 본 발명의 구현예를 각각의 이들 어구의 범주에 해당하는 조성물 및 방법으로 고려한다. 따라서, 기재된 요소 또는 단계를 포함하는 조성물 또는 방법은 특정한 구현예를 고려하며, 여기서, 조성물 또는 방법은 그들 요소 또는 단계로 이루어지거나, 본질적으로 이들로 이루어진다.
특허, 특허 출원서 및 공보를 포함하는 본 명세서에 기재된 모든 참고문헌은 이전에 구체적으로 포함되든지 아니든지 간에, 그들 전문이 본 명세서에 참고로 포함된다.
이제 본 발명이 완전히 기재되었으며, 본 발명이 과도한 실험과정 없이, 본 발명의 사상 및 범주로부터 벗어나지 않고, 넓은 범위의 동등한 파라미터, 농도 및 조건 내에서 수행될 수 있음이 당해분야의 숙련가에 의해 인정될 것이다.
본 발명이 본 발명의 특정 구현예에 관하여 기재되지만, 본 발명이 추가로 변형될 수 있음이 이해될 것이다. 본 출원은 일반적으로 본 발명의 원리에 따르고, 본 발명이 속한 기술분야 내에서 공지된 또는 관례적 실무 범위 내에서 일어나고 본 명세서에 제시된 필수적인 특징들에 적용될 수 있는 바와 같이, 본 개시내용으로부터의 출발하는 것을 포함하는, 본 발명의 임의의 변화, 용도 또는 적용을 포괄하고자 한다.
본 발명이 상기 실시예를 참고로 기재되었으나, 본 발명의 사상 및 범주 내에서 변형 및 변화가 포함되는 것이 이해될 것이다. 따라서, 본 발명은 하기 특허청구범위에 의해서만 제한된다.
참조문헌
Anastasio, KL, JA Soucheck, and H Sugiyama, 1971. Boticinogeny and Actions of the Bacteriocin. J. of Bacteriology 107: 143-149.
Bartlett JG, Onderdonk AB, Cisneros RL, Kasper DL. 1977. Clindamycin-associated colitis due to a toxin-producing species of Clostridium in hamsters. J Infect Dis. 136:701-705.
Bartlett JG, Chang T, Taylor NS, Onderdonk AB. 1979. Colitis induced by Clostridium difficile. Rev Infect Dis 1:370-8.
Bartlett JG. 2002. Antibiotic-associated Diarrhea. N Engl J Med 346: 334-9.
Bartlett JG, 2007. Clostridium difficile: Old and New Observations. J Clin Gastroenterol. 41 Suppl 1:S24-9.
Benson L, Song X, Campos J, Singh N. Changing epidemiology of Clostridium difficile-associated disease in children. Infect Control Hosp Epidemiol. 2007;28:1233-5.
Blackwell, C. C. and J. A. Law. 1981. Typing of non-serogroupable Neisseria meningitidis by means of sensitivity to R-type pyocins of Pseudomonas aeruginosa;
Blackwell, C. C., F. P. Winstanley, and W. A. Telfer-Brunton. 1982. Sensitivity of thermophilic campylobacters to R-type pyocines of Pseudomonas aeruginosa. J. Med. Microbiol. 15:247-251.
Bradley. Bacteriocins. Bacteriol. Rev. 31:230-314, 1967.
Bol DK, Yasbin RE. Characterization of an inducible oxidative stress system in Bacillus subtilis. J Bacteriol. 1990 Jun; 172(6):3503-6.
Campagnari, A. A., R. Karalus, M. Apicella, W. Melaugh, A. J. Lesse, and B. W. Gibson. 1994. Use of pyocin to select a Haemophilus ducreyi variant defective in lipooligosaccharide biosynthesis. Infect. Immun. 62:2379-2386.
Coetzee, H. L., H. C. De Klerk, J. N. Coetzee, and J. A. Smit. 1968. Bacteriophage- tail-like particles associated with intra-species killing of Proteus vulgaris. J. Gen. Virol. 2:29-36.
Daw, MA, and FR Falkiner, 1996. Bacteriocins: nature, function and structure Review Article. Micron 27:467-479.
DeMarini DM, Lawrence BK. Prophage induction by DNA topoisomerase II poisons and reactive-oxygen species: role of DNA breaks. Mutat Res. 1992 May; 267(1):1-17.
Ellison, JS and JA Kautter, 1970. Purification and Some Properties of Two Boticins. J. of Bacteriology,104: 19-26.
Filiatrault, M. J., R. S. Munson, Jr., and A. A. Campagnari. 2001. Genetic analysis of a pyocin-resistant lipooligosaccharide (LOS) mutant of Haemophilus ducreyi: restoration of full-length LOS restores pyocin sensitivity. J. inhibition Bacteriol. 183:5756-5761.
Fortier, LC and S Moineau, 2007. Morphological and genetic diversity of temperate phages in Clostridium difficile . Appl Environ Microbiol . 73:7358-7366.
Goh, S, PF Ong, KP Song, TV Riley and BJ Chang, 2007. The complete genome sequence of Clostridium difficile phage phiC2 and comparisons to phiCD119 and inducible prophages of CD630. Microbiology, 153: 676-685.
Gebhart D, Williams SR, Bishop-Lilly KA, Govoni GR, Willner KM, Butani A, Sozhamannan S, Martin D, Fortier LC, Scholl D. Novel high-molecular-weight, R-type bacteriocins of Clostridium difficile. J Bacteriol. 2012 Nov; 194(22):6240-7.
Gibson DG, Young L, Chuang RY, Venter JC, Hutchison CA 3rd, Smith HO. Enzymatic assembly of DNA molecules up to several hundred kilobases. Nat Methods.2009 May; 6(5):343-5.
Govind, R, JA Fralick, and RD Rolfe, 2006. Genomic organization and molecular characterization of Clostridium difficile bacteriophage phiCD119. J. Bacteriol. 188:2568-2577.
Imlay JA, Linn S. Mutagenesis and stress responses induced in Escherichia coli by hydrogen peroxide. J Bacteriol. 1987 Jul; 169(7):2967-76.
Jabrane, A., A. Sabri, P. Compe`re, P. Jacques, I. Vandenberghe, J. Van Beeumen, and P. Thenart. 2002. Characterization of serracin P, a phagetail-like bacteriocin, and its activity against Erwinia amylovora, the fire blight pathogen. Appl. Environ. Microbiol. 68:5704-5710.
Kageyama 등 Life Sciences 9:471-476, 1962.
Kageyama, M., K. Ikeda, and F. Egami. 1964. Studies of a pyocin. III. Biological properties of the pyocin. J. Biochem. 55:59-64.
Kageyama, M., K. Ikeda, and F. Egami. 1964a. Studies of a pyocin. I. Physical and chemical properties. J. Biochem. 55:49-53.
Kageyama, M. 1975. Bacteriocins and bacteriophages in Pseudomonas aeruginosa, p. 291-305. In T. Mitsuhashi and H. Hashimoto (ed.), Microbial drug resistance. University of Tokyo Press, Tokyo, Japan.
Keel, K, JS Brazier, KW Post, S Weese and JG Songer, 2007. Prevalence of PCR Ribotypes Among Clostridium Difficile Isolates from Pigs, Calves, and Other Species J. Clinical Microbiology, 45: 1963-1964.
Kingsbury, D, 1966. Bacteriocin production by strains of Neisseria meningitidis." J Bacteriol. 91:1696-9.
Krogh, S,, M O'Reilly, N Nolan and KM Devine, 1996. The phage-like element PBSX and part of the skin element, which are resident at different locations on the Bacillus subtilis chromosome, are highly homologous. Microbiology 142: 2031-2040
Liu S, Endo K, Ara K, Ozaki K, Ogasawara N. 2008. Introduction of marker-free deletions in Bacillus subtilis using the AraR repressor and the ara promoter. Microbiology. 154: 2562-70.
Loo VG, Poirier L, Miller MA, Oughton M, Libman MD, Michaud S, 등 A predominantly clonal multi-institutional outbreak of Clostridium difficile-associated diarrhea with high morbidity and mortality. N Engl J Med. 2005;353:2442-9.
McDonald LC, Killgore GE, Thompson A, Owens RC Jr. Kazakova SV, SamoblSP, 등 An epidemic, toxin gene-variant strain of Clostridium difficile. N Engl J Med. 2005; 353:2433-41.
Morse, S. A., B. V. Jones, and P. G. Lysko. 1980. Pyocin of Neisseria gonorrhoeae: mechanism of action. Antimicrob. Agents Chemother. 18:416-423.
Muto CA Pokrywa M, Shutt K, Mendelsohn MB, Nouri K, Posey K, 등 A large outbreak of Clostridium difficile -associated disease with an unexpected proportion of deaths and colectomies at a teaching hospital following increased fluroquinolone use. Infect Control Hosp Epidemiol. 2005; 26:273-80.
Nieves, BM, F Gil and FJ Castillo, 1981. Growth inhibition activity and bacteriophage and bacteriocinlike particles associated with different species of Clostridium. Can. J. Microbiol. 27: 216-225.
P?pin J, Valiquette L, Alary ME, Villemure P, Pelletier A, Forget K, 등 Clostridium difficile-associated diarrhea in a region of Quebec from 1991 to 2003: a changing pattern of disease severity. CMAJ. 2004;171:466-72.
Ritchie JM, Greenwich JL, Davis BM, Bronson RT, Gebhart D, Williams SR, Martin D, Scholl D, Waldor MK. An Escherichia coli O157-specific engineered pyocin prevents and ameliorates infection by E. coli O157:H7 in an animal model of diarrheal disease. Antimicrob Agents Chemother. 2011 Dec;55(12):5469-74.
Scholl, D, and DW Martin, Jr., 2008. Antibacterial efficacy of R-type pyocins towards Pseudomonas aeruginosa in a murine peritonitis model. Antimicrob. Agents Chemother. 52:1647-1652.
Scholl, D, M Cooley, SR Williams, D Gebhart, D Martin, A Bates, and R Mandrell, 2009. An Engineered R-Type Pyocin Is a Highly Specific and Sensitive Bactericidal Agent for the Food-Borne Pathogen Escherichia coli O157:H7. Antimicrob. Agents Chemother. 53: 3074-3080.
Strauch, E., H. Kaspar, C. Schaudinn, P. Dersch, K. Madela, C. Gewinner, S. Hertwig, J. Wecke, and B. Appel. 2001. Characterization of enterocoliticin, a phage tail-like bacteriocin, and its effect on pathogenic Yersinia enterocolitica strains. Appl. Environ. Microbiol. 67:5634-5642.
Sunenshine, RH & LC McDonald, 2006. Clostridium difficile-associated disease: New challenges from an established pathogen, Cleveland Clinic J. of Medicine, 73: 187.
Williams, S., D. Gebhart, D. W. Martin, and D. Scholl. 2008. Re-targeting R-type pyocins to generate novel bactericidal protein complexes. Appl. Environ. Microbiol. 74:3868-3876.
Wood, HE, MT Dawson, KM Devine, D J McConell, 1990. Characterization of PBSX, a Defective Prophage of Bacillus subtilis. J Bacteriology 172: 2667-2674.
Zilberberg, MD, Tillotson, GS and McDonald, LC., 2010 Clostridium difficile Infections Among Hospitalized Children, United States, 1997-2006. Emerging Infect Dis 16: 604-609.
Zink, R., M. J. Loessner, and S. Schere. 1995. Characterization of cryptic prophages (monocins) in Listeria and sequence analysis of a holin/endolysin gene. Microbiology 141:2577-2584.
SEQUENCE LISTING
<110> AVIDBIOTICS CORP.
<120> DIFFOCINS AND METHODS OF USE THEREOF
<130> CF210341
<140>
<141>
<150> 13/829,725
<151> 2013-03-14
<160> 163
<170> PatentIn version 3.5
<210> 1
<211> 22825
<212> DNA
<213> Clostridium difficile
<400> 1
ggccgcaata cccactacac cttcgtcatc tttaaattta agagttttta ctattgaata 60
ataaaggtat attccagtaa aaataatctt taaatacaag aaaaataaac tctttgggta 120
tattaaaaag ctaaaaagtg taaatataaa agcaagtaga gtacttatcc tgtaaaagaa 180
atctatttgt gtaatgtctt tatattttat cataaacacc gaatataaaa tgatgaaaat 240
aattgcgacg attgcatata tggtaaataa catattttca agagtaccat ttgaaattac 300
tatccactta taccacataa ttggccaaaa taatagtgct aagaacttaa aataattatc 360
aaacaacttt tctttataca ttcatcaaac aacctttctt aacaaaagca tatatttgtt 420
tttagaattt taaataatat gatatcatta ttatatatta atattgaatt tatagaaacc 480
aaaatttgtt aaaataaata tatagatttt actgttaagc cagttaaaat tactactatt 540
tttattatga aattggatca aatatgtaga aatacggcaa attagttaat attaaatatt 600
tattatttcc aagttgtaaa gactgttttt ttaatgataa aaattctaat cttttttgaa 660
agaaagtaat atccacatta agtatgtctg ccatttcata aacgcaagtg atgccagaat 720
taattatgtt tattatatct tcttcagtaa ttaagaactc acaagcccat tttaaggctt 780
tattttcgca cttatctata ataatttttg tataataatc gttataagag gatacatagt 840
atccaaggct agtgaaatga tgtccaagtt cttcagctaa gatggatgtc aatttttttg 900
agttttgttt taaattactg agtaatgata taattttaat accatgtttg tttatatata 960
gcccttctaa atcacctgca atataagtgg tataatgaat tattatctct tcttgagaag 1020
ctaattcaaa aagcttatcc aaattattca taaaaatccc cctaaaatag aatgtatgtt 1080
tgcctttaaa ttatattaaa agagcagaaa aatagactgc tcatcatatg gtttattttt 1140
ttttatattt atttagtaaa aattctatat aatcattaag ttgttcttgt gcttcttcag 1200
gtaactcttc atgtggattt tttctatgtg cagctactgt atcaatattt tccttaacta 1260
aggttcttcc aagaaggtaa tcaactgata cattaaatac atcagccaat ttgtttaaaa 1320
tgtgttcatc aggaaatctg ttttctgttt catagtaccc taagactctt tgggaaacgc 1380
ctactttttc tccaagttct ctttgagtca atccaaattc ctttctaagt tctcttaatc 1440
ttttggcaaa cattataaca ccaccttatg tatagattat aacaaattgt tctaaaaaat 1500
aaaactaata aaatataaaa gaatattttt tctaaaatct attgataaag aacaaatgat 1560
tctatataat ctaagtgtgg aagaacaaaa tattcttaat ggtaatggag gtataaaaca 1620
atgtttaaaa ataacttgaa atattataga aaatgcaaag gtatgacaca aattcaactt 1680
gccagaaagg ctggaattac aaatgactat atatctcaaa tagaaagagg tataaaaaat 1740
cctggtcttc ttatggctaa gaagatttct agtattttag aacaaaatat agaagaagtt 1800
ttttttatac agttatagaa caatatgttc ttgaaagttg tgagattagt aaaaaactgt 1860
gcactaaaga gattattgta aatttgaagc taataataag tatataaaaa aggagaagta 1920
ctatggaaaa caaaaaagat atattattta aagaaacaga tgaaagatta cataattata 1980
agtatttgga tataaagata aagaatatta atttggacat aaaaagatgt gagaatgaat 2040
actctggatg tggagcaatg gtatatacag aaaagactag taacacatat aacataagtt 2100
cttctgtgga aaatgaggtg ttaaaaagag aggaaagatt aagaaaatta aaaatggaaa 2160
aagaagatat agaaatagaa aaagagaaga tagaaaatgc tctaacatgt ctaaatgata 2220
tagaaatgga attttttaat cttttttata atagtaagac aaaaaacaat atgacatata 2280
tttctatgaa actacactta gatagaacat cttgctacaa tttaaagaaa aaaatgatat 2340
ttaaattgag tgagatatta taaaaaatat gacaacttta caacacttta tatacactat 2400
tgcaacacta ggcaataaaa tatgtgagat aatgttattg tgaaagaaat ccatattgaa 2460
ggaggtgata aattgaaaag aataatatta cctaaaaata tagaagatat ttgacaggaa 2520
taaatgagat gtatatttaa aaatgactta tatcatttat agtaagatta tcagattaag 2580
caagaatatt tagtgatagt gtggtgatta tttgcttaaa tacaaggaaa tattagaaac 2640
aattattgag attctcaaaa aaaactttac tgaaagtatt tttattgatg atgaaagtgt 2700
gcaaggctct gaagggtctt gtttttttgt aagtatacta tcagttattt gtacacctat 2760
aatgttaaat acgaataata aagatattgt tatctctata aaatacttac caaaaccaca 2820
gtcaaagagt attagaatgt atgaaatttc agatgaatta aataagttat tcaacagaaa 2880
tataaaggta acagacagaa aattaaatat aacaaagcta gaacaaagta ttaaaaaaga 2940
agagtcaatt tatgtattga actttacaat tacactaaat tatctggata gtgtatatga 3000
agaagatgta gtatatgaaa atatggaaga aatcaattta aatttaggag agtgatagta 3060
tggctatagg attaccaagt atcaacatat catttaagga gctagctaca actgttaaag 3120
aacgttcagc tagaggaata attgcaatgg tgcttaaaga tgctaaggca ctaggtctta 3180
atgaaataca tgaaaaagag gatataccag ttgatttatc tgctgaaaat aaagagtata 3240
taaatttagc tttgatggga aatgttaaca ctccaaataa attattagtt tatgtaatag 3300
aaggagaagc agatattcaa actgcattag attttttaga gactaaggaa tttaattatc 3360
tatgtatgcc aaaagcagta gaagctgata agactgctat aaaaaattgg ataattaaac 3420
ttagagatat agataaggtt aaggttaaag ctgtattagg aaaagttgta ggaaatcatg 3480
aagggataat taattttact acagaagatg tgttagttgg agaaaagaaa tacagtgttg 3540
atgagtttac aagtagggtg gctggactta tagcaggaac acctttaagt caatcagtaa 3600
cttatactaa gcttagtgat gtagttgata tacctaagat gacgaaagtt gatgcagaat 3660
caagggttaa taaaggagag cttatactta ttaaggaagc aggggctata agaattgcaa 3720
gaggagtaaa ttctttaact gagttaacag aagaaaaagg agaaatgttc cagaaaataa 3780
aaatagttga cactttagat attatacata gtgacataag aaaggtgata atagatgact 3840
atataggaaa ggttactaac agttatgaca acaaatgttt attgatagta gctataaaaa 3900
gttatttaga agaattagaa aagtcagcac ttatagaatc tgattctact gttgaaatag 3960
attttgaagc acaaaaatcg tatttaaaat caaaaggagt agatttatct tatatgacat 4020
tacaagaaat aaaagaagct aacacaggtt ctaaagtatt tttaaaagca aaaataaaag 4080
tacttgatgc tatggaagat atagatttat caatagaaat ataggaggat tattaatatg 4140
gcaaatatgg aagctagaaa tgtaatgagt ggtacttggg gagaactttg gcttgatgga 4200
aacaaagtag cagaagtaaa gaagtttcaa gcaaagatgg aatttacaaa agaggatatt 4260
ataatagcag gtcaaatggg tactgataca aagtatatgg gatataaagg aaaaggttca 4320
ataactctat accatgttag ttcaagaatg cacaagttaa ttggagaaaa gataaagaga 4380
ggttctgaac ctagatttgt tgctatatct aaattaaatg acccagattc ttatggagca 4440
gaaagaatag cagtaaaaaa tatagcattt gatgatttaa ctttagctga ttgggaggtt 4500
ggagtaaaag gagagataga agcacctttc acatttactg agtatgattt tcttgatata 4560
atttagtttt atatttggtt ttatactgat atttagtaga tatatactta ataaatttag 4620
gtagttaata agtaaaaaag ttagttgatt gaatttgatt gataaaggag caaataataa 4680
tgaatgaaaa tggattatca aaaaatataa acatagtaga tttactttta aatgcagata 4740
cagaaaactt agaaagacca agtactatag ttgaacttaa gagattatca actatatttg 4800
ggcaggaatt taaagtaatg tgtagagctt taacaataag taaagatgaa gagatacaaa 4860
atacttgtct taaaattgat gaaaatatga aaacggatat agacttaccg gagatgcaga 4920
tgcttacaat tatagaaggt gtttgtgatt tggatggaaa gcttttattt aaaaataagg 4980
aactaatgga taaatttaag gctccaacac caaaagaatt ggcaagaaaa ctattattac 5040
caggtgaaat taccaaccta tatagaatac ttcaagatgt tatgggttat ggtaaaaatg 5100
cagtgataga agaggtaaaa aactaatagg gacggatacc aagactacaa taatgtacta 5160
ttattggaag aaaaaaggta taagaccgtc ccttttttat gcaatggata aaggcgaatt 5220
aaagcttatt gaagcttttt tcgccttaga aattgaggaa gaagttgaaa aaatgaaaca 5280
tggatatgga gtgtgtcctt tgacaggagg tggtatgtaa tgggaaatgt gagagaagaa 5340
ggtataaata tgtatcttac agataattac acaccaaaaa tgaaccaaat tatatcagta 5400
actgataatt ttaggagagc aactgtggct gtttcacttt ccactaatgt aatggctagt 5460
agcataaaaa attctattgg aagtgcaagt agtagagtaa acagtttaaa ttcctcgtta 5520
agaaaagttc aaactactgc tagtagtgta agttcaacta tggcaaaatt aagttctagc 5580
ataaatgctg tttcaggagt tattggaagt ttaaatggaa gtattatgag actagcaata 5640
actatagcta tgattattga ttattttaat aagttgattc aaaagaaaaa tgagtttaat 5700
tcaaatatta tgattatatt aatatttaaa gctaaaagtg atgaagtaga aaaaactaaa 5760
aataaattac ttggaaattt aaaaaagatt ggtggcaaga tttggaatat cgtaataaaa 5820
gcaaaagata tgactaagag agtgataagt agtatcttgg gaaaattaaa acgagtagag 5880
aaacgtcctt atcaaggaag tattaatctt aaagatatgg taagtagtgc tatggctaga 5940
attttgccta agttaatgtt gtttaaaaat actttttgga gtggtgtaat agctataaaa 6000
gatatggcaa gtagcattat aagtaaagta tttcccaaat tgagattgtt tgcaggtaag 6060
gtatggagtg gtgcaatagc tgtaaaggat atggcaagtg gaatacttgg ttcgataaaa 6120
gggaagatat ctgatttgac aaatggtgct actataggtg tcgctgtgaa aaagggtgtt 6180
gacttacttg gtcaggaaca aaatcagaaa gttgttctag aaagtgtaat gaaaagaaat 6240
actggaaaaa ctagccaaaa agatgttgat aagtattatg acagtttagt aaatatggca 6300
aatgatacgc cttttgaccc tgaagatgtt gttgcaatgg gaactaaagc taaaatgatt 6360
agtaatatta ctggtggcaa aaaagaaaaa gatataactc aagctatggt agatgttaga 6420
gctttaaata tgaatacaag tagtgaacaa gatgtatcag cagctttctt aagtgcagca 6480
aaaggaaata tggaatctct taatactctg gtaggagaaa attataaaac ttttgatgaa 6540
gcattggaag gcataagtgt aaagcagatg gggttagcta aagaaatgag taatacaata 6600
ccaggtataa tatcaggagc tcaaacaagc attaacaatg gtttgaagag tattgttaaa 6660
ccttttgatg atattttagg tcaaggacta aagaaaataa aaacttttat agaaagtgga 6720
ttagggaatt tagctggctt atctgaaaaa atggctggta aaataggcaa tgtaatgaat 6780
ggtaagataa ttattggcaa caaatatgac cagatgcaat ctagaagtgt aaaaaatgga 6840
aaagagtttt ctgattctac tcaatatcga atttctaatg aggctgaaaa gcgtaaaatg 6900
atggttgaaa ataagcaaga acgttttgaa aatcatgcag caacaatgat agggaatgca 6960
ccaaaagcaa ttgttaacgc aggaagtaca ctattacaaa atattgattt tacagcatta 7020
atagattcac tacttccagt agtaaactta gtaaataatt tactagatag tataaacaat 7080
aaatcaccaa ttgcacaagg attaataagt atatttggta caatagtaac tacagcattc 7140
caactaatcg gacctgtagt tgaagctgtt agtcctatta tcacaagaat ttttactttt 7200
ttaggtgaat atgcacctca aataaacaat tttatagaga cactgggtgt tatttggaaa 7260
actgtatggg agaccttagg acctctgttg gaaactggat ggaaaattat agagccaata 7320
ttgggagctt tttttaacat attagataaa gtatgtaaaa tagttaaaga tatatgcaaa 7380
tggtggcaaa ctatgattaa taagataaaa aatggaagca tcacaggaac agttttaaat 7440
ctagtggaaa agagtaaaaa aaattacaaa gataatccat atgctggaac aaaggctggt 7500
gattctggta aagcttattc aagtaagaaa ggtaataatg catttggatt gaactatgtt 7560
ccttataatg actatcaaac cagactccat gaaggtgaaa tggttttaac taaacaagaa 7620
gcaaatcaat atagaagcag aaaaaatggt ggaaatataa acatagctaa gttagctgat 7680
acaatagtga ttagagaaga agctgatata gaaaagataa catcaaaatt agttgcaagt 7740
atccaattgg cacagttagg gggtgtctta taatggaaat gtggcttaga caagcagaag 7800
atagatttag atttccagta tttccatctt cctttagtat taatggaaaa gctgctgtaa 7860
actcttctag tatactcaaa ataggtgaag tagcaacttt tggtggtgta gctcttaaaa 7920
gcatttcaat atcaagtttt tttccaaata aagactacac tttctgtgac tatacaggtt 7980
ttccatcacc atatgattgt gtaaataaga tagaaaaatg gatgaaggaa ggttttatat 8040
taagatttac aattacggaa acaaatataa atatggaagt cataattgaa gggtttagtt 8100
atgaagaaag agatgggact cgagatgtat attttacatt agatttaaaa gagtataaaa 8160
gaataaagat accaaaagta actccaaaac aataactatt atagataata agttgtaagt 8220
aactgctgat agaattaaat gaaaaggcag gtgatttttt attattaaga tttgggtaca 8280
cataaaaaac ggaagtatat atgacataac tgacatagta gacaaggtat catggtcagg 8340
tgattataaa tctccatcaa ggacactaga gttttcaata atacaatcat catttgatgt 8400
aaatttccaa caaatcgata taccaatagc tagtacagtc tgtttctatg tagatgagaa 8460
agaactcttt agaggaatga taattaatag gtctaaagat tcaagcagta atgaaattag 8520
ttttgtatct aaagatatgg gatttttact tacacaaagt gaagtgtcat acaattttaa 8580
agataagtta gttgaagaca tagcaaagca agtatttgct gaaaataggc tttcagttgg 8640
aacaatagca aagaccaatg tcaagtatac aaagatgttt ataggagtaa atggttatga 8700
cacaataatg agtgcatata cagaggcaag taaaaagaca aagaaaaagt atatgataga 8760
ggctaattta gataagttta atgttattga aaaaggaact gttacattaa gtgttatgtt 8820
tgaagaggga tttaatatta taaataccac cttttcggag agcatggaaa atgtaaaaaa 8880
taaagtaata gtggtagacc agtatggaag caagattagc gaaaaaatag ataatgaaat 8940
ttttaaggaa gtaaatgtaa taatgcaaaa agtaattcag caacaagaaa atcaagatgt 9000
agatattgat agcgagttta atgggataga aaaaagctgt tctcttaaag gttatggaga 9060
tgtaagttgt ataactggta gaggagtaaa agttaaagat tcttatacaa agcttgtagg 9120
actattttat atagatacag acaaacatac ttggcaaaat ggagaatatc aaattgagct 9180
tgaacttaat tttcaaaatc ttatggatga aaagtcagca ggacaggatg aacctaagga 9240
agaaagtaat ttagggggag aagattatgc aggaggaaaa gagtttacag cagaatttac 9300
agcttactgt cctagaaaag aagaaggtgg agatacagat tgtagaaaga aaaaacttga 9360
cccatctaaa aaacttgcgc tgctcctatg gttggtaaat atgagcaaac ttattataca 9420
aaagagtttt taaataaaca tcctttattg aactatggag atgaaataca ggtaattaca 9480
ggagtttctg gtcgtgatgg agtctataaa gtaaatgacg taggacctgc aataactata 9540
gaaaaaaatg gaacatacca tatagatatt ttatttggaa atgttgaaga agctagtaaa 9600
tttggaagaa gaaaaggaaa aattattatt ggtggttatt ctggtaatgt atctgataaa 9660
gctaaaatag taatatcaga ggcaaaaaaa catctaggta aaccttataa atggggtgga 9720
aatggaccaa gtagttttga ctgttctggt ttaatggtct actgttttaa aaaagttaat 9780
gttagtttgc caagaacgtc aaatcaacaa tctaaaaaag gcaagaaagt agaacaaaaa 9840
aatcttcaag caggagattt agtatttttt cataatccag tcagccatgt tggattatat 9900
ataggtaatg gagaattttt acatgctcca caaaaaggtg atgtagttaa aataagtaag 9960
ttaagtagta gaagagattt taatacagct aggagagtat tataaaagga tggtgatata 10020
atggctaatc caataaatga atttatagga ataataagag aagaaggaaa gtatcataat 10080
caaccttctt ttttattgga aaattaaaag taaattacca gatttaaaaa tagagacaaa 10140
taacatcata ttagaaaaag aagatatttt gatagatagt tggatgattg atagacagct 10200
agaaacattt gacacagaaa caaatcaaga acaccagcat gaagtaaaaa atccttttat 10260
agataacttt gaatctgggg atatggtaat aatgtttaga ataggcgaaa aatttgctgt 10320
tgtaagtaag ttggtgagct tataatgagt acaatatttc cttttatagg tgtcccagag 10380
gattatatct tacctaaaac agaagaattg ccaatctttc gtgaagtggc atgggatttt 10440
gaaaaagatg aacctatttt agaaaaaggt gactttaaaa taattgaaaa aaaaagaagc 10500
cttaaaagtt tggatataca agtgtataaa gacaaataga tatgaacatg agatatactc 10560
tttagaatat gggacagagc tttcagaact aataggacaa aaatatacaa aaggtcttac 10620
agaaagtgaa gctagtagat tcataaaaga ggcccttcta ataaatccat atatattaga 10680
agtaaacgta aaaagtgcta actttaacag agacgtattg agtgcaaatg taaaagtatc 10740
cactatctat ggggaggtgg aaataaatgt atagtgacca gacatatgaa gtaataaaaa 10800
atagaactct tgaaaatatt aatcttgata tttataaagg agaaggttct tttctaaaca 10860
acatggtatc tggaaataat ctagaacttt cgaagatata tctagaactt tcaaagatac 10920
ataaaatggc ttttatacaa gacacatata accagtttct tgataaaaga gtcaatgaat 10980
ttggtgtata tagaaagtta ggtacagagt caaatggaga agttgaattt attggagaga 11040
aaggaactgt aataaataat ggcacaataa tatcatatag agatttacta tttgtagtaa 11100
taaaagatgt aactattggt agtgaagaag gtgacaatag cccagttcaa gctctggaag 11160
ttggtaagaa atataattta cctacaaatt gtgaatttaa actagttgat aatatatctg 11220
gagtaacaaa gattactaac acaagaagtt ttgaaggtgg tacagatata gagacagatg 11280
aagaactaaa agaaagattt tataaaatcc aaagaaatca agctacaagt ggaaataaag 11340
ctcactatga agaatgggct ttggaagtag atggagtcta taatgttaag gtttatccaa 11400
gatgggatgg tccaggaaca gttaaggtct tgatatttgg ggaaaataat caagctgttg 11460
atacagaaac gattgaaagg tgtcagcaac atatagatga agagaagcct attggaccaa 11520
ctataacagt tgtgacacca ttaccaatag aaataagtat aagtgcagta atgaaactag 11580
aagatggata tacattagac aatgtaaaag aatctttcct agaaagtata aatacatact 11640
ttagagatat tagaggagag ataatctata caaaagtcat gggaatactt ataaatacta 11700
ctggtgtaca cgatttaagt aatctactta taaatggaag tacagataat ataactatta 11760
atgaagataa aatacctagt gtaacaactg ttaattttag tgaggtggaa aatcaatgaa 11820
gctaattgat aaactaccat catttgatag aaattacatt gtagaggaga tacaaggtgc 11880
atacgataca gaattaaata ttcttaaaga agatattgat gataccttta accaattatt 11940
tgttgataca gcgacatggg gattagatat gtgggaagac atactctgca ttgaaaaaaa 12000
agaacttgat tttgacacaa gacgtagcaa tataaaagct aaaatgagaa gcagaggtac 12060
tagtactatt gaagttataa aaagtatatg tgaggcatat acaaaatcag aaacagatat 12120
aaaagtttat agtgatgaat ttacattcgt attgagtttt atagcaaata actgtgacta 12180
taaaactctt ttagattgta gcgagatgat tgaaagagta aaacctgctc acttattaca 12240
ctatttagaa ccaataatac tagataaaag tatggtctat tgtggtggag gtatggtatg 12300
tagtgaagag gtaaaagttc atccatactt tgaaccaatt ataaaatgta gtgctgttgt 12360
aaactgtgga gctggaatgt taagtagaga agaaataaag gtttatcctt taagcattaa 12420
atgcattgaa aataattgta agattaatat agctattgca aatgatacag gcgtagaaaa 12480
tgtagtagtt tatcctaaat cggaggtggt ataattggaa gaaaaatttt atataatatt 12540
aaccaaaatt ggtagagaaa aaatagcaaa tgcaactgca ctaggagagc ttgttggatt 12600
aaccaagttt caagttggag atagtaatgg agaatattat gagccaacag aggaacaaac 12660
tgctttaaag aatgtagttt gggaaggaaa tataaattct ctaagaattg atgaaaaaaa 12720
tcctaattgg atagttatag agactatttt accaggaaca gttggtggat ttatgataag 12780
agaagctgct gttctggata atgagaataa tataatagct atwggtaagt atccagagac 12840
gtataagcca cgtgctgaag atggcagtat taaagatttg gttgtaaaaa tgattttaca 12900
attgtccaat acttcaaatg ttacattaga agtagacccg acgttggttt ttgtaactca 12960
aaaggatatt caagatttag atgataagtt tgataaaaat ataaaagaaa taaaagtaaa 13020
aattggagat acagatatat taactacaga ttctaaagat ttatcaggag ctataaatga 13080
ggtagttaaa aaaatagaaa atatatcttt tgatgatgtt ataagtggtc aaatacaaac 13140
tgatatatca gtattaaaaa atagctataa caaattatct gaaaaagtgc tagatatatt 13200
aatataccta gaattagagt cagaagtaac tgtagatgag gctggttatt ggtatgatac 13260
attagcaaat ggaaataaca tagtagctat agaagggctt aagttagatt taaatagaaa 13320
atgtataaca ggtgaaattg gtaatgtgat ttttagagat gtagtattac catttagtgc 13380
aaatagagtt agatatatac atgatatgga taataacttt gttgagacaa aatctagtaa 13440
cacttattta aaagaacaaa aagatataac tctaagtaaa tattcatatg aaataagata 13500
aataaaggag gtagtactaa taatgaagca aaataaactt ttacagcgtg gtgcttattt 13560
taatgataag aacatattga ttgatgattt tgataaaaga tataatgatt atgattttgt 13620
agaatttttt actggtataa gtaatagtac ctttggttta aaatcagatg gtaatttata 13680
tgcttgtggc gataatacag gttttcaact aggacttgga aaagattcgt cagagagaag 13740
gatgtttagt aaagtaaaaa ttgataatgt aaaatatgta tcttgtggtt caaaacacag 13800
tgtagcagta actaaagatg gatttgcata tggagcagga acaagtaatg taggtcaatt 13860
aggtgtaatt gagtctacag tatattatga atttactaag ctaccaatag atgatgtaaa 13920
aactgttgca tgtggttatg actttacatt tgtgcttaaa aatgatggaa cattatattc 13980
agcaggttta aactcaagtg gtcaacttgg actaggtgat actaacaata gagctacttt 14040
tactaaagta aatatagata gtgtgaaaga tgtagtgact tataatcaat ctgtatttat 14100
cataaaaatg gatgggacag cacatgcatg tggattaaat tcaaatgggc agttgggaat 14160
taatagtact ttaaataaaa gtgtatttaa taaaatagaa ggtatggata atgtaaaaca 14220
gatagcgtgt ggtagtagtc atacaattct tattaagaat gatggaacta tgtatactac 14280
aggctataat ggagttggtc agcttggtac aggaaataat aataattcaa ttgtatttac 14340
tctttctagt ataaataatg ttaagtatgc ttcttgtgga aataatcata ctatgatatt 14400
aaaatacgat aatacactgt ttagtacagg acaaaacaat tatggtcaac tagccaatgc 14460
caataaagat gtagcatcaa gaaatacttt tgctaaggtt aatgtagaaa atataaaaga 14520
tattaaatgt ggttctcaat ttaatttttt aataaatggt tcaaaagaga tatttgtatc 14580
tggctgtaat ttagcaggtc aacttggttc attttttcat acaacttttc tgtatgagtt 14640
ttcaaatgtg caatcttcaa atttagataa ttattcaggt ttattggtta atgatgatta 14700
tttatatgtt acaaaggaca atagtgaatt tttaaatgta aagttaagtg ataattttca 14760
agattataag aagatagagt taacagatag caatatgttt attgttatga atgatggtac 14820
attgtatgct tgtggtttaa ataattatgg acagttagga ttgggagata ctgttaacag 14880
gtcagttatg actaaggtgg atatagataa tgttttggat ataaaaggaa acggaaactc 14940
aacttttgtg cttaagaata atggaacatt atattcatgt ggtttaaata gtaatggaca 15000
attgggttta agagatgaag ttaatagaaa tatatttaca aaaatagaaa tagagaatgt 15060
aaaggatttt tgtgtaggaa gcaattatgt catagcttta aatcactcaa aagaagtata 15120
tggatgggga aataatcctt ataataatat agaaaaaact tctaattatc catataagca 15180
gggaataagt aatattgaaa agatagcagc atatgattat tctgtatata tgataaacag 15240
tgaagggaaa ctatatgttt ctggatacaa ttataattat caattaggta aaggaaataa 15300
tagtaaccaa agcaaagcat tagtatctca atgtagaaca aattcaacat cttctacatc 15360
aaatggactt agaacgttac ctaaaataac taatgttttt cctttttatg atggttgtgc 15420
aataattgac gaaggaggtt atgtttattt aacaggatat catggatatt taagaacatt 15480
aaatagcagt ccaagtatat ctgattattc aagatatgga acttttattg aggctacaaa 15540
ttcaaatcat aatacttatt ttatacaaga gactgatttt agtggaattg aaaaagtaat 15600
agggatgtca aataatatat tattttttaa gaaaggaagt tcatatatta ctggatatcc 15660
aaaaacattt ggctcaacca ttactggaca tagaagttat actagtatta attctgagag 15720
ttctaattta ggaagtaatt ttataatata tcatagtaat tccaagttat atggaaaagg 15780
gattgctaat agtgggcaat ttgggaattc aacaaatata gatggcacaa gtaactatga 15840
tacaggatta aaagacataa aagatataat tgtaaaagga aatactgtag tagtagtaga 15900
taaaaataac aatatatatg taacaggaat gaatcagaat aacaaacttg ggatagggga 15960
atataacaac gaaccagtaa aaaaattcac aaatataact gaacaatcaa actcatttat 16020
atttatggat gatataaaag aaattacaac atcaagaaat acaatgttta tagtaaaaaa 16080
tgatggaaca gcctatgcca caggaaataa tagttctgga caattaggat taggtgacac 16140
aataaataga aataagttca ctcagataaa ccttgataat ataaagaaaa tatcaacaag 16200
tatagatggt aacacaacat ttgcaattag aaatgatgga acactatact ccacaggatt 16260
aaataccaaa ggacaactgg gattaggtga tatagtaaat agaaatacat ttaccaaagt 16320
aaacatccaa aatgtaagag atgttgtttt agggactact cactcgcatg caatcaaaga 16380
tgataacaca ttatattcat gtggagaaaa cactcatggg caactgggct taggaagcga 16440
aagcaaccat ccagacgtat tgacatttac tgtaaacaat ataactaatg taagagatgt 16500
gtactgctca gatacaacaa catttattgt aaaggacaca aacattgcat attgttgtgg 16560
atacaataat aattcacaac taggtatggg aaatactact gaccagtata gttttataaa 16620
gtgtatggaa aatgtaaaag aagttatacc aaatgaaata aatacctata taataacaat 16680
ctataatact gcatatagta caggtttaaa tactgattat tgcttaggtc taaatagtaa 16740
tagcaatcaa agttcatttt ctgaaattcc aatttcaaat gtagtaaaag tagctccaaa 16800
cagaaataat gcagtacttt tacttacaag tgaaggggat gtatatactg caggcaaatg 16860
tagtaatggt tcaggtacag gaagtgagac tccagagaag attaaaaaaa tagcatcaaa 16920
ggcaaaggat attggaatga attatagatg tggacattat gtaagtgata atggagacct 16980
atatggtaca ggttttaata ataatggaca attaggtgtt ggtgatgtaa caaaaagaga 17040
tacatttata aaaaccaata caagagtaaa gaaaatactt cctttagaat atgcaaatat 17100
agcaataaaa gatactaatg atatatatat ttgtggatta aataactatg gacaattagg 17160
tgttggaaat agatacgata gtagaaataa tgataataga atatttaatt ataagcatat 17220
gaattttgta atgggtgatt tgacatctat taaaaacaga cataacttta tacttctaaa 17280
caataagata gtgataccta ccacaaaaga catagattat ggtttagtat taggaaattt 17340
atacaaagga gacctttata ctgagcttcc atatgaagat ataaaagaag tatctatttc 17400
taagactcat attattatat tacttaatga tggaacaatg tatggatgtg gtacaaacta 17460
ccatggagaa ttattgcaag acttgtctat aaatcaagtg gatgaatttg tgcagattaa 17520
tgtatcagat gtaaagcatg tttcatgtgg agataacttt acttatttta taaaatctga 17580
tgatagtctt tggtctattg gtaaaaattc cgaatatcaa ttaggtatag gtcacaataa 17640
tccagttact gaattacaaa gaattacaac tatatctagc tgtaaagaag tacattgtgg 17700
taaaaactat acattagtag taactacagg taatgaatta tttgtacaag gatataatga 17760
taagggagct ttaggattag gaagcgatag tgaaaatact ataattaagt tctttacaaa 17820
agcactaaca gacataagag aaataaaatc ttatggaagt gaccatatat tagtacttaa 17880
aaatgataat tcagtatggg ttactggaaa aaatagggat gtatataaaa ttgaacaacc 17940
agtagaattt ttaaaagaat ttactatagt acctatttct gaagatgtaa atacagtaaa 18000
ggatgtactt gcaacagaca atacattata tattatatca gaagtaggaa cgacaaatgc 18060
tgctatagaa attactgaaa aatcaatttc atcaattaag ataaaaatac aagaccctaa 18120
taaagatata agtagaatag aaatgcttat aaatggtgaa agtgtaaaat ctgtaagtga 18180
tttaactact gaaaaaatat cctttgaagt accaccagat aaaattaaaa taggagagaa 18240
taagatacta tttagagctt attgtaaagg tgatgattta tatgcatctt tatttatttt 18300
taaagagagt actggaaatt ctataattaa agattcttat gttatgatag gtaatagaat 18360
gtacaaggta gttaatacaa catctaatga acaagatatt acaattacac tagatagagg 18420
acttgaagaa gatttaaatc ttggagaccc tatatatcaa ttaataaata aaactaaagt 18480
tcaagtaaaa ataaataaat ctgacttatt caaagacatg aaactagttg aaatcaaaaa 18540
atcagactca agttatcaag aaatctatga attagaagaa gccaacataa aaagtgctca 18600
gcctaaaatc atagtagaaa aaggagataa atggacagct ataaaacgtc catctatgat 18660
ttttagatat gatgctgaaa acaacgagcc acaagcttaa aatggaggtg taaaaattgt 18720
ttaaattcga taaaaataaa atagaacaaa tcaaacaagg tagaaaagta gaaatgcagt 18780
ataaagacat ttcagacata agtataggtc aagcaaagca agatgatgat ataacaaata 18840
attttatagc aaatgcagaa atatatgaga tgttgttaag tcaaagttct gtcaatgaag 18900
caagtaatat aagcactttt agtgtaagaa aatctggagg tgagagtgga atggtagaag 18960
tatatgtagc tttaatttta agaggcagaa aaacaataga agaagtacca gcagtaatta 19020
gagagcaagt tagaattaga tgtaaagaat tagaaatacc agttgaatag taaatttaga 19080
ataactatgt attagttatt ttttttatgt aaagtacaag gtcttaactt taataagtaa 19140
gccttgtact tattttttgt tatattagaa attgtatata tatttattat ttattcaatc 19200
tataaattaa acctacaatt taaagtacag aagattaaat tgataatcct gaaaatataa 19260
tattgcatga tgtaagaata taacaaaaat taaagctata agtataaaaa atttagacaa 19320
taggaggcta taatggataa attaataacc gaattgagta gtctgggggc aataggtata 19380
ctatgtgctc tattatttaa aaatactatg caggagaaaa aagaagatag agacatgtat 19440
aaaaaaactg tagaaaattt tatagaatta tctacacaac aacaagaaat aaacaaaaat 19500
atacttgttc aaatgggaat aatgaaaaca gatgtagagg aaattaagga agatgttact 19560
gatataaaag gtatgttaca aaacggtgta taacatgaaa gtagcagtag caccagatta 19620
tatattatta ggaaaagata aagtagtatt gtagatagtg ccctatttta ttgagaagga 19680
ttttatattt taaaatatta attaaaaaaa gtaataaaaa taatatataa aaataacata 19740
taaaaattca aaaaggagtt aagcttaaat ttgattagaa aaaatcaatt ttaagacaac 19800
tccttttttt tattaaatta ttgtctatta accaaaatag ctattttagc atctggatta 19860
taacttatct gaaccatttg atttttctta acatgttcaa ggtcttcacc accataagct 19920
atttgtaact taactggtaa cttaccttgt tttataatag caacgtactc ttttttacct 19980
ttttctctaa actaatcaaa ttgccaacat aaggtttaaa gttctgatac tttttactag 20040
aatttcttat gtagaagaaa gcaccaacag caataactaa atttatgcca agtgtaaccc 20100
aagaattgat tttaagcata gctccagcga ttattatcac gaacattaaa acgataggta 20160
atatagcttt cttaagaagc aatttaccca ttatttcatt agcctttttc tcagggccac 20220
tcatagtttt tgatctagca aatgattgcg cgaatttgtc tcttaagccc attttatcct 20280
cctaatttta ataaatattt agttataata acgagatatt acttgaaact aaaaatttac 20340
tacatttata ttatgtttga cttttgtata aataattaca ttcaagtaaa gcaaaatata 20400
ctaattattt tatcataaaa ttataaaaaa gaaaataaat gaaataaaaa tattagaaca 20460
aagaaatgat gtaaaatcgt atcaaaagca acataaaaat tatttatcta ttttctcatc 20520
tttatttttg ttatactcaa tttttcctaa atccttctct ttttcatatt catgaagttt 20580
taattcaatc ataccttcta ttttggcttt atcataatca tttaactttc taaagttgtt 20640
taaaagcttt atttcattag agtttatgct attaagtgga tagtttgagg aggaatcgca 20700
aattaaatct gatttatgtg atagattatc tccatttaat agccagtcta ctgaaacatt 20760
aaatatctca gctatagatt ttaatatttc ataatttggt tttctaatgt ttctctcaaa 20820
tttacttaag ttgtcacagc ctaacatttc ttctagttca tattgtttaa ggttttttgc 20880
ttttctcaaa taaacaattc tttctcctaa agtatccata aacactctcc attcaattaa 20940
tgtcaaaaag actttttaag atgtaaatag tttcaaatta aaggtcaaaa tgacataaaa 21000
accattgact taaggtcaaa atgactttat aattaactta atgatacgaa tttacatcct 21060
aattttagca caaagtaatc aaaaaatctt atttagtatt aaataaattt atatacttaa 21120
tatgtgtaca tattaaaaat atatactaaa tagagggggt gcgtaagcta aagtaatata 21180
aaagtaaata taaatcactt agaaaggaag ttgataaatg gatgctcgaa aaaaatggat 21240
accttttttg ggagtgcaag tcaagcaaag acttattgaa ttaaatatga ctcaaaggga 21300
attagcgaag aaaataggtg ttaatgaaaa ctatttgtca gctattttaa atggaagaag 21360
aacaggtaaa aaatataaat catcaattta tcaattactt aatatagaat attcagaaga 21420
tgattaataa atagtatata aagtaggtga atattcttgt gtgcaaattg gattcagatg 21480
gggttataga gtgttgtaga gcaattgatg attttattac agcacttagt aatataaaaa 21540
gcttaaatat ggaaagatta aatactttaa ctaaatattc tagtacatgt tcaatccttc 21600
ttaaagaggg gaattatgaa ggatgtacaa ttgtgtatag aaagatgttg gaagaattaa 21660
aaacatgagt aatgcatttc ttaggaatat aaattataca tagaaatgta ttatattttt 21720
caaagtactt aaactaaaat atggataaga taatctaaat attataaatg tgcttgaaat 21780
tagactatac ttgtttttaa ataatccaat atccatattt tagtaatata ctacaaaaaa 21840
agaaggttaa tagatgatgt aaaatcgtat caaattatgt atgtttaaac cattttatct 21900
tcattattat tagaggaatg cttttttaag tctttatatt cagatatctt aagttcaagt 21960
attccttcta tttttatttt atcacgttcg tttagttgtc tgtatagatt taatatcatc 22020
atttcatcat tagtaacatg taagtaatct tctttatctt cttttacact actattgaca 22080
tttaccttct ctttaccata gagaagccag tcagtcgtaa cattaaaata atcagctatt 22140
gacattagta tatcacaatt aggttttcta tctcctgttt catacttgcc taagttttca 22200
aattttaaaa tatccataag tttgcgctga gtaagttttt tggagtttct caaataagca 22260
attctttttc ctaaagtatc cacaaaatac actcctttct ttttatgagt aatgtctaaa 22320
tgacatttga aattaaaaat atataaattt ataatataaa actactaaat taaagtctaa 22380
atgacatttt gcttaaatta atatgctcat aatatgattt taacatatta tagttgaaaa 22440
tatatggttt attttgattt gtatatataa caatagattt aattgttata aaaatgtaaa 22500
ggggtgtatg aatagattgt ataaatttat ttcgataaac taagattgct ttttgattgt 22560
ctgtaaaaga gaaaaagatt aagataaaaa tagtattata ttgtaattta tattaatcaa 22620
ttacaaagat tttatgaatt tattctttag ggtaaaatat ttaagaataa gataaattta 22680
caatataata ctataacact cttttatcta gttttatttt ctttatagaa caataatatt 22740
ataaatgcta gtagatttac acagaatact gttatataca tctgtttgaa tcctgagttt 22800
agagtagatt gtagtgtgga tccgg 22825
<210> 2
<211> 65
<212> PRT
<213> Clostridium difficile
<400> 2
Met Phe Lys Asn Asn Leu Lys Tyr Tyr Arg Lys Cys Lys Gly Met Thr
1 5 10 15
Gln Ile Gln Leu Ala Arg Lys Ala Gly Ile Thr Asn Asp Tyr Ile Ser
20 25 30
Gln Ile Glu Arg Gly Ile Lys Asn Pro Gly Leu Leu Met Ala Lys Lys
35 40 45
Ile Ser Ser Ile Leu Glu Gln Asn Ile Glu Glu Val Phe Phe Ile Gln
50 55 60
Leu
65
<210> 3
<211> 146
<212> PRT
<213> Clostridium difficile
<400> 3
Met Glu Asn Lys Lys Asp Ile Leu Phe Lys Glu Thr Asp Glu Arg Leu
1 5 10 15
His Asn Tyr Lys Tyr Leu Asp Ile Lys Ile Lys Asn Ile Asn Leu Asp
20 25 30
Ile Lys Arg Cys Glu Asn Glu Tyr Ser Gly Cys Gly Ala Met Val Tyr
35 40 45
Thr Glu Lys Thr Ser Asn Thr Tyr Asn Ile Ser Ser Ser Val Glu Asn
50 55 60
Glu Val Leu Lys Arg Glu Glu Arg Leu Arg Lys Leu Lys Met Glu Lys
65 70 75 80
Glu Asp Ile Glu Ile Glu Lys Glu Lys Ile Glu Asn Ala Leu Thr Cys
85 90 95
Leu Asn Asp Ile Glu Met Glu Phe Phe Asn Leu Phe Tyr Asn Ser Lys
100 105 110
Thr Lys Asn Asn Met Thr Tyr Ile Ser Met Lys Leu His Leu Asp Arg
115 120 125
Thr Ser Cys Tyr Asn Leu Lys Lys Lys Met Ile Phe Lys Leu Ser Glu
130 135 140
Ile Leu
145
<210> 4
<211> 130
<212> PRT
<213> Clostridium difficile
<400> 4
Asn Phe Thr Glu Ser Ile Phe Ile Asp Asp Glu Ser Val Gln Gly Ser
1 5 10 15
Glu Gly Ser Cys Phe Phe Val Ser Ile Leu Ser Val Ile Cys Thr Pro
20 25 30
Ile Met Leu Asn Thr Asn Asn Lys Asp Ile Val Ile Ser Ile Lys Tyr
35 40 45
Leu Pro Lys Pro Gln Ser Lys Ser Ile Arg Met Tyr Glu Ile Ser Asp
50 55 60
Glu Leu Asn Lys Leu Phe Asn Arg Asn Ile Lys Val Thr Asp Arg Lys
65 70 75 80
Leu Asn Ile Thr Lys Leu Glu Gln Ser Ile Lys Lys Glu Glu Ser Ile
85 90 95
Tyr Val Leu Asn Phe Thr Ile Thr Leu Asn Tyr Leu Asp Ser Val Tyr
100 105 110
Glu Glu Asp Val Val Tyr Glu Asn Met Glu Glu Ile Asn Leu Asn Leu
115 120 125
Gly Glu
130
<210> 5
<211> 354
<212> PRT
<213> Clostridium difficile
<400> 5
Met Ala Ile Gly Leu Pro Ser Ile Asn Ile Ser Phe Lys Glu Leu Ala
1 5 10 15
Thr Thr Val Lys Glu Arg Ser Ala Arg Gly Ile Ile Ala Met Val Leu
20 25 30
Lys Asp Ala Lys Ala Leu Gly Leu Asn Glu Ile His Glu Lys Glu Asp
35 40 45
Ile Pro Val Asp Leu Ser Ala Glu Asn Lys Glu Tyr Ile Asn Leu Ala
50 55 60
Leu Met Gly Asn Val Asn Thr Pro Asn Lys Leu Leu Val Tyr Val Ile
65 70 75 80
Glu Gly Glu Ala Asp Ile Gln Thr Ala Leu Asp Phe Leu Glu Thr Lys
85 90 95
Glu Phe Asn Tyr Leu Cys Met Pro Lys Ala Val Glu Ala Asp Lys Thr
100 105 110
Ala Ile Lys Asn Trp Ile Ile Lys Leu Arg Asp Ile Asp Lys Val Lys
115 120 125
Val Lys Ala Val Leu Gly Lys Val Val Gly Asn His Glu Gly Ile Ile
130 135 140
Asn Phe Thr Thr Glu Asp Val Leu Val Gly Glu Lys Lys Tyr Ser Val
145 150 155 160
Asp Glu Phe Thr Ser Arg Val Ala Gly Leu Ile Ala Gly Thr Pro Leu
165 170 175
Ser Gln Ser Val Thr Tyr Thr Lys Leu Ser Asp Val Val Asp Ile Pro
180 185 190
Lys Met Thr Lys Val Asp Ala Glu Ser Arg Val Asn Lys Gly Glu Leu
195 200 205
Ile Leu Ile Lys Glu Ala Gly Ala Ile Arg Ile Ala Arg Gly Val Asn
210 215 220
Ser Leu Thr Glu Leu Thr Glu Glu Lys Gly Glu Met Phe Gln Lys Ile
225 230 235 240
Lys Ile Val Asp Thr Leu Asp Ile Ile His Ser Asp Ile Arg Lys Val
245 250 255
Ile Ile Asp Asp Tyr Ile Gly Lys Val Thr Asn Ser Tyr Asp Asn Lys
260 265 270
Cys Leu Leu Ile Val Ala Ile Lys Ser Tyr Leu Glu Glu Leu Glu Lys
275 280 285
Ser Ala Leu Ile Glu Ser Asp Ser Thr Val Glu Ile Asp Phe Glu Ala
290 295 300
Gln Lys Ser Tyr Leu Lys Ser Lys Gly Val Asp Leu Ser Tyr Met Thr
305 310 315 320
Leu Gln Glu Ile Lys Glu Ala Asn Thr Gly Ser Lys Val Phe Leu Lys
325 330 335
Ala Lys Ile Lys Val Leu Asp Ala Met Glu Asp Ile Asp Leu Ser Ile
340 345 350
Glu Ile
<210> 6
<211> 142
<212> PRT
<213> Clostridium difficile
<400> 6
Met Ala Asn Met Glu Ala Arg Asn Val Met Ser Gly Thr Trp Gly Glu
1 5 10 15
Leu Trp Leu Asp Gly Asn Lys Val Ala Glu Val Lys Lys Phe Gln Ala
20 25 30
Lys Met Glu Phe Thr Lys Glu Asp Ile Ile Ile Ala Gly Gln Met Gly
35 40 45
Thr Asp Thr Lys Tyr Met Gly Tyr Lys Gly Lys Gly Ser Ile Thr Leu
50 55 60
Tyr His Val Ser Ser Arg Met His Lys Leu Ile Gly Glu Lys Ile Lys
65 70 75 80
Arg Gly Ser Glu Pro Arg Phe Val Ala Ile Ser Lys Leu Asn Asp Pro
85 90 95
Asp Ser Tyr Gly Ala Glu Arg Ile Ala Val Lys Asn Ile Ala Phe Asp
100 105 110
Asp Leu Thr Leu Ala Asp Trp Glu Val Gly Val Lys Gly Glu Ile Glu
115 120 125
Ala Pro Phe Thr Phe Thr Glu Tyr Asp Phe Leu Asp Ile Ile
130 135 140
<210> 7
<211> 148
<212> PRT
<213> Clostridium difficile
<400> 7
Met Asn Glu Asn Gly Leu Ser Lys Asn Ile Asn Ile Val Asp Leu Leu
1 5 10 15
Leu Asn Ala Asp Thr Glu Asn Leu Glu Arg Pro Ser Thr Ile Val Glu
20 25 30
Leu Lys Arg Leu Ser Thr Ile Phe Gly Gln Glu Phe Lys Val Met Cys
35 40 45
Arg Ala Leu Thr Ile Ser Lys Asp Glu Glu Ile Gln Asn Thr Cys Leu
50 55 60
Lys Ile Asp Glu Asn Met Lys Thr Asp Ile Asp Leu Pro Glu Met Gln
65 70 75 80
Met Leu Thr Ile Ile Glu Gly Val Cys Asp Leu Asp Gly Lys Leu Leu
85 90 95
Phe Lys Asn Lys Glu Leu Met Asp Lys Phe Lys Ala Pro Thr Pro Lys
100 105 110
Glu Leu Ala Arg Lys Leu Leu Leu Pro Gly Glu Ile Thr Asn Leu Tyr
115 120 125
Arg Ile Leu Gln Asp Val Met Gly Tyr Gly Lys Asn Ala Val Ile Glu
130 135 140
Glu Val Lys Asn
145
<210> 8
<211> 55
<212> PRT
<213> Clostridium difficile
<400> 8
Met Tyr Tyr Tyr Trp Lys Lys Lys Gly Ile Arg Pro Ser Leu Phe Tyr
1 5 10 15
Ala Met Asp Lys Gly Glu Leu Lys Leu Ile Glu Ala Phe Phe Ala Leu
20 25 30
Glu Ile Glu Glu Glu Val Glu Lys Met Lys His Gly Tyr Gly Val Cys
35 40 45
Pro Leu Thr Gly Gly Gly Met
50 55
<210> 9
<211> 817
<212> PRT
<213> Clostridium difficile
<400> 9
Met Gly Asn Val Arg Glu Glu Gly Ile Asn Met Tyr Leu Thr Asp Asn
1 5 10 15
Tyr Thr Pro Lys Met Asn Gln Ile Ile Ser Val Thr Asp Asn Phe Arg
20 25 30
Arg Ala Thr Val Ala Val Ser Leu Ser Thr Asn Val Met Ala Ser Ser
35 40 45
Ile Lys Asn Ser Ile Gly Ser Ala Ser Ser Arg Val Asn Ser Leu Asn
50 55 60
Ser Ser Leu Arg Lys Val Gln Thr Thr Ala Ser Ser Val Ser Ser Thr
65 70 75 80
Met Ala Lys Leu Ser Ser Ser Ile Asn Ala Val Ser Gly Val Ile Gly
85 90 95
Ser Leu Asn Gly Ser Ile Met Arg Leu Ala Ile Thr Ile Ala Met Ile
100 105 110
Ile Asp Tyr Phe Asn Lys Leu Ile Gln Lys Lys Asn Glu Phe Asn Ser
115 120 125
Asn Ile Met Ile Ile Leu Ile Phe Lys Ala Lys Ser Asp Glu Val Glu
130 135 140
Lys Thr Lys Asn Lys Leu Leu Gly Asn Leu Lys Lys Ile Gly Gly Lys
145 150 155 160
Ile Trp Asn Ile Val Ile Lys Ala Lys Asp Met Thr Lys Arg Val Ile
165 170 175
Ser Ser Ile Leu Gly Lys Leu Lys Arg Val Glu Lys Arg Pro Tyr Gln
180 185 190
Gly Ser Ile Asn Leu Lys Asp Met Val Ser Ser Ala Met Ala Arg Ile
195 200 205
Leu Pro Lys Leu Met Leu Phe Lys Asn Thr Phe Trp Ser Gly Val Ile
210 215 220
Ala Ile Lys Asp Met Ala Ser Ser Ile Ile Ser Lys Val Phe Pro Lys
225 230 235 240
Leu Arg Leu Phe Ala Gly Lys Val Trp Ser Gly Ala Ile Ala Val Lys
245 250 255
Asp Met Ala Ser Gly Ile Leu Gly Ser Ile Lys Gly Lys Ile Ser Asp
260 265 270
Leu Thr Asn Gly Ala Thr Ile Gly Val Ala Val Lys Lys Gly Val Asp
275 280 285
Leu Leu Gly Gln Glu Gln Asn Gln Lys Val Val Leu Glu Ser Val Met
290 295 300
Lys Arg Asn Thr Gly Lys Thr Ser Gln Lys Asp Val Asp Lys Tyr Tyr
305 310 315 320
Asp Ser Leu Val Asn Met Ala Asn Asp Thr Pro Phe Asp Pro Glu Asp
325 330 335
Val Val Ala Met Gly Thr Lys Ala Lys Met Ile Ser Asn Ile Thr Gly
340 345 350
Gly Lys Lys Glu Lys Asp Ile Thr Gln Ala Met Val Asp Val Arg Ala
355 360 365
Leu Asn Met Asn Thr Ser Ser Glu Gln Asp Val Ser Ala Ala Phe Leu
370 375 380
Ser Ala Ala Lys Gly Asn Met Glu Ser Leu Asn Thr Leu Val Gly Glu
385 390 395 400
Asn Tyr Lys Thr Phe Asp Glu Ala Leu Glu Gly Ile Ser Val Lys Gln
405 410 415
Met Gly Leu Ala Lys Glu Met Ser Asn Thr Ile Pro Gly Ile Ile Ser
420 425 430
Gly Ala Gln Thr Ser Ile Asn Asn Gly Leu Lys Ser Ile Val Lys Pro
435 440 445
Phe Asp Asp Ile Leu Gly Gln Gly Leu Lys Lys Ile Lys Thr Phe Ile
450 455 460
Glu Ser Gly Leu Gly Asn Leu Ala Gly Leu Ser Glu Lys Met Ala Gly
465 470 475 480
Lys Ile Gly Asn Val Met Asn Gly Lys Ile Ile Ile Gly Asn Lys Tyr
485 490 495
Asp Gln Met Gln Ser Arg Ser Val Lys Asn Gly Lys Glu Phe Ser Asp
500 505 510
Ser Thr Gln Tyr Arg Ile Ser Asn Glu Ala Glu Lys Arg Lys Met Met
515 520 525
Val Glu Asn Lys Gln Glu Arg Phe Glu Asn His Ala Ala Thr Met Ile
530 535 540
Gly Asn Ala Pro Lys Ala Ile Val Asn Ala Gly Ser Thr Leu Leu Gln
545 550 555 560
Asn Ile Asp Phe Thr Ala Leu Ile Asp Ser Leu Leu Pro Val Val Asn
565 570 575
Leu Val Asn Asn Leu Leu Asp Ser Ile Asn Asn Lys Ser Pro Ile Ala
580 585 590
Gln Gly Leu Ile Ser Ile Phe Gly Thr Ile Val Thr Thr Ala Phe Gln
595 600 605
Leu Ile Gly Pro Val Val Glu Ala Val Ser Pro Ile Ile Thr Arg Ile
610 615 620
Phe Thr Phe Leu Gly Glu Tyr Ala Pro Gln Ile Asn Asn Phe Ile Glu
625 630 635 640
Thr Leu Gly Val Ile Trp Lys Thr Val Trp Glu Thr Leu Gly Pro Leu
645 650 655
Leu Glu Thr Gly Trp Lys Ile Ile Glu Pro Ile Leu Gly Ala Phe Phe
660 665 670
Asn Ile Leu Asp Lys Val Cys Lys Ile Val Lys Asp Ile Cys Lys Trp
675 680 685
Trp Gln Thr Met Ile Asn Lys Ile Lys Asn Gly Ser Ile Thr Gly Thr
690 695 700
Val Leu Asn Leu Val Glu Lys Ser Lys Lys Asn Tyr Lys Asp Asn Pro
705 710 715 720
Tyr Ala Gly Thr Lys Ala Gly Asp Ser Gly Lys Ala Tyr Ser Ser Lys
725 730 735
Lys Gly Asn Asn Ala Phe Gly Leu Asn Tyr Val Pro Tyr Asn Asp Tyr
740 745 750
Gln Thr Arg Leu His Glu Gly Glu Met Val Leu Thr Lys Gln Glu Ala
755 760 765
Asn Gln Tyr Arg Ser Arg Lys Asn Gly Gly Asn Ile Asn Ile Ala Lys
770 775 780
Leu Ala Asp Thr Ile Val Ile Arg Glu Glu Ala Asp Ile Glu Lys Ile
785 790 795 800
Thr Ser Lys Leu Val Ala Ser Ile Gln Leu Ala Gln Leu Gly Gly Val
805 810 815
Leu
<210> 10
<211> 140
<212> PRT
<213> Clostridium difficile
<400> 10
Met Glu Met Trp Leu Arg Gln Ala Glu Asp Arg Phe Arg Phe Pro Val
1 5 10 15
Phe Pro Ser Ser Phe Ser Ile Asn Gly Lys Ala Ala Val Asn Ser Ser
20 25 30
Ser Ile Leu Lys Ile Gly Glu Val Ala Thr Phe Gly Gly Val Ala Leu
35 40 45
Lys Ser Ile Ser Ile Ser Ser Phe Phe Pro Asn Lys Asp Tyr Thr Phe
50 55 60
Cys Asp Tyr Thr Gly Phe Pro Ser Pro Tyr Asp Cys Val Asn Lys Ile
65 70 75 80
Glu Lys Trp Met Lys Glu Gly Phe Ile Leu Arg Phe Thr Ile Thr Glu
85 90 95
Thr Asn Ile Asn Met Glu Val Ile Ile Glu Gly Phe Ser Tyr Glu Glu
100 105 110
Arg Asp Gly Thr Arg Asp Val Tyr Phe Thr Leu Asp Leu Lys Glu Tyr
115 120 125
Lys Arg Ile Lys Ile Pro Lys Val Thr Pro Lys Gln
130 135 140
<210> 11
<211> 509
<212> PRT
<213> Clostridium difficile
<400> 11
Met Ile Ile Asn Arg Ser Lys Asp Ser Ser Ser Asn Glu Ile Ser Phe
1 5 10 15
Val Ser Lys Asp Met Gly Phe Leu Leu Thr Gln Ser Glu Val Ser Tyr
20 25 30
Asn Phe Lys Asp Lys Leu Val Glu Asp Ile Ala Lys Gln Val Phe Ala
35 40 45
Glu Asn Arg Leu Ser Val Gly Thr Ile Ala Lys Thr Asn Val Lys Tyr
50 55 60
Thr Lys Met Phe Ile Gly Val Asn Gly Tyr Asp Thr Ile Met Ser Ala
65 70 75 80
Tyr Thr Glu Ala Ser Lys Lys Thr Lys Lys Lys Tyr Met Ile Glu Ala
85 90 95
Asn Leu Asp Lys Phe Asn Val Ile Glu Lys Gly Thr Val Thr Leu Ser
100 105 110
Val Met Phe Glu Glu Gly Phe Asn Ile Ile Asn Thr Thr Phe Ser Glu
115 120 125
Ser Met Glu Asn Val Lys Asn Lys Val Ile Val Val Asp Gln Tyr Gly
130 135 140
Ser Lys Ile Ser Glu Lys Ile Asp Asn Glu Ile Phe Lys Glu Val Asn
145 150 155 160
Val Ile Met Gln Lys Val Ile Gln Gln Gln Glu Asn Gln Asp Val Asp
165 170 175
Ile Asp Ser Glu Phe Asn Gly Ile Glu Lys Ser Cys Ser Leu Lys Gly
180 185 190
Tyr Gly Asp Val Ser Cys Ile Thr Gly Arg Gly Val Lys Val Lys Asp
195 200 205
Ser Tyr Thr Lys Leu Val Gly Leu Phe Tyr Ile Asp Thr Asp Lys His
210 215 220
Thr Trp Gln Asn Gly Glu Tyr Gln Ile Glu Leu Glu Leu Asn Phe Gln
225 230 235 240
Asn Leu Met Asp Glu Lys Ser Ala Gly Gln Asp Glu Pro Lys Glu Glu
245 250 255
Ser Asn Leu Gly Gly Glu Asp Tyr Ala Gly Gly Lys Glu Phe Thr Ala
260 265 270
Glu Phe Thr Ala Tyr Cys Pro Arg Lys Glu Glu Gly Gly Asp Thr Asp
275 280 285
Cys Arg Lys Lys Lys Leu Asp Pro Ser Lys Lys Thr Cys Ala Ala Pro
290 295 300
Met Val Gly Lys Tyr Glu Gln Thr Tyr Tyr Thr Lys Glu Phe Leu Asn
305 310 315 320
Lys His Pro Leu Leu Asn Tyr Gly Asp Glu Ile Gln Val Ile Thr Gly
325 330 335
Val Ser Gly Arg Asp Gly Val Tyr Lys Val Asn Asp Val Gly Pro Ala
340 345 350
Ile Thr Ile Glu Lys Asn Gly Thr Tyr His Ile Asp Ile Leu Phe Gly
355 360 365
Asn Val Glu Glu Ala Ser Lys Phe Gly Arg Arg Lys Gly Lys Ile Ile
370 375 380
Ile Gly Gly Tyr Ser Gly Asn Val Ser Asp Lys Ala Lys Ile Val Ile
385 390 395 400
Ser Glu Ala Lys Lys His Leu Gly Lys Pro Tyr Lys Trp Gly Gly Asn
405 410 415
Gly Pro Ser Ser Phe Asp Cys Ser Gly Leu Met Val Tyr Cys Phe Lys
420 425 430
Lys Val Asn Val Ser Leu Pro Arg Thr Ser Asn Gln Gln Ser Lys Lys
435 440 445
Gly Lys Lys Val Glu Gln Lys Asn Leu Gln Ala Gly Asp Leu Val Phe
450 455 460
Phe His Asn Pro Val Ser His Val Gly Leu Tyr Ile Gly Asn Gly Glu
465 470 475 480
Phe Leu His Ala Pro Gln Lys Gly Asp Val Val Lys Ile Ser Lys Leu
485 490 495
Ser Ser Arg Arg Asp Phe Asn Thr Ala Arg Arg Val Leu
500 505
<210> 12
<211> 108
<212> PRT
<213> Clostridium difficile
<400> 12
Met Ala Asn Pro Ile Asn Glu Phe Ile Gly Ile Ile Arg Glu Glu Gly
1 5 10 15
Lys Tyr His Asn Gln Pro Ser Phe Phe Ile Gly Lys Ile Lys Ser Lys
20 25 30
Leu Pro Asp Leu Lys Ile Glu Thr Asn Asn Ile Ile Leu Glu Lys Glu
35 40 45
Asp Ile Leu Ile Asp Ser Trp Met Ile Asp Arg Gln Leu Glu Thr Phe
50 55 60
Asp Thr Glu Thr Asn Gln Glu His Gln His Glu Val Lys Asn Pro Phe
65 70 75 80
Ile Asp Asn Phe Glu Ser Gly Asp Met Val Ile Met Phe Arg Ile Gly
85 90 95
Glu Lys Phe Ala Val Val Ser Lys Leu Val Ser Leu
100 105
<210> 13
<211> 142
<212> PRT
<213> Clostridium difficile
<400> 13
Met Ser Thr Ile Phe Pro Phe Ile Gly Val Pro Glu Asp Tyr Ile Leu
1 5 10 15
Pro Lys Thr Glu Glu Leu Pro Ile Phe Arg Glu Val Ala Trp Asp Phe
20 25 30
Glu Lys Asp Glu Pro Ile Leu Glu Lys Gly Asp Phe Lys Ile Ile Glu
35 40 45
Lys Lys Glu Ala Leu Lys Val Trp Ile Tyr Lys Cys Ile Lys Thr Asn
50 55 60
Arg Tyr Glu His Glu Ile Tyr Ser Leu Glu Tyr Gly Thr Glu Leu Ser
65 70 75 80
Glu Leu Ile Gly Gln Lys Tyr Thr Lys Gly Leu Thr Glu Ser Glu Ala
85 90 95
Ser Arg Phe Ile Lys Glu Ala Leu Leu Ile Asn Pro Tyr Ile Leu Glu
100 105 110
Val Asn Val Lys Ser Ala Asn Phe Asn Arg Asp Val Leu Ser Ala Asn
115 120 125
Val Lys Val Ser Thr Ile Tyr Gly Glu Val Glu Ile Asn Val
130 135 140
<210> 14
<211> 350
<212> PRT
<213> Clostridium difficile
<400> 14
Met Tyr Ser Asp Gln Thr Tyr Glu Val Ile Lys Asn Arg Thr Leu Glu
1 5 10 15
Asn Ile Asn Leu Asp Ile Tyr Lys Gly Glu Gly Ser Phe Leu Asn Asn
20 25 30
Met Val Ser Gly Asn Asn Leu Glu Leu Ser Lys Ile Tyr Leu Glu Leu
35 40 45
Ser Lys Ile His Lys Met Ala Phe Ile Gln Asp Thr Tyr Asn Gln Phe
50 55 60
Leu Asp Lys Arg Val Asn Glu Phe Gly Val Tyr Arg Lys Leu Gly Thr
65 70 75 80
Glu Ser Asn Gly Glu Val Glu Phe Ile Gly Glu Lys Gly Thr Val Ile
85 90 95
Asn Asn Gly Thr Ile Ile Ser Tyr Arg Asp Leu Leu Phe Val Val Ile
100 105 110
Lys Asp Val Thr Ile Gly Ser Glu Glu Gly Asp Asn Ser Pro Val Gln
115 120 125
Ala Leu Glu Val Gly Lys Lys Tyr Asn Leu Pro Thr Asn Cys Glu Phe
130 135 140
Lys Leu Val Asp Asn Ile Ser Gly Val Thr Lys Ile Thr Asn Thr Arg
145 150 155 160
Ser Phe Glu Gly Gly Thr Asp Ile Glu Thr Asp Glu Glu Leu Lys Glu
165 170 175
Arg Phe Tyr Lys Ile Gln Arg Asn Gln Ala Thr Ser Gly Asn Lys Ala
180 185 190
His Tyr Glu Glu Trp Ala Leu Glu Val Asp Gly Val Tyr Asn Val Lys
195 200 205
Val Tyr Pro Arg Trp Asp Gly Pro Gly Thr Val Lys Val Leu Ile Phe
210 215 220
Gly Glu Asn Asn Gln Ala Val Asp Thr Glu Thr Ile Glu Arg Cys Gln
225 230 235 240
Gln His Ile Asp Glu Glu Lys Pro Ile Gly Pro Thr Ile Thr Val Val
245 250 255
Thr Pro Leu Pro Ile Glu Ile Ser Ile Ser Ala Val Met Lys Leu Glu
260 265 270
Asp Gly Tyr Thr Leu Asp Asn Val Lys Glu Ser Phe Leu Glu Ser Ile
275 280 285
Asn Thr Tyr Phe Arg Asp Ile Arg Gly Glu Ile Ile Tyr Thr Lys Val
290 295 300
Met Gly Ile Leu Ile Asn Thr Thr Gly Val His Asp Leu Ser Asn Leu
305 310 315 320
Leu Ile Asn Gly Ser Thr Asp Asn Ile Thr Ile Asn Glu Asp Lys Ile
325 330 335
Pro Ser Val Thr Thr Val Asn Phe Ser Glu Val Glu Asn Gln
340 345 350
<210> 15
<211> 232
<212> PRT
<213> Clostridium difficile
<400> 15
Met Lys Leu Ile Asp Lys Leu Pro Ser Phe Asp Arg Asn Tyr Ile Val
1 5 10 15
Glu Glu Ile Gln Gly Ala Tyr Asp Thr Glu Leu Asn Ile Leu Lys Glu
20 25 30
Asp Ile Asp Asp Thr Phe Asn Gln Leu Phe Val Asp Thr Ala Thr Trp
35 40 45
Gly Leu Asp Met Trp Glu Asp Ile Leu Cys Ile Glu Lys Lys Glu Leu
50 55 60
Asp Phe Asp Thr Arg Arg Ser Asn Ile Lys Ala Lys Met Arg Ser Arg
65 70 75 80
Gly Thr Ser Thr Ile Glu Val Ile Lys Ser Ile Cys Glu Ala Tyr Thr
85 90 95
Lys Ser Glu Thr Asp Ile Lys Val Tyr Ser Asp Glu Phe Thr Phe Val
100 105 110
Leu Ser Phe Ile Ala Asn Asn Cys Asp Tyr Lys Thr Leu Leu Asp Cys
115 120 125
Ser Glu Met Ile Glu Arg Val Lys Pro Ala His Leu Leu His Tyr Leu
130 135 140
Glu Pro Ile Ile Leu Asp Lys Ser Met Val Tyr Cys Gly Gly Gly Met
145 150 155 160
Val Cys Ser Glu Glu Val Lys Val His Pro Tyr Phe Glu Pro Ile Ile
165 170 175
Lys Cys Ser Ala Val Val Asn Cys Gly Ala Gly Met Leu Ser Arg Glu
180 185 190
Glu Ile Lys Val Tyr Pro Leu Ser Ile Lys Cys Ile Glu Asn Asn Cys
195 200 205
Lys Ile Asn Ile Ala Ile Ala Asn Asp Thr Gly Val Glu Asn Val Val
210 215 220
Val Tyr Pro Lys Ser Glu Val Val
225 230
<210> 16
<211> 328
<212> PRT
<213> Clostridium difficile
<400> 16
Met Glu Glu Lys Phe Tyr Ile Ile Leu Thr Lys Ile Gly Arg Glu Lys
1 5 10 15
Ile Ala Asn Ala Thr Ala Leu Gly Glu Leu Val Gly Leu Thr Lys Phe
20 25 30
Gln Val Gly Asp Ser Asn Gly Glu Tyr Tyr Glu Pro Thr Glu Glu Gln
35 40 45
Thr Ala Leu Lys Asn Val Val Trp Glu Gly Asn Ile Asn Ser Leu Arg
50 55 60
Ile Asp Glu Lys Asn Pro Asn Trp Ile Val Ile Glu Thr Ile Leu Pro
65 70 75 80
Gly Thr Val Gly Gly Phe Met Ile Arg Glu Ala Ala Val Leu Asp Asn
85 90 95
Glu Asn Asn Ile Ile Ala Ile Gly Lys Tyr Pro Glu Thr Tyr Lys Pro
100 105 110
Arg Ala Glu Asp Gly Ser Ile Lys Asp Leu Val Val Lys Met Ile Leu
115 120 125
Gln Leu Ser Asn Thr Ser Asn Val Thr Leu Glu Val Asp Pro Thr Leu
130 135 140
Val Phe Val Thr Gln Lys Asp Ile Gln Asp Leu Asp Asp Lys Phe Asp
145 150 155 160
Lys Asn Ile Lys Glu Ile Lys Val Lys Ile Gly Asp Thr Asp Ile Leu
165 170 175
Thr Thr Asp Ser Lys Asp Leu Ser Gly Ala Ile Asn Glu Val Val Lys
180 185 190
Lys Ile Glu Asn Ile Ser Phe Asp Asp Val Ile Ser Gly Gln Ile Gln
195 200 205
Thr Asp Ile Ser Val Leu Lys Asn Ser Tyr Asn Lys Leu Ser Glu Lys
210 215 220
Val Leu Asp Ile Leu Ile Tyr Leu Glu Leu Glu Ser Glu Val Thr Val
225 230 235 240
Asp Glu Ala Gly Tyr Trp Tyr Asp Thr Leu Ala Asn Gly Asn Asn Ile
245 250 255
Val Ala Ile Glu Gly Leu Lys Leu Asp Leu Asn Arg Lys Cys Ile Thr
260 265 270
Gly Glu Ile Gly Asn Val Ile Phe Arg Asp Val Val Leu Pro Phe Ser
275 280 285
Ala Asn Arg Val Arg Tyr Ile His Asp Met Asp Asn Asn Phe Val Glu
290 295 300
Thr Lys Ser Ser Asn Thr Tyr Leu Lys Glu Gln Lys Asp Ile Thr Leu
305 310 315 320
Ser Lys Tyr Ser Tyr Glu Ile Arg
325
<210> 17
<211> 1725
<212> PRT
<213> Clostridium difficile
<400> 17
Met Lys Gln Asn Lys Leu Leu Gln Arg Gly Ala Tyr Phe Asn Asp Lys
1 5 10 15
Asn Ile Leu Ile Asp Asp Phe Asp Lys Arg Tyr Asn Asp Tyr Asp Phe
20 25 30
Val Glu Phe Phe Thr Gly Ile Ser Asn Ser Thr Phe Gly Leu Lys Ser
35 40 45
Asp Gly Asn Leu Tyr Ala Cys Gly Asp Asn Thr Gly Phe Gln Leu Gly
50 55 60
Leu Gly Lys Asp Ser Ser Glu Arg Arg Met Phe Ser Lys Val Lys Ile
65 70 75 80
Asp Asn Val Lys Tyr Val Ser Cys Gly Ser Lys His Ser Val Ala Val
85 90 95
Thr Lys Asp Gly Phe Ala Tyr Gly Ala Gly Thr Ser Asn Val Gly Gln
100 105 110
Leu Gly Val Ile Glu Ser Thr Val Tyr Tyr Glu Phe Thr Lys Leu Pro
115 120 125
Ile Asp Asp Val Lys Thr Val Ala Cys Gly Tyr Asp Phe Thr Phe Val
130 135 140
Leu Lys Asn Asp Gly Thr Leu Tyr Ser Ala Gly Leu Asn Ser Ser Gly
145 150 155 160
Gln Leu Gly Leu Gly Asp Thr Asn Asn Arg Ala Thr Phe Thr Lys Val
165 170 175
Asn Ile Asp Ser Val Lys Asp Val Val Thr Tyr Asn Gln Ser Val Phe
180 185 190
Ile Ile Lys Met Asp Gly Thr Ala His Ala Cys Gly Leu Asn Ser Asn
195 200 205
Gly Gln Leu Gly Ile Asn Ser Thr Leu Asn Lys Ser Val Phe Asn Lys
210 215 220
Ile Glu Gly Met Asp Asn Val Lys Gln Ile Ala Cys Gly Ser Ser His
225 230 235 240
Thr Ile Leu Ile Lys Asn Asp Gly Thr Met Tyr Thr Thr Gly Tyr Asn
245 250 255
Gly Val Gly Gln Leu Gly Thr Gly Asn Asn Asn Asn Ser Ile Val Phe
260 265 270
Thr Leu Ser Ser Ile Asn Asn Val Lys Tyr Ala Ser Cys Gly Asn Asn
275 280 285
His Thr Met Ile Leu Lys Tyr Asp Asn Thr Leu Phe Ser Thr Gly Gln
290 295 300
Asn Asn Tyr Gly Gln Leu Ala Asn Ala Asn Lys Asp Val Ala Ser Arg
305 310 315 320
Asn Thr Phe Ala Lys Val Asn Val Glu Asn Ile Lys Asp Ile Lys Cys
325 330 335
Gly Ser Gln Phe Asn Phe Leu Ile Asn Gly Ser Lys Glu Ile Phe Val
340 345 350
Ser Gly Cys Asn Leu Ala Gly Gln Leu Gly Ser Phe Phe His Thr Thr
355 360 365
Phe Leu Tyr Glu Phe Ser Asn Val Gln Ser Ser Asn Leu Asp Asn Tyr
370 375 380
Ser Gly Leu Leu Val Asn Asp Asp Tyr Leu Tyr Val Thr Lys Asp Asn
385 390 395 400
Ser Glu Phe Leu Asn Val Lys Leu Ser Asp Asn Phe Gln Asp Tyr Lys
405 410 415
Lys Ile Glu Leu Thr Asp Ser Asn Met Phe Ile Val Met Asn Asp Gly
420 425 430
Thr Leu Tyr Ala Cys Gly Leu Asn Asn Tyr Gly Gln Leu Gly Leu Gly
435 440 445
Asp Thr Val Asn Arg Ser Val Met Thr Lys Val Asp Ile Asp Asn Val
450 455 460
Leu Asp Ile Lys Gly Asn Gly Asn Ser Thr Phe Val Leu Lys Asn Asn
465 470 475 480
Gly Thr Leu Tyr Ser Cys Gly Leu Asn Ser Asn Gly Gln Leu Gly Leu
485 490 495
Arg Asp Glu Val Asn Arg Asn Ile Phe Thr Lys Ile Glu Ile Glu Asn
500 505 510
Val Lys Asp Phe Cys Val Gly Ser Asn Tyr Val Ile Ala Leu Asn His
515 520 525
Ser Lys Glu Val Tyr Gly Trp Gly Asn Asn Pro Tyr Asn Asn Ile Glu
530 535 540
Lys Thr Ser Asn Tyr Pro Tyr Lys Gln Gly Ile Ser Asn Ile Glu Lys
545 550 555 560
Ile Ala Ala Tyr Asp Tyr Ser Val Tyr Met Ile Asn Ser Glu Gly Lys
565 570 575
Leu Tyr Val Ser Gly Tyr Asn Tyr Asn Tyr Gln Leu Gly Lys Gly Asn
580 585 590
Asn Ser Asn Gln Ser Lys Ala Leu Val Ser Gln Cys Arg Thr Asn Ser
595 600 605
Thr Ser Ser Thr Ser Asn Gly Leu Arg Thr Leu Pro Lys Ile Thr Asn
610 615 620
Val Phe Pro Phe Tyr Asp Gly Cys Ala Ile Ile Asp Glu Gly Gly Tyr
625 630 635 640
Val Tyr Leu Thr Gly Tyr His Gly Tyr Leu Arg Thr Leu Asn Ser Ser
645 650 655
Pro Ser Ile Ser Asp Tyr Ser Arg Tyr Gly Thr Phe Ile Glu Ala Thr
660 665 670
Asn Ser Asn His Asn Thr Tyr Phe Ile Gln Glu Thr Asp Phe Ser Gly
675 680 685
Ile Glu Lys Val Ile Gly Met Ser Asn Asn Ile Leu Phe Phe Lys Lys
690 695 700
Gly Ser Ser Tyr Ile Thr Gly Tyr Pro Lys Thr Phe Gly Ser Thr Ile
705 710 715 720
Thr Gly His Arg Ser Tyr Thr Ser Ile Asn Ser Glu Ser Ser Asn Leu
725 730 735
Gly Ser Asn Phe Ile Ile Tyr His Ser Asn Ser Lys Leu Tyr Gly Lys
740 745 750
Gly Ile Ala Asn Ser Gly Gln Phe Gly Asn Ser Thr Asn Ile Asp Gly
755 760 765
Thr Ser Asn Tyr Asp Thr Gly Leu Lys Asp Ile Lys Asp Ile Ile Val
770 775 780
Lys Gly Asn Thr Val Val Val Val Asp Lys Asn Asn Asn Ile Tyr Val
785 790 795 800
Thr Gly Met Asn Gln Asn Asn Lys Leu Gly Ile Gly Glu Tyr Asn Asn
805 810 815
Glu Pro Val Lys Lys Phe Thr Asn Ile Thr Glu Gln Ser Asn Ser Phe
820 825 830
Ile Phe Met Asp Asp Ile Lys Glu Ile Thr Thr Ser Arg Asn Thr Met
835 840 845
Phe Ile Val Lys Asn Asp Gly Thr Ala Tyr Ala Thr Gly Asn Asn Ser
850 855 860
Ser Gly Gln Leu Gly Leu Gly Asp Thr Ile Asn Arg Asn Lys Phe Thr
865 870 875 880
Gln Ile Asn Leu Asp Asn Ile Lys Lys Ile Ser Thr Ser Ile Asp Gly
885 890 895
Asn Thr Thr Phe Ala Ile Arg Asn Asp Gly Thr Leu Tyr Ser Thr Gly
900 905 910
Leu Asn Thr Lys Gly Gln Leu Gly Leu Gly Asp Ile Val Asn Arg Asn
915 920 925
Thr Phe Thr Lys Val Asn Ile Gln Asn Val Arg Asp Val Val Leu Gly
930 935 940
Thr Thr His Ser His Ala Ile Lys Asp Asp Asn Thr Leu Tyr Ser Cys
945 950 955 960
Gly Glu Asn Thr His Gly Gln Leu Gly Leu Gly Ser Glu Ser Asn His
965 970 975
Pro Asp Val Leu Thr Phe Thr Val Asn Asn Ile Thr Asn Val Arg Asp
980 985 990
Val Tyr Cys Ser Asp Thr Thr Thr Phe Ile Val Lys Asp Thr Asn Ile
995 1000 1005
Ala Tyr Cys Cys Gly Tyr Asn Asn Asn Ser Gln Leu Gly Met Gly
1010 1015 1020
Asn Thr Thr Asp Gln Tyr Ser Phe Ile Lys Cys Met Glu Asn Val
1025 1030 1035
Lys Glu Val Ile Pro Asn Glu Ile Asn Thr Tyr Ile Ile Thr Ile
1040 1045 1050
Tyr Asn Thr Ala Tyr Ser Thr Gly Leu Asn Thr Asp Tyr Cys Leu
1055 1060 1065
Gly Leu Asn Ser Asn Ser Asn Gln Ser Ser Phe Ser Glu Ile Pro
1070 1075 1080
Ile Ser Asn Val Val Lys Val Ala Pro Asn Arg Asn Asn Ala Val
1085 1090 1095
Leu Leu Leu Thr Ser Glu Gly Asp Val Tyr Thr Ala Gly Lys Cys
1100 1105 1110
Ser Asn Gly Ser Gly Thr Gly Ser Glu Thr Pro Glu Lys Ile Lys
1115 1120 1125
Lys Ile Ala Ser Lys Ala Lys Asp Ile Gly Met Asn Tyr Arg Cys
1130 1135 1140
Gly His Tyr Val Ser Asp Asn Gly Asp Leu Tyr Gly Thr Gly Phe
1145 1150 1155
Asn Asn Asn Gly Gln Leu Gly Val Gly Asp Val Thr Lys Arg Asp
1160 1165 1170
Thr Phe Ile Lys Thr Asn Thr Arg Val Lys Lys Ile Leu Pro Leu
1175 1180 1185
Glu Tyr Ala Asn Ile Ala Ile Lys Asp Thr Asn Asp Ile Tyr Ile
1190 1195 1200
Cys Gly Leu Asn Asn Tyr Gly Gln Leu Gly Val Gly Asn Arg Tyr
1205 1210 1215
Asp Ser Arg Asn Asn Asp Asn Arg Ile Phe Asn Tyr Lys His Met
1220 1225 1230
Asn Phe Val Met Gly Asp Leu Thr Ser Ile Lys Asn Arg His Asn
1235 1240 1245
Phe Ile Leu Leu Asn Asn Lys Ile Val Ile Pro Thr Thr Lys Asp
1250 1255 1260
Ile Asp Tyr Gly Leu Val Leu Gly Asn Leu Tyr Lys Gly Asp Leu
1265 1270 1275
Tyr Thr Glu Leu Pro Tyr Glu Asp Ile Lys Glu Val Ser Ile Ser
1280 1285 1290
Lys Thr His Ile Ile Ile Leu Leu Asn Asp Gly Thr Met Tyr Gly
1295 1300 1305
Cys Gly Thr Asn Tyr His Gly Glu Leu Leu Gln Asp Leu Ser Ile
1310 1315 1320
Asn Gln Val Asp Glu Phe Val Gln Ile Asn Val Ser Asp Val Lys
1325 1330 1335
His Val Ser Cys Gly Asp Asn Phe Thr Tyr Phe Ile Lys Ser Asp
1340 1345 1350
Asp Ser Leu Trp Ser Ile Gly Lys Asn Ser Glu Tyr Gln Leu Gly
1355 1360 1365
Ile Gly His Asn Asn Pro Val Thr Glu Leu Gln Arg Ile Thr Thr
1370 1375 1380
Ile Ser Ser Cys Lys Glu Val His Cys Gly Lys Asn Tyr Thr Leu
1385 1390 1395
Val Val Thr Thr Gly Asn Glu Leu Phe Val Gln Gly Tyr Asn Asp
1400 1405 1410
Lys Gly Ala Leu Gly Leu Gly Ser Asp Ser Glu Asn Thr Ile Ile
1415 1420 1425
Lys Phe Phe Thr Lys Ala Leu Thr Asp Ile Arg Glu Ile Lys Ser
1430 1435 1440
Tyr Gly Ser Asp His Ile Leu Val Leu Lys Asn Asp Asn Ser Val
1445 1450 1455
Trp Val Thr Gly Lys Asn Arg Asp Val Tyr Lys Ile Glu Gln Pro
1460 1465 1470
Val Glu Phe Leu Lys Glu Phe Thr Ile Val Pro Ile Ser Glu Asp
1475 1480 1485
Val Asn Thr Val Lys Asp Val Leu Ala Thr Asp Asn Thr Leu Tyr
1490 1495 1500
Ile Ile Ser Glu Val Gly Thr Thr Asn Ala Ala Ile Glu Ile Thr
1505 1510 1515
Glu Lys Ser Ile Ser Ser Ile Lys Ile Lys Ile Gln Asp Pro Asn
1520 1525 1530
Lys Asp Ile Ser Arg Ile Glu Met Leu Ile Asn Gly Glu Ser Val
1535 1540 1545
Lys Ser Val Ser Asp Leu Thr Thr Glu Lys Ile Ser Phe Glu Val
1550 1555 1560
Pro Pro Asp Lys Ile Lys Ile Gly Glu Asn Lys Ile Leu Phe Arg
1565 1570 1575
Ala Tyr Cys Lys Gly Asp Asp Leu Tyr Ala Ser Leu Phe Ile Phe
1580 1585 1590
Lys Glu Ser Thr Gly Asn Ser Ile Ile Lys Asp Ser Tyr Val Met
1595 1600 1605
Ile Gly Asn Arg Met Tyr Lys Val Val Asn Thr Thr Ser Asn Glu
1610 1615 1620
Gln Asp Ile Thr Ile Thr Leu Asp Arg Gly Leu Glu Glu Asp Leu
1625 1630 1635
Asn Leu Gly Asp Pro Ile Tyr Gln Leu Ile Asn Lys Thr Lys Val
1640 1645 1650
Gln Val Lys Ile Asn Lys Ser Asp Leu Phe Lys Asp Met Lys Leu
1655 1660 1665
Val Glu Ile Lys Lys Ser Asp Ser Ser Tyr Gln Glu Ile Tyr Glu
1670 1675 1680
Leu Glu Glu Ala Asn Ile Lys Ser Ala Gln Pro Lys Ile Ile Val
1685 1690 1695
Glu Lys Gly Asp Lys Trp Thr Ala Ile Lys Arg Pro Ser Met Ile
1700 1705 1710
Phe Arg Tyr Asp Ala Glu Asn Asn Glu Pro Gln Ala
1715 1720 1725
<210> 18
<211> 98
<212> PRT
<213> Clostridium difficile
<400> 18
Met Gln Tyr Lys Asp Ile Ser Asp Ile Ser Ile Gly Gln Ala Lys Gln
1 5 10 15
Asp Asp Asp Ile Thr Asn Asn Phe Ile Ala Asn Ala Glu Ile Tyr Glu
20 25 30
Met Leu Leu Ser Gln Ser Ser Val Asn Glu Ala Ser Asn Ile Ser Thr
35 40 45
Phe Ser Val Arg Lys Ser Gly Gly Glu Ser Gly Met Val Glu Val Tyr
50 55 60
Val Ala Leu Ile Leu Arg Gly Arg Lys Thr Ile Glu Glu Val Pro Ala
65 70 75 80
Val Ile Arg Glu Gln Val Arg Ile Arg Cys Lys Glu Leu Glu Ile Pro
85 90 95
Val Glu
<210> 19
<211> 86
<212> PRT
<213> Clostridium difficile
<400> 19
Met Asp Lys Leu Ile Thr Glu Leu Ser Ser Leu Gly Ala Ile Gly Ile
1 5 10 15
Leu Cys Ala Leu Leu Phe Lys Asn Thr Met Gln Glu Lys Lys Glu Asp
20 25 30
Arg Asp Met Tyr Lys Lys Thr Val Glu Asn Phe Ile Glu Leu Ser Thr
35 40 45
Gln Gln Gln Glu Ile Asn Lys Asn Ile Leu Val Gln Met Gly Ile Met
50 55 60
Lys Thr Asp Val Glu Glu Ile Lys Glu Asp Val Thr Asp Ile Lys Gly
65 70 75 80
Met Leu Gln Asn Gly Val
85
<210> 20
<211> 151
<212> PRT
<213> Clostridium difficile
<400> 20
Met Gly Leu Arg Asp Lys Phe Ala Gln Ser Phe Ala Arg Ser Lys Thr
1 5 10 15
Met Ser Gly Pro Glu Lys Lys Ala Asn Glu Ile Met Gly Lys Leu Leu
20 25 30
Leu Lys Lys Ala Ile Leu Pro Ile Val Leu Met Phe Val Ile Ile Ile
35 40 45
Ala Gly Ala Met Leu Lys Ile Asn Ser Trp Val Thr Leu Gly Ile Asn
50 55 60
Leu Val Ile Ala Val Gly Ala Phe Phe Tyr Ile Arg Asn Ser Ser Lys
65 70 75 80
Lys Tyr Gln Asn Phe Lys Pro Tyr Val Gly Asn Leu Ile Ser Leu Glu
85 90 95
Lys Lys Gly Lys Lys Glu Tyr Val Ala Ile Ile Lys Gln Gly Lys Leu
100 105 110
Pro Val Lys Leu Gln Ile Ala Tyr Gly Gly Glu Asp Leu Glu His Val
115 120 125
Lys Lys Asn Gln Met Val Gln Ile Ser Tyr Asn Pro Asp Ala Lys Ile
130 135 140
Ala Ile Leu Val Asn Arg Gln
145 150
<210> 21
<211> 139
<212> PRT
<213> Clostridium difficile
<400> 21
Met Asp Thr Leu Gly Glu Arg Ile Val Tyr Leu Arg Lys Ala Lys Asn
1 5 10 15
Leu Lys Gln Tyr Glu Leu Glu Glu Met Leu Gly Cys Asp Asn Leu Ser
20 25 30
Lys Phe Glu Arg Asn Ile Arg Lys Pro Asn Tyr Glu Ile Leu Lys Ser
35 40 45
Ile Ala Glu Ile Phe Asn Val Ser Val Asp Trp Leu Leu Asn Gly Asp
50 55 60
Asn Leu Ser His Lys Ser Asp Leu Ile Cys Asp Ser Ser Ser Asn Tyr
65 70 75 80
Pro Leu Asn Ser Ile Asn Ser Asn Glu Ile Lys Leu Leu Asn Asn Phe
85 90 95
Arg Lys Leu Asn Asp Tyr Asp Lys Ala Lys Ile Glu Gly Met Ile Glu
100 105 110
Leu Lys Leu His Glu Tyr Glu Lys Glu Lys Asp Leu Gly Lys Ile Glu
115 120 125
Tyr Asn Lys Asn Lys Asp Glu Lys Ile Asp Lys
130 135
<210> 22
<211> 69
<212> PRT
<213> Clostridium difficile
<400> 22
Met Asp Ala Arg Lys Lys Trp Ile Pro Phe Leu Gly Val Gln Val Lys
1 5 10 15
Gln Arg Leu Ile Glu Leu Asn Met Thr Gln Arg Glu Leu Ala Lys Lys
20 25 30
Ile Gly Val Asn Glu Asn Tyr Leu Ser Ala Ile Leu Asn Gly Arg Arg
35 40 45
Thr Gly Lys Lys Tyr Lys Ser Ser Ile Tyr Gln Leu Leu Asn Ile Glu
50 55 60
Tyr Ser Glu Asp Asp
65
<210> 23
<211> 132
<212> PRT
<213> Clostridium difficile
<400> 23
Val Asp Thr Leu Gly Lys Arg Ile Ala Tyr Leu Arg Asn Ser Lys Lys
1 5 10 15
Leu Thr Gln Arg Lys Leu Met Asp Ile Leu Lys Phe Glu Asn Leu Gly
20 25 30
Lys Tyr Glu Thr Gly Asp Arg Lys Pro Asn Cys Asp Ile Leu Met Ser
35 40 45
Ile Ala Asp Tyr Phe Asn Val Thr Thr Asp Trp Leu Leu Tyr Gly Lys
50 55 60
Glu Lys Val Asn Val Asn Ser Ser Val Lys Glu Asp Lys Glu Asp Tyr
65 70 75 80
Leu His Val Thr Asn Asp Glu Met Met Ile Leu Asn Leu Tyr Arg Gln
85 90 95
Leu Asn Glu Arg Asp Lys Ile Lys Ile Glu Gly Ile Leu Glu Leu Lys
100 105 110
Ile Ser Glu Tyr Lys Asp Leu Lys Lys His Ser Ser Asn Asn Asn Glu
115 120 125
Asp Lys Met Val
130
<210> 24
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 24
tttcttgaag accatcgaag caccaccacc accaccactg 40
<210> 25
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 25
ttttttgaag acaatcgaag ggcttcgccc tgtcgctcga c 41
<210> 26
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 26
ttccttgaag acctaatttg gggcaatccc gcaaggag 38
<210> 27
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 27
ccccttgaag acccaatttc gtatggcaat gaaagacgg 39
<210> 28
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 28
aattgcggcc gcagctcgct agcggtacct cgaggatatc ttcgaagaag acacatccg 59
<210> 29
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 29
aattccggga tgcatgcctc taggatccgg cgcgcc 36
<210> 30
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 30
agctggcgcg ccggatccta gaggcatgca tcccggaatt cggatgtgtc ttctt 55
<210> 31
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 31
cgaagatatc ctcgaggtac cgctagcgag ctgcggccgc 40
<210> 32
<211> 8119
<212> DNA
<213> Clostridium difficile
<400> 32
ggccgcaata cccactacac cttcgtcatc tttaaattta agagttttta ctattgaata 60
ataaaggtat attccagtaa aaataatctt taaatacaag aaaaataaac tctttgggta 120
tattaaaaag ctaaaaagtg taaatataaa agcaagtaga gtacttatcc tgtaaaagaa 180
atctatttgt gtaatgtctt tatattttat cataaacacc gaatataaaa tgatgaaaat 240
aattgcgacg attgcatata tggtaaataa catattttca agagtaccat ttgaaattac 300
tatccactta taccacataa ttggccaaaa taatagtgct aagaacttaa aataattatc 360
aaacaacttt tctttataca ttcatcaaac aacctttctt aacaaaagca tatatttgtt 420
tttagaattt taaataatat gatatcatta ttatatatta atattgaatt tatagaaacc 480
aaaatttgtt aaaataaata tatagatttt actgttaagc cagttaaaat tactactatt 540
tttattatga aattggatca aatatgtaga aatacggcaa attagttaat attaaatatt 600
tattatttcc aagttgtaaa gactgttttt ttaatgataa aaattctaat cttttttgaa 660
agaaagtaat atccacatta agtatgtctg ccatttcata aacgcaagtg atgccagaat 720
taattatgtt tattatatct tcttcagtaa ttaagaactc acaagcccat tttaaggctt 780
tattttcgca cttatctata ataatttttg tataataatc gttataagag gatacatagt 840
atccaaggct agtgaaatga tgtccaagtt cttcagctaa gatggatgtc aatttttttg 900
agttttgttt taaattactg agtaatgata taattttaat accatgtttg tttatatata 960
gcccttctaa atcacctgca atataagtgg tataatgaat tattatctct tcttgagaag 1020
ctaattcaaa aagcttatcc aaattattca taaaaatccc cctaaaatag aatgtatgtt 1080
tgcctttaaa ttatattaaa agagcagaaa aatagactgc tcatcatatg gtttattttt 1140
ttttatattt atttagtaaa aattctatat aatcattaag ttgttcttgt gcttcttcag 1200
gtaactcttc atgtggattt tttctatgtg cagctactgt atcaatattt tccttaacta 1260
aggttcttcc aagaaggtaa tcaactgata cattaaatac atcagccaat ttgtttaaaa 1320
tgtgttcatc aggaaatctg ttttctgttt catagtaccc taagactctt tgggaaacgc 1380
ctactttttc tccaagttct ctttgagtca atccaaattc ctttctaagt tctcttaatc 1440
ttttggcaaa cattataaca ccaccttatg tatagattat aacaaattgt tctaaaaaat 1500
aaaactaata aaatataaaa gaatattttt tctaaaatct attgataaag aacaaatgat 1560
tctatataat ctaagtgtgg aagaacaaaa tattcttaat ggtaatggag gtataaaaca 1620
atgtttaaaa ataacttgaa atattataga aaatgcaaag gtatgacaca aattcaactt 1680
gccagaaagg ctggaattac aaatgactat atatctcaaa tagaaagagg tataaaaaat 1740
cctggtcttc ttatggctaa gaagatttct agtattttag aacaaaatat agaagaagtt 1800
ttttttatac agttatagaa caatatgttc ttgaaagttg tgagattagt aaaaaactgt 1860
gcactaaaga gattattgta aatttgaagc taataataag tatataaaaa aggagaagta 1920
ctatggaaaa caaaaaagat atattattta aagaaacaga tgaaagatta cataattata 1980
agtatttgga tataaagata aagaatatta atttggacat aaaaagatgt gagaatgaat 2040
actctggatg tggagcaatg gtatatacag aaaagactag taacacatat aacataagtt 2100
cttctgtgga aaatgaggtg ttaaaaagag aggaaagatt aagaaaatta aaaatggaaa 2160
aagaagatat agaaatagaa aaagagaaga tagaaaatgc tctaacatgt ctaaatgata 2220
tagaaatgga attttttaat cttttttata atagtaagac aaaaaacaat atgacatata 2280
tttctatgaa actacactta gatagaacat cttgctacaa tttaaagaaa aaaatgatat 2340
ttaaattgag tgagatatta taaaaaatat gacaacttta caacacttta tatacactat 2400
tgcaacacta ggcaataaaa tatgtgagat aatgttattg tgaaagaaat ccatattgaa 2460
ggaggtgata aattgaaaag aataatatta cctaaaaata tagaagatat ttgacaggaa 2520
taaatgagat gtatatttaa aaatgactta tatcatttat agtaagatta tcagattaag 2580
caagaatatt tagtgatagt gtggtgatta tttgcttaaa tacaaggaaa tattagaaac 2640
aattattgag attctcaaaa aaaactttac tgaaagtatt tttattgatg atgaaagtgt 2700
gcaaggctct gaagggtctt gtttttttgt aagtatacta tcagttattt gtacacctat 2760
aatgttaaat acgaataata aagatattgt tatctctata aaatacttac caaaaccaca 2820
gtcaaagagt attagaatgt atgaaatttc agatgaatta aataagttat tcaacagaaa 2880
tataaaggta acagacagaa aattaaatat aacaaagcta gaacaaagta ttaaaaaaga 2940
agagtcaatt tatgtattga actttacaat tacactaaat tatctggata gtgtatatga 3000
agaagatgta gtatatgaaa atatggaaga aatcaattta aatttaggag agtgatagta 3060
tggctatagg attaccaagt atcaacatat catttaagga gctagctaca actgttaaag 3120
aacgttcagc tagaggaata attgcaatgg tgcttaaaga tgctaaggca ctaggtctta 3180
atgaaataca tgaaaaagag gatataccag ttgatttatc tgctgaaaat aaagagtata 3240
taaatttagc tttgatggga aatgttaaca ctccaaataa attattagtt tatgtaatag 3300
aaggagaagc agatattcaa actgcattag attttttaga gactaaggaa tttaattatc 3360
tatgtatgcc aaaagcagta gaagctgata agactgctat aaaaaattgg ataattaaac 3420
ttagagatat agataaggtt aaggttaaag ctgtattagg aaaagttgta ggaaatcatg 3480
aagggataat taattttact acagaagatg tgttagttgg agaaaagaaa tacagtgttg 3540
atgagtttac aagtagggtg gctggactta tagcaggaac acctttaagt caatcagtaa 3600
cttatactaa gcttagtgat gtagttgata tacctaagat gacgaaagtt gatgcagaat 3660
caagggttaa taaaggagag cttatactta ttaaggaagc aggggctata agaattgcaa 3720
gaggagtaaa ttctttaact gagttaacag aagaaaaagg agaaatgttc cagaaaataa 3780
aaatagttga cactttagat attatacata gtgacataag aaaggtgata atagatgact 3840
atataggaaa ggttactaac agttatgaca acaaatgttt attgatagta gctataaaaa 3900
gttatttaga agaattagaa aagtcagcac ttatagaatc tgattctact gttgaaatag 3960
attttgaagc acaaaaatcg tatttaaaat caaaaggagt agatttatct tatatgacat 4020
tacaagaaat aaaagaagct aacacaggtt ctaaagtatt tttaaaagca aaaataaaag 4080
tacttgatgc tatggaagat atagatttat caatagaaat ataggaggat tattaatatg 4140
gcaaatatgg aagctagaaa tgtaatgagt ggtacttggg gagaactttg gcttgatgga 4200
aacaaagtag cagaagtaaa gaagtttcaa gcaaagatgg aatttacaaa agaggatatt 4260
ataatagcag gtcaaatggg tactgataca aagtatatgg gatataaagg aaaaggttca 4320
ataactctat accatgttag ttcaagaatg cacaagttaa ttggagaaaa gataaagaga 4380
ggttctgaac ctagatttgt tgctatatct aaattaaatg acccagattc ttatggagca 4440
gaaagaatag cagtaaaaaa tatagcattt gatgatttaa ctttagctga ttgggaggtt 4500
ggagtaaaag gagagataga agcacctttc acatttactg agtatgattt tcttgatata 4560
atttagtttt atatttggtt ttatactgat atttagtaga tatatactta ataaatttag 4620
gtagttaata agtaaaaaag ttagttgatt gaatttgatt gataaaggag caaataataa 4680
tgaatgaaaa tggattatca aaaaatataa acatagtaga tttactttta aatgcagata 4740
cagaaaactt agaaagacca agtactatag ttgaacttaa gagattatca actatatttg 4800
ggcaggaatt taaagtaatg tgtagagctt taacaataag taaagatgaa gagatacaaa 4860
atacttgtct taaaattgat gaaaatatga aaacggatat agacttaccg gagatgcaga 4920
tgcttacaat tatagaaggt gtttgtgatt tggatggaaa gcttttattt aaaaataagg 4980
aactaatgga taaatttaag gctccaacac caaaagaatt ggcaagaaaa ctattattac 5040
caggtgaaat taccaaccta tatagaatac ttcaagatgt tatgggttat ggtaaaaatg 5100
cagtgataga agaggtaaaa aactaatagg gacggatacc aagactacaa taatgtacta 5160
ttattggaag aaaaaaggta taagaccgtc ccttttttat gcaatggata aaggcgaatt 5220
aaagcttatt gaagcttttt tcgccttaga aattgaggaa gaagttgaaa aaatgaaaca 5280
tggatatgga gtgtgtcctt tgacaggagg tggtatgtaa tgggaaatgt gagagaagaa 5340
ggtataaata tgtatcttac agataattac acaccaaaaa tgaaccaaat tatatcagta 5400
actgataatt ttaggagagc aactgtggct gtttcacttt ccactaatgt aatggctagt 5460
agcataaaaa attctattgg aagtgcaagt agtagagtaa acagtttaaa ttcctcgtta 5520
agaaaagttc aaactactgc tagtagtgta agttcaacta tggcaaaatt aagttctagc 5580
ataaatgctg tttcaggagt tattggaagt ttaaatggaa gtattatgag actagcaata 5640
actatagcta tgattattga ttattttaat aagttgattc aaaagaaaaa tgagtttaat 5700
tcaaatatta tgattatatt aatatttaaa gctaaaagtg atgaagtaga aaaaactaaa 5760
aataaattac ttggaaattt aaaaaagatt ggtggcaaga tttggaatat cgtaataaaa 5820
gcaaaagata tgactaagag agtgataagt agtatcttgg gaaaattaaa acgagtagag 5880
aaacgtcctt atcaaggaag tattaatctt aaagatatgg taagtagtgc tatggctaga 5940
attttgccta agttaatgtt gtttaaaaat actttttgga gtggtgtaat agctataaaa 6000
gatatggcaa gtagcattat aagtaaagta tttcccaaat tgagattgtt tgcaggtaag 6060
gtatggagtg gtgcaatagc tgtaaaggat atggcaagtg gaatacttgg ttcgataaaa 6120
gggaagatat ctgatttgac aaatggtgct actataggtg tcgctgtgaa aaagggtgtt 6180
gacttacttg gtcaggaaca aaatcagaaa gttgttctag aaagtgtaat gaaaagaaat 6240
actggaaaaa ctagccaaaa agatgttgat aagtattatg acagtttagt aaatatggca 6300
aatgatacgc cttttgaccc tgaagatgtt gttgcaatgg gaactaaagc taaaatgatt 6360
agtaatatta ctggtggcaa aaaagaaaaa gatataactc aagctatggt agatgttaga 6420
gctttaaata tgaatacaag tagtgaacaa gatgtatcag cagctttctt aagtgcagca 6480
aaaggaaata tggaatctct taatactctg gtaggagaaa attataaaac ttttgatgaa 6540
gcattggaag gcataagtgt aaagcagatg gggttagcta aagaaatgag taatacaata 6600
ccaggtataa tatcaggagc tcaaacaagc attaacaatg gtttgaagag tattgttaaa 6660
ccttttgatg atattttagg tcaaggacta aagaaaataa aaacttttat agaaagtgga 6720
ttagggaatt tagctggctt atctgaaaaa atggctggta aaataggcaa tgtaatgaat 6780
ggtaagataa ttattggcaa caaatatgac cagatgcaat ctagaagtgt aaaaaatgga 6840
aaagagtttt ctgattctac tcaatatcga atttctaatg aggctgaaaa gcgtaaaatg 6900
atggttgaaa ataagcaaga acgttttgaa aatcatgcag caacaatgat agggaatgca 6960
ccaaaagcaa ttgttaacgc aggaagtaca ctattacaaa atattgattt tacagcatta 7020
atagattcac tacttccagt agtaaactta gtaaataatt tactagatag tataaacaat 7080
aaatcaccaa ttgcacaagg attaataagt atatttggta caatagtaac tacagcattc 7140
caactaatcg gacctgtagt tgaagctgtt agtcctatta tcacaagaat ttttactttt 7200
ttaggtgaat atgcacctca aataaacaat tttatagaga cactgggtgt tatttggaaa 7260
actgtatggg agaccttagg acctctgttg gaaactggat ggaaaattat agagccaata 7320
ttgggagctt tttttaacat attagataaa gtatgtaaaa tagttaaaga tatatgcaaa 7380
tggtggcaaa ctatgattaa taagataaaa aatggaagca tcacaggaac agttttaaat 7440
ctagtggaaa agagtaaaaa aaattacaaa gataatccat atgctggaac aaaggctggt 7500
gattctggta aagcttattc aagtaagaaa ggtaataatg catttggatt gaactatgtt 7560
ccttataatg actatcaaac cagactccat gaaggtgaaa tggttttaac taaacaagaa 7620
gcaaatcaat atagaagcag aaaaaatggt ggaaatataa acatagctaa gttagctgat 7680
acaatagtga ttagagaaga agctgatata gaaaagataa catcaaaatt agttgcaagt 7740
atccaattgg cacagttagg gggtgtctta taatggaaat gtggcttaga caagcagaag 7800
atagatttag atttccagta tttccatctt cctttagtat taatggaaaa gctgctgtaa 7860
actcttctag tatactcaaa ataggtgaag tagcaacttt tggtggtgta gctcttaaaa 7920
gcatttcaat atcaagtttt tttccaaata aagactacac tttctgtgac tatacaggtt 7980
ttccatcacc atatgattgt gtaaataaga tagaaaaatg gatgaaggaa ggttttatat 8040
taagatttac aattacggaa acaaatataa atatggaagt cataattgaa gggtttagtt 8100
atgaagaaag agatgggac 8119
<210> 33
<211> 7686
<212> DNA
<213> Clostridium difficile
<400> 33
tcgagatgta tattttacat tagatttaaa agagtataaa agaataaaga taccaaaagt 60
aactccaaaa caataactat tatagataat aagttgtaag taactgctga tagaattaaa 120
tgaaaaggca ggtgattttt tattattaag atttgggtac acataaaaaa cggaagtata 180
tatgacataa ctgacatagt agacaaggta tcatggtcag gtgattataa atctccatca 240
aggacactag agttttcaat aatacaatca tcatttgatg taaatttcca acaaatcgat 300
ataccaatag ctagtacagt ctgtttctat gtagatgaga aagaactctt tagaggaatg 360
ataattaata ggtctaaaga ttcaagcagt aatgaaatta gttttgtatc taaagatatg 420
ggatttttac ttacacaaag tgaagtgtca tacaatttta aagataagtt agttgaagac 480
atagcaaagc aagtatttgc tgaaaatagg ctttcagttg gaacaatagc aaagaccaat 540
gtcaagtata caaagatgtt tataggagta aatggttatg acacaataat gagtgcatat 600
acagaggcaa gtaaaaagac aaagaaaaag tatatgatag aggctaattt agataagttt 660
aatgttattg aaaaaggaac tgttacatta agtgttatgt ttgaagaggg atttaatatt 720
ataaatacca ccttttcgga gagcatggaa aatgtaaaaa ataaagtaat agtggtagac 780
cagtatggaa gcaagattag cgaaaaaata gataatgaaa tttttaagga agtaaatgta 840
ataatgcaaa aagtaattca gcaacaagaa aatcaagatg tagatattga tagcgagttt 900
aatgggatag aaaaaagctg ttctcttaaa ggttatggag atgtaagttg tataactggt 960
agaggagtaa aagttaaaga ttcttataca aagcttgtag gactatttta tatagataca 1020
gacaaacata cttggcaaaa tggagaatat caaattgagc ttgaacttaa ttttcaaaat 1080
cttatggatg aaaagtcagc aggacaggat gaacctaagg aagaaagtaa tttaggggga 1140
gaagattatg caggaggaaa agagtttaca gcagaattta cagcttactg tcctagaaaa 1200
gaagaaggtg gagatacaga ttgtagaaag aaaaaacttg acccatctaa aaaacttgcg 1260
ctgctcctat ggttggtaaa tatgagcaaa cttattatac aaaagagttt ttaaataaac 1320
atcctttatt gaactatgga gatgaaatac aggtaattac aggagtttct ggtcgtgatg 1380
gagtctataa agtaaatgac gtaggacctg caataactat agaaaaaaat ggaacatacc 1440
atatagatat tttatttgga aatgttgaag aagctagtaa atttggaaga agaaaaggaa 1500
aaattattat tggtggttat tctggtaatg tatctgataa agctaaaata gtaatatcag 1560
aggcaaaaaa acatctaggt aaaccttata aatggggtgg aaatggacca agtagttttg 1620
actgttctgg tttaatggtc tactgtttta aaaaagttaa tgttagtttg ccaagaacgt 1680
caaatcaaca atctaaaaaa ggcaagaaag tagaacaaaa aaatcttcaa gcaggagatt 1740
tagtattttt tcataatcca gtcagccatg ttggattata tataggtaat ggagaatttt 1800
tacatgctcc acaaaaaggt gatgtagtta aaataagtaa gttaagtagt agaagagatt 1860
ttaatacagc taggagagta ttataaaagg atggtgatat aatggctaat ccaataaatg 1920
aatttatagg aataataaga gaagaaggaa agtatcataa tcaaccttct tttttattgg 1980
aaaattaaaa gtaaattacc agatttaaaa atagagacaa ataacatcat attagaaaaa 2040
gaagatattt tgatagatag ttggatgatt gatagacagc tagaaacatt tgacacagaa 2100
acaaatcaag aacaccagca tgaagtaaaa aatcctttta tagataactt tgaatctggg 2160
gatatggtaa taatgtttag aataggcgaa aaatttgctg ttgtaagtaa gttggtgagc 2220
ttataatgag tacaatattt ccttttatag gtgtcccaga ggattatatc ttacctaaaa 2280
cagaagaatt gccaatcttt cgtgaagtgg catgggattt tgaaaaagat gaacctattt 2340
tagaaaaagg tgactttaaa ataattgaaa aaaaaagaag ccttaaaagt ttggatatac 2400
aagtgtataa agacaaatag atatgaacat gagatatact ctttagaata tgggacagag 2460
ctttcagaac taataggaca aaaatataca aaaggtctta cagaaagtga agctagtaga 2520
ttcataaaag aggcccttct aataaatcca tatatattag aagtaaacgt aaaaagtgct 2580
aactttaaca gagacgtatt gagtgcaaat gtaaaagtat ccactatcta tggggaggtg 2640
gaaataaatg tatagtgacc agacatatga agtaataaaa aatagaactc ttgaaaatat 2700
taatcttgat atttataaag gagaaggttc ttttctaaac aacatggtat ctggaaataa 2760
tctagaactt tcgaagatat atctagaact ttcaaagata cataaaatgg cttttataca 2820
agacacatat aaccagtttc ttgataaaag agtcaatgaa tttggtgtat atagaaagtt 2880
aggtacagag tcaaatggag aagttgaatt tattggagag aaaggaactg taataaataa 2940
tggcacaata atatcatata gagatttact atttgtagta ataaaagatg taactattgg 3000
tagtgaagaa ggtgacaata gcccagttca agctctggaa gttggtaaga aatataattt 3060
acctacaaat tgtgaattta aactagttga taatatatct ggagtaacaa agattactaa 3120
cacaagaagt tttgaaggtg gtacagatat agagacagat gaagaactaa aagaaagatt 3180
ttataaaatc caaagaaatc aagctacaag tggaaataaa gctcactatg aagaatgggc 3240
tttggaagta gatggagtct ataatgttaa ggtttatcca agatgggatg gtccaggaac 3300
agttaaggtc ttgatatttg gggaaaataa tcaagctgtt gatacagaaa cgattgaaag 3360
gtgtcagcaa catatagatg aagagaagcc tattggacca actataacag ttgtgacacc 3420
attaccaata gaaataagta taagtgcagt aatgaaacta gaagatggat atacattaga 3480
caatgtaaaa gaatctttcc tagaaagtat aaatacatac tttagagata ttagaggaga 3540
gataatctat acaaaagtca tgggaatact tataaatact actggtgtac acgatttaag 3600
taatctactt ataaatggaa gtacagataa tataactatt aatgaagata aaatacctag 3660
tgtaacaact gttaatttta gtgaggtgga aaatcaatga agctaattga taaactacca 3720
tcatttgata gaaattacat tgtagaggag atacaaggtg catacgatac agaattaaat 3780
attcttaaag aagatattga tgataccttt aaccaattat ttgttgatac agcgacatgg 3840
ggattagata tgtgggaaga catactctgc attgaaaaaa aagaacttga ttttgacaca 3900
agacgtagca atataaaagc taaaatgaga agcagaggta ctagtactat tgaagttata 3960
aaaagtatat gtgaggcata tacaaaatca gaaacagata taaaagttta tagtgatgaa 4020
tttacattcg tattgagttt tatagcaaat aactgtgact ataaaactct tttagattgt 4080
agcgagatga ttgaaagagt aaaacctgct cacttattac actatttaga accaataata 4140
ctagataaaa gtatggtcta ttgtggtgga ggtatggtat gtagtgaaga ggtaaaagtt 4200
catccatact ttgaaccaat tataaaatgt agtgctgttg taaactgtgg agctggaatg 4260
ttaagtagag aagaaataaa ggtttatcct ttaagcatta aatgcattga aaataattgt 4320
aagattaata tagctattgc aaatgataca ggcgtagaaa atgtagtagt ttatcctaaa 4380
tcggaggtgg tataattgga agaaaaattt tatataatat taaccaaaat tggtagagaa 4440
aaaatagcaa atgcaactgc actaggagag cttgttggat taaccaagtt tcaagttgga 4500
gatagtaatg gagaatatta tgagccaaca gaggaacaaa ctgctttaaa gaatgtagtt 4560
tgggaaggaa atataaattc tctaagaatt gatgaaaaaa atcctaattg gatagttata 4620
gagactattt taccaggaac agttggtgga tttatgataa gagaagctgc tgttctggat 4680
aatgagaata atataatagc tatwggtaag tatccagaga cgtataagcc acgtgctgaa 4740
gatggcagta ttaaagattt ggttgtaaaa atgattttac aattgtccaa tacttcaaat 4800
gttacattag aagtagaccc gacgttggtt tttgtaactc aaaaggatat tcaagattta 4860
gatgataagt ttgataaaaa tataaaagaa ataaaagtaa aaattggaga tacagatata 4920
ttaactacag attctaaaga tttatcagga gctataaatg aggtagttaa aaaaatagaa 4980
aatatatctt ttgatgatgt tataagtggt caaatacaaa ctgatatatc agtattaaaa 5040
aatagctata acaaattatc tgaaaaagtg ctagatatat taatatacct agaattagag 5100
tcagaagtaa ctgtagatga ggctggttat tggtatgata cattagcaaa tggaaataac 5160
atagtagcta tagaagggct taagttagat ttaaatagaa aatgtataac aggtgaaatt 5220
ggtaatgtga tttttagaga tgtagtatta ccatttagtg caaatagagt tagatatata 5280
catgatatgg ataataactt tgttgagaca aaatctagta acacttattt aaaagaacaa 5340
aaagatataa ctctaagtaa atattcatat gaaataagat aaataaagga ggtagtacta 5400
ataatgaagc aaaataaact tttacagcgt ggtgcttatt ttaatgataa gaacatattg 5460
attgatgatt ttgataaaag atataatgat tatgattttg tagaattttt tactggtata 5520
agtaatagta cctttggttt aaaatcagat ggtaatttat atgcttgtgg cgataataca 5580
ggttttcaac taggacttgg aaaagattcg tcagagagaa ggatgtttag taaagtaaaa 5640
attgataatg taaaatatgt atcttgtggt tcaaaacaca gtgtagcagt aactaaagat 5700
ggatttgcat atggagcagg aacaagtaat gtaggtcaat taggtgtaat tgagtctaca 5760
gtatattatg aatttactaa gctaccaata gatgatgtaa aaactgttgc atgtggttat 5820
gactttacat ttgtgcttaa aaatgatgga acattatatt cagcaggttt aaactcaagt 5880
ggtcaacttg gactaggtga tactaacaat agagctactt ttactaaagt aaatatagat 5940
agtgtgaaag atgtagtgac ttataatcaa tctgtattta tcataaaaat ggatgggaca 6000
gcacatgcat gtggattaaa ttcaaatggg cagttgggaa ttaatagtac tttaaataaa 6060
agtgtattta ataaaataga aggtatggat aatgtaaaac agatagcgtg tggtagtagt 6120
catacaattc ttattaagaa tgatggaact atgtatacta caggctataa tggagttggt 6180
cagcttggta caggaaataa taataattca attgtattta ctctttctag tataaataat 6240
gttaagtatg cttcttgtgg aaataatcat actatgatat taaaatacga taatacactg 6300
tttagtacag gacaaaacaa ttatggtcaa ctagccaatg ccaataaaga tgtagcatca 6360
agaaatactt ttgctaaggt taatgtagaa aatataaaag atattaaatg tggttctcaa 6420
tttaattttt taataaatgg ttcaaaagag atatttgtat ctggctgtaa tttagcaggt 6480
caacttggtt cattttttca tacaactttt ctgtatgagt tttcaaatgt gcaatcttca 6540
aatttagata attattcagg tttattggtt aatgatgatt atttatatgt tacaaaggac 6600
aatagtgaat ttttaaatgt aaagttaagt gataattttc aagattataa gaagatagag 6660
ttaacagata gcaatatgtt tattgttatg aatgatggta cattgtatgc ttgtggttta 6720
aataattatg gacagttagg attgggagat actgttaaca ggtcagttat gactaaggtg 6780
gatatagata atgttttgga tataaaagga aacggaaact caacttttgt gcttaagaat 6840
aatggaacat tatattcatg tggtttaaat agtaatggac aattgggttt aagagatgaa 6900
gttaatagaa atatatttac aaaaatagaa atagagaatg taaaggattt ttgtgtagga 6960
agcaattatg tcatagcttt aaatcactca aaagaagtat atggatgggg aaataatcct 7020
tataataata tagaaaaaac ttctaattat ccatataagc agggaataag taatattgaa 7080
aagatagcag catatgatta ttctgtatat atgataaaca gtgaagggaa actatatgtt 7140
tctggataca attataatta tcaattaggt aaaggaaata atagtaacca aagcaaagca 7200
ttagtatctc aatgtagaac aaattcaaca tcttctacat caaatggact tagaacgtta 7260
cctaaaataa ctaatgtttt tcctttttat gatggttgtg caataattga cgaaggaggt 7320
tatgtttatt taacaggata tcatggatat ttaagaacat taaatagcag tccaagtata 7380
tctgattatt caagatatgg aacttttatt gaggctacaa attcaaatca taatacttat 7440
tttatacaag agactgattt tagtggaatt gaaaaagtaa tagggatgtc aaataatata 7500
ttatttttta agaaaggaag ttcatatatt actggatatc caaaaacatt tggctcaacc 7560
attactggac atagaagtta tactagtatt aattctgaga gttctaattt aggaagtaat 7620
tttataatat atcatagtaa ttccaagtta tatggaaaag ggattgctaa tagtgggcaa 7680
tttggg 7686
<210> 34
<211> 7020
<212> DNA
<213> Clostridium difficile
<400> 34
aattcaacaa atatagatgg cacaagtaac tatgatacag gattaaaaga cataaaagat 60
ataattgtaa aaggaaatac tgtagtagta gtagataaaa ataacaatat atatgtaaca 120
ggaatgaatc agaataacaa acttgggata ggggaatata acaacgaacc agtaaaaaaa 180
ttcacaaata taactgaaca atcaaactca tttatattta tggatgatat aaaagaaatt 240
acaacatcaa gaaatacaat gtttatagta aaaaatgatg gaacagccta tgccacagga 300
aataatagtt ctggacaatt aggattaggt gacacaataa atagaaataa gttcactcag 360
ataaaccttg ataatataaa gaaaatatca acaagtatag atggtaacac aacatttgca 420
attagaaatg atggaacact atactccaca ggattaaata ccaaaggaca actgggatta 480
ggtgatatag taaatagaaa tacatttacc aaagtaaaca tccaaaatgt aagagatgtt 540
gttttaggga ctactcactc gcatgcaatc aaagatgata acacattata ttcatgtgga 600
gaaaacactc atgggcaact gggcttagga agcgaaagca accatccaga cgtattgaca 660
tttactgtaa acaatataac taatgtaaga gatgtgtact gctcagatac aacaacattt 720
attgtaaagg acacaaacat tgcatattgt tgtggataca ataataattc acaactaggt 780
atgggaaata ctactgacca gtatagtttt ataaagtgta tggaaaatgt aaaagaagtt 840
ataccaaatg aaataaatac ctatataata acaatctata atactgcata tagtacaggt 900
ttaaatactg attattgctt aggtctaaat agtaatagca atcaaagttc attttctgaa 960
attccaattt caaatgtagt aaaagtagct ccaaacagaa ataatgcagt acttttactt 1020
acaagtgaag gggatgtata tactgcaggc aaatgtagta atggttcagg tacaggaagt 1080
gagactccag agaagattaa aaaaatagca tcaaaggcaa aggatattgg aatgaattat 1140
agatgtggac attatgtaag tgataatgga gacctatatg gtacaggttt taataataat 1200
ggacaattag gtgttggtga tgtaacaaaa agagatacat ttataaaaac caatacaaga 1260
gtaaagaaaa tacttccttt agaatatgca aatatagcaa taaaagatac taatgatata 1320
tatatttgtg gattaaataa ctatggacaa ttaggtgttg gaaatagata cgatagtaga 1380
aataatgata atagaatatt taattataag catatgaatt ttgtaatggg tgatttgaca 1440
tctattaaaa acagacataa ctttatactt ctaaacaata agatagtgat acctaccaca 1500
aaagacatag attatggttt agtattagga aatttataca aaggagacct ttatactgag 1560
cttccatatg aagatataaa agaagtatct atttctaaga ctcatattat tatattactt 1620
aatgatggaa caatgtatgg atgtggtaca aactaccatg gagaattatt gcaagacttg 1680
tctataaatc aagtggatga atttgtgcag attaatgtat cagatgtaaa gcatgtttca 1740
tgtggagata actttactta ttttataaaa tctgatgata gtctttggtc tattggtaaa 1800
aattccgaat atcaattagg tataggtcac aataatccag ttactgaatt acaaagaatt 1860
acaactatat ctagctgtaa agaagtacat tgtggtaaaa actatacatt agtagtaact 1920
acaggtaatg aattatttgt acaaggatat aatgataagg gagctttagg attaggaagc 1980
gatagtgaaa atactataat taagttcttt acaaaagcac taacagacat aagagaaata 2040
aaatcttatg gaagtgacca tatattagta cttaaaaatg ataattcagt atgggttact 2100
ggaaaaaata gggatgtata taaaattgaa caaccagtag aatttttaaa agaatttact 2160
atagtaccta tttctgaaga tgtaaataca gtaaaggatg tacttgcaac agacaataca 2220
ttatatatta tatcagaagt aggaacgaca aatgctgcta tagaaattac tgaaaaatca 2280
atttcatcaa ttaagataaa aatacaagac cctaataaag atataagtag aatagaaatg 2340
cttataaatg gtgaaagtgt aaaatctgta agtgatttaa ctactgaaaa aatatccttt 2400
gaagtaccac cagataaaat taaaatagga gagaataaga tactatttag agcttattgt 2460
aaaggtgatg atttatatgc atctttattt atttttaaag agagtactgg aaattctata 2520
attaaagatt cttatgttat gataggtaat agaatgtaca aggtagttaa tacaacatct 2580
aatgaacaag atattacaat tacactagat agaggacttg aagaagattt aaatcttgga 2640
gaccctatat atcaattaat aaataaaact aaagttcaag taaaaataaa taaatctgac 2700
ttattcaaag acatgaaact agttgaaatc aaaaaatcag actcaagtta tcaagaaatc 2760
tatgaattag aagaagccaa cataaaaagt gctcagccta aaatcatagt agaaaaagga 2820
gataaatgga cagctataaa acgtccatct atgattttta gatatgatgc tgaaaacaac 2880
gagccacaag cttaaaatgg aggtgtaaaa attgtttaaa ttcgataaaa ataaaataga 2940
acaaatcaaa caaggtagaa aagtagaaat gcagtataaa gacatttcag acataagtat 3000
aggtcaagca aagcaagatg atgatataac aaataatttt atagcaaatg cagaaatata 3060
tgagatgttg ttaagtcaaa gttctgtcaa tgaagcaagt aatataagca cttttagtgt 3120
aagaaaatct ggaggtgaga gtggaatggt agaagtatat gtagctttaa ttttaagagg 3180
cagaaaaaca atagaagaag taccagcagt aattagagag caagttagaa ttagatgtaa 3240
agaattagaa ataccagttg aatagtaaat ttagaataac tatgtattag ttattttttt 3300
tatgtaaagt acaaggtctt aactttaata agtaagcctt gtacttattt tttgttatat 3360
tagaaattgt atatatattt attatttatt caatctataa attaaaccta caatttaaag 3420
tacagaagat taaattgata atcctgaaaa tataatattg catgatgtaa gaatataaca 3480
aaaattaaag ctataagtat aaaaaattta gacaatagga ggctataatg gataaattaa 3540
taaccgaatt gagtagtctg ggggcaatag gtatactatg tgctctatta tttaaaaata 3600
ctatgcagga gaaaaaagaa gatagagaca tgtataaaaa aactgtagaa aattttatag 3660
aattatctac acaacaacaa gaaataaaca aaaatatact tgttcaaatg ggaataatga 3720
aaacagatgt agaggaaatt aaggaagatg ttactgatat aaaaggtatg ttacaaaacg 3780
gtgtataaca tgaaagtagc agtagcacca gattatatat tattaggaaa agataaagta 3840
gtattgtaga tagtgcccta ttttattgag aaggatttta tattttaaaa tattaattaa 3900
aaaaagtaat aaaaataata tataaaaata acatataaaa attcaaaaag gagttaagct 3960
taaatttgat tagaaaaaat caattttaag acaactcctt ttttttatta aattattgtc 4020
tattaaccaa aatagctatt ttagcatctg gattataact tatctgaacc atttgatttt 4080
tcttaacatg ttcaaggtct tcaccaccat aagctatttg taacttaact ggtaacttac 4140
cttgttttat aatagcaacg tactcttttt tacctttttc tctaaactaa tcaaattgcc 4200
aacataaggt ttaaagttct gatacttttt actagaattt cttatgtaga agaaagcacc 4260
aacagcaata actaaattta tgccaagtgt aacccaagaa ttgattttaa gcatagctcc 4320
agcgattatt atcacgaaca ttaaaacgat aggtaatata gctttcttaa gaagcaattt 4380
acccattatt tcattagcct ttttctcagg gccactcata gtttttgatc tagcaaatga 4440
ttgcgcgaat ttgtctctta agcccatttt atcctcctaa ttttaataaa tatttagtta 4500
taataacgag atattacttg aaactaaaaa tttactacat ttatattatg tttgactttt 4560
gtataaataa ttacattcaa gtaaagcaaa atatactaat tattttatca taaaattata 4620
aaaaagaaaa taaatgaaat aaaaatatta gaacaaagaa atgatgtaaa atcgtatcaa 4680
aagcaacata aaaattattt atctattttc tcatctttat ttttgttata ctcaattttt 4740
cctaaatcct tctctttttc atattcatga agttttaatt caatcatacc ttctattttg 4800
gctttatcat aatcatttaa ctttctaaag ttgtttaaaa gctttatttc attagagttt 4860
atgctattaa gtggatagtt tgaggaggaa tcgcaaatta aatctgattt atgtgataga 4920
ttatctccat ttaatagcca gtctactgaa acattaaata tctcagctat agattttaat 4980
atttcataat ttggttttct aatgtttctc tcaaatttac ttaagttgtc acagcctaac 5040
atttcttcta gttcatattg tttaaggttt tttgcttttc tcaaataaac aattctttct 5100
cctaaagtat ccataaacac tctccattca attaatgtca aaaagacttt ttaagatgta 5160
aatagtttca aattaaaggt caaaatgaca taaaaaccat tgacttaagg tcaaaatgac 5220
tttataatta acttaatgat acgaatttac atcctaattt tagcacaaag taatcaaaaa 5280
atcttattta gtattaaata aatttatata cttaatatgt gtacatatta aaaatatata 5340
ctaaatagag ggggtgcgta agctaaagta atataaaagt aaatataaat cacttagaaa 5400
ggaagttgat aaatggatgc tcgaaaaaaa tggatacctt ttttgggagt gcaagtcaag 5460
caaagactta ttgaattaaa tatgactcaa agggaattag cgaagaaaat aggtgttaat 5520
gaaaactatt tgtcagctat tttaaatgga agaagaacag gtaaaaaata taaatcatca 5580
atttatcaat tacttaatat agaatattca gaagatgatt aataaatagt atataaagta 5640
ggtgaatatt cttgtgtgca aattggattc agatggggtt atagagtgtt gtagagcaat 5700
tgatgatttt attacagcac ttagtaatat aaaaagctta aatatggaaa gattaaatac 5760
tttaactaaa tattctagta catgttcaat ccttcttaaa gaggggaatt atgaaggatg 5820
tacaattgtg tatagaaaga tgttggaaga attaaaaaca tgagtaatgc atttcttagg 5880
aatataaatt atacatagaa atgtattata tttttcaaag tacttaaact aaaatatgga 5940
taagataatc taaatattat aaatgtgctt gaaattagac tatacttgtt tttaaataat 6000
ccaatatcca tattttagta atatactaca aaaaaagaag gttaatagat gatgtaaaat 6060
cgtatcaaat tatgtatgtt taaaccattt tatcttcatt attattagag gaatgctttt 6120
ttaagtcttt atattcagat atcttaagtt caagtattcc ttctattttt attttatcac 6180
gttcgtttag ttgtctgtat agatttaata tcatcatttc atcattagta acatgtaagt 6240
aatcttcttt atcttctttt acactactat tgacatttac cttctcttta ccatagagaa 6300
gccagtcagt cgtaacatta aaataatcag ctattgacat tagtatatca caattaggtt 6360
ttctatctcc tgtttcatac ttgcctaagt tttcaaattt taaaatatcc ataagtttgc 6420
gctgagtaag ttttttggag tttctcaaat aagcaattct ttttcctaaa gtatccacaa 6480
aatacactcc tttcttttta tgagtaatgt ctaaatgaca tttgaaatta aaaatatata 6540
aatttataat ataaaactac taaattaaag tctaaatgac attttgctta aattaatatg 6600
ctcataatat gattttaaca tattatagtt gaaaatatat ggtttatttt gatttgtata 6660
tataacaata gatttaattg ttataaaaat gtaaaggggt gtatgaatag attgtataaa 6720
tttatttcga taaactaaga ttgctttttg attgtctgta aaagagaaaa agattaagat 6780
aaaaatagta ttatattgta atttatatta atcaattaca aagattttat gaatttattc 6840
tttagggtaa aatatttaag aataagataa atttacaata taatactata acactctttt 6900
atctagtttt attttcttta tagaacaata atattataaa tgctagtaga tttacacaga 6960
atactgttat atacatctgt ttgaatcctg agtttagagt agattgtagt gtggatccgg 7020
<210> 35
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 35
ttttttgcgg ccgcaatacc cactacacct tcgtc 35
<210> 36
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 36
tatacatctc gagtcccatc tctttc 26
<210> 37
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 37
gaagaaagag atgggactcg agatg 25
<210> 38
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 38
cttgtgccat ctatatttgt tg 22
<210> 39
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 39
ggaaaaggga ttgctaatag tg 22
<210> 40
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 40
tcccccggat ccacactaca atctactcta aactcagg 38
<210> 41
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 41
ggcgcgccac tagtaccggt gccatggcgg ccgc 34
<210> 42
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 42
agctgcggcc gccatggcac cggtactagt ggcgcgccca tg 42
<210> 43
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 43
ttccttggtc tcacgcgaac aaaattctcc agtcttc 37
<210> 44
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 44
ttccttggtc tcaggccgtc gcgactaaga aaatgcc 37
<210> 45
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 45
gtgagcggat aacaattccc 20
<210> 46
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 46
agattgtagt gtggatccgg 20
<210> 47
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 47
tccttcggcg cgcctcaaat ttaagcttaa ctcc 34
<210> 48
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 48
tttagggact actcactcgc 20
<210> 49
<211> 1773
<212> PRT
<213> Clostridium difficile
<400> 49
Met Lys Arg Thr Lys Leu Leu Gln Arg Gly Asn Phe Phe Gly Asp Lys
1 5 10 15
Asn Met Val Val Asp Glu Phe Asp Glu Gly Tyr Asp Asn Tyr Asp Phe
20 25 30
Ile Asn Phe Phe Thr Gly Cys Cys Asn Tyr Thr Phe Gly Leu Lys Asn
35 40 45
Asn Asn Ile Leu Tyr Gly Cys Gly Asp Asn Ser Asn Phe Gln Leu Gly
50 55 60
Leu Gly Glu Asp Asn Thr Thr Arg Lys Leu Phe Thr Lys Ile Pro Asn
65 70 75 80
Ile Ser Thr Asn Ile Lys Lys Val Ala Cys Gly Glu Ser His Ala Val
85 90 95
Ile Leu Thr Ser Asp Gly Glu Leu Leu Val Ala Gly Ile Asn Thr Asp
100 105 110
Gly Gln Met Gly Leu Gly Leu Glu Lys Val Gly Lys Thr Val Ser Thr
115 120 125
Phe Glu Lys Val Pro Glu Ile Lys Gly Val Lys Asp Ile Ala Cys Gly
130 135 140
Leu Gln Ser Thr Tyr Leu Leu Tyr Asn Asp Gly Thr Leu Tyr Val Ala
145 150 155 160
Gly Asn Asn Leu Tyr Gly Gln Leu Gly Leu Gly Thr Asn Gly Ala Ser
165 170 175
Ala Asn Val Asn Thr Phe Thr Lys Val Asp Val Asp Asn Val Lys Ala
180 185 190
Val Phe Ser Tyr Asn Lys Ser Ala Phe Ile Ile Lys Asn Asp Asn Lys
195 200 205
Cys Tyr Ser Thr Gly Phe Asn Asn Gln Gly Gln Leu Gly Leu Gly Asp
210 215 220
Lys Asn Asn Arg Asp Leu Phe Ser Leu Val Ser Ile Asn Asp Val Lys
225 230 235 240
Thr Ile Ala Cys Gly Ser Glu His Thr Val Leu Met Thr Tyr Asn Asn
245 250 255
Asp Ile Tyr Gly Cys Gly Lys Glu Lys Cys Phe Gly Asn Ala Leu Gln
260 265 270
Ser Ser Leu Phe Thr Lys Ile Glu Glu Val Asn Ile Lys Thr Ile Ala
275 280 285
Cys Gly His Gly Asn Thr Met Leu Ile Asp Asn Lys Gly Thr Leu Lys
290 295 300
Val Ala Gly Asn Asn Asp Ile Tyr Gln Leu Gly Ile Ala Asn Tyr Ser
305 310 315 320
Glu Asn Ile Asp Asn Ser Phe Ile Asp Leu Lys Asn Ile Val Ala Lys
325 330 335
Asn Ile Phe Ile Gly Leu Ser His Ser Ile Leu Ile Asp Ser Asn Asn
340 345 350
Asp Ser Tyr Cys Thr Gly Asp Asn Thr Tyr Gly Gln Leu Gly Ser Phe
355 360 365
Phe Asp Asp Met His Ile Val Glu Phe Lys Lys Met Asp Ser Glu Lys
370 375 380
Tyr Ser Tyr Ser Asn Tyr Ile Asn Leu Ile Lys Ser Glu Asp Lys Leu
385 390 395 400
Thr Leu Leu Lys Glu Glu Met Glu Ile Lys Asp Ile Glu Leu Pro Leu
405 410 415
Asp Ile His Ser Val Arg Asp Val Val Phe Ser Pro Tyr Cys Thr Leu
420 425 430
Val Ile Leu Gly Asn Gly Asp Val Tyr Gly Leu Gly Asn Asn Arg Tyr
435 440 445
Lys Gly Met Gly Ser Asp Leu Pro Ser Gln Leu Asn Glu Leu Thr Lys
450 455 460
Leu Ser Ile Ser Asn Val Lys Ser Ile Val Ala Ser Lys Asn Ile Ser
465 470 475 480
Gly Gly Ile Phe Tyr Ile Lys Asn Asp Asp Thr Cys Tyr Tyr Ser Gly
485 490 495
Pro Asn Ser Asn Ser Ile Ala Gly Val Leu Pro Ser Asn Ser Asp Val
500 505 510
Phe Lys Lys Ile Ser Ile Asp Asn Val Lys Lys Val Val Ile Asn Thr
515 520 525
Asp Leu Ser Asn Trp Phe Ser Leu Ile Val Thr Asn Asn Lys Gln Ile
530 535 540
Tyr Thr Ser Gly Lys Ser Ser Ser Tyr Val Asn Gly Leu Ser Asn Ala
545 550 555 560
Leu Ile Ser Gln Tyr Thr Glu Ile Ser Leu Ser Asn Val Thr Asp Ala
565 570 575
Tyr Ser Ser Tyr Asn Ala Thr Phe Ile Val Val Asp Glu Lys Lys Val
580 585 590
Tyr Ala Thr Gly Ile Asn Thr Asn Tyr Leu Leu Gly Phe Ser Thr Ser
595 600 605
Asp Gly Ser Asn Val Asn Leu Gly Leu Leu Ser Asp Trp Tyr Tyr Ile
610 615 620
Asn Ile Ser Gly Ser Ser Tyr Ser Arg Val Ser Cys Thr Asn Asn Ile
625 630 635 640
Thr Lys Ile Asn Asn Ile Ile Ile Tyr Glu Tyr Val Thr Val Phe Cys
645 650 655
Thr Asn Ile Gly Ser Phe Leu Thr Gly Tyr His Gly Thr Ser Trp Thr
660 665 670
Lys Pro Thr Asp Ser Ser Tyr Arg Val Gln Tyr Gln Gly Ile Ser Tyr
675 680 685
Ala Gly Tyr Leu Asp Ser Tyr Ile Tyr Asn Tyr Tyr Pro Thr Arg Cys
690 695 700
Thr Gln Ser Ser Ser Ser Thr Thr Phe Ala Tyr Leu Tyr Asn Gly Glu
705 710 715 720
Ser Ser Ser Asn Leu Lys Asn Val Asn Pro Asp Asn Leu Leu Ile Ser
725 730 735
Gly Gly Ser Ser Tyr Ile His Gln Tyr Gly Arg Asn Tyr Leu Asn Asn
740 745 750
Gln Ser Ser Asn Asn Ile Ala Ala Ser Asn Ile Asn Ser Gly Pro Ile
755 760 765
Thr Ser Asp Lys Ala Ile Phe Leu Tyr Lys Ala Leu Leu Tyr Leu Ser
770 775 780
Ser Asn Thr Leu Tyr Gly Phe Gly Asn Ile Ser Glu Ser Ala Lys Glu
785 790 795 800
Leu Asp Val Ser Asp Thr Gln Asp Gly Tyr Asn Ala Thr Asn Tyr Lys
805 810 815
Lys Val Met Lys Asn Ile Lys Asn Ile Phe Ile Pro Pro Tyr Asp Leu
820 825 830
Ser Arg Asp Lys Thr Arg Phe Ala Ile Leu Thr Asp Lys Ser Leu Phe
835 840 845
Ile Cys Gly Tyr Asn Ser Lys Gly Thr His Gly Ile Ser Val Asn Ser
850 855 860
Ser Leu Asn Leu Asn Asn Lys Ile Asn Tyr Asn Lys Lys Asn Ser Ser
865 870 875 880
Ser Glu Ile Ser Ser Asn Ile Gln Glu Ile Tyr Ser His Ser Lys Ser
885 890 895
Thr Tyr Leu Leu Thr Asn Asn Asn Met Leu Tyr Ser Val Gly Leu Asn
900 905 910
Asp Val Gly Gln Leu Gly Val Gly Asp Glu Ile Asn Arg Lys Val Phe
915 920 925
Thr Lys Ile Asn Ile Asp Asn Ile Lys Ser Ile Asn Val Asn Arg Phe
930 935 940
Thr Asp Asn Ser Lys His Ala Phe Ala Ile Lys Asn Asp Asn Thr Cys
945 950 955 960
Tyr Ala Val Gly Leu Asn Asn Ser Gly Gln Leu Gly Ile Gly Asp Asn
965 970 975
Val Asn Arg Asn Ile Phe Thr Lys Ile Asn Val Glu Asn Val Lys Tyr
980 985 990
Val Ala Val Tyr Gly Asn Thr Ser Leu Leu Leu Thr Asn Asp Gly Leu
995 1000 1005
Leu Tyr Gly Ala Gly Asn Asn Gly Lys Gly Gln Leu Gly Leu Gly
1010 1015 1020
Asp Thr Thr Ser Arg Asn Ile Phe Thr Arg Ile Pro Ile Asn Gly
1025 1030 1035
Val Arg Asp Val Tyr Leu Cys Asn Asp Val Ser Ile Ile Val Lys
1040 1045 1050
Asn Asp Asn Thr Cys Tyr Val Cys Gly Leu Val Asn Gly Tyr Phe
1055 1060 1065
Gly Phe Thr Glu Gly Ser Ile Ser Thr Phe Thr Lys Ile Asn Ile
1070 1075 1080
Glu Asn Val Lys Ser Val Val Thr Ala Gly Ser Glu Ala Thr Phe
1085 1090 1095
Phe Ile Thr Asn Asp Asn Met Ile Tyr Thr Thr Gly Lys Lys Glu
1100 1105 1110
Arg Val Phe Phe Ser Thr Glu Thr Asn Asp Ile Lys Gly Ile Arg
1115 1120 1125
Val Ile Asn Asn Ile Ile Asn Ala Lys Lys Ile Val Val Asn Gly
1130 1135 1140
Tyr Thr Ser Ala Ile Leu Thr Asn Asp Asn Lys Leu Phe Val Gly
1145 1150 1155
Gly Leu Ser Gly Tyr Gly Ser Ile Ala Asn Asn Asn Asn Thr Asn
1160 1165 1170
Ser Val Glu Asp Val Lys Asp Val Phe Val Thr Ala Asn Asn Thr
1175 1180 1185
Leu Tyr Ile Asp Asn Asn Asn Asn Leu Ile Ser Ser Gly Arg Asp
1190 1195 1200
Thr Tyr Gly Ile Ser Asp Glu Ser Tyr Arg Asp Met Ser Val Pro
1205 1210 1215
Tyr Tyr Lys Val Ser Ile Lys Lys Asp Val Asp Thr Val Phe Ser
1220 1225 1230
Ser Tyr Asn Thr Ile Phe Ile Lys Asp Ile Tyr Gly Lys Phe Tyr
1235 1240 1245
Ser Ser Thr Arg Asp Asn Arg Tyr Asn His Leu Gly Ile His His
1250 1255 1260
Arg Tyr Asp Asn Asp Lys Asn Glu Ala Leu Glu Gly Ser Leu His
1265 1270 1275
Ser Tyr Phe Lys Thr Asp Asn Thr Ser Asp Lys Ile Val Phe Asn
1280 1285 1290
Lys Lys Asn Glu Lys Leu Val Met Phe Asn Asp Lys Tyr Ile Lys
1295 1300 1305
Thr Asn Asn Lys Tyr Ile Asn Tyr Lys Asn Ile Phe Lys Asp Asn
1310 1315 1320
Phe Lys Tyr Thr Ser Ile Ile Leu Pro Phe Glu Val Ser Asp Ile
1325 1330 1335
Asp Ile Ser Lys Thr His Ser Leu Ala Val Ala Lys Asp Gly Lys
1340 1345 1350
Leu Tyr Gly Ile Gly Ser Asn Ser Tyr Lys Glu Ile Asn Gln Thr
1355 1360 1365
Leu Glu Asp Ile Glu Leu Leu Thr Leu Thr Glu Val Asn Ile Ser
1370 1375 1380
Asp Val Lys Lys Val Ala Cys Gly Asp Asn Tyr Ser Tyr Ile Ile
1385 1390 1395
Lys Thr Asp Asn Thr Leu Trp Ser Tyr Gly Lys Asn Thr Glu Tyr
1400 1405 1410
Gln Leu Gly Val Gly His Asn Asn Asp Val Arg Glu Leu Gln Lys
1415 1420 1425
Val Thr Gly Leu Pro Ser Val Lys Asp Ile Ser Ile Tyr Asn Ser
1430 1435 1440
Met Thr Leu Val Leu Thr Asn Glu Gly Glu Leu Tyr Ala Gln Gly
1445 1450 1455
Tyr Asn Thr Asn Gly Leu Phe Gly Leu Gly Glu Ser Glu Lys Asp
1460 1465 1470
Lys Ile Ile Arg Thr Phe Thr Lys Val Leu Thr Asn Val Lys Glu
1475 1480 1485
Ile Lys Ser His Asn Asp Asp His Ile Leu Val Ile Lys Asn Asp
1490 1495 1500
Asn Ser Leu Trp Ile Thr Gly Lys Asn Lys Ser Met Tyr Lys Ile
1505 1510 1515
Ser Ile Ser Ile Thr Asp Leu Tyr Glu Phe Thr Lys Ile Pro Ile
1520 1525 1530
Pro Glu His Leu Asn Asp Ile Leu Asp Ile Glu Leu Ser Asp Asp
1535 1540 1545
Thr Ile Tyr Met Ile Thr Lys Val Asp Thr Ser Lys Ala Ser Ile
1550 1555 1560
Glu Ile Val Glu Lys Ser Ile Ser Gln Val Arg Val Val Val Gln
1565 1570 1575
Asp Pro Asn Asn Val Ile Glu Lys Leu Glu Met Phe Ile Asn Asp
1580 1585 1590
Glu Leu Ile Ser Thr Lys Thr Asn Leu Glu Ile Asn Ser Ile Ile
1595 1600 1605
Phe Glu Ile Pro Gln Asn Lys Ile Val Leu Gly Glu Asn Lys Ile
1610 1615 1620
Leu Ile Lys Ala Ser Ser Pro Thr Gly Asp Leu Tyr Ser Ser Met
1625 1630 1635
Phe Ile Phe Lys Ser Glu Thr Gly Leu Lys Val Lys Lys Asp Ser
1640 1645 1650
Ile Leu Met Ile Asn Asn Lys Val Tyr Ser Ile Ile Asn Ile Thr
1655 1660 1665
Glu Asn Asn Thr Asp Leu Ile Val Thr Leu Asn Glu Gly Leu Lys
1670 1675 1680
Asp Asp Met Met Glu Asn Asn Pro Ile Tyr Gln Leu Ile Asn Lys
1685 1690 1695
Thr Lys Val Gln Val Lys Ile Asn Lys Ser Asp Leu Phe Lys Asp
1700 1705 1710
Met Lys Leu Val Glu Ile Lys Lys Ser Asp Ser Ser Tyr Gln Glu
1715 1720 1725
Ile Tyr Glu Leu Glu Glu Ala Asn Ile Lys Ser Ala Gln Pro Lys
1730 1735 1740
Ile Ile Val Glu Lys Gly Asp Lys Trp Thr Ala Ile Lys Arg Pro
1745 1750 1755
Ser Met Ile Phe Arg Tyr Asp Ala Glu Asn Asn Glu Pro Gln Ala
1760 1765 1770
<210> 50
<211> 1743
<212> PRT
<213> Clostridium difficile
<400> 50
Met Lys Gln Asn Lys Leu Leu Gln Arg Gly Ala Tyr Phe Asn Asp Lys
1 5 10 15
Asn Ile Leu Ile Asp Asp Phe Asp Lys Arg Tyr Asn Asp Tyr Asp Phe
20 25 30
Val Glu Phe Phe Thr Gly Ile Ser Asn Ser Thr Phe Gly Leu Lys Ser
35 40 45
Asp Gly Asn Leu Tyr Ala Cys Gly Asp Asn Thr Gly Phe Gln Leu Gly
50 55 60
Leu Gly Lys Asp Ser Ser Glu Arg Arg Met Phe Ser Lys Val Lys Ile
65 70 75 80
Asp Asn Val Lys Tyr Val Ser Cys Gly Ser Lys His Ser Val Ala Val
85 90 95
Thr Lys Asp Gly Phe Ala Tyr Gly Ala Gly Thr Ser Asn Val Gly Gln
100 105 110
Leu Gly Val Ile Glu Ser Thr Val Tyr Tyr Glu Phe Thr Lys Leu Pro
115 120 125
Ile Asp Asp Val Lys Thr Val Ala Cys Gly Tyr Asp Phe Thr Phe Val
130 135 140
Leu Lys Asn Asp Gly Thr Leu Tyr Ser Ala Gly Leu Asn Ser Ser Gly
145 150 155 160
Gln Leu Gly Leu Gly Asp Thr Asn Asn Arg Val Thr Phe Thr Lys Val
165 170 175
Asn Ile Asp Ser Val Lys Asp Val Val Thr Tyr Asn Gln Ser Val Phe
180 185 190
Ile Ile Lys Met Asp Gly Thr Ala His Ala Cys Gly Leu Asn Ser Asn
195 200 205
Gly Gln Leu Gly Ile Asn Ser Thr Leu Asn Lys Ser Val Phe Asn Lys
210 215 220
Ile Glu Gly Met Asp Asn Val Lys Gln Ile Ala Cys Gly Ser Ser His
225 230 235 240
Thr Ile Leu Ile Lys Asn Asp Gly Thr Met Tyr Thr Thr Gly Ser Asn
245 250 255
Gly Tyr Gly Gln Leu Gly Thr Gly Asn Asn Asn Asn Ser Ile Val Phe
260 265 270
Thr Leu Ser Ser Ile Asn Asn Val Lys Tyr Ala Ser Cys Gly Asn Asn
275 280 285
His Thr Met Ile Leu Lys Tyr Asp Asn Thr Leu Phe Ser Thr Gly Gln
290 295 300
Asn Asn Tyr Gly Gln Leu Ala Asn Ala Asn Lys Asp Val Ala Ser Arg
305 310 315 320
Asn Thr Phe Val Lys Val Asn Val Glu Asn Ile Lys Asp Ile Lys Cys
325 330 335
Gly Ser Gln Phe Asn Phe Leu Ile Asn Gly Ser Lys Glu Ile Phe Val
340 345 350
Ser Gly Cys Asn Leu Ala Gly Gln Leu Gly Ser Phe Phe His Thr Thr
355 360 365
Phe Leu Tyr Glu Phe Ser Lys Val Gln Ser Ser Asn Leu Asp Asn Tyr
370 375 380
Ser Gly Leu Leu Val Asn Asp Asp Tyr Leu Tyr Val Thr Lys Asp Asn
385 390 395 400
Ser Glu Phe Leu Asn Val Lys Leu Ser Asp Asn Phe Gln Asp Tyr Lys
405 410 415
Lys Ile Glu Leu Thr Asp Asn Asn Met Phe Ile Val Met Asn Asp Gly
420 425 430
Thr Leu Tyr Ala Cys Gly Leu Asn Asn Tyr Gly Gln Leu Gly Leu Gly
435 440 445
Asp Thr Val Asn Arg Ser Val Met Thr Lys Val Asp Ile Asp Asn Val
450 455 460
Leu Asp Ile Lys Gly Asn Gly Asn Ser Thr Phe Val Leu Lys Asn Asn
465 470 475 480
Gly Thr Leu Tyr Ser Cys Gly Tyr Asn Ser Ser Gly Ile Leu Gly Leu
485 490 495
Lys Asp Asn Thr Asn Arg Asn Ile Phe Thr Lys Ile Glu Ile Glu Asn
500 505 510
Ile Lys Glu Phe Cys Val Glu Ser Asn Tyr Ile Val Ala Leu Asn His
515 520 525
Ser Lys Glu Leu Tyr Gly Trp Gly Asn Gln Ser Tyr Ile Val Tyr Gly
530 535 540
Asp Asn Arg Asn Tyr Pro Tyr Lys Asp Thr Arg Val Ser Asn Val Glu
545 550 555 560
Lys Ile Ala Thr Trp Ser Asp Thr Leu Tyr Ile Leu Asp Ser Thr Gly
565 570 575
Ala Thr Lys Thr Ile Gly Tyr Ser Tyr Asn Gly Ser Gly Gly Tyr Pro
580 585 590
Ala Pro Ser Ser Ser Ser Thr Tyr Arg Glu Gly Gly Tyr Ile Asn Lys
595 600 605
Asn Thr Ser Tyr Arg Thr Leu Glu Phe Tyr Asn Thr Ser Lys Thr Lys
610 615 620
Leu Val Asn Leu Phe Ala Phe Tyr Asn Gly Cys Val Phe Val Asp Glu
625 630 635 640
Asn Gly Leu Ala Tyr Cys Ile Gly Glu Asn Asn Ile Asn Phe Arg Gly
645 650 655
Gly Ser Thr Thr Asn Glu Asn Asn Ser Leu Arg Phe Ile Asn Asn Ser
660 665 670
Gly Val Tyr Tyr Thr Asn Thr Asp Gly Thr Asp Tyr Thr Cys Tyr Gln
675 680 685
Trp Thr Tyr Lys Leu Ile Arg Cys Ser Ile Phe Asp Ser Pro Gln Asn
690 695 700
Ile Ile Gly Asn Ser Lys Asn Ile Leu Tyr Leu Ser Lys Asn Asn Ser
705 710 715 720
Thr Phe Lys Cys Thr Gly Asn Cys Ile Thr Tyr Gly Ile Asn Ser Gln
725 730 735
Asn Trp Tyr Ser Tyr Phe Ser Asp Ser Ser Asn Gly Ala Ile Ala Leu
740 745 750
Gly Asn Glu Phe Ile Leu Lys Asn Tyr Ser Gly Glu Cys Leu Leu Lys
755 760 765
Gly Tyr Gly Lys Ala Thr Asn Gly Glu Phe Gly Asn Ser Thr Asn Ile
770 775 780
Ser Ser Ile Ser Asn Tyr Asp Thr Gly Leu Lys Asp Ile Lys Asp Ile
785 790 795 800
Ile Val Lys Asn Asn Thr Val Val Val Val Asp Lys Asn Asn Asn Ile
805 810 815
Tyr Val Thr Gly Ala Asn Gln Phe Asn Lys Leu Gly Ile Gly Glu Tyr
820 825 830
Asn Asn Gln Pro Ile Arg Lys Phe Thr Asn Ile Thr Glu Gln Ser Asn
835 840 845
Ser Phe Ile Phe Met Asp Asp Ile Lys Glu Ile Thr Thr Ser Arg Asn
850 855 860
Thr Met Phe Ile Val Lys Asn Asp Gly Thr Ala Tyr Ala Thr Gly Asn
865 870 875 880
Asn Ser Ser Gly Gln Leu Gly Leu Gly Asp Thr Ile Asn Arg Asn Lys
885 890 895
Phe Thr Gln Ile Asn Leu Asp Asn Ile Lys Lys Ile Ser Thr Ser Ile
900 905 910
Asp Gly Asn Thr Thr Phe Ala Ile Arg Asn Asp Gly Thr Leu Tyr Ser
915 920 925
Thr Gly Leu Asn Thr Lys Gly Gln Leu Gly Leu Gly Asp Ile Val Asn
930 935 940
Arg Asn Thr Phe Thr Lys Val Asn Ile Gln Asn Val Arg Asp Val Val
945 950 955 960
Leu Gly Thr Thr His Ser His Ala Ile Lys Asp Asp Asn Thr Leu Tyr
965 970 975
Ser Cys Gly Glu Asn Thr His Gly Gln Leu Gly Leu Gly Ser Glu Ser
980 985 990
Asn His Pro Asp Val Leu Thr Phe Thr Val Asn Asn Ile Thr Asn Val
995 1000 1005
Arg Asp Val Tyr Cys Ser Asp Thr Thr Thr Phe Ile Val Lys Asp
1010 1015 1020
Thr Asn Ile Ala Tyr Cys Cys Gly Tyr Asn Asn Asn Ser Gln Leu
1025 1030 1035
Gly Met Gly Asn Thr Thr Asp Gln Tyr Ser Phe Ile Lys Cys Met
1040 1045 1050
Glu Asn Val Lys Glu Val Ile Pro Asn Glu Ile Asn Thr Tyr Ile
1055 1060 1065
Ile Thr Ile Tyr Asn Thr Ala Tyr Ser Thr Gly Leu Asn Thr Asp
1070 1075 1080
Tyr Cys Leu Gly Leu Asn Ser Asn Ser Asn Gln Ser Ser Phe Ser
1085 1090 1095
Glu Ile Pro Ile Ser Asn Val Val Lys Val Ala Pro Asn Arg Asn
1100 1105 1110
Asn Ala Val Leu Leu Leu Thr Ser Glu Gly Asp Val Tyr Thr Ala
1115 1120 1125
Gly Lys Cys Ser Asn Gly Ser Gly Thr Gly Ser Glu Thr Pro Glu
1130 1135 1140
Lys Ile Lys Lys Ile Ala Ser Lys Ala Lys Asp Ile Gly Met Asn
1145 1150 1155
Tyr Arg Cys Gly His Tyr Val Ser Asp Asn Gly Asp Leu Tyr Gly
1160 1165 1170
Thr Gly Phe Asn Asp Cys Gly Gln Leu Gly Val Gly Asn Val Thr
1175 1180 1185
Lys Arg Asp Thr Phe Ile Lys Thr Asn Thr Arg Val Lys Lys Ile
1190 1195 1200
Leu Pro Leu Glu Tyr Ala Asn Ile Ala Ile Lys Asp Thr Asn Asp
1205 1210 1215
Ile Tyr Ile Cys Gly Leu Asn Asn Tyr Gly Gln Leu Gly Val Gly
1220 1225 1230
Asn Arg Tyr Asp Ser Arg Asn Asn Asp Asn Arg Ile Phe Asn Tyr
1235 1240 1245
Lys His Met Asn Phe Val Met Gly Asp Leu Thr Ser Ile Lys Asn
1250 1255 1260
Arg His Asn Phe Ile Leu Leu Asn Asn Lys Ile Val Ile Pro Thr
1265 1270 1275
Thr Lys Asp Ile Asp Tyr Gly Leu Val Leu Gly Asn Leu Tyr Lys
1280 1285 1290
Gly Asp Leu Tyr Thr Glu Leu Pro Tyr Glu Asp Ile Lys Glu Val
1295 1300 1305
Ser Ile Ser Lys Thr His Ile Ile Ile Leu Leu Asn Asp Gly Thr
1310 1315 1320
Met Tyr Gly Cys Gly Thr Asn Tyr His Gly Glu Leu Leu Gln Asp
1325 1330 1335
Leu Ser Ile Asn Gln Val Asp Glu Phe Val Gln Ile Asn Val Ser
1340 1345 1350
Asp Val Lys His Val Ser Cys Gly Asp Asn Phe Thr Tyr Phe Ile
1355 1360 1365
Lys Ser Asp Asp Ser Leu Trp Ser Ile Gly Lys Asn Ser Glu Tyr
1370 1375 1380
Gln Leu Gly Ile Gly His Asn Asn Pro Val Thr Glu Leu Gln Arg
1385 1390 1395
Ile Thr Thr Ile Ser Ser Cys Lys Glu Val His Cys Gly Lys Asn
1400 1405 1410
Tyr Thr Leu Val Val Thr Thr Ser Asn Glu Leu Phe Val Gln Gly
1415 1420 1425
Tyr Asn Asp Lys Gly Ala Leu Gly Leu Gly Ser Asp Ser Glu Asn
1430 1435 1440
Thr Ile Ile Lys Phe Phe Thr Lys Ala Leu Thr Asp Ile Arg Glu
1445 1450 1455
Ile Lys Ser Tyr Gly Ser Asp His Ile Leu Val Leu Lys Asn Asp
1460 1465 1470
Asn Ser Val Trp Val Thr Gly Lys Asn Arg Asp Val Tyr Lys Ile
1475 1480 1485
Glu Gln Pro Val Glu Phe Leu Lys Glu Phe Thr Ile Val Pro Ile
1490 1495 1500
Ser Glu Asp Val Asn Thr Val Lys Asp Val Leu Ala Thr Asp Asn
1505 1510 1515
Thr Leu Tyr Ile Ile Ser Glu Val Gly Thr Thr Asn Ala Ala Ile
1520 1525 1530
Glu Ile Thr Glu Lys Ser Ile Ser Ser Ile Lys Ile Lys Ile Gln
1535 1540 1545
Asp Pro Asn Lys Asp Ile Ser Arg Ile Glu Met Leu Ile Asn Gly
1550 1555 1560
Glu Ser Val Lys Ser Val Ser Asp Leu Ile Thr Glu Lys Ile Ser
1565 1570 1575
Phe Glu Val Pro Pro Asp Lys Ile Lys Ile Gly Glu Asn Lys Ile
1580 1585 1590
Leu Phe Arg Ala Tyr Cys Lys Gly Asp Asp Leu Tyr Ala Ser Leu
1595 1600 1605
Phe Ile Phe Lys Glu Ser Thr Gly Asn Ser Ile Ile Lys Asp Ser
1610 1615 1620
Tyr Val Met Ile Gly Asn Arg Met Tyr Lys Val Val Asn Thr Thr
1625 1630 1635
Ser Asn Glu Gln Asp Ile Thr Ile Thr Leu Asp Arg Gly Leu Glu
1640 1645 1650
Glu Asp Leu Asn Leu Gly Asp Pro Ile Tyr Gln Leu Ile Asn Lys
1655 1660 1665
Thr Lys Val Gln Val Lys Ile Asn Lys Ser Asp Leu Phe Lys Asp
1670 1675 1680
Met Lys Leu Val Glu Ile Lys Lys Ser Asp Ser Ser Tyr Gln Glu
1685 1690 1695
Ile Tyr Glu Leu Glu Glu Ala Asn Ile Lys Ser Ala Gln Pro Lys
1700 1705 1710
Ile Ile Val Glu Lys Gly Asp Lys Trp Thr Ala Ile Lys Arg Pro
1715 1720 1725
Ser Met Ile Phe Arg Tyr Asp Ala Glu Asn Asn Glu Pro Gln Ala
1730 1735 1740
<210> 51
<211> 1773
<212> PRT
<213> Clostridium difficile
<400> 51
Met Lys Arg Thr Lys Leu Leu Gln Arg Gly Asn Phe Phe Gly Asp Lys
1 5 10 15
Asn Met Val Val Asp Glu Phe Asp Glu Gly Tyr Asp Asn Tyr Asp Phe
20 25 30
Ile Asn Phe Phe Thr Gly Cys Cys Asn Tyr Thr Phe Gly Leu Lys Asn
35 40 45
Asn Asn Ile Leu Tyr Gly Cys Gly Asp Asn Ser Asn Phe Gln Leu Gly
50 55 60
Leu Gly Glu Asp Asn Thr Thr Arg Lys Leu Phe Thr Lys Ile Pro Asn
65 70 75 80
Ile Ser Thr Asn Ile Lys Lys Val Ala Cys Gly Glu Ser His Ala Val
85 90 95
Ile Leu Thr Ser Asp Gly Glu Leu Leu Val Ala Gly Ile Asn Thr Asp
100 105 110
Gly Gln Met Gly Leu Gly Leu Glu Lys Val Gly Lys Thr Val Ser Thr
115 120 125
Phe Glu Lys Val Pro Glu Ile Lys Gly Val Lys Asp Ile Ala Cys Gly
130 135 140
Leu Gln Ser Thr Tyr Leu Leu Tyr Asn Asp Gly Thr Leu Tyr Val Ala
145 150 155 160
Gly Asn Asn Leu Tyr Gly Gln Leu Gly Leu Gly Thr Asn Gly Ala Ser
165 170 175
Ala Asn Val Asn Thr Phe Thr Lys Val Asp Val Asp Asn Val Lys Ala
180 185 190
Val Phe Ser Tyr Asn Lys Ser Ala Phe Ile Ile Lys Asn Asp Asn Lys
195 200 205
Cys Tyr Ser Thr Gly Phe Asn Asn Gln Gly Gln Leu Gly Leu Gly Asp
210 215 220
Lys Asn Asn Arg Asp Leu Phe Ser Leu Val Ser Ile Asn Asp Val Lys
225 230 235 240
Thr Ile Ala Cys Gly Ser Glu His Thr Val Leu Met Thr Tyr Asn Asn
245 250 255
Asp Ile Tyr Gly Cys Gly Lys Glu Lys Cys Phe Gly Asn Ala Leu Gln
260 265 270
Ser Ser Leu Phe Thr Lys Ile Glu Glu Val Asn Ile Lys Thr Ile Ala
275 280 285
Cys Gly His Gly Asn Thr Met Leu Ile Asp Asn Lys Gly Thr Leu Lys
290 295 300
Val Ala Gly Asn Asn Asp Ile Tyr Gln Leu Gly Ile Ala Asn Tyr Ser
305 310 315 320
Glu Asn Ile Asp Asn Ser Phe Ile Asp Leu Lys Asn Ile Val Ala Lys
325 330 335
Asn Ile Phe Ile Gly Leu Ser His Ser Ile Leu Ile Asp Ser Asn Asn
340 345 350
Asp Ser Tyr Cys Thr Gly Asp Asn Thr Tyr Gly Gln Leu Gly Ser Phe
355 360 365
Phe Asp Asp Met His Ile Val Glu Phe Lys Lys Met Asp Ser Glu Lys
370 375 380
Tyr Ser Tyr Ser Asn Tyr Ile Asn Leu Ile Lys Ser Glu Asp Lys Leu
385 390 395 400
Thr Leu Leu Lys Glu Glu Met Glu Ile Lys Asp Ile Glu Leu Pro Leu
405 410 415
Asp Ile His Ser Val Arg Asp Val Val Phe Ser Pro Tyr Cys Thr Leu
420 425 430
Val Ile Leu Gly Asn Gly Asp Val Tyr Gly Leu Gly Asn Asn Arg Tyr
435 440 445
Lys Gly Met Gly Ser Asp Leu Pro Ser Gln Leu Asn Glu Leu Thr Lys
450 455 460
Leu Ser Ile Ser Asn Val Lys Ser Ile Val Ala Ser Lys Asn Ile Ser
465 470 475 480
Gly Gly Ile Phe Tyr Ile Lys Asn Asp Asp Thr Cys Tyr Tyr Ser Gly
485 490 495
Pro Asn Ser Asn Ser Ile Ala Gly Val Leu Pro Ser Asn Ser Asp Val
500 505 510
Phe Lys Lys Ile Ser Ile Asp Asn Val Lys Lys Val Val Ile Asn Thr
515 520 525
Asp Leu Ser Asn Trp Phe Ser Leu Ile Val Thr Asn Asn Lys Gln Ile
530 535 540
Tyr Thr Ser Gly Lys Ser Ser Ser Tyr Val Asn Gly Leu Ser Asn Ala
545 550 555 560
Leu Ile Ser Gln Tyr Thr Glu Ile Ser Leu Ser Asn Val Thr Asp Ala
565 570 575
Tyr Ser Ser Tyr Asn Ala Thr Phe Ile Val Val Asp Glu Lys Lys Val
580 585 590
Tyr Ala Thr Gly Ile Asn Thr Asn Tyr Leu Leu Gly Phe Ser Thr Ser
595 600 605
Asp Gly Ser Asn Val Asn Leu Gly Leu Leu Ser Asp Trp Tyr Tyr Ile
610 615 620
Asn Ile Ser Gly Ser Ser Tyr Ser Arg Val Ser Cys Thr Asn Asn Ile
625 630 635 640
Thr Lys Ile Asn Asn Ile Ile Ile Tyr Glu Tyr Val Thr Val Phe Cys
645 650 655
Thr Asn Ile Gly Ser Phe Leu Thr Gly Tyr His Gly Thr Ser Trp Thr
660 665 670
Lys Pro Thr Asp Ser Ser Tyr Arg Val Gln Tyr Gln Gly Ile Ser Tyr
675 680 685
Ala Gly Tyr Leu Asp Ser Tyr Ile Tyr Asn Tyr Tyr Pro Thr Arg Cys
690 695 700
Thr Gln Ser Ser Ser Ser Thr Thr Phe Ala Tyr Leu Tyr Asn Gly Glu
705 710 715 720
Ser Ser Ser Asn Leu Lys Asn Val Asn Pro Asp Asn Leu Leu Ile Ser
725 730 735
Gly Gly Ser Ser Tyr Ile His Gln Tyr Gly Arg Asn Tyr Leu Asn Asn
740 745 750
Gln Ser Ser Asn Asn Ile Ala Ala Ser Asn Ile Asn Ser Gly Pro Ile
755 760 765
Thr Ser Asp Lys Ala Ile Phe Leu Tyr Lys Ala Leu Leu Tyr Leu Ser
770 775 780
Ser Asn Thr Leu Tyr Gly Phe Gly Asn Ile Ser Glu Ser Ala Lys Glu
785 790 795 800
Leu Asp Val Ser Asp Thr Gln Asp Gly Tyr Asn Ala Thr Asn Tyr Lys
805 810 815
Lys Val Met Lys Asn Ile Lys Asn Ile Phe Ile Pro Pro Tyr Asp Leu
820 825 830
Ser Arg Asp Lys Thr Arg Phe Ala Ile Leu Thr Asp Lys Ser Leu Phe
835 840 845
Ile Cys Gly Tyr Asn Ser Lys Gly Thr His Gly Ile Ser Val Asn Ser
850 855 860
Ser Leu Asn Leu Asn Asn Lys Ile Asn Tyr His Lys Lys Asn Ser Ser
865 870 875 880
Ser Glu Ile Ser Ser Asn Ile Gln Glu Ile Tyr Ser His Ser Lys Ser
885 890 895
Thr Tyr Leu Leu Thr Asn Asn Asn Met Leu Tyr Ser Val Gly Leu Asn
900 905 910
Asp Val Gly Gln Leu Gly Val Gly Asp Glu Ile Asn Arg Lys Val Phe
915 920 925
Thr Lys Ile Asn Ile Asp Asn Ile Lys Ser Ile Asn Val Asn Arg Phe
930 935 940
Thr Asp Asn Ser Lys His Ala Phe Ala Ile Lys Asn Asp Asn Thr Cys
945 950 955 960
Tyr Ala Val Gly Leu Asn Asn Ser Gly Gln Leu Gly Ile Gly Asp Asn
965 970 975
Val Asn Arg Asn Ile Phe Thr Lys Ile Asn Val Glu Asn Val Lys Tyr
980 985 990
Val Ala Val Tyr Gly Asn Thr Ser Leu Leu Leu Thr Asn Asp Gly Leu
995 1000 1005
Leu Tyr Gly Ala Gly Asn Asn Gly Lys Gly Gln Leu Gly Leu Gly
1010 1015 1020
Asp Thr Thr Ser Arg Asn Ile Phe Thr Arg Ile Pro Ile Asn Gly
1025 1030 1035
Val Arg Asp Val Tyr Leu Cys Asn Asp Val Ser Ile Ile Val Lys
1040 1045 1050
Asn Asp Asn Thr Cys Tyr Val Cys Gly Leu Val Asn Gly Tyr Phe
1055 1060 1065
Gly Phe Thr Glu Gly Ser Ile Ser Thr Phe Thr Lys Ile Asn Ile
1070 1075 1080
Glu Asn Val Lys Ser Val Val Thr Ala Gly Ser Glu Ala Thr Phe
1085 1090 1095
Phe Ile Thr Asn Asp Asn Met Ile Tyr Thr Thr Gly Lys Lys Glu
1100 1105 1110
Arg Val Phe Phe Ser Thr Glu Thr Asn Asp Ile Lys Gly Ile Arg
1115 1120 1125
Val Ile Asn Asn Ile Ile Asn Ala Lys Lys Ile Val Val Asn Gly
1130 1135 1140
Tyr Thr Ser Ala Ile Leu Thr Asn Asp Asn Lys Leu Phe Val Gly
1145 1150 1155
Gly Leu Ser Gly Tyr Gly Ser Ile Ala Asn Asn Asn Asn Thr Asn
1160 1165 1170
Ser Val Glu Asp Val Lys Asp Val Phe Val Thr Ala Asn Asn Thr
1175 1180 1185
Leu Tyr Ile Asp Asn Asn Asn Asn Leu Ile Ser Ser Gly Arg Asp
1190 1195 1200
Thr Tyr Gly Ile Ser Asp Glu Ser Tyr Arg Asp Met Ser Val Pro
1205 1210 1215
Tyr Tyr Lys Val Ser Ile Lys Lys Asp Val Asp Thr Val Phe Ser
1220 1225 1230
Ser Tyr Asn Thr Ile Phe Ile Lys Asp Ile Tyr Gly Lys Phe Tyr
1235 1240 1245
Ser Ser Thr Arg Asp Asn Arg Tyr Asn His Leu Gly Ile His His
1250 1255 1260
Arg Tyr Asp Asn Asp Lys Asn Glu Ala Leu Glu Gly Ser Leu His
1265 1270 1275
Ser Tyr Phe Lys Thr Asp Asn Thr Ser Asp Lys Ile Val Phe Asn
1280 1285 1290
Lys Lys Asn Glu Lys Leu Val Met Phe Asn Asp Lys Tyr Ile Lys
1295 1300 1305
Thr Asn Asn Lys Tyr Ile Asn Tyr Lys Asn Ile Phe Lys Asp Asn
1310 1315 1320
Phe Lys Tyr Thr Ser Ile Ile Leu Pro Phe Glu Val Ser Asp Ile
1325 1330 1335
Asp Ile Ser Lys Thr His Ser Leu Ala Val Ala Lys Asp Gly Lys
1340 1345 1350
Leu Tyr Gly Ile Gly Ser Asn Ser Tyr Lys Glu Ile Asn Gln Thr
1355 1360 1365
Leu Glu Asp Ile Glu Leu Leu Thr Leu Thr Glu Val Asn Ile Ser
1370 1375 1380
Asp Val Lys Lys Val Ala Cys Gly Asp Asn Tyr Ser Tyr Ile Ile
1385 1390 1395
Lys Thr Asp Asn Thr Leu Trp Ser Tyr Gly Lys Asn Thr Glu Tyr
1400 1405 1410
Gln Leu Gly Val Gly His Asn Asn Asp Val Arg Glu Leu Gln Lys
1415 1420 1425
Val Thr Gly Leu Pro Ser Val Lys Asp Ile Ser Ile Tyr Asn Ser
1430 1435 1440
Met Thr Leu Val Leu Thr Asn Glu Gly Glu Leu Tyr Ala Gln Gly
1445 1450 1455
Tyr Asn Thr Asn Gly Leu Phe Gly Leu Gly Glu Ser Glu Lys Asp
1460 1465 1470
Lys Ile Ile Arg Thr Phe Thr Lys Val Leu Thr Asn Val Lys Glu
1475 1480 1485
Ile Lys Ser His Asn Asp Asp His Ile Leu Val Ile Lys Asn Asp
1490 1495 1500
Asn Ser Leu Trp Ile Thr Gly Lys Asn Lys Ser Met Tyr Lys Ile
1505 1510 1515
Ser Ile Ser Ile Thr Asp Leu Tyr Glu Phe Thr Lys Ile Pro Ile
1520 1525 1530
Pro Glu His Leu Asn Asp Ile Leu Asp Ile Glu Leu Ser Asp Asp
1535 1540 1545
Thr Ile Tyr Met Ile Thr Lys Val Asp Thr Ser Lys Ala Ser Ile
1550 1555 1560
Glu Ile Val Glu Lys Ser Ile Ser Gln Val Arg Val Val Val Gln
1565 1570 1575
Asp Pro Asn Asn Val Ile Glu Lys Leu Glu Met Phe Ile Asn Asp
1580 1585 1590
Glu Leu Ile Ser Thr Lys Thr Asn Leu Glu Ile Asn Ser Ile Ile
1595 1600 1605
Phe Glu Ile Pro Gln Asn Lys Ile Val Leu Gly Glu Asn Lys Ile
1610 1615 1620
Leu Ile Lys Ala Ser Ser Pro Thr Gly Asp Leu Tyr Ser Ser Met
1625 1630 1635
Phe Ile Phe Lys Ser Glu Thr Gly Leu Lys Val Lys Lys Asp Ser
1640 1645 1650
Ile Leu Met Ile Asn Asn Lys Val Tyr Ser Ile Ile Asn Ile Thr
1655 1660 1665
Glu Asn Asn Thr Asp Leu Ile Val Thr Leu Asn Glu Gly Leu Lys
1670 1675 1680
Asp Asp Met Met Glu Asn Asn Pro Ile Tyr Gln Leu Ile Asn Lys
1685 1690 1695
Thr Lys Val Gln Val Lys Ile Asn Lys Ser Asp Leu Phe Lys Asp
1700 1705 1710
Met Lys Leu Val Glu Ile Lys Lys Ser Asp Ser Ser Tyr Gln Glu
1715 1720 1725
Ile Tyr Glu Leu Glu Glu Ala Asn Ile Lys Ser Ala Gln Pro Lys
1730 1735 1740
Ile Ile Val Glu Lys Gly Asp Lys Trp Thr Ala Ile Lys Arg Pro
1745 1750 1755
Ser Met Ile Phe Arg Tyr Asp Ala Glu Asn Asn Glu Pro Gln Ala
1760 1765 1770
<210> 52
<211> 1725
<212> PRT
<213> Clostridium difficile
<400> 52
Met Lys Gln Asn Lys Leu Leu Gln Arg Gly Ala Tyr Phe Asn Asp Lys
1 5 10 15
Asn Ile Leu Ile Asp Asp Phe Asp Lys Arg Tyr Asn Asp Tyr Asp Phe
20 25 30
Val Glu Phe Phe Thr Gly Ile Ser Asn Ser Thr Phe Gly Leu Lys Ser
35 40 45
Asp Gly Asn Leu Tyr Ala Cys Gly Asp Asn Thr Gly Phe Pro Leu Gly
50 55 60
Leu Gly Lys Asp Ser Ser Glu Arg Arg Met Phe Ser Lys Val Lys Ile
65 70 75 80
Asp Asn Val Lys Tyr Val Ser Cys Gly Ser Lys His Ser Val Ala Val
85 90 95
Thr Lys Asp Gly Phe Ala Tyr Gly Ala Gly Thr Ser Asn Val Gly Gln
100 105 110
Leu Gly Val Ile Glu Ser Thr Val Tyr Tyr Glu Phe Thr Lys Leu Pro
115 120 125
Ile Asp Asp Val Lys Thr Val Ala Cys Gly Tyr Asp Phe Thr Phe Val
130 135 140
Leu Lys Asn Asp Gly Thr Leu Tyr Ser Ala Gly Leu Asn Ser Ser Gly
145 150 155 160
Gln Leu Gly Leu Gly Asp Thr Asn Asn Arg Ala Thr Phe Thr Lys Val
165 170 175
Asn Ile Asp Ser Val Lys Asp Val Val Thr Tyr Asn Gln Ser Val Phe
180 185 190
Ile Ile Lys Met Asp Gly Thr Ala His Ala Cys Gly Leu Asn Ser Asn
195 200 205
Gly Gln Leu Gly Ile Asn Ser Thr Leu Asn Lys Ser Val Phe Asn Lys
210 215 220
Ile Glu Gly Met Asp Asn Val Lys Gln Ile Ala Cys Gly Ser Ser His
225 230 235 240
Thr Ile Leu Ile Lys Asn Asp Gly Thr Met Tyr Thr Thr Gly Tyr Asn
245 250 255
Gly Val Gly Gln Leu Gly Thr Gly Asn Asn Asn Asn Ser Ile Val Phe
260 265 270
Thr Leu Ser Ser Ile Asn Asn Val Lys Tyr Ala Ser Cys Gly Asn Asn
275 280 285
His Thr Met Ile Leu Lys Tyr Asp Asn Thr Leu Phe Ser Thr Gly Gln
290 295 300
Asn Asn Tyr Gly Gln Leu Ala Asn Ala Asn Lys Asp Val Ala Ser Arg
305 310 315 320
Asn Thr Phe Ala Lys Val Asn Val Glu Asn Ile Lys Asp Ile Lys Cys
325 330 335
Gly Ser Gln Phe Asn Phe Leu Ile Asn Gly Ser Lys Glu Ile Phe Val
340 345 350
Ser Gly Cys Asn Leu Ala Gly Gln Leu Gly Ser Phe Phe His Thr Thr
355 360 365
Phe Leu Tyr Glu Phe Ser Asn Val Gln Ser Ser Asn Leu Asp Asn Tyr
370 375 380
Ser Gly Leu Leu Val Asn Asp Asp Tyr Leu Tyr Val Thr Lys Asp Asn
385 390 395 400
Ser Glu Phe Leu Asn Val Lys Leu Ser Asp Asn Phe Gln Asp Tyr Lys
405 410 415
Lys Ile Glu Leu Thr Asp Ser Asn Met Phe Ile Val Met Asn Asp Gly
420 425 430
Thr Leu Tyr Ala Cys Gly Leu Asn Asn Tyr Gly Gln Leu Gly Leu Gly
435 440 445
Asp Thr Val Asn Arg Ser Val Met Thr Lys Val Asp Ile Asp Asn Val
450 455 460
Leu Asp Ile Lys Gly Asn Gly Asn Ser Thr Phe Val Leu Lys Asn Asn
465 470 475 480
Gly Thr Leu Tyr Ser Cys Gly Leu Asn Ser Asn Gly Gln Leu Gly Leu
485 490 495
Arg Asp Glu Val Asn Arg Asn Ile Phe Thr Lys Ile Glu Ile Glu Asn
500 505 510
Val Lys Asp Phe Cys Val Gly Ser Asn Tyr Val Ile Ala Leu Asn His
515 520 525
Ser Lys Glu Val Tyr Gly Trp Gly Asn Asn Pro Tyr Asn Asn Ile Glu
530 535 540
Lys Thr Ser Asn Tyr Pro Tyr Lys Gln Gly Ile Ser Asn Ile Glu Lys
545 550 555 560
Ile Ala Ala Tyr Asp Tyr Ser Val Tyr Met Ile Asn Ser Glu Gly Lys
565 570 575
Leu Tyr Val Ser Gly Tyr Asn Tyr Asn Tyr Gln Leu Gly Lys Gly Asn
580 585 590
Asn Ser Asn Gln Ser Lys Ala Leu Val Ser Gln Cys Arg Thr Asn Ser
595 600 605
Thr Ser Ser Thr Ser Asn Gly Leu Arg Thr Leu Pro Lys Ile Thr Asn
610 615 620
Val Phe Pro Phe Tyr Asp Gly Cys Ala Ile Ile Asp Glu Gly Gly Tyr
625 630 635 640
Val Tyr Leu Thr Gly Tyr His Gly Tyr Leu Arg Thr Leu Asn Ser Ser
645 650 655
Pro Ser Ile Ser Asp Tyr Ser Arg Tyr Gly Thr Phe Ile Glu Ala Thr
660 665 670
Asn Ser Asn His Asn Thr Tyr Phe Ile Gln Glu Thr Asp Phe Ser Gly
675 680 685
Ile Glu Lys Val Ile Gly Met Ser Asn Asn Ile Leu Phe Phe Lys Lys
690 695 700
Gly Ser Ser Tyr Ile Thr Gly Tyr Pro Lys Thr Phe Gly Ser Thr Ile
705 710 715 720
Thr Gly His Arg Ser Tyr Thr Ser Ile Asn Ser Glu Ser Ser Asn Leu
725 730 735
Gly Ser Asn Phe Ile Ile Tyr His Ser Asn Ser Lys Leu Tyr Gly Lys
740 745 750
Gly Ile Ala Asn Ser Gly Gln Phe Gly Asn Ser Thr Asn Ile Asp Gly
755 760 765
Thr Ser Asn Tyr Asp Thr Gly Leu Lys Asp Ile Lys Asp Ile Ile Val
770 775 780
Lys Gly Asn Thr Val Val Val Val Asp Lys Asn Asn Asn Ile Tyr Val
785 790 795 800
Thr Gly Met Asn Gln Asn Asn Lys Leu Gly Ile Gly Glu Tyr Asn Asn
805 810 815
Glu Pro Val Lys Lys Phe Thr Asn Ile Thr Glu Gln Ser Asn Ser Phe
820 825 830
Ile Phe Met Asp Asp Ile Lys Glu Ile Thr Thr Ser Arg Asn Thr Met
835 840 845
Phe Ile Val Lys Asn Asp Gly Thr Ala Tyr Ala Thr Gly Asn Asn Ser
850 855 860
Ser Gly Gln Leu Gly Leu Gly Asp Thr Ile Asn Arg Asn Lys Phe Thr
865 870 875 880
Gln Ile Asn Leu Asp Asn Ile Lys Lys Ile Ser Thr Ser Ile Asp Gly
885 890 895
Asn Thr Thr Phe Ala Ile Arg Asn Asp Gly Thr Leu Tyr Ser Thr Gly
900 905 910
Leu Asn Thr Lys Gly Gln Leu Gly Leu Gly Asp Ile Val Asn Arg Asn
915 920 925
Thr Phe Thr Lys Val Asn Ile Gln Asn Val Arg Asp Val Val Leu Gly
930 935 940
Thr Thr His Ser His Ala Ile Lys Asp Asp Asn Thr Leu Tyr Ser Cys
945 950 955 960
Gly Glu Asn Thr His Gly Gln Leu Gly Leu Gly Ser Glu Ser Asn His
965 970 975
Pro Asp Val Leu Thr Phe Thr Val Asn Asn Ile Thr Asn Val Arg Asp
980 985 990
Val Tyr Cys Ser Asp Thr Thr Thr Phe Ile Val Lys Asp Thr Asn Ile
995 1000 1005
Ala Tyr Cys Cys Gly Tyr Asn Asn Asn Ser Gln Leu Gly Met Gly
1010 1015 1020
Asn Thr Thr Asp Gln Tyr Ser Phe Ile Lys Cys Met Glu Asn Val
1025 1030 1035
Lys Glu Val Ile Pro Asn Glu Ile Asn Thr Tyr Ile Ile Thr Ile
1040 1045 1050
Tyr Asn Thr Ala Tyr Ser Thr Gly Leu Asn Thr Asp Tyr Cys Leu
1055 1060 1065
Gly Leu Asn Ser Asn Ser Asn Gln Ser Ser Phe Ser Glu Ile Pro
1070 1075 1080
Ile Ser Asn Val Val Lys Val Ala Pro Asn Arg Asn Asn Ala Val
1085 1090 1095
Leu Leu Leu Thr Ser Glu Gly Asp Val Tyr Thr Ala Gly Lys Cys
1100 1105 1110
Ser Asn Gly Ser Gly Thr Gly Ser Glu Thr Pro Glu Lys Ile Lys
1115 1120 1125
Lys Ile Ala Ser Lys Ala Lys Asp Ile Gly Met Asn Tyr Arg Cys
1130 1135 1140
Gly His Tyr Val Ser Asp Asn Gly Asp Leu Tyr Gly Thr Gly Phe
1145 1150 1155
Asn Asn Asn Gly Gln Leu Gly Val Gly Asp Val Thr Lys Arg Asp
1160 1165 1170
Thr Phe Ile Lys Thr Asn Thr Arg Val Lys Lys Ile Leu Pro Leu
1175 1180 1185
Glu Tyr Ala Asn Ile Ala Ile Lys Asp Thr Asn Asp Ile Tyr Ile
1190 1195 1200
Cys Gly Leu Asn Asn Tyr Gly Gln Leu Gly Val Gly Asn Arg Tyr
1205 1210 1215
Asp Ser Arg Asn Asn Asp Asn Arg Ile Phe Asn Tyr Lys His Met
1220 1225 1230
Asn Phe Val Met Gly Asp Leu Thr Ser Ile Lys Asn Arg His Asn
1235 1240 1245
Phe Ile Leu Leu Asn Asn Lys Ile Val Ile Pro Thr Thr Lys Asp
1250 1255 1260
Ile Asp Tyr Gly Leu Val Leu Gly Asn Leu Tyr Lys Gly Asp Leu
1265 1270 1275
Tyr Thr Glu Leu Pro Tyr Glu Asp Ile Lys Glu Val Ser Ile Ser
1280 1285 1290
Lys Thr His Ile Ile Ile Leu Leu Asn Asp Gly Thr Met Tyr Gly
1295 1300 1305
Cys Gly Thr Asn Tyr His Gly Glu Leu Leu Gln Asp Leu Ser Ile
1310 1315 1320
Asn Gln Val Asp Glu Phe Val Gln Ile Asn Val Ser Asp Val Lys
1325 1330 1335
His Val Ser Cys Gly Asp Asn Phe Thr Tyr Phe Ile Lys Ser Asp
1340 1345 1350
Asp Ser Leu Trp Ser Ile Gly Lys Asn Ser Glu Tyr Gln Leu Gly
1355 1360 1365
Ile Gly His Asn Asn Pro Val Thr Glu Leu Gln Arg Ile Thr Thr
1370 1375 1380
Ile Ser Ser Cys Lys Glu Val His Cys Gly Lys Asn Tyr Thr Leu
1385 1390 1395
Val Val Thr Thr Gly Asn Glu Leu Phe Val Gln Gly Tyr Asn Asp
1400 1405 1410
Lys Gly Ala Leu Gly Leu Gly Ser Asp Ser Glu Asn Thr Ile Ile
1415 1420 1425
Lys Phe Phe Thr Lys Ala Leu Thr Asp Ile Arg Glu Ile Lys Ser
1430 1435 1440
Tyr Gly Ser Asp His Ile Leu Val Leu Lys Asn Asp Asn Ser Val
1445 1450 1455
Trp Val Thr Gly Lys Asn Arg Asp Val Tyr Lys Ile Glu Gln Pro
1460 1465 1470
Val Glu Phe Leu Lys Glu Phe Thr Ile Val Pro Ile Ser Glu Asp
1475 1480 1485
Val Asn Thr Val Lys Asp Val Leu Ala Thr Asp Asn Thr Leu Tyr
1490 1495 1500
Ile Ile Ser Glu Val Gly Thr Thr Asn Ala Ala Ile Glu Ile Thr
1505 1510 1515
Glu Lys Ser Ile Ser Ser Ile Lys Ile Lys Ile Gln Asp Pro Asn
1520 1525 1530
Lys Asp Ile Ser Arg Ile Glu Met Leu Ile Asn Gly Glu Ser Val
1535 1540 1545
Lys Ser Val Ser Asp Leu Thr Thr Glu Lys Ile Ser Phe Glu Val
1550 1555 1560
Pro Pro Asp Lys Ile Lys Ile Gly Glu Asn Lys Ile Leu Phe Arg
1565 1570 1575
Ala Tyr Cys Lys Gly Asp Asp Leu Tyr Ala Ser Leu Phe Ile Phe
1580 1585 1590
Lys Glu Ser Thr Gly Asn Ser Ile Ile Lys Asp Ser Tyr Val Met
1595 1600 1605
Ile Gly Asn Arg Met Tyr Lys Val Val Asn Thr Thr Ser Asn Glu
1610 1615 1620
Gln Asp Ile Thr Ile Thr Leu Asp Arg Gly Leu Glu Glu Asp Leu
1625 1630 1635
Asn Leu Gly Asp Pro Ile Tyr Gln Leu Ile Asn Lys Thr Lys Val
1640 1645 1650
Gln Val Lys Ile Asn Lys Ser Asp Leu Phe Lys Asp Met Lys Leu
1655 1660 1665
Val Glu Ile Lys Lys Ser Asp Ser Ser Tyr Gln Glu Ile Tyr Glu
1670 1675 1680
Leu Glu Glu Ala Asn Ile Lys Ser Ala Gln Pro Lys Ile Ile Val
1685 1690 1695
Glu Lys Gly Asp Lys Trp Thr Ala Ile Lys Arg Pro Ser Met Ile
1700 1705 1710
Phe Arg Tyr Asp Ala Glu Asn Asn Glu Pro Gln Ala
1715 1720 1725
<210> 53
<211> 1743
<212> PRT
<213> Clostridium difficile
<400> 53
Met Lys Gln Asn Lys Leu Leu Gln Arg Gly Ala Tyr Phe Asn Asp Lys
1 5 10 15
Asn Ile Leu Ile Asp Asp Phe Asp Lys Arg Tyr Asn Asp Tyr Asp Phe
20 25 30
Val Glu Phe Phe Thr Gly Ile Ser Asn Ser Thr Phe Gly Leu Lys Ser
35 40 45
Asp Gly Asn Leu Tyr Ala Cys Gly Asn Asn Thr Gly Phe Pro Leu Gly
50 55 60
Leu Gly Lys Asp Ser Ser Glu Arg Arg Met Phe Ser Lys Val Lys Ile
65 70 75 80
Asp Asn Val Lys Tyr Val Ser Cys Gly Ser Lys His Ser Val Ala Val
85 90 95
Thr Lys Asp Gly Phe Ala Tyr Gly Ala Gly Thr Ser Asn Val Gly Gln
100 105 110
Leu Gly Val Ile Glu Ser Thr Val Tyr Tyr Glu Phe Thr Lys Leu Pro
115 120 125
Ile Asp Asp Val Lys Thr Val Ala Cys Gly Tyr Asp Phe Thr Phe Val
130 135 140
Leu Lys Asn Asp Gly Thr Leu Tyr Ser Ala Gly Leu Asn Ser Ser Gly
145 150 155 160
Gln Leu Gly Leu Gly Asp Thr Asn Asn Arg Ala Thr Phe Thr Lys Val
165 170 175
Asn Ile Asp Ser Val Lys Asp Val Val Thr Tyr Asn Gln Ser Val Phe
180 185 190
Ile Ile Lys Met Asp Gly Thr Ala His Ala Cys Gly Leu Asn Ser Asn
195 200 205
Gly Gln Leu Gly Ile Asn Ser Thr Leu Asn Lys Ser Val Phe Asn Lys
210 215 220
Ile Glu Gly Met Asp Asn Val Lys Gln Ile Ala Cys Gly Ser Ser His
225 230 235 240
Thr Ile Leu Ile Lys Asn Asp Gly Thr Met Tyr Thr Thr Gly Tyr Asn
245 250 255
Gly Val Gly Gln Leu Gly Thr Gly Asn Asn Asn Asn Ser Ile Val Phe
260 265 270
Thr Leu Ser Ser Ile Asn Asn Val Lys Tyr Ala Ser Cys Gly Asn Asn
275 280 285
His Thr Met Ile Leu Lys Tyr Asp Asn Thr Leu Phe Ser Thr Gly Gln
290 295 300
Asn Thr Tyr Gly Gln Leu Ala Asn Ala Asn Lys Asp Val Ala Ser Arg
305 310 315 320
Asn Thr Phe Ala Lys Val Asn Val Glu Asn Ile Lys Asp Ile Lys Cys
325 330 335
Gly Ser Gln Phe Asn Phe Leu Ile Asn Gly Ser Lys Glu Ile Phe Val
340 345 350
Ser Gly Cys Asn Leu Ala Gly Gln Leu Gly Ser Phe Phe His Thr Thr
355 360 365
Phe Leu Tyr Glu Phe Ser Lys Val Gln Ser Ser Asn Leu Asp Asn Tyr
370 375 380
Ser Gly Leu Leu Val Asn Asp Asp Tyr Leu Tyr Val Thr Lys Asp Asn
385 390 395 400
Ser Glu Phe Leu Asn Val Lys Leu Ser Asp Asn Phe Gln Asp Tyr Lys
405 410 415
Lys Ile Glu Leu Thr Asp Asn Asn Met Phe Ile Val Met Asn Asp Gly
420 425 430
Thr Leu Tyr Ala Cys Gly Leu Asn Asn Tyr Gly Gln Leu Gly Leu Gly
435 440 445
Asp Thr Val Asn Arg Ser Val Met Thr Lys Val Asp Ile Asp Asn Val
450 455 460
Leu Asp Ile Lys Gly Asn Gly Asn Ser Thr Phe Val Leu Lys Asn Asn
465 470 475 480
Gly Thr Leu Tyr Ser Cys Gly Tyr Asn Ser Ser Gly Ile Leu Gly Leu
485 490 495
Lys Asp Asn Thr Asn Arg Asn Ile Phe Thr Lys Ile Glu Ile Glu Asn
500 505 510
Val Lys Ala Phe Cys Val Glu Ser Asn Tyr Ile Val Val Leu Asn His
515 520 525
Ser Lys Glu Leu Tyr Gly Trp Gly Asn Glu Ser Tyr Ile Val Tyr Gly
530 535 540
Asn Ser Arg Asn Tyr Pro Tyr Lys Asp Thr Arg Val Ser Asn Val Glu
545 550 555 560
Lys Ile Ala Thr Trp Ser Asp Thr Leu Tyr Ile Leu Asp Ser Thr Gly
565 570 575
Ala Thr Lys Thr Ile Gly Tyr Ser Tyr Asn Gly Ser Gly Gly Tyr Pro
580 585 590
Ala Pro Ser Ser Ser Ser Thr Tyr Arg Asp Gly Gly Tyr Ile Asn Lys
595 600 605
Asn Thr Ser Tyr Arg Thr Leu Glu Phe Tyr Asn Thr Ser Lys Thr Lys
610 615 620
Leu Val Asn Leu Phe Ala Phe Tyr Asn Gly Cys Val Phe Val Asp Glu
625 630 635 640
Asn Gly Leu Ala Tyr Cys Ile Gly Glu Asn Asn Ile Asn Phe Arg Gly
645 650 655
Asn Ser Thr Thr Asn Glu Asn Asn Ser Leu Arg Phe Ile Asn Asn Ser
660 665 670
Gly Val Tyr Tyr Thr Asn Thr Asp Gly Thr Asp Tyr Thr Cys Tyr Gln
675 680 685
Trp Thr Tyr Lys Leu Ile Arg Cys Ser Ile Phe Asp Ser Pro Gln Asn
690 695 700
Ile Ile Gly Asn Ser Lys Asn Ile Leu Tyr Leu Ser Lys Asn Asn Ser
705 710 715 720
Thr Phe Lys Cys Thr Gly Asn Cys Ile Thr Tyr Gly Ile Asn Ser Gln
725 730 735
Asn Trp Tyr Ser Tyr Phe Ser Asp Ser Ser Asn Gly Ala Ile Ala Leu
740 745 750
Gly Asn Glu Phe Ile Leu Lys Asn Tyr Ser Gly Glu Cys Leu Leu Lys
755 760 765
Gly Tyr Gly Lys Ala Thr Asn Gly Glu Phe Gly Asn Ser Thr Asn Ile
770 775 780
Ser Ser Ile Ser Asn Tyr Asp Thr Gly Leu Lys Asp Ile Lys Asp Ile
785 790 795 800
Ile Val Lys Asn Asn Thr Val Val Val Val Asp Lys Asn Asn Asn Ile
805 810 815
Tyr Val Thr Gly Ala Asn Gln Phe Asn Lys Leu Gly Ile Gly Glu Tyr
820 825 830
Asn Asn Gln Pro Ile Lys Lys Phe Thr Asn Ile Thr Glu Gln Ser Asn
835 840 845
Ser Phe Ile Phe Met Asp Asp Ile Lys Glu Ile Thr Thr Ser Arg Asn
850 855 860
Thr Met Phe Ile Val Lys Asn Asp Gly Thr Ala Tyr Ala Thr Gly Asn
865 870 875 880
Asn Ser Ser Gly Gln Leu Gly Leu Gly Asp Thr Ile Asn Arg Asn Lys
885 890 895
Phe Thr Gln Ile Asn Leu Asp Asn Ile Lys Lys Ile Ser Thr Ser Ile
900 905 910
Asp Gly Asn Thr Thr Phe Ala Ile Arg Asn Asp Gly Thr Leu Tyr Ser
915 920 925
Thr Gly Leu Asn Thr Lys Gly Gln Leu Gly Leu Gly Asp Ile Val Asn
930 935 940
Arg Asn Thr Phe Thr Lys Val Asn Ile Gln Asn Val Arg Asp Val Val
945 950 955 960
Leu Gly Thr Thr His Ser His Ala Ile Lys Asp Asp Asn Thr Leu Tyr
965 970 975
Ser Cys Gly Glu Asn Thr His Gly Gln Leu Gly Leu Gly Ser Glu Ser
980 985 990
Asn His Pro Asp Val Leu Thr Phe Thr Val Asn Asn Ile Thr Asn Val
995 1000 1005
Arg Asp Val Tyr Cys Ser Asp Thr Thr Thr Phe Ile Val Lys Asp
1010 1015 1020
Thr Asn Ile Ala Tyr Cys Cys Gly Tyr Asn Asn Asn Ser Gln Leu
1025 1030 1035
Gly Met Gly Asn Thr Thr Asp Gln Tyr Ser Phe Ile Lys Cys Met
1040 1045 1050
Glu Asn Val Lys Glu Val Ile Pro Asn Glu Ile Asn Thr Tyr Ile
1055 1060 1065
Ile Thr Ile Tyr Asn Thr Ala Tyr Ser Thr Gly Leu Asn Thr Asp
1070 1075 1080
Tyr Cys Leu Gly Leu Asn Ser Asn Ser Asn Gln Ser Ser Phe Ser
1085 1090 1095
Glu Ile Pro Ile Ser Asn Val Val Lys Val Ala Pro Asn Arg Asn
1100 1105 1110
Asn Ala Val Leu Leu Leu Thr Ser Glu Gly Asp Val Tyr Thr Ala
1115 1120 1125
Gly Lys Cys Ser Asn Gly Ser Gly Thr Gly Ser Glu Thr Pro Glu
1130 1135 1140
Lys Ile Lys Lys Ile Ala Ser Lys Ala Lys Asp Ile Gly Met Asn
1145 1150 1155
Tyr Arg Cys Gly His Tyr Val Ser Asp Asn Gly Asp Leu Tyr Gly
1160 1165 1170
Thr Gly Phe Asn Asp Cys Gly Gln Leu Gly Val Gly Asp Val Thr
1175 1180 1185
Lys Arg Asp Thr Phe Ile Lys Thr Asn Thr Arg Val Lys Lys Ile
1190 1195 1200
Leu Pro Leu Glu Tyr Ala Asn Ile Ala Ile Lys Asp Thr Asn Asp
1205 1210 1215
Ile Tyr Ile Cys Gly Leu Asn Asn Tyr Gly Gln Leu Gly Val Gly
1220 1225 1230
Asn Arg Tyr Asp Ser Arg Asn Asn Asp Asn Arg Ile Phe Asn Tyr
1235 1240 1245
Lys His Met Asn Phe Val Met Gly Asp Leu Thr Ser Ile Lys Asn
1250 1255 1260
Arg His Asn Phe Ile Leu Leu Asn Asn Lys Ile Val Ile Pro Thr
1265 1270 1275
Thr Lys Asp Ile Asp Tyr Gly Leu Val Leu Gly Asn Leu Tyr Lys
1280 1285 1290
Gly Asp Leu Tyr Thr Glu Leu Pro Tyr Glu Asp Ile Lys Glu Val
1295 1300 1305
Ser Ile Ser Lys Thr His Ile Ile Ile Leu Leu Asn Asp Gly Thr
1310 1315 1320
Met Tyr Gly Cys Gly Thr Asn Tyr His Gly Glu Leu Leu Gln Asp
1325 1330 1335
Leu Ser Ile Asn Gln Val Asp Glu Phe Val Gln Ile Asn Val Ser
1340 1345 1350
Asp Val Lys His Val Ser Cys Gly Asp Asn Phe Thr Tyr Phe Ile
1355 1360 1365
Lys Ser Asp Asp Ser Leu Trp Ser Ile Gly Lys Asn Ser Glu Tyr
1370 1375 1380
Gln Leu Gly Ile Gly His Asn Asn Pro Val Thr Glu Leu Gln Arg
1385 1390 1395
Ile Thr Thr Ile Ser Ser Cys Lys Glu Val His Cys Gly Lys Asn
1400 1405 1410
Tyr Thr Leu Val Val Thr Thr Gly Asn Glu Leu Phe Val Gln Gly
1415 1420 1425
Tyr Asn Asp Lys Gly Ala Leu Gly Leu Gly Ser Asp Ser Glu Asn
1430 1435 1440
Thr Ile Ile Lys Phe Phe Thr Lys Ala Leu Thr Asp Ile Arg Glu
1445 1450 1455
Ile Lys Ser Tyr Gly Ser Asp His Ile Leu Val Leu Lys Asn Asp
1460 1465 1470
Asn Ser Val Trp Val Thr Gly Lys Asn Arg Asp Val Tyr Lys Ile
1475 1480 1485
Glu Gln Pro Val Glu Phe Leu Lys Glu Phe Thr Ile Ile Pro Ile
1490 1495 1500
Ser Glu Asp Val Asn Thr Val Lys Asp Val Leu Ala Thr Asp Asn
1505 1510 1515
Thr Leu Tyr Ile Ile Ser Glu Val Gly Thr Thr Asn Ala Ala Ile
1520 1525 1530
Glu Ile Thr Glu Lys Ser Ile Ser Ser Ile Lys Ile Lys Ile Gln
1535 1540 1545
Asp Pro Asn Lys Asp Ile Ser Arg Ile Glu Met Leu Ile Asn Gly
1550 1555 1560
Glu Ser Val Lys Ser Val Ser Asp Leu Ile Thr Glu Lys Ile Ser
1565 1570 1575
Phe Glu Val Pro Pro Asp Lys Ile Lys Ile Gly Glu Asn Lys Ile
1580 1585 1590
Leu Phe Arg Ala Tyr Cys Lys Gly Asp Asp Leu Tyr Ala Ser Leu
1595 1600 1605
Phe Ile Phe Lys Glu Ser Thr Gly Asn Ser Ile Ile Lys Asp Ser
1610 1615 1620
Tyr Val Met Ile Gly Asn Arg Met Tyr Lys Val Val Asn Thr Thr
1625 1630 1635
Ser Asn Glu Gln Asp Ile Thr Ile Thr Leu Asp Arg Gly Leu Glu
1640 1645 1650
Glu Asp Leu Asn Leu Gly Asp Pro Ile Tyr Gln Leu Ile Asn Lys
1655 1660 1665
Thr Lys Val Gln Val Lys Ile Asn Lys Ser Asp Leu Phe Lys Asp
1670 1675 1680
Met Lys Leu Val Glu Ile Lys Lys Ser Asp Ser Ser Tyr Gln Glu
1685 1690 1695
Ile Tyr Glu Leu Glu Glu Ala Asn Ile Lys Ser Ala Gln Pro Lys
1700 1705 1710
Ile Ile Val Glu Lys Gly Asp Lys Trp Thr Ala Ile Lys Arg Pro
1715 1720 1725
Ser Met Ile Phe Arg Tyr Asp Ala Glu Asn Asn Glu Pro Gln Ala
1730 1735 1740
<210> 54
<211> 341
<212> PRT
<213> Clostridium difficile
<400> 54
Met Ala Ile Asp Lys Ser Tyr Tyr Thr Ile Ile Thr Asp Val Gly Lys
1 5 10 15
Ala Lys Ile Ala Asn Ala Ser Val Thr Gly Asn Lys Val Gly Phe Val
20 25 30
Lys Ile Gln Leu Gly Asp Gly Gly Gly Ser Glu Tyr Thr Pro Thr Glu
35 40 45
Ser Gln Thr Ala Leu Lys Asn Val Val Trp Glu Gly Asn Ile Gly Asn
50 55 60
Thr Thr Thr Asp Glu Thr Ala Pro Asn Cys Ile Ile Leu Glu Ser Leu
65 70 75 80
Ile Pro Ser Ser Val Gly Gly Phe Met Ile Arg Glu Ile Gly Tyr Leu
85 90 95
Asp Asp Glu Asn Asn Leu Ile Ala Ile Ser Lys Tyr Lys Glu Cys Tyr
100 105 110
Lys Pro Ser Ile Glu Gln Gly Ala Val Val Asp Met Lys Val Lys Thr
115 120 125
Val Leu Ile Val Ser Asn Val Asn Asn Ile Glu Leu Lys Ile Asp Pro
130 135 140
Thr Ile Ile Phe Ala Thr Leu Lys Asp Ile Gln Asp Leu Glu Thr Lys
145 150 155 160
Ile Gly Thr Val Asn Thr Lys Ile Asp Thr Thr Lys Thr Glu Leu Thr
165 170 175
Ser Asn Ile Glu Thr Thr Lys Thr Glu Leu Asn Thr Arg Ile Asp Thr
180 185 190
Glu Asn Glu Lys Gln Asn Ile Lys Ile Asp Gln Leu Ile Ala Gly Gly
195 200 205
Ser Asn Val Ala Ser Thr Gln Ile Ile Thr Ile Asp Asp Trp Val Glu
210 215 220
Asp Ala Glu Asn Gly Phe Lys Ala Thr Val Thr His Ser Leu Leu Thr
225 230 235 240
Gln Arg Ile Val Val Asn Ile Ile Asp Ala Thr Thr Lys Glu Asn Val
245 250 255
Val Thr Asn Phe Lys Ile Ile Asp Asp Asn Ser Ile Glu Ile Arg Ser
260 265 270
Glu Val Lys Val Glu Leu Asn Val Tyr Val Ile Asn Gly Asn Ala Glu
275 280 285
Thr His Phe Ile Asn Ala Thr Val Asp Asp Asn Arg Val Ser Glu Met
290 295 300
Thr Thr Tyr Ser Ser Lys Lys Ile Glu Asp Arg Leu Val Asn Ile Glu
305 310 315 320
Glu Lys Val Asn Gly Gly Leu Ser Asn Ile Ala Thr Ser Val Asn Glu
325 330 335
Leu Ile Thr Tyr Cys
340
<210> 55
<211> 132
<212> PRT
<213> Clostridium difficile
<400> 55
Met Ala Glu Gln Gln Tyr Phe Thr Leu Val Thr Asp Ile Gly Lys Ala
1 5 10 15
Ala Ile Ala Asn Ala Ser Val Thr Gly Glu Lys Val Asp Phe Ala Lys
20 25 30
Ile Lys Val Gly Asp Gly Gly Gly Ser Ser Tyr Thr Pro Asn Glu Ser
35 40 45
Gln Thr Ala Leu Lys Asn Val Val Trp Glu Ser Thr Leu Glu His Ala
50 55 60
Gln Val Asp Lys Asp Asn Pro Asn Trp Val Val Ile Gln Lys Phe Ile
65 70 75 80
Pro Gly Asp Val Gly Gly Phe Glu Ile Arg Glu Val Gly Leu Phe Asp
85 90 95
Ser Lys Asp Gln Leu Leu Ala Val Ser Ser Tyr Pro Thr Thr Tyr Lys
100 105 110
Pro Glu Ser Arg Phe Gly Asp Cys Lys Arg Thr Ile Asn Lys Ser Asn
115 120 125
Ile Ser Cys Ile
130
<210> 56
<211> 205
<212> PRT
<213> Clostridium difficile
<400> 56
Met Pro Asn Glu Leu Asn Phe Asn Asn Glu Ile Glu Glu Tyr Leu Ile
1 5 10 15
Thr Thr Pro Ala His Ala Asn Glu Phe Asn Asn Arg Gln Gln Lys Leu
20 25 30
Leu Asp Asn Asp Lys Tyr Leu Asn Asn Lys Ile Asp Thr Thr Lys Thr
35 40 45
Glu Leu Asn Thr Arg Ile Asp Thr Glu Asn Glu Lys Gln Asn Ile Lys
50 55 60
Ile Asp Gln Leu Ile Ala Gly Gly Ser Asn Val Ala Tyr Thr Gln Arg
65 70 75 80
Val Ala Ile Asp Asp Trp Val Glu Asp Ala Glu Asn Gly Phe Lys Ala
85 90 95
Thr Val Thr His Ser Leu Leu Thr Gln Arg Ile Val Val Asn Ile Ile
100 105 110
Asp Ala Thr Thr Lys Glu Asn Val Val Thr Asn Phe Lys Ile Ile Asp
115 120 125
Asp Asn Ser Ile Glu Ile Arg Ser Glu Thr Arg Ser Glu Leu Asn Val
130 135 140
Tyr Val Ile Asn Gly Asn Ala Glu Thr His Phe Ile Asn Ala Thr Val
145 150 155 160
Asp Asp Asn Arg Val Ser Glu Met Thr Thr Tyr Ser Ser Lys Lys Ile
165 170 175
Glu Asp Arg Leu Val Asn Ile Glu Glu Lys Val Asn Gly Gly Leu Ser
180 185 190
Asn Ile Ala Thr Ser Val Asn Glu Leu Ile Thr Tyr Cys
195 200 205
<210> 57
<211> 14
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 57
ggccgcctcg aggg 14
<210> 58
<211> 14
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 58
cgcgccctcg aggc 14
<210> 59
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 59
tgaagtacca tggtatccag 20
<210> 60
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 60
actggatacc atggtacttc 20
<210> 61
<211> 19897
<212> DNA
<213> Clostridium difficile
<400> 61
gcaataccca ctacaccttc gtcatcttta aatttaagag tttttactat tgaataataa 60
aggtatattc cagtaaaaat aatctttaaa tacaagaaaa ataaactctt tgggtatatt 120
aaaaagctaa aaagtgtaaa tataaaagca agtagagtac ttatcctgta aaagaaatct 180
atttgtgtaa tgtctttata ttttatcata aacaccgaat ataaaatgat gaaaacaatt 240
gcgacgattg catatatggt aaataacata ttttcaagag taccatttga aattactatc 300
cacttatacc acataattgg ccaaaataat agtgctaaga acttaaaata attatcaaac 360
aacttttctt tatacattca tcaaacaacc tttcttaaca aaagcatata tttgttttta 420
gaattttaaa taatatgata tcattattat atattaatat tgaatttata gaaaccaaaa 480
tttgttaaaa taaatatata gattttactg ttaagccagt taaaattact actattttta 540
ttatgaaatt ggatcaaata tgtagaaata cggcaaatta gttaatatta aatatttatt 600
atttccaagt tgtaaagact gtttttttaa tgatagaaat tctaatcttt tttgaaagaa 660
agtaatatcc acattaagta tgtctgccat ttcataaacg caagtgatgc cagagttaat 720
tatgtttatt atatcttctt cagtaattaa gaactcacaa gcccatttta aggctttatt 780
ttcgcactta tctataataa tttttgtata ataatcgtta taagaggata catagtatcc 840
aaggctagtg aaatgatgtc caagttcttc agctaagatg gatgtcaatt tttttgagtt 900
ttgttttaaa ttactgagta atgatataat tttaatacca tgtttgttta tatatagtcc 960
ttctaaatca cctgcaatat aagtggtata atgaattatt atctcttctt gagaagctaa 1020
ttcaaaaagc ttatccaaat tattcataaa aatcccccta aaatagaatg tatgtttgcc 1080
tttaaattat attaaaagag cagaaaaata gactgctcat catatggttt attttttttt 1140
atatttattt agtaaaaatt ctatataatc attaagttgt tcttgtgctt cttcaggtaa 1200
ctcttcatgt ggattttttc tatgtgcagc tactgtatca atattttcct taactaaggt 1260
tcttccaaga aggtaatcaa ctgatacatt aaatacatca gccaatttat ttaaaatgtg 1320
ttcatcagga aatctgtttt ctgtttcata gtaccctaag actctttggg aaacgcctac 1380
tttttctcca agttctcttt gagtcaatcc aaattccttt ctaagttctc ttaatctttt 1440
ggcaaacatt ataacaccac cttatgtata gattataaca aattgttcta aaaaataaaa 1500
ctaataaaat ataaaagaat atttttttct aaaatctatt gataaagaac aaataattct 1560
atataatcta agtgaggaag aacaaaatat tcttaatagt aatggaggta taaaacaatg 1620
tttaaaaata acttgaaata ttatagaaaa tgcaaaggta tgacacaaat tcaacttgcc 1680
agaaaggctg gaattacaaa tgattatata tctcaaatag aaagaggtat aaaaaatcct 1740
ggacttctta tggctaagaa gatttctagt attttagaac aaaatataga agaagttttt 1800
tttatacagt tatagaacaa tatgttcttg aaagttgtga gattagtaaa aaactgtgca 1860
ctaaagagat tattgtaaat ttgaagctaa taataagtat ataaaaaagg ggaagtacta 1920
tggaaaacaa aaaagatata ttatttaaag aaacagataa aagattacat aattataagt 1980
atttggatat aaagataaag aatattaact tggacataaa aagatgtgag aatgaatact 2040
ctggatgtgg agcaatggta tatacagaaa agactagtaa cacatataac ataagctctt 2100
ctgtggaaaa tgaggtgtta aaaagagagg aaagattaag aaaattaaaa atggaaaaag 2160
aagatataga aatagaaaaa gagaagatag aaaatgctct aacgtgtcta aatgatatag 2220
aaatggaatt ttttaatctt ttttataata gtaagacaaa aaacaatatg acatatattt 2280
ctatgaaact acacttagat agaacatctt gctacaattt aaagaaaaag atgatattta 2340
aattgagtga gatattataa aaaataggac aattttacaa cactttatat acaccattgc 2400
aacaataggc aataaaatat gtgagataat gttattgtga aagaaatcca tattgaagga 2460
ggtgatagat tgaaaagaat aatattacct aaaaatatag aagatacttg acaggaataa 2520
atgagatata tatttaaaaa tgacttatat catttatagt aagattatca gattaagcaa 2580
gaatatttag tgatagtgtg gtgattattt gcttaaatac aaggaaatat tagaaacaat 2640
tattgagatt ctcaaaaaaa actttactga aagtattttt attgatgatg aaagtgtgca 2700
aggctctgaa gggtcttgtt tttttgtaag tatactatca gttatttgta cacctgtaat 2760
gttaaatacg aataacaaag atattgttat ctctataaaa tacttaccaa aaccacagtc 2820
aaagagtatt agaatgtatg aaatttcaga tgaattaaat aagctattta acagaaatat 2880
aaaggtaaca gacagaaaat taaatataac aaagctagaa caaagtatta aaaaagaaga 2940
gtcaatttat gtattgaact ttacatttac actaaactat ctggatagtg tatatgaaga 3000
agatgtagta tatgaaaata tgaaagaaat caatttaaat ttaggagagt gatagtatgg 3060
ctataggatt accaagtatc aacatatcat ttaaggagct agctacaact gttaaagaac 3120
gttcagctag aggaataatt gcaatggtac ttaaagatgc taaggcacta ggtcttaatg 3180
aaatacatga aaaagaggat ataccagttg atttatctgc tgaaaataaa gaatatataa 3240
atttagcttt gatgggaaat gttaacactc caaataaatt attagtttat gtaatagaag 3300
gagaagcaga tattcaaact gcattagatt ttttagagac taaggaattt aattatctat 3360
gtatgccaaa agcagtagaa gctgataaga ctgctataaa aaattggata attaaactta 3420
gagatataga taaggttaag gttaaagctg tattaggaaa agttgtagga aatcatgaag 3480
ggataattaa ttttactaca gaagatgtgt tagttggaga aaagaaatac agtgttgatg 3540
agtttacaag cagggtggct ggacttatag caggtacacc tttaagtcaa tcagtaactt 3600
atactaaact tagtgatgta gtcgatatac ctaagatgac gaaagttgat gcagaatcaa 3660
gggttaataa aggagagctt atacttatta aagaagcagg agctataaga attgctagag 3720
gagtaaattc tttaactgaa ttaacagcag aaaaaggaga aatgttccag aaaataaaaa 3780
tagttgacac tttagatatt atacatagtg acataagaaa ggtgataata gatgactata 3840
taggaaaggt tactaacagt tatgacaaca aatgtttatt gatagtagct ataaaaagtt 3900
atttagaaga attagaaaaa tcagcactta tagaatctga ttctactgtt gaaatagatt 3960
ttgaagcaca aaaatcgtat ttaaaatcaa aaggagtaga tttatcttat atgacattac 4020
aagaaataaa agaagctaac acaggttcta aagtattttt aaaagcaaaa ataaaagtac 4080
ttgatgctat ggaagatata gatttatcaa tagaaatata ggaggattat taatatggca 4140
aatatggaag ctagaaatgt aatgagtggt acttggggag aactttggct tgatggaaac 4200
aaagtagcag aagtaaagaa atttcaagca aagatggaat ttacaaaaga agatattata 4260
atagcaggtc aaatgggtac tgatacaaag tatatgggat ataaaggaaa aggctcaata 4320
actctatacc acgttagttc aagaatgcac aagttaattg gagaaaagat aaagagaggt 4380
tctgaaccta gatttgttgc tatatcaaaa ttaaatgacc cagattctta tggagcagaa 4440
agaatagcag taaaaaatat agcatttgat gatttaactt tagctgattg ggaggttgga 4500
gtaaaaggag agatagaagc tcctttcaca tttactgagt atgattttct tgatataatt 4560
tagttttata tttagtttta tactgatatt tagtaagtat atacttaata aattcagata 4620
gttaataagt aaaaaagtta gttgattgaa tttgattgat aaaggagcaa ataataatga 4680
gtgaaaatgg attatcaaaa aatataaaca tagtagattt acttttaaat tcagatacag 4740
aaaacttaga aagaccaagt actatagttg aacttaagag attatcaact atatttgggc 4800
aggaatttaa agtaatgtgt agagctttaa caataagtaa agatgaagaa atacaaaata 4860
cttgtcttaa aattgatgaa aatatgaaaa cggatataga cttaccggag atgcagatgc 4920
ttacaattat agaaggtgtt tgtgatttgg atggaaagct tttatttaaa aataaggagc 4980
taatggataa atttaaggct ccaacaccaa aagaattagc aagaaaatta ttattaccag 5040
gtgaaattac caacttatat agaatacttc aagatgttat gggttatggt aaaaatgcag 5100
tgatagaaga ggtaaaaaac taatagggac ggataccagg actacaataa tgtactatta 5160
ttggaagaaa aaaggtataa gaccgtccct tttttatgca atggataaag gcgaattaaa 5220
gcttattgaa gcttttttcg ccttagaaat tgaggaagaa gttgaaaaaa tgaaacatgg 5280
atatggagtg tgtcctttga caggaggtgg tatgtaatgg gaaatgtgag agaagaaggt 5340
ataaatatgt accttacaga taattacaca ccaaaaatga atcaaattat atcagtaact 5400
gataatttta ggagagcaac tgtggctgtt tcactttcca ctaatgtaat ggctagtagc 5460
ataaaaaatt ctattggaag tgcaagtaat agagtaaaca gtttaaattc ctcgttaaga 5520
aaagttcaaa ctactgctag tagtgtaagt tcaactatga caaaattaag ttctagcata 5580
aatgctgttt caggagttat tggaagttta aatggaagta ttatgagact agcaataact 5640
atagctatga ttattgatta ttttaataag ttgattcaaa agaaaaatga gtttaattca 5700
aatattatga ttatattaat atttaaagct aaaagtgatg aagtagaaaa aactaaaaat 5760
aaattacttg gaaatttaaa aaagattggt ggcaagattt ggaatatcgt aataaaagca 5820
aaagatatga ctaagagagt gataagtagt atcttgggaa aattaaaaca agtagagaaa 5880
cgtccttatc aaggaagtat taatcttaaa gatatggtga gtagtgctat gggtagaatt 5940
ttgcctaagt taatgttgtt taaaaatact ttttggagtg gtgtaatagc tataaaagat 6000
atggcaagtg gcattataag taaagtattt cccaaattga gattatttgc aggtaaggta 6060
tggagtggtg caatagctgt aaaggatatg gcaagtggaa tacttggttc gataaaaggg 6120
aagatatctg atttgacaaa tggtgctact ataggtgtcg ctgtgaaaaa gggtgttgat 6180
ttacttggtc aggaacaaaa tcagaaagtt gttctagaaa gtgtaatgaa aagaaatact 6240
ggaaaagtta atcaaataga tgttgatgat tattatggca gtttagtaag aatggcaaat 6300
gatacgcctt ttgaccctga agatgttgtt gcaatgggaa ctaaagctaa aatgattagt 6360
aatattactg gtggcaaaaa agaaaaagat ataactcaag ctatggtaga tgttagagct 6420
ttaaatatga atacaagtag tgaacaagat gtatcagcag ctttcttaag tgcagcaaaa 6480
ggaaacatgg aatctcttaa tactctggta ggagaaaatt ataaaacttt tgatgaagca 6540
ttggaaggca taagtgtaaa gcagatgggg ttagctaaag aaatgagtaa tacaatacca 6600
ggtataatat caggagctca aacaagcatt aacaatggct tgaagagtat tgttaaacct 6660
tttgatgata ttttaggtca aggactaaag aaaataaaaa cttttataga aagtggatta 6720
ggcaatttag ctggcttatc tgaaaaaatg gctggtaaaa taggcaatgt aatgaatggt 6780
aagataatta ttggcaacaa atatgaccag atgcaatcta gaagtgtaaa aaatggaaaa 6840
gagttttctg attctactca atatcgaatt tctaatgagg ctgaaaagcg taaaatgatg 6900
gttgaaaata agcaagaacg ttttgaaaat catgcagcaa caatgatagg gaatgcacca 6960
aaagcaattg ttaacgcagg aagtacacta ttacaaaata tcgattttac agcattaata 7020
gattcattac ttccagtagt aaacttagta aataatttac tagatagtat aaacaataaa 7080
tcaccaattg cacaaggatt aataagtata tttggtacaa tagtaactac agcattccaa 7140
ctaatcggac ctgtagttga agctgttagt cctattatca caagaatttt tactttttta 7200
ggtgaatatg cacctcaaat aaacaatttt atagagacac tgggtgttat ttggaaaact 7260
gtatgggaga ccttaggacc tctgttggaa actggatgga aaattataga gccaatattg 7320
ggagcttttt ttaacatatt agataaagta tgtaaaatag ttaaagatat atgtaaatgg 7380
tggcaaacta tgattaataa gataaaaaat ggaagcatca caggaacagt tttaaatcta 7440
gtggaaaaga gtaaaaaaaa ttacaaagat aatccatatg ctggaacaaa ggctggtgat 7500
tctggtaaag cttattcagg taagaaaggt aataatgcat ttggattgaa ctatgttcct 7560
tataatgact atcaaaccag actccatgaa ggtgaaatgg ttttaactaa acaagaagca 7620
aatcaatata gaagcagaaa aaatggtgga aatataaaca tagctaagtt agctgataca 7680
atagtgatta gagaagaagc tgatatagaa aagataacat caaaattagt tgcaagtatc 7740
caattggcac agttaggggg tgtcttataa tggaaatgtg gcttagacaa gctgaagata 7800
gatttagatt tccagtattt ccatcttcct ttagtattaa tggaaaagct gctgtaaact 7860
cttctagtat actcaaaata ggtgaaatag caacttttgg tggtgtagct cttaaaagca 7920
tttcaatatc aagttttttt ccaaataaag actatacttt ctgtgactat acaggttttc 7980
catcaccata tgattgtgta aataagatag aaaaatggat gaaggaaggt tttatattaa 8040
gatttacaat tacggaaaca aatataaata tggaagtcat aattgaaggg tttagttatg 8100
aagaaagaga tgggactcga gatgtatatt ttacattaga tttaaaagag tataaaagaa 8160
taaagatacc aaaagtaact ccaaaacaat aactattata gataataagt tataaataac 8220
tgctgataga attaaatgaa aaggcaggtg attttttatt attaagattt gggtacacat 8280
aaaaaacgga agtatatatg acataactga catagtagac aaggtatcat ggtcaggtga 8340
ttataaatct ccatcaagga cactagagtt ttcaataata caatcatcat ttgatgtaaa 8400
tttccaacaa atcgatatac caatagctag tacagtctgt ttctatgtag atgagaaaga 8460
actctttaga ggaatgataa ttaataggtc taaagattca agcagtaatg aaattagttt 8520
tgtatctaaa gatatgggat ttttacttac acaaagtgaa gtgtcataca attttaaaga 8580
taagttagtt gaagacatag caaagcaagt atttgctgaa aataggcttt cagttggaat 8640
aatagcaaag accaatgtca agtatacaaa gatgtttata ggagtaaatg gttatgacac 8700
aataatgagt gcatatacag aagcaagtaa aaagacaaag aaaaagtata tgatagaggc 8760
caatttagat aagtttaatg ttattgaaaa aggaactgtt acattaagtg ttatgtttga 8820
agagggattt aatattataa ataccacctt ttcggagagc atggaaaatg taaaaaataa 8880
agtaatagtg gtagaccagt atggaagcaa gattagcgaa aaaatagata atgaaatttt 8940
taaggaagta aatgtaataa tgcaaaaagt aattcagcaa caagaaaatc aagatgtaga 9000
tattgatagc gagtttaatg ggatagaaaa aagctgttct cttaaaggtt atggagatgt 9060
aagttgtata actggtagag gagtaaaagt taaagattct tatacaaagc ttgtaggact 9120
attttatata gatacagaca aacatacttg gcaaaatgga gaatatcaaa ttgagcttga 9180
acttaatttt caaaatctta tggatgaaaa gtcagcagga caggatgaac ctaaggaaga 9240
aagtaattta gggggagaag attatgcagg aggaaaagag tttacagcag aatttacagc 9300
ttactgtcct agaaaagaag aaggtggaga tacagattgt agaaagaaaa aacttgaccc 9360
atctaaaaaa acttgcgctg ctcctatggt tggtaaatat gagcaaactt attatacaaa 9420
agagttttta aataaacatc ctttattaaa ctatggagat gaaatacagg taattacagg 9480
agtttctggt cgtgatggag tctataaagt aaatgacgta ggacctgcaa taactataga 9540
aaagaatgga acataccata tagatatttt atttggaaat gttgaagaag ctagtaaatt 9600
tggaagaaga aaaggaaaaa ttattattgg tggttattct ggtaatgtat ctgataaagc 9660
taaaatagta atatcagaag caaaaaaaca tctaggtaaa ccttataaat ggggtggaaa 9720
tggaccaagt agttttgact gttctggttt aatggtctat tgttttaaaa aagttaatgt 9780
tagtttgcca agaacgtcaa atcaacaatc taaaaaaggc aagaaagtag aacaaaaaaa 9840
tcttcaagca ggagatttag tattttttca taatccagtc agccatgttg gattatatat 9900
aggtaatgga gaatttttac atgctccaca aaaaggtgat gtagttaaaa taagtaagtt 9960
aagtagtaga agagatttta acacagctag gagagtatta taaaaggatg gtgatataat 10020
ggctaatcca ataaatgaat ttataggaat aataagagaa gaaggaaagt atcataatca 10080
accttctttt tttattggaa aaattaaaag taaattacca gatttaaaaa tagagacaaa 10140
taacatcata ttagaaaaag aagatatttt gatagatagt tggatgattg atagacagct 10200
agaaacattt gacacagaaa caaatcaaga acaccagcat gaagtaaaaa atccttttat 10260
agataacttt gaatctgggg atatggtaat aatgtttaga ataggcgaaa aatttgctgt 10320
tgtaagtaag ttggtgagct tataatgagt acaatatttc cttttatagg tgtcccagag 10380
gattatatct tacctaaaac agaagaattg ccaatctttc gtgaagtggc atgggatttt 10440
gaaaaagatg aacctatttt agaaaaaggt gactttaaaa taattgaaaa aaaagaagcc 10500
ttaaaagttt ggatatacaa gtgtataaag acaaatagat atgaacatga gatatactct 10560
ttagaatatg ggacagagct ttcagaacta ataggacaaa aatatacaaa aggtcttaca 10620
gaaagtgaag ctagtagatt cataaaagag gcccttctaa taaatccata tatattagaa 10680
gtaaacgtaa aaagtgctaa ctttaacaga gacatattga gtgcaaatgt aaaagtatcc 10740
actatctatg gggaggtgga aataaatgta tagtgaccag acatatgaag taataaaaaa 10800
tagaactctt gaaaatatta atcttgatat ttataaagga gaaggttctt ttctaaacaa 10860
catggtatct ggaaataatc tagaactttc gaagatatat ctagaacttt caaagatgca 10920
taaaatggct tttatacaag acacatataa ccagtttctt gataaaagag tcaatgaatt 10980
tggtgtatat agaaagttag gtacagagtc aaatggagaa gttgaattta ttggagagaa 11040
aggtactgta ataaataatg gcacaataat atcatataga gatttactat ttgtagtaat 11100
aaaagatgta actattggta gtgaagaagg tgacaatagc ccagttcaag ctctggaagt 11160
tggtaagaaa tataatttac ctacaaattg tgaatttaaa ctagttgata atatatctgg 11220
agtaacaaag attactaaca caagaagttt tgaaggtggt acagatatag agacagatga 11280
agaactaaaa gaaagatttt ataaaatcca aagaaatcaa gctacaagtg gaaataaagc 11340
tcactatgaa gaatgggctt tggaagtaga tggagtctat aatgttaagg tttatccaag 11400
atgggatggt ccgggaacag ttaaggtctt gatatttggg aaaaataatc aagctgttga 11460
tacagaaaca attgaaaggt gtcagcaaca tatagatgaa gagaagccta ttggaccaac 11520
tataacagtt gtgacaccat taccaataga aataagtata agtgcagtaa tgaaactaga 11580
agatggatat acattagaca atgtaaaaga atctttccta gaaagtataa atacatactt 11640
tagagatatt agaggagaga taatctatac aaaagtaatg ggaatactta taaatactac 11700
tggtgtacac gatttaagta acctacttat aaatggaagt acagataata taactattaa 11760
tgaagataaa atacctagtg taacaactgt taattttagt gaggtggaaa atcaatgaag 11820
ctaattgata aactaccatc atttgataga aattacattg tagaggagat acaaggtgca 11880
tacgatacag aattaaatat tcttaaagaa gatattgatg atacctttaa ccaattattt 11940
gttgacactg caacatgggg attagatatg tgggaagaca tactctgcat tgaaaaaaaa 12000
gaacttgatt ttgacacaag acgtagcaat ataaaagcta aaatgagaag cagaggtact 12060
agtactattg aagttataaa aagtatatgt gaggcatata caaaatcaga aacagatata 12120
aaagtttata gtgatgaatt tacattcgta ttgagtttta tagcaaataa ctgtgactat 12180
aaaactcttt tagattgtag cgatatgatt gaaagagtaa aacctgctca cttattacac 12240
tatttagaac caataatact agataaaagt atggtctatt gtggtggagg tatggtatgt 12300
agtgaagagg taaaagttca tccatacttt gaaccaatta taaaatgtag tgctgttgta 12360
aactgtggag ctggaatgat aagtagagaa gaaataaagg tttatccttt aagcattaaa 12420
tgcattgaaa ataattgtaa gattaatata gctattgcaa atgatacagg tgtagaaaat 12480
gtagtagttt atcctaaatc ggaggtggta taattggaag aaaaatttta tataatatta 12540
accaaaattg gtagagaaaa aatagcaaat gcaactgcac taggagagct tgttggatta 12600
accaagtttc aagttggaga tagtaatgga gaatattatg agccaacaga ggaacaaact 12660
gctttaaaga atgtagtttg ggaaggaaat ataaattctc taagaattga tgaaaaaaat 12720
cctaattgga tagttataga gactatttta ccaggaacag ttggtggatt tatgataaga 12780
gaagctgctg ttctggataa tgagaataat ataatagcta taggtaagta tccagagacg 12840
tataagccac gtgctgaaga tggcagtatt aaagatttgg ttgtaaaaat gattttacaa 12900
ttgtccaata cttcaaatgt tacattagaa gtagacccga cgttggtttt tgtaactcaa 12960
aaggatattc aagatttaga tgataagttt gataaaaata taaaagaaat aaaagtaaaa 13020
attggcgaag aactcttatc tacagaagct aaaaacttat caggagctat aaatgaggta 13080
gtagaaaaaa ttaaaaatat atctattgat gatgtaatag gaggtcaaat acaaactgaa 13140
ctatctgtat taaaaaatag ttacaataaa ttatctgaaa aagtattaga tatcttaata 13200
tacttagaat tagagtcaga aatagatgta gatgaagctg gatattggta tgatacctta 13260
actaatgcta aaaacataat agctatagaa ggccttaagt tagatttaaa tagaaagtgt 13320
ataactggag aacttggtag tgttacattt aagaatgtgg tgctaccatt taatgcaaat 13380
agagttagat atatacatga aatggataat aactttgttg aaacaaaatc taatagggca 13440
tattcaattg gtcagacaga tataacttta aataaatatt cgtatgaaat aagataatta 13500
ggaggttttt ataatgaaaa gaactaaact acttcaaaga ggtaatttct ttggcgataa 13560
aaatatggta gttgatgaat ttgatgaagg gtatgataat tatgacttta ttaatttttt 13620
tactggatgt tgtaactata catttggtct aaaaaataat aatatcttgt atggatgtgg 13680
agataatagt aactttcaac ttggattggg agaagacaat acaacaagaa aattatttac 13740
gaaaatacca aatatatcta ccaatattaa aaaagttgca tgtggagaat ctcatgcagt 13800
tatacttact tcagatggag aattacttgt cgcaggtata aatacagatg gtcaaatggg 13860
attgggatta gaaaaagtag ggaaaacagt ttctacattt gagaaggttc cagaaataaa 13920
aggcgtaaag gatattgcat gtggacttca atcaacatat cttttataca atgatggaac 13980
tttatatgtt gctggaaata atttgtatgg tcaattaggt ctaggaacta atggagcatc 14040
tgcaaatgta aatacattta caaaagtaga tgttgacaat gtaaaggctg tattttcata 14100
taataaatca gcttttataa taaagaatga caataaatgc tattctactg gttttaataa 14160
tcaaggtcaa ctaggtttag gagataagaa taatagagat ttatttagtt tagtttctat 14220
taatgatgtt aagactatag cttgtggttc tgaacacact gtgttaatga cgtataataa 14280
tgatatatat ggttgtggaa aggaaaaatg ttttggaaat gcacttcaat catcactatt 14340
tactaagata gaagaagtaa atataaaaac tattgcatgt ggtcatggta acactatgct 14400
tatagataac aaaggtactt taaaggttgc tggaaataat gatatatatc agttaggtat 14460
agcaaattac tctgagaata tagataattc atttatagat ttaaaaaata ttgtagctaa 14520
gaatattttc attggtttat cacatagcat actaattgat tcaaataatg attcatattg 14580
tacaggagat aatacttatg gacaattagg ttcgtttttt gatgatatgc acattgtaga 14640
atttaagaaa atggatagtg aaaaatatag ttatagtaat tatataaatt taattaaatc 14700
tgaggataaa ttaactttat taaaagaaga aatggaaata aaggatattg aacttccact 14760
agatatacat tctgtaagag atgtcgtttt tagtccttat tgtactctgg ttattttagg 14820
gaatggagat gtatatggtc taggaaataa tagatacaaa ggaatgggtt ctgacttacc 14880
aagtcaatta aatgagttga caaaattaag tatctctaat gtaaagtcta tagtagcatc 14940
aaaaaatatt tctggaggaa tattctacat taaaaatgat gatacttgtt attattctgg 15000
accaaatagt aactcaatag caggtgttct tccttctaat tcagatgtat ttaagaaaat 15060
atctatagat aatgtaaaaa aagttgttat aaatactgat ttatcaaact ggttttcatt 15120
aattgtaact aataataagc aaatatacac ttctggaaag agttcaagtt atgttaatgg 15180
acttagtaat gcattaataa gtcaatatac tgagattagc cttagtaatg taactgatgc 15240
ttatagttca tataatgcaa catttattgt agttgatgaa aaaaaggtat atgcaactgg 15300
tataaataca aattacctgt taggttttag tacttctgat ggatctaatg taaatctagg 15360
tttattaagt gattggtatt atataaatat atcagggtca agttatagta gagtttcatg 15420
cacgaataat attactaaaa ttaataatat tatcatatat gagtatgtaa ctgtattttg 15480
tacaaacatt ggatcttttc taactggata ccatggtact tcatggacaa aaccaactga 15540
ttcaagctat agagttcaat atcagggaat ttcatatgca ggatatcttg attcttatat 15600
atataattat tatcctacaa gatgtacaca atcatcatct tctacaactt ttgcttattt 15660
atataatggg gaatcgtcaa gtaatttaaa aaatgtcaat ccagataatt tacttatttc 15720
tggaggttca tcttatatac atcaatatgg aaggaattat cttaacaatc aatcatctaa 15780
taatattgca gcatctaata taaattcagg tcctattacc tctgataaag ccatattttt 15840
atataaagct ctattgtatt tatcttctaa cacgctatat ggttttggga atatatctga 15900
aagtgcaaaa gaactagatg tttcagatac acaagatgga tataatgcca ctaattataa 15960
aaaggtaatg aaaaatataa aaaatatatt tatacctcct tatgatttaa gtagagataa 16020
aactagattt gcaatattaa ctgataagag cttatttata tgtggatata actctaaggg 16080
tacgcatggt atatcagtta atagtagttt aaatttaaat aataagataa attacaataa 16140
aaagaatagc agtagtgaaa tatcttctaa tatacaagaa atatatagcc attcaaagtc 16200
tacatattta ttaactaata ataatatgct ttacagtgtt ggtttaaatg atgtaggtca 16260
attaggagtg ggagatgaga taaatagaaa ggtatttact aaaataaata ttgataatat 16320
aaaatctata aatgtaaata gatttactga caatagtaaa catgcatttg cgataaaaaa 16380
tgataatacc tgttatgctg ttggtttaaa taattctggt cagttaggaa taggagataa 16440
tgtaaataga aatatattta ctaaaataaa tgttgaaaat gtaaaatatg tagctgtata 16500
tggaaacaca tctctattat taactaatga tggtctttta tatggagcag gtaataatgg 16560
aaaaggacag ttaggattgg gtgatactac aagtaggaat atatttacac gtatacctat 16620
aaatggtgtt agagatgtat atctatgtaa tgatgtatca atcattgtta aaaatgataa 16680
tacatgctat gtatgtggac ttgtaaatgg ctattttggg tttactgaag gaagtataag 16740
tacatttaca aaaataaata ttgagaatgt aaaatctgtt gtgacagcag gaagtgaagc 16800
tacatttttt ataacaaatg acaatatgat ttatactaca gggaaaaaag agagggtatt 16860
cttttcaaca gagactaatg atataaaggg gatacgagta attaataata ttataaatgc 16920
aaaaaaaata gtagttaatg gatatacttc agccatttta acaaatgaca ataaactatt 16980
tgttggaggt cttagtggat atggaagtat agcaaataat aataatacaa atagtgtgga 17040
agatgttaaa gatgtttttg taacagctaa taatacactt tatatagata ataataacaa 17100
tttgatatca tcaggtagag atacttatgg tatatctgat gaatcttata gggatatgtc 17160
agttccatat tataaagtat ctataaagaa agatgttgat actgtatttt ctagttacaa 17220
tactatattt attaaagata tatatggaaa attttattct tcaacaagag ataatagata 17280
taatcattta ggtattcacc atagatatga taatgataaa aatgaagctc ttgaaggttc 17340
cctacattca tattttaaaa cagataacac atcagataaa atagttttta ataagaaaaa 17400
tgaaaagcta gtaatgttta atgataagta tataaaaaca aataataagt atataaatta 17460
taaaaacata tttaaagata attttaagta tacttcaata atattgccat ttgaggtatc 17520
tgatattgat atatcaaaaa cacattcatt ggctgttgct aaggatggca agttatatgg 17580
aataggaagt aattcatata aagaaattaa tcaaaccctt gaagatatag aattattaac 17640
tcttactgaa gtaaatatat cagatgtcaa aaaagttgct tgtggagata actactccta 17700
tattattaag acagataata ctctatggtc atatggaaag aatactgagt accaattggg 17760
agttggccac aataatgatg taagagagtt acaaaaggtt actggattac cttctgttaa 17820
agatataagt atatataact caatgacact tgttttaact aatgagggag agttgtacgc 17880
tcaagggtac aatacaaatg gattatttgg actaggagaa agtgaaaaag ataagataat 17940
aagaactttt actaaagtat taactaatgt taaagaaatt aagtcacata atgatgacca 18000
catactagta attaaaaatg ataatagtct atggataact ggtaaaaata aatctatgta 18060
taaaatatct atatcaatta ctgatttata tgaatttact aaaataccaa ttcctgaaca 18120
tctaaatgat attttagata tagagctttc agatgataca atatacatga taacaaaagt 18180
agatacaagt aaagcatcta tagaaatagt tgaaaaatca atatctcaag tgagagttgt 18240
agtacaagac cctaataatg ttatagaaaa acttgaaatg tttataaatg atgaattaat 18300
atctactaag actaatttgg aaataaatag cattatattt gagataccac aaaataaaat 18360
agtattagga gaaaataaga tactgattaa agccagtagt cctacaggcg atttatattc 18420
aagtatgttt atatttaaat cagaaacagg gcttaaagta aaaaaggatt ctattttaat 18480
gataaacaat aaagtatatt caatcataaa cattactgaa aataacactg acttaatagt 18540
aacattaaat gagggattaa aggatgatat gatggaaaac aatcctatat atcaattaat 18600
aaataaaact aaagttcaag taaaaataaa taaatctgac ttattcaaag acatgaaact 18660
agttgaaatc aaaaaatcag actcaagtta ccaagaaatc tatgaattag aagaagccaa 18720
cataaaaagt gctcagccta aaatcatagt agaaaaagga gataaatgga cagctataaa 18780
acgtccatct atgattttta gatatgatgc tgaaaacaac gagccacaag cttaaaatgg 18840
aggtgtgaaa attgtttaaa ttcgataaaa ataaaataga acaaatcaaa caaggtagaa 18900
aagtagaaat gcagtataaa gacatttcag acataagtat aggtcaagta aagcaagatg 18960
atgatataac aaataatttt atagcaaatg tagaaatata tgagatgttg ttaaatcaaa 19020
gttctgtcaa tgaagcaagt aatataagca cttttagtgt aagaaaatct ggaggtgaga 19080
gtggaatggt agaagtatat gtagctttaa ttttaagagg caaaaaaaca atagaagaag 19140
taccagcagt aattagagag caagttagaa ttagatgtaa agaattagaa ataccagttg 19200
aatagtaaat ttagaataac tatgtattag ttattttttt tatgtaaagt acaaggtctt 19260
aactttaata agtaagcctt gtacttattt tttgttacat tagaacttgt atatatattt 19320
attatttatt caatctataa attacaccta caatttaaag tacagaagat taaattgata 19380
atcctgaaaa tataatattg catgatgtaa gaatacaaca aaaattaaag ctataagtat 19440
aaaaaattta gacaatagga ggctataatg gataaattaa taaccgaatt gagtagtcta 19500
ggggcaatag gtatactatg tgctctatta tttaaaaata ctatgcagga gaaaaaagaa 19560
gatagagaca tgtataaaaa aactgtagaa aattttatag aattatctac acaacaacaa 19620
gaaataaaca aaaatatact tgttcaaatg ggtataatga aaacagatgt agaggaaatt 19680
aaggaagatg ttactgatat aaaaggtatg ttacaaaatg gtgtataaca tgaaagagta 19740
gcaccagatt atatattgtt aggaaaagat aaagtagtat tgtagatagt tcactatttt 19800
attgagaagg atttaatatt taaaatatta attaaaaaaa gtaataaaaa taacatataa 19860
aaattaaaaa aggagttaag cttaaatttg aggcgcg 19897
<210> 62
<211> 168
<212> PRT
<213> Clostridium difficile
<400> 62
Met Asn Asn Leu Asp Lys Leu Phe Glu Leu Ala Ser Gln Glu Glu Ile
1 5 10 15
Ile Ile His Tyr Thr Thr Tyr Ile Ala Gly Asp Leu Glu Gly Leu Tyr
20 25 30
Ile Asn Lys His Gly Ile Lys Ile Ile Ser Leu Leu Ser Asn Leu Lys
35 40 45
Gln Asn Ser Lys Lys Leu Thr Ser Ile Leu Ala Glu Glu Leu Gly His
50 55 60
His Phe Thr Ser Leu Gly Tyr Tyr Val Ser Ser Tyr Asn Asp Tyr Tyr
65 70 75 80
Thr Lys Ile Ile Ile Asp Lys Cys Glu Asn Lys Ala Leu Lys Trp Ala
85 90 95
Cys Glu Phe Leu Ile Thr Glu Glu Asp Ile Ile Asn Ile Ile Asn Ser
100 105 110
Gly Ile Thr Cys Val Tyr Glu Met Ala Asp Ile Leu Asn Val Asp Ile
115 120 125
Thr Phe Phe Gln Lys Arg Leu Glu Phe Leu Ser Leu Lys Lys Gln Ser
130 135 140
Leu Gln Leu Gly Asn Asn Lys Tyr Leu Ile Leu Thr Asn Leu Pro Tyr
145 150 155 160
Phe Tyr Ile Phe Asp Pro Ile Ser
165
<210> 63
<211> 106
<212> PRT
<213> Clostridium difficile
<400> 63
Met Phe Ala Lys Arg Leu Arg Glu Leu Arg Lys Glu Phe Gly Leu Thr
1 5 10 15
Gln Arg Glu Leu Gly Glu Lys Val Gly Val Ser Gln Arg Val Leu Gly
20 25 30
Tyr Tyr Glu Thr Glu Asn Arg Phe Pro Asp Glu His Ile Leu Asn Lys
35 40 45
Leu Ala Asp Val Phe Asn Val Ser Val Asp Tyr Leu Leu Gly Arg Thr
50 55 60
Leu Val Lys Glu Asn Ile Asp Thr Val Ala Ala His Arg Lys Asn Pro
65 70 75 80
His Glu Glu Leu Pro Glu Glu Ala Gln Glu Gln Leu Asn Asp Tyr Ile
85 90 95
Glu Phe Leu Leu Asn Lys Tyr Lys Lys Lys
100 105
<210> 64
<211> 65
<212> PRT
<213> Clostridium difficile
<400> 64
Met Phe Lys Asn Asn Leu Lys Tyr Tyr Arg Lys Cys Lys Gly Met Thr
1 5 10 15
Gln Ile Gln Leu Ala Arg Lys Ala Gly Ile Thr Asn Asp Tyr Ile Ser
20 25 30
Gln Ile Glu Arg Gly Ile Lys Asn Pro Gly Leu Leu Met Ala Lys Lys
35 40 45
Ile Ser Ser Ile Leu Glu Gln Asn Ile Glu Glu Val Phe Phe Ile Gln
50 55 60
Leu
65
<210> 65
<211> 146
<212> PRT
<213> Clostridium difficile
<400> 65
Met Glu Asn Lys Lys Asp Ile Leu Phe Lys Glu Thr Asp Lys Arg Leu
1 5 10 15
His Asn Tyr Lys Tyr Leu Asp Ile Lys Ile Lys Asn Ile Asn Leu Asp
20 25 30
Ile Lys Arg Cys Glu Asn Glu Tyr Ser Gly Cys Gly Ala Met Val Tyr
35 40 45
Thr Glu Lys Thr Ser Asn Thr Tyr Asn Ile Ser Ser Ser Val Glu Asn
50 55 60
Glu Val Leu Lys Arg Glu Glu Arg Leu Arg Lys Leu Lys Met Glu Lys
65 70 75 80
Glu Asp Ile Glu Ile Glu Lys Glu Lys Ile Glu Asn Ala Leu Thr Cys
85 90 95
Leu Asn Asp Ile Glu Met Glu Phe Phe Asn Leu Phe Tyr Asn Ser Lys
100 105 110
Thr Lys Asn Asn Met Thr Tyr Ile Ser Met Lys Leu His Leu Asp Arg
115 120 125
Thr Ser Cys Tyr Asn Leu Lys Lys Lys Met Ile Phe Lys Leu Ser Glu
130 135 140
Ile Leu
145
<210> 66
<211> 147
<212> PRT
<213> Clostridium difficile
<400> 66
Leu Leu Lys Tyr Lys Glu Ile Leu Glu Thr Ile Ile Glu Ile Leu Lys
1 5 10 15
Lys Asn Phe Thr Glu Ser Ile Phe Ile Asp Asp Glu Ser Val Gln Gly
20 25 30
Ser Glu Gly Ser Cys Phe Phe Val Ser Ile Leu Ser Val Ile Cys Thr
35 40 45
Pro Val Met Leu Asn Thr Asn Asn Lys Asp Ile Val Ile Ser Ile Lys
50 55 60
Tyr Leu Pro Lys Pro Gln Ser Lys Ser Ile Arg Met Tyr Glu Ile Ser
65 70 75 80
Asp Glu Leu Asn Lys Leu Phe Asn Arg Asn Ile Lys Val Thr Asp Arg
85 90 95
Lys Leu Asn Ile Thr Lys Leu Glu Gln Ser Ile Lys Lys Glu Glu Ser
100 105 110
Ile Tyr Val Leu Asn Phe Thr Phe Thr Leu Asn Tyr Leu Asp Ser Val
115 120 125
Tyr Glu Glu Asp Val Val Tyr Glu Asn Met Lys Glu Ile Asn Leu Asn
130 135 140
Leu Gly Glu
145
<210> 67
<211> 354
<212> PRT
<213> Clostridium difficile
<400> 67
Met Ala Ile Gly Leu Pro Ser Ile Asn Ile Ser Phe Lys Glu Leu Ala
1 5 10 15
Thr Thr Val Lys Glu Arg Ser Ala Arg Gly Ile Ile Ala Met Val Leu
20 25 30
Lys Asp Ala Lys Ala Leu Gly Leu Asn Glu Ile His Glu Lys Glu Asp
35 40 45
Ile Pro Val Asp Leu Ser Ala Glu Asn Lys Glu Tyr Ile Asn Leu Ala
50 55 60
Leu Met Gly Asn Val Asn Thr Pro Asn Lys Leu Leu Val Tyr Val Ile
65 70 75 80
Glu Gly Glu Ala Asp Ile Gln Thr Ala Leu Asp Phe Leu Glu Thr Lys
85 90 95
Glu Phe Asn Tyr Leu Cys Met Pro Lys Ala Val Glu Ala Asp Lys Thr
100 105 110
Ala Ile Lys Asn Trp Ile Ile Lys Leu Arg Asp Ile Asp Lys Val Lys
115 120 125
Val Lys Ala Val Leu Gly Lys Val Val Gly Asn His Glu Gly Ile Ile
130 135 140
Asn Phe Thr Thr Glu Asp Val Leu Val Gly Glu Lys Lys Tyr Ser Val
145 150 155 160
Asp Glu Phe Thr Ser Arg Val Ala Gly Leu Ile Ala Gly Thr Pro Leu
165 170 175
Ser Gln Ser Val Thr Tyr Thr Lys Leu Ser Asp Val Val Asp Ile Pro
180 185 190
Lys Met Thr Lys Val Asp Ala Glu Ser Arg Val Asn Lys Gly Glu Leu
195 200 205
Ile Leu Ile Lys Glu Ala Gly Ala Ile Arg Ile Ala Arg Gly Val Asn
210 215 220
Ser Leu Thr Glu Leu Thr Ala Glu Lys Gly Glu Met Phe Gln Lys Ile
225 230 235 240
Lys Ile Val Asp Thr Leu Asp Ile Ile His Ser Asp Ile Arg Lys Val
245 250 255
Ile Ile Asp Asp Tyr Ile Gly Lys Val Thr Asn Ser Tyr Asp Asn Lys
260 265 270
Cys Leu Leu Ile Val Ala Ile Lys Ser Tyr Leu Glu Glu Leu Glu Lys
275 280 285
Ser Ala Leu Ile Glu Ser Asp Ser Thr Val Glu Ile Asp Phe Glu Ala
290 295 300
Gln Lys Ser Tyr Leu Lys Ser Lys Gly Val Asp Leu Ser Tyr Met Thr
305 310 315 320
Leu Gln Glu Ile Lys Glu Ala Asn Thr Gly Ser Lys Val Phe Leu Lys
325 330 335
Ala Lys Ile Lys Val Leu Asp Ala Met Glu Asp Ile Asp Leu Ser Ile
340 345 350
Glu Ile
<210> 68
<211> 142
<212> PRT
<213> Clostridium difficile
<400> 68
Met Ala Asn Met Glu Ala Arg Asn Val Met Ser Gly Thr Trp Gly Glu
1 5 10 15
Leu Trp Leu Asp Gly Asn Lys Val Ala Glu Val Lys Lys Phe Gln Ala
20 25 30
Lys Met Glu Phe Thr Lys Glu Asp Ile Ile Ile Ala Gly Gln Met Gly
35 40 45
Thr Asp Thr Lys Tyr Met Gly Tyr Lys Gly Lys Gly Ser Ile Thr Leu
50 55 60
Tyr His Val Ser Ser Arg Met His Lys Leu Ile Gly Glu Lys Ile Lys
65 70 75 80
Arg Gly Ser Glu Pro Arg Phe Val Ala Ile Ser Lys Leu Asn Asp Pro
85 90 95
Asp Ser Tyr Gly Ala Glu Arg Ile Ala Val Lys Asn Ile Ala Phe Asp
100 105 110
Asp Leu Thr Leu Ala Asp Trp Glu Val Gly Val Lys Gly Glu Ile Glu
115 120 125
Ala Pro Phe Thr Phe Thr Glu Tyr Asp Phe Leu Asp Ile Ile
130 135 140
<210> 69
<211> 148
<212> PRT
<213> Clostridium difficile
<400> 69
Met Ser Glu Asn Gly Leu Ser Lys Asn Ile Asn Ile Val Asp Leu Leu
1 5 10 15
Leu Asn Ser Asp Thr Glu Asn Leu Glu Arg Pro Ser Thr Ile Val Glu
20 25 30
Leu Lys Arg Leu Ser Thr Ile Phe Gly Gln Glu Phe Lys Val Met Cys
35 40 45
Arg Ala Leu Thr Ile Ser Lys Asp Glu Glu Ile Gln Asn Thr Cys Leu
50 55 60
Lys Ile Asp Glu Asn Met Lys Thr Asp Ile Asp Leu Pro Glu Met Gln
65 70 75 80
Met Leu Thr Ile Ile Glu Gly Val Cys Asp Leu Asp Gly Lys Leu Leu
85 90 95
Phe Lys Asn Lys Glu Leu Met Asp Lys Phe Lys Ala Pro Thr Pro Lys
100 105 110
Glu Leu Ala Arg Lys Leu Leu Leu Pro Gly Glu Ile Thr Asn Leu Tyr
115 120 125
Arg Ile Leu Gln Asp Val Met Gly Tyr Gly Lys Asn Ala Val Ile Glu
130 135 140
Glu Val Lys Asn
145
<210> 70
<211> 55
<212> PRT
<213> Clostridium difficile
<400> 70
Met Tyr Tyr Tyr Trp Lys Lys Lys Gly Ile Arg Pro Ser Leu Phe Tyr
1 5 10 15
Ala Met Asp Lys Gly Glu Leu Lys Leu Ile Glu Ala Phe Phe Ala Leu
20 25 30
Glu Ile Glu Glu Glu Val Glu Lys Met Lys His Gly Tyr Gly Val Cys
35 40 45
Pro Leu Thr Gly Gly Gly Met
50 55
<210> 71
<211> 817
<212> PRT
<213> Clostridium difficile
<400> 71
Met Gly Asn Val Arg Glu Glu Gly Ile Asn Met Tyr Leu Thr Asp Asn
1 5 10 15
Tyr Thr Pro Lys Met Asn Gln Ile Ile Ser Val Thr Asp Asn Phe Arg
20 25 30
Arg Ala Thr Val Ala Val Ser Leu Ser Thr Asn Val Met Ala Ser Ser
35 40 45
Ile Lys Asn Ser Ile Gly Ser Ala Ser Asn Arg Val Asn Ser Leu Asn
50 55 60
Ser Ser Leu Arg Lys Val Gln Thr Thr Ala Ser Ser Val Ser Ser Thr
65 70 75 80
Met Thr Lys Leu Ser Ser Ser Ile Asn Ala Val Ser Gly Val Ile Gly
85 90 95
Ser Leu Asn Gly Ser Ile Met Arg Leu Ala Ile Thr Ile Ala Met Ile
100 105 110
Ile Asp Tyr Phe Asn Lys Leu Ile Gln Lys Lys Asn Glu Phe Asn Ser
115 120 125
Asn Ile Met Ile Ile Leu Ile Phe Lys Ala Lys Ser Asp Glu Val Glu
130 135 140
Lys Thr Lys Asn Lys Leu Leu Gly Asn Leu Lys Lys Ile Gly Gly Lys
145 150 155 160
Ile Trp Asn Ile Val Ile Lys Ala Lys Asp Met Thr Lys Arg Val Ile
165 170 175
Ser Ser Ile Leu Gly Lys Leu Lys Gln Val Glu Lys Arg Pro Tyr Gln
180 185 190
Gly Ser Ile Asn Leu Lys Asp Met Val Ser Ser Ala Met Gly Arg Ile
195 200 205
Leu Pro Lys Leu Met Leu Phe Lys Asn Thr Phe Trp Ser Gly Val Ile
210 215 220
Ala Ile Lys Asp Met Ala Ser Gly Ile Ile Ser Lys Val Phe Pro Lys
225 230 235 240
Leu Arg Leu Phe Ala Gly Lys Val Trp Ser Gly Ala Ile Ala Val Lys
245 250 255
Asp Met Ala Ser Gly Ile Leu Gly Ser Ile Lys Gly Lys Ile Ser Asp
260 265 270
Leu Thr Asn Gly Ala Thr Ile Gly Val Ala Val Lys Lys Gly Val Asp
275 280 285
Leu Leu Gly Gln Glu Gln Asn Gln Lys Val Val Leu Glu Ser Val Met
290 295 300
Lys Arg Asn Thr Gly Lys Val Asn Gln Ile Asp Val Asp Asp Tyr Tyr
305 310 315 320
Gly Ser Leu Val Arg Met Ala Asn Asp Thr Pro Phe Asp Pro Glu Asp
325 330 335
Val Val Ala Met Gly Thr Lys Ala Lys Met Ile Ser Asn Ile Thr Gly
340 345 350
Gly Lys Lys Glu Lys Asp Ile Thr Gln Ala Met Val Asp Val Arg Ala
355 360 365
Leu Asn Met Asn Thr Ser Ser Glu Gln Asp Val Ser Ala Ala Phe Leu
370 375 380
Ser Ala Ala Lys Gly Asn Met Glu Ser Leu Asn Thr Leu Val Gly Glu
385 390 395 400
Asn Tyr Lys Thr Phe Asp Glu Ala Leu Glu Gly Ile Ser Val Lys Gln
405 410 415
Met Gly Leu Ala Lys Glu Met Ser Asn Thr Ile Pro Gly Ile Ile Ser
420 425 430
Gly Ala Gln Thr Ser Ile Asn Asn Gly Leu Lys Ser Ile Val Lys Pro
435 440 445
Phe Asp Asp Ile Leu Gly Gln Gly Leu Lys Lys Ile Lys Thr Phe Ile
450 455 460
Glu Ser Gly Leu Gly Asn Leu Ala Gly Leu Ser Glu Lys Met Ala Gly
465 470 475 480
Lys Ile Gly Asn Val Met Asn Gly Lys Ile Ile Ile Gly Asn Lys Tyr
485 490 495
Asp Gln Met Gln Ser Arg Ser Val Lys Asn Gly Lys Glu Phe Ser Asp
500 505 510
Ser Thr Gln Tyr Arg Ile Ser Asn Glu Ala Glu Lys Arg Lys Met Met
515 520 525
Val Glu Asn Lys Gln Glu Arg Phe Glu Asn His Ala Ala Thr Met Ile
530 535 540
Gly Asn Ala Pro Lys Ala Ile Val Asn Ala Gly Ser Thr Leu Leu Gln
545 550 555 560
Asn Ile Asp Phe Thr Ala Leu Ile Asp Ser Leu Leu Pro Val Val Asn
565 570 575
Leu Val Asn Asn Leu Leu Asp Ser Ile Asn Asn Lys Ser Pro Ile Ala
580 585 590
Gln Gly Leu Ile Ser Ile Phe Gly Thr Ile Val Thr Thr Ala Phe Gln
595 600 605
Leu Ile Gly Pro Val Val Glu Ala Val Ser Pro Ile Ile Thr Arg Ile
610 615 620
Phe Thr Phe Leu Gly Glu Tyr Ala Pro Gln Ile Asn Asn Phe Ile Glu
625 630 635 640
Thr Leu Gly Val Ile Trp Lys Thr Val Trp Glu Thr Leu Gly Pro Leu
645 650 655
Leu Glu Thr Gly Trp Lys Ile Ile Glu Pro Ile Leu Gly Ala Phe Phe
660 665 670
Asn Ile Leu Asp Lys Val Cys Lys Ile Val Lys Asp Ile Cys Lys Trp
675 680 685
Trp Gln Thr Met Ile Asn Lys Ile Lys Asn Gly Ser Ile Thr Gly Thr
690 695 700
Val Leu Asn Leu Val Glu Lys Ser Lys Lys Asn Tyr Lys Asp Asn Pro
705 710 715 720
Tyr Ala Gly Thr Lys Ala Gly Asp Ser Gly Lys Ala Tyr Ser Gly Lys
725 730 735
Lys Gly Asn Asn Ala Phe Gly Leu Asn Tyr Val Pro Tyr Asn Asp Tyr
740 745 750
Gln Thr Arg Leu His Glu Gly Glu Met Val Leu Thr Lys Gln Glu Ala
755 760 765
Asn Gln Tyr Arg Ser Arg Lys Asn Gly Gly Asn Ile Asn Ile Ala Lys
770 775 780
Leu Ala Asp Thr Ile Val Ile Arg Glu Glu Ala Asp Ile Glu Lys Ile
785 790 795 800
Thr Ser Lys Leu Val Ala Ser Ile Gln Leu Ala Gln Leu Gly Gly Val
805 810 815
Leu
<210> 72
<211> 140
<212> PRT
<213> Clostridium difficile
<400> 72
Met Glu Met Trp Leu Arg Gln Ala Glu Asp Arg Phe Arg Phe Pro Val
1 5 10 15
Phe Pro Ser Ser Phe Ser Ile Asn Gly Lys Ala Ala Val Asn Ser Ser
20 25 30
Ser Ile Leu Lys Ile Gly Glu Ile Ala Thr Phe Gly Gly Val Ala Leu
35 40 45
Lys Ser Ile Ser Ile Ser Ser Phe Phe Pro Asn Lys Asp Tyr Thr Phe
50 55 60
Cys Asp Tyr Thr Gly Phe Pro Ser Pro Tyr Asp Cys Val Asn Lys Ile
65 70 75 80
Glu Lys Trp Met Lys Glu Gly Phe Ile Leu Arg Phe Thr Ile Thr Glu
85 90 95
Thr Asn Ile Asn Met Glu Val Ile Ile Glu Gly Phe Ser Tyr Glu Glu
100 105 110
Arg Asp Gly Thr Arg Asp Val Tyr Phe Thr Leu Asp Leu Lys Glu Tyr
115 120 125
Lys Arg Ile Lys Ile Pro Lys Val Thr Pro Lys Gln
130 135 140
<210> 73
<211> 509
<212> PRT
<213> Clostridium difficile
<400> 73
Met Ile Ile Asn Arg Ser Lys Asp Ser Ser Ser Asn Glu Ile Ser Phe
1 5 10 15
Val Ser Lys Asp Met Gly Phe Leu Leu Thr Gln Ser Glu Val Ser Tyr
20 25 30
Asn Phe Lys Asp Lys Leu Val Glu Asp Ile Ala Lys Gln Val Phe Ala
35 40 45
Glu Asn Arg Leu Ser Val Gly Ile Ile Ala Lys Thr Asn Val Lys Tyr
50 55 60
Thr Lys Met Phe Ile Gly Val Asn Gly Tyr Asp Thr Ile Met Ser Ala
65 70 75 80
Tyr Thr Glu Ala Ser Lys Lys Thr Lys Lys Lys Tyr Met Ile Glu Ala
85 90 95
Asn Leu Asp Lys Phe Asn Val Ile Glu Lys Gly Thr Val Thr Leu Ser
100 105 110
Val Met Phe Glu Glu Gly Phe Asn Ile Ile Asn Thr Thr Phe Ser Glu
115 120 125
Ser Met Glu Asn Val Lys Asn Lys Val Ile Val Val Asp Gln Tyr Gly
130 135 140
Ser Lys Ile Ser Glu Lys Ile Asp Asn Glu Ile Phe Lys Glu Val Asn
145 150 155 160
Val Ile Met Gln Lys Val Ile Gln Gln Gln Glu Asn Gln Asp Val Asp
165 170 175
Ile Asp Ser Glu Phe Asn Gly Ile Glu Lys Ser Cys Ser Leu Lys Gly
180 185 190
Tyr Gly Asp Val Ser Cys Ile Thr Gly Arg Gly Val Lys Val Lys Asp
195 200 205
Ser Tyr Thr Lys Leu Val Gly Leu Phe Tyr Ile Asp Thr Asp Lys His
210 215 220
Thr Trp Gln Asn Gly Glu Tyr Gln Ile Glu Leu Glu Leu Asn Phe Gln
225 230 235 240
Asn Leu Met Asp Glu Lys Ser Ala Gly Gln Asp Glu Pro Lys Glu Glu
245 250 255
Ser Asn Leu Gly Gly Glu Asp Tyr Ala Gly Gly Lys Glu Phe Thr Ala
260 265 270
Glu Phe Thr Ala Tyr Cys Pro Arg Lys Glu Glu Gly Gly Asp Thr Asp
275 280 285
Cys Arg Lys Lys Lys Leu Asp Pro Ser Lys Lys Thr Cys Ala Ala Pro
290 295 300
Met Val Gly Lys Tyr Glu Gln Thr Tyr Tyr Thr Lys Glu Phe Leu Asn
305 310 315 320
Lys His Pro Leu Leu Asn Tyr Gly Asp Glu Ile Gln Val Ile Thr Gly
325 330 335
Val Ser Gly Arg Asp Gly Val Tyr Lys Val Asn Asp Val Gly Pro Ala
340 345 350
Ile Thr Ile Glu Lys Asn Gly Thr Tyr His Ile Asp Ile Leu Phe Gly
355 360 365
Asn Val Glu Glu Ala Ser Lys Phe Gly Arg Arg Lys Gly Lys Ile Ile
370 375 380
Ile Gly Gly Tyr Ser Gly Asn Val Ser Asp Lys Ala Lys Ile Val Ile
385 390 395 400
Ser Glu Ala Lys Lys His Leu Gly Lys Pro Tyr Lys Trp Gly Gly Asn
405 410 415
Gly Pro Ser Ser Phe Asp Cys Ser Gly Leu Met Val Tyr Cys Phe Lys
420 425 430
Lys Val Asn Val Ser Leu Pro Arg Thr Ser Asn Gln Gln Ser Lys Lys
435 440 445
Gly Lys Lys Val Glu Gln Lys Asn Leu Gln Ala Gly Asp Leu Val Phe
450 455 460
Phe His Asn Pro Val Ser His Val Gly Leu Tyr Ile Gly Asn Gly Glu
465 470 475 480
Phe Leu His Ala Pro Gln Lys Gly Asp Val Val Lys Ile Ser Lys Leu
485 490 495
Ser Ser Arg Arg Asp Phe Asn Thr Ala Arg Arg Val Leu
500 505
<210> 74
<211> 108
<212> PRT
<213> Clostridium difficile
<400> 74
Met Ala Asn Pro Ile Asn Glu Phe Ile Gly Ile Ile Arg Glu Glu Gly
1 5 10 15
Lys Tyr His Asn Gln Pro Ser Phe Phe Ile Gly Lys Ile Lys Ser Lys
20 25 30
Leu Pro Asp Leu Lys Ile Glu Thr Asn Asn Ile Ile Leu Glu Lys Glu
35 40 45
Asp Ile Leu Ile Asp Ser Trp Met Ile Asp Arg Gln Leu Glu Thr Phe
50 55 60
Asp Thr Glu Thr Asn Gln Glu His Gln His Glu Val Lys Asn Pro Phe
65 70 75 80
Ile Asp Asn Phe Glu Ser Gly Asp Met Val Ile Met Phe Arg Ile Gly
85 90 95
Glu Lys Phe Ala Val Val Ser Lys Leu Val Ser Leu
100 105
<210> 75
<211> 142
<212> PRT
<213> Clostridium difficile
<400> 75
Met Ser Thr Ile Phe Pro Phe Ile Gly Val Pro Glu Asp Tyr Ile Leu
1 5 10 15
Pro Lys Thr Glu Glu Leu Pro Ile Phe Arg Glu Val Ala Trp Asp Phe
20 25 30
Glu Lys Asp Glu Pro Ile Leu Glu Lys Gly Asp Phe Lys Ile Ile Glu
35 40 45
Lys Lys Glu Ala Leu Lys Val Trp Ile Tyr Lys Cys Ile Lys Thr Asn
50 55 60
Arg Tyr Glu His Glu Ile Tyr Ser Leu Glu Tyr Gly Thr Glu Leu Ser
65 70 75 80
Glu Leu Ile Gly Gln Lys Tyr Thr Lys Gly Leu Thr Glu Ser Glu Ala
85 90 95
Ser Arg Phe Ile Lys Glu Ala Leu Leu Ile Asn Pro Tyr Ile Leu Glu
100 105 110
Val Asn Val Lys Ser Ala Asn Phe Asn Arg Asp Ile Leu Ser Ala Asn
115 120 125
Val Lys Val Ser Thr Ile Tyr Gly Glu Val Glu Ile Asn Val
130 135 140
<210> 76
<211> 350
<212> PRT
<213> Clostridium difficile
<400> 76
Met Tyr Ser Asp Gln Thr Tyr Glu Val Ile Lys Asn Arg Thr Leu Glu
1 5 10 15
Asn Ile Asn Leu Asp Ile Tyr Lys Gly Glu Gly Ser Phe Leu Asn Asn
20 25 30
Met Val Ser Gly Asn Asn Leu Glu Leu Ser Lys Ile Tyr Leu Glu Leu
35 40 45
Ser Lys Met His Lys Met Ala Phe Ile Gln Asp Thr Tyr Asn Gln Phe
50 55 60
Leu Asp Lys Arg Val Asn Glu Phe Gly Val Tyr Arg Lys Leu Gly Thr
65 70 75 80
Glu Ser Asn Gly Glu Val Glu Phe Ile Gly Glu Lys Gly Thr Val Ile
85 90 95
Asn Asn Gly Thr Ile Ile Ser Tyr Arg Asp Leu Leu Phe Val Val Ile
100 105 110
Lys Asp Val Thr Ile Gly Ser Glu Glu Gly Asp Asn Ser Pro Val Gln
115 120 125
Ala Leu Glu Val Gly Lys Lys Tyr Asn Leu Pro Thr Asn Cys Glu Phe
130 135 140
Lys Leu Val Asp Asn Ile Ser Gly Val Thr Lys Ile Thr Asn Thr Arg
145 150 155 160
Ser Phe Glu Gly Gly Thr Asp Ile Glu Thr Asp Glu Glu Leu Lys Glu
165 170 175
Arg Phe Tyr Lys Ile Gln Arg Asn Gln Ala Thr Ser Gly Asn Lys Ala
180 185 190
His Tyr Glu Glu Trp Ala Leu Glu Val Asp Gly Val Tyr Asn Val Lys
195 200 205
Val Tyr Pro Arg Trp Asp Gly Pro Gly Thr Val Lys Val Leu Ile Phe
210 215 220
Gly Lys Asn Asn Gln Ala Val Asp Thr Glu Thr Ile Glu Arg Cys Gln
225 230 235 240
Gln His Ile Asp Glu Glu Lys Pro Ile Gly Pro Thr Ile Thr Val Val
245 250 255
Thr Pro Leu Pro Ile Glu Ile Ser Ile Ser Ala Val Met Lys Leu Glu
260 265 270
Asp Gly Tyr Thr Leu Asp Asn Val Lys Glu Ser Phe Leu Glu Ser Ile
275 280 285
Asn Thr Tyr Phe Arg Asp Ile Arg Gly Glu Ile Ile Tyr Thr Lys Val
290 295 300
Met Gly Ile Leu Ile Asn Thr Thr Gly Val His Asp Leu Ser Asn Leu
305 310 315 320
Leu Ile Asn Gly Ser Thr Asp Asn Ile Thr Ile Asn Glu Asp Lys Ile
325 330 335
Pro Ser Val Thr Thr Val Asn Phe Ser Glu Val Glu Asn Gln
340 345 350
<210> 77
<211> 232
<212> PRT
<213> Clostridium difficile
<400> 77
Met Lys Leu Ile Asp Lys Leu Pro Ser Phe Asp Arg Asn Tyr Ile Val
1 5 10 15
Glu Glu Ile Gln Gly Ala Tyr Asp Thr Glu Leu Asn Ile Leu Lys Glu
20 25 30
Asp Ile Asp Asp Thr Phe Asn Gln Leu Phe Val Asp Thr Ala Thr Trp
35 40 45
Gly Leu Asp Met Trp Glu Asp Ile Leu Cys Ile Glu Lys Lys Glu Leu
50 55 60
Asp Phe Asp Thr Arg Arg Ser Asn Ile Lys Ala Lys Met Arg Ser Arg
65 70 75 80
Gly Thr Ser Thr Ile Glu Val Ile Lys Ser Ile Cys Glu Ala Tyr Thr
85 90 95
Lys Ser Glu Thr Asp Ile Lys Val Tyr Ser Asp Glu Phe Thr Phe Val
100 105 110
Leu Ser Phe Ile Ala Asn Asn Cys Asp Tyr Lys Thr Leu Leu Asp Cys
115 120 125
Ser Asp Met Ile Glu Arg Val Lys Pro Ala His Leu Leu His Tyr Leu
130 135 140
Glu Pro Ile Ile Leu Asp Lys Ser Met Val Tyr Cys Gly Gly Gly Met
145 150 155 160
Val Cys Ser Glu Glu Val Lys Val His Pro Tyr Phe Glu Pro Ile Ile
165 170 175
Lys Cys Ser Ala Val Val Asn Cys Gly Ala Gly Met Ile Ser Arg Glu
180 185 190
Glu Ile Lys Val Tyr Pro Leu Ser Ile Lys Cys Ile Glu Asn Asn Cys
195 200 205
Lys Ile Asn Ile Ala Ile Ala Asn Asp Thr Gly Val Glu Asn Val Val
210 215 220
Val Tyr Pro Lys Ser Glu Val Val
225 230
<210> 78
<211> 327
<212> PRT
<213> Clostridium difficile
<400> 78
Leu Glu Glu Lys Phe Tyr Ile Ile Leu Thr Lys Ile Gly Arg Glu Lys
1 5 10 15
Ile Ala Asn Ala Thr Ala Leu Gly Glu Leu Val Gly Leu Thr Lys Phe
20 25 30
Gln Val Gly Asp Ser Asn Gly Glu Tyr Tyr Glu Pro Thr Glu Glu Gln
35 40 45
Thr Ala Leu Lys Asn Val Val Trp Glu Gly Asn Ile Asn Ser Leu Arg
50 55 60
Ile Asp Glu Lys Asn Pro Asn Trp Ile Val Ile Glu Thr Ile Leu Pro
65 70 75 80
Gly Thr Val Gly Gly Phe Met Ile Arg Glu Ala Ala Val Leu Asp Asn
85 90 95
Glu Asn Asn Ile Ile Ala Ile Gly Lys Tyr Pro Glu Thr Tyr Lys Pro
100 105 110
Arg Ala Glu Asp Gly Ser Ile Lys Asp Leu Val Val Lys Met Ile Leu
115 120 125
Gln Leu Ser Asn Thr Ser Asn Val Thr Leu Glu Val Asp Pro Thr Leu
130 135 140
Val Phe Val Thr Gln Lys Asp Ile Gln Asp Leu Asp Asp Lys Phe Asp
145 150 155 160
Lys Asn Ile Lys Glu Ile Lys Val Lys Ile Gly Glu Glu Leu Leu Ser
165 170 175
Thr Glu Ala Lys Asn Leu Ser Gly Ala Ile Asn Glu Val Val Glu Lys
180 185 190
Ile Lys Asn Ile Ser Ile Asp Asp Val Ile Gly Gly Gln Ile Gln Thr
195 200 205
Glu Leu Ser Val Leu Lys Asn Ser Tyr Asn Lys Leu Ser Glu Lys Val
210 215 220
Leu Asp Ile Leu Ile Tyr Leu Glu Leu Glu Ser Glu Ile Asp Val Asp
225 230 235 240
Glu Ala Gly Tyr Trp Tyr Asp Thr Leu Thr Asn Ala Lys Asn Ile Ile
245 250 255
Ala Ile Glu Gly Leu Lys Leu Asp Leu Asn Arg Lys Cys Ile Thr Gly
260 265 270
Glu Leu Gly Ser Val Thr Phe Lys Asn Val Val Leu Pro Phe Asn Ala
275 280 285
Asn Arg Val Arg Tyr Ile His Glu Met Asp Asn Asn Phe Val Glu Thr
290 295 300
Lys Ser Asn Arg Ala Tyr Ser Ile Gly Gln Thr Asp Ile Thr Leu Asn
305 310 315 320
Lys Tyr Ser Tyr Glu Ile Arg
325
<210> 79
<211> 98
<212> PRT
<213> Clostridium difficile
<400> 79
Met Gln Tyr Lys Asp Ile Ser Asp Ile Ser Ile Gly Gln Val Lys Gln
1 5 10 15
Asp Asp Asp Ile Thr Asn Asn Phe Ile Ala Asn Val Glu Ile Tyr Glu
20 25 30
Met Leu Leu Asn Gln Ser Ser Val Asn Glu Ala Ser Asn Ile Ser Thr
35 40 45
Phe Ser Val Arg Lys Ser Gly Gly Glu Ser Gly Met Val Glu Val Tyr
50 55 60
Val Ala Leu Ile Leu Arg Gly Lys Lys Thr Ile Glu Glu Val Pro Ala
65 70 75 80
Val Ile Arg Glu Gln Val Arg Ile Arg Cys Lys Glu Leu Glu Ile Pro
85 90 95
Val Glu
<210> 80
<211> 86
<212> PRT
<213> Clostridium difficile
<400> 80
Met Asp Lys Leu Ile Thr Glu Leu Ser Ser Leu Gly Ala Ile Gly Ile
1 5 10 15
Leu Cys Ala Leu Leu Phe Lys Asn Thr Met Gln Glu Lys Lys Glu Asp
20 25 30
Arg Asp Met Tyr Lys Lys Thr Val Glu Asn Phe Ile Glu Leu Ser Thr
35 40 45
Gln Gln Gln Glu Ile Asn Lys Asn Ile Leu Val Gln Met Gly Ile Met
50 55 60
Lys Thr Asp Val Glu Glu Ile Lys Glu Asp Val Thr Asp Ile Lys Gly
65 70 75 80
Met Leu Gln Asn Gly Val
85
<210> 81
<211> 1802
<212> PRT
<213> Clostridium difficile
<400> 81
Met Lys Gln Asn Lys Leu Leu Gln Arg Gly Ala Tyr Phe Asn Asp Lys
1 5 10 15
Asn Ile Leu Ile Asp Asp Phe Asp Lys Arg Tyr Asn Asp Tyr Asp Phe
20 25 30
Val Glu Phe Phe Thr Gly Ile Ser Asn Ser Thr Phe Gly Leu Lys Ser
35 40 45
Asp Gly Asn Leu Tyr Ala Cys Gly Asp Asn Thr Gly Met Lys Gln Asn
50 55 60
Lys Leu Leu Gln Arg Gly Ala Tyr Phe Asn Asp Lys Asn Ile Leu Ile
65 70 75 80
Asp Asp Phe Asp Lys Arg Tyr Asn Asp Tyr Asp Phe Val Glu Phe Phe
85 90 95
Thr Gly Ile Ser Asn Ser Thr Phe Gly Leu Lys Ser Asp Gly Asn Leu
100 105 110
Tyr Ala Cys Gly Asp Asn Thr Gly Phe Gln Leu Gly Leu Gly Lys Asp
115 120 125
Ser Ser Glu Arg Arg Met Phe Ser Lys Val Lys Ile Asp Asn Val Lys
130 135 140
Tyr Val Ser Cys Gly Ser Lys His Ser Val Ala Val Thr Lys Asp Gly
145 150 155 160
Phe Ala Tyr Gly Ala Gly Thr Ser Asn Val Gly Gln Leu Gly Val Ile
165 170 175
Glu Ser Thr Val Tyr Tyr Glu Phe Thr Lys Leu Pro Ile Asp Asp Val
180 185 190
Lys Thr Val Ala Cys Gly Tyr Asp Phe Thr Phe Val Leu Lys Asn Asp
195 200 205
Gly Thr Leu Tyr Ser Ala Gly Leu Asn Ser Ser Gly Gln Leu Gly Leu
210 215 220
Gly Asp Thr Asn Asn Arg Val Thr Phe Thr Lys Val Asn Ile Asp Ser
225 230 235 240
Val Lys Asp Val Val Thr Tyr Asn Gln Ser Val Phe Ile Ile Lys Met
245 250 255
Asp Gly Thr Ala His Ala Cys Gly Leu Asn Ser Asn Gly Gln Leu Gly
260 265 270
Ile Asn Ser Thr Leu Asn Lys Ser Val Phe Asn Lys Ile Glu Gly Met
275 280 285
Asp Asn Val Lys Gln Ile Ala Cys Gly Ser Ser His Thr Ile Leu Ile
290 295 300
Lys Asn Asp Gly Thr Met Tyr Thr Thr Gly Ser Asn Gly Tyr Gly Gln
305 310 315 320
Leu Gly Thr Gly Asn Asn Asn Asn Ser Ile Val Phe Thr Leu Ser Ser
325 330 335
Ile Asn Asn Val Lys Tyr Ala Ser Cys Gly Asn Asn His Thr Met Ile
340 345 350
Leu Lys Tyr Asp Asn Thr Leu Phe Ser Thr Gly Gln Asn Asn Tyr Gly
355 360 365
Gln Leu Ala Asn Ala Asn Lys Asp Val Ala Ser Arg Asn Thr Phe Val
370 375 380
Lys Val Asn Val Glu Asn Ile Lys Asp Ile Lys Cys Gly Ser Gln Phe
385 390 395 400
Asn Phe Leu Ile Asn Gly Ser Lys Glu Ile Phe Val Ser Gly Cys Asn
405 410 415
Leu Ala Gly Gln Leu Gly Ser Phe Phe His Thr Thr Phe Leu Tyr Glu
420 425 430
Phe Ser Lys Val Gln Ser Ser Asn Leu Asp Asn Tyr Ser Gly Leu Leu
435 440 445
Val Asn Asp Asp Tyr Leu Tyr Val Thr Lys Asp Asn Ser Glu Phe Leu
450 455 460
Asn Val Lys Leu Ser Asp Asn Phe Gln Asp Tyr Lys Lys Ile Glu Leu
465 470 475 480
Thr Asp Asn Asn Met Phe Ile Val Met Asn Asp Gly Thr Leu Tyr Ala
485 490 495
Cys Gly Leu Asn Asn Tyr Gly Gln Leu Gly Leu Gly Asp Thr Val Asn
500 505 510
Arg Ser Val Met Thr Lys Val Asp Ile Asp Asn Val Leu Asp Ile Lys
515 520 525
Gly Asn Gly Asn Ser Thr Phe Val Leu Lys Asn Asn Gly Thr Leu Tyr
530 535 540
Ser Cys Gly Tyr Asn Ser Ser Gly Ile Leu Gly Leu Lys Asp Asn Thr
545 550 555 560
Asn Arg Asn Ile Phe Thr Lys Ile Glu Ile Glu Asn Ile Lys Glu Phe
565 570 575
Cys Val Glu Ser Asn Tyr Ile Val Ala Leu Asn His Ser Lys Glu Leu
580 585 590
Tyr Gly Trp Gly Asn Gln Ser Tyr Ile Val Tyr Gly Asp Asn Arg Asn
595 600 605
Tyr Pro Tyr Lys Asp Thr Arg Val Ser Asn Val Glu Lys Ile Ala Thr
610 615 620
Trp Ser Asp Thr Leu Tyr Ile Leu Asp Ser Thr Gly Ala Thr Lys Thr
625 630 635 640
Ile Gly Tyr Ser Tyr Asn Gly Ser Gly Gly Tyr Pro Ala Pro Ser Ser
645 650 655
Ser Ser Thr Tyr Arg Glu Gly Gly Tyr Ile Asn Lys Asn Thr Ser Tyr
660 665 670
Arg Thr Leu Glu Phe Tyr Asn Thr Ser Lys Thr Lys Leu Val Asn Leu
675 680 685
Phe Ala Phe Tyr Asn Gly Cys Val Phe Val Asp Glu Asn Gly Leu Ala
690 695 700
Tyr Cys Ile Gly Glu Asn Asn Ile Asn Phe Arg Gly Gly Ser Thr Thr
705 710 715 720
Asn Glu Asn Asn Ser Leu Arg Phe Ile Asn Asn Ser Gly Val Tyr Tyr
725 730 735
Thr Asn Thr Asp Gly Thr Asp Tyr Thr Cys Tyr Gln Trp Thr Tyr Lys
740 745 750
Leu Ile Arg Cys Ser Ile Phe Asp Ser Pro Gln Asn Ile Ile Gly Asn
755 760 765
Ser Lys Asn Ile Leu Tyr Leu Ser Lys Asn Asn Ser Thr Phe Lys Cys
770 775 780
Thr Gly Asn Cys Ile Thr Tyr Gly Ile Asn Ser Gln Asn Trp Tyr Ser
785 790 795 800
Tyr Phe Ser Asp Ser Ser Asn Gly Ala Ile Ala Leu Gly Asn Glu Phe
805 810 815
Ile Leu Lys Asn Tyr Ser Gly Glu Cys Leu Leu Lys Gly Tyr Gly Lys
820 825 830
Ala Thr Asn Gly Glu Phe Gly Asn Ser Thr Asn Ile Ser Ser Ile Ser
835 840 845
Asn Tyr Asp Thr Gly Leu Lys Asp Ile Lys Asp Ile Ile Val Lys Asn
850 855 860
Asn Thr Val Val Val Val Asp Lys Asn Asn Asn Ile Tyr Val Thr Gly
865 870 875 880
Ala Asn Gln Phe Asn Lys Leu Gly Ile Gly Glu Tyr Asn Asn Gln Pro
885 890 895
Ile Arg Lys Phe Thr Asn Ile Thr Glu Gln Ser Asn Ser Phe Ile Phe
900 905 910
Met Asp Asp Ile Lys Glu Ile Thr Thr Ser Arg Asn Thr Met Phe Ile
915 920 925
Val Lys Asn Asp Gly Thr Ala Tyr Ala Thr Gly Asn Asn Ser Ser Gly
930 935 940
Gln Leu Gly Leu Gly Asp Thr Ile Asn Arg Asn Lys Phe Thr Gln Ile
945 950 955 960
Asn Leu Asp Asn Ile Lys Lys Ile Ser Thr Ser Ile Asp Gly Asn Thr
965 970 975
Thr Phe Ala Ile Arg Asn Asp Gly Thr Leu Tyr Ser Thr Gly Leu Asn
980 985 990
Thr Lys Gly Gln Leu Gly Leu Gly Asp Ile Val Asn Arg Asn Thr Phe
995 1000 1005
Thr Lys Val Asn Ile Gln Asn Val Arg Asp Val Val Leu Gly Thr
1010 1015 1020
Thr His Ser His Ala Ile Lys Asp Asp Asn Thr Leu Tyr Ser Cys
1025 1030 1035
Gly Glu Asn Thr His Gly Gln Leu Gly Leu Gly Ser Glu Ser Asn
1040 1045 1050
His Pro Asp Val Leu Thr Phe Thr Val Asn Asn Ile Thr Asn Val
1055 1060 1065
Arg Asp Val Tyr Cys Ser Asp Thr Thr Thr Phe Ile Val Lys Asp
1070 1075 1080
Thr Asn Ile Ala Tyr Cys Cys Gly Tyr Asn Asn Asn Ser Gln Leu
1085 1090 1095
Gly Met Gly Asn Thr Thr Asp Gln Tyr Ser Phe Ile Lys Cys Met
1100 1105 1110
Glu Asn Val Lys Glu Val Ile Pro Asn Glu Ile Asn Thr Tyr Ile
1115 1120 1125
Ile Thr Ile Tyr Asn Thr Ala Tyr Ser Thr Gly Leu Asn Thr Asp
1130 1135 1140
Tyr Cys Leu Gly Leu Asn Ser Asn Ser Asn Gln Ser Ser Phe Ser
1145 1150 1155
Glu Ile Pro Ile Ser Asn Val Val Lys Val Ala Pro Asn Arg Asn
1160 1165 1170
Asn Ala Val Leu Leu Leu Thr Ser Glu Gly Asp Val Tyr Thr Ala
1175 1180 1185
Gly Lys Cys Ser Asn Gly Ser Gly Thr Gly Ser Glu Thr Pro Glu
1190 1195 1200
Lys Ile Lys Lys Ile Ala Ser Lys Ala Lys Asp Ile Gly Met Asn
1205 1210 1215
Tyr Arg Cys Gly His Tyr Val Ser Asp Asn Gly Asp Leu Tyr Gly
1220 1225 1230
Thr Gly Phe Asn Asp Cys Gly Gln Leu Gly Val Gly Asn Val Thr
1235 1240 1245
Lys Arg Asp Thr Phe Ile Lys Thr Asn Thr Arg Val Lys Lys Ile
1250 1255 1260
Leu Pro Leu Glu Tyr Ala Asn Ile Ala Ile Lys Asp Thr Asn Asp
1265 1270 1275
Ile Tyr Ile Cys Gly Leu Asn Asn Tyr Gly Gln Leu Gly Val Gly
1280 1285 1290
Asn Arg Tyr Asp Ser Arg Asn Asn Asp Asn Arg Ile Phe Asn Tyr
1295 1300 1305
Lys His Met Asn Phe Val Met Gly Asp Leu Thr Ser Ile Lys Asn
1310 1315 1320
Arg His Asn Phe Ile Leu Leu Asn Asn Lys Ile Val Ile Pro Thr
1325 1330 1335
Thr Lys Asp Ile Asp Tyr Gly Leu Val Leu Gly Asn Leu Tyr Lys
1340 1345 1350
Gly Asp Leu Tyr Thr Glu Leu Pro Tyr Glu Asp Ile Lys Glu Val
1355 1360 1365
Ser Ile Ser Lys Thr His Ile Ile Ile Leu Leu Asn Asp Gly Thr
1370 1375 1380
Met Tyr Gly Cys Gly Thr Asn Tyr His Gly Glu Leu Leu Gln Asp
1385 1390 1395
Leu Ser Ile Asn Gln Val Asp Glu Phe Val Gln Ile Asn Val Ser
1400 1405 1410
Asp Val Lys His Val Ser Cys Gly Asp Asn Phe Thr Tyr Phe Ile
1415 1420 1425
Lys Ser Asp Asp Ser Leu Trp Ser Ile Gly Lys Asn Ser Glu Tyr
1430 1435 1440
Gln Leu Gly Ile Gly His Asn Asn Pro Val Thr Glu Leu Gln Arg
1445 1450 1455
Ile Thr Thr Ile Ser Ser Cys Lys Glu Val His Cys Gly Lys Asn
1460 1465 1470
Tyr Thr Leu Val Val Thr Thr Ser Asn Glu Leu Phe Val Gln Gly
1475 1480 1485
Tyr Asn Asp Lys Gly Ala Leu Gly Leu Gly Ser Asp Ser Glu Asn
1490 1495 1500
Thr Ile Ile Lys Phe Phe Thr Lys Ala Leu Thr Asp Ile Arg Glu
1505 1510 1515
Ile Lys Ser Tyr Gly Ser Asp His Ile Leu Val Leu Lys Asn Asp
1520 1525 1530
Asn Ser Val Trp Val Thr Gly Lys Asn Arg Asp Val Tyr Lys Ile
1535 1540 1545
Glu Gln Pro Val Glu Phe Leu Lys Glu Phe Thr Ile Val Pro Ile
1550 1555 1560
Ser Glu Asp Val Asn Thr Val Lys Asp Val Leu Ala Thr Asp Asn
1565 1570 1575
Thr Leu Tyr Ile Ile Ser Glu Val Gly Thr Thr Asn Ala Ala Ile
1580 1585 1590
Glu Ile Thr Glu Lys Ser Ile Ser Ser Ile Lys Ile Lys Ile Gln
1595 1600 1605
Asp Pro Asn Lys Asp Ile Ser Arg Ile Glu Met Leu Ile Asn Gly
1610 1615 1620
Glu Ser Val Lys Ser Val Ser Asp Leu Ile Thr Glu Lys Ile Ser
1625 1630 1635
Phe Glu Val Pro Pro Asp Lys Ile Lys Ile Gly Glu Asn Lys Ile
1640 1645 1650
Leu Phe Arg Ala Tyr Cys Lys Gly Asp Asp Leu Tyr Ala Ser Leu
1655 1660 1665
Phe Ile Phe Lys Glu Ser Thr Gly Asn Ser Ile Ile Lys Asp Ser
1670 1675 1680
Tyr Val Met Ile Gly Asn Arg Met Tyr Lys Val Val Asn Thr Thr
1685 1690 1695
Ser Asn Glu Gln Asp Ile Thr Ile Thr Leu Asp Arg Gly Leu Glu
1700 1705 1710
Glu Asp Leu Asn Leu Gly Asp Pro Ile Tyr Gln Leu Ile Asn Lys
1715 1720 1725
Thr Lys Val Gln Val Lys Ile Asn Lys Ser Asp Leu Phe Lys Asp
1730 1735 1740
Met Lys Leu Val Glu Ile Lys Lys Ser Asp Ser Ser Tyr Gln Glu
1745 1750 1755
Ile Tyr Glu Leu Glu Glu Ala Asn Ile Lys Ser Ala Gln Pro Lys
1760 1765 1770
Ile Ile Val Glu Lys Gly Asp Lys Trp Thr Ala Ile Lys Arg Pro
1775 1780 1785
Ser Met Ile Phe Arg Tyr Asp Ala Glu Asn Asn Glu Pro Gln
1790 1795 1800
<210> 82
<211> 1742
<212> PRT
<213> Clostridium difficile
<400> 82
Met Lys Gln Asn Lys Leu Leu Gln Arg Gly Ala Tyr Phe Asn Asp Lys
1 5 10 15
Asn Ile Leu Ile Asp Asp Phe Asp Lys Arg Tyr Asn Asp Tyr Asp Phe
20 25 30
Val Glu Phe Phe Thr Gly Ile Ser Asn Ser Thr Phe Gly Leu Lys Ser
35 40 45
Asp Gly Asn Leu Tyr Ala Cys Gly Asn Asn Thr Gly Phe Pro Leu Gly
50 55 60
Leu Gly Lys Asp Ser Ser Glu Arg Arg Met Phe Ser Lys Val Lys Ile
65 70 75 80
Asp Asn Val Lys Tyr Val Ser Cys Gly Ser Lys His Ser Val Ala Val
85 90 95
Thr Lys Asp Gly Phe Ala Tyr Gly Ala Gly Thr Ser Asn Val Gly Gln
100 105 110
Leu Gly Val Ile Glu Ser Thr Val Tyr Tyr Glu Phe Thr Lys Leu Pro
115 120 125
Ile Asp Asp Val Lys Thr Val Ala Cys Gly Tyr Asp Phe Thr Phe Val
130 135 140
Leu Lys Asn Asp Gly Thr Leu Tyr Ser Ala Gly Leu Asn Ser Ser Gly
145 150 155 160
Gln Leu Gly Leu Gly Asp Thr Asn Asn Arg Ala Thr Phe Thr Lys Val
165 170 175
Asn Ile Asp Ser Val Lys Asp Val Val Thr Tyr Asn Gln Ser Val Phe
180 185 190
Ile Ile Lys Met Asp Gly Thr Ala His Ala Cys Gly Leu Asn Ser Asn
195 200 205
Gly Gln Leu Gly Ile Asn Ser Thr Leu Asn Lys Ser Val Phe Asn Lys
210 215 220
Ile Glu Gly Met Asp Asn Val Lys Gln Ile Ala Cys Gly Ser Ser His
225 230 235 240
Thr Ile Leu Ile Lys Asn Asp Gly Thr Met Tyr Thr Thr Gly Tyr Asn
245 250 255
Gly Val Gly Gln Leu Gly Thr Gly Asn Asn Asn Asn Ser Ile Val Phe
260 265 270
Thr Leu Ser Ser Ile Asn Asn Val Lys Tyr Ala Ser Cys Gly Asn Asn
275 280 285
His Thr Met Ile Leu Lys Tyr Asp Asn Thr Leu Phe Ser Thr Gly Gln
290 295 300
Asn Thr Tyr Gly Gln Leu Ala Asn Ala Asn Lys Asp Val Ala Ser Arg
305 310 315 320
Asn Thr Phe Ala Lys Val Asn Val Glu Asn Ile Lys Asp Ile Lys Cys
325 330 335
Gly Ser Gln Phe Asn Phe Leu Ile Asn Gly Ser Lys Glu Ile Phe Val
340 345 350
Ser Gly Cys Asn Leu Ala Gly Gln Leu Gly Ser Phe Phe His Thr Thr
355 360 365
Phe Leu Tyr Glu Phe Ser Lys Val Gln Ser Ser Asn Leu Asp Asn Tyr
370 375 380
Ser Gly Leu Leu Val Asn Asp Asp Tyr Leu Tyr Val Thr Lys Asp Asn
385 390 395 400
Ser Glu Phe Leu Asn Val Lys Leu Ser Asp Asn Phe Gln Asp Tyr Lys
405 410 415
Lys Ile Glu Leu Thr Asp Asn Asn Met Phe Ile Val Met Asn Asp Gly
420 425 430
Thr Leu Tyr Ala Cys Gly Leu Asn Asn Tyr Gly Gln Leu Gly Leu Gly
435 440 445
Asp Thr Val Asn Arg Ser Val Met Thr Lys Val Asp Ile Asp Asn Val
450 455 460
Leu Asp Ile Lys Gly Asn Gly Asn Ser Thr Phe Val Leu Lys Asn Asn
465 470 475 480
Gly Thr Leu Tyr Ser Cys Gly Tyr Asn Ser Ser Gly Ile Leu Gly Leu
485 490 495
Lys Asp Asn Thr Asn Arg Asn Ile Phe Thr Lys Ile Glu Ile Glu Asn
500 505 510
Val Lys Ala Phe Cys Val Glu Ser Asn Tyr Ile Val Val Leu Asn His
515 520 525
Ser Lys Glu Leu Tyr Gly Trp Gly Asn Glu Ser Tyr Ile Val Tyr Gly
530 535 540
Asn Ser Arg Asn Tyr Pro Tyr Lys Asp Thr Arg Val Ser Asn Val Glu
545 550 555 560
Lys Ile Ala Thr Trp Ser Asp Thr Leu Tyr Ile Leu Asp Ser Thr Gly
565 570 575
Ala Thr Lys Thr Ile Gly Tyr Ser Tyr Asn Gly Ser Gly Gly Tyr Pro
580 585 590
Ala Pro Ser Ser Ser Ser Thr Tyr Arg Asp Gly Gly Tyr Ile Asn Lys
595 600 605
Asn Thr Ser Tyr Arg Thr Leu Glu Phe Tyr Asn Thr Ser Lys Thr Lys
610 615 620
Leu Val Asn Leu Phe Ala Phe Tyr Asn Gly Cys Val Phe Val Asp Glu
625 630 635 640
Asn Gly Leu Ala Tyr Cys Ile Gly Glu Asn Asn Ile Asn Phe Arg Gly
645 650 655
Asn Ser Thr Thr Asn Glu Asn Asn Ser Leu Arg Phe Ile Asn Asn Ser
660 665 670
Gly Val Tyr Tyr Thr Asn Thr Asp Gly Thr Asp Tyr Thr Cys Tyr Gln
675 680 685
Trp Thr Tyr Lys Leu Ile Arg Cys Ser Ile Phe Asp Ser Pro Gln Asn
690 695 700
Ile Ile Gly Asn Ser Lys Asn Ile Leu Tyr Leu Ser Lys Asn Asn Ser
705 710 715 720
Thr Phe Lys Cys Thr Gly Asn Cys Ile Thr Tyr Gly Ile Asn Ser Gln
725 730 735
Asn Trp Tyr Ser Tyr Phe Ser Asp Ser Ser Asn Gly Ala Ile Ala Leu
740 745 750
Gly Asn Glu Phe Ile Leu Lys Asn Tyr Ser Gly Glu Cys Leu Leu Lys
755 760 765
Gly Tyr Gly Lys Ala Thr Asn Gly Glu Phe Gly Asn Ser Thr Asn Ile
770 775 780
Ser Ser Ile Ser Asn Tyr Asp Thr Gly Leu Lys Asp Ile Lys Asp Ile
785 790 795 800
Ile Val Lys Asn Asn Thr Val Val Val Val Asp Lys Asn Asn Asn Ile
805 810 815
Tyr Val Thr Gly Ala Asn Gln Phe Asn Lys Leu Gly Ile Gly Glu Tyr
820 825 830
Asn Asn Gln Pro Ile Lys Lys Phe Thr Asn Ile Thr Glu Gln Ser Asn
835 840 845
Ser Phe Ile Phe Met Asp Asp Ile Lys Glu Ile Thr Thr Ser Arg Asn
850 855 860
Thr Met Phe Ile Val Lys Asn Asp Gly Thr Ala Tyr Ala Thr Gly Asn
865 870 875 880
Asn Ser Ser Gly Gln Leu Gly Leu Gly Asp Thr Ile Asn Arg Asn Lys
885 890 895
Phe Thr Gln Ile Asn Leu Asp Asn Ile Lys Lys Ile Ser Thr Ser Ile
900 905 910
Asp Gly Asn Thr Thr Phe Ala Ile Arg Asn Asp Gly Thr Leu Tyr Ser
915 920 925
Thr Gly Leu Asn Thr Lys Gly Gln Leu Gly Leu Gly Asp Ile Val Asn
930 935 940
Arg Asn Thr Phe Thr Lys Val Asn Ile Gln Asn Val Arg Asp Val Val
945 950 955 960
Leu Gly Thr Thr His Ser His Ala Ile Lys Asp Asp Asn Thr Leu Tyr
965 970 975
Ser Cys Gly Glu Asn Thr His Gly Gln Leu Gly Leu Gly Ser Glu Ser
980 985 990
Asn His Pro Asp Val Leu Thr Phe Thr Val Asn Asn Ile Thr Asn Val
995 1000 1005
Arg Asp Val Tyr Cys Ser Asp Thr Thr Thr Phe Ile Val Lys Asp
1010 1015 1020
Thr Asn Ile Ala Tyr Cys Cys Gly Tyr Asn Asn Asn Ser Gln Leu
1025 1030 1035
Gly Met Gly Asn Thr Thr Asp Gln Tyr Ser Phe Ile Lys Cys Met
1040 1045 1050
Glu Asn Val Lys Glu Val Ile Pro Asn Glu Ile Asn Thr Tyr Ile
1055 1060 1065
Ile Thr Ile Tyr Asn Thr Ala Tyr Ser Thr Gly Leu Asn Thr Asp
1070 1075 1080
Tyr Cys Leu Gly Leu Asn Ser Asn Ser Asn Gln Ser Ser Phe Ser
1085 1090 1095
Glu Ile Pro Ile Ser Asn Val Val Lys Val Ala Pro Asn Arg Asn
1100 1105 1110
Asn Ala Val Leu Leu Leu Thr Ser Glu Gly Asp Val Tyr Thr Ala
1115 1120 1125
Gly Lys Cys Ser Asn Gly Ser Gly Thr Gly Ser Glu Thr Pro Glu
1130 1135 1140
Lys Ile Lys Lys Ile Ala Ser Lys Ala Lys Asp Ile Gly Met Asn
1145 1150 1155
Tyr Arg Cys Gly His Tyr Val Ser Asp Asn Gly Asp Leu Tyr Gly
1160 1165 1170
Thr Gly Phe Asn Asp Cys Gly Gln Leu Gly Val Gly Asp Val Thr
1175 1180 1185
Lys Arg Asp Thr Phe Ile Lys Thr Asn Thr Arg Val Lys Lys Ile
1190 1195 1200
Leu Pro Leu Glu Tyr Ala Asn Ile Ala Ile Lys Asp Thr Asn Asp
1205 1210 1215
Ile Tyr Ile Cys Gly Leu Asn Asn Tyr Gly Gln Leu Gly Val Gly
1220 1225 1230
Asn Arg Tyr Asp Ser Arg Asn Asn Asp Asn Arg Ile Phe Asn Tyr
1235 1240 1245
Lys His Met Asn Phe Val Met Gly Asp Leu Thr Ser Ile Lys Asn
1250 1255 1260
Arg His Asn Phe Ile Leu Leu Asn Asn Lys Ile Val Ile Pro Thr
1265 1270 1275
Thr Lys Asp Ile Asp Tyr Gly Leu Val Leu Gly Asn Leu Tyr Lys
1280 1285 1290
Gly Asp Leu Tyr Thr Glu Leu Pro Tyr Glu Asp Ile Lys Glu Val
1295 1300 1305
Ser Ile Ser Lys Thr His Ile Ile Ile Leu Leu Asn Asp Gly Thr
1310 1315 1320
Met Tyr Gly Cys Gly Thr Asn Tyr His Gly Glu Leu Leu Gln Asp
1325 1330 1335
Leu Ser Ile Asn Gln Val Asp Glu Phe Val Gln Ile Asn Val Ser
1340 1345 1350
Asp Val Lys His Val Ser Cys Gly Asp Asn Phe Thr Tyr Phe Ile
1355 1360 1365
Lys Ser Asp Asp Ser Leu Trp Ser Ile Gly Lys Asn Ser Glu Tyr
1370 1375 1380
Gln Leu Gly Ile Gly His Asn Asn Pro Val Thr Glu Leu Gln Arg
1385 1390 1395
Ile Thr Thr Ile Ser Ser Cys Lys Glu Val His Cys Gly Lys Asn
1400 1405 1410
Tyr Thr Leu Val Val Thr Thr Gly Asn Glu Leu Phe Val Gln Gly
1415 1420 1425
Tyr Asn Asp Lys Gly Ala Leu Gly Leu Gly Ser Asp Ser Glu Asn
1430 1435 1440
Thr Ile Ile Lys Phe Phe Thr Lys Ala Leu Thr Asp Ile Arg Glu
1445 1450 1455
Ile Lys Ser Tyr Gly Ser Asp His Ile Leu Val Leu Lys Asn Asp
1460 1465 1470
Asn Ser Val Trp Val Thr Gly Lys Asn Arg Asp Val Tyr Lys Ile
1475 1480 1485
Glu Gln Pro Val Glu Phe Leu Lys Glu Phe Thr Ile Ile Pro Ile
1490 1495 1500
Ser Glu Asp Val Asn Thr Val Lys Asp Val Leu Ala Thr Asp Asn
1505 1510 1515
Thr Leu Tyr Ile Ile Ser Glu Val Gly Thr Thr Asn Ala Ala Ile
1520 1525 1530
Glu Ile Thr Glu Lys Ser Ile Ser Ser Ile Lys Ile Lys Ile Gln
1535 1540 1545
Asp Pro Asn Lys Asp Ile Ser Arg Ile Glu Met Leu Ile Asn Gly
1550 1555 1560
Glu Ser Val Lys Ser Val Ser Asp Leu Ile Thr Glu Lys Ile Ser
1565 1570 1575
Phe Glu Val Pro Pro Asp Lys Ile Lys Ile Gly Glu Asn Lys Ile
1580 1585 1590
Leu Phe Arg Ala Tyr Cys Lys Gly Asp Asp Leu Tyr Ala Ser Leu
1595 1600 1605
Phe Ile Phe Lys Glu Ser Thr Gly Asn Ser Ile Ile Lys Asp Ser
1610 1615 1620
Tyr Val Met Ile Gly Asn Arg Met Tyr Lys Val Val Asn Thr Thr
1625 1630 1635
Ser Asn Glu Gln Asp Ile Thr Ile Thr Leu Asp Arg Gly Leu Glu
1640 1645 1650
Glu Asp Leu Asn Leu Gly Asp Pro Ile Tyr Gln Leu Ile Asn Lys
1655 1660 1665
Thr Lys Val Gln Val Lys Ile Asn Lys Ser Asp Leu Phe Lys Asp
1670 1675 1680
Met Lys Leu Val Glu Ile Lys Lys Ser Asp Ser Ser Tyr Gln Glu
1685 1690 1695
Ile Tyr Glu Leu Glu Glu Ala Asn Ile Lys Ser Ala Gln Pro Lys
1700 1705 1710
Ile Ile Val Glu Lys Gly Asp Lys Trp Thr Ala Ile Lys Arg Pro
1715 1720 1725
Ser Met Ile Phe Arg Tyr Asp Ala Glu Asn Asn Glu Pro Gln
1730 1735 1740
<210> 83
<211> 1724
<212> PRT
<213> Clostridium difficile
<400> 83
Met Lys Gln Asn Lys Leu Leu Gln Arg Gly Ala Tyr Phe Asn Asp Lys
1 5 10 15
Asn Ile Leu Ile Asp Asp Phe Asp Lys Arg Tyr Asn Asp Tyr Asp Phe
20 25 30
Val Glu Phe Phe Thr Gly Ile Ser Asn Ser Thr Phe Gly Leu Lys Ser
35 40 45
Asp Gly Asn Leu Tyr Ala Cys Gly Asp Asn Thr Gly Phe Gln Leu Gly
50 55 60
Leu Gly Lys Asp Ser Ser Glu Arg Arg Met Phe Ser Lys Val Lys Ile
65 70 75 80
Asp Asn Val Lys Tyr Val Ser Cys Gly Ser Lys His Ser Val Ala Val
85 90 95
Thr Lys Asp Gly Phe Ala Tyr Gly Ala Gly Thr Ser Asn Val Gly Gln
100 105 110
Leu Gly Val Ile Glu Ser Thr Val Tyr Tyr Glu Phe Thr Lys Leu Pro
115 120 125
Ile Asp Asp Val Lys Thr Val Ala Cys Gly Tyr Asp Phe Thr Phe Val
130 135 140
Leu Lys Asn Asp Gly Thr Leu Tyr Ser Ala Gly Leu Asn Ser Ser Gly
145 150 155 160
Gln Leu Gly Leu Gly Asp Thr Asn Asn Arg Ala Thr Phe Thr Lys Val
165 170 175
Asn Ile Asp Ser Val Lys Asp Val Val Thr Tyr Asn Gln Ser Val Phe
180 185 190
Ile Ile Lys Met Asp Gly Thr Ala His Ala Cys Gly Leu Asn Ser Asn
195 200 205
Gly Gln Leu Gly Ile Asn Ser Thr Leu Asn Lys Ser Val Phe Asn Lys
210 215 220
Ile Glu Gly Met Asp Asn Val Lys Gln Ile Ala Cys Gly Ser Ser His
225 230 235 240
Thr Ile Leu Ile Lys Asn Asp Gly Thr Met Tyr Thr Thr Gly Tyr Asn
245 250 255
Gly Val Gly Gln Leu Gly Thr Gly Asn Asn Asn Asn Ser Ile Val Phe
260 265 270
Thr Leu Ser Ser Ile Asn Asn Val Lys Tyr Ala Ser Cys Gly Asn Asn
275 280 285
His Thr Met Ile Leu Lys Tyr Asp Asn Thr Leu Phe Ser Thr Gly Gln
290 295 300
Asn Asn Tyr Gly Gln Leu Ala Asn Ala Asn Lys Asp Val Ala Ser Arg
305 310 315 320
Asn Thr Phe Ala Lys Val Asn Val Glu Asn Ile Lys Asp Ile Lys Cys
325 330 335
Gly Ser Gln Phe Asn Phe Leu Ile Asn Gly Ser Lys Glu Ile Phe Val
340 345 350
Ser Gly Cys Asn Leu Ala Gly Gln Leu Gly Ser Phe Phe His Thr Thr
355 360 365
Phe Leu Tyr Glu Phe Ser Asn Val Gln Ser Ser Asn Leu Asp Asn Tyr
370 375 380
Ser Gly Leu Leu Val Asn Asp Asp Tyr Leu Tyr Val Thr Lys Asp Asn
385 390 395 400
Ser Glu Phe Leu Asn Val Lys Leu Ser Asp Asn Phe Gln Asp Tyr Lys
405 410 415
Lys Ile Glu Leu Thr Asp Ser Asn Met Phe Ile Val Met Asn Asp Gly
420 425 430
Thr Leu Tyr Ala Cys Gly Leu Asn Asn Tyr Gly Gln Leu Gly Leu Gly
435 440 445
Asp Thr Val Asn Arg Ser Val Met Thr Lys Val Asp Ile Asp Asn Val
450 455 460
Leu Asp Ile Lys Gly Asn Gly Asn Ser Thr Phe Val Leu Lys Asn Asn
465 470 475 480
Gly Thr Leu Tyr Ser Cys Gly Leu Asn Ser Asn Gly Gln Leu Gly Leu
485 490 495
Arg Asp Glu Val Asn Arg Asn Ile Phe Thr Lys Ile Glu Ile Glu Asn
500 505 510
Val Lys Asp Phe Cys Val Gly Ser Asn Tyr Val Ile Ala Leu Asn His
515 520 525
Ser Lys Glu Val Tyr Gly Trp Gly Asn Asn Pro Tyr Asn Asn Ile Glu
530 535 540
Lys Thr Ser Asn Tyr Pro Tyr Lys Gln Gly Ile Ser Asn Ile Glu Lys
545 550 555 560
Ile Ala Ala Tyr Asp Tyr Ser Val Tyr Met Ile Asn Ser Glu Gly Lys
565 570 575
Leu Tyr Val Ser Gly Tyr Asn Tyr Asn Tyr Gln Leu Gly Lys Gly Asn
580 585 590
Asn Ser Asn Gln Ser Lys Ala Leu Val Ser Gln Cys Arg Thr Asn Ser
595 600 605
Thr Ser Ser Thr Ser Asn Gly Leu Arg Thr Leu Pro Lys Ile Thr Asn
610 615 620
Val Phe Pro Phe Tyr Asp Gly Cys Ala Ile Ile Asp Glu Gly Gly Tyr
625 630 635 640
Val Tyr Leu Thr Gly Tyr His Gly Tyr Leu Arg Thr Leu Asn Ser Ser
645 650 655
Pro Ser Ile Ser Asp Tyr Ser Arg Tyr Gly Thr Phe Ile Glu Ala Thr
660 665 670
Asn Ser Asn His Asn Thr Tyr Phe Ile Gln Glu Thr Asp Phe Ser Gly
675 680 685
Ile Glu Lys Val Ile Gly Met Ser Asn Asn Ile Leu Phe Phe Lys Lys
690 695 700
Gly Ser Ser Tyr Ile Thr Gly Tyr Pro Lys Thr Phe Gly Ser Thr Ile
705 710 715 720
Thr Gly His Arg Ser Tyr Thr Ser Ile Asn Ser Glu Ser Ser Asn Leu
725 730 735
Gly Ser Asn Phe Ile Ile Tyr His Ser Asn Ser Lys Leu Tyr Gly Lys
740 745 750
Gly Ile Ala Asn Ser Gly Gln Phe Gly Asn Ser Thr Asn Ile Asp Gly
755 760 765
Thr Ser Asn Tyr Asp Thr Gly Leu Lys Asp Ile Lys Asp Ile Ile Val
770 775 780
Lys Gly Asn Thr Val Val Val Val Asp Lys Asn Asn Asn Ile Tyr Val
785 790 795 800
Thr Gly Met Asn Gln Asn Asn Lys Leu Gly Ile Gly Glu Tyr Asn Asn
805 810 815
Glu Pro Val Lys Lys Phe Thr Asn Ile Thr Glu Gln Ser Asn Ser Phe
820 825 830
Ile Phe Met Asp Asp Ile Lys Glu Ile Thr Thr Ser Arg Asn Thr Met
835 840 845
Phe Ile Val Lys Asn Asp Gly Thr Ala Tyr Ala Thr Gly Asn Asn Ser
850 855 860
Ser Gly Gln Leu Gly Leu Gly Asp Thr Ile Asn Arg Asn Lys Phe Thr
865 870 875 880
Gln Ile Asn Leu Asp Asn Ile Lys Lys Ile Ser Thr Ser Ile Asp Gly
885 890 895
Asn Thr Thr Phe Ala Ile Arg Asn Asp Gly Thr Leu Tyr Ser Thr Gly
900 905 910
Leu Asn Thr Lys Gly Gln Leu Gly Leu Gly Asp Ile Val Asn Arg Asn
915 920 925
Thr Phe Thr Lys Val Asn Ile Gln Asn Val Arg Asp Val Val Leu Gly
930 935 940
Thr Thr His Ser His Ala Ile Lys Asp Asp Asn Thr Leu Tyr Ser Cys
945 950 955 960
Gly Glu Asn Thr His Gly Gln Leu Gly Leu Gly Ser Glu Ser Asn His
965 970 975
Pro Asp Val Leu Thr Phe Thr Val Asn Asn Ile Thr Asn Val Arg Asp
980 985 990
Val Tyr Cys Ser Asp Thr Thr Thr Phe Ile Val Lys Asp Thr Asn Ile
995 1000 1005
Ala Tyr Cys Cys Gly Tyr Asn Asn Asn Ser Gln Leu Gly Met Gly
1010 1015 1020
Asn Thr Thr Asp Gln Tyr Ser Phe Ile Lys Cys Met Glu Asn Val
1025 1030 1035
Lys Glu Val Ile Pro Asn Glu Ile Asn Thr Tyr Ile Ile Thr Ile
1040 1045 1050
Tyr Asn Thr Ala Tyr Ser Thr Gly Leu Asn Thr Asp Tyr Cys Leu
1055 1060 1065
Gly Leu Asn Ser Asn Ser Asn Gln Ser Ser Phe Ser Glu Ile Pro
1070 1075 1080
Ile Ser Asn Val Val Lys Val Ala Pro Asn Arg Asn Asn Ala Val
1085 1090 1095
Leu Leu Leu Thr Ser Glu Gly Asp Val Tyr Thr Ala Gly Lys Cys
1100 1105 1110
Ser Asn Gly Ser Gly Thr Gly Ser Glu Thr Pro Glu Lys Ile Lys
1115 1120 1125
Lys Ile Ala Ser Lys Ala Lys Asp Ile Gly Met Asn Tyr Arg Cys
1130 1135 1140
Gly His Tyr Val Ser Asp Asn Gly Asp Leu Tyr Gly Thr Gly Phe
1145 1150 1155
Asn Asn Asn Gly Gln Leu Gly Val Gly Asp Val Thr Lys Arg Asp
1160 1165 1170
Thr Phe Ile Lys Thr Asn Thr Arg Val Lys Lys Ile Leu Pro Leu
1175 1180 1185
Glu Tyr Ala Asn Ile Ala Ile Lys Asp Thr Asn Asp Ile Tyr Ile
1190 1195 1200
Cys Gly Leu Asn Asn Tyr Gly Gln Leu Gly Val Gly Asn Arg Tyr
1205 1210 1215
Asp Ser Arg Asn Asn Asp Asn Arg Ile Phe Asn Tyr Lys His Met
1220 1225 1230
Asn Phe Val Met Gly Asp Leu Thr Ser Ile Lys Asn Arg His Asn
1235 1240 1245
Phe Ile Leu Leu Asn Asn Lys Ile Val Ile Pro Thr Thr Lys Asp
1250 1255 1260
Ile Asp Tyr Gly Leu Val Leu Gly Asn Leu Tyr Lys Gly Asp Leu
1265 1270 1275
Tyr Thr Glu Leu Pro Tyr Glu Asp Ile Lys Glu Val Ser Ile Ser
1280 1285 1290
Lys Thr His Ile Ile Ile Leu Leu Asn Asp Gly Thr Met Tyr Gly
1295 1300 1305
Cys Gly Thr Asn Tyr His Gly Glu Leu Leu Gln Asp Leu Ser Ile
1310 1315 1320
Asn Gln Val Asp Glu Phe Val Gln Ile Asn Val Ser Asp Val Lys
1325 1330 1335
His Val Ser Cys Gly Asp Asn Phe Thr Tyr Phe Ile Lys Ser Asp
1340 1345 1350
Asp Ser Leu Trp Ser Ile Gly Lys Asn Ser Glu Tyr Gln Leu Gly
1355 1360 1365
Ile Gly His Asn Asn Pro Val Thr Glu Leu Gln Arg Ile Thr Thr
1370 1375 1380
Ile Ser Ser Cys Lys Glu Val His Cys Gly Lys Asn Tyr Thr Leu
1385 1390 1395
Val Val Thr Thr Gly Asn Glu Leu Phe Val Gln Gly Tyr Asn Asp
1400 1405 1410
Lys Gly Ala Leu Gly Leu Gly Ser Asp Ser Glu Asn Thr Ile Ile
1415 1420 1425
Lys Phe Phe Thr Lys Ala Leu Thr Asp Ile Arg Glu Ile Lys Ser
1430 1435 1440
Tyr Gly Ser Asp His Ile Leu Val Leu Lys Asn Asp Asn Ser Val
1445 1450 1455
Trp Val Thr Gly Lys Asn Arg Asp Val Tyr Lys Ile Glu Gln Pro
1460 1465 1470
Val Glu Phe Leu Lys Glu Phe Thr Ile Val Pro Ile Ser Glu Asp
1475 1480 1485
Val Asn Thr Val Lys Asp Val Leu Ala Thr Asp Asn Thr Leu Tyr
1490 1495 1500
Ile Ile Ser Glu Val Gly Thr Thr Asn Ala Ala Ile Glu Ile Thr
1505 1510 1515
Glu Lys Ser Ile Ser Ser Ile Lys Ile Lys Ile Gln Asp Pro Asn
1520 1525 1530
Lys Asp Ile Ser Arg Ile Glu Met Leu Ile Asn Gly Glu Ser Val
1535 1540 1545
Lys Ser Val Ser Asp Leu Thr Thr Glu Lys Ile Ser Phe Glu Val
1550 1555 1560
Pro Pro Asp Lys Ile Lys Ile Gly Glu Asn Lys Ile Leu Phe Arg
1565 1570 1575
Ala Tyr Cys Lys Gly Asp Asp Leu Tyr Ala Ser Leu Phe Ile Phe
1580 1585 1590
Lys Glu Ser Thr Gly Asn Ser Ile Ile Lys Asp Ser Tyr Val Met
1595 1600 1605
Ile Gly Asn Arg Met Tyr Lys Val Val Asn Thr Thr Ser Asn Glu
1610 1615 1620
Gln Asp Ile Thr Ile Thr Leu Asp Arg Gly Leu Glu Glu Asp Leu
1625 1630 1635
Asn Leu Gly Asp Pro Ile Tyr Gln Leu Ile Asn Lys Thr Lys Val
1640 1645 1650
Gln Val Lys Ile Asn Lys Ser Asp Leu Phe Lys Asp Met Lys Leu
1655 1660 1665
Val Glu Ile Lys Lys Ser Asp Ser Ser Tyr Gln Glu Ile Tyr Glu
1670 1675 1680
Leu Glu Glu Ala Asn Ile Lys Ser Ala Gln Pro Lys Ile Ile Val
1685 1690 1695
Glu Lys Gly Asp Lys Trp Thr Ala Ile Lys Arg Pro Ser Met Ile
1700 1705 1710
Phe Arg Tyr Asp Ala Glu Asn Asn Glu Pro Gln
1715 1720
<210> 84
<211> 1724
<212> PRT
<213> Clostridium difficile
<400> 84
Met Lys Gln Asn Lys Leu Leu Gln Arg Gly Ala Tyr Phe Asn Asp Lys
1 5 10 15
Asn Ile Leu Ile Asp Asp Phe Asp Lys Arg Tyr Asn Asp Tyr Asp Phe
20 25 30
Val Glu Phe Phe Thr Gly Ile Ser Asn Ser Thr Phe Gly Leu Lys Ser
35 40 45
Asp Gly Asn Leu Tyr Ala Cys Gly Asp Asn Thr Gly Phe Pro Leu Gly
50 55 60
Leu Gly Lys Asp Ser Ser Glu Arg Arg Met Phe Ser Lys Val Lys Ile
65 70 75 80
Asp Asn Val Lys Tyr Val Ser Cys Gly Ser Lys His Ser Val Ala Val
85 90 95
Thr Lys Asp Gly Phe Ala Tyr Gly Ala Gly Thr Ser Asn Val Gly Gln
100 105 110
Leu Gly Val Ile Glu Ser Thr Val Tyr Tyr Glu Phe Thr Lys Leu Pro
115 120 125
Ile Asp Asp Val Lys Thr Val Ala Cys Gly Tyr Asp Phe Thr Phe Val
130 135 140
Leu Lys Asn Asp Gly Thr Leu Tyr Ser Ala Gly Leu Asn Ser Ser Gly
145 150 155 160
Gln Leu Gly Leu Gly Asp Thr Asn Asn Arg Ala Thr Phe Thr Lys Val
165 170 175
Asn Ile Asp Ser Val Lys Asp Val Val Thr Tyr Asn Gln Ser Val Phe
180 185 190
Ile Ile Lys Met Asp Gly Thr Ala His Ala Cys Gly Leu Asn Ser Asn
195 200 205
Gly Gln Leu Gly Ile Asn Ser Thr Leu Asn Lys Ser Val Phe Asn Lys
210 215 220
Ile Glu Gly Met Asp Asn Val Lys Gln Ile Ala Cys Gly Ser Ser His
225 230 235 240
Thr Ile Leu Ile Lys Asn Asp Gly Thr Met Tyr Thr Thr Gly Tyr Asn
245 250 255
Gly Val Gly Gln Leu Gly Thr Gly Asn Asn Asn Asn Ser Ile Val Phe
260 265 270
Thr Leu Ser Ser Ile Asn Asn Val Lys Tyr Ala Ser Cys Gly Asn Asn
275 280 285
His Thr Met Ile Leu Lys Tyr Asp Asn Thr Leu Phe Ser Thr Gly Gln
290 295 300
Asn Asn Tyr Gly Gln Leu Ala Asn Ala Asn Lys Asp Val Ala Ser Arg
305 310 315 320
Asn Thr Phe Ala Lys Val Asn Val Glu Asn Ile Lys Asp Ile Lys Cys
325 330 335
Gly Ser Gln Phe Asn Phe Leu Ile Asn Gly Ser Lys Glu Ile Phe Val
340 345 350
Ser Gly Cys Asn Leu Ala Gly Gln Leu Gly Ser Phe Phe His Thr Thr
355 360 365
Phe Leu Tyr Glu Phe Ser Asn Val Gln Ser Ser Asn Leu Asp Asn Tyr
370 375 380
Ser Gly Leu Leu Val Asn Asp Asp Tyr Leu Tyr Val Thr Lys Asp Asn
385 390 395 400
Ser Glu Phe Leu Asn Val Lys Leu Ser Asp Asn Phe Gln Asp Tyr Lys
405 410 415
Lys Ile Glu Leu Thr Asp Ser Asn Met Phe Ile Val Met Asn Asp Gly
420 425 430
Thr Leu Tyr Ala Cys Gly Leu Asn Asn Tyr Gly Gln Leu Gly Leu Gly
435 440 445
Asp Thr Val Asn Arg Ser Val Met Thr Lys Val Asp Ile Asp Asn Val
450 455 460
Leu Asp Ile Lys Gly Asn Gly Asn Ser Thr Phe Val Leu Lys Asn Asn
465 470 475 480
Gly Thr Leu Tyr Ser Cys Gly Leu Asn Ser Asn Gly Gln Leu Gly Leu
485 490 495
Arg Asp Glu Val Asn Arg Asn Ile Phe Thr Lys Ile Glu Ile Glu Asn
500 505 510
Val Lys Asp Phe Cys Val Gly Ser Asn Tyr Val Ile Ala Leu Asn His
515 520 525
Ser Lys Glu Val Tyr Gly Trp Gly Asn Asn Pro Tyr Asn Asn Ile Glu
530 535 540
Lys Thr Ser Asn Tyr Pro Tyr Lys Gln Gly Ile Ser Asn Ile Glu Lys
545 550 555 560
Ile Ala Ala Tyr Asp Tyr Ser Val Tyr Met Ile Asn Ser Glu Gly Lys
565 570 575
Leu Tyr Val Ser Gly Tyr Asn Tyr Asn Tyr Gln Leu Gly Lys Gly Asn
580 585 590
Asn Ser Asn Gln Ser Lys Ala Leu Val Ser Gln Cys Arg Thr Asn Ser
595 600 605
Thr Ser Ser Thr Ser Asn Gly Leu Arg Thr Leu Pro Lys Ile Thr Asn
610 615 620
Val Phe Pro Phe Tyr Asp Gly Cys Ala Ile Ile Asp Glu Gly Gly Tyr
625 630 635 640
Val Tyr Leu Thr Gly Tyr His Gly Tyr Leu Arg Thr Leu Asn Ser Ser
645 650 655
Pro Ser Ile Ser Asp Tyr Ser Arg Tyr Gly Thr Phe Ile Glu Ala Thr
660 665 670
Asn Ser Asn His Asn Thr Tyr Phe Ile Gln Glu Thr Asp Phe Ser Gly
675 680 685
Ile Glu Lys Val Ile Gly Met Ser Asn Asn Ile Leu Phe Phe Lys Lys
690 695 700
Gly Ser Ser Tyr Ile Thr Gly Tyr Pro Lys Thr Phe Gly Ser Thr Ile
705 710 715 720
Thr Gly His Arg Ser Tyr Thr Ser Ile Asn Ser Glu Ser Ser Asn Leu
725 730 735
Gly Ser Asn Phe Ile Ile Tyr His Ser Asn Ser Lys Leu Tyr Gly Lys
740 745 750
Gly Ile Ala Asn Ser Gly Gln Phe Gly Asn Ser Thr Asn Ile Asp Gly
755 760 765
Thr Ser Asn Tyr Asp Thr Gly Leu Lys Asp Ile Lys Asp Ile Ile Val
770 775 780
Lys Gly Asn Thr Val Val Val Val Asp Lys Asn Asn Asn Ile Tyr Val
785 790 795 800
Thr Gly Met Asn Gln Asn Asn Lys Leu Gly Ile Gly Glu Tyr Asn Asn
805 810 815
Glu Pro Val Lys Lys Phe Thr Asn Ile Thr Glu Gln Ser Asn Ser Phe
820 825 830
Ile Phe Met Asp Asp Ile Lys Glu Ile Thr Thr Ser Arg Asn Thr Met
835 840 845
Phe Ile Val Lys Asn Asp Gly Thr Ala Tyr Ala Thr Gly Asn Asn Ser
850 855 860
Ser Gly Gln Leu Gly Leu Gly Asp Thr Ile Asn Arg Asn Lys Phe Thr
865 870 875 880
Gln Ile Asn Leu Asp Asn Ile Lys Lys Ile Ser Thr Ser Ile Asp Gly
885 890 895
Asn Thr Thr Phe Ala Ile Arg Asn Asp Gly Thr Leu Tyr Ser Thr Gly
900 905 910
Leu Asn Thr Lys Gly Gln Leu Gly Leu Gly Asp Ile Val Asn Arg Asn
915 920 925
Thr Phe Thr Lys Val Asn Ile Gln Asn Val Arg Asp Val Val Leu Gly
930 935 940
Thr Thr His Ser His Ala Ile Lys Asp Asp Asn Thr Leu Tyr Ser Cys
945 950 955 960
Gly Glu Asn Thr His Gly Gln Leu Gly Leu Gly Ser Glu Ser Asn His
965 970 975
Pro Asp Val Leu Thr Phe Thr Val Asn Asn Ile Thr Asn Val Arg Asp
980 985 990
Val Tyr Cys Ser Asp Thr Thr Thr Phe Ile Val Lys Asp Thr Asn Ile
995 1000 1005
Ala Tyr Cys Cys Gly Tyr Asn Asn Asn Ser Gln Leu Gly Met Gly
1010 1015 1020
Asn Thr Thr Asp Gln Tyr Ser Phe Ile Lys Cys Met Glu Asn Val
1025 1030 1035
Lys Glu Val Ile Pro Asn Glu Ile Asn Thr Tyr Ile Ile Thr Ile
1040 1045 1050
Tyr Asn Thr Ala Tyr Ser Thr Gly Leu Asn Thr Asp Tyr Cys Leu
1055 1060 1065
Gly Leu Asn Ser Asn Ser Asn Gln Ser Ser Phe Ser Glu Ile Pro
1070 1075 1080
Ile Ser Asn Val Val Lys Val Ala Pro Asn Arg Asn Asn Ala Val
1085 1090 1095
Leu Leu Leu Thr Ser Glu Gly Asp Val Tyr Thr Ala Gly Lys Cys
1100 1105 1110
Ser Asn Gly Ser Gly Thr Gly Ser Glu Thr Pro Glu Lys Ile Lys
1115 1120 1125
Lys Ile Ala Ser Lys Ala Lys Asp Ile Gly Met Asn Tyr Arg Cys
1130 1135 1140
Gly His Tyr Val Ser Asp Asn Gly Asp Leu Tyr Gly Thr Gly Phe
1145 1150 1155
Asn Asn Asn Gly Gln Leu Gly Val Gly Asp Val Thr Lys Arg Asp
1160 1165 1170
Thr Phe Ile Lys Thr Asn Thr Arg Val Lys Lys Ile Leu Pro Leu
1175 1180 1185
Glu Tyr Ala Asn Ile Ala Ile Lys Asp Thr Asn Asp Ile Tyr Ile
1190 1195 1200
Cys Gly Leu Asn Asn Tyr Gly Gln Leu Gly Val Gly Asn Arg Tyr
1205 1210 1215
Asp Ser Arg Asn Asn Asp Asn Arg Ile Phe Asn Tyr Lys His Met
1220 1225 1230
Asn Phe Val Met Gly Asp Leu Thr Ser Ile Lys Asn Arg His Asn
1235 1240 1245
Phe Ile Leu Leu Asn Asn Lys Ile Val Ile Pro Thr Thr Lys Asp
1250 1255 1260
Ile Asp Tyr Gly Leu Val Leu Gly Asn Leu Tyr Lys Gly Asp Leu
1265 1270 1275
Tyr Thr Glu Leu Pro Tyr Glu Asp Ile Lys Glu Val Ser Ile Ser
1280 1285 1290
Lys Thr His Ile Ile Ile Leu Leu Asn Asp Gly Thr Met Tyr Gly
1295 1300 1305
Cys Gly Thr Asn Tyr His Gly Glu Leu Leu Gln Asp Leu Ser Ile
1310 1315 1320
Asn Gln Val Asp Glu Phe Val Gln Ile Asn Val Ser Asp Val Lys
1325 1330 1335
His Val Ser Cys Gly Asp Asn Phe Thr Tyr Phe Ile Lys Ser Asp
1340 1345 1350
Asp Ser Leu Trp Ser Ile Gly Lys Asn Ser Glu Tyr Gln Leu Gly
1355 1360 1365
Ile Gly His Asn Asn Pro Val Thr Glu Leu Gln Arg Ile Thr Thr
1370 1375 1380
Ile Ser Ser Cys Lys Glu Val His Cys Gly Lys Asn Tyr Thr Leu
1385 1390 1395
Val Val Thr Thr Gly Asn Glu Leu Phe Val Gln Gly Tyr Asn Asp
1400 1405 1410
Lys Gly Ala Leu Gly Leu Gly Ser Asp Ser Glu Asn Thr Ile Ile
1415 1420 1425
Lys Phe Phe Thr Lys Ala Leu Thr Asp Ile Arg Glu Ile Lys Ser
1430 1435 1440
Tyr Gly Ser Asp His Ile Leu Val Leu Lys Asn Asp Asn Ser Val
1445 1450 1455
Trp Val Thr Gly Lys Asn Arg Asp Val Tyr Lys Ile Glu Gln Pro
1460 1465 1470
Val Glu Phe Leu Lys Glu Phe Thr Ile Val Pro Ile Ser Glu Asp
1475 1480 1485
Val Asn Thr Val Lys Asp Val Leu Ala Thr Asp Asn Thr Leu Tyr
1490 1495 1500
Ile Ile Ser Glu Val Gly Thr Thr Asn Ala Ala Ile Glu Ile Thr
1505 1510 1515
Glu Lys Ser Ile Ser Ser Ile Lys Ile Lys Ile Gln Asp Pro Asn
1520 1525 1530
Lys Asp Ile Ser Arg Ile Glu Met Leu Ile Asn Gly Glu Ser Val
1535 1540 1545
Lys Ser Val Ser Asp Leu Thr Thr Glu Lys Ile Ser Phe Glu Val
1550 1555 1560
Pro Pro Asp Lys Ile Lys Ile Gly Glu Asn Lys Ile Leu Phe Arg
1565 1570 1575
Ala Tyr Cys Lys Gly Asp Asp Leu Tyr Ala Ser Leu Phe Ile Phe
1580 1585 1590
Lys Glu Ser Thr Gly Asn Ser Ile Ile Lys Asp Ser Tyr Val Met
1595 1600 1605
Ile Gly Asn Arg Met Tyr Lys Val Val Asn Thr Thr Ser Asn Glu
1610 1615 1620
Gln Asp Ile Thr Ile Thr Leu Asp Arg Gly Leu Glu Glu Asp Leu
1625 1630 1635
Asn Leu Gly Asp Pro Ile Tyr Gln Leu Ile Asn Lys Thr Lys Val
1640 1645 1650
Gln Val Lys Ile Asn Lys Ser Asp Leu Phe Lys Asp Met Lys Leu
1655 1660 1665
Val Glu Ile Lys Lys Ser Asp Ser Ser Tyr Gln Glu Ile Tyr Glu
1670 1675 1680
Leu Glu Glu Ala Asn Ile Lys Ser Ala Gln Pro Lys Ile Ile Val
1685 1690 1695
Glu Lys Gly Asp Lys Trp Thr Ala Ile Lys Arg Pro Ser Met Ile
1700 1705 1710
Phe Arg Tyr Asp Ala Glu Asn Asn Glu Pro Gln
1715 1720
<210> 85
<211> 1772
<212> PRT
<213> Clostridium difficile
<400> 85
Met Lys Arg Thr Lys Leu Leu Gln Arg Gly Asn Phe Phe Gly Asp Lys
1 5 10 15
Asn Met Val Val Asp Glu Phe Asp Glu Gly Tyr Asp Asn Tyr Asp Phe
20 25 30
Ile Asn Phe Phe Thr Gly Cys Cys Asn Tyr Thr Phe Gly Leu Lys Asn
35 40 45
Asn Asn Ile Leu Tyr Gly Cys Gly Asp Asn Ser Asn Phe Gln Leu Gly
50 55 60
Leu Gly Glu Asp Asn Thr Thr Arg Lys Leu Phe Thr Lys Ile Pro Asn
65 70 75 80
Ile Ser Thr Asn Ile Lys Lys Val Ala Cys Gly Glu Ser His Ala Val
85 90 95
Ile Leu Thr Ser Asp Gly Glu Leu Leu Val Ala Gly Ile Asn Thr Asp
100 105 110
Gly Gln Met Gly Leu Gly Leu Glu Lys Val Gly Lys Thr Val Ser Thr
115 120 125
Phe Glu Lys Val Pro Glu Ile Lys Gly Val Lys Asp Ile Ala Cys Gly
130 135 140
Leu Gln Ser Thr Tyr Leu Leu Tyr Asn Asp Gly Thr Leu Tyr Val Ala
145 150 155 160
Gly Asn Asn Leu Tyr Gly Gln Leu Gly Leu Gly Thr Asn Gly Ala Ser
165 170 175
Ala Asn Val Asn Thr Phe Thr Lys Val Asp Val Asp Asn Val Lys Ala
180 185 190
Val Phe Ser Tyr Asn Lys Ser Ala Phe Ile Ile Lys Asn Asp Asn Lys
195 200 205
Cys Tyr Ser Thr Gly Phe Asn Asn Gln Gly Gln Leu Gly Leu Gly Asp
210 215 220
Lys Asn Asn Arg Asp Leu Phe Ser Leu Val Ser Ile Asn Asp Val Lys
225 230 235 240
Thr Ile Ala Cys Gly Ser Glu His Thr Val Leu Met Thr Tyr Asn Asn
245 250 255
Asp Ile Tyr Gly Cys Gly Lys Glu Lys Cys Phe Gly Asn Ala Leu Gln
260 265 270
Ser Ser Leu Phe Thr Lys Ile Glu Glu Val Asn Ile Lys Thr Ile Ala
275 280 285
Cys Gly His Gly Asn Thr Met Leu Ile Asp Asn Lys Gly Thr Leu Lys
290 295 300
Val Ala Gly Asn Asn Asp Ile Tyr Gln Leu Gly Ile Ala Asn Tyr Ser
305 310 315 320
Glu Asn Ile Asp Asn Ser Phe Ile Asp Leu Lys Asn Ile Val Ala Lys
325 330 335
Asn Ile Phe Ile Gly Leu Ser His Ser Ile Leu Ile Asp Ser Asn Asn
340 345 350
Asp Ser Tyr Cys Thr Gly Asp Asn Thr Tyr Gly Gln Leu Gly Ser Phe
355 360 365
Phe Asp Asp Met His Ile Val Glu Phe Lys Lys Met Asp Ser Glu Lys
370 375 380
Tyr Ser Tyr Ser Asn Tyr Ile Asn Leu Ile Lys Ser Glu Asp Lys Leu
385 390 395 400
Thr Leu Leu Lys Glu Glu Met Glu Ile Lys Asp Ile Glu Leu Pro Leu
405 410 415
Asp Ile His Ser Val Arg Asp Val Val Phe Ser Pro Tyr Cys Thr Leu
420 425 430
Val Ile Leu Gly Asn Gly Asp Val Tyr Gly Leu Gly Asn Asn Arg Tyr
435 440 445
Lys Gly Met Gly Ser Asp Leu Pro Ser Gln Leu Asn Glu Leu Thr Lys
450 455 460
Leu Ser Ile Ser Asn Val Lys Ser Ile Val Ala Ser Lys Asn Ile Ser
465 470 475 480
Gly Gly Ile Phe Tyr Ile Lys Asn Asp Asp Thr Cys Tyr Tyr Ser Gly
485 490 495
Pro Asn Ser Asn Ser Ile Ala Gly Val Leu Pro Ser Asn Ser Asp Val
500 505 510
Phe Lys Lys Ile Ser Ile Asp Asn Val Lys Lys Val Val Ile Asn Thr
515 520 525
Asp Leu Ser Asn Trp Phe Ser Leu Ile Val Thr Asn Asn Lys Gln Ile
530 535 540
Tyr Thr Ser Gly Lys Ser Ser Ser Tyr Val Asn Gly Leu Ser Asn Ala
545 550 555 560
Leu Ile Ser Gln Tyr Thr Glu Ile Ser Leu Ser Asn Val Thr Asp Ala
565 570 575
Tyr Ser Ser Tyr Asn Ala Thr Phe Ile Val Val Asp Glu Lys Lys Val
580 585 590
Tyr Ala Thr Gly Ile Asn Thr Asn Tyr Leu Leu Gly Phe Ser Thr Ser
595 600 605
Asp Gly Ser Asn Val Asn Leu Gly Leu Leu Ser Asp Trp Tyr Tyr Ile
610 615 620
Asn Ile Ser Gly Ser Ser Tyr Ser Arg Val Ser Cys Thr Asn Asn Ile
625 630 635 640
Thr Lys Ile Asn Asn Ile Ile Ile Tyr Glu Tyr Val Thr Val Phe Cys
645 650 655
Thr Asn Ile Gly Ser Phe Leu Thr Gly Tyr His Gly Thr Ser Trp Thr
660 665 670
Lys Pro Thr Asp Ser Ser Tyr Arg Val Gln Tyr Gln Gly Ile Ser Tyr
675 680 685
Ala Gly Tyr Leu Asp Ser Tyr Ile Tyr Asn Tyr Tyr Pro Thr Arg Cys
690 695 700
Thr Gln Ser Ser Ser Ser Thr Thr Phe Ala Tyr Leu Tyr Asn Gly Glu
705 710 715 720
Ser Ser Ser Asn Leu Lys Asn Val Asn Pro Asp Asn Leu Leu Ile Ser
725 730 735
Gly Gly Ser Ser Tyr Ile His Gln Tyr Gly Arg Asn Tyr Leu Asn Asn
740 745 750
Gln Ser Ser Asn Asn Ile Ala Ala Ser Asn Ile Asn Ser Gly Pro Ile
755 760 765
Thr Ser Asp Lys Ala Ile Phe Leu Tyr Lys Ala Leu Leu Tyr Leu Ser
770 775 780
Ser Asn Thr Leu Tyr Gly Phe Gly Asn Ile Ser Glu Ser Ala Lys Glu
785 790 795 800
Leu Asp Val Ser Asp Thr Gln Asp Gly Tyr Asn Ala Thr Asn Tyr Lys
805 810 815
Lys Val Met Lys Asn Ile Lys Asn Ile Phe Ile Pro Pro Tyr Asp Leu
820 825 830
Ser Arg Asp Lys Thr Arg Phe Ala Ile Leu Thr Asp Lys Ser Leu Phe
835 840 845
Ile Cys Gly Tyr Asn Ser Lys Gly Thr His Gly Ile Ser Val Asn Ser
850 855 860
Ser Leu Asn Leu Asn Asn Lys Ile Asn Tyr Asn Lys Lys Asn Ser Ser
865 870 875 880
Ser Glu Ile Ser Ser Asn Ile Gln Glu Ile Tyr Ser His Ser Lys Ser
885 890 895
Thr Tyr Leu Leu Thr Asn Asn Asn Met Leu Tyr Ser Val Gly Leu Asn
900 905 910
Asp Val Gly Gln Leu Gly Val Gly Asp Glu Ile Asn Arg Lys Val Phe
915 920 925
Thr Lys Ile Asn Ile Asp Asn Ile Lys Ser Ile Asn Val Asn Arg Phe
930 935 940
Thr Asp Asn Ser Lys His Ala Phe Ala Ile Lys Asn Asp Asn Thr Cys
945 950 955 960
Tyr Ala Val Gly Leu Asn Asn Ser Gly Gln Leu Gly Ile Gly Asp Asn
965 970 975
Val Asn Arg Asn Ile Phe Thr Lys Ile Asn Val Glu Asn Val Lys Tyr
980 985 990
Val Ala Val Tyr Gly Asn Thr Ser Leu Leu Leu Thr Asn Asp Gly Leu
995 1000 1005
Leu Tyr Gly Ala Gly Asn Asn Gly Lys Gly Gln Leu Gly Leu Gly
1010 1015 1020
Asp Thr Thr Ser Arg Asn Ile Phe Thr Arg Ile Pro Ile Asn Gly
1025 1030 1035
Val Arg Asp Val Tyr Leu Cys Asn Asp Val Ser Ile Ile Val Lys
1040 1045 1050
Asn Asp Asn Thr Cys Tyr Val Cys Gly Leu Val Asn Gly Tyr Phe
1055 1060 1065
Gly Phe Thr Glu Gly Ser Ile Ser Thr Phe Thr Lys Ile Asn Ile
1070 1075 1080
Glu Asn Val Lys Ser Val Val Thr Ala Gly Ser Glu Ala Thr Phe
1085 1090 1095
Phe Ile Thr Asn Asp Asn Met Ile Tyr Thr Thr Gly Lys Lys Glu
1100 1105 1110
Arg Val Phe Phe Ser Thr Glu Thr Asn Asp Ile Lys Gly Ile Arg
1115 1120 1125
Val Ile Asn Asn Ile Ile Asn Ala Lys Lys Ile Val Val Asn Gly
1130 1135 1140
Tyr Thr Ser Ala Ile Leu Thr Asn Asp Asn Lys Leu Phe Val Gly
1145 1150 1155
Gly Leu Ser Gly Tyr Gly Ser Ile Ala Asn Asn Asn Asn Thr Asn
1160 1165 1170
Ser Val Glu Asp Val Lys Asp Val Phe Val Thr Ala Asn Asn Thr
1175 1180 1185
Leu Tyr Ile Asp Asn Asn Asn Asn Leu Ile Ser Ser Gly Arg Asp
1190 1195 1200
Thr Tyr Gly Ile Ser Asp Glu Ser Tyr Arg Asp Met Ser Val Pro
1205 1210 1215
Tyr Tyr Lys Val Ser Ile Lys Lys Asp Val Asp Thr Val Phe Ser
1220 1225 1230
Ser Tyr Asn Thr Ile Phe Ile Lys Asp Ile Tyr Gly Lys Phe Tyr
1235 1240 1245
Ser Ser Thr Arg Asp Asn Arg Tyr Asn His Leu Gly Ile His His
1250 1255 1260
Arg Tyr Asp Asn Asp Lys Asn Glu Ala Leu Glu Gly Ser Leu His
1265 1270 1275
Ser Tyr Phe Lys Thr Asp Asn Thr Ser Asp Lys Ile Val Phe Asn
1280 1285 1290
Lys Lys Asn Glu Lys Leu Val Met Phe Asn Asp Lys Tyr Ile Lys
1295 1300 1305
Thr Asn Asn Lys Tyr Ile Asn Tyr Lys Asn Ile Phe Lys Asp Asn
1310 1315 1320
Phe Lys Tyr Thr Ser Ile Ile Leu Pro Phe Glu Val Ser Asp Ile
1325 1330 1335
Asp Ile Ser Lys Thr His Ser Leu Ala Val Ala Lys Asp Gly Lys
1340 1345 1350
Leu Tyr Gly Ile Gly Ser Asn Ser Tyr Lys Glu Ile Asn Gln Thr
1355 1360 1365
Leu Glu Asp Ile Glu Leu Leu Thr Leu Thr Glu Val Asn Ile Ser
1370 1375 1380
Asp Val Lys Lys Val Ala Cys Gly Asp Asn Tyr Ser Tyr Ile Ile
1385 1390 1395
Lys Thr Asp Asn Thr Leu Trp Ser Tyr Gly Lys Asn Thr Glu Tyr
1400 1405 1410
Gln Leu Gly Val Gly His Asn Asn Asp Val Arg Glu Leu Gln Lys
1415 1420 1425
Val Thr Gly Leu Pro Ser Val Lys Asp Ile Ser Ile Tyr Asn Ser
1430 1435 1440
Met Thr Leu Val Leu Thr Asn Glu Gly Glu Leu Tyr Ala Gln Gly
1445 1450 1455
Tyr Asn Thr Asn Gly Leu Phe Gly Leu Gly Glu Ser Glu Lys Asp
1460 1465 1470
Lys Ile Ile Arg Thr Phe Thr Lys Val Leu Thr Asn Val Lys Glu
1475 1480 1485
Ile Lys Ser His Asn Asp Asp His Ile Leu Val Ile Lys Asn Asp
1490 1495 1500
Asn Ser Leu Trp Ile Thr Gly Lys Asn Lys Ser Met Tyr Lys Ile
1505 1510 1515
Ser Ile Ser Ile Thr Asp Leu Tyr Glu Phe Thr Lys Ile Pro Ile
1520 1525 1530
Pro Glu His Leu Asn Asp Ile Leu Asp Ile Glu Leu Ser Asp Asp
1535 1540 1545
Thr Ile Tyr Met Ile Thr Lys Val Asp Thr Ser Lys Ala Ser Ile
1550 1555 1560
Glu Ile Val Glu Lys Ser Ile Ser Gln Val Arg Val Val Val Gln
1565 1570 1575
Asp Pro Asn Asn Val Ile Glu Lys Leu Glu Met Phe Ile Asn Asp
1580 1585 1590
Glu Leu Ile Ser Thr Lys Thr Asn Leu Glu Ile Asn Ser Ile Ile
1595 1600 1605
Phe Glu Ile Pro Gln Asn Lys Ile Val Leu Gly Glu Asn Lys Ile
1610 1615 1620
Leu Ile Lys Ala Ser Ser Pro Thr Gly Asp Leu Tyr Ser Ser Met
1625 1630 1635
Phe Ile Phe Lys Ser Glu Thr Gly Leu Lys Val Lys Lys Asp Ser
1640 1645 1650
Ile Leu Met Ile Asn Asn Lys Val Tyr Ser Ile Ile Asn Ile Thr
1655 1660 1665
Glu Asn Asn Thr Asp Leu Ile Val Thr Leu Asn Glu Gly Leu Lys
1670 1675 1680
Asp Asp Met Met Glu Asn Asn Pro Ile Tyr Gln Leu Ile Asn Lys
1685 1690 1695
Thr Lys Val Gln Val Lys Ile Asn Lys Ser Asp Leu Phe Lys Asp
1700 1705 1710
Met Lys Leu Val Glu Ile Lys Lys Ser Asp Ser Ser Tyr Gln Glu
1715 1720 1725
Ile Tyr Glu Leu Glu Glu Ala Asn Ile Lys Ser Ala Gln Pro Lys
1730 1735 1740
Ile Ile Val Glu Lys Gly Asp Lys Trp Thr Ala Ile Lys Arg Pro
1745 1750 1755
Ser Met Ile Phe Arg Tyr Asp Ala Glu Asn Asn Glu Pro Gln
1760 1765 1770
<210> 86
<211> 1772
<212> PRT
<213> Clostridium difficile
<400> 86
Met Lys Arg Thr Lys Leu Leu Gln Arg Gly Asn Phe Phe Gly Asp Lys
1 5 10 15
Asn Met Val Val Asp Glu Phe Asp Glu Gly Tyr Asp Asn Tyr Asp Phe
20 25 30
Ile Asn Phe Phe Thr Gly Cys Cys Asn Tyr Thr Phe Gly Leu Lys Asn
35 40 45
Asn Asn Ile Leu Tyr Gly Cys Gly Asp Asn Ser Asn Phe Gln Leu Gly
50 55 60
Leu Gly Glu Asp Asn Thr Thr Arg Lys Leu Phe Thr Lys Ile Pro Asn
65 70 75 80
Ile Ser Thr Asn Ile Lys Lys Val Ala Cys Gly Glu Ser His Ala Val
85 90 95
Ile Leu Thr Ser Asp Gly Glu Leu Leu Val Ala Gly Ile Asn Thr Asp
100 105 110
Gly Gln Met Gly Leu Gly Leu Glu Lys Val Gly Lys Thr Val Ser Thr
115 120 125
Phe Glu Lys Val Pro Glu Ile Lys Gly Val Lys Asp Ile Ala Cys Gly
130 135 140
Leu Gln Ser Thr Tyr Leu Leu Tyr Asn Asp Gly Thr Leu Tyr Val Ala
145 150 155 160
Gly Asn Asn Leu Tyr Gly Gln Leu Gly Leu Gly Thr Asn Gly Ala Ser
165 170 175
Ala Asn Val Asn Thr Phe Thr Lys Val Asp Val Asp Asn Val Lys Ala
180 185 190
Val Phe Ser Tyr Asn Lys Ser Ala Phe Ile Ile Lys Asn Asp Asn Lys
195 200 205
Cys Tyr Ser Thr Gly Phe Asn Asn Gln Gly Gln Leu Gly Leu Gly Asp
210 215 220
Lys Asn Asn Arg Asp Leu Phe Ser Leu Val Ser Ile Asn Asp Val Lys
225 230 235 240
Thr Ile Ala Cys Gly Ser Glu His Thr Val Leu Met Thr Tyr Asn Asn
245 250 255
Asp Ile Tyr Gly Cys Gly Lys Glu Lys Cys Phe Gly Asn Ala Leu Gln
260 265 270
Ser Ser Leu Phe Thr Lys Ile Glu Glu Val Asn Ile Lys Thr Ile Ala
275 280 285
Cys Gly His Gly Asn Thr Met Leu Ile Asp Asn Lys Gly Thr Leu Lys
290 295 300
Val Ala Gly Asn Asn Asp Ile Tyr Gln Leu Gly Ile Ala Asn Tyr Ser
305 310 315 320
Glu Asn Ile Asp Asn Ser Phe Ile Asp Leu Lys Asn Ile Val Ala Lys
325 330 335
Asn Ile Phe Ile Gly Leu Ser His Ser Ile Leu Ile Asp Ser Asn Asn
340 345 350
Asp Ser Tyr Cys Thr Gly Asp Asn Thr Tyr Gly Gln Leu Gly Ser Phe
355 360 365
Phe Asp Asp Met His Ile Val Glu Phe Lys Lys Met Asp Ser Glu Lys
370 375 380
Tyr Ser Tyr Ser Asn Tyr Ile Asn Leu Ile Lys Ser Glu Asp Lys Leu
385 390 395 400
Thr Leu Leu Lys Glu Glu Met Glu Ile Lys Asp Ile Glu Leu Pro Leu
405 410 415
Asp Ile His Ser Val Arg Asp Val Val Phe Ser Pro Tyr Cys Thr Leu
420 425 430
Val Ile Leu Gly Asn Gly Asp Val Tyr Gly Leu Gly Asn Asn Arg Tyr
435 440 445
Lys Gly Met Gly Ser Asp Leu Pro Ser Gln Leu Asn Glu Leu Thr Lys
450 455 460
Leu Ser Ile Ser Asn Val Lys Ser Ile Val Ala Ser Lys Asn Ile Ser
465 470 475 480
Gly Gly Ile Phe Tyr Ile Lys Asn Asp Asp Thr Cys Tyr Tyr Ser Gly
485 490 495
Pro Asn Ser Asn Ser Ile Ala Gly Val Leu Pro Ser Asn Ser Asp Val
500 505 510
Phe Lys Lys Ile Ser Ile Asp Asn Val Lys Lys Val Val Ile Asn Thr
515 520 525
Asp Leu Ser Asn Trp Phe Ser Leu Ile Val Thr Asn Asn Lys Gln Ile
530 535 540
Tyr Thr Ser Gly Lys Ser Ser Ser Tyr Val Asn Gly Leu Ser Asn Ala
545 550 555 560
Leu Ile Ser Gln Tyr Thr Glu Ile Ser Leu Ser Asn Val Thr Asp Ala
565 570 575
Tyr Ser Ser Tyr Asn Ala Thr Phe Ile Val Val Asp Glu Lys Lys Val
580 585 590
Tyr Ala Thr Gly Ile Asn Thr Asn Tyr Leu Leu Gly Phe Ser Thr Ser
595 600 605
Asp Gly Ser Asn Val Asn Leu Gly Leu Leu Ser Asp Trp Tyr Tyr Ile
610 615 620
Asn Ile Ser Gly Ser Ser Tyr Ser Arg Val Ser Cys Thr Asn Asn Ile
625 630 635 640
Thr Lys Ile Asn Asn Ile Ile Ile Tyr Glu Tyr Val Thr Val Phe Cys
645 650 655
Thr Asn Ile Gly Ser Phe Leu Thr Gly Tyr His Gly Thr Ser Trp Thr
660 665 670
Lys Pro Thr Asp Ser Ser Tyr Arg Val Gln Tyr Gln Gly Ile Ser Tyr
675 680 685
Ala Gly Tyr Leu Asp Ser Tyr Ile Tyr Asn Tyr Tyr Pro Thr Arg Cys
690 695 700
Thr Gln Ser Ser Ser Ser Thr Thr Phe Ala Tyr Leu Tyr Asn Gly Glu
705 710 715 720
Ser Ser Ser Asn Leu Lys Asn Val Asn Pro Asp Asn Leu Leu Ile Ser
725 730 735
Gly Gly Ser Ser Tyr Ile His Gln Tyr Gly Arg Asn Tyr Leu Asn Asn
740 745 750
Gln Ser Ser Asn Asn Ile Ala Ala Ser Asn Ile Asn Ser Gly Pro Ile
755 760 765
Thr Ser Asp Lys Ala Ile Phe Leu Tyr Lys Ala Leu Leu Tyr Leu Ser
770 775 780
Ser Asn Thr Leu Tyr Gly Phe Gly Asn Ile Ser Glu Ser Ala Lys Glu
785 790 795 800
Leu Asp Val Ser Asp Thr Gln Asp Gly Tyr Asn Ala Thr Asn Tyr Lys
805 810 815
Lys Val Met Lys Asn Ile Lys Asn Ile Phe Ile Pro Pro Tyr Asp Leu
820 825 830
Ser Arg Asp Lys Thr Arg Phe Ala Ile Leu Thr Asp Lys Ser Leu Phe
835 840 845
Ile Cys Gly Tyr Asn Ser Lys Gly Thr His Gly Ile Ser Val Asn Ser
850 855 860
Ser Leu Asn Leu Asn Asn Lys Ile Asn Tyr His Lys Lys Asn Ser Ser
865 870 875 880
Ser Glu Ile Ser Ser Asn Ile Gln Glu Ile Tyr Ser His Ser Lys Ser
885 890 895
Thr Tyr Leu Leu Thr Asn Asn Asn Met Leu Tyr Ser Val Gly Leu Asn
900 905 910
Asp Val Gly Gln Leu Gly Val Gly Asp Glu Ile Asn Arg Lys Val Phe
915 920 925
Thr Lys Ile Asn Ile Asp Asn Ile Lys Ser Ile Asn Val Asn Arg Phe
930 935 940
Thr Asp Asn Ser Lys His Ala Phe Ala Ile Lys Asn Asp Asn Thr Cys
945 950 955 960
Tyr Ala Val Gly Leu Asn Asn Ser Gly Gln Leu Gly Ile Gly Asp Asn
965 970 975
Val Asn Arg Asn Ile Phe Thr Lys Ile Asn Val Glu Asn Val Lys Tyr
980 985 990
Val Ala Val Tyr Gly Asn Thr Ser Leu Leu Leu Thr Asn Asp Gly Leu
995 1000 1005
Leu Tyr Gly Ala Gly Asn Asn Gly Lys Gly Gln Leu Gly Leu Gly
1010 1015 1020
Asp Thr Thr Ser Arg Asn Ile Phe Thr Arg Ile Pro Ile Asn Gly
1025 1030 1035
Val Arg Asp Val Tyr Leu Cys Asn Asp Val Ser Ile Ile Val Lys
1040 1045 1050
Asn Asp Asn Thr Cys Tyr Val Cys Gly Leu Val Asn Gly Tyr Phe
1055 1060 1065
Gly Phe Thr Glu Gly Ser Ile Ser Thr Phe Thr Lys Ile Asn Ile
1070 1075 1080
Glu Asn Val Lys Ser Val Val Thr Ala Gly Ser Glu Ala Thr Phe
1085 1090 1095
Phe Ile Thr Asn Asp Asn Met Ile Tyr Thr Thr Gly Lys Lys Glu
1100 1105 1110
Arg Val Phe Phe Ser Thr Glu Thr Asn Asp Ile Lys Gly Ile Arg
1115 1120 1125
Val Ile Asn Asn Ile Ile Asn Ala Lys Lys Ile Val Val Asn Gly
1130 1135 1140
Tyr Thr Ser Ala Ile Leu Thr Asn Asp Asn Lys Leu Phe Val Gly
1145 1150 1155
Gly Leu Ser Gly Tyr Gly Ser Ile Ala Asn Asn Asn Asn Thr Asn
1160 1165 1170
Ser Val Glu Asp Val Lys Asp Val Phe Val Thr Ala Asn Asn Thr
1175 1180 1185
Leu Tyr Ile Asp Asn Asn Asn Asn Leu Ile Ser Ser Gly Arg Asp
1190 1195 1200
Thr Tyr Gly Ile Ser Asp Glu Ser Tyr Arg Asp Met Ser Val Pro
1205 1210 1215
Tyr Tyr Lys Val Ser Ile Lys Lys Asp Val Asp Thr Val Phe Ser
1220 1225 1230
Ser Tyr Asn Thr Ile Phe Ile Lys Asp Ile Tyr Gly Lys Phe Tyr
1235 1240 1245
Ser Ser Thr Arg Asp Asn Arg Tyr Asn His Leu Gly Ile His His
1250 1255 1260
Arg Tyr Asp Asn Asp Lys Asn Glu Ala Leu Glu Gly Ser Leu His
1265 1270 1275
Ser Tyr Phe Lys Thr Asp Asn Thr Ser Asp Lys Ile Val Phe Asn
1280 1285 1290
Lys Lys Asn Glu Lys Leu Val Met Phe Asn Asp Lys Tyr Ile Lys
1295 1300 1305
Thr Asn Asn Lys Tyr Ile Asn Tyr Lys Asn Ile Phe Lys Asp Asn
1310 1315 1320
Phe Lys Tyr Thr Ser Ile Ile Leu Pro Phe Glu Val Ser Asp Ile
1325 1330 1335
Asp Ile Ser Lys Thr His Ser Leu Ala Val Ala Lys Asp Gly Lys
1340 1345 1350
Leu Tyr Gly Ile Gly Ser Asn Ser Tyr Lys Glu Ile Asn Gln Thr
1355 1360 1365
Leu Glu Asp Ile Glu Leu Leu Thr Leu Thr Glu Val Asn Ile Ser
1370 1375 1380
Asp Val Lys Lys Val Ala Cys Gly Asp Asn Tyr Ser Tyr Ile Ile
1385 1390 1395
Lys Thr Asp Asn Thr Leu Trp Ser Tyr Gly Lys Asn Thr Glu Tyr
1400 1405 1410
Gln Leu Gly Val Gly His Asn Asn Asp Val Arg Glu Leu Gln Lys
1415 1420 1425
Val Thr Gly Leu Pro Ser Val Lys Asp Ile Ser Ile Tyr Asn Ser
1430 1435 1440
Met Thr Leu Val Leu Thr Asn Glu Gly Glu Leu Tyr Ala Gln Gly
1445 1450 1455
Tyr Asn Thr Asn Gly Leu Phe Gly Leu Gly Glu Ser Glu Lys Asp
1460 1465 1470
Lys Ile Ile Arg Thr Phe Thr Lys Val Leu Thr Asn Val Lys Glu
1475 1480 1485
Ile Lys Ser His Asn Asp Asp His Ile Leu Val Ile Lys Asn Asp
1490 1495 1500
Asn Ser Leu Trp Ile Thr Gly Lys Asn Lys Ser Met Tyr Lys Ile
1505 1510 1515
Ser Ile Ser Ile Thr Asp Leu Tyr Glu Phe Thr Lys Ile Pro Ile
1520 1525 1530
Pro Glu His Leu Asn Asp Ile Leu Asp Ile Glu Leu Ser Asp Asp
1535 1540 1545
Thr Ile Tyr Met Ile Thr Lys Val Asp Thr Ser Lys Ala Ser Ile
1550 1555 1560
Glu Ile Val Glu Lys Ser Ile Ser Gln Val Arg Val Val Val Gln
1565 1570 1575
Asp Pro Asn Asn Val Ile Glu Lys Leu Glu Met Phe Ile Asn Asp
1580 1585 1590
Glu Leu Ile Ser Thr Lys Thr Asn Leu Glu Ile Asn Ser Ile Ile
1595 1600 1605
Phe Glu Ile Pro Gln Asn Lys Ile Val Leu Gly Glu Asn Lys Ile
1610 1615 1620
Leu Ile Lys Ala Ser Ser Pro Thr Gly Asp Leu Tyr Ser Ser Met
1625 1630 1635
Phe Ile Phe Lys Ser Glu Thr Gly Leu Lys Val Lys Lys Asp Ser
1640 1645 1650
Ile Leu Met Ile Asn Asn Lys Val Tyr Ser Ile Ile Asn Ile Thr
1655 1660 1665
Glu Asn Asn Thr Asp Leu Ile Val Thr Leu Asn Glu Gly Leu Lys
1670 1675 1680
Asp Asp Met Met Glu Asn Asn Pro Ile Tyr Gln Leu Ile Asn Lys
1685 1690 1695
Thr Lys Val Gln Val Lys Ile Asn Lys Ser Asp Leu Phe Lys Asp
1700 1705 1710
Met Lys Leu Val Glu Ile Lys Lys Ser Asp Ser Ser Tyr Gln Glu
1715 1720 1725
Ile Tyr Glu Leu Glu Glu Ala Asn Ile Lys Ser Ala Gln Pro Lys
1730 1735 1740
Ile Ile Val Glu Lys Gly Asp Lys Trp Thr Ala Ile Lys Arg Pro
1745 1750 1755
Ser Met Ile Phe Arg Tyr Asp Ala Glu Asn Asn Glu Pro Gln
1760 1765 1770
<210> 87
<211> 1743
<212> PRT
<213> Clostridium difficile
<400> 87
Met Lys Gln Asn Lys Leu Leu Gln Arg Gly Ala Tyr Phe Asn Asp Lys
1 5 10 15
Asn Ile Leu Ile Asp Asp Phe Asp Lys Arg Tyr Asn Asp Tyr Asp Phe
20 25 30
Val Glu Phe Phe Thr Gly Ile Ser Asn Ser Thr Phe Gly Leu Lys Ser
35 40 45
Asp Gly Asn Leu Tyr Ala Cys Gly Asp Asn Thr Gly Phe Gln Leu Gly
50 55 60
Leu Gly Lys Asp Ser Ser Glu Arg Arg Met Phe Ser Lys Val Lys Ile
65 70 75 80
Asp Asn Val Lys Tyr Val Ser Cys Gly Ser Lys His Ser Val Ala Val
85 90 95
Thr Lys Asp Gly Phe Ala Tyr Gly Ala Gly Thr Ser Asn Val Gly Gln
100 105 110
Leu Gly Val Ile Glu Ser Thr Val Tyr Tyr Glu Phe Thr Lys Leu Pro
115 120 125
Ile Asp Asp Val Lys Thr Val Ala Cys Gly Tyr Asp Phe Thr Phe Val
130 135 140
Leu Lys Asn Asp Gly Thr Leu Tyr Ser Ala Gly Leu Asn Ser Ser Gly
145 150 155 160
Gln Leu Gly Leu Gly Asp Thr Asn Asn Arg Ala Thr Phe Thr Lys Val
165 170 175
Asn Ile Asp Ser Val Lys Asp Val Val Thr Tyr Asn Gln Ser Val Phe
180 185 190
Ile Ile Lys Met Asp Gly Thr Ala His Ala Cys Gly Leu Asn Ser Asn
195 200 205
Gly Gln Leu Gly Ile Asn Ser Thr Leu Asn Lys Ser Val Phe Asn Lys
210 215 220
Ile Glu Gly Met Asp Asn Val Lys Gln Ile Ala Cys Gly Ser Ser His
225 230 235 240
Thr Ile Leu Ile Lys Asn Asp Gly Thr Met Tyr Thr Thr Gly Tyr Asn
245 250 255
Gly Val Gly Gln Leu Gly Thr Gly Asn Asn Asn Asn Ser Ile Val Phe
260 265 270
Thr Leu Ser Ser Ile Asn Asn Val Lys Tyr Ala Ser Cys Gly Asn Asn
275 280 285
His Thr Met Ile Leu Lys Tyr Asp Asn Thr Leu Phe Ser Thr Gly Gln
290 295 300
Asn Asn Tyr Gly Gln Leu Ala Asn Ala Asn Lys Asp Val Ala Ser Arg
305 310 315 320
Asn Thr Phe Ala Lys Val Asn Val Glu Asn Ile Lys Asp Ile Lys Cys
325 330 335
Gly Ser Gln Phe Asn Phe Leu Ile Asn Gly Ser Lys Glu Ile Phe Val
340 345 350
Ser Gly Cys Asn Leu Ala Gly Gln Leu Gly Ser Phe Phe His Thr Thr
355 360 365
Phe Leu Tyr Glu Phe Ser Lys Val Gln Ser Ser Asn Leu Asp Asn Tyr
370 375 380
Ser Gly Leu Leu Val Asn Asp Asp Tyr Leu Tyr Val Thr Lys Asp Asn
385 390 395 400
Ser Glu Phe Leu Asn Val Lys Leu Ser Asp Asn Phe Gln Asp Tyr Lys
405 410 415
Lys Ile Glu Leu Thr Asp Asn Asn Met Phe Ile Val Met Asn Asp Gly
420 425 430
Ser Leu Tyr Ala Cys Gly Leu Asn Asn Ala Gly Gln Leu Gly Leu Gly
435 440 445
Asp Thr Val Asn Arg Ser Val Met Thr Lys Val Asp Ile Asp Asn Val
450 455 460
Leu Asp Ile Lys Gly Asn Gly Ser Ser Thr Phe Val Leu Lys Asn Asn
465 470 475 480
Gly Thr Leu Tyr Ser Cys Gly Leu Asn Ser Ser Gly Ile Leu Gly Leu
485 490 495
Lys Asp Asn Thr Asn Arg Asn Ile Phe Thr Lys Ile Glu Ile Glu Asn
500 505 510
Ile Lys Glu Phe Cys Val Glu Ser Asn Tyr Ile Val Ala Leu Asn His
515 520 525
Ser Lys Glu Leu Tyr Gly Trp Gly Asn Gln Ser Tyr Ile Val Tyr Gly
530 535 540
Asp Asn Arg Asn Tyr Pro Tyr Lys Asp Thr Arg Val Ser Asn Val Glu
545 550 555 560
Lys Ile Ala Thr Trp Ser Asp Thr Leu Tyr Ile Leu Asp Ser Thr Gly
565 570 575
Ala Ala Lys Thr Ile Gly Tyr Ser Tyr Asn Gly Ser Gly Gly Tyr Pro
580 585 590
Ala Pro Ser Thr Ser Ser Ser Tyr Gln Ser Lys Gly Tyr Asn Ala Trp
595 600 605
Asn Thr Ser Tyr Arg Thr Leu Glu Phe Tyr Asn Thr Ala Gln Thr Lys
610 615 620
Leu Ile Asn Leu Phe Ala Phe Tyr Arg Gly Cys Met Phe Phe Asp Glu
625 630 635 640
Ser Asp Arg Ala Tyr Cys Ile Gly Glu Asn Asn Met Lys Phe Thr Ser
645 650 655
Ser Ser Gln Ile Thr Pro Glu Ser Glu Leu Arg Phe Ser Ser Asn Ser
660 665 670
Gly Ile Tyr His Thr Asn Ser Asp Gly Gly Val Tyr Thr Cys Tyr Gln
675 680 685
Trp Thr Tyr Lys Leu Ile Arg Cys Ser Val Phe Asp Ser Ser Lys Ser
690 695 700
Val Val Gly Asn Ser Lys Asn Ile Leu Ser Leu Leu Lys Asn Asn Ser
705 710 715 720
Thr Phe Arg Cys Thr Gly Ser Cys Leu Thr Tyr Gly Gln Thr Asn Gln
725 730 735
Asn Trp Ser Ser Tyr Leu Ser Asp Asn Cys Asn Gly Ala Val Ser Leu
740 745 750
Gly Asn Glu Phe Ile Leu Lys Asn Tyr Ser Gly Glu Ser Val Leu Lys
755 760 765
Gly Tyr Gly Lys Ser Asn Asn Gly Glu Phe Gly Ser Ser Thr Ser Ile
770 775 780
Ser Asn Ala Ser Asn Tyr Asp Thr Gly Leu Lys Asp Ile Lys Asp Ile
785 790 795 800
Ile Val Lys Asn Asn Thr Val Val Val Val Asp Lys Asn Asn Asn Ile
805 810 815
Tyr Val Thr Gly Thr Asn Gln Phe Asn Lys Leu Gly Ile Gly Glu Tyr
820 825 830
Asn Asn Gln Pro Ile Lys Lys Phe Thr Asn Ile Thr Glu Gln Ser Asn
835 840 845
Ser Phe Ile Phe Met Asp Asp Ile Lys Glu Ile Thr Thr Ser Arg Asn
850 855 860
Thr Met Phe Ile Val Lys Asn Asp Gly Thr Ala Tyr Ala Thr Gly Asn
865 870 875 880
Asn Ser Ser Gly Gln Leu Gly Leu Gly Asp Thr Ile Asn Arg Asn Lys
885 890 895
Phe Thr Gln Ile Asn Ile Asp Asn Ile Lys Lys Ile Ser Thr Ser Ile
900 905 910
Asp Gly Asn Thr Thr Phe Ala Ile Arg Asn Asp Gly Thr Leu Tyr Ser
915 920 925
Thr Gly Leu Asn Thr Lys Gly Gln Leu Gly Leu Gly Asp Ile Val Asn
930 935 940
Arg Asn Thr Phe Thr Lys Val Asn Ile Gln Asn Val Arg Asp Val Val
945 950 955 960
Leu Gly Thr Thr His Ser His Ala Ile Lys Asp Asp Asn Thr Leu Tyr
965 970 975
Ser Cys Gly Glu Asn Thr His Gly Gln Leu Gly Leu Gly Ser Glu Ser
980 985 990
Asn His Pro Asp Val Leu Thr Phe Thr Val Asn Asn Ile Thr Asn Val
995 1000 1005
Arg Asp Val Tyr Cys Ser Asp Thr Thr Thr Phe Ile Val Lys Asp
1010 1015 1020
Thr Asn Ile Ala Tyr Cys Cys Gly Tyr Asn Asn Asn Ser Gln Leu
1025 1030 1035
Gly Met Gly Asn Thr Thr Asp Gln Tyr Ser Phe Ile Lys Cys Met
1040 1045 1050
Glu Asn Val Lys Glu Val Ile Pro Asn Glu Ile Asn Thr Tyr Ile
1055 1060 1065
Ile Thr Ile Tyr Asn Thr Ala Tyr Ser Thr Gly Leu Asn Thr Asp
1070 1075 1080
Tyr Cys Leu Gly Leu Asn Ser Asn Ser Asn Gln Ser Ser Phe Ser
1085 1090 1095
Glu Ile Pro Ile Ser Asn Val Val Lys Val Ala Pro Asn Arg Asn
1100 1105 1110
Asn Ala Val Leu Leu Leu Thr Ser Glu Gly Asp Val Tyr Thr Ala
1115 1120 1125
Gly Lys Cys Ser Asn Gly Ser Gly Thr Gly Ser Glu Thr Pro Glu
1130 1135 1140
Lys Ile Lys Lys Ile Ala Ser Lys Ala Lys Asp Ile Gly Met Asn
1145 1150 1155
Tyr Arg Cys Gly His Tyr Val Ser Asp Asn Gly Asp Leu Tyr Gly
1160 1165 1170
Thr Gly Phe Asn Asn Asn Gly Gln Leu Gly Val Gly Asp Val Thr
1175 1180 1185
Lys Arg Asp Thr Phe Ile Lys Thr Asn Thr Arg Val Lys Lys Ile
1190 1195 1200
Leu Pro Leu Glu Tyr Ala Asn Ile Ala Ile Lys Asp Thr Asn Asp
1205 1210 1215
Ile Tyr Ile Cys Gly Leu Asn Asn Tyr Gly Gln Leu Gly Val Gly
1220 1225 1230
Asn Arg Tyr Asp Ser Arg Asn Asn Asp Asn Arg Ile Phe Asn Tyr
1235 1240 1245
Lys His Met Asn Phe Val Met Gly Asp Leu Thr Ser Ile Lys Asn
1250 1255 1260
Arg His Asn Phe Ile Leu Leu Asn Asn Lys Ile Val Ile Pro Thr
1265 1270 1275
Thr Lys Asp Ile Asp Tyr Gly Leu Val Leu Gly Asn Leu Tyr Lys
1280 1285 1290
Gly Asp Leu Tyr Thr Glu Leu Pro Tyr Glu Asp Ile Lys Glu Val
1295 1300 1305
Ser Ile Ser Lys Thr His Ile Ile Ile Leu Leu Asn Asp Gly Thr
1310 1315 1320
Met Tyr Gly Cys Gly Thr Asn Tyr His Gly Glu Leu Leu Gln Asp
1325 1330 1335
Leu Ser Ile Asn Gln Val Asp Glu Phe Val Gln Ile Asn Val Ser
1340 1345 1350
Asp Val Lys His Val Ser Cys Gly Asp Asn Phe Thr Tyr Phe Ile
1355 1360 1365
Lys Ser Asp Asp Ser Leu Trp Ser Ile Gly Lys Asn Ser Glu Tyr
1370 1375 1380
Gln Leu Gly Ile Gly His Asn Asn Pro Val Thr Glu Leu Gln Arg
1385 1390 1395
Ile Thr Thr Ile Ser Ser Cys Lys Glu Val His Cys Gly Lys Asn
1400 1405 1410
Tyr Thr Leu Val Val Thr Thr Gly Asn Glu Leu Phe Val Gln Gly
1415 1420 1425
Tyr Asn Asp Lys Gly Ala Leu Gly Leu Gly Ser Asp Ser Glu Asn
1430 1435 1440
Thr Ile Ile Lys Phe Phe Thr Lys Ala Leu Thr Asp Ile Arg Glu
1445 1450 1455
Ile Lys Ser Tyr Gly Ser Asp His Ile Leu Val Leu Lys Asn Asp
1460 1465 1470
Asn Ser Val Trp Val Thr Gly Lys Asn Arg Asp Val Tyr Lys Ile
1475 1480 1485
Glu Gln Pro Val Glu Phe Leu Lys Glu Phe Thr Ile Ile Pro Ile
1490 1495 1500
Ser Glu Asp Val Asn Thr Val Lys Asp Val Leu Ala Thr Asp Asn
1505 1510 1515
Thr Leu Tyr Ile Ile Ser Glu Val Gly Thr Thr Asn Ala Ala Ile
1520 1525 1530
Glu Ile Thr Glu Lys Ser Ile Ser Ser Ile Lys Ile Lys Ile Gln
1535 1540 1545
Asp Pro Asn Lys Asp Ile Ser Arg Ile Glu Met Leu Ile Asn Gly
1550 1555 1560
Glu Ser Val Lys Ser Val Ser Asp Leu Ile Thr Glu Lys Ile Ser
1565 1570 1575
Phe Glu Val Pro Pro Asp Lys Ile Lys Ile Gly Glu Asn Lys Ile
1580 1585 1590
Leu Phe Arg Ala Tyr Cys Lys Gly Asp Asp Leu Tyr Ala Ser Leu
1595 1600 1605
Phe Ile Phe Lys Glu Ser Thr Gly Asn Ser Ile Ile Lys Asp Ser
1610 1615 1620
Tyr Val Met Ile Gly Asn Arg Met Tyr Lys Val Val Asn Thr Thr
1625 1630 1635
Ser Asn Glu Gln Asp Ile Thr Ile Thr Leu Asp Arg Gly Leu Glu
1640 1645 1650
Glu Asp Leu Asn Leu Gly Asp Pro Ile Tyr Gln Leu Ile Asn Lys
1655 1660 1665
Thr Lys Val Gln Val Lys Ile Asn Lys Ser Asp Leu Phe Lys Asp
1670 1675 1680
Met Lys Leu Val Glu Ile Lys Lys Ser Asp Ser Ser Tyr Gln Glu
1685 1690 1695
Ile Tyr Glu Leu Glu Glu Ala Asn Ile Lys Ser Ala Gln Pro Lys
1700 1705 1710
Ile Ile Val Glu Lys Gly Asp Lys Trp Thr Ala Ile Lys Arg Pro
1715 1720 1725
Ser Met Ile Phe Arg Tyr Asp Ala Glu Asn Asn Glu Pro Gln Ala
1730 1735 1740
<210> 88
<211> 327
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 88
Leu Glu Glu Lys Phe Tyr Ile Ile Leu Thr Lys Ile Gly Arg Glu Lys
1 5 10 15
Ile Ala Asn Ala Thr Ala Leu Gly Glu Leu Val Gly Leu Thr Lys Phe
20 25 30
Gln Val Gly Asp Ser Asn Gly Glu Tyr Tyr Glu Pro Thr Glu Glu Gln
35 40 45
Thr Ala Leu Lys Asn Val Val Trp Glu Gly Asn Ile Asn Ser Leu Arg
50 55 60
Ile Asp Glu Lys Asn Pro Asn Trp Ile Val Ile Glu Thr Ile Leu Pro
65 70 75 80
Gly Thr Val Gly Gly Phe Met Ile Arg Glu Ala Ala Val Leu Asp Asn
85 90 95
Glu Asn Asn Ile Ile Ala Ile Gly Lys Tyr Pro Glu Thr Tyr Lys Pro
100 105 110
Arg Ala Glu Asp Gly Ser Ile Lys Asp Leu Val Val Lys Met Ile Leu
115 120 125
Gln Leu Ser Asn Thr Ser Asn Val Thr Leu Glu Val Asp Pro Thr Leu
130 135 140
Val Phe Val Thr Gln Lys Asp Ile Gln Asp Leu Asp Asp Lys Phe Asp
145 150 155 160
Lys Asn Ile Lys Glu Ile Lys Val Asn Ile Gly Asp Val Asn Ile Leu
165 170 175
Thr Thr Tyr Ser Lys Asp Leu Ser Gly Ala Ile Asn Glu Val Val Lys
180 185 190
Lys Ile Glu Asn Ile Ser Phe Asp Asp Val Ile Ser Gly Gln Ile Gln
195 200 205
Thr Asp Ile Ser Val Leu Lys Asn Ser Tyr Asn Lys Leu Ser Glu Lys
210 215 220
Val Leu Asp Ile Leu Ile Tyr Leu Glu Leu Glu Ser Glu Val Thr Val
225 230 235 240
Asp Glu Ala Gly Tyr Trp Tyr Asp Thr Leu Ala Asn Gly Asn Asn Ile
245 250 255
Val Ala Ile Glu Gly Leu Lys Leu Asp Leu Asn Arg Lys Cys Ile Thr
260 265 270
Gly Glu Ile Gly Asn Val Ile Phe Arg Asp Val Val Leu Pro Phe Ser
275 280 285
Ala Asn Arg Val Arg Tyr Ile His Asp Met Asp Asn Asn Phe Val Glu
290 295 300
Thr Lys Ser Ser Asn Thr Tyr Leu Lys Glu Gln Lys Asp Ile Thr Leu
305 310 315 320
Asn Lys Tyr Ser Tyr Glu Ile
325
<210> 89
<211> 117
<212> PRT
<213> Clostridium difficile
<400> 89
Leu Phe Lys Phe Asp Lys Asn Lys Ile Glu Gln Ile Lys Gln Gly Arg
1 5 10 15
Lys Val Glu Met Gln Tyr Lys Asp Ile Ser Asp Ile Ser Ile Gly Gln
20 25 30
Val Lys Gln Asp Asp Asp Ile Thr Asn Asn Phe Ile Ala Asn Ala Glu
35 40 45
Ile Tyr Glu Met Leu Leu Ser Gln Ser Ser Val Asn Glu Ala Ser Asn
50 55 60
Ile Ser Thr Phe Ser Val Arg Lys Ser Gly Gly Glu Ser Gly Met Val
65 70 75 80
Glu Val Tyr Val Ala Leu Ile Leu Arg Gly Lys Lys Thr Ile Glu Glu
85 90 95
Val Pro Ala Val Ile Arg Glu Gln Val Arg Ile Arg Cys Lys Glu Leu
100 105 110
Glu Ile Pro Val Glu
115
<210> 90
<211> 86
<212> PRT
<213> Clostridium difficile
<400> 90
Met Asp Lys Leu Ile Thr Glu Leu Ser Ser Leu Gly Ala Ile Gly Ile
1 5 10 15
Leu Cys Ala Leu Leu Phe Lys Asn Thr Met Gln Glu Lys Lys Glu Asp
20 25 30
Arg Asp Met Tyr Lys Lys Thr Val Glu Asn Phe Ile Glu Leu Ser Thr
35 40 45
Gln Gln Gln Glu Ile Asn Lys Asn Ile Leu Val Gln Met Gly Ile Met
50 55 60
Lys Thr Asp Val Glu Glu Ile Lys Glu Asp Val Thr Asp Ile Lys Gly
65 70 75 80
Met Leu Gln Asn Gly Val
85
<210> 91
<211> 327
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 91
Leu Glu Glu Lys Phe Tyr Ile Ile Leu Thr Lys Ile Gly Arg Glu Lys
1 5 10 15
Ile Ala Asn Ala Thr Ala Leu Gly Glu Leu Val Gly Leu Thr Lys Phe
20 25 30
Gln Val Gly Asp Ser Asn Gly Glu Tyr Tyr Glu Pro Thr Glu Glu Gln
35 40 45
Thr Ala Leu Lys Asn Val Val Trp Glu Gly Asn Ile Asn Ser Leu Arg
50 55 60
Ile Asp Glu Lys Asn Pro Asn Trp Ile Val Ile Glu Thr Ile Leu Pro
65 70 75 80
Gly Thr Val Gly Gly Phe Met Ile Arg Glu Ala Ala Val Leu Asp Asn
85 90 95
Glu Asn Asn Ile Ile Ala Ile Gly Lys Tyr Pro Glu Thr Tyr Lys Pro
100 105 110
Arg Ala Glu Asp Gly Ser Ile Lys Asp Leu Val Val Lys Met Ile Leu
115 120 125
Gln Leu Ser Asn Thr Ser Asn Val Thr Leu Glu Val Asp Pro Thr Leu
130 135 140
Val Phe Val Thr Gln Lys Asp Ile Gln Asp Leu Glu Thr Lys Ile Gly
145 150 155 160
Thr Val Asn Thr Lys Ile Asp Thr Thr Lys Thr Glu Leu Thr Ser Asn
165 170 175
Ile Glu Thr Ala Lys Thr Glu Leu Asn Thr Lys Ile Asp Gln Leu Ile
180 185 190
Ala Gly Gly Ser Asn Val Ala Tyr Thr Gln Arg Val Ala Ile Asp Asp
195 200 205
Trp Val Glu Asp Ala Glu Ser Gly Phe Lys Ala Thr Val Thr His Ser
210 215 220
Leu Leu Thr His Arg Ile Val Val Asn Ile Ile Asp Ala Thr Thr Lys
225 230 235 240
Glu Asn Ile Val Pro Asn Phe Lys Ile Val Asp Asp Asn Ser Ile Glu
245 250 255
Ile Arg Ser Glu Val Lys Val Glu Leu Asn Val Tyr Val Ile Asn Gly
260 265 270
Asn Ala Glu Thr His Phe Ile Asn Ala Thr Val Asp Asp Asn Arg Val
275 280 285
Ser Glu Met Thr Thr Tyr Ser Ser Lys Lys Ile Glu Asp Arg Leu Val
290 295 300
Asn Ile Glu Glu Lys Val Asn Gly Gly Leu Ser Asn Ile Ala Thr Ser
305 310 315 320
Val Asn Glu Leu Ile Thr Tyr
325
<210> 92
<211> 570
<212> PRT
<213> Clostridium difficile
<400> 92
Met Gln Thr Glu Trp Asn Phe Asn Tyr Ala Asn Tyr Val Gln Asn Val
1 5 10 15
Ser Leu Pro Pro Gly Arg Tyr Lys Leu Glu Cys Trp Gly Ala Cys Gly
20 25 30
Gly Ala Val Asp Thr Ser Asp Trp Thr Asp Cys Ala Lys Gly Gly Tyr
35 40 45
Ser Lys Gly Glu Ile Val Phe Lys Lys Arg Thr Asn Leu Gln Ile Cys
50 55 60
Val Gly Gln Ser Gly Tyr Glu Lys Val Ser Glu Gly Ser Ser Leu Thr
65 70 75 80
Arg Ser Gly Phe Asn Gly Ala Gly Ala Ala Gly Lys Val Thr Thr Gly
85 90 95
Ser Phe Ala Tyr Ser Lys Tyr Gly Gly Gly Ala Thr Asp Ile Arg Leu
100 105 110
Tyr His Pro Ser Ala Thr Trp Gly Asn Thr Glu Ser Leu Leu Ser Arg
115 120 125
Ile Leu Val Ala Gly Gly Gly Gly Gly Met Lys Asn Asn Phe Ala Ser
130 135 140
Ala Arg Ser Ile Gly His Gly Gly Gly Tyr Val Gly Val Asn Gly Val
145 150 155 160
Gly Arg Asp Arg Asp Phe Cys Gly Gly Gly Ser Gln Tyr Gln Gly Gly
165 170 175
Thr Ser Tyr Asp Thr Glu Glu Tyr His Gly Ser Leu Gly Lys Gly Gly
180 185 190
Tyr Gly Asn Ile Gly Ile Gly Gly Gly Gly Gly Trp Tyr Gly Gly Ala
195 200 205
Gly Ser Tyr Ser Asn Glu Cys Gly Gly Gly Gly Ser Gly Tyr Ala Leu
210 215 220
Asn Lys Asp Ser Tyr Lys Ala Pro Gly Tyr Ile Pro Thr Pro Glu Tyr
225 230 235 240
Tyr Leu Glu Asn Ile Val Met Thr Thr Gly Gly Asn Thr Thr Lys Ala
245 250 255
Asp Gly Tyr Ala Lys Ile Thr Leu Leu Gln Ala Leu Pro Phe Leu Thr
260 265 270
Val Ser Ser Tyr Asn Ser Thr Gln Ala Thr Phe Lys Ala Asp His Thr
275 280 285
Asp Pro Ala Leu Leu Thr Lys Ile Glu Trp Phe Ile Asp Asp Val Leu
290 295 300
Lys Glu Thr Ile Thr Thr Asn Leu Thr Glu Glu Lys Thr Ile Asn Tyr
305 310 315 320
Thr Leu Glu Asp Asn Ala Leu His Thr Leu Lys Ile Val Val Thr Asp
325 330 335
Ser Asn Asn Ala Thr Ala Glu Lys Val Leu Ser Ile Ser Lys Asn Ile
340 345 350
Met Pro Leu Pro Glu Asn Val Asn Leu Asn Asp Ile Ser Thr Lys Leu
355 360 365
Val Glu Val Asn Ala Gly Phe Lys Val Gly Lys Thr Ser Ile Ile Asn
370 375 380
Thr Leu Ala Leu Lys Asn Ile Glu Ala Ser Leu Asn Asn Thr Leu Val
385 390 395 400
Glu Leu Ser Glu Lys Ile Lys Thr Ser Phe Asp Ser Ser Asp Thr Ser
405 410 415
Val Gln Asp Leu Gln Asn Gln Val Thr Gln Lys Asn Asn Thr Ile Thr
420 425 430
Gln Leu Glu Thr Glu Leu Ser Lys Arg Lys Arg Phe Ile Thr Gly Thr
435 440 445
Tyr Thr Phe Thr Lys Thr Asp Ala Glu Asn Phe Asn Leu Ser Ile Tyr
450 455 460
Asp Lys Glu Gly Thr Ser Lys Thr Leu Thr Ile Pro Val Asn Met Gly
465 470 475 480
Phe Ser Pro Ser Leu Ile Val Leu Ser Gly Val Thr Phe Ser Thr Thr
485 490 495
Ser Lys Ser Tyr Val Tyr Phe Asp Asn Val Cys Asn Ser Asn Phe Tyr
500 505 510
Asn Phe Gly Tyr Asn Ser Asp Ser Thr His Ser Asn Pro Lys Ala Val
515 520 525
Gly Ile Leu Asn Val Ser Asn Val Gly Tyr Ser Ser Leu Val Leu Thr
530 535 540
Leu Tyr Lys Leu Ser Met Ser Glu Ala Val Gly Ile Trp Ala Lys Glu
545 550 555 560
Gly Ala Thr Leu Thr Tyr Lys Ile Tyr Ile
565 570
<210> 93
<211> 266
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 93
Leu Glu Glu Lys Phe Tyr Ile Ile Leu Thr Lys Ile Gly Arg Glu Lys
1 5 10 15
Ile Ala Asn Ala Thr Ala Leu Gly Glu Leu Val Gly Leu Thr Lys Phe
20 25 30
Gln Val Gly Asp Ser Asn Gly Glu Tyr Tyr Glu Pro Thr Glu Glu Gln
35 40 45
Thr Ala Leu Lys Asn Val Val Trp Glu Gly Asn Ile Asn Ser Leu Arg
50 55 60
Ile Asp Glu Lys Asn Pro Asn Trp Ile Val Ile Glu Thr Ile Leu Pro
65 70 75 80
Gly Thr Val Gly Gly Phe Met Ile Arg Glu Ala Ala Val Leu Asp Asn
85 90 95
Glu Asn Asn Ile Ile Ala Ile Gly Lys Tyr Pro Glu Thr Tyr Lys Pro
100 105 110
Arg Ala Glu Asp Gly Ser Ile Lys Asp Leu Val Val Lys Met Ile Leu
115 120 125
Gln Leu Ser Asn Thr Ser Asn Val Thr Leu Glu Val Asp Pro Thr Leu
130 135 140
Val Phe Val Thr Gln Lys Asp Ile Gln Asp Leu Glu Thr Lys Ile Gly
145 150 155 160
Thr Val Asn Ile Lys Ile Asp Thr Thr Lys Thr Glu Leu Thr Ser Asn
165 170 175
Ile Glu Thr Thr Lys Thr Glu Leu Ile Gly Lys Ile Gly Asp Thr Thr
180 185 190
Gln Leu Thr Thr Thr Asp Lys Thr Asn Ile Val Ser Ala Leu Asn Glu
195 200 205
Val Lys Thr Ser Val Asp Ser Ile Glu Thr Thr Ala Asp Lys Thr Ser
210 215 220
Ile Lys Asp Thr Asp Asn Leu Phe Glu Ser Asp Asn Val Glu Gly Ala
225 230 235 240
Leu Lys Glu Val Met Gln Glu Val Lys Gly Asn Arg Ser Ser Ile Ile
245 250 255
Ser Ser Ile Asn Ser Asn Leu Ile Pro Met
260 265
<210> 94
<211> 497
<212> PRT
<213> Clostridium difficile
<400> 94
Met Ala Thr Tyr Asp Val Asp Arg Gly Val Lys Leu Arg Glu Gly Glu
1 5 10 15
His Thr Asp Glu Glu Ile Phe Leu Arg Ala Cys Ser Tyr Gln Thr Gly
20 25 30
Gly Arg Thr Tyr Tyr Gly Thr Phe Glu Val Gly Asn Glu Ile Lys Val
35 40 45
Phe Glu Leu Glu Thr Arg Leu Tyr Thr Ala Thr Thr Thr Asn Val Arg
50 55 60
Tyr Tyr Ser Thr Ser Gly Ser Glu Val Met Val Arg Asp Val Val Met
65 70 75 80
Arg Gln Asn Val Thr Ala Met Phe Val Ala Lys Pro Thr Ile Asn Ile
85 90 95
Lys Asp Asn Leu Gly Ile Ile Ser Asp Ala Cys Glu Ile Glu Tyr Thr
100 105 110
Ile Ser Asp Gly Phe Pro Glu Leu Arg Tyr Asn Ile Val Tyr Lys Leu
115 120 125
Asn Asn Asp Ile Ile Gly Gln Ile Val Asn Thr Val Asp Ser Lys Tyr
130 135 140
Lys Ile Ser Leu Thr Asp Glu Tyr Leu Ser Lys Leu Ser His Asn Ser
145 150 155 160
Thr Asn His Ile Val Ile Glu Phe Asn Asp Phe Asn Asn Arg Asn Met
165 170 175
Leu Thr Lys Thr Val Ile Phe Thr Lys Gly Asn Thr Lys Pro Lys Leu
180 185 190
Asn Ile Thr Ser Tyr Asn Ser Thr Thr Thr Ile Phe Thr Ala Ile Asp
195 200 205
Thr Asp Asn Asn Leu Ser Lys Ile Glu Trp Phe Ile Asp Asp Val Leu
210 215 220
Lys Glu Thr Ile Thr Thr Asp Leu Tyr Leu Glu Lys Ile Ile Asn Tyr
225 230 235 240
Glu Leu Thr Asp Asn Ala Val His Thr Leu Lys Ile Val Ala Thr Asp
245 250 255
Ala Glu Asn Ala Thr Val Glu Lys Val Leu Ser Ile Ser Lys Glu Ile
260 265 270
Met Pro Phe Gln Ser Asp Ala Ser Leu Ser Asp Ile Ser Thr Lys Leu
275 280 285
Ala Glu Ile Gly Glu Gly Phe Lys Asn Gly Lys Thr Ser Ile Ile Asn
290 295 300
Thr Leu Ala Leu Lys Asn Ile Glu Ala Ser Leu Asn Asn Thr Leu Val
305 310 315 320
Glu Leu Ser Glu Lys Ile Lys Thr Ser Phe Asp Ser Ser Asp Ala Ser
325 330 335
Val Gln Asp Leu Met Asn Gln Leu Thr Gln Ala Asn Asn Thr Ile Ser
340 345 350
Gln Leu Asp Ser Lys Tyr Lys Tyr Ala Ser Gly Thr Ala Asn Ala Arg
355 360 365
Glu Asn Ser Ser Leu Ile Ala Cys Ile Tyr Asp Pro Asn Thr Ser His
370 375 380
Thr Val Glu Glu Thr Ser Pro Tyr Trp Leu Asp Leu Asn Gly Ile Gly
385 390 395 400
Phe Ile Pro Asp Ile Phe Phe Ala Glu Cys Glu Tyr Glu Pro Asn Ser
405 410 415
Asp Ala Phe Tyr Lys Tyr Phe Val Phe Ala Ile Lys Asn Thr Phe Ser
420 425 430
Ile Ser Asn Asn Thr Gly Phe Val Val Asn Ile Thr Phe Asn Lys Glu
435 440 445
Tyr Gly Asp Arg Ser Phe Lys Leu Arg Gly Asp Leu Tyr Thr Leu Gly
450 455 460
Lys Arg His Val Ser Met Asp Asn Thr Gly Val Arg Val Pro Ala Leu
465 470 475 480
Asn Thr Leu Asn Asn Leu Arg Ala Tyr Lys Trp His Ala Ala Lys Phe
485 490 495
Lys
<210> 95
<211> 332
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 95
Leu Glu Glu Lys Phe Tyr Ile Ile Leu Thr Lys Ile Gly Arg Glu Lys
1 5 10 15
Ile Ala Asn Ala Thr Ala Leu Gly Glu Leu Val Gly Leu Thr Lys Phe
20 25 30
Gln Val Gly Asp Ser Asn Gly Glu Tyr Tyr Glu Pro Thr Glu Glu Gln
35 40 45
Thr Ala Leu Lys Asn Val Val Trp Glu Gly Asn Ile Asn Ser Leu Arg
50 55 60
Ile Asp Glu Lys Asn Pro Asn Trp Ile Val Ile Glu Thr Ile Leu Pro
65 70 75 80
Gly Thr Val Gly Gly Phe Met Ile Arg Glu Ala Ala Val Leu Asp Asn
85 90 95
Glu Asn Asn Ile Ile Ala Ile Gly Lys Tyr Pro Glu Thr Tyr Lys Pro
100 105 110
Arg Ala Glu Asp Gly Ser Ile Lys Asp Leu Val Val Lys Met Ile Leu
115 120 125
Gln Leu Ser Asn Thr Ser Asn Val Thr Leu Glu Val Asp Pro Thr Leu
130 135 140
Val Phe Val Thr Gln Lys Asp Ile Gln Glu Leu Asp Thr Lys Ile Asp
145 150 155 160
Thr Thr Lys Thr Glu Leu Thr Ser Asn Ile Glu Thr Ala Lys Thr Glu
165 170 175
Leu Asn Thr Arg Ile Asp Thr Glu Asn Glu Lys Gln Asn Ile Lys Ile
180 185 190
Asp Gln Leu Val Ala Gly Gly Val Asn Val Ser His Thr His Ile Ile
195 200 205
Glu Val Ala Asp Trp Ile Leu Asn Asn Glu Thr Asn Met Tyr Glu Val
210 215 220
Thr Ile Asn His Pro Leu Leu Thr Lys Arg Ile Leu Ile Ala Leu Tyr
225 230 235 240
Asp Glu Ile Gly Glu Ala Leu Thr Pro Asn Ala Arg Ala Ile Asp Asp
245 250 255
Asn Ser Ile Leu Val Arg Asn Glu Glu Asn Ile Lys Met Tyr Val Tyr
260 265 270
Leu Ile Asn Gly Asn Ala Glu Thr His Phe Ile Asn Ala Thr Val Asp
275 280 285
Asp Asn Arg Val Ser Glu Met Thr Thr Tyr Ser Ser Lys Lys Ile Glu
290 295 300
Asp Arg Leu Val Asn Ile Glu Glu Lys Leu Ser Gly Asn Leu Ser Asp
305 310 315 320
Ile Ala Thr Ser Val Asn Glu Leu Ile Thr Tyr Cys
325 330
<210> 96
<211> 565
<212> PRT
<213> Clostridium difficile
<400> 96
Val Ala Thr Glu Trp Asn Phe Asp Phe Lys Ala Glu Ala Gln Pro Ile
1 5 10 15
Thr Leu Lys Ala Gly Lys Tyr Lys Leu Glu Cys Trp Gly Ala His Gly
20 25 30
Lys Val Trp Gly Gly Asp Ser Gln Ser Ser Gly Gly Tyr Ser Tyr Gly
35 40 45
Glu Leu Thr Leu Lys Lys Glu Thr Thr Leu Tyr Val Tyr Thr Gly Ala
50 55 60
Thr Gly Ser Ser Asn Lys Tyr Glu Lys Phe Thr Phe Asn Gly Gly Gly
65 70 75 80
Leu Gly Val Asn Asn Gly Gly Gly Gly Ala Thr Asp Ile Arg Leu Val
85 90 95
Asn Gly Asp Trp Asn Asn Glu Gln Gly Leu Leu Ser Arg Ile Ile Val
100 105 110
Ala Gly Gly Gly Gly Gly Ala Phe Ser Lys Thr Pro Ala Gly Lys Gly
115 120 125
Gly Gly Phe Lys Gly Gly Asn Ser Thr Asn Asp Asp Asn Ser Ser Met
130 135 140
Leu Ile Val Pro Gly Gly Thr Gln Tyr Asp Gly Gly Arg Gly Tyr Cys
145 150 155 160
Asp Glu Trp Asp Gly Val Phe Gly Cys Gly Gly Gly Ser Ile Leu Gly
165 170 175
Leu Glu Arg Gly Lys Tyr Pro Tyr Asn Ser Gly Gly Gly Gly Trp Phe
180 185 190
Gly Gly Ala Gly Ala Arg Asn Thr Ser Ser Gly Gly Gly Gly Ser Gly
195 200 205
Tyr Val Leu Thr Lys Asp Ser Tyr Lys Pro Val Gly Tyr Ile Pro Thr
210 215 220
Ser Glu Tyr Trp Leu Glu Asn Val Gly Ser Ile Thr Gly Gly Asn Thr
225 230 235 240
Ala Lys Val Asn Gly Tyr Ala Lys Ile Thr Leu Leu Gln Ala Leu Pro
245 250 255
Ile Leu Thr Ile Ser Ser Tyr Asn Ser Thr Gln Ala Thr Phe Lys Ala
260 265 270
Asp His Thr Asp Pro Thr Leu Leu Thr Lys Ile Glu Val Phe Ile Asp
275 280 285
Asp Thr Leu Lys Glu Thr Ile Thr Thr Asp Leu Thr Leu Glu Lys Thr
290 295 300
Ile Asn Tyr Thr Leu Glu Asp Asn Ala Leu His Thr Leu Lys Ile Val
305 310 315 320
Val Thr Asp Ser Asn Asn Ala Thr Ala Glu Lys Val Leu Ser Ile Ser
325 330 335
Lys Asn Ile Met Pro Leu Pro Glu Asn Val Asn Leu Gln Asp Ile Ser
340 345 350
Thr Lys Leu Thr Glu Val Asn Ala Gly Phe Lys Ser Gly Lys Thr Ser
355 360 365
Ile Ile Asn Thr Leu Ala Leu Lys Asn Ile Glu Ala Ser Leu Asn Asn
370 375 380
Thr Leu Ile Glu Leu Ser Glu Lys Ile Lys Ile Ser Phe Asp Ser Ser
385 390 395 400
Asp Ala Ser Val Gln Asp Leu Met Asn Gln Leu Thr Gln Ala Asn Asn
405 410 415
Thr Ile Ser Gln Leu Asn Thr Lys Tyr Lys Val Ala Ser Gly Arg Thr
420 425 430
Ser Thr Leu Thr Asp Thr Thr Ser Thr Ala Tyr Leu Tyr Val Asn Ser
435 440 445
Gln Ser Asn Pro Asn Tyr Pro Ile Asn Pro Gly Gly Trp Val Asn Ile
450 455 460
Lys Gly Leu Asn Phe Ile Pro Asn Ile Phe Phe Ala Glu Cys Glu Cys
465 470 475 480
Thr Thr Asn Ser Pro Thr Gln Phe Tyr Lys Tyr Leu Ile Phe Ala Thr
485 490 495
Tyr Leu Ile Pro Ser Leu Ser Asp Lys Asp Phe Val Ile Thr Thr Ala
500 505 510
Leu Arg Lys Thr Asn Ser Asp Thr Lys Phe Thr Ala Asp Ser Gln Val
515 520 525
Tyr Ile Asn Asn Arg Gly Asn Thr Tyr Ile Asn Asn Gln Gly Val Tyr
530 535 540
Val Pro Ala Tyr Arg Pro Ser Val Ser Tyr Thr Leu Tyr Asn Trp Tyr
545 550 555 560
Ala Ile Lys Phe Val
565
<210> 97
<211> 332
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 97
Leu Glu Glu Lys Phe Tyr Ile Ile Leu Thr Lys Ile Gly Arg Glu Lys
1 5 10 15
Ile Ala Asn Ala Thr Ala Leu Gly Glu Leu Val Gly Leu Thr Lys Phe
20 25 30
Gln Val Gly Asp Ser Asn Gly Glu Tyr Tyr Glu Pro Thr Glu Glu Gln
35 40 45
Thr Ala Leu Lys Asn Val Val Trp Glu Gly Asn Ile Asn Ser Leu Arg
50 55 60
Ile Asp Glu Lys Asn Pro Asn Trp Ile Val Ile Glu Thr Ile Leu Pro
65 70 75 80
Gly Thr Val Gly Gly Phe Met Ile Arg Glu Ala Ala Val Leu Asp Asn
85 90 95
Glu Asn Asn Ile Ile Ala Ile Gly Lys Tyr Pro Glu Thr Tyr Lys Pro
100 105 110
Arg Ala Glu Asp Gly Ser Ile Lys Asp Leu Val Val Lys Met Ile Leu
115 120 125
Gln Leu Ser Asn Thr Ser Asn Val Thr Leu Glu Val Asp Pro Thr Leu
130 135 140
Val Phe Val Thr Gln Lys Asp Ile Gln Asp Leu Asp Ser Lys Ile Asp
145 150 155 160
Thr Thr Lys Thr Glu Leu Thr Ser Asn Ile Glu Thr Ala Lys Thr Glu
165 170 175
Leu Asn Thr Arg Ile Asp Thr Glu Asn Glu Lys Gln Asn Ile Lys Ile
180 185 190
Asp Gln Leu Ile Ala Gly Gly Ser Asn Val Ala Ser Thr Gln Thr Ile
195 200 205
Thr Ile Asp Asp Trp Val Glu Asp Ala Glu Asn Gly Phe Lys Ala Thr
210 215 220
Val Thr His Ser Leu Leu Thr Gln Arg Ile Val Val Asn Ile Ile Asp
225 230 235 240
Ala Thr Thr Lys Glu Asn Val Val Thr Asn Phe Lys Ile Ile Asp Asp
245 250 255
Asn Ser Ile Glu Ile Arg Ser Glu Thr Arg Ser Glu Leu Asn Val Tyr
260 265 270
Val Ile Asn Gly Asn Ala Glu Thr Arg Phe Ile Asn Ala Thr Val Asp
275 280 285
Asp Asn Arg Val Ser Glu Met Thr Thr Tyr Ser Ser Lys Lys Ile Glu
290 295 300
Asp Arg Leu Val Asn Ile Glu Glu Lys Val Asn Gly Asn Leu Ser Asn
305 310 315 320
Ile Ala Thr Ser Val Asn Glu Leu Ile Thr Tyr Cys
325 330
<210> 98
<211> 541
<212> PRT
<213> Clostridium difficile
<400> 98
Val Ala Thr Glu Trp Asn Phe Asp Phe Lys Ala Glu Ala Gln Pro Ile
1 5 10 15
Thr Leu Lys Ala Gly Lys Tyr Lys Leu Glu Cys Trp Gly Ala His Gly
20 25 30
Arg Val Trp Thr Gly Asp Ser Pro Ser Asn Gly Gly Tyr Ser Tyr Gly
35 40 45
Glu Leu Thr Leu Lys Lys Glu Thr Thr Leu Tyr Val Tyr Thr Gly Ala
50 55 60
Ala Gly Ser Ser Asn Lys Tyr Glu Glu Phe Thr Phe Asn Gly Gly Gly
65 70 75 80
Leu Gly Val Asn Ser Gly Gly Gly Gly Ala Thr Asp Ile Arg Leu Val
85 90 95
Asn Gly Asp Trp Asn Asn Glu Gln Gly Leu Leu Ser Arg Ile Ile Val
100 105 110
Ala Gly Gly Gly Gly Gly Ala Phe Ser Lys Thr Pro Ala Gly Lys Gly
115 120 125
Gly Gly Phe Lys Gly Gly Asn Ser Thr Asn Asp Asp Asn Ser Ser Met
130 135 140
Leu Ile Val Pro Gly Gly Thr Gln Tyr Asp Gly Gly Arg Gly Tyr Tyr
145 150 155 160
Asp Glu Trp Asp Gly Val Phe Gly Cys Gly Gly Gly Ser Ile Leu Gly
165 170 175
Leu Glu Arg Gly Lys Tyr Pro Tyr Asn Ser Gly Gly Gly Gly Trp Phe
180 185 190
Gly Gly Ala Gly Ala Arg Asn Thr Ser Ser Gly Gly Gly Gly Ser Gly
195 200 205
Tyr Val Leu Thr Lys Asp Ser Tyr Lys Pro Val Gly Tyr Ile Pro Thr
210 215 220
Ser Glu Tyr Trp Leu Glu Asn Val Gly Ser Ile Thr Gly Gly Asn Thr
225 230 235 240
Ala Lys Val Asn Gly Tyr Ala Lys Ile Thr Leu Leu Gln Ala Leu Pro
245 250 255
Ile Leu Thr Ile Ser Ser Tyr Asn Ser Thr Gln Ala Thr Phe Lys Ala
260 265 270
Asp His Thr Asp Pro Thr Leu Leu Thr Lys Ile Glu Tyr Phe Ile Asp
275 280 285
Asp Val Leu Lys Glu Thr Ile Thr Thr Asp Leu Thr Leu Glu Lys Thr
290 295 300
Ile Asn Tyr Thr Leu Glu Asp Asn Ala Leu His Thr Leu Lys Ile Val
305 310 315 320
Val Thr Asp Ser Asn Asn Ala Thr Ala Glu Lys Val Leu Ser Ile Ser
325 330 335
Lys Asn Ile Met Pro Leu Pro Glu Asn Val Asn Leu Gln Asp Ile Ser
340 345 350
Ser Lys Leu Ile Glu Ile Asn Thr Gly Phe Lys Thr Gly Lys Thr Ser
355 360 365
Ile Ile Asn Thr Leu Ala Leu Lys Asn Ile Glu Ala Ser Leu Asn Asn
370 375 380
Thr Leu Val Glu Leu Ser Glu Lys Ile Lys Thr Ser Phe Asp Ser Ser
385 390 395 400
Asp Ala Ser Val Gln Glu Leu Gln Asn Arg Ile Thr Glu Leu Thr Asn
405 410 415
Gln Leu Ser Gln Arg Ile Lys Tyr Ala Thr Gly Thr Tyr Thr Ile Pro
420 425 430
Asp Gly Thr Ser Ser Leu Val Val Pro Thr Asn Leu Thr Phe Val Pro
435 440 445
Lys Thr Ile Ile Val Lys Ile Phe Ser Val Lys Asp Gly Ser Asn Pro
450 455 460
Ser Lys Thr Leu Ser Ala Tyr Pro Cys Met Thr Gly Val Asn Gln Asn
465 470 475 480
Leu Arg Tyr Asp Asn Gly Ser Tyr Thr Arg Val Ile Gly Asn Ala Ser
485 490 495
Ile Arg Asp Val Thr Ala Asp Ser Phe Lys Ile Glu Leu Gly Lys Ser
500 505 510
Asp Phe Asn Ala Gly Val Glu Phe Pro Phe Thr Phe Tyr Ser Lys Thr
515 520 525
Phe Arg Trp Tyr Ala Leu Asp Ile Glu Phe Leu Asn Asn
530 535 540
<210> 99
<211> 339
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 99
Leu Glu Glu Lys Phe Tyr Ile Ile Leu Thr Lys Ile Gly Arg Glu Lys
1 5 10 15
Ile Ala Asn Ala Thr Ala Leu Gly Glu Leu Val Gly Leu Thr Lys Phe
20 25 30
Gln Val Gly Asp Ser Asn Gly Glu Tyr Tyr Glu Pro Thr Glu Glu Gln
35 40 45
Thr Ala Leu Lys Asn Val Val Trp Glu Gly Asn Ile Asn Ser Leu Arg
50 55 60
Ile Asp Glu Lys Asn Pro Asn Trp Ile Val Ile Glu Thr Ile Leu Pro
65 70 75 80
Gly Thr Val Gly Gly Phe Met Ile Arg Glu Ala Ala Val Leu Asp Asn
85 90 95
Glu Asn Asn Ile Ile Ala Ile Gly Lys Tyr Pro Glu Thr Tyr Lys Pro
100 105 110
Arg Ala Glu Asp Gly Ser Ile Lys Asp Leu Val Val Lys Met Ile Leu
115 120 125
Gln Leu Ser Asn Thr Ser Asn Val Thr Leu Glu Val Asp Pro Thr Leu
130 135 140
Val Phe Val Thr Gln Lys Asp Ile Gln Asp Leu Asp Ala Lys Ile Ser
145 150 155 160
Asn Val Asn Thr Lys Ile Asp Thr Thr Lys Thr Glu Leu Thr Ser Asn
165 170 175
Ile Glu Thr Ala Lys Thr Glu Leu Asn Thr Arg Ile Asp Thr Glu Asn
180 185 190
Glu Lys Gln Asn Ile Lys Ile Asp Gln Leu Ile Ala Gly Gly Ser Asn
195 200 205
Val Ala Ser Thr Gln Thr Ile Thr Ile Asp Asp Trp Ile Asp Asn Gln
210 215 220
Glu Gly Gly Phe Lys Ala Thr Val Thr His Gly Leu Leu Thr Gln Arg
225 230 235 240
Ile Thr Val Ser Ile Ile Asp Ala Thr Thr Lys Asp Asn Val Val Pro
245 250 255
Asp Phe Thr Ile Ile Asp Asp Asn Ser Ile Glu Val Arg Ser Gly Val
260 265 270
Lys Val Glu Leu Asn Val Tyr Val Ile Asn Gly Asn Ala Glu Thr His
275 280 285
Phe Ile Asn Ala Thr Val Asp Asp Asn Arg Val Ser Glu Met Thr Thr
290 295 300
Tyr Ser Ser Lys Lys Ile His Glu Glu Ile Gly Lys Val Ala Glu Gln
305 310 315 320
Leu Thr Gly Ile Asn Ser Asn Ile Ile Ser Thr Val Asn Asn Asp Ile
325 330 335
Leu Pro Ile
<210> 100
<211> 508
<212> PRT
<213> Clostridium difficile
<400> 100
Met Ala Leu Ser Met Ser Tyr Phe Asn Leu Pro Asp Lys Arg Lys Tyr
1 5 10 15
Thr Lys Asn Leu Ala Phe Asn Pro Phe Ala Gly Gly Arg Gln Asn Phe
20 25 30
Glu Trp Thr Gly Gly Asp His Gly Leu Asn Gly Glu Phe Lys Glu Thr
35 40 45
Cys Leu Ser Cys Thr Tyr Asn Gly Ser Thr Leu Asn Trp Gly Ser Gly
50 55 60
Asn Val Trp Val Leu Gly Glu Tyr Gly Gln Tyr Thr Phe Thr Tyr Asn
65 70 75 80
Cys Glu Ser Met His Val Asp Thr Gln Gln Lys Phe Pro Tyr Thr Ser
85 90 95
Asn Arg Ile Ile Thr Ile Lys Gly Arg Pro Val Ile Ser Gly Ser Asp
100 105 110
Thr Ser Leu Gly Asn Lys Arg Lys Gly Phe Ser Val Asp Phe Thr Val
115 120 125
Ser Asp Asp Thr Pro Asn Val Asn Leu Ile Val Arg Ala Tyr Leu Asp
130 135 140
Asp Lys Leu Ile Gln Asn Ile Thr Pro Val Val Gln Asn Ser Thr Leu
145 150 155 160
Thr Ala Thr Val Thr Asp Ser Gln Leu Asn Ser Leu Ser Val Asp Gly
165 170 175
Asn His Lys Leu Lys Ile Gln Leu Asn Asp Gly Tyr Asp Asn Phe Asp
180 185 190
Arg Ile Phe Thr Phe Lys Lys Ile Glu Lys Gly Ile Asp Ile Ser Thr
195 200 205
Ser Leu Val Thr Asp Ser Gln Ala Lys Phe Thr Val Thr Lys Ile Tyr
210 215 220
Ser Glu Leu Thr Lys Ile Glu Cys Tyr Leu Asp Glu Thr Leu Lys Glu
225 230 235 240
Thr Phe Thr Thr Asp Leu Tyr Ser Glu Lys Thr Ile Asn Tyr Glu Leu
245 250 255
Ile Asp Asn Ala Ile His Thr Leu Lys Ile Val Val Thr Asp Ala Glu
260 265 270
Asn Val Val Glu Glu Lys Val Ile Ser Ile Ser Lys Asn Ile Met Pro
275 280 285
Leu Gln Pro Asp Ala Thr Leu Gln Asp Ile Ser Thr Lys Leu Thr Glu
290 295 300
Ile Gly Gln Gly Val Arg Asn Gly Lys Thr Ser Ile Ile Asn Thr Leu
305 310 315 320
Ala Leu Lys Asn Ile Asp Ala Ser Leu Asn Asn Thr Leu Val Glu Leu
325 330 335
Ser Glu Lys Ile Lys Gly Gly Phe Asp Ser Gly Asp Ala Ser Leu Gln
340 345 350
Asp Leu Met Asn Gln Leu Thr Gln Ala Asn Asn Thr Ile Ser Gln Leu
355 360 365
Asn Thr Lys Tyr Lys Val Ala Ser Gly Thr Val Thr Ser Phe Ala Asp
370 375 380
Ser Thr Lys Ile Ala Tyr Pro Tyr Leu Thr Asp Asn Val Thr Lys Pro
385 390 395 400
Gly Ser Trp Ile Lys Val Ser Asn Leu Gly Phe Lys Pro Asn Ile Phe
405 410 415
Phe Ala Asp Phe Asp Tyr Tyr Asp Ala Glu Tyr Lys Asn Asn Tyr Lys
420 425 430
Leu Phe Leu Phe Ala Cys Asn Gly Val Ala Thr Gln Arg Gly Val Asp
435 440 445
Phe Ser Ser Val Thr Ser Phe Ile Arg Lys Ser Gly Asp Glu Tyr Phe
450 455 460
His Ala Asn Gly Trp Leu Tyr Ser Asn Ser Glu Gly Asp Val Tyr Phe
465 470 475 480
Asn Asn Thr Gly Val Gln Ile Pro Ala Tyr Asn Phe Asp Ser Thr Gln
485 490 495
Lys His Thr Tyr Lys Trp Tyr Ala Ile Lys Phe Ile
500 505
<210> 101
<211> 256
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 101
Leu Glu Glu Lys Phe Tyr Ile Ile Leu Thr Lys Ile Gly Arg Glu Lys
1 5 10 15
Ile Ala Asn Ala Thr Ala Leu Gly Glu Leu Val Gly Leu Thr Lys Phe
20 25 30
Gln Val Gly Asp Ser Asn Gly Glu Tyr Tyr Glu Pro Thr Glu Glu Gln
35 40 45
Thr Ala Leu Lys Asn Val Val Trp Glu Gly Asn Ile Asn Ser Leu Arg
50 55 60
Ile Asp Glu Lys Asn Pro Asn Trp Ile Val Ile Glu Thr Ile Leu Pro
65 70 75 80
Gly Thr Val Gly Gly Phe Met Ile Arg Glu Ala Ala Val Leu Asp Asn
85 90 95
Glu Asn Asn Ile Ile Ala Ile Gly Lys Tyr Pro Glu Thr Tyr Lys Pro
100 105 110
Arg Ala Glu Asp Gly Ser Ile Lys Asp Leu Val Val Lys Met Ile Leu
115 120 125
Gln Leu Ser Asn Thr Ser Asn Val Thr Leu Glu Val Asp Pro Thr Leu
130 135 140
Val Phe Val Thr Gln Lys Asp Ile Gln Asp Leu Glu Thr Lys Ile Gly
145 150 155 160
Thr Val Asn Thr Lys Ile Asp Thr Thr Lys Thr Glu Leu Asn Ser Lys
165 170 175
Val Gly Asp Thr Thr Leu Leu Thr Thr Thr Asp Lys Thr Asn Ile Val
180 185 190
Asn Ala Leu Asn Glu Val Lys Lys Thr Ser Val Asp Ser Ile Glu Thr
195 200 205
Thr Ala Glu Lys Thr Ser Tyr Asn Asn Ala Thr Ser Lys Leu Asn Ala
210 215 220
Thr Asn Val Gln Gly Ala Ile Asp Glu Ile Val Ala Glu Val Arg Gly
225 230 235 240
Asn Arg Ser Ser Ile Ile Ser Ser Ile Asn Asp Asn Leu Ile Pro Met
245 250 255
<210> 102
<211> 486
<212> PRT
<213> Clostridium difficile
<400> 102
Met Pro Pro Ala Glu Thr Phe Ile Cys Asn Arg Ile Val Lys Lys Arg
1 5 10 15
Arg Gly Tyr Tyr Ser Glu Arg Asp Val Phe Leu Ser Pro Cys Pro Tyr
20 25 30
Val Tyr Gly Glu Gly Gly Met Tyr Glu Ser Thr Tyr Tyr Gly Glu Phe
35 40 45
Asp Leu Ser Asn Ser Lys Tyr Ile Thr Val Pro Thr Ser Thr Lys Tyr
50 55 60
Glu Lys Thr Ala Thr Arg Val Tyr Phe Ile Ser Gly Gly Asn Met Ile
65 70 75 80
Thr Ser Ser Ser Gly Met Lys Gln Ala Ile Thr Leu Glu Leu Ile Pro
85 90 95
Asp Pro Asn Ile Ile Ile Asn Asp Asp Leu Gly Val Ile Ser Asp Ser
100 105 110
Cys Asn Ile Asn Tyr Arg Ile Pro Asp Ser Asn Thr Ser Val Lys Phe
115 120 125
Asp Val Thr Glu Lys Leu Asn Gly Val Val Ile Ser Lys Lys Asn Tyr
130 135 140
Ala Leu Asp Gly Asn Tyr Thr Leu Asn Leu Thr Asp Glu His Leu Ser
145 150 155 160
Thr Leu Ser Phe Asn Ser Thr Asn Asn Ile Thr Ile Glu Leu Ser Thr
165 170 175
Tyr Gln Gly Gly Lys Phe Leu Glu Lys Thr Val Thr Phe Thr Lys Gly
180 185 190
Asn Thr Lys Pro Lys Leu Asn Ile Thr Ser Tyr Asn Ser Thr Thr Ala
195 200 205
Ile Phe Thr Ala Ile Asp Ile Asp Asn Asn Leu Ser Lys Ile Glu Trp
210 215 220
Phe Ile Asp Asp Val Leu Lys Glu Thr Ile Thr Thr Asp Leu Tyr Leu
225 230 235 240
Glu Lys Thr Ile Asn Tyr Glu Leu Thr Asp Asn Ala Ile His Thr Leu
245 250 255
Lys Ile Val Ala Thr Asp Ala Glu Asn Ala Thr Val Glu Lys Val Leu
260 265 270
Ser Ile Ser Lys Glu Ile Met Pro Leu Gln Glu Asp Ala Ser Leu Ser
275 280 285
Asp Ile Ser Thr Lys Leu Ala Glu Ile Gly Glu Glu Phe Arg Asn Gly
290 295 300
Lys Thr Ser Ile Ile Asn Thr Leu Ala Leu Lys Asn Ile Glu Ala Ser
305 310 315 320
Leu Asn Asn Thr Leu Val Glu Leu Ser Glu Lys Ile Lys Thr Ser Phe
325 330 335
Asp Ser Ser Asp Ala Ser Val Gln Asp Leu Gln Asn Arg Ile Thr Glu
340 345 350
Leu Asn Asn Gln Leu Ser Gln Arg Lys Lys Trp Ala Thr Gly Arg Tyr
355 360 365
Thr Phe Thr Asp Leu Asp Ile Ser Asn Phe Thr Leu Asn Ser Glu Ser
370 375 380
Ile Val Gln Thr Lys Ser Ile Ile Thr Asp Leu Ser Phe Thr Pro Ser
385 390 395 400
Ile Ile Ile Ile Asp Ser Ile Gln Met Lys Ser Gly Thr Asp Arg Val
405 410 415
Tyr Phe Arg Ser Ile Thr Asn Leu Asp Ile Thr Ile Gly Ala Lys Tyr
420 425 430
Thr Asn Ser Ser Leu Pro Val Gly Gly Ser Gly Tyr Ile Tyr Ile Gln
435 440 445
Lys Pro Thr Pro Ser Asn Asn Phe Leu Leu Ile Leu Thr Arg Leu Asp
450 455 460
Gly Gln Gly Arg Glu Ile Ser Phe Ser Pro Ile Val Gly Glu Thr Leu
465 470 475 480
Thr Trp Tyr Ala Phe Glu
485
<210> 103
<211> 258
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 103
Leu Glu Glu Lys Phe Tyr Ile Ile Leu Thr Lys Ile Gly Arg Glu Lys
1 5 10 15
Ile Ala Asn Ala Thr Ala Leu Gly Glu Leu Val Gly Leu Thr Lys Phe
20 25 30
Gln Val Gly Asp Ser Asn Gly Glu Tyr Tyr Glu Pro Thr Glu Glu Gln
35 40 45
Thr Ala Leu Lys Asn Val Val Trp Glu Gly Asn Ile Asn Ser Leu Arg
50 55 60
Ile Asp Glu Lys Asn Pro Asn Trp Ile Val Ile Glu Thr Ile Leu Pro
65 70 75 80
Gly Thr Val Gly Gly Phe Met Ile Arg Glu Ala Ala Val Leu Asp Asn
85 90 95
Glu Asn Asn Ile Ile Ala Ile Gly Lys Tyr Pro Glu Thr Tyr Lys Pro
100 105 110
Arg Ala Glu Asp Gly Ser Ile Lys Asp Leu Val Val Lys Met Ile Leu
115 120 125
Gln Leu Ser Asn Thr Ser Asn Val Thr Leu Glu Val Asp Pro Thr Leu
130 135 140
Val Phe Val Thr Gln Lys Asp Ile Gln Asp Leu Asp Thr Lys Ile Asp
145 150 155 160
Thr Thr Lys Ala Glu Leu Thr Ser Asn Ile Glu Thr Ala Lys Thr Glu
165 170 175
Leu Asn Asn Lys Ile Gly Asp Thr Thr Leu Leu Thr Thr Thr Asp Lys
180 185 190
Thr Asn Ile Val Ser Ala Ile Asn Glu Val Lys Thr Ser Val Asp Ser
195 200 205
Ile Glu Thr Thr Ala Glu Lys Thr Ser Tyr Asn Asn Ala Thr Ser Asn
210 215 220
Leu Asn Ala Thr Asn Val Gln Gly Ala Ile Asp Glu Val Val Arg Lys
225 230 235 240
Ile Glu Asn Phe Asn Glu Ile Asn Ile Asn Ile Gln Asn Asp Met Leu
245 250 255
Pro Ile
<210> 104
<211> 574
<212> PRT
<213> Clostridium difficile
<400> 104
Met Gln Thr Val Trp Asn Phe Asp Tyr Ala Asn Tyr Val Arg Ser Ile
1 5 10 15
Ser Leu Leu Pro Gly Arg Tyr Lys Leu Glu Cys Trp Gly Ala Cys Gly
20 25 30
Gly Gly Lys Gly Ala Ser Ser Phe Asn Glu Cys Ala Lys Gly Gly Tyr
35 40 45
Ala Lys Gly Glu Ile Ile Leu Lys Lys Arg Thr Asn Leu Ile Val Cys
50 55 60
Val Gly Gln Ser Gly Tyr Glu Lys Leu Ala Lys Asp Ser Asn Ile Thr
65 70 75 80
Arg Thr Gly Phe Asn Gly Gly Gly Arg Ala Gly Ser Thr Asn Ile Gly
85 90 95
Asp Tyr Ile Tyr Ala Gly Tyr Gly Gly Gly Ala Thr Asp Ile Arg Leu
100 105 110
Tyr Tyr Ser Ser Thr Thr Trp Asp Ser Ser Glu Gly Leu Leu Ser Arg
115 120 125
Ile Leu Val Ala Gly Gly Ala Gly Ala Ile Ser Gly Phe Ser Tyr Pro
130 135 140
His Pro Ser Ile Gly His Gly Gly Gly Glu Lys Gly Ser Asp Gly Val
145 150 155 160
Ser Ala Asn Thr Asn Arg Phe Ser Gly Gly Gly Ser Gln Tyr Gln Gly
165 170 175
Gly Ser Asn Gln Glu Thr Ile Glu Tyr His Gly Ser Phe Gly Lys Gly
180 185 190
Gly Ile Gly Tyr Tyr Ser Val Gly Gly Gly Gly Gly Trp Tyr Gly Gly
195 200 205
Gly Gly Thr Asn Ala Gly Asn Val Ala Gly Gly Gly Ser Gly Tyr Ala
210 215 220
Leu Thr Lys Asp Ser Tyr Lys Pro Pro Gly Tyr Ile Pro Thr Ser Glu
225 230 235 240
Tyr Trp Leu Glu Asn Val Val Met Thr Thr Gly Gly Asn Thr Thr Arg
245 250 255
Ala Asp Gly Tyr Ala Lys Ile Thr Leu Leu Gln Ala Leu Pro Phe Leu
260 265 270
Asn Ile Ser Ser Tyr Asn Ser Thr Gln Val Thr Phe Lys Ala Asp His
275 280 285
Thr Asp Pro Thr Leu Leu Thr Lys Ile Glu Val Phe Ile Asp Asp Thr
290 295 300
Leu Lys Glu Thr Ile Thr Thr Asp Leu Thr Thr Glu Lys Thr Ile Asn
305 310 315 320
Tyr Thr Leu Glu Asp Asn Ala Leu His Thr Leu Lys Ile Val Val Thr
325 330 335
Asp Ser Asn Asn Ala Thr Ala Glu Lys Val Leu Ser Ile Ser Lys Gly
340 345 350
Ile Ala Pro Leu Pro Ala Gly Ser Thr Thr Asp Glu Val Thr Asn Lys
355 360 365
Trp Ile Glu Ile Lys Asp Thr Phe Arg Ser Gly Lys Thr Ser Ile Ile
370 375 380
Asn Thr Leu Ala Leu Lys Asn Ile Glu Ala Ser Leu Asn Asn Thr Leu
385 390 395 400
Val Glu Leu Ser Glu Lys Ile Lys Val Gly Phe Asp Ser Lys Asp Ala
405 410 415
Ser Leu Gln Asp Leu Ile Lys Gln Leu Thr Gln Ala Asn Asn Thr Ile
420 425 430
Ser Gln Leu Asn Thr Lys Tyr Lys Val Ala Ser Gly Thr Thr Thr Ala
435 440 445
Leu Glu Ala Glu Gly Arg Gly Ser Leu Phe Glu Val Thr Tyr Ser Gly
450 455 460
Gly Lys Ser Tyr Ala Tyr Asn Arg Trp Val Lys Val Thr Gly Leu Asn
465 470 475 480
Phe Thr Pro Asn Ile Phe Ile Thr Phe Glu Asn His Lys Thr Ser Tyr
485 490 495
Pro Tyr Phe Tyr Cys Asn Phe Thr Phe Ala Cys Gln Gly Val Phe Asp
500 505 510
Lys Asp Phe Ala Val Val Thr Phe Tyr Ser Phe Arg Gly Gln Pro Gly
515 520 525
Glu Thr Thr Tyr Asp Ala Thr Gly Asn Val Ile His Ile Asp Lys Gly
530 535 540
Ala Pro Tyr Met Asn Glu Asn Gly Val Tyr Leu Pro Val Tyr Thr Gln
545 550 555 560
Glu Gly Tyr Leu Thr Arg Asn Trp Tyr Ala Ile Lys Phe Lys
565 570
<210> 105
<211> 265
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 105
Leu Glu Glu Lys Phe Tyr Ile Ile Leu Thr Lys Ile Gly Arg Glu Lys
1 5 10 15
Ile Ala Asn Ala Thr Ala Leu Gly Glu Leu Val Gly Leu Thr Lys Phe
20 25 30
Gln Val Gly Asp Ser Asn Gly Glu Tyr Tyr Glu Pro Thr Glu Glu Gln
35 40 45
Thr Ala Leu Lys Asn Val Val Trp Glu Gly Asn Ile Asn Ser Leu Arg
50 55 60
Ile Asp Glu Lys Asn Pro Asn Trp Ile Val Ile Glu Thr Ile Leu Pro
65 70 75 80
Gly Thr Val Gly Gly Phe Met Ile Arg Glu Ala Ala Val Leu Asp Asn
85 90 95
Glu Asn Asn Ile Ile Ala Ile Gly Lys Tyr Pro Glu Thr Tyr Lys Pro
100 105 110
Arg Ala Glu Asp Gly Ser Ile Lys Asp Leu Val Val Lys Met Ile Leu
115 120 125
Gln Leu Ser Asn Thr Ser Asn Val Thr Leu Glu Val Asp Pro Thr Leu
130 135 140
Val Phe Val Thr Gln Lys Asp Ile Gln Asp Leu Glu Thr Lys Ile Gly
145 150 155 160
Thr Val Asn Thr Lys Ile Asp Thr Thr Lys Thr Glu Leu Thr Ser Asn
165 170 175
Ile Glu Thr Ala Lys Thr Glu Leu Asn Asn Lys Ile Gly Asp Thr Thr
180 185 190
Gln Leu Thr Thr Ile Asp Lys Thr Asn Ile Val Ser Ala Leu Asn Glu
195 200 205
Val Lys Ala Ser Val Asp Ser Ile Glu Thr Thr Ala Glu Lys Thr Ser
210 215 220
Tyr Asn Asn Ala Thr Ser Asn Leu Ile Ala Thr Asn Val Gln Gly Ala
225 230 235 240
Ile Asp Glu Val Val Arg Lys Ile Glu Asn Phe Asn Glu Val Asn Ile
245 250 255
Ser Ile Gln Asn Asp Met Leu Pro Ile
260 265
<210> 106
<211> 575
<212> PRT
<213> Clostridium difficile
<400> 106
Met Ala Ile Val Tyr Glu Phe Asn Tyr Thr Gly Ala Glu Gln Ser Val
1 5 10 15
Val Leu Pro Pro Gly Lys Tyr Lys Phe Glu Cys Phe Gly Ala Cys Gly
20 25 30
Gly Asn Tyr Tyr Asp Phe Val Gln Cys Ala Lys Gly Gly Tyr Thr Ala
35 40 45
Gly Ser Leu Ile Leu Lys Glu Asn Thr Thr Leu His Val Tyr Val Gly
50 55 60
Gln Ser Gly Tyr Cys Lys Gly Val Asn Gly Ile Glu Thr Cys Arg Ser
65 70 75 80
Gly Phe Asn Gly Ala Gly Gly Ile Thr Thr Tyr Lys Ser Thr Ser Asp
85 90 95
Gly Tyr Tyr Ser Leu Ala Gly Gly Gly Ala Thr Asp Ile Arg Leu Ile
100 105 110
Gly Gly Asn Trp Asp Asn Leu Gln Ser Leu Leu Ser Arg Ile Ile Val
115 120 125
Ala Gly Gly Gly Gly Gly Gly Ser Gly Asn Ser His Asp Ser Ile Gly
130 135 140
His Gly Gly Gly Thr Lys Gly Lys Asp Gly Ile Ser Ile Ala Asn Lys
145 150 155 160
Tyr Phe Ala Gly Gly Gly Ser Gln Phe Gln Gly Gly Leu Thr Phe Asn
165 170 175
Ser Leu Tyr Asn Gly Ser Phe Gly Val Ser Gly Ala Gly Asp Gly Ile
180 185 190
Ser Gly Val Gly Gly Gly Gly Gly Trp Tyr Cys Gly Ala Gly Ser Phe
195 200 205
Tyr Ala Glu Phe Gly Gly Gly Gly Ser Gly Tyr Ile Leu Thr Lys Asp
210 215 220
Ser Tyr Lys Pro Ala Asn Tyr Ser Pro Ser Ser Lys Tyr Tyr Phe Ser
225 230 235 240
Asp Ile Asn Ser Val Val Gly Gly Asn Thr Thr Lys Gln Asp Gly Tyr
245 250 255
Ala Lys Ile Thr Leu Leu Gln Ala Leu Pro Phe Leu Thr Ile Ser Ser
260 265 270
Tyr Asn Ser Thr Thr Ala Thr Phe Lys Ala Asp His Thr Asp Pro Thr
275 280 285
Leu Leu Thr Lys Ile Glu Tyr Phe Ile Asp Asp Val Leu Lys Glu Thr
290 295 300
Ile Thr Thr Asp Leu Thr Leu Glu Lys Thr Ile Asn Tyr Thr Leu Glu
305 310 315 320
Asp Asn Ala Leu His Thr Leu Lys Ile Val Val Thr Asp Ser Ala Asn
325 330 335
Ala Thr Ala Glu Lys Val Val Ser Ile Ser Lys Gly Ile Ala Pro Leu
340 345 350
Pro Ala Gly Ser Thr Thr Asp Glu Val Thr Ser Lys Trp Ile Glu Ile
355 360 365
Lys Asp Ala Phe Lys Ser Gly Lys Thr Ser Ile Ile Asn Thr Leu Ala
370 375 380
Leu Lys Asn Ile Glu Ala Ser Leu Asn Asn Thr Leu Val Glu Leu Ser
385 390 395 400
Glu Lys Ile Lys Thr Ser Phe Asp Ser Ser Asp Ala Ser Val Gln Asp
405 410 415
Leu Met Asn Gln Leu Thr Gln Ala Asn Asn Thr Ile Ser Gln Leu Asn
420 425 430
Thr Lys Tyr Lys Val Ala Ser Gly Arg Thr Ser Ala Leu Thr Asp Thr
435 440 445
Ile Ser Thr Ala Tyr Leu Tyr Val Asn Ser Gln Ser Asn Pro Asn Tyr
450 455 460
Pro Ile Asn Pro Gly Gly Trp Ile Asn Ile Glu Gly Leu Asn Phe Ile
465 470 475 480
Pro Asn Ile Phe Phe Ala Glu Cys Glu Cys Thr Ala Asn Ser Pro Thr
485 490 495
Gln Phe Tyr Lys Tyr Leu Val Phe Ala Thr Tyr Ser Ile Pro Ser Leu
500 505 510
Ser Asp Lys Asp Phe Val Ile Thr Thr Ala Leu Arg Lys Thr Asn Ser
515 520 525
Asp Thr Lys Phe Thr Ala Asp Ser Gln Val Tyr Ile Asn Asn Arg Gly
530 535 540
Asn Thr Tyr Ile Asn Asn Gln Gly Val Tyr Val Pro Ala Tyr Arg Pro
545 550 555 560
Ser Val Ser Tyr Thr Leu Tyr Asn Trp Tyr Ala Ile Lys Phe Ile
565 570 575
<210> 107
<211> 259
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 107
Leu Glu Glu Lys Phe Tyr Ile Ile Leu Thr Lys Ile Gly Arg Glu Lys
1 5 10 15
Ile Ala Asn Ala Thr Ala Leu Gly Glu Leu Val Gly Leu Thr Lys Phe
20 25 30
Gln Val Gly Asp Ser Asn Gly Glu Tyr Tyr Glu Pro Thr Glu Glu Gln
35 40 45
Thr Ala Leu Lys Asn Val Val Trp Glu Gly Asn Ile Asn Ser Leu Arg
50 55 60
Ile Asp Glu Lys Asn Pro Asn Trp Ile Val Ile Glu Thr Ile Leu Pro
65 70 75 80
Gly Thr Val Gly Gly Phe Met Ile Arg Glu Ala Ala Val Leu Asp Asn
85 90 95
Glu Asn Asn Ile Ile Ala Ile Gly Lys Tyr Pro Glu Thr Tyr Lys Pro
100 105 110
Arg Ala Glu Asp Gly Ser Ile Lys Asp Leu Val Val Lys Met Ile Leu
115 120 125
Gln Leu Ser Asn Thr Ser Asn Val Thr Leu Glu Val Asp Pro Thr Leu
130 135 140
Val Phe Val Thr Gln Lys Asp Ile Gln Asp Leu Asp Ala Lys Ile Asp
145 150 155 160
Thr Thr Lys Thr Glu Leu Thr Ser Asn Ile Glu Thr Thr Lys Thr Glu
165 170 175
Leu Asn Thr Lys Ile Gly Asp Thr Thr Gln Leu Thr Thr Thr Asp Lys
180 185 190
Thr Asn Ile Val Ser Ala Leu Asn Glu Val Lys Ser Ser Val Asp Ser
195 200 205
Ile Glu Thr Thr Ala Glu Lys Thr Ser Ile Lys Asp Thr Asp Asn Leu
210 215 220
Phe Ser Ser Asp Asn Val Glu Gly Ala Leu Lys Glu Val Met Gln Glu
225 230 235 240
Val Lys Gly Asn Arg Ser Ser Ile Ile Ser Thr Val Asn Asn Asn Leu
245 250 255
Ile Pro Met
<210> 108
<211> 495
<212> PRT
<213> Clostridium difficile
<400> 108
Met Ser Thr Thr Val Leu Glu Arg Thr Val Lys Arg Arg Arg Gly Tyr
1 5 10 15
Tyr Arg Met Thr Asp Ile His Ala Ser Arg Leu Thr Tyr Asn Asp Gly
20 25 30
Ser Pro Tyr Tyr Thr Asp Phe Val Ala Tyr Tyr Thr Leu Asp Gln Tyr
35 40 45
Glu Arg Val Ser Ile Ser Ala Thr Lys Lys Phe Val Ala Tyr Ser Thr
50 55 60
Arg Ala Cys Gln Ile Ile Asn Gly Arg Glu Val Asp Ile Ser Arg Asn
65 70 75 80
Phe Thr Gln Glu Thr Thr Val Gln Phe Val Pro Asp Pro Thr Ile Phe
85 90 95
Ile Ser Asn Asp Leu Gly Val Ile Gly Asn Ala Cys Ser Ile Asn Tyr
100 105 110
Arg Ile Ser Asp Ser Asp Ser Ser Val Arg Phe Lys Ile Ile Glu Lys
115 120 125
Ile Asn Gly Val Lys Ile Ala Glu Lys Asn Asn Val Val Asp Gly Asn
130 135 140
Tyr Glu Leu Ile Ile Thr Asp Glu Leu Leu Ser Glu Leu Ala Phe Asn
145 150 155 160
Ser Val Asn Asn Ile Thr Ile Glu Leu Asp Asn Gly Tyr Gly Gly Ile
165 170 175
Phe Leu Asp Lys Thr Val Thr Phe Thr Lys Gly Asn Thr Lys Pro Lys
180 185 190
Leu Asn Ile Thr Ser Tyr Asn Ser Thr Ser Ala Thr Phe Thr Ala Ile
195 200 205
Asp Thr Asp Asn Asn Leu Ser Lys Ile Glu Trp Phe Ile Asp Asp Val
210 215 220
Leu Lys Glu Thr Ile Thr Thr Asp Leu Thr Thr Glu Lys Thr Ile Asn
225 230 235 240
Tyr Glu Leu Ala Asp Asn Ala Ile His Thr Leu Lys Ile Val Ala Thr
245 250 255
Asp Ser Glu Asn Ala Thr Ala Glu Lys Val Leu Ser Ile Ser Lys Glu
260 265 270
Ile Met Pro Leu Gln Ser Asp Ala Ser Leu Ser Asp Ile Ser Thr Lys
275 280 285
Leu Ile Glu Ile Gly Glu Gly Phe Arg Asn Gly Lys Thr Ser Ile Ile
290 295 300
Asn Thr Leu Ala Leu Lys Asn Ile Glu Ala Ser Leu Asn Asn Thr Leu
305 310 315 320
Val Glu Leu Ser Glu Lys Ile Lys Gln Ser Phe Asp Ser Gly Asp Ala
325 330 335
Ser Leu Gln Asp Leu Met Asn Gln Leu Thr Gln Ala Asn Asn Thr Ile
340 345 350
Ser Gln Leu Asn Ser Lys Tyr Lys Val Ala Ser Gly Thr Val Thr Ser
355 360 365
Phe Ala Asp Ser Ala Lys Ile Ala Tyr Pro Tyr Leu Thr Asp Arg Thr
370 375 380
Phe Lys Pro Gly Thr Trp Val Lys Ile Ser Asn Leu Asp Phe Lys Pro
385 390 395 400
Asn Ile Phe Phe Ala Asp Phe Asp Tyr Tyr Asp Thr Glu Tyr Lys Asn
405 410 415
Asn Tyr Lys Leu Phe Leu Phe Ala Cys Arg Gly Val Ala Thr Gln Arg
420 425 430
Gly Val Asp Phe Ser Ser Val Thr Ala Phe Ile Arg Lys Asn Ser Asp
435 440 445
Glu Asn Phe His Ala Asn Gly Trp Leu Tyr Asn Asn Ser Glu Gly Asp
450 455 460
Val Tyr Phe Asn Asn Thr Gly Val Gln Ile Pro Ala Tyr Asn Phe Asp
465 470 475 480
Ser Thr Gln Arg His Ile Tyr Lys Trp Tyr Ala Ile Lys Phe Ile
485 490 495
<210> 109
<211> 259
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 109
Leu Glu Glu Lys Phe Tyr Ile Ile Leu Thr Lys Ile Gly Arg Glu Lys
1 5 10 15
Ile Ala Asn Ala Thr Ala Leu Gly Glu Leu Val Gly Leu Thr Lys Phe
20 25 30
Gln Val Gly Asp Ser Asn Gly Glu Tyr Tyr Glu Pro Thr Glu Glu Gln
35 40 45
Thr Ala Leu Lys Asn Val Val Trp Glu Gly Asn Ile Asn Ser Leu Arg
50 55 60
Ile Asp Glu Lys Asn Pro Asn Trp Ile Val Ile Glu Thr Ile Leu Pro
65 70 75 80
Gly Thr Val Gly Gly Phe Met Ile Arg Glu Ala Ala Val Leu Asp Asn
85 90 95
Glu Asn Asn Ile Ile Ala Ile Gly Lys Tyr Pro Glu Thr Tyr Lys Pro
100 105 110
Arg Ala Glu Asp Gly Ser Ile Lys Asp Leu Val Val Lys Met Ile Leu
115 120 125
Gln Leu Ser Asn Thr Ser Asn Val Thr Leu Glu Val Asp Pro Thr Leu
130 135 140
Val Phe Val Thr Gln Lys Asp Ile Gln Asp Leu Asp Ala Lys Ile Asp
145 150 155 160
Thr Thr Lys Thr Glu Leu Thr Ser Asn Ile Glu Thr Thr Lys Thr Glu
165 170 175
Leu Asn Thr Lys Ile Gly Asp Thr Thr Gln Leu Thr Thr Thr Asp Lys
180 185 190
Thr Asn Ile Val Ser Ala Leu Asn Glu Val Lys Ser Ser Val Asp Ser
195 200 205
Ile Glu Thr Thr Ala Glu Lys Thr Ser Ile Lys Asp Thr Asp Asn Leu
210 215 220
Phe Ser Ser Gly Asn Val Glu Gly Ala Leu Lys Glu Val Met Gln Glu
225 230 235 240
Val Lys Gly Asn Arg Ser Ser Ile Ile Ser Thr Val Asn Asn Asn Leu
245 250 255
Ile Pro Met
<210> 110
<211> 495
<212> PRT
<213> Clostridium difficile
<400> 110
Met Ser Thr Thr Val Leu Glu Arg Thr Val Lys Arg Arg Arg Gly Tyr
1 5 10 15
Tyr Arg Met Thr Asp Ile His Ala Ser Arg Leu Thr Tyr Asn Asp Gly
20 25 30
Ser Pro Tyr Tyr Thr Asp Phe Val Ala Tyr Tyr Thr Leu Asp Gln Tyr
35 40 45
Glu Arg Val Ser Ile Ser Ala Thr Lys Lys Phe Val Ala Tyr Ser Thr
50 55 60
Arg Ala Cys Gln Ile Ile Asn Gly Arg Glu Val Asp Ile Ser Arg Asn
65 70 75 80
Phe Thr Gln Glu Thr Thr Val Gln Phe Val Pro Asp Pro Thr Ile Phe
85 90 95
Ile Ser Asn Asp Leu Gly Val Ile Gly Asn Ala Cys Ser Ile Asn Tyr
100 105 110
Arg Ile Ser Asp Ser Asp Ser Ser Val Arg Phe Lys Ile Ile Glu Lys
115 120 125
Ile Asn Gly Val Lys Ile Ala Glu Lys Asn Asn Val Val Asp Gly Asn
130 135 140
Tyr Glu Leu Ile Ile Thr Asp Glu Leu Leu Ser Glu Leu Ala Phe Asn
145 150 155 160
Ser Val Asn Asn Ile Thr Ile Glu Leu Asp Asn Gly Tyr Gly Gly Ile
165 170 175
Phe Leu Asp Lys Thr Val Thr Phe Thr Lys Gly Asn Thr Lys Pro Lys
180 185 190
Leu Asn Ile Thr Ser Tyr Asn Ser Thr Ser Ala Thr Phe Thr Ala Ile
195 200 205
Asp Thr Asp Asn Asn Leu Ser Lys Ile Glu Trp Phe Ile Asp Asp Val
210 215 220
Leu Lys Glu Thr Ile Thr Thr Asp Leu Thr Thr Glu Lys Thr Ile Asn
225 230 235 240
Tyr Glu Leu Ala Asp Asn Ala Ile His Thr Leu Lys Ile Val Ala Thr
245 250 255
Asp Ser Glu Asn Ala Thr Ala Glu Lys Val Leu Ser Ile Ser Lys Glu
260 265 270
Ile Met Pro Leu Gln Ser Asp Ala Ser Leu Ser Asp Ile Ser Thr Lys
275 280 285
Leu Ile Glu Ile Gly Glu Gly Phe Arg Asn Gly Lys Thr Ser Ile Ile
290 295 300
Asn Thr Leu Ala Leu Lys Asn Ile Glu Ala Ser Leu Asn Asn Thr Leu
305 310 315 320
Val Glu Leu Ser Glu Lys Ile Lys Gln Ser Phe Asp Ser Gly Asp Ala
325 330 335
Ser Leu Gln Asp Leu Met Asn Gln Leu Thr Gln Ala Asn Asn Thr Ile
340 345 350
Ser Gln Leu Asn Ser Lys Tyr Lys Val Ala Ser Gly Thr Val Thr Ser
355 360 365
Phe Ala Asp Ser Ala Lys Ile Ala Tyr Pro Tyr Leu Thr Asp Arg Thr
370 375 380
Phe Lys Pro Gly Thr Trp Val Lys Ile Ser Asn Leu Asp Phe Lys Pro
385 390 395 400
Asn Ile Phe Phe Ala Asp Phe Asp Tyr Tyr Asp Thr Glu Tyr Lys Asn
405 410 415
Asn Tyr Lys Leu Phe Leu Phe Ala Cys Arg Gly Val Ala Thr Gln Arg
420 425 430
Gly Val Asp Phe Ser Ser Val Thr Ala Phe Ile Lys Lys Asn Ser Asp
435 440 445
Glu Asn Phe His Ala Asn Gly Trp Leu Tyr Asn Asn Ser Glu Gly Asp
450 455 460
Val Tyr Phe Asn Asn Thr Gly Val Gln Ile Pro Ala Tyr Asn Phe Asp
465 470 475 480
Ser Thr Gln Arg His Ile Tyr Lys Trp Tyr Ala Ile Lys Phe Ile
485 490 495
<210> 111
<211> 265
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 111
Leu Glu Glu Lys Phe Tyr Ile Ile Leu Thr Lys Ile Gly Arg Glu Lys
1 5 10 15
Ile Ala Asn Ala Thr Ala Leu Gly Glu Leu Val Gly Leu Thr Lys Phe
20 25 30
Gln Val Gly Asp Ser Asn Gly Glu Tyr Tyr Glu Pro Thr Glu Glu Gln
35 40 45
Thr Ala Leu Lys Asn Val Val Trp Glu Gly Asn Ile Asn Ser Leu Arg
50 55 60
Ile Asp Glu Lys Asn Pro Asn Trp Ile Val Ile Glu Thr Ile Leu Pro
65 70 75 80
Gly Thr Val Gly Gly Phe Met Ile Arg Glu Ala Ala Val Leu Asp Asn
85 90 95
Glu Asn Asn Ile Ile Ala Ile Gly Lys Tyr Pro Glu Thr Tyr Lys Pro
100 105 110
Arg Ala Glu Asp Gly Ser Ile Lys Asp Leu Val Val Lys Met Ile Leu
115 120 125
Gln Leu Ser Asn Thr Ser Asn Val Thr Leu Glu Val Asp Pro Thr Leu
130 135 140
Val Phe Val Thr Gln Lys Asp Ile Gln Glu Leu Glu Thr Lys Ile Gly
145 150 155 160
Thr Ile Asn Thr Lys Ile Asp Thr Thr Lys Thr Glu Leu Thr Ser Asn
165 170 175
Ile Glu Thr Ala Lys Thr Glu Leu Ser Asn Lys Ile Gly Asp Thr Thr
180 185 190
Gln Leu Asn Thr Thr Asp Lys Thr Asn Ile Val Ser Ala Leu Asn Glu
195 200 205
Val Lys Thr Ser Val Asp Ser Ile Glu Thr Thr Ala Glu Lys Thr Ser
210 215 220
Tyr Asn Asn Ala Thr Ser Lys Leu Thr Ala Thr Thr Val Gln Gly Ala
225 230 235 240
Ile Asp Glu Val Val Ala Lys Ile Glu Asn Phe Asn Glu Val Asn Ile
245 250 255
Ser Ile Gln Asn Asp Met Leu Pro Ile
260 265
<210> 112
<211> 565
<212> PRT
<213> Clostridium difficile
<400> 112
Met Thr Thr Glu Trp Asn Phe Asn Tyr Ile Gly Thr Gly Lys Lys Val
1 5 10 15
Ile Leu Lys Pro Gly Lys Tyr Lys Leu Glu Cys Trp Gly Ala Ser Gly
20 25 30
Gly Gly Arg Phe Asp Glu Trp Thr Glu Cys Ala Lys Gly Gly Tyr Ser
35 40 45
Lys Gly Glu Leu Thr Leu Lys Lys Glu Thr Ile Leu Tyr Val Tyr Ala
50 55 60
Gly Glu Ser Gly Tyr Lys Lys Phe Ser Asn Ile Ser Asp Trp Ala Gly
65 70 75 80
Phe Asn Gly Gly Gly Arg Gly Pro Asn Glu Gly Val Asp Pro Lys Phe
85 90 95
Thr Thr Cys Gly Gly Gly Ala Thr Asp Ile Arg Leu Ile Gly Gly Val
100 105 110
Trp Asn Asp Glu Gln Gly Leu Leu Ser Arg Ile Ile Val Ala Gly Gly
115 120 125
Gly Gly Ser Ile Gly Thr Ser Ser Phe Ser Ser Ile Gly Leu Gly Gly
130 135 140
Gly Phe Ala Gly Gly Met Gly Val Gly Ala Gly Thr Thr Cys Thr Gly
145 150 155 160
Gly Thr Gln Tyr Glu Gly Gly Val Thr Val Asn Ser Asn Gly Asn Gly
165 170 175
Ser Phe Gly Lys Gly Gly Ile Gly Asn Val Cys Ala Gly Gly Gly Gly
180 185 190
Trp Tyr Gly Gly Ala Gly Ala Ser Ser Ser Gly Val Gly Gly Gly Gly
195 200 205
Ser Gly Tyr Val Leu Thr Lys Asp Ser Tyr Lys Pro Lys Gly Tyr Ile
210 215 220
Pro Thr Ser Glu Tyr Trp Leu Glu Asn Val Asn Ser Ile Ala Gly Asp
225 230 235 240
Asn Thr Ser Asn Ala His Gly Tyr Ala Lys Ile Thr Leu Leu Gln Ala
245 250 255
Leu Pro Phe Leu Asn Ile Ser Ser Tyr Asn Ser Ser Thr Ala Thr Phe
260 265 270
Lys Ala Asp His Thr Asp Pro Thr Leu Leu Thr Lys Ile Glu Tyr Phe
275 280 285
Ile Asp Asp Val Leu Lys Glu Thr Ile Thr Thr Asp Leu Thr Leu Glu
290 295 300
Lys Thr Ile Asn Tyr Thr Leu Glu Asp Asn Ala Leu His Thr Leu Lys
305 310 315 320
Ile Val Val Thr Asp Ser Ala Asn Ala Thr Val Glu Lys Val Val Ser
325 330 335
Val Ser Arg Gly Ile Ala Pro Leu Pro Ser Gly Ser Thr Thr Asp Glu
340 345 350
Val Thr Asn Lys Trp Ile Glu Ile Lys Asp Ala Phe Lys Thr Gly Lys
355 360 365
Thr Ser Ile Ile Asn Thr Leu Ala Leu Lys Asn Ile Glu Ala Asn Leu
370 375 380
Asn Asn Thr Leu Val Glu Leu Ser Glu Lys Ile Lys Thr Ser Phe Asp
385 390 395 400
Ser Ser Asp Ala Ser Val Gln Asp Leu Met Asn Gln Leu Thr Glu Lys
405 410 415
Asn Asn Ile Ile Ser Gln Leu Asn Ala Lys Tyr Lys Ile Ala His Gly
420 425 430
Thr Thr Ser Ile Ile Gln Asn Ser Leu Trp Ser Ala Tyr Leu Tyr Asp
435 440 445
Ser Asn His Asn Asn Asn Tyr Glu Arg Gln Pro Lys Thr Trp Ile Gly
450 455 460
Val Glu Gly Leu Asn Phe Val Pro Asn Leu Phe Phe Ala Glu Cys Glu
465 470 475 480
Tyr Lys Asp Ser Ser Ser Val Tyr Tyr Lys His Phe Val Phe Gly Thr
485 490 495
Ser Gly Ile Pro Ser Ile Ser Gly Glu Thr Asp Phe Val Val Thr Ser
500 505 510
Lys Phe Arg Lys Pro Tyr Gly Asn Gln Asn Tyr Ser Ala Phe Gly Gln
515 520 525
Ala Tyr Lys Ser Asn Lys Gly Ser Ile Trp Ile Glu Asn Asn Thr Tyr
530 535 540
Val Pro Ala Ile Ile Pro Glu Ile Asp Gly Val Leu Tyr Asn Trp Tyr
545 550 555 560
Ala Ile Lys Phe Ile
565
<210> 113
<211> 97
<212> PRT
<213> Clostridium difficile
<400> 113
Met Asn Val Pro Asn Arg Ile Ile Tyr Asp Gln Thr Gly Arg Thr Ile
1 5 10 15
Phe Glu Thr Gly Glu Ser Cys Gly Asp Val Leu Pro His Tyr Thr Ile
20 25 30
Thr Glu Leu His Tyr Ile Asp Ile Glu Tyr Gly Ser Ile Asp Tyr Thr
35 40 45
Arg Asn Arg Val Ile Gly Ile Asn Ile Glu Thr Lys Glu Pro Ile Leu
50 55 60
Glu Glu Ile Pro Val Tyr Ile Thr Asp Glu Glu Lys Arg Ile Gln Glu
65 70 75 80
Leu Glu Asn Gln Leu Leu Ile Ala Glu Asn Glu Lys Val Gly Gly Leu
85 90 95
Leu
<210> 114
<211> 60
<212> PRT
<213> Clostridium difficile
<400> 114
Met Asn Ile Asn Asn Val Val Val Arg Ile Leu Ala Glu Arg Ile Leu
1 5 10 15
Ser Lys Gly Leu Asn Pro Leu Lys Asn Arg Glu Phe Gln Leu Asp Asp
20 25 30
Val Thr Asn Thr Glu Tyr Arg Lys Ala Val Glu Asp Tyr Ile Ile Lys
35 40 45
Asn Ser Gly Val Val Glu Gly Ala Glu Pro Thr Ile
50 55 60
<210> 115
<211> 265
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 115
Leu Glu Glu Lys Phe Tyr Ile Ile Leu Thr Lys Ile Gly Arg Glu Lys
1 5 10 15
Ile Ala Asn Ala Thr Ala Leu Gly Glu Leu Val Gly Leu Thr Lys Phe
20 25 30
Gln Val Gly Asp Ser Asn Gly Glu Tyr Tyr Glu Pro Thr Glu Glu Gln
35 40 45
Thr Ala Leu Lys Asn Val Val Trp Glu Gly Asn Ile Asn Ser Leu Arg
50 55 60
Ile Asp Glu Lys Asn Pro Asn Trp Ile Val Ile Glu Thr Ile Leu Pro
65 70 75 80
Gly Thr Val Gly Gly Phe Met Ile Arg Glu Ala Ala Val Leu Asp Asn
85 90 95
Glu Asn Asn Ile Ile Ala Ile Gly Lys Tyr Pro Glu Thr Tyr Lys Pro
100 105 110
Arg Ala Glu Asp Gly Ser Ile Lys Asp Leu Val Val Lys Met Ile Leu
115 120 125
Gln Leu Ser Asn Thr Ser Asn Val Thr Leu Glu Val Asp Pro Thr Leu
130 135 140
Val Phe Val Thr Gln Lys Asp Ile Gln Asp Leu Glu Thr Lys Ile Gly
145 150 155 160
Thr Val Asn Thr Lys Ile Asp Thr Thr Lys Thr Glu Leu Thr Ser Asn
165 170 175
Ile Glu Thr Ala Lys Thr Glu Ile Asp Glu Lys Ile Gly Asp Thr Thr
180 185 190
Gln Leu Thr Thr Thr Asp Lys Thr Asn Ile Val Gly Ala Leu Asn Glu
195 200 205
Val Lys Thr Ser Val Asp Ser Ile Glu Thr Thr Ala Glu Lys Thr Ser
210 215 220
Tyr Asn Asn Ala Thr Ser Asn Leu Ala Ala Thr Asn Val Gln Gly Ala
225 230 235 240
Ile Asp Glu Val Val Arg Lys Ile Glu Lys Phe Asn Glu Val Asn Ile
245 250 255
Ser Ile Gln Asn Asp Met Leu Pro Ile
260 265
<210> 116
<211> 426
<212> PRT
<213> Clostridium difficile
<400> 116
Met Gln Ser Glu Trp Asn Phe Asp Tyr Thr Gly Ala Glu Gln Asn Val
1 5 10 15
Thr Leu Lys Pro Gly Lys Tyr Lys Leu Glu Cys Trp Gly Ala Cys Gly
20 25 30
Gly Gly Trp Phe Ser Glu Trp Thr Lys Gly Ala Lys Gly Gly Tyr Ser
35 40 45
Lys Ala Glu Leu Thr Leu Lys Lys Glu Thr Ile Leu Tyr Val Tyr Ala
50 55 60
Gly Glu Thr Gly Cys Gln Lys Phe Glu Asn Ser Ile Asn Asn Trp Thr
65 70 75 80
Gly Phe Asn Gly Gly Gly Arg Gly Thr Asn Ala Gly Ala Asp Pro Lys
85 90 95
Phe Ile Leu Cys Gly Gly Gly Ala Thr Asp Ile Arg Leu Ile Arg Gly
100 105 110
Ser Trp Ser Asn Glu Gln Gly Leu Leu Ser Arg Ile Leu Val Ala Gly
115 120 125
Gly Ala Gly Ala Ile Ser Ser Ser Asp Tyr Gly Val Gly Asn Gly Gly
130 135 140
Gly Met Glu Gly Ser Lys Gly Phe Asp Gly Ser Asn Ala Phe Val Thr
145 150 155 160
Gly Gly Thr Gln Tyr Gln Gly Gly Ile Gly Leu Glu Asp Lys Tyr Asn
165 170 175
Gly Ser Phe Gly Arg Ala Ser Ser Thr Gly Thr Gly Gln Gly Gly Gly
180 185 190
Gly Gly Trp Phe Gly Gly Ala Gly Gly Leu Asn Tyr Asn Ala Ala Gly
195 200 205
Gly Ser Gly Tyr Ala Leu Thr Lys Asp Ser Tyr Lys Pro Pro Gly Tyr
210 215 220
Ile Pro Thr Ser Lys Tyr Tyr Leu Asp Asn Val Val Met Thr Thr Gly
225 230 235 240
Gly Asn Thr Thr Lys Ala Asp Gly Tyr Ala Lys Ile Thr Leu Leu Gln
245 250 255
Ala Leu Pro Phe Leu Thr Val Ser Ser Tyr Asn Ser Thr Thr Ala Thr
260 265 270
Phe Lys Ala Asp His Thr Asp Pro Thr Leu Leu Thr Lys Ile Glu Trp
275 280 285
Phe Ile Asp Glu Lys Leu Lys Glu Thr Ile Thr Ser Lys Leu Thr Ile
290 295 300
Glu Lys Thr Ile Asn Tyr Thr Leu Glu Asp Asn Ala Leu His Thr Ile
305 310 315 320
Lys Ile Val Val Thr Asp Ser Ser Asn Ala Thr Ala Glu Arg Ile Phe
325 330 335
Thr Val Ser Lys Gly Ile Ala Pro Leu Pro Thr Gly Ser Ser Ser Glu
340 345 350
Glu Val Thr Asn Lys Trp Arg Glu Ile Lys Asp Ser Phe Lys Thr Gly
355 360 365
Lys Thr Ser Ile Ile Asn Thr Leu Ala Leu Lys Asn Ile Glu Ser Asn
370 375 380
Leu Asn Asn Thr Leu Val Glu Leu Ser Glu Lys Ile Lys Gln Ser Phe
385 390 395 400
Asp Ser Ser Asp Ala Ser Val Gln Glu Leu Glu Asn Gln Ile Leu Leu
405 410 415
Asn Glu Asn Glu Lys Val Gly Gly Ile Leu
420 425
<210> 117
<211> 60
<212> PRT
<213> Clostridium difficile
<400> 117
Met Asn Ile Asn Asn Val Val Val Arg Ile Leu Ala Glu Arg Ile Leu
1 5 10 15
Asn Gly Gly Leu Asn Pro Leu Lys Asn Arg Glu Phe Gln Leu Asp Asp
20 25 30
Val Thr Asn Ile Gly Tyr Arg Lys Ala Val Glu Asp Tyr Ile Ile Glu
35 40 45
His Ser Gly Val Val Glu Gly Ala Glu Pro Thr Lys
50 55 60
<210> 118
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 118
ttctaaacaa catggtatct gg 22
<210> 119
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 119
aacagtacct attttagttt ctaagtcttg aatatccttt tgagttacaa 50
<210> 120
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 120
ggtttttgta actcaaaagg atattcaaga cttagaaact aaaataggta ctgtt 55
<210> 121
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 121
cgaatttaaa caattttcac acctccattt taaatatata ttttgtaagt taatgtagc 59
<210> 122
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 122
gctacattaa cttacaaaat atatatttaa aatggaggtg tgaaaattgt 50
<210> 123
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 123
atttccttac gcgaaatacg 20
<210> 124
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 124
aacagtacct attttagttt ctaagtcttg aatatccttt tgagttacaa 50
<210> 125
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 125
cgttggtttt tgtaactcaa aaggatattc aagacttaga aactaaaata ggtactgtta 60
<210> 126
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 126
tcgaatttaa acaattttca cacctccatt ttatttaaat tttgccgcat 50
<210> 127
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 127
tataaatggc atgcggcaaa atttaaataa aatggaggtg tgaaaattgt 50
<210> 128
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 128
tccttcggcg cgcctcaaat ttaagcttaa ctcc 34
<210> 129
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 129
agttgtatca attttagtgt ctaattcttg aatatccttt tgagttacaa 50
<210> 130
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 130
tggtttttgt aactcaaaag gatattcaag aattagacac taaaattgat acaac 55
<210> 131
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 131
tttaaacaat tttcacacct ccattttata caaattttat agcataccaa 50
<210> 132
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 132
tacaattggt atgctataaa atttgtataa aatggaggtg tgaaaattgt 50
<210> 133
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 133
agttgtatca attttagagt ctaggtcttg aatatccttt tgagttacaa 50
<210> 134
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 134
ttttgtaact caaaaggata ttcaagacct agactctaaa attgatacaa 50
<210> 135
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 135
atcgaattta aacaattttc acacctccat tttaattatt taaaaattct atatctaacg 60
<210> 136
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 136
gcgttagata tagaattttt aaataattaa aatggaggtg tgaaaattgt 50
<210> 137
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 137
tctggaaata atctagaact ttcgaagata tatctagaac tttcaaagat g 51
<210> 138
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 138
gcttatttta gcatctaaat cttgaatatc cttttgagtt aca 43
<210> 139
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 139
taactcaaaa ggatattcaa gatttagatg ctaaaataag ca 42
<210> 140
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 140
aattttcaca cctccatttt aaataaattt aatagcatac catt 44
<210> 141
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 141
ggtatgctat taaatttatt taaaatggag gtgtgaaaat tgt 43
<210> 142
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 142
ggcgctcagg atccggcgcg cctcaaattt aagctt 36
<210> 143
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 143
gtacctattt tagtttctaa gtcttgaata tccttttgag ttaca 45
<210> 144
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 144
aactcaaaag gatattcaag acttagaaac taaaataggt actg 44
<210> 145
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 145
aattttcaca cctccatttt attcaaatgc ataccatg 38
<210> 146
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 146
tggtatgcat ttgaataaaa tggaggtgtg aaaattgt 38
<210> 147
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 147
tcaattttag tgtctaggtc ttgaatatcc ttttgagtta ca 42
<210> 148
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 148
taactcaaaa ggatattcaa gacctagaca ctaaaattga taca 44
<210> 149
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 149
aattttcaca cctccatttt atttaaattt tatagcatac cag 43
<210> 150
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 150
ggtatgctat aaaatttaaa taaaatggag gtgtgaaaat tgt 43
<210> 151
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 151
acctatttta gtttctaagt cttgaatatc cttttgagtt aca 43
<210> 152
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 152
attttcacac ctccatttta tatgaatttt atagcatacc aa 42
<210> 153
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 153
ggtatgctat aaaattcata taaaatggag gtgtgaaaat tgt 43
<210> 154
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 154
tatcaatttt agcgtctaaa tcttgaatat ccttttgagt taca 44
<210> 155
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 155
actcaaaagg atattcaaga tttagacgct aaaattgata c 41
<210> 156
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 156
attttcacac ctccatttta aataaattta atagcatacc at 42
<210> 157
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 157
ggtatgctat taaatttatt taaaatggag gtgtgaaaat tgt 43
<210> 158
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 158
cctattttag tttccaattc ttgaatatcc ttttgagtta ca 42
<210> 159
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 159
actcaaaagg atattcaaga attggaaact aaaataggta c 41
<210> 160
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 160
attttcacac ctccatttta aataaatttt atagcatacc aat 43
<210> 161
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 161
ggtatgctat aaaatttatt taaaatggag gtgtgaaaat tgt 43
<210> 162
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 162
ggcgctcagg atccggcgcg ccctatatag ttggttctgc tcc 43
<210> 163
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 163
ggcgctcagg atccggcgcg cctcctttta ctactccact atgc 44
Claims (30)
- R-형 고분자량(hmw) 박테리오신을 인코딩하는 단리된 핵산분자로서,
상기 핵산분자는 클로스트리듐 디피실레의 제1 균주의 게놈으로부터의 것이며, 하기를 포함하는 핵산 분자:
서열번호: 66-77를 인코딩하는 제2 폴리뉴클레오타이드에 적어도 80% 동일한 제1 폴리뉴클레오타이드 서열, 상기 핵산분자는 C. 디피실레를 감염하는 박테리오파아지의 RBD 또는 C. 디피실레의 제2 균주의 게놈으로부터 프로파아지나 프로파아지 잔여물의 수용체 결합 도메인(RBD)을 인코딩하는 이종성 서열을 추가로 포함하고, 그리고
상기 R-형 hmw 박테리오신은 서열번호: 78의 폴리펩타이드에 적어도 80% 동일한 제1 기저판 부착 영역 (BPAR) 폴리펩타이드의 아미노 말단 부분의 적어도 50 인접 아미노산을 포함하고, 그리고
상기 R-형 hmw 박테리오신은 C. 디피실레의 적어도 하나의 균주에 대해 살균활성을 가지고; 그리고
상기 RBD에 동족인 제 2 BPAR의 적어도 C-말단부를 인코딩하는 제3 폴리뉴클레오타이드. - 청구항 1에 있어서, 상기 RBD는 서열번호: 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 및 116으로 이루어진 그룹으로부터 선택된 RBD에 적어도 80% 동일한 핵산분자.
- 청구항 1에 있어서, 상기 제3 폴리뉴클레오타이드는 RBD의 전장 동족 BPAR을 인코딩하는 핵산분자.
- 청구항 1에 있어서, 상기 RBD의 동족 BPAR을 인코딩하는 제3 폴리뉴클레오타이드는 핵산분자 안으로 삽입되어 RBD의 전장 동족 BPAR의 C-말단부가 제1 BPAR의 아미노-말단부에 융합된 핵산분자.
- 청구항 1에 있어서, 상기 RBD의 동족 BPAR의 C-말단부를 인코딩하는 제3 폴리뉴클레오타이드는 서열번호: 88, 91, 93, 95, 97, 99, 101, 103, 105, 107, 109, 111, 및 115로 이루어진 그룹으로부터 선택된 서열에 적어도 80% 동일한 BPAR을 인코딩하는 서열을 포함하는 핵산분자.
- 청구항 1에 있어서, RBD의 동족 차페론을 인코딩하는 제4 폴리뉴클레오타이드를 더 포함하는 핵산분자.
- 청구항 6에 있어서, 상기 동족 차페론은 서열번호: 89, 90, 113, 114, 및 117로 이루어진 그룹으로부터 선택된 핵산분자.
- 청구항 1의 핵산분자를 포함하는 발현 카세트.
- 청구항 8에 있어서, 상기 R-형 고분자량 (hmw) 박테리오신의 상기 발현은 유도성이거나 억제성인 발현 카세트.
- 청구항 9에 있어서, 상기 발현은 소분자 유발제 또는 탈-억제인자에 의해 유도된 발현 카세트.
- 청구항 10에 있어서, 상기 소분자 유발제 또는 탈-억제인자는 ROS의 발생자나 반응성 산소종(ROS)인 발현 카세트.
- 청구항 11에 있어서, 상기 ROS는 인간 또는 기타 동물에 비독성인 퍼옥사이드인 발현 카세트.
- 청구항 12에 있어서, 상기 퍼옥사이드는 과산화수소인 발현 카세트.
- 청구항 1에 의해 인코딩된 R-형 hmw 박테리오신.
- 청구항 14에 있어서, 상기 박테리오신은 동물에 경구로 투여될 수 있고 그리고 여전히 살균활성을 나타내는 형태로 배설물 중에 배출될 수 있는 R-형 hmw 박테리오신.
- 청구항 14에 있어서, 상기 박테리오신은 25 ℃에서 30분 동안 pH 2.5 내지 10 사이에서 인큐베이션 후 살균활성을 보유하는 R-형 hmw 박테리오신.
- 청구항 14에 있어서, 상기 박테리오신은 45 ℃에서 30분 동안 인큐베이션 후 살균활성을 보유하는 R-형 hmw 박테리오신.
- 유도성 프로모터에 작동가능하게 연결된 청구항 1에 따른 핵산분자를 포함하는 생산자 세포를, R-형 hmw 박테리오신의 발현을 유도하기에 효과적인 농도로 유도제에 노출하고, 이렇게 함으로써 R-형 hmw 박테리오신을 생산하는 것을 포함하는, R-형 hmw 박테리오신을 생산하는 방법.
- 청구항 18에 있어서, 상기 R-형 hmw 박테리오신을 인코딩하는 상기 핵산분자는 상기 생산자 세포의 게놈에 이종성이고 그리고 상기 핵산분자는 생산자 세포의 염색체 내에 함유되거나 생산자 세포 내의 염색체외 발현 벡터에 함유되는 방법.
- 청구항 18에 있어서, 상기 생산자 세포는 비-병원성이고 편성 혐기성 박테리움이 아닌 방법.
- 청구항 20에 있어서, 상기 비-병원성이고 편성 혐기성 박테리움이 아닌 것은 바실러스 , 락토바실러스, 락토구균 , 및 리스테리아로 이루어진 그룹으로부터 선택된 박테리아의 속으로부터의 종인 방법.
- 청구항 21에 있어서, 상기 종은 바실러스 서브틸리스인 방법.
- 청구항 22에 있어서, 상기 B. 서브틸리스는 R-형 hmw 박테리오신을 생산하기 위해 유도될 때 융해되지 않는 방법.
- 병원체 C. 디피실레를 청구항 14의 효과적인 양의 R-형 hmw 박테리오신과 접촉하는 것을 포함하고, 이로써 R-형 hmw 박테리오신이 병원체 C. 디피실레에 결합하여 사멸하는 것인, 클로스트리듐 디피실레를 사멸하는 방법.
- 청구항 24에 있어서, 상기 클로스트리듐 디피실레는 동물 내에 존재하고 그리고 R-형 hmw 박테리오신의 살균양을 동물에 투여하는 방법.
- 청구항 25에 있어서, 상기 동물은 포유동물인 방법.
- 청구항 26에 있어서, 상기 포유동물은 인간인 방법.
- 박테리오신의 살균양을 생성하는 양의 청구항 1에 따른 핵산분자를 포함하는 생산자 세포를 감염의 치료를 필요로 하는 동물에 투여하는 것을 포함하여, 그렇게 함으로써 감염을 치료하는 것인, 동물에 있어서 클로스트리듐 디피실레의 감염을 치료하는 방법.
- 청구항 14의 R-형 hmw 박테리오신 및 약제학적으로 허용가능한 담체를 포함하는 조성물.
- 청구항 1에 있어서, 상기 RBD는 C. 디피실레의 제2 균주를 감염하는 박테리오파아지로부터의 것인 핵산분자.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13/829,725 US9115354B2 (en) | 2010-05-27 | 2013-03-14 | Diffocins and methods of use thereof |
US13/829,725 | 2013-03-14 | ||
PCT/US2014/024138 WO2014159550A1 (en) | 2013-03-14 | 2014-03-12 | Diffocins and methods of use thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20150127266A true KR20150127266A (ko) | 2015-11-16 |
Family
ID=50680121
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020157028954A KR20150127266A (ko) | 2013-03-14 | 2014-03-12 | 디포신류 및 이들의 사용 방법 |
Country Status (8)
Country | Link |
---|---|
EP (1) | EP2970401A1 (ko) |
JP (1) | JP2016512428A (ko) |
KR (1) | KR20150127266A (ko) |
CN (1) | CN105473608A (ko) |
AU (1) | AU2014240427A1 (ko) |
BR (1) | BR112015022157A8 (ko) |
CA (1) | CA2903499A1 (ko) |
WO (1) | WO2014159550A1 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA3178705A1 (en) * | 2020-04-07 | 2021-10-14 | Pylum Biosciences, Inc. | Enterocins and methods of using the same |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5985823A (en) * | 1997-06-09 | 1999-11-16 | Ambi Inc. | Method for the treatment of diarrheal disease and for eliminating particular bacterial populations from the colon |
EP1773995B1 (en) | 2004-08-03 | 2009-10-07 | The Regents Of The University Of California | Site specific system for generating diversity protein sequences |
KR101955171B1 (ko) * | 2010-05-27 | 2019-03-06 | 사이포스 바이오사이언시스 인코포레이티드 | 디포신 및 그의 사용 방법 |
-
2014
- 2014-03-12 JP JP2016501427A patent/JP2016512428A/ja not_active Withdrawn
- 2014-03-12 CN CN201480027828.4A patent/CN105473608A/zh active Pending
- 2014-03-12 CA CA2903499A patent/CA2903499A1/en not_active Abandoned
- 2014-03-12 KR KR1020157028954A patent/KR20150127266A/ko not_active Application Discontinuation
- 2014-03-12 BR BR112015022157A patent/BR112015022157A8/pt not_active Application Discontinuation
- 2014-03-12 WO PCT/US2014/024138 patent/WO2014159550A1/en active Application Filing
- 2014-03-12 AU AU2014240427A patent/AU2014240427A1/en not_active Abandoned
- 2014-03-12 EP EP14722414.1A patent/EP2970401A1/en not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
WO2014159550A1 (en) | 2014-10-02 |
BR112015022157A2 (pt) | 2017-11-21 |
AU2014240427A1 (en) | 2015-09-17 |
EP2970401A1 (en) | 2016-01-20 |
JP2016512428A (ja) | 2016-04-28 |
CN105473608A (zh) | 2016-04-06 |
CA2903499A1 (en) | 2014-10-02 |
BR112015022157A8 (pt) | 2018-01-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DK2200442T3 (en) | Bacteriophage lytic OR PROTEIN DERIVED FROM bacteriophage WHICH IS EFFECTIVE FOR THE TREATMENT OF Staphylococcus aureus biofilms | |
KR101592177B1 (ko) | 대장균에 대한 광범위 항균 활성을 갖는 박테리오파지를 활용한 대장균 감염을 방지 및 처치하는 방법 | |
CN110691603A (zh) | 包含呼吸道抗菌噬菌体的噬菌体组合物及其使用方法 | |
KR20140117433A (ko) | 재조합 독소를 포함하는, 클로스트리디움 디피실레에 대한 백신 | |
DK2847323T3 (en) | Bacteriophage for biological control of Salmonella and in the preparation or processing of food | |
PH12015501888B1 (en) | Novel bacteriophage and antibacterial composition comprising the same | |
KR102073095B1 (ko) | 대장균 박테리오파지 Esc-COP-14 및 이의 병원성 대장균 증식 억제 용도 | |
DK2576604T3 (en) | DIFFOCINES AND METHODS OF USING THEREOF | |
KR20130028275A (ko) | 살모넬라 티피무륨 감염을 방지 및 처치하는 방법 | |
KR101587113B1 (ko) | 치주염 유발 장알균(Enterococcus faecalis)을 특이적으로 사멸시키는 신규한 박테리오파지 | |
KR102016922B1 (ko) | 신규한 병원성 대장균 특이 박테리오파지 ec10 및 이를 포함하는 항균 조성물 | |
KR20150127266A (ko) | 디포신류 및 이들의 사용 방법 | |
KR102016919B1 (ko) | 신규한 살모넬라균 특이 박테리오파지 sc1 및 이를 포함하는 항균 조성물 | |
KR102125235B1 (ko) | 닭 대장균 예방 및 치료를 위한 신규 박테리오파지 및 이를 이용한 항균조성물 | |
US9115354B2 (en) | Diffocins and methods of use thereof | |
KR102269089B1 (ko) | 항생제 내성을 갖는 아시네토박터 속의 균을 용균하는 신규한 박테리오파지 | |
KR101993124B1 (ko) | 신규한 살모넬라균 특이 박테리오파지 sg1 및 이를 포함하는 항균 조성물 | |
KR101871347B1 (ko) | 신규한 병원성 대장균 특이 박테리오파지 ec121 및 이를 포함하는 항균 조성물 | |
KR102003759B1 (ko) | 신규한 살모넬라균 특이 박테리오파지 sh9 및 이를 포함하는 항균 조성물 | |
KR20230127664A (ko) | 살모넬라 사멸능을 갖는 박테리오파지 및 이의 용도 | |
Class et al. | Patent application title: DIFFOCIN AND METHODS OF USE THEREOF Inventors: Dean M. Scholl (Burlingame, CA, US) Dana M. Gebhart (San Francisco, CA, US) Steven R. Williams (San Francisco, CA, US) Gregory R. Govoni (San Carlos, CA, US) David W. Martin, Jr.(Mill Valley, CA, US) Assignees: AvidBiotics Corp. | |
Mahmoud | Identification of Enterococcus faecium genes involved in resistance to oxidative stress and virulence | |
Morris et al. | 2. Novel regulatory logic in the antibiotic resistance response of Enterococcus faecalis against cell envelope targeting antibiotics | |
Goralski | Ribosome Rescue Is Essential in the Pathogen Francisella tularensis | |
KR20230159560A (ko) | 장독소원성 박테로이데스 프라길리스의 증식을 억제하기 위한 조성물 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
WITN | Withdrawal due to no request for examination |