KR20050050146A - 글리코펩티드 항생제 a40926의 생합성을 위한 유전자및 단백질 - Google Patents

글리코펩티드 항생제 a40926의 생합성을 위한 유전자및 단백질 Download PDF

Info

Publication number
KR20050050146A
KR20050050146A KR1020057007012A KR20057007012A KR20050050146A KR 20050050146 A KR20050050146 A KR 20050050146A KR 1020057007012 A KR1020057007012 A KR 1020057007012A KR 20057007012 A KR20057007012 A KR 20057007012A KR 20050050146 A KR20050050146 A KR 20050050146A
Authority
KR
South Korea
Prior art keywords
ala
leu
val
gly
arg
Prior art date
Application number
KR1020057007012A
Other languages
English (en)
Inventor
스테파노 도나디오
마르게리따 소지오
파브리지오 벨뜨라멧띠
Original Assignee
비큐론 파마세티컬스 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 비큐론 파마세티컬스 인코포레이티드 filed Critical 비큐론 파마세티컬스 인코포레이티드
Publication of KR20050050146A publication Critical patent/KR20050050146A/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/36Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Actinomyces; from Streptomyces (G)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/04Antibacterial agents
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P1/00Preparation of compounds or compositions, not provided for in groups C12P3/00 - C12P39/00, by using microorganisms or enzymes
    • C12P1/06Preparation of compounds or compositions, not provided for in groups C12P3/00 - C12P39/00, by using microorganisms or enzymes by using actinomycetales

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Chemical & Material Sciences (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Microbiology (AREA)
  • Communicable Diseases (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Oncology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Mycology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)

Abstract

본 발명은 항생제 분야, 더욱 구체적으로는 글리코펩티드 항생제 A40926의 생합성 경로를 코딩하는 핵산 분자의 단리에 관한 것이다. A40926 생산에 관여하는 유전자 산물의 기능이 개시된다. 본 발명은 A40926 생산을 코딩하는 신규 생합성 유전자, 코딩되는 폴리펩티드, 상기 폴리펩티드를 코딩하는 핵산 서열을 포함하는 재조합 벡터, 상기 벡터로 형질전환된 숙주 세포 및 A40926, 그의 전구체, 그의 유도체, 또는 A40926 또는 그의 전구체와는 상이한 변형된 글리코펩티드의 생산 방법을 포함하는, 상기 형질전환된 숙주 세포를 이용하는 글리코펩티드 항생제의 생산 방법을 제공한다.

Description

글리코펩티드 항생제 A40926의 생합성을 위한 유전자 및 단백질 {GENES AND PROTEINS FOR THE BIOSYNTHESIS OF THE GLYCOPEPTIDE ANTIBIOTIC A40926}
방선균류는, 대다수가 상업적 용도(예컨대, 항생제)를 가지는, 구조적으로 다양하고 생물학적으로 활성인 이차 대사산물을 생산하는 능력으로 공지되어 있다. 중요한 대사산물은 (가장 상세히 연구된) 스트렙토마이세스(Streptomyces) 종에 의해 생산될 뿐만 아니라, 보다 덜 공지된 방선균 속에 의해서도 생산된다: 예컨대, 리파마이신, 테이코플라닌 및 에리트로마이신은 각기 아미콜라토프시스(Amycolatopsis), 악티노플라네스(Actinoplanes)사카로폴리스포라(Saccharopolyspora) 종에 의해 현재 산업적으로 생산된다. 이차 대사산물의 생합성을 지배하는 유전 요소는 대사산물의 합성, 조절 및 저항을 위해 필요한 모든 유전자를 포함하는 유전자 클러스터에서 조직화된다.
많은 상이한 이차 대사산물은 유사한 효소가 개입되는 통상의 생합성 루트를 공유한다. 이는 폴리케티드 (Katz 및 McDaniel, 1999년), 리보솜에서 합성되지 않은 펩티드 (Marahiel, 1997년) 및 데옥시당 (Rodriguez 등, 2000년)에 대해 철저하게 문서에서 증명되었다. 그러나, 이 유사성에도 불구하고, 소정의 미생물에서 특별한 이차 대사산물의 합성에 관여하는 유전자 클러스터의 조직화는 선험적으로 정의될 수 없다. 사실상, 매우 유사한 이차 대사산물의 합성은, 특히 상응하는 생산자 균주가 동일한 속에 속하지 않을 때, 상이하게 조직화된 클러스트에 의해 지배될 수 있다. 이 종류의 예는 마크롤라이드 항생제들 (Katz 및 McDaniel, 1999년) 중에서 찾아볼 수 있다. 또한, 생산자 균주 내에서의 원하는 클러스트의 동정은 동일한 경로에 대해 효소를 특정하는 다수 클러스트의 발생에 의해 방선균류에서 복잡하다. 이는 폴리케티드 (예컨대, Ruan 등, 1997년) 및 펩티드 (예컨대, Sosio 등, 2000a년)에 대해 나타났고, 게놈 시퀀싱에 의해 확인되었다 (Omura 등, 2001년; Bentley 등, 2002년). 결과적으로, 이미 공지된 것들 대비의 신규 클러스터의 동일성 정도, 조직화 또는 뉴클레오티드 서열은 선험적으로 알 수 없다.
작용 메카니즘으로 인해 달바헵티드(dalbaheptide)로도 알려진 글리코펩티드는 (Parenti 및 Cavalleri, 1989년), 현재 임상적으로 사용되고 있는 반코마이신 및 테이코플라닌과 함께, 세균 세포벽의 가교결합을 간섭하는 한 중요한 계통의 항생제이다. 이는 종종 생명을 위협하는 감염을 치료함에 있어 최후에 선택되어지는 항생제이다. 한편, 장내구균(enterococci) 중에서의 글리코펩티드에 대한 내성 발생 및 이 높은 수준의 내성이 궁극적으로 메티실린-내성 스타필로코쿠스 아우레우스(Staphylococcus aureus)에서 넓게 퍼지게 될 수 있는 우려는 상기 부류의 2차-형성 약물에 대한 연구를 촉진하였다. 향상된 활성, 확장된 항세균 스펙트럼 또는 보다 양호한 약동학적 성질을 갖는 반합성 유도체의 개발로 (Malabarba 및 Ciabatti, 2001년), 유망되는 결과가 얻어졌다.
그러므로, 천연 발생 화합물의 조작에 의해 향상된 글리코펩티드를 수득할 가능성 및 유용성이 있다. 그러나, 글리코펩티드는 구조적으로 복잡한 분자이고, 그의 화학으로의 접근용이성이 분자 내의 수개 위치에 제한된다. 예를 들어, 당이 글리코펩티드로부터 화학적으로 용이하게 제거되어, 상응하는 아글리콘을 생성시킬 수 있는 반면, 화학적 수단에 의한 특별한 위치에의 상이한 당의 위치선택적 부착은 극히 어렵다. 글리코펩티드에서의 염소화 정도가 항생제 활성에 영향을 준다는 것이 나타났다. 유사하게, 글리코펩티드에서의 방향족 환의 화학적 탈염소화가 용이하게 달성될 수 있는 반면, 구조에서 원하는 환의 선택된 할로겐화는 비교적 복잡하다. 한 최종 예로서, 테이코플라닌 부류의 글리코펩티드는 위치 4에 있는 아릴아미노산에 부착된 글루코사민에 연결되어 있는 아실 사슬을 함유하는 반면, 반코마이신 계통의 화합물은 그러하지 않다. 글리코펩티드의 아실화 및 탈아실화는 화학적으로 또는 생물학적 변환기술에 의해 보고되어 왔으나 (Lancini 및 Cavalleri, 1997년), 이는 주로 총체적으로 낮은 수율을 초래한다. 상기 측면에서, 화학적 수단에 의해 생산되는 것이 어렵거나 불가능한 유도체를 수득하기 위해, 글리코펩티드 형성에 있어 상기 단계들을 재지정하는데 유용한 유전자 및 효소를 가지는 것이 바람직할 수 있다. 이는 염소화 정도가 글리코펩티드의 생물학적 활성에 영향을 준다는 것과, 글리코펩티드의 글리코실화 또는 아실화 패턴을 변경시킴으로써 향상된 유도체를 수득할 수 있다는 것으로 나타났기 때문에, 특히 적절하다 (Malabarba 및 Ciabatti, 2001년). 화학을 위한 주요 제한점들 중 하나는, 펩티드 골격 내에 존재하는 아미노산의 유형 또는 순서를 변화시키는 것이다. 화학적으로, 비교적 낮은 수율로 아미노산 1 및 3에 대해서만 개입하는 것이 가능한 것으로 나타났다 (Malabarba 등, 1997년). 이에 따라, 정확하게 공학처리된 균주를 이용한 발효 공정에 의해 직접적으로 신규 글리코펩티드 유도체를 고안하기 위한 일반적 방법이 매우 요망되게 된다.
유리한 대안책은 천연 발생 글리코펩티드의 생합성 공정의 공학처리에 의해 향상된 항생제를 생성시키는 것이다. 이 종류의 예들이 보고되었다. 실제로, 반코마이신 및 클로로에레모마이신 유전자 클러스터로부터의 글리코실트랜스퍼라제의 발현 후에, 글리코펩티드 아글리콘을 생체외 및 생체내의 양자 모두에서 선택적으로 글리코실화하는 것이 가능하였다 (Solenberg 등, 1997년; Loosey 등, 2001년). 그러나, 지금까지 기술된 효소들은 모두 원하는 위치에 글루코사민 잔기를 부착시킬 수 없었다. 유사하게, 발히마이신 생산자 A. 메디테라네이(A. mediterranei)에서의 선택된 유전자의 불활성화에 의해, 발히마이신 유도체가 수득되었다 (Pelzer 등, 1999년). 그러나, 테이코플라닌 부류의 글리코펩티드 생산 균주에 대한 상기와 같은 실험은 기재되지 않았다.
항생제 A40926는 글리코펩티드의 테이코플라닌 부류에 속한다 (Parenti 및 Cavalleri, 1989년). 이는 코어 구조가 아미노산 1-3, 2-4 및 4-6 간의 에테르 결합 및 아미노산 5-7 간의 C-C 결합에 의해 결정되는 강성 비계(scaffold)를 갖는 헵타펩티드 골격으로 재수행될 수 있는 밀접히 관련된 분자의 착체로 구성된다. 게다가, 2개의 당 잔기 및 2개의 염소 원자가 분자 상에 존재한다. A40926 착체의 성분의 구조는 하기 화학식으로 표시된다 (식 중, R은 주요성분으로서 인자 A1 (R = n-데실), 인자 B0 (R = 9-메틸데실) 및 인자 B1 (R = n-운데실)을 갖는 [C9-C12] 알킬을 나타냄).
이전에 악티노마두라(Actinomadura) 종 ATCC39727로 알려진 생산자 균주는 최근 노노무리아(Nonomuria) 종 ATCC39727로 재분류되었다 (Zhang 등, 1998년). 고유 항세균 활성을 나타내는 것 이외에도, A40926은 또한 반합성 글리코펩티드 달바반신 (이전에 BI397 또는 MDL 62397로도 알려짐; Malabarba 및 Ciabatti, 2001년)의 전구체이다. 그러므로, A40926의 구조를 조작하고, 그의 수율을 증가시키기 위한 부가적 툴이 매우 요망되게 된다. 그러나, 속 노노무리아로부터의 다른 원으로부터의 클러스터의 예가 없다. 그러므로, 노노무리아에서의 A40926 형성에 필요하고 그 형성을 조절하는 유전자가 또한 생산 공정의 최적화에 유용할 수 있다.
최근, 글리코펩티드 클로로에레모마이신 (van Wageningen 등, 1998년), 발히마이신 (Pelzer 등, 1999년), 콤플레스타틴 (Chiu 등, 2001년) 및 A47934 (Pootoolal 등, 2002년)의 형성에 관여하는 유전자 클러스터가 기재되었다. cep, bal, com sta로 각기 명명되는 이 클러스터는 아미콜라토프시스 오리엔탈리스(Amycolatopsis orientalis), 아미콜라토프시스 메디테라네이((Amycolatopsis mediterranei), 스트렙토마이세스 라벤둘라에(Streptomyces lavendulae) 스트렙토마이세스 토요카엔시스(Streptomyces toyocaensis)로부터 각기 수득되었다. 이 클러스터는 글리코펩티드 경로를 조작하는데 유용한 수개의 유전자를 제공하였다. 그러나, 일부 단계들은 기재된 클러스터로 수행될 수 없다. 예를 들어, 유용한 유전자 클러스터는 당의 산화 상태를 변경시킬 수 있는 기능, 지방산 사슬을 부착할 수 있는 기능, 또는 아미노산 3의 방향족 부분기에 염소 원자를 제공할 수 있는 기능을 코딩하지 않는다. 이 모든 기능들이 또한 본 발명에 기재되어 있다.
항생제 제조를 위한 산업적 공정 고안이 비교적 성공적이었고, 이에 따라 리터당 수그램(g)의 수준에 달하는 항생제 적정을 갖는 대량 발효를 가져왔다. 이는 하기 실험적 시행착오 접근법에 의해 대체로 달성되었고, 합리적 기초가 결여되어 있다. 이에 따라, 새로운 공정의 개발 및 현 기술의 향상이 여전히 시간 소비적이며, 불안정하고, 비일관적으로 수행하며, 원치 않는 부산물을 축적하는 한 세균 배양액을 초래할 수 있다. 근년, 당해 유전자 클러스터 내에 존재하는 핵심 조절 요소의 조작 또는 경로에서의 속도 제한 단계의 과도발현과 종종 관련되었던 스트렙토마이세스 종에 의해 생성되는 항생제의 수준을 증가시키기 위해 합리적 방법들이 성공적으로 적용되었다. 그러므로, 그러한 클러스터-연관 조절자를 코딩하는 유전자, 또는 합성에서의 제한 단계는 수율 향상을 위한 효과적인 툴이 될 수 있다. 그러나, 지금까지 방선균류에서 동정된 클러스터-연관 조절자는 수가지 상이한 단백질 부류에 속한다 (Chater 및 Bibb, 1997년). 심지어 하나의 부류 내에서도, 서열 동일성이 상당히 다양하다. 그러므로, 클러스터-연관 조절자의 존재, 성질, 수 및 서열은 다른 클러스터, 심지어는 관련 항생제를 특정하는 클러스터에 의해 예측될 수 없다. 한 예로서, 틸로신 유전자 클러스터는 4개의 구별된 조절자를 코딩하는 반면, 관련 마크롤라이드 항생제 에리트로마이신을 특정하는 클러스터에서는 그 어떤 것도 발견되지 않았다 (Bate 등, 1999년). 유사하게, 생합성 경로에서의 속도-제한 단계의 성질 및 이유가 선험적으로 구축될 수 없다.
발명의 요약
본 발명은 미생물에서의 글리코펩티드 A40926의 생합성에 필요한 한 세트의 단리된 폴리뉴클레오티드 분자를 제공한다. 본 발명의 한 형태에서, 폴리뉴클레오티드 분자는 노노무리아 종 ATCC39727로부터 단리된 dbv 유전자 클러스터를 나타내고, A40926 형성에 필요한 폴리펩티드를 코딩하는 37개 ORF로 구성되는 인접 DNA 서열 (서열 1)로부터 선택된다. 상기 37개 ORF에 의해 코딩되는 폴리펩티드의 아미노산 서열이 서열 2 내지 38에 제공된다.
본 발명은
a) A40926의 합성에 필요한 폴리펩티드를 코딩하는 dbv 유전자 클러스터 (서열 1);
b) dbv 유전자 클러스터 (서열 1)에 의해 코딩되는 것과 동일한 폴리펩티드를 코딩하지만 dbv 유전자 클러스터 자체의 뉴클레오티드 서열은 아닌 뉴클레오티드 서열;
c) 서열 2 내지 38의 폴리펩티드를 코딩하는 dbv ORF 1 내지 37의 임의의 뉴클레오티드 서열 및
d) dbv ORF 1 내지 37 (서열 2 내지 38) 중 임의의 것에 의해 코딩되는 것과 동일한 폴리펩티드를 코딩하지만 상기 ORF의 뉴클레오티드 서열은 아닌 뉴클레오티드 서열
로 구성되는 군으로부터 선택되는 뉴클레오티드 서열을 포함하는 단리된 핵산을 제공하는 것이다.
본 발명의 다른 목적은,
e) 서열 4 내지 5, 7 내지 11, 19 내지 21, 23 내지 24, 30 내지 31 및 37에 특정된 폴리펩티드를 코딩하는 dbv ORF 3 내지 4, 6 내지 10, 18 내지 20, 22 내지 23, 29 내지 30 및 36 중 임의의 것의 뉴클레오티드 서열;
f) dbv ORF 3 내지 4, 6 내지 10, 18 내지 20, 22 내지 23, 29 내지 30 및 36 (서열 4 내지 5, 7 내지 11, 19 내지 21, 23 내지 24, 30 내지 31 및 37) 중 임의의 것에 의해 코딩되는 것과 동일한 폴리펩티드를 코딩하지만 상기 ORF의 뉴클레오티드 서열은 아닌 뉴클레오티드 서열;
g) dbv ORF 3, 6 내지 9, 18 내지 20, 22 내지 23, 29 내지 30 및 36 (서열 4, 7 내지 10, 19 내지 21, 23 내지 24, 30 내지 31 및 37) 중 임의의 것에 의해 코딩되는 폴리펩티드와 아미노산 서열이 80% 이상, 바람직하게는 86% 이상, 더욱 바람직하게는 90% 이상, 가장 바람직하게는 95% 이상 동일한 폴리펩티드를 코딩하는 뉴클레오티드 서열 및
h) dbv ORF 4 및 10 (서열 5 및 11) 중 임의의 것에 의해 코딩되는 폴리펩티드와 아미노산 서열이 87% 이상, 바람직하게는 90% 이상, 더욱 바람직하게는 95% 이상 동일한 폴리펩티드를 코딩하는 뉴클레오티드 서열
로 구성된 군으로부터 선택되는 뉴클레오티드 서열을 포함하는 단리된 핵산을 제공하는 것이다.
한 실시양태에서, 본 발명의 단리된 핵산은 A40926의 4-히드록시-페닐글리신 (HPG) 잔기를 합성하는데 필요한 폴리펩티드를 코딩하는 ORF 1 내지 37 (서열 2 내지 38)로부터 선택되는 ORF의 조합을 포함한다. 또다른 실시양태에서, 핵산은 A40926의 3,5-디히드록시-페닐글리신(DPG) 잔기의 합성에 필요한 폴리펩티드를 코딩하는 ORF 1 내지 37 (서열 2 내지 38)로부터 선택되는 ORF의 조합을 포함한다. 또다른 실시양태에서, 핵산은 A40926의 헵타펩티드 골격의 합성에 필요한 폴리펩티드를 코딩하는 ORF 1 내지 37 (서열 2 내지 38)로부터 선택되는 ORF의 조합을 포함한다. 또다른 실시양태에 따라, 본 발명의 핵산에서, A40926의 아미노산 3 및 6의 방향족 잔기의 염소화에 필요한 폴리펩티드를 코딩하는 ORF 1 내지 37 (서열 2 내지 38)로부터 선택되는 ORF의 조합이 제공된다. 또다른 실시양태에 따라, 본 발명의 핵산에서, A40926의 아미노산 6의 티로신 잔기의 β-히드록실화에 필요한 폴리펩티드를 코딩하는 ORF 1 내지 37 (서열 2 내지 38)로부터 선택되는 ORF의 조합을 포함하는 핵산이 제공된다. 또다른 실시양태에 따라, A40926의 위치 2와 4, 4와 6, 1과 3 및 5와 7에 있는 아미노산의 방향족 잔기의 가교결합에 필요한 폴리펩티드를 코딩하는 ORF 1 내지 37 (서열 2 내지 38)로부터 선택되는 ORF의 조합을 포함하는 핵산이 제공된다. 또다른 실시양태에 따라, 본 발명의 핵산에서, N-아실글루쿠론아민 잔기의 첨가 및 형성에 필요한 폴리펩티드를 코딩하는 ORF 1 내지 37 (서열 2 내지 38)로부터 선택되는 ORF의 조합이 제공된다. 또다른 실시양태에 따라, 만노실 잔기의 부착에 필요한 폴리펩티드를 코딩하는 ORF 1 내지 37 (서열 2 내지 38)로부터 선택되는 ORF의 조합을 포함하는 핵산이 제공된다. 또다른 실시양태에 따라, A40926의 N-메틸화에 필요한 폴리펩티드를 코딩하는 ORF 1 내지 37 (서열 2 내지 38)로부터 선택되는 ORF의 조합을 포함하는 핵산이 제공된다. 또다른 실시양태에 따라, A40926의 외수송 및 A40926에 대한 내성에 필요한 폴리펩티드를 코딩하는 ORF 1 내지 37 (서열 2 내지 38)로부터 선택되는 ORF의 조합을 포함하는 핵산이 제공된다. 또다른 실시양태에서, dbv 유전자 클러스터의 발현을 조절하는데 필요한 폴리펩티드를 코딩하는 ORF 1 내지 37 (서열 2 내지 38)로부터 선택되는 ORF의 조합을 포함하는 핵산이 제공된다. 또다른 실시양태에서, ORF 1 내지 37 (서열 2 내지 38)로부터 선택되는 ORF의 발현 수준을 증진시키는, 서열 1로부터 선택되는 하나 이상의 DNA 세그먼트를 포함하는 핵산이 제공된다.
당업자는, A40926 생합성 경로의 폴리펩티드를 코딩하는 뉴클레오티드 서열을 제공하는 본 발명은 또한, 그러한 폴리펩티드로부터 유도되는 단편을 코딩하는 뉴클레오티드도 제공한다는 것을 이해한다. 부가적으로, 당업자는 유전 코드가 퇴화됨에 따라, 서열 2 내지 38에 특정된 동일한 폴리펩티드가 ORF 1 내지 37의 천연 또는 인공 변종체, 즉 동일한 폴리펩티드를 코딩하지만 ORF 1 내지 37에 의해 특정된 게놈 뉴클레오티드 서열은 아닌 뉴클레오티드 서열에 의해 코딩될 수 있다는 것을 이해한다. 또한, 서열 2 내지 38에 특정된 폴리펩티드의 자연 발생되거나 인공적으로 제조된 변종체로서, 상기 원래의 폴리펩티드와 동일한 기능(들)을 가지나, 폴딩 또는 촉매적 기능에 필수적이지 않은 아미노산의 첨가, 결실 또는 치환, 또는 필수 아미노산의 보존적 치환을 포함하는 변종체가 발생할 수 있다는 것을 이해한다.
당업자는 또한, A40926 생합성에 필요한 전체 클러스터의 뉴클레오티드 서열을 제공하는 본 발명은 또한 상기 클러스터에 존재하는 유전자의 발현에 필요한 뉴클레오티드 서열도 제공한다는 것을 이해한다. 그러한 조절 서열은 비제한적으로, 프로모터 및 인핸서 서열, 안티센스 서열, 전사 종결자 및 반종결자 서열을 포함한다. 이 서열은 dbv 유전자 클러스터에 존재하는 유전자의 발현을 조절하는데 유용하다. 단독이거나 다른 뉴클레오티드 서열에 융합된 상기 뉴클레오티드 서열을 담지하는 세포도 또한 본 발명의 범주 내에 포함된다.
한 측면에서, 본 발명은 N-아실-글루코사민 잔기를 글리코펩티드 항생제 전구체의 코어 구조에 부착시키는데 유용한, ORF9 폴리펩티드 (서열 10), 또는 상기 폴리펩티드의 천연 발생 변종체 또는 유도체를 코딩하는 뉴클레오티드 서열을 포함하는 단리된 핵산을 제공한다. 또다른 측면에서, 본 발명은 지방산 잔기를 글리코펩티드 항생제 전구체의 코어 구조에 부착시키는데 유용한, ORF23 폴리펩티드 (서열 24), 또는 상기 폴리펩티드의 천연 발생 변종체 또는 유도체를 코딩하는 뉴클레오티드 서열을 포함하는 핵산을 제공한다. 또다른 측면에서, 본 발명은 글리코펩티드 항생제 전구체에 부착된 당 부분기의 산화에 유용한 ORF29 폴리펩티드 (서열 30), 또는 상기 폴리펩티드의 천연 발생 변종체 또는 유도체를 코딩하는 뉴클레오티드 서열을 포함하는 핵산을 제공한다. 또다른 측면에서, 본 발명은 코어 글리코펩티드 항생제 전구체에서의 b-히드록시티로신 및 DPG 잔기의 염소화에 유용한 ORF10 폴리펩티드 (서열 11), 또는 상기 폴리펩티드의 천연 발생 변종체 또는 유도체를 코딩하는 뉴클레오티드 서열을 포함하는 핵산을 제공한다. 또다른 측면에서, 본 발명은 만노실 잔기를 글리코펩티드 항생제 전구체의 코어 구조에 부착시키는데 유용한 ORF20 폴리펩티드 (서열 21), 또는 상기 폴리펩티드의 천연 발생 변종체 또는 유도체를 코딩하는 뉴클레오티드 서열을 포함하는 핵산을 제공한다.
또다른 측면에서, 본 발명은 글리코펩티드 항생제 또는 글리코펩티드 항생제 전구체의 세포로부터의 외수송 및 내성 부여에 유용한 ORF 7, 18, 19, 24 및 35 (서열 8, 19, 20, 25 및 36)에 의해 코딩되는 폴리펩티드, 또는 상기 폴리펩티드의 천연 발생 또는 인공 발생 변종체 또는 유도체를 코딩하는 뉴클레오티드 서열을 포함하는 핵산을 제공한다. 또다른 측면에서, 본 발명은 생산 균주에 대한 내성을 글리코펩티드 항생제 또는 글리코펩티드 항생제 전구체에 부여하는데 유용한 ORF7 폴리펩티드 (서열 8), 또는 상기 폴리펩티드의 천연 발생 또는 인공 발생 변종체 또는 유도체를 코딩하는 뉴클레오티드 서열을 포함하는 핵산을 제공한다. 또다른 측면에서, 본 발명은 글리코펩티드 항생제 전구체의 수율을 증가시키는데 유용한, ORF 3, 4, 6, 22 및 36 폴리펩티드 (서열 4, 5, 7, 23 및 37), 또는 상기 폴리펩티드의 천연 발생 또는 인공 발생 변종체 또는 유도체를 코딩하는 뉴클레오티드 서열을 포함하는 핵산을 제공한다.
한 실시양태에서, 본 발명은 ORF 1 내지 37 (서열 2 내지 38) 중 임의의 것으로부터 선택된 하나 이상의 ORF를 특정하는 뉴클레오티드 서열의 여분 카피(extra copy)를 담지하는 글리코펩티드 생산 균주를 제공한다. 한 바람직한 실시양태에서, 그러한 글리코펩티드 생산 균주는 목 악티노마이세탈레스(Actinomycetales)에 속하는 임의의 균주이다. 다른 한 바람직한 실시양태에서, 그러한 글리코펩티드 생산 균주는 속 노노무리아의 한 원이다. 한 추가적 측면에서, 본 발명은 ORF 1 내지 37 (서열 2 내지 38) 중 하나 이상의 증가 또는 감소된 발현을 초래하는, 서열 1에 특정된 뉴클레오티드 서열에서의 하나 이상의 변형을 갖는 노노무리아 균주를 제공한다.
한 바람직한 실시양태에서, 본 발명은 A40926, 그의 전구체 중 하나 이상 또는 또다른 세포에 의한 그의 유도체의 제조에 유용한, 하나 이상의 벡터에 담지된 서열 1에 의해 특정된 뉴클레오티드 서열 또는 그의 일부분을 포함하는 핵산을 제공한다. 한 바람직한 실시양태에서, 상기 뉴클레오티드 서열 또는 그의 부분은 단일 벡터에 담지된다. 또다른 바람직한 실시양태에서, 그러한 벡터는 세균 인공 염색체이다. 또다른 측면에서, 상기 세균 인공 염색체는 (W099/63674에 기재된 바와 같은) ESAC 벡터이다. 또다른 바람직한 실시양태에서, 본 발명은 상기 재조합 방선균류 균주의 염색체에 통합된 ESAC 벡터에 담지된, 서열 1에 의해 특정된 유전자 클러스터를 포함하는 노노무리아 종 ATCC 39727 이외의 재조합 방선균류 균주를 제공한다.
한 측면에서, 본 발명은 하기 단계들을 포함하는, A40926의 생산을 증가시키는 방법을 제공한다: (1) 생합성 경로를 이용하여 A40926 또는 A40926 전구체를 생산하는 미생물을 상기 경로에서의 속도 제한 활성을 코딩하는 ORF 1 내지 37 (서열 2 내지 38) 중 임의의 것으로부터 선택되는 DNA 서열을 포함하는 재조합 DNA 벡터로 형질전환하는 단계 및 (2) 상기 벡터로 형질전환된 상기 미생물을 세포 성장, 상기 유전자의 발현 및 상기 항생제 또는 항생제 전구체의 생산에 적합한 조건하에 배양하는 단계.
또다른 측면에서, 본 발명은 하기 단계들을 포함하는 A40926의 유도체의 생산 방법을 제공한다: (1) 서열 1에 의해 특정되는 뉴클레오티드 서열로부터 선택되는 세그먼트로서, 우회하기 희망하는 생합성 단계를 촉매하는 폴리펩티드를 코딩하는 ORF의 1 내지 37 (서열 2 내지 38) 중 하나의 적어도 일부분을 포함하는, 상기 세그먼트를 적당한 벡터에 클로닝하는 단계; (2) 상기 폴리펩티드의 활성에 필수적인 아미노산에 대해 특정하는 하나 이상의 코돈을 제거 또는 대체함으로써 상기 ORF를 불활성화시키는 단계; (3) 생합성 경로를 이용하여 A40926 또는 A40926 전구체를 생산하는 미생물을 상기 재조합 DNA 벡터로 형질전환하는 단계; (4) 상기 DNA 서열이 변이된 카피로 대체됨으로써 파괴된 유전자를 생성시키는 상기 것들에 대한 수득된 형질변환체를 선별하는 단계 및 (5) 상기 변이체 세포를 세포 성장, 상기 경로의 발현 및 상기 경로 유사체의 제조에 적합한 조건하에 배양하는 단계.
또다른 측면에서, 본 발명은 하기 단계들을 포함하는 신규 글리코펩티드의 생산 방법을 제공한다: (1) 생합성 경로를 이용하여 A40926 또는 그의 전구체와는 상이한 글리코펩티드 또는 글리코펩티드 전구체를 생산하는 미생물을 ORF 1 내지 37 (서열 2 내지 38) 중에서 선택되는 하나 이상의 ORF를 포함하고 상기 글리코펩티드 또는 글리코펩티드 전구체를 변형시키는 하나 이상의 폴리펩티드(들)의 발현을 코딩하는 재조합 DNA 벡터로 형질전환하는 단계 및 (2) 상기 벡터로 형질전환된 상기 미생물을 세포 성장, 상기 유전자의 발현 및 상기 항생제 또는 항생제 전구체의 생산에 적합한 조건하에 배양하는 단계.
이 방법의 수행에 적합한 글리코펩티드 또는 글리코펩티드 전구체를 생산하는 미생물의 예는, 속 스트렙토마이세스, 아미콜라토프시스, 악티노플라네스, 노노무리아 등에 속하는 균주이다.
또다른 측면에서, 본 발명은 또한 하기 단계들을 포함하는 신규 글리코펩티드의 생산 방법을 제공한다: (1) 글리코펩티드 또는 글리코펩티드 전구체를 생산하지 않으며 도입된 ORF(들)를 효율적으로 발현할 수 있는 미생물 중에서 선택된 미생물을 글리코펩티드 또는 글리코펩티드 전구체(활성 폴리펩티드(들))를 변형시키는 하나 이상의 폴리펩티드(들)을 코딩하는 ORF 1 내지 37 (서열 2 내지 38) 중에서 선택되는 하나 이상의 ORF를 포함하는 재조합 DNA 벡터로 형질전환하는 단계; (2) 적어도 상기 활성 폴리펩티드(들)을 함유하는 상기 미생물의 세포 추출물 또는 세포 분획물을 활성 폴리펩티드(들)의 존재에 적합한 조건하에서 제조하는 단계; (3) 글리코펩티드 또는 글리코펩티드 전구체를 상기 세포 추출물 또는 세포 분획물에 첨가하고, 상기 혼합물을 상기 활성 폴리펩티드(들)이 상기 글리코펩티드 또는 글리코펩티드 전구체를 변형시킬 수 있는 조건하에서 인큐베이션하는 단계.
이 방법의 수행에 적합한 미생물의 예는 스트렙토마이세스 리비단스(Streptomyces lividans), 스트렙토마이세스 코엘리콜로르(Streptomyces coelicolor), 에쉐리키아 콜라이(Escherichia coli), 바실러스 섭틸리스(Bacillus subtilis) 등에 속하는 균주이다.
본 발명의 다른 한 측면은 하기 것들로부터 선택되는, A40926의 생합성 경로에 관여하는 폴리펩티드 서열을 포함하는 단리된 폴리펩티드를 포함한다:
a) dbv ORF 1 내지 37 (서열 2 내지 38) 중 임의의 것에 의해 코딩되는 ORF 폴리펩티드, 또는 dbv ORF 1 내지 37 (서열 2 내지 38) 중 임의의 것, 바람직하게는 dbv ORF 3 내지 4, 6 내지 10, 18 내지 20, 22 내지 23, 29 내지 30 (서열 4 내지 5, 7 내지 11, 19 내지 21, 23 내지 24, 30 내지 31 및 37) 중 임의의 것에 의해 코딩되는 폴리펩티드와 아미노산 서열이 동일한 폴리펩티드;
b) dbv ORF 3, 6 내지 9, 18 내지 20, 22 내지 23, 29 내지 30 및 36 (서열 4, 7 내지 10, 19 내지 21, 23 내지 24, 30 내지 31 및 37) 중 임의의 것에 의해 코딩되는 폴리펩티드와 아미노산 서열이 80% 이상, 바람직하게는 86% 이상, 더욱 바람직하게는 90% 이상, 가장 바람직하게는 95% 이상 동일한 폴리펩티드 및
c) dbv ORF 4 및 10 (서열 5 및 11) 중 임의의 것에 의해 코딩되는 폴리펩티드와 아미노산 서열이 87% 이상, 바람직하게는 90% 이상, 더욱 바람직하게는 95% 이상 동일한 폴리펩티드.
정의
용어 "단리된 핵산"은 천연 및 합성 공급원의, 단일 또는 이중 나선일 수 있는 게놈 DNA 또는 상보적 DNA (cDNA)로서의 DNA 분자를 가리킨다. 이 용어는 또한 천연 또는 합성 공급원의 RNA 분자도 가리킨다.
용어 "뉴클레오티드 서열"은 본원에 개시된 ORF 및 유전자 내부 영역의 전체 길이 또는 부분 길이 서열을 가리킨다. 서열목록에 나와 있는 본 발명의 뉴클레오티드 서열들 중 임의의 하나는 (a) 코딩 서열, (b) (a)의 전사로부터 유도된 RNA 분자, (c) 동일한 폴리펩티드를 코딩하는 유전자 코드의 퇴화를 이용하는 코딩 서열, 또는 (d) 프로모터, 인핸서, 종결자 및 반종결자 서열을 함유하는 유전자내부 영역이다.
용어 " 유전자 클러스터", "클러스터" 및 "생합성 클러스터"는 모두 이차 대사산물의 합성에 필요한 모든 유전자들을 함유하는 미생물의 게놈의 인접 세그먼트를 나타낸다.
용어 "dbv"는 노노무리아 종 ATCC39727에서 A40926 생합성을 초래하는 유전 요소를 가리킨다.
용어 "ORF"는 하나의 폴리펩티드를 코딩하는 게놈 뉴클레오티드 서열을 가리킨다. 본 발명의 영역에서, 용어 ORF는 "유전자"와 동의어이다.
용어 "ORF 폴리펩티드"는 ORF에 의해 코딩되는 폴리펩티드를 가리킨다.
용어 "dbv ORF"는 dbv 유전자 클러스터 내에 포함된 ORF를 가리킨다.
용어 "NRPS"는 이차 대사산물의 올리고펩티드 골격으로의 아미노산의 혼입을 초래하는 효소 활성의 착체인 비-리보솜 펩티드 신테타제를 가리킨다. 기능적 NRPS는 올리고펩티드로의 하나 이상의 아미노산의 혼입을 촉매하는 NRPS이다.
용어 "NRPS 모듈", 또는 "모듈"은 올리고펩티드로의 하나의 아미노산의 활성화, 혼입 및 가능한 변형을 지시하는 NRPS의 세그먼트를 가리킨다.
용어 "NRPS 유전자"는 NRPS를 코딩하는 유전자를 가리킨다.
용어 "이차 대사산물"은 유전자 클러스터에 의해 특정된 한 세트의 유전자의 발현을 통해 미생물에 의해 생성되는 생활성 물질을 가리킨다.
용어 "생산 숙주"는 이차 대사산물의 형성이 공여자 유기체로부터 유도된 유전자 클러스터에 의해 지시되는 미생물이다.
용어 "ESAC"는 "에쉐리키아 콜라이-스트렙토마이세스 인공 염색체", 즉 에쉐리키아 콜라이 숙주 내에 큰 DNA 삽입부를 담지하고 유지하며, 방선균류 생산 숙주 내에 도입되어 유지될 수 있는 재조합 벡터를 가리킨다. ESAC의 예가 W099/67374에 나와 있다.
도 1. 노노무리아 종 ATCC39727의 염색체로부터 유도된 단리된 DNA 세그먼트. 굵은 선은 서열 1에 기재된 세그먼트를 나타낸다. 상기 단리된 DNA 세그먼트를 담지하는 코스미드는 11A5, 7F3, 7E9, 1B1, 7A2, 11B9 및 7C7로 표시된다.
도 2. dbv 클러스터의 유전 조직. 각 ORF는 화살표로 표시되고, 표 1에서 넘버링된다. 방향은 도 1에서와 같다. 단위 막대에 있는 숫자는 서열 좌표 (kb)를 가리킨다.
A. 노노무리아로부터의 dbv 유전자
A40926는 노노무리아 종 ATCC39727에 의해 생산되는 밀접히 관련된 글리코펩티드 항생제의 착체이다. 본 발명은 A40926의 생합성을 위한 유전자 클러스터의 핵산 서열 및 특징화를 제공한다. 인접한 DNA 서열과 함께, A40926 유전자 클러스터의 물리적 조직이 도 1에 나와 있으며, 그 도 1은, 노노무리아 종 ATCC39727의 게놈으로부터의 90-kb 게놈 세그먼트의 물리적 지도 및 그러한 세그먼트를 특정하는 한 세트의 코스미드를 도시한다. dbv 클러스터로 표시되는 A40926 생합성을 지배하는 DNA 세그먼트의 유전 조직이 도 2에 나와 있고, 그의 뉴클레오티드 서열은 서열 1로 기재되어 있다.
클러스터의 정확한 경계는 다른 글리코펩티드 클러스터와의 비교 및 그의 유전자 산물의 기능으로부터 구축될 수 있다. 그러므로, 좌측 끝 (도 1)에서, dbv 클러스터는 HPG의 합성에 관여하는 효소 HmoS를 코딩하는 dbv ORF1 (서열 2)의 의해 구분된다. 우측에서는, dbv 클러스터는 서열 1의 뉴클레오티드 71065 내지 71138의 폭을 가지는 tRNA 유전자의 3'-말단과 유사한 attL 부위의 나머지에 의해 구분된다. dbv 클러스터는 대략 71,100개 염기쌍의 폭을 가지고, dbv ORF1 내지 dbv ORF37로 표시되는 37개 ORF를 포함한다. 서열 1의 인접 뉴클레오티드 서열 (71138개 염기쌍)은 서열 2 내지 38에 열거된 37개의 유래 단백질을 코딩한다. ORF1 (서열 2)는 상보적 나선 상의 뉴클레오티드 1140 내지 40으로부터 서열 1을 번역함으로써 유래된 366개 아미노산을 나타낸다. ORF2 (서열 3)은 상보적 나선 상의 뉴클레오티드 2329 내지 1259로부터 서열 1을 번역함으로써 유래된 356개 아미노산을 나타낸다. ORF3 (서열 4)은 상보적 나선 상의 뉴클레오티드 5161 내지 2558로부터 서열 1을 번역함으로써 유래된 867개 아미노산을 나타낸다. ORF4 (서열 5)는 상보적 나선 상의 뉴클레오티드 6231 내지 5266로부터 서열 1을 번역함으로써 유래된 321개 아미노산을 나타낸다. ORF5 (서열 6)는 뉴클레오티드 7183 내지 8292로부터 서열 1을 번역함으로써 유래된 369개 아미노산을 나타낸다. ORF6 (서열 7)은 뉴클레오티드 8320 내지 8973로부터 서열 1을 번역함으로써 유래된 217개 아미노산을 나타낸다. ORF7 (서열8)은 뉴클레오티드 9069 내지 9659로부터 서열 1을 번역함으로써 유래된196개 아미노산을 나타낸다. ORF8 (서열 9)은 상보적 나선 상의 뉴클레오티드 10667 내지 9708로부터 서열 1을 번역함으로써 유래된 319개 아미노산을 나타낸다. ORF9 (서열 10)는 상보적 나선 상의 뉴클레오티드 11896 내지 10670로부터 서열 1을 번역함으로써 유래된 408개 아미노산을 나타낸다. ORF10 (서열 11)은 상보적 나선 상의 뉴클레오티드 13419 내지 11950로부터 서열 1을 번역함으로써 유래된 489개 아미노산을 나타낸다. ORF11 (서열 12)은 상보적 나선 상의 뉴클레오티드 14741 내지 13479로부터 서열 1을 번역함으로써 유래된 420개 아미노산을 나타낸다. ORF12 (서열 13)는 상보적 나선 상의 뉴클레오티드 16019 내지 14823으로부터 서열 1을 번역함으로써 유래된 398개 아미노산을 나타낸다. ORF13 (서열 14)은 상보적 나선 상의 뉴클레오티드 17163 내지 16009으로부터 서열 1을 번역함으로써 유래된 384개 아미노산을 나타낸다. ORF14 (서열 15)는 상보적 나선 상의 뉴클레오티드 18366 내지 17185로부터 서열 1을 번역함으로써 유래된 393개 아미노산을 나타낸다. ORF15 (서열 16)는 상보적 나선 상의 뉴클레오티드 18671 내지 18462로부터 서열 1을 번역함으로써 유래된 69개 아미노산을 나타낸다. ORF16 (서열 17)은 상보적 나선 상의 뉴클레오티드 24259 내지 18668로부터 서열 1을 번역함으로써 유래된 1863개 아미노산을 나타낸다. ORF17 (서열 18)은 상보적 나선 상의 뉴클레오티드 36529 내지 24278로부터 서열 1을 번역함으로써 유래된 4083개 아미노산을 나타낸다. ORF18 (서열 19)은 상보적 나선 상의 뉴클레오티드 39021 내지 36760으로부터 서열 1을 번역함으로써 유래된 753개 아미노산을 나타낸다. ORF19 (서열 20)는 상보적 나선 상의 뉴클레오티드 39851 내지 39152로부터 서열 1을 번역함으로써 유래된 232개 아미노산을 나타낸다. ORF20 (서열 21)은 상보적 나선 상의 뉴클레오티드 41732 내지 40125로부터 서열 1을 번역함으로써 유래된 535개 아미노산을 나타낸다. ORF21 (서열 22)은 상보적 나선 상의 뉴클레오티드 42584 내지 41772로부터 서열 1을 번역함으로써 유래된 270개 아미노산을 나타낸다. ORF22 (서열 23)는 상보적 나선 상의 뉴클레오티드 44130 내지 42868로부터 서열 1을 번역함으로써 유래된 420개 아미노산을 나타낸다. ORF23 (서열 24)은 상보적 나선 상의 뉴클레오티드 46355 내지 44226으로부터 서열 1을 번역함으로써 유래된 709개 아미노산을 나타낸다. ORF24 (서열 25)는 뉴클레오티드 46632 내지 48578로부터 서열 1을 번역함으로써 유래된 648개 아미노산을 나타낸다. ORF25 (서열 26)는 뉴클레오티드 48575 내지 54868로부터 서열 1을 번역함으로써 유래된 2097개 아미노산을 나타낸다. ORF26 (서열 27)은 뉴클레오티드 54865 내지 58056으로부터 서열 1을 번역함으로써 유래된 1063개 아미노산을 나타낸다. ORF27 (서열 28)은 뉴클레오티드 58152 내지 58985로부터 서열 1을 번역함으로써 유래된 277개 아미노산을 나타낸다. ORF28 (서열 29)은 뉴클레오티드 59046 내지 60641로부터 서열 1을 번역함으로써 유래된 531개 아미노산을 나타낸다. ORF29 (서열 30)는 상보적 나선 상의 뉴클레오티드 62445 내지 60874로부터 서열 1을 번역함으로써 유래된 523개 아미노산을 나타낸다. ORF30 (서열 31)은 뉴클레오티드 62887 내지 63312로부터 서열 1을 번역함으로써 유래된 141개 아미노산을 나타낸다. ORF31 (서열 32)은 뉴클레오티드 63469 내지 64587로부터 서열 1을 번역함으로써 유래된 372개 아미노산을 나타낸다. ORF32 (서열 33)는 뉴클레오티드 64599 내지 65240으로부터 서열 1을 번역함으로써 유래된 213개 아미노산을 나타낸다. ORF33 (서열 34)은 뉴클레오티드 65237 내지 66541로부터 서열 1을 번역함으로써 유래된 434개 아미노산을 나타낸다. ORF34 (서열 35)는 뉴클레오티드 66538 내지 67335로부터 서열 1을 번역함으로써 유래된 265개 아미노산을 나타낸다. ORF35 (서열 36)는 뉴클레오티드 67332 내지 68618로부터 서열 1을 번역함으로써 유래된 428개 아미노산을 나타낸다. ORF36 (서열 37)은 상보적 나선 상의 뉴클레오티드 69423 내지 68685로부터 서열 1을 번역함으로써 유래된 251개 아미노산을 나타낸다. ORF37 (서열 38)은 뉴클레오티드 69608 내지 70894로부터 서열 1을 번역함으로써 유래된 428개 아미노산을 나타낸다.
dbv 클러스터는 다른 글리코펩티드 클러스터의 것들과 실질적으로 상이한 조직을 나타낸다. 5가지 bal, cep, com, stadbv 클러스터 간의 비교가 표 1에 요약되어 있다.
a + 표시는 다른 기재된 글리코펩티드 유전자 클러스터에서의 정형체의 존재를 가리킴.
b 정형체가 다른 글리코펩티드 유전자 클러스터에 존재하지 않을 때, 진뱅크에서의 블라스트(Blast) 연구에 대한 결과를 보고함.
c 다른 글리코펩티드 클러스터에서의 존재 및 진뱅크에서의 블라스트 연구로부터의 조합된 결과를 기초로 한 dbv ORF의 제안 기능.
d 이 칼럼은 다른 글리코펩티드 유전자 클러스터 및 그의 공급원인 클러스터로부터 최적의 매치의 서열 동일성(%)을 보고함.
e 최고 점수를 갖는 진뱅크 엔트리의 등록 번호.
f 블라스트 연구로부터 수득된 확률 점수.
g 전 칼럼으로부터의 진뱅크 엔트리의 유기체 및 제안 기능. 약어는 다음과 같다: S., 스트렙토마이세스; M., 메조르히조비움(M., Mesorhizobium); A., 아미콜라토프시스
h 블라스트 연구에 의해 보고된 보존 도메인.
* 다른 글리코펩티드 클러스터에서, 단 데이타베이스에서 다른 곳에서 존재하는 보다 높은 동일성을 갖는 서열에서의 존재.
실제로, NRPS의 7개 모듈을 코딩하는 유전자는 12-kb 세그먼트에 의해 분리된 2개의 발산 전사된 영역으로서 조직화된다 (도 2). 이는 NRPS 유전자의 7개 모듈이 조밀 영역에 존재하고, 모두 동일한 방향으로 번역되는 bal, cep, com sta 클러스터의 조직과는 대조된다. 또한, bal, cep, com sta 클러스터에서, 하나를 제외한 모든 ORF가 동일한 방향으로 전사되는 반면, 37개 dbv ORF 중 단지 22개만이 한 방향으로 전사되고, 나머지 15개는 반대 방향으로 전사된다. 이는 dbv 클러스터의 전사적 복잡성을 가리킨다.
dbv 클러스터는 또한 bal, cep, com sta 클러스터에서 동족체가 없는 수개의 ORF의 존재를 그 특징으로 한다. 이는 dbv ORF 3, 6 내지 8, 18 내지 20, 22, 23, 29, 30 및 36 (서열 4,7 내지 9, 19 내지 21, 23, 24, 30, 31 및 37)을 포함한다. 5개 bal, cep, com, sta 및 dbv 클러스터 간의 비교가 표 1에 요약되어 있다. 결론적으로, 본원에 기재된 dbv 클러스터 유전 조직은 다른 글리코펩티드의 합성에 관여하는 다른 클러스트의 조직과 실질적으로 상이하다. 그러므로 그은 그러한 유전 조직을 갖는 클러스트의 첫 번째 예를 나타낸다.
B. dbv 유전자의 역할
본 발명은 특히 A40926의 헵타펩티드 전구체의 합성을 초래하는 NRPS를 코딩하는 DNA 서열을 개시한다. dbv NRPS는 각기 1개 내지 3개 모듈을 함유하는 4개의 폴리펩티드로 구성된다. 이는 dbv ORF16, ORF17, ORF25 및 ORF26 (서열 17, 18, 26 및 27)로 표시된다. NRPS에 의한 펩티드 합성이, 로딩 모듈 후에 일련의 신장 모듈이 이어지는 모듈적 시스템에 의해 수행된다. NRPS에서, 각 신장 모듈은 기질 인식 및 활성화를 초래하는 아데닐화(A) 도메인; 티오에스테르 아미노산 및 신장 펩티드로서 공유 결합하는 티올화(T) 도메인 및 펩티드 결합 형성을 촉매하는 축합(C) 도메인의 적어도 3개의 도메인의 존재를 그 특징으로 한다. 이 코어 도메인에 부가하여, 마지막 모듈은 완성된 펩티드를 NRPS에 연결하는 에스테르 결합을 가수분해하는 티오에스테라제(Te) 도메인을 포함한다. 일부 모듈은 에피머화 (E) 도메인의 작용을 통해 L-아미노산을 D-형으로 전환한다. dbv NRPS는 총 7개의 A 도메인, 7개의 T 도메인, 6개의 C 도메인, 3개의 E 도메인 및 1개의 Te 도메인에 대한 7개 모듈로 구성된다. 구체적으로, dbv ORF26 (서열 27)은 NRPS 모듈 1 및 2를 코딩하고, 도메인 A-T-C-A-E-T의 서열을 특정하며, A40926의 헵타펩티드 코어 내의 HPG 및 Tyr 잔기 (첫 번째 2개의 아미노산)의 혼입에 필요하며; dbv ORF25 (서열 26)는 NRPS 모듈 3을 코딩하고, 도메인 C-A-T의 서열을 특정하며, DPG 잔기의 혼입을 초래하며; dbv ORF17 (서열 18)은 NRPS 모듈 4 내지 6을 코딩하고, 도메인 C-A-E-T-C-A-E-T-C-A-T의 서열을 특정하며, A40926 헵타펩티드 코어에의 2개의 HPG 및 Tyr 잔기의 혼입을 초래하고; 또한 dbv ORF16 (서열 17)는 NRPS 모듈 7을 코딩하고, 도메인 C-A-T-C*-T-Te의 서열을 특정하며 (C*는 기능이 알려지지 않은 비전형적인 축합 도메인을 나타냄), 마지막 DPG 잔기의 혼입 및 A40926의 헵타펩티드 전구체의 방출에 필요하다.
dbv 클러스터에 존재하는 다른 유전자는 A40926의 생산을 증가시키거나, 신규 대사산물을 합성하는데 유용한 신규 유전 요소를 나타낸다. 이들 중에서, dbv ORF9 (서열 10)는 N-아실-글루코사민 잔기를 헵타펩티드 (화학식 I)에서 위치 4에 있는 HPG 잔기의 페놀성 히드록실에 부착시키는 글리코실트랜스퍼라제를 코딩한다. 이 유전자는 이종성 숙주에서 클로닝되고 발현되어, N-아실-글루코사민 잔기를 다른 글리코펩티드 아글리콘에 부착시킬 수 있는 활성 효소를 생성할 수 있다. 대안적으로, dbv ORF9는 생산 균주 내에서 불활성화됨으로써, A40926 아글리콘을 생성할 수 있다. 이 아글리콘은 화학적 수단에 의해 수득될 수 있으나 (Malabarba 및 Ciabatti, 2001년), 화학적으로 개입할 필요없이, 단일 발효 공정을 통해 이를 제조하는 것이 바람직할 수 있다.
본 발명의 또다른 바람직한 핵산 분자는 A40926의 아미노산 3 및 아미노산 6에 대한 염소 원자의 첨가를 초래하는 할로게나제를 코딩하는 dbv ORF10 (서열 11)을 포함한다. dbv ORF10은 cep, com, sta bal 클러스터에 존재하는 할로게나제 유전자와는 상이한 신규 유전 요소를 나타낸다. 사실상, A40926 염소화 패턴은 이 글리코펩티드 중 독특하다. 이 유전자는 이종성 숙주에서 클로닝되고 발현되어, 글리코펩티드의 방향족 잔기 3 및 6을 염소화할 수 있는 활성 효소를 생성할 수 있다.
본 발명의 또다른 바람직한 핵산 분자는 아미노산 4에 있는 글루코사민 잔기의 지방산을 이용한 N-아실화를 초래하는 아실트랜스퍼라제를 코딩하는 dbv ORF23 (서열 24)을 포함한다. dbv ORF23은 cep, com, sta bal 클러스터가 없는 신규 유전 요소를 나타낸다. 이 유전자는 이종성 숙주에서 클로닝되고 발현되어, 상이한 글리코펩티드의 당 부분기를 N-아실화할 수 있는 활성 효소를 생성할 수 있다.
본 발명의 또다른 바람직한 핵산 분자는 A40926에서 아미노산 4에 부착된 D-글루코사민 잔기의 아미노 글루쿠론산으로의 산화를 초래하는 헥소스 옥시다제를 코딩하는 dbv ORF29 (서열 30)를 포함한다. dbv ORF29는 cep, com, sta bal 클러스터가 없는 신규 유전 요소를 나타낸다. 이 유전자는 이종성 숙주에서 클로닝되고 발현되어, 글리코펩티드에 부착된 D-글루코사민 잔기를 산화시킬 수 있는 활성 효소를 생성할 수 있다.
본 발명의 또다른 바람직한 핵산 분자는 NRPS로부터의 변종 중간체 펩티드의 가수분해를 초래하는 티오에스테라제를 코딩하는 dbv ORF36 (서열 37)을 포함한다. NRPS와 구별되는 폴리펩티드로서 존재하는 다른 티오에스테라제와 유사하게 (Kotowska 등, 2002년), dbv ORF36의 산물은 헵타펩티드로 더욱 가공되지 않는 NRPS 상의 상기 모든 티오에스테르를 가수분해함으로써, A40926 생합성을 위해 효율적인 NRPS의 유지를 초래한다. 이에 따라, 이는 cep, sta, com bal 클러스터가 없는 신규 유전 요소를 나타낸다. 이 유전자는 또다른 글리코펩티드 생산자 균주에서 클로닝되고 발현되어, 형성되는 산물의 수율을 증가시킬 수 있다. 숙주 균주는 비제한적으로 목 악티노마이세탈레스, 과 스트렙토스포란기아세아에(Streptosporangiaceae), 마이크로모노스포라세아에(Micromonosporaceae), 슈도노카르디아세아에(Pseudonocardiaceae)스트렙토마이세타세아에(Streptomycetaceae), 노노무레아에(Nonomureae), 악티노플라네스, 아미콜라토프시스, 스트렙토마이세스 등에 속하는 균주들을 포함한다.
본 발명의 또다른 바람직한 핵산 분자는 아미노산 7에 대한 만노실 잔기의 부착을 초래하는 만노실트랜스퍼라제를 코딩하는 dbv ORF20 (서열 21)을 포함한다. 이에 따라, 이는 cep, sta, com bal 클러스터가 없는 신규 유전 요소를 나타낸다. 이 유전자는 또다른 글리코펩티드 생산자 균주에서 클로닝되고 발현되어, 아미노산 7에 부착된 만노실 잔기를 담지하는 글리코펩티드를 생성할 수 있다. 대안적으로, dbv ORF20은 생산 균주에서 불활성화됨으로써 데만노실-A40926이 형성될 수 있다. 이 화합물은 다른 수단에 의해 수득될 수 있으나 (Lancini 및 Cavalleri, 1997년), 단일 발효 공정을 통해 제조하는 것이 바람직할 수 있다.
dbv 클러스터는 또한 비-단백질형성 아미노산 HPG 및 DPG의 합성을 초래하는 수많은 유전자들을 포함한다. 전자의 합성을 위해, dbv ORF 1, 2, 5 및 37 (서열 2, 3, 6 및 38)의 생성물이 요구된다. DPG의 합성은 ORF37 (서열 38)에 부가하여, dbv ORF 31 내지 34 (서열 32 내지 35)의 관여를 요한다. 그의 역할이 표 1에 요약되어 있다. HPG 및 DPG가 비-단백질형성 아미노산이기 때문에, NRPS에 의한 헵타펩티드의 합성은 그의 유용성에 의존한다. 결과적으로, 이 효소의 활성은 글리코펩티드 생합성에서 제한적 단계이다. 이에 따라, 글리코펩티드의 증가된 수율이 이 ORF의 발현을 증가시킴으로써 수득될 수 있다. 이 유전자는 A40926 생산 균주에서 개별적으로 또는 임의 조합으로 과다발현되어, A40926의 수율을 증가시킬 수 있다.
dbv 클러스터는 또한 세포질로부터 글리코펩티드 중간체 또는 최종 생성물을 외수송하거나, 생산자 세포에의 내성 부여를 초래하는 수많은 유전자들을 포함한다. 이 유전자는 dbv ORF 7, 18 내지 19, 24 및 35 (서열 8, 19 내지 20, 25 및 36)를 포함한다. dbv ORF7은 성장 펩티도글리칸으로부터의 말단 D-알라닌 부분기의 제거를 초래하는 카르복시펩티다제를 코딩한다. 이는 cep, com, sta bal 클러스터가 없는 신규 유전 요소를 나타낸다. dbv ORF 18 내지 19 및 24는 A40926 또는 그의 중간체의 ATP-의존성 분비를 초래하는 ABC 계통 (van Veen 및 Konings, 1998년)의 트랜스포터를 코딩한다. dbv ORF35는 양성자 구배에 대항하여 A40926 또는 그의 중간체의 외수송을 초래하는 Na/K 이온-상호수송체를 코딩한다. 이 유전자는 또다른 글리코펩티드 생산자 균주에서, 개별적으로 또는 임의의 조합으로 클로닝되어 발현되어, 형성된 생성물의 수율을 증가시킬 수 있다. 숙주 균주는 비제한적으로 목 악티노마이세탈레스, 스트렙토스포란기아세아에, 마이크로모노스포라세아에, 슈도노카르디아세아에 스트렙토마이세타세아에, 노노무레아에, 악티노플라네스, 아미콜라토프시스, 스트렙토마이세스 등에 속하는 균주들을 포함한다. 대안적으로, 이 유전자는 A40926 생산 균주에서 개별적으로 또는 임의 조합으로 과다발현되어, A40926의 수율을 증가시킬 수 있다.
dbv 클러스터는 또한 A40926 제조 중에 생합성 및 내성 유전자의 발현을 직접적으로 또는 간접적으로 가능하게 하거나 활성화하는 수많은 조절 유전자들을 포함한다. 이 유전자는 또한 dbv ORF 3, 4, 6 및 22 (서열 4, 5, 7 및 23)를 포함한다. dbv ORF3은 스트렙토마이세스 하이그로스코피쿠스로부터의 유전자 클러스터 내에 존재하는 양성 조절자인 HygR과 매우 관계있다 (Ruan 등, 1997년). 이는 cep, com, bal sta 클러스터가 없는 신규 유전 요소를 나타낸다. dbv ORF4는 다른 글리코펩티드 클러스터에 존재하는 유사한 조절자와 매우 관계있다. dbv ORF 6 및 22는 2-성분 신호전달 시스템을 코딩한다. 이 4개의 유전자는 또다른 글리코펩티드 생산자 균주에서 개별적으로 또는 임의의 조합으로 클로닝되어 발현되어, 형성된 생성물의 수율을 증가시킬 수 있다. 숙주 균주는 비제한적으로 목 악티노마이세탈레스, 스트렙토스포란기아세아에, 마이크로모노스포라세아에, 슈도노카르디아세아에 스트렙토마이세타세아에, 노노무레아에, 악티노플라네스, 아미콜라토프시스, 스트렙토마이세스 등에 속하는 균주들을 포함한다. 대안적으로, 이 유전자는 A40926 생산 균주에서 개별적으로 또는 임의의 조합으로 과다발현되어, A40926의 수율을 증가시킬 수 있다.
C. dbv 클러스터의 사용
본 발명은 또한 전체 A40926 분자, 그의 전구체 중 임의의 하나 또는 그의 유도체의 발현을 위한 핵산도 제공한다. 그러한 핵산은 A40926의 어셈블리를 지시하는데 충분한 폴리펩티드를 코딩하는 ORF를 포함하는 단리된 유전자 클러스터(들)를 포함한다. 한 예에서, 전체 dbv 클러스터 (서열 1)는 적당한 벡터에 도입되어, 원하는 생산 숙주를 형질전환하는데 사용될 수 있다. 한 측면에서, 이 DNA 세그먼트는 큰 DNA 세그먼트를 담지할 수 있는 적당한 벡터에 도입된다. 그러한 벡터의 예는 비제한적으로 세균 인공 염색체 (BAC) 벡터 또는 분화된 유도체, 예컨대 ESAC 벡터를 포함한다 (Shizuya 등, 1992년; Ioannou 등, 1994년; Sosio 등, 2000b년). 또다른 측면에서, dbv 클러스터가 원하는 생산 숙주에서 상용성을 가질 수 있는, 2개의 구별되는 벡터로의 2개의 분리된 세그먼트로서 클로닝된다. 또다른 측면에서, dbv 클러스터는 3개의 세그먼트로 하위분할되어, 각기 분리된 상용성 벡터에 클로닝될 수 있다. 1-, 2- 또는 3-벡터 시스템의 사용예가 문헌에 기재되었다 (예컨대, Xue 등, 1999년).
일단 dbv 클러스터가 적당히 하나 이상의 벡터에 클로닝되면, 이것은 천연 숙주에서보다 더욱 효율적으로 글리코펩티드 항생제가 생산될 수 있는 수많은 적당한 생산 숙주에 도입될 수 있다. 바람직한 숙주 세포는 방선균류 유전자를 효율적으로 발현할 수 있는 종 또는 균주의 숙주 세포이다. 그러한 숙주는 비제한적으로 악티노마이세탈레스, 스트렙토스포란기아세아에, 마이크로모노스포라세아에, 슈도노카르디아세아에 스트렙토마이세타세아에, 노노무라에아(Nonomuraea), 악티노플라네스, 아미콜라토프시스 스트렙토마이세스 등에 속하는 균주들을 포함한다. 대안적으로, 하나 이상의 적당한 벡터에 클로닝된 dbv 클러스터의 두 번째 카피는 A40926 생산 균주에 도입될 수 있고, 거기에서 dbv 유전자의 두 번째 카피가 A40926의 수율을 증가시키게 된다.
잘 특징화된 숙주에 대한 생산 능력의 부여는, 최적화 및 발달을 가져오는 공정의 수개 부분을 실질적으로 향상시킬 수 있다. 즉, 생산 균주에서의 천연 생성물의 적정 농도가 효과적으로 증가될 수 있으며; 천연 생성물의 정제가 가능한 간섭 활성의 공지된 배경에서 수행될 수 있으며; 착체의 조성이 더욱 효과적으로 조절될 수 있고; 천연 생성물의 변경된 유도체가 발효 조건의 조작을 통해, 또는 경로 공학처리에 의해 더욱 효과적으로 생산될 수 있다.
대안적으로, 생합성 유전자 클러스터가 변형되어, 숙주 세포에 삽입되어, 광범위하게 다양한 대사산물들을 합성하거나 화학적으로 변형시키는데 사용될 수 있다. 즉, 예를 들어 개방 해독 프레임이 다시 정렬되고, 변형되어, 다른 글리코펩티드 생합성 유전자 클러스터와 조합될 수 있다.
여기에 제공된 정보를 이용하여, 통상적이고 공지된 방법을 이용하여, A40926 핵산의 클로닝 및 발현을 달성할 수 있다.
또다른 가능한 용도로서, dbv 유전자 클러스터로부터 선택된 ORF는 통상적인 분자생물학 기술을 이용하여 단리되어 불활성화된다. 노노무리아 종 ATCC39727 염색체에서 상기 ORF를 플랭킹(flanking)하는 DNA 세그먼트를 포함하는 적당한 벡터에 클로닝된 변이된 ORF가 상기 노노무리아 균주에 도입되며, 거기에서 동종성 조합의 2가지 이중 교차 이벤트는 생산자 균주에서 상기 ORF의 불활성화를 초래한다. 이 절차는 효율적인 방식으로 A40926의 전구체 또는 유도체를 생산하는데 유용하다.
또다른 가능한 용도로서, dbv 유전자 클러스터로부터 선택된 ORF는 단리되어 바람직한 프로모터의 조절 하에 놓인다. 이어서, 적당한 벡터에 클로닝된, 공학처리된 ORF는, 상기한 바와 같이 원래의 ORF를 대체하거나, 또는 상기 ORF의 부가적 카피로서, 노노무리아 종 ATCC 39727에 도입된다. 이 절차는 A40926 분자, 그의 전구체 또는 유도체를 생산하는데 중요한 ORF의 발현 수준을 증가 또는 감소시키는데 유용하다.
하기 실시예는 A40926 유전자 클러스터를 동정할 수 있도록 하는 원리 및 방법 및 모든 dbv 유전자를 동정 및 분석할 수 있도록 하는 원리 및 방법을 설명하기 위한 것이다. 이 실시예는 본 발명의 원리 및 방법을 설명하기 위한 것이나, 그 범주를 제한하지 않는 것으로 한다.
일반적 방법
달리 지시되지 않는 한, 세균 균주 및 클로닝 벡터는 모두 공공 수집기관 또는 산업적 출처로부터 수득될 수 있다. 분자생물학을 위해 표준 절차를 사용한다 (예컨대, Sambrook 등, 1989년; Kieser 등, 2000년). 노노무리아를 HT 아가 (Kieser 등, 2000년) 및 래어(Rare)3 배지 (10 g/l 글루코스, 4 g/l 효모 추출물, 10 g/l 맥아 추출물, 2 g/l 펩톤, 2 g/l MgCl2, 0.5% 글리세롤)에서 생장시켰다. 글리코펩티드를 공개된 절차에 따라 단리시킨다 (Lancini 및 Cavalleri, 1997년). 위스콘신 패키지(Wisconsin package), 버전 9.1 (Accelrys)의 프로그램을 이용하여 서열 분석을 수행한다. 공공 사이트(http://www.ncbi.nlm.nih.gov/blast/index.html 및 http://www.ebi.ac.uk/fasta33)에서 블라스트(Blast) 또는 파스타(Fasta) 프로그램으로 데이타베이스 조사를 수행한다.
실시예 1 - A40926 생합성 유전자의 단리
코스미드 벡터 수퍼코스(Supercos) [스트라타겐(Stratagene, 미국 캘리포니아주 92037 라졸라 소재]에서 노노무리아 ATCC39727로부터의 DNA로 게놈 라이브러리를 제작한다. 노노무리아 ATCC39727로부터의 총 DNA를 Sau3AI로 차례로 부분 소화시켜, 단편 크기를 40 kb 범위로 최적화하였다. 부분 소화된 DNA를 알칼리성 포스파타제로 처리하여, BamHI로 미리 소화된 수퍼코스에 라이게이션하였다. 라이게이션 혼합물을 생체외 패키징하여, 이. 콜라이(E. coli) XL1Blue 세포에 트랜스펙션하는데 사용하였다. 수득된 코스미드 라이브러리를, 주형으로서 A. 메디테라네이 DSM 5908 게놈 DNA를 사용하여 bal 클러스터로부터의 세그먼트의 PCR 증폭으로부터 수득된 2개의 프로브로 혼성화함으로써 선별한다. 이 프로브는 올리고 5'-ATGCGCGTGTTGATCTCG-3' (서열 39) 및 5'-CGGCTGACCGCGGCGAAC-3' (서열 40)을 이용한 증폭으로부터 수득된 bgtfA 및 올리고 5'-CGTGGGGGTGGATGTATCGA-3' (서열 41) 및 5'-TCACCATTGGATCAGCG-3' (서열 42)을 이용한 증폭으로부터 수득된 dpgA이었다. 모든 올리고는 등록번호 Y16952로 GenBank에 기탁된 서열로부터 고안되었다. 또한, 올리고뉴클레오티드 Pep8을 이용하여 혼성화를 수행하였다 (Sosio 등, 2000a년). 이 프로브들 중 하나 이상에 대해 양성인 코스미드를 제한효소로 단리하여 물리적으로 지도작성하였다. 그러한 실험으로부터, 도 1에 나와있는 코스미드를 동정하였다. 이에 따라, 노노무리아 종 ATCC39727의 게놈으로부터 동정된 세그먼트는 항생제 A40926의 합성을 초래하는 dbv 유전자 클러스터를 포함한다.
상기 실시예는 dbv 클러스터를 단리할 수 있도록 하는 원리 및 방법을 설명하기 위한 것이다. 다양한 벡터들에서 dbv 클러스터를 클로닝할 수 있음을 당업자는 인지할 것이다. 그러나, dbv 클러스터가 72-kb 크기인 경우, 바람직한 벡터는 람다, 코스미드 및 BAC 벡터와 같은 큰 삽입부를 담지할 수 있는 벡터임을 이해한다. 당업자는 그러한 라이브러리로부터 dbv 클러스터를 동정하는데 다른 프로브를 사용할 수 있음을 이해한다. 서열 1에 보고된 서열로부터, 노노무리아 종ATCC39727 DNA로부터 임의의 단편을 PCR-증폭하여, 그러한 DNA로 제작된 라이브러리를 선별하는데 사용할 수 있다. 서열 1에 의해 커버된 임의의 세그먼트를 포함하는, 상기 라이브러리로부터의 하나 이상의 클론을 동정할 수 있다. 또한, 표 1에 제공된 정보를 이용하여, cep, bal, com sta 클러스터로부터 유도된 것들과 같은 이종성 프로브의 사용을 통해 dbv 클러스터를 동정할 수도 있다. 대안적으로, 이차 대사산물의 합성을 지휘하는 다른 유전자 클러스터는 이종성 혼성화를 허용하기 위해 dbv 유전자와 충분히 관계되는 유전자를 함유한다. 모든 이 변형들은 본 발명의 범주 내에 포함된다.
실시예 2 - A40926 유전자 클러스터의 서열 분석
실시예 1에 기재된 바와 같이 동정된 dbv 클러스터를 샷건법(shotgun approach)에 의해 시퀀싱하였다. dbv 클러스터의 서열은 서열 1로서 본원에 제공된다. 수득된 DNA 서열을 코돈프레퍼런스(Codonpreference) [GCG, (제네틱 컴퓨터 그룹(Genetic Computer group), 미국 53711 위스콘신주 매디슨 소재) 버전 9.1]으로 분석하여, 가능히 코딩 서열을 동정할 수 있다. 그 다음, 이러한 식으로 동정된 각 코딩 서열을 프로그램 Tfasta (GCG, 버전 9.1)을 이용하여, bal, cep, com sta 클러스터와 대비함으로써 분석하였다. 이어서, 이 클러스터들 중 임의의 것에서의 매칭을 동정하지 않는 코딩 서열을 프로그램 블라스트를 이용하여 GenBank에 대해, 또는 파스타를 이용하여 SwissProt에 대해 조사하였다. 마지막으로, 각 ORF에 대한 정확한 출발 코돈을 프로그램 파일업(Pileup) (GCG, 버전 9.1)을 이용하는 관련 서열의 다중 배치로써, 또는 상향류 리보솜 결합 부위에 대한 조사로써 구축하였다. 총체적으로, dbv ORF1 내지 dbv ORF37로 표시되는 37개 ORF를 동정한다. 이 분석의 결과가 표 1에 요약되어 있고, 서열 2 내지 서열 38로서 서열목록에 본원에 제공된다. 상세 내용이 하기에 나와 있다.
2A. 분화된 아미노산 HPG 및 DPG의 합성
dbv 클러스터에 의해 코딩되는 7개 단백질이 분화된 아미노산 HPG 및 DPG의 합성에 관여한다. 즉, ORF1 및 ORF2 (서열 2 및 3)가 A40926 형성에 필요한 HPG 잔기의 합성과 관련되고, p-히드록시만델레이트 옥시다제 및 p-히드록시만델레이트 신테타제를 각기 코딩한다. 이 ORF의 동족체가 다른 글리코펩티드 클러스터에 나와 있고 (표 1), 그의 역할이 실험적으로 구축되었다 (Li 등, 2001년; Hubbard 등, 2000년). ORF 31 내지 34 (서열 32 내지 35)는 A40926 형성에 필요한 DPG 잔기의 합성에 관여한다. 이 ORF의 동족체가 DPG 잔기를 포함하는 헵타펩티드의 합성을 지휘하는 다른 글리코펩티드 클러스터에 발견되고 (표 1), 상응하는 유전자 산물의 관련이 실험적으로 결정되었다 (Pfeifer 등, 2001년; Chen 등, 2001등). ORF37 (서열 38)을 p-히드록시페닐글리옥실레이트 및 3,5-디히드록시페닐글리옥실레이트의 양자 모두의 아미노기전달반응에 필요한 아미노 트랜스퍼라제를 코딩하여, HPG 및 DPG를 각기 생성한다. 그의 역할이 실험적으로 구축되었고 (Pfeifer 등, 2001년; Hubbard 등, 2000년), 티로신을 아미노 공여자로서 우선적으로 이용한다 (Hubbard 등, 2000년). 이 반응은 p-히드록시페닐피루베이트을 형성시키게 되고, 이는 이어서 ORF2 (서열 3)의 유전자 산물의 작용에 의해 p-히드록시만델레이트로 전환될 수 있다.
HPG 및 DPG의 합성에 간접적으로 관여하는 다른 ORF가 또한 dbv 클러스터, 즉 ORF5 및 ORF30 (서열 6 및 31)에서 발견된다. ORF5 (서열 6)는 ORF2 (서열 3)의 생성물에 대한 기질인 p-히드록시페닐피루베이트의 합성에 관여하는 프리페네이트 데히드로게나제를 코딩한다. 그러므로 이 ORF는 티로신을 HPG로 전환하는 사이클을 프라이밍하는 효소를 코딩한다. 따라서 이 ORF의 발현 수준은 A40926 형성을 위해 적당한 수준의 HPG를 공급하는데 중요하다. ORF30 (서열 31)은 세균 게놈 서열로부터 확인된, 기능이 알려지지 않은 가설적 폴리펩티드와 매우 유사한 폴리펩티드를 코딩하며, 최적의 매치가 S. 코엘리콜로르로부터의 NP_626911.1에 의해 나타내어진다 (표 1). 그러나, 이 모든 단백질들은 4-히드록시벤조일-CoA 티오에스테라제의 전형인 보존 도메인을 나타낸다 (Benning 등, 1998년). 이에 따라, ORF30 (서열 31)의 생성물은 이 작은 폴리케티드의 합성 중에, DPG 또는 그의 전구체 중 하나의 방출을 용이하게 하기 쉽다. ORF30 (서열 31)은 dbv 클러스터에 대해 독특하다 (표 1).
2B. A40926의 헵타펩티드 전구체의 합성
ORF 16, 17, 25 및 26 (서열 17, 18, 26 및 27)에 의해 코딩되는 4개 단백질은 A40926의 헵타펩티드 코어의 합성에 관여한다. 이 모두는 다른 NRPS와 상당한 유사성을 나타낸다. 다른 NRPS 시스템과의 정렬에 기초하여, 이 4개 ORF에 의해 코딩되는 단백질의 제안되는 도메인 조성 및 특이성이 표 2에 보고되어 있다.
dbv NRPS 도메인 조성 및 역할
dbv ORF 모듈 도메인 아미노산 펩티드 결합
ORF25 1-2 AT-CATE HPG, Tyr 1-2
ORF26 3 CAT DPG 2-3
ORF17 4-6 CATE-CATE-CAT HPG, HPG, Tyr 3-4, 4-5, 5-6
ORF16 7 CATC*Te DPG 6-7A
dbv NRPS 유전자의 특이적 역할의 지정은 dbv 클러스터 내에서의 유전 위치특정에 의해 예측될 수 없었다. 사실상, 지금까지 보고된 모든 글리코펩티드 클러스터들의 경우, 모듈의 유전 순서와, 상응하는 아미노산이 폴리펩티드에 혼입되는 순서 간에 동일 선상의 관계가 있으나, dbv 클러스터에서는 그러하지 않으며 (도 2), 그 이유는 그의 NRPS 유전자가 발산적으로 전사되기 때문이다. 그러나, 그의 역할 및 특이성은 하기 관찰을 기초로 하여 예측될 수 있다:
i) ORF16 (서열 17)에 의해 특정되는 단백질의 도메인 조성 및 그것이 티오에스테라제 도메인으로 종결된다는 사실은 DPG 잔기의 인식 및 헵타펩티드의 마지막 펩티드 결합의 형성 및 그에 이은 효소 결합된 티오에스테르의 절단에서의 역할과 가장 일관됨 (표 2);
ii) ORF 17 (서열 18)의 모듈 조직 및 도메인 조성은, 다른 글리코펩티드 NRPS 시스템에서 보는 바와 같이, 헵타펩티드의 아미노산 4 내지 6 인식 및 그의 혼입에 필요한 모듈 4 내지 6을 포함하는 이 폴리펩티드와 가장 일관됨 (van Wageningen 등, 1998년; Pelzer 등, 1999년; Chiu 등, 2001년; Pootoolal 등, 2002년);
iii) ORF25 (서열 26)의 생성물의 도메인 조직화는 헵타펩티드 합성을 개시하고, 첫 번째 펩티드 결합의 형성을 촉매하는 역할과 가장 일관되며, 그 이유는 이 ORF가 2개의 NRPS 모듈, 단 단지 하나의 C 도메인을 코딩하기 때문임 (표 2);
iv) ORF26 (서열 27)의 도메인 조직은 헵타펩티드에서의 세 번째 아미노산의 인식 및 혼입을 초래하는 모듈 3을 포함하는 상기 폴리펩티드와 가장 일치되며, 그 이유는 이 모듈이 (모듈 2, 4 및 5의 역할에 의해 필요한) E 도메인을 포함하지 않고, C 도메인은 존재하고, Te 도메인은 부재하며 (표 2), 이 ORF가 모듈 1 및 7을 각기 코딩하는 것을 배제하기 때문이다.
A40926의 헵타펩티드 전구체의 합성에 간접적으로 관여하는 다른 ORF가 또한 dbv 클러스터, 즉 ORF15 및 ORF36 (서열 16 및 37)에서 발견된다. ORF15 (서열 16)는 기능이 알려지지 않은 짧은 펩티드를 코딩한다. 이 유전자 산물의 동족체가 NRPS 시스템을 코딩하는 많은 클러스트에서 발견된다. ORF36 (서열 37)은, NRPS 또는 폴리케티드 신타제 유전자를 포함하는 다른 클러스터에 의해 종종 코딩되는 단백질인 II형 티오에스테라제를 코딩한다. 이 티오에스테라제의 제안 역할은 효소에 공유결합된 변종 중간체를 제거함으로써, NRPS 및 PKS 시스템이 작동하도록 하는 효율성을 증진시키는 것이다 (Heathcote 등, 2001년). 다른 공지된 글리코펩티드 클러스터에 의해 코딩되는 상기 단백질의 정형체는 없다 (표 1).
2C. 헵타펩티드에서의 방향족 잔기의 가교결합
ORF 11 내지 14 (서열 12 내지 15)에 의해 코딩되는 4개 단백질이 A40926 헵타펩티드 전구체의 방향족 잔기를 함께 결합시키는 가교결합 반응에 관여한다. 이 4개 단백질은 P450 모노옥시게나제에 대한 상당한 동종성을 나타낸다 (표 1). 다른 글리코펩티드 클러스터에서 발견되는 P450 모노옥시게나제와의 동일성 및 bal 클러스터에 존재하는 유전자에 의해 코딩되는 P450 모노옥시게나제에 대해 예측되는 역할을 기초로 하여 (Bischoff 등, 2001년), 하기 예측을 할 수 있다. 즉, ORF 14 (서열 15)의 생성물은 아미노산 2 및 4의 방향족 잔기의 가교결합과 관련되기 쉽고; ORF 12 (서열 13)의 생성물은 아미노산 4 및 6의 방향족 잔기의 가교결합과 관련되기 쉬우며; ORF 11 (서열 12)의 생성물은 아미노산 5 및 7의 방향족 잔기의 가교결합과 관련되기 쉽다. ORF 13 (서열 14)의 정형체는 bal, cep com 클러스터에 존재하지 않으나, sta 클러스터에서 발견된다 (표 1). A47934의 구조는 A40926의 구조와 마찬가지로, 아미노산 1 및 3의 방향족 잔기 간의 가외 가교결합을 포함하기 때문에, ORF13 (서열 14)의 생성물은 이 가교결합 반응과 관련되기 쉽다.
2D. 히드록시티로신의 형성 및 방향족 잔기의 염소화
ORF10 및 ORF28 (서열 11 및 29)에 의해 코딩되는 2개의 단백질은 헵타펩티드에서 아미노산 6으로 존재하는 티로신 잔기에 대한 b-히드록실기의 첨가 및 아미노산 2 및 6의 방향족 잔기의 염소화에 관여한다. 다른 글리코펩티드 클러스터에서 발견되는 할로게나제 코딩의 유전자와의 동일성 수준 및 bal 클러스터에 존재하는 할로게나제 유전자에 대해 예측되는 역할을 기초로 하여 (Puk 등, 2002년), ORF10 (서열 11)의 생성물은 아미노산 3 및 6의 양자 모두의 방향족 잔기로의 염소 원자의 도입과 관련되기 쉽다. ORF28 (서열 29)의 생성물은 비-헴 철 디옥시게나제의 전형인 모티프를 함유하는, 매우 관련된 단백질 부류이다. 그러한 한 단백질은 sta 클러스터로부터 예측되고 (Pootoolal 등, 2002년), 티로신의 b-히드록실화와 관련되는 것으로 제시된다. 이 히드록실화 반응의 정확한 타이밍은 현재 알려져 있지 않다. 그것은, 발히마이신의 합성에서 일어나는 바와 같이, 아미노산 6이 헵타펩티드에 혼입되기 전에 일어날 수 있고 (Bischoff 등, 2001년); 헵타펩티드 합성 중에, 또는 헵타펩티드 골격의 완성 후에 일어날 수 있다.
2E. 당의 첨가 및 변형 및 N-메틸화
ORF 9, 20, 23, 27 및 29 (서열 10, 21, 24, 28 및 30)에 의해 코딩되는 5개 단백질은 A40926 생합성의 나중 단계들 중 일부 단계에 관여한다. 그의 예측되는 역할은 하기와 같다.
ORF9 (서열 10)는 위치 4에 존재하는 아미노산 잔기의 방향족 환의 p-히드록실기에 대한 당의 부착에 관여하는 것으로 입증된, 다른 글리코펩티드 클러스터 (표 1)에 의해 코딩되는 단백질과 매우 관련이 깊다 (Solenberg 등, 1997년). 구체적으로, ORF9 (서열 10)는 A40926 아글리콘에 대한 N-아실-글루코사민 잔기의 부착에 관여하는 글리코실트랜스퍼라제를 코딩한다. 그러한 특이성을 갖는 다른 글리코실트랜스퍼라제는 다른 기재된 글리코펩티드 클러스터에 의해 코딩되지 않는다.
ORF20 (서열 21)의 동족체는 다른 기재된 글리코펩티드 클러스터에서 발견되지 않는다. 이 단백질은 단백질 만노실트랜스퍼라제 부류의 전형인 모티프를 포함한다 (표 1). 또한, 이 ORF의 동족체는 S. 코엘리콜로르 게놈에서 (표 1), 또한 항생제 라모플라닌의 합성을 특정하는 악티노플라네스 종 클러스터에서 (WO0231155), 동정되었다. 라모플라닌은 펩티드 코어에 부착된 만노실 잔기를 포함하기 때문에, 이 모든 데이타는 아미노산 7의 히드록실기에 만노실 잔기를 부착시키는 ORF20 (서열 21)의 역할을 가리킨다. 이 추정적 역할은 또한 이하 실시예 4에서 입증된다.
ORF23 (서열 24)의 동족체는 다른 기재된 글리코펩티드 클러스터에서는 발견되지 않는다. 이 단백질은 아실트랜스퍼라제의 부류 3의 전형인 모티프를 포함한다 (표 1). A40926은 아미노당 잔기의 NH2 기에 부착된 아실 잔기를 포함하기 때문에, 이 ORF의 생성물은 A40926 착체를 특징화하는 화합물 부류를 초래하는 A40926 전구체의 아실화에 직접 또는 간접적으로 관련되기 쉽다.
ORF27 (서열 28)의 동족체는 balcep 클러스터에서 발견된다 (표 1). cep 클러스터로부터의 ORF27의 동족체가 클로로에레모마이신 중간체의 말단 류신 잔기의 N-메틸화에 관여한다는 것이 입증되었다. HPG 잔기는 A40926에서 N-말단 위치에 존재한다. 결과적으로, ORF27 (서열 28)의 생성물은 글리코펩티드 전구체에서 HPG 잔기의 N-메틸화를 촉매하기 쉽고, 이에 따라 다른 기재된 메틸트랜스퍼라제와 상이한 특이성이 부여된다.
ORF29 (서열 30)의 동족체는 다른 기재된 글리코펩티드 클러스터에서는 발견되지 않는다 (표 1). 이 단백질은 FAD 결합의 전형인 모티프를 포함하고, 이는 헥소스 옥시다제에 대한 상당한 매치를 나타낸다 (표 1). A40926는 아미노산 4에 부착된 글루쿠론아민계 잔기를 포함하기 때문에, ORF29 (서열 30)에 의해 코딩되는 단백질은 글루코사민 잔기의 산화와 관련되기 쉽다. 이 단백질은 또한 세포질로부터 분비된 단백질의 전형인 추정적 시그널 펩티드 서열도 포함하기 때문에, 이 산화는 글리코펩티드 코어에 부착된 글루코사민 잔기를 기질로서 사용하여, 세포질 외에서 일어나기 쉽다.
2F. 외수송 및 내성
ORF 7, 18, 19, 24 및 35 (서열 8, 19, 20, 25 및 36)에 의해 코딩되는 5개 단백질은 세포질 외로 A40926 또는 그의 전구체 일부를 외수송하는 것과 생산 균주에 내성을 부여하는 것과 관련된다. 그의 예측되는 역할은 하기와 같다.
ORF7 (서열 8)의 동족체는 다른 기재된 글리코펩티드 클러스터에서 발견되지 않는다. 이 단백질은 VanY 부류의 카르복시펩티다제의 전형인 모티프를 포함한다 (표 1). 이 부류는, 발생초기 펩티도글리칸에서의 펜타펩티드 사슬들 중 일부로부터 말단 알라닐 잔기를 제거하고, 이에 따라 분자 표적에 대한 글리코펩티드 결합 정도를 감소시키는 것과 관련된 일부 반코마이신-내성 장내구균에서 가장 잘 연구된다 (Evers 등, 1996년). 그러므로, ORF7 (서열 8)는 생산 균주 노노무리아종 ATCC38727에서 A40926에 대한 어느 정도의 수준의 내성을 부여하는 것과 관련되기 쉽다.
ORF24 및 ORF35 (서열 25 및 36)의 동족체는 다른 글리코펩티드 클러스터에 존재한다 (표 1). 그것은 ABC-형 및 이온-의존성 막통과 트랜스포터를 각기 코딩하는 것으로 예측된다. 이에 따라, 그것은 A40926 또는 그의 전구체 중 일부의 외수송 또는 구획화하는 것과 관련되기 쉽다. ORF18 및 ORF19 (서열 19 및 20)의 동족체는 다른 기재된 글리코펩티드 클러스터에서 발견되지 않는다 (표 1). 그것은 부가적인 ABC-형 트랜스포터를 코딩하는 것으로 예측되고, 이들 중 단지 ORF18 (서열 19)만이 막통과 단백질인 것으로 예측된다. 이에 따라, 그것은 A40926 또는 그의 전구체 중 일부의 외수송 또는 구획화와 관련되기 쉽다.
2G. 조절
ORF 3, 4, 6 및 22 (서열 4, 5, 7 및 23)에 의해 코딩되는 4개 단백질은 dbv 유전자들 중 하나 이상의 발현을 조절하는 것과 관련된다. ORF3 (서열 4)의 동족체는 다른 기재된 글리코펩티드 클러스터에서 발견되지 않는다. 이 단백질은 LuxR 부류의 양성 조절자의 전형인 모티프를 포함하고, 스트렙토마이세스 하이그로스코피쿠스로부터의 PKS 클러스터에서 발견되는 하나의 양성 조절자와 주로 관련이 있다 (Ruan 등, 1997년). ORF4 (서열 5)의 동족체는 다른 글리코펩티드 클러스터에 존재하고 (표 1), LysR-형의 양성 전사 조절자의 부류에 속한다. 그러므로 ORF 3 및 4 (서열 4 및 5)는 dbv 유전자들 중 하나 이상의 발현에 필요하기 쉽다. ORF6 및 ORF22 (서열 7 및 23)는 세균 2-성분 신호전달 시스템의 2개 원을 코딩한다. 전자 단백질은 가능히 반응 조절자이고, 최적의 매치가 S. 코엘리콜로르 CutR 단백질에서 발견된다 (표 1). 후자 단백질은 S. 하이그로스코피쿠스로부터의 추정적 센서 단백질 키나제와 주로 관련이 있는, 가능한 막통과 히스티딘 키나제이다 (표 1). 그러므로 ORF 6 및 22 (서열 23)는 dbv 클러스터들 중 하나 이상의 발현을 촉발하는 시그널을 감작하는 것과 관련되기 쉽다.
실시예 3 - ESAC 벡터 내에서의 dbv 클러스터의 단리
실시예 2에 제공된 정보를 이용하여, dbv 클러스터를 하기와 같이 ESAC 벡터에서 단리하였다. pPAC-S1 벡터에서 노노무리아 ATCC39727로부터의 DNA로 게놈 라이브러리를 제작하였다 (Sosio 등, 2000b년). 노노무리아 ATCC39727로부터의 DNA를 기재된 바와 같이 아가로스 플러그에 삽입하여 제조하였고 (Sosio 등, 2000b년; W099/67374), Sau3AI로 부분 소화시켜, 단편 크기를 100 내지 200 kb 범위로 최적화하였다. 수득된 DNA 단편은 기재된 바와 같이 PFGE 겔 상에 간략히 가동하고, 회수하여, 아가로스-겔로부터 분리시켰다 (Sosio 등, 2000b년; W099/67374). 벡터 제조, 라이게이션 및 이. 콜라이 DH1OB 컴피턴트 세포의 전기충격을 포함하는 수득된 단계들을 기재된 바와 같이 수행하였다 (Sosio 등, 2000b년; W099/67374). 수득된 콜로니를 나일론 필터 상에 배치하여, 2개의 프로브를 이용한 혼성화에 의해 선별하고, 노노무리아 ATCC39727 게놈 DNA로부터 PCR-증폭시켰다. 올리고 5'-TCAGGAGACGAACCCCGC-3' (서열 43) 및 5'-GTGCACGAAAGTCCCGTC-3' (서열 44)를 이용하여 프로브 A를 수득하였고; 5'-ATGGACTCCCACGTTCTC-3' (서열 45) 및 5' TCAGGGGAGACATGCGGT-3' (서열 46)을 이용하여 프로브 B를 수득하였다. 이 모든 서열들은 서열 1로부터 유도되었다. 이어서, 이 모든 프로브들에 대해 양성인 ESAC 클론을 단리하여, EcoRI 및 EcoRV로 소화함으로써 물리적으로 맵핑하였다. 그러한 한 실험으로부터, 약 84 kb의 삽입부를 포함하는 ESAC 클론 NmES1를 단리하였다. NmES1는 전체 dbv 클러스터 (서열 1)의 폭을 가지고, 서열 1의 뉴클레오티드 1에 대해 약 5 kb 5', 또한 서열 1의 nt 71138에 대해 약 8 kb 3' 확장한다.
상기 실시예는 dbv 클러스터를 ESAC 벡터에서 수득할 수 있도록 하는 원리 및 방법을 설명하기 위한 것이다. 당업자는 벡터 pPAC-S1는 이 목적을 위해 사용될 수 있는 ESAC 벡터의 단 한 가지 예일 뿐임을 인지할 것이다. 전체 dbv 유전자 클러스터를 클로닝하고, 적당한 방선균류 숙주에 전달하기 위해 유용한 다른 벡터가 기재되어 있다 (Sosio 등, 2000b년; W099/67374). 또한, 비제한적으로 이. 콜라이 세포의 부분 소화, 단편 분리 및 회수, 벡터 제조, 라이게이션 및 형질전환을 포함하는 노노무리아 종 ATCC39727 DNA의 큰 삽입부 라이브러리를 제조하기 위한 다른 방법도 또한 본 발명의 범주 내에 포함된다. 당업자는 일단 dbv 클러스터의 경계가 서열 1에서와 같이 구축되면, 상기한 프로브 A 및 B 이외의 임의의 프로브 또는 프로브들의 조합이, 삽입부가 전체 dbv 클러스터의 폭을 가지는 클론을 동정하기 위해, 노노무리아 종 ATCC39727 DNA로 제작된 라이브러리를 선별하는데 사용될 수 있음을 인지할 것이다. 대안적으로, 서열 1 및 표 1에 제공된 정보를 이용하여, 이종성 혼성화를 허용하기 위해 dbv 유전자와 충분히 관련된 유전자를 포함하는 다른 유전자 클러스터로부터 다른 유용한 프로브를 수득할 수 있다. 이 모든 변형들은 본 발명의 범주 내에 포함된다.
실시예 4 유전자 대체에 의한 A40926 경로의 조작
실시예 2에 제공된 정보를 이용하여, ORF20에서의 인프레임 결실(in frame deletion)을 하기와 같이 구축하였다. 올리고 5'-TTTTGAATTCTCAGGCGATCCGTCCGTCT-3' (서열 47) 및 5'-TTTTCTAGAGCCCGGACACCCGGGGGCTGA-3' (서열 48)을 이용한 증폭을 통해 단편 A를 수득하였고; 올리고 5'-TTTTCTAGAAGTCATGGTGATGTGCGACAT-3' (서열 49) 및 5'-TTTTAAGCTTATGTTGCAGGACGCCGACCG-3' (서열 50)을 이용한 증폭을 통해 단편 B를 수득하였다. 그 다음에, EcoRI 및 XbaI을 이용하여 단편 A을 소화시켰고, XbaI 및 HindIII를 이용하여 단편 B를 소화시켰으며, 양자 모두를 EcoRI 및 HindIII로 미리 소화된 pSET152 (Bierman 등, 1992년)에 라이게이션시켰다. 이. 콜라이 DH5a 세포의 형질전환 후에, EcoRI 및 HindIII로 소화시킨 후, 4 kb 및 1.5 kb의 단편의 존재에 의해 pSM4로 표시되는 수득된 플라스미드가 인식되었다. 분취량의 pSM4를 이. 콜라이 ET12567 (pUB307) (Kieser 등, 2000년) 세포에 옮겨, 균주 SM4를 수득하였다. 이어서, LB에서 하룻밤 배양하여 수득한 약 108 CFU의 SM4 세포를 약 80시간동안 Rare3 배지에서 성장한 약 107 CFU의 노노무리아 ATCC39727과 혼합하였다. 수득된 혼합물을 HT 플레이트상에 전착시킨 후, 28℃에서 약 20시간 동안 배양하였다. 물로 완만히 세척하여 과량의 이. 콜라이 세포를 제거한 후, 200 mg의 날리딕스산 및 15 mg/ml의 아프라마이신을 함유하는 3 ml 연성 아가를 플레이트 위에 깔았다. 28℃에서 3 내지 5주 동안 추가 배양한 후, 노노무리아 접합완료체를 아프라마이신을 포함하는 새 배지 상에 도말하였다. 균주 SS18라고 하는 그러한 한 접합완료체를 추가 가공하였다. 이어서, 균주 SS18을 아프라마이신이 없는 HT 배지에서의 수차례 통과시키면서 성장시키고, 적당한 희석액을 아프라마이신이 없는 HT 아가 상에 플레이팅하였다. 이어서, 개별적 콜로니를 올리고 5'-TTTTGAATTCTCAGGCGATCCGTCCGTCT-3' (서열 47) 및 5'-TTTTAAGCTTATGTTGCAGGACGCCGACCG-3' (서열 50)을 이용하여, PCR에 의해 분석하였다. 1.5 kb 밴드의 존재에 의해, ORF20의 결실 대립유전자를 포함하는 콜로니를 인식하였다. SSM18이라고 하는 그러한 한 콜로니를 HT 배지에서 성장시키고, 오센틱 스탠다드(authentic standard)와 비교함으로써, 데만노실-A40926의 형성을 확인하였다 (Malabarba 및 Ciabatti, 2001년).
상기 실시예는 서열 2 내지 38에 의해 특정화는 것들 중 임의의 것 중에서 선택되는 ORF를 A40926 생산 균주 노노무리아 종 ATCC39727에서의 변이 카피와 대체할 수 있도록 하는 원리 및 방법을 설명하기 위한 것이다. 당업자는 서열 1에 의해 특정된 클러스트에서의 인프레임 결실을 일으키기 위한 방법들 중 단지 한 예임을 인지할 것이다. 당업자는 또한 인프레임 결실이 변이를 발생시키기 위한 단지 한 방법이고, 비제한적으로 프레임-시프트 변이, 삽입 및 부위-지정 변이를 포함하는 다른 방법들도 또한 서열 2 내지 38에 의해 특정된 ORF 중 임의의 것에서의 공변이체를 발생시키는데 사용될 수 있다는 것을 이해한다. 당업자는 또한 서열 1에 의해 특정화되는 ORF 중 임의의 것에서 변이를 발생시키는 방법을 구축함으로써, 이 동일 방법은 상기 동일 ORF의 발현 수준을 변경하는데 적용될 수 있음을 이해한다. 이 것을 달성할 수 있는 방법의 예는, 비제한적으로 노노무리아 종ATCC39727 게놈 내의 임의의 곳으로의 상기 ORF의 다중 카피의 통합, 상기 ORF의 발현을 조절하는 프로모터의 변경, 그의 발현을 간섭하는 안티센스 RNA 또는 전사 종결자의 제거를 포함한다.
마지막으로, 접합완료체 및 그의 유도체의 선택 및 선별 방법에서, 변이된 대립유전자를 공여자 및 수령자 균주의 복합화 및 배양을 위한 조건하에서 노노무리아 종 ATCC39727에 도입하는데 사용되는 벡터에서의 변형들은 모두 본 발명의 범주 내에 포함된다.
참고문헌
SEQUENCE LISTING <110> Vicuron Pharmaceuticals Inc. <120> Genes and proteins for the biosynthesis of the glycopeptide antibiotic A40926 <130> G69039 <160> 50 <170> PatentIn version 3.1 <210> 1 <211> 71138 <212> DNA <213> Nonomuria <220> <221> misc_feature <222> (40)..(1140) <223> ORF1; negative strandedness <220> <221> misc_feature <222> (1259)..(2329) <223> ORF2; negative strandedness <220> <221> misc_feature <222> (2558)..(5161) <223> ORF3; negative strandedness <220> <221> misc_feature <222> (5266)..(6231) <223> ORF4; negative strandedness <220> <221> misc_feature <222> (7183)..(8292) <223> ORF5; positive strandedness <220> <221> misc_feature <222> (8320)..(8973) <223> ORF6; positive strandedness <220> <221> misc_feature <222> (9069)..(9659) <223> ORF7; positive strandedness <220> <221> misc_feature <222> (9708)..(10667) <223> ORF8; negative strandedness <220> <221> misc_feature <222> (10670)..(11896) <223> ORF9; negative strandedness <220> <221> misc_feature <222> (11950)..(13419) <223> ORF10; negative strandedness <220> <221> misc_feature <222> (13479)..(14741) <223> ORF11; negative strandedness <220> <221> misc_feature <222> (14823)..(16019) <223> ORF12; negative strandedness <220> <221> misc_feature <222> (16009)..(17163) <223> ORF13; negative strandedness <220> <221> misc_feature <222> (17185)..(18366) <223> ORF14; negative strandedness <220> <221> misc_feature <222> (18462)..(18671) <223> ORF15; negative strandedness <220> <221> misc_feature <222> (18668)..(24259) <223> ORF16; negative strandedness <220> <221> misc_feature <222> (24278)..(36529) <223> ORF17; negative strandedness <220> <221> misc_feature <222> (36760)..(39021) <223> ORF18; negative strandedness <220> <221> misc_feature <222> (39153)..(39851) <223> ORF19; negative strandedness <220> <221> misc_feature <222> (40125)..(41732) <223> ORF20; negative strandedness <220> <221> misc_feature <222> (41772)..(42584) <223> ORF21; negative strandedness <220> <221> misc_feature <222> (42868)..(44130) <223> ORF22; negative strandedness <220> <221> misc_feature <222> (44226)..(46355) <223> ORF23; negative strandedness <220> <221> misc_feature <222> (46632)..(48578) <223> ORF24; positive strandedness <220> <221> misc_feature <222> (48575)..(54868) <223> ORF25; positive strandedness <220> <221> misc_feature <222> (54865)..(58056) <223> ORF26; positive strandedness <220> <221> misc_feature <222> (58152)..(58985) <223> ORF27; positive strandedness <220> <221> misc_feature <222> (59046)..(60641) <223> ORF28; positive strandedness <220> <221> misc_feature <222> (60874)..(62445) <223> ORF29; negative strandedness <220> <221> misc_feature <222> (62887)..(63312) <223> ORF30; positive strandedness <220> <221> misc_feature <222> (63469)..(64587) <223> ORF31; positive strandedness <220> <221> misc_feature <222> (64599)..(65240) <223> ORF32; positive strandedness <220> <221> misc_feature <222> (65237)..(66541) <223> ORF33; positive strandedness <220> <221> misc_feature <222> (66538)..(67335) <223> ORF34; positive strandedness <220> <221> misc_feature <222> (67332)..(68618) <223> ORF35; positive strandedness <220> <221> misc_feature <222> (68685)..(69423) <223> ORF36; negative strandedness <220> <221> misc_feature <222> (69608)..(70894) <223> ORF37; positive strandedness <220> <221> misc_feature <222> (71065)..(71138) <223> attL site, remnant <400> 1 gggggctggg cctgctgcgg ctcgcgagcg ggctgacggt caggagacga accccgcgcc 60 ggggcgggtc gtcctgagtg cctgggctgc ggcgacgtcg ccgcagcctg ccaggccgag 120 cccgtcctcg atctcggcac ccaggaggcc gagcaccgta cggacccccc gttcgccgtc 180 cgcggccaga ccccagatca cggggcgtcc gacgagcaca cccgacgccc cgagcgccag 240 cgccttgagg acgtcggctc ccgaccggac gccaccatcg agcatgatct cgcagcggcc 300 cccgacgctc tccgccaccc ccggcagcgc gtcgagactg gccacggcgc cgtcgagctg 360 acgtccgccg tggttggaga ccacgatgcc gtcgatgccg aggtccgcgg cgcggcgggc 420 gtcctcgggg tgcagaatgc ccttgaccac cagcgggagc ccgctggcgg cccggagggt 480 ctcgaggtac gaccagtcca ccgcggcgga gagctccatg gccgtgtgcg ccgccagcgc 540 ggagccgccg gaggcacccc gatgagcctc ggtcccggag ttcgccgtca ggtgcacggg 600 ccgcacgtgc gggggcaggc ggaaccggtt gcggatgtca cgtggcctgc ggcccatcca 660 cggcacatcg agcgtgagca tcaacgcccg gcaccccgcg tcctcggccc ggcggatcag 720 gccgagggtg gcggcgtgct cgcgaaggca gtagagctgg aaccagacgt gtccccccag 780 ggcggtgacg tcctccaccg ggacgctgct caaggtgctg acggtgaacg ggaccccggc 840 gtcccgcgcc gcccgggccg tcgccagctc accgtcggga tgcacgagcc ggtggtaggc 900 gacgggggcc accgccaccg gcatcgtcgc ggggtggccc agcagcgtcg cacgggtgga 960 gcacgccgac acgtcctgga gcacccgcgg caccaggaac acccggtcga aggcggcccg 1020 attcgcacgg agggtctgct cgcggccgct cccgccgtcg atgaagtccc ggacgtcggc 1080 ggggaggacc ttggcggcga tctcctcgta ctcggcgagg cagacgggac tttcgtgcac 1140 gctgtcagga cgctcgggcc cgctgccggg acgctcgggc ccgctgccgg gacgctcggg 1200 cccgctgccg ggacgctcgg gcccgctgcc gggacgctcc cgcacgctgc tgggacgctc 1260 atgcacgctg ctgggacctc gccacctcga cggcctcgta gagggccttg atgttggcgc 1320 ctccgaaggt gcgggctccc tgccgctcga tgacctcgaa gaagagggtc tcgcgcggat 1380 gggtggacgc cgtgaagatc tggaagagct gtccgccgtg atcctcgtca gcgagcagtc 1440 ccgtcgcgcg caactggtcc accgtgtgac cccggatctg gatccgtgat tcgagcaggt 1500 cgtagtagct gcccggcgtg ctgaggaagc ggacgccccg ctcggacagg gtgttcacgg 1560 cgtgcacggc gtccgaggag gagaaggcga cgtgctgcac cccggcaccg gcgtgccgtt 1620 cgaggaacat gtcgatctgg ccggcctcgg ccatcgggtc gggttcgatg agtgtcagcg 1680 tgacggcgcc ggaggcgctc tgcaccacct tggactccat ggcctgggtg ccgacctcga 1740 tgcgttcctt gaaggtctcg ctgaagccga gggtggcgac gtagaagtcg gtgatgatgt 1800 cgaggtcacc cgtgggcagg cacacggcga agtggtcgat gtcgagcagc tccgccgcgt 1860 ccgcaccgga ctcggcggcg gacggagcct cggagaagcc gaccggcagg ccggggtcgt 1920 cgccggggtc ccgctggacg agggtgtgga ccacgtcgcc gaagccgccg atcgcggcgg 1980 agcaggccgg cccggggccg gggtgccggg acggggaccg tacgggccgg gcgccggcgg 2040 ccacggcatg ggtgaagacg acgtcgacgt cgggggtccg cagggcgatg tcggcgaccc 2100 cgtcgccgtg cgtccgcaca taggccgaag ccggatggcc gtcggacgtg gcctgggtga 2160 ggacgagggt gatgcggccc tgccggagcg cgacgctgcg atggtcgctg gcgttcgccg 2220 tgcccacgac ggcgaagcgg tattcgtcgg tccaagggag agtggcgacc ttcagatccg 2280 ctacgtacat ttcgacgtaa tcaacggcga gaggcggaag cgattccata ttccgacgct 2340 acggccgggc ggggaggttc gcaccgtgtc cattggacgc gctcgcaggc cgcgctcaca 2400 gcagattccg gtacattccc gaggcctttt caggccggcg tggacggtcg gcggatcagg 2460 cttcataaaa agcctgccct ggcgtattct cgggttaatc aaccccgatg gatatcctgc 2520 ccgaggccgg cgaattcggc ttgtcgaact cttcgctcta cagccgcact gcctcacgcg 2580 gctcgcggcc ggctgtggcc gtcgccttat cggcgatgtc cgcggcgaag aggttgccca 2640 ggtcaccccg agtctgtacg tggagtttcc gatagatcct ggtgagatgc tgctcgaccg 2700 tgctgcgcgt gatgtagagc gcctcggcga tctcacgatt ggtgtgccca cgggcggcga 2760 gcacggcgac ccgccgttcg gcgccgctca acggtgcggt ctcaccatga tcgtgctgtg 2820 cggcgagcct cctcatcaag ggcttcgcgt tgcactcgcg ggccagctcc tgcgcccgca 2880 cccagtaggc ccgggcctcg tccttgccgc ccttgagctg tggggtcccg gcgaggtcgc 2940 agagggaaag ggccagctgg tagcgatcct gggcggcctc cagcgcgtcc acggactgca 3000 tcagcaaccg ctggcgctgt gcgggcttgc tcagctgcgc gtgcaggcgg agggcgaccc 3060 cgtacgtccg caggtcaccg gaggaggtgt gggcgatctg ggccgtgacc agatcggccg 3120 ccctgcgacg ccagcccagt tgcaggcacg ctcgcgccgc gccgaggcgc caggggacca 3180 cgtcggacag gctgctgccc cagcgctgga ccgcctgccc gcatgccagg aagccggcga 3240 aggcggcgcg aggctgctcc gtgaccaggt ggtagtgcgc cctcgcgagc tcgtagccga 3300 tcccgaaggc ggtctccgcc gtctcgcggg gcatcggcac cgccacggtc gccttcgcct 3360 cgtcgaggtg gcccatcgcg gtctgggcat ggagcagggt gctgagtggc gcgccgatcg 3420 cgacgcccca gccgctgggc tgcagtatgg tcagcgcctc ctgcgcatgg gcctcggccc 3480 ccgccaggtc gcccttgcgc cacgccgtct ccgcccggat ggcggagatg atcgccttcc 3540 aggtgggcgc cttcgtcacc ccgggctcct tgaggagcgt ctcgcaggag gccgccacct 3600 ccgacactcc gcccagcagc agtgccatca gagccgagat gatgctgtcc atcgcctcat 3660 ccgtcggctc cgcctgacgc aggatccggc gcgcgtcctc gactgtctgg cccatcgagc 3720 cgcgggcgga ccggggcaat ctgtcgagaa gcaccgggtg gacgtggcac atcgcgatca 3780 aggacgcgtc ggcgtccctg tcggcgacgc tcggcctcag ccgatcgatc agctccgccg 3840 cgtcggcgaa ccggccgtac cacagcagct ggcggaacag ctccatcccg tgagatccac 3900 gcaacgcacc cgagcgcgtg gcgtcgagca gatcgggcac gtgacgtgcc gccactgccg 3960 ggtcgacgcg ccactccgcc gcggcgagca tcaccttcac gtccagccgg cgaggcgtgc 4020 cccagccgga cgccagggcg agccgtaagc acttcatgac agcgacgaaa tcaccctcgt 4080 cgaacgcctg ccttcccgct tcgacgagga cgtcgaaagc ccactcctca cccgaccagc 4140 ccgcctccag caagcgcgtg gccacagccg acggtgggcc tccccgccga tggaggatct 4200 ccgcggcccg ccggaggatc tccatcctgc cgtaggaggt catgcgcccg agtacggcca 4260 ggcggcccgc ctcatgacga aagcgccccc cggccaggag cccggcgcgc tccagcatcc 4320 ccatcgagcg tgtcgcggca ggaggggcga tgcccacgag ctcgcccacc gcgtccggcg 4380 tggcgtgctc gccgaggacg gccaccgcct ccgcgacgcg gacggcctcc ggctcgcagc 4440 catgaacgca cgctgccacc gcgctcatga aggagtcgcc gaccacgagc ccgggcgcgc 4500 cggcctcctg atcctcgatc agcgcccgga ccagcagcgg gctgccgccg ctgaagcggt 4560 agaggtcgtc ggcgagctgg tcggccgtct cggccccgag gtgctcggtg gcgaactgcc 4620 tgaccgccgg acggggcagg agcggcagct cgaccagctc gatgccgggc aggcgcagca 4680 aggactcggc gacatggggg agaggggccg gcggccggtc ctggcagatc gtgacggcga 4740 tcatcatcct ggtgtccgtc agcaggggcg tcatggacag gatggccagc agggacggat 4800 cgtcggcgag atccacgtcg tcgatcgtca ggaggatcgg gttcgcctcg gccatctgga 4860 acagggagac gcagacgtcc tcgaccgcgt caccgcccct gcgcgcggtc agccgctccg 4920 ctgccccgcg gcccaggatc tggtcggcga ccccccagtc cagcgactgc tccgccggcg 4980 tgcagcgggc cgtgaccagc cggatgccgg ccgcgatgga tcgcatgccg agctcgtgga 5040 ggatggcggt cttgccgccg accacaggcc ccgtgatgac ggccactcca ccgcggccgg 5100 ccgcggtgga atcgagcaac ctcgtcagac tcttcagttc acgatctcgc ccgaacagca 5160 ctcttgctcg tcccccaagc ggttcgtcga cttggtttgc cgtgtgcctg atctggtcct 5220 ggtcccgtcg ctctacatac ggccgcccgg ctcatccact cgtgctcatc cagcggccag 5280 atcggtcgcc cgcccctcca ggcgatccgc gaacgctgcc cagatctggg catgatccct 5340 ggcgcatctc gcgacaacgg tgccccaatg cggcggcact ccgcgcaaga tcctttccca 5400 ttcctgcccg tcgatggagt gcaatgatag cattcgcaac aaaattcggc cggtttcggt 5460 cagacgtaat gcgggatcgg ccttgagcct ttccagcacg gcttggcggt ctcggccgtc 5520 gacgtggccg aaatcctgtt ctgcccgacg cagtaattcc ggcttggtcc ttaatctccg 5580 gctcccgtcc ggaatcgggc tctcaccgtg ctccaaccgg cctctcacat cccggaccgt 5640 ctccggggag atgccgacct gtttggcgac ctggcggagc gaaaggtccg gatggctgcg 5700 gatgagctcg gcggcgagtc tcctcccctc tgagctgtcc accggacgga tgcgcccgtc 5760 ccgcccgatt ctggcctcgt caccgccttg tcctctgcgc ctgcgcaggt cggccaccgt 5820 gccggcggag atgccggtcg ccgaggccac ccgtcgatca gaccactgcg gatgtgtccc 5880 gatgatccgg acggccgcac gcttgcggtc ggccagtgag agcggcagcc cgtgccgcac 5940 gttcgcctcg acggccagga cgaaggcgtc cgattcggtg ccgtcgatca gcctcaccga 6000 gattgttgtt tcacccctga cccgcgccac cttcaaccgg tgcaggccgt cgatcacccg 6060 catcgttgga cggtggacga gaatgggcgg aagctcccct tgtgccgaca acagggtctc 6120 gacgtgctct ggatcctcgc ccgaagtccg gggtgagtac acagaggaca gccgggacag 6180 ctcgatttcg acgacaggga gagtggctat gtcaactccc gtcgggtcca cctagcctcc 6240 gattcgatta gcgtcatatc ggagccgggg gcgttcaaaa aacaacccag ccgcgtgcgc 6300 cgcgcgcacc ttcgacgatt ccccgtcgcg cctgcagcat ctggtcccgg gcaagcctgg 6360 acttcccggc gcgagctgca taaatcgatc ggccaagtgc tctgtcgaga gaatgcgtcg 6420 catcctcttt tcttcggcaa ctccacgcgg caaagaattg gacgctgtcg ccgcgaatcc 6480 gtagccgtct acctcatcga attgcagaac gcttcccgtt agcattccga tcactccgac 6540 tttcggttag gccttcctcc ggaaggttaa aggaggctgt gcaggtcgaa ccacccccta 6600 tcccggacat ccacccccct agtttcggat aagaccgatg cgcggggttg cgcctctgtc 6660 gcgaagcgga gtatccggtg ctggaccgcc cgaatcgagc ggtcaccatg cgtgtcaatc 6720 cgtgtgtatt ggcatgcgcc gtcggcgcga gcccggcggg gccgcggcgg tcccacggtt 6780 tcgctcatga caccgtctcc aggtgagggt gatcgcggta gccggccacg ggcgcgctgc 6840 cgcagcggcg gccatgctga tctgcccatg gaccagcagg ccgacggtga ggtcccgccg 6900 gacggccggc tcccggtaca acgtacgtca gttcttctcg gcgatctagg ggagtgggcg 6960 gggtgccttc gccgggcatg cgggcggcct gtcctttggc aattgacagg cgtgaatgca 7020 gaaaggagcg cggccacctc tgacctgccg agtaagggaa tggattactc atcaatggcg 7080 ccggtggcca cggaactcgc ccggcgatcc ggcgtgtcca aatggcgcgg tgcccaggcc 7140 cgccgatgga caccgcccgg tgcgcgggct taagaagtag ccgtgaccct ggagaggacg 7200 ctcatcgtcg gcaccggtct gatcggcacc tccgccgcgc tcgcccttcg cgagaagggg 7260 gtggcggtct acctgtccga cgtcgacgca catgccgtac ggctggcgcg agcgctcggc 7320 gcgggccagg agtggaccgg tcagcgcgtg gacctggcat tgatcgccgt gcccccgccc 7380 agcgtggggc agcggctggc cgatctgcag cagcggcggg ccgcgcgggc gtacaccgat 7440 gtgaccagcg tcaaggtcga tccgatcgcc gacgcggagc ggctcggctg cgacctgacc 7500 tcctatgtcc ccggacaccc gctcgccggc cgggagcggt ccggcccggc cgccgcccgt 7560 gccgatctgt tcctgggacg tccctgggcg ctctgccccc gccctgagac gggtgcggat 7620 gccgtgcggc tggccaggga gctggtctcg atgtgcgggg cggagcccta caccgtgagt 7680 gcgggcgagc acgacacggc ggtggcgctg gtgtcgcacg ccccgcacgt ggccgcgtcc 7740 gcggtggcgg cgcggctgag ggacggcgac gacgtcgcgc tggccctggc ggggcagggg 7800 ctgcgcgacg tgacgcggat cgccgcaggg gaccccctgc tgtggcggat gattctcgcc 7860 gcgaacgccc tgccggtggc cggggtgctg gagcggatcg cggccgatct cgccgcggcg 7920 gcctcggcgc tgcggtccgg cgatctcgac gatgtgacgg atctgctgcg gcgcggcgtg 7980 gacggccacg gccggatccc cgacaagcac ggcggcccgg cgcgtgacta cacggtgatc 8040 caggtggtgc tgcaggatcg gccgggagag ctggcgaggc tcttcaacgc ggcggggctc 8100 gcggacgtca acatcgagga catccgcctg gagcactcgg ccggcctgcc ggtcggggtg 8160 gtcgaggtct ccgtgcgccc ggaggacacc ggccggctca ccgaggcact gcgcttccac 8220 ggctggcacg tcccgcccgt ccccgacggc aactcgagga tcgaccggac gcgagctatg 8280 gtgtcagact gacagccccc gatcgagacg gcgacacgaa tgcgcgttct ggtggtggag 8340 gaccaagtcg acctggccga ctcggtggcg cgggtgctgc gtcgcgaggg catggccgtc 8400 gatgtcagtc atgacggcga tgacgcacag gagcgcctct ccgtgatcga ctacgacgtc 8460 gtggtgcttg atcgggatat tcccggcgtc catggcgacg agctgtgcgc tgagatcgcc 8520 gtggacgatc gcaggacccg ggtgctgatg ctcaccgcgt ccgggacgac cgctgaccgg 8580 gtggcgggcc tgagcctggg cgccgacgac tatctgccga agccgttcgc cttcgccgag 8640 ctggtggcgc gcatccgcgc cctgggcagg cgcgcgcatc ctcccgcgcc gccgatcctg 8700 gtccacggcg acctgcggct cgatccggcg caacgggtgg cgatcagggg cggcatgcgg 8760 ctgccgctga ccaccaagga gctggcggtc ctggagcatc tgctgaccgc gcgcggccgg 8820 gtggtgtcgg ccgaggagct gctcgaacgg gtctgggacg agcaagccga cccgttcacc 8880 accaccgtga aggcgacgat caaccggctg cgctcgaagc tcggccagcc gccggtgatc 8940 gaaaccgtcc cgcgcgaggg atatcgcatc tgatccgcgc ggtcacagag cggtcacacg 9000 ttctctgacc ctcgtgtcac cttctgctcc gtagaactgg tgtcagatca ccagactgga 9060 ggagagggat gaggagaagc gagggtgacg acgaaccacg cactctcccg cctcgggccc 9120 gggaccgggt gtacaccgcg gtcacgcggg tgctcgccgt gctcctgctg cccgtggcgt 9180 tcgtccgtca gcccggccgc gcccgcgagc tggcctgcgg ctgggcgttg aggatgcgat 9240 tcccggcaga ggacctcacc gggctcaccg acggcgccag ggcggcgttc accgcggcgc 9300 gggccgaggc gctgtggcgt cacggccagc tcgtcggtct cacttccgga taccgcgatc 9360 cccgggtcca gcagcggatg ttcgaggagg aggtgcgccg ctcagggtcc gtggccgccg 9420 cacggatgtt cgtggcgccg ccggccgagt ccaaccacgt caagggcatg gcgctggacg 9480 tacgcccgca cgagggcgcg cgctggctgg aggcgcacgg cgcccgctac gacctctacc 9540 gcatctacga caacgagtgg tggcacttcg aacaccgccc ggagtgcggt ggcacgccac 9600 cacggcggct accccaccca ggcgcggcct gggcgagccg gaacgggggc cgggtctagc 9660 tagggcacgg ggtcgccgcg gggatcggtc cccggccggc ttcggcgcta gggcagctcg 9720 atgcggccgc tccgctgata ccagtgacgg cccgccagca aatgggtgac gaccgccttc 9780 tccagcgtcg agcgctgcgg aagctcctcc agcggctggc cgttgtagcg gaagacgaac 9840 tccaggatcg cgtcgtcccc gtcctgcggt tcggagtcga ggagcgtcca gccgcgtctg 9900 agctgcagga tgtgggagtc ctcggcgaga tactcggcca gctgcggatc gagcagccac 9960 gaggtgcctg tcgccgcccg ggcgccgtgc tcgggaaaat gccgttcgaa gaacgggcgg 10020 gcacgacgga gcgagtcgta atagatgtcg gggatcagcg gcccgcccac ttcggggatg 10080 tgcaggccga ggacgggcgt gccgtccttg gcgacggcca ggttgtactg gagccggccg 10140 agccggtaga ccaggccgcg cacgagcagg gtgagccacc acggcatgtt cgtgccgccc 10200 tcgccgtact tgcggcgatg gatggccacc gattccccca gctgcgtcag ggtctcccag 10260 gtggtcgcct cggggatgtc ccgtgtcgcg tggaagcgcc gcaacgccgg aagcgtcgcg 10320 aggaagacgt acacgtggaa gtagcgggcg gcggccccgg tctcgtacgg cagggtcggc 10380 ccaccccgta ccttcacctt gtagtcgccc atgtgccgga cgagctcgtg gtgggcgcgt 10440 tcgagcagcc accacagggc cgggtcgcga tccgggccgg gggtggccgc cacgatctcc 10500 tcgacgtcgg gagccggcac ctccagccgg tgtaagagat cacgagcctc atcgccctga 10560 ggcaggcgca ccggctcggg gggcggtccg agctcctcga gccgggagag ccacgccgtg 10620 gcgttctctc ccagccgcag ctgcctgcgc acgctctcag catccatcgt cactccgttc 10680 tgttccgccc ggccccggcg gccgtgtcga gcaggagttt cgcggccacg gccgccccgt 10740 cggcgcggat cttcccggcc acgtcgatcg cccgcgcgcg ggtctcggga gccagcgccg 10800 tggtgagcgc ggccgacagg ctctccacgg tcggcacccg cccgtcgtgt gccacgccga 10860 tgcccagctc ggccacccgg ccggcgtggt acggctggtc ggtcatctgg ggcaccacga 10920 cctggggagc gcccgcccgg gtgaccgcgg tcgtgatgcc cgcgctgccg gcgtggacga 10980 cggcggccac ccggccgaac aacacctggt ggttcacctc gccgacggtc aggcagtcgc 11040 tccggtcgtc gggcggggct aggccggccc agccacggga gacgatcacc cggtggccat 11100 gggcccggat cgcctcgatg gccaccctcg cggcgtcggt gggggcgggc ccgctgccga 11160 actccacgtg caccggtggc gggccggcct ccaggaacgc ctccacctcg gcgggcaggg 11220 gccgttcgtc gggcatgatc cacgcaccgg tctgcacgac gtcgaggtcc gtccgctgca 11280 gcggggccag gaccgggtcc gcggccagga aggggcgatc ggtgtagccg tagctgaaga 11340 tgtcgtccac cggcggcagg ccgatcgagg cccgccggct gttgagcgcg gcaccgaacc 11400 gctggtaggc gccctggttg ttgcggtccc acagcacccg gttgtcggtc acgtcccgcg 11460 cgggctgctc accgaggggt ggcggcggcg ggtagtacgg cgacggcaca tagatggggc 11520 agtagaagac gtagacgtag gggatgccga gcttctcggc caccgaccgg acggcgaccg 11580 ccgccgacag cacgccgctc accaccatca cctcgcaccc ctcggcggcc ggcaggacct 11640 ggtcgagctg cgtggcgatg gcctcggcgt cgagccgggg cacgtcctcg agcgagggcg 11700 gcctcttccc gtgcagcttc gcgcgcatcg aggtgccgac cggcaccagc ggcaccccgg 11760 cctcggccag tctctccgcg cagtccggcg gggcgcacat ccgtgtctcc gcgcctagct 11820 cacgcagctg gaccgccagg cccagcagcg gttcgacgtc cccgcgtgat ccggacgtcg 11880 acaacaacac gcgcatgtcg tatccctgtt ccgtggattc tggtgcggat cgatcggaag 11940 gccggagcct caggggtgat gtgtcagcca tctcatcccg tcgggtgagg tcaccagccc 12000 gccggggaac agtggctgct cgggctcggc gtccgcaccg agcaccgccc tcatctgctc 12060 ctgcccgccc tcctgcatca cctgtttgac cacctgtgac ttgaacagcg gcaccatgct 12120 ggagtcgtcg ccgtcggcca tctgatcgac ggccgcggcg aactcggcgc tgcgctcggc 12180 gatccgccct gaggtcgcca gcgccgtctc gccggaggac agaccgccca ccaggtccac 12240 gaacgactcc agctcggtgt actccttgtt gttggtgacc ttcttggcgt gccagaaata 12300 cgactcctcg ttcacgttca tctcgtagaa cgccagcagg aactcgtagt acacgctgta 12360 ctcgcggcga tatcgcgcct cgaactcatg cagcgcgatc ttctcctcga cgtcaccggc 12420 caggacgctg ttgatcgacc gggccgccag gaggccgctg taggtggcca ggtgcacccc 12480 ggaggagaac accgggtcca cgaagcacgc ggcatcgccc accaggatca tcccgggccg 12540 ccagaacttc gtctggtggt aggagtagtc cttgcggacc cgcagctgcc cgtacttgcc 12600 ggtcgtcacc cggcgcgccg gcgcgaggta ctccgagatc agcgggcact cggcgatcag 12660 cgcggccagc gccttctccc gatcgccctg gatcttctcc gccatctccc ggcgcaccac 12720 cgcgcccacg ctggtcagcg tgtcgctcag cgggatgtac cagaaccagc cgctgtcgaa 12780 ggccacgctc aggatgttgc ccgagtacgg ctccgccagc cgcttgccgc cctcgaagta 12840 accgaacagc gccaggctgc ggaagaactc cgaatagttc cgcgtgccac cgacgctgga 12900 atacaaccgg ctcttgttgc ccgacgcgtc gatcacgaaa cgcgcggaca ccgcgtgctc 12960 gccgccgtca ggatcgacgt aacgcaggcc ggtgacccga tcgccgtcct cgatcacctc 13020 ggtgaccgag catccctcac gcaccaccac gcccttgcgt ctggcgttgc cgagcaggat 13080 ctcgtcgaag cgtgcccgct ccacctggta ggcgaaagtc gtcggacccg tgatccgcgg 13140 agagacggag aaggagaacg tccacggctc cggccgcgcc ccccaccgga aggtgccccc 13200 gcgcttcacg ggaaaccccg ccgccgcgag ctcgtccgtc accccgagca tccggcacac 13260 cccgtgcacg gtcgagggca gcaacgactc gccgatctga taccgcggaa agacttcctt 13320 ctccaccagc agcacccgat gaccctgcat ggccaccagt gtcgccacgg tcgaaccgcc 13380 agggccgccg ccggcgacca ccacatcgaa ctcttccacg gacttctcct ttttcgttgt 13440 ggtcatgcga agtcgcccgg catttcggcc gcaggccgct accaggtgac cggcaactcg 13500 tccgggcaat cgatgaacgc gttacggaac ttcacttcct cggcggacac cgccaggcgc 13560 agcccgggaa accggcgcca caaactctga tacgccatgc gcagcagcgt cctggctatc 13620 gccgcgccta tgcagtaatg gatgccgtgc ccgaacccga cgtgcgagcc gcagtcacgg 13680 cgcacgtcga ggacgttggc attcggcgtc agcgcctcgt cgcgattcgc catcagaatc 13740 gagcacagga cgtaatcccc ggccttgatc agctggccgt cgacgaccac gtcccggacg 13800 gcgagccgtg gattcggctg ctgcacgggc gacaggaacc gcagcagctc accgaccacc 13860 cggtcggcct cctcgcgtcc ggcgaagaga gactgtcgct ggtcgggatg atccagcagc 13920 gcgagaaccc cgaagccgat cgaccccgcg acggtttcga caccacccag gatcagcgcc 13980 gtgagtacgc ccttcagctc ctcgtccgtg acatcgtctc cgtgctcccg caccagcatc 14040 ccgatgaacc cctcgtcagg gtccttccgc tgccggatga tgaggccgtt cagataccgg 14100 ttgaacgccg cgctgtcggc cgcccgggcc ttgaacccgc ggctgagatc gacgttctgc 14160 ctgacacgcc ggatgaactc gatccgatca tcacgcggga tgccgagcag ctcacacagc 14220 actcctccgc cgaccggatc ggcgaacagc gcctggacgt ccgcgggcgg ccccgcggcc 14280 tccagctcgt cgatgcggtc atcgatgagg tcctgcatgg cgggctccag ccggcggatc 14340 cggcgggccg tgaactccgg ggtcagcatc ccgcgcagcc gcgtgtgctc gggcggatca 14400 tagaccgaca gctgaccgac cagattcggc ggtatgggct ctccggcgat cgatggcgcc 14460 gaactccacc gggggcgcgt cgtgaagttc tcgtgatcgc cgagtattct gcgcacgacg 14520 tcgtatccca aagcctgcca gacatagtcg acacgcagct gagtggccgc gtcaccgcct 14580 atccggacca gtgggccatg cgccctgagc gcgaacatgt cctcatgcgg atcacagtgc 14640 gtccgcatca tgtagttcgc cgtcggctgc aggaccggcg cgcccgcatc gatatcgtca 14700 tccatacccg ggtcgaaact ccattcgctg tcgatccgca cgctcggctg atccgatcct 14760 ggtcgcgggc ggaagatatt tccagcgtcg tcaaatggac gatgggaacg ggaattccgc 14820 gatcaccagg cgaccatcag actggtcaat ccatacgcgg gagtggtcaa ccggaacgat 14880 ggctcccgat cgggatccgc gagcctcagc gtgggaaaac gccgccacag ggcggtgtag 14940 accgtgcgca gttcgaggcg ggccagagcg gctcccaggc aatgatggac gccgtgcccg 15000 aacgcgacat gggggacggg ctcgcgccgg acatcgaggc ggccggcatc cggcagcagg 15060 gcagggtcac ggttggccat gggcagagag caggagacgg tctctccctc cttgatcacc 15120 tggcccccga tggtgacgtc ctccatggcg acccggggcg tcggcgcata ggggacggtc 15180 aggtagcgga tcagctcgtc gaccgcccga tccgccgact ggtcgtcgcc ctgcaacgcg 15240 gcgatctgct cggggtgtct gagcagggcc agcacgccga gcccgatcat gccggagatg 15300 ttgtcgtcgc cggccagcat cacctgaacg cagaagcccc gcagctcctc gtccgtggcc 15360 gtgtcaccgt actcggcgag gacggctccg agcagcccct cgccgggatc cttccgctcc 15420 ctggcgatca tggccagcag gtagcgggag aacgccgcgc cggcggccgc ccgcctcttc 15480 tggctgcgcg aggcgtcgag atggccgtga cacagctgca tgaacatggc gcggtcgtcc 15540 cgtggcaccc cgatcagctc gcacagcacg gcccctggca cctcgtcggc gacgagttcg 15600 accagatccg caggggggcc cgcccgttcc agggcgtcga gccgttcggt cacgatctgt 15660 tcgatgtacg gcttcagccg ccggatccgg cgcagggtga atcccggggt cagcttctgg 15720 cggagccgcg tgtgctcagg cgggtcgtag tccatcaggt tcccgaccag ctcacgcggc 15780 cggaagttgc ctcttccgcc gatctcgtcc cgttcgttcc agcggcgccg ggtgctgaac 15840 cgccggtgat cgccgagcac ctgccgcacg acggtgtacc ccgtggccag ccaggtggtc 15900 tccgcgtccg ctcctgatcc gatggtgatc ctcgtcagcg ttccggcggc gcgcagttcg 15960 tccgccggat ccaggtcctg ccgccgagta tggaggggcc gcgcgccgtc accactcaac 16020 gggaagctcc tccacggcga agggggccgg cttccccggt ttgaaccgca ggtcctctgc 16080 cgggaccgcc agccgcagcg acgggaaccg gcggaccaac gccggcaacg ccacttgcgc 16140 ctggagcctg gccagcggtg ccccgaggca gaagtggacg ccgtgcccga acgcgaggtg 16200 ttcggggttg ccccgggtga ggtcgaagcg gtcctcgcgc gcacgattgc ccgccaggat 16260 cgagcaggtc aggacatcac cggcgtggat gtcccgtccg gccaggcgcg tgtcgaccag 16320 tgcggtccgg ggagaggggg tctcgacgat cgacgcgtag cggaacacct cctcggccgc 16380 gctgtccgcg agctccggac gctcgcgcag cagcgccatc tggtcggggt gggtcacgag 16440 gaggagcacc gcgatcgcca gctgcgaggc catctgctcg accgccccga tcatgatccc 16500 ctcgacgagc cccgccagct cctcgtcggt gacctcgcct ccgtgctcgc gcacgatgcc 16560 gccgatcatc ccggtgccgg gatcgaggcg ttcgcgagcc gccagtttcc tggcgtagtc 16620 gacgatgccc aggcccgaca cgttccgctg cctggggact cggctctccc ggctgtcccg 16680 gaacatcctc gacagctcgg cctggtcgtc acgggggacg ccgaggaagt cgcaggcgat 16740 cagcgccggg atgggccagg cggcgttcct gacgaagtcg accggcgacc ccatgctctc 16800 cagatcggcc aagcagtcct cgacggtctc ttcgacgaca ggccgcaggc tctcgatccg 16860 ccgggcggtg ttcgccctgg tcacggtcct gcgcaaccgg gtgtgatcgg gcgcgtcgta 16920 cgactgcagg attcccggca gccaggcgcg ctccgcctcg tcctcgaccg ggcgcatcga 16980 gctgaaccgg ttggcgtcgg cgagaatctc tctgatctcg ccatatccgg tgacgagcca 17040 ctgcttgtgg ccgtccagcc ccggctcggt gtcgtactcg tgcagcggcc cgtcctcttg 17100 caggtcgaag agcgccggca cgggatcgag cctcagccgc tgatgcggca gcggaaccac 17160 catgattctc ctcagcttcc ggcgttacca gtcgagcagc agtgctttca cgtcgaacgg 17220 cggcggcccc aatctgatct cttgttcggg ctcggccagc cggagtgcgg ggaagcggcg 17280 tgccagagcc gggatcgccg accggaagat gagctcggcc aggggtctgc caagacagtg 17340 atggatgccg tgcccgaacg cgacattcgg cgctctgtcg cgggtgaggt cgaactgatc 17400 gtccgggccg gggaagtgcc gccggttcgc tcccagcaac gagcacgtga cggtgtcgcc 17460 ggccttgacg atgcggtcac cgatgcgcac gtcctccagc gcgatccgcg gagtgagctt 17520 ctcgtcgatg gtgagatagc gcaccatctc ctccagccag tcaggcacga cgtccggctt 17580 gtcccgaagc agcgcgaact gctcggggac ctcggccatc agccacgcgc ccgccgcgag 17640 gaaacgagcc acctggtcac cgcccgcgcc catgacgaac gcggccagcc ccgtcagctc 17700 cgcgtcggtg atctcgtcac cgtgttcgcg caccacgacg ctgagcatgt cgtcgccggg 17760 atcacggcgc gtgcgagcca cgacctggcc catgtaggtc atgaacttgt tcccggcggc 17820 tccgcgtctg ctggccgccc gctgggaccg gctggcgtgc aggctgcgtg acagctccgc 17880 ctgatcatca cgtggaatgc cgaggaagtc gcaggtcgcc gtcgtcgcga tggaccaccc 17940 gaaatgcggg acgaagtcca gcgggccacc gatggactcg atggcgtcca ggcagtcctc 18000 gacgacctga tcgacctgcg ggcggaaccg ctccatccgc cggacggtga acgcgggcga 18060 gaccacccgg cgcagtcgcg tgtgctccgg cgggtcgtac tgggtgatga agccgggaaa 18120 gacgattccg gccgcggtcc cgccgtagag caacctggag ctgaacttgt ccgagcccag 18180 cacctgccgg acctcgtcga acccggtggc gagccacgcg gtccgccctc cagggccttc 18240 ctcggcgccc agctcggtca tcgggccctc ggccatgaag gaccgcagct gtggcaccgg 18300 atcgaaccgg tccctccagt gcagctcccc gggcaggacg acgttgagct cctcgaacac 18360 ttccacgtca caggtccttc cgcctcaacg gtggtctcag gccggtcgga cgggcgctgg 18420 gcccgtccaa ccgtccacat caagcggctg gacaccctcg ctcaggcgcc ggcttccgcg 18480 atgagactct tcggccggat gtccgtccag ttctcctcga cgtaggcgag gcattcctgg 18540 cgggtggcca cgccgtggac gcgggtccag ccaggcggca cctccgcgaa cgagggccag 18600 agcgagtgct gtccttcgtc gttgacgagc acgaggaagg agccgtcttc gttctcgaac 18660 gggttggtca tcgctgtgtc ctttcaccgt ccggccgggg ccggagtttc tcggcgacga 18720 cggccccgat ccgggccagc gccgcgggct gcagcatctg catgtggtcg atctcgatct 18780 cgtgaggctc gacggttccg gtggtgaggg gtcgccagct ggcgatggcg tccgcgacgg 18840 gcagatggga ggggcggttc actgtggcga cgaagagcag gatgtcgcag ccgaagctgc 18900 gggaggtgtg cagcggcccg acccgggcga ggtgctccat gacctcgtcc aggcgcttcc 18960 tggcgccggc ctccgtggcc accgcggcgg cgagctgcgc ctgctgctcc tgctgcctgt 19020 cgaagtccgc ggcctcctga tcggccgcgt cgccgcgcgg gcgccggagc ctgcccacgt 19080 cggtgggata ggcgtcgagc agggcgagca ggccgacctg ctccccttgc tcctccagca 19140 ccctggccat ctcctgcgcg atccgcccgc ccagtgacca cccgaggagg tggtacggcc 19200 cggtcggctg cacggcgcgg atctgctcga cgtaatcggc cgccatctcc tcgacgccgg 19260 ccgccagcgg ctccgtacga gccaggccgc gcgcctgcac gccgtagacc ggctggttgg 19320 ggggcaggct ccgcagcagg ggcgcgtagt tccagctcag ccctccgctc gcatggacgc 19380 agtacagcgg cggacggtta ccgccggctc gcagcggcag cagcacctcg aagtcgcccg 19440 tgccggtctt caccgagccg ctcgatcccc gccgctcgcc gacgacgacc agggtgcccc 19500 cggctgtcca gcgggcgagc aggcccgtgg gcagcatgcg ccgccccgtg gccccgaagg 19560 ggcaggccag ggtccggtcg cccggctccg cgtccaccgc cgcgccggtg aggtagagct 19620 cgccgacggc gacggcgggg cgcagccggt cgtcgagcac gagcgcgccg agcggaccgc 19680 cctcggccag gtcggcggcc accgggggca cggcctcgga ccacttcgcc ggcgcctcgg 19740 ccggacgttc gcgttcggcg tcgtccagca ggacgtccag gtcgctgacg cgccgctggg 19800 gatcctccgc cacctgctcc aggaagctga ccagccgccg tgccagcgac tcggccgtgg 19860 cctgatcgaa gaggtcggcg gcatagtgga gggtgccctc gatgccgtcc tcgtcgcggc 19920 gctcggtgag cctgaacgcc agatccagct cgatggcctc cggcccgaca ggttcgacgc 19980 tggtgcgcag ggcgggcagc tccgtcgcgt cccacgcgcc gaggtcctcc tcgtgcacct 20040 ccaaccccac ctggaacacg ggatggcggg agagcgagac cggcaggtcg agcagctcga 20100 cgatcctggc gaagggcacg tccaggtgct ggcgcgcgga ccggatcgcc tcctgcgccc 20160 gggtgacgac ctccaggaag gtggggtcgc ccgagaggtc cgtgcgcagg gcgagcggcc 20220 gggcgaaggg cccgatcatc ggctccaggt cgatgaggtc gtcgtcccgt ggcagcttcg 20280 tgccgatcac caggtcgtgg cccgccccga gcctggtcag cagcatggcg agcgcggcat 20340 gcacgatctg gaacgggtgc gcgccgatcg ggtccaccgc ctccaccagc ctggcgtgcg 20400 ggccggcgtc cagtcgcaac gacaccgtgc cggcccgccg cgacgcgacg gccgaccggg 20460 ggcggtcgaa cgggagcacc gtctccccgt ggatgcccgc cagattgtcg cgccagaaca 20520 ccagctgctc gttgatcagg ccgtccgcat cgcgctcgcc ttcgagcagg cgccgctccc 20580 agatcgcgta gtcggcgaac tgcagtgtca ggggcgcccg ctccggtgcc cggccggcac 20640 gccgcgcgcc gtacgccgcc gacaggtccc ggaggaacac atccagcgac tcgtcatcgg 20700 cgaggatccg gtgcaccatc aggtgcagga cgtgttcccc gtcggagagc cggaacaggt 20760 caccgcgcca cggcacctcc cgggtgaggt cgaagaccga ctcccgcagc tcggtgagca 20820 gcccgggcag gctctcctcg gtggcgggaa ccggcgtcag gtcaaccggc gaggcgtcgt 20880 gtacgtgctg gtgaacgctc tgcgcgtggc cggggaaggt cgtccggaga atctcgtgcc 20940 gcgccgcgac gtcgccgagc gccgcctcca gcgcgggcac gtccagccgg ccgcgcaagc 21000 gcagcgcgac cgagacgtgc aggccggcgg cctccccggg actcgccagc agccaggcgc 21060 tgagctgctg ggcggtgagc ggtacccggc ccggccgttc ggcgggctcc agcgcggggc 21120 gtgacttcgc ggccagcgcc cgggcgacac ccgcgggggt ggccgcggag aacagctgcc 21180 ggatgggcag gtccgcaccg agctcctcac ggatccgcgc gatgagccgc atggccagtg 21240 ccgaactgcc gccgagatca tggaaggcgt cgtcgacgcc cacccggtcg acgccgagga 21300 tctcggcgaa gagcgcgcac agcaccttct cggtctcgct ctcctgtgcc ctgtccggcg 21360 cacgtcccac gagatcgggg gcgggcagag ccaggcgatc caccttgccg ttgggcgtga 21420 caggcagcgc gggcagggcg acgaccgcca ggggaaccat gtacgcgggc aggaccaggg 21480 ccatctcccg ccggatctcc gccggccccg catcggttcc gtcggagatg aagtagccga 21540 ccaggcgctt ctcgcccggc tggtcctccc gcgccacgac gaccgcctcg accacgccgc 21600 gctgggccgc cagcacggcc tccacctcgc cgagctccac ccggtagccg cggatcttca 21660 cctggtcgtc ggtgcggccg aggaacacca cctcgccgtc gcggttccag cgcgccaggt 21720 cgccggtgcg gtacatgcgc tcaccaggag aagggtccac ggaggccgga acggccacga 21780 accgctctgc cgtcaggccc ggcccgccga gatacccgcg ggccagcccg gtgcccgcga 21840 tgtacagctc gcccgccacc cccggcgcga ccgggcgcag gaaggcgtcc aggatgtaga 21900 tcctgcggtt ggtcatggga cggccgatcg gcagctcccg cccgacctcc tcgccgggct 21960 cgatcggctt ccacgtcgcg cacagggtgg tctcggtcgg tccgtacgtg ttgcgcaccc 22020 gcaggccggg cacggcccgc cgcaggtgct ccacggactg cgccggaacc acgtcaccac 22080 cggtcccgac ctcgaccagg cccgcgaaac actccgggga cgactccgcg agggcccgga 22140 aggtaccggc ggtgagatgg acgaaggtca cgccccgttc gacggcctgt ctcatcccga 22200 gcgcgtccag cactcccggc tcggtgagca cgacccggcc acccatggcg agcggcaccc 22260 acatcgcgta gagcgaaggg tcgaagacgt gcgtcgcgtg catcagcacg gcgtcgcccg 22320 ggccgatccg ccagccctcg tcgcccgcca ggccggccac ggccccatgg gggacgccca 22380 cccccttcgg caggccggtg gagccggagg tgtacatcac gtacgccagg tcgtcggcgc 22440 tcagccggat ctgcggcgcc gtggcggcac ccgcgtcgat ggccgcgcgg gtctccgggg 22500 cgtcgatgac gatcgcgtcc gccggcgcca cttccctggt ggcccgggtg cacaggacgg 22560 ccgagacacc ggagtcggcg agcacgaact cgatccgctc ggccgggtgc tcgacgtcca 22620 ccgggacgta cgcggcgccc gccttccagc tcgccaggaa cgcgatcagc aggtcaggcg 22680 acctgtccat gaccacgccg acgcggtcgc cacggccgat gccacgagcg gcgaggtggc 22740 gggccagccg gttcgccgcc tggtcgacct cggcgtaggt caggtccgcg ccgccggcat 22800 cggtgatcgc caccgcgtcc ggcgccgtgg ccacccgccg tccgaagaga tcgagcacgg 22860 actgccccgg cgtggggccc gccgtcgcgt tccagtcctc caccaccagg gcgcgctcgg 22920 cttcgctcag cagcgtcagc cggccgacga ggacgtcggg ctcggcgacc agccgctcaa 22980 gcacgcgagc cagcgcgccc acgaccgatt cggcggccgc ctcgtcgaag aggccgcggt 23040 cgtagtcgag gatgagcggc atctgcgcgc cgggcccggt gatcagggtg aacgggtagt 23100 gcgaggagtt gcgtccgcgc cgcaccggtc tcaggtccag gccgccgtcc tcttcggccc 23160 ggccgagtcc ctggcgcggg aagttctcgt agatgacgag cgtgtcgaag accgccccgg 23220 gcccgacggc ggcctgcatc tcctgcaggc cgagatgctg gtgcgccatg agtgccgact 23280 ggctgcgctg cagctcggcg agcagctcga cgacccgccg gccgccttcg agccggaccc 23340 gtaccggcag ggtgccgagc agctgcccga ccatcgactc cacaccggcc agctcggcgg 23400 gccgccccga ggcggtcgcg ccgaacacca cgtcggtgcg gccggcgagc tgcgccagga 23460 ccatggccca cgcaccctgg acgacggtgt tcaaggtgag gccgtggccg cgcgccagcc 23520 gcgccagccc gtccgtcagc tccgcggaga gctcgatcac cgcggtgccc atgtccggca 23580 cgcgggccgg atcggccggg gcgaccagcg tgggcgtgtc cagtccggcg agctcctgcc 23640 gccaggccgc ccgggccgcc tccttgtcct gccggcccag ccaggcgagg tagtcccggt 23700 aggacacggc ggcaggcagc ccggacgcgt cgccgcccgc cgcgtagatc gcggccagct 23760 cgcggtgcag gatcggcatc gaccagccgt ccagcaggac atggtgcagg gtgtgcacga 23820 gccggtggct ggccgggccg agccggatga ggtgcagctt catcagcggt gccgcatcga 23880 gggggagccg ctcggccagc tcgtccgccg ccagccggtc cacctcgctg tcgaggaggt 23940 cgtccggcag cccgtggaga tccgtttcac gccaggggat ctccgcctcc cgcgcgatga 24000 cctgcaccat ctgcgcgccg ctgacatagc ggaaataggc ccgcagcgcg gcatgccggt 24060 ccacgagcgc ctgccacgac gccctcagcc gcccggcgtc cagcgggccg tcgatgccgt 24120 acacggtctg caccgtgtag gtgtcgggcc cgtcgtcgtc gagggcggtg tgatagagca 24180 tgccctcctg cagcggcgag aggggccaga cgtcttccac gctggagcgc ggcttcgcac 24240 gagtgtcgtc aatggtcacg atctgctcct tatggagtca tccgccggcc ggtccggcct 24300 cgagttggtc cagctgatca ggcgaaagat ccacgagtgt gccggccggg ggctccggtt 24360 ccccggtgcc ctcgccgtcg gccgggagct ccttgacgac cgccgccagc cgttccgccg 24420 tcttctcgtc gaacacctgc cacggggtga ggtccagccc cttccggcgg gccagggccg 24480 acagctgcat cgaggtgatc gagtcgccgc cgagctcgaa gaagctgtcg ccggcgccca 24540 cctcctccag gccgagcacc tccgcgaaca gctcgcacaa cttcgcctcc atggccgagc 24600 gcgggtcgcg tcctgacgac gacctcgcga aatcgggggc ccgcagcgcc cgatgatcga 24660 ccttgccgtt cggggtcagg ggcatcgtgt ccagcgggac gaacgccgcc ggcctcatgt 24720 gctccggcag gcgtccggcc gcgctctcgc ggagggcgga gatcaacgcg ccgtcctgcc 24780 cggcctcgga gggagcgccg gccacctgct cggccgcggg gacgacatac gccaccaggt 24840 acttctggcc cggaccgtcc tcgcgggcga cgaccgccac ctgggcgacc cccggatggt 24900 ccgccagcac ggcctcgatc tcacccggct cgatccgata gccgcgcacc ttgacctgcg 24960 cgtcggcccg gccggtgaag accagctcac cgtcccgggt ccagcgggcc cggttgccgg 25020 tgcggtacat gcgctcacca ggacgggcag ggctcaccga ggccggcacc gcgacgaacc 25080 gctccgctgt caggcccgga cggccgaggt agccgcgggc gagcccggcc cccgccacat 25140 agagctcgcc ggtcacacct ggcggcacgg gctgcaggaa ggcgtcgagc acataggctc 25200 gcaggccggt gatcggccgg ccgatgggca ccacgtcgcg tcccggagac agcggggagc 25260 tcatcgtcgc gcagacggtc gtctcggtgg gcccgtaggc gttgatcatc cggcggcccg 25320 gcgaccagcg gtccaccagc gcgggcgggc aggcctcgcc ggccacgacc agggtctcca 25380 ggctgtccgg caggtcgtcc tcgacggccg gcacgctcgg cggcacggtc acgtgggtga 25440 tgccccaccg gcgtaccgcg tcgcccagcg acacccgggg cggcatgctc tccgcgtcgg 25500 ccagcaccac ggtcccgccc gacaacaggg ccatgcacag ctcggagacg gcggcgtcga 25560 agccgagagc ggcgaactgc aggatccgcg aggcggacgt gacgccgaag cgctcgatct 25620 gcgcgctcgc cagattgccg agcccggcat gggggacgag gactcccttg ggcacgcccg 25680 tcgaccccga ggtgtagatc acatacgccc cgtcacccgc ctccacccgg ggcagcgcag 25740 tgcgcggatc ggcggcgagc ggcgcgtcca gcgccaccac cgcgcccgcg aactcctccg 25800 ggacggcctg cctggtctcg ctcgtgcaca gcagcacctc cggcgcggaa tccgccagga 25860 tgaagctgat gcgctcgcgc ggataatcgg gatccatcgg gacgaacacc ccgcccgccg 25920 aggacacccc gagcagtgcc accaccagct cggccgagcg tcccacgagc acgcccaccc 25980 gcgtctcacg gcgcacgccc agccccacca gcagccgcgc cagctcctcc gcctcgtcca 26040 gcagtccgct gtacgacagg ctccgggccg cgtccaccac cgccaccgca tccggcgagc 26100 gctccacctg ccggcggaac agcatcggca ccggctccgc ggcgggcggc acgccggtcc 26160 tgttccactc ctccaccacc aggcggcgct gctcaggacc gatcaggccc acgcgcccga 26220 ccggcacgcg cggctcggcc accacctgct ccagtgcccg gaggatcgac gcgagcatct 26280 cctcggcctc ggcccgatcg accacgtccg gccggtagat gaactcaccg tggacgcggc 26340 ccgccacgga cgcgcgcatg gacagcggat agtgccctgt gtcgttcggg atgcccgcgg 26400 gccgcatgac gagcgcgtcg gggccttcgg gccgaggcgg cgggggcggg tagttctcga 26460 acaccacgat cgtgtcgaac gccgcgcccg gaccggcgag ctggttgatc tcgctcagcc 26520 ccacgtgctg gtgcggcatg cacgcgacct gccgttcctg aaggtctgtc agcatgtcga 26580 ggaacggctc cgcaccggcc aggcgagccc ggaccggcaa catgttcatg aacaggccga 26640 cggcggactc cacaccgggg atctcgggcg ggcgcccggc caccgcggcg ccgaagacca 26700 cgtcgtcgcg tccggtcagc cgggccaggt gcagtgccca gatcccctgg aagagcgtgt 26760 tcgccgtcac gccgtgacga ccggtgaact ccaccacgcg ccggctcagc gcctcgtcga 26820 gttcgaaccc gacacgttcg ggctccaggg gagtggtgat cgtctccggc ggcacgacgt 26880 gggtcgcctc gtcgagcccc gccagctcgg cccgccacgc ctctcgggcg gccgccttgt 26940 cctggcgggc gatccaggcg agatagtcgc ggtacgacgt cgcggccgga agggcccggc 27000 cgtcaccgcc ggactcgtac acggtcagca cgtcctcggt gatcagcggc agggaccagc 27060 cgtcggccac gatgtgatgc gaggtcagga ccagccggtg ccggcgttcg ccgaggcgca 27120 ccaggtgcag ccgcagctgc ggcgcccggg tcaggtcgaa ccgctcggtg tgcagctgct 27180 ccgcgaggcg gtcgaactcc gccagcgcct cgtcctcggg cagccgggac agatcggtct 27240 cctgccagtc cagcggcacc tcgcgagcga tcgcctgcac ggccgcgccg gacccgagct 27300 ggtggaagct cgcccgcagg gcggggtgcc ggtcgagcag agcctgccag gaggcgcgga 27360 accgggcgac gtccaacgga ccgtcgaggg cgagcttgcg catccccgcg tagacgtccg 27420 ggccgcgctc gtcggcggcg tggaacagca ggccctcctg gagcggagac agcggccaga 27480 tgtcgagcag ggtcggtacg gcggcctcga cctccgccac gtcctgctgc gtcagcgaga 27540 tgagcgggaa gtccgacggc gtgtgcccgc cggcgccgcc gccaccgacg tgtgccgcaa 27600 ggccggtcag catggccagc caggcctgcg cgagcgactc cgcctcggcc tcgccgagca 27660 gccgccccgc ccaggtcacg gtcaggctca gctcaggtcc tgccgcaccg tccagcacgg 27720 ccgcgtcgat ctccacggcg tgccgcaacg ccgtgtcctg ctccgccgtg ccgccgatgg 27780 tgcccagcag ctgccagggc tccggggcgc ccgcggaccg ggacgggaag cggccgaggt 27840 agttgaaccc gatctccggc ttcggcgccg ccgcgagagc ctgccccgtc ccggcgttga 27900 gatagcgcag gatcccgtag ccgagcccgc cgtcgggcac ggcccgcacg ttctccttga 27960 cctgcttcag caggtgaccg gccgcaccgc cacccgcgat cacttcggcc ggatcgatcc 28020 ctgtcacatc cagccggagc ggatgcacgt cggtgaacca gccgaccgtc cgcgacaggt 28080 ccagctcgtc gatgggccgg cggccgtgac cttcgacgtc caccacgacc gcggtgccgc 28140 cgcgccagtg ggccaccgcg cctgccagcg tcgccagcaa cacctcgtgg acaccgcagt 28200 ggaaggcgga ggtggcctgc tccacgagca cgcccgcccg gtcatgcggc agcgtccacg 28260 atgtgcgtcc cgcggtcgag acggtgtcgc gcgccgggtc gagctcgccc agccgcgatc 28320 gcgccccgtc gaggatctcc gtccacgtct ccagctccgt ggcccgtgtc accgcctgat 28380 cggccagcgt tcgcgcccag cgccggaacg agacgtcgac ggggtcgagc accggccgcc 28440 ggccggcggc cacggcttcg caggccacct gcaggtccgg cagcaggatt cgccacgaca 28500 cgacgtccac cacgagatgg tgcgccgcca cgacgagccg tcccacccgc cctggccccg 28560 cgtccaccca gaccgcccgg atcatcacgc cggcgtgggg atccagccgt gcggccgcgt 28620 cgcgggcgca gcgatccgcg atctcatcca cgtcaccggt gccggcctcg acccgttcga 28680 ccagcgtcgc cgcgtccacc gctccgcggc cggccacgac cagccggggc tgcgcagccc 28740 cggtgcggac gatccggctg cgcagcatgt catgcgcgtc gatgaccgcg cccaatccgg 28800 ccgccagcac gtccaccgac aggtcgtcgg gcgcaccggc ggtcacccac tgggacaggg 28860 cgccccgggt catcgcgtcg ggatcgcgtt cgagcagtgc ccggatcacc ggcgtcgaca 28920 tcacctcacc gacgccgtcg tcgaggctcg cccgcgtcgc accgccgcgt tcggcgacca 28980 tcgcgatccc ggcgggcgtc ttgcgctcga agacgtcctt cgcgccgaag acgagctcct 29040 cacgtcgcgc gcgggcggcc aaccgcatgg agaggatcga gtcgccgccc agctcgaaga 29100 agctgtcctc ggctccggct cgcgccacgc ccaggacctc ggcgaacagt tcgcacaaca 29160 cccgctcggc ctcggtacgc ggctcccggc cggccgcctt cccggtgaac tcggggacgg 29220 gcagcgcggc acggtcgatc ttcccgttgg gcgtcagcgg gacgccgtcc agcagcacca 29280 ccgccgccgg caccatgaac tccggcagcc gtcccgcgag gtgctcgcgt accgcgtcgg 29340 gatccaggcc cgagccctcc tccgcggtca cgtaggcgat gagtctcttc tcgccgggac 29400 ggtcctcccg cgccacgacg accgcctgcg cgacgtgcgg aacctcggcc agcgccgcct 29460 cgatctcccc tggctcgacg cggtagcccc ggatcttcac ctgggagtcg gcccgcccgg 29520 cgaacagcag ctcgcctcgg tccgtccagc gcgccaggtc gccggtgcgg tacatccgct 29580 caccggaggc cgcggggttc accgaagcgg gcaccgcgat gaaccgctcc gaggtcgccg 29640 cgggggcgcc caggtaaccg tgtgccaggc ccgcgccggc gaggtagagc tcaccggtga 29700 cgttcggcgc caccggctgg aggaaggcat ccaggacgta cacctgccgg ccggccagcg 29760 gacggccgat gggcaaggtg tcgcccgttt ccgtgtgcgg ctcgatgagg tgccaggtgg 29820 cgcagagcgt gacctcggtg gggccgtaca actcccggac ccggacctcc gggcatgccc 29880 ggcgcacccg tgcgacggac tcgagcggca ccacgtcccc gccggtgagg acctcgcgca 29940 gcccgctgaa ggagtccggc gactcctccg ccagcacccg gaaggtcccc gccgtcagat 30000 ggacggtggt cgcgccccgt gcgatcacgt cccgcagccg ctgcgcgtcg atcgcgcccg 30060 gttccgcgac catcacgcag gctccgctga ccagcggcac ccagatctcg agcagcgacg 30120 cgtcgaacgc gtgcgacgcg tgcatcaaca cgcggtcgcc ggcgccctgc gaccagcccg 30180 ggtcgccggc cagagccgcg gcgctcccat gcggcaccgc gacgcccttc ggcaccccgg 30240 tcgatccgga cgtgtacatc acgtaggcca cgtcatgcgc tccgaccgcg agcggtggcg 30300 cctcgtgccg ctccgcctcg gtcgcgggtg cgtccatgac caccggctcg atcccgtccg 30360 ggaccgcgtg ccgggtcgct cccgcgcaca ccgccaccga cgcgccggcg tcggccagca 30420 tccgctcgat gcgctccgcc gggtagtcca cgttcaccgg gacttgcgcg gcccccgcct 30480 tccagaccgc gagcagggcg acgatcaggt ccgcgccgcg ttccatcagc acgccgacgc 30540 ggtcgccgcg ccgcacgccc ctcctggcca ggtgccccgc cagccggtcc gattcccggt 30600 cgaggccggc gtaggacagg gtgcgtccgt cgccgatgac cgccgtcgcg tccggcgccg 30660 cgtcggcctg gcgccggaac agctccggca ccgatgaacc gccggccgcc gcaccggtcg 30720 agttccagcg ctccgtcacg gagccgcggg tggatcggct ggtcacggcc aggcggccga 30780 cgggaagcga gggctccgcc accatccggg ccaggacccg cacgacctgc ccggtgatct 30840 cggcggccag gtccccgccg atccagtcgg gccggtagtc cagctggatc tgcaggcgcg 30900 cgcccgggat gacgctcacg gacagcggat aggtggtgcc ggtccgcgtg cggatcgagc 30960 tgatcgccac gccaccgtcg tcgagaccgt cggcgtccag cgggtagttg acgatcatca 31020 ggatcgtgtc gaagatcgag cccggccccg ccgccttctg gatctccggc agccccaggt 31080 gctgatgctc cgtcaaggac gactggcgcc gctgcaggtc ctggagcagg tccagcaccg 31140 gaacagcccc gtcgaggcgc acccggaccg gaacggtgtt gatgaacatc cccaccatcc 31200 gctcgacatc cggcaacgcg tccgccggac gcccggacac gaccgtgccg aacaccacat 31260 ccgtccgtct cgccagccgc gccagcacca gggcccaggc gccctgcacg accgtgctca 31320 acgtcagccc atgaccacgg gcgaagccgg tgagggcgcg ggtcgcctcc tcggacagcc 31380 attcggcatg cccgtccggc atcaccggcg ccttgcccgc gtcgaggccc accacggtcg 31440 gttcgtccag cccggcgagc tcggcccgcc acgccgatcg tgccgcgtcc tcgtcctgac 31500 ggctcagcca cgccacgtag tcccggtagg agggcggcgc cggcgagacc cgtccgtcgg 31560 cgtaggcggt cagcatctcg cccagcagga tcggcgtgga ccagccgtcc acgagcacat 31620 ggtgcgacgt caccacgagc cggtgccgcg ccgcaccgag acggatcagc agcaaccgca 31680 gcagcggcgc cctgctgacg tcgaaccgct ccgcctgatc cgccgcgagc aggcgttcca 31740 cctccgcgtc cggctcatcg agccgcgaca ggtccgcctc acgccacagg acctcggcct 31800 cgcccacgac gacctgcacc gtctcgccgg atcccagctg gtggaagccc gtccggagcg 31860 tctcgtgccg gtcgatcacc gactgccacg ccgcgtgcag ccgttgcgcg tcgagcggcc 31920 cgtcgaggtc caggatccgc tgggtctggt agacgtcgac gccgtcctcg tcgaaggctc 31980 tctcgaagag gatgccctcc tggagcggcg acagtggcca gacgtccgtc aggccgggcg 32040 ccacggcctc cagttcgtcc acgtcccgct gccgcacctc gaccagctcg aagtcggacg 32100 gtgtgtgtcc gcccgcgccg ggagtgtcgg cgagagcggc gaggccggcc agcgtgtcca 32160 gccacgcctc gccgagccgc tccaccgcgg cagggtcgag gtccctgccg tcgatggcga 32220 gtctcagccg ggggccggcc ggcgtgtcct gaacgtccgc gccgacctcc agggcgtggg 32280 actggacgag gtccggcccg gccgcctgtc cgccgagagc cccttcgcac acctgccacg 32340 cggtgtcctc ggaggcgacg ccggaccgtc cgagatagtt gaatccgatc tgggccgacg 32400 gcagctccgc cagccgggcg ccggtttcgg ggttgaggta gcgcaacagc ccgtagccga 32460 gcccgtcgcc cggcaccgct cgcgcctgtt ccttcacggc cttcagcaac tccccggccg 32520 ccgcagctcc tggaccgaca ccggagacat cgaggcggac cggatgaacg ctggtgaacc 32580 agcccacggt acgcagcaga tcctctccgt cggcggcatg gcggccgtgg ccttccacgt 32640 ccaccaggat cccggcgtca gcaccgcgcc accgcgccac cgcacccgcc aggcccgcca 32700 gcaggacgtc ctgaaccccg cagtggaagg ctgccggcac gcgcgccacc aggttgcgcg 32760 cttgggcatc ggacagtgtc cgcgaccacg acgccgactg cccggggtgc cgctccagcg 32820 gcaggtcgcc gccttcgagc acgccggccc aatggccggc ctcggccacg gtgctctcgc 32880 tgagcgcctg cccggccagc cgccgcgccc attgccggta cgacgtcacc gcgggttcga 32940 ggacgggggt tccgccggag accgcctcgt cgtaggccgc ccgcagatcc gacagcagga 33000 tcgcccacga gaccgcgtcg acgaccaggt gatgcaccac caaggccaac cggcccggct 33060 cggcgtcgcc cgcgtcgacc cacacggccc ggaccatgat cccttcggac gggtccagcg 33120 tgcccgccgc cgtcctggcc tcgcgctcgg cgcgctcagc gaggttcccg ttcccggccg 33180 ccacccgcgt caccaggccg gccgcgtcca cggcacccgg ctcggccacc atcagccgtc 33240 cgtcgggctc cacccgcgtc cgtagcagat cgtgcacatc caggacggcc tgcagggcgg 33300 tcaccagcgc gtccggggcg aagccggccg gggtgacgac gacccgcgcc tgcgcgaaac 33360 cggggcgcac cgcgtcatcg ccgagggcac gcatcaccgg cgtcctcggg atctcgccca 33420 cgcccggctc cactgaggag gctcgcctcc ccggggcctg ttgagccagc gccgccagcc 33480 gctcgggcgt gcggtgctcg aacacctgtc ggggggtcag cgggataccc tggcgccgcg 33540 cgcgggcggc gacctgcatc gacgagatcg agtccccgcc cagctcgaag aagctgtctg 33600 cgaccccgac ccgccccgcc cccaggacct cggcgaacac tccgcacagg atccgctcgg 33660 cgtcggtggc cggctcccgg tccaccgccc cggcagcgaa gtccggctcg ggcagggccc 33720 ggcggtccac ctttccgttg ccggtcagcg gcaacgcgtc cagcaccagc accgcggccg 33780 gaaccatgaa ctcgggcagc gtcgcggcga gctgctcgcg tatccgcacc gggtcgaggt 33840 ccccccctgt ttcggcgacc acgtaaccga tcaggcgctc ttcccgcgcg gacaccacgg 33900 cctgaccgac acctggaagg ccggcgagga ccgcctcgat ctcgccgggc tccacccggt 33960 acccgcggat cttcacctgg tcgtcggcac gcccggcgaa cgccagctca ccctgatccg 34020 tccagcgcgc caggtctccg gtccggtaca tccgcccacc gggcacgaac ggctcggcga 34080 cgaaccgctc ggccgtcaac gccgggcggc ccagatagcc ctgcgccacc ccggccccgg 34140 cgacgtacag ctcgcccgtc acccccgggg gcacgggccg caggaacgcg tcgaggacat 34200 agacccgccg ccccgcgagc ggacgcccga tcggcagcac cggccccgtc ggctcgcccg 34260 gctgcagcag ccaccatgtc gcacacagcg tggcctccgt cgggccgtag agatgccgca 34320 cgcggacgtc cgggcacgcc cgccgcaccc gttccaccgc cgcgagcggc accgcgtccc 34380 caccggtcag cacctcgcgc agcccggcga ccgactccgg tgactcctcg gccagcaccc 34440 ggaaggtccc cgccgtcagg tgagcgcagg tgacaccgcc ggccacgtac ccggccaggg 34500 cctcgccgtc caccgcgccc ggctcggcga gcacgacccg ggcgcccgac agcagcggca 34560 cccacagctc gaacagcgag atgtcgaacg cgtgcgaggc gtgcatcagc acggcgtcct 34620 cgggccccag cccccatccc ggctcgccgg ccagcgccgc gacgttgccg tgcgagaccg 34680 cgacgccctt cggcctgccc gtcgatcccg acgtgtacat cacgtacgcg aggtcgtccg 34740 cgtgcgcacc cgcggagaga cgggcgtgct ccgccaccgc ccgcagcgtg tccgggtcgt 34800 ccaggacgat cggatcgagc ccgccggccg gcacggcggc ctggcacgct cgctcggtca 34860 ccactgccgc cggctccgcg tccgcgagca tgaactgcac gcgctccgcc gggtaggcgg 34920 gatccaccgg cacgaacgcc gctcccgcct tccacaccgc cagcagcgtc gcgatcaggc 34980 cgggtgaccg gcccatcacc acggccaccc gatccccgcg ccggacgccc cggccgctca 35040 ggtagccggc gagcctctcc gcgtgctcgg ccagctcacc gaacgagacc gcccgcttcc 35100 cctcgacgac cgccacccgg tcacggccgc gctccacctg gcggtcgaag agatccggag 35160 ccagctcgcc cggcgccacg cggggtgccg cactccatgc gttcaccacc agcgcacgct 35220 cggccgcact cgtcacgtcg acctcggcca ccgtgaggtc gcccgcgccc gccagctgcc 35280 gcagaatccc ggtgaatcgc tccaggatgg cgagcgcggc ttcccggtcg aagaggtccg 35340 tcacatggtc gagattgagc agcatcgact cgccggggac ggcgaccagc gtcagcggat 35400 aatgggcggc ttcccggccc tggtctattc gaatatcgaa ggctgccgcg gcatccgatg 35460 ggcgaagctc acggggaaag ttctggaaaa cgagcaaggt gtcgaagacg gcgccggcgc 35520 cggccgtcct ctgaatatcc gccaatccca tgtactggtg ggggatgagc gccgactgcc 35580 gcttctgcaa atccgccagg aattcgatga ccggcgtcga accgctcagc cgcacgcgta 35640 cggggacggt gttgaggaac aaccccacca tcccctcgac gccgggcaga tccggcgggc 35700 gtgccgagac cgccgcaccg aacaccacgt ccgtccggcc cgcgagctgg gcgagcagca 35760 acgcccacgc gccctgcacc actgtgttca gcgtcagccc atgggtgcga gccagctcgc 35820 tcagggctcg cgtgaggtcc tcgggcagct cgaccgtgat gttctccggc atggcgggcg 35880 cccggttcgc atcggcgggc gccaccagcg tcggctcctc gacaccccgc agctccgccg 35940 cccatgccga cagcgtgcgc tccttgtcct gccggtccag ccacaccagg taatcccggt 36000 acgacggcac cgcgggcagg tccagcgggc tcccgtcggc cgcgtacagc atcgacagct 36060 cgtcgagcat gatgggcatc gaccagccat ccatgatcgc gtggtggcag gtcatcacca 36120 ggcggtggtc gtcgccggcg agacggatca gggtcagccg cagcaacggc gccttcgcga 36180 ggtcgaacct ccgcgtcctg tcctcctcgg ccaccgcgcg cacggcctcc tcgggctcgc 36240 tgaggtggga gaggtccacc acccgccacg gcagctccac ctgcctggcg atgagctgca 36300 ccgtctcacc tgatttgcgc tgccgaaaac aagcccggag agcggcgtgc cgcgccagga 36360 gcgcctccca tgcggcacgc agtctgtccg cttccaccgg accgttcagg ttcaggatcc 36420 aatggcccac ataaaggccg ggccagtcgt cgtcataggt cgtgtggaag agcaaccctt 36480 gctggagtgg tgacagcggc cagaaatctt cgatccgcga ctgagccatg gatgaatatc 36540 tccctcaatc agcaaagcgg cccgagaggg aatcatccat tgatgggtct gacccggaca 36600 atctgtccat ccgtgactgc cgtcaccgat ccgggtgggg tcgaaggagg ccgccgacgc 36660 ggaacgtggc ggcttgcggg cgagcaacat ggctacggcg cgccatccac agctggatgg 36720 cgcgccgtag ccaggttcac cgctcgatcg agcgcggcct cactcgaagg aaagccccgc 36780 ggccggcgtc acccggacgg cccggcgtgc cgggagaaca ctggccagga gccccgccag 36840 ggcggcgacg aggacgacga cggcgagcag tggccagggg acctgcatgg tggcgttgtc 36900 gagagcctgc ttcacgaagg tctcgtaacc gacccaggcg aacccgatgc cgatcacggt 36960 gccgagcacg gcggccacca gggagagcag cacggcctcg gcggccagca tccgccgcaa 37020 ctgcctgcga gtgagcccga gcgcgcgcag cagcgcgtgt tcgcgaacac gctcgagaac 37080 ggacaggccc agggtgttgg cgatcccgac gagggcgatc gccacggaga agccgagcag 37140 cgcgacgatg gcccaggtga ggatcatcag cggcgcgttc tccgtctcac gggcctccag 37200 ctggtcgttc acgttcgccc cggccgcggc cgccaggtcg cccagctcac cgacgagccg 37260 cgtcgagtcg gcgtcggcgg atgcgcggat ccagacggca cgcggcgcgg cggagtcggt 37320 gagccgggcc agcgtctccg gcgcgacgac ggcctgcagc ccccagccgg tggcgagcga 37380 gacctgcagc acggcccgcc ggtcgccgac cgtgaccctg accttgtcac cggcccgcag 37440 gcgcagctgg cggaatgcgg actcatcgag cctgagcacg cctggctcca cccgggcgaa 37500 cgacccgccg tcgtgggcca cccgctgggc atccggcgcg gtgaccaccg ggatcggctt 37560 gtcgaggccg gagaccgtgg cgacggcgcc gtccaccgcg atggcctgat ccaccccgga 37620 agtgccacgg accttgtcga ggaagtcggc ggagaacggc ttgccggtcg agaccagcgc 37680 ggcgtcgatg gggtgctggc cgtcgagtct ctcgttcagc gcctcggagg tgatggcgac 37740 gccggtcagg acggcggtga tcagggtgat accgaccagc agtgaggcgg cggtggtggc 37800 ggtccggcgc gggttgcgca cggcgttctt cgtcgcgagc cgcccgatgg tgccgagccg 37860 cgtaccggtg atctccagca gacgggggat gagcaccggc ccgaacagga gcacgccggt 37920 gaacaacgaa ccgccgccgg ccagcatgag caccgtgctg tgccaagcca tcgccgacgc 37980 gagcaggacg agcccggcga tcaacatgaa gacgccgagc accagccgtg cccgccccgt 38040 ggctgtacgc gggtcggtcg cggtgtcggg acgcagtgcc gccagcgggc tcacccgcac 38100 cacgcgccgg atcggcagcc aggccgcgac cagggtggcc gtcagcccga tggcgagccc 38160 gcccagcagc cacggcgcgg gcggtgccgg ggcggcgatc ggggtgatcg gtgagagggt 38220 cttgatcagg gcgatgagcc cgtagccgag tccggcgccg accagcacgc cggccagcga 38280 cgacaggagg ccgacgacgg ccgcctcccg gcgtaccgaa ctcaccacct ggcggcgggt 38340 cgcaccgacg cagcgcaaca gggcgaagtc gcgcatgcgc tgggccagca ggatggagaa 38400 ggtgttcgcg atgaccagga tcgagacgaa cacggcgatg ccggcgaaga gcagcagcag 38460 cagtgaccag gtgtccacgc cgttctggag ctgcgccgtc cgggccgcga tctcctgctc 38520 cggggtctgc accttcgcgg tctcgggcac cggaccgacc gcgccgcgca ccgtcaccgt 38580 gtagatgccg agggagggat cgtcggccca gcgcatgagc tgcggccagg tgacgtacac 38640 cgacgcctgc gccacaggag aaggcgcccg cacgatgccg accacggtga agtcggctgc 38700 cgtggcacgc tcacctatcc ggatgcggtc gccgacggcg acgtcccagt tctgggcgtc 38760 ccacaggtcc accacggcct cgcccttgcg ctcggggaaa cggcccgagg tgagctgctg 38820 ccagcgcagg tccttggact cggcgaccgg ccccacgccc atctcggggt aggaccggtc 38880 acccgcgcgc accgtcagca tggccctgcc gagcggtgac gcgttcgcgc catgacgctc 38940 gacgagctcg aacgcatcct cgttcgtcag cttggacacc acgtggtcgg agttgcggaa 39000 cggcgccccg aagccggcca tgatgccgct ctgcgccccg gaggtgagca cgccgacccc 39060 gacgacgaag gccacggcga cggtgaccgc gatcgccgcc gcgacgtacc tgcggacatg 39120 ggtgcgcagc gacgcgagaa agacggtgcg catcaggcga tccgtccgtc ttccagggtg 39180 accacgccgt cggcgtaggc cgcggcctca cgctcgtggg tgaccatcac gacggtctgg 39240 cccagctcgc gggtggattt gtgcaggtac cccaggacct ccgccgaggt ggtgctgtcg 39300 aggtttccgg tgggctcgtc ggcgaacagc agatccggcc cggtgatcag agcccgggcg 39360 atggccaccc gctgctgctg gccgccggac atctcggagg gccggtggcc gagccggtcg 39420 gccatgccga gggtttcggc gagcacgtgc acgcgctcgg tcgccgcgtc gtcgatgcgc 39480 cggccgccga gctcgagcgg gagcgtgatg ttctggaacg ccgtgagcat cggcagcagg 39540 ttgaaagact ggaacacgaa gccgatgtgc tcacggcgga agaccgtgag ctcgttgtcg 39600 tcgagtgatc cgagatcggt gccggccacg gtgacagtgc catcgctcgc ctgatcgagc 39660 ccggccaggc agtgcatcaa cgtggacttg cccgatccgc tcgaccccat gatcgcggtg 39720 aacttgccgc gcgggaggtc gaggtcgacg ccgcgcaggg catgcacgcg ggtttcaccc 39780 tggccgtaca ccttggtcag gtttcgcgcg ctggccgcca cggtttccag agcggctcgc 39840 tggccggtca tatagaagca cccttcgatt gtgcttgcgt acagtcggca tgcatgagca 39900 gaaagccatc attgacggct tcatggcgct attcttcgcg ccaaggctgg tagtcgtgct 39960 ggtactccgc aaagcgccac ccatcgtaga cgagcagtcg gccgggcacc aacggttcca 40020 aattgaagca gggcgccgtg cggagtaata gtcaagactg tggatgccga gttccttggc 40080 gactgtggga agggtgcttg caccggacgg gcggcattcc ctggtcagcc cccgggtgtc 40140 cgggccgctg gtccggcgtt ggcgtcgaag gaactgccgc cgtacctggg gtcgagcacg 40200 gatgcggacc acgtggcggg cgcggccagc atggccgcga cgccgatggt gagcccggcg 40260 ctgaccagcg aactacgacg gggcctgacc agccgcgcca gcgcgagcgc gacgacggcg 40320 accacgccga gcgcgaccgc gccccacatc gcccacggca gaaaagtggg gtagaaggac 40380 cacaaccaga cggcccaggc gagttcggcc acgatcgcga gcggaaatat ccacgccatc 40440 ctgcctccgc tccgatacgc ccgccagaac attacaatgc cgattccgga caaagcggct 40500 accggcggcg cgagtacggc cacatatgcg ctgtgcggga tgacaaagac cgcgctgtag 40560 ggcagggcga aggtgagaag ccacacgccc cacatcacca ttccgccgcg tgccgggtcg 40620 gtacgctcgg cccggcgcca ccaccacagc ccgcacagca gagccatcag cgcgagcgga 40680 tacagccaac cggacgcgac gccgaggcgg ccgccgaaca gcttgcccca gccgccccca 40740 tgctcgatgc ctatctcggg gatgaccatg ccagggcgtg gccggggcag ctgcgtcgat 40800 ctcttcggag gcgccgggcc gatcaccgag cccatgtagt tgggcggcag ggcgccgggc 40860 agattgatgc ccaggcgtcc gagaccgttg tacccgaaca ccatcgcggc ggcgctgctg 40920 ttcgtggtgc cgctgatgta gggccggtcg gcggccggag tgacgtggta gagcgtgatc 40980 cacgacagcg acaccacgag cgtcaccact ccggcgatcc ccaggtgctg cagccgacgg 41040 cgcagtccga tcggcgcgct caggagataa ccgatcgcca gggcgggcag gatcatccac 41100 gcctgcaaca tcttcgcctg gaaacccagc ccgacccaga cgccggccca gaccagcgac 41160 cgcagccgtc cttccagcac ggcccgctga taggagtcga cggcgagcac caggcacatg 41220 accagcgccc catcggccat gctgtgcccg aacatggacg cggccacggg ggtgatggtg 41280 aagacggcgg cggcgagcag acctggcacc acgcccgccc atcgccgcac gatccggtac 41340 atcaccagca ccgagatcac gccctcgatc acctgcggca aggcaagggc ccaggcgtgg 41400 aagccgaaga tcttgaccga gatggcctgc ggcacgaagg ccccggcgag cttgtcgagc 41460 gtgtaggtcg cctgcacgtc gacggtgccg tacaggaacg ccttccagtt ctcggacatg 41520 ctcttgacgg cgtccgagta tctcggtgcg tagtcgacca gcggcaggtt ccaggcgtag 41580 agcaccgctg ccgtggccgc gatgcagagc agcgccggcc gggcccacca cggctggccg 41640 ggcggcgagc gccacaccgc ccagcggggg aatctgccgg cgggtgcggg gtcccggcac 41700 gcggacggcg gagtcatggt gatgtgcgac atgaggaact cccaggcgtt tccttcggca 41760 gttccctgcc tttactcggc tgcgtagcga atgaccggcc aggtggtctc gttatatccg 41820 ccgtccggtg cggcgttcct ggcatgctca tcgagtttgg cgaacaggtt cttgttcggc 41880 ccgtcgagca ccgacaactg cgtcgcgtag tgcttcatcg cctggaattt ccgcgtccgc 41940 gcctcctcat cgacgaaact cagctccgga gagccgagcc ggaggccgtc aggcaattca 42000 gccaggtcct gggaatacgc cgcgtacggg agatcctgcc agagtcgcag cggaatacct 42060 cgctcgcgtg cggcgagcag cgtggcatcc cgcgtggcct tgtggtcggg gtgtttcccg 42120 atggccacac aggtgagaac gagcgtcgga tcgcactccg cgatcatgga ctcgatgtcc 42180 tccctgatcg cggcgaccag gtcgtggttg ttcgccggcg actgctggcg gaccatcgag 42240 ccttcgttgt ggtgcagcag ccactggcca tccggtgacc ttcgatagat ggcatcgaga 42300 aaacggccat gccgatggcc cgcaccgagc tgatcgaggg cggcgatgtc ctcatttcgt 42360 cggcgcagcg gcgcgtcctc ggtcggcgac agaccccagc gtgcgtggaa tcgctccgcc 42420 gccggggaat aagggggcgc cgcgctgccg gcgaacaccg tgaagacggt tacttttcca 42480 ccgtcctgct ccgcttgggc gaggctggct ccgacggaga ggacggcatc atccaaatga 42540 ggggagattg ctaatatccg ggttcggtcg gcgtcctgca acatggttgt cagtctggtg 42600 tcggccctgc cccgttgcaa taaagcggaa ctggacggga cctcgcacgc gtggagaatt 42660 tccgggcggg ccgggcacca cgatgagtca cccggtcacg tcgcagtcac acgttctctg 42720 accagcctgt caccgtctgc tgcgtacaac tggtgtcaac gccgacaccg ggcaggagaa 42780 gatgagtggg aagagcgcag ccgcacgacc tcgcctcggt cgcatcgaac gacgccttcg 42840 ccgggctcac gtcggcgacc gcggcctcta ggatggcgcc agccggcgca gcgcgcgccg 42900 catgaggggg aagtggatct ctaccgagag gccaccctgc gggcgcgcgt gcgcggtcaa 42960 cgtggcgtcg tgggcgacgg cgatggcgcg gacgatggac agcccgaggc cgtggtggtc 43020 gtcggcgcgg gtgcggtcga gccgctggaa gggctcgaag aggcggtgga cctgctcggg 43080 gggcaccacc gggccggtgt tggcgatgga gacgacggcc ttcccggcct cggcccgggt 43140 ggagagctcc acctggccgc caggcacgtt gtagcgcatg gcgttgtcca gaaggttggt 43200 gatgagtcgt tcgaccagtg ccgggtcgcc cgtggtgggg gcatgagcga tcccggtcac 43260 caatcggggg tgtgggcaac cggcccggag ggacttcccg tcggcccagg aatcggttgc 43320 cgcgccggcc gtggggctgt tcccgtcagc cctccgatcg gcactcacgc cggccctggg 43380 gttgttcccg tcagccccgg ggccggtccc ctccatcgtg cggatcgtgt gctcggcgat 43440 ctccgccaga tccaggggct cgcggtgatc gaggccgccc tcgctcttgg ccagcgtcag 43500 cagcgattcc agcaggcgcc cctgctgccg gctgaggtcg agcagccgct ccatgatcga 43560 tcgcatggac ggggtgtcgg cgtcccgatg caggaggctc tcctccagca acgcgtgctc 43620 cagggtgagc ggggtgcgca gctcgtgggc cgcgttggcg acgaagcgct tctgcgcgtc 43680 gagggcgctg tggagacgtt ccagcagctc gtccaccgtg tcggcgaggt tgcgcagctc 43740 gtcgcgcggg ccgggcaggg cgagccgctc gtggacgttg cgggcggaga tccgcttgag 43800 cgtggtgttc atcgtccgta gcgggcgcag catcctgcct gccaccagcc agccgagcaa 43860 gaacgagatg accgtcatca gggccagcgc gatcagcgat tggaacagca ggttctccag 43920 aatggccgcc tgctgctgcc gcgcgaaggc gcggaacctg ccgccagggt caccgtccac 43980 cagcacgaag ggtctggagc cgcggaagag caggtaggtg atggcgagca ggaccacccc 44040 tgaggcggcg aacaacgcgc cgtagacgag cgtgaggcgc agccgtacgc tgcggaaggc 44100 tgttgtcagg cgtcggagac gatgggccac tgttccgatg gtatgagacc aggaccggcc 44160 ggaggagccc acggcgccga cgatcgcggc cccgggccga ggccgagatg ccgcgagtcg 44220 ggcgcctacc gagtcagcgc accgcgcacc gctgccgtga cctcgggcgc cagggtgcgg 44280 gcgaaggtgg tggtgaggtg gctgcggtcg gagtaggcga tcaggccgcc gatgacgggg 44340 ccgcaccgct cgccgcacac caggtgatcg acactcgcca cggagacgag gccggtgtcg 44400 tcggcgcggg cggcggcggc gagcggatcc ggccggagca cgacgccggc cgggccgccg 44460 caggagtcca gatcgtccgg gtgcttggcg atgcagtggg gcacgctgtc cggcatggcc 44520 ggggtgtcac gcaggacgag caccggaagg ccggcgccgg tgaaggcccg gagcgtgtcg 44580 cggtaggccc gctcggccgc ggcctgctgg ccggctggcg agacgccggc gagcggcaca 44640 tgcgtacggt tggacatgat caccaggtcg tagccgccgt tcacgatgga cccgaccgcc 44700 cacttgttga tcttctggca gttctccgag acccccgcgc cttcgaggac gagcggctga 44760 tcgacggtgt agcacgccag ctgtacgtag gtggtgagct gccagcgctc gctccacagc 44820 gccttctcca gggccgggac ccagtgtccc gcgtgggagt tcccgaccag ggcgatgcgc 44880 ctgccggcgg cgtcaggtcc gtacgtgcac gtgttccggg cgatgaacgg ttccttgttc 44940 acgcacccgt ccgcgtacac ggcgggcttg tccttcaacg cgacctgagg aggcatcagc 45000 aggcccagat cctggcacgc cgggtcgcgc acgacgccgg cacccaggca tgaccctgcc 45060 cgcgaggccg cggcctcgaa cgcggcactc tccgtacgct cggcggcgtc ggcgtaggcg 45120 acgacgcccg ctcccgctcc tgcgacgacc accacgcacg acgcgagcat cgcgaacgtg 45180 agcctgcggc tgcggaccag gaccgggtgc cagcgcagcc ggtcctcgac gaggtactgc 45240 gagagcgcgg cgaggaccag ggtcagcgcg atcacgccca cggactcgat cacggtcagc 45300 gagcggccca gcgcgtacgg gaggatcatg atcggcggcc aatgccacag gtacaccgcg 45360 taggaggcgt tgccgagcca ctggaccggc cgccacgcca gcgcccgccc gggtccgccg 45420 cgcagaccgt ccgcggccgc tgcgatcacc aggcaggccc ccactgtcgg caccagggcg 45480 gcggctccgg ggaaggccgt ctcggcgtcg aaccggacca cggcccaccc gatcatgccc 45540 aggccggccc acgcgagccc ggcccggacc gcccgcgcgc gcggcatcgc gcgtacggtg 45600 agaaccgcgg cgagcagacc gccgagcgcg agctcccaga agcgggtcgt cgacacgaag 45660 tacgcggcgg ccggatcggt cgccgtcttc tgcaccgacc aggcgaggga cgcggccacg 45720 accgcacccg tgaccaccac cgcgctccac ctcgtgaagt tctccggagg gcgacgcccc 45780 cgtgccaccc gggcggccag ccaggccgcc gaccccagca gcagcggcca gccgaggtag 45840 aactgttcct cgatggacag cgaccagtag tgctgcgcgg gccagtccgg ctggtcgacg 45900 tcgaggtagt tcgcctgcgt gagcgcgagt ctcaggttct ccacgtacac cgtggcggcg 45960 atcacctcac gcgccgccgt ccccagcacc gtgagcggca gccagaccac cgacgcggcg 46020 agcgtgacca ggagcgcgag gctcgcggcc gggatgaggc ggcggacgcg gcgtgcccag 46080 aagtccagca gtctcccgcc gccgtgtccc ggctgacgca gcaggtggct cgtgatgagg 46140 tacccggaga tgacgaagaa gacgtctacc cccacgtacc cgccggtcgg cccgccgggc 46200 cacaggtgga acgcgaccac cgccgccacc gcgatcgccc ggaggccctg aatgtccgtg 46260 cgggactcgg agctccggcc gccggcgtgc tcgcttcgcg gcgcacacga cggggcgtgc 46320 ggcgtcagcc cgcatgcgca ggtcggaagg gacatctgtt cggtgggtgc cgggcgctcc 46380 atggcaactc ccgcgtcatc gaggtgctgc gcagccctcg aaggtcgcac ccgcggacga 46440 gagcctgctt gatcgcaagc gtgctcaacg gactcgatgt ctacaagccg gtccaggtga 46500 acgcttggtc accaccaccg gtgaacgcgt ccaagcgcgc gaactgttca gttggaccca 46560 ctcgtggaca tcggctccgc tcagcacgat tgaggtcgct gacttgcgtg cgcgtgtgag 46620 aggagtcccg catggccata gtgtcgccgt tcggaggttt gctgaagggc gacggagagg 46680 atgatcccgc gccgtccagg atccgcccgg ggacgttgcg acgagtgctc ggatacttcc 46740 gcccgcacgt cggcaaggtg gcgctcttcg ttctcgtcac cgcattggat tcgatcttcg 46800 tcgtcgcgtc tccgttgatg ttgaaggacc tggtggacaa gggggttctg gggaacgatc 46860 tggagctcgt catcctgctg gcgtgcctgg ccgccggctt cgccgtgatg agcacgctgt 46920 tgcagctcgt gtcggcctac atctccggcc ggatcgggca gggggtcagt tacgacctgc 46980 gggttcaggc ccttgaccac gtccagcggc tgccgatcgc gttcttcacc cggacccaga 47040 cgggcgtgct ggtcggccgg ctgcacacgg agctggtcat gacgcagatg gcgttcaccc 47100 agatgctgac ggccgccgcc agcgcggtca cggtcctgct ggtgctggcc gagctgttct 47160 acctgtcgtg gatcgtcgcc ctcctcacgc tggtgctgat cccggtgttc ctggtgccct 47220 ggtcttacgt gggacggcgg atgcagcgct acaccagagg gctgatggag gagaacgccg 47280 gcctggccgg gctgctgcag gagcggttca acgtccaggg ggcgatgctc tccaagctct 47340 tcggccgtcc ggccgaggag atggccgagt acgagagcag ggccggccgg atccgcgggc 47400 tcgccgtgag cgtcaccctc tacggccgga tggcccccgc catcttcgcg ctgatggccg 47460 cgctcgccac ggcgctcgtc tacggggtcg gcggcgggct cgtgctctcg caggcgttcc 47520 agctcggcac gctggtcgcc ctggccaccc tgctcgggcg gctgttcggg ccgatcaccc 47580 agctggccag cattcaggag aacgcgctca cggtcctggt gagcttcgag cggatcttcg 47640 agctgctcga tctgaagccg ctgatcgagg aacgccccga cgcggtcgcg ctcaaggccg 47700 gcaaggcctc ggacgtccag ttcgagaacg tgtcgttccg ctaccccagc gcggacgagg 47760 tctcgctgcc gtcgctggaa cagaacgtgc gcaccgggca ggagcgtggt gaagcgacgc 47820 cggaggtgct gcgcgacgtg agcctgcacg tgccggccgg caccctcacc gcgctcgtgg 47880 gcccgtccgg cgccgggaag agcaccctca cgcacctggt gtcccggctg tacgacccga 47940 cctccggaac cgttcgcgtc ggcggacacg acctgcggga cctcaccttc gactcgctgc 48000 gcgaaacggt gggggtggtc agccaggaca cctacctctt ccatgacacg attcgggcga 48060 accttctcta cgcccgcccc gacgccaccg aggacgagct ggtcgaggcg tgccgagggg 48120 cgcagatctg ggacctgatc gcatccctgc cacgcgggct cgacaccgtc gtgggtgatc 48180 gcggttatcg cctgtcaggc ggggagaagc aacggctggc gatcgcccgg ctgctgctga 48240 aggcaccctc ggtcgtcgtt ctcgacgagg ccaccgccca cctggactcg gagtcggagg 48300 ccgccgtcca gcgggcactg acgacagccc tgcgcagccg tacctccctg gtgatcgccc 48360 accggttgtc cacgatccgc gaggccgacc acattctcgt gatcgacgac gggagggtca 48420 gggagcgcgg gacgcacgag gagttgctgg cggaaggcgg tctctacgcc gacctgtacc 48480 acacgcagtt cgccaagtca ggcgtcaacg ggacccggcc gggacagggc gacggggcgg 48540 agcccgtgca agaggtggtc ggtggagggg aacgatgagc gccggaacgc gggccacacc 48600 gacgacggtg ctggacctct tcgcccgcca ggtgggccgg gcacccgatg cggtggctct 48660 ggtcgacggg gaccgggtcc tgacctaccg gcggctggac gagctcgccg gagcgctgtc 48720 cgggcgcctg atcggccggg gtgtcggccg gggtgatcgc gtcgcggtga tgatggaccg 48780 ctcggcggac ctggtggtga cgctgctcgc cgtgtggcag gcgggggcgg cctacgtgcc 48840 ggtggacgcc gcccttcccg cccggcgggt ggcgttcatg gtggcggact ccggagcctg 48900 cctgatggtg tgctcggagg cgacgcgcga tgcggtaccg caaggggtcg agtcgatcgc 48960 gttgaccggc gagggcggat gcggcacgtc ggcggtcacg gtggacccgg gggatctggc 49020 gtacgtgatg tacacgtccg gctcgacggg caccccgaag ggggtggccg tcccgcatcg 49080 gagcgtcgcg gagctgacgg gaaaccccgg ctggggggtg gagcccggcg aggcggtgct 49140 catgcacgcg ccctacacct tcgacgcctc cctgttcgag atctgggtgc cgctcgtgtc 49200 gggcgcccgg gtggtgatcg ccgcaccggg tgcggtggac gcccggcgcc tgcgcgaggc 49260 ggtcgccgcc ggggtgacga gggtgcacct gaccgcgggc agcttccgcg cggtggcgga 49320 ggagtcgccg gagtcgttcg cgcacttccg tgaggtgctg accggtggtg acgtggtgcc 49380 cgcgtacgca gtgcagaagg tgcgggcggc ctgccctcac gtgcggatcc ggcatctgta 49440 cggcccgacg gagacgaccc tgtgcgcgac gtggcagctg ctggagccgg gtgacgtcgt 49500 ggggcccgtc ctgccgatcg gccgcccgct gccgggccgc cgggcctggg tgctcgacgc 49560 gtcattgcgg ccggtggagc ccggggtggt cggtgacctg tacctttccg gcgccggtct 49620 ggcggacggc tacctggacc gggcggggct gacggcggaa cggttcgtgg cggatccgtc 49680 cgcggcgggg aggcggatgt atcggacggg ggatctggct cagtggaccg cggacggtga 49740 gctgctgttc gcgggccggg ccgacgacca ggtgaaggtc cgcggattcc ggatcgagcc 49800 gggcgaggtc gaggccgcgc tgaccgctca gccgcacgtc cgcgaggccg tggtggtggc 49860 gatcgacggg cgcctgatcg gttacgtggt ggcggacggg gacgtggatc ccgtactgat 49920 gcgccggcgg ctggcggcgt cgctgccgga gtacatgatc ccggccgctc tggtcacgct 49980 ggacgcgttg ccgctgaccg gcagcggcaa ggtggacagg agggcgctgc ccgagcccga 50040 tttcgcgtcg gccgcgccgc gccgcgaacc cggcaccgag ccggagcgcg tcctgtgcga 50100 cctgttcgcg gagcttctgc aaccggaggg aaggggggta ggggtcgatg acggtttcgt 50160 cgagctgggc ggggactcga tcgtcgcgat ccggctggca gcacgtgcgt ccagggtggg 50220 gctgctggtg acgcccgccc agatcttcaa ggagaagact ccggcacggc tggcagccgt 50280 cgcgggtgcc gtaccggccg gcagacccgc cgacggcccg ctgatcaccc tcacggcgga 50340 ggaggaggcg gagctggcga ccgccgtccc gggggccgag gaggtctggc cactcgcacc 50400 gctccaggaa gggctctact tccaggccac cctcgacgac gagggtcacg acatctacca 50460 ggcgcaatgg atcctggagc tggcggggcc gctggacgcc gcccggctgc gggcctcgtg 50520 ggaagcggtc ttcgcccggc accccgagct tcgcgtgagc ttccaccggc gcgcgtcagg 50580 cacgatgctg caggtcgtcg ccgggcacgt cgtcctgccg tggcgagagg tggatctggc 50640 ggatgcgggc gatatcgacg cggccgtggc ggccctgatc agtgaggaac aggagcagcg 50700 gttcgacctc gccaaggcac cgctgttccg gctggtgctg gtccgtcacg gcgaggaccg 50760 gcaccgcctg ctggtcgtcc atcaccacat cctgaccgat ggctggtcgg tggcggtcat 50820 cctcaacgag gtggctgagg cgtacacgaa cggcggccgt ctcccggacc gcacgggcgc 50880 ggcctcctac cgggactacc tggcctggct ggaccggcag gacaaggacg ccgcacgtgc 50940 cgcctggcag gcggagctgt ccggcctcga agggcccgcg ccgatcgcga aggccgccac 51000 cacgaccggc gccgggacgg gctacgaata tcgcatcgcc ttcctgaccc ctgacctcca 51060 cacgcggctg acggagctgg cccgcgacca cgggctgacg ctgaacaccc tggcacaggg 51120 cgcatgggcg atggtgctgg cgcggctcgc gcggcgcact gacgtggtct tcggcaccac 51180 ggtcgcctgc cgtcccgccg agctccccga ggtggagtcg gtgccgggtc tcatgatgaa 51240 cacggttccg gtccgggtgc cgctgcaggg cgcgcaatcg gtcgtggacc tgctcaccgg 51300 cctgcaggaa cggcaggcgg ccttgctgcc gcaccagcat ctggggctga cggagatcca 51360 gcgggcggca ggacctggcg cgacgttcga cacgctgctg gtcttcgaga actacccgcg 51420 ggacttcgcc ggccagttca cctacctggg cacgatcgag gggacccact acccgctgac 51480 cctcggcatc atcccggggg atcacttcag gatccagctc gtctaccggc gcgggcaggt 51540 cggggagagc gtcgccgagt cgatcctggg atggttcacc ggcgctctca tgacgatggc 51600 cgctgatccg cacgggccgg tgggccggat cggtgtgggt gaggcccggg ccggcggctc 51660 ggaccgggcg atggcggcgg gggagccgct gccggtgctg ctacggcggg tggtgaagga 51720 ccggccggac gaggtggcgg tggtggacgg cgacggtgag ctgtcgttcg gggaattgtg 51780 ggaacgggcg acggcgctgg cggccgagct gagggctcac gggatcgggc cggagagccg 51840 ggtggccgtg atggtgggca ggtcggcgtg gtgggcggtc ggggtgctgg gcgtctgctt 51900 ggcgggcggc gcgttcatgc cggtggatcc ggcgtatccg gctgagcgcg tcaggtggat 51960 cctggccgac tccgacccac ggctggtgct gtgcgcgggg acgacgcggg aggcggtgcc 52020 ggaggagttc gcagaccggc tggtggtggt cgacgagctg gacctcgcgg ggagcgacga 52080 tgcgggcttg ccacgggtga gcccggatga cgcggcttat gtgatctata cgtcgggatc 52140 gacggggact cccaaggggg tcgtcgtctc gcacgcgggc ctcgggaatc tggcgatggc 52200 gcagatcgac cggttcgccg tgtcgccgtc gtcgcgagtc ctgcagttcg cggcgctggg 52260 cttcgacgcg atggtgtcgg agatgttgat ggcgctgttg tcgggggcga ggctggtgat 52320 ggcgccggag ccggccctgc caccgcgggt gtcgctggcc gaggcgttgc ggcggtggga 52380 ggtcacgcac gtcacggttc cgccgtcggt gctggccacc gccgatgcgc tgccggccgg 52440 gctggagacg gtggtggtgg cgggggaggc ctgcccgccg ggcctggccg aacgctggtc 52500 ggcgggacgg cggctggtca acgcgtacgg gccgaccgag gccacggtct gcgcggcgat 52560 gagcaggccg ttgacgggca gccgggaggt ggtcccgatc gggacaccca tcgccggcgg 52620 ccgttgctac gtgctggacg cgttcctgcg gccgttgccg ccggggatca ccggtgagct 52680 gtacgtggcc gggatcgggt tggcgcgcgg ctatctgggt cgtgcgtcgt tgacggctga 52740 gcggttcgtg gcggatccgt tcgtggctgg tgagcggatg tatcggacgg gggatctggc 52800 gtattggacg ggtgagggcg agctggtgtt cgccgggcgg gatgacgacc aggtgaagat 52860 ccgtgggtat cgggtggagc cgggtgaggt ggaggcggtg ctggcggggc agccgggggt 52920 ggatcaggcg gtggtggtgg cgcgtgaggg gcggttgctg ggttatgtcg tctccggtgg 52980 tggggtggat ccggtgcggt tgcgtgaggg ggtcgcgcgg gtgttgccgg agtacatggt 53040 gccggcggcg gtggtggtgc tgggtgcggt gccggtgacg gcgaacggga aggtggatcg 53100 ggaggcgttg ccggatccgg gcttcggcgg gcgggtttcg ggccgggagc cgcgtacgga 53160 ggtcgagcgg gcgttgtgcg ggctcttcgc cgaggtgctc gggctgccgg gggtgacggc 53220 ggtggggccg gacgacagct tcttcgagct gggcggggac tcgatcactt cgatgcagct 53280 ggcgtcgcgg gctcgccgcg aggggatgct cttcggcgcg cgggaggtgt tcgagcgcaa 53340 gacgcctgcg gggctcgcgg cgatcgtcga tgtgggcggc gagcttgcgg caggtccggc 53400 cgacggcgtg ggggagatcg cgtggacgcc gatcatgcgg gcgctcgggg acgggatcgt 53460 ggggtcgcgg ttcgcccagt gggtggtgct gggtgcgccg ccggacctac gggcggacgt 53520 ggtggccgcg ggattggcgg cggtggtgga cacgcacgac gtgttgcggc tgcgggtcgt 53580 cgatgaccgg gcgggccgcc ggctggcagt gggcgagcgc gggtcggtgg acacggccgg 53640 gctggtcacg cggctcgagt gcggcggccg tccgccggac gaggtcgtgg agcgcgcggt 53700 gcgggaggcc gtggggcggt tggacccggt ggcgggtgtg atggcgcagg cggtctgggt 53760 ggatgcgggg ccggcgcgga cggggcggtt ggtcgtcgtg gtgcatcatc tggcggtcga 53820 cgggatgtcg tggcggatcc tggtgcccga cctgcggctg gcgtgtgagg cggtggccga 53880 ggggcgggat ccggtgctgg agccggtgtg ggggtcgttc cggcgctggg cggctctgct 53940 ggaggagtcg gcgctctcgc gggagcgggt cggggagctg cacacgtggc ggacgatcgt 54000 cgatcaggag gatcggccgg tcggccggcg gcggctgagc gcaggggatg cggccggggg 54060 cgtgcgttca cggtcgtggg tgatgtcggg ggatgaggcg tcgctcctgg tggggaaggt 54120 tccggtggcg ttccactgcg gggtccacga ggtcctgctg gcgggcctgg cgggagcggt 54180 ggcgcgctgg cacggtgacg acggggtcct ggtggatgtg gaaggccacg ggcgtcatcc 54240 ggccgagggg atggatctgt ccaggacggt gggctggttc accagcatgc atccggtgcg 54300 cctggatgtg gcggggatcg agctggcggc ggtgccggcc ggtggccgtg cggccgggca 54360 gttgctgaag gcggtcaagg agcagtcgcg ggcggcgccc ggcgacgggc tcggttacgg 54420 gttgctgcgc catctcaatc ccgagacggg ccccgttctg gcggccctgc cgtcaccgca 54480 gatcgggttc aactacatgg gccggttcgt caccgtcgac cagggcggtg cgcggccgtg 54540 gcagccggtc ggggggatcg gcggttcgct ggaccccggc atgggcctgc cgcatgcgct 54600 ggaggtcaat gcgatcgtcc acgacaggct ggcgggcccg gagctggtgc tcacggtgga 54660 ctggcgggac gacctgctgg aggagaccga catcgaacga ctgtgccagg tgtggctgga 54720 catgttgtcc ggattgtccc gccaagcgga ggatccttcc gcaggcggac acaccgcgtc 54780 cgacttcgcc ctactcgacc tcgaccagga cgagatcgag ggcttcgaag ccatagcagc 54840 ggaactctct ggaggccaga catcgtgaac acgccgagca cacccgccgg atcggcgctt 54900 gaggaagtct ggccgctgtc accgatgcag gaggggatcc tctatcacgc cgcactcgat 54960 gaggcccctg acctctacct catccagcag tcgcagatca tcgaaggacc cttggacacc 55020 gagcggttcc gcctggcttg ggagagcctc ctcaaccggc atgcggcgct tcgcgcgtgc 55080 ttccaccggc ggaagtccgg tgagtcggtc cagctcatcc cccgtaaggt gccgctcccg 55140 tggtccgagc gcgacctgtc cggcctgtcc gaggaggacg cgctggccga ggcgagcgtg 55200 atcgcggaga aggagcgcgc cacgagattc gacccggcca agcctccgct gctgcggcag 55260 gtgctgatcc ggttcggtcc ggacaagcac tgtctggtga cgacgagcca tcacctggtc 55320 atggacgggt ggtcgcgggc gatcctcgag tcggagctcc tcgagctcta cgccgcgggt 55380 ggcgccgagc cggggctgcg gcccgccggc tcctaccggg actatctggc ctggctggag 55440 cggcaggaca aggaggccgc ccgcgcggca tggcgtgcgg agctggcggg cgccgaccgt 55500 tcgacactcg gcatccccga agcgtccagg aagacccagg ggcagcgggt gcgggaggtg 55560 ctcggctacg cgccggactt cacctccgct ctggtggact tcgcccgccg ccatgggctg 55620 acgctgaaca cgctggtgca gggggcgtgg gcgttggtgc tggcccggct cacgcgccgt 55680 cgtgacgtgg tgttcggcgc ggtggtctcg ggacgtccgg cggaggtgcc cggcgtggag 55740 caggccgtcg ggctgttcat caacaccgtg ccggtgcgcg tccggttgga cggcgggcag 55800 ccggtcatcc agctgctgac ggagctgcag gagcggcagt ccacgctcat ctcgcatcag 55860 catctcgggc tgcaggagat ccagaagctc tccggggtga gcttcgacac cgtcgtgtcg 55920 ttcgagaact acgtcgatcc gggggcgggt ccgggctccg atcgcgagct gcgcctgaga 55980 ctgaaggagt ttcaccagtc ggcgccgtac gcgctcctcc tcggcatcat gccaggtgag 56040 agcctccaga ccgacgtgga gtaccggccc gagctgctcg acgcccgcgt cgccaaggag 56100 gccctccacg ggctcgcccg cgtcctcgag cggatgatcg ccgagccgga gaccgcagtg 56160 ggccgcctgg acgtggtcgg tgacgcgggg cgcgagctgg tggtcgagcg gtggaacgag 56220 acgggcgacg cgatcggtgc gccgtccgcg gtggacctgt tccggcgcca ggttgcacgg 56280 gcacccgccg cgacggcggt gacggccggg gacctggcct ggtcgtacgc ggagctcgac 56340 gagcggtccg gccggctggc gcgggcactg acggaacgcg gcgtgcgacg cggcgaccgg 56400 gtgggcgtgg tgctggggcg gtcggcagag gtgctggcag cctggctcgg agtgtggaag 56460 gcaggcgcgg cgttcgtgcc ggtcgacccg gactacccgg cggaccgggt ggcgttcatg 56520 ctggccgact ccgccgtcgc gatggtggtg tgccaggagg cgacctcggg tgtggtgccc 56580 ccgggctacc agcagctcct ggtgaacgac gccgacgacg gcgaggccgc cctggtcccg 56640 atcggggcgg acgatctcgc ctacgtgatg tacacctccg gatcgaccgg gaccccgaag 56700 ggcgtggcga tcccgcacgg cggcgtggcg gcgctggcgg gagatccggg atggggcgtc 56760 ggacccggcg acgcggtgct gatgcacgcc ccgcacacct tcgacgcgtc gttgtacgac 56820 gtgtgggtgc cgctcgtctc cggcgcgcgg gtcatgatca ccgagccggg ggtcgtcgac 56880 gcggagcggc tcgccgggca tgtggccgac ggcctcaccg cggtcaactt caccgcgggg 56940 cacttccgcg cgctggcgca ggagtcgccg gagtcgttct ccgggctgcg cgaggtggcg 57000 gcgggtggcg acgtggtgcc gctcgatgtg gtggagcggg tacggcgggc gtgcccgcgg 57060 ctccgggtct ggcacaccta cggcccgacc gagaccacgc tgtgcgcgac gtggaaggcg 57120 atcgagcccg gtgacgaggt ggggccggtg ctgcccatcg gccgggcact gccgggccgg 57180 cggctgtacg tgctggacgc gttcctgcgg ccgttgccgc cgggcatcgc gggtgatctc 57240 tacctcgcag gcgccggagt ggcccacggc tatctgggtc gtgcgtcgtt gacggctgag 57300 cggttcgtgg cggatccgtt cgtggctggt gagcggatgt atcggacggg ggatctggcg 57360 tattggacgg gtgagggcga gctggtgttc gccgggcggg atgacgacca ggtgaagatc 57420 cgtgggtatc gggtggagcc gggtgaggtg gaggcggtgc tggcggggca gccgggggtg 57480 gatcaggcgg tggtggtggc gcgtgagggg cggttgctgg gttatgtcgt ctccggtggt 57540 ggggtggatc cggtgcggtt gcgtgagggg gtcgcgcggg tgttgccgga gtacatggtg 57600 ccggcggcgg tggtggtgct gggtgcggtg ccggtgacgg cgaacgggaa ggtggatcgg 57660 gaggcgttgc cggatccggg cttcggcggg cgggtttcgg gccgggagcc gcgtacggag 57720 gtcgagcggg cgttgtgcgg gctcttcgcc gaggtgctcg ggctgccggg ggtgacggcg 57780 gtggggccgg acgacagctt cttcgagctg ggcggggact ccatccattc ggtgaagctg 57840 gcagcgcggg ccacgcgtgc cggcatgccc ttcaccgtgg tcgaggtgtt cgagcacaag 57900 acgcctgcgg ggctcgcgac gatcgtcgac gtgggcggcg agcccgcggc aggtccggct 57960 gatcccccat cggactccga cctgctcggc ctggcgcagg acgagatagc ggagttcgag 58020 gccgaattcg acgacgaacg tcattctctg cgctgatcga aagcgggcgc cgcgcacggt 58080 gtgccggcag cctgcgagtt gtccaacatc ctgtcgtgcc aatgacgtat gcccatgagt 58140 aggttggctc aatgataagc aaagcaatgc atggaccgat tcggcccgcc cgcgcggata 58200 ccctgctggc ctcggtaggc gagcgaggca ttctgtgtga cttttacgac gagaacgcct 58260 cggaaatctt ccgtgatttg gaggcggacg cgggcggcac ggaagaagcc cacgggttcg 58320 cggcgctcgt ccgcccggag tcgggggcga tcctggagct cggggccgga acaggcaggc 58380 tgacgattcc gctcctggag ctcggctggg aggtgaccgc cctcgaactg tcgaccgcga 58440 tgctcaccac cctgcggacg cggctggcgg acgcgccggc ggacctccgg gatcggtgca 58500 ccctcgttca cgcggacatg accgccttca aactgggaga acgcttcgga acggcgattc 58560 tcagcccgtc cacgatcgac ctcctggacg atgccgacag accagggctg tactcgtcgg 58620 tccgtgagca tctgcggccc ggcgggagat tcctgctcgg catggccaac cccgacgcgt 58680 ccggcaggca ggagccgctg gagcgcaccc aggagttcac gggcaggagc ggccgccgat 58740 acgtgctgca cgccaaggtc tacccgtcgg aggagatccg cgacgtgacc attcatcctg 58800 cggatgaatc ggcggacccc ttcgtcatct gcgtcaatcg cttcagagtc atcaccccgg 58860 atcagatagc acgagagctg gagcaagccg gattcgacgt ggtcgcgcgg accccactgc 58920 ccggggtgcg taatcacgaa ctggtgctgg aagcgcaatg gggcagcgtg gaagacgcgc 58980 attagagccc tccggggaaa gcgcttgtgt acttttctgc agtcattcga cagtgaggaa 59040 cagaaatgag tgaggagctc ctcttcctcc ggcccgacac cattatcgaa ccgctggcca 59100 accggttcta cgcctcgatg tacgcgacgg ctcccgtcac ggccgccatg aatctcgcct 59160 tccgtaacct gccgatgctg gagtcctacc tcgcatcccc ggaatggcat ttcgcagccg 59220 ctcgcgatcc gaagttccgc ggcggattct tcgtcaacat cgaggagcag cggaagaacg 59280 aggtcgaggc gctgctcgct gcgatccggc gcgacagcgc ggacgtgctc cggttcgccg 59340 aggcgatcgc ggaggccgag aagatcatcc gcgaggaagc gaccggatac gatctcaggc 59400 cgctctaccc gaagctgcct cccgagctgt cgggtctggt ggagatcgcc tatgacaccg 59460 gcaacgcggc ctcgctgcac ttcctggagc cgctcatcta caagagcaag gcctacgccg 59520 aggactgcca gtccgttcag ctctccgtgg agaccgggat cgagcggccg ttcgtgatga 59580 gcaccccgcg actgccctca cccgacgtgc tcgagctgaa catcccgttc cggcatccgg 59640 gtctggagga gctcttcctg tccaggatcc ggcccaccac cctggccgcc ctccgcgagg 59700 cgctggagct cggcgacgcg gaagcggcgc ggctcgccga cctgctggtc ccggagccct 59760 cgctcgcctc cgaccgccat gtcgcggccg gagcccggat ccgctactgg gggcacgcct 59820 gcctgctcat gcagacgccc gacgtggcca tcatgacgga cccgttcatc agcgcggata 59880 ccgacgcgac cggccgctac acctacaacg acctgcctga ccgcctcgac tacgtcctca 59940 tcacgcacgg gcattccgac catctggtgc ccgagacgct gcttcaactg cgcggccggg 60000 tgggcacgtt cgtcgtgccg cgaacctcgc gcggcaacct gtgcgatcct tcgctggcgc 60060 tctatctcag aagcttcggg ctgcccgcga tcgaggtgga cgatttcgat gagatcgagt 60120 tccccggcgg gaagatcgtc tccaccccgt tcttcggcga gcacgccgat ctcgacatcc 60180 gggccaagtc gacgtattgg atcaacctcg gtggcaagtc gatctgggtg ggcgcggact 60240 cctcaggcct cgatccggtt ctctaccgcc atatccgccg gcatctcggc gcggtcaaca 60300 tcgccttcct cgggatggaa tgcgatggcg cgccgctgaa ctggcagtac cagccgttca 60360 tcaccaaggc gttgccgaag aagatgagcg acagccgcaa gatgtccggc tccaacgcgg 60420 agcaggcagg tgcgatcgtc accgagctgg gcgccgagga ggcgtacatc tacgccatgg 60480 gggaggagag ctggctgggg catgtcatgg ccaccagcta caacgaggac tcctaccagc 60540 tccagcagat cgccgagttc gaggcatggt gttcccgcaa gggtgtgaag gccgctcatc 60600 tgctcgacca gcatgagtgg cactggtcgt catccaggtg atcgcggtgg cccgccggtc 60660 ggccttcgct caggcgggca gggccgcggt cgcaagcagc tgccgaggcc gtgctcgccg 60720 aggccgtgct cgccgaggcc gtgcccgtgc tcgcccaggc cgtgcccgtg ctcgccgacg 60780 ccgtgctcgt cgaggccggt gccagagggc gcgtcaccgg cctctcagcg caaccggccg 60840 cgtgaaccgc ccggcggttc ggatcgttcg atatcagggc cggatcgaca acgcgtggtg 60900 gaagtggtta cgcgggtcgt aggcggcctt caccttgcgc agccgcgggt ggttcccctt 60960 gtagtagagg tcgtgccacg gcacgcccga ggtgttcaag cccggatccg cgaggtcgct 61020 gtcggggtaa ttgatgtacg ccccatcgct gacgtcgttc ggcaccggca ccccgccggt 61080 ctcggcgtac acatcggcat agagcttgcg gacccacgtc agatgcttgg cctcgttgcc 61140 gggattcgcc caaccggtga tgtagttcac cttgagtatc gcgtcgcgct gcggcagggc 61200 ggtggccgcc gggtcgacgg tgttcacctt cccgccgtag ccgatcagcc agacggcgcc 61260 gtagtcgatc ccgtccatgt gggtcatgtt ctcgtacacg gcctgaatct gccggtcggt 61320 cagccgcttg cgcaggtagc cggctttcgt cttcgacgcc gggcccctgc ctcctcgccc 61380 cggcgtcgag gccagccacc tctgttcgat cggctcgggc acctcggccg gcgggacgcc 61440 gtcgatcacc gcctcgatgt gcgcgtcgag cagtctccgg gcgtccggcc gggtggcgtc 61500 cacctggatg ggcatcatga agccgctctc acccatgccc gggacctcgt tcccgatcat 61560 gagctgactc cacagcccgg tgtacggcga gtcgggcccg ctgttccgct cgtaccactc 61620 cccgtggttg cgcagcagcc gggagaacgc cgcctccgtc atccccgccc agtcgaaggt 61680 caccgtgctc gtgagcaacg tcgcgggcgg cttcggcagc agccgctccg gattccggcc 61740 gacgtcctcc ggcaccctca tccagtactt cgtgaccacc ccgaagttcc cgccgccacc 61800 gccggtgtgc gcccaccaca ggtcgtgatg ggggtcgtcg cgctcacggg tcgccacgat 61860 cacgcgtgcc ttcccctgtt tgttgacgac gacgacctcg accgcgtaca agtagtcgac 61920 cacggagccg aactgccgtg acagcgggcc gtacccgcct ccgcagatgt gtccgccgac 61980 gccgaccccg ccgcagaccc cacccggtat ggtcacgttc cagcccaggt agagcttttc 62040 gtacacctct gagagcgtgt tgcccggctc gatcaggaac gcgttcatcg acgggtcgta 62100 cgcgatctcc gtcagcagcg acatgtcgat gatgaccttg acgtcggggt tgtcgacgaa 62160 gtcctcgaaa cagtgcccac cgctgcggac ggcgacccgc ttgccggtgc gcaccgtctc 62220 ctcgacggca tcggccacct gctgggtgga gccgaccagg tggatgtagt cgggctcgcc 62280 gttgaagcgg ctgttggcgc cacgcagctt caggttgagg tagcgcgggt cgtccggagt 62340 caccttgacc gggccggccg gcggtaagca gcgctcgccc cgcagctccg gtcgcgtgga 62400 cgaggcgccg gccgacgcgg cgtccgctcc ggtgccgccg gtcaccaccg ccgccgcgcc 62460 cccggcaagg gaggcactca gcaatctacg tcggttcagt tttgtcatgg cggcgacgtt 62520 actatcggtt cgattcgatc aactcgctgt ctgactggac gtaagcgatc tcttcacgcc 62580 gtggccgtac gtggctgtcc atcgcctaca gatttccgat ctctgaaggt acggtcacct 62640 gttgaagaac gcgtccgtca gcgcattcca ggtgacgccg ccgcgaacgc gcgctcacgg 62700 gaaaactcgc cgtcgaggcg ggtgacgacg gaatcgtggt gtccaaccac ggaggccgtc 62760 agttggacgg tgccgtcctg agccagtttc tgccaaacga ctgggaacac catgggacat 62820 ccacacgatc aagagcccga cggccaaatc cgtcctgcgg ctcagagccc ccgccggttg 62880 gtcgagatga cgagcacctc cgggcggcac ctgtatcacc gccaggtgcg attctccgat 62940 atcgacgccc acggccacgt caacaatgtg cgtttcctgg aatacctgga ggacgcctgg 63000 atcgccctct atctcgacaa tgcgggcccg ccgcaggagg accgcgacgg attgcccgcc 63060 gtggggttcg ccgtcgtgcg ccacgagatc ttctatcggc gcccgctcag gttccggcac 63120 gggtcggtgc gggtcgagtc gtgggtgacc aaggtgaaca gggtgacctg cgagatggcc 63180 gcgcagatct gctcggacgg ggaggtgttc gtcgaagccc gctcgatgat catggggttc 63240 gacacgcaca ccgccaagcc gcggcgcctc accctgcacg agcgcacctt tctcaagcgt 63300 tacctgcgct gatgtgactt ctccattgcc ggccgcggct ccgggcgttg gacgattttg 63360 accgccgaga tcggccgagc ctaccttcac ggtgttcgct gcgaccggaa aggtgaattc 63420 aatggccgcg tccgaggtca agcaagtgct ccggagcaag ctcaggacat gggggtggat 63480 gtatcgatga cgaccagcat cgcgtcggca gaagaccttt ccgtcctcac cggactgagc 63540 gagatcacca cgttcgccgg cgtggggaca gccgtttccg ccacgtccta ttcgcaagcc 63600 gagctgctcg aaatcctcga catacgcgat cccaggatcc gatcgctgtt cctgaacagc 63660 gcgatcgagc ggcgttttct cgcgcttccg ccccagggcc gggacgggga gcgcgtggcg 63720 gaaccgcagg gtgatctcct ggacaagcac aaaaagctcg ccgtcgatat gggatgccgg 63780 gccctcgagt cctgcctgaa gtcggcgggc gcgacgctct cggatgtccg ccacctgtgc 63840 tgcgtcacct cgaccggttt tctcaccccc ggcctgagcg cactcatcat ccgcgagctc 63900 gggctcgacc cgcattgcag ccgcgccgac atcgtcggca tgggatgcaa cgcggggctg 63960 aacgcgctca acctggtcgc gggctggtcc gcggcgcacc cgggcgagct cgccgtcgtt 64020 ctgtgcagcg aggcgtgttc cgctgcttac gcactggacg gcaccatgcg caccgcggtg 64080 gtcaacagcc tgttcggcga cggatccgcc gccctcgccg tcgtctccgg tgacgggcgc 64140 gctgccggcc cgcgcgtcct gaagttcgcg agctacgtca tcaccgacgc gatcgaggcg 64200 atgcgctacg actgggaccg cgaccaggac cggttcagct tcttcctcga tccgcagatc 64260 ccctacgtgg tcggcgcgca cgccgagatc gtcgtcgaca agctgctgtc cggtacgggg 64320 ctgcgccgca gcgacatcgg ccattggctg gtgcactccg gcggcaagaa ggtgatcgac 64380 gccatcgtcg tcaacctcgg cctgagccgg catgacgtcc gccacacgac cgctgtgctc 64440 cgcgactacg ggaacctctc cagcggctcc ttcctcttct cctacgaacg gctcgccggc 64500 gagggcgtga ccaggcccgg agactacggg gtgctcatga ccatggggcc cggctccacg 64560 atcgaaacgg cgctgatcca atggtgagtg gcagtgacat gaacggcgaa ctggagctga 64620 gcctcgacgg cacccaggcg ctgaccgcgt cggtcgagga gctgaacggc ctctgcgacc 64680 gcgccgagga ccatcgagca cccggcccgg tcatcgtcca cgtcaccggc gtgccgcgcc 64740 ttggctggtc gaaggggctg acggtgggcc tggtctccaa gtgggagcgg gtggtgcgcc 64800 ggttcgaacg gctcggccgg ctcaccgtcg ccgtggcgtc aggcgactgc gcgggaccct 64860 ctctcgacct cctcctcgct gccgacgtgc ggatcgccgc tccggcgacc cggctgctgc 64920 cctcctgggc cggcggcgcc gcgtggccgg ggatggccgt ctaccggctc acccagcagg 64980 ccggtacggg cggcatccgg cgggccgtgc tgctcggggc acccatcgac gccgaccgcg 65040 cgctcgccct caacctgatc gacgaggtgt ccgcggaccc ggcggcgtcc ctggccggcc 65100 tggcgggtgc cggggacggc gcggagctgg cgattcgcag gcagctgatg ttcgaggcga 65160 gctcaaccac tttcgaggac gcgctcggtg ctcacctggc cgcggtggac cgggccctac 65220 gacgggagac cctctcgtga cgacggattg gccggcgctg ccgcccaggg cgccgctcgc 65280 cctctggacc ctgacggcgg aggcccagcg agtcgacgac ctgctcgccg ggctgccgga 65340 gcctcctgcc agaacctccg cccagcgcga tgccgcggcc tcggcactcg acaaggtgag 65400 gcggatgcgc gcggactaca tggaggcgca cgccgaggag atctacggcg agctcacctc 65460 cggccgcacc cggcacctgc gcatcgacga gctcgtacgg gccgccgccc gcgcctaccc 65520 cggcctggtg cccaccgatg agcagatggc ggccgagcgc gcgcggccac aggcggagaa 65580 ggaagggcgc gagatcgatc agggcatctt cctgcgcggg gtcctgcgtg ccccgaaggc 65640 gggcccgcac ctgctcgacg ccatgctccg gcccaccccc agggcccttg agctgctccc 65700 tgaattcatc gagtccggcg aggtgcggat ggaggcggtc ctgctgcggc gccgtgacgg 65760 tgtcgcgtac ctgaccctgt gccgggacga ctgcctcaac gccgaggacg cgcagcaggt 65820 ggacgacatg gagaccgcag tcgacctggc gctgctcgac ccccaggtcc gggtggggct 65880 cctgcggggc ggcgagatga gccatccccg gtaccggggg cgccgggtgt tctgcgcggg 65940 cgtcaacctc aagaagctga gctcgggcga catctccctc gtcgacttcc tcctacggcg 66000 cgagctgggc tacatccaca agatcgttcg cggcgtgtac acggacggtt cgtggcactc 66060 gaagctgacc gacaagccct ggatggcggt cgtcgactcc ttcgccatcg gcggtggggc 66120 tcagctcctc ctggtcttcg accaggtgct ggcggcgtcc gactcctaca tcagcctgcc 66180 tgcggcgacg gaggggatca ttccgggggt cgcgaactac cggctcaccc ggttcaccgg 66240 gccacgcgcg gcccggcaga tgatcctcgg cgggcggcgg atccgggcgg acgagccgga 66300 cgcacggttg atgatcgacg aggtcgtccc gccggaggag atggacgcgg cgatcgatcg 66360 cgcactggcc cgcctcgacg gagatgcggt gccggccaac cggcgcatgc tgaacctggc 66420 cgaggagccg cccgaggcgt tcggccggta cctggccgag ttcgccctgc agcaggcact 66480 gcgcatctac ggcagggacg tcatcggcaa ggtcggcagg ttcgcagcgg gatcggcatg 66540 agcgagcctc gcgtgcgcta cgagaagaag gaacacgtcg cccatgtgac gatgaaccgg 66600 ccccacgtgc tgaacgcgat ggatcgccgg atgcacgagg agctcgccga gatctgggac 66660 gacgtcgagg ccgacgacga cgtcaggacg gtcgtcctga ccggtgcggg aacgcgggcc 66720 ttctccgtcg gccaggacct caaggaacgc gcgctgctgg acgaggcggg cacgcaggcc 66780 tcgacgttcg gcagccgggg gcaggcaggt catccccggc tgaccgaccg cttcaccttg 66840 tccaagccgg tggtcgcccg ggtgcacggc tacgcgctgg gtggcggctt cgagctggtg 66900 ctcgcctgcg acctcgtcat cgcctccgag gaggcggtgt tcggcctgcc ggaggtccgg 66960 ctcggcctga tccccggggc gggaggcgtg ttccggctgc cgcggcagct gccgcagaag 67020 gtggcgatgg gccatctgct gaccgggcgc cggatggatg cggccacggc gttccggtac 67080 ggattggtga acgaggtcgt accgcttgat gagctggatc ggtgcgtggc cggatggacc 67140 gacgacctcg tacgcgccgc tccgctgtct gttcgcgcga tcaaggaggc cgccatgcgg 67200 tcgctcgaca ttcccctgga ggaggcgttc accacgtcct acccatggga agagcgtcgt 67260 cggcgtagcg gcgatgcgat cgagggcgtc cgggcgttcg tcgagaagag ggacccggtc 67320 tggacgtcga gatgatcccc ccgcacacgt tgctggtctt cttcgttcag gctgcggccc 67380 tcctgctgct cgcgttgctc ctgggccgcc tggccgtacg gctgggcctg gcggcggtcg 67440 tcggcgaact gtgtgccggc gtcatcctcg gcccctccgt gctggggcag gtcgcgcccg 67500 gggcggagca gtggctgttt ccctcgccgt cgtcacacat gctggacgcc gtcgggcagc 67560 tcggcgtgtt gttgctgatc ggcttgacgg gcgcgcatct ggatctgcgg ctgatccggc 67620 ggcagggcgc cacggcggtg cgggtgagcg ccttcgggtt ggtcgtgccg atggccctcg 67680 gcatcggcgc cggcctgttg ctgccggccg agttccgcgg gaccggcggc tcggccgtct 67740 tcgccctgtt cctgggggtg acgatgtgtg tcagctcgat ccccgtgatc gccaagacgc 67800 tgatggacat gaacctgctc catcgcaacg tcggccagct cacgctgacc gccggcatga 67860 tcgacgacgc cttcgggtgg gtgctgcttt cggtggtgac ggcgatggcc accgccggag 67920 ccggtgcggg gaccgtggtg ctgtcgatcg cgtcgctgct cggggtgatc gtcttcagcg 67980 tcgtcatcgg caggccggcg gtccgggtgg cgttgcggac gacggaggat cagggggtga 68040 tcgccggcca ggtcgtggtg ctggtgctcg cggccgcggc cgggacgcat gcgctgggcc 68100 tcgaaccgat cttcggggcc ttcgtcgccg ggctgctggt gagcacggcc atgccgaatc 68160 cggtcagact ggcaccgctg cgcacggtga cgctcggggt gctggctccc ctctatttcg 68220 ccaccatggg cctgcgcgtc gatctcacgg ccctggcgcg gccggaggtg ctcgccgtgg 68280 ggctgctggt cctggccctg gcgatcatcg gcaagttcct gggcgccttc ctgggcgcct 68340 ggaccagccg gctcagccga tgggaggcct tggcgctggg ggcggggatg aacgcccgtg 68400 gcgtcatcca gatgatcgtg gcgacggtcg gcctgcggct gggggtgatc actgacgaga 68460 tcttcacgat catcatcgtg gtggcggtga tcacctctct gctcgccccg ccactcctgc 68520 gcctggccat gaccaggatc gaggccaccg ccgaggagga ggcccgcctc ctcgcctacg 68580 ggctgcgccc cggcgaggcc cgggaagacg tacggtgacg acggctcggg atcgtcgtgc 68640 ccgacgacaa ggccggcagc cggacggtgg tggccggtgc cggctcagcc acagtgggcc 68700 ggggtcgcga tgcccagccg cgcgtgcagg tgcgcccaca gagcagcctg ctcgtgcccc 68760 aggaagaagt ggcctccggg caggacgtgg caggagaact cccgagccgt caactcggcc 68820 catcgcgcga ccgcgtcgag ccgtacgacg ggatcgtccg caccggtgaa cgccgtgatc 68880 ggcaccgtca ggggcggccc aggcgtgtgg cggtaggact ggacgagctg gaagtcgttg 68940 cgcacgtagg ggagggcgaa cgcccggaac tccgcgctcg cgagcgcctc ggcatcggtg 69000 ccgcccaaca ggcgcagcct gtcgatgagc gcctcctcgg aggccggcgc cacccgatgc 69060 gcgagacggc cacggtcgtg cgcggccaca cctccggaga cgaagagatg agccggcggg 69120 ataccggacc cggtgagaag ccgcgccgtc tcgtaagcga tcaaactgcc catactgtgc 69180 ccgaacagcg ccaccggccg gtcgaggagc ggcctcagct cacgccccac cgactccgcg 69240 agccggtggg catcaccgac gaggggttcg tgcaaccggt cggcgcggcc cggatactga 69300 accgcgtgca cttctatctc cggcgcggcc agccggtgcc aattccggta gaagaccgcc 69360 gaaccgcccg cgtgcggaaa acagatcagc cgcatcgtgg cgagcggccg cctgtcgaaa 69420 caccgaaacc aggtggacat gtagcctcgc ttcggcctca tatcatggtc ttgggtcaat 69480 cctggtgacc tgactatatg cctgcaccgc cataaagtat gtccgtccac tcatcggcgg 69540 gcatgcggca cgagtctgcc caggtcgcac ttgacgcctg gtcggcaaag ggaaaaccct 69600 tgcttccatg gactcccacg ttctcgccca tcaattgagc aaggaaacgc tgcacggatc 69660 gctgatggac ccggccatcg agtcgatgaa tctactgaac gagattgccg gcaactaccc 69720 cgacgccatt tccatggccg cgggccggcc gtacgaggag ttcttcgacg tcggcctcat 69780 ccacgactat ctggaggcct accgcgacca tctccgcaac gaccggcgga tggatgacgc 69840 cgggatcagc cgcatgcttt tccaatacgg gaccacgaag gggatcatct ccgaccttgt 69900 cgcccggcac ctcgccgagg acgagaacat cgaggccgac ccggcctccg tggtcatcac 69960 tgtgggcttc caggaggcca tgttcctggt gcttcgcgcg ctgcgagcga acgagcggga 70020 cgtcctgctc gcccccacgc ccacctacgt cggcctgacc ggagcggcgc tgctcaccga 70080 cacccctgtc tggccggtcc agtccaccga caacggcatc gacctcgacc accttgagca 70140 ccaactgaaa cgcgcccagg accagggcgc ccgggtccgg gcctgctacg tgaccccgaa 70200 cttcgccaac cccaccggca ccagcatgga cctgcccgcc cgccatcgcc tcctggaggt 70260 cgccgcggcc cacggcatcc tgatcctgga ggacaacgcg tacggactcc tcggccagga 70320 ccgcctcccc acgctgaagt ccctcgacca tgcggcgacc gtcgtctacc tcggctcctt 70380 cgccaagacc ggcatgcccg gcgcccgggt cggctacgtc gtggcggacc agcacgtagc 70440 ggggggcggc tcgctcgccg acgagctcgc gaagctcaag ggcatgctca ccgtgaacac 70500 ctcgcccatc gcccaggcgg tgatcgccgg caagctgctg cgccacgact tcagcctggc 70560 ccgggccaac gcccgcgaga ccgccatcta ccagcgcaac ctccacctca cgctggacga 70620 actcacccgc cggctcggcg ccgtcccggg agtcacctgg aacgcgccga cgggcgggtt 70680 cttcatcacc gtcaccgtgc ccttcgtcgt ggatgacgag ctgttggaac acgctgcccg 70740 cgatcatggc gttttgttca cgccgatgca tcacttctat ggtgggaagg atgggttcaa 70800 ccagcttcgg ctgtcgatca gcctgctcaa cccgcaactg atcgaggagg gtgtctcccg 70860 gcttgccggg ctcgtcaccg catgtctccc ctgaaccatg cctggggcct tgagtcggac 70920 ggccgggttg cgtgcggccg ggatgaaggt caaccacaag cgggtggtgc gcgagcacgg 70980 cctcgccggg cggtggccag cgaccaaggc ctcgacaaac gccatcgccg accctcccga 71040 gggaggatcg gcggttgaag atctgtgtgc cccctgcagg attcgaacct gcgcacccgg 71100 ctccggaggc cggtgctcta tcccctgagc taaggggg 71138 <210> 2 <211> 366 <212> PRT <213> Nonomuria <400> 2 Met His Glu Ser Pro Val Cys Leu Ala Glu Tyr Glu Glu Ile Ala Ala 1 5 10 15 Lys Val Leu Pro Ala Asp Val Arg Asp Phe Ile Asp Gly Gly Ser Gly 20 25 30 Arg Glu Gln Thr Leu Arg Ala Asn Arg Ala Ala Phe Asp Arg Val Phe 35 40 45 Leu Val Pro Arg Val Leu Gln Asp Val Ser Ala Cys Ser Thr Arg Ala 50 55 60 Thr Leu Leu Gly His Pro Ala Thr Met Pro Val Ala Val Ala Pro Val 65 70 75 80 Ala Tyr His Arg Leu Val His Pro Asp Gly Glu Leu Ala Thr Ala Arg 85 90 95 Ala Ala Arg Asp Ala Gly Val Pro Phe Thr Val Ser Thr Leu Ser Ser 100 105 110 Val Pro Val Glu Asp Val Thr Ala Leu Gly Gly His Val Trp Phe Gln 115 120 125 Leu Tyr Cys Leu Arg Glu His Ala Ala Thr Leu Gly Leu Ile Arg Arg 130 135 140 Ala Glu Asp Ala Gly Cys Arg Ala Leu Met Leu Thr Leu Asp Val Pro 145 150 155 160 Trp Met Gly Arg Arg Pro Arg Asp Ile Arg Asn Arg Phe Arg Leu Pro 165 170 175 Pro His Val Arg Pro Val His Leu Thr Ala Asn Ser Gly Thr Glu Ala 180 185 190 His Arg Gly Ala Ser Gly Gly Ser Ala Leu Ala Ala His Thr Ala Met 195 200 205 Glu Leu Ser Ala Ala Val Asp Trp Ser Tyr Leu Glu Thr Leu Arg Ala 210 215 220 Ala Ser Gly Leu Pro Leu Val Val Lys Gly Ile Leu His Pro Glu Asp 225 230 235 240 Ala Arg Arg Ala Ala Asp Leu Gly Ile Asp Gly Ile Val Val Ser Asn 245 250 255 His Gly Gly Arg Gln Leu Asp Gly Ala Val Ala Ser Leu Asp Ala Leu 260 265 270 Pro Gly Val Ala Glu Ser Val Gly Gly Arg Cys Glu Ile Met Leu Asp 275 280 285 Gly Gly Val Arg Ser Gly Ala Asp Val Leu Lys Ala Leu Ala Leu Gly 290 295 300 Ala Ser Gly Val Leu Val Gly Arg Pro Val Ile Trp Gly Leu Ala Ala 305 310 315 320 Asp Gly Glu Arg Gly Val Arg Thr Val Leu Gly Leu Leu Gly Ala Glu 325 330 335 Ile Glu Asp Gly Leu Gly Leu Ala Gly Cys Gly Asp Val Ala Ala Ala 340 345 350 Gln Ala Leu Arg Thr Thr Arg Pro Gly Ala Gly Phe Val Ser 355 360 365 <210> 3 <211> 356 <212> PRT <213> Nonomuria <400> 3 Met Glu Ser Leu Pro Pro Leu Ala Val Asp Tyr Val Glu Met Tyr Val 1 5 10 15 Ala Asp Leu Lys Val Ala Thr Leu Pro Trp Thr Asp Glu Tyr Arg Phe 20 25 30 Ala Val Val Gly Thr Ala Asn Ala Ser Asp His Arg Ser Val Ala Leu 35 40 45 Arg Gln Gly Arg Ile Thr Leu Val Leu Thr Gln Ala Thr Ser Asp Gly 50 55 60 His Pro Ala Ser Ala Tyr Val Arg Thr His Gly Asp Gly Val Ala Asp 65 70 75 80 Ile Ala Leu Arg Thr Pro Asp Val Asp Val Val Phe Thr His Ala Val 85 90 95 Ala Ala Gly Ala Arg Pro Val Arg Ser Pro Ser Arg His Pro Gly Pro 100 105 110 Gly Pro Ala Cys Ser Ala Ala Ile Gly Gly Phe Gly Asp Val Val His 115 120 125 Thr Leu Val Gln Arg Asp Pro Gly Asp Asp Pro Gly Leu Pro Val Gly 130 135 140 Phe Ser Glu Ala Pro Ser Ala Ala Glu Ser Gly Ala Asp Ala Ala Glu 145 150 155 160 Leu Leu Asp Ile Asp His Phe Ala Val Cys Leu Pro Thr Gly Asp Leu 165 170 175 Asp Ile Ile Thr Asp Phe Tyr Val Ala Thr Leu Gly Phe Ser Glu Thr 180 185 190 Phe Lys Glu Arg Ile Glu Val Gly Thr Gln Ala Met Glu Ser Lys Val 195 200 205 Val Gln Ser Ala Ser Gly Ala Val Thr Leu Thr Leu Ile Glu Pro Asp 210 215 220 Pro Met Ala Glu Ala Gly Gln Ile Asp Met Phe Leu Glu Arg His Ala 225 230 235 240 Gly Ala Gly Val Gln His Val Ala Phe Ser Ser Ser Asp Ala Val His 245 250 255 Ala Val Asn Thr Leu Ser Glu Arg Gly Val Arg Phe Leu Ser Thr Pro 260 265 270 Gly Ser Tyr Tyr Asp Leu Leu Glu Ser Arg Ile Gln Ile Arg Gly His 275 280 285 Thr Val Asp Gln Leu Arg Ala Thr Gly Leu Leu Ala Asp Glu Asp His 290 295 300 Gly Gly Gln Leu Phe Gln Ile Phe Thr Ala Ser Thr His Pro Arg Glu 305 310 315 320 Thr Leu Phe Phe Glu Val Ile Glu Arg Gln Gly Ala Arg Thr Phe Gly 325 330 335 Gly Ala Asn Ile Lys Ala Leu Tyr Glu Ala Val Glu Val Ala Arg Ser 340 345 350 Gln Gln Arg Ala 355 <210> 4 <211> 867 <212> PRT <213> Nonomuria <400> 4 Met Leu Phe Gly Arg Asp Arg Glu Leu Lys Ser Leu Thr Arg Leu Leu 1 5 10 15 Asp Ser Thr Ala Ala Gly Arg Gly Gly Val Ala Val Ile Thr Gly Pro 20 25 30 Val Val Gly Gly Lys Thr Ala Ile Leu His Glu Leu Gly Met Arg Ser 35 40 45 Ile Ala Ala Gly Ile Arg Leu Val Thr Ala Arg Cys Thr Pro Ala Glu 50 55 60 Gln Ser Leu Asp Trp Gly Val Ala Asp Gln Ile Leu Gly Arg Gly Ala 65 70 75 80 Ala Glu Arg Leu Thr Ala Arg Arg Gly Gly Asp Ala Val Glu Asp Val 85 90 95 Cys Val Ser Leu Phe Gln Met Ala Glu Ala Asn Pro Ile Leu Leu Thr 100 105 110 Ile Asp Asp Val Asp Leu Ala Asp Asp Pro Ser Leu Leu Ala Ile Leu 115 120 125 Ser Met Thr Pro Leu Leu Thr Asp Thr Arg Met Met Ile Ala Val Thr 130 135 140 Ile Cys Gln Asp Arg Pro Pro Ala Pro Leu Pro His Val Ala Glu Ser 145 150 155 160 Leu Leu Arg Leu Pro Gly Ile Glu Leu Val Glu Leu Pro Leu Leu Pro 165 170 175 Arg Pro Ala Val Arg Gln Phe Ala Thr Glu His Leu Gly Ala Glu Thr 180 185 190 Ala Asp Gln Leu Ala Asp Asp Leu Tyr Arg Phe Ser Gly Gly Ser Pro 195 200 205 Leu Leu Val Arg Ala Leu Ile Glu Asp Gln Glu Ala Gly Ala Pro Gly 210 215 220 Leu Val Val Gly Asp Ser Phe Met Ser Ala Val Ala Ala Cys Val His 225 230 235 240 Gly Cys Glu Pro Glu Ala Val Arg Val Ala Glu Ala Val Ala Val Leu 245 250 255 Gly Glu His Ala Thr Pro Asp Ala Val Gly Glu Leu Val Gly Ile Ala 260 265 270 Pro Pro Ala Ala Thr Arg Ser Met Gly Met Leu Glu Arg Ala Gly Leu 275 280 285 Leu Ala Gly Gly Arg Phe Arg His Glu Ala Gly Arg Leu Ala Val Leu 290 295 300 Gly Arg Met Thr Ser Tyr Gly Arg Met Glu Ile Leu Arg Arg Ala Ala 305 310 315 320 Glu Ile Leu His Arg Arg Gly Gly Pro Pro Ser Ala Val Ala Thr Arg 325 330 335 Leu Leu Glu Ala Gly Trp Ser Gly Glu Glu Trp Ala Phe Asp Val Leu 340 345 350 Val Glu Ala Gly Arg Gln Ala Phe Asp Glu Gly Asp Phe Val Ala Val 355 360 365 Met Lys Cys Leu Arg Leu Ala Leu Ala Ser Gly Trp Gly Thr Pro Arg 370 375 380 Arg Leu Asp Val Lys Val Met Leu Ala Ala Ala Glu Trp Arg Val Asp 385 390 395 400 Pro Ala Val Ala Ala Arg His Val Pro Asp Leu Leu Asp Ala Thr Arg 405 410 415 Ser Gly Ala Leu Arg Gly Ser His Gly Met Glu Leu Phe Arg Gln Leu 420 425 430 Leu Trp Tyr Gly Arg Phe Ala Asp Ala Ala Glu Leu Ile Asp Arg Leu 435 440 445 Arg Pro Ser Val Ala Asp Arg Asp Ala Asp Ala Ser Leu Ile Ala Met 450 455 460 Cys His Val His Pro Val Leu Leu Asp Arg Leu Pro Arg Ser Ala Arg 465 470 475 480 Gly Ser Met Gly Gln Thr Val Glu Asp Ala Arg Arg Ile Leu Arg Gln 485 490 495 Ala Glu Pro Thr Asp Glu Ala Met Asp Ser Ile Ile Ser Ala Leu Met 500 505 510 Ala Leu Leu Leu Gly Gly Val Ser Glu Val Ala Ala Ser Cys Glu Thr 515 520 525 Leu Leu Lys Glu Pro Gly Val Thr Lys Ala Pro Thr Trp Lys Ala Ile 530 535 540 Ile Ser Ala Ile Arg Ala Glu Thr Ala Trp Arg Lys Gly Asp Leu Ala 545 550 555 560 Gly Ala Glu Ala His Ala Gln Glu Ala Leu Thr Ile Leu Gln Pro Ser 565 570 575 Gly Trp Gly Val Ala Ile Gly Ala Pro Leu Ser Thr Leu Leu His Ala 580 585 590 Gln Thr Ala Met Gly His Leu Asp Glu Ala Lys Ala Thr Val Ala Val 595 600 605 Pro Met Pro Arg Glu Thr Ala Glu Thr Ala Phe Gly Ile Gly Tyr Glu 610 615 620 Leu Ala Arg Ala His Tyr His Leu Val Thr Glu Gln Pro Arg Ala Ala 625 630 635 640 Phe Ala Gly Phe Leu Ala Cys Gly Gln Ala Val Gln Arg Trp Gly Ser 645 650 655 Ser Leu Ser Asp Val Val Pro Trp Arg Leu Gly Ala Ala Arg Ala Cys 660 665 670 Leu Gln Leu Gly Trp Arg Arg Arg Ala Ala Asp Leu Val Thr Ala Gln 675 680 685 Ile Ala His Thr Ser Ser Gly Asp Leu Arg Thr Tyr Gly Val Ala Leu 690 695 700 Arg Leu His Ala Gln Leu Ser Lys Pro Ala Gln Arg Gln Arg Leu Leu 705 710 715 720 Met Gln Ser Val Asp Ala Leu Glu Ala Ala Gln Asp Arg Tyr Gln Leu 725 730 735 Ala Leu Ser Leu Cys Asp Leu Ala Gly Thr Pro Gln Leu Lys Gly Gly 740 745 750 Lys Asp Glu Ala Arg Ala Tyr Trp Val Arg Ala Gln Glu Leu Ala Arg 755 760 765 Glu Cys Asn Ala Lys Pro Leu Met Arg Arg Leu Ala Ala Gln His Asp 770 775 780 His Gly Glu Thr Ala Pro Leu Ser Gly Ala Glu Arg Arg Val Ala Val 785 790 795 800 Leu Ala Ala Arg Gly His Thr Asn Arg Glu Ile Ala Glu Ala Leu Tyr 805 810 815 Ile Thr Arg Ser Thr Val Glu Gln His Leu Thr Arg Ile Tyr Arg Lys 820 825 830 Leu His Val Gln Thr Arg Gly Asp Leu Gly Asn Leu Phe Ala Ala Asp 835 840 845 Ile Ala Asp Lys Ala Thr Ala Thr Ala Gly Arg Glu Pro Arg Glu Ala 850 855 860 Val Arg Leu 865 <210> 5 <211> 321 <212> PRT <213> Nonomuria <400> 5 Met Asp Pro Thr Gly Val Asp Ile Ala Thr Leu Pro Val Val Glu Ile 1 5 10 15 Glu Leu Ser Arg Leu Ser Ser Val Tyr Ser Pro Arg Thr Ser Gly Glu 20 25 30 Asp Pro Glu His Val Glu Thr Leu Leu Ser Ala Gln Gly Glu Leu Pro 35 40 45 Pro Ile Leu Val His Arg Pro Thr Met Arg Val Ile Asp Gly Leu His 50 55 60 Arg Leu Lys Val Ala Arg Val Arg Gly Glu Thr Thr Ile Ser Val Arg 65 70 75 80 Leu Ile Asp Gly Thr Glu Ser Asp Ala Phe Val Leu Ala Val Glu Ala 85 90 95 Asn Val Arg His Gly Leu Pro Leu Ser Leu Ala Asp Arg Lys Arg Ala 100 105 110 Ala Val Arg Ile Ile Gly Thr His Pro Gln Trp Ser Asp Arg Arg Val 115 120 125 Ala Ser Ala Thr Gly Ile Ser Ala Gly Thr Val Ala Asp Leu Arg Arg 130 135 140 Arg Arg Gly Gln Gly Gly Asp Glu Ala Arg Ile Gly Arg Asp Gly Arg 145 150 155 160 Ile Arg Pro Val Asp Ser Ser Glu Gly Arg Arg Leu Ala Ala Glu Leu 165 170 175 Ile Arg Ser His Pro Asp Leu Ser Leu Arg Gln Val Ala Lys Gln Val 180 185 190 Gly Ile Ser Pro Glu Thr Val Arg Asp Val Arg Gly Arg Leu Glu His 195 200 205 Gly Glu Ser Pro Ile Pro Asp Gly Ser Arg Arg Leu Arg Thr Lys Pro 210 215 220 Glu Leu Leu Arg Arg Ala Glu Gln Asp Phe Gly His Val Asp Gly Arg 225 230 235 240 Asp Arg Gln Ala Val Leu Glu Arg Leu Lys Ala Asp Pro Ala Leu Arg 245 250 255 Leu Thr Glu Thr Gly Arg Ile Leu Leu Arg Met Leu Ser Leu His Ser 260 265 270 Ile Asp Gly Gln Glu Trp Glu Arg Ile Leu Arg Gly Val Pro Pro His 275 280 285 Trp Gly Thr Val Val Ala Arg Cys Ala Arg Asp His Ala Gln Ile Trp 290 295 300 Ala Ala Phe Ala Asp Arg Leu Glu Gly Arg Ala Thr Asp Leu Ala Ala 305 310 315 320 Gly <210> 6 <211> 369 <212> PRT <213> Nonomuria <400> 6 Met Thr Leu Glu Arg Thr Leu Ile Val Gly Thr Gly Leu Ile Gly Thr 1 5 10 15 Ser Ala Ala Leu Ala Leu Arg Glu Lys Gly Val Ala Val Tyr Leu Ser 20 25 30 Asp Val Asp Ala His Ala Val Arg Leu Ala Arg Ala Leu Gly Ala Gly 35 40 45 Gln Glu Trp Thr Gly Gln Arg Val Asp Leu Ala Leu Ile Ala Val Pro 50 55 60 Pro Pro Ser Val Gly Gln Arg Leu Ala Asp Leu Gln Gln Arg Arg Ala 65 70 75 80 Ala Arg Ala Tyr Thr Asp Val Thr Ser Val Lys Val Asp Pro Ile Ala 85 90 95 Asp Ala Glu Arg Leu Gly Cys Asp Leu Thr Ser Tyr Val Pro Gly His 100 105 110 Pro Leu Ala Gly Arg Glu Arg Ser Gly Pro Ala Ala Ala Arg Ala Asp 115 120 125 Leu Phe Leu Gly Arg Pro Trp Ala Leu Cys Pro Arg Pro Glu Thr Gly 130 135 140 Ala Asp Ala Val Arg Leu Ala Arg Glu Leu Val Ser Met Cys Gly Ala 145 150 155 160 Glu Pro Tyr Thr Val Ser Ala Gly Glu His Asp Thr Ala Val Ala Leu 165 170 175 Val Ser His Ala Pro His Val Ala Ala Ser Ala Val Ala Ala Arg Leu 180 185 190 Arg Asp Gly Asp Asp Val Ala Leu Ala Leu Ala Gly Gln Gly Leu Arg 195 200 205 Asp Val Thr Arg Ile Ala Ala Gly Asp Pro Leu Leu Trp Arg Met Ile 210 215 220 Leu Ala Ala Asn Ala Leu Pro Val Ala Gly Val Leu Glu Arg Ile Ala 225 230 235 240 Ala Asp Leu Ala Ala Ala Ala Ser Ala Leu Arg Ser Gly Asp Leu Asp 245 250 255 Asp Val Thr Asp Leu Leu Arg Arg Gly Val Asp Gly His Gly Arg Ile 260 265 270 Pro Asp Lys His Gly Gly Pro Ala Arg Asp Tyr Thr Val Ile Gln Val 275 280 285 Val Leu Gln Asp Arg Pro Gly Glu Leu Ala Arg Leu Phe Asn Ala Ala 290 295 300 Gly Leu Ala Asp Val Asn Ile Glu Asp Ile Arg Leu Glu His Ser Ala 305 310 315 320 Gly Leu Pro Val Gly Val Val Glu Val Ser Val Arg Pro Glu Asp Thr 325 330 335 Gly Arg Leu Thr Glu Ala Leu Arg Phe His Gly Trp His Val Pro Pro 340 345 350 Val Pro Asp Gly Asn Ser Arg Ile Asp Arg Thr Arg Ala Met Val Ser 355 360 365 Asp <210> 7 <211> 217 <212> PRT <213> Nonomuria <400> 7 Met Arg Val Leu Val Val Glu Asp Gln Val Asp Leu Ala Asp Ser Val 1 5 10 15 Ala Arg Val Leu Arg Arg Glu Gly Met Ala Val Asp Val Ser His Asp 20 25 30 Gly Asp Asp Ala Gln Glu Arg Leu Ser Val Ile Asp Tyr Asp Val Val 35 40 45 Val Leu Asp Arg Asp Ile Pro Gly Val His Gly Asp Glu Leu Cys Ala 50 55 60 Glu Ile Ala Val Asp Asp Arg Arg Thr Arg Val Leu Met Leu Thr Ala 65 70 75 80 Ser Gly Thr Thr Ala Asp Arg Val Ala Gly Leu Ser Leu Gly Ala Asp 85 90 95 Asp Tyr Leu Pro Lys Pro Phe Ala Phe Ala Glu Leu Val Ala Arg Ile 100 105 110 Arg Ala Leu Gly Arg Arg Ala His Pro Pro Ala Pro Pro Ile Leu Val 115 120 125 His Gly Asp Leu Arg Leu Asp Pro Ala Gln Arg Val Ala Ile Arg Gly 130 135 140 Gly Met Arg Leu Pro Leu Thr Thr Lys Glu Leu Ala Val Leu Glu His 145 150 155 160 Leu Leu Thr Ala Arg Gly Arg Val Val Ser Ala Glu Glu Leu Leu Glu 165 170 175 Arg Val Trp Asp Glu Gln Ala Asp Pro Phe Thr Thr Thr Val Lys Ala 180 185 190 Thr Ile Asn Arg Leu Arg Ser Lys Leu Gly Gln Pro Pro Val Ile Glu 195 200 205 Thr Val Pro Arg Glu Gly Tyr Arg Ile 210 215 <210> 8 <211> 196 <212> PRT <213> Nonomuria <400> 8 Met Arg Arg Ser Glu Gly Asp Asp Glu Pro Arg Thr Leu Pro Pro Arg 1 5 10 15 Ala Arg Asp Arg Val Tyr Thr Ala Val Thr Arg Val Leu Ala Val Leu 20 25 30 Leu Leu Pro Val Ala Phe Val Arg Gln Pro Gly Arg Ala Arg Glu Leu 35 40 45 Ala Cys Gly Trp Ala Leu Arg Met Arg Phe Pro Ala Glu Asp Leu Thr 50 55 60 Gly Leu Thr Asp Gly Ala Arg Ala Ala Phe Thr Ala Ala Arg Ala Glu 65 70 75 80 Ala Leu Trp Arg His Gly Gln Leu Val Gly Leu Thr Ser Gly Tyr Arg 85 90 95 Asp Pro Arg Val Gln Gln Arg Met Phe Glu Glu Glu Val Arg Arg Ser 100 105 110 Gly Ser Val Ala Ala Ala Arg Met Phe Val Ala Pro Pro Ala Glu Ser 115 120 125 Asn His Val Lys Gly Met Ala Leu Asp Val Arg Pro His Glu Gly Ala 130 135 140 Arg Trp Leu Glu Ala His Gly Ala Arg Tyr Asp Leu Tyr Arg Ile Tyr 145 150 155 160 Asp Asn Glu Trp Trp His Phe Glu His Arg Pro Glu Cys Gly Gly Thr 165 170 175 Pro Pro Arg Arg Leu Pro His Pro Gly Ala Ala Trp Ala Ser Arg Asn 180 185 190 Gly Gly Arg Val 195 <210> 9 <211> 319 <212> PRT <213> Nonomuria <400> 9 Met Asp Ala Glu Ser Val Arg Arg Gln Leu Arg Leu Gly Glu Asn Ala 1 5 10 15 Thr Ala Trp Leu Ser Arg Leu Glu Glu Leu Gly Pro Pro Pro Glu Pro 20 25 30 Val Arg Leu Pro Gln Gly Asp Glu Ala Arg Asp Leu Leu His Arg Leu 35 40 45 Glu Val Pro Ala Pro Asp Val Glu Glu Ile Val Ala Ala Thr Pro Gly 50 55 60 Pro Asp Arg Asp Pro Ala Leu Trp Trp Leu Leu Glu Arg Ala His His 65 70 75 80 Glu Leu Val Arg His Met Gly Asp Tyr Lys Val Lys Val Arg Gly Gly 85 90 95 Pro Thr Leu Pro Tyr Glu Thr Gly Ala Ala Ala Arg Tyr Phe His Val 100 105 110 Tyr Val Phe Leu Ala Thr Leu Pro Ala Leu Arg Arg Phe His Ala Thr 115 120 125 Arg Asp Ile Pro Glu Ala Thr Thr Trp Glu Thr Leu Thr Gln Leu Gly 130 135 140 Glu Ser Val Ala Ile His Arg Arg Lys Tyr Gly Glu Gly Gly Thr Asn 145 150 155 160 Met Pro Trp Trp Leu Thr Leu Leu Val Arg Gly Leu Val Tyr Arg Leu 165 170 175 Gly Arg Leu Gln Tyr Asn Leu Ala Val Ala Lys Asp Gly Thr Pro Val 180 185 190 Leu Gly Leu His Ile Pro Glu Val Gly Gly Pro Leu Ile Pro Asp Ile 195 200 205 Tyr Tyr Asp Ser Leu Arg Arg Ala Arg Pro Phe Phe Glu Arg His Phe 210 215 220 Pro Glu His Gly Ala Arg Ala Ala Thr Gly Thr Ser Trp Leu Leu Asp 225 230 235 240 Pro Gln Leu Ala Glu Tyr Leu Ala Glu Asp Ser His Ile Leu Gln Leu 245 250 255 Arg Arg Gly Trp Thr Leu Leu Asp Ser Glu Pro Gln Asp Gly Asp Asp 260 265 270 Ala Ile Leu Glu Phe Val Phe Arg Tyr Asn Gly Gln Pro Leu Glu Glu 275 280 285 Leu Pro Gln Arg Ser Thr Leu Glu Lys Ala Val Val Thr His Leu Leu 290 295 300 Ala Gly Arg His Trp Tyr Gln Arg Ser Gly Arg Ile Glu Leu Pro 305 310 315 <210> 10 <211> 408 <212> PRT <213> Nonomuria <400> 10 Met Arg Val Leu Leu Ser Thr Ser Gly Ser Arg Gly Asp Val Glu Pro 1 5 10 15 Leu Leu Gly Leu Ala Val Gln Leu Arg Glu Leu Gly Ala Glu Thr Arg 20 25 30 Met Cys Ala Pro Pro Asp Cys Ala Glu Arg Leu Ala Glu Ala Gly Val 35 40 45 Pro Leu Val Pro Val Gly Thr Ser Met Arg Ala Lys Leu His Gly Lys 50 55 60 Arg Pro Pro Ser Leu Glu Asp Val Pro Arg Leu Asp Ala Glu Ala Ile 65 70 75 80 Ala Thr Gln Leu Asp Gln Val Leu Pro Ala Ala Glu Gly Cys Glu Val 85 90 95 Met Val Val Ser Gly Val Leu Ser Ala Ala Val Ala Val Arg Ser Val 100 105 110 Ala Glu Lys Leu Gly Ile Pro Tyr Val Tyr Val Phe Tyr Cys Pro Ile 115 120 125 Tyr Val Pro Ser Pro Tyr Tyr Pro Pro Pro Pro Pro Leu Gly Glu Gln 130 135 140 Pro Ala Arg Asp Val Thr Asp Asn Arg Val Leu Trp Asp Arg Asn Asn 145 150 155 160 Gln Gly Ala Tyr Gln Arg Phe Gly Ala Ala Leu Asn Ser Arg Arg Ala 165 170 175 Ser Ile Gly Leu Pro Pro Val Asp Asp Ile Phe Ser Tyr Gly Tyr Thr 180 185 190 Asp Arg Pro Phe Leu Ala Ala Asp Pro Val Leu Ala Pro Leu Gln Arg 195 200 205 Thr Asp Leu Asp Val Val Gln Thr Gly Ala Trp Ile Met Pro Asp Glu 210 215 220 Arg Pro Leu Pro Ala Glu Val Glu Ala Phe Leu Glu Ala Gly Pro Pro 225 230 235 240 Pro Val His Val Glu Phe Gly Ser Gly Pro Ala Pro Thr Asp Ala Ala 245 250 255 Arg Val Ala Ile Glu Ala Ile Arg Ala His Gly His Arg Val Ile Val 260 265 270 Ser Arg Gly Trp Ala Gly Leu Ala Pro Pro Asp Asp Arg Ser Asp Cys 275 280 285 Leu Thr Val Gly Glu Val Asn His Gln Val Leu Phe Gly Arg Val Ala 290 295 300 Ala Val Val His Ala Gly Ser Ala Gly Ile Thr Thr Ala Val Thr Arg 305 310 315 320 Ala Gly Ala Pro Gln Val Val Val Pro Gln Met Thr Asp Gln Pro Tyr 325 330 335 His Ala Gly Arg Val Ala Glu Leu Gly Ile Gly Val Ala His Asp Gly 340 345 350 Arg Val Pro Thr Val Glu Ser Leu Ser Ala Ala Leu Thr Thr Ala Leu 355 360 365 Ala Pro Glu Thr Arg Ala Arg Ala Ile Asp Val Ala Gly Lys Ile Arg 370 375 380 Ala Asp Gly Ala Ala Val Ala Ala Lys Leu Leu Leu Asp Thr Ala Ala 385 390 395 400 Gly Ala Gly Arg Asn Arg Thr Glu 405 <210> 11 <211> 489 <212> PRT <213> Nonomuria <400> 11 Met Glu Glu Phe Asp Val Val Val Ala Gly Gly Gly Pro Gly Gly Ser 1 5 10 15 Thr Val Ala Thr Leu Val Ala Met Gln Gly His Arg Val Leu Leu Val 20 25 30 Glu Lys Glu Val Phe Pro Arg Tyr Gln Ile Gly Glu Ser Leu Leu Pro 35 40 45 Ser Thr Val His Gly Val Cys Arg Met Leu Gly Val Thr Asp Glu Leu 50 55 60 Ala Ala Ala Gly Phe Pro Val Lys Arg Gly Gly Thr Phe Arg Trp Gly 65 70 75 80 Ala Arg Pro Glu Pro Trp Thr Phe Ser Phe Ser Val Ser Pro Arg Ile 85 90 95 Thr Gly Pro Thr Thr Phe Ala Tyr Gln Val Glu Arg Ala Arg Phe Asp 100 105 110 Glu Ile Leu Leu Gly Asn Ala Arg Arg Lys Gly Val Val Val Arg Glu 115 120 125 Gly Cys Ser Val Thr Glu Val Ile Glu Asp Gly Asp Arg Val Thr Gly 130 135 140 Leu Arg Tyr Val Asp Pro Asp Gly Gly Glu His Ala Val Ser Ala Arg 145 150 155 160 Phe Val Ile Asp Ala Ser Gly Asn Lys Ser Arg Leu Tyr Ser Ser Val 165 170 175 Gly Gly Thr Arg Asn Tyr Ser Glu Phe Phe Arg Ser Leu Ala Leu Phe 180 185 190 Gly Tyr Phe Glu Gly Gly Lys Arg Leu Ala Glu Pro Tyr Ser Gly Asn 195 200 205 Ile Leu Ser Val Ala Phe Asp Ser Gly Trp Phe Trp Tyr Ile Pro Leu 210 215 220 Ser Asp Thr Leu Thr Ser Val Gly Ala Val Val Arg Arg Glu Met Ala 225 230 235 240 Glu Lys Ile Gln Gly Asp Arg Glu Lys Ala Leu Ala Ala Leu Ile Ala 245 250 255 Glu Cys Pro Leu Ile Ser Glu Tyr Leu Ala Pro Ala Arg Arg Val Thr 260 265 270 Thr Gly Lys Tyr Gly Gln Leu Arg Val Arg Lys Asp Tyr Ser Tyr His 275 280 285 Gln Thr Lys Phe Trp Arg Pro Gly Met Ile Leu Val Gly Asp Ala Ala 290 295 300 Cys Phe Val Asp Pro Val Phe Ser Ser Gly Val His Leu Ala Thr Tyr 305 310 315 320 Ser Gly Leu Leu Ala Ala Arg Ser Ile Asn Ser Val Leu Ala Gly Asp 325 330 335 Val Glu Glu Lys Ile Ala Leu His Glu Phe Glu Ala Arg Tyr Arg Arg 340 345 350 Glu Tyr Ser Val Tyr Tyr Glu Phe Leu Leu Ala Phe Tyr Glu Met Asn 355 360 365 Val Asn Glu Glu Ser Tyr Phe Trp His Ala Lys Lys Val Thr Asn Asn 370 375 380 Lys Glu Tyr Thr Glu Leu Glu Ser Phe Val Asp Leu Val Gly Gly Leu 385 390 395 400 Ser Ser Gly Glu Thr Ala Leu Ala Thr Ser Gly Arg Ile Ala Glu Arg 405 410 415 Ser Ala Glu Phe Ala Ala Ala Val Asp Gln Met Ala Asp Gly Asp Asp 420 425 430 Ser Ser Met Val Pro Leu Phe Lys Ser Gln Val Val Lys Gln Val Met 435 440 445 Gln Glu Gly Gly Gln Glu Gln Met Arg Ala Val Leu Gly Ala Asp Ala 450 455 460 Glu Pro Glu Gln Pro Leu Phe Pro Gly Gly Leu Val Thr Ser Pro Asp 465 470 475 480 Gly Met Arg Trp Leu Thr His His Pro 485 <210> 12 <211> 420 <212> PRT <213> Nonomuria <400> 12 Met Arg Ile Asp Ser Glu Trp Ser Phe Asp Pro Gly Met Asp Asp Asp 1 5 10 15 Ile Asp Ala Gly Ala Pro Val Leu Gln Pro Thr Ala Asn Tyr Met Met 20 25 30 Arg Thr His Cys Asp Pro His Glu Asp Met Phe Ala Leu Arg Ala His 35 40 45 Gly Pro Leu Val Arg Ile Gly Gly Asp Ala Ala Thr Gln Leu Arg Val 50 55 60 Asp Tyr Val Trp Gln Ala Leu Gly Tyr Asp Val Val Arg Arg Ile Leu 65 70 75 80 Gly Asp His Glu Asn Phe Thr Thr Arg Pro Arg Trp Ser Ser Ala Pro 85 90 95 Ser Ile Ala Gly Glu Pro Ile Pro Pro Asn Leu Val Gly Gln Leu Ser 100 105 110 Val Tyr Asp Pro Pro Glu His Thr Arg Leu Arg Gly Met Leu Thr Pro 115 120 125 Glu Phe Thr Ala Arg Arg Ile Arg Arg Leu Glu Pro Ala Met Gln Asp 130 135 140 Leu Ile Asp Asp Arg Ile Asp Glu Leu Glu Ala Ala Gly Pro Pro Ala 145 150 155 160 Asp Val Gln Ala Leu Phe Ala Asp Pro Val Gly Gly Gly Val Leu Cys 165 170 175 Glu Leu Leu Gly Ile Pro Arg Asp Asp Arg Ile Glu Phe Ile Arg Arg 180 185 190 Val Arg Gln Asn Val Asp Leu Ser Arg Gly Phe Lys Ala Arg Ala Ala 195 200 205 Asp Ser Ala Ala Phe Asn Arg Tyr Leu Asn Gly Leu Ile Ile Arg Gln 210 215 220 Arg Lys Asp Pro Asp Glu Gly Phe Ile Gly Met Leu Val Arg Glu His 225 230 235 240 Gly Asp Asp Val Thr Asp Glu Glu Leu Lys Gly Val Leu Thr Ala Leu 245 250 255 Ile Leu Gly Gly Val Glu Thr Val Ala Gly Ser Ile Gly Phe Gly Val 260 265 270 Leu Ala Leu Leu Asp His Pro Asp Gln Arg Gln Ser Leu Phe Ala Gly 275 280 285 Arg Glu Glu Ala Asp Arg Val Val Gly Glu Leu Leu Arg Phe Leu Ser 290 295 300 Pro Val Gln Gln Pro Asn Pro Arg Leu Ala Val Arg Asp Val Val Val 305 310 315 320 Asp Gly Gln Leu Ile Lys Ala Gly Asp Tyr Val Leu Cys Ser Ile Leu 325 330 335 Met Ala Asn Arg Asp Glu Ala Leu Thr Pro Asn Ala Asn Val Leu Asp 340 345 350 Val Arg Arg Asp Cys Gly Ser His Val Gly Phe Gly His Gly Ile His 355 360 365 Tyr Cys Ile Gly Ala Ala Ile Ala Arg Thr Leu Leu Arg Met Ala Tyr 370 375 380 Gln Ser Leu Trp Arg Arg Phe Pro Gly Leu Arg Leu Ala Val Ser Ala 385 390 395 400 Glu Glu Val Lys Phe Arg Asn Ala Phe Ile Asp Cys Pro Asp Glu Leu 405 410 415 Pro Val Thr Trp 420 <210> 13 <211> 398 <212> PRT <213> Nonomuria <400> 13 Met Ser Gly Asp Gly Ala Arg Pro Leu His Thr Arg Arg Gln Asp Leu 1 5 10 15 Asp Pro Ala Asp Glu Leu Arg Ala Ala Gly Thr Leu Thr Arg Ile Thr 20 25 30 Ile Gly Ser Gly Ala Asp Ala Glu Thr Thr Trp Leu Ala Thr Gly Tyr 35 40 45 Thr Val Val Arg Gln Val Leu Gly Asp His Arg Arg Phe Ser Thr Arg 50 55 60 Arg Arg Trp Asn Glu Arg Asp Glu Ile Gly Gly Arg Gly Asn Phe Arg 65 70 75 80 Pro Arg Glu Leu Val Gly Asn Leu Met Asp Tyr Asp Pro Pro Glu His 85 90 95 Thr Arg Leu Arg Gln Lys Leu Thr Pro Gly Phe Thr Leu Arg Arg Ile 100 105 110 Arg Arg Leu Lys Pro Tyr Ile Glu Gln Ile Val Thr Glu Arg Leu Asp 115 120 125 Ala Leu Glu Arg Ala Gly Pro Pro Ala Asp Leu Val Glu Leu Val Ala 130 135 140 Asp Glu Val Pro Gly Ala Val Leu Cys Glu Leu Ile Gly Val Pro Arg 145 150 155 160 Asp Asp Arg Ala Met Phe Met Gln Leu Cys His Gly His Leu Asp Ala 165 170 175 Ser Arg Ser Gln Lys Arg Arg Ala Ala Ala Gly Ala Ala Phe Ser Arg 180 185 190 Tyr Leu Leu Ala Met Ile Ala Arg Glu Arg Lys Asp Pro Gly Glu Gly 195 200 205 Leu Leu Gly Ala Val Leu Ala Glu Tyr Gly Asp Thr Ala Thr Asp Glu 210 215 220 Glu Leu Arg Gly Phe Cys Val Gln Val Met Leu Ala Gly Asp Asp Asn 225 230 235 240 Ile Ser Gly Met Ile Gly Leu Gly Val Leu Ala Leu Leu Arg His Pro 245 250 255 Glu Gln Ile Ala Ala Leu Gln Gly Asp Asp Gln Ser Ala Asp Arg Ala 260 265 270 Val Asp Glu Leu Ile Arg Tyr Leu Thr Val Pro Tyr Ala Pro Thr Pro 275 280 285 Arg Val Ala Met Glu Asp Val Thr Ile Gly Gly Gln Val Ile Lys Glu 290 295 300 Gly Glu Thr Val Ser Cys Ser Leu Pro Met Ala Asn Arg Asp Pro Ala 305 310 315 320 Leu Leu Pro Asp Ala Gly Arg Leu Asp Val Arg Arg Glu Pro Val Pro 325 330 335 His Val Ala Phe Gly His Gly Val His His Cys Leu Gly Ala Ala Leu 340 345 350 Ala Arg Leu Glu Leu Arg Thr Val Tyr Thr Ala Leu Trp Arg Arg Phe 355 360 365 Pro Thr Leu Arg Leu Ala Asp Pro Asp Arg Glu Pro Ser Phe Arg Leu 370 375 380 Thr Thr Pro Ala Tyr Gly Leu Thr Ser Leu Met Val Ala Trp 385 390 395 <210> 14 <211> 384 <212> PRT <213> Nonomuria <400> 14 Met Val Val Pro Leu Pro His Gln Arg Leu Arg Leu Asp Pro Val Pro 1 5 10 15 Ala Leu Phe Asp Leu Gln Glu Asp Gly Pro Leu His Glu Tyr Asp Thr 20 25 30 Glu Pro Gly Leu Asp Gly His Lys Gln Trp Leu Val Thr Gly Tyr Gly 35 40 45 Glu Ile Arg Glu Ile Leu Ala Asp Ala Asn Arg Phe Ser Ser Met Arg 50 55 60 Pro Val Glu Asp Glu Ala Glu Arg Ala Trp Leu Pro Gly Ile Leu Gln 65 70 75 80 Ser Tyr Asp Ala Pro Asp His Thr Arg Leu Arg Arg Thr Val Thr Arg 85 90 95 Ala Asn Thr Ala Arg Arg Ile Glu Ser Leu Arg Pro Val Val Glu Glu 100 105 110 Thr Val Glu Asp Cys Leu Ala Asp Leu Glu Ser Met Gly Ser Pro Val 115 120 125 Asp Phe Val Arg Asn Ala Ala Trp Pro Ile Pro Ala Leu Ile Ala Cys 130 135 140 Asp Phe Leu Gly Val Pro Arg Asp Asp Gln Ala Glu Leu Ser Arg Met 145 150 155 160 Phe Arg Asp Ser Arg Glu Ser Arg Val Pro Arg Gln Arg Asn Val Ser 165 170 175 Gly Leu Gly Ile Val Asp Tyr Ala Arg Lys Leu Ala Ala Arg Glu Arg 180 185 190 Leu Asp Pro Gly Thr Gly Met Ile Gly Gly Ile Val Arg Glu His Gly 195 200 205 Gly Glu Val Thr Asp Glu Glu Leu Ala Gly Leu Val Glu Gly Ile Met 210 215 220 Ile Gly Ala Val Glu Gln Met Ala Ser Gln Leu Ala Ile Ala Val Leu 225 230 235 240 Leu Leu Val Thr His Pro Asp Gln Met Ala Leu Leu Arg Glu Arg Pro 245 250 255 Glu Leu Ala Asp Ser Ala Ala Glu Glu Val Phe Arg Tyr Ala Ser Ile 260 265 270 Val Glu Thr Pro Ser Pro Arg Thr Ala Leu Val Asp Thr Arg Leu Ala 275 280 285 Gly Arg Asp Ile His Ala Gly Asp Val Leu Thr Cys Ser Ile Leu Ala 290 295 300 Gly Asn Arg Ala Arg Glu Asp Arg Phe Asp Leu Thr Arg Gly Asn Pro 305 310 315 320 Glu His Leu Ala Phe Gly His Gly Val His Phe Cys Leu Gly Ala Pro 325 330 335 Leu Ala Arg Leu Gln Ala Gln Val Ala Leu Pro Ala Leu Val Arg Arg 340 345 350 Phe Pro Ser Leu Arg Leu Ala Val Pro Ala Glu Asp Leu Arg Phe Lys 355 360 365 Pro Gly Lys Pro Ala Pro Phe Ala Val Glu Glu Leu Pro Val Glu Trp 370 375 380 <210> 15 <211> 393 <212> PRT <213> Nonomuria <400> 15 Met Glu Val Phe Glu Glu Leu Asn Val Val Leu Pro Gly Glu Leu His 1 5 10 15 Trp Arg Asp Arg Phe Asp Pro Val Pro Gln Leu Arg Ser Phe Met Ala 20 25 30 Glu Gly Pro Met Thr Glu Leu Gly Ala Glu Glu Gly Pro Gly Gly Arg 35 40 45 Thr Ala Trp Leu Ala Thr Gly Phe Asp Glu Val Arg Gln Val Leu Gly 50 55 60 Ser Asp Lys Phe Ser Ser Arg Leu Leu Tyr Gly Gly Thr Ala Ala Gly 65 70 75 80 Ile Val Phe Pro Gly Phe Ile Thr Gln Tyr Asp Pro Pro Glu His Thr 85 90 95 Arg Leu Arg Arg Val Val Ser Pro Ala Phe Thr Val Arg Arg Met Glu 100 105 110 Arg Phe Arg Pro Gln Val Asp Gln Val Val Glu Asp Cys Leu Asp Ala 115 120 125 Ile Glu Ser Ile Gly Gly Pro Leu Asp Phe Val Pro His Phe Gly Trp 130 135 140 Ser Ile Ala Thr Thr Ala Thr Cys Asp Phe Leu Gly Ile Pro Arg Asp 145 150 155 160 Asp Gln Ala Glu Leu Ser Arg Ser Leu His Ala Ser Arg Ser Gln Arg 165 170 175 Ala Ala Ser Arg Arg Gly Ala Ala Gly Asn Lys Phe Met Thr Tyr Met 180 185 190 Gly Gln Val Val Ala Arg Thr Arg Arg Asp Pro Gly Asp Asp Met Leu 195 200 205 Ser Val Val Val Arg Glu His Gly Asp Glu Ile Thr Asp Ala Glu Leu 210 215 220 Thr Gly Leu Ala Ala Phe Val Met Gly Ala Gly Gly Asp Gln Val Ala 225 230 235 240 Arg Phe Leu Ala Ala Gly Ala Trp Leu Met Ala Glu Val Pro Glu Gln 245 250 255 Phe Ala Leu Leu Arg Asp Lys Pro Asp Val Val Pro Asp Trp Leu Glu 260 265 270 Glu Met Val Arg Tyr Leu Thr Ile Asp Glu Lys Leu Thr Pro Arg Ile 275 280 285 Ala Leu Glu Asp Val Arg Ile Gly Asp Arg Ile Val Lys Ala Gly Asp 290 295 300 Thr Val Thr Cys Ser Leu Leu Gly Ala Asn Arg Arg His Phe Pro Gly 305 310 315 320 Pro Asp Asp Gln Phe Asp Leu Thr Arg Asp Arg Ala Pro Asn Val Ala 325 330 335 Phe Gly His Gly Ile His His Cys Leu Gly Arg Pro Leu Ala Glu Leu 340 345 350 Ile Phe Arg Ser Ala Ile Pro Ala Leu Ala Arg Arg Phe Pro Ala Leu 355 360 365 Arg Leu Ala Glu Pro Glu Gln Glu Ile Arg Leu Gly Pro Pro Pro Phe 370 375 380 Asp Val Lys Ala Leu Leu Leu Asp Trp 385 390 <210> 16 <211> 69 <212> PRT <213> Nonomuria <400> 16 Met Thr Asn Pro Phe Glu Asn Glu Asp Gly Ser Phe Leu Val Leu Val 1 5 10 15 Asn Asp Glu Gly Gln His Ser Leu Trp Pro Ser Phe Ala Glu Val Pro 20 25 30 Pro Gly Trp Thr Arg Val His Gly Val Ala Thr Arg Gln Glu Cys Leu 35 40 45 Ala Tyr Val Glu Glu Asn Trp Thr Asp Ile Arg Pro Lys Ser Leu Ile 50 55 60 Ala Glu Ala Gly Ala 65 <210> 17 <211> 1863 <212> PRT <213> Nonomuria <400> 17 Met Thr Ile Asp Asp Thr Arg Ala Lys Pro Arg Ser Ser Val Glu Asp 1 5 10 15 Val Trp Pro Leu Ser Pro Leu Gln Glu Gly Met Leu Tyr His Thr Ala 20 25 30 Leu Asp Asp Asp Gly Pro Asp Thr Tyr Thr Val Gln Thr Val Tyr Gly 35 40 45 Ile Asp Gly Pro Leu Asp Ala Gly Arg Leu Arg Ala Ser Trp Gln Ala 50 55 60 Leu Val Asp Arg His Ala Ala Leu Arg Ala Tyr Phe Arg Tyr Val Ser 65 70 75 80 Gly Ala Gln Met Val Gln Val Ile Ala Arg Glu Ala Glu Ile Pro Trp 85 90 95 Arg Glu Thr Asp Leu His Gly Leu Pro Asp Asp Leu Leu Asp Ser Glu 100 105 110 Val Asp Arg Leu Ala Ala Asp Glu Leu Ala Glu Arg Leu Pro Leu Asp 115 120 125 Ala Ala Pro Leu Met Lys Leu His Leu Ile Arg Leu Gly Pro Ala Ser 130 135 140 His Arg Leu Val His Thr Leu His His Val Leu Leu Asp Gly Trp Ser 145 150 155 160 Met Pro Ile Leu His Arg Glu Leu Ala Ala Ile Tyr Ala Ala Gly Gly 165 170 175 Asp Ala Ser Gly Leu Pro Ala Ala Val Ser Tyr Arg Asp Tyr Leu Ala 180 185 190 Trp Leu Gly Arg Gln Asp Lys Glu Ala Ala Arg Ala Ala Trp Arg Gln 195 200 205 Glu Leu Ala Gly Leu Asp Thr Pro Thr Leu Val Ala Pro Ala Asp Pro 210 215 220 Ala Arg Val Pro Asp Met Gly Thr Ala Val Ile Glu Leu Ser Ala Glu 225 230 235 240 Leu Thr Asp Gly Leu Ala Arg Leu Ala Arg Gly His Gly Leu Thr Leu 245 250 255 Asn Thr Val Val Gln Gly Ala Trp Ala Met Val Leu Ala Gln Leu Ala 260 265 270 Gly Arg Thr Asp Val Val Phe Gly Ala Thr Ala Ser Gly Arg Pro Ala 275 280 285 Glu Leu Ala Gly Val Glu Ser Met Val Gly Gln Leu Leu Gly Thr Leu 290 295 300 Pro Val Arg Val Arg Leu Glu Gly Gly Arg Arg Val Val Glu Leu Leu 305 310 315 320 Ala Glu Leu Gln Arg Ser Gln Ser Ala Leu Met Ala His Gln His Leu 325 330 335 Gly Leu Gln Glu Met Gln Ala Ala Val Gly Pro Gly Ala Val Phe Asp 340 345 350 Thr Leu Val Ile Tyr Glu Asn Phe Pro Arg Gln Gly Leu Gly Arg Ala 355 360 365 Glu Glu Asp Gly Gly Leu Asp Leu Arg Pro Val Arg Arg Gly Arg Asn 370 375 380 Ser Ser His Tyr Pro Phe Thr Leu Ile Thr Gly Pro Gly Ala Gln Met 385 390 395 400 Pro Leu Ile Leu Asp Tyr Asp Arg Gly Leu Phe Asp Glu Ala Ala Ala 405 410 415 Glu Ser Val Val Gly Ala Leu Ala Arg Val Leu Glu Arg Leu Val Ala 420 425 430 Glu Pro Asp Val Leu Val Gly Arg Leu Thr Leu Leu Ser Glu Ala Glu 435 440 445 Arg Ala Leu Val Val Glu Asp Trp Asn Ala Thr Ala Gly Pro Thr Pro 450 455 460 Gly Gln Ser Val Leu Asp Leu Phe Gly Arg Arg Val Ala Thr Ala Pro 465 470 475 480 Asp Ala Val Ala Ile Thr Asp Ala Gly Gly Ala Asp Leu Thr Tyr Ala 485 490 495 Glu Val Asp Gln Ala Ala Asn Arg Leu Ala Arg His Leu Ala Ala Arg 500 505 510 Gly Ile Gly Arg Gly Asp Arg Val Gly Val Val Met Asp Arg Ser Pro 515 520 525 Asp Leu Leu Ile Ala Phe Leu Ala Ser Trp Lys Ala Gly Ala Ala Tyr 530 535 540 Val Pro Val Asp Val Glu His Pro Ala Glu Arg Ile Glu Phe Val Leu 545 550 555 560 Ala Asp Ser Gly Val Ser Ala Val Leu Cys Thr Arg Ala Thr Arg Glu 565 570 575 Val Ala Pro Ala Asp Ala Ile Val Ile Asp Ala Pro Glu Thr Arg Ala 580 585 590 Ala Ile Asp Ala Gly Ala Ala Thr Ala Pro Gln Ile Arg Leu Ser Ala 595 600 605 Asp Asp Leu Ala Tyr Val Met Tyr Thr Ser Gly Ser Thr Gly Leu Pro 610 615 620 Lys Gly Val Gly Val Pro His Gly Ala Val Ala Gly Leu Ala Gly Asp 625 630 635 640 Glu Gly Trp Arg Ile Gly Pro Gly Asp Ala Val Leu Met His Ala Thr 645 650 655 His Val Phe Asp Pro Ser Leu Tyr Ala Met Trp Val Pro Leu Ala Met 660 665 670 Gly Gly Arg Val Val Leu Thr Glu Pro Gly Val Leu Asp Ala Leu Gly 675 680 685 Met Arg Gln Ala Val Glu Arg Gly Val Thr Phe Val His Leu Thr Ala 690 695 700 Gly Thr Phe Arg Ala Leu Ala Glu Ser Ser Pro Glu Cys Phe Ala Gly 705 710 715 720 Leu Val Glu Val Gly Thr Gly Gly Asp Val Val Pro Ala Gln Ser Val 725 730 735 Glu His Leu Arg Arg Ala Val Pro Gly Leu Arg Val Arg Asn Thr Tyr 740 745 750 Gly Pro Thr Glu Thr Thr Leu Cys Ala Thr Trp Lys Pro Ile Glu Pro 755 760 765 Gly Glu Glu Val Gly Arg Glu Leu Pro Ile Gly Arg Pro Met Thr Asn 770 775 780 Arg Arg Ile Tyr Ile Leu Asp Ala Phe Leu Arg Pro Val Ala Pro Gly 785 790 795 800 Val Ala Gly Glu Leu Tyr Ile Ala Gly Thr Gly Leu Ala Arg Gly Tyr 805 810 815 Leu Gly Gly Pro Gly Leu Thr Ala Glu Arg Phe Val Ala Val Pro Ala 820 825 830 Ser Val Asp Pro Ser Pro Gly Glu Arg Met Tyr Arg Thr Gly Asp Leu 835 840 845 Ala Arg Trp Asn Arg Asp Gly Glu Val Val Phe Leu Gly Arg Thr Asp 850 855 860 Asp Gln Val Lys Ile Arg Gly Tyr Arg Val Glu Leu Gly Glu Val Glu 865 870 875 880 Ala Val Leu Ala Ala Gln Arg Gly Val Val Glu Ala Val Val Val Ala 885 890 895 Arg Glu Asp Gln Pro Gly Glu Lys Arg Leu Val Gly Tyr Phe Ile Ser 900 905 910 Asp Gly Thr Asp Ala Gly Pro Ala Glu Ile Arg Arg Glu Met Ala Leu 915 920 925 Val Leu Pro Ala Tyr Met Val Pro Leu Ala Val Val Ala Leu Pro Ala 930 935 940 Leu Pro Val Thr Pro Asn Gly Lys Val Asp Arg Leu Ala Leu Pro Ala 945 950 955 960 Pro Asp Leu Val Gly Arg Ala Pro Asp Arg Ala Gln Glu Ser Glu Thr 965 970 975 Glu Lys Val Leu Cys Ala Leu Phe Ala Glu Ile Leu Gly Val Asp Arg 980 985 990 Val Gly Val Asp Asp Ala Phe His Asp Leu Gly Gly Ser Ser Ala Leu 995 1000 1005 Ala Met Arg Leu Ile Ala Arg Ile Arg Glu Glu Leu Gly Ala Asp 1010 1015 1020 Leu Pro Ile Arg Gln Leu Phe Ser Ala Ala Thr Pro Ala Gly Val 1025 1030 1035 Ala Arg Ala Leu Ala Ala Lys Ser Arg Pro Ala Leu Glu Pro Ala 1040 1045 1050 Glu Arg Pro Gly Arg Val Pro Leu Thr Ala Gln Gln Leu Ser Ala 1055 1060 1065 Trp Leu Leu Ala Ser Pro Gly Glu Ala Ala Gly Leu His Val Ser 1070 1075 1080 Val Ala Leu Arg Leu Arg Gly Arg Leu Asp Val Pro Ala Leu Glu 1085 1090 1095 Ala Ala Leu Gly Asp Val Ala Ala Arg His Glu Ile Leu Arg Thr 1100 1105 1110 Thr Phe Pro Gly His Ala Gln Ser Val His Gln His Val His Asp 1115 1120 1125 Ala Ser Pro Val Asp Leu Thr Pro Val Pro Ala Thr Glu Glu Ser 1130 1135 1140 Leu Pro Gly Leu Leu Thr Glu Leu Arg Glu Ser Val Phe Asp Leu 1145 1150 1155 Thr Arg Glu Val Pro Trp Arg Gly Asp Leu Phe Arg Leu Ser Asp 1160 1165 1170 Gly Glu His Val Leu His Leu Met Val His Arg Ile Leu Ala Asp 1175 1180 1185 Asp Glu Ser Leu Asp Val Phe Leu Arg Asp Leu Ser Ala Ala Tyr 1190 1195 1200 Gly Ala Arg Arg Ala Gly Arg Ala Pro Glu Arg Ala Pro Leu Thr 1205 1210 1215 Leu Gln Phe Ala Asp Tyr Ala Ile Trp Glu Arg Arg Leu Leu Glu 1220 1225 1230 Gly Glu Arg Asp Ala Asp Gly Leu Ile Asn Glu Gln Leu Val Phe 1235 1240 1245 Trp Arg Asp Asn Leu Ala Gly Ile His Gly Glu Thr Val Leu Pro 1250 1255 1260 Phe Asp Arg Pro Arg Ser Ala Val Ala Ser Arg Arg Ala Gly Thr 1265 1270 1275 Val Ser Leu Arg Leu Asp Ala Gly Pro His Ala Arg Leu Val Glu 1280 1285 1290 Ala Val Asp Pro Ile Gly Ala His Pro Phe Gln Ile Val His Ala 1295 1300 1305 Ala Leu Ala Met Leu Leu Thr Arg Leu Gly Ala Gly His Asp Leu 1310 1315 1320 Val Ile Gly Thr Lys Leu Pro Arg Asp Asp Asp Leu Ile Asp Leu 1325 1330 1335 Glu Pro Met Ile Gly Pro Phe Ala Arg Pro Leu Ala Leu Arg Thr 1340 1345 1350 Asp Leu Ser Gly Asp Pro Thr Phe Leu Glu Val Val Thr Arg Ala 1355 1360 1365 Gln Glu Ala Ile Arg Ser Ala Arg Gln His Leu Asp Val Pro Phe 1370 1375 1380 Ala Arg Ile Val Glu Leu Leu Asp Leu Pro Val Ser Leu Ser Arg 1385 1390 1395 His Pro Val Phe Gln Val Gly Leu Glu Val His Glu Glu Asp Leu 1400 1405 1410 Gly Ala Trp Asp Ala Thr Glu Leu Pro Ala Leu Arg Thr Ser Val 1415 1420 1425 Glu Pro Val Gly Pro Glu Ala Ile Glu Leu Asp Leu Ala Phe Arg 1430 1435 1440 Leu Thr Glu Arg Arg Asp Glu Asp Gly Ile Glu Gly Thr Leu His 1445 1450 1455 Tyr Ala Ala Asp Leu Phe Asp Gln Ala Thr Ala Glu Ser Leu Ala 1460 1465 1470 Arg Arg Leu Val Ser Phe Leu Glu Gln Val Ala Glu Asp Pro Gln 1475 1480 1485 Arg Arg Val Ser Asp Leu Asp Val Leu Leu Asp Asp Ala Glu Arg 1490 1495 1500 Glu Arg Pro Ala Glu Ala Pro Ala Lys Trp Ser Glu Ala Val Pro 1505 1510 1515 Pro Val Ala Ala Asp Leu Ala Glu Gly Gly Pro Leu Gly Ala Leu 1520 1525 1530 Val Leu Asp Asp Arg Leu Arg Pro Ala Val Ala Val Gly Glu Leu 1535 1540 1545 Tyr Leu Thr Gly Ala Ala Val Asp Ala Glu Pro Gly Asp Arg Thr 1550 1555 1560 Leu Ala Cys Pro Phe Gly Ala Thr Gly Arg Arg Met Leu Pro Thr 1565 1570 1575 Gly Leu Leu Ala Arg Trp Thr Ala Gly Gly Thr Leu Val Val Val 1580 1585 1590 Gly Glu Arg Arg Gly Ser Ser Gly Ser Val Lys Thr Gly Thr Gly 1595 1600 1605 Asp Phe Glu Val Leu Leu Pro Leu Arg Ala Gly Gly Asn Arg Pro 1610 1615 1620 Pro Leu Tyr Cys Val His Ala Ser Gly Gly Leu Ser Trp Asn Tyr 1625 1630 1635 Ala Pro Leu Leu Arg Ser Leu Pro Pro Asn Gln Pro Val Tyr Gly 1640 1645 1650 Val Gln Ala Arg Gly Leu Ala Arg Thr Glu Pro Leu Ala Ala Gly 1655 1660 1665 Val Glu Glu Met Ala Ala Asp Tyr Val Glu Gln Ile Arg Ala Val 1670 1675 1680 Gln Pro Thr Gly Pro Tyr His Leu Leu Gly Trp Ser Leu Gly Gly 1685 1690 1695 Arg Ile Ala Gln Glu Met Ala Arg Val Leu Glu Glu Gln Gly Glu 1700 1705 1710 Gln Val Gly Leu Leu Ala Leu Leu Asp Ala Tyr Pro Thr Asp Val 1715 1720 1725 Gly Arg Leu Arg Arg Pro Arg Gly Asp Ala Ala Asp Gln Glu Ala 1730 1735 1740 Ala Asp Phe Asp Arg Gln Gln Glu Gln Gln Ala Gln Leu Ala Ala 1745 1750 1755 Ala Val Ala Thr Glu Ala Gly Ala Arg Lys Arg Leu Asp Glu Val 1760 1765 1770 Met Glu His Leu Ala Arg Val Gly Pro Leu His Thr Ser Arg Ser 1775 1780 1785 Phe Gly Cys Asp Ile Leu Leu Phe Val Ala Thr Val Asn Arg Pro 1790 1795 1800 Ser His Leu Pro Val Ala Asp Ala Ile Ala Ser Trp Arg Pro Leu 1805 1810 1815 Thr Thr Gly Thr Val Glu Pro His Glu Ile Glu Ile Asp His Met 1820 1825 1830 Gln Met Leu Gln Pro Ala Ala Leu Ala Arg Ile Gly Ala Val Val 1835 1840 1845 Ala Glu Lys Leu Arg Pro Arg Pro Asp Gly Glu Arg Thr Gln Arg 1850 1855 1860 <210> 18 <211> 4083 <212> PRT <213> Nonomuria <400> 18 Met Ala Gln Ser Arg Ile Glu Asp Phe Trp Pro Leu Ser Pro Leu Gln 1 5 10 15 Gln Gly Leu Leu Phe His Thr Thr Tyr Asp Asp Asp Trp Pro Gly Leu 20 25 30 Tyr Val Gly His Trp Ile Leu Asn Leu Asn Gly Pro Val Glu Ala Asp 35 40 45 Arg Leu Arg Ala Ala Trp Glu Ala Leu Leu Ala Arg His Ala Ala Leu 50 55 60 Arg Ala Cys Phe Arg Gln Arg Lys Ser Gly Glu Thr Val Gln Leu Ile 65 70 75 80 Ala Arg Gln Val Glu Leu Pro Trp Arg Val Val Asp Leu Ser His Leu 85 90 95 Ser Glu Pro Glu Glu Ala Val Arg Ala Val Ala Glu Glu Asp Arg Thr 100 105 110 Arg Arg Phe Asp Leu Ala Lys Ala Pro Leu Leu Arg Leu Thr Leu Ile 115 120 125 Arg Leu Ala Gly Asp Asp His Arg Leu Val Met Thr Cys His His Ala 130 135 140 Ile Met Asp Gly Trp Ser Met Pro Ile Met Leu Asp Glu Leu Ser Met 145 150 155 160 Leu Tyr Ala Ala Asp Gly Ser Pro Leu Asp Leu Pro Ala Val Pro Ser 165 170 175 Tyr Arg Asp Tyr Leu Val Trp Leu Asp Arg Gln Asp Lys Glu Arg Thr 180 185 190 Leu Ser Ala Trp Ala Ala Glu Leu Arg Gly Val Glu Glu Pro Thr Leu 195 200 205 Val Ala Pro Ala Asp Ala Asn Arg Ala Pro Ala Met Pro Glu Asn Ile 210 215 220 Thr Val Glu Leu Pro Glu Asp Leu Thr Arg Ala Leu Ser Glu Leu Ala 225 230 235 240 Arg Thr His Gly Leu Thr Leu Asn Thr Val Val Gln Gly Ala Trp Ala 245 250 255 Leu Leu Leu Ala Gln Leu Ala Gly Arg Thr Asp Val Val Phe Gly Ala 260 265 270 Ala Val Ser Ala Arg Pro Pro Asp Leu Pro Gly Val Glu Gly Met Val 275 280 285 Gly Leu Phe Leu Asn Thr Val Pro Val Arg Val Arg Leu Ser Gly Ser 290 295 300 Thr Pro Val Ile Glu Phe Leu Ala Asp Leu Gln Lys Arg Gln Ser Ala 305 310 315 320 Leu Ile Pro His Gln Tyr Met Gly Leu Ala Asp Ile Gln Arg Thr Ala 325 330 335 Gly Ala Gly Ala Val Phe Asp Thr Leu Leu Val Phe Gln Asn Phe Pro 340 345 350 Arg Glu Leu Arg Pro Ser Asp Ala Ala Ala Ala Phe Asp Ile Arg Ile 355 360 365 Asp Gln Gly Arg Glu Ala Ala His Tyr Pro Leu Thr Leu Val Ala Val 370 375 380 Pro Gly Glu Ser Met Leu Leu Asn Leu Asp His Val Thr Asp Leu Phe 385 390 395 400 Asp Arg Glu Ala Ala Leu Ala Ile Leu Glu Arg Phe Thr Gly Ile Leu 405 410 415 Arg Gln Leu Ala Gly Ala Gly Asp Leu Thr Val Ala Glu Val Asp Val 420 425 430 Thr Ser Ala Ala Glu Arg Ala Leu Val Val Asn Ala Trp Ser Ala Ala 435 440 445 Pro Arg Val Ala Pro Gly Glu Leu Ala Pro Asp Leu Phe Asp Arg Gln 450 455 460 Val Glu Arg Gly Arg Asp Arg Val Ala Val Val Glu Gly Lys Arg Ala 465 470 475 480 Val Ser Phe Gly Glu Leu Ala Glu His Ala Glu Arg Leu Ala Gly Tyr 485 490 495 Leu Ser Gly Arg Gly Val Arg Arg Gly Asp Arg Val Ala Val Val Met 500 505 510 Gly Arg Ser Pro Gly Leu Ile Ala Thr Leu Leu Ala Val Trp Lys Ala 515 520 525 Gly Ala Ala Phe Val Pro Val Asp Pro Ala Tyr Pro Ala Glu Arg Val 530 535 540 Gln Phe Met Leu Ala Asp Ala Glu Pro Ala Ala Val Val Thr Glu Arg 545 550 555 560 Ala Cys Gln Ala Ala Val Pro Ala Gly Gly Leu Asp Pro Ile Val Leu 565 570 575 Asp Asp Pro Asp Thr Leu Arg Ala Val Ala Glu His Ala Arg Leu Ser 580 585 590 Ala Gly Ala His Ala Asp Asp Leu Ala Tyr Val Met Tyr Thr Ser Gly 595 600 605 Ser Thr Gly Arg Pro Lys Gly Val Ala Val Ser His Gly Asn Val Ala 610 615 620 Ala Leu Ala Gly Glu Pro Gly Trp Gly Leu Gly Pro Glu Asp Ala Val 625 630 635 640 Leu Met His Ala Ser His Ala Phe Asp Ile Ser Leu Phe Glu Leu Trp 645 650 655 Val Pro Leu Leu Ser Gly Ala Arg Val Val Leu Ala Glu Pro Gly Ala 660 665 670 Val Asp Gly Glu Ala Leu Ala Gly Tyr Val Ala Gly Gly Val Thr Cys 675 680 685 Ala His Leu Thr Ala Gly Thr Phe Arg Val Leu Ala Glu Glu Ser Pro 690 695 700 Glu Ser Val Ala Gly Leu Arg Glu Val Leu Thr Gly Gly Asp Ala Val 705 710 715 720 Pro Leu Ala Ala Val Glu Arg Val Arg Arg Ala Cys Pro Asp Val Arg 725 730 735 Val Arg His Leu Tyr Gly Pro Thr Glu Ala Thr Leu Cys Ala Thr Trp 740 745 750 Trp Leu Leu Gln Pro Gly Glu Pro Thr Gly Pro Val Leu Pro Ile Gly 755 760 765 Arg Pro Leu Ala Gly Arg Arg Val Tyr Val Leu Asp Ala Phe Leu Arg 770 775 780 Pro Val Pro Pro Gly Val Thr Gly Glu Leu Tyr Val Ala Gly Ala Gly 785 790 795 800 Val Ala Gln Gly Tyr Leu Gly Arg Pro Ala Leu Thr Ala Glu Arg Phe 805 810 815 Val Ala Glu Pro Phe Val Pro Gly Gly Arg Met Tyr Arg Thr Gly Asp 820 825 830 Leu Ala Arg Trp Thr Asp Gln Gly Glu Leu Ala Phe Ala Gly Arg Ala 835 840 845 Asp Asp Gln Val Lys Ile Arg Gly Tyr Arg Val Glu Pro Gly Glu Ile 850 855 860 Glu Ala Val Leu Ala Gly Leu Pro Gly Val Gly Gln Ala Val Val Ser 865 870 875 880 Ala Arg Glu Glu Arg Leu Ile Gly Tyr Val Val Ala Glu Thr Gly Gly 885 890 895 Asp Leu Asp Pro Val Arg Ile Arg Glu Gln Leu Ala Ala Thr Leu Pro 900 905 910 Glu Phe Met Val Pro Ala Ala Val Leu Val Leu Asp Ala Leu Pro Leu 915 920 925 Thr Gly Asn Gly Lys Val Asp Arg Arg Ala Leu Pro Glu Pro Asp Phe 930 935 940 Ala Ala Gly Ala Val Asp Arg Glu Pro Ala Thr Asp Ala Glu Arg Ile 945 950 955 960 Leu Cys Gly Val Phe Ala Glu Val Leu Gly Ala Gly Arg Val Gly Val 965 970 975 Ala Asp Ser Phe Phe Glu Leu Gly Gly Asp Ser Ile Ser Ser Met Gln 980 985 990 Val Ala Ala Arg Ala Arg Arg Gln Gly Ile Pro Leu Thr Pro Arg Gln 995 1000 1005 Val Phe Glu His Arg Thr Pro Glu Arg Leu Ala Ala Leu Ala Gln 1010 1015 1020 Gln Ala Pro Gly Arg Arg Ala Ser Ser Val Glu Pro Gly Val Gly 1025 1030 1035 Glu Ile Pro Arg Thr Pro Val Met Arg Ala Leu Gly Asp Asp Ala 1040 1045 1050 Val Arg Pro Gly Phe Ala Gln Ala Arg Val Val Val Thr Pro Ala 1055 1060 1065 Gly Phe Ala Pro Asp Ala Leu Val Thr Ala Leu Gln Ala Val Leu 1070 1075 1080 Asp Val His Asp Leu Leu Arg Thr Arg Val Glu Pro Asp Gly Arg 1085 1090 1095 Leu Met Val Ala Glu Pro Gly Ala Val Asp Ala Ala Gly Leu Val 1100 1105 1110 Thr Arg Val Ala Ala Gly Asn Gly Asn Leu Ala Glu Arg Ala Glu 1115 1120 1125 Arg Glu Ala Arg Thr Ala Ala Gly Thr Leu Asp Pro Ser Glu Gly 1130 1135 1140 Ile Met Val Arg Ala Val Trp Val Asp Ala Gly Asp Ala Glu Pro 1145 1150 1155 Gly Arg Leu Ala Leu Val Val His His Leu Val Val Asp Ala Val 1160 1165 1170 Ser Trp Ala Ile Leu Leu Ser Asp Leu Arg Ala Ala Tyr Asp Glu 1175 1180 1185 Ala Val Ser Gly Gly Thr Pro Val Leu Glu Pro Ala Val Thr Ser 1190 1195 1200 Tyr Arg Gln Trp Ala Arg Arg Leu Ala Gly Gln Ala Leu Ser Glu 1205 1210 1215 Ser Thr Val Ala Glu Ala Gly His Trp Ala Gly Val Leu Glu Gly 1220 1225 1230 Gly Asp Leu Pro Leu Glu Arg His Pro Gly Gln Ser Ala Ser Trp 1235 1240 1245 Ser Arg Thr Leu Ser Asp Ala Gln Ala Arg Asn Leu Val Ala Arg 1250 1255 1260 Val Pro Ala Ala Phe His Cys Gly Val Gln Asp Val Leu Leu Ala 1265 1270 1275 Gly Leu Ala Gly Ala Val Ala Arg Trp Arg Gly Ala Asp Ala Gly 1280 1285 1290 Ile Leu Val Asp Val Glu Gly His Gly Arg His Ala Ala Asp Gly 1295 1300 1305 Glu Asp Leu Leu Arg Thr Val Gly Trp Phe Thr Ser Val His Pro 1310 1315 1320 Val Arg Leu Asp Val Ser Gly Val Gly Pro Gly Ala Ala Ala Ala 1325 1330 1335 Gly Glu Leu Leu Lys Ala Val Lys Glu Gln Ala Arg Ala Val Pro 1340 1345 1350 Gly Asp Gly Leu Gly Tyr Gly Leu Leu Arg Tyr Leu Asn Pro Glu 1355 1360 1365 Thr Gly Ala Arg Leu Ala Glu Leu Pro Ser Ala Gln Ile Gly Phe 1370 1375 1380 Asn Tyr Leu Gly Arg Ser Gly Val Ala Ser Glu Asp Thr Ala Trp 1385 1390 1395 Gln Val Cys Glu Gly Ala Leu Gly Gly Gln Ala Ala Gly Pro Asp 1400 1405 1410 Leu Val Gln Ser His Ala Leu Glu Val Gly Ala Asp Val Gln Asp 1415 1420 1425 Thr Pro Ala Gly Pro Arg Leu Arg Leu Ala Ile Asp Gly Arg Asp 1430 1435 1440 Leu Asp Pro Ala Ala Val Glu Arg Leu Gly Glu Ala Trp Leu Asp 1445 1450 1455 Thr Leu Ala Gly Leu Ala Ala Leu Ala Asp Thr Pro Gly Ala Gly 1460 1465 1470 Gly His Thr Pro Ser Asp Phe Glu Leu Val Glu Val Arg Gln Arg 1475 1480 1485 Asp Val Asp Glu Leu Glu Ala Val Ala Pro Gly Leu Thr Asp Val 1490 1495 1500 Trp Pro Leu Ser Pro Leu Gln Glu Gly Ile Leu Phe Glu Arg Ala 1505 1510 1515 Phe Asp Glu Asp Gly Val Asp Val Tyr Gln Thr Gln Arg Ile Leu 1520 1525 1530 Asp Leu Asp Gly Pro Leu Asp Ala Gln Arg Leu His Ala Ala Trp 1535 1540 1545 Gln Ser Val Ile Asp Arg His Glu Thr Leu Arg Thr Gly Phe His 1550 1555 1560 Gln Leu Gly Ser Gly Glu Thr Val Gln Val Val Val Gly Glu Ala 1565 1570 1575 Glu Val Leu Trp Arg Glu Ala Asp Leu Ser Arg Leu Asp Glu Pro 1580 1585 1590 Asp Ala Glu Val Glu Arg Leu Leu Ala Ala Asp Gln Ala Glu Arg 1595 1600 1605 Phe Asp Val Ser Arg Ala Pro Leu Leu Arg Leu Leu Leu Ile Arg 1610 1615 1620 Leu Gly Ala Ala Arg His Arg Leu Val Val Thr Ser His His Val 1625 1630 1635 Leu Val Asp Gly Trp Ser Thr Pro Ile Leu Leu Gly Glu Met Leu 1640 1645 1650 Thr Ala Tyr Ala Asp Gly Arg Val Ser Pro Ala Pro Pro Ser Tyr 1655 1660 1665 Arg Asp Tyr Val Ala Trp Leu Ser Arg Gln Asp Glu Asp Ala Ala 1670 1675 1680 Arg Ser Ala Trp Arg Ala Glu Leu Ala Gly Leu Asp Glu Pro Thr 1685 1690 1695 Val Val Gly Leu Asp Ala Gly Lys Ala Pro Val Met Pro Asp Gly 1700 1705 1710 His Ala Glu Trp Leu Ser Glu Glu Ala Thr Arg Ala Leu Thr Gly 1715 1720 1725 Phe Ala Arg Gly His Gly Leu Thr Leu Ser Thr Val Val Gln Gly 1730 1735 1740 Ala Trp Ala Leu Val Leu Ala Arg Leu Ala Arg Arg Thr Asp Val 1745 1750 1755 Val Phe Gly Thr Val Val Ser Gly Arg Pro Ala Asp Ala Leu Pro 1760 1765 1770 Asp Val Glu Arg Met Val Gly Met Phe Ile Asn Thr Val Pro Val 1775 1780 1785 Arg Val Arg Leu Asp Gly Ala Val Pro Val Leu Asp Leu Leu Gln 1790 1795 1800 Asp Leu Gln Arg Arg Gln Ser Ser Leu Thr Glu His Gln His Leu 1805 1810 1815 Gly Leu Pro Glu Ile Gln Lys Ala Ala Gly Pro Gly Ser Ile Phe 1820 1825 1830 Asp Thr Ile Leu Met Ile Val Asn Tyr Pro Leu Asp Ala Asp Gly 1835 1840 1845 Leu Asp Asp Gly Gly Val Ala Ile Ser Ser Ile Arg Thr Arg Thr 1850 1855 1860 Gly Thr Thr Tyr Pro Leu Ser Val Ser Val Ile Pro Gly Ala Arg 1865 1870 1875 Leu Gln Ile Gln Leu Asp Tyr Arg Pro Asp Trp Ile Gly Gly Asp 1880 1885 1890 Leu Ala Ala Glu Ile Thr Gly Gln Val Val Arg Val Leu Ala Arg 1895 1900 1905 Met Val Ala Glu Pro Ser Leu Pro Val Gly Arg Leu Ala Val Thr 1910 1915 1920 Ser Arg Ser Thr Arg Gly Ser Val Thr Glu Arg Trp Asn Ser Thr 1925 1930 1935 Gly Ala Ala Ala Gly Gly Ser Ser Val Pro Glu Leu Phe Arg Arg 1940 1945 1950 Gln Ala Asp Ala Ala Pro Asp Ala Thr Ala Val Ile Gly Asp Gly 1955 1960 1965 Arg Thr Leu Ser Tyr Ala Gly Leu Asp Arg Glu Ser Asp Arg Leu 1970 1975 1980 Ala Gly His Leu Ala Arg Arg Gly Val Arg Arg Gly Asp Arg Val 1985 1990 1995 Gly Val Leu Met Glu Arg Gly Ala Asp Leu Ile Val Ala Leu Leu 2000 2005 2010 Ala Val Trp Lys Ala Gly Ala Ala Gln Val Pro Val Asn Val Asp 2015 2020 2025 Tyr Pro Ala Glu Arg Ile Glu Arg Met Leu Ala Asp Ala Gly Ala 2030 2035 2040 Ser Val Ala Val Cys Ala Gly Ala Thr Arg His Ala Val Pro Asp 2045 2050 2055 Gly Ile Glu Pro Val Val Met Asp Ala Pro Ala Thr Glu Ala Glu 2060 2065 2070 Arg His Glu Ala Pro Pro Leu Ala Val Gly Ala His Asp Val Ala 2075 2080 2085 Tyr Val Met Tyr Thr Ser Gly Ser Thr Gly Val Pro Lys Gly Val 2090 2095 2100 Ala Val Pro His Gly Ser Ala Ala Ala Leu Ala Gly Asp Pro Gly 2105 2110 2115 Trp Ser Gln Gly Ala Gly Asp Arg Val Leu Met His Ala Ser His 2120 2125 2130 Ala Phe Asp Ala Ser Leu Leu Glu Ile Trp Val Pro Leu Val Ser 2135 2140 2145 Gly Ala Cys Val Met Val Ala Glu Pro Gly Ala Ile Asp Ala Gln 2150 2155 2160 Arg Leu Arg Asp Val Ile Ala Arg Gly Ala Thr Thr Val His Leu 2165 2170 2175 Thr Ala Gly Thr Phe Arg Val Leu Ala Glu Glu Ser Pro Asp Ser 2180 2185 2190 Phe Ser Gly Leu Arg Glu Val Leu Thr Gly Gly Asp Val Val Pro 2195 2200 2205 Leu Glu Ser Val Ala Arg Val Arg Arg Ala Cys Pro Glu Val Arg 2210 2215 2220 Val Arg Glu Leu Tyr Gly Pro Thr Glu Val Thr Leu Cys Ala Thr 2225 2230 2235 Trp His Leu Ile Glu Pro His Thr Glu Thr Gly Asp Thr Leu Pro 2240 2245 2250 Ile Gly Arg Pro Leu Ala Gly Arg Gln Val Tyr Val Leu Asp Ala 2255 2260 2265 Phe Leu Gln Pro Val Ala Pro Asn Val Thr Gly Glu Leu Tyr Leu 2270 2275 2280 Ala Gly Ala Gly Leu Ala His Gly Tyr Leu Gly Ala Pro Ala Ala 2285 2290 2295 Thr Ser Glu Arg Phe Ile Ala Val Pro Ala Ser Val Asn Pro Ala 2300 2305 2310 Ala Ser Gly Glu Arg Met Tyr Arg Thr Gly Asp Leu Ala Arg Trp 2315 2320 2325 Thr Asp Arg Gly Glu Leu Leu Phe Ala Gly Arg Ala Asp Ser Gln 2330 2335 2340 Val Lys Ile Arg Gly Tyr Arg Val Glu Pro Gly Glu Ile Glu Ala 2345 2350 2355 Ala Leu Ala Glu Val Pro His Val Ala Gln Ala Val Val Val Ala 2360 2365 2370 Arg Glu Asp Arg Pro Gly Glu Lys Arg Leu Ile Ala Tyr Val Thr 2375 2380 2385 Ala Glu Glu Gly Ser Gly Leu Asp Pro Asp Ala Val Arg Glu His 2390 2395 2400 Leu Ala Gly Arg Leu Pro Glu Phe Met Val Pro Ala Ala Val Val 2405 2410 2415 Leu Leu Asp Gly Val Pro Leu Thr Pro Asn Gly Lys Ile Asp Arg 2420 2425 2430 Ala Ala Leu Pro Val Pro Glu Phe Thr Gly Lys Ala Ala Gly Arg 2435 2440 2445 Glu Pro Arg Thr Glu Ala Glu Arg Val Leu Cys Glu Leu Phe Ala 2450 2455 2460 Glu Val Leu Gly Val Ala Arg Ala Gly Ala Glu Asp Ser Phe Phe 2465 2470 2475 Glu Leu Gly Gly Asp Ser Ile Leu Ser Met Arg Leu Ala Ala Arg 2480 2485 2490 Ala Arg Arg Glu Glu Leu Val Phe Gly Ala Lys Asp Val Phe Glu 2495 2500 2505 Arg Lys Thr Pro Ala Gly Ile Ala Met Val Ala Glu Arg Gly Gly 2510 2515 2520 Ala Thr Arg Ala Ser Leu Asp Asp Gly Val Gly Glu Val Met Ser 2525 2530 2535 Thr Pro Val Ile Arg Ala Leu Leu Glu Arg Asp Pro Asp Ala Met 2540 2545 2550 Thr Arg Gly Ala Leu Ser Gln Trp Val Thr Ala Gly Ala Pro Asp 2555 2560 2565 Asp Leu Ser Val Asp Val Leu Ala Ala Gly Leu Gly Ala Val Ile 2570 2575 2580 Asp Ala His Asp Met Leu Arg Ser Arg Ile Val Arg Thr Gly Ala 2585 2590 2595 Ala Gln Pro Arg Leu Val Val Ala Gly Arg Gly Ala Val Asp Ala 2600 2605 2610 Ala Thr Leu Val Glu Arg Val Glu Ala Gly Thr Gly Asp Val Asp 2615 2620 2625 Glu Ile Ala Asp Arg Cys Ala Arg Asp Ala Ala Ala Arg Leu Asp 2630 2635 2640 Pro His Ala Gly Val Met Ile Arg Ala Val Trp Val Asp Ala Gly 2645 2650 2655 Pro Gly Arg Val Gly Arg Leu Val Val Ala Ala His His Leu Val 2660 2665 2670 Val Asp Val Val Ser Trp Arg Ile Leu Leu Pro Asp Leu Gln Val 2675 2680 2685 Ala Cys Glu Ala Val Ala Ala Gly Arg Arg Pro Val Leu Asp Pro 2690 2695 2700 Val Asp Val Ser Phe Arg Arg Trp Ala Arg Thr Leu Ala Asp Gln 2705 2710 2715 Ala Val Thr Arg Ala Thr Glu Leu Glu Thr Trp Thr Glu Ile Leu 2720 2725 2730 Asp Gly Ala Arg Ser Arg Leu Gly Glu Leu Asp Pro Ala Arg Asp 2735 2740 2745 Thr Val Ser Thr Ala Gly Arg Thr Ser Trp Thr Leu Pro His Asp 2750 2755 2760 Arg Ala Gly Val Leu Val Glu Gln Ala Thr Ser Ala Phe His Cys 2765 2770 2775 Gly Val His Glu Val Leu Leu Ala Thr Leu Ala Gly Ala Val Ala 2780 2785 2790 His Trp Arg Gly Gly Thr Ala Val Val Val Asp Val Glu Gly His 2795 2800 2805 Gly Arg Arg Pro Ile Asp Glu Leu Asp Leu Ser Arg Thr Val Gly 2810 2815 2820 Trp Phe Thr Asp Val His Pro Leu Arg Leu Asp Val Thr Gly Ile 2825 2830 2835 Asp Pro Ala Glu Val Ile Ala Gly Gly Gly Ala Ala Gly His Leu 2840 2845 2850 Leu Lys Gln Val Lys Glu Asn Val Arg Ala Val Pro Asp Gly Gly 2855 2860 2865 Leu Gly Tyr Gly Ile Leu Arg Tyr Leu Asn Ala Gly Thr Gly Gln 2870 2875 2880 Ala Leu Ala Ala Ala Pro Lys Pro Glu Ile Gly Phe Asn Tyr Leu 2885 2890 2895 Gly Arg Phe Pro Ser Arg Ser Ala Gly Ala Pro Glu Pro Trp Gln 2900 2905 2910 Leu Leu Gly Thr Ile Gly Gly Thr Ala Glu Gln Asp Thr Ala Leu 2915 2920 2925 Arg His Ala Val Glu Ile Asp Ala Ala Val Leu Asp Gly Ala Ala 2930 2935 2940 Gly Pro Glu Leu Ser Leu Thr Val Thr Trp Ala Gly Arg Leu Leu 2945 2950 2955 Gly Glu Ala Glu Ala Glu Ser Leu Ala Gln Ala Trp Leu Ala Met 2960 2965 2970 Leu Thr Gly Leu Ala Ala His Val Gly Gly Gly Gly Ala Gly Gly 2975 2980 2985 His Thr Pro Ser Asp Phe Pro Leu Ile Ser Leu Thr Gln Gln Asp 2990 2995 3000 Val Ala Glu Val Glu Ala Ala Val Pro Thr Leu Leu Asp Ile Trp 3005 3010 3015 Pro Leu Ser Pro Leu Gln Glu Gly Leu Leu Phe His Ala Ala Asp 3020 3025 3030 Glu Arg Gly Pro Asp Val Tyr Ala Gly Met Arg Lys Leu Ala Leu 3035 3040 3045 Asp Gly Pro Leu Asp Val Ala Arg Phe Arg Ala Ser Trp Gln Ala 3050 3055 3060 Leu Leu Asp Arg His Pro Ala Leu Arg Ala Ser Phe His Gln Leu 3065 3070 3075 Gly Ser Gly Ala Ala Val Gln Ala Ile Ala Arg Glu Val Pro Leu 3080 3085 3090 Asp Trp Gln Glu Thr Asp Leu Ser Arg Leu Pro Glu Asp Glu Ala 3095 3100 3105 Leu Ala Glu Phe Asp Arg Leu Ala Glu Gln Leu His Thr Glu Arg 3110 3115 3120 Phe Asp Leu Thr Arg Ala Pro Gln Leu Arg Leu His Leu Val Arg 3125 3130 3135 Leu Gly Glu Arg Arg His Arg Leu Val Leu Thr Ser His His Ile 3140 3145 3150 Val Ala Asp Gly Trp Ser Leu Pro Leu Ile Thr Glu Asp Val Leu 3155 3160 3165 Thr Val Tyr Glu Ser Gly Gly Asp Gly Arg Ala Leu Pro Ala Ala 3170 3175 3180 Thr Ser Tyr Arg Asp Tyr Leu Ala Trp Ile Ala Arg Gln Asp Lys 3185 3190 3195 Ala Ala Ala Arg Glu Ala Trp Arg Ala Glu Leu Ala Gly Leu Asp 3200 3205 3210 Glu Ala Thr His Val Val Pro Pro Glu Thr Ile Thr Thr Pro Leu 3215 3220 3225 Glu Pro Glu Arg Val Gly Phe Glu Leu Asp Glu Ala Leu Ser Arg 3230 3235 3240 Arg Val Val Glu Phe Thr Gly Arg His Gly Val Thr Ala Asn Thr 3245 3250 3255 Leu Phe Gln Gly Ile Trp Ala Leu His Leu Ala Arg Leu Thr Gly 3260 3265 3270 Arg Asp Asp Val Val Phe Gly Ala Ala Val Ala Gly Arg Pro Pro 3275 3280 3285 Glu Ile Pro Gly Val Glu Ser Ala Val Gly Leu Phe Met Asn Met 3290 3295 3300 Leu Pro Val Arg Ala Arg Leu Ala Gly Ala Glu Pro Phe Leu Asp 3305 3310 3315 Met Leu Thr Asp Leu Gln Glu Arg Gln Val Ala Cys Met Pro His 3320 3325 3330 Gln His Val Gly Leu Ser Glu Ile Asn Gln Leu Ala Gly Pro Gly 3335 3340 3345 Ala Ala Phe Asp Thr Ile Val Val Phe Glu Asn Tyr Pro Pro Pro 3350 3355 3360 Pro Pro Arg Pro Glu Gly Pro Asp Ala Leu Val Met Arg Pro Ala 3365 3370 3375 Gly Ile Pro Asn Asp Thr Gly His Tyr Pro Leu Ser Met Arg Ala 3380 3385 3390 Ser Val Ala Gly Arg Val His Gly Glu Phe Ile Tyr Arg Pro Asp 3395 3400 3405 Val Val Asp Arg Ala Glu Ala Glu Glu Met Leu Ala Ser Ile Leu 3410 3415 3420 Arg Ala Leu Glu Gln Val Val Ala Glu Pro Arg Val Pro Val Gly 3425 3430 3435 Arg Val Gly Leu Ile Gly Pro Glu Gln Arg Arg Leu Val Val Glu 3440 3445 3450 Glu Trp Asn Arg Thr Gly Val Pro Pro Ala Ala Glu Pro Val Pro 3455 3460 3465 Met Leu Phe Arg Arg Gln Val Glu Arg Ser Pro Asp Ala Val Ala 3470 3475 3480 Val Val Asp Ala Ala Arg Ser Leu Ser Tyr Ser Gly Leu Leu Asp 3485 3490 3495 Glu Ala Glu Glu Leu Ala Arg Leu Leu Val Gly Leu Gly Val Arg 3500 3505 3510 Arg Glu Thr Arg Val Gly Val Leu Val Gly Arg Ser Ala Glu Leu 3515 3520 3525 Val Val Ala Leu Leu Gly Val Ser Ser Ala Gly Gly Val Phe Val 3530 3535 3540 Pro Met Asp Pro Asp Tyr Pro Arg Glu Arg Ile Ser Phe Ile Leu 3545 3550 3555 Ala Asp Ser Ala Pro Glu Val Leu Leu Cys Thr Ser Glu Thr Arg 3560 3565 3570 Gln Ala Val Pro Glu Glu Phe Ala Gly Ala Val Val Ala Leu Asp 3575 3580 3585 Ala Pro Leu Ala Ala Asp Pro Arg Thr Ala Leu Pro Arg Val Glu 3590 3595 3600 Ala Gly Asp Gly Ala Tyr Val Ile Tyr Thr Ser Gly Ser Thr Gly 3605 3610 3615 Val Pro Lys Gly Val Leu Val Pro His Ala Gly Leu Gly Asn Leu 3620 3625 3630 Ala Ser Ala Gln Ile Glu Arg Phe Gly Val Thr Ser Ala Ser Arg 3635 3640 3645 Ile Leu Gln Phe Ala Ala Leu Gly Phe Asp Ala Ala Val Ser Glu 3650 3655 3660 Leu Cys Met Ala Leu Leu Ser Gly Gly Thr Val Val Leu Ala Asp 3665 3670 3675 Ala Glu Ser Met Pro Pro Arg Val Ser Leu Gly Asp Ala Val Arg 3680 3685 3690 Arg Trp Gly Ile Thr His Val Thr Val Pro Pro Ser Val Pro Ala 3695 3700 3705 Val Glu Asp Asp Leu Pro Asp Ser Leu Glu Thr Leu Val Val Ala 3710 3715 3720 Gly Glu Ala Cys Pro Pro Ala Leu Val Asp Arg Trp Ser Pro Gly 3725 3730 3735 Arg Arg Met Ile Asn Ala Tyr Gly Pro Thr Glu Thr Thr Val Cys 3740 3745 3750 Ala Thr Met Ser Ser Pro Leu Ser Pro Gly Arg Asp Val Val Pro 3755 3760 3765 Ile Gly Arg Pro Ile Thr Gly Leu Arg Ala Tyr Val Leu Asp Ala 3770 3775 3780 Phe Leu Gln Pro Val Pro Pro Gly Val Thr Gly Glu Leu Tyr Val 3785 3790 3795 Ala Gly Ala Gly Leu Ala Arg Gly Tyr Leu Gly Arg Pro Gly Leu 3800 3805 3810 Thr Ala Glu Arg Phe Val Ala Val Pro Ala Ser Val Ser Pro Ala 3815 3820 3825 Arg Pro Gly Glu Arg Met Tyr Arg Thr Gly Asn Arg Ala Arg Trp 3830 3835 3840 Thr Arg Asp Gly Glu Leu Val Phe Thr Gly Arg Ala Asp Ala Gln 3845 3850 3855 Val Lys Val Arg Gly Tyr Arg Ile Glu Pro Gly Glu Ile Glu Ala 3860 3865 3870 Val Leu Ala Asp His Pro Gly Val Ala Gln Val Ala Val Val Ala 3875 3880 3885 Arg Glu Asp Gly Pro Gly Gln Lys Tyr Leu Val Ala Tyr Val Val 3890 3895 3900 Pro Ala Ala Glu Gln Val Ala Gly Ala Pro Ser Glu Ala Gly Gln 3905 3910 3915 Asp Gly Ala Leu Ile Ser Ala Leu Arg Glu Ser Ala Ala Gly Arg 3920 3925 3930 Leu Pro Glu His Met Arg Pro Ala Ala Phe Val Pro Leu Asp Thr 3935 3940 3945 Met Pro Leu Thr Pro Asn Gly Lys Val Asp His Arg Ala Leu Arg 3950 3955 3960 Ala Pro Asp Phe Ala Arg Ser Ser Ser Gly Arg Asp Pro Arg Ser 3965 3970 3975 Ala Met Glu Ala Lys Leu Cys Glu Leu Phe Ala Glu Val Leu Gly 3980 3985 3990 Leu Glu Glu Val Gly Ala Gly Asp Ser Phe Phe Glu Leu Gly Gly 3995 4000 4005 Asp Ser Ile Thr Ser Met Gln Leu Ser Ala Leu Ala Arg Arg Lys 4010 4015 4020 Gly Leu Asp Leu Thr Pro Trp Gln Val Phe Asp Glu Lys Thr Ala 4025 4030 4035 Glu Arg Leu Ala Ala Val Val Lys Glu Leu Pro Ala Asp Gly Glu 4040 4045 4050 Gly Thr Gly Glu Pro Glu Pro Pro Ala Gly Thr Leu Val Asp Leu 4055 4060 4065 Ser Pro Asp Gln Leu Asp Gln Leu Glu Ala Gly Pro Ala Gly Gly 4070 4075 4080 <210> 19 <211> 753 <212> PRT <213> Nonomuria <400> 19 Met Ala Gly Phe Gly Ala Pro Phe Arg Asn Ser Asp His Val Val Ser 1 5 10 15 Lys Leu Thr Asn Glu Asp Ala Phe Glu Leu Val Glu Arg His Gly Ala 20 25 30 Asn Ala Ser Pro Leu Gly Arg Ala Met Leu Thr Val Arg Ala Gly Asp 35 40 45 Arg Ser Tyr Pro Glu Met Gly Val Gly Pro Val Ala Glu Ser Lys Asp 50 55 60 Leu Arg Trp Gln Gln Leu Thr Ser Gly Arg Phe Pro Glu Arg Lys Gly 65 70 75 80 Glu Ala Val Val Asp Leu Trp Asp Ala Gln Asn Trp Asp Val Ala Val 85 90 95 Gly Asp Arg Ile Arg Ile Gly Glu Arg Ala Thr Ala Ala Asp Phe Thr 100 105 110 Val Val Gly Ile Val Arg Ala Pro Ser Pro Val Ala Gln Ala Ser Val 115 120 125 Tyr Val Thr Trp Pro Gln Leu Met Arg Trp Ala Asp Asp Pro Ser Leu 130 135 140 Gly Ile Tyr Thr Val Thr Val Arg Gly Ala Val Gly Pro Val Pro Glu 145 150 155 160 Thr Ala Lys Val Gln Thr Pro Glu Gln Glu Ile Ala Ala Arg Thr Ala 165 170 175 Gln Leu Gln Asn Gly Val Asp Thr Trp Ser Leu Leu Leu Leu Leu Phe 180 185 190 Ala Gly Ile Ala Val Phe Val Ser Ile Leu Val Ile Ala Asn Thr Phe 195 200 205 Ser Ile Leu Leu Ala Gln Arg Met Arg Asp Phe Ala Leu Leu Arg Cys 210 215 220 Val Gly Ala Thr Arg Arg Gln Val Val Ser Ser Val Arg Arg Glu Ala 225 230 235 240 Ala Val Val Gly Leu Leu Ser Ser Leu Ala Gly Val Leu Val Gly Ala 245 250 255 Gly Leu Gly Tyr Gly Leu Ile Ala Leu Ile Lys Thr Leu Ser Pro Ile 260 265 270 Thr Pro Ile Ala Ala Pro Ala Pro Pro Ala Pro Trp Leu Leu Gly Gly 275 280 285 Leu Ala Ile Gly Leu Thr Ala Thr Leu Val Ala Ala Trp Leu Pro Ile 290 295 300 Arg Arg Val Val Arg Val Ser Pro Leu Ala Ala Leu Arg Pro Asp Thr 305 310 315 320 Ala Thr Asp Pro Arg Thr Ala Thr Gly Arg Ala Arg Leu Val Leu Gly 325 330 335 Val Phe Met Leu Ile Ala Gly Leu Val Leu Leu Ala Ser Ala Met Ala 340 345 350 Trp His Ser Thr Val Leu Met Leu Ala Gly Gly Gly Ser Leu Phe Thr 355 360 365 Gly Val Leu Leu Phe Gly Pro Val Leu Ile Pro Arg Leu Leu Glu Ile 370 375 380 Thr Gly Thr Arg Leu Gly Thr Ile Gly Arg Leu Ala Thr Lys Asn Ala 385 390 395 400 Val Arg Asn Pro Arg Arg Thr Ala Thr Thr Ala Ala Ser Leu Leu Val 405 410 415 Gly Ile Thr Leu Ile Thr Ala Val Leu Thr Gly Val Ala Ile Thr Ser 420 425 430 Glu Ala Leu Asn Glu Arg Leu Asp Gly Gln His Pro Ile Asp Ala Ala 435 440 445 Leu Val Ser Thr Gly Lys Pro Phe Ser Ala Asp Phe Leu Asp Lys Val 450 455 460 Arg Gly Thr Ser Gly Val Asp Gln Ala Ile Ala Val Asp Gly Ala Val 465 470 475 480 Ala Thr Val Ser Gly Leu Asp Lys Pro Ile Pro Val Val Thr Ala Pro 485 490 495 Asp Ala Gln Arg Val Ala His Asp Gly Gly Ser Phe Ala Arg Val Glu 500 505 510 Pro Gly Val Leu Arg Leu Asp Glu Ser Ala Phe Arg Gln Leu Arg Leu 515 520 525 Arg Ala Gly Asp Lys Val Arg Val Thr Val Gly Asp Arg Arg Ala Val 530 535 540 Leu Gln Val Ser Leu Ala Thr Gly Trp Gly Leu Gln Ala Val Val Ala 545 550 555 560 Pro Glu Thr Leu Ala Arg Leu Thr Asp Ser Ala Ala Pro Arg Ala Val 565 570 575 Trp Ile Arg Ala Ser Ala Asp Ala Asp Ser Thr Arg Leu Val Gly Glu 580 585 590 Leu Gly Asp Leu Ala Ala Ala Ala Gly Ala Asn Val Asn Asp Gln Leu 595 600 605 Glu Ala Arg Glu Thr Glu Asn Ala Pro Leu Met Ile Leu Thr Trp Ala 610 615 620 Ile Val Ala Leu Leu Gly Phe Ser Val Ala Ile Ala Leu Val Gly Ile 625 630 635 640 Ala Asn Thr Leu Gly Leu Ser Val Leu Glu Arg Val Arg Glu His Ala 645 650 655 Leu Leu Arg Ala Leu Gly Leu Thr Arg Arg Gln Leu Arg Arg Met Leu 660 665 670 Ala Ala Glu Ala Val Leu Leu Ser Leu Val Ala Ala Val Leu Gly Thr 675 680 685 Val Ile Gly Ile Gly Phe Ala Trp Val Gly Tyr Glu Thr Phe Val Lys 690 695 700 Gln Ala Leu Asp Asn Ala Thr Met Gln Val Pro Trp Pro Leu Leu Ala 705 710 715 720 Val Val Val Leu Val Ala Ala Leu Ala Gly Leu Leu Ala Ser Val Leu 725 730 735 Pro Ala Arg Arg Ala Val Arg Val Thr Pro Ala Ala Gly Leu Ser Phe 740 745 750 Glu <210> 20 <211> 232 <212> PRT <213> Nonomuria <400> 20 Met Thr Gly Gln Arg Ala Ala Leu Glu Thr Val Ala Ala Ser Ala Arg 1 5 10 15 Asn Leu Thr Lys Val Tyr Gly Gln Gly Glu Thr Arg Val His Ala Leu 20 25 30 Arg Gly Val Asp Leu Asp Leu Pro Arg Gly Lys Phe Thr Ala Ile Met 35 40 45 Gly Ser Ser Gly Ser Gly Lys Ser Thr Leu Met His Cys Leu Ala Gly 50 55 60 Leu Asp Gln Ala Ser Asp Gly Thr Val Thr Val Ala Gly Thr Asp Leu 65 70 75 80 Gly Ser Leu Asp Asp Asn Glu Leu Thr Val Phe Arg Arg Glu His Ile 85 90 95 Gly Phe Val Phe Gln Ser Phe Asn Leu Leu Pro Met Leu Thr Ala Phe 100 105 110 Gln Asn Ile Thr Leu Pro Leu Glu Leu Gly Gly Arg Arg Ile Asp Asp 115 120 125 Ala Ala Thr Glu Arg Val His Val Leu Ala Glu Thr Leu Gly Met Ala 130 135 140 Asp Arg Leu Gly His Arg Pro Ser Glu Met Ser Gly Gly Gln Gln Gln 145 150 155 160 Arg Val Ala Ile Ala Arg Ala Leu Ile Thr Gly Pro Asp Leu Leu Phe 165 170 175 Ala Asp Glu Pro Thr Gly Asn Leu Asp Ser Thr Thr Ser Ala Glu Val 180 185 190 Leu Gly Tyr Leu His Lys Ser Thr Arg Glu Leu Gly Gln Thr Val Val 195 200 205 Met Val Thr His Glu Arg Glu Ala Ala Ala Tyr Ala Asp Gly Val Val 210 215 220 Thr Leu Glu Asp Gly Arg Ile Ala 225 230 <210> 21 <211> 535 <212> PRT <213> Nonomuria <400> 21 Met Ser His Ile Thr Met Thr Pro Pro Ser Ala Cys Arg Asp Pro Ala 1 5 10 15 Pro Ala Gly Arg Phe Pro Arg Trp Ala Val Trp Arg Ser Pro Pro Gly 20 25 30 Gln Pro Trp Trp Ala Arg Pro Ala Leu Leu Cys Ile Ala Ala Thr Ala 35 40 45 Ala Val Leu Tyr Ala Trp Asn Leu Pro Leu Val Asp Tyr Ala Pro Arg 50 55 60 Tyr Ser Asp Ala Val Lys Ser Met Ser Glu Asn Trp Lys Ala Phe Leu 65 70 75 80 Tyr Gly Thr Val Asp Val Gln Ala Thr Tyr Thr Leu Asp Lys Leu Ala 85 90 95 Gly Ala Phe Val Pro Gln Ala Ile Ser Val Lys Ile Phe Gly Phe His 100 105 110 Ala Trp Ala Leu Ala Leu Pro Gln Val Ile Glu Gly Val Ile Ser Val 115 120 125 Leu Val Met Tyr Arg Ile Val Arg Arg Trp Ala Gly Val Val Pro Gly 130 135 140 Leu Leu Ala Ala Ala Val Phe Thr Ile Thr Pro Val Ala Ala Ser Met 145 150 155 160 Phe Gly His Ser Met Ala Asp Gly Ala Leu Val Met Cys Leu Val Leu 165 170 175 Ala Val Asp Ser Tyr Gln Arg Ala Val Leu Glu Gly Arg Leu Arg Ser 180 185 190 Leu Val Trp Ala Gly Val Trp Val Gly Leu Gly Phe Gln Ala Lys Met 195 200 205 Leu Gln Ala Trp Met Ile Leu Pro Ala Leu Ala Ile Gly Tyr Leu Leu 210 215 220 Ser Ala Pro Ile Gly Leu Arg Arg Arg Leu Gln His Leu Gly Ile Ala 225 230 235 240 Gly Val Val Thr Leu Val Val Ser Leu Ser Trp Ile Thr Leu Tyr His 245 250 255 Val Thr Pro Ala Ala Asp Arg Pro Tyr Ile Ser Gly Thr Thr Asn Ser 260 265 270 Ser Ala Ala Ala Met Val Phe Gly Tyr Asn Gly Leu Gly Arg Leu Gly 275 280 285 Ile Asn Leu Pro Gly Ala Leu Pro Pro Asn Tyr Met Gly Ser Val Ile 290 295 300 Gly Pro Ala Pro Pro Lys Arg Ser Thr Gln Leu Pro Arg Pro Arg Pro 305 310 315 320 Gly Met Val Ile Pro Glu Ile Gly Ile Glu His Gly Gly Gly Trp Gly 325 330 335 Lys Leu Phe Gly Gly Arg Leu Gly Val Ala Ser Gly Trp Leu Tyr Pro 340 345 350 Leu Ala Leu Met Ala Leu Leu Cys Gly Leu Trp Trp Trp Arg Arg Ala 355 360 365 Glu Arg Thr Asp Pro Ala Arg Gly Gly Met Val Met Trp Gly Val Trp 370 375 380 Leu Leu Thr Phe Ala Leu Pro Tyr Ser Ala Val Phe Val Ile Pro His 385 390 395 400 Ser Ala Tyr Val Ala Val Leu Ala Pro Pro Val Ala Ala Leu Ser Gly 405 410 415 Ile Gly Ile Val Met Phe Trp Arg Ala Tyr Arg Ser Gly Gly Arg Met 420 425 430 Ala Trp Ile Phe Pro Leu Ala Ile Val Ala Glu Leu Ala Trp Ala Val 435 440 445 Trp Leu Trp Ser Phe Tyr Pro Thr Phe Leu Pro Trp Ala Met Trp Gly 450 455 460 Ala Val Ala Leu Gly Val Val Ala Val Val Ala Leu Ala Leu Ala Arg 465 470 475 480 Leu Val Arg Pro Arg Arg Ser Ser Leu Val Ser Ala Gly Leu Thr Ile 485 490 495 Gly Val Ala Ala Met Leu Ala Ala Pro Ala Thr Trp Ser Ala Ser Val 500 505 510 Leu Asp Pro Arg Tyr Gly Gly Ser Ser Phe Asp Ala Asn Ala Gly Pro 515 520 525 Ala Ala Arg Thr Pro Gly Gly 530 535 <210> 22 <211> 270 <212> PRT <213> Nonomuria <400> 22 Met Leu Gln Asp Ala Asp Arg Thr Arg Ile Leu Ala Ile Ser Pro His 1 5 10 15 Leu Asp Asp Ala Val Leu Ser Val Gly Ala Ser Leu Ala Gln Ala Glu 20 25 30 Gln Asp Gly Gly Lys Val Thr Val Phe Thr Val Phe Ala Gly Ser Ala 35 40 45 Ala Pro Pro Tyr Ser Pro Ala Ala Glu Arg Phe His Ala Arg Trp Gly 50 55 60 Leu Ser Pro Thr Glu Asp Ala Pro Leu Arg Arg Arg Asn Glu Asp Ile 65 70 75 80 Ala Ala Leu Asp Gln Leu Gly Ala Gly His Arg His Gly Arg Phe Leu 85 90 95 Asp Ala Ile Tyr Arg Arg Ser Pro Asp Gly Gln Trp Leu Leu His His 100 105 110 Asn Glu Gly Ser Met Val Arg Gln Gln Ser Pro Ala Asn Asn His Asp 115 120 125 Leu Val Ala Ala Ile Arg Glu Asp Ile Glu Ser Met Ile Ala Glu Cys 130 135 140 Asp Pro Thr Leu Val Leu Thr Cys Val Ala Ile Gly Lys His Pro Asp 145 150 155 160 His Lys Ala Thr Arg Asp Ala Thr Leu Leu Ala Ala Arg Glu Arg Gly 165 170 175 Ile Pro Leu Arg Leu Trp Gln Asp Leu Pro Tyr Ala Ala Tyr Ser Gln 180 185 190 Asp Leu Ala Glu Leu Pro Asp Gly Leu Arg Leu Gly Ser Pro Glu Leu 195 200 205 Ser Phe Val Asp Glu Glu Ala Arg Thr Arg Lys Phe Gln Ala Met Lys 210 215 220 His Tyr Ala Thr Gln Leu Ser Val Leu Asp Gly Pro Asn Lys Asn Leu 225 230 235 240 Phe Ala Lys Leu Asp Glu His Ala Arg Asn Ala Ala Pro Asp Gly Gly 245 250 255 Tyr Asn Glu Thr Thr Trp Pro Val Ile Arg Tyr Ala Ala Glu 260 265 270 <210> 23 <211> 420 <212> PRT <213> Nonomuria <400> 23 Met Ala His Arg Leu Arg Arg Leu Thr Thr Ala Phe Arg Ser Val Arg 1 5 10 15 Leu Arg Leu Thr Leu Val Tyr Gly Ala Leu Phe Ala Ala Ser Gly Val 20 25 30 Val Leu Leu Ala Ile Thr Tyr Leu Leu Phe Arg Gly Ser Arg Pro Phe 35 40 45 Val Leu Val Asp Gly Asp Pro Gly Gly Arg Phe Arg Ala Phe Ala Arg 50 55 60 Gln Gln Gln Ala Ala Ile Leu Glu Asn Leu Leu Phe Gln Ser Leu Ile 65 70 75 80 Ala Leu Ala Leu Met Thr Val Ile Ser Phe Leu Leu Gly Trp Leu Val 85 90 95 Ala Gly Arg Met Leu Arg Pro Leu Arg Thr Met Asn Thr Thr Leu Lys 100 105 110 Arg Ile Ser Ala Arg Asn Val His Glu Arg Leu Ala Leu Pro Gly Pro 115 120 125 Arg Asp Glu Leu Arg Asn Leu Ala Asp Thr Val Asp Glu Leu Leu Glu 130 135 140 Arg Leu His Ser Ala Leu Asp Ala Gln Lys Arg Phe Val Ala Asn Ala 145 150 155 160 Ala His Glu Leu Arg Thr Pro Leu Thr Leu Glu His Ala Leu Leu Glu 165 170 175 Glu Ser Leu Leu His Arg Asp Ala Asp Thr Pro Ser Met Arg Ser Ile 180 185 190 Met Glu Arg Leu Leu Asp Leu Ser Arg Gln Gln Gly Arg Leu Leu Glu 195 200 205 Ser Leu Leu Thr Leu Ala Lys Ser Glu Gly Gly Leu Asp His Arg Glu 210 215 220 Pro Leu Asp Leu Ala Glu Ile Ala Glu His Thr Ile Arg Thr Met Glu 225 230 235 240 Gly Thr Gly Pro Gly Ala Asp Gly Asn Asn Pro Arg Ala Gly Val Ser 245 250 255 Ala Asp Arg Arg Ala Asp Gly Asn Ser Pro Thr Ala Gly Ala Ala Thr 260 265 270 Asp Ser Trp Ala Asp Gly Lys Ser Leu Arg Ala Gly Cys Pro His Pro 275 280 285 Arg Leu Val Thr Gly Ile Ala His Ala Pro Thr Thr Gly Asp Pro Ala 290 295 300 Leu Val Glu Arg Leu Ile Thr Asn Leu Leu Asp Asn Ala Met Arg Tyr 305 310 315 320 Asn Val Pro Gly Gly Gln Val Glu Leu Ser Thr Arg Ala Glu Ala Gly 325 330 335 Lys Ala Val Val Ser Ile Ala Asn Thr Gly Pro Val Val Pro Pro Glu 340 345 350 Gln Val His Arg Leu Phe Glu Pro Phe Gln Arg Leu Asp Arg Thr Arg 355 360 365 Ala Asp Asp His His Gly Leu Gly Leu Ser Ile Val Arg Ala Ile Ala 370 375 380 Val Ala His Asp Ala Thr Leu Thr Ala His Ala Arg Pro Gln Gly Gly 385 390 395 400 Leu Ser Val Glu Ile His Phe Pro Leu Met Arg Arg Ala Leu Arg Arg 405 410 415 Leu Ala Pro Ser 420 <210> 24 <211> 709 <212> PRT <213> Nonomuria <400> 24 Met Ser Leu Pro Thr Cys Ala Cys Gly Leu Thr Pro His Ala Pro Ser 1 5 10 15 Cys Ala Pro Arg Ser Glu His Ala Gly Gly Arg Ser Ser Glu Ser Arg 20 25 30 Thr Asp Ile Gln Gly Leu Arg Ala Ile Ala Val Ala Ala Val Val Ala 35 40 45 Phe His Leu Trp Pro Gly Gly Pro Thr Gly Gly Tyr Val Gly Val Asp 50 55 60 Val Phe Phe Val Ile Ser Gly Tyr Leu Ile Thr Ser His Leu Leu Arg 65 70 75 80 Gln Pro Gly His Gly Gly Gly Arg Leu Leu Asp Phe Trp Ala Arg Arg 85 90 95 Val Arg Arg Leu Ile Pro Ala Ala Ser Leu Ala Leu Leu Val Thr Leu 100 105 110 Ala Ala Ser Val Val Trp Leu Pro Leu Thr Val Leu Gly Thr Ala Ala 115 120 125 Arg Glu Val Ile Ala Ala Thr Val Tyr Val Glu Asn Leu Arg Leu Ala 130 135 140 Leu Thr Gln Ala Asn Tyr Leu Asp Val Asp Gln Pro Asp Trp Pro Ala 145 150 155 160 Gln His Tyr Trp Ser Leu Ser Ile Glu Glu Gln Phe Tyr Leu Gly Trp 165 170 175 Pro Leu Leu Leu Gly Ser Ala Ala Trp Leu Ala Ala Arg Val Ala Arg 180 185 190 Gly Arg Arg Pro Pro Glu Asn Phe Thr Arg Trp Ser Ala Val Val Val 195 200 205 Thr Gly Ala Val Val Ala Ala Ser Leu Ala Trp Ser Val Gln Lys Thr 210 215 220 Ala Thr Asp Pro Ala Ala Ala Tyr Phe Val Ser Thr Thr Arg Phe Trp 225 230 235 240 Glu Leu Ala Leu Gly Gly Leu Leu Ala Ala Val Leu Thr Val Arg Ala 245 250 255 Met Pro Arg Ala Arg Ala Val Arg Ala Gly Leu Ala Trp Ala Gly Leu 260 265 270 Gly Met Ile Gly Trp Ala Val Val Arg Phe Asp Ala Glu Thr Ala Phe 275 280 285 Pro Gly Ala Ala Ala Leu Val Pro Thr Val Gly Ala Cys Leu Val Ile 290 295 300 Ala Ala Ala Ala Asp Gly Leu Arg Gly Gly Pro Gly Arg Ala Leu Ala 305 310 315 320 Trp Arg Pro Val Gln Trp Leu Gly Asn Ala Ser Tyr Ala Val Tyr Leu 325 330 335 Trp His Trp Pro Pro Ile Met Ile Leu Pro Tyr Ala Leu Gly Arg Ser 340 345 350 Leu Thr Val Ile Glu Ser Val Gly Val Ile Ala Leu Thr Leu Val Leu 355 360 365 Ala Ala Leu Ser Gln Tyr Leu Val Glu Asp Arg Leu Arg Trp His Pro 370 375 380 Val Leu Val Arg Ser Arg Arg Leu Thr Phe Ala Met Leu Ala Ser Cys 385 390 395 400 Val Val Val Val Ala Gly Ala Gly Ala Gly Val Val Ala Tyr Ala Asp 405 410 415 Ala Ala Glu Arg Thr Glu Ser Ala Ala Phe Glu Ala Ala Ala Ser Arg 420 425 430 Ala Gly Ser Cys Leu Gly Ala Gly Val Val Arg Asp Pro Ala Cys Gln 435 440 445 Asp Leu Gly Leu Leu Met Pro Pro Gln Val Ala Leu Lys Asp Lys Pro 450 455 460 Ala Val Tyr Ala Asp Gly Cys Val Asn Lys Glu Pro Phe Ile Ala Arg 465 470 475 480 Asn Thr Cys Thr Tyr Gly Pro Asp Ala Ala Gly Arg Arg Ile Ala Leu 485 490 495 Val Gly Asn Ser His Ala Gly His Trp Val Pro Ala Leu Glu Lys Ala 500 505 510 Leu Trp Ser Glu Arg Trp Gln Leu Thr Thr Tyr Val Gln Leu Ala Cys 515 520 525 Tyr Thr Val Asp Gln Pro Leu Val Leu Glu Gly Ala Gly Val Ser Glu 530 535 540 Asn Cys Gln Lys Ile Asn Lys Trp Ala Val Gly Ser Ile Val Asn Gly 545 550 555 560 Gly Tyr Asp Leu Val Ile Met Ser Asn Arg Thr His Val Pro Leu Ala 565 570 575 Gly Val Ser Pro Ala Gly Gln Gln Ala Ala Ala Glu Arg Ala Tyr Arg 580 585 590 Asp Thr Leu Arg Ala Phe Thr Gly Ala Gly Leu Pro Val Leu Val Leu 595 600 605 Arg Asp Thr Pro Ala Met Pro Asp Ser Val Pro His Cys Ile Ala Lys 610 615 620 His Pro Asp Asp Leu Asp Ser Cys Gly Gly Pro Ala Gly Val Val Leu 625 630 635 640 Arg Pro Asp Pro Leu Ala Ala Ala Ala Arg Ala Asp Asp Thr Gly Leu 645 650 655 Val Ser Val Ala Ser Val Asp His Leu Val Cys Gly Glu Arg Cys Gly 660 665 670 Pro Val Ile Gly Gly Leu Ile Ala Tyr Ser Asp Arg Ser His Leu Thr 675 680 685 Thr Thr Phe Ala Arg Thr Leu Ala Pro Glu Val Thr Ala Ala Val Arg 690 695 700 Gly Ala Leu Thr Arg 705 <210> 25 <211> 648 <212> PRT <213> Nonomuria <400> 25 Met Ala Ile Val Ser Pro Phe Gly Gly Leu Leu Lys Gly Asp Gly Glu 1 5 10 15 Asp Asp Pro Ala Pro Ser Arg Ile Arg Pro Gly Thr Leu Arg Arg Val 20 25 30 Leu Gly Tyr Phe Arg Pro His Val Gly Lys Val Ala Leu Phe Val Leu 35 40 45 Val Thr Ala Leu Asp Ser Ile Phe Val Val Ala Ser Pro Leu Met Leu 50 55 60 Lys Asp Leu Val Asp Lys Gly Val Leu Gly Asn Asp Leu Glu Leu Val 65 70 75 80 Ile Leu Leu Ala Cys Leu Ala Ala Gly Phe Ala Val Met Ser Thr Leu 85 90 95 Leu Gln Leu Val Ser Ala Tyr Ile Ser Gly Arg Ile Gly Gln Gly Val 100 105 110 Ser Tyr Asp Leu Arg Val Gln Ala Leu Asp His Val Gln Arg Leu Pro 115 120 125 Ile Ala Phe Phe Thr Arg Thr Gln Thr Gly Val Leu Val Gly Arg Leu 130 135 140 His Thr Glu Leu Val Met Thr Gln Met Ala Phe Thr Gln Met Leu Thr 145 150 155 160 Ala Ala Ala Ser Ala Val Thr Val Leu Leu Val Leu Ala Glu Leu Phe 165 170 175 Tyr Leu Ser Trp Ile Val Ala Leu Leu Thr Leu Val Leu Ile Pro Val 180 185 190 Phe Leu Val Pro Trp Ser Tyr Val Gly Arg Arg Met Gln Arg Tyr Thr 195 200 205 Arg Gly Leu Met Glu Glu Asn Ala Gly Leu Ala Gly Leu Leu Gln Glu 210 215 220 Arg Phe Asn Val Gln Gly Ala Met Leu Ser Lys Leu Phe Gly Arg Pro 225 230 235 240 Ala Glu Glu Met Ala Glu Tyr Glu Ser Arg Ala Gly Arg Ile Arg Gly 245 250 255 Leu Ala Val Ser Val Thr Leu Tyr Gly Arg Met Ala Pro Ala Ile Phe 260 265 270 Ala Leu Met Ala Ala Leu Ala Thr Ala Leu Val Tyr Gly Val Gly Gly 275 280 285 Gly Leu Val Leu Ser Gln Ala Phe Gln Leu Gly Thr Leu Val Ala Leu 290 295 300 Ala Thr Leu Leu Gly Arg Leu Phe Gly Pro Ile Thr Gln Leu Ala Ser 305 310 315 320 Ile Gln Glu Asn Ala Leu Thr Val Leu Val Ser Phe Glu Arg Ile Phe 325 330 335 Glu Leu Leu Asp Leu Lys Pro Leu Ile Glu Glu Arg Pro Asp Ala Val 340 345 350 Ala Leu Lys Ala Gly Lys Ala Ser Asp Val Gln Phe Glu Asn Val Ser 355 360 365 Phe Arg Tyr Pro Ser Ala Asp Glu Val Ser Leu Pro Ser Leu Glu Gln 370 375 380 Asn Val Arg Thr Gly Gln Glu Arg Gly Glu Ala Thr Pro Glu Val Leu 385 390 395 400 Arg Asp Val Ser Leu His Val Pro Ala Gly Thr Leu Thr Ala Leu Val 405 410 415 Gly Pro Ser Gly Ala Gly Lys Ser Thr Leu Thr His Leu Val Ser Arg 420 425 430 Leu Tyr Asp Pro Thr Ser Gly Thr Val Arg Val Gly Gly His Asp Leu 435 440 445 Arg Asp Leu Thr Phe Asp Ser Leu Arg Glu Thr Val Gly Val Val Ser 450 455 460 Gln Asp Thr Tyr Leu Phe His Asp Thr Ile Arg Ala Asn Leu Leu Tyr 465 470 475 480 Ala Arg Pro Asp Ala Thr Glu Asp Glu Leu Val Glu Ala Cys Arg Gly 485 490 495 Ala Gln Ile Trp Asp Leu Ile Ala Ser Leu Pro Arg Gly Leu Asp Thr 500 505 510 Val Val Gly Asp Arg Gly Tyr Arg Leu Ser Gly Gly Glu Lys Gln Arg 515 520 525 Leu Ala Ile Ala Arg Leu Leu Leu Lys Ala Pro Ser Val Val Val Leu 530 535 540 Asp Glu Ala Thr Ala His Leu Asp Ser Glu Ser Glu Ala Ala Val Gln 545 550 555 560 Arg Ala Leu Thr Thr Ala Leu Arg Ser Arg Thr Ser Leu Val Ile Ala 565 570 575 His Arg Leu Ser Thr Ile Arg Glu Ala Asp His Ile Leu Val Ile Asp 580 585 590 Asp Gly Arg Val Arg Glu Arg Gly Thr His Glu Glu Leu Leu Ala Glu 595 600 605 Gly Gly Leu Tyr Ala Asp Leu Tyr His Thr Gln Phe Ala Lys Ser Gly 610 615 620 Val Asn Gly Thr Arg Pro Gly Gln Gly Asp Gly Ala Glu Pro Val Gln 625 630 635 640 Glu Val Val Gly Gly Gly Glu Arg 645 <210> 26 <211> 2097 <212> PRT <213> Nonomuria <400> 26 Met Ser Ala Gly Thr Arg Ala Thr Pro Thr Thr Val Leu Asp Leu Phe 1 5 10 15 Ala Arg Gln Val Gly Arg Ala Pro Asp Ala Val Ala Leu Val Asp Gly 20 25 30 Asp Arg Val Leu Thr Tyr Arg Arg Leu Asp Glu Leu Ala Gly Ala Leu 35 40 45 Ser Gly Arg Leu Ile Gly Arg Gly Val Gly Arg Gly Asp Arg Val Ala 50 55 60 Val Met Met Asp Arg Ser Ala Asp Leu Val Val Thr Leu Leu Ala Val 65 70 75 80 Trp Gln Ala Gly Ala Ala Tyr Val Pro Val Asp Ala Ala Leu Pro Ala 85 90 95 Arg Arg Val Ala Phe Met Val Ala Asp Ser Gly Ala Cys Leu Met Val 100 105 110 Cys Ser Glu Ala Thr Arg Asp Ala Val Pro Gln Gly Val Glu Ser Ile 115 120 125 Ala Leu Thr Gly Glu Gly Gly Cys Gly Thr Ser Ala Val Thr Val Asp 130 135 140 Pro Gly Asp Leu Ala Tyr Val Met Tyr Thr Ser Gly Ser Thr Gly Thr 145 150 155 160 Pro Lys Gly Val Ala Val Pro His Arg Ser Val Ala Glu Leu Thr Gly 165 170 175 Asn Pro Gly Trp Gly Val Glu Pro Gly Glu Ala Val Leu Met His Ala 180 185 190 Pro Tyr Thr Phe Asp Ala Ser Leu Phe Glu Ile Trp Val Pro Leu Val 195 200 205 Ser Gly Ala Arg Val Val Ile Ala Ala Pro Gly Ala Val Asp Ala Arg 210 215 220 Arg Leu Arg Glu Ala Val Ala Ala Gly Val Thr Arg Val His Leu Thr 225 230 235 240 Ala Gly Ser Phe Arg Ala Val Ala Glu Glu Ser Pro Glu Ser Phe Ala 245 250 255 His Phe Arg Glu Val Leu Thr Gly Gly Asp Val Val Pro Ala Tyr Ala 260 265 270 Val Gln Lys Val Arg Ala Ala Cys Pro His Val Arg Ile Arg His Leu 275 280 285 Tyr Gly Pro Thr Glu Thr Thr Leu Cys Ala Thr Trp Gln Leu Leu Glu 290 295 300 Pro Gly Asp Val Val Gly Pro Val Leu Pro Ile Gly Arg Pro Leu Pro 305 310 315 320 Gly Arg Arg Ala Trp Val Leu Asp Ala Ser Leu Arg Pro Val Glu Pro 325 330 335 Gly Val Val Gly Asp Leu Tyr Leu Ser Gly Ala Gly Leu Ala Asp Gly 340 345 350 Tyr Leu Asp Arg Ala Gly Leu Thr Ala Glu Arg Phe Val Ala Asp Pro 355 360 365 Ser Ala Ala Gly Arg Arg Met Tyr Arg Thr Gly Asp Leu Ala Gln Trp 370 375 380 Thr Ala Asp Gly Glu Leu Leu Phe Ala Gly Arg Ala Asp Asp Gln Val 385 390 395 400 Lys Val Arg Gly Phe Arg Ile Glu Pro Gly Glu Val Glu Ala Ala Leu 405 410 415 Thr Ala Gln Pro His Val Arg Glu Ala Val Val Val Ala Ile Asp Gly 420 425 430 Arg Leu Ile Gly Tyr Val Val Ala Asp Gly Asp Val Asp Pro Val Leu 435 440 445 Met Arg Arg Arg Leu Ala Ala Ser Leu Pro Glu Tyr Met Ile Pro Ala 450 455 460 Ala Leu Val Thr Leu Asp Ala Leu Pro Leu Thr Gly Ser Gly Lys Val 465 470 475 480 Asp Arg Arg Ala Leu Pro Glu Pro Asp Phe Ala Ser Ala Ala Pro Arg 485 490 495 Arg Glu Pro Gly Thr Glu Pro Glu Arg Val Leu Cys Asp Leu Phe Ala 500 505 510 Glu Leu Leu Gln Pro Glu Gly Arg Gly Val Gly Val Asp Asp Gly Phe 515 520 525 Val Glu Leu Gly Gly Asp Ser Ile Val Ala Ile Arg Leu Ala Ala Arg 530 535 540 Ala Ser Arg Val Gly Leu Leu Val Thr Pro Ala Gln Ile Phe Lys Glu 545 550 555 560 Lys Thr Pro Ala Arg Leu Ala Ala Val Ala Gly Ala Val Pro Ala Gly 565 570 575 Arg Pro Ala Asp Gly Pro Leu Ile Thr Leu Thr Ala Glu Glu Glu Ala 580 585 590 Glu Leu Ala Thr Ala Val Pro Gly Ala Glu Glu Val Trp Pro Leu Ala 595 600 605 Pro Leu Gln Glu Gly Leu Tyr Phe Gln Ala Thr Leu Asp Asp Glu Gly 610 615 620 His Asp Ile Tyr Gln Ala Gln Trp Ile Leu Glu Leu Ala Gly Pro Leu 625 630 635 640 Asp Ala Ala Arg Leu Arg Ala Ser Trp Glu Ala Val Phe Ala Arg His 645 650 655 Pro Glu Leu Arg Val Ser Phe His Arg Arg Ala Ser Gly Thr Met Leu 660 665 670 Gln Val Val Ala Gly His Val Val Leu Pro Trp Arg Glu Val Asp Leu 675 680 685 Ala Asp Ala Gly Asp Ile Asp Ala Ala Val Ala Ala Leu Ile Ser Glu 690 695 700 Glu Gln Glu Gln Arg Phe Asp Leu Ala Lys Ala Pro Leu Phe Arg Leu 705 710 715 720 Val Leu Val Arg His Gly Glu Asp Arg His Arg Leu Leu Val Val His 725 730 735 His His Ile Leu Thr Asp Gly Trp Ser Val Ala Val Ile Leu Asn Glu 740 745 750 Val Ala Glu Ala Tyr Thr Asn Gly Gly Arg Leu Pro Asp Arg Thr Gly 755 760 765 Ala Ala Ser Tyr Arg Asp Tyr Leu Ala Trp Leu Asp Arg Gln Asp Lys 770 775 780 Asp Ala Ala Arg Ala Ala Trp Gln Ala Glu Leu Ser Gly Leu Glu Gly 785 790 795 800 Pro Ala Pro Ile Ala Lys Ala Ala Thr Thr Thr Gly Ala Gly Thr Gly 805 810 815 Tyr Glu Tyr Arg Ile Ala Phe Leu Thr Pro Asp Leu His Thr Arg Leu 820 825 830 Thr Glu Leu Ala Arg Asp His Gly Leu Thr Leu Asn Thr Leu Ala Gln 835 840 845 Gly Ala Trp Ala Met Val Leu Ala Arg Leu Ala Arg Arg Thr Asp Val 850 855 860 Val Phe Gly Thr Thr Val Ala Cys Arg Pro Ala Glu Leu Pro Glu Val 865 870 875 880 Glu Ser Val Pro Gly Leu Met Met Asn Thr Val Pro Val Arg Val Pro 885 890 895 Leu Gln Gly Ala Gln Ser Val Val Asp Leu Leu Thr Gly Leu Gln Glu 900 905 910 Arg Gln Ala Ala Leu Leu Pro His Gln His Leu Gly Leu Thr Glu Ile 915 920 925 Gln Arg Ala Ala Gly Pro Gly Ala Thr Phe Asp Thr Leu Leu Val Phe 930 935 940 Glu Asn Tyr Pro Arg Asp Phe Ala Gly Gln Phe Thr Tyr Leu Gly Thr 945 950 955 960 Ile Glu Gly Thr His Tyr Pro Leu Thr Leu Gly Ile Ile Pro Gly Asp 965 970 975 His Phe Arg Ile Gln Leu Val Tyr Arg Arg Gly Gln Val Gly Glu Ser 980 985 990 Val Ala Glu Ser Ile Leu Gly Trp Phe Thr Gly Ala Leu Met Thr Met 995 1000 1005 Ala Ala Asp Pro His Gly Pro Val Gly Arg Ile Gly Val Gly Glu 1010 1015 1020 Ala Arg Ala Gly Gly Ser Asp Arg Ala Met Ala Ala Gly Glu Pro 1025 1030 1035 Leu Pro Val Leu Leu Arg Arg Val Val Lys Asp Arg Pro Asp Glu 1040 1045 1050 Val Ala Val Val Asp Gly Asp Gly Glu Leu Ser Phe Gly Glu Leu 1055 1060 1065 Trp Glu Arg Ala Thr Ala Leu Ala Ala Glu Leu Arg Ala His Gly 1070 1075 1080 Ile Gly Pro Glu Ser Arg Val Ala Val Met Val Gly Arg Ser Ala 1085 1090 1095 Trp Trp Ala Val Gly Val Leu Gly Val Cys Leu Ala Gly Gly Ala 1100 1105 1110 Phe Met Pro Val Asp Pro Ala Tyr Pro Ala Glu Arg Val Arg Trp 1115 1120 1125 Ile Leu Ala Asp Ser Asp Pro Arg Leu Val Leu Cys Ala Gly Thr 1130 1135 1140 Thr Arg Glu Ala Val Pro Glu Glu Phe Ala Asp Arg Leu Val Val 1145 1150 1155 Val Asp Glu Leu Asp Leu Ala Gly Ser Asp Asp Ala Gly Leu Pro 1160 1165 1170 Arg Val Ser Pro Asp Asp Ala Ala Tyr Val Ile Tyr Thr Ser Gly 1175 1180 1185 Ser Thr Gly Thr Pro Lys Gly Val Val Val Ser His Ala Gly Leu 1190 1195 1200 Gly Asn Leu Ala Met Ala Gln Ile Asp Arg Phe Ala Val Ser Pro 1205 1210 1215 Ser Ser Arg Val Leu Gln Phe Ala Ala Leu Gly Phe Asp Ala Met 1220 1225 1230 Val Ser Glu Met Leu Met Ala Leu Leu Ser Gly Ala Arg Leu Val 1235 1240 1245 Met Ala Pro Glu Pro Ala Leu Pro Pro Arg Val Ser Leu Ala Glu 1250 1255 1260 Ala Leu Arg Arg Trp Glu Val Thr His Val Thr Val Pro Pro Ser 1265 1270 1275 Val Leu Ala Thr Ala Asp Ala Leu Pro Ala Gly Leu Glu Thr Val 1280 1285 1290 Val Val Ala Gly Glu Ala Cys Pro Pro Gly Leu Ala Glu Arg Trp 1295 1300 1305 Ser Ala Gly Arg Arg Leu Val Asn Ala Tyr Gly Pro Thr Glu Ala 1310 1315 1320 Thr Val Cys Ala Ala Met Ser Arg Pro Leu Thr Gly Ser Arg Glu 1325 1330 1335 Val Val Pro Ile Gly Thr Pro Ile Ala Gly Gly Arg Cys Tyr Val 1340 1345 1350 Leu Asp Ala Phe Leu Arg Pro Leu Pro Pro Gly Ile Thr Gly Glu 1355 1360 1365 Leu Tyr Val Ala Gly Ile Gly Leu Ala Arg Gly Tyr Leu Gly Arg 1370 1375 1380 Ala Ser Leu Thr Ala Glu Arg Phe Val Ala Asp Pro Phe Val Ala 1385 1390 1395 Gly Glu Arg Met Tyr Arg Thr Gly Asp Leu Ala Tyr Trp Thr Gly 1400 1405 1410 Glu Gly Glu Leu Val Phe Ala Gly Arg Asp Asp Asp Gln Val Lys 1415 1420 1425 Ile Arg Gly Tyr Arg Val Glu Pro Gly Glu Val Glu Ala Val Leu 1430 1435 1440 Ala Gly Gln Pro Gly Val Asp Gln Ala Val Val Val Ala Arg Glu 1445 1450 1455 Gly Arg Leu Leu Gly Tyr Val Val Ser Gly Gly Gly Val Asp Pro 1460 1465 1470 Val Arg Leu Arg Glu Gly Val Ala Arg Val Leu Pro Glu Tyr Met 1475 1480 1485 Val Pro Ala Ala Val Val Val Leu Gly Ala Val Pro Val Thr Ala 1490 1495 1500 Asn Gly Lys Val Asp Arg Glu Ala Leu Pro Asp Pro Gly Phe Gly 1505 1510 1515 Gly Arg Val Ser Gly Arg Glu Pro Arg Thr Glu Val Glu Arg Ala 1520 1525 1530 Leu Cys Gly Leu Phe Ala Glu Val Leu Gly Leu Pro Gly Val Thr 1535 1540 1545 Ala Val Gly Pro Asp Asp Ser Phe Phe Glu Leu Gly Gly Asp Ser 1550 1555 1560 Ile Thr Ser Met Gln Leu Ala Ser Arg Ala Arg Arg Glu Gly Met 1565 1570 1575 Leu Phe Gly Ala Arg Glu Val Phe Glu Arg Lys Thr Pro Ala Gly 1580 1585 1590 Leu Ala Ala Ile Val Asp Val Gly Gly Glu Leu Ala Ala Gly Pro 1595 1600 1605 Ala Asp Gly Val Gly Glu Ile Ala Trp Thr Pro Ile Met Arg Ala 1610 1615 1620 Leu Gly Asp Gly Ile Val Gly Ser Arg Phe Ala Gln Trp Val Val 1625 1630 1635 Leu Gly Ala Pro Pro Asp Leu Arg Ala Asp Val Val Ala Ala Gly 1640 1645 1650 Leu Ala Ala Val Val Asp Thr His Asp Val Leu Arg Leu Arg Val 1655 1660 1665 Val Asp Asp Arg Ala Gly Arg Arg Leu Ala Val Gly Glu Arg Gly 1670 1675 1680 Ser Val Asp Thr Ala Gly Leu Val Thr Arg Leu Glu Cys Gly Gly 1685 1690 1695 Arg Pro Pro Asp Glu Val Val Glu Arg Ala Val Arg Glu Ala Val 1700 1705 1710 Gly Arg Leu Asp Pro Val Ala Gly Val Met Ala Gln Ala Val Trp 1715 1720 1725 Val Asp Ala Gly Pro Ala Arg Thr Gly Arg Leu Val Val Val Val 1730 1735 1740 His His Leu Ala Val Asp Gly Met Ser Trp Arg Ile Leu Val Pro 1745 1750 1755 Asp Leu Arg Leu Ala Cys Glu Ala Val Ala Glu Gly Arg Asp Pro 1760 1765 1770 Val Leu Glu Pro Val Trp Gly Ser Phe Arg Arg Trp Ala Ala Leu 1775 1780 1785 Leu Glu Glu Ser Ala Leu Ser Arg Glu Arg Val Gly Glu Leu His 1790 1795 1800 Thr Trp Arg Thr Ile Val Asp Gln Glu Asp Arg Pro Val Gly Arg 1805 1810 1815 Arg Arg Leu Ser Ala Gly Asp Ala Ala Gly Gly Val Arg Ser Arg 1820 1825 1830 Ser Trp Val Met Ser Gly Asp Glu Ala Ser Leu Leu Val Gly Lys 1835 1840 1845 Val Pro Val Ala Phe His Cys Gly Val His Glu Val Leu Leu Ala 1850 1855 1860 Gly Leu Ala Gly Ala Val Ala Arg Trp His Gly Asp Asp Gly Val 1865 1870 1875 Leu Val Asp Val Glu Gly His Gly Arg His Pro Ala Glu Gly Met 1880 1885 1890 Asp Leu Ser Arg Thr Val Gly Trp Phe Thr Ser Met His Pro Val 1895 1900 1905 Arg Leu Asp Val Ala Gly Ile Glu Leu Ala Ala Val Pro Ala Gly 1910 1915 1920 Gly Arg Ala Ala Gly Gln Leu Leu Lys Ala Val Lys Glu Gln Ser 1925 1930 1935 Arg Ala Ala Pro Gly Asp Gly Leu Gly Tyr Gly Leu Leu Arg His 1940 1945 1950 Leu Asn Pro Glu Thr Gly Pro Val Leu Ala Ala Leu Pro Ser Pro 1955 1960 1965 Gln Ile Gly Phe Asn Tyr Met Gly Arg Phe Val Thr Val Asp Gln 1970 1975 1980 Gly Gly Ala Arg Pro Trp Gln Pro Val Gly Gly Ile Gly Gly Ser 1985 1990 1995 Leu Asp Pro Gly Met Gly Leu Pro His Ala Leu Glu Val Asn Ala 2000 2005 2010 Ile Val His Asp Arg Leu Ala Gly Pro Glu Leu Val Leu Thr Val 2015 2020 2025 Asp Trp Arg Asp Asp Leu Leu Glu Glu Thr Asp Ile Glu Arg Leu 2030 2035 2040 Cys Gln Val Trp Leu Asp Met Leu Ser Gly Leu Ser Arg Gln Ala 2045 2050 2055 Glu Asp Pro Ser Ala Gly Gly His Thr Ala Ser Asp Phe Ala Leu 2060 2065 2070 Leu Asp Leu Asp Gln Asp Glu Ile Glu Gly Phe Glu Ala Ile Ala 2075 2080 2085 Ala Glu Leu Ser Gly Gly Gln Thr Ser 2090 2095 <210> 27 <211> 1063 <212> PRT <213> Nonomuria <400> 27 Met Asn Thr Pro Ser Thr Pro Ala Gly Ser Ala Leu Glu Glu Val Trp 1 5 10 15 Pro Leu Ser Pro Met Gln Glu Gly Ile Leu Tyr His Ala Ala Leu Asp 20 25 30 Glu Ala Pro Asp Leu Tyr Leu Ile Gln Gln Ser Gln Ile Ile Glu Gly 35 40 45 Pro Leu Asp Thr Glu Arg Phe Arg Leu Ala Trp Glu Ser Leu Leu Asn 50 55 60 Arg His Ala Ala Leu Arg Ala Cys Phe His Arg Arg Lys Ser Gly Glu 65 70 75 80 Ser Val Gln Leu Ile Pro Arg Lys Val Pro Leu Pro Trp Ser Glu Arg 85 90 95 Asp Leu Ser Gly Leu Ser Glu Glu Asp Ala Leu Ala Glu Ala Ser Val 100 105 110 Ile Ala Glu Lys Glu Arg Ala Thr Arg Phe Asp Pro Ala Lys Pro Pro 115 120 125 Leu Leu Arg Gln Val Leu Ile Arg Phe Gly Pro Asp Lys His Cys Leu 130 135 140 Val Thr Thr Ser His His Leu Val Met Asp Gly Trp Ser Arg Ala Ile 145 150 155 160 Leu Glu Ser Glu Leu Leu Glu Leu Tyr Ala Ala Gly Gly Ala Glu Pro 165 170 175 Gly Leu Arg Pro Ala Gly Ser Tyr Arg Asp Tyr Leu Ala Trp Leu Glu 180 185 190 Arg Gln Asp Lys Glu Ala Ala Arg Ala Ala Trp Arg Ala Glu Leu Ala 195 200 205 Gly Ala Asp Arg Ser Thr Leu Gly Ile Pro Glu Ala Ser Arg Lys Thr 210 215 220 Gln Gly Gln Arg Val Arg Glu Val Leu Gly Tyr Ala Pro Asp Phe Thr 225 230 235 240 Ser Ala Leu Val Asp Phe Ala Arg Arg His Gly Leu Thr Leu Asn Thr 245 250 255 Leu Val Gln Gly Ala Trp Ala Leu Val Leu Ala Arg Leu Thr Arg Arg 260 265 270 Arg Asp Val Val Phe Gly Ala Val Val Ser Gly Arg Pro Ala Glu Val 275 280 285 Pro Gly Val Glu Gln Ala Val Gly Leu Phe Ile Asn Thr Val Pro Val 290 295 300 Arg Val Arg Leu Asp Gly Gly Gln Pro Val Ile Gln Leu Leu Thr Glu 305 310 315 320 Leu Gln Glu Arg Gln Ser Thr Leu Ile Ser His Gln His Leu Gly Leu 325 330 335 Gln Glu Ile Gln Lys Leu Ser Gly Val Ser Phe Asp Thr Val Val Ser 340 345 350 Phe Glu Asn Tyr Val Asp Pro Gly Ala Gly Pro Gly Ser Asp Arg Glu 355 360 365 Leu Arg Leu Arg Leu Lys Glu Phe His Gln Ser Ala Pro Tyr Ala Leu 370 375 380 Leu Leu Gly Ile Met Pro Gly Glu Ser Leu Gln Thr Asp Val Glu Tyr 385 390 395 400 Arg Pro Glu Leu Leu Asp Ala Arg Val Ala Lys Glu Ala Leu His Gly 405 410 415 Leu Ala Arg Val Leu Glu Arg Met Ile Ala Glu Pro Glu Thr Ala Val 420 425 430 Gly Arg Leu Asp Val Val Gly Asp Ala Gly Arg Glu Leu Val Val Glu 435 440 445 Arg Trp Asn Glu Thr Gly Asp Ala Ile Gly Ala Pro Ser Ala Val Asp 450 455 460 Leu Phe Arg Arg Gln Val Ala Arg Ala Pro Ala Ala Thr Ala Val Thr 465 470 475 480 Ala Gly Asp Leu Ala Trp Ser Tyr Ala Glu Leu Asp Glu Arg Ser Gly 485 490 495 Arg Leu Ala Arg Ala Leu Thr Glu Arg Gly Val Arg Arg Gly Asp Arg 500 505 510 Val Gly Val Val Leu Gly Arg Ser Ala Glu Val Leu Ala Ala Trp Leu 515 520 525 Gly Val Trp Lys Ala Gly Ala Ala Phe Val Pro Val Asp Pro Asp Tyr 530 535 540 Pro Ala Asp Arg Val Ala Phe Met Leu Ala Asp Ser Ala Val Ala Met 545 550 555 560 Val Val Cys Gln Glu Ala Thr Ser Gly Val Val Pro Pro Gly Tyr Gln 565 570 575 Gln Leu Leu Val Asn Asp Ala Asp Asp Gly Glu Ala Ala Leu Val Pro 580 585 590 Ile Gly Ala Asp Asp Leu Ala Tyr Val Met Tyr Thr Ser Gly Ser Thr 595 600 605 Gly Thr Pro Lys Gly Val Ala Ile Pro His Gly Gly Val Ala Ala Leu 610 615 620 Ala Gly Asp Pro Gly Trp Gly Val Gly Pro Gly Asp Ala Val Leu Met 625 630 635 640 His Ala Pro His Thr Phe Asp Ala Ser Leu Tyr Asp Val Trp Val Pro 645 650 655 Leu Val Ser Gly Ala Arg Val Met Ile Thr Glu Pro Gly Val Val Asp 660 665 670 Ala Glu Arg Leu Ala Gly His Val Ala Asp Gly Leu Thr Ala Val Asn 675 680 685 Phe Thr Ala Gly His Phe Arg Ala Leu Ala Gln Glu Ser Pro Glu Ser 690 695 700 Phe Ser Gly Leu Arg Glu Val Ala Ala Gly Gly Asp Val Val Pro Leu 705 710 715 720 Asp Val Val Glu Arg Val Arg Arg Ala Cys Pro Arg Leu Arg Val Trp 725 730 735 His Thr Tyr Gly Pro Thr Glu Thr Thr Leu Cys Ala Thr Trp Lys Ala 740 745 750 Ile Glu Pro Gly Asp Glu Val Gly Pro Val Leu Pro Ile Gly Arg Ala 755 760 765 Leu Pro Gly Arg Arg Leu Tyr Val Leu Asp Ala Phe Leu Arg Pro Leu 770 775 780 Pro Pro Gly Ile Ala Gly Asp Leu Tyr Leu Ala Gly Ala Gly Val Ala 785 790 795 800 His Gly Tyr Leu Gly Arg Ala Ser Leu Thr Ala Glu Arg Phe Val Ala 805 810 815 Asp Pro Phe Val Ala Gly Glu Arg Met Tyr Arg Thr Gly Asp Leu Ala 820 825 830 Tyr Trp Thr Gly Glu Gly Glu Leu Val Phe Ala Gly Arg Asp Asp Asp 835 840 845 Gln Val Lys Ile Arg Gly Tyr Arg Val Glu Pro Gly Glu Val Glu Ala 850 855 860 Val Leu Ala Gly Gln Pro Gly Val Asp Gln Ala Val Val Val Ala Arg 865 870 875 880 Glu Gly Arg Leu Leu Gly Tyr Val Val Ser Gly Gly Gly Val Asp Pro 885 890 895 Val Arg Leu Arg Glu Gly Val Ala Arg Val Leu Pro Glu Tyr Met Val 900 905 910 Pro Ala Ala Val Val Val Leu Gly Ala Val Pro Val Thr Ala Asn Gly 915 920 925 Lys Val Asp Arg Glu Ala Leu Pro Asp Pro Gly Phe Gly Gly Arg Val 930 935 940 Ser Gly Arg Glu Pro Arg Thr Glu Val Glu Arg Ala Leu Cys Gly Leu 945 950 955 960 Phe Ala Glu Val Leu Gly Leu Pro Gly Val Thr Ala Val Gly Pro Asp 965 970 975 Asp Ser Phe Phe Glu Leu Gly Gly Asp Ser Ile His Ser Val Lys Leu 980 985 990 Ala Ala Arg Ala Thr Arg Ala Gly Met Pro Phe Thr Val Val Glu Val 995 1000 1005 Phe Glu His Lys Thr Pro Ala Gly Leu Ala Thr Ile Val Asp Val 1010 1015 1020 Gly Gly Glu Pro Ala Ala Gly Pro Ala Asp Pro Pro Ser Asp Ser 1025 1030 1035 Asp Leu Leu Gly Leu Ala Gln Asp Glu Ile Ala Glu Phe Glu Ala 1040 1045 1050 Glu Phe Asp Asp Glu Arg His Ser Leu Arg 1055 1060 <210> 28 <211> 277 <212> PRT <213> Nonomuria <400> 28 Met Ile Ser Lys Ala Met His Gly Pro Ile Arg Pro Ala Arg Ala Asp 1 5 10 15 Thr Leu Leu Ala Ser Val Gly Glu Arg Gly Ile Leu Cys Asp Phe Tyr 20 25 30 Asp Glu Asn Ala Ser Glu Ile Phe Arg Asp Leu Glu Ala Asp Ala Gly 35 40 45 Gly Thr Glu Glu Ala His Gly Phe Ala Ala Leu Val Arg Pro Glu Ser 50 55 60 Gly Ala Ile Leu Glu Leu Gly Ala Gly Thr Gly Arg Leu Thr Ile Pro 65 70 75 80 Leu Leu Glu Leu Gly Trp Glu Val Thr Ala Leu Glu Leu Ser Thr Ala 85 90 95 Met Leu Thr Thr Leu Arg Thr Arg Leu Ala Asp Ala Pro Ala Asp Leu 100 105 110 Arg Asp Arg Cys Thr Leu Val His Ala Asp Met Thr Ala Phe Lys Leu 115 120 125 Gly Glu Arg Phe Gly Thr Ala Ile Leu Ser Pro Ser Thr Ile Asp Leu 130 135 140 Leu Asp Asp Ala Asp Arg Pro Gly Leu Tyr Ser Ser Val Arg Glu His 145 150 155 160 Leu Arg Pro Gly Gly Arg Phe Leu Leu Gly Met Ala Asn Pro Asp Ala 165 170 175 Ser Gly Arg Gln Glu Pro Leu Glu Arg Thr Gln Glu Phe Thr Gly Arg 180 185 190 Ser Gly Arg Arg Tyr Val Leu His Ala Lys Val Tyr Pro Ser Glu Glu 195 200 205 Ile Arg Asp Val Thr Ile His Pro Ala Asp Glu Ser Ala Asp Pro Phe 210 215 220 Val Ile Cys Val Asn Arg Phe Arg Val Ile Thr Pro Asp Gln Ile Ala 225 230 235 240 Arg Glu Leu Glu Gln Ala Gly Phe Asp Val Val Ala Arg Thr Pro Leu 245 250 255 Pro Gly Val Arg Asn His Glu Leu Val Leu Glu Ala Gln Trp Gly Ser 260 265 270 Val Glu Asp Ala His 275 <210> 29 <211> 531 <212> PRT <213> Nonomuria <400> 29 Met Ser Glu Glu Leu Leu Phe Leu Arg Pro Asp Thr Ile Ile Glu Pro 1 5 10 15 Leu Ala Asn Arg Phe Tyr Ala Ser Met Tyr Ala Thr Ala Pro Val Thr 20 25 30 Ala Ala Met Asn Leu Ala Phe Arg Asn Leu Pro Met Leu Glu Ser Tyr 35 40 45 Leu Ala Ser Pro Glu Trp His Phe Ala Ala Ala Arg Asp Pro Lys Phe 50 55 60 Arg Gly Gly Phe Phe Val Asn Ile Glu Glu Gln Arg Lys Asn Glu Val 65 70 75 80 Glu Ala Leu Leu Ala Ala Ile Arg Arg Asp Ser Ala Asp Val Leu Arg 85 90 95 Phe Ala Glu Ala Ile Ala Glu Ala Glu Lys Ile Ile Arg Glu Glu Ala 100 105 110 Thr Gly Tyr Asp Leu Arg Pro Leu Tyr Pro Lys Leu Pro Pro Glu Leu 115 120 125 Ser Gly Leu Val Glu Ile Ala Tyr Asp Thr Gly Asn Ala Ala Ser Leu 130 135 140 His Phe Leu Glu Pro Leu Ile Tyr Lys Ser Lys Ala Tyr Ala Glu Asp 145 150 155 160 Cys Gln Ser Val Gln Leu Ser Val Glu Thr Gly Ile Glu Arg Pro Phe 165 170 175 Val Met Ser Thr Pro Arg Leu Pro Ser Pro Asp Val Leu Glu Leu Asn 180 185 190 Ile Pro Phe Arg His Pro Gly Leu Glu Glu Leu Phe Leu Ser Arg Ile 195 200 205 Arg Pro Thr Thr Leu Ala Ala Leu Arg Glu Ala Leu Glu Leu Gly Asp 210 215 220 Ala Glu Ala Ala Arg Leu Ala Asp Leu Leu Val Pro Glu Pro Ser Leu 225 230 235 240 Ala Ser Asp Arg His Val Ala Ala Gly Ala Arg Ile Arg Tyr Trp Gly 245 250 255 His Ala Cys Leu Leu Met Gln Thr Pro Asp Val Ala Ile Met Thr Asp 260 265 270 Pro Phe Ile Ser Ala Asp Thr Asp Ala Thr Gly Arg Tyr Thr Tyr Asn 275 280 285 Asp Leu Pro Asp Arg Leu Asp Tyr Val Leu Ile Thr His Gly His Ser 290 295 300 Asp His Leu Val Pro Glu Thr Leu Leu Gln Leu Arg Gly Arg Val Gly 305 310 315 320 Thr Phe Val Val Pro Arg Thr Ser Arg Gly Asn Leu Cys Asp Pro Ser 325 330 335 Leu Ala Leu Tyr Leu Arg Ser Phe Gly Leu Pro Ala Ile Glu Val Asp 340 345 350 Asp Phe Asp Glu Ile Glu Phe Pro Gly Gly Lys Ile Val Ser Thr Pro 355 360 365 Phe Phe Gly Glu His Ala Asp Leu Asp Ile Arg Ala Lys Ser Thr Tyr 370 375 380 Trp Ile Asn Leu Gly Gly Lys Ser Ile Trp Val Gly Ala Asp Ser Ser 385 390 395 400 Gly Leu Asp Pro Val Leu Tyr Arg His Ile Arg Arg His Leu Gly Ala 405 410 415 Val Asn Ile Ala Phe Leu Gly Met Glu Cys Asp Gly Ala Pro Leu Asn 420 425 430 Trp Gln Tyr Gln Pro Phe Ile Thr Lys Ala Leu Pro Lys Lys Met Ser 435 440 445 Asp Ser Arg Lys Met Ser Gly Ser Asn Ala Glu Gln Ala Gly Ala Ile 450 455 460 Val Thr Glu Leu Gly Ala Glu Glu Ala Tyr Ile Tyr Ala Met Gly Glu 465 470 475 480 Glu Ser Trp Leu Gly His Val Met Ala Thr Ser Tyr Asn Glu Asp Ser 485 490 495 Tyr Gln Leu Gln Gln Ile Ala Glu Phe Glu Ala Trp Cys Ser Arg Lys 500 505 510 Gly Val Lys Ala Ala His Leu Leu Asp Gln His Glu Trp His Trp Ser 515 520 525 Ser Ser Arg 530 <210> 30 <211> 523 <212> PRT <213> Nonomuria <400> 30 Met Thr Gly Gly Thr Gly Ala Asp Ala Ala Ser Ala Gly Ala Ser Ser 1 5 10 15 Thr Arg Pro Glu Leu Arg Gly Glu Arg Cys Leu Pro Pro Ala Gly Pro 20 25 30 Val Lys Val Thr Pro Asp Asp Pro Arg Tyr Leu Asn Leu Lys Leu Arg 35 40 45 Gly Ala Asn Ser Arg Phe Asn Gly Glu Pro Asp Tyr Ile His Leu Val 50 55 60 Gly Ser Thr Gln Gln Val Ala Asp Ala Val Glu Glu Thr Val Arg Thr 65 70 75 80 Gly Lys Arg Val Ala Val Arg Ser Gly Gly His Cys Phe Glu Asp Phe 85 90 95 Val Asp Asn Pro Asp Val Lys Val Ile Ile Asp Met Ser Leu Leu Thr 100 105 110 Glu Ile Ala Tyr Asp Pro Ser Met Asn Ala Phe Leu Ile Glu Pro Gly 115 120 125 Asn Thr Leu Ser Glu Val Tyr Glu Lys Leu Tyr Leu Gly Trp Asn Val 130 135 140 Thr Ile Pro Gly Gly Val Cys Gly Gly Val Gly Val Gly Gly His Ile 145 150 155 160 Cys Gly Gly Gly Tyr Gly Pro Leu Ser Arg Gln Phe Gly Ser Val Val 165 170 175 Asp Tyr Leu Tyr Ala Val Glu Val Val Val Val Asn Lys Gln Gly Lys 180 185 190 Ala Arg Val Ile Val Ala Thr Arg Glu Arg Asp Asp Pro His His Asp 195 200 205 Leu Trp Trp Ala His Thr Gly Gly Gly Gly Gly Asn Phe Gly Val Val 210 215 220 Thr Lys Tyr Trp Met Arg Val Pro Glu Asp Val Gly Arg Asn Pro Glu 225 230 235 240 Arg Leu Leu Pro Lys Pro Pro Ala Thr Leu Leu Thr Ser Thr Val Thr 245 250 255 Phe Asp Trp Ala Gly Met Thr Glu Ala Ala Phe Ser Arg Leu Leu Arg 260 265 270 Asn His Gly Glu Trp Tyr Glu Arg Asn Ser Gly Pro Asp Ser Pro Tyr 275 280 285 Thr Gly Leu Trp Ser Gln Leu Met Ile Gly Asn Glu Val Pro Gly Met 290 295 300 Gly Glu Ser Gly Phe Met Met Pro Ile Gln Val Asp Ala Thr Arg Pro 305 310 315 320 Asp Ala Arg Arg Leu Leu Asp Ala His Ile Glu Ala Val Ile Asp Gly 325 330 335 Val Pro Pro Ala Glu Val Pro Glu Pro Ile Glu Gln Arg Trp Leu Ala 340 345 350 Ser Thr Pro Gly Arg Gly Gly Arg Gly Pro Ala Ser Lys Thr Lys Ala 355 360 365 Gly Tyr Leu Arg Lys Arg Leu Thr Asp Arg Gln Ile Gln Ala Val Tyr 370 375 380 Glu Asn Met Thr His Met Asp Gly Ile Asp Tyr Gly Ala Val Trp Leu 385 390 395 400 Ile Gly Tyr Gly Gly Lys Val Asn Thr Val Asp Pro Ala Ala Thr Ala 405 410 415 Leu Pro Gln Arg Asp Ala Ile Leu Lys Val Asn Tyr Ile Thr Gly Trp 420 425 430 Ala Asn Pro Gly Asn Glu Ala Lys His Leu Thr Trp Val Arg Lys Leu 435 440 445 Tyr Ala Asp Val Tyr Ala Glu Thr Gly Gly Val Pro Val Pro Asn Asp 450 455 460 Val Ser Asp Gly Ala Tyr Ile Asn Tyr Pro Asp Ser Asp Leu Ala Asp 465 470 475 480 Pro Gly Leu Asn Thr Ser Gly Val Pro Trp His Asp Leu Tyr Tyr Lys 485 490 495 Gly Asn His Pro Arg Leu Arg Lys Val Lys Ala Ala Tyr Asp Pro Arg 500 505 510 Asn His Phe His His Ala Leu Ser Ile Arg Pro 515 520 <210> 31 <211> 141 <212> PRT <213> Nonomuria <400> 31 Met Thr Ser Thr Ser Gly Arg His Leu Tyr His Arg Gln Val Arg Phe 1 5 10 15 Ser Asp Ile Asp Ala His Gly His Val Asn Asn Val Arg Phe Leu Glu 20 25 30 Tyr Leu Glu Asp Ala Trp Ile Ala Leu Tyr Leu Asp Asn Ala Gly Pro 35 40 45 Pro Gln Glu Asp Arg Asp Gly Leu Pro Ala Val Gly Phe Ala Val Val 50 55 60 Arg His Glu Ile Phe Tyr Arg Arg Pro Leu Arg Phe Arg His Gly Ser 65 70 75 80 Val Arg Val Glu Ser Trp Val Thr Lys Val Asn Arg Val Thr Cys Glu 85 90 95 Met Ala Ala Gln Ile Cys Ser Asp Gly Glu Val Phe Val Glu Ala Arg 100 105 110 Ser Met Ile Met Gly Phe Asp Thr His Thr Ala Lys Pro Arg Arg Leu 115 120 125 Thr Leu His Glu Arg Thr Phe Leu Lys Arg Tyr Leu Arg 130 135 140 <210> 32 <211> 372 <212> PRT <213> Nonomuria <400> 32 Met Gly Val Asp Val Ser Met Thr Thr Ser Ile Ala Ser Ala Glu Asp 1 5 10 15 Leu Ser Val Leu Thr Gly Leu Ser Glu Ile Thr Thr Phe Ala Gly Val 20 25 30 Gly Thr Ala Val Ser Ala Thr Ser Tyr Ser Gln Ala Glu Leu Leu Glu 35 40 45 Ile Leu Asp Ile Arg Asp Pro Arg Ile Arg Ser Leu Phe Leu Asn Ser 50 55 60 Ala Ile Glu Arg Arg Phe Leu Ala Leu Pro Pro Gln Gly Arg Asp Gly 65 70 75 80 Glu Arg Val Ala Glu Pro Gln Gly Asp Leu Leu Asp Lys His Lys Lys 85 90 95 Leu Ala Val Asp Met Gly Cys Arg Ala Leu Glu Ser Cys Leu Lys Ser 100 105 110 Ala Gly Ala Thr Leu Ser Asp Val Arg His Leu Cys Cys Val Thr Ser 115 120 125 Thr Gly Phe Leu Thr Pro Gly Leu Ser Ala Leu Ile Ile Arg Glu Leu 130 135 140 Gly Leu Asp Pro His Cys Ser Arg Ala Asp Ile Val Gly Met Gly Cys 145 150 155 160 Asn Ala Gly Leu Asn Ala Leu Asn Leu Val Ala Gly Trp Ser Ala Ala 165 170 175 His Pro Gly Glu Leu Ala Val Val Leu Cys Ser Glu Ala Cys Ser Ala 180 185 190 Ala Tyr Ala Leu Asp Gly Thr Met Arg Thr Ala Val Val Asn Ser Leu 195 200 205 Phe Gly Asp Gly Ser Ala Ala Leu Ala Val Val Ser Gly Asp Gly Arg 210 215 220 Ala Ala Gly Pro Arg Val Leu Lys Phe Ala Ser Tyr Val Ile Thr Asp 225 230 235 240 Ala Ile Glu Ala Met Arg Tyr Asp Trp Asp Arg Asp Gln Asp Arg Phe 245 250 255 Ser Phe Phe Leu Asp Pro Gln Ile Pro Tyr Val Val Gly Ala His Ala 260 265 270 Glu Ile Val Val Asp Lys Leu Leu Ser Gly Thr Gly Leu Arg Arg Ser 275 280 285 Asp Ile Gly His Trp Leu Val His Ser Gly Gly Lys Lys Val Ile Asp 290 295 300 Ala Ile Val Val Asn Leu Gly Leu Ser Arg His Asp Val Arg His Thr 305 310 315 320 Thr Ala Val Leu Arg Asp Tyr Gly Asn Leu Ser Ser Gly Ser Phe Leu 325 330 335 Phe Ser Tyr Glu Arg Leu Ala Gly Glu Gly Val Thr Arg Pro Gly Asp 340 345 350 Tyr Gly Val Leu Met Thr Met Gly Pro Gly Ser Thr Ile Glu Thr Ala 355 360 365 Leu Ile Gln Trp 370 <210> 33 <211> 213 <212> PRT <213> Nonomuria <400> 33 Met Asn Gly Glu Leu Glu Leu Ser Leu Asp Gly Thr Gln Ala Leu Thr 1 5 10 15 Ala Ser Val Glu Glu Leu Asn Gly Leu Cys Asp Arg Ala Glu Asp His 20 25 30 Arg Ala Pro Gly Pro Val Ile Val His Val Thr Gly Val Pro Arg Leu 35 40 45 Gly Trp Ser Lys Gly Leu Thr Val Gly Leu Val Ser Lys Trp Glu Arg 50 55 60 Val Val Arg Arg Phe Glu Arg Leu Gly Arg Leu Thr Val Ala Val Ala 65 70 75 80 Ser Gly Asp Cys Ala Gly Pro Ser Leu Asp Leu Leu Leu Ala Ala Asp 85 90 95 Val Arg Ile Ala Ala Pro Ala Thr Arg Leu Leu Pro Ser Trp Ala Gly 100 105 110 Gly Ala Ala Trp Pro Gly Met Ala Val Tyr Arg Leu Thr Gln Gln Ala 115 120 125 Gly Thr Gly Gly Ile Arg Arg Ala Val Leu Leu Gly Ala Pro Ile Asp 130 135 140 Ala Asp Arg Ala Leu Ala Leu Asn Leu Ile Asp Glu Val Ser Ala Asp 145 150 155 160 Pro Ala Ala Ser Leu Ala Gly Leu Ala Gly Ala Gly Asp Gly Ala Glu 165 170 175 Leu Ala Ile Arg Arg Gln Leu Met Phe Glu Ala Ser Ser Thr Thr Phe 180 185 190 Glu Asp Ala Leu Gly Ala His Leu Ala Ala Val Asp Arg Ala Leu Arg 195 200 205 Arg Glu Thr Leu Ser 210 <210> 34 <211> 434 <212> PRT <213> Nonomuria <400> 34 Met Thr Thr Asp Trp Pro Ala Leu Pro Pro Arg Ala Pro Leu Ala Leu 1 5 10 15 Trp Thr Leu Thr Ala Glu Ala Gln Arg Val Asp Asp Leu Leu Ala Gly 20 25 30 Leu Pro Glu Pro Pro Ala Arg Thr Ser Ala Gln Arg Asp Ala Ala Ala 35 40 45 Ser Ala Leu Asp Lys Val Arg Arg Met Arg Ala Asp Tyr Met Glu Ala 50 55 60 His Ala Glu Glu Ile Tyr Gly Glu Leu Thr Ser Gly Arg Thr Arg His 65 70 75 80 Leu Arg Ile Asp Glu Leu Val Arg Ala Ala Ala Arg Ala Tyr Pro Gly 85 90 95 Leu Val Pro Thr Asp Glu Gln Met Ala Ala Glu Arg Ala Arg Pro Gln 100 105 110 Ala Glu Lys Glu Gly Arg Glu Ile Asp Gln Gly Ile Phe Leu Arg Gly 115 120 125 Val Leu Arg Ala Pro Lys Ala Gly Pro His Leu Leu Asp Ala Met Leu 130 135 140 Arg Pro Thr Pro Arg Ala Leu Glu Leu Leu Pro Glu Phe Ile Glu Ser 145 150 155 160 Gly Glu Val Arg Met Glu Ala Val Leu Leu Arg Arg Arg Asp Gly Val 165 170 175 Ala Tyr Leu Thr Leu Cys Arg Asp Asp Cys Leu Asn Ala Glu Asp Ala 180 185 190 Gln Gln Val Asp Asp Met Glu Thr Ala Val Asp Leu Ala Leu Leu Asp 195 200 205 Pro Gln Val Arg Val Gly Leu Leu Arg Gly Gly Glu Met Ser His Pro 210 215 220 Arg Tyr Arg Gly Arg Arg Val Phe Cys Ala Gly Val Asn Leu Lys Lys 225 230 235 240 Leu Ser Ser Gly Asp Ile Ser Leu Val Asp Phe Leu Leu Arg Arg Glu 245 250 255 Leu Gly Tyr Ile His Lys Ile Val Arg Gly Val Tyr Thr Asp Gly Ser 260 265 270 Trp His Ser Lys Leu Thr Asp Lys Pro Trp Met Ala Val Val Asp Ser 275 280 285 Phe Ala Ile Gly Gly Gly Ala Gln Leu Leu Leu Val Phe Asp Gln Val 290 295 300 Leu Ala Ala Ser Asp Ser Tyr Ile Ser Leu Pro Ala Ala Thr Glu Gly 305 310 315 320 Ile Ile Pro Gly Val Ala Asn Tyr Arg Leu Thr Arg Phe Thr Gly Pro 325 330 335 Arg Ala Ala Arg Gln Met Ile Leu Gly Gly Arg Arg Ile Arg Ala Asp 340 345 350 Glu Pro Asp Ala Arg Leu Met Ile Asp Glu Val Val Pro Pro Glu Glu 355 360 365 Met Asp Ala Ala Ile Asp Arg Ala Leu Ala Arg Leu Asp Gly Asp Ala 370 375 380 Val Pro Ala Asn Arg Arg Met Leu Asn Leu Ala Glu Glu Pro Pro Glu 385 390 395 400 Ala Phe Gly Arg Tyr Leu Ala Glu Phe Ala Leu Gln Gln Ala Leu Arg 405 410 415 Ile Tyr Gly Arg Asp Val Ile Gly Lys Val Gly Arg Phe Ala Ala Gly 420 425 430 Ser Ala <210> 35 <211> 265 <212> PRT <213> Nonomuria <400> 35 Met Ser Glu Pro Arg Val Arg Tyr Glu Lys Lys Glu His Val Ala His 1 5 10 15 Val Thr Met Asn Arg Pro His Val Leu Asn Ala Met Asp Arg Arg Met 20 25 30 His Glu Glu Leu Ala Glu Ile Trp Asp Asp Val Glu Ala Asp Asp Asp 35 40 45 Val Arg Thr Val Val Leu Thr Gly Ala Gly Thr Arg Ala Phe Ser Val 50 55 60 Gly Gln Asp Leu Lys Glu Arg Ala Leu Leu Asp Glu Ala Gly Thr Gln 65 70 75 80 Ala Ser Thr Phe Gly Ser Arg Gly Gln Ala Gly His Pro Arg Leu Thr 85 90 95 Asp Arg Phe Thr Leu Ser Lys Pro Val Val Ala Arg Val His Gly Tyr 100 105 110 Ala Leu Gly Gly Gly Phe Glu Leu Val Leu Ala Cys Asp Leu Val Ile 115 120 125 Ala Ser Glu Glu Ala Val Phe Gly Leu Pro Glu Val Arg Leu Gly Leu 130 135 140 Ile Pro Gly Ala Gly Gly Val Phe Arg Leu Pro Arg Gln Leu Pro Gln 145 150 155 160 Lys Val Ala Met Gly His Leu Leu Thr Gly Arg Arg Met Asp Ala Ala 165 170 175 Thr Ala Phe Arg Tyr Gly Leu Val Asn Glu Val Val Pro Leu Asp Glu 180 185 190 Leu Asp Arg Cys Val Ala Gly Trp Thr Asp Asp Leu Val Arg Ala Ala 195 200 205 Pro Leu Ser Val Arg Ala Ile Lys Glu Ala Ala Met Arg Ser Leu Asp 210 215 220 Ile Pro Leu Glu Glu Ala Phe Thr Thr Ser Tyr Pro Trp Glu Glu Arg 225 230 235 240 Arg Arg Arg Ser Gly Asp Ala Ile Glu Gly Val Arg Ala Phe Val Glu 245 250 255 Lys Arg Asp Pro Val Trp Thr Ser Arg 260 265 <210> 36 <211> 428 <212> PRT <213> Nonomuria <400> 36 Met Ile Pro Pro His Thr Leu Leu Val Phe Phe Val Gln Ala Ala Ala 1 5 10 15 Leu Leu Leu Leu Ala Leu Leu Leu Gly Arg Leu Ala Val Arg Leu Gly 20 25 30 Leu Ala Ala Val Val Gly Glu Leu Cys Ala Gly Val Ile Leu Gly Pro 35 40 45 Ser Val Leu Gly Gln Val Ala Pro Gly Ala Glu Gln Trp Leu Phe Pro 50 55 60 Ser Pro Ser Ser His Met Leu Asp Ala Val Gly Gln Leu Gly Val Leu 65 70 75 80 Leu Leu Ile Gly Leu Thr Gly Ala His Leu Asp Leu Arg Leu Ile Arg 85 90 95 Arg Gln Gly Ala Thr Ala Val Arg Val Ser Ala Phe Gly Leu Val Val 100 105 110 Pro Met Ala Leu Gly Ile Gly Ala Gly Leu Leu Leu Pro Ala Glu Phe 115 120 125 Arg Gly Thr Gly Gly Ser Ala Val Phe Ala Leu Phe Leu Gly Val Thr 130 135 140 Met Cys Val Ser Ser Ile Pro Val Ile Ala Lys Thr Leu Met Asp Met 145 150 155 160 Asn Leu Leu His Arg Asn Val Gly Gln Leu Thr Leu Thr Ala Gly Met 165 170 175 Ile Asp Asp Ala Phe Gly Trp Val Leu Leu Ser Val Val Thr Ala Met 180 185 190 Ala Thr Ala Gly Ala Gly Ala Gly Thr Val Val Leu Ser Ile Ala Ser 195 200 205 Leu Leu Gly Val Ile Val Phe Ser Val Val Ile Gly Arg Pro Ala Val 210 215 220 Arg Val Ala Leu Arg Thr Thr Glu Asp Gln Gly Val Ile Ala Gly Gln 225 230 235 240 Val Val Val Leu Val Leu Ala Ala Ala Ala Gly Thr His Ala Leu Gly 245 250 255 Leu Glu Pro Ile Phe Gly Ala Phe Val Ala Gly Leu Leu Val Ser Thr 260 265 270 Ala Met Pro Asn Pro Val Arg Leu Ala Pro Leu Arg Thr Val Thr Leu 275 280 285 Gly Val Leu Ala Pro Leu Tyr Phe Ala Thr Met Gly Leu Arg Val Asp 290 295 300 Leu Thr Ala Leu Ala Arg Pro Glu Val Leu Ala Val Gly Leu Leu Val 305 310 315 320 Leu Ala Leu Ala Ile Ile Gly Lys Phe Leu Gly Ala Phe Leu Gly Ala 325 330 335 Trp Thr Ser Arg Leu Ser Arg Trp Glu Ala Leu Ala Leu Gly Ala Gly 340 345 350 Met Asn Ala Arg Gly Val Ile Gln Met Ile Val Ala Thr Val Gly Leu 355 360 365 Arg Leu Gly Val Ile Thr Asp Glu Ile Phe Thr Ile Ile Ile Val Val 370 375 380 Ala Val Ile Thr Ser Leu Leu Ala Pro Pro Leu Leu Arg Leu Ala Met 385 390 395 400 Thr Arg Ile Glu Ala Thr Ala Glu Glu Glu Ala Arg Leu Leu Ala Tyr 405 410 415 Gly Leu Arg Pro Gly Glu Ala Arg Glu Asp Val Arg 420 425 <210> 37 <211> 251 <212> PRT <213> Nonomuria <400> 37 Met Ser Thr Trp Phe Arg Cys Phe Asp Arg Arg Pro Leu Ala Thr Met 1 5 10 15 Arg Leu Ile Cys Phe Pro His Ala Gly Gly Ser Ala Val Phe Tyr Arg 20 25 30 Asn Trp His Arg Leu Ala Ala Pro Glu Ile Glu Val His Ala Val Gln 35 40 45 Tyr Pro Gly Arg Ala Asp Arg Leu His Glu Pro Leu Val Gly Asp Ala 50 55 60 His Arg Leu Ala Glu Ser Val Gly Arg Glu Leu Arg Pro Leu Leu Asp 65 70 75 80 Arg Pro Val Ala Leu Phe Gly His Ser Met Gly Ser Leu Ile Ala Tyr 85 90 95 Glu Thr Ala Arg Leu Leu Thr Gly Ser Gly Ile Pro Pro Ala His Leu 100 105 110 Phe Val Ser Gly Gly Val Ala Ala His Asp Arg Gly Arg Leu Ala His 115 120 125 Arg Val Ala Pro Ala Ser Glu Glu Ala Leu Ile Asp Arg Leu Arg Leu 130 135 140 Leu Gly Gly Thr Asp Ala Glu Ala Leu Ala Ser Ala Glu Phe Arg Ala 145 150 155 160 Phe Ala Leu Pro Tyr Val Arg Asn Asp Phe Gln Leu Val Gln Ser Tyr 165 170 175 Arg His Thr Pro Gly Pro Pro Leu Thr Val Pro Ile Thr Ala Phe Thr 180 185 190 Gly Ala Asp Asp Pro Val Val Arg Leu Asp Ala Val Ala Arg Trp Ala 195 200 205 Glu Leu Thr Ala Arg Glu Phe Ser Cys His Val Leu Pro Gly Gly His 210 215 220 Phe Phe Leu Gly His Glu Gln Ala Ala Leu Trp Ala His Leu His Ala 225 230 235 240 Arg Leu Gly Ile Ala Thr Pro Ala His Cys Gly 245 250 <210> 38 <211> 428 <212> PRT <213> Nonomuria <400> 38 Met Asp Ser His Val Leu Ala His Gln Leu Ser Lys Glu Thr Leu His 1 5 10 15 Gly Ser Leu Met Asp Pro Ala Ile Glu Ser Met Asn Leu Leu Asn Glu 20 25 30 Ile Ala Gly Asn Tyr Pro Asp Ala Ile Ser Met Ala Ala Gly Arg Pro 35 40 45 Tyr Glu Glu Phe Phe Asp Val Gly Leu Ile His Asp Tyr Leu Glu Ala 50 55 60 Tyr Arg Asp His Leu Arg Asn Asp Arg Arg Met Asp Asp Ala Gly Ile 65 70 75 80 Ser Arg Met Leu Phe Gln Tyr Gly Thr Thr Lys Gly Ile Ile Ser Asp 85 90 95 Leu Val Ala Arg His Leu Ala Glu Asp Glu Asn Ile Glu Ala Asp Pro 100 105 110 Ala Ser Val Val Ile Thr Val Gly Phe Gln Glu Ala Met Phe Leu Val 115 120 125 Leu Arg Ala Leu Arg Ala Asn Glu Arg Asp Val Leu Leu Ala Pro Thr 130 135 140 Pro Thr Tyr Val Gly Leu Thr Gly Ala Ala Leu Leu Thr Asp Thr Pro 145 150 155 160 Val Trp Pro Val Gln Ser Thr Asp Asn Gly Ile Asp Leu Asp His Leu 165 170 175 Glu His Gln Leu Lys Arg Ala Gln Asp Gln Gly Ala Arg Val Arg Ala 180 185 190 Cys Tyr Val Thr Pro Asn Phe Ala Asn Pro Thr Gly Thr Ser Met Asp 195 200 205 Leu Pro Ala Arg His Arg Leu Leu Glu Val Ala Ala Ala His Gly Ile 210 215 220 Leu Ile Leu Glu Asp Asn Ala Tyr Gly Leu Leu Gly Gln Asp Arg Leu 225 230 235 240 Pro Thr Leu Lys Ser Leu Asp His Ala Ala Thr Val Val Tyr Leu Gly 245 250 255 Ser Phe Ala Lys Thr Gly Met Pro Gly Ala Arg Val Gly Tyr Val Val 260 265 270 Ala Asp Gln His Val Ala Gly Gly Gly Ser Leu Ala Asp Glu Leu Ala 275 280 285 Lys Leu Lys Gly Met Leu Thr Val Asn Thr Ser Pro Ile Ala Gln Ala 290 295 300 Val Ile Ala Gly Lys Leu Leu Arg His Asp Phe Ser Leu Ala Arg Ala 305 310 315 320 Asn Ala Arg Glu Thr Ala Ile Tyr Gln Arg Asn Leu His Leu Thr Leu 325 330 335 Asp Glu Leu Thr Arg Arg Leu Gly Ala Val Pro Gly Val Thr Trp Asn 340 345 350 Ala Pro Thr Gly Gly Phe Phe Ile Thr Val Thr Val Pro Phe Val Val 355 360 365 Asp Asp Glu Leu Leu Glu His Ala Ala Arg Asp His Gly Val Leu Phe 370 375 380 Thr Pro Met His His Phe Tyr Gly Gly Lys Asp Gly Phe Asn Gln Leu 385 390 395 400 Arg Leu Ser Ile Ser Leu Leu Asn Pro Gln Leu Ile Glu Glu Gly Val 405 410 415 Ser Arg Leu Ala Gly Leu Val Thr Ala Cys Leu Pro 420 425 <210> 39 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> PCR primer <400> 39 atgcgcgtgt tgatctcg 18 <210> 40 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> PCR primer <400> 40 cggctgaccg cggcgaac 18 <210> 41 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> PCR primer <400> 41 cgtgggggtg gatgtatcga 20 <210> 42 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> PCR primer <400> 42 tcaccattgg atcagcg 17 <210> 43 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> PCR primer <400> 43 tcaggagacg aaccccgc 18 <210> 44 <211> 18 <212> DNA <213> Artificial sequence <220> <223> PCR primer <400> 44 gtgcacgaaa gtcccgtc 18 <210> 45 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> PCR primer <400> 45 atggactccc acgttctc 18 <210> 46 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> PCR primer <400> 46 tcaggggaga catgcggt 18 <210> 47 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> PCR primer <400> 47 ttttgaattc tcaggcgatc cgtccgtct 29 <210> 48 <211> 31 <212> DNA <213> Artifical Sequence <400> 48 tttttctaga gcccggacac ccgggggctg a 31 <210> 49 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> PCR primer <400> 49 tttttctaga agtcatggtg atgtgcgaca t 31 <210> 50 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> PCR primer <400> 50 ttttaagctt atgttgcagg acgccgaccg 30

Claims (29)

  1. a) A40926의 합성에 필요한 폴리펩티드를 코딩하는 dbv 유전자 클러스터 (서열 1);
    b) dbv 유전자 클러스터 (서열 1)에 의해 코딩되는 것과 동일한 폴리펩티드를 코딩하지만 상기 dbv 유전자 클러스터의 뉴클레오티드 서열은 아닌 뉴클레오티드 서열;
    c) 서열 2 내지 38의 폴리펩티드를 코딩하는 dbv ORF 1 내지 37의 임의의 뉴클레오티드 서열;
    d) dbv ORF 1 내지 37 (서열 2 내지 38) 중 임의의 것에 의해 코딩되는 것과 동일한 폴리펩티드를 코딩하지만 상기 ORF의 뉴클레오티드 서열은 아닌 뉴클레오티드 서열
    로 구성되는 군으로부터 선택되는 뉴클레오티드 서열을 포함하는 단리된 핵산.
  2. 제1항에 있어서,
    e) dbv ORF 3 내지 4, 6 내지 10, 18 내지 20, 22 내지 23, 29 내지 30 및 36 (서열 4 내지 5, 7 내지 11, 19 내지 21, 23 내지 24, 30 내지 31 및 37) 중 임의의 것의 뉴클레오티드 서열;
    f) dbv ORF 3 내지 4, 6 내지 10, 18 내지 20, 22 내지 23, 29 내지 30 및 36 (서열 4 내지 5, 7 내지 11, 19 내지 21, 23 내지 24, 30 내지 31 및 37) 중 임의의 것에 의해 코딩되는 것과 동일한 폴리펩티드를 코딩하지만 상기 ORF의 뉴클레오티드 서열은 아닌 뉴클레오티드 서열;
    g) dbv ORF 3, 6 내지 9, 18 내지 20, 22 내지 23, 29 내지 30 및 36 (서열 4, 7 내지 10, 19 내지 21, 23 내지 24, 30 내지 31 및 37) 중 임의의 것에 의해 코딩되는 폴리펩티드와 아미노산 서열이 80% 이상, 바람직하게는 86% 이상, 더욱 바람직하게는 90% 이상, 가장 바람직하게는 95% 이상 동일한 폴리펩티드를 코딩하는 뉴클레오티드 서열;
    h) dbv ORF 4 및 10 (서열 5 및 11) 중 임의의 것에 의해 코딩되는 폴리펩티드와 아미노산 서열이 87% 이상, 바람직하게는 90% 이상, 더욱 바람직하게는 95% 이상 동일한 폴리펩티드를 코딩하는 뉴클레오티드 서열
    로 구성된 군으로부터 선택되는 뉴클레오티드 서열을 포함하는 단리된 핵산.
  3. 제2항에 있어서, dbv ORF 1, 2, 5 및 37 (서열 2, 3, 6 및 38)로 구성되며 A40926의 4-히드록시-페닐글리신 잔기의 합성에 필요한 폴리펩티드를 코딩하는 뉴클레오티드 서열 또는 이와 동일한 폴리펩티드를 코딩하지만 상기 ORF의 뉴클레오티드 서열은 아닌 뉴클레오티드 서열의 조합을 포함하는 단리된 핵산.
  4. 제2항에 있어서, dbv ORF 30 내지 34 및 37 (서열 31 내지 35 및 38)로 구성되며 A40926의 3,5-디히드록시-페닐글리신 잔기의 합성에 필요한 폴리펩티드를 코딩하는 뉴클레오티드 서열 또는 이와 동일한 폴리펩티드를 코딩하지만 상기 ORF의 뉴클레오티드 서열은 아닌 뉴클레오티드 서열의 조합을 포함하는 단리된 핵산.
  5. 제2항에 있어서, dbv ORF 16, 17, 25, 26 및 36 (서열 17 내지 18, 26 내지 27 및 37)으로 구성되며 A40926의 헵타펩티드 골격의 합성에 필요한 폴리펩티드를 코딩하는 뉴클레오티드 서열 또는 이와 동일한 폴리펩티드를 코딩하지만 상기 ORF의 뉴클레오티드 서열은 아닌 뉴클레오티드 서열의 조합을 포함하는 단리된 핵산.
  6. 제2항에 있어서, dbv ORF 10 (서열 11)으로 구성되며 A40926의 아미노산 3 및 6의 방향족 잔기의 염소화에 필요한 폴리펩티드를 코딩하는 뉴클레오티드 서열 또는 이와 동일한 폴리펩티드를 코딩하지만 상기 ORF의 뉴클레오티드 서열은 아닌 뉴클레오티드 서열의 조합을 포함하는 단리된 핵산.
  7. 제2항에 있어서, dbv ORF 28 (서열 29)로 구성되며 A40926의 아미노산 6의 티로신 잔기의 β-히드록실화에 필요한 폴리펩티드를 코딩하는 뉴클레오티드 서열 또는 이와 동일한 폴리펩티드를 코딩하지만 상기 ORF의 뉴클레오티드 서열은 아닌 뉴클레오티드 서열의 조합을 포함하는 단리된 핵산.
  8. 제2항에 있어서, dbv ORF 11 내지 14 (서열 12 내지 15)로 구성되며 A40926의 위치 2와 4, 4와 6, 1과 3 및 5와 7에 있는 아미노산의 방향족 잔기의 가교결합에 필요한 폴리펩티드를 코딩하는 뉴클레오티드 서열 또는 이와 동일한 폴리펩티드를 코딩하지만 상기 ORF의 뉴클레오티드 서열은 아닌 뉴클레오티드 서열의 조합을 포함하는 단리된 핵산.
  9. 제2항에 있어서, ORF 9, 23 및 29 (서열 10, 24 및 30)로 구성되며 A40926의 N-아실 글루쿠론아민 잔기의 첨가 및 형성에 필요한 폴리펩티드를 코딩하는 뉴클레오티드 서열 또는 이와 동일한 폴리펩티드를 코딩하지만 상기 ORF의 뉴클레오티드 서열은 아닌 뉴클레오티드 서열의 조합을 포함하는 단리된 핵산.
  10. 제2항에 있어서, dbv ORF 20 (서열 21)으로 구성되며 A40926의 만노실 잔기의 부착에 필요한 폴리펩티드를 코딩하는 뉴클레오티드 서열 또는 이와 동일한 폴리펩티드를 코딩하지만 상기 ORF의 뉴클레오티드 서열은 아닌 뉴클레오티드 서열의 조합을 포함하는 단리된 핵산.
  11. 제2항에 있어서, dbv ORF 27 (서열 28)로 구성되며 A40926의 N-메틸화에 필요한 폴리펩티드를 코딩하는 뉴클레오티드 서열 또는 이와 동일한 폴리펩티드를 코딩하지만 상기 ORF의 뉴클레오티드 서열은 아닌 뉴클레오티드 서열의 조합을 포함하는 단리된 핵산.
  12. 제2항에 있어서, dbv ORF 7, 18, 19, 24 및 35 (서열 8, 19 내지 20, 25 및 36)로 구성되며 A40926 또는 그의 전구체 일부를 세포질 외부로 외수송하고 생산 균주에게 A40926에 대한 내성을 부여하는데 필요한 폴리펩티드를 코딩하는 뉴클레오티드 서열 또는 이와 동일한 폴리펩티드를 코딩하지만 상기 ORF의 뉴클레오티드 서열은 아닌 뉴클레오티드 서열의 조합을 포함하는 단리된 핵산.
  13. 제2항에 있어서, dbv ORF 3, 4, 6 및 22 (서열 4, 5, 7 및 23)로 구성되는 dbv 유전자 클러스터의 하나 이상의 유전자의 발현을 조절하는데 필요한 폴리펩티드를 코딩하는 뉴클레오티드 서열 또는 이와 동일한 폴리펩티드를 코딩하지만 상기 ORF의 뉴클레오티드 서열은 아닌 뉴클레오티드 서열의 조합을 포함하는 단리된 핵산.
  14. 제1항에 있어서, A40926의 합성에 필요한 폴리펩티드를 코딩하는 dbv 유전자 클러스터로 구성되는 뉴클레오티드 서열을 포함하며, 만노실 잔기의 부착에 필요한 폴리펩티드를 코딩하는 뉴클레오티드 서열에 인프레임 결실(in frame deletion)이 도입된 단리된 핵산.
  15. 제1항에 있어서, dbv ORF 1 내지 37 (서열 2 내지 38)의 뉴클레오티드 서열 또는 상기 dbv ORF에 의해 코딩되는 것과 동일한 폴리펩티드를 코딩하지만 상기 dbv ORF의 뉴클레오티드 서열은 아닌 뉴클레오티드 서열 중 하나 이상의 여분 카피(extra copy)를 1개 이상 담지하는 뉴클레오티드 서열을 포함하는 단리된 핵산.
  16. 제1항 내지 제15항 중 어느 한 항에 있어서, 뉴클레오티드 서열이 DNA 서열인 단리된 핵산.
  17. 제1항 내지 제15항 중 어느 한 항에서 정의된 DNA 서열을 포함하는 재조합 DNA 벡터.
  18. 제17항에 있어서, ESAC 벡터인 재조합 벡터.
  19. 제17항 또는 제18항의 벡터로 형질전환된 숙주 세포.
  20. 제19항에 있어서, 목 악티노마이세탈레스(Actinomycetales), 바람직하게는 과 스트렙토스포란기아세아에(Streptosporangiaceae), 마이크로모노스포라세아에(Micromonosporaceae), 슈도노카르디아세아에(Pseudonocardiaceae) 또는 스트렙토마이세타세아에(Streptomycetaceae), 더욱 바람직하게는 노노무레아에(Nonomureae), 악티노플라네스(Actinoplanes), 아미콜라토프시스(Amycolatopsis), 스트렙토마이세스(Streptomyces) 등에 속하는 형질전환된 숙주 세포.
  21. a) 생합성 경로를 이용하여 A40926 또는 A40926 전구체를 생산하는 미생물을 상기 경로에서의 속도 제한 활성의 발현을 코딩하는 제17항의 재조합 DNA 벡터로 형질전환하는 단계 및
    b) 상기 벡터로 형질전환된 상기 미생물을 세포 성장, 상기 유전자의 발현 및 상기 항생제 또는 항생제 전구체의 생산에 적합한 조건하에 배양하는 단계
    를 포함하는, 생합성 경로를 이용하여 A40926 또는 그의 전구체를 생산할 수 있는 미생물에 의한 A40926의 생산을 증가시키는 방법.
  22. A40926 또는 그의 전구체 또는 유도체를 생산하며 게놈 내의 A40926 생합성 유전자가 제15항에 따른 뉴클레오티드 서열의 삽입에 의해 변형된 형질전환된 미생물.
  23. 제22항의 형질전환된 A40926-생산 미생물을 배양하는 단계를 포함하는, A40926 또는 그의 전구체 또는 유도체의 생산 방법.
  24. 게놈 내에 A40926 생합성 유전자를 가지며 dbv ORF 1 내지 37 (서열 2 내지 38)로부터 선택되는 A40926 생합성 유전자들 중 하나 이상이 파괴된 형질전환된 A40926-생산 미생물.
  25. 제24항에 있어서, 파괴된 생합성 유전자가 만노실 잔기의 부착에 관여하는 유전자인 형질전환된 미생물.
  26. 제24항의 형질전환된 A40926-생산 미생물을 포함하는 A40926 전구체 또는 유도체의 생산 방법.
  27. a) (i) 생합성 경로를 이용하여 A40926 또는 그의 전구체와는 상이한 글리코펩티드 또는 글리코펩티드 전구체를 생산하는 미생물을 재조합 DNA 벡터로 형질전환하는 단계로서, 여기서 상기 벡터 또는 그의 일부는 상기 글리코펩티드 또는 글리코펩티드 전구체를 변형시키는 하나 이상의 폴리펩티드(들)의 발현을 코딩하는 제1항 내지 제13항 중 어느 한 항의 하나 이상의 뉴클레오티드 서열(들)을 포함하고,
    (ii) 상기 벡터로 형질전환된 상기 미생물을 세포 성장, 상기 유전자의 발현 및 상기 항생제 또는 항생제 전구체의 생산에 적합한 조건하에 배양하는 단계
    또는
    b) (i) 글리코펩티드 또는 글리코펩티드 전구체를 생산하지 않으며 도입된 뉴클레오티드 서열(들)을 효율적으로 발현할 수 있는 미생물 중에서 선택된 미생물을, 글리코펩티드 또는 글리코펩티드 전구체를 변형시키는 하나 이상의 폴리펩티드(들) (활성 폴리펩티드(들))을 코딩하는 제1항 내지 제13항 중 어느 한 항의 하나 이상의 뉴클레오티드 서열(들)을 포함하는 재조합 DNA 벡터로 형질전환하는 단계;
    (ii) 적어도 상기 활성 폴리펩티드(들)을 함유하는 상기 미생물의 세포 추출물 또는 세포 분획물을 활성 폴리펩티드(들)의 존재에 적합한 조건하에서 제조하는 단계 및
    (iii) 글리코펩티드 또는 글리코펩티드 전구체를 상기 세포 추출물 또는 세포 분획물에 첨가하고, 상기 혼합물을 상기 활성 폴리펩티드(들)이 상기 글리코펩티드 또는 글리코펩티드 전구체를 변형시킬 수 있는 조건하에서 인큐베이션하는 단계
    를 포함하는, A40926 또는 그의 전구체와는 상이한 글리코펩티드의 생산 방법.
  28. a) dbv ORF 1 내지 37 (서열 2 내지 38) 중 임의의 것에 의해 코딩되는 ORF 폴리펩티드, 또는 dbv ORF 1 내지 37 (서열 2 내지 38) 중 임의의 것, 바람직하게는 dbv ORF 3 내지 4, 6 내지 10, 18 내지 20, 22 내지 23, 29 내지 30 (서열 4 내지 5, 7 내지 11, 19 내지 21, 23 내지 24, 30 내지 31 및 37) 중 임의의 것에 의해 코딩되는 ORF 폴리펩티드와 아미노산 서열이 동일한 폴리펩티드;
    b) dbv ORF 3, 6 내지 9, 18 내지 20, 22 내지 23, 29 내지 30 및 36 (서열 4, 7 내지 10, 19 내지 21, 23 내지 24, 30 내지 31 및 37) 중 임의의 것에 의해 코딩되는 폴리펩티드와 아미노산 서열이 80% 이상, 바람직하게는 86% 이상, 더욱 바람직하게는 90% 이상, 가장 바람직하게는 95% 이상 동일한 폴리펩티드 및
    c) dbv ORF 4 및 10 (서열 5 및 11) 중 임의의 것에 의해 코딩되는 폴리펩티드와 아미노산 서열이 87% 이상, 바람직하게는 90% 이상, 더욱 바람직하게는 95% 이상 동일한 폴리펩티드
    로부터 선택되는, A40926의 생합성 경로에 관여하는 폴리펩티드 서열을 포함하는 단리된 폴리펩티드.
  29. 제3항 내지 제16항 중 어느 한 항의 핵산 중 임의의 것에 의해 코딩되는 폴리펩티드로부터 선택되는, A40926의 생합성 경로에 관여하는 폴리펩티드를 포함하는 단리된 폴리펩티드.
KR1020057007012A 2002-10-23 2003-10-15 글리코펩티드 항생제 a40926의 생합성을 위한 유전자및 단백질 KR20050050146A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP02023597.4 2002-10-23
EP20020023597 EP1413626A1 (en) 2002-10-23 2002-10-23 Genes and proteins for the biosynthesis of the glycopeptide antibiotic A40926

Publications (1)

Publication Number Publication Date
KR20050050146A true KR20050050146A (ko) 2005-05-27

Family

ID=32050001

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020057007012A KR20050050146A (ko) 2002-10-23 2003-10-15 글리코펩티드 항생제 a40926의 생합성을 위한 유전자및 단백질

Country Status (8)

Country Link
US (1) US20080145892A1 (ko)
EP (2) EP1413626A1 (ko)
JP (1) JP2006516885A (ko)
KR (1) KR20050050146A (ko)
CN (1) CN1732263A (ko)
AU (1) AU2003294693A1 (ko)
CA (1) CA2501393A1 (ko)
WO (1) WO2004038025A2 (ko)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102234675B (zh) * 2010-04-29 2014-08-27 上海医药工业研究院 野野村放线菌发酵生产a40926的发酵培养基以及发酵方法
CN103361345B (zh) * 2013-06-15 2016-05-04 福州大学 重组调控生物元器件强化次级代谢产物生物合成的方法
CN109988224B (zh) * 2014-05-30 2022-12-13 四川大学 具抗菌活性的多肽及其应用
CN105671110B (zh) * 2015-05-05 2019-02-01 重庆乾泰生物医药有限公司 一种生产达巴万星前体a40926的方法
MA46717A (fr) * 2016-10-11 2019-09-11 Bluebird Bio Inc Variantes de l'endonucléase homing tcra
CN107226845B (zh) * 2017-05-31 2020-10-09 成都雅途生物技术有限公司 一种抗多重耐药菌的化合物yt-011及其制备方法
CN109946398B (zh) * 2019-03-28 2022-05-24 丽珠集团新北江制药股份有限公司 一种检测达巴万星及其杂质的方法
CN112430608B (zh) * 2020-12-04 2022-03-25 浙江大学 一种构建奥利万星前体高产工程菌的方法及应用
CN112625925B (zh) * 2021-01-08 2022-04-19 浙江大学 一种达巴万星前体a40926b0高产菌株及应用

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB8425685D0 (en) * 1984-10-11 1984-11-14 Lepetit Spa Antibiotic a 40926 complex
GB8621912D0 (en) * 1986-09-11 1986-10-15 Lepetit Spa Increasing ratio of components of anti-biotic complex
JP2002518045A (ja) 1998-06-23 2002-06-25 バイオサーチ・イタリア・ソチエタ・ペル・アチオニ 天然物を生産する能力を適当な生産宿主中に移す方法

Also Published As

Publication number Publication date
CA2501393A1 (en) 2004-05-06
WO2004038025A2 (en) 2004-05-06
CN1732263A (zh) 2006-02-08
JP2006516885A (ja) 2006-07-13
US20080145892A1 (en) 2008-06-19
WO2004038025A3 (en) 2004-07-29
EP1413626A1 (en) 2004-04-28
EP1578972A2 (en) 2005-09-28
AU2003294693A1 (en) 2004-05-13

Similar Documents

Publication Publication Date Title
KR101573536B1 (ko) 악티노플레인스 가르바디넨시스 및 악티노플레인스리구리애로부터의 란티바이오틱 생합성 유전자 클러스터
AU2008285655B2 (en) Thiopeptide precursor protein, gene encoding it and uses thereof
US20140038297A1 (en) Genes and Proteins for the Biosynthesis of the Lantibiotic 107891
NZ508326A (en) A polyketide synthase and non ribosomal peptide synthase genes, isolated from a myxobacterium, necessary for synthesis of epothiones A and B
KR20100039443A (ko) 답토마이신 생합성 유전자 클러스터에 관련된 조성물 및 방법
KR20050050146A (ko) 글리코펩티드 항생제 a40926의 생합성을 위한 유전자및 단백질
US6825013B2 (en) Isolation of biosynthesis genes for pseudo-oligosaccharides from Streptomyces glaucescens GLA.O, and their use
US20050170411A1 (en) Genes and proteins involved in the biosynthesis of enediyne ring structures
CA2386587C (en) Genes and proteins for the biosynthesis of anthramycin
EP0682706B1 (en) Novel compounds
RU2441915C9 (ru) Гены и белки для биосинтеза лантибиотика 107891
EP1460085A1 (en) Genes and proteins for the biosynthesis of the glycopeptide antibiotic teicoplanin
CA2445692A1 (en) Compositions, methods and systems for the discovery of enediyne natural products
US20040033581A1 (en) Dual condensation/epimerization domain in non-ribosomal peptide synthetase systems
CA2412627A1 (en) Genes and proteins involved in the biosynthesis of lipopeptides

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid