KR20050050146A - 글리코펩티드 항생제 a40926의 생합성을 위한 유전자및 단백질 - Google Patents
글리코펩티드 항생제 a40926의 생합성을 위한 유전자및 단백질 Download PDFInfo
- Publication number
- KR20050050146A KR20050050146A KR1020057007012A KR20057007012A KR20050050146A KR 20050050146 A KR20050050146 A KR 20050050146A KR 1020057007012 A KR1020057007012 A KR 1020057007012A KR 20057007012 A KR20057007012 A KR 20057007012A KR 20050050146 A KR20050050146 A KR 20050050146A
- Authority
- KR
- South Korea
- Prior art keywords
- ala
- leu
- val
- gly
- arg
- Prior art date
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/36—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Actinomyces; from Streptomyces (G)
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/04—Antibacterial agents
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P1/00—Preparation of compounds or compositions, not provided for in groups C12P3/00 - C12P39/00, by using microorganisms or enzymes
- C12P1/06—Preparation of compounds or compositions, not provided for in groups C12P3/00 - C12P39/00, by using microorganisms or enzymes by using actinomycetales
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- General Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Medicinal Chemistry (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Chemical & Material Sciences (AREA)
- Gastroenterology & Hepatology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Microbiology (AREA)
- Communicable Diseases (AREA)
- Pharmacology & Pharmacy (AREA)
- Animal Behavior & Ethology (AREA)
- Oncology (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Mycology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
Abstract
본 발명은 항생제 분야, 더욱 구체적으로는 글리코펩티드 항생제 A40926의 생합성 경로를 코딩하는 핵산 분자의 단리에 관한 것이다. A40926 생산에 관여하는 유전자 산물의 기능이 개시된다. 본 발명은 A40926 생산을 코딩하는 신규 생합성 유전자, 코딩되는 폴리펩티드, 상기 폴리펩티드를 코딩하는 핵산 서열을 포함하는 재조합 벡터, 상기 벡터로 형질전환된 숙주 세포 및 A40926, 그의 전구체, 그의 유도체, 또는 A40926 또는 그의 전구체와는 상이한 변형된 글리코펩티드의 생산 방법을 포함하는, 상기 형질전환된 숙주 세포를 이용하는 글리코펩티드 항생제의 생산 방법을 제공한다.
Description
방선균류는, 대다수가 상업적 용도(예컨대, 항생제)를 가지는, 구조적으로 다양하고 생물학적으로 활성인 이차 대사산물을 생산하는 능력으로 공지되어 있다. 중요한 대사산물은 (가장 상세히 연구된) 스트렙토마이세스(Streptomyces) 종에 의해 생산될 뿐만 아니라, 보다 덜 공지된 방선균 속에 의해서도 생산된다: 예컨대, 리파마이신, 테이코플라닌 및 에리트로마이신은 각기 아미콜라토프시스(Amycolatopsis), 악티노플라네스(Actinoplanes) 및 사카로폴리스포라(Saccharopolyspora) 종에 의해 현재 산업적으로 생산된다. 이차 대사산물의 생합성을 지배하는 유전 요소는 대사산물의 합성, 조절 및 저항을 위해 필요한 모든 유전자를 포함하는 유전자 클러스터에서 조직화된다.
많은 상이한 이차 대사산물은 유사한 효소가 개입되는 통상의 생합성 루트를 공유한다. 이는 폴리케티드 (Katz 및 McDaniel, 1999년), 리보솜에서 합성되지 않은 펩티드 (Marahiel, 1997년) 및 데옥시당 (Rodriguez 등, 2000년)에 대해 철저하게 문서에서 증명되었다. 그러나, 이 유사성에도 불구하고, 소정의 미생물에서 특별한 이차 대사산물의 합성에 관여하는 유전자 클러스터의 조직화는 선험적으로 정의될 수 없다. 사실상, 매우 유사한 이차 대사산물의 합성은, 특히 상응하는 생산자 균주가 동일한 속에 속하지 않을 때, 상이하게 조직화된 클러스트에 의해 지배될 수 있다. 이 종류의 예는 마크롤라이드 항생제들 (Katz 및 McDaniel, 1999년) 중에서 찾아볼 수 있다. 또한, 생산자 균주 내에서의 원하는 클러스트의 동정은 동일한 경로에 대해 효소를 특정하는 다수 클러스트의 발생에 의해 방선균류에서 복잡하다. 이는 폴리케티드 (예컨대, Ruan 등, 1997년) 및 펩티드 (예컨대, Sosio 등, 2000a년)에 대해 나타났고, 게놈 시퀀싱에 의해 확인되었다 (Omura 등, 2001년; Bentley 등, 2002년). 결과적으로, 이미 공지된 것들 대비의 신규 클러스터의 동일성 정도, 조직화 또는 뉴클레오티드 서열은 선험적으로 알 수 없다.
작용 메카니즘으로 인해 달바헵티드(dalbaheptide)로도 알려진 글리코펩티드는 (Parenti 및 Cavalleri, 1989년), 현재 임상적으로 사용되고 있는 반코마이신 및 테이코플라닌과 함께, 세균 세포벽의 가교결합을 간섭하는 한 중요한 계통의 항생제이다. 이는 종종 생명을 위협하는 감염을 치료함에 있어 최후에 선택되어지는 항생제이다. 한편, 장내구균(enterococci) 중에서의 글리코펩티드에 대한 내성 발생 및 이 높은 수준의 내성이 궁극적으로 메티실린-내성 스타필로코쿠스 아우레우스(Staphylococcus aureus)에서 넓게 퍼지게 될 수 있는 우려는 상기 부류의 2차-형성 약물에 대한 연구를 촉진하였다. 향상된 활성, 확장된 항세균 스펙트럼 또는 보다 양호한 약동학적 성질을 갖는 반합성 유도체의 개발로 (Malabarba 및 Ciabatti, 2001년), 유망되는 결과가 얻어졌다.
그러므로, 천연 발생 화합물의 조작에 의해 향상된 글리코펩티드를 수득할 가능성 및 유용성이 있다. 그러나, 글리코펩티드는 구조적으로 복잡한 분자이고, 그의 화학으로의 접근용이성이 분자 내의 수개 위치에 제한된다. 예를 들어, 당이 글리코펩티드로부터 화학적으로 용이하게 제거되어, 상응하는 아글리콘을 생성시킬 수 있는 반면, 화학적 수단에 의한 특별한 위치에의 상이한 당의 위치선택적 부착은 극히 어렵다. 글리코펩티드에서의 염소화 정도가 항생제 활성에 영향을 준다는 것이 나타났다. 유사하게, 글리코펩티드에서의 방향족 환의 화학적 탈염소화가 용이하게 달성될 수 있는 반면, 구조에서 원하는 환의 선택된 할로겐화는 비교적 복잡하다. 한 최종 예로서, 테이코플라닌 부류의 글리코펩티드는 위치 4에 있는 아릴아미노산에 부착된 글루코사민에 연결되어 있는 아실 사슬을 함유하는 반면, 반코마이신 계통의 화합물은 그러하지 않다. 글리코펩티드의 아실화 및 탈아실화는 화학적으로 또는 생물학적 변환기술에 의해 보고되어 왔으나 (Lancini 및 Cavalleri, 1997년), 이는 주로 총체적으로 낮은 수율을 초래한다. 상기 측면에서, 화학적 수단에 의해 생산되는 것이 어렵거나 불가능한 유도체를 수득하기 위해, 글리코펩티드 형성에 있어 상기 단계들을 재지정하는데 유용한 유전자 및 효소를 가지는 것이 바람직할 수 있다. 이는 염소화 정도가 글리코펩티드의 생물학적 활성에 영향을 준다는 것과, 글리코펩티드의 글리코실화 또는 아실화 패턴을 변경시킴으로써 향상된 유도체를 수득할 수 있다는 것으로 나타났기 때문에, 특히 적절하다 (Malabarba 및 Ciabatti, 2001년). 화학을 위한 주요 제한점들 중 하나는, 펩티드 골격 내에 존재하는 아미노산의 유형 또는 순서를 변화시키는 것이다. 화학적으로, 비교적 낮은 수율로 아미노산 1 및 3에 대해서만 개입하는 것이 가능한 것으로 나타났다 (Malabarba 등, 1997년). 이에 따라, 정확하게 공학처리된 균주를 이용한 발효 공정에 의해 직접적으로 신규 글리코펩티드 유도체를 고안하기 위한 일반적 방법이 매우 요망되게 된다.
유리한 대안책은 천연 발생 글리코펩티드의 생합성 공정의 공학처리에 의해 향상된 항생제를 생성시키는 것이다. 이 종류의 예들이 보고되었다. 실제로, 반코마이신 및 클로로에레모마이신 유전자 클러스터로부터의 글리코실트랜스퍼라제의 발현 후에, 글리코펩티드 아글리콘을 생체외 및 생체내의 양자 모두에서 선택적으로 글리코실화하는 것이 가능하였다 (Solenberg 등, 1997년; Loosey 등, 2001년). 그러나, 지금까지 기술된 효소들은 모두 원하는 위치에 글루코사민 잔기를 부착시킬 수 없었다. 유사하게, 발히마이신 생산자 A. 메디테라네이(A. mediterranei)에서의 선택된 유전자의 불활성화에 의해, 발히마이신 유도체가 수득되었다 (Pelzer 등, 1999년). 그러나, 테이코플라닌 부류의 글리코펩티드 생산 균주에 대한 상기와 같은 실험은 기재되지 않았다.
항생제 A40926는 글리코펩티드의 테이코플라닌 부류에 속한다 (Parenti 및 Cavalleri, 1989년). 이는 코어 구조가 아미노산 1-3, 2-4 및 4-6 간의 에테르 결합 및 아미노산 5-7 간의 C-C 결합에 의해 결정되는 강성 비계(scaffold)를 갖는 헵타펩티드 골격으로 재수행될 수 있는 밀접히 관련된 분자의 착체로 구성된다. 게다가, 2개의 당 잔기 및 2개의 염소 원자가 분자 상에 존재한다. A40926 착체의 성분의 구조는 하기 화학식으로 표시된다 (식 중, R은 주요성분으로서 인자 A1 (R = n-데실), 인자 B0 (R = 9-메틸데실) 및 인자 B1 (R = n-운데실)을 갖는 [C9-C12] 알킬을 나타냄).
이전에 악티노마두라(Actinomadura) 종 ATCC39727로 알려진 생산자 균주는 최근 노노무리아(Nonomuria) 종 ATCC39727로 재분류되었다 (Zhang 등, 1998년). 고유 항세균 활성을 나타내는 것 이외에도, A40926은 또한 반합성 글리코펩티드 달바반신 (이전에 BI397 또는 MDL 62397로도 알려짐; Malabarba 및 Ciabatti, 2001년)의 전구체이다. 그러므로, A40926의 구조를 조작하고, 그의 수율을 증가시키기 위한 부가적 툴이 매우 요망되게 된다. 그러나, 속 노노무리아로부터의 다른 원으로부터의 클러스터의 예가 없다. 그러므로, 노노무리아에서의 A40926 형성에 필요하고 그 형성을 조절하는 유전자가 또한 생산 공정의 최적화에 유용할 수 있다.
최근, 글리코펩티드 클로로에레모마이신 (van Wageningen 등, 1998년), 발히마이신 (Pelzer 등, 1999년), 콤플레스타틴 (Chiu 등, 2001년) 및 A47934 (Pootoolal 등, 2002년)의 형성에 관여하는 유전자 클러스터가 기재되었다. cep, bal, com 및 sta로 각기 명명되는 이 클러스터는 아미콜라토프시스 오리엔탈리스(Amycolatopsis orientalis), 아미콜라토프시스 메디테라네이((Amycolatopsis mediterranei), 스트렙토마이세스 라벤둘라에(Streptomyces lavendulae) 및 스트렙토마이세스 토요카엔시스(Streptomyces toyocaensis)로부터 각기 수득되었다. 이 클러스터는 글리코펩티드 경로를 조작하는데 유용한 수개의 유전자를 제공하였다. 그러나, 일부 단계들은 기재된 클러스터로 수행될 수 없다. 예를 들어, 유용한 유전자 클러스터는 당의 산화 상태를 변경시킬 수 있는 기능, 지방산 사슬을 부착할 수 있는 기능, 또는 아미노산 3의 방향족 부분기에 염소 원자를 제공할 수 있는 기능을 코딩하지 않는다. 이 모든 기능들이 또한 본 발명에 기재되어 있다.
항생제 제조를 위한 산업적 공정 고안이 비교적 성공적이었고, 이에 따라 리터당 수그램(g)의 수준에 달하는 항생제 적정을 갖는 대량 발효를 가져왔다. 이는 하기 실험적 시행착오 접근법에 의해 대체로 달성되었고, 합리적 기초가 결여되어 있다. 이에 따라, 새로운 공정의 개발 및 현 기술의 향상이 여전히 시간 소비적이며, 불안정하고, 비일관적으로 수행하며, 원치 않는 부산물을 축적하는 한 세균 배양액을 초래할 수 있다. 근년, 당해 유전자 클러스터 내에 존재하는 핵심 조절 요소의 조작 또는 경로에서의 속도 제한 단계의 과도발현과 종종 관련되었던 스트렙토마이세스 종에 의해 생성되는 항생제의 수준을 증가시키기 위해 합리적 방법들이 성공적으로 적용되었다. 그러므로, 그러한 클러스터-연관 조절자를 코딩하는 유전자, 또는 합성에서의 제한 단계는 수율 향상을 위한 효과적인 툴이 될 수 있다. 그러나, 지금까지 방선균류에서 동정된 클러스터-연관 조절자는 수가지 상이한 단백질 부류에 속한다 (Chater 및 Bibb, 1997년). 심지어 하나의 부류 내에서도, 서열 동일성이 상당히 다양하다. 그러므로, 클러스터-연관 조절자의 존재, 성질, 수 및 서열은 다른 클러스터, 심지어는 관련 항생제를 특정하는 클러스터에 의해 예측될 수 없다. 한 예로서, 틸로신 유전자 클러스터는 4개의 구별된 조절자를 코딩하는 반면, 관련 마크롤라이드 항생제 에리트로마이신을 특정하는 클러스터에서는 그 어떤 것도 발견되지 않았다 (Bate 등, 1999년). 유사하게, 생합성 경로에서의 속도-제한 단계의 성질 및 이유가 선험적으로 구축될 수 없다.
발명의 요약
본 발명은 미생물에서의 글리코펩티드 A40926의 생합성에 필요한 한 세트의 단리된 폴리뉴클레오티드 분자를 제공한다. 본 발명의 한 형태에서, 폴리뉴클레오티드 분자는 노노무리아 종 ATCC39727로부터 단리된 dbv 유전자 클러스터를 나타내고, A40926 형성에 필요한 폴리펩티드를 코딩하는 37개 ORF로 구성되는 인접 DNA 서열 (서열 1)로부터 선택된다. 상기 37개 ORF에 의해 코딩되는 폴리펩티드의 아미노산 서열이 서열 2 내지 38에 제공된다.
본 발명은
a) A40926의 합성에 필요한 폴리펩티드를 코딩하는 dbv 유전자 클러스터 (서열 1);
b) dbv 유전자 클러스터 (서열 1)에 의해 코딩되는 것과 동일한 폴리펩티드를 코딩하지만 dbv 유전자 클러스터 자체의 뉴클레오티드 서열은 아닌 뉴클레오티드 서열;
c) 서열 2 내지 38의 폴리펩티드를 코딩하는 dbv ORF 1 내지 37의 임의의 뉴클레오티드 서열 및
d) dbv ORF 1 내지 37 (서열 2 내지 38) 중 임의의 것에 의해 코딩되는 것과 동일한 폴리펩티드를 코딩하지만 상기 ORF의 뉴클레오티드 서열은 아닌 뉴클레오티드 서열
로 구성되는 군으로부터 선택되는 뉴클레오티드 서열을 포함하는 단리된 핵산을 제공하는 것이다.
본 발명의 다른 목적은,
e) 서열 4 내지 5, 7 내지 11, 19 내지 21, 23 내지 24, 30 내지 31 및 37에 특정된 폴리펩티드를 코딩하는 dbv ORF 3 내지 4, 6 내지 10, 18 내지 20, 22 내지 23, 29 내지 30 및 36 중 임의의 것의 뉴클레오티드 서열;
f) dbv ORF 3 내지 4, 6 내지 10, 18 내지 20, 22 내지 23, 29 내지 30 및 36 (서열 4 내지 5, 7 내지 11, 19 내지 21, 23 내지 24, 30 내지 31 및 37) 중 임의의 것에 의해 코딩되는 것과 동일한 폴리펩티드를 코딩하지만 상기 ORF의 뉴클레오티드 서열은 아닌 뉴클레오티드 서열;
g) dbv ORF 3, 6 내지 9, 18 내지 20, 22 내지 23, 29 내지 30 및 36 (서열 4, 7 내지 10, 19 내지 21, 23 내지 24, 30 내지 31 및 37) 중 임의의 것에 의해 코딩되는 폴리펩티드와 아미노산 서열이 80% 이상, 바람직하게는 86% 이상, 더욱 바람직하게는 90% 이상, 가장 바람직하게는 95% 이상 동일한 폴리펩티드를 코딩하는 뉴클레오티드 서열 및
h) dbv ORF 4 및 10 (서열 5 및 11) 중 임의의 것에 의해 코딩되는 폴리펩티드와 아미노산 서열이 87% 이상, 바람직하게는 90% 이상, 더욱 바람직하게는 95% 이상 동일한 폴리펩티드를 코딩하는 뉴클레오티드 서열
로 구성된 군으로부터 선택되는 뉴클레오티드 서열을 포함하는 단리된 핵산을 제공하는 것이다.
한 실시양태에서, 본 발명의 단리된 핵산은 A40926의 4-히드록시-페닐글리신 (HPG) 잔기를 합성하는데 필요한 폴리펩티드를 코딩하는 ORF 1 내지 37 (서열 2 내지 38)로부터 선택되는 ORF의 조합을 포함한다. 또다른 실시양태에서, 핵산은 A40926의 3,5-디히드록시-페닐글리신(DPG) 잔기의 합성에 필요한 폴리펩티드를 코딩하는 ORF 1 내지 37 (서열 2 내지 38)로부터 선택되는 ORF의 조합을 포함한다. 또다른 실시양태에서, 핵산은 A40926의 헵타펩티드 골격의 합성에 필요한 폴리펩티드를 코딩하는 ORF 1 내지 37 (서열 2 내지 38)로부터 선택되는 ORF의 조합을 포함한다. 또다른 실시양태에 따라, 본 발명의 핵산에서, A40926의 아미노산 3 및 6의 방향족 잔기의 염소화에 필요한 폴리펩티드를 코딩하는 ORF 1 내지 37 (서열 2 내지 38)로부터 선택되는 ORF의 조합이 제공된다. 또다른 실시양태에 따라, 본 발명의 핵산에서, A40926의 아미노산 6의 티로신 잔기의 β-히드록실화에 필요한 폴리펩티드를 코딩하는 ORF 1 내지 37 (서열 2 내지 38)로부터 선택되는 ORF의 조합을 포함하는 핵산이 제공된다. 또다른 실시양태에 따라, A40926의 위치 2와 4, 4와 6, 1과 3 및 5와 7에 있는 아미노산의 방향족 잔기의 가교결합에 필요한 폴리펩티드를 코딩하는 ORF 1 내지 37 (서열 2 내지 38)로부터 선택되는 ORF의 조합을 포함하는 핵산이 제공된다. 또다른 실시양태에 따라, 본 발명의 핵산에서, N-아실글루쿠론아민 잔기의 첨가 및 형성에 필요한 폴리펩티드를 코딩하는 ORF 1 내지 37 (서열 2 내지 38)로부터 선택되는 ORF의 조합이 제공된다. 또다른 실시양태에 따라, 만노실 잔기의 부착에 필요한 폴리펩티드를 코딩하는 ORF 1 내지 37 (서열 2 내지 38)로부터 선택되는 ORF의 조합을 포함하는 핵산이 제공된다. 또다른 실시양태에 따라, A40926의 N-메틸화에 필요한 폴리펩티드를 코딩하는 ORF 1 내지 37 (서열 2 내지 38)로부터 선택되는 ORF의 조합을 포함하는 핵산이 제공된다. 또다른 실시양태에 따라, A40926의 외수송 및 A40926에 대한 내성에 필요한 폴리펩티드를 코딩하는 ORF 1 내지 37 (서열 2 내지 38)로부터 선택되는 ORF의 조합을 포함하는 핵산이 제공된다. 또다른 실시양태에서, dbv 유전자 클러스터의 발현을 조절하는데 필요한 폴리펩티드를 코딩하는 ORF 1 내지 37 (서열 2 내지 38)로부터 선택되는 ORF의 조합을 포함하는 핵산이 제공된다. 또다른 실시양태에서, ORF 1 내지 37 (서열 2 내지 38)로부터 선택되는 ORF의 발현 수준을 증진시키는, 서열 1로부터 선택되는 하나 이상의 DNA 세그먼트를 포함하는 핵산이 제공된다.
당업자는, A40926 생합성 경로의 폴리펩티드를 코딩하는 뉴클레오티드 서열을 제공하는 본 발명은 또한, 그러한 폴리펩티드로부터 유도되는 단편을 코딩하는 뉴클레오티드도 제공한다는 것을 이해한다. 부가적으로, 당업자는 유전 코드가 퇴화됨에 따라, 서열 2 내지 38에 특정된 동일한 폴리펩티드가 ORF 1 내지 37의 천연 또는 인공 변종체, 즉 동일한 폴리펩티드를 코딩하지만 ORF 1 내지 37에 의해 특정된 게놈 뉴클레오티드 서열은 아닌 뉴클레오티드 서열에 의해 코딩될 수 있다는 것을 이해한다. 또한, 서열 2 내지 38에 특정된 폴리펩티드의 자연 발생되거나 인공적으로 제조된 변종체로서, 상기 원래의 폴리펩티드와 동일한 기능(들)을 가지나, 폴딩 또는 촉매적 기능에 필수적이지 않은 아미노산의 첨가, 결실 또는 치환, 또는 필수 아미노산의 보존적 치환을 포함하는 변종체가 발생할 수 있다는 것을 이해한다.
당업자는 또한, A40926 생합성에 필요한 전체 클러스터의 뉴클레오티드 서열을 제공하는 본 발명은 또한 상기 클러스터에 존재하는 유전자의 발현에 필요한 뉴클레오티드 서열도 제공한다는 것을 이해한다. 그러한 조절 서열은 비제한적으로, 프로모터 및 인핸서 서열, 안티센스 서열, 전사 종결자 및 반종결자 서열을 포함한다. 이 서열은 dbv 유전자 클러스터에 존재하는 유전자의 발현을 조절하는데 유용하다. 단독이거나 다른 뉴클레오티드 서열에 융합된 상기 뉴클레오티드 서열을 담지하는 세포도 또한 본 발명의 범주 내에 포함된다.
한 측면에서, 본 발명은 N-아실-글루코사민 잔기를 글리코펩티드 항생제 전구체의 코어 구조에 부착시키는데 유용한, ORF9 폴리펩티드 (서열 10), 또는 상기 폴리펩티드의 천연 발생 변종체 또는 유도체를 코딩하는 뉴클레오티드 서열을 포함하는 단리된 핵산을 제공한다. 또다른 측면에서, 본 발명은 지방산 잔기를 글리코펩티드 항생제 전구체의 코어 구조에 부착시키는데 유용한, ORF23 폴리펩티드 (서열 24), 또는 상기 폴리펩티드의 천연 발생 변종체 또는 유도체를 코딩하는 뉴클레오티드 서열을 포함하는 핵산을 제공한다. 또다른 측면에서, 본 발명은 글리코펩티드 항생제 전구체에 부착된 당 부분기의 산화에 유용한 ORF29 폴리펩티드 (서열 30), 또는 상기 폴리펩티드의 천연 발생 변종체 또는 유도체를 코딩하는 뉴클레오티드 서열을 포함하는 핵산을 제공한다. 또다른 측면에서, 본 발명은 코어 글리코펩티드 항생제 전구체에서의 b-히드록시티로신 및 DPG 잔기의 염소화에 유용한 ORF10 폴리펩티드 (서열 11), 또는 상기 폴리펩티드의 천연 발생 변종체 또는 유도체를 코딩하는 뉴클레오티드 서열을 포함하는 핵산을 제공한다. 또다른 측면에서, 본 발명은 만노실 잔기를 글리코펩티드 항생제 전구체의 코어 구조에 부착시키는데 유용한 ORF20 폴리펩티드 (서열 21), 또는 상기 폴리펩티드의 천연 발생 변종체 또는 유도체를 코딩하는 뉴클레오티드 서열을 포함하는 핵산을 제공한다.
또다른 측면에서, 본 발명은 글리코펩티드 항생제 또는 글리코펩티드 항생제 전구체의 세포로부터의 외수송 및 내성 부여에 유용한 ORF 7, 18, 19, 24 및 35 (서열 8, 19, 20, 25 및 36)에 의해 코딩되는 폴리펩티드, 또는 상기 폴리펩티드의 천연 발생 또는 인공 발생 변종체 또는 유도체를 코딩하는 뉴클레오티드 서열을 포함하는 핵산을 제공한다. 또다른 측면에서, 본 발명은 생산 균주에 대한 내성을 글리코펩티드 항생제 또는 글리코펩티드 항생제 전구체에 부여하는데 유용한 ORF7 폴리펩티드 (서열 8), 또는 상기 폴리펩티드의 천연 발생 또는 인공 발생 변종체 또는 유도체를 코딩하는 뉴클레오티드 서열을 포함하는 핵산을 제공한다. 또다른 측면에서, 본 발명은 글리코펩티드 항생제 전구체의 수율을 증가시키는데 유용한, ORF 3, 4, 6, 22 및 36 폴리펩티드 (서열 4, 5, 7, 23 및 37), 또는 상기 폴리펩티드의 천연 발생 또는 인공 발생 변종체 또는 유도체를 코딩하는 뉴클레오티드 서열을 포함하는 핵산을 제공한다.
한 실시양태에서, 본 발명은 ORF 1 내지 37 (서열 2 내지 38) 중 임의의 것으로부터 선택된 하나 이상의 ORF를 특정하는 뉴클레오티드 서열의 여분 카피(extra copy)를 담지하는 글리코펩티드 생산 균주를 제공한다. 한 바람직한 실시양태에서, 그러한 글리코펩티드 생산 균주는 목 악티노마이세탈레스(Actinomycetales)에 속하는 임의의 균주이다. 다른 한 바람직한 실시양태에서, 그러한 글리코펩티드 생산 균주는 속 노노무리아의 한 원이다. 한 추가적 측면에서, 본 발명은 ORF 1 내지 37 (서열 2 내지 38) 중 하나 이상의 증가 또는 감소된 발현을 초래하는, 서열 1에 특정된 뉴클레오티드 서열에서의 하나 이상의 변형을 갖는 노노무리아 균주를 제공한다.
한 바람직한 실시양태에서, 본 발명은 A40926, 그의 전구체 중 하나 이상 또는 또다른 세포에 의한 그의 유도체의 제조에 유용한, 하나 이상의 벡터에 담지된 서열 1에 의해 특정된 뉴클레오티드 서열 또는 그의 일부분을 포함하는 핵산을 제공한다. 한 바람직한 실시양태에서, 상기 뉴클레오티드 서열 또는 그의 부분은 단일 벡터에 담지된다. 또다른 바람직한 실시양태에서, 그러한 벡터는 세균 인공 염색체이다. 또다른 측면에서, 상기 세균 인공 염색체는 (W099/63674에 기재된 바와 같은) ESAC 벡터이다. 또다른 바람직한 실시양태에서, 본 발명은 상기 재조합 방선균류 균주의 염색체에 통합된 ESAC 벡터에 담지된, 서열 1에 의해 특정된 유전자 클러스터를 포함하는 노노무리아 종 ATCC 39727 이외의 재조합 방선균류 균주를 제공한다.
한 측면에서, 본 발명은 하기 단계들을 포함하는, A40926의 생산을 증가시키는 방법을 제공한다: (1) 생합성 경로를 이용하여 A40926 또는 A40926 전구체를 생산하는 미생물을 상기 경로에서의 속도 제한 활성을 코딩하는 ORF 1 내지 37 (서열 2 내지 38) 중 임의의 것으로부터 선택되는 DNA 서열을 포함하는 재조합 DNA 벡터로 형질전환하는 단계 및 (2) 상기 벡터로 형질전환된 상기 미생물을 세포 성장, 상기 유전자의 발현 및 상기 항생제 또는 항생제 전구체의 생산에 적합한 조건하에 배양하는 단계.
또다른 측면에서, 본 발명은 하기 단계들을 포함하는 A40926의 유도체의 생산 방법을 제공한다: (1) 서열 1에 의해 특정되는 뉴클레오티드 서열로부터 선택되는 세그먼트로서, 우회하기 희망하는 생합성 단계를 촉매하는 폴리펩티드를 코딩하는 ORF의 1 내지 37 (서열 2 내지 38) 중 하나의 적어도 일부분을 포함하는, 상기 세그먼트를 적당한 벡터에 클로닝하는 단계; (2) 상기 폴리펩티드의 활성에 필수적인 아미노산에 대해 특정하는 하나 이상의 코돈을 제거 또는 대체함으로써 상기 ORF를 불활성화시키는 단계; (3) 생합성 경로를 이용하여 A40926 또는 A40926 전구체를 생산하는 미생물을 상기 재조합 DNA 벡터로 형질전환하는 단계; (4) 상기 DNA 서열이 변이된 카피로 대체됨으로써 파괴된 유전자를 생성시키는 상기 것들에 대한 수득된 형질변환체를 선별하는 단계 및 (5) 상기 변이체 세포를 세포 성장, 상기 경로의 발현 및 상기 경로 유사체의 제조에 적합한 조건하에 배양하는 단계.
또다른 측면에서, 본 발명은 하기 단계들을 포함하는 신규 글리코펩티드의 생산 방법을 제공한다: (1) 생합성 경로를 이용하여 A40926 또는 그의 전구체와는 상이한 글리코펩티드 또는 글리코펩티드 전구체를 생산하는 미생물을 ORF 1 내지 37 (서열 2 내지 38) 중에서 선택되는 하나 이상의 ORF를 포함하고 상기 글리코펩티드 또는 글리코펩티드 전구체를 변형시키는 하나 이상의 폴리펩티드(들)의 발현을 코딩하는 재조합 DNA 벡터로 형질전환하는 단계 및 (2) 상기 벡터로 형질전환된 상기 미생물을 세포 성장, 상기 유전자의 발현 및 상기 항생제 또는 항생제 전구체의 생산에 적합한 조건하에 배양하는 단계.
이 방법의 수행에 적합한 글리코펩티드 또는 글리코펩티드 전구체를 생산하는 미생물의 예는, 속
스트렙토마이세스, 아미콜라토프시스, 악티노플라네스, 노노무리아
등에 속하는 균주이다.
또다른 측면에서, 본 발명은 또한 하기 단계들을 포함하는 신규 글리코펩티드의 생산 방법을 제공한다: (1) 글리코펩티드 또는 글리코펩티드 전구체를 생산하지 않으며 도입된 ORF(들)를 효율적으로 발현할 수 있는 미생물 중에서 선택된 미생물을 글리코펩티드 또는 글리코펩티드 전구체(활성 폴리펩티드(들))를 변형시키는 하나 이상의 폴리펩티드(들)을 코딩하는 ORF 1 내지 37 (서열 2 내지 38) 중에서 선택되는 하나 이상의 ORF를 포함하는 재조합 DNA 벡터로 형질전환하는 단계; (2) 적어도 상기 활성 폴리펩티드(들)을 함유하는 상기 미생물의 세포 추출물 또는 세포 분획물을 활성 폴리펩티드(들)의 존재에 적합한 조건하에서 제조하는 단계; (3) 글리코펩티드 또는 글리코펩티드 전구체를 상기 세포 추출물 또는 세포 분획물에 첨가하고, 상기 혼합물을 상기 활성 폴리펩티드(들)이 상기 글리코펩티드 또는 글리코펩티드 전구체를 변형시킬 수 있는 조건하에서 인큐베이션하는 단계.
이 방법의 수행에 적합한 미생물의 예는
종
스트렙토마이세스 리비단스(Streptomyces lividans), 스트렙토마이세스 코엘리콜로르(Streptomyces coelicolor), 에쉐리키아 콜라이(Escherichia coli), 바실러스 섭틸리스(Bacillus subtilis)
등에 속하는 균주이다.
본 발명의 다른 한 측면은 하기 것들로부터 선택되는, A40926의 생합성 경로에 관여하는 폴리펩티드 서열을 포함하는 단리된 폴리펩티드를 포함한다:
a) dbv ORF 1 내지 37 (서열 2 내지 38) 중 임의의 것에 의해 코딩되는 ORF 폴리펩티드, 또는 dbv ORF 1 내지 37 (서열 2 내지 38) 중 임의의 것, 바람직하게는 dbv ORF 3 내지 4, 6 내지 10, 18 내지 20, 22 내지 23, 29 내지 30 (서열 4 내지 5, 7 내지 11, 19 내지 21, 23 내지 24, 30 내지 31 및 37) 중 임의의 것에 의해 코딩되는 폴리펩티드와 아미노산 서열이 동일한 폴리펩티드;
b) dbv ORF 3, 6 내지 9, 18 내지 20, 22 내지 23, 29 내지 30 및 36 (서열 4, 7 내지 10, 19 내지 21, 23 내지 24, 30 내지 31 및 37) 중 임의의 것에 의해 코딩되는 폴리펩티드와 아미노산 서열이 80% 이상, 바람직하게는 86% 이상, 더욱 바람직하게는 90% 이상, 가장 바람직하게는 95% 이상 동일한 폴리펩티드 및
c) dbv ORF 4 및 10 (서열 5 및 11) 중 임의의 것에 의해 코딩되는 폴리펩티드와 아미노산 서열이 87% 이상, 바람직하게는 90% 이상, 더욱 바람직하게는 95% 이상 동일한 폴리펩티드.
정의
용어 "단리된 핵산"은 천연 및 합성 공급원의, 단일 또는 이중 나선일 수 있는 게놈 DNA 또는 상보적 DNA (cDNA)로서의 DNA 분자를 가리킨다. 이 용어는 또한 천연 또는 합성 공급원의 RNA 분자도 가리킨다.
용어 "뉴클레오티드 서열"은 본원에 개시된 ORF 및 유전자 내부 영역의 전체 길이 또는 부분 길이 서열을 가리킨다. 서열목록에 나와 있는 본 발명의 뉴클레오티드 서열들 중 임의의 하나는 (a) 코딩 서열, (b) (a)의 전사로부터 유도된 RNA 분자, (c) 동일한 폴리펩티드를 코딩하는 유전자 코드의 퇴화를 이용하는 코딩 서열, 또는 (d) 프로모터, 인핸서, 종결자 및 반종결자 서열을 함유하는 유전자내부 영역이다.
용어 " 유전자 클러스터", "클러스터" 및 "생합성 클러스터"는 모두 이차 대사산물의 합성에 필요한 모든 유전자들을 함유하는 미생물의 게놈의 인접 세그먼트를 나타낸다.
용어 "dbv"는 노노무리아 종 ATCC39727에서 A40926 생합성을 초래하는 유전 요소를 가리킨다.
용어 "ORF"는 하나의 폴리펩티드를 코딩하는 게놈 뉴클레오티드 서열을 가리킨다. 본 발명의 영역에서, 용어 ORF는 "유전자"와 동의어이다.
용어 "ORF 폴리펩티드"는 ORF에 의해 코딩되는 폴리펩티드를 가리킨다.
용어 "dbv ORF"는 dbv 유전자 클러스터 내에 포함된 ORF를 가리킨다.
용어 "NRPS"는 이차 대사산물의 올리고펩티드 골격으로의 아미노산의 혼입을 초래하는 효소 활성의 착체인 비-리보솜 펩티드 신테타제를 가리킨다. 기능적 NRPS는 올리고펩티드로의 하나 이상의 아미노산의 혼입을 촉매하는 NRPS이다.
용어 "NRPS 모듈", 또는 "모듈"은 올리고펩티드로의 하나의 아미노산의 활성화, 혼입 및 가능한 변형을 지시하는 NRPS의 세그먼트를 가리킨다.
용어 "NRPS 유전자"는 NRPS를 코딩하는 유전자를 가리킨다.
용어 "이차 대사산물"은 유전자 클러스터에 의해 특정된 한 세트의 유전자의 발현을 통해 미생물에 의해 생성되는 생활성 물질을 가리킨다.
용어 "생산 숙주"는 이차 대사산물의 형성이 공여자 유기체로부터 유도된 유전자 클러스터에 의해 지시되는 미생물이다.
용어 "ESAC"는 "에쉐리키아 콜라이-스트렙토마이세스 인공 염색체", 즉 에쉐리키아 콜라이 숙주 내에 큰 DNA 삽입부를 담지하고 유지하며, 방선균류 생산 숙주 내에 도입되어 유지될 수 있는 재조합 벡터를 가리킨다. ESAC의 예가 W099/67374에 나와 있다.
도 1. 노노무리아 종 ATCC39727의 염색체로부터 유도된 단리된 DNA 세그먼트. 굵은 선은 서열 1에 기재된 세그먼트를 나타낸다. 상기 단리된 DNA 세그먼트를 담지하는 코스미드는 11A5, 7F3, 7E9, 1B1, 7A2, 11B9 및 7C7로 표시된다.
도 2. dbv 클러스터의 유전 조직. 각 ORF는 화살표로 표시되고, 표 1에서 넘버링된다. 방향은 도 1에서와 같다. 단위 막대에 있는 숫자는 서열 좌표 (kb)를 가리킨다.
A. 노노무리아로부터의 dbv 유전자
A40926는 노노무리아 종 ATCC39727에 의해 생산되는 밀접히 관련된 글리코펩티드 항생제의 착체이다. 본 발명은 A40926의 생합성을 위한 유전자 클러스터의 핵산 서열 및 특징화를 제공한다. 인접한 DNA 서열과 함께, A40926 유전자 클러스터의 물리적 조직이 도 1에 나와 있으며, 그 도 1은, 노노무리아 종 ATCC39727의 게놈으로부터의 90-kb 게놈 세그먼트의 물리적 지도 및 그러한 세그먼트를 특정하는 한 세트의 코스미드를 도시한다. dbv 클러스터로 표시되는 A40926 생합성을 지배하는 DNA 세그먼트의 유전 조직이 도 2에 나와 있고, 그의 뉴클레오티드 서열은 서열 1로 기재되어 있다.
클러스터의 정확한 경계는 다른 글리코펩티드 클러스터와의 비교 및 그의 유전자 산물의 기능으로부터 구축될 수 있다. 그러므로, 좌측 끝 (도 1)에서, dbv 클러스터는 HPG의 합성에 관여하는 효소 HmoS를 코딩하는 dbv ORF1 (서열 2)의 의해 구분된다. 우측에서는, dbv 클러스터는 서열 1의 뉴클레오티드 71065 내지 71138의 폭을 가지는 tRNA 유전자의 3'-말단과 유사한 attL 부위의 나머지에 의해 구분된다. dbv 클러스터는 대략 71,100개 염기쌍의 폭을 가지고, dbv ORF1 내지 dbv ORF37로 표시되는 37개 ORF를 포함한다. 서열 1의 인접 뉴클레오티드 서열 (71138개 염기쌍)은 서열 2 내지 38에 열거된 37개의 유래 단백질을 코딩한다. ORF1 (서열 2)는 상보적 나선 상의 뉴클레오티드 1140 내지 40으로부터 서열 1을 번역함으로써 유래된 366개 아미노산을 나타낸다. ORF2 (서열 3)은 상보적 나선 상의 뉴클레오티드 2329 내지 1259로부터 서열 1을 번역함으로써 유래된 356개 아미노산을 나타낸다. ORF3 (서열 4)은 상보적 나선 상의 뉴클레오티드 5161 내지 2558로부터 서열 1을 번역함으로써 유래된 867개 아미노산을 나타낸다. ORF4 (서열 5)는 상보적 나선 상의 뉴클레오티드 6231 내지 5266로부터 서열 1을 번역함으로써 유래된 321개 아미노산을 나타낸다. ORF5 (서열 6)는 뉴클레오티드 7183 내지 8292로부터 서열 1을 번역함으로써 유래된 369개 아미노산을 나타낸다. ORF6 (서열 7)은 뉴클레오티드 8320 내지 8973로부터 서열 1을 번역함으로써 유래된 217개 아미노산을 나타낸다. ORF7 (서열8)은 뉴클레오티드 9069 내지 9659로부터 서열 1을 번역함으로써 유래된196개 아미노산을 나타낸다. ORF8 (서열 9)은 상보적 나선 상의 뉴클레오티드 10667 내지 9708로부터 서열 1을 번역함으로써 유래된 319개 아미노산을 나타낸다. ORF9 (서열 10)는 상보적 나선 상의 뉴클레오티드 11896 내지 10670로부터 서열 1을 번역함으로써 유래된 408개 아미노산을 나타낸다. ORF10 (서열 11)은 상보적 나선 상의 뉴클레오티드 13419 내지 11950로부터 서열 1을 번역함으로써 유래된 489개 아미노산을 나타낸다. ORF11 (서열 12)은 상보적 나선 상의 뉴클레오티드 14741 내지 13479로부터 서열 1을 번역함으로써 유래된 420개 아미노산을 나타낸다. ORF12 (서열 13)는 상보적 나선 상의 뉴클레오티드 16019 내지 14823으로부터 서열 1을 번역함으로써 유래된 398개 아미노산을 나타낸다. ORF13 (서열 14)은 상보적 나선 상의 뉴클레오티드 17163 내지 16009으로부터 서열 1을 번역함으로써 유래된 384개 아미노산을 나타낸다. ORF14 (서열 15)는 상보적 나선 상의 뉴클레오티드 18366 내지 17185로부터 서열 1을 번역함으로써 유래된 393개 아미노산을 나타낸다. ORF15 (서열 16)는 상보적 나선 상의 뉴클레오티드 18671 내지 18462로부터 서열 1을 번역함으로써 유래된 69개 아미노산을 나타낸다. ORF16 (서열 17)은 상보적 나선 상의 뉴클레오티드 24259 내지 18668로부터 서열 1을 번역함으로써 유래된 1863개 아미노산을 나타낸다. ORF17 (서열 18)은 상보적 나선 상의 뉴클레오티드 36529 내지 24278로부터 서열 1을 번역함으로써 유래된 4083개 아미노산을 나타낸다. ORF18 (서열 19)은 상보적 나선 상의 뉴클레오티드 39021 내지 36760으로부터 서열 1을 번역함으로써 유래된 753개 아미노산을 나타낸다. ORF19 (서열 20)는 상보적 나선 상의 뉴클레오티드 39851 내지 39152로부터 서열 1을 번역함으로써 유래된 232개 아미노산을 나타낸다. ORF20 (서열 21)은 상보적 나선 상의 뉴클레오티드 41732 내지 40125로부터 서열 1을 번역함으로써 유래된 535개 아미노산을 나타낸다. ORF21 (서열 22)은 상보적 나선 상의 뉴클레오티드 42584 내지 41772로부터 서열 1을 번역함으로써 유래된 270개 아미노산을 나타낸다. ORF22 (서열 23)는 상보적 나선 상의 뉴클레오티드 44130 내지 42868로부터 서열 1을 번역함으로써 유래된 420개 아미노산을 나타낸다. ORF23 (서열 24)은 상보적 나선 상의 뉴클레오티드 46355 내지 44226으로부터 서열 1을 번역함으로써 유래된 709개 아미노산을 나타낸다. ORF24 (서열 25)는 뉴클레오티드 46632 내지 48578로부터 서열 1을 번역함으로써 유래된 648개 아미노산을 나타낸다. ORF25 (서열 26)는 뉴클레오티드 48575 내지 54868로부터 서열 1을 번역함으로써 유래된 2097개 아미노산을 나타낸다. ORF26 (서열 27)은 뉴클레오티드 54865 내지 58056으로부터 서열 1을 번역함으로써 유래된 1063개 아미노산을 나타낸다. ORF27 (서열 28)은 뉴클레오티드 58152 내지 58985로부터 서열 1을 번역함으로써 유래된 277개 아미노산을 나타낸다. ORF28 (서열 29)은 뉴클레오티드 59046 내지 60641로부터 서열 1을 번역함으로써 유래된 531개 아미노산을 나타낸다. ORF29 (서열 30)는 상보적 나선 상의 뉴클레오티드 62445 내지 60874로부터 서열 1을 번역함으로써 유래된 523개 아미노산을 나타낸다. ORF30 (서열 31)은 뉴클레오티드 62887 내지 63312로부터 서열 1을 번역함으로써 유래된 141개 아미노산을 나타낸다. ORF31 (서열 32)은 뉴클레오티드 63469 내지 64587로부터 서열 1을 번역함으로써 유래된 372개 아미노산을 나타낸다. ORF32 (서열 33)는 뉴클레오티드 64599 내지 65240으로부터 서열 1을 번역함으로써 유래된 213개 아미노산을 나타낸다. ORF33 (서열 34)은 뉴클레오티드 65237 내지 66541로부터 서열 1을 번역함으로써 유래된 434개 아미노산을 나타낸다. ORF34 (서열 35)는 뉴클레오티드 66538 내지 67335로부터 서열 1을 번역함으로써 유래된 265개 아미노산을 나타낸다. ORF35 (서열 36)는 뉴클레오티드 67332 내지 68618로부터 서열 1을 번역함으로써 유래된 428개 아미노산을 나타낸다. ORF36 (서열 37)은 상보적 나선 상의 뉴클레오티드 69423 내지 68685로부터 서열 1을 번역함으로써 유래된 251개 아미노산을 나타낸다. ORF37 (서열 38)은 뉴클레오티드 69608 내지 70894로부터 서열 1을 번역함으로써 유래된 428개 아미노산을 나타낸다.
dbv 클러스터는 다른 글리코펩티드 클러스터의 것들과 실질적으로 상이한 조직을 나타낸다. 5가지 bal, cep, com, sta 및 dbv 클러스터 간의 비교가 표 1에 요약되어 있다.
a + 표시는 다른 기재된 글리코펩티드 유전자 클러스터에서의 정형체의 존재를 가리킴.
b 정형체가 다른 글리코펩티드 유전자 클러스터에 존재하지 않을 때, 진뱅크에서의 블라스트(Blast) 연구에 대한 결과를 보고함.
c 다른 글리코펩티드 클러스터에서의 존재 및 진뱅크에서의 블라스트 연구로부터의 조합된 결과를 기초로 한 dbv ORF의 제안 기능.
d 이 칼럼은 다른 글리코펩티드 유전자 클러스터 및 그의 공급원인 클러스터로부터 최적의 매치의 서열 동일성(%)을 보고함.
e 최고 점수를 갖는 진뱅크 엔트리의 등록 번호.
f 블라스트 연구로부터 수득된 확률 점수.
g 전 칼럼으로부터의 진뱅크 엔트리의 유기체 및 제안 기능. 약어는 다음과 같다: S., 스트렙토마이세스; M., 메조르히조비움(M., Mesorhizobium); A., 아미콜라토프시스
h 블라스트 연구에 의해 보고된 보존 도메인.
* 다른 글리코펩티드 클러스터에서, 단 데이타베이스에서 다른 곳에서 존재하는 보다 높은 동일성을 갖는 서열에서의 존재.
실제로, NRPS의 7개 모듈을 코딩하는 유전자는 12-kb 세그먼트에 의해 분리된 2개의 발산 전사된 영역으로서 조직화된다 (도 2). 이는 NRPS 유전자의 7개 모듈이 조밀 영역에 존재하고, 모두 동일한 방향으로 번역되는 bal, cep, com 및 sta 클러스터의 조직과는 대조된다. 또한, bal, cep, com 및 sta 클러스터에서, 하나를 제외한 모든 ORF가 동일한 방향으로 전사되는 반면, 37개 dbv ORF 중 단지 22개만이 한 방향으로 전사되고, 나머지 15개는 반대 방향으로 전사된다. 이는 dbv 클러스터의 전사적 복잡성을 가리킨다.
dbv 클러스터는 또한 bal, cep, com 및 sta 클러스터에서 동족체가 없는 수개의 ORF의 존재를 그 특징으로 한다. 이는 dbv ORF 3, 6 내지 8, 18 내지 20, 22, 23, 29, 30 및 36 (서열 4,7 내지 9, 19 내지 21, 23, 24, 30, 31 및 37)을 포함한다. 5개 bal, cep, com, sta 및 dbv 클러스터 간의 비교가 표 1에 요약되어 있다. 결론적으로, 본원에 기재된 dbv 클러스터 유전 조직은 다른 글리코펩티드의 합성에 관여하는 다른 클러스트의 조직과 실질적으로 상이하다. 그러므로 그은 그러한 유전 조직을 갖는 클러스트의 첫 번째 예를 나타낸다.
B. dbv 유전자의 역할
본 발명은 특히 A40926의 헵타펩티드 전구체의 합성을 초래하는 NRPS를 코딩하는 DNA 서열을 개시한다. dbv NRPS는 각기 1개 내지 3개 모듈을 함유하는 4개의 폴리펩티드로 구성된다. 이는 dbv ORF16, ORF17, ORF25 및 ORF26 (서열 17, 18, 26 및 27)로 표시된다. NRPS에 의한 펩티드 합성이, 로딩 모듈 후에 일련의 신장 모듈이 이어지는 모듈적 시스템에 의해 수행된다. NRPS에서, 각 신장 모듈은 기질 인식 및 활성화를 초래하는 아데닐화(A) 도메인; 티오에스테르 아미노산 및 신장 펩티드로서 공유 결합하는 티올화(T) 도메인 및 펩티드 결합 형성을 촉매하는 축합(C) 도메인의 적어도 3개의 도메인의 존재를 그 특징으로 한다. 이 코어 도메인에 부가하여, 마지막 모듈은 완성된 펩티드를 NRPS에 연결하는 에스테르 결합을 가수분해하는 티오에스테라제(Te) 도메인을 포함한다. 일부 모듈은 에피머화 (E) 도메인의 작용을 통해 L-아미노산을 D-형으로 전환한다. dbv NRPS는 총 7개의 A 도메인, 7개의 T 도메인, 6개의 C 도메인, 3개의 E 도메인 및 1개의 Te 도메인에 대한 7개 모듈로 구성된다. 구체적으로, dbv ORF26 (서열 27)은 NRPS 모듈 1 및 2를 코딩하고, 도메인 A-T-C-A-E-T의 서열을 특정하며, A40926의 헵타펩티드 코어 내의 HPG 및 Tyr 잔기 (첫 번째 2개의 아미노산)의 혼입에 필요하며; dbv ORF25 (서열 26)는 NRPS 모듈 3을 코딩하고, 도메인 C-A-T의 서열을 특정하며, DPG 잔기의 혼입을 초래하며; dbv ORF17 (서열 18)은 NRPS 모듈 4 내지 6을 코딩하고, 도메인 C-A-E-T-C-A-E-T-C-A-T의 서열을 특정하며, A40926 헵타펩티드 코어에의 2개의 HPG 및 Tyr 잔기의 혼입을 초래하고; 또한 dbv ORF16 (서열 17)는 NRPS 모듈 7을 코딩하고, 도메인 C-A-T-C*-T-Te의 서열을 특정하며 (C*는 기능이 알려지지 않은 비전형적인 축합 도메인을 나타냄), 마지막 DPG 잔기의 혼입 및 A40926의 헵타펩티드 전구체의 방출에 필요하다.
dbv 클러스터에 존재하는 다른 유전자는 A40926의 생산을 증가시키거나, 신규 대사산물을 합성하는데 유용한 신규 유전 요소를 나타낸다. 이들 중에서, dbv ORF9 (서열 10)는 N-아실-글루코사민 잔기를 헵타펩티드 (화학식 I)에서 위치 4에 있는 HPG 잔기의 페놀성 히드록실에 부착시키는 글리코실트랜스퍼라제를 코딩한다. 이 유전자는 이종성 숙주에서 클로닝되고 발현되어, N-아실-글루코사민 잔기를 다른 글리코펩티드 아글리콘에 부착시킬 수 있는 활성 효소를 생성할 수 있다. 대안적으로, dbv ORF9는 생산 균주 내에서 불활성화됨으로써, A40926 아글리콘을 생성할 수 있다. 이 아글리콘은 화학적 수단에 의해 수득될 수 있으나 (Malabarba 및 Ciabatti, 2001년), 화학적으로 개입할 필요없이, 단일 발효 공정을 통해 이를 제조하는 것이 바람직할 수 있다.
본 발명의 또다른 바람직한 핵산 분자는 A40926의 아미노산 3 및 아미노산 6에 대한 염소 원자의 첨가를 초래하는 할로게나제를 코딩하는 dbv ORF10 (서열 11)을 포함한다. dbv ORF10은 cep, com, sta 및 bal 클러스터에 존재하는 할로게나제 유전자와는 상이한 신규 유전 요소를 나타낸다. 사실상, A40926 염소화 패턴은 이 글리코펩티드 중 독특하다. 이 유전자는 이종성 숙주에서 클로닝되고 발현되어, 글리코펩티드의 방향족 잔기 3 및 6을 염소화할 수 있는 활성 효소를 생성할 수 있다.
본 발명의 또다른 바람직한 핵산 분자는 아미노산 4에 있는 글루코사민 잔기의 지방산을 이용한 N-아실화를 초래하는 아실트랜스퍼라제를 코딩하는 dbv ORF23 (서열 24)을 포함한다. dbv ORF23은 cep, com, sta 및 bal 클러스터가 없는 신규 유전 요소를 나타낸다. 이 유전자는 이종성 숙주에서 클로닝되고 발현되어, 상이한 글리코펩티드의 당 부분기를 N-아실화할 수 있는 활성 효소를 생성할 수 있다.
본 발명의 또다른 바람직한 핵산 분자는 A40926에서 아미노산 4에 부착된 D-글루코사민 잔기의 아미노 글루쿠론산으로의 산화를 초래하는 헥소스 옥시다제를 코딩하는 dbv ORF29 (서열 30)를 포함한다. dbv ORF29는 cep, com, sta 및 bal 클러스터가 없는 신규 유전 요소를 나타낸다. 이 유전자는 이종성 숙주에서 클로닝되고 발현되어, 글리코펩티드에 부착된 D-글루코사민 잔기를 산화시킬 수 있는 활성 효소를 생성할 수 있다.
본 발명의 또다른 바람직한 핵산 분자는 NRPS로부터의 변종 중간체 펩티드의 가수분해를 초래하는 티오에스테라제를 코딩하는 dbv ORF36 (서열 37)을 포함한다. NRPS와 구별되는 폴리펩티드로서 존재하는 다른 티오에스테라제와 유사하게 (Kotowska 등, 2002년), dbv ORF36의 산물은 헵타펩티드로 더욱 가공되지 않는 NRPS 상의 상기 모든 티오에스테르를 가수분해함으로써, A40926 생합성을 위해 효율적인 NRPS의 유지를 초래한다. 이에 따라, 이는 cep, sta, com 및 bal 클러스터가 없는 신규 유전 요소를 나타낸다. 이 유전자는 또다른 글리코펩티드 생산자 균주에서 클로닝되고 발현되어, 형성되는 산물의 수율을 증가시킬 수 있다. 숙주 균주는 비제한적으로 목 악티노마이세탈레스, 과 스트렙토스포란기아세아에(Streptosporangiaceae), 마이크로모노스포라세아에(Micromonosporaceae), 슈도노카르디아세아에(Pseudonocardiaceae) 및 스트렙토마이세타세아에(Streptomycetaceae), 속 노노무레아에(Nonomureae), 악티노플라네스, 아미콜라토프시스, 스트렙토마이세스 등에 속하는 균주들을 포함한다.
본 발명의 또다른 바람직한 핵산 분자는 아미노산 7에 대한 만노실 잔기의 부착을 초래하는 만노실트랜스퍼라제를 코딩하는 dbv ORF20 (서열 21)을 포함한다. 이에 따라, 이는 cep, sta, com 및 bal 클러스터가 없는 신규 유전 요소를 나타낸다. 이 유전자는 또다른 글리코펩티드 생산자 균주에서 클로닝되고 발현되어, 아미노산 7에 부착된 만노실 잔기를 담지하는 글리코펩티드를 생성할 수 있다. 대안적으로, dbv ORF20은 생산 균주에서 불활성화됨으로써 데만노실-A40926이 형성될 수 있다. 이 화합물은 다른 수단에 의해 수득될 수 있으나 (Lancini 및 Cavalleri, 1997년), 단일 발효 공정을 통해 제조하는 것이 바람직할 수 있다.
dbv 클러스터는 또한 비-단백질형성 아미노산 HPG 및 DPG의 합성을 초래하는 수많은 유전자들을 포함한다. 전자의 합성을 위해, dbv ORF 1, 2, 5 및 37 (서열 2, 3, 6 및 38)의 생성물이 요구된다. DPG의 합성은 ORF37 (서열 38)에 부가하여, dbv ORF 31 내지 34 (서열 32 내지 35)의 관여를 요한다. 그의 역할이 표 1에 요약되어 있다. HPG 및 DPG가 비-단백질형성 아미노산이기 때문에, NRPS에 의한 헵타펩티드의 합성은 그의 유용성에 의존한다. 결과적으로, 이 효소의 활성은 글리코펩티드 생합성에서 제한적 단계이다. 이에 따라, 글리코펩티드의 증가된 수율이 이 ORF의 발현을 증가시킴으로써 수득될 수 있다. 이 유전자는 A40926 생산 균주에서 개별적으로 또는 임의 조합으로 과다발현되어, A40926의 수율을 증가시킬 수 있다.
dbv 클러스터는 또한 세포질로부터 글리코펩티드 중간체 또는 최종 생성물을 외수송하거나, 생산자 세포에의 내성 부여를 초래하는 수많은 유전자들을 포함한다. 이 유전자는 dbv ORF 7, 18 내지 19, 24 및 35 (서열 8, 19 내지 20, 25 및 36)를 포함한다. dbv ORF7은 성장 펩티도글리칸으로부터의 말단 D-알라닌 부분기의 제거를 초래하는 카르복시펩티다제를 코딩한다. 이는 cep, com, sta 및 bal 클러스터가 없는 신규 유전 요소를 나타낸다. dbv ORF 18 내지 19 및 24는 A40926 또는 그의 중간체의 ATP-의존성 분비를 초래하는 ABC 계통 (van Veen 및 Konings, 1998년)의 트랜스포터를 코딩한다. dbv ORF35는 양성자 구배에 대항하여 A40926 또는 그의 중간체의 외수송을 초래하는 Na/K 이온-상호수송체를 코딩한다. 이 유전자는 또다른 글리코펩티드 생산자 균주에서, 개별적으로 또는 임의의 조합으로 클로닝되어 발현되어, 형성된 생성물의 수율을 증가시킬 수 있다. 숙주 균주는 비제한적으로 목 악티노마이세탈레스, 과 스트렙토스포란기아세아에, 마이크로모노스포라세아에, 슈도노카르디아세아에 및 스트렙토마이세타세아에, 속 노노무레아에, 악티노플라네스, 아미콜라토프시스, 스트렙토마이세스 등에 속하는 균주들을 포함한다. 대안적으로, 이 유전자는 A40926 생산 균주에서 개별적으로 또는 임의 조합으로 과다발현되어, A40926의 수율을 증가시킬 수 있다.
dbv 클러스터는 또한 A40926 제조 중에 생합성 및 내성 유전자의 발현을 직접적으로 또는 간접적으로 가능하게 하거나 활성화하는 수많은 조절 유전자들을 포함한다. 이 유전자는 또한 dbv ORF 3, 4, 6 및 22 (서열 4, 5, 7 및 23)를 포함한다. dbv ORF3은 스트렙토마이세스 하이그로스코피쿠스로부터의 유전자 클러스터 내에 존재하는 양성 조절자인 HygR과 매우 관계있다 (Ruan 등, 1997년). 이는 cep, com, bal 및 sta 클러스터가 없는 신규 유전 요소를 나타낸다. dbv ORF4는 다른 글리코펩티드 클러스터에 존재하는 유사한 조절자와 매우 관계있다. dbv ORF 6 및 22는 2-성분 신호전달 시스템을 코딩한다. 이 4개의 유전자는 또다른 글리코펩티드 생산자 균주에서 개별적으로 또는 임의의 조합으로 클로닝되어 발현되어, 형성된 생성물의 수율을 증가시킬 수 있다. 숙주 균주는 비제한적으로 목 악티노마이세탈레스, 과 스트렙토스포란기아세아에, 마이크로모노스포라세아에, 슈도노카르디아세아에 및 스트렙토마이세타세아에, 속 노노무레아에, 악티노플라네스, 아미콜라토프시스, 스트렙토마이세스 등에 속하는 균주들을 포함한다. 대안적으로, 이 유전자는 A40926 생산 균주에서 개별적으로 또는 임의의 조합으로 과다발현되어, A40926의 수율을 증가시킬 수 있다.
C. dbv 클러스터의 사용
본 발명은 또한 전체 A40926 분자, 그의 전구체 중 임의의 하나 또는 그의 유도체의 발현을 위한 핵산도 제공한다. 그러한 핵산은 A40926의 어셈블리를 지시하는데 충분한 폴리펩티드를 코딩하는 ORF를 포함하는 단리된 유전자 클러스터(들)를 포함한다. 한 예에서, 전체 dbv 클러스터 (서열 1)는 적당한 벡터에 도입되어, 원하는 생산 숙주를 형질전환하는데 사용될 수 있다. 한 측면에서, 이 DNA 세그먼트는 큰 DNA 세그먼트를 담지할 수 있는 적당한 벡터에 도입된다. 그러한 벡터의 예는 비제한적으로 세균 인공 염색체 (BAC) 벡터 또는 분화된 유도체, 예컨대 ESAC 벡터를 포함한다 (Shizuya 등, 1992년; Ioannou 등, 1994년; Sosio 등, 2000b년). 또다른 측면에서, dbv 클러스터가 원하는 생산 숙주에서 상용성을 가질 수 있는, 2개의 구별되는 벡터로의 2개의 분리된 세그먼트로서 클로닝된다. 또다른 측면에서, dbv 클러스터는 3개의 세그먼트로 하위분할되어, 각기 분리된 상용성 벡터에 클로닝될 수 있다. 1-, 2- 또는 3-벡터 시스템의 사용예가 문헌에 기재되었다 (예컨대, Xue 등, 1999년).
일단 dbv 클러스터가 적당히 하나 이상의 벡터에 클로닝되면, 이것은 천연 숙주에서보다 더욱 효율적으로 글리코펩티드 항생제가 생산될 수 있는 수많은 적당한 생산 숙주에 도입될 수 있다. 바람직한 숙주 세포는 방선균류 유전자를 효율적으로 발현할 수 있는 종 또는 균주의 숙주 세포이다. 그러한 숙주는 비제한적으로 악티노마이세탈레스, 스트렙토스포란기아세아에, 마이크로모노스포라세아에, 슈도노카르디아세아에 및 스트렙토마이세타세아에, 노노무라에아(Nonomuraea), 악티노플라네스, 아미콜라토프시스 및 스트렙토마이세스 등에 속하는 균주들을 포함한다. 대안적으로, 하나 이상의 적당한 벡터에 클로닝된 dbv 클러스터의 두 번째 카피는 A40926 생산 균주에 도입될 수 있고, 거기에서 dbv 유전자의 두 번째 카피가 A40926의 수율을 증가시키게 된다.
잘 특징화된 숙주에 대한 생산 능력의 부여는, 최적화 및 발달을 가져오는 공정의 수개 부분을 실질적으로 향상시킬 수 있다. 즉, 생산 균주에서의 천연 생성물의 적정 농도가 효과적으로 증가될 수 있으며; 천연 생성물의 정제가 가능한 간섭 활성의 공지된 배경에서 수행될 수 있으며; 착체의 조성이 더욱 효과적으로 조절될 수 있고; 천연 생성물의 변경된 유도체가 발효 조건의 조작을 통해, 또는 경로 공학처리에 의해 더욱 효과적으로 생산될 수 있다.
대안적으로, 생합성 유전자 클러스터가 변형되어, 숙주 세포에 삽입되어, 광범위하게 다양한 대사산물들을 합성하거나 화학적으로 변형시키는데 사용될 수 있다. 즉, 예를 들어 개방 해독 프레임이 다시 정렬되고, 변형되어, 다른 글리코펩티드 생합성 유전자 클러스터와 조합될 수 있다.
여기에 제공된 정보를 이용하여, 통상적이고 공지된 방법을 이용하여, A40926 핵산의 클로닝 및 발현을 달성할 수 있다.
또다른 가능한 용도로서, dbv 유전자 클러스터로부터 선택된 ORF는 통상적인 분자생물학 기술을 이용하여 단리되어 불활성화된다. 노노무리아 종 ATCC39727 염색체에서 상기 ORF를 플랭킹(flanking)하는 DNA 세그먼트를 포함하는 적당한 벡터에 클로닝된 변이된 ORF가 상기 노노무리아 균주에 도입되며, 거기에서 동종성 조합의 2가지 이중 교차 이벤트는 생산자 균주에서 상기 ORF의 불활성화를 초래한다. 이 절차는 효율적인 방식으로 A40926의 전구체 또는 유도체를 생산하는데 유용하다.
또다른 가능한 용도로서, dbv 유전자 클러스터로부터 선택된 ORF는 단리되어 바람직한 프로모터의 조절 하에 놓인다. 이어서, 적당한 벡터에 클로닝된, 공학처리된 ORF는, 상기한 바와 같이 원래의 ORF를 대체하거나, 또는 상기 ORF의 부가적 카피로서, 노노무리아 종 ATCC 39727에 도입된다. 이 절차는 A40926 분자, 그의 전구체 또는 유도체를 생산하는데 중요한 ORF의 발현 수준을 증가 또는 감소시키는데 유용하다.
하기 실시예는 A40926 유전자 클러스터를 동정할 수 있도록 하는 원리 및 방법 및 모든 dbv 유전자를 동정 및 분석할 수 있도록 하는 원리 및 방법을 설명하기 위한 것이다. 이 실시예는 본 발명의 원리 및 방법을 설명하기 위한 것이나, 그 범주를 제한하지 않는 것으로 한다.
일반적 방법
달리 지시되지 않는 한, 세균 균주 및 클로닝 벡터는 모두 공공 수집기관 또는 산업적 출처로부터 수득될 수 있다. 분자생물학을 위해 표준 절차를 사용한다 (예컨대, Sambrook 등, 1989년; Kieser 등, 2000년). 노노무리아를 HT 아가 (Kieser 등, 2000년) 및 래어(Rare)3 배지 (10 g/l 글루코스, 4 g/l 효모 추출물, 10 g/l 맥아 추출물, 2 g/l 펩톤, 2 g/l MgCl2, 0.5% 글리세롤)에서 생장시켰다. 글리코펩티드를 공개된 절차에 따라 단리시킨다 (Lancini 및 Cavalleri, 1997년). 위스콘신 패키지(Wisconsin package), 버전 9.1 (Accelrys)의 프로그램을 이용하여 서열 분석을 수행한다. 공공 사이트(http://www.ncbi.nlm.nih.gov/blast/index.html 및 http://www.ebi.ac.uk/fasta33)에서 블라스트(Blast) 또는 파스타(Fasta) 프로그램으로 데이타베이스 조사를 수행한다.
실시예 1 - A40926 생합성 유전자의 단리
코스미드 벡터 수퍼코스(Supercos) [스트라타겐(Stratagene, 미국 캘리포니아주 92037 라졸라 소재]에서 노노무리아 ATCC39727로부터의 DNA로 게놈 라이브러리를 제작한다. 노노무리아 ATCC39727로부터의 총 DNA를 Sau3AI로 차례로 부분 소화시켜, 단편 크기를 40 kb 범위로 최적화하였다. 부분 소화된 DNA를 알칼리성 포스파타제로 처리하여, BamHI로 미리 소화된 수퍼코스에 라이게이션하였다. 라이게이션 혼합물을 생체외 패키징하여, 이. 콜라이(E. coli) XL1Blue 세포에 트랜스펙션하는데 사용하였다. 수득된 코스미드 라이브러리를, 주형으로서 A. 메디테라네이 DSM 5908 게놈 DNA를 사용하여 bal 클러스터로부터의 세그먼트의 PCR 증폭으로부터 수득된 2개의 프로브로 혼성화함으로써 선별한다. 이 프로브는 올리고 5'-ATGCGCGTGTTGATCTCG-3' (서열 39) 및 5'-CGGCTGACCGCGGCGAAC-3' (서열 40)을 이용한 증폭으로부터 수득된 bgtfA 및 올리고 5'-CGTGGGGGTGGATGTATCGA-3' (서열 41) 및 5'-TCACCATTGGATCAGCG-3' (서열 42)을 이용한 증폭으로부터 수득된 dpgA이었다. 모든 올리고는 등록번호 Y16952로 GenBank에 기탁된 서열로부터 고안되었다. 또한, 올리고뉴클레오티드 Pep8을 이용하여 혼성화를 수행하였다 (Sosio 등, 2000a년). 이 프로브들 중 하나 이상에 대해 양성인 코스미드를 제한효소로 단리하여 물리적으로 지도작성하였다. 그러한 실험으로부터, 도 1에 나와있는 코스미드를 동정하였다. 이에 따라, 노노무리아 종 ATCC39727의 게놈으로부터 동정된 세그먼트는 항생제 A40926의 합성을 초래하는 dbv 유전자 클러스터를 포함한다.
상기 실시예는 dbv 클러스터를 단리할 수 있도록 하는 원리 및 방법을 설명하기 위한 것이다. 다양한 벡터들에서 dbv 클러스터를 클로닝할 수 있음을 당업자는 인지할 것이다. 그러나, dbv 클러스터가 72-kb 크기인 경우, 바람직한 벡터는 람다, 코스미드 및 BAC 벡터와 같은 큰 삽입부를 담지할 수 있는 벡터임을 이해한다. 당업자는 그러한 라이브러리로부터 dbv 클러스터를 동정하는데 다른 프로브를 사용할 수 있음을 이해한다. 서열 1에 보고된 서열로부터, 노노무리아 종ATCC39727 DNA로부터 임의의 단편을 PCR-증폭하여, 그러한 DNA로 제작된 라이브러리를 선별하는데 사용할 수 있다. 서열 1에 의해 커버된 임의의 세그먼트를 포함하는, 상기 라이브러리로부터의 하나 이상의 클론을 동정할 수 있다. 또한, 표 1에 제공된 정보를 이용하여, cep, bal, com 및 sta 클러스터로부터 유도된 것들과 같은 이종성 프로브의 사용을 통해 dbv 클러스터를 동정할 수도 있다. 대안적으로, 이차 대사산물의 합성을 지휘하는 다른 유전자 클러스터는 이종성 혼성화를 허용하기 위해 dbv 유전자와 충분히 관계되는 유전자를 함유한다. 모든 이 변형들은 본 발명의 범주 내에 포함된다.
실시예 2 - A40926 유전자 클러스터의 서열 분석
실시예 1에 기재된 바와 같이 동정된 dbv 클러스터를 샷건법(shotgun approach)에 의해 시퀀싱하였다. dbv 클러스터의 서열은 서열 1로서 본원에 제공된다. 수득된 DNA 서열을 코돈프레퍼런스(Codonpreference) [GCG, (제네틱 컴퓨터 그룹(Genetic Computer group), 미국 53711 위스콘신주 매디슨 소재) 버전 9.1]으로 분석하여, 가능히 코딩 서열을 동정할 수 있다. 그 다음, 이러한 식으로 동정된 각 코딩 서열을 프로그램 Tfasta (GCG, 버전 9.1)을 이용하여, bal, cep, com 및 sta 클러스터와 대비함으로써 분석하였다. 이어서, 이 클러스터들 중 임의의 것에서의 매칭을 동정하지 않는 코딩 서열을 프로그램 블라스트를 이용하여 GenBank에 대해, 또는 파스타를 이용하여 SwissProt에 대해 조사하였다. 마지막으로, 각 ORF에 대한 정확한 출발 코돈을 프로그램 파일업(Pileup) (GCG, 버전 9.1)을 이용하는 관련 서열의 다중 배치로써, 또는 상향류 리보솜 결합 부위에 대한 조사로써 구축하였다. 총체적으로, dbv ORF1 내지 dbv ORF37로 표시되는 37개 ORF를 동정한다. 이 분석의 결과가 표 1에 요약되어 있고, 서열 2 내지 서열 38로서 서열목록에 본원에 제공된다. 상세 내용이 하기에 나와 있다.
2A. 분화된 아미노산 HPG 및 DPG의 합성
dbv 클러스터에 의해 코딩되는 7개 단백질이 분화된 아미노산 HPG 및 DPG의 합성에 관여한다. 즉, ORF1 및 ORF2 (서열 2 및 3)가 A40926 형성에 필요한 HPG 잔기의 합성과 관련되고, p-히드록시만델레이트 옥시다제 및 p-히드록시만델레이트 신테타제를 각기 코딩한다. 이 ORF의 동족체가 다른 글리코펩티드 클러스터에 나와 있고 (표 1), 그의 역할이 실험적으로 구축되었다 (Li 등, 2001년; Hubbard 등, 2000년). ORF 31 내지 34 (서열 32 내지 35)는 A40926 형성에 필요한 DPG 잔기의 합성에 관여한다. 이 ORF의 동족체가 DPG 잔기를 포함하는 헵타펩티드의 합성을 지휘하는 다른 글리코펩티드 클러스터에 발견되고 (표 1), 상응하는 유전자 산물의 관련이 실험적으로 결정되었다 (Pfeifer 등, 2001년; Chen 등, 2001등). ORF37 (서열 38)을 p-히드록시페닐글리옥실레이트 및 3,5-디히드록시페닐글리옥실레이트의 양자 모두의 아미노기전달반응에 필요한 아미노 트랜스퍼라제를 코딩하여, HPG 및 DPG를 각기 생성한다. 그의 역할이 실험적으로 구축되었고 (Pfeifer 등, 2001년; Hubbard 등, 2000년), 티로신을 아미노 공여자로서 우선적으로 이용한다 (Hubbard 등, 2000년). 이 반응은 p-히드록시페닐피루베이트을 형성시키게 되고, 이는 이어서 ORF2 (서열 3)의 유전자 산물의 작용에 의해 p-히드록시만델레이트로 전환될 수 있다.
HPG 및 DPG의 합성에 간접적으로 관여하는 다른 ORF가 또한 dbv 클러스터, 즉 ORF5 및 ORF30 (서열 6 및 31)에서 발견된다. ORF5 (서열 6)는 ORF2 (서열 3)의 생성물에 대한 기질인 p-히드록시페닐피루베이트의 합성에 관여하는 프리페네이트 데히드로게나제를 코딩한다. 그러므로 이 ORF는 티로신을 HPG로 전환하는 사이클을 프라이밍하는 효소를 코딩한다. 따라서 이 ORF의 발현 수준은 A40926 형성을 위해 적당한 수준의 HPG를 공급하는데 중요하다. ORF30 (서열 31)은 세균 게놈 서열로부터 확인된, 기능이 알려지지 않은 가설적 폴리펩티드와 매우 유사한 폴리펩티드를 코딩하며, 최적의 매치가 S. 코엘리콜로르로부터의 NP_626911.1에 의해 나타내어진다 (표 1). 그러나, 이 모든 단백질들은 4-히드록시벤조일-CoA 티오에스테라제의 전형인 보존 도메인을 나타낸다 (Benning 등, 1998년). 이에 따라, ORF30 (서열 31)의 생성물은 이 작은 폴리케티드의 합성 중에, DPG 또는 그의 전구체 중 하나의 방출을 용이하게 하기 쉽다. ORF30 (서열 31)은 dbv 클러스터에 대해 독특하다 (표 1).
2B. A40926의 헵타펩티드 전구체의 합성
ORF 16, 17, 25 및 26 (서열 17, 18, 26 및 27)에 의해 코딩되는 4개 단백질은 A40926의 헵타펩티드 코어의 합성에 관여한다. 이 모두는 다른 NRPS와 상당한 유사성을 나타낸다. 다른 NRPS 시스템과의 정렬에 기초하여, 이 4개 ORF에 의해 코딩되는 단백질의 제안되는 도메인 조성 및 특이성이 표 2에 보고되어 있다.
dbv ORF | 모듈 | 도메인 | 아미노산 | 펩티드 결합 |
ORF25 | 1-2 | AT-CATE | HPG, Tyr | 1-2 |
ORF26 | 3 | CAT | DPG | 2-3 |
ORF17 | 4-6 | CATE-CATE-CAT | HPG, HPG, Tyr | 3-4, 4-5, 5-6 |
ORF16 | 7 | CATC*Te | DPG | 6-7A |
dbv NRPS 유전자의 특이적 역할의 지정은 dbv 클러스터 내에서의 유전 위치특정에 의해 예측될 수 없었다. 사실상, 지금까지 보고된 모든 글리코펩티드 클러스터들의 경우, 모듈의 유전 순서와, 상응하는 아미노산이 폴리펩티드에 혼입되는 순서 간에 동일 선상의 관계가 있으나, dbv 클러스터에서는 그러하지 않으며 (도 2), 그 이유는 그의 NRPS 유전자가 발산적으로 전사되기 때문이다. 그러나, 그의 역할 및 특이성은 하기 관찰을 기초로 하여 예측될 수 있다:
i) ORF16 (서열 17)에 의해 특정되는 단백질의 도메인 조성 및 그것이 티오에스테라제 도메인으로 종결된다는 사실은 DPG 잔기의 인식 및 헵타펩티드의 마지막 펩티드 결합의 형성 및 그에 이은 효소 결합된 티오에스테르의 절단에서의 역할과 가장 일관됨 (표 2);
ii) ORF 17 (서열 18)의 모듈 조직 및 도메인 조성은, 다른 글리코펩티드 NRPS 시스템에서 보는 바와 같이, 헵타펩티드의 아미노산 4 내지 6 인식 및 그의 혼입에 필요한 모듈 4 내지 6을 포함하는 이 폴리펩티드와 가장 일관됨 (van Wageningen 등, 1998년; Pelzer 등, 1999년; Chiu 등, 2001년; Pootoolal 등, 2002년);
iii) ORF25 (서열 26)의 생성물의 도메인 조직화는 헵타펩티드 합성을 개시하고, 첫 번째 펩티드 결합의 형성을 촉매하는 역할과 가장 일관되며, 그 이유는 이 ORF가 2개의 NRPS 모듈, 단 단지 하나의 C 도메인을 코딩하기 때문임 (표 2);
iv) ORF26 (서열 27)의 도메인 조직은 헵타펩티드에서의 세 번째 아미노산의 인식 및 혼입을 초래하는 모듈 3을 포함하는 상기 폴리펩티드와 가장 일치되며, 그 이유는 이 모듈이 (모듈 2, 4 및 5의 역할에 의해 필요한) E 도메인을 포함하지 않고, C 도메인은 존재하고, Te 도메인은 부재하며 (표 2), 이 ORF가 모듈 1 및 7을 각기 코딩하는 것을 배제하기 때문이다.
A40926의 헵타펩티드 전구체의 합성에 간접적으로 관여하는 다른 ORF가 또한 dbv 클러스터, 즉 ORF15 및 ORF36 (서열 16 및 37)에서 발견된다. ORF15 (서열 16)는 기능이 알려지지 않은 짧은 펩티드를 코딩한다. 이 유전자 산물의 동족체가 NRPS 시스템을 코딩하는 많은 클러스트에서 발견된다. ORF36 (서열 37)은, NRPS 또는 폴리케티드 신타제 유전자를 포함하는 다른 클러스터에 의해 종종 코딩되는 단백질인 II형 티오에스테라제를 코딩한다. 이 티오에스테라제의 제안 역할은 효소에 공유결합된 변종 중간체를 제거함으로써, NRPS 및 PKS 시스템이 작동하도록 하는 효율성을 증진시키는 것이다 (Heathcote 등, 2001년). 다른 공지된 글리코펩티드 클러스터에 의해 코딩되는 상기 단백질의 정형체는 없다 (표 1).
2C. 헵타펩티드에서의 방향족 잔기의 가교결합
ORF 11 내지 14 (서열 12 내지 15)에 의해 코딩되는 4개 단백질이 A40926 헵타펩티드 전구체의 방향족 잔기를 함께 결합시키는 가교결합 반응에 관여한다. 이 4개 단백질은 P450 모노옥시게나제에 대한 상당한 동종성을 나타낸다 (표 1). 다른 글리코펩티드 클러스터에서 발견되는 P450 모노옥시게나제와의 동일성 및 bal 클러스터에 존재하는 유전자에 의해 코딩되는 P450 모노옥시게나제에 대해 예측되는 역할을 기초로 하여 (Bischoff 등, 2001년), 하기 예측을 할 수 있다. 즉, ORF 14 (서열 15)의 생성물은 아미노산 2 및 4의 방향족 잔기의 가교결합과 관련되기 쉽고; ORF 12 (서열 13)의 생성물은 아미노산 4 및 6의 방향족 잔기의 가교결합과 관련되기 쉬우며; ORF 11 (서열 12)의 생성물은 아미노산 5 및 7의 방향족 잔기의 가교결합과 관련되기 쉽다. ORF 13 (서열 14)의 정형체는 bal, cep 및 com 클러스터에 존재하지 않으나, sta 클러스터에서 발견된다 (표 1). A47934의 구조는 A40926의 구조와 마찬가지로, 아미노산 1 및 3의 방향족 잔기 간의 가외 가교결합을 포함하기 때문에, ORF13 (서열 14)의 생성물은 이 가교결합 반응과 관련되기 쉽다.
2D. 히드록시티로신의 형성 및 방향족 잔기의 염소화
ORF10 및 ORF28 (서열 11 및 29)에 의해 코딩되는 2개의 단백질은 헵타펩티드에서 아미노산 6으로 존재하는 티로신 잔기에 대한 b-히드록실기의 첨가 및 아미노산 2 및 6의 방향족 잔기의 염소화에 관여한다. 다른 글리코펩티드 클러스터에서 발견되는 할로게나제 코딩의 유전자와의 동일성 수준 및 bal 클러스터에 존재하는 할로게나제 유전자에 대해 예측되는 역할을 기초로 하여 (Puk 등, 2002년), ORF10 (서열 11)의 생성물은 아미노산 3 및 6의 양자 모두의 방향족 잔기로의 염소 원자의 도입과 관련되기 쉽다. ORF28 (서열 29)의 생성물은 비-헴 철 디옥시게나제의 전형인 모티프를 함유하는, 매우 관련된 단백질 부류이다. 그러한 한 단백질은 sta 클러스터로부터 예측되고 (Pootoolal 등, 2002년), 티로신의 b-히드록실화와 관련되는 것으로 제시된다. 이 히드록실화 반응의 정확한 타이밍은 현재 알려져 있지 않다. 그것은, 발히마이신의 합성에서 일어나는 바와 같이, 아미노산 6이 헵타펩티드에 혼입되기 전에 일어날 수 있고 (Bischoff 등, 2001년); 헵타펩티드 합성 중에, 또는 헵타펩티드 골격의 완성 후에 일어날 수 있다.
2E. 당의 첨가 및 변형 및 N-메틸화
ORF 9, 20, 23, 27 및 29 (서열 10, 21, 24, 28 및 30)에 의해 코딩되는 5개 단백질은 A40926 생합성의 나중 단계들 중 일부 단계에 관여한다. 그의 예측되는 역할은 하기와 같다.
ORF9 (서열 10)는 위치 4에 존재하는 아미노산 잔기의 방향족 환의 p-히드록실기에 대한 당의 부착에 관여하는 것으로 입증된, 다른 글리코펩티드 클러스터 (표 1)에 의해 코딩되는 단백질과 매우 관련이 깊다 (Solenberg 등, 1997년). 구체적으로, ORF9 (서열 10)는 A40926 아글리콘에 대한 N-아실-글루코사민 잔기의 부착에 관여하는 글리코실트랜스퍼라제를 코딩한다. 그러한 특이성을 갖는 다른 글리코실트랜스퍼라제는 다른 기재된 글리코펩티드 클러스터에 의해 코딩되지 않는다.
ORF20 (서열 21)의 동족체는 다른 기재된 글리코펩티드 클러스터에서 발견되지 않는다. 이 단백질은 단백질 만노실트랜스퍼라제 부류의 전형인 모티프를 포함한다 (표 1). 또한, 이 ORF의 동족체는 S. 코엘리콜로르 게놈에서 (표 1), 또한 항생제 라모플라닌의 합성을 특정하는 악티노플라네스 종 클러스터에서 (WO0231155), 동정되었다. 라모플라닌은 펩티드 코어에 부착된 만노실 잔기를 포함하기 때문에, 이 모든 데이타는 아미노산 7의 히드록실기에 만노실 잔기를 부착시키는 ORF20 (서열 21)의 역할을 가리킨다. 이 추정적 역할은 또한 이하 실시예 4에서 입증된다.
ORF23 (서열 24)의 동족체는 다른 기재된 글리코펩티드 클러스터에서는 발견되지 않는다. 이 단백질은 아실트랜스퍼라제의 부류 3의 전형인 모티프를 포함한다 (표 1). A40926은 아미노당 잔기의 NH2 기에 부착된 아실 잔기를 포함하기 때문에, 이 ORF의 생성물은 A40926 착체를 특징화하는 화합물 부류를 초래하는 A40926 전구체의 아실화에 직접 또는 간접적으로 관련되기 쉽다.
ORF27 (서열 28)의 동족체는 bal 및 cep 클러스터에서 발견된다 (표 1). cep 클러스터로부터의 ORF27의 동족체가 클로로에레모마이신 중간체의 말단 류신 잔기의 N-메틸화에 관여한다는 것이 입증되었다. HPG 잔기는 A40926에서 N-말단 위치에 존재한다. 결과적으로, ORF27 (서열 28)의 생성물은 글리코펩티드 전구체에서 HPG 잔기의 N-메틸화를 촉매하기 쉽고, 이에 따라 다른 기재된 메틸트랜스퍼라제와 상이한 특이성이 부여된다.
ORF29 (서열 30)의 동족체는 다른 기재된 글리코펩티드 클러스터에서는 발견되지 않는다 (표 1). 이 단백질은 FAD 결합의 전형인 모티프를 포함하고, 이는 헥소스 옥시다제에 대한 상당한 매치를 나타낸다 (표 1). A40926는 아미노산 4에 부착된 글루쿠론아민계 잔기를 포함하기 때문에, ORF29 (서열 30)에 의해 코딩되는 단백질은 글루코사민 잔기의 산화와 관련되기 쉽다. 이 단백질은 또한 세포질로부터 분비된 단백질의 전형인 추정적 시그널 펩티드 서열도 포함하기 때문에, 이 산화는 글리코펩티드 코어에 부착된 글루코사민 잔기를 기질로서 사용하여, 세포질 외에서 일어나기 쉽다.
2F. 외수송 및 내성
ORF 7, 18, 19, 24 및 35 (서열 8, 19, 20, 25 및 36)에 의해 코딩되는 5개 단백질은 세포질 외로 A40926 또는 그의 전구체 일부를 외수송하는 것과 생산 균주에 내성을 부여하는 것과 관련된다. 그의 예측되는 역할은 하기와 같다.
ORF7 (서열 8)의 동족체는 다른 기재된 글리코펩티드 클러스터에서 발견되지 않는다. 이 단백질은 VanY 부류의 카르복시펩티다제의 전형인 모티프를 포함한다 (표 1). 이 부류는, 발생초기 펩티도글리칸에서의 펜타펩티드 사슬들 중 일부로부터 말단 알라닐 잔기를 제거하고, 이에 따라 분자 표적에 대한 글리코펩티드 결합 정도를 감소시키는 것과 관련된 일부 반코마이신-내성 장내구균에서 가장 잘 연구된다 (Evers 등, 1996년). 그러므로, ORF7 (서열 8)는 생산 균주 노노무리아종 ATCC38727에서 A40926에 대한 어느 정도의 수준의 내성을 부여하는 것과 관련되기 쉽다.
ORF24 및 ORF35 (서열 25 및 36)의 동족체는 다른 글리코펩티드 클러스터에 존재한다 (표 1). 그것은 ABC-형 및 이온-의존성 막통과 트랜스포터를 각기 코딩하는 것으로 예측된다. 이에 따라, 그것은 A40926 또는 그의 전구체 중 일부의 외수송 또는 구획화하는 것과 관련되기 쉽다. ORF18 및 ORF19 (서열 19 및 20)의 동족체는 다른 기재된 글리코펩티드 클러스터에서 발견되지 않는다 (표 1). 그것은 부가적인 ABC-형 트랜스포터를 코딩하는 것으로 예측되고, 이들 중 단지 ORF18 (서열 19)만이 막통과 단백질인 것으로 예측된다. 이에 따라, 그것은 A40926 또는 그의 전구체 중 일부의 외수송 또는 구획화와 관련되기 쉽다.
2G. 조절
ORF 3, 4, 6 및 22 (서열 4, 5, 7 및 23)에 의해 코딩되는 4개 단백질은 dbv 유전자들 중 하나 이상의 발현을 조절하는 것과 관련된다. ORF3 (서열 4)의 동족체는 다른 기재된 글리코펩티드 클러스터에서 발견되지 않는다. 이 단백질은 LuxR 부류의 양성 조절자의 전형인 모티프를 포함하고, 스트렙토마이세스 하이그로스코피쿠스로부터의 PKS 클러스터에서 발견되는 하나의 양성 조절자와 주로 관련이 있다 (Ruan 등, 1997년). ORF4 (서열 5)의 동족체는 다른 글리코펩티드 클러스터에 존재하고 (표 1), LysR-형의 양성 전사 조절자의 부류에 속한다. 그러므로 ORF 3 및 4 (서열 4 및 5)는 dbv 유전자들 중 하나 이상의 발현에 필요하기 쉽다. ORF6 및 ORF22 (서열 7 및 23)는 세균 2-성분 신호전달 시스템의 2개 원을 코딩한다. 전자 단백질은 가능히 반응 조절자이고, 최적의 매치가 S. 코엘리콜로르 CutR 단백질에서 발견된다 (표 1). 후자 단백질은 S. 하이그로스코피쿠스로부터의 추정적 센서 단백질 키나제와 주로 관련이 있는, 가능한 막통과 히스티딘 키나제이다 (표 1). 그러므로 ORF 6 및 22 (서열 23)는 dbv 클러스터들 중 하나 이상의 발현을 촉발하는 시그널을 감작하는 것과 관련되기 쉽다.
실시예 3 - ESAC 벡터 내에서의
dbv
클러스터의 단리
실시예 2에 제공된 정보를 이용하여, dbv 클러스터를 하기와 같이 ESAC 벡터에서 단리하였다. pPAC-S1 벡터에서 노노무리아 ATCC39727로부터의 DNA로 게놈 라이브러리를 제작하였다 (Sosio 등, 2000b년). 노노무리아 ATCC39727로부터의 DNA를 기재된 바와 같이 아가로스 플러그에 삽입하여 제조하였고 (Sosio 등, 2000b년; W099/67374), Sau3AI로 부분 소화시켜, 단편 크기를 100 내지 200 kb 범위로 최적화하였다. 수득된 DNA 단편은 기재된 바와 같이 PFGE 겔 상에 간략히 가동하고, 회수하여, 아가로스-겔로부터 분리시켰다 (Sosio 등, 2000b년; W099/67374). 벡터 제조, 라이게이션 및 이. 콜라이 DH1OB 컴피턴트 세포의 전기충격을 포함하는 수득된 단계들을 기재된 바와 같이 수행하였다 (Sosio 등, 2000b년; W099/67374). 수득된 콜로니를 나일론 필터 상에 배치하여, 2개의 프로브를 이용한 혼성화에 의해 선별하고, 노노무리아 ATCC39727 게놈 DNA로부터 PCR-증폭시켰다. 올리고 5'-TCAGGAGACGAACCCCGC-3' (서열 43) 및 5'-GTGCACGAAAGTCCCGTC-3' (서열 44)를 이용하여 프로브 A를 수득하였고; 5'-ATGGACTCCCACGTTCTC-3' (서열 45) 및 5' TCAGGGGAGACATGCGGT-3' (서열 46)을 이용하여 프로브 B를 수득하였다. 이 모든 서열들은 서열 1로부터 유도되었다. 이어서, 이 모든 프로브들에 대해 양성인 ESAC 클론을 단리하여, EcoRI 및 EcoRV로 소화함으로써 물리적으로 맵핑하였다. 그러한 한 실험으로부터, 약 84 kb의 삽입부를 포함하는 ESAC 클론 NmES1를 단리하였다. NmES1는 전체 dbv 클러스터 (서열 1)의 폭을 가지고, 서열 1의 뉴클레오티드 1에 대해 약 5 kb 5', 또한 서열 1의 nt 71138에 대해 약 8 kb 3' 확장한다.
상기 실시예는 dbv 클러스터를 ESAC 벡터에서 수득할 수 있도록 하는 원리 및 방법을 설명하기 위한 것이다. 당업자는 벡터 pPAC-S1는 이 목적을 위해 사용될 수 있는 ESAC 벡터의 단 한 가지 예일 뿐임을 인지할 것이다. 전체 dbv 유전자 클러스터를 클로닝하고, 적당한 방선균류 숙주에 전달하기 위해 유용한 다른 벡터가 기재되어 있다 (Sosio 등, 2000b년; W099/67374). 또한, 비제한적으로 이. 콜라이 세포의 부분 소화, 단편 분리 및 회수, 벡터 제조, 라이게이션 및 형질전환을 포함하는 노노무리아 종 ATCC39727 DNA의 큰 삽입부 라이브러리를 제조하기 위한 다른 방법도 또한 본 발명의 범주 내에 포함된다. 당업자는 일단 dbv 클러스터의 경계가 서열 1에서와 같이 구축되면, 상기한 프로브 A 및 B 이외의 임의의 프로브 또는 프로브들의 조합이, 삽입부가 전체 dbv 클러스터의 폭을 가지는 클론을 동정하기 위해, 노노무리아 종 ATCC39727 DNA로 제작된 라이브러리를 선별하는데 사용될 수 있음을 인지할 것이다. 대안적으로, 서열 1 및 표 1에 제공된 정보를 이용하여, 이종성 혼성화를 허용하기 위해 dbv 유전자와 충분히 관련된 유전자를 포함하는 다른 유전자 클러스터로부터 다른 유용한 프로브를 수득할 수 있다. 이 모든 변형들은 본 발명의 범주 내에 포함된다.
실시예 4 유전자 대체에 의한 A40926 경로의 조작
실시예 2에 제공된 정보를 이용하여, ORF20에서의 인프레임 결실(in frame deletion)을 하기와 같이 구축하였다. 올리고 5'-TTTTGAATTCTCAGGCGATCCGTCCGTCT-3' (서열 47) 및 5'-TTTTCTAGAGCCCGGACACCCGGGGGCTGA-3' (서열 48)을 이용한 증폭을 통해 단편 A를 수득하였고; 올리고 5'-TTTTCTAGAAGTCATGGTGATGTGCGACAT-3' (서열 49) 및 5'-TTTTAAGCTTATGTTGCAGGACGCCGACCG-3' (서열 50)을 이용한 증폭을 통해 단편 B를 수득하였다. 그 다음에, EcoRI 및 XbaI을 이용하여 단편 A을 소화시켰고, XbaI 및 HindIII를 이용하여 단편 B를 소화시켰으며, 양자 모두를 EcoRI 및 HindIII로 미리 소화된 pSET152 (Bierman 등, 1992년)에 라이게이션시켰다. 이. 콜라이 DH5a 세포의 형질전환 후에, EcoRI 및 HindIII로 소화시킨 후, 4 kb 및 1.5 kb의 단편의 존재에 의해 pSM4로 표시되는 수득된 플라스미드가 인식되었다. 분취량의 pSM4를 이. 콜라이 ET12567 (pUB307) (Kieser 등, 2000년) 세포에 옮겨, 균주 SM4를 수득하였다. 이어서, LB에서 하룻밤 배양하여 수득한 약 108 CFU의 SM4 세포를 약 80시간동안 Rare3 배지에서 성장한 약 107 CFU의 노노무리아 ATCC39727과 혼합하였다. 수득된 혼합물을 HT 플레이트상에 전착시킨 후, 28℃에서 약 20시간 동안 배양하였다. 물로 완만히 세척하여 과량의 이. 콜라이 세포를 제거한 후, 200 mg의 날리딕스산 및 15 mg/ml의 아프라마이신을 함유하는 3 ml 연성 아가를 플레이트 위에 깔았다. 28℃에서 3 내지 5주 동안 추가 배양한 후, 노노무리아 접합완료체를 아프라마이신을 포함하는 새 배지 상에 도말하였다. 균주 SS18라고 하는 그러한 한 접합완료체를 추가 가공하였다. 이어서, 균주 SS18을 아프라마이신이 없는 HT 배지에서의 수차례 통과시키면서 성장시키고, 적당한 희석액을 아프라마이신이 없는 HT 아가 상에 플레이팅하였다. 이어서, 개별적 콜로니를 올리고 5'-TTTTGAATTCTCAGGCGATCCGTCCGTCT-3' (서열 47) 및 5'-TTTTAAGCTTATGTTGCAGGACGCCGACCG-3' (서열 50)을 이용하여, PCR에 의해 분석하였다. 1.5 kb 밴드의 존재에 의해, ORF20의 결실 대립유전자를 포함하는 콜로니를 인식하였다. SSM18이라고 하는 그러한 한 콜로니를 HT 배지에서 성장시키고, 오센틱 스탠다드(authentic standard)와 비교함으로써, 데만노실-A40926의 형성을 확인하였다 (Malabarba 및 Ciabatti, 2001년).
상기 실시예는 서열 2 내지 38에 의해 특정화는 것들 중 임의의 것 중에서 선택되는 ORF를 A40926 생산 균주 노노무리아 종 ATCC39727에서의 변이 카피와 대체할 수 있도록 하는 원리 및 방법을 설명하기 위한 것이다. 당업자는 서열 1에 의해 특정된 클러스트에서의 인프레임 결실을 일으키기 위한 방법들 중 단지 한 예임을 인지할 것이다. 당업자는 또한 인프레임 결실이 변이를 발생시키기 위한 단지 한 방법이고, 비제한적으로 프레임-시프트 변이, 삽입 및 부위-지정 변이를 포함하는 다른 방법들도 또한 서열 2 내지 38에 의해 특정된 ORF 중 임의의 것에서의 공변이체를 발생시키는데 사용될 수 있다는 것을 이해한다. 당업자는 또한 서열 1에 의해 특정화되는 ORF 중 임의의 것에서 변이를 발생시키는 방법을 구축함으로써, 이 동일 방법은 상기 동일 ORF의 발현 수준을 변경하는데 적용될 수 있음을 이해한다. 이 것을 달성할 수 있는 방법의 예는, 비제한적으로 노노무리아 종ATCC39727 게놈 내의 임의의 곳으로의 상기 ORF의 다중 카피의 통합, 상기 ORF의 발현을 조절하는 프로모터의 변경, 그의 발현을 간섭하는 안티센스 RNA 또는 전사 종결자의 제거를 포함한다.
마지막으로, 접합완료체 및 그의 유도체의 선택 및 선별 방법에서, 변이된 대립유전자를 공여자 및 수령자 균주의 복합화 및 배양을 위한 조건하에서 노노무리아 종 ATCC39727에 도입하는데 사용되는 벡터에서의 변형들은 모두 본 발명의 범주 내에 포함된다.
참고문헌
SEQUENCE LISTING
<110> Vicuron Pharmaceuticals Inc.
<120> Genes and proteins for the biosynthesis of the glycopeptide antibiotic A40926
<130> G69039
<160> 50
<170> PatentIn version 3.1
<210> 1
<211> 71138
<212> DNA
<213> Nonomuria
<220>
<221> misc_feature
<222> (40)..(1140)
<223> ORF1; negative strandedness
<220>
<221> misc_feature
<222> (1259)..(2329)
<223> ORF2; negative strandedness
<220>
<221> misc_feature
<222> (2558)..(5161)
<223> ORF3; negative strandedness
<220>
<221> misc_feature
<222> (5266)..(6231)
<223> ORF4; negative strandedness
<220>
<221> misc_feature
<222> (7183)..(8292)
<223> ORF5; positive strandedness
<220>
<221> misc_feature
<222> (8320)..(8973)
<223> ORF6; positive strandedness
<220>
<221> misc_feature
<222> (9069)..(9659)
<223> ORF7; positive strandedness
<220>
<221> misc_feature
<222> (9708)..(10667)
<223> ORF8; negative strandedness
<220>
<221> misc_feature
<222> (10670)..(11896)
<223> ORF9; negative strandedness
<220>
<221> misc_feature
<222> (11950)..(13419)
<223> ORF10; negative strandedness
<220>
<221> misc_feature
<222> (13479)..(14741)
<223> ORF11; negative strandedness
<220>
<221> misc_feature
<222> (14823)..(16019)
<223> ORF12; negative strandedness
<220>
<221> misc_feature
<222> (16009)..(17163)
<223> ORF13; negative strandedness
<220>
<221> misc_feature
<222> (17185)..(18366)
<223> ORF14; negative strandedness
<220>
<221> misc_feature
<222> (18462)..(18671)
<223> ORF15; negative strandedness
<220>
<221> misc_feature
<222> (18668)..(24259)
<223> ORF16; negative strandedness
<220>
<221> misc_feature
<222> (24278)..(36529)
<223> ORF17; negative strandedness
<220>
<221> misc_feature
<222> (36760)..(39021)
<223> ORF18; negative strandedness
<220>
<221> misc_feature
<222> (39153)..(39851)
<223> ORF19; negative strandedness
<220>
<221> misc_feature
<222> (40125)..(41732)
<223> ORF20; negative strandedness
<220>
<221> misc_feature
<222> (41772)..(42584)
<223> ORF21; negative strandedness
<220>
<221> misc_feature
<222> (42868)..(44130)
<223> ORF22; negative strandedness
<220>
<221> misc_feature
<222> (44226)..(46355)
<223> ORF23; negative strandedness
<220>
<221> misc_feature
<222> (46632)..(48578)
<223> ORF24; positive strandedness
<220>
<221> misc_feature
<222> (48575)..(54868)
<223> ORF25; positive strandedness
<220>
<221> misc_feature
<222> (54865)..(58056)
<223> ORF26; positive strandedness
<220>
<221> misc_feature
<222> (58152)..(58985)
<223> ORF27; positive strandedness
<220>
<221> misc_feature
<222> (59046)..(60641)
<223> ORF28; positive strandedness
<220>
<221> misc_feature
<222> (60874)..(62445)
<223> ORF29; negative strandedness
<220>
<221> misc_feature
<222> (62887)..(63312)
<223> ORF30; positive strandedness
<220>
<221> misc_feature
<222> (63469)..(64587)
<223> ORF31; positive strandedness
<220>
<221> misc_feature
<222> (64599)..(65240)
<223> ORF32; positive strandedness
<220>
<221> misc_feature
<222> (65237)..(66541)
<223> ORF33; positive strandedness
<220>
<221> misc_feature
<222> (66538)..(67335)
<223> ORF34; positive strandedness
<220>
<221> misc_feature
<222> (67332)..(68618)
<223> ORF35; positive strandedness
<220>
<221> misc_feature
<222> (68685)..(69423)
<223> ORF36; negative strandedness
<220>
<221> misc_feature
<222> (69608)..(70894)
<223> ORF37; positive strandedness
<220>
<221> misc_feature
<222> (71065)..(71138)
<223> attL site, remnant
<400> 1
gggggctggg cctgctgcgg ctcgcgagcg ggctgacggt caggagacga accccgcgcc 60
ggggcgggtc gtcctgagtg cctgggctgc ggcgacgtcg ccgcagcctg ccaggccgag 120
cccgtcctcg atctcggcac ccaggaggcc gagcaccgta cggacccccc gttcgccgtc 180
cgcggccaga ccccagatca cggggcgtcc gacgagcaca cccgacgccc cgagcgccag 240
cgccttgagg acgtcggctc ccgaccggac gccaccatcg agcatgatct cgcagcggcc 300
cccgacgctc tccgccaccc ccggcagcgc gtcgagactg gccacggcgc cgtcgagctg 360
acgtccgccg tggttggaga ccacgatgcc gtcgatgccg aggtccgcgg cgcggcgggc 420
gtcctcgggg tgcagaatgc ccttgaccac cagcgggagc ccgctggcgg cccggagggt 480
ctcgaggtac gaccagtcca ccgcggcgga gagctccatg gccgtgtgcg ccgccagcgc 540
ggagccgccg gaggcacccc gatgagcctc ggtcccggag ttcgccgtca ggtgcacggg 600
ccgcacgtgc gggggcaggc ggaaccggtt gcggatgtca cgtggcctgc ggcccatcca 660
cggcacatcg agcgtgagca tcaacgcccg gcaccccgcg tcctcggccc ggcggatcag 720
gccgagggtg gcggcgtgct cgcgaaggca gtagagctgg aaccagacgt gtccccccag 780
ggcggtgacg tcctccaccg ggacgctgct caaggtgctg acggtgaacg ggaccccggc 840
gtcccgcgcc gcccgggccg tcgccagctc accgtcggga tgcacgagcc ggtggtaggc 900
gacgggggcc accgccaccg gcatcgtcgc ggggtggccc agcagcgtcg cacgggtgga 960
gcacgccgac acgtcctgga gcacccgcgg caccaggaac acccggtcga aggcggcccg 1020
attcgcacgg agggtctgct cgcggccgct cccgccgtcg atgaagtccc ggacgtcggc 1080
ggggaggacc ttggcggcga tctcctcgta ctcggcgagg cagacgggac tttcgtgcac 1140
gctgtcagga cgctcgggcc cgctgccggg acgctcgggc ccgctgccgg gacgctcggg 1200
cccgctgccg ggacgctcgg gcccgctgcc gggacgctcc cgcacgctgc tgggacgctc 1260
atgcacgctg ctgggacctc gccacctcga cggcctcgta gagggccttg atgttggcgc 1320
ctccgaaggt gcgggctccc tgccgctcga tgacctcgaa gaagagggtc tcgcgcggat 1380
gggtggacgc cgtgaagatc tggaagagct gtccgccgtg atcctcgtca gcgagcagtc 1440
ccgtcgcgcg caactggtcc accgtgtgac cccggatctg gatccgtgat tcgagcaggt 1500
cgtagtagct gcccggcgtg ctgaggaagc ggacgccccg ctcggacagg gtgttcacgg 1560
cgtgcacggc gtccgaggag gagaaggcga cgtgctgcac cccggcaccg gcgtgccgtt 1620
cgaggaacat gtcgatctgg ccggcctcgg ccatcgggtc gggttcgatg agtgtcagcg 1680
tgacggcgcc ggaggcgctc tgcaccacct tggactccat ggcctgggtg ccgacctcga 1740
tgcgttcctt gaaggtctcg ctgaagccga gggtggcgac gtagaagtcg gtgatgatgt 1800
cgaggtcacc cgtgggcagg cacacggcga agtggtcgat gtcgagcagc tccgccgcgt 1860
ccgcaccgga ctcggcggcg gacggagcct cggagaagcc gaccggcagg ccggggtcgt 1920
cgccggggtc ccgctggacg agggtgtgga ccacgtcgcc gaagccgccg atcgcggcgg 1980
agcaggccgg cccggggccg gggtgccggg acggggaccg tacgggccgg gcgccggcgg 2040
ccacggcatg ggtgaagacg acgtcgacgt cgggggtccg cagggcgatg tcggcgaccc 2100
cgtcgccgtg cgtccgcaca taggccgaag ccggatggcc gtcggacgtg gcctgggtga 2160
ggacgagggt gatgcggccc tgccggagcg cgacgctgcg atggtcgctg gcgttcgccg 2220
tgcccacgac ggcgaagcgg tattcgtcgg tccaagggag agtggcgacc ttcagatccg 2280
ctacgtacat ttcgacgtaa tcaacggcga gaggcggaag cgattccata ttccgacgct 2340
acggccgggc ggggaggttc gcaccgtgtc cattggacgc gctcgcaggc cgcgctcaca 2400
gcagattccg gtacattccc gaggcctttt caggccggcg tggacggtcg gcggatcagg 2460
cttcataaaa agcctgccct ggcgtattct cgggttaatc aaccccgatg gatatcctgc 2520
ccgaggccgg cgaattcggc ttgtcgaact cttcgctcta cagccgcact gcctcacgcg 2580
gctcgcggcc ggctgtggcc gtcgccttat cggcgatgtc cgcggcgaag aggttgccca 2640
ggtcaccccg agtctgtacg tggagtttcc gatagatcct ggtgagatgc tgctcgaccg 2700
tgctgcgcgt gatgtagagc gcctcggcga tctcacgatt ggtgtgccca cgggcggcga 2760
gcacggcgac ccgccgttcg gcgccgctca acggtgcggt ctcaccatga tcgtgctgtg 2820
cggcgagcct cctcatcaag ggcttcgcgt tgcactcgcg ggccagctcc tgcgcccgca 2880
cccagtaggc ccgggcctcg tccttgccgc ccttgagctg tggggtcccg gcgaggtcgc 2940
agagggaaag ggccagctgg tagcgatcct gggcggcctc cagcgcgtcc acggactgca 3000
tcagcaaccg ctggcgctgt gcgggcttgc tcagctgcgc gtgcaggcgg agggcgaccc 3060
cgtacgtccg caggtcaccg gaggaggtgt gggcgatctg ggccgtgacc agatcggccg 3120
ccctgcgacg ccagcccagt tgcaggcacg ctcgcgccgc gccgaggcgc caggggacca 3180
cgtcggacag gctgctgccc cagcgctgga ccgcctgccc gcatgccagg aagccggcga 3240
aggcggcgcg aggctgctcc gtgaccaggt ggtagtgcgc cctcgcgagc tcgtagccga 3300
tcccgaaggc ggtctccgcc gtctcgcggg gcatcggcac cgccacggtc gccttcgcct 3360
cgtcgaggtg gcccatcgcg gtctgggcat ggagcagggt gctgagtggc gcgccgatcg 3420
cgacgcccca gccgctgggc tgcagtatgg tcagcgcctc ctgcgcatgg gcctcggccc 3480
ccgccaggtc gcccttgcgc cacgccgtct ccgcccggat ggcggagatg atcgccttcc 3540
aggtgggcgc cttcgtcacc ccgggctcct tgaggagcgt ctcgcaggag gccgccacct 3600
ccgacactcc gcccagcagc agtgccatca gagccgagat gatgctgtcc atcgcctcat 3660
ccgtcggctc cgcctgacgc aggatccggc gcgcgtcctc gactgtctgg cccatcgagc 3720
cgcgggcgga ccggggcaat ctgtcgagaa gcaccgggtg gacgtggcac atcgcgatca 3780
aggacgcgtc ggcgtccctg tcggcgacgc tcggcctcag ccgatcgatc agctccgccg 3840
cgtcggcgaa ccggccgtac cacagcagct ggcggaacag ctccatcccg tgagatccac 3900
gcaacgcacc cgagcgcgtg gcgtcgagca gatcgggcac gtgacgtgcc gccactgccg 3960
ggtcgacgcg ccactccgcc gcggcgagca tcaccttcac gtccagccgg cgaggcgtgc 4020
cccagccgga cgccagggcg agccgtaagc acttcatgac agcgacgaaa tcaccctcgt 4080
cgaacgcctg ccttcccgct tcgacgagga cgtcgaaagc ccactcctca cccgaccagc 4140
ccgcctccag caagcgcgtg gccacagccg acggtgggcc tccccgccga tggaggatct 4200
ccgcggcccg ccggaggatc tccatcctgc cgtaggaggt catgcgcccg agtacggcca 4260
ggcggcccgc ctcatgacga aagcgccccc cggccaggag cccggcgcgc tccagcatcc 4320
ccatcgagcg tgtcgcggca ggaggggcga tgcccacgag ctcgcccacc gcgtccggcg 4380
tggcgtgctc gccgaggacg gccaccgcct ccgcgacgcg gacggcctcc ggctcgcagc 4440
catgaacgca cgctgccacc gcgctcatga aggagtcgcc gaccacgagc ccgggcgcgc 4500
cggcctcctg atcctcgatc agcgcccgga ccagcagcgg gctgccgccg ctgaagcggt 4560
agaggtcgtc ggcgagctgg tcggccgtct cggccccgag gtgctcggtg gcgaactgcc 4620
tgaccgccgg acggggcagg agcggcagct cgaccagctc gatgccgggc aggcgcagca 4680
aggactcggc gacatggggg agaggggccg gcggccggtc ctggcagatc gtgacggcga 4740
tcatcatcct ggtgtccgtc agcaggggcg tcatggacag gatggccagc agggacggat 4800
cgtcggcgag atccacgtcg tcgatcgtca ggaggatcgg gttcgcctcg gccatctgga 4860
acagggagac gcagacgtcc tcgaccgcgt caccgcccct gcgcgcggtc agccgctccg 4920
ctgccccgcg gcccaggatc tggtcggcga ccccccagtc cagcgactgc tccgccggcg 4980
tgcagcgggc cgtgaccagc cggatgccgg ccgcgatgga tcgcatgccg agctcgtgga 5040
ggatggcggt cttgccgccg accacaggcc ccgtgatgac ggccactcca ccgcggccgg 5100
ccgcggtgga atcgagcaac ctcgtcagac tcttcagttc acgatctcgc ccgaacagca 5160
ctcttgctcg tcccccaagc ggttcgtcga cttggtttgc cgtgtgcctg atctggtcct 5220
ggtcccgtcg ctctacatac ggccgcccgg ctcatccact cgtgctcatc cagcggccag 5280
atcggtcgcc cgcccctcca ggcgatccgc gaacgctgcc cagatctggg catgatccct 5340
ggcgcatctc gcgacaacgg tgccccaatg cggcggcact ccgcgcaaga tcctttccca 5400
ttcctgcccg tcgatggagt gcaatgatag cattcgcaac aaaattcggc cggtttcggt 5460
cagacgtaat gcgggatcgg ccttgagcct ttccagcacg gcttggcggt ctcggccgtc 5520
gacgtggccg aaatcctgtt ctgcccgacg cagtaattcc ggcttggtcc ttaatctccg 5580
gctcccgtcc ggaatcgggc tctcaccgtg ctccaaccgg cctctcacat cccggaccgt 5640
ctccggggag atgccgacct gtttggcgac ctggcggagc gaaaggtccg gatggctgcg 5700
gatgagctcg gcggcgagtc tcctcccctc tgagctgtcc accggacgga tgcgcccgtc 5760
ccgcccgatt ctggcctcgt caccgccttg tcctctgcgc ctgcgcaggt cggccaccgt 5820
gccggcggag atgccggtcg ccgaggccac ccgtcgatca gaccactgcg gatgtgtccc 5880
gatgatccgg acggccgcac gcttgcggtc ggccagtgag agcggcagcc cgtgccgcac 5940
gttcgcctcg acggccagga cgaaggcgtc cgattcggtg ccgtcgatca gcctcaccga 6000
gattgttgtt tcacccctga cccgcgccac cttcaaccgg tgcaggccgt cgatcacccg 6060
catcgttgga cggtggacga gaatgggcgg aagctcccct tgtgccgaca acagggtctc 6120
gacgtgctct ggatcctcgc ccgaagtccg gggtgagtac acagaggaca gccgggacag 6180
ctcgatttcg acgacaggga gagtggctat gtcaactccc gtcgggtcca cctagcctcc 6240
gattcgatta gcgtcatatc ggagccgggg gcgttcaaaa aacaacccag ccgcgtgcgc 6300
cgcgcgcacc ttcgacgatt ccccgtcgcg cctgcagcat ctggtcccgg gcaagcctgg 6360
acttcccggc gcgagctgca taaatcgatc ggccaagtgc tctgtcgaga gaatgcgtcg 6420
catcctcttt tcttcggcaa ctccacgcgg caaagaattg gacgctgtcg ccgcgaatcc 6480
gtagccgtct acctcatcga attgcagaac gcttcccgtt agcattccga tcactccgac 6540
tttcggttag gccttcctcc ggaaggttaa aggaggctgt gcaggtcgaa ccacccccta 6600
tcccggacat ccacccccct agtttcggat aagaccgatg cgcggggttg cgcctctgtc 6660
gcgaagcgga gtatccggtg ctggaccgcc cgaatcgagc ggtcaccatg cgtgtcaatc 6720
cgtgtgtatt ggcatgcgcc gtcggcgcga gcccggcggg gccgcggcgg tcccacggtt 6780
tcgctcatga caccgtctcc aggtgagggt gatcgcggta gccggccacg ggcgcgctgc 6840
cgcagcggcg gccatgctga tctgcccatg gaccagcagg ccgacggtga ggtcccgccg 6900
gacggccggc tcccggtaca acgtacgtca gttcttctcg gcgatctagg ggagtgggcg 6960
gggtgccttc gccgggcatg cgggcggcct gtcctttggc aattgacagg cgtgaatgca 7020
gaaaggagcg cggccacctc tgacctgccg agtaagggaa tggattactc atcaatggcg 7080
ccggtggcca cggaactcgc ccggcgatcc ggcgtgtcca aatggcgcgg tgcccaggcc 7140
cgccgatgga caccgcccgg tgcgcgggct taagaagtag ccgtgaccct ggagaggacg 7200
ctcatcgtcg gcaccggtct gatcggcacc tccgccgcgc tcgcccttcg cgagaagggg 7260
gtggcggtct acctgtccga cgtcgacgca catgccgtac ggctggcgcg agcgctcggc 7320
gcgggccagg agtggaccgg tcagcgcgtg gacctggcat tgatcgccgt gcccccgccc 7380
agcgtggggc agcggctggc cgatctgcag cagcggcggg ccgcgcgggc gtacaccgat 7440
gtgaccagcg tcaaggtcga tccgatcgcc gacgcggagc ggctcggctg cgacctgacc 7500
tcctatgtcc ccggacaccc gctcgccggc cgggagcggt ccggcccggc cgccgcccgt 7560
gccgatctgt tcctgggacg tccctgggcg ctctgccccc gccctgagac gggtgcggat 7620
gccgtgcggc tggccaggga gctggtctcg atgtgcgggg cggagcccta caccgtgagt 7680
gcgggcgagc acgacacggc ggtggcgctg gtgtcgcacg ccccgcacgt ggccgcgtcc 7740
gcggtggcgg cgcggctgag ggacggcgac gacgtcgcgc tggccctggc ggggcagggg 7800
ctgcgcgacg tgacgcggat cgccgcaggg gaccccctgc tgtggcggat gattctcgcc 7860
gcgaacgccc tgccggtggc cggggtgctg gagcggatcg cggccgatct cgccgcggcg 7920
gcctcggcgc tgcggtccgg cgatctcgac gatgtgacgg atctgctgcg gcgcggcgtg 7980
gacggccacg gccggatccc cgacaagcac ggcggcccgg cgcgtgacta cacggtgatc 8040
caggtggtgc tgcaggatcg gccgggagag ctggcgaggc tcttcaacgc ggcggggctc 8100
gcggacgtca acatcgagga catccgcctg gagcactcgg ccggcctgcc ggtcggggtg 8160
gtcgaggtct ccgtgcgccc ggaggacacc ggccggctca ccgaggcact gcgcttccac 8220
ggctggcacg tcccgcccgt ccccgacggc aactcgagga tcgaccggac gcgagctatg 8280
gtgtcagact gacagccccc gatcgagacg gcgacacgaa tgcgcgttct ggtggtggag 8340
gaccaagtcg acctggccga ctcggtggcg cgggtgctgc gtcgcgaggg catggccgtc 8400
gatgtcagtc atgacggcga tgacgcacag gagcgcctct ccgtgatcga ctacgacgtc 8460
gtggtgcttg atcgggatat tcccggcgtc catggcgacg agctgtgcgc tgagatcgcc 8520
gtggacgatc gcaggacccg ggtgctgatg ctcaccgcgt ccgggacgac cgctgaccgg 8580
gtggcgggcc tgagcctggg cgccgacgac tatctgccga agccgttcgc cttcgccgag 8640
ctggtggcgc gcatccgcgc cctgggcagg cgcgcgcatc ctcccgcgcc gccgatcctg 8700
gtccacggcg acctgcggct cgatccggcg caacgggtgg cgatcagggg cggcatgcgg 8760
ctgccgctga ccaccaagga gctggcggtc ctggagcatc tgctgaccgc gcgcggccgg 8820
gtggtgtcgg ccgaggagct gctcgaacgg gtctgggacg agcaagccga cccgttcacc 8880
accaccgtga aggcgacgat caaccggctg cgctcgaagc tcggccagcc gccggtgatc 8940
gaaaccgtcc cgcgcgaggg atatcgcatc tgatccgcgc ggtcacagag cggtcacacg 9000
ttctctgacc ctcgtgtcac cttctgctcc gtagaactgg tgtcagatca ccagactgga 9060
ggagagggat gaggagaagc gagggtgacg acgaaccacg cactctcccg cctcgggccc 9120
gggaccgggt gtacaccgcg gtcacgcggg tgctcgccgt gctcctgctg cccgtggcgt 9180
tcgtccgtca gcccggccgc gcccgcgagc tggcctgcgg ctgggcgttg aggatgcgat 9240
tcccggcaga ggacctcacc gggctcaccg acggcgccag ggcggcgttc accgcggcgc 9300
gggccgaggc gctgtggcgt cacggccagc tcgtcggtct cacttccgga taccgcgatc 9360
cccgggtcca gcagcggatg ttcgaggagg aggtgcgccg ctcagggtcc gtggccgccg 9420
cacggatgtt cgtggcgccg ccggccgagt ccaaccacgt caagggcatg gcgctggacg 9480
tacgcccgca cgagggcgcg cgctggctgg aggcgcacgg cgcccgctac gacctctacc 9540
gcatctacga caacgagtgg tggcacttcg aacaccgccc ggagtgcggt ggcacgccac 9600
cacggcggct accccaccca ggcgcggcct gggcgagccg gaacgggggc cgggtctagc 9660
tagggcacgg ggtcgccgcg gggatcggtc cccggccggc ttcggcgcta gggcagctcg 9720
atgcggccgc tccgctgata ccagtgacgg cccgccagca aatgggtgac gaccgccttc 9780
tccagcgtcg agcgctgcgg aagctcctcc agcggctggc cgttgtagcg gaagacgaac 9840
tccaggatcg cgtcgtcccc gtcctgcggt tcggagtcga ggagcgtcca gccgcgtctg 9900
agctgcagga tgtgggagtc ctcggcgaga tactcggcca gctgcggatc gagcagccac 9960
gaggtgcctg tcgccgcccg ggcgccgtgc tcgggaaaat gccgttcgaa gaacgggcgg 10020
gcacgacgga gcgagtcgta atagatgtcg gggatcagcg gcccgcccac ttcggggatg 10080
tgcaggccga ggacgggcgt gccgtccttg gcgacggcca ggttgtactg gagccggccg 10140
agccggtaga ccaggccgcg cacgagcagg gtgagccacc acggcatgtt cgtgccgccc 10200
tcgccgtact tgcggcgatg gatggccacc gattccccca gctgcgtcag ggtctcccag 10260
gtggtcgcct cggggatgtc ccgtgtcgcg tggaagcgcc gcaacgccgg aagcgtcgcg 10320
aggaagacgt acacgtggaa gtagcgggcg gcggccccgg tctcgtacgg cagggtcggc 10380
ccaccccgta ccttcacctt gtagtcgccc atgtgccgga cgagctcgtg gtgggcgcgt 10440
tcgagcagcc accacagggc cgggtcgcga tccgggccgg gggtggccgc cacgatctcc 10500
tcgacgtcgg gagccggcac ctccagccgg tgtaagagat cacgagcctc atcgccctga 10560
ggcaggcgca ccggctcggg gggcggtccg agctcctcga gccgggagag ccacgccgtg 10620
gcgttctctc ccagccgcag ctgcctgcgc acgctctcag catccatcgt cactccgttc 10680
tgttccgccc ggccccggcg gccgtgtcga gcaggagttt cgcggccacg gccgccccgt 10740
cggcgcggat cttcccggcc acgtcgatcg cccgcgcgcg ggtctcggga gccagcgccg 10800
tggtgagcgc ggccgacagg ctctccacgg tcggcacccg cccgtcgtgt gccacgccga 10860
tgcccagctc ggccacccgg ccggcgtggt acggctggtc ggtcatctgg ggcaccacga 10920
cctggggagc gcccgcccgg gtgaccgcgg tcgtgatgcc cgcgctgccg gcgtggacga 10980
cggcggccac ccggccgaac aacacctggt ggttcacctc gccgacggtc aggcagtcgc 11040
tccggtcgtc gggcggggct aggccggccc agccacggga gacgatcacc cggtggccat 11100
gggcccggat cgcctcgatg gccaccctcg cggcgtcggt gggggcgggc ccgctgccga 11160
actccacgtg caccggtggc gggccggcct ccaggaacgc ctccacctcg gcgggcaggg 11220
gccgttcgtc gggcatgatc cacgcaccgg tctgcacgac gtcgaggtcc gtccgctgca 11280
gcggggccag gaccgggtcc gcggccagga aggggcgatc ggtgtagccg tagctgaaga 11340
tgtcgtccac cggcggcagg ccgatcgagg cccgccggct gttgagcgcg gcaccgaacc 11400
gctggtaggc gccctggttg ttgcggtccc acagcacccg gttgtcggtc acgtcccgcg 11460
cgggctgctc accgaggggt ggcggcggcg ggtagtacgg cgacggcaca tagatggggc 11520
agtagaagac gtagacgtag gggatgccga gcttctcggc caccgaccgg acggcgaccg 11580
ccgccgacag cacgccgctc accaccatca cctcgcaccc ctcggcggcc ggcaggacct 11640
ggtcgagctg cgtggcgatg gcctcggcgt cgagccgggg cacgtcctcg agcgagggcg 11700
gcctcttccc gtgcagcttc gcgcgcatcg aggtgccgac cggcaccagc ggcaccccgg 11760
cctcggccag tctctccgcg cagtccggcg gggcgcacat ccgtgtctcc gcgcctagct 11820
cacgcagctg gaccgccagg cccagcagcg gttcgacgtc cccgcgtgat ccggacgtcg 11880
acaacaacac gcgcatgtcg tatccctgtt ccgtggattc tggtgcggat cgatcggaag 11940
gccggagcct caggggtgat gtgtcagcca tctcatcccg tcgggtgagg tcaccagccc 12000
gccggggaac agtggctgct cgggctcggc gtccgcaccg agcaccgccc tcatctgctc 12060
ctgcccgccc tcctgcatca cctgtttgac cacctgtgac ttgaacagcg gcaccatgct 12120
ggagtcgtcg ccgtcggcca tctgatcgac ggccgcggcg aactcggcgc tgcgctcggc 12180
gatccgccct gaggtcgcca gcgccgtctc gccggaggac agaccgccca ccaggtccac 12240
gaacgactcc agctcggtgt actccttgtt gttggtgacc ttcttggcgt gccagaaata 12300
cgactcctcg ttcacgttca tctcgtagaa cgccagcagg aactcgtagt acacgctgta 12360
ctcgcggcga tatcgcgcct cgaactcatg cagcgcgatc ttctcctcga cgtcaccggc 12420
caggacgctg ttgatcgacc gggccgccag gaggccgctg taggtggcca ggtgcacccc 12480
ggaggagaac accgggtcca cgaagcacgc ggcatcgccc accaggatca tcccgggccg 12540
ccagaacttc gtctggtggt aggagtagtc cttgcggacc cgcagctgcc cgtacttgcc 12600
ggtcgtcacc cggcgcgccg gcgcgaggta ctccgagatc agcgggcact cggcgatcag 12660
cgcggccagc gccttctccc gatcgccctg gatcttctcc gccatctccc ggcgcaccac 12720
cgcgcccacg ctggtcagcg tgtcgctcag cgggatgtac cagaaccagc cgctgtcgaa 12780
ggccacgctc aggatgttgc ccgagtacgg ctccgccagc cgcttgccgc cctcgaagta 12840
accgaacagc gccaggctgc ggaagaactc cgaatagttc cgcgtgccac cgacgctgga 12900
atacaaccgg ctcttgttgc ccgacgcgtc gatcacgaaa cgcgcggaca ccgcgtgctc 12960
gccgccgtca ggatcgacgt aacgcaggcc ggtgacccga tcgccgtcct cgatcacctc 13020
ggtgaccgag catccctcac gcaccaccac gcccttgcgt ctggcgttgc cgagcaggat 13080
ctcgtcgaag cgtgcccgct ccacctggta ggcgaaagtc gtcggacccg tgatccgcgg 13140
agagacggag aaggagaacg tccacggctc cggccgcgcc ccccaccgga aggtgccccc 13200
gcgcttcacg ggaaaccccg ccgccgcgag ctcgtccgtc accccgagca tccggcacac 13260
cccgtgcacg gtcgagggca gcaacgactc gccgatctga taccgcggaa agacttcctt 13320
ctccaccagc agcacccgat gaccctgcat ggccaccagt gtcgccacgg tcgaaccgcc 13380
agggccgccg ccggcgacca ccacatcgaa ctcttccacg gacttctcct ttttcgttgt 13440
ggtcatgcga agtcgcccgg catttcggcc gcaggccgct accaggtgac cggcaactcg 13500
tccgggcaat cgatgaacgc gttacggaac ttcacttcct cggcggacac cgccaggcgc 13560
agcccgggaa accggcgcca caaactctga tacgccatgc gcagcagcgt cctggctatc 13620
gccgcgccta tgcagtaatg gatgccgtgc ccgaacccga cgtgcgagcc gcagtcacgg 13680
cgcacgtcga ggacgttggc attcggcgtc agcgcctcgt cgcgattcgc catcagaatc 13740
gagcacagga cgtaatcccc ggccttgatc agctggccgt cgacgaccac gtcccggacg 13800
gcgagccgtg gattcggctg ctgcacgggc gacaggaacc gcagcagctc accgaccacc 13860
cggtcggcct cctcgcgtcc ggcgaagaga gactgtcgct ggtcgggatg atccagcagc 13920
gcgagaaccc cgaagccgat cgaccccgcg acggtttcga caccacccag gatcagcgcc 13980
gtgagtacgc ccttcagctc ctcgtccgtg acatcgtctc cgtgctcccg caccagcatc 14040
ccgatgaacc cctcgtcagg gtccttccgc tgccggatga tgaggccgtt cagataccgg 14100
ttgaacgccg cgctgtcggc cgcccgggcc ttgaacccgc ggctgagatc gacgttctgc 14160
ctgacacgcc ggatgaactc gatccgatca tcacgcggga tgccgagcag ctcacacagc 14220
actcctccgc cgaccggatc ggcgaacagc gcctggacgt ccgcgggcgg ccccgcggcc 14280
tccagctcgt cgatgcggtc atcgatgagg tcctgcatgg cgggctccag ccggcggatc 14340
cggcgggccg tgaactccgg ggtcagcatc ccgcgcagcc gcgtgtgctc gggcggatca 14400
tagaccgaca gctgaccgac cagattcggc ggtatgggct ctccggcgat cgatggcgcc 14460
gaactccacc gggggcgcgt cgtgaagttc tcgtgatcgc cgagtattct gcgcacgacg 14520
tcgtatccca aagcctgcca gacatagtcg acacgcagct gagtggccgc gtcaccgcct 14580
atccggacca gtgggccatg cgccctgagc gcgaacatgt cctcatgcgg atcacagtgc 14640
gtccgcatca tgtagttcgc cgtcggctgc aggaccggcg cgcccgcatc gatatcgtca 14700
tccatacccg ggtcgaaact ccattcgctg tcgatccgca cgctcggctg atccgatcct 14760
ggtcgcgggc ggaagatatt tccagcgtcg tcaaatggac gatgggaacg ggaattccgc 14820
gatcaccagg cgaccatcag actggtcaat ccatacgcgg gagtggtcaa ccggaacgat 14880
ggctcccgat cgggatccgc gagcctcagc gtgggaaaac gccgccacag ggcggtgtag 14940
accgtgcgca gttcgaggcg ggccagagcg gctcccaggc aatgatggac gccgtgcccg 15000
aacgcgacat gggggacggg ctcgcgccgg acatcgaggc ggccggcatc cggcagcagg 15060
gcagggtcac ggttggccat gggcagagag caggagacgg tctctccctc cttgatcacc 15120
tggcccccga tggtgacgtc ctccatggcg acccggggcg tcggcgcata ggggacggtc 15180
aggtagcgga tcagctcgtc gaccgcccga tccgccgact ggtcgtcgcc ctgcaacgcg 15240
gcgatctgct cggggtgtct gagcagggcc agcacgccga gcccgatcat gccggagatg 15300
ttgtcgtcgc cggccagcat cacctgaacg cagaagcccc gcagctcctc gtccgtggcc 15360
gtgtcaccgt actcggcgag gacggctccg agcagcccct cgccgggatc cttccgctcc 15420
ctggcgatca tggccagcag gtagcgggag aacgccgcgc cggcggccgc ccgcctcttc 15480
tggctgcgcg aggcgtcgag atggccgtga cacagctgca tgaacatggc gcggtcgtcc 15540
cgtggcaccc cgatcagctc gcacagcacg gcccctggca cctcgtcggc gacgagttcg 15600
accagatccg caggggggcc cgcccgttcc agggcgtcga gccgttcggt cacgatctgt 15660
tcgatgtacg gcttcagccg ccggatccgg cgcagggtga atcccggggt cagcttctgg 15720
cggagccgcg tgtgctcagg cgggtcgtag tccatcaggt tcccgaccag ctcacgcggc 15780
cggaagttgc ctcttccgcc gatctcgtcc cgttcgttcc agcggcgccg ggtgctgaac 15840
cgccggtgat cgccgagcac ctgccgcacg acggtgtacc ccgtggccag ccaggtggtc 15900
tccgcgtccg ctcctgatcc gatggtgatc ctcgtcagcg ttccggcggc gcgcagttcg 15960
tccgccggat ccaggtcctg ccgccgagta tggaggggcc gcgcgccgtc accactcaac 16020
gggaagctcc tccacggcga agggggccgg cttccccggt ttgaaccgca ggtcctctgc 16080
cgggaccgcc agccgcagcg acgggaaccg gcggaccaac gccggcaacg ccacttgcgc 16140
ctggagcctg gccagcggtg ccccgaggca gaagtggacg ccgtgcccga acgcgaggtg 16200
ttcggggttg ccccgggtga ggtcgaagcg gtcctcgcgc gcacgattgc ccgccaggat 16260
cgagcaggtc aggacatcac cggcgtggat gtcccgtccg gccaggcgcg tgtcgaccag 16320
tgcggtccgg ggagaggggg tctcgacgat cgacgcgtag cggaacacct cctcggccgc 16380
gctgtccgcg agctccggac gctcgcgcag cagcgccatc tggtcggggt gggtcacgag 16440
gaggagcacc gcgatcgcca gctgcgaggc catctgctcg accgccccga tcatgatccc 16500
ctcgacgagc cccgccagct cctcgtcggt gacctcgcct ccgtgctcgc gcacgatgcc 16560
gccgatcatc ccggtgccgg gatcgaggcg ttcgcgagcc gccagtttcc tggcgtagtc 16620
gacgatgccc aggcccgaca cgttccgctg cctggggact cggctctccc ggctgtcccg 16680
gaacatcctc gacagctcgg cctggtcgtc acgggggacg ccgaggaagt cgcaggcgat 16740
cagcgccggg atgggccagg cggcgttcct gacgaagtcg accggcgacc ccatgctctc 16800
cagatcggcc aagcagtcct cgacggtctc ttcgacgaca ggccgcaggc tctcgatccg 16860
ccgggcggtg ttcgccctgg tcacggtcct gcgcaaccgg gtgtgatcgg gcgcgtcgta 16920
cgactgcagg attcccggca gccaggcgcg ctccgcctcg tcctcgaccg ggcgcatcga 16980
gctgaaccgg ttggcgtcgg cgagaatctc tctgatctcg ccatatccgg tgacgagcca 17040
ctgcttgtgg ccgtccagcc ccggctcggt gtcgtactcg tgcagcggcc cgtcctcttg 17100
caggtcgaag agcgccggca cgggatcgag cctcagccgc tgatgcggca gcggaaccac 17160
catgattctc ctcagcttcc ggcgttacca gtcgagcagc agtgctttca cgtcgaacgg 17220
cggcggcccc aatctgatct cttgttcggg ctcggccagc cggagtgcgg ggaagcggcg 17280
tgccagagcc gggatcgccg accggaagat gagctcggcc aggggtctgc caagacagtg 17340
atggatgccg tgcccgaacg cgacattcgg cgctctgtcg cgggtgaggt cgaactgatc 17400
gtccgggccg gggaagtgcc gccggttcgc tcccagcaac gagcacgtga cggtgtcgcc 17460
ggccttgacg atgcggtcac cgatgcgcac gtcctccagc gcgatccgcg gagtgagctt 17520
ctcgtcgatg gtgagatagc gcaccatctc ctccagccag tcaggcacga cgtccggctt 17580
gtcccgaagc agcgcgaact gctcggggac ctcggccatc agccacgcgc ccgccgcgag 17640
gaaacgagcc acctggtcac cgcccgcgcc catgacgaac gcggccagcc ccgtcagctc 17700
cgcgtcggtg atctcgtcac cgtgttcgcg caccacgacg ctgagcatgt cgtcgccggg 17760
atcacggcgc gtgcgagcca cgacctggcc catgtaggtc atgaacttgt tcccggcggc 17820
tccgcgtctg ctggccgccc gctgggaccg gctggcgtgc aggctgcgtg acagctccgc 17880
ctgatcatca cgtggaatgc cgaggaagtc gcaggtcgcc gtcgtcgcga tggaccaccc 17940
gaaatgcggg acgaagtcca gcgggccacc gatggactcg atggcgtcca ggcagtcctc 18000
gacgacctga tcgacctgcg ggcggaaccg ctccatccgc cggacggtga acgcgggcga 18060
gaccacccgg cgcagtcgcg tgtgctccgg cgggtcgtac tgggtgatga agccgggaaa 18120
gacgattccg gccgcggtcc cgccgtagag caacctggag ctgaacttgt ccgagcccag 18180
cacctgccgg acctcgtcga acccggtggc gagccacgcg gtccgccctc cagggccttc 18240
ctcggcgccc agctcggtca tcgggccctc ggccatgaag gaccgcagct gtggcaccgg 18300
atcgaaccgg tccctccagt gcagctcccc gggcaggacg acgttgagct cctcgaacac 18360
ttccacgtca caggtccttc cgcctcaacg gtggtctcag gccggtcgga cgggcgctgg 18420
gcccgtccaa ccgtccacat caagcggctg gacaccctcg ctcaggcgcc ggcttccgcg 18480
atgagactct tcggccggat gtccgtccag ttctcctcga cgtaggcgag gcattcctgg 18540
cgggtggcca cgccgtggac gcgggtccag ccaggcggca cctccgcgaa cgagggccag 18600
agcgagtgct gtccttcgtc gttgacgagc acgaggaagg agccgtcttc gttctcgaac 18660
gggttggtca tcgctgtgtc ctttcaccgt ccggccgggg ccggagtttc tcggcgacga 18720
cggccccgat ccgggccagc gccgcgggct gcagcatctg catgtggtcg atctcgatct 18780
cgtgaggctc gacggttccg gtggtgaggg gtcgccagct ggcgatggcg tccgcgacgg 18840
gcagatggga ggggcggttc actgtggcga cgaagagcag gatgtcgcag ccgaagctgc 18900
gggaggtgtg cagcggcccg acccgggcga ggtgctccat gacctcgtcc aggcgcttcc 18960
tggcgccggc ctccgtggcc accgcggcgg cgagctgcgc ctgctgctcc tgctgcctgt 19020
cgaagtccgc ggcctcctga tcggccgcgt cgccgcgcgg gcgccggagc ctgcccacgt 19080
cggtgggata ggcgtcgagc agggcgagca ggccgacctg ctccccttgc tcctccagca 19140
ccctggccat ctcctgcgcg atccgcccgc ccagtgacca cccgaggagg tggtacggcc 19200
cggtcggctg cacggcgcgg atctgctcga cgtaatcggc cgccatctcc tcgacgccgg 19260
ccgccagcgg ctccgtacga gccaggccgc gcgcctgcac gccgtagacc ggctggttgg 19320
ggggcaggct ccgcagcagg ggcgcgtagt tccagctcag ccctccgctc gcatggacgc 19380
agtacagcgg cggacggtta ccgccggctc gcagcggcag cagcacctcg aagtcgcccg 19440
tgccggtctt caccgagccg ctcgatcccc gccgctcgcc gacgacgacc agggtgcccc 19500
cggctgtcca gcgggcgagc aggcccgtgg gcagcatgcg ccgccccgtg gccccgaagg 19560
ggcaggccag ggtccggtcg cccggctccg cgtccaccgc cgcgccggtg aggtagagct 19620
cgccgacggc gacggcgggg cgcagccggt cgtcgagcac gagcgcgccg agcggaccgc 19680
cctcggccag gtcggcggcc accgggggca cggcctcgga ccacttcgcc ggcgcctcgg 19740
ccggacgttc gcgttcggcg tcgtccagca ggacgtccag gtcgctgacg cgccgctggg 19800
gatcctccgc cacctgctcc aggaagctga ccagccgccg tgccagcgac tcggccgtgg 19860
cctgatcgaa gaggtcggcg gcatagtgga gggtgccctc gatgccgtcc tcgtcgcggc 19920
gctcggtgag cctgaacgcc agatccagct cgatggcctc cggcccgaca ggttcgacgc 19980
tggtgcgcag ggcgggcagc tccgtcgcgt cccacgcgcc gaggtcctcc tcgtgcacct 20040
ccaaccccac ctggaacacg ggatggcggg agagcgagac cggcaggtcg agcagctcga 20100
cgatcctggc gaagggcacg tccaggtgct ggcgcgcgga ccggatcgcc tcctgcgccc 20160
gggtgacgac ctccaggaag gtggggtcgc ccgagaggtc cgtgcgcagg gcgagcggcc 20220
gggcgaaggg cccgatcatc ggctccaggt cgatgaggtc gtcgtcccgt ggcagcttcg 20280
tgccgatcac caggtcgtgg cccgccccga gcctggtcag cagcatggcg agcgcggcat 20340
gcacgatctg gaacgggtgc gcgccgatcg ggtccaccgc ctccaccagc ctggcgtgcg 20400
ggccggcgtc cagtcgcaac gacaccgtgc cggcccgccg cgacgcgacg gccgaccggg 20460
ggcggtcgaa cgggagcacc gtctccccgt ggatgcccgc cagattgtcg cgccagaaca 20520
ccagctgctc gttgatcagg ccgtccgcat cgcgctcgcc ttcgagcagg cgccgctccc 20580
agatcgcgta gtcggcgaac tgcagtgtca ggggcgcccg ctccggtgcc cggccggcac 20640
gccgcgcgcc gtacgccgcc gacaggtccc ggaggaacac atccagcgac tcgtcatcgg 20700
cgaggatccg gtgcaccatc aggtgcagga cgtgttcccc gtcggagagc cggaacaggt 20760
caccgcgcca cggcacctcc cgggtgaggt cgaagaccga ctcccgcagc tcggtgagca 20820
gcccgggcag gctctcctcg gtggcgggaa ccggcgtcag gtcaaccggc gaggcgtcgt 20880
gtacgtgctg gtgaacgctc tgcgcgtggc cggggaaggt cgtccggaga atctcgtgcc 20940
gcgccgcgac gtcgccgagc gccgcctcca gcgcgggcac gtccagccgg ccgcgcaagc 21000
gcagcgcgac cgagacgtgc aggccggcgg cctccccggg actcgccagc agccaggcgc 21060
tgagctgctg ggcggtgagc ggtacccggc ccggccgttc ggcgggctcc agcgcggggc 21120
gtgacttcgc ggccagcgcc cgggcgacac ccgcgggggt ggccgcggag aacagctgcc 21180
ggatgggcag gtccgcaccg agctcctcac ggatccgcgc gatgagccgc atggccagtg 21240
ccgaactgcc gccgagatca tggaaggcgt cgtcgacgcc cacccggtcg acgccgagga 21300
tctcggcgaa gagcgcgcac agcaccttct cggtctcgct ctcctgtgcc ctgtccggcg 21360
cacgtcccac gagatcgggg gcgggcagag ccaggcgatc caccttgccg ttgggcgtga 21420
caggcagcgc gggcagggcg acgaccgcca ggggaaccat gtacgcgggc aggaccaggg 21480
ccatctcccg ccggatctcc gccggccccg catcggttcc gtcggagatg aagtagccga 21540
ccaggcgctt ctcgcccggc tggtcctccc gcgccacgac gaccgcctcg accacgccgc 21600
gctgggccgc cagcacggcc tccacctcgc cgagctccac ccggtagccg cggatcttca 21660
cctggtcgtc ggtgcggccg aggaacacca cctcgccgtc gcggttccag cgcgccaggt 21720
cgccggtgcg gtacatgcgc tcaccaggag aagggtccac ggaggccgga acggccacga 21780
accgctctgc cgtcaggccc ggcccgccga gatacccgcg ggccagcccg gtgcccgcga 21840
tgtacagctc gcccgccacc cccggcgcga ccgggcgcag gaaggcgtcc aggatgtaga 21900
tcctgcggtt ggtcatggga cggccgatcg gcagctcccg cccgacctcc tcgccgggct 21960
cgatcggctt ccacgtcgcg cacagggtgg tctcggtcgg tccgtacgtg ttgcgcaccc 22020
gcaggccggg cacggcccgc cgcaggtgct ccacggactg cgccggaacc acgtcaccac 22080
cggtcccgac ctcgaccagg cccgcgaaac actccgggga cgactccgcg agggcccgga 22140
aggtaccggc ggtgagatgg acgaaggtca cgccccgttc gacggcctgt ctcatcccga 22200
gcgcgtccag cactcccggc tcggtgagca cgacccggcc acccatggcg agcggcaccc 22260
acatcgcgta gagcgaaggg tcgaagacgt gcgtcgcgtg catcagcacg gcgtcgcccg 22320
ggccgatccg ccagccctcg tcgcccgcca ggccggccac ggccccatgg gggacgccca 22380
cccccttcgg caggccggtg gagccggagg tgtacatcac gtacgccagg tcgtcggcgc 22440
tcagccggat ctgcggcgcc gtggcggcac ccgcgtcgat ggccgcgcgg gtctccgggg 22500
cgtcgatgac gatcgcgtcc gccggcgcca cttccctggt ggcccgggtg cacaggacgg 22560
ccgagacacc ggagtcggcg agcacgaact cgatccgctc ggccgggtgc tcgacgtcca 22620
ccgggacgta cgcggcgccc gccttccagc tcgccaggaa cgcgatcagc aggtcaggcg 22680
acctgtccat gaccacgccg acgcggtcgc cacggccgat gccacgagcg gcgaggtggc 22740
gggccagccg gttcgccgcc tggtcgacct cggcgtaggt caggtccgcg ccgccggcat 22800
cggtgatcgc caccgcgtcc ggcgccgtgg ccacccgccg tccgaagaga tcgagcacgg 22860
actgccccgg cgtggggccc gccgtcgcgt tccagtcctc caccaccagg gcgcgctcgg 22920
cttcgctcag cagcgtcagc cggccgacga ggacgtcggg ctcggcgacc agccgctcaa 22980
gcacgcgagc cagcgcgccc acgaccgatt cggcggccgc ctcgtcgaag aggccgcggt 23040
cgtagtcgag gatgagcggc atctgcgcgc cgggcccggt gatcagggtg aacgggtagt 23100
gcgaggagtt gcgtccgcgc cgcaccggtc tcaggtccag gccgccgtcc tcttcggccc 23160
ggccgagtcc ctggcgcggg aagttctcgt agatgacgag cgtgtcgaag accgccccgg 23220
gcccgacggc ggcctgcatc tcctgcaggc cgagatgctg gtgcgccatg agtgccgact 23280
ggctgcgctg cagctcggcg agcagctcga cgacccgccg gccgccttcg agccggaccc 23340
gtaccggcag ggtgccgagc agctgcccga ccatcgactc cacaccggcc agctcggcgg 23400
gccgccccga ggcggtcgcg ccgaacacca cgtcggtgcg gccggcgagc tgcgccagga 23460
ccatggccca cgcaccctgg acgacggtgt tcaaggtgag gccgtggccg cgcgccagcc 23520
gcgccagccc gtccgtcagc tccgcggaga gctcgatcac cgcggtgccc atgtccggca 23580
cgcgggccgg atcggccggg gcgaccagcg tgggcgtgtc cagtccggcg agctcctgcc 23640
gccaggccgc ccgggccgcc tccttgtcct gccggcccag ccaggcgagg tagtcccggt 23700
aggacacggc ggcaggcagc ccggacgcgt cgccgcccgc cgcgtagatc gcggccagct 23760
cgcggtgcag gatcggcatc gaccagccgt ccagcaggac atggtgcagg gtgtgcacga 23820
gccggtggct ggccgggccg agccggatga ggtgcagctt catcagcggt gccgcatcga 23880
gggggagccg ctcggccagc tcgtccgccg ccagccggtc cacctcgctg tcgaggaggt 23940
cgtccggcag cccgtggaga tccgtttcac gccaggggat ctccgcctcc cgcgcgatga 24000
cctgcaccat ctgcgcgccg ctgacatagc ggaaataggc ccgcagcgcg gcatgccggt 24060
ccacgagcgc ctgccacgac gccctcagcc gcccggcgtc cagcgggccg tcgatgccgt 24120
acacggtctg caccgtgtag gtgtcgggcc cgtcgtcgtc gagggcggtg tgatagagca 24180
tgccctcctg cagcggcgag aggggccaga cgtcttccac gctggagcgc ggcttcgcac 24240
gagtgtcgtc aatggtcacg atctgctcct tatggagtca tccgccggcc ggtccggcct 24300
cgagttggtc cagctgatca ggcgaaagat ccacgagtgt gccggccggg ggctccggtt 24360
ccccggtgcc ctcgccgtcg gccgggagct ccttgacgac cgccgccagc cgttccgccg 24420
tcttctcgtc gaacacctgc cacggggtga ggtccagccc cttccggcgg gccagggccg 24480
acagctgcat cgaggtgatc gagtcgccgc cgagctcgaa gaagctgtcg ccggcgccca 24540
cctcctccag gccgagcacc tccgcgaaca gctcgcacaa cttcgcctcc atggccgagc 24600
gcgggtcgcg tcctgacgac gacctcgcga aatcgggggc ccgcagcgcc cgatgatcga 24660
ccttgccgtt cggggtcagg ggcatcgtgt ccagcgggac gaacgccgcc ggcctcatgt 24720
gctccggcag gcgtccggcc gcgctctcgc ggagggcgga gatcaacgcg ccgtcctgcc 24780
cggcctcgga gggagcgccg gccacctgct cggccgcggg gacgacatac gccaccaggt 24840
acttctggcc cggaccgtcc tcgcgggcga cgaccgccac ctgggcgacc cccggatggt 24900
ccgccagcac ggcctcgatc tcacccggct cgatccgata gccgcgcacc ttgacctgcg 24960
cgtcggcccg gccggtgaag accagctcac cgtcccgggt ccagcgggcc cggttgccgg 25020
tgcggtacat gcgctcacca ggacgggcag ggctcaccga ggccggcacc gcgacgaacc 25080
gctccgctgt caggcccgga cggccgaggt agccgcgggc gagcccggcc cccgccacat 25140
agagctcgcc ggtcacacct ggcggcacgg gctgcaggaa ggcgtcgagc acataggctc 25200
gcaggccggt gatcggccgg ccgatgggca ccacgtcgcg tcccggagac agcggggagc 25260
tcatcgtcgc gcagacggtc gtctcggtgg gcccgtaggc gttgatcatc cggcggcccg 25320
gcgaccagcg gtccaccagc gcgggcgggc aggcctcgcc ggccacgacc agggtctcca 25380
ggctgtccgg caggtcgtcc tcgacggccg gcacgctcgg cggcacggtc acgtgggtga 25440
tgccccaccg gcgtaccgcg tcgcccagcg acacccgggg cggcatgctc tccgcgtcgg 25500
ccagcaccac ggtcccgccc gacaacaggg ccatgcacag ctcggagacg gcggcgtcga 25560
agccgagagc ggcgaactgc aggatccgcg aggcggacgt gacgccgaag cgctcgatct 25620
gcgcgctcgc cagattgccg agcccggcat gggggacgag gactcccttg ggcacgcccg 25680
tcgaccccga ggtgtagatc acatacgccc cgtcacccgc ctccacccgg ggcagcgcag 25740
tgcgcggatc ggcggcgagc ggcgcgtcca gcgccaccac cgcgcccgcg aactcctccg 25800
ggacggcctg cctggtctcg ctcgtgcaca gcagcacctc cggcgcggaa tccgccagga 25860
tgaagctgat gcgctcgcgc ggataatcgg gatccatcgg gacgaacacc ccgcccgccg 25920
aggacacccc gagcagtgcc accaccagct cggccgagcg tcccacgagc acgcccaccc 25980
gcgtctcacg gcgcacgccc agccccacca gcagccgcgc cagctcctcc gcctcgtcca 26040
gcagtccgct gtacgacagg ctccgggccg cgtccaccac cgccaccgca tccggcgagc 26100
gctccacctg ccggcggaac agcatcggca ccggctccgc ggcgggcggc acgccggtcc 26160
tgttccactc ctccaccacc aggcggcgct gctcaggacc gatcaggccc acgcgcccga 26220
ccggcacgcg cggctcggcc accacctgct ccagtgcccg gaggatcgac gcgagcatct 26280
cctcggcctc ggcccgatcg accacgtccg gccggtagat gaactcaccg tggacgcggc 26340
ccgccacgga cgcgcgcatg gacagcggat agtgccctgt gtcgttcggg atgcccgcgg 26400
gccgcatgac gagcgcgtcg gggccttcgg gccgaggcgg cgggggcggg tagttctcga 26460
acaccacgat cgtgtcgaac gccgcgcccg gaccggcgag ctggttgatc tcgctcagcc 26520
ccacgtgctg gtgcggcatg cacgcgacct gccgttcctg aaggtctgtc agcatgtcga 26580
ggaacggctc cgcaccggcc aggcgagccc ggaccggcaa catgttcatg aacaggccga 26640
cggcggactc cacaccgggg atctcgggcg ggcgcccggc caccgcggcg ccgaagacca 26700
cgtcgtcgcg tccggtcagc cgggccaggt gcagtgccca gatcccctgg aagagcgtgt 26760
tcgccgtcac gccgtgacga ccggtgaact ccaccacgcg ccggctcagc gcctcgtcga 26820
gttcgaaccc gacacgttcg ggctccaggg gagtggtgat cgtctccggc ggcacgacgt 26880
gggtcgcctc gtcgagcccc gccagctcgg cccgccacgc ctctcgggcg gccgccttgt 26940
cctggcgggc gatccaggcg agatagtcgc ggtacgacgt cgcggccgga agggcccggc 27000
cgtcaccgcc ggactcgtac acggtcagca cgtcctcggt gatcagcggc agggaccagc 27060
cgtcggccac gatgtgatgc gaggtcagga ccagccggtg ccggcgttcg ccgaggcgca 27120
ccaggtgcag ccgcagctgc ggcgcccggg tcaggtcgaa ccgctcggtg tgcagctgct 27180
ccgcgaggcg gtcgaactcc gccagcgcct cgtcctcggg cagccgggac agatcggtct 27240
cctgccagtc cagcggcacc tcgcgagcga tcgcctgcac ggccgcgccg gacccgagct 27300
ggtggaagct cgcccgcagg gcggggtgcc ggtcgagcag agcctgccag gaggcgcgga 27360
accgggcgac gtccaacgga ccgtcgaggg cgagcttgcg catccccgcg tagacgtccg 27420
ggccgcgctc gtcggcggcg tggaacagca ggccctcctg gagcggagac agcggccaga 27480
tgtcgagcag ggtcggtacg gcggcctcga cctccgccac gtcctgctgc gtcagcgaga 27540
tgagcgggaa gtccgacggc gtgtgcccgc cggcgccgcc gccaccgacg tgtgccgcaa 27600
ggccggtcag catggccagc caggcctgcg cgagcgactc cgcctcggcc tcgccgagca 27660
gccgccccgc ccaggtcacg gtcaggctca gctcaggtcc tgccgcaccg tccagcacgg 27720
ccgcgtcgat ctccacggcg tgccgcaacg ccgtgtcctg ctccgccgtg ccgccgatgg 27780
tgcccagcag ctgccagggc tccggggcgc ccgcggaccg ggacgggaag cggccgaggt 27840
agttgaaccc gatctccggc ttcggcgccg ccgcgagagc ctgccccgtc ccggcgttga 27900
gatagcgcag gatcccgtag ccgagcccgc cgtcgggcac ggcccgcacg ttctccttga 27960
cctgcttcag caggtgaccg gccgcaccgc cacccgcgat cacttcggcc ggatcgatcc 28020
ctgtcacatc cagccggagc ggatgcacgt cggtgaacca gccgaccgtc cgcgacaggt 28080
ccagctcgtc gatgggccgg cggccgtgac cttcgacgtc caccacgacc gcggtgccgc 28140
cgcgccagtg ggccaccgcg cctgccagcg tcgccagcaa cacctcgtgg acaccgcagt 28200
ggaaggcgga ggtggcctgc tccacgagca cgcccgcccg gtcatgcggc agcgtccacg 28260
atgtgcgtcc cgcggtcgag acggtgtcgc gcgccgggtc gagctcgccc agccgcgatc 28320
gcgccccgtc gaggatctcc gtccacgtct ccagctccgt ggcccgtgtc accgcctgat 28380
cggccagcgt tcgcgcccag cgccggaacg agacgtcgac ggggtcgagc accggccgcc 28440
ggccggcggc cacggcttcg caggccacct gcaggtccgg cagcaggatt cgccacgaca 28500
cgacgtccac cacgagatgg tgcgccgcca cgacgagccg tcccacccgc cctggccccg 28560
cgtccaccca gaccgcccgg atcatcacgc cggcgtgggg atccagccgt gcggccgcgt 28620
cgcgggcgca gcgatccgcg atctcatcca cgtcaccggt gccggcctcg acccgttcga 28680
ccagcgtcgc cgcgtccacc gctccgcggc cggccacgac cagccggggc tgcgcagccc 28740
cggtgcggac gatccggctg cgcagcatgt catgcgcgtc gatgaccgcg cccaatccgg 28800
ccgccagcac gtccaccgac aggtcgtcgg gcgcaccggc ggtcacccac tgggacaggg 28860
cgccccgggt catcgcgtcg ggatcgcgtt cgagcagtgc ccggatcacc ggcgtcgaca 28920
tcacctcacc gacgccgtcg tcgaggctcg cccgcgtcgc accgccgcgt tcggcgacca 28980
tcgcgatccc ggcgggcgtc ttgcgctcga agacgtcctt cgcgccgaag acgagctcct 29040
cacgtcgcgc gcgggcggcc aaccgcatgg agaggatcga gtcgccgccc agctcgaaga 29100
agctgtcctc ggctccggct cgcgccacgc ccaggacctc ggcgaacagt tcgcacaaca 29160
cccgctcggc ctcggtacgc ggctcccggc cggccgcctt cccggtgaac tcggggacgg 29220
gcagcgcggc acggtcgatc ttcccgttgg gcgtcagcgg gacgccgtcc agcagcacca 29280
ccgccgccgg caccatgaac tccggcagcc gtcccgcgag gtgctcgcgt accgcgtcgg 29340
gatccaggcc cgagccctcc tccgcggtca cgtaggcgat gagtctcttc tcgccgggac 29400
ggtcctcccg cgccacgacg accgcctgcg cgacgtgcgg aacctcggcc agcgccgcct 29460
cgatctcccc tggctcgacg cggtagcccc ggatcttcac ctgggagtcg gcccgcccgg 29520
cgaacagcag ctcgcctcgg tccgtccagc gcgccaggtc gccggtgcgg tacatccgct 29580
caccggaggc cgcggggttc accgaagcgg gcaccgcgat gaaccgctcc gaggtcgccg 29640
cgggggcgcc caggtaaccg tgtgccaggc ccgcgccggc gaggtagagc tcaccggtga 29700
cgttcggcgc caccggctgg aggaaggcat ccaggacgta cacctgccgg ccggccagcg 29760
gacggccgat gggcaaggtg tcgcccgttt ccgtgtgcgg ctcgatgagg tgccaggtgg 29820
cgcagagcgt gacctcggtg gggccgtaca actcccggac ccggacctcc gggcatgccc 29880
ggcgcacccg tgcgacggac tcgagcggca ccacgtcccc gccggtgagg acctcgcgca 29940
gcccgctgaa ggagtccggc gactcctccg ccagcacccg gaaggtcccc gccgtcagat 30000
ggacggtggt cgcgccccgt gcgatcacgt cccgcagccg ctgcgcgtcg atcgcgcccg 30060
gttccgcgac catcacgcag gctccgctga ccagcggcac ccagatctcg agcagcgacg 30120
cgtcgaacgc gtgcgacgcg tgcatcaaca cgcggtcgcc ggcgccctgc gaccagcccg 30180
ggtcgccggc cagagccgcg gcgctcccat gcggcaccgc gacgcccttc ggcaccccgg 30240
tcgatccgga cgtgtacatc acgtaggcca cgtcatgcgc tccgaccgcg agcggtggcg 30300
cctcgtgccg ctccgcctcg gtcgcgggtg cgtccatgac caccggctcg atcccgtccg 30360
ggaccgcgtg ccgggtcgct cccgcgcaca ccgccaccga cgcgccggcg tcggccagca 30420
tccgctcgat gcgctccgcc gggtagtcca cgttcaccgg gacttgcgcg gcccccgcct 30480
tccagaccgc gagcagggcg acgatcaggt ccgcgccgcg ttccatcagc acgccgacgc 30540
ggtcgccgcg ccgcacgccc ctcctggcca ggtgccccgc cagccggtcc gattcccggt 30600
cgaggccggc gtaggacagg gtgcgtccgt cgccgatgac cgccgtcgcg tccggcgccg 30660
cgtcggcctg gcgccggaac agctccggca ccgatgaacc gccggccgcc gcaccggtcg 30720
agttccagcg ctccgtcacg gagccgcggg tggatcggct ggtcacggcc aggcggccga 30780
cgggaagcga gggctccgcc accatccggg ccaggacccg cacgacctgc ccggtgatct 30840
cggcggccag gtccccgccg atccagtcgg gccggtagtc cagctggatc tgcaggcgcg 30900
cgcccgggat gacgctcacg gacagcggat aggtggtgcc ggtccgcgtg cggatcgagc 30960
tgatcgccac gccaccgtcg tcgagaccgt cggcgtccag cgggtagttg acgatcatca 31020
ggatcgtgtc gaagatcgag cccggccccg ccgccttctg gatctccggc agccccaggt 31080
gctgatgctc cgtcaaggac gactggcgcc gctgcaggtc ctggagcagg tccagcaccg 31140
gaacagcccc gtcgaggcgc acccggaccg gaacggtgtt gatgaacatc cccaccatcc 31200
gctcgacatc cggcaacgcg tccgccggac gcccggacac gaccgtgccg aacaccacat 31260
ccgtccgtct cgccagccgc gccagcacca gggcccaggc gccctgcacg accgtgctca 31320
acgtcagccc atgaccacgg gcgaagccgg tgagggcgcg ggtcgcctcc tcggacagcc 31380
attcggcatg cccgtccggc atcaccggcg ccttgcccgc gtcgaggccc accacggtcg 31440
gttcgtccag cccggcgagc tcggcccgcc acgccgatcg tgccgcgtcc tcgtcctgac 31500
ggctcagcca cgccacgtag tcccggtagg agggcggcgc cggcgagacc cgtccgtcgg 31560
cgtaggcggt cagcatctcg cccagcagga tcggcgtgga ccagccgtcc acgagcacat 31620
ggtgcgacgt caccacgagc cggtgccgcg ccgcaccgag acggatcagc agcaaccgca 31680
gcagcggcgc cctgctgacg tcgaaccgct ccgcctgatc cgccgcgagc aggcgttcca 31740
cctccgcgtc cggctcatcg agccgcgaca ggtccgcctc acgccacagg acctcggcct 31800
cgcccacgac gacctgcacc gtctcgccgg atcccagctg gtggaagccc gtccggagcg 31860
tctcgtgccg gtcgatcacc gactgccacg ccgcgtgcag ccgttgcgcg tcgagcggcc 31920
cgtcgaggtc caggatccgc tgggtctggt agacgtcgac gccgtcctcg tcgaaggctc 31980
tctcgaagag gatgccctcc tggagcggcg acagtggcca gacgtccgtc aggccgggcg 32040
ccacggcctc cagttcgtcc acgtcccgct gccgcacctc gaccagctcg aagtcggacg 32100
gtgtgtgtcc gcccgcgccg ggagtgtcgg cgagagcggc gaggccggcc agcgtgtcca 32160
gccacgcctc gccgagccgc tccaccgcgg cagggtcgag gtccctgccg tcgatggcga 32220
gtctcagccg ggggccggcc ggcgtgtcct gaacgtccgc gccgacctcc agggcgtggg 32280
actggacgag gtccggcccg gccgcctgtc cgccgagagc cccttcgcac acctgccacg 32340
cggtgtcctc ggaggcgacg ccggaccgtc cgagatagtt gaatccgatc tgggccgacg 32400
gcagctccgc cagccgggcg ccggtttcgg ggttgaggta gcgcaacagc ccgtagccga 32460
gcccgtcgcc cggcaccgct cgcgcctgtt ccttcacggc cttcagcaac tccccggccg 32520
ccgcagctcc tggaccgaca ccggagacat cgaggcggac cggatgaacg ctggtgaacc 32580
agcccacggt acgcagcaga tcctctccgt cggcggcatg gcggccgtgg ccttccacgt 32640
ccaccaggat cccggcgtca gcaccgcgcc accgcgccac cgcacccgcc aggcccgcca 32700
gcaggacgtc ctgaaccccg cagtggaagg ctgccggcac gcgcgccacc aggttgcgcg 32760
cttgggcatc ggacagtgtc cgcgaccacg acgccgactg cccggggtgc cgctccagcg 32820
gcaggtcgcc gccttcgagc acgccggccc aatggccggc ctcggccacg gtgctctcgc 32880
tgagcgcctg cccggccagc cgccgcgccc attgccggta cgacgtcacc gcgggttcga 32940
ggacgggggt tccgccggag accgcctcgt cgtaggccgc ccgcagatcc gacagcagga 33000
tcgcccacga gaccgcgtcg acgaccaggt gatgcaccac caaggccaac cggcccggct 33060
cggcgtcgcc cgcgtcgacc cacacggccc ggaccatgat cccttcggac gggtccagcg 33120
tgcccgccgc cgtcctggcc tcgcgctcgg cgcgctcagc gaggttcccg ttcccggccg 33180
ccacccgcgt caccaggccg gccgcgtcca cggcacccgg ctcggccacc atcagccgtc 33240
cgtcgggctc cacccgcgtc cgtagcagat cgtgcacatc caggacggcc tgcagggcgg 33300
tcaccagcgc gtccggggcg aagccggccg gggtgacgac gacccgcgcc tgcgcgaaac 33360
cggggcgcac cgcgtcatcg ccgagggcac gcatcaccgg cgtcctcggg atctcgccca 33420
cgcccggctc cactgaggag gctcgcctcc ccggggcctg ttgagccagc gccgccagcc 33480
gctcgggcgt gcggtgctcg aacacctgtc ggggggtcag cgggataccc tggcgccgcg 33540
cgcgggcggc gacctgcatc gacgagatcg agtccccgcc cagctcgaag aagctgtctg 33600
cgaccccgac ccgccccgcc cccaggacct cggcgaacac tccgcacagg atccgctcgg 33660
cgtcggtggc cggctcccgg tccaccgccc cggcagcgaa gtccggctcg ggcagggccc 33720
ggcggtccac ctttccgttg ccggtcagcg gcaacgcgtc cagcaccagc accgcggccg 33780
gaaccatgaa ctcgggcagc gtcgcggcga gctgctcgcg tatccgcacc gggtcgaggt 33840
ccccccctgt ttcggcgacc acgtaaccga tcaggcgctc ttcccgcgcg gacaccacgg 33900
cctgaccgac acctggaagg ccggcgagga ccgcctcgat ctcgccgggc tccacccggt 33960
acccgcggat cttcacctgg tcgtcggcac gcccggcgaa cgccagctca ccctgatccg 34020
tccagcgcgc caggtctccg gtccggtaca tccgcccacc gggcacgaac ggctcggcga 34080
cgaaccgctc ggccgtcaac gccgggcggc ccagatagcc ctgcgccacc ccggccccgg 34140
cgacgtacag ctcgcccgtc acccccgggg gcacgggccg caggaacgcg tcgaggacat 34200
agacccgccg ccccgcgagc ggacgcccga tcggcagcac cggccccgtc ggctcgcccg 34260
gctgcagcag ccaccatgtc gcacacagcg tggcctccgt cgggccgtag agatgccgca 34320
cgcggacgtc cgggcacgcc cgccgcaccc gttccaccgc cgcgagcggc accgcgtccc 34380
caccggtcag cacctcgcgc agcccggcga ccgactccgg tgactcctcg gccagcaccc 34440
ggaaggtccc cgccgtcagg tgagcgcagg tgacaccgcc ggccacgtac ccggccaggg 34500
cctcgccgtc caccgcgccc ggctcggcga gcacgacccg ggcgcccgac agcagcggca 34560
cccacagctc gaacagcgag atgtcgaacg cgtgcgaggc gtgcatcagc acggcgtcct 34620
cgggccccag cccccatccc ggctcgccgg ccagcgccgc gacgttgccg tgcgagaccg 34680
cgacgccctt cggcctgccc gtcgatcccg acgtgtacat cacgtacgcg aggtcgtccg 34740
cgtgcgcacc cgcggagaga cgggcgtgct ccgccaccgc ccgcagcgtg tccgggtcgt 34800
ccaggacgat cggatcgagc ccgccggccg gcacggcggc ctggcacgct cgctcggtca 34860
ccactgccgc cggctccgcg tccgcgagca tgaactgcac gcgctccgcc gggtaggcgg 34920
gatccaccgg cacgaacgcc gctcccgcct tccacaccgc cagcagcgtc gcgatcaggc 34980
cgggtgaccg gcccatcacc acggccaccc gatccccgcg ccggacgccc cggccgctca 35040
ggtagccggc gagcctctcc gcgtgctcgg ccagctcacc gaacgagacc gcccgcttcc 35100
cctcgacgac cgccacccgg tcacggccgc gctccacctg gcggtcgaag agatccggag 35160
ccagctcgcc cggcgccacg cggggtgccg cactccatgc gttcaccacc agcgcacgct 35220
cggccgcact cgtcacgtcg acctcggcca ccgtgaggtc gcccgcgccc gccagctgcc 35280
gcagaatccc ggtgaatcgc tccaggatgg cgagcgcggc ttcccggtcg aagaggtccg 35340
tcacatggtc gagattgagc agcatcgact cgccggggac ggcgaccagc gtcagcggat 35400
aatgggcggc ttcccggccc tggtctattc gaatatcgaa ggctgccgcg gcatccgatg 35460
ggcgaagctc acggggaaag ttctggaaaa cgagcaaggt gtcgaagacg gcgccggcgc 35520
cggccgtcct ctgaatatcc gccaatccca tgtactggtg ggggatgagc gccgactgcc 35580
gcttctgcaa atccgccagg aattcgatga ccggcgtcga accgctcagc cgcacgcgta 35640
cggggacggt gttgaggaac aaccccacca tcccctcgac gccgggcaga tccggcgggc 35700
gtgccgagac cgccgcaccg aacaccacgt ccgtccggcc cgcgagctgg gcgagcagca 35760
acgcccacgc gccctgcacc actgtgttca gcgtcagccc atgggtgcga gccagctcgc 35820
tcagggctcg cgtgaggtcc tcgggcagct cgaccgtgat gttctccggc atggcgggcg 35880
cccggttcgc atcggcgggc gccaccagcg tcggctcctc gacaccccgc agctccgccg 35940
cccatgccga cagcgtgcgc tccttgtcct gccggtccag ccacaccagg taatcccggt 36000
acgacggcac cgcgggcagg tccagcgggc tcccgtcggc cgcgtacagc atcgacagct 36060
cgtcgagcat gatgggcatc gaccagccat ccatgatcgc gtggtggcag gtcatcacca 36120
ggcggtggtc gtcgccggcg agacggatca gggtcagccg cagcaacggc gccttcgcga 36180
ggtcgaacct ccgcgtcctg tcctcctcgg ccaccgcgcg cacggcctcc tcgggctcgc 36240
tgaggtggga gaggtccacc acccgccacg gcagctccac ctgcctggcg atgagctgca 36300
ccgtctcacc tgatttgcgc tgccgaaaac aagcccggag agcggcgtgc cgcgccagga 36360
gcgcctccca tgcggcacgc agtctgtccg cttccaccgg accgttcagg ttcaggatcc 36420
aatggcccac ataaaggccg ggccagtcgt cgtcataggt cgtgtggaag agcaaccctt 36480
gctggagtgg tgacagcggc cagaaatctt cgatccgcga ctgagccatg gatgaatatc 36540
tccctcaatc agcaaagcgg cccgagaggg aatcatccat tgatgggtct gacccggaca 36600
atctgtccat ccgtgactgc cgtcaccgat ccgggtgggg tcgaaggagg ccgccgacgc 36660
ggaacgtggc ggcttgcggg cgagcaacat ggctacggcg cgccatccac agctggatgg 36720
cgcgccgtag ccaggttcac cgctcgatcg agcgcggcct cactcgaagg aaagccccgc 36780
ggccggcgtc acccggacgg cccggcgtgc cgggagaaca ctggccagga gccccgccag 36840
ggcggcgacg aggacgacga cggcgagcag tggccagggg acctgcatgg tggcgttgtc 36900
gagagcctgc ttcacgaagg tctcgtaacc gacccaggcg aacccgatgc cgatcacggt 36960
gccgagcacg gcggccacca gggagagcag cacggcctcg gcggccagca tccgccgcaa 37020
ctgcctgcga gtgagcccga gcgcgcgcag cagcgcgtgt tcgcgaacac gctcgagaac 37080
ggacaggccc agggtgttgg cgatcccgac gagggcgatc gccacggaga agccgagcag 37140
cgcgacgatg gcccaggtga ggatcatcag cggcgcgttc tccgtctcac gggcctccag 37200
ctggtcgttc acgttcgccc cggccgcggc cgccaggtcg cccagctcac cgacgagccg 37260
cgtcgagtcg gcgtcggcgg atgcgcggat ccagacggca cgcggcgcgg cggagtcggt 37320
gagccgggcc agcgtctccg gcgcgacgac ggcctgcagc ccccagccgg tggcgagcga 37380
gacctgcagc acggcccgcc ggtcgccgac cgtgaccctg accttgtcac cggcccgcag 37440
gcgcagctgg cggaatgcgg actcatcgag cctgagcacg cctggctcca cccgggcgaa 37500
cgacccgccg tcgtgggcca cccgctgggc atccggcgcg gtgaccaccg ggatcggctt 37560
gtcgaggccg gagaccgtgg cgacggcgcc gtccaccgcg atggcctgat ccaccccgga 37620
agtgccacgg accttgtcga ggaagtcggc ggagaacggc ttgccggtcg agaccagcgc 37680
ggcgtcgatg gggtgctggc cgtcgagtct ctcgttcagc gcctcggagg tgatggcgac 37740
gccggtcagg acggcggtga tcagggtgat accgaccagc agtgaggcgg cggtggtggc 37800
ggtccggcgc gggttgcgca cggcgttctt cgtcgcgagc cgcccgatgg tgccgagccg 37860
cgtaccggtg atctccagca gacgggggat gagcaccggc ccgaacagga gcacgccggt 37920
gaacaacgaa ccgccgccgg ccagcatgag caccgtgctg tgccaagcca tcgccgacgc 37980
gagcaggacg agcccggcga tcaacatgaa gacgccgagc accagccgtg cccgccccgt 38040
ggctgtacgc gggtcggtcg cggtgtcggg acgcagtgcc gccagcgggc tcacccgcac 38100
cacgcgccgg atcggcagcc aggccgcgac cagggtggcc gtcagcccga tggcgagccc 38160
gcccagcagc cacggcgcgg gcggtgccgg ggcggcgatc ggggtgatcg gtgagagggt 38220
cttgatcagg gcgatgagcc cgtagccgag tccggcgccg accagcacgc cggccagcga 38280
cgacaggagg ccgacgacgg ccgcctcccg gcgtaccgaa ctcaccacct ggcggcgggt 38340
cgcaccgacg cagcgcaaca gggcgaagtc gcgcatgcgc tgggccagca ggatggagaa 38400
ggtgttcgcg atgaccagga tcgagacgaa cacggcgatg ccggcgaaga gcagcagcag 38460
cagtgaccag gtgtccacgc cgttctggag ctgcgccgtc cgggccgcga tctcctgctc 38520
cggggtctgc accttcgcgg tctcgggcac cggaccgacc gcgccgcgca ccgtcaccgt 38580
gtagatgccg agggagggat cgtcggccca gcgcatgagc tgcggccagg tgacgtacac 38640
cgacgcctgc gccacaggag aaggcgcccg cacgatgccg accacggtga agtcggctgc 38700
cgtggcacgc tcacctatcc ggatgcggtc gccgacggcg acgtcccagt tctgggcgtc 38760
ccacaggtcc accacggcct cgcccttgcg ctcggggaaa cggcccgagg tgagctgctg 38820
ccagcgcagg tccttggact cggcgaccgg ccccacgccc atctcggggt aggaccggtc 38880
acccgcgcgc accgtcagca tggccctgcc gagcggtgac gcgttcgcgc catgacgctc 38940
gacgagctcg aacgcatcct cgttcgtcag cttggacacc acgtggtcgg agttgcggaa 39000
cggcgccccg aagccggcca tgatgccgct ctgcgccccg gaggtgagca cgccgacccc 39060
gacgacgaag gccacggcga cggtgaccgc gatcgccgcc gcgacgtacc tgcggacatg 39120
ggtgcgcagc gacgcgagaa agacggtgcg catcaggcga tccgtccgtc ttccagggtg 39180
accacgccgt cggcgtaggc cgcggcctca cgctcgtggg tgaccatcac gacggtctgg 39240
cccagctcgc gggtggattt gtgcaggtac cccaggacct ccgccgaggt ggtgctgtcg 39300
aggtttccgg tgggctcgtc ggcgaacagc agatccggcc cggtgatcag agcccgggcg 39360
atggccaccc gctgctgctg gccgccggac atctcggagg gccggtggcc gagccggtcg 39420
gccatgccga gggtttcggc gagcacgtgc acgcgctcgg tcgccgcgtc gtcgatgcgc 39480
cggccgccga gctcgagcgg gagcgtgatg ttctggaacg ccgtgagcat cggcagcagg 39540
ttgaaagact ggaacacgaa gccgatgtgc tcacggcgga agaccgtgag ctcgttgtcg 39600
tcgagtgatc cgagatcggt gccggccacg gtgacagtgc catcgctcgc ctgatcgagc 39660
ccggccaggc agtgcatcaa cgtggacttg cccgatccgc tcgaccccat gatcgcggtg 39720
aacttgccgc gcgggaggtc gaggtcgacg ccgcgcaggg catgcacgcg ggtttcaccc 39780
tggccgtaca ccttggtcag gtttcgcgcg ctggccgcca cggtttccag agcggctcgc 39840
tggccggtca tatagaagca cccttcgatt gtgcttgcgt acagtcggca tgcatgagca 39900
gaaagccatc attgacggct tcatggcgct attcttcgcg ccaaggctgg tagtcgtgct 39960
ggtactccgc aaagcgccac ccatcgtaga cgagcagtcg gccgggcacc aacggttcca 40020
aattgaagca gggcgccgtg cggagtaata gtcaagactg tggatgccga gttccttggc 40080
gactgtggga agggtgcttg caccggacgg gcggcattcc ctggtcagcc cccgggtgtc 40140
cgggccgctg gtccggcgtt ggcgtcgaag gaactgccgc cgtacctggg gtcgagcacg 40200
gatgcggacc acgtggcggg cgcggccagc atggccgcga cgccgatggt gagcccggcg 40260
ctgaccagcg aactacgacg gggcctgacc agccgcgcca gcgcgagcgc gacgacggcg 40320
accacgccga gcgcgaccgc gccccacatc gcccacggca gaaaagtggg gtagaaggac 40380
cacaaccaga cggcccaggc gagttcggcc acgatcgcga gcggaaatat ccacgccatc 40440
ctgcctccgc tccgatacgc ccgccagaac attacaatgc cgattccgga caaagcggct 40500
accggcggcg cgagtacggc cacatatgcg ctgtgcggga tgacaaagac cgcgctgtag 40560
ggcagggcga aggtgagaag ccacacgccc cacatcacca ttccgccgcg tgccgggtcg 40620
gtacgctcgg cccggcgcca ccaccacagc ccgcacagca gagccatcag cgcgagcgga 40680
tacagccaac cggacgcgac gccgaggcgg ccgccgaaca gcttgcccca gccgccccca 40740
tgctcgatgc ctatctcggg gatgaccatg ccagggcgtg gccggggcag ctgcgtcgat 40800
ctcttcggag gcgccgggcc gatcaccgag cccatgtagt tgggcggcag ggcgccgggc 40860
agattgatgc ccaggcgtcc gagaccgttg tacccgaaca ccatcgcggc ggcgctgctg 40920
ttcgtggtgc cgctgatgta gggccggtcg gcggccggag tgacgtggta gagcgtgatc 40980
cacgacagcg acaccacgag cgtcaccact ccggcgatcc ccaggtgctg cagccgacgg 41040
cgcagtccga tcggcgcgct caggagataa ccgatcgcca gggcgggcag gatcatccac 41100
gcctgcaaca tcttcgcctg gaaacccagc ccgacccaga cgccggccca gaccagcgac 41160
cgcagccgtc cttccagcac ggcccgctga taggagtcga cggcgagcac caggcacatg 41220
accagcgccc catcggccat gctgtgcccg aacatggacg cggccacggg ggtgatggtg 41280
aagacggcgg cggcgagcag acctggcacc acgcccgccc atcgccgcac gatccggtac 41340
atcaccagca ccgagatcac gccctcgatc acctgcggca aggcaagggc ccaggcgtgg 41400
aagccgaaga tcttgaccga gatggcctgc ggcacgaagg ccccggcgag cttgtcgagc 41460
gtgtaggtcg cctgcacgtc gacggtgccg tacaggaacg ccttccagtt ctcggacatg 41520
ctcttgacgg cgtccgagta tctcggtgcg tagtcgacca gcggcaggtt ccaggcgtag 41580
agcaccgctg ccgtggccgc gatgcagagc agcgccggcc gggcccacca cggctggccg 41640
ggcggcgagc gccacaccgc ccagcggggg aatctgccgg cgggtgcggg gtcccggcac 41700
gcggacggcg gagtcatggt gatgtgcgac atgaggaact cccaggcgtt tccttcggca 41760
gttccctgcc tttactcggc tgcgtagcga atgaccggcc aggtggtctc gttatatccg 41820
ccgtccggtg cggcgttcct ggcatgctca tcgagtttgg cgaacaggtt cttgttcggc 41880
ccgtcgagca ccgacaactg cgtcgcgtag tgcttcatcg cctggaattt ccgcgtccgc 41940
gcctcctcat cgacgaaact cagctccgga gagccgagcc ggaggccgtc aggcaattca 42000
gccaggtcct gggaatacgc cgcgtacggg agatcctgcc agagtcgcag cggaatacct 42060
cgctcgcgtg cggcgagcag cgtggcatcc cgcgtggcct tgtggtcggg gtgtttcccg 42120
atggccacac aggtgagaac gagcgtcgga tcgcactccg cgatcatgga ctcgatgtcc 42180
tccctgatcg cggcgaccag gtcgtggttg ttcgccggcg actgctggcg gaccatcgag 42240
ccttcgttgt ggtgcagcag ccactggcca tccggtgacc ttcgatagat ggcatcgaga 42300
aaacggccat gccgatggcc cgcaccgagc tgatcgaggg cggcgatgtc ctcatttcgt 42360
cggcgcagcg gcgcgtcctc ggtcggcgac agaccccagc gtgcgtggaa tcgctccgcc 42420
gccggggaat aagggggcgc cgcgctgccg gcgaacaccg tgaagacggt tacttttcca 42480
ccgtcctgct ccgcttgggc gaggctggct ccgacggaga ggacggcatc atccaaatga 42540
ggggagattg ctaatatccg ggttcggtcg gcgtcctgca acatggttgt cagtctggtg 42600
tcggccctgc cccgttgcaa taaagcggaa ctggacggga cctcgcacgc gtggagaatt 42660
tccgggcggg ccgggcacca cgatgagtca cccggtcacg tcgcagtcac acgttctctg 42720
accagcctgt caccgtctgc tgcgtacaac tggtgtcaac gccgacaccg ggcaggagaa 42780
gatgagtggg aagagcgcag ccgcacgacc tcgcctcggt cgcatcgaac gacgccttcg 42840
ccgggctcac gtcggcgacc gcggcctcta ggatggcgcc agccggcgca gcgcgcgccg 42900
catgaggggg aagtggatct ctaccgagag gccaccctgc gggcgcgcgt gcgcggtcaa 42960
cgtggcgtcg tgggcgacgg cgatggcgcg gacgatggac agcccgaggc cgtggtggtc 43020
gtcggcgcgg gtgcggtcga gccgctggaa gggctcgaag aggcggtgga cctgctcggg 43080
gggcaccacc gggccggtgt tggcgatgga gacgacggcc ttcccggcct cggcccgggt 43140
ggagagctcc acctggccgc caggcacgtt gtagcgcatg gcgttgtcca gaaggttggt 43200
gatgagtcgt tcgaccagtg ccgggtcgcc cgtggtgggg gcatgagcga tcccggtcac 43260
caatcggggg tgtgggcaac cggcccggag ggacttcccg tcggcccagg aatcggttgc 43320
cgcgccggcc gtggggctgt tcccgtcagc cctccgatcg gcactcacgc cggccctggg 43380
gttgttcccg tcagccccgg ggccggtccc ctccatcgtg cggatcgtgt gctcggcgat 43440
ctccgccaga tccaggggct cgcggtgatc gaggccgccc tcgctcttgg ccagcgtcag 43500
cagcgattcc agcaggcgcc cctgctgccg gctgaggtcg agcagccgct ccatgatcga 43560
tcgcatggac ggggtgtcgg cgtcccgatg caggaggctc tcctccagca acgcgtgctc 43620
cagggtgagc ggggtgcgca gctcgtgggc cgcgttggcg acgaagcgct tctgcgcgtc 43680
gagggcgctg tggagacgtt ccagcagctc gtccaccgtg tcggcgaggt tgcgcagctc 43740
gtcgcgcggg ccgggcaggg cgagccgctc gtggacgttg cgggcggaga tccgcttgag 43800
cgtggtgttc atcgtccgta gcgggcgcag catcctgcct gccaccagcc agccgagcaa 43860
gaacgagatg accgtcatca gggccagcgc gatcagcgat tggaacagca ggttctccag 43920
aatggccgcc tgctgctgcc gcgcgaaggc gcggaacctg ccgccagggt caccgtccac 43980
cagcacgaag ggtctggagc cgcggaagag caggtaggtg atggcgagca ggaccacccc 44040
tgaggcggcg aacaacgcgc cgtagacgag cgtgaggcgc agccgtacgc tgcggaaggc 44100
tgttgtcagg cgtcggagac gatgggccac tgttccgatg gtatgagacc aggaccggcc 44160
ggaggagccc acggcgccga cgatcgcggc cccgggccga ggccgagatg ccgcgagtcg 44220
ggcgcctacc gagtcagcgc accgcgcacc gctgccgtga cctcgggcgc cagggtgcgg 44280
gcgaaggtgg tggtgaggtg gctgcggtcg gagtaggcga tcaggccgcc gatgacgggg 44340
ccgcaccgct cgccgcacac caggtgatcg acactcgcca cggagacgag gccggtgtcg 44400
tcggcgcggg cggcggcggc gagcggatcc ggccggagca cgacgccggc cgggccgccg 44460
caggagtcca gatcgtccgg gtgcttggcg atgcagtggg gcacgctgtc cggcatggcc 44520
ggggtgtcac gcaggacgag caccggaagg ccggcgccgg tgaaggcccg gagcgtgtcg 44580
cggtaggccc gctcggccgc ggcctgctgg ccggctggcg agacgccggc gagcggcaca 44640
tgcgtacggt tggacatgat caccaggtcg tagccgccgt tcacgatgga cccgaccgcc 44700
cacttgttga tcttctggca gttctccgag acccccgcgc cttcgaggac gagcggctga 44760
tcgacggtgt agcacgccag ctgtacgtag gtggtgagct gccagcgctc gctccacagc 44820
gccttctcca gggccgggac ccagtgtccc gcgtgggagt tcccgaccag ggcgatgcgc 44880
ctgccggcgg cgtcaggtcc gtacgtgcac gtgttccggg cgatgaacgg ttccttgttc 44940
acgcacccgt ccgcgtacac ggcgggcttg tccttcaacg cgacctgagg aggcatcagc 45000
aggcccagat cctggcacgc cgggtcgcgc acgacgccgg cacccaggca tgaccctgcc 45060
cgcgaggccg cggcctcgaa cgcggcactc tccgtacgct cggcggcgtc ggcgtaggcg 45120
acgacgcccg ctcccgctcc tgcgacgacc accacgcacg acgcgagcat cgcgaacgtg 45180
agcctgcggc tgcggaccag gaccgggtgc cagcgcagcc ggtcctcgac gaggtactgc 45240
gagagcgcgg cgaggaccag ggtcagcgcg atcacgccca cggactcgat cacggtcagc 45300
gagcggccca gcgcgtacgg gaggatcatg atcggcggcc aatgccacag gtacaccgcg 45360
taggaggcgt tgccgagcca ctggaccggc cgccacgcca gcgcccgccc gggtccgccg 45420
cgcagaccgt ccgcggccgc tgcgatcacc aggcaggccc ccactgtcgg caccagggcg 45480
gcggctccgg ggaaggccgt ctcggcgtcg aaccggacca cggcccaccc gatcatgccc 45540
aggccggccc acgcgagccc ggcccggacc gcccgcgcgc gcggcatcgc gcgtacggtg 45600
agaaccgcgg cgagcagacc gccgagcgcg agctcccaga agcgggtcgt cgacacgaag 45660
tacgcggcgg ccggatcggt cgccgtcttc tgcaccgacc aggcgaggga cgcggccacg 45720
accgcacccg tgaccaccac cgcgctccac ctcgtgaagt tctccggagg gcgacgcccc 45780
cgtgccaccc gggcggccag ccaggccgcc gaccccagca gcagcggcca gccgaggtag 45840
aactgttcct cgatggacag cgaccagtag tgctgcgcgg gccagtccgg ctggtcgacg 45900
tcgaggtagt tcgcctgcgt gagcgcgagt ctcaggttct ccacgtacac cgtggcggcg 45960
atcacctcac gcgccgccgt ccccagcacc gtgagcggca gccagaccac cgacgcggcg 46020
agcgtgacca ggagcgcgag gctcgcggcc gggatgaggc ggcggacgcg gcgtgcccag 46080
aagtccagca gtctcccgcc gccgtgtccc ggctgacgca gcaggtggct cgtgatgagg 46140
tacccggaga tgacgaagaa gacgtctacc cccacgtacc cgccggtcgg cccgccgggc 46200
cacaggtgga acgcgaccac cgccgccacc gcgatcgccc ggaggccctg aatgtccgtg 46260
cgggactcgg agctccggcc gccggcgtgc tcgcttcgcg gcgcacacga cggggcgtgc 46320
ggcgtcagcc cgcatgcgca ggtcggaagg gacatctgtt cggtgggtgc cgggcgctcc 46380
atggcaactc ccgcgtcatc gaggtgctgc gcagccctcg aaggtcgcac ccgcggacga 46440
gagcctgctt gatcgcaagc gtgctcaacg gactcgatgt ctacaagccg gtccaggtga 46500
acgcttggtc accaccaccg gtgaacgcgt ccaagcgcgc gaactgttca gttggaccca 46560
ctcgtggaca tcggctccgc tcagcacgat tgaggtcgct gacttgcgtg cgcgtgtgag 46620
aggagtcccg catggccata gtgtcgccgt tcggaggttt gctgaagggc gacggagagg 46680
atgatcccgc gccgtccagg atccgcccgg ggacgttgcg acgagtgctc ggatacttcc 46740
gcccgcacgt cggcaaggtg gcgctcttcg ttctcgtcac cgcattggat tcgatcttcg 46800
tcgtcgcgtc tccgttgatg ttgaaggacc tggtggacaa gggggttctg gggaacgatc 46860
tggagctcgt catcctgctg gcgtgcctgg ccgccggctt cgccgtgatg agcacgctgt 46920
tgcagctcgt gtcggcctac atctccggcc ggatcgggca gggggtcagt tacgacctgc 46980
gggttcaggc ccttgaccac gtccagcggc tgccgatcgc gttcttcacc cggacccaga 47040
cgggcgtgct ggtcggccgg ctgcacacgg agctggtcat gacgcagatg gcgttcaccc 47100
agatgctgac ggccgccgcc agcgcggtca cggtcctgct ggtgctggcc gagctgttct 47160
acctgtcgtg gatcgtcgcc ctcctcacgc tggtgctgat cccggtgttc ctggtgccct 47220
ggtcttacgt gggacggcgg atgcagcgct acaccagagg gctgatggag gagaacgccg 47280
gcctggccgg gctgctgcag gagcggttca acgtccaggg ggcgatgctc tccaagctct 47340
tcggccgtcc ggccgaggag atggccgagt acgagagcag ggccggccgg atccgcgggc 47400
tcgccgtgag cgtcaccctc tacggccgga tggcccccgc catcttcgcg ctgatggccg 47460
cgctcgccac ggcgctcgtc tacggggtcg gcggcgggct cgtgctctcg caggcgttcc 47520
agctcggcac gctggtcgcc ctggccaccc tgctcgggcg gctgttcggg ccgatcaccc 47580
agctggccag cattcaggag aacgcgctca cggtcctggt gagcttcgag cggatcttcg 47640
agctgctcga tctgaagccg ctgatcgagg aacgccccga cgcggtcgcg ctcaaggccg 47700
gcaaggcctc ggacgtccag ttcgagaacg tgtcgttccg ctaccccagc gcggacgagg 47760
tctcgctgcc gtcgctggaa cagaacgtgc gcaccgggca ggagcgtggt gaagcgacgc 47820
cggaggtgct gcgcgacgtg agcctgcacg tgccggccgg caccctcacc gcgctcgtgg 47880
gcccgtccgg cgccgggaag agcaccctca cgcacctggt gtcccggctg tacgacccga 47940
cctccggaac cgttcgcgtc ggcggacacg acctgcggga cctcaccttc gactcgctgc 48000
gcgaaacggt gggggtggtc agccaggaca cctacctctt ccatgacacg attcgggcga 48060
accttctcta cgcccgcccc gacgccaccg aggacgagct ggtcgaggcg tgccgagggg 48120
cgcagatctg ggacctgatc gcatccctgc cacgcgggct cgacaccgtc gtgggtgatc 48180
gcggttatcg cctgtcaggc ggggagaagc aacggctggc gatcgcccgg ctgctgctga 48240
aggcaccctc ggtcgtcgtt ctcgacgagg ccaccgccca cctggactcg gagtcggagg 48300
ccgccgtcca gcgggcactg acgacagccc tgcgcagccg tacctccctg gtgatcgccc 48360
accggttgtc cacgatccgc gaggccgacc acattctcgt gatcgacgac gggagggtca 48420
gggagcgcgg gacgcacgag gagttgctgg cggaaggcgg tctctacgcc gacctgtacc 48480
acacgcagtt cgccaagtca ggcgtcaacg ggacccggcc gggacagggc gacggggcgg 48540
agcccgtgca agaggtggtc ggtggagggg aacgatgagc gccggaacgc gggccacacc 48600
gacgacggtg ctggacctct tcgcccgcca ggtgggccgg gcacccgatg cggtggctct 48660
ggtcgacggg gaccgggtcc tgacctaccg gcggctggac gagctcgccg gagcgctgtc 48720
cgggcgcctg atcggccggg gtgtcggccg gggtgatcgc gtcgcggtga tgatggaccg 48780
ctcggcggac ctggtggtga cgctgctcgc cgtgtggcag gcgggggcgg cctacgtgcc 48840
ggtggacgcc gcccttcccg cccggcgggt ggcgttcatg gtggcggact ccggagcctg 48900
cctgatggtg tgctcggagg cgacgcgcga tgcggtaccg caaggggtcg agtcgatcgc 48960
gttgaccggc gagggcggat gcggcacgtc ggcggtcacg gtggacccgg gggatctggc 49020
gtacgtgatg tacacgtccg gctcgacggg caccccgaag ggggtggccg tcccgcatcg 49080
gagcgtcgcg gagctgacgg gaaaccccgg ctggggggtg gagcccggcg aggcggtgct 49140
catgcacgcg ccctacacct tcgacgcctc cctgttcgag atctgggtgc cgctcgtgtc 49200
gggcgcccgg gtggtgatcg ccgcaccggg tgcggtggac gcccggcgcc tgcgcgaggc 49260
ggtcgccgcc ggggtgacga gggtgcacct gaccgcgggc agcttccgcg cggtggcgga 49320
ggagtcgccg gagtcgttcg cgcacttccg tgaggtgctg accggtggtg acgtggtgcc 49380
cgcgtacgca gtgcagaagg tgcgggcggc ctgccctcac gtgcggatcc ggcatctgta 49440
cggcccgacg gagacgaccc tgtgcgcgac gtggcagctg ctggagccgg gtgacgtcgt 49500
ggggcccgtc ctgccgatcg gccgcccgct gccgggccgc cgggcctggg tgctcgacgc 49560
gtcattgcgg ccggtggagc ccggggtggt cggtgacctg tacctttccg gcgccggtct 49620
ggcggacggc tacctggacc gggcggggct gacggcggaa cggttcgtgg cggatccgtc 49680
cgcggcgggg aggcggatgt atcggacggg ggatctggct cagtggaccg cggacggtga 49740
gctgctgttc gcgggccggg ccgacgacca ggtgaaggtc cgcggattcc ggatcgagcc 49800
gggcgaggtc gaggccgcgc tgaccgctca gccgcacgtc cgcgaggccg tggtggtggc 49860
gatcgacggg cgcctgatcg gttacgtggt ggcggacggg gacgtggatc ccgtactgat 49920
gcgccggcgg ctggcggcgt cgctgccgga gtacatgatc ccggccgctc tggtcacgct 49980
ggacgcgttg ccgctgaccg gcagcggcaa ggtggacagg agggcgctgc ccgagcccga 50040
tttcgcgtcg gccgcgccgc gccgcgaacc cggcaccgag ccggagcgcg tcctgtgcga 50100
cctgttcgcg gagcttctgc aaccggaggg aaggggggta ggggtcgatg acggtttcgt 50160
cgagctgggc ggggactcga tcgtcgcgat ccggctggca gcacgtgcgt ccagggtggg 50220
gctgctggtg acgcccgccc agatcttcaa ggagaagact ccggcacggc tggcagccgt 50280
cgcgggtgcc gtaccggccg gcagacccgc cgacggcccg ctgatcaccc tcacggcgga 50340
ggaggaggcg gagctggcga ccgccgtccc gggggccgag gaggtctggc cactcgcacc 50400
gctccaggaa gggctctact tccaggccac cctcgacgac gagggtcacg acatctacca 50460
ggcgcaatgg atcctggagc tggcggggcc gctggacgcc gcccggctgc gggcctcgtg 50520
ggaagcggtc ttcgcccggc accccgagct tcgcgtgagc ttccaccggc gcgcgtcagg 50580
cacgatgctg caggtcgtcg ccgggcacgt cgtcctgccg tggcgagagg tggatctggc 50640
ggatgcgggc gatatcgacg cggccgtggc ggccctgatc agtgaggaac aggagcagcg 50700
gttcgacctc gccaaggcac cgctgttccg gctggtgctg gtccgtcacg gcgaggaccg 50760
gcaccgcctg ctggtcgtcc atcaccacat cctgaccgat ggctggtcgg tggcggtcat 50820
cctcaacgag gtggctgagg cgtacacgaa cggcggccgt ctcccggacc gcacgggcgc 50880
ggcctcctac cgggactacc tggcctggct ggaccggcag gacaaggacg ccgcacgtgc 50940
cgcctggcag gcggagctgt ccggcctcga agggcccgcg ccgatcgcga aggccgccac 51000
cacgaccggc gccgggacgg gctacgaata tcgcatcgcc ttcctgaccc ctgacctcca 51060
cacgcggctg acggagctgg cccgcgacca cgggctgacg ctgaacaccc tggcacaggg 51120
cgcatgggcg atggtgctgg cgcggctcgc gcggcgcact gacgtggtct tcggcaccac 51180
ggtcgcctgc cgtcccgccg agctccccga ggtggagtcg gtgccgggtc tcatgatgaa 51240
cacggttccg gtccgggtgc cgctgcaggg cgcgcaatcg gtcgtggacc tgctcaccgg 51300
cctgcaggaa cggcaggcgg ccttgctgcc gcaccagcat ctggggctga cggagatcca 51360
gcgggcggca ggacctggcg cgacgttcga cacgctgctg gtcttcgaga actacccgcg 51420
ggacttcgcc ggccagttca cctacctggg cacgatcgag gggacccact acccgctgac 51480
cctcggcatc atcccggggg atcacttcag gatccagctc gtctaccggc gcgggcaggt 51540
cggggagagc gtcgccgagt cgatcctggg atggttcacc ggcgctctca tgacgatggc 51600
cgctgatccg cacgggccgg tgggccggat cggtgtgggt gaggcccggg ccggcggctc 51660
ggaccgggcg atggcggcgg gggagccgct gccggtgctg ctacggcggg tggtgaagga 51720
ccggccggac gaggtggcgg tggtggacgg cgacggtgag ctgtcgttcg gggaattgtg 51780
ggaacgggcg acggcgctgg cggccgagct gagggctcac gggatcgggc cggagagccg 51840
ggtggccgtg atggtgggca ggtcggcgtg gtgggcggtc ggggtgctgg gcgtctgctt 51900
ggcgggcggc gcgttcatgc cggtggatcc ggcgtatccg gctgagcgcg tcaggtggat 51960
cctggccgac tccgacccac ggctggtgct gtgcgcgggg acgacgcggg aggcggtgcc 52020
ggaggagttc gcagaccggc tggtggtggt cgacgagctg gacctcgcgg ggagcgacga 52080
tgcgggcttg ccacgggtga gcccggatga cgcggcttat gtgatctata cgtcgggatc 52140
gacggggact cccaaggggg tcgtcgtctc gcacgcgggc ctcgggaatc tggcgatggc 52200
gcagatcgac cggttcgccg tgtcgccgtc gtcgcgagtc ctgcagttcg cggcgctggg 52260
cttcgacgcg atggtgtcgg agatgttgat ggcgctgttg tcgggggcga ggctggtgat 52320
ggcgccggag ccggccctgc caccgcgggt gtcgctggcc gaggcgttgc ggcggtggga 52380
ggtcacgcac gtcacggttc cgccgtcggt gctggccacc gccgatgcgc tgccggccgg 52440
gctggagacg gtggtggtgg cgggggaggc ctgcccgccg ggcctggccg aacgctggtc 52500
ggcgggacgg cggctggtca acgcgtacgg gccgaccgag gccacggtct gcgcggcgat 52560
gagcaggccg ttgacgggca gccgggaggt ggtcccgatc gggacaccca tcgccggcgg 52620
ccgttgctac gtgctggacg cgttcctgcg gccgttgccg ccggggatca ccggtgagct 52680
gtacgtggcc gggatcgggt tggcgcgcgg ctatctgggt cgtgcgtcgt tgacggctga 52740
gcggttcgtg gcggatccgt tcgtggctgg tgagcggatg tatcggacgg gggatctggc 52800
gtattggacg ggtgagggcg agctggtgtt cgccgggcgg gatgacgacc aggtgaagat 52860
ccgtgggtat cgggtggagc cgggtgaggt ggaggcggtg ctggcggggc agccgggggt 52920
ggatcaggcg gtggtggtgg cgcgtgaggg gcggttgctg ggttatgtcg tctccggtgg 52980
tggggtggat ccggtgcggt tgcgtgaggg ggtcgcgcgg gtgttgccgg agtacatggt 53040
gccggcggcg gtggtggtgc tgggtgcggt gccggtgacg gcgaacggga aggtggatcg 53100
ggaggcgttg ccggatccgg gcttcggcgg gcgggtttcg ggccgggagc cgcgtacgga 53160
ggtcgagcgg gcgttgtgcg ggctcttcgc cgaggtgctc gggctgccgg gggtgacggc 53220
ggtggggccg gacgacagct tcttcgagct gggcggggac tcgatcactt cgatgcagct 53280
ggcgtcgcgg gctcgccgcg aggggatgct cttcggcgcg cgggaggtgt tcgagcgcaa 53340
gacgcctgcg gggctcgcgg cgatcgtcga tgtgggcggc gagcttgcgg caggtccggc 53400
cgacggcgtg ggggagatcg cgtggacgcc gatcatgcgg gcgctcgggg acgggatcgt 53460
ggggtcgcgg ttcgcccagt gggtggtgct gggtgcgccg ccggacctac gggcggacgt 53520
ggtggccgcg ggattggcgg cggtggtgga cacgcacgac gtgttgcggc tgcgggtcgt 53580
cgatgaccgg gcgggccgcc ggctggcagt gggcgagcgc gggtcggtgg acacggccgg 53640
gctggtcacg cggctcgagt gcggcggccg tccgccggac gaggtcgtgg agcgcgcggt 53700
gcgggaggcc gtggggcggt tggacccggt ggcgggtgtg atggcgcagg cggtctgggt 53760
ggatgcgggg ccggcgcgga cggggcggtt ggtcgtcgtg gtgcatcatc tggcggtcga 53820
cgggatgtcg tggcggatcc tggtgcccga cctgcggctg gcgtgtgagg cggtggccga 53880
ggggcgggat ccggtgctgg agccggtgtg ggggtcgttc cggcgctggg cggctctgct 53940
ggaggagtcg gcgctctcgc gggagcgggt cggggagctg cacacgtggc ggacgatcgt 54000
cgatcaggag gatcggccgg tcggccggcg gcggctgagc gcaggggatg cggccggggg 54060
cgtgcgttca cggtcgtggg tgatgtcggg ggatgaggcg tcgctcctgg tggggaaggt 54120
tccggtggcg ttccactgcg gggtccacga ggtcctgctg gcgggcctgg cgggagcggt 54180
ggcgcgctgg cacggtgacg acggggtcct ggtggatgtg gaaggccacg ggcgtcatcc 54240
ggccgagggg atggatctgt ccaggacggt gggctggttc accagcatgc atccggtgcg 54300
cctggatgtg gcggggatcg agctggcggc ggtgccggcc ggtggccgtg cggccgggca 54360
gttgctgaag gcggtcaagg agcagtcgcg ggcggcgccc ggcgacgggc tcggttacgg 54420
gttgctgcgc catctcaatc ccgagacggg ccccgttctg gcggccctgc cgtcaccgca 54480
gatcgggttc aactacatgg gccggttcgt caccgtcgac cagggcggtg cgcggccgtg 54540
gcagccggtc ggggggatcg gcggttcgct ggaccccggc atgggcctgc cgcatgcgct 54600
ggaggtcaat gcgatcgtcc acgacaggct ggcgggcccg gagctggtgc tcacggtgga 54660
ctggcgggac gacctgctgg aggagaccga catcgaacga ctgtgccagg tgtggctgga 54720
catgttgtcc ggattgtccc gccaagcgga ggatccttcc gcaggcggac acaccgcgtc 54780
cgacttcgcc ctactcgacc tcgaccagga cgagatcgag ggcttcgaag ccatagcagc 54840
ggaactctct ggaggccaga catcgtgaac acgccgagca cacccgccgg atcggcgctt 54900
gaggaagtct ggccgctgtc accgatgcag gaggggatcc tctatcacgc cgcactcgat 54960
gaggcccctg acctctacct catccagcag tcgcagatca tcgaaggacc cttggacacc 55020
gagcggttcc gcctggcttg ggagagcctc ctcaaccggc atgcggcgct tcgcgcgtgc 55080
ttccaccggc ggaagtccgg tgagtcggtc cagctcatcc cccgtaaggt gccgctcccg 55140
tggtccgagc gcgacctgtc cggcctgtcc gaggaggacg cgctggccga ggcgagcgtg 55200
atcgcggaga aggagcgcgc cacgagattc gacccggcca agcctccgct gctgcggcag 55260
gtgctgatcc ggttcggtcc ggacaagcac tgtctggtga cgacgagcca tcacctggtc 55320
atggacgggt ggtcgcgggc gatcctcgag tcggagctcc tcgagctcta cgccgcgggt 55380
ggcgccgagc cggggctgcg gcccgccggc tcctaccggg actatctggc ctggctggag 55440
cggcaggaca aggaggccgc ccgcgcggca tggcgtgcgg agctggcggg cgccgaccgt 55500
tcgacactcg gcatccccga agcgtccagg aagacccagg ggcagcgggt gcgggaggtg 55560
ctcggctacg cgccggactt cacctccgct ctggtggact tcgcccgccg ccatgggctg 55620
acgctgaaca cgctggtgca gggggcgtgg gcgttggtgc tggcccggct cacgcgccgt 55680
cgtgacgtgg tgttcggcgc ggtggtctcg ggacgtccgg cggaggtgcc cggcgtggag 55740
caggccgtcg ggctgttcat caacaccgtg ccggtgcgcg tccggttgga cggcgggcag 55800
ccggtcatcc agctgctgac ggagctgcag gagcggcagt ccacgctcat ctcgcatcag 55860
catctcgggc tgcaggagat ccagaagctc tccggggtga gcttcgacac cgtcgtgtcg 55920
ttcgagaact acgtcgatcc gggggcgggt ccgggctccg atcgcgagct gcgcctgaga 55980
ctgaaggagt ttcaccagtc ggcgccgtac gcgctcctcc tcggcatcat gccaggtgag 56040
agcctccaga ccgacgtgga gtaccggccc gagctgctcg acgcccgcgt cgccaaggag 56100
gccctccacg ggctcgcccg cgtcctcgag cggatgatcg ccgagccgga gaccgcagtg 56160
ggccgcctgg acgtggtcgg tgacgcgggg cgcgagctgg tggtcgagcg gtggaacgag 56220
acgggcgacg cgatcggtgc gccgtccgcg gtggacctgt tccggcgcca ggttgcacgg 56280
gcacccgccg cgacggcggt gacggccggg gacctggcct ggtcgtacgc ggagctcgac 56340
gagcggtccg gccggctggc gcgggcactg acggaacgcg gcgtgcgacg cggcgaccgg 56400
gtgggcgtgg tgctggggcg gtcggcagag gtgctggcag cctggctcgg agtgtggaag 56460
gcaggcgcgg cgttcgtgcc ggtcgacccg gactacccgg cggaccgggt ggcgttcatg 56520
ctggccgact ccgccgtcgc gatggtggtg tgccaggagg cgacctcggg tgtggtgccc 56580
ccgggctacc agcagctcct ggtgaacgac gccgacgacg gcgaggccgc cctggtcccg 56640
atcggggcgg acgatctcgc ctacgtgatg tacacctccg gatcgaccgg gaccccgaag 56700
ggcgtggcga tcccgcacgg cggcgtggcg gcgctggcgg gagatccggg atggggcgtc 56760
ggacccggcg acgcggtgct gatgcacgcc ccgcacacct tcgacgcgtc gttgtacgac 56820
gtgtgggtgc cgctcgtctc cggcgcgcgg gtcatgatca ccgagccggg ggtcgtcgac 56880
gcggagcggc tcgccgggca tgtggccgac ggcctcaccg cggtcaactt caccgcgggg 56940
cacttccgcg cgctggcgca ggagtcgccg gagtcgttct ccgggctgcg cgaggtggcg 57000
gcgggtggcg acgtggtgcc gctcgatgtg gtggagcggg tacggcgggc gtgcccgcgg 57060
ctccgggtct ggcacaccta cggcccgacc gagaccacgc tgtgcgcgac gtggaaggcg 57120
atcgagcccg gtgacgaggt ggggccggtg ctgcccatcg gccgggcact gccgggccgg 57180
cggctgtacg tgctggacgc gttcctgcgg ccgttgccgc cgggcatcgc gggtgatctc 57240
tacctcgcag gcgccggagt ggcccacggc tatctgggtc gtgcgtcgtt gacggctgag 57300
cggttcgtgg cggatccgtt cgtggctggt gagcggatgt atcggacggg ggatctggcg 57360
tattggacgg gtgagggcga gctggtgttc gccgggcggg atgacgacca ggtgaagatc 57420
cgtgggtatc gggtggagcc gggtgaggtg gaggcggtgc tggcggggca gccgggggtg 57480
gatcaggcgg tggtggtggc gcgtgagggg cggttgctgg gttatgtcgt ctccggtggt 57540
ggggtggatc cggtgcggtt gcgtgagggg gtcgcgcggg tgttgccgga gtacatggtg 57600
ccggcggcgg tggtggtgct gggtgcggtg ccggtgacgg cgaacgggaa ggtggatcgg 57660
gaggcgttgc cggatccggg cttcggcggg cgggtttcgg gccgggagcc gcgtacggag 57720
gtcgagcggg cgttgtgcgg gctcttcgcc gaggtgctcg ggctgccggg ggtgacggcg 57780
gtggggccgg acgacagctt cttcgagctg ggcggggact ccatccattc ggtgaagctg 57840
gcagcgcggg ccacgcgtgc cggcatgccc ttcaccgtgg tcgaggtgtt cgagcacaag 57900
acgcctgcgg ggctcgcgac gatcgtcgac gtgggcggcg agcccgcggc aggtccggct 57960
gatcccccat cggactccga cctgctcggc ctggcgcagg acgagatagc ggagttcgag 58020
gccgaattcg acgacgaacg tcattctctg cgctgatcga aagcgggcgc cgcgcacggt 58080
gtgccggcag cctgcgagtt gtccaacatc ctgtcgtgcc aatgacgtat gcccatgagt 58140
aggttggctc aatgataagc aaagcaatgc atggaccgat tcggcccgcc cgcgcggata 58200
ccctgctggc ctcggtaggc gagcgaggca ttctgtgtga cttttacgac gagaacgcct 58260
cggaaatctt ccgtgatttg gaggcggacg cgggcggcac ggaagaagcc cacgggttcg 58320
cggcgctcgt ccgcccggag tcgggggcga tcctggagct cggggccgga acaggcaggc 58380
tgacgattcc gctcctggag ctcggctggg aggtgaccgc cctcgaactg tcgaccgcga 58440
tgctcaccac cctgcggacg cggctggcgg acgcgccggc ggacctccgg gatcggtgca 58500
ccctcgttca cgcggacatg accgccttca aactgggaga acgcttcgga acggcgattc 58560
tcagcccgtc cacgatcgac ctcctggacg atgccgacag accagggctg tactcgtcgg 58620
tccgtgagca tctgcggccc ggcgggagat tcctgctcgg catggccaac cccgacgcgt 58680
ccggcaggca ggagccgctg gagcgcaccc aggagttcac gggcaggagc ggccgccgat 58740
acgtgctgca cgccaaggtc tacccgtcgg aggagatccg cgacgtgacc attcatcctg 58800
cggatgaatc ggcggacccc ttcgtcatct gcgtcaatcg cttcagagtc atcaccccgg 58860
atcagatagc acgagagctg gagcaagccg gattcgacgt ggtcgcgcgg accccactgc 58920
ccggggtgcg taatcacgaa ctggtgctgg aagcgcaatg gggcagcgtg gaagacgcgc 58980
attagagccc tccggggaaa gcgcttgtgt acttttctgc agtcattcga cagtgaggaa 59040
cagaaatgag tgaggagctc ctcttcctcc ggcccgacac cattatcgaa ccgctggcca 59100
accggttcta cgcctcgatg tacgcgacgg ctcccgtcac ggccgccatg aatctcgcct 59160
tccgtaacct gccgatgctg gagtcctacc tcgcatcccc ggaatggcat ttcgcagccg 59220
ctcgcgatcc gaagttccgc ggcggattct tcgtcaacat cgaggagcag cggaagaacg 59280
aggtcgaggc gctgctcgct gcgatccggc gcgacagcgc ggacgtgctc cggttcgccg 59340
aggcgatcgc ggaggccgag aagatcatcc gcgaggaagc gaccggatac gatctcaggc 59400
cgctctaccc gaagctgcct cccgagctgt cgggtctggt ggagatcgcc tatgacaccg 59460
gcaacgcggc ctcgctgcac ttcctggagc cgctcatcta caagagcaag gcctacgccg 59520
aggactgcca gtccgttcag ctctccgtgg agaccgggat cgagcggccg ttcgtgatga 59580
gcaccccgcg actgccctca cccgacgtgc tcgagctgaa catcccgttc cggcatccgg 59640
gtctggagga gctcttcctg tccaggatcc ggcccaccac cctggccgcc ctccgcgagg 59700
cgctggagct cggcgacgcg gaagcggcgc ggctcgccga cctgctggtc ccggagccct 59760
cgctcgcctc cgaccgccat gtcgcggccg gagcccggat ccgctactgg gggcacgcct 59820
gcctgctcat gcagacgccc gacgtggcca tcatgacgga cccgttcatc agcgcggata 59880
ccgacgcgac cggccgctac acctacaacg acctgcctga ccgcctcgac tacgtcctca 59940
tcacgcacgg gcattccgac catctggtgc ccgagacgct gcttcaactg cgcggccggg 60000
tgggcacgtt cgtcgtgccg cgaacctcgc gcggcaacct gtgcgatcct tcgctggcgc 60060
tctatctcag aagcttcggg ctgcccgcga tcgaggtgga cgatttcgat gagatcgagt 60120
tccccggcgg gaagatcgtc tccaccccgt tcttcggcga gcacgccgat ctcgacatcc 60180
gggccaagtc gacgtattgg atcaacctcg gtggcaagtc gatctgggtg ggcgcggact 60240
cctcaggcct cgatccggtt ctctaccgcc atatccgccg gcatctcggc gcggtcaaca 60300
tcgccttcct cgggatggaa tgcgatggcg cgccgctgaa ctggcagtac cagccgttca 60360
tcaccaaggc gttgccgaag aagatgagcg acagccgcaa gatgtccggc tccaacgcgg 60420
agcaggcagg tgcgatcgtc accgagctgg gcgccgagga ggcgtacatc tacgccatgg 60480
gggaggagag ctggctgggg catgtcatgg ccaccagcta caacgaggac tcctaccagc 60540
tccagcagat cgccgagttc gaggcatggt gttcccgcaa gggtgtgaag gccgctcatc 60600
tgctcgacca gcatgagtgg cactggtcgt catccaggtg atcgcggtgg cccgccggtc 60660
ggccttcgct caggcgggca gggccgcggt cgcaagcagc tgccgaggcc gtgctcgccg 60720
aggccgtgct cgccgaggcc gtgcccgtgc tcgcccaggc cgtgcccgtg ctcgccgacg 60780
ccgtgctcgt cgaggccggt gccagagggc gcgtcaccgg cctctcagcg caaccggccg 60840
cgtgaaccgc ccggcggttc ggatcgttcg atatcagggc cggatcgaca acgcgtggtg 60900
gaagtggtta cgcgggtcgt aggcggcctt caccttgcgc agccgcgggt ggttcccctt 60960
gtagtagagg tcgtgccacg gcacgcccga ggtgttcaag cccggatccg cgaggtcgct 61020
gtcggggtaa ttgatgtacg ccccatcgct gacgtcgttc ggcaccggca ccccgccggt 61080
ctcggcgtac acatcggcat agagcttgcg gacccacgtc agatgcttgg cctcgttgcc 61140
gggattcgcc caaccggtga tgtagttcac cttgagtatc gcgtcgcgct gcggcagggc 61200
ggtggccgcc gggtcgacgg tgttcacctt cccgccgtag ccgatcagcc agacggcgcc 61260
gtagtcgatc ccgtccatgt gggtcatgtt ctcgtacacg gcctgaatct gccggtcggt 61320
cagccgcttg cgcaggtagc cggctttcgt cttcgacgcc gggcccctgc ctcctcgccc 61380
cggcgtcgag gccagccacc tctgttcgat cggctcgggc acctcggccg gcgggacgcc 61440
gtcgatcacc gcctcgatgt gcgcgtcgag cagtctccgg gcgtccggcc gggtggcgtc 61500
cacctggatg ggcatcatga agccgctctc acccatgccc gggacctcgt tcccgatcat 61560
gagctgactc cacagcccgg tgtacggcga gtcgggcccg ctgttccgct cgtaccactc 61620
cccgtggttg cgcagcagcc gggagaacgc cgcctccgtc atccccgccc agtcgaaggt 61680
caccgtgctc gtgagcaacg tcgcgggcgg cttcggcagc agccgctccg gattccggcc 61740
gacgtcctcc ggcaccctca tccagtactt cgtgaccacc ccgaagttcc cgccgccacc 61800
gccggtgtgc gcccaccaca ggtcgtgatg ggggtcgtcg cgctcacggg tcgccacgat 61860
cacgcgtgcc ttcccctgtt tgttgacgac gacgacctcg accgcgtaca agtagtcgac 61920
cacggagccg aactgccgtg acagcgggcc gtacccgcct ccgcagatgt gtccgccgac 61980
gccgaccccg ccgcagaccc cacccggtat ggtcacgttc cagcccaggt agagcttttc 62040
gtacacctct gagagcgtgt tgcccggctc gatcaggaac gcgttcatcg acgggtcgta 62100
cgcgatctcc gtcagcagcg acatgtcgat gatgaccttg acgtcggggt tgtcgacgaa 62160
gtcctcgaaa cagtgcccac cgctgcggac ggcgacccgc ttgccggtgc gcaccgtctc 62220
ctcgacggca tcggccacct gctgggtgga gccgaccagg tggatgtagt cgggctcgcc 62280
gttgaagcgg ctgttggcgc cacgcagctt caggttgagg tagcgcgggt cgtccggagt 62340
caccttgacc gggccggccg gcggtaagca gcgctcgccc cgcagctccg gtcgcgtgga 62400
cgaggcgccg gccgacgcgg cgtccgctcc ggtgccgccg gtcaccaccg ccgccgcgcc 62460
cccggcaagg gaggcactca gcaatctacg tcggttcagt tttgtcatgg cggcgacgtt 62520
actatcggtt cgattcgatc aactcgctgt ctgactggac gtaagcgatc tcttcacgcc 62580
gtggccgtac gtggctgtcc atcgcctaca gatttccgat ctctgaaggt acggtcacct 62640
gttgaagaac gcgtccgtca gcgcattcca ggtgacgccg ccgcgaacgc gcgctcacgg 62700
gaaaactcgc cgtcgaggcg ggtgacgacg gaatcgtggt gtccaaccac ggaggccgtc 62760
agttggacgg tgccgtcctg agccagtttc tgccaaacga ctgggaacac catgggacat 62820
ccacacgatc aagagcccga cggccaaatc cgtcctgcgg ctcagagccc ccgccggttg 62880
gtcgagatga cgagcacctc cgggcggcac ctgtatcacc gccaggtgcg attctccgat 62940
atcgacgccc acggccacgt caacaatgtg cgtttcctgg aatacctgga ggacgcctgg 63000
atcgccctct atctcgacaa tgcgggcccg ccgcaggagg accgcgacgg attgcccgcc 63060
gtggggttcg ccgtcgtgcg ccacgagatc ttctatcggc gcccgctcag gttccggcac 63120
gggtcggtgc gggtcgagtc gtgggtgacc aaggtgaaca gggtgacctg cgagatggcc 63180
gcgcagatct gctcggacgg ggaggtgttc gtcgaagccc gctcgatgat catggggttc 63240
gacacgcaca ccgccaagcc gcggcgcctc accctgcacg agcgcacctt tctcaagcgt 63300
tacctgcgct gatgtgactt ctccattgcc ggccgcggct ccgggcgttg gacgattttg 63360
accgccgaga tcggccgagc ctaccttcac ggtgttcgct gcgaccggaa aggtgaattc 63420
aatggccgcg tccgaggtca agcaagtgct ccggagcaag ctcaggacat gggggtggat 63480
gtatcgatga cgaccagcat cgcgtcggca gaagaccttt ccgtcctcac cggactgagc 63540
gagatcacca cgttcgccgg cgtggggaca gccgtttccg ccacgtccta ttcgcaagcc 63600
gagctgctcg aaatcctcga catacgcgat cccaggatcc gatcgctgtt cctgaacagc 63660
gcgatcgagc ggcgttttct cgcgcttccg ccccagggcc gggacgggga gcgcgtggcg 63720
gaaccgcagg gtgatctcct ggacaagcac aaaaagctcg ccgtcgatat gggatgccgg 63780
gccctcgagt cctgcctgaa gtcggcgggc gcgacgctct cggatgtccg ccacctgtgc 63840
tgcgtcacct cgaccggttt tctcaccccc ggcctgagcg cactcatcat ccgcgagctc 63900
gggctcgacc cgcattgcag ccgcgccgac atcgtcggca tgggatgcaa cgcggggctg 63960
aacgcgctca acctggtcgc gggctggtcc gcggcgcacc cgggcgagct cgccgtcgtt 64020
ctgtgcagcg aggcgtgttc cgctgcttac gcactggacg gcaccatgcg caccgcggtg 64080
gtcaacagcc tgttcggcga cggatccgcc gccctcgccg tcgtctccgg tgacgggcgc 64140
gctgccggcc cgcgcgtcct gaagttcgcg agctacgtca tcaccgacgc gatcgaggcg 64200
atgcgctacg actgggaccg cgaccaggac cggttcagct tcttcctcga tccgcagatc 64260
ccctacgtgg tcggcgcgca cgccgagatc gtcgtcgaca agctgctgtc cggtacgggg 64320
ctgcgccgca gcgacatcgg ccattggctg gtgcactccg gcggcaagaa ggtgatcgac 64380
gccatcgtcg tcaacctcgg cctgagccgg catgacgtcc gccacacgac cgctgtgctc 64440
cgcgactacg ggaacctctc cagcggctcc ttcctcttct cctacgaacg gctcgccggc 64500
gagggcgtga ccaggcccgg agactacggg gtgctcatga ccatggggcc cggctccacg 64560
atcgaaacgg cgctgatcca atggtgagtg gcagtgacat gaacggcgaa ctggagctga 64620
gcctcgacgg cacccaggcg ctgaccgcgt cggtcgagga gctgaacggc ctctgcgacc 64680
gcgccgagga ccatcgagca cccggcccgg tcatcgtcca cgtcaccggc gtgccgcgcc 64740
ttggctggtc gaaggggctg acggtgggcc tggtctccaa gtgggagcgg gtggtgcgcc 64800
ggttcgaacg gctcggccgg ctcaccgtcg ccgtggcgtc aggcgactgc gcgggaccct 64860
ctctcgacct cctcctcgct gccgacgtgc ggatcgccgc tccggcgacc cggctgctgc 64920
cctcctgggc cggcggcgcc gcgtggccgg ggatggccgt ctaccggctc acccagcagg 64980
ccggtacggg cggcatccgg cgggccgtgc tgctcggggc acccatcgac gccgaccgcg 65040
cgctcgccct caacctgatc gacgaggtgt ccgcggaccc ggcggcgtcc ctggccggcc 65100
tggcgggtgc cggggacggc gcggagctgg cgattcgcag gcagctgatg ttcgaggcga 65160
gctcaaccac tttcgaggac gcgctcggtg ctcacctggc cgcggtggac cgggccctac 65220
gacgggagac cctctcgtga cgacggattg gccggcgctg ccgcccaggg cgccgctcgc 65280
cctctggacc ctgacggcgg aggcccagcg agtcgacgac ctgctcgccg ggctgccgga 65340
gcctcctgcc agaacctccg cccagcgcga tgccgcggcc tcggcactcg acaaggtgag 65400
gcggatgcgc gcggactaca tggaggcgca cgccgaggag atctacggcg agctcacctc 65460
cggccgcacc cggcacctgc gcatcgacga gctcgtacgg gccgccgccc gcgcctaccc 65520
cggcctggtg cccaccgatg agcagatggc ggccgagcgc gcgcggccac aggcggagaa 65580
ggaagggcgc gagatcgatc agggcatctt cctgcgcggg gtcctgcgtg ccccgaaggc 65640
gggcccgcac ctgctcgacg ccatgctccg gcccaccccc agggcccttg agctgctccc 65700
tgaattcatc gagtccggcg aggtgcggat ggaggcggtc ctgctgcggc gccgtgacgg 65760
tgtcgcgtac ctgaccctgt gccgggacga ctgcctcaac gccgaggacg cgcagcaggt 65820
ggacgacatg gagaccgcag tcgacctggc gctgctcgac ccccaggtcc gggtggggct 65880
cctgcggggc ggcgagatga gccatccccg gtaccggggg cgccgggtgt tctgcgcggg 65940
cgtcaacctc aagaagctga gctcgggcga catctccctc gtcgacttcc tcctacggcg 66000
cgagctgggc tacatccaca agatcgttcg cggcgtgtac acggacggtt cgtggcactc 66060
gaagctgacc gacaagccct ggatggcggt cgtcgactcc ttcgccatcg gcggtggggc 66120
tcagctcctc ctggtcttcg accaggtgct ggcggcgtcc gactcctaca tcagcctgcc 66180
tgcggcgacg gaggggatca ttccgggggt cgcgaactac cggctcaccc ggttcaccgg 66240
gccacgcgcg gcccggcaga tgatcctcgg cgggcggcgg atccgggcgg acgagccgga 66300
cgcacggttg atgatcgacg aggtcgtccc gccggaggag atggacgcgg cgatcgatcg 66360
cgcactggcc cgcctcgacg gagatgcggt gccggccaac cggcgcatgc tgaacctggc 66420
cgaggagccg cccgaggcgt tcggccggta cctggccgag ttcgccctgc agcaggcact 66480
gcgcatctac ggcagggacg tcatcggcaa ggtcggcagg ttcgcagcgg gatcggcatg 66540
agcgagcctc gcgtgcgcta cgagaagaag gaacacgtcg cccatgtgac gatgaaccgg 66600
ccccacgtgc tgaacgcgat ggatcgccgg atgcacgagg agctcgccga gatctgggac 66660
gacgtcgagg ccgacgacga cgtcaggacg gtcgtcctga ccggtgcggg aacgcgggcc 66720
ttctccgtcg gccaggacct caaggaacgc gcgctgctgg acgaggcggg cacgcaggcc 66780
tcgacgttcg gcagccgggg gcaggcaggt catccccggc tgaccgaccg cttcaccttg 66840
tccaagccgg tggtcgcccg ggtgcacggc tacgcgctgg gtggcggctt cgagctggtg 66900
ctcgcctgcg acctcgtcat cgcctccgag gaggcggtgt tcggcctgcc ggaggtccgg 66960
ctcggcctga tccccggggc gggaggcgtg ttccggctgc cgcggcagct gccgcagaag 67020
gtggcgatgg gccatctgct gaccgggcgc cggatggatg cggccacggc gttccggtac 67080
ggattggtga acgaggtcgt accgcttgat gagctggatc ggtgcgtggc cggatggacc 67140
gacgacctcg tacgcgccgc tccgctgtct gttcgcgcga tcaaggaggc cgccatgcgg 67200
tcgctcgaca ttcccctgga ggaggcgttc accacgtcct acccatggga agagcgtcgt 67260
cggcgtagcg gcgatgcgat cgagggcgtc cgggcgttcg tcgagaagag ggacccggtc 67320
tggacgtcga gatgatcccc ccgcacacgt tgctggtctt cttcgttcag gctgcggccc 67380
tcctgctgct cgcgttgctc ctgggccgcc tggccgtacg gctgggcctg gcggcggtcg 67440
tcggcgaact gtgtgccggc gtcatcctcg gcccctccgt gctggggcag gtcgcgcccg 67500
gggcggagca gtggctgttt ccctcgccgt cgtcacacat gctggacgcc gtcgggcagc 67560
tcggcgtgtt gttgctgatc ggcttgacgg gcgcgcatct ggatctgcgg ctgatccggc 67620
ggcagggcgc cacggcggtg cgggtgagcg ccttcgggtt ggtcgtgccg atggccctcg 67680
gcatcggcgc cggcctgttg ctgccggccg agttccgcgg gaccggcggc tcggccgtct 67740
tcgccctgtt cctgggggtg acgatgtgtg tcagctcgat ccccgtgatc gccaagacgc 67800
tgatggacat gaacctgctc catcgcaacg tcggccagct cacgctgacc gccggcatga 67860
tcgacgacgc cttcgggtgg gtgctgcttt cggtggtgac ggcgatggcc accgccggag 67920
ccggtgcggg gaccgtggtg ctgtcgatcg cgtcgctgct cggggtgatc gtcttcagcg 67980
tcgtcatcgg caggccggcg gtccgggtgg cgttgcggac gacggaggat cagggggtga 68040
tcgccggcca ggtcgtggtg ctggtgctcg cggccgcggc cgggacgcat gcgctgggcc 68100
tcgaaccgat cttcggggcc ttcgtcgccg ggctgctggt gagcacggcc atgccgaatc 68160
cggtcagact ggcaccgctg cgcacggtga cgctcggggt gctggctccc ctctatttcg 68220
ccaccatggg cctgcgcgtc gatctcacgg ccctggcgcg gccggaggtg ctcgccgtgg 68280
ggctgctggt cctggccctg gcgatcatcg gcaagttcct gggcgccttc ctgggcgcct 68340
ggaccagccg gctcagccga tgggaggcct tggcgctggg ggcggggatg aacgcccgtg 68400
gcgtcatcca gatgatcgtg gcgacggtcg gcctgcggct gggggtgatc actgacgaga 68460
tcttcacgat catcatcgtg gtggcggtga tcacctctct gctcgccccg ccactcctgc 68520
gcctggccat gaccaggatc gaggccaccg ccgaggagga ggcccgcctc ctcgcctacg 68580
ggctgcgccc cggcgaggcc cgggaagacg tacggtgacg acggctcggg atcgtcgtgc 68640
ccgacgacaa ggccggcagc cggacggtgg tggccggtgc cggctcagcc acagtgggcc 68700
ggggtcgcga tgcccagccg cgcgtgcagg tgcgcccaca gagcagcctg ctcgtgcccc 68760
aggaagaagt ggcctccggg caggacgtgg caggagaact cccgagccgt caactcggcc 68820
catcgcgcga ccgcgtcgag ccgtacgacg ggatcgtccg caccggtgaa cgccgtgatc 68880
ggcaccgtca ggggcggccc aggcgtgtgg cggtaggact ggacgagctg gaagtcgttg 68940
cgcacgtagg ggagggcgaa cgcccggaac tccgcgctcg cgagcgcctc ggcatcggtg 69000
ccgcccaaca ggcgcagcct gtcgatgagc gcctcctcgg aggccggcgc cacccgatgc 69060
gcgagacggc cacggtcgtg cgcggccaca cctccggaga cgaagagatg agccggcggg 69120
ataccggacc cggtgagaag ccgcgccgtc tcgtaagcga tcaaactgcc catactgtgc 69180
ccgaacagcg ccaccggccg gtcgaggagc ggcctcagct cacgccccac cgactccgcg 69240
agccggtggg catcaccgac gaggggttcg tgcaaccggt cggcgcggcc cggatactga 69300
accgcgtgca cttctatctc cggcgcggcc agccggtgcc aattccggta gaagaccgcc 69360
gaaccgcccg cgtgcggaaa acagatcagc cgcatcgtgg cgagcggccg cctgtcgaaa 69420
caccgaaacc aggtggacat gtagcctcgc ttcggcctca tatcatggtc ttgggtcaat 69480
cctggtgacc tgactatatg cctgcaccgc cataaagtat gtccgtccac tcatcggcgg 69540
gcatgcggca cgagtctgcc caggtcgcac ttgacgcctg gtcggcaaag ggaaaaccct 69600
tgcttccatg gactcccacg ttctcgccca tcaattgagc aaggaaacgc tgcacggatc 69660
gctgatggac ccggccatcg agtcgatgaa tctactgaac gagattgccg gcaactaccc 69720
cgacgccatt tccatggccg cgggccggcc gtacgaggag ttcttcgacg tcggcctcat 69780
ccacgactat ctggaggcct accgcgacca tctccgcaac gaccggcgga tggatgacgc 69840
cgggatcagc cgcatgcttt tccaatacgg gaccacgaag gggatcatct ccgaccttgt 69900
cgcccggcac ctcgccgagg acgagaacat cgaggccgac ccggcctccg tggtcatcac 69960
tgtgggcttc caggaggcca tgttcctggt gcttcgcgcg ctgcgagcga acgagcggga 70020
cgtcctgctc gcccccacgc ccacctacgt cggcctgacc ggagcggcgc tgctcaccga 70080
cacccctgtc tggccggtcc agtccaccga caacggcatc gacctcgacc accttgagca 70140
ccaactgaaa cgcgcccagg accagggcgc ccgggtccgg gcctgctacg tgaccccgaa 70200
cttcgccaac cccaccggca ccagcatgga cctgcccgcc cgccatcgcc tcctggaggt 70260
cgccgcggcc cacggcatcc tgatcctgga ggacaacgcg tacggactcc tcggccagga 70320
ccgcctcccc acgctgaagt ccctcgacca tgcggcgacc gtcgtctacc tcggctcctt 70380
cgccaagacc ggcatgcccg gcgcccgggt cggctacgtc gtggcggacc agcacgtagc 70440
ggggggcggc tcgctcgccg acgagctcgc gaagctcaag ggcatgctca ccgtgaacac 70500
ctcgcccatc gcccaggcgg tgatcgccgg caagctgctg cgccacgact tcagcctggc 70560
ccgggccaac gcccgcgaga ccgccatcta ccagcgcaac ctccacctca cgctggacga 70620
actcacccgc cggctcggcg ccgtcccggg agtcacctgg aacgcgccga cgggcgggtt 70680
cttcatcacc gtcaccgtgc ccttcgtcgt ggatgacgag ctgttggaac acgctgcccg 70740
cgatcatggc gttttgttca cgccgatgca tcacttctat ggtgggaagg atgggttcaa 70800
ccagcttcgg ctgtcgatca gcctgctcaa cccgcaactg atcgaggagg gtgtctcccg 70860
gcttgccggg ctcgtcaccg catgtctccc ctgaaccatg cctggggcct tgagtcggac 70920
ggccgggttg cgtgcggccg ggatgaaggt caaccacaag cgggtggtgc gcgagcacgg 70980
cctcgccggg cggtggccag cgaccaaggc ctcgacaaac gccatcgccg accctcccga 71040
gggaggatcg gcggttgaag atctgtgtgc cccctgcagg attcgaacct gcgcacccgg 71100
ctccggaggc cggtgctcta tcccctgagc taaggggg 71138
<210> 2
<211> 366
<212> PRT
<213> Nonomuria
<400> 2
Met His Glu Ser Pro Val Cys Leu Ala Glu Tyr Glu Glu Ile Ala Ala
1 5 10 15
Lys Val Leu Pro Ala Asp Val Arg Asp Phe Ile Asp Gly Gly Ser Gly
20 25 30
Arg Glu Gln Thr Leu Arg Ala Asn Arg Ala Ala Phe Asp Arg Val Phe
35 40 45
Leu Val Pro Arg Val Leu Gln Asp Val Ser Ala Cys Ser Thr Arg Ala
50 55 60
Thr Leu Leu Gly His Pro Ala Thr Met Pro Val Ala Val Ala Pro Val
65 70 75 80
Ala Tyr His Arg Leu Val His Pro Asp Gly Glu Leu Ala Thr Ala Arg
85 90 95
Ala Ala Arg Asp Ala Gly Val Pro Phe Thr Val Ser Thr Leu Ser Ser
100 105 110
Val Pro Val Glu Asp Val Thr Ala Leu Gly Gly His Val Trp Phe Gln
115 120 125
Leu Tyr Cys Leu Arg Glu His Ala Ala Thr Leu Gly Leu Ile Arg Arg
130 135 140
Ala Glu Asp Ala Gly Cys Arg Ala Leu Met Leu Thr Leu Asp Val Pro
145 150 155 160
Trp Met Gly Arg Arg Pro Arg Asp Ile Arg Asn Arg Phe Arg Leu Pro
165 170 175
Pro His Val Arg Pro Val His Leu Thr Ala Asn Ser Gly Thr Glu Ala
180 185 190
His Arg Gly Ala Ser Gly Gly Ser Ala Leu Ala Ala His Thr Ala Met
195 200 205
Glu Leu Ser Ala Ala Val Asp Trp Ser Tyr Leu Glu Thr Leu Arg Ala
210 215 220
Ala Ser Gly Leu Pro Leu Val Val Lys Gly Ile Leu His Pro Glu Asp
225 230 235 240
Ala Arg Arg Ala Ala Asp Leu Gly Ile Asp Gly Ile Val Val Ser Asn
245 250 255
His Gly Gly Arg Gln Leu Asp Gly Ala Val Ala Ser Leu Asp Ala Leu
260 265 270
Pro Gly Val Ala Glu Ser Val Gly Gly Arg Cys Glu Ile Met Leu Asp
275 280 285
Gly Gly Val Arg Ser Gly Ala Asp Val Leu Lys Ala Leu Ala Leu Gly
290 295 300
Ala Ser Gly Val Leu Val Gly Arg Pro Val Ile Trp Gly Leu Ala Ala
305 310 315 320
Asp Gly Glu Arg Gly Val Arg Thr Val Leu Gly Leu Leu Gly Ala Glu
325 330 335
Ile Glu Asp Gly Leu Gly Leu Ala Gly Cys Gly Asp Val Ala Ala Ala
340 345 350
Gln Ala Leu Arg Thr Thr Arg Pro Gly Ala Gly Phe Val Ser
355 360 365
<210> 3
<211> 356
<212> PRT
<213> Nonomuria
<400> 3
Met Glu Ser Leu Pro Pro Leu Ala Val Asp Tyr Val Glu Met Tyr Val
1 5 10 15
Ala Asp Leu Lys Val Ala Thr Leu Pro Trp Thr Asp Glu Tyr Arg Phe
20 25 30
Ala Val Val Gly Thr Ala Asn Ala Ser Asp His Arg Ser Val Ala Leu
35 40 45
Arg Gln Gly Arg Ile Thr Leu Val Leu Thr Gln Ala Thr Ser Asp Gly
50 55 60
His Pro Ala Ser Ala Tyr Val Arg Thr His Gly Asp Gly Val Ala Asp
65 70 75 80
Ile Ala Leu Arg Thr Pro Asp Val Asp Val Val Phe Thr His Ala Val
85 90 95
Ala Ala Gly Ala Arg Pro Val Arg Ser Pro Ser Arg His Pro Gly Pro
100 105 110
Gly Pro Ala Cys Ser Ala Ala Ile Gly Gly Phe Gly Asp Val Val His
115 120 125
Thr Leu Val Gln Arg Asp Pro Gly Asp Asp Pro Gly Leu Pro Val Gly
130 135 140
Phe Ser Glu Ala Pro Ser Ala Ala Glu Ser Gly Ala Asp Ala Ala Glu
145 150 155 160
Leu Leu Asp Ile Asp His Phe Ala Val Cys Leu Pro Thr Gly Asp Leu
165 170 175
Asp Ile Ile Thr Asp Phe Tyr Val Ala Thr Leu Gly Phe Ser Glu Thr
180 185 190
Phe Lys Glu Arg Ile Glu Val Gly Thr Gln Ala Met Glu Ser Lys Val
195 200 205
Val Gln Ser Ala Ser Gly Ala Val Thr Leu Thr Leu Ile Glu Pro Asp
210 215 220
Pro Met Ala Glu Ala Gly Gln Ile Asp Met Phe Leu Glu Arg His Ala
225 230 235 240
Gly Ala Gly Val Gln His Val Ala Phe Ser Ser Ser Asp Ala Val His
245 250 255
Ala Val Asn Thr Leu Ser Glu Arg Gly Val Arg Phe Leu Ser Thr Pro
260 265 270
Gly Ser Tyr Tyr Asp Leu Leu Glu Ser Arg Ile Gln Ile Arg Gly His
275 280 285
Thr Val Asp Gln Leu Arg Ala Thr Gly Leu Leu Ala Asp Glu Asp His
290 295 300
Gly Gly Gln Leu Phe Gln Ile Phe Thr Ala Ser Thr His Pro Arg Glu
305 310 315 320
Thr Leu Phe Phe Glu Val Ile Glu Arg Gln Gly Ala Arg Thr Phe Gly
325 330 335
Gly Ala Asn Ile Lys Ala Leu Tyr Glu Ala Val Glu Val Ala Arg Ser
340 345 350
Gln Gln Arg Ala
355
<210> 4
<211> 867
<212> PRT
<213> Nonomuria
<400> 4
Met Leu Phe Gly Arg Asp Arg Glu Leu Lys Ser Leu Thr Arg Leu Leu
1 5 10 15
Asp Ser Thr Ala Ala Gly Arg Gly Gly Val Ala Val Ile Thr Gly Pro
20 25 30
Val Val Gly Gly Lys Thr Ala Ile Leu His Glu Leu Gly Met Arg Ser
35 40 45
Ile Ala Ala Gly Ile Arg Leu Val Thr Ala Arg Cys Thr Pro Ala Glu
50 55 60
Gln Ser Leu Asp Trp Gly Val Ala Asp Gln Ile Leu Gly Arg Gly Ala
65 70 75 80
Ala Glu Arg Leu Thr Ala Arg Arg Gly Gly Asp Ala Val Glu Asp Val
85 90 95
Cys Val Ser Leu Phe Gln Met Ala Glu Ala Asn Pro Ile Leu Leu Thr
100 105 110
Ile Asp Asp Val Asp Leu Ala Asp Asp Pro Ser Leu Leu Ala Ile Leu
115 120 125
Ser Met Thr Pro Leu Leu Thr Asp Thr Arg Met Met Ile Ala Val Thr
130 135 140
Ile Cys Gln Asp Arg Pro Pro Ala Pro Leu Pro His Val Ala Glu Ser
145 150 155 160
Leu Leu Arg Leu Pro Gly Ile Glu Leu Val Glu Leu Pro Leu Leu Pro
165 170 175
Arg Pro Ala Val Arg Gln Phe Ala Thr Glu His Leu Gly Ala Glu Thr
180 185 190
Ala Asp Gln Leu Ala Asp Asp Leu Tyr Arg Phe Ser Gly Gly Ser Pro
195 200 205
Leu Leu Val Arg Ala Leu Ile Glu Asp Gln Glu Ala Gly Ala Pro Gly
210 215 220
Leu Val Val Gly Asp Ser Phe Met Ser Ala Val Ala Ala Cys Val His
225 230 235 240
Gly Cys Glu Pro Glu Ala Val Arg Val Ala Glu Ala Val Ala Val Leu
245 250 255
Gly Glu His Ala Thr Pro Asp Ala Val Gly Glu Leu Val Gly Ile Ala
260 265 270
Pro Pro Ala Ala Thr Arg Ser Met Gly Met Leu Glu Arg Ala Gly Leu
275 280 285
Leu Ala Gly Gly Arg Phe Arg His Glu Ala Gly Arg Leu Ala Val Leu
290 295 300
Gly Arg Met Thr Ser Tyr Gly Arg Met Glu Ile Leu Arg Arg Ala Ala
305 310 315 320
Glu Ile Leu His Arg Arg Gly Gly Pro Pro Ser Ala Val Ala Thr Arg
325 330 335
Leu Leu Glu Ala Gly Trp Ser Gly Glu Glu Trp Ala Phe Asp Val Leu
340 345 350
Val Glu Ala Gly Arg Gln Ala Phe Asp Glu Gly Asp Phe Val Ala Val
355 360 365
Met Lys Cys Leu Arg Leu Ala Leu Ala Ser Gly Trp Gly Thr Pro Arg
370 375 380
Arg Leu Asp Val Lys Val Met Leu Ala Ala Ala Glu Trp Arg Val Asp
385 390 395 400
Pro Ala Val Ala Ala Arg His Val Pro Asp Leu Leu Asp Ala Thr Arg
405 410 415
Ser Gly Ala Leu Arg Gly Ser His Gly Met Glu Leu Phe Arg Gln Leu
420 425 430
Leu Trp Tyr Gly Arg Phe Ala Asp Ala Ala Glu Leu Ile Asp Arg Leu
435 440 445
Arg Pro Ser Val Ala Asp Arg Asp Ala Asp Ala Ser Leu Ile Ala Met
450 455 460
Cys His Val His Pro Val Leu Leu Asp Arg Leu Pro Arg Ser Ala Arg
465 470 475 480
Gly Ser Met Gly Gln Thr Val Glu Asp Ala Arg Arg Ile Leu Arg Gln
485 490 495
Ala Glu Pro Thr Asp Glu Ala Met Asp Ser Ile Ile Ser Ala Leu Met
500 505 510
Ala Leu Leu Leu Gly Gly Val Ser Glu Val Ala Ala Ser Cys Glu Thr
515 520 525
Leu Leu Lys Glu Pro Gly Val Thr Lys Ala Pro Thr Trp Lys Ala Ile
530 535 540
Ile Ser Ala Ile Arg Ala Glu Thr Ala Trp Arg Lys Gly Asp Leu Ala
545 550 555 560
Gly Ala Glu Ala His Ala Gln Glu Ala Leu Thr Ile Leu Gln Pro Ser
565 570 575
Gly Trp Gly Val Ala Ile Gly Ala Pro Leu Ser Thr Leu Leu His Ala
580 585 590
Gln Thr Ala Met Gly His Leu Asp Glu Ala Lys Ala Thr Val Ala Val
595 600 605
Pro Met Pro Arg Glu Thr Ala Glu Thr Ala Phe Gly Ile Gly Tyr Glu
610 615 620
Leu Ala Arg Ala His Tyr His Leu Val Thr Glu Gln Pro Arg Ala Ala
625 630 635 640
Phe Ala Gly Phe Leu Ala Cys Gly Gln Ala Val Gln Arg Trp Gly Ser
645 650 655
Ser Leu Ser Asp Val Val Pro Trp Arg Leu Gly Ala Ala Arg Ala Cys
660 665 670
Leu Gln Leu Gly Trp Arg Arg Arg Ala Ala Asp Leu Val Thr Ala Gln
675 680 685
Ile Ala His Thr Ser Ser Gly Asp Leu Arg Thr Tyr Gly Val Ala Leu
690 695 700
Arg Leu His Ala Gln Leu Ser Lys Pro Ala Gln Arg Gln Arg Leu Leu
705 710 715 720
Met Gln Ser Val Asp Ala Leu Glu Ala Ala Gln Asp Arg Tyr Gln Leu
725 730 735
Ala Leu Ser Leu Cys Asp Leu Ala Gly Thr Pro Gln Leu Lys Gly Gly
740 745 750
Lys Asp Glu Ala Arg Ala Tyr Trp Val Arg Ala Gln Glu Leu Ala Arg
755 760 765
Glu Cys Asn Ala Lys Pro Leu Met Arg Arg Leu Ala Ala Gln His Asp
770 775 780
His Gly Glu Thr Ala Pro Leu Ser Gly Ala Glu Arg Arg Val Ala Val
785 790 795 800
Leu Ala Ala Arg Gly His Thr Asn Arg Glu Ile Ala Glu Ala Leu Tyr
805 810 815
Ile Thr Arg Ser Thr Val Glu Gln His Leu Thr Arg Ile Tyr Arg Lys
820 825 830
Leu His Val Gln Thr Arg Gly Asp Leu Gly Asn Leu Phe Ala Ala Asp
835 840 845
Ile Ala Asp Lys Ala Thr Ala Thr Ala Gly Arg Glu Pro Arg Glu Ala
850 855 860
Val Arg Leu
865
<210> 5
<211> 321
<212> PRT
<213> Nonomuria
<400> 5
Met Asp Pro Thr Gly Val Asp Ile Ala Thr Leu Pro Val Val Glu Ile
1 5 10 15
Glu Leu Ser Arg Leu Ser Ser Val Tyr Ser Pro Arg Thr Ser Gly Glu
20 25 30
Asp Pro Glu His Val Glu Thr Leu Leu Ser Ala Gln Gly Glu Leu Pro
35 40 45
Pro Ile Leu Val His Arg Pro Thr Met Arg Val Ile Asp Gly Leu His
50 55 60
Arg Leu Lys Val Ala Arg Val Arg Gly Glu Thr Thr Ile Ser Val Arg
65 70 75 80
Leu Ile Asp Gly Thr Glu Ser Asp Ala Phe Val Leu Ala Val Glu Ala
85 90 95
Asn Val Arg His Gly Leu Pro Leu Ser Leu Ala Asp Arg Lys Arg Ala
100 105 110
Ala Val Arg Ile Ile Gly Thr His Pro Gln Trp Ser Asp Arg Arg Val
115 120 125
Ala Ser Ala Thr Gly Ile Ser Ala Gly Thr Val Ala Asp Leu Arg Arg
130 135 140
Arg Arg Gly Gln Gly Gly Asp Glu Ala Arg Ile Gly Arg Asp Gly Arg
145 150 155 160
Ile Arg Pro Val Asp Ser Ser Glu Gly Arg Arg Leu Ala Ala Glu Leu
165 170 175
Ile Arg Ser His Pro Asp Leu Ser Leu Arg Gln Val Ala Lys Gln Val
180 185 190
Gly Ile Ser Pro Glu Thr Val Arg Asp Val Arg Gly Arg Leu Glu His
195 200 205
Gly Glu Ser Pro Ile Pro Asp Gly Ser Arg Arg Leu Arg Thr Lys Pro
210 215 220
Glu Leu Leu Arg Arg Ala Glu Gln Asp Phe Gly His Val Asp Gly Arg
225 230 235 240
Asp Arg Gln Ala Val Leu Glu Arg Leu Lys Ala Asp Pro Ala Leu Arg
245 250 255
Leu Thr Glu Thr Gly Arg Ile Leu Leu Arg Met Leu Ser Leu His Ser
260 265 270
Ile Asp Gly Gln Glu Trp Glu Arg Ile Leu Arg Gly Val Pro Pro His
275 280 285
Trp Gly Thr Val Val Ala Arg Cys Ala Arg Asp His Ala Gln Ile Trp
290 295 300
Ala Ala Phe Ala Asp Arg Leu Glu Gly Arg Ala Thr Asp Leu Ala Ala
305 310 315 320
Gly
<210> 6
<211> 369
<212> PRT
<213> Nonomuria
<400> 6
Met Thr Leu Glu Arg Thr Leu Ile Val Gly Thr Gly Leu Ile Gly Thr
1 5 10 15
Ser Ala Ala Leu Ala Leu Arg Glu Lys Gly Val Ala Val Tyr Leu Ser
20 25 30
Asp Val Asp Ala His Ala Val Arg Leu Ala Arg Ala Leu Gly Ala Gly
35 40 45
Gln Glu Trp Thr Gly Gln Arg Val Asp Leu Ala Leu Ile Ala Val Pro
50 55 60
Pro Pro Ser Val Gly Gln Arg Leu Ala Asp Leu Gln Gln Arg Arg Ala
65 70 75 80
Ala Arg Ala Tyr Thr Asp Val Thr Ser Val Lys Val Asp Pro Ile Ala
85 90 95
Asp Ala Glu Arg Leu Gly Cys Asp Leu Thr Ser Tyr Val Pro Gly His
100 105 110
Pro Leu Ala Gly Arg Glu Arg Ser Gly Pro Ala Ala Ala Arg Ala Asp
115 120 125
Leu Phe Leu Gly Arg Pro Trp Ala Leu Cys Pro Arg Pro Glu Thr Gly
130 135 140
Ala Asp Ala Val Arg Leu Ala Arg Glu Leu Val Ser Met Cys Gly Ala
145 150 155 160
Glu Pro Tyr Thr Val Ser Ala Gly Glu His Asp Thr Ala Val Ala Leu
165 170 175
Val Ser His Ala Pro His Val Ala Ala Ser Ala Val Ala Ala Arg Leu
180 185 190
Arg Asp Gly Asp Asp Val Ala Leu Ala Leu Ala Gly Gln Gly Leu Arg
195 200 205
Asp Val Thr Arg Ile Ala Ala Gly Asp Pro Leu Leu Trp Arg Met Ile
210 215 220
Leu Ala Ala Asn Ala Leu Pro Val Ala Gly Val Leu Glu Arg Ile Ala
225 230 235 240
Ala Asp Leu Ala Ala Ala Ala Ser Ala Leu Arg Ser Gly Asp Leu Asp
245 250 255
Asp Val Thr Asp Leu Leu Arg Arg Gly Val Asp Gly His Gly Arg Ile
260 265 270
Pro Asp Lys His Gly Gly Pro Ala Arg Asp Tyr Thr Val Ile Gln Val
275 280 285
Val Leu Gln Asp Arg Pro Gly Glu Leu Ala Arg Leu Phe Asn Ala Ala
290 295 300
Gly Leu Ala Asp Val Asn Ile Glu Asp Ile Arg Leu Glu His Ser Ala
305 310 315 320
Gly Leu Pro Val Gly Val Val Glu Val Ser Val Arg Pro Glu Asp Thr
325 330 335
Gly Arg Leu Thr Glu Ala Leu Arg Phe His Gly Trp His Val Pro Pro
340 345 350
Val Pro Asp Gly Asn Ser Arg Ile Asp Arg Thr Arg Ala Met Val Ser
355 360 365
Asp
<210> 7
<211> 217
<212> PRT
<213> Nonomuria
<400> 7
Met Arg Val Leu Val Val Glu Asp Gln Val Asp Leu Ala Asp Ser Val
1 5 10 15
Ala Arg Val Leu Arg Arg Glu Gly Met Ala Val Asp Val Ser His Asp
20 25 30
Gly Asp Asp Ala Gln Glu Arg Leu Ser Val Ile Asp Tyr Asp Val Val
35 40 45
Val Leu Asp Arg Asp Ile Pro Gly Val His Gly Asp Glu Leu Cys Ala
50 55 60
Glu Ile Ala Val Asp Asp Arg Arg Thr Arg Val Leu Met Leu Thr Ala
65 70 75 80
Ser Gly Thr Thr Ala Asp Arg Val Ala Gly Leu Ser Leu Gly Ala Asp
85 90 95
Asp Tyr Leu Pro Lys Pro Phe Ala Phe Ala Glu Leu Val Ala Arg Ile
100 105 110
Arg Ala Leu Gly Arg Arg Ala His Pro Pro Ala Pro Pro Ile Leu Val
115 120 125
His Gly Asp Leu Arg Leu Asp Pro Ala Gln Arg Val Ala Ile Arg Gly
130 135 140
Gly Met Arg Leu Pro Leu Thr Thr Lys Glu Leu Ala Val Leu Glu His
145 150 155 160
Leu Leu Thr Ala Arg Gly Arg Val Val Ser Ala Glu Glu Leu Leu Glu
165 170 175
Arg Val Trp Asp Glu Gln Ala Asp Pro Phe Thr Thr Thr Val Lys Ala
180 185 190
Thr Ile Asn Arg Leu Arg Ser Lys Leu Gly Gln Pro Pro Val Ile Glu
195 200 205
Thr Val Pro Arg Glu Gly Tyr Arg Ile
210 215
<210> 8
<211> 196
<212> PRT
<213> Nonomuria
<400> 8
Met Arg Arg Ser Glu Gly Asp Asp Glu Pro Arg Thr Leu Pro Pro Arg
1 5 10 15
Ala Arg Asp Arg Val Tyr Thr Ala Val Thr Arg Val Leu Ala Val Leu
20 25 30
Leu Leu Pro Val Ala Phe Val Arg Gln Pro Gly Arg Ala Arg Glu Leu
35 40 45
Ala Cys Gly Trp Ala Leu Arg Met Arg Phe Pro Ala Glu Asp Leu Thr
50 55 60
Gly Leu Thr Asp Gly Ala Arg Ala Ala Phe Thr Ala Ala Arg Ala Glu
65 70 75 80
Ala Leu Trp Arg His Gly Gln Leu Val Gly Leu Thr Ser Gly Tyr Arg
85 90 95
Asp Pro Arg Val Gln Gln Arg Met Phe Glu Glu Glu Val Arg Arg Ser
100 105 110
Gly Ser Val Ala Ala Ala Arg Met Phe Val Ala Pro Pro Ala Glu Ser
115 120 125
Asn His Val Lys Gly Met Ala Leu Asp Val Arg Pro His Glu Gly Ala
130 135 140
Arg Trp Leu Glu Ala His Gly Ala Arg Tyr Asp Leu Tyr Arg Ile Tyr
145 150 155 160
Asp Asn Glu Trp Trp His Phe Glu His Arg Pro Glu Cys Gly Gly Thr
165 170 175
Pro Pro Arg Arg Leu Pro His Pro Gly Ala Ala Trp Ala Ser Arg Asn
180 185 190
Gly Gly Arg Val
195
<210> 9
<211> 319
<212> PRT
<213> Nonomuria
<400> 9
Met Asp Ala Glu Ser Val Arg Arg Gln Leu Arg Leu Gly Glu Asn Ala
1 5 10 15
Thr Ala Trp Leu Ser Arg Leu Glu Glu Leu Gly Pro Pro Pro Glu Pro
20 25 30
Val Arg Leu Pro Gln Gly Asp Glu Ala Arg Asp Leu Leu His Arg Leu
35 40 45
Glu Val Pro Ala Pro Asp Val Glu Glu Ile Val Ala Ala Thr Pro Gly
50 55 60
Pro Asp Arg Asp Pro Ala Leu Trp Trp Leu Leu Glu Arg Ala His His
65 70 75 80
Glu Leu Val Arg His Met Gly Asp Tyr Lys Val Lys Val Arg Gly Gly
85 90 95
Pro Thr Leu Pro Tyr Glu Thr Gly Ala Ala Ala Arg Tyr Phe His Val
100 105 110
Tyr Val Phe Leu Ala Thr Leu Pro Ala Leu Arg Arg Phe His Ala Thr
115 120 125
Arg Asp Ile Pro Glu Ala Thr Thr Trp Glu Thr Leu Thr Gln Leu Gly
130 135 140
Glu Ser Val Ala Ile His Arg Arg Lys Tyr Gly Glu Gly Gly Thr Asn
145 150 155 160
Met Pro Trp Trp Leu Thr Leu Leu Val Arg Gly Leu Val Tyr Arg Leu
165 170 175
Gly Arg Leu Gln Tyr Asn Leu Ala Val Ala Lys Asp Gly Thr Pro Val
180 185 190
Leu Gly Leu His Ile Pro Glu Val Gly Gly Pro Leu Ile Pro Asp Ile
195 200 205
Tyr Tyr Asp Ser Leu Arg Arg Ala Arg Pro Phe Phe Glu Arg His Phe
210 215 220
Pro Glu His Gly Ala Arg Ala Ala Thr Gly Thr Ser Trp Leu Leu Asp
225 230 235 240
Pro Gln Leu Ala Glu Tyr Leu Ala Glu Asp Ser His Ile Leu Gln Leu
245 250 255
Arg Arg Gly Trp Thr Leu Leu Asp Ser Glu Pro Gln Asp Gly Asp Asp
260 265 270
Ala Ile Leu Glu Phe Val Phe Arg Tyr Asn Gly Gln Pro Leu Glu Glu
275 280 285
Leu Pro Gln Arg Ser Thr Leu Glu Lys Ala Val Val Thr His Leu Leu
290 295 300
Ala Gly Arg His Trp Tyr Gln Arg Ser Gly Arg Ile Glu Leu Pro
305 310 315
<210> 10
<211> 408
<212> PRT
<213> Nonomuria
<400> 10
Met Arg Val Leu Leu Ser Thr Ser Gly Ser Arg Gly Asp Val Glu Pro
1 5 10 15
Leu Leu Gly Leu Ala Val Gln Leu Arg Glu Leu Gly Ala Glu Thr Arg
20 25 30
Met Cys Ala Pro Pro Asp Cys Ala Glu Arg Leu Ala Glu Ala Gly Val
35 40 45
Pro Leu Val Pro Val Gly Thr Ser Met Arg Ala Lys Leu His Gly Lys
50 55 60
Arg Pro Pro Ser Leu Glu Asp Val Pro Arg Leu Asp Ala Glu Ala Ile
65 70 75 80
Ala Thr Gln Leu Asp Gln Val Leu Pro Ala Ala Glu Gly Cys Glu Val
85 90 95
Met Val Val Ser Gly Val Leu Ser Ala Ala Val Ala Val Arg Ser Val
100 105 110
Ala Glu Lys Leu Gly Ile Pro Tyr Val Tyr Val Phe Tyr Cys Pro Ile
115 120 125
Tyr Val Pro Ser Pro Tyr Tyr Pro Pro Pro Pro Pro Leu Gly Glu Gln
130 135 140
Pro Ala Arg Asp Val Thr Asp Asn Arg Val Leu Trp Asp Arg Asn Asn
145 150 155 160
Gln Gly Ala Tyr Gln Arg Phe Gly Ala Ala Leu Asn Ser Arg Arg Ala
165 170 175
Ser Ile Gly Leu Pro Pro Val Asp Asp Ile Phe Ser Tyr Gly Tyr Thr
180 185 190
Asp Arg Pro Phe Leu Ala Ala Asp Pro Val Leu Ala Pro Leu Gln Arg
195 200 205
Thr Asp Leu Asp Val Val Gln Thr Gly Ala Trp Ile Met Pro Asp Glu
210 215 220
Arg Pro Leu Pro Ala Glu Val Glu Ala Phe Leu Glu Ala Gly Pro Pro
225 230 235 240
Pro Val His Val Glu Phe Gly Ser Gly Pro Ala Pro Thr Asp Ala Ala
245 250 255
Arg Val Ala Ile Glu Ala Ile Arg Ala His Gly His Arg Val Ile Val
260 265 270
Ser Arg Gly Trp Ala Gly Leu Ala Pro Pro Asp Asp Arg Ser Asp Cys
275 280 285
Leu Thr Val Gly Glu Val Asn His Gln Val Leu Phe Gly Arg Val Ala
290 295 300
Ala Val Val His Ala Gly Ser Ala Gly Ile Thr Thr Ala Val Thr Arg
305 310 315 320
Ala Gly Ala Pro Gln Val Val Val Pro Gln Met Thr Asp Gln Pro Tyr
325 330 335
His Ala Gly Arg Val Ala Glu Leu Gly Ile Gly Val Ala His Asp Gly
340 345 350
Arg Val Pro Thr Val Glu Ser Leu Ser Ala Ala Leu Thr Thr Ala Leu
355 360 365
Ala Pro Glu Thr Arg Ala Arg Ala Ile Asp Val Ala Gly Lys Ile Arg
370 375 380
Ala Asp Gly Ala Ala Val Ala Ala Lys Leu Leu Leu Asp Thr Ala Ala
385 390 395 400
Gly Ala Gly Arg Asn Arg Thr Glu
405
<210> 11
<211> 489
<212> PRT
<213> Nonomuria
<400> 11
Met Glu Glu Phe Asp Val Val Val Ala Gly Gly Gly Pro Gly Gly Ser
1 5 10 15
Thr Val Ala Thr Leu Val Ala Met Gln Gly His Arg Val Leu Leu Val
20 25 30
Glu Lys Glu Val Phe Pro Arg Tyr Gln Ile Gly Glu Ser Leu Leu Pro
35 40 45
Ser Thr Val His Gly Val Cys Arg Met Leu Gly Val Thr Asp Glu Leu
50 55 60
Ala Ala Ala Gly Phe Pro Val Lys Arg Gly Gly Thr Phe Arg Trp Gly
65 70 75 80
Ala Arg Pro Glu Pro Trp Thr Phe Ser Phe Ser Val Ser Pro Arg Ile
85 90 95
Thr Gly Pro Thr Thr Phe Ala Tyr Gln Val Glu Arg Ala Arg Phe Asp
100 105 110
Glu Ile Leu Leu Gly Asn Ala Arg Arg Lys Gly Val Val Val Arg Glu
115 120 125
Gly Cys Ser Val Thr Glu Val Ile Glu Asp Gly Asp Arg Val Thr Gly
130 135 140
Leu Arg Tyr Val Asp Pro Asp Gly Gly Glu His Ala Val Ser Ala Arg
145 150 155 160
Phe Val Ile Asp Ala Ser Gly Asn Lys Ser Arg Leu Tyr Ser Ser Val
165 170 175
Gly Gly Thr Arg Asn Tyr Ser Glu Phe Phe Arg Ser Leu Ala Leu Phe
180 185 190
Gly Tyr Phe Glu Gly Gly Lys Arg Leu Ala Glu Pro Tyr Ser Gly Asn
195 200 205
Ile Leu Ser Val Ala Phe Asp Ser Gly Trp Phe Trp Tyr Ile Pro Leu
210 215 220
Ser Asp Thr Leu Thr Ser Val Gly Ala Val Val Arg Arg Glu Met Ala
225 230 235 240
Glu Lys Ile Gln Gly Asp Arg Glu Lys Ala Leu Ala Ala Leu Ile Ala
245 250 255
Glu Cys Pro Leu Ile Ser Glu Tyr Leu Ala Pro Ala Arg Arg Val Thr
260 265 270
Thr Gly Lys Tyr Gly Gln Leu Arg Val Arg Lys Asp Tyr Ser Tyr His
275 280 285
Gln Thr Lys Phe Trp Arg Pro Gly Met Ile Leu Val Gly Asp Ala Ala
290 295 300
Cys Phe Val Asp Pro Val Phe Ser Ser Gly Val His Leu Ala Thr Tyr
305 310 315 320
Ser Gly Leu Leu Ala Ala Arg Ser Ile Asn Ser Val Leu Ala Gly Asp
325 330 335
Val Glu Glu Lys Ile Ala Leu His Glu Phe Glu Ala Arg Tyr Arg Arg
340 345 350
Glu Tyr Ser Val Tyr Tyr Glu Phe Leu Leu Ala Phe Tyr Glu Met Asn
355 360 365
Val Asn Glu Glu Ser Tyr Phe Trp His Ala Lys Lys Val Thr Asn Asn
370 375 380
Lys Glu Tyr Thr Glu Leu Glu Ser Phe Val Asp Leu Val Gly Gly Leu
385 390 395 400
Ser Ser Gly Glu Thr Ala Leu Ala Thr Ser Gly Arg Ile Ala Glu Arg
405 410 415
Ser Ala Glu Phe Ala Ala Ala Val Asp Gln Met Ala Asp Gly Asp Asp
420 425 430
Ser Ser Met Val Pro Leu Phe Lys Ser Gln Val Val Lys Gln Val Met
435 440 445
Gln Glu Gly Gly Gln Glu Gln Met Arg Ala Val Leu Gly Ala Asp Ala
450 455 460
Glu Pro Glu Gln Pro Leu Phe Pro Gly Gly Leu Val Thr Ser Pro Asp
465 470 475 480
Gly Met Arg Trp Leu Thr His His Pro
485
<210> 12
<211> 420
<212> PRT
<213> Nonomuria
<400> 12
Met Arg Ile Asp Ser Glu Trp Ser Phe Asp Pro Gly Met Asp Asp Asp
1 5 10 15
Ile Asp Ala Gly Ala Pro Val Leu Gln Pro Thr Ala Asn Tyr Met Met
20 25 30
Arg Thr His Cys Asp Pro His Glu Asp Met Phe Ala Leu Arg Ala His
35 40 45
Gly Pro Leu Val Arg Ile Gly Gly Asp Ala Ala Thr Gln Leu Arg Val
50 55 60
Asp Tyr Val Trp Gln Ala Leu Gly Tyr Asp Val Val Arg Arg Ile Leu
65 70 75 80
Gly Asp His Glu Asn Phe Thr Thr Arg Pro Arg Trp Ser Ser Ala Pro
85 90 95
Ser Ile Ala Gly Glu Pro Ile Pro Pro Asn Leu Val Gly Gln Leu Ser
100 105 110
Val Tyr Asp Pro Pro Glu His Thr Arg Leu Arg Gly Met Leu Thr Pro
115 120 125
Glu Phe Thr Ala Arg Arg Ile Arg Arg Leu Glu Pro Ala Met Gln Asp
130 135 140
Leu Ile Asp Asp Arg Ile Asp Glu Leu Glu Ala Ala Gly Pro Pro Ala
145 150 155 160
Asp Val Gln Ala Leu Phe Ala Asp Pro Val Gly Gly Gly Val Leu Cys
165 170 175
Glu Leu Leu Gly Ile Pro Arg Asp Asp Arg Ile Glu Phe Ile Arg Arg
180 185 190
Val Arg Gln Asn Val Asp Leu Ser Arg Gly Phe Lys Ala Arg Ala Ala
195 200 205
Asp Ser Ala Ala Phe Asn Arg Tyr Leu Asn Gly Leu Ile Ile Arg Gln
210 215 220
Arg Lys Asp Pro Asp Glu Gly Phe Ile Gly Met Leu Val Arg Glu His
225 230 235 240
Gly Asp Asp Val Thr Asp Glu Glu Leu Lys Gly Val Leu Thr Ala Leu
245 250 255
Ile Leu Gly Gly Val Glu Thr Val Ala Gly Ser Ile Gly Phe Gly Val
260 265 270
Leu Ala Leu Leu Asp His Pro Asp Gln Arg Gln Ser Leu Phe Ala Gly
275 280 285
Arg Glu Glu Ala Asp Arg Val Val Gly Glu Leu Leu Arg Phe Leu Ser
290 295 300
Pro Val Gln Gln Pro Asn Pro Arg Leu Ala Val Arg Asp Val Val Val
305 310 315 320
Asp Gly Gln Leu Ile Lys Ala Gly Asp Tyr Val Leu Cys Ser Ile Leu
325 330 335
Met Ala Asn Arg Asp Glu Ala Leu Thr Pro Asn Ala Asn Val Leu Asp
340 345 350
Val Arg Arg Asp Cys Gly Ser His Val Gly Phe Gly His Gly Ile His
355 360 365
Tyr Cys Ile Gly Ala Ala Ile Ala Arg Thr Leu Leu Arg Met Ala Tyr
370 375 380
Gln Ser Leu Trp Arg Arg Phe Pro Gly Leu Arg Leu Ala Val Ser Ala
385 390 395 400
Glu Glu Val Lys Phe Arg Asn Ala Phe Ile Asp Cys Pro Asp Glu Leu
405 410 415
Pro Val Thr Trp
420
<210> 13
<211> 398
<212> PRT
<213> Nonomuria
<400> 13
Met Ser Gly Asp Gly Ala Arg Pro Leu His Thr Arg Arg Gln Asp Leu
1 5 10 15
Asp Pro Ala Asp Glu Leu Arg Ala Ala Gly Thr Leu Thr Arg Ile Thr
20 25 30
Ile Gly Ser Gly Ala Asp Ala Glu Thr Thr Trp Leu Ala Thr Gly Tyr
35 40 45
Thr Val Val Arg Gln Val Leu Gly Asp His Arg Arg Phe Ser Thr Arg
50 55 60
Arg Arg Trp Asn Glu Arg Asp Glu Ile Gly Gly Arg Gly Asn Phe Arg
65 70 75 80
Pro Arg Glu Leu Val Gly Asn Leu Met Asp Tyr Asp Pro Pro Glu His
85 90 95
Thr Arg Leu Arg Gln Lys Leu Thr Pro Gly Phe Thr Leu Arg Arg Ile
100 105 110
Arg Arg Leu Lys Pro Tyr Ile Glu Gln Ile Val Thr Glu Arg Leu Asp
115 120 125
Ala Leu Glu Arg Ala Gly Pro Pro Ala Asp Leu Val Glu Leu Val Ala
130 135 140
Asp Glu Val Pro Gly Ala Val Leu Cys Glu Leu Ile Gly Val Pro Arg
145 150 155 160
Asp Asp Arg Ala Met Phe Met Gln Leu Cys His Gly His Leu Asp Ala
165 170 175
Ser Arg Ser Gln Lys Arg Arg Ala Ala Ala Gly Ala Ala Phe Ser Arg
180 185 190
Tyr Leu Leu Ala Met Ile Ala Arg Glu Arg Lys Asp Pro Gly Glu Gly
195 200 205
Leu Leu Gly Ala Val Leu Ala Glu Tyr Gly Asp Thr Ala Thr Asp Glu
210 215 220
Glu Leu Arg Gly Phe Cys Val Gln Val Met Leu Ala Gly Asp Asp Asn
225 230 235 240
Ile Ser Gly Met Ile Gly Leu Gly Val Leu Ala Leu Leu Arg His Pro
245 250 255
Glu Gln Ile Ala Ala Leu Gln Gly Asp Asp Gln Ser Ala Asp Arg Ala
260 265 270
Val Asp Glu Leu Ile Arg Tyr Leu Thr Val Pro Tyr Ala Pro Thr Pro
275 280 285
Arg Val Ala Met Glu Asp Val Thr Ile Gly Gly Gln Val Ile Lys Glu
290 295 300
Gly Glu Thr Val Ser Cys Ser Leu Pro Met Ala Asn Arg Asp Pro Ala
305 310 315 320
Leu Leu Pro Asp Ala Gly Arg Leu Asp Val Arg Arg Glu Pro Val Pro
325 330 335
His Val Ala Phe Gly His Gly Val His His Cys Leu Gly Ala Ala Leu
340 345 350
Ala Arg Leu Glu Leu Arg Thr Val Tyr Thr Ala Leu Trp Arg Arg Phe
355 360 365
Pro Thr Leu Arg Leu Ala Asp Pro Asp Arg Glu Pro Ser Phe Arg Leu
370 375 380
Thr Thr Pro Ala Tyr Gly Leu Thr Ser Leu Met Val Ala Trp
385 390 395
<210> 14
<211> 384
<212> PRT
<213> Nonomuria
<400> 14
Met Val Val Pro Leu Pro His Gln Arg Leu Arg Leu Asp Pro Val Pro
1 5 10 15
Ala Leu Phe Asp Leu Gln Glu Asp Gly Pro Leu His Glu Tyr Asp Thr
20 25 30
Glu Pro Gly Leu Asp Gly His Lys Gln Trp Leu Val Thr Gly Tyr Gly
35 40 45
Glu Ile Arg Glu Ile Leu Ala Asp Ala Asn Arg Phe Ser Ser Met Arg
50 55 60
Pro Val Glu Asp Glu Ala Glu Arg Ala Trp Leu Pro Gly Ile Leu Gln
65 70 75 80
Ser Tyr Asp Ala Pro Asp His Thr Arg Leu Arg Arg Thr Val Thr Arg
85 90 95
Ala Asn Thr Ala Arg Arg Ile Glu Ser Leu Arg Pro Val Val Glu Glu
100 105 110
Thr Val Glu Asp Cys Leu Ala Asp Leu Glu Ser Met Gly Ser Pro Val
115 120 125
Asp Phe Val Arg Asn Ala Ala Trp Pro Ile Pro Ala Leu Ile Ala Cys
130 135 140
Asp Phe Leu Gly Val Pro Arg Asp Asp Gln Ala Glu Leu Ser Arg Met
145 150 155 160
Phe Arg Asp Ser Arg Glu Ser Arg Val Pro Arg Gln Arg Asn Val Ser
165 170 175
Gly Leu Gly Ile Val Asp Tyr Ala Arg Lys Leu Ala Ala Arg Glu Arg
180 185 190
Leu Asp Pro Gly Thr Gly Met Ile Gly Gly Ile Val Arg Glu His Gly
195 200 205
Gly Glu Val Thr Asp Glu Glu Leu Ala Gly Leu Val Glu Gly Ile Met
210 215 220
Ile Gly Ala Val Glu Gln Met Ala Ser Gln Leu Ala Ile Ala Val Leu
225 230 235 240
Leu Leu Val Thr His Pro Asp Gln Met Ala Leu Leu Arg Glu Arg Pro
245 250 255
Glu Leu Ala Asp Ser Ala Ala Glu Glu Val Phe Arg Tyr Ala Ser Ile
260 265 270
Val Glu Thr Pro Ser Pro Arg Thr Ala Leu Val Asp Thr Arg Leu Ala
275 280 285
Gly Arg Asp Ile His Ala Gly Asp Val Leu Thr Cys Ser Ile Leu Ala
290 295 300
Gly Asn Arg Ala Arg Glu Asp Arg Phe Asp Leu Thr Arg Gly Asn Pro
305 310 315 320
Glu His Leu Ala Phe Gly His Gly Val His Phe Cys Leu Gly Ala Pro
325 330 335
Leu Ala Arg Leu Gln Ala Gln Val Ala Leu Pro Ala Leu Val Arg Arg
340 345 350
Phe Pro Ser Leu Arg Leu Ala Val Pro Ala Glu Asp Leu Arg Phe Lys
355 360 365
Pro Gly Lys Pro Ala Pro Phe Ala Val Glu Glu Leu Pro Val Glu Trp
370 375 380
<210> 15
<211> 393
<212> PRT
<213> Nonomuria
<400> 15
Met Glu Val Phe Glu Glu Leu Asn Val Val Leu Pro Gly Glu Leu His
1 5 10 15
Trp Arg Asp Arg Phe Asp Pro Val Pro Gln Leu Arg Ser Phe Met Ala
20 25 30
Glu Gly Pro Met Thr Glu Leu Gly Ala Glu Glu Gly Pro Gly Gly Arg
35 40 45
Thr Ala Trp Leu Ala Thr Gly Phe Asp Glu Val Arg Gln Val Leu Gly
50 55 60
Ser Asp Lys Phe Ser Ser Arg Leu Leu Tyr Gly Gly Thr Ala Ala Gly
65 70 75 80
Ile Val Phe Pro Gly Phe Ile Thr Gln Tyr Asp Pro Pro Glu His Thr
85 90 95
Arg Leu Arg Arg Val Val Ser Pro Ala Phe Thr Val Arg Arg Met Glu
100 105 110
Arg Phe Arg Pro Gln Val Asp Gln Val Val Glu Asp Cys Leu Asp Ala
115 120 125
Ile Glu Ser Ile Gly Gly Pro Leu Asp Phe Val Pro His Phe Gly Trp
130 135 140
Ser Ile Ala Thr Thr Ala Thr Cys Asp Phe Leu Gly Ile Pro Arg Asp
145 150 155 160
Asp Gln Ala Glu Leu Ser Arg Ser Leu His Ala Ser Arg Ser Gln Arg
165 170 175
Ala Ala Ser Arg Arg Gly Ala Ala Gly Asn Lys Phe Met Thr Tyr Met
180 185 190
Gly Gln Val Val Ala Arg Thr Arg Arg Asp Pro Gly Asp Asp Met Leu
195 200 205
Ser Val Val Val Arg Glu His Gly Asp Glu Ile Thr Asp Ala Glu Leu
210 215 220
Thr Gly Leu Ala Ala Phe Val Met Gly Ala Gly Gly Asp Gln Val Ala
225 230 235 240
Arg Phe Leu Ala Ala Gly Ala Trp Leu Met Ala Glu Val Pro Glu Gln
245 250 255
Phe Ala Leu Leu Arg Asp Lys Pro Asp Val Val Pro Asp Trp Leu Glu
260 265 270
Glu Met Val Arg Tyr Leu Thr Ile Asp Glu Lys Leu Thr Pro Arg Ile
275 280 285
Ala Leu Glu Asp Val Arg Ile Gly Asp Arg Ile Val Lys Ala Gly Asp
290 295 300
Thr Val Thr Cys Ser Leu Leu Gly Ala Asn Arg Arg His Phe Pro Gly
305 310 315 320
Pro Asp Asp Gln Phe Asp Leu Thr Arg Asp Arg Ala Pro Asn Val Ala
325 330 335
Phe Gly His Gly Ile His His Cys Leu Gly Arg Pro Leu Ala Glu Leu
340 345 350
Ile Phe Arg Ser Ala Ile Pro Ala Leu Ala Arg Arg Phe Pro Ala Leu
355 360 365
Arg Leu Ala Glu Pro Glu Gln Glu Ile Arg Leu Gly Pro Pro Pro Phe
370 375 380
Asp Val Lys Ala Leu Leu Leu Asp Trp
385 390
<210> 16
<211> 69
<212> PRT
<213> Nonomuria
<400> 16
Met Thr Asn Pro Phe Glu Asn Glu Asp Gly Ser Phe Leu Val Leu Val
1 5 10 15
Asn Asp Glu Gly Gln His Ser Leu Trp Pro Ser Phe Ala Glu Val Pro
20 25 30
Pro Gly Trp Thr Arg Val His Gly Val Ala Thr Arg Gln Glu Cys Leu
35 40 45
Ala Tyr Val Glu Glu Asn Trp Thr Asp Ile Arg Pro Lys Ser Leu Ile
50 55 60
Ala Glu Ala Gly Ala
65
<210> 17
<211> 1863
<212> PRT
<213> Nonomuria
<400> 17
Met Thr Ile Asp Asp Thr Arg Ala Lys Pro Arg Ser Ser Val Glu Asp
1 5 10 15
Val Trp Pro Leu Ser Pro Leu Gln Glu Gly Met Leu Tyr His Thr Ala
20 25 30
Leu Asp Asp Asp Gly Pro Asp Thr Tyr Thr Val Gln Thr Val Tyr Gly
35 40 45
Ile Asp Gly Pro Leu Asp Ala Gly Arg Leu Arg Ala Ser Trp Gln Ala
50 55 60
Leu Val Asp Arg His Ala Ala Leu Arg Ala Tyr Phe Arg Tyr Val Ser
65 70 75 80
Gly Ala Gln Met Val Gln Val Ile Ala Arg Glu Ala Glu Ile Pro Trp
85 90 95
Arg Glu Thr Asp Leu His Gly Leu Pro Asp Asp Leu Leu Asp Ser Glu
100 105 110
Val Asp Arg Leu Ala Ala Asp Glu Leu Ala Glu Arg Leu Pro Leu Asp
115 120 125
Ala Ala Pro Leu Met Lys Leu His Leu Ile Arg Leu Gly Pro Ala Ser
130 135 140
His Arg Leu Val His Thr Leu His His Val Leu Leu Asp Gly Trp Ser
145 150 155 160
Met Pro Ile Leu His Arg Glu Leu Ala Ala Ile Tyr Ala Ala Gly Gly
165 170 175
Asp Ala Ser Gly Leu Pro Ala Ala Val Ser Tyr Arg Asp Tyr Leu Ala
180 185 190
Trp Leu Gly Arg Gln Asp Lys Glu Ala Ala Arg Ala Ala Trp Arg Gln
195 200 205
Glu Leu Ala Gly Leu Asp Thr Pro Thr Leu Val Ala Pro Ala Asp Pro
210 215 220
Ala Arg Val Pro Asp Met Gly Thr Ala Val Ile Glu Leu Ser Ala Glu
225 230 235 240
Leu Thr Asp Gly Leu Ala Arg Leu Ala Arg Gly His Gly Leu Thr Leu
245 250 255
Asn Thr Val Val Gln Gly Ala Trp Ala Met Val Leu Ala Gln Leu Ala
260 265 270
Gly Arg Thr Asp Val Val Phe Gly Ala Thr Ala Ser Gly Arg Pro Ala
275 280 285
Glu Leu Ala Gly Val Glu Ser Met Val Gly Gln Leu Leu Gly Thr Leu
290 295 300
Pro Val Arg Val Arg Leu Glu Gly Gly Arg Arg Val Val Glu Leu Leu
305 310 315 320
Ala Glu Leu Gln Arg Ser Gln Ser Ala Leu Met Ala His Gln His Leu
325 330 335
Gly Leu Gln Glu Met Gln Ala Ala Val Gly Pro Gly Ala Val Phe Asp
340 345 350
Thr Leu Val Ile Tyr Glu Asn Phe Pro Arg Gln Gly Leu Gly Arg Ala
355 360 365
Glu Glu Asp Gly Gly Leu Asp Leu Arg Pro Val Arg Arg Gly Arg Asn
370 375 380
Ser Ser His Tyr Pro Phe Thr Leu Ile Thr Gly Pro Gly Ala Gln Met
385 390 395 400
Pro Leu Ile Leu Asp Tyr Asp Arg Gly Leu Phe Asp Glu Ala Ala Ala
405 410 415
Glu Ser Val Val Gly Ala Leu Ala Arg Val Leu Glu Arg Leu Val Ala
420 425 430
Glu Pro Asp Val Leu Val Gly Arg Leu Thr Leu Leu Ser Glu Ala Glu
435 440 445
Arg Ala Leu Val Val Glu Asp Trp Asn Ala Thr Ala Gly Pro Thr Pro
450 455 460
Gly Gln Ser Val Leu Asp Leu Phe Gly Arg Arg Val Ala Thr Ala Pro
465 470 475 480
Asp Ala Val Ala Ile Thr Asp Ala Gly Gly Ala Asp Leu Thr Tyr Ala
485 490 495
Glu Val Asp Gln Ala Ala Asn Arg Leu Ala Arg His Leu Ala Ala Arg
500 505 510
Gly Ile Gly Arg Gly Asp Arg Val Gly Val Val Met Asp Arg Ser Pro
515 520 525
Asp Leu Leu Ile Ala Phe Leu Ala Ser Trp Lys Ala Gly Ala Ala Tyr
530 535 540
Val Pro Val Asp Val Glu His Pro Ala Glu Arg Ile Glu Phe Val Leu
545 550 555 560
Ala Asp Ser Gly Val Ser Ala Val Leu Cys Thr Arg Ala Thr Arg Glu
565 570 575
Val Ala Pro Ala Asp Ala Ile Val Ile Asp Ala Pro Glu Thr Arg Ala
580 585 590
Ala Ile Asp Ala Gly Ala Ala Thr Ala Pro Gln Ile Arg Leu Ser Ala
595 600 605
Asp Asp Leu Ala Tyr Val Met Tyr Thr Ser Gly Ser Thr Gly Leu Pro
610 615 620
Lys Gly Val Gly Val Pro His Gly Ala Val Ala Gly Leu Ala Gly Asp
625 630 635 640
Glu Gly Trp Arg Ile Gly Pro Gly Asp Ala Val Leu Met His Ala Thr
645 650 655
His Val Phe Asp Pro Ser Leu Tyr Ala Met Trp Val Pro Leu Ala Met
660 665 670
Gly Gly Arg Val Val Leu Thr Glu Pro Gly Val Leu Asp Ala Leu Gly
675 680 685
Met Arg Gln Ala Val Glu Arg Gly Val Thr Phe Val His Leu Thr Ala
690 695 700
Gly Thr Phe Arg Ala Leu Ala Glu Ser Ser Pro Glu Cys Phe Ala Gly
705 710 715 720
Leu Val Glu Val Gly Thr Gly Gly Asp Val Val Pro Ala Gln Ser Val
725 730 735
Glu His Leu Arg Arg Ala Val Pro Gly Leu Arg Val Arg Asn Thr Tyr
740 745 750
Gly Pro Thr Glu Thr Thr Leu Cys Ala Thr Trp Lys Pro Ile Glu Pro
755 760 765
Gly Glu Glu Val Gly Arg Glu Leu Pro Ile Gly Arg Pro Met Thr Asn
770 775 780
Arg Arg Ile Tyr Ile Leu Asp Ala Phe Leu Arg Pro Val Ala Pro Gly
785 790 795 800
Val Ala Gly Glu Leu Tyr Ile Ala Gly Thr Gly Leu Ala Arg Gly Tyr
805 810 815
Leu Gly Gly Pro Gly Leu Thr Ala Glu Arg Phe Val Ala Val Pro Ala
820 825 830
Ser Val Asp Pro Ser Pro Gly Glu Arg Met Tyr Arg Thr Gly Asp Leu
835 840 845
Ala Arg Trp Asn Arg Asp Gly Glu Val Val Phe Leu Gly Arg Thr Asp
850 855 860
Asp Gln Val Lys Ile Arg Gly Tyr Arg Val Glu Leu Gly Glu Val Glu
865 870 875 880
Ala Val Leu Ala Ala Gln Arg Gly Val Val Glu Ala Val Val Val Ala
885 890 895
Arg Glu Asp Gln Pro Gly Glu Lys Arg Leu Val Gly Tyr Phe Ile Ser
900 905 910
Asp Gly Thr Asp Ala Gly Pro Ala Glu Ile Arg Arg Glu Met Ala Leu
915 920 925
Val Leu Pro Ala Tyr Met Val Pro Leu Ala Val Val Ala Leu Pro Ala
930 935 940
Leu Pro Val Thr Pro Asn Gly Lys Val Asp Arg Leu Ala Leu Pro Ala
945 950 955 960
Pro Asp Leu Val Gly Arg Ala Pro Asp Arg Ala Gln Glu Ser Glu Thr
965 970 975
Glu Lys Val Leu Cys Ala Leu Phe Ala Glu Ile Leu Gly Val Asp Arg
980 985 990
Val Gly Val Asp Asp Ala Phe His Asp Leu Gly Gly Ser Ser Ala Leu
995 1000 1005
Ala Met Arg Leu Ile Ala Arg Ile Arg Glu Glu Leu Gly Ala Asp
1010 1015 1020
Leu Pro Ile Arg Gln Leu Phe Ser Ala Ala Thr Pro Ala Gly Val
1025 1030 1035
Ala Arg Ala Leu Ala Ala Lys Ser Arg Pro Ala Leu Glu Pro Ala
1040 1045 1050
Glu Arg Pro Gly Arg Val Pro Leu Thr Ala Gln Gln Leu Ser Ala
1055 1060 1065
Trp Leu Leu Ala Ser Pro Gly Glu Ala Ala Gly Leu His Val Ser
1070 1075 1080
Val Ala Leu Arg Leu Arg Gly Arg Leu Asp Val Pro Ala Leu Glu
1085 1090 1095
Ala Ala Leu Gly Asp Val Ala Ala Arg His Glu Ile Leu Arg Thr
1100 1105 1110
Thr Phe Pro Gly His Ala Gln Ser Val His Gln His Val His Asp
1115 1120 1125
Ala Ser Pro Val Asp Leu Thr Pro Val Pro Ala Thr Glu Glu Ser
1130 1135 1140
Leu Pro Gly Leu Leu Thr Glu Leu Arg Glu Ser Val Phe Asp Leu
1145 1150 1155
Thr Arg Glu Val Pro Trp Arg Gly Asp Leu Phe Arg Leu Ser Asp
1160 1165 1170
Gly Glu His Val Leu His Leu Met Val His Arg Ile Leu Ala Asp
1175 1180 1185
Asp Glu Ser Leu Asp Val Phe Leu Arg Asp Leu Ser Ala Ala Tyr
1190 1195 1200
Gly Ala Arg Arg Ala Gly Arg Ala Pro Glu Arg Ala Pro Leu Thr
1205 1210 1215
Leu Gln Phe Ala Asp Tyr Ala Ile Trp Glu Arg Arg Leu Leu Glu
1220 1225 1230
Gly Glu Arg Asp Ala Asp Gly Leu Ile Asn Glu Gln Leu Val Phe
1235 1240 1245
Trp Arg Asp Asn Leu Ala Gly Ile His Gly Glu Thr Val Leu Pro
1250 1255 1260
Phe Asp Arg Pro Arg Ser Ala Val Ala Ser Arg Arg Ala Gly Thr
1265 1270 1275
Val Ser Leu Arg Leu Asp Ala Gly Pro His Ala Arg Leu Val Glu
1280 1285 1290
Ala Val Asp Pro Ile Gly Ala His Pro Phe Gln Ile Val His Ala
1295 1300 1305
Ala Leu Ala Met Leu Leu Thr Arg Leu Gly Ala Gly His Asp Leu
1310 1315 1320
Val Ile Gly Thr Lys Leu Pro Arg Asp Asp Asp Leu Ile Asp Leu
1325 1330 1335
Glu Pro Met Ile Gly Pro Phe Ala Arg Pro Leu Ala Leu Arg Thr
1340 1345 1350
Asp Leu Ser Gly Asp Pro Thr Phe Leu Glu Val Val Thr Arg Ala
1355 1360 1365
Gln Glu Ala Ile Arg Ser Ala Arg Gln His Leu Asp Val Pro Phe
1370 1375 1380
Ala Arg Ile Val Glu Leu Leu Asp Leu Pro Val Ser Leu Ser Arg
1385 1390 1395
His Pro Val Phe Gln Val Gly Leu Glu Val His Glu Glu Asp Leu
1400 1405 1410
Gly Ala Trp Asp Ala Thr Glu Leu Pro Ala Leu Arg Thr Ser Val
1415 1420 1425
Glu Pro Val Gly Pro Glu Ala Ile Glu Leu Asp Leu Ala Phe Arg
1430 1435 1440
Leu Thr Glu Arg Arg Asp Glu Asp Gly Ile Glu Gly Thr Leu His
1445 1450 1455
Tyr Ala Ala Asp Leu Phe Asp Gln Ala Thr Ala Glu Ser Leu Ala
1460 1465 1470
Arg Arg Leu Val Ser Phe Leu Glu Gln Val Ala Glu Asp Pro Gln
1475 1480 1485
Arg Arg Val Ser Asp Leu Asp Val Leu Leu Asp Asp Ala Glu Arg
1490 1495 1500
Glu Arg Pro Ala Glu Ala Pro Ala Lys Trp Ser Glu Ala Val Pro
1505 1510 1515
Pro Val Ala Ala Asp Leu Ala Glu Gly Gly Pro Leu Gly Ala Leu
1520 1525 1530
Val Leu Asp Asp Arg Leu Arg Pro Ala Val Ala Val Gly Glu Leu
1535 1540 1545
Tyr Leu Thr Gly Ala Ala Val Asp Ala Glu Pro Gly Asp Arg Thr
1550 1555 1560
Leu Ala Cys Pro Phe Gly Ala Thr Gly Arg Arg Met Leu Pro Thr
1565 1570 1575
Gly Leu Leu Ala Arg Trp Thr Ala Gly Gly Thr Leu Val Val Val
1580 1585 1590
Gly Glu Arg Arg Gly Ser Ser Gly Ser Val Lys Thr Gly Thr Gly
1595 1600 1605
Asp Phe Glu Val Leu Leu Pro Leu Arg Ala Gly Gly Asn Arg Pro
1610 1615 1620
Pro Leu Tyr Cys Val His Ala Ser Gly Gly Leu Ser Trp Asn Tyr
1625 1630 1635
Ala Pro Leu Leu Arg Ser Leu Pro Pro Asn Gln Pro Val Tyr Gly
1640 1645 1650
Val Gln Ala Arg Gly Leu Ala Arg Thr Glu Pro Leu Ala Ala Gly
1655 1660 1665
Val Glu Glu Met Ala Ala Asp Tyr Val Glu Gln Ile Arg Ala Val
1670 1675 1680
Gln Pro Thr Gly Pro Tyr His Leu Leu Gly Trp Ser Leu Gly Gly
1685 1690 1695
Arg Ile Ala Gln Glu Met Ala Arg Val Leu Glu Glu Gln Gly Glu
1700 1705 1710
Gln Val Gly Leu Leu Ala Leu Leu Asp Ala Tyr Pro Thr Asp Val
1715 1720 1725
Gly Arg Leu Arg Arg Pro Arg Gly Asp Ala Ala Asp Gln Glu Ala
1730 1735 1740
Ala Asp Phe Asp Arg Gln Gln Glu Gln Gln Ala Gln Leu Ala Ala
1745 1750 1755
Ala Val Ala Thr Glu Ala Gly Ala Arg Lys Arg Leu Asp Glu Val
1760 1765 1770
Met Glu His Leu Ala Arg Val Gly Pro Leu His Thr Ser Arg Ser
1775 1780 1785
Phe Gly Cys Asp Ile Leu Leu Phe Val Ala Thr Val Asn Arg Pro
1790 1795 1800
Ser His Leu Pro Val Ala Asp Ala Ile Ala Ser Trp Arg Pro Leu
1805 1810 1815
Thr Thr Gly Thr Val Glu Pro His Glu Ile Glu Ile Asp His Met
1820 1825 1830
Gln Met Leu Gln Pro Ala Ala Leu Ala Arg Ile Gly Ala Val Val
1835 1840 1845
Ala Glu Lys Leu Arg Pro Arg Pro Asp Gly Glu Arg Thr Gln Arg
1850 1855 1860
<210> 18
<211> 4083
<212> PRT
<213> Nonomuria
<400> 18
Met Ala Gln Ser Arg Ile Glu Asp Phe Trp Pro Leu Ser Pro Leu Gln
1 5 10 15
Gln Gly Leu Leu Phe His Thr Thr Tyr Asp Asp Asp Trp Pro Gly Leu
20 25 30
Tyr Val Gly His Trp Ile Leu Asn Leu Asn Gly Pro Val Glu Ala Asp
35 40 45
Arg Leu Arg Ala Ala Trp Glu Ala Leu Leu Ala Arg His Ala Ala Leu
50 55 60
Arg Ala Cys Phe Arg Gln Arg Lys Ser Gly Glu Thr Val Gln Leu Ile
65 70 75 80
Ala Arg Gln Val Glu Leu Pro Trp Arg Val Val Asp Leu Ser His Leu
85 90 95
Ser Glu Pro Glu Glu Ala Val Arg Ala Val Ala Glu Glu Asp Arg Thr
100 105 110
Arg Arg Phe Asp Leu Ala Lys Ala Pro Leu Leu Arg Leu Thr Leu Ile
115 120 125
Arg Leu Ala Gly Asp Asp His Arg Leu Val Met Thr Cys His His Ala
130 135 140
Ile Met Asp Gly Trp Ser Met Pro Ile Met Leu Asp Glu Leu Ser Met
145 150 155 160
Leu Tyr Ala Ala Asp Gly Ser Pro Leu Asp Leu Pro Ala Val Pro Ser
165 170 175
Tyr Arg Asp Tyr Leu Val Trp Leu Asp Arg Gln Asp Lys Glu Arg Thr
180 185 190
Leu Ser Ala Trp Ala Ala Glu Leu Arg Gly Val Glu Glu Pro Thr Leu
195 200 205
Val Ala Pro Ala Asp Ala Asn Arg Ala Pro Ala Met Pro Glu Asn Ile
210 215 220
Thr Val Glu Leu Pro Glu Asp Leu Thr Arg Ala Leu Ser Glu Leu Ala
225 230 235 240
Arg Thr His Gly Leu Thr Leu Asn Thr Val Val Gln Gly Ala Trp Ala
245 250 255
Leu Leu Leu Ala Gln Leu Ala Gly Arg Thr Asp Val Val Phe Gly Ala
260 265 270
Ala Val Ser Ala Arg Pro Pro Asp Leu Pro Gly Val Glu Gly Met Val
275 280 285
Gly Leu Phe Leu Asn Thr Val Pro Val Arg Val Arg Leu Ser Gly Ser
290 295 300
Thr Pro Val Ile Glu Phe Leu Ala Asp Leu Gln Lys Arg Gln Ser Ala
305 310 315 320
Leu Ile Pro His Gln Tyr Met Gly Leu Ala Asp Ile Gln Arg Thr Ala
325 330 335
Gly Ala Gly Ala Val Phe Asp Thr Leu Leu Val Phe Gln Asn Phe Pro
340 345 350
Arg Glu Leu Arg Pro Ser Asp Ala Ala Ala Ala Phe Asp Ile Arg Ile
355 360 365
Asp Gln Gly Arg Glu Ala Ala His Tyr Pro Leu Thr Leu Val Ala Val
370 375 380
Pro Gly Glu Ser Met Leu Leu Asn Leu Asp His Val Thr Asp Leu Phe
385 390 395 400
Asp Arg Glu Ala Ala Leu Ala Ile Leu Glu Arg Phe Thr Gly Ile Leu
405 410 415
Arg Gln Leu Ala Gly Ala Gly Asp Leu Thr Val Ala Glu Val Asp Val
420 425 430
Thr Ser Ala Ala Glu Arg Ala Leu Val Val Asn Ala Trp Ser Ala Ala
435 440 445
Pro Arg Val Ala Pro Gly Glu Leu Ala Pro Asp Leu Phe Asp Arg Gln
450 455 460
Val Glu Arg Gly Arg Asp Arg Val Ala Val Val Glu Gly Lys Arg Ala
465 470 475 480
Val Ser Phe Gly Glu Leu Ala Glu His Ala Glu Arg Leu Ala Gly Tyr
485 490 495
Leu Ser Gly Arg Gly Val Arg Arg Gly Asp Arg Val Ala Val Val Met
500 505 510
Gly Arg Ser Pro Gly Leu Ile Ala Thr Leu Leu Ala Val Trp Lys Ala
515 520 525
Gly Ala Ala Phe Val Pro Val Asp Pro Ala Tyr Pro Ala Glu Arg Val
530 535 540
Gln Phe Met Leu Ala Asp Ala Glu Pro Ala Ala Val Val Thr Glu Arg
545 550 555 560
Ala Cys Gln Ala Ala Val Pro Ala Gly Gly Leu Asp Pro Ile Val Leu
565 570 575
Asp Asp Pro Asp Thr Leu Arg Ala Val Ala Glu His Ala Arg Leu Ser
580 585 590
Ala Gly Ala His Ala Asp Asp Leu Ala Tyr Val Met Tyr Thr Ser Gly
595 600 605
Ser Thr Gly Arg Pro Lys Gly Val Ala Val Ser His Gly Asn Val Ala
610 615 620
Ala Leu Ala Gly Glu Pro Gly Trp Gly Leu Gly Pro Glu Asp Ala Val
625 630 635 640
Leu Met His Ala Ser His Ala Phe Asp Ile Ser Leu Phe Glu Leu Trp
645 650 655
Val Pro Leu Leu Ser Gly Ala Arg Val Val Leu Ala Glu Pro Gly Ala
660 665 670
Val Asp Gly Glu Ala Leu Ala Gly Tyr Val Ala Gly Gly Val Thr Cys
675 680 685
Ala His Leu Thr Ala Gly Thr Phe Arg Val Leu Ala Glu Glu Ser Pro
690 695 700
Glu Ser Val Ala Gly Leu Arg Glu Val Leu Thr Gly Gly Asp Ala Val
705 710 715 720
Pro Leu Ala Ala Val Glu Arg Val Arg Arg Ala Cys Pro Asp Val Arg
725 730 735
Val Arg His Leu Tyr Gly Pro Thr Glu Ala Thr Leu Cys Ala Thr Trp
740 745 750
Trp Leu Leu Gln Pro Gly Glu Pro Thr Gly Pro Val Leu Pro Ile Gly
755 760 765
Arg Pro Leu Ala Gly Arg Arg Val Tyr Val Leu Asp Ala Phe Leu Arg
770 775 780
Pro Val Pro Pro Gly Val Thr Gly Glu Leu Tyr Val Ala Gly Ala Gly
785 790 795 800
Val Ala Gln Gly Tyr Leu Gly Arg Pro Ala Leu Thr Ala Glu Arg Phe
805 810 815
Val Ala Glu Pro Phe Val Pro Gly Gly Arg Met Tyr Arg Thr Gly Asp
820 825 830
Leu Ala Arg Trp Thr Asp Gln Gly Glu Leu Ala Phe Ala Gly Arg Ala
835 840 845
Asp Asp Gln Val Lys Ile Arg Gly Tyr Arg Val Glu Pro Gly Glu Ile
850 855 860
Glu Ala Val Leu Ala Gly Leu Pro Gly Val Gly Gln Ala Val Val Ser
865 870 875 880
Ala Arg Glu Glu Arg Leu Ile Gly Tyr Val Val Ala Glu Thr Gly Gly
885 890 895
Asp Leu Asp Pro Val Arg Ile Arg Glu Gln Leu Ala Ala Thr Leu Pro
900 905 910
Glu Phe Met Val Pro Ala Ala Val Leu Val Leu Asp Ala Leu Pro Leu
915 920 925
Thr Gly Asn Gly Lys Val Asp Arg Arg Ala Leu Pro Glu Pro Asp Phe
930 935 940
Ala Ala Gly Ala Val Asp Arg Glu Pro Ala Thr Asp Ala Glu Arg Ile
945 950 955 960
Leu Cys Gly Val Phe Ala Glu Val Leu Gly Ala Gly Arg Val Gly Val
965 970 975
Ala Asp Ser Phe Phe Glu Leu Gly Gly Asp Ser Ile Ser Ser Met Gln
980 985 990
Val Ala Ala Arg Ala Arg Arg Gln Gly Ile Pro Leu Thr Pro Arg Gln
995 1000 1005
Val Phe Glu His Arg Thr Pro Glu Arg Leu Ala Ala Leu Ala Gln
1010 1015 1020
Gln Ala Pro Gly Arg Arg Ala Ser Ser Val Glu Pro Gly Val Gly
1025 1030 1035
Glu Ile Pro Arg Thr Pro Val Met Arg Ala Leu Gly Asp Asp Ala
1040 1045 1050
Val Arg Pro Gly Phe Ala Gln Ala Arg Val Val Val Thr Pro Ala
1055 1060 1065
Gly Phe Ala Pro Asp Ala Leu Val Thr Ala Leu Gln Ala Val Leu
1070 1075 1080
Asp Val His Asp Leu Leu Arg Thr Arg Val Glu Pro Asp Gly Arg
1085 1090 1095
Leu Met Val Ala Glu Pro Gly Ala Val Asp Ala Ala Gly Leu Val
1100 1105 1110
Thr Arg Val Ala Ala Gly Asn Gly Asn Leu Ala Glu Arg Ala Glu
1115 1120 1125
Arg Glu Ala Arg Thr Ala Ala Gly Thr Leu Asp Pro Ser Glu Gly
1130 1135 1140
Ile Met Val Arg Ala Val Trp Val Asp Ala Gly Asp Ala Glu Pro
1145 1150 1155
Gly Arg Leu Ala Leu Val Val His His Leu Val Val Asp Ala Val
1160 1165 1170
Ser Trp Ala Ile Leu Leu Ser Asp Leu Arg Ala Ala Tyr Asp Glu
1175 1180 1185
Ala Val Ser Gly Gly Thr Pro Val Leu Glu Pro Ala Val Thr Ser
1190 1195 1200
Tyr Arg Gln Trp Ala Arg Arg Leu Ala Gly Gln Ala Leu Ser Glu
1205 1210 1215
Ser Thr Val Ala Glu Ala Gly His Trp Ala Gly Val Leu Glu Gly
1220 1225 1230
Gly Asp Leu Pro Leu Glu Arg His Pro Gly Gln Ser Ala Ser Trp
1235 1240 1245
Ser Arg Thr Leu Ser Asp Ala Gln Ala Arg Asn Leu Val Ala Arg
1250 1255 1260
Val Pro Ala Ala Phe His Cys Gly Val Gln Asp Val Leu Leu Ala
1265 1270 1275
Gly Leu Ala Gly Ala Val Ala Arg Trp Arg Gly Ala Asp Ala Gly
1280 1285 1290
Ile Leu Val Asp Val Glu Gly His Gly Arg His Ala Ala Asp Gly
1295 1300 1305
Glu Asp Leu Leu Arg Thr Val Gly Trp Phe Thr Ser Val His Pro
1310 1315 1320
Val Arg Leu Asp Val Ser Gly Val Gly Pro Gly Ala Ala Ala Ala
1325 1330 1335
Gly Glu Leu Leu Lys Ala Val Lys Glu Gln Ala Arg Ala Val Pro
1340 1345 1350
Gly Asp Gly Leu Gly Tyr Gly Leu Leu Arg Tyr Leu Asn Pro Glu
1355 1360 1365
Thr Gly Ala Arg Leu Ala Glu Leu Pro Ser Ala Gln Ile Gly Phe
1370 1375 1380
Asn Tyr Leu Gly Arg Ser Gly Val Ala Ser Glu Asp Thr Ala Trp
1385 1390 1395
Gln Val Cys Glu Gly Ala Leu Gly Gly Gln Ala Ala Gly Pro Asp
1400 1405 1410
Leu Val Gln Ser His Ala Leu Glu Val Gly Ala Asp Val Gln Asp
1415 1420 1425
Thr Pro Ala Gly Pro Arg Leu Arg Leu Ala Ile Asp Gly Arg Asp
1430 1435 1440
Leu Asp Pro Ala Ala Val Glu Arg Leu Gly Glu Ala Trp Leu Asp
1445 1450 1455
Thr Leu Ala Gly Leu Ala Ala Leu Ala Asp Thr Pro Gly Ala Gly
1460 1465 1470
Gly His Thr Pro Ser Asp Phe Glu Leu Val Glu Val Arg Gln Arg
1475 1480 1485
Asp Val Asp Glu Leu Glu Ala Val Ala Pro Gly Leu Thr Asp Val
1490 1495 1500
Trp Pro Leu Ser Pro Leu Gln Glu Gly Ile Leu Phe Glu Arg Ala
1505 1510 1515
Phe Asp Glu Asp Gly Val Asp Val Tyr Gln Thr Gln Arg Ile Leu
1520 1525 1530
Asp Leu Asp Gly Pro Leu Asp Ala Gln Arg Leu His Ala Ala Trp
1535 1540 1545
Gln Ser Val Ile Asp Arg His Glu Thr Leu Arg Thr Gly Phe His
1550 1555 1560
Gln Leu Gly Ser Gly Glu Thr Val Gln Val Val Val Gly Glu Ala
1565 1570 1575
Glu Val Leu Trp Arg Glu Ala Asp Leu Ser Arg Leu Asp Glu Pro
1580 1585 1590
Asp Ala Glu Val Glu Arg Leu Leu Ala Ala Asp Gln Ala Glu Arg
1595 1600 1605
Phe Asp Val Ser Arg Ala Pro Leu Leu Arg Leu Leu Leu Ile Arg
1610 1615 1620
Leu Gly Ala Ala Arg His Arg Leu Val Val Thr Ser His His Val
1625 1630 1635
Leu Val Asp Gly Trp Ser Thr Pro Ile Leu Leu Gly Glu Met Leu
1640 1645 1650
Thr Ala Tyr Ala Asp Gly Arg Val Ser Pro Ala Pro Pro Ser Tyr
1655 1660 1665
Arg Asp Tyr Val Ala Trp Leu Ser Arg Gln Asp Glu Asp Ala Ala
1670 1675 1680
Arg Ser Ala Trp Arg Ala Glu Leu Ala Gly Leu Asp Glu Pro Thr
1685 1690 1695
Val Val Gly Leu Asp Ala Gly Lys Ala Pro Val Met Pro Asp Gly
1700 1705 1710
His Ala Glu Trp Leu Ser Glu Glu Ala Thr Arg Ala Leu Thr Gly
1715 1720 1725
Phe Ala Arg Gly His Gly Leu Thr Leu Ser Thr Val Val Gln Gly
1730 1735 1740
Ala Trp Ala Leu Val Leu Ala Arg Leu Ala Arg Arg Thr Asp Val
1745 1750 1755
Val Phe Gly Thr Val Val Ser Gly Arg Pro Ala Asp Ala Leu Pro
1760 1765 1770
Asp Val Glu Arg Met Val Gly Met Phe Ile Asn Thr Val Pro Val
1775 1780 1785
Arg Val Arg Leu Asp Gly Ala Val Pro Val Leu Asp Leu Leu Gln
1790 1795 1800
Asp Leu Gln Arg Arg Gln Ser Ser Leu Thr Glu His Gln His Leu
1805 1810 1815
Gly Leu Pro Glu Ile Gln Lys Ala Ala Gly Pro Gly Ser Ile Phe
1820 1825 1830
Asp Thr Ile Leu Met Ile Val Asn Tyr Pro Leu Asp Ala Asp Gly
1835 1840 1845
Leu Asp Asp Gly Gly Val Ala Ile Ser Ser Ile Arg Thr Arg Thr
1850 1855 1860
Gly Thr Thr Tyr Pro Leu Ser Val Ser Val Ile Pro Gly Ala Arg
1865 1870 1875
Leu Gln Ile Gln Leu Asp Tyr Arg Pro Asp Trp Ile Gly Gly Asp
1880 1885 1890
Leu Ala Ala Glu Ile Thr Gly Gln Val Val Arg Val Leu Ala Arg
1895 1900 1905
Met Val Ala Glu Pro Ser Leu Pro Val Gly Arg Leu Ala Val Thr
1910 1915 1920
Ser Arg Ser Thr Arg Gly Ser Val Thr Glu Arg Trp Asn Ser Thr
1925 1930 1935
Gly Ala Ala Ala Gly Gly Ser Ser Val Pro Glu Leu Phe Arg Arg
1940 1945 1950
Gln Ala Asp Ala Ala Pro Asp Ala Thr Ala Val Ile Gly Asp Gly
1955 1960 1965
Arg Thr Leu Ser Tyr Ala Gly Leu Asp Arg Glu Ser Asp Arg Leu
1970 1975 1980
Ala Gly His Leu Ala Arg Arg Gly Val Arg Arg Gly Asp Arg Val
1985 1990 1995
Gly Val Leu Met Glu Arg Gly Ala Asp Leu Ile Val Ala Leu Leu
2000 2005 2010
Ala Val Trp Lys Ala Gly Ala Ala Gln Val Pro Val Asn Val Asp
2015 2020 2025
Tyr Pro Ala Glu Arg Ile Glu Arg Met Leu Ala Asp Ala Gly Ala
2030 2035 2040
Ser Val Ala Val Cys Ala Gly Ala Thr Arg His Ala Val Pro Asp
2045 2050 2055
Gly Ile Glu Pro Val Val Met Asp Ala Pro Ala Thr Glu Ala Glu
2060 2065 2070
Arg His Glu Ala Pro Pro Leu Ala Val Gly Ala His Asp Val Ala
2075 2080 2085
Tyr Val Met Tyr Thr Ser Gly Ser Thr Gly Val Pro Lys Gly Val
2090 2095 2100
Ala Val Pro His Gly Ser Ala Ala Ala Leu Ala Gly Asp Pro Gly
2105 2110 2115
Trp Ser Gln Gly Ala Gly Asp Arg Val Leu Met His Ala Ser His
2120 2125 2130
Ala Phe Asp Ala Ser Leu Leu Glu Ile Trp Val Pro Leu Val Ser
2135 2140 2145
Gly Ala Cys Val Met Val Ala Glu Pro Gly Ala Ile Asp Ala Gln
2150 2155 2160
Arg Leu Arg Asp Val Ile Ala Arg Gly Ala Thr Thr Val His Leu
2165 2170 2175
Thr Ala Gly Thr Phe Arg Val Leu Ala Glu Glu Ser Pro Asp Ser
2180 2185 2190
Phe Ser Gly Leu Arg Glu Val Leu Thr Gly Gly Asp Val Val Pro
2195 2200 2205
Leu Glu Ser Val Ala Arg Val Arg Arg Ala Cys Pro Glu Val Arg
2210 2215 2220
Val Arg Glu Leu Tyr Gly Pro Thr Glu Val Thr Leu Cys Ala Thr
2225 2230 2235
Trp His Leu Ile Glu Pro His Thr Glu Thr Gly Asp Thr Leu Pro
2240 2245 2250
Ile Gly Arg Pro Leu Ala Gly Arg Gln Val Tyr Val Leu Asp Ala
2255 2260 2265
Phe Leu Gln Pro Val Ala Pro Asn Val Thr Gly Glu Leu Tyr Leu
2270 2275 2280
Ala Gly Ala Gly Leu Ala His Gly Tyr Leu Gly Ala Pro Ala Ala
2285 2290 2295
Thr Ser Glu Arg Phe Ile Ala Val Pro Ala Ser Val Asn Pro Ala
2300 2305 2310
Ala Ser Gly Glu Arg Met Tyr Arg Thr Gly Asp Leu Ala Arg Trp
2315 2320 2325
Thr Asp Arg Gly Glu Leu Leu Phe Ala Gly Arg Ala Asp Ser Gln
2330 2335 2340
Val Lys Ile Arg Gly Tyr Arg Val Glu Pro Gly Glu Ile Glu Ala
2345 2350 2355
Ala Leu Ala Glu Val Pro His Val Ala Gln Ala Val Val Val Ala
2360 2365 2370
Arg Glu Asp Arg Pro Gly Glu Lys Arg Leu Ile Ala Tyr Val Thr
2375 2380 2385
Ala Glu Glu Gly Ser Gly Leu Asp Pro Asp Ala Val Arg Glu His
2390 2395 2400
Leu Ala Gly Arg Leu Pro Glu Phe Met Val Pro Ala Ala Val Val
2405 2410 2415
Leu Leu Asp Gly Val Pro Leu Thr Pro Asn Gly Lys Ile Asp Arg
2420 2425 2430
Ala Ala Leu Pro Val Pro Glu Phe Thr Gly Lys Ala Ala Gly Arg
2435 2440 2445
Glu Pro Arg Thr Glu Ala Glu Arg Val Leu Cys Glu Leu Phe Ala
2450 2455 2460
Glu Val Leu Gly Val Ala Arg Ala Gly Ala Glu Asp Ser Phe Phe
2465 2470 2475
Glu Leu Gly Gly Asp Ser Ile Leu Ser Met Arg Leu Ala Ala Arg
2480 2485 2490
Ala Arg Arg Glu Glu Leu Val Phe Gly Ala Lys Asp Val Phe Glu
2495 2500 2505
Arg Lys Thr Pro Ala Gly Ile Ala Met Val Ala Glu Arg Gly Gly
2510 2515 2520
Ala Thr Arg Ala Ser Leu Asp Asp Gly Val Gly Glu Val Met Ser
2525 2530 2535
Thr Pro Val Ile Arg Ala Leu Leu Glu Arg Asp Pro Asp Ala Met
2540 2545 2550
Thr Arg Gly Ala Leu Ser Gln Trp Val Thr Ala Gly Ala Pro Asp
2555 2560 2565
Asp Leu Ser Val Asp Val Leu Ala Ala Gly Leu Gly Ala Val Ile
2570 2575 2580
Asp Ala His Asp Met Leu Arg Ser Arg Ile Val Arg Thr Gly Ala
2585 2590 2595
Ala Gln Pro Arg Leu Val Val Ala Gly Arg Gly Ala Val Asp Ala
2600 2605 2610
Ala Thr Leu Val Glu Arg Val Glu Ala Gly Thr Gly Asp Val Asp
2615 2620 2625
Glu Ile Ala Asp Arg Cys Ala Arg Asp Ala Ala Ala Arg Leu Asp
2630 2635 2640
Pro His Ala Gly Val Met Ile Arg Ala Val Trp Val Asp Ala Gly
2645 2650 2655
Pro Gly Arg Val Gly Arg Leu Val Val Ala Ala His His Leu Val
2660 2665 2670
Val Asp Val Val Ser Trp Arg Ile Leu Leu Pro Asp Leu Gln Val
2675 2680 2685
Ala Cys Glu Ala Val Ala Ala Gly Arg Arg Pro Val Leu Asp Pro
2690 2695 2700
Val Asp Val Ser Phe Arg Arg Trp Ala Arg Thr Leu Ala Asp Gln
2705 2710 2715
Ala Val Thr Arg Ala Thr Glu Leu Glu Thr Trp Thr Glu Ile Leu
2720 2725 2730
Asp Gly Ala Arg Ser Arg Leu Gly Glu Leu Asp Pro Ala Arg Asp
2735 2740 2745
Thr Val Ser Thr Ala Gly Arg Thr Ser Trp Thr Leu Pro His Asp
2750 2755 2760
Arg Ala Gly Val Leu Val Glu Gln Ala Thr Ser Ala Phe His Cys
2765 2770 2775
Gly Val His Glu Val Leu Leu Ala Thr Leu Ala Gly Ala Val Ala
2780 2785 2790
His Trp Arg Gly Gly Thr Ala Val Val Val Asp Val Glu Gly His
2795 2800 2805
Gly Arg Arg Pro Ile Asp Glu Leu Asp Leu Ser Arg Thr Val Gly
2810 2815 2820
Trp Phe Thr Asp Val His Pro Leu Arg Leu Asp Val Thr Gly Ile
2825 2830 2835
Asp Pro Ala Glu Val Ile Ala Gly Gly Gly Ala Ala Gly His Leu
2840 2845 2850
Leu Lys Gln Val Lys Glu Asn Val Arg Ala Val Pro Asp Gly Gly
2855 2860 2865
Leu Gly Tyr Gly Ile Leu Arg Tyr Leu Asn Ala Gly Thr Gly Gln
2870 2875 2880
Ala Leu Ala Ala Ala Pro Lys Pro Glu Ile Gly Phe Asn Tyr Leu
2885 2890 2895
Gly Arg Phe Pro Ser Arg Ser Ala Gly Ala Pro Glu Pro Trp Gln
2900 2905 2910
Leu Leu Gly Thr Ile Gly Gly Thr Ala Glu Gln Asp Thr Ala Leu
2915 2920 2925
Arg His Ala Val Glu Ile Asp Ala Ala Val Leu Asp Gly Ala Ala
2930 2935 2940
Gly Pro Glu Leu Ser Leu Thr Val Thr Trp Ala Gly Arg Leu Leu
2945 2950 2955
Gly Glu Ala Glu Ala Glu Ser Leu Ala Gln Ala Trp Leu Ala Met
2960 2965 2970
Leu Thr Gly Leu Ala Ala His Val Gly Gly Gly Gly Ala Gly Gly
2975 2980 2985
His Thr Pro Ser Asp Phe Pro Leu Ile Ser Leu Thr Gln Gln Asp
2990 2995 3000
Val Ala Glu Val Glu Ala Ala Val Pro Thr Leu Leu Asp Ile Trp
3005 3010 3015
Pro Leu Ser Pro Leu Gln Glu Gly Leu Leu Phe His Ala Ala Asp
3020 3025 3030
Glu Arg Gly Pro Asp Val Tyr Ala Gly Met Arg Lys Leu Ala Leu
3035 3040 3045
Asp Gly Pro Leu Asp Val Ala Arg Phe Arg Ala Ser Trp Gln Ala
3050 3055 3060
Leu Leu Asp Arg His Pro Ala Leu Arg Ala Ser Phe His Gln Leu
3065 3070 3075
Gly Ser Gly Ala Ala Val Gln Ala Ile Ala Arg Glu Val Pro Leu
3080 3085 3090
Asp Trp Gln Glu Thr Asp Leu Ser Arg Leu Pro Glu Asp Glu Ala
3095 3100 3105
Leu Ala Glu Phe Asp Arg Leu Ala Glu Gln Leu His Thr Glu Arg
3110 3115 3120
Phe Asp Leu Thr Arg Ala Pro Gln Leu Arg Leu His Leu Val Arg
3125 3130 3135
Leu Gly Glu Arg Arg His Arg Leu Val Leu Thr Ser His His Ile
3140 3145 3150
Val Ala Asp Gly Trp Ser Leu Pro Leu Ile Thr Glu Asp Val Leu
3155 3160 3165
Thr Val Tyr Glu Ser Gly Gly Asp Gly Arg Ala Leu Pro Ala Ala
3170 3175 3180
Thr Ser Tyr Arg Asp Tyr Leu Ala Trp Ile Ala Arg Gln Asp Lys
3185 3190 3195
Ala Ala Ala Arg Glu Ala Trp Arg Ala Glu Leu Ala Gly Leu Asp
3200 3205 3210
Glu Ala Thr His Val Val Pro Pro Glu Thr Ile Thr Thr Pro Leu
3215 3220 3225
Glu Pro Glu Arg Val Gly Phe Glu Leu Asp Glu Ala Leu Ser Arg
3230 3235 3240
Arg Val Val Glu Phe Thr Gly Arg His Gly Val Thr Ala Asn Thr
3245 3250 3255
Leu Phe Gln Gly Ile Trp Ala Leu His Leu Ala Arg Leu Thr Gly
3260 3265 3270
Arg Asp Asp Val Val Phe Gly Ala Ala Val Ala Gly Arg Pro Pro
3275 3280 3285
Glu Ile Pro Gly Val Glu Ser Ala Val Gly Leu Phe Met Asn Met
3290 3295 3300
Leu Pro Val Arg Ala Arg Leu Ala Gly Ala Glu Pro Phe Leu Asp
3305 3310 3315
Met Leu Thr Asp Leu Gln Glu Arg Gln Val Ala Cys Met Pro His
3320 3325 3330
Gln His Val Gly Leu Ser Glu Ile Asn Gln Leu Ala Gly Pro Gly
3335 3340 3345
Ala Ala Phe Asp Thr Ile Val Val Phe Glu Asn Tyr Pro Pro Pro
3350 3355 3360
Pro Pro Arg Pro Glu Gly Pro Asp Ala Leu Val Met Arg Pro Ala
3365 3370 3375
Gly Ile Pro Asn Asp Thr Gly His Tyr Pro Leu Ser Met Arg Ala
3380 3385 3390
Ser Val Ala Gly Arg Val His Gly Glu Phe Ile Tyr Arg Pro Asp
3395 3400 3405
Val Val Asp Arg Ala Glu Ala Glu Glu Met Leu Ala Ser Ile Leu
3410 3415 3420
Arg Ala Leu Glu Gln Val Val Ala Glu Pro Arg Val Pro Val Gly
3425 3430 3435
Arg Val Gly Leu Ile Gly Pro Glu Gln Arg Arg Leu Val Val Glu
3440 3445 3450
Glu Trp Asn Arg Thr Gly Val Pro Pro Ala Ala Glu Pro Val Pro
3455 3460 3465
Met Leu Phe Arg Arg Gln Val Glu Arg Ser Pro Asp Ala Val Ala
3470 3475 3480
Val Val Asp Ala Ala Arg Ser Leu Ser Tyr Ser Gly Leu Leu Asp
3485 3490 3495
Glu Ala Glu Glu Leu Ala Arg Leu Leu Val Gly Leu Gly Val Arg
3500 3505 3510
Arg Glu Thr Arg Val Gly Val Leu Val Gly Arg Ser Ala Glu Leu
3515 3520 3525
Val Val Ala Leu Leu Gly Val Ser Ser Ala Gly Gly Val Phe Val
3530 3535 3540
Pro Met Asp Pro Asp Tyr Pro Arg Glu Arg Ile Ser Phe Ile Leu
3545 3550 3555
Ala Asp Ser Ala Pro Glu Val Leu Leu Cys Thr Ser Glu Thr Arg
3560 3565 3570
Gln Ala Val Pro Glu Glu Phe Ala Gly Ala Val Val Ala Leu Asp
3575 3580 3585
Ala Pro Leu Ala Ala Asp Pro Arg Thr Ala Leu Pro Arg Val Glu
3590 3595 3600
Ala Gly Asp Gly Ala Tyr Val Ile Tyr Thr Ser Gly Ser Thr Gly
3605 3610 3615
Val Pro Lys Gly Val Leu Val Pro His Ala Gly Leu Gly Asn Leu
3620 3625 3630
Ala Ser Ala Gln Ile Glu Arg Phe Gly Val Thr Ser Ala Ser Arg
3635 3640 3645
Ile Leu Gln Phe Ala Ala Leu Gly Phe Asp Ala Ala Val Ser Glu
3650 3655 3660
Leu Cys Met Ala Leu Leu Ser Gly Gly Thr Val Val Leu Ala Asp
3665 3670 3675
Ala Glu Ser Met Pro Pro Arg Val Ser Leu Gly Asp Ala Val Arg
3680 3685 3690
Arg Trp Gly Ile Thr His Val Thr Val Pro Pro Ser Val Pro Ala
3695 3700 3705
Val Glu Asp Asp Leu Pro Asp Ser Leu Glu Thr Leu Val Val Ala
3710 3715 3720
Gly Glu Ala Cys Pro Pro Ala Leu Val Asp Arg Trp Ser Pro Gly
3725 3730 3735
Arg Arg Met Ile Asn Ala Tyr Gly Pro Thr Glu Thr Thr Val Cys
3740 3745 3750
Ala Thr Met Ser Ser Pro Leu Ser Pro Gly Arg Asp Val Val Pro
3755 3760 3765
Ile Gly Arg Pro Ile Thr Gly Leu Arg Ala Tyr Val Leu Asp Ala
3770 3775 3780
Phe Leu Gln Pro Val Pro Pro Gly Val Thr Gly Glu Leu Tyr Val
3785 3790 3795
Ala Gly Ala Gly Leu Ala Arg Gly Tyr Leu Gly Arg Pro Gly Leu
3800 3805 3810
Thr Ala Glu Arg Phe Val Ala Val Pro Ala Ser Val Ser Pro Ala
3815 3820 3825
Arg Pro Gly Glu Arg Met Tyr Arg Thr Gly Asn Arg Ala Arg Trp
3830 3835 3840
Thr Arg Asp Gly Glu Leu Val Phe Thr Gly Arg Ala Asp Ala Gln
3845 3850 3855
Val Lys Val Arg Gly Tyr Arg Ile Glu Pro Gly Glu Ile Glu Ala
3860 3865 3870
Val Leu Ala Asp His Pro Gly Val Ala Gln Val Ala Val Val Ala
3875 3880 3885
Arg Glu Asp Gly Pro Gly Gln Lys Tyr Leu Val Ala Tyr Val Val
3890 3895 3900
Pro Ala Ala Glu Gln Val Ala Gly Ala Pro Ser Glu Ala Gly Gln
3905 3910 3915
Asp Gly Ala Leu Ile Ser Ala Leu Arg Glu Ser Ala Ala Gly Arg
3920 3925 3930
Leu Pro Glu His Met Arg Pro Ala Ala Phe Val Pro Leu Asp Thr
3935 3940 3945
Met Pro Leu Thr Pro Asn Gly Lys Val Asp His Arg Ala Leu Arg
3950 3955 3960
Ala Pro Asp Phe Ala Arg Ser Ser Ser Gly Arg Asp Pro Arg Ser
3965 3970 3975
Ala Met Glu Ala Lys Leu Cys Glu Leu Phe Ala Glu Val Leu Gly
3980 3985 3990
Leu Glu Glu Val Gly Ala Gly Asp Ser Phe Phe Glu Leu Gly Gly
3995 4000 4005
Asp Ser Ile Thr Ser Met Gln Leu Ser Ala Leu Ala Arg Arg Lys
4010 4015 4020
Gly Leu Asp Leu Thr Pro Trp Gln Val Phe Asp Glu Lys Thr Ala
4025 4030 4035
Glu Arg Leu Ala Ala Val Val Lys Glu Leu Pro Ala Asp Gly Glu
4040 4045 4050
Gly Thr Gly Glu Pro Glu Pro Pro Ala Gly Thr Leu Val Asp Leu
4055 4060 4065
Ser Pro Asp Gln Leu Asp Gln Leu Glu Ala Gly Pro Ala Gly Gly
4070 4075 4080
<210> 19
<211> 753
<212> PRT
<213> Nonomuria
<400> 19
Met Ala Gly Phe Gly Ala Pro Phe Arg Asn Ser Asp His Val Val Ser
1 5 10 15
Lys Leu Thr Asn Glu Asp Ala Phe Glu Leu Val Glu Arg His Gly Ala
20 25 30
Asn Ala Ser Pro Leu Gly Arg Ala Met Leu Thr Val Arg Ala Gly Asp
35 40 45
Arg Ser Tyr Pro Glu Met Gly Val Gly Pro Val Ala Glu Ser Lys Asp
50 55 60
Leu Arg Trp Gln Gln Leu Thr Ser Gly Arg Phe Pro Glu Arg Lys Gly
65 70 75 80
Glu Ala Val Val Asp Leu Trp Asp Ala Gln Asn Trp Asp Val Ala Val
85 90 95
Gly Asp Arg Ile Arg Ile Gly Glu Arg Ala Thr Ala Ala Asp Phe Thr
100 105 110
Val Val Gly Ile Val Arg Ala Pro Ser Pro Val Ala Gln Ala Ser Val
115 120 125
Tyr Val Thr Trp Pro Gln Leu Met Arg Trp Ala Asp Asp Pro Ser Leu
130 135 140
Gly Ile Tyr Thr Val Thr Val Arg Gly Ala Val Gly Pro Val Pro Glu
145 150 155 160
Thr Ala Lys Val Gln Thr Pro Glu Gln Glu Ile Ala Ala Arg Thr Ala
165 170 175
Gln Leu Gln Asn Gly Val Asp Thr Trp Ser Leu Leu Leu Leu Leu Phe
180 185 190
Ala Gly Ile Ala Val Phe Val Ser Ile Leu Val Ile Ala Asn Thr Phe
195 200 205
Ser Ile Leu Leu Ala Gln Arg Met Arg Asp Phe Ala Leu Leu Arg Cys
210 215 220
Val Gly Ala Thr Arg Arg Gln Val Val Ser Ser Val Arg Arg Glu Ala
225 230 235 240
Ala Val Val Gly Leu Leu Ser Ser Leu Ala Gly Val Leu Val Gly Ala
245 250 255
Gly Leu Gly Tyr Gly Leu Ile Ala Leu Ile Lys Thr Leu Ser Pro Ile
260 265 270
Thr Pro Ile Ala Ala Pro Ala Pro Pro Ala Pro Trp Leu Leu Gly Gly
275 280 285
Leu Ala Ile Gly Leu Thr Ala Thr Leu Val Ala Ala Trp Leu Pro Ile
290 295 300
Arg Arg Val Val Arg Val Ser Pro Leu Ala Ala Leu Arg Pro Asp Thr
305 310 315 320
Ala Thr Asp Pro Arg Thr Ala Thr Gly Arg Ala Arg Leu Val Leu Gly
325 330 335
Val Phe Met Leu Ile Ala Gly Leu Val Leu Leu Ala Ser Ala Met Ala
340 345 350
Trp His Ser Thr Val Leu Met Leu Ala Gly Gly Gly Ser Leu Phe Thr
355 360 365
Gly Val Leu Leu Phe Gly Pro Val Leu Ile Pro Arg Leu Leu Glu Ile
370 375 380
Thr Gly Thr Arg Leu Gly Thr Ile Gly Arg Leu Ala Thr Lys Asn Ala
385 390 395 400
Val Arg Asn Pro Arg Arg Thr Ala Thr Thr Ala Ala Ser Leu Leu Val
405 410 415
Gly Ile Thr Leu Ile Thr Ala Val Leu Thr Gly Val Ala Ile Thr Ser
420 425 430
Glu Ala Leu Asn Glu Arg Leu Asp Gly Gln His Pro Ile Asp Ala Ala
435 440 445
Leu Val Ser Thr Gly Lys Pro Phe Ser Ala Asp Phe Leu Asp Lys Val
450 455 460
Arg Gly Thr Ser Gly Val Asp Gln Ala Ile Ala Val Asp Gly Ala Val
465 470 475 480
Ala Thr Val Ser Gly Leu Asp Lys Pro Ile Pro Val Val Thr Ala Pro
485 490 495
Asp Ala Gln Arg Val Ala His Asp Gly Gly Ser Phe Ala Arg Val Glu
500 505 510
Pro Gly Val Leu Arg Leu Asp Glu Ser Ala Phe Arg Gln Leu Arg Leu
515 520 525
Arg Ala Gly Asp Lys Val Arg Val Thr Val Gly Asp Arg Arg Ala Val
530 535 540
Leu Gln Val Ser Leu Ala Thr Gly Trp Gly Leu Gln Ala Val Val Ala
545 550 555 560
Pro Glu Thr Leu Ala Arg Leu Thr Asp Ser Ala Ala Pro Arg Ala Val
565 570 575
Trp Ile Arg Ala Ser Ala Asp Ala Asp Ser Thr Arg Leu Val Gly Glu
580 585 590
Leu Gly Asp Leu Ala Ala Ala Ala Gly Ala Asn Val Asn Asp Gln Leu
595 600 605
Glu Ala Arg Glu Thr Glu Asn Ala Pro Leu Met Ile Leu Thr Trp Ala
610 615 620
Ile Val Ala Leu Leu Gly Phe Ser Val Ala Ile Ala Leu Val Gly Ile
625 630 635 640
Ala Asn Thr Leu Gly Leu Ser Val Leu Glu Arg Val Arg Glu His Ala
645 650 655
Leu Leu Arg Ala Leu Gly Leu Thr Arg Arg Gln Leu Arg Arg Met Leu
660 665 670
Ala Ala Glu Ala Val Leu Leu Ser Leu Val Ala Ala Val Leu Gly Thr
675 680 685
Val Ile Gly Ile Gly Phe Ala Trp Val Gly Tyr Glu Thr Phe Val Lys
690 695 700
Gln Ala Leu Asp Asn Ala Thr Met Gln Val Pro Trp Pro Leu Leu Ala
705 710 715 720
Val Val Val Leu Val Ala Ala Leu Ala Gly Leu Leu Ala Ser Val Leu
725 730 735
Pro Ala Arg Arg Ala Val Arg Val Thr Pro Ala Ala Gly Leu Ser Phe
740 745 750
Glu
<210> 20
<211> 232
<212> PRT
<213> Nonomuria
<400> 20
Met Thr Gly Gln Arg Ala Ala Leu Glu Thr Val Ala Ala Ser Ala Arg
1 5 10 15
Asn Leu Thr Lys Val Tyr Gly Gln Gly Glu Thr Arg Val His Ala Leu
20 25 30
Arg Gly Val Asp Leu Asp Leu Pro Arg Gly Lys Phe Thr Ala Ile Met
35 40 45
Gly Ser Ser Gly Ser Gly Lys Ser Thr Leu Met His Cys Leu Ala Gly
50 55 60
Leu Asp Gln Ala Ser Asp Gly Thr Val Thr Val Ala Gly Thr Asp Leu
65 70 75 80
Gly Ser Leu Asp Asp Asn Glu Leu Thr Val Phe Arg Arg Glu His Ile
85 90 95
Gly Phe Val Phe Gln Ser Phe Asn Leu Leu Pro Met Leu Thr Ala Phe
100 105 110
Gln Asn Ile Thr Leu Pro Leu Glu Leu Gly Gly Arg Arg Ile Asp Asp
115 120 125
Ala Ala Thr Glu Arg Val His Val Leu Ala Glu Thr Leu Gly Met Ala
130 135 140
Asp Arg Leu Gly His Arg Pro Ser Glu Met Ser Gly Gly Gln Gln Gln
145 150 155 160
Arg Val Ala Ile Ala Arg Ala Leu Ile Thr Gly Pro Asp Leu Leu Phe
165 170 175
Ala Asp Glu Pro Thr Gly Asn Leu Asp Ser Thr Thr Ser Ala Glu Val
180 185 190
Leu Gly Tyr Leu His Lys Ser Thr Arg Glu Leu Gly Gln Thr Val Val
195 200 205
Met Val Thr His Glu Arg Glu Ala Ala Ala Tyr Ala Asp Gly Val Val
210 215 220
Thr Leu Glu Asp Gly Arg Ile Ala
225 230
<210> 21
<211> 535
<212> PRT
<213> Nonomuria
<400> 21
Met Ser His Ile Thr Met Thr Pro Pro Ser Ala Cys Arg Asp Pro Ala
1 5 10 15
Pro Ala Gly Arg Phe Pro Arg Trp Ala Val Trp Arg Ser Pro Pro Gly
20 25 30
Gln Pro Trp Trp Ala Arg Pro Ala Leu Leu Cys Ile Ala Ala Thr Ala
35 40 45
Ala Val Leu Tyr Ala Trp Asn Leu Pro Leu Val Asp Tyr Ala Pro Arg
50 55 60
Tyr Ser Asp Ala Val Lys Ser Met Ser Glu Asn Trp Lys Ala Phe Leu
65 70 75 80
Tyr Gly Thr Val Asp Val Gln Ala Thr Tyr Thr Leu Asp Lys Leu Ala
85 90 95
Gly Ala Phe Val Pro Gln Ala Ile Ser Val Lys Ile Phe Gly Phe His
100 105 110
Ala Trp Ala Leu Ala Leu Pro Gln Val Ile Glu Gly Val Ile Ser Val
115 120 125
Leu Val Met Tyr Arg Ile Val Arg Arg Trp Ala Gly Val Val Pro Gly
130 135 140
Leu Leu Ala Ala Ala Val Phe Thr Ile Thr Pro Val Ala Ala Ser Met
145 150 155 160
Phe Gly His Ser Met Ala Asp Gly Ala Leu Val Met Cys Leu Val Leu
165 170 175
Ala Val Asp Ser Tyr Gln Arg Ala Val Leu Glu Gly Arg Leu Arg Ser
180 185 190
Leu Val Trp Ala Gly Val Trp Val Gly Leu Gly Phe Gln Ala Lys Met
195 200 205
Leu Gln Ala Trp Met Ile Leu Pro Ala Leu Ala Ile Gly Tyr Leu Leu
210 215 220
Ser Ala Pro Ile Gly Leu Arg Arg Arg Leu Gln His Leu Gly Ile Ala
225 230 235 240
Gly Val Val Thr Leu Val Val Ser Leu Ser Trp Ile Thr Leu Tyr His
245 250 255
Val Thr Pro Ala Ala Asp Arg Pro Tyr Ile Ser Gly Thr Thr Asn Ser
260 265 270
Ser Ala Ala Ala Met Val Phe Gly Tyr Asn Gly Leu Gly Arg Leu Gly
275 280 285
Ile Asn Leu Pro Gly Ala Leu Pro Pro Asn Tyr Met Gly Ser Val Ile
290 295 300
Gly Pro Ala Pro Pro Lys Arg Ser Thr Gln Leu Pro Arg Pro Arg Pro
305 310 315 320
Gly Met Val Ile Pro Glu Ile Gly Ile Glu His Gly Gly Gly Trp Gly
325 330 335
Lys Leu Phe Gly Gly Arg Leu Gly Val Ala Ser Gly Trp Leu Tyr Pro
340 345 350
Leu Ala Leu Met Ala Leu Leu Cys Gly Leu Trp Trp Trp Arg Arg Ala
355 360 365
Glu Arg Thr Asp Pro Ala Arg Gly Gly Met Val Met Trp Gly Val Trp
370 375 380
Leu Leu Thr Phe Ala Leu Pro Tyr Ser Ala Val Phe Val Ile Pro His
385 390 395 400
Ser Ala Tyr Val Ala Val Leu Ala Pro Pro Val Ala Ala Leu Ser Gly
405 410 415
Ile Gly Ile Val Met Phe Trp Arg Ala Tyr Arg Ser Gly Gly Arg Met
420 425 430
Ala Trp Ile Phe Pro Leu Ala Ile Val Ala Glu Leu Ala Trp Ala Val
435 440 445
Trp Leu Trp Ser Phe Tyr Pro Thr Phe Leu Pro Trp Ala Met Trp Gly
450 455 460
Ala Val Ala Leu Gly Val Val Ala Val Val Ala Leu Ala Leu Ala Arg
465 470 475 480
Leu Val Arg Pro Arg Arg Ser Ser Leu Val Ser Ala Gly Leu Thr Ile
485 490 495
Gly Val Ala Ala Met Leu Ala Ala Pro Ala Thr Trp Ser Ala Ser Val
500 505 510
Leu Asp Pro Arg Tyr Gly Gly Ser Ser Phe Asp Ala Asn Ala Gly Pro
515 520 525
Ala Ala Arg Thr Pro Gly Gly
530 535
<210> 22
<211> 270
<212> PRT
<213> Nonomuria
<400> 22
Met Leu Gln Asp Ala Asp Arg Thr Arg Ile Leu Ala Ile Ser Pro His
1 5 10 15
Leu Asp Asp Ala Val Leu Ser Val Gly Ala Ser Leu Ala Gln Ala Glu
20 25 30
Gln Asp Gly Gly Lys Val Thr Val Phe Thr Val Phe Ala Gly Ser Ala
35 40 45
Ala Pro Pro Tyr Ser Pro Ala Ala Glu Arg Phe His Ala Arg Trp Gly
50 55 60
Leu Ser Pro Thr Glu Asp Ala Pro Leu Arg Arg Arg Asn Glu Asp Ile
65 70 75 80
Ala Ala Leu Asp Gln Leu Gly Ala Gly His Arg His Gly Arg Phe Leu
85 90 95
Asp Ala Ile Tyr Arg Arg Ser Pro Asp Gly Gln Trp Leu Leu His His
100 105 110
Asn Glu Gly Ser Met Val Arg Gln Gln Ser Pro Ala Asn Asn His Asp
115 120 125
Leu Val Ala Ala Ile Arg Glu Asp Ile Glu Ser Met Ile Ala Glu Cys
130 135 140
Asp Pro Thr Leu Val Leu Thr Cys Val Ala Ile Gly Lys His Pro Asp
145 150 155 160
His Lys Ala Thr Arg Asp Ala Thr Leu Leu Ala Ala Arg Glu Arg Gly
165 170 175
Ile Pro Leu Arg Leu Trp Gln Asp Leu Pro Tyr Ala Ala Tyr Ser Gln
180 185 190
Asp Leu Ala Glu Leu Pro Asp Gly Leu Arg Leu Gly Ser Pro Glu Leu
195 200 205
Ser Phe Val Asp Glu Glu Ala Arg Thr Arg Lys Phe Gln Ala Met Lys
210 215 220
His Tyr Ala Thr Gln Leu Ser Val Leu Asp Gly Pro Asn Lys Asn Leu
225 230 235 240
Phe Ala Lys Leu Asp Glu His Ala Arg Asn Ala Ala Pro Asp Gly Gly
245 250 255
Tyr Asn Glu Thr Thr Trp Pro Val Ile Arg Tyr Ala Ala Glu
260 265 270
<210> 23
<211> 420
<212> PRT
<213> Nonomuria
<400> 23
Met Ala His Arg Leu Arg Arg Leu Thr Thr Ala Phe Arg Ser Val Arg
1 5 10 15
Leu Arg Leu Thr Leu Val Tyr Gly Ala Leu Phe Ala Ala Ser Gly Val
20 25 30
Val Leu Leu Ala Ile Thr Tyr Leu Leu Phe Arg Gly Ser Arg Pro Phe
35 40 45
Val Leu Val Asp Gly Asp Pro Gly Gly Arg Phe Arg Ala Phe Ala Arg
50 55 60
Gln Gln Gln Ala Ala Ile Leu Glu Asn Leu Leu Phe Gln Ser Leu Ile
65 70 75 80
Ala Leu Ala Leu Met Thr Val Ile Ser Phe Leu Leu Gly Trp Leu Val
85 90 95
Ala Gly Arg Met Leu Arg Pro Leu Arg Thr Met Asn Thr Thr Leu Lys
100 105 110
Arg Ile Ser Ala Arg Asn Val His Glu Arg Leu Ala Leu Pro Gly Pro
115 120 125
Arg Asp Glu Leu Arg Asn Leu Ala Asp Thr Val Asp Glu Leu Leu Glu
130 135 140
Arg Leu His Ser Ala Leu Asp Ala Gln Lys Arg Phe Val Ala Asn Ala
145 150 155 160
Ala His Glu Leu Arg Thr Pro Leu Thr Leu Glu His Ala Leu Leu Glu
165 170 175
Glu Ser Leu Leu His Arg Asp Ala Asp Thr Pro Ser Met Arg Ser Ile
180 185 190
Met Glu Arg Leu Leu Asp Leu Ser Arg Gln Gln Gly Arg Leu Leu Glu
195 200 205
Ser Leu Leu Thr Leu Ala Lys Ser Glu Gly Gly Leu Asp His Arg Glu
210 215 220
Pro Leu Asp Leu Ala Glu Ile Ala Glu His Thr Ile Arg Thr Met Glu
225 230 235 240
Gly Thr Gly Pro Gly Ala Asp Gly Asn Asn Pro Arg Ala Gly Val Ser
245 250 255
Ala Asp Arg Arg Ala Asp Gly Asn Ser Pro Thr Ala Gly Ala Ala Thr
260 265 270
Asp Ser Trp Ala Asp Gly Lys Ser Leu Arg Ala Gly Cys Pro His Pro
275 280 285
Arg Leu Val Thr Gly Ile Ala His Ala Pro Thr Thr Gly Asp Pro Ala
290 295 300
Leu Val Glu Arg Leu Ile Thr Asn Leu Leu Asp Asn Ala Met Arg Tyr
305 310 315 320
Asn Val Pro Gly Gly Gln Val Glu Leu Ser Thr Arg Ala Glu Ala Gly
325 330 335
Lys Ala Val Val Ser Ile Ala Asn Thr Gly Pro Val Val Pro Pro Glu
340 345 350
Gln Val His Arg Leu Phe Glu Pro Phe Gln Arg Leu Asp Arg Thr Arg
355 360 365
Ala Asp Asp His His Gly Leu Gly Leu Ser Ile Val Arg Ala Ile Ala
370 375 380
Val Ala His Asp Ala Thr Leu Thr Ala His Ala Arg Pro Gln Gly Gly
385 390 395 400
Leu Ser Val Glu Ile His Phe Pro Leu Met Arg Arg Ala Leu Arg Arg
405 410 415
Leu Ala Pro Ser
420
<210> 24
<211> 709
<212> PRT
<213> Nonomuria
<400> 24
Met Ser Leu Pro Thr Cys Ala Cys Gly Leu Thr Pro His Ala Pro Ser
1 5 10 15
Cys Ala Pro Arg Ser Glu His Ala Gly Gly Arg Ser Ser Glu Ser Arg
20 25 30
Thr Asp Ile Gln Gly Leu Arg Ala Ile Ala Val Ala Ala Val Val Ala
35 40 45
Phe His Leu Trp Pro Gly Gly Pro Thr Gly Gly Tyr Val Gly Val Asp
50 55 60
Val Phe Phe Val Ile Ser Gly Tyr Leu Ile Thr Ser His Leu Leu Arg
65 70 75 80
Gln Pro Gly His Gly Gly Gly Arg Leu Leu Asp Phe Trp Ala Arg Arg
85 90 95
Val Arg Arg Leu Ile Pro Ala Ala Ser Leu Ala Leu Leu Val Thr Leu
100 105 110
Ala Ala Ser Val Val Trp Leu Pro Leu Thr Val Leu Gly Thr Ala Ala
115 120 125
Arg Glu Val Ile Ala Ala Thr Val Tyr Val Glu Asn Leu Arg Leu Ala
130 135 140
Leu Thr Gln Ala Asn Tyr Leu Asp Val Asp Gln Pro Asp Trp Pro Ala
145 150 155 160
Gln His Tyr Trp Ser Leu Ser Ile Glu Glu Gln Phe Tyr Leu Gly Trp
165 170 175
Pro Leu Leu Leu Gly Ser Ala Ala Trp Leu Ala Ala Arg Val Ala Arg
180 185 190
Gly Arg Arg Pro Pro Glu Asn Phe Thr Arg Trp Ser Ala Val Val Val
195 200 205
Thr Gly Ala Val Val Ala Ala Ser Leu Ala Trp Ser Val Gln Lys Thr
210 215 220
Ala Thr Asp Pro Ala Ala Ala Tyr Phe Val Ser Thr Thr Arg Phe Trp
225 230 235 240
Glu Leu Ala Leu Gly Gly Leu Leu Ala Ala Val Leu Thr Val Arg Ala
245 250 255
Met Pro Arg Ala Arg Ala Val Arg Ala Gly Leu Ala Trp Ala Gly Leu
260 265 270
Gly Met Ile Gly Trp Ala Val Val Arg Phe Asp Ala Glu Thr Ala Phe
275 280 285
Pro Gly Ala Ala Ala Leu Val Pro Thr Val Gly Ala Cys Leu Val Ile
290 295 300
Ala Ala Ala Ala Asp Gly Leu Arg Gly Gly Pro Gly Arg Ala Leu Ala
305 310 315 320
Trp Arg Pro Val Gln Trp Leu Gly Asn Ala Ser Tyr Ala Val Tyr Leu
325 330 335
Trp His Trp Pro Pro Ile Met Ile Leu Pro Tyr Ala Leu Gly Arg Ser
340 345 350
Leu Thr Val Ile Glu Ser Val Gly Val Ile Ala Leu Thr Leu Val Leu
355 360 365
Ala Ala Leu Ser Gln Tyr Leu Val Glu Asp Arg Leu Arg Trp His Pro
370 375 380
Val Leu Val Arg Ser Arg Arg Leu Thr Phe Ala Met Leu Ala Ser Cys
385 390 395 400
Val Val Val Val Ala Gly Ala Gly Ala Gly Val Val Ala Tyr Ala Asp
405 410 415
Ala Ala Glu Arg Thr Glu Ser Ala Ala Phe Glu Ala Ala Ala Ser Arg
420 425 430
Ala Gly Ser Cys Leu Gly Ala Gly Val Val Arg Asp Pro Ala Cys Gln
435 440 445
Asp Leu Gly Leu Leu Met Pro Pro Gln Val Ala Leu Lys Asp Lys Pro
450 455 460
Ala Val Tyr Ala Asp Gly Cys Val Asn Lys Glu Pro Phe Ile Ala Arg
465 470 475 480
Asn Thr Cys Thr Tyr Gly Pro Asp Ala Ala Gly Arg Arg Ile Ala Leu
485 490 495
Val Gly Asn Ser His Ala Gly His Trp Val Pro Ala Leu Glu Lys Ala
500 505 510
Leu Trp Ser Glu Arg Trp Gln Leu Thr Thr Tyr Val Gln Leu Ala Cys
515 520 525
Tyr Thr Val Asp Gln Pro Leu Val Leu Glu Gly Ala Gly Val Ser Glu
530 535 540
Asn Cys Gln Lys Ile Asn Lys Trp Ala Val Gly Ser Ile Val Asn Gly
545 550 555 560
Gly Tyr Asp Leu Val Ile Met Ser Asn Arg Thr His Val Pro Leu Ala
565 570 575
Gly Val Ser Pro Ala Gly Gln Gln Ala Ala Ala Glu Arg Ala Tyr Arg
580 585 590
Asp Thr Leu Arg Ala Phe Thr Gly Ala Gly Leu Pro Val Leu Val Leu
595 600 605
Arg Asp Thr Pro Ala Met Pro Asp Ser Val Pro His Cys Ile Ala Lys
610 615 620
His Pro Asp Asp Leu Asp Ser Cys Gly Gly Pro Ala Gly Val Val Leu
625 630 635 640
Arg Pro Asp Pro Leu Ala Ala Ala Ala Arg Ala Asp Asp Thr Gly Leu
645 650 655
Val Ser Val Ala Ser Val Asp His Leu Val Cys Gly Glu Arg Cys Gly
660 665 670
Pro Val Ile Gly Gly Leu Ile Ala Tyr Ser Asp Arg Ser His Leu Thr
675 680 685
Thr Thr Phe Ala Arg Thr Leu Ala Pro Glu Val Thr Ala Ala Val Arg
690 695 700
Gly Ala Leu Thr Arg
705
<210> 25
<211> 648
<212> PRT
<213> Nonomuria
<400> 25
Met Ala Ile Val Ser Pro Phe Gly Gly Leu Leu Lys Gly Asp Gly Glu
1 5 10 15
Asp Asp Pro Ala Pro Ser Arg Ile Arg Pro Gly Thr Leu Arg Arg Val
20 25 30
Leu Gly Tyr Phe Arg Pro His Val Gly Lys Val Ala Leu Phe Val Leu
35 40 45
Val Thr Ala Leu Asp Ser Ile Phe Val Val Ala Ser Pro Leu Met Leu
50 55 60
Lys Asp Leu Val Asp Lys Gly Val Leu Gly Asn Asp Leu Glu Leu Val
65 70 75 80
Ile Leu Leu Ala Cys Leu Ala Ala Gly Phe Ala Val Met Ser Thr Leu
85 90 95
Leu Gln Leu Val Ser Ala Tyr Ile Ser Gly Arg Ile Gly Gln Gly Val
100 105 110
Ser Tyr Asp Leu Arg Val Gln Ala Leu Asp His Val Gln Arg Leu Pro
115 120 125
Ile Ala Phe Phe Thr Arg Thr Gln Thr Gly Val Leu Val Gly Arg Leu
130 135 140
His Thr Glu Leu Val Met Thr Gln Met Ala Phe Thr Gln Met Leu Thr
145 150 155 160
Ala Ala Ala Ser Ala Val Thr Val Leu Leu Val Leu Ala Glu Leu Phe
165 170 175
Tyr Leu Ser Trp Ile Val Ala Leu Leu Thr Leu Val Leu Ile Pro Val
180 185 190
Phe Leu Val Pro Trp Ser Tyr Val Gly Arg Arg Met Gln Arg Tyr Thr
195 200 205
Arg Gly Leu Met Glu Glu Asn Ala Gly Leu Ala Gly Leu Leu Gln Glu
210 215 220
Arg Phe Asn Val Gln Gly Ala Met Leu Ser Lys Leu Phe Gly Arg Pro
225 230 235 240
Ala Glu Glu Met Ala Glu Tyr Glu Ser Arg Ala Gly Arg Ile Arg Gly
245 250 255
Leu Ala Val Ser Val Thr Leu Tyr Gly Arg Met Ala Pro Ala Ile Phe
260 265 270
Ala Leu Met Ala Ala Leu Ala Thr Ala Leu Val Tyr Gly Val Gly Gly
275 280 285
Gly Leu Val Leu Ser Gln Ala Phe Gln Leu Gly Thr Leu Val Ala Leu
290 295 300
Ala Thr Leu Leu Gly Arg Leu Phe Gly Pro Ile Thr Gln Leu Ala Ser
305 310 315 320
Ile Gln Glu Asn Ala Leu Thr Val Leu Val Ser Phe Glu Arg Ile Phe
325 330 335
Glu Leu Leu Asp Leu Lys Pro Leu Ile Glu Glu Arg Pro Asp Ala Val
340 345 350
Ala Leu Lys Ala Gly Lys Ala Ser Asp Val Gln Phe Glu Asn Val Ser
355 360 365
Phe Arg Tyr Pro Ser Ala Asp Glu Val Ser Leu Pro Ser Leu Glu Gln
370 375 380
Asn Val Arg Thr Gly Gln Glu Arg Gly Glu Ala Thr Pro Glu Val Leu
385 390 395 400
Arg Asp Val Ser Leu His Val Pro Ala Gly Thr Leu Thr Ala Leu Val
405 410 415
Gly Pro Ser Gly Ala Gly Lys Ser Thr Leu Thr His Leu Val Ser Arg
420 425 430
Leu Tyr Asp Pro Thr Ser Gly Thr Val Arg Val Gly Gly His Asp Leu
435 440 445
Arg Asp Leu Thr Phe Asp Ser Leu Arg Glu Thr Val Gly Val Val Ser
450 455 460
Gln Asp Thr Tyr Leu Phe His Asp Thr Ile Arg Ala Asn Leu Leu Tyr
465 470 475 480
Ala Arg Pro Asp Ala Thr Glu Asp Glu Leu Val Glu Ala Cys Arg Gly
485 490 495
Ala Gln Ile Trp Asp Leu Ile Ala Ser Leu Pro Arg Gly Leu Asp Thr
500 505 510
Val Val Gly Asp Arg Gly Tyr Arg Leu Ser Gly Gly Glu Lys Gln Arg
515 520 525
Leu Ala Ile Ala Arg Leu Leu Leu Lys Ala Pro Ser Val Val Val Leu
530 535 540
Asp Glu Ala Thr Ala His Leu Asp Ser Glu Ser Glu Ala Ala Val Gln
545 550 555 560
Arg Ala Leu Thr Thr Ala Leu Arg Ser Arg Thr Ser Leu Val Ile Ala
565 570 575
His Arg Leu Ser Thr Ile Arg Glu Ala Asp His Ile Leu Val Ile Asp
580 585 590
Asp Gly Arg Val Arg Glu Arg Gly Thr His Glu Glu Leu Leu Ala Glu
595 600 605
Gly Gly Leu Tyr Ala Asp Leu Tyr His Thr Gln Phe Ala Lys Ser Gly
610 615 620
Val Asn Gly Thr Arg Pro Gly Gln Gly Asp Gly Ala Glu Pro Val Gln
625 630 635 640
Glu Val Val Gly Gly Gly Glu Arg
645
<210> 26
<211> 2097
<212> PRT
<213> Nonomuria
<400> 26
Met Ser Ala Gly Thr Arg Ala Thr Pro Thr Thr Val Leu Asp Leu Phe
1 5 10 15
Ala Arg Gln Val Gly Arg Ala Pro Asp Ala Val Ala Leu Val Asp Gly
20 25 30
Asp Arg Val Leu Thr Tyr Arg Arg Leu Asp Glu Leu Ala Gly Ala Leu
35 40 45
Ser Gly Arg Leu Ile Gly Arg Gly Val Gly Arg Gly Asp Arg Val Ala
50 55 60
Val Met Met Asp Arg Ser Ala Asp Leu Val Val Thr Leu Leu Ala Val
65 70 75 80
Trp Gln Ala Gly Ala Ala Tyr Val Pro Val Asp Ala Ala Leu Pro Ala
85 90 95
Arg Arg Val Ala Phe Met Val Ala Asp Ser Gly Ala Cys Leu Met Val
100 105 110
Cys Ser Glu Ala Thr Arg Asp Ala Val Pro Gln Gly Val Glu Ser Ile
115 120 125
Ala Leu Thr Gly Glu Gly Gly Cys Gly Thr Ser Ala Val Thr Val Asp
130 135 140
Pro Gly Asp Leu Ala Tyr Val Met Tyr Thr Ser Gly Ser Thr Gly Thr
145 150 155 160
Pro Lys Gly Val Ala Val Pro His Arg Ser Val Ala Glu Leu Thr Gly
165 170 175
Asn Pro Gly Trp Gly Val Glu Pro Gly Glu Ala Val Leu Met His Ala
180 185 190
Pro Tyr Thr Phe Asp Ala Ser Leu Phe Glu Ile Trp Val Pro Leu Val
195 200 205
Ser Gly Ala Arg Val Val Ile Ala Ala Pro Gly Ala Val Asp Ala Arg
210 215 220
Arg Leu Arg Glu Ala Val Ala Ala Gly Val Thr Arg Val His Leu Thr
225 230 235 240
Ala Gly Ser Phe Arg Ala Val Ala Glu Glu Ser Pro Glu Ser Phe Ala
245 250 255
His Phe Arg Glu Val Leu Thr Gly Gly Asp Val Val Pro Ala Tyr Ala
260 265 270
Val Gln Lys Val Arg Ala Ala Cys Pro His Val Arg Ile Arg His Leu
275 280 285
Tyr Gly Pro Thr Glu Thr Thr Leu Cys Ala Thr Trp Gln Leu Leu Glu
290 295 300
Pro Gly Asp Val Val Gly Pro Val Leu Pro Ile Gly Arg Pro Leu Pro
305 310 315 320
Gly Arg Arg Ala Trp Val Leu Asp Ala Ser Leu Arg Pro Val Glu Pro
325 330 335
Gly Val Val Gly Asp Leu Tyr Leu Ser Gly Ala Gly Leu Ala Asp Gly
340 345 350
Tyr Leu Asp Arg Ala Gly Leu Thr Ala Glu Arg Phe Val Ala Asp Pro
355 360 365
Ser Ala Ala Gly Arg Arg Met Tyr Arg Thr Gly Asp Leu Ala Gln Trp
370 375 380
Thr Ala Asp Gly Glu Leu Leu Phe Ala Gly Arg Ala Asp Asp Gln Val
385 390 395 400
Lys Val Arg Gly Phe Arg Ile Glu Pro Gly Glu Val Glu Ala Ala Leu
405 410 415
Thr Ala Gln Pro His Val Arg Glu Ala Val Val Val Ala Ile Asp Gly
420 425 430
Arg Leu Ile Gly Tyr Val Val Ala Asp Gly Asp Val Asp Pro Val Leu
435 440 445
Met Arg Arg Arg Leu Ala Ala Ser Leu Pro Glu Tyr Met Ile Pro Ala
450 455 460
Ala Leu Val Thr Leu Asp Ala Leu Pro Leu Thr Gly Ser Gly Lys Val
465 470 475 480
Asp Arg Arg Ala Leu Pro Glu Pro Asp Phe Ala Ser Ala Ala Pro Arg
485 490 495
Arg Glu Pro Gly Thr Glu Pro Glu Arg Val Leu Cys Asp Leu Phe Ala
500 505 510
Glu Leu Leu Gln Pro Glu Gly Arg Gly Val Gly Val Asp Asp Gly Phe
515 520 525
Val Glu Leu Gly Gly Asp Ser Ile Val Ala Ile Arg Leu Ala Ala Arg
530 535 540
Ala Ser Arg Val Gly Leu Leu Val Thr Pro Ala Gln Ile Phe Lys Glu
545 550 555 560
Lys Thr Pro Ala Arg Leu Ala Ala Val Ala Gly Ala Val Pro Ala Gly
565 570 575
Arg Pro Ala Asp Gly Pro Leu Ile Thr Leu Thr Ala Glu Glu Glu Ala
580 585 590
Glu Leu Ala Thr Ala Val Pro Gly Ala Glu Glu Val Trp Pro Leu Ala
595 600 605
Pro Leu Gln Glu Gly Leu Tyr Phe Gln Ala Thr Leu Asp Asp Glu Gly
610 615 620
His Asp Ile Tyr Gln Ala Gln Trp Ile Leu Glu Leu Ala Gly Pro Leu
625 630 635 640
Asp Ala Ala Arg Leu Arg Ala Ser Trp Glu Ala Val Phe Ala Arg His
645 650 655
Pro Glu Leu Arg Val Ser Phe His Arg Arg Ala Ser Gly Thr Met Leu
660 665 670
Gln Val Val Ala Gly His Val Val Leu Pro Trp Arg Glu Val Asp Leu
675 680 685
Ala Asp Ala Gly Asp Ile Asp Ala Ala Val Ala Ala Leu Ile Ser Glu
690 695 700
Glu Gln Glu Gln Arg Phe Asp Leu Ala Lys Ala Pro Leu Phe Arg Leu
705 710 715 720
Val Leu Val Arg His Gly Glu Asp Arg His Arg Leu Leu Val Val His
725 730 735
His His Ile Leu Thr Asp Gly Trp Ser Val Ala Val Ile Leu Asn Glu
740 745 750
Val Ala Glu Ala Tyr Thr Asn Gly Gly Arg Leu Pro Asp Arg Thr Gly
755 760 765
Ala Ala Ser Tyr Arg Asp Tyr Leu Ala Trp Leu Asp Arg Gln Asp Lys
770 775 780
Asp Ala Ala Arg Ala Ala Trp Gln Ala Glu Leu Ser Gly Leu Glu Gly
785 790 795 800
Pro Ala Pro Ile Ala Lys Ala Ala Thr Thr Thr Gly Ala Gly Thr Gly
805 810 815
Tyr Glu Tyr Arg Ile Ala Phe Leu Thr Pro Asp Leu His Thr Arg Leu
820 825 830
Thr Glu Leu Ala Arg Asp His Gly Leu Thr Leu Asn Thr Leu Ala Gln
835 840 845
Gly Ala Trp Ala Met Val Leu Ala Arg Leu Ala Arg Arg Thr Asp Val
850 855 860
Val Phe Gly Thr Thr Val Ala Cys Arg Pro Ala Glu Leu Pro Glu Val
865 870 875 880
Glu Ser Val Pro Gly Leu Met Met Asn Thr Val Pro Val Arg Val Pro
885 890 895
Leu Gln Gly Ala Gln Ser Val Val Asp Leu Leu Thr Gly Leu Gln Glu
900 905 910
Arg Gln Ala Ala Leu Leu Pro His Gln His Leu Gly Leu Thr Glu Ile
915 920 925
Gln Arg Ala Ala Gly Pro Gly Ala Thr Phe Asp Thr Leu Leu Val Phe
930 935 940
Glu Asn Tyr Pro Arg Asp Phe Ala Gly Gln Phe Thr Tyr Leu Gly Thr
945 950 955 960
Ile Glu Gly Thr His Tyr Pro Leu Thr Leu Gly Ile Ile Pro Gly Asp
965 970 975
His Phe Arg Ile Gln Leu Val Tyr Arg Arg Gly Gln Val Gly Glu Ser
980 985 990
Val Ala Glu Ser Ile Leu Gly Trp Phe Thr Gly Ala Leu Met Thr Met
995 1000 1005
Ala Ala Asp Pro His Gly Pro Val Gly Arg Ile Gly Val Gly Glu
1010 1015 1020
Ala Arg Ala Gly Gly Ser Asp Arg Ala Met Ala Ala Gly Glu Pro
1025 1030 1035
Leu Pro Val Leu Leu Arg Arg Val Val Lys Asp Arg Pro Asp Glu
1040 1045 1050
Val Ala Val Val Asp Gly Asp Gly Glu Leu Ser Phe Gly Glu Leu
1055 1060 1065
Trp Glu Arg Ala Thr Ala Leu Ala Ala Glu Leu Arg Ala His Gly
1070 1075 1080
Ile Gly Pro Glu Ser Arg Val Ala Val Met Val Gly Arg Ser Ala
1085 1090 1095
Trp Trp Ala Val Gly Val Leu Gly Val Cys Leu Ala Gly Gly Ala
1100 1105 1110
Phe Met Pro Val Asp Pro Ala Tyr Pro Ala Glu Arg Val Arg Trp
1115 1120 1125
Ile Leu Ala Asp Ser Asp Pro Arg Leu Val Leu Cys Ala Gly Thr
1130 1135 1140
Thr Arg Glu Ala Val Pro Glu Glu Phe Ala Asp Arg Leu Val Val
1145 1150 1155
Val Asp Glu Leu Asp Leu Ala Gly Ser Asp Asp Ala Gly Leu Pro
1160 1165 1170
Arg Val Ser Pro Asp Asp Ala Ala Tyr Val Ile Tyr Thr Ser Gly
1175 1180 1185
Ser Thr Gly Thr Pro Lys Gly Val Val Val Ser His Ala Gly Leu
1190 1195 1200
Gly Asn Leu Ala Met Ala Gln Ile Asp Arg Phe Ala Val Ser Pro
1205 1210 1215
Ser Ser Arg Val Leu Gln Phe Ala Ala Leu Gly Phe Asp Ala Met
1220 1225 1230
Val Ser Glu Met Leu Met Ala Leu Leu Ser Gly Ala Arg Leu Val
1235 1240 1245
Met Ala Pro Glu Pro Ala Leu Pro Pro Arg Val Ser Leu Ala Glu
1250 1255 1260
Ala Leu Arg Arg Trp Glu Val Thr His Val Thr Val Pro Pro Ser
1265 1270 1275
Val Leu Ala Thr Ala Asp Ala Leu Pro Ala Gly Leu Glu Thr Val
1280 1285 1290
Val Val Ala Gly Glu Ala Cys Pro Pro Gly Leu Ala Glu Arg Trp
1295 1300 1305
Ser Ala Gly Arg Arg Leu Val Asn Ala Tyr Gly Pro Thr Glu Ala
1310 1315 1320
Thr Val Cys Ala Ala Met Ser Arg Pro Leu Thr Gly Ser Arg Glu
1325 1330 1335
Val Val Pro Ile Gly Thr Pro Ile Ala Gly Gly Arg Cys Tyr Val
1340 1345 1350
Leu Asp Ala Phe Leu Arg Pro Leu Pro Pro Gly Ile Thr Gly Glu
1355 1360 1365
Leu Tyr Val Ala Gly Ile Gly Leu Ala Arg Gly Tyr Leu Gly Arg
1370 1375 1380
Ala Ser Leu Thr Ala Glu Arg Phe Val Ala Asp Pro Phe Val Ala
1385 1390 1395
Gly Glu Arg Met Tyr Arg Thr Gly Asp Leu Ala Tyr Trp Thr Gly
1400 1405 1410
Glu Gly Glu Leu Val Phe Ala Gly Arg Asp Asp Asp Gln Val Lys
1415 1420 1425
Ile Arg Gly Tyr Arg Val Glu Pro Gly Glu Val Glu Ala Val Leu
1430 1435 1440
Ala Gly Gln Pro Gly Val Asp Gln Ala Val Val Val Ala Arg Glu
1445 1450 1455
Gly Arg Leu Leu Gly Tyr Val Val Ser Gly Gly Gly Val Asp Pro
1460 1465 1470
Val Arg Leu Arg Glu Gly Val Ala Arg Val Leu Pro Glu Tyr Met
1475 1480 1485
Val Pro Ala Ala Val Val Val Leu Gly Ala Val Pro Val Thr Ala
1490 1495 1500
Asn Gly Lys Val Asp Arg Glu Ala Leu Pro Asp Pro Gly Phe Gly
1505 1510 1515
Gly Arg Val Ser Gly Arg Glu Pro Arg Thr Glu Val Glu Arg Ala
1520 1525 1530
Leu Cys Gly Leu Phe Ala Glu Val Leu Gly Leu Pro Gly Val Thr
1535 1540 1545
Ala Val Gly Pro Asp Asp Ser Phe Phe Glu Leu Gly Gly Asp Ser
1550 1555 1560
Ile Thr Ser Met Gln Leu Ala Ser Arg Ala Arg Arg Glu Gly Met
1565 1570 1575
Leu Phe Gly Ala Arg Glu Val Phe Glu Arg Lys Thr Pro Ala Gly
1580 1585 1590
Leu Ala Ala Ile Val Asp Val Gly Gly Glu Leu Ala Ala Gly Pro
1595 1600 1605
Ala Asp Gly Val Gly Glu Ile Ala Trp Thr Pro Ile Met Arg Ala
1610 1615 1620
Leu Gly Asp Gly Ile Val Gly Ser Arg Phe Ala Gln Trp Val Val
1625 1630 1635
Leu Gly Ala Pro Pro Asp Leu Arg Ala Asp Val Val Ala Ala Gly
1640 1645 1650
Leu Ala Ala Val Val Asp Thr His Asp Val Leu Arg Leu Arg Val
1655 1660 1665
Val Asp Asp Arg Ala Gly Arg Arg Leu Ala Val Gly Glu Arg Gly
1670 1675 1680
Ser Val Asp Thr Ala Gly Leu Val Thr Arg Leu Glu Cys Gly Gly
1685 1690 1695
Arg Pro Pro Asp Glu Val Val Glu Arg Ala Val Arg Glu Ala Val
1700 1705 1710
Gly Arg Leu Asp Pro Val Ala Gly Val Met Ala Gln Ala Val Trp
1715 1720 1725
Val Asp Ala Gly Pro Ala Arg Thr Gly Arg Leu Val Val Val Val
1730 1735 1740
His His Leu Ala Val Asp Gly Met Ser Trp Arg Ile Leu Val Pro
1745 1750 1755
Asp Leu Arg Leu Ala Cys Glu Ala Val Ala Glu Gly Arg Asp Pro
1760 1765 1770
Val Leu Glu Pro Val Trp Gly Ser Phe Arg Arg Trp Ala Ala Leu
1775 1780 1785
Leu Glu Glu Ser Ala Leu Ser Arg Glu Arg Val Gly Glu Leu His
1790 1795 1800
Thr Trp Arg Thr Ile Val Asp Gln Glu Asp Arg Pro Val Gly Arg
1805 1810 1815
Arg Arg Leu Ser Ala Gly Asp Ala Ala Gly Gly Val Arg Ser Arg
1820 1825 1830
Ser Trp Val Met Ser Gly Asp Glu Ala Ser Leu Leu Val Gly Lys
1835 1840 1845
Val Pro Val Ala Phe His Cys Gly Val His Glu Val Leu Leu Ala
1850 1855 1860
Gly Leu Ala Gly Ala Val Ala Arg Trp His Gly Asp Asp Gly Val
1865 1870 1875
Leu Val Asp Val Glu Gly His Gly Arg His Pro Ala Glu Gly Met
1880 1885 1890
Asp Leu Ser Arg Thr Val Gly Trp Phe Thr Ser Met His Pro Val
1895 1900 1905
Arg Leu Asp Val Ala Gly Ile Glu Leu Ala Ala Val Pro Ala Gly
1910 1915 1920
Gly Arg Ala Ala Gly Gln Leu Leu Lys Ala Val Lys Glu Gln Ser
1925 1930 1935
Arg Ala Ala Pro Gly Asp Gly Leu Gly Tyr Gly Leu Leu Arg His
1940 1945 1950
Leu Asn Pro Glu Thr Gly Pro Val Leu Ala Ala Leu Pro Ser Pro
1955 1960 1965
Gln Ile Gly Phe Asn Tyr Met Gly Arg Phe Val Thr Val Asp Gln
1970 1975 1980
Gly Gly Ala Arg Pro Trp Gln Pro Val Gly Gly Ile Gly Gly Ser
1985 1990 1995
Leu Asp Pro Gly Met Gly Leu Pro His Ala Leu Glu Val Asn Ala
2000 2005 2010
Ile Val His Asp Arg Leu Ala Gly Pro Glu Leu Val Leu Thr Val
2015 2020 2025
Asp Trp Arg Asp Asp Leu Leu Glu Glu Thr Asp Ile Glu Arg Leu
2030 2035 2040
Cys Gln Val Trp Leu Asp Met Leu Ser Gly Leu Ser Arg Gln Ala
2045 2050 2055
Glu Asp Pro Ser Ala Gly Gly His Thr Ala Ser Asp Phe Ala Leu
2060 2065 2070
Leu Asp Leu Asp Gln Asp Glu Ile Glu Gly Phe Glu Ala Ile Ala
2075 2080 2085
Ala Glu Leu Ser Gly Gly Gln Thr Ser
2090 2095
<210> 27
<211> 1063
<212> PRT
<213> Nonomuria
<400> 27
Met Asn Thr Pro Ser Thr Pro Ala Gly Ser Ala Leu Glu Glu Val Trp
1 5 10 15
Pro Leu Ser Pro Met Gln Glu Gly Ile Leu Tyr His Ala Ala Leu Asp
20 25 30
Glu Ala Pro Asp Leu Tyr Leu Ile Gln Gln Ser Gln Ile Ile Glu Gly
35 40 45
Pro Leu Asp Thr Glu Arg Phe Arg Leu Ala Trp Glu Ser Leu Leu Asn
50 55 60
Arg His Ala Ala Leu Arg Ala Cys Phe His Arg Arg Lys Ser Gly Glu
65 70 75 80
Ser Val Gln Leu Ile Pro Arg Lys Val Pro Leu Pro Trp Ser Glu Arg
85 90 95
Asp Leu Ser Gly Leu Ser Glu Glu Asp Ala Leu Ala Glu Ala Ser Val
100 105 110
Ile Ala Glu Lys Glu Arg Ala Thr Arg Phe Asp Pro Ala Lys Pro Pro
115 120 125
Leu Leu Arg Gln Val Leu Ile Arg Phe Gly Pro Asp Lys His Cys Leu
130 135 140
Val Thr Thr Ser His His Leu Val Met Asp Gly Trp Ser Arg Ala Ile
145 150 155 160
Leu Glu Ser Glu Leu Leu Glu Leu Tyr Ala Ala Gly Gly Ala Glu Pro
165 170 175
Gly Leu Arg Pro Ala Gly Ser Tyr Arg Asp Tyr Leu Ala Trp Leu Glu
180 185 190
Arg Gln Asp Lys Glu Ala Ala Arg Ala Ala Trp Arg Ala Glu Leu Ala
195 200 205
Gly Ala Asp Arg Ser Thr Leu Gly Ile Pro Glu Ala Ser Arg Lys Thr
210 215 220
Gln Gly Gln Arg Val Arg Glu Val Leu Gly Tyr Ala Pro Asp Phe Thr
225 230 235 240
Ser Ala Leu Val Asp Phe Ala Arg Arg His Gly Leu Thr Leu Asn Thr
245 250 255
Leu Val Gln Gly Ala Trp Ala Leu Val Leu Ala Arg Leu Thr Arg Arg
260 265 270
Arg Asp Val Val Phe Gly Ala Val Val Ser Gly Arg Pro Ala Glu Val
275 280 285
Pro Gly Val Glu Gln Ala Val Gly Leu Phe Ile Asn Thr Val Pro Val
290 295 300
Arg Val Arg Leu Asp Gly Gly Gln Pro Val Ile Gln Leu Leu Thr Glu
305 310 315 320
Leu Gln Glu Arg Gln Ser Thr Leu Ile Ser His Gln His Leu Gly Leu
325 330 335
Gln Glu Ile Gln Lys Leu Ser Gly Val Ser Phe Asp Thr Val Val Ser
340 345 350
Phe Glu Asn Tyr Val Asp Pro Gly Ala Gly Pro Gly Ser Asp Arg Glu
355 360 365
Leu Arg Leu Arg Leu Lys Glu Phe His Gln Ser Ala Pro Tyr Ala Leu
370 375 380
Leu Leu Gly Ile Met Pro Gly Glu Ser Leu Gln Thr Asp Val Glu Tyr
385 390 395 400
Arg Pro Glu Leu Leu Asp Ala Arg Val Ala Lys Glu Ala Leu His Gly
405 410 415
Leu Ala Arg Val Leu Glu Arg Met Ile Ala Glu Pro Glu Thr Ala Val
420 425 430
Gly Arg Leu Asp Val Val Gly Asp Ala Gly Arg Glu Leu Val Val Glu
435 440 445
Arg Trp Asn Glu Thr Gly Asp Ala Ile Gly Ala Pro Ser Ala Val Asp
450 455 460
Leu Phe Arg Arg Gln Val Ala Arg Ala Pro Ala Ala Thr Ala Val Thr
465 470 475 480
Ala Gly Asp Leu Ala Trp Ser Tyr Ala Glu Leu Asp Glu Arg Ser Gly
485 490 495
Arg Leu Ala Arg Ala Leu Thr Glu Arg Gly Val Arg Arg Gly Asp Arg
500 505 510
Val Gly Val Val Leu Gly Arg Ser Ala Glu Val Leu Ala Ala Trp Leu
515 520 525
Gly Val Trp Lys Ala Gly Ala Ala Phe Val Pro Val Asp Pro Asp Tyr
530 535 540
Pro Ala Asp Arg Val Ala Phe Met Leu Ala Asp Ser Ala Val Ala Met
545 550 555 560
Val Val Cys Gln Glu Ala Thr Ser Gly Val Val Pro Pro Gly Tyr Gln
565 570 575
Gln Leu Leu Val Asn Asp Ala Asp Asp Gly Glu Ala Ala Leu Val Pro
580 585 590
Ile Gly Ala Asp Asp Leu Ala Tyr Val Met Tyr Thr Ser Gly Ser Thr
595 600 605
Gly Thr Pro Lys Gly Val Ala Ile Pro His Gly Gly Val Ala Ala Leu
610 615 620
Ala Gly Asp Pro Gly Trp Gly Val Gly Pro Gly Asp Ala Val Leu Met
625 630 635 640
His Ala Pro His Thr Phe Asp Ala Ser Leu Tyr Asp Val Trp Val Pro
645 650 655
Leu Val Ser Gly Ala Arg Val Met Ile Thr Glu Pro Gly Val Val Asp
660 665 670
Ala Glu Arg Leu Ala Gly His Val Ala Asp Gly Leu Thr Ala Val Asn
675 680 685
Phe Thr Ala Gly His Phe Arg Ala Leu Ala Gln Glu Ser Pro Glu Ser
690 695 700
Phe Ser Gly Leu Arg Glu Val Ala Ala Gly Gly Asp Val Val Pro Leu
705 710 715 720
Asp Val Val Glu Arg Val Arg Arg Ala Cys Pro Arg Leu Arg Val Trp
725 730 735
His Thr Tyr Gly Pro Thr Glu Thr Thr Leu Cys Ala Thr Trp Lys Ala
740 745 750
Ile Glu Pro Gly Asp Glu Val Gly Pro Val Leu Pro Ile Gly Arg Ala
755 760 765
Leu Pro Gly Arg Arg Leu Tyr Val Leu Asp Ala Phe Leu Arg Pro Leu
770 775 780
Pro Pro Gly Ile Ala Gly Asp Leu Tyr Leu Ala Gly Ala Gly Val Ala
785 790 795 800
His Gly Tyr Leu Gly Arg Ala Ser Leu Thr Ala Glu Arg Phe Val Ala
805 810 815
Asp Pro Phe Val Ala Gly Glu Arg Met Tyr Arg Thr Gly Asp Leu Ala
820 825 830
Tyr Trp Thr Gly Glu Gly Glu Leu Val Phe Ala Gly Arg Asp Asp Asp
835 840 845
Gln Val Lys Ile Arg Gly Tyr Arg Val Glu Pro Gly Glu Val Glu Ala
850 855 860
Val Leu Ala Gly Gln Pro Gly Val Asp Gln Ala Val Val Val Ala Arg
865 870 875 880
Glu Gly Arg Leu Leu Gly Tyr Val Val Ser Gly Gly Gly Val Asp Pro
885 890 895
Val Arg Leu Arg Glu Gly Val Ala Arg Val Leu Pro Glu Tyr Met Val
900 905 910
Pro Ala Ala Val Val Val Leu Gly Ala Val Pro Val Thr Ala Asn Gly
915 920 925
Lys Val Asp Arg Glu Ala Leu Pro Asp Pro Gly Phe Gly Gly Arg Val
930 935 940
Ser Gly Arg Glu Pro Arg Thr Glu Val Glu Arg Ala Leu Cys Gly Leu
945 950 955 960
Phe Ala Glu Val Leu Gly Leu Pro Gly Val Thr Ala Val Gly Pro Asp
965 970 975
Asp Ser Phe Phe Glu Leu Gly Gly Asp Ser Ile His Ser Val Lys Leu
980 985 990
Ala Ala Arg Ala Thr Arg Ala Gly Met Pro Phe Thr Val Val Glu Val
995 1000 1005
Phe Glu His Lys Thr Pro Ala Gly Leu Ala Thr Ile Val Asp Val
1010 1015 1020
Gly Gly Glu Pro Ala Ala Gly Pro Ala Asp Pro Pro Ser Asp Ser
1025 1030 1035
Asp Leu Leu Gly Leu Ala Gln Asp Glu Ile Ala Glu Phe Glu Ala
1040 1045 1050
Glu Phe Asp Asp Glu Arg His Ser Leu Arg
1055 1060
<210> 28
<211> 277
<212> PRT
<213> Nonomuria
<400> 28
Met Ile Ser Lys Ala Met His Gly Pro Ile Arg Pro Ala Arg Ala Asp
1 5 10 15
Thr Leu Leu Ala Ser Val Gly Glu Arg Gly Ile Leu Cys Asp Phe Tyr
20 25 30
Asp Glu Asn Ala Ser Glu Ile Phe Arg Asp Leu Glu Ala Asp Ala Gly
35 40 45
Gly Thr Glu Glu Ala His Gly Phe Ala Ala Leu Val Arg Pro Glu Ser
50 55 60
Gly Ala Ile Leu Glu Leu Gly Ala Gly Thr Gly Arg Leu Thr Ile Pro
65 70 75 80
Leu Leu Glu Leu Gly Trp Glu Val Thr Ala Leu Glu Leu Ser Thr Ala
85 90 95
Met Leu Thr Thr Leu Arg Thr Arg Leu Ala Asp Ala Pro Ala Asp Leu
100 105 110
Arg Asp Arg Cys Thr Leu Val His Ala Asp Met Thr Ala Phe Lys Leu
115 120 125
Gly Glu Arg Phe Gly Thr Ala Ile Leu Ser Pro Ser Thr Ile Asp Leu
130 135 140
Leu Asp Asp Ala Asp Arg Pro Gly Leu Tyr Ser Ser Val Arg Glu His
145 150 155 160
Leu Arg Pro Gly Gly Arg Phe Leu Leu Gly Met Ala Asn Pro Asp Ala
165 170 175
Ser Gly Arg Gln Glu Pro Leu Glu Arg Thr Gln Glu Phe Thr Gly Arg
180 185 190
Ser Gly Arg Arg Tyr Val Leu His Ala Lys Val Tyr Pro Ser Glu Glu
195 200 205
Ile Arg Asp Val Thr Ile His Pro Ala Asp Glu Ser Ala Asp Pro Phe
210 215 220
Val Ile Cys Val Asn Arg Phe Arg Val Ile Thr Pro Asp Gln Ile Ala
225 230 235 240
Arg Glu Leu Glu Gln Ala Gly Phe Asp Val Val Ala Arg Thr Pro Leu
245 250 255
Pro Gly Val Arg Asn His Glu Leu Val Leu Glu Ala Gln Trp Gly Ser
260 265 270
Val Glu Asp Ala His
275
<210> 29
<211> 531
<212> PRT
<213> Nonomuria
<400> 29
Met Ser Glu Glu Leu Leu Phe Leu Arg Pro Asp Thr Ile Ile Glu Pro
1 5 10 15
Leu Ala Asn Arg Phe Tyr Ala Ser Met Tyr Ala Thr Ala Pro Val Thr
20 25 30
Ala Ala Met Asn Leu Ala Phe Arg Asn Leu Pro Met Leu Glu Ser Tyr
35 40 45
Leu Ala Ser Pro Glu Trp His Phe Ala Ala Ala Arg Asp Pro Lys Phe
50 55 60
Arg Gly Gly Phe Phe Val Asn Ile Glu Glu Gln Arg Lys Asn Glu Val
65 70 75 80
Glu Ala Leu Leu Ala Ala Ile Arg Arg Asp Ser Ala Asp Val Leu Arg
85 90 95
Phe Ala Glu Ala Ile Ala Glu Ala Glu Lys Ile Ile Arg Glu Glu Ala
100 105 110
Thr Gly Tyr Asp Leu Arg Pro Leu Tyr Pro Lys Leu Pro Pro Glu Leu
115 120 125
Ser Gly Leu Val Glu Ile Ala Tyr Asp Thr Gly Asn Ala Ala Ser Leu
130 135 140
His Phe Leu Glu Pro Leu Ile Tyr Lys Ser Lys Ala Tyr Ala Glu Asp
145 150 155 160
Cys Gln Ser Val Gln Leu Ser Val Glu Thr Gly Ile Glu Arg Pro Phe
165 170 175
Val Met Ser Thr Pro Arg Leu Pro Ser Pro Asp Val Leu Glu Leu Asn
180 185 190
Ile Pro Phe Arg His Pro Gly Leu Glu Glu Leu Phe Leu Ser Arg Ile
195 200 205
Arg Pro Thr Thr Leu Ala Ala Leu Arg Glu Ala Leu Glu Leu Gly Asp
210 215 220
Ala Glu Ala Ala Arg Leu Ala Asp Leu Leu Val Pro Glu Pro Ser Leu
225 230 235 240
Ala Ser Asp Arg His Val Ala Ala Gly Ala Arg Ile Arg Tyr Trp Gly
245 250 255
His Ala Cys Leu Leu Met Gln Thr Pro Asp Val Ala Ile Met Thr Asp
260 265 270
Pro Phe Ile Ser Ala Asp Thr Asp Ala Thr Gly Arg Tyr Thr Tyr Asn
275 280 285
Asp Leu Pro Asp Arg Leu Asp Tyr Val Leu Ile Thr His Gly His Ser
290 295 300
Asp His Leu Val Pro Glu Thr Leu Leu Gln Leu Arg Gly Arg Val Gly
305 310 315 320
Thr Phe Val Val Pro Arg Thr Ser Arg Gly Asn Leu Cys Asp Pro Ser
325 330 335
Leu Ala Leu Tyr Leu Arg Ser Phe Gly Leu Pro Ala Ile Glu Val Asp
340 345 350
Asp Phe Asp Glu Ile Glu Phe Pro Gly Gly Lys Ile Val Ser Thr Pro
355 360 365
Phe Phe Gly Glu His Ala Asp Leu Asp Ile Arg Ala Lys Ser Thr Tyr
370 375 380
Trp Ile Asn Leu Gly Gly Lys Ser Ile Trp Val Gly Ala Asp Ser Ser
385 390 395 400
Gly Leu Asp Pro Val Leu Tyr Arg His Ile Arg Arg His Leu Gly Ala
405 410 415
Val Asn Ile Ala Phe Leu Gly Met Glu Cys Asp Gly Ala Pro Leu Asn
420 425 430
Trp Gln Tyr Gln Pro Phe Ile Thr Lys Ala Leu Pro Lys Lys Met Ser
435 440 445
Asp Ser Arg Lys Met Ser Gly Ser Asn Ala Glu Gln Ala Gly Ala Ile
450 455 460
Val Thr Glu Leu Gly Ala Glu Glu Ala Tyr Ile Tyr Ala Met Gly Glu
465 470 475 480
Glu Ser Trp Leu Gly His Val Met Ala Thr Ser Tyr Asn Glu Asp Ser
485 490 495
Tyr Gln Leu Gln Gln Ile Ala Glu Phe Glu Ala Trp Cys Ser Arg Lys
500 505 510
Gly Val Lys Ala Ala His Leu Leu Asp Gln His Glu Trp His Trp Ser
515 520 525
Ser Ser Arg
530
<210> 30
<211> 523
<212> PRT
<213> Nonomuria
<400> 30
Met Thr Gly Gly Thr Gly Ala Asp Ala Ala Ser Ala Gly Ala Ser Ser
1 5 10 15
Thr Arg Pro Glu Leu Arg Gly Glu Arg Cys Leu Pro Pro Ala Gly Pro
20 25 30
Val Lys Val Thr Pro Asp Asp Pro Arg Tyr Leu Asn Leu Lys Leu Arg
35 40 45
Gly Ala Asn Ser Arg Phe Asn Gly Glu Pro Asp Tyr Ile His Leu Val
50 55 60
Gly Ser Thr Gln Gln Val Ala Asp Ala Val Glu Glu Thr Val Arg Thr
65 70 75 80
Gly Lys Arg Val Ala Val Arg Ser Gly Gly His Cys Phe Glu Asp Phe
85 90 95
Val Asp Asn Pro Asp Val Lys Val Ile Ile Asp Met Ser Leu Leu Thr
100 105 110
Glu Ile Ala Tyr Asp Pro Ser Met Asn Ala Phe Leu Ile Glu Pro Gly
115 120 125
Asn Thr Leu Ser Glu Val Tyr Glu Lys Leu Tyr Leu Gly Trp Asn Val
130 135 140
Thr Ile Pro Gly Gly Val Cys Gly Gly Val Gly Val Gly Gly His Ile
145 150 155 160
Cys Gly Gly Gly Tyr Gly Pro Leu Ser Arg Gln Phe Gly Ser Val Val
165 170 175
Asp Tyr Leu Tyr Ala Val Glu Val Val Val Val Asn Lys Gln Gly Lys
180 185 190
Ala Arg Val Ile Val Ala Thr Arg Glu Arg Asp Asp Pro His His Asp
195 200 205
Leu Trp Trp Ala His Thr Gly Gly Gly Gly Gly Asn Phe Gly Val Val
210 215 220
Thr Lys Tyr Trp Met Arg Val Pro Glu Asp Val Gly Arg Asn Pro Glu
225 230 235 240
Arg Leu Leu Pro Lys Pro Pro Ala Thr Leu Leu Thr Ser Thr Val Thr
245 250 255
Phe Asp Trp Ala Gly Met Thr Glu Ala Ala Phe Ser Arg Leu Leu Arg
260 265 270
Asn His Gly Glu Trp Tyr Glu Arg Asn Ser Gly Pro Asp Ser Pro Tyr
275 280 285
Thr Gly Leu Trp Ser Gln Leu Met Ile Gly Asn Glu Val Pro Gly Met
290 295 300
Gly Glu Ser Gly Phe Met Met Pro Ile Gln Val Asp Ala Thr Arg Pro
305 310 315 320
Asp Ala Arg Arg Leu Leu Asp Ala His Ile Glu Ala Val Ile Asp Gly
325 330 335
Val Pro Pro Ala Glu Val Pro Glu Pro Ile Glu Gln Arg Trp Leu Ala
340 345 350
Ser Thr Pro Gly Arg Gly Gly Arg Gly Pro Ala Ser Lys Thr Lys Ala
355 360 365
Gly Tyr Leu Arg Lys Arg Leu Thr Asp Arg Gln Ile Gln Ala Val Tyr
370 375 380
Glu Asn Met Thr His Met Asp Gly Ile Asp Tyr Gly Ala Val Trp Leu
385 390 395 400
Ile Gly Tyr Gly Gly Lys Val Asn Thr Val Asp Pro Ala Ala Thr Ala
405 410 415
Leu Pro Gln Arg Asp Ala Ile Leu Lys Val Asn Tyr Ile Thr Gly Trp
420 425 430
Ala Asn Pro Gly Asn Glu Ala Lys His Leu Thr Trp Val Arg Lys Leu
435 440 445
Tyr Ala Asp Val Tyr Ala Glu Thr Gly Gly Val Pro Val Pro Asn Asp
450 455 460
Val Ser Asp Gly Ala Tyr Ile Asn Tyr Pro Asp Ser Asp Leu Ala Asp
465 470 475 480
Pro Gly Leu Asn Thr Ser Gly Val Pro Trp His Asp Leu Tyr Tyr Lys
485 490 495
Gly Asn His Pro Arg Leu Arg Lys Val Lys Ala Ala Tyr Asp Pro Arg
500 505 510
Asn His Phe His His Ala Leu Ser Ile Arg Pro
515 520
<210> 31
<211> 141
<212> PRT
<213> Nonomuria
<400> 31
Met Thr Ser Thr Ser Gly Arg His Leu Tyr His Arg Gln Val Arg Phe
1 5 10 15
Ser Asp Ile Asp Ala His Gly His Val Asn Asn Val Arg Phe Leu Glu
20 25 30
Tyr Leu Glu Asp Ala Trp Ile Ala Leu Tyr Leu Asp Asn Ala Gly Pro
35 40 45
Pro Gln Glu Asp Arg Asp Gly Leu Pro Ala Val Gly Phe Ala Val Val
50 55 60
Arg His Glu Ile Phe Tyr Arg Arg Pro Leu Arg Phe Arg His Gly Ser
65 70 75 80
Val Arg Val Glu Ser Trp Val Thr Lys Val Asn Arg Val Thr Cys Glu
85 90 95
Met Ala Ala Gln Ile Cys Ser Asp Gly Glu Val Phe Val Glu Ala Arg
100 105 110
Ser Met Ile Met Gly Phe Asp Thr His Thr Ala Lys Pro Arg Arg Leu
115 120 125
Thr Leu His Glu Arg Thr Phe Leu Lys Arg Tyr Leu Arg
130 135 140
<210> 32
<211> 372
<212> PRT
<213> Nonomuria
<400> 32
Met Gly Val Asp Val Ser Met Thr Thr Ser Ile Ala Ser Ala Glu Asp
1 5 10 15
Leu Ser Val Leu Thr Gly Leu Ser Glu Ile Thr Thr Phe Ala Gly Val
20 25 30
Gly Thr Ala Val Ser Ala Thr Ser Tyr Ser Gln Ala Glu Leu Leu Glu
35 40 45
Ile Leu Asp Ile Arg Asp Pro Arg Ile Arg Ser Leu Phe Leu Asn Ser
50 55 60
Ala Ile Glu Arg Arg Phe Leu Ala Leu Pro Pro Gln Gly Arg Asp Gly
65 70 75 80
Glu Arg Val Ala Glu Pro Gln Gly Asp Leu Leu Asp Lys His Lys Lys
85 90 95
Leu Ala Val Asp Met Gly Cys Arg Ala Leu Glu Ser Cys Leu Lys Ser
100 105 110
Ala Gly Ala Thr Leu Ser Asp Val Arg His Leu Cys Cys Val Thr Ser
115 120 125
Thr Gly Phe Leu Thr Pro Gly Leu Ser Ala Leu Ile Ile Arg Glu Leu
130 135 140
Gly Leu Asp Pro His Cys Ser Arg Ala Asp Ile Val Gly Met Gly Cys
145 150 155 160
Asn Ala Gly Leu Asn Ala Leu Asn Leu Val Ala Gly Trp Ser Ala Ala
165 170 175
His Pro Gly Glu Leu Ala Val Val Leu Cys Ser Glu Ala Cys Ser Ala
180 185 190
Ala Tyr Ala Leu Asp Gly Thr Met Arg Thr Ala Val Val Asn Ser Leu
195 200 205
Phe Gly Asp Gly Ser Ala Ala Leu Ala Val Val Ser Gly Asp Gly Arg
210 215 220
Ala Ala Gly Pro Arg Val Leu Lys Phe Ala Ser Tyr Val Ile Thr Asp
225 230 235 240
Ala Ile Glu Ala Met Arg Tyr Asp Trp Asp Arg Asp Gln Asp Arg Phe
245 250 255
Ser Phe Phe Leu Asp Pro Gln Ile Pro Tyr Val Val Gly Ala His Ala
260 265 270
Glu Ile Val Val Asp Lys Leu Leu Ser Gly Thr Gly Leu Arg Arg Ser
275 280 285
Asp Ile Gly His Trp Leu Val His Ser Gly Gly Lys Lys Val Ile Asp
290 295 300
Ala Ile Val Val Asn Leu Gly Leu Ser Arg His Asp Val Arg His Thr
305 310 315 320
Thr Ala Val Leu Arg Asp Tyr Gly Asn Leu Ser Ser Gly Ser Phe Leu
325 330 335
Phe Ser Tyr Glu Arg Leu Ala Gly Glu Gly Val Thr Arg Pro Gly Asp
340 345 350
Tyr Gly Val Leu Met Thr Met Gly Pro Gly Ser Thr Ile Glu Thr Ala
355 360 365
Leu Ile Gln Trp
370
<210> 33
<211> 213
<212> PRT
<213> Nonomuria
<400> 33
Met Asn Gly Glu Leu Glu Leu Ser Leu Asp Gly Thr Gln Ala Leu Thr
1 5 10 15
Ala Ser Val Glu Glu Leu Asn Gly Leu Cys Asp Arg Ala Glu Asp His
20 25 30
Arg Ala Pro Gly Pro Val Ile Val His Val Thr Gly Val Pro Arg Leu
35 40 45
Gly Trp Ser Lys Gly Leu Thr Val Gly Leu Val Ser Lys Trp Glu Arg
50 55 60
Val Val Arg Arg Phe Glu Arg Leu Gly Arg Leu Thr Val Ala Val Ala
65 70 75 80
Ser Gly Asp Cys Ala Gly Pro Ser Leu Asp Leu Leu Leu Ala Ala Asp
85 90 95
Val Arg Ile Ala Ala Pro Ala Thr Arg Leu Leu Pro Ser Trp Ala Gly
100 105 110
Gly Ala Ala Trp Pro Gly Met Ala Val Tyr Arg Leu Thr Gln Gln Ala
115 120 125
Gly Thr Gly Gly Ile Arg Arg Ala Val Leu Leu Gly Ala Pro Ile Asp
130 135 140
Ala Asp Arg Ala Leu Ala Leu Asn Leu Ile Asp Glu Val Ser Ala Asp
145 150 155 160
Pro Ala Ala Ser Leu Ala Gly Leu Ala Gly Ala Gly Asp Gly Ala Glu
165 170 175
Leu Ala Ile Arg Arg Gln Leu Met Phe Glu Ala Ser Ser Thr Thr Phe
180 185 190
Glu Asp Ala Leu Gly Ala His Leu Ala Ala Val Asp Arg Ala Leu Arg
195 200 205
Arg Glu Thr Leu Ser
210
<210> 34
<211> 434
<212> PRT
<213> Nonomuria
<400> 34
Met Thr Thr Asp Trp Pro Ala Leu Pro Pro Arg Ala Pro Leu Ala Leu
1 5 10 15
Trp Thr Leu Thr Ala Glu Ala Gln Arg Val Asp Asp Leu Leu Ala Gly
20 25 30
Leu Pro Glu Pro Pro Ala Arg Thr Ser Ala Gln Arg Asp Ala Ala Ala
35 40 45
Ser Ala Leu Asp Lys Val Arg Arg Met Arg Ala Asp Tyr Met Glu Ala
50 55 60
His Ala Glu Glu Ile Tyr Gly Glu Leu Thr Ser Gly Arg Thr Arg His
65 70 75 80
Leu Arg Ile Asp Glu Leu Val Arg Ala Ala Ala Arg Ala Tyr Pro Gly
85 90 95
Leu Val Pro Thr Asp Glu Gln Met Ala Ala Glu Arg Ala Arg Pro Gln
100 105 110
Ala Glu Lys Glu Gly Arg Glu Ile Asp Gln Gly Ile Phe Leu Arg Gly
115 120 125
Val Leu Arg Ala Pro Lys Ala Gly Pro His Leu Leu Asp Ala Met Leu
130 135 140
Arg Pro Thr Pro Arg Ala Leu Glu Leu Leu Pro Glu Phe Ile Glu Ser
145 150 155 160
Gly Glu Val Arg Met Glu Ala Val Leu Leu Arg Arg Arg Asp Gly Val
165 170 175
Ala Tyr Leu Thr Leu Cys Arg Asp Asp Cys Leu Asn Ala Glu Asp Ala
180 185 190
Gln Gln Val Asp Asp Met Glu Thr Ala Val Asp Leu Ala Leu Leu Asp
195 200 205
Pro Gln Val Arg Val Gly Leu Leu Arg Gly Gly Glu Met Ser His Pro
210 215 220
Arg Tyr Arg Gly Arg Arg Val Phe Cys Ala Gly Val Asn Leu Lys Lys
225 230 235 240
Leu Ser Ser Gly Asp Ile Ser Leu Val Asp Phe Leu Leu Arg Arg Glu
245 250 255
Leu Gly Tyr Ile His Lys Ile Val Arg Gly Val Tyr Thr Asp Gly Ser
260 265 270
Trp His Ser Lys Leu Thr Asp Lys Pro Trp Met Ala Val Val Asp Ser
275 280 285
Phe Ala Ile Gly Gly Gly Ala Gln Leu Leu Leu Val Phe Asp Gln Val
290 295 300
Leu Ala Ala Ser Asp Ser Tyr Ile Ser Leu Pro Ala Ala Thr Glu Gly
305 310 315 320
Ile Ile Pro Gly Val Ala Asn Tyr Arg Leu Thr Arg Phe Thr Gly Pro
325 330 335
Arg Ala Ala Arg Gln Met Ile Leu Gly Gly Arg Arg Ile Arg Ala Asp
340 345 350
Glu Pro Asp Ala Arg Leu Met Ile Asp Glu Val Val Pro Pro Glu Glu
355 360 365
Met Asp Ala Ala Ile Asp Arg Ala Leu Ala Arg Leu Asp Gly Asp Ala
370 375 380
Val Pro Ala Asn Arg Arg Met Leu Asn Leu Ala Glu Glu Pro Pro Glu
385 390 395 400
Ala Phe Gly Arg Tyr Leu Ala Glu Phe Ala Leu Gln Gln Ala Leu Arg
405 410 415
Ile Tyr Gly Arg Asp Val Ile Gly Lys Val Gly Arg Phe Ala Ala Gly
420 425 430
Ser Ala
<210> 35
<211> 265
<212> PRT
<213> Nonomuria
<400> 35
Met Ser Glu Pro Arg Val Arg Tyr Glu Lys Lys Glu His Val Ala His
1 5 10 15
Val Thr Met Asn Arg Pro His Val Leu Asn Ala Met Asp Arg Arg Met
20 25 30
His Glu Glu Leu Ala Glu Ile Trp Asp Asp Val Glu Ala Asp Asp Asp
35 40 45
Val Arg Thr Val Val Leu Thr Gly Ala Gly Thr Arg Ala Phe Ser Val
50 55 60
Gly Gln Asp Leu Lys Glu Arg Ala Leu Leu Asp Glu Ala Gly Thr Gln
65 70 75 80
Ala Ser Thr Phe Gly Ser Arg Gly Gln Ala Gly His Pro Arg Leu Thr
85 90 95
Asp Arg Phe Thr Leu Ser Lys Pro Val Val Ala Arg Val His Gly Tyr
100 105 110
Ala Leu Gly Gly Gly Phe Glu Leu Val Leu Ala Cys Asp Leu Val Ile
115 120 125
Ala Ser Glu Glu Ala Val Phe Gly Leu Pro Glu Val Arg Leu Gly Leu
130 135 140
Ile Pro Gly Ala Gly Gly Val Phe Arg Leu Pro Arg Gln Leu Pro Gln
145 150 155 160
Lys Val Ala Met Gly His Leu Leu Thr Gly Arg Arg Met Asp Ala Ala
165 170 175
Thr Ala Phe Arg Tyr Gly Leu Val Asn Glu Val Val Pro Leu Asp Glu
180 185 190
Leu Asp Arg Cys Val Ala Gly Trp Thr Asp Asp Leu Val Arg Ala Ala
195 200 205
Pro Leu Ser Val Arg Ala Ile Lys Glu Ala Ala Met Arg Ser Leu Asp
210 215 220
Ile Pro Leu Glu Glu Ala Phe Thr Thr Ser Tyr Pro Trp Glu Glu Arg
225 230 235 240
Arg Arg Arg Ser Gly Asp Ala Ile Glu Gly Val Arg Ala Phe Val Glu
245 250 255
Lys Arg Asp Pro Val Trp Thr Ser Arg
260 265
<210> 36
<211> 428
<212> PRT
<213> Nonomuria
<400> 36
Met Ile Pro Pro His Thr Leu Leu Val Phe Phe Val Gln Ala Ala Ala
1 5 10 15
Leu Leu Leu Leu Ala Leu Leu Leu Gly Arg Leu Ala Val Arg Leu Gly
20 25 30
Leu Ala Ala Val Val Gly Glu Leu Cys Ala Gly Val Ile Leu Gly Pro
35 40 45
Ser Val Leu Gly Gln Val Ala Pro Gly Ala Glu Gln Trp Leu Phe Pro
50 55 60
Ser Pro Ser Ser His Met Leu Asp Ala Val Gly Gln Leu Gly Val Leu
65 70 75 80
Leu Leu Ile Gly Leu Thr Gly Ala His Leu Asp Leu Arg Leu Ile Arg
85 90 95
Arg Gln Gly Ala Thr Ala Val Arg Val Ser Ala Phe Gly Leu Val Val
100 105 110
Pro Met Ala Leu Gly Ile Gly Ala Gly Leu Leu Leu Pro Ala Glu Phe
115 120 125
Arg Gly Thr Gly Gly Ser Ala Val Phe Ala Leu Phe Leu Gly Val Thr
130 135 140
Met Cys Val Ser Ser Ile Pro Val Ile Ala Lys Thr Leu Met Asp Met
145 150 155 160
Asn Leu Leu His Arg Asn Val Gly Gln Leu Thr Leu Thr Ala Gly Met
165 170 175
Ile Asp Asp Ala Phe Gly Trp Val Leu Leu Ser Val Val Thr Ala Met
180 185 190
Ala Thr Ala Gly Ala Gly Ala Gly Thr Val Val Leu Ser Ile Ala Ser
195 200 205
Leu Leu Gly Val Ile Val Phe Ser Val Val Ile Gly Arg Pro Ala Val
210 215 220
Arg Val Ala Leu Arg Thr Thr Glu Asp Gln Gly Val Ile Ala Gly Gln
225 230 235 240
Val Val Val Leu Val Leu Ala Ala Ala Ala Gly Thr His Ala Leu Gly
245 250 255
Leu Glu Pro Ile Phe Gly Ala Phe Val Ala Gly Leu Leu Val Ser Thr
260 265 270
Ala Met Pro Asn Pro Val Arg Leu Ala Pro Leu Arg Thr Val Thr Leu
275 280 285
Gly Val Leu Ala Pro Leu Tyr Phe Ala Thr Met Gly Leu Arg Val Asp
290 295 300
Leu Thr Ala Leu Ala Arg Pro Glu Val Leu Ala Val Gly Leu Leu Val
305 310 315 320
Leu Ala Leu Ala Ile Ile Gly Lys Phe Leu Gly Ala Phe Leu Gly Ala
325 330 335
Trp Thr Ser Arg Leu Ser Arg Trp Glu Ala Leu Ala Leu Gly Ala Gly
340 345 350
Met Asn Ala Arg Gly Val Ile Gln Met Ile Val Ala Thr Val Gly Leu
355 360 365
Arg Leu Gly Val Ile Thr Asp Glu Ile Phe Thr Ile Ile Ile Val Val
370 375 380
Ala Val Ile Thr Ser Leu Leu Ala Pro Pro Leu Leu Arg Leu Ala Met
385 390 395 400
Thr Arg Ile Glu Ala Thr Ala Glu Glu Glu Ala Arg Leu Leu Ala Tyr
405 410 415
Gly Leu Arg Pro Gly Glu Ala Arg Glu Asp Val Arg
420 425
<210> 37
<211> 251
<212> PRT
<213> Nonomuria
<400> 37
Met Ser Thr Trp Phe Arg Cys Phe Asp Arg Arg Pro Leu Ala Thr Met
1 5 10 15
Arg Leu Ile Cys Phe Pro His Ala Gly Gly Ser Ala Val Phe Tyr Arg
20 25 30
Asn Trp His Arg Leu Ala Ala Pro Glu Ile Glu Val His Ala Val Gln
35 40 45
Tyr Pro Gly Arg Ala Asp Arg Leu His Glu Pro Leu Val Gly Asp Ala
50 55 60
His Arg Leu Ala Glu Ser Val Gly Arg Glu Leu Arg Pro Leu Leu Asp
65 70 75 80
Arg Pro Val Ala Leu Phe Gly His Ser Met Gly Ser Leu Ile Ala Tyr
85 90 95
Glu Thr Ala Arg Leu Leu Thr Gly Ser Gly Ile Pro Pro Ala His Leu
100 105 110
Phe Val Ser Gly Gly Val Ala Ala His Asp Arg Gly Arg Leu Ala His
115 120 125
Arg Val Ala Pro Ala Ser Glu Glu Ala Leu Ile Asp Arg Leu Arg Leu
130 135 140
Leu Gly Gly Thr Asp Ala Glu Ala Leu Ala Ser Ala Glu Phe Arg Ala
145 150 155 160
Phe Ala Leu Pro Tyr Val Arg Asn Asp Phe Gln Leu Val Gln Ser Tyr
165 170 175
Arg His Thr Pro Gly Pro Pro Leu Thr Val Pro Ile Thr Ala Phe Thr
180 185 190
Gly Ala Asp Asp Pro Val Val Arg Leu Asp Ala Val Ala Arg Trp Ala
195 200 205
Glu Leu Thr Ala Arg Glu Phe Ser Cys His Val Leu Pro Gly Gly His
210 215 220
Phe Phe Leu Gly His Glu Gln Ala Ala Leu Trp Ala His Leu His Ala
225 230 235 240
Arg Leu Gly Ile Ala Thr Pro Ala His Cys Gly
245 250
<210> 38
<211> 428
<212> PRT
<213> Nonomuria
<400> 38
Met Asp Ser His Val Leu Ala His Gln Leu Ser Lys Glu Thr Leu His
1 5 10 15
Gly Ser Leu Met Asp Pro Ala Ile Glu Ser Met Asn Leu Leu Asn Glu
20 25 30
Ile Ala Gly Asn Tyr Pro Asp Ala Ile Ser Met Ala Ala Gly Arg Pro
35 40 45
Tyr Glu Glu Phe Phe Asp Val Gly Leu Ile His Asp Tyr Leu Glu Ala
50 55 60
Tyr Arg Asp His Leu Arg Asn Asp Arg Arg Met Asp Asp Ala Gly Ile
65 70 75 80
Ser Arg Met Leu Phe Gln Tyr Gly Thr Thr Lys Gly Ile Ile Ser Asp
85 90 95
Leu Val Ala Arg His Leu Ala Glu Asp Glu Asn Ile Glu Ala Asp Pro
100 105 110
Ala Ser Val Val Ile Thr Val Gly Phe Gln Glu Ala Met Phe Leu Val
115 120 125
Leu Arg Ala Leu Arg Ala Asn Glu Arg Asp Val Leu Leu Ala Pro Thr
130 135 140
Pro Thr Tyr Val Gly Leu Thr Gly Ala Ala Leu Leu Thr Asp Thr Pro
145 150 155 160
Val Trp Pro Val Gln Ser Thr Asp Asn Gly Ile Asp Leu Asp His Leu
165 170 175
Glu His Gln Leu Lys Arg Ala Gln Asp Gln Gly Ala Arg Val Arg Ala
180 185 190
Cys Tyr Val Thr Pro Asn Phe Ala Asn Pro Thr Gly Thr Ser Met Asp
195 200 205
Leu Pro Ala Arg His Arg Leu Leu Glu Val Ala Ala Ala His Gly Ile
210 215 220
Leu Ile Leu Glu Asp Asn Ala Tyr Gly Leu Leu Gly Gln Asp Arg Leu
225 230 235 240
Pro Thr Leu Lys Ser Leu Asp His Ala Ala Thr Val Val Tyr Leu Gly
245 250 255
Ser Phe Ala Lys Thr Gly Met Pro Gly Ala Arg Val Gly Tyr Val Val
260 265 270
Ala Asp Gln His Val Ala Gly Gly Gly Ser Leu Ala Asp Glu Leu Ala
275 280 285
Lys Leu Lys Gly Met Leu Thr Val Asn Thr Ser Pro Ile Ala Gln Ala
290 295 300
Val Ile Ala Gly Lys Leu Leu Arg His Asp Phe Ser Leu Ala Arg Ala
305 310 315 320
Asn Ala Arg Glu Thr Ala Ile Tyr Gln Arg Asn Leu His Leu Thr Leu
325 330 335
Asp Glu Leu Thr Arg Arg Leu Gly Ala Val Pro Gly Val Thr Trp Asn
340 345 350
Ala Pro Thr Gly Gly Phe Phe Ile Thr Val Thr Val Pro Phe Val Val
355 360 365
Asp Asp Glu Leu Leu Glu His Ala Ala Arg Asp His Gly Val Leu Phe
370 375 380
Thr Pro Met His His Phe Tyr Gly Gly Lys Asp Gly Phe Asn Gln Leu
385 390 395 400
Arg Leu Ser Ile Ser Leu Leu Asn Pro Gln Leu Ile Glu Glu Gly Val
405 410 415
Ser Arg Leu Ala Gly Leu Val Thr Ala Cys Leu Pro
420 425
<210> 39
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> PCR primer
<400> 39
atgcgcgtgt tgatctcg 18
<210> 40
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> PCR primer
<400> 40
cggctgaccg cggcgaac 18
<210> 41
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> PCR primer
<400> 41
cgtgggggtg gatgtatcga 20
<210> 42
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> PCR primer
<400> 42
tcaccattgg atcagcg 17
<210> 43
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> PCR primer
<400> 43
tcaggagacg aaccccgc 18
<210> 44
<211> 18
<212> DNA
<213> Artificial sequence
<220>
<223> PCR primer
<400> 44
gtgcacgaaa gtcccgtc 18
<210> 45
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> PCR primer
<400> 45
atggactccc acgttctc 18
<210> 46
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> PCR primer
<400> 46
tcaggggaga catgcggt 18
<210> 47
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> PCR primer
<400> 47
ttttgaattc tcaggcgatc cgtccgtct 29
<210> 48
<211> 31
<212> DNA
<213> Artifical Sequence
<400> 48
tttttctaga gcccggacac ccgggggctg a 31
<210> 49
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> PCR primer
<400> 49
tttttctaga agtcatggtg atgtgcgaca t 31
<210> 50
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> PCR primer
<400> 50
ttttaagctt atgttgcagg acgccgaccg 30
Claims (29)
- a) A40926의 합성에 필요한 폴리펩티드를 코딩하는 dbv 유전자 클러스터 (서열 1);b) dbv 유전자 클러스터 (서열 1)에 의해 코딩되는 것과 동일한 폴리펩티드를 코딩하지만 상기 dbv 유전자 클러스터의 뉴클레오티드 서열은 아닌 뉴클레오티드 서열;c) 서열 2 내지 38의 폴리펩티드를 코딩하는 dbv ORF 1 내지 37의 임의의 뉴클레오티드 서열;d) dbv ORF 1 내지 37 (서열 2 내지 38) 중 임의의 것에 의해 코딩되는 것과 동일한 폴리펩티드를 코딩하지만 상기 ORF의 뉴클레오티드 서열은 아닌 뉴클레오티드 서열로 구성되는 군으로부터 선택되는 뉴클레오티드 서열을 포함하는 단리된 핵산.
- 제1항에 있어서,e) dbv ORF 3 내지 4, 6 내지 10, 18 내지 20, 22 내지 23, 29 내지 30 및 36 (서열 4 내지 5, 7 내지 11, 19 내지 21, 23 내지 24, 30 내지 31 및 37) 중 임의의 것의 뉴클레오티드 서열;f) dbv ORF 3 내지 4, 6 내지 10, 18 내지 20, 22 내지 23, 29 내지 30 및 36 (서열 4 내지 5, 7 내지 11, 19 내지 21, 23 내지 24, 30 내지 31 및 37) 중 임의의 것에 의해 코딩되는 것과 동일한 폴리펩티드를 코딩하지만 상기 ORF의 뉴클레오티드 서열은 아닌 뉴클레오티드 서열;g) dbv ORF 3, 6 내지 9, 18 내지 20, 22 내지 23, 29 내지 30 및 36 (서열 4, 7 내지 10, 19 내지 21, 23 내지 24, 30 내지 31 및 37) 중 임의의 것에 의해 코딩되는 폴리펩티드와 아미노산 서열이 80% 이상, 바람직하게는 86% 이상, 더욱 바람직하게는 90% 이상, 가장 바람직하게는 95% 이상 동일한 폴리펩티드를 코딩하는 뉴클레오티드 서열;h) dbv ORF 4 및 10 (서열 5 및 11) 중 임의의 것에 의해 코딩되는 폴리펩티드와 아미노산 서열이 87% 이상, 바람직하게는 90% 이상, 더욱 바람직하게는 95% 이상 동일한 폴리펩티드를 코딩하는 뉴클레오티드 서열로 구성된 군으로부터 선택되는 뉴클레오티드 서열을 포함하는 단리된 핵산.
- 제2항에 있어서, dbv ORF 1, 2, 5 및 37 (서열 2, 3, 6 및 38)로 구성되며 A40926의 4-히드록시-페닐글리신 잔기의 합성에 필요한 폴리펩티드를 코딩하는 뉴클레오티드 서열 또는 이와 동일한 폴리펩티드를 코딩하지만 상기 ORF의 뉴클레오티드 서열은 아닌 뉴클레오티드 서열의 조합을 포함하는 단리된 핵산.
- 제2항에 있어서, dbv ORF 30 내지 34 및 37 (서열 31 내지 35 및 38)로 구성되며 A40926의 3,5-디히드록시-페닐글리신 잔기의 합성에 필요한 폴리펩티드를 코딩하는 뉴클레오티드 서열 또는 이와 동일한 폴리펩티드를 코딩하지만 상기 ORF의 뉴클레오티드 서열은 아닌 뉴클레오티드 서열의 조합을 포함하는 단리된 핵산.
- 제2항에 있어서, dbv ORF 16, 17, 25, 26 및 36 (서열 17 내지 18, 26 내지 27 및 37)으로 구성되며 A40926의 헵타펩티드 골격의 합성에 필요한 폴리펩티드를 코딩하는 뉴클레오티드 서열 또는 이와 동일한 폴리펩티드를 코딩하지만 상기 ORF의 뉴클레오티드 서열은 아닌 뉴클레오티드 서열의 조합을 포함하는 단리된 핵산.
- 제2항에 있어서, dbv ORF 10 (서열 11)으로 구성되며 A40926의 아미노산 3 및 6의 방향족 잔기의 염소화에 필요한 폴리펩티드를 코딩하는 뉴클레오티드 서열 또는 이와 동일한 폴리펩티드를 코딩하지만 상기 ORF의 뉴클레오티드 서열은 아닌 뉴클레오티드 서열의 조합을 포함하는 단리된 핵산.
- 제2항에 있어서, dbv ORF 28 (서열 29)로 구성되며 A40926의 아미노산 6의 티로신 잔기의 β-히드록실화에 필요한 폴리펩티드를 코딩하는 뉴클레오티드 서열 또는 이와 동일한 폴리펩티드를 코딩하지만 상기 ORF의 뉴클레오티드 서열은 아닌 뉴클레오티드 서열의 조합을 포함하는 단리된 핵산.
- 제2항에 있어서, dbv ORF 11 내지 14 (서열 12 내지 15)로 구성되며 A40926의 위치 2와 4, 4와 6, 1과 3 및 5와 7에 있는 아미노산의 방향족 잔기의 가교결합에 필요한 폴리펩티드를 코딩하는 뉴클레오티드 서열 또는 이와 동일한 폴리펩티드를 코딩하지만 상기 ORF의 뉴클레오티드 서열은 아닌 뉴클레오티드 서열의 조합을 포함하는 단리된 핵산.
- 제2항에 있어서, ORF 9, 23 및 29 (서열 10, 24 및 30)로 구성되며 A40926의 N-아실 글루쿠론아민 잔기의 첨가 및 형성에 필요한 폴리펩티드를 코딩하는 뉴클레오티드 서열 또는 이와 동일한 폴리펩티드를 코딩하지만 상기 ORF의 뉴클레오티드 서열은 아닌 뉴클레오티드 서열의 조합을 포함하는 단리된 핵산.
- 제2항에 있어서, dbv ORF 20 (서열 21)으로 구성되며 A40926의 만노실 잔기의 부착에 필요한 폴리펩티드를 코딩하는 뉴클레오티드 서열 또는 이와 동일한 폴리펩티드를 코딩하지만 상기 ORF의 뉴클레오티드 서열은 아닌 뉴클레오티드 서열의 조합을 포함하는 단리된 핵산.
- 제2항에 있어서, dbv ORF 27 (서열 28)로 구성되며 A40926의 N-메틸화에 필요한 폴리펩티드를 코딩하는 뉴클레오티드 서열 또는 이와 동일한 폴리펩티드를 코딩하지만 상기 ORF의 뉴클레오티드 서열은 아닌 뉴클레오티드 서열의 조합을 포함하는 단리된 핵산.
- 제2항에 있어서, dbv ORF 7, 18, 19, 24 및 35 (서열 8, 19 내지 20, 25 및 36)로 구성되며 A40926 또는 그의 전구체 일부를 세포질 외부로 외수송하고 생산 균주에게 A40926에 대한 내성을 부여하는데 필요한 폴리펩티드를 코딩하는 뉴클레오티드 서열 또는 이와 동일한 폴리펩티드를 코딩하지만 상기 ORF의 뉴클레오티드 서열은 아닌 뉴클레오티드 서열의 조합을 포함하는 단리된 핵산.
- 제2항에 있어서, dbv ORF 3, 4, 6 및 22 (서열 4, 5, 7 및 23)로 구성되는 dbv 유전자 클러스터의 하나 이상의 유전자의 발현을 조절하는데 필요한 폴리펩티드를 코딩하는 뉴클레오티드 서열 또는 이와 동일한 폴리펩티드를 코딩하지만 상기 ORF의 뉴클레오티드 서열은 아닌 뉴클레오티드 서열의 조합을 포함하는 단리된 핵산.
- 제1항에 있어서, A40926의 합성에 필요한 폴리펩티드를 코딩하는 dbv 유전자 클러스터로 구성되는 뉴클레오티드 서열을 포함하며, 만노실 잔기의 부착에 필요한 폴리펩티드를 코딩하는 뉴클레오티드 서열에 인프레임 결실(in frame deletion)이 도입된 단리된 핵산.
- 제1항에 있어서, dbv ORF 1 내지 37 (서열 2 내지 38)의 뉴클레오티드 서열 또는 상기 dbv ORF에 의해 코딩되는 것과 동일한 폴리펩티드를 코딩하지만 상기 dbv ORF의 뉴클레오티드 서열은 아닌 뉴클레오티드 서열 중 하나 이상의 여분 카피(extra copy)를 1개 이상 담지하는 뉴클레오티드 서열을 포함하는 단리된 핵산.
- 제1항 내지 제15항 중 어느 한 항에 있어서, 뉴클레오티드 서열이 DNA 서열인 단리된 핵산.
- 제1항 내지 제15항 중 어느 한 항에서 정의된 DNA 서열을 포함하는 재조합 DNA 벡터.
- 제17항에 있어서, ESAC 벡터인 재조합 벡터.
- 제17항 또는 제18항의 벡터로 형질전환된 숙주 세포.
- 제19항에 있어서, 목 악티노마이세탈레스(Actinomycetales), 바람직하게는 과 스트렙토스포란기아세아에(Streptosporangiaceae), 마이크로모노스포라세아에(Micromonosporaceae), 슈도노카르디아세아에(Pseudonocardiaceae) 또는 스트렙토마이세타세아에(Streptomycetaceae), 더욱 바람직하게는 속 노노무레아에(Nonomureae), 악티노플라네스(Actinoplanes), 아미콜라토프시스(Amycolatopsis), 스트렙토마이세스(Streptomyces) 등에 속하는 형질전환된 숙주 세포.
- a) 생합성 경로를 이용하여 A40926 또는 A40926 전구체를 생산하는 미생물을 상기 경로에서의 속도 제한 활성의 발현을 코딩하는 제17항의 재조합 DNA 벡터로 형질전환하는 단계 및b) 상기 벡터로 형질전환된 상기 미생물을 세포 성장, 상기 유전자의 발현 및 상기 항생제 또는 항생제 전구체의 생산에 적합한 조건하에 배양하는 단계를 포함하는, 생합성 경로를 이용하여 A40926 또는 그의 전구체를 생산할 수 있는 미생물에 의한 A40926의 생산을 증가시키는 방법.
- A40926 또는 그의 전구체 또는 유도체를 생산하며 게놈 내의 A40926 생합성 유전자가 제15항에 따른 뉴클레오티드 서열의 삽입에 의해 변형된 형질전환된 미생물.
- 제22항의 형질전환된 A40926-생산 미생물을 배양하는 단계를 포함하는, A40926 또는 그의 전구체 또는 유도체의 생산 방법.
- 게놈 내에 A40926 생합성 유전자를 가지며 dbv ORF 1 내지 37 (서열 2 내지 38)로부터 선택되는 A40926 생합성 유전자들 중 하나 이상이 파괴된 형질전환된 A40926-생산 미생물.
- 제24항에 있어서, 파괴된 생합성 유전자가 만노실 잔기의 부착에 관여하는 유전자인 형질전환된 미생물.
- 제24항의 형질전환된 A40926-생산 미생물을 포함하는 A40926 전구체 또는 유도체의 생산 방법.
- a) (i) 생합성 경로를 이용하여 A40926 또는 그의 전구체와는 상이한 글리코펩티드 또는 글리코펩티드 전구체를 생산하는 미생물을 재조합 DNA 벡터로 형질전환하는 단계로서, 여기서 상기 벡터 또는 그의 일부는 상기 글리코펩티드 또는 글리코펩티드 전구체를 변형시키는 하나 이상의 폴리펩티드(들)의 발현을 코딩하는 제1항 내지 제13항 중 어느 한 항의 하나 이상의 뉴클레오티드 서열(들)을 포함하고,(ii) 상기 벡터로 형질전환된 상기 미생물을 세포 성장, 상기 유전자의 발현 및 상기 항생제 또는 항생제 전구체의 생산에 적합한 조건하에 배양하는 단계또는b) (i) 글리코펩티드 또는 글리코펩티드 전구체를 생산하지 않으며 도입된 뉴클레오티드 서열(들)을 효율적으로 발현할 수 있는 미생물 중에서 선택된 미생물을, 글리코펩티드 또는 글리코펩티드 전구체를 변형시키는 하나 이상의 폴리펩티드(들) (활성 폴리펩티드(들))을 코딩하는 제1항 내지 제13항 중 어느 한 항의 하나 이상의 뉴클레오티드 서열(들)을 포함하는 재조합 DNA 벡터로 형질전환하는 단계;(ii) 적어도 상기 활성 폴리펩티드(들)을 함유하는 상기 미생물의 세포 추출물 또는 세포 분획물을 활성 폴리펩티드(들)의 존재에 적합한 조건하에서 제조하는 단계 및(iii) 글리코펩티드 또는 글리코펩티드 전구체를 상기 세포 추출물 또는 세포 분획물에 첨가하고, 상기 혼합물을 상기 활성 폴리펩티드(들)이 상기 글리코펩티드 또는 글리코펩티드 전구체를 변형시킬 수 있는 조건하에서 인큐베이션하는 단계를 포함하는, A40926 또는 그의 전구체와는 상이한 글리코펩티드의 생산 방법.
- a) dbv ORF 1 내지 37 (서열 2 내지 38) 중 임의의 것에 의해 코딩되는 ORF 폴리펩티드, 또는 dbv ORF 1 내지 37 (서열 2 내지 38) 중 임의의 것, 바람직하게는 dbv ORF 3 내지 4, 6 내지 10, 18 내지 20, 22 내지 23, 29 내지 30 (서열 4 내지 5, 7 내지 11, 19 내지 21, 23 내지 24, 30 내지 31 및 37) 중 임의의 것에 의해 코딩되는 ORF 폴리펩티드와 아미노산 서열이 동일한 폴리펩티드;b) dbv ORF 3, 6 내지 9, 18 내지 20, 22 내지 23, 29 내지 30 및 36 (서열 4, 7 내지 10, 19 내지 21, 23 내지 24, 30 내지 31 및 37) 중 임의의 것에 의해 코딩되는 폴리펩티드와 아미노산 서열이 80% 이상, 바람직하게는 86% 이상, 더욱 바람직하게는 90% 이상, 가장 바람직하게는 95% 이상 동일한 폴리펩티드 및c) dbv ORF 4 및 10 (서열 5 및 11) 중 임의의 것에 의해 코딩되는 폴리펩티드와 아미노산 서열이 87% 이상, 바람직하게는 90% 이상, 더욱 바람직하게는 95% 이상 동일한 폴리펩티드로부터 선택되는, A40926의 생합성 경로에 관여하는 폴리펩티드 서열을 포함하는 단리된 폴리펩티드.
- 제3항 내지 제16항 중 어느 한 항의 핵산 중 임의의 것에 의해 코딩되는 폴리펩티드로부터 선택되는, A40926의 생합성 경로에 관여하는 폴리펩티드를 포함하는 단리된 폴리펩티드.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP02023597.4 | 2002-10-23 | ||
EP20020023597 EP1413626A1 (en) | 2002-10-23 | 2002-10-23 | Genes and proteins for the biosynthesis of the glycopeptide antibiotic A40926 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20050050146A true KR20050050146A (ko) | 2005-05-27 |
Family
ID=32050001
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020057007012A KR20050050146A (ko) | 2002-10-23 | 2003-10-15 | 글리코펩티드 항생제 a40926의 생합성을 위한 유전자및 단백질 |
Country Status (8)
Country | Link |
---|---|
US (1) | US20080145892A1 (ko) |
EP (2) | EP1413626A1 (ko) |
JP (1) | JP2006516885A (ko) |
KR (1) | KR20050050146A (ko) |
CN (1) | CN1732263A (ko) |
AU (1) | AU2003294693A1 (ko) |
CA (1) | CA2501393A1 (ko) |
WO (1) | WO2004038025A2 (ko) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102234675B (zh) * | 2010-04-29 | 2014-08-27 | 上海医药工业研究院 | 野野村放线菌发酵生产a40926的发酵培养基以及发酵方法 |
CN103361345B (zh) * | 2013-06-15 | 2016-05-04 | 福州大学 | 重组调控生物元器件强化次级代谢产物生物合成的方法 |
CN109988224B (zh) * | 2014-05-30 | 2022-12-13 | 四川大学 | 具抗菌活性的多肽及其应用 |
CN105671110B (zh) * | 2015-05-05 | 2019-02-01 | 重庆乾泰生物医药有限公司 | 一种生产达巴万星前体a40926的方法 |
MA46717A (fr) * | 2016-10-11 | 2019-09-11 | Bluebird Bio Inc | Variantes de l'endonucléase homing tcra |
CN107226845B (zh) * | 2017-05-31 | 2020-10-09 | 成都雅途生物技术有限公司 | 一种抗多重耐药菌的化合物yt-011及其制备方法 |
CN109946398B (zh) * | 2019-03-28 | 2022-05-24 | 丽珠集团新北江制药股份有限公司 | 一种检测达巴万星及其杂质的方法 |
CN112430608B (zh) * | 2020-12-04 | 2022-03-25 | 浙江大学 | 一种构建奥利万星前体高产工程菌的方法及应用 |
CN112625925B (zh) * | 2021-01-08 | 2022-04-19 | 浙江大学 | 一种达巴万星前体a40926b0高产菌株及应用 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB8425685D0 (en) * | 1984-10-11 | 1984-11-14 | Lepetit Spa | Antibiotic a 40926 complex |
GB8621912D0 (en) * | 1986-09-11 | 1986-10-15 | Lepetit Spa | Increasing ratio of components of anti-biotic complex |
JP2002518045A (ja) | 1998-06-23 | 2002-06-25 | バイオサーチ・イタリア・ソチエタ・ペル・アチオニ | 天然物を生産する能力を適当な生産宿主中に移す方法 |
-
2002
- 2002-10-23 EP EP20020023597 patent/EP1413626A1/en not_active Withdrawn
-
2003
- 2003-10-15 US US10/532,567 patent/US20080145892A1/en not_active Abandoned
- 2003-10-15 EP EP03785622A patent/EP1578972A2/en not_active Withdrawn
- 2003-10-15 CN CNA2003801074110A patent/CN1732263A/zh active Pending
- 2003-10-15 KR KR1020057007012A patent/KR20050050146A/ko not_active Application Discontinuation
- 2003-10-15 CA CA002501393A patent/CA2501393A1/en not_active Abandoned
- 2003-10-15 WO PCT/EP2003/011398 patent/WO2004038025A2/en active Application Filing
- 2003-10-15 AU AU2003294693A patent/AU2003294693A1/en not_active Abandoned
- 2003-10-15 JP JP2004545854A patent/JP2006516885A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
CA2501393A1 (en) | 2004-05-06 |
WO2004038025A2 (en) | 2004-05-06 |
CN1732263A (zh) | 2006-02-08 |
JP2006516885A (ja) | 2006-07-13 |
US20080145892A1 (en) | 2008-06-19 |
WO2004038025A3 (en) | 2004-07-29 |
EP1413626A1 (en) | 2004-04-28 |
EP1578972A2 (en) | 2005-09-28 |
AU2003294693A1 (en) | 2004-05-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101573536B1 (ko) | 악티노플레인스 가르바디넨시스 및 악티노플레인스리구리애로부터의 란티바이오틱 생합성 유전자 클러스터 | |
AU2008285655B2 (en) | Thiopeptide precursor protein, gene encoding it and uses thereof | |
US20140038297A1 (en) | Genes and Proteins for the Biosynthesis of the Lantibiotic 107891 | |
NZ508326A (en) | A polyketide synthase and non ribosomal peptide synthase genes, isolated from a myxobacterium, necessary for synthesis of epothiones A and B | |
KR20100039443A (ko) | 답토마이신 생합성 유전자 클러스터에 관련된 조성물 및 방법 | |
KR20050050146A (ko) | 글리코펩티드 항생제 a40926의 생합성을 위한 유전자및 단백질 | |
US6825013B2 (en) | Isolation of biosynthesis genes for pseudo-oligosaccharides from Streptomyces glaucescens GLA.O, and their use | |
US20050170411A1 (en) | Genes and proteins involved in the biosynthesis of enediyne ring structures | |
CA2386587C (en) | Genes and proteins for the biosynthesis of anthramycin | |
EP0682706B1 (en) | Novel compounds | |
RU2441915C9 (ru) | Гены и белки для биосинтеза лантибиотика 107891 | |
EP1460085A1 (en) | Genes and proteins for the biosynthesis of the glycopeptide antibiotic teicoplanin | |
CA2445692A1 (en) | Compositions, methods and systems for the discovery of enediyne natural products | |
US20040033581A1 (en) | Dual condensation/epimerization domain in non-ribosomal peptide synthetase systems | |
CA2412627A1 (en) | Genes and proteins involved in the biosynthesis of lipopeptides |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
WITN | Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid |