CN1732263A - 生物合成糖肽类抗生素a40926的基因及蛋白 - Google Patents

生物合成糖肽类抗生素a40926的基因及蛋白 Download PDF

Info

Publication number
CN1732263A
CN1732263A CNA2003801074110A CN200380107411A CN1732263A CN 1732263 A CN1732263 A CN 1732263A CN A2003801074110 A CNA2003801074110 A CN A2003801074110A CN 200380107411 A CN200380107411 A CN 200380107411A CN 1732263 A CN1732263 A CN 1732263A
Authority
CN
China
Prior art keywords
ala
leu
arg
nucleotide sequence
gly
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2003801074110A
Other languages
English (en)
Inventor
S·董纳迪奥
M·索斯奥
F·贝尔特梅提
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vicuron Pharmaceuticals LLC
Original Assignee
Vicuron Pharmaceuticals LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vicuron Pharmaceuticals LLC filed Critical Vicuron Pharmaceuticals LLC
Publication of CN1732263A publication Critical patent/CN1732263A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/36Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Actinomyces; from Streptomyces (G)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/04Antibacterial agents
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P1/00Preparation of compounds or compositions, not provided for in groups C12P3/00 - C12P39/00, by using microorganisms or enzymes
    • C12P1/06Preparation of compounds or compositions, not provided for in groups C12P3/00 - C12P39/00, by using microorganisms or enzymes by using actinomycetales

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Chemical & Material Sciences (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biotechnology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Microbiology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Oncology (AREA)
  • Communicable Diseases (AREA)
  • Public Health (AREA)
  • Mycology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

本发明涉及抗生素领域,更特别涉及编码糖肽类抗生素A40926生物合成途径的核酸分子的分离。公开内容为参与A40926生产的基因产物的功能。本发明提供编码A40926生产的全新生物合成基因、编码的多肽、含有编码所述多肽的核酸序列的重组载体、使用上述载体转化的宿主细胞以及使用该转化的宿主细胞产生糖肽类抗生素的方法,这些方法包括产生A40926、其前体、其衍生物或不同于A40926或其前体的被修饰糖肽的方法。

Description

生物合成糖肽类抗生素A40926的基因及蛋白
发明背景
放线菌因其产生结构多样并且具有生物学活性的次生代谢物而广为人知,这些次生代谢物中,许多用于商业用途(例如抗生素)。重要的代谢物不仅由链霉菌属物种(Streptomyces spp.)(研究最为详细)产生,而且也由了解较少的放线菌属产生:例如,分别使用拟无枝酸菌属(Amycolatopsis)、游动放线菌属(Actinoplanes)和糖多孢菌属(Saccharopolyspora)的物种工业化生产利福霉素、游壁菌素和红霉素。控制次生代谢物生物合成的遗传因子组织在基因簇中,所述基因簇中含有代谢物合成、调节和抗性所需的所有基因。
许多不同的次生代谢物享有共同的生物合成路径,相似的酶介入其中。聚酮化合物(Katz和McDaniel,1999)、非核糖体合成肽(Marahiel,1997)和脱氧糖(Rodriguez等人,2000)具有充分证明资料。然而,尽管具有这种相似性,但参与给定微生物中特定次生代谢物合成的基因簇的组织,并不能够推测确定。事实上,非常相似的次生代谢物的合成可以由不同组织的簇控制,特别是当相应的生产性菌株不属于相同属的时候。这类实例可见于大环内酯类抗生素中(Katz和McDaniel 1999)。另外,在放线菌内,限定相同途径酶的多重簇的出现,使生产性菌株内所需的簇的鉴定变得复杂。这一点已显示于聚酮化合物(例如Ruan等人,1997)和肽(例如Sosio等人,2000a)中,并通过基因组测序得到证实(Omura等人,2001;Bentley等人,2002)。因此,一个人不能与已知簇比较而推测得知新簇的组织、核苷酸序列、或者一致性程度。
糖肽,也因其作用机制而被称为dalbaheptides(Parenti和Cavalleri,1989),它与万古霉素和游壁菌素是目前临床使用中重要的抗生素种类,其干扰细菌细胞壁的交联。它们往往是治疗危及生命的感染最后的抗生素选择。另一方面,肠道球菌中对糖肽抗性的出现、以及对该高水平抗性可能最终在二甲氧基苯青霉素抗性的金黄色葡萄球菌(Staphylococcus aureus)中广泛传播的恐惧促进了对该类第二代药物的搜索。随着具有改善的活性、加广的抗细菌谱或更优的药物代谢动力学的半合成衍生物的发展,已获得了有希望的结果(Malabarba和Ciabatti2001)。
因此,存在经处理天然存在的化合物而获得改进的糖肽的潜力和效用。然而,糖肽是结构复杂的分子,它们的化学可及性限制在分子内很少的位置。例如,尽管很容易从糖肽中将糖化学地去除而产生相应的糖苷配基,不同的糖通过化学方法与特定位置的区域选择性附着却极为困难。已有显示糖肽中的氯化程度影响抗生素活性。类似地,糖肽中芳环的化学脱氯易于实现,而结构中所需环的选择的卤化则相对复杂。作为最后的实例,游壁菌素家族的糖肽含有连接到葡糖胺上的酰基链,所述葡糖胺在4位与芳基氨基酸附着,而万古霉素类化合物不含有酰基链。糖肽的酰化和脱酰化已有化学或通过生物转化的报导(Lancini和Cavalleri,1997),但是通常全面导致低产量。根据上文,为了获得难以或不可能通过化学方法制备的衍生物,有必要拥有可以在糖肽形成中用于改变这些步骤方向的基因和酶。由于已显示氯化程度影响糖肽生物学活性,而且可以通过改变糖肽的糖基化或酰化模式获得改进的衍生物,这一点格外有意义(Malabarba和Ciabatti,2001)。主要的化学限制之一是改变肽主链中存在的氨基酸的类型或顺序。化学上,已显示以相对低产量仅仅干预氨基酸1和3是可能的(Malabarba等人,1997)。因此非常需要使用精确设计的菌株直接通过发酵过程设计新的糖肽衍生物的通用方法。
具有吸引力的备选方法将通过设计天然存在的糖肽的生物合成过程而产生改进的抗生素。这类实例已有报导。事实上,可以从万古霉素和chloroeremomycin基因簇表达糖基转移酶后,在体外和体内选择性糖基化糖肽糖苷配基(Solenberg等人,1997;Loosey等人,2001)。然而,迄今为止没有一个得到说明的酶能够在所需位置附着于葡糖胺残基。类似地,balhimycin产生者地中海拟无枝酸菌(A.mediterranei)内所选基因的失活导致balhimycin衍生物的获得(Pelzer等人,1999)。然而,对于产生游壁菌素家族糖肽的菌株,没有对这类实验进行说明。
抗生素A40926属于糖肽游壁菌素家族(Parenti和Cavalleri,1989)。它由密切相关分子的复合物组成,其核心结构可以重导为具有刚性支架结构的七肽骨架,该刚性支架结构由氨基酸1-3、2-4和4-6之间的醚键以及氨基酸5-7之间的C-C键决定。另外,分子上存在两个糖残基和两个氯原子。A40926复合物成分的结构以下面显示的分子式代表,其中R代表[C9-C12]烷基,以因子A1(R=正癸基),因子B0(R=9-甲基癸基)以及因子B1(R=正十一烷基)为主要成分。
Figure A20038010741100091
最近将生产性菌株(以前认为是马杜拉放线菌属物种(Actinomadura sp.)ATCC39727)重新分类为野野村菌属物种(Nonomuria sp.)ATCC39727(Zhang等,1998)。除了显示固有的抗细菌活性之外,A40926也是半合成的糖肽dalbavancin的前体(以前认为是BI397或MDL 62397;Malabarba和Ciabatti,2001)。因此,其它处理A40926结构及增加其产量的工具将是非常需要的。然而,来自野野村菌属的所述簇尚无实例。因此,野野村菌属内调节A40926形成所需的基因也可以用于使生产过程最优化。
最近,参与糖肽chloroeremomycin(van Wageningen等人,1998)、balhimycin(Pelzer等人,1999)、补体结合抑制素(Chiu等人,2001)以及A47934(Pootoolal等人,2002)形成的基因簇得到说明。这些分别被指定为cep、bal、com和sta的簇,分别获得于东方拟无枝酸菌(Amycolatopsis orientalis)、地中海拟无枝酸菌(Amycolatopsis mediterranei)、淡紫灰链霉菌(Streptomyceslavendulae)和丰加链霉菌(Streptomyces toyocaensis)。这些簇为处理糖肽途径提供了几个有用的基因。然而,某些步骤不能以所述簇执行。例如,可利用的基因簇不编码能改变糖氧化状态、附着脂肪酸链或在氨基酸3的芳族部分提供氯原子的功能。本发明中也说明了所有这些功能。
抗生素生产的工业过程的设计相对成功,实现了抗生素滴度达到每升几克水平的大量发酵。这主要通过根据经验的、反复试验方法实现,缺乏理论基础。这样,新方法的发展和现有技术的改进仍然耗时并可能导致不稳定、操作不一致以及累积不必要的副产物的细菌培养物。近几年,合理的方法成功地应用于增加链霉菌属物种产生的抗生素水平,这些方法往往涉及目的基因簇之内关键调节元件的处理或途径中限速步骤的超表达。因此,编码这类簇相关调节物或合成限制步骤的基因可以成为产量改善的有效工具。然而,迄今为止在放线菌内鉴定的簇相关调节物属于几个不同的蛋白家族(Chater和Bibb1997)。即使在一个家族之内,序列一致性也有相当大的变化。因此,不能通过与其他簇的比较而预测簇相关调节物的存在、性质、数量和序列,甚至那些限定相关抗生素的簇。作为举例,泰乐菌素基因簇编码四个不同的调节物,而没有一个出现在限定相关的大环内酯类抗生素红霉素的簇内(Bate等人,1999)。类似地,不能预先确定生物合成途径中限速步骤的性质和原因。
发明概述
本发明提供在微生物内生物合成糖肽A40926所需的一组分离的多核苷酸分子。在本发明的一种形式中,多核苷酸分子选自毗邻的DNA序列(SEQ ID NO:1),该序列代表分离自野野村菌属物种ATCC39727的dbv基因簇,由37个ORF组成,这些ORE编码A40926形成所需的多肽。在SEQ ID NO:2至38中提供了由上述37个ORF编码的多肽的氨基酸序列。
本发明提供分离的核酸,该核酸包括选自下列的核苷酸序列:
a)dbv基因簇(SEQ ID NO:1),该基因簇编码A40926合成所需的多肽;
b)核苷酸序列,该核苷酸序列与dbv基因簇(SEQ ID NO:1)编码相同多肽,而不同于dbv基因簇本身的核苷酸序列;
c)dbv ORF 1至37中的任何核苷酸序列,该核苷酸序列编码多肽SEQ ID NO:2至38;
d)核苷酸序列,该核苷酸序列与dbv ORF 1至37中任何一个ORF编码相同多肽(SEQ ID NO:2至38),而不同于所述ORF的核苷酸序列。
本发明的另一个目的是提供分离的核酸,该核酸包括选自下列的核苷酸序列:
e)dbv ORF 3至4、6至10、18至20、22至23、29至30、以及36中的任何一个核苷酸序列,该序列编码SEQ ID NO:4至5、7至11、19至21、23至24、30至31、以及37中指定的多肽;
f)核苷酸序列,该核苷酸序列与dbv ORF 3至4、6至10、18至20、22至23、29至30、以及36中的任何一个编码相同的多肽(SEQID NO:4至5、7至11、19至21、23至24、30至31、以及37),而不同于所述dbv ORF的核苷酸序列;
g)核苷酸序列,该核苷酸序列编码的多肽与dbv ORF 3、6至9、18至20、22至23、29至30、以及36中的任何一个编码的多肽(SEQID NO:4、7至10、19至21、23至24、30至31、以及37)在氨基酸序列上具有至少80%、优选86%、更优选90%、最优选95%或以上的同一性;
h)核苷酸序列,该核苷酸序列编码的多肽与dbv ORF 4和10中的任何一个编码的多肽(SEQ ID NO:5和11)在氨基酸序列上具有至少87%、优选90%、更优选95%或以上的同一性。
在一个实施方案中,本发明中分离的核酸包括选自ORF 1至37(SEQID NO:2至38)的ORF组合,其编码合成A40926中4-羟苯甘氨酸(4-hydroxyphenylglycine,HPG)残基所需的多肽。在另一个实施方案中,核酸包括选自ORF 1至37(SEQ ID NO:2至38)的ORF组合,其编码合成A40926中3,5-羟苯甘氨酸(3,5-dihydroxyphenylglycine,DPG)残基所需的多肽。在另一个实施方案中,核酸包括选自ORF 1至37(SEQ ID NO:2至38)的ORF组合,其编码合成A40926中七肽骨架所需的多肽。根据另一个实施方案,在本发明的核酸中,提供选自ORF 1至37(SEQ ID NO:2至38)的ORF组合,其编码A40926中氨基酸3和6的芳族残基氯化所需的多肽。在另一个实施方案中,提供包括选自ORF 1至37(SEQ ID NO:2至38)的ORF组合的核酸,其编码A40926中氨基酸6的酪氨酸残基β-羟化所需的多肽。在另一个实施方案中,提供包括选自ORF 1至37(SEQ IDNO:2至38)的ORF组合的核酸,其编码A40926中2和4、4和6、1和3、以及5和7位氨基酸的芳族残基交联所需的多肽。根据另一个实施方案,在本发明的核酸中,提供选自ORF 1至37(SEQ ID NO:2至38)的ORF组合,其编码添加和形成N-酰基葡糖醛酸胺(N-acylglucuronamine)残基所需的多肽。在另一个实施方案中,提供包括选自ORF 1至37(SEQ ID NO:2至38)的ORF组合的核酸,其编码甘露糖残基附着所需的多肽。在另一个实施方案中,提供包括选自ORF 1至37(SEQ ID NO:2至38)的ORF组合的核酸,其编码A40926N-甲基化所需的多肽。根据另一个实施方案,提供包括选自ORF 1至37(SEQ ID NO:2至38)的ORF组合的核酸,其编码A40926输出及抗性所需的多肽。在另一个实施方案中,提供包括选自ORF 1至37(SEQID NO:2至38)的ORF组合的核酸,其编码调节dbv基因簇表达所需的多肽。在另一个实施方案中,提供包括选自SEQ ID NO:1的一个或多个DNA片段的核酸,以增强选自ORF 1至37(SEQ ID NO:2至38)中的ORF的表达水平。
本领域技术人员理解,提供编码A40926生物合成途径多肽的核苷酸序列的本发明,也提供编码衍生自这些多肽的片段的核苷酸。另外,本领域技术人员理解,由于遗传密码的简并,在SEQ ID NO:2至38中指定的相同多肽可以由ORF 1至37的天然或人工变体编码,即,由不同于ORF 1至37指定的基因组核苷酸序列,但是编码相同多肽的核苷酸序列编码。另外也应理解,可以出现SEQ ID NO:2至38中指定的多肽的天然发生或人工制造的变体,所述变体与上述初始多肽具有相同功能,但是含有非折叠或催化功能所必需的氨基酸的添加、缺失或置换,或者必需氨基酸的保守性置换。
本领域技术人员也理解,提供了A40926生物合成所需的整个簇的核苷酸序列后,本发明也提供存在于所述簇中的基因表达所需的核苷酸序列。这类调节序列包括但是不限于启动子和增强子序列、反义序列、转录终止子和抗终止子序列。这些序列用于调节存在于dbv基因簇中的基因的表达。携带所述核苷酸序列的细胞也在本发明范围内,携带的所述核苷酸序列独立于其它核苷酸序列,或与其它核苷酸序列融合。
一方面,本发明提供分离的核酸,该核酸包括编码ORF 9多肽(SEQID NO:10)、或者所述多肽天然存在的变体或衍生物的核苷酸序列,该多肽用于向糖肽抗生素前体核心结构附着N-酰基葡糖胺残基。另一方面,本发明提供核酸,该核酸包括编码ORF23多肽(SEQ ID NO:24)、或者所述多肽天然发生的变体或衍生物的核苷酸序列,该多肽用于向糖肽抗生素前体核心结构附着脂肪酸残基。另一方面,本发明提供核酸,该核酸包括编码ORF 29多肽(SEQ ID NO:30)、或者所述多肽天然发生的变体或衍生物的核苷酸序列,该多肽用于附着于糖肽抗生素前体的糖基的氧化。另一方面,本发明提供核酸,该核酸包括编码ORF 10多肽(SEQ ID NO:11)、或者所述多肽天然发生的变体或衍生物的核苷酸序列,该多肽用于核心糖肽抗生素前体中b-羟基酪氨酸和DPG残基的氯化。在另一方面,本发明提供核酸,该核酸包括编码ORF20多肽(SEQ ID NO:21)、或者所述多肽天然发生的变体或衍生物的核苷酸序列,该多肽用于向糖肽抗生素前体附着甘露糖残基。
另一方面,本发明提供核酸,该核酸包括编码由ORF 7、18、19、24和35所编码的多肽(SEQ ID NO:8、19、20、25和36)、或者所述多肽天然发生的变体或衍生物的核苷酸序列,该多肽用于糖肽抗生素或糖肽抗生素前体向细胞外的输出,以及赋予抗性。另一方面,本发明提供核酸,该核酸包括编码ORF 7多肽(SEQ ID NO:8)、或者所述多肽天然或人工发生的变体或衍生物的核苷酸序列,该多肽用于赋予生产性菌株对糖肽抗生素或糖肽抗生素前体的抗性。另一方面,本发明提供核酸,该核酸包括编码ORF 3、4、6、22和36多肽(SEQ IDNO:4、5、7、23和37)、或者所述多肽天然或人工发生的变体或衍生物的核苷酸序列,该多肽用于增加糖肽抗生素前体的产量。
在一个实施方案中,本发明提供携带核苷酸序列额外拷贝的糖肽生产性菌株,该核苷酸序列指定了至少一个选自ORF 1至37((SEQ IDNO:2至38)的任何一个中的ORF。在一个优选的实施方案中,这类糖肽生产性菌株是属于放线菌目(Actinomycetales)的任何菌株。在另一个优选的实施方案中,这类糖肽生产性菌株是野野村菌属成员。在更深一个方面,本发明提供野野村菌属菌株,该菌株在SEQ ID NO:1中指定的核苷酸序列中含有一个或多个变异,这类变异引起ORF 1至37(SEQ ID NO:2至38)中一个或多个的表达的增加或降低。
在一个优选的实施方案中,本发明提供核酸,该核酸包括由SEQ IDNO:1指定的核苷酸序列或其部分,由一个或多个载体携带,用于由另一个细胞产生A40926、一个或多个其前体或衍生物。在一个优选的实施方案中,所述核苷酸序列或其部分在单独的载体上携带。在另一个优选的实施方案中,这类载体是细菌人工染色体。另一方面,所述细菌人工染色体是ESAC载体(如WO99/63674中所说明)。在另一个优选的实施方案中,本发明提供不同于野野村菌属物种ATCC 39727的重组放线菌菌株,其含有SEQ ID NO:1指定的基因簇,所述基因簇在ESAC载体中携带,该载体整合到所述重组放线菌菌株染色体中。
一方面,本发明提供用于提高A40926生产的方法,所述方法包括下列步骤:(1)以重组DNA载体转化通过生物合成途径方法产生A40926或A40926前体的微生物,所述载体包括选自ORF 1至37(SEQ ID NO:2至38)的任何一个的DNA序列,该序列编码所述途径中的限速活性;(2)在适合细胞生长、表达所述基因以及生产所述抗生素或抗生素前体的条件下培养使用所述载体转化的微生物。
另一方面,本发明提供产生A40926衍生物的方法,所述方法包括下列步骤:(1)将选自由SEQ ID NO:1限定的核苷酸序列的片段克隆到适宜载体中,所述片段含有至少ORF 1至37(SEQ ID NO:2至38)中之一的部分,所述ORF编码多肽,该多肽催化想要绕过的生物合成步骤;(2)通过去除或置换一个或多个密码子灭活所述ORF,所述密码子指定对所述多肽的活性所必需的氨基酸;(3)使用所述重组DNA载体转化通过生物合成途径方法产生A40926或A40926前体的微生物;(4)筛选产生的转化体中所述DNA序列被突变拷贝置换从而产生断裂基因的那些重组体;以及(5)在适合细胞生长、所述途径的表达以及所述途径类似物的生产的条件下,培养所述突变细胞。
另一方面,本发明提供产生新糖肽的方法,所述方法包括下列步骤:(1)使用重组DNA载体转化通过生物合成途径方法产生不同于A40926及其前体的糖肽或糖肽前体的微生物,所述载体包括选自ORF1至37(SEQ ID NO:2至38)的一个或多个ORF,编码修饰所述糖肽或糖肽前体的一个或多个多肽的表达;(2)在适于细胞生长、表达所述基因以及产生所述抗生素或抗生素前体的条件下培养用所述载体转化的微生物。
适于采用该方法产生糖肽或糖肽前体的微生物实例是属于链霉菌属、拟无枝酸菌属、游动放线菌属、野野村菌属等的菌株。
另一方面,本发明提供另一个产生新糖肽的方法,所述方法包括下列步骤:(1)使用重组DNA载体转化微生物,所述载体包括选自ORF1至37(SEQ ID NO:2至38)的一个或多个ORF,编码一个或多个修饰糖肽或糖肽前体的多肽(活性多肽),且所述微生物选自不产生糖肽或糖肽前体、并且可以有效表达引入的ORF的微生物;(2)在适于活性多肽存在的条件下,制备所述微生物的细胞提取物或细胞级分,所述细胞提取物或细胞级分至少含有所述活性多肽;(3)向所述细胞提取物或细胞级分添加糖肽或糖肽前体,在所述活性多肽可以修饰所述糖肽或糖肽前体的条件下温育所述混合物。
适于采用该方法的微生物的实例是属于浅青紫链霉菌(Streptomyces lividans)、天蓝色链霉菌(Streptomycescoelicolor)、大肠杆菌(Escherichia coli)、枯草芽孢杆菌(Bacillus subtilis)等的菌株。
本发明的另一个方面包括分离的多肽,该多肽包括参与A40926生物合成途径的多肽序列,选自
a)由dbv ORF 1至37(SEQ ID NO:2至38)中任何一项编码的ORF多肽,或者是与由dbv ORF 1至37(SEQ ID NO:2至38)中任何一项编码,优选由dbv ORF3至4、6至10、18至20、22至23、29至30(SEQ ID NO:4至5、7至11、19至21、23至24、30至31和37)中任何一项编码的多肽氨基酸序列相同的多肽;
b)多肽,该多肽与dbv ORF 3、6至9、18至20、22至23、29至30以及36(SEQ ID NO:4、7至10、19至21、23至24、30至31以及37)中任何一项编码的多肽的氨基酸序列具有至少80%、优选86%、更优选90%、最优选95%或以上的同一性;以及
c)多肽,该多肽与dbv ORF 4和10(SEQ ID NO:5至11)中任何一项编码的多肽的氨基酸序列具有至少87%、优选90%、更优选95%或以上的同一性。
定义
术语“分离的核酸”指天然或合成来源的DNA分子,是基因组DNA或互补DNA(cDNA),可以是单链或双链。该术语也指天然或合成来源的RNA分子。
术语“核苷酸序列”指ORF的全部长度或部分长度的序列,以及在此公开的基因间区域。本发明示于序列表中的任何一个核苷酸序列是(a)编码序列,(b)从(a)转录产生的RNA分子,(c)利用密码子简并性编码相同多肽的编码序列,或(d)含有启动子、增强子、终止子和抗终止子序列的基因间区域。
术语“基因簇”、“簇”和“生物合成簇”均指定为含有所有次生代谢物合成所需基因的微生物基因组的毗邻片段。
术语“dbv”指负责野野村菌属物种ATCC39727中A40926生物合成的遗传因子。
术语“ORF”指编码一个多肽的基因组核苷酸序列。在本发明上下文中,术语ORF与“基因”同义。
术语“ORF多肽”指由ORF编码的多肽。
术语“dbv ORF”指包括于dbv基因簇之内的ORF。
术语“NRPS”指非核糖体肽合成酶,该酶是负责将氨基酸整合到次生代谢物寡肽骨架中的酶学活性的复合物。有功能的NRPS是催化一个或多个氨基酸整合到寡肽中的酶。
术语“NRPS模块”或“模块”指指导一个氨基酸向寡肽的活化、整合及可能的修饰的NRPS片段。
术语“NRPS基因”指编码NRPS的基因。
术语“次生代谢物”指通过基因簇指定的一组基因的表达、由微生物产生的生物活性物质。
术语“生产性宿主”是由供体生物衍生的基因簇指导次生代谢物形成的微生物。
术语“ESAC”指“大肠杆菌-链霉菌属人工染色体”,即在大肠杆菌宿主内携带及保持大的DNA插入片段、并可以引入及保持于放线菌属生产性宿主中的重组载体。ESAC的实例于WO99/67374中给出。
附图简述
图1.分离的DNA片段衍生于野野村菌属物种ATCC39727染色体。粗线表示在SEQ ID NO:1中说明的片段。携带所述分离的DNA片段的粘粒指定为11A5、7F3、7E9、1B1、7A2、11B9和7C7。
图2.dbv簇的基因组织。各个ORF以箭标代表,并如表1中编码。方向与图1中相同。刻度线上的数字显示序列坐标(以kb为单位)。
发明详述
A.野野村菌属dbv基因
A40926是由野野村菌属物种ATCC39727产生的密切相关糖肽抗生素的复合物。本发明提供核酸序列以及A40926生物合成的基因簇的表征。A40926基因簇以及侧翼DNA序列的物理组织报告于图1中,该图说明了野野村菌属物种ATCC39727基因组的90kb基因组片段以及一组限定这些片段的粘粒的物理图谱。控制A40926生物合成的DNA片段,指定为dbv簇,其遗传组成显示于图2中,其核苷酸序列如SEQID NO:1所报告。
可以通过与其他糖肽簇的比较及从其基因产物功能确定该簇的精确边界。因此,在左端(图1),dbv簇由dbv ORF 1划界,其编码参与HPG合成的酶HmoS(SEQ ID No:2)。在右侧,dbv簇由attL位点的残余部分划界,该部分与tRNA基因的3’末端相似,跨越SEQ ID NO:1的核苷酸71065至71138。dbv簇跨越约71,100个碱基对,含有37个ORF,指定为dbv ORF1至dbv ORF37。SEQ ID NO:1(71138碱基对)的毗邻核苷酸序列编码列于SEQ ID NO:2至38中的37个推导的蛋白。ORF1(SEQ ID NO:2)代表从翻译SEQ ID NO:1互补链上核苷酸1140至40推导的366个氨基酸。ORF2(SEQ ID NO:3)代表从翻译SEQ ID NO:1互补链上核苷酸2329至1259推导的356个氨基酸。ORF3(SEQ ID NO:4)代表从翻译SEQ ID NO:1互补链上核苷酸5161至2558推导的867个氨基酸。ORF4(SEQ ID NO:5)代表从翻译SEQ ID NO:1互补链上核苷酸6231至5266推导的321个氨基酸。ORF5(SEQ ID NO:6)代表从翻译SEQ ID NO:1核苷酸7183至8292推导的369个氨基酸。ORF6(SEQ ID NO:7)代表从翻译SEQID NO:1核苷酸8320至8973推导的217个氨基酸。ORF7(SEQ ID NO:8)代表从翻译SEQ ID NO:1核苷酸9069至9659推导的196个氨基酸。ORF8(SEQ ID NO:9)代表从翻译SEQ ID NO:1互补链上核苷酸10667至9708推导的319个氨基酸。ORF9(SEQ ID NO:10)代表从翻译SEQID NO:1互补链上核苷酸11896至10670推导的408个氨基酸。ORF10(SEQ ID NO:11)代表从翻译SEQ ID NO:1互补链上核苷酸13419至11950推导的489个氨基酸。ORF11(SEQ ID NO:12)代表从翻译SEQID NO:1互补链上核苷酸14741至13479推导的420个氨基酸。ORF12(SEQ ID NO:13)代表从翻译SEQ ID NO:1互补链上核苷酸16019至14823推导的398个氨基酸。ORF13(SEQ ID NO:14)代表从翻译SEQ ID NO:1互补链上核苷酸17163至16009推导的384个氨基酸。ORF14(SEQ ID NO:15)代表从翻译SEQ ID NO:1互补链上核苷酸18366至17185推导的393个氨基酸。ORF15(SEQ ID NO:16)代表从翻译SEQ ID NO:1互补链上核苷酸18671至18462推导的69个氨基酸。ORF16(SEQ ID NO:17)代表从翻译SEQ ID NO:1互补链上核苷酸24259至18668推导的1863个氨基酸。ORF17(SEQ ID NO:18)代表从翻译SEQ ID NO:1互补链上核苷酸36529至24278推导的4083个氨基酸。ORF18(SEQ ID NO:19)代表从翻译SEQ ID NO:1互补链上核苷酸39021至36760推导的753个氨基酸。ORF19(SEQ ID NO:20)代表从翻译SEQ ID NO:1互补链上核苷酸39851至39152推导的232个氨基酸。ORF20(SEQ ID NO:21)代表从翻译SEQ ID NO:1互补链上核苷酸41732至40125推导的535个氨基酸。ORF21(SEQ ID NO:22)代表从翻译SEQ ID NO:1互补链上核苷酸42584至41772推导的270个氨基酸。ORF22(SEQ ID NO:23)代表从翻译SEQ ID NO:1互补链上核苷酸44130至42868推导的420个氨基酸。ORF23(SEQ IDNO:24)代表从翻译SEQ ID NO:1互补链上核苷酸46355至44226推导的709个氨基酸。ORF24(SEQ ID NO:25)代表从翻译SEQ ID NO:1核苷酸46632至48578推导的648个氨基酸。ORF25(SEQ ID NO:26)代表从翻译SEQ ID NO:1核苷酸48575至54868推导的2097个氨基酸。ORF26(SEQ ID NO:27)代表从翻译SEQ ID NO:1核苷酸54865至58056推导的1063个氨基酸。ORF27(SEQ ID NO:28)代表从翻译SEQ ID NO:1核苷酸58152至58985推导的277个氨基酸。ORF28(SEQ ID NO:29)代表从翻译SEQ ID NO:1核苷酸59046至60641推导的531个氨基酸。ORF29(SEQ ID NO:30)代表从翻译SEQ ID NO:1互补链上核苷酸62445至60874推导的523个氨基酸。ORF30(SEQ IDNO:31)代表从翻译SEQ ID NO:1核苷酸62887至63312推导的141个氨基酸。ORF31(SEQ ID NO:32)代表从翻译SEQ ID NO:1核苷酸63469至64587推导的372个氨基酸。ORF32(SEQ ID NO:33)代表从翻译SEQ ID NO:1核苷酸64599至65240推导的213个氨基酸。ORF33(SEQ ID NO:34)代表从翻译SEQ ID NO:1核苷酸65237至66541推导的434个氨基酸。ORF34(SEQ ID NO:35)代表从翻译SEQID NO:1核苷酸66538至67335推导的265个氨基酸。ORF35(SEQ IDNO:36)代表从翻译SEQ ID NO:1核苷酸67332至68618推导的428个氨基酸。ORF36(SEQ ID NO:37)代表从翻译SEQ ID NO:1互补链上核苷酸69423至68685推导的251个氨基酸。ORF37(SEQ ID NO:38)代表从翻译SEQ ID NO:1核苷酸69608至70894推导的428个氨基酸。
dbv簇表现出与其他糖肽簇基本不同的组织。五个bal、cep、com、sta和dbv簇之间的比较概括于表1中。
                                                                 表1
  dbv簇   糖肽簇a   GeneBankb
  dbvORF  大小(Da)   提议的功能c   bal  cep   com   sta  最佳匹配d   条目e   概率f   来源,功能g   CDh
  ORF1  38146   对羟基扁桃酸酯氧化酶   +   +   +   +  sta,65%
  ORF2  37922   对羟基扁桃酸酯合成酶   +   +   +   +  sta,65%
  ORF3  93001   调节物   T03225   9e-90   吸水链霉菌(S.hygroscopicus)正调节物
  ORF4  35408   调节物   +   +   +  cep,81%
  ORF5  38817   预苯酸酯脱氢酶   +   +   +  cep,82%
  ORF6  23902   反应调节物   *   *  com,66%   Q03756   9e-84   天蓝色链霉菌,反应调节物CutR
  ORF7  22157   羧肽酶   S77033   8e-04   集胞蓝细菌属物种,(Synechocystis sp.)未知   VanY-型羧肽酶
  ORF8  36364   未知   无匹配
  ORF9  42916   糖基转移酶   +   +  cep,69%
  ORF10  53813   卤化酶   +   +   +   +  sta,86%
  ORF11  46610   交联氨基酸5-7   +   +   +  sta,76%
  ORF12  44026   交联氨基酸4-6   +   +   +   +  cep,84%
  dbv簇   糖肽簇a   GeneBankb
  dbvORF   大小(Da)   提议的功能c  bal  cep  com  sta   最佳匹配d   条目e   概率f   来源,功能g   CDh
  ORF13   42515   交联氨基酸1-3   +   sta,75%
  ORF14   43603   交联氨基酸2-4   +   +   +   +   bal,73%
  ORF15   7714   未知   +   +   +   +   cep,88%
  ORF16   200022   NRPS,模块7   +   +   +   +   cep,78%
  ORF17   433671   NRPS,模块4-6   +   +   +   +   sta,76%
  ORF18   79133   ABC转运蛋白   CAB89462.1   4e-58   天蓝色链霉菌,ABC转运蛋白
  ORF19   24733   ABC转运蛋白   CAB89461.1   3e-67   天蓝色链霉菌,ABC转运蛋白
  ORF20   57418   甘露糖基转移酶   CAC32663.1   6e-59   天蓝色链霉菌,未知   蛋白甘露糖基转移酶
  ORF21   29785   未知   +   +   bal,60%
  ORF22   45887   跨膜组氨酸激酶   *   *   com,54%   T30222   2e-49   吸水链霉菌,传感器蛋白激酶
  ORF23   74849   酰基转移酶   NP_103545.1   1e-58   百脉根中间根瘤菌(M.loti)可能的酰基转移酶   酰基转移酶3家族
  ORF24   69894   ABC转运蛋白   +   +   +   sta,76%
  ORF25   221820   NRPS,模块1-2   +   +   +   +   sta,74%
  ORF26   113832   NRPS,模块3   +   +   +   +   sta,74%
  ORF27   30307   甲基转移酶   +   +   cep,58%
  dbv簇   糖肽簇a   GeneBankb
  dbvORF   大小(Da)   提议的功能c   bal   cep  com   sta   最佳匹配d   条目e   概率f   来源,功能g   CDh
  ORF28   59291   β-羟化酶   +   sta,81%
  ORF29   56959   己糖氧化酶   NP_630371.1   e-126   天蓝色链霉菌,假定的分泌性氧化还原酶
  ORF30   16502   未知   NP_626911.1   2e-18   天蓝色链霉菌,假想的   4-羟基苯甲酰辅酶A硫酯酶
  ORF31   39458   3,5-二羟苯基乙酰辅酶A合酶   +   +   +   bal,89%
  ORF32   22178   增强3,5-二羟苯基乙酰辅酶A合酶活性   +   +   +   bal,77%
  ORF33   47840   3,5-二羟苯基乙酰辅酶A加氧酶   +   +   +   bal,82%
  ORF34   29396   增强3,5-二羟苯基乙酰辅酶A合酶活性   +   +   +   cep,88%
  ORF35   44118   膜内在离子转运蛋白   +   +   +   +   bal,60%
  ORF36   26133   II型硫酯酶   AAG52991.1   2e-25   地中海拟无核酸菌RifR,硫酯酶
  ORF37   46605   氨基转移酶   +   +   +   +   cep,79%
a+符号表示在其他说明的糖肽基因簇中存在直向同源物(ortholog)
b当其他糖肽基因簇中不存在直向同源物时,报告在GeneBank中Blast搜索结果
c在存在于其他糖肽簇中以及GeneBank中Blast搜索联合结果的基础上,提议的dbv ORF功能。
d该列报告了与其他糖肽基因簇的最佳匹配的百分比序列一致性及其起源的簇
e具有最高分值的GeneBank条目的编号(Accession number)
f从Blast搜索获得的概率分值
g前列GeneBank条目的生物及提议的功能。缩写为:S.,链霉菌属;M.,中间根瘤菌属(Mesorhizobium);A.,拟无枝酸菌属
h由Blast搜索报告的保守结构域
*存在于其他糖肽簇中,但是具有较高一致性的序列存在于数据库其它地方
实际上,编码七个NRPS模块的基因组织为两个背驰转录的区域,由12kb的片段分隔(图2)。这与bal、cep、com和sta簇的组织形成对照,在这些簇中,NRPS基因的七个模块存在于一个紧凑的区域,全部以相同方向翻译。另外,尽管在bal、cep、com和sta簇中,除了一个之外所有ORF以相同方向转录,但37个dbv ORF中仅有22个以一个方向转录,而余下的15个以相反的方向转录。这说明了dbv簇的转录复杂性。
dbv簇也以几个ORF的存在为特征,这些ORF在bal、cep、com和sta簇中没有发现同系物。这些ORF包括dbv ORF 3、6至8、18至20、22、23、29、30和36(SEQ ID NO:4、7至9、19至21、23、24、30、31和37)。五个bal、cep、com、sta和dbv簇之间的比较总结于表1中。总之,如此处所说明的dbv簇的遗传组成,基本上有别于参与其它糖肽合成的其他簇。因此,它代表了具有这类基因组成的簇的第一个实施例。
B.dbv基因的功能
本发明特别公开了编码NRPS的DNA序列,NRPS负责A40926七肽前体的合成。dbv NRPS由四个多肽组成,每个多肽含有1至3个模块。将这些多肽指定为dbv ORF 16、ORF 17、ORF 25和ORF26(SEQ ID NO:17、18、26和27)。使用模块系统由NRPS进行肽合成,其中,装载模块尾随以一系列延长模块。在NRPS中,每个延长模块以存在至少3个结构域为特征,所述结构域为:腺苷酸化(A)结构域,负责底物识别和激活;硫醇化作用(T)结构域,作为硫酯使氨基酸与延长肽共价结合;以及缩合(C)结构域,催化肽键形成。除了这些核心结构域之外,最后一个模块含有硫酯酶(Te)结构域,将连接完整肽与NRPS的酯键水解。有些模块通过差向异构化(E)结构域的作用将L-氨基酸转化为D型。dbv NRPS由七个模块组成,总共为七个A结构域、七个T结构域、六个C结构域、三个E结构域以及一个Te结构域。特定地,dbv ORF 26(SEQID NO:27)编码NRPS模块1和2,限定了结构域A-T-C-A-E-T的序列,且是HPC和Tyr残基(头两个氨基酸)整合到A40926的七肽核心中所必需的;dbv ORF 25(SEQ ID NO:26)编码NRPS模块3,限定了结构域C-A-T的序列,且负责DPG残基的整合;dbv ORF 17(SEQ ID NO:18)编码NRPS模块4至6,限定了结构域C-A-E-T-C-A-E-T-C-A-T的序列,且负责A40926七肽核心中两个HPG和Tyr残基的整合;dbvORF16(SEQ ID NO:17)编码NRPS模块7,限定了结构域C-A-T-C*-T-Te的序列(C*表示未知功能的非典型缩合结构域),且是最后一个DPG残基整合以及A40926的七肽前体释放所必需的。
存在于dbv簇中的其他基因代表用于增加A40926生产或合成新代谢物的新的遗传因子。其中,dbv ORF9(SEQ ID NO:10)编码糖基转移酶,该酶在七肽中向4位HPG残基的酚式羟基添加N-酰基-葡糖胺残基(分子式I)。可以将该基因克隆并在异源宿主中表达,以产生能够将N-酰基-葡糖胺残基添加到其他糖肽糖苷配基上的活性酶。作为选择,可以在生产性菌株中将dbv ORF9灭活,导致A40926糖苷配基的形成。虽然可以通过化学方法获得该糖苷配基(Malabarba和Ciabatti,2001),但通过单独的发酵过程产生该糖苷配基可以满足需要,不需要化学的干涉。
本发明的其他优选核酸分子包括dbv ORF10(SEQ ID NO:11),它编码卤化酶(halogenase),负责氯原子在A40926氨基酸3和氨基酸6的加成。dbv ORF 10代表新的遗传因子,有别于存在于cep、com、sta和bal簇中的卤化酶基因。事实上,A40926氯化模式在这些糖肽中相当独特。可以将该基因克隆并在异源宿主中表达,以产生能够氯化糖肽芳族残基3和6的活性酶。
本发明的其他优选核酸分子包括dbv ORF 23(SEQ ID NO:24),它编码酰基转移酶,负责以脂肪酸在氨基酸4葡糖胺残基的N-酰基化。dbv ORF 23代表新的遗传因子,不存在于cep、com、sta和bal簇中。可以将该基因克隆并在异源宿主中表达,以产生能够对不同糖肽的糖基部分N-酰基化的活性酶。
本发明的其他优选核酸分子包括dbv ORF 29(SEQ ID NO:30),它编码已糖氧化酶,负责附着于A40926中氨基酸4的D-葡糖胺残基向氨基葡糖醛酸的氧化。dbv ORF 29代表新的遗传因子,不存在于cep、com、sta和bal簇中。可以将该基因克隆并在异源宿主中表达,以产生能够氧化附着到糖肽的D-葡糖胺的活性酶。
本发明的其他优选核酸分子包括dbv ORF 36(SEQ ID NO:37),它编码硫酯酶,负责水解来自NRPS的异常中间肽。与其他以不同于NRPS的多肽存在的硫酯酶相似(Kotowska等,2002),dbv ORF 36的产物通过水解NRPS上的所有不进一步加工入七肽的硫酯而负责为A40926的生物合成保持有效的NRPS。它因此代表新的遗传因子,不存在于cep、sta、com和bal簇中。可以将该基因克隆并在另外的糖肽生产性菌株中表达,以增加形成的产物产量。宿主菌株包括但是不限于属于放线菌目,属于链孢囊菌科(Streptosporangiaceae)、小单孢菌科(Micromonosporaceae)、假诺卡氏菌科(Pseudonocardiaceae)和链霉菌科(Streptomycetaceae),属于野野村菌属(Nonomureae)、游动放线菌属、拟无枝酸菌属、链霉菌属等的菌株。
本发明的其他优选核酸分子包括dbv ORF 20(SEQ ID NO:21),它编码甘露糖基转移酶,负责向氨基酸7添加甘露糖残基。它因此代表新的遗传因子,不存在于cep、sta、com和bal簇中。可以将该基因克隆并在另外的糖肽生产性菌株中表达,以产生携带有添加至氨基酸7的甘露糖残基的糖肽。作为选择,可以在生产性菌株中将dbv ORF20灭活,导致去甘露糖A40926的形成。虽然可以通过其他方法获得该化合物(Lancini和Cavalleri,1997),但通过单独的发酵过程产生该化合物可以满足需要。
dbv簇也包括许多基因,这些基因负责非蛋白原性氨基酸HPG和DPG的合成。对于前者的合成,需要dbv ORF 1、2、5和37(SEQ IDNO:2、3、6和38)的产物。DPG的合成,除了ORF 37(SEQ ID NO:38)之外,需要dbv ORF 31至34(SEQ ID NO:32至35)的参与。它们的功能概括于表1。由于HPG和DPG是非蛋白原性氨基酸,所以经由NRPS的七肽合成依赖于它们的有效性。因此,这些酶的活性是糖肽生物合成中的限速步骤。由此可以通过增加这些ORF的表达而获得增加的糖肽产量。可以在A40926生产性菌株中,单独或以其任何组合超表达这些基因,以增加A40926的产量。
dbv簇也包括许多基因,这些基因负责将糖肽中间物或终产物输出到细胞质外、以及负责赋予生产性细胞抗性。这些基因包括dbv ORF 7、18至19、24和35(SEQ ID NO:8、19至20、25和36)。dbv ORF 7编码羧肽酶,负责从生长中的肽聚糖去除末端D-丙氨酸部分。它代表新的遗传因子,不存在于cep、com、sta和bal簇中。dbv ORF 18至19和24编码ABC类转运蛋白(van Veen和Konings,1998),负责A40926或其中间物的依赖ATP的分泌。dbv ORF 35编码Na/K离子反向转运蛋白,负责逆质子梯度输出A40926或其中间物。可以在另一个糖肽生产性菌株中,单独或以其任何组合克隆并表达这些基因,以增加形成的产物产量。宿主菌株包括但不限于属于属于放线菌目,属于链孢囊菌科、小单孢菌科、假诺卡氏菌科和链霉菌科,属于野野村菌属、游动放线菌属、拟无枝酸菌属、链霉菌属等的菌株。作为选择,可以在A40926生产性菌株中单独或以其任何组合超表达这些基因,以增加A40926产量。
dbv簇也包括许多调节基因,这些基因在A40926生产中负责直接或间接激活生物合成和抗性基因的表达。这些基因包括dbv ORF 3、4、6和22(SEQ ID NO:4、5、7和23)。dbv ORF 3与存在于吸水链霉菌(Streptomyces hygroscopicus)的基因簇中的正调节基因HygR高度相关(Ruan等,1997)。它代表新的遗传因子,不存在于cep、com、bal和sta簇中。dbv ORF 4与存在于其他糖肽簇中的相似调节基因高度相关。dbv ORF 6和22一起编码双组分信号转导体系。可以在另一个糖肽生产性菌株中单独或以其任何组合将这四个基因克隆并表达,以增加形成产物的产量。宿主菌株包括但不限于属于放线菌目,属于链孢囊菌科、小单孢菌科、假诺卡氏菌科和链霉菌科,属于野野村菌属、游动放线菌属、拟无枝酸菌属、链霉菌属等的菌株。作为选择,可以在A40926生产性菌株中单独或以其任何组合将这些基因克隆或超表达,以增加A40926产量。
C.dbv簇的用途
本发明也提供表达完整A40926分子、其任何前体或其任何衍生物的核酸。这类核酸包括分离的基因簇,该基因簇包括编码糖肽的ORF,所述糖肽足以指导A40926装配。在一个实例中,可以将完整的dbv簇(SEQ ID NO:1)引入合适的载体中,并用于转化所需的生产性宿主。一方面,将该DNA片段引入能够携带大DNA片段的合适的载体。这类载体的实例包括但是不限于细菌人工染色体(BAC)载体或特定衍生物,例如ESAC载体(Shizuya等人,1992;Ioannou等人,1994;Sosio等人,2000b)。另一方面,将dbv簇以两个分离的片段克隆到两个不同载体中,这两个载体可以在所需的生产性宿主中相容。在另一方面,可以将dbv簇细分为三个片段,将每一个克隆到分离的相容载体中。单、双或三载体系统用途的实例在文献中得到说明(例如Xue等人,1999)。
一旦将dbv簇合适地克隆到一个或多个载体中,可以将其引入许多合适的生产性宿主中,在合适的生产性宿主中,可以发生具有比天然宿主中更高效率的糖肽抗生素的生产。优选的宿主细胞是那些可以有效表达放线菌类基因的物种或菌株。这类宿主包括但是不限于放线菌目、链孢囊菌科、小单孢菌科、假诺卡氏菌科和链霉菌科、野野村菌属、游动放线菌属、拟无枝酸菌属和链霉菌属等。作为选择,可以将克隆到一个或多个合适载体中的dbv簇的第二个拷贝,引入A40926生产性菌株中,dbv基因的第二个拷贝将在此增加A40926产量。
生产能力向得到充分表征的宿主的转移,可以基本改善通向最优化和发展过程的几个部分:可以更有效地增加生产性菌株中天然产物的滴度;可以在已知可能的干扰活动背景下进行天然产物的纯化;可以更有效地控制复合物的组成;可以通过操纵发酵条件或通过途径工程更有效地产生天然产物改变的衍生物。
作为选择,可以将生物合成基因簇修饰、插入宿主细胞,并用于合成或化学修饰多种代谢物:例如,可以重编排、修饰可读框,并将其与其他糖肽生物合成基因簇组合。
利用此处提供的信息,可以使用常规和广为人知的方法实现A40926核酸的克隆与表达。
在另一个可能的用途中,通过使用常规分子生物学技术从dbv基因簇分离选择的ORF,并灭活选择的ORF。将克隆入合适的载体(所述载体含有在野野村菌属物种ATCC39727染色体中在侧面与所述ORF相接的DNA片段)的突变ORF引入所述野野村菌属菌株中,在此两个同源重组的双交换事件导致所述ORF在生产菌株中的失活。该方法可以以有效的方式用于A40926前体或衍生物的生产。
在另一个可能的用途中,从dbv基因簇分离选择的ORF,并将其置于所需启动子的控制之下。然后,无论通过前述的置换初始ORF、还是作为所述ORF的额外拷贝,将经过设计、克隆到合适载体中的ORF引入野野村菌属物种ATCC 39727中。该方法可以用于增加或降低ORF的表达水平,该ORF对于A40926分子、其前体或衍生物的生产是关键的。
实施例
下列实施例供以阐明鉴定A40926基因簇的原理和方法学、以及鉴定和分析dbv基因的原理和方法学。这些实施例供以阐明本发明的原理和方法学,但是并不意味限制其范围。
普通方法
除非另外指出,细菌菌株和克隆载体均从公共保藏或商业来源获得。对分子生物学使用标准方法(例如Sambrook等人,1989;Kieser等人,2000)。在HT琼脂(Kieser等人,2000)和Rare3培养基(10g/l葡萄糖,4g/l酵母提取物,10g/l麦芽汁,2g/l蛋白胨,2g/lMgCl2,0.5%甘油)中培养野野村菌属。按照发表的方法分离糖肽(Lancini和Cavalleri,1997)。使用来自Wisconsin package,9.1版本(Accelrys)的程序进行序列分析。使用Blast或Fasta程序在公共站点(http://www.ncbi.nlm.nih.gov/blast/index.html和http://www.ebi.ac.uk/fasta33)进行数据库搜索。
实施例1-A40926生物合成基因的分离
使用粘粒载体Supercos(Stratagene,La Jolla,CA 92037)中来自野野村菌属ATCC39727的DNA建立基因组文库。为了将片段大小量优化于40kb范围之内,使用Sau3AI部分消化野野村菌属ATCC39727的总DNA。使用碱性磷酸酶处理经部分消化的DNA,并与事先以BamHI消化的Supercos连接。体外包装连接混合物,并将其用于转染大肠杆菌XL1Blue细胞。通过与两个探针杂交筛选产生的粘粒文库,所述探针从bal簇片段的PCR扩增获得,PCR扩增使用地中海拟无枝酸菌DSM 5908基因组DNA为模板。这些探针是:bgtfA,从使用寡核苷酸(oligos)5′-ATGCGCGTGTTGATCTCG-3′(SEQ ID NO:39)和5′-CGGCTGACCGCGGCGAAC-3′(SEQ ID NO:40)的扩增获得;以及dpgA,从使用寡核苷酸5′-CGTGGGGGTGGATGTATCGA-3′(SEQ ID NO:41)和5′-TCACCATTGGATCAGCG-3′(SEQ ID NO:42)的扩增获得。从保存于GenBank的编号Y16952的序列设计所有寡核苷酸。使用寡核苷酸Pep8(Sosio等人,2000a)进行进一步杂交。分离对一个或多个这样的探针阳性的粘粒,使用限制酶绘制物理图谱。通过这些实验鉴定报告于图1中的粘粒。由此从野野村菌属物种ATCC39727基因组鉴定的片段含有负责抗生素A40926合成的dbv基因簇。
上文的实施例供以阐明分离dbv簇的原理和方法学。本领域技术人员将想到,可以将dbv簇克隆到多种载体中。然而,本领域技术人员理解,假定72kb大小的dbv簇,优选的载体是能够携带大的插入片段的那些,例如λ、粘粒和BAC载体。本领域技术人员理解,其它探针可以用于这类文库中dbv簇的鉴定。由SEQ ID NO:1中报告的序列,可以从野野村菌属物种ATCC39727 DNA PCR扩增任何片段,并将该片段用于筛选以此类DNA建立的文库。可以鉴定所述文库的一个或多个克隆,所述克隆包括由SEQ ID NO:10覆盖的任何片段。另外,通过使用异源探针,例如从cep、bal、com和sta簇衍生的那些,利用表1中提供的信息,来鉴定dbv簇也是可能的。作为选择,其他指导次生代谢物合成的基因簇,含有关于使得能够进行异源杂交充分与dbv基因相关的基因。所有这些变化在本发明范围之内。
实施例2-A40926基因簇的序列分析
通过鸟枪法对dbv簇测序,dbv簇如实施例1中所述进行鉴定。在此将dbv簇序列作为SEQ ID NO:1提供。使用Codonpreference[GCG,(Genetic Computer group,Madison,WI 53711)版本9.1]分析产生的DNA序列,以鉴定相似的编码序列。接下来,使用程序Tfasta(GCG,版本9.1),通过对bal、cep、com和sta簇的比较,分析以这种方法鉴定的每个编码序列。然后使用程序Blast对GenBank、或使用Fasta对SwissProt搜索没有确定与这些簇中任何一个相匹配的编码序列。最后,通过使用程序Pileup(GCG,版本9.1)对相关序列多重比对,或者通过搜索上游核糖体结合位点,确定每个ORF的精确起始密码子。总共鉴定了37个ORF,命名为dbv ORF 1至dbv ORF 37。这些分析的结果概括于表1,在此作为SEQ ID No:2至SEQ ID No:38提供于序列表中。下面提供细节。
2A.特化氨基酸HPG和DPG的合成
七个由dbv簇编码的蛋白参与特化氨基酸HPG和DPG的合成:即,ORF 1和ORF 2(SEQ ID NO:2和3)参与形成A40926所需的HPG残基的合成,它们分别编码对-羟基扁桃酸酯氧化酶和对-羟基扁桃酸酯合成酶。在其它糖肽簇中可以发现这些ORF的同系物(表1),其功能经实验方法得以确定(Li等人,2001;Hubbard等人,2000)。ORF 31至34(SEQ ID NO:32至35)参与形成A40926所需的DPG残基的合成。在其它糖肽簇中可以发现这些ORF的同系物,其指导含有DPG残基的七肽的合成(表1),相应基因产物的参与经实验方法得以确定(Pfeifer等人,2001;Chen等人,2001)。ORF37(SEQ ID NO:38)编码对-羟苯乙醛酸和3,5-二羟苯乙醛酸的转氨作用所需的氨基转移酶,以分别产生HPG和DPG。其功能经实验方法得以确定(Pfeifer等人,2001;Hubbard等人,2000),它优先利用酪氨酸作为氨基供体(Hubbard等人,2000)。该反应导致对-羟苯丙酮酸酯的形成,对-羟苯丙酮酸酯然后可以通过ORF 2(SEQ ID NO:3)基因产物的作用转化为对羟扁桃酸酯。
在dbv簇中也发现有其它间接参与HPG和DPG合成的ORF,即ORF5和ORF 30(SEQ ID NO:6和31)。ORF 5(SEQ ID NO:6)编码预苯酸酯脱氢酶,该酶参与对-羟苯丙酮酸酯的合成,对羟苯丙酮酸酯是ORF 2(SEQ ID NO:3)产物的底物。该ORF因此编码引发将酪氨酸转化为HPG的循环的酶。因此,该ORF的表达水平对于为形成A40926提供充分水平的HPG而言是重要的。ORF 30(SEQ ID NO:31)编码多肽,该多肽与由细菌基因组序列鉴定的未知功能的假定多肽高度相似,最佳匹配由来自天蓝色链霉菌的NP626911.1代表(表1)。然而,所有这些蛋白都表现4-羟苯甲酰辅酶A硫酯酶特有的保守结构域(Benning等人1998)。因此,ORF 30(SEQ ID No:31)的产物也许在这个小的聚酮化合物的合成中促进DPG或其前体之一的释放。ORF 30(SEQ ID NO:31)是dbv簇所特有的(表1)。
2B.A40926七肽前体的合成
由ORF 16、17、25和26(SEQ ID NO:17、18、26和27)编码的四个蛋白参与A40926七肽核心的合成。所有这些显示与其他NRPS的显著相似性。以与其他NRPS系统的比对为基础,由这四个ORF编码的蛋白的建议结构域组成和特异性报告于表2中。
表2.dbv NRPS的结构域组成及功能
 dbv ORF   模块   结构域   氨基酸   肽键
  ORF25   1-2   AT-CATE   HPG,Tyr   1-2
  ORF26   3   CAT   DPG   2-3
  ORF17   4-6   CATE-CATE-CAT   HPG,HPG,Tyr   3-4,4-5,5-6
  ORF16   7   CATC*Te   DPG   6-7
不能根据dbv NRPS基因在dbv簇内的遗传定位来预测其特定功能的分配。事实上,尽管对于至今为止所有报导的糖肽簇,在模块的基因顺序和相应氨基酸整合入多肽的顺序之间存在共线性,但对于dbv簇,情况并非如此(图2),因为其NRPS基因被背弛转录。然而,可以在下列观察的基础上预测其功能和特异性:
i)由ORF16(SEQ ID NO:17)指定的蛋白的结构域组成,及其以硫酯酶结构域终止的事实,与DPG残基的识别和七肽最后一个肽键的形成、继之为酶结合硫酯的切割的功能最为一致(表2);
ii)ORF 17(SEQ ID NO:18)的模块组织和结构域组成,与所述含有模块4至6的多肽最为一致,模块4至6是七肽氨基酸4至6的识别及其整合所需的,如在其他糖肽NRPS系统所见的(vanWageningen等人,1998;Pelzer等人,1999;Chiu等人,2001;Pootoolal等人,2002);
iii)由于ORF 25(SEQ ID NO:26)编码两个NRPS模块但是仅一个C结构域,所以该ORF产物的结构域组织与其起始七肽合成和催化第一个肽键形成的功能最为一致(表2);
iv)ORF 26(SEQ ID NO:27)的结构域组织与含有负责识别和整合七肽中第三个氨基酸的模块3的多肽最为一致,这是因为该模块不含有E结构域(模块2、4和5的功能所需),且分别存在或不存在C和Te结构域(表2),分别排除了该ORF编码模块1和7。
在dbv簇中也发现其它间接参与A40926七肽前体合成的ORF,即ORF 15和ORF 36(SEQ ID NO:16和37)。ORF 15(SEQ ID NO:16)编码功能未知的短肽。许多编码NRPS系统的簇中发现该基因产物的同系物。ORF 36(SEQ ID NO:37)编码II型硫酯酶,该蛋白通常由其它含有NRPS或聚酮化合物合酶基因的簇编码。这些硫酯酶被提议的功能是,通过去除与酶共价附着的异常中间物而增强NRPS和PKS系统运转的效率(Heathcote等人,2001)。其它已知糖肽簇不编码该蛋白的直向同源物(表1)。
2C.七肽中芳族残基的交联
由ORF 11至14(SEQ ID NO:12至15)编码的四个蛋白参与将A40926七肽前体的芳族残基连接在一起的交联反应。这四个蛋白显示与P450单加氧酶的显著同源性(表1)。在与其它糖肽簇中发现的P450单加氧酶一致性水平的基础上,以及在对由存在于bal簇中基因所编码的P450单加氧酶所预测功能的基础上(Bischoff等人,2001),可以作出下列预测。即,ORF 14(SEQ ID NO:15)的产物可能参与氨基酸2和4的芳族残基的交联;ORF 12(SEQID-NO:13)的产物可能参与氨基酸4和6的芳族残基的交联;以及ORF 11(SEQID NO:12)的产物可能参与氨基酸5和7的芳族残基的交联。ORF 13(SEQ ID NO:14)的直向同源物不存在于bal、cep和com簇中,但是见于sta簇中(表1)。由于在与A40926相似的A47934结构中,在氨基酸1和3的芳族残基之间含有额外的交联,ORF13(SEQ ID NO:14)的产物可能参与该交联反应。
2D.β-羟基酪氨酸的形成以及芳族残基的氯化
由ORF10和ORF28(SEQ ID NO:11和29)编码的两个蛋白参与β-羟基向作为氨基酸6存在于七肽中的酪氨酸残基的加成,以及氨基酸2和6的族组残基的氯化。在与其它糖肽簇中发现的编码卤化酶的基因的一致性水平的基础上,以及在对存在于bal簇中的卤化酶基因所预测功能的基础上(Puk等人,2002),ORF 10(SEQ ID NO:11)的产物可能参与氯原子向氨基酸3和6的芳族残基的引入。ORF28(SEQ IDNO:29)的产物是高度相关的蛋白家族,含有非血红素铁双加氧酶特有的基序。从sta簇预测了一个这样的蛋白(Pootoolal等人,2002),提示该蛋白参与酪氨酸的β-羟基化作用。该羟基化反应的精确的时间选择目前尚未知。由于它发生在balhimycin的合成中,所以它可能出现在氨基酸6整合入七肽之前(Bischoff等人,2001);它可能出现在七肽合成期间、或七肽骨架完成之后。
2E.糖的加成和修饰,以及N-甲基化
由ORF 9、20、23、27和29(SEQ ID NO:10、21、24、28和30)编码的五个蛋白参与A40926生物合成中一些晚期步骤。它们的预测功能如下。ORF 9(SEQ ID NO:10)与由其它糖肽簇编码的蛋白高度相关(表1),已证实它们参与糖向存在于4位的氨基酸残基芳环对羟基的附着(Solenberg等人,1997)。ORF9(SEQ ID NO:10)特定地编码糖基转移酶,该酶参与N-酰基葡糖胺残基向A40926糖苷配基的附着。没有其它得到说明的糖肽簇编码具有这种特异性的糖基转移酶。
在其它得到说明的糖肽簇中没有发现ORF 20(SEQ ID NO:21)的同系物。该蛋白含有甘露糖基转移酶蛋白家族的特征基序(表1)。另外,在天蓝色链霉菌基因组中(表1)、以及指定抗生素雷冒拉宁(ramoplanin)合成的游动放线菌属物种的簇中(WO0231155),鉴定了该ORF的同系物。由于雷冒拉宁含有附着于肽核心的甘露糖残基,附着所有这些数据指向ORF20(SEQ ID NO:21)在甘露糖残基附着至氨基酸7羟基中的功能。在下面的实施例4中也证实了这种假设的功能。
在其它得到说明的糖肽簇中没有发现ORF 23(SEQ ID NO:24)的同系物。该蛋白含有酰基转移酶家族3的特征基序(表1)。由于A40926含有附着于氨基糖残基NH2基的酰基,所以所述ORF的产物可能直接或间接参与A40926前体的酰基化,产生表征A40926复合物的化合物家族。
在bal和cep簇中发现ORF 27(SEQ ID NO:28)的同系物(表1)。已经证实,来自cep簇的ORF 27同系物参与chloroeremomycin中间物的末端亮氨酸残基的N-甲基化。A40926的N-末端位置存在HPG残基。因而,ORF 27(SEQ ID NO:28)的产物可能催化糖肽前体中HPG残基的N-甲基化,并且因此被赋予了与其它得到说明的甲基转移酶不同的特异性。
在其它得到说明的糖肽簇中没有发现ORF 29(SEQ ID NO:30)的同系物(表1)。该蛋白含有FAD结合特有的基序,显示出与己糖氧化酶相当大的匹配(表1)。由于A40926含有附着于氨基酸4的葡糖醛酸胺残基,所以由ORF 29(SEQ ID NO:30)编码的蛋白可能参与葡糖胺残基的氧化。由于该蛋白也含有分泌到细胞质外的蛋白的特征性假定信号肽序列,所以所述氧化可能发生在细胞质外,使用附着到糖肽核心的葡糖胺残基为底物
2F.输出和抗性
由ORF 7、18、19、24和35(SEQ ID NO:8、19、20、25和36)编码的五种蛋白参与A40926或其某些前体向细胞质外的输出、以及赋予生产菌株抗性。其预测功能如下。
在其它得到说明的糖肽簇中没有发现ORF 7(SEQ ID NO:8)的同系物。所述蛋白含有羧肽酶VanY家族的特征基序(表1)。该家族在某些万古霉素抗性肠道球菌中研究最为充分,在肠道球菌中,该家族参与末端丙氨酰残基从初生肽聚糖中某些五肽链的去除,从而降低结合到其分子靶标的糖肽的程度(Evers等人,1996)。ORF 7(SEQ IDNO:8)因此可能参与在生产性菌株野野村菌属物种ATCC38727中赋予对A40926的某种水平的抗性。
在其它糖肽簇中存在ORF 24和ORF 35(SEQ ID NO:25和36)的同系物(表1)。预测它们分别编码ABC型和依赖离子的跨膜转运蛋白。因此,它们可能参与A40926或其某些前体的输出或区室化。在其它得到说明的糖肽簇中没有发现ORF 18和ORF 19(SEQ ID NO:19和20)的同系物(表1)。预测它们编码另外的ABC-型运输蛋白,其中,仅ORF 18(SEQ ID NO:19)经预测为跨膜蛋白。因此,它们可能参与A40926或其某些前体的输出或区室化。
2G.调节
由ORF 3、4、6和22(SEQ ID NO:4、5、7和23)编码的四个蛋白参与一个或多个dbv基因表达的调节。在其它得到说明的糖肽簇中没有发现ORF 3(SEQ ID NO:4)的同系物。所述蛋白含有LuxR家族正调节物的特征基序,且与从吸水链霉菌PKS簇中发现的一个正调节物最为相关(Ruan等人,1997)。在其它糖肽簇中存在ORF 4(SEQID NO:5)的同系物(表1),它们属于LysR型正转录因子调节物家族。因此,ORF 3和4(SEQ ID NO:4和5)可能为一个或多个dbv基因的表达所需。ORF 6和ORF 22(SEQ ID NO:7和23)编码细菌双组分信号转导系统的两个成员。前一个蛋白是可能的反应调节物,与天蓝色链霉菌CutR蛋白具有最佳匹配(表1)。后一个蛋白是可能的跨膜组氨酸激酶,与吸水链霉菌的假定传感器蛋白激酶最为相关(表1)。因此,ORF 6和22(SEQ ID NO:23)可能参与感受触发dbv簇中一个或多个基因表达的信号。
实施例3-dbv簇在ESAC载体中的分离
使用实施例2中提供的信息,如下所述在ESAC载体中分离dbv簇。以在pPAC-S1载体中的野野村菌属ATCC39727 DNA建立基因组文库(Sosio等人,2000b)。按照说明将来自野野村菌属ATCC39727的DNA预先置入琼脂糖填料中(Sosio等人,2000b;WO99/67374),并且以Sau3AI部分消化以最优化片段大小在100-200kb范围内。简单地,按照说明将产生的DNA片段走PFGE凝胶,从琼脂糖凝胶回收并释放(Sosio等人,2000b;WO99/67374)。按照说明进行因而发生的步骤,包括载体制备、连接和大肠杆菌DH10B感受态细胞的电穿孔(Sosio等人,2000b;WO99/67374)。将产生的菌落排列在尼龙滤器上,并使用两个探针通过杂交进行筛选,探针来自野野村菌属ATCC39727基因组DNA的PCR扩增。使用寡核苷酸5′-TCAGGAGACGAACCCCGC-3′(SEQID NO:43)和5′-GTGCACGAAAGTCCCGTC-3′(SEQ ID NO:44)获得探针A;使用5′-ATGGACTCCCACGTTCTC-3′(SEQ ID NO:45)和5′-TCAGGGGAGACATGCGGT-3′(SEQ ID NO:46)获得探针B。所有这些序列衍生自SEQ ID NO:1。然后分离对所有这些探针阳性的ESAC克隆,并以EcoRI和EcoRV消化绘制物理图谱。从一个这类实验中,分离含有约84kb插入片段的ESAC克隆NmES1。NmES1跨过整个dbv簇(SEQID NO:1),并延伸至SEQ ID NO:1的核苷酸1的5’约5kb,以及SEQ ID NO:1的核苷酸71138的3’约8kb。
上述实施例用以阐明可以在ESAC载体中获得dbv簇的原理和方法学。本领域技术人员将想到,pPAC-S1载体仅是可以用于此目的的ESAC载体的一个实例。其它用于克隆整个dbv基因簇并转移到适宜放射菌类宿主中的载体已有说明(Sosio等人,2000b;WO99/67374)。另外,用于制备野野村菌属物种ATCC39727 DNA的大插入片段文库的其它方法也在本发明范围内,这些方法包括但是不限于部分消化、片段分离和回收、载体制备、连接和大肠杆菌细胞的转化。本领域技术人员也将想到,一旦如在SEQ ID NO:1中那样确定了dbv簇的边界,可以使用除上述探针A和B之外的任何探针或探针的联合,来筛选以野野村菌属物种ATCC39727 DNA建立的文库,以鉴定插入片段跨越整个dbv簇的克隆。作为选择,使用SEQ ID NO:1和表1中提供的信息,可以从其它基因簇获得有用的探针,这些基因簇含有与dbv基因足够相关的基因,以允许异源杂交。所有这些变异在本发明范围内。
实施例4-使用基因置换的A40926途径操作
使用实施例2中提供的信息,如下所述在ORF 20中构建框内缺失。通过以寡核苷酸5′-TTTTGAATTCTCAGGCGATCCGTCCGTCT-3′(SEQ IDNO:47)和5′-TTTTCTAGAGCCCGGACACCCGGGGGCTGA-3′(SEQ ID NO:48)扩增获得片段A;通过以寡核苷酸5′-TTTTCTAGAAGTCATGGTGATGTGCGACAT-3′(SEQ ID NO:49)和5′-TTTTAAGCTTATGTTGCAGGACGCCGACCG-3′(SEQ ID NO:50)扩增获得片段B。然后,使用EcoRI和XbaI消化片段A,使用XbaI和HindIII消化片段B,二者都连接到事先以EcoRI和HindIII消化的pSET152(Bierman等人,1992)中。大肠杆菌DH5α细胞转化之后,产生的质粒指定为pSM4,根据EcoRI和HindIII消化后存在4kb和1.5kb片段而识别该质粒。将pSM4的等分试样转移到大肠杆菌ET12567(pUB307)(Kieser等人,2000)细胞内,产生菌株SM4。然后,将来自LB中过夜培养物的SM4细胞约108CFU与在Rare3培养基中生长约80小时的野野村菌属ATCC39727约107CFU混和。将产生的混合物涂布于HT盘上,其于28℃温育约20小时。用水温和洗涤去除过量大肠杆菌细胞后,使用3ml软琼脂将盘覆盖,软琼脂中含有200mg萘啶酮酸和15mg/ml阿泊拉霉素。另外于28℃温育3-5周后,将野野村菌属接合后体在含有阿泊拉霉素的新鲜培养基上划线。进一步处理一个名为菌株SS18的这类接合后体。在不含阿泊拉霉素的HT培养基中将菌株SS18培养数代,将适宜的稀释物涂布于不含阿泊拉霉素的HT琼脂上。使用寡核苷酸5′-TTTTGAATTCTCAGGCGATCCGTCCGTCT-3′(SEQ ID NO:47)和5′-TTTTAAGCTTATGTTGCAGGACGCCGACCG-3′(SEQ ID NO:50),通过PCR分析单菌落。根据存在1.5kb条带,识别含有缺失的ORF 20等位基因的菌落。在HT培养基中培养一个指定为SSM18的这类菌落,通过与可信标准物比较确认去甘露糖基-A40926的形成(Malabarba和Ciabatti,2001)。
上述实施例用以阐明能够在A40926生产性菌株野野村菌属物种ATCC39727中由突变的拷贝置换ORF的原理和方法学,所述ORF选自任何由SEQ ID NO:2至38指定的ORF。本领域技术人员将想到,ORF20(SEQ ID NO:21)仅是用于在SEQ ID NO:1指定的簇中产生框内缺失的方法学的一个实例。本领域技术人员也理解框内缺失仅是用于生成突变的一种方法,在任何由SEQ ID NO:2至38指定的ORF中,也可以使用其它方法产生无义突变型,这些方法包括但是不限于移码突变、插入和定点突变。本领域技术人员也理解,确立了在任何由SEQ IDNO:1指定的ORF中产生突变的方法后,这些相同的方法学可以应用于改变这些相同ORF的表达水平。这一点如何实现的实例包括但是不限于所述ORF的多拷贝在野野村菌属物种ATCC39727基因组中任何位置的整合、控制所述ORF表达水平的启动子中的改变、干扰其表达的反义RNA或转录终止子的去除。
最后,在用于将突变的等位基因引入野野村菌属物种ATCC39727的载体中、在供体和受体菌株的接合和培养条件中、在选择和筛选接合后体及其衍生物的方法中的所有变化均在本发明范围内。
                              参考文献
Bate N,Butler AR,Gandecha AR,Cundliffe E(1999)Chem Biol 6:617-624.
Benning MM,Wesenberg G,Liu R,Taylor KL,Dunaway-Mariano D,Holden HM(1998)J Biol Chem 273:33572-33579.
Bentley SD,Chater KF,Cerdeno-Tarraga AM,Challis GL,Thomson NR,James KD,Harris DE,Quail MA,Kieser H,Harper D,Bateman A,Btown S,Chandra G,Chen CW,Collins M,Cronin A,Fraser A,Goble A,Hidalgo J,Hornsby T,Howarth S,Huang CH,Kieser T,Larke L,Murphy L,Oliver K,O′Neil S,Rabbinowitsch E,Rajandream MA,Rutherford K,Rutter S,Seeger K,SaundersD,Sharp S,Squares R,Squares S,Taylor K,Warren T,Wietzorrek A,Woodwardm J,Barrell BG,Parkhill J,Hopwood DA(2002)Nature 417:141-147.
Bierman R,Logan K,OBrien ET,Seno R,Nagaraja R,Schoner BE(1992)Gene116:43-49.
Bischoff D,Pelzer S,Holtzel A,Nicholson GJ,Stockert S,Wohlleben W,Jung G,Sussmuth RD(2001)Angew Chem Int Ed Engl 40:1693-1696.
Chater KF,Bibb M(1997)in Biotechnology,vol 6,pp.57-105,VCH,Weinheim,Germany.
(Kleinkauf H,von Dohren H eds),VCH,Weinheim,Germany.
Chen H,Tseng CC,Hubbard BK,Walsh CT(2001)Proc Natl Acad Sci USA 98:14901-14906.
Chiu HT,Hubbard BK,Shah AN,Eide J,Fredenburg RA,Walsh CT,Khosla C(2001)Proc Natl Acad Sci USA 98:8548-8553.
Evers S,Quintiliani R Jr,Courvalin P(1996)Microb Drug Resist 2:219-223.
Heathcote ML,Staunton J,Leadlay PF(2001)Chem Biol 8:207-220.
Hubbard BK,Thomas MG,Walsh CT(2000)Chem Biol 7:931-942.
Katz L,McDaniel R(1999)Med.Res.Rev.19:543-58.
Kieser T,Bibb MJ,Buttner MJ,Chater KF,Hopwood DA(2000)PracticalStreptomyces Genetics,The John Innes Foundation,Norwich,UK.
Kotowska M,Pawlik K,Butler AR,Cundliffe E,Takano E,Kuczek K(2002)Microbiology 148:1777-1883.
Ioannou PA.Amemiya CT,Garnes J,Kroise1 PM,Shizuya H,Chen C,Batzer MA,de Jong PJ(1994)Nat Genet 6:84-89.
Lancini GC,Cavalleri B(1990)In:Kleinkauf H,von D_hren H(eds),Biochemistryof Peptide Antibiotics pp.159-178 Walter de Gruyter Berlin,New York.
Lancini GC,Cavalleri B(1997)Glycopeptide antibiotics(Dalbaaheptides)inBiotechnology,vol 7,pp.369-396,VCH,Weinheim,Germany.
Li TL,Choroba OW,Hong H,Williams DH,Spencer JB(2001)Chem Commun 20:2156-2157.
Losey HC,Peczuh MW,Chen Z,Eggert US,Dong SD,Pelczer I,Kahne D,WalshCT(2001)Biochemisty 40:4745-4755.
Malabarba A,Ciabatti R(2001)Curr Med Chem 8:1759-1773.
Malabarba A.Ciabatti R,Gerli E,Ripamonti F,Ferrari P,Colombo L,OlsufyevaEN,Pavlov AY,Reznikova MI,Lazhko EI,Preobrazhenskaya MN(1997)JAntibiot 50:70-81.
Marahiel MA(1997)Chem Biol 4:561-577.
Mendez C,Salas JA.(2001)Trends Biotechhol 19:449-456.
Omura S,Ikeda H,Ishikawa J,Hanamoto A,Takahashi C,Shinose M,TakahashiY,Horikawa H,Nakazawa H,Osonoe T,Kikuchi H,Shiba T,Sakaki Y,Hattori M(2001)Proc Natl Acad Sci USA 98:12215-12220.
Parenti F,Cavalleri B(1989)J Antibiot 42:1882-1883.
Parenti F,Cavalleri B(1990)Drugs of the future 15:57-72.
Pelzer S,Sussmuth R,Heckmann D,Recktenwald J,Huber P,Jung G,WohllebenW(1999)Antimicrob Agents Chemother 43:1565-1573.
Pfeifer V,Nicholson GJ,Ries J,Recktenwald J,Schefer AB,Shawky RM,SchroderJ,Wohlleben W,Pelzer S(2001)J Biol Chem 276:38370-38377.
Pootoolal J,Thomas MG,Marshall CG,Neu JM,Hubbard BK,Walsh CT,WrightGD(2002)Proc Natl Acad Sci USA 99:8962-8967.
Puk O,Huber P,Bischoff D,Recktenwald J,Jung G,Sussmuth RD,van Pee KH,Wohlleben W,Pelzer S(2002)Chem Biol 9:225-235.
Rodriguez L,Aguirrezabalaga I,Allende N,Brana AF,Mendez C,Salas JA(2002)Chem Biol.9:721-729.
Ruan X,Stassi D,Lax SA,Katz L(1997)Gene 203:1-9.
Sambrook J,Fritsch EF,Maniatis T(1989)Molecular Clonihg:A laboratoryManual(Cold Spring Harbor Lab.Press,Cold Spring Harbor NY).
Shizuya H,Birren B,Kim UJ,Mancino V,Slepak T,Tachiri Y,Simon M(1992)Proc Natl Acad Sci USA 89:8794-8797.
Solenberg PJ,Matsushima P,Stack DR,Wilkie SC,Thompson RC,Baltz RH(1997)Chem Biol 4:195-202.
Sosio M,Bossi E,Bianchi A,Donadio S(2000a)Mol Gen Genet 264:213-221.
Sosio M,Giusino F,Cappellano C,Bossi E,Puglia AM,Donadio S(2000b)NatBiotechnol 18:343-345.
Steiert M,Schmitz FJ(2002)Curr Opin Investig Drugs 3:229-233.
van Wageningen AM,Kirkpatrick PN,Williams DH,Harris BR,Kershaw JK,Lennard NJ,Jones M,Jones SJ,Solenberg PJ(1998)Chem Biol 5:155-162.
van Veen HW,Konings WN(1998)Biochim Biophys Acta 1365:31-36.
Xue Q,Ashley G,Hutchinson CR,Santi DV(1999)Proc Natl Acad Sci USA 96:11740-11745.
Zhang Z,Wang Y.Ruan J(1998)Int J Syst Bactehol 48:411-422.
                                序列表
<110>Vicuron Pharmaceuticals Inc.
<120>生物合成糖肽抗生素A40926的基因及蛋白
<130>G69039
<160>50
<170>PatentIn version 3.1
<210>1
<211>71138
<212>DNA
<213>野野村菌属
<220>
<221>misc_feature
<222>(40)..(1140)
<223>ORF1;负链
<220>
<221>misc_feature
<222>(1259)..(2329)
<223>ORF2;负链
<220>
<221>misc_feature
<222>(2558)..(5161)
<223>ORF3;负链
<220>
<221>misc_feature
<222>(5266)..(6231)
<223>ORF4;负链
<220>
<221>misc_feature
<222>(7183)..(8292)
<223>ORF5;正链
<220>
<221>misc_feature
<222>(8320)..(8973)
<223>ORF6;正链
<220>
<221>misc_feature
<222>(9069)..(9659)
<223>ORF7;正链
<220>
<221>misc_feature
<222>(9708)..(10667)
<223>ORF8;负链
<220>
<221>misc_feature
<222>(10670)..(11896)
<223>ORF9;负链
<220>
<221>misc_feature
<222>(11950)..(13419)
<223>ORF10;负链
<220>
<221>misc_feature
<222>(13479)..(14741)
<223>ORF11;负链
<220>
<221>misc_feature
<222>(14823)..(16019)
<223>ORF12;负链
<220>
<221>misc_feature
<222>(16009)..(17163)
<223>ORF13;负链
<220>
<221>misc_feature
<222>(17185)..(18366)
<223>ORF14;负链
<220>
<221>misc_feature
<222>(18462)..(18671)
<223>ORF15;负链
<220>
<221>misc_feature
<222>(18668)..(24259)
<223>ORF16;负链
<220>
<221>misc_feature
<222>(24278)..(36529)
<223>ORF17;负链
<220>
<221>misc_feature
<222>(36760)..(39021)
<223>ORF18;负链
<220>
<221>misc_feature
<222>(39153)..(39851)
<223>ORF19;负链
<220>
<221>misc_feature
<222>(40125)..(41732)
<223>ORF20;负链
<220>
<221>misc_feature
<222>(41772)..(42584)
<223>ORF21;负链
<220>
<221>misc_feature
<222>(42868)..(44130)
<223>ORF22;负链
<220>
<221>misc_feature
<222>(44226)..(46355)
<223>ORF23;负链
<220>
<221>misc_feature
<222>(46632)..(48578)
<223>ORF24;正链
<220>
<221>misc_feature
<222>(48575)..(54868)
<223>ORF25;正链
<220>
<221>misc_feature
<222>(54865)..(58056)
<223>ORF26;正链
<220>
<221>mise_feature
<222>(58152)..(58985)
<223>ORF27;正链
<220>
<221>misc_feature
<222>(59046)..(60641)
<223>ORF28;正链
<220>
<221>misc_feature
<222>(60874)..(62445)
<223>ORF29;负链
<220>
<221>misc_feature
<222>(62887)..(63312)
<223>ORF30;正链
<220>
<221>misc_feature
<222>(63469)..(64587)
<223>ORF31;正链
<220>
<221>misc_feature
<222>(64599)..(65240)
<223>ORF32;正链
<220>
<221>mise_feature
<222>(65237)..(66541)
<223>ORF33;正链
<220>
<221>misc_feature
<222>(66538)..(67335)
<223>ORF34;正链
<220>
<221>misc_feature
<222>(67332)..(68618)
<223>ORF35;正链
<220>
<221>misc_feature
<222>(68685)..(69423)
<223>ORF36;负链
<220>
<221>misc_feature
<222>(69608)..(70894)
<223>ORF37;正链
<220>
<221>misc_feature
<222>(71065)..(71138)
<223>attL位点,残迹
<400>1
gggggctggg cctgctgcgg ctcgcgagcg ggctgacggt caggagacga accccgcgcc   60
ggggcgggtc gtcctgagtg cctgggctgc ggcgacgtcg ccgcagcctg ccaggccgag  120
cccgtcctcg atctcggcac ccaggaggcc gagcaccgta cggacccccc gttcgccgtc  180
cgcggccaga ccccagatca cggggcgtcc gacgagcaca cccgacgccc cgagcgccag  240
cgccttgagg acgtcggctc ccgaccggac gccaccatcg agcatgatct cgcagcggcc  300
cccgacgctc tccgccaccc ccggcagcgc gtcgagactg gccacggcgc cgtcgagctg  360
acgtccgccg tggttggaga ccacgatgcc gtcgatgccg aggtccgcgg cgcggcgggc  420
gtcctcgggg tgcagaatgc ccttgaccac cagcgggagc ccgctggcgg cccggagggt  480
ctcgaggtac gaccagtcca ccgcggcgga gagctccatg gccgtgtgcg ccgccagcgc  540
ggagccgccg gaggcacccc gatgagcctc ggtcccggag ttcgccgtca ggtgcacggg  600
ccgcacgtgc gggggcaggc ggaaccggtt gcggatgtca cgtggcctgc ggcccatcca     660
cggcacatcg agcgtgagca tcaacgcccg gcaccccgcg tcctcggccc ggcggatcag     720
gccgagggtg gcggcgtgct cgcgaaggca gtagagctgg aaccagacgt gtccccccag     780
ggcggtgacg tcctccaccg ggacgctgct caaggtgctg acggtgaacg ggaccccggc     840
gtcccgcgcc gcccgggccg tcgccagctc accgtcggga tgcacgagcc ggtggtaggc     900
gacgggggcc accgccaccg gcatcgtcgc ggggtggccc agcagcgtcg cacgggtgga     960
gcacgccgac acgtcctgga gcacccgcgg caccaggaac acccggtcga aggcggcccg    1020
attcgcacgg agggtctgct cgcggccgct cccgccgtcg atgaagtccc ggacgtcggc    1080
ggggaggacc ttggcggcga tctcctcgta ctcggcgagg cagacgggac tttcgtgcac    1140
gctgtcagga cgctcgggcc cgctgccggg acgctcgggc ccgctgccgg gacgctcggg    1200
cccgctgccg ggacgctcgg gcccgctgcc gggacgctcc cgcacgctgc tgggacgctc    1260
atgcacgctg ctgggacctc gccacctcga cggcctcgta gagggccttg atgttggcgc    1320
ctccgaaggt gcgggctccc tgccgctcga tgacctcgaa gaagagggtc tcgcgcggat    1380
gggtggacgc cgtgaagatc tggaagagct gtccgccgtg atcctcgtca gcgagcagtc    1440
ccgtcgcgcg caactggtcc accgtgtgac cccggatctg gatccgtgat tcgagcaggt    1500
cgtagtagct gcccggcgtg ctgaggaagc ggacgccccg ctcggacagg gtgttcacgg    1560
cgtgcacggc gtccgaggag gagaaggcga cgtgctgcac cccggcaccg gcgtgccgtt    1620
cgaggaacat gtcgatctgg ccggcctcgg ccatcgggtc gggttcgatg agtgtcagcg    1680
tgacggcgcc ggaggcgctc tgcaccacct tggactccat ggcctgggtg ccgacctcga    1740
tgcgttcctt gaaggtctcg ctgaagccga gggtggcgac gtagaagtcg gtgatgatgt    1800
cgaggtcacc cgtgggcagg cacacggcga agtggtcgat gtcgagcagc tccgccgcgt    1860
ccgcaccgga ctcggcggcg gacggagcct cggagaagcc gaccggcagg ccggggtcgt    1920
cgccggggtc ccgctggacg agggtgtgga ccacgtcgcc gaagccgccg atcgcggcgg    1980
agcaggccgg cccggggccg gggtgccggg acggggaccg tacgggccgg gcgccggcgg    2040
ccacggcatg ggtgaagacg acgtcgacgt cgggggtccg cagggcgatg tcggcgaccc    2100
cgtcgccgtg cgtccgcaca taggccgaag ccggatggcc gtcggacgtg gcctgggtga    2160
ggacgagggt gatgcggccc tgccggagcg cgacgctgcg atggtcgctg gcgttcgccg    2220
tgcccacgac ggcgaagcgg tattcgtcgg tccaagggag agtggcgacc ttcagatccg    2280
ctacgtacat ttcgacgtaa tcaacggcga gaggcggaag cgattccata ttccgacgct    2340
acggccgggc ggggaggttc gcaccgtgtc cattggacgc gctcgcaggc cgcgctcaca    2400
gcagattccg gtacattccc gaggcctttt caggccggcg tggacggtcg gcggatcagg    2460
cttcataaaa agcctgccct ggcgtattct cgggttaatc aaccccgatg gatatcctgc    2520
ccgaggccgg cgaattcggc ttgtcgaact cttcgctcta cagccgcact gcctcacgcg    2580
gctcgcggcc ggctgtggcc gtcgccttat cggcgatgtc cgcggcgaag aggttgccca    2640
ggtcaccccg agtctgtacg tggagtttcc gatagatcct ggtgagatgc tgctcgaccg    2700
tgctgcgcgt gatgtagagc gcctcggcga tctcacgatt ggtgtgccca cgggcggcga    2760
gcacggcgac ccgccgttcg gcgccgctca acggtgcggt ctcaccatga tcgtgctgtg    2820
cggcgagcct cctcatcaag ggcttcgcgt tgcactcgcg ggccagctcc tgcgcccgca    2880
cccagtaggc ccgggcctcg tccttgccgc ccttgagctg tggggtcccg gcgaggtcgc    2940
agagggaaag ggccagctgg tagcgatcct gggcggcctc cagcgcgtcc acggactgca    3000
tcagcaaccg ctggcgctgt gcgggcttgc tcagctgcgc gtgcaggcgg agggcgaccc    3060
cgtacgtccg caggtcaccg gaggaggtgt gggcgatctg ggccgtgacc agatcggccg    3120
ccctgcgacg ccagcccagt tgcaggcacg ctcgcgccgc gccgaggcgc caggggacca    3180
cgtcggacag gctgctgccc cagcgctgga ccgcctgccc gcatgccagg aagccggcga    3240
aggcggcgcg aggctgctcc gtgaccaggt ggtagtgcgc cctcgcgagc tcgtagccga    3300
tcccgaaggc ggtctccgcc gtctcgcggg gcatcggcac cgccacggtc gccttcgcct    3360
cgtcgaggtg gcccatcgcg gtctgggcat ggagcagggt gctgagtggc gcgccgatcg    3420
cgacgcccca gccgctgggc tgcagtatgg tcagcgcctc ctgcgcatgg gcctcggccc    3480
ccgccaggtc gcccttgcgc cacgccgtct ccgcccggat ggcggagatg atcgccttcc    3540
aggtgggcgc cttcgtcacc ccgggctcct tgaggagcgt ctcgcaggag gccgccacct    3600
ccgacactcc gcccagcagc agtgccatca gagccgagat gatgctgtcc atcgcctcat    3660
ccgtcggctc cgcctgacgc aggatccggc gcgcgtcctc gactgtctgg cccatcgagc    3720
cgcgggcgga ccggggcaat ctgtcgagaa gcaccgggtg gacgtggcac atcgcgatca    3780
aggacgcgtc ggcgtccctg tcggcgacgc tcggcctcag ccgatcgatc agctccgccg    3840
cgtcggcgaa ccggccgtac cacagcagct ggcggaacag ctccatcccg tgagatccac    3900
gcaacgcacc cgagcgcgtg gcgtcgagca gatcgggcac gtgacgtgcc gccactgccg    3960
ggtcgacgcg ccactccgcc gcggcgagca tcaccttcac gtccagccgg cgaggcgtgc    4020
cccagccgga cgccagggcg agccgtaagc acttcatgac agcgacgaaa tcaccctcgt    4080
cgaacgcctg ccttcccgct tcgacgagga cgtcgaaagc ccactcctca cccgaccagc    4140
ccgcctccag caagcgcgtg gccacagccg acggtgggcc tccccgccga tggaggatct    4200
ccgcggcccg ccggaggatc tccatcctgc cgtaggaggt catgcgcccg agtacggcca    4260
ggcggcccgc ctcatgacga aagcgccccc cggccaggag cccggcgcgc tccagcatcc    4320
ccatcgagcg tgtcgcggca ggaggggcga tgcccacgag ctcgcccacc gcgtccggcg    4380
tggcgtgctc gccgaggacg gccaccgcct ccgcgacgcg gacggcctcc ggctcgcagc    4440
catgaacgca cgctgccacc gcgctcatga aggagtcgcc gaccacgagc ccgggcgcgc    4500
cggcctcctg atcctcgatc agcgcccgga ccagcagcgg gctgccgccg ctgaagcggt    4560
agaggtcgtc ggcgagctgg tcggccgtct cggccccgag gtgctcggtg gcgaactgcc    4620
tgaccgccgg acggggcagg agcggcagct cgaccagctc gatgccgggc aggcgcagca    4680
aggactcggc gacatggggg agaggggccg gcggccggtc ctggcagatc gtgacggcga    4740
tcatcatcct ggtgtccgtc agcaggggcg tcatggacag gatggccagc agggacggat    4800
cgtcggcgag atccacgtcg tcgatcgtca ggaggatcgg gttcgcctcg gccatctgga    4860
acagggagac gcagacgtcc tcgaccgcgt caccgcccct gcgcgcggtc agccgctccg    4920
ctgccccgcg gcccaggatc tggtcggcga ccccccagtc cagcgactgc tccgccggcg    4980
tgcagcgggc cgtgaccagc cggatgccgg ccgcgatgga tcgcatgccg agctcgtgga    5040
ggatggcggt cttgccgccg accacaggcc ccgtgatgac ggccactcca ccgcggccgg    5100
ccgcggtgga atcgagcaac ctcgtcagac tcttcagttc acgatctcgc ccgaacagca    5160
ctcttgctcg tcccccaagc ggttcgtcga cttggtttgc cgtgtgcctg atctggtcct    5220
ggtcccgtcg ctctacatac ggccgcccgg ctcatccact cgtgctcatc cagcggccag    5280
atcggtcgcc cgcccctcca ggcgatccgc gaacgctgcc cagatctggg catgatccct    5340
ggcgcatctc gcgacaacgg tgccccaatg cggcggcact ccgcgcaaga tcctttccca    5400
ttcctgcccg tcgatggagt gcaatgatag cattcgcaac aaaattcggc cggtttcggt    5460
cagacgtaat gcgggatcgg ccttgagcct ttccagcacg gcttggcggt ctcggccgtc    5520
gacgtggccg aaatcctgtt ctgcccgacg cagtaattcc ggcttggtcc ttaatctccg    5580
gctcccgtcc ggaatcgggc tctcaccgtg ctccaaccgg cctctcacat cccggaccgt    5640
ctccggggag atgccgacct gtttggcgac ctggcggagc gaaaggtccg gatggctgcg    5700
gatgagctcg gcggcgagtc tcctcccctc tgagctgtcc accggacgga tgcgcccgtc    5760
ccgcccgatt ctggcctcgt caccgccttg tcctctgcgc ctgcgcaggt cggccaccgt    5820
gccggcggag atgccggtcg ccgaggccac ccgtcgatca gaccactgcg gatgtgtccc    5880
gatgatccgg acggccgcac gcttgcggtc ggccagtgag agcggcagcc cgtgccgcac    5940
gttcgcctcg acggccagga cgaaggcgtc cgattcggtg ccgtcgatca gcctcaccga    6000
gattgttgtt tcacccctga cccgcgccac cttcaaccgg tgcaggccgt cgatcacccg    6060
catcgttgga cggtggacga gaatgggcgg aagctcccct tgtgccgaca acagggtctc    6120
gacgtgctct ggatcctcgc ccgaagtccg gggtgagtac acagaggaca gccgggacag    6180
ctcgatttcg acgacaggga gagtggctat gtcaactccc gtcgggtcca cctagcctcc    6240
gattcgatta gcgtcatatc ggagccgggg gcgttcaaaa aacaacccag ccgcgtgcgc    6300
cgcgcgcacc ttcgacgatt ccccgtcgcg cctgcagcat ctggtcccgg gcaagcctgg    6360
acttcccggc gcgagctgca taaatcgatc ggccaagtgc tctgtcgaga gaatgcgtcg    6420
catcctcttt tcttcggcaa ctccacgcgg caaagaattg gacgctgtcg ccgcgaatcc    6480
gtagccgtct acctcatcga attgcagaac gcttcccgtt agcattccga tcactccgac    6540
tttcggttag gccttcctcc ggaaggttaa aggaggctgt gcaggtcgaa ccacccccta    6600
tcccggacat ccacccccct agtttcggat aagaccgatg cgcggggttg cgcctctgtc    6660
gcgaagcgga gtatccggtg ctggaccgcc cgaatcgagc ggtcaccatg cgtgtcaatc    6720
cgtgtgtatt ggcatgcgcc gtcggcgcga gcccggcggg gccgcggcgg tcccacggtt    6780
tcgctcatga caccgtctcc aggtgagggt gatcgcggta gccggccacg ggcgcgctgc    6840
cgcagcggcg gccatgctga tctgcccatg gaccagcagg ccgacggtga ggtcccgccg    6900
gacggccggc tcccggtaca acgtacgtca gttcttctcg gcgatctagg ggagtgggcg    6960
gggtgccttc gccgggcatg cgggcggcct gtcctttggc aattgacagg cgtgaatgca    7020
gaaaggagcg cggccacctc tgacctgccg agtaagggaa tggattactc atcaatggcg    7080
ccggtggcca cggaactcgc ccggcgatcc ggcgtgtcca aatggcgcgg tgcccaggcc    7140
cgccgatgga caccgcccgg tgcgcgggct taagaagtag ccgtgaccct ggagaggacg    7200
ctcatcgtcg gcaccggtct gatcggcacc tccgccgcgc tcgcccttcg cgagaagggg    7260
gtggcggtct acctgtccga cgtcgacgca catgccgtac ggctggcgcg agcgctcggc    7320
gcgggccagg agtggaccgg tcagcgcgtg gacctggcat tgatcgccgt gcccccgccc    7380
agcgtggggc agcggctggc cgatctgcag cagcggcggg ccgcgcgggc gtacaccgat    7440
gtgaccagcg tcaaggtcga tccgatcgcc gacgcggagc ggctcggctg cgacctgacc    7500
tcctatgtcc ccggacaccc gctcgccggc cgggagcggt ccggcccggc cgccgcccgt    7560
gccgatctgt tcctgggacg tccctgggcg ctctgccccc gccctgagac gggtgcggat    7620
gccgtgcggc tggccaggga gctggtctcg atgtgcgggg cggagcccta caccgtgagt    7680
gcgggcgagc acgacacggc ggtggcgctg gtgtcgcacg ccccgcacgt ggccgcgtcc    7740
gcggtggcgg cgcggctgag ggacggcgac gacgtcgcgc tggccctggc ggggcagggg    7800
ctgcgcgacg tgacgcggat cgccgcaggg gaccccctgc tgtggcggat gattctcgcc    7860
gcgaacgccc tgccggtggc cggggtgctg gagcggatcg cggccgatct cgccgcggcg    7920
gcctcggcgc tgcggtccgg cgatctcgac gatgtgacgg atctgctgcg gcgcggcgtg    7980
gacggccacg gccggatccc cgacaagcac ggcggcccgg cgcgtgacta cacggtgatc    8040
caggtggtgc tgcaggatcg gccgggagag ctggcgaggc tcttcaacgc ggcggggctc    8100
gcggacgtca acatcgagga catccgcctg gagcactcgg ccggcctgcc ggtcggggtg    8160
gtcgaggtct ccgtgcgccc ggaggacacc ggccggctca ccgaggcact gcgcttccac    8220
ggctggcacg tcccgcccgt ccccgacggc aactcgagga tcgaccggac gcgagctatg    8280
gtgtcagact gacagccccc gatcgagacg gcgacacgaa tgcgcgttct ggtggtggag    8340
gaccaagtcg acctggccga ctcggtggcg cgggtgctgc gtcgcgaggg catggccgtc    8400
gatgtcagtc atgacggcga tgacgcacag gagcgcctct ccgtgatcga ctacgacgtc    8460
gtggtgcttg atcgggatat tcccggcgtc catggcgacg agctgtgcgc tgagatcgcc    8520
gtggacgatc gcaggacccg ggtgctgatg ctcaccgcgt ccgggacgac cgctgaccgg    8580
gtggcgggcc tgagcctggg cgccgacgac tatctgccga agccgttcgc cttcgccgag    8640
ctggtggcgc gcatccgcgc cctgggcagg cgcgcgcatc ctcccgcgcc gccgatcctg    8700
gtccacggcg acctgcggct cgatccggcg caacgggtgg cgatcagggg cggcatgcgg    8760
ctgccgctga ccaccaagga gctggcggtc ctggagcatc tgctgaccgc gcgcggccgg    8820
gtggtgtcgg ccgaggagct gctcgaacgg gtctgggacg agcaagccga cccgttcacc    8880
accaccgtga aggcgacgat caaccggctg cgctcgaagc tcggccagcc gccggtgatc    8940
gaaaccgtcc cgcgcgaggg atatcgcatc tgatccgcgc ggtcacagag cggtcacacg    9000
ttctctgacc ctcgtgtcac cttctgctcc gtagaactgg tgtcagatca ccagactgga    9060
ggagagggat gaggagaagc gagggtgacg acgaaccacg cactctcccg cctcgggccc    9120
gggaccgggt gtacaccgcg gtcacgcggg tgctcgccgt gctcctgctg cccgtggcgt    9180
tcgtccgtca gcccggccgc gcccgcgagc tggcctgcgg ctgggcgttg aggatgcgat    9240
tcccggcaga ggacctcacc gggctcaccg acggcgccag ggcggcgttc accgcggcgc    9300
gggccgaggc gctgtggcgt cacggccagc tcgtcggtct cacttccgga taccgcgatc    9360
cccgggtcca gcagcggatg ttcgaggagg aggtgcgccg ctcagggtcc gtggccgccg    9420
cacggatgtt cgtggcgccg ccggccgagt ccaaccacgt caagggcatg gcgctggacg    9480
tacgcccgca cgagggcgcg cgctggctgg aggcgcacgg cgcccgctac gacctctacc    9540
gcatctacga caacgagtgg tggcacttcg aacaccgccc ggagtgcggt ggcacgccac    9600
cacggcggct accccaccca ggcgcggcct gggcgagccg gaacgggggc cgggtctagc    9660
tagggcacgg ggtcgccgcg gggatcggtc cccggccggc ttcggcgcta gggcagctcg    9720
atgcggccgc tccgctgata ccagtgacgg cccgccagca aatgggtgac gaccgccttc    9780
tccagcgtcg agcgctgcgg aagctcctcc agcggctggc cgttgtagcg gaagacgaac    9840
tccaggatcg cgtcgtcccc gtcctgcggt tcggagtcga ggagcgtcca gccgcgtctg   9900
agctgcagga tgtgggagtc ctcggcgaga tactcggcca gctgcggatc gagcagccac   9960
gaggtgcctg tcgccgcccg ggcgccgtgc tcgggaaaat gccgttcgaa gaacgggcgg  10020
gcacgacgga gcgagtcgta atagatgtcg gggatcagcg gcccgcccac ttcggggatg  10080
tgcaggccga ggacgggcgt gccgtccttg gcgacggcca ggttgtactg gagccggccg  10140
agccggtaga ccaggccgcg cacgagcagg gtgagccacc acggcatgtt cgtgccgccc  10200
tcgccgtact tgcggcgatg gatggccacc gattccccca gctgcgtcag ggtctcccag  10260
gtggtcgcct cggggatgtc ccgtgtcgcg tggaagcgcc gcaacgccgg aagcgtcgcg  10320
aggaagacgt acacgtggaa gtagcgggcg gcggccccgg tctcgtacgg cagggtcggc  10380
ccaccccgta ccttcacctt gtagtcgccc atgtgccgga cgagctcgtg gtgggcgcgt  10440
tcgagcagcc accacagggc cgggtcgcga tccgggccgg gggtggccgc cacgatctcc  10500
tcgacgtcgg gagccggcac ctccagccgg tgtaagagat cacgagcctc atcgccctga  10560
ggcaggcgca ccggctcggg gggcggtccg agctcctcga gccgggagag ccacgccgtg  10620
gcgttctctc ccagccgcag ctgcctgcgc acgctctcag catccatcgt cactccgttc  10680
tgttccgccc ggccccggcg gccgtgtcga gcaggagttt cgcggccacg gccgccccgt  10740
cggcgcggat cttcccggcc acgtcgatcg cccgcgcgcg ggtctcggga gccagcgccg  10800
tggtgagcgc ggccgacagg ctctccacgg tcggcacccg cccgtcgtgt gccacgccga  10860
tgcccagctc ggccacccgg ccggcgtggt acggctggtc ggtcatctgg ggcaccacga  10920
cctggggagc gcccgcccgg gtgaccgcgg tcgtgatgcc cgcgctgccg gcgtggacga  10980
cggcggccac ccggccgaac aacacctggt ggttcacctc gccgacggtc aggcagtcgc  11040
tccggtcgtc gggcggggct aggccggccc agccacggga gacgatcacc cggtggccat  11100
gggcccggat cgcctcgatg gccaccctcg cggcgtcggt gggggcgggc ccgctgccga  11160
actccacgtg caccggtggc gggccggcct ccaggaacgc ctccacctcg gcgggcaggg  11220
gccgttcgtc gggcatgatc cacgcaccgg tctgcacgac gtcgaggtcc gtccgctgca  11280
gcggggccag gaccgggtcc gcggccagga aggggcgatc ggtgtagccg tagctgaaga  11340
tgtcgtccac cggcggcagg ccgatcgagg cccgccggct gttgagcgcg gcaccgaacc  11400
gctggtaggc gccctggttg ttgcggtccc acagcacccg gttgtcggtc acgtcccgcg  11460
cgggctgctc accgaggggt ggcggcggcg ggtagtacgg cgacggcaca tagatggggc  11520
agtagaagac gtagacgtag gggatgccga gcttctcggc caccgaccgg acggcgaccg  11580
ccgccgacag cacgccgctc accaccatca cctcgcaccc ctcggcggcc ggcaggacct  11640
ggtcgagctg cgtggcgatg gcctcggcgt cgagccgggg cacgtcctcg agcgagggcg  11700
gcctcttccc gtgcagcttc gcgcgcatcg aggtgccgac cggcaccagc ggcaccccgg  11760
cctcggccag tctctccgcg cagtccggcg gggcgcacat ccgtgtctcc gcgcctagct  11820
cacgcagctg gaccgccagg cccagcagcg gttcgacgtc cccgcgtgat ccggacgtcg  11880
acaacaacac gcgcatgtcg tatccctgtt ccgtggattc tggtgcggat cgatcggaag  11940
gccggagcct caggggtgat gtgtcagcca tctcatcccg tcgggtgagg tcaccagccc  12000
gccggggaac agtggctgct cgggctcggc gtccgcaccg agcaccgccc tcatctgctc  12060
ctgcccgccc tcctgcatca cctgtttgac cacctgtgac ttgaacagcg gcaccatgct  12120
ggagtcgtcg ccgtcggcca tctgatcgac ggccgcggcg aactcggcgc tgcgctcggc  12180
gatccgccct gaggtcgcca gcgccgtctc gccggaggac agaccgccca ccaggtccac  12240
gaacgactcc agctcggtgt actccttgtt gttggtgacc ttcttggcgt gccagaaata  12300
cgactcctcg ttcacgttca tctcgtagaa cgccagcagg aactcgtagt acacgctgta  12360
ctcgcggcga tatcgcgcct cgaactcatg cagcgcgatc ttctcctcga cgtcaccggc  12420
caggacgctg ttgatcgacc gggccgccag gaggccgctg taggtggcca ggtgcacccc  12480
ggaggagaac accgggtcca cgaagcacgc ggcatcgccc accaggatca tcccgggccg  12540
ccagaacttc gtctggtggt aggagtagtc cttgcggacc cgcagctgcc cgtacttgcc  12600
ggtcgtcacc cggcgcgccg gcgcgaggta ctccgagatc agcgggcact cggcgatcag  12660
cgcggccagc gccttctccc gatcgccctg gatcttctcc gccatctccc ggcgcaccac  12720
cgcgcccacg ctggtcagcg tgtcgctcag cgggatgtac cagaaccagc cgctgtcgaa  12780
ggccacgctc aggatgttgc ccgagtacgg ctccgccagc cgcttgccgc cctcgaagta  12840
accgaacagc gccaggctgc ggaagaactc cgaatagttc cgcgtgccac cgacgctgga  12900
atacaaccgg ctcttgttgc ccgacgcgtc gatcacgaaa cgcgcggaca ccgcgtgctc  12960
gccgccgtca ggatcgacgt aacgcaggcc ggtgacccga tcgccgtcct cgatcacctc  13020
ggtgaccgag catccctcac gcaccaccac gcccttgcgt ctggcgttgc cgagcaggat  13080
ctcgtcgaag cgtgcccgct ccacctggta ggcgaaagtc gtcggacccg tgatccgcgg  13140
agagacggag aaggagaacg tccacggctc cggccgcgcc ccccaccgga aggtgccccc  13200
gcgcttcacg ggaaaccccg ccgccgcgag ctcgtccgtc accccgagca tccggcacac  13260
cccgtgcacg gtcgagggca gcaacgactc gccgatctga taccgcggaa agacttcctt  13320
ctccaccagc agcacccgat gaccctgcat ggccaccagt gtcgccacgg tcgaaccgcc  13380
agggccgccg ccggcgacca ccacatcgaa ctcttccacg gacttctcct ttttcgttgt  13440
ggtcatgcga agtcgcccgg catttcggcc gcaggccgct accaggtgac cggcaactcg  13500
tccgggcaat cgatgaacgc gttacggaac ttcacttcct cggcggacac cgccaggcgc  13560
agcccgggaa accggcgcca caaactctga tacgccatgc gcagcagcgt cctggctatc  13620
gccgcgccta tgcagtaatg gatgccgtgc ccgaacccga cgtgcgagcc gcagtcacgg  13680
cgcacgtcga ggacgttggc attcggcgtc agcgcctcgt cgcgattcgc catcagaatc  13740
gagcacagga cgtaatcccc ggccttgatc agctggccgt cgacgaccac gtcccggacg  13800
gcgagccgtg gattcggctg ctgcacgggc gacaggaacc gcagcagctc accgaccacc  13860
cggtcggcct cctcgcgtcc ggcgaagaga gactgtcgct ggtcgggatg atccagcagc  13920
gcgagaaccc cgaagccgat cgaccccgcg acggtttcga caccacccag gatcagcgcc  13980
gtgagtacgc ccttcagctc ctcgtccgtg acatcgtctc cgtgctcccg caccagcatc  14040
ccgatgaacc cctcgtcagg gtccttccgc tgccggatga tgaggccgtt cagataccgg  14100
ttgaacgccg cgctgtcggc cgcccgggcc ttgaacccgc ggctgagatc gacgttctgc  14160
ctgacacgcc ggatgaactc gatccgatca tcacgcggga tgccgagcag ctcacacagc  14220
actcctccgc cgaccggatc ggcgaacagc gcctggacgt ccgcgggcgg ccccgcggcc  14280
tccagctcgt cgatgcggtc atcgatgagg tcctgcatgg cgggctccag ccggcggatc  14340
cggcgggccg tgaactccgg ggtcagcatc ccgcgcagcc gcgtgtgctc gggcggatca  14400
tagaccgaca gctgaccgac cagattcggc ggtatgggct ctccggcgat cgatggcgcc  14460
gaactccacc gggggcgcgt cgtgaagttc tcgtgatcgc cgagtattct gcgcacgacg  14520
tcgtatccca aagcctgcca gacatagtcg acacgcagct gagtggccgc gtcaccgcct  14580
atccggacca gtgggccatg cgccctgagc gcgaacatgt cctcatgcgg atcacagtgc  14640
gtccgcatca tgtagttcgc cgtcggctgc aggaccggcg cgcccgcatc gatatcgtca  14700
tccatacccg ggtcgaaact ccattcgctg tcgatccgca cgctcggctg atccgatcct  14760
ggtcgcgggc ggaagatatt tccagcgtcg tcaaatggac gatgggaacg ggaattccgc  14820
gatcaccagg cgaccatcag actggtcaat ccatacgcgg gagtggtcaa ccggaacgat  14880
ggctcccgat cgggatccgc gagcctcagc gtgggaaaac gccgccacag ggcggtgtag  14940
accgtgcgca gttcgaggcg ggccagagcg gctcccaggc aatgatggac gccgtgcccg  15000
aacgcgacat gggggacggg ctcgcgccgg acatcgaggc ggccggcatc cggcagcagg  15060
gcagggtcac ggttggccat gggcagagag caggagacgg tctctccctc cttgatcacc  15120
tggcccccga tggtgacgtc ctccatggcg acccggggcg tcggcgcata ggggacggtc  15180
aggtagcgga tcagctcgtc gaccgcccga tccgccgact ggtcgtcgcc ctgcaacgcg  15240
gcgatctgct cggggtgtct gagcagggcc agcacgccga gcccgatcat gccggagatg  15300
ttgtcgtcgc cggccagcat cacctgaacg cagaagcccc gcagctcctc gtccgtggcc  15360
gtgtcaccgt actcggcgag gacggctccg agcagcccct cgccgggatc cttccgctcc  15420
ctggcgatca tggccagcag gtagcgggag aacgccgcgc cggcggccgc ccgcctcttc  15480
tggctgcgcg aggcgtcgag atggccgtga cacagctgca tgaacatggc gcggtcgtcc  15540
cgtggcaccc cgatcagctc gcacagcacg gcccctggca cctcgtcggc gacgagttcg  15600
accagatccg caggggggcc cgcccgttcc agggcgtcga gccgttcggt cacgatctgt  15660
tcgatgtacg gcttcagccg ccggatccgg cgcagggtga atcccggggt cagcttctgg  15720
cggagccgcg tgtgctcagg cgggtcgtag tccatcaggt tcccgaccag ctcacgcggc  15780
cggaagttgc ctcttccgcc gatctcgtcc cgttcgttcc agcggcgccg ggtgctgaac  15840
cgccggtgat cgccgagcac ctgccgcacg acggtgtacc ccgtggccag ccaggtggtc  15900
tccgcgtccg ctcctgatcc gatggtgatc ctcgtcagcg ttccggcggc gcgcagttcg  15960
tccgccggat ccaggtcctg ccgccgagta tggaggggcc gcgcgccgtc accactcaac  16020
gggaagctcc tccacggcga agggggccgg cttccccggt ttgaaccgca ggtcctctgc  16080
cgggaccgcc agccgcagcg acgggaaccg gcggaccaac gccggcaacg ccacttgcgc  16140
ctggagcctg gccagcggtg ccccgaggca gaagtggacg ccgtgcccga acgcgaggtg  16200
ttcggggttg ccccgggtga ggtcgaagcg gtcctcgcgc gcacgattgc ccgccaggat  16260
cgagcaggtc aggacatcac cggcgtggat gtcccgtccg gccaggcgcg tgtcgaccag  16320
tgcggtccgg ggagaggggg tctcgacgat cgacgcgtag cggaacacct cctcggccgc  16380
gctgtccgcg agctccggac gctcgcgcag cagcgccatc tggtcggggt gggtcacgag  16440
gaggagcacc gcgatcgcca gctgcgaggc catctgctcg accgccccga tcatgatccc  16500
ctcgacgagc cccgccagct cctcgtcggt gacctcgcct ccgtgctcgc gcacgatgcc  16560
gccgatcatc ccggtgccgg gatcgaggcg ttcgcgagcc gccagtttcc tggcgtagtc  16620
gacgatgccc aggcccgaca cgttccgctg cctggggact cggctctccc ggctgtcccg  16680
gaacatcctc gacagctcgg cctggtcgtc acgggggacg ccgaggaagt cgcaggcgat  16740
cagcgccggg atgggccagg cggcgttcct gacgaagtcg accggcgacc ccatgctctc  16800
cagatcggcc aagcagtcct cgacggtctc ttcgacgaca ggccgcaggc tctcgatccg  16860
ccgggcggtg ttcgccctgg tcacggtcct gcgcaaccgg gtgtgatcgg gcgcgtcgta  16920
cgactgcagg attcccggca gccaggcgcg ctccgcctcg tcctcgaccg ggcgcatcga  16980
gctgaaccgg ttggcgtcgg cgagaatctc tctgatctcg ccatatccgg tgacgagcca  17040
ctgcttgtgg ccgtccagcc ccggctcggt gtcgtactcg tgcagcggcc cgtcctcttg  17100
caggtcgaag agcgccggca cgggatcgag cctcagccgc tgatgcggca gcggaaccac  17160
catgattctc ctcagcttcc ggcgttacca gtcgagcagc agtgctttca cgtcgaacgg  17220
cggcggcccc aatctgatct cttgttcggg ctcggccagc cggagtgcgg ggaagcggcg  17280
tgccagagcc gggatcgccg accggaagat gagctcggcc aggggtctgc caagacagtg  17340
atggatgccg tgcccgaacg cgacattcgg cgctctgtcg cgggtgaggt cgaactgatc  17400
gtccgggccg gggaagtgcc gccggttcgc tcccagcaac gagcacgtga cggtgtcgcc  17460
ggccttgacg atgcggtcac cgatgcgcac gtcctccagc gcgatccgcg gagtgagctt  17520
ctcgtcgatg gtgagatagc gcaccatctc ctccagccag tcaggcacga cgtccggctt  17580
gtcccgaagc agcgcgaact gctcggggac ctcggccatc agccacgcgc ccgccgcgag  17640
gaaacgagcc acctggtcac cgcccgcgcc catgacgaac gcggccagcc ccgtcagctc  17700
cgcgtcggtg atctcgtcac cgtgttcgcg caccacgacg ctgagcatgt cgtcgccggg  17760
atcacggcgc gtgcgagcca cgacctggcc catgtaggtc atgaacttgt tcccggcggc  17820
tccgcgtctg ctggccgccc gctgggaccg gctggcgtgc aggctgcgtg acagctccgc  17880
ctgatcatca cgtggaatgc cgaggaagtc gcaggtcgcc gtcgtcgcga tggaccaccc  17940
gaaatgcggg acgaagtcca gcgggccacc gatggactcg atggcgtcca ggcagtcctc  18000
gacgacctga tcgacctgcg ggcggaaccg ctccatccgc cggacggtga acgcgggcga  18060
gaccacccgg cgcagtcgcg tgtgctccgg cgggtcgtac tgggtgatga agccgggaaa  18120
gacgattccg gccgcggtcc cgccgtagag caacctggag ctgaacttgt ccgagcccag  18180
cacctgccgg acctcgtcga acccggtggc gagccacgcg gtccgccctc cagggccttc  18240
ctcggcgccc agctcggtca tcgggccctc ggccatgaag gaccgcagct gtggcaccgg  18300
atcgaaccgg tccctccagt gcagctcccc gggcaggacg acgttgagct cctcgaacac  18360
ttccacgtca caggtccttc cgcctcaacg gtggtctcag gccggtcgga cgggcgctgg  18420
gcccgtccaa ccgtccacat caagcggctg gacaccctcg ctcaggcgcc ggcttccgcg  18480
atgagactct tcggccggat gtccgtccag ttctcctcga cgtaggcgag gcattcctgg  18540
cgggtggcca cgccgtggac gcgggtccag ccaggcggca cctccgcgaa cgagggccag  18600
agcgagtgct gtccttcgtc gttgacgagc acgaggaagg agccgtcttc gttctcgaac  18660
gggttggtca tcgctgtgtc ctttcaccgt ccggccgggg ccggagtttc tcggcgacga  18720
cggccccgat ccgggccagc gccgcgggct gcagcatctg catgtggtcg atctcgatct  18780
cgtgaggctc gacggttccg gtggtgaggg gtcgccagct ggcgatggcg tccgcgacgg  18840
gcagatggga ggggcggttc actgtggcga cgaagagcag gatgtcgcag ccgaagctgc  18900
gggaggtgtg cagcggcccg acccgggcga ggtgctccat gacctcgtcc aggcgcttcc  18960
tggcgccggc ctccgtggcc accgcggcgg cgagctgcgc ctgctgctcc tgctgcctgt  19020
cgaagtccgc ggcctcctga tcggccgcgt cgccgcgcgg gcgccggagc ctgcccacgt  19080
cggtgggata ggcgtcgagc agggcgagca ggccgacctg ctccccttgc tcctccagca  19140
ccctggccat ctcctgcgcg atccgcccgc ccagtgacca cccgaggagg tggtacggcc  19200
cggtcggctg cacggcgcgg atctgctcga cgtaatcggc cgccatctcc tcgacgccgg  19260
ccgccagcgg ctccgtacga gccaggccgc gcgcctgcac gccgtagacc ggctggttgg  19320
ggggcaggct ccgcagcagg ggcgcgtagt tccagctcag ccctccgctc gcatggacgc  19380
agtacagcgg cggacggtta ccgccggctc gcagcggcag cagcacctcg aagtcgcccg  19440
tgccggtctt caccgagccg ctcgatcccc gccgctcgcc gacgacgacc agggtgcccc  19500
cggctgtcca gcgggcgagc aggcccgtgg gcagcatgcg ccgccccgtg gccccgaagg  19560
ggcaggccag ggtccggtcg cccggctccg cgtccaccgc cgcgccggtg aggtagagct  19620
cgccgacggc gacggcgggg cgcagccggt cgtcgagcac gagcgcgccg agcggaccgc  19680
cctcggccag gtcggcggcc accgggggca cggcctcgga ccacttcgcc ggcgcctcgg  19740
ccggacgttc gcgttcggcg tcgtccagca ggacgtccag gtcgctgacg cgccgctggg  19800
gatcctccgc cacctgctcc aggaagctga ccagccgccg tgccagcgac tcggccgtgg  19860
cctgatcgaa gaggtcggcg gcatagtgga gggtgccctc gatgccgtcc tcgtcgcggc  19920
gctcggtgag cctgaacgcc agatccagct cgatggcctc cggcccgaca ggttcgacgc  19980
tggtgcgcag ggcgggcagc tccgtcgcgt cccacgcgcc gaggtcctcc tcgtgcacct  20040
ccaaccccac ctggaacacg ggatggcggg agagcgagac cggcaggtcg agcagctcga  20100
cgatcctggc gaagggcacg tccaggtgct ggcgcgcgga ccggatcgcc tcctgcgccc  20160
gggtgacgac ctccaggaag gtggggtcgc ccgagaggtc cgtgcgcagg gcgagcggcc  20220
gggcgaaggg cccgatcatc ggctccaggt cgatgaggtc gtcgtcccgt ggcagcttcg  20280
tgccgatcac caggtcgtgg cccgccccga gcctggtcag cagcatggcg agcgcggcat  20340
gcacgatctg gaacgggtgc gcgccgatcg ggtccaccgc ctccaccagc ctggcgtgcg  20400
ggccggcgtc cagtcgcaac gacaccgtgc cggcccgccg cgacgcgacg gccgaccggg  20460
ggcggtcgaa cgggagcacc gtctccccgt ggatgcccgc cagattgtcg cgccagaaca  20520
ccagctgctc gttgatcagg ccgtccgcat cgcgctcgcc ttcgagcagg cgccgctccc  20580
agatcgcgta gtcggcgaac tgcagtgtca ggggcgcccg ctccggtgcc cggccggcac  20640
gccgcgcgcc gtacgccgcc gacaggtccc ggaggaacac atccagcgac tcgtcatcgg  20700
cgaggatccg gtgcaccatc aggtgcagga cgtgttcccc gtcggagagc cggaacaggt  20760
caccgcgcca cggcacctcc cgggtgaggt cgaagaccga ctcccgcagc tcggtgagca  20820
gcccgggcag gctctcctcg gtggcgggaa ccggcgtcag gtcaaccggc gaggcgtcgt  20880
gtacgtgctg gtgaacgctc tgcgcgtggc cggggaaggt cgtccggaga atctcgtgcc  20940
gcgccgcgac gtcgccgagc gccgcctcca gcgcgggcac gtccagccgg ccgcgcaagc  21000
gcagcgcgac cgagacgtgc aggccggcgg cctccccggg actcgccagc agccaggcgc  21060
tgagctgctg ggcggtgagc ggtacccggc ccggccgttc ggcgggctcc agcgcggggc  21120
gtgacttcgc ggccagcgcc cgggcgacac ccgcgggggt ggccgcggag aacagctgcc  21180
ggatgggcag gtccgcaccg agctcctcac ggatccgcgc gatgagccgc atggccagtg  21240
ccgaactgcc gccgagatca tggaaggcgt cgtcgacgcc cacccggtcg acgccgagga  21300
tctcggcgaa gagcgcgcac agcaccttct cggtctcgct ctcctgtgcc ctgtccggcg  21360
cacgtcccac gagatcgggg gcgggcagag ccaggcgatc caccttgccg ttgggcgtga  21420
caggcagcgc gggcagggcg acgaccgcca ggggaaccat gtacgcgggc aggaccaggg  21480
ccatctcccg ccggatctcc gccggccccg catcggttcc gtcggagatg aagtagccga  21540
ccaggcgctt ctcgcccggc tggtcctccc gcgccacgac gaccgcctcg accacgccgc  21600
gctgggccgc cagcacggcc tccacctcgc cgagctccac ccggtagccg cggatcttca  21660
cctggtcgtc ggtgcggccg aggaacacca cctcgccgtc gcggttccag cgcgccaggt  21720
cgccggtgcg gtacatgcgc tcaccaggag aagggtccac ggaggccgga acggccacga  21780
accgctctgc cgtcaggccc ggcccgccga gatacccgcg ggccagcccg gtgcccgcga  21840
tgtacagctc gcccgccacc cccggcgcga ccgggcgcag gaaggcgtcc aggatgtaga  21900
tcctgcggtt ggtcatggga cggccgatcg gcagctcccg cccgacctcc tcgccgggct  21960
cgatcggctt ccacgtcgcg cacagggtgg tctcggtcgg tccgtacgtg ttgcgcaccc  22020
gcaggccggg cacggcccgc cgcaggtgct ccacggactg cgccggaacc acgtcaccac  22080
cggtcccgac ctcgaccagg cccgcgaaac actccgggga cgactccgcg agggcccgga  22140
aggtaccggc ggtgagatgg acgaaggtca cgccccgttc gacggcctgt ctcatcccga  22200
gcgcgtccag cactcccggc tcggtgagca cgacccggcc acccatggcg agcggcaccc  22260
acatcgcgta gagcgaaggg tcgaagacgt gcgtcgcgtg catcagcacg gcgtcgcccg  22320
ggccgatccg ccagccctcg tcgcccgcca ggccggccac ggccccatgg gggacgccca  22380
cccccttcgg caggccggtg gagccggagg tgtacatcac gtacgccagg tcgtcggcgc  22440
tcagccggat ctgcggcgcc gtggcggcac ccgcgtcgat ggccgcgcgg gtctccgggg  22500
cgtcgatgac gatcgcgtcc gccggcgcca cttccctggt ggcccgggtg cacaggacgg  22560
ccgagacacc ggagtcggcg agcacgaact cgatccgctc ggccgggtgc tcgacgtcca  22620
ccgggacgta cgcggcgccc gccttccagc tcgccaggaa cgcgatcagc aggtcaggcg  22680
acctgtccat gaccacgccg acgcggtcgc cacggccgat gccacgagcg gcgaggtggc  22740
gggccagccg gttcgccgcc tggtcgacct cggcgtaggt caggtccgcg ccgccggcat  22800
cggtgatcgc caccgcgtcc ggcgccgtgg ccacccgccg tccgaagaga tcgagcacgg  22860
actgccccgg cgtggggccc gccgtcgcgt tccagtcctc caccaccagg gcgcgctcgg  22920
cttcgctcag cagcgtcagc cggccgacga ggacgtcggg ctcggcgacc agccgctcaa  22980
gcacgcgagc cagcgcgccc acgaccgatt cggcggccgc ctcgtcgaag aggccgcggt  23040
cgtagtcgag gatgagcggc atctgcgcgc cgggcccggt gatcagggtg aacgggtagt  23100
gcgaggagtt gcgtccgcgc cgcaccggtc tcaggtccag gccgccgtcc tcttcggccc  23160
ggccgagtcc ctggcgcggg aagttctcgt agatgacgag cgtgtcgaag accgccccgg  23220
gcccgacggc ggcctgcatc tcctgcaggc cgagatgctg gtgcgccatg agtgccgact  23280
ggctgcgctg cagctcggcg agcagctcga cgacccgccg gccgccttcg agccggaccc  23340
gtaccggcag ggtgccgagc agctgcccga ccatcgactc cacaccggcc agctcggcgg  23400
gccgccccga ggcggtcgcg ccgaacacca cgtcggtgcg gccggcgagc tgcgccagga  23460
ccatggccca cgcaccctgg acgacggtgt tcaaggtgag gccgtggccg cgcgccagcc  23520
gcgccagccc gtccgtcagc tccgcggaga gctcgatcac cgcggtgccc atgtccggca  23580
cgcgggccgg atcggccggg gcgaccagcg tgggcgtgtc cagtccggcg agctcctgcc  23640
gccaggccgc ccgggccgcc tccttgtcct gccggcccag ccaggcgagg tagtcccggt  23700
aggacacggc ggcaggcagc ccggacgcgt cgccgcccgc cgcgtagatc gcggccagct  23760
cgcggtgcag gatcggcatc gaccagccgt ccagcaggac atggtgcagg gtgtgcacga  23820
gccggtggct ggccgggccg agccggatga ggtgcagctt catcagcggt gccgcatcga  23880
gggggagccg ctcggccagc tcgtccgccg ccagccggtc cacctcgctg tcgaggaggt  23940
cgtccggcag cccgtggaga tccgtttcac gccaggggat ctccgcctcc cgcgcgatga  24000
cctgcaccat ctgcgcgccg ctgacatagc ggaaataggc ccgcagcgcg gcatgccggt  24060
ccacgagcgc ctgccacgac gccctcagcc gcccggcgtc cagcgggccg tcgatgccgt  24120
acacggtctg caccgtgtag gtgtcgggcc cgtcgtcgtc gagggcggtg tgatagagca  24180
tgccctcctg cagcggcgag aggggccaga cgtcttccac gctggagcgc ggcttcgcac  24240
gagtgtcgtc aatggtcacg atctgctcct tatggagtca tccgccggcc ggtccggcct  24300
cgagttggtc cagctgatca ggcgaaagat ccacgagtgt gccggccggg ggctccggtt  24360
ccccggtgcc ctcgccgtcg gccgggagct ccttgacgac cgccgccagc cgttccgccg  24420
tcttctcgtc gaacacctgc cacggggtga ggtccagccc cttccggcgg gccagggccg  24480
acagctgcat cgaggtgatc gagtcgccgc cgagctcgaa gaagctgtcg ccggcgccca  24540
cctcctccag gccgagcacc tccgcgaaca gctcgcacaa cttcgcctcc atggccgagc  24600
gcgggtcgcg tcctgacgac gacctcgcga aatcgggggc ccgcagcgcc cgatgatcga  24660
ccttgccgtt cggggtcagg ggcatcgtgt ccagcgggac gaacgccgcc ggcctcatgt  24720
gctccggcag gcgtccggcc gcgctctcgc ggagggcgga gatcaacgcg ccgtcctgcc  24780
cggcctcgga gggagcgccg gccacctgct cggccgcggg gacgacatac gccaccaggt  24840
acttctggcc cggaccgtcc tcgcgggcga cgaccgccac ctgggcgacc cccggatggt  24900
ccgccagcac ggcctcgatc tcacccggct cgatccgata gccgcgcacc ttgacctgcg  24960
cgtcggcccg gccggtgaag accagctcac cgtcccgggt ccagcgggcc cggttgccgg  25020
tgcggtacat gcgctcacca ggacgggcag ggctcaccga ggccggcacc gcgacgaacc  25080
gctccgctgt caggcccgga cggccgaggt agccgcgggc gagcccggcc cccgccacat  25140
agagctcgcc ggtcacacct ggcggcacgg gctgcaggaa ggcgtcgagc acataggctc  25200
gcaggccggt gatcggccgg ccgatgggca ccacgtcgcg tcccggagac agcggggagc  25260
tcatcgtcgc gcagacggtc gtctcggtgg gcccgtaggc gttgatcatc cggcggcccg  25320
gcgaccagcg gtccaccagc gcgggcgggc aggcctcgcc ggccacgacc agggtctcca  25380
ggctgtccgg caggtcgtcc tcgacggccg gcacgctcgg cggcacggtc acgtgggtga  25440
tgccccaccg gcgtaccgcg tcgcccagcg acacccgggg cggcatgctc tccgcgtcgg  25500
ccagcaccac ggtcccgccc gacaacaggg ccatgcacag ctcggagacg gcggcgtcga  25560
agccgagagc ggcgaactgc aggatccgcg aggcggacgt gacgccgaag cgctcgatct  25620
gcgcgctcgc cagattgccg agcccggcat gggggacgag gactcccttg ggcacgcccg  25680
tcgaccccga ggtgtagatc acatacgccc cgtcacccgc ctccacccgg ggcagcgcag  25740
tgcgcggatc ggcggcgagc ggcgcgtcca gcgccaccac cgcgcccgcg aactcctccg  25800
ggacggcctg cctggtctcg ctcgtgcaca gcagcacctc cggcgcggaa tccgccagga  25860
tgaagctgat gcgctcgcgc ggataatcgg gatccatcgg gacgaacacc ccgcccgccg  25920
aggacacccc gagcagtgcc accaccagct cggccgagcg tcccacgagc acgcccaccc  25980
gcgtctcacg gcgcacgccc agccccacca gcagccgcgc cagctcctcc gcctcgtcca  26040
gcagtccgct gtacgacagg ctccgggccg cgtccaccac cgccaccgca tccggcgagc  26100
gctccacctg ccggcggaac agcatcggca ccggctccgc ggcgggcggc acgccggtcc  26160
tgttccactc ctccaccacc aggcggcgct gctcaggacc gatcaggccc acgcgcccga  26220
ccggcacgcg cggctcggcc accacctgct ccagtgcccg gaggatcgac gcgagcatct  26280
cctcggcctc ggcccgatcg accacgtccg gccggtagat gaactcaccg tggacgcggc  26340
ccgccacgga cgcgcgcatg gacagcggat agtgccctgt gtcgttcggg atgcccgcgg  26400
gccgcatgac gagcgcgtcg gggccttcgg gccgaggcgg cgggggcggg tagttctcga  26460
acaccacgat cgtgtcgaac gccgcgcccg gaccggcgag ctggttgatc tcgctcagcc  26520
ccacgtgctg gtgcggcatg cacgcgacct gccgttcctg aaggtctgtc agcatgtcga  26580
ggaacggctc cgcaccggcc aggcgagccc ggaccggcaa catgttcatg aacaggccga  26640
cggcggactc cacaccgggg atctcgggcg ggcgcccggc caccgcggcg ccgaagacca  26700
cgtcgtcgcg tccggtcagc cgggccaggt gcagtgccca gatcccctgg aagagcgtgt  26760
tcgccgtcac gccgtgacga ccggtgaact ccaccacgcg ccggctcagc gcctcgtcga  26820
gttcgaaccc gacacgttcg ggctccaggg gagtggtgat cgtctccggc ggcacgacgt  26880
gggtcgcctc gtcgagcccc gccagctcgg cccgccacgc ctctcgggcg gccgccttgt  26940
cctggcgggc gatccaggcg agatagtcgc ggtacgacgt cgcggccgga agggcccggc  27000
cgtcaccgcc ggactcgtac acggtcagca cgtcctcggt gatcagcggc agggaccagc  27060
cgtcggccac gatgtgatgc gaggtcagga ccagccggtg ccggcgttcg ccgaggcgca  27120
ccaggtgcag ccgcagctgc ggcgcccggg tcaggtcgaa ccgctcggtg tgcagctgct  27180
ccgcgaggcg gtcgaactcc gccagcgcct cgtcctcggg cagccgggac agatcggtct  27240
cctgccagtc cagcggcacc tcgcgagcga tcgcctgcac ggccgcgccg gacccgagct  27300
ggtggaagct cgcccgcagg gcggggtgcc ggtcgagcag agcctgccag gaggcgcgga  27360
accgggcgac gtccaacgga ccgtcgaggg cgagcttgcg catccccgcg tagacgtccg  27420
ggccgcgctc gtcggcggcg tggaacagca ggccctcctg gagcggagac agcggccaga  27480
tgtcgagcag ggtcggtacg gcggcctcga cctccgccac gtcctgctgc gtcagcgaga  27540
tgagcgggaa gtccgacggc gtgtgcccgc cggcgccgcc gccaccgacg tgtgccgcaa  27600
ggccggtcag catggccagc caggcctgcg cgagcgactc cgcctcggcc tcgccgagca  27660
gccgccccgc ccaggtcacg gtcaggctca gctcaggtcc tgccgcaccg tccagcacgg  27720
ccgcgtcgat ctccacggcg tgccgcaacg ccgtgtcctg ctccgccgtg ccgccgatgg  27780
tgcccagcag ctgccagggc tccggggcgc ccgcggaccg ggacgggaag cggccgaggt  27840
agttgaaccc gatctccggc ttcggcgccg ccgcgagagc ctgccccgtc ccggcgttga  27900
gatagcgcag gatcccgtag ccgagcccgc cgtcgggcac ggcccgcacg ttctccttga  27960
cctgcttcag caggtgaccg gccgcaccgc cacccgcgat cacttcggcc ggatcgatcc  28020
ctgtcacatc cagccggagc ggatgcacgt cggtgaacca gccgaccgtc cgcgacaggt  28080
ccagctcgtc gatgggccgg cggccgtgac cttcgacgtc caccacgacc gcggtgccgc  28140
cgcgccagtg ggccaccgcg cctgccagcg tcgccagcaa cacctcgtgg acaccgcagt  28200
ggaaggcgga ggtggcctgc tccacgagca cgcccgcccg gtcatgcggc agcgtccacg  28260
atgtgcgtcc cgcggtcgag acggtgtcgc gcgccgggtc gagctcgccc agccgcgatc  28320
gcgccccgtc gaggatctcc gtccacgtct ccagctccgt ggcccgtgtc accgcctgat  28380
cggccagcgt tcgcgcccag cgccggaacg agacgtcgac ggggtcgagc accggccgcc  28440
ggccggcggc cacggcttcg caggccacct gcaggtccgg cagcaggatt cgccacgaca  28500
cgacgtccac cacgagatgg tgcgccgcca cgacgagccg tcccacccgc cctggccccg  28560
cgtccaccca gaccgcccgg atcatcacgc cggcgtgggg atccagccgt gcggccgcgt  28620
cgcgggcgca gcgatccgcg atctcatcca cgtcaccggt gccggcctcg acccgttcga  28680
ccagcgtcgc cgcgtccacc gctccgcggc cggccacgac cagccggggc tgcgcagccc  28740
cggtgcggac gatccggctg cgcagcatgt catgcgcgtc gatgaccgcg cccaatccgg  28800
ccgccagcac gtccaccgac aggtcgtcgg gcgcaccggc ggtcacccac tgggacaggg  28860
cgccccgggt catcgcgtcg ggatcgcgtt cgagcagtgc ccggatcacc ggcgtcgaca  28920
tcacctcacc gacgccgtcg tcgaggctcg cccgcgtcgc accgccgcgt tcggcgacca  28980
tcgcgatccc ggcgggcgtc ttgcgctcga agacgtcctt cgcgccgaag acgagctcct  29040
cacgtcgcgc gcgggcggcc aaccgcatgg agaggatcga gtcgccgccc agctcgaaga  29100
agctgtcctc ggctccggct cgcgccacgc ccaggacctc ggcgaacagt tcgcacaaca  29160
cccgctcggc ctcggtacgc ggctcccggc cggccgcctt cccggtgaac tcggggacgg  29220
gcagcgcggc acggtcgatc ttcccgttgg gcgtcagcgg gacgccgtcc agcagcacca  29280
ccgccgccgg caccatgaac tccggcagcc gtcccgcgag gtgctcgcgt accgcgtcgg  29340
gatccaggcc cgagccctcc tccgcggtca cgtaggcgat gagtctcttc tcgccgggac  29400
ggtcctcccg cgccacgacg accgcctgcg cgacgtgcgg aacctcggcc agcgccgcct  29460
cgatctcccc tggctcgacg cggtagcccc ggatcttcac ctgggagtcg gcccgcccgg  29520
cgaacagcag ctcgcctcgg tccgtccagc gcgccaggtc gccggtgcgg tacatccgct  29580
caccggaggc cgcggggttc accgaagcgg gcaccgcgat gaaccgctcc gaggtcgccg  29640
cgggggcgcc caggtaaccg tgtgccaggc ccgcgccggc gaggtagagc tcaccggtga  29700
cgttcggcgc caccggctgg aggaaggcat ccaggacgta cacctgccgg ccggccagcg  29760
gacggccgat gggcaaggtg tcgcccgttt ccgtgtgcgg ctcgatgagg tgccaggtgg  29820
cgcagagcgt gacctcggtg gggccgtaca actcccggac ccggacctcc gggcatgccc  29880
ggcgcacccg tgcgacggac tcgagcggca ccacgtcccc gccggtgagg acctcgcgca  29940
gcccgctgaa ggagtccggc gactcctccg ccagcacccg gaaggtcccc gccgtcagat  30000
ggacggtggt cgcgccccgt gcgatcacgt cccgcagccg ctgcgcgtcg atcgcgcccg  30060
gttccgcgac catcacgcag gctccgctga ccagcggcac ccagatctcg agcagcgacg  30120
cgtcgaacgc gtgcgacgcg tgcatcaaca cgcggtcgcc ggcgccctgc gaccagcccg  30180
ggtcgccggc cagagccgcg gcgctcccat gcggcaccgc gacgcccttc ggcaccccgg  30240
tcgatccgga cgtgtacatc acgtaggcca cgtcatgcgc tccgaccgcg agcggtggcg  30300
cctcgtgccg ctccgcctcg gtcgcgggtg cgtccatgac caccggctcg atcccgtccg  30360
ggaccgcgtg ccgggtcgct cccgcgcaca ccgccaccga cgcgccggcg tcggccagca  30420
tccgctcgat gcgctccgcc gggtagtcca cgttcaccgg gacttgcgcg gcccccgcct  30480
tccagaccgc gagcagggcg acgatcaggt ccgcgccgcg ttccatcagc acgccgacgc  30540
ggtcgccgcg ccgcacgccc ctcctggcca ggtgccccgc cagccggtcc gattcccggt  30600
cgaggccggc gtaggacagg gtgcgtccgt cgccgatgac cgccgtcgcg tccggcgccg  30660
cgtcggcctg gcgccggaac agctccggca ccgatgaacc gccggccgcc gcaccggtcg  30720
agttccagcg ctccgtcacg gagccgcggg tggatcggct ggtcacggcc aggcggccga  30780
cgggaagcga gggctccgcc accatccggg ccaggacccg cacgacctgc ccggtgatct  30840
cggcggccag gtccccgccg atccagtcgg gccggtagtc cagctggatc tgcaggcgcg  30900
cgcccgggat gacgctcacg gacagcggat aggtggtgcc ggtccgcgtg cggatcgagc  30960
tgatcgccac gccaccgtcg tcgagaccgt cggcgtccag cgggtagttg acgatcatca  31020
ggatcgtgtc gaagatcgag cccggccccg ccgccttctg gatctccggc agccccaggt  31080
gctgatgctc cgtcaaggac gactggcgcc gctgcaggtc ctggagcagg tccagcaccg  31140
gaacagcccc gtcgaggcgc acccggaccg gaacggtgtt gatgaacatc cccaccatcc  31200
gctcgacatc cggcaacgcg tccgccggac gcccggacac gaccgtgccg aacaccacat  31260
ccgtccgtct cgccagccgc gccagcacca gggcccaggc gccctgcacg accgtgctca  31320
acgtcagccc atgaccacgg gcgaagccgg tgagggcgcg ggtcgcctcc tcggacagcc  31380
attcggcatg cccgtccggc atcaccggcg ccttgcccgc gtcgaggccc accacggtcg  31440
gttcgtccag cccggcgagc tcggcccgcc acgccgatcg tgccgcgtcc tcgtcctgac  31500
ggctcagcca cgccacgtag tcccggtagg agggcggcgc cggcgagacc cgtccgtcgg  31560
cgtaggcggt cagcatctcg cccagcagga tcggcgtgga ccagccgtcc acgagcacat  31620
ggtgcgacgt caccacgagc cggtgccgcg ccgcaccgag acggatcagc agcaaccgca  31680
gcagcggcgc cctgctgacg tcgaaccgct ccgcctgatc cgccgcgagc aggcgttcca  31740
cctccgcgtc cggctcatcg agccgcgaca ggtccgcctc acgccacagg acctcggcct  31800
cgcccacgac gacctgcacc gtctcgccgg atcccagctg gtggaagccc gtccggagcg  31860
tctcgtgccg gtcgatcacc gactgccacg ccgcgtgcag ccgttgcgcg tcgagcggcc  31920
cgtcgaggtc caggatccgc tgggtctggt agacgtcgac gccgtcctcg tcgaaggctc  31980
tctcgaagag gatgccctcc tggagcggcg acagtggcca gacgtccgtc aggccgggcg  32040
ccacggcctc cagttcgtcc acgtcccgct gccgcacctc gaccagctcg aagtcggacg  32100
gtgtgtgtcc gcccgcgccg ggagtgtcgg cgagagcggc gaggccggcc agcgtgtcca  32160
gccacgcctc gccgagccgc tccaccgcgg cagggtcgag gtccctgccg tcgatggcga  32220
gtctcagccg ggggccggcc ggcgtgtcct gaacgtccgc gccgacctcc agggcgtggg  32280
actggacgag gtccggcccg gccgcctgtc cgccgagagc cccttcgcac acctgccacg  32340
cggtgtcctc ggaggcgacg ccggaccgtc cgagatagtt gaatccgatc tgggccgacg  32400
gcagctccgc cagccgggcg ccggtttcgg ggttgaggta gcgcaacagc ccgtagccga  32460
gcccgtcgcc cggcaccgct cgcgcctgtt ccttcacggc cttcagcaac tccccggccg  32520
ccgcagctcc tggaccgaca ccggagacat cgaggcggac cggatgaacg ctggtgaacc  32580
agcccacggt acgcagcaga tcctctccgt cggcggcatg gcggccgtgg ccttccacgt  32640
ccaccaggat cccggcgtca gcaccgcgcc accgcgccac cgcacccgcc aggcccgcca  32700
gcaggacgtc ctgaaccccg cagtggaagg ctgccggcac gcgcgccacc aggttgcgcg  32760
cttgggcatc ggacagtgtc cgcgaccacg acgccgactg cccggggtgc cgctccagcg  32820
gcaggtcgcc gccttcgagc acgccggccc aatggccggc ctcggccacg gtgctctcgc  32880
tgagcgcctg cccggccagc cgccgcgccc attgccggta cgacgtcacc gcgggttcga  32940
ggacgggggt tccgccggag accgcctcgt cgtaggccgc ccgcagatcc gacagcagga  33000
tcgcccacga gaccgcgtcg acgaccaggt gatgcaccac caaggccaac cggcccggct  33060
cggcgtcgcc cgcgtcgacc cacacggccc ggaccatgat cccttcggac gggtccagcg  33120
tgcccgccgc cgtcctggcc tcgcgctcgg cgcgctcagc gaggttcccg ttcccggccg  33180
ccacccgcgt caccaggccg gccgcgtcca cggcacccgg ctcggccacc atcagccgtc  33240
cgtcgggctc cacccgcgtc cgtagcagat cgtgcacatc caggacggcc tgcagggcgg  33300
tcaccagcgc gtccggggcg aagccggccg gggtgacgac gacccgcgcc tgcgcgaaac  33360
cggggcgcac cgcgtcatcg ccgagggcac gcatcaccgg cgtcctcggg atctcgccca  33420
cgcccggctc cactgaggag gctcgcctcc ccggggcctg ttgagccagc gccgccagcc  33480
gctcgggcgt gcggtgctcg aacacctgtc ggggggtcag cgggataccc tggcgccgcg  33540
cgcgggcggc gacctgcatc gacgagatcg agtccccgcc cagctcgaag aagctgtctg  33600
cgaccccgac ccgccccgcc cccaggacct cggcgaacac tccgcacagg atccgctcgg  33660
cgtcggtggc cggctcccgg tccaccgccc cggcagcgaa gtccggctcg ggcagggccc  33720
ggcggtccac ctttccgttg ccggtcagcg gcaacgcgtc cagcaccagc accgcggccg  33780
gaaccatgaa ctcgggcagc gtcgcggcga gctgctcgcg tatccgcacc gggtcgaggt  33840
ccccccctgt ttcggcgacc acgtaaccga tcaggcgctc ttcccgcgcg gacaccacgg  33900
cctgaccgac acctggaagg ccggcgagga ccgcctcgat ctcgccgggc tccacccggt  33960
acccgcggat cttcacctgg tcgtcggcac gcccggcgaa cgccagctca ccctgatccg  34020
tccagcgcgc caggtctccg gtccggtaca tccgcccacc gggcacgaac ggctcggcga  34080
cgaaccgctc ggccgtcaac gccgggcggc ccagatagcc ctgcgccacc ccggccccgg  34140
cgacgtacag ctcgcccgtc acccccgggg gcacgggccg caggaacgcg tcgaggacat  34200
agacccgccg ccccgcgagc ggacgcccga tcggcagcac cggccccgtc ggctcgcccg  34260
gctgcagcag ccaccatgtc gcacacagcg tggcctccgt cgggccgtag agatgccgca  34320
cgcggacgtc cgggcacgcc cgccgcaccc gttccaccgc cgcgagcggc accgcgtccc  34380
caccggtcag cacctcgcgc agcccggcga ccgactccgg tgactcctcg gccagcaccc  34440
ggaaggtccc cgccgtcagg tgagcgcagg tgacaccgcc ggccacgtac ccggccaggg  34500
cctcgccgtc caccgcgccc ggctcggcga gcacgacccg ggcgcccgac agcagcggca  34560
cccacagctc gaacagcgag atgtcgaacg cgtgcgaggc gtgcatcagc acggcgtcct  34620
cgggccccag cccccatccc ggctcgccgg ccagcgccgc gacgttgccg tgcgagaccg  34680
cgacgccctt cggcctgccc gtcgatcccg acgtgtacat cacgtacgcg aggtcgtccg  34740
cgtgcgcacc cgcggagaga cgggcgtgct ccgccaccgc ccgcagcgtg tccgggtcgt  34800
ccaggacgat cggatcgagc ccgccggccg gcacggcggc ctggcacgct cgctcggtca  34860
ccactgccgc cggctccgcg tccgcgagca tgaactgcac gcgctccgcc gggtaggcgg  34920
gatccaccgg cacgaacgcc gctcccgcct tccacaccgc cagcagcgtc gcgatcaggc  34980
cgggtgaccg gcccatcacc acggccaccc gatccccgcg ccggacgccc cggccgctca  35040
ggtagccggc gagcctctcc gcgtgctcgg ccagctcacc gaacgagacc gcccgcttcc  35100
cctcgacgac cgccacccgg tcacggccgc gctccacctg gcggtcgaag agatccggag  35160
ccagctcgcc cggcgccacg cggggtgccg cactccatgc gttcaccacc agcgcacgct  35220
cggccgcact cgtcacgtcg acctcggcca ccgtgaggtc gcccgcgccc gccagctgcc  35280
gcagaatccc ggtgaatcgc tccaggatgg cgagcgcggc ttcccggtcg aagaggtccg  35340
tcacatggtc gagattgagc agcatcgact cgccggggac ggcgaccagc gtcagcggat  35400
aatgggcggc ttcccggccc tggtctattc gaatatcgaa ggctgccgcg gcatccgatg  35460
ggcgaagctc acggggaaag ttctggaaaa cgagcaaggt gtcgaagacg gcgccggcgc  35520
cggccgtcct ctgaatatcc gccaatccca tgtactggtg ggggatgagc gccgactgcc  35580
gcttctgcaa atccgccagg aattcgatga ccggcgtcga accgctcagc cgcacgcgta  35640
cggggacggt gttgaggaac aaccccacca tcccctcgac gccgggcaga tccggcgggc  35700
gtgccgagac cgccgcaccg aacaccacgt ccgtccggcc cgcgagctgg gcgagcagca  35760
acgcccacgc gccctgcacc actgtgttca gcgtcagccc atgggtgcga gccagctcgc  35820
tcagggctcg cgtgaggtcc tcgggcagct cgaccgtgat gttctccggc atggcgggcg  35880
cccggttcgc atcggcgggc gccaccagcg tcggctcctc gacaccccgc agctccgccg  35940
cccatgccga cagcgtgcgc tccttgtcct gccggtccag ccacaccagg taatcccggt  36000
acgacggcac cgcgggcagg tccagcgggc tcccgtcggc cgcgtacagc atcgacagct  36060
cgtcgagcat gatgggcatc gaccagccat ccatgatcgc gtggtggcag gtcatcacca  36120
ggcggtggtc gtcgccggcg agacggatca gggtcagccg cagcaacggc gccttcgcga  36180
ggtcgaacct ccgcgtcctg tcctcctcgg ccaccgcgcg cacggcctcc tcgggctcgc  36240
tgaggtggga gaggtccacc acccgccacg gcagctccac ctgcctggcg atgagctgca  36300
ccgtctcacc tgatttgcgc tgccgaaaac aagcccggag agcggcgtgc cgcgccagga  36360
gcgcctccca tgcggcacgc agtctgtccg cttccaccgg accgttcagg ttcaggatcc  36420
aatggcccac ataaaggccg ggccagtcgt cgtcataggt cgtgtggaag agcaaccctt  36480
gctggagtgg tgacagcggc cagaaatctt cgatccgcga ctgagccatg gatgaatatc  36540
tccctcaatc agcaaagcgg cccgagaggg aatcatccat tgatgggtct gacccggaca  36600
atctgtccat ccgtgactgc cgtcaccgat ccgggtgggg tcgaaggagg ccgccgacgc  36660
ggaacgtggc ggcttgcggg cgagcaacat ggctacggcg cgccatccac agctggatgg  36720
cgcgccgtag ccaggttcac cgctcgatcg agcgcggcct cactcgaagg aaagccccgc  36780
ggccggcgtc acccggacgg cccggcgtgc cgggagaaca ctggccagga gccccgccag  36840
ggcggcgacg aggacgacga cggcgagcag tggccagggg acctgcatgg tggcgttgtc  36900
gagagcctgc ttcacgaagg tctcgtaacc gacccaggcg aacccgatgc cgatcacggt  36960
gccgagcacg gcggccacca gggagagcag cacggcctcg gcggccagca tccgccgcaa  37020
ctgcctgcga gtgagcccga gcgcgcgcag cagcgcgtgt tcgcgaacac gctcgagaac  37080
ggacaggccc agggtgttgg cgatcccgac gagggcgatc gccacggaga agccgagcag  37140
cgcgacgatg gcccaggtga ggatcatcag cggcgcgttc tccgtctcac gggcctccag  37200
ctggtcgttc acgttcgccc cggccgcggc cgccaggtcg cccagctcac cgacgagccg  37260
cgtcgagtcg gcgtcggcgg atgcgcggat ccagacggca cgcggcgcgg cggagtcggt  37320
gagccgggcc agcgtctccg gcgcgacgac ggcctgcagc ccccagccgg tggcgagcga  37380
gacctgcagc acggcccgcc ggtcgccgac cgtgaccctg accttgtcac cggcccgcag  37440
gcgcagctgg cggaatgcgg actcatcgag cctgagcacg cctggctcca cccgggcgaa  37500
cgacccgccg tcgtgggcca cccgctgggc atccggcgcg gtgaccaccg ggatcggctt  37560
gtcgaggccg gagaccgtgg cgacggcgcc gtccaccgcg atggcctgat ccaccccgga  37620
agtgccacgg accttgtcga ggaagtcggc ggagaacggc ttgccggtcg agaccagcgc  37680
ggcgtcgatg gggtgctggc cgtcgagtct ctcgttcagc gcctcggagg tgatggcgac  37740
gccggtcagg acggcggtga tcagggtgat accgaccagc agtgaggcgg cggtggtggc  37800
ggtccggcgc gggttgcgca cggcgttctt cgtcgcgagc cgcccgatgg tgccgagccg  37860
cgtaccggtg atctccagca gacgggggat gagcaccggc ccgaacagga gcacgccggt  37920
gaacaacgaa ccgccgccgg ccagcatgag caccgtgctg tgccaagcca tcgccgacgc  37980
gagcaggacg agcccggcga tcaacatgaa gacgccgagc accagccgtg cccgccccgt  38040
ggctgtacgc gggtcggtcg cggtgtcggg acgcagtgcc gccagcgggc tcacccgcac  38100
cacgcgccgg atcggcagcc aggccgcgac cagggtggcc gtcagcccga tggcgagccc  38160
gcccagcagc cacggcgcgg gcggtgccgg ggcggcgatc ggggtgatcg gtgagagggt  38220
cttgatcagg gcgatgagcc cgtagccgag tccggcgccg accagcacgc cggccagcga  38280
cgacaggagg ccgacgacgg ccgcctcccg gcgtaccgaa ctcaccacct ggcggcgggt  38340
cgcaccgacg cagcgcaaca gggcgaagtc gcgcatgcgc tgggccagca ggatggagaa  38400
ggtgttcgcg atgaccagga tcgagacgaa cacggcgatg ccggcgaaga gcagcagcag  38460
cagtgaccag gtgtccacgc cgttctggag ctgcgccgtc cgggccgcga tctcctgctc  38520
cggggtctgc accttcgcgg tctcgggcac cggaccgacc gcgccgcgca ccgtcaccgt  38580
gtagatgccg agggagggat cgtcggccca gcgcatgagc tgcggccagg tgacgtacac  38640
cgacgcctgc gccacaggag aaggcgcccg cacgatgccg accacggtga agtcggctgc  38700
cgtggcacgc tcacctatcc ggatgcggtc gccgacggcg acgtcccagt tctgggcgtc  38760
ccacaggtcc accacggcct cgcccttgcg ctcggggaaa cggcccgagg tgagctgctg  38820
ccagcgcagg tccttggact cggcgaccgg ccccacgccc atctcggggt aggaccggtc  38880
acccgcgcgc accgtcagca tggccctgcc gagcggtgac gcgttcgcgc catgacgctc  38940
gacgagctcg aacgcatcct cgttcgtcag cttggacacc acgtggtcgg agttgcggaa  39000
cggcgccccg aagccggcca tgatgccgct ctgcgccccg gaggtgagca cgccgacccc  39060
gacgacgaag gccacggcga cggtgaccgc gatcgccgcc gcgacgtacc tgcggacatg  39120
ggtgcgcagc gacgcgagaa agacggtgcg catcaggcga tccgtccgtc ttccagggtg  39180
accacgccgt cggcgtaggc cgcggcctca cgctcgtggg tgaccatcac gacggtctgg  39240
cccagctcgc gggtggattt gtgcaggtac cccaggacct ccgccgaggt ggtgctgtcg  39300
aggtttccgg tgggctcgtc ggcgaacagc agatccggcc cggtgatcag agcccgggcg  39360
atggccaccc gctgctgctg gccgccggac atctcggagg gccggtggcc gagccggtcg  39420
gccatgccga gggtttcggc gagcacgtgc acgcgctcgg tcgccgcgtc gtcgatgcgc  39480
cggccgccga gctcgagcgg gagcgtgatg ttctggaacg ccgtgagcat cggcagcagg  39540
ttgaaagact ggaacacgaa gccgatgtgc tcacggcgga agaccgtgag ctcgttgtcg  39600
tcgagtgatc cgagatcggt gccggccacg gtgacagtgc catcgctcgc ctgatcgagc  39660
ccggccaggc agtgcatcaa cgtggacttg cccgatccgc tcgaccccat gatcgcggtg  39720
aacttgccgc gcgggaggtc gaggtcgacg ccgcgcaggg catgcacgcg ggtttcaccc  39780
tggccgtaca ccttggtcag gtttcgcgcg ctggccgcca cggtttccag agcggctcgc  39840
tggccggtca tatagaagca cccttcgatt gtgcttgcgt acagtcggca tgcatgagca  39900
gaaagccatc attgacggct tcatggcgct attcttcgcg ccaaggctgg tagtcgtgct  39960
ggtactccgc aaagcgccac ccatcgtaga cgagcagtcg gccgggcacc aacggttcca  40020
aattgaagca gggcgccgtg cggagtaata gtcaagactg tggatgccga gttccttggc  40080
gactgtggga agggtgcttg caccggacgg gcggcattcc ctggtcagcc cccgggtgtc  40140
cgggccgctg gtccggcgtt ggcgtcgaag gaactgccgc cgtacctggg gtcgagcacg  40200
gatgcggacc acgtggcggg cgcggccagc atggccgcga cgccgatggt gagcccggcg  40260
ctgaccagcg aactacgacg gggcctgacc agccgcgcca gcgcgagcgc gacgacggcg  40320
accacgccga gcgcgaccgc gccccacatc gcccacggca gaaaagtggg gtagaaggac  40380
cacaaccaga cggcccaggc gagttcggcc acgatcgcga gcggaaatat ccacgccatc  40440
ctgcctccgc tccgatacgc ccgccagaac attacaatgc cgattccgga caaagcggct  40500
accggcggcg cgagtacggc cacatatgcg ctgtgcggga tgacaaagac cgcgctgtag  40560
ggcagggcga aggtgagaag ccacacgccc cacatcacca ttccgccgcg tgccgggtcg  40620
gtacgctcgg cccggcgcca ccaccacagc ccgcacagca gagccatcag cgcgagcgga  40680
tacagccaac cggacgcgac gccgaggcgg ccgccgaaca gcttgcccca gccgccccca  40740
tgctcgatgc ctatctcggg gatgaccatg ccagggcgtg gccggggcag ctgcgtcgat  40800
ctcttcggag gcgccgggcc gatcaccgag cccatgtagt tgggcggcag ggcgccgggc  40860
agattgatgc ccaggcgtcc gagaccgttg tacccgaaca ccatcgcggc ggcgctgctg  40920
ttcgtggtgc cgctgatgta gggccggtcg gcggccggag tgacgtggta gagcgtgatc  40980
cacgacagcg acaccacgag cgtcaccact ccggcgatcc ccaggtgctg cagccgacgg  41040
cgcagtccga tcggcgcgct caggagataa ccgatcgcca gggcgggcag gatcatccac  41100
gcctgcaaca tcttcgcctg gaaacccagc ccgacccaga cgccggccca gaccagcgac  41160
cgcagccgtc cttccagcac ggcccgctga taggagtcga cggcgagcac caggcacatg  41220
accagcgccc catcggccat gctgtgcccg aacatggacg cggccacggg ggtgatggtg  41280
aagacggcgg cggcgagcag acctggcacc acgcccgccc atcgccgcac gatccggtac  41340
atcaccagca ccgagatcac gccctcgatc acctgcggca aggcaagggc ccaggcgtgg  41400
aagccgaaga tcttgaccga gatggcctgc ggcacgaagg ccccggcgag cttgtcgagc  41460
gtgtaggtcg cctgcacgtc gacggtgccg tacaggaacg ccttccagtt ctcggacatg  41520
ctcttgacgg cgtccgagta tctcggtgcg tagtcgacca gcggcaggtt ccaggcgtag  41580
agcaccgctg ccgtggccgc gatgcagagc agcgccggcc gggcccacca cggctggccg  41640
ggcggcgagc gccacaccgc ccagcggggg aatctgccgg cgggtgcggg gtcccggcac  41700
gcggacggcg gagtcatggt gatgtgcgac atgaggaact cccaggcgtt tccttcggca  41760
gttccctgcc tttactcggc tgcgtagcga atgaccggcc aggtggtctc gttatatccg  41820
ccgtccggtg cggcgttcct ggcatgctca tcgagtttgg cgaacaggtt cttgttcggc  41880
ccgtcgagca ccgacaactg cgtcgcgtag tgcttcatcg cctggaattt ccgcgtccgc  41940
gcctcctcat cgacgaaact cagctccgga gagccgagcc ggaggccgtc aggcaattca  42000
gccaggtcct gggaatacgc cgcgtacggg agatcctgcc agagtcgcag cggaatacct  42060
cgctcgcgtg cggcgagcag cgtggcatcc cgcgtggcct tgtggtcggg gtgtttcccg  42120
atggccacac aggtgagaac gagcgtcgga tcgcactccg cgatcatgga ctcgatgtcc  42180
tccctgatcg cggcgaccag gtcgtggttg ttcgccggcg actgctggcg gaccatcgag  42240
ccttcgttgt ggtgcagcag ccactggcca tccggtgacc ttcgatagat ggcatcgaga  42300
aaacggccat gccgatggcc cgcaccgagc tgatcgaggg cggcgatgtc ctcatttcgt  42360
cggcgcagcg gcgcgtcctc ggtcggcgac agaccccagc gtgcgtggaa tcgctccgcc  42420
gccggggaat aagggggcgc cgcgctgccg gcgaacaccg tgaagacggt tacttttcca  42480
ccgtcctgct ccgcttgggc gaggctggct ccgacggaga ggacggcatc atccaaatga  42540
ggggagattg ctaatatccg ggttcggtcg gcgtcctgca acatggttgt cagtctggtg  42600
tcggccctgc cccgttgcaa taaagcggaa ctggacggga cctcgcacgc gtggagaatt  42660
tccgggcggg ccgggcacca cgatgagtca cccggtcacg tcgcagtcac acgttctctg  42720
accagcctgt caccgtctgc tgcgtacaac tggtgtcaac gccgacaccg ggcaggagaa  42780
gatgagtggg aagagcgcag ccgcacgacc tcgcctcggt cgcatcgaac gacgccttcg  42840
ccgggctcac gtcggcgacc gcggcctcta ggatggcgcc agccggcgca gcgcgcgccg  42900
catgaggggg aagtggatct ctaccgagag gccaccctgc gggcgcgcgt gcgcggtcaa  42960
cgtggcgtcg tgggcgacgg cgatggcgcg gacgatggac agcccgaggc cgtggtggtc  43020
gtcggcgcgg gtgcggtcga gccgctggaa gggctcgaag aggcggtgga cctgctcggg  43080
gggcaccacc gggccggtgt tggcgatgga gacgacggcc ttcccggcct cggcccgggt  43140
ggagagctcc acctggccgc caggcacgtt gtagcgcatg gcgttgtcca gaaggttggt  43200
gatgagtcgt tcgaccagtg ccgggtcgcc cgtggtgggg gcatgagcga tcccggtcac  43260
caatcggggg tgtgggcaac cggcccggag ggacttcccg tcggcccagg aatcggttgc  43320
cgcgccggcc gtggggctgt tcccgtcagc cctccgatcg gcactcacgc cggccctggg  43380
gttgttcccg tcagccccgg ggccggtccc ctccatcgtg cggatcgtgt gctcggcgat  43440
ctccgccaga tccaggggct cgcggtgatc gaggccgccc tcgctcttgg ccagcgtcag  43500
cagcgattcc agcaggcgcc cctgctgccg gctgaggtcg agcagccgct ccatgatcga  43560
tcgcatggac ggggtgtcgg cgtcccgatg caggaggctc tcctccagca acgcgtgctc  43620
cagggtgagc ggggtgcgca gctcgtgggc cgcgttggcg acgaagcgct tctgcgcgtc  43680
gagggcgctg tggagacgtt ccagcagctc gtccaccgtg tcggcgaggt tgcgcagctc  43740
gtcgcgcggg ccgggcaggg cgagccgctc gtggacgttg cgggcggaga tccgcttgag  43800
cgtggtgttc atcgtccgta gcgggcgcag catcctgcct gccaccagcc agccgagcaa  43860
gaacgagatg accgtcatca gggccagcgc gatcagcgat tggaacagca ggttctccag  43920
aatggccgcc tgctgctgcc gcgcgaaggc gcggaacctg ccgccagggt caccgtccac  43980
cagcacgaag ggtctggagc cgcggaagag caggtaggtg atggcgagca ggaccacccc  44040
tgaggcggcg aacaacgcgc cgtagacgag cgtgaggcgc agccgtacgc tgcggaaggc  44100
tgttgtcagg cgtcggagac gatgggccac tgttccgatg gtatgagacc aggaccggcc  44160
ggaggagccc acggcgccga cgatcgcggc cccgggccga ggccgagatg ccgcgagtcg  44220
ggcgcctacc gagtcagcgc accgcgcacc gctgccgtga cctcgggcgc cagggtgcgg  44280
gcgaaggtgg tggtgaggtg gctgcggtcg gagtaggcga tcaggccgcc gatgacgggg  44340
ccgcaccgct cgccgcacac caggtgatcg acactcgcca cggagacgag gccggtgtcg  44400
tcggcgcggg cggcggcggc gagcggatcc ggccggagca cgacgccggc cgggccgccg  44460
caggagtcca gatcgtccgg gtgcttggcg atgcagtggg gcacgctgtc cggcatggcc  44520
ggggtgtcac gcaggacgag caccggaagg ccggcgccgg tgaaggcccg gagcgtgtcg  44580
cggtaggccc gctcggccgc ggcctgctgg ccggctggcg agacgccggc gagcggcaca  44640
tgcgtacggt tggacatgat caccaggtcg tagccgccgt tcacgatgga cccgaccgcc  44700
cacttgttga tcttctggca gttctccgag acccccgcgc cttcgaggac gagcggctga  44760
tcgacggtgt agcacgccag ctgtacgtag gtggtgagct gccagcgctc gctccacagc  44820
gccttctcca gggccgggac ccagtgtccc gcgtgggagt tcccgaccag ggcgatgcgc  44880
ctgccggcgg cgtcaggtcc gtacgtgcac gtgttccggg cgatgaacgg ttccttgttc  44940
acgcacccgt ccgcgtacac ggcgggcttg tccttcaacg cgacctgagg aggcatcagc  45000
aggcccagat cctggcacgc cgggtcgcgc acgacgccgg cacccaggca tgaccctgcc  45060
cgcgaggccg cggcctcgaa cgcggcactc tccgtacgct cggcggcgtc ggcgtaggcg  45120
acgacgcccg ctcccgctcc tgcgacgacc accacgcacg acgcgagcat cgcgaacgtg  45180
agcctgcggc tgcggaccag gaccgggtgc cagcgcagcc ggtcctcgac gaggtactgc  45240
gagagcgcgg cgaggaccag ggtcagcgcg atcacgccca cggactcgat cacggtcagc  45300
gagcggccca gcgcgtacgg gaggatcatg atcggcggcc aatgccacag gtacaccgcg  45360
taggaggcgt tgccgagcca ctggaccggc cgccacgcca gcgcccgccc gggtccgccg  45420
cgcagaccgt ccgcggccgc tgcgatcacc aggcaggccc ccactgtcgg caccagggcg  45480
gcggctccgg ggaaggccgt ctcggcgtcg aaccggacca cggcccaccc gatcatgccc  45540
aggccggccc acgcgagccc ggcccggacc gcccgcgcgc gcggcatcgc gcgtacggtg  45600
agaaccgcgg cgagcagacc gccgagcgcg agctcccaga agcgggtcgt cgacacgaag  45660
tacgcggcgg ccggatcggt cgccgtcttc tgcaccgacc aggcgaggga cgcggccacg  45720
accgcacccg tgaccaccac cgcgctccac ctcgtgaagt tctccggagg gcgacgcccc  45780
cgtgccaccc gggcggccag ccaggccgcc gaccccagca gcagcggcca gccgaggtag  45840
aactgttcct cgatggacag cgaccagtag tgctgcgcgg gccagtccgg ctggtcgacg  45900
tcgaggtagt tcgcctgcgt gagcgcgagt ctcaggttct ccacgtacac cgtggcggcg  45960
atcacctcac gcgccgccgt ccccagcacc gtgagcggca gccagaccac cgacgcggcg  46020
agcgtgacca ggagcgcgag gctcgcggcc gggatgaggc ggcggacgcg gcgtgcccag  46080
aagtccagca gtctcccgcc gccgtgtccc ggctgacgca gcaggtggct cgtgatgagg  46140
tacccggaga tgacgaagaa gacgtctacc cccacgtacc cgccggtcgg cccgccgggc  46200
cacaggtgga acgcgaccac cgccgccacc gcgatcgccc ggaggccctg aatgtccgtg  46260
cgggactcgg agctccggcc gccggcgtgc tcgcttcgcg gcgcacacga cggggcgtgc  46320
ggcgtcagcc cgcatgcgca ggtcggaagg gacatctgtt cggtgggtgc cgggcgctcc  46380
atggcaactc ccgcgtcatc gaggtgctgc gcagccctcg aaggtcgcac ccgcggacga  46440
gagcctgctt gatcgcaagc gtgctcaacg gactcgatgt ctacaagccg gtccaggtga  46500
acgcttggtc accaccaccg gtgaacgcgt ccaagcgcgc gaactgttca gttggaccca  46560
ctcgtggaca tcggctccgc tcagcacgat tgaggtcgct gacttgcgtg cgcgtgtgag  46620
aggagtcccg catggccata gtgtcgccgt tcggaggttt gctgaagggc gacggagagg  46680
atgatcccgc gccgtccagg atccgcccgg ggacgttgcg acgagtgctc ggatacttcc  46740
gcccgcacgt cggcaaggtg gcgctcttcg ttctcgtcac cgcattggat tcgatcttcg  46800
tcgtcgcgtc tccgttgatg ttgaaggacc tggtggacaa gggggttctg gggaacgatc  46860
tggagctcgt catcctgctg gcgtgcctgg ccgccggctt cgccgtgatg agcacgctgt  46920
tgcagctcgt gtcggcctac atctccggcc ggatcgggca gggggtcagt tacgacctgc  46980
gggttcaggc ccttgaccac gtccagcggc tgccgatcgc gttcttcacc cggacccaga  47040
cgggcgtgct ggtcggccgg ctgcacacgg agctggtcat gacgcagatg gcgttcaccc  47100
agatgctgac ggccgccgcc agcgcggtca cggtcctgct ggtgctggcc gagctgttct  47160
acctgtcgtg gatcgtcgcc ctcctcacgc tggtgctgat cccggtgttc ctggtgccct  47220
ggtcttacgt gggacggcgg atgcagcgct acaccagagg gctgatggag gagaacgccg  47280
gcctggccgg gctgctgcag gagcggttca acgtccaggg ggcgatgctc tccaagctct  47340
tcggccgtcc ggccgaggag atggccgagt acgagagcag ggccggccgg atccgcgggc  47400
tcgccgtgag cgtcaccctc tacggccgga tggcccccgc catcttcgcg ctgatggccg  47460
cgctcgccac ggcgctcgtc tacggggtcg gcggcgggct cgtgctctcg caggcgttcc  47520
agctcggcac gctggtcgcc ctggccaccc tgctcgggcg gctgttcggg ccgatcaccc  47580
agctggccag cattcaggag aacgcgctca cggtcctggt gagcttcgag cggatcttcg  47640
agctgctcga tctgaagccg ctgatcgagg aacgccccga cgcggtcgcg ctcaaggccg  47700
gcaaggcctc ggacgtccag ttcgagaacg tgtcgttccg ctaccccagc gcggacgagg  47760
tctcgctgcc gtcgctggaa cagaacgtgc gcaccgggca ggagcgtggt gaagcgacgc  47820
cggaggtgct gcgcgacgtg agcctgcacg tgccggccgg caccctcacc gcgctcgtgg  47880
gcccgtccgg cgccgggaag agcaccctca cgcacctggt gtcccggctg tacgacccga  47940
cctccggaac cgttcgcgtc ggcggacacg acctgcggga cctcaccttc gactcgctgc  48000
gcgaaacggt gggggtggtc agccaggaca cctacctctt ccatgacacg attcgggcga  48060
accttctcta cgcccgcccc gacgccaccg aggacgagct ggtcgaggcg tgccgagggg  48120
cgcagatctg ggacctgatc gcatccctgc cacgcgggct cgacaccgtc gtgggtgatc  48180
gcggttatcg cctgtcaggc ggggagaagc aacggctggc gatcgcccgg ctgctgctga  48240
aggcaccctc ggtcgtcgtt ctcgacgagg ccaccgccca cctggactcg gagtcggagg  48300
ccgccgtcca gcgggcactg acgacagccc tgcgcagccg tacctccctg gtgatcgccc  48360
accggttgtc cacgatccgc gaggccgacc acattctcgt gatcgacgac gggagggtca  48420
gggagcgcgg gacgcacgag gagttgctgg cggaaggcgg tctctacgcc gacctgtacc  48480
acacgcagtt cgccaagtca ggcgtcaacg ggacccggcc gggacagggc gacggggcgg  48540
agcccgtgca agaggtggtc ggtggagggg aacgatgagc gccggaacgc gggccacacc  48600
gacgacggtg ctggacctct tcgcccgcca ggtgggccgg gcacccgatg cggtggctct  48660
ggtcgacggg gaccgggtcc tgacctaccg gcggctggac gagctcgccg gagcgctgtc  48720
cgggcgcctg atcggccggg gtgtcggccg gggtgatcgc gtcgcggtga tgatggaccg  48780
ctcggcggac ctggtggtga cgctgctcgc cgtgtggcag gcgggggcgg cctacgtgcc  48840
ggtggacgcc gcccttcccg cccggcgggt ggcgttcatg gtggcggact ccggagcctg  48900
cctgatggtg tgctcggagg cgacgcgcga tgcggtaccg caaggggtcg agtcgatcgc  48960
gttgaccggc gagggcggat gcggcacgtc ggcggtcacg gtggacccgg gggatctggc  49020
gtacgtgatg tacacgtccg gctcgacggg caccccgaag ggggtggccg tcccgcatcg  49080
gagcgtcgcg gagctgacgg gaaaccccgg ctggggggtg gagcccggcg aggcggtgct  49140
catgcacgcg ccctacacct tcgacgcctc cctgttcgag atctgggtgc cgctcgtgtc  49200
gggcgcccgg gtggtgatcg ccgcaccggg tgcggtggac gcccggcgcc tgcgcgaggc  49260
ggtcgccgcc ggggtgacga gggtgcacct gaccgcgggc agcttccgcg cggtggcgga  49320
ggagtcgccg gagtcgttcg cgcacttccg tgaggtgctg accggtggtg acgtggtgcc  49380
cgcgtacgca gtgcagaagg tgcgggcggc ctgccctcac gtgcggatcc ggcatctgta  49440
cggcccgacg gagacgaccc tgtgcgcgac gtggcagctg ctggagccgg gtgacgtcgt  49500
ggggcccgtc ctgccgatcg gccgcccgct gccgggccgc cgggcctggg tgctcgacgc  49560
gtcattgcgg ccggtggagc ccggggtggt cggtgacctg tacctttccg gcgccggtct  49620
ggcggacggc tacctggacc gggcggggct gacggcggaa cggttcgtgg cggatccgtc  49680
cgcggcgggg aggcggatgt atcggacggg ggatctggct cagtggaccg cggacggtga  49740
gctgctgttc gcgggccggg ccgacgacca ggtgaaggtc cgcggattcc ggatcgagcc  49800
gggcgaggtc gaggccgcgc tgaccgctca gccgcacgtc cgcgaggccg tggtggtggc  49860
gatcgacggg cgcctgatcg gttacgtggt ggcggacggg gacgtggatc ccgtactgat  49920
gcgccggcgg ctggcggcgt cgctgccgga gtacatgatc ccggccgctc tggtcacgct  49980
ggacgcgttg ccgctgaccg gcagcggcaa ggtggacagg agggcgctgc ccgagcccga  50040
tttcgcgtcg gccgcgccgc gccgcgaacc cggcaccgag ccggagcgcg tcctgtgcga  50100
cctgttcgcg gagcttctgc aaccggaggg aaggggggta ggggtcgatg acggtttcgt  50160
cgagctgggc ggggactcga tcgtcgcgat ccggctggca gcacgtgcgt ccagggtggg  50220
gctgctggtg acgcccgccc agatcttcaa ggagaagact ccggcacggc tggcagccgt  50280
cgcgggtgcc gtaccggccg gcagacccgc cgacggcccg ctgatcaccc tcacggcgga  50340
ggaggaggcg gagctggcga ccgccgtccc gggggccgag gaggtctggc cactcgcacc  50400
gctccaggaa gggctctact tccaggccac cctcgacgac gagggtcacg acatctacca  50460
ggcgcaatgg atcctggagc tggcggggcc gctggacgcc gcccggctgc gggcctcgtg  50520
ggaagcggtc ttcgcccggc accccgagct tcgcgtgagc ttccaccggc gcgcgtcagg  50580
cacgatgctg caggtcgtcg ccgggcacgt cgtcctgccg tggcgagagg tggatctggc  50640
ggatgcgggc gatatcgacg cggccgtggc ggccctgatc agtgaggaac aggagcagcg  50700
gttcgacctc gccaaggcac cgctgttccg gctggtgctg gtccgtcacg gcgaggaccg  50760
gcaccgcctg ctggtcgtcc atcaccacat cctgaccgat ggctggtcgg tggcggtcat  50820
cctcaacgag gtggctgagg cgtacacgaa cggcggccgt ctcccggacc gcacgggcgc  50880
ggcctcctac cgggactacc tggcctggct ggaccggcag gacaaggacg ccgcacgtgc  50940
cgcctggcag gcggagctgt ccggcctcga agggcccgcg ccgatcgcga aggccgccac  51000
cacgaccggc gccgggacgg gctacgaata tcgcatcgcc ttcctgaccc ctgacctcca  51060
cacgcggctg acggagctgg cccgcgacca cgggctgacg ctgaacaccc tggcacaggg  51120
cgcatgggcg atggtgctgg cgcggctcgc gcggcgcact gacgtggtct tcggcaccac  51180
ggtcgcctgc cgtcccgccg agctccccga ggtggagtcg gtgccgggtc tcatgatgaa  51240
cacggttccg gtccgggtgc cgctgcaggg cgcgcaatcg gtcgtggacc tgctcaccgg  51300
cctgcaggaa cggcaggcgg ccttgctgcc gcaccagcat ctggggctga cggagatcca  51360
gcgggcggca ggacctggcg cgacgttcga cacgctgctg gtcttcgaga actacccgcg  51420
ggacttcgcc ggccagttca cctacctggg cacgatcgag gggacccact acccgctgac  51480
cctcggcatc atcccggggg atcacttcag gatccagctc gtctaccggc gcgggcaggt  51540
cggggagagc gtcgccgagt cgatcctggg atggttcacc ggcgctctca tgacgatggc  51600
cgctgatccg cacgggccgg tgggccggat cggtgtgggt gaggcccggg ccggcggctc  51660
ggaccgggcg atggcggcgg gggagccgct gccggtgctg ctacggcggg tggtgaagga  51720
ccggccggac gaggtggcgg tggtggacgg cgacggtgag ctgtcgttcg gggaattgtg  51780
ggaacgggcg acggcgctgg cggccgagct gagggctcac gggatcgggc cggagagccg  51840
ggtggccgtg atggtgggca ggtcggcgtg gtgggcggtc ggggtgctgg gcgtctgctt  51900
ggcgggcggc gcgttcatgc cggtggatcc ggcgtatccg gctgagcgcg tcaggtggat  51960
cctggccgac tccgacccac ggctggtgct gtgcgcgggg acgacgcggg aggcggtgcc  52020
ggaggagttc gcagaccggc tggtggtggt cgacgagctg gacctcgcgg ggagcgacga  52080
tgcgggcttg ccacgggtga gcccggatga cgcggcttat gtgatctata cgtcgggatc  52140
gacggggact cccaaggggg tcgtcgtctc gcacgcgggc ctcgggaatc tggcgatggc  52200
gcagatcgac cggttcgccg tgtcgccgtc gtcgcgagtc ctgcagttcg cggcgctggg  52260
cttcgacgcg atggtgtcgg agatgttgat ggcgctgttg tcgggggcga ggctggtgat  52320
ggcgccggag ccggccctgc caccgcgggt gtcgctggcc gaggcgttgc ggcggtggga  52380
ggtcacgcac gtcacggttc cgccgtcggt gctggccacc gccgatgcgc tgccggccgg  52440
gctggagacg gtggtggtgg cgggggaggc ctgcccgccg ggcctggccg aacgctggtc  52500
ggcgggacgg cggctggtca acgcgtacgg gccgaccgag gccacggtct gcgcggcgat  52560
gagcaggccg ttgacgggca gccgggaggt ggtcccgatc gggacaccca tcgccggcgg  52620
ccgttgctac gtgctggacg cgttcctgcg gccgttgccg ccggggatca ccggtgagct  52680
gtacgtggcc gggatcgggt tggcgcgcgg ctatctgggt cgtgcgtcgt tgacggctga  52740
gcggttcgtg gcggatccgt tcgtggctgg tgagcggatg tatcggacgg gggatctggc  52800
gtattggacg ggtgagggcg agctggtgtt cgccgggcgg gatgacgacc aggtgaagat  52860
ccgtgggtat cgggtggagc cgggtgaggt ggaggcggtg ctggcggggc agccgggggt  52920
ggatcaggcg gtggtggtgg cgcgtgaggg gcggttgctg ggttatgtcg tctccggtgg  52980
tggggtggat ccggtgcggt tgcgtgaggg ggtcgcgcgg gtgttgccgg agtacatggt  53040
gccggcggcg gtggtggtgc tgggtgcggt gccggtgacg gcgaacggga aggtggatcg  53100
ggaggcgttg ccggatccgg gcttcggcgg gcgggtttcg ggccgggagc cgcgtacgga  53160
ggtcgagcgg gcgttgtgcg ggctcttcgc cgaggtgctc gggctgccgg gggtgacggc  53220
ggtggggccg gacgacagct tcttcgagct gggcggggac tcgatcactt cgatgcagct  53280
ggcgtcgcgg gctcgccgcg aggggatgct cttcggcgcg cgggaggtgt tcgagcgcaa  53340
gacgcctgcg gggctcgcgg cgatcgtcga tgtgggcggc gagcttgcgg caggtccggc  53400
cgacggcgtg ggggagatcg cgtggacgcc gatcatgcgg gcgctcgggg acgggatcgt  53460
ggggtcgcgg ttcgcccagt gggtggtgct gggtgcgccg ccggacctac gggcggacgt  53520
ggtggccgcg ggattggcgg cggtggtgga cacgcacgac gtgttgcggc tgcgggtcgt  53580
cgatgaccgg gcgggccgcc ggctggcagt gggcgagcgc gggtcggtgg acacggccgg  53640
gctggtcacg cggctcgagt gcggcggccg tccgccggac gaggtcgtgg agcgcgcggt  53700
gcgggaggcc gtggggcggt tggacccggt ggcgggtgtg atggcgcagg cggtctgggt  53760
ggatgcgggg ccggcgcgga cggggcggtt ggtcgtcgtg gtgcatcatc tggcggtcga  53820
cgggatgtcg tggcggatcc tggtgcccga cctgcggctg gcgtgtgagg cggtggccga  53880
ggggcgggat ccggtgctgg agccggtgtg ggggtcgttc cggcgctggg cggctctgct  53940
ggaggagtcg gcgctctcgc gggagcgggt cggggagctg cacacgtggc ggacgatcgt  54000
cgatcaggag gatcggccgg tcggccggcg gcggctgagc gcaggggatg cggccggggg  54060
cgtgcgttca cggtcgtggg tgatgtcggg ggatgaggcg tcgctcctgg tggggaaggt  54120
tccggtggcg ttccactgcg gggtccacga ggtcctgctg gcgggcctgg cgggagcggt  54180
ggcgcgctgg cacggtgacg acggggtcct ggtggatgtg gaaggccacg ggcgtcatcc  54240
ggccgagggg atggatctgt ccaggacggt gggctggttc accagcatgc atccggtgcg  54300
cctggatgtg gcggggatcg agctggcggc ggtgccggcc ggtggccgtg cggccgggca  54360
gttgctgaag gcggtcaagg agcagtcgcg ggcggcgccc ggcgacgggc tcggttacgg  54420
gttgctgcgc catctcaatc ccgagacggg ccccgttctg gcggccctgc cgtcaccgca  54480
gatcgggttc aactacatgg gccggttcgt caccgtcgac cagggcggtg cgcggccgtg  54540
gcagccggtc ggggggatcg gcggttcgct ggaccccggc atgggcctgc cgcatgcgct  54600
ggaggtcaat gcgatcgtcc acgacaggct ggcgggcccg gagctggtgc tcacggtgga  54660
ctggcgggac gacctgctgg aggagaccga catcgaacga ctgtgccagg tgtggctgga  54720
catgttgtcc ggattgtccc gccaagcgga ggatccttcc gcaggcggac acaccgcgtc  54780
cgacttcgcc ctactcgacc tcgaccagga cgagatcgag ggcttcgaag ccatagcagc  54840
ggaactctct ggaggccaga catcgtgaac acgccgagca cacccgccgg atcggcgctt  54900
gaggaagtct ggccgctgtc accgatgcag gaggggatcc tctatcacgc cgcactcgat  54960
gaggcccctg acctctacct catccagcag tcgcagatca tcgaaggacc cttggacacc  55020
gagcggttcc gcctggcttg ggagagcctc ctcaaccggc atgcggcgct tcgcgcgtgc  55080
ttccaccggc ggaagtccgg tgagtcggtc cagctcatcc cccgtaaggt gccgctcccg  55140
tggtccgagc gcgacctgtc cggcctgtcc gaggaggacg cgctggccga ggcgagcgtg  55200
atcgcggaga aggagcgcgc cacgagattc gacccggcca agcctccgct gctgcggcag  55260
gtgctgatcc ggttcggtcc ggacaagcac tgtctggtga cgacgagcca tcacctggtc  55320
atggacgggt ggtcgcgggc gatcctcgag tcggagctcc tcgagctcta cgccgcgggt  55380
ggcgccgagc cggggctgcg gcccgccggc tcctaccggg actatctggc ctggctggag  55440
cggcaggaca aggaggccgc ccgcgcggca tggcgtgcgg agctggcggg cgccgaccgt  55500
tcgacactcg gcatccccga agcgtccagg aagacccagg ggcagcgggt gcgggaggtg  55560
ctcggctacg cgccggactt cacctccgct ctggtggact tcgcccgccg ccatgggctg  55620
acgctgaaca cgctggtgca gggggcgtgg gcgttggtgc tggcccggct cacgcgccgt  55680
cgtgacgtgg tgttcggcgc ggtggtctcg ggacgtccgg cggaggtgcc cggcgtggag  55740
caggccgtcg ggctgttcat caacaccgtg ccggtgcgcg tccggttgga cggcgggcag  55800
ccggtcatcc agctgctgac ggagctgcag gagcggcagt ccacgctcat ctcgcatcag  55860
catctcgggc tgcaggagat ccagaagctc tccggggtga gcttcgacac cgtcgtgtcg  55920
ttcgagaact acgtcgatcc gggggcgggt ccgggctccg atcgcgagct gcgcctgaga  55980
ctgaaggagt ttcaccagtc ggcgccgtac gcgctcctcc tcggcatcat gccaggtgag  56040
agcctccaga ccgacgtgga gtaccggccc gagctgctcg acgcccgcgt cgccaaggag  56100
gccctccacg ggctcgcccg cgtcctcgag cggatgatcg ccgagccgga gaccgcagtg  56160
ggccgcctgg acgtggtcgg tgacgcgggg cgcgagctgg tggtcgagcg gtggaacgag  56220
acgggcgacg cgatcggtgc gccgtccgcg gtggacctgt tccggcgcca ggttgcacgg  56280
gcacccgccg cgacggcggt gacggccggg gacctggcct ggtcgtacgc ggagctcgac  56340
gagcggtccg gccggctggc gcgggcactg acggaacgcg gcgtgcgacg cggcgaccgg  56400
gtgggcgtgg tgctggggcg gtcggcagag gtgctggcag cctggctcgg agtgtggaag  56460
gcaggcgcgg cgttcgtgcc ggtcgacccg gactacccgg cggaccgggt ggcgttcatg  56520
ctggccgact ccgccgtcgc gatggtggtg tgccaggagg cgacctcggg tgtggtgccc  56580
ccgggctacc agcagctcct ggtgaacgac gccgacgacg gcgaggccgc cctggtcccg  56640
atcggggcgg acgatctcgc ctacgtgatg tacacctccg gatcgaccgg gaccccgaag  56700
ggcgtggcga tcccgcacgg cggcgtggcg gcgctggcgg gagatccggg atggggcgtc  56760
ggacccggcg acgcggtgct gatgcacgcc ccgcacacct tcgacgcgtc gttgtacgac  56820
gtgtgggtgc cgctcgtctc cggcgcgcgg gtcatgatca ccgagccggg ggtcgtcgac  56880
gcggagcggc tcgccgggca tgtggccgac ggcctcaccg cggtcaactt caccgcgggg  56940
cacttccgcg cgctggcgca ggagtcgccg gagtcgttct ccgggctgcg cgaggtggcg  57000
gcgggtggcg acgtggtgcc gctcgatgtg gtggagcggg tacggcgggc gtgcccgcgg  57060
ctccgggtct ggcacaccta cggcccgacc gagaccacgc tgtgcgcgac gtggaaggcg  57120
atcgagcccg gtgacgaggt ggggccggtg ctgcccatcg gccgggcact gccgggccgg  57180
cggctgtacg tgctggacgc gttcctgcgg ccgttgccgc cgggcatcgc gggtgatctc  57240
tacctcgcag gcgccggagt ggcccacggc tatctgggtc gtgcgtcgtt gacggctgag  57300
cggttcgtgg cggatccgtt cgtggctggt gagcggatgt atcggacggg ggatctggcg  57360
tattggacgg gtgagggcga gctggtgttc gccgggcggg atgacgacca ggtgaagatc  57420
cgtgggtatc gggtggagcc gggtgaggtg gaggcggtgc tggcggggca gccgggggtg  57480
gatcaggcgg tggtggtggc gcgtgagggg cggttgctgg gttatgtcgt ctccggtggt  57540
ggggtggatc cggtgcggtt gcgtgagggg gtcgcgcggg tgttgccgga gtacatggtg  57600
ccggcggcgg tggtggtgct gggtgcggtg ccggtgacgg cgaacgggaa ggtggatcgg  57660
gaggcgttgc cggatccggg cttcggcggg cgggtttcgg gccgggagcc gcgtacggag  57720
gtcgagcggg cgttgtgcgg gctcttcgcc gaggtgctcg ggctgccggg ggtgacggcg  57780
gtggggccgg acgacagctt cttcgagctg ggcggggact ccatccattc ggtgaagctg  57840
gcagcgcggg ccacgcgtgc cggcatgccc ttcaccgtgg tcgaggtgtt cgagcacaag  57900
acgcctgcgg ggctcgcgac gatcgtcgac gtgggcggcg agcccgcggc aggtccggct  57960
gatcccccat cggactccga cctgctcggc ctggcgcagg acgagatagc ggagttcgag  58020
gccgaattcg acgacgaacg tcattctctg cgctgatcga aagcgggcgc cgcgcacggt  58080
gtgccggcag cctgcgagtt gtccaacatc ctgtcgtgcc aatgacgtat gcccatgagt  58140
aggttggctc aatgataagc aaagcaatgc atggaccgat tcggcccgcc cgcgcggata  58200
ccctgctggc ctcggtaggc gagcgaggca ttctgtgtga cttttacgac gagaacgcct  58260
cggaaatctt ccgtgatttg gaggcggacg cgggcggcac ggaagaagcc cacgggttcg  58320
cggcgctcgt ccgcccggag tcgggggcga tcctggagct cggggccgga acaggcaggc  58380
tgacgattcc gctcctggag ctcggctggg aggtgaccgc cctcgaactg tcgaccgcga  58440
tgctcaccac cctgcggacg cggctggcgg acgcgccggc ggacctccgg gatcggtgca  58500
ccctcgttca cgcggacatg accgccttca aactgggaga acgcttcgga acggcgattc  58560
tcagcccgtc cacgatcgac ctcctggacg atgccgacag accagggctg tactcgtcgg  58620
tccgtgagca tctgcggccc ggcgggagat tcctgctcgg catggccaac cccgacgcgt  58680
ccggcaggca ggagccgctg gagcgcaccc aggagttcac gggcaggagc ggccgccgat  58740
acgtgctgca cgccaaggtc tacccgtcgg aggagatccg cgacgtgacc attcatcctg  58800
cggatgaatc ggcggacccc ttcgtcatct gcgtcaatcg cttcagagtc atcaccccgg  58860
atcagatagc acgagagctg gagcaagccg gattcgacgt ggtcgcgcgg accccactgc  58920
ccggggtgcg taatcacgaa ctggtgctgg aagcgcaatg gggcagcgtg gaagacgcgc  58980
attagagccc tccggggaaa gcgcttgtgt acttttctgc agtcattcga cagtgaggaa  59040
cagaaatgag tgaggagctc ctcttcctcc ggcccgacac cattatcgaa ccgctggcca  59100
accggttcta cgcctcgatg tacgcgacgg ctcccgtcac ggccgccatg aatctcgcct  59160
tccgtaacct gccgatgctg gagtcctacc tcgcatcccc ggaatggcat ttcgcagccg  59220
ctcgcgatcc gaagttccgc ggcggattct tcgtcaacat cgaggagcag cggaagaacg  59280
aggtcgaggc gctgctcgct gcgatccggc gcgacagcgc ggacgtgctc cggttcgccg  59340
aggcgatcgc ggaggccgag aagatcatcc gcgaggaagc gaccggatac gatctcaggc  59400
cgctctaccc gaagctgcct cccgagctgt cgggtctggt ggagatcgcc tatgacaccg  59460
gcaacgcggc ctcgctgcac ttcctggagc cgctcatcta caagagcaag gcctacgccg  59520
aggactgcca gtccgttcag ctctccgtgg agaccgggat cgagcggccg ttcgtgatga  59580
gcaccccgcg actgccctca cccgacgtgc tcgagctgaa catcccgttc cggcatccgg  59640
gtctggagga gctcttcctg tccaggatcc ggcccaccac cctggccgcc ctccgcgagg  59700
cgctggagct cggcgacgcg gaagcggcgc ggctcgccga cctgctggtc ccggagccct  59760
cgctcgcctc cgaccgccat gtcgcggccg gagcccggat ccgctactgg gggcacgcct  59820
gcctgctcat gcagacgccc gacgtggcca tcatgacgga cccgttcatc agcgcggata  59880
ccgacgcgac cggccgctac acctacaacg acctgcctga ccgcctcgac tacgtcctca  59940
tcacgcacgg gcattccgac catctggtgc ccgagacgct gcttcaactg cgcggccggg  60000
tgggcacgtt cgtcgtgccg cgaacctcgc gcggcaacct gtgcgatcct tcgctggcgc  60060
tctatctcag aagcttcggg ctgcccgcga tcgaggtgga cgatttcgat gagatcgagt  60120
tccccggcgg gaagatcgtc tccaccccgt tcttcggcga gcacgccgat ctcgacatcc  60180
gggccaagtc gacgtattgg atcaacctcg gtggcaagtc gatctgggtg ggcgcggact  60240
cctcaggcct cgatccggtt ctctaccgcc atatccgccg gcatctcggc gcggtcaaca  60300
tcgccttcct cgggatggaa tgcgatggcg cgccgctgaa ctggcagtac cagccgttca  60360
tcaccaaggc gttgccgaag aagatgagcg acagccgcaa gatgtccggc tccaacgcgg  60420
agcaggcagg tgcgatcgtc accgagctgg gcgccgagga ggcgtacatc tacgccatgg  60480
gggaggagag ctggctgggg catgtcatgg ccaccagcta caacgaggac tcctaccagc  60540
tccagcagat cgccgagttc gaggcatggt gttcccgcaa gggtgtgaag gccgctcatc  60600
tgctcgacca gcatgagtgg cactggtcgt catccaggtg atcgcggtgg cccgccggtc  60660
ggccttcgct caggcgggca gggccgcggt cgcaagcagc tgccgaggcc gtgctcgccg  60720
aggccgtgct cgccgaggcc gtgcccgtgc tcgcccaggc cgtgcccgtg ctcgccgacg  60780
ccgtgctcgt cgaggccggt gccagagggc gcgtcaccgg cctctcagcg caaccggccg  60840
cgtgaaccgc ccggcggttc ggatcgttcg atatcagggc cggatcgaca acgcgtggtg  60900
gaagtggtta cgcgggtcgt aggcggcctt caccttgcgc agccgcgggt ggttcccctt  60960
gtagtagagg tcgtgccacg gcacgcccga ggtgttcaag cccggatccg cgaggtcgct  61020
gtcggggtaa ttgatgtacg ccccatcgct gacgtcgttc ggcaccggca ccccgccggt  61080
ctcggcgtac acatcggcat agagcttgcg gacccacgtc agatgcttgg cctcgttgcc  61140
gggattcgcc caaccggtga tgtagttcac cttgagtatc gcgtcgcgct gcggcagggc  61200
ggtggccgcc gggtcgacgg tgttcacctt cccgccgtag ccgatcagcc agacggcgcc  61260
gtagtcgatc ccgtccatgt gggtcatgtt ctcgtacacg gcctgaatct gccggtcggt  61320
cagccgcttg cgcaggtagc cggctttcgt cttcgacgcc gggcccctgc ctcctcgccc  61380
cggcgtcgag gccagccacc tctgttcgat cggctcgggc acctcggccg gcgggacgcc  61440
gtcgatcacc gcctcgatgt gcgcgtcgag cagtctccgg gcgtccggcc gggtggcgtc  61500
cacctggatg ggcatcatga agccgctctc acccatgccc gggacctcgt tcccgatcat  61560
gagctgactc cacagcccgg tgtacggcga gtcgggcccg ctgttccgct cgtaccactc  61620
cccgtggttg cgcagcagcc gggagaacgc cgcctccgtc atccccgccc agtcgaaggt  61680
caccgtgctc gtgagcaacg tcgcgggcgg cttcggcagc agccgctccg gattccggcc  61740
gacgtcctcc ggcaccctca tccagtactt cgtgaccacc ccgaagttcc cgccgccacc  61800
gccggtgtgc gcccaccaca ggtcgtgatg ggggtcgtcg cgctcacggg tcgccacgat  61860
cacgcgtgcc ttcccctgtt tgttgacgac gacgacctcg accgcgtaca agtagtcgac  61920
cacggagccg aactgccgtg acagcgggcc gtacccgcct ccgcagatgt gtccgccgac  61980
gccgaccccg ccgcagaccc cacccggtat ggtcacgttc cagcccaggt agagcttttc  62040
gtacacctct gagagcgtgt tgcccggctc gatcaggaac gcgttcatcg acgggtcgta  62100
cgcgatctcc gtcagcagcg acatgtcgat gatgaccttg acgtcggggt tgtcgacgaa  62160
gtcctcgaaa cagtgcccac cgctgcggac ggcgacccgc ttgccggtgc gcaccgtctc  62220
ctcgacggca tcggccacct gctgggtgga gccgaccagg tggatgtagt cgggctcgcc  62280
gttgaagcgg ctgttggcgc cacgcagctt caggttgagg tagcgcgggt cgtccggagt  62340
caccttgacc gggccggccg gcggtaagca gcgctcgccc cgcagctccg gtcgcgtgga  62400
cgaggcgccg gccgacgcgg cgtccgctcc ggtgccgccg gtcaccaccg ccgccgcgcc  62460
cccggcaagg gaggcactca gcaatctacg tcggttcagt tttgtcatgg cggcgacgtt  62520
actatcggtt cgattcgatc aactcgctgt ctgactggac gtaagcgatc tcttcacgcc  62580
gtggccgtac gtggctgtcc atcgcctaca gatttccgat ctctgaaggt acggtcacct  62640
gttgaagaac gcgtccgtca gcgcattcca ggtgacgccg ccgcgaacgc gcgctcacgg  62700
gaaaactcgc cgtcgaggcg ggtgacgacg gaatcgtggt gtccaaccac ggaggccgtc  62760
agttggacgg tgccgtcctg agccagtttc tgccaaacga ctgggaacac catgggacat  62820
ccacacgatc aagagcccga cggccaaatc cgtcctgcgg ctcagagccc ccgccggttg  62880
gtcgagatga cgagcacctc cgggcggcac ctgtatcacc gccaggtgcg attctccgat  62940
atcgacgccc acggccacgt caacaatgtg cgtttcctgg aatacctgga ggacgcctgg  63000
atcgccctct atctcgacaa tgcgggcccg ccgcaggagg accgcgacgg attgcccgcc  63060
gtggggttcg ccgtcgtgcg ccacgagatc ttctatcggc gcccgctcag gttccggcac  63120
gggtcggtgc gggtcgagtc gtgggtgacc aaggtgaaca gggtgacctg cgagatggcc  63180
gcgcagatct gctcggacgg ggaggtgttc gtcgaagccc gctcgatgat catggggttc  63240
gacacgcaca ccgccaagcc gcggcgcctc accctgcacg agcgcacctt tctcaagcgt  63300
tacctgcgct gatgtgactt ctccattgcc ggccgcggct ccgggcgttg gacgattttg  63360
accgccgaga tcggccgagc ctaccttcac ggtgttcgct gcgaccggaa aggtgaattc  63420
aatggccgcg tccgaggtca agcaagtgct ccggagcaag ctcaggacat gggggtggat  63480
gtatcgatga cgaccagcat cgcgtcggca gaagaccttt ccgtcctcac cggactgagc  63540
gagatcacca cgttcgccgg cgtggggaca gccgtttccg ccacgtccta ttcgcaagcc  63600
gagctgctcg aaatcctcga catacgcgat cccaggatcc gatcgctgtt cctgaacagc  63660
gcgatcgagc ggcgttttct cgcgcttccg ccccagggcc gggacgggga gcgcgtggcg  63720
gaaccgcagg gtgatctcct ggacaagcac aaaaagctcg ccgtcgatat gggatgccgg  63780
gccctcgagt cctgcctgaa gtcggcgggc gcgacgctct cggatgtccg ccacctgtgc  63840
tgcgtcacct cgaccggttt tctcaccccc ggcctgagcg cactcatcat ccgcgagctc  63900
gggctcgacc cgcattgcag ccgcgccgac atcgtcggca tgggatgcaa cgcggggctg  63960
aacgcgctca acctggtcgc gggctggtcc gcggcgcacc cgggcgagct cgccgtcgtt  64020
ctgtgcagcg aggcgtgttc cgctgcttac gcactggacg gcaccatgcg caccgcggtg  64080
gtcaacagcc tgttcggcga cggatccgcc gccctcgccg tcgtctccgg tgacgggcgc  64140
gctgccggcc cgcgcgtcct gaagttcgcg agctacgtca tcaccgacgc gatcgaggcg  64200
atgcgctacg actgggaccg cgaccaggac cggttcagct tcttcctcga tccgcagatc  64260
ccctacgtgg tcggcgcgca cgccgagatc gtcgtcgaca agctgctgtc cggtacgggg  64320
ctgcgccgca gcgacatcgg ccattggctg gtgcactccg gcggcaagaa ggtgatcgac  64380
gccatcgtcg tcaacctcgg cctgagccgg catgacgtcc gccacacgac cgctgtgctc  64440
cgcgactacg ggaacctctc cagcggctcc ttcctcttct cctacgaacg gctcgccggc  64500
gagggcgtga ccaggcccgg agactacggg gtgctcatga ccatggggcc cggctccacg  64560
atcgaaacgg cgctgatcca atggtgagtg gcagtgacat gaacggcgaa ctggagctga  64620
gcctcgacgg cacccaggcg ctgaccgcgt cggtcgagga gctgaacggc ctctgcgacc  64680
gcgccgagga ccatcgagca cccggcccgg tcatcgtcca cgtcaccggc gtgccgcgcc  64740
ttggctggtc gaaggggctg acggtgggcc tggtctccaa gtgggagcgg gtggtgcgcc  64800
ggttcgaacg gctcggccgg ctcaccgtcg ccgtggcgtc aggcgactgc gcgggaccct  64860
ctctcgacct cctcctcgct gccgacgtgc ggatcgccgc tccggcgacc cggctgctgc  64920
cctcctgggc cggcggcgcc gcgtggccgg ggatggccgt ctaccggctc acccagcagg  64980
ccggtacggg cggcatccgg cgggccgtgc tgctcggggc acccatcgac gccgaccgcg  65040
cgctcgccct caacctgatc gacgaggtgt ccgcggaccc ggcggcgtcc ctggccggcc  65100
tggcgggtgc cggggacggc gcggagctgg cgattcgcag gcagctgatg ttcgaggcga  65160
gctcaaccac tttcgaggac gcgctcggtg ctcacctggc cgcggtggac cgggccctac  65220
gacgggagac cctctcgtga cgacggattg gccggcgctg ccgcccaggg cgccgctcgc  65280
cctctggacc ctgacggcgg aggcccagcg agtcgacgac ctgctcgccg ggctgccgga  65340
gcctcctgcc agaacctccg cccagcgcga tgccgcggcc tcggcactcg acaaggtgag  65400
gcggatgcgc gcggactaca tggaggcgca cgccgaggag atctacggcg agctcacctc  65460
cggccgcacc cggcacctgc gcatcgacga gctcgtacgg gccgccgccc gcgcctaccc  65520
cggcctggtg cccaccgatg agcagatggc ggccgagcgc gcgcggccac aggcggagaa  65580
ggaagggcgc gagatcgatc agggcatctt cctgcgcggg gtcctgcgtg ccccgaaggc  65640
gggcccgcac ctgctcgacg ccatgctccg gcccaccccc agggcccttg agctgctccc  65700
tgaattcatc gagtccggcg aggtgcggat ggaggcggtc ctgctgcggc gccgtgacgg  65760
tgtcgcgtac ctgaccctgt gccgggacga ctgcctcaac gccgaggacg cgcagcaggt  65820
ggacgacatg gagaccgcag tcgacctggc gctgctcgac ccccaggtcc gggtggggct  65880
cctgcggggc ggcgagatga gccatccccg gtaccggggg cgccgggtgt tctgcgcggg  65940
cgtcaacctc aagaagctga gctcgggcga catctccctc gtcgacttcc tcctacggcg  66000
cgagctgggc tacatccaca agatcgttcg cggcgtgtac acggacggtt cgtggcactc  66060
gaagctgacc gacaagccct ggatggcggt cgtcgactcc ttcgccatcg gcggtggggc  66120
tcagctcctc ctggtcttcg accaggtgct ggcggcgtcc gactcctaca tcagcctgcc  66180
tgcggcgacg gaggggatca ttccgggggt cgcgaactac cggctcaccc ggttcaccgg  66240
gccacgcgcg gcccggcaga tgatcctcgg cgggcggcgg atccgggcgg acgagccgga  66300
cgcacggttg atgatcgacg aggtcgtccc gccggaggag atggacgcgg cgatcgatcg  66360
cgcactggcc cgcctcgacg gagatgcggt gccggccaac cggcgcatgc tgaacctggc  66420
cgaggagccg cccgaggcgt tcggccggta cctggccgag ttcgccctgc agcaggcact  66480
gcgcatctac ggcagggacg tcatcggcaa ggtcggcagg ttcgcagcgg gatcggcatg  66540
agcgagcctc gcgtgcgcta cgagaagaag gaacacgtcg cccatgtgac gatgaaccgg  66600
ccccacgtgc tgaacgcgat ggatcgccgg atgcacgagg agctcgccga gatctgggac  66660
gacgtcgagg ccgacgacga cgtcaggacg gtcgtcctga ccggtgcggg aacgcgggcc  66720
ttctccgtcg gccaggacct caaggaacgc gcgctgctgg acgaggcggg cacgcaggcc  66780
tcgacgttcg gcagccgggg gcaggcaggt catccccggc tgaccgaccg cttcaccttg  66840
tccaagccgg tggtcgcccg ggtgcacggc tacgcgctgg gtggcggctt cgagctggtg  66900
ctcgcctgcg acctcgtcat cgcctccgag gaggcggtgt tcggcctgcc ggaggtccgg  66960
ctcggcctga tccccggggc gggaggcgtg ttccggctgc cgcggcagct gccgcagaag  67020
gtggcgatgg gccatctgct gaccgggcgc cggatggatg cggccacggc gttccggtac  67080
ggattggtga acgaggtcgt accgcttgat gagctggatc ggtgcgtggc cggatggacc  67140
gacgacctcg tacgcgccgc tccgctgtct gttcgcgcga tcaaggaggc cgccatgcgg  67200
tcgctcgaca ttcccctgga ggaggcgttc accacgtcct acccatggga agagcgtcgt  67260
cggcgtagcg gcgatgcgat cgagggcgtc cgggcgttcg tcgagaagag ggacccggtc  67320
tggacgtcga gatgatcccc ccgcacacgt tgctggtctt cttcgttcag gctgcggccc  67380
tcctgctgct cgcgttgctc ctgggccgcc tggccgtacg gctgggcctg gcggcggtcg  67440
tcggcgaact gtgtgccggc gtcatcctcg gcccctccgt gctggggcag gtcgcgcccg  67500
gggcggagca gtggctgttt ccctcgccgt cgtcacacat gctggacgcc gtcgggcagc  67560
tcggcgtgtt gttgctgatc ggcttgacgg gcgcgcatct ggatctgcgg ctgatccggc  67620
ggcagggcgc cacggcggtg cgggtgagcg ccttcgggtt ggtcgtgccg atggccctcg  67680
gcatcggcgc cggcctgttg ctgccggccg agttccgcgg gaccggcggc tcggccgtct  67740
tcgccctgtt cctgggggtg acgatgtgtg tcagctcgat ccccgtgatc gccaagacgc  67800
tgatggacat gaacctgctc catcgcaacg tcggccagct cacgctgacc gccggcatga  67860
tcgacgacgc cttcgggtgg gtgctgcttt cggtggtgac ggcgatggcc accgccggag  67920
ccggtgcggg gaccgtggtg ctgtcgatcg cgtcgctgct cggggtgatc gtcttcagcg  67980
tcgtcatcgg caggccggcg gtccgggtgg cgttgcggac gacggaggat cagggggtga  68040
tcgccggcca ggtcgtggtg ctggtgctcg cggccgcggc cgggacgcat gcgctgggcc  68100
tcgaaccgat cttcggggcc ttcgtcgccg ggctgctggt gagcacggcc atgccgaatc  68160
cggtcagact ggcaccgctg cgcacggtga cgctcggggt gctggctccc ctctatttcg  68220
ccaccatggg cctgcgcgtc gatctcacgg ccctggcgcg gccggaggtg ctcgccgtgg  68280
ggctgctggt cctggccctg gcgatcatcg gcaagttcct gggcgccttc ctgggcgcct  68340
ggaccagccg gctcagccga tgggaggcct tggcgctggg ggcggggatg aacgcccgtg  68400
gcgtcatcca gatgatcgtg gcgacggtcg gcctgcggct gggggtgatc actgacgaga  68460
tcttcacgat catcatcgtg gtggcggtga tcacctctct gctcgccccg ccactcctgc  68520
gcctggccat gaccaggatc gaggccaccg ccgaggagga ggcccgcctc ctcgcctacg  68580
ggctgcgccc cggcgaggcc cgggaagacg tacggtgacg acggctcggg atcgtcgtgc  68640
ccgacgacaa ggccggcagc cggacggtgg tggccggtgc cggctcagcc acagtgggcc  68700
ggggtcgcga tgcccagccg cgcgtgcagg tgcgcccaca gagcagcctg ctcgtgcccc  68760
aggaagaagt ggcctccggg caggacgtgg caggagaact cccgagccgt caactcggcc  68820
catcgcgcga ccgcgtcgag ccgtacgacg ggatcgtccg caccggtgaa cgccgtgatc  68880
ggcaccgtca ggggcggccc aggcgtgtgg cggtaggact ggacgagctg gaagtcgttg  68940
cgcacgtagg ggagggcgaa cgcccggaac tccgcgctcg cgagcgcctc ggcatcggtg  69000
ccgcccaaca ggcgcagcct gtcgatgagc gcctcctcgg aggccggcgc cacccgatgc  69060
gcgagacggc cacggtcgtg cgcggccaca cctccggaga cgaagagatg agccggcggg  69120
ataccggacc cggtgagaag ccgcgccgtc tcgtaagcga tcaaactgcc catactgtgc  69180
ccgaacagcg ccaccggccg gtcgaggagc ggcctcagct cacgccccac cgactccgcg  69240
agccggtggg catcaccgac gaggggttcg tgcaaccggt cggcgcggcc cggatactga  69300
accgcgtgca cttctatctc cggcgcggcc agccggtgcc aattccggta gaagaccgcc  69360
gaaccgcccg cgtgcggaaa acagatcagc cgcatcgtgg cgagcggccg cctgtcgaaa  69420
caccgaaacc aggtggacat gtagcctcgc ttcggcctca tatcatggtc ttgggtcaat  69480
cctggtgacc tgactatatg cctgcaccgc cataaagtat gtccgtccac tcatcggcgg  69540
gcatgcggca cgagtctgcc caggtcgcac ttgacgcctg gtcggcaaag ggaaaaccct  69600
tgcttccatg gactcccacg ttctcgccca tcaattgagc aaggaaacgc tgcacggatc  69660
gctgatggac ccggccatcg agtcgatgaa tctactgaac gagattgccg gcaactaccc  69720
cgacgccatt tccatggccg cgggccggcc gtacgaggag ttcttcgacg tcggcctcat  69780
ccacgactat ctggaggcct accgcgacca tctccgcaac gaccggcgga tggatgacgc  69840
cgggatcagc cgcatgcttt tccaatacgg gaccacgaag gggatcatct ccgaccttgt  69900
cgcccggcac ctcgccgagg acgagaacat cgaggccgac ccggcctccg tggtcatcac  69960
tgtgggcttc caggaggcca tgttcctggt gcttcgcgcg ctgcgagcga acgagcggga  70020
cgtcctgctc gcccccacgc ccacctacgt cggcctgacc ggagcggcgc tgctcaccga  70080
cacccctgtc tggccggtcc agtccaccga caacggcatc gacctcgacc accttgagca  70140
ccaactgaaa cgcgcccagg accagggcgc ccgggtccgg gcctgctacg tgaccccgaa  70200
cttcgccaac cccaccggca ccagcatgga cctgcccgcc cgccatcgcc tcctggaggt  70260
cgccgcggcc cacggcatcc tgatcctgga ggacaacgcg tacggactcc tcggccagga  70320
ccgcctcccc acgctgaagt ccctcgacca tgcggcgacc gtcgtctacc tcggctcctt  70380
cgccaagacc ggcatgcccg gcgcccgggt cggctacgtc gtggcggacc agcacgtagc  70440
ggggggcggc tcgctcgccg acgagctcgc gaagctcaag ggcatgctca ccgtgaacac  70500
ctcgcccatc gcccaggcgg tgatcgccgg caagctgctg cgccacgact tcagcctggc  70560
ccgggccaac gcccgcgaga ccgccatcta ccagcgcaac ctccacctca cgctggacga  70620
actcacccgc cggctcggcg ccgtcccggg agtcacctgg aacgcgccga cgggcgggtt  70680
cttcatcacc gtcaccgtgc ccttcgtcgt ggatgacgag ctgttggaac acgctgcccg  70740
cgatcatggc gttttgttca cgccgatgca tcacttctat ggtgggaagg atgggttcaa  70800
ccagcttcgg ctgtcgatca gcctgctcaa cccgcaactg atcgaggagg gtgtctcccg  70860
gcttgccggg ctcgtcaccg catgtctccc ctgaaccatg cctggggcct tgagtcggac  70920
ggccgggttg cgtgcggccg ggatgaaggt caaccacaag cgggtggtgc gcgagcacgg  70980
cctcgccggg cggtggccag cgaccaaggc ctcgacaaac gccatcgccg accctcccga  71040
gggaggatcg gcggttgaag atctgtgtgc cccctgcagg attcgaacct gcgcacccgg  71100
ctccggaggc cggtgctcta tcccctgagc taaggggg                          71138
<210>2
<211>366
<212>PRT
<213>野野村菌属
<400>2
Met His Glu Ser Pro Val Cys Leu Ala Glu Tyr Glu Glu Ile Ala Ala
1               5                   10                  15
Lys Val Leu Pro Ala Asp Val Arg Asp Phe Ile Asp Gly Gly Ser Gly
            20                  25                  30
Arg Glu Gln Thr Leu Arg Ala Ash Arg Ala Ala Phe Asp Arg Val Phe
        35                  40                  45
Leu Val Pro Arg Val Leu Gln Asp Val Ser Ala Cys Ser Thr Arg Ala
    50                  55                  60
Thr Leu Leu Gly His Pro Ala Thr Met Pro Val Ala Val Ala Pro Val
65                  70                  75                  80
Ala Tyr His Arg Leu Val His Pro Asp Gly Glu Leu Ala Thr Ala Arg
                85                  90                  95
Ala Ala Arg Asp Ala Gly Val Pro Phe Thr Val Ser Thr Leu Ser Ser
            100                 105                 110
Val Pro Val Glu Asp Val Thr Ala Leu Gly Gly His Val Trp Phe Gln
        115                 120                 125
Leu Tyr Cys Leu Arg Glu His Ala Ala Thr Leu Gly Leu Ile Arg Arg
    130                 135                 140
Ala Glu Asp Ala Gly Cys Arg Ala Leu Met Leu Thr Leu Asp Val Pro
145                 150                 155                 160
Trp Met Gly Arg Arg Pro Arg Asp Ile Arg Asn Arg Phe Arg Leu Pro
                165                 170                 175
Pro His Val Arg Pro Val His Leu Thr Ala Asn Ser Gly Thr Glu Ala
            180                 185                 190
His Arg Gly Ala Ser Gly Gly Ser Ala Leu Ala Ala His Thr Ala Met
        195                 200                 205
Glu Leu Ser Ala Ala Val Asp Trp Ser Tyr Leu Glu Thr Leu Arg Ala
    210                 215                 220
Ala Ser Gly Leu Pro Leu Val Val Lys Gly Ile Leu His Pro Glu Asp
225                 230                 235                 240
Ala Arg Arg Ala Ala Asp Leu Gly Ile Asp Gly Ile Val Val Ser Asn
                245                 250                 255
His Gly Gly Arg Gln Leu Asp Gly Ala Val Ala Ser Leu Asp Ala Leu
            260                 265                 270
Pro Gly Val Ala Glu Ser Val Gly Gly Arg Cys Glu Ile Met Leu Asp
        275                 280                 285
Gly Gly Val Arg Ser Gly Ala Asp Val Leu Lys Ala Leu Ala Leu Gly
    290                 295                 300
Ala Ser Gly Val Leu Val Gly Arg Pro Val Ile Trp Gly Leu Ala Ala
305                 310                 315                 320
Asp Gly Glu Arg Gly Val Arg Thr Val Leu Gly Leu Leu Gly Ala Glu
                325                 330                 335
Ile Glu Asp Gly Leu Gly Leu Ala Gly Cys Gly Asp Val Ala Ala Ala
            340                 345                 350
Gln Ala Leu Arg Thr Thr Arg Pro Gly Ala Gly Phe Val Ser
        355                 360                 365
<210>3
<211>356
<212>PRT
<213>野野村菌属
<400>3
Met Glu Ser Leu Pro Pro Leu Ala Val Asp Tyr Val Glu Met Tyr Val
1               5                   10                  15
Ala Asp Leu Lys Val Ala Thr Leu Pro Trp Thr Asp Glu Tyr Arg Phe
            20                  25                  30
Ala Val Val Gly Thr Ala Asn Ala Ser Asp His Arg Ser Val Ala Leu
        35                  40                  45
Arg Gln Gly Arg Ile Thr Leu Val Leu Thr Gln Ala Thr Ser Asp Gly
    50                  55                  60
His Pro Ala Ser Ala Tyr Val Arg Thr His Gly Asp Gly Val Ala Asp
65                  70                  75                  80
Ile Ala Leu Arg Thr Pro Asp Val Asp Val Val Phe Thr His Ala Val
                85                  90                  95
Ala Ala Gly Ala Arg Pro Val Arg Ser Pro Ser Arg His Pro Gly Pro
            100                 105                 110
Gly Pro Ala Cys Ser Ala Ala Ile Gly Gly Phe Gly Asp Val Val His
        115                 120                 125
Thr Leu Val Gln Arg Asp Pro Gly Asp Asp Pro Gly Leu Pro Val Gly
    130                 135                 140
Phe Ser Glu Ala Pro Ser Ala Ala Glu Ser Gly Ala Asp Ala Ala Glu
145                 150                 155                 160
Leu Leu Asp Ile Asp His Phe Ala Val Cys Leu Pro Thr Gly Asp Leu
               165                 170                 175
Asp Ile Ile Thr Asp Phe Tyr Val Ala Thr Leu Gly Phe Ser Glu Thr
            180                 185                 190
Phe Lys Glu Arg Ile Glu Val Gly Thr Gln Ala Met Glu Ser Lys Val
        195                 200                 205
Val Gln Ser Ala Ser Gly Ala Val Thr Leu Thr Leu Ile Glu Pro Asp
    210                 215                 220
Pro Met Ala Glu Ala Gly Gln Ile Asp Met Phe Leu Glu Arg His Ala
225                 230                 235                 240
Gly Ala Gly Val Gln His Val Ala Phe Ser Ser Ser Asp Ala Val His
                245                 250                 255
Ala Val Asn Thr Leu Ser Glu Arg Gly Val Arg Phe Leu Ser Thr Pro
            260                 265                 270
Gly Ser Tyr Tyr Asp Leu Leu Glu Ser Arg Ile Gln Ile Arg Gly His
        275                 280                 285
Thr Val Asp Gln Leu Arg Ala Thr Gly Leu Leu Ala Asp Glu Asp His
    290                 295                 300
Gly Gly Gln Leu Phe Gln Ile Phe Thr Ala Ser Thr His Pro Arg Glu
305                 310                 315                 320
Thr Leu Phe Phe Glu Val Ile Glu Arg Gln Gly Ala Arg Thr Phe Gly
                325                 330                 335
Gly Ala Asn Ile Lys Ala Leu Tyr Glu Ala Val Glu Val Ala Arg Ser
            340                 345                 350
Gln Gln Arg Ala
        355
<210>4
<211>867
<212>PRT
<213>野野村菌属
<400>4
Met Leu Phe Gly Arg Asp Arg Glu Leu Lys Ser Leu Thr Arg Leu Leu
1               5                   10                  15
Asp Ser Thr Ala Ala Gly Arg Gly Gly Val Ala Val Ile Thr Gly Pro
            20                  25                  30
Val Val Gly Gly Lys Thr Ala Ile Leu His Glu Leu Gly Met Arg Ser
        35                  40                  45
Ile Ala Ala Gly Ile Arg Leu Val Thr Ala Arg Cys Thr Pro Ala Glu
    50                  55                  60
Gln Ser Leu Asp Trp Gly Val Ala Asp Gln Ile Leu Gly Arg Gly Ala
65                  70                  75                  80
Ala Glu Arg Leu Thr Ala Arg Arg Gly Gly Asp Ala Val Glu Asp Val
                85                  90                  95
Cys Val Ser Leu Phe Gln Met Ala Glu Ala Asn Pro Ile Leu Leu Thr
            100                 105                 110
Ile Asp Asp Val Asp Leu Ala Asp Asp Pro Ser Leu Leu Ala Ile Leu
        115                 120                 125
Ser Met Thr Pro Leu Leu Thr Asp Thr Arg Met Met Ile Ala Val Thr
    130                 135                 140
Ile Cys Gln Asp Arg Pro Pro Ala Pro Leu Pro His Val Ala Glu Ser
145                 150                 155                 160
Leu Leu Arg Leu Pro Gly Ile Glu Leu Val Glu Leu Pro Leu Leu Pro
                165                 170                 175
Arg Pro Ala Val Arg Gln Phe Ala Thr Glu His Leu Gly Ala Glu Thr
            180                 185                 190
Ala Asp Gln Leu Ala Asp Asp Leu Tyr Arg Phe Ser Gly Gly Ser Pro
        195                 200                 205
Leu Leu Val Arg Ala Leu Ile Glu Asp Gln Glu Ala Gly Ala Pro Gly
    210                 215                 220
Leu Val Val Gly Asp Ser Phe Met Ser Ala Val Ala Ala Cys Val His
225                 230                 235                 240
Gly Cys Glu Pro Glu Ala Val Arg Val Ala Glu Ala Val Ala Val Leu
                245                 250                 255
Gly Glu His Ala Thr Pro Asp Ala Val Gly Glu Leu Val Gly Ile Ala
            260                 265                 270
Pro Pro Ala Ala Thr Arg Ser Met Gly Met Leu Glu Arg Ala Gly Leu
        275                 280                 285
Leu Ala Gly Gly Arg Phe Arg His Glu Ala Gly Arg Leu Ala Val Leu
    290                 295                 300
Gly Arg Met Thr Ser Tyr Gly Arg Met Glu Ile Leu Arg Arg Ala Ala
305                 310                 315                 320
Glu Ile Leu His Arg Arg Gly Gly Pro Pro Ser Ala Val Ala Thr Arg
                325                 330                 335
Leu Leu Glu Ala Gly Trp Ser Gly Glu Glu Trp Ala Phe Asp Val Leu
            340                 345                 350
Val Glu Ala Gly Arg Gln Ala Phe Asp Glu Gly Asp Phe Val Ala Val
        355                 360                 365
Met Lys Cys Leu Arg Leu Ala Leu Ala Ser Gly Trp Gly Thr Pro Arg
    370                 375                 380
Arg Leu Asp Val Lys Val Met Leu Ala Ala Ala Glu Trp Arg Val Asp
385                 390                 395                 400
Pro Ala Val Ala Ala Arg His Val Pro Asp Leu Leu Asp Ala Thr Arg
                405                 410                 415
Ser Gly Ala Leu Arg Gly Ser His Gly Met Glu Leu Phe Arg Gln Leu
            420                 425                 430
Leu Trp Tyr Gly Arg Phe Ala Asp Ala Ala Glu Leu Ile Asp Arg Leu
        435                 440                 445
Arg Pro Ser Val Ala Asp Arg Asp Ala Asp Ala Ser Leu Ile Ala Met
    450                 455                 460
Cys His Val His Pro Val Leu Leu Asp Arg Leu Pro Arg Ser Ala Arg
465                 470                 475                 480
Gly Ser Met Gly Gln Thr Val Glu Asp Ala Arg Arg Ile Leu Arg Gln
                485                 490                 495
Ala Glu Pro Thr Asp Glu Ala Met Asp Ser Ile Ile Ser Ala Leu Met
            500                 505                 510
Ala Leu Leu Leu Gly Gly Val Ser Glu Val Ala Ala Ser Cys Glu Thr
        515                 520                 525
Leu Leu Lys Glu Pro Gly Val Thr Lys Ala Pro Thr Trp Lys Ala Ile
    530                 535                 540
Ile Ser Ala Ile Arg Ala Glu Thr Ala Trp Arg Lys Gly Asp Leu Ala
545                 550                 555                 560
Gly Ala Glu Ala His Ala Gln Glu Ala Leu Thr Ile Leu Gln Pro Ser
                565                 570                 575
Gly Trp Gly Val Ala Ile Gly Ala Pro Leu Ser Thr Leu Leu His Ala
            580                 585                 590
Gln Thr Ala Met Gly His Leu Asp Glu Ala Lys Ala Thr Val Ala Val
        595                 600                 605
Pro Met Pro Arg Glu Thr Ala Glu Thr Ala Phe Gly Ile Gly Tyr Glu
    610                 615                 620
Leu Ala Arg Ala His Tyr His Leu Val Thr Glu Gln Pro Arg Ala Ala
625                 630                 635                 640
Phe Ala Gly Phe Leu Ala Cys Gly Gln Ala Val Gln Arg Trp Gly Ser
                645                 650                 655
Ser Leu Ser Asp Val Val Pro Trp Arg Leu Gly Ala Ala Arg Ala Cys
            660                 665                 670
Leu Gln Leu Gly Trp Arg Arg Arg Ala Ala Asp Leu Val Thr Ala Gln
        675                 680                 685
Ile Ala His Thr Ser Ser Gly Asp Leu Arg Thr Tyr Gly Val Ala Leu
    690                 695                 700
Arg Leu His Ala Gln Leu Ser Lys Pro Ala Gln Arg Gln Arg Leu Leu
705                 710                 715                 720
Met Gln Ser Val Asp Ala Leu Glu Ala Ala Gln Asp Arg Tyr Gln Leu
                725                 730                 735
Ala Leu Ser Leu Cys Asp Leu Ala Gly Thr Pro Gln Leu Lys Gly Gly
            740                 745                 750
Lys Asp Glu Ala Arg Ala Tyr Trp Val Arg Ala Gln Glu Leu Ala Arg
        755                 760                 765
Glu Cys Asn Ala Lys Pro Leu Met Arg Arg Leu Ala Ala Gln His Asp
    770                 775                 780
His Gly Glu Thr Ala Pro Leu Ser Gly Ala Glu Arg Arg Val Ala Val
785                 790                 795                 800
Leu Ala Ala Arg Gly His Thr Asn Arg Glu Ile Ala Glu Ala Leu Tyr
                805                 810                 815
Ile Thr Arg Ser Thr Val Glu Gln His Leu Thr Arg Ile Tyr Arg Lys
            820                 825                 830
Leu His Val Gln Thr Arg Gly Asp Leu Gly Asn Leu Phe Ala Ala Asp
        835                 840                 845
Ile Ala Asp Lys Ala Thr Ala Thr Ala Gly Arg Glu Pro Arg Glu Ala
    850                 855                 860
Val Arg Leu
865
<210>5
<211>321
<212>PRT
<213>野野村菌属
<400>5
Met Asp Pro Thr Gly Val Asp Ile Ala Thr Leu Pro Val Val Glu Ile
1               5                   10                  15
Glu Leu Ser Arg Leu Ser Ser Val Tyr Ser Pro Arg Thr Ser Gly Glu
            20                  25                  30
Asp Pro Glu His Val Glu Thr Leu Leu Ser Ala Gln Gly Glu Leu Pro
        35                  40                  45
Pro Ile Leu Val His Arg Pro Thr Met Arg Val Ile Asp Gly Leu His
    50                  55                  60
Arg Leu Lys Val Ala Arg Val Arg Gly Glu Thr Thr Ile Ser Val Arg
65                  70                  75                  80
Leu Ile Asp Gly Thr Glu Ser Asp Ala Phe Val Leu Ala Val Glu Ala
                85                  90                  95
Asn Val Arg His Gly Leu Pro Leu Ser Leu Ala Asp Arg Lys Arg Ala
            100                 105                 110
Ala Val Arg Ile Ile Gly Thr His Pro Gln Trp Ser Asp Arg Arg Val
        115                 120                 125
Ala Ser Ala Thr Gly Ile Ser Ala Gly Thr Val Ala Asp Leu Arg Arg
    130                 135                 140
Arg Arg Gly Gln Gly Gly Asp Glu Ala Arg Ile Gly Arg Asp Gly Arg
145                 150                 155                 160
Ile Arg Pro Val Asp Ser Ser Glu G1y Arg Arg Leu A1a Ala Glu Leu
                165                 170                 175
Ile Arg Ser His Pro Asp Leu Ser Leu Arg Gln Val Ala Lys Gln Val
            180                 185                 190
Gly Ile Ser Pro Glu Thr Val Arg Asp Val Arg Gly Arg Leu G1u His
        195                 200                 205
Gly Glu Ser Pro Ile Pro Asp Gly Ser Arg Arg Leu Arg Thr Lys Pro
    210                 215                 220
Glu Leu Leu Arg Arg Ala Glu Gln Asp Phe Gly His Val Asp Gly Arg
225                 230                 235                 240
Asp Arg Gln Ala Val Leu Glu Arg Leu Lys Ala Asp Pro Ala Leu Arg
                245                 250                 255
Leu Thr Glu Thr Gly Arg Ile Leu Leu Arg Met Leu Ser Leu His Ser
            260                 265                 270
Ile Asp Gly Gln Glu Trp Glu Arg Ile Leu Arg Gly Val Pro Pro His
        275                 280                 285
Trp Gly Thr Val Val Ala Arg Cys Ala Arg Asp His Ala Gln Ile Trp
    290                 295                 300
Ala Ala Phe Ala Asp Arg Leu Glu Gly Arg Ala Thr Asp Leu Ala Ala
305                 310                 315                 320
Gly
<210>6
<211>369
<212>PRT
<213>野野村菌属
<400>6
Met Thr Leu Glu Arg Thr Leu Ile Val Gly Thr Gly Leu Ile Gly Thr
1               5                   10                  15
Ser Ala Ala Leu Ala Leu Arg Glu Lys Gly Val Ala Val Tyr Leu Ser
            20                  25                  30
Asp Val Asp Ala His Ala Val Arg Leu Ala Arg Ala Leu Gly Ala Gly
        35                  40                  45
Gln Glu Trp Thr Gly Gln Arg Val Asp Leu Ala Leu Ile Ala Val Pro
    50                  55                  60
Pro Pro Ser Val Gly Gln Arg Leu Ala Asp Leu Gln Gln Arg Arg Ala
65                  70                  75                  80
Ala Arg Ala Tyr Thr Asp Val Thr Ser Val Lys Val Asp Pro Ile Ala
                85                  90                  95
Asp Ala Glu Arg Leu Gly Cys Asp Leu Thr Ser Tyr Val Pro Gly His
            100                 105                 110
Pro Leu Ala Gly Arg Glu Arg Ser Gly Pro Ala Ala Ala Arg Ala Asp
        115                 120                 125
Leu Phe Leu Gly Arg Pro Trp Ala Leu Cys Pro Arg Pro Glu Thr Gly
    130                 135                 140
Ala Asp Ala Val Arg Leu Ala Arg Glu Leu Val Ser Met Cys Gly Ala
145                 150                 155                 160
Glu Pro Tyr Thr Val Ser Ala Gly Glu His Asp Thr Ala Val Ala Leu
                165                 170                 175
Val Ser His Ala Pro His Val Ala Ala Ser Ala Val Ala Ala Arg Leu
            180                 185                 190
Arg Asp Gly Asp Asp Val Ala Leu Ala Leu Ala Gly Gln Gly Leu Arg
        195                 200                 205
Asp Val Thr Arg Ile Ala Ala Gly Asp Pro Leu Leu Trp Arg Met Ile
    210                 215                 220
Leu Ala Ala Asn Ala Leu Pro Val Ala Gly Val Leu Glu Arg Ile Ala
225                 230                 235                 240
Ala Asp Leu Ala Ala Ala Ala Ser Ala Leu Arg Ser Gly Asp Leu Asp
                245                 250                 255
Asp Val Thr Asp Leu Leu Arg Arg Gly Val Asp Gly His Gly Arg Ile
            260                 265                 270
Pro Asp Lys His Gly Gly Pro Ala Arg Asp Tyr Thr Val Ile Gln Val
        275                 280                 285
Val Leu Gln Asp Arg Pro Gly Glu Leu Ala Arg Leu Phe Asn Ala Ala
    290                 295                 300
Gly Leu Ala Asp Val Asn Ile Glu Asp Ile Arg Leu Glu His Ser Ala
305                 310                 315                 320
Gly Leu Pro Val Gly Val Val Glu Val Ser Val Arg Pro Glu Asp Thr
                325                 330                 335
Gly Arg Leu Thr Glu Ala Leu Arg Phe His Gly Trp His Val Pro Pro
            340                 345                 350
Val Pro Asp Gly Asn Ser Arg Ile Asp Arg Thr Arg Ala Met Val Ser
        355                 360                 365
Asp
<210>7
<211>217
<212>PRT
<213>野野村菌属
<400>7
Met Arg Val Leu Val Val Glu Asp Gln Val Asp Leu Ala Asp Ser Val
1               5                   10                  15
Ala Arg Val Leu Arg Arg Glu Gly Met Ala Val Asp Val Ser His Asp
            20                  25                  30
Gly Asp Asp Ala Gln Glu Arg Leu Ser Val Ile Asp Tyr Asp Val Val
        35                  40                  45
Val Leu Asp Arg Asp Ile Pro Gly Val His Gly Asp Glu Leu Cys Ala
    50                  55                  60
Glu Ile Ala Val Asp Asp Arg Arg Thr Arg Val Leu Met Leu Thr Ala
65                  70                  75                  80
Ser Gly Thr Thr Ala Asp Arg Val Ala Gly Leu Ser Leu Gly Ala Asp
                85                  90                  95
Asp Tyr Leu Pro Lys Pro Phe Ala Phe Ala Glu Leu Val Ala Arg Ile
            100                 105                 110
Arg Ala Leu Gly Arg Arg Ala His Pro Pro Ala Pro Pro Ile Leu Val
        115                 120                 125
His Gly Asp Leu Arg Leu Asp Pro Ala Gln Arg Val Ala Ile Arg Gly
    130                 135                 140
Gly Met Arg Leu Pro Leu Thr Thr Lys Glu Leu Ala Val Leu Glu His
145                 150                 155                 160
Leu Leu Thr Ala Arg Gly Arg Val Val Ser Ala Glu Glu Leu Leu Glu
                165                 170                 175
Arg Val Trp Asp Glu Gln Ala Asp Pro Phe Thr Thr Thr Val Lys Ala
            180                 185                 190
Thr Ile Asn Arg Leu Arg Ser Lys Leu Gly Gln Pro Pro Val Ile Glu
        195                 200                 205
Thr Val Pro Arg Glu Gly Tyr Arg Ile
    210                 215
<210>8
<211>196
<212>PRT
<213>野野村菌属
<400>8
Met Arg Arg Ser Glu Gly Asp Asp Glu Pro Arg Thr Leu Pro Pro Arg
1               5                   10                  15
Ala Arg Asp Arg Val Tyr Thr Ala Val Thr Arg Val Leu Ala Val Leu
            20                  25                  30
Leu Leu Pro Val Ala Phe Val Arg Gln Pro Gly Arg Ala Arg Glu Leu
        35                  40                  45
Ala Cys Gly Trp Ala Leu Arg Met Arg Phe Pro Ala Glu Asp Leu Thr
    50                  55                  60
Gly Leu Thr Asp Gly Ala Arg Ala Ala Phe Thr Ala Ala Arg Ala Glu
65                  70                  75                  80
Ala Leu Trp Arg His Gly Gln Leu Val Gly Leu Thr Ser Gly Tyr Arg
                85                  90                  95
Asp Pro Arg Val Gln Gln Arg Met Phe Glu Glu Glu Val Arg Arg Ser
            100                 105                 110
Gly Ser Val Ala Ala Ala Arg Met Phe Val Ala Pro Pro Ala Glu Ser
        115                 120                 125
Asn His Val Lys Gly Met Ala Leu Asp Val Arg Pro His Glu Gly Ala
    130                 135                 140
Arg Trp Leu Glu Ala His Gly Ala Arg Tyr Asp Leu Tyr Arg Ile Tyr
145                 150                 155                 160
Asp Asn Glu Trp Trp His Phe Glu His Arg Pro Glu Cys Gly Gly Thr
                165                 170                 175
Pro Pro Arg Arg Leu Pro His Pro Gly Ala Ala Trp Ala Ser Arg Asn
            180                 185                 190
Gly Gly Arg Val
        195
<210>9
<211>319
<212>PRT
<213>野野村菌属
<400>9
Met Asp Ala Glu Ser Val Arg Arg Gln Leu Arg Leu Gly Glu Asn Ala
1               5                   10                  15
Thr Ala Trp Leu Ser Arg Leu Glu Glu Leu Gly Pro Pro Pro Glu Pro
            20                  25                  30
Val Arg Leu Pro Gln Gly Asp Glu Ala Arg Asp Leu Leu His Arg Leu
        35                  40                  45
Glu Val Pro Ala Pro Asp Val Glu Glu Ile Val Ala Ala Thr Pro Gly
    50                  55                  60
Pro Asp Arg Asp Pro Ala Leu Trp Trp Leu Leu Glu Arg Ala His His
65                  70                  75                  80
Glu Leu Val Arg His Met Gly Asp Tyr Lys Val Lys Val Arg Gly Gly
                85                  90                  95
Pro Thr Leu Pro Tyr Glu Thr Gly Ala Ala Ala Arg Tyr Phe His Val
            100                 105                 110
Tyr Val Phe Leu Ala Thr Leu Pro Ala Leu Arg Arg Phe His Ala Thr
        115                 120                 125
Arg Asp Ile Pro Glu Ala Thr Thr Trp Glu Thr Leu Thr Gln Leu Gly
    130                 135                 140
Glu Ser Val Ala Ile His Arg Arg Lys Tyr Gly Glu Gly Gly Thr Asn
145                 150                 155                 160
Met Pro Trp Trp Leu Thr Leu Leu Val Arg Gly Leu Val Tyr Arg Leu
                165                 170                 175
Gly Arg Leu Gln Tyr Asn Leu Ala Val Ala Lys Asp Gly Thr Pro Val
            180                 185                 190
Leu Gly Leu His Ile Pro Glu Val Gly Gly Pro Leu Ile Pro Asp Ile
        195                 200                 205
Tyr Tyr Asp Ser Leu Arg Arg Ala Arg Pro Phe Phe Glu Arg His Phe
    210                 215                 220
Pro Glu His Gly Ala Arg Ala Ala Thr Gly Thr Ser Trp Leu Leu Asp
225                 230                 235                 240
Pro Gln Leu Ala Glu Tyr Leu Ala Glu Asp Ser His Ile Leu Gln Leu
                245                 250                 255
Arg Arg Gly Trp Thr Leu Leu Asp Ser Glu Pro Gln Asp Gly Asp Asp
            260                 265                 970
Ala Ile Leu Glu Phe Val Phe Arg Tyr Asn Gly Gln Pro Leu Glu Glu
        275                 280                 285
Leu Pro Gln Arg Ser Thr Leu Glu Lys Ala Val Val Thr His Leu Leu
    290                 295                 300
Ala Gly Arg His Trp Tyr Gln Arg Ser Gly Arg Ile Glu Leu Pro
305                 310                 315
<210>10
<211>408
<212>PRT
<213>野野村菌属
<400>10
Met Arg Val Leu Leu Ser Thr Ser Gly Ser Arg Gly Asp Val Glu Pro
1               5                   10                  15
Leu Leu Gly Leu Ala Val Gln Leu Arg Glu Leu Gly Ala Glu Thr Arg
            20                  25                  30
Met Cys Ala Pro Pro Asp Cys Ala Glu Arg Leu Ala Glu Ala Gly Val
        35                  40                  45
Pro Leu Val Pro Val Gly Thr Ser Met Arg Ala Lys Leu His Gly Lys
    50                  55                  60
Arg Pro Pro Ser Leu Glu Asp Val Pro Arg Leu Asp Ala Glu Ala Ile
65                  70                  75                  80
Ala Thr Gln Leu Asp Gln Val Leu Pro Ala Ala Glu Gly Cys Glu Val
                85                  90                  95
Met Val Val Ser Gly Val Leu Ser Ala Ala Val Ala Val Arg Ser Val
            100                 105                 110
Ala Glu Lys Leu Gly Ile Pro Tyr Val Tyr Val Phe Tyr Cys Pro Ile
        115                 120                 125
Tyr Val Pro Ser Pro Tyr Tyr Pro Pro Pro Pro Pro Leu Gly Glu Gln
    130                 135                 140
Pro Ala Arg Asp Val Thr Asp Asn Arg Val Leu Trp Asp Arg Asn Asn
145                 150                 155                 160
Gln Gly Ala Tyr Gln Arg Phe Gly Ala Ala Leu Asn Ser Arg Arg Ala
                165                 170                 175
Ser Ile Gly Leu Pro Pro Val Asp Asp Ile Phe Ser Tyr Gly Tyr Thr
            180                 185                 190
Asp Arg Pro Phe Leu Ala Ala Asp Pro Val Leu Ala Pro Leu Gln Arg
        195                 200                 205
Thr Asp Leu Asp Val Val Gln Thr Gly Ala Trp Ile Met Pro Asp Glu
    210                 215                 220
Arg Pro Leu Pro Ala Glu Val Glu Ala Phe Leu Glu Ala Gly Pro Pro
225                 230                 235                 240
Pro Val His Val Glu Phe Gly Ser Gly Pro Ala Pro Thr Asp Ala Ala
                245                 250                 255
Arg Val Ala Ile Glu Ala Ile Arg Ala His Gly His Arg Val Ile Val
            260                 265                 270
Ser Arg Gly Trp Ala Gly Leu Ala Pro Pro Asp Asp Arg Ser Asp Cys
        275                 280                 285
Leu Thr Val Gly Glu Val Asn His Gln Val Leu Phe Gly Arg Val Ala
    290                 295                 300
Ala Val Val His Ala Gly Ser Ala Gly Ile Thr Thr Ala Val Thr Arg
305                 310                 315                 320
Ala Gly Ala Pro Gln Val Val Val Pro Gln Met Thr Asp Gln Pro Tyr
                325                 330                 335
His Ala Gly Arg Val Ala Glu Leu Gly Ile Gly Val Ala His Asp Gly
            340                 345                 350
Arg Val Pro Thr Val Glu Ser Leu Ser Ala Ala Leu Thr Thr Ala Leu
        355                 360                 365
Ala Pro Glu Thr Arg Ala Arg Ala Ile Asp Val Ala Gly Lys Ile Arg
    370                 375                 380
Ala Asp Gly Ala Ala Val Ala Ala Lys Leu Leu Leu Asp Thr Ala Ala
385                 390                 395                 400
Gly Ala Gly Arg Asn Arg Thr Glu
                405
<210>11
<211>489
<212>PRT
<213>野野村菌属
<400>11
Met Glu Glu Phe Asp Val Val Val Ala Gly Gly Gly Pro Gly Gly Ser
1               5                   10                  15
Thr Val Ala Thr Leu Val Ala Met Gln Gly His Arg Val Leu Leu Val
            20                  25                  30
Glu Lys Glu Val Phe Pro Arg Tyr Gln Ile Gly Glu Ser Leu Leu Pro
        35                  40                  45
Ser Thr Val His Gly Val Cys Arg Met Leu Gly Val Thr Asp Glu Leu
    50                  55                  60
Ala Ala Ala Gly Phe Pro Val Lys Arg Gly Gly Thr Phe Arg Trp Gly
65                  70                  75                  80
Ala Arg Pro Glu Pro Trp Thr Phe Ser Phe Ser Val Ser Pro Arg Ile
                85                  90                  95
Thr Gly Pro Thr Thr Phe Ala Tyr Gln Val Glu Arg Ala Arg Phe Asp
            100                 105                 110
Glu Ile Leu Leu Gly Asn Ala Arg Arg Lys Gly Val Val Val Arg Glu
        115                 120                 125
Gly Cys Ser Val Thr Glu Val Ile Glu Asp Gly Asp Arg Val Thr Gly
    130                 135                 140
Leu Arg Tyr Val Asp Pro Asp Gly Gly Glu His Ala Val Ser Ala Arg
145                 150                 155                 160
Phe Val Ile Asp Ala Ser Gly Asn Lys Ser Arg Leu Tyr Ser Ser Val
                165                 170                 175
Gly Gly Thr Arg Asn Tyr Ser Glu Phe Phe Arg Ser Leu Ala Leu Phe
            180                 185                 190
Gly Tyr Phe Glu Gly Gly Lys Arg Leu Ala Glu Pro Tyr Ser Gly Asn
        195                 200                 205
Ile Leu Ser Val Ala Phe Asp Ser Gly Trp Phe Trp Tyr Ile Pro Leu
    210                 215                 220
Ser Asp Thr Leu Thr Ser Val Gly Ala Val Val Arg Arg Glu Met Ala
225                 230                 235                 240
Glu Lys Ile Gln Gly Asp Arg Glu Lys Ala Leu Ala Ala Leu Ile Ala
                245                 250                 255
Glu Cys Pro Leu Ile Ser Glu Tyr Leu Ala Pro Ala Arg Arg Val Thr
            260                 265                 270
Thr Gly Lys Tyr Gly Gln Leu Arg Val Arg Lys Asp Tyr Ser Tyr His
        275                 280                 285
Gln Thr Lys Phe Trp Arg Pro Gly Met Ile Leu Val Gly Asp Ala Ala
    290                 295                 300
Cys Phe Val Asp Pro Val Phe Ser Ser Gly Val His Leu Ala Thr Tyr
305                 310                 315                 320
Ser Gly Leu Leu Ala Ala Arg Ser Ile Asn Ser Val Leu Ala Gly Asp
                325                 330                 335
Val Glu Glu Lys Ile Ala Leu His Glu Phe Glu Ala Arg Tyr Arg Arg
            340                 345                 350
Glu Tyr Ser Val Tyr Tyr Glu Phe Leu Leu Ala Phe Tyr Glu Met Asn
        355                 360                 365
Val Asn Glu Glu Ser Tyr Phe Trp His Ala Lys Lys Val Thr Asn Asn
    370                 375                 380
Lys Glu Tyr Thr Glu Leu Glu Ser Phe Val Asp Leu Val Gly Gly Leu
385                 390                 395                 400
Ser Ser Gly Glu Thr Ala Leu Ala Thr Ser Gly Arg Ile Ala Glu Arg
                405                 410                 415
Ser Ala Glu Phe Ala Ala Ala Val Asp Gln Met Ala Asp Gly Asp Asp
            420                 425                 430
Ser Ser Met Val Pro Leu Phe Lys Ser Gln Val Val Lys Gln Val Met
        435                 440                 445
Gln Glu Gly Gly Gln Glu Gln Met Arg Ala Val Leu Gly Ala Asp Ala
    450                 455                 460
Glu Pro Glu Gln Pro Leu Phe Pro Gly Gly Leu Val Thr Ser Pro Asp
465                 470                 475                 480
Gly Met Arg Trp Leu Thr His His Pro
                485
<210>12
<211>420
<212>PRT
<213>野野村菌属
<400>12
Met Arg Ile Asp Ser Glu Trp Ser Phe Asp Pro Gly Met Asp Asp Asp
1               5                   10                  15
Ile Asp Ala Gly Ala Pro Val Leu Gln Pro Thr Ala Asn Tyr Met Met
            20                  25                  30
Arg Thr His Cys Asp Pro His Glu Asp Met Phe Ala Leu Arg Ala His
        35                  40                  45
Gly Pro Leu Val Arg Ile Gly Gly Asp Ala Ala Thr Gln Leu Arg Val
    50                  55                  60
Asp Tyr Val Trp Gln Ala Leu Gly Tyr Asp Val Val Arg Arg Ile Leu
65                  70                  75                  80
Gly Asp His Glu Asn Phe Thr Thr Arg Pro Arg Trp Ser Ser Ala Pro
                85                  90                  95
Ser Ile Ala Gly Glu Pro Ile Pro Pro Asn Leu Val Gly Gln Leu Ser
            100                 105                 110
Val Tyr Asp Pro Pro Glu His Thr Arg Leu Arg Gly Met Leu Thr Pro
        115                 120                 125
Glu Phe Thr Ala Arg Arg Ile Arg Arg Leu Glu Pro Ala Met Gln Asp
    130                 135                 140
Leu Ile Asp Asp Arg Ile Asp Glu Leu Glu Ala Ala Gly Pro Pro Ala
145                 150                 155                 160
Asp Val Gln Ala Leu Phe Ala Asp Pro Val Gly Gly Gly Val Leu Cys
                165                 170                 175
Glu Leu Leu Gly Ile Pro Arg Asp Asp Arg Ile Glu Phe Ile Arg Arg
            180                 185                 190
Val Arg Gln Asn Val Asp Leu Ser Arg Gly Phe Lys Ala Arg Ala Ala
        195                 200                 205
Asp Ser Ala Ala Phe Asn Arg Tyr Leu Asn Gly Leu Ile Ile Arg Gln
    210                 215                 220
Arg Lys Asp Pro Asp Glu Gly Phe Ile Gly Met Leu Val Arg Glu His
225                 230                 235                 240
Gly Asp Asp Val Thr Asp Glu Glu Leu Lys Gly Val Leu Thr Ala Leu
                245                 250                 255
Ile Leu Gly Gly Val Glu Thr Val Ala Gly Ser Ile Gly Phe Gly Val
            260                 265                 270
Leu Ala Leu Leu Asp His Pro Asp Gln Arg Gln Ser Leu Phe Ala Gly
        275                 280                 285
Arg Glu Glu Ala Asp Arg Val Val Gly Glu Leu Leu Arg Phe Leu Ser
    290                 295                 300
Pro Val Gln Gln Pro Asn Pro Arg Leu Ala Val Arg Asp Val Val Val
305                 310                 315                 320
Asp Gly Gln Leu Ile Lys Ala Gly Asp Tyr Val Leu Cys Ser Ile Leu
                325                 330                 335
Met Ala Asn Arg Asp Glu Ala Leu Thr Pro Asn Ala Asn Val Leu Asp
            340                 345                 350
Val Arg Arg Asp Cys Gly Ser His Val Gly Phe Gly His Gly Ile His
        355                 360                 365
Tyr Cys Ile Gly Ala Ala Ile Ala Arg Thr Leu Leu Arg Met Ala Tyr
    370                 375                 380
Gln Ser Leu Trp Arg Arg Phe Pro Gly Leu Arg Leu Ala Val Ser Ala
385                 390                 395                 400
Glu Glu Val Lys Phe Arg Asn Ala Phe Ile Asp Cys Pro Asp Glu Leu
                405                 410                 415
Pro Val Thr Trp
            420
<210>13
<211>398
<212>PRT
<213>野野村菌属
<400>13
Met Ser Gly Asp Gly Ala Arg Pro Leu His Thr Arg Arg Gln Asp Leu
1               5                   10                  15
Asp Pro Ala Asp Glu Leu Arg Ala Ala Gly Thr Leu Thr Arg Ile Thr
            20                  25                  30
Ile Gly Ser Gly Ala Asp Ala Glu Thr Thr Trp Leu Ala Thr Gly Tyr
        35                  40                  45
Thr Val Val Arg Gln Val Leu Gly Asp His Arg Arg Phe Ser Thr Arg
    50                  55                  60
Arg Arg Trp Asn Glu Arg Asp Glu Ile Gly Gly Arg Gly Asn Phe Arg
65                  70                  75                  80
Pro Arg Glu Leu Val Gly Asn Leu Met Asp Tyr Asp Pro Pro Glu His
                85                  90                  95
Thr Arg Leu Arg Gln Lys Leu Thr Pro Gly Phe Thr Leu Arg Arg Ile
            100                 105                 110
Arg Arg Leu Lys Pro Tyr Ile Glu Gln Ile Val Thr Glu Arg Leu Asp
        115                 120                 125
Ala Leu Glu Arg Ala Gly Pro Pro Ala Asp Leu Val Glu Leu Val Ala
    130                 135                 140
Asp Glu Val Pro Gly Ala Val Leu Cys Glu Leu Ile Gly Val Pro Arg
145                 150                 155                 160
Asp Asp Arg Ala Met Phe Met Gln Leu Cys His Gly His Leu Asp Ala
                165                 170                 175
Ser Arg Ser Gln Lys Arg Arg Ala Ala Ala Gly Ala Ala Phe Ser Arg
            180                 185                 190
Tyr Leu Leu Ala Met Ile Ala Arg Glu Arg Lys Asp Pro Gly Glu Gly
        195                 200                 205
Leu Leu Gly Ala Val Leu Ala Glu Tyr Gly Asp Thr Ala Thr Asp Glu
    210                 215                 220
Glu Leu Arg Gly Phe Cys Val Gln Val Met Leu Ala Gly Asp Asp Asn
225                 230                 235                 240
Ile Ser Gly Met Ile Gly Leu Gly Val Leu Ala Leu Leu Arg His Pro
                245                 250                 255
Glu Gln Ile Ala Ala Leu Gln Gly Asp Asp Gln Ser Ala Asp Arg Ala
            260                 265                 270
Val Asp Glu Leu Ile Arg Tyr Leu Thr Val Pro Tyr Ala Pro Thr Pro
        275                 280                 285
Arg Val Ala Met Glu Asp Val Thr Ile Gly Gly Gln Val Ile Lys Glu
    290                 295                 300
Gly Glu Thr Val Ser Cys Ser Leu Pro Met Ala Asn Arg Asp Pro Ala
305                 310                 315                 320
Leu Leu Pro Asp Ala Gly Arg Leu Asp Val Arg Arg Glu Pro Val Pro
                325                 330                 335
His Val Ala Phe Gly His Gly Val His His Cys Leu Gly Ala Ala Leu
            340                 345                 350
Ala Arg Leu Glu Leu Arg Thr Val Tyr Thr Ala Leu Trp Arg Arg Phe
        355                 360                 365
Pro Thr Leu Arg Leu Ala Asp Pro Asp Arg Glu Pro Ser Phe Arg Leu
    370                 375                 380
Thr Thr Pro Ala Tyr Gly Leu Thr Ser Leu Met Val Ala Trp
385                 390                 395
<210>14
<211>384
<212>PRT
<213>野野村菌属
<400>14
Met Val Val Pro Leu Pro His Gln Arg Leu Arg Leu Asp Pro Val Pro
1               5                   10                  15
Ala Leu Phe Asp Leu Gln Glu Asp Gly Pro Leu His Glu Tyr Asp Thr
            20                  25                  30
Glu Pro Gly Leu Asp Gly His Lys Gln Trp Leu Val Thr Gly Tyr Gly
        35                  40                  45
Glu Ile Arg Glu Ile Leu Ala Asp Ala Asn Arg Phe Ser Ser Met Arg
    50                  55                  60
Pro Val Glu Asp Glu Ala Glu Arg Ala Trp Leu Pro Gly Ile Leu Gln
65                  70                  75                  80
Ser Tyr Asp Ala Pro Asp His Thr Arg Leu Arg Arg Thr Val Thr Arg
                85                  90                  95
Ala Asn Thr Ala Arg Arg Ile Glu Ser Leu Arg Pro Val Val Glu Glu
            100                 105                 110
Thr Val Glu Asp Cys Leu Ala Asp Leu Glu Ser Met Gly Ser Pro Val
        115                 120                 125
Asp Phe Val Arg Asn Ala Ala Trp Pro Ile Pro Ala Leu Ile Ala Cys
    130                 135                 140
Asp Phe Leu Gly Val Pro Arg Asp Asp Gln Ala Glu Leu Ser Arg Met
145                 150                 155                 160
Phe Arg Asp Ser Arg Glu Ser Arg Val Pro Arg Gln Arg Asn Val Ser
                165                 170                 175
Gly Leu Gly Ile Val Asp Tyr Ala Arg Lys Leu Ala Ala Arg Glu Arg
            180                 185                 190
Leu Asp Pro Gly Thr Gly Met Ile Gly Gly Ile Val Arg Glu His Gly
        195                 200                 205
Gly Glu Val Thr Asp Glu Glu Leu Ala Gly Leu Val Glu Gly Ile Met
    210                 215                 220
Ile Gly Ala Val Glu Gln Met Ala Ser Gln Leu Ala Ile Ala Val Leu
225                 230                 235                 240
Leu Leu Val Thr His Pro Asp Gln Met Ala Leu Leu Arg Glu Arg Pro
                245                 250                 255
Glu Leu Ala Asp Ser Ala Ala Glu Glu Val Phe Arg Tyr Ala Ser Ile
            260                 265                 270
Val Glu Thr Pro Ser Pro Arg Thr Ala Leu Val Asp Thr Arg Leu Ala
        275                 280                 285
Gly Arg Asp Ile His Ala Gly Asp Val Leu Thr Cys Ser Ile Leu Ala
    290                 295                 300
Gly Asn Arg Ala Arg Glu Asp Arg Phe Asp Leu Thr Arg Gly Asn Pro
305                 310                 315                 320
Glu His Leu Ala Phe Gly His Gly Val His Phe Cys Leu Gly Ala Pro
                325                 330                 335
Leu Ala Arg Leu Gln Ala Gln Val Ala Leu Pro Ala Leu Val Arg Arg
            340                 345                 350
Phe Pro Ser Leu Arg Leu Ala Val Pro Ala Glu Asp Leu Arg Phe Lys
        355                 360                 365
Pro Gly Lys Pro Ala Pro Phe Ala Val Glu Glu Leu Pro Val Glu Trp
    370                 375                 380
<210>15
<211>393
<212>PRT
<213>野野村菌属
<400>15
Met Glu Val Phe Glu Glu Leu Asn Val Val Leu Pro Gly Glu Leu His
1               5                   10                  15
Trp Arg Asp Arg Phe Asp Pro Val Pro Gln Leu Arg Ser Phe Met Ala
            20                  25                  30
Glu Gly Pro Met Thr Glu Leu Gly Ala Glu Glu Gly Pro Gly Gly Arg
        35                  40                  45
Thr Ala Trp Leu Ala Thr Gly Phe Asp Glu Val Arg Gln Val Leu Gly
    50                  55                  60
Ser Asp Lys Phe Ser Ser Arg Leu Leu Tyr Gly Gly Thr Ala Ala Gly
65                  70                  75                  80
Ile Val Phe Pro Gly Phe Ile Thr Gln Tyr Asp Pro Pro Glu His Thr
                85                  90                  95
Arg Leu Arg Arg Val Val Ser Pro Ala Phe Thr Val Arg Arg Met Glu
            100                 105                 110
Arg Phe Arg Pro Gln Val Asp Gln Val Val Glu Asp Cys Leu Asp Ala
        115                 120                 125
Ile Glu Ser Ile Gly Gly Pro Leu Asp Phe Val Pro His Phe Gly Trp
    130                 135                 140
Ser Ile Ala Thr Thr Ala Thr Cys Asp Phe Leu Gly Ile Pro Arg Asp
145                 150                 155                 160
Asp Gln Ala Glu Leu Ser Arg Ser Leu His Ala Ser Arg Ser Gln Arg
                165                 170                 175
Ala Ala Ser Arg Arg Gly Ala Ala Gly Asn Lys Phe Met Thr Tyr Met
            180                 185                 190
Gly Gln Val Val Ala Arg Thr Arg Arg Asp Pro Gly Asp Asp Met Leu
        195                 200                 205
Ser Val Val Val Arg Glu His Gly Asp Glu Ile Thr Asp Ala Glu Leu
    210                 215                 220
Thr Gly Leu Ala Ala Phe Val Met Gly Ala Gly Gly Asp Gln Val Ala
225                 230                 235                 240
Arg Phe Leu Ala Ala Gly Ala Trp Leu Met Ala Glu Val Pro Glu Gln
                245                 250                 255
Phe Ala Leu Leu Arg Asp Lys Pro Asp Val Val Pro Asp Trp Leu Glu
            260                 265                 270
Glu Met Val Arg Tyr Leu Thr Ile Asp Glu Lys Leu Thr Pro Arg Ile
        275                 280                 285
Ala Leu Glu Asp Val Arg Ile Gly Asp Arg Ile Val Lys Ala Gly Asp
    290                 295                 300
Thr Val Thr Cys Ser Leu Leu Gly Ala Asn Arg Arg His Phe Pro Gly
305                 310                 315                 320
Pro Asp Asp Gln Phe Asp Leu Thr Arg Asp Arg Ala Pro Asn Val Ala
                325                 330                 335
Phe Gly His Gly Ile His His Cys Leu Gly Arg Pro Leu Ala Glu Leu
            340                 345                 350
Ile Phe Arg Ser Ala Ile Pro Ala Leu Ala Arg Arg Phe Pro Ala Leu
        355                 360                 365
Arg Leu Ala Glu Pro Glu Gln Glu Ile Arg Leu Gly Pro Pro Pro Phe
    370                 375                 380
Asp Val Lys Ala Leu Leu Leu Asp Trp
385                 390
<210>16
<211>69
<212>PRT
<213>野野村菌属
<400>16
Met Thr Asn Pro Phe Glu Asn Glu Asp Gly Ser Phe Leu Val Leu Val
1               5                   10                  15
Asn Asp Glu Gly Gln His Ser Leu Trp Pro Ser Phe Ala Glu Val Pro
            20                  25                  30
Pro Gly Trp Thr Arg Val His Gly Val Ala Thr Arg Gln Glu Cys Leu
        35                  40                  45
Ala Tyr Val Glu Glu Asn Trp Thr Asp Ile Arg Pro Lys Ser Leu Ile
    50                  55                  60
Ala Glu Ala Gly Ala
65
<210>17
<211>1863
<212>PRT
<213>野野村菌属
<400>17
Met Thr Ile Asp Asp Thr Arg Ala Lys Pro Arg Ser Ser Val Glu Asp
1               5                   10                  15
Val Trp Pro Leu Ser Pro Leu Gln Glu Gly Met Leu Tyr His Thr Ala
            20                  25                  30
Leu Asp Asp Asp Gly Pro Asp Thr Tyr Thr Val Gln Thr Val Tyr Gly
        35                  40                  45
Ile Asp Gly Pro Leu Asp Ala Gly Arg Leu Arg Ala Ser Trp Gln Ala
    50                  55                  60
Leu Val Asp Arg His Ala Ala Leu Arg Ala Tyr Phe Arg Tyr Val Ser
65                  70                  75                  80
Gly Ala Gln Met Val Gln Val Ile Ala Arg Glu Ala Glu Ile Pro Trp
                85                  90                  95
Arg Glu Thr Asp Leu His Gly Leu Pro Asp Asp Leu Leu Asp Ser Glu
            100                 105                 110
Val Asp Arg Leu Ala Ala Asp Glu Leu Ala Glu Arg Leu Pro Leu Asp
        115                 120                 125
Ala Ala Pro Leu Met Lys Leu His Leu Ile Arg Leu Gly Pro Ala Ser
    130                 135                 140
His Arg Leu Val His Thr Leu His His Val Leu Leu Asp Gly Trp Ser
145                 150                 155                 160
Met Pro Ile Leu His Arg Glu Leu Ala Ala Ile Tyr Ala Ala Gly Gly
                165                 170                 175
Asp Ala Ser Gly Leu Pro Ala Ala Val Ser Tyr Arg Asp Tyr Leu Ala
            180                 185                 190
Trp Leu Gly Arg Gln Asp Lys Glu Ala Ala Arg Ala Ala Trp Arg Gln
        195                 200                 205
Glu Leu Ala Gly Leu Asp Thr Pro Thr Leu Val Ala Pro Ala Asp Pro
    210                 215                 220
Ala Arg Val Pro Asp Met Gly Thr Ala Val Ile Glu Leu Ser Ala Glu
225                 230                 235                 240
Leu Thr Asp Gly Leu Ala Arg Leu Ala Arg Gly His Gly Leu Thr Leu
                245                 250                 255
Asn Thr Val Val Gln Gly Ala Trp Ala Met Val Leu Ala Gln Leu Ala
            260                 265                 270
Gly Arg Thr Asp Val Val Phe Gly Ala Thr Ala Ser Gly Arg Pro Ala
        275                 280                 285
Glu Leu Ala Gly Val Glu Ser Met Val Gly Gln Leu Leu Gly Thr Leu
    290                 295                 300
Pro Val Arg Val Arg Leu Glu Gly Gly Arg Arg Val Val Glu Leu Leu
305                 310                 315                 320
Ala Glu Leu Gln Arg Ser Gln Ser Ala Leu Met Ala His Gln His Leu
                325                 330                 335
Gly Leu Gln Glu Met Gln Ala Ala Val Gly Pro Gly Ala Val Phe Asp
            340                 345                 350
Thr Leu Val Ile Tyr Glu Asn Phe Pro Arg Gln Gly Leu Gly Arg Ala
        355                 360                 365
Glu Glu Asp Gly Gly Leu Asp Leu Arg Pro Val Arg Arg Gly Arg Asn
    370                 375                 380
Ser Ser His Tyr Pro Phe Thr Leu Ile Thr Gly Pro Gly Ala Gln Met
385                 390                 395                 400
Pro Leu Ile Leu Asp Tyr Asp Arg Gly Leu Phe Asp Glu Ala Ala Ala
                405                 410                 415
Glu Ser Val Val Gly Ala Leu Ala Arg Val Leu Glu Arg Leu Val Ala
            420                 425                 430
Glu Pro Asp Val Leu Val Gly Arg Leu Thr Leu Leu Ser Glu Ala Glu
        435                 440                 445
Arg Ala Leu Val Val Glu Asp Trp Asn Ala Thr Ala Gly Pro Thr Pro
    450                 455                 460
Gly Gln Ser Val Leu Asp Leu Phe Gly Arg Arg Val Ala Thr Ala Pro
465                 470                 475                 480
Asp Ala Val Ala Ile Thr Asp Ala Gly Gly Ala Asp Leu Thr Tyr Ala
                485                 490                 495
Glu Val Asp Gln Ala Ala Asn Arg Leu Ala Arg His Leu Ala Ala Arg
            500                 505                 510
Gly Ile Gly Arg Gly Asp Arg Val Gly Val Val Met Asp Arg Ser Pro
        515                 520                 525
Asp Leu Leu Ile Ala Phe Leu Ala Ser Trp Lys Ala Gly Ala Ala Tyr
    530                 535                 540
Val Pro Val Asp Val Glu His Pro Ala Glu Arg Ile Glu Phe Val Leu
545                 550                 555                 560
Ala Asp Ser Gly Val Ser Ala Val Leu Cys Thr Arg Ala Thr Arg Glu
                565                 570                 575
Val Ala Pro Ala Asp Ala Ile Val Ile Asp ALa Pro Glu Thr Arg Ala
            580                 585                 590
Ala Ile Asp Ala Gly Ala Ala Thr Ala Pro Gln Ile Arg Leu Ser Ala
        595                 600                 605
Asp Asp Leu Ala Tyr Val Met Tyr Thr Ser Gly Ser Thr Gly Leu Pro
    610                 615                 620
Lys Gly Val Gly Val Pro His Gly Ala Val Ala Gly Leu Ala Gly Asp
625                 630                 635                 640
Glu Gly Trp Arg Ile Gly Pro Gly Asp Ala Val Leu Met His Ala Thr
                645                 650                 655
His Val Phe Asp Pro Ser Leu Tyr Ala Met Trp Val Pro Leu Ala Met
            660                 665                 670
Gly Gly Arg Val Val Leu Thr Glu Pro Gly Val Leu Asp Ala Leu Gly
        675                 680                 685
Met Arg Gln Ala Val Glu Arg Gly Val Thr Phe Val His Leu Thr Ala
    690                 695                 700
Gly Thr Phe Arg Ala Leu Ala Glu Ser Ser Pro Glu Cys Phe Ala Gly
705                 710                 715                 720
Leu Val Glu Val Gly Thr Gly Gly Asp Val Val Pro Ala Gln Ser Val
                725                 730                 735
Glu His Leu Arg Arg Ala Val Pro Gly Leu Arg Val Arg Asn Thr Tyr
            740                 745                 750
Gly Pro Thr Glu Thr Thr Leu Cys Ala Thr Trp Lys Pro Ile Glu Pro
        755                 760                 765
Gly Glu Glu Val Gly Arg Glu Leu Pro Ile Gly Arg Pro Met Thr Asn
    770                 775                 780
Arg Arg Ile Tyr Ile Leu Asp Ala Phe Leu Arg Pro Val Ala Pro Gly
785                 790                 795                 800
Val Ala Gly Glu Leu Tyr Ile Ala Gly Thr Gly Leu Ala Arg Gly Tyr
                805                 810                 815
Leu Gly Gly Pro Gly Leu Thr Ala Glu Arg Phe Val Ala Val Pro Ala
            820                 825                 830
Ser Val Asp Pro Ser Pro Gly Glu Arg Met Tyr Arg Thr Gly Asp Leu
        835                 840                 845
Ala Arg Trp Asn Arg Asp Gly Glu Val Val Phe Leu Gly Arg Thr Asp
    850                 855                 860
Asp Gln Val Lys Ile Arg Gly Tyr Arg Val Glu Leu Gly Glu Val Glu
865                 870                 875                 880
Ala Val Leu Ala Ala Gln Arg Gly Val Val Glu Ala Val Val Val Ala
                885                 890                 895
Arg Glu Asp Gln Pro Gly Glu Lys Arg Leu Val Gly Tyr Phe Ile Ser
            900                 905                 910
Asp Gly Thr Asp Ala Gly Pro Ala Glu Ile Arg Arg Glu Met Ala Leu
        915                 920                 925
Val Leu Pro Ala Tyr Met Val Pro Leu Ala Val Val Ala Leu Pro Ala
    930                 935                 940
Leu Pro Val Thr Pro Asn Gly Lys Val Asp Arg Leu Ala Leu Pro Ala
945                 950                 955                 960
Pro Asp Leu Val Gly Arg Ala Pro Asp Arg Ala Gln Glu Ser Glu Thr
                965                 970                 975
Glu Lys Val Leu Cys Ala Leu Phe Ala Glu Ile Leu Gly Val Asp Arg
            980                 985                 990
Val Gly Val Asp Asp Ala Phe His  Asp Leu Gly Gly Ser  Ser Ala Leu
        995                 1000                 1005
Ala Met  Arg Leu Ile Ala Arg  Ile Arg Glu Glu Leu  Gly Ala Asp
    1010                 1015                 1020
Leu Pro  Ile Arg Gln Leu Phe  Ser Ala Ala Thr Pro  Ala Gly Val
    1025                 1030                 1035
Ala Arg  Ala Leu Ala Ala Lys  Ser Arg Pro Ala Leu  Glu Pro Ala
    1040                 1045                 1050
Glu Arg  Pro Gly Arg Val Pro  Leu Thr Ala Gln Gln  Leu Ser Ala
    1055                 1060                 1065
Trp Leu  Leu Ala Ser Pro Gly  Glu Ala Ala Gly Leu  His Val Ser
    1070                 1075                 1080
Val Ala  Leu Arg Leu Arg Gly  Arg Leu Asp Val Pro  Ala Leu Glu
    1085                 1090                 1095
Ala Ala  Leu Gly Asp Val Ala  Ala Arg His Glu Ile  Leu Arg Thr
    1100                 1105                 1110
Thr Phe  Pro Gly His Ala Gln  Ser Val His Gln His  Val His Asp
    1115                 1120                 1125
Ala Ser  Pro Val Asp Leu Thr  Pro Val Pro Ala Thr  Glu Glu Ser
    1130                 1135                 1140
Leu Pro  Gly Leu Leu Thr Glu  Leu Arg Glu Ser Val  Phe Asp Leu
    1145                 1150                 1155
Thr Arg  Glu Val Pro Trp Arg  Gly Asp Leu Phe Arg  Leu Ser Asp
    1160                 1165                 1170
Gly Glu  His Val Leu His Leu  Met Val His Arg Ile  Leu Ala Asp
    1175                 1180                 1185
Asp Glu  Ser Leu Asp Val Phe  Leu Arg Asp Leu Ser  Ala Ala Tyr
    1190                 1195                 1200
Gly Ala  Arg Arg Ala Gly Arg  Ala Pro Glu Arg Ala  Pro Leu Thr
    1205                 1210                 1215
Leu Gln  Phe Ala Asp Tyr Ala  Ile Trp Glu Arg Arg  Leu Leu Glu
    1220                 1225                 1230
Gly Glu  Arg Asp Ala Asp Gly  Leu Ile Asn Glu Gln  Leu Val Phe
    1235                 1240                 1245
Trp Arg  Asp Asn Leu Ala Gly  Ile His Gly Glu Thr  Val Leu Pro
    1250                 1255                 1260
Phe Asp  Arg Pro Arg Ser Ala  Val Ala Ser Arg Arg  Ala Gly Thr
    1265                 1270                 1275
Val Ser  Leu Arg Leu Asp Ala  Gly Pro His Ala Arg  Leu Val Glu
    1280                 1285                 1290
Ala Val  Asp Pro Ile Gly Ala  His Pro Phe Gln Ile  Val His Ala
    1295                 1300                 1305
Ala Leu  Ala Met Leu Leu Thr  Arg Leu Gly Ala Gly  His Asp Leu
    1310                 1315                 1320
Val Ile  Gly Thr Lys Leu Pro  Arg Asp Asp Asp Leu  Ile Asp Leu
    1325                 1330                 1335
Glu Pro  Met Ile Gly Pro Phe  Ala Arg Pro Leu Ala  Leu Arg Thr
    1340                 1345                 1350
Asp Leu  Ser Gly Asp Pro Thr  Phe Leu Glu Val Val  Thr Arg Ala
    1355                 1360                 1365
Gln Glu  Ala Ile Arg Ser Ala  Arg Gln His Leu Asp  Val Pro Phe
    1370                 1375                 1380
Ala Arg  Ile Val Glu Leu Leu  Asp Leu Pro Val Ser  Leu Ser Arg
    1385                 1390                 1395
His Pro  Val Phe Gln Val Gly  Leu Glu Val His Glu  Glu Asp Leu
    1400                 1405                 1410
Gly Ala  Trp Asp Ala Thr Glu  Leu Pro Ala Leu Arg  Thr Ser Val
    1415                 1420                 1425
Glu Pro  Val Gly Pro Glu Ala  Ile Glu Leu Asp Leu  Ala Phe Arg
    1430                 1435                 1440
Leu Thr  Glu Arg Arg Asp Glu  Asp Gly Ile Glu Gly  Thr Leu His
    1445                 1450                 1455
Tyr Ala  Ala Asp Leu Phe Asp  Gln Ala Thr Ala Glu  Ser Leu Ala
    1460                 1465                 1470
Arg Arg  Leu Val Ser Phe Leu  Glu Gln Val Ala Glu  Asp Pro Gln
    1475                 1480                 1485
Arg Arg  Val Ser Asp Leu Asp  Val Leu Leu Asp Asp  Ala Glu Arg
    1490                 1495                 1500
Glu Arg  Pro Ala Glu Ala Pro  Ala Lys Trp Ser Glu  Ala Val Pro
    1505                 1510                 1515
Pro Val  Ala Ala Asp Leu Ala  Glu Gly Gly Pro Leu  Gly Ala Leu
    1520                 1525                 1530
Val Leu  Asp Asp Arg Leu Arg  Pro Ala Val Ala Val  Gly Glu Leu
    1535                 1540                 1545
Tyr Leu  Thr Gly Ala Ala Val  Asp Ala Glu Pro Gly  Asp Arg Thr
    1550                 1555                 1560
Leu Ala  Cys Pro Phe Gly Ala  Thr Gly Arg Arg Met  Leu Pro Thr
    1565                 1570                 1575
Gly Leu  Leu Ala Arg Trp Thr  Ala Gly Gly Thr Leu  Val Val Val
    1580                 1585                 1590
Gly Glu  Arg Arg Gly Ser Ser  Gly Ser Val Lys Thr  Gly Thr Gly
    1595                 1600                 1605
Asp Phe  Glu Val Leu Leu Pro  Leu Arg Ala Gly Gly  Asn Arg Pro
    1610                 1615                 1620
Pro Leu  Tyr Cys Val His Ala  Ser Gly Gly Leu Ser  Trp Asn Tyr
    1625                 1630                 1635
Ala Pro  Leu Leu Arg Ser Leu  Pro Pro Asn Gln Pro  Val Tyr Gly
    1640                 1645                 1650
Val Gln  Ala Arg Gly Leu Ala  Arg Thr Glu Pro Leu  Ala Ala Gly
    1655                 1660                 1665
Val Glu  G1u Met Ala Ala Asp  Tyr Val Glu Gln Ile  Arg Ala Val
    1670                 1675                 1680
Gln Pro  Thr Gly Pro Tyr His  Leu Leu Gly Trp Ser  Leu Gly Gly
    1685                 1690                 1695
Arg Ile  Ala Gln Glu Met Ala  Arg Val Leu Glu Glu  Gln Gly Glu
    1700                 1705                 1710
Gln Val  Gly Leu Leu Ala Leu  Leu Asp Ala Tyr Pro  Thr Asp Val
    1715                 1720                 1725
Gly Arg  Leu Arg Arg Pro Arg  Gly Asp Ala Ala Asp  Gln Glu Ala
    1730                 1735                 1740
Ala Asp  Phe Asp Arg Gln Gln  Glu Gln Gln Ala Gln  Leu Ala Ala
    1745                 1750                 1755
Ala Val  Ala Thr Glu Ala Gly  Ala Arg Lys Arg Leu  Asp Glu Val
    1760                 1765                 1770
Met Glu  His Leu Ala Arg Val  Gly Pro Leu His Thr  Ser Arg Ser
    1775                 1780                 1785
Phe Gly  Cys Asp Ile Leu Leu  Phe Val Ala Thr Val  Asn Arg Pro
    1790                 1795                 1800
Ser His  Leu Pro Val Ala Asp  Ala Ile Ala Ser Trp  Arg Pro Leu
    1805                 1810                 1815
Thr Thr  Gly Thr Val Glu Pro  His Glu Ile Glu Ile  Asp His Met
    1820                 1825                 1830
Gln Met  Leu Gln Pro Ala Ala  Leu Ala Arg Ile Gly  Ala Val Val
    1835                 1840                 1845
Ala Glu  Lys Leu Arg Pro Arg  Pro Asp Gly Glu Arg  Thr Gln Arg
    1850                 1855                 1860
<210>18
<211>4083
<212>PRT
<213>野野村菌属
<400>18
Met Ala Gln Ser Arg Ile Glu Asp Phe Trp Pro Leu Ser Pro Leu Gln
1               5                   10                  15
Gln Gly Leu Leu Phe His Thr Thr Tyr Asp Asp Asp Trp Pro Gly Leu
            20                  25                  30
Tyr Val Gly His Trp Ile Leu Asn Leu Asn Gly Pro Val Glu Ala Asp
        35                  40                  45
Arg Leu Arg Ala Ala Trp Glu Ala Leu Leu Ala Arg His Ala Ala Leu
    50                  55                  60
Arg Ala Cys Phe Arg Gln Arg Lys Ser Gly Glu Thr Val Gln Leu Ile
65                  70                  75                  80
Ala Arg Gln Val Glu Leu Pro Trp Arg Val Val Asp Leu Ser His Leu
                85                  90                  95
Ser Glu Pro Glu Glu Ala Val Arg Ala Val Ala Glu Glu Asp Arg Thr
            100                 105                 110
Arg Arg Phe Asp Leu Ala Lys Ala Pro Leu Leu Arg Leu Thr Leu Ile
        115                 120                 125
Arg Leu Ala Gly Asp Asp His Arg Leu Val Met Thr Cys His His Ala
    130                 135                 140
Ile Met Asp Gly Trp Ser Met Pro Ile Met Leu Asp Glu Leu Ser Met
145                 150                 155                 160
Leu Tyr Ala Ala Asp Gly Ser Pro Leu Asp Leu Pro Ala Val Pro Ser
                165                 170                 175
Tyr Arg Asp Tyr Leu Val Trp Leu Asp Arg Gln Asp Lys Glu Arg Thr
            180                 185                 190
Leu Ser Ala Trp Ala Ala Glu Leu Arg Gly Val Glu Glu Pro Thr Leu
        195                 200                 205
Val Ala Pro Ala Asp Ala Asn Arg Ala Pro Ala Met Pro Glu Asn Ile
    210                 215                 220
Thr Val Glu Leu Pro Glu Asp Leu Thr Arg Ala Leu Ser Glu Leu Ala
225                 230                 235                 240
Arg Thr His Gly Leu Thr Leu Asn Thr Val Val Gln Gly Ala Trp Ala
                245                 250                 255
Leu Leu Leu Ala Gln Leu Ala Gly Arg Thr Asp Val Val Phe Gly Ala
            260                 265                 270
Ala Val Ser Ala Arg Pro Pro Asp Leu Pro Gly Val Glu Gly Met Val
        275                 280                 285
Gly Leu Phe Leu Asn Thr Val Pro Val Arg Val Arg Leu Ser Gly Ser
    290                 295                 300
Thr Pro Val Ile Glu Phe Leu Ala Asp Leu Gln Lys Arg Gln Ser Ala
305                 310                 315                 320
Leu Ile Pro His Gln Tyr Met Gly Leu Ala Asp Ile Gln Arg Thr Ala
                325                 330                 335
Gly Ala Gly Ala Val Phe Asp Thr Leu Leu Val Phe Gln Asn Phe Pro
            340                 345                 350
Arg Glu Leu Arg Pro Ser Asp Ala Ala Ala Ala Phe Asp Ile Arg Ile
        355                 360                 365
Asp Gln Gly Arg Glu Ala Ala His Tyr Pro Leu Thr Leu Val Ala Val
    370                 375                 380
Pro Gly Glu Ser Met Leu Leu Asn Leu Asp His Val Thr Asp Leu Phe
385                 390                 395                 400
Asp Arg Glu Ala Ala Leu Ala Ile Leu Glu Arg Phe Thr Gly Ile Leu
                405                 410                 415
Arg Gln Leu Ala Gly Ala Gly Asp Leu Thr Val Ala Glu Val Asp Val
            420                 425                 430
Thr Ser Ala Ala Glu Arg Ala Leu Val Val Asn Ala Trp Ser Ala Ala
        435                 440                 445
Pro Arg Val Ala Pro Gly Glu Leu Ala Pro Asp Leu Phe Asp Arg Gln
    450                 455                 460
Val Glu Arg Gly Arg Asp Arg Val Ala Val Val Glu Gly Lys Arg Ala
465                 470                 475                 480
Val Ser Phe Gly Glu Leu Ala Glu His Ala Glu Arg Leu Ala Gly Tyr
                485                 490                 495
Leu Ser Gly Arg Gly Val Arg Arg Gly Asp Arg Val Ala Val Val Met
            500                 505                 510
Gly Arg Ser Pro Gly Leu Ile Ala Thr Leu Leu Ala Val Trp Lys Ala
        515                 520                 525
Gly Ala Ala Phe Val Pro Val Asp Pro Ala Tyr Pro Ala Glu Arg Val
    530                 535                 540
Gln Phe Met Leu Ala Asp Ala Glu Pro Ala Ala Val Val Thr Glu Arg
545                 550                 555                 560
Ala Cys Gln Ala Ala Val Pro Ala Gly Gly Leu Asp Pro Ile Val Leu
                565                 570                 575
Asp Asp Pro Asp Thr Leu Arg Ala Val Ala Glu His Ala Arg Leu Ser
            580                 585                 590
Ala Gly Ala His Ala Asp Asp Leu Ala Tyr Val Met Tyr Thr Ser Gly
        595                 600                 605
Ser Thr Gly Arg Pro Lys Gly Val Ala Val Ser His Gly Asn Val Ala
    610                 615                 620
Ala Leu Ala Gly Glu Pro Gly Trp Gly Leu Gly Pro Glu Asp Ala Val
625                 630                 635                 640
Leu Met His Ala Ser His Ala Phe Asp Ile Ser Leu Phe Glu Leu Trp
                645                 650                 655
Val Pro Leu Leu Ser Gly Ala Arg Val Val Leu Ala Glu Pro Gly Ala
            660                 665                 670
Val Asp Gly Glu Ala Leu Ala Gly Tyr Val Ala Gly Gly Val Thr Cys
        675                 680                 685
Ala His Leu Thr Ala Gly Thr Phe Arg Val Leu Ala Glu Glu Ser Pro
    690                 695                 700
Glu Ser Val Ala Gly Leu Arg Glu Val Leu Thr Gly Gly Asp Ala Val
705                 710                 715                 720
Pro Leu Ala Ala Val Glu Arg Val Arg Arg Ala Cys Pro Asp Val Arg
                725                 730                 735
Val Arg His Leu Tyr Gly Pro Thr Glu Ala Thr Leu Cys Ala Thr Trp
            740                 745                 750
Trp Leu Leu Gln Pro Gly Glu Pro Thr Gly Pro Val Leu Pro Ile Gly
        755                 760                 765
Arg Pro Leu Ala Gly Arg Arg Val Tyr Val Leu Asp Ala Phe Leu Arg
    770                 775                 780
Pro Val Pro Pro Gly Val Thr Gly Glu Leu Tyr Val Ala Gly Ala Gly
785                 790                 795                 800
Val Ala Gln Gly Tyr Leu Gly Arg Pro Ala Leu Thr Ala Glu Arg Phe
                805                 810                 815
Val Ala Glu Pro Phe Val Pro Gly Gly Arg Met Tyr Arg Thr Gly Asp
            820                 825                 830
Leu Ala Arg Trp Thr Asp Gln Gly Glu Leu Ala Phe Ala Gly Arg Ala
        835                 840                 845
Asp Asp Gln Val Lys Ile Arg Gly Tyr Arg Val Glu Pro Gly Glu Ile
    850                 855                 860
Glu Ala Val Leu Ala Gly Leu Pro Gly Val Gly Gln Ala Val Val Ser
865                 870                 875                 880
Ala Arg Glu Glu Arg Leu Ile Gly Tyr Val Val Ala Glu Thr Gly Gly
                885                 890                 895
Asp Leu Asp Pro Val Arg Ile Arg Glu Gln Leu Ala Ala Thr Leu Pro
            900                 905                 910
Glu Phe Met Val Pro Ala Ala Val Leu Val Leu Asp Ala Leu Pro Leu
        915                 920                 925
Thr Gly Asn Gly Lys Val Asp Arg Arg Ala Leu Pro Glu Pro Asp Phe
    930                 935                 940
Ala Ala Gly Ala Val Asp Arg Glu Pro Ala Thr Asp Ala Glu Arg Ile
945                 950                 955                 960
Leu Cys Gly Val Phe Ala Glu Val Leu Gly Ala Gly Arg Val Gly Val
                965                 970                 975
Ala Asp Ser Phe Phe Glu Leu Gly Gly Asp Ser Ile Ser Ser Met Gln
            980                 985                 990
Val Ala Ala Arg Ala Arg Arg Gln  Gly Ile Pro Leu Thr  Pro Arg Gln
        995                 1000                 1005
Val Phe  Glu His Arg Thr Pro  Glu Arg Leu Ala Ala  Leu Ala Gln
    1010                 1015                 1020
Gln Ala  Pro Gly Arg Arg Ala  Ser Ser Val Glu Pro  Gly Val Gly
    1025                 1030                 1035
Glu Ile  Pro Arg Thr Pro Val  Met Arg Ala Leu Gly  Asp Asp Ala
    1040                 1045                 1050
Val Arg  Pro Gly Phe Ala Gln  Ala Arg Val Val Val  Thr Pro Ala
    1055                 1060                 1065
Gly Phe  Ala Pro Asp Ala Leu  Val Thr Ala Leu Gln  Ala Val Leu
    1070                 1075                 1080
Asp Val  His Asp Leu Leu Arg  Thr Arg Val Glu Pro  Asp Gly Arg
    1085                 1090                 1095
Leu Met  Val Ala Glu Pro Gly  Ala Val Asp Ala Ala  Gly Leu Val
    1100                 1105                 1110
Thr Arg  Val Ala Ala Gly Asn  Gly Asn Leu Ala Glu  Arg Ala Glu
    1115                 1120                 1125
Arg Glu  Ala Arg Thr Ala Ala  Gly Thr Leu Asp Pro  Ser Glu Gly
    1130                 1135                 1140
Ile Met  Val Arg Ala Val Trp  Val Asp Ala Gly Asp  Ala Glu Pro
    1145                 1150                 1155
Gly Arg  Leu Ala Leu Val Val  His His Leu Val Val  Asp Ala Val
    1160                 1165                 1170
Ser Trp  Ala Ile Leu Leu Ser  Asp Leu Arg Ala Ala  Tyr Asp Glu
    1175                 1180                 1185
Ala Val  Ser Gly Gly Thr Pro  Val Leu Glu Pro Ala  Val Thr Ser
    1190                 1195                 1200
Tyr Arg  Gln Trp Ala Arg Arg  Leu Ala Gly Gln Ala  Leu Ser Glu
    1205                 1210                 1215
Ser Thr  Val Ala Glu Ala Gly  His Trp Ala Gly Val  Leu Glu Gly
    1220                 1225                 1230
Gly Asp  Leu Pro Leu Glu Arg  His Pro Gly Gln Ser  Ala Ser Trp
    1235                 1240                 1245
Ser Arg  Thr Leu Ser Asp Ala  Gln Ala Arg Asn Leu  Val Ala Arg
    1250                 1255                 1260
Val Pro  Ala Ala Phe His Cys  Gly Val Gln Asp Val  Leu Leu Ala
    1265                 1270                 1275
Gly Leu  Ala Gly Ala Val Ala  Arg Trp Arg Gly Ala  Asp Ala Gly
    1280                 1285                 1290
Ile Leu  Val Asp Val Glu Gly  His Gly Arg His Ala  Ala Asp Gly
    1295                 1300                 1305
Glu Asp  Leu Leu Arg Thr Val  Gly Trp Phe Thr Ser  Val His Pro
    1310                 1315                 1320
Val Arg  Leu Asp Val Ser Gly  Val Gly Pro Gly Ala  Ala Ala Ala
    1325                 1330                 1335
Gly Glu  Leu Leu Lys Ala Val  Lys Glu Gln Ala Arg  Ala Val Pro
    1340                 1345                 1350
Gly Asp  Gly Leu Gly Tyr Gly  Leu Leu Arg Tyr Leu  Asn Pro Glu
    1355                 1360                 1365
Thr Gly  Ala Arg Leu Ala Glu  Leu Pro Ser Ala Gln  Ile Gly Phe
    1370                 1375                 1380
Asn Tyr  Leu Gly Arg Ser Gly  Val Ala Ser Glu Asp  Thr Ala Trp
    1385                 1390                 1395
Gln Val  Cys Glu Gly Ala Leu  Gly Gly Gln Ala Ala  Gly Pro Asp
    1400                 1405                 1410
Leu Val  Gln Ser His Ala Leu  Glu Val Gly Ala Asp  Val Gln Asp
    1415                 1420                 1425
Thr Pro  Ala Gly Pro Arg Leu  Arg Leu Ala Ile Asp  Gly Arg Asp
    1430                 1435                 1440
Leu Asp  Pro Ala Ala Val Glu  Arg Leu Gly Glu Ala  Trp Leu Asp
    1445                 1450                 1455
Thr Leu  Ala Gly Leu Ala Ala  Leu Ala Asp Thr Pro  Gly Ala Gly
    1460                 1465                 1470
Gly His  Thr Pro Ser Asp Phe  Glu Leu Val Glu Val  Arg Gln Arg
    1475                 1480                 1485
Asp Val  Asp Glu Leu Glu Ala  Val Ala Pro Gly Leu  Thr Asp Val
    1490                 1495                 1500
Trp Pro  Leu Ser Pro Leu Gln  Glu Gly Ile Leu Phe  Glu Arg Ala
    1505                 1510                 1515
Phe Asp  Glu Asp Gly Val Asp  Val Tyr Gln Thr Gln  Arg Ile Leu
    1520                 1525                 1530
Asp Leu  Asp Gly Pro Leu Asp  Ala Gln Arg Leu His  Ala Ala Trp
    1535                 1540                 1545
Gln Ser  Val Ile Asp Arg His  Glu Thr Leu Arg Thr  Gly Phe His
    1550                 1555                 1560
Gln Leu  Gly Ser Gly Glu Thr  Val Gln Val Val Val  Gly Glu Ala
    1565                 1570                 1575
Glu Val  Leu Trp Arg Glu Ala  Asp Leu Ser Arg Leu  Asp Glu Pro
    1580                 1585                 1590
Asp Ala  Glu Val Glu Arg Leu  Leu Ala Ala Asp Gln  Ala Glu Arg
    1595                 1600                 1605
Phe Asp  Val Ser Arg Ala Pro  Leu Leu Arg Leu Leu  Leu Ile Arg
    1610                 1615                 1620
Leu Gly  Ala Ala Arg His Arg  Leu Val Val Thr Ser  His His Val
    1625                 1630                 1635
Leu Val  Asp Gly Trp Ser Thr  Pro Ile Leu Leu Gly  Glu Met Leu
    1640                 1645                 1650
Thr Ala  Tyr Ala Asp Gly Arg  Val Ser Pro Ala Pro  Pro Ser Tyr
    1655                 1660                 1665
Arg Asp  Tyr Val Ala Trp Leu  Ser Arg Gln Asp Glu  Asp Ala Ala
    1670                 1675                 1680
Arg Ser  Ala Trp Arg Ala Glu  Leu Ala Gly Leu Asp  Glu Pro Thr
    1685                 1690                 1695
Val Val  Gly Leu Asp Ala Gly  Lys Ala Pro Val Met  Pro Asp Gly
    1700                 1705                 1710
His Ala  Glu Trp Leu Ser Glu  Glu Ala Thr Arg Ala  Leu Thr Gly
    1715                 1720                 1725
Phe Ala  Arg Gly His Gly Leu  Thr Leu Ser Thr Val  Val Gln Gly
    1730                 1735                 1740
Ala Trp  Ala Leu Val Leu Ala  Arg Leu Ala Arg Arg  Thr Asp Val
    1745                 1750                 1755
Val Phe  Gly Thr Val Val Ser  Gly Arg Pro Ala Asp  Ala Leu Pro
    1760                 1765                 1770
Asp Val  Glu Arg Met Val Gly  Met Phe Ile Asn Thr  Val Pro Val
    1775                 1780                 1785
Arg Val  Arg Leu Asp Gly Ala  Val Pro Val Leu Asp  Leu Leu Gln
    1790                 1795                 1800
Asp Leu  Gln Arg Arg Gln Ser  Ser Leu Thr Glu His  Gln His Leu
    1805                 1810                 1815
Gly Leu  Pro Glu Ile Gln Lys  Ala Ala Gly Pro Gly  Ser Ile Phe
    1820                 1825                 1830
Asp Thr  Ile Leu Met Ile Val  Asn Tyr Pro Leu Asp  Ala Asp Gly
    1835                 1840                 1845
Leu Asp  Asp Gly Gly Val Ala  Ile Ser Ser Ile Arg  Thr Arg Thr
    1850                 1855                 1860
Gly Thr  Thr Tyr Pro Leu Ser  Val Ser Val Ile Pro  Gly Ala Arg
    1865                 1870                 1875
Leu Gln  IIe Gln Leu Asp Tyr  Arg Pro Asp Trp Ile  Gly Gly Asp
    1880                 1885                 1890
Leu Ala  Ala Glu Ile Thr Gly  Gln Val Val Arg Val  Leu Ala Arg
    1895                 1900                 1905
Met Val  Ala Glu Pro Ser Leu  Pro Val Gly Arg Leu  Ala Val Thr
    1910                 1915                 1920
Ser Arg  Ser Thr Arg Gly Ser  Val Thr Glu Arg Trp  Asn Ser Thr
    1925                 1930                 1935
Gly Ala  Ala Ala Gly Gly Ser  Ser Val Pro Glu Leu  Phe Arg Arg
    1940                 1945                 1950
Gln Ala  Asp Ala Ala Pro Asp  Ala Thr Ala Val Ile  Gly Asp Gly
    1955                 1960                 1965
Arg Thr  Leu Ser Tyr Ala Gly  Leu Asp Arg Glu Ser  Asp Arg Leu
    1970                 1975                 1980
Ala Gly  His Leu Ala Arg Arg  Gly Val Arg Arg Gly  Asp Arg Val
    1985                 1990                 1995
Gly Val  Leu Met Glu Arg Gly  Ala Asp Leu Ile Val  Ala Leu Leu
    2000                 2005                 2010
Ala Val  Trp Lys Ala Gly Ala  Ala Gln Val Pro Val  Asn Val Asp
    2015                 2020                 2025
Tyr Pro  Ala Glu Arg Ile Glu  Arg Met Leu Ala Asp  Ala Gly Ala
    2030                 2035                 2040
Ser Val  Ala Val Cys Ala Gly  Ala Thr Arg His Ala  Val Pro Asp
    2045                 2050                 2055
Gly Ile  Glu Pro Val Val Met  Asp Ala Pro Ala Thr  Glu Ala Glu
    2060                 2065                 2070
Arg His  Glu Ala Pro Pro Leu  Ala Val Gly Ala His  Asp Val Ala
    2075                 2080                 2085
Tyr Val  Met Tyr Thr Ser Gly  Ser Thr Gly Val Pro  Lys Gly Val
    2090                 2095                 2100
Ala Val  Pro His Gly Ser Ala  Ala Ala Leu Ala Gly  Asp Pro Gly
    2105                 2110                 2115
Trp Ser  Gln Gly Ala Gly Asp  Arg Val Leu Met His  Ala Ser His
    2120                 2125                 2130
Ala Phe  Asp Ala Ser Leu Leu  Glu Ile Trp Val Pro  Leu Val Ser
    2135                 2140                 2145
Gly Ala  Cys Val Met Val Ala  Glu Pro Gly Ala Ile  Asp Ala Gln
    2150                 2155                 2160
Arg Leu  Arg Asp Val Ile Ala  Arg Gly A1a Thr Thr  Val His Leu
    2165                 2170                 2175
Thr Ala  Gly Thr Phe Arg Val  Leu Ala Glu Glu Ser  Pro Asp Ser
    2180                 2185                 2190
Phe Ser  Gly Leu Arg Glu Val  Leu Thr Gly Gly Asp  Val Val Pro
    2195                 2200                 2205
Leu Glu  Ser Val Ala Arg Val  Arg Arg Ala Cys Pro  Glu Val Arg
    2210                 2215                 2220
Val Arg  Glu Leu Tyr Gly Pro  Thr Glu Val Thr Leu  Cys Ala Thr
    2225                 2230                 2235
Trp His  Leu Ile Glu Pro His  Thr Glu Thr Gly Asp  Thr Leu Pro
    2240                 2245                 2250
Ile Gly  Arg Pro Leu Ala Gly  Arg Gln Val Tyr Val  Leu Asp Ala
    2255                 2260                 2265
Phe Leu  Gln Pro Val Ala Pro  Asn Val Thr Gly Glu  Leu Tyr Leu
    2270                 2275                 2280
Ala Gly  Ala Gly Leu Ala His  Gly Tyr Leu Gly Ala  Pro Ala Ala
    2285                 2290                 2295
Thr Ser  Glu Arg Phe Ile Ala  Val Pro A1a Ser Val  Asn Pro Ala
    2300                 2305                 2310
Ala Ser  Gly Glu Arg Met Tyr  Arg Thr Gly Asp Leu  Ala Arg Trp
    2315                 2320                 2325
Thr Asp  Arg Gly Glu Leu Leu  Phe Ala Gly Arg Ala  Asp Ser Gln
    2330                 2335                 2340
Val Lys  Ile Arg Gly Tyr Arg  Val Glu Pro Gly Glu  Ile Glu Ala
    2345                 2350                 2355
Ala Leu  Ala Glu Val Pro His  Val Ala Gln Ala Val  Val Val Ala
    2360                 2365                 2370
Arg Glu  Asp Arg Pro Gly Glu  Lys Arg Leu Ile Ala  Tyr Val Thr
    2375                 2380                 2385
Ala Glu  Glu Gly Ser Gly Leu  Asp Pro Asp Ala Val  Arg Glu His
    2390                 2395                 2400
Leu Ala  Gly Arg Leu Pro Glu  Phe Met Val Pro Ala  Ala Val Val
    2405                 2410                 2415
Leu Leu  Asp Gly Val Pro Leu  Thr Pro Asn Gly Lys  Ile Asp Arg
    2420                 2425                 2430
Ala Ala  Leu Pro Val Pro Glu  Phe Thr Gly Lys Ala  Ala Gly Arg
    2435                 2440                 2445
Glu Pro  Arg Thr Glu Ala Glu  Arg Val Leu Cys Glu  Leu Phe Ala
    2450                 2455                 2460
Glu Val  Leu Gly Val Ala Arg  Ala Gly Ala Glu Asp  Ser Phe Phe
    2465                 2470                 2475
Glu Leu  Gly Gly Asp Ser Ile  Leu Ser Met Arg Leu  Ala Ala Arg
    2480                 2485                 2490
Ala Arg  Arg Glu Glu Leu Val  Phe Gly Ala Lys Asp  Val Phe Glu
    2495                 2500                 2505
Arg Lys  Thr Pro Ala Gly Ile  Ala Met Val Ala Glu  Arg Gly Gly
    2510                 2515                 2520
Ala Thr  Arg Ala Ser Leu Asp  Asp Gly Val Gly Glu  Val Met Ser
    2525                 2530                 2535
Thr Pro  Val Ile Arg Ala Leu  Leu Glu Arg Asp Pro  Asp Ala Met
    2540                 2545                 2550
Thr Arg  Gly Ala Leu Ser Gln  Trp Val Thr Ala Gly  Ala Pro Asp
    2555                 2560                 2565
Asp Leu  Ser Val Asp Val Leu  Ala Ala Gly Leu Gly  Ala Val Ile
    2570                 2575                 2580
Asp Ala  His Asp Met Leu Arg  Ser Arg Ile Val Arg  Thr Gly Ala
    2585                 2590                 2595
Ala Gln  Pro Arg Leu Val Val  Ala Gly Arg Gly Ala  Val Asp Ala
    2600                 2605                 2610
Ala Thr  Leu Val Glu Arg Val  Glu Ala Gly Thr Gly  Asp Val Asp
    2615                 2620                 2625
Glu Ile  Ala Asp Arg Cys Ala  Arg Asp Ala Ala Ala  Arg Leu Asp
    2630                 2635                 2640
Pro His  Ala Gly Val Met Ile  Arg Ala Val Trp Val  Asp Ala Gly
    2645                 2650                 2655
Pro Gly  Arg Val Gly Arg Leu  Val Val Ala Ala His  His Leu Val
    2660                 2665                 2670
Val Asp  Val Val Ser Trp Arg  Ile Leu Leu Pro Asp  Leu Gln Val
    2675                 2680                 2685
Ala Cys  Glu Ala Val Ala Ala  Gly Arg Arg Pro Val  Leu Asp Pro
    2690                 2695                 2700
Val Asp  Val Ser Phe Arg Arg  Trp Ala Arg Thr Leu  Ala Asp Gln
    2705                 2710                 2715
Ala Val  Thr Arg Ala Thr Glu  Leu Glu Thr Trp Thr  Glu Ile Leu
    2720                 2725                 2730
Asp Gly  Ala Arg Ser Arg Leu  Gly Glu Leu Asp Pro  Ala Arg Asp
    2735                 2740                 2745
Thr Val  Ser Thr Ala Gly Arg  Thr Ser Trp Thr Leu  Pro His Asp
    2750                 2755                 2760
Arg Ala  Gly Val Leu Val Glu  Gln Ala Thr Ser Ala  Phe His Cys
    2765                 2770                 2775
Gly Val  His Glu Val Leu Leu  Ala Thr Leu Ala Gly  Ala Val Ala
    2780                 2785                 2790
His Trp  Arg Gly Gly Thr Ala  Val Val Val Asp Val  Glu Gly His
    2795                 2800                 2805
Gly Arg  Arg Pro Ile Asp Glu  Leu Asp Leu Ser Arg  Thr Val Gly
    2810                 2815                 2820
Trp Phe  Thr Asp Val His Pro  Leu Arg Leu Asp Val  Thr Gly Ile
    2825                 2830                 2835
Asp Pro  Ala Glu Val Ile Ala  Gly Gly Gly Ala Ala  Gly His Leu
    2840                 2845                 2850
Leu Lys  Gln Val Lys Glu Asn  Val Arg Ala Val Pro  Asp Gly Gly
    2855                 2860                 2865
Leu Gly  Tyr Gly Ile Leu Arg  Tyr Leu Asn Ala Gly  Thr Gly Gln
    2870                 2875                 2880
Ala Leu  Ala Ala Ala Pro Lys  Pro Glu Ile Gly Phe  Asn Tyr Leu
    2885                 2890                 2895
Gly Arg  Phe Pro Ser Arg Ser  Ala Gly Ala Pro Glu  Pro Trp Gln
    2900                 2905                 2910
Leu Leu  Gly Thr Ile Gly Gly  Thr Ala Glu Gln Asp  Thr Ala Leu
    2915                 2920                 2925
Arg His  Ala Val Glu Ile Asp  Ala Ala Val Leu Asp  Gly Ala Ala
    2930                 2935                 2940
Gly Pro  Glu Leu Ser Leu Thr  Val Thr Trp Ala Gly  Arg Leu Leu
    2945                 2950                 2955
Gly Glu  Ala Glu Ala Glu Ser  Leu Ala Gln Ala Trp  Leu Ala Met
    2960                 2965                 2970
Leu Thr  Gly Leu Ala Ala His  Val Gly Gly Gly Gly  Ala Gly Gly
    2975                 2980                 2985
His Thr  Pro Ser Asp Phe Pro  Leu Ile Ser Leu Thr  Gln Gln Asp
    2990                 2995                 3000
Val Ala  Glu Val Glu Ala Ala  Val Pro Thr Leu Leu  Asp Ile Trp
    3005                 3010                 3015
Pro Leu  Ser Pro Leu Gln Glu  Gly Leu Leu Phe His  Ala Ala Asp
    3020                 3025                 3030
Glu Arg  Gly Pro Asp Val Tyr  Ala Gly Met Arg Lys  Leu Ala Leu
    3035                 3040                 3045
Asp Gly  Pro Leu Asp Val Ala  Arg Phe Arg Ala Ser  Trp Gln Ala
    3050                 3055                 3060
Leu Leu  Asp Arg His Pro Ala  Leu Arg Ala Ser Phe  His Gln Leu
    3065                 3070                 3075
Gly Ser  Gly Ala Ala Val Gln  Ala Ile Ala Arg Glu  Val Pro Leu
    3080                 3085                 3090
Asp Trp  Gln Glu Thr Asp Leu  Ser Arg Leu Pro Glu  Asp Glu Ala
    3095                 3100                 3105
Leu Ala  Glu Phe Asp Arg Leu  Ala Glu Gln Leu His  Thr Glu Arg
    3110                 3115                 3120
Phe Asp  Leu Thr Arg Ala Pro  Gln Leu Arg Leu His  Leu Val Arg
    3125                 3130                 3135
Leu Gly  Glu Arg Arg His Arg  Leu Val Leu Thr Ser  His His Ile
    3140                 3145                 3150
Val Ala  Asp Gly Trp Ser Leu  Pro Leu Ile Thr Glu  Asp Val Leu
    3155                 3160                 3165
Thr Val  Tyr Glu Ser Gly Gly  Asp Gly Arg Ala Leu  Pro Ala Ala
    3170                 3175                 3180
Thr Ser  Tyr Arg Asp Tyr Leu  Ala Trp Ile Ala Arg  Gln Asp Lys
    3185                 3190                 3195
Ala Ala  Ala Arg Glu Ala Trp  Arg Ala Glu Leu Ala  Gly Leu Asp
    3200                 3205                 3210
Glu Ala  Thr His Val Val Pro  Pro Glu Thr Ile Thr  Thr Pro Leu
    3215                 3220                 3225
Glu Pro  Glu Arg Val Gly Phe  Glu Leu Asp Glu Ala  Leu Ser Arg
    3230                 3235                 3240
Arg Val  Val Glu Phe Thr Gly  Arg His Gly Val Thr  Ala Asn Thr
    3245                 3250                 3255
Leu Phe  Gln Gly Ile Trp Ala  Leu His Leu Ala Arg  Leu Thr Gly
    3260                 3265                 3270
Arg Asp  Asp Val Val Phe Gly  Ala Ala Val Ala Gly  Arg Pro Pro
    3275                 3280                 3285
Glu Ile  Pro Gly Val Glu Ser  Ala Val Gly Leu Phe  Met Asn Met
    3290                 3295                 3300
Leu Pro  Val Arg Ala Arg Leu  Ala Gly Ala Glu Pro  Phe Leu Asp
    3305                 3310                 3315
Met Leu  Thr Asp Leu Gln Glu  Arg Gln Val Ala Cys  Met Pro His
    3320                 3325                 3330
Gln His  Val Gly Leu Ser Glu  Ile Asn Gln Leu Ala  Gly Pro Gly
    3335                 3340                 3345
Ala Ala  Phe Asp Thr Ile Val  Val Phe Glu Asn Tyr  Pro Pro Pro
    3350                 3355                 3360
Pro Pro  Arg Pro Glu Gly Pro  Asp Ala Leu Val Met  Arg Pro Ala
    3365                 3370                 3375
Gly Ile  Pro Asn Asp Thr Gly  His Tyr Pro Leu Ser  Met Arg Ala
    3380                 3385                 3390
Ser Val  Ala Gly Arg Val His  Gly Glu Phe Ile Tyr  Arg Pro Asp
    3395                 3400                 3405
Val Val  Asp Arg Ala Glu Ala  Glu Glu Met Leu Ala  Ser Ile Leu
    3410                 3415                 3420
Arg Ala  Leu Glu Gln Val Val  Ala Glu Pro Arg Val  Pro Val Gly
    3425                 3430                 3435
Arg Val  Gly Leu Ile Gly Pro  Glu Gln Arg Arg Leu  Val Val Glu
    3440                 3445                 3450
Glu Trp  Asn Arg Thr Gly Val  Pro Pro Ala Ala Glu  Pro Val Pro
    3455                 3460                 3465
Met Leu  Phe Arg Arg Gln Val  Glu Arg Ser Pro Asp  Ala Val Ala
    3470                 3475                 3480
Val Val  Asp Ala Ala Arg Ser  Leu Ser Tyr Ser Gly  Leu Leu Asp
    3485                 3490                 3495
Glu Ala  Glu Glu Leu Ala Arg  Leu Leu Val Gly Leu  Gly Val Arg
    3500                 3505                 3510
Arg Glu  Thr Arg Val Gly Val  Leu Val Gly Arg Ser  Ala Glu Leu
    3515                 3520                 3525
Val Val  Ala Leu Leu Gly Val  Ser Ser Ala Gly Gly  Val Phe Val
    3530                 3535                 3540
Pro Met  Asp Pro Asp Tyr Pro  Arg Glu Arg Ile Ser  Phe Ile Leu
    3545                 3550                 3555
Ala Asp  Ser Ala Pro Glu Val  Leu Leu Cys Thr Ser  Glu Thr Arg
    3560                 3565                 3570
Gln Ala  Val Pro Glu Glu Phe  Ala Gly Ala Val Val  Ala Leu Asp
    3575                 3580                 3585
Ala Pro  Leu Ala Ala Asp Pro  Arg Thr Ala Leu Pro  Arg Val Glu
    3590                 3595                 3600
Ala Gly  Asp Gly Ala Tyr Val  Ile Tyr Thr Ser Gly  Ser Thr Gly
    3605                 3610                 3615
Val Pro  Lys Gly Val Leu Val  Pro His Ala Gly Leu  Gly Asn Leu
    3620                 3625                 3630
Ala Ser  Ala Gln Ile Glu Arg  Phe Gly Val Thr Ser  Ala Ser Arg
    3635                 3640                 3645
Ile Leu  Gln Phe Ala Ala Leu  Gly Phe Asp Ala Ala  Val Ser Glu
    3650                 3655                 3660
Leu Cys  Met Ala Leu Leu Ser  Gly Gly Thr Val Val  Leu Ala Asp
    3665                 3670                 3675
Ala Glu  Ser Met Pro Pro Arg  Val Ser Leu Gly Asp  Ala Val Arg
    3680                 3685                 3690
Arg Trp  Gly Ile Thr His Val  Thr Val Pro Pro Ser  Val Pro Ala
    3695                 3700                 3705
Val Glu  Asp Asp Leu Pro Asp  Ser Leu Glu Thr Leu  Val Val Ala
    3710                 3715                 3720
Gly Glu  Ala Cys Pro Pro Ala  Leu Val Asp Arg Trp  Ser Pro Gly
    3725                 3730                 3735
Arg Arg  Met Ile Asn Ala Tyr  Gly Pro Thr Glu Thr  Thr Val Cys
    3740                 3745                 3750
Ala Thr  Met Ser Ser Pro Leu  Ser Pro Gly Arg Asp  Val Val Pro
    3755                 3760                 3765
Ile Gly  Arg Pro Ile Thr Gly  Leu Arg Ala Tyr Val  Leu Asp Ala
    3770                 3775                 3780
Phe Leu  Gln Pro Val Pro Pro  Gly Val Thr Gly Glu  Leu Tyr Val
    3785                 3790                 3795
Ala Gly  Ala Gly Leu Ala Arg  Gly Tyr Leu Gly Arg  Pro Gly Leu
    3800                 3805                 3810
Thr Ala  Glu Arg Phe Val Ala  Val Pro Ala Ser Val  Ser Pro Ala
    3815                 3820                 3825
Arg Pro  Gly Glu Arg Met Tyr  Arg Thr Gly Asn Arg  Ala Arg Trp
    3830                 3835                 3840
Thr Arg  Asp Gly Glu Leu Val  Phe Thr Gly Arg Ala  Asp Ala Gln
    3845                 3850                 3855
Val Lys  Val Arg Gly Tyr Arg  Ile Glu Pro Gly Glu  Ile Glu Ala
    3860                 3865                 3870
Val Leu  Ala Asp His Pro Gly  Val Ala Gln Val Ala  Val Val Ala
    3875                 3880                 3885
Arg Glu  Asp Gly Pro Gly Gln  Lys Tyr Leu Val Ala  Tyr Val Val
    3890                 3895                 3900
Pro Ala  Ala Glu Gln Val Ala  Gly Ala Pro Ser Glu  Ala Gly Gln
    3905                 3910                 3915
Asp Gly  Ala Leu Ile Ser Ala  Leu Arg Glu Ser Ala  Ala Gly Arg
    3920                 3925                 3930
Leu Pro  Glu His Met Arg Pro  Ala Ala Phe Val Pro  Leu Asp Thr
    3935                 3940                 3945
Met Pro  Leu Thr Pro Asn Gly  Lys Val Asp His Arg  Ala Leu Arg
    3950                 3955                 3960
Ala Pro  Asp Phe Ala Arg Ser  Ser Ser Gly Arg Asp  Pro Arg Ser
    3965                 3970                 3975
Ala Met  Glu Ala Lys Leu Cys  Glu Leu Phe Ala Glu  Val Leu Gly
    3980                 3985                 3990
Leu Glu  Glu Val Gly Ala Gly  Asp Ser Phe Phe Glu  Leu Gly Gly
    3995                 4000                 4005
Asp Ser  Ile Thr Ser Met Gln  Leu Ser Ala Leu Ala  Arg Arg Lys
    4010                 4015                 4020
Gly Leu  Asp Leu Thr Pro Trp  Gln Val Phe Asp Glu  Lys Thr Ala
    4025                 4030                 4035
Glu Arg  Leu Ala Ala Val Val  Lys Glu Leu Pro Ala  Asp Gly Glu
    4040                 4045                 4050
Gly Thr  Gly Glu Pro Glu Pro  Pro Ala Gly Thr Leu  Val Asp Leu
    4055                 4060                 4065
Ser Pro  Asp Gln Leu Asp Gln  Leu Glu Ala Gly Pro  Ala Gly Gly
    4070                 4075                 4080
<210>19
<211>753
<212>PRT
<213>野野村菌属
<400>19
Met Ala Gly Phe Gly Ala Pro Phe Arg Asn Ser Asp His Val Val Ser
1               5                   10                  15
Lys Leu Thr Asn Glu Asp Ala Phe Glu Leu Val Glu Arg His Gly Ala
            20                  25                  30
Asn Ala Ser Pro Leu Gly Arg Ala Met Leu Thr Val Arg Ala Gly Asp
        35                  40                  45
Arg Ser Tyr Pro Glu Met Gly Val Gly Pro Val Ala Glu Ser Lys Asp
    50                  55                  60
Leu Arg Trp Gln Gln Leu Thr Ser Gly Arg Phe Pro Glu Arg Lys Gly
65                  70                  75                  80
Glu Ala Val Val Asp Leu Trp Asp Ala Gln Asn Trp Asp Val Ala Val
                85                  90                  95
Gly Asp Arg Ile Arg Ile Gly Glu Arg Ala Thr Ala Ala Asp Phe Thr
            100                 105                 110
Val Val Gly Ile Val Arg Ala Pro Ser Pro Val Ala Gln Ala Ser Val
        115                 120                 125
Tyr Val Thr Trp Pro Gln Leu Met Arg Trp Ala Asp Asp Pro Ser Leu
    130                 135                 140
Gly Ile Tyr Thr Val Thr Val Arg Gly Ala Val Gly Pro Val Pro Glu
145                 150                 155                 160
Thr Ala Lys Val Gln Thr Pro Glu Gln Glu Ile Ala Ala Arg Thr Ala
                165                 170                 175
Gln Leu Gln Asn Gly Val Asp Thr Trp Ser Leu Leu Leu Leu Leu Phe
            180                 185                 190
Ala Gly Ile Ala Val Phe Val Ser Ile Leu Val Ile Ala Asn Thr Phe
        195                 200                 205
Ser Ile Leu Leu Ala Gln Arg Met Arg Asp Phe Ala Leu Leu Arg Cys
    210                 215                 220
Val Gly Ala Thr Arg Arg Gln Val Val Ser Ser Val Arg Arg Glu Ala
225                 230                 235                 240
Ala Val Val Gly Leu Leu Ser Ser Leu Ala Gly Val Leu Val Gly Ala
                245                 250                 255
Gly Leu Gly Tyr Gly Leu Ile Ala Leu Ile Lys Thr Leu Ser Pro Ile
            260                 265                 270
Thr Pro Ile Ala Ala Pro Ala Pro Pro Ala Pro Trp Leu Leu Gly Gly
        275                 280                 285
Leu Ala lle Gly Leu Thr Ala Thr Leu Val Ala Ala Trp Leu Pro Ile
    290                 295                 300
Arg Arg Val Val Arg Val Ser Pro Leu Ala Ala Leu Arg Pro Asp Thr
305                 310                 315                 320
Ala Thr Asp Pro Arg Thr Ala Thr Gly Arg Ala Arg Leu Val Leu Gly
                325                 330                 335
Val Phe Met Leu Ile Ala Gly Leu Val Leu Leu Ala Ser Ala Met Ala
            340                 345                 350
Trp His Ser Thr Val Leu Met Leu Ala Gly Gly Gly Ser Leu Phe Thr
        355                 360                 365
Gly Val Leu Leu Phe Gly Pro Val Leu Ile Pro Arg Leu Leu Glu Ile
    370                 375                 380
Thr Gly Thr Arg Leu Gly Thr Ile Gly Arg Leu Ala Thr Lys Asn Ala
385                 390                 395                 400
Val Arg Asn Pro Arg Arg Thr Ala Thr Thr Ala Ala Ser Leu Leu Val
                405                 410                 415
Gly Ile Thr Leu Ile Thr Ala Val Leu Thr Gly Val Ala Ile Thr Ser
            420                 425                 430
Glu Ala Leu Asn Glu Arg Leu Asp Gly Gln His Pro Ile Asp Ala Ala
        435                 440                 445
Leu Val Ser Thr Gly Lys Pro Phe Ser Ala Asp Phe Leu Asp Lys Val
    450                 455                 460
Arg Gly Thr Ser Gly Val Asp Gln Ala Ile Ala Val Asp Gly Ala Val
465                 470                 475                 480
Ala Thr Val Ser Gly Leu Asp Lys Pro Ile Pro Val Val Thr Ala Pro
                485                 490                 495
Asp Ala Gln Arg Val Ala His Asp Gly Gly Ser Phe Ala Arg Val Glu
            500                 505                 510
Pro Gly Val Leu Arg Leu Asp Glu Ser Ala Phe Arg Gln Leu Arg Leu
        515                 520                 525
Arg Ala Gly Asp Lys Val Arg Val Thr Val Gly Asp Arg Arg Ala Val
    530                 535                 540
Leu Gln Val Ser Leu Ala Thr Gly Trp Gly Leu Gln Ala Val Val Ala
545                 550                 555                 560
Pro Glu Thr Leu Ala Arg Leu Thr Asp Ser Ala Ala Pro Arg Ala Val
                565                 570                 575
Trp Ile Arg Ala Ser Ala Asp Ala Asp Ser Thr Arg Leu Val Gly Glu
            580                 585                 590
Leu Gly Asp Leu Ala Ala Ala Ala Gly Ala Asn Val Asn Asp Gln Leu
        595                 600                 605
Glu Ala Arg Glu Thr Glu Asn Ala Pro Leu Met Ile Leu Thr Trp Ala
    610                 615                 620
Ile Val Ala Leu Leu Gly Phe Ser Val Ala Ile Ala Leu Val Gly Ile
625                 630                 635                 640
Ala Asn Thr Leu Gly Leu Ser Val Leu Glu Arg Val Arg Glu His Ala
                645                 650                 655
Leu Leu Arg Ala Leu Gly Leu Thr Arg Arg Gln Leu Arg Arg Met Leu
            660                 665                 670
Ala Ala Glu Ala Val Leu Leu Ser Leu Val Ala Ala Val Leu Gly Thr
        675                 680                 685
Val Ile Gly Ile Gly Phe Ala Trp Val Gly Tyr Glu Thr Phe Val Lys
    690                 695                 700
Gln Ala Leu Asp Asn Ala Thr Met Gln Val Pro Trp Pro Leu Leu Ala
705                 710                 715                 720
Val Val Val Leu Val Ala Ala Leu Ala Gly Leu Leu Ala Ser Val Leu
                725                 730                 735
Pro Ala Arg Arg Ala Val Arg Val Thr Pro Ala Ala Gly Leu Ser Phe
            740                 745                 750
Glu
<210>20
<211>232
<212>PRT
<213>野野村菌属
<400>20
Met Thr Gly Gln Arg Ala Ala Leu Glu Thr Val Ala Ala Ser Ala Arg
1               5                   10                  15
Asn Leu Thr Lys Val Tyr Gly Gln Gly Glu Thr Arg Val His Ala Leu
            20                  25                  30
Arg Gly Val Asp Leu Asp Leu Pro Arg Gly Lys Phe Thr Ala Ile Met
        35                  40                  45
Gly Ser Ser Gly Ser Gly Lys Ser Thr Leu Met His Cys Leu Ala Gly
    50                  55                  60
Leu Asp Gln Ala Ser Asp Gly Thr Val Thr Val Ala Gly Thr Asp Leu
65                  70                  75                  80
Gly Ser Leu Asp Asp Asn Glu Leu Thr Val Phe Arg Arg Glu His Ile
                85                  90                  95
Gly Phe Val Phe Gln Ser Phe Asn Leu Leu Pro Met Leu Thr Ala Phe
            100                 105                 110
Gln Asn Ile Thr Leu Pro Leu Glu Leu Gly Gly Arg Arg Ile Asp Asp
        115                 120                 125
Ala Ala Thr Glu Arg Val His Val Leu Ala Glu Thr Leu Gly Met Ala
    130                 135                 140
Asp Arg Leu Gly His Arg Pro Ser Glu Met Ser Gly Gly Gln Gln Gln
145                 150                 155                 160
Arg Val Ala Ile Ala Arg Ala Leu Ile Thr Gly Pro Asp Leu Leu Phe
                165                 170                 175
Ala Asp Glu Pro Thr Gly Asn Leu Asp Ser Thr Thr Ser Ala Glu Val
            180                 185                 190
Leu Gly Tyr Leu His Lys Ser Thr Arg Glu Leu Gly Gln Thr Val Val
        195                 200                 205
Met Val Thr His Glu Arg Glu Ala Ala Ala Tyr Ala Asp Gly Val Val
    210                 215                 220
Thr Leu Glu Asp Gly Arg Ile Ala
225                 230
<210>21
<211>535
<212>PRT
<213>野野村菌属
<400>21
Met Ser His Ile Thr Met Thr Pro Pro Ser Ala Cys Arg Asp Pro Ala
1               5                   10                  15
Pro Ala Gly Arg Phe Pro Arg Trp Ala Val Trp Arg Ser Pro Pro Gly
            20                  25                  30
Gln Pro Trp Trp Ala Arg Pro Ala Leu Leu Cys Ile Ala Ala Thr Ala
        35                  40                  45
Ala Val Leu Tyr Ala Trp Asn Leu Pro Leu Val Asp Tyr Ala Pro Arg
    50                  55                  60
Tyr Ser Asp Ala Val Lys Ser Met Ser Glu Asn Trp Lys Ala Phe Leu
65                  70                  75                  80
Tyr Gly Thr Val Asp Val Gln Ala Thr Tyr Thr Leu Asp Lys Leu Ala
                85                  90                  95
Gly Ala Phe Val Pro Gln Ala Ile Ser Val lys Ile Phe Gly Phe His
            100                 105                 110
Ala Trp Ala Leu Ala Leu Pro Gln Val Ile Glu Gly Val Ile Ser Val
        115                 120                 125
Leu Val Met Tyr Arg Ile Val Arg Arg Trp Ala Gly Val Val Pro Gly
    130                 135                 140
Leu Leu Ala Ala Ala Val Phe Thr Ile Thr Pro Val Ala Ala Ser Met
145                 150                 155                 160
Phe Gly His Ser Met Ala Asp Gly Ala Leu Val Met Cys Leu Val Leu
                165                 170                 175
Ala Val Asp Ser Tyr Gln Arg Ala Val Leu Glu Gly Arg Leu Arg Ser
            180                 185                 190
Leu Val Trp Ala Gly Val Trp Val Gly Leu Gly Phe Gln Ala Lys Met
        195                 200                 205
Leu Gln Ala Trp Met Ile Leu Pro Ala Leu Ala Ile Gly Tyr Leu Leu
    210                 215                 220
Ser Ala Pro Ile Gly Leu Arg Arg Arg Leu Gln His Leu Gly Ile Ala
225                 230                 235                 240
Gly Val Val Thr Leu Val Val Ser Leu Ser Trp lle Thr Leu Tyr His
                245                 250                 255
Val Thr Pro Ala Ala Asp Arg Pro Tyr Ile Ser Gly Thr Thr Asn Ser
            260                 265                 270
Ser Ala Ala Ala Met Val Phe Gly Tyr Asn Gly Leu Gly Arg Leu Gly
        275                 280                 285
Ile Asn Leu Pro Gly Ala Leu Pro Pro Asn Tyr Met Gly Ser Val Ile
    290                 295                 300
Gly Pro Ala Pro Pro Lys Arg Ser Thr Gln Leu Pro Arg Pro Arg Pro
305                 310                 315                 320
Gly Met Val Ile Pro Glu Ile Gly Ile Glu His Gly Gly Gly Trp Gly
                325                 330                 335
Lys Leu Phe Gly Gly Arg Leu Gly Val Ala Ser Gly Trp Leu Tyr Pro
            340                 345                 350
Leu Ala Leu Met Ala Leu Leu Cys Gly Leu Trp Trp Trp Arg Arg Ala
        355                 360                 365
Glu Arg Thr Asp Pro Ala Arg Gly Gly Met Val Met Trp Gly Val Trp
    370                 375                 380
Leu Leu Thr Phe Ala Leu Pro Tyr Ser Ala Val Phe Val Ile Pro His
385                 390                 395                 400
Ser Ala Tyr Val Ala Val Leu Ala Pro Pro Val Ala Ala Leu Ser Gly
                405                 410                 415
Ile Gly Ile Val Met Phe Trp Arg Ala Tyr Arg Ser Gly Gly Arg Met
            420                 425                 430
Ala Trp Ile Phe Pro Leu Ala Ile Val Ala Glu Leu Ala Trp Ala Val
        435                 440                 445
Trp Leu Trp Ser Phe Tyr Pro Thr Phe Leu Pro Trp Ala Met Trp Gly
    450                 455                 460
Ala Val Ala Leu Gly Val Val Ala Val Val Ala Leu Ala Leu Ala Arg
465                 470                 475                 480
Leu Val Arg Pro Arg Arg Ser Ser Leu Val Ser Ala Gly Leu Thr Ile
                485                 490                 495
Gly Val Ala Ala Met Leu Ala Ala Pro Ala Thr Trp Ser Ala Ser Val
            500                 505                 510
Leu Asp Pro Arg Tyr Gly Gly Ser Ser Phe Asp Ala Asn Ala Gly Pro
        515                 520                 525
Ala Ala Arg Thr Pro Gly Gly
    530                 535
<210>22
<211>270
<212>PRT
<213>野野村菌属
<400>22
Met Leu Gln Asp Ala Asp Arg Thr Arg Ile Leu Ala Ile Ser Pro His
1               5                   10                  15
Leu Asp Asp Ala Val Leu Ser Val Gly Ala Ser Leu Ala Gln Ala Glu
            20                  25                  30
Gln Asp Gly Gly Lys Val Thr Val Phe Thr Val Phe Ala Gly Ser Ala
        35                  40                  45
Ala Pro Pro Tyr Ser Pro Ala Ala Glu Arg Phe His Ala Arg Trp Gly
    50                  55                  60
Leu Ser Pro Thr Glu Asp Ala Pro Leu Arg Arg Arg Asn Glu Asp Ile
65                  70                  75                  80
Ala Ala Leu Asp Gln Leu Gly Ala Gly His Arg His Gly Arg Phe Leu
                85                  90                  95
Asp Ala Ile Tyr Arg Arg Ser Pro Asp Gly Gln Trp Leu Leu His His
            100                 105                 110
Asn Glu Gly Ser Met Val Arg Gln Gln Ser Pro Ala Asn Asn His Asp
        115                 120                 125
Leu Val Ala Ala Ile Arg Glu Asp Ile Glu Ser Met Ile Ala Glu Cys
    130                 135                 140
Asp Pro Thr Leu Val Leu Thr Cys Val Ala Ile Gly Lys His Pro Asp
145                 150                 155                 160
His Lys Ala Thr Arg Asp Ala Thr Leu Leu Ala Ala Arg Glu Arg Gly
                165                 170                 175
Ile Pro Leu Arg Leu Trp Gln Asp Leu Pro Tyr Ala Ala Tyr Ser Gln
            180                 185                 190
Asp Leu Ala Glu Leu Pro Asp Gly Leu Arg Leu Gly Ser Pro Glu Leu
        195                 200                 205
Ser Phe Val Asp Glu Glu Ala Arg Thr Arg Lys Phe Gln Ala Met Lys
    210                 215                 220
His Tyr Ala Thr Gln Leu Ser Val Leu Asp Gly Pro Asn Lys Asn Leu
225                 230                 235                 240
Phe Ala Lys Leu Asp Glu His Ala Arg Asn Ala Ala Pro Asp Gly Gly
                245                 250                 255
Tyr Asn Glu Thr Thr Trp Pro Val Ile Arg Tyr Ala Ala Glu
            260                 265                 270
<210>23
<211>420
<212>PRT
<213>野野村菌属
<400>23
Met Ala His Arg Leu Arg Arg Leu Thr Thr Ala Phe Arg Ser Val Arg
1               5                   10                  15
Leu Arg Leu Thr Leu Val Tyr Gly Ala Leu Phe Ala Ala Ser Gly Val
            20                  25                  30
Val Leu Leu Ala Ile Thr Tyr Leu Leu Phe Arg Gly Ser Arg Pro Phe
        35                  40                  45
Val Leu Val Asp Gly Asp Pro Gly Gly Arg Phe Arg Ala Phe Ala Arg
    50                  55                  60
Gln Gln Gln Ala Ala Ile Leu Glu Asn Leu Leu Phe Gln Ser Leu Ile
65                  70                  75                  80
Ala Leu Ala Leu Met Thr Val Ile Ser Phe Leu Leu Gly Trp Leu Val
                85                  90                  95
Ala Gly Arg Met Leu Arg Pro Leu Arg Thr Met Asn Thr Thr Leu Lys
            100                 105                 110
Arg Ile Ser Ala Arg Asn Val His Glu Arg Leu Ala Leu Pro Gly Pro
        115                 120                 125
Arg Asp Glu Leu Arg Asn Leu Ala Asp Thr Val Asp Glu Leu Leu Glu
    130                 135                 140
Arg Leu His Ser Ala Leu Asp Ala Gln Lys Arg Phe Val Ala Asn Ala
145                 150                 155                 160
Ala His Glu Leu Arg Thr Pro Leu Thr Leu Glu His Ala Leu Leu Glu
                165                 170                 175
Glu Ser Leu Leu His Arg Asp Ala Asp Thr Pro Ser Met Arg Ser Ile
            180                 185                 190
Met Glu Arg Leu Leu Asp Leu Ser Arg Gln Gln Gly Arg Leu Leu Glu
        195                 200                 205
Ser Leu Leu Thr Leu Ala Lys Ser Glu Gly Gly Leu Asp His Arg Glu
    210                 215                 220
Pro Leu Asp Leu Ala Glu Ile Ala Glu His Thr Ile Arg Thr Met Glu
225                 230                 235                 240
Gly Thr Gly Pro Gly Ala Asp Gly Asn Asn Pro Arg Ala Gly Val Ser
                245                 250                 255
Ala Asp Arg Arg Ala Asp Gly Asn Ser Pro Thr Ala Gly Ala Ala Thr
            260                 265                 270
Asp Ser Trp Ala Asp Gly Lys Ser Leu Arg Ala Gly Cys Pro His Pro
        275                 280                 285
Arg Leu Val Thr Gly Ile Ala His Ala Pro Thr Thr Gly Asp Pro Ala
    290                 295                 300
Leu Val Glu Arg Leu Ile Thr Asn Leu Leu Asp Asn Ala Met Arg Tyr
305                 310                 315                 320
Asn Val Pro Gly Gly Gln Val Glu Leu Ser Thr Arg Ala Glu Ala Gly
                325                 330                 335
Lys Ala Val Val Ser Ile Ala Asn Thr Gly Pro Val Val Pro Pro Glu
            340                 345                 350
Gln Val His Arg Leu Phe Glu Pro Phe Gln Arg Leu Asp Arg Thr Arg
        355                 360                 365
Ala Asp Asp His His Gly Leu Gly Leu Ser Ile Val Arg Ala Ile Ala
    370                 375                 380
Val Ala His Asp Ala Thr Leu Thr Ala His Ala Arg Pro Gln Gly Gly
385                 390                 395                 400
Leu Ser Val Glu Ile His Phe Pro Leu Met Arg Arg Ala Leu Arg Arg
                405                 410                 415
Leu Ala Pro Ser
            420
<210>24
<211>709
<212>PRT
<213>野野村菌属
<400>24
Met Ser Leu Pro Thr Cys Ala Cys Gly Leu Thr Pro His Ala Pro Ser
1               5                   10                  15
Cys Ala Pro Arg Ser Glu His Ala Gly Gly Arg Ser Ser Glu Ser Arg
            20                  25                  30
Thr Asp Ile Gln Gly Leu Arg Ala Ile Ala Val Ala Ala Val Val Ala
        35                  40                  45
Phe His Leu Trp Pro Gly Gly Pro Thr Gly Gly Tyr Val Gly Val Asp
    50                  55                  60
Val Phe Phe Val Ile Ser Gly Tyr Leu Ile Thr Ser His Leu Leu Arg
65                  70                  75                  80
Gln Pro Gly His Gly Gly Gly Arg Leu Leu Asp Phe Trp Ala Arg Arg
                85                  90                  95
Val Arg Arg Leu Ile Pro Ala Ala Ser Leu Ala Leu Leu Val Thr Leu
            100                 105                 110
Ala Ala Ser Val Val Trp Leu Pro Leu Thr Val Leu Gly Thr Ala Ala
        115                 120                 125
Arg Glu Val Ile Ala Ala Thr Val Tyr Val Glu Asn Leu Arg Leu Ala
    130                 135                 140
Leu Thr Gln Ala Asn Tyr Leu Asp Val Asp Gln Pro Asp Trp Pro Ala
145                 150                 155                 160
Gln His Tyr Trp Ser Leu Ser Ile Glu Glu Gln Phe Tyr Leu Gly Trp
                165                 170                 175
Pro Leu Leu Leu Gly Ser Ala Ala Trp Leu Ala Ala Arg Val Ala Arg
            180                 185                 190
Gly Arg Arg Pro Pro Glu Asn Phe Thr Arg Trp Ser Ala Val Val Val
        195                 200                 205
Thr Gly Ala Val Val Ala Ala Ser Leu Ala Trp Ser Val Gln Lys Thr
    210                 215                 220
Ala Thr Asp Pro Ala Ala Ala Tyr Phe Val Ser Thr Thr Arg Phe Trp
225                 230                 235                 240
Glu Leu Ala Leu Gly Gly Leu Leu Ala Ala Val Leu Thr Val Arg Ala
                245                 250                 255
Met Pro Arg Ala Arg Ala Val Arg Ala Gly Leu Ala Trp Ala Gly Leu
            260                 265                 270
Gly Met Ile Gly Trp Ala Val Val Arg Phe Asp Ala Glu Thr Ala Phe
        275                 280                 285
Pro Gly Ala Ala Ala Leu Val Pro Thr Val Gly Ala Cys Leu Val Ile
    290                 295                 300
Ala Ala Ala Ala Asp Gly Leu Arg Gly Gly Pro Gly Arg Ala Leu Ala
305                 310                 315                 320
Trp Arg Pro Val Gln Trp Leu Gly Asn Ala Ser Tyr Ala Val Tyr Leu
                325                 330                 335
Trp His Trp Pro Pro Ile Met Ile Leu Pro Tyr Ala Leu Gly Arg Ser
            340                 345                 350
Leu Thr Val Ile Glu Ser Val Gly Val Ile Ala Leu Thr Leu Val Leu
        355                 360                 365
Ala Ala Leu Ser Gln Tyr Leu Val Glu Asp Arg Leu Arg Trp His Pro
    370                 375                 380
Val Leu Val Arg Ser Arg Arg Leu Thr Phe Ala Met Leu Ala Ser Cys
385                 390                 395                 400
Val Val Val Val Ala Gly Ala Gly Ala Gly Val Val Ala Tyr Ala Asp
                405                 410                 415
Ala Ala Glu Arg Thr Glu Ser Ala Ala Phe Glu Ala Ala Ala Ser Arg
            420                 425                 430
Ala Gly Ser Cys Leu Gly Ala Gly Val Val Arg Asp Pro Ala Cys Gln
        435                 440                 445
Asp Leu Gly Leu Leu Met Pro Pro Gln Val Ala Leu Lys Asp Lys Pro
    450                 455                 460
Ala Val Tyr Ala Asp Gly Cys Val Asn Lys Glu Pro Phe Ile Ala Arg
465                 470                 475                 480
Asn Thr Cys Thr Tyr Gly Pro Asp Ala Ala Gly Arg Arg Ile Ala Leu
                485                 490                 495
Val Gly Asn Ser His Ala Gly His Trp Val Pro Ala Leu Glu Lys Ala
            500                 505                 510
Leu Trp Ser Glu Arg Trp Gln Leu Thr Thr Tyr Val Gln Leu Ala Cys
        515                 520                 525
Tyr Thr Val Asp Gln Pro Leu Val Leu Glu Gly Ala Gly Val Ser Glu
    530                 535                 540
Asn Cys Gln Lys Ile Asn Lys Trp Ala Val Gly Ser Ile Val Asn Gly
545                 550                 555                 560
Gly Tyr Asp Leu Val Ile Met Ser Asn Arg Thr His Val Pro Leu Ala
                565                 570                 575
Gly Val Ser Pro Ala Gly Gln Gln Ala Ala Ala Glu Arg Ala Tyr Arg
            580                 585                 590
Asp Thr Leu Arg Ala Phe Thr Gly Ala GlV Leu Pro Val Leu Val Leu
        595                 600                 605
Arg Asp Thr Pro Ala Met Pro Asp Ser Val Pro His Cys Ile Ala Lys
    610                 615                 620
His Pro Asp Asp Leu Asp Ser Cys Gly Gly Pro Ala Gly Val Val Leu
625                 630                 635                 640
Arg Pro Asp Pro Leu Ala Ala Ala Ala Arg Ala Asp Asp Thr Gly Leu
                645                 650                 655
Val Ser Val Ala Ser Val Asp His Leu Val Cys Gly Glu Arg Cys Gly
            660                 665                 670
Pro Val Ile Gly Gly Leu Ile Ala Tyr Ser Asp Arg Ser His Leu Thr
        675                 680                 685
Thr Thr Phe Ala Arg Thr Leu Ala Pro Glu Val Thr Ala Ala Val Arg
    690                 695                 700
Gly Ala Leu Thr Arg
705
<210>25
<211>648
<212>PRT
<213>野野村菌属
<400>25
Met Ala Ile Val Ser Pro Phe Gly Gly Leu Leu Lys Gly Asp Gly Glu
1               5                   10                  15
Asp Asp Pro Ala Pro Ser Arg Ile Arg Pro Gly Thr Leu Arg Arg Val
            20                  25                  30
Leu Gly Tyr Phe Arg Pro His Val Gly Lys Val Ala Leu Phe Val Leu
        35                  40                  45
Val Thr Ala Leu Asp Ser Ile Phe Val Val Ala Ser Pro Leu Met Leu
    50                  55                  60
Lys Asp Leu Val Asp Lys Gly Val Leu Gly Asn Asp Leu Glu Leu Val
65                  70                  75                  80
Ile Leu Leu Ala Cys Leu Ala Ala Gly Phe Ala Val Met Ser Thr Leu
                85                  90                  95
Leu Gln Leu Val Ser Ala Tyr Ile Ser Gly Arg Ile Gly Gln Gly Val
            100                 105                 110
Ser Tyr Asp Leu Arg Val Gln Ala Leu Asp His Val Gln Arg Leu Pro
        115                 120                 125
Ile Ala Phe Phe Thr Arg Thr Gln Thr Gly Val Leu Val Gly Arg Leu
    130                 135                 140
His Thr Glu Leu Val Met Thr Gln Met Ala Phe Thr Gln Met Leu Thr
145                 150                 155                 160
Ala Ala Ala Ser Ala Val Thr Val Leu Leu Val Leu Ala Glu Leu Phe
                165                 170                 175
Tyr Leu Ser Trp Ile Val Ala Leu Leu Thr Leu Val Leu Ile Pro Val
            180                 185                 190
Phe Leu Val Pro Trp Ser Tyr Val Gly Arg Arg Met Gln Arg Tyr Thr
        195                 200                 205
Arg Gly Leu Met Glu Glu Asn Ala Gly Leu Ala Gly Leu Leu Gln Glu
    210                 215                 220
Arg Phe Asn Val Gln Gly Ala Met Leu Ser Lys Leu Phe Gly Arg Pro
225                 230                 235                 240
Ala Glu Glu Met Ala Glu Tyr Glu Ser Arg Ala Gly Arg Ile Arg Gly
                245                 250                 255
Leu Ala Val Ser Val Thr Leu Tyr Gly Arg Met Ala Pro Ala Ile Phe
            260                 265                 270
Ala Leu Met Ala Ala Leu Ala Thr Ala Leu Val Tyr Gly Val Gly Gly
        275                 280                 285
Gly Leu Val Leu Ser Gln Ala Phe Gln Leu Gly Thr Leu Val Ala Leu
    290                 295                 300
Ala Thr Leu Leu Gly Arg Leu Phe Gly Pro lle Thr Gln Leu Ala Ser
305                 310                 315                 320
Ile Gln Glu Asn Ala Leu Thr Val Leu Val Ser Phe Glu Arg Ile Phe
                325                 330                 335
Glu Leu Leu Asp Leu Lys Pro Leu Ile Glu Glu Arg Pro Asp Ala Val
            340                 345                 350
Ala Leu Lys Ala Gly Lys Ala Ser Asp Val Gln Phe Glu Asn Val Ser
        355                 360                 365
Phe Arg Tyr Pro Ser Ala Asp Glu Val Ser Leu Pro Ser Leu Glu Gln
    370                 375                 380
Asn Val Arg Thr Gly Gln Glu Arg Gly Glu Ala Thr Pro Glu Val Leu
385                 390                 395                 400
Arg Asp Val Ser Leu His Val Pro Ala Gly Thr Leu Thr Ala Leu Val
                405                 410                 415
Gly Pro Ser Gly Ala Gly Lys Ser Thr Leu Thr His Leu Val Ser Arg
            420                 425                 430
Leu Tyr Asp Pro Thr Ser Gly Thr Val Arg Val Gly Gly His Asp Leu
        435                 440                 445
Arg Asp Leu Thr Phe Asp Ser Leu Arg Glu Thr Val Gly Val Val Ser
    450                 455                 460
Gln Asp Thr Tyr Leu Phe His Asp Thr Ile Arg Ala Asn Leu Leu Tyr
465                 470                 475                 480
Ala Arg Pro Asp Ala Thr Glu Asp Glu Leu Val Glu Ala Cys Arg Gly
                485                 490                 495
Ala Gln Ile Trp Asp Leu Ile Ala Ser Leu Pro Arg Gly Leu Asp Thr
            500                 505                 510
Val Val Gly Asp Arg Gly Tyr Arg Leu Ser Gly Gly Glu Lys Gln Arg
        515                 520                 525
Leu Ala Ile Ala Arg Leu Leu Leu Lys Ala Pro Ser Val Val Val Leu
    530                 535                 540
Asp Glu Ala Thr Ala His Leu Asp Ser Glu Ser Glu Ala Ala Val Gln
545                 550                 555                 560
Arg Ala Leu Thr Thr Ala Leu Arg Ser Arg Thr Ser Leu Val Ile Ala
                565                 570                 575
His Arg Leu Ser Thr Ile Arg Glu Ala Asp His Ile Leu Val Ile Asp
            580                 585                 590
Asp Gly Arg Val Arg Glu Arg Gly Thr His Glu Glu Leu Leu Ala Glu
        595                 600                 605
Gly Gly Leu Tyr AlaAsp Leu Tyr His Thr Gln Phe Ala Lys Ser Gly
    610                 615                 620
Val Asn Gly Thr Arg Pro Gly Gln Gly Asp Gly Ala Glu Pro Val Gln
625                 630                 635                 640
Glu Val Val Gly Gly Gly Glu Arg
                645
<210>26
<211>2097
<212>PRT
<213>野野村菌属
<400>26
Met Ser Ala Gly Thr Arg Ala Thr Pro Thr Thr Val Leu Asp Leu Phe
1               5                   10                  15
Ala Arg Gln Val Gly Arg Ala Pro Asp Ala Val Ala Leu Val Asp Gly
            20                  25                  30
Asp Arg Val Leu Thr Tyr Arg Arg Leu Asp Glu Leu Ala Gly Ala Leu
        35                  40                  45
Ser Gly Arg Leu Ile Gly Arg Gly Val Gly Arg Gly Asp Arg Val Ala
    50                  55                  60
Val Met Met Asp Arg Ser Ala Asp Leu Val Val Thr Leu Leu Ala Val
65                  70                  75                  80
Trp Gln Ala Gly Ala Ala Tyr Val Pro Val Asp Ala Ala Leu Pro Ala
                85                  90                  95
Arg Arg Val Ala Phe Met Val Ala Asp Ser Gly Ala Cys Leu Met Val
            100                 105                 110
Cys Ser Glu Ala Thr Arg Asp Ala Val Pro Gln Gly Val Glu Ser Ile
        115                 120                 125
Ala Leu Thr Gly Glu Gly Gly Cys Gly Thr Ser Ala Val Thr Val Asp
    130                 135                 140
Pro Gly Asp Leu Ala Tyr Val Met Tyr Thr Ser Gly Ser Thr Gly Thr
145                 150                 155                 160
Pro Lys Gly Val Ala Val Pro His Arg Ser Val Ala Glu Leu Thr Gly
                165                 170                 175
Asn Pro Gly Trp Gly Val Glu Pro Gly Glu Ala Val Leu Met His Ala
            180                 185                 190
Pro Tyr Thr Phe Asp Ala Ser Leu Phe Glu Ile Trp Val Pro Leu Val
        195                 200                 205
Ser Gly Ala Arg Val Val Ile Ala Ala Pro Gly Ala Val Asp Ala Arg
    210                 215                 220
Arg Leu Arg Glu Ala Val Ala Ala Gly Val Thr Arg Val His Leu Thr
225                 230                 235                 240
Ala Gly Ser Phe Arg Ala Val Ala Glu Glu Ser Pro Glu Ser Phe Ala
                245                 250                 255
His Phe Arg Glu Val Leu Thr Gly Gly Asp Val Val Pro Ala Tyr Ala
            260                 265                 270
Val Gln Lys Val Arg Ala Ala Cys Pro His Val Arg Ile Arg His Leu
        275                 280                 285
Tyr Gly Pro Thr Glu Thr Thr Leu Cys Ala Thr Trp Gln Leu Leu Glu
    290                 295                 300
Pro Gly Asp Val Val Gly Pro Val Leu Pro Ile Gly Arg Pro Leu Pro
305                 310                 315                 320
Gly Arg Arg Ala Trp Val Leu Asp Ala Ser Leu Arg Pro Val Glu Pro
                325                 330                 335
Gly Val Val Gly Asp Leu Tyr Leu Ser Gly Ala Gly Leu Ala Asp Gly
            340                 345                 350
Tyr Leu Asp Arg Ala Gly Leu Thr Ala Glu Arg Phe Val Ala Asp Pro
        355                 360                 365
Ser Ala Ala Gly Arg Arg Met Tyr Arg Thr Gly Asp Leu Ala Gln Trp
    370                 375                 380
Thr Ala Asp Gly Glu Leu Leu Phe Ala Gly Arg Ala Asp Asp Gln Val
385                 390                 395                 400
Lys Val Arg Gly Phe Arg Ile Glu Pro Gly Glu Val Glu Ala Ala Leu
                405                 410                 415
Thr Ala Gln Pro His Val Arg Glu Ala Val Val Val Ala Ile Asp Gly
            420                 425                 430
Arg Leu Ile Gly Tyr Val Val Ala Asp Gly Asp Val Asp Pro Val Leu
        435                 440                 445
Met Arg Arg Arg Leu Ala Ala Ser Leu Pro Glu Tyr Met Ile Pro Ala
    450                 455                 460
Ala Leu Val Thr Leu Asp Ala Leu Pro Leu Thr Gly Ser Gly Lys Val
465                 470                 475                 480
Asp Arg Arg Ala Leu Pro Glu Pro Asp Phe Ala Ser Ala Ala Pro Arg
                485                 490                 495
Arg Glu Pro Gly Thr Glu Pro Glu Arg Val Leu Cys Asp Leu Phe Ala
            500                 505                 510
Glu Leu Leu Gln Pro Glu Gly Arg Gly Val Gly Val Asp Asp Gly Phe
        515                 520                 525
Val Glu Leu Gly Gly Asp Ser Ile Val Ala Ile Arg Leu Ala Ala Arg
    530                 535                 540
Ala Ser Arg Val Gly Leu Leu Val Thr Pro Ala Gln Ile Phe Lys Glu
545                 550                 555                 560
Lys Thr Pro Ala Arg Leu Ala Ala Val Ala Gly Ala Val Pro Ala Gly
                565                 570                 575
Arg Pro Ala Asp Gly Pro Leu Ile Thr Leu Thr Ala Glu Glu Glu Ala
            580                 585                 590
Glu Leu Ala Thr Ala Val Pro Gly Ala Glu Glu Val Trp Pro Leu Ala
        595                 600                 605
Pro Leu Gln Glu Gly Leu Tyr Phe Gln Ala Thr Leu Asp Asp Glu Gly
    610                 615                 620
His Asp Ile Tyr Gln Ala Gln Trp Ile Leu Glu Leu Ala Gly Pro Leu
625                 630                 635                 640
Asp Ala Ala Arg Leu Arg Ala Ser Trp Glu Ala Val Phe Ala Arg His
                645                 650                 655
Pro Glu Leu Arg Val Ser Phe His Arg Arg Ala Ser Gly Thr Met Leu
            660                 665                 670
Gln Val Val Ala Gly His Val Val Leu Pro Trp Arg Glu Val Asp Leu
        675                 680                 685
Ala Asp Ala Gly Asp Ile Asp Ala Ala Val Ala Ala Leu Ile Ser Glu
    690                 695                 700
Glu Gln Glu Gln Arg Phe Asp Leu Ala Lys Ala Pro Leu Phe Arg Leu
705                 710                 715                 720
Val Leu Val Arg His Gly Glu Asp Arg His Arg Leu Leu Val Val His
                725                 730                 735
His His Ile Leu Thr Asp Gly Trp Ser Val Ala Val Ile Leu Asn Glu
            740                 745                 750
Val Ala Glu Ala Tyr Thr Asn Gly Gly Arg Leu Pro Asp Arg Thr Gly
        755                 760                 765
Ala Ala Ser Tyr Arg Asp Tyr Leu Ala Trp Leu Asp Arg Gln Asp Lys
    770                 775                 780
Asp Ala Ala Arg Ala Ala Trp Gln Ala Glu Leu Ser Gly Leu Glu Gly
785                 790                 795                 800
Pro Ala Pro Ile Ala Lys Ala Ala Thr Thr Thr Gly Ala Gly Thr Gly
                805                 810                 815
Tyr Glu Tyr Arg Ile Ala Phe Leu Thr Pro Asp Leu His Thr Arg Leu
            820                 825                 830
Thr Glu Leu Ala Arg Asp His Gly Leu Thr Leu Asn Thr Leu Ala Gln
        835                 840                 845
Gly Ala Trp Ala Met Val Leu Ala Arg Leu Ala Arg Arg Thr Asp Val
    850                 855                 860
Val Phe Gly Thr Thr Val Ala Cys Arg Pro Ala Glu Leu Pro Glu Val
865                 870                 875                 880
Glu Ser Val Pro Gly Leu Met Met Asn Thr Val Pro Val Arg Val Pro
                885                 890                 895
Leu Gln Gly Ala Gln Ser Val Val Asp Leu Leu Thr Gly Leu Gln Glu
            900                 905                 910
Arg Gln Ala Ala Leu Leu Pro His Gln His Leu Gly Leu Thr Glu Ile
        915                 920                 925
Gln Arg Ala Ala Gly Pro Gly Ala Thr Phe Asp Thr Leu Leu Val Phe
    930                 935                 940
Glu Asn Tyr Pro Arg Asp Phe Ala Gly Gln Phe Thr Tyr Leu Gly Thr
945                 950                 955                 960
Ile Glu Gly Thr His Tyr Pro Leu Thr Leu Gly Ile Ile Pro Gly Asp
                965                 970                 975
His Phe Arg Ile Gln Leu Val Tyr Arg Arg Gly Gln Val Gly Glu Ser
            980                 985                 990
Val Ala Glu Ser Ile Leu Gly Trp  Phe Thr Gly Ala Leu  Met Thr Mer
        995                 1000                 1005
Ala Ala  Asp Pro His Gly Pro  Val Gly Arg Ile Gly  Val Gly Glu
    1010                 1015                 1020
Ala Arg  Ala Gly Gly Ser Asp  Arg Ala Met Ala Ala  Gly Glu Pro
    1025                 1030                 1035
Leu Pro  Val Leu Leu Arg Arg  Val Val Lys Asp Arg  Pro Asp Glu
    1040                 1045                 1050
Val Ala  Val Val Asp Gly Asp  Gly Glu Leu Ser Phe  Gly Glu Leu
    1055                 1060                 1065
Trp Glu  Arg Ala Thr Ala Leu  Ala Ala Glu Leu Arg  Ala His Gly
    1070                 1075                 1080
Ile Gly  Pro Glu Ser Arg Val  Ala Val Met Val Gly  Arg Ser Ala
    1085                 1090                 1095
Trp Trp  Ala Val Gly Val Leu  Gly Val Cys Leu Ala  Gly Gly Ala
    1100                 1105                 1110
Phe Met  Pro Val Asp Pro Ala  Tyr Pro Ala Glu Arg  Val Arg Trp
    1115                 1120                 1125
Ile Leu  Ala Asp Ser Asp Pro  Arg Leu Val Leu Cys  Ala Gly Thr
    1130                 1135                 1140
Thr Arg  Glu Ala Val Pro Glu  Glu Phe Ala Asp Arg  Leu Val Val
    1145                 1150                 1155
Val Asp  Glu Leu Asp Leu Ala  Gly Ser Asp Asp Ala  Gly Leu Pro
    1160                 1165                 1170
Arg Val  Ser Pro Asp Asp Ala  Ala Tyr Val Ile Tyr  Thr Ser Gly
    1175                 1180                 1185
Ser Thr  Gly Thr Pro Lys Gly  Val Val Val Ser His  Ala Gly Leu
    1190                 1195                 1200
Gly Asn  Leu Ala Met Ala Gln  Ile Asp Arg Phe Ala  Val Ser Pro
    1205                 1210                 1215
Ser Ser  Arg Val Leu Gln Phe  Ala Ala Leu Gly Phe  Asp Ala Met
    1220                 1225                 1230
Val Ser  Glu Met Leu Met Ala  Leu Leu Ser Gly Ala  Arg Leu Val
    1235                 1240                 1245
Met Ala  Pro Glu Pro Ala Leu  Pro Pro Arg Val Ser  Leu Ala Glu
    1250                 1255                 1260
Ala Leu  Arg Arg Trp Glu Val  Thr His Val Thr Val  Pro Pro Ser
    1265                 1270                 1275
Val Leu  Ala Thr Ala Asp Ala  Leu Pro Ala Gly Leu  Glu Thr Val
    1280                 1285                 1290
Val Val  Ala Gly Glu Ala Cys  Pro Pro Gly Leu Ala  Glu Arg Trp
    1295                 1300                 1305
Ser Ala  Gly Arg Arg Leu Val  Asn Ala Tyr Gly Pro  Thr Glu Ala
    1310                 1315                 1320
Thr Val  Cys Ala Ala Met Ser  Arg Pro Leu Thr Gly  Ser Arg Glu
    1325                 1330                 1335
Val Val Pro Ile Gly Thr Pro  Ile Ala Gly Gly Arg  Cys Tyr Val
    1340                 1345                 1350
Leu Asp  Ala Phe Leu Arg Pro  Leu Pro Pro Gly Ile  Thr Gly Glu
    1355                 1360                 1365
Leu Tyr  Val Ala Gly Ile Gly  Leu Ala Arg Gly Tyr  Leu Gly Arg
    1370                 1375                 1380
Ala Ser  Leu Thr Ala Glu Arg  Phe Val Ala Asp Pro  Phe Val Ala
    1385                 1390                 1395
Gly Glu  Arg Met Tyr Arg Thr  Gly Asp Leu Ala Tyr  Trp Thr Gly
    1400                 1405                 1410
Glu Gly  Glu Leu Val Phe Ala  Gly Arg Asp Asp Asp  Gln Val Lys
    1415                 1420                 1425
Ile Arg  Gly Tyr Arg Val Glu  Pro Gly Glu Val Glu  Ala Val Leu
    1430                 1435                 1440
Ala Gly  Gln Pro Gly Val Asp  Gln Ala Val Val Val  Ala Arg Glu
    1445                 1450                 1455
Gly Arg  Leu Leu Gly Tyr Val  Val Ser Gly Gly Gly  Val Asp Pro
    1460                 1465                 1470
Val Arg  Leu Arg Glu Gly Val  Ala Arg Val Leu Pro  Glu Tyr Met
    1475                 1480                 1485
Val Pro  Ala Ala Val Val Val  Leu Gly Ala Val Pro  Val Thr Ala
    1490                 1495                 1500
Asn Gly  Lys Val Asp Arg Glu  Ala Leu Pro Asp Pro  Gly Phe Gly
    1505                 1510                 1515
Gly Arg  Val Ser Gly Arg Glu  Pro Arg Thr Glu Val  Glu Arg Ala
    1520                 1525                 1530
Leu Cys  Gly Leu Phe Ala Glu  Val Leu Gly Leu Pro  Gly Val Thr
    1535                 1540                 1545
Ala Val  Gly Pro Asp Asp Ser  Phe Phe Glu Leu Gly  Gly Asp Ser
    1550                 1555                 1560
Ile Thr  Ser Met Gln Leu Ala  Ser Arg Ala Arg Arg  Glu Gly Met
    1565                 1570                 1575
Leu Phe  Gly Ala Arg Glu Val  Phe Glu Arg Lys Thr  Pro Ala Gly
    1580                 1585                 1590
Leu Ala  Ala Ile Val Asp Val  Gly Gly Glu Leu Ala  Ala Gly Pro
    1595                 1600                 1605
Ala Asp  Gly Val Gly Glu Ile  Ala Trp Thr Pro Ile  Met Arg Ala
    1610                 1615                 1620
Leu Gly  Asp Gly Ile Val Gly  Ser Arg Phe Ala Gln  Trp Val Val
    1625                 1630                 1635
Leu Gly  Ala Pro Pro Asp Leu  Arg Ala Asp Val Val  Ala Ala Gly
    1640                 1645                 1650
Leu Ala  Ala Val Val Asp Thr  His Asp Val Leu Arg  Leu Arg Val
    1655                 1660                 1665
Val Asp  Asp Arg Ala Gly Arg  Arg Leu Ala Val Gly  Glu Arg Gly
    1670                 1675                 1680
Ser Val  Asp Thr Ala Gly Leu  Val Thr Arg Leu Glu  Cys Gly Gly
    1685                 1690                 1695
Arg Pro  Pro Asp Glu Val Val  Glu Arg Ala Val Arg  Glu Ala Val
    1700                 1705                 1710
Gly Arg  Leu Asp Pro Val Ala  Gly Val Met Ala Gln  Ala Val Trp
    1715                 1720                 1725
Val Asp  Ala Gly Pro Ala Arg  Thr Gly Arg Leu Val  Val Val Val
    1730                 1735                 1740
His His  Leu Ala Val Asp Gly  Met Ser Trp Arg Ile  Leu Val Pro
    1745                 1750                 1755
Asp Leu  Arg Leu Ala Cys Glu  Ala Val Ala Glu Gly  Arg Asp Pro
    1760                 1765                 1770
Val Leu  Glu Pro Val Trp Gly  Ser Phe Arg Arg Trp  Ala Ala Leu
    1775                 1780                 1785
Leu Glu  Glu Ser Ala Leu Ser  Arg Glu Arg Val Gly  Glu Leu His
    1790                 1795                 1800
Thr Trp  Arg Thr Ile Val Asp  Gln Glu Asp Arg Pro  Val Gly Arg
    1805                 1810                 1815
Arg Arg  Leu Ser Ala Gly Asp  Ala Ala Gly Gly Val  Arg Ser Arg
    1820                 1825                 1830
Ser Trp  Val Met Ser Gly Asp  Glu Ala Ser Leu Leu  Val Gly Lys
    1835                 1840                 1845
Val Pro  Val Ala Phe His Cys  Gly Val His Glu Val  Leu Leu Ala
    1850                 1855                 1860
Gly Leu  Ala Gly Ala Val Ala  Arg Trp His Gly Asp  Asp Gly Val
    1865                 1870                 1875
Leu Val  Asp Val Glu Gly His  Gly Arg His Pro Ala  Glu Gly Met
    1880                 1885                 1890
Asp Leu  Ser Arg Thr Val Gly  Trp Phe Thr Ser Met  His Pro Val
    1895                 1900                 1905
Arg Leu  Asp Val Ala Gly Ile  Glu Leu Ala Ala Val  Pro Ala Gly
    1910                 1915                 1920
Gly Arg  Ala Ala Gly Gln Leu  Leu Lys Ala Val Lys  Glu Gln Ser
    1925                 1930                 1935
Arg Ala  Ala Pro Gly Asp Gly  Leu Gly Tyr Gly Leu  Leu Arg His
    1940                 1945                 1950
Leu Asn  Pro Glu Thr Gly Pro  Val Leu Ala Ala Leu  Pro Ser Pro
    1955                 1960                 1965
Gln Ile  Gly Phe Asn Tyr Met  Gly Arg Phe Val Thr  Val Asp Gln
    1970                 1975                 1980
Gly Gly  Ala Arg Pro Trp Gln  Pro Val Gly Gly Ile  Gly Gly Ser
    1985                 1990                 1995
Leu Asp  Pro Gly Met Gly Leu  Pro His Ala Leu Glu  Val Asn Ala
    2000                 2005                 2010
Ile Val  His Asp Arg Leu Ala  Gly Pro Glu Leu Val  Leu Thr Val
    2015                 2020                 2025
Asp Trp  Arg Asp Asp Leu Leu  Glu Glu Thr Asp Ile  Glu Arg Leu
    2030                 2035                 2040
Cys Gln  Val Trp Leu Asp Met  Leu Ser Gly Leu Ser  Arg Gln Ala
    2045                 2050                 2055
Glu Asp  Pro Ser Ala Gly Gly  His Thr Ala Ser Asp  Phe Ala Leu
    2060                 2065                 2070
Leu Asp  Leu Asp Gln Asp Glu  Ile Glu Gly Phe Glu  Ala Ile Ala
    2075                 2080                 2085
Ala Glu  Leu Ser Gly Gly Gln  Thr Ser
    2090                 2095
<210>27
<211>1063
<212>PRT
<213>野野村菌属
<400>27
Met Asn Thr Pro Ser Thr Pro Ala Gly Ser Ala Leu Glu Glu Val Trp
1               5                   10                  15
Pro Leu Ser Pro Met Gln Glu Gly Ile Leu Tyr His Ala Ala Leu Asp
            20                  25                  30
Glu Ala Pro Asp Leu Tyr Leu Ile Gln Gln Ser Gln Ile Ile Glu Gly
        35                  40                  45
Pro Leu Asp Thr Glu Arg Phe Arg Leu Ala Trp Glu Ser Leu Leu Asn
    50                  55                  60
Arg His Ala Ala Leu Arg Ala Cys Phe His Arg Arg Lys Ser Gly Glu
65                  70                  75                  80
Ser Val Gln Leu Ile Pro Arg Lys Val Pro Leu Pro Trp Ser Glu Arg
                85                  90                  95
Asp Leu Ser Gly Leu Ser Glu Glu Asp Ala Leu Ala Glu Ala Ser Val
            100                 105                 110
Ile Ala Glu Lys Glu Arg Ala Thr Arg Phe Asp Pro Ala Lys Pro Pro
        115                 120                 125
Leu Leu Arg Gln Val Leu Ile Arg Phe Gly Pro Asp Lys His Cys Leu
    130                 135                 140
Val Thr Thr Ser His His Leu Val Met Asp Gly Trp Ser Arg Ala Ile
145                 150                 155                 160
Leu Glu Ser Glu Leu Leu Glu Leu Tyr Ala Ala Gly Gly Ala Glu Pro
                165                 170                 175
Gly Leu Arg Pro Ala Gly Ser Tyr Arg Asp Tyr Leu Ala Trp Leu Glu
            180                 185                 190
Arg Gln Asp Lys Glu Ala Ala Arg Ala Ala Trp Arg Ala Glu Leu Ala
        195                 200                 205
Gly Ala Asp Arg Ser Thr Leu Gly Ile Pro Glu Ala Ser Arg Lys Thr
    210                 215                 220
Gln Gly Gln Arg Val Arg Glu Val Leu Gly Tyr Ala Pro Asp Phe Thr
225                 230                 235                 240
Ser Ala Leu Val Asp Phe Ala Arg Arg His Gly Leu Thr Leu Asn Thr
                245                 250                 255
Leu Val Gln Gly Ala Trp Ala Leu Val Leu Ala Arg Leu Thr Arg Arg
            260                 265                 270
Arg Asp Val Val Phe Gly Ala Val Val Ser Gly Arg Pro Ala Glu Val
        275                 280                 285
Pro Gly Val Glu Gln Ala Val Gly Leu Phe Ile Asn Thr Val Pro Val
    290                 295                 300
Arg Val Arg Leu Asp Gly Gly Gln Pro Val Ile Gln Leu Leu Thr Glu
305                 310                 315                 320
Leu Gln Glu Arg Gln Ser Thr Leu Ile Ser His Gln His Leu Gly Leu
                325                 330                 335
Gln Glu Ile Gln Lys Leu Ser Gly Val Ser Phe Asp Thr Val Val Ser
            340                 345                 350
Phe Glu Asn Tyr Val Asp Pro Gly Ala Gly Pro Gly Ser Asp Arg Glu
        355                 360                 365
Leu Arg Leu Arg Leu Lys Glu Phe His Gln Ser Ala Pro Tyr Ala Leu
    370                 375                 380
Leu Leu Gly Ile Met Pro Gly Glu Ser Leu Gln Thr Asp Val Glu Tyr
385                 390                 395                 400
Arg Pro Glu Leu Leu Asp Ala Arg Val Ala Lys Glu Ala Leu His Gly
                405                 410                 415
Leu Ala Arg Val Leu Glu Arg Met Ile Ala Glu Pro Glu Thr Ala Val
            420                 425                 430
Gly Arg Leu Asp Val Val Gly Asp Ala Gly Arg Glu Leu Val Val Glu
        435                 440                 445
Arg Trp Asn Glu Thr Gly Asp Ala Ile Gly Ala Pro Ser Ala Val Asp
    450                 455                 460
Leu Phe Arg Arg Gln Val Ala Arg Ala Pro Ala Ala Thr Ala Val Thr
465                 470                 475                 480
Ala Gly Asp Leu Ala Trp Ser Tyr Ala Glu Leu Asp Glu Arg Ser Gly
                485                 490                 495
Arg Leu Ala Arg Ala Leu Thr Glu Arg Gly Val Arg Arg Gly Asp Arg
            500                 505                 510
Val Gly Val Val Leu Gly Arg Ser Ala Glu Val Leu Ala Ala Trp Leu
        515                 520                 525
Gly Val Trp Lys Ala Gly Ala Ala Phe Val Pro Val Asp Pro Asp Tyr
    530                 535                 540
Pro Ala Asp Arg Val Ala Phe Met Leu Ala Asp Ser Ala Val Ala Met
545                 550                 555                 560
Val Val Cys Gln Glu Ala Thr Ser Gly Val Val Pro Pro Gly Tyr Gln
                565                 570                 575
Gln Leu Leu Val Asn Asp Ala Asp Asp Gly Glu Ala Ala Leu Val Pro
            580                 585                 590
Ile Gly Ala Asp Asp Leu Ala Tyr Val Met Tyr Thr Ser Gly Ser Thr
        595                 600                 605
Gly Thr Pro Lys Gly Val Ala Ile Pro His Gly Gly Val Ala Ala Leu
    610                 615                 620
Ala Gly Asp Pro Gly Trp Gly Val Gly Pro Gly Asp Ala Val Leu Met
625                 630                 635                 640
His Ala Pro His Thr Phe Asp Ala Ser Leu Tyr Asp Val Trp Val Pro
                645                 650                 655
Leu Val Ser Gly Ala Arg Val Met lle Thr Glu Pro Gly Val Val Asp
            660                 665                 670
Ala Glu Arg Leu Ala Gly His Val Ala Asp Gly Leu Thr Ala Val Asn
        675                 680                 685
Phe Thr Ala Gly His Phe Arg Ala Leu Ala Gln Glu Ser Pro Glu Ser
    690                 695                 700
Phe Ser Gly Leu Arg Glu Val Ala Ala Gly Gly Asp Val Val Pro Leu
705                 710                 715                 720
Asp Val Val Glu Arg Val Arg Arg Ala Cys Pro Arg Leu Arg Val Trp
                725                 730                 735
His Thr Tyr Gly Pro Thr Glu Thr Thr Leu Cys Ala Thr Trp Lys Ala
            740                 745                 750
Ile Glu Pro Gly Asp Glu Val Gly Pro Val Leu Pro Ile Gly Arg Ala
        755                 760                 765
Leu Pro Gly Arg Arg Leu Tyr Val Leu Asp Ala Phe Leu Arg Pro Leu
    770                 775                 780
Pro Pro Gly Ile Ala Gly Asp Leu Tyr Leu Ala Gly Ala Gly Val Ala
785                 790                 795                 800
His Gly Tyr Leu Gly Arg Ala Ser Leu Thr Ala Glu Arg Phe Val Ala
                805                 810                 815
Asp Pro Phe Val Ala Gly Glu Arg Met Tyr Arg Thr Gly Asp Leu Ala
            820                 825                 830
Tyr Trp Thr Gly Glu Gly Glu Leu Val Phe Ala Gly Arg Asp Asp Asp
        835                 840                 845
Gln Val Lys Ile Arg Gly Tyr Arg Val Glu Pro Gly Glu Val Glu Ala
    850                 855                 860
Val Leu Ala Gly Gln Pro Gly Val Asp Gln Ala Val Val Val Ala Arg
865                 870                 875                 880
Glu Gly Arg Leu Leu Gly Tyr Val Val Ser Gly Gly Gly Val Asp Pro
                885                 890                 895
Val Arg Leu Arg Glu Gly Val Ala Arg Val Leu Pro Glu Tyr Met Val
            900                 905                 910
Pro Ala Ala Val Val Val Leu Gly Ala Val Pro Val Thr Ala Asn Gly
        915                 920                 925
Lys Val Asp Arg Glu Ala Leu Pro Asp Pro Gly Phe Gly Gly Arg Val
    930                 935                 940
Ser Gly Arg Glu Pro Arg Thr Glu Val Glu Arg Ala Leu Cys Gly Leu
945                 950                 955                 960
Phe Ala Glu Val Leu Gly Leu Pro Gly Val Thr Ala Val Gly Pro Asp
                965                 970                 975
Asp Ser Phe Phe Glu Leu Gly Gly Asp Ser Ile His Ser Val Lys Leu
            980                 985                 990
Ala Ala Arg Ala Thr Arg Ala Gly  Met Pro Phe Thr Val  Val Glu Val
        995                 1000                 1005
Phe Glu  His Lys Thr Pro Ala  Gly Leu Ala Thr Ile  Val Asp Val
    1010                 1015                 1020
Gly Gly  Glu Pro Ala Ala Gly  Pro Ala Asp Pro Pro  Ser Asp Ser
    1025                 1030                 1035
Asp Leu  Leu Gly Leu Ala Gln  Asp Glu Ile Ala Glu  Phe Glu Ala
    1040                 1045                 1050
Glu Phe  Asp Asp Glu Arg His  Ser Leu Arg
    1055                 1060
<210>28
<211>277
<212>PRT
<213>野野村菌属
<400>28
Met Ile Ser Lys Ala Met His Gly Pro Ile Arg Pro Ala Arg Ala Asp
1               5                   10                  15
Thr Leu Leu Ala Ser Val Gly Glu Arg Gly Ile Leu Cys Asp Phe Tyr
            20                  25                  30
Asp Glu Asn Ala Ser Glu Ile Phe Arg Asp Leu Glu Ala Asp Ala Gly
        35                  40                  45
Gly Thr Glu Glu Ala His Gly Phe Ala Ala Leu Val Arg Pro Glu Ser
    50                  55                  60
Gly Ala Ile Leu Glu Leu Gly Ala Gly Thr Gly Arg Leu Thr Ile Pro
65                  70                  75                  80
Leu Leu Glu Leu Gly Trp Glu Val Thr Ala Leu Glu Leu Ser Thr Ala
                85                  90                  95
Met Leu Thr Thr Leu Arg Thr Arg Leu Ala Asp Ala Pro Ala Asp Leu
            100                 105                 110
Arg Asp Arg Cys Thr Leu Val His Ala Asp Met Thr Ala Phe Lys Leu
        115                 120                 125
Gly Glu Arg Phe Gly Thr Ala Ile Leu Ser Pro Ser Thr Ile Asp Leu
    130                 135                 140
Leu Asp Asp Ala Asp Arg Pro Gly Leu Tyr Ser Ser Val Arg Glu His
145                 150                 155                 160
Leu Arg Pro Gly Gly Arg Phe Leu Leu Gly Met Ala Asn Pro Asp Ala
                165                 170                 175
Ser Gly Arg Gln Glu Pro Leu Glu Arg Thr Gln Glu Phe Thr Gly Arg
            180                 185                 190
Ser Gly Arg Arg Tyr Val Leu His Ala Lys Val Tyr Pro Ser Glu Glu
        195                 200                 205
Ile Arg Asp Val Thr Ile His Pro Ala Asp Glu Ser Ala Asp Pro Phe
    210                 215                 220
Val Ile Cys Val Asn Arg Phe Arg Val Ile Thr Pro Asp Gln Ile Ala
225                 230                 235                 240
Arg Glu Leu Glu Gln Ala Gly Phe Asp Val Val Ala Arg Thr Pro Leu
                245                 250                 255
Pro Gly Val Arg Asn His Glu Leu Val Leu Glu Ala Gln Trp Gly Ser
            260                 265                 270
Val Glu Asp Ala His
        275
<210>29
<211>531
<212>PRT
<213>野野村菌属
<400>29
Met Ser Glu Glu Leu Leu Phe Leu Arg Pro Asp Thr Ile Ile Glu Pro
1               5                   10                  15
Leu Ala Asn Arg Phe Tyr Ala Ser Met Tyr Ala Thr Ala Pro Val Thr
            20                  25                  30
Ala Ala Met Asn Leu Ala Phe Arg Asn Leu Pro Met Leu Glu Ser Tyr
        35                  40                  45
Leu Ala Ser Pro Glu Trp His Phe Ala Ala Ala Arg Asp Pro Lys Phe
    50                  55                  60
Arg Gly Gly Phe Phe Val Asn Ile Glu Glu Gln Arg Lys Asn Glu Val
65                  70                  75                  80
Glu Ala Leu Leu Ala Ala Ile Arg Arg Asp Ser Ala Asp Val Leu Arg
                85                  90                  95
Phe Ala Glu Ala Ile Ala Glu Ala Glu Lys Ile Ile Arg Glu Glu Ala
            100                 105                 110
Thr Gly Tyr Asp Leu Arg Pro Leu Tyr Pro Lys Leu Pro Pro Glu Leu
        115                 120                 125
Ser Gly Leu Val Glu Ile Ala Tyr Asp Thr Gly Asn Ala Ala Ser Leu
    130                 135                 140
His Phe Leu Glu Pro Leu Ile Tyr Lys Ser Lys Ala Tyr Ala Glu Asp
145                 150                 155                 160
Cys Gln Ser Val Gln Leu Ser Val Glu Thr Gly Ile Glu Arg Pro Phe
                165                 170                 175
Val Met Ser Thr Pro Arg Leu Pro Ser Pro Asp Val Leu Glu Leu Asn
            180                 185                 190
Ile Pro Phe Arg His Pro Gly Leu Glu Glu Leu Phe Leu Ser Arg Ile
        195                 200                 205
Arg Pro Thr Thr Leu Ala Ala Leu Arg Glu Ala Leu Glu Leu Gly Asp
    210                 215                 220
Ala Glu Ala Ala Arg Leu Ala Asp Leu Leu Val Pro Glu Pro Ser Leu
225                 230                 235                 240
Ala Ser Asp Arg His Val Ala Ala Gly Ala Arg Ile Arg Tyr Trp Gly
                245                 250                 255
His Ala Cys Leu Leu Met Gln Thr Pro Asp Val Ala Ile Met Thr Asp
            260                 265                 270
Pro Phe Ile Ser Ala Asp Thr Asp Ala Thr Gly Arg Tyr Thr Tyr Asn
        275                 280                 285
Asp Leu Pro Asp Arg Leu Asp Tyr Val Leu Ile Thr His Gly His Ser
    290                 295                 300
Asp His Leu Val Pro Glu Thr Leu Leu Gln Leu Arg Gly Arg Val Gly
305                 310                 315                 320
Thr Phe Val Val Pro Arg Thr Ser Arg Gly Asn Leu Cys Asp Pro Ser
                325                 330                 335
Leu Ala Leu Tyr Leu Arg Ser Phe Gly Leu Pro Ala Ile Glu Val Asp
            340                 345                 350
Asp Phe Asp Glu Ile Glu Phe Pro Gly Gly Lys Ile Val Ser Thr Pro
        355                 360                 365
Phe Phe Gly Glu His Ala Asp Leu Asp Ile Arg Ala Lys Ser Thr Tyr
    370                 375                 380
Trp Ile Asn Leu Gly Gly Lys Ser Ile Trp Val Gly Ala Asp Ser Ser
385                 390                 395                 400
Gly Leu Asp Pro Val Leu Tyr Arg His Ile Arg Arg His Leu Gly Ala
                405                 410                 415
Val Asn Ile Ala Phe Leu Gly Met Glu Cys Asp Gly Ala Pro Leu Asn
            420                 425                 430
Trp Gln Tyr Gln Pro Phe Ile Thr Lys Ala Leu Pro Lys Lys Met Ser
        435                 440                 445
Asp Ser Arg Lys Met Ser Gly Ser Asn Ala Glu Gln Ala Gly Ala Ile
    450                 455                 460
Val Thr Glu Leu Gly Ala Glu Glu Ala Tyr Ile Tyr Ala Met Gly Glu
465                 470                 475                 480
Glu Ser Trp Leu Gly His Val Met Ala Thr Ser Tyr Asn Glu Asp Ser
                485                 490                 495
Tyr Gln Leu Gln Gln Ile Ala Glu Phe Glu Ala Trp Cys Ser Arg Lys
            500                 505                 510
Gly Val Lys Ala Ala His Leu Leu Asp Gln His Glu Trp His Trp Ser
        515                 520                 525
Ser Ser Arg
    530
<210>30
<211>523
<212>PRT
<213>野野村菌属
<400>30
Met Thr Gly Gly Thr Gly Ala Asp Ala Ala Ser Ala Gly Ala Ser Ser
1               5                   10                  15
Thr Arg Pro Glu Leu Arg Gly Glu Arg Cys Leu Pro Pro Ala Gly Pro
            20                  25                  30
Val Lys Val Thr Pro Asp Asp Pro Arg Tyr Leu Asn Leu Lys Leu Arg
        35                  40                  45
Gly Ala Asn Ser Arg Phe Asn Gly Glu Pro Asp Tyr Ile His Leu Val
    50                  55                  60
Gly Ser Thr Gln Gln Val Ala Asp Ala Val Glu Glu Thr Val Arg Thr
65                  70                  75                  80
Gly Lys Arg Val Ala Val Arg Ser Gly Gly His Cys Phe Glu Asp Phe
                85                  90                  95
Val Asp Asn Pro Asp Val Lys Val Ile Ile Asp Met Ser Leu Leu Thr
            100                 105                 110
Glu Ile Ala Tyr Asp Pro Ser Met Asn Ala Phe Leu Ile Glu Pro Gly
        115                 120                 125
Asn Thr Leu Ser Glu Val Tyr Glu Lys Leu Tyr Leu Gly Trp Asn Val
    130                 135                 140
Thr Ile Pro Gly Gly Val Cys Gly Gly Val Gly Val Gly Gly His Ile
145                 150                 155                 160
Cys Gly Gly Gly Tyr Gly Pro Leu Ser Arg Gln Phe Gly Ser Val Val
                165                 170                 175
Asp Tyr Leu Tyr Ala Val Glu Val Val Val Val Asn Lys Gln Gly Lys
            180                 185                 190
Ala Arg Val Ile Val Ala Thr Arg Glu Arg Asp Asp Pro His His Asp
        195                 200                 205
Leu Trp Trp Ala His Thr Gly Gly Gly Gly Gly Asn Phe Gly Val Val
    210                 215                 220
Thr Lys Tyr Trp Met Arg Val Pro Glu Asp Val Gly Arg Asn Pro Glu
225                 230                 235                 240
Arg Leu Leu Pro Lys Pro Pro Ala Thr Leu Leu Thr Ser Thr Val Thr
                245                 250                 255
Phe Asp Trp Ala Gly Met Thr Glu Ala Ala Phe Ser Arg Leu Leu Arg
            260                 265                 270
Asn His Gly Glu Trp Tyr Glu Arg Asn Ser Gly Pro Asp Ser Pro Tyr
        275                 280                 285
Thr Gly Leu Trp Ser Gln Leu Met Ile Gly Asn Glu Val Pro Gly Met
    290                 295                 300
Gly Glu Ser Gly Phe Met Met Pro Ile Gln Val Asp Ala Thr Arg Pro
305                 310                 315                 320
Asp Ala Arg Arg Leu Leu Asp Ala His Ile Glu Ala Val Ile Asp Gly
                 325                 330                 335
Val Pro Pro Ala Glu Val Pro Glu Pro Ile Glu Glu Arg Trp Leu Ala
            340                 345                 350
Ser Thr Pro Gly Arg Gly Gly Arg Gly Pro Ala Ser Lys Thr Lys Ala
        355                 360                 365
Gly Tyr Leu Arg Lys Arg Leu Thr Asp Arg Gln Ile Gln Ala Val Tyr
    370                 375                 380
Glu Asn Met Thr His Met Asp Gly Ile Asp Tyr Gly Ala Val Trp Leu
385                 390                 395                 400
Ile Gly Tyr Gly Gly Lys Val Asn Thr Val Asp Pro Ala Ala Thr Ala
                405                 410                 415
Leu Pro Gln Arg Asp Ala Ile Leu Lys Val Asn Tyr Ile Thr Gly Trp
            420                 425                 430
Ala Asn Pro Gly Asn Glu Ala Lys His Leu Thr Trp Val Arg Lys Leu
        435                 440                 445
Tyr Ala Asp Val Tyr Ala Glu Thr Gly Gly Val Pro Val Pro Asn Asp
    450                 455                 460
Val Ser Asp Gly Ala Tyr Ilo Asn Tyr Pro Asp Ser Asp Leu Ala Asp
465                 470                 475                 480
Pro Gly Leu Asn Thr Ser Gly Val Pro Trp His Asp Leu Tyr Tyr Lys
                485                 490                 495
Gly Asn His Pro Arg Leu Arg Lys Val Lys Ala Ala Tyr Asp Pro Arg
            500                 505                 510
Asn His Phe His His Ala Leu Ser Ile Arg Pro
        515                 520
<210>31
<211>141
<212>PRT
<213>野野村菌属
<400>31
Met Thr Ser Thr Ser Gly Arg His Leu Tyr His Arg Gln Val Arg Phe
1               5                   10                  15
Ser Asp Ile Asp Ala His Gly His Val Asn Asn Val Arg Phe Leu Glu
            20                  25                  30
Tyr Leu Glu Asp Ala Trp Ile Ala Leu Tyr Leu Asp Asn Ala Gly Pro
        35                  40                  45
Pro Gln Glu Asp Arg Asp Gly Leu Pro Ala Val Gly Phe Ala Val Val
    50                  55                  60
Arg His Glu Ile Phe Tyr Arg Arg Pro Leu Arg Phe Arg His Gly Ser
65                  70                  75                  80
Val Arg Val Glu Ser Trp Val Thr Lys Val Asn Arg Val Thr Cys Glu
                85                  90                  95
Met Ala Ala Gln Ile Cys Ser Asp Gly Glu Val Phe Val Glu Ala Arg
            100                 105                 110
Ser Met Ile Met Gly Phe Asp Thr His Thr Ala Lys Pro Arg Arg Leu
        115                 120                 125
Thr Leu His Glu Arg Thr Phe Leu Lys Arg Tyr Leu Arg
    130                 135                 140
<210>32
<211>372
<212>PRT
<213>野野村菌属
<400>32
Met Gly Val Asp Val Ser Met Thr Thr Ser Ile Ala Ser Ala Glu Asp
1               5                   10                  15
Leu Ser Val Leu Thr Gly Leu Ser Glu Ile Thr Thr Phe Ala Gly Val
            20                  25                  30
Gly Thr Ala Val Ser Ala Thr Ser Tyr Ser Gln Ala Glu Leu Leu Glu
        35                  40                  45
Ile Leu Asp Ile Arg Asp Pro Arg Ile Arg Ser Leu Phe Leu Asn Ser
    50                  55                  60
Ala Ile Glu Arg Arg Phe Leu Ala Leu Pro Pro Gln Gly Arg Asp Gly
65                  70                  75                  80
Glu Arg Val Ala Glu Pro Gln Gly Asp Leu Leu Asp Lys His Lys Lys
                85                  90                  95
Leu Ala Val Asp Met Gly Cys Arg Ala Leu Glu Ser Cys Leu Lys Ser
            100                 105                 110
Ala Gly Ala Thr Leu Ser Asp Val Arg His Leu Cys Cys Val Thr Ser
        115                 120                 125
Thr Gly Phe Leu Thr Pro Gly Leu Ser Ala Leu Ile Ile Arg Glu Leu
    130                 135                 140
Gly Leu Asp Pro His Cys Ser Arg Ala Asp Ile Val Gly Met Gly Cys
145                 150                 155                 160
Asn Ala Gly Leu Asn Ala Leu Asn Leu Val Ala Gly Trp Ser Ala Ala
                165                 170                 175
His Pro Gly Glu Leu Ala Val Val Leu Cys Ser Glu Ala Cys Ser Ala
            180                 185                 190
Ala Tyr Ala Leu Asp Gly Thr Met Arg Thr Ala Val Val Asn Ser Leu
        195                 200                 205
Phe Gly Asp Gly Ser Ala Ala Leu Ala Val Val Ser Gly Asp Gly Arg
    210                 215                 220
Ala Ala Gly Pro Arg Val Leu Lys Phe Ala Ser Tyr Val Ile Thr Asp
225                 230                 235                 240
Ala Ile Glu Ala Met Arg Tyr Asp Trp Asp Arg Asp Gln Asp Arg Phe
                245                 250                 255
Ser Phe Phe Leu Asp Pro Gln Ile Pro Tyr Val Val Gly Ala His Ala
            260                 265                 270
Glu Ile Val Val Asp Lys Leu Leu Ser Gly Thr Gly Leu Arg Arg Ser
        275                 280                 285
Asp Ile Gly His Trp Leu Val His Ser Gly Gly Lys Lys Val Ile Asp
    290                 295                 300
Ala Ile Val Val Asn Leu Gly Leu Ser Arg His Asp Val Arg His Thr
305                 310                 315                 320
Thr Ala Val Leu Arg Asp Tyr Gly Asn Leu Ser Ser Gly Ser Phe Leu
                325                 330                 335
Phe Ser Tyr Glu Arg Leu Ala Gly Glu Gly Val Thr Arg Pro Gly Asp
            340                 345                 350
Tyr Gly Val Leu Met Thr Met Gly Pro Gly Ser Thr Ile Glu Thr Ala
        355                 360                 365
Leu Ile Gln Trp
    370
<210>33
<211>213
<212>PRT
<213>野野村菌属
<400>33
Met Asn Gly Glu Leu Glu Leu Ser Leu Asp Gly Thr Gln Ala Leu Thr
1               5                   10                  15
Ala Ser Val Glu Glu Leu Asn Gly Leu Cys Asp Arg Ala Glu Asp His
            20                  25                  30
Arg Ala Pro Gly Pro Val Ile Val His Val Thr Gly Val Pro Arg Leu
        35                  40                  45
Gly Trp Ser Lys Gly Leu Thr Val Gly Leu Val Ser Lys Trp Glu Arg
    50                  55                  60
Val Val Arg Arg Phe Glu Arg Leu Gly Arg Leu Thr Val Ala Val Ala
65                  70                  75                  80
Ser Gly Asp Cys Ala Gly Pro Ser Leu Asp Leu Leu Leu Ala Ala Asp
                85                  90                  95
Val Arg Ile Ala Ala Pro Ala Thr Arg Leu Leu Pro Ser Trp Ala Gly
            100                 105                 110
Gly Ala Ala Trp Pro Gly Met Ala Val Tyr Arg Leu Thr Gln Gln Ala
        115                 120                 125
Gly Thr Gly Gly Ile Arg Arg Ala Val Leu Leu Gly Ala Pro Ile Asp
    130                 135                 140
Ala Asp Arg Ala Leu Ala Leu Asn Leu Ile Asp Glu Val Ser Ala Asp
145                 150                 155                 160
Pro Ala Ala Ser Leu Ala Gly Leu Ala Gly Ala Gly Asp Gly Ala Glu
                165                 170                 175
Leu Ala Ile Arg Arg Gln Leu Met Phe Glu Ala Ser Ser Thr Thr Phe
            180                 185                 190
Glu Asp Ala Leu Gly Ala His Leu Ala Ala Val Asp Arg Ala Leu Arg
        195                 200                 205
Arg Glu Thr Leu Ser
    210
<210>34
<211>434
<212>PRT
<213>野野村菌属
<400>34
Met Thr Thr Asp Trp Pro Ala Leu Pro Pro Arg Ala Pro Leu Ala Leu
1               5                   10                  15
Trp Thr Leu Thr Ala Glu Ala Gln Arg Val Asp Asp Leu Leu Ala Gly
            20                  25                  30
Leu Pro Glu Pro Pro Ala Arg Thr Ser Ala Gln Arg Asp Ala Ala Ala
        35                  40                  45
Ser Ala Leu Asp Lys Val Arg Arg Met Arg Ala Asp Tyr Met Glu Ala
    50                  55                  60
His Ala Glu Glu Ile Tyr Gly Glu Leu Thr Ser Gly Arg Thr Arg His
65                  70                  75                  80
Leu Arg Ile Asp Glu Leu Val Arg Ala Ala Ala Arg Ala Tyr Pro Gly
                85                  90                  95
Leu Val Pro Thr Asp Glu Gln Met Ala Ala Glu Arg Ala Arg Pro Gln
            100                 105                 110
Ala Glu Lys Glu Gly Arg Glu Ile Asp Gln Gly Ile Phe Leu Arg Gly
        115                 120                 125
Val Leu Arg Ala Pro Lys Ala Gly Pro His Leu Leu Asp Ala Met Leu
    130                 135                 140
Arg Pro Thr Pro Arg Ala Leu Glu Leu Leu Pro Glu Phe Ile Glu Ser
145                 150                 155                 160
Gly Glu Val Arg Met Glu Ala Val Leu Leu Arg Arg Arg Asp Gly Val
                165                 170                 175
Ala Tyr Leu Thr Leu Cys Arg Asp Asp Cys Leu Asn Ala Glu Asp Ala
            180                 185                 190
Gln Gln Val Asp Asp Met Glu Thr Ala Val Asp Leu Ala Leu Leu Asp
        195                 200                 205
Pro Gln Val Arg Val Gly Leu Leu Arg Gly Gly Glu Met Ser His Pro
    210                 215                 220
Arg Tyr Arg Gly Arg Arg Val Phe Cys Ala Gly Val Asn Leu Lys Lys
225                 230                 235                 240
Leu Ser Ser Gly Asp Ile Ser Leu Val Asp Phe Leu Leu Arg Arg Glu
                245                 250                 255
Leu Gly Tyr Ile His Lys Ile Val Arg Gly Val Tyr Thr Asp Gly Ser
            260                 265                 270
Trp His Ser Lys Leu Thr Asp Lys Pro Trp Met Ala Val Val Asp Ser
        275                 280                 285
Phe Ala Ile Gly Gly Gly Ala Gln Leu Leu Leu Val Phe Asp Gln Val
    290                 295                 300
Leu Ala Ala Ser Asp Ser Tyr Ile Ser Leu Pro Ala Ala Thr Glu Gly
305                 310                 315                 320
Ile Ile Pro Gly Val Ala Asn Tyr Arg Leu Thr Arg Phe Thr Gly Pro
                325                 330                 335
Arg Ala Ala Arg Gln Met Ile Leu Gly Gly Arg Arg Ile Arg Ala Asp
            340                 345                 350
Glu Pro Asp Ala Arg Leu Met Ile Asp Glu Val Val Pro Pro Glu Glu
        355                 360                 365
Met Asp Ala Ala Ile Asp Arg Ala Leu Ala Arg Leu Asp Gly Asp Ala
    370                 375                 380
Val Pro Ala Asn Arg Arg Met Leu Asn Leu Ala Glu Glu Pro Pro Glu
385                 390                 395                 400
Ala Phe Gly Arg Tyr Leu Ala Glu Phe Ala Leu Gln Gln Ala Leu Arg
                405                 410                 415
Ile Tyr Gly Arg Asp Val Ile Gly Lys Val Gly Arg Phe Ala Ala Gly
            420                 425                 430
Ser Ala
<210>35
<211>265
<212>PRT
<213>野野村菌属
<400>35
Met Ser Glu Pro Arg Val Arg Tyr Glu Lys Lys Glu His Val Ala His
1               5                   10                  15
Val Thr Met Asn Arg Pro His Val Leu Asn Ala Met Asp Arg Arg Met
            20                  25                  30
His Glu Glu Leu Ala Glu Ile Trp Asp Asp Val Glu Ala Asp Asp Asp
        35                  40                  45
Val Arg Thr Val Val Leu Thr Gly Ala Gly Thr Arg Ala Phe Ser Val
    50                  55                  60
Gly Gln Asp Leu Lys Glu Arg Ala Leu Leu Asp Glu Ala Gly Thr Gln
65                  70                  75                  80
Ala Ser Thr Phe Gly Ser Arg Gly Gln Ala Gly His Pro Arg Leu Thr
                85                  90                  95
Asp Arg Phe Thr Leu Ser Lys Pro Val Val Ala Arg Val His Gly Tyr
            100                 105                 110
Ala Leu Gly Gly Gly Phe Glu Leu Val Leu Ala Cys Asp Leu Val Ile
        115                 120                 125
Ala Ser Glu Glu Ala Val Phe Gly Leu Pro Glu Val Arg Leu Gly Leu
    130                 135                 140
Ile Pro Gly Ala Gly Gly Val Phe Arg Leu Pro Arg Gln Leu Pro Gln
145                 150                 155                 160
Lys Val Ala Met Gly His Leu Leu Thr Gly Arg Arg Met Asp Ala Ala
                165                 170                 175
Thr Ala Phe Arg Tyr Gly Leu Val Asn Glu Val Val Pro Leu Asp Glu
            180                 185                 190
Leu Asp Arg Cys Val Ala Gly Trp Thr Asp Asp Leu Val Arg Ala Ala
        195                 200                 205
Pro Leu Ser Val Arg Ala Ile Lys Glu Ala Ala Met Arg Ser Leu Asp
    210                 215                 220
Ilo Pro Leu Glu Glu Ala Phe Thr Thr Ser Tyr Pro Trp Glu Glu Arg
225                 230                 235                 240
Arg Arg Arg Ser Gly Asp Ala Ile Glu Gly Val Arg Ala Phe Val Glu
                245                 250                 255
Lys Arg Asp Pro Val Trp Thr Ser Arg
            260                 265
<210>36
<211>428
<212>PRT
<213>野野村菌属
<400>36
Met Ile Pro Pro His Thr Leu Leu Val Phe Phe Val Gln Ala Ala Ala
1               5                   10                  15
Leu Leu Leu Leu Ala Leu Leu Leu Gly Arg Leu Ala Val Arg Leu Gly
            20                  25                  30
Leu Ala Ala Val Val Gly Glu Leu Cys Ala Gly Val Ile Leu Gly Pro
        35                  40                  45
Ser Val Leu Gly Gln Val Ala Pro Gly Ala Glu Gln Trp Leu Phe Pro
    50                  55                  60
Ser Pro Ser Ser His Met Leu Asp Ala Val Gly Gln Leu Gly Val Leu
65                  70                  75                  80
Leu Leu Ile Gly Leu Thr Gly Ala His Leu Asp Leu Arg Leu Ile Arg
                85                  90                  95
Arg Gln Gly Ala Thr Ala Val Arg Val Ser Ala Phe Gly Leu Val Val
            100                 105                 110
Pro Met Ala Leu Gly Ile Gly Ala Gly Leu Leu Leu Pro Ala Glu Phe
        115                 120                 125
Arg Gly Thr Gly Gly Ser Ala Val Phe Ala Leu Phe Leu Gly Val Thr
    130                 135                 140
Met Cys Val Ser Ser Ile Pro Val Ile Ala Lys Thr Leu Met Asp Met
145                 150                 155                 160
Asn Leu Leu His Arg Asn Val Gly Gln Leu Thr Leu Thr Ala Gly Met
                165                 170                 175
Ile Asp Asp Ala Phe Gly Trp Val Leu Leu Ser Val Val Thr Ala Met
            180                 185                 190
Ala Thr Ala Gly Ala Gly Ala Gly Thr Val Val Leu Ser Ile Ala Ser
        195                 200                 205
Leu Leu Gly Val Ile Val Phe Ser Val Val Ile Gly Arg Pro Ala Val
    210                 215                 220
Arg Val Ala Leu Arg Thr Thr Glu Asp Gln Gly Val Ile Ala Gly Gln
225                 230                 235                 240
Val Val Val Leu Val Leu Ala Ala Ala Ala Gly Thr His Ala Leu Gly
                245                 250                 255
Leu Glu Pro Ile Phe Gly Ala Phe Val Ala Gly Leu Leu Val Ser Thr
            260                 265                 270
Ala Met Pro Asn Pro Val Arg Leu Ala Pro Leu Arg Thr Val Thr Leu
        275                 280                 285
Gly Val Leu Ala Pro Leu Tyr Phe Ala Thr Met Gly Leu Arg Val Asp
    290                 295                 300
Leu Thr Ala Leu Ala Arg Pro Glu Val Leu Ala Val Gly Leu Leu Val
305                 310                 315                 320
Leu Ala Leu Ala Ile Ile Gly Lys Phe Leu Gly Ala Phe Leu Gly Ala
                325                 330                 335
Trp Thr Ser Arg Leu Ser Arg Trp Glu Ala Leu Ala Leu Gly Ala Gly
            340                 345                 350
Met Asn Ala Arg Gly Val Ile Gln Met Ile Val Ala Thr Val Gly Leu
        355                 360                 365
Arg Leu Gly Val Ile Thr Asp Glu Ile Phe Thr Ile Ile Ile Val Val
    370                 375                 380
Ala Val Ile Thr Ser Leu Leu Ala Pro Pro Leu Leu Arg Leu Ala Met
385                 390                 395                 400
Thr Arg Ile Glu Ala Thr Ala Glu Glu Glu Ala Arg Leu Leu Ala Tyr
                405                 410                 415
Gly Leu Arg Pro Gly Glu Ala Arg Glu Asp Val Arg
            420                 425
<210>37
<211>251
<212>PRT
<213>野野村菌属
<400>37
Met Ser Thr Trp Phe Arg Cys Phe Asp Arg Arg Pro Leu Ala Thr Met
1               5                   10                  15
Arg Leu Ile Cys Phe Pro His Ala Gly Gly Ser Ala Val Phe Tyr Arg
            20                  25                  30
Asn Trp His Arg Leu Ala Ala Pro Glu Ile Glu Val His Ala Val Gln
        35                  40                  45
Tyr Pro Gly Arg Ala Asp Arg Leu His Glu Pro Leu Val Gly Asp Ala
    50                  55                  60
His Arg Leu Ala Glu Ser Val Gly Arg Glu Leu Arg Pro Leu Leu Asp
65                  70                  75                  80
Arg Pro Val Ala Leu Phe Gly His Ser Met Gly Ser Leu Ile Ala Tyr
                85                  90                  95
Glu Thr Ala Arg Leu Leu Thr Gly Ser Gly Ile Pro Pro Ala His Leu
            100                 105                 110
Phe Val Ser Gly Gly Val Ala Ala His Asp Arg Gly Arg Leu Ala His
        115                 120                 125
Arg Val Ala Pro Ala Ser Glu Glu Ala Leu Ile Asp Arg Leu Arg Leu
    130                 135                 140
Leu Gly Gly Thr Asp Ala Glu Ala Leu Ala Ser Ala Glu Phe Arg Ala
145                 150                 155                 160
Phe Ala Leu Pro Tyr Val Arg Asn Asp Phe Gln Leu Val Gln Ser Tyr
                165                 170                 175
Arg His Thr Pro Gly Pro Pro Leu Thr Val Pro Ile Thr Ala Phe Thr
            180                 185                 190
Gly Ala Asp Asp Pro Val Val Arg Leu Asp Ala Val Ala Arg Trp Ala
        195                 200                 205
Glu Leu Thr Ala Arg Glu Phe Ser Cys His Val Leu Pro Gly Gly His
    210                 215                 220
Phe Phe Leu Gly His Glu Gln Ala Ala Leu Trp Ala His Leu His Ala
225                 230                 235                 240
Arg Leu Gly Ile Ala Thr Pro Ala His Cys Gly
                245                 250
<210>38
<211>428
<212>PRT
<213>野野村菌属
<400>38
Met Asp Ser His Val Leu Ala His Gln Leu Ser Lys Glu Thr Leu His
1               5                   10                  15
Gly Ser Leu Met Asp Pro Ala Ile Glu Ser Met Asn Leu Leu Asn Glu
            20                  25                  30
Ile Ala Gly Asn Tyr Pro Asp Ala lle Ser Met Ala Ala Gly Arg Pro
        35                  40                  45
Tyr Glu Glu Phe Phe Asp Val Gly Leu Ile His Asp Tyr Leu Glu Ala
    50                  55                  60
Tyr Arg Asp His Leu Arg Asn Asp Arg Arg Met Asp Asp Ala Gly Ile
65                  70                  75                  80
Ser Arg Met Leu Phe Gln Tyr Gly Thr Thr Lys Gly Ile Ile Ser Asp
                85                  90                  95
Leu Val Ala Arg His Leu Ala Glu Asp Glu Asn Ile Glu Ala Asp Pro
            100                 105                 110
Ala Ser Val Val Ile Thr Val Gly Phe Gln Glu Ala Met Phe Leu Val
        115                 120                 125
Leu Arg Ala Leu Arg Ala Asn Glu Arg Asp Val Leu Leu Ala Pro Thr
    130                 135                 140
Pro Thr Tyr Val Gly Leu Thr Gly Ala Ala Leu Leu Thr Asp Thr Pro
145                 150                 155                 160
Val Trp Pro Val Gln Ser Thr Asp Asn Gly Ile Asp Leu Asp His Leu
                165                 170                 175
Glu His Gln Leu Lys Arg Ala Gln Asp Gln Gly Ala Arg Val Arg Ala
            180                 185                 190
Cys Tyr Val Thr Pro Asn Phe Ala Asn Pro Thr Gly Thr Ser Met Asp
        195                 200                 205
Leu Pro Ala Arg His Arg Leu Leu Glu Val Ala Ala Ala His Gly Ile
    210                 215                 220
Leu Ile Leu Glu Asp Asn Ala Tyr Gly Leu Leu Gly Gln Asp Arg Leu
225                 230                 235                 240
Pro Thr Leu Lys Ser Leu Asp His Ala Ala Thr Val Val Tyr Leu Gly
                245                 250                 255
Ser Phe Ala Lys Thr Gly Met Pro Gly Ala Arg Val Gly Tyr Val Val
            260                 265                 270
Ala Asp Gln His Val Ala Gly Gly Gly Ser Leu Ala Asp Glu Leu Ala
        275                 280                 285
Lys Leu Lys Gly Met Leu Thr Val Asn Thr Ser Pro Ile Ala Gln Ala
    290                 295                 300
Val Ile Ala Gly Lys Leu Leu Arg His Asp Phe Ser Leu Ala Arg Ala
305                 310                 315                 320
Asn Ala Arg Glu Thr Ala Ile Tyr Gln Arg Asn Leu His Leu Thr Leu
                325                 330                 335
Asp Glu Leu Thr Arg Arg Leu Gly Ala Val Pro Gly Val Thr Trp Asn
            340                 345                 350
Ala Pro Thr Gly Gly Phe Phe Ile Thr Val Thr Val Pro Phe Val Val
        355                 360                 365
Asp Asp Glu Leu Leu Glu His Ala Ala Arg Asp His Gly Val Leu Phe
    370                 375                 380
Thr Pro Met His His Phe Tyr Gly Gly Lys Asp Gly Phe Asn Gln Leu
385                 390                 395                 400
Arg Leu Ser Ile Ser Leu Leu Asn Pro Gln Leu Ile Glu Glu Gly Val
                405                 410                 415
Ser Arg Leu Ala Gly Leu Val Thr Ala Cys Leu Pro
            420                 425
<210>39
<211>18
<212>DNA
<213>合成的
<400>39
atgcgcgtgt tgatctcg                                                  18
<210>40
<211>18
<212>DNA
<213>合成的
<400>40
cggctgaccg cggcgaac                                                  18
<210>41
<211>20
<212>DNA
<213>合成的
<400>41
cgtgggggtg gatgtatcga                                                20
<210>42
<211>17
<212>DNA
<213>合成的
<400>42
tcaccattgg atcagcg                                                   17
<210>43
<211>18
<212>DNA
<400>43
tcaggagacg aaccccgc                                                  18
<210>44
<211>18
<212>DNA
<213>合成的
<400>44
gtgcacgaaa gtcccgtc                                                  18
<210>45
<211>18
<212>DNA
<213>合成的
<400>45
atggactccc acgttctc                                                  18
<210>46
<211>18
<212>DNA
<213>合成的
<400>46
tcaggggaga catgcggt                                                   18
<210>47
<211>29
<212>DNA
<213>合成的
<400>47
ttttgaattc tcaggcgatc cgtccgtct                                       29
<210>48
<211>31
<212>DNA
<213>合成的
<400>48
tttttctaga gcccggacac ccgggggctg a                                    31
<210>49
<211>31
<212>DNA
<213>合成的
<400>49
tttttctaga agtcatggtg atgtgcgaca t                                    31
<210>50
<211>30
<212>DNA
<213>合成的
<400>50
ttttaagctt atgttgcagg acgccgaccg                                      30

Claims (29)

1.分离的核酸,该核酸包括选自下列的核苷酸序列:
a)dbv基因簇(SEQ ID NO:1),该基因簇编码合成A40926所需的多肽;
b)核苷酸序列,该核苷酸序列与dbv基因簇(SEQ ID NO:1)编码相同的多肽,而不同于dbv基因簇的核苷酸序列;
c)dbv ORF 1至37中的任何核苷酸序列,该核苷酸序列编码多肽SEQ ID NO:2至38;
d)核苷酸序列,该核苷酸序列与dbv ORF 1至37中任何一个ORF编码相同的多肽(SEQ ID NO:2至38),而不同于所述ORF的核苷酸序列。
2.权利要求1的分离的核酸,该核酸包括选自下列的核苷酸序列:
e)dbv ORF 3至4、6至10、18至20、22至23、29至30、以及36(SEQ ID NO:4至5、7至11、19至21、23至24、30至31、以及37)中任何一个核苷酸序列;
f)核苷酸序列,该核苷酸序列与dbv ORF 3至4、6至10、18至20、22至23、29至30、以及36中任何一个编码相同的多肽(SEQ IDNO:4至5、7至11、19至21、23至24、30至31、以及37),而不同于所述ORF的核苷酸序列;
g)核苷酸序列,该核苷酸序列编码的多肽与dbv ORF 3、6至9、18至20、22至23、29至30、以及36中的任何一个编码的多肽(SEQID NO:4、7至10、19至21、23至24、30至31、以及37)在氨基酸序列中具有至少80%、优选86%、更优选90%、最优选95%或以上的同一性;
h)核苷酸序列,该核苷酸序列编码的多肽与dbv ORF 4和10中的任何一个编码的多肽(SEQ ID NO:5和11)在氨基酸序列中具有至少87%、优选90%、更优选95%或以上的同一性。
3.权利要求2的分离的核酸,包括核苷酸序列的组合,所述核苷酸序列编码合成A40926的4-羟苯甘氨酸残基所需的多肽,由dbv ORF1、2、5和37(SEQ ID NO:2、3、6和38)组成;或编码相同多肽的核苷酸序列,而不同于所述ORF核苷酸序列。
4.权利要求2的分离的核酸,包括核苷酸序列的组合,所述核苷酸序列编码合成A40926的3,5-二羟苯甘氨酸残基所需的多肽,由dbvORF 30至34、以及37(SEQ ID NO:31至35、以及38)组成;或编码相同多肽的核苷酸序列,而不同于所述ORF核苷酸序列。
5.权利要求2的分离的核酸,包括核苷酸序列的组合,所述核苷酸序列编码合成A40926的七肽骨架所需的多肽,由dbv ORF 16、17、25、26和36(SEQ ID NO:17至18、26至27、以及37)组成;或编码相同多肽的核苷酸序列,而不同于所述ORF核苷酸序列。
6.权利要求2的分离的核酸,包括核苷酸序列,所述核苷酸序列编码氯化A40926的氨基酸3和6的芳族残基所需的多肽,由dbv ORF10(SEQ ID NO:11)组成;或编码相同多肽的核苷酸序列,而不同于所述ORF核苷酸序列。
7.权利要求2的分离的核酸,包括核苷酸序列,所述核苷酸序列编码A40926的氨基酸6酪氨酸残基的β-羟基化作用所需的多肽,由dbv ORF 28(SEQ ID NO:29)组成;或编码相同多肽的核苷酸序列,而不同于所述ORF核苷酸序列。
8.权利要求2的分离的核酸,包括核苷酸序列的组合,所述核苷酸序列编码在A40926位置2和4、4和6、1和3、以及5和7处的氨基酸芳族残基交联所需的多肽,由dbv ORF 11至14(SEQ ID NO:12至15)组成;或编码相同多肽的核苷酸序列,而不同于所述ORF核苷酸序列。
9.权利要求2的分离的核酸,包括核苷酸序列的组合,所述核苷酸序列编码A40926N-酰基葡糖醛酸胺残基的加成及形成所需的多肽,由ORF 9、23和29(SEQ ID NO:10、24和30)组成;或编码相同多肽的核苷酸序列,而不同于所述ORF核苷酸序列。
10.权利要求2的分离的核酸,包括核苷酸序列,所述核苷酸序列编码A40926甘露糖残基的附着所需的多肽,由ORF 20(SEQ ID NO:21)组成;或编码相同多肽的核苷酸序列,而不同于所述ORF核苷酸序列。
11.权利要求2的分离的核酸,包括核苷酸序列,所述核苷酸序列编码A40926的N-甲基化所需的多肽,由ORF 27(SEQ ID NO:28)组成;或编码相同多肽的核苷酸序列,而不同于所述ORF核苷酸序列。
12.权利要求2的分离的核酸,包括核苷酸序列的组合,所述核苷酸序列编码A40926或一些其部分前体向细胞质外的输出、以及赋予生产性菌株对A40926的抗性所需的多肽,由ORF 7、18、19、24和35(SEQ ID NO:8、19至20、25和36)组成;或编码相同多肽的核苷酸序列,而不同于所述ORF核苷酸序列。
13.权利要求2的分离的核酸,包括核苷酸序列的组合,所述核苷酸序列编码调节dbv基因簇的一个或多个基因表达所需的多肽,由ORF 3、4、6和22(SEQ ID NO:4、5、7和23)组成;或编码相同多肽的核苷酸序列,而不同于所述ORF核苷酸序列。
14.权利要求1的分离的核酸,包括由dbv基因簇组成的核苷酸序列,所述dbv基因簇编码A40926的合成所需的多肽,其中,在编码附着甘露糖残基所需多肽的核苷酸序列中引入框内缺失。
15.权利要求1的分离的核酸,包括携带dbv ORF 1至37(SEQ IDNO:2至38)中至少一个的至少一个额外拷贝的核苷酸序列,或包括与所述dbvORF编码的相同多肽的核苷酸序列,而不同于所述dbv ORF的核苷酸序列。
16.权利要求1至15中任何一项的分离的核酸,其核苷酸序列为DNA序列。
17.重组DNA载体,该载体包括如权利要求1至15中任何一项所定义的DNA序列。
18.权利要求17的重组载体,该载体为ESAC载体。
19.以权利要求17或18中任何一项的载体转化的宿主细胞。
20.权利要求19的转化的宿主细胞,该细胞属于放线菌目,优选属于链孢囊菌科、小单孢菌科、假诺卡氏菌科或链霉菌科,更优选属于野野村菌属、游动放线菌属、拟无枝酸菌属、链霉菌属等。
21.通过能够经生物合成途径产生A40926或其前体的微生物增加A40926生产的方法,所述方法包括:
a)以权利要求17的重组DNA载体转化经生物合成途径产生A40926或A40926前体的微生物,其中,所述DNA载体编码所述途径中限速的活性的表达;
b)在适于细胞生长、所述基因表达以及所述抗生素或抗生素前体产生的条件下,培养以所述载体转化的微生物。
22.产生A40926或其前体或衍生物的转化的微生物,其基因组中的A40926生物合成基因经过权利要求15的核苷酸序列的插入而修饰。
23.产生A40926或其前体或衍生物的方法,该方法包括培养权利要求22的转化的A40926生产性微生物。
24.转化的A40926生产性微生物,其基因组中具有A40926生物合成基因,其中,至少一个选自dbv ORF 1至37(SEQ ID NO:2至38)的A40926生物合成基因被破坏。
25.权利要求24的转化的微生物,其中被破坏的生物合成基因是参与甘露糖残基附着的基因。
26.产生A40926前体或衍生物的方法,该方法包括权利要求24的转化的A40926生产性微生物。
27.产生不同于A40926或其前体的糖肽的方法,该方法在于:
a)(i)以重组DNA载体转化微生物,该微生物通过生物合成途径产生有别于A40926或其前体的糖肽或糖肽前体,所述载体或其部分包括权利要求1至13中任何一项的一个或多个核苷酸序列,编码一个或多个修饰所述糖肽或糖肽前体的多肽的表达;以及(ii)在适于细胞生长、所述基因表达以及所述抗生素或抗生素前体产生的条件下,培养以所述载体转化的微生物;
b)(i)以重组DNA载体转化微生物,所述的载体包括权利要求1至13中任何一项的一个或多个核苷酸序列,编码一个或多个修饰所述糖肽或糖肽前体的多肽(活性多肽),所述微生物选自不产生糖肽或糖肽前体、并且可以有效表达引入的核苷酸序列的微生物;(ii)在适于活性多肽存在的条件下,制备所述微生物的细胞提取物或细胞级分,所述细胞提取物或细胞级分至少含有所述的活性多肽;以及(iii)将糖肽或糖肽前体添加到所述细胞提取物或细胞级分中,并在所述的活性多肽可以修饰该糖肽或糖肽前体的条件下温育所述混合物。
28.分离的多肽,包括参与A40926生物合成途径的多肽序列,该多肽序列选自
a)由dbv ORF 1至37(SEQ ID NO:2至38)中任何一项编码的ORF多肽,或者与由dbv ORF 1至37(SEQ ID NO:2至38)中任何一项编码、优选由dbv ORF 3至4、6至10、18至20、22至23、29至30(SEQ ID NO:4至5、7至11、19至21、23至24、30至31、以及37)中任何一项编码的ORF多肽氨基酸序列相同的多肽;
b)多肽,该多肽与由dbv ORF 3、6至9、18至20、22至23、29至30、以及36(SEQ ID NO:4、7至10、19至21、23至24、30至31、以及37)中任何一项编码的多肽氨基酸序列具有至少80%、优选86%、更优选90%、最优选95%或以上的同一性;以及
c)多肽,该多肽与由ORF 4和10(SEQ ID NO:5和11)中任何一项编码的多肽氨基酸序列具有至少87%、优选90%、更优选95%或以上的同一性。
29.分离的多肽,包括参与A40926生物合成途径的多肽,选自由权利要求3至16中任何一项核酸编码的多肽。
CNA2003801074110A 2002-10-23 2003-10-15 生物合成糖肽类抗生素a40926的基因及蛋白 Pending CN1732263A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP20020023597 EP1413626A1 (en) 2002-10-23 2002-10-23 Genes and proteins for the biosynthesis of the glycopeptide antibiotic A40926
EP02023597.4 2002-10-23

Publications (1)

Publication Number Publication Date
CN1732263A true CN1732263A (zh) 2006-02-08

Family

ID=32050001

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2003801074110A Pending CN1732263A (zh) 2002-10-23 2003-10-15 生物合成糖肽类抗生素a40926的基因及蛋白

Country Status (8)

Country Link
US (1) US20080145892A1 (zh)
EP (2) EP1413626A1 (zh)
JP (1) JP2006516885A (zh)
KR (1) KR20050050146A (zh)
CN (1) CN1732263A (zh)
AU (1) AU2003294693A1 (zh)
CA (1) CA2501393A1 (zh)
WO (1) WO2004038025A2 (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102234675A (zh) * 2010-04-29 2011-11-09 上海医药工业研究院 野野村放线菌发酵生产a40926的发酵培养基以及发酵方法
CN103361345A (zh) * 2013-06-15 2013-10-23 福州大学 重组调控生物元器件强化次级代谢产物生物合成的方法
CN105671110A (zh) * 2015-05-05 2016-06-15 重庆乾泰生物医药有限公司 一种生产达巴万星前体a40926的方法
CN107226845A (zh) * 2017-05-31 2017-10-03 成都雅途生物技术有限公司 一种抗多重耐药菌的化合物yt‑011及其制备方法
CN104036155B (zh) * 2014-05-30 2018-01-05 四川大学 抗菌肽抗菌活性预测方法及抗菌肽
CN110036107A (zh) * 2016-10-11 2019-07-19 蓝鸟生物公司 TCRα归巢核酸内切酶变体
CN112625925A (zh) * 2021-01-08 2021-04-09 浙江大学 一种达巴万星前体a40926b0高产菌株及应用

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109946398B (zh) * 2019-03-28 2022-05-24 丽珠集团新北江制药股份有限公司 一种检测达巴万星及其杂质的方法
CN112430608B (zh) * 2020-12-04 2022-03-25 浙江大学 一种构建奥利万星前体高产工程菌的方法及应用

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB8425685D0 (en) * 1984-10-11 1984-11-14 Lepetit Spa Antibiotic a 40926 complex
GB8621912D0 (en) * 1986-09-11 1986-10-15 Lepetit Spa Increasing ratio of components of anti-biotic complex
IL140021A0 (en) 1998-06-23 2002-02-10 Biosearch Italia Spa Methods for transferring the capability to produce a natural product into a suitable production host

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102234675A (zh) * 2010-04-29 2011-11-09 上海医药工业研究院 野野村放线菌发酵生产a40926的发酵培养基以及发酵方法
CN102234675B (zh) * 2010-04-29 2014-08-27 上海医药工业研究院 野野村放线菌发酵生产a40926的发酵培养基以及发酵方法
CN103361345A (zh) * 2013-06-15 2013-10-23 福州大学 重组调控生物元器件强化次级代谢产物生物合成的方法
CN104036155B (zh) * 2014-05-30 2018-01-05 四川大学 抗菌肽抗菌活性预测方法及抗菌肽
CN105671110A (zh) * 2015-05-05 2016-06-15 重庆乾泰生物医药有限公司 一种生产达巴万星前体a40926的方法
CN105671110B (zh) * 2015-05-05 2019-02-01 重庆乾泰生物医药有限公司 一种生产达巴万星前体a40926的方法
CN110036107A (zh) * 2016-10-11 2019-07-19 蓝鸟生物公司 TCRα归巢核酸内切酶变体
CN107226845A (zh) * 2017-05-31 2017-10-03 成都雅途生物技术有限公司 一种抗多重耐药菌的化合物yt‑011及其制备方法
CN107226845B (zh) * 2017-05-31 2020-10-09 成都雅途生物技术有限公司 一种抗多重耐药菌的化合物yt-011及其制备方法
CN112625925A (zh) * 2021-01-08 2021-04-09 浙江大学 一种达巴万星前体a40926b0高产菌株及应用
CN112625925B (zh) * 2021-01-08 2022-04-19 浙江大学 一种达巴万星前体a40926b0高产菌株及应用

Also Published As

Publication number Publication date
WO2004038025A3 (en) 2004-07-29
JP2006516885A (ja) 2006-07-13
KR20050050146A (ko) 2005-05-27
CA2501393A1 (en) 2004-05-06
EP1578972A2 (en) 2005-09-28
WO2004038025A2 (en) 2004-05-06
EP1413626A1 (en) 2004-04-28
US20080145892A1 (en) 2008-06-19
AU2003294693A1 (en) 2004-05-13

Similar Documents

Publication Publication Date Title
CN1277843C (zh) 分枝杆菌比较基因组学作为鉴定分枝杆菌病的诊断、预防或治疗靶的工具
CN1977046A (zh) 编码参与普拉地内酯生物合成的多肽的dna
KR20020091820A (ko) 신규한 폴리뉴클레오타이드
CN1298447A (zh) 生产刺糖噻杀虫剂所用的生物合成基因
AU2008285655B2 (en) Thiopeptide precursor protein, gene encoding it and uses thereof
US20140038297A1 (en) Genes and Proteins for the Biosynthesis of the Lantibiotic 107891
CN1263855C (zh) 来自淡青链霉菌的假寡糖生物合成基因的分离及其应用
CN1732263A (zh) 生物合成糖肽类抗生素a40926的基因及蛋白
CN1514880A (zh) 生产依马菌素的方法和组合物
CA2386587C (en) Genes and proteins for the biosynthesis of anthramycin
CA2387401C (en) Compositions, methods and systems for the production of enediynes
US20060269994A1 (en) Non-ribosomal peptide synthetases and associated biosynthetic genes
CN1257282C (zh) 南寡霉素生物合成基因簇
CN1190444C (zh) 南昌霉素生物合成基因簇
US20070172909A1 (en) Non-ribosomal peptide synthetases and associated biosynthetic genes
CN1194012C (zh) 精子生成相关蛋白、其编码序列及用途
RU2441915C9 (ru) Гены и белки для биосинтеза лантибиотика 107891
CN1349560A (zh) 除虫菌素糖苷配基合成酶基因
CA2445687C (en) Compositions, methods and systems for the discovery of enediyne natural products
CN1711355A (zh) 参与螺旋霉素生物合成的多肽、编码这些多肽的核苷酸序列及其应用

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Open date: 20060208