CN1774447B - 肺炎链球菌抗原 - Google Patents

肺炎链球菌抗原 Download PDF

Info

Publication number
CN1774447B
CN1774447B CN200480010200XA CN200480010200A CN1774447B CN 1774447 B CN1774447 B CN 1774447B CN 200480010200X A CN200480010200X A CN 200480010200XA CN 200480010200 A CN200480010200 A CN 200480010200A CN 1774447 B CN1774447 B CN 1774447B
Authority
CN
China
Prior art keywords
antibody
antigen
streptococcus pneumoniae
nucleic acid
fragment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN200480010200XA
Other languages
English (en)
Other versions
CN1774447A (zh
Inventor
A·迈因克
E·纳吉
M·汉纳
S·德瓦陶伊
U·施蒂尔施奈德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Valneva Austria GmbH
Original Assignee
Intercell Austria AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Intercell Austria AG filed Critical Intercell Austria AG
Publication of CN1774447A publication Critical patent/CN1774447A/zh
Application granted granted Critical
Publication of CN1774447B publication Critical patent/CN1774447B/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/315Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Streptococcus (G), e.g. Enterococci
    • C07K14/3156Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Streptococcus (G), e.g. Enterococci from Streptococcus pneumoniae (Pneumococcus)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/02Bacterial antigens
    • A61K39/09Lactobacillales, e.g. aerococcus, enterococcus, lactobacillus, lactococcus, streptococcus
    • A61K39/092Streptococcus
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/04Antibacterial agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P37/00Drugs for immunological or allergic disorders
    • A61P37/02Immunomodulators
    • A61P37/04Immunostimulants
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P43/00Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/689Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Abstract

本发明公开了编码超免疫血清反应性抗原或其片段的分离的核酸分子以及来自肺炎链球菌的超免疫血清反应性抗原或其片段,分离这种抗原的方法及其具体应用。

Description

肺炎链球菌抗原
本发明涉及分离的编码肺炎链球菌(Streptococcus pneumoniae)抗原的核酸分子,所述抗原适合用于制备预防和治疗由肺炎链球菌引起的细菌感染的药物。
肺炎链球菌(肺炎球菌属)是小刀状、革兰氏阳性的、兼性厌氧的细菌。它是作为人类和实验性动物病原的仅有的具有荚膜的生物。荚膜是抗原性的,并且形成通过血清型对肺炎球菌分类的基础。基于它们与类型特异性抗血清的反应,已经鉴定了90个血清型。已经显示大多数肺炎链球菌血清型造成严重的疾病,并且估计十个最常见的血清型对全世界的约62%的侵入性疾病负责。分类和血清型流行随年龄组和地理区域而不同。
肺炎球菌是呼吸道常见的寄居物,并且可以从5%-70%的正常成人的鼻咽分离。无症状带菌者的比率随年龄、环境和上呼吸道感染的存在而变化。仅有5%-10%的没有孩子的成年人是带菌者。在学校和孤儿院,27%-58%的学生和居民可以是带菌者。在军事设施上,多至50%-60%的服务人员可以是带菌者。带菌者的延续时间是变化的,并且通常在儿童中延续时间比在成年人中的时间更长(综述于Epidemiology and Prevention ofVaccine-Preventable Diseases,第7版,第二次印刷The Pink Book)。
对带菌者与天然免疫性之间的关系了解的很少。此外,对使疾病发生在带菌者中的免疫机制了解的很少。
肺炎链球菌是在生命阶段的尽头的人类疾病和在具有潜在疾病的那些人中的重要试剂。与所有其它可疫苗预防的疾病的组合相比,肺炎球菌性疾病造成了更多的人死亡-在美国每年约有40,000或更多。肺炎球菌性疾病的主要临床综合征包括肺炎、菌血症和脑膜炎。当诱病条件存在时,,疾病最经常发生,特别是肺病。其是一种常见的先行病毒性呼吸道感染的细菌性并发症,诸如流行性感冒和麻疹,以及慢性疾病的常见细菌性并发症,诸如慢性阻塞性肺病、糖尿病、充血性心脏衰竭、肾衰竭、烟熏和醇中毒。在呼吸疾病更加流行的冬季和早春,肺炎球菌的感染更为常见。免疫缺陷(脾功能异常、医原(iatrogen)等)是形成致命肺炎球菌感染的风险因子,因为其减少了细菌清除率和缺乏抗体。培养阶段很短,1-3天。症状包括突然发烧和恶寒战栗或强直、排痰性咳、胸膜炎胸痛、呼吸困难(dyspnoe)、心动过速和缺氧。
肺炎链球菌是造成美国88%菌血症感染的原因。肺炎是侵入性肺炎球菌性疾病的最常见的形式:150.000-570.000病例/年(美国)。36%的成年人群体获得性肺炎和50%的医院获得性肺炎是由肺炎链球菌引起的(美国)。已经报道在65岁和65岁以上的成年人中疾病的发病率是~60病例/100.000。这种疾病的病例致死率从对于两岁或更年幼的那些的1.4%增加到在80岁或更年长的那些中的20.6%。由流行性感冒和肺炎球菌引起的疾病在一起成为导致65岁及以上的人的第五大死亡原因。在这个年龄组中,可归因于这些病原体的死亡率超过90%。菌血症发生在约25-30%的患有肺炎的患者中。菌血症的总死亡率是约20%,但是在更年长的人中可以高达60%。在1998年,可归因于侵入性肺炎球菌性疾病的所有死亡的51%发生在超过65岁的年龄组中。在美国,肺炎球菌是造成所有细菌性脑膜炎病例中13%-19%的原因。估计每年有3,000-6,000肺炎球菌性脑膜炎病例发生。1/4的患有肺炎球菌性脑膜炎的患者也患有肺炎。临床症状、脊柱液体指数和神经并发症与脓性细菌脑膜炎的其它形式类似(综述于Epidemiology and Prevention of Vaccine-Preventable Diseases,7thEdition-Second Printing,The Pink Book)。
在儿童中,肺炎球菌是急性中耳炎的常见原因,并且在28%-55%的中耳吸出物中检测得到。到12个月龄时,62%的儿童已经至少有一次急性中耳炎的发作。中耳感染是美国儿科出诊最频繁的原因,每年导致2千万的出诊。肺炎球菌性中耳炎的并发症可以包括乳突炎和脑膜炎。在<2周岁的儿童中,没有已知位点感染的菌血症是最常见的侵入性临床表现,在这个年龄组中,约占侵入性疾病的70%。在小于2周岁的儿童中,菌血症性肺炎占侵入性肺炎球菌性疾病的12%-16%。随着侵入性Hib疾病的下降,肺炎链球菌已经成为美国小于5周岁的儿童中细菌性脑膜炎最主要的原因。小于1周岁的儿童具有最高的肺炎球菌性脑膜炎的发病率,约为10病例/100,000人口。在小于5周岁的儿童中,肺炎球菌性疾病的负担是明显的。估计每年发生17,000例侵入性疾病,其中13,000是没有已知感染位点的菌血症,并且约700是脑膜炎。估计每年有200个儿童死于侵入性肺炎球菌性疾病。即使不考虑侵入性疾病,估计每年有5百万例的急性中耳炎发生在小于5周岁的儿童中。(综述于Epidemiology and Preventionof Vaccine-Preventable Diseases,第7版,第二次印刷,The Pink Book)。
肺炎链球菌感染的确定诊断通常依赖于从血液或其它正常无菌的身体部位对生物的分离。还可进行测试以检测体液中荚膜多糖抗原。
青霉素是治疗的选择药物。但是因为广谱的抗菌的抗性,成功进行抗感染治疗已经变得越来越困难。对青霉素的抗性正在增加,并且根据最近的报道,其在美国达到了~25%{Whitney,C.等,2000}。抗大环内酯的菌株的比率达到了~20%{Hyde,T.等,2001}。抗菌剂的应用与肺炎链球菌对@内酰胺和大环内酯的抗性的增加具有高度相关性{McCormick,A.等,2003}。
然而,甚至用有效的抗生素治疗(敏感菌株),侵入性疾病的病例致死率在发达国家中高达平均10%,并且对于某些血清型,在更年长的患者中和在菌血症或脑膜炎的病例中可以更高(高达80%)。
因此,仍然需要有效的治疗以预防或改善肺炎球菌(spneumoococcal)性感染。疫苗不仅能预防链球菌引起的感染,而且更特殊地预防或改善宿主组织(例如,在鼻咽中)的建群,由此减少上呼吸道感染和其它化脓性感染,诸如中耳炎的发病率。消除侵入性疾病-肺炎、菌血症和脑膜炎以及脓毒症将是减少急性感染发病率和生物携带的直接后果。能够显示交叉保护作用的疫苗将对于预防或改善由所有其它链球菌物种,即组A、B、C和G的引起感染是有用的,所述交叉保护作用是针对大多数导致人感染的肺炎链球菌菌株的。
疫苗可包含全部各种不同抗原。抗原的实例是被完全灭活或减毒的生物体、这些生物体/组织的亚组分、蛋白质,或者,它们最简单的形式-肽。抗原还可以糖基化的蛋白质或肽的形式被免疫系统所识别,而且还可是或者包含多糖或脂质。可以使用短肽,因为例如细胞毒性T细胞(CTL)识别通常形式短至8-11个氨基酸长的肽且与主要组织相容性复合体(MHC)结合的抗原。B-细胞可识别4-5个氨基酸短的线性表位以及三维结构(构象表位)。为了获得持续不变的抗原特异性免疫应答,需要用佐剂引发涉及免疫系统所有细胞的免疫级联反应。主要地,佐剂是作用于所谓的抗原呈递细胞(APCs),但不局限于其作用形式。这些细胞通常首先遇到抗原,然后将加工过或未修饰过的抗原呈递于免疫效应细胞上。还可涉及中间细胞类型。只有具有适当特异性的效应子细胞可在生产性免疫应答中被激活。佐剂还可局部保留抗原以及共注射的其它因子。此外,佐剂可用作其它免疫细胞的化学引诱物或可局部的和/或全身性地用作免疫系统的刺激剂。
早在1911年,就开始尝试开发有效的肺炎球菌疫苗。然而,随着青霉素在19世纪40年代的出现,对所述疫苗的兴趣下降,直到观察到尽管用抗生素治疗仍旧有很多患者死亡。到60年代末期,再次尝试开发多价疫苗。首个肺炎球菌疫苗包含来自14个不同类型肺炎球菌细菌的纯化的荚膜多糖抗原。在1983年,23价的多糖疫苗(PPV23)得到许可并且取代了不再生产的14价疫苗。PPV23包含来自23个类型的肺炎球菌细菌的多糖抗原,所述细菌导致88%的菌血症的肺炎球菌性疾病。此外,对于一些占菌血症疾病另外8%的荚膜类型,交叉反应性发生。在美国可得到两种多糖疫苗(Pneumovax 23,Merck,和Pnu-Immune 23,Wyeth-Lederle)。两种疫苗都包含25μg的每种抗原/剂量并且包括苯酚或硫柳汞作为防腐剂。
在2000年,首个肺炎球菌性缀合疫苗(PCV7,Prevnar)在美国得到许可。其包括与已知为CRM197的白喉毒素的非毒性变体缀合的肺炎链球菌的7个血清型(4、9V、14、19F、23F、18C和6B)的纯化的荚膜多糖。在1978-1994年间,在小于6周岁的儿童中,包括在Prevnar中的所述血清型导致86%的菌血症,83%的脑膜炎和65%的急性中耳炎(综述于Epidemiology and Prevention of Vaccine-Preventable Diseases,7thEdition-Second Printing,The Pink Book)。正在开发包含肺炎链球菌的9和11个血清型的另外的肺炎球菌多糖缀合物疫苗。将所述疫苗进行肌内施用。在施用4剂量的Prevnar疫苗后,实际上所有健康的婴儿形成针对包含在疫苗中的所有7种血清型的抗体。Prevnar也已经显示在包括患有镰形细胞疾病和HIV感染的那些的婴儿和儿童中具有免疫原性。在大临床实验中,Prevnar显示减少了由疫苗血清型引起的侵入性疾病和减少了由包括不在疫苗中的血清型的所有的血清型引起的侵入性疾病。与未接种疫苗的儿童相比,接受Prevnar的儿童具有更少的急性中耳炎发作并且经历更少的鼓膜造孔术管放置。目前尚不知道在Prevnar后的保护延续时间。用Prevnar进行的免疫减少了疫苗血清型的鼻咽携带率,而总携带率未受影响。不幸的是,其已经显示减少了血清型的再分配,即,用Prevnar没有覆盖的菌株对疫苗血清型进行替代{Pelton,S.等,2003}。
推荐将肺炎球菌性疫苗常规地施用于i.,所有的儿童,所述疫苗作为常规儿童时期(shildhood)免疫程序表的一部分,ii.,65岁及65岁以上的成年人以及iii.,具有正常免疫系统并患有慢性疾病的大于2岁的人,所述慢性疾病包括心血管疾病、肺病、糖尿病、醇中毒、硬化,或脑脊髓液体渗漏。在过了中年的群体中,肺炎球菌疫苗的目标组和流行性感冒疫苗组重叠。这些疫苗可以在相同的时间不同的部位给药,而不会增加副作用。
甚至在用有效的抗生素治疗时,在高风险个体中(具有潜在疾病-主要是病毒性呼吸感染、无免疫应答)观察到高致死率。MAb方法靶向具有严重疾病的患者并且提供进行细菌清除的立即免疫增强。通过调理作用,细菌在噬菌细胞中被杀死并且没有被抗生素溶解在血液中。这种机制可以有助于去除使败血症患者的临床状况恶化的毒素(诸如肺炎球菌溶血素和其它的细胞毒素)的释放。在单克隆抗体生产技术中的最近进展提供产生人抗体试剂和再引入抗体疗法的方式,从而避免与血清疗法关联的毒性。
免疫球蛋白是具有非常多种分类的抗菌蛋白,可以将其用于预防和治疗正在出现的感染性疾病。针对许多种不同的微生物,抗体疗法已经显示是有效的,在{Burnie,J.等,1998}中综述。
虽然已经显示荚膜特异性抗体是高度保护性的,但是仍不清楚这些血清型特异性抗体防护疾病的浓度为何,并且就在最近,变得清楚的是这些抗体的调理活性和亲和力是比浓度更关键的保护决定子。
毫无疑问,在针对肺炎球菌性疾病的战斗中,蛋白质缀合的疫苗是对amarmatorium的重大的新的增加,但是疫苗包含有限量的肺炎球菌性血清型,并且考虑到足够的生态压力,由非疫苗血清型引起的替代疾病仍然是现实的威胁,特别是在具有非常高的疾病负担的区域中。
在过去十年中,一些肺炎球菌蛋白质的免疫原性和保护能力已经在动物模型中有所描述,并且目前正在探索这些以开发基于常见物种的蛋白质的疫苗。这些蛋白质是肺炎球菌表面蛋白质A(PspA,{McDaniel,L.等,1991};{Roche,H.等,2003}),肺炎球菌表面粘附素A(PsaA,{Talkington,D.等,1996}),胆碱结合蛋白质A(CbpA,{Rosenow,C.等1997}),LytB氨基葡糖苷酶(glucosaminidase),LytC溶菌酶,PrtA丝氨酸蛋白酶,PhtA(三联组氨酸A)和肺炎球菌疫苗抗原A (PvaA){Wizemann,T.等,2001};{Adamou,J.等,2001}。
在革兰氏阳性生物的表面上显示的某些蛋白质或酶是有效促成发病机理的因素,并且可以涉及由这些病原引起的疾病过程。这些蛋白质经常涉及与宿主组织的直接相互作用或涉及conceiling来自宿主防御机制的细菌表面{Navarre,W.等,1999}。在这点上,肺炎链球菌不是例外。一些表面蛋白的特征在于作为毒力因子,所述毒力因子对于肺炎球菌病原性是重要的,在{Jedrzejas,M.,2001}中综述。如果这些蛋白质的抗体能够提供对人类更好的保护,它们能够提供新的、基于蛋白质的肺炎球菌疫苗的来源以用在结合或替代更传统的荚膜多糖疫苗中。作为潜在疫苗的抗原的一些上述蛋白质以及许多在{DiGuilmi,A.等,2002}中综述的另外的候选者的应用主要是得自基于鉴别的容易性或获得的机会进行选择的结果。需要以更全面的方式鉴定肺炎链球菌的相关抗原。
本发明人开发了一种方法用于鉴定、分离和产生来自具体病原体,特别是来自金黄色葡萄球菌(Staphylococcus aureus)和表皮葡萄球菌(Staphylococcus epidermidis)的超免疫血清反应性抗原(WO 02/059148)。不过,由于生物学特性、致病功能和遗传背景的差异,肺炎链球菌与葡萄球菌菌株是显著不同的。重要的是,用于鉴定来自肺炎链球菌的抗原的血清选择与应用于金黄色葡萄球菌筛选的血清选择是不同的。为此目的收集三种主要类型的人血清。首先,针对肺炎链球菌的鼻咽携带,检测年龄小于45周岁且优选家庭中有幼儿的健康成人。大部分幼儿是肺炎链球菌的带菌者,且就其家庭成员而言他们被认为是一接触源。基于相关资料,保护性(建群中和)抗体有可能存在于非肺炎链球菌带菌者的被暴露的个体中(在家庭中具有高携带率的儿童)。为了选择相应的血清来源,用细菌裂解物和培养物上清蛋白质进行检测抗肺炎链球菌IgG和IgA抗体水平的一系列ELISA。在基于基因组的抗原鉴定中包括来自高效价非带菌者的血清。用于人血清选择的这种方法基本上与针对金黄色葡萄球菌的方法明显不同,其中携带或非携带状态不能与抗体水平联系起来。其次,以相同方式表征和选择患有侵入性肺炎球菌性疾病的恢复期患者的血清样品。还从患有侵入性疾病的个体中获得包含纵向收集的样品的第三组血清,且主要将其用于证实的目的。这种收集的主要价值是可以在发病(diase)(prae)之前,在发作(急性)时和在恢复过程中(恢复期)中遵循抗原特异性抗体水平中的变化。后一组帮助选择表位,其在疾病过程中诱导抗体,并在疾病之前诱导抗体缺失。
两个细菌物种肺炎链球菌和金黄色葡萄球菌自身的基因组显示出了许多重要的差异。肺炎链球菌的基因组含大约2.16Mb,而金黄色葡萄球菌含2.85Mb。它们的平均GC含量分别为39.7和33%且大约30-45%的编码基因在这两个病原体之间不是共有的。此外,这两个细菌物种繁殖需要不同的生长条件和培养基。肺炎链球菌是严格的人类病原体,而还发现金黄色葡萄球菌可感染一系列温血动物。下文中提供了可由所述的两种病原体造成的一系列最主要的疾病。金黄色葡萄球菌主要引起医院感染、机会感染:脓疱病、滤泡炎、脓肿、疖子、被感染的伤口、心内膜炎、脑膜炎、脓毒性关节炎、肺炎、骨髓炎、皮肤烫伤综合征(SSS)、中毒性休克综合征。肺炎链球菌主要引起群落获得性感染:上呼吸道感染(咽炎、中耳炎)和下呼吸道感染(肺炎)以及菌血症、脓毒病和脑膜炎。
通过随机鸟枪法测序策略来确定命名为TIGR4的肺炎链球菌荚膜血清型4分离物的完全基因组序列(GenBank登录号AE005672;见www.tigr.org/tigrscripts/CMR2/CMRHomePage.spl)。该临床分离物来自Kongsvinger,Norway的一位30岁男性患者的血液,并且在小鼠模型的感染中具有高度侵入性和毒力。
构成本发明基础的问题是提供用于开发药物诸如针对肺炎链球菌感染的疫苗的方法。更具体而言,此问题是提供可用于所述药物制备的来自肺炎链球菌的一套有效、相关和全面的核酸分子或超免疫血清反应性抗原。
因此,本发明提供了编码超免疫血清反应性抗原或其片段的分离的核酸分子,该核酸包含选自由下列各项组成的组中的核酸序列:
a)与选自Seq ID No 1,101-144的核酸分子具有至少70%序列同一性的核酸分子
b)与a)的核酸分子互补的核酸分子,
c)包含a)或b)的核酸分子的至少15个连续碱基的核酸分子,
d)在严紧杂交条件下与a)、b)或c)的核酸分子退火的核酸分子,
e)若非遗传密码的简并性,与a)、b)、c)或d)中所定义的核酸分子杂交的核酸分子。
依照本发明优选的实施方案,序列同一性至少是80%,优选至少95%,尤其是100%。
此外,本发明提供了编码超免疫血清反应性抗原或其片段的分离的核酸分子,该核酸包含选自由下列各项组成的组的核酸序列:
a)与选自Seq ID No 2-6、8、10-16、18-23、25-31、34、36、38-42、44、47-48、51、53、55-62、64、67、71-76、78-79、81-94、96-100的核酸分子具有至少96%的序列同一性的核酸分子,
b)与a)的核酸分子互补的核酸分子,
c)包含a)或b)的核酸分子的至少15个连续碱基的核酸分子,
d)在严紧杂交条件下与a)、b)或c)的核酸分子退火的核酸分子,
e)若非遗传密码的简并性,与a)、b)、c)或d)中所定义的核酸杂交的核酸分子。
根据另一方面,本发明提供了包含核酸序列的分离的核酸分子,所述核酸序列选自由下列各项组成的组:
a)选自Seq ID No 9、17、24、32、37、43、52、54、65-66、70、80的核酸分子。
b)与a)的核酸互补的核酸分子,
c)若非遗传密码的简并性,与a)、b)、c)或d)中所定义的核酸杂交的核酸分子。
优选地,核酸分子是DNA或RNA。
依照本发明的优选实施方案,核酸分子分离自基因组DNA,尤其是来自肺炎链球菌的基因组DNA。
依照本发明,提供了含有按照本发明任一方面的核酸分子的载体。
在优选的实施方案中,所述载体适用于由按照本发明的核酸分子编码的超免疫血清反应性抗原或其片段的重组表达。
本发明还提供了含有按照本发明的所述载体的宿主细胞。
根据另一方面,本发明进一步提供了包含由按照本发明的核酸分子编码的氨基酸序列的超免疫血清反应性抗原。
在优选的实施方案中,氨基酸序列(多肽)选自由Seq ID No 145,245-288组成的组中。
在另一优选的实施方案中,氨基酸序列(多肽)选自由Seq ID No146-150、152、154-160、162-167、169-175、178、180、182-186、188、191-192、195、197、199-206、208、211、215-220、222-223、225-238、240-244组成的组中。
在另一优选的实施方案中,氨基酸序列(多肽)选自由Seq ID No 153、161、168、176、181、187、196、198、209-210、214、224组成的组中。
根据另一方面,本发明提供了超免疫血清反应性抗原的片段,其选自由下述组成的组中:包含表1“预测的免疫原性氨基酸”和“已鉴定的免疫原性区域的定位”栏的氨基酸序列的肽;表2的血清反应性表位,尤其是含以下氨基酸的肽:Seq ID No 145的第4-11位、35-64位、66-76位、101-108位、111-119位和57-114位;Seq ID No 146的第5-27位、32-64位、92-102位、107-113位、119-125位、133-139位、148-162位、177-187位、195-201位、207-214位、241-251位、254-269位、285-300位、302-309位、317-324位、332-357位、365-404位、411-425位、443-463位、470-477位、479-487位、506-512位、515-520位、532-547位、556-596位、603-610位、616-622位、624-629位、636-642位、646-665位、667-674位、687-692位、708-720位、734-739位、752-757位、798-820位、824-851位、856-865位和732-763位;Seq ID No 147的第14-21位、36-44位、49-66位、102-127位、162-167位、177-196位、45-109位和145-172位;Seq ID No 148的第17-35位、64-75位、81-92位、100-119位、125-172位、174-183位、214-222位、230-236位、273-282位、287-303位、310-315位、331-340位、392-398位、412-420位、480-505位、515-523位、525-546位、553-575位、592-598位、603-609位、617-625位、631-639位、644-651位、658-670位、681-687位、691-704位、709-716位、731-736位、739-744位、750-763位、774-780位、784-791位、799-805位、809-822位、859-870位、880-885位、907-916位、924-941位、943-949位、973-986位、1010-1016位、1026-1036位、1045-1054位、1057-1062位、1082-1088位、1095-1102位、1109-1120位、1127-1134位、1140-1146位、1152-1159位、1169-1179位、1187-1196位、1243-1251位、1262-1273位、1279-1292位、1306-1312位、1332-1343位、1348-1364位、1379-1390位、1412-1420位、1427-1436位、1458-1468位、1483-1503位、1524-1549位、1574-1588位、1614-1619位、1672-1685位、1697-1707位、1711-1720位、1738-1753位、1781-1787位、1796-1801位、1826-1843位、132-478位、508-592位和1753-1810位;Seq ID No 149的第15-43位、49-55位、71-77位、104-110位、123-130位、162-171位、180-192位、199-205位、219-227位、246-254位、264-270位、279-287位、293-308位、312-322位、330-342位、349-356位、369-377位、384-394位、401-406位、416-422位、432-439位、450-460位、464-474位、482-494位、501-508位、521-529位、536-546位、553-558位、568-574位、584-591位、602-612位、616-626位、634-646位、653-660位、673-681位、688-698位、705-710位、720-726位、736-749位、833-848位、1-199位、200-337位、418-494位和549-647位;Seq ID No 150的第9-30位、65-96位、99-123位、170-178位和1-128位;Seq ID No 151的第7-32位、34-41位、96-106位、127-136位、154-163位、188-199位、207-238位、272-279位、306-312位、318-325位、341-347位、353-360位、387-393位、399-406位、434-440位、452-503位、575-580位、589-601位、615-620位、635-640位、654-660位、674-680位、696-701位、710-731位、1-548位和660-691位;Seq ID No 152的第4-19位、35-44位、48-59位、77-87位、93-99位、106-111位、130-138位、146-161位和78-84位;Seq ID No 153的第24-30位、36-43位、64-86位、93-99位、106-130位、132-145位、148-165位、171-177位、189-220位、230-249位、251-263位、293-300位、302-3 12位、323-329位、338-356位、369-379位、390-412位和179-193位;Seq ID No 154的第30-39位、61-67位、74-81位、90-120位、123-145位、154-167位、169-179位、182-197位、200-206位、238-244位、267-272位和230-265位;Seq ID No 155的第14-20位、49-65位、77-86位和2-68位;Seq ID No 156的第4-9位、26-35位、42-48位、53-61位、63-85位、90-101位、105-111位、113-121位、129-137位、140-150位、179-188位、199-226位、228-237位、248-255位、259-285位、299-308位、314-331位、337-343位、353-364位、410-421位、436-442位和110-144位;Seq ID No 157的第36-47位、55-63位、94-108位、129-134位、144-158位、173-187位、196-206位、209-238位、251-266位、270-285位、290-295位、300-306位、333-344位、346-354位、366-397位、404-410位、422-435位、439-453位、466-473位、515-523位、529-543位、554-569位、571-585位、590-596位、607-618位、627-643位、690-696位、704-714位、720-728位、741-749位、752-767位、780-799位、225-247位和480-507位;Seq IDNo 158的第16-25位、36-70位、80-93位、100-106位和78-130位;Seq ID No159的第18-27位、41-46位、50-57位、65-71位、79-85位、93-98位、113-128位、144-155位、166-178位、181-188位、201-207位、242-262位、265-273位、281-295位、303-309位、318-327位和36-64位;Seq ID No 160的第7-29位、31-44位、50-59位、91-96位、146-153位、194-201位、207-212位、232-238位、264-278位、284-290位、296-302位、326-353位、360-370位、378-384位、400-405位、409-418位、420-435位、442-460位、499-506位、529-534位、556-562位、564-576位、644-651位、677-684位、687-698位、736-743位、759-766位、778-784位、808-814位、852-858位、874-896位、920-925位、929-935位、957-965位、1003-1012位、1021-1027位、1030-1044位、1081-1087位、1101-1111位、1116-1124位、1148-1159位、1188-1196位、1235-1251位、1288-1303位、1313-1319位、1328-1335位、1367-1373位、1431-1437位、1451-1458位、1479-1503位、1514-1521位、1530-1540位、1545-1552位、1561-1568位、1598-1605位、1617-1647位、1658-1665位、1670-1676位、1679-1689位、1698-1704位、1707-1713位、1732-1738位、1744-1764位、1-70位、154-189位、922-941位、1445-1462位和1483-1496位;Seq ID No 161的第6-51位、81-91位、104-113位、126-137位、150-159位、164-174位、197-209位、215-224位、229-235位、256-269位、276-282位、307-313位、317-348位、351-357位、376-397位、418-437位、454-464位、485-490位、498-509位、547-555位、574-586位、602-619位和452-530位;Seq ID No 162的第25-31位、39-47位、49-56位、99-114位、121-127位、159-186位、228-240位、253-269位、271-279位、303-315位、365-382位、395-405位、414-425位、438-453位和289-384位;Seq ID No 163的第9-24位、41-47位、49-54位、68-78位、108-114位、117-122位、132-140位、164-169位、179-186位、193-199位、206-213位、244-251位、267-274位、289-294位、309-314位、327-333位、209-249位和286-336位;Seq ID No 164的第9-28位、53-67位、69-82位、87-93位、109-117位、172-177位、201-207位、220-227位、242-247位、262-268位、305-318位、320-325位和286-306位;Seq ID No 165的第4-10位、26-39位、47-58位、63-73位、86-96位、98-108位、115-123位、137-143位、148-155位、160-176位、184-189位、194-204位、235-240位、254-259位、272-278位和199-283位;Seq ID No 166的第4-26位、33-39位、47-53位、59-65位、76-83位、91-97位、104-112位、118-137位、155-160位、167-174位、198-207位、242-268位、273-279位、292-315位、320-332位、345-354位、358-367位、377-394位、403-410位、424-439位、445-451位、453-497位、511-518位、535-570位、573-589位、592-601位、604-610位和202-242位;SeqID No 167的第8-30位、36-45位、64-71位、76-82位、97-103位、105-112位、134-151位、161-183位、211-234位、253-268位、270-276位、278-284位、297-305位、309-315位、357-362位、366-372位、375-384位、401-407位、409-416位、441-455位、463-470位、475-480位、490-497位、501-513位、524-537位、552-559位、565-576位、581-590位、592-600位、619-625位、636-644位、646-656位和316-419位;Seq ID No 168的第4-17位、52-58位、84-99位、102-110位、114-120位、124-135位、143-158位、160-173位、177-196位、201-216位、223-250位、259-267位、269-275位和1-67位;Seq ID No 169的第6-46位、57-67位、69-80位、82-133位、137-143位、147-168位、182-187位、203-209位、214-229位、233-242位、246-280位和53-93位;Seq ID No 170的第7-40位、50-56位、81-89位、117-123位、202-209位、213-218位、223-229位、248-261位、264-276位、281-288位、303-308位、313-324位、326-332位、340-346位、353-372位、434-443位、465-474位、514-523位、556-564位、605-616位、620-626位、631-636位、667-683位、685-699位、710-719位、726-732位、751-756位、760-771位、779-788位、815-828位、855-867位、869-879位、897-902位、917-924位、926-931位、936-942位、981-1000位、1006-1015位、1017-1028位、1030-1039位、1046-1054位、1060-1066位、1083-1092位、1099-1112位、1122-1130位、1132-1140位、1148-1158位、1161-1171位、1174-1181位、1209-1230位、1236-1244位、1248-1254位、1256-1267位、1269-1276位、1294-1299位、1316-1328位、1332-1354位、1359-1372位、1374-1380位、1384-1390位、1395-1408位、1419-1425位、1434-1446位、1453-1460位、1465-1471位、1474-1493位、1505-1515位、1523-1537位、1547-1555位、1560-1567位、1577-1605位、1633-1651位、1226-1309位、1455-1536位和1538-1605位;Seq ID No 171的第4-10位、31-39位、81-88位、106-112位、122-135位、152-158位、177-184位、191-197位、221-227位、230-246位、249-255位、303-311位、317-326位、337-344位、346-362位、365-371位、430-437位、439-446位、453-462位、474-484位和449-467位;Seq ID No 172的第9-15位、24-35位、47-55位、122-128位、160-177位、188-196位、202-208位、216-228位、250-261位、272-303位、318-324位、327-339位、346-352位、355-361位、368-373位、108-218位和344-376位;Seq ID No 173的第6-14位、17-48位、55-63位、71-90位、99-109位、116-124位、181-189位、212-223位、232-268位、270-294位、297-304位、319-325位、340-348位、351-370位、372-378位、388-394位、406-415位、421-434位和177-277位;Seq ID No 174的第21-39位、42-61位、65-75位、79-85位、108-115位和11-38位;Seq ID No 175的第4-17位、26-39位、61-76位、103-113位、115-122位、136-142位、158-192位、197-203位、208-214位、225-230位、237-251位和207-225位;Seq ID No 176的第5-11位、27-36位、42-53位、62-70位、74-93位、95-104位、114-119位、127-150位、153-159位、173-179位、184-193位、199-206位、222-241位、248-253位、257-280位、289-295位、313-319位、322-342位、349-365位、368-389位、393-406位、408-413位、426-438位、447-461位、463-470位、476-495位、532-537位、543-550位和225-246位;Seq ID No 177的第4-29位、68-82位、123-130位、141-147位、149-157位、178-191位、203-215位、269-277位、300-307位、327-335位、359-370位、374-380位、382-388位、393-400位、410-417位、434-442位、483-492位、497-503位、505-513位、533-540位、564-569位、601-607位、639-647位、655-666位、693-706位、712-718位、726-736位、752-758位、763-771位、774-780位、786-799位、806-812位、820-828位、852-863位、884-892位、901-909位、925-932位、943-948位、990-996位、1030-1036位、1051-1059位、1062-1068位、1079-1086位、1105-1113位、1152-1162位、1168-1179位、1183-1191位、1204-1210位、1234-1244位、1286-1295位、1318-1326位、1396-1401位、1451-1460位、1465-1474位、1477-1483位、1488-1494位、1505-1510位、1514-1521位、1552-1565位、1593-1614位、1664-1672位、1677-1685位、1701-1711位、1734-1745位、1758-1770位、1784-1798位、1840-1847位、1852-1873位、1885-1891位、1906-1911位、1931-1939位、1957-1970位、1977-1992位、2014-2020位、2026-2032位、2116-2134位、1-348位、373-490位、573-767位、903-1043位、1155-1198位、1243-1482位、1550-1595位、1682-1719位、1793-1921位和2008-2110;Seq ID No 178的第10-35位、39-52位、107-112位、181-188位、226-236位、238-253位、258-268位、275-284位、296-310位、326-338位、345-368位、380-389位、391-408位、410-418位、420-429位、444-456位、489-505位、573-588位、616-623位、637-643位、726-739位、741-767位、785-791位、793-803位、830-847位、867-881位、886-922位、949-956位、961-980位、988-1004位、1009-1018位、1027-1042位、1051-1069位、1076-1089位、1108-1115位、1123-1135位、1140-1151位、1164-1179位、1182-1191位、1210-1221位、1223-1234位、1242-1250位、1255-1267位、1281-1292位、1301-1307位、1315-1340位、1348-1355位、1366-1373位、1381-1413位、1417-1428位、1437-1444位、1453-1463位、1478-1484位、1490-1496位、1498-1503位、1520-1536位、1538-1546位、1548-1570位、1593-1603位、1612-1625位、1635-1649位、1654-1660位、1670-1687位、1693-1700位、1705-1711位、1718-1726位、1729-1763位、1790-1813位、1871-1881位、1893-1900位、1907-1935位、1962-1970位、1992-2000位、2006-2013位、2033-2039位、2045-2051位、2055-2067位、2070-2095位、2097-2110位、2115-2121位、2150-2171位、2174-2180位、2197-2202位、2206-2228位和1526-1560位;Seq ID No 179的第4-17位、35-48位、54-76位、78-107位、109-115位、118-127位、134-140位、145-156位、169-174位、217-226位、232-240位、256-262位、267-273位、316-328位、340-346位、353-360位、402-409位、416-439位、448-456位、506-531位、540-546位、570-578位、586-593位、595-600位、623-632位、662-667位、674-681位、689-705位、713-724位、730-740位、757-763位、773-778位、783-796位、829-835位、861-871位、888-899位、907-939位、941-955位、957-969位、986-1000位、1022-1028位、1036-1044位、1068-1084位、1095-1102位、1118-1124位、1140-1146位、1148-1154位、1168-1181位、1185-1190位、1197-1207位、1218-1226位、1250-1270位、1272-1281位、1284-1296位、1312-1319位、1351-1358位、1383-1409位、1422-1428位、1438-1447位、1449-1461位、1482-1489位、1504-1510位、1518-1527位、1529-1537位、1544-1551位、1569-1575位、1622-1628位、1631-1637位、1682-1689位、1711-1718位、1733-1740位、1772-1783位、1818-1834位、1859-1872位、1-64位和128-495位;Seq ID No 180的第8-28位、32-37位、62-69位、119-125位、137-149位、159-164位、173-189位、200-205位、221-229位、240-245位、258-265位、268-276位、287-293位、296-302位、323-329位和1-95位;Seq ID No 181的第9-18位、25-38位、49-63位、65-72位、74-81位、94-117位、131-137位、139-146位、149-158位、162-188位、191-207位、217-225位、237-252位、255-269位、281-293位、301-326位、332-342位、347-354位、363-370位、373-380位、391-400位、415-424位、441-447位和75-107位;Seq ID No 182的第4-24位、64-71位、81-87位、96-116位、121-128位、130-139位、148-155位、166-173位、176-184位、203-215位、231-238位、243-248位、256-261位、280-286位、288-306位、314-329位和67-148位;Seq ID No 183的第4-10位、19-37位、46-52位、62-81位、83-89位、115-120位、134-139位、141-151位、168-186位、197-205位、209-234位、241-252位、322-335位、339-345位、363-379位、385-393位、403-431位、434-442位、447-454位、459-465位、479-484位、487-496位和404-420位;Seq ID No 184的第10-35位、46-66位、71-77位、84-93位、96-122位、138-148位、154-172位、182-213位、221-233位、245-263位、269-275位、295-301位、303-309位、311-320位、324-336位、340-348位、351-359位、375-381位和111-198位;Seq ID No 185的第14-25位、30-42位、47-61位、67-75位、81-91位、98-106位、114-122位、124-135位、148-193位、209-227位和198-213;Seq ID No 186的第5-18位、45-50位、82-90位、97-114位、116-136位、153-161位、163-171位、212-219位、221-227位、240-249位、267-281位、311-317位、328-337位、375-381位、390-395位、430-436位、449-455位、484-495位、538-543位、548-554位、556-564位、580-586位、596-602位和493-606位;Seq ID No 187的第9-25位、28-34位、37-44位、61-68位、75-81位、88-96位、98-111位、119-133位、138-150位、152-163位、168-182位、186-194位、200-205位、216-223位、236-245位、257-264位、279-287位、293-304位、311-318位、325-330位、340-346位、353-358位、365-379位、399-409位、444-453位和303-391位;Seq IDNo 188的第16-36位、55-61位、66-76位、78-102位、121-130位、134-146位、150-212位、221-239位、255-276位、289-322位、329-357位和29-59位;Seq ID No 189的第8-27位、68-74位、77-99位、110-116位、124-141位、171-177位、202-217位、221-228位、259-265位、275-290位、293-303位、309-325位、335-343位、345-351位、365-379位、384-394位、406-414位、423-437位、452-465位、478-507位、525-534位、554-560位、611-624位、628-651位、669-682位、742-747位、767-778位、782-792位、804-812位、820-836位、79-231和359-451位;Seq ID No 190的第5-28位、39-45位、56-62位、67-74位、77-99位、110-117位、124-141位、168-176位、200-230位、237-244位、268-279位、287-299位、304-326位、329-335位、348-362位、370-376位、379-384位、390-406位、420-429位、466-471位、479-489位、495-504位、529-541位、545-553位、561-577位、598-604位、622-630位、637-658位、672-680位、682-688位、690-696位、698-709位、712-719位、724-736位、738-746位、759-769位、780-786位、796-804位、813-818位、860-877位、895-904位、981-997位、1000-1014位、1021-1029位、1-162位、206-224位、254-350位、414-514位和864-938位;Seq ID No 191的第4-11位、19-49位、56-66位、68-101位、109-116位、123-145位、156-165位、177-185位、204-221位、226-234位、242-248位、251-256位、259-265位、282-302位、307-330位、340-349位、355-374位、377-383位、392-400位、422-428位、434-442位、462-474位和266-322位;Seq ID No 192的第14-43位、45-57位、64-74位、80-87位、106-127位、131-142位、145-161位、173-180位、182-188位、203-210位、213-219位、221-243位、245-254位、304-311位、314-320位、342-348位、354-365位、372-378位、394-399位、407-431位、436-448位、459-465位、470-477位、484-490位、504-509位、531-537位、590-596位、611-617位、642-647位、723-734位、740-751位、754-762位、764-774位、782-797位、807-812位、824-831位、838-845位、877-885位、892-898位、900-906位、924-935位、940-946位、982-996位、1006-1016位、1033-1043位、1051-1056位、1058-1066位、1094-1108位、1119-1126位、1129-1140位、1150-1157位、1167-1174位、1176-1185位、1188-1201位、1209-1216位、1220-1228位、1231-1237位、1243-1248位、1253-1285位、1288-1297位、1299-1307位、1316-1334位、1336-1343位、1350-1359位、1365-1381位、1390-1396位、1412-1420位、1427-1439位、1452-1459位、1477-1484位、1493-1512位、1554-1559位、1570-1578位、1603-1608位、1623-1630位、1654-1659位、1672-1680位、1689-1696位、1705-1711位、1721-1738位、1752-1757位、1773-1780位、1817-1829位、1844-1851位、1856-1863位、1883-1895位、1950-1958位、1974-1990位、172-354位、384-448位、464-644位、648-728位和1357-1370位;SeqID No 193的第8-27位、68-74位、77-99位、110-116位、124-141位、169-176位、201-216位、220-227位、258-264位、274-289位、292-302位、308-324位、334-342位、344-350位、364-372位、377-387位、399-407位、416-429位、445-458位、471-481位、483-500位、518-527位、547-553位、604-617位、621-644位、662-675位、767-778位、809-816位、15-307位、350-448位和496-620位;Seq ID No 194的第4-17位、24-29位、53-59位、62-84位、109-126位、159-164位、189-204位、208-219位、244-249位、274-290位、292-302位、308-324位、334-342位、344-350位、378-389位、391-397位、401-409位、424-432位、447-460位、470-479位、490-504位、521-529位、538-544位、549-555位、570-577位、583-592位、602-608位、615-630位、635-647位、664-677位、692-698位、722-731位、733-751位、782-790位、793-799位、56-267位、337-426位和495-601位;Seq ID No 195的第12-22位、49-59位、77-89位、111-121位、136-148位、177-186位、207-213位、217-225位、227-253位、259-274位、296-302位、328-333位、343-354位、374-383位、424-446位、448-457位、468-480位、488-502位、507-522位、544-550位、553-560位、564-572位、587-596位、604-614位、619-625位、629-635位、638-656位、662-676位、680-692位、697-713位、720-738位、779-786位、833-847位、861-869位、880-895位、897-902位、911-917位、946-951位、959-967位、984-990位、992-1004位、1021-1040位、1057-1067位、1073-1080位和381-403位;Seq ID No 196的第4-10位、26-31位、46-56位、60-66位、70-79位、86-94位、96-102位、109-118位、132-152位、164-187位、193-206位、217-224位和81-149位;Seq ID No 197的第4-21位、26-37位、48-60位、71-82位、109-117位、120-128位、130-136位、142-147位、181-187位、203-211位、216-223位、247-255位、257-284位、316-325位、373-379位、395-400位、423-435位、448-456位、479-489位、512-576位、596-625位、641-678位、680-688位、692-715位和346-453位;Seq ID No 198的第10-16位、25-31位、34-56位、58-69位、71-89位、94-110位、133-176位、186-193位、208-225位、240-250位、259-266位、302-307位、335-341位、376-383位、410-416位和316-407位;Seq ID No 199的第11-29位、42-56位、60-75位、82-88位、95-110位、116-126位、132-143位、145-160位、166-172位、184-216位和123-164位;Seq ID No 200的第11-29位、54-63位、110-117位、139-152位、158-166位、172-180位、186-193位、215-236位、240-251位、302-323位、330-335位、340-347位、350-366位、374-381位和252-299位;Seq ID No 201的第18-27位、35-42位、50-56位、67-74位、112-136位、141-153位、163-171位、176-189位、205-213位、225-234位、241-247位、253-258位、269-281位、288-298位、306-324位、326-334位、355-369位、380-387位和289-320位;Seq ID No 202的第7-15位、19-41位、56-72位、91-112位、114-122位、139-147位、163-183位、196-209位、258-280位、326-338位、357-363位、391-403位、406-416位和360-378位;Seq ID No203的第11-18位、29-41位、43-49位、95-108位、142-194位、204-212位、216-242位、247-256位、264-273位和136-149位;Seq ID No 204的第18-24位、33-40位、65-79位、89-102位、113-119位、130-137位、155-161位、173-179位、183-203位、205-219位、223-231位、245-261位、267-274位、296-306位、311-321位、330-341位、344-363位、369-381位、401-408位、415-427位、437-444位、453-464位、472-478位、484-508位、517-524位、526-532位、543-548位和59-180位;Seq ID No 205的第5-13位、52-65位、67-73位、97-110位、112-119位、134-155位和45-177位;Seq ID No 206的第6-28位、34-43位、57-67位、75-81位、111-128位、132-147位、155-163位、165-176位、184-194位、208-216位、218-229位、239-252位、271-278位、328-334位、363-376位、381-388位、426-473位、481-488位、492-498位、507-513位、536-546位、564-582位、590-601位、607-623位、148-269位、420-450位和610-648位;Seq ID No 207的第4-12位、20-38位、69-75位、83-88位、123-128位、145-152位、154-161位、183-188位、200-213位、245-250位、266-272位、306-312位、332-339位、357-369位、383-389位、395-402位、437-453位、455-470位、497-503位和1-112位;Seq ID No208的第35-59位、74-86位、111-117位、122-137位和70-154位;Seq ID No209的第26-42位、54-61位、65-75位、101-107位、123-130位、137-144位、148-156位、164-172位、177-192位、213-221位、231-258位和157-249位;Seq ID No 210的第29-38位、61-67位、77-87位、94-100位、105-111位、118-158位和1-97位;Seq ID No 211的第7-21位、30-48位、51-58位、60-85位、94-123位、134-156位、160-167位、169-183位、186-191位、216-229位、237-251位、257-267位、272-282位、287-298位和220-243位;Seq IDNo 212的第6-29位、34-47位、56-65位、69-76位、83-90位、123-134位、143-151位、158-178位、197-203位、217-235位、243-263位、303-309位、320-333位、338-348位、367-373位、387-393位、407-414位、416-427位、441-457位、473-482位、487-499位、501-509位、514-520位、530-535位、577-583位、590-602位、605-612位、622-629位、641-670位、678-690位、37-71位和238-307位;Seq ID No 213的第7-40位、121-132位、148-161位、196-202位、209-215位、221-235位、248-255位、271-280位、288-295位、330-339位、395-409位、414-420位、446-451位、475-487位、556-563位、568-575位、580-586位、588-595位、633-638位、643-648位、652-659位、672-685位、695-700位、710-716位、737-742位、749-754位、761-767位、775-781位、796-806位、823-835位、850-863位、884-890位、892-900位、902-915位、934-941位和406-521位;Seq ID No 214的第9-18位、24-46位、51-58位、67-77位、85-108位、114-126位、129-137位、139-146位、152-165位、173-182位、188-195位、197-204位、217-250位、260-274位、296-313位、343-366位、368-384位、427-434位、437-446位、449-455位、478-484位、492-506位、522-527位、562-591位、599-606位、609-618位、625-631位、645-652位和577-654位;Seq ID No 215的第13-20位、26-37位、41-53位、56-65位、81-100位、102-114位、118-127位、163-188位、196-202位、231-238位、245-252位、266-285位、293-298位、301-306位和19-78位;Seq ID No 216的第10-23位、32-42位、54-66位、73-91位、106-113位、118-127位、139-152位、164-173位、198-207位、210-245位、284-300位、313-318位、330-337位、339-346位、354-361位、387-393位、404-426位、429-439位、441-453位、467-473位、479-485位、496-509位、536-544位、551-558位、560-566位、569-574位、578-588位、610-615位、627-635位、649-675位、679-690位、698-716位、722-734位、743-754位、769-780位、782-787位和480-550位;Seq ID No 217的第6-39位、42-50位、60-68位、76-83位、114-129位、147-162位、170-189位、197-205位、217-231位、239-248位、299-305位、338-344位、352-357位、371-377位、380-451位、459-483位、491-499位、507-523位、537-559位、587-613位、625-681位、689-729位、737-781位、785-809位、817-865位、873-881位、889-939位、951-975位、983-1027位、1031-1055位、1063-1071位、1079-1099位、1103-1127位、1151-1185位、1197-1261位、1269-1309位、1317-1333位、1341-1349位、1357-1465位、1469-1513位、1517-1553位、1557-1629位、1637-1669位、1677-1701位、1709-1725位、1733-1795位、1823-1849位、1861-1925位、1933-1973位、1981-2025位、2029-2053位、2061-2109位、2117-2125位、2133-2183位、2195-2219位、2227-2271位、2275-2299位、2307-2315位、2323-2343位、2347-2371位、2395-2429位、2441-2529位、2537-2569位、2577-2601位、2609-2625位、2633-2695位、2699-2737位、2765-2791位、2803-2867位、2889-2913位、2921-2937位、2945-2969位、2977-2985位、2993-3009位、3023-3045位、3073-3099位、3111-3167位、3175-3215位、3223-3267位、3271-3295位、3303-3351位、3359-3367位、3375-3425位、3437-3461位、3469-3513位、3517-3541位、3549-3557位、3565-3585位、3589-3613位、3637-3671位、3683-3747位、3755-3795位、3803-3819位、3827-3835位、3843-3951位、3955-3999位、4003-4039位、4043-4115位、4123-4143位、4147-4171位、4195-4229位、4241-4305位、4313-4353位、4361-4377位、4385-4393位、4401-4509位、4513-4557位、4561-4597位、4601-4718位、4749-4768位、74-171位、452-559位和2951-3061位;Seq ID No 218的第16-22位、30-51位、70-111位、117-130位、137-150位、171-178位、180-188位、191-196位和148-181位;Seq ID No 219的第6-19位、21-46位、50-56位、80-86位、118-126位、167-186位、189-205位、211-242位、244-267位、273-286位、290-297位、307-316位、320-341位和34-60位;Seq ID No 220的第5-26位、33-43位、48-54位、58-63位、78-83位、113-120位、122-128位、143-152位、157-175位、185-192位、211-225位、227-234位、244-256位、270-281位、284-290位、304-310位、330-337位、348-355位、362-379位、384-394位、429-445位、450-474位、483-490位、511-520位、537-546位、548-554位、561-586位、590-604位、613-629位、149-186位、285-431位和573-659位;Seq ID No 221的第5-26位、49-59位、61-67位、83-91位、102-111位、145-157位、185-192位、267-272位、279-286位、292-298位、306-312位、134-220位、235-251位和254-280位;Seq ID No222的第5-19位、72-79位、83-92位、119-124位、140-145位、160-165位、167-182位、224-232位、240-252位、259-270位、301-310位、313-322位、332-343位、347-367位、384-398位、416-429位、431-446位、454-461位和1-169位;Seq ID No 223的第8-17位、26-31位、56-62位、75-83位、93-103位、125-131位、135-141位、150-194位、205-217位、233-258位、262-268位、281-286位和127-168位;Seq ID No 224的第6-12位、69-75位、108-115位、139-159位、176-182位、194-214位和46-161位;Seq ID No 225的第6-13位、18-27位、39-48位、51-59位、66-73位、79-85位、95-101位、109-116位、118-124位、144-164位、166-177位、183-193位、197-204位、215-223位、227-236位、242-249位、252-259位、261-270位、289-301位、318-325位和12-58位;Seq ID No 226的第4-10位、26-32位、48-60位、97-105位、117-132位、138-163位、169-185位、192-214位、219-231位、249-261位、264-270位、292-308位、343-356位、385-392位、398-404位、408-417位、435-441位和24-50位;Seq ID No 227的第10-40位、42-48位、51-61位、119-126位和1-118位;Seq ID No 228的第5-17位、40-58位、71-83位、103-111位、123-140位、167-177位、188-204位和116-128位;Seq ID No 229的第4-9位、11-50位、57-70位、112-123位、127-138位和64-107位;Seq IDNo 230的第9-39位、51-67位和1-101位;Seq ID No 231的第5-14位、17-25位、28-46位、52-59位、85-93位、99-104位、111-120位、122-131位、140-148位、158-179位、187-197位、204-225位、271-283位、285-293位和139-155位;Seq ID No 232的第42-70位、73-90位、92-108位、112-127位、152-164位、166-172位、181-199位、201-210位、219-228位、247-274位、295-302位、322-334位、336-346位、353-358位、396-414位、419-425位、432-438位、462-471位、518-523位、531-536位、561-567位、576-589位、594-612位、620-631位、665-671位、697-710位、718-731位、736-756位、765-771位、784-801位和626-653位;Seq ID No 233的第8-28位、41-51位、53-62位、68-74位、79-85位、94-100位、102-108位、114-120位、130-154位、156-162位、175-180位、198-204位、206-213位、281-294位、308-318位、321-339位、362-368位、381-386位、393-399位、407-415位和2-13位;Seq ID No 234的第4-39位、48-65位、93-98位、106-112位、116-129位和10-36位;Seq ID No 235的第25-32位、35-50位、66-71位、75-86位、90-96位、123-136位、141-151位、160-179位、190-196位、209-215位、222-228位、235-242位、257-263位、270-280位和209-247位;Seq ID No 236的第5-29位、31-38位、50-57位、62-75位、83-110位、115-132位、168-195位、197-206位、216-242位、249-258位、262-269位、333-340位、342-350位、363-368位、376-392位、400-406位、410-421位、423-430位、436-442位、448-454位、460-466位、471-476位、491-496位、511-516位、531-536位、551-556位、571-576位、585-591位、599-605位、27-70位、219-293位、441-504位和512-584位;Seq ID No 237的第4-12位、14-34位、47-75位、83-104位、107-115位、133-140位、148-185位、187-196位、207-212位、224-256位、258-265位、281-287位、289-296位、298-308位、325-333位、345-355位、365-371位、382-395位、424-435位、441-457位、465-472位、483-491位、493-505位、528-534位、536-546位、552-558位、575-584位、589-600位、616-623位和576-591位;Seq ID No 238的第4-76位、78-89位、91-126位、142-148位、151-191位、195-208位、211-223位、226-240位、256-277位、279-285位、290-314位、317-323位、358-377位、381-387位、391-396位、398-411位、415-434位、436-446位、454-484位、494-512位、516-523位、538-552位、559-566位、571-577位、579-596位、599-615位、620-627位、635-644位、694-707位、720-734位、737-759位、761-771位和313-329位;Seq ID No 239的第7-38位、44-49位、79-89位、99-108位、117-123位、125-132位、137-146位、178-187位、207-237位、245-255位、322-337位、365-387位、398-408位、445-462位、603-608位、623-628位、644-650位、657-671位、673-679位和111-566位;Seq ID No 240的第6-20位、22-35位、39-45位、58-64位、77-117位、137-144位、158-163位、205-210位、218-224位、229-236位、239-251位、263-277位、299-307位、323-334位、353-384位、388-396位、399-438位、443-448位、458-463位、467-478位、481-495位、503-509位、511-526位、559-576位、595-600位、612-645位、711-721位、723-738位、744-758位、778-807位和686-720位;Seq ID No 241的第10-33位、35-41位、72-84位、129-138位、158-163位、203-226位、243-252位、258-264位、279-302位、322-329位、381-386位、401-406位、414-435位和184-385位;Seq ID No 242的第4-9位、19-24位、41-47位、75-85位、105-110位、113-146位和45-62位;Seq ID No 243的第4-25位、52-67位、117-124位、131-146位、173-180位、182-191位、195-206位、215-221位、229-236位、245-252位、258-279位、286-291位、293-302位、314-320位、327-336位、341-353位、355-361位、383-389位和1-285位;Seq ID No 244的第14-32位、38-50位、73-84位、93-105位、109-114位和40-70位;Seq IDNo 245的第5-26位和22-34位;Seq ID No 246的第23-28位和13-39位;SeqID No 247的第8-14位和21-34位;Seq ID No 248的第4-13位、20-29位、44-50位、59-74位和41-69位;Seq ID No 249的第4-9位、19-42位、48-59位、71-83位和57-91位;Seq ID No 250的第4-14位和10-28位;Seq ID No 251的22-28位、32-42位、63-71位、81-111位、149-156位、158-167位、172-180位、182-203位、219-229位和27-49位;Seq ID No 252的第17-27位和23-32位;Seq ID No 253的第18-24位和28-38位;Seq ID No 254的第9-15位和13-27位;Seq ID No 255的第13-22位和18-29位;Seq ID No 256的第17-26位和2-11位;Seq ID No 257的第4-33位和16-32位;Seq ID No 258的第4-10位、37-43位、54-84位、92-127位和15-62位;Seq ID No 259的第4-14位、20-32位、35-60位、69-75位、79-99位、101-109位、116-140位和124-136位;SeqID No 260的第2-13位;Seq ID No 261的第4-13位、28-42位和42-57位;Seq ID No 262的第4-14位、27-44位和14-35位;Seq ID No 263的第4-12位和1-27位;Seq ID No 264的第4-18位、39-45位、47-74位和35-66位;SeqID No 265的第8-20位、43-77位和17-36位;Seq ID No 266的第4-30位、35-45位、51-57位和35-49位;Seq ID No 267的第4-24位、49-57位和15-34位;Seq ID No 268的第4-22位和8-27位;Seq ID No 269的第13-25位、32-59位、66-80位和21-55位;Seq ID No 270的第4-10位、24-33位、35-42位、54-65位、72-82位、98-108位和15-30位;Seq ID No 271的第8-19位和17-47位;Seq ID No 272的第12-18位、40-46和31-52位;Seq ID No 273的第4-20位、35-78位、83-102位、109-122位和74-86位;Seq ID No 274的第7-17位、21-41位、46-63位和2-20位;Seq ID No 275的第30-37位和2-33位;Seq IDNo 276的第4-13位、17-25位和1-15位;Seq ID No 277的第17-31位、44-51位和20-51位;Seq ID No 278的第20-30位和5-23位;Seq ID No 279的第13-33位、48-71位和92-110位;Seq ID No 280的第4-9位、50-69位、76-88位、96-106位、113-118位和12-34位;Seq ID No 281的第4-24位和6-26位;Seq ID No 282的第7-26位和14-30位;Seq ID No 283的第9-39位、46-68位、75-82位、84-103位和26-44位;Seq ID No 284的第4-30位、33-107位和58-84位;Seq ID No 285的第4-12位和9-51位;Seq ID No 286的第12-18位、29-37位和6-37位;Seq ID No 287的第4-21位、33-52位、64-71位和16-37位;SeqID No 288的第9-19位和2-30位;Seq ID No 245的第20-37位;Seq ID No 246的第8-27位;Seq ID No 247的第10-27位;Seq ID No 248的第42-59位和52-69位;Seq ID No 249的第63-80位和74-91位;Seq ID No 250的第11-28位;Seq ID No 251的第28-49位;Seq ID No 252的第15-32位;Seq ID No 253的第4-20位;Seq ID No 254的第10-27位;Seq ID No 255的第17-34位;Seq ID No 256的第1-18位;Seq ID No 257的第16-33位;Seq ID No 258的第16-36位、30-49位和43-62位;Seq ID No 259的第122-139位;Seq ID No260的1-18位;Seq ID No 261的第41-58位;Seq ID No 262的第15-35位;Seq ID No 263的第2-27位;Seq ID No 265的第18-36位;Seq ID No 266的第34-51位;Seq ID No 268的第9-27位;Seq ID No 269的第22-47位;Seq IDNo 271的第18-36位和29-47位;Seq ID No 272的第32-52位;Seq ID No 273的第72-89位;Seq ID No 274的第3-20位;Seq ID No 275的第3-21位和15-33位;Seq ID No 276的第1-18位;Seq ID No 278的第6-23位;Seq ID No 279的第93-110位;Seq ID No 280的第13-34位;Seq ID No 281的第7-26位和9-26位;Seq ID No 282的第16-33位;Seq ID No 283的第27-44位;Seq ID No284的第67-84位;Seq ID No 285的第10-33位和26-50位;Seq ID No 286的第7-25位和19-37位;Seq ID No 287的第17-37位;Seq ID No 288的第3-20位和13-30位;Seq ID No 145的第62-80位和75-93位;Seq ID No 147的第92-108位;Seq ID No 148的第332-349位、177-200位和1755-1777位;Seq IDNo 149的第109-133位、149-174位、260-285位和460-485位;Seq ID No 150的第26-47位和42-64位;Seq ID No 151的第22-41位、35-54位、115-130位、306-325位、401-420位和454-478位;Seq ID No 155的第22-45位;Seq ID No160的第156-174位、924-940位、1485-1496位、1447-1462位和1483-1498位;Seq ID No 161的第457-475位;Seq ID No 163的第302-325位;Seq IDNo 164的第288-305位;Seq ID No 165的第244-266位和260-282位;Seq IDNo 166的第204-225位和220-241位;Seq ID No 167的第324-345位、340-361位、356-377位、372-393位和388-408位;Seq ID No 168的第39-64位;SeqID No 169的第54-76位和70-92位;Seq ID No 170的第1227-1247位、1539-1559位、1554-1574位、1569-1589位、1584-1604位、1242-1262位、1272-1292位、1287-1308位、1456-1477位、1472-1494位、1488-1510位和1505-1526位;Seq ID No 172的第351-368位;Seq ID No 173的第179-200位、195-216位、211-232位、227-248位和243-263位;Seq ID No 174的第13-37位;Seq ID No 175的第208-224位;Seq ID No 177的第42-64位、59-81位、304-328位、323-348位、465-489位、968-992位、1399-1418位、1412-1431位和2092-2111位;Seq ID No 178的第1528-1547位和1541-1560位;Seq IDNo 179的第184-200位、367-388位、382-403位、409-429位、425-444位和438-457位;Seq ID No 180的第27-50位和45-67位;Seq ID No 183的第114-131位和405-419位;Seq ID No 184的第113-134位、129-150位、145-166位、161-182位和177-198位;Seq ID No 186的第495-515位;Seq ID No 187的第346-358位;Seq ID No 190的第208-224位;Seq ID No 192的第178-194位、202-223位、217-238位、288-308位和1355-1372位;Seq ID No 194的第57-78位;Seq ID No 197的第347-369位、364-386位、381-403位、398-420位、415-437位和432-452位;Seq ID No 198的第347-372位;Seq ID No 199的第147-163位;Seq ID No 200的第263-288位;Seq ID No 202的第361-377位;Seq ID No 204的第82-104位、99-121位、116-138位、133-155位和150-171位;Seq ID No 205的第110-130位和125-145位;Seq ID No 206的第613-631位、626-644位和196-213位;Seq ID No 208的第78-100位、95-117位、112-134位和129-151位;Seq ID No 209的第158-180位、175-197位、192-214位、209-231位和226-248位;Seq ID No 210的第30-50位、45-65位和60-79位;Seq ID No 213的第431-455位和450-474位;Seq ID No 214的第579-601位、596-618位、613-635位和630-653位;Seq ID No 217的第920-927位、98-119位、114-135位、130-151位、146-167和162-182位;SeqID No 219的第36-59位;Seq ID No 220的第194-216位和381-404位;Seq IDNo 221的第236-251位和255-279位;Seq ID No 222的第80-100位和141-164位;Seq ID No 223的第128-154位;Seq ID No 224的第82-100位、95-116位和111-134位;Seq ID No 227的第55-76位、71-92位和87-110位;Seq IDNo 229的第91-106位;Seq ID No 230的第74-96位;Seq ID No 231的第140-157位;Seq ID No 233的第4-13位;Seq ID No 236的第41-65位和499-523位;Seq ID No 239的第122-146位、191-215位、288-313位、445-469位和511-535位;Seq ID No 241的第347-368位;Seq ID No 242的第46-61位;Seq ID No 243的第15-37位、32-57位、101-121位、115-135位、138-158位、152-172位、220-242位和236-258位。
本发明还提供了产生按照本发明的肺炎链球菌超免疫血清反应性抗原或其片段的方法,所述方法包括在适当的表达系统中表达按照本发明的一个或多个核酸分子。
此外,本发明提供了用于产生表达按照本发明的肺炎链球菌超免疫血清反应性抗原或其片段的细胞的方法,所述方法包括用按照本发明的载体转化或转染适当的宿主细胞。
依照本发明,提供了含有本发明中所定义的超免疫血清反应性抗原或其片段或本发明中所定义的核酸分子的药物组合物,尤其是疫苗。  在优选的实施方案中,药物组合物还包含免疫刺激物质,优选选自包含下列各项的组中:聚阳离子聚合物,尤其是聚阳离子肽;免疫刺激性脱氧核苷酸(ODNs);含至少两个赖氨酸-亮氨酸-赖氨酸基序的肽,尤其是KLKLLLLLKLK;神经活性化合物,尤其是人生长激素;清蛋白,弗氏完全或不完全佐剂或它们的组合。
在更优选的实施方案中,免疫刺激物质是聚阳离子聚合物与免疫刺激性脱氧核苷酸的组合或含至少两个赖氨酸-亮氨酸-赖氨酸基序的肽和免疫刺激性脱氧核苷酸的组合。
在更优选的实施方案中,聚阳离子聚合物是聚阳离子肽,尤其是多精氨酸。
依照本发明,提供了按照本发明的核酸分子或按照本发明的超免疫血清反应性抗原或其片段在制备药物制剂,尤其是制备针对肺炎链球菌感染的疫苗中的应用。
同此还提供了至少与按照本发明的超免疫血清反应性抗原或其片段的选择性部分结合的抗体或至少其有效部分。
在优选的实施方案中,所述抗体是单克隆抗体。
在另一优选的实施方案中,所述抗体的有效部分包含Fab片段。
在另一优选的实施方案中,所述抗体是嵌合抗体。
在更优选的实施方案中,所述抗体是人源化抗体。
本发明还提供了生产按照本发明的抗体的杂交瘤细胞系。
此外,本发明提供了生产按照本发明的抗体的方法,其特征在于以下步骤:
·通过对所述动物施用按照本发明中所定义的超免疫血清反应性抗原或其片段在非人动物体内引发免疫应答,
·从所述动物中去除含抗体的体液,并
·通过将所述含抗体的体液进行进一步的纯化步骤生产该抗体。
因此,本发明还提供了生产按照本发明的抗体的方法,其特征在于以下步骤:
·通过对所述动物施用按照本发明中所定义的超免疫血清反应性抗原或其片段在非人动物体内引发免疫应答,
·从所述动物体内取出脾脏或脾细胞,
·产生所述脾脏或脾细胞的杂交瘤细胞,
·选择并克隆对所述超免疫血清反应性抗原或其片段特异的杂交瘤细胞,
·通过培养所述被克隆的杂交瘤细胞和任选进一步的纯化步骤生产抗体。
依照以上方法提供或生产的抗体可用于制备治疗或预防肺炎链球菌感染的药物。
依照另一方面,本发明提供了与按照本发明的超免疫血清反应性抗原或其片段结合的拮抗剂。
所述能与按照本发明的超免疫血清反应性抗原或其片段结合的拮抗剂可用包含以下步骤的方法进行鉴定:
a)在能提供响应候选拮抗剂与所述超免疫血清反应性抗原或其片段的结合的可检测信号的组分的存在下,将按照本发明的分离的或固定的超免疫血清反应性抗原或其片段与候选的拮抗剂在允许所述候选拮抗剂结合所述超免疫血清反应性抗原或其片段的条件下接触,并
b)检测响应拮抗剂与超免疫血清反应性抗原或其片段结合所产生的信号的存在或不存在。
能降低或抑制按照本发明的超免疫血清反应性抗原或其片段与其相互作用配偶体之间的相互作用活性的拮抗剂可通过包含以下步骤的方法进行鉴定:
a)提供按照本发明的超免疫血清反应性抗原或其超免疫片段,
b)提供针对所述超免疫血清反应性抗原或其片段的相互作用配偶体,尤其是按照本发明的抗体,
c)使所述的超免疫血清反应性抗原或其片段与所述的相互作用配偶体相互作用以形成相互作用复合物,
d)提供候选拮抗剂,
e)允许候选拮抗剂和所述的相互作用复合物之间发生竞争性反应,
f)确定候选拮抗剂是否抑制或降低了超免疫血清反应性抗原或其片段与相互作用配偶体之间的相互作用活性。
按照本发明的超免疫血清反应性抗原或其片段可用于分离和/或纯化和/或鉴定所述超免疫血清反应性抗原或其片段的相互作用配偶体。
本发明还提供了体外诊断涉及按照本发明的超免疫血清反应性抗原或其片段表达的疾病的方法,所述方法包括测定编码所述的按照本发明的超免疫血清反应性抗原或其片段的核酸序列的存在或按照本发明的超免疫血清反应性抗原或其片段的存在。
本发明还提供了体外诊断细菌感染,尤其是肺炎链球菌感染的方法,所述方法包括分析编码所述的按照本发明的超免疫血清反应性抗原或其片段的核酸序列的存在或按照本发明的超免疫血清反应性抗原或其片段的存在。
此外,本发明提供了按照本发明的超免疫血清反应性抗原或其片段在生产结合所述超免疫血清反应性抗原或其片段的肽中的应用,其中的肽是抗促成素(anticaline)。
本发明还提供了按照本发明的超免疫血清反应性抗原或其片段在制备功能性核酸中的应用,其中的功能性核酸选自包含适体(aptamer)和spiegelmer的组中。
按照本发明的核酸分子也可用于制备功能性核糖核酸,其中的功能性核糖核酸选自包含核酶、反义核酸和siRNA的组中。
本发明有利地提供了一套有效、相关且全面的分离的核酸分子以及它们编码的超免疫血清反应性抗原或其片段,使用来自多个人血浆库的抗体制剂和来自肺炎链球菌基因组的表面表达文库将它们从肺炎链球菌中鉴定出来。因此,本发明满足了对在用于制备抗体和用于鉴定有效针对肺炎链球菌感染的化合物的程序中有用的的肺炎链球菌抗原、疫苗、诊断剂和产品的广泛需求。
有效的疫苗应由蛋白质或多肽组成,它们可由所有菌株表达并能诱导高亲和力的、丰富的抗肺炎链球菌细胞表面组分的抗体。所述的抗体应是用于调理作用的IgG1和/或IgG3,以及用于中和粘附和毒素作用的任何IgG亚型和IgA。化学定义的疫苗一定确实优于全细胞疫苗(减毒的或灭活的),因为可除去与人组织交叉反应或抑制调理作用的肺炎链球菌组分,而且可选择诱发保护性抗体和/或保护性免疫反应的个别蛋白质。
已应用于本发明的方法是以肺炎球菌蛋白质或肽与人血清中存在抗体之间的相互作用为基础的。由人免疫系统产生且存在于人血清中的针对肺炎链球菌的抗体是抗原性蛋白质体内表达以及它们的免疫原性的指征。此外,使用预选择的血清库通过细菌表面展示表达文库鉴定的抗原性蛋白质在用单独选择或产生的血清进行的第二轮和第三轮筛选中被加工。由此本发明提供了一套有效的、相关的、全面的肺炎球菌抗原作为药物组合物,尤其是预防肺炎链球菌感染的疫苗。
在用于鉴定按照本发明的一组全面的抗原的抗原鉴定程序中,用数个血清库或血浆组分或含其它集合抗体的体液(抗体库)筛选了至少两个不同的细菌表面表达文库。抗体库来自血清样品集合,已针对肺炎链球菌的抗原性化合物对所述集合进行了检测,诸如全细胞提取物和培养物上清蛋白质等。优选地,使用两种不同的血清集合:1.用非常稳定的抗体所有组分(repertoire):正常成人,临床健康人群,他们是非带菌者且克服了先前的遭遇或目前正携带肺炎链球菌但无急性疾病和症状的人群,2.由于致病生物体的存在而具有急性诱发抗体,患者具有不同表现的急性疾病(例如,肺炎链球菌咽炎、肺炎、菌血症、腹膜炎、脑膜炎和脓毒症)。血清必须与多个肺炎球菌特异性抗原反应,以便被认为是超免疫的和因此与用于本发明的筛选方法相关。
用于本发明中时,表达文库应可以表达所有潜在的抗原,例如,来自肺炎链球菌所有分泌性蛋白质和表面蛋白质的抗原。对于在细菌宿主膜上的两个选定外膜蛋白(LamB和FhuA),细菌宿主的重组文库将代表细菌表面展示文库,所述细菌宿主的重组文库展示一组(全部)的肺炎链球菌的表达的肽序列{Georgiou,G.,1997};{Etz,H.等,2001}。使用重组表达文库的优势之一在于鉴定的超免疫血清反应性抗原可通过表达被筛选和选择的克隆的编码序列即刻产生,而无需另外的重组DNA技术或克隆步骤,所述筛选和选择的克隆表达超免疫血清反应性抗原。
用一轮或多轮另外的筛选进一步分析根据本发明所述程序鉴定的一组全面的抗原。因此利用了针对选定的被鉴定为具免疫原性的肽的单个抗体制剂或多个抗体。依照优选的实施方案,用于第二轮筛选的单独抗体制剂来自肺炎链球菌急性感染患者,尤其是显示出抗体效价高于一定最低水平的患者,例如抗体效价高于被测试人(患者或健康个体)血清的80个百分点,优选高于90个百分点,尤其是高于95个百分点。在第二轮筛选中应用所述的高效价单独抗体制剂可以高选择性地鉴定来自肺炎链球菌的超免疫血清反应性抗原及其片段。
在全面的筛选步骤之后,如果不能表达于原核表达系统中则可表达为重组蛋白或体外翻译产物的选定抗原性蛋白或者已被鉴定的抗原性肽(合成产生),在第二轮筛选中用巨大的人血清集合(最小~150健康和患者血清)通过一系列ELISA和蛋白质印迹测定进行检测评估其免疫原性。
重要的是单独的抗体制剂(也可以是选定的血清)可以从来自第一轮的所有具备希望的候选者筛选鉴定所有超免疫血清反应性抗原的最有潜力的候选者。因此,在第二轮筛选中应优选至少10种单独的抗体制剂(即,来自感染选定病原体的至少10名不同个体的抗体制剂(例如血清))用于鉴定这些抗原。当然,还有可能利用少于10种的单独制剂,不过,利用少数单独抗体制剂得到的步骤的选择性可能不是最佳的。另一方面,如果给定的超免疫血清反应性抗原(或其抗原性片段)被至少10种单独的抗体制剂所识别,优选至少30种,尤其是至少50种单独的抗体制剂识别,超免疫血清反应性抗原鉴定的选择性对于进行正确的鉴定而言也已足够。当然,超免疫血清反应性可用尽可能多的单独制剂进行检测(例如,多于100或甚至多于1000)。
因此,按照本发明方法的超免疫血清反应性抗体制剂的相关部分应优选至少10种,更优选至少30种,尤其是至少50种单独的抗体制剂。备选地(或联合的)超免疫血清反应性抗原还可用第二轮筛选中所用所有单独抗体制剂的至少20%、优选至少30%、尤其是至少40%进行鉴定。
依照本发明的优选的实施方案,从其中制备出用于第二轮筛选的单独抗体制剂的血清(或自身被用作抗体制剂)是根据其针对肺炎链球菌的效价(例如,针对这种病原体的制剂,诸如裂解物、细胞壁组分和重组蛋白)进行选择的。优选地,当整个生物体(总裂解物或全细胞)被用作ELISA中的抗原时,选择总IgA效价高于2000U的、尤其是高于4000U的和/或IgG效价高于5000U、尤其是高于12000U的那些生物体(U=单位,在给定稀释度下的OD405nm读数计算而得)。
人免疫系统所产生且存在于人血清中的针对链球菌的抗体是抗原性蛋白质体内表达及其免疫原性的指征。血清抗体对线性表位的识别可能是以短到4-5个氨基酸长的序列为基础的。当然这并不一定意味着这些短肽能在体内产生所述的给定抗体。为此进一步在动物内(主要是在小鼠内)检测所限定表位、多肽和蛋白质在体内诱发针对选定蛋白质的抗体的能力。
优选的抗原定位于细胞表面或被分泌且因而易于到达细胞外。预期将抗细胞壁蛋白质的抗体用于多个目的:抑制粘附、干扰营养获得、抑制免疫逃避以促进吞噬作用(Hornef,M等)。针对被分泌蛋白质的抗体在对其毒素或毒性组分功能的中和作用中是有利的。还已知的是细菌通过分泌蛋白质相互交流。中和针对这些蛋白质的抗体可阻断链球菌物种之间或之内的生长促进通讯。证实了生物信息分析(信号序列、细胞壁定位信号、跨膜结构域)对评估细胞表面定位或分泌作用非常有用。实验方法包括分离具有相应表位的抗体和来自人血清的蛋白质,并在小鼠中产生针对通过细菌表面展示筛选所选定的(多)肽的免疫血清。然后将这些血清作为以下检测的试剂用于第三轮筛选中:在不同条件下生长的肺炎链球菌的细胞表面染色(FACS或显微镜观察),测定中和能力(毒素、粘附)以及促进调理作用和胞噬作用(体外吞噬作用检测)。
为此目的,细菌大肠杆菌克隆被直接注射入小鼠中,采集免疫血清并在相关的体外试验中检测功能性的调理或中和抗体。或者,使用肽或蛋白质作为底物,可以从人或小鼠血清中纯化特异性抗体。
宿主针对肺炎链球菌的防卫性主要依赖于调理吞噬杀伤作用机制。通过接种疫苗诱发调理型和中和型的高亲和力抗体可帮助先天的免疫系统清除细菌和毒素。这使得按照本发明的方法成为鉴定肺炎球菌抗原性蛋白质的最适工具。
皮肤和黏膜是抗链球菌入侵的强大屏障。不过,一旦皮肤或黏膜破裂,非适应性的细胞防卫第一道防线通过补体和巨噬细胞、尤其是多形核白细胞(PMNs)开始联合作用。可以认为这些细胞是清除入侵细菌的基石。由于肺炎链球菌起初是胞外病原体,所以主要的抗链球菌适应性反应来自免疫系统的体液防卫装备且通过三种主要的机制介导:调理作用的促进、毒素中和作用和粘附的抑制。现认为调理作用尤为重要,因为它是有效的吞噬作用所需要的。为了进行有效的调理,微生物的表面必须用抗体和补体因子包被以便PMNs通过受体识别IgG分子的Fc片段或活化的C3b。经调理作用后,链球菌被吞噬并处死。结合细菌细胞表面特异性抗原的抗体作为配体用于附着PMNs并促进胞噬作用。预期与粘附素和其它细胞表面蛋白结合的非常相似的抗体可中和粘附作用并预防建群。本发明所提供的抗原的选择因此非常适于鉴定在动物模型或人中导致针对感染的保护的那些抗原。
依照本文所用的抗原鉴定方法,特别是如下所述,本发明可令人惊讶的提供肺炎链球菌的一套全面的新核酸和新的超免疫血清反应性抗原及其片段。根据某一方面,本发明特别涉及编码超免疫血清反应性抗原且具有序列表Seq ID No:1-144,289-303中所列出序列的核苷酸序列以及序列表Seq ID No 145-288和304-318所列出的代表超免疫血清反应性抗原的相应编码氨基酸序列。
在本发明的优选实施方案中,提供的核酸分子其全长展示出与Seq IDNo 1,101-144所列核苷酸序列具有70%的同一性。最高度优选的核酸包含了全长与Seq ID No 1,101-144所列的核酸分子具有至少80%或至少85%同一性的区域。在这点上,特别优选全长与上述序列具有至少90%、91%、92%、93%、94%、95%或96%同一性的核酸分子。而且,高度优选至少具有97%同一性的那些核酸分子,特别高度优选至少98%和至少99%的同一性,更优选至少99%或99.5%,特别优选100%的同一性的那些。此外,在这方面优选的实施方案是编码超免疫血清反应性抗原或其片段(多肽)的核酸,所述的超免疫血清反应性抗原或片段(多肽)保持与由序列Seq ID No 1,101-144所列的所述核酸编码的成熟多肽基本上相同的生物学功能或活性。
正如本领域已知且此处所用的,如通过比较这些序列确定的,同一性是两个或多个多肽序列或者两个或多个多核苷酸序列之间的关系。在本领域内,同一性也意味着多肽或多核苷酸序列之间的序列相关程度,情形可能是通过在所述序列行与行之间进行比对确定的。可容易地计算同一性。虽然存在许多方法可以检测两个多核苷酸或两个多肽序列之间的同一性,但此术语对技术熟练人员而言是众所周知的(如,Sequence Analysis inMolecular Biology,von Heinje,G.,Academic Press,1987)。优选的测定同一性的方法是对其进行设计以可以给出待测序列之间最大的匹配程度。将确定同一性的方法编成了计算机程序。测定两个序列之间同一性的优选计算机程序法包括,但不局限于,GCG软件包{Devereux,J.等,1984}、BLASTP、BLASTN和FASTA{Altschul,S.等,1990}。
依照本发明的另一方面,提供了展示出与Seq ID No 2-6、8、10-16、18-23、25-31、34、36、38-42、44、47-48、51、53、55-62、64、67、71-76、78-79、81-94、96-100所列出的核酸序列具有至少96%同一性的核酸分子。
依照本发明的另一方面,提供了与Seq ID No 9、17、24、32、37、43、52、54、65-66、70、80所列出的核酸序列相同的核酸分子。
按照本发明的核酸分子可作为与上文所述第一个备选核酸至少基本上互补的第二个备选的核酸分子。用于此处时,互补意味着核酸链通过Watson-Crick碱基配对原则与第二条核酸链的碱基配对。基本上互补用于此处时意味着碱基配对并非存在于各自链的所有碱基之间,而是剩余一定数目或百分比的不配对碱基或错配碱基。正确配对的碱基百分率优选至少70%,更优选80%,还更优选90%,最优选高于90%的任一百分率。应提及的是认为70%比例的碱基匹配时是同源的且认为具此程度匹配碱基的杂交是严紧的。此类严紧杂交的杂交条件可以参见Current Protocols inMolecular Biology(John Wiley and Sons,Inc.,1987)。更具体而言,杂交条件可以如下:
·例如,在5×SSPE、5×Denhardt’s试剂、0.1%SDS、100g/mL剪切DNA中于68℃进行杂交
·在0.2×SSC、0.1%SDS中于42℃进行中度严紧洗涤
·在0.1×SSC、0.1%SDS于68℃进行高严紧性洗涤。
GC含量为50%的基因组DNA的TM近似96℃。相对于1%的错配而言,TM下降约1℃。
此外,本文所述的任何另外的杂交条件原则上也是适用的。
当然,编码与本发明所鉴定分子相同的多肽分子的所有核酸序列分子都包含在给定编码序列的任何内容内,因为可以将遗传密码的简并性直接应用于明确测定的且编码给定多肽分子的所有可能性核酸分子,即使所述的简并核酸分子的数目可能是高的也是如此。这还可适用于给定多肽的片段,只要该片段编码的多肽适用于疫苗接种即可,例如作为主动或被动疫苗。
按照本发明的核酸分子可作为第三个备选的核酸分子,它包含如上所述的依照本发明的核酸分子的的第一和第二备选核酸分子的一段至少15个碱基的序列。优选地,所述碱基形成连续的碱基序列。不过,由许多碱基分隔开的两个或多个部分组成的序列也在本发明的范围内。
这种核酸可以优选地由来自此处公开的序列的至少20个,甚至更优选的至少30个,尤其地至少50个的连续碱基组成。可以根据计划了的应用领域(例如,作为(PCR)引物、探针、捕获分子(例如在(DNA)芯片上),等),容易地对适当长度进行优化。优选的核酸分子包含一个或多个预测的免疫原性的氨基酸序列的至少连续15个碱基部分,所述预测的免疫原性的氨基酸序列是在表1和2中列出的序列,尤其是具有超过10分,优选地,超过20分,尤其地超过25分的表2中的序列。特别优选的是包含在本申请的序列方案中的任何序列的DNA序列中的连续部分的核酸,所述连续部分与公开的肺炎链球菌菌株TIGR4的基因组({Tettelin,H.等,2001};GenBank登录号AE005672)和/或任何其它公开的肺炎链球菌基因组序列或其部分,特别是菌株R6({Hoskins,J.等.,2001};GenBank登录AE007317)相比,其显示1个或更多,优选地多于2个,尤其多于5个的不相同核酸残基。特别优选的不相同核酸残基是导致不相同氨基酸残基的残基。优选地,与上述公开的肺炎链球菌对应物相比,核酸序列编码具有至少1个,优选地至少2个,优选地至少3个不同氨基酸残基的多肽。还优选这种分离的多肽,其是此处,例如在序列表中所述的具有至少6个、7个或8个氨基酸残基的蛋白质的片段(或整个蛋白质),并且可以被这些核酸编码。
按照本发明的核酸分子也可用作第四个备选的核酸分子,它在严紧杂交条件下与符合上述第一、第二和第三备选方案的任一本发明核酸分子退火。严紧杂交条件通常是本文所述的条件。
最后,按照本发明的核酸分子可用作第五个备选的核酸分子,若非遗传密码的简并性,与符合上述第一、第二、第三和第四备选方案的任一本发明核酸分子的任一核酸分子杂交。此类核酸分子是指优选地按照本发明的核酸编码按照本发明的超免疫血清反应性抗原或其片段的这一事实。此类核酸分子可特别用于检测按照本发明的核酸分子并从而诊断单独的微生物诸如肺炎链球菌以及涉及此类微生物的任何疾病或疾病状况。优选地,杂交可在与上述第四个备选方案相关的所述严紧条件下发生或完成。
用于本文时,核酸分子通常指任何核糖核酸分子或脱氧核糖核酸分子,它们可以是未修饰的RNA或DNA或修饰过的RNA或DNA。因此,例如,本文所用的核酸分子尤其是指单链和双链DNA、作为单链和双链RNA混合物的DNA以及作为单链和双链区域混合物的RNA,含有DNA和RNA的杂交分子,所述杂交分子可以是单链或更典型地是双链或三链的,或单链和双链区域的混合物。此外,用于本文时,核酸分子涉及包含RNA或DNA或兼有RNA和DNA二者的三链区域。在这种区域内的链可能来自同一分子或来自不同的分子。这些区域可包含所有的一个或多个分子,但更通常是只涉及某些分子的一个区域。三螺旋区域的分子之一常常是寡核苷酸。用于本文时,术语核酸分子包括含有一个或多个修饰碱基的上述DNA或RNA。因此,由于稳定性或其它原因而其主链被修饰的DNA或RNA是如同本文提及术语时所指的“核酸分子”。此外,含稀有碱基诸如肌苷,或修饰的碱基,诸如三苯甲基化碱基的DNAs或RNAs是该术语用于本文时所指的核酸分子,它们只是其中的两个例子。应该理解的是为了达到许多本领域技术人员已知的有益的目的而对DNA和RNA进行了多种类型的修饰。术语核酸分子用于本文时包含化学、酶促或代谢修饰形式的核酸分子以及病毒和细胞的DNA和RNA特性的化学形式,其中包括简单和复杂细胞。术语核酸分子还包含常常称为寡核苷酸的短核酸分子。“多核苷酸”和“核酸”或“核酸分子”在此常常交换使用。
本发明中所提供的核酸分子还涵盖许多单独的片段,长于和短于肺炎链球菌编码区序列表中所列出的核酸分子序列,它们可通过标准的克隆方法产生。为了达到独特性,片段必须有足够长度以将其与其它已知的核酸序列区分开来,通过将任何选定的肺炎链球菌片段与诸如GenBank等计算机数据库中的核苷酸序列进行比较可最方便地进行确定。
此外,可以对本发明所涵盖的核酸分子和多肽进行修饰。例如,可以进行不会影响核酸所编码的多肽的核苷酸替代,因此编码超免疫血清反应性抗原或其片段的任何核酸分子都包含在本发明范围内。
而且,利用标准技术诸如标准的克隆技术,可以将编码本发明所提供的超免疫血清反应性抗原或其片段的任何核酸分子与任何所需的调节序列进行功能型连接以产生融合蛋白,所述调节序列无论是肺炎链球菌调节序列或异源的调节序列,异源前导序列、异源标记序列或异源编码序列。
本发明的核酸分子可以是通过克隆获得或通过化学合成技术产生或二者联合方法获得的RNA形式诸如mRNA或cRNA或DNA形式,其包括例如cDNA和基因组DNA。所述DNA可以是三链、双链或单链的。单链DNA可以是编码链,也称为有义链,或者可以是非编码链,也称为反义链。
本发明还涉及本文上述核酸分子的变体,它们编码具有序列表中所列出的推断肺炎链球菌的氨基酸序列的超免疫血清反应性抗原和其片段的片段、类似物及衍生物。核酸分子变体可以是天然存在的变体,诸如天然存在的等位基因变体,或者其可以是非天然存在的变体。通过诱变技术,包括应用于核酸分子、细胞或生物体的那些诱变技术,可以制备核酸分子的这些非天然存在变体
在这方面的变体中,变体是通过核苷酸替代、缺失或添加而不同于上述核酸分子的变体。所述替代、缺失或添加可涉及一个或多个核苷酸。所述变体可以在编码区内或非编码区内或二者内都有所改变。在编码区中的改变可以产生保守或非保守性氨基酸替代、缺失或添加。优选的是编码具有序列表中所提肺炎链球菌序列的变体、类似物、衍生物或片段或者片段的变体、类似物或衍生物的核酸分子,其中数个、一些、5-10个、1-5个、1-3个、2个、1个或无氨基酸以任一组合形式被替代、缺失或添加。其中尤其优选沉默替代、添加和缺失,它们不改变序列表中所列肺炎链球菌多肽的特征和活性。在这点上还特别优选保守性替代。
按照本发明的肽和片段还包括修饰的表位以及编码所述修饰表位的核酸序列,所述修改的表位中优选根据在例如{Tourdot,S等,2000}中公开的原则对给定表位的一个或两个氨基酸进行修饰或替代。
清楚的是,通过提高、保留或至少不显著阻碍所述表位的T细胞活化能力的氨基酸交换从而也将衍生自本发明表位的表位还包括在按照本发明的表位范围内。因此,本发明的表位还覆盖了不包含肺炎链球菌来源的原始序列但触发相同的或优选提高的T细胞应答的表位。将这些表位称为“不规则变化的”,它们需要具有对MHC/HLA分子相似的或优选更大的亲合力,还需要具有以相似或优选更强的方式刺激T细胞受体(TCR)定向于原始表位的能力。
不规则变化表位可通过合理的设计获得,即,如{Rammensee,H.等,1999}所述,考虑各个残基对结合MHC/HLA的贡献,联合与TCR潜在相互作用的残基的系统性交换并用定向针对原始表位的T细胞检测得到的序列。这样的设计对于本领域技术人员而言是可能的而无需过多的实验。
另一可能性包括用定向针对原始表位的T细胞筛选肽库。优选的方式是合成肽库的定位扫描。这种方法已详述于{Hemmer,B.等,1999}和本文所给定文献中。
作为对本发明来源氨基酸序列表示的表位或不规则变化表位的备选方案,还可以应用模拟这些表位的物质,例如“肽模拟物”或“反-逆-肽(retro-inverso-peptides)”。
设计改良表位的另一方面是用增加其刺激T细胞能力的物质进行它们的配制或修饰。这些包括T辅助细胞表位、脂质或脂质体或在WO01/78767中所述的优选修饰。
增加表位的T细胞刺激能力的另一方式是将它们与免疫刺激物质配制在一起,所述免疫刺激物质例如细胞因子或趋化因子如白介素-2、-7、-12、-18,I类和II类干扰素(IFN),尤其是γ-IFN、GM-CSF、α-TNF、flt3配体及其它。
正如本文关于本发明核酸分子检测所另外讨论的,例如,上述本发明核酸分子可用作针对RNA、cDNA和基因组DNA的杂交探针以分离编码本发明多肽的全长cDNAs和基因组克隆,以及分离与本发明核酸分子具有高度序列相似性的其它基因的cDNA和基因组克隆。这种探针通常包含至少15个碱基。优选地,这种探针具有至少20个、至少25个或至少30个碱基,还可能具有至少50个碱基。尤其优选的探针具有至少30个碱基,和具有50个或少于50个的碱基,诸如30、35、40、45或50个碱基。
例如,本发明核酸分子的编码区可通过用已知的DNA序列合成寡核苷酸探针筛选有关的文库而被分离。然后将具有与本发明基因序列互补的序列的已标记寡核苷酸用于筛选cDNA、基因组DNA或mRNA文库以确定探针与文库中的哪一个成员杂交。
正如本文关于核酸分子试验所进一步讨论的,其中,可以将本发明的核酸分子和多肽用作试剂和材料用于研发疾病,尤其是人的疾病的治疗和诊断的方法。
可以将寡核苷酸形式的本发明核酸分子用于本文所述方法中,但优选用于PCR,以确定此处鉴定的肺炎链球菌基因是否全部或部分在受感染组织诸如血液中存在和/或转录。公认的,还可将这种序列用于诊断病原体已达到的感染阶段和感染类型。为此目的和其它目的,可以使用包含至少按照本发明的核酸之一的阵列。
可以将按照本发明的核酸分子用于检测核酸分子和包含这些核酸的生物体或样品。优选这种检测是用于诊断的,更优选用于诊断涉及或与肺炎链球菌的存在或丰度有关的疾病。
通过用各种技术在DNA水平上检测按照本发明的任何核酸分子,可以确认感染了肺炎链球菌的真核生物(此处也称“个体”),特别是哺乳动物,尤其是人。可以获得用于将肺炎链球菌从其它生物体中辨别出来的优选核酸分子候选物。
本发明提供了诊断由肺炎链球菌感染引起的疾病的方法,包括从分离或来自个体的样品中测定具有序列表中所列出的核酸分子序列的核酸分子表达水平的增加。使用任何本领域众所周知的任一核酸分子定量方法,诸如,例如,PCR、RT-PCR、核糖核酸酶保护、RNA印迹、其它的杂交方法以及本文所述的阵列,可以对核酸分子的表达进行测量。
用于本文时,分离是指“人为的”将其从自身的天然状态中隔离出来,即,如果它存在于自然界中,那么已经将它已改变或从其最初的环境中移去,或二者兼具。当该术语用于此处时,例如,在其天然状态下天然存在于活的生物体内的天然存在的核酸分子或多肽不是“分离的”,但从其天然状态共存物质中分离出来的相同核酸分子或多肽是“分离的”。例如,作为分离的一部分或分离后,这种核酸分子可与其它核酸分子,诸如DNA连接,以形成融合蛋白,用于诱变,和用于在宿主细胞中进行增殖和表达。可以将分离的核酸分子,单独的或与其它核酸分子诸如载体结合,引入培养物或完整生物体的宿主细胞内。该术语用于此处时,当引入培养物或完整生物体的宿主细胞中时,这种DNA仍然是分离的,因为它们将不会处于其天然存在形式或环境中。同样,核酸分子和多肽可存在于组合物中,诸如培养基制剂、将核酸分子或多肽引入例如细胞中的溶液、进行化学或酶促反应的组合物或溶液中,例如,所述组合物不是天然存在的组合物且其中保留了在术语用于本文时所具有的意义中的分离的核酸分子或多肽。
按照本发明的核酸可化学合成。或者,所述核酸可用本领域技术人员已知的方法分离自肺炎链球菌。
依照本发明的另一方面,用本文所述的抗原鉴定方法提供了一套全面的、新的超免疫血清反应性抗原和其片段。在本发明优选的实施方案中,提供了含有此处所述任一核酸分子编码的氨基酸序列的超免疫血清反应性抗原及其片段。在本发明的另一优选实施方案中,提供了所含氨基酸序列选自由Seq ID No 145、254-288所表示多肽序列的组中的一组新的超免疫血清反应性抗原及其片段。在本发明另一个优选的实施方案中,提供了所含氨基酸序列选自由Seq ID No 146-150、152、154-160、162-167、169-175、178、180、182-186、188、191-192、195、197、199-206、208、211、215-220、222-223、225-238、240-244组成的组中所示多肽序列的超免疫血清反应性抗原及其片段。在本发明更优选的实施方案中,提供了所含氨基酸序列选自由Seq ID No 153、161、168、176、181、187、196、198、209-210、214、224组成的组中所示多肽序列的超免疫血清反应性抗原及其片段。
本发明中所提供的超免疫血清反应性抗原及其片段包括序列表中所列出的任何多肽以及与序列表中所提出多肽具有至少70%同一性的多肽,优选与序列表中所提出多肽具有至少80%或85%的同一性、更优选与序列表中所提出多肽具有至少90%的相似性(更优选至少90%的同一性)、还更优选与序列表中所提出多肽具有至少95%、96%、97%、98%、99%或99.5%的相似性(更优选至少95%、96%、97%、98%、99%或99.5%的同一性)的多肽,还包括该多肽的部分,所述多肽具有这种部分的多肽,即通常含至少4个氨基酸,更优选至少8个,还更优选至少30个,更优选至少50个氨基酸,诸如4、8、10、20、30、35、40、45或50个氨基酸。
本发明还涉及这些超免疫血清反应性抗原及其片段的片段、类似物和衍生物。术语“片段”、“衍生物”和“类似物”在涉及其氨基酸序列列于序列表中的抗原时,指基本上保持与所述超免疫血清反应性抗原及其片段相同或相似的生物学功能或活性的多肽。
超免疫血清反应性抗原及其片段的片段、衍生物或类似物可能是1)其中一个或多个氨基酸残基被保守或不保守氨基酸残基替代(优选保守的氨基酸残基)且这种替代的氨基酸残基可以或不可以由该遗传密码编码,或2)其中一个或多个氨基酸残基包含替代基团,或3)其中成熟的超免疫血清反应性抗原或其片段与另一化合物融合,诸如增加超免疫血清反应性抗原及其片段半寿期的化合物(例如,聚乙二醇),或4)其中附加的氨基酸与成熟的超免疫血清反应性抗原或其片段融合,诸如前导序列或分泌序列或用于纯化成熟的超免疫血清反应性抗原或其片段的序列或前蛋白质序列。认为这种片段、衍生物和类似物在来自本发明教导的那些本领域技术人员的范围内。
本发明还涉及不同肺炎链球菌分离株的抗原。基于本文公开的核酸和氨基酸序列,可以容易地分离这些同源物。迄今为止,已辨别在超过40个血清组中的超过90个的血清型,并且这种分型的基础是特异于血清型的抗血清。因此任何抗原的存在都可针对每一种血清型来确定。此外,还可能按照针对S.pyogenes的sic基因所述,确定各种血清型中特殊抗原的可变性(Hoe,N等,2001)。各种血清型对不同肺炎球菌感染的影响在不同年龄组和地理区域内是变化的{Gray,B.等,1979};{Gray,B.等,1986};{Orange,M.等,1993},在Epidemiology and Prevention ofVaccine-Preventable Diseases中综述,第七版,第二次印刷,The PinkBook)。一个重要的方面是,在各种临床菌株中,预期最有价值的保护性抗原是保守的。
在本发明特别优选的实施方案中,有关这方面的是序列表中列举的超免疫血清反应性抗原,其变体、类似物、衍生物和片段,以及片段的变体、类似物和衍生物。此外,含有这种超免疫血清反应性抗原、其变体、类似物、衍生物和片段以及片段的变体、类似物和衍生物的融合多肽也包括在本发明中。使用标准技术,包括用于产生和表达编码融合蛋白的重组多核酸的标准重组技术,可以容易地制备这种融合多肽和蛋白质以及编码它们的核酸分子。
优选的变体是那些通过保守氨基酸替代从参照株系改变而来的变体。所述替代是用相似特性的另一氨基酸替代多肽中给定的氨基酸。典型地,认为脂肪族氨基酸丙氨酸、缬氨酸、亮氨酸和异亮氨酸中的相互替代;羟基残基丝氨酸和苏氨酸之间的交换,酸性残基天冬氨酸和谷氨酸之间的交换,酰胺残基天冬酰胺和谷氨酰胺之间的替换,碱性残基赖氨酸和精氨酸之间的交换以及芳香族残基苯丙氨酸和酪氨酸之间的替代是保守性替代。   在 这方面还特别优选的是具有序列表中列举的任一多肽的氨基酸序列的变体、类似物、衍生物和片段以及片段的变体、类似物和衍生物,其中数个、一些、5-10个、1-5个、1-3个、2个、1个或无氨基酸残基以任何组合方式被替代、缺失或添加。其中特别优选的是不改变本发明多肽特征和活性的沉默替代、添加和缺失。在这点上还特别优选的是保守性替代。最优选的是具有序列表中所列举氨基酸序列而且无替代的多肽。
本发明的超免疫血清反应性抗原及其片段优选以分离的形式提供,且优选纯化至均一。
也属于本发明优选的实施方案的是含有具有序列表中所列举氨基酸序列的多肽片段以及序列表中所列举多肽的变体和衍生物片段的多肽。
在这方面所述片段是具有与部分而非所有上述超免疫血清反应性抗原和它的片段以及变体或衍生物、类似物及其片段完全相同的氨基酸序列的多肽。这种片段可以是“独立的”,即,并非其它氨基酸或多肽的一部分或与它们相融合,或者它们可包含于较大的多肽中形成其中的一部分或区域。在本发明的这方面还优选的是通过本发明多肽的结构或功能特征表征的片段,即,含有本发明多肽的α-螺旋和α-螺旋形成区域、β-折叠和β-折叠形成区域、转角和转角形成区域、卷曲和卷曲形成区域、亲水性区域、疏水性区域、α两性分子区域、β两性分子区域、柔性区域、表面形成区域、底物结合区域和高抗原性指示区的片段以及这些片段的组合。优选的区域是介导本发明的超免疫血清反应性抗原及其片段活性的那些区域。在这点上最优选的是具有本发明超免疫血清反应性抗原及其片段的化学、生物学或其它活性的片段,包括那些具有相似的活性或改良的活性或具有减少的不理想活性的片段。特别优选的是含酶受体或结构域的片段,其赋予肺炎链球菌生存所必需的功能或在人体内引发疾病的能力。还优选的多肽片段是包括或含有动物,尤其是人中的抗原性或免疫原性决定子的那些多肽片段。
将抗原性片段定义为本身可作为抗原或当作为半抗原时可制备抗原的鉴定的抗原片段。因此,显示出一个或(对于较长片段而言)只有一些氨基酸交换的抗原或抗原片段也能用于本发明,条件是具有氨基酸交换的所述片段的抗原能力并未在交换时严重受损,即,适合于在接种这种抗原并且用来自个体血清的单独抗体制剂进行鉴定的个体中激发适当的免疫应答。
这种超免疫血清反应性抗原片段的优选实例选自由下列组成的组中:包含表1“预测的免疫原性氨基酸”和“已鉴定的免疫原性区域的定位”栏的氨基酸序列的肽;表2的血清反应性表位,尤其是含以下氨基酸的肽:Seq ID No 145的第4-11位、35-64位、66-76位、101-108位、111-119位和57-114位;Seq ID No 146的第5-27位、32-64位、92-102位、107-113位、119-125位、133-139位、148-162位、177-187位、195-201位、207-214位、241-251位、254-269位、285-300位、302-309位、317-324位、332-357位、365-404位、411-425位、443-463位、470-477位、479-487位、506-512位、515-520位、532-547位、556-596位、603-610位、616-622位、624-629位、636-642位、646-665位、667-674位、687-692位、708-720位、734-739位、752-757位、798-820位、824-851位、856-865位和732-763位;SeqID No 147的第14-21位、36-44位、49-66位、102-127位、162-167位、177-196位、45-109位和145-172位;Seq ID No 148的第17-35位、64-75位、81-92位、100-119位、125-172位、174-183位、214-222位、230-236位、273-282位、287-303位、310-315位、331-340位、392-398位、412-420位、480-505位、515-523位、525-546位、553-575位、592-598位、603-609位、617-625位、631-639位、644-651位、658-670位、681-687位、691-704位、709-716位、731-736位、739-744位、750-763位、774-780位、784-791位、799-805位、809-822位、859-870位、880-885位、907-916位、924-941位、943-949位、973-986位、1010-1016位、1026-1036位、1045-1054位、1057-1062位、1082-1088位、1095-1102位、1109-1120位、1127-1134位、1140-1146位、1152-1159位、1169-1179位、1187-1196位、1243-1251位、1262-1273位、1279-1292位、1306-1312位、1332-1343位、1348-1364位、1379-1390位、1412-1420位、1427-1436位、1458-1468位、1483-1503位、1524-1549位、1574-1588位、1614-1619位、1672-1685位、1697-1707位、1711-1720位、1738-1753位、1781-1787位、1796-1801位、1826-1843位、132-478位、508-592位和1753-1810位;Seq ID No 149的第15-43位、49-55位、71-77位、104-110位、123-130位、162-171位、180-192位、199-205位、219-227位、246-254位、264-270位、279-287位、293-308位、312-322位、330-342位、349-356位、369-377位、384-394位、401-406位、416-422位、432-439位、450-460位、464-474位、482-494位、501-508位、521-529位、536-546位、553-558位、568-574位、584-591位、602-612位、616-626位、634-646位、653-660位、673-681位、688-698位、705-710位、720-726位、736-749位、833-848位、1-199位、200-337位、418-494位和549-647位;Seq ID No150的第9-30位、65-96位、99-123位、170-178位和1-128位;Seq ID No 151的第7-32位、34-41位、96-106位、127-136位、154-163位、188-199位、207-238位、272-279位、306-312位、318-325位、341-347位、353-360位、387-393位、399-406位、434-440位、452-503位、575-580位、589-601位、615-620位、635-640位、654-660位、674-680位、696-701位、710-731位、1-548位和660-691位;Seq ID No 152的第4-19位、35-44位、48-59位、77-87位、93-99位、106-111位、130-138位、146-161位和78-84位;Seq ID No 153的第24-30位、36-43位、64-86位、93-99位、106-130位、132-145位、148-165位、171-177位、189-220位、230-249位、251-263位、293-300位、302-312位、323-329位、338-356位、369-379位、390-412位和179-193位;Seq IDNo 154的第30-39位、61-67位、74-81位、90-120位、123-145位、154-167位、169-179位、182-197位、200-206位、238-244位、267-272位和230-265位;Seq ID No 155的第14-20位、49-65位、77-86位和2-68位;Seq ID No156的第4-9位、26-35位、42-48位、53-61位、63-85位、90-101位、105-111位、113-121位、129-137位、140-150位、179-188位、199-226位、228-237位、248-255位、259-285位、299-308位、314-331位、337-343位、353-364位、410-421位、436-442位和110-144位;Seq ID No 157的第36-47位、55-63位、94-108位、129-134位、144-158位、173-187位、196-206位、209-238位、251-266位、270-285位、290-295位、300-306位、333-344位、346-354位、366-397位、404-410位、422-435位、439-453位、466-473位、515-523位、529-543位、554-569位、571-585位、590-596位、607-618位、627-643位、690-696位、704-714位、720-728位、741-749位、752-767位、780-799位、225-247位和480-507位;Seq ID No 158的第16-25位、36-70位、80-93位、100-106位和78-130位;Seq ID No 159的第18-27位、41-46位、50-57位、65-71位、79-85位、93-98位、113-128位、144-155位、166-178位、181-188位、201-207位、242-262位、265-273位、281-295位、303-309位、318-327位和36-64位;Seq ID No 160的第7-29位、31-44位、50-59位、91-96位、146-153位、194-201位、207-212位、232-238位、264-278位、284-290位、296-302位、326-353位、360-370位、378-384位、400-405位、409-418位、420-435位、442-460位、499-506位、529-534位、556-562位、564-576位、644-651位、677-684位、687-698位、736-743位、759-766位、778-784位、808-814位、852-858位、874-896位、920-925位、929-935位、957-965位、1003-1012位、1021-1027位、1030-1044位、1081-1087位、1101-1111位、1116-1124位、1148-1159位、1188-1196位、1235-1251位、1288-1303位、1313-1319位、1328-1335位、1367-1373位、1431-1437位、1451-1458位、1479-1503位、1514-1521位、1530-1540位、1545-1552位、1561-1568位、1598-1605位、1617-1647位、1658-1665位、1670-1676位、1679-1689位、1698-1704位、1707-1713位、1732-1738位、1744-1764位、1-70位、154-189位、922-941位、1445-1462位和1483-1496位;Seq ID No 161的第6-51位、81-91位、104-113位、126-137位、150-159位、164-174位、197-209位、215-224位、229-235位、256-269位、276-282位、307-313位、317-348位、351-357位、376-397位、418-437位、454-464位、485-490位、498-509位、547-555位、574-586位、602-619位和452-530位;Seq ID No 162的第25-31位、39-47位、49-56位、99-114位、121-127位、159-186位、228-240位、253-269位、271-279位、303-315位、365-382位、395-405位、414-425位、438-453位和289-384位;Seq ID No 163的第9-24位、41-47位、49-54位、68-78位、108-114位、117-122位、132-140位、164-169位、179-186位、193-199位、206-213位、244-251位、267-274位、289-294位、309-314位、327-333位、209-249位和286-336位;Seq ID No 164的第9-28位、53-67位、69-82位、87-93位、109-117位、172-177位、201-207位、220-227位、242-247位、262-268位、305-318位、320-325位和286-306位;Seq ID No165的第4-10位、26-39位、47-58位、63-73位、86-96位、98-108位、115-123位、137-143位、148-155位、160-176位、184-189位、194-204位、235-240位、254-259位、272-278位和199-283位;Seq ID No 166的第4-26位、33-39位、47-53位、59-65位、76-83位、91-97位、104-112位、118-137位、155-160位、167-174位、198-207位、242-268位、273-279位、292-315位、320-332位、345-354位、358-367位、377-394位、403-410位、424-439位、445-451位、453-497位、511-518位、535-570位、573-589位、592-601位、604-610位和202-242位;SeqID No 167的第8-30位、36-45位、64-71位、76-82位、97-103位、105-112位、134-151位、161-183位、211-234位、253-268位、270-276位、278-284位、297-305位、309-315位、357-362位、366-372位、375-384位、401-407位、409-416位、441-455位、463-470位、475-480位、490-497位、501-513位、524-537位、552-559位、565-576位、581-590位、592-600位、619-625位、636-644位、646-656位和316-419位;Seq ID No 168的第4-17位、52-58位、84-99位、102-110位、114-120位、124-135位、143-158位、160-173位、177-196位、201-216位、223-250位、259-267位、269-275位和1-67位;Seq ID No 169的第6-46位、57-67位、69-80位、82-133位、137-143位、147-168位、182-187位、203-209位、214-229位、233-242位、246-280位和53-93位;Seq ID No 170的第7-40位、50-56位、81-89位、117-123位、202-209位、213-218位、223-229位、248-261位、264-276位、281-288位、303-308位、313-324位、326-332位、340-346位、353-372位、434-443位、465-474位、514-523位、556-564位、605-616位、620-626位、631-636位、667-683位、685-699位、710-719位、726-732位、751-756位、760-771位、779-788位、815-828位、855-867位、869-879位、897-902位、917-924位、926-931位、936-942位、981-1000位、1006-1015位、1017-1028位、1030-1039位、1046-1054位、1060-1066位、1083-1092位、1099-1112位、1122-1130位、1132-1140位、1148-1158位、1161-1171位、1174-1181位、1209-1230位、1236-1244位、1248-1254位、1256-1267位、1269-1276位、1294-1299位、1316-1328位、1332-1354位、1359-1372位、1374-1380位、1384-1390位、1395-1408位、1419-1425位、1434-1446位、1453-1460位、1465-1471位、1474-1493位、1505-1515位、1523-1537位、1547-1555位、1560-1567位、1577-1605位、1633-1651位、1226-1309位、1455-1536位和1538-1605位;Seq ID No 171的第4-10位、31-39位、81-88位、106-112位、122-135位、152-158位、177-184位、191-197位、221-227位、230-246位、249-255位、303-311位、317-326位、337-344位、346-362位、365-371位、430-437位、439-446位、453-462位、474-484位和449-467位;Seq ID No172的第9-15位、24-35位、47-55位、122-128位、160-177位、188-196位、202-208位、216-228位、250-261位、272-303位、318-324位、327-339位、346-352位、355-361位、368-373位、108-218位和344-376位;Seq ID No 173的第6-14位、17-48位、55-63位、71-90位、99-109位、116-124位、181-189位、212-223位、232-268位、270-294位、297-304位、319-325位、340-348位、351-370位、372-378位、388-394位、406-415位、421-434位和177-277位;Seq ID No 174的第21-39位、42-61位、65-75位、79-85位、108-115位和11-38位;Seq ID No 175的第4-17位、26-39位、61-76位、103-113位、115-122位、136-142位、158-192位、197-203位、208-214位、225-230位、237-251位和207-225位;Seq ID No 176的第5-11位、27-36位、42-53位、62-70位、74-93位、95-104位、114-119位、127-150位、153-159位、173-179位、184-193位、199-206位、222-241位、248-253位、257-280位、289-295位、313-319位、322-342位、349-365位、368-389位、393-406位、408-413位、426-438位、447-461位、463-470位、476-495位、532-537位、543-550位和225-246位;Seq ID No 177的第4-29位、68-82位、123-130位、141-147位、149-157位、178-191位、203-215位、269-277位、300-307位、327-335位、359-370位、374-380位、382-388位、393-400位、410-417位、434-442位、483-492位、497-503位、505-513位、533-540位、564-569位、601-607位、639-647位、655-666位、693-706位、712-718位、726-736位、752-758位、763-771位、774-780位、786-799位、806-812位、820-828位、852-863位、884-892位、901-909位、925-932位、943-948位、990-996位、1030-1036位、1051-1059位、1062-1068位、1079-1086位、1105-1113位、1152-1162位、1168-1179位、1183-1191位、1204-1210位、1234-1244位、1286-1295位、1318-1326位、1396-1401位、1451-1460位、1465-1474位、1477-1483位、1488-1494位、1505-1510位、1514-1521位、1552-1565位、1593-1614位、1664-1672位、1677-1685位、1701-1711位、1734-1745位、1758-1770位、1784-1798位、1840-1847位、1852-1873位、1885-1891位、1906-1911位、1931-1939位、1957-1970位、1977-1992位、2014-2020位、2026-2032位、2116-2134位、1-348位、373-490位、573-767位、903-1043位、1155-1198位、1243-1482位、1550-1595位、1682-1719位、1793-1921位和2008-2110;Seq ID No 178的第10-35位、39-52位、107-112位、181-188位、226-236位、238-253位、258-268位、275-284位、296-310位、326-338位、345-368位、380-389位、391-408位、410-418位、420-429位、444-456位、489-505位、573-588位、616-623位、637-643位、726-739位、741-767位、785-791位、793-803位、830-847位、867-881位、886-922位、949-956位、961-980位、988-1004位、1009-1018位、1027-1042位、1051-1069位、1076-1089位、1108-1115位、1123-1135位、1140-1151位、1164-1179位、1182-1191位、1210-1221位、1223-1234位、1242-1250位、1255-1267位、1281-1292位、1301-1307位、1315-1340位、1348-1355位、1366-1373位、1381-1413位、1417-1428位、1437-1444位、1453-1463位、1478-1484位、1490-1496位、1498-1503位、1520-1536位、1538-1546位、1548-1570位、1593-1603位、1612-1625位、1635-1649位、1654-1660位、1670-1687位、1693-1700位、1705-1711位、1718-1726位、1729-1763位、1790-1813位、1871-1881位、1893-1900位、1907-1935位、1962-1970位、1992-2000位、2006-2013位、2033-2039位、2045-2051位、2055-2067位、2070-2095位、2097-2110位、2115-2121位、2150-2171位、2174-2180位、2197-2202位、2206-2228位和1526-1560位;Seq ID No 179的第4-17位、35-48位、54-76位、78-107位、109-115位、118-127位、134-140位、145-156位、169-174位、217-226位、232-240位、256-262位、267-273位、316-328位、340-346位、353-360位、402-409位、416-439位、448-456位、506-531位、540-546位、570-578位、586-593位、595-600位、623-632位、662-667位、674-681位、689-705位、713-724位、730-740位、757-763位、773-778位、783-796位、829-835位、861-871位、888-899位、907-939位、941-955位、957-969位、986-1000位、1022-1028位、1036-1044位、1068-1084位、1095-1102位、1118-1124位、1140-1146位、1148-1154位、1168-1181位、1185-1190位、1197-1207位、1218-1226位、1250-1270位、1272-1281位、1284-1296位、1312-1319位、1351-1358位、1383-1409位、1422-1428位、1438-1447位、1449-1461位、1482-1489位、1504-1510位、1518-1527位、1529-1537位、1544-1551位、1569-1575位、1622-1628位、1631-1637位、1682-1689位、1711-1718位、1733-1740位、1772-1783位、1818-1834位、1859-1872位、1-64位和128-495位;Seq ID No 180的第8-28位、32-37位、62-69位、119-125位、137-149位、159-164位、173-189位、200-205位、221-229位、240-245位、258-265位、268-276位、287-293位、296-302位、323-329位和1-95位;SeqID No 181的第9-18位、25-38位、49-63位、65-72位、74-81位、94-117位、131-137位、139-146位、149-158位、162-188位、191-207位、217-225位、237-252位、255-269位、281-293位、301-326位、332-342位、347-354位、363-370位、373-380位、391-400位、415-424位、441-447位和75-107位;Seq ID No 182的第4-24位、64-71位、81-87位、96-116位、121-128位、130-139位、148-155位、166-173位、176-184位、203-215位、231-238位、243-248位、256-261位、280-286位、288-306位、314-329位和67-148位;Seq ID No 183的第4-10位、19-37位、46-52位、62-81位、83-89位、115-120位、134-139位、141-151位、168-186位、197-205位、209-234位、241-252位、322-335位、339-345位、363-379位、385-393位、403-431位、434-442位、447-454位、459-465位、479-484位、487-496位和404-420位;Seq ID No184的第10-35位、46-66位、71-77位、84-93位、96-122位、138-148位、154-172位、182-213位、221-233位、245-263位、269-275位、295-301位、303-309位、311-320位、324-336位、340-348位、351-359位、375-381位和111-198位;Seq ID No 185的第14-25位、30-42位、47-61位、67-75位、81-91位、98-106位、114-122位、124-135位、148-193位、209-227位和198-213;Seq ID No 186的第5-18位、45-50位、82-90位、97-114位、116-136位、153-161位、163-171位、212-219位、221-227位、240-249位、267-281位、311-317位、328-337位、375-381位、390-395位、430-436位、449-455位、484-495位、538-543位、548-554位、556-564位、580-586位、596-602位和493-606位;Seq ID No 187的第9-25位、28-34位、37-44位、61-68位、75-81位、88-96位、98-111位、119-133位、138-150位、152-163位、168-182位、186-194位、200-205位、216-223位、236-245位、257-264位、279-287位、293-304位、311-318位、325-330位、340-346位、353-358位、365-379位、399-409位、444-453位和303-391位;Seq ID No 188的第16-36位、55-61位、66-76位、78-102位、121-130位、134-146位、150-212位、221-239位、255-276位、289-322位、329-357位和29-59位;Seq ID No 189的第8-27位、68-74位、77-99位、110-116位、124-141位、171-177位、202-217位、221-228位、259-265位、275-290位、293-303位、309-325位、335-343位、345-351位、365-379位、384-394位、406-414位、423-437位、452-465位、478-507位、525-534位、554-560位、611-624位、628-651位、669-682位、742-747位、767-778位、782-792位、804-812位、820-836位、79-231和359-451位;Seq ID No 190的第5-28位、39-45位、56-62位、67-74位、77-99位、110-117位、124-141位、168-176位、200-230位、237-244位、268-279位、287-299位、304-326位、329-335位、348-362位、370-376位、379-384位、390-406位、420-429位、466-471位、479-489位、495-504位、529-541位、545-553位、561-577位、598-604位、622-630位、637-658位、672-680位、682-688位、690-696位、698-709位、712-719位、724-736位、738-746位、759-769位、780-786位、796-804位、813-818位、860-877位、895-904位、981-997位、1000-1014位、1021-1029位、1-162位、206-224位、254-350位、414-514位和864-938位;Seq ID No 191的第4-11位、19-49位、56-66位、68-101位、109-116位、123-145位、156-165位、177-185位、204-221位、226-234位、242-248位、251-256位、259-265位、282-302位、307-330位、340-349位、355-374位、377-383位、392-400位、422-428位、434-442位、462-474位和266-322位;Seq ID No 192的第14-43位、45-57位、64-74位、80-87位、106-127位、131-142位、145-161位、173-180位、182-188位、203-210位、213-219位、221-243位、245-254位、304-311位、314-320位、342-348位、354-365位、372-378位、394-399位、407-431位、436-448位、459-465位、470-477位、484-490位、504-509位、531-537位、590-596位、611-617位、642-647位、723-734位、740-751位、754-762位、764-774位、782-797位、807-812位、824-831位、838-845位、877-885位、892-898位、900-906位、924-935位、940-946位、982-996位、1006-1016位、1033-1043位、1051-1056位、1058-1066位、1094-1108位、1119-1126位、1129-1140位、1150-1157位、1167-1174位、1176-1185位、1188-1201位、1209-1216位、1220-1228位、1231-1237位、1243-1248位、1253-1285位、1288-1297位、1299-1307位、1316-1334位、1336-1343位、1350-1359位、1365-1381位、1390-1396位、1412-1420位、1427-1439位、1452-1459位、1477-1484位、1493-1512位、1554-1559位、1570-1578位、1603-1608位、1623-1630位、1654-1659位、1672-1680位、1689-1696位、1705-1711位、1721-1738位、1752-1757位、1773-1780位、1817-1829位、1844-1851位、1856-1863位、1883-1895位、1950-1958位、1974-1990位、172-354位、384-448位、464-644位、648-728位和1357-1370位;Seq ID No 193的第8-27位、68-74位、77-99位、110-116位、124-141位、169-176位、201-216位、220-227位、258-264位、274-289位、292-302位、308-324位、334-342位、344-350位、364-372位、377-387位、399-407位、416-429位、445-458位、471-481位、483-500位、518-527位、547-553位、604-617位、621-644位、662-675位、767-778位、809-816位、15-307位、350-448位和496-620位;Seq ID No 194的第4-17位、24-29位、53-59位、62-84位、109-126位、159-164位、189-204位、208-219位、244-249位、274-290位、292-302位、308-324位、334-342位、344-350位、378-389位、391-397位、401-409位、424-432位、447-460位、470-479位、490-504位、521-529位、538-544位、549-555位、570-577位、583-592位、602-608位、615-630位、635-647位、664-677位、692-698位、722-731位、733-751位、782-790位、793-799位、56-267位、337-426位和495-601位;Seq ID No 195的第12-22位、49-59位、77-89位、111-121位、136-148位、177-186位、207-213位、217-225位、227-253位、259-274位、296-302位、328-333位、343-354位、374-383位、424-446位、448-457位、468-480位、488-502位、507-522位、544-550位、553-560位、564-572位、587-596位、604-614位、619-625位、629-635位、638-656位、662-676位、680-692位、697-713位、720-738位、779-786位、833-847位、861-869位、880-895位、897-902位、911-917位、946-951位、959-967位、984-990位、992-1004位、1021-1040位、1057-1067位、1073-1080位和381-403位;Seq ID No 196的第4-10位、26-31位、46-56位、60-66位、70-79位、86-94位、96-102位、109-118位、132-152位、164-187位、193-206位、217-224位和81-149位;Seq ID No 197的第4-21位、26-37位、48-60位、71-82位、109-117位、120-128位、130-136位、142-147位、181-187位、203-211位、216-223位、247-255位、257-284位、316-325位、373-379位、395-400位、423-435位、448-456位、479-489位、512-576位、596-625位、641-678位、680-688位、692-715位和346-453位;Seq ID No 198的第10-16位、25-31位、34-56位、58-69位、71-89位、94-110位、133-176位、186-193位、208-225位、240-250位、259-266位、302-307位、335-341位、376-383位、410-416位和316-407位;Seq ID No199的第11-29位、42-56位、60-75位、82-88位、95-110位、116-126位、132-143位、145-160位、166-172位、184-216位和123-164位;Seq ID No 200的第11-29位、54-63位、110-117位、139-152位、158-166位、172-180位、186-193位、215-236位、240-251位、302-323位、330-335位、340-347位、350-366位、374-381位和252-299位;Seq ID No 201的第18-27位、35-42位、50-56位、67-74位、112-136位、141-153位、163-171位、176-189位、205-213位、225-234位、241-247位、253-258位、269-281位、288-298位、306-324位、326-334位、355-369位、380-387位和289-320位;Seq ID No 202的第7-15位、19-41位、56-72位、91-112位、114-122位、139-147位、163-183位、196-209位、258-280位、326-338位、357-363位、391-403位、406-416位和360-378位;Seq ID No 203的第11-18位、29-41位、43-49位、95-108位、142-194位、204-212位、216-242位、247-256位、264-273位和136-149位;Seq ID No 204的第18-24位、33-40位、65-79位、89-102位、113-119位、130-137位、155-161位、173-179位、183-203位、205-219位、223-231位、245-261位、267-274位、296-306位、311-321位、330-341位、344-363位、369-381位、401-408位、415-427位、437-444位、453-464位、472-478位、484-508位、517-524位、526-532位、543-548位和59-180位;Seq ID No205的第5-13位、52-65位、67-73位、97-110位、112-119位、134-155位和45-177位;Seq ID No 206的第6-28位、34-43位、57-67位、75-81位、111-128位、132-147位、155-163位、165-176位、184-194位、208-216位、218-229位、239-252位、271-278位、328-334位、363-376位、381-388位、426-473位、481-488位、492-498位、507-513位、536-546位、564-582位、590-601位、607-623位、148-269位、420-450位和610-648位;Seq ID No207的第4-12位、20-38位、69-75位、83-88位、123-128位、145-152位、154-161位、183-188位、200-213位、245-250位、266-272位、306-312位、332-339位、357-369位、383-389位、395-402位、437-453位、455-470位、497-503位和1-112位;Seq ID No 208的第35-59位、74-86位、111-117位、122-137位和70-154位;Seq ID No 209的第26-42位、54-61位、65-75位、101-107位、123-130位、137-144位、148-156位、164-172位、177-192位、213-221位、231-258位和157-249位;Seq ID No 210的第29-38位、61-67位、77-87位、94-100位、105-111位、118-158位和1-97位;Seq ID No 211的第7-21位、30-48位、51-58位、60-85位、94-123位、134-156位、160-167位、169-183位、186-191位、216-229位、237-251位、257-267位、272-282位、287-298位和220-243位;Seq ID No 212的第6-29位、34-47位、56-65位、69-76位、83-90位、123-134位、143-151位、158-178位、197-203位、217-235位、243-263位、303-309位、320-333位、338-348位、367-373位、387-393位、407-414位、416-427位、441-457位、473-482位、487-499位、501-509位、514-520位、530-535位、577-583位、590-602位、605-612位、622-629位、641-670位、678-690位、37-71位和238-307位;Seq ID No 213的第7-40位、121-132位、148-161位、196-202位、209-215位、221-235位、248-255位、271-280位、288-295位、330-339位、395-409位、414-420位、446-451位、475-487位、556-563位、568-575位、580-586位、588-595位、633-638位、643-648位、652-659位、672-685位、695-700位、710-716位、737-742位、749-754位、761-767位、775-781位、796-806位、823-835位、850-863位、884-890位、892-900位、902-915位、934-941位和406-521位;Seq ID No 214的第9-18位、24-46位、51-58位、67-77位、85-108位、114-126位、129-137位、139-146位、152-165位、173-182位、188-195位、197-204位、217-250位、260-274位、296-313位、343-366位、368-384位、427-434位、437-446位、449-455位、478-484位、492-506位、522-527位、562-591位、599-606位、609-618位、625-631位、645-652位和577-654位;Seq ID No 215的第13-20位、26-37位、41-53位、56-65位、81-100位、102-114位、118-127位、163-188位、196-202位、231-238位、245-252位、266-285位、293-298位、301-306位和19-78位;Seq ID No 216的第10-23位、32-42位、54-66位、73-91位、106-113位、118-127位、139-152位、164-173位、198-207位、210-245位、284-300位、313-318位、330-337位、339-346位、354-361位、387-393位、404-426位、429-439位、441-453位、467-473位、479-485位、496-509位、536-544位、551-558位、560-566位、569-574位、578-588位、610-615位、627-635位、649-675位、679-690位、698-716位、722-734位、743-754位、769-780位、782-787位和480-550位;Seq ID No 217的第6-39位、42-50位、60-68位、76-83位、114-129位、147-162位、170-189位、197-205位、217-231位、239-248位、299-305位、338-344位、352-357位、371-377位、380-451位、459-483位、491-499位、507-523位、537-559位、587-613位、625-681位、689-729位、737-781位、785-809位、817-865位、873-881位、889-939位、951-975位、983-1027位、1031-1055位、1063-1071位、1079-1099位、1103-1127位、1151-1185位、1197-1261位、1269-1309位、1317-1333位、1341-1349位、1357-1465位、1469-1513位、1517-1553位、1557-1629位、1637-1669位、1677-1701位、1709-1725位、1733-1795位、1823-1849位、1861-1925位、1933-1973位、1981-2025位、2029-2053位、2061-2109位、2117-2125位、2133-2183位、2195-2219位、2227-2271位、2275-2299位、2307-2315位、2323-2343位、2347-2371位、2395-2429位、2441-2529位、2537-2569位、2577-2601位、2609-2625位、2633-2695位、2699-2737位、2765-2791位、2803-2867位、2889-2913位、2921-2937位、2945-2969位、2977-2985位、2993-3009位、3023-3045位、3073-3099位、3111-3167位、3175-3215位、3223-3267位、3271-3295位、3303-3351位、3359-3367位、3375-3425位、3437-3461位、3469-3513位、3517-3541位、3549-3557位、3565-3585位、3589-3613位、3637-3671位、3683-3747位、3755-3795位、3803-3819位、3827-3835位、3843-3951位、3955-3999位、4003-4039位、4043-4115位、4123-4143位、4147-4171位、4195-4229位、4241-4305位、4313-4353位、4361-4377位、4385-4393位、4401-4509位、4513-4557位、4561-4597位、4601-4718位、4749-4768位、74-171位、452-559位和2951-3061位;Seq ID No 218的第16-22位、30-51位、70-111位、117-130位、137-150位、171-178位、180-188位、191-196位和148-181位;Seq ID No219的第6-19位、21-46位、50-56位、80-86位、118-126位、167-186位、189-205位、211-242位、244-267位、273-286位、290-297位、307-316位、320-341位和34-60位;Seq ID No 220的第5-26位、33-43位、48-54位、58-63位、78-83位、113-120位、122-128位、143-152位、157-175位、185-192位、211-225位、227-234位、244-256位、270-281位、284-290位、304-310位、330-337位、348-355位、362-379位、384-394位、429-445位、450-474位、483-490位、511-520位、537-546位、548-554位、561-586位、590-604位、613-629位、149-186位、285-431位和573-659位;Seq ID No 221的第5-26位、49-59位、61-67位、83-91位、102-111位、145-157位、185-192位、267-272位、279-286位、292-298位、306-312位、134-220位、235-251位和254-280位;Seq ID No 222的第5-19位、72-79位、83-92位、119-124位、140-145位、160-165位、167-182位、224-232位、240-252位、259-270位、301-310位、313-322位、332-343位、347-367位、384-398位、416-429位、431-446位、454-461位和1-169位;Seq ID No 223的第8-17位、26-31位、56-62位、75-83位、93-103位、125-131位、135-141位、150-194位、205-217位、233-258位、262-268位、281-286位和127-168位;Seq ID No 224的第6-12位、69-75位、108-115位、139-159位、176-182位、194-214位和46-161位;Seq ID No 225的第6-13位、18-27位、39-48位、51-59位、66-73位、79-85位、95-101位、109-116位、118-124位、144-164位、166-177位、183-193位、197-204位、215-223位、227-236位、242-249位、252-259位、261-270位、289-301位、318-325位和12-58位;Seq ID No 226的第4-10位、26-32位、48-60位、97-105位、117-132位、138-163位、169-185位、192-214位、219-231位、249-261位、264-270位、292-308位、343-356位、385-392位、398-404位、408-417位、435-441位和24-50位;Seq ID No 227的第10-40位、42-48位、51-61位、119-126位和1-118位;Seq ID No 228的第5-17位、40-58位、71-83位、103-111位、123-140位、167-177位、188-204位和116-128位;Seq ID No 229的第4-9位、11-50位、57-70位、112-123位、127-138位和64-107位;Seq ID No 230的第9-39位、51-67位和1-101位;Seq ID No231的第5-14位、17-25位、28-46位、52-59位、85-93位、99-104位、111-120位、122-131位、140-148位、158-179位、187-197位、204-225位、271-283位、285-293位和139-155位;Seq ID No 232的第42-70位、73-90位、92-108位、112-127位、152-164位、166-172位、181-199位、201-210位、219-228位、247-274位、295-302位、322-334位、336-346位、353-358位、396-414位、419-425位、432-438位、462-471位、518-523位、531-536位、561-567位、576-589位、594-612位、620-631位、665-671位、697-710位、718-731位、736-756位、765-771位、784-801位和626-653位;Seq ID No 233的第8-28位、41-51位、53-62位、68-74位、79-85位、94-100位、102-108位、114-120位、130-154位、156-162位、175-180位、198-204位、206-213位、281-294位、308-318位、321-339位、362-368位、381-386位、393-399位、407-415位和2-13位;Seq ID No 234的第4-39位、48-65位、93-98位、106-112位、116-129位和10-36位;Seq ID No 235的第25-32位、35-50位、66-71位、75-86位、90-96位、123-136位、141-151位、160-179位、190-196位、209-215位、222-228位、235-242位、257-263位、270-280位和209-247位;Seq IDNo 236的第5-29位、31-38位、50-57位、62-75位、83-110位、115-132位、168-195位、197-206位、216-242位、249-258位、262-269位、333-340位、342-350位、363-368位、376-392位、400-406位、410-421位、423-430位、436-442位、448-454位、460-466位、471-476位、491-496位、511-516位、531-536位、551-556位、571-576位、585-591位、599-605位、27-70位、219-293位、441-504位和512-584位;Seq ID No 237的第4-12位、14-34位、47-75位、83-104位、107-115位、133-140位、148-185位、187-196位、207-212位、224-256位、258-265位、281-287位、289-296位、298-308位、325-333位、345-355位、365-371位、382-395位、424-435位、441-457位、465-472位、483-491位、493-505位、528-534位、536-546位、552-558位、575-584位、589-600位、616-623位和576-591位;Seq ID No 238的第4-76位、78-89位、91-126位、142-148位、151-191位、195-208位、211-223位、226-240位、256-277位、279-285位、290-314位、317-323位、358-377位、381-387位、391-396位、398-411位、415-434位、436-446位、454-484位、494-512位、516-523位、538-552位、559-566位、571-577位、579-596位、599-615位、620-627位、635-644位、694-707位、720-734位、737-759位、761-771位和313-329位;Seq ID No 239的第7-38位、44-49位、79-89位、99-108位、117-123位、125-132位、137-146位、178-187位、207-237位、245-255位、322-337位、365-387位、398-408位、445-462位、603-608位、623-628位、644-650位、657-671位、673-679位和111-566位;Seq ID No 240的第6-20位、22-35位、39-45位、58-64位、77-117位、137-144位、158-163位、205-210位、218-224位、229-236位、239-251位、263-277位、299-307位、323-334位、353-384位、388-396位、399-438位、443-448位、458-463位、467-478位、481-495位、503-509位、511-526位、559-576位、595-600位、612-645位、711-721位、723-738位、744-758位、778-807位和686-720位;Seq IDNo 241的第10-33位、35-41位、72-84位、129-138位、158-163位、203-226位、243-252位、258-264位、279-302位、322-329位、381-386位、401-406位、414-435位和184-385位;Seq ID No 242的第4-9位、19-24位、41-47位、75-85位、105-110位、113-146位和45-62位;Seq ID No 243的第4-25位、52-67位、117-124位、131-146位、173-180位、182-191位、195-206位、215-221位、229-236位、245-252位、258-279位、286-291位、293-302位、314-320位、327-336位、341-353位、355-361位、383-389位和1-285位;Seq ID No 244的第14-32位、38-50位、73-84位、93-105位、109-114位和40-70位;Seq ID No 245的第5-26位和22-34位;Seq ID No 246的第23-28位和13-39位;Seq ID No 247的第8-14位和21-34位;Seq ID No 248的第4-13位、20-29位、44-50位、59-74位和41-69位;Seq ID No 249的第4-9位、19-42位、48-59位、71-83位和57-91位;Seq ID No 250的第4-14位和10-28位;Seq ID No 251的22-28位、32-42位、63-71位、81-111位、149-156位、158-167位、172-180位、182-203位、219-229位和27-49位;Seq ID No 252的第17-27位和23-32位;Seq ID No 253的第18-24位和28-38位;Seq ID No 254的第9-15位和13-27位;Seq ID No 255的第13-22位和18-29位;Seq ID No 256的第17-26位和2-11位;Seq ID No 257的第4-33位和16-32位;Seq ID No 258的第4-10位、37-43位、54-84位、92-127位和15-62位;Seq ID No 259的第4-14位、20-32位、35-60位、69-75位、79-99位、101-109位、116-140位和124-136位;Seq ID No 260的第2-13位;Seq ID No 261的第4-13位、28-42位和42-57位;Seq ID No 262的第4-14位、27-44位和14-35位;Seq ID No263的第4-12位和1-27位;Seq ID No 264的第4-18位、39-45位、47-74位和35-66位;Seq ID No 265的第8-20位、43-77位和17-36位;Seq ID No 266的第4-30位、35-45位、51-57位和35-49位;Seq ID No 267的第4-24位、49-57位和15-34位;Seq ID No 268的第4-22位和8-27位;Seq ID No 269的第13-25位、32-59位、66-80位和21-55位;Seq ID No 270的第4-10位、24-33位、35-42位、54-65位、72-82位、98-108位和15-30位;Seq ID No 271的第8-19位和17-47位;Seq ID No 272的第12-18位、40-46和31-52位;Seq ID No 273的第4-20位、35-78位、83-102位、109-122位和74-86位;Seq ID No 274的第7-17位、21-41位、46-63位和2-20位;Seq ID No 275的第30-37位和2-33位;Seq ID No 276的第4-13位、17-25位和1-15位;Seq ID No 277的第17-31位、44-51位和20-51位;Seq ID No 278的第20-30位和5-23位;Seq ID No279的第13-33位、48-71位和92-110位;Seq ID No 280的第4-9位、50-69位、76-88位、96-106位、113-118位和12-34位;Seq ID No 281的第4-24位和6-26位;Seq ID No 282的第7-26位和14-30位;Seq ID No 283的第9-39位、46-68位、75-82位、84-103位和26-44位;Seq ID No 284的第4-30位、33-107位和58-84位;Seq ID No 285的第4-12位和9-51位;Seq ID No 286的第12-18位、29-37位和6-37位;Seq ID No 287的第4-21位、33-52位、64-71位和16-37位;Seq ID No 288的第9-19位和2-30位;Seq ID No 245的第20-37位;SeqID No 246的第8-27位;Seq ID No 247的第10-27位;Seq ID No 248的第42-59位和52-69位;Seq ID No 249的第63-80位和74-91位;Seq ID No 250的第11-28位;Seq ID No 251的第28-49位;Seq ID No 252的第15-32位;Seq ID No 253的第4-20位;Seq ID No 254的第10-27位;Seq ID No 255的第17-34位;Seq ID No 256的第1-18位;Seq ID No 257的第16-33位;SeqID No 258的第16-36位、30-49位和43-62位;Seq ID No 259的第122-139位;Seq ID No 260的1-18位;Seq ID No 261的第41-58位;Seq ID No 262的第15-35位;Seq ID No 263的第2-27位;Seq ID No 265的第18-36位;Seq IDNo 266的第34-51位;Seq ID No 268的第9-27位;Seq ID No 269的第22-47位;Seq ID No 271的第18-36位和29-47位;Seq ID No 272的第32-52位;Seq ID No 273的第72-89位;Seq ID No 274的第3-20位;Seq ID No 275的第3-21位和15-33位;Seq ID No 276的第1-18位;Seq ID No 278的第6-23位;Seq ID No 279的第93-110位;Seq ID No 280的第13-34位;Seq ID No281的第7-26位和9-26位;Seq ID No 282的第16-33位;Seq ID No 283的第27-44位;Seq ID No 284的第67-84位;Seq ID No 285的第10-33位和26-50位;Seq ID No 286的第7-25位和19-37位;Seq ID No 287的第17-37位;SeqID No 288的第3-20位和13-30位;Seq ID No 145的第62-80位和75-93位;Seq ID No 147的第92-108位;Seq ID No 148的第332-349位、177-200位和1755-1777位;Seq ID No 149的第109-133位、149-174位、260-285位和460-485位;Seq ID No 150的第26-47位和42-64位;Seq ID No 151的第22-41位、35-54位、115-130位、306-325位、401-420位和454-478位;Seq ID No155的第22-45位;Seq ID No 160的第156-174位、924-940位、1485-1496位、1447-1462位和1483-1498位;Seq ID No 161的第457-475位;Seq ID No163的第302-325位;Seq ID No 164的第288-305位;Seq ID No 165的第244-266位和260-282位;Seq ID No 166的第204-225位和220-241位;Seq IDNo 167的第324-345位、340-361位、356-377位、372-393位和388408位;Seq ID No 168的第39-64位;Seq ID No 169的第54-76位和70-92位;Seq IDNo 170的第1227-1247位、1539-1559位、1554-1574位、1569-1589位、1584-1604位、1242-1262位、1272-1292位、1287-1308位、1456-1477位、1472-1494位、1488-1510位和1505-1526位;Seq ID No 172的第351-368位;Seq ID No 173的第179-200位、195-216位、211-232位、227-248位和243-263位;Seq ID No 174的第13-37位;Seq ID No 175的第208-224位;Seq ID No177的第42-64位、59-81位、304-328位、323-348位、465-489位、968-992位、1399-1418位、1412-1431位和2092-2111位;Seq ID No 178的第1528-1547位和1541-1560位;Seq ID No 179的第184-200位、367-388位、382-403位、409-429位、425-444位和438-457位;Seq ID No 180的第27-50位和45-67位;Seq ID No 183的第114-131位和405-419位;Seq ID No 184的第113-134位、129-150位、145-166位、161-182位和177-198位;Seq ID No186的第495-515位;Seq ID No 187的第346-358位;Seq ID No 190的第208-224位;Seq ID No 192的第178-194位、202-223位、217-238位、288-308位和1355-1372位;Seq ID No 194的第57-78位;Seq ID No 197的第347-369位、364-386位、381-403位、398-420位、415-437位和432-452位;Seq ID No198的第347-372位;Seq ID No 199的第147-163位;Seq ID No 200的第263-288位;Seq ID No 202的第361-377位;Seq ID No 204的第82-104位、99-121位、116-138位、133-155位和150-171位;Seq ID No 205的第110-130位和125-145位;Seq ID No 206的第613-631位、626-644位和196-213位;Seq ID No 208的第78-100位、95-117位、112-134位和129-151位;Seq ID No209的第158-180位、175-197位、192-214位、209-231位和226-248位;SeqID No 210的第30-50位、45-65位和60-79位;Seq ID No 213的第431-455位和450-474位;Seq ID No 214的第579-601位、596-618位、613-635位和630-653位;Seq ID No 217的第920-927位、98-119位、114-135位、130-151位、146-167和162-182位;Seq ID No 219的第36-59位;Seq ID No 220的第194-216位和381-404位;Seq ID No 221的第236-251位和255-279位;SeqID No 222的第80-100位和141-164位;Seq ID No 223的第128-154位;SeqID No 224的第82-100位、95-116位和111-134位;Seq ID No 227的第55-76位、71-92位和87-110位;Seq ID No 229的第91-106位;Seq ID No 230的第74-96位;Seq ID No 231的第140-157位;Seq ID No 233的第4-13位;SeqID No 236的第41-65位和499-523位;Seq ID No 239的第122-146位、191-215位、288-313位、445-469位和511-535位;Seq ID No 241的第347-368位;Seq ID No 242的第46-61位;Seq ID No 243的第15-37位、32-57位、101-121位、115-135位、138-158位、152-172位、220-242位和236-258位,以及含所述序列的至少6个、优选8个以上、尤其是10个以上氨基酸以及优选地不超过70、50、40、20、15、11个氨基酸的片段。所有这些片段个别地且各自独立的形成本发明的优选方面。
用一组具有至少10个氨基酸长且有1个氨基酸重叠的肽通过分析蛋白质抗原的完整序列可鉴定具体抗原的所有线性超免疫血清反应性片段。随后,用已表达的全长蛋白质或其结构域多肽通过分析与超免疫血清在一起的蛋白质抗原可鉴定非线性表位。假如蛋白质的独特结构域足以形成不依赖于其天然蛋白质的3D结构,分析与超免疫血清在一起的相应重组或合成产生的结构域多肽可鉴定多结构域蛋白质的个别结构域内的构象表位。对于那些其中的结构域具有线性表位以及构象表位的抗原而言,可以利用对应于线性表位的肽进行的竞争性实验确认构象表位的存在。
应该理解的是,本发明还尤其涉及编码上述片段的核酸分子、与编码所述片段的核酸分子杂交的核酸分子、尤其是那些在严紧条件下杂交的核酸分子以及用于扩增编码所述片段的核酸分子的核酸分子,诸如PCR引物。在这些方面,如上所讨论的,优选的核酸分子是与优选片段相应的那些核酸分子。
本发明还涉及含有核酸分子或本发明的核酸分子的载体、用本发明载体遗传改造过的宿主细胞和用重组技术生产超免疫血清反应性抗原及其片段。
可以将多种表达载体用于表达按照本发明的超免疫血清反应性抗原或其片段。通常,在宿主中适于维持、增殖或表达核酸从而表达多肽的任何载体都可用于这方面的表达。依照本方面的这一方面,载体可以是,例如,质粒载体、单链或双链噬菌体载体、单链或双链RNA或DNA病毒载体。本文所公开的起始质粒可商购获得、可公众获得或可通过常规应用众所周知的已发表方法从可获得的质粒进行构建。在某些方面,载体中优选的是用于表达本发明的核酸分子和超免疫血清反应性抗原或其片段的那些载体。宿主细胞中的核酸构建体可以常规方式用于生产由所述重组序列编码的基因产物。或者,可以通过传统的肽合成仪合成性产生本发明的超免疫血清反应性抗原及其片段。成熟蛋白质可在适当启动子的调控下表达于哺乳动物细胞、酵母、细菌或其它细胞中。使用来自本发明DNA构建体的RNA,还可将无细胞翻译体系应用于生产这些蛋白质。
可对宿主细胞进行遗传改造以引入核酸分子并表达本发明的核酸分子。适当宿主的代表性实例包括细菌细胞,诸如链球菌(streptococci)、葡萄球菌(staphylococci)、大肠杆菌(E.coli)、链霉菌(Streptomyces)和枯草芽孢杆菌(Bacillus subtillis)细胞;真菌细胞,诸如酵母细胞和曲霉菌(Aspergillus)细胞;昆虫细胞,诸如果蝇S2和Spodoptera Sf 9细胞;动物细胞,诸如CHO、COS、Hela、C127、3T3、BHK、293和Bowes黑素瘤细胞;和植物细胞。
本发明还提供了生产肺炎链球菌超免疫血清反应性抗原及其片段的方法,所述方法包括从宿主细胞表达由本发明所提供的核酸分子编码的超免疫血清反应性抗原或其片段。本发明还提供了生产表达肺炎链球菌超免疫血清反应性抗原或其片段的细胞的方法,所述方法包括用按照本发明的载体转化或转染合适的宿主细胞从而使被转化或转染的细胞表达由包含在所述载体中的核酸编码的多肽。
多肽可以以修饰过的形式,诸如融合蛋白进行表达,而且不仅可包含分泌信号,还可包含附加的异源功能区域。因此,例如,可以将附加氨基酸的区域,尤其是带电荷氨基酸,加入多肽的N-或C-末端以便在纯化期间或随后的操作和贮存期间提高其在宿主细胞中的稳定性和持久性。此外,可以将区域加入多肽中以促进纯化。这些区域可在该多肽最终制备步骤前进行去除。其中,在多肽中添加肽部分产生分泌物或排泄物以提高稳定性或促进纯化是本领域中熟知和常规的技术。优选的融合蛋白包含来自免疫球蛋白且对溶解或纯化多肽有效的异源区段。例如,EP-A-O 464 533(加拿大副本2045869)公开了含免疫球蛋白分子恒定区多个部分以及另一蛋白质或其部分的融合蛋白。在药物开发中,例如,为了高通量筛选检测的目的将蛋白质与抗体Fc部分融合以鉴定拮抗剂。参阅,例如,{Bennett,D.等,1995}和{Johanson,K.等,1995}。
肺炎链球菌超免疫血清反应性抗原或其片段可通过众所周知的方法从重组细胞培养物中进行回收和纯化,所述方法包括硫酸铵或乙醇沉淀、酸提取、阴离子或阳离子交换层析、磷酸纤维素层析、疏水相互作用层析、羟磷灰石层析和外源凝集素层析。
按照本发明的超免疫血清反应性抗原及其片段可通过化学合成以及生物技术手段产生。后者包括用含有按照本发明的核酸的载体转染或转化宿主细胞并在本领域技术人员已知的条件下培养已被转染或已被转化的宿主细胞。生产方法还可包括纯化步骤以纯化或分离待制备的多肽。在优选实施方案中,所述载体是按照本发明的载体。
按照本发明的超免疫血清反应性抗原及其片段可用于检测样品中的某种或几种生物体,所述样品含这些生物体或其来源多肽。优选地,这种检测是用于诊断的,更优选用于疾病的诊断,最优选用于诊断与革兰氏阳性细菌,尤其是选自包含链球菌、葡萄球菌和乳酸球菌(1actococci)的组中细菌的存在或多度相关或有联系的疾病。更优选地,微生物选自包含无乳链球菌(Streptococcus agalactiae)、化脓链球菌(Streptococcus pyogenes)和变异链球菌(Streptococcus mutans)的组,尤其是所述微生物为化脓链球菌。
本发明还涉及诊断检测法诸如用于检测本发明超免疫血清反应性抗原及其片段在细胞和组织中水平的定量和诊断检测中,其包括正常和异常水平的测定。因而,例如,依照本发明用于检测较正常对照组织样品而言过量表达的多肽的诊断检测法可用于检测感染的存在,例如,和识别正被感染的生物体。可用于确定宿主来源样品中多肽水平的检测技术是本领域技术人员众所周知的。这些检测方法包括放射免疫检测法、竞争性结合检测法、蛋白质印迹分析和ELISA检测法。其中,ELISA是常常优选的。ELISA检测最初包括制备特异于所述多肽的抗体,优选单克隆抗体。此外,通常制备与所述单克隆抗体结合的报道抗体。所述报道抗体附着于可检测试剂诸如放射性试剂、荧光试剂或酶促试剂,诸如辣根过氧化物酶。
按照本发明的超免疫血清反应性抗原及其片段还可用于阵列的目的或连同阵列使用。更具体而言,可将至少一个按照本发明的超免疫血清反应性抗原及其片段固定于支持物上。所述支持物典型地包含各种超免疫血清反应性抗原及其片段,凭此通过使用一种或数种按照本发明的超免疫血清反应性抗原及其片段和/或不同的超免疫血清反应性抗原及其片段可建立多样性。这种阵列的特征性质,以及一般而言任何阵列的特征性质,是将独特的多肽固定于所述支持物或其表面的独特的或预定区域或位置。因此,阵列的独特位置或区域的任一活性可与具体的多肽相关。固定于支持物上的不同超免疫血清反应性抗原及其片段的数目可以从少到10个到数千个不同的超免疫血清反应性抗原及其片段之间变化。在优选的实施方案中,每cm2的超免疫血清反应性抗原及其片段的密度少到每cm2 10个肽/多肽到每cm2至少400个不同的肽/多肽,且更具体地是每cm2至少1000个不同的超免疫血清反应性抗原及其片段。
这种阵列的制备是本领域技术人员已知的,例如,描述于美国专利5,744,309。阵列优选地包含一个平面、多孔或非多孔且具有至少第一个表面的固体支持物。将如本文所公开的超免疫血清反应性抗原及其片段固定于所述的表面上。优选的支持物材料尤其是玻璃或纤维素。用于本文所述任一诊断应用中的阵列也在本发明的范围内。除了按照本发明的超免疫血清反应性抗原及其片段之外,还可以将按照本发明的核酸分子用于上述阵列的产生中。本申请也适用于抗体构成的阵列,优选地,所述抗体尤其是本文所述的单克隆抗体。
另一方面,本发明涉及指向按照本发明的任一超免疫血清反应性抗原及其片段、衍生物或其片段的抗体。本发明包括,例如,单克隆和多克隆抗体、嵌合的、单链的和人源化的抗体,以及Fab片段或Fab表达文库的产物。在本发明范围内的是所述抗体可以是嵌合的,即,其不同部分来源自不同物种或至少各自的序列取自不同的物种。
针对相应于本发明序列的超免疫血清反应性抗原及其片段产生的抗体可通过将超免疫血清反应性抗原及其片段直接注射入动物中或通过将超免疫血清反应性抗原及其片段施用于动物,优选非人动物而获得。然后由此获得的抗体与超免疫血清反应性抗原及其片段自身结合。以这种方式,即使只编码超免疫血清反应性抗原及其片段的片段的序列也可用于产生结合完整天然超免疫血清反应性抗原及其片段的抗体。然后,将所述的抗体用于从表达那些超免疫血清反应性抗原及其片段的组织中分离超免疫血清反应性抗原及其片段。
为了制备单克隆抗体,可以使用本领域已知的提供以连续细胞系培养产生的抗体的任何技术。(如,最初在{Kohler,G.等,1975}中所述的。)
用于产生单链抗体的所述技术(美国专利号4,946,778)可适用于生产针对按照本发明免疫原性超免疫血清反应性抗原及其片段的单链抗体。此外,可以将转基因小鼠,或其它生物体诸如其它哺乳动物用于表达针对按照本发明的免疫原性超免疫血清反应性抗原及其片段的人源化抗体。
或者,噬菌体展示技术或核糖体展示可应用于选择对超免疫血清反应性抗原及其片段具结合活性的抗体基因,它们可来自为具有相应靶抗原而筛选的人淋巴细胞的PCR扩增v-基因的全部组分或来自天然的文库{McCafferty,J.等1990};{Marks,J.等,1992}。还可以通过链的改组来提高这些抗体的亲合力{Clackson,T.等,1991}。
如果存在两个抗原结合结构域,每个结构域可直接针对不同表位-被称为“双特异性的”抗体。
可以将上述抗体应用于分离或鉴定表达超免疫血清反应性抗原及其片段的克隆或通过将抗体附着于固体支持物上进行亲和层析分离和/或纯化来纯化本发明的超免疫血清反应性抗原及其片段。
因此,特别地,可将针对本发明超免疫血清反应性抗原及其片段的抗体应用于抑制和/或治疗感染,特别是细菌感染,尤其是由肺炎链球菌引起的感染。
超免疫血清反应性抗原及其片段包括形成本发明的具体的一个方面的抗原性、表位性或免疫学等价衍生物。用于本文时,术语“抗原等价衍生物”涵盖被某些抗体特异性识别的超免疫血清反应性抗原及其片段或其等价物,在所述抗体针对按照本发明的蛋白质或超免疫血清反应性抗原及其片段产生后,其干扰了病原体和哺乳动物宿主之间的相互作用。用于本文时,术语“免疫学等价衍生物”涵盖肽或其等价物,当将它们用于适当制剂中以在脊椎动物中产生抗体时,所述抗体发挥了干扰病原体和哺乳动物宿主之间相互作用的功能。
可将超免疫血清反应性抗原及其片段,诸如抗原性或免疫学等价衍生物或它们的融合蛋白用作抗原来免疫小鼠或其它动物诸如大鼠或鸡。融合蛋白可为超免疫血清反应性抗原及其片段提供稳定性。所述抗原可以例如通过偶联与例如牛血清白蛋白(BSA)或匙孔血蓝蛋白(KLH)的免疫原性载体蛋白联合。或者,包含多拷贝所述蛋白质或超免疫血清反应性抗原及其片段或抗原性或免疫学等价的超免疫血清反应性抗原及其片段的抗原性肽对于提高免疫原性而言可具有足够的抗原性,从而避免了载体的使用。
优选地,对抗体或其衍生物进行修饰使其在个体中的免疫原性降低。例如,如果所述个体是人,最优选对抗体进行人源化,其中将杂交瘤衍生抗体的互补性决定区移植入人的单克隆抗体内,例如如{Jones,P.等,1986}或{Tempest,P.等,1991}所述。
本发明的多核苷酸在遗传免疫中的应用优选地采用合适的运送方法,诸如将质粒DNA直接注射入肌肉中、运送与特定的蛋白质载体复合的DNA、DNA与磷酸钙共沉淀、将DNA封装入各种形式的脂质体中、微粒轰击{Tang,D.等,1992},{Eisenbraun,M.等,1993}以及用克隆的逆转录病毒载体进行体内感染{Seeger,C.等,1984}。
另一方面,本发明涉及与按照本发明的任一超免疫血清反应性抗原及其片段结合的肽,以及制备这种肽的方法,其中该方法的特征在于按照本发明的超免疫血清反应性抗原及其片段的应用,且基本的步骤是本领域技术人员所已知的。
可以使用依照现有技术的方法诸如噬菌体展示或核糖体展示产生这些肽。在噬菌体展示的情形下,基本上肽库是以噬菌体的形式产生的,且将此类文库与靶分子接触,所述靶分子在本情形中是按照本发明的超免疫血清反应性抗原及其片段。随后从各自的反应液中除去与靶分子结合的肽,优选地,除去作为与靶分子结合的复合物的肽。本领域技术人员已知的是,结合特征,至少一定程度上,取决于具体实现的实验安排,诸如盐浓度等。将以较高的亲和力或较大的力与靶分子结合的那些肽从文库中未结合的成员中分离出来后,以及任选的同样在将靶分子从靶分子和肽的复合物中移去后,可以随后对相应的肽进行特征鉴定。在特征鉴定前,可诸如,例如通过增殖编码肽的噬菌体,任选地进行扩增步骤。所述特征鉴定,优选地包括对靶结合肽进行测序。基本上,所述的肽不局限于其长度,不过,优选地以相应的方法获得长度为大约8-20个氨基酸的肽。文库的大小可以介于大约102-1018种不同的肽,优选地108-1015种不同的肽,但并不局限于此。
结合超免疫血清反应性抗原及其片段的靶的具体形式是特别在德国专利申请DE 197 42 706中所述的所谓“抗促成素”(anticalines)。
另一方面,本发明涉及与按照本发明的任一超免疫血清反应性抗原及其片段相互作用的的功能性核酸,以及制备这种功能性核酸的方法,其中该方法的特征在于按照本发明的超免疫血清反应性抗原及其片段的应用,而基本的步骤则是本领域技术人员所已知的。功能性核酸优选为适体和spiegelmers。
适体是单链或双链且特异与靶分子相互作用的D-核酸。适体的制备和选择参见,例如欧洲专利EP 0 533 838所述的。基本上采用了以下步骤。首先,提供核酸的混合物,即,可能的适体,其中每一核酸典型地包含数个、优选至少8个连续的随机核苷酸的区段。此混合物随后与靶分子接触,从而诸如基于与候选混合物相比,该混合物对靶分子增加的亲和力或对其更大的力,所述核酸与靶分子结合。结合的核酸(一个或多个分子)随后从留下的混合物中分离出来。任选地,使用例如聚合酶链式反应扩增由此获得的核酸。这些步骤可重复数次结果得到具有特异结合靶分子的增加的比率核酸的混合物,然后任选地从中选择最终结合的核酸。将这些特异性结合的核酸称为适体。显而易见在产生或鉴定个体混合物的适体样品的方法的任一阶段,都可用标准技术测定核酸序列。可通过例如引入产生的适体的为本领域技术人员已知的限定的化学基团使适体稳定,这也在本发明的范围内。这样的修饰可以,例如,存在于在核苷酸的糖基部分2’位置处引入氨基。目前将适体用作治疗剂。不过,可以将由此选择或产生的适体用于靶分子的确认和/或用于药物开发,优选地,以小分子为基础的药物开发的前导物质,这也在本发明的范围内。这事实上是通过竞争性试验完成的,其中候选药物通过从靶分子和适体的复合物中替代出适体而抑制靶分子和适体之间的相互作用,假设各个候选药物可特异性抑制靶分子和适体之间的相互作用,且如果相互作用是特异性的,所述的候选药物将,至少原则上,适于封闭靶分子并因此降低其在含所述靶分子的相应体系中的生物利用度或活性。然后,可以将由此获得的小分子进一步的衍生化和修饰以使其物理、化学、生物学和/或医学特性,诸如毒性、特异性、生物降解性和生物利用度优化。
Spiegelmer及其产生或制备是基于相似的原理。spiegelmer的制备描述于国际专利申请WO 98/08856。Spiegelmer是L-核酸,这意味着它们是由L-核苷酸而非象适体那样由D-核苷酸组成的。Spiegelmer的特征在于它们在生物学体系中具有非常高的稳定性,并且与适体相比,特异性地与它们所针对的靶分子相互作用。在spiegelmer产生过程中,建立了一群异源D-核酸,将所述的那群异源D-核酸与靶分子的光学对映体接触,在本情形中其是例如按照本发明的超免疫血清反应性抗原及其片段的天然存在L-对映体的D-对映体。随后,分离不与靶分子的光学对映体相互作用的那些D-核酸。但是分离那些与靶分子的光学对映体相互作用的那些D-核酸,对其任选地进行鉴定和/或测序并随后基于获自D-核酸的核酸序列信息合成相应的L-核酸。这些L-核酸与天然存在的靶分子而非其光学对映体特异相互作用,所述L-核酸在序列方面与和上述的与靶分子的光学对映体相互作用的D-核酸相同。与适体产生方法类似,也可能数次重复各个步骤并因此富集与靶分子的光学对映体特异性相互作用的那些核酸。
另一方面,本发明涉及与按照本发明的任何核酸分子相互作用的功能性核酸,以及用于制备所述功能性核酸的方法,其中该方法的特征在于使用了按照本发明的核酸分子及其相应序列且基本步骤是本领域技术人员所已知的。功能性核酸优选地是核酶、反义寡核苷酸和siRNA。
核酶是具有催化活性的核酸,其优选地由基本上包括两部分的RNA组成。第一部分显示出催化活性,而第二部分负责与靶核酸的特异性相互作用,在本情形中所述靶核酸是编码按照本发明的超免疫血清反应性抗原及其片段的核酸。基于靶核酸与核酶第二部分之间的相互作用,典型地通过杂交和在两条杂交链上基本上互补的碱基序列的Watson-Crick碱基配对,可活化催化活性部分,这意味着如果所述核酶的催化活性是磷酸二酯酶活性,那么它在分子内或分子间催化靶核酸。随后,靶核酸可以进一步降解,这最终导致了靶核酸以及来源自所述靶核酸的蛋白质的降解。核酶、其用途和设计原则是本领域技术人员所已知的,并且例描述于{Doherty,E.等,2001}和{Lewin,A.等,2001}。
用于药物制备及作为诊断剂的反义寡核苷酸的活性和设计分别基于相似的作用模式。基本上,反义寡核苷酸的杂交基于与靶RNA的碱基互补,优选地与mRNA的碱基互补,从而激活RNase H。RNase H被磷酸二酯和硫代磷酸酯二者偶联的DNA激活。不过,磷酸二酯偶联的DNA被细胞核酸酶快速降解,而硫代磷酸酯偶联的DNA则不会。这些抗性、非天然存在的DNA衍生物在与RNA杂交后,不抑制RNase H。换而言之,反义多核苷酸只在作为DNA RNA杂交复合物时是有效的。这类反义寡核苷酸的实例特别地参见美国专利US 5,849,902和US 5,989,912。换言之,基于靶分子的核酸序列,即,在本案例中是针对按照本发明的超免疫血清反应性抗原及其片段的核酸分子,其或来自相应核酸序列原则上可从中推导出来的靶蛋白,或通过了解象这样的核酸序列,特别是mRNA,可基于碱基互补的原则设计适当的反义寡核苷酸。
特别优选的是具有硫代磷酸酯的短序列的反义寡核苷酸(3-9个碱基)。活化细菌RNase H需要最少3个DNA碱基,而活化哺乳动物RNaseH需要最少5个碱基。在这些嵌合寡核苷酸中,存在形成RNase H底物的中心区,两侧是由不形成RNase H底物的修饰过的核苷酸组成的杂交“臂”。嵌合寡核苷酸的杂交“臂”可由诸如2′-O-甲基或2′-氟代进行修饰。备选的方案是在所述的臂中使用磷酸甲酯或氨基磷酸酯键。在本发明实践中有效的反义寡核苷酸的另外的实施方案是P-甲氧基寡核苷酸、部分的P-甲氧基寡脱氧核糖核苷酸或P-甲氧基寡核苷酸。
对于本发明而言特别相关和有效的是如以上提及的两个美国专利中所更具体描述的那些反义寡核苷酸。这些寡核苷酸包含非天然存在的5′→3′-连接核苷酸。更确切的说,寡核苷酸具有两种类型的核苷酸:2′-脱氧硫代磷酸酯,它激活RNase H,以及2′-修饰的核苷酸,它不激活RNaseH。2′-已修饰的核苷酸之间的键可以是磷酸二酯、硫代磷酸酯或P-乙氧基磷酸二酯。RNase H的活化是通过含介于3-5个之间的2’脱氧硫代磷酸酯核苷酸的连续RNase H-活化区域激活细菌的RNase H以及含介于5-10个之间的2′-脱氧硫代磷酸酯核苷酸的连续RNase H-活化区激活真核的、尤其是哺乳动物的RNase H而完成的。防止降解的保护作用是通过形成5′和3′末端碱基高度核酸酶抗性以及任选地通过安置3′末端封闭基团而完成。
更具体而言,所述的反义寡核苷酸包含-5′末端和-3′末端;和从位点11-59的独立选自由2’-修饰的磷酸二酯核苷酸和2’-修饰的P-烷氧基磷酸三酯核苷酸组成的组中的5′→3′-连接核苷酸;且其中5′-末端核苷附着于3-10个连续硫代磷酸酯连接脱氧核糖核苷酸的RNase H-活化区域,且其中所述寡核苷酸的3′-末端选自由反向的脱氧核糖核苷酸、1-3个硫代磷酸酯2’-修饰核糖核苷酸的连续序列、生物素基团和P-烷氧基磷酸三酯核苷酸组成的组中。
还可使用其中不是5′末端核苷附着于RNase H-活化区而是3′末端核苷如上所述附着于RNase H-活化区的反义寡核苷酸。此外,5′末端选自不同于所述寡核苷酸3′末端的具体基团。
按照本发明的核酸以及超免疫血清反应性抗原及其片段可用作或用于制备药物组合物,尤其是疫苗。优选地将所述的药物组合物、优选地将疫苗用于预防或治疗由肺炎链球菌引起、涉及或相关的疾病。在此范围内,本发明的另一方面涉及在个体、尤其是哺乳动物内引起免疫应答的方法,它包括用按照本发明的超免疫血清反应性抗原及其片段或其片段或变体接种个体,足以产生抗体以保护所述个体不受感染,尤其是链球菌感染,最具体而言是肺炎链球菌感染。
本发明的另一方面涉及在个体中诱发免疫应答的方法,它包括,通过基因治疗或其它方法运送功能性编码超免疫血清反应性抗原及其片段或其片段或变体的核酸,以便在体内表达超免疫血清反应性抗原及其片段或其片段或变体,从而诱导免疫应答产生抗体或细胞介导的T细胞应答,所述T细胞是产生细胞因子的T细胞或细胞毒性T细胞,以保护所述的个体免受疾病的侵袭,无论该疾病是已存在于个体内的或未存在其中的。施用基因的一个方式是将其包被在颗粒或其它物质上加速进入所需细胞中。
本发明的另一方面涉及免疫学组合物,所述组合物在引入能在其中诱发免疫应答的宿主时,在该宿主中诱发免疫应答,其中的组合物包含编码和表达按照本发明的超免疫血清反应性抗原及其片段的抗原的重组DNA。免疫学应答可用于治疗或预防,且可采用抗体免疫性或细胞免疫性的形式,诸如由CTL或CD4+T细胞产生的免疫性。
本发明的超免疫血清反应性抗原及其片段或其片段可与辅助蛋白质融合,所述辅助蛋白质自身可不产生抗体,但能稳定所述第一种蛋白质并产生具有免疫原性和保护特性的融合蛋白。这种融合的重组蛋白质优选进一步包含抗原性辅助蛋白,诸如谷胱甘肽-S-转移酶(GST)或β-半乳糖苷酶,以及稳定蛋白质并有利于其产生和纯化的相对大的辅助蛋白。此外,辅助蛋白在提供免疫系统全身性刺激的意义上可用作佐剂。辅助蛋白可附着于第一种蛋白质的氨基或羧基末端。
此外,本发明提供了在肺炎链球菌感染的动物模型的所述遗传免疫接种实验中使用所需的核酸分子或其特殊片段的方法。这种片段对于鉴定能引起预防或治疗免疫应答的蛋白质表位是特别有效的。此方法可随后从成功抵抗或清除感染所必需的动物器官内产生特殊意义的单克隆抗体,用于哺乳动物、尤其是人体内肺炎链球菌感染预防剂或治疗方法的研发。
超免疫血清反应性抗原及其片段可作为抗原用于宿主的疫苗接种从而产生特异抗体保护宿主抵抗细菌入侵,例如,通过阻断细菌在受损伤组织的粘附。组织损伤的实例包括由例如病毒感染(例如呼吸器官的,诸如流行性感冒)、机械、化学或热损伤或留置装置的植入造成的皮肤或结缔组织以及粘膜组织的伤口,或在粘膜诸如口腔、乳腺、尿道或阴道中的伤口。
本发明还包括含与适当载体在一起的免疫原性重组蛋白质的疫苗制剂。由于蛋白质可在胃中分解,因此优选胃肠外地施用,包括,例如,皮下、肌肉内、静脉内、皮内、鼻内或透过皮肤施用。适于胃肠外施用的制剂包括水性和非水性无菌注射液,它们可包含抗氧化剂、缓冲液、抑菌剂和使制剂与个体的体液,优选地血液等渗的溶质;以及可包含悬浮剂或增稠剂在内的水性和非水性无菌悬浮液。制剂可以单位剂量或多剂量包装出现,例如,封装在安瓿和小瓶中,且可以冻干状态储存,只需在临用前立即加入无菌液态载体即可。疫苗制品还可包括用于增强制品免疫原性的佐剂体系,诸如水包油体系和本领域已知的其它体系。剂量取决于疫苗的特异活性且可用常规实验方便的测定。
按照另一方面,本发明涉及包含了本发明所提供针对肺炎链球菌的超免疫血清反应性抗原或其片段的药物组合物。这种药物组合物可包含针对肺炎链球菌的一个,优选地至少两个或更多的超免疫血清反应性抗原或其片段。任选地,所述的肺炎链球菌超免疫血清反应性抗原或其片段还可与针对其它病原体的抗原组合于联合药物组合物中。优选地,所述的药物组合物是用于预防或治疗由肺炎链球菌和/或其它病原体引起的感染的疫苗,针对所述病原体的抗原已包含于该疫苗中。
按照另一方面,本发明涉及包含如上述鉴定针对肺炎链球菌的编码超免疫血清反应性抗原或其片段的核酸分子的药物组合物。这种药物组合物可包含编码针对肺炎链球菌的超免疫血清反应性抗原或其片段的一个或多个核酸分子。任选地,这种编码超免疫血清反应性抗原或其片段的肺炎链球菌核酸分子还可与编码针对其它病原体的抗原的核酸分子组合于联合型药物组合物中。优选地,所述的药物组合物是用于预防或治疗由肺炎链球菌和/或其它病原体引起的感染的疫苗,针对所述病原体的抗原已包含于该疫苗中。
所述药物组合物可包含任何适当的辅助物质,诸如缓冲物质、稳定剂或另外的活性成分,尤其是已知与药物组合物和/或疫苗产生有联系的成分。
对于按照本发明的超免疫血清反应性抗原、其片段或其编码核酸分子而言优选的载体和/或赋形剂是用于进一步刺激免疫应答产生超免疫血清反应性抗原、其片段或其编码核酸分子的免疫刺激化合物。优选地,在按照本发明的药用制剂中的免疫刺激化合物选自聚阳离子物质,尤其是聚阳离子肽、免疫刺激核酸分子,优选地免疫刺激脱氧核苷酸、明矾、弗氏完全佐剂、弗氏不完全佐剂、神经活性化合物,尤其是人生长激素,或它们的组合物的组中。
也在本发明范围内的是,药物组合物、尤其是疫苗,除了包含按照本发明的超免疫血清反应性抗原、其片段和/或其编码核酸分子之外还包含具有生物学或药学活性的其它化合物。优选地,所述疫苗组合物包含至少一种聚阳离子肽。按照本发明使用的聚阳离子化合物可能是显示出符合WO 97/30721的特征性作用的任何聚阳离子化合物。优选的聚阳离子化合物选自碱性多肽、有机聚阳离子、碱性聚氨基酸或它们的混合物。这些聚氨基酸应具有至少4个氨基酸残基的链长(WO 97/30721)。尤其优选的是类似聚赖氨酸、聚精氨酸和多肽的物质或它们的混合物,所述多肽在8个以上氨基酸的范围内、尤其是20个以上氨基酸残基的范围内包含20%以上、尤其是50%以上的碱性氨基酸。其它优选的聚阳离子和它们的药物组合物参见WO 97/30721(例如,聚乙烯亚胺)和WO 99/38528。优选地,这些多肽包含介于20-500个之间的氨基酸残基,尤其是介于30-200个之间的残基。
这些聚阳离子化合物可通过化学或重组方法产生或可来自天然来源。
阳离子(多)肽还可以是具有如综述{Ganz,T.,1999}中所述的抗菌特性。这些(多)肽可以是原核的或动物的或植物来源的或可化学或重组产生的(WO 02/13857)。肽还可以属于防卫素类型(WO 02/13857)。这些肽的序列可发现于,例如,以下网址的抗菌的序列数据库:
http://www.bbcm.univ.trieste.it/~tossi/pag2.html
这种宿主防御肽或防御工具也是按照本发明的聚阳离子聚合物的优选形式的。通常,将允许作为优选地由APC(包括树状细胞)介导的适应性免疫系统活化(或下调)终产物的化合物用作聚阳离子聚合物。
在本发明中尤其优选用作聚阳离子物质的是cathelicidin来源的抗微生物肽或其衍生物(国际专利申请WO 02/13857,并入本文作为参考),尤其是来源于哺乳类cathelicidin、优选地来自人、牛或小鼠的抗微生物肽。
天然来源的聚阳离子化合物包括HIV-REV或HIV-TAT(衍生的阳离子肽、触角(antennapedia)肽、脱乙酰壳多糖或几丁质的其它衍生物)或通过生化或重组产生的来源于这些肽或蛋白质的其它肽。其它优选的聚阳离子化合物是cathelin或cathelin的相关或衍生物质。例如,小鼠的cathelin是具有氨基酸序列NH2-RLAGLLRKGGEKIGEKLKKIGOKIKNFFQKLVPQPE-COOH的肽。相关的或衍生的cathelin物质包含cathelin序列的全部或具有至少15-20个氨基酸残基的部分。衍生可包括用不在20个标准氨基酸之内的氨基酸进行的对天然氨基酸的替代或修饰。此外,可将更多的阳离子残基引入所述cathelin分子中。这些cathelin分子优选地与抗原组合。这些cathelin分子令人惊讶地显示出也可有效的作为抗原的佐剂而无需添加另外的佐剂。因此可能利用这种cathelin分子作为疫苗制剂中的有效佐剂,可以有或没有另外的免疫活化物质。
可依照本发明使用的另一优选的多阳离子物质是含有由3-7个疏水氨基酸组成的接头隔开的至少2个KLK-基序的合成肽(国际专利申请WO02/32451,并入本文作为参考)。
本发明的药物组合物可进一步包含免疫刺激核酸。免疫刺激核酸是,例如,含有核酸的中性或人造CpG,所述核酸是来自非脊椎动物的核酸短序列或者是在某一碱基段含非甲基化的胞嘧啶-鸟嘌呤双核苷(CpG)的短寡核苷酸形式(ODNs)(例如,参见WO 96/02555)。或者,也可优选地将如WO 01/93903中所述基于肌苷和胞苷的核酸或含脱氧肌苷和/或脱氧尿苷残基的脱氧核酸(参见WO 01/93905和PCT/EP 02/05448,并入本文作为参考)用作本发明的免疫刺激核酸。优选地,不同免疫刺激核酸的混合物可按照本发明使用。
也属于本发明范围的是任一上述聚阳离子化合物与任一上述免疫刺激核酸组合。优选地,这种组合是根据:WO 01/93905、WO 02/32451、WO 01/54720、WO 01/93903、WO 02/13857和PCT/EP 02/05448以及奥地利专利申请A 1924/2001所述,将这些文献并入本文作为参考。
另外或备选的这种疫苗组合物除了包含按照本发明的超免疫血清反应性抗原及其片段以及它们的编码核酸之外,还可包含神经活性的化合物。优选地,神经活性的化合物是人生长因子,例如在WO 01/24822中所述的。同样优选的是,神经活性的化合物与上述任一聚阳离子化合物和/或免疫刺激核酸组合。
在另一方面,本发明涉及药物组合物。这种药物组合物是,例如,本文所述的疫苗。药物组合物还是包含以下任一种化合物或其组合的药物组合物:按照本发明的核酸分子、按照本发明的超免疫血清反应性抗原及其片段、按照本发明的载体、按照本发明的细胞、按照本发明的抗体、按照本发明的功能性核酸以及按照本发明的结合肽诸如抗促成素、按本文所述筛选的任何激动剂和拮抗剂。与之有关的是可将任何这些化合物与未灭菌或灭菌载体诸如适于施用于受试者的药用载体组合使用,以供细胞、组织或器官使用,。这些组合物包括,例如,培养基添加剂或治疗有效量的本发明超免疫血清反应性抗原及其片段和药用载体或赋形剂。这些载体可包括,但不局限于:盐、缓冲盐、右旋糖、水、甘油、乙醇及它们的组合。该制剂应与施用模式相配。
药物组合物可以任一有效的、方便的形式施用,其中特别包括,例如,通过局部、口、肛门、阴道、静脉内、腹膜内、肌肉内、皮下、鼻内、气管内或皮内途径施用。
在治疗中或作为预防药,可以将活性试剂作为可注射组合物,例如,作为无菌水性分散液,优选地,作为等渗的无菌水性分散液,施用于个体。
或者组合物可配置成局部应用的制剂,例如以药膏、霜、洗液、眼膏、滴眼液、滴耳液、漱口剂、浸渍敷料和缝合线和气雾剂形式,且可包含合适的常规添加剂,包括,例如,防腐剂、帮助药物渗透的溶剂以及在药膏和霜中的润肤剂。这种局部制剂还可包含适合的常规载体,例如霜或软膏基质、以及用于洗液的乙醇或油醇。这种载体组成可占制剂重量的约1%-约98%,更通常的是组成高达制剂重量的约80%。
除了上述治疗之外,通常可以将本发明组合物用作伤口处理剂以防止细菌粘附于伤口组织中暴露的基质蛋白质上,且可作为抗生素预防疗法的另一备选方案或与其结合使用于牙科治疗的预防性应用中。
疫苗组合物便利的是以可注射形式存在。可以使用常规的佐剂以增强免疫应答。疫苗接种的适当单位剂量是0.05-5μg抗原/kg体重,优选地,施用这种剂量1-3次且间隔1-3周。
采用指定的剂量范围,应不会观察到本发明化合物的毒理学副作用,如果有就将停止它们施用于适当个体。
在另一实施方案中,本发明涉及诊断和药物包装和试剂盒,其包含了填充有一种或多种本发明上述组合物成分的一个或多个容器。所述成分可以有效量、剂量、制剂或组合存在。与这种容器相关的是管理制药的政府机构规定形式的说明书、药品或生物产品的用途或销售,反映出制药机构同意该产品的应用或销售针对人进行施用。
与本发明有关的且涉及本文所述用途,诸如,例如,药物组合物或疫苗的应用的任何疾病具体而言是由链球菌,更优选地由肺炎链球菌引起、连接或相关的疾病或疾病状况。与此有关应注意的是肺炎链球菌包含本文所述那些菌株在内的数个菌株。涉及依照本发明待预防和/或治疗与细菌感染相关、由其引起或与其有联系的疾病除了包括细菌性咽炎之外,还包括人的中耳炎、肺炎、菌血症、脑膜炎、腹膜炎和脓毒症。
在另一实施方案中,本发明涉及利用按照本发明的任一超免疫血清反应性抗原或核酸的筛选方法。象这样的筛选方法是本领域技术人员已知的,且可对其进行设计以筛选激动剂或拮抗剂。优选地,在抑制或阻碍按照本发明的任一超免疫血清反应性抗原及其片段与相互作用配偶体的结合的情况下筛选拮抗剂。这种相互作用配偶体可以是天然存在的相互作用配偶体或非天然存在的相互作用配偶体。
本发明还提供了筛选化合物的方法以鉴定化合物,所述化合物增强(激动剂)或阻断(拮抗剂)本发明的超免疫血清反应性抗原及其片段或核酸分子的功能,诸如它们与结合分子的相互作用。筛选方法可涉及高通量。
例如,为了筛选激动剂或拮抗剂,分别按照本发明的核酸分子和核酸的相互作用配偶体可能是合成的反应混合物、细胞区室,诸如膜、细胞被膜或细胞壁,或它们中任一种的制剂,可从表达结合本发明的超免疫血清反应性抗原及其片段的分子的细胞中制备它们。在可能是激动剂或拮抗剂的候选分子缺乏或存在的条件下,将所述制剂与标记的超免疫血清反应性抗原及其片段一起温育。候选分子与结合分子结合的能力反映在被标记配体的结合有所下降。无故结合的分子,即,不诱发超免疫血清反应性抗原及其片段的功能性作用的分子,最有可能是好的拮抗剂。可很好结合且引起与超免疫血清反应性抗原及其片段相同或非常接近的功能作用的分子是良好的激动剂。
潜在激动剂和拮抗剂功能作用可通过,例如,在候选分子与细胞或适当细胞制剂相互作用后测定报道体系的活性来检测,且将此效用与本发明超免疫血清反应性抗原及其片段或所引起作用与超免疫血清反应性抗原及其片段相同的分子的效用进行比较。这方面可用的报道体系包括但不局限于转换成产物的比色分析的标记底物、对超免疫血清反应性抗原及其片段功能活性中的变化作出响应的报道基因以及本领域已知的结合试验。
检测拮抗剂的另一实例是一种竞争性试验,所述试验在适于进行竞争性抑制试验的条件下将本发明的超免疫血清反应性抗原及其片段和具有结合膜的结合分子、重组结合分子、天然底物或配体或底物或配体模拟物的可能拮抗剂结合。可以对超免疫血清反应性抗原及其片段进行标记,诸如放射性或比色分析化合物标记,从而可准确测定与结合分子结合或转换成产物的超免疫血清反应性抗原及其片段的分子数目以评估可能的拮抗剂的效力。
可能性的拮抗剂包括与本发明的超免疫血清反应性抗原及其片段结合并从而抑制或消除其活性的小有机分子、肽、多肽和抗体。可能的拮抗剂还可以是结合于结合分子的同一位点且不会诱导产生本发明的超免疫血清反应性抗原及其片段的功能活性的小有机分子、肽,诸如紧密相连的蛋白质或抗体等多肽。
可能的拮抗剂包括结合并占据超免疫血清反应性抗原及其片段的结合位点因此阻碍其与细胞结合分子结合从而抑制正常生物学活性的小分子。小分子的实例包括但不局限于小的有机分子、肽或肽类似分子。
其它的可能性拮抗剂包括反义分子(参见{Okano,H.等,1991};OLIGODEOXYNUCLEOTIDES AS ANTISENSE INHIBITORS OF GENEEXPRESSION;CRC出版社,Boca Ration,FL(1988),对这些分子的描述)。
优选的可能性拮抗剂包括本发明的超免疫血清反应性抗原及其片段的衍生物。
用于本文时,按照本发明的超免疫血清反应性抗原及其片段的活性是它们与其任一相互作用配偶体结合的能力或与自身的或任何相互作用配偶体结合的这种能力的程度。
在某一具体方面,本发明提供了本发明的超免疫血清反应性抗原及其片段、核酸分子或抑制剂在干预病原体和被造成感染后遗症的哺乳动物宿主之间最初的物理学相互作用中的应用。具体而言本发明的分子可用于:i)防止肺炎链球菌对位于粘膜表面的哺乳动物胞外基质蛋白质以及留置装置或伤口处的胞外基质蛋白质的粘附;ii)封闭介于哺乳动物胞外基质蛋白质和细菌蛋白质之间并介导组织损伤或侵入的阻断的细菌粘连;iii)或导致免疫防御的逃避;iv)阻断除了通过留置装置植入或通过其它外科技术之外的方式,例如通过抑制营养获得引起的感染中发病的正常进程。
可以将本文所提供的各个DNA编码序列用于抗菌化合物的探索和开发中。可以将表达后的编码蛋白质用作抗菌药物筛选的靶目标。此外,可以将编码所述编码蛋白质氨基末端区域的DNA序列或相应mRNA的Shine-Delgarno或其它翻译促进序列用于构建反义序列以控制目的编码序列的表达。
可以将拮抗剂和激动剂用于,例如,抑制链球菌,尤其是肺炎链球菌引起的疾病,诸如脓毒症。
另一方面,本发明涉及亲和力装置,所述的亲和力装置包括至少一种支持材料和附着在支持材料上的任一按照本发明的超免疫血清反应性抗原及其片段。由于按照本发明的超免疫血清反应性抗原及其片段对其靶细胞或靶分子或其相互作用配偶体的特异性,如果符合结合条件,超免疫血清反应性抗原及其片段可从应用到支持材料的任一种样品中选择性的除去它们的相互作用配偶体。所述样品可以是生物学或医学样品,包括但不局限于,发酵液、细胞碎片、细胞制剂、组织制剂、器官制剂、血液、尿、淋巴液、液体等。
超免疫血清反应性抗原及其片段可以共价或非共价方式附着于基质上。合适的支持材料对于本领域的技术人员是已知的,并且可选自包含纤维素、硅、玻璃、铝、顺磁珠、淀粉和葡聚糖的组。
通过以下图、实施例和序列表对本发明进行了进一步的举例说明,其中可见更多的特征、实施方案和优势。应理解这些实施例只是以例证方式给出而不是对内容的局限。
与本发明有关:
图1显示了肺炎链球菌特异性人血清的特性。
图2显示了来自肺炎链球菌血清型4的小片段基因组文库LSPn-70的特性。
图3显示了使用生物素化的人IgGs通过MACS选择细菌细胞。
图4显示了用鉴定的抗原进行基因分布研究的实例。
图5显示了在不同年龄组中和在肺炎球菌性疾病过程中的表位特异性抗体水平的实例。
图6显示通过流式细胞计用表位特异性抗血清染色的细胞表面的实例。
图7显示在体外试验中测定由选定的表位诱导的抗体的杀菌活性。
图8显示了用选定的肺炎链球菌抗原进行的主动免疫在鼠致死率脓毒症模型中的保护作用。
图9显示了用选定的肺炎链球菌抗原产生的血清进行的被动免疫在鼠致死率脓毒症模型中的保护作用。
图10显示了对在SP2216抗原中的保护性结构域进行的鉴定。
图11显示了由保护性抗原诱导的抗体对不同肺炎链球菌血清型的交叉反应性。
图12显示了天然SP2216变体的氨基酸序列的对比。
图13显示了天然SP1732变体的氨基酸序列的对比。
图14显示了天然SP2190变体的氨基酸序列的对比。
表1显示了用基因组肺炎链球菌文库和人血清进行的所有筛选的概况。
表2显示了用人血清进行的表位血清学分析的总结。
表3显示了针对50个肺炎链球菌菌株中已鉴定抗原的基因分布分析概况。
表4显示了表面染色和杀菌活性测量的概况。
本说明书中可提及的图详述如下。
图1显示了通过免疫测试检测的关于抗肺炎链球菌抗体的人血清的鉴定。将制备自肺炎链球菌血清型4荚膜阴性突变株的总细菌裂解物或培养物上清液部分用作包被抗原,通过标准ELISA来测量总抗-肺炎链球菌IgG和IgA抗体水平。以三个不同的血清稀释度对来自具有侵入性疾病且正在恢复期的患者的97个血清样品或者来自没有肺炎链球菌鼻咽携带的健康成人的50个血清进行分析。以(A)具有细菌裂解物的患者血清和(B)具有培养物上清液蛋白质的健康成人血清显示典型实验的结果。将数据表示为ELISA单位(IgA 10.000x,IgG 50,000),所述ELISA单位在检测的线性范围内在血清稀释度上通过在405nm处的吸光度计算。选择和集中来自两个供体组的2x5的血清通过细菌表面展示进行抗原鉴定。圆圈指示包括在两个患者库(PSPn3-IgG,-IgA和PSPn7-IgG)和两个健康者库(NSPn4-IgG,-IgA和NSPn5-IgG)中的选定的血清。(C)通过ELISA在预选择的血清上进行免疫印迹分析以确保有关蛋白质抗原的多重免疫反应性。显示了使用总细菌裂解物进行的代表性实验的结果,所述总细菌裂解物制备自肺炎链球菌血清型4荚膜阴性突变株和在5.000稀释度的患者的血清。未经选择,将低效价血清包括进去作为阴性对照。Mw:分子量标记。(D)通过FACS进行肺炎链球菌血清型4荚膜阴性突变株的表面染色以比较抗体与表面定位抗原的结合。以不同的浓度(0.5%-5%)使用人血清。显示了以0.5%终浓度使用的患者血清的代表性数据。用FITC标记的抗人IgGFab检测信号并且用计算机程序CELLQuest对其进行分析。(E)显示了介于使用总细菌裂解物通过ELISA测量的IgG效价和用血清IgGs对整个活体肺炎链球菌进行的表面染色之间的相关性。将IgG效价表示为ELISA单位,而将表面染色表示为通过计算机程序CELLQuest计算的染色细菌的平均荧光。
图2(A)显示了肺炎链球菌类型4小片段基因组文库,LSPn-70的片段大小分布。测序后,对609个随机选择克隆序列进行修整以消除载体残基,并对具有多种基因组片段大小的克隆数目进行作图。(B)显示了肺炎链球菌染色体(按照TIGR4基因组数据)上LSPn-70的同一套随机测序克隆的分布图解。圆圈表示与所注解ORF匹配的序列而矩形代表在+/+或者+/-方向上与非编码染色体序列完全匹配的克隆。菱形标出了具有嵌合序列的所有克隆的位置。碱基对中的数字间隔标示于环形基因组上用于定位。在图的底部给出了文库中多个克隆组分配的数目和百分比。
图3(A)显示了用生物素化人IgG进行的MACS选择。用10μg生物素化的IgG(PSPn3-IgG,纯化自人血清)筛选pMAL9.1中的LSPn-70文库。作为阴性对照,在用于筛选的文库细胞中不添加血清。针对各轮选择均显示了在第一和第二轮洗脱后选择的细胞数(分别是上行和下行)。(B)显示了通过细菌表面展示根据用人血清IgG库(PSPn7-IgG,4μg/μl)进行的免疫印迹分析而选择的特异性克隆(1-26)的反应性,所述人血清以1∶3,000的稀释度用于MACS的选择。作为负荷对照,还用1∶5,000稀释度的超免疫兔血清且直接针对平台蛋白(platform protein)LamB的抗体分析相同的印迹。LB,来自表达LamB且无外源肽插入的克隆的提取物。
图4(A)显示用于分析基因分布研究的肺炎链球菌的临床分离株的不同血清型的图示。(B)显示用相应的寡核苷酸进行的对SP1604的基因分布的PCR分析。预计的PCR片段的大小是470 bp。在A下列举的1-50,肺炎链球菌菌株临床分离物;-,未加入基因组DNA;+,来自肺炎链球血清型4的基因组DNA,将其用作文库构建的模板。
图5显示在肺炎球菌性疾病过程中对表位特异性人血清IgG抗体水平的ELISA测量。从患有侵入性肺炎球菌疾病的患者中,纵向地收集疾病发生前(前),急性期和恢复期的三个血清样品。显示了用两组来自不同患者的血清进行的代表性实验,所述血清是如所指示的与表示已鉴定抗原SP0069、SP0082、SP0117、SP1175、SP1937、SP2190和SP2216的肽反应的(A)P1147和(B)P1150。使生物素标记的肽与在200x和1.000x稀释度的人血清样品反应,并且将数据表示为ELISA单位。
图6显示通过流式细胞计检测结合肺炎链球菌细胞表面的特异性抗体。在图5A中将免疫前小鼠血清和针对肺炎链球菌血清型4裂解物产生的多克隆血清与肺炎链球菌菌株血清型4一起温育并用流式细胞计进行分析。对照显示二次抗体对肺炎链球菌细胞表面的非特异结合水平。图5B柱状图显示,与针对平台蛋白LamB的对照血清相比,由于抗-SP2216、抗-SP0117、抗-SP0454和抗-CRF1992抗体的特异性结合而使荧光增强。
图7显示如体外杀伤试验所确定的表位特异性抗体的杀菌活性。对免疫血清的杀伤活性的测量与适当的对照血清平行进行,并相对适当的对照血清进行计算。将数据表示为杀伤的百分比,即由于抗体的存在而导致的细菌集落形成单位(cfu)的减少,所述抗体在用肺炎链球菌裂解物产生的超免疫(HI)多克隆小鼠血清中(A),在用表达于LamB平台蛋白中的SP0117表位产生的免疫血清中(B),以及在用表达于FhuA平台蛋白的SP1287表位产生的小鼠免疫血清中(C)。对照血清代表免疫前血清(PI),用大肠杆菌克隆表达并且不携带源于肺炎链球菌的表位的Lamb或FhuA诱导的血清。将肺炎链球菌血清型4细胞与小鼠吞噬细胞一起培育60分钟,并且通过接种在血琼脂平板后计算集落形成单位来对存活细菌进行定量。
图8显示通过在小鼠致死率模型中用选定的肺炎链球菌抗原进行的主动免疫来获得的保护作用。用克隆自血清型4肺炎链球菌菌株并用血清型6B菌株激发的重组抗原免疫C3H小鼠(每个测试组10个)。在激发后2-3周监控存活状况。A:用SP0368、SP0667、SP2190和SP2216抗原免疫小鼠并用104集落形成单位的细菌静脉内地激发小鼠。将未免疫的小鼠用作阴性对照,而将PspA(SP0117)用作阳性对照。B:用SP2190和SP2216抗原免疫小鼠,并用105的集落形成单位的细菌对其进行腹膜内地激发。将用PBS注射的小鼠或仅用佐剂(CFA/IFA)免疫的模拟试验用作阴性对照,而将PspA(SP0117)用作阳性对照。C:用SP0498和SP1732抗原免疫小鼠并用105集落形成单位的细菌对其进行腹膜内地激发。将用PBS注射的小鼠用作阴性对照,而将PspA(SP0117)用作阳性对照。
图9显示在小鼠致死率模型中通过用选定的肺炎链球菌抗原产生的超免疫小鼠血清进行的被动免疫而获得的保护。在用105集落形成单位的肺炎链球菌血清型6B细菌进行腹膜内激发两小时前,对C3H小鼠(每组10只)腹膜内地施用小鼠血清。激发后3周监控存活状况。提供150μl用SP2190或SP2216产生的免疫血清,并补充以150μl血清,所述血清来自首次实验的小鼠而非来自接受100μl的每种抗-SP2190、抗-SP2216免疫血清和100μl来自首次实验的小鼠血清的小鼠。将阴性对照用来自PBS注射的、未注射的(未用过的)或非免疫CFA/IFA注射的小鼠的300μl血清进行处理。
图10显示对在SP2216抗原中的保护性结构域进行的鉴定。A:SP2216的图示说明通过in silico(结构预测)分析预测的两个亚结构域和通过细菌表面展示鉴定的表位的定位(灰色条纹和箭头)。B:用重组SP2216抗原:全长、N-端或C端结构域对C3H小鼠(每个测试组10只)进行免疫,并通过腹膜内施予105集落形成单位的肺炎链球菌血清型6B菌株对其进行激发。激发后2-3周监控存活状况。将非免疫的(注射CFA/IFA佐剂的)小鼠作为阴性对照,而将PspA(SP0117)作为阳性对照。
图11是通过分析不同的肺炎链球菌血清型显示的抗体的交叉反应性。用制备自代表48个不同血清型的肺炎链球菌的60个临床分离株的细菌裂解物以及使用用克隆自血清型4菌株的SP1732、SP2190和SP2216重组抗原产生的血清进行免疫印迹分析以测试抗体的交叉反应性。将关于7个不同血清型(泳道1-7)的结果显示为取自完整分析的数据。Mw:分子量标记。
图12显示在肺炎链球菌的不同临床分离株中表达的天然SP2216变体中检测的氨基酸交换。通过DNA测序分析来自代表47个不同肺炎链球菌血清型的47株临床分离株的SP2216基因。显示了那些相对于公开的TIGR4基因组序列具有氨基酸交换的血清型的翻译的氨基酸序列。
图13显示了在表达于肺炎链球菌的不同临床分离株中的天然SP1732变体中检测到的氨基酸交换。通过DNA测序分析了代表6个主要肺炎链球菌血清型(4,6B,9V,18C,19F,23F)的6个不同临床分离株的SP1732基因。显示了那些相对于公开的TIGR4(血清型4)基因组序列具有氨基酸交换的血清型的翻译的氨基酸序列。
图14显示了在表达于肺炎链球菌的不同临床分离株中的天然SP2190变体中检测到的氨基酸交换。通过DNA测序分析了代表7个主要肺炎链球菌血清型(4,6B,9V,14,18C,19F,23F)的7个不同临床分离株的SP2190基因。显示了那些相对于公开的TIGR4(血清型4)基因组序列具有氨基酸交换的血清型的翻译的氨基酸序列。由于缺失在一些基因中间部分的序列信息,单独显示N-端和C端的氨基酸对比。A:N-端氨基酸序列;B:C-端氨基酸序列。
表1:用细菌表面展示鉴定的免疫原性蛋白质。
A,用NSPn4-IgA(362)鉴定在fhuA中的300bp文库,B,用NSPn4-IgG(832)鉴定在fhuA中的300bp文库,C,用NSPn5-IgG(872)鉴定在fhuA中的300bp文库,D,用PSPn3-IgA(361)鉴定的在fhuA中的300bp文库,E,用PSPn3-IgG(575)鉴定的在fhuA中的300bp文库,F,用PSPn7-IgG(795)鉴定在fhuA中的300bp文库,G,用NSPn4-IgA(1043)鉴定lamB中的70bp文库,H,用NSPn4-IgG(929)鉴定在lamB中的70bp文库,I,用NSPn5-IgG(527)鉴定在lamB中的70bp文库,K,用PSPn3-IgA(1121)鉴定在lamB中的70bp文库,L,用PSPn3-IgG(1242)鉴定的在lamB中的70bp文库,M,用PSPn7-IgG(514)鉴定的在lamB中的70bp文库;*长于5个氨基酸的抗原序列的预测用程序ANTIGENIC{Kolaskar,A.等,1990}进行。
表2:关于人血清的表位血清学。
显示了代表用个别人血清选定表位的个别合成肽的免疫反应性。反应性范围是模式/灰色编码;白色:-(<50U),浅灰色:+(50-119U),深灰色:++(120-199U),黑色:+++(200-500U)以及垂直交叉:++++(>500U)。在背景校正后从OD405nm的读数和血清稀释度计算ELISA单位(U)。S表示由所有反应性的总和(所有+数目的相加)计算的得分;测量P1至P13血清是高效价的,并且来自患有侵入性肺炎疾病的患者而N1至N10血清来自具有高抗-肺炎链球菌效价的健康成人。S代表评分。免疫反应性的总和是:-=0;+=1;++=2;+++=3和++++=4。在从和至栏中给出按照TIGR4菌株的基因组注释的合成肽在抗原开放阅读框(ORF)中的定位,分别指示第一个和最后一个氨基酸残基。肽名称:在注释的开放阅读框SP0117中存在的SP0117.1-7;在SP0408的备选的开放阅读框中的可能的新的开放阅读框,ARF 0408.1;在完整的SP0129中的可能的新开放阅读框,CRF0129.1。
表3:肺炎链球菌菌株中的基因分布。
用特异于相应抗原编码基因的寡核苷酸通过PCR检测图4A中所示的50个肺炎链球菌菌株。对一个选定PCR片段的PCR片段进行测序以证实正确DNA片段的扩增。*,与肺炎链球菌TIGR4(血清型4)相比,在血清型14菌株中的氨基酸替代的数目。#,因为基因不存在于血清型14菌株中而用于测序的备选菌株。
表4:抗原性表位的表面定位和表位特异性抗体的功能性
通过使用用具有质粒的大肠杆菌克隆免疫产生的小鼠血清以图6所述和显示的方法测试45个肺炎链球菌抗原的表面定位,所述质粒编码与肺炎链球菌肽融合的平台蛋白LamB或FhuA。将数据归纳于标记为FACS的栏中。如实施例的图7所显示,将非常相同的免疫试剂用在体外杀伤实验中,并将通过FACS测试为阳性的所有抗原表示在PK(吞噬杀伤)栏中。-:阴性结果,+:在所有进行的试验中不是一直都为阳性,++和+++是相对于对照试剂一直都为阳性。
实施例
实施例1:基于人血清的抗肺炎链球菌抗体的特征鉴定和选择,抗体筛选试剂的制备
实验过程
酶联免疫测定法(ELISA).
用稀释于包被缓冲液(0.1M碳酸钠pH 9.2)的5-10μg/ml总蛋白包被ELISA平板(Maxisorb,Millipore)。在PBS-BSA中制备了三种血清的稀释液(2,000×、10,000×、50,000×)。按照制造商的推荐(稀释度:1,000×)使用高特异性的辣根过氧化物酶(HRP)-偶联的抗人IgG或抗人IgA二抗(Southern Biotech)。基手自动ELISA读数仪(TECAN SUNRISE)的OD405nm读数通过检测底物(ABTS)向显色产物的转换从而对抗原-抗体复合物进行定量。
细菌抗原提取物的制备
总细菌裂解产物:将细菌过夜生长于THB(Todd-Hewitt Broth)中,通过反复冻融循环进行裂解:温育于干冰/乙醇混合物中直至冻结(1分钟),然后融解于37℃(5分钟):重复3次。随后进行超声波降解并通过离心收集上清(3,500rpm,15分钟,4℃)。
培养物上清液:通过离心除去细菌后,通过将1份上清液与3份无水乙醇(abs.ethanol)混合用冰冷的乙醇沉淀过夜培养的细菌培养物上清液并于-20℃温育过夜。通过离心收集沉淀(2,600g,15分钟)。将干的沉淀或者溶解于PBS以备ELISA,或者溶解于尿素和SDS样品缓冲液中以备SDS-PAGE和免疫印迹。用Bradford测试法检测样品的蛋白质浓度。
免疫印迹法
从体外培养的肺炎链球菌血清型4无荚膜突变菌株中制备总细菌裂解物和培养物上清样品。用BioRad Mini-Protean 3 Cell电泳系统通过SDS-PAGE分离10-25μg总蛋白/泳道并将蛋白质转到硝酸纤维素膜(ECL,Amersham Pharmacia)上。在5%的牛奶中过夜封闭后,加入2,000倍稀释的人血清,并将HRPO标记的抗人IgG用于检测。
细菌表面染色
流式细胞术分析进行如下。肺炎链球菌血清型4无荚膜突变菌株在Todd-Hewitt肉汤中生长过夜直到早期稳定期。收集细胞并在Hanks平衡盐溶液(HBSS)中洗涤两次并基于OD600nm的读数将细胞密度调整到在100μl HBSS中约1×106 CFU,所述HBSS具有0.5%BSA。与人血清于0.5%和2%的最终浓度一起在4℃温育60分钟后,通过在过量HBSS,0.5%BSA中离心洗去未结合的抗体。对于检测,将用荧光素(FITC)标记的山羊抗人IgG二抗(F(ab’)2特异性片段与细胞一起在4℃温育30分钟。洗涤细胞后,用2%多聚甲醛固定细胞。用Becton Dickinson FACScan流式细胞仪检测表面染色抗体并用计算机程序CELLQuest进一步分析数据。
纯化抗体以用于基因组筛选。基于筛选步骤中所用血清集合的总抗链球菌效价选择来自患者以及健康组的5份血清。通过将热灭活血清与全部大肠杆菌细胞(DH5α,用pHIE11转化,在与细菌表面展示所用相同的条件下生长)一起温育去除抗大肠杆菌蛋白质的抗体。依照制造商的说明书(UltraLink Immobilized Protein G,Pierce)通过蛋白G亲和层析从收集的消耗血清中产生高度富集的IgG制品。IgA抗体也是通过亲和层析利用固定于链霉亲和素-琼脂糖(GIBCO BRL)上的生物素标记抗人IgA(SouthemBiotech)进行纯化。通过SDS-PAGE、蛋白质印迹、ELISA和蛋白质浓度检测检查消耗和纯化的效率。
结果
由人免疫系统产生并存在于人血清中的抗肺炎链球菌的抗体是抗原性蛋白质的体内表达及其免疫原性的指征。这些分子对于鉴定如本发明中所述方法中的个别抗原是必需的,所述鉴定是基于特异性抗链球菌抗体与相应的肺炎链球菌肽或蛋白质的相互作用。为了研究相关的抗体集合,由下列个体中收集人血清:
I.患有侵入性肺炎链球菌感染的恢复期患者,诸如肺炎、菌血症和脑膜炎(通过医学微生物学试验显示肺炎链球菌是起因)的患者,
II.取样时没有带菌的健康成人。肺炎链球菌建群和感染是常见的,并且作为来自以往接触的天然免疫的结果呈现抗体。
通过一系列的免疫测试对来自患者的97份血清样品和来自健康成人的50份血清的抗肺炎链球菌抗体进行特征鉴定。利用两种不同的抗原制品,诸如由肺炎链球菌血清型4无荚膜突变菌株制备的细菌总提取物和培养物上清液蛋白质,通过ELISA进行基本的特征鉴定。我们分析无荚膜株是一个重要的方面,因为我们避免了由血清型特异性的丰富抗荚膜多糖抗体产生的反应性。
最近报道了不仅IgG,而且IgA血清抗体也能够通过PMNs的FcRIII受体识别并且促进调理作用{Phillips-Quagliata,J等,2000};(Shibuya,A.等,2000)。IgA抗体的基本作用是中和作用,主要是在粘膜表面。血清IgA的水平反映二聚体分泌型IgA的性质、数量和特异性。为此不仅对血清收集物分析抗链球菌IgG,还分析IgA水平。在ELISA分析中,利用高度特异性的第二试剂检测来自诸如IgG和IgA的高度亲和性类型的抗体,但是避免IgM。IgM抗体的产生发生于初级适应性体液反应期间,并且导致低亲和性的抗体,而IgG和IgA抗体已经进行过亲和性突变,并在抵抗或预防疾病中更有价值。在给定的稀释度中比较抗体效价,其中反应是线性的(图1A和1B.)。基于IgG和IgA针对两种复合抗原性混合物的反应性对血清进行分级,选择最高的通过免疫印迹作进一步测试。这种分析确认预选择血清针对多种肺炎球菌蛋白的高度抗体反应性,特别是在与未选择的低效价血清进行比较时(图1C)。血清的ELISA分级还与相同肺炎链球菌株的表面染色十分关联(图1D和1E),这提示通过ELISA检测的多数抗体与表面抗原相对应。这种广泛的抗体特征鉴定方法已经导致抗肺炎球菌超免疫血清的清楚鉴定。
将来自患者和健康供体组的2x5份选择的血清合并以便进一步富集丰富的抗体,但仍然具有不同个体的抗体集合的表现。通过亲和层析从合并的血清中纯化IgG和IgA抗体,并除去大肠杆菌反应性抗体以避免细菌表面展示筛选中的背景。
实施例2:肺炎链球菌的高度随机且框架选定的小片段基因组DNA文库的产生
实验步骤
链球菌基因组DNA的制备。将来自冻存穿刺斜面的肺炎链球菌血清型4(临床分离物,用传统血清型进行分型)接种于50ml Todd-Hewitt Broth培养基中并在37℃通风振荡培养18小时。随后收获培养基,以1,600x g离心15分钟并去上清。细菌沉淀用PBS洗3次并小心重悬于0.5ml溶菌酶溶液(100mg/ml)中。加入0.1ml的10mg/ml热处理RNase A和20 U的RNase T1,小心混和并将此溶液在37℃保温1小时。加入0.2ml的20%SDS溶液和0.1ml的蛋白酶K(10 mg/ml)后将此试管在55℃温育过夜。随后加入1/3体积的饱和NaCl并将该溶液在4℃温育20分钟。在微量离心管中沉淀提取物(13,000rpm)并将上清液转移至新管中。用PhOH/CHCl3/IAA(25∶24∶1)和CHCl3/IAA(24∶1)抽提该溶液。通过加入0.6倍体积的异丙醇于室温沉淀DNA,用消毒的巴斯德移液管从所述溶液中将DNA缠绕在上面并转移入含80%冰冻乙醇的试管中。通过以10-12,000xg离心沉淀回收DNA,随后进行空气干燥并溶于ddH2O中。
小基因组DNA片段的制备。将基因组DNA片段用杯状洞角超声波仪(装备了BB5杯状洞角的Bandelin Sonoplus UV 2200超声波仪,10秒脉冲,100%功率输出)机械切割成大小150-300bp之间的片段或通过温和的DNase I处理(Novagen)切割成大小50-70bp范围内的片段。观察到当将DNA断裂成150-300 bp大小范围内的片段时,超声波降解法产生了密集得多的片段大小分布。不过,尽管DNA广泛暴露于超声波诱导的流体力学剪切力中,并不能有效和可重复地实现随后的片段大小减小。所以,利用Novagen的鸟枪裂解试剂盒通过温和的DNase I处理获得50-70bp大小的片段。制备试剂盒所提供的DNaseI的1∶20稀释液并在MnCl2存在的条件下于60μl的体积中在20℃消化5分钟以确保酶的双链切割。用2μl的0.5M EDTA终止反应并在2%TAE-琼脂糖凝胶上评估片段化效率。此处理导致基因组DNA全部断裂成近似50-70bp的片段。随后在存在每种dNTP 100μM的条件下用T4 DNA聚合酶将片段末端补平以保证末端的有效对齐。片段可立即用于连接反应或冻存于-20℃备用。
载体的描述。在pASK-IBA主链{Skerra,A.,1994}上构建载体pMAL4.31,用卡那霉素抗性基因调换β-内酰胺酶(bla)基因。此外将bla基因克隆入多克隆位点。编码成熟β-内酰胺酶的序列之前有ompA的前导序列以使其能有效分泌穿过细胞质膜。而且编码成熟β-内酰胺酶的头12个氨基酸的序列(间隔序列)接着ompA前导肽序列之后以避免序列直接在前导肽酶切割位点之后融合,因为,例如,此区域的正电荷氨基酸簇会减少或完全破坏穿越细胞质膜的迁移{Kajava,A.等,2000}。SmaI限制性位点是用于文库插入的。用于回收选定片段的上游FseI位点和下游NotI位点在SmaI位点两侧。所述的三个限制性位点在编码所述的12个氨基酸间隔序列的序列之后插入,插入方式是bla基因转录于-1阅读框架中,导致在NotI位点之后15bp产生了一个终止密码子。+1bp插入恢复了blaORF从而产生了β内酰胺酶蛋白并随之获得了氨苄青霉素抗性。
通过将lamB基因克隆入pEH1的多克隆位点构建载体pMAL9.1{Hashemzadeh-Bonehi,L.等,1998}。随后,在第154位氨基酸之后将含限制位点FseI、SmaI和NotI的序列插入lamB中。此插入的阅读框架以此方式构建,即,通过用FseI和NotI消化从质粒pMAL4.31切下框架选定的DNA片段进行转移产生了lamB的连续阅读框架以及各自的插入片段。
通过将btuB基因克隆入pEH1的多克隆位点构建载体pMAL10.1。随后,在第236位氨基酸之后将含限制位点FseI、XbaI和NotI的序列插入btuB中。此插入的阅读框架以此方式选择,即,通过用FseI和NotI消化从质粒pMAL4.31切下框架选定的DNA片段进行转移产生了btuB的连续阅读框架以及各自的插入片段。
通过将fhuA基因克隆入pEH1的多克隆位点构建载体pHIE11。随后,在第405位氨基酸之后将含限制位点FseI、XbaI和NotI的序列插入fhuA中。此插入的阅读框架以此方式选择,即,通过用FseI和NotI消化从质粒pMAL4.31切下框架选定的DNA片段进行转移产生了fhuA的连续阅读框架以及各自的插入片段。
对于框架选择的文库克隆和评估。将肺炎链球菌基因组DNA片段连接入载体pMAL4.31的SmaI位点中。将重组DNA通过电穿孔进入DH10B电感受态大肠杆菌细胞(GIBCO BRL)并将转化子铺于补充了卡那霉素(50μg/ml)和氨苄青霉素(50μg/ml)的LB琼脂上。平板在37℃温育过夜并收集菌落进行大量DNA提取。贮藏并保留一个有代表性的平板以便收集菌落供菌落PCR分析和大规模测序。最初用简单菌落PCR检测确定大致的片段大小分布以及插入效率。结合插入位点的完整性以及框架选择的精确性(3n+1准则)由测序数据评估片段的精确大小。
有关细菌表面展示的文库克隆和评估。用限制性酶FseI和NotI从含肺炎链球菌文库的pMAL4.31载体上切下基因组DNA片段。随后将全部片段群转移入已用FseI和NotI消化的质粒pMAL9.1(LamB)或pHIE11(FhuA)。利用这两种识别8bp富含GC序列的限制性酶,在各个平台载体中保持pMAL4.31载体中选定的阅读框架。然后通过电穿孔将所述质粒文库转化入大肠杆菌DH5α细胞中。将细胞铺于补充了50μg/ml卡那霉素的大LB琼脂平板上并以产生清晰可见单菌落的密度在37℃培养过夜。随后将细胞从这些平板表面刮下,用新鲜LB培养基漂洗并以等份试样贮存于-80℃以备文库筛选。
结果
用于框架选择的文库。在pMAL4.31载体中产生了大小分别约为70和300bp的两个文库(LSPn70和LSPn300)。对于每个文库而言,大约1μg pMAL4.31质粒DNA和50ng片段化的肺炎链球菌基因组DNA的连接和随后的转化在框架选择后产生了4×105-2×106个克隆。为了评估文库的随机性,对大约600个随机选择的LSPn70克隆进行测序。生物信息分析显示这些克隆中只有极少的克隆出现了一次以上。另外,还显示出90%的克隆大小落在大小25-100bp之间的范围内,平均大小为52bp(图2)。几乎所有序列都遵从3n+1原则,显示出所有克隆均为正确的框架选择。
细菌表面展示文库。大肠杆菌表面的肽展示要求将来自LSPn文库的插入片段从框架选择载体pMAL4.31转移至展示质粒pMAL9.1(LamB)或pHIE11(FhuA)。用FseI和NotI限制酶切割基因组DNA片段而5ng插入片段与0.1μg质粒DNA连接并随后转化入DH5α细胞产生了2-5×106个克隆。将克隆从LB平板上刮下并冻存而无需进一步扩增。
实施例3:用细菌表面展示基因文库和人血清鉴定来自肺炎链球菌的高免疫原性肽序列
实验步骤
MACS筛选。将来自给定文库的约2.5×108个细胞在补充了50μg/ml卡那霉素的5ml LB培养基中于37℃生长2小时。通过加入1mM IPTG 30分钟诱导表达。用新鲜的LB培养基漂洗细胞两次并将大约2×107个细胞重悬于100μl LB培养基中并转移至Eppendorf管中。
将纯化自血清的10μg生物素化的人IgGs加入细胞中并将此悬浮液在4℃温和摇动温育过夜。加入900μl LB培养基,将悬浮液混和并随后在4℃于6,000rpm离心10分钟(对于IgA筛选而言,使用10μg的纯化IgA并用生物素化的抗人IgG二抗捕捉它们)。用1ml LB漂洗细胞一次,然后重悬于100μl LB培养基中。加入10μl与链霉亲和素偶联的MACS微珠(Miltenyi Biotech,Germany)并在4℃继续温育20分钟。之后加入900μl LB培养基并将MACS微珠细胞悬浮液加到固定于磁铁上且已平衡好的MS柱(Miltenyi Biotech,Germany)上。(所述MS柱通过用1ml 70%乙醇洗涤一次和2ml LB培养基洗涤两次进行平衡。)
随后用3ml LB培养基洗柱三次。去除磁铁后,用2ml LB培养基洗脱细胞。用3ml LB培养基洗柱后,将2ml洗脱液再次加到同一柱上并重复洗涤和洗脱步骤。第三次进行上样、洗涤和洗脱操作,产生最终的洗脱液2ml。
第二轮筛选如下进行。通过离心收集最终的洗脱液中的细胞并重悬于补充了50μg/ml卡那霉素的1ml LB培养基中。将培养物在37℃温育90分钟随后用1mM IPTG诱导30分钟。随后收集细胞,用1ml LB培养基洗涤一次并重悬于10μl LB培养基中。再次加入10μg生物素化的人IgG并将悬浮液在4℃温和摇动温育过夜。所有其它步骤完全与第一轮筛选相同。将两轮筛选后的细胞铺于补充有50μg/ml卡那霉素的LB琼脂平板上并于37℃培养过夜。
通过测序和蛋白质印迹分析评估选定的克隆。将选定的克隆在37℃于补充有50μg/ml卡那霉素的3ml LB培养基中培养过夜以便用标准方法制备质粒DNA。在MWG(Germany)上或与TIGR(U.S.A.)协作完成测序。
为了进行蛋白质印迹分析,用10%SDS-PAGE分离大约10-20μg总细胞蛋白并印迹至HybondC膜(Amersham Pharmacia Biotech,England)上。用大约1∶5,000稀释的人血清作为一抗和1∶5,000稀释的偶联至HRP的抗人IgG或IgA抗体作为二抗检测LamB或FhuA融合蛋白。用ECL检测试剂盒(Amersham Pharmacia Biotech,England)进行检测。或者,用兔抗FhuA或兔抗LamB多克隆免疫血清作为一抗与偶联至HRP的相应二抗联合进行融合蛋白的检测。
结果
使用生物素化的Igs通过磁性活化细胞分选术(MACS)筛选细菌表面展示文库。用来自患者血清或健康人血清的生物素化人IgGs和IgA集合筛选pMAL9.1中的LSPn70文库和pHIE11中的LSPn300文库(参阅实施例1:从人血清制备抗体)。如在实验步骤下所述完成选择步骤。图3A显示了用LSPn-70文库和PSPn3-IgGs进行筛选的一个代表性的实例。正如从MACS筛选的第一轮选择后的菌落数中可见的,最终回收到的细胞总数从2×107个细胞急剧下降到大约5×104个细胞,而不加入抗体进行的选择则显示下降到大约2×103个细胞(图3A)。第二轮之后,用PSPn3-IgGs回收到相似数目的细胞,而当不加入来自人血清的IgG时回收到的细胞少于10个,这清楚地证明了选择依赖于肺炎链球菌特异性抗体。为了评估筛选的效果,随机挑选26个选定的克隆并进行使用筛选性IgG合并物(PSPn7)的免疫印迹分析(图3B)。此分析表明约90%的选定克隆显示出对存在于相关血清中的抗体的反应性而表达无肺炎链球菌特异性插入片段的LamB的对照菌株则不与同一种血清反应。通常,观察到的反应比例在35-90%范围内。菌落PCR分析显示所有的选定克隆都含有预期大小范围内的插入片段。
随后对大量随机挑选的克隆(600-1200个克隆/每次筛选)进行测序,鉴定出用于筛选的人血清抗体特异地识别的基因和相应的肽或蛋白质序列。特定克隆被选择的频率至少在部分程度上反映了用于选择的血清中识别该克隆所呈递表位的特异抗体的丰度和/或亲和力。在这方面令人吃惊的是,来自某些ORF(例如SP2216,SP0117,SP0641,SP2136,SP2190,SP0107,SP0082)的克隆被选择次数超过100次,证明了它们的高度免疫原性特性。表1总结了获自所有12个已进行筛选的资料。表1中给出的所有克隆都已通过用来自单个克隆的全细胞提取物进行蛋白质印迹分析证实以显示与各个筛选中所用人血清集合的指征反应性。正如从表1中可见的,将鉴定的ORF的独特区域鉴定为免疫原性的,因为大小不定的蛋白质片段通过平台蛋白质展示在表面上。
更值得关注的是,通过细菌表面展示筛选所鉴定的大部分基因编码附着于肺炎链球菌表面和/或被分泌的蛋白质。这与肺炎链球菌毒性中表面附着或分泌蛋白质的预期作用是一致的。
实施例4:用个体人血清对高度免疫原性肽序列的反应性的评估。
实验步骤
肽合成
利用标准F-moc化学法在Rink酰胺树脂(PepChem,Tübingen,Germany)上用SyroII合成仪(Multisyntech,Witten,Germany)小规模地合成肽(4mg树脂,平行的至多288个)。在装配序列后,用Fmoc-epsilon-氨基己酸(作为接头)和生物素(Sigma,St.Louis,MO;像正常的氨基酸一样进行活化)延伸所述肽。用93%TFA,5%三乙基硅烷和2%水作用一小时将肽从树脂上切下。真空下干燥肽并由乙腈/水(1∶1)冻干三次。通过在Reflex III MALDI-TOF(Bruker,Bremen Germany)进行质谱分析来检验正确物质的存在。使用所述肽而不需要进一步纯化。
酶联免疫测定法(ELISA)
按照制造商的说明以10μg/ml的浓度将生物素标记的肽(于N端)涂布于链霉亲合素ELISA平板(EXICON)上。依照制造商的建议(稀释度:1,000x)使用高特异性的辣根过氧化物酶(HRP)-偶联的抗人IgG二抗(Southern Biotech)。于两种血清稀释液,200X和1,000X中对血清进行测试。人工涂布后,通过Gemini 160 ELISA机器人(TECAN)以嵌入式ELISA读取器(GENIOS,TECAN)对肽平板进行处理和分析。
分析中包括大约110名患者和60名健康成人血清。在选定克隆的生物信息分析之后,设计并合成相应的肽。如果表位具有超过26个氨基酸残基,就制备重叠肽。用N末端生物素标签合成所有的肽并将其用作链霉亲和素包被的ELISA平板上的包被试剂。
分析分两步进行。首先,基于它们对个别血清的反应性选择肽,所述个别血清包括在用于制备供细菌表面展示的IgG和IgA筛选试剂的血清集合内。对于224个肽的血清反应性的总结显示于表2中,所述肽代表来自以20份用于抗原鉴定的人血清(代表5种血清的4种不同集合)进行分析的基因组筛选的肺炎链球菌表位。通过基于阳性血清数目和反应程度对每种肽计算的分值对肽进行比较。所述的肽的范围包括高度反应性和广泛反应性的肽至弱阳性的肽。在最具有反应性的肽中包括已知的抗原,其中一些还在有关鼻咽携带或脓毒症的动物攻击模型中起保护作用(例如PspA/SP0117,丝氨酸蛋白酶/SP0641,组氨酸三联蛋白/SP1175)。未呈现阳性反应的肽不包括在进一步更详细的研究中。
其次,针对显示出对筛选血清具有特异的高反应性的肽检测来自侵入性肺炎球菌病患者或来自健康成人和儿童的大量非预选个体血清。在疾病期间通过利用三份系列血清样品对血清转化测试高度阳性的肽,所述血清样品从侵入性肺炎球菌病患者中纵向收集,第一份在疾病发生前(pre),第二份在疾病的急性期(发病5天之内)而第三份在疾病的恢复期(发病后>3周)。两个不同患者的两次代表性ELISA实验得以显示,展示出血清转化为多种肽,提示表位特异性抗体水平在疾病发生前是低的,并在急性期和恢复期中得以诱导(图5)。显示这种抗体模式的抗原对于开发疫苗特别有价值(例如SP2216,SP2109,SP1175,SP0117,SP0082)。
实施例5:用鉴定自肺炎链球菌的高度免疫原性蛋白质进行的基因分布研究。
实验步骤
通过PCR进行肺炎球菌抗原的基因分布研究。理想的疫苗抗原应是存在于该疫苗所指向的所有或绝大部分靶生物体菌株内的抗原。为了确定编码已鉴定的肺炎链球菌抗原的基因是否普遍存在于肺炎链球菌菌株内,用特异于目的基因的引物对一系列独立的肺炎链球菌分离株进行PCR。如图4A中所示,获得覆盖了最频繁出现于患者中的血清型的肺炎链球菌分离株。如果有可能覆盖所有的已鉴定免疫原性表位,就针对所有已鉴定的ORF设计作为引物的寡核苷酸序列,产生大约1,000bp的产物。如实施例2中所述制备所有的肺炎链球菌菌株的基因组DNA。按制造商的说明书(Invitrogen,The Netherlands)用Taq聚合酶(1U)、200nM dNTPs、寡核苷酸各10pMol和试剂盒在25μl反应体积内进行PCR。作为标准,进行30个循环(1x:5分钟,95℃,30x:30秒95℃,30秒56℃,30秒72℃,1x4分钟.72℃),除非条件需修改以适合个别引物对。
结果
通过PCR检测编码免疫原性蛋白质的所有已鉴定基因是否存在于50个不同的肺炎链球菌菌株中(图4A)。作为一个实例,图4B显示了对于SP1604而言所有指定50个菌株的PCR反应。正如明显可见的,基因存在于所有被分析的菌株中。对来自类型14菌株的PCR片段进行测序显示,与肺炎链球菌类型4菌株相比,414bp中有6bp是不同的,导致这两个分离株中三个氨基酸的差异。
对于总共50个被分析基因中,有31个存在于所有被测试的菌株中,而9个基因在被测试的50个菌株中的10个以上菌株中缺乏(表3)。几个基因(SP0667,SP0930)显示出大小的差异且不存在于所有的分离菌株中。某些基因显示出了大小的变化,但却在所有被测菌株中都是保守的。对产自一种菌株的PCR片段进行测序并随后与类型4菌株比较证实了正确DNA片段的扩增并显示了表3中所指出的序列差异程度。重要的是,许多已鉴定抗原的序列和大小在所有菌株中都是很保守的且因此是预防肺炎球菌感染的新疫苗候选物。
实施例6:从来自肺炎链球菌并展示于大肠杆菌表面的高度免疫原性蛋白质/肽所免疫的小鼠中获得的免疫血清的鉴定。
实验步骤
从小鼠中产生免疫血清
将含有编码与肺炎链球菌肽融合的平台蛋白的质粒的大肠杆菌克隆在补充有50μg/ml卡那霉素的LB培养基中于37℃培养。1∶10稀释过夜培养物,培养至OD600为0.5并用0.2mM IPTG诱导2小时。将沉淀的细菌细胞悬浮于PBS缓冲液中并在冰上通过超声波降解法破裂,产生粗细胞提取物。根据OD600测量值,将相当于5×107个细胞的等分试样静脉注射入NMRI小鼠中,2周后加强免疫一次。第二次注射1周后提取血清。通过肽ELISA测量表位特异的抗体水平。
抗原的体外表达
通过免疫印迹检测体外培养的肺炎链球菌血清型4的抗原表达。测试不同的生长培养基和培养条件以便检测总裂解产物和细菌培养上清液中抗原的存在。当检测到相应于预计的分子量和电泳迁移率的特定条带时认为表达得到确认。
细胞表面染色
流式细胞术分析如下进行。细菌在根据免疫印迹显示导致抗原表达的培养条件下生长。细胞在Hanks平衡盐溶液(HBSS)中洗两次并将细胞密度调整到在100μl HBSS,0.5%BSA中大约为1×106 CFU。与50-100倍稀释的小鼠抗血清一起在4℃温育30-60分钟后,在过量HBSS,0.5%BSA中通过离心洗去未结合抗体。将用荧光素(FITC)特异标记的山羊抗小鼠二抗(F(ab’)2片段与细胞一起在4℃保温30-60分钟。漂洗细胞后,用2%多聚甲醛固定细胞。用Becton Dickinson FACScan流式细胞仪检测被结合的抗体并用计算机软件CELLQuest进一步分析数据。阴性对照血清包括小鼠免疫前血清和用制备自IPTG诱导的大肠杆菌细胞的裂解产物产生的小鼠多克隆血清,所述大肠杆菌是用编码基因lamB或fhuA且无肺炎链球菌基因组插入片段的质粒转化的。
杀菌(杀伤)试验
将小鼠巨噬细胞(RAW246.7或P388.D1)和细菌温育并通过菌落计数测定60分钟后可存活细菌的损失。简而言之,细菌用Hanks平衡盐溶液(HBSS)洗两次并将细胞密度调整到在50μl HBSS中大约1×105CFU。将细菌与小鼠血清(高达25%)和豚鼠补体(高达5%)以总体积100μl于4℃保温60分钟。将预调理的细菌与巨噬细胞(小鼠细胞系RAW264.7或P388.D1;每100μl为2×106个细胞)以1∶20的比例混合并于37℃旋转摇床上500rpm保温。将各样品的等分试样稀释于无菌水中并室温温育5分钟以裂解巨噬细胞。然后将系列稀释液铺到Todd-Hewitt Broth琼脂平板上。将平板在37℃温育过夜,并用Countermat闪射计数器(IUL Instruments)对菌落进行计数。对照血清包括小鼠免疫前血清和用制备自IPTG诱导的大肠杆菌的裂解产物产生的小鼠多克隆血清,所述大肠杆菌是用含有基因lamB或fhuA而无肺炎链球菌基因组插入片段的质粒转化的。
结果
抗原的体外表达。通过利用针对抗大肠杆菌克隆产生的血清在体外分析肺炎链球菌血清类型4中的抗原蛋白质的表达,所述大肠杆菌克隆含有编码与肺炎链球菌肽融合的平台蛋白的质粒。首先,利用大肠杆菌克隆通过肽ELISA和/或免疫印迹测定特异性抗体的存在,所述大肠杆菌克隆表达包埋于LamB或FhuA平台蛋白中的给定表位。然后,使用制备自肺炎链球菌血清型4菌株的总细菌裂解物和培养上清液通过免疫印迹分析阳性血清(数据未显示)。这种分析是确定蛋白质是否全部表达的第一个步骤,并且如果是,在该生长条件下,从而通过FACS分析评价多肽的表面表达。基于文献数据分析,不是所有的蛋白都在体外条件下表达。
肺炎链球菌的细胞表面染色。随后,细菌表面对于一些抗原性蛋白的可接近性通过基于流式细胞计的测试进行证实。链球菌与未免疫的血清以及由肺炎链球菌裂解物或具有质粒的大肠杆菌克隆产生的多克隆血清一起进行温育,所述质粒编码与肺炎链球菌肽融合的平台蛋白,随后用荧光标记的二抗进行检测。如在图6A中显示的,由肺炎链球菌的裂解物产生的抗血清包含针对表面组分的抗体,肺炎链球菌血清型4细胞群体的荧光的明显改变证实了这一点。对于针对许多已鉴定的肺炎球菌抗原的肽所产生的多克隆血清,观察到了肺炎链球菌血清型4细胞的相似细胞表面染色(图6B和表4)。在一些情况中,如通过柱状图(图6B)的两个峰的检测指示的,细菌的亚群没有被染色。这种现象可能是在细菌生长过程中基因产物的差异表达、由其它表面分子或血浆蛋白质导致的不充足的抗体水平或对抗体结合的部分抑制的结果。
体外杀菌活性。调理吞噬杀伤是宿主对胞外细菌,诸如肺炎链球菌的防卫体系的基础。如果由特殊抗原诱导的抗体能够与活化的补体组分(C3bi)结合,结合针对细菌抗原的抗体的细胞表面是易受调理素作用的并且由吞噬细胞(巨噬细胞和嗜中性粒细胞)诱导杀伤(杀菌)。已经显示在体外试验中测量的人血清的抗-肺炎球菌杀菌活性可以与接种疫苗的个体的体内保护作用具有相关性{Romero-Steiner,S.等,1999}。在图7中显示的实例和在表4中显示的总结表示了用相应表位在小鼠中产生的抗原特异性抗体测量的杀菌活性。按照这些数据,一些新的肺炎球菌抗原诱导了功能性抗体(例如SP0082,SP2216,SP2136,SP0454,SP0069,SP0369等)。重要的是,证实了众所周知的保护性肺炎球菌抗原,PspA(SP0117)在非常相同的试验中是强阳性的。
这些实验证实了生物信息预测,即许多蛋白质因它们的信号肽序列而被输出,此外显示了它们存在于肺炎链球菌血清型4的细胞表面上。它们还证实对于由具有功能特性的人抗体的识别,这些蛋白质是可获得的,并且使它们成为对于开发针对肺炎球菌性疾病的疫苗有价值的候选物。
实施例7:对诱导保护性免疫应答的肺炎球菌抗原的鉴定
实验方法
重组肺炎球菌蛋白质的表达
基因/DNA片段的克隆:使用基因特异性引物通过PCR从肺炎链球菌(菌株T4,荚膜型4)的基因组中扩增目标基因/DNA片段。除了基因特异性部分以外,所述引物还具有协助扩增的PCR产物定向克隆的限制性酶切位点。所述引物的基因退火(特异性)部分在长度上的范围介于15-24个碱基之间。用适当的限制性酶消化获得PCR产物并将其克隆在pET28b(+)载体上(NOVAGEN)。一旦证实了重组质粒包含目标基因,对作为表达宿主的大肠杆菌BL21
Figure G04810200X19960403D000981
细胞(INVITROGEN)进行转化。对这些细胞进行优化以有效地表达目标基因。表达和纯化蛋白质:培养具有重组质粒的大肠杆菌BL21
Figure G04810200X19960403D000982
细胞直到在所需培养体积中达到对数期。一旦达到0.8的OD600nm,用1mM的IPTG于37℃诱导培养物3小时。通过离心收获所述细胞,通过冻融结合的方法裂解,随后用NOVAGEN’分裂细胞。通过离心,将裂解物分离成可溶的部分(上清液)和不可溶的部分(沉淀)。取决于蛋白质的定位,随后采用不同的纯化策略。如果蛋白是在可溶的部分,通过使上述上清液与Ni-Agarose珠(Ni-NTA-
Figure G04810200X19960403D000984
,QIAGEN)结合来进行蛋白质的纯化。由于在表达蛋白的C端或者N端或者两端的五组氨酸(HIS)的存在,当其它的污染蛋白质被洗涤缓冲液从柱上洗涤下来时,其与Ni-agarose结合。用100mM immidazole洗脱所述蛋白质并且浓缩所述洗脱物,通过Bradford分析蛋白质的浓度并通过PAGE和蛋白质印迹检查进行检测。如果所述蛋白质存在于不可溶的部分中,将沉淀溶解在包含8M尿素的缓冲液中。使用上述的相同的材料和方法在变性条件下(在包含8M尿素的缓冲液中)进行纯化。浓缩洗脱物并以逐步方式进行透析以去除所有的尿素。通过SDS-PAGE检测所述蛋白质并通过Bradford方法测量浓度。
动物保护研究
动物:使用雌性小鼠C3H(HeNHsd;A,B,C,D:agouti,野生型,自交)。 动免疫:皮下注射50μg的重组蛋白并用完全弗氏佐剂(CFA)辅助。在第14和第28天,用相同量的蛋白加强免疫动物两次,但用不完全弗氏佐剂(IFA)辅助。将众所周知的保护性抗原PspA(SP0117)用作阳性对照,而将未免疫的(PBS或者CFA/IFA佐剂注射的)小鼠用作阴性对照。使用相应的重组蛋白通过ELISA在第35-38天测量抗体效价,并测定其在200.00-1.000.000范围内(终点效价)。被动免疫:在腹膜内接种肺炎链球菌之前2小时,用150-300μl小鼠血清对首次实验的小鼠进行腹膜内免疫。细菌激 :制备肺炎链球菌的血清型6B的冷冻甘油贮存物并用于所有的实验。通过OD600nm测量测定适当估计的细胞数量。为了确定存在于制备自冷冻甘油贮存培养物的接种物中的真正存活的细胞数量,使用6个系列稀释度通过接种在平板上确定集落形成单位。通过在鼠尾静脉内地注射或者腹膜内地注射104-108细菌/小鼠。在激发后,通过监控存活率2-3周来测量免疫的保护性效果并以%的动物总数(10/组)中表示。
结果
在本发明中,确定了由细菌表面展示鉴定的6个不同肺炎球菌抗原在小鼠脓毒症/致死率模型中具有保护作用。用代表SP2190、SP2216和SP0667蛋白的重组抗原进行的免疫获得了最佳保护水平,而SP0368、SP1732和SP0498显示了较低的保护水平(图8)。如已经通过被动血清转移实验所证实的,抗体介导了保护性作用(图9)。相对于来自阴性对照组的小鼠,接受特异性抗-SP2190和抗-SP2216抗体的首次实验的小鼠免于死亡。重要的是,如已经在图9中显示的,这些抗原的组合导致了提高的保护。与用100μl的每种特异性抗血清(补充以100μl的首次实验的血清)的血清治疗相比,用150μl的由重组SP2190或重组SP2216产生的免疫血清(补充以150μl首次实验的血清)进行的被动免疫导致了较低水平的存活率。这些实验强烈支持这些抗原的组合在针对肺炎球菌的疾病的接种中具有有益的效果。
由于用于免疫的抗原来自血清型4菌株,并且激发菌株是血清型6B的,这些实验证实了所述抗原是交叉保护性的。
所述SP2216,SP2190和SP1732重组蛋白在从侵入性肺炎球菌性疾病中恢复的患者,以及在那些接触肺炎球菌的健康个体(在家庭中的儿童)的血清中检测到了最高水平的抗体(数据未显示)。在细菌表面展示筛选中鉴定的最频繁的抗原是SP2216蛋白。具体的目的是比较由人抗体选择的这种蛋白质(N-端氨基酸序列)或者未选择的这种蛋白质(C-端氨基酸序列)的亚结构域的保护性(图10A)。用两种不同的结构域(作为重组抗原表达的)免疫后,变得显而易见的是  SP2216蛋白的免疫原性部分具有保护性潜能,而未被选择的结构域是无效的并且可与阴性对照相当(图10B)。基于该实验,由细菌表面展示检测的表位鉴定了细菌蛋白的保护性表位和区域并且可以将这种信息用于随机设计基于本发明所述的抗原的亚单位的疫苗。
实施例8:确定保护性抗原的序列保守性
实验方法
免疫印迹
总细菌裂解物和培养上清液样品制备自体外生长的肺炎链球菌菌株。将代表48种不同血清型的60个(临床分离株)包括在本研究中。使用BioRad Mini-Protean 3 Cell电泳系统通过SDS-PAGE分离大约25μg总蛋白质/泳道,并将蛋白质转移到硝酸纤维素膜(ECL,Amersham Pharmacia)上。在5%牛奶中封闭过夜后,将用来自血清型4菌株的重组蛋白SP2216、SP1732和SP2190(并将SP0117/PspA作为内对照)免疫产生的超免疫小鼠血清以5,000x稀释度加入,并使用HRPO标记的抗-小鼠IgG进行检测。
DNA测序
使用校正聚合酶Expand(ROCHE)通过PCR扩增来自肺炎链球菌(血清型4、6B、9V、14、18C、19F和23F)的基因组DNA的SP1732、SP2190和SP22126基因。使用长度介于27-31个碱基的基因特异性引物来扩增整个开放阅读框。将获得的PCR产物克隆到
Figure G04810200X19960403D001011
2.1-TOPO载体(Invitrogen)。在确证(MWG)序列之前,使用小量制备试剂盒(Qiagen)纯化重组质粒DNA。除了所述7个血清型外,通过PCR扩增来自其它41个不同血清型的SP2216基因,并对纯化的PCR产物进行测序。
结果
鉴定诱导抗体的保守抗原对于开发有效疫苗是关键的,所述抗体与不同的临床分离株具有交叉反应性。其与靶向肺炎球菌性疾病的基于蛋白的疫苗尤其相关,因为肺炎链球菌(肺炎球菌)的超过90个的不同血清型与人类感染相关联。
在完全分析中,确定了由全部来自血清型4的菌株的SP2216、SP2190和SP1732诱导的抗体与在免疫印迹分析中测试的所有不同的血清型具有广泛的交叉反应性(图11)。显著地,显示电泳迁移率变化(指示不同大小)的SP2190抗原保持了抗体反应性,强烈支持优势免疫表位是保守的。与此相对地,我们检测到了与抗-PspA抗体较低的交叉反应性,这与在这种抗原的免疫原性氨基酸序列中已知的差异是一致的。
为了直接解决鉴定的保护性抗原在肺炎链球菌的不同血清型中是否是保守的这一问题,对SP2216、SP1732和SP2190基因进行了DNA序列分析。SP2216和SP1732是高度保守的,仅检测到少数几个氨基酸变化。
对来自代表47个不同肺炎链球菌血清型的47个不同临床分离株的SP2216基因进行测序,并仅在分析菌株的其中两个中检测到了仅一个氨基酸交换(图12)。在大多数分析的菌株(6个中的4个)中检测到了SP1732基因的一个或两个氨基酸交换(图13)。如在图14中显示的,所述2190抗原在相应基因的氨基酸序列中显示了巨大的变异性。由于插入和缺失,很难计算在不同SP2190变体中的精确的氨基酸同源性,但是可以估计其在介于约60和90%之间。但是,基于图8,9和11表现的实验,氨基酸同一性对于诱导交叉反应性和交叉保护性抗体是足够的。
参考文献
Adamou,J.,等(200 1).Infect Immun 69:949-58。
Altschul,S.,等(1990).Journal of Molecular Biology 215:403-10。
Bennett,D.,等(1995).J Mol Recognit 8:52-8。
Brown,J.,等(2001).Infect Immun 69:6702-6。
Burnie,J.,等(1998).J Antimicrob Chemother 41:319-22。
Clackson,T.,等(1991).Nature 352:624-8。
Devereux,J.,等(1984).Nucleic acids research 12:387-95。
DiGuilmi,A.,等(2002).EMBO Rep 3:728-34.
Doherty,E.,等(2001).Annu Rev Biophys Biomol Struct 30:457-475。
Eisenbraun,M.,等(1993).DNA Cell Biol 12:791-7。
Epidemiology and Prevention of Vaccine-Preventable Diseases,7th
Edition-Second Printing(The Pink Book).The Pink Book is published by theCenters for Disease Control and Prevention,U.S.Department of Health andHuman Services。
Etz,H.,等(2001).J.Bacteriol 183:6924-35。
Ganz,T.(1999). Science 286:420-421。
Georgiou,G.(1997).Nature Biotechnology 15:29-34。
Gray,B.,等(1979).J Infect Dis 140:979-83。
Gray,B.,等(1986).Pediatr Infect Dis 5:201-7。
Hashemzadeh-Bonehi,L.,等(1998).Mol Microbiol 30:676-678。
Hausdorff,W.,等(2001).Lancet 357:950-2。
Heinje,von G.(1987)e.g.Sequence Analysis in Molecular Bio1ogy,Acedimic Press
Hemmer,B.,等(1999).Nat Med 5:1375-82。
Hoe,N.,等(2001).J Infect Dis183:633-9。
Hornef,M.,等(2002).Nat Immunol 3:1033-40。
Hoskins,J.,等(2001).J Bacteriol 183:5709-17。
Hyde,T.,等(2001).JAMA 286:1857-62。
Jedrzejas,M.(2001).Microbiol Mol Biol Rev 65:187-207。
Johanson,K.,等(1995).J Biol Chem 270:9459-71。
Jones,P.,等(1986).Nature 321:522-5。
Kajava,A.,等(2000).J Bacteriol 182:2163-9。
Kohler,G.,等(1975).Nature 256:495-7。
Kolaskar,A.,等(1990).FEBS Lett 276:172-4。
Lewin,A.,等(2001).Trends Mol Med 7:221-8。
Marks,J.,等(1992).Biotechnology(N Y)10:779-83。
McCafferty,J.,等(1990).Nature 348:552-4。
McCormick,A.,等(2003).Nat Med 9:424-30。
McDaniel,L.,等(1991).Infect Immun 59:222-8。
Navarre,W.,等(1999).Microbiol Mol Biol Rev 63:174-229。
Okano,H.,等(1991).J Neurochem 56:560-7。
Oligodeoxynucleotides as Antisense Inhibitors of Gene Expression;CRCPress,Boca Tation,FL(1988) for a description of these moleculesOrange,M.,等(1993).Pediatr Infect Dis J12:244-6。
Pelton,S.,等(2003).Vaccine 21:1562-71。
Phillips-Quagliata,J.,等(2000).J Immunol 165:2544-55。
Rammensee,H.,等(1999).Immunogenetics 50:213-9。
Roche,H.,等(2003).Infect Immun 71:1033-41.
Romero-Steiner,S.,等(1999).Clin Infect Dis 29:281-8。
Rosenow,C.,等(1997).Mol Microbiol 25:819-29。
Seeger,C.,等(1984).Proc Natl Acad Sci U S A 81:5849-52。
Shibuya,A.,等(2000).Nature Immunology 1:441-6。
Skerra,A.(1994).Gene 151:131-5。
Talkington,D.,等(1996).Microb Pathog 21:17-22。
Tang,D.,等(1992).Nature 356:152-4。
Tempest,P.,等(1991).Biotechnology (N Y)9:266-71。
Tettelin,H.,等(2001).Science 293:498-506。
Tourdot,S.,等(2000).Eur J Immunol 30:3411-21。
Whitney,C.,等(2000).N Engl J Med 343:1917-24。
Wiley,J.,等(1987)Current Protocols in Molecular Biology。
Wizemann,T.,等(2001).Infect Immun 69:1593-8。
表1通过细菌表面展示鉴定的免疫原性蛋白质
  肺炎链球菌抗原蛋白   推定的功能(通过同源性)   预测的免疫原性氨基酸** 每个开放阅读框和筛选的选定克隆的编号   已鉴定的免疫原性区域的定位(氨基酸)   SeqID(DNA,蛋白质)
  SP0008   假设的蛋白质  4-11,35-64,66-76,101-108,111-119 G:15   57-114   1,145
  SP0032   DNA聚合酶I(poIA)  5-27,32-64,92-102,107-113,119-125,133-139,148-162,177-187,195-201,207-214,241-251,254-269,285-300,302-309,317-324,332-357,365-404,411-425,443-463,470-477,479-487,506-512,515-520,532-547,556-596,603-610,616-622,624-629,636-642,646-665,667-674,687-692,708-720,734-739,752-757,798-820,824-851,856-865 H:39,I:6,L:2   732-763   2,146
  SP0069 胆碱结合蛋白I  14-21,36-44,49-66,102-127,162-167,177-196 G:1,H:2,L:1,K:44,L:3,M:1   45-109145-172   3,147
  SP0071 免疫球蛋白A1蛋白酶(iga-1)  17-35,64-75,81-92,100-119,125-172,174-183,214-222,230-236,273-282,287-303,310-315,331-340,392-398,412-420,480-505,515-523,525-546,553-575,592-598,603-609,617-625,631-639,644-651,658-670,681-687,691-704,709-716,731-736,739-744,750-763,774-780,784-791,799-805,809-822,859-870,880-885,907-916,924-941,943-949,973-986,1010-1016,1026-1036,1045-1054,1057-1062,1082-1088,1095-1102,1109-1120,1127-1134,1140-1146,1152-1159,1169-1179,1187-1196,1243-1251,1262-1273,1279-1292,1306-1312,1332-1343,1348-1364,1379-1390,1412-1420,1427-1436,1458-1468,1483-1503,1524-1549,1574-1588,1614-1619,1672-1685,1697-1707,1711-1720,1738-1753,1781-1787,1796-1801,1826-1843 A:3,C:1,D:9,E:9,F:4,G:21,I:34,K:61,L:20,M:2   132-478508-5921753-1810   4,148
  SP0082   细胞壁表面锚形体  15-43,49-55,71-77,104-110,123-130,162-171,180-192,199-205,219-227,246-254,264-270,279-287,293-308,312-322,330-342,349-356,369-377,384-394,401-406,416-422,432-439,450-460,464-474,482-494,501-508,521-529,536-546,553-558,568-574,584-591,602-612,616-626,634-646,653-660,673-681,688-698,705-710,720-726,736-749,833-848 C:9,E:4F:2,L:26,L:4,M:67   1-199200-337418-494549-647   5,149
  SP0107 LysM结构域蛋白  9-30,65-96,99-123,170-178 A:3,B:16,C:15,D:1,E:5,F:178,   1-128   6,150
  肺炎链球菌抗原蛋白   推定的功能(通过同源性)   预测的免疫原性氨基酸**   每个开放阅读框和筛选的选定克隆的编号   已鉴定的免疫原性区域的定位(氨基酸)   Seq ID(DNA,蛋白质)
  M:1
  SP0117   肺炎球菌表面蛋白A(pspA)   7-32,34-41,96-106,127-136,154-163,188-199,207-238,272-279,306-312,318-325,341-347,353-360,387-393,399-406,434-440,452-503,575-580,589-601,615-620,635-640,654-660,674-680,696-701,710-731   A:13,B:11,C:10,D:4,E:31,F:6,G:33,H:13,I:9,K:64,L:32,M:46   1-548660-691   7,151
  SP0191   假设的蛋白质   4-19,35-44,48-59,77-87,93-99,106-111,130-138,146-161   E:1,I:2   78-84   8,152
  SP0197   推定的二氢叶酸合酶   24-30,36-43,66-86,93-99,106-130,132-145,148-165,171-177,189-220,230-249,251-263,293-300,302-312,323-329,338-356,369-379,390-412   L:9   179-193   9,153
  SP0212 核蛋白L2   30-39,61-67,74-81,90-120,123-145,154-167,169-179,182-197,200-206,238-244,267-272   L:10   230-265   10,154
  SP0222 核蛋白S14   14-20,49-65,77-86   H:14,L:8,M:3   2-68   11,155
  SP0239   保守的假设蛋白质   4-9,26-35,42-48,53-61,63-85,90-101,105-111,113-121,129-137,140-150,179-188,199-226,228-237,248-255,259-285,299-308,314-331,337-343,353-364,410-421,436-442   L:2,M:1   110-144   12,156
  SP0251 推定的甲酸乙酰基转移酶   36-47,55-63,94-108,129-134,144-158,173-187,196-206,209-238,251-266,270-285,290-295,300-306,333-344,346-354,366-397,404-410,422-435,439-453,466-473,515-523,529-543,554-569,571-585,590-596,607-618,627-643,690-696,704-714,720-728,741-749,752-767,780-799   G:2,H:7,L:1,M:5   225-247480-507   13,157
  SP0295 核蛋白S9(rpsl)   16-25,36-70,80-93,100-106   L:4   78-130   14,158
  SP0330 糖结合转录调节子RegR   18-27,41-46,50-57,65-71,79-85,93-98,113-128,144-155,166-178,181-188,201-207,242-262,265-273,281-295,303-309,318-327   G:1,H:1,L:4   36-64   15,159
  SP0368   细胞壁表面锚形体家族蛋白质   7-29,31-44,50-59,91-96,146-153,194-201,207-212,232-238,264-278,284-290,296-302,326-353,360-370,378-384,400-405,409-418,420-435,442-460,499-506,529-534,556-562,564-576,644-651,677-684,687-698,736-743,759-766,778-784,808-814,852-858,874-896,920-925,929-935,957-965,1003-1012,1021-1027,1030-1044,1081-1087,1101-1111,1116-1124,1148-1159,1188-   D:1,H:3,I:1,L:1,M:3   1-70154-189922-9411445-14621483-1496   16,160
  肺炎链球菌抗原蛋白   推定的功能(通过同源性)   预测的免疫原性氨基酸** 每个开放阅读框和筛选的选定克隆的编号   已鉴定的免疫原性区域的定位(氨基酸)   SeqID(DNA,蛋白质)
1196,1235-1251,1288-1303,1313-1319,1328-1335,1367-1373,1431-1437,1451-1458,1479-1503,1514-1521,1530-1540,1545-1552,1561-1568,1598-1605,1617-1647,1658-1665,1670-1676,1679-1689,1698-1704,1707-1713,1732-1738,1744-1764
  SP0369   青霉素结合蛋白1A 6-51,81-91,104-113,126-137,150-159,164-174,197-209,215-224,229-235,256-269,276-282,307-313,317-348,351-357,376-397,418-437,454-464,485-490,498-509,547-555,574-586,602-619 B:1,E:1,L:13,M:1   452-530   17,161
  SP0374 假设的蛋白质 25-31,39-47,49-56,99-114,121-127,159-186,228-240,253-269,271-279,303-315,365-382,395-405,414-425,438-453 E:4,I:1,L:3   289-384   18,162
  SP0377   胆碱结合蛋白C 9-24,41-47,49-54,68-78,108-114,117-122,132-140,164-169,179-186,193-199,206-213,244-251,267-274,289-294,309-314,327-333 G:5,H:4,I:1,K:88,L:3,M:8   209-249286-336   19,163
  SP0378   胆碱结合蛋白J(cbpJ) 9-28,53-67,69-82,87-93,109-117,172-177,201-207,220-227,242-247,262-268,305-318,320-325 K:47,L:6,M:5  286-306   20,164
  SP0390 胆碱结合蛋白G(cbpG) 4-10,26-39,47-58,63-73,86-96,98-108,115-123,137-143,148-155,160-176,184-189,194-204,235-240,254-259,272-278 G:1,K:69,M:6  199-283   21,165
  SP0454   假设的蛋白质 4-26,33-39,47-53,59-65,76-83,91-97,104-112,118-137,155-160,167-174,198-207,242-268,273-279,292-315,320-332,345-354,358-367,377-394,403-410,424-439,445-451,453-497,511-518,535-570,573-589,592-601,604-610 H:1,L:1,L:6   202-242   22,166
  SP0463 细胞壁表面锚形体家族蛋白质 8-30,36-45,64-71,76-82,97-103,105-112,134-151,161-183,211-234,253-268,270-276,278-284,297-305,309-315,357-362,366-372,375-384,401-407,409-416,441-455,463-470,475-480,490-497,501-513,524-537,552-559,565-576,581-590,592-600,619-625,636-644,646-656 A:1,B:2,C:4,E:1,F:4,   316-419   23,167
  SP0466 推定的分选酶 4-17,52-58,84-99,102-110,114-120,124-135,143-158,160-173,177-196,201-216,223-250,259-267,269-275 E:1,M:2   1-67   24,168
  SP0468 推定的分选酶 6-46,57-67,69-80,82-133,137-143,147-168,182-187,203-209,214-229,233-242,246-280 G:24,H:20,L:1   53-93   25,169
  SP0498   推定的内-β-N-乙酰基氨基葡糖苷酶 7-40,50-56,81-89,117-123,202-209,213-218,223-229,248-261,264-276,281-288,303-308,313-324,326-332,340-346,353-372,434-443,465-474,514-523,556-564,605-616,620-626,631-636,667-683,685-699,710-719,726-732,751-756,760-771,779-788,815-828,855-867,869- B:5,C:1,E:2,F:1,G:2   1226-13091455-15361538-1605   26,170
  肺炎链球菌抗原蛋白   推定的功能(通过同源性)   预测的免疫原性氨基酸**   每个开放阅读框和筛选的选定克隆的编号   已鉴定的免疫原性区域的定位(氨基酸)   SeqID(DNA,蛋白质)
879,897-902,917-924,926-931,936-942,981-1000,1006-1015,1017-1028,1030-1039,1046-1054,1060-1066,1083-1092,1099-1112,1122-1130,1132-1140,1148-1158,1161-1171,1174-1181,1209-1230,1236-1244,1248-1254,1256-1267,1269-1276,1294-1299,1316-1328,1332-1354,1359-1372,1374-1380,1384-1390,1395-1408,1419-1425,1434-1446,1453-1460,1465-1471,1474-1493,1505-1515,1523-1537,1547-1555,1560-1567,1577-1605,1633-1651
  SP0509 I型限制性-修饰性系统M亚单位 4-10,31-39,81-88,106-112,122-135,152-158,177-184,191-197,221-227,230-246,249-255,303-311,317-326,337-344,346-362,365-371,430-437,439-446,453-462,474-484   I:2   449-467   27,171
  SP0519   dnaJ蛋白质(dnaJ) 9-15,24-35,47-55,122-128,160-177,188-196,202-208,216-228,250-261,272-303,318-324,327-339,346-352,355-361,368-373   A:1,D:2,H:2   108-218344-376   28,172
  SP0529 BlpC ABC转运蛋白质(blpB) 6-14,17-48,55-63,71-90,99-109,116-124,181-189,212-223,232-268,270-294,297-304,319-325,340-348,351-370,372-378,388-394,406-415,421-434   A:1,B:3,C:3,D:1,F:4,   177-277   29,173
  SP0564   假设的蛋白质 21-39,42-61,65-75,79-85,108-115   H:3   11-38   30,174
  SP0609 氨基酸ABC转运蛋白,氨基酸结合蛋白 4-17,26-39,61-76,103-113,115-122,136-142,158-192,197-203,208-214,225-230,237-251   I:3   207-225   31,175
  SP0613 金属-β-内酰胺酶超家族蛋白质 5-11,27-36,42-53,62-70,74-93,95-104,114-119,127-150,153-159,173-179,184-193,199-206,222-241,248-253,257-280,289-295,313-319,322-342,349-365,368-389,393-406,408-413,426-438,447-461,463-470,476-495,532-537,543-550   I:12   225-246   32,176
  SP0641 丝氨酸蛋白酶 4-29,68-82,123-130,141-147,149-157,178-191,203-215,269-277,300-307,327-335,359-370,374-380,382-388,393-400,410-417,434-442,483-492,497-503,505-513,533-540,564-569,601-607,639-647,655-666,693-706,712-718,726-736,752-758,763-771,774-780,786-799,806-812,820-828,852-863,884-892,901-909,925-932,943-948,990-996,1030-1036,1051-1059,1062-1068,1079-1086,1105-1113,1152-1162,1168-1179,1183-1191,1204-1210,1234-1244,1286-1295,1318-1326,1396-1401,1451-1460,1465-1474,1477-1483,1488-1494,1505-1510,1514-1521,1552-1565,1593-1614,1664-1672,1677-1685,1701-1711,1734-1745,1758-1770,1784-1798,1840-   A:19,B:72,C:34,D:5,E:21,F:86,G:26,H:86,I:17,L:130,M:29   1-348373-490573-767903-10431155-11981243-14821550-15951682-17191793-19212008-2110   33,177
  肺炎链球菌抗原蛋白   推定的功能(通过同源性)   预测的免疫原性氨基酸**   每个开放阅读框和筛选的选定克隆的编号   已鉴定的免疫原性区域的定位(氨基酸)   SeqID(DNA,蛋白质)
  1847,1852-1873,1885-1891,1906-1911,1931-1939,1957-1970,1977-1992,2014-2020,2026-2032,2116-2134
  SP0648   β-半乳糖苷酶(bgaA)   10-35,39-52,107-112,181-188,226-236,238-253,258-268,275-284,296-310,326-338,345-368,380-389,391-408,410-418,420-429,444-456,489-505,573-588,616-623,637-643,726-739,741-767,785-791,793-803,830-847,867-881,886-922,949-956,961-980,988-1004,1009-1018,1027-1042,1051-1069,1076-1089,1108-1115,1123-1135,1140-1151,1164-1179,1182-1191,1210-1221,1223-1234,1242-1250,1255-1267,1281-1292,1301-1307,1315-1340,1348-1355,1366-1373,1381-1413,1417-1428,1437-1444,1453-1463,1478-1484,1490-1496,1498-1503,1520-1536,1538-1546,1548-1570,1593-1603,1612-1625,1635-1649,1654-1660,1670-1687,1693-1700,1705-1711,1718-1726,1729-1763,1790-1813,1871-1881,1893-1900,1907-1935,1962-1970,1992-2000,2006-2013,2033-2039,2045-2051,2055-2067,2070-2095,2097-2110,2115-2121,2150-2171,2174-2180,2197-2202,2206-2228   C:1,E:1,F:1,G:1,H:4,I:1,M:2   1526-1560   34,178
  SP0664   推定的锌金属蛋白酶ZmpB   4-17,35-48,54-76,78-107,109-115,118-127,134-140,145-156,169-174,217-226,232-240,256-262,267-273,316-328,340-346,353-360,402-409,416-439,448-456,506-531,540-546,570-578,586-593,595-600,623-632,662-667,674-681,689-705,713-724,730-740,757-763,773-778,783-796,829-835,861-871,888-899,907-939,941-955,957-969,986-1000,1022-1028,1036-1044,1068-1084,1095-1102,1118-1124,1140-1146,1148-1154,1168-1181,1185-1190,1197-1207,1218-1226,1250-1270,1272-1281,1284-1296,1312-1319,1351-1358,1383-1409,1422-1428,1438-1447,1449-1461,1482-1489,1504-1510,1518-1527,1529-1537,1544-1551,1569-1575,1622-1628,1631-1637,1682-1689,1711-1718,1733-1740,1772-1783,1818-1834,1859-1872   A:9,B:25,C:13,D:7E:14,F:77,G:12,H:10,K:67,L:13,M:6   1-64128-495   35,179
  SP0667 推定的肺炎球菌表面蛋白质   8-28,32-37,62-69,119-125,137-149,159-164,173-189,200-205,221-229,240-245,258-265,268-276,287-293,296-302,323-329   A:72,B:80,C:90,D:20,E:12,F:53   1-95   36,180
  SP0688   UDP-N-乙酰基muramoyl丙氨酸-D-谷氨酸连接酶   9-18,25-38,49-63,65-72,74-81,94-117,131-137,139-146,149-158,162-188,191-207,217-225,237-252,255-269,281-293,301-326,332-342,347-354,363-370,373-   I:3   75-107   37,181
  肺炎链球菌抗原蛋白   推定的功能(通过同源性)   预测的免疫原性氨基酸**   每个开放阅读框和筛选的选定克隆的编号   已鉴定的免疫原性区域的定位(氨基酸)   SeqID(DNA,蛋白质)
380,391-400,415-424,441-447
  SP0749   支链氨基酸ABC转运蛋白 4-24,64-71,81-87,96-116,121-128,130-139,148-155,166-173,176-184,203-215,231-238,243-248,256-261,280-285,288-306,314-329 E:2,I:8,L:8   67-148   38,182
  SP0770   ABC转运蛋白,ATP-结合蛋白 4-10,19-37,46-52,62-81,83-89,115-120,134-139,141-151,168-186,197-205,209-234,241-252,322-335,339-345,363-379,385-393,403-431,434-442,447-454,459-465,479-484,487-496 L:2   404-420   39,183
  SP0785   保守的假设蛋白质 10-35,46-66,71-77,84-93,96-122,138-148,154-172,182-213,221-233,245-263,269-275,295-301,303-309,311-320,324-336,340-348,351-359,375-381 C:1,E:2,I:1   111-198   40,184
  SP0914   与结瘤素相关的蛋白质,平截 14-25,30-42,47-61,67-75,81-91,98-106,114-122,124-135,148-193,209-227 L.2.   198-213   41,185
  SP0930   胆碱结合蛋白E(cbpE) 5-18,45-50,82-90,97-114,116-136,153-161,163-171,212-219,221-227,240-249,267-281,311-317,328-337,375-381,390-395,430-436,449-455,484-495,538-543,548-554,556-564,580-586,596-602 E:4,G:2,H:1,I:2,K:5   493-606   42,186
  SP0943 Gid蛋白质(gid) 9-25,28-34,37-44,61-68,75-81,88-96,98-111,119-133,138-150,152-163,168-182,186-194,200-205,216-223,236-245,257-264,279-287,293-304,311-318,325-330,340-346,353-358,365-379,399-409,444-453 E:2,L:24  303-391   43,187
  SP0952   丙氨酸脱氢酶,真实的移码(ald) 16-36,55-61,66-76,78-102,121-130,134-146,150-212,221-239,255-276,289-322,329-357 G:3,H:4   29-59   44,188
  SP1003 保守的假设蛋白质(PAT) 8-27,68-74,77-99,110-116,124-141,171-177,202-217,221-228,259-265,275-290,293-303,309-325,335-343,345-351,365-379,384-394,406-414,423-437,452-465,478-507,525-534,554-560,611-624,628-651,669-682,742-747,767-778,782-792,804-812,820-836 A:2,B:5,C:8,D:5,E:13,F:3,M:2   79-231359-451   45,189
  SP1004   保守的假设蛋白质 5-28,39-45,56-62,67-74,77-99,110-117,124-141,168-176,200-230,237-244,268-279,287-299,304-326,329-335,348-362,370-376,379-384,390-406,420-429,466-471,479-489,495-504,529-541,545-553,561-577,598-604,622-630,637-658,672-680,682-688,690-696,698-709,712-719,724-736,738-746,759-769,780-786,796-804,813-818,860-877,895-904,981-997,1000-1014,1021-1029 A:5,B:4,C:4,D:9,E:12,F:4,H:3,I:1,L:1   1-162206-224254-350414-514864-938   46,190
  肺炎链球菌抗原蛋白   推定的功能(通过同源性)   预测的免疫原性氨基酸**   每个开放阅读框和筛选的选定克隆的编号   已鉴定的免疫原性区域的定位(氨基酸)   SeqID(DNA,蛋白质)
  SP1124   糖原合酶(glgA) 4-11,19-49,56-66,68-101,109-116,123-145,156-165,177-185,204-221,226-234,242-248,251-256,259-265,282-302,307-330,340-349,355-374,377-383,392-400,422-428,434-442,462-474 M:1   266-322   47,191
  SP1154   IgA1蛋白酶 14-43,45-57,64-74,80-87,106-127,131-142,145-161,173-180,182-188,203-210,213-219,221-243,245-254,304-311,314-320,342-348,354-365,372-378,394-399,407-431,436-448,459-465,470-477,484-490,504-509,531-537,590-596,611-617,642-647,723-734,740-751,754-762,764-774,782-797,807-812,824-831,838-845,877-885,892-898,900-906,924-935,940-946,982-996,1006-1016,1033-1043,1051-1056,1058-1066,1094-1108,1119-1126,1129-1140,1150-1157,1167-1174,1176-1185,1188-1201,1209-1216,1220-1228,1231-1237,1243-1248,1253-1285,1288-1297,1299-1307,1316-1334,1336-1343,1350-1359,1365-1381,1390-1396,1412-1420,1427-1439,1452-1459,1477-1484,1493-1512,1554-1559,1570-1578,1603-1608,1623-1630,1654-1659,1672-1680,1689-1696,1705-1711,1721-1738,1752-1757,1773-1780,1817-1829,1844-1851,1856-1863,1883-1895,1950-1958,1974-1990 A:6,B:2,C:9,D:3,E:4,F:2,G:6,H:4,I:13,L:12   172-354384-448464-644648-7281357-1370   48,192
  SP1174 保守的结构域蛋白(PAT) 8-27,68-74,77-99,110-116,124-141,169-176,201-216,220-227,258-264,274-289,292-302,308-324,334-342,344-350,364-372,377-387,399-407,416-429,445-458,471-481,483-500,518-527,547-553,604-617,621-644,662-675,767-778,809-816 B:14,C:17,D:6,E:18,F:16,I:1,K:5,L:1,M:8   15-307350-448496-620   49,193
  SP1175   保守的结构域蛋白质 4-17,24-29,53-59,62-84,109-126,159-164,189-204,208-219,244-249,274-290,292-302,308-324,334-342,344-350,378-389,391-397,401-409,424-432,447-460,470-479,490-504,521-529,538-544,549-555,570-577,583-592,602-608,615-630,635-647,664-677,692-698,722-731,733-751,782-790,793-799 A:1,B:4,C:3,D:3,E:9,F:2,H:2,M:4   56-267337-426495-601   50,194
  SP1221 II型限制性内切核酸酶 12-22,49-59,77-89,111-121,136-148,177-186,207-213,217-225,227-253,259-274,296-302,328-333,343-354,374-383,424-446,448-457,468-480,488-502,507-522,544-550,553-560,564-572,587-596,604-614,619-625,629-635,638-656,662-676,680-692,697-713,720-738,779-786,833-847,861-869,880-895,897-902,911-917,946-951,959-967,984-990,992-1004,1021-1040,1057- G:2,H:1,K:1,L:4   381-403   51,195
  肺炎链球菌抗原蛋白   推定的功能(通过同源性)   预测的免疫原性氨基酸**   每个开放阅读框和筛选的选定克隆的编号   已鉴定的免疫原性区域的定位(氨基酸)   SeqID(DNA,蛋白质)
1067,1073-1080
  SP1227   DNA-结合反应调节子 4-10,26-31,46-56,60-66,70-79,86-94,96-102,109-118,132-152,164-187,193-206,217-224 E:1,L:3 81-149   52,196
  SP1241   氨基酸ABC转运蛋白,氨基酸-结合pro 4-21,26-37,48-60,71-82,109-117,120-128,130-136,142-147,181-187,203-211,216-223,247-255,257-284,316-325,373-379,395-400,423-435,448-456,479-489,512-576,596-625,641-678,680-688,692-715 B:2,C:1,E:2,I:1   346-453   53,197
  SP1287   信号识别颗粒蛋白(ffh) 10-16,25-31,34-56,58-69,71-89,94-110,133-176,186193,208-225,240-250,259-266,302-307,335-341,376-383,410-416 B:8,G:8,H:3,M:1   316-407   54,198
  SP1330 推定的N-乙酰基甘露糖胺-6-P差向异构酶(nanE) 11-29,42-56,60-75,82-88,95-110,116-126,132-143,145-160,166-172,184-216 L:45   123-164   55,199
  SP1374 分支酸合酶(aroC) 11-29,54-63,110-117,139-152,158-166,172-180,186-193,215-236,240-251,302-323,330-335,340-347,350-366,374-381 G:1,L:29,M:14 252-299   56,200
  SP1378   保守的假设蛋白质 18-27,35-42,50-56,67-74,112-136,141-153,163171,176-189,205-213,225-234,241-247,253-258,269-281,288-298,306-324,326-334,355-369,380-387 H:2   289-320   57,201
  SP1429   肽酶,U32家族 7-15,19-41,56-72,91-112,114-122,139-147,163-183,196-209,258-280,326-338,357-363,391-403,406-416 H:4   360-378   58,202
  SP1478   氧化还原酶,醛/酮还原酶家族 11-18,29-41,43-49,95-108,142-194,204-212,216-242,247-256,264-273 H:11   136-149   59,203
  SP1518   保守的假设蛋白质 18-24,33-40,65-79,89-102,113-119,130-137,155-161,173-179,183-203,205-219,223-231,245-261,267-274,296-306,311-321,330-341,344-363,369-381,401-408,415-427,437-444,453-464,472-478,484-508,517-524,526-532,543-548 A:10,E:4,G:5,H:1 59-180   60,204
  SP1522   保守的结构域蛋白质 5-13,52-65,67-73,97-110,112-119,134-155 B:4,C:6,E:1,H:7,L:3   45-177   61,205
  SP1527   寡肽ABC转运蛋白 6-28,34-43,57-67,75-81,111-128,132-147,155-163,165-176,184-194,208-216,218-229,239-252,271-278,328-334,363-376,381-388,426-473,481-488,492-498,507-513,536-546,564-582,590-601,607-623 A:1,B:1,C:4,F:1,G:26,H:18,I:10,L:2,M:1   148-269420-450610-648   62,206
  肺炎链球菌抗原蛋白   推定的功能(通过同源性)   预测的免疫原性氨基酸**   每个开放阅读框和筛选的选定克隆的编号   已鉴定的免疫原性区域的定位(氨基酸)   SeqID(DNA,蛋白质)
  SP1573   溶菌酶(IytC) 4-12,20-38,69-75,83-88,123-128,145-152,154-161,183-188,200-213,245-250,266-272,306-312,332-339,357-369,383-389,395-402,437-453,455-470,497-503   A:40,B:27,C:24,D:2,E:6,G:11,K:1   1-112   63,207
  SP1604   假设的蛋白质 35-59,74-86,111-117,122-137   A:1,C:3,E:1,G:1,I:1   70-154   64,208
  SP1661   细胞分裂蛋白DivIVA 26-42,54-61,65-75,101-107,123-130,137-144,148-156,164-172,177-192,213-221,231-258   E:2   157-249   65,209
  SP1664   ylmF蛋白质(ylmF) 29-38,61-67,77-87,94-100,105-111,118-158   B:1,C:42,I:3   1-97   66,210
  SP1676   推定的N-乙酰基neuraminate裂合酶 7-21,30-48,51-58,60-85,94-123,134-156,160-167,169-183,186191,216-229,237-251,257-267,272-282,287-298   H:2   220-243   67,211
  SP1687   神经氨酸酶B(nanB) 6-9,34-47,56-65,69-76,83-90,123-134,143-151,158-178,197-203,217-235,243-263,303-309,320-333,338-348,367-373,387-393,407-414,416-427,441-457,473-482,487-499,501-509,514520,530-535,577-583,590-602,605-612,622-629,641-670,678-690   B:3,E:2,L:1,M:2   37-71238-307   68,212
  SP1693   神经氨酸酶A(nanA) 7-40,121-132,148-161,196-202,209-215,221-235,248-255,271-280,288-295,330-339,395-409,414-420,446-451,475-487,556-563,568-575,580-586,588-595,633-638,643-648,652-659,672-685,695-700,710-716,737-742,749-754,761-767,775-781,796-806,823-835,850-863,884-890,892-900,902-915,934-941   C:3,D:5,E:3,F:1,G:7,H:1,I:3,K:20,L:4   406-521   69,213
  SP1732   丝氨酸/苏氨酸蛋白激酶 9-18,24-46,51-58,67-77,85-108,114-126,129-137,139-146,152-165,173-182,188-195,197-204,217-250,260-274,296-313,343-366,368-384,427-434,437-446,449-455,478-484,492-506,522-527,562-591,599-606,609-618,625-631,645-652   E:2,H:1   577-654   70,214
  SP1735 甲硫氨酰基-tRNA甲酰基转移酶(fmt) 13-20,26-37,41-53,56-65,81-100,102-114,118-127,163-188,196-202,231-238,245252,266-285,293-298,301-306   K:13,M:13   1978   71,215
  SP1759   前蛋白质移位酶,SecA,亚单位(secA-2) 10-23,32-42,54-66,73-91,106-113,18-127,139-152,164-173,198-207,210-245,284-300,313-318,330-337,339-346,354-361,387393,404-426,429-439,441-453,467-473,479-485,496-509,536-544,551-558,560-566,569-574,578-588,610-615,627-635,649-675,679-690,698-716,722-734,743-754,769-780,782-787   I:6,L:2,M:2   480-550   72,216
  肺炎链球菌抗原蛋白   推定的功能(通过同源性)   预测的免疫原性氨基酸**   每个开放阅读框和筛选的选定克隆的编号   已鉴定的免疫原性区域的定位(氨基酸)   SeqID(DNA,蛋白质)
  SP1772   细胞壁表面锚形体家族蛋白质 6-39,42-50,60-68,76-83,114-129,147-162,170-189,197-205,217-231,239-248,299-305,338-344,352-357,371-377,380-451,459-483,491-499,507-523,537-559,587-613,625-681,689-729,737-781,785-809,817-865,873-381,889-939,951-975,983-1027,1031-1055,1063-1071,1079-1099,1103-1127,1151-1185,1197-1261,1269-1309,1317-1333,1341-1349,1357-1465,1469-1513,1517-1553,1557-1629,1637-1669,1677-1701,1709-1725,1733-1795,1823-1849,1861-1925,1933-1973,1981-2025,2029-2053,2061-2109,2117-2125,2133-2183,2195-2219,2227-2271,2275-2299,2307-2315,2323-2343,2347-2371,2395-2429,2441-2529,2537-2569,2577-2601,2609-2625,2633-2695,2699-2737,2765-2791,2803-2867,2889-2913,2921-2937,2945-2969,2977-2985,2993-3009,3023-3045,30733099,3111-3167,3175-3215,3223-3267,3271-3295,3303-3351,3359-3367,3375-3425,3437-3461,3469-3513,3517-3541,3549-3557,3565-3585,3589-3613,3637-3671,3683-3747,3755-3795,3803-3819,3827-3835,3843-3951,3955-3999,4003-4039,4043-4115,4123-4143,4147-4171,4195-4229,4241-4305,4313-4353,4361-4377,4385-4393,4401-4509,4513-4557,4561-4597,4601-4718,4749-4768 B:9,C:1,D:1,F:13,G:1,H:3,I:1,L:1,M:2   74-171452-5592951-3061   73,217
  SP1804   推定的通用应激蛋白24 16-22,30-51,70-111,117-130,137-150,171-178,180-188,191-196 I:4   148-181   74,218
  SP1888 寡肽ABC转运蛋白,ATP-结合蛋白AmiE 6-19,21-46,50-56,80-86,118-126,167-186,189-205,211-242,244-267,273-286,290-297,307-316,320-341 H:1   34-60   75,219
  SP1891 寡肽ABC转运蛋白 5-26,33-43,48-54,58-63,78-83,113-120,122-128,143-152,157-175,185-192,211-225,227-234,244-256,270-281,284-290,304-310,330-337,348-355,362-379,384-394,429-445,450-474,483-490,511-520,537-546,548-554,561-586,590-604,613-629 A:2,B:3,E:1,F:1,G:13,H:8   149-186285-431573-659   76,220
  SP1937 自溶素(IytA) 5-26,49-59,61-67,83-91,102-111,145-157,185-192,267-272,279-286,292-298,306-312 D:3,F:1,G:1,H:2,K:11,M:1   134-220235-251254-280   77,221
  SP1954 丝氨酸蛋白酶,subtilase家族,真实的框架 5-19,72-79,83-92,119-124,140-145,160-165,167-182,224-232,240-252,259-270,301-310,313-322,332-343,347-367,384-398,416-429,431-446,454-461 C:43,E:6,I:4,K:21,L:50  1-169   78,222
  SP1980   cmp-结合-因子1 8-17,26-31,56-62,75-83,93-103,125-131,135-141,150-   H:9   127-168   79,223
  肺炎链球菌抗原蛋白   推定的功能(通过同源性)   预测的免疫原性氨基酸**   每个开放阅读框和筛选的选定克隆的编号   已鉴定的免疫原性区域的定位(氨基酸)   SeqID(DNA,蛋白质)
  (cbf1) 194,205-217,233-258,262-268,281-286
  SP1992   细胞壁表面锚形体家族蛋白质 6-12,69-75,108-115,139-159,176-182,194-214 B:5,C:1,F:4,I:1   46-161   80,224
  SP1999   分解代谢物控制蛋白A(ccpA) 6-13,18-27,39-48,51-59,66-73,79-85,95-101,109-116,118-124,144-164,166-177,183-193,197-204,215-223,227-236,242-249,252-259,261-270,289-301,318-325 I:2   12-58   81,225
  SP2021   糖基水解酶 4-10,26-32,48-60,97-105,117-132,138-163,169-185,192-214,219-231,249-261,264-270,292-308,343-356,385-392,398-404,408-417,435-441 L:3   24-50   82,226
  SP2027   保守的假设蛋白质 10-40,42-48,51-61,119-126 A:1,E:1,G:19,H:12,I:16,L:5   1-118   83,227
  SP2039   保守的假设蛋白质 5-17,40-58,71-83,103-111,123-140,167-177,188-204 G:1,L:3   116-128   84,228
  SP2048   保守的假设蛋白质 4-9,11-50,57-70,112-123,127-138 L:1,L:4   64-107   85,229
  SP2051 Conpetence蛋白质Cgl C 9-39,51-67 D:1,G:3,I:8,L:26   1-101   86,230
  SP2092 UTP-葡萄糖-1-磷酸尿苷酰基转移酶(uridylyltransferase)(gal U) 5-14,17-25,28-46,52-59,85-93,99-104,111-120,122-131,140-148,158-179,187-197,204-225,271-283,285-293 H:2   139-155   87,231
  SP2099   青霉素结合蛋白1B 42-70,73-90,92-108,112-127,152-164,166-172,181-199,201-210,219-228,247-274,295-302,322-334,336-346,353-358,396-414,419-425,432-438,462-471,518-523,531-536,561-567,576-589,594-612,620-631,665-671,697-710,718-731,736-756,765-771,784-801 A:1,B:9,C:11,D:1,E:6,F:1,H:4,K:1   626-653   88,232
  SP2108   麦芽糖ABC转运蛋白 8-28,41-51,53-62,68-74,79-85,94-100,102-108,114-120,130-154,156-162,175-180,198-204,206-213,281-294,308-318,321-339,362-368,381-386,393-399,407-415 G:10,H:1,L:10,M:1   2-13   89,233
  SP2120   假设的蛋白质 4-39,48-65,93-98,106-112,116-129 I:2   10-36   90,234
  SP2128 反式酮酶,N-末端亚单位 25-32,35-50,66-71,75-86,90-96,123-136,141-151,160-179,190-196,209-215,222-228,235-242,257-263,270-280 H:2   209-247   91,235
  SP2136   胆碱结合蛋白PcpA 5-29,31-38,50-57,62-75,83-110,115-132,168-195,197-206,216-242,249-258,262-269,333-340,342-350,363-368,376-392,400-406,410-421,423-430,436-442,448-454,460-466,471-476,491-496,511-516,531-536,551- C:3,F:1,G:24,H:32,I:13,K:177,   27-70219-293441-504512-584   92,236
  肺炎链球菌抗原蛋白   推定的功能(通过同源性)   预测的免疫原性氨基酸**   每个开放阅读框和筛选的选定克隆的编号   已鉴定的免疫原性区域的定位(氨基酸)   SeqID(DNA,蛋白质)
  556,571-576,585-591,599-605   L:34,M:18
  SP2141   糖基水解酶相关蛋白质   4-12,14-34,47-75,83-104,107-115,133-140,148-185,187-196,207-212,224-256,258-265,281-287,289-296,298-308,325-333,345-355,365-371,382-395,424-435,441-457,465-472,483-491,493-505,528-534,536-546,552-558,575-584,589-600,616-623   L:3   576-591   93,237
  SP2180   保守的假设的蛋白质   4-76,78-89,91-126,142-148,151-191,195-208,211-223,226-240,256-277,279-285,290-314,317-323,358-377,381-387,391-396,398-411,415-434,436-446,454-484,494-512,516-523,538-552,559-566,571-577,579-596,599-615,620-627,635-644,694-707,720-734,737-759,761-771   I:3   313-329   94,238
  SP2190   胆碱结合蛋白质A(cbpA)   7-38,44-49,79-89,99-108,117-123,125-132,137-146,178-187,207-237,245-255,322-337,365-387,398-408,445-462,603-608,623-628,644-650,657-671,673-679   A:6,B:12,C:9,D:6,E:30,F:8,G:65,H:72,I:76,K:222,L:99,M:37   111-566   95,239
  SP2194   ATP-依赖型Clp蛋白酶,ATP-结合亚单位   6-20,22-35,39-45,58-64,77-117,137-144,158-163,205-210,218-224,229-236,239-251,263-277,299-307,323-334,353-384,388-396,399-438,443-448,458-463,467-478,481-495,503-509,511-526,559-576,595-600,612-645,711-721,723-738,744-758,778-807   H:1   686-720   96,240
  SP2201   胆碱结合蛋白D(cbpD)   10-33,35-41,72-84,129-138,158-163,203-226,243-252,258-264,279-302,322-329,381-386,401-406,414-435   B:4,C:3,D:1,E:7,F:1,G:1,H:2,K:26,M:1   184-385   97,241
  SP2204   核蛋白L9   4-9,19-24,41-47,75-85,105-110,113-146   H:3,L:4   45-62   98,242
  SP2216   与葡聚糖结合蛋白(GbpB)S.突变体同源的分泌的45kd蛋白质   4-25,52-67,117-124,131-146,173-180,182-191,195-206,215-221,229-236,245-252,258-279,286-291,293-302,314-320,327-336,341-353,355-361,383-389   A:130,B:414,C:450,D:162,E:166,F:284,G:90,H:16,I:4,K:10,L:29,   1-285   99,243
  肺炎链球菌抗原蛋白   推定的功能(通过同源性)   预测的免疫原性氨基酸**   每个开放阅读框和筛选的选定克隆的编号   已鉴定的免疫原性区域的定位(氨基酸)   SeqID(DNA,蛋白质)
M:11
  SP-NRF1   胆碱结合蛋白 14-32,38-50,73-84,93-105,109-114 H:1   40-70   100,244
  ARF0408   假设的蛋白质 5-26 L:3   22-34   101,245
  ARF0441   假设的蛋白质 23-28 H:3   13-39   102,246
  ARF0690   假设的蛋白质 8-14 L:2   21-34   103,247
  ARF0878   假设的蛋白质 4-13,20-29,44-50,59-74 H:3   41-69   104,248
  ARF0921   假设的蛋白质 4-9,19-42,48-59,71-83 M:4   57-91   105,249
  ARF1153   假设的蛋白质 4-14 M:7   10-28   106,250
ARF1515   假设的蛋白质 22-28,32-42,63-71,81-111,149-156,158-167,172-180,182-203,219-229 G:4,H:5 27-49   107,251
  ARF1519   假设的蛋白质 17-27 H:3   23-32   108,252
  ARF1905   假设的蛋白质 18-24 H:2   28-38   109,253
  ARF2044   假设的蛋白质 9-15 G:2,H:5   13-27   110,254
  ARF2155   假设的蛋白质 13-22 H:3   18-29   111,255
  ARF2199   假设的蛋白质 17-26 M:3   2-11   112,256
  CRF0129   假设的蛋白质 4-33 L:4   16-32   113,257
  CRF0200   假设的蛋白质 4-10,37-43,54-84,92-127 H:5,L:1   15-62   114,258
  CRF0236   假设的蛋白质 4-14,20-32,35-60,69-75,79-99,101-109,116-140 L:3   124-136   115,259
  CRF0394   假设的蛋白质 H:7   2-13   116,260
  CRF0408   假设的蛋白质 4-13,28-42 L:11   42-57   117,261
  CRF0430   假设的蛋白质 4-14,27-44 G:4,H:8   14-35   118,262
  CRF0498   假设的蛋白质 4-12 H:4   1-27   119,263
  CRF0519   假设的蛋白质 4-18,39-45,47-74 G:5,H:3   35-66   120,264
  CRF0573   假设的蛋白质 8-20,4377 I:3,L:9   17-36   121,265
  CRF0713   假设的蛋白质 4-30,35-45,51-57 L:3   35-49   122,266
  CRF0722   假设的蛋白质 4-24,49-57 G:18   15-34   123,267
  CRF0764   假设的蛋白质 4-22 L:4   8-27   124,268
  CRF1079   假设的蛋白质 13-25,32-59,66-80 H:5   21-55   125,269
  CRF1248   假设的蛋白质 4-10,24-33,35-42,54-65,72-82,98-108 H:1   15-30   126,270
  CRF1398   假设的蛋白质 8-19 H:1,L:3   17-47   127,271
  CRF1412   假设的蛋白质 12-18,40-46 L:8   31-52   128,272
  CRF1467   假设的蛋白质 4-20,35-78,83-102,109-122 I:4   74-86   129,273
  CRF1484   假设的蛋白质 7-17,21-41,46-63 I:5   2-20   130,274
  CRF1587   假设的蛋白质 30-37 G:3,H:3,   2-33   131,275
  肺炎链球菌抗原蛋白   推定的功能(通过同源性)   预测的免疫原性氨基酸**   每个开放阅读框和筛选的选定克隆的编号   已鉴定的免疫原性区域的定位(氨基酸)   SeqID(DNA,蛋白质)
  L:4
  CRF1606   假设的蛋白质 4-13,17-25   L:3   1-15   132,276
  CRF1623   假设的蛋白质 17-31,44-51   M:6   20-51   133,277
  CRF1625   假设的蛋白质 20-30   L:10   5-23   134,278
  CRF1640   假设的蛋白质 13-33,48-71   I:5   92-110   135,279
  CRF1702   假设的蛋白质 4-9,50-69,76-88,96-106,113-118   L:6   12-34   136,280
  CRF1825   假设的蛋白质 4-24   L:11   6-26   137,281
  CRF1883   假设的蛋白质 7-26   H:61,L:77   14-30   138,282
  CRF1991   假设的蛋白质 9-39,46-68,75-82,84-103   H:6,L:2   26-44   139,283
  CRF1992   假设的蛋白质 4-30,33-107   M:7   58-84   140,284
  CRF2004   假设的蛋白质 4-12   L:3   9-51   141,285
CRF2030 假设的蛋白质 12-18,29-37   H:5,L:1,M:1   6-37   142,286
  CRF2065   假设的蛋白质 4-21,33-52,64-71   I:1,M:6   16-37   143,287
  CRF2232   假设的蛋白质 9-19   L:3   2-30   144,288
表2.在肽ELISA中的表位的免疫原性
Figure G04810200X19960403D001211
Figure G04810200X19960403D001231
表3:在肺炎链球菌菌株中的基因分布
  开放阅读框   常用名   基因分布(50的出现率)   氨基酸替代(在血清型14菌株中)*   同源性()   Seq ID(DNA,蛋白质)
  SP0008   假设的蛋白质   n.d.   n.d.   1,145
  SP0032   DNA聚合酶I(poIA)   n.d.   n.d.   2,146
  SP0069   胆碱结合蛋白I   7   0/166#   3,147
  SP0071   免疫球蛋白A1蛋白酶(iga-1)   7   0/477#   4,148
  SP0082   细胞壁表面锚形体   50   5/385   5,149
  SP0107   LysM结构域蛋白   50   1/173   6,150
  SP0117   肺炎球菌表面蛋白A(pspA)   n.d.   n.d.   7,151
  SP0191   假设的蛋白质   n.d.   n.d.   8,152
  SP0197   推定的二氢叶酸合酶   n.d.   n.d.   9,153
  SP0212   核蛋白L2   50   0/232   10,154
  SP0222   核蛋白S14   n.d.   n.d.   11,155
  SP0239   保守的假设的蛋白质   n.d.   n.d.   12,156
  SP0251   推定的甲酸乙酰基转移酶   n.d.   n.d.   13,157
  SP0295   核蛋白质S9(rpsl)   50   1/121   14,158
  SP0330   糖结合转录调节子RegR   n.d.   n.d.   15,159
  SP0368   细胞壁表面锚形体家族蛋白   46   4/422#   16,160
  SP0369   青霉素结合蛋白1A   50   1/346   17,161
  SP0374   假设的蛋白质   n.d.   n.d.   18,162
  SP0377   胆碱结合蛋白C   29   0/114   19,163
  SP0378   胆碱结合蛋白J(cbpJ)   50   2/104   20,164
  SP0390   胆碱结合蛋白G(cbpG)   50   3/171#   21,165
  SP0454   假设的蛋白质   48   1/303#   22,166
  SP0463   细胞壁表面锚形体家族蛋白   10   0/298#   23,167
  SP0466   推定的分选酶   44   4/243#   24,168
  SP0468   推定的分选酶   18   0/254#   25,169
  SP0498   推定的内-β-N-乙酰基氨基葡糖苷酶   50   4/334   26,170
  SP0509   I型限制性-修饰性系统M亚单位   n.d.   n.d.   27,171
  SP0519   dnaJ蛋白(dnaJ)   50   2/312   28,172
  SP0529   BlpC ABC转运蛋白(blpB)   50   6/306   29,173
  SP0564   假设的蛋白质   50   1/127   30,174
  开放阅读框   常用名   基因分布(50的出现率)   氨基酸替代(在血清型14菌株中)*   同源性()   Seq ID(DNA,蛋白质)
  SP0609   氨基酸ABC转运蛋白,氨基酸-结合pro   50   0/232   31,175
  SP0613   金属-β-内酰胺酶超家族蛋白质   n.d.   n.d.   32,176
  SP0641   丝氨酸蛋白酶   n.d.   n.d.   33,177
  SP0648   β-半乳糖苷酶(bgaA)   50   0/304   34,178
  SP0664   推定的锌金属蛋白酶ZmpB   n.d.   n.d.   35,179
  SP0667   推定的肺炎球菌表面蛋白   45   18/297   36,180
  SP0688   UDP-N-乙酰基muramoyl丙氨酸-D-谷氨酸连接酶   n.d.   n.d.   37,181
  SP0749   支链氨基酸ABC转运蛋白   50   4/303   38,182
  SP0770   ABC转运蛋白质,ATP-结合蛋白   50   0/307   39,183
  SP0785   保守的假设的蛋白质   50   0/304   40,184
  SP0914   与结瘤素相关的蛋白,平截   n.d.   n.d.   41,185
  SP0930   胆碱结合蛋白E(cbpE)   47   17/294   42,186
  SP0943   Gid蛋白(gid)   n.d.   n.d.   43,187
  SP0952   丙氨酸脱氢酶,真实的移码(ald)   n.d.   n.d.   44,188
  SP1003   保守的假设的蛋白质(PAT)   n.d.   n.d.   45,189
  SP1004   保守的假设的蛋白质   n.d.   n.d.   46,190
  SP1124   糖原合酶(glgA)   n.d.   n.d.   47,191
  SP1154   IgA1蛋白酶   28   13/470;80missing   48,192
  SP1174   保守的结构域蛋白(PAT)   n.d.   n.d.   49,193
  SP1175   保守的结构域蛋白   n.d.   n.d.   50,194
  SP1221   II型限制性内切核酸酶   n.d.   n.d.   51,195
  SP1227   DNA-结合反应调节子   n.d.   n.d.   52,196
  SP1241   氨基酸ABC转运蛋白质,氨基酸-结合蛋白质   50   0/285   53,197
  SP1287   信号识别颗粒蛋白质(ffh)   49   0/300   54,198
  SP1330   推定的N-乙酰基甘露糖胺-6-P差向异构酶(nanE)   14   0/211#   55,199
  SP1374   分支酸合酶(aroC)   50   0/289   56,200
  SP1378   保守的假设的蛋白质   n.d.   n.d.   57,201
  SP1429   肽酶,U32家族   50   8/305   58,202
  SP1478   氧化还原酶,醛/酮还原酶家族   n.d.   n.d.   59,203
  开放阅读框   常用名   基因分布(50的出现率)   氨基酸替代(在血清型14菌株中)*   同源性()   Seq ID(DNA,蛋白质)
  SP1518   保守的假设的蛋白   50   4/313;3额外的   60,204
  SP1522   保守的结构域蛋白   n.d.   n.d.   61,205
  SP1527   寡肽ABC转运蛋白   50   0/463   62,206
  SP1573   溶菌酶(IytC)   n.d.   n.d.   63,207
  SP1604   假设的蛋白质   50   3/138   64,208
  SP1661   细胞分裂蛋白质DivIVA   50   3/236   65,209
  SP1664   ylmF蛋白质(ylmF)   50   0/164   66,210
  SP1676   推定的N-乙酰基neuraminate裂合酶   n.d.   n.d.   67,211
  SP1687   神经氨酸酶B(nanB)   n.d.   n.d.   68,212
  SP1693   神经氨酸酶A(nanA)   n.d.   n.d.   69,213
  SP1732   丝氨酸/苏氨酸蛋白激酶   49   2/293   70,214
  SP1735 甲硫氨酰基-tRNA甲酰基转移酶(fmt)   n.d.   n.d.   71,215
  SP1759 前蛋白移位酶,SecA,亚单位(secA-2)   n.d.   n.d.   72,216
  SP1772   细胞壁表面锚形体家族蛋白   23   12/253#   73,217
  SP1804   推定的通用应激蛋白24   n.d.   n.d.   74,218
  SP1888   寡肽ABC转运蛋白,ATP-结合蛋白AmiE   n.d.   n.d.   75,219
  SP1891   寡肽ABC转运蛋白   n.d.   n.d.   76,220
  SP1937   自溶素(IytA)   50   0/275   77,221
  SP1954   丝氨酸蛋白酶,subtilase家族,真实的框架   12   0/305#   78,222
  SP1980   cmp-结合-因子1(cbf1)   n.d.   n.d.   79,223
  SP1992   细胞壁表面锚形体家族蛋白   50   4/197   80,224
  SP1999   分解代谢物控制蛋白质A(ccpA)   n.d.   n.d.   81,225
  SP2021   糖基水解酶   n.d.   n.d.   82,226
  SP2027   保守的假设的蛋白质   n.d.   n.d.   83,227
  SP2039   保守的假设的蛋白质   n.d.   n.d.   84,228
  SP2048   保守的假设的蛋白质   50   8/134   85,229
  SP2051   Conpetence蛋白CglC   50   8/92   86,230
  SP2092   UTP-葡萄糖-1-磷酸尿苷酰基转移酶(galU)   n.d.   n.d.   87,231
  SP2099   青霉素结合蛋白1B   n.d.   n.d.   88,232
  SP2108   麦芽糖ABC转运蛋白   50   1/279   89,233
  SP2120   假设的蛋白质   n.d.   n.d.   90,234
  开放阅读框   常用名   基因分布(50的出现率)   氨基酸替代(在血清型14菌株中)*   同源性()   Seq ID(DNA,蛋白质)
  SP2128   反式酮酶,N-末端亚单位   n.d.   n.d.   91,235
  SP2136   胆碱结合蛋白PcpA   45   1/382   92,236
  SP2141   糖基水解酶相关蛋白   n.d.   n.d.   93,237
  SP2180   保守的假设的蛋白质   n.d.   n.d.   94,238
  SP2190   胆碱结合蛋白(cbpA)   47   for:48.8%;rev:2/17#   95,239
  SP2194 ATP-依赖型Clp蛋白酶,ATP-结合亚单位   50   1/262   96,240
  SP2201   胆碱结合蛋白D(cbpD)   50   7/384   97,241
  SP2204   核蛋白L9   n.d.   n.d.   98,242
  SP2216   与葡聚糖结合蛋白(GbpB)S.突变体同源的分泌的45kd蛋白质   50   0/347   99,243
  SP-NRF1   胆碱结合蛋白   n.d.   n.d.   100,244
  ARF0408   假设的蛋白质   n.d.   n.d.   101,245
  ARF0441   假设的蛋白质   n.d.   n.d.   102,246
  ARF0690   假设的蛋白质   n.d.   n.d.   103,247
  ARF0878   假设的蛋白质   n.d.   n.d.   104,248
  ARF0921   假设的蛋白质   n.d.   n.d.   105,249
  ARF1153   假设的蛋白质   n.d.   n.d.   106,250
  ARF1515   假设的蛋白质   n.d.   n.d.   107,251
  ARF1519   假设的蛋白质   n.d.   n.d.   108,252
  ARF1905   假设的蛋白质   n.d.   n.d.   109,253
  ARF2044   假设的蛋白质   n.d.   n.d.   110,254
  ARF2155   假设的蛋白质   n.d.   n.d.   111,255
  ARF2199   假设的蛋白质   n.d.   n.d.   112,256
  CRF0129   假设的蛋白质   n.d.   n.d.   113,257
  CRF0200   假设的蛋白质   n.d.   n.d.   114,258
  CRF0236   假设的蛋白质   n.d.   n.d.   115,259
  CRF0394   假设的蛋白质   n.d.   n.d.   116,260
  CRF0408   假设的蛋白质   n.d.   n.d.   117,261
  CRF0430   假设的蛋白质   n.d.   n.d.   118,262
  CRF0498   假设的蛋白质   n.d.   n.d.   119,263
  CRF0519   假设的蛋白质   n.d.   n.d.   120,264
  CRF0573   假设的蛋白质   n.d.   n.d.   121,265
  CRF0713   假设的蛋白质   n.d.   n.d.   122,266
  CRF0722   假设的蛋白质   n.d.   n.d.   123,267
  CRF0764   假设的蛋白质   n.d.   n.d.   124,268
  开放阅读框   常用名   基因分布(50的出现率)   氨基酸替代(在血清型14菌株中)*   同源性()   Seq ID(DNA,蛋白质)
  CRF1079   假设的蛋白质   n.d.   n.d.   125,269
  CRF1248   假设的蛋白质   n.d.   n.d.   126,270
  CRF1398   假设的蛋白质   n.d.   n.d.   127,271
  CRF1412   假设的蛋白质   n.d.   n.d.   128,272
  CRF1467.1   假设的蛋白质   n.d.   n.d.   129,273
  CRF1484   假设的蛋白质   n.d.   n.d.   130,274
  CRF1587   假设的蛋白质   n.d.   n.d.   131,275
  CRF1606   假设的蛋白质   n.d.   n.d.   132,276
  CRF1623   假设的蛋白质   n.d.   n.d.   133,277
  CRF1625   假设的蛋白质   n.d.   n.d.   134,278
  CRF1640   假设的蛋白质   n.d.   n.d.   135,279
  CRF1702   假设的蛋白质   n.d.   n.d.   136,280
  CRF1825   假设的蛋白质   n.d.   n.d.   137,281
  CRF1883   假设的蛋白质   n.d.   n.d.   138,282
  CRF1991   假设的蛋白质   n.d.   n.d.   139,283
  CRF1992   假设的蛋白质   n.d.   n.d.   140,284
  CRF2004   假设的蛋白质   n.d.   n.d.   141,285
  CRF2030   假设的蛋白质   n.d.   n.d.   142,286
  CRF2065   假设的蛋白质   n.d.   n.d.   143,287
  CRF2232   假设的蛋白质   n.d.   n.d.   144,288
表4
  开放阅读框   常用名   FACS   PK
  ARF0878   假设的蛋白质   +   nd
  ARF0921   假设的蛋白质   +   nd
  CRF0236   假设的蛋白质   ++
  CRF0573   假设的蛋白质   +   nd
  CRF1412   假设的蛋白质   +   nd
  CRF1702   假设的蛋白质   +   nd
  CRF1992   假设的蛋白质   ++   ++
  SP0008   假设的蛋白质   +   -
  SP0069   胆碱结合蛋白质I   ++   ++
  SP0082   细胞壁表面锚形体   +   -
  SP0117   肺炎球菌表面蛋白质A(pspA)   +++   +++
  SP0212   核蛋白L2   +   ++
  SP0295   核蛋白S9(rpsl)   ++   +++
  SP0368   细胞壁表面锚形体家族蛋白   ++   +++
  SP0369   青霉素结合蛋白1A   ++   ++
  SP0377   胆碱结合蛋白C   ++   ++
  SP0378   胆碱结合蛋白J(cbpJ)   ++   nd
  SP0390   胆碱结合蛋白质(cbpG)   ++   +
  SP0454   假设的蛋白质   ++   +++
  SP0463   细胞壁表面锚形体家族蛋白   +   ++
  SP0466   推定的分选酶   ++   ++
  SP0468   推定的分选酶   ++   ++
  SP0519   dnaJ蛋白(dnaJ)   ++   +
  SP0609   氨基酸ABC转运蛋白,氨基酸-结合   ++   +
  SP0641   丝氨酸蛋白酶   +   -
  SP0664   锌金属蛋白酶ZmpB   +   ++
  SP0749   支链氨基酸ABC转运蛋白   +   +
  SP0770   ABC转运蛋白,ATP-结合蛋白   ++   ++
  SP1154   IgA1蛋白酶   ++   ++
  SP1287   信号识别颗粒蛋白(ffh)   +   ++
  SP1330   N-乙酰基甘露糖胺-6-P   ++   -
  SP1429   肽酶,U32家族   +   ++
  SP1527   寡肽ABC转运蛋白   +   ++
  SP1759   前蛋白移位酶,SecA亚单位(错误克隆!!!)   +   -
  SP1772   细胞壁表面锚形体家族蛋白   +   +
  SP1891   寡肽ABC转运蛋白   +   ++
  SP1937   自溶素(IytA)   +   -
  SP1954   丝氨酸蛋白酶,subtilase家族,真实的框架   +   ++
  SP1980   cmp-结合-因子1(cbf1)   +   -
  SP2108   麦芽糖ABC转运蛋白   +   ++
  SP2136   胆碱结合蛋白PcpA   +   ++
  SP2190   胆碱结合蛋白A(cbpA)   +   ++
  SP2194   ATP-依赖型Clp蛋白酶,ATP-结合亚单位   ++   ++
  SP2201SP2216   胆碱结合蛋白D(cbpD)分泌的45kd蛋白质   ++   ++++
序列表
SeqID 1
atgtctaaaa atattgtaca attgaataat tcttttattc aaaatgaata ccaacgtcgt      60
cgctacctga tgaaagaacg acaaaaacgg aatcgtttta tgggaggggt attgattttg     120
attatgctat tatttatctt gccaactttt aatttagcgc agagttatca gcaattactc     180
caaagacgtc agcaattagc agacttgcaa actcagtatc aaactttgag tgatgaaaag     240
gataaggaga cagcatttgc taccaagttg aaagatgaag attatgctgc taaatataca     300
cgagcgaagt actattattc taagtcgagg gaaaaagttt atacgattcc tgacttgctt     360
caaagg                                                                366
 
SeqID 2
atggataaga aaaaattatt attgattgat gggtcttctg tagcttttcg ggcgtttttt      60
gcgctgtatc agcagttgga ccgttttaag aatgtggctg gtttgcatac caatgcgatt     120
tatggttttc agttgatgtt gagtcattta ttggagcggg ttgagccgag tcatattttg     180
gtggcttttg atgcgggaaa gacgaccttc cggacagaga tgtatgcgga ctataagggt     240
ggtcgggcca agactcctga tgagtttcgt gagcaatttc ctttcattcg tgagttgctg     300
gatcatatgg ggattcgtca ctatgatctg gctcagtatg aggcggatga catcattggg     360
acgctggata agctagcaga gcaggatggt tttgatatta ctattgtcag tggggacaag     420
gatttgattc agctgacgga tgagcatacg gtggttgaaa tttccaagaa aggtgtggct     480
gagtttgagg cctttacgcc agattacctc atggaagaaa tgggcctcac accagctcag     540
tttatcgatc tcaaggcgct catgggtgat aagtcggata atatccctgg ggtgaccaaa     600
gtcggtgaaa agacgggtat taagctcttg ctggagcatg gttcgcttga ggggatttat     660
gaaaatattg atggaatgaa gacttctaag atgaaggaaa atctcatcaa tgacaaggaa     720
caggcctttt tgtctaaaac actagcgacc attgatacca aggcaccgat tgcgattggt     780
ttagaggact tggtctatag tggtccagat gttgaaaatc ttgggaaatt ctacgatgag     840
atgggcttca aacagctaaa gcaggcttta aatgtgtcgt cagctgatgt gtctgagagt     900
ttggatttta ctattgttga ccaaatcagt caagatatgc tgagtgaaga gtctatcttc     960
cactttgagc tttttggtga gaattaccat acggataatt tggttggatt tgtctggtct    1020
tgtggggata agctctatgc cacagacaag cttgagctgt tgcaagaccc gattttcaag    1080
gatttcttag aaaaaacatc tctgagagtt tatgacttta agaaggttaa agttcttttg    1140
caacgttttg gtgtggattt gcaggcgcct gcttttgaca tccgtttggc taaatacctc    1200
ctttcgactg tggaggacaa tgaaattgcg accatcgcta gtctttatgg tcagacttac    1260
ttggttgatg atgaaacttt ctacggtaag ggtgttaaaa aggccattcc tgaacgtgag    1320
aaattcttgg aacacttagc ttgtaaactt gctgttttgg tagaaacaga gcctatttta    1380
cttgaaaaac tcagcgaaaa tgggcaatta gagcttcttt atgatatgga gcaacctctg    1440
gcttttgtcc ttgccaagat ggaaattgct gggattatgg tcaagaaaga gaccttgctt    1500
gagatgcagg ctgaaaatga gcttgtcatt gaaaaactga ctcaagagat ttacgagctg    1560
gctggtgagg agtttaatgt caactcgcct aagcagttgg gcgtgcttct ctttgagaaa    1620
ttgggacttc ctctagaata cactaagaaa accaagacag gttattcgac agcagtggat    1680
gttttagagc gtctcgctcc tattgctccg attgttaaga aaatcctgga ttaccgtcaa    1740
attgctaaga ttcaatctac ttatgtaatt ggcttgcagg actggatttt ggctgatgga    1800
aagattcata ctcgctatgt gcaggatttg acccagaccg ggcgtttgtc tagtgtggat    1860
ccaaacttgc aaaatattcc tgcccgattg gaacaggggc gcttgattcg gaaggctttt    1920
gtgccagagt gggaggatag tgtgctactc agctctgact attcacagat tgaattgcgc    1980
gttttggcgc atatttctaa ggatgagcac ttgattaagg ccttccaaga gggggcagat    2040
atccatactt cgacagccat gcgggtcttt ggcattgagc gtcctgatga tgtgactgca    2100
aacgaccgtc gcaatgccaa ggcagttaac tttggagtgg tttatgggat ttcagacttt    2160
ggcttgtcta ataatttggg aattagtcgt aaggaagcca aagcctacat tgatacctac    2220
tttgaacgtt ttccaggtat taaaaactac atggatgaag tggtgcggga ggcgcgtgat    2280
aagggctatg tagagaccct ctttaagcgt cgccgtgagt tgccagatat caattcgcgc    2340
aacttcaata ttcgtggttt tgcggagcga actgctatca actcacctat ccagggttcg    2400
gcagcagata ttctcaagat tgccatgatt cagctggata aagccttggt tgcaggtggt    2460
tatcagacta agatgctgtt acaagtgcac gatgaaatcg tccttgaagt gcctaaatct    2520
gaattggtag agatgaaaaa attggtgaaa caaaccatgg aagaagccat tcaactcagt    2580
gttcctctta tcgcagatga gaatgaaggg gcaacctggt acgaggctaa a             2631
 
SeqID 3
atggggatgg cagcttttaa aaatcctaac aatcaataca aagctattac aattgctcaa      60
actctaggtg atgatgcttc ttcagaggaa ttggctggta gatatggttc tgctgttcag     120
tgtacagaag tgactgcctc aaacctttca acagttaaaa ctaaagctac ggttgtagaa     180
aaaccactga aagattttag agcgtctacg tctgatcagt ctggttgggt ggaatctaat     240
ggtaaatggt atttctatga gtctggtgat gtgaagacag gttgggtgaa aacagatggt     300
aaatggtact atttgaatga cttaggtgtc atgcagactg gatttgtaaa attttctggt     360
agctggtatt acttgagcaa ttcaggtgct atgtttacag gctggggaac agatggtagc     420
agatggttct actttgacgg ctcaggagct atgaagacag gctggtacaa ggaaaatggc     480
acttggtatt accttgacga agcaggtatc atgaagacag gttggtttaa agtcggacca     540
cactggtact atgcctacgg ttcaggagct ttggctgtga gcacaacaac accagatggt     600
taccgtgtaa atggtaatgg tgaatgggta aac                                  633
 
SeqID 4
atgagccgaa aaagcattgg tgagaaacgc catagtttct cgatgagaaa gttgtcagtg      60
ggattggtat cagttactgt atctagtttc tttttgatga gtcaagggat tcaatcggta     120
tcggccgata atatggaaag tccaattcat tataagtata tgaccgaggg taaattgaca     180
gacgaggaaa aatccttgct ggtagaggcc cttccacaac tggctgaaga atcagatgat     240
acttattact tggtttatag atctcaacag tttttaccga atacaggttt taacccaact     300
gttggtactt tcctttttac tgcaggattg agcttgttag ttttattggt ttctaaaagg     360
gaaaatggaa agaaacgact tgttcatttt ctgctgttga ctagcatggg agttcaattg     420
ttgccggcca gtgcttttgg gttgaccagc cagattttat ctgcctataa tagtcagctt     480
tctatcggag tcggggaaca tttaccagag cctctgaaaa tcgaaggtta tcaatatatt     540
ggttatatca aaactaagaa acaggataat acagagcttt caaggacagt tgatgggaaa     600
tactctgctc aaagagatag tcaaccaaac tctacaaaaa catcagatgt agttcattca     660
gctgatttag aatggaacca aggacagggg aaggttagtt tacaaggtga agcatcaggg     720
gatgatggac tttcagaaaa atcttctata gcagcagaca atctatcttc taatgattca     780
ttcgcaagtc aagttgagca gaatccggat cacaaaggag aatctgtagt tcgaccaaca     840
gtgccagaac aaggaaatcc tgtgtctgct acaacggtgc agagtgcgga agaggaagta     900
ttggcgacga caaatgatcg accagagtat aaacttccat tggaaaccaa aggcacgcaa     960
gaacccggtc atgagggtga agccgcagtc cgtgaagact taccagtcta cactaagcca    1020
ctagaaacca aaggtacaca aggacccgga catgaaggtg aagctgcagt tcgcgaggaa    1080
gaaccagctt acacagaacc gttagcaacg aaaggcacgc aagagccagg tcatgagggc    1140
aaagctacag tccgcgaaga gactctagag tacacggaac cggtagcgac aaaaggcaca    1200
caagaacccg aacatgaggg cgaagcggca gtagaagaag aacttccggc tttagaggtc    1260
actacacgaa atagaacgga aatccagaat attccttata caacagaaga aattcaggat    1320
ccaacacttc tgaaaaatcg tcgtaagatt gaacgacaag ggcaagcagg gacacgtaca    1380
attcaatatg aagactacat cgtaaatggt aatgtcgtag aaactaaaga agtgtcacga    1440
actgaagtag ctccggtcaa cgaagtcgtt aaagtaggaa cacttgtgaa agttaaacct    1500
acagtagaaa ttacaaactt aacaaaagtt gagaacaaaa aatctataac tgtaagttat    1560
aacttaatag acactacctc agcatatgtt tctgcaaaaa cgcaagtttt ccatggagac    1620
aagctagtta aagaggtgga tatagaaaat cctgccaaag agcaagtaat atcaggttta    1680
gattactaca caccgtatac agttaaaaca cacctaactt ataatttggg tgaaaataat    1740
gaggaaaata ctgaaacatc aactcaagat ttccaattag agtataagaa aatagagatt    1800
aaagatattg attcagtaga attatacggt aaagaaaatg atcgttatcg tagatattta    1860
agtctaagtg aagcgccgac tgatacggct aaatactttg taaaagtgaa atcagatcgc    1920
ttcaaagaaa tgtacctacc tgtaaaatct attacagaaa atacggatgg aacgtataaa    1980
gtgacggtag ccgttgatca acttgtcgaa gaaggtacag acggttacaa agatgattac    2040
acatttactg tagctaaatc taaagcagag caaccaggag tttacacatc ctttaaacag    2100
ctggtaacag ccatgcaaag caatctgtct ggtgtctata cattggcttc agatatgacc    2160
gcagatgagg tgagcttagg cgataagcag acaagttatc tcacaggtgc atttacaggg    2220
agcttgatcg gttctgatgg aacaaaatcg tatgccattt atgatttgaa gaaaccatta    2280
tttgatacat taaatggtgc tacagttaga gatttggata ttaaaactgt ttctgctgat    2340
agtaaagaaa atgtcgcagc gctggcgaag gcagcgaata gcgcgaatat taataatgtt    2400
gcagtagaag gaaaaatctc aggtgcgaaa tctgttgcgg gattagtagc gagcgcaaca    2460
aatacagtga tagaaaacag ctcgtttaca gggaaactta tcgcaaatca ccaggacagt    2520
aataaaaatg atactggagg aatagtaggt aatataacag gaaatagttc gagagttaat    2580
aaagttaggg tagatgcctt aatctctact aatgcacgca ataataacca aacagctgga    2640
gggatagtag gtagattaga aaatggtgca ttgatatcta attcggttgc tactggagaa    2700
atacgaaatg gtcaaggata ttctagagtc ggaggaatag taggatctac gtggcaaaac    2760
ggtcgagtaa ataatgttgt gagtaacgta gatgttggag atggttatgt tatcaccggt    2820
gatcaatacg cagcagcaga tgtgaaaaat gcaagtacat cagttgataa tagaaaagca    2880
gacagattcg ctacaaaatt atcaaaagac caaatagacg cgaaagttgc tgattatgga    2940
atcacagtaa ctcttgatga tactgggcaa gatttaaaac gtaatctaag agaagttgat    3000
tatacaagac taaataaagc agaagctgaa agaaaagtag cttatagcaa catagaaaaa    3060
ctgatgccat tctacaataa agacctagta gttcactatg gtaacaaagt agcgacaaca    3120
gataaacttt acactacaga attgttagat gttgtgccga tgaaagatga tgaagtagta    3180
acggatatta ataataagaa aaattcaata aataaagtta tgttacattt caaagataat    3240
acagtagaat acctagatgt aacattcaaa gaaaacttca taaacagtca agtaatcgaa    3300
tacaatgtta caggaaaaga atatatattc acaccagaag catttgtttc agactataca    3360
gcgataacga ataacgtact aagcgacttg caaaatgtaa cacttaactc agaagctact    3420
aaaaaagtac taggagcagc gaatgatgca gccttagata acctatactt agatagacaa    3480
tttgaagaag ttaaagctaa tatagcagaa cacctaagaa aagtattagc gatggataaa    3540
tcaatcaata ctacaggaga cggtgtagtt gaatacgtaa gtgagaaaat caaaaataac    3600
aaagaagcat ttatgctagg tcttacttat atgaaccgtt ggtacgatat taattatggt    3660
aaaatgaata caaaagattt atctacgtac aagtttgact ttaacggaaa taatgagact    3720
tcaacgttgg atactattgt cgcattagga aatagtggac tagataacct gagagcttca    3780
aatactgtag gtttatatgc gaataaactt gcatcggtaa aaggagaaga ttcagtcttt    3840
gacttcgtag aagcgtatag aaaactgttc ttaccaaaca aaacaaataa cgagtggttt    3900
aaagaaaata caaaggcata tatagtcgaa atgaagtctg atattgcaga agtacgagaa   3960
aaacaagaat caccaacagc cgatagaaaa tattcattag gagtttacga tagaatatca   4020
gcaccaagtt gggggcataa gagtatgtta ttaccactac taactttacc tgaagaatct   4080
gtgtatattt catcgaatat gtctacactt gcattcggtt cgtatgaaag atatcgtgat   4140
agtgtggatg gagttattct ttcaggagat gctttacgaa cttatgtaag aaatagagtt   4200
gatatagcag cgaaaaggca tagagaccat tatgatattt ggtacaatct tcttgacagt   4260
gcttcaaaag aaaaactttt ccgttctgtg atagtttatg atggattcaa tgtaaaagat   4320
gagacaggaa gaacttattg ggcaaggtta acggataaaa acatcggctc tattaaagaa   4380
ttcttcggac ctgttgggaa atggtatgag tataatagta gtgcaggagc gtatgcgaat   4440
ggaagtttaa cgcactttgt gttagataga ttattagatg cttatggaac gtcggtttat   4500
actcatgaaa tggttcataa ttctgattct gcaatctact ttgaaggaaa tggtagacgt   4560
gaaggattgg gagcggagtt atacgcactt ggtttactgc aatctgtaga tagtgtaaat   4620
tctcatattt tagctttaaa tacgttatat aaagcagaaa aagatgattt gaatagattg   4680
catacatata atccggtgga acgtttcgat tcggatgagg cgcttcaaag ttatatgcat   4740
ggatcatatg atgtaatgta tacacttgat gcgatggaag caaaagcgat attagctcaa   4800
aataatgatg ttaagaaaaa atggtttaga aaaatagaaa attattacgt tcgtgatact   4860
agacataata aagatacaca tgcaggaaat aaagtccgtc cattaacaga tgaagaagta   4920
gctaacttaa catcgttaaa ctcattaatc gacaacgaca tcataaatag acgtagctat   4980
gatgatagta gagaatataa acgaaatggc tactatacta taagtatgtt ctctcctgta   5040
tacgcagcgc taagcaattc gaaaggtgct cctggagata ttatgtttag aaaaatagct   5100
tatgaattac ttgcggaaaa aggttatcac aaaggattcc taccttatgt ttctaatcag   5160
tacggagcag aagcatttgc cagcggaagc aaaacattct catcatggca tggaagagat   5220
gttgctttag tgacagatga tttagtattt aagaaagtat tcaatggtga gtactcatca   5280
tgggctgatt tcaaaaaagc aatgtttaaa caacgtatag ataaacaaga taatctgaaa   5340
ccaataacaa ttcaatacga attaggtaat cctaatagta caaaagaagt aactataaca   5400
acggctgcac aaatgcaaca attaattaat gaagcggctg cgaaagatat tactaatata   5460
gatcgtgcaa cgagtcatac cccagcaagt tgggtgcatt tattaaaaca aaaaatctat   5520
aatgcatatc ttcgcactac agatgacttt agaaattcta tatataaa                5568
 
SeqID 5
atgaaattca atccaaatca aagatatact cgttggtcta ttcgccgtct cagtgtcggt     60
gttgcctcag ttgttgtggc tagtggcttc tttgtcctag ttggtcagcc aagttctgta    120
cgtgccgatg ggctcaatcc aaccccaggt caagtcttac ctgaagagac atcgggaacg    180
aaagagggtg acttatcaga aaaaccagga gacaccgttc tcactcaagc gaaacctgag    240
ggcgttactg gaaatacgaa ttcacttccg acacctacag aaagaactga agtgagcgag    300
gaaacaagcc cttctagtct ggatacactt tttgaaaaag atgaagaagc tcaaaaaaat    360
ccagagctaa cagatgtctt aaaagaaact gtagatacag ctgatgtgga tgggacacaa    420
gcaagtccag cagaaactac tcctgaacaa gtaaaaggtg gagtgaaaga aaatacaaaa    480
gacagcatcg atgttcctgc tgcttatctt gaaaaagctg aagggaaagg tcctttcact    540
gccggtgtaa accaagtaat tccttatgaa ctattcgctg gtgatggtat gttaactcgt    600
ctattactaa aagcttcgga taatgctcct tggtctgaca atggtactgc taaaaatcct    660
gctttacctc ctcttgaagg attaacaaaa gggaaatact tctatgaagt agacttaaat    720
ggcaatactg ttggtaaaca aggtcaagct ttaattgatc aacttcgcgc taatggtact    780
caaacttata aagctactgt taaagtttac ggaaataaag acggtaaagc tgacttgact    840
aatctagttg ctactaaaaa tgtagacatc aacatcaatg gattagttgc taaagaaaca    900
gttcaaaaag ccgttgcaga caacgttaaa gacagtatcg atgttccagc agcctaccta    960
gaaaaagcca agggtgaagg tccattcaca gcaggtgtca accatgtgat tccatacgaa   1020
ctcttcgcag gtgatggcat gttgactcgt ctcttgctca aggcatctga caaggcacca   1080
tggtcagata acggcgacgc taaaaaccca gccctatctc cactaggcga aaacgtgaag   1140
accaaaggtc aatacttcta tcaagtagcc ttggacggaa atgtagctgg caaagaaaaa   1200
caagcgctca ttgaccagtt ccgagcaaat ggtactcaaa cttacagcgc tacagtcaat   1260
gtctatggta acaaagacgg taaaccagac ttggacaaca tcgtagcaac taaaaaagtc   1320
actattaaca taaacggttt aatttctaaa gaaacagttc aaaaagccgt tgcagacaac   1380
gttaaagaca gtatcgatgt tccagcagcc tacctagaaa aagccaaggg tgaaggtcca   1440
ttcacagcag gtgtcaacca tgtgattcca tacgaactct tcgcaggtga tggtatgttg   1500
actcgtctct tgctcaaggc atctgacaag gcaccatggt cagataacgg tgacgctaaa   1560
aacccagccc tatctccact aggtgaaaac gtgaagacca aaggtcaata cttctatcaa   1620
ttagccttgg acggaaatgt agctggcaaa gaaaaacaag cgctcattga ccagttccga   1680
gcaaacggta ctcaaactta cagcgctaca gtcaatgtct atggtaacaa agacggtaaa   1740
ccagacttgg acaacatcgt agcaactaaa aaagtcacta ttaacataaa cggtttaatt   1800
tctaaagaaa cagttcaaaa agccgttgca gacaacgtta aggacagtat cgatgttcca   1860
gcagcctacc tagaaaaggc caagggtgaa ggtccattca cagcaggtgt caaccatgtg   1920
attccatacg aactcttcgc aggtgatggc atgttgactc gtctcttgct caaggcatct   1980
gacaaggcac catggtcaga taacggcgac gctaaaaacc cagctctatc tccactaggt   2040
gaaaacgtga agaccaaagg tcaatacttc tatcaagtag ccttggacgg aaatgtagct   2100
ggcaaagaaa aacaagcgct cattgaccag ttccgagcaa acggtactca aacttacagc   2160
gctacagtca atgtctatgg taacaaagac ggtaaaccag acttggacaa catcgtagca   2220
actaaaaaag tcactattaa gataaatgtt aaagaaacat cagacacagc aaatggttca   2280
ttatcacctt ctaactctgg ttctggcgtg actccgatga atcacaatca tgctacaggt    2340
actacagata gcatgcctgc tgacaccatg acaagttcta ccaacacgat ggcaggtgaa    2400
aacatggctg cttctgctaa caagatgtct gatacgatga tgtcagagga taaagctatg    2460
ctaccaaata ctggtgagac tcaaacatca atggcaagta ttggtttcct tgggcttgcg    2520
cttgcaggtt tactcggtgg tctaggtttg aaaaacaaaa aagaagaaaa c             2571
 
SeqID 6
atgaaatcaa taactaaaaa gattaaagca actcttgcag gagtagctgc cttgtttgca      60
gtatttgctc catcatttgt atctgctcaa gaatcatcaa cttacactgt taaagaaggt     120
gatacacttt cagaaatcgc tgaaactcac aacacaacag ttgaaaaatt ggcagaaaac     180
aaccacattg ataacattca tttgatttat gttgatcaag agttggttat cgatggccct     240
gtagcgcctg ttgcaacacc agcgccagct acttatgcgg caccagccgc tcaagatgaa     300
actgtttcag ctccagtagc agaaactcca gtagtaagtg aaacagttgt ttcaactgta     360
agcggatctg aagcagaagc caaagaatgg atcgctcaaa aagaatcagg tggtagctat     420
acagctacaa atggacgtta tatcggacgt taccaattaa cagattcata cctgaacggt     480
gactactcag ctgaaaacca agaacgtgta gcagatgcct acgttgcagg acgttacggt     540
tcatggactg ctgctaaaaa cttctggctt aacaatggct ggtat                     585
 
SeqID 7
atgaataaga aaaaaatgat tttaacaagt ctagccagcg tcgctatctt aggggctggt      60
tttgttacgt ctcagcctac ttttgtaaga gcagaagaat ctccacaagt tgtcgaaaaa     120
tcttcattag agaagaaata tgaggaagca aaagcaaaag ctgatactgc caagaaagat     180
tacgaaacgg ctaaaaagaa agcagaagac gctcagaaaa agtatgaaga tgatcagaag     240
agaactgagg agaaagctcg aaaagaagca gaagcatctc aaaaattgaa tgatgtggcg     300
cttgttgttc aaaatgcata taaagagtac cgagaagttc aaaatcaacg tagtaaatat     360
aaatctgacg ctgaatatca gaaaaaatta acagaggtcg actctaaaat agagaaggct     420
aggaaagagc aacaggactt gcaaaataaa tttaatgaag taagagcagt tgtagttcct     480
gaaccaaatg cgttggctga gactaagaaa aaagcagaag aagctaaagc agaagaaaaa     540
gtagctaaga gaaaatatga ttatgcaact ctaaaggtag cactagcgaa gaaagaagta     600
gaggctaagg aacttgaaat tgaaaaactt caatatgaaa tttctacttt ggaacaagaa     660
gttgctactg ctcaacatca agtagataat ttgaaaaaac ttcttgctgg tgcggatcct     720
gatgatggca cagaagttat agaagctaaa ttaaaaaaag gagaagctga gctaaacgct     780
aaacaagctg agttagcaaa aaaacaaaca gaacttgaaa aacttcttga cagccttgat     840
cctgaaggta agactcagga tgaattagat aaagaagcag aagaagctga gttggataaa     900
aaagctgatg aacttcaaaa taaagttgct gatttagaaa aagaaattag taaccttgaa     960
atattacttg gaggggctga tcctgaagat gatactgctg ctcttcaaaa taaattagct    1020
gctaaaaaag ctgagttagc aaaaaaacaa acagaacttg aaaaacttct tgacagcctt    1080
gatcctgaag gtaagactca ggatgaatta gataaagaag cagaagaagc tgagttggat    1140
aaaaaagctg atgaacttca aaataaagtt gctgatttag aaaaagaaat tagtaacctt    1200
gaaatattac ttggaggggc tgattctgaa gatgatactg ctgctcttca aaataaatta    1260
gctactaaaa aagctgaatt ggaaaaaact caaaaagaat tagatgcagc tcttaatgag    1320
ttaggccctg atggagatga agaagaaact ccagcgccgg ctcctcaacc agagcaacca    1380
gctcctgcac caaaaccaga gcaaccagct ccagctccaa aaccagagca accagctcct    1440
gcaccaaaac cagagcaacc agctccagct ccaaaaccag agcaaccagc tccagctcca    1500
aaaccagagc aaccagctaa gccggagaaa ccagctgaag agcctactca accagaaaaa    1560
ccagccactc caaaaacagg ctggaaacaa gaaaacggta tgtggtattt ctacaatact    1620
gatggttcaa tggcaatagg ttggctccaa aacaacggtt catggtacta cctaaacgct    1680
aacggcgcta tggcaacagg ttgggtgaaa gatggagata cctggtacta tcttgaagca    1740
tcaggtgcta tgaaagcaag ccaatggttc aaagtatcag ataaatggta ctatgtcaac    1800
agcaatggcg ctatggcgac aggctggctc caatacaatg gctcatggta ctacctcaac    1860
gctaatggtg atatggcgac aggatggctc caatacaacg gttcatggta ttacctcaac    1920
gctaatggtg atatggcgac aggatgggct aaagtcaacg gttcatggta ctacctaaac    1980
gctaacggtg ctatggctac aggttgggct aaagtcaacg gttcatggta ctacctaaac    2040
gctaacggtt caatggcaac aggttgggtg aaagatggag atacctggta ctatcttgaa    2100
gcatcaggtg ctatgaaagc aagccaatgg ttcaaagtat cagataaatg gtactatgtc    2160
aatggcttag gtgcccttgc agtcaacaca actgtagatg gctataaagt caatgccaat    2220
ggtgaatggg tt                                                        2232
 
SeqID 8
atgaaaaaaa tagttcttgt tagtctagct ttcctttttg tcctggttgg ttgcggacag      60
aaaaaagaaa ctggaccagc tacaaaaaca gaaaaagata cgcttcagtc ggcattgcca     120
gttattgaaa atgctgagaa gaatacagtt gtaactaaga ctttggtctt gcccaagtca     180
gatgatggta gccagcagac acaaacaatt acttacaaag acaagacttt tttgagtcta     240
gctatccaac aaaaacgtcc agtctctgat gagttgaaga cttatattga ccaacatgga     300
gtggaggaaa ctcaaaaagc tcttcttgaa gcggaggaga aggataagtc tatcattgaa     360
gctcgtaaat tggcaggttt caaacttgaa acaaaactat tgagcgcaac ggaacttcaa     420
acaacgacta gttttgattt tcaagttctg gatgtcaaga aggcttccca gttggaacat     480
ctgaagaata ttggtttgga aaatcttttg aaaaatgaac caagcaaata tatttcagat     540
agattggcaa atggcgcgac agaacaa                                        567
 
SeqID 9
atgtttgaag tagaagaatg gctccatagt cggattggtt tgaattttcg atcaggtttg     60
ggtcgaatgc agcaagcggt ggatttgtta ggaaatcctg agcagtctta ccctattatc    120
cacgtaacag ggactaatgg gaaaggatct accattgctt ttatgaggga attatttatg    180
gggcatggca aaaaagttgc gacctttacc tcccctcata tcgtctctat caatgaccga    240
atctgcatta atgggcagcc tatagcagac gcagacttta tccgtttgac tgatcaggtc    300
aaggagatgg agaaaacgct tctgcaaact cctgcccagt tgtccttttt tgaattgctg    360
accttggttg cttttcttta ttttagggag caggaggtgg atttggtttt attagaagtg    420
ggaattggtg gcttacttga cacgaccaat gtggtaactg gagagtttgc tgtcatcacc    480
tccattgggc ttgaccatca agaaaccttg ggtgatagtc tagaagcaat tgcagagcag    540
aaagctggta ttttcaaggc tggtaagaag gcagtgattg cgaaattgcc tccagaagct    600
aggcttgcct gtcagaaaaa agccgaatct ttagctgtta acctttatca ggcaggtcaa    660
gattttttaa tgctgaatgg tgatttttca agctctttac taaatctttc acagctgaac    720
ataggcttag aaggagtcta tcagcaggag aatgcagcct tggcgttgca aacttttctt    780
ctttttatga gagaaagaaa ggaagctgtt gatgaacagg ctgtaagaaa ggccttggaa    840
cagacccatt gggctggtcg cttggagcgt attcgcccac agatttattt ggatggtgct    900
cataacctcc ctgccttgac tcgcttggct gagtttatca aagaaaaaga gcaggaaggc    960
tatcgacctc aaatcctctt tggatccttg aaacgtaagg attatcaagg gatgttgggt   1020
tatctgactg aaaaattgcc tcaggtggaa ctcaaggtga ccggctttga ctatcagggg   1080
gctttggacg aaagggatgt gacaggttac gatatagttt cttcttaccg agaatttatc   1140
agcgattttg aagaaagggc agacgctcaa gacttgctgt tcgttacagg gtctctctat   1200
tttatctcag aagtacgggg ctacctgctg gaccgtgagc agataaat                1248
 
SeqID 10
gtgggaattc gtgtttataa accaacaaca aacggtcgcc gtaatatgac ttctttggat     60
ttcgctgaaa tcacaacaag cactcctgaa aaatcattgc ttgttgcatt gaagagcaag    120
gctggtcgta acaacaacgg tcgtatcaca gttcgtcacc aaggtggtgg acacaaacgt    180
ttctaccgtt tggttgactt caaacgtaat aaagacaacg ttgaagcagt tgttaaaaca    240
atcgagtacg atccaaaccg ttctgcaaac atcgctcttg tacactacac tgacggtgtg    300
aaagcataca tcatcgctcc aaaaggtctt gaagtaggtc aacgtatcgt ttcaggtcca    360
gaagcagata tcaaagtcgg aaacgctctt ccacttgcta acatcccagt tggtactttg    420
attcacaaca tcgagttgaa accaggtcgt ggtggtgaat tggtacgtgc tgctggtgca    480
tctgctcaag tattgggttc tgaaggtaaa tatgttcttg ttcgtcttca atcaggtgaa    540
gttcgtatga ttcttggaac ttgccgtgct acagttggtg ttgtcggaaa cgaacaacat    600
ggacttgtaa accttggtaa agcaggacgt agccgttgga aaggtatccg cccaacagtt    660
cgtggttctg taatgaaccc taacgatcac ccacacggtg gtggtgaagg taaagcacca    720
gttggtcgta aagcaccatc tactccatgg ggcaaacctg ctcttggtct taaaactcgt    780
aacaagaaag cgaaatctga caaacttatc gttcgtcgtc gcaacgagaa a             831
 
SeqID 11
atggctaaaa aatcaatggt agctagagag gctaaacgcc aaaaaattgt tgaccgttat     60
gctgaaaaac gtgctgcatt aaaggcggca ggggactacg aaggtttatc taaattacct    120
cgcaacgcct caccgactcg tttacataat cgttgtaggg ttacggggcg cccacattca    180
gtttaccgca aatttggtct gagtcgtatc gcttttcgcg aacttgcgca taaaggtcaa    240
attcctggtg taacaaaagc atcttgg                                        267
 
SeqID 12
atggatatta gacaagttac tgaaaccatc gccatgattg aggagcaaaa cttcgatatt     60
agaaccatta ccatggggat ttctcttttg gactgtatcg atccagatat caatcgtgct    120
gcggagaaaa tctatcaaaa aattacgaca aaggcggcta atttagtagc tgttggtgat    180
gaaattgcgg ctgagttggg aattcctatc gttaataagc gtgtatcggt gacacctatt    240
tctctgattg gggcagcgac agatgcgacg gactacgtgg ttctggcaaa agcgcttgat    300
aaggctgcga aagagattgg tgtggacttt attggtggtt tttctgcctt agtacaaaaa    360
ggttatcaaa agggagatga gattctcatc aattccattc ctcgcgcttt ggctgagacg    420
gataaggtct gctcgtcagt caatatcggc tcaaccaagt ctggtattaa tatgacggct    480
gtggcagata tgggacgaat tatcaaggaa acagcaaatc tttcagatat gggagtggcc    540
aagttggttg tattcgctaa tgctgttgag gacaatccat ttatggcggg tgcctttcat    600
ggtgttgggg aagcagatgt tatcatcaat gtcggagttt ctggtcctgg tgttgtgaaa    660
cgtgctttgg aaaaagttcg tggacagagc tttgatgtag tagccgaaac agttaagaaa    720
actgccttta aaatcactcg tatcggtcaa ttggttggtc aaatggccag tgagagactg    780
ggtgtggagt ttggtattgt ggacttgagt ttggcaccaa cccctgcggt tggagactct    840
gtggcacgtg tccttgagga aatggggcta gaaacagttg gcacgcatgg aacgacggct    900
gccttggccc tcttgaacga ccaagttaaa aagggtggag tgatggcctg caaccaagtc    960
ggtggtttat ctggtgcctt tatccctgtt tctgaggatg aaggaatgat tgctgcagtg   1020
caaaatggct ctcttaattt agaaaaacta gaagctatga cggctatctg ttctgttgga   1080
ttggatatga ttgccatccc agaagatacg cctgctgaaa ctattgcggc tatgattgcg   1140
gatgaagcag caatcggtgt tatcaacatg aaaacaacag ctgttcgtat cattcccaaa   1200
ggaaaagaag gcgatatgat tgagtttggt ggtctattag gaactgcacc cgttatgaag   1260
gttaatgggg cttcgtctgt cgacttcatc tctcgcggtg gacaaatccc agcaccaatt   1320
catagtttta aaaat                                                    1335
 
SeqID 13
atggtaaata cagaagtagc aagaacaaca atcaagacag aatattttgg cagccttact     60
gaaaggatga acaaatatcg agaagatgtt ttaaataaaa aaccttatat tgatgctgag    120
agagcagttc tagcaacacg cgcctatgaa cgatacaagg aacaacctaa tgtcctaaaa    180
cgtgcatata tgctgaaaga aattttggaa aatatgacta tctatattga agaagaatct    240
atgattgcgg gaaatcaagc ttcttccaat aaagatgctc ctatttttcc ggaatatacg    300
ctagaatttg ttctcaatga gttggatctt tttgaaaagc gtgatggaga tgttttctat    360
attacagaag aaacaaaaga acaacttaga agtattgctc cgttttggga aaataataat    420
ttacgtgcta gagctggtgc cttattacct gaagaagtgt ctgtttatat ggaaacagga    480
ttcttcggta tggaaggtaa gatgaattct ggagatgctc acttagcagt taactatcag    540
aaacttttgc aatttggttt aagaggtttt gaagagcggg ctcgtaaagc aaaagtagct    600
ctagatttaa cagatccagc aagtattgat aaatatcatt tttacgactc tatatttatc    660
gtaatcgatg ctattaaagt atatgcaaag cgctttgttg ctcttgctaa aagtttagcc    720
gaaaatgcaa atcctaaacg taagaaagaa ttacttgaga ttgcagatat ttgctctaga    780
gtcccatatg aaccggcaac tacttttgca gaagctattc aatcagtttg gtttattcaa    840
tgtattttac aaattgaatc taatggccac tctctttcat atggccgttt tgatcaatat    900
atgtatccat atatgaaggc tgatttagaa agtggtaaag aaacagaaga tagcattgtt    960
gaacgtctga caaatctttg gattaagaca attacaatta ataaggttcg cagtcaatca   1020
catacatttt cttcagcagg aagtccttta tatcaaaatg ttacaattgg tggacagact   1080
cgagataaga aggatgctgt taacccatta tcttatttgg tattaaaatc agttgcacaa   1140
acccatctac cgcaacctaa tctaactgta cgttaccatg caggtttaga tgctcgtttc   1200
atgaatgagt gtattgaagt gatgaaactt ggttttggta tgcctgcatt taataatgat   1260
gagattatta ttccttcttt tattgcaaaa ggagtattgg aagatgatgc ttatgattac   1320
agtgccattg gatgtgttga aacggcagtt ccagggaaat ggggctatcg ttgcacaggt   1380
atgagttata tgaacttccc taaggttcta cttatcacga tgaatgatgg aattgatccg   1440
gcttcgggta aacggtttgc accaagcttt ggtcgtttta aggatatgaa gaacttttct   1500
gaattagaaa atgcttggga taaaacacta agatatttga cacgaatgag tgttattgtt   1560
gaaaattcta ttgatttatc attggaacga gaagttcctg atattctatg ttcagcattg   1620
actgatgatt gtattggtcg tggaaaacac cttaaagaag gtggagcagt atatgattat   1680
atatcaggat tgcaagttgg aattgcaaat ttgtcggatt cattagctgc aattaaaaaa   1740
ttggtgtttg aggaagaacg tataagccca agtcagcttt ggcatgcact ggaaacagat   1800
tatgccggag aagaaggtaa ggtcattcaa gaaatgttga ttcatgatgc acctaagtat   1860
ggtaatgatg atgattatgc tgacaaattg gttactgctg cttatgacat ttatgttgat   1920
gaaattgcta aatatcctaa tacacgttat ggaagagggc ctattggagg aattcgttat   1980
tcaggaacat cttctatctc agccaacgta gggcagggac gtggaacatt agcaactcca   2040
gatggacgca acgcgggtac accgttagca gagggttgtt caccatcaca taatatggat   2100
caacacggcc ctacatctgt tttaaaatct gtttcaaaat taccaacaga tgaaatcgta   2160
ggtggggttc tcttaaatca gaaagtaaat cctcaaacgt tagccaaaga agaagataaa   2220
ttaaaactaa ttgctttgtt acgaacattc tttaatcgtt tacatgggta ccatattcaa   2280
tacaatgttg tttccagaga gacgctgatt gacgctcaga aacatcctga aaaacacaga   2340
gacttaattg ttcgtgttgc aggatactct gcattcttca atgttctttc taaggcaacc   2400
caagatgaca ttataggacg tactgagcat actttg                             2436
 
SeqID 14
atgtcacaag cacaatatgc aggtactgga cgtcgtaaaa acgctgttgc acgcgttcgc     60
cttgttccag gaactggtaa aatcactgtt aacaaaaaag atgttgaaga gtacatccca    120
cacgctgacc ttcgtcttgt catcaaccaa ccattcgcag ttacttcaac tgtaggttca    180
tacgacgttt tcgttaacgt tataggtggt ggatacgctg gtcaatcagg agctatccgt    240
cacggtatcg ctcgtgccct tcttcaagta gacccagact tccgcgattc attgaaacgc    300
gcaggacttc ttacacgtga ctcacgtaaa gttgaacgta agaaaccagg tcttaagaaa    360
gctcgtaaag catcacaatt tagtaaacgt                                     390
 
SeqID 15
ttggagaaga aactgaccat aaaagacatt gcggaaatgg ctcagacctc gaaaacaacc     60
gtgtcatttt acctaaacgg gaaatatgaa aaaatgtccc aagagacacg tgaaaagatt    120
gaaaaagtta ttcatgaaac aaattacaaa ccgagcattg ttgcgcgtag cttaaactcc    180
aaacgaacaa aattaatcgg tgttttgatt ggtgatatta ccaacagttt ctcaaaccaa    240
attgttaagg gaattgagga tatcgccagc cagaatggct accaggtaat gataggaaat    300
agtaattaca gccaagagag tgaggaccgg tatattgaaa gcatgcttct cttgggagta    360
gacggcttta ttattcagcc gacctctaat ttccgaaaat attctcgtat catcgatgag    420
aaaaagaaga aaatggtctt ttttgatagt cagctctatg aacaccggac tagctgggtt    480
aaaaccaata actatgatgc cgtttatgac atgacccagt cctgtatcga aaaaggttat    540
gaacattttc tcttgattac agcggatacg agtcgtttga gtactcggat tgagcgggca    600
agtggttttg tggatgcttt aacagatgct aatatgcgtc acgccagtct aaccattgaa     660
gataagcata cgaatttgga acaaattaag gaatttttac aaaaagaaat cgatcccgat     720
gaaaaaactc tggtatttat ccctaactgt tgggccctac ctctagtctt taccgttatc     780
aaagagttga attataactt gccacaagtt gggttgattg gttttgacaa tacggagtgg     840
acttgctttt cttctccaag tgtttcgacg ctggttcagc cctcctttga ggaaggacaa     900
caggctacaa agattttgat tgaccagatt gaaggtcgca atcaagaaga aaggcaacaa     960
gtcttggatt gtagtgtgaa ttggaaagag tcgactttc                            999
 
SeqID 16
atgaataaag gattatttga aaaacgttgt aaatatagta ttcggaaatt ttcattaggt      60
gttgcttctg ttatgattgg agctgcattc tttgggacaa gtccggttct tgcagatagc     120
gtgcagtctg gttccacggc gaacttacca gctgatttag ctactgctct tgcaacagca     180
aaagagaatg atgggcgtga ttttgaagcg cctaaggtgg gagaagacca aggttctcca     240
gaagttacag atggacctaa gacagaagaa gaactattag cacttgaaaa agaaaaaccg     300
gctgaagaaa aaccaaaaga ggataaacct gcagctgcta aacctgaaac acctaagacg     360
gtaacccctg aatggcaaac ggtagcgaat aaagagcaac agggaacagt cactatccga     420
gaagaaaaag gtgtccgcta caaccaacta tcctcaactg ctcaaaatga taacgcaggc     480
aaaccagccc tgtttgaaaa gaagggcttg accgttgatg ccaatggaaa tgcaactgtt     540
gatttaacct tcaaagatga ttctgaaaag ggcaaatcac gctttggtgt ctttttgaaa     600
tttaaagata ccaagaataa tgtttttgtc ggttatgaca aggatggctg gttctgggag     660
tataaatctc caacaactag cacttggtat agaggtagtc gtgttgctgc tcctgaaaca     720
ggatcaacaa accgtctctc tatcactctc aagtcagacg gtcagctaaa tgccagcaat     780
aatgatgtca atctctttga cacagtgact ctaccagctg cggtcaatga ccatcttaaa     840
aatgagaaga agattcttct caaggcgggc tcttatgacg atgagcgaac agttgttagc     900
gttaaaacgg ataaccaaga gggggtaaaa acagaggata cccctgctga aaaagaaaca     960
ggtcctgaag ttgatgatag caaggtgact tatgacacga ttcagtctaa ggtcctcaaa    1020
gcagtgattg accaagcctt ccctcgtgtc aaggaataca gcttgaacgg gcatactttg    1080
ccaggacagg tgcaacagtt caaccaagtc tttatcaata accaccgaat cacccctgaa    1140
gtcacttata agaaaatcaa tgagacaaca gcagagtact tgatgaagct tcgcgatgat    1200
gctcacttaa tcaatgcgga aatgacagta cgcttgcaag ttgtagacaa tcaattgcac    1260
tttgatgtga ctaagattgt caaccacaat caagtcactc caggtcaaaa gattgatgac    1320
gaaagcaaac tactttcttc tattagtttc ctcggcaatg ctttagtctc tgtttctagt    1380
aatcaaactg gtgctaagtt tgatggggca accatgtcaa acaatacgca tgtcagcgga    1440
gatgatcata tcgatgtaac caatccaatg aaggatttgg ctaagggtta catgtatgga    1500
tttgtttcta cagataagct tgctgctggt gtttggagta actctcaaaa cagctatggt    1560
ggtggttcga atgactggac tcgtttgaca gcttataaag aaacagtcgg aaatgccaac    1620
tatgtaggaa tccacagctc tgaatggcaa tgggaaaaag cttataaggg cattgttttc    1680
ccagaataca cgaaggaact tccaagtgct aaggttgtta tcactgaaga tgccaatgca    1740
gacaagaacg ttgattggca agatggtgcc attgcttatc gtagcattat gaacaatcct    1800
caaggttggg aaaaagttaa ggatatcaca gcttaccgta tcgcgatgaa ctttggttct    1860
caagcacaaa acccattcct tatgaccttg gatggtatca agaaaatcaa tctccataca    1920
gatggtcttg ggcaaggtgt tctccttaaa ggatatggta gcgaaggcca tgactctggt    1980
cacttgaact atgctgatat tggtaagcgt atcggtggtg tcgaagactt caagacccta    2040
attgagaagg ctaagaaata tggagctcat ctaggtatcc acgttaacgc ttcagaaact    2100
tatcctgagt ctaaatactt caatgaaaaa attctccgta agaatccaga tggaagctat    2160
agctatggtt ggaactggct agatcaaggt atcaacattg atgctgccta tgacctagct    2220
catggtcgtt tggcacgttg ggaagatttg aagaaaaaac ttggtgacgg tctcgacttt    2280
atctatgtgg acgtttgggg taatggtcaa tcaggtgata acggtgcctg ggctacccac    2340
gttcttgcta aagaaattaa caaacaaggc tggcgctttg cgatcgagtg gggccatggt    2400
ggtgagtacg actctacctt ccatcactgg gcagctgact tgacctacgg tggctacacc    2460
aataaaggta tcaacagtgc catcacccgc tttatccgta accaccaaaa agatgcttgg    2520
gtaggggact acagaagtta tggtggtgca gccaactatc cactgctagg tggctacagc    2580
atgaaagact ttgaaggctg gcagggaaga agtgactaca atggctatgt aaccaactta    2640
tttgcccatg acgtcatgac taagtacttc caacacttca ctgtaagtaa atgggaaaat    2700
ggtacaccgg tgactatgac cgataacggt agcacctata aatggactcc agaaatgcga    2760
gtggaattgg tagatgctga caataataaa gtagttgtaa ctcgtaagtc aaatgatgtc    2820
aatagtccac aatatcgcga acgtacagta acgctcaacg gacgtgtcat ccaagatggt    2880
tcagcttact tgactccttg gaactgggat gcaaatggta agaaactttc tactgataag    2940
gaaaagatgt actacttcaa tacgcaggcc ggtgcaacaa cttggaccct tccaagcgat    3000
tgggcaaaga gcaaggttta cctttacaag ctaactgacc aaggtaagac agaagagcaa    3060
gaactaactg taaaagatgg taaaattacc ctagatcttc tagcaaatca accatacgtt    3120
ctctatcgtt cgaaacaaac taatcctgaa atgtcatgga gtgaaggcat gcacatctat    3180
gaccaaggat ttaatagcgg taccttgaaa cattggacca tttcaggcga tgcttctaag    3240
gcagaaattg tcaagtctca aggggcaaac gatatgcttc gtattcaagg aaacaaagaa    3300
aaagttagtc tcactcagaa attaactggc ttgaaaccaa ataccaagta tgccgtttat    3360
gttggtgtag ataaccgtag taatgccaag gcaagtatca ctgtgaatac tggtgaaaaa    3420
gaagtgacta cttataccaa taagtctctc gcgctcaact atgttaaggc ctacgcccac    3480
aatacacgtc gtgacaatgc tacagttgac gatacaagtt acttccaaaa catgtacgcc    3540
ttctttacaa ctggagcgga cgtctcaaat gttactctga cattgagtcg tgaagctggt    3600
gatcaagcaa cttactttga tgaaattcgt acctttgaaa acaattcaag catgtacgga    3660
gacaagcatg atacaggtaa aggcaccttc aagcaagact ttgaaaatgt tgctcagggt    3720
atcttcccat ttgtagtggg tggtgtcgaa ggtgttgaag ataaccgcac tcacttgtct    3780
gaaaaacaca atccatatac acaacgtggt tggaatggta agaaagtcga tgatgttatc    3840
gaaggaaatt ggtcactcaa gacaaatgga ctagtgagcc gtcgtaactt ggtttaccaa    3900
accatcccac aaaacttccg ttttgaagca ggtaagacct accgtgtaac ctttgaatac    3960
gaagcaggat cagacaatac ctatgctttt gtagtcggta agggagaatt ccagtcaggt    4020
cgtcgtggta ctcaagcaag caacttggaa atgcatgaat tgccaaatac ttggacagat    4080
tctaagaaag ccaagaaggc aaccttcctt gtgacaggtg cagaaacagg cgatacttgg    4140
gtaggtatct actcaactgg aaatgcaagt aatactcgtg gtgattctgg tggaaatgcc    4200
aacttccgtg gttataacga cttcatgatg gataatcttc aaatcgaaga aattacccta    4260
acaggtaaga tgttgacaga aaatgctctg aagaactact tgccaacggt tgccatgact    4320
aactacacca aagagtctat ggatgctttg aaagaggcgg tctttaacct cagtcaggcc    4380
gatgatgata tcagtgtgga agaagcgcgt gcagagattg ccaagattga agctttgaag    4440
aatgctttgg ttcagaagaa gacggctttg gtagcagatg actttgcaag tcttacagct    4500
cctgctcagg ctcaagaagg tcttgcaaat gcctttgatg gcaatgtgtc tagtctatgg    4560
catacatctt ggaatggtgg agatgtaggc aagcctgcaa ctatggtctt gaaagaacca    4620
actgaaatca caggacttcg ctatgttccg cgtggatcag gttcaaatgg taacttgcga    4680
gatgtgaaac ttgttgtgac agatgagtct ggcaaggagc atacctttac tgcaactgat    4740
tggccaaata acaacaaacc aaaagatatt gactttggta agacaatcaa ggctaagaaa    4800
attgtcctta ctggtaccaa gacatacgga gatggtggag ataaatacca atctgcagcg    4860
gaacttatct ttactcgtcc acaggtagca gaaacacctc ttgacttgtc aggctatgaa    4920
gcagctttgg ttaaggctca gaaattaaca gacaaagaca atcaagagga agtagctagc    4980
gttcaggcaa gcatgaaata tgcgacggat aaccatctct tgacggaaag aatggtggaa    5040
tactttgcag attatctcaa ccaattaaaa gattctgcta cgaaaccaga tgctccaact    5100
gtagagaaac ctgagtttaa acttagatct ttagcttccg agcaaggtaa gacgccagat    5160
tataagcaag aaatagctag accagaaaca cctgaacaaa tcttgccagc aacaggtgag    5220
agtcaatctg acacagccct catcctagca agtgttagtc tagccctatc tgctctcttt    5280
gtagtaaaaa cgaagaaaga c                                              5301
 
SeqID 17
atgaacaaac caacgattct gcgcctaatc aagtatctga gcattagctt cttaagcttg      60
gttatcgcag ccattgtctt aggcggagga gtttttttct actacgttag caaggctcct     120
agcctatccg agagtaaact agttgcaaca acttctagta aaatctacga caataaaaat     180
caactcattg ctgacttggg ttctgaacgc cgcgtcaatg cccaagctaa tgatattccc     240
acagatttgg ttaaggcaat cgtttctatc gaagaccatc gcttcttcga ccacaggggg     300
attgatacca tccgtatcct gggagctttc ttgcgcaatc tgcaaagcaa ttccctccaa     360
ggtggatcaa ctctcaccca acagttgatt aagttgactt acttttcaac ttcgacttcc     420
gaccagacta tttctcgtaa ggctcaggaa gcttggttag cgattcagtt agaacaaaaa     480
gcaaccaagc aagaaatctt gacctactat ataaataagg tctacatgtc taatgggaac     540
tatggaatgc agacagcagc tcaaaactac tatggtaaag acctcaataa tttaagttta     600
cctcagttag ccttgctggc tggaatgcct caggcaccaa accaatatga cccctattca     660
catccagaag cagcccaaga ccgccgaaac ttggtcttat ctgaaatgaa aaatcaaggc     720
tacatctctg ctgaacagta tgagaaagca gtcaatacac caattactga tggactacaa     780
agtctcaaat cagcaagtaa ttaccctgct tacatggata attacctcaa ggaagtcatc     840
aatcaagttg aagaagaaac aggctataac ctactcacaa ctgggatgga tgtctacaca     900
aatgtagacc aagaagctca aaaacatctg tgggatattt acaatacaga cgaatacgtt     960
gcctatccag acgatgaatt gcaagtcgct tctaccattg ttgatgtttc taacggtaaa    1020
gtcattgccc agctaggagc acgccatcag tcaagtaatg tttccttcgg aattaaccaa    1080
gcagtagaaa caaaccgcga ctggggatca actatgaaac cgatcacaga ctatgctcct    1140
gccttggagt acggtgtcta cgattcaact gctactatcg ttcacgatga gccctataac    1200
taccctggga caaatactcc tgtttataac tgggataggg gctactttgg caacatcacc    1260
ttgcaatacg ccctgcaaca atcgcgaaac gtcccagccg tggaaactct aaacaaggtc    1320
ggactcaacc gcgccaagac tttcctaaat ggtctaggaa tcgactaccc aagtattcac    1380
tactcaaatg ccatttcaag taacacaacc gaatcagaca aaaaatatgg agcaagtagt    1440
gaaaagatgg ctgctgctta cgctgccttt gcaaatggtg gaacttacta taaaccaatg    1500
tatatccata aagtcgtctt tagtgatggg agtgaaaaag agttctctaa tgtcggaact    1560
cgtgccatga aggaaacgac agcctatatg atgaccgaca tgatgaaaac agtcttgact    1620
tatggaactg gacgaaatgc ctatcttgct tggctccctc aggctggtaa aacaggaacc    1680
tctaactata cagacgagga aattgaaaac cacatcaaga cctctcaatt tgtagcacct    1740
gatgaactat ttgctggcta tacgcgtaaa tattcaatgg ctgtatggac aggctattct    1800
aaccgtctga caccacttgt aggcaatggc cttacggtcg ctgccaaagt ttaccgctct    1860
atgatgacct acctgtctga aggaagcaat ccagaagatt ggaatatacc agaggggctc    1920
tacagaaatg gagaattcgt atttaaaaat ggtgctcgtt ctacgtggaa ctcacctgct    1980
ccacaacaac ccccatcaac tgaaagttca agctcatcat cagatagttc aacttcacag    2040
tctagctcaa ccactccaag cacaaataat agtacgacta ccaatcctaa caataatacg    2100
caacaatcaa atacaacccc tgatcaacaa aatcagaatc ctcaaccagc acaacca       2157
SeqID 18
atgagtaaaa aaagacgaaa tcgtcataaa aaagaaggtc aagaaccgca atttgatttt      60
gatgaagcaa aagagctaac agttggtcaa gctattcgta aaaatgaaga agtggaatca     120
ggagtcttgc ctgaggattc cattttggac aagtatgtta agcaacacag agatgaaatt     180
gaggcggata agtttgcgac tcgtcaatac aaaaaagagg agttcgttga aactcagagt     240
ctggatgatt taattcaaga gatgcgtgag gctgtagaga agtcagaagc ttcttcggag     300
gaagttccat cttctgaaga catcttacta cccttgcctc tggacgatga ggagcaaggc     360
ttggatcctc tattgctaga tgatgaaaat ccaacagaaa tgactgaaga agtggaagag     420
gagcaaaacc tttctcgtct ggatcaagag gactcagaaa agaaaagtaa aaaaggcttt     480
attttgaccg ttttggcgct tgtatcagta attatttgtg tcagtgctta ttatgtctac     540
cgtcaagtgg ctcgttcgac taaggaaatt gaaacttctc aatcaactac agccaatcaa     600
tcggatgtgg atgattttaa tacactttat gacgcctttt acacagatag caataaaacg     660
gctttgaaaa atagccagtt tgataaactg agtcaactca agactttact tgataagctg     720
gaaggtagtc gtgaacatac gcttgccaaa tctaaatatg atagtctagc aacgcaaatc     780
aaggctattc aagatgtcaa tgctcaattt gagaaaccag ctattgtgga tggtgtgttg     840
gataccaatg ccaaagccaa atcggatgct aaatttacgg atattaaaac tggaaatacg     900
gagcttgata aagtgctaga taaggctatc agtcttggta agagccagca aacaagtact     960
tctagctcaa gttcaagtca aactagcagc tcaagttcaa gtcaagcaag ttcaaatacg    1020
actagtgagc caaaaccaag tagttcaaat gagactagaa gtagtcgcag tgaagtcaat    1080
atgggtctct cgagtgcagg ggttgctgtt caaagaagtg ccagtcgtgt tgcctataat    1140
cagtctgcta ttgatgatag taataactct gcctgggatt ttgcggatgg tgtcttggaa    1200
caaattctag cgacttcacg ttcacgtggc tatatcactg gagaccaata tatccttgaa    1260
cgtgtcaata tcgttaacgg caatggttat tacaacctct acaagccaga tggaacctat    1320
ctctttaccc ttaactgtaa gacaggctac tttgtcggaa atggcgctgg tcatgcggat    1380
gacttagatt ac                                                        1392
 
SeqID 19
atgaagcttt tgaaaaaaat gatgcaagtc gcattagcag tctttttctt tggtttgcta      60
gctacaaata cggtatttgc gaataccaca ggtggccgat ttgttgataa ggataataga     120
aaatattatg taaaagatga tcataaagca atctattggc ataaaataga cggtaaaact     180
tactattttg gtgatattgg agagatggtt gtcggttggc aatacttaga aattcctgga     240
acaggttatc gtgataattt attcgataac caaccagtta atgaaattgg ccttcaggag     300
aagtggtact attttggaca agatggtgct ttgctagaac aaacagataa acaagtacta     360
gaggcaaaaa cgtctgaaaa tacaggaaaa gtatacggtg aacaatatcc tctatctgct     420
gaaaagagaa cttattattt tgataataat tatgctgtaa agacaggctg gatttatgaa     480
gagggtcatt ggtattattt aaataagcta ggaaattttg gcgatgattc ttacaatcca     540
ctaccaattg gtgaagttgc taagggttgg actcaagatt ttcatgttac tattgacatt     600
gatagaagca aacctgctcc atggtactac ctagatgctt caggtaagat gcttacagat     660
tggcaaaaag taaacggaaa atggtattat tttggctcct ctggttctat ggcaacaggt     720
tggaaatatg tacgaggcaa atggtattac ttagataata aaaatggtga tatgaaaaca     780
ggatggcaat accttggtaa caagtggtac tacctccgtt catcaggagc tatggtaact     840
ggctggtatc aagatggttc aacttggtac tatttagatc cttctaatgg agatatgaaa     900
ataggttgga caaaagtaaa tggaaaatgg tattatctca attcaaatgg agcaatggtt     960
acaggtagcc aaactatcga tggtaaagtt tataatttcg cctcatctgg tgagtggatt    1020
 
SeqID 20
atgaaaattt tgaaaaaaac tatgcaagtt ggactgacag tatttttctt tggtttgcta      60
gggaccagta cagtatttgc agatgattct gaaggatggc agtttgtcca agaaaacgga     120
agaacctact acaaaaaggg ggacctcaaa gaaacctact ggcgagtgat tgatggtaag     180
tactattatt ttgattctct atctggagag atggttgtcg gctggcaata tatcccgttt     240
ccatctaaag gtagtacaat tggtccttac ccaaatggta tcagattaga aggttttcca     300
aagtcagagt ggtactactt cgataaaaat ggagtgctac aagagtttgt tggttggaaa     360
acattagaga ttaaaactaa agacagtgtt ggaagaaagt acggggaaaa acgtgaagat     420
tcagaagata aagaagagaa gcgttattat acgaactatt actttaatca aaatcattct     480
ttagagacag gttggcttta tgatcagtct aactggtatt atctagctaa gacggaaatt     540
aatggagaaa actaccttgg tggtgaaaga cgtgcggggt ggataaacga tgattcgact     600
tggtactacc tagatccaac aactggtatt atgcaaacag gttggcaata tctaggtaat     660
aagtggtact acctccgttc ctcaggagca atggccactg gctggtatca ggaaggtacc     720
acttggtatt atttagacca cccaaatggc gatatgaaaa caggttggca aaaccttggg     780
aacaaatggt actatctccg ttcatcagga gctatggcaa ctggttggta tcaagatggt     840
tcaacttggt actacctaaa tgcaggtaat ggagacatga agacaggttg gttccaggtc     900
aatggcaact ggtactatgc ttatagctca ggtgctttgg cagtgaatac gaccgtagat     960
ggctattctg tcaactataa tggcgaatgg gttcgg                               996
 
SeqID 21
atggttttat ctaagtatta tggagtagcc gatggaatga atgtagaagg gaggggaagt      60
gcgaatttta ttaaagataa tgtgttaatt acagcggctc acaactacta cagacatgac     120
tatgggaaag aagcggatga tatttatgtt cttccggctg ttagtccaag tcaagaacca    180
tttggaaaga tcaaagtaaa ggaagttcgt tatttgaagg aatttagaaa tttaaattct    240
aaggatgcaa gggaatatga cttggcttta ttaattctag aagagcccat tggtgcaaaa    300
ttagggactt tgggtcttcc tactagtcaa aaaaatttga caggaataac tgtgactatc    360
acaggctatc catcatataa ttttaaaatt catcaaatgt atacagataa aaaacaagtt    420
ttaagtgatg atggcatgtt cttggattac caagttgata ctttagaggg gtctagtgga    480
tctacagttt atgatgctag tcaccgtgta gtaggagtgc atactttagg agatggagct    540
aatcaaatta acagtgcagt taaattaaat gaacgaaatt tgccatttat ttattcggtt    600
cttaaaggtt actctcttga aggatggaag aaaataaatg gtagttggta ccattataga    660
caacatgata aacaaacggg ttggcaggag ataaatgata cttggtatta tttagacagt    720
tccggtaaga tgcttacaga ttggcaaaaa gtaaatggaa aatggtatta tctcaattca    780
aatggagcaa tggttacagg tagccaaact atcgatggta aagtttataa cttcgcttca    840
tctggtgagt ggatt                                                     855
 
SeqID 22
ttgatgaaaa aaactttttt cttactggtg ttaggcttgt tttgccttct tccactctct     60
gtttttgcca ttgatttcaa gataaactct tatcaagggg atttgtatat tcatgcagac    120
aatacggcag agtttagaca gaagatagtt taccagtttg aggaggactt taagggccaa    180
atcgtgggac ttggacgtgc tggtaagatg cctagcgggt ttgacattga ccctcatcca    240
aagattcagg ccgcgaaaaa cggtgcagaa ctagcagatg tgactagcga agtaacagaa    300
gaagcggatg gttatactgt gagagtctat aatccaggtc aggagggcga catagttgaa    360
gttgacctcg tctggaactt aaaaaattta cttttccttt atgatgatat cgctgaatta    420
aattggcaac ctctgacaga tagttcagag tctattgaaa agtttgaatt tcatgtaagg    480
ggagacaagg gggctgaaaa actctttttc catacaggga aactttttag agagggaacg    540
attgaaaaga gtaaccttga ttatactatc cgtttagaca atcttccggc taagcgtgga    600
gttgagttgc atgcctattg gcctcggacc gattttgcta gcgctaggga tcagggattg    660
aaagggaatc gtttagaaga gtttaataag atagaagact cgattgttag agaaaaagat    720
cagagtaaac aactcgttac ttgggtcctc ccttcgatcc tttccatctc cttgttattg    780
agtgtctgct tctattttat ttatagaaga aagaccactc cttcagtcaa atatgccaaa    840
aatcatcgtc tctatgaacc accaatggaa ttagagccta tggttttatc agaagcagtc    900
tactcgacct ccttggagga agtgagtccc ttggtcaagg gagctggaaa attcaccttt    960
gatcaactta ttcaagctac cttgctagat gtgatagacc gtgggaatgt ctctatcatt   1020
tcagaaggag atgcagttgg tttgaggcta gtaaaagaag atggtttgtc aagctttgag   1080
aaagactgcc taaatctagc tttttcaggt aaaaaagaag aaactctttc caatttgttt   1140
gcggattaca aggtatctga tagtctttat cgtagagcca aagtttctga tgaaaaacgg   1200
attcaagcaa gagggcttca actcaaatct tcttttgaag aggtattgaa ccagatgcaa   1260
gaaggagtga gaaaacgagt ttccttctgg gggctcccag attattatcg tcctttaact   1320
ggtggggaaa aggccttgca agtgggtatg ggtgccttga ctatcctgcc cctatttatc   1380
ggatttggtt tgttcttgta cagtttagac gttcatggct atctttacct ccctttgcca   1440
atacttggtt ttctagggtt agttttgtct gttttctatt attggaagct tcgactagat   1500
aatcgtgatg gtgttctaaa tgaagcggga gctgaggtct actatctctg gaccagtttt   1560
gaaaatatgt tgcgtgagat tgcacgattg gatcaggctg aactggaaag tattgtggtc   1620
tggaatcgcc tcttggtcta tgcgacctta tttggctatg cggacaaggt tagtcatttg   1680
atgaaggttc atcagattca agtggaaaat ccagatatca atctctatgt agcttatggc   1740
tggcacagta cgttttatca ttcaacagca caaatgagcc attatgctag tgtcgcaaat   1800
acagcaagca cctactctgt atcttctgga agtggaagtt ctggtggtgg cttctctgga   1860
ggcggaggtg gcggcagtat cggtgccttt                                    1890
 
SeqID 23
atgaaatcaa tcaacaaatt tttaacaatg cttgctgcct tattactgac agcgagtagc     60
ctgttttcag ctgcaacagt ttttgcggct gggacgacaa caacatctgt taccgttcat    120
aaactattgg caacagatgg ggatatggat aaaattgcaa atgagttaga aacaggtaac    180
tatgctggta ataaagtggg tgttctacct gcaaatgcaa aagaaattgc cggtgttatg    240
ttcgtttgga caaatactaa taatgaaatt attgatgaaa atggccaaac tctaggagtg    300
aatattgatc cacaaacatt taaactctca ggggcaatgc cggcaactgc aatgaaaaaa    360
ttaacagaag ctgaaggagc taaatttaac acggcaaatt taccagctgc taagtataaa    420
atttatgaaa ttcacagttt atcaacttat gtcggtgaag atggagcaac cttaacaggt    480
tctaaagcag ttccaattga aattgaatta ccattgaacg atgttgtgga tgcgcatgtg    540
tatccaaaaa atacagaagc aaagccaaaa attgataaag atttcaaagg taaagcaaat    600
ccagatacac cacgtgtaga taaagataca cctgtgaacc accaagttgg agatgttgta    660
gagtacgaaa ttgttacaaa aattccagca cttgctaatt atgcaacagc aaactggagc    720
gatagaatga ctgaaggttt ggcattcaac aaaggtacag tgaaagtaac tgttgatgat    780
gttgcacttg aagcaggtga ttatgctcta acagaagtag caactggttt tgatttgaaa    840
ttaacagatg ctggtttagc taaagtgaat gaccaaaacg ctgaaaaaac tgtgaaaatc    900
acttattcgg caacattgaa tgacaaagca attgtagaag taccagaatc taatgatgta    960
acatttaact atggtaataa tccagatcac gggaatactc caaagccgaa taagccaaat   1020
gaaaacggcg atttgacatt gaccaagaca tgggttgatg ctacaggtgc accaattccg   1080
gctggagctg aagcaacgtt cgatttggtt aatgctcaga ctggtaaagt tgtacaaact   1140
gtaactttga caacagacaa aaatacagtt actgttaacg gattggataa aaatacagaa   1200
tataaattcg ttgaacgtag tataaaaggg tattcagcag attatcaaga aatcactaca   1260
gctggagaaa ttgctgtcaa gaactggaaa gacgaaaatc caaaaccact tgatccaaca   1320
gagccaaaag ttgttacata tggtaaaaag tttgtcaaag ttaatgataa agataatcgt   1380
ttagctgggg cagaatttgt aattgcaaat gctgataatg ctggtcaata tttagcacgt   1440
aaagcagata aagtgagtca agaagagaag cagttggttg ttacaacaaa ggatgcttta   1500
gatagagcag ttgctgctta taacgctctt actgcacaac aacaaactca gcaagaaaaa   1560
gagaaagttg acaaagctca agctgcttat aatgctgctg tgattgctgc caacaatgca   1620
tttgaatggg tggcagataa ggacaatgaa aatgttgtga aattagtttc tgatgcacaa   1680
ggtcgctttg aaattacagg ccttcttgca ggtacatatt acttagaaga aacaaaacag   1740
cctgctggtt atgcattact aactagccgt cagaaatttg aagtcactgc aacttcttat   1800
tcagcgactg gacaaggcat tgagtatact gctggttcag gtaaagatga cgctacaaaa   1860
gtagtcaaca aaaaaatcac tatcccacaa acgggtggta ttggtacaat tatctttgct   1920
gtagcggggg ctgcgattat gggtattgca gtgtacgcat atgttaaaaa caacaaagat   1980
gaggatcaac ttgct                                                    1995
 
SeqID 24
atggcggtaa tggcgtatcc gctggtgtct cgcttgtatt atcgagtgga atcaaatcaa     60
caaattgctg actttgataa ggaaaaagca acgttggatg aggctgacat tgatgaacga    120
atgaaattgg cacaagcctt caatgactct ttgaataatg tagtgagtgg cgatccttgg    180
tcggaagaaa tgaagaaaaa agggcgagca gagtatgcac gtatgttaga aatccatgag    240
cggatggggc atgtggaaat ccccgttatt gacgtggatt tgccggttta tgctggtact    300
gctgaagagg tattgcagca aggggctggg catctagagg gaacttctct gccgatcgga    360
ggcaattcga cccatgcggt gattacggca catacaggtt tgccaacagc taagatgttt    420
acggatttga ccaaacttaa agttggggat aagttttatg tgcacaatat caaggaagtg    480
atggcctatc aagtggatca agtaaaggtg attgagccga cgaactttga tgatttattg    540
attgtaccag gtcatgatta tgtgaccttg ctgacttgta cgccatacat gatcaatacc    600
catcgtctat tggttcgggg gcatcggata ccgtacgtag cagaggttga ggaagaattt    660
attgcagcaa acaaactcag tcatctctat cgctacctgt tttatgtggc agttggtttg    720
attgtgattc ttttatggat tattcgacgc ttgcgcaaga agaaaaaaca accggaaaag    780
gctttgaagg cgctgaaagc agcaaggaag gaagtgaagg tggaggatgg acaacag       837
 
SeqID 25
atgtcaagga ctaaactacg agccttattg ggatacttgt tgatgttggt agcctgtttg     60
attcctattt attgttttgg acagatggtg ttgcagtctc ttggacaggt gaaaggtcat    120
gctacatttg tgaaatccat gacaactgaa atgtaccaag aacaacagaa ccattctctc    180
gcctacaatc aacgcttggc ttcgcaaaat cgcattgtag atcctttttt ggcggaggga    240
tatgaggtca attaccaagt gtctgacgac cctgatgcag tctatggtta cttgtctatt    300
ccaagtttgg aaatcatgga gccggtttat ttgggagcag attatcatca tttagggatg    360
ggcttggctc atgtggatgg tacaccgctg cctctggatg gtacagggat tcgctcagtg    420
attgctgggc accgtgcaga gccaagccat gtctttttcc gccatttgga tcagctaaaa    480
gttggagatg ctctttatta tgataatggc caggaaattg tagaatatca gatgatggac    540
acagagatta ttttaccgtc ggaatgggaa aaattagaat cggttagctc taaaaatatc    600
atgaccttga taacctgcga tccgattcct acctttaata aacgcttatt agtgaatttt    660
gaacgagtcg ctgtttatca aaaatcagat ccacaaacag ctgcagttgc gagggttgct    720
tttacgaaag aaggacaatc tgtatcgcgt gttgcaacct ctcaatggtt gtaccgtggg    780
ctagtggtac tggcatttct gggaatcctg tttgttttgt ggaagctagc acgtttacta    840
cgagggaaa                                                            849
 
SeqID 26
atgaagaatc cattttttga aagacgttgt cgttacagta ttcgtaagtt atcagtagga     60
gcctgctcgc tgatgattgg tgctgtttta tttgctggtc cagccttggc tgaagaaact    120
gcagttcctg aaaatagcgg agctaataca gagcttgttt caggagagag tgagcattcg    180
accaatgaag ctgataagca gaatgaaggg gaacatgcta gagaaaacaa gctagaaaag    240
gcagaa9gag tagcgatagc atctgaaact gcttcgccag caagcaatga agctgcaact    300
actgaaactg cagaagcagc tagcgcagct aaaccagagg aaaaagcaag tgaggtggtt    360
gcagaaacac catctgcaga agcaaaacct aagtctgaca aggaaacaga agcaaagccc    420
gaagcaacta accaagggga tgagtctaaa ccagcagcag aagctaataa gactgaaaaa    480
gaagtccagc cagatgtccc taaaaataca gaaaaaacat taaaaccaaa ggaaatcaaa    540
tttaattctt gggaagaatt gttaaaatgg gaaccaggtg ctcgtgaaga tgatgctatt    600
aaccgcggat ctgttgtcct cgcttcacgt cggacaggtc atttagtcaa tgaaaaagct    660
agcaaggaag caaaagttca agccttatca aacaccaatt ctaaagcaaa agaccatgct    720
tctgttggtg gagaagagtt caaggcctat gcttttgact attggcaata tctagattca    780
atggtcttct gggaaggtct cgtaccaact cctgacgtta ttgatgcagg tcaccgtaac    840
ggggttcctg tatacggtac actcttcttc aactggtcta atagtattgc agatcaagaa    900
agatttgctg aagctttgaa gcaagacgca gatggtagct tcccaattgc ccgtaaattg    960
gtagacatgg ccaagtatta tggctatgat ggctatttca tcaaccaaga aacaactgga   1020
gatttggtta aacctcttgg agaaaagatg cgccagttta tgctctatag caaggaatat   1080
gctgctaagg taaaccatcc aatcaagtat tcttggtacg atgccatgac ctataactat    1140
ggacgttatc atcaagatgg tttgggagaa tacaactacc aattcatgca accagaagga    1200
gataaggttc cggcagataa cttctttgct aactttaact gggataaggc taaaaatgat    1260
tacactattg caactgccaa ctggattggt cgtaatcctt atgatgtatt tgcaggtttg    1320
gaattgcaac agggtggttc ctacaagaca aaggttaagt ggaatgacat tttagacgaa    1380
aatgggaaat tgcgcctttc tcttggttta tttgccccag ataccattac aagtttagga    1440
aaaactggtg aagattatca taaaaatgaa gatatcttct ttacaggtta tcaaggagac    1500
cctactggcc aaaaaccagg tgacaaagat tggtatggta ttgctaacct agttgcggac    1560
cgtacgccag cggtaggtaa tacttttact acttctttta atacaggtca tggtaaaaaa    1620
tggttcgtag atggtaaggt ttctaaggat tctgagtgga attatcgttc agtatcaggt    1680
gttcttccaa catggcgctg gtggcagact tcaacagggg aaaaacttcg tgcagaatat    1740
gattttacag atgcctataa tggcggaaat tcccttaaat tctctggtga tgtagccggt    1800
aagacagatc aggatgtgag actttattct actaagttag aagtaactga gaagaccaaa    1860
cttcgtgttg cccacaaggg aggaaaaggt tctaaagttt atatggcatt ctctacaact    1920
ccagactaca aattcgatga tgcagatgca tggaaagagc taaccctttc tgacaactgg    1980
acaaatgaag aatttgatct tagctcacta gcgggtaaaa ccatctatgc agtcaaacta    2040
tttttcgagc atgaaggtgc tgtaaaagat tatcagttta acctaggaca attaactatc    2100
tcggacaatc accaagagcc acaatcgccg acaagctttt ctgtagtgaa acaatctctt    2160
aaaaatgccc aagaagcgga agcagttgtg caatttaaag gcaacaagga tgcagatttc    2220
tatgaagttt atgaaaaaga tggagacagc tggaaattac taactggctc atcttctaca    2280
actatttatc taccaaaagt tagccgctca gcaagtgctc agggtacaac tcaagaactg    2340
aaggttgtag cagtcggtaa aaatggagtt cgttcagaag ctgcaaccac aacctttgat    2400
tggggtatga ctgtaaaaga taccagccta ccaaaaccac tagctgaaaa tatcgttcca    2460
ggtgcaacag ttattgatag tactttccct aagactgaag gtggagaagg tattgaaggt    2520
atgttgaacg gtaccattac tagcttgtca gataaatggt cttcagctca gttgagtggt    2580
agtgtggata ttcgtttgac caagccacgt accgttgtta gatgggtcat ggatcatgca    2640
ggagctggtg gtgagtctgt taacgatggc ttgatgaaca ctaaagactt tgacctttat    2700
tataaagatg cagatggtga gtggaagcta gctaaggaag tccgtggtaa caaagcacac    2760
gtgacagata tcactcttga taaaccaatc actgctcaag actggcgctt gaatgttgtc    2820
acttctgaca atggaactcc atggaaggct attcgtatct ataactggaa aatgtatgaa    2880
aagcttgata ctgagagtgt caatattccg atggccaagg ctgcagcccg ttctctaggc    2940
aataacaagg tacaagttgg ctttgcagat gtaccggctg gagcaactat taccgtttat    3000
gataatccaa attctcaaac tccgctcgca accttgaaga gcgaagttgg aggagaccta    3060
gcaagtgcac cattggattt gacaaatcaa tctggtcttc tttattatcg tacccagttg    3120
ccaggcaagg aaattagtaa tgtcctagca gtttccgttc caaaagatga cagaagaatc    3180
aagtcagtca gcctagaaac aggacctaag aaaacaagct acgccgaagg ggaggatttg    3240
gaccttagag gtggtgttct tcgagttcag tatgaaggag gaactgagga cgaactcatt    3300
cgcctaactc acgcaggtgt atcagtatca ggttttgata cgcatcataa gggagaacag    3360
aatcttactc tccaatattt gggacaaccg gtaaatgcta atttgtcagt gactgtcact    3420
ggccaagacg aagcaagtcc gaaaactatt ttgggaattg aagtaagtca ggaaccgaaa    3480
aaagattacc tagttggtga tagcttagac ttgtctgaag gacgctttgc agtggcttat    3540
agcaatgaca ccatggaaga acattccttt actgatgagg gagttgaaat ttctggttac    3600
gatgctcaaa agactggtcg tcaaaccttg acgcttcatt accaaggcca tgaagttagc    3660
tttgatgttt tggtatctcc aaaagcagca ttgaacgatg agtacctcaa acaaaaatta    3720
gcagaagttg aagctgctaa gaacaaggtg gtctataact ttgcttcatc agaagtaaaa    3780
gaagccttct tgaaagcaat tgaagcggcc gaacaagtgt tgaaagacca tgaaactagc    3840
acccaagatc aagtcaatga ccgacttaat aaattgacag aagctcataa agctctgaat    3900
ggtcaagaga aatttacgga agaaaagaca gagcttgatc gcttaacagg tgaggttcaa    3960
gaactcttgg ctgccaaacc aaaccatcct tcaggttctg ccctagctcc gcttcttgag    4020
aaaaacaagg ccttggttga aaaagtagat ttgagtccag aagagcttac aacagcgaaa    4080
cagagtctaa aagatctggt tgctttattg aaagaagaca agccagcagt cttttctgat    4140
agtaaaacag gtgttgaagt acacttctca aataaagaga agactgtcat caagggtttg    4200
aaagtagagc gtgttcaagc aagtgctgaa gagaagaaat actttgctgg agaagatgct    4260
catgtctttg aaatagaagg tttggatgaa aaaggtcaag atgttgatct ctcttatgct    4320
tctattgtga aaatcccaat tgaaaaagat aagaaagtta agaaagtatt tttcttacct    4380
gaaggcaaag aggcagtaga attggctttt gaacaaacgg atagtcatgt tatctttaca    4440
gcacctcact ttactcatta tgcctttgtt tatgaatctg ctgaaaaacc acaacctgct    4500
aaaccagcac cacaaaacac agtccttcca aaacctactt atcaaccgac ttctgatcaa    4560
caaaaggctc ctaaattgga agttcaagag gaaaaggttg cctttcatcg tcaagagcat    4620
gaaaatactg agatgctagt tggggaacaa cgagtcatca tacagggacg agatggactg    4680
ttaagacatg tctttgaagt tgatgaaaac ggtcagcgtc gtcttcgttc aacagaagtc    4740
atccaagaag cgattccaga aattgttgaa attggaacaa aagtaaaaac agtaccagca    4800
gtagtagcta cacaggaaaa accagctcaa aatacagcag ttaaatcaga agaagcaagc    4860
aaacaattgc caaatacagg aacagctgat gctaatgaag ccctaatagc aggcttagcc    4920
agccttggtc ttgctagttt agccttgacc ttgagacgga aaagagaaga taaagat       4977
 
SeqID 27
atgtcaatta catcatttgt aaaaagaatt caagatatca ctcgaaacga tgctggtgtt      60
aatggtgatg ctcaacgtat tgagcaaatg tcttggttat tattcttaaa aatttatgat    120
agccgtgaaa tggtttggga attagaagaa gacgagtatg agtcaattat cccagaggaa    180
ttaaaatggc gaaattgggc tcatgctcaa aatggggaac gggtattgac aggcgatgaa    240
ttacttgatt ttgtcaataa caagttattc aaagagttga aagagcttga aataacttca    300
aatatgccta ttcgaaaaac gattgttaaa tcagcttttg aagatgcgaa caactatatg    360
aaaaatggcg tcttgttacg ccaagtcatc aatgttattg atgaagttga tttcaatagc    420
cctgaagatc gtcattcgtt taatgatatt tacgaaaaaa ttcttaaaga tattcaaaat    480
gctgggaact caggagaatt ttatacgcca cgtgcagcga ctgattttat tgccgaagtt    540
cttgacccaa aacttggaga atcaatggca gaccttgctt gcggaacagg aggcttcttg    600
acttcgactc tgaaccgttt aagtagtcaa cgtaaaacta gtgaagatac caaaaaatat    660
aatacagctg tttttggtat tgaaaagaaa gcatttcctc atcttttagc agttacaaat    720
ctgtttcttc acgaaattga tgaccctaaa attgttcatg gaaatacttt ggagaaaaat    780
gttcgtgaat atacggatga tgaaaaattt gacattatta tgatgaatcc accttttgga    840
gggtcagaat tagaaacaat aaaaaataac tttccagcag aattacggag ttctgaaaca    900
gctgatttat ttatggctgt cattatgtat cgtttgaaag aaaatggtcg tgttggagtt    960
attttacctg atggttttct atttggtgaa ggtgtaaaaa ctcgcttgaa acaaaaactg   1020
gtagatgagt tcaacttgca tacgattatt aggttgcctc atagtgtctt tgcaccgtat   1080
acaggaatcc atacgaacat tcttttcttt gataaaacaa agaaaacaga agaaacttgg   1140
ttttatcgtt tagatatgcc agatggttat aaaaatttct cgaaaactaa gccgatgaag   1200
tcagaacact tcaatcctgt tcgtgactgg tgggaaaatc gtgaagagat tctggaaggt   1260
aagttctaca aatctaaatc atttacacct agtgaattgg ctgagttgaa ttataattta   1320
gaccagtgtg actttccaaa agaggaagag gaaatcttaa atccctttga gttgattcag   1380
aattatcaag cggaaagagc aactttaaat cataagattg ataatgtatt agctgatatt   1440
ttgcagttgt tggaggacaa a                                             1461
 
SeqID 28
atgaacaata ctgaatttta tgatcgtctg ggggtatcca aaaacgcttc ggcagacgaa     60
atcaaaaagg cttatcgtaa gctttccaaa aaatatcacc cagatatcaa caaggagcct    120
ggtgctgagg acaagtacaa ggaagttcaa gaagcctatg agactttgag tgacgaccaa    180
aaacgtgctg cctatgacca gtatggtgct gcaggcgcca atggtggttt tggtggagct    240
ggtggtttcg gcggtttcaa tggggcaggt ggcttcggtg gttttgagga tattttctca    300
agtttcttcg gcggaggcgg ttcttcgcgc aatccaaacg ctcctcgcca aggagatgat    360
ctccagtatc gtgtcaattt gacctttgaa gaagctatct tcggaactga gaaggaagtt    420
aagtatcatc gtgaagctgg ctgtcgtaca tgtaatggat ctggtgctaa gccagggaca    480
agtccagtca cttgtggacg ctgtcatggc gctggtgtca ttaacgtcga tacgcagact    540
cctcttggta tgatgcgtcg ccaagtaacc tgtgatgtct gtcacggtcg aggaaaagaa    600
atcaaatatc catgtacaac ctgtcatgga acaggtcatg agaaacaagc tcatagcgta    660
catgtgaaaa tccctgctgg tgtggaaaca ggtcaacaaa ttcgcctcgc tggtcaaggt    720
gaagcaggct ttaacggtgg accttatggt gacttgtatg tagtagtttc tgtggaagct    780
agcgacaagt ttgaacgtga aggaacgact atcttctaca atctcaacct caactttgtc    840
caagcggctc ttggtgatac agtagatatt ccaactgttc acggtgatgt tgaattggtt    900
attccagagg gaactcagac tggtaagaag ttccgcctac gtagtaaggg ggcaccgagc    960
cttcgtggcg gtgcagttgg tgaccaatac gttactgtta atgtcgtaac accgacaggc   1020
ttgaacgacc gccaaaaagt agccttgaaa gaattcgcgg ctgctggtga cttgaaagta   1080
aatccaaaga aaaaaggctt ctttgaccat attaaagatg cctttgatgg agaa         1134
 
SeqID 29
atgaatccta atctttttag aagcgtcgag ttttatcaga gacgttacca taactatgcg     60
acagtgttaa ttatacctct ttcattacta tttactttca tcttgatttt ctcccttgtt    120
gccacaaaag aaattactgt tacttcccaa ggagaaatcg cccctacaag tgtcattgcc    180
tccattcagt caaccagtga taatcctatc ctagctaatc atttagtggc aaatcaagta    240
gttgaaaaag gggacttact catcaaatac tctgaaacaa tggaagaaag tcagaaaact    300
gccttagcaa ctcaattaca aagacttgag aagcaaaaag aaggacttgg aattttgaaa    360
caaagcttag aaaaagcgac tgatcttttt tctggcgagg atgaatttgg ctaccataat    420
acctttatga attttactaa acaatcccat gatattgaac tgggtatcac aaagactaac    480
accgaagttt caaatcaagc taatctttcc aatagcagtt catcagctat tgaacaagaa    540
attacaaaag ttcaacaaca aattggagaa tatcaagagt tgagagatgc tatcataaat    600
aacagagcac gcttaccaaa tggcaatccg caccagtcaa ttttgaatcg ttatcttgta    660
gcctcacaag gacaaacaca aggaactgca gaggagccat ttttatctca aattaatcaa    720
agtattgcag gtcttgaatc atctatcgca agcctcaaaa ttcagcaagc tggtatcgga    780
agtgtagcaa cttatgataa cagtttagca accaaaattg aagtactccg cactcagttt    840
ttacagacag cctcacagca acaactaact gtggagaatc aattaacaga attaaaagta    900
caactagatc aagccacaca gcgtttggaa aacaatacct taacctcccc aagtaaaggt    960
atcgttcatc tgaacagcga atttgaaggt aaaaatagaa ttccaactgg tacagaaatt   1020
gctcaaatat tccctgtcat cacagataca agagaagtac taatcactta ctacgtatct   1080
tctgactatc tacctctact agataaagga caaactgtaa gattaaaact ggagaagatt   1140
ggaaatcacg gcaccaccat catcggccaa cttcagacaa ttgatcaaac tcctaccaga   1200
acagagcaag gaaatctctt taaattaacc gctcttgcaa aactatctaa cgaggatagt   1260
aaactcatcc aatatggctt acaaggtcgc gtcactagtg taactacaaa gaaaacatat   1320
tttgattatt tcaaagataa aattttaaca cattctgat                          1359
 
SeqID 30
atgtcaaaga aactcaatcg taaaaaacaa ttacgaaatg gcctccgtcg cgcaggtgcc     60
ttttcaagta cggtgactaa ggttgtagat gagacaaaaa aagtcgtgaa gcgtgcagaa    120
cagtcagcaa gcgcagctgg taaggctgtt tctaaaaaag ttgaacaagc agtagaagct    180
accaaagagc aagctcaaaa agtagctaat tctgtagaag attttgcagc aaatttgggt    240
ggacttccac ttgatcgtgc caagactttc tatgatgaag gaatcaagtc tgcttcagat    300
ttcaaaaact ggactgaaaa agaactcctt gccttgaaag gaatcggccc agctaccatc    360
aagaaattga aagaaaatgg catcaagttc aag                                 393
 
SeqID 31
ttgattagcc ttttcggcct tgctgctgcc aaaccagtcc aggctgatac aagtatcgca     60
gacattcaaa aaagaggcga actggttgtc ggtgtcaaac aagacgttcc caattttggt    120
tacaaagatc ccaagaccgg tacttattct ggtatcgaaa ccgacttggc caagatggta    180
gctgatgaac tcaaggtcaa gattcgctat gtgccggtta cagcacaaac ccgcggcccc    240
cttctagaca atgaacaggt cgatatggat atcgcgacct ttaccatcac ggacgaacgc    300
aaaaaactct acaactttac cagtccctac tacacagacg cttctggatt tttggtcaat    360
aaatctgcca aaatcaaaaa gattgaggac ctaaacggca aaaccatcgg agtcgcccaa    420
ggttctatca cccaacgcct gattactgaa ctgggtaaaa agaaaggtct gaagtttaaa    480
ttcgtcgaac ttggttccta cccagaattg attacttccc tgcacgctca tcgtatcgat    540
accttttccg ttgaccgctc tattctatct ggctacacta gtaaacggac agcactacta    600
gatgatagtt tcaagccatc tgactacggt attgttacca agaaatcaaa tacagagctc    660
aacgactatc ttgataactt ggttactaaa tggagcaagg atggtagttt gcagaaactt    720
tatgaccgtt acaagctcaa accatctagc catactgcag at                       762
 
SeqID 32
atgagtaata tcagtttaac aacacttggt ggtgtgcgtg agaatggaaa aaatatgtac     60
attgctgaaa ttggagagtc catttttgtt ttgaatgtag ggttaaaata tcctgaaaat    120
gaacaattag gggtcgatgt ggtgattcca aacatggatt acctttttga aaatagcgac    180
cgtattgctg gggttttctt gacccacggg catgcggatg ccattggtgc tctaccgtat    240
ctcttggcag aggctaaagt tcctgtattt gggtctgagt tgaccattga gttggcaaag    300
ctctttgtca aaggaaatga tgccgttaag aaatttaatg atttccatgt cattgatgag    360
aatacggaga ttgattttgg tgggacagtg gtttccttct tccctacgac ttactccgtt    420
ccagagagtc tgggaattgt cttgaagaca tcggaaggaa gcatcgttta tacaggtgac    480
ttcaaatttg accaaacggc tagtgaatct tatgcaactg attttgctcg tttggcagag    540
attggtcgtg acggcgtcct ggctctcctc agtgattcgg ccaatgcaga cagcaatatt    600
caggtggcta gtgaaagtga agttagggat gaaattaccc aaactattgc tgactgggaa    660
ggtcgtatca tcgttgcagc tgtttccagt aatctttctc gtattcagca gatttttgac    720
gctgcggata aaacaggtcg acgtatcgtc ttgacaggat ttgatattga aaatatcgtc    780
cgcacagcga ttcgtcttaa gaagttgtct ttagccaacg aaattctttt gattaagcct    840
aaagatatgt ctcgctttga agaccatgag ttgattattc ttgagacagg tcgtatgggt    900
gagcctatca atggacttcg taagatgtcg attggtcgcc atcgttatgt agaaatcaag    960
gatggggacc tagtctatat tgctacggct ccgtctattg ctaaagaagc ctttgttgcg   1020
cgtgtggaaa atatgattta tcaggcaggt ggggttgtca aattgattac ccaaagttta   1080
catgtatcag ggcacggaaa tgtgcgtgat ttgcagctga tgatcaatct tttgcaacct   1140
aagtacctct tccctgtcca aggggagtat cgtgagttgg atgctcacgc taaggctgcc   1200
atggcagttg ggatgttgcc agaacgcatc ttcattccta aaaaggggac gaccatggct   1260
tacgagaatg gagactttgt tccagctgga tcggtttcag caggagatat cttgattgat   1320
gggaatgcca ttggtgatgt tggaaatgtt gttcttcgtg accgtaaggt cttgtcagag   1380
gatggaattt tcatcgtggc tattacagtc aaccgtcgtg agaagaaaat tgtggctagg   1440
gctcgtgttc acacgcgtgg atttgtttat ctcaagaaga gtcgcgatat tctccgtgaa   1500
agttcagaat tgattaacca aacggtagaa gagtatcttc aaggagatga ctttgactgg   1560
gcagatctca aaggtaaggt tcgtgacaat ctgaccaagt acctctttga tcaaaccaag   1620
cgtcgcccag ccattttacc agtagtcatg gaagcaaaa                          1659
 
SeqID 33
atgaaaaaaa gtacagtatt gtcattaacc acagctgcag ttattttagc agcctatgcc     60
cctaatgagg tagtcttagc agacacatct agctctgaag atgctttaaa catctctgat    120
aaagaaaaag tagcagaaaa taaagagaaa catgaaaata tccatagtgc tatggaaact    180
tcacaggatt ttaaagagaa gaaaacagca gtcattaagg aaaaagaagt tgttagtaaa    240
aatcctgtga tagacaataa cactagcaat gaagaagcaa aaatcaaaga agaaaattcc    300
aataaatccc aaggagatta tacggactca tttgtgaata aaaacacaga aaatcccaaa    360
aaagaagata aagttgtcta tattgctgaa tttaaagata aagaatctgg agaaaaagca    420
atcaaggaac tatccagtct taagaataca aaagttttat atacttatga tagaattttt    480
aacggtagtg ccatagaaac aactccagat aacttggaca aaattaaaca aatagaaggt    540
atttcatcgg ttgaaagggc acaaaaagtc caacccatga tgaatcatgc cagaaaggaa    600
attggagttg aggaagctat tgattaccta aagtctatca atgctccgtt tgggaaaaat     660
tttgatggta gaggtatggt catttcaaat atcgatactg gaacagatta tagacataag     720
gctatgagaa tcgatgatga tgccaaagcc tcaatgagat ttaaaaaaga agacttaaaa     780
ggcactgata aaaattattg gttgagtgat aaaatccctc atgcgttcaa ttattataat     840
ggtggcaaaa tcactgtaga aaaatatgat gatggaaggg attattttga cccacatggg     900
atgcatattg cagggattct tgctggaaat gatactgaac aagacatcaa aaactttaac     960
ggcatagatg gaattgcacc taatgcacaa attttctctt acaaaatgta ttctgacgca    1020
ggatctgggt ttgcgggtga tgaaacaatg tttcatgcta ttgaagattctatcaaacac     1080
aacgttgatg ttgtttcggt atcatctggt tttacaggaa caggtcttgt aggtgagaaa    1140
tattggcaag ctattcgggc attaagaaaa gcaggcattc caatggttgt cgctacgggt    1200
aactatgcga cttctgcttc aagttcttca tgggatttag tagcaaataa tcatctgaaa    1260
atgaccgaca ctggaaatgt aacacgaact gcagcacatg aagatgcgat agcggtcgct    1320
tctgctaaaa atcaaacagt tgagtttgat aaagttaaca taggtggaga aagttttaaa    1380
tacagaaata taggggcctt tttcgataag agtaaaatca caacaaatga agatggaaca    1440
aaagctccta gtaaattaaa atttgtatat ataggcaagg ggcaagacca agatttgata    1500
ggtttggatc ttaggggcaa aattgcagta atggatagaa tttatacaaa ggatttaaaa    1560
aatgctttta aaaaagctat ggataagggt gcacgcgcca ttatggttgt aaatactgta    1620
aattactaca atagagataa ttggacagag cttccagcta tgggatatga agcggatgaa    1680
ggtactaaaa gtcaagtgtt ttcaatttca ggagatgatg gtgtaaagct atggaacatg    1740
attaatcctg ataaaaaaac tgaagtcaaa agaaataata aagaagattt taaagataaa    1800
ttggagcaat actatccaat tgatatggaa agttttaatt ccaacaaacc gaatgtaggt    1860
gacgaaaaag agattgactt taagtttgca cctgacacag acaaagaact ctataaagaa    1920
gatatcatcg ttccagcagg atctacatct tgggggccaa gaatagattt acttttaaaa    1980
cccgatgttt cagcacctgg taaaaatatt aaatccacgc ttaatgttat taatggcaaa    2040
tcaacttatg gctatatgtc aggaactagt atggcgactc caatcgtggc agcttctact    2100
gttttgatta gaccgaaatt aaaggaaatg cttgaaagac ctgtattgaa aaatcttaag    2160
ggagatgaca aaatagatct tacaagtctt acaaaaattg ccctacaaaa tactgcgcga    2220
cctatgatgg atgcaacttc ttggaaagaa aaaagtcaat actttgcatc acctagacaa    2280
cagggagcag gcctaattaa tgtggccaat gctttgagaa atgaagttgt agcaactttc    2340
aaaaacactg attctaaagg tttggtaaac tcatatggtt ccatttctct taaagaaata    2400
aaaggtgata aaaaatactt tacaatcaag cttcacaata catcaaacag acctttgact    2460
tttaaagttt cagcatcagc gataactaca gattctctaa ctgacagatt aaaacttgat    2520
gaaacatata aagatgaaaa atctccagat ggtaagcaaa ttgttccaga aattcaccca    2580
gaaaaagtca aaggagcaaa tatcacattt gagcatgata ctttcactat aggcgcaaat    2640
tctagctttg atttgaatgc ggttataaat gttggagagg ccaaaaacaa aaataaattt    2700
gtagaatcat ttattcattt tgagtcagtg gaagaaatgg aagctctaaa ctccaacggg    2760
aagaaaataa acttccaacc ttctttgtcg atgcctctaa tgggatttgc tgggaattgg    2820
aaccacgaac caatccttga taaatgggct tgggaagaag ggtcaagatc aaaaacactg    2880
ggaggttatg atgatgatgg taaaccgaaa attccaggaa ccttaaataa gggaattggt    2940
ggagaacatg gtatagataa atttaatcca gcaggagtta tacaaaatag aaaagataaa    3000
aatacaacat ccctggatca aaatccagaa ttatttgctt tcaataacga agggatcaac    3060
gctccatcat caagtggttc taagattgct aacatttatc ctttagattc aaatggaaat    3120
cctcaagatg ctcaacttga aagaggatta acaccttctc cacttgtatt aagaagtgca    3180
gaagaaggat tgatttcaat agtaaataca aataaagagg gagaaaatca aagagactta    3240
aaagtcattt cgagagaaca ctttattaga ggaattttaa attctaaaag caatgatgca    3300
aagggaatca aatcatctaa actaaaagtt tggggtgact tgaagtggga tggactcatc    3360
tataatccta gaggtagaga agaaaatgca ccagaaagta aggataatca agatcctgct    3420
actaagataa gaggtcaatt tgaaccgatt gcggaaggtc aatatttcta taaatttaaa    3480
tatagattaa ctaaagatta cccatggcag gtttcctata ttcctgtaaa aattgataac    3540
accgccccta agattgtttc ggttgatttt tcaaatcctg aaaaaattaa gttgattaca    3600
aaggatactt atcataaggt aaaagatcag tataagaatg aaacgctatt tgcgagagat    3660
caaaaagaac atcctgaaaa atttgacgag attgcgaacg aagtttggta tgctggcgcc    3720
gctcttgtta atgaagatgg agaggttgaa aaaaatcttg aagtaactta cgcaggtgag    3780
ggtcaaggaa gaaatagaaa acttgataaa gacggaaata ccatttatga aattaaaggt    3840
gcgggagatt taaggggaaa aatcattgaa gtcattgcat tagatggttc tagcaatttc    3900
acaaagattc atagaattaa atttgctaat caggctgatg aaaaggggat gatttcctat    3960
tatctagtag atcctgatca agattcatct aaatatcaaa agcttggcga gattgcagaa    4020
tctaaattta aaaatttagg aaatggaaaa gagggtagtc taaaaaaaga tacaactggg    4080
gtagaacatc atcatcaaga aaatgaagag tctattaaag aaaaatctag ttttactatt    4140
gatagaaata tttcaacaat tagagacttt gaaaataaag acttaaagaa actcattaaa    4200
aagaaattta gagaagttga tgattttaca agtgaaactg gtaagagaat ggaggaatac    4260
gattataaat acgatgataa aggaaatata atagcctacg atgatgggac tgatctagaa    4320
tatgaaactg agaaacttga cgaaatcaaa tcaaaaattt atggtgttct aagtccgtct    4380
aaagatggac actttgaaat tcttggaaag ataagtaatg tttctaaaaa tgccaaggta    4440
tattatggga ataactataa atctatagaa atcaaagcga ccaagtatga tttccactca    4500
aaaacgatga catttgatct atacgctaat attaatgata ttgtggatgg attagctttt    4560
gcaggagata tgagattatt tgttaaagat aatgatcaga aaaaagctga aattaaaatt    4620
agaatgcctg aaaaaattaa ggaaactaaa tcagaatatc cctatgtatc aagttatggg    4680
aatgtcatag aattagggga aggagatctt tcaaaaaaca aaccagacaa tttaactaaa    4740
atggaatctg gtaaaatcta ttctgattca gaaaaacaac aatatctgtt aaaggataat    4800
atcattctaa gaaaaggcta tgcactaaaa gtgactacct ataatcctgg aaaaacggat    4860
atgttagaag gaaatggagt ctatagcaag gaagatatag caaaaataca aaaggccaat    4920
cctaatctaa gagccctttc agaaacaaca atttatgctg atagtagaaa tgttgaagat    4980
ggaagaagta cccaatctgt attaatgtcg gctttggacg gctttaacat tataaggtat    5040
caagtgttta catttaaaat gaacgataaa ggggaagcta tcgataaaga cggaaatctt    5100
gtgacagatt cttctaaact tgtattattt ggtaaggatg ataaagaata cactggagag    5160
gataagttca atgtagaagc tataaaagaa gatggctcca tgttatttat tgataccaaa    5220
ccagtaaacc tttcaatgga taagaactac tttaatccat ctaaatctaa taaaatttat    5280
gtacgaaatc cagaatttta tttaagaggt aagatttctg ataagggtgg ttttaactgg    5340
gaattgagag ttaatgaatc ggttgtagat aattatttaa tctacggaga tttacacatt    5400
gataacacta gagattttaa tattaagctg aatgttaaag acggtgacat catggactgg    5460
ggaatgaaag actataaagc aaacggattt ccagataagg taacagatat ggatggaaat    5520
gtttatcttc aaactggcta tagcgatttg aatgctaaag cagttggagt ccactatcag    5580
tttttatatg ataatgttaa acccgaagta aacattgatc ctaagggaaa tactagtatc    5640
gaatatgctg atggaaaatc tgtagtcttt aacatcaatg ataaaagaaa taatggattc    5700
gatggtgaga ttcaagaaca acatatttat ataaatggaa aagaatatac atcatttaat    5760
gatattaaac aaataataga caagacacta aacattaaga ttgttgtaaa agattttgca    5820
agaaatacaa ccgtaaaaga attcatttta aataaagata cgggagaggt aagtgaatta    5880
aaacctcata gggtaactgt gaccattcaa aatggaaaag aaatgagttc aacgatagtg    5940
tcggaagaag attttatttt acctgtttat aagggtgaat tagaaaaagg ataccaattt    6000
gatggttggg aaatttctgg tttcgaaggt aaaaaagacg ctggctatgt tattaatcta    6060
tcaaaagata cctttataaa acctgtattc aagaaaatag aggagaaaaa ggaggaagaa    6120
aataaaccta cttttgatgt atcgaaaaag aaagataacc cacaagtaaa ccatagtcaa    6180
ttaaatgaaa gtcacagaaa agaggattta caaagagaag agcattcaca aaaatctgat    6240
tcaactaagg atgttacagc tacagttctt gataaaaaca atatcagtag taaatcaact    6300
actaacaatc ctaataagtt gccaaaaact ggaacagcaa gcggagccca gacactatta    6360
gctgccggaa taatgtttat agtaggaatt tttcttggat tgaagaaaaa aaatcaagat    6420
 
SeqID 34
atggggaaag gccattggaa tcggaaaaga gtttatagca ttcgtaagtt tgctgtggga      60
gcttgctcag taatgattgg gacttgtgca gttttattag gaggaaatat agctggagaa     120
tctgtagttt atgcggatga aacacttatt actcatactg ctgagaaacc taaagaggaa     180
aaaatgatag tagaagaaaa ggctgataaa gctttggaaa ctaaaaatat agttgaaagg     240
acagaacaaa gtgaacctag ttcaactgag gctattgcat ctgagaagaa agaagatgaa     300
gccgtaactc caaaagagga aaaagtgtct gctaaaccgg aagaaaaagc tccaaggata     360
gaatcacaag cttcaaatca agaaaaaccg ctcaaggaag atgctaaagc tgtaacaaat     420
gaagaagtga atcaaatgat tgaagacagg aaagtggatt ttaatcaaaa ttggtacttt     480
aaactcaatg caaattctaa ggaagccatt aaacctgatg cagacgtatc tacgtggaaa     540
aaattagatt taccgtatga ctggagtatc tttaacgatt tcgatcatga atctcctgca     600
caaaatgaag gtggacagct caacggtggg gaagcttggt atcgcaagac tttcaaacta     660
gatgaaaaag acctcaagaa aaatgttcgc cttacttttg atggcgtcta catggattct     720
caagtttatg tcaatggtca gttagtgggg cattatccaa atggttataa ccagttctca     780
tatgatatca ccaaatacct tcaaaaagat ggtcgtgaga atgtgattgc tgtccatgca     840
gtcaacaaac agccaagtag ccgttggtat tcaggaagtg gtatctatcg tgatgtgact     900
ttacaagtga cagataaggt gcatgttgag aaaaatggga caactatttt aacaccaaaa     960
cttgaagaac aacaacatgg caaggttgaa actcatgtga ccagcaaaat cgtcaatacg    1020
gacgacaaag accatgaact tgtagccgaa tatcaaatcg ttgaacgagg tggtcatgct    1080
gtaacaggct tagttcgtac agcgagtcgt accttaaaag cacatgaatc aacaagccta    1140
gatgcgattt tagaagttga aagaccaaaa ctctggactg ttttaaatga caaacctgcc    1200
ttgtacgaat tgattacgcg tgtttaccgt gacggtcaat tggttgatgc taagaaggat    1260
ttgtttggtt accgttacta tcactggact ccaaatgaag gtttctcttt gaatggtgaa    1320
cgtattaaat tccatggagt atccttgcac cacgaccatg gggcgcttgg agcagaagaa    1380
aactataaag cagaatatcg ccgtctcaaa caaatgaagg agatgggagt taactccatc    1440
cgtacaaccc acaaccctgc tagtgagcaa accttgcaaa tcgcagcaga actaggttta    1500
atcgttcagg aagaggcctt tgatacgtgg tatggtggca agaaacctta tgactatgga    1560
cgtttctttg aaaaagatgc cactcaccca gaagctcgaa aaggtgaaaa atggtctgat    1620
tttgacctac gtaccatggt cgaaagaggc aaaaacaacc ctgctatctt catgtggtca    1680
attggtaatg aaataggtga agctaatggt gatgcccact ctttagcaac tgttaaacgt    1740
ttggttaagg ttatcaagga tgttgataag actcgctatg ttaccatggg agcagataaa    1800
ttccgtttcg gtaatggtag cggagggcat gagaaaattg ctgatgaact cgatgctgtt    1860
ggatttaact attctgaaga taattacaaa gcccttagag ctaagcatcc aaaatggttg    1920
atttatggat cagaaacatc ttcagctacc cgtacacgtg gaagttacta tcgccctgaa    1980
cgtgaattga aacatagcaa tggacctgag cgtaattatg aacagtcaga ttatggaaat    2040
gatcgtgtgg gttgggggaa aacagcaacc gcttcatgga cttttgaccg tgacaacgct    2100
ggctatgctg gacagtttat ctggacaggt acggactata ttggtgaacc tacaccatgg    2160
cacaaccaaa atcaaactcc tgttaagagc tcttactttg gtatcgtaga tacagccggc    2220
attccaaaac atgacttcta tctctaccaa agccaatggg tttctgttaa gaagaaaccg    2280
atggtacacc ttcttcctca ctggaactgg gaaaacaaag aattagcatc caaagtagct    2340
gactcagaag gtaagattcc agttcgtgct tattcgaatg cttctagtgt agaattgttc    2400
ttgaatggaa aatctcttgg tcttaagact ttcaataaaa aacaaaccag cgatgggcgg    2460
acttaccaag aaggtgcaaa tgctaatgaa ctttatcttg aatggaaagt tgcctatcaa    2520
ccaggtacct tggaagcaat tgctcgtgat gaatctggca aggaaattgc tcgagataag    2580
attacgactg ctggtaagcc agcggcagtt cgtcttatta aggaagacca tgcgattgca    2640
gcagatggaa aagacttgac ttacatctac tatgaaattg ttgacagcca ggggaatgtg    2700
gttccaactg ctaataatct ggttcgcttc caattgcatg gccaaggtca actggtcggt    2760
gtagataacg gagaacaagc cagccgtgaa cgctataagg cgcaagcaga tggttcttgg    2820
attcgtaaag catttaatgg taaaggtgtt gccattgtca aatcaactga acaagcaggg    2880
aaattcaccc tgactgccca ctctgatctc ttgaaatcga accaagtcac tgtctttact    2940
ggtaagaaag aaggacaaga gaagactgtt ttggggacag aagtgccaaa agtacagacc    3000
attattggag aggcacctga aatgcctacc actgttccgt ttgtatacag tgatggtagc    3060
cgtgcagaac gtcctgtaac ctggtcttca gtagatgtga gcaagcctgg tattgtaacg    3120
gtgaaaggta tggctgacgg acgagaagta gaagctcgtg tagaagtgat tgctcttaaa    3180
tcagagctac cagttgtgaa acgtattgct ccaaatactg acttgaattc tgtagacaaa    3240
tctgtttcct atgttttgat tgatggaagt gttgaagagt atgaagtgga caagtgggag    3300
attgccgaag aagataaagc taagttagca attccaggtt ctcgtattca agcgaccggt    3360
tatttagaag gtcaaccaat tcatgcaacc cttgtggtag aagaaggcaa tcctgcggca    3420
cctgcagtac caactgtaac ggttggtggt gaggcagtaa caggtcttac tagtcaaaaa    3480
ccaatgcaat accgcactct tgcttatgga gctaagttgc cagaagtcac agcaagtgct    3540
aaaaatgcag ctgttacagt tcttcaagca agcgcagcaa acggcatgcg tgcgagcatc    3600
tttattcagc ctaaagatgg tggccctctt caaacctatg caattcaatt ccttgaagaa    3660
gcgccaaaaa ttgctcactt gagcttgcaa gtggaaaaag ctgacagtct caaagaagac    3720
caaactgtca aattgtcggt tcgagctcac tatcaagatg gaacgcaagc tgtattacca    3780
gctgataaag taaccttctc tacaagtggt gaaggggaag tcgcaattcg taaaggaatg    3840
cttgagttgc ataagccagg agcagtcact ctgaacgctg aatatgaggg agctaaagac    3900
caagttgaac tcactatcca agccaatact gagaagaaga ttgcgcaatc catccgtcct    3960
gtaaatgtag tgacagattt gcatcaggaa ccaagtcttc cagcaacagt aacagttgag    4020
tatgacaaag gtttccctaa aactcataaa gtcacttggc aagctattcc gaaagaaaaa    4080
ctagactcct atcaaacatt tgaagtacta ggtaaagttg aaggaattga ccttgaagcg    4140
cgtgcaaaag tctctgtaga aggtatcgtt tcagttgaag aagtcagtgt gacaactcca    4200
atcgcagaag caccacaatt accagaaagt gttcggacat atgattcaaa tggtcacgtt    4260
tcatcagcta aggttgcatg ggatgcgatt cgtccagagc aatacgctaa ggaaggtgtc    4320
tttacagtta atggtcgctt agaaggtacg caattaacaa ctaaacttca tgttcgcgta    4380
tctgctcaaa ctgagcaagg tgcaaacatt tctgaccaat ggaccggttc agaattgcca    4440
cttgcctttg cttcagactc aaatccaagc gacccagttt caaatgttaa tgacaagctc    4500
atttcctaca ataaccaacc agccaatcgt tggacaaact ggaatcgtac taatccagaa    4560
gcttcagtcg gtgttctgtt tggagattca ggtatcttga gcaaacgctc cgttgataat    4620
ctaagtgtcg gattccatga agaccatgga gttggtgtac cgaagtctta tgtgattgag    4680
tattatgttg gtaagactgt cccaacagct cctaaaaacc ctagttttgt tggtaatgag    4740
gaccatgtct ttaatgattc tgccaactgg aaaccagtta ctaatctaaa agcccctgct    4800
caactcaagg ctggagaaat gaaccacttt agctttgata aagttgaaac ctatgctgtt    4860
cgtattcgca tggttaaagc agataacaag cgtggaacgt ctatcacaga ggtacaaatc    4920
tttgcgaaac aagttgcggc agccaagcaa ggacaaacaa gaatccaagt tgacggcaaa    4980
gacttagcaa acttcaaccc tgatttgaca gactactacc ttgagtctgt agatggaaaa    5040
gttccggcag tcacagcaag tgttagcaac aatggtctcg ctaccgtcgt tccaagcgtt    5100
cgtgaaggtg agccagttcg tgtcatcgcg aaagctgaaa atggcgacat cttaggagaa    5160
taccgtctgc acttcactaa ggataagagc ttactttctc ataaaccagt tgctgcggtt    5220
aaacaagctc gcttgctaca agtaggtcaa gcacttgaat tgccgactaa ggttccagtt    5280
tacttcacag gtaaagacgg ctacgaaaca aaagacctga cagttgaatg ggaagaagtt    5340
ccagcggaaa atctgacaaa agcaggtcaa tttactgttc gaggccgtgt ccttggtagt    5400
aaccttgttg ctgagatcac tgtacgagtg acagacaaac ttggtgagac tctttcagat    5460
aaccctaact atgatgaaaa cagtaaccag gcctttgctt cagcaaccaa tgatattgac    5520
aaaaactctc atgaccgcgt tgactatctc aatgacggag atcattcaga aaatcgtcgt    5580
tggacaaact ggtcaccaac accatcttct aatccagaag tatcagcggg tgtgattttc    5640
cgtgaaaatg gtaagattgt agaacggact gttacacaag gaaaagttca gttctttgca    5700
gatagtggta cggatgcacc atctaaactc gttttagaac gctatgtcgg tccagagttt    5760
gaagtgccaa cctactattc aaactaccaa gcctacgacg cagaccatcc attcaacaat    5820
ccagaaaatt gggaagctgt tccttatcgt gcggataaag acattgcagc tggtgatgaa    5880
atcaacgtaa catttaaagc tatcaaagcc aaagctatga gatggcgtat ggagcgtaaa    5940
gcagataaga gcggtgttgc gatgattgag atgaccttcc ttgcaccaag tgaattgcct    6000
caagaaagca ctcaatcaaa gattcttgta gatggaaaag aacttgctga tttcgctgaa    6060
aatcgtcaag actatcaaat tacctataaa ggtcaacggc caaaagtctc agttgaagaa    6120
aacaatcaag tagcttcaac tgtggtagat agtggagaag atagctttcc agtacttgtt    6180
cgcctcgttt cagaaagtgg aaaacaagtc aaggaatacc gtatccactt gactaaggaa    6240
aaaccagttt ctgagaagac agttgctgct gtacaagaag atcttccaaa aatcgaattt    6300
gttgaaaaag atttggcata caagacagtt gagaaaaaag attcaacact gtatctaggt    6360
gaaactcgtg tagaacaaga aggaaaagtt ggaaaagaac gtatctttac agcgattaat    6420
cctgatggaa gtaaggaaga aaaactccgt gaagtggtag aagttccgac agaccgcatc    6480
gtcttggttg gaaccaaacc agtagctcaa gaagctaaaa aaccacaagt gtcagaaaaa    6540
gcagatacaa aaccaattga ttcaagtgaa gctagtcaaa ctaataaagc ccagttacca    6600
agtacaggta gtgcggcaag ccaagcagca gtagcagcag gtttaactct tctaggtttg    6660
agtgcaggat tagtagttac taaaggtaaa aaagaagac                           6699
 
SeqID 35
atggctcctt ctgtagtgga cgcagccacc tatcactatg taaataaaga gattatttca      60
caagaagcta aagatttaat tcagacagga aagcctgaca ggaatgaagt tgtatatggt     120
ttggtgtatc aaaaagatca gttgcctcaa acagggacag aagcatctgt tttgacagct     180
tttggtttgc tgactgttgg gagcttgctt ttaatctaca agagaaagaa aattgctagc     240
gtctttctag ttggagctat gggattggta gttcttccta gtgcaggggc tgtagaccca     300
gttgcgaccc tagcgctggc tagtcgagag ggtgttgttg aaatggaggg ctatcgctat     360
gttggttatc tatcaggtga catcctcaaa acgcttggct tggacactgt tttagaagaa     420
acctcagcaa aacctggaga ggtgactgtg gtcgaagttg agactcctca atcaataaca     480
aatcaggagc aagctaggac agaaaaccaa gtagtagaga cagaggaagc tccaaaagaa     540
gaagcaccta aaacagaaga aagtccaaag gaagaaccaa aatcggaggt aaaacctact     600
gacgacaccc ttcctaaagt agaagagggg aaagaagatt cagcagaacc agctccagtt     660
gaagaagtag gtggagaagt tgagtcaaaa ccagaggaaa aagtagcagt taagccagaa     720
agtcaaccat cagacaaacc agctgaggaa tcaaaagttg aacaagcagg tgaaccagtc     780
gcgccaagag aagacgaaaa ggcaccagtc gagccagaaa agcaaccaga agctcctgaa     840
gaagagaagg ctgtagagga aacaccgaaa caagaagagt caactccaga taccaaggct     900
gaagaaactg tagaaccaaa agaggagact gttaatcaat ctattgaaca accaaaagtt     960
gaaacgcctg ctgtagaaaa acaaacagaa ccaacagagg aaccaaaagt tgaacaagca    1020
ggtgaaccag tcgcgccaag agaagacgaa caggcaccaa cggcaccagt tgagccagaa    1080
aagcaaccag aagttcctga agaagagaag gctgtagagg aaacaccgaa accagaagat    1140
aaaataaagg gtattggtac taaagaacca gttgataaaa gtgagttaaa taatcaaatt    1200
gataaagcta gttcagtttc tcctactgat tattctacag caagttacaa tgctcttgga    1260
cctgttttag aaactgcaaa aggtgtctat gcttcagagc ctgtaaaaca gcctgaggta    1320
aatagcgaga caaataaact taaaacggct attgacgctc taaacgttga taaaactgaa    1380
ttaaacaata cgattgcaga tgcaaaaaca aaggtaaaag aacattacag tgatagaagt    1440
tggcaaaacc tccaaactga agttacaaag gctgaaaaag ttgcagctaa tacagatgct    1500
aaacaaagtg aagttaacga agctgttgaa aaattaactg caactattga aaaattggtt    1560
gaattatatg aaaagccaat attaacattg actagtaccg ataagaaaat attggaacgt    1620
gaagctgttg ctaagtatac tctagaaaat caaaacaaaa caaaaatcaa atcaatcaca    1680
gctgaattga aaaaaggaga agaagttatt aatactgtag tccttacaga tgacaaggta    1740
acaacagaaa ctataagcgc tgcatttaag aacctagagt actacaaaga atacacccta    1800
tctacaacta tgatttacga cagaggtaac ggtgaagaaa ctgaaactct agaaaatcaa    1860
aatattcaat tagatcttaa aaaagttgag cttaaaaata ttaaacgtac agatttaatc    1920
aaatacgaaa atggaaaaga aactaatgaa tcactgataa caactattcc tgatgataag    1980
agcaattatt atttaaaaat aacttcaaat aatcagaaaa ctacattact agctgttaaa    2040
aatatagaag aaactacggt taacggaaca cctgtatata aagttacagc aatcgcagac    2100
aatttagtct ctagaactgc tgataataaa tttgaagaag aatacgttca ctatattgaa    2160
aaacctaaag tccacgaaga taatgtatat tataatttca aagaattagt ggaagctatt    2220
caaaacgatc cttcaaaaga atatcgtctg ggacaatcaa tgagcgctag aaatgttgtt    2280
cctaatggaa aatcatatat cactaaagaa ttcacaggaa aacttttaag ttctgaagga    2340
aaacaatttg ctattactga attggaacat ccattattta atgtgataac aaacgcaacg    2400
ataaataatg tgaattttga aaatgtagag atagaacgtt ctggtcaaga taatattgca    2460
tcattagcca atactatgaa aggttcttca gttattacaa atgtcaaaat tacaggcaca    2520
ctttcaggtc gtaataatgt tgctggattt gtaaataata tgaatgatgg aactcgtatt    2580
gaaaatgttg ctttctttgg caaactacac tctacaagtg gaaatggctc tcatacaggg    2640
ggaattgcag gtacaaacta tagaggaatt gttagaaaag catatgttga tgctactatt    2700
acaggaaaca aaacacgcgc cagcttgtta gttcctaaag tagattatgg attaactcta    2760
gaccatctta ttggtacaaa agctctccta actgagtcgg ttgtaaaagg taaaatagat    2820
gtttcaaatc cagtagaagt tggagcaata gcaagtaaga cttggcctgt aggtacggta    2880
agtaattctg tcagctatgc taagattatc cgtggagagg agttattcgg ctctaacgac    2940
gttgatgatt ctgattatgc tagtgctcat ataaaagatt tatatgcggt agagggatat    3000
tcgtcaggta atagatcatt taggaaatct aaaacattta ctaaattaac taaagaacaa    3060
gctgatgcta aagttactac tttcaatatt actgctgata aattagaaag tgatctatct    3120
cctcttgcaa aacttaatga agaaaaagcc tattctagta ttcaagatta taacgctgaa    3180
tataaccaag cctataaaaa tcttgaaaaa ttaataccat tctacaataa agattatatt    3240
gtatatcaag gtaataaatt aaataaagaa caccatctaa atactaaaga agttctttct    3300
gttaccgcga tgaacaacaa tgagtttatc acaaacctag atgaagctaa taaaattatt    3360
gttcactatg cggacggtac aaaagattac tttaacttgt cttctagcag tgaaggttta    3420
agtaatgtaa aagaatatac tataactgac ttaggaatta aatatacacc taatatcgtt    3480
caaaaagata acactactct tgttaatgat ataaaatcta ttttagaatc agtagagctt    3540
cagtctcaaa cgatgtatca gcatctaaat cgattaggtg actatagagt taatgcaatc    3600
aaagatttat atttagaaga aagcttcaca gatgttaaag aaaacttaac aaacctaatc    3660
acaaaattag ttcaaaacga agaacatcaa ctaaatgatt ctccagctgc tcgtcaaatg    3720
attcgtgata aagtcgagaa aaacaaagca gctttattac taggtttaac ttacctaaat    3780
cgttactatg gagttaaatt tggtgatgtt aatattaaag aattaatgct attcaaacca    3840
gatttctatg gtgaaaaagt tagcgtatta gacagattaa ttgaaatcgg ttctaaagag    3900
aacaacatta aaggttcacg tacattcgac gcattcggtc aagtattggc taaatatact    3960
aaatcaggta atttagatgc atttttaaat tataatagac aattgttcac aaatatagac    4020
aatatgaacg attggtttat tgatgctaca gaagaccatg tctacatcgc agaacgcgct    4080
tctgaggtcg aagaaattaa aaattctaaa catcgtgcat tcgataattt aaaacgaagt    4140
caccttagaa atactatact cccactactg aatattgata aagcacatct ttatttaatt    4200
tcaaattata atgcaattgc ctttggtagt gcagagcgat taggtaaaaa atcattagaa    4260
gatattaaag atatcgttaa caaagctgca gatggttata gaaactatta tgatttctgg    4320
tatcgtctag cgtctgataa cgttaaacaa cgactactaa gagatgctgt tattcctatt    4380
tgggaaggtt ataacgctcc tggtggatgg gttgaaaaat atggccgcta taataccgac    4440
aaagtatata ctcctcttag agaattcttt ggtcctatgg ataagtatta taattataat    4500
ggaacaggag cttatgctgc tatatatcct aactctgatg atattagaac tgatgtaaaa    4560
tatgttcatt tagaaatggt tggtgaatac ggtatttcag tttacacaca tgaaacaaca    4620
cacgtcaacg accgtgcgat ttacttaggt ggctttggac accgtgaagg tactgatgct    4680
gaagcatatg ctcagggtat gctacaaact cctgttactg gtagtggatt tgatgagttt    4740
ggttctttag gtattaatat ggtatttaaa cgcaaaaatg atgggaatca gtggtatatt    4800
acagatccaa aaactctaaa aacacgagaa gatattaata gatatatgaa gggttataat    4860
gacactttaa ctcttcttga tgaaattgag gctgaatctg tgatttctca acaaaataaa    4920
gatttaaata gtgcatggtt caaaaaaata gatagagaat accgtgataa caataaatta    4980
aatcaatggg ataaaattcg aaatctaagt caagaagaga aaaatgaatt aaatattcaa    5040
tctgttaatg atttagttga tcaacaatta atgactaatc gcaatccagg taatggtatc    5100
tataaacccg aagcaattag ctataacgat caatcacctt atgtaggtgt tagaatgatg    5160
accggtatct acggaggtaa tactagtaaa ggtgctcctg gagctgtttc attcaaacat    5220
aatgctttta gattatgggg ttactacgga tacgaaaatg ggttcttagg ttatgcttca    5280
aataaatata aacaacaatc taaaacagat ggtgagtctg ttctaagtga tgaatatatt    5340
atcaagaaaa tatctaacaa tacatttaat actattgaag aatttaaaaa agcttacttc    5400
aaagaagtta aagataaagc aacgaaagga ttaacaacat tcgaagtaaa tggttcttcc    5460
gtttcatcat acgatgattt actgacattg tttaaagaag ctgttaaaaa agatgccgaa    5520
actcttaaac aagaagcaaa cggtaataaa acagtatcta tgaataatac agttaaatta    5580
aaagaagctg tttataagaa acttcttcaa caaacaaata gctttaaaac ttcaatcttt    5640
aaa                                                                  5643
 
SeqID 36
atgaataaac gtctattttc aaaaatgagt ctggtgacgt tgccaatttt agccttgttt      60
tcacaatcag ttttggcgga agaaaacatc catttttcga gctgtaagga agcttgggcg     120
aatggctatt cggatattca cgagggagaa cctggttatt ctgccaagtt agaccgtgat     180
catgatggtg tggcttgcga attgaaaaat gctcctaagg gtgcttttaa agcaaaacag     240
tcaacggcta ttcaaatcaa cacaagttca gcaacaacaa gtggttgggt taagcaggac     300
ggcgcttggt actactttga tggaaatgga aatctagtga aaaatgcatg gcagggaagc     360
tattacctga aagctgatgg taaaatggca cagagtgaat ggatttatga ctcttcttat     420
caagcttggt attatttgaa atcagatggt tcttatgcaa aaaatgcatg gcaaggagct     480
tattacctta aatcaaacgg taaaatggca caaggtgagt gggtttatga ttcttcttac     540
caagcatggt attacttgaa atcagatggt tcatatgctc gcaatgcatg gcaaggaaac     600
tactatttga aatcagatgg taaaatggct aaaggtgaat gggtttatga tgccacctat     660
caagcttggt attatttgac atcagatggt tcttatgctt acagtacatg gcaaggaaat     720
tactatctaa aatcggatgg taaaatggct gtcaatgaat gggttgatgg tggacgttat     780
tatgttggcg ctgacggagt ttggaaggaa gttcaagcaa gtacagcttc ttctagtaat     840
gatagcaata gtgaatattc tgctgcttta ggaaaggcaa aaagttataa ttcgttattc     900
cacatgtcaa aaaaacgtat gtatagacaa ttaacttctg attttgataa attttcaaat     960
gatgcagctc aatatgccat tgatcattta gatgat                               996
 
SeqID 37
atgaaagtaa tagatcaatt taaaaataag aaagtccttg ttttaggttt ggccaagtct      60
ggtgaatctg cagctcgttt gttggacaag ctaggtgcca ttgtgacagt aaatgatggg     120
aaacctttcg aggacaatcc agctgcccaa agtttgctgg aagaagggat caaggtcatt     180
acaggtggcc atcctttgga actcttggat gaagagtttg cccttatggt gaaaaatcca     240
ggtatcccct acaacaatac catgattgaa aaggctttgg ccaagggaat tccagtcttg     300
actgaggtgg aattggctta tttgatttca gaagcaccga ttattggtat cacaggatcg     360
aacggtaaga caaccacaac gactatgatt ggggaagttt tgactgctgc tggccaacat     420
ggtcttttat cagggaatat cggctatcca gctagtcagg ttgctcaaat agcatcagat     480
aaggacacgc ttgttatgga actttcttct ttccaactca tgggtgttca agaattccat     540
ccagagattg cggttattac caacctcatg ccaactcata tcgactacca tgggtcattt     600
tcggaatatg tagcagccaa gtggaatatc cagaacaaga tgacagcagc tgatttcctt     660
gtcttgaact ttaatcaaga cttggcaaaa gacttgactt ccaagacaga agccactgtt    720
gtaccatttt caacacttga aaaggttgat ggagcttatc tggaagatgg tcaactctac    780
ttccgtggtg aagtagtcat ggcagcgaat gaaatcggtg ttccaggtag ccacaatgtg    840
gaaaatgccc ttgcgactat tgctgtagcc aagcttcgtg atgtggacaa tcaaaccatc    900
aaggaaactc tttcagcctt cggtggtgtc aaacaccgtc tccagtttgt ggatgacatc    960
aagggtgtta aattctataa cgacagtaaa tcaactaata tcttggctac tcaaaaagcc   1020
ttgtcaggat ttgacaacag caaggtcgtc ttgattgcag gtggtttgga ccgtggcaat   1080
gagtttgacg aattggtgcc agacattact ggactcaaga agatggtcat cctgggtcaa   1140
tctgcagaac gtgtcaaacg ggcagcagac aaggctggtg tcgcttatgt ggaggcgaca   1200
gatattgcag atgcgacccg caaggcctat gagcttgcga ctcaaggaga tgtggttctt   1260
cttagtcctg ccaatgctag ctgggatatg tatgctaact ttgaagtacg tggcgacctc   1320
tttatcgaca cagtagcgga gttaaaagaa                                    1350
 
SeqID 38
atgaagaaaa aatttgccct atcgtttgtg gcgcttgcaa gtgtagcact tcttgcagcc     60
tgtggagaag tgaagtctgg agcagtcaac actgctggta actcagtaga ggaaaagaca    120
attaaaatcg ggtttaactt tgaagaatca ggttctttag ctgcatacgg aacagctgaa    180
caaaaaggtg cccaattggc tgttgatgaa atcaatgccg caggtggtat cgatggaaaa    240
caaatcgaag tagtcgataa agataataag tctgaaacag ctgaggctgc ttcagttaca    300
actaaccttg taacccaatc taaagtatca gcagtcgtag gacctgcgac atctggtgcg    360
actgcagctg cggtagcgaa cgctacaaaa gcaggtgttc cattgatctc accaagtgcg    420
actcaagatg gattgactaa aggtcaagat tacctcttta ttggaacttt ccaagatagc    480
ttccaaggaa aaattatctc aaactatgtt tctgaaaaat taaatgctaa gaaagttgtt    540
ctttacactg acaatgccag tgactatgct aaagggattg caaaatcttt ccgcgagtca    600
tacaagggtg aaatcgttgc agatgaaact ttcgtagcag gtgacacaga cttccaagca    660
gcccttacaa aaatgaaagg gaaagacttt gatgctatcg ttgttcctgg ttactataat    720
gaggctggta aaattgtaaa ccaagcgcgt ggcatgggaa ttgacaaacc aatcgttggt    780
ggtgatggat tcaacggtga ggagtttgta caacaagcaa ctgctgaaaa agcatcaaac    840
atctacttta tctcaggctt ctcaactact gtagaagttt cagctaaagc taaagccttc    900
cttgacgctt accgtgctaa gtacaatgaa gagccttcaa catttgcagc cttggcttat    960
gattcagttc accttgtagc aaacgcagca aaaggtgcta aaaattcagg tgaaatcaag   1020
aataaccttg ctaaaacaaa agattttgaa ggtgtaactg gtcaaacaag cttcgatgca   1080
gaccacaaca cagtcaaaac tgcttacatg atgaccatga acaatggtaa agttgaagca   1140
gcagaagttg taaaacca                                                 1158
 
SeqID 39
atgagtattt tagaagttaa aaatctgagt cacggttttg gtgaccgtgc aatttttgaa     60
gatgtgtcct tccgtctcct caagggagaa catatcggcc tggtcggtgc caatggtgaa    120
ggaaaatcaa cctttatgag tatcgtgact ggtaaaatgc tgccagatga aggaaaggtt    180
gagtggtcca aatatgtgac ggctggttac ttggatcagc actctgtcct tgctgaaaga    240
cagtcggtgc gtgatgttct ccgtacggct tttgatgagc ttttcaaagc tgaagctcgt    300
atcaatgacc tctatatgaa aatggctgaa gacggcgcgg atgttgatgc tctcatggaa    360
gaagtaggag aacttcaaga ccgtctggag agtcgtgatt tctatacctt ggatgctaag    420
attgacgaag tagcgcgtgc tcttggtgtt atggactttg gcatggatac ggatgtaact    480
tctttgtcag gtgggcaaag aaccaaggtg cttttggcaa aacttctcct tgaaaagcct    540
gatatcttgc tgttggacga gccgaccaac tacttggatg ctgagcatat tgattggctc    600
aagcgctatc tccaaaacta tgagaatgcc tttgttctca tttcgcacga tattccattc    660
ctcaatgacg ttattaatat tgtctatcat gtggaaaatc aacagctgac gcgttactct    720
ggtgactact accagttcca agaagtttat gctatgaaga aatctcagct agaggcagcc    780
tacgaacgcc agcagaaaga gattgcagac ctcaaggact ttgtggctcg taataaagcc    840
cgtgttgcaa ctcgtaatat ggctatgtct cgtcaaaaga aattggataa gatggatatt    900
atcgaactcc aaagtgagaa accaaaacca tcctttgatt tcaaaccagc tcgtacacca    960
gggcgcttta tcttccaagc caagaacttg caaattggtt acgaccgtcc tcttactaag   1020
cctttaaatc ttaccttcga acgcaatcaa aaggttgcga ttattggtgc taatggtatt   1080
ggaaaaacaa ctctcttgaa gagtctcttg ggcattatct cgccaatcgc tggggaagtg   1140
gagcgtggag attatttaga acttggttat tttgagcagg aagtagaagg cggtaatcgc   1200
caaactcctc ttgaagctgt ctggaatgcc tttcctgccc ttaatcaagc agaagtccgt   1260
gcagcccttg cccgttgtgg tttgacaacc aaacatattg aaagccagat tcaagtatta   1320
tcagggggag agcaagccaa ggttcgtttc tgtctcttga tgaatcgtga aaacaacgtt   1380
ttagtgctgg acgagccgac caaccatttg gatgtggatg caaaggatga gctcaaacgc   1440
gctctcaaag aatatagggg atctatcctt atggtctgcc acgagccaga cttttatgaa   1500
ggctggatag accaaatatg ggattttaat aatttaact                          1539
 
SeqID 40
atgaagaaaa agaatggtaa agctaaaaag tggcaactgt atgcagcaat cggtgctgcg     60
agtgtagttg tattgggtgc tggggggatt ttactcttta gacaaccttc tcagactgct    120
ctaaaagatg agcctactca tcttgttgtt gccaaggaag gaagcgtggc ctcctctgtt    180
ttattgtcag ggacagtaac agcaaaaaat gaacaatatg tttattttga tgctagtaag    240
ggtgatttag atgaaatcct tgtttctgtg ggcgataagg tcagcgaagg gcaggcttta    300
gtcaagtaca gtagttcaga agcgcaggcg gcctatgatt cagctagtcg agcagtagct    360
agggcagatc gtcatatcaa tgaactcaat caagcacgaa atgaagccgc ttcagctccg    420
gctccacagt taccagcgcc agtaggagga gaagatgcaa cggtgcaaag cccaactcca    480
gtggctggaa attctgttgc ttctattgac gctcaattgg gtgatgcccg tgatgcgcgt    540
gcagatgctg cggcgcaatt aagcaaggct caaagtcaat tggatgcaac aactgttctc    600
agtaccctag agggaactgt ggtcgaagtc aatagcaatg tttctaaatc tccaacaggg    660
gcgagtcaag ttatggttca tattgtcagc aatgaaaatt tacaagtcaa gggagaattg    720
tctgagtaca atctagccaa cctttctgta ggtcaagaag taagctttac ttctaaagtg    780
tatcctgata aaaaatggac tgggaaatta agctatattt ctgactatcc taaaaacaat    840
ggtgaagcag ctagtccagc agccgggaat aatacaggtt ctaaataccc ttatactatt    900
gatgtgacag gcgaggttgg tgatttgaaa caaggttttt ctgtcaacat tgaggttaaa    960
agcaaaacta aggctattct tgttcctgtt agcagtctag taatggatga tagtaaaaat   1020
tatgtctgga ttgtggatga acaacaaaag gctaaaaaag ttgaggtttc attgggaaat   1080
gctgacgcag aaaatcaaga aatcacttct ggtttaacga acggtgctaa ggtcatcagt   1140
aatccaacat cttccttgga agaaggaaaa gaggtgaagg ctgatgaagc aactaat      1197
 
SeqID 41
tcagaaacaa atcacgaaat tgattcaaat tttgcaggtc gtttaaatat cctgcgtgcg     60
ggtgttcttg atgctaacga tggaattatt tccattgctg gtgtggttat cggagttgcc    120
agtgccacga ccaatatctg gattatcttt ttatcaggtt ttacggctat cttagctggt    180
gccttttcaa tggctggtgg agaatatgta tccgtttcaa ctccaaaaga taccgaggaa    240
gctgccgttt cgcgagaaaa actcttgcta gaccaagata gggaactagc caaaaaatcc    300
ctctatgctg cttatatcca aaatggagaa ttcaaaactt ctgcccaact cttgaccaat    360
aagatctttc ttaaaaatcc actcaaggct ctggtagagg aaaaatatgg gattgagtat    420
gaagaattta ccaatccttg gcacgctgcc atttctagct tcgttgcctt tttccttaga    480
agtttgcctc caatgctgtc agtgaccatt tttccaagtg attaccgcat ccctgctacc    540
gtccttattg tcggtgtggc ccttcttctc actggttaca caagtgctag acttggaaaa    600
gccccaacca aaacagctat gattcggaac cttgctattg gtctcttgac catgggagtt    660
accttcctgc tcggacaact tttcagcatt                                     690
 
SeqID 42
atgaaaaaga aattaactag tttagcactt gtaggcgctt ttttaggttt gtcatggtat     60
gggaatgttc aggctcaaga aagttcagga aataaaatcc actttatcaa tgttcaagaa    120
ggtggcagtg atgcgattat tcttgaaagc aatggacatt ttgccatggt ggatacagga    180
gaagattatg atttcccaga tggaagtgat tctcgctatc catggagaga aggaattgaa    240
acgtcttata agcatgttct aacagaccgt gtctttcgtc gtttgaagga attgggtgtc    300
caaaaacttg attttatttt ggtgacccat acccacagtg atcatattgg aaatgttgat    360
gaattactgt ctacctatcc agttgaccga gtctatctta agaaatatag tgatagtcgt    420
attactaatt ctgaacgtct atgggataat ctgtatggct atgataaggt tttacagact    480
gctgcagaaa aaggtgtttc agttattcaa aatatcacac aaggggatgc tcattttcag    540
tttggggaca tggatattca gctctataat tatgaaaatg aaactgattc atcgggtgaa    600
ttaaagaaaa tttgggatga caattccaat tccttgatta gcgtggtgaa agtcaatggc    660
aagaaaattt accttggggg cgatttagat aatgttcatg gagcagaaga caagtatggt    720
cctctcattg gaaaagttga tttgatgaag tttaatcatc accatgatac caacaaatca    780
aataccaagg atttcattaa aaatttgagt ccgagtttga ttgttcaaac ttcggatagt    840
ctaccttgga aaaatggtgt tgatagtgag tatgttaatt ggctcaaaga acgaggaatt    900
gagagaatca acgcagccag caaagactat gatgcaacag tttttgatat tcgaaaagac    960
ggttttgtca atatttcaac atcctacaag ccgattccaa gttttcaagc tggttggcat   1020
aagagtgcat atgggaactg gtggtatcaa gcgcctgatt ctacaggaga gtatgctgtc   1080
ggttggaatg aaatcgaagg tgaatggtat tactttaacc aaacgggtat cttgttacag   1140
aatcaatgga aaaaatggaa caatcattgg ttctatttga cagactctgg tgcttctgct   1200
aaaaattgga agaaaatcgc tggaatctgg tattatttta acaaagaaaa ccagatggaa   1260
attggttgga ttcaagataa agagcagtgg tattatttgg atgttgatgg ttctatgaag   1320
acaggatggc ttcaatatat ggggcaatgg tattactttg ctccatcagg ggaaatgaaa   1380
atgggctggg taaaagataa agaaacctgg tactatatgg attctactgg tgtcatgaag   1440
acaggtgaga tagaagttgc tggtcaacat tattatctgg aagattcagg agctatgaag   1500
caaggctggc ataaaaaggc aaatgattgg tatttctaca agacagacgg ttcacgagct   1560
gtgggttgga tcaaggacaa ggataaatgg tacttcttga aagaaaatgg tcaattactt   1620
gtgaacggta agacaccaga aggttatact gtggattcaa gtggtgcctg gttagtggat   1680
gtttcgatcg agaaatctgc tacaattaaa actacaagtc attcagaaat aaaagaatcc   1740
aaagaagtag tgaaaaagga tcttgaaaat aaagaaacga gtcaacatga aagtgttaca   1800
aatttttcaa ctagtcaaga tttgacatcc tcaacttcac aaagctctga aacgagtgta   1860
aacaaatcgg aatcagaaca g                                             1881
 
SeqID 43
atggacttag gtcccaccca aagaggtatt agtgtcgtgt ctcaatctta tatcaatgtt     60
atcggtgctg gtttggcagg ttctgaagca gcttaccaaa tcgcagagcg tggtattcca    120
gttaaactat atgaaatgcg tggtgtcaag tctacacccc agcataaaac agacaatttt    180
gctgagttgg tttgttccaa ttctttgcgt ggggatgctt tgacaaatgc agttggtctt    240
ctcaaggaag aaatgcgtcg cttgggttct gttatcttgg aatctgctga ggctacacgt    300
gttcctgcag gtggtgccct tgcagtggac cgtgatggtt tctctcaaat ggtgaccgaa    360
aaagttgcca accacccctt gattgaagtg gttcgtgatg aaattacaga attgccgaca    420
gatgttatta cggttatcgc tactggtcct ttgacaagtg atgccttggc tgaaaagatt    480
catgctctta atgacggtgc tggtttttat ttctacgatg cggcagcgcc tattatcgat    540
gtcaacacta tcgatatgag caaggtctac ctcaaatcac gttatgataa gggagaagcg    600
gcctacctca atgcccctat gaccaagcaa gaatttatgg atttccatga agctttggtc    660
aatgcagaag aagcaccgct tagttctttt gaaaaagaaa agtactttga aggatgtatg    720
cctatcgaag tcatggccaa acgtggcatt aaaactatgc tttatggccc tatgaagcca    780
gtcggtcttg agtacccaga cgactataca ggacctcgtg atggagaatt taaaacacct    840
tatgcggttg tgcaacttcg tcaggataat gcagctggta gcctctacaa tattgttggt    900
ttccagaccc acctcaaatg gggagaacaa aagcgtgtct tccaaatgat tccgggtctt    960
gaaaatgcgg agtttgtccg ttatggtgtg atgcatcgca attcttacat ggattcacca   1020
aatcttcttg agcagactta ccgttctaag aaacaaccaa atctcttctt tgctggtcaa   1080
atgacgggtg tggaaggcta tgttgagtcg gcggcttcag gcttagttgc gggaattaac   1140
gcagctcgtc tcttcaagga agaaagcgag gctattttcc ccgagacgac agcgattgga   1200
agcttagctc attacattac ccatgccgac agcaaacatt tccaaccaat gaatgtcaat   1260
tttgggatca tcaaggagtt ggaaggcgag cgtatccgtg ataagaaggc tcgttatgaa   1320
aaaattgcag agcgtgccct tgccgactta gaggaatttt tgactgtc                1368
 
SeqID 44
atgttaatcg gaatcccaaa agaaattaaa aataacgaaa accgtgtcgc cctcacacct     60
gcaggtgttc atagcttagt tagtcgtggt catcgtgtcc ttatcgaaac aaatgctggt    120
ctcggttctg gctttactga tgctgactat caaaagcaag gagctgagat tgtcgctact    180
gctggtgaag cttgggcagc agagttggtt gtgaaagtaa aagaatcttt aagttctgaa    240
tacggttact tgcgcgacga tcttcttctc ttcacctact tgcacatggc cgctgctcca    300
gaattagcag atgctatgtt aacagcaaaa acaactgaaa ctgttcgtga caatcaagga    360
caactaccgc tcctcgttcc tatgagtgag gttgcaggtc gtatggctgt tcaaatcgga    420
gctcacttcc ttactaagca agctggtggc tctggtgttc tacttggtgg tgtaccaggt    480
gttccaaaag gaaaagtaac tatcatcggt ggtggtgtcg tcggtacaca tgctgcccgc    540
atcgcccttg gtcttggtgc tcaagtgact attttagata ttagttccaa gcgtctctca    600
gttctagaag aagtctttgg aagtcaaatt caaactctta tgtctaattc attcaacatt    660
gaagcaagtg tgagagatgc tgatgtggtg attggagcca ttctcatccc tggtgcaaaa    720
gcaccggaat tggtgacaga tgagatggtc aaacaaatgc gtccaggctc tgtatcgttg    780
acgttgctgt tgaccaaggt ggcgttatcg aaacagctga ccgtgtgaca acgcacgatg    840
aacccgtcta tgaaaaacac ggtgttctcc actatgccgt tgccaatatc cctggtgcgg    900
ttgctcgcac ttcaaccatc gccctaacca atgtcactct tccttatatc gaagctttgg    960
ctggcaaagg attcgcacaa gcaatctctg aagatgaagg cttgcgtcaa ggtgtgacta   1020
cttatcaagg ttacttgact aacctaccag ttgctcaagg acttaatcgt gactacactg   1080
atatcaatga tttagta                                                  1097
 
SeqID 45
atgaaaatta ataaaaaata tctagcaggt tcagtggcag tccttgccct aagtgtttgt     60
tcctatgaac ttggtcgtca ccaagctggt caggttaaga aagagtctaa tcgagtttct    120
tatatagatg gtgatcaggc tggtcaaaag gcagaaaact tgacaccaga tgaagtcagt    180
aagagggagg ggatcaacgc cgaacaaatc gtcatcaaga ttacggatca aggttatgtg    240
acctctcatg gagaccatta tcattactat aatggcaagg tcccttatga tgccatcatc    300
agtgaagagc tcctcatgaa agatccgaat tatcagttga aggattcaga cattgtcaat    360
gaaatcaagg gtggttatgt tatcaaggta gatggaaaat actatgttta ccttaaggat    420
gcagctcatg cggataatat tcggacaaaa gaagagatta aacgtcagaa gcaggaacac    480
agtcataatc acgggggtgg ttctaacgat caagcagtag ttgcagccag agcccaagga    540
cgctatacaa cggatgatgg ttatatcttc aatgcatctg atatcattga ggacacgggt    600
gatgcttata tcgttcctca cggcgaccat taccattaca ttcctaagaa tgagttatca    660
gctagcgagt tagctgctgc agaagcctat tggaatggga agcagggatc tcgtccttct    720
tcaagttcta gttataatgc aaatccagct caaccaagat tgtcagagaa ccacaatctg    780
actgtcactc caacttatca tcaaaatcaa ggggaaaaca tttcaagcct tttacgtgaa    840
ttgtatgcta aacccttatc agaacgccat gtggaatctg atggccttat tttcgaccca    900
gcgcaaatca caagtcgaac cgccagaggt gtagctgtcc ctcatggtaa ccattaccac    960
tttatccctt atgaacaaat gtctgaattg gaaaaacgaa ttgctcgtat tattcccctt   1020
cgttatcgtt caaaccattg ggtaccagat tcaagaccag aacaaccaag tccacaatcg   1080
actccggaac ctagtccaag tccgcaacct gcaccaaatc ctcaaccagc tccaagcaat   1140
ccaattgatg agaaattggt caaagaagct gttcgaaaag taggcgatgg ttatgtcttt   1200
gaggagaatg gagtttctcg ttatatccca gccaaggatc tttcagcaga aacagcagca   1260
ggcattgata gcaaactggc caagcaggaa agtttatctc ataagctagg agctaagaaa   1320
actgacctcc catctagtga tcgagaattt tacaataagg cttatgactt actagcaaga   1380
attcaccaag atttacttga taataaaggt cgacaagttg attttgaggc tttggataac   1440
ctgttggaac gactcaagga tgtcccaagt gataaagtca agttagtgga tgatattctt    1500
gccttcttag ctccgattcg tcatccagaa cgtttaggaa aaccaaatgc gcaaattacc    1560
tacactgatg atgagattca agtagccaag ttggcaggca agtacacaac agaagacggt    1620
tatatctttg atcctcgtga tataaccagt gatgaggggg atgcctatgt aactccacat    1680
atgacccata gccactggat taaaaaagat agtttgtctg aagctgagag agcggcagcc    1740
caggcttatg ctaaagagaa aggtttgacc cctccttcga cagaccatca ggattcagga    1800
aatactgagg caaaaggagc agaagctatc tacaaccgcg tgaaagcagc taagaaggtg    1860
ccacttgatc gtatgcctta caatcttcaa tatactgtag aagtcaaaaa cggtagttta    1920
atcatacctc attatgacca ttaccataac atcaaatttg agtggtttga cgaaggcctt    1980
tatgaggcac ctaaggggta tactcttgag gatcttttgg cgactgtcaa gtactatgtc    2040
gaacatccaa acgaacgtcc gcattcagat aatggttttg gtaacgctag cgaccatgtt    2100
cgtaaaaata aggtagacca agacagtaaa cctgatgaag ataaggaaca tgatgaagta    2160
agtgagccaa ctcaccctga atctgatgaa aaagagaatc acgctggttt aaatccttca    2220
gcagataatc tttataaacc aagcactgat acggaagaga cagaggaaga agctgaagat    2280
accacagatg aggctgaaat tcctcaagta gagaattctg ttattaacgc taagatagca    2340
gatgcggagg ccttgctaga aaaagtaaca gatcctagta ttagacaaaa tgctatggag    2400
acattgactg gtctaaaaag tagtcttctt ctcggaacga aagataataa cactatttca    2460
gcagaagtag atagtctctt ggctttgtta aaagaaagtc aaccggctcc tatacag       2517
 
SeqID 46
atgaaattta gtaaaaaata tatagcagct ggatcagctg ttatcgtatc cttgagtcta      60
tgtgcctatg cactaaacca gcatcgttcg caggaaaata aggacaataa tcgtgtctct     120
tatgtggatg gcagccagtc aagtcagaaa agtgaaaact tgacaccaga ccaggttagc     180
cagaaagaag gaattcaggc tgagcaaatt gtaatcaaaa ttacagatca gggctatgta     240
acgtcacacg gtgaccacta tcattactat aatgggaaag ttccttatga tgccctcttt     300
agtgaagaac tcttgatgaa ggatccaaac tatcaactta aagacgctga tattgtcaat     360
gaagtcaagg gtggttatat catcaaggtc gatggaaaat attatgtcta cctgaaagat     420
gcagctcatg ctgataatgt tcgaactaaa gatgaaatca atcgtcaaaa acaagaacat     480
gtcaaagata atgagaaggt taactctaat gttgctgtag caaggtctca gggacgatat     540
acgacaaatg atggttatgt ctttaatcca gctgatatta tcgaagatac gggtaatgct     600
tatatcgttc ctcatggagg tcactatcac tacattccca aaagcgattt atctgctagt     660
gaattagcag cagctaaagc acatctggct ggaaaaaata tgcaaccgag tcagttaagc     720
tattcttcaa cagctagtga caataacacg caatctgtag caaaaggatc aactagcaag     780
ccagcaaata aatctgaaaa tctccagagt cttttgaagg aactctatga ttcacctagc     840
gcccaacgtt acagtgaatc agatggcctg gtctttgacc ctgctaagat tatcagtcgt     900
acaccaaatg gagttgcgat tccgcatggc gaccattacc actttattcc ttacagcaag     960
ctttctgcct tagaagaaaa gattgccaga atggtgccta tcagtggaac tggttctaca    1020
gtttctacaa atgcaaaacc taatgaagta gtgtctagtc taggcagtct ttcaagcaat    1080
ccttcttctt taacgacaag taaggagctc tcttcagcat ctgatggtta tatttttaat    1140
ccaaaagata tcgttgaaga aacggctaca gcttatattg taagacatgg tgatcatttc    1200
cattacattc caaaatcaaa tcaaattggg caaccgactc ttccaaacaa tagtctagca    1260
acaccttctc catctcttcc aatcaatcca ggaacttcac atgagaaaca tgaagaagat    1320
ggatacggat ttgatgctaa tcgtattatc gctgaagatg aatcaggttt tgtcatgagt    1380
cacggagacc acaatcatta tttcttcaag aaggacttga cagaagagca aattaaggct    1440
gcgcaaaaac atttagagga agttaaaact agtcataatg gattagattc tttgtcatct    1500
catgaacagg attatccaag taatgccaaa gaaatgaaag atttagataa aaaaatcgaa    1560
gaaaaaattg ctggcattat gaaacaatat ggtgtcaaac gtgaaagtat tgtcgtgaat    1620
aaagaaaaaa atgcgattat ttatccgcat ggagatcacc atcatgcaga tccgattgat    1680
gaacataaac cggttggaat tggtcattct cacagtaact atgaactgtt taaacccgaa    1740
gaaggagttg ctaaaaaaga agggaataaa gtttatactg gagaagaatt aacgaatgtt    1800
gttaatttgt taaaaaatag tacgtttaat aatcaaaact ttactctagc caatggtcaa    1860
aaacgcgttt cttttagttt tccgcctgaa ttggagaaaa aattaggtat caatatgcta    1920
gtaaaattaa taacaccaga tggaaaagta ttggagaaag tatctggtaa agtatttgga    1980
gaaggagtag ggaatattgc aaactttgaa ttagatcaac cttatttacc aggacaaaca    2040
tttaagtata ctatcgcttc aaaagattat ccagaagtaa gttatgatgg tacatttaca    2100
gttccaacct ctttagctta caaaatggcc agtcaaacga ttttctatcc tttccatgca    2160
ggggatactt atttaagagt gaaccctcaa tttgcagtgc ctaaaggaac tgatgcttta    2220
gtcagagtgt ttgatgaatt tcatggaaat gcttatttag aaaataacta taaagttggt    2280
gaaatcaaat taccgattcc gaaattaaac caaggaacaa ccagaacggc cggaaataaa    2340
attcctgtaa ccttcatggc aaatgcttat ttggacaatc aatcgactta tattgtggaa    2400
gtacctatct tggaaaaaga aaatcaaact gataaaccaa gtattctacc acaatttaaa    2460
aggaataaag cacaagaaaa cttaaaactt gatgaaaagg tagaagaacc aaagactagt    2520
gagaaggtag aaaaagaaaa actttctgaa actgggaata gtactagtaa ttcaacgtta    2580
gaagaagttc ctacagtgga tcctgtacaa gaaaaagtag caaaatttgc tgaaagttat    2640
gggatgaagc tagaaaatgt cttgtttaat atggacggaa caattgaatt atatttacca    2700
tcgggagaag tcattaaaaa gaatatggca gattttacag gagaagcacc tcaaggaaat    2760
ggtgaaaata aaccatctga aaatggaaaa gtatctactg gaacagttga gaaccaacca    2820
acagaaaata aaccagcaga ttctttacca gaggcaccaa acgaaaaacc tgtaaaacca    2880
gaaaactcaa cggataatgg aatgttgaat ccagaaggga atgtggggag tgaccctatg    2940
ttagatccag cattagagga agctccagca gtagatcctg tacaagaaaa attagaaaaa    3000
tttacagcta gttacggatt aggcttagat agtgttatat tcaatatgga tggaacgatt    3060
gaattaagat tgccaagtgg agaagtgata aaaaagaatt tatctgatct catagcg       3117
 
SeqID 47
atgaaaattt tatttgtagc agcagagggt gcaccctttt caaaaacagg tggtttggga      60
gacgtcattg gcgctcttcc aaaatcactg gtaaaagctg ggcacgaagt tgcagtgatt     120
ttaccctact atgatatggt agaggctaaa tttggaaatc agattgaaga tgtgcttcat     180
tttgaggtga gcgttggttg gcgcagacag tattgtggaa ttaagaaaac agtattaaat     240
ggtgtaacct tctactttat tgacaatcaa tattatttct tccgtggtca tgtttacggt     300
gattttgatg acggagaacg ctttgccttt ttccaactgg ctgccattga ggctatggaa     360
aggattgact ttattcctga tcttctccat gttcatgact accatacagc tatgattcct     420
ttcttgttga aggaaaaata ccgttggatt caagcctatg aggacattga aacagtttta     480
accattcata atttagaatt ccaaggacaa ttttcagaag gaatgttggg tgatttgttt     540
ggagttggct ttgaacgtta cgctgatggc acccttcgat ggaacaactg tctgaactgg     600
atgaaggcag gtattctcta tgcgaaccgt gtttcaaccg tttcacctag ctatgctcat     660
gaaattatga ctagtcagtt tggatgtaat ttggatcaga ttcttaaaat ggagtctggt     720
aaagtatctg gtatcgtgaa tgggattgat gctgatcttt ataatcctca gacggatgct     780
cttttagact atcatttcaa tcaggaagat ttgtctggga aagccaaaaa taaggcaaaa     840
ttgcaagaaa gagttggctt gcctgttaga gcagacgttc cactggtggg aattgtttct     900
cgtttgacac gtcaaaaagg ttttgatgtg gtggtcgaaa gtcttcacca tatcttgcaa     960
gaagatgttc agattgttct tttgggaact ggcgatccag cctttgaagg agctttctca    1020
tggtttgctc agatttaccc agacaagcta tcaacaaata tcacttttga tgtcaaactt    1080
gctcaggaaa tctacgctgc ttgtgacctc ttcctcatgc caagtcgttt tgaaccgtgt    1140
ggcttgtctc aaatgatggc tatgcgttat ggaaccttgc cattggtcca tgaagttgga    1200
ggcttgcgag atacagttcg cgctttcaat ccaatcgaag gaagcggtac tggctttagc    1260
tttgacaatc tatctcctta ttggttaaat tggactttcc aaacagcatt ggacttgtat    1320
agaaaccatc cagacatttg gagaaaccta caaaaacaag ctatggagag tgacttctca    1380
tgggatacag cctgcaagtc ataccttgac ttgtaccata gtttagttaa t             1431
 
SeqID 48
atggaaaagt attttggtga aaaacaagag cgtttttcat ttagaaaatt atcagtagga      60
cttgtatctg caacgatttc aagtttattt tttatgtctg tattagctag ttcatctgtg     120
gatgctcaag aaactgcggg agttcactat aaatatgtgg cagattcaga gctatcatca     180
gaagaaaaga agcagcttgt ctatgatatt ccgacatacg tggagaatga tgatgaaact     240
tattatcttg tttataagtt aaattctcaa aatcaactgg cggaattgcc aaatactgga     300
agcaagaatg agaggcaagc cctagttgct ggtgctagct tagctgctat gggaatttta     360
atttttgctg tttccaagaa aaaggttaag aataaaacgg tattacattt agtattggtt     420
gcagggatag gaaatggtgt cttagtttca gtccatgctt tagaaaatca tcttttgcta     480
aattacaata cggactatga attgacctct ggagaaaaat tacctcttcc taaagagatt     540
tcaggttaca cttatattgg atatatcaaa gagggaaaaa cgacttctga gtctgaagta     600
agtaatcaaa agagttcagt tgccactcct acaaaacaac aaaaggtgga ttataatgtt     660
acaccgaatt ttgtagacca tccatcaaca gtacaagcta ttcaggaaca aacacctgtt     720
tcttcaacta agccgacaga agttcaagta gttgaaaaac ctttctctac tgaattaatc     780
aatccaagaa aagaagagaa acaatcttca gattctcaag aacaattagc cgaacataag     840
aatctagaaa cgaagaaaga ggagaagatt tctccaaaag aaaagactgg ggtaaataca     900
ttaaatccac aggatgaagt tttatcaggt caattgaaca aacctgaact cttatatcgt     960
gaggaaacta tggagacaaa aatagatttt caagaagaaa ttcaagaaaa tcctgattta    1020
gctgaaggaa ctgtaagagt aaaacaagaa ggtaaattag gtaagaaagt tgaaatcgtc    1080
agaatattct ctgtaaacaa ggaagaagtt tcgcgagaaa ttgtttcaac ttcaacgact    1140
gcgcctagtc caagaatagt cgaaaaaggt actaaaaaaa ctcaagttat aaaggaacaa    1200
cctgagactg gtgtagaaca taaggacgta cagtctggag ctattgttga acccgcaatt    1260
cagcctgagt tgcccgaagc tgtagtaagt gacaaaggcg aaccagaagt tcaacctaca    1320
ttacccgaag cagttgtgac cgacaaaggt gagactgagg ttcaaccaga gtcgccagat    1380
actgtggtaa gtgataaagg tgaaccagag caggtagcac cgcttccaga atataagggt    1440
aatattgagc aagtaaaacc tgaaactccg gttgagaaga ccaaagaaca aggtccagaa    1500
aaaactgaag aagttccagt aaaaccaaca gaagaaacac cagtaaatcc aaatgaaggt    1560
actacagaag gaacctcaat tcaagaagca gaaaatccag ttcaacctgc agaagaatca    1620
acaacgaatt cagagaaagt atcaccagat acatctagca aaaatactgg ggaagtgtcc    1680
agtaatccta gtgattcgac aacctcagtt ggagaatcaa ataaaccaga acataatgac    1740
tctaaaaatg aaaattcaga aaaaactgta gaagaagttc cagtaaatcc aaatgaaggc    1800
acagtagaag gtacctcaaa tcaagaaaca gaaaaaccag ttcaacctgc agaagaaaca    1860
caaacaaact ctgggaaaat agctaacgaa aatactggag aagtatccaa taaacctagt    1920
gattcaaaac caccagttga agaatcaaat caaccagaaa aaaacggaac tgcaacaaaa    1980
ccagaaaatt caggtaatac aacatcagag aatggacaaa cagaaccaga accatcaaac    2040
ggaaattcaa ctgaggatgt ttcaaccgaa tcaaacacat ccaattcaaa tggaaacgaa    2100
gaaattaaac aagaaaatga actagaccct gataaaaagg tagaagaacc agagaaaaca    2160
cttgaattaa gaaatgtttc cgacctagag ttatacagtt tgtcaaatgg tacttataaa    2220
caacacattt cgttagagca agttccaagc aatccaaata gctactttgt taaagtgaaa    2280
tcttcttcat tcaaagatgt atacctacca gtagcatcaa tatcagagga aagaaaaaat    2340
gataaaatcc tttataaaat cacagcaaaa gtagagaagc ttcagcagga gatagaaagc    2400
agatataaag ataattttac cttctatcta gctaagaagg gaacagaaga aacaacaaac    2460
tttacttcct ttagtaatct ggtcaaagct ataaaccaaa atccctctgg aacctatcat    2520
ttagcggcca gcctgaatgc taacgaagtg gagcttggtc ctgatgaaag atcctatatc    2580
aaggacacct ttactggtcg tttaatcggt gaaaaagatg gcaagaatta tgctatctat    2640
aatttgaaaa aacctctgtt tgaaaacttg agtggtgcta cagtagaaaa actgagtcta    2700
aaaaatgttg ctatttcagg gaaagatgat atcggttcac tggcaaatga agctcagaat    2760
aacacaaaaa ttaagcaagt tcacgtcgat ggtgttctgg ctggtgaacg tggtatcggt    2820
ggtttgctgg ctaaggctga gcaatcaagc atcacagaga gcagtttcaa gggaagaatt    2880
atcaacactt atgaaacgac tgctgcctac aatatcggtg gtatggtcgg tcatttgaca    2940
ggtgacaagg ctttacttac taagtcaaaa gcgacagtag ccatttcatc taacacaaat    3000
acttcagatc agactgtggg tggacttgca ggcctagtag accgagatgc acagatccaa    3060
gatagctatg ctgaaggtga tatcaacaat gtcaagcact ttggtagagt cgctggagtg    3120
gcaggcaatt tgtgggatcg aacttctggt gatgttaggc atgctggaag tttgaccaat    3180
gttctcagcg atgttaatgt aaccaacgga aatgccatca ctggttacca ctataacgaa    3240
atgaaggtaa aggacacatt cagcagcaag gccaacagag tctacaatgt caccttggtc    3300
aaggatgagg tcgtcagcaa ggaatccttt gaagaaagag gaacaatgct agatgcttct    3360
caaattgcaa gcaaaaaagc agaaatcaat cctctcattt taccaacagt ggagccactt    3420
tcaacaagtg gcaaaaaaga cagtgatttt tctaaggtgg cctattatca agctaagcgc    3480
aacttgactt ataaaaacat tgaaaaattg ctacctttct acaacaaggc aaccatcgtc    3540
aaatacggaa acctggtcaa tgagaacagt cttttatatc aaaaagaact cttgtcagca    3600
gtcatgatga aggacaacca agtcatcaca gacattgttt ctaacaaaca gactgcaaac    3660
aaactcttgc ttcactacaa ggatgattta tctgagaagc tggatctcaa ataccagaat    3720
gatttcgcca aattagcaga atatagtctg ggcaatactg gacttctcta tacgccaaac    3780
caattcctgt atgaccaaac ctctatcatc aagcaagtct tacctgactt acaaaaggtt    3840
gactatcatt cagaagccat cagaaagacg ctgggtattt ctccaaacgt caagcaaact    3900
gagctctatc tagaagacca gttcgccaaa acaaaacaac aactggaaga cagtttgaaa    3960
aaactcttgt cagcggatgc tggactggct agtgctaacc ccgtcactga aggttatctt    4020
gtagataaaa tcaaacgcaa caaggaagcc ttgctacttg gcttgaccta tctggaacgg    4080
tggtataact ttagctatgg tcaggtgaat gtcaaagacc tagttctgta ccatttggac    4140
ttctttggta aggggaatgc ttcaccatta gatactctga ttgagttggg taaatctggc    4200
tttaacaatc ttctagctaa gaataatgtc gatacttatg gtatcagtct tgccagtcaa    4260
catggaacga cagatttgtt tagcacgctg gaacattacc gaaaagtctt tttaccaaat    4320
acaagcaata atgactggtt taaatcagag actaaggctt acattgtcga agaaaaatcc    4380
actatcgaag aggtgaaaac gaagcaaggg ttagctggca ccaagtattc tatcggtgtt    4440
tatgatcgta tcacgagtgc cacatggaaa taccgcaata tggtcttgcc tctcctgacc    4500
ttgccagaga gatccgtatt tgtcatctcg accatgtcta gtctaggatt tggagcttat    4560
gatcgctacc gcagtagtga ccataaagcg ggcaaggctc tcaatgattt tgttgaagaa    4620
aatgcgcgtg aaacagccaa acgtcagcga gatcactacg attattggta tcgtatttta    4680
gacgacaatg cacgtgaaaa actttataga aatattttgc tttacgatgc ttataaattt    4740
ggcgatgata ataccgtagg gaaagctaca gaagtggcag attttgataa tccaaatcct    4800
gcaatgcaac atttctttgg acctgttgga aataaagttg ggcataatca acacggtgct    4860
tatgctacag gtgatgcagt ttattatatg ggttatcgaa tgttggataa ggatggagct    4920
attacttata cgcatgagat gacacatgac tcagatcagg acatttatct tggaggatat    4980
ggtcgaagaa gtggcttggg accagagttc tttgctaaag gattattaca agcaccagac    5040
catccagatg atgcgaccat taccatcaac tccatcttga aacattcaaa atctgatagt    5100
acagaaagtc gacgattaca agtacttgat ccaactacaa gatttaataa tgcagatgat    5160
ttgaagcaat atgtccacaa catgtttgac gttgtttata tgttggaata tctcgaagga    5220
aattcaattc ttaaattgga tacgaatcaa aaacaacaac ttcttagaaa agttacaaat    5280
gagtaccatc ctgatcctga tggaaataag gtctatgcaa caaatgttgt cagaaatcta    5340
acagtagaag aagttgaaag actacgttca ttcaatgatt tgattgataa taatattctt    5400
tcgtctaggg aatatgcctc aggtaaatac gaaagaaatg gctacttcac tattaagtta    5460
tttgcaccga tttatgctgc attaagtaat gatataggaa caccaggtga cctgatggga    5520
cgtcgtatag cctatgaact actagctgct aaaggcttta aagatggtat ggtaccatat    5580
atctcaaacc aatacgaaga agaagccaaa caaaagggca agacaatcaa tctctacggt    5640
aaaacaagag gtttggttac agatgacttg gttttggaaa aggtatttaa taaccaatat    5700
catacttgga gtgagtttaa gaaagctatg tatcaagaac gacaagatca gtttgataga    5760
ttgaacaaag ttacttttaa tgatacaaca cagccttggc aaacatttgc caagaaaact    5820
acaagcagtg tagatgaatt acagaaatta atggacgttg ctgttcgtaa ggatgcagaa    5880
cacaattact accattggaa taactacaat ccagacatag atagtgaagt ccacaagctc    5940
aagagagcaa tctttaaagc ctatcttgac caaacaaatg attttagaag ttcaattttt    6000
gagaataaaa aa                                                        6012
 
SeqID 49
atgaaaatta ataaaaaata tctagcaggt tcagtggcag tccttgccct aagtgtttgt      60
tcctatgagc ttggacgtta ccaagctggt caggataaga aagagtctaa tcgagttgct    120
tatatagatg gtgatcaggc tggtcaaaag gcagaaaact tgacaccaga tgaagtcagt    180
aagagggagg ggatcaacgc cgaacaaatt gttatcaaga ttacggatca aggttatgtg    240
acctctcatg gagaccatta tcattactat aatggcaagg ttccttatga tgccatcatc    300
agtgaagagc tcctcatgaa agatccgaat tatcagttga aggattcaga cattgtcaat    360
gaaatcaagg gtggttatgt cattaaggta aacggtaaat actatgttta ccttaaggat    420
gcagctcatg cggataatat tcggacaaaa gaagagatta aacgtcagaa gcaggaacgc    480
agtcataatc ataactcaag agcagataat gctgttgctg cagccagagc ccaaggacgt    540
tatacaacgg atgatgggta tatcttcaat gcatctgata tcattgagga cacgggtgat    600
gcttatatcg ttcctcacgg cgaccattac cattacattc ctaagaatga gttatcagct    660
agcgagttag ctgctgcaga agcctattgg aatgggaagc agggatctcg tccttcttca    720
agttctagtt ataatgcaaa tccagctcaa ccaagattgt cagagaacca caatctgact    780
gtcactccaa cttatcatca aaatcaaggg gaaaacattt caagcctttt acgtgaattg    840
tatgctaaac ccttatcaga acgccatgtg gaatctgatg gccttatttt cgacccagcg    900
caaatcacaa gtcgaaccgc cagaggtgta gctgtccctc atggtaacca ttaccacttt    960
atcccttatg aacaaatgtc tgaattggaa aaacgaattg ctcgtattat tccccttcgt   1020
tatcgttcaa accattgggt accagattca agaccagaag aaccaagtcc acaaccgact   1080
ccagaaccta gtccaagtcc gcaaccagct ccaagcaatc caattgatga gaaattggtc   1140
aaagaagctg ttcgaaaagt aggcgatggt tatgtctttg aggagaatgg agtttctcgt   1200
tatatcccag ccaaggatct ttcagcagaa acagcagcag gcattgatag caaactggcc   1260
aagcaggaaa gtttatctca taagctagga actaagaaaa ctgacctccc atctagtgat   1320
cgagaatttt acaataaggc ttatgactta ctagcaagaa ttcaccaaga tttacttgat   1380
aataaaggtc gacaagttga ttttgaggct ttggataacc tgttggaacg actcaaggat   1440
gtctcaagtg ataaagtcaa gttagtggaa gatattcttg ccttcttagc tccgattcgt   1500
catccagaac gtttaggaaa accaaatgcg caaattacct acactgatga tgagattcaa   1560
gcagccaagt tggcaggcaa gtacacaaca gaagacggtt atatctttga tcctcgtgat   1620
ataaccagtg atgaggggga tgcctatgta actccacata tgacccatag ccactggatt   1680
aaaaaagata gtttgtctga agctgagaga gcggcagccc aggcttatgc taaagagaaa   1740
ggtttgaccc ctccttcgac agaccatcag gattcaggaa atactgaggc aaaaggagca   1800
gaagctatct acaaccgcgt gaaagcagct aagaaggtgc cacttgatcg tatgccttac   1860
aatcttcaat atactgtaga agtcaaaaac ggtagtttaa tcatacctca ttatgaccat   1920
taccataaca tcaaatttga gtggtttgac gaaggccttt atgaggcacc taaggggtat   1980
actcttgagg atcttttggc gactgtcaag tactatgtcg aacatccaaa cgaacgtccg   2040
cattcagata atggttttgg taacgctagc gaccatgttc aaagaaacaa aaatggtcaa   2100
gctgatacca atcaaacgga aaaaccaagc gaggagaaac ctcagacaga aaaacctgag   2160
gaagaaaccc ctcgagaaga gaaaccgcaa agcgagaaac cagagtctcc aaaaccaaca   2220
gaggaaccag aagaatcacc agaggaatca gaagaacctc aggtcgagac tgaaaaggtt   2280
gaagaaaaac tgagagaggc tgaagattta cttggaaaaa tccaggatcc aattatcaag   2340
tccaatgcca aagagactct cacaggatta aaaaataatt tactatttgg cacccaggac   2400
aacaatacta ttatggcaga agctgaaaaa ctattggctt tattaaagga gagtaag      2457
 
SeqID 50
ttgattttaa gtgtttgttc ttacgagttg ggactgtatc aagctagaac ggttaaggaa     60
aataatcgtg tttcctatat agatggaaaa caagcgacgc aaaaaacgga gaatttgact    120
cctgatgagg ttagcaagcg tgaaggaatc aatgctgagc aaatcgtcat caagataaca    180
gaccaaggct atgtcacttc acatggcgac cactatcatt attacaatgg taaggttcct    240
tatgacgcta tcatcagtga agaattactc atgaaagatc caaactataa gctaaaagat    300
gaggatattg ttaatgaggt caagggtgga tatgttatca aggtagatgg aaaatactat    360
gtttacctta aggatgctgc ccacgcggat aacgtccgta caaaagagga aatcaatcga    420
caaaaacaag agcatagtca acatcgtgaa ggtggaactc caagaaacga tggtgctgtt    480
gccttggcac gttcgcaagg acgctatact acagatgatg gttatatctt taatgcttct    540
gatatcatag aggatactgg tgatgcttat atcgttcctc atggagatca ttaccattac    600
attcctaaga atgagttatc agctagcgag ttggctgctg cagaagcctt cctatctggt    660
cgaggaaatc tgtcaaattc aagaacctat cgccgacaaa atagcgataa cacttcaaga    720
acaaactggg taccttctgt aagcaatcca ggaactacaa atactaacac aagcaacaac    780
agcaacacta acagtcaagc aagtcaaagt aatgacattg atagtctctt gaaacagctc    840
tacaaactgc ctttgagtca acgacatgta gaatctgatg gccttgtctt tgatccagca    900
caaatcacaa gtcgaacagc tagaggtgtt gcagtgccac acggagatca ttaccacttc    960
atcccttact ctcaaatgtc tgaattggaa gaacgaatcg ctcgtattat tccccttcgt   1020
tatcgttcaa accattgggt accagattca aggccagaac aaccaagtcc acaaccgact   1080
ccggaaccta gtccaggccc gcaacctgca ccaaatctta aaatagactc aaattcttct   1140
ttggttagtc agctggtacg aaaagttggg gaaggatatg tattcgaaga aaagggcatc   1200
tctcgttatg tctttgcgaa agatttacca tctgaaactg ttaaaaatct tgaaagcaag   1260
ttatcaaaac aagagagtgt ttcacacact ttaactgcta aaaaagaaaa tgttgctcct   1320
cgtgaccaag aattttatga taaagcatat aatctgttaa ctgaggctca taaagccttg   1380
tttgaaaata agggtcgtaa ttctgatttc caagccttag acaaattatt agaacgcttg   1440
aatgatgaat cgactaataa agaaaaattg gtagatgatt tattggcatt cctagcacca   1500
attacccatc cagagcgact tggcaaacca aattctcaaa ttgagtatac tgaagacgaa   1560
gttcgtattg ctcaattagc tgataagtat acaacgtcag atggttacat ttttgatgaa    1620
catgatataa tcagtgatga aggagatgca tatgtaacgc ctcatatggg ccatagtcac    1680
tggattggaa aagatagcct ttctgataag gaaaaagttg cagctcaagc ctatactaaa    1740
gaaaaaggta tcctacctcc atctccagac gcagatgtta aagcaaatcc aactggagat    1800
agtgcagcag ctatttacaa tcgtgtgaaa ggggaaaaac gaattccact cgttcgactt    1860
ccatatatgg ttgagcatac agttgaggtt aaaaacggta atttgattat tcctcataag    1920
gatcattacc ataatattaa atttgcttgg tttgatgatc acacatacaa agctccaaat    1980
ggctatacct tggaagattt gtttgcgacg attaagtact acgtagaaca ccctgacgaa    2040
cgtccacatt ctaatgatgg atggggcaat gccagtgagc atgtgttagg caagaaagac    2100
cacagtgaag atccaaataa gaacttcaaa gcggatgaag agccagtaga ggaaacacct    2160
gctgagccag aagtccctca agtagagact gaaaaagtag aagcccaact caaagaagca    2220
gaagttttgc ttgcgaaagt aacggattct agtctgaaag ccaatgcaac agaaactcta    2280
gctggtttac gaaataattt gactcttcaa attatggata acaatagtat catggcagaa    2340
gcagaaaaat tacttgcgtt gttaaaagga agtaatcctt catctgtaag taaggaaaaa    2400
ataaac                                                               2406
 
SeqID 51
atgccagtag aaattaaaac cactaaagaa attcatccta aaatctatgc ctacaccaca      60
ccgacagtaa ccagtaatga aggctggatt aagattgggt atacagaacg tgatgtcaca     120
caacgtatca aggagcaaac gcatacagct catatagcta cagatgtctt atggactggt     180
gatgcagctt atacagaaga gcctgataag gggaaaactt tcaaggacca tgatttccac     240
catttccttt ctttccatga tgtagaacgt cgtcccaaga cggaatggtt ctattttaat     300
ggaactcctg aaaaatcaaa aaatcttttt gataagtttg ttcagcatga tttgtctggt     360
tatcagcctg gaaaaggaca ggactatact ctgcgacaag agcaagaaga agcagttgct     420
aagacattag cttatttcca agaacatgct ggaggcaagt ttctctggaa tgccaagcca     480
cgctttggta aaaccttgtc tacctatgac ctagctcgac ggatggaagc tgtcaatgtc     540
ctaattgtaa caaaccgccc tgccattgct aactcatggt atgatgattt tgaaacattc     600
atagcaggtc aaacgactta caagtttgtt tctgaatcag atagccttaa gagtcgtcca     660
atcttgtcac gacaagaatt tcttggtatt ttagctgacg atgtaagaca acttgctttt     720
atcagtctcc aagacttgaa aggatctgtt tatttaggtg gagagcacga taaactcaaa     780
tgggtaactg atctgcattg ggacttgttg gttattgacg aggctcatga aggagttgat     840
accttcaaga ctgaccaagc ctttaataag attcgacgaa attttactct gcatttgtca     900
ggtacatcat ttaaagcatt ggctaaagga gattttacag aggaacaaat ctacaactgg     960
tcttatgctg atgagcaggc tgctaagtat tcgtggtctc ttgagcaaga agaggaaaat    1020
ccttatgaaa gcttgcctca gttgaatctc tttacctatc aaatgtctca gatgattggc    1080
gaaaagttag aaaaaggcgc tcagatcgat ggtgaaaata ttgactatgt ttttgactta    1140
agtgaatttt tcgctacaga tgataaaggg aaatttattc atgagcatga tgtcagaaat    1200
tggttagata ctctatcaag caatgaaaaa tatccatttt caaccaaaga actccgtaat    1260
gaactcaagc atactttttg gcttttagaa cgtgtcgctt cggccaaagc attaaaagcc    1320
ctactagaag aacacccaat ctatgaaaac tatgagatcg ttctagctgc tggtgacgga    1380
cgtatgtccg aagaagacga taaagtcaaa ctcaaatcct tggacttggt tagaaaagcg    1440
atagcagaga atgacaaaac cattacccta tccgttggtc agctgacgac aggtgtcact    1500
atccctgaat ggacaggtgt attgatgtta tcaaatttga aatcaccagc tctttatatg    1560
caggccgcct tccgtgctca aaatccttac tcatggagcg ataacaaagg aaatcacttt    1620
cgcaaagaaa gagcctatgt atttgacttt gcgccggaaa gaaccttgat tctctttgat    1680
gagtttgcca acaacttatt gcttgtaact gcagctggta gaggaacttc agctacacgc    1740
gaagaaaata ttagagaatt attaaacttc tttccaatta ttgccgaaga ccgtgctggt    1800
aagatggttg aaattgatgc aaaggcagtt ctaaccactc ctcgccagat aaaagctaga    1860
gaagttctta aacgaggttt tatgtccaat ctcttatttg ataatattag tggtattttc    1920
caagcaagtc aaacagtttt agatatttta aatgagctgc cagttgaaaa ggaagggaag    1980
gtacaagata gttctgattt attagatttt tcagatgtta cagtcgatga tgagggaaat    2040
gcagtagtag accatgaaat tgtagttaat cagcaaatgc gactttttgg tgaaaaagtt    2100
tatggacttg gtgaatctgt tgctgagtta gtcacaaaag atgaggaacg aactcaaaaa    2160
cagctggtca atgacttgag taagaccgtt tcttcagtga ttgtagagga attgaaagca    2220
gattattctc taaaaacaag ggaaactgag caaattaaga aacaaattac agcaacactt    2280
gagaatgaaa ttcgaaaaaa tgatatcgaa agaaaaattt ctgaagctca tatcaagcaa    2340
gagttgcaac agcagctcaa agaagcaaat gataaagcgc aaaaagataa gattcaagaa    2400
gatttggaaa aacgtttaga agaaaataaa ctcattcata aagaaaaact agaacaaaca    2460
ctcaaaaaag aagtggaaaa aatgcctgag aaatttatcg aacaggttga gataaaacgt    2520
gtggaacagt tgaaacaatc agctcaagat gaaattcgtg accatttacg agggtttgca    2580
agaacaattc caagttttat tatggcttac ggtgatcaaa ctctaacact tgataatttt    2640
gatgcctttg ttcctgaaca tgttttttat gaagtaacag ggattacgat tgatcagttt    2700
agatatttgc gagatggtgg gcaggatttt gcagggcatc tctttgataa agcaacattt    2760
gacgaagcta ttcaagaatt tcttcgcaag aaaaaggagt tggcggatta ttttaaagat    2820
caaaaagaag acatttttga ctatattcca ccgcagaaga ccaaccaaat tttcactcct    2880
aaacgagtgg tgaaaaggat ggtagatgat ttggaaaagg aaaatccagg gatttttgat    2940
gatccatcta agacttttat tgatttatat atgaagtcag gcctctatat tgcagaactt    3000
gtgaagcggt tatataatag caatggcttg aaagaggcc tttccaaatcc tgaagaacgc    3060
ttaaaacata ttttggaaaa gcaagtttat ggatttgctc cgtctgagat tatctataac   3120
atttccacta attttatatt tggcaatctt tctaaagata tcagtaggaa gaattttgtt   3180
ttagcagata ccattccagc ggctaaagaa gggagcattc aaaagttggt tgattcctat   3240
tttgaaaata at                                                       3252
 
SeqID 52
atgaaaaaaa tactaattgt agatgatgag aaaccaatct cggatattat caagtttaat     60
atgaccaagg aaggttacga agttgtaact gcttttaatg gtcgtgaagc gctagagcaa    120
tttgaagcag agcaaccaga tattattatt ctggatttga tgcttccaga aattgatggt    180
ttagaagttg ctaagaccat tcgtaagaca agcagtgtgc ccattcttat gctttcagcc    240
aaagatagtg aatttgataa ggttatcggt ttggaacttg gggcagatga ctatgtaaca    300
aaacccttct ccaatcgtga gttgcaggcg cgtgttaaag ctcttctgcg tcgttctcaa    360
cctatgccag tagatggtca ggaagcagat agtaaacctc aacctatcca aattggggat    420
ttagaaattg ttccagacgc ctacgtggct aaaaaatatg gcgaagaact agacttaacc    480
catcgtgaat ttgagctttt gtatcattta gcatcgcata caggtcaagt catcacgcgc    540
gaacacttgc ttgagactgt ctggggttat gactattttg gtgatgtccg tacagttgat    600
gtgactgtac gacgtctgcg tgagaagatt gaagatacgc ccagccgacc agagtatatc    660
ttgacgcgcc gtggtgtagg gtattacatg agaaataatg ct                       702
 
SeqID 53
atgaagaaaa aatttctagc atttttgcta attttattcc caattttctc attaggtatt     60
gccaaagcag aaacgattaa gattgtttct gataccgcct atgcaccttt tgagtttaaa    120
gattcagatc aaacttataa aggaattgat gttgacatta ttaacaaagt cgctgagatt    180
aaaggctgga acattcagat gtcctatcct ggatttgacg cagcagtcaa tgcggttcaa    240
gctgggcaag ccgacgctat catggcaggg atgacaaaga ctaaagaacg tgaaaaagtc    300
ttcaccatgt ctgatactta ctatgataca aaagttgtca ttgctactac aaagtcacac    360
aaaattagca agtacgacca attaactggc aaaaccgttg gtgttaaaaa cggaactgcc    420
gctcaacgtt tccttgaaac aatcaaagat aaatacggct ttactattaa aacatttgac    480
actggtgatt taatgaacaa cagcttgagt gctggtgcca tcgatgccat gatggatgac    540
aaacctgtta tcgaatatgc cattaaccaa ggtcaagacc tccatattga aatggatggt    600
gaagctgtag gaagttttgc tttcggtgtg aaaaaaggaa gtaaatacga gcacctggtt    660
actgaattta accaagcctt gtctgaaatg aaaaaagatg gtagtcttga taaaattatc    720
aagaaatgga ctgcttcatc atcttcagca gtgccaacta caactactct cgcaggatta    780
aaagctattc ctgttaaggc taaatatatc attgccagcg attcttcttt tgcccctttt    840
gttttccaaa attcaagcaa ccaatacact ggtattgata tggaattgat taaggcaatc    900
gctaaagacc aaggttttga aattgaaatc accaaccctg gttttgatgc tgctatcagt    960
gctgtccaag ctggtcaagc cgatggtatc atcgctggta tgtctgtcac agatgctcgt   1020
aaggcaactt ttgacttctc agaatcatac tacactgcta ataccattct tggtgtcaaa   1080
gaatcaagca atattgcttc ttatgaagat ctaaaaggaa agacagtcgg tgttaaaaac   1140
ggaactgctt ctcaaacctt cctaacagaa aatcaaagca aatacggcta caaaatcaaa   1200
acctttgctg atggttcttc aatgtatgac agtttaaaca ctggtgccat tgatgccgtt   1260
atggatgatg aacctgttct caaatattct atcagccaag gtcaaaaatt gaaaactcca   1320
atctctggaa ctccaatcgg tgaaacagcc tttgccgtta aaaaaggagc aaatccagaa   1380
ctgattgaaa tgttcaacaa cggacttgca aaccttaaag caaacggtga attccaaaag   1440
attcttgaca aatacctagc tagcgaatct tcaactgctt caacaagtac tgttgacgaa   1500
acaacgctct ggggcttgct tcaaaacaac tacaaacaac tccttagcgg tcttggtatc   1560
actcttgctc tagctcttat ctcatttgct attgccattg tcatcggaat tatcttcggt   1620
atgtttagcg ttagcccata caaatctctt cgcgtcatct ctgagatttt cgttgacgtt   1680
attcgtggta ttccattgat gattcttgca gccttcatct tctggggaat tccaaacttc   1740
atcgagtcta tcacaggcca acaaagccca attaacgact ttgtagctgg aaccattgcc   1800
ctctcactca atgcggctgc ttatatcgct gaaatcgttc gtggtggtat tcaggccgtt   1860
ccagttggcc aaatggaagc cagccgaagc ttgggtatct cttatggaaa aaccatgcgt   1920
aagattatct tgccacaagc aactaaattg atgttgccaa actttgtcaa ccaattcgtt   1980
atcgctctta aagatacaac tatcgtatct gctatcggtt tggttgaact cttccaaact   2040
ggtaagatta tcattgctcg taactaccaa agtttcaaga tgtatgcaat ccttgctatc   2100
ttctatcttg taattatcac acttttgact agactagcga aacgcttaga aaagaggatt   2160
cgt                                                                 2163
 
SeqID 54
atggcatttg aaagtttaac agaacgtttg cagaacgtct ttaaaaatct acgtaaaaaa     60
ggaaaaatct ctgaatctga tgtccaagag gcaaccaaag aaattcgctt ggccttgctc    120
gaggccgacg ttgccttgcc tgttgtaaag gactttatca agaaagttcg tgagcgtgca    180
gtcgggcatg aggtcattga tacacttaat cctgcgcaac agattattaa aatcgttgat    240
gaggaattga cagccgtttt aggttctgat acggcagaaa ttatcaagtc acctaagatt    300
ccaaccatca tcatgatggt tggtttacaa ggggctggta aaacaacctt tgctggtaaa    360
ttggccaaca aactcaagaa agaagaaaat gctcgtcctt tgatgattgc ggcggatatt    420
tatcgtccag ctgccattga ccagcttaag accttgggac aacagattga tgtgcctgtc    480
tttgcacttg gaacagaagt accagctgtt gagattgtac gtcaaggttt ggagcaagcc    540
caaactaatc ataacgacta tgtcttgatt gatactgcgg gtcgtttgca gattgatgag    600
ctcctcatga atgagcttcg tgatgtgaaa gcattggctc aaccaaatga aatcttgctt    660
gtcgttgatg ctatgattgg tcaggaagca gccaatgttg cgcgtgagtt taatgctcag    720
ttggaagtga ctggggtcat ccttaccaag attgatggcg atactcgtgg tggtgctgct    780
ctgtctgttc gtcacattac tggaaaacca atcaagttca ctggtacagg tgaaaagatt    840
acggacattg aaaccttcca cccagaccgc atgtctagcc gtatccttgg tatgggggat    900
atgctcactt tgattgagaa agcttctcag gaatacgatg aacaaaaagc ccttgaaatg    960
gctgagaaga tgcgcgaaaa cacctttgat tttaatgatt tcatcgatca attagatcag   1020
gtgcaaaata tggggccgat ggaagacttg ctcaagatga ttccaggtat ggccaacaat   1080
ccagcccttc aaaacatgaa ggtggatgaa cgccagattg ctcgtaaacg tgccattgtg   1140
tcttcgatga cacctgaaga gcgtgaaaac ccagatttgt taaatccaag ccgtcgccgt   1200
cgtattgctg ctggttctgg aaatacattc gtcgaagtca ataaattcat caaggacttt   1260
aaccaggcta aacagctcat gcagggtgtt atgtctgggg atatgaataa aatgatgaag   1320
caaatgggga ttaatccaaa taaccttcct aaaaatatgc caaatatggg aggaatggat   1380
atgtctgccc ttgaaggaat gatgggacaa ggcggtatgc ctgacttatc agctctcgga   1440
ggagcaggaa tgccagatat gagccagatg tttggtggcg gtttgaaagg taaaattggt   1500
gaatttgcca tgaaacagtc catgaaacgt atggctaaca aaatgaagaa agcgaagaag   1560
aaacgcaag                                                           1569
 
SeqID 55
atgagccaaa tttggactaa agaaaaattt ataagccaag ttcaaggtgg agtcattgtt     60
tcttgtcaag ctttacctgg tgaagccctt tataatgaag aatttagctt gatgcctttt    120
atggctaaag cagctttaga ggcaggagca gtgggcattc gcgcaaattc tgtgcgtgat    180
attaaagcaa ttcagaaagt agtagattta ccaataattg gaattatcaa aagggattat    240
ccacctcaag aaccatatat tactgctacg atgaaagaag tagatgaact tgtagaatgc    300
ggaacaacag tcattgcatt tgatgcaact ttaagaccaa gatatgatgg cttagttgtc    360
agtgaattta tcaaaaaaat aaaagaaaaa tatccgaatc aattgctgat ggcggatgta    420
agtaatttag atgaaggtct ctatgcattt aaatcaggcg ttgattttgt tggtacaaca    480
ttatcaggtt acacaagtac aagtgtacaa tcagatgagc ctgattttga actaatgaaa    540
aaattggctg attttaatat tccggtaatt gccgaaggaa aaattcatta tccagaacaa    600
ttaaaaaaag cttatagttt aggtgttacc agtgtagtca ttggtggagc gattacacgt    660
ccaaaagaaa ttgctcagcg atttattaat gtcatcaaa                           699
 
SeqID 56
atgagatatt taactgcagg agaatcacac ggcccccgtc taacagctat tattgaggga     60
attccagctg gacttccatt gacagctgag gatatcaatg aggaccttag acgccgtcag    120
ggtggctacg gtcgtggtgg tcgtatgaag attgagaatg accaggttgt ctttacttcg    180
ggcgttcgcc acgggaagac gacaggggcg cctattacta tggatgtcat caataaggac    240
caccagaaat ggctggacat catgtctgcg gaggacattg aagaccgcct taaaagcaag    300
cggaaaatta ctcatcctcg cccaggtcat gccgatttgg ttggggggat taagtaccgt    360
tttgatgatt tgcgaaattc tttggagcgt tcatcagctc gtgaaaccac catgcgggtg    420
gcagttggtg cagtagccaa acgcctcttg gctgagctgg atatggagat tgccaaccat    480
gtcgtggtct ttggtggcaa ggaaatcgat gttcctgaaa atctgacagt cgctgaaatt    540
aagcaaagag ctgcccagtc tgaagtttct attgtcaacc aagaacgaga acaggaaatc    600
aaggactata ttgaccaaat caaacgtgat ggtgatacca tcggtggggt tgtggagaca    660
gtcgtcggag gcgttccagt tggtcttggt tcctatgtcc aatgggatag aaaattggat    720
gcaagattgg ctcaagctgt tgtctctatc aatgccttta aaggggtgga atttggtctt    780
ggctttgagg ctggttatcg taaaggcagc caagttatgg atgaaattct ctggtctaaa    840
gaagacggtt atactcgccg taccaataat ctaggtggtt ttgaaggtgg tatgactaat    900
gggcaaccca tcgttgttcg tggggtcatg aaacccattc ctactcttta taaacctctt    960
atgagtgtgg atatcgaaac ccacgaacct tacaaggcaa ccgtggagag aagtgatccg   1020
actgctcttc cagctgcagg aatggtcatg gaagcagttg tagcaacggt tctggcgcaa   1080
gaaatcctcg aaaaattctc atcagataat cttgaggaac taaaagaagc ggtagccaaa   1140
caccgagact atacaaagaa ctat                                          1164
 
SeqID 57
atggtagtta tgaatagaat aagagtcagc aaaagggttg aaaagaagct tgctaagggg     60
ctagttttac tagaagccag tgatcttgag aatgtcaatc ttaaggatca ggaagtagag    120
gtgcagggtc aggaaggaaa ctttcttggg actgcctacc tttctcagca aaacaagggc    180
ttgggctggt ttatcagcaa agacaaggtg gccttcaatc aagctttctt tgaaacgttg    240
tttagaaaag ccaaagaaaa gagaaacgcc tactatcaag atgatttgac aactgccttt    300
cgtctcttta atcaagaggg agatggcttt gggggtctga cagtggacct ttatggcgac    360
tacgccgtct tttcttggta taactcttat gtttatcaga ttcgtcagac tatatcagaa    420
gcctttagac aggttttccc tgaggtttta ggagcttatg agaaaatccg ctttaagggt    480
ttggactatg aatctgccca tgtttatggt caagaagcac ctgacttttt caatgtttta    540
gaaaatggtg tcctgtatca agtctttatg aatgatggct tgatgacagg aattttccta    600
gaccagcatg aggttcgcgg tagtttagtt gacggcttgg ctatgggtaa atccttactc    660
aatatgtttt cctacacagc ggctttttca gtagctgcgg ccatgggagg agctagccat    720
acaacttctg ttgatctagc caaacgttca cgagaattgt ctcaagcgca ttttcaggca    780
aatgggctca gcacagacga gcatcgtttt atagtcatgg atgtctttga gtatttcaaa    840
tatgccaaac gcaaagactt gacctacgat gtgattgtcc tagatccgcc tagctttgct    900
cggaataaaa aacaaacttt ctctgtggcc aaggattatc acaagttgat ttcccagagt    960
cttgagattt taaatccggg agggattatc attgccagta ccaatgctgc caatgtttcc   1020
cgtcagaaat ttacagaaca aattgataaa ggttttgcag gaagaagtta ccagatttta   1080
aacaaatatg gtcttccagc agattttgcc tataataaaa aagatgaaag tagtaattac   1140
ctcaaggtga ttagtatgaa ggttagtaaa                                    1170
 
SeqID 58
atgacaaaaa cattaaaacg tcctgaggtt ttatcacctg cagggacttt agagaagcta     60
aaggtagctg ttcagtatgg agcagatgct gtctttatcg gtggtcaggc ctatggtctt    120
cgtagccgtg cgggaaactt tactttcgaa cagatggaag aaggcgtgca gtttgcggcc    180
aagtatggtg ccaaggtcta tgtagcggct aatatggtta tgcacgaagg aaatgaagct    240
ggtgctggtg agtggttccg taaactgcgt gatatcggga ttgcagcagt tatcgtatct    300
gacccagcct tgattatgat tgcagtgact gaagcaccag gccttgaaat ccacctttct    360
acccaagcca gtgccactaa ctatgaaacc cttgagttct ggaaagagct aggcttgact    420
cgtgtcgttt tagcgcgtga ggtttcaatg gaagaattag ctgagatccg caaacgtaca    480
gatgttgaaa ttgaagcctt tgtccatgga gctatgtgta tttcatactc tggacgttgt    540
actctttcaa accacatgag tatgcgtgat gccaaccgtg gtggatgttc tcagtcatgc    600
cgttggaaat acgaccttta cgatatgcca tttgggaaag aacgtaagag tttgcagggt    660
gagattccag aagaattttc aatgtcagcc gttgacatgt ctatgattga ccacattcca    720
gatatgattg aaaatggtgt ggacagtcta aaaatcgaag gacgtatgaa gtctattcac    780
tacgtatcaa cagtaaccaa ctgctacaag gcggctgtgg atgcctatct tgaaagtcct    840
gaaaagtttg aagctatcaa acaagacttg gtggacgaga tgtggaaggt tgcccaacgt    900
gaactggcta caggatttta ctatggtaca ccatctgaaa atgagcagtt gtttggtgct    960
cgccgtaaaa ttcctgagta caagtttgtc gctgaagtgg tttcttatga tgatgcggca   1020
caaacagcaa caattcgtca acgaaatgtc attaacgaag gggaccaagt tgagttttat   1080
ggtccaggtt tccgtcattt tgaaacctat attgaagatt tgcatgatgc caaaggcaat   1140
aaaatcgacc gcgctccaaa tccaatggaa ctattgacta ttaaggtgcc tcaacccgtt   1200
caatcaggag atatggttcg tgcattaaaa gaaggactca tcaatcttta taaggaagat   1260
ggaaccagcg tcacagttcg agct                                          1284
 
SeqID 59
atgaatacct atcaattaaa taatggagta gaaattccag tattgggatt tggaactttt     60
aaggctaagg atggagaaga agcctatcgt gcagtgttag aagccttgaa ggctggttat    120
cgtcatattg atacggcggc gatttatcag aatgaagaaa gtgttggtca agcaatcaaa    180
gatagcggag ttccacgtga agaaatgttc gtaactacca agctttggaa tagtcagcaa    240
acctatgagc aaactcgtca agctttggaa aaatctatag aaaaactggg cttggattat    300
ttggatttgt atttgattca ttggccgaac ccaaaaccgc tcagagaaaa tgacgcatgg    360
aaaactcgca atgcggaagt ttggagagcg atggaagacc tctatcaaga agggaaaatc    420
cgtgctatcg gcgttagcaa ttttcttccc catcatttgg atgccttgct tgaaactgca    480
actatcgttc ctgcggtcaa tcaagttcgc ttggcgccag gtgtgtatca agatcaagtc    540
gtagcttact gtcgtgaaaa gggaatttta ttggaagctt gggggccttt tggacaagga    600
gaactgtttg atagcaagca agtccaagaa atagcagcaa atcacggaaa atcggttgct    660
cagatagcct tggcctggag cttggcagaa ggatttttac cacttccaaa atctgtcaca    720
acctctcgta ttcaagctaa tcttgattgc tttggaattg aactgagtca tgaggagaga    780
gaaaccttaa aaacgattgc tgttcaatcg ggtgctccac gagttgatga tgtggatttc    840
 
SeqID 60
ttgagtgaaa agtcaagaga agaagagaaa ttaagcttta aagagcagat tctgagagat     60
ttagaaaaag taaaaggcta tgatgaagtt ctgaaagaag atgaggcagt agttcgcact    120
cctgcaaatg aaccttcaac tgaagaactc atggctgatt ccttgtcaac ggtagaggag    180
attatgagaa aagctcctac cgtgcctact cacccaagtc aaggtgtacc agcttctcca    240
gcagatgaga ttcaaagaga aactcctggt gttccaagtc atccaagtca agatgtacct    300
tcttctccag cggaagaaag tggatcaaga ccaggtccag gtcctgttag acctaagaaa    360
cttgaaagag aatacaatga aaccccaaca agggtagctg tttcctatac gacggcagag    420
aaaaaagcag aacaagcagg tccagaaaca cctacgcctg ctacagaaac agtggatatc    480
atcagagata catcacgtcg tagccgtaga gaaggagcaa aacccgttaa gcctaagaaa    540
gagaagaagt cacatgtgaa agcttttgtg atttcattcc ttgtattcct tgccttgctc    600
tcagcaggtg gttactttgg ttaccagtac gtgctagatt ccttattacc tatcgatgct    660
aattctaaga aatatgtgac ggttggaatt ccagaaggtt caaacgttca agaaatcggt    720
acgacgcttg aaaaagctgg tttggtaaag catggtctga tttttagttt ttatgccaag    780
tataaaaatt ataccgactt gaaagcaggt tactacaatt tgcaaaagag tatgagtaca    840
gaagacttac tcaaagagtt gcaaaaaggt ggaacagatg aaccgcaaga acctgtactt    900
gcgactttga caattccaga aggttatacc ttggatcaga ttgctcaagc tgtgggtcaa    960
ttgcaaggtg acttcaaaga gtctttgaca gcggaggctt tcttggctaa agttcaagat   1020
gagacgttta tcagtcaagc agtagcgaaa tatcctactt tactggaaag tttgcctgta   1080
aaagacagcg gtgcgcgtta tcgtttggaa ggataccttt tcccagctac atactctatc   1140
aaggaaagca caactattga gagcttgatt gatgagatgt tagctgctat ggataagaac   1200
ctatctcctt actatagtac tatcaaatct aaaaacttga ctgtcaatga gttgttgacc   1260
attgcttcct tggtcgaaaa agaaggtgcc aagacagaag atcgtaagct cattgcaggt   1320
gtattctaca atcgtttgaa tcgtgatatg ccacttcaaa gtaatattgc aatcttgtat   1380
gcccaaggaa aactggggca aaatatcagt ctagctgagg atgttgcgat tgataccaac   1440
attgattcac cttataatgt ttataaaaat gtaggtctca tgcctggtcc agtcgatagt   1500
ccaagtctgg atgcgattga gtcaagcatc aatcaaacta agagcgataa cctctacttt   1560
gtagcagatg tcacagaagg caaggtctac tatgctaaca atcaagaaga ccacgaccgc   1620
aatgtcgctg aacatgtcaa cagcaaatta aac                                1653
 
SeqID 61
atgaaacaag aacgatttcc attggtgtca gatgacgagg tcatgttgac tgaaatgcca     60
gtcatgaatc tctatgatga gtctgatctg atcagtaata tcaagggtga gtatcgagat    120
aaaaattatt tagaatgggc tcctattgct gaagaaaaac cagtaaaacc gattgaaaag    180
caagtcgaaa aacctaaaaa ggctccttta ggggttaaaa aagaaggaaa gagctatgcg    240
gaggtggcgc gtgaagaagc gcgtgcggac ttgaaaaaga aacgctctgc taactaccta    300
actcaggatt tcagccttgc gagacgtcat tctcagccca gtctagttag acagggcaat    360
caaccgacag ctcctttcca aaaggaaaat cctggtgaat ttgtcaaata tagccaaaaa    420
ttgacccagt ctcattatat cttggcggaa gaagttcatt ctatccctac caagaatgaa    480
gaagtgtcag cacctgctcc aaagaaaaac aattatgatt ttctaaagaa gagccaaatc    540
tacaataaaa aaagtaaaca aacagaacaa gaacgtcggg ttgcccaaga gttgaatctg    600
accagaatga cagaa                                                     615
 
SeqID 62
atgaaaaagt ctaagagcaa atatctaacc ttggcaggtc ttgtcctggg tacaggagtt     60
ttattgagcg cgtgtggaaa ttctagcacg gcgtcaaaaa cctacaacta tgtttattca    120
agtgatccat ctagcttgaa ctatctagca gaaaaccgcg cagcaacatc cgatattgtt    180
gcaaatttgg tagacgggtt attagaaaat gaccaatatg ggaatattat tccatcatta    240
gcagaggatt ggactgtttc tcaggacggt ttgacctata cctacaaact tcgtaaggat    300
gccaagtggt ttacttctga gggagaagaa tatgcgcctg taactgccca ggattttgtg    360
acaggtttgc aatatgcagc tgataaaaaa tcagaagcct tgtatctagt gcaggactct    420
gttgctggtt tggatgacta tatcactggt aaaacaagcg acttttcaac tgtcggtgtc    480
aaggcacttg atgaccaaac ggttcaatat actttggtta aaccagaact ttactggaat    540
tcaaaaacac ttgcaacgat actttttcct gttaatgcag atttcctgaa atcaaaaggg    600
gatgattttg ggaaggcgga tccatctagt attttgtaca atggaccttt cttgatgaaa    660
gcacttgtct caaaatctgc tattgaatat aagaaaaacc ctaattactg ggatgctaag    720
aatgtctttg tagacgatgt gaaattgacc tactatgatg gtagcgacca agaatcactg    780
gaacgtaatt ttacagctgg tgcttatact acggctcgtc tttttcctaa cagctccagc    840
tatgaaggga ttaaagaaaa atacaaaaac aatatcatct atagtatgca aaattcaact    900
tcatatttct ttaattttaa cctagatagg aagtcttaca attatacttc taaaacaagt    960
gacattgaaa agaaatcgac tcaggaagca gttctcaata aaaacttccg tcaggctatc   1020
aattttgctt ttgacagaac atcttatggg gctcagtctg aagggaaaga aggtgcaaca   1080
aagattttgc gtaacctagt ggttcctcca aactttgtca gtatcaaggg aaaagacttt   1140
ggtgaagttg tagcctctaa gatggtcaac tatggtaagg aatggcaagg tatcaacttt   1200
gcggatggtc aagaccctta ctacaatcct gagaaagcca aggctaagtt tgcggaagct   1260
aagaaagaac tcgaagcaaa gggtgttcaa ttcccaatcc acttggataa gactgtggaa   1320
gtaacagata aagtaggcat acaaggagtt agttctatca aacaatcaat tgaatctgtt   1380
ttaggttctg ataatgtagt gattgacatt cagcaattaa catcagatga gtttgacagt   1440
tcaggctact ttgctcaaac agctgctcag aaagattatg atttatatca tggcggttgg   1500
ggacctgatt atcaagaccc gtcaacctat ctcgatattt ttaatactaa tagtggagga   1560
tttctgcaaa atcttggact agagcctggt gaggccaatg acaaggctaa ggcagttgga   1620
ctggatgtct atactcaaat gttggaagaa gctaataaag agcaagatcc ggccaaacgt   1680
tatgagaaat atgctgatat tcaagcttgg ttgattgata gttctttagt tcttccaagt   1740
gtttcgcgtg ggggaacacc atcattgaga agaaccgtac catttgctgc tgcctatggt   1800
ttaaccggta caaaaggggt tgaatcatat aaatacctca aagtacaaga taagattgtc   1860
acaacagacg aatatgcaaa agccagagaa aaatggttga aagaaaaaga agaatccaat   1920
aaaaaagccc aagaagaatt ggcaaaacat gtcaaa                             1956
 
SeqID 63
gtggaacagc attcagatgt ctgttacatt ttttatagga gagaaagatt gaaaacaaaa     60
attggattag caagtatctg tttactaggc ttggcaacta gtcatgtcgc tgcaaatgaa    120
actgaagtag caaaaacttc gcaggataca acgacagctt caagtagttc agagcaaaat    180
cagtcttcta ataaaacgca aacgagcgca gaagtacaga ctaatgctgc tgcccactgg    240
gatggggatt attatgtaaa ggatgatggt tctaaagctc aaagtgaatg gatttttgac    300
aactactata aggcttggtt ttatattaat tcagatggtc gttactcgca gaatgaatgg    360
catggaaatt actacctgaa atcaggtgga tatatggccc aaaacgagtg gatctatgac    420
agtaattaca agagttggtt ttatctcaag tcagatgggg cttatgctca tcaagaatgg    480
caattgattg gaaataagtg gtactacttc aagaagtggg gttacatggc taaaagccaa    540
tggcaaggaa gttatttctt gaatggtcaa ggagctatga tgcaaaatga atggctctat    600
gatccagcct attctgctta tttttatcta aaatccgatg gaacttatgc taaccaagag    660
tggcaaaaag tgggcggcaa atggtactat ttcaagaagt ggggctatat ggctcggaat    720
gagtggcaag gcaactacta tttgactgga agtggtgcca tggcgactga cgaagtgatt    780
atggatggta ctcgctatat ctttgcggcc tctggtgagc tcaaagaaaa aaaagatttg    840
aatgtcggct gggttcacag agatggtaag cgctatttct ttaataatag agaagaacaa    900
gtgggaaccg aacatgctaa gaaagtcatt gatattagtg agcacaatgg tcgtatcaat    960
gattggaaaa aggttattga tgagaacgaa gtggatggtg tcattgttcg tctaggttat   1020
agcggtaaag aagacaagga attggcgcat aacattaagg agttaaaccg tctgggaatt   1080
ccttatggtg tctatctcta tacctatgct gaaaatgaga ccgatgctga gagtgacgct   1140
aaacagacca ttgaacttat aaagaaatac aatatgaacc tgtcttaccc tatctattat   1200
gatgttgaga attgggaata tgtaaataag agcaagagag ctccaagtga tacaggcact   1260
tgggttaaaa tcatcaacaa gtacatggac acgatgaagc aggcgggtta tcaaaatgtg   1320
tatgtctata gctatcgtag tttattacag acgcgtttaa aacacccaga tattttaaaa   1380
catgtaaact gggtagcggc ctatacgaat gctttagaat gggaaaaccc tcattattca   1440
ggaaaaaaag gttggcaata tacctcttct gaatacatga aaggaatcca agggcgcgta   1500
gatgtcagcg tttggtat                                                 1518
 
SeqID 64
atggcaaaag aaccgtggca agaagatatc tatgatcaag aagaatcaag agcagagcgt     60
cggcatcgaa accacggagg ggctgatagg atggctaatc gtattttgac gatcctagct    120
agtattttct ttgtaattgt ggtggtgatg gtcatcgttc tcatctatct atcatcgggg    180
gggagtaatc gcacagcagc cttaaaaggc tttcatgatt ctgatgccag tgtagtacaa    240
atctcatctt caagtagttc tcagcctgag cagagttcag agccagaatc tacttctagt    300
agttcagaag aagctgctaa tcctgaagga acgattaaag ttctcgcagg agaaggggaa    360
gcagctattg ccgctcgtgc aggaatctcc attgctcagt tagaggcctt gaatcctggg    420
cacatggcta caggatcttg gtttgctaat ccaggtgatg ttataaaaat aaaa          474
 
SeqID 65
atgccaatta catcattaga aataaaggac aagacttttg gaactcgatt cagaggtttt     60
gatccagaag aagtcgatga atttttagat attgtggttc gtgattacga agatcttgtg    120
cgtgcgaatc atgataaaaa tttgcgtatt aagagtttag aagagcgttt gtcttacttt    180
gatgaaataa aagattcatt gagccagtct gtattgattg ctcaggatac agctgagaga    240
gtgaaacagg cggcgcatga acgttcaaac aatatcattc atcaagcaga gcaagatgcg    300
caacgcttgt tggaagaagc taaatataag gcaaacgaga ttcttcgtca agcaactgat    360
aatgctaaga aagtcgctgt tgaaacagaa gaattgaaga acaagagccg tgtcttccac    420
caacgtctca aatctacaat tgagagtcag ttggctattg ttgaatcttc agattgggaa    480
gatattctcc gtccaacagc tacttatctt caaaccagtg atgaagcctt taaagaagtg    540
gttagcgaag tacttggaga accgattcca gctccaattg aagaagaacc aattgatatg    600
acacgtcagt tctctcaagc agaaatggca gaattacaag ctcgtattga ggtagccgat    660
aaagaattgt ctgaatttga agctcagatt aaacaggaag tggaagctcc aactcctgta    720
gtgagtcctc aagttgaaga agagcctctg ctcatccagt tggcccaatg tatgaagaac    780
cagaag                                                               786
 
SeqID 66
atgtctttaa aagatagatt cgatagattt atagattatt ttacggagga tgaggattca     60
agtctccctt atgaaaaaag agatgagcct gtgtttactt cagtaaattc ttcacaggaa    120
ccggctctcc caatgaatca accttcacag tcggctggca caaaagagaa caatatcacc    180
agacttcatg caagacaaca ggaattggca aatcagagtc agcgtgcaac ggataaggtc    240
attatagatg ttcgttatcc tagaaaatat gaggatgcaa cagaaattgt tgatttattg    300
gcaggaaacg aaagtatctt gattgatttt cagtatatga cagaggtgca ggctcgtcgt    360
tgtttggact atttggatgg agcttgtcat gttttagctg gaaatttgaa aaaggtagct    420
tctaccatgt atttgttgac accagtgaac gttattgtaa atgttgaaga tatccgttta    480
ccagatgaag atcaacaggg tgagttcggt tttgatatga agcgaaatag agtacga       537
 
SeqID 67
atgtcagatt tgaaaaaata cgaaggtgtc attccagcct tctacgcatg ttatgatgat     60
caaggagaag taagcccaga acgtacgcgt gccttggttc aatacttcat tgataaaggt    120
gttcaaggtc tttatgtcaa tggttcttct ggtgaatgta tctaccaaag cgttgaagat    180
cgcaagttga ttttggaaga agtcatggcg gtagccaaag gtaaattgac cattattgcc    240
catgttgctt gcaataatac taaagatagt atggaacttg ctcgccatgc tgaaagcttg    300
ggagtagatg ctattgcaac gattccacca atttatttcc gcttgccaga atactcagtt    360
gccaaatact ggaacgatat cagttctgca gctccaaaca cagactacgt gatttacaac    420
attcctcaat tggcaggggt tgctttgact ccaagccttt acacagaaat gttgaaaaat    480
cctcgtgtta tcggtgtgaa gaactcttct atgccagttc aagatatcca aacctttgtc    540
agccttggtg gagaagacca tatcgtcttt aatggtcctg atgagcagtt cctaggagga    600
cgcctcatgg gggctagggc tggtatcggt ggtacttatg gtgctatgcc agaactcttc    660
ttgaaactca atcagttgat tgcggataag gacctagaaa cagcgcgtga attgcagtat    720
gctatcaacg caatcattgg taaactcact tctgctcatg gaaatatgta cggtgtcatc    780
aaagaagtct tgaaaatcaa tgaaggcttg aatattggat ctgttcgttc accattgaca    840
ccagtgactg aagaagatcg tccagttgta gaagcggctg ctgccttgat tcgtgaaacc    900
aaggagcgct tcctc                                                     915
 
SeqID 68
atgaataaaa gaggtcttta ttcaaaacta ggaatttccg ttgtaggcat tagtctttta     60
atgggagtcc ccactttgat tcatgcgaat gaattaaact atggtcaact gtccatatct    120
cctatttttc aaggaggttc atatcaactg aacaataaga gtatagatat cagctctttg    180
ttattagata aattgtctgg agagagtcag acagtagtaa tgaaatttaa agcagataaa    240
ccaaactctc ttcaagcttt gtttggccta tctaatagta aagcaggctt taaaaataat    300
tacttttcaa ttttcatgag agattctggt gagataggtg tagaaataag agacgcccaa    360
aagggaataa attatttatt ttccagacca gcttcattat ggggaaaaca taaaggacag    420
gcagttgaaa atacactagt atttgtatct gattctaaag ataaaacata cacaatgtat    480
gttaatggaa tagaagtgtt ctctgaaaca gttgatacat ttttgccaat ttcaaatata    540
aatggtatag ataaggcaac actaggagct gttaatcgtg aaggtaagga acattacctc    600
gcaaaaggaa gtattgatga aatcagtcta tttaacaaag caattagtga tcaggaagtt    660
tcaactattc ccttgtcaaa tccatttcag ttaattttcc aatcaggaga ttctactcaa    720
gctaactatt ttagaatacc gacactatat acattaagta gtggaagagt tctatcaagt    780
attgatgcac gttatggtgg gactcatgat tctaaaagta agattaatat tgccacttct    840
tatagtgatg ataatgggaa aacgtggagt gagccaattt ttgctatgaa gtttaatgac    900
tatgaggagc agttagttta ctggccacga gataataaat taaagaatag tcaaattagt    960
ggaagtgctt cattcataga ttcatccatt gttgaagata aaaaatctgg gaaaacgata   1020
ttactagctg atgttatgcc tgcgggtatt ggaaataata atgcaaataa agccgactca   1080
ggttttaaag aaataaatgg tcattattat ttaaaactaa agaagaatgg agataacgat   1140
ttccgttata cagttagaga aaatggtgtc gtttataatg aaacaactaa taaacctaca   1200
aattatacta taaatgataa gtatgaagtt ttggagggag gaaagtcttt aacagtcgaa   1260
caatattcgg ttgattttga tagtggctct ttaagagaaa ggcataatgg aaaacaggtt   1320
cctatgaatg ttttctacaa agattcgtta tttaaagtga ctcctactaa ttatatagca   1380
atgacaacta gtcagaatag aggagagagt tgggaacaat ttaagttgtt gcctccgttc   1440
ttaggagaaa aacataatgg aacttactta tgtcccggac aaggtttagc attaaaatca   1500
agtaacagat tgatttttgc aacatatact agtggagaac taacctatct catttctgat   1560
gatagtggtc aaacatggaa gaaatcctca gcttcaattc cgtttaaaaa tgcaacagca   1620
gaagcacaaa tggttgaact gagagatggt gtgattagaa cattctttag aaccactaca   1680
ggtaagatag cttatatgac tagtagagat tctggagaaa catggtcgaa agtttcgtat   1740
attgatggaa tccaacaaac ttcatatggc acacaagtat ctgcaattaa atactctcaa   1800
ttaattgatg gaaaagaagc agtcattttg agtacaccaa attctagaag tggccgcaag   1860
ggaggccaat tagttgtcgg tttagtcaat aaagaagatg atagtattga ttggaaatac   1920
cactatgata ttgatttgcc ttcgtatggt tatgcctatt ctgcgattac agaattgcca   1980
aatcatcaca taggtgtact gtttgaaaaa tatgattcgt ggtcgagaaa tgaattgcat   2040
ttaagcaatg tagttcagta tatagatttg gaaattaatg atttaacaaa a            2091
 
SeqID 69
atgaatcgga gtgttcaaga acgtaagtgt cgttatagca ttaggaaact atcggtagga     60
gcggtttcta tgattgtagg agcagtggta tttggaacgt ctcctgtttt agctcaagaa    120
ggggcaagtg agcaacctct ggcaaatgaa actcaacttt cgggggagag ctcaacccta    180
actgatacag aaaagagcca gcttcttca gagactgaac tttctggcaa taagcaagaa     240
caagaaagga aagataagca agaagaaaaa attccaagag attactatgc acgagatttg    300
gaaaatgtcg aaacagtgat agaaaaagaa gatgttgaaa ccaatgcttc aaatggtcag    360
agagttgatt tatcaagtga actagataaa ctaaagaaac ttgaaaacgc aacagttcac    420
atggagttta agccagatgc caaggcccca gcattctata atctcttttc tgtgtcaagt    480
gctactaaaa aagatgagta cttcactatg gcagtttaca ataatactgc tactctagag    540
gggcgtggtt cggatgggaa acagttttac aataattaca acgatgcacc cttaaaagtt    600
aaaccaggtc agtggaattc tgtgactttc acagttgaaa aaccgacagc agaactacct    660
aaaggccgag tgcgcctcta cgtaaacggg gtattatctc gaacaagtct gagatctggc    720
aatttcatta aagatatgcc agatgtaacg catgtgcaaa tcggagcaac caagcgtgcc    780
aacaatacgg tttgggggtc aaatctacag attcggaatc tcactgtgta taatcgtgct    840
ttaacaccag aagaggtaca aaaacgtagt caacttttta aacgctcaga tttagaaaaa    900
aaactacctg aaggagcggc tttaacagag aaaacggaca tattcgaaag cgggcgtaac    960
ggtaacccaa ataaagatgg aatcaagagt tatcgtattc cagcacttct caagacagat   1020
aaaggaactt tgatcgcagg tgcagatgaa cgccgtctcc attcgagtga ctggggtgat   1080
atcggtatgg tcatcagacg tagtgaagat aatggtaaaa cttggggtga ccgagtaacc   1140
attaccaact tacgtgacaa tccaaaagct tctgacccat cgatcggttc accagtgaat   1200
atcgatatgg tgttggttca agatcctgaa accaaacgaa tcttttctat ctatgacatg   1260
ttcccagaag ggaagggaat ctttggaatg tcttcacaaa aagaagaagc ctacaaaaaa   1320
atcgatggaa aaacctatca aatcctctac cgtgaaggag aaaagggagc ttataccatt   1380
cgagaaaatg gtactgtcta tacaccagat ggtaaggcga cagactatcg cgttgttgta   1440
gatcctgtta aaccagccta tagcgacaag ggtgatctat acaagggtga ccaattacta    1500
ggaaatatct acttcacaac aaacaaaact tctccattta gaattgccaa ggatagctat    1560
ctatggatgt cctacagtga tgacgacggg aagacatggt cagctcctca agatattact    1620
ccgatggtca aagccgattg gatgaaattc ttgggtgtag gtcctggaac aggaattgta    1680
cttcggaatg ggcctcacaa gggacggatt ttgataccgg tttatacgac taataatgta    1740
tctcacttag atggctcgca atcttctcgt gtcatctatt cagatgatca tggaaaaact    1800
tggcatgctg gagaagcggt caacgataac cgtcaggtag acggtcaaaa gatccactct    1860
tctacgatga acaatagacg tgcgcaaaat acagaatcaa cggtggtaca actaaacaat    1920
ggagatgtta aactctttat gcgtggtttg actggagatc ttcaggttgc tacaagtaaa    1980
gacggaggag tgacttggga gaaggatatc aaacgttatc cacaggttaa agatgtctat    2040
gttcaaatgt ctgctatcca tacgatgcac gaaggaaaag aatacatcat cctcagtaat    2100
gcaggtggac cgaaacgtga aaatgggatg gtccacttgg cacgtgtcga agaaaatggt    2160
gagttgactt ggctcaaaca caatccaatt caaaaaggag agtttgccta taattcgctc    2220
caagaattag gaaatgggga gtatggcatc ttgtatgaac atactgaaaa aggacaaaat    2280
gcctataccc tatcatttag aaaatttaat tgggaatttt tgagcaaaaa tctgatttct    2340
cctaccgaag cgaactagag agatgggcaa aggagagatg ggcaaaggag ttattggctt    2400
ggagttcgac tcagaagtat tggtcaacaa ggctccaacc cttcaattgg caaatggtaa    2460
aacagcgact ttcctaaccc agtatgatag caagaccttg ttgtttgcag tagataagga    2520
agatatcgga caggaaatta ttggtatagc taaaggaagc atcgaaagta tgcataatct    2580
tcctgtaaat ctagcaggtg ccagagttcc tggcggagta aatggtagca aagcagcggt    2640
gcatgaagtt ccagaattta cagggggagt taatggtaca gagccagctg ttcatgaaat    2700
cgcagagtat aagggatctg attcgcttgt aactcttact acaaaaaaag attatactta    2760
caaagctcct cttgctcagc aggcacttcc tgaaacagga aacaaggaga gtgacctcct    2820
agcttcacta ggactaacag ctttcttcct tggtctgttt acgctaggga aaaagagaga    2880
acaa                                                                 2884
 
SeqID 70
atgatccaaa tcggcaagat ttttgccgga cgctatcgga ttgtcaaaca gattggtcga      60
ggaggtatgg cggatgtcta cctagccaaa gacttaatct tagatgggga agaagtggca     120
gtgaaggttc tgaggaccaa ctaccagacg gacccgatag ctgtagctcg ttttcagcgt     180
gaagcgagag ctatggcaga tctagaccat cctcatatcg ttcggataac agatattggc     240
gaggaagacg gtcaacagta cctagctatg gagtatgtgg ctggactgga cctcaaacgc     300
tatatcaagg aacattatcc tctttctaat gaagaagcag tccgtatcat gggacaaatt     360
ctcttggcta tgcgcttggc ccatactcga ggaattgttc acagggactt gaaacctcaa     420
aatatcctct tgacaccaga tgggactgcc aaggtcacag actttgggat tgctgtagcc     480
tttgcagaga caagtctgac ccagactaac tcgatgttgg gctcagttca ttacttgtca     540
ccagagcagg cgcgtggttc gaaggcgact gtgcagagtg atatctatgc catggggatt     600
attttctatg agatgctgac aggccatatc ccttatgacg gggatagcgc ggtgaccatt     660
gccctccagc atttccagaa acccctgccg tccgttattg cagaaaatcc atctgtacct     720
caggctttag aaaatgttat tatcaaggca actgctaaaa agttgaccaa tcgctaccgc     780
tcggtttcag agatgtatgt ggacttgtct agtagcttgt cctacaatcg tagaaatgaa     840
agtaagttaa tctttgatga aacgagcaag gcagatacca agaccttgcc gaaggtttct     900
cagagtacct tgacatctat tcctaaggtt caagcgcaaa cagaacacaa atcaatcaaa     960
aacccaagcc aggctgtgac agaggaaact taccaaccac aagcaccgaa aaaacataga    1020
tttaagatgc gttacctgat tttgttggcc agccttgtat tggtggcagc ttctcttatt    1080
tggatactat ccagaactcc tgcaaccatt gccattccag atgtggcagg tcagacagtt    1140
gcagaggcca aggcaacgct caaaaaagcc aattttgaga ttggtgagga gaagacagag    1200
gctagtgaaa aggtggaaga agggcggatt atccgtacag atcctggcgc tggaactggt    1260
cgaaaagaag gaacgaaaat caatttggtt gtctcatcag gcaagcaatc tttccaaatt    1320
agtaattatg tcggtcggaa atcctctgat gtcattgcgg aattaaaaga gaaaaaagtt    1380
ccagataatt tgattaaaat tgaggaagaa gagtcgaatg agagtgaggc tggaacggtc    1440
ctgaagcaaa gtctaccaga aggtacgacc tatgacttga gcaaggcaac tcaaattgtt    1500
ttgacagtag ctaaaaaagc tacgacgatt caattaggga actatattgg acggaactct    1560
acagaagtaa tctcagaact caagcagaag aaggttcctg agaatttgat taagatagag    1620
gaagaagagt ccagcgaaag cgaaccagga acgattatga aacaaagtcc aggtgccgga    1680
acgacttatg atgtgagtaa acctactcaa attgtcttga cagtagctaa aaaagttaca    1740
agtgttgcca tgccgagtta cattggttct agcttggagt ttactaagaa caatttgatt    1800
caaattgttg ggattaagga agctaatata gaagttgtag aagtgacgac agcgcctgca    1860
ggtagtgcag aaggcatggt tgttgaacaa agtcctagag caggtgaaaa ggtagacctc    1920
aataagacta gagtcaagat ttcaatctac aaacctaaaa caacttcagc tactcct       1977
 
SeqID 71
atgacaaaac taatctttat ggggaccccc gacttttcag caacagtctt aaaaggactt      60
ttgacagatg accgttacga aattctagcc gttgtgaccc agccagaccg tgctgttggt     120
cgtaaaaaag ttatccaaga aaccccagtc aagcaggctg ccaaggaagc aggactatct     180
atctaccaac ctgaaaaatt atctggaagt ccagagatgg aagatcttat gaagctagga     240
gcagatggaa ttgtgactgc tgcttttggg cagtttctcc caagcaaact ccttgatagc     300
atggactttg ctgtcaacgt tcatgcctcc ctccttccta gacaccgtgg tggtgcgcct     360
atccattatg ccttgattca aggggatgag gaagctggtg tgaccatcat ggaaatggtt    420
aaggaaatgg atgcaggaga tatgatttct cgtcgcagca ttccgatcac agatgaggac    480
aatgttggca ccttgtttga aaaattggcg ctagttggtc gtgatttgct tttggacact    540
ctgcctgcct atattgctgg tgatatcaaa cctgaaccgc aggatacgag tcaggttacc    600
ttctctccaa atataaagcc agaggaagaa aaactggact ggaacaaaac caatcgtcaa    660
ctctttaacc aaattcgtgg aatgaacccc tggcctgttg cccatacttt ccttaagggc    720
gaccgcttta agatttatga agccctacca gtagaaggtc agggaaatcc aggtgagatt    780
ctctctatcg gcaagaaaga attgattgtc gcaacggctg aaggggctct atccctcaaa    840
caagtgcagc cagctggtaa gcctaagatg gacattgctt ccttcctcaa cggagttgga    900
cgtacattga ctgtaggaga acgatttggt gac                                 933
 
SeqID 72
gtgtttagac gtttaggtca agatttccag cttaggaaag tgaaaaagat tttaaagcag     60
attaatgccc tgaaaggcaa gatgtcctct ctttcggatc aagaattagt agctaaaaca    120
gtagagtttc gtcagcgtct ttccgaggga gaaagtctag acgatatttt ggttgaagct    180
tttgctgtgg tgcgtgaagc agataagcgg attttaggga tgtttcctta tgatgttcaa    240
gtcatgggag ctattgtcat gcactatgga aatgttgctg agatgaatac gggggaaggt    300
aagaccttga cagctaccat gcctgtctat ttgaacgctt tttcaggaga aggagtgatg    360
gttgtgactc ctaatgagta tttatcaaag cgtgatgccg aggaaatggg tcaagtttat    420
cgttttctag gattgaccat tggtgtacca tttacggaag atccaaagaa ggagatgaaa    480
gctgaagaaa agaagcttat ctatgcttcg gatatcatct acacaaccaa tagtaattta    540
ggttttgatt atctaaatga taacctagcc tcgaatgaag aaggtaagtt tttacgaccg    600
tttaactatg tgattattga tgaaattgat gatatcttgc ttgatagtgc acaaactcct    660
ctgattattg cgggttctcc tcgtgttcag tctaattact atgcgatcat tgatacactt    720
gtaacaacct tggtcgaagg agaggattat atctttaaag aggagaaaga ggaggtttgg    780
ctcactacta agggggccaa gtctgctgag aatttcctag ggattgataa tttatacaag    840
gaagagcatg cgtcttttgc tcgtcatttg gtttatgcga ttcgagctca taagctcttt    900
actaaagata aggactatat cattcgtgga aatgagatgg tactggttga taagggaaca    960
gggcgtctaa tggaaatgac taaacttcaa ggaggtctcc atcaggctat tgaagccaag   1020
gaacatgtca aattatctcc tgagacgcgg gctatggcct cgatcaccta tcagagtctt   1080
tttaagatgt ttaataagat atctggtatg acagggacag gtaaggtcgc ggaaaaagag   1140
tttattgaaa cttacaatat gtctgtagta cgcattccaa ccaatcgtcc gagacaacgg   1200
attgactatc cagataatct atatatcact ttacctgaaa aagtgtatgc atccttggag   1260
tacatcaagc aataccatgc taagggaaat cctttactcg tttttgtagg ctcagttgaa   1320
atgtctcaac tctattcgtc tctcttgttt cgtgaaggga ttgcccataa tgtcctaaat   1380
gctaataatg cggcgcgtga ggctcagatt atctccgagt caggtcagat gggggctgtg   1440
acagtggcta cctctatggc aggacgtggt acggatatca agcttggtaa aggagtcgca   1500
gagcttgggg gcttgattgt tattgggact gagcggatgg aaagtcagcg gatcgaccta   1560
caaattcgtg gccgttctgg tcgtcaggga gatcctggta tgagtaaatt ttttgtatcc   1620
ttagaggatg atgttatcaa gaaatttggt ccatcttggg tgcataaaaa gtacaaagac   1680
tatcaggttc aagatatgac tcaaccggaa gtattgaaag gtcgtaaata ccggaaacta   1740
gtcgaaaagg ctcagcatgc cagtgatagt gctggacgtt cagcacgtcg tcagactctg   1800
gagtatgctg aaagtatgaa tatacaacgg gatatagtct ataaagagag aaatcgtcta   1860
atagatggtt ctcgtgactt agaggatgtt gttgtggata tcattgagag atatacagaa   1920
gaggtagcgg ctgatcacta tgctagtcgt gaattattgt ttcactttat tgtgaccaat   1980
attagttttc atgttaaaga ggttccagat tatatagatg taactgacaa aactgcagtt   2040
cgtagcttta tgaagcaggt gattgataaa gaactttctg aaaagaaaga attacttaat   2100
caacatgact tatatgaaca gtttttacga ctttcactgc ttaaagccat tgatgacaac   2160
tgggtagagc aggtagacta tctacaacag ctatccatgg ctatcggtgg tcaatctgct   2220
agtcagaaaa atccaatcgt agagtactat caagaagcct acgcgggctt tgaagctatg   2280
aaagaacaga ttcatgcgga tatggtgcgt aatctcctga tggggctggt tgaggtcact   2340
ccaaaaggtg aaatcgtgac tcattttcca                                    2370
 
SeqID 73
atgaccgaaa cggtagaaga taaagtaagt cattcaatta ctgggcttga tatcctcaag     60
gggatagttg ctgcgggagc tgtcataagt ggaaccgttg caactcaaac gaaggtattt    120
acaaatgagt cagcagtact tgaaaaaact gtagagaaaa cggatgcttt ggcaacaaat    180
gatacagtag ttctaggtac gatatctaca agtaattcag cgagttcaac tagtttgtca    240
gcttcagagt cggcaagtac atctgcatct gagtcagcct caaccagcgc ttcgacctca    300
gcaagtacaa gtgcatcaga atcagcaagt acatcggctt cgacaagtat ttctgcatca    360
tctactgtgg taggttcaca aacagctgcc gctacagaag caactgctaa gaaggtcgaa    420
gaagatcgta agaaaccagc tagtgattat gtagcatcag ttacaaatgt caatctccaa    480
tcttatgcta agcgacgcaa gcgttcagtg gattccatcg agcaattgct ggcttctata    540
aaaaatgctg ctgttttttc tggcaatacg attgtaaatg gcgcccctgc aattaatgca    600
agtctaaaca ttgctaaaag tgagacaaaa gtttatacag gtgaaggtgt agattcggta    660
tatcgtgttc caatttacta taaattgaaa gtgacaaatg atggttcaaa attgaccttt    720
acctatacgg ttacgtatgt gaatcctaaa acaaatgatc ttggtaatat atcaagtatg    780
cgtcctggat attctatcta taattcaggt acttcaacac aaacaatgtt aacccttggc    840
agtgatcttg gtaaaccttc aggtgtaaag aactacatta ctgacaaaaa tggtagacag     900
gttctatcct ataatacatc tacaatgacg acgcagggta gtgggtatac ttggggaaat     960
ggtgcccaaa tgaatggttt ctttgctaag aaaggatatg gattaacatc atcttggact    1020
gtaccaatta ctggaacgga tacatccttt acatttaccc cttacgctgc tagaacagat    1080
agaattggaa ttaactactt caatggtgga ggaaaggtag ttgaatctag cacgaccagt    1140
cagtcacttt cacagtctaa gtcactctca gtaagtgcta gtcaaagcgc ctcagcttca    1200
gcatcaacaa gtgcgtcggc ttcagcatca accagtgcct cggcttcagc gtcaaccagt    1260
gcgtcagctt cagcaagtac cagtgcttca gtctcagcat caacaagtgc ttcagcctca    1320
gcatcgacaa gtgcctcggc ttcagcaagc acatcagcat ctgaatcagc gtcaaccagt    1380
gcttcggctt cagcaagtac cagtgcttca gcttcagcat caaccagcgc ctcggcctca    1440
gcaagcacct cagcttctga atcggcctca accagcgcct cggcctcagc aagcacctca    1500
gcttctgaat cggcctcaac cagcgcctca gcctcagcat caacgagtgc ttcggcttca    1560
gcaagcacaa gcgcctcggg ttcagcatca acgagtacgt cagcttcagc gtcaaccagt    1620
gcttcagcct cagcatcaac aagtgcgtca gcctcagcaa gtatctcagc gtctgaatcg    1680
gcatcaacga gtgcgtctga gtcagcatca acgagtacgt cagcctcagc aagcacctca    1740
gcttctgaat cggcctcaac cagtgcgtca gcctcagcat cgacaagcgc ctcagcttca    1800
gcaagtacca gtgcttcagc ctcagcgtcg acaagtgcgt cggcctcaac cagtgcatct    1860
gaatcggcat caaccagtgc gtcagcctca gcaagtacta gtgcatcggc ttcagcatca    1920
accagtgcct cggcttcagc gtcaaccagt gcgtcagctt cagcaagtac cagtgcttca    1980
gtctcagcat caacaagtgc ttcagcctca gcatcgacaa gtgcctcggc ttcagcaagc    2040
acatcagcat ctgaatcagc gtcgacaagc gcctcagctt cagcaagtac cagtgcgtca    2100
gcctcagcgt cgacaagtgc gtcagcctca gcaagtacta gtgcatcagc ttcagcatca    2160
acgagtgcat cggcttcggc gtcaaccagt gcatcagagt cagcaagtac cagtgcgtca    2220
gcttccgcat caacaagtgc ctcggcttca gcaagcacca gtgcgtcggc ttcagcaagt    2280
actagcgcct cagcctcagc ctcaaccagt gcgtcagcct cagcaagtat ctcagcgtct    2340
gaatcggcat caacgagtgc gtccgcttca gcaagtacta gcgcctcagc ctcagcgtca    2400
acaagtgcat cggcttcagc gtcaacgagt gcgtctgaat cggcatcaac gagtgcgtcc    2460
gcttcagcaa gtactagcgc ctcagcctca gcgtcaacaa gtgcatcggc ttcagcatca    2520
acgagtgcgt ccgcttcagc aagtactagc gcctcagcct cagcgtcaac aagtgcatcg    2580
gcttcagcgt caacgagtgc gtctgagtca gcatcaacga gtgcgtcagc ctcagcaagc    2640
acatcagctt ctgaatctgc atcaaccagt gcgtcagcct cagcatcgac aagcgcctca    2700
gcttcagcaa gtaccagtgc gtcagcctca gcgtcgacaa gtgcgtcggc ttcagcaagt    2760
accagtgcgt cagcctcagc aagtaccagt gcgtcagcct cagcgtcgac aagtgcgtcg    2820
gcctcaacca gtgcatctga atcggcatca accagtgcgt cagcctcagc aagtactagt    2880
gcatcagctt cagcatcaac gagtgcatcg gcttcagcat caaccagtgc atcagagtca    2940
gcaagtacca gtgcgtcagc ttccgcatca acaagtgcct cggcttcagc aagtactagc    3000
gcctcagcct cagcgtcaac aagtgcttca gcttccgcgt caaccagcgc ctcggcctca    3060
gcaagtatct cagcgtctga atcggcatca acaagtgcct cggcttcagc atcaacgagt    3120
gcatcagtct cagcaagcac cagtgcgtcg gcctcagcaa gcaccagcgc gtctgaatcc    3180
gcatcaacca gtgcctcagc ttcagcaagt acctcagcat ctgaatcagc atcaacaagt    3240
gcctcggctt cagcaagcac aagtgcttca gcctcagcaa gtatctcagc gtctgaatcg    3300
gcatcaacga gtgcgtccgc ttcagcaagt actagcgcct cagcatcagc gtcaacaagt    3360
gcttcggctt cagcgtcaac gagtgcgtct gagtcagcat caacgagtac gtcagcctca    3420
gcaagcacat cagcttctga atctgcatca accagtgcgt cagcctcagc atcgacaagc    3480
gcctcagctt cagcaagtac cagtgcgtca gcctcagcaa gtaccagtgc ttcagcctca    3540
gcgtcgacaa gtgcgtcggc ctcaaccagt gcatctgaat cggcatcaac cagtgcgtca    3600
gcctcagcaa gtactagcgc ctcagcctca gcatcaacga gtgcgtccgc ttcagcaagt    3660
actagtgcat cagcttcagc aagtactagc gcctcagcct cagcgtcgac aagcgcctca    3720
gcttcagcaa gtaccagtgc gtcagcctca gcgtcgacaa gtgcgtcggc ttcagcaagt    3780
acctcagcgt ctgaatcagc atcaacaagt gcgtcggctt cagcatcaac gagtgcatca    3840
gcttcagcat caacaagtgc ttcagcttca gcaagtacca gtgcgtcggc ttcagcatca    3900
acgagtgctt cagtctcagc gtcaaccagt gcctctgaat ccgcatcaac aagtgcctcg    3960
gcttcagcaa gcaccagtgc ttcggcttca gcgtcaacga gtgcgtctga gtcagcatca    4020
acgagtgcgt cagcctcagc aagcacatca gcttctgaat ctgcatcaac cagtgcgtca    4080
gctcccgcat caacaagcgc ctcggcctca gcaagtacaa gtgcttcagc ctcagcatca    4140
accagtgcat cagcttcagc ctcaacaagt gcttcagcct cagcgtcaac cagtgcctcg    4200
gcttcagcaa gtaccagtgc gtcagcttca gcaagcacaa gtgcgtcagc ttcagcatca    4260
accagtgctt cggcttcggc atcaacaagt gcctcagcat cagcatcaac gagtgcgtca    4320
gcctcagcaa gtactagtgc atcagcatca gcatcaacca gtgcatcagc ctcagcaagt    4380
atctcagcgt ctgaatcggc atcaacgagt gcatcagcat cagcatcaac gagtgcatcg    4440
gcttcagcgt caaccagtgc atcagtctca gcaagcacca gtgcgtcggc ttcagcatca    4500
acgagtgcct cagcctcagc aagtatctca gcgtctgaat cggcatcaac gagtgcgtca    4560
gcctcagcaa gtactagtgc atcggcttca gcaagcacca gtgcgtcggc ttcagcatca    4620
accagtgcct cagcctcagc aagtatctca gcgtctgaat cggcatcaac gagtgcgtca    4680
gcctcagcaa gtactagtgc atcagcatca gcatcaacga gtgcatcggc ttcagcaagt    4740
accagcgcct cagcttcagc aagcaccagt gcgtcagcct cagcaagtac cagcgcctca    4800
gcctcagcaa gcaccagtgc ctcagcttca gcaagtacca gtgcgtcagc ctcagcgtcg    4860
acaagtgcgt cggcttcagc aagtacctca gcgtctgaat cagcatcaac gagtgcatca    4920
gcttcagcat caacaagtgc ttcagcttca gcaagtacca gtgcgtcggc ttcagcatca    4980
acgagtgctt cagtctcagc gtcaaccagt gcctctgaat cagcatcaac aagtgcctcg    5040
gcttcagcaa gcaccagtgc gtcggcttca gcaagtacta gtgcatcggc ttcagcatcg    5100
acaagtgcgt ctgaatcggc atcaacgagt gcttcggctt cagcatcaac gagtgcgtca    5160
gcctcagcaa gcacatcagc ttctgaatct gcatcaacca gtgcgtccgc ttcagcgtca    5220
accagtgcgt cggcttcagc gtcgacaagt gcttcggctt cagcatcaac gagtgcgtcg    5280
gcctcagcaa gcgcaagtac ctcagcgtca gcttccgcct caaccagtgc gtcggcttca    5340
gcaagcacaa gtgcgtcagc ctcagcaagt atctcagcgt ctgaatcggc atcaacgagt    5400
gcgtctgagt cagcatcaac gagtacgtca gcctcagcaa gcacatcagc ttctgaatct    5460
gcatcaacca gtgcgtcagc ctcagcatcg acaagcgcct cagcttcagc aagtaccagt    5520
gcttcagcct cagcgtcgac aagtgcgtcg gcctcaacca gtgcatctga atcggcatca    5580
accagtgcgt cagcctcagc aagtactagt gcatcagctt cagcatcaac gagtgcatcg    5640
gcttcagcat caaccagtgc ctcggcttca gcgtcaacca gtgcgtcagc ttcagcaagt    5700
accagtgctt cagtctcagc atcaacaagt gcttcagcct cagcatcgac aagtgcctcg    5760
gcttcagcaa gcacatcagc atctgaatca gcgtcgacaa gcgcctcagc ttcagcaagt    5820
accagtgcgt cagcctcagc gtcgacaagt gcgtcagcct cagcaagtac tagtgcatca    5880
gcttcagcat caacgagtgc atcggcttcg gcgtcaacca gtgcatcaga gtcagcaagt    5940
accagtgcgt cagcttccgc atcaacaagt gcctcggctt cagcaagcac cagtgcgtcg    6000
gcttcagcaa gtactagcgc ctcagcctca gcctcaacca gtgcgtcagc ctcagcaagt    6060
atctcagcgt ctgaatcggc atcaacgagt gcgtccgctt cagcaagtac tagcgcctca    6120
gcctcagcgt caacaagtgc atcggcttca gcgtcaacga gtgcgtctga atcggcatca    6180
acgagtgcgt ccgcttcagc aagtactagc gcctcagcct cagcgtcaac aagtgcatcg    6240
gcttcagcat caacgagtgc gtccgcttca gcaagtacta gcgcctcagc ctcagcgtca    6300
acaagtgcat cggcttcagc gtcaacgagt gcgtctgagt cagcatcaac gagtgcgtca    6360
gcctcagcaa gcacatcagc ttctgaatct gcatcaacca gtgcgtcagc ctcagcatcg    6420
acaagcgcct cagcttcagc aagtaccagt gcgtcagcct cagcgtcgac aagtgcgtcg    6480
gcttcagcaa gtaccagtgc gtcagcctca gcaagtacca gtgcgtcagc ctcagcgtcg    6540
acaagtgcgt cggcctcaac cagtgcatct gaatcggcat caaccagtgc gtcagcctca    6600
gcaagtacta gtgcatcagc ttcagcatca acgagtgcat cggcttcagc atcaaccagt    6660
gcatcagagt cagcaagtac cagtgcgtca gcttccgcat caacaagtgc ctcggcttca    6720
gcaagtacta gcgcctcagc ctcagcgtca acaagtgctt cagcttccgc gtcaaccagc    6780
gcctcggcct cagcaagtat ctcagcgtct gaatcggcat caacaagtgc ctcggcttca    6840
gcatcaacga gtgcatcagt ctcagcaagc accagtgcgt cggcctcagc aagcaccagc    6900
gcgtctgaat ccgcatcaac cagtgcctca gcttcagcaa gtacctcagc atctgaatca    6960
gcatcaacaa gtgcatcggc ttcagcaagc acaagtgctt cagcctcagc aagtatctca    7020
gcgtctgaat cggcatcaac gagtgcgtcc gcttcagcaa gtactagcgc ctcagcatca    7080
gcgtcaacaa gtgcttcggc ttcagcgtca acgagtgcgt ctgagtcagc atcaacgagt    7140
acgtcagcct cagcaagcac atcagcttct gaatctgcat caaccagtgc gtcagcctca    7200
gcatcgacaa gcgcctcagc ttcagcaagt accagtgcgt cagcctcagc aagtaccagt    7260
gcttcagcct cagcgtcgac aagtgcgtcg gcctcaacca gtgcatctga atcggcatca    7320
accagtgcgt cagcctcagc aagtactagc gcctcagcct cagcatcaac gagtgcgtcc    7380
gcttcagcaa gtactagtgc atcagcatca gcatcaacga gtgcatcggc ttcagcaagt    7440
accagcgcct cagcttcagc aagcaccagt gcgtcagcct cagcaagtac cagcgcctca    7500
gcctcagcaa gcaccagtgc ctcagcttca gcaagtacca gtgcgtcagc ctcagcgtcg    7560
acaagtgcgt cggcttcagc aagtacctca gcgtctgaat cagcatcaac gagtgcatca    7620
gcttcagcat caacaagtgc ttcagcttca gcaagtacca gtgcgtcggc ttcagcatca    7680
acgagtgctt cagtctcagc gtcaaccagt gcctctgaat cagcatcaac aagtgcctcg    7740
gcttcagcaa gcaccagtgc gtcggcttca gcaagtacta gtgcatcggc ttcagcatcg    7800
acaagtgcgt ctgaatcggc atcaacgagt gcttcggctt cagcatcaac gagtgcgtca    7860
gcctcagcaa gcacatcagc ttctgaatct gcatcaacca gtgcgtccgc ttcagcgtca    7920
accagtgcgt cggcttcagc gtcgacaagt gcttcggctt cagcatcaac gagtgcgtcg    7980
gcctcagcaa gcgcaagtac ctcagcgtca gcttccgcct caaccagtgc gtccgcttca    8040
gcaagcacaa gtgcgtcagc ctcagcaagt atctcagcgt ctgaatcggc atcaacgagt    8100
gcgtcggcct cagcaagcgc aagtacctca gcgtcagctt ccgcctcaac cagtgcgtcg    8160
gcttcagcaa gcacaagtgc gtcagcctca gcaagtatct cagcgtctga atcggcatca    8220
acgagtgcgt ctgagtcagc atcaacgagt acgtcagcct cagcaagcac atcagcttct    8280
gaatcggcat caaccagtgc gtcagcctca gcatcgacaa gcgcctcagc ttcagcaagt    8340
accagtgctt cagcctcagc gtcgacaagt gcgtcggcct caaccagtgc atctgaatcg    8400
gcatcaacca gtgcgtcagc ctcagcaagt actagtgcat cagcttcagc atcaacgagt    8460
gcatcggctt cagcatcaac cagtgcctcg gcttcagcgt caaccagtgc gtcagcttca    8520
gcaagtacca gtgcttcagt ctcagcatca acaagtgctt cagcctcagc atcgacaagt    8580
gcctcggctt cagcaagcac atcagcatct gaatcagcgt cgacaagtgc gtcggcctca    8640
accagtgcat ctgaatcggc atcaaccagt gcgtcagcct cagcaagtac tagtgcatca    8700
gcttcagcat caacgagtgc atcggcttcg gcgtcaacca gtgcatcaga gtcagcaagt    8760
accagtgcgt cagcttccgc atcaacaagt gcctcggctt cagcaagcac atcagcatct    8820
gaatcagcgt caaccagtgc ttcggcttca gcaagtacca gtgcttcagc ttcagcatca    8880
accagcgcct cggcctcagc aagcacctca gcttctgaat cggcctcaac cagcgcctcg    8940
gcctcagcaa gcacctcagc ttctgaatcg gcctcaacca gcgcctcagc ctcagcatca    9000
acgagtgctt cggcttcagc aagcacaagc gcctcgggtt cagcatcaac gagtacgtca   9060
gcttcagcgt caaccagtgc ttcagcctca gcatcaacaa gtgcgtcagc ctcagcaagt   9120
atctcagcgt ctgaatcggc atcaacgagt gcgtctgagt cagcatcaac gagtacgtca   9180
gcctcagcaa gcacctcagc ttctgaatcg gcctcaacca gtgcgtcagc ctcagcatcg   9240
acaagcgcct cagcttcagc aagtaccagt gcttcagcct cagcgtcgac aagtgcgtcg   9300
gcctcaacca gtgcatctga atcggcatca accagtgcgt cagcctcagc aagtactagt   9360
gcatcggctt cagcatcaac cagtgcctcg gcttcagcgt caaccagtgc gtcagcttca   9420
gcaagtacca gtgcttcagt ctcagcatca acaagtgctt cagcctcagc atcgacaagt   9480
gcctcggctt cagcaagcac atcagcatct gaatcagcgt cgacaagcgc ctcagcttca   9540
gcaagtacca gtgcgtcagc ctcagcgtcg acaagtgcgt cagcctcagc aagtactagt   9600
gcatcagctt cagcatcaac gagtgcatcg gcttcggcgt caaccagtgc atcagagtca   9660
gcaagtacca gtgcgtcagc ttccgcatca acaagtgcct cggcttcagc aagcaccagt   9720
gcgtcggctt cagcaagtac tagcgcctca gcctcagcct caaccagtgc gtcagcctca   9780
gcaagtatct cagcgtctga atcggcatca acgagtgcgt ccgcttcagc aagtactagc   9840
gcctcagcct cagcgtcaac aagtgcatcg gcttcagcgt caacgagtgc gtctgaatcg   9900
gcatcaacga gtgcgtccgc ttcagcaagt actagcgcct cagcctcagc gtcaacaagt   9960
gcatcggctt cagcatcaac gagtgcgtcc gcttcagcaa gtactagcgc ctcagcctca  10020
gcgtcaacaa gtgcatcggc ttcagcgtca acgagtgcgt ctgagtcagc atcaacgagt  10080
gcgtcagcct cagcaagcac atcagcttct gaatctgcat caaccagtgc gtcagcctca  10140
gcatcgacaa gcgcctcagc ttcagcaagt accagtgcgt cagcctcagc gtcgacaagt  10200
gcgtcggctt cagcaagtac cagtgcgtca gcctcagcaa gtaccagtgc gtcagcctca  10260
gcgtcgacaa gtgcgtcggc ctcaaccagt gcatctgaat cggcatcaac cagtgcgtca  10320
gcctcagcaa gtactagtgc atcagcttca gcatcaacga gtgcatcggc ttcagcatca  10380
accagtgcat cagagtcagc aagtaccagt gcgtcagctt ccgcatcaac aagtgcctcg  10440
gcttcagcaa gtactagcgc ctcagcctca gcgtcaacaa gtgcttcagc ttccgcgtca  10500
accagcgcct cggcctcagc aagtatctca gcgtctgaat cggcatcaac aagtgcctcg  10560
gcttcagcat caacgagtgc atcagtctca gcaagcacca gtgcgtcggc ctcagcaagc  10620
accagcgcgt ctgaatccgc atcaaccagt gcctcagctt cagcaagtac ctcagcatct  10680
gaatcagcat caacaagtgc ctcggcttca gcaagcacaa gtgcttcagc ctcagcaagt  10740
atctcagcgt ctgaatcggc atcaacgagt gcgtccgctt cagcaagtac tagcgcctca  10800
gcatcagcgt caacaagtgc ttcggcttca gcgtcaacga gtgcgtctga gtcagcatca  10860
acgagtacgt cagcctcagc aagcacatca gcttctgaat ctgcatcaac cagtgcgtca  10920
gcctcagcat cgacaagcgc ctcagcttca gcaagtacca gtgcgtcagc ctcagcaagt  10980
accagtgctt cagcctcagc gtcgacaagt gcgtcggcct caaccagtgc atctgaatcg  11040
gcatcaacca gtgcgtcagc ctcagcaagt actagcgcct cagcctcagc atcaacgagt  11100
gcgtccgctt cagcaagtac tagtgcatca gcttcagcaa gtactagcgc ctcagcctca  11160
gcgtcgacaa gcgcctcagc ttcagcaagt accagtgcgt cagcctcagc gtcgacaagt  11220
gcgtcggctt cagcaagtac ctcagcgtct gaatcagcat caacaagtgc gtcggcttca  11280
gcatcaacga gtgcatcagc ttcagcatca acaagtgctt cagcttcagc aagtaccagt  11340
gcgtcggctt cagcatcaac gagtgcttca gtctcagcgt caaccagtgc ctctgaatcc  11400
gcatcaacaa gtgcctcggc ttcagcaagc accagtgctt cggcttcagc gtcaacgagt  11460
gcgtctgagt cagcatcaac gagtgcgtca gcctcagcaa gcacatcagc ttctgaatct  11520
gcatcaacca gtgcgtcagc ttccgcatca acaagcgcct cggcctcagc aagtacaagt  11580
gcttcagcct cagcatcaac cagtgcatca gcttcagcct caacaagtgc ttcagcctca  11640
gcgtcaacca gtgcctcggc ttcagcaagt accagtgcgt cagcttcagc aagcacaagt  11700
gcgtcagctt cagcatcaac cagtgcttcg gcttcggcat caacaagtgc ctcagcatca  11760
gcatcaacga gtgcgtcagc ctcagcaagt actagtgcat cagcatcagc atcaaccagt  11820
gcatcagcct cagcaagtat ctcagcgtct gaatcggcat caacgagtgc atcagcatca  11880
gcatcaacga gtgcatcggc ttcagcgtca accagtgcat cagtctcagc aagcaccagt  11940
gcgtcggctt cagcatcaac gagtgcctca gcctcagcaa gtatctcagc gtctgaatcg  12000
gcatcaacga gtgcgtcagc ctcagcaagt actagtgcat cggcttcagc aagcaccagt  12060
gcgtcggctt cagcatcaac cagtgcctca gcctcagcaa gtatctcagc gtctgaatcg  12120
gcatcaacga gtgcgtcagc ctcagcaagt actagtgcat cagcatcagc atcaacgagt  12180
gcatcggctt cagcaagtac cagcgcctca gcttcagcaa gcaccagtgc gtcagcctca  12240
gcaagtacca gcgcctcagc ctcagcaagc accagtgcct cagcttcagc aagtaccagt  12300
gcgtcagcct cagcgtcgac aagtgcgtcg gcttcagcaa gtacctcagc gtctgaatca  12360
gcatcaacga gtgcatcagc ttcagcatca acaagtgctt cagcttcagc aagtatctca  12420
gcgtctgaat cggcatcaac gagtgcgtcc gcttcagcaa gtactagcgc ctcagcatca  12480
gcgtcaacaa gtgcttcggc ttcagcgtca acgagtgcgt ctgagtcagc atcaacgagt  12540
acgtcagcct cagcaagcac atcagcttct gaatctgcat caaccagtgc gtcagcctca  12600
gcatcgacaa gcgcctcagc ttcagcaagt accagtgcgt cagcctcagc aagtaccagt  12660
gcttcagcct cagcgtcgac aagtgcgtcg gcctcaacca gtgcatctga atcggcatca  12720
accagtgcgt cagcctcagc aagtactagc gcctcagcct cagcatcaac gagtgcgtcc  12780
gcttcagcaa gtactagtgc atcagcttca gcaagtacta gcgcctcagc ctcagcgtcg  12840
acaagcgcct cagcttcagc aagtaccagt gcgtcagcct cagcgtcgac aagtgcgtcg  12900
gcttcagcaa gtacctcagc gtctgaatca gcatcaacaa gtgcgtcggc ttcagcatca  12960
acgagtgcat cagcttcagc atcaacaagt gcttcagctt cagcaagtac cagtgcgtcg  13020
gcttcagcat caacgagtgc ttcagtctca gcgtcaacca gtgcctctga atccgcatca  13080
acaagtgcct cggcttcagc aagcaccagt gcttcggctt cagcgtcaac gagtgcgtct  13140
gagtcagcat caacgagtgc gtcagcctca gcaagcacat cagcttctga atctgcatca  13200
accagtgcgt cagcttccgc atcaacaagc gcctcggcct cagcaagtac aagtgcttca  13260
gcctcagcat caaccagtgc atcagcttca gcctcaacaa gtgcttcagc ctcagcgtca  13320
accagtgcct cggcttcagc aagtaccagt gcgtcagctt cagcaagcac aagtgcgtca  13380
gcttcagcat caaccagtgc ttcggcttcg gcatcaacaa gtgcctcagc atcagcatca  13440
acgagtgcgt cagcctcagc aagtactagt gcatcagcat cagcatcaac cagtgcatca  13500
gcctcagcaa gtatctcagc gtctgaatcg gcatcaacga gtgcatcagc atcagcatca  13560
acgagtgcat cggcttcagc gtcaaccagt gcatcagtct cagcaagcac cagtgcgtcg  13620
gcttcagcat caacgagtgc ctcagcctca gcaagtatct cagcgtctga atcggcatca  13680
acgagtgcgt cagcctcagc aagtactagt gcatcggctt cagcaagcac cagtgcgtcg  13740
gcttcagcat caaccagtgc ctcagcctca gcaagtatct cagcgtctga atcggcatca  13800
acgagtgcgt cagcctcagc aagtactagt gcatcagcct cagcatcaac gagtgcatcg  13860
gcttcagcaa gtaccagcgc ctcagcttca gcaagcacca gtgcgtcagc ctcagcaagt  13920
accagcgcct cagcctcagc aagcaccagt gcctcagctt cagcaagtac cagtgcgtca  13980
gcctcagcat caacaagtgc ttcagcttcg gcctcaacaa gtgcgtcagc ttcagcatca  14040
acgagtgcgt cggcttcagc aagcaccagt gcctcggcct cagcaagcac cagtgcttca  14100
gcttcagcat caacaagtgc gtcagcttca gcaagtacat cagtttcaaa ttcagcaaac  14160
cattcgaact cacaagttgg aaatacttct ggatcgacag gtaaatccca aaaagaattg  14220
cctaatacag gtactgagtc gtcaattgga tctgtgttac ttggagttct agcagctgtt  14280
acaggtattg gattggttgc gaaacgccgt aaacgtgatg aagaagag               14328
 
SeqID 74
atgtcaaacg aaaaaaacac aaacactaac gtagaaaaga aagatgctac tgttgtagct     60
cacgaaatca aaggggaact tacttacgaa gataaagtta tccaaaaaat cattggtctt    120
tcactagaaa acgtttcagg tcttttggga atcgatggtg gtttcttctc aaatcttaaa    180
gaaaaaatcg ttaacagcga tgacgtaaca agtggtgtta acgtagaagt tggtaaaaca    240
caagttgcag ttgacttaaa cgttattgtt gagtaccaaa aaaatgttcc agctttatat    300
tcagaaatca gagaaatcgt atcttcagaa gttgctaaaa tgactgactt ggaaattgtt    360
gaaatcaacg taaacgttgt cgacatcaaa actaaagaac agcatgaagc agactcagta    420
agccttcaag atcgcgtatc tgacgttgct gaatcaacag gagaattcac ttcagaacaa    480
ttcgaaaaag ctaaatctgg tcttggatct ggtttctcaa ctgttcaaga aaaagttagc    540
gaaggtgtag aagctgttaa aggtgcagca aatggtgtag tatctcacga aaacactcgt    600
gtaaac                                                               606
 
SeqID 75
atgacaaaag aaaaaaatgt aattttgact gctcgcgata ttgtcgtgga atttgacgtt     60
cgtgacaaag tattgacagc cattcgcggc gtttcccttg aactagtcga aggagaagta    120
ttagccttgg taggtgagtc aggatcaggt aaatctgttt tgacaaagac cttcacaggt    180
atgctcgaag aaaatggtcg tattgcccaa ggtagtattg actaccgtgg tcaggacttg    240
acagctttat cttctcacaa ggattgggaa caaattcgtg gtgctaagat tgcgactatc    300
ttccaggacc caatgactag tttggacccc attaaaacaa ttggtagtca gattacagaa    360
gttattgtaa aacaccaagg aaaaacagct aaagaagcga aagaattggc cattgactac    420
atgaataagg ttggcattcc agacgcagat agacgtttta atgaataccc attccaatat    480
tctggaggaa tgcgtcaacg tatcgttatt gctattgccc ttgcctgccg acctgatgtc    540
ttgatctgtg atgagccaac aactgccttg gatgtaacta ttcaagctca gattattgat    600
ttgctaaaat ctttacaaaa cgagtatcat ttcacaacaa tctttattac ccacgacctt    660
ggtgtggtgg caagtattgc ggataaggta gcggttatgt atgcaggaga aatcgttgag    720
tatggaacgg ttgaggaagt cttctatgac cctcgccatc catatacatg gagtctcttg    780
tctagcttgc ctcagcttgc tgatgataaa ggggatcttt actcaatccc aggaacacct    840
ccgtcacttt atactgacct gaaaggggat gcttttgcct tgcgttctga ctacgcaatg    900
cagattgact tcgaacaaaa agctcctcaa ttctcagtat cagagacaca ttgggctaaa    960
acttggcttc ttcatgagga tgctccgaaa gtagaaaaac cagctgtgat tgcaaatctc   1020
catgataaga tccgtgaaaa aatgggattt gcccatctgg ctgac                   1065
 
SeqID 76
atgaaaaaaa atcgtgtatt tgctacagca ggtcttgttt tattagcagc aggtgtactt     60
gcagcatgca gttcttcaaa atcatctgat tcatcagccc ctaaagctta tggctatgtt    120
tatacagcag acccagaaac cttggactac ctgatttcaa gtaaaaatag tacaacagta    180
gtgacttcaa atgggattga tggtttattc actaacgata attacggtaa tcttgctcct    240
gcagttgcag aggattggga agtctctaag gatggtttga cctacactta taagattcgt    300
aaaggggtta aatggtttac ctctgatgga gaagaatatg cagaggtgac ggctaaagat    360
ttcgtgaacg gtttaaaaca cgcagcagat aaaaaatcag aagctatgta tttagctgaa    420
aattcggtta aaggcttggc agattatcta tcaggaactt caacagattt ttcaacagtt    480
ggtgtcaagg cggttgatga ttatacgtta caatacactt tgaaccagcc tgaaccgttc    540
tggaactcta agttgaccta ttctattttc tggcctctga atgaagaatt cgaaacatca    600
aaaggaagcg attttgctaa accaacagat ccgacatcct tgctttataa tggtccattc    660
ttgttgaaag ggttgactgc aaaatcttct gtagagtttg taaaaaatga gcaatattgg    720
gataaagaaa atgtccacct agatactatc aatctagctt actatgatgg atcagatcag    780
gagtcgctag agcgtaactt cactagtgga gcttatagtt atgcccgtct ttaccctacc    840
agctccaact attctaaggt tgcagaagaa tacaaggaca atatctatta cacacaatca    900
ggctctggga ttgctggtct gggtgtgaat attgatcgcc aaagttacaa ctatacttct    960
aaaactacag attcagagaa agtagctact aagaaggcat tgcttaacaa agatttccgt   1020
caagccttga attttgctct tgatcgctca gcttactcag ctcaaatcaa tggtaaagat   1080
ggagcagctt tagcagttcg taatttattt gtaaaaccag actttgtttc agctggtgag   1140
aagacctttg gtgatttagt cgctgctcaa cttcctgctt atggtgatga gtggaaaggt   1200
gtgaatttag ctgatgggca ggatggttta ttcaatgctg acaaggccaa ggcagagttt   1260
gcgaaagcta agaaagcttt agaagcagac ggcgttcagt ttcctattca tctggacgtt   1320
ccagtagacc aagcatcaaa aaactacata tctcgtattc agtcctttaa acaatctgta   1380
gaaacagttc ttggtgttga aaatgtcgtt gttgatattc aacaaatgac aagtgatgaa   1440
ttccttaata ttacttacta tgctgccaat gcttcatctg aggattggga tgtatcagga   1500
ggagtttcat gggggccaga ctatcaagac ccatctactt acctggatat tttaaaaaca   1560
actagcagtg aaactacaaa aacatattta ggatttgata atccaaatag cccttcagta   1620
gttcaagttg gtttgaaaga atacgataaa ttagttgatg aagctgccag agagacaagc   1680
gacttgaatg tccgttatga aaaatatgca gcggctcaag catggttgac agatagttca   1740
ctctttattc ctgctatggc ttcttctggt gcagcaccag tgctttcacg aattgttcca   1800
tttactggag cttctgcgca aacaggctct aaggggtcag atgtttactt caaatatttg   1860
aaatcacaag ataaagtggt gactaaggaa gagtatgaaa aagctcgtga aaaatggttg   1920
aaagaaaaag ctgaatcaaa tgagaaagct caaaaagaat tggcaagtca tgtgaag      1977
 
SeqID 77
atggaaatta atgtgagtaa attaagaaca gatttgcctc aagtcggcgt gcaaccatat     60
aggcaagtac acgcacactc aactgggaat ccgcattcaa ccgtacagaa tgaagcggat    120
tatcactggc ggaaagaccc agaattaggt tttttctcgc acattgttgg gaacggttgc    180
atcatgcagg taggacctgt tgataatggt gcctgggacg ttgggggcgg ttggaatgct    240
gagacctatg cagcggttga actgattgaa agccattcaa ccaaagaaga gttcatgacg    300
gactaccgcc tttatatcga actcttacgc aatctagcag atgaagcagg tttgccgaaa    360
acgcttgata cagggagttt agctggaatt aaaacgcacg agtattgcac gaataaccaa    420
ccaaacaacc actcagacca cgttgaccct tatccatatc ttgctaaatg gggcattagc    480
cgtgagcagt ttaagcatga tattgagaac ggcttgacga ttgaaacagg ctggcagaag    540
aatgacactg gctactggta cgtacattca gacggctctt atccaaaaga caagtttgag    600
aaaatcaatg gcacttggta ctactttgac agttcaggct atatgcttgc agaccgctgg    660
aggaagcaca cagacggcaa ctggtactgg ttcgacaact caggcgaaat ggctacaggc    720
tggaagaaaa tcgctgataa gtggtactat ttcaacgaag aaggtgccat gaagacaggc    780
tgggtcaagt acaaggacac ttggtactac ttagacgcta aagaaggcgc catggtatca    840
aatgccttta tccagtcagc ggacggaaca ggctggtact acctcaaacc agacggaaca    900
ctggcagaca agccagaatt cacagtagag ccagatggct tgattacagt aaaa          954
 
SeqID 78
atgaaaaaaa aatattggac tttagcgata ttattctttt gtttgttcaa taattctgtt     60
actgctcaag aaatacctaa aaatcttgat ggcaatataa ctcacactca gactagcgaa    120
agtttttctg aatctgatga aaaacaggtt gactattcta ataaaaatca agaagaagta    180
gaccaaaata aatttcgtat tcaaatcgat aagacagaat tatttgtaac aacagataaa    240
catttagaaa aaaactgttg taaattggaa cttgaaccac aaataaataa cgatattgtt    300
aactctgaaa gtaataattt actaggcgaa gataatttag ataataaaat taaggaaaat    360
gtttctcatc tagataatag aggaggaaat atagagcatg acaaagataa cttagaatcg    420
tcgattgtaa gaaaatatga atgggatata gataaagtta ctggtggagg cgaaagttat    480
aaattatatt ctaaaagtaa ttctaaagtt tcaattgcta ttttagattc aggagtcgat    540
ttacaaaata ctggattact gaaaaatctt tcaaatcact caaaaaacta tgtccccaat    600
aaaggatatt taggaaaaga ggagggagag gaaggaataa tatcagatat tcaagataga    660
ttaggtcatg gtacggctgt tgtagctcaa attgtagggg atgacaatat taatggagta    720
aatcctcacg ttaatattaa cgtctataga atatttggta agtcgtcagc tagtccagat    780
tggattgtaa aagcaatttt tgatgctgta gatgatggca atgatattat caatcttagt    840
actggacaat atttaatgat tgatggagaa tatgaggacg gaacaaatga ttttgaaaca    900
tttttgaagt ataaaaaggc tattgattac gcgaatcaaa aaggagtaat tatagtagct    960
gcattaggga atgactccct aaatgtatca aatcagtcag atttattgaa acttattagt   1020
tcacgcaaaa aagtaagaaa accaggatta gtagttgatg ttccaagtta tttctcatct   1080
acaatttcgg tcggaggcat agatcgctta ggtaatttat cagattttag caataaaggg   1140
gattctgatg caatatatgc gcctgcaggc tcaacattat ctctttcaga attaggactt   1200
aataacttta ttaatgcaga aaaatataaa gaagattgga ttttttcggc aacactagga   1260
ggatatacgt atctttatgg aaactcattt gctgctccta aagtttctgg tgcgattgca   1320
atgattattg ataaatacaa attaaaagat cagccctata attatatgtt tgtaaaaaaa   1380
ttctggaaga aacattacca g                                             1401
 
SeqID 79
atgaaaaaag atgagttatt tgaaggcttt tacctaatca aatcagctga cctgaggcaa     60
actcgagctg ggaaaaacta cctagccttt accttccaag atgatagtgg cgagattgat    120
gggaagctct gggatgccca acctcataac attgaggcct ttaccgcagg taaggttgtc    180
cacatgaaag gacgccgaga agtttataac aatacccctc aagtcaatca aattactctc    240
cgcctgcctc aagctggtga acccaatgac ccagctgatt tcaaggtcaa gtcaccagtt    300
gatgtcaagg aaattcgtga ctacatgtcg caaatgattt tcaaaattga aaatcctgtc    360
tggcaacgga ttgtccgaaa tctctacacc aagtatgata aggaattcta ctcctatcca    420
gctgccaaga ccaaccacca tgcctttgaa acgggcttgg cctatcatac ggcgaccatg    480
gtgcgtttgg cagacgctat tagcgaagtt tatcctcagc tcaataagag cctgctctat    540
gcggggatta tgttgcatga cttagctaag gtcatcgagt tgacggggcc agaccagaca    600
gagtacacag tgcgaggtaa tcttcttgga catatcgctc tcattgatag cgaaattacc    660
aagacagtta tggaactcgg catcgatgat accaaggaag aagtcgtttt gcttcgtcat    720
gtcatcctca gtcaccacgg cttgcttgag tatggaagcc cagtccgtcc acgcattatg    780
gaagcagaga ttatccatat gattgacaat ctggatgcaa gcatgatgat gatgtcaaca    840
gctcttgctt tggtggataa aggagagatg accaataaaa tcttcgctat ggataatcgt    900
tccttctata aaccagattt agat                                           924
 
SeqID 80
gtgacgattc taggaaaaga tacagttcaa caatctgcga aaggtgaatc tgtaactcaa     60
gaagctacac cagagtataa gctagaaaat acaccaggtg gagataaggg aggcaatact    120
ggaagctcag atgctaatgc gaatgaaggc ggtggtagcc aggcgggtgg atcagctcac    180
acaggttcac aaaactcagc tcaatcacaa gcttctaagc aattagctac tgaaaaagaa    240
tcagctaaaa atgccattga aaaagcagcc aaggacaagc aggatgaaat caaaggcgca    300
ccgctttctg ataaagaaaa agcagaactt ttagcaagag tggaagcaga aaaacaagca    360
gctctcaaag agattgaaaa tgcgaaaact atggaagatg tgaaggaagc agaaacgatt    420
ggagtgcaag ccattgccat ggttacagtt cctaagagac cagtggctcc taatgctgct    480
cctaagacaa caagtgcacc gcaagcaact gcaggaacaa tgcaagatgt tacctaccag    540
tcacctgctg gcaaacaatt acctaacaca ggttcagcat caagtgcagc acttgctagt    600
cttggtctag tggtggcaac aagtggtttt gctttgctag gaagaaagac tagacgtaga    660
aaa                                                                  663
 
SeqID 81
atgaatgcag atgatacagt aaccatttat gatgtcgctc gtgaagcagg tgtttccatg     60
gcgacggtca gccgtgtggt caatggcaat aaaaatgtaa aagagaatac ccgtaaaaaa    120
gtgctagagg taattgatcg tttggattat cgtccaaatg cagttgcgcg tggtcttgca    180
agtaaaaaga caaccactgt cggtgtcgtg attccaaata ttaccaatgg ttatttttcg    240
agtttggcta aggggattga tgatattgca gaaatgtaca agtacaatat tgtcctagct    300
aatagcgatg aagataacga gaaagaagtt tctgttgtca ataccctctt ttcaaagcag    360
gtagatggca ttatctatat ggggtatcac ttgacagata aaattcgctc agaattttcg    420
cgttcacgta ctccgattgt tctcgcagga actgtcgatg ttgagcacca gttgccaagt    480
gtcaatattg actataagca agcaacaatt gatgcagtga gttaccttgc taaagaaaat    540
gagcgtattg ctttcgttag cggtccgcta gtggatgaca tcaatggtaa ggttcgttta    600
gttggctaca aggaaacctt gaaaaaagca ggaatcactt atagtgaggg tttggtattt    660
gaatctaaat atagctatga tgatggttac gccttagcag agcgtttgat ttcatcaaat    720
gcaactgcag cagttgtgac aggtgatgag ttggcagcag gagtcttgaa cggtttggct    780
gataagggtg tttctgtgcc agaagatttt gaaattatta ctagtgatga ttcacaaatc    840
tcacgcttta cccgtccaaa cttgacaacg attgcccaac ctctttatga ccttggtgcc    900
attagtatgc gtatgttgac caagattatg cataaggaag agttggaaga acgtgaagtt    960
ctcttacctc atggtttgac agaacgtagc tcaacacgaa aacgtaaa                1008
 
SeqID 82
atgaaaaaaa agttagtatt tcctaatctg ttttggtggg gagctgcttc tagcggacct     60
cagacagaag gtcaatatgg aaaagtacat gaaaatgtga tggactactg gttcaaaacg    120
catccagaag attttttcga taatgtcgga cctcttgtag ccagtaactt ttttcatact    180
tacaccgaag atttccactt gatgaaggaa attggagtta attctttccg cacttccatc    240
caatggagtc gactcatcaa gaatttagag acaggtgagc ctgatccaaa aggtattgct    300
ttctacaatg ccatcattga agaagctaaa aagaaccaga tggatcttgt gatgaattta    360
catcattttg atttaccagt ggaacttctt caaaaatacg gtggttggga aagcaaacat    420
gtagtggagt tattcgtgaa gtttgccaag actgctttca catgctttgg agataaggtt    480
cattactgga caactttcaa tgagccaatg gtcattccag aagcaggata cttatatgct    540
ttccattatc caaatctaaa aggaaaggga aaagaggccg tacaagtcat ctataatcta    600
aaccttgcta gtgcaaaagt gattcaacta tatcgctcat tagaacttga tggaaagatt    660
gggattattt taaacttgac acctgcttat ccaagaagta attctccaga agacttagaa    720
gcaagtcgat ttacagatga cttctttaac aaagtcttct tgaatccagc tgttaaagga    780
actttcccag aaagattggt aaaacagcta gagagagatg gcgtgttatg gagtcatacc    840
gaaaaagagc ttcaactgat gaaatcaaat acggttgatt ttcttggagt aaactactac    900
catccaaaac gtgttcaagc acaagcaaat cctgaggaat atcagacgcc ctggatgcca    960
gaccaatact tcaaagagta tgaatggctg gagcgtcgca tgaatccata tcgtggttgg   1020
gaaatttttc cgaaagccat ttatgatatt gctatgattg tgaaggaaga atatggtaat   1080
atcccatggt ttatcagtga aaacggaatg ggtgttgaaa acgaagcacg gtttatcgat   1140
gaaaatggag ttatcgatga cgtgtatcgt attgaatttt atgaagaaca tttaagatgg   1200
ctacataaag ccattgaaga gggaagtcac tgttttggat accacgcttg gaccgcattt   1260
gattgctggt cttggaataa tgcatataag aatcgttacg gatttatctc cgttgattta   1320
gaaacgcaaa agagaaccat caagagctca ggaagatggt atcgcaaagt aagtgacaat   1380
aacggttttg aagtagaaat tgaggag                                       1407
 
SeqID 83
gtggaaaatc ttacgaattt ttacgaaaag tatcgtgtct atctgactcg tccacgttta     60
gagcttttgg cagtagttac cattgttttc tgtgctgtac tcgtcttttt tctaaatatt    120
ccaggaaaag gtgtcttaaa actcgataat ggaacgattg tttatgatgg cagtcttgtc    180
cgcggtaaaa tgaatggcca aggtaccatt accttccaaa atggagacca atatacaggt    240
ggcttcaaca atggagcctt caacggaaaa ggtacctttc aatctaaaga aggctggacc    300
tacgaaggtg attttgtaaa tggtcaggct gaaggaaaag ggaaactaac aacagaacaa    360
gaagtcgttt atgaaggaac ttttaaacaa ggcgtttttc aacaaaaa                 408
 
SeqID 84
atgttgaata agataagaga ctatttagac tttgctggtt tgcagtaccg taatcctgat     60
aaagcgggag cagagcgaga gaagatgctg gcattccgcc acaaaggaca agaggcccga    120
aaggttttta cagaactggc caaagccttt caagcaagcc atccagaatg gcaactccaa    180
cagactagcc agtggatgaa tcaggcccag cgtttgagac cacatttttg ggtttatcta    240
cagagagacg gacaagtgac agaacctatg atggccttac gtttgtatgg gacatctact    300
gactttggaa tttctttgga agtcagtttc atcgaacgta agaaggatga gcaaacactg    360
ggcaagcagg ccaaagtttt agacattcca accgttaaag ggatttatta tctaacctac    420
tctaatggtc aaagtcaacg gtgggaggcg aatgaagaaa agcgtcgtac tttacgcgag    480
aaggtgagaa gtcaagaagt tcgaaaagtt ttagtgaagg tagatgttcc tatgacagaa    540
aattcgtctg aagaagaaat cgtagaaggc ttattgaagt cttattctaa aattcttccc    600
tattatctag ctacgagaaa a                                              621
 
SeqID 85
atggttcaga acagttgttg gcaatcaaag agccataagg tcaaggcttt taccttgtta     60
gaatccctgc ttgccctcat tgtcatcagt gggggattac tcctttttca agctatgagt    120
cagctcctca tttcagaagt tcgctaccag caacaaagcg agcaaaagga gtggctcttg    180
tttgtggacc aacttgaggt agaattagac cgttcgcagt tcgaaaaagt agaaggcaat    240
cgcctataca tgaagcaaga tggcaaggac atcgccatcg gtaagtcaaa gtcagatgat    300
ttccgtaaaa cgaatgctcg tggtcgaggt tatcagccta tggtttatgg actcaaatct    360
gtacggatta cagaggacaa tcaactggtt cgctttcatt tccagttcca aaaaggctta    420
gaaagggagt tcatctatcg tgtggaaaaa gaaaaaagt                           459
 
SeqID 86
atgaaaaaaa tgatgacatt cttgaaaaaa gctaaggtta aagcttttac attggtggag     60
atgttggtgg tcttgctgat tatcagcgtg cttttcttgc tctttgtacc taatctgacc    120
aagcaaaaag aagcagtcaa tgacaaagga aaagcagctg ttgttaaggt ggtggaaagc    180
caggcagaac tttatagctt agaaaagaat gaagatgcta gcctaagaaa gttacaagca    240
gatggacgca tcacggaaga acaggctaaa gcttataaag aatacaatga taaaaatgga    300
ggagcaaatc gtaaagtcaa tgat                                           324
 
SeqID 87
atgacatcaa aagttagaaa ggcagtcatc cctgctgctg gactaggaac tcgattttta     60
ccagcaacca aggcccttgc caaagaaatg ttgccaatcg tagacaaacc aactatccag    120
tttatcgtgg aagaagctct caaatcaggt attgaagata ttctagttgt cactggtaaa    180
tcaaaacgtt ctattgagga ccactttgat tcaaacttcg aattggaata taacctcaaa    240
gaaaaaggga aaacagatct tttgaagcta gttgataaaa caactgacat gcgtctgcat    300
tttatccgcc aaactcatcc acgcggtctc ggagatgctg ttttgcaagc caaggctttc    360
gtcggaaatg aaccttttgt cgttatgctt ggtgatgact tgatggatat cacagacgaa    420
aaggctgttc cacttaccaa acaactcatg gatgactacg agcgtaccca cgcgtctact    480
atcgctgtca tgccagtccc tcatgacgaa gtatctgctt acggggttat tgctccgcaa    540
ggcgaaggaa aagatggtct ttacagtgtt gaaacctttg ttgaaaaacc agctccagag    600
gacgctccta gcgaccttgc tattatcgga cgctacctcc tcacgcctga aatttttgag    660
attctcgaaa agcaagctcc aggtgcagga aatgaaattc agctgacaga tgcaatcgac    720
accctcaata aaacacaacg tgtatttgct cgtgagttca aaggggctcg ttacgatgtc    780
ggagacaagt ttggcttcat gaaaacatcc atcgactacg ccctcaaaca cccacaagtc    840
aaagatgatt tgaagaatta cctcatccaa cttggaaaag aattgactga gaaggaa       897
 
SeqID 88
atgcaaaatc aattaaatga attaaaacga aaaatgctgg aatttttcca gcaaaaacaa     60
aaaaataaaa aatcagctag acctggcaag aaaggttcaa gtaccaaaaa atctaaaacc    120
ttagataagt cagtcatttt cccagctatt ttactgagta taaaagcctt atttaactta    180
ctctttgtac tcggttttct aggaggaatg ttgggagctg ggattgcttt gggatacgga    240
gtggccttat ttgacaaggt tcgggtgcct cagacagaag aattggtgaa tcaggtcaag    300
gacatctctt ctatttcaga gattacctat tcggacggga cggtgattgc ttccatagag    360
agtgatttgt tgcgcacttc tatctcatct gagcaaattt cggaaaatct gaagaaggct    420
atcattgcga cagaagatga acactttaaa gaacataagg gtgtagtacc caaggcggtg    480
attcgtgcga ccttggggaa atttgtaggt ttgggttcct ctagtggggg ttcaaccttg    540
acccagcaac taattaaaca gcaggtggtt ggggatgcgc cgaccttggc tcgtaaggcg    600
gcagagattg tggatgctct tgccttggaa cgcgccatga ataaagatga gattttaacg    660
acctatctca atgtggctcc ctttggccga aataataagg gacagaatat tgcaggggct    720
cggcaagcag ctgagggaat tttcggtgta gatgccagtc agttgactgt tcctcaagca    780
gcatttttag caggacttcc acagagtccc attacttact ctccttatga aaatactggg    840
gagttgaaga gtgatgaaga cctagaaatt ggcttaagac gggctaaggc agttctttac    900
agtatgtatc gtacaggtgc attaagcaaa gacgagtatt ctcagtacaa ggattatgac    960
cttaaacagg actttttacc atcgggcacg gttacaggaa tttcacgaga ctatttatac   1020
tttacaactt tggcagaagc tcaagaacgt atgtatgact atctagctca gagagacaat   1080
gtctccgcta aggagttgaa aaatgaggca actcagaagt tttatcgaga tttggcagcc   1140
aaggaaattg aaaatggtgg ttataagatt actactacca tagatcagaa aattcattct   1200
gccatgcaaa gtgcggttgc tgattatggc tatcttttag acgatggaac aggtcgtgta   1260
gaagtaggga atgtcttgat ggataaccaa acaggtgcta ttctaggctt tgtaggtggt   1320
cgtaattatc aagaaaatca aaataatcat gcctttgata ccaaacgttc gccagcttct   1380
actaccaagc ccttgctggc ctacggtatt gctattgacc agggcttgat gggaagtgaa   1440
acgattctat ctaactatcc aacaaacttt gctaatggca atccgattat gtatgctaat   1500
agcaagggaa caggaatgat gaccttggga gaagctctga actattcatg gaatatccct   1560
gcttactgga cctatcgtat gctccgtgaa aagggtgttg atgtcaaggg ttatatggaa   1620
aagatgggtt acgagattcc tgagtacggt attgagagct tgccaatggg tggtggtatt   1680
gaagtcacag ttgcccagca taccaatggc tatcagacct tagctaataa tggagtttat   1740
catcagaagc atgtgatttc aaagattgaa gcagcagatg gtagagtggt gtatgagtat   1800
caggataaac cggttcaagt ctattcaaaa gctactgcga cgattatgca gggattgcta   1860
cgagaagttc tatcctctcg tgtgacaaca accttcaagt ctaacctgac ttctttaaat   1920
cctactctgg ctaatgcaga ttggattggg aagactggta caaccaacca agacgaaaat   1980
atgtggctca tgctttcgac acctagatta accctaggtg gctggattgg gcatgatgat   2040
aatcattcat tgtcacgtag agcaggttat tctaataact ctaattacat ggctcatctg   2100
gtaaatgcga ttcagcaagc ttccccaagc atttggggga acgagcgctt tgctttagat   2160
cctagtgtag tgaaatcgga agtcttgaaa tcaacaggtc aaaaaccaga gaaggtttct   2220
gttgaaggaa aagaagtaga ggtcacaggt tcgactgtta ccagctattg ggctaataag   2280
tcaggagcgc cagcgacaag ttatcgcttt gctattggcg gaagtgatgc ggattatcag   2340
aatgcttggt ctagtattgt ggggagtcta ccaactccat ccagctccag cagttcaagt   2400
agtagttcta gcgatagcag taactcaagt actacacgac cttcttcttc aagggcgaga   2460
cga                                                                 2463
 
SeqID 89
atgtcatcta aatttatgaa gagcgctgcg gtgcttggaa ctgctacact tgctagcttg     60
cttttggtag cttgcggaag caaaactgct gataagcctg ctgattctgg ttcatctgaa    120
gtcaaagaac tcactgtata tgtagacgag ggatataaga gctatattga agaggttgct    180
aaagcttatg aaaaagaagc tggagtaaaa gtcactctta aaactggtga tgctctagga    240
ggtcttgata aactttctct tgacaaccaa tctggtaatg tccctgatgt tatgatggct    300
ccatacgacc gtgtaggtag ccttggttct gacggacaac tttcagaagt gaaattgagc    360
gatggtgcta aaacagacga cacaactaaa tctcttgtaa cagctgctaa tggtaaagtt    420
tacggtgctc ctgccgttat cgagtcactt gttatgtact acaacaaaga cttggtgaaa    480
gatgctccaa aaacatttgc tgacttggaa aaccttgcta aagatagcaa atacgcattc    540
gctggtgaag atggtaaaac tactgccttc ctagctgact ggacaaactt ctactataca    600
tatggacttc ttgccggtaa cggtgcttac gtctttggcc aaaacggtaa agacgctaaa    660
gacatcggtc ttgcaaacga cggttctatc gtaggtatca actacgctaa atcttggtac    720
gaaaaatggc ctaaaggtat gcaagataca gaaggtgctg gaaacttaat ccaaactcaa    780
ttccaagaag gtaaaacagc tgctatcatc gacggacctt ggaaagctca agcctttaaa    840
gatgctaaag taaactacgg agttgcaact atcccaactc ttccaaatgg aaaagaatat    900
gctgcattcg gtggtggtaa agcttgggtc attcctcaag ccgttaagaa ccttgaagct    960
tctcaaaaat ttgtagactt ccttgttgca actgaacaac aaaaagtatt atatgataag   1020
actaacgaaa tcccagctaa tactgaggct cgttcatacg ctgaaggtaa aaacgatgag   1080
ttgacaacag ctgttatcaa acagttcaag aacactcaac cactgccaaa catctctcaa   1140
atgtctgcag tttgggatcc agcgaaaaat atgctctttg atgctgtaag tggtcaaaaa   1200
gatgctaaaa cagctgctaa cgatgctgta acattgatca aagaaacaat caaacaaaaa   1260
tttggtgaa                                                           1269
 
SeqID 90
atgatagata aagtggtcag gaacctactc ctgacctttt tcttttgcaa aatgacaaaa     60
atcataattt ttttgacaac tatacttgtc aaaaagaaaa agatatgtta caatgaattc    120
aagttaagaa ataggaagca gaaaggagtt ataatgtggg tactaggatt tatactattt    180
atgattttct tttattctaa taattctaaa aaaatcaaga aactagagaa taaaatcaaa    240
agacttgagc gaaaagagaa aggaaacgca gaaatgtcga gattattaca agaaatgatt    300
ggaaaggaac caattataac gggagtgtat attgggccag ataactggga agttgtggat    360
gttgatgagg aatgggtaaa gctacgacgt gtagataata cgggaaaaga aaaattcaag    420
ttgcaacgta ttgaggatat ccaaaccgtt gaatttgacg gagag                    465
 
SeqID 91
atgattttaa gtaaaaatag agaagatggg ttaagaaaat ttgcgactaa catccgatta     60
aatactctta gaacattgaa tcatcttgga ttcggacatt acggaggaag tctgtctatc    120
gtagaagttt tagcggtgct ttatggtgaa ataatgccaa tgactccaga aatatttgca    180
gcacgagata gagattattt catattatca aaaggtcacg gaggaccagc tctatacagt    240
acactctatt tgaatggttt ctttgacaaa gaattcttat attctttaaa tacaaatgga    300
accaaattac cgtctcatcc tgatagaaat ctaacgccag gcatagatat gacaacgggc    360
tctttaggac aaggaattag tgttgcaact ggacttgcat atggtcagag aataagaaag    420
agtccctttt atacttacgc tattgttgga gatggtgagt taaatgaggg acaatgttgg    480
gaggctatac agtttgcttc tcatcaacag ttatccaact taattgtatt tgttgatgat    540
aacaaaaaac aattagatgg ttttacaaag gatatttgta atccaggtga tttcgtagaa    600
aaattttcag catttggatt tgaatccatt agggtcaagg gttcagatat tagagaaatt    660
tatgaaggga ttgtccaatt aaaacagtca aataattcat cacctaagtg cattgtatta    720
gatactatta aaggtcaagg ggttcaagag ctggaagaaa tgaaatccaa tcatcatctt    780
cgccctactg tagaggagaa acaaatgtta acttcagttg tagaaagatt aagtcaggaa    840
ttggaggaaa cagaa                                                     855
 
SeqID 92
atgaaaaaaa ctacaatatt atcattaact acagctgcgg ttattttagc agcatatgtc     60
cctaatgaac caatcctagc agatactcct agttcggaag taatcaaaga gactaaagtt    120
ggaagtatta ttcaacaaaa taatatcaaa tataaggttc taactgtaga aggtaacata    180
ggaactgttc aagtgggtaa tggagttact cctgtagagt ttgaagctgg tcaagatgga    240
aaaccattca cgattcctac aaaaatcaca gtaggtgata aagtatttac cgttactgaa    300
gtagctagtc aagcttttag ttattatcca gatgaaacag gtagaattgt ctactatcct    360
agctctatta ctatcccatc aagcataaaa aaaatacaaa aaaaaggctt ccatggaact    420
aaagctaaaa ctattatttt tgacaaaggc agtcagctgg agaaaattga agatagagct    480
tttgattttt ctgaattaga agagattgaa ttgcctgcat ctctagaata tattggaaca    540
agtgcatttt cttttagtca aaaattgaaa aagctaacct tttcctcaag ttcaaaatta    600
gaattaatat cacatgaggc ttttgctaat ttatcaaatt tagagaaact aacattacca    660
aaatcggtta aaacattagg aagtaatcta tttagactca ctactagctt aaaacatgtt    720
gatgttgaag aaggaaatga atcgtttgcc tcagttgatg gtgttttgtt ttcaaaagat    780
aaaacccaat taatttatta tccaagtcaa aaaaatgacg aaagttataa aacgcctaag    840
gagacaaaag aacttgcatc atattcgttt aataaaaatt cttacttgaa aaaactcgaa    900
ttgaatgaag gtttagaaaa aatcggtact tttgcatttg cagatgcgat taaacttgaa    960
gaaattagct taccaaatag tttagaaact attgaacgtt tagcctttta cggtaattta   1020
gaattaaaag aacttatatt accagataat gttaaaaatt ttggtaaaca cgttatgaac   1080
ggtttaccaa aattaaaaag tttaacaatt ggtaataata tcaactcatt gccgtccttc   1140
ttcctaagtg gcgtcttaga ttcattaaag gaaattcata ttaagaataa aagtacagag   1200
ttttctgtga aaaaagatac atttgcaatt cctgaaactg ttaagttcta tgtaacatca   1260
gaacatataa aagatgttct taaatcaaat ttatctacta gtaatgatat cattgttgaa   1320
aaagtagata atataaaaca agaaactgat gtagctaaac ctaaaaagaa ttctaatcag   1380
ggagtagttg gttgggttaa agacaaaggt ttatggtatt acttaaacga atcaggttca   1440
atggctactg gttgggttaa agacaaaggt ttatggtatt acttaaacga atcaggttca   1500
atggctactg gttgggttaa agacaaaggc ttatggtact acttaaatga atcaggttca   1560
atggctactg gttgggttaa agacaaaggc ttatggtatt acttaaacga atcaggttca   1620
atggctactg gttgggttaa agacaaaggc ttatggtact acttaaatga atcaggttca   1680
atggctactg gttgggttaa agacaaaggc ttatggtatt acttaaatga atcaggttca   1740
atggctactg gttgggttac agtttctggt aaatggtact atacctataa ttcaggagat   1800
ttattagtaa acacgactac acccgatggc tatcgagtca atgctaacgg tgagtgggta   1860
gga                                                                 1863
 
SeqID 93
atggtaagat ttacaggact tagtctcaaa caaacgcaag ctattgaggt tttaaaaggt     60
cacatttctc taccagatgt ggaagtggct gtcactcagt ctgaccaagc atctatctct    120
atcgagggtg aggaaggtca ctatcaattg acctaccgca aacctcacca actttatcgt    180
gccttgtcct tgttggtaac agttctagca gaagctgata aagtagagat tgaggaacaa    240
gcagcttacg aagatttggc ttacatggtt gactgttctc gaaatgcggt gctgaatgtg    300
gcttctgcca agcagatgat tgagatattg gctctcatgg gctactcaac ctttgagctt    360
tacatggaag acacttacca gattgaaggg cagccttact ttggctattt ccgtggagct    420
tattcagcag aggagttgca ggaaatcgaa gcctatgccc aacagtttga cgtgaccttt    480
gtaccatgca tccagacctt ggcccacttg tcggcctttg tcaaatgggg tgtcaaggaa    540
gtgcaggagc tccgtgatgt agaggacatt cttctcattg gcgaagaaaa ggtttatgac    600
ttgattgatg gcatgtttgc cacgttgtct aaactgaaga ctcgcaaggt caatatcggg     660
atggacgaag cccacttggt tggtttggga cgctacctga ttctgaacgg tgttgtggat     720
cgtagtctcc tcatgtgcca acacttggag cgcgtgctgg atattgctga caaatatggt     780
ttccactgcc agatgtggag tgatatgttc ttcaaactca tgtcagcgga tggccagtac     840
gaccgtgatg tggaaattcc agaggaaact cgtgtctacc tagaccgtct caaagaccgt     900
gtgactctgg tttactggga ttattatcag gatagcgagg aaaaatacaa ccgtaatttc     960
cgcaatcatc acaagattag ccatgacctt gcatttgcag ggggagcttg gaagtggatt    1020
ggctttacac ctcacaacca ttttagccgt ctagtggcta tcgaggctaa taaagcctgc    1080
cgtgccaatc agattaaaga agtcatcgta acgggttggg gagacaatgg tggtgaaact    1140
gcccagttct ctatcctacc aagcttgcaa atctgggcag aactcagcta tcgcaatgac    1200
ctagatggtt tgtctgcgca cttcaagacc aatactggtc taacggttga ggattttatg    1260
cagattgacc ttgccaacct cttaccagac ctaccaggca atctcagcgg tatcaatccc    1320
aaccgctatg ttttttatca ggatattctt tgtccgattc ttgatcaaca catgacacct    1380
gaacaggaca aaccgcactt cgctcaggct gctgagacgc ttgctaacat taaagaaaaa    1440
gctggaaact atgcctatct ctttgaaact caggcccagt tgaatgctat tttaagtagc    1500
aaagtagatg tgggacgacg cattcgtcag gcctaccaag cggatgataa agaaagttta    1560
caacaaatcg ccagacaaga attaccagaa cttagaagcc aaattgaaga cttccatgcc    1620
ctctttagcc accaatggct gaaagaaaac aaggtctttg gtttggatac agttgacatc    1680
cgtatgggcg gactcttgca acgcatcaaa cgagcagaaa gccgtatcga ggtttatctg    1740
gctggtcagc ttgaccgcat cgacgagctg gaagttgaaa tcctaccatt tactgacttc    1800
tacgcagaca aggatttcgc agcaactaca gccaaccagt ggcataccat tgcgacagcg    1860
tcgacgattt atacgact                                                  1878
 
SeqID 94
atgtctaatt catttgtcaa gttgttagtc tctcaattat ttgcaaattt agcagatatt      60
ttctttagag taacaatcat tgctaacata tacattattt caaaatcagt aattgccaca     120
tcactagttc ctatcttaat aggaatatcc tcttttgttg cgagtctttt agttccgttg     180
gttactaaaa ggttagcgct aaatagggtt ttatctttat ctcaatttgg aaagactata     240
ttattggcga tactggtagg aatgtttacc gtaatgcaat ccgtagcgcc tttggtgacc     300
tatctatttg ttgttgcaat ttccatacta gatggttttg cagcacccgt ttcctatgct     360
attgtgccac gctatgcgac cgatttgggt aaggctaatt cagccttatc aatgactggt     420
gaagctgttc aattgatagg ttggggatta ggtggactct tgtttgcaac aattggtctg     480
ttacctacca cgtgtatcaa tttagtcttg tatatcattt ctagctttct gatgttattt     540
cttcctaacg ctgaagtgga ggtgttagag tcagaaacta atcttgaaat tttgctcaaa     600
ggttggaagt tagttgctag aaatcctaga ttaagacttt ttgtatcagc aaatttattg     660
gaaatttttt caaatacgat ttgggtttct tccattatac ttgtttttgt aacggagtta     720
ttaaataaaa cggaaagtta ctggggatat tctaatacag catactctat tggtattata     780
attagtggct taattgcttt taggctatct gaaaagttcc ttgctgctaa a              831
 
SeqID 95
atgtttgcat caaaaagcga aagaaaagta cattattcaa ttcgtaaatt tagtgttgga      60
gtagctagtg tagttgttgc cagtcttgtt atgggaagtg tggttcatgc gacagagaac     120
gagggagcta cccaagtacc cacttcttct aatagggcaa atgaaagtca ggcagaacaa     180
ggagaacaac ctaaaaaact cgattcagaa cgagataagg caaggaaaga ggtcgaggaa     240
tatgtaaaaa aaatagtggg tgagagctat gcaaaatcaa ctaaaaagcg acatacaatt     300
actgtagctc tagttaacga gttgaacaac attaagaacg agtatttgaa taaaatagtt     360
gaatcaacct cagaaagcca actacagata ctgatgatgg agagtcgatc aaaagtagat     420
gaagctgtgt ctaagtttga aaaggactca tcttcttcgt caagttcaga ctcttccact     480
aaaccggaag cttcagatac agcgaagcca aacaagccga cagaaccagg agaaaaggta     540
gcagaagcta agaagaaggt tgaagaagct gagaaaaaag ccaaggatca aaaagaagaa     600
gatcgtcgta actacccaac cattacttac aaaacgcttg aacttgaaat tgctgagtcc     660
gatgtggaag ttaaaaaagc ggagcttgaa ctagtaaaag tgaaagctaa cgaacctcga     720
gacgagcaaa aaattaagca agcagaagcg gaagttgaga gtaaacaagc tgaggctaca     780
aggttaaaaa aaatcaagac agatcgtgaa gaagcagaag aagaagctaa acgaagagca     840
gatgctaaag agcaaggtaa accaaagggg cgggcaaaac gaggagttcc tggagagcta     900
gcaacacctg ataaaaaaga aaatgatgcg aagtcttcag attctagcgt aggtgaagaa     960
actcttccaa gcccatccct gaaaccagaa aaaaaggtag cagaagctga gaagaaggtt    1020
gaagaagcta agaaaaaagc cgaggatcaa aaagaagaag atcgccgtaa ctacccaacc    1080
aatacttaca aaacgcttga acttgaaatt gctgagtccg atgtggaagt taaaaaagcg    1140
gagcttgaac tagtaaaaga ggaagctaag gaacctcgaa acgaggaaaa agttaagcaa    1200
gcaaaagcgg aagttgagag taaaaaagct gaggctacaa ggttagaaaa aatcaagaca    1260
gatcgtaaaa aagcagaaga agaagctaaa cgaaaagcag cagaagaaga taaagttaaa    1320
gaaaaaccag ctgaacaacc acaaccagcg ccggctccaa aagcagaaaa accagctcca    1380
gctccaaaac cagagaatcc agctgaacaa ccaaaagcag aaaaaccagc tgatcaacaa    1440
gctgaagaag actatgctcg tagatcagaa gaagaatata atcgcttgac tcaacagcaa    1500
ccgccaaaaa ctgaaaaacc agcacaacca tctactccaa aaacaggctg gaaacaagaa    1560
aacggtatgt ggtacttcta caatactgat ggttcaatgg cgacaggatg gctccaaaac    1620
aatggctcat ggtactacct caacagcaat ggcgctatgg cgacaggatg gctccaaaac    1680
aatggttcat ggtactatct aaacgctaat ggttcaatgg caacaggatg gctccaaaac    1740
aatggttcat ggtactacct aaacgctaat ggttcaatgg cgacaggatg gctccaatac    1800
aatggctcat ggtactacct aaacgctaat ggttcaatgg cgacaggatg gctccaatac    1860
aatggctcat ggtactacct aaacgctaat ggtgatatgg cgacaggttg ggtgaaagat    1920
ggagatacct ggtactatct tgaagcatca ggtgctatga aagcaagcca atggttcaaa    1980
gtatcagata aatggtacta tgtcaatggc tcaggtgccc ttgcagtcaa cacaactgta    2040
gatggctatg gagtcaatgc caatggtgaa tgggtaaac                           2079
 
SeqID 96
atgaactatt caaaagcatt gaatgaatgt atcgaaagtg cctacatggtt gctggacat      60
tttggagctc gttatctaga gtcgtggcac ttgttgattg ccatgtctaa tcacagttat     120
agtgtagcag gggcaacttt aaatgattat ccgtatgaga tggaccgttt agaagaggtg     180
gctttggaac tgactgaaac ggactatagc caggatgaaa cctttacgga attgccgttc     240
tcccgtcgtt tgcaggttct ttttgatgaa gcagagtatg tagcgtcagt ggtccatgct     300
aaggtactag ggacagagca cgtcctctat gcgattttgc atgatagcaa tgccttggcg     360
actcgtatct tggagagggc tggtttttct tatgaagaca agaaagatca ggtcaagatt     420
gctgctcttc gtcgaaattt agaagaacgg gcaggctgga ctcgtgaaga tctcaaggct     480
ttacgccaac gccatcgtac agtagctgac aagcaaaatt ctatggccaa tatgatgggc     540
atgccgcaga ctcctagtgg tggtctcgag gattatacgc atgatttgac agagcaagcg     600
cgttctggca agttagaacc agtcatcggt cgggacaagg aaatctcacg tatgattcaa     660
atcttgagcc ggaagactaa gaacaaccct gtcttggttg gggatgctgg tgtcgggaaa     720
acagctctgg cgcttggtct tgcccagcgt attgctagtg gtgacgtgcc tgcggaaatg     780
gctaagatgc gcgtgttaga acttgatttg atgaatgtcg ttgcagggac acgcttccgt     840
ggtgactttg aagaacgcat gaataatatc atcaaggata ttgaagaaga tggccaagtc     900
atcctcttta tcgatgaact ccacaccatc atgggttctg gtagcgggat tgattcgact     960
ctggatgcgg ccaatatctt gaaaccagcc ttggcgcgtg gaactttgag aacggttggt    1020
gccactactc aggaagaata tcaaaaacat atcgaaaaag atgcggcact ttctcgtcgt    1080
ttcgctaaag tgacgattga agaaccaagt gtggcagata gtatgactat tttacaaggt    1140
ttgaaggcga cttatgagaa acatcaccgt gtacaaatca cagatgaagc ggttgaaaca    1200
gcggttaaga tggctcatcg ttatttaacc agtcgtcact tgccagactc tgctatcgat    1260
ctcttggatg aggcggcagc aacagtgcaa aataaggcaa agcatgtaaa agcagacgat    1320
tcagatttga gtccagctga caaggccctg atggatggca agtggaaaca ggcagcccag    1380
ctaatcgcaa aagaagagga agtacctgtc tacaaagact tggtgacaga gtctgatatt    1440
ttgaccacct tgagtcgctt gtcaggaatc ccagttcaaa aactgactca aacggatgct    1500
aagaagtatt taaatcttga agcagaactc cataaacggg ttatcggtca agatcaagct    1560
gtttcaagca ttagccgtgc cattcgccgc aaccagtcag ggattcgcag tcataagcgt    1620
ccgattggtt cctttatgtt cctagggcct acaggtgtcg ggaaaactga attagccaag    1680
gctctggcag aagttctttt tgacgacgaa tcagccctta tccgctttga tatgagtgag    1740
tatatggaga aatttgcagc tagtcgtctc aacggagctc ctccaggcta tgtaggatat    1800
gaagaaggtg gggagttgac agagaaggtt cgcaataaac cctattccgt tctcctcttt    1860
gatgaggtag agaaggccca cccagatatc tttaatgttc tcttgcaggt tctggatgac    1920
ggtgtcttga cagatagcaa gggacgcaag gtcgattttt caaataccat tatcattatg    1980
acatcgaatc taggtgcgac tgcccttcgt gatgataaga ctgttggttt tggggctaag    2040
gatattcgtt ttgaccagga aaatatggaa aaacgcatgt ttgaagaact gaaaaaagct    2100
tatagaccgg aattcatcaa ccgtattgat gagaaggtgg tcttccatag cctatctagt    2160
gatcatatgc aggaagtggt gaagattatg gtcaagcctt tagtggcaag tttgactgaa    2220
aaaggcattg acttgaaatt acaagcttca gctctgaaat tgttagcaaa tcaaggatat    2280
gacccagaga tgggagctcg cccacttcgc agaaccctgc aaacagaagt ggaggacaag    2340
ttggcagaac ttcttctcaa gggagattta gtggcaggca gcacacttaa gattggtgtc    2400
aaagcaggcc agttaaaatt tgatattgca                                     2430
 
SeqID 97
atgaaaattt taccgtttat agcaagagga acaagttatt acttgaagat gtcagttaaa      60
aagcttgttc cttttttagt agtaggattg atgctagcag ctggtgatag tgtctatgcc     120
tattccagag gaaatggatc gattgcgcgt ggggatgatt atcctgctta ttataaaaat     180
gggagccagg agattgatca gtggcgcatg tattctcgtc agtgtacttc ttttgtagcc     240
tttcgtttga gtaatgtcaa tggttttgaa attccggcag cttatggaaa tgcgaatgaa     300
tggggacatc gtgctcgtcg ggaaggttat cgtgtagata atacaccgac gattggttcc     360
attacttggt ctactgcagg aacttatggt catgttgcct gggtgtcaaa tgtaatggga     420
gatcagattg agattgagga atataactat ggttatacag aatcctataa taaacgagtt     480
ataaaagcaa acacgatgac aggatttatt cattttaaag atttggatgg tggcagtgtt     540
gggaatagtc aatcctcaac ttcaacaggc ggaactcatt attttaagac caagtctgct     600
attaaaactg aacctctagc tagcggaact gtgattgatt actattatcc tggggagaag     660
gttcattatg atcagatact tgaaaaagac ggctataagt ggttgagtta tactgcctat     720
aatggaagct atcgttatgt tcaattggag gctgtgaata aaaatcctct aggtaattct     780
gttctttctt caacaggtgg aactcattat tttaagacca agtctgctat caaaactgaa     840
cccctagtta gtgcaactgt gattgattac tattatcctg gagagaaggt tcattatgat     900
caaattctcg aaaaagacgg ctacaagtgg ttgagttata cggcttataa cggaagtcgt     960
cgctatatac agctagaggg agtgacttct tcacaaaatt atcagaatca atcaggaaac   1020
atctctagct atggatccca tagtagttca actgtcggtt ggaagaaaat aaatggtagt   1080
tggtatcatt tcaaatcaaa tggttctaaa tcaacaggat ggctgaaaga cggttctagc   1140
tggtattatt tgaaattatc tggtgaaatg cagacaggat ggttaaagga aaatggtttg   1200
tggtattatc tgggtagttc aggggcaatg aaaacaggct ggtaccaggt ctctggtaag   1260
tggtattatt cttactcttc aggcgcctta gctgttaata cgacggtgga tggctacaga   1320
gtaaacagtg atggagaacg agta                                          1344
 
SeqID 98
atgaaagtaa tctttttagc agatgttaaa ggaaaaggta aaaaaggcga aattaaggaa     60
gtaccaacag ggtatgcgca aaactttctt atcaaaaaga atctagccaa agaagcgact    120
gctcaagctg taggtgaact tcgtggtaaa caaaaatcgg aagaaaaagc tcacgctgag    180
atgattgcag aaggaaaagc aattaaagca caacttgaag cagaagaaac tgttgtagaa    240
tttgttgaaa aagttggtcc agatggtcgt acctttggtt ctattaccaa taagaagatt    300
gcagaagaat tgcaaaagca atttggaatt aagattgata aacgtcatat tcaagtacaa    360
gctccgattc gagcggttgg tttgattgat gtgccagtga aaatctatca agatatcaca    420
agtgtaatca atcttcgtgt gaaagaagga                                     450
 
SeqID 99
atgaagaaaa aaatcttagc gtcactttta ttaagtacag taatggtttc tcaagtagct     60
gttttaacaa ctgcgcatgc agaaacgact gatgacaaaa ttgctgctca agataataaa    120
attagtaact taacagcaca acaacaagaa gcccaaaaac aagttgacca aattcaggag    180
caagtatcag ctattcaagc tgagcagtct aacttgcaag ctgaaaatga tagattacaa    240
gcagaatcta agaaactcga gggtgagatt acagaacttt ctaaaaacat tgtttctcgt    300
aaccaatcgt tggaaaaaca agctcgtagt gctcaaacaa atggagccgt aactagctat    360
atcaatacca ttgtaaactc aaaatcaatt acagaagcta tttcacgtgt tgctgcaatg    420
agtgaaatcg tatctgcaaa caacaaaatg ttagaacaac aaaaggcaga taaaaaagct    480
atttctgaaa aacaagtagc aaataatgat gctatcaata ctgtaattgc taatcaacaa    540
aaattggctg atgatgctca agcattgact acgaaacagg cagaactaaa agctgctgaa    600
ttaagtcttg ctgctgagaa agcgacagct gaaggggaaa aagcaagtct attagagcaa    660
aaagcagcag ctgaggcaga ggctcgtgca gctgcggtag cagaagcagc ttataaagaa    720
aaacgagcta gccaacaaca atcagtactt gcttcagcaa acactaactt aacagctcaa    780
gtgcaagcag tatctgaatc tgcagcagca cctgtccgtg caaaagttcg tccaacatac    840
agtacaaacg cttcaagtta tccaattgga gaatgtacat ggggagtaaa aacattggca    900
ccttgggctg gagactactg gggtaatgga gcacagtggg ctacaagtgc agcagcagca    960
ggtttccgta caggttcaac acctcaagtt ggagcaattg catgttggaa tgatggtgga   1020
tatggtcacg tagcggttgt tacagctgtt gaatcaacaa cacgtatcca agtatcagaa   1080
tcaaattatg caggtaatcg tacaattgga aatcaccgtg gatggttcaa tccaacaaca   1140
acttctgaag gttttgttac atatatttat gcagat                             1176
 
SeqID 100
atggtaaaaa gacgtataag gagagggacg agagaacctg aaaaagttgt tgttcctgag     60
caatcatcta ttccttcgta tcctgtatct gttacatcta accaaggaac agatgtagca    120
gtagaaccag ctaaagcagt tgctccaaca acagactgga aacaagaaaa tggtatgtgg    180
tatttttata atactgatgg ttccatggca acaggttggg tacaagttaa tagttcatgg    240
tactacctca acagcaacgg ttctatgaaa gtcaatcaat ggttccaagt tggtggtaaa    300
tggtattatg taaatacatc gggtgagtta gcggtcaata caagtataga tggctataga    360
gtcaatgata atggtgaatg ggtgcgt                                        387
 
SeqID 101
gagttgcgac ggctatcaag gttggtggac caggagctct attttggatg tggatggcgg     60
ctttctttgg aatggctacc aagtatgcgg aaggactctt ggccatcaaa taccgcacca    120
aggacgacca tggtgcag                                                  138
 
SeqID 102
gactgtatca ggaaacaacc gttcacacgc gatgaaccaa acaaaacgtg ccgtaaaacc     60
aaaccttcaa aaagttactg ttcttatcga tgg                                  93
 
SeqID 103
ggacaaagaa accctcgaag aattgaaaga gttatcagaa tggcagaaac gaaaccaaga     60
atatctaaaa aagaaggc                                                   78
 
SeqID 104
cagaggaagc tgttcaaaat cttccaccta ttccagaaga aaagtgggtg gaaccagaaa     60
tcatcctgcc tcaagctgaa cttaaattcc ctgaacagga agatgactca gatgacgaag    120
atgttcaggt cgatttttca gccaaagaag cccttgaata caaacttcca agcttacaac    180
tctttgcacc agataaacca aaagatcagt ctaaagagaa gaaaattgtc agagaaaata    240
tcaaaatct                                                            249
SeqID 105
ttggtgatta tagttttgaa aatccagtcc aaatcggaga cagactttat tttcaagaca     60
tggccattta ttcttttgtc aaaaataata cctttaatgg tattggattg ccaagtctct    120
atctcatgga cgaacaggga gactgtagct tactcaaagc ttttggctat caagacttta    180
aagggagatt atcatgatgg acagtccaaa aaaattaggc tatcacatgc cagcagagta    240
cgaaccccat catggtaccc tcatgatatg gccgactcga ccaggatcat ggccttttca    300
aggaaaggct gc                                                        312
 
SeqID 106
gagagactac cagcttttcc tagaagtctt tcagggagga agttggacca aggcggaacc     60
aaagaaaaag gctcggatgg aagaagtcct                                      90
 
SeqID 107
agaaattgcc tctctacttg gaaaagctcc tcaaactatc acactgaaat caagcgtggg     60
acagtccgac aatgtcttgg aaaagggcgc ttcaaagagg tttattctgc cgactacgct    120
caacagtctt atgaaaacaa tcgcaagcgc tcggtcaaga aatcaagctt gaccaaggaa    180
ctaaaggaaa agattctcca ctatcataac caaaaatttt cgcctgaaat gatggttatg    240
gctaaagggg ttaacgtggg aatttcaacc atttactatt ggattcatca tggaaaattg    300
gggttaagca agcaggattt gctttaccct agaaaaggaa aagcgcttaa gaaacaggct    360
agcaccaact ttaaacctgc tggtcaatcc atcgaacagc ggcctgaagc tatcaatctt    420
cgcttggaga atgggcatta tgagattgat acggttctac ttacgagatc gaaaaactac    480
tgcttgattg tcttgacgga tcgaaagagt agacatcaga tcatccgatt gattccaaat    540
aaaagtgctg aggtggtcaa tcaggctcta aaactcatct taaaacaaca caagattctt    600
tccatcacgg cagataatgg aacggaattc aatcgcttgt ttgatatatt ttctgaggag    660
cacatctatt atgcgcaccc ctatgcctct tgggaaaggg gaactaatga gaatcacaac    720
aggctcattc gtagatagtt acctaaggga accaagaaaa tgactcccaa agaagtcgca    780
ttcatcgaaa agtggattaa caactatcct aaaaaatgct tggactacaa gtcacccaga    840
gaagacttct ggatggctaa cttgaacttg aaatttagca aaatggaaat aatttttatt    900
aaacgcttcc aa                                                        912
 
SeqID 108
cctgtcatga ctatctcatc gcctactatg aaaaacatgg atttgtcaac gaaggccagt     60
cccagtcaac ctttgcaggg gaaacatggt atgatatggt ctgggaaa                 108
 
SeqID 109
acatcatcaa taaggataca cacaaggaaa tcatcgccaa actggactac gacgccccat     60
cttgccctga gtgcggaaac caat                                            84
 
SeqID 110
tacttccttc cacacaagta tgccagagaa agcttatcgc taccctctac caacaaaata     60
ttacacagaa aacaaggttc g                                               81
 
SeqID 111
gcagccttca aaaaagatca aattaatgag cgtgtcgaga aattaggtaa gttaaaacct     60
attacaataa attacaacgg aaaatcagaa gtaattgata gtaaagaaaa attacaagag    120
cttatgaata aagccgttaa agacgaagtg gctcaaata                           159
 
SeqID 112
gcttatgcgc attctaaaag aagcgctgga agtggcaggg caggaggcag acaatgtctt     60
tgccaatgtc aaaataaatg taggagagat tttaagtat                            99
 
SeqID 113
cacggccgac cttatcataa gcctcaccaa ccgcatcatc acgggtttcc ccaacaatct     60
tataatctcc tgcctccgaa acataaacca actctgtgtg tccgccgc                 108
 
SeqID 114
aaaggaaaaa tcctcctgct accaaggcta accactcaaa gatggcaaag aaaaatccgc     60
cctgactcac gtaagtcagc aaataataaa gcaaaccttg acttccataa tagtcgctgt    120
aaatcttccc tgtctgatga agcgcccaac ctgcataaaa atcctgcact tcttgtgcac    180
tcattaagtc gagtaatagc ggtactccta gagttatccc cgttacaagc gtactccata    240
gtaaaatttt caccaaagga agacgacttg attcacgatg atgcgattct tgttcgattt    300
ggtattctag aggttcacga ttctccttat gaacttcttc tactctacca tacacactca    360
tatcgtttct cctgttcaat ttatctgtct                                     390
 
SeqID 115
tttacggtaa gccatgtatt cctcctttat ttatctttta atccaagacc caaatcaatg     60
agtttgagtt tcacttcttc caaactcttg cgtccaagat ttcgtacttt catcatctct    120
gcttcagatt tttctgtcaa atcatgcaca gtattgatac cggcacgttt taaacagttg    180
tatgaacgca cagacaagtc cagttcctca atcgtacgat ctaaaatacg gtcgtcagat    240
tcagtatcag cttctttcat cacttcagtt gacttagcaa tctcagtaag atttgtaaac    300
aaatcaagat gttctgtcaa aatacgtgct gaaagcccta aagcatcttc tggaataatt    360
gttccatttg tcaagatttc aagggttaat ttgtcgaaac catcattgct acctacacga    420
gcaggttcca ct                                                        432
 
SeqID 116
cttgtctgca tgaagaataa gggctgctac aaggaaagaa acaactgctg ccac           54
 
SeqID 117
ttccattatt tgtcaaaata ctttttagtt tcagcaataa cgactggcga caagaccaag     60
agggcaatca agtttggcag agccatcaag gcgttaacga tatctgcgat aatccagacc    120
atatccaact cgataaatcc tcctaacaag accatgagca caaaaaccac acgg          174
 
SeqID 118
ggaaagaagg tattcataaa ataccctcta tcaagagtct cctcaaaaac aggaccgatg     60
attacaggca ggacaaaaga taagatagtc gataaaaagg ttggttgtcc atttgaaaaa    120
agcacggtaa aatactcatc a                                              141
 
SeqID 119
tcttcaccag tttttcctaa acttgtaatg gtatctgggg caaataaacc aagagaaagg     60
cgcaatttcc cattttcgtc taaaatgtca ttccacttaa cctttgtctt g             111
 
SeqID 120
tacttaactt ccttctcagt tccgaagata gcttcttcaa aggtcaaatt gacacgatac     60
tggagatcat ctccttggcg aggagcgttt ggattgcgcg aagaaccgcc tccgccgaag    120
aaacttgaga aaatatcctc aaaaccaccg aagccacctg ccccattgaa accgccgaaa    180
ccaccagctc caccaaaacc accattggcg cctgcagcac catactggtc a             231
 
SeqID 121
cagtcatggc gtcctattcc agattcaaaa tgctatacac aagaaaaact cactatcccc     60
attaaaagaa gaaaagacat caaggacttc taccacaatt ccatccaaag acacaaaaac    120
agccataaga gtcacctcct tgattcctat aggctgatta taacaagact ggctgaaatt    180
gtacatgaaa ataaaatcct aatagtactc attttgtatg tgactaatat tccgtctcgc    240
tccagaaggt acgaagtaaa tagagtt                                        267
 
SeqID 122
ctgtttcgtt tttatcgtgt aattgttctt tatcgaggtt ggcatattta tcttttaatt     60
cttgtgaatt tgcagtacgt tcaaaacgtt ttccgaaagg atcgattcct tgttcgcgga    120
gcgcagccat tttttcacgg cgaacgatct gctggtcatt tagttcttcc atatgttctg    180
 
SeqID 123
ataactcacc ctccactaaa ccctgagcat tttgtttcaa gagtcttttc atctcttggt     60
ttgaagtctt atcagccaaa agatgataga tttctgagaa agccttcaga tagtaggcat    120
cctgaatcag gtaatagcgg aaaatggcag gttctaaatt cccctcttgt aattgtaaaa    180
 
SeqID 124
acattggcta aagcagtcgg tttgatgtat tctccaccaa ttccaccaaa accattctta     60
ggccgaataa cgacagattc gtcttctata                                      90
 
SeqID 125
cctggttctc cattttcaga gatttccggt gcaggatttt ttggtgtcgc gaaacgaata     60
tttccacgtc caccacgacc accgtgggca acgataaatt cttgcccatg ttcaatcaaa    120
tctgttaaaa ccttgccagt ctccgcatca cgaacagtcg taccttgtgg tactcgaact    180
ctaaggtcct cagcaccacg accatgcatc cctttggtca tccctttttc accagaatca    240
gccttgaaa                                                            249
 
SeqID 126
ataaattcct tgaccttggc cacatcctta tccaaaagaa gggcaccaag aaaggcttca     60
aaggcatcac caagaatggt gtcacgattg cgaccacctg atttttcttc ccctttaccc    120
aacttgataa actggtcaaa ctggcaatca cgcgcaaaac cagctaaact ctcctcacgg    180
acaatcatag cacggagttt tgataggtca ccttcaggct ttttaggata ttttttatat    240
agatattctg aaatcaataa ctgtagaaca gcgtctccta aaaattccaa gcgttcattg    300
tgtgaaattt ttaagaggcg gtgctcattg gca                                 333
 
SeqID 127
ccaataggaa aaaggaattg taaagctgaa tgccaatccc accacctgct tgaaaagcag     60
aagaccttcc agtcaagaaa gaccaagaga tatggggcaa gccccgaacc aagatataga    120
gaatcaagga agccaagatt gtcacaa                                        147
 
SeqID 128
cagccattgg gacactcgaa agccgaagaa catgagacta tctgttcgca taccttcgat     60
aaccatacga ccgaaaccat accaaatcaa gtaaaaggcc gtgatatgac ctcgtctgag    120
actcttccat ttccgtctaa aaatcagaat caaggcaaag ccaagcagat tcca          174
 
SeqID 129
ccttgctctt tacctgatta tgggctggtt ggttctggct atcattcctg ccattatcag     60
tcaaacgaca cccgttttct ggagtctcat ggtaactggc ggactctgtt atacagttgg    120
agctggattt tatgccaaga aaaaacctta tttccacatg atttggcatc tctttatcct    180
agctgcgtcc gcacttcaat acatcgctat tgtttattac atgtaaaaaa gttgagaaat    240
tcaatctcaa cttttttctt tacacatatt gataaagtac tggtgcaagc gcacatcatc    300
agtcaattct ggatgaaaag aacttaccaa catatttttt tcttgggctg caacaatttg    360
attgttcact gttgc                                                     375
 
SeqID 130
cgagtaaaag ataatcatct ggataagctt gtgaaagctc ttctaaaaag gcgttcatcc     60
actcagtatt acatccacca gctattaaga aaaatgattc gcctgtatgg gcatcaacag    120
ctccataaca atagcgaaat tctcgtatat agtgactatg gacatgtgga cctactccta    180
ttggagacca acaagatccc agtttac                                        207
 
SeqID 131
caagtcatca aaatagacat agcaactaca aataaaacgg aatctgtaaa gagccaaagt     60
gagagagaaa agaaaagatt gacaagcagt aatatactaa aggttagagg gcgaccgata    120
 
SeqID 132
gcctttaaga gttccaaggt cccatcactt gatccatcat cgacaaagac atactcgatt     60
tctgtttcca aatctggaag taaagcttcc agagcc                               96
 
SeqID 133
gataaaactg acccactggc taggaaactt cctgacaaaa gtaagccgtc aacttccttt     60
tgcaccaaat cactttctcc cgttaacatg gcttcattga cttccgcaaa gccttccaaa    120
accaaggcat cactaggaat ctgctctcct gcagacaaac gaatgacatc tcctagcact    180
aattcttcag gattaagagc aacttcc                                        207
 
SeqID 134
ttatgccgat tacaaacaca agcaaggcca cgagggtctg tgaccaatct aacgaagcaa     60
aataaggtat atagatacct aaattatctc cgccagacgc aattgtcagc aatg          114
 
SeqID 135
tgcattcaaa gcattggcaa tgagggacag tgcaaaggca atagttgtta cgtaggcaag     60
gagattcatc ttgcccccat atccgatata gttggtcaca aaggcaaaga ggaaggcgat    120
gatggaaatg atgatggccg ccaattttac ctgtttttgg ctcatttggt tgggtctgcc    180
ttcttgcgaa gcttcccact tctttatagc aaaggtataa atgaggaagg tgacgggata    240
ggtaatgatg gccgccttat ttccaaggat ataatcaata gcaccggaca aaatggtatt    300
aacaatacca aagtaatttc cccatttgct                                     330
 
SeqID 136
acgtccacga agctggttat cgatacgacg actttcatga cgttctgtac caataacaca     60
aagtcctcca agttcacgaa caccttcacc aagcttgatg tcggtaccac gacccgccat    120
gttggttgcg atggtaacgg caccacgttg accagcattc atgatgattt gggcttctct    180
atagtggttt ttggcattca agacttcgtg aggaacacca gctgcaacca atttcttaga    240
aatgtagtca ctagtttcaa ccgctactgt accaaccaag acaggttgac ccttttggta    300
acgagcctta acgtcttcga caaccgcttt aaacttagat tcgatacttg cataaagaag    360
gtc                                                                  363
 
SeqID 137
atctctactg gtgtaccgac ctgttcgatg tatccattgt taaagactgc aattctatca     60
gataaagtca aggcttcctc t                                               81
 
SeqID 138
ttaagtacca tgtccagcat aaagtcaatc ttgtgctctt taccgacaca caccattttc     60
tcaaaatcag ccatatcacc aaaaagagga tccactgcca ta                       102
 
SeqID 139
agctgctcat actcatctac caactccaag gcatgctcaa tcgtcggttt atcaaaacca     60
acaatattca tctgtgtcac acccatctca gcagccaagg caatttcttc tgcctcacga    120
cctgcaaatt cttctacatt caagtgtgta tgtgtatcaa aaatcatctc ttctaacctc    180
gttttctatc ttctattata ccaaaaaaga ggaggggcac ctaatttttc ggtttcccct    240
cctctcttca atagagagct attctgctat cttttctatc cgatattgcc catctcctat    300
tccacagtta gagacagaag agattggcta cat                                 333
 
SeqID 140
gtaacatctt gcattgttcc tgcagttgct tgcggtgcac ttgttgtctt aggagcagca     60
ttaggagcca ctggtctctt aggaactgta accatggcaa tggcttgcac tccaatcgtt    120
tctgcttcct tcacatcttc catagttttc gcattttcaa tctctttgag agctgcttgt    180
ttttctgctt ccactcttgc taaaagttct gctttttctt tatcagaaag cggtgcgcct    240
ttgatttcat cctgcttgtc cttggctgct ttttcaatgg catttttagc tgattctttt    300
tcagtagcta attgcttaga agcttgtgat                                     330
 
SeqID 141
tattctcctt tcaaccactc cattctcata aggaaaacga cgaaaatcat aaatccaaac     60
cccaaagcac cacgaatgaa ttggcgaagc aaggtttggt caaaccaacc tgtaaacatt    120
tccactaacc ataccaagag tgacaggccg ataaagaaa                           159
 
SeqID 142
gattatttca agtttcgaac aacttttaca agattttcta cagtaaagcc atattctgcc     60
aatacttttg gtgctggggc agaggctccg aaggtatcaa tacctagaac ggcaccatcg    120
agaccaacat atttgtacca gttt                                           144
 
SeqID 143
agaggcagac gtggattatg cgttgcacga atcaaggctc ctagactagt cattaaacct     60
aagagaacaa tcgatccgcc taccaaagat agatacagtc caccactctc agctacatcc    120
ctctccgtcc ccaaaagtcc tatcatctct ttcccagcga agatggacaa aaatcctaaa    180
aggaaactta atagtaaggt aatcttcaac gcctcagtca ca                       222
 
SeqID 144
actcctccat ataccaaaat tcctgccaaa acagctataa taccatttat ttcagctcaa     60
gatttcaacc aagcccaacg gctctctgga                                      90
 
SeqID 145
MSKNIVQLNNSFIQNEYQRRRYLMKERQKRNRFMGGVLILIMLLFILPTFNLAQSYQQLLQRRQQLADLQTQYQTLSDEKDKE
TAFATKLKDEDYAAKYTRAKYYYSKSREKVYTIPDLLQR
 
SeqID 146
MDKKKLLLIDGSSVAFRAFFALYQQLDRFKNVAGLHTNAIYGFQLMLSHLLERVEPSHILVAFDAGKTTFRTEMYADYKGGRA
KTPDEFREQFPFIRELLDHMGIRHYDLAQYEADDIIGTLDKLAEQDGFDITIVSGDKDLIQLTDEHTVVEISKKGVAEFEAFI
PDYLMEEMGLTPAQFIDLKALMGDKSDNIPGVTKVGEKTGIKLLLEHGSLEGIYENIDGMKTSKMKENLINDKEQAFLSKTLA
TIDTKAPIAIGLEDLVYSGPDVENLGKFYDEMGFKQLKQALNVSSADVSESLDFTIVDQISQDMLSEESIFHFELFGENYHTD
NLVGFVWSCGDKLYATDKLELLQDPIFKDFLEKTSLRVYDFKKVKVLLQRFGVDLQAPAFDIRLAKYLLSTVEDNEIATIASI
YGQTYLVDDETFYGKGVKKAIPEREKFLEHLACKLAVLVETEPILLEKLSENGQLELLYDMEQPLAFVLAKMEIAGIMVKKET
LLEMQAENELVIEKLTQEIYELAGEEFNVNSPKQLGVLLFEKLGLPLEYTKKTKTGYSTAVDVLERLAPIAPIVKKILDYRQI
AKIQSTYVIGLQDWILADGKIHTRYVQDLTQTGRLSSVDPNLQNIPARLEQGRLIRKAFVPEWEDSVLLSSDYSQIELRVLAH
ISKDEHLIKAFQEGADIHTSTAMRVFGIERPDDVTANDRRANKAVNFGVVYGISDFGLSNNLGISRKEAKAYIDTYFERFPGI
KNYMDEVVREARDKGYVETLFKRRRELPDINSRNFNIRGFAERTAINSPIQGSAADILKIAMIQLDKALVAGGYQTKMLLQVH
DEIVLEVPKSELVEMKKLVKQTMEEAIQLSVPLIADENEGATWYEAK
 
SeqID 147
MGMAAFKNPNNQYKAITIAQTLGDDASSEELAGRYGSAVQCTEVTASNLSTVKTKATVVEKPLKDFRASTSDQSGWVESNGKW
YFYESGDVKTGWVKTDGKWYYLNDLGVMQTGFVKFSGSWYYLSNSGAMFTGWGTDGSRWFYFDGSGAMKTGWYKENGTWYYLD
EAGIMKTGWFKVGPHWYYAYGSGALAVSTTTPDGYRVNGNGEWVN
 
SeqID 148
MSRKSIGEKRHSFSMRKLSVGLVSVTVSSFFLMSQGIQSVSADNMESPIHYKYMTEGKLTDEEKSLLVEALPQLAEESDDTYY
LVYRSQQFLPNTGFNPTVGTFLFTAGLSLLVLLVSKRENGKKRLVHFLLLTSMGVQLLPASAFGLTSQILSAYNSQLSIGVGE
HLPEPLKIEGYQYIGYIKTKKQDNTELSRTVDGKYSAQRDSQPNSTKTSDVVHSADLEWNQGQGKVSLQGEASGDDGLSEKSS
IAADNLSSNDSFASQVEQNPDHKGESVVRPTVPEQGNPVSATTVQSAEEEVLATTNDRPEYKLPLETKGTQEPGHEGEAAVRE
DLPVYTKPLETKGTQGPGHEGEAAVREEEPAYTEPLATKGTQEPGHEGKATVREETLEYTEPVATKGTQEPEHEGEAAVEEEL
PALEVTTRNRTEIQNIPYTTEEIQDPTLLKNRRKIERQGQAGTRTIQYEDYIVNGNVVETKEVSRTEVAPVNEVVKVGTLVKV
KPTVEITNLTKVENKKSITVSYNLIDTTSAYVSAKTQVFHGDKLVKEVDIENPAKEQVISGLDYYTPYTVKTHLTYNLGENNE
ENTETSTQDFQLEYKKIEIKDIDSVELYGKENDRYRRYLSLSEAPTDTAKYFVKVKSDRFKEMYLPVKSITENTDGTYKVTVA
VDQLVEEGTDGYKDDYTFTVAKSKAEQPGVYTSFKQLVTAMQSNLSGVYTLASDMTADEVSLGDKQTSYLTGAFTGSLIGSDG
TKSYAIYDLKKPLFDTLNGATVRDLDIKTVSADSKENVAALAKAANSANINNVAVEGKISGAKSVAGLVASATNTVIENSSFT
GKLIANHQDSNKNDTGGIVGNITGNSSRVNKVRVDALISTNARNNNQTAGGIVGRLENGALISNSVATGEIRNGQGYSRVGGI
VGSTWQNGRVNNVVSNVDVGDGYVITGDQYAAADVKNASTSVDNRKADRFATKLSKDQIDAKVADYGITVTLDDTGQDLKRNL
REVDYTRLNKAEAERKVAYSNIEKLMPFYNKDLVVHYGNKVATTDKLYTTELLDVVPMKDDEVVTDINNKKNSINKVMLHFKD
NTVEYLDVTFKENFINSQVIEYNVTGKEYIFTPEAFVSDYTAITNNVLSDLQNVTLNSEATKKVLGAANDAALDNLYLDRQFE
EVKANIAEHLRKVLAMDKSINTTGDGVVEYVSEKIKNNKEAFMLGLTYMNRWYDINYGKMNTKDLSTYKFDFNGNNETSTLDT
IVALGNSGLDNLRASNTVGLYANKLASVKGEDSVFDFVEAYRKLFLPNKTNNEWFKENTKAYIVEMKSDIAEVREKQESPTAD
RKYSLGVYDRISAPSWGHKSMLLPLLTLPEESVYISSNMSTLAFGSYERYRDSVDGVILSGDALRTYVRNRVDIAAKRHRDHY
DIWYNLLDSASKEKLFRSVIVYDGFNVKDETGRTYWARLTDKNIGSIKEFFGPVGKWYEYNSSAGAYANGSLTHFVLDRLLDA
YGTSVYTHEMVHNSDSAIYFEGNGRREGLGAELYALGLLQSVDSVNSHILALNTLYKAEKDDLNRLHTYNPVERFDSDEALQS
YMHGSYDVMYTLDAMEAKAILAQNNDVKKKWFRKIENYYVRDTRHNKDTHAGNKVRPLTDEEVANLTSLNSLIDNDIINRRSY
DDSREYKRNGYYTISMFSPVYAALSNSKGAPGDIMFRKIAYELLAEKGYHKGFLPYVSNQYGAEAFASGSKTFSSWHGRDVAL
VTDDLVFKKVFNGEYSSWADFKKAMFKQRIDKQDNLKPITIQYELGNPNSTKEVTITTAAQMQQLINEAAAKDITNIDRATSH
TPASWVHLLKQKIYNAYLRTTDDFRNSIYK
 
SeqID 149
MKFNPNQRYTRWSIRRLSVGVASVVVASGFFVLVGQPSSVRADGLNPTPGQVLPEETSGTKEGDLSEKPGDTVLTQAKPEGVT
GNTNSLPTPTERTEVSEETSPSSLDTLFEKDEEAQKNPELTDVLKETVDTADVDGTQASPAETTPEQVKGGVKENTKDSIDVP
AAYLEKAEGKGPFTAGVNQVIPYELFAGDGMLTRLLLKASDNAPWSDNGTAKNPALPPLEGLTKGKYFYEVDLNGNTVGKQGQ
ALIDQLRANGTQTYKATVKVYGNKDGKADLTNLVATKNVDININGLVAKETVQKAVADNVKDSIDVPAAYLEKAKGEGPFTAG
VNHVIPYELFAGDGMLTRLLLKASDKAPWSDNGDAKNPALSPLGENVKTKGQYFYQVALDGNVAGKEKQALIDQFRANGTQTY
SATVNVYGNKDGKPDLDNIVATKKVTININGLISKETVQKAVADNVKDSIDVPAAYLEKAKGEGPFTAGVNHVIPYELFAGDG
MLTRLLLKASDKAPWSDNGDAKNPALSPLGENVKTKGQYFYQLALDGNVAGKEKQALIDQFRANGTQTYSATVNVYGNKDGKP
DLDNIVATKKVTININGLISKETVQKAVADNVKDSIDVPAAYLEKAKGEGPFTAGVNHVIPYELFAGDGMLTRLLLKASDKAP
WSDNGDAKNPALSPLGENVKTKGQYFYQVALDGNVAGKEKQALIDQFRANGTQTYSATVNVYGNKDGKPDLDNIVATKKVTIK
INVKETSDTANGSLSPSNSGSGVTPMNHNHATGTTDSMPADTMTSSTNTMAGENMAASANKMSDTMMSEDKAMLPNTGETQTS
MASIGFLGLALAGLLGGLGLKNKKEEN
 
SeqID 150
MKSITKKIKATLAGVAALFAVFAPSFVSAQESSTYTVKEGDTLSEIAETHNTTVEKLAENNHIDNIHLIYVDQELVIDGPVAP
VATPAPATYAAPAAQDETVSAPVAETPVVSETVVSTVSGSEAEAKEWIAQKESGGSYTATNGRYIGRYQLTDSYLNGDYSAEN
QERVADAYVAGRYGSWTAAKNFWLNNGWY
 
SeqID 151
MNKKKMILTSLASVAILGAGFVTSQPTFVRAEESPQVVEKSSLEKKYEEAKAKADTAKKDYETAKKKAEDAQKKYEDDQKRTE
EKARKEAEASQKLNDVALVVQNAYKEYREVQNQRSKYKSDAEYQKKLTEVDSKIEKARKEQQDLQNKFNEVRAVVVPEPNALA
ETKKKAEEAKAEEKVAKRKYDYATLKVALAKKEVEAKELEIEKLQYEISTLEQEVATAQHQVDNLKKLLAGADPDDGTEVIEA
KLKKGEAELNAKQAELAKKQTELEKLLDSLDPEGKTQDELDKEAEEAELDKKADELQNKVADLEKKISNLEILLGGADPEDDT
AALQNKLAAKKAELAKKQTELEKLLDSLDPEGKTQDELDKEAEEAELDKKADELQNKVADLEKEISNLEILLGGADSEDDTAA
LQNKLATKKAELEKTQKELDAALNELGPDGDEEETPAPAPQPEQPAPAPKPEQPAPAPKPEQPAPAPKPEQPAPAPKPEQPAP
APKPEQPAKPEKPAEEPTQPEKPATPKTGWKQENGMWYFYNTDGSMAIGWLQNNGSWYYLNANGAMATGWVKDGDTWYYLEAS
GAMKASQWFKVSDKWYYVNSNGAMATGWLQYNGSWYYLNANGDMATGWLQYNGSWYYLNANGDMATGWAKVNGSWYYLNANGA
MATGWAKVNGSWYYLNANGSMATGWVKDGDTWYYLEASGAMKASQWFKVSDKWYYVNGLGALAVNTTVDGYKVNANGEWV
 
SeqID 152
MKKIVLVSLAFLFVLVGCGQKKETGPATKTEKDTLQSALPVIENAEKNTVVTKTLVLPKSDDGSQQTQTITYKDKTFLSLAIQ
QKRPVSDELKTYIDQHGVEETQKALLEAEEKDKSIIEARKLAGFKLETKLLSATELQTTTSFDFQVLDVKKASQLEHLKNIGL
ENLLKNEPSKYISDRLANGATEQ
 
SeqID 153
MFEVEEWLHSRIGLNFRSGLGRMQQAVDLLGNPEQSYPIIHVTGTNGKGSTIAFMRELFMGHGKKVATFTSPHIVSINDRICI
NGQPIADADFIRLTDQVKEMEKTLLQTPAQLSFFELLTLVAFLYFREQEVDLVLLEVGIGGLLDTTNVVTGEFAVITSIGLDH
QETLGDSLEAIAEQKAGIFKAGKKAVIAKLPPEARLACQKKAESLAVNLYQAGQDFLMLNGDFSSSLLNLSQLNIGLEGVYQQ
ENAALALQTFLLFMRERKEAVDEQAVRKALEQTHWAGRLERIRPQIYLDGAHNLPALTRLAEFIKEKEDEGYRPQILFGSLKR
KDYQGMLGYLTEKLPQVELKVTGFDYQGALDERDVTGYDIVSSYREFISDFEERADAQDLLFVTGSLYFISEVRGYLLDREQI
N
 
SeqID 154
VGIRVYKPTTNGRRNMTSLDFAEITTSTPEKSLLVALKSKAGRNNNGRITVRHQGGGHKRFYRLVDFKRNKDNVEAVVKTIEY
DPNRSANIALVHYTDGVKAYIIAPKGLEVGQRIVSGPEADIKVGNALPLANIPVGTLIHNIELKPGRGGELVRAAGASAQVLG
SEGKYVLVRLQSGEVRMILGTCRATVGVVGNEQHGLVNLGKAGRSRWEGIRPTVRGSVMNPNDHPHGGGEGKAPVGRKAPSTP
WGKPALGLKTRNKKAKSDKLIVRRRNEK
 
SeqID 155
MAKKSMVAREAKRQKIVDRYAEKRAALKAAGDYEGLSKLPRNASPTRLHNRCRVTGRPHSVYRKFGLSRIAFRELAHKGQIPG
VTKASW
 
SeqID 156
MDIRQVTETIAMIEEQNFDIRTITMGISLLDCIDPDINRAAEKIYQKITTKAANLVAVGDEIAAELGIPIVNKRVSVTPISLI
GAATDATDYVVLAKALDKAAKEIGVDFIGGFSALVQKGYQKGDEILINSIPRALAETDKVCSSVNIGSTKSGINMTAVADMGR
IIKETANLSDMGVAKLVVFANAVEDNPFMAGAFHGVGEADVIINVGVSGPGVVKRALEKVRGQSFDVVAETVKKTAFKITRIG
QLVGQMASERLGVEFGIVDLSLAPTPAVGDSVARVLEEMGLETVGTHGTTAALALLNDQVKKGGVMACNQVGGLSGAFIPVSE
DEGMIAAVQNGSLNLEKLEAMTAICSVGLDMIAIPEDTPAETIAAMIADEAAIGVINMKTTAVRIIPKGKEGDMIEFGGLLGT
APVMKVNGASSVDFISRGGQIPAPIHSFKN
 
SeqID 157
MVNTEVARTTIKTEYFGSLTERMNKYREDVLNKKPYIDAERAVLATRAYERYKEQPNVLKRAYMLKEILENMTIYIEEESMIA
GNQASSNKDAPIFPEYTLEFVLNELDLFEKRDGDVFYITEETKEQLRSIAPFWENNNLRARAGALLPEEVSVYMETGFFGMEG
KMNSGDAHLAVNYQKLLQFGLRGFEERARKAKVALDLTDPASIDKYHFYDSIFIVIDAIKVYAKRFVALAKSLAENANPKRKK
ELLEIADICSRVPYEPATTFAEAIQSVWFIQCILQIESNGHSLSYGRFDQYMYPYMKADLESGKETEDSIVERLTNLWIKTIT
INKVRSQSHTFSSAGSPLYQNVTIGGQTRDKKDAVNPLSYLVLKSVAQTHLPQPNLTVRYHAGLDARFMNECIEVMKLGFGMP
AFNNDEIIIPSFIAKGVLEDDAYDYSAIGCVETAVPGKWGYRCTGMSYMNFPKVLLITMNDGIDPASGKRFAPSFGRFKDMKN
FSELENAWDKTLRYLTRMSVIVENSIDLSLEREVPDILCSALTDDCIGRGKHLKEGGAVYDYISGLQVGIANLSDSLAAIKKL
VFEEERISPSQLWHALETDYAGEEGKVIQEMLIHDAPKYGNDDDYADKLVTAAYDIYVDEIAKYPNTRYGRGPIGGIRYSGTS
SISANVGQGRGTLATPDGRNAGTPLAEGCSPSHNMDQHGPTSVLKSVSKLPTDEIVGGVLLNQKVNPQTLAKEEDKLKLIALL
RTFFNRLHGYHIQYNVVSRETLIDAQKHPEKHRDLIVRVAGYSAFFNVLSKATQDDIIGRTEHTL
 
SeqID 158
MSQAQYAGTGRRKNAVARVRLVPGTGKITVNKKDVEEYIPHADLRLVINQPFAVTSTVGSYDVFVNVIGGGYAGQSGAIRHGI
ARALLQVDPDFRDSLKRAGLLTRDSRKVERKKPGLKKARKASQFSKR
 
SeqID 159
LEKKLTIKDIAEMAQTSKTTVSFYLNGKYEKMSQETREKIEKVIHETNYKPSIVARSLNSKRTKLIGVLIGDITNSFSNQIVK
GIEDIASQNGYQVMIGNSNYSQESEDRYIESMLLLGVDGFIIQPTSNFRKYSRIIDEKKKKMVFFDSQLYEHRTSWVKTNNYD
AVYDMTQSCIEKGYEHFLLITADTSRLSTRIERASGFVDALTDANMRHASLTIEDKHTNLEQIKEFLQKEIDPDEKTLVFIPN
CWALPLVFTVIKELNYNLPQVGLIGFDNTEWTCFSSPSVSTLVQPSFEEGQQATKILIDQIEGRNQEERQQVLDCSVNWKEST
F
 
SeqID 160
MNKGLFEKRCKYSIRKFSLGVASVMIGAAFFGTSPVLADSVQSGSTANLPADLATALATAKENDGRDFEAPKVGEDQGSPEVT
DGPKTEEELLALEKEKPAEEKPKEDKPAAAKPETPKTVTPEWQTVANKEQQGTVTIREEKGVRYNQLSSTAQNDNAGKPALFE
KKGLTVDANGNATVDLTFKDDSEKGKSRFGVFLKFKDTKNNVFVGYDKDGWFWEYKSPTTSTWYRGSRVAAPETGSTNRLSIT
LKSDGQLNASNNDVNLFDTVTLPAAVNDHLKNEKKILLKAGSYDDERTVVSVKTDNQEGVKTEDTPAEKETGPEVDDSKVTYD
TIQSKVLKAVIDQAFPRVKEYSLNGHTLPGQVQQFNQVFINNHRITPEVTYKKINETTAEYLMKLRDDAHLINAEMTVRLQVV
DNQLHFDVTKIVNHNQVTPGQKIDDESKLLSSISFLGNALVSVSSNQTGAKFDGATMSNNTHVSGDDHIDVTNPMKDLAKGYM
YGFVSTDKLAAGVWSNSQNSYGGGSNDWTRLTAYKETVGNANYVGIHSSEWQWEKAYKGIVFPEYTKELPSAKVVITEDANAD
KNVDWQDGAIAYRSIMNNPQGWEKVKDITAYRIAMNFGSQAQNPFLMTLDGIKKINLHTDGLGQGVLLKGYGSEGHDSGHLNY
ADIGKRIGGVEDFKTLIEKAKKYGAHLGIHVNASETYPESKYFNEKILRKNPDGSYSYGWNWLDQGINIDAAYDLAHGRLARW
EDLKKKLGDGLDFIYVDVWGNGQSGDNGAWATHVLAKEINKQGWRFAIEWGHGGEYDSTFHHWAADLTYGGYTNKGINSAITR
FIRNHQKDAWVGDYRSYGGAANYPLLGGYSMKDFEGWQGRSDYNGYVTNLFAHDVMTKYFQHFTVSKWENGTPVTMTDNGSTY
KWTPEMRVELVDADNNKVVVTRKSNDVNSPQYRERTVTLNGRVIQDGSAYLTPWNWDANGKKLSTDKEKMYYFNTQAGATTWT
LPSDWAKSKVYLYKLTDQGKTEEQELTVKDGKITLDLLANQPYVLYRSKQTNPEMSWSEGMHIYDQGFNSGTLKHWTISGDAS
KAEIVKSQGANDMLRIQGNKEKVSLTQKLTGLKPNTKYAVYVGVDNRSNAKASITVNTGEKEVTTYTNKSLALNYVKAYAHNT
RRDNATVDDTSYFQNMYAFFTTGADVSNVTLTLSREAGDQATYFDEIRTFENNSSMYGDKHDTGKGTFKQDFENVAQGIFPFV
VGGVEGVEDNRTHLSEKHNPYTQRGWNGKKVDDVIEGNWSLKTNGLVSRRNLVYQTIPQNFRFEAGKTYRVTFEYEAGSDNTY
AFVVGKGEFQSGRRGTQASNLEMHELPNTWTDSKKAKYATFLVTGAETGDTWVGIYSTGNASNTRGDSGGNANFRGYNDFMMD
NLQIEEITLTGKMLTENALKNYLPTVAMTNYTKESMDALKEAVFNLSQADDDISVEEARAEIAKIEALKNALVQKKTALVADD
FASLTAPAQAQEGLANAFDGNVSSLWHTSWNGGDVGKPATMVLKEPTEITGLRYVPRGSGSNGNLRDVKLVVTDESGKEHTFT
ATDWPNNNKPKDIDFGKTIKAKKIVLTGTKTYGDGGDKYQSAAELIFTRPQVAETPLDLSGYEAALVKAQKLTDKDNQEEVAS
VQASMYYATDNHLLTERMVEYFADYLNQLKDSATKPDAPTVEKPEFKLRSLASEQGKTPDYKQEIARPETPEQILPATGESQS
DTALILASVSLALSALFVVKTKKD
 
SeqID 161
MNKPTILRLIKYLSISFLSLVIAAIVLGGGVFFYYVSYAPSLSESYLVATTSSKIYDNKNQLIADLGSERRVNAQANDIPTDL
VYAIVSIEDHRFFDHRGIDTIRILGAFLRNLQSNSLQGGSTLTQQLIKLTYFSTSTSDQTISRKAQEAWLAIQLEQKATKQEI
LTYYINKVYMSNGNYGMQTAAQNYYGKDLNNLSLPQLALLAGMPQAPNQYDPYSHPEAAQDRRNLVLSEMKNQGYISAEQYEK
AVNTPITDGLQSLKSASNYPAYMDNYLKEVINQVEEETGYNLLTTGMDVYTNVDQEAQKHLWDIYNTDEYVAYPDDELQVAST
IVDVSNGKVIAQLGARHQSSNVSFGINQAVETNRDWGSTMKPITDYAPALEYGVYDSTATIVHDEPYNYPGTNTPVYNWDRGY
FGNITLQYALQQSRNVPAVETLNKVGLNRAKTFLNGLGIDYPSIHYSNAISSNTTESDKKYGASSEYMAAAYAAFANGGTYYK
PMYIHKVVFSDGSEKEFSNVGTRAMKETTAYMMTDMMYTVLTYGTGRNAYLAWLPQAGKTGTSNYTDEEIENHIKTSQFVAPD
ELFAGYTRKYSMAVWTGYSNRLTPLVGNGLTVAAKVYRSMMTYLSEGSNPEDWNIPEGLYRNGEFVFKNGARSTWNSPAPQQP
PSTESSSSSSDSSTSQSSSTTPSTNNSTTTNPNNNTQQSNTTPDQQNQNPQPAQP
 
SeqID 162
MSKKRRNRHKKEGQEPQFDFDEAKELTVGQAIRKNEEVESGVLPEDSILDKYVKQHRDEIEADKFATRQYKKEEFVETQSLDD
LIQEMREAVEKSEASSEEVPSSEDILLPLPLDDEEQGLDPLLLDDENPTEMTEEVEEEQNLSRLDQEDSEKKSKKGFILTVLA
LVSVIICVSAYYVYRQVARSTKEIETSQSTTANQSDVDDFNTLYDAFYTDSNKTALKNSQFDKLSQLKTLLDKLEGSREHTLA
KSKYDSLATQIKAIQDVNAQFEKPAIVDGVLDTNAKAKSDAKFTDIKTGNTELDKVLDKAISLGKSQQTSTSSSSSSQTSSSS
SSQASSNTTSEPKPSSSNETRSSRSEVNMGLSSAGVAVQRSASRVAYNQSAIDDSNNSAWDFADGVLEQILATSRSRGYITGD
QYILERVNIVNGNGYYNLYKPDGTYLFTLNCKTGYFVGNGAGHADDLDY
 
SeqID 163
MKLLKKMMQVALAVFFFGLLATNTVFANTTGGRFVDKDNRKYYVKDDHKAIYWHKIDGKTYYFGDIGEMVVGWQYLEIPGTGY
RDNLFDNQPVNEIGLQEKWYYFGQDGALLEQTDKQVLEAKTSENTGKVYGEQYPLSAEKRTYYFDNNYAVKTGWIYEEGHWYY
LNKLGNFGDDSYNPLPIGEVAKGWTQDFHVTIDIDRSKPAPWYYLDASGKMLTDWQKVNGKWYYFGSSGSMATGWKYVRGKWY
YLDNKNGDMKTGWQYLGNKWYYLRSSGAMVTGWYQDGSTWYYLDPSNGDMKIGWTKVNGKWYYLNSNGAMVTGSQTIDGKVYN
FASSGEWI
 
SeqID 164
MKILKKTMQVGLTVFFFGLLGTSTVFADDSEGWQFVQENGRTYYKKGDLKETYWRVIDGKYYYFDSLSGEMVVGWQYIPFPSK
GSTIGPYPNGIRLEGFPKSEWYYFDKNGVLQEFVGWKTLEIKTKDSVGRKYGEKREDSEDKEEKRYYTNYYFNQNHSLETGWL
YDQSNWYYLAKTEINGENYLGGERRAGWINDDSTWYYLDPTTGIMQTGWQYLGNKWYYLRSSGAMATGWYQEGTTWYYLDHPN
GDMKTGWQNLGNKWYYLRSSGAMATGWYQDGSTWYYLNAGNGDMKTGWFQVNGNWYYAYSSGALAVNTTVDGYSVNYNGEWVR
 
SeqID 165
MVLSKYYGVADGMNVEGRGSANFIKDNVLITAAHNYYRHDYGKEADDIYVLPAVSPSQEPFGKIKVKEVRYLKEFRNLNSKDA
REYDLALLILEEPIGAKLGTLGLPTSQKNLTGITVTITGYPSYNFKIHQMYTDKKQVLSDDGMFLDYQVDTLEGSSGSTVYDA
SHRVVGVHTLGDGANQINSAVKLNERNLPFIYSVLKGYSLEGWKKINGSWYHYRQHDKQTGWQEINDTWYYLDSSGKMLTDWQ
KVNGKWYYLNSNGAMVTGSQTIDGKVYNFASSGEWI
 
SeqID 166
LMKKTFFLLVLGLFCLLPLSVFAIDFKINSYQGDLYIHADNTAEFRQKIVYQFEEDFKGQIVGLGRAGKMPSGFDIDPHPKIQ
AAKNGAELADVTSEVTEEADGYTVRVYNPGQEGDIVEVDLVWNLKNLLFLYDDIAELNWQPLTDSSESIEKFEFHVRGDKGAE
KLFFHTGKLFREGTIEKSNLDYTIRLDNLPAKRGVELHAYWPRTDFASARDQGLKGNRLEEFNKIEDSIVREKDQSKQLVTWV
LPSILSISLLLSVCFYFIYRRKTTPSVKYAKNHRLYEPPMELEPMVLSEAVYSTSLEEVSPLVKGAGKFTFDQLIQATLLDVI
DRGNVSIISEGDAVGLRLVKEDGLSSFEKDCLNLAFSGKKEETLSNLFADYKVSDSLYRRAKVSDEKRIQARGLQLKSSFEEV
LNQMQEGVRKRVSFWGLPDYYRPLTGGEKALQVGMGALTILPLFIGFGLFLYSLDVHGYLYLPLPILGFLGLVLSVFYYWKLR
LDNRDGVLNEAGAEVYYLWTSFENMLREIARLDQAELESIVVWNRLLVYATLFGYADKVSHLMKVHQIQVENPDINLYVAYGW
HSTFYHSTAQMSHYASVANTASTYSVSSGSGSSGGGFSGGGGGGSIGAF
 
SeqID 167
MKSINKFLTMLAALLLTASSLFSAATVFAAGTTTTSVTVHKLLATDGDMDKIANELETGNYAGNKVGVLPANAKEIAGVMFVW
TNTNNEIIDENGQTLGVNIDPQTFKLSGAMPATAMKKLTEAEGAKFNTANLPAAKYKIYEIHSLSTYVGEDGATLTGSKAVPI
EIELPLNDVVDAHVYPKNTEAKPKIDKDFKGKANPDTPRVDKDTPVNHQVGDVVEYEIVTKIPALANYATANWSDRMTEGLAF
NKGTVKVTVDDVALEAGDYALTEVATGFDLKLTDAGLAKVNDQNAEKTVKITYSATLNDKAIVEVPESNDVTFNYGNNPDHGN
TPKPNKPNENGDLTLTKTWVDATGAPIPAGAEATFDLVNAQTGKVVQTVTLTTDKNTVTVNGLDKNTEYKFVERSIKGYSADY
QEITTAGEIAVKNWKDENPKPLDPTEPKVVTYGKKFVKVNDKDNRLAGAEFVIANADNAGQYLARKADKVSQEEKQLVVTTKD
ALDRAVAAYNALTAQQQTQQEKEKVDKAQAAYNAAVIAANNAFEWVADKDNENVVKLVSDAQGRFEITGLLAGTYYLEETKQP
AGYALLTSRQKFEVTATSYSATGQGIEYTAGSGKDDATKVVNKKITIPQTGGIGTIIFAVAGAAIMGIAVYAYVKNNKDEDQL
A
 
SeqID 168
MAVMAYPLVSRLYYRVESNQQIADFDKEKATLDEADIDERMKLAQAFNDSLNNVVSGDPWSEEMKKKGRAEYARMLEIHERMG
HVEIPVIDVDLPVYAGTAEEVLQQGAGHLEGTSLPIGGNSTHAVITAHTGLPTAKMFTDLTKLKVGDKFYVHNIKEVMAYQVD
QVKVIEPTNFDDLLIVPGHDYVTLLTCTPYMINTHRLLVRGHRIPYVAEVEEEFIAANKLSHLYRYLFYVAVGLIVILLWIIR
RLRKKKKQPEKALKALKAARKEVKVEDGQQ
 
SeqID 169
MSRTKLRALLGYLLMLVACLIPIYCFGQMVLQSLGQVKGHATFVKSMTTEMYQEQQNHSLAYNQRLASQNRIVDPFLAEGYEV
NYQVSDDPDAVYGYLSIPSLEIMEPVYLGADYHHLGMGLAHVDGTPLPLDGTGIRSVIAGHRAEPSHVFFRHLDQLKVGDALY
YDNGQEIVEYQMMDTEIILPSEWEKLESVSSKNIMTLITCDPIPTFNKRLLVNFERVAVYQKSDPQTAAVARVAFTKEGQSVS
RVATSQWLYRGLVVLAFLGILFVLWKLARLLRGK
 
SeqID 170
MKNPFFERRCRYSIRKLSVGACSLMIGAVLFAGPALAEETAVPENSGANTELVSGESEHSTNEADKQNEGEHARENKLEKAEG
VAIASETASPASNEAATTETAEAASAAKPEEKASEVVAETPSAEAKPKSDKETEAKPEATNQGDESKPAAEANKTEKEVQPDV
PKNTEKTLKPKEIKFNSWEELLKWEPGAREDDAINRGSVVLASRRTGHLVNEKASKEAKVQALSNTNSKAKDHASVGGEEFKA
YAFDYWQYLDSMVFWEGLVPTPDVIDAGHRNGVPVYGTLFFNWSNSIADQERFAEALKQDADGSFPIARKLVDMAKYYGYDGY
FINQETTGDLVKPLGEKMRQFMLYSKEYAAKVNHPIKYSWYDAMTYNYGRYHQDGLGEYNYQFMQPEGDKVPADNFFANFNWD
KAKNDYTIATANWIGRNPYDVFAGLELQQGGSYKTKVKWNDILDENGKLRLSLGLFAPDTITSLGKTGEDYHKNEDIFFTGYQ
GDPTGQKPGDKDWYGIANLVADRTPAVGNTFTTSFNTGHGKKWFVDGKVSKDSEWNYRSVSGVLPTWRWWQTSTGEKLRAEYD
FTDAYNGGNSLKFSGDVAGKTDQDVRLYSTKLEVTEKTKLRVAHKGGKGSKVYMAFSTTPDYKFDDADAWKELTLSDNWTNEE
FDLSSLAGKTIYAVKLFFEHEGAVKDYQFNLGQLTISDNHQEPQSPTSFSVVKQSLKNAQEAEAVVQFKGNKDADFYEVYEKD
GDSWKLLTGSSSTTIYLPKVSRSASAQGTTQELKVVAVGKNGVRSEAATTTFDWGMTVKDTSLPKPLAENIVPGATVIDSTFP
KTEGGEGIEGMLNGTITSLSDKWSSAQLSGSVDIRLTKPRTVVRWVMDHAGAGGESVNDGLMNTKDFDLYYKDADGEWKLAKE
VRGNKAHVTDITLDKPITAQDWRLNVVTSDNGTPWKAIRIYNWKMYEKLDTESVNIPMAKAAARSLGNNKVQVGFADVPAGAT
ITVYDNPNSQTPLATLKSEVGGDLASAPLDLTNQSGLLYYRTQLPGKEISNVLAVSVPKDDRRIKSVSLETGPKKTSYAEGED
LDLRGGVLRVQYEGGTEDELIRLTHAGVSVSGFDTHHKGEQNLTLQYLGQPVNANLSVTVTGQDEASPKTILGIEVSQEPKKD
YLVGDSLDLSEGRFAVAYSNDTMEEHSFTDEGVEISGYDAQKTGRQTLTLHYQGHEVSFDVLVSPKAALNDEYLKQKLAEVEA
AKNKVVYNFASSEVKEAFLKAIEAAEQVLKDHETSTQDQVNDRLNKLTEAHKALNGQEKFTEEKTELDRLTGEVQELLAAKPN
HPSGSALAPLLEKNKALVEKVDLSPEELTTAKQSLKDLVALLKEDKPAVFSDSKTGVEVHFSNKEKTVIKGLKVERVQASAEE
KKYFAGEDAHVFEIEGLDEKGQDVDLSYASIVKIPIEKDKKVKKVFFLPEGKEAVELAFEQTDSHVIFTAPHFTHYAFVYESA
EKPQPAKPAPQNTVLPKPTYQPTSDQQKAPKLEVQEEKVAFHRQEHENTEMLVGEQRVIIQGRDGLLRHVFEVDENGQRRLRS
TEVIQEAIPEIVEIGTKVKTVPAVVATQEKPAQNTAVKSEEASKQLPNTGTADANEALIAGLASLGLASLALTLRRKREDKD
 
SeqID 171
MSITSFVKRIQDITRNDAGVNGDAQRIEQMSWLLFLKIYDSREMVWELEEDEYESIIPEELKWRNWAHAQNGERVLTGDELLD
FVNNKLFKELKELEITSNMPIRKTIVKSAFEDANNYMKNGVLLRQVINVIDEVDFNSPEDRHSFNDIYEKILKDIQNAGNSGE
FYTPRAATDFIAEVLDPKLGESMADLACGTGGFLTSTLNRLSSQRKTSEDTKKYNTAVFGIEKKAFPHLLAVTNLFLHEIDDP
KIVHGNTLEKNVREYTDDEKFDIIMMNPPFGGSELETIKNNFPAELRSSETADLFMAVIMYRLKENGRVGVILPDGFLFGEGV
KTRLKQKLVDEFNLHTIIRLPHSVFAPYTGIHTNILFFDKTKKTEETWFYRLDMPDGYKNFSKTKPMKSEHFNPVRDWWENRE
EILEGKFYKSKSFTPSELAELNYNLDQCDFPKEEEEILNPFELIQNYQAERATLNHKIDNVLADILQLLEDK
 
SeqID 172
MNNTEFYDRLGVSKNASADEIKKAYRKLSKKYHPDINKEPGAEDKYKEVQEAYETLSDDQKRAAYDQYGAAGANGGFGGAGGF
GGFNGAGGFGGFEDIFSSFFGGGGSSRNPNAPRQGDDLQYRVNLTFEEAIFGTEKEVKYHREAGCRTCNGSGAKPGTSPVTCG
RCHGAGVINVDTQTPLGMMRRQVTCDVCHGRGKEIKYPCTTCHGTGHEKQAHSVHVKIPAGVETGQQIRLAGQGEAGFNGGPY
GDLYVVVSVEASDKFEREGTTIFYNLNLNFVQAALGDTVDIPTVHGDVELVIPEGTQTGKKFRLRSKGAPSLRGGAVGDQYVT
VNVVTPTGLNDRQKVALKEFAAAGDLKVNPKKKGFFDHIKDAFDGE
 
SeqID 173
MNPNLFRSVEFYQRRYHNYATVLIIPLSLLFTFILIFSLVATKEITVTSQGEIAPTSVIASIQSTSDNPILANHLVANQVVEK
GDLLIKYSETMEESQKTALATQLQRLEKQKEGLGILKQSLEKATDLFSGEDEFGYHNTFMNFTKQSHDIELGITKTNTEVSNQ
ANLSNSSSSAIEQEITKVQQQIGEYQELRDAIINNRARLPTGNPHQSILNRYLVASQGQTQGTAEEPFLSQINQSIAGLESSI
ASLKIQQAGIGSVATYDNSLATKIEVLRTQFLQTASQQQLTVENQLTELKVQLDQATQRLENNTLTSPSKGIVHLNSEFEGKN
RIPTGTEIAQIFPVITDTREVLITYYVSSDYLPLLDKGQTVRLKLEKIGNHGTTIIGQLQTIDQTPTRTEQGNLFKLTALAKL
SNEDSKLIQYGLQGRVTSVTTKKTYFDYFKDKILTHSD
 
SeqID 174
MSKKLNRKKQLRNGLRRAGAFSSTVTKVVDETKKVVKRAEQSASAAGKAVSKKVEQAVEATKEQAQKVANSVEDFAANLGGLP
LDRAKTFYDEGIKSASDFKNWTEKELLALKGIGPATIKKLKENGIKFK
 
SeqID 175
LISLFGLAAAKPVQADTSIADIQKRGELVVGVKQDVPNFGYKDPKTGTYSGIETDLAKMVADELKVKIRYVPVTAQTRGPLLD
NEQVDMDIATFTITDERKKLYNFTSPYYTDASGFLVNKSAKIKKIEDLNGKTIGVAQGSITQRLITELGKKKGLKFKFVELGS
YPELITSLHAHRIDTFSVDRSILSGYTSKRTALLDDSFKPSDYGIVTKKSNTELNDYLDNLVTKWSKDGSLQKLYDRYKLKPS
SHTAD
 
SeqID 176
MSNISLTTLGGVRENGKNMYIAEIGESIFVLNVGLKYPENEQLGVDVVIPNMDYLFENSDRIAGVFLTHGHADAIGALPYLLA
EAKVPVFGSELTIELAKLFVKGNDAVKKFNDFHVIDENTEIDFGGTVVSFFPTTYSVPESLGIVLKTSEGSIVYTGDFKFDQT
ASESYATDFARLAEIGRDGVLALLSDSANADSNIQVASESEVRDEITQTIADWEGRIIVAAVSSNLSRIQQIFDAADKTGRRI
VLTGFDIENIVRTAIRLKKLSLANEILLIKPKDMSRFEDHELIILETGRMGEPINGLRKMSIGRHRYVEIKDGDLVYIATAPS
IAKEAFVARVENMIYQAGGVVKLITQSLHVSGHGNVRDLQLMINLLQPKYLFPVQGEYRELDAHAKAAMAVGMLPERIFIPKK
GTTMAYENGDFVPAGSVSAGDILIDGNAIGDVGNVVLRDRKVLSEDGIFIVAITVNRREKKIVARARVHTRGFVYLKKSRDIL
RESSELINQTVEEYLQGDDFDWADLKGKVRDNLTKYLFDQTKRRPAILPVVMEAK
 
SeqID 177
MKKSTVLSLTTAAVILAAYAPNEVVLADTSSSEDALNISDKEKVAENKEKHENIHSAMETSQDFKEKKTAVIKEKEVVSKNPV
IDNNTSNEEAKIKEENSNKSQGDYTDSFVNKNTENPKKEDKVVYIAEFKDKESGEKAIKELSSLKNTKVLYTYDRIFNGSAIE
TTPDNLDKIKQIEGISSVERAQKVQPMMNHARKEIGVEEAIDYLKSINAPFGKNFDGRGMVISNIDTGTDYRHKAMRIDDDAK
ASMRFKKEDLKGTDKNYWLSDKIPHAFNYYNGGKITVEKYDDGRDYFDPHGMHIAGILAGNDTEQDIKNFNGIDGIAPNAQIF
SYKMYSDAGSGFAGDETMFHAIEDSIKHNVDVVSVSSGFTGTGLVGEKYWQAIRALRKAGIPMVVATGNYATSASSSSWDLVA
NNHLKMTDTGNVTRTAAHEDAIAVASAKNQTVEFDKVNIGGESFKYRNIGAFFDKSKITTNEDGTKAPSKLKFVYIGKGQDQD
LIGLDLRGKIAVMDRIYTKDLKNAFKKAMDKGARAIMVVNTVNYYNRDNWTELPAMGYEADEGTKSQVFSISGDDGVKLWNMI
NPDKKTEVKRNNKEDFKDKLEQYYPIDMESFNSNKPNVGDEKEIDFKFAPDTDKELYKEDIIVPAGSTSWGPRIDLLLKPDVS
APGKNIKSTLNVINGKSTYGYMSGTSMATPIVAASTVLIRPKLKEMLERPVLKNLKGDDKIDLTSLTKIALQNTARPMMDATS
WKEKSQYFASPRQQGAGLINVANALRNEVVATFKNTDSKGLVNSYGSISLKEIKGDKKYFTIKLHNTSNRPLTFKVSASAITT
DSLTDRLKLDETYKDEKSPDGKQIVPEIHPEKVKGANITFEHDTFTIGANSSFDLNAVINVGEAKNKNKFVESFIHFESVEEM
EALNSNGKKINFQPSLSMPLMGFAGNWNHEPILDKWAWEEGSRSKTLGGYDDDGKPKIPGTLNKGIGGEHGIDKFNPAGVIQN
RKDKNTTSLDQNPELFAFNNEGINAPSSSGSKIANIYPLDSNGNPQDAQLERGLTPSPLVLRSAEEGLISIVNTNKEGENQRD
LKVISREHFIRGILNSKSNDAKGIKSSKLKVWGDLKWDGLIYNPRGREENAPESKDNQDPATKIRGQFEPIAEGQYFYKFKYR
LTKDYPWQVSYIPVKIDNTAPKIVSVDFSNPEKIKLITKDTYHKVKDQYKNETLFARDQKEHPEKFDEIANEVWYAGAALVNE
DGEVEKNLEVTYAGEGQGRNRKLDKDGNTIYEIKGAGDLRGKIIEVIALDGSSNFTKIHRIKFANQADEKGMISYYLVDPDQD
SSKYQKLGEIAESKFKNLGNGKEGSLKKDTTGVEHHHQENEESIKEKSSFTIDRNISTIRDFENKDLKKLIKKKFREVDDFTS
ETGKRMEEYDYKYDDKGNIIAYDDGTDLEYETEKLDEIKSKIYGVLSPSKDGHFEILGKISNVSKNAKVYYGNNYKSIEIKAT
KYDFHSKTMTFDLYANINDIVDGLAFAGDMRLFVKDNDQKKAEIKIRMPEKIKETKSEYPYVSSYGNVIELGEGDLSKNKPDN
LTKMESGKIYSDSEKQQYLLKDNIILRKGYALKVTTYNPGKTDMLEGNGVYSKEDIAKIQKANPNLRALSETTIYADSRNVED
GRSTQSVLMSALDGFNIIRYQVFTFKMNDKGEAIDKDGNLVTDSSKLVLFGKDDKEYTGEDKFNVEAIKEDGSMLFIDTKPVN
LSMDKNYFNPSKSNKIYVRNPEFYLRGKISDKGGFNWELRVNESVVDNYLIYGDLHIDNTRDFNIKLNVKDGDIMDWGMKDYK
ANGFPDKVTDMDGNVYLQTGYSDLNAKAVGVHYQFLYDNVKPEVNIDPKGNTSIEYADGKSVVFNINDKRNNGFDGEIQEQHI
YINGKEYTSFNDIKQIIDKTLNIKIVVKDFARNTTVKEFILNKDTGEVSELKPHRVTVTIQNGKEMSSTIVSEEDFILPVYKG
ELEKGYQFDGWEISGFEGKKDAGYVINLSKDTFIKPVFKKIEEKKEEENKPTFDVSKKKDNPQVNHSQLNESHRKEDLQREEH
SQKSDSTKDVTATVLDKNNISSKSTTNNPNKLPKTGTASGAQTLLAAGIMFIVGIFLGLKKKNQD
 
SeqID 178
MGKGHWNRKRVYSIRKFAVGACSVMIGTCAVLLGGNIAGESVVYADETLITHTAEKPKEEKMIVEEKADKALETKNIVERTEQ
SEPSSTEAIASEKKEDEAVTPKEEKVSAKPEEKAPRIESQASNQEKPLKEDAKAVTNEEVNQMIEDRKVDFNQNWYFKLNANS
KEAIKPDADVSTWKKLDLPYDWSIFNDFDHESPAQNEGGQLNGGEAWYRKTFKLDEKDLKKNVRLTFDGVYMDSQVYVNGQLV
GHYPNGYNQFSYDITKYLQKDGRENVIAVHAVNKQPSSRWYSGSGIYRDVTLQVTDKVHVEKNGTTILTPKLEEQQHGKVETH
VTSKIVNTDDKDHELVAEYQIVERGGHAVTGLVRTASRTLKAHESTSLDAILEVERPKLWTVLNDKPALYELITRVYRDGQLV
DAKKDLFGYRYYHWTPNEGFSLNGERIKFHGVSLHHDHGALGAEENYKAEYRRLKQMKEMGVNSIRTTHNPASEQTLQIAAEI
GLLVQEEAFDTWYGGKKPYDYGRFFEKDATHPEARKGEKWSDFDLRTMVERGKNNPAIFMWSIGNEIGEANGDAHSLATVKRI
VKVIKDVDKTRYVTMGADKFRFGNGSGGHEKIADELDAVGFNYSEDNYKALRAKHPKWLIYGSETSSATRTRGSYYRPERELR
HSNGPERNYEQSDYGNDRVGWGKTATASWTFDRDNAGYAGQFIWTGTDYIGEPTPWHNQNQTPVKSSYFGIVDTAGIPKHDFY
LYQSQWVSVKKKPMVHLLPHWNWENKELASKVADSEGKIPVRAYSNASSVELFLNGKSLGLKTFNKKQTSDGRTYQESANANE
LYLEWKVAYQPGTLEAIARDESGKEIARDKITTAGKPAAVRLIKEDHAIAADGKDLTYIYYEIVDSQGNVVPTANNLVRFQLE
GQGQLVGVDNGEQASRERYKAQADGSWIRKAFNGKGVAIVKSTEQAGKFTLTAHSDLLKSNQVTVFTGKKEGQEKTVLGTEVP
KVQTIIGEAPEMPTTVPFVYSDGSRAERPVTWSSVDVSKPGIVTVKGMADGREVEARVEVIALKSELPVVKRIAPNTDLNSVI
KSVSYVLIDGSVEEYEVDKWEIAEEDKAKLAIPGSRIQATGYLEGQPIHATLVVEEGNPAAPAVPTVTVGGEAVTGLTSQKPM
QYRTLAYGAKLPEVTASAKNAAVTVLQASAANGMRASIFIQPKDGGPLQTYAIQFLEEAPKIAHLSLQVEKADSLKEDQTVKI
SVRAHYQDGTQAVLPADKVTFSTSGEGEVAIRKGMLELHKPGAVTLNAEYEGAKDQVELTIQANTEKKIAQSIRPVNVVTDLH
QEPSLPATVTVEYDKGFPKTHKVTWQAIPKEKLDSYQTFEVLGKVEGIDLEARAKVSVEGIVSVEEVSVTTPIAEAPQLPESV
RTYDSNGHVSSAKVAWDAIRPEQYAKEGVFTVNGRLEGTQLTTKLHVRVSAQTEQGANISDQWTGSELPLAFASDSNPSDPVS
NVNDKLISYNNQPANRWTNWNRTNPEASVGVLFGDSGILSKRSVDNLSVGFHEDHGVGVPKSYVIEYYVGKTVPTAPKNPSFV
GNEDHVFNDSANWKPVTNLKAPAQLKAGEMNHFSFDKVETYAVRIRMVKADNKRGTSITEVQIFAKQVAAAKQGQTRIQVDGF
DLANFNPDLTDYYLESVDGKVPAVTASVSNNGLATVVPSVREGEPVRVIAKAENGDILGEYRLHFTKDKSLLSHKPVAAVKQA
RLLQVGQALELPTKVPVYFTGKDGYETKDLTVEWEEVPAENLTKAGQFTVRGRVLGSNLVAEITVRVTDKLGETLSDNPNYD■
NSNQAFASATNDIDKNSHDRVDYLNDGDHSENRRWTNWSPTPSSNPEVSAGVIFRENGKIVERTVTQGKVQFFADSGTDAPS■
LVLERYVGPEFEVPTYYSNYQAYDADHPFNNPENWEAVPYRADKDIAAGDEINVTFKAIKAKAMRWRMERKADKSGVAMIEMT
FLAPSELPQESTQSKILVDGKELADFAENRQDYQITYKGQRPKVSVEENNQVASTVVDSGEDSFPVLVRLVSESGKQVKEYR■
HLTKEKPVSEKTVAAVQEDLPKIEFVEKDLAYKTVEKKDSTLYLGETRVEQEGKVGKERIFTAINPDGSKEEKLREVVEVPT■
RIVLVGTKPVAQEAKKPQVSEKADTKPIDSSEASQTNKAQLPSTGSAASQAAVAAGLTLLGLSAGLVVTKGKKED
 
SeqID 179
MAPSVVDAATYHYVNKEIISQEAKDLIQTGKPDRNEVVYGLVYQKDQLPQTGTEASVLTAFGLLTVGSLLLIYKRKKIASVF■
VGAMGLVVLPSAGAVDPVATLALASREGVVEMEGYRYVGYLSGDILKTLGLDTVLEETSAKPGEVTVVEVETPQSITNQEQA■
TENQVVETEEAPKEEAPKTEESPKEEPKSEVKPTDDTLPKVEEGKEDSAEPAPVEEVGGEVESKPEEKVAVKPESQPSDKPA■
ESKVEQAGEPVAPREDEKAPVEPEKQPEAPEEEKAVEETPKQEESTPDTKAEETVEPKEETVNQSIEQPKVETPAVEKQTEPT
EEPKVEQAGEPVAPREDEQAPTAPVEPEKQPEVPEEEKAVEETPKPEDKIKGIGTKEPVDKSELNNQIDKASSVSPTDYSTAS
YNALGPVLETAKGVYASEPVKQPEVNSETNKLKTAIDALNVDKTELNNTIADAKTKVKEHYSDRSWQNLQTEVTKAEKVAANT
DAKQSEVNEAVEKLTATIEKLVELSEKPILTLTSTDKKILEREAVAKYTLENQNKTKIKSITAELKKGEEVINTVVLTDDKVT
TETISAAFKNLEYYKEYTLSTTMIYDRGNGEETETLENQNIQLDLKKVELKNIKRTDLIKYENGKETNESLITTIPDDKSNYY
LKITSNNQKTTLLAVKNIEETTVNGTPVYKVTAIADNLVSRTADNKFEEEYVHYIEKPKVHEDNVYYNFKELVEAIQNDPSK■
YRLGQSMSARNVVPNGKSYITKEFTGKLLSSEGKQFAITELEHPLFNVITNATINNVNFENVEIERSGQDNIASLANTMKGSS
VITNVKITGTLSGRNNVAGFVNNMNDGTRIENVAFFGKLHSTSGNGSHTGGIAGTNYRGIVRKAYVDATITGNKTRASLLVP■
VDYGLTLDHLIGTKALLTESVVKGKIDVSNPVEVGAIASKTWPVGTVSNSVSYAKIIRGEELFGSNDVDDSDYASAHIKDLYA
VEGYSSGNRSFRKSKTFTKLTKEQADAKVTTFNITADKLESDLSPLAKLNEEKAYSSIQDYNAEYNQAYKNLEKLIPFYNKDY
IVYQGNKLNKEHHLNTKEVLSVTAMNNNEFITNLDEANKIIVHYADGTKDYFNLSSSSEGLSNVKEYTITDLGIKYTPNIVQ■
DNTTLVNDIKSILESVELQSQTMYQHLNRLGDYRVNAIKDLYLEESFTDVKENLTNLITKLVQNEEHQLNDSPAARQMIRDKV
EKNKAALLLGLTYLNRYYGVKFGDVNIKELMLFKPDFYGEKVSVLDRLIEIGSKENNIKGSRTFDAFGQVLAKYTKSGNLDA■
LNYNRQLFTNIDNMNDWFIDATEDHVYIAERASEVEEIKNSKHRAFDNLKRSHLRNTILPLLNIDKAHLYLISNYNAIAFGSA
ERLGKKSLEDIKDIVNKAADGYRNYYDFWYRLASDNVKQRLLRDAVIPIWEGYNAPGGWVEKYGRYNTDKVYTPLREFFGPM■
KYYNYNGTGAYAAIYPNSDDIRTDVKYVHLEMVGEYGISVYTHETTHVNDRAIYLGGFGHREGTDAEAYAQGMLQTPVTGSG■
DEFGSLGINMVFKRKNDGNQWYITDPKTLKTREDINRYMKGYNDTLTLLDEIEAESVISQQNKDLNSAWFKKIDREYRDNNK■
NQWDKIRNLSQEEKNELNIQSVNDLVDQQLMTNRNPGNGIYKPEAISYNDQSPYVGVRMMTGIYGGNTSKGAPGAVSFKHNA■
RLWGYYGYENGFLGYASNKYKQQSKTDGESVLSDEYIIKKISNNTFNTIEEFKKAYFKEVKDKATKGLTTFEVNGSSVSSYDI
LLTLFKEAVKKDAETLKQEANGNKTVSMNNTVKLKEAVYKKLLQQTNSFKTSIFK
 
SeqID 180
MNKRLFSKMSLVTLPILALFSQSVLAEENIHFSSCKEAWANGYSDIHEGEPGYSAKLDRDHDGVACELKNAPKGAFKAKQSTA
IQINTSSATTSGWVKQDGAWYYFDGNGNLVKNAWQGSYYLKADGKMAQSEWIYDSSYQAWYYLKSDGSYAKNAWQGAYYLKSN
GKMAQGEWVYDSSYQAWYYLKSDGSYARNAWQGNYYLKSDGKMAKGEWVYDATYQAWYYLTSDGSYAYSTWQGNYYLKSDGKM
AVNEWVDGGRYYVGADGVWKEVQASTASSSNDSNSEYSAALGKAKSYNSLFHMSKKRMYRQLTSDFDKFSNDAAQYAIDHLDD
 
SeqID 181
MKVIDQFKNKKVLVLGLAKSGESAARLLDKLGAIVTVNDGKPFEDNPAAQSLLEEGIKVITGGHPLELLDEEFALMVKNPGIP
YNNPMIEKALAKGIPVLTEVELAYLISEAPIIGITGSNGKTTTTTMIGEVLTAAGQHGLLSGNIGYPASQVAQIASDKDTLVM
ELSSFQLMGVQEFHPEIAVITNLMPTHIDYHGSFSEYVAAKWNIQNKMTAADFLVLNFNQDLAKDLTSKTEATVVPFSTLEKV
DGAYLEDGQLYFRGEVVMAANEIGVPGSHNVENALATIAVAKLRDVDNQTIKETLSAFGGVKHRLQFVDDIKGVKFYNDSKST
NILATQKALSGFDNSKVVLIAGGLDRGNEFDELVPDITGLKKMVILGQSAERVKRAADKAGVAYVEATDIADATRKAYELATQ
GDVVLLSPANASWDMYANFEVRGDLFIDTVAELKE
 
SeqID 182
MKKKFALSFVALASVALLAACGEVKSGAVNTAGNSVEEKTIKIGFNFEESGSLAAYGTAEQKGAQLAVDEINAAGGIDGKQIE
VVDKDNKSETAEAASVTTNLVTQSKVSAVVGPATSGATAAAVANATKAGVPLISPSATQDGLTKGQDYLFIGTFQDSFQGKII
SNYVSEKLNAKKVVLYTDNASDYAKGIAKSFRESYKGEIVADETFVAGDTDFQAALTKMKGKDFDAIVVPGYYNEAGKIVNQA
RGMGIDKPIVGGDGFNGEEFVQQATAEKASNIYFISGFSTTVEVSAKAKAFLDAYRAKYNEEPSTFAALAYDSVHLVANAAKG
AKNSGEIKNNLAKTKDFEGVTGQTSFDADHNTVKTAYMMTMNNGKVEAAEVVKP
 
SeqID 183
MSILEVKNLSHGFGDRAIFEDVSFRLLKGEHIGLVGANGEGKSTFMSIVTGKMLPDEGKVEWSKYVTAGYLDQHSVLAERQSV
RDVLRTAFDELFKAEARINDLYMKMAEDGADVDALMEEVGELQDRLESRDFYTLDAKIDEVARALGVMDFGMDTDVTSLSGGQ
RTKVLLAKLLLEKPDILLLDEPTNYLDAEHIDWLKRYLQNYENAFVLISHDIPFLNDVINIVYHVENQQLTRYSGDYYQFQEV
YAMKKSQLEAAYERQQKEIADLKDFVARNKARVATRNMAMSRQKKLDKMDIIELQSEKPKPSFDFKPARTPGRFIFQAKNLQI
GYDRPLTKPLNLTFERNQKVAIIGANGIGKTTLLKSLLGIISPIAGEVERGDYLELGYFEQEVEGGNRQTPLEAVWNAFPALN
QAEVRAALARCGLTTKHIESQIQVLSGGEQAKVRFCLLMNRENNVLVLDEPTNHLDVDAKDELKRALKEYRGSILMVCHEPD■
YEGWIDQIWDFNNLT
 
SeqID 184
MKKKNGKAKKWQLYAAIGAASVVVLGAGGILLFRQPSQTALKDEPTHLVVAKEGSVASSVLLSGTVTAKNEQYVYFDASKGD■
DEILVSVGDKVSEGQALVKYSSSEAQAAYDSASRAVARADRHINELNQARNEAASAPAPQLPAPVGGEDATVQSPTPVAGNSV
ASIDAQLGDARDARADAAAQLSKAQSQLDATTVLSTLEGTVVEVNSNVSKSPTGASQVMVHIVSNENLQVKGELSEYNLANLS
VGQEVSFTSKVYPDKKWTGKLSYISDYPKNNGEAASPAAGNNTGSKYPYTIDVTGEVGDLKQGFSVNIEVKSKTKAILVPVSS
LVMDDSKNYVWIVDEQQKAKKVEVSLGNADAENQEITSGLTNGAKVISNPTSSLEEGKEVKADEATN
 
SeqID 185
SETNHEIDSNFAGRLNILRAGVLDANDGIISIAGVVIGVASATTNIWIIFLSGFTAILAGAFSMAGGEYVSVSTPKDTEEAAV
SREKLLLDQDRELAKKSLYAAYIQNGEFKTSAQLLTNKIFLKNPLKALVEEKYGIEYEEFTNPWHAAISSFVAFFLRSLPPM■
SVTIFPSDYRIPATVLIVGVALLLTGYTSARLGKAPTKTAMIRNLAIGLLTMGVTFLLGQLFSI
 
SeqID 186
MKKKLTSLALVGAFLGLSWYGNVQAQESSGNKIHFINVQEGGSDAIILESNGHFAMVDTGEDYDFPDGSDSRYPWREGIETSY
KHVLTDRVFRRLKELGVQKLDFILVTHTHSDHIGNVDELLSTYPVDRVYLKKYSDSRITNSERLWDNLYGYDKVLQTAAEKGV
SVIQNITQGDAHFQFGDMDIQLYNYENETDSSGELKKIWDDNSNSLISVVKVNGKKIYLGGDLDNVHGAEDKYGPLIGKVDLM
KFNHHHDTNKSNTKDFIKNLSPSLIVQTSDSLPWKNGVDSEYVNWLKERGIERINAASKDYDATVFDIRKDGFVNISTSYKP■
PSFQAGWHKSAYGNWWYQAPDSTGEYAVGWNEIEGEWYYFNQTGILLQNQWKKWNNHWFYLTDSGASAKNWKKIAGIWYYFNF
ENQMEIGWIQDKEQWYYLDVDGSMKTGWLQYMGQWYYFAPSGEMKMGWVKDKETWYYMDSTGVMKTGEIEVAGQHYYLEDSGA
MKQGWHKKANDWYFYKTDGSRAVGWIKDKDKWYFLKENGQLLVNGKTPEGYTVDSSGAWLVDVSIEKSATIKTTSHSEIKES■
EVVKKDLENKETSQHESVTNFSTSQDLTSSTSQSSETSVNKSESEQ
 
SeqID 187
MDLGPTQRGISVVSQSYINVIGAGLAGSEAAYQIAERGIPVKLYEMRGVKSTPQHKTDNFAELVCSNSLRGDALTNAVGLLK■
EMRRLGSVILESAEATRVPAGGALAVDRDGFSQMVTEKVANHPLIEVVRDEITELPTDVITVIATGPLTSDALAEKIHALNDG
AGFYFYDAAAPIIDVNTIDMSKVYLKSRYDKGEAAYLNAPMTKQEFMDFHEALVNAEEAPLSSFEKEKYFEGCMPIEVMAKRG
IKTMLYGPMKPVGLEYPDDYTGPRDGEFKTPYAVVQLRQDNAAGSLYNIVGFQTHLKWGEQKRVFQMIPGLENAEFVRYGVM■
RNSYMDSPNLLEQTYRSKKQPNLFFAGQMTGVEGYVESAASGLVAGINAARLFKEESEAIFPETTAIGSLAHYITHADSKHFQ
PMNVNFGIIKELEGERIRDKKARYEKIAERALADLEEFLTV
 
SeqID 188
MLIGIPKEIKNNENRVALTPAGVHSLVSRGHRVLIETNAGLGSGFTDADYQKQGAEIVATAGEAWAAELVVKVKESLSSEYGY
LRDDLLLFTYLHMAAAPELADAMLTAKTTETVRDNQGQLPLLVPMSEVAGRMAVQIGAHFLTKQAGGSGVLLGGVPGVPKGKV
TIIGGGVVGTHAARIALGLGAQVTILDISSKRLSVLEEVFGSQIQTLMSNSFNIEASVRDADVVIGAILIPGAKAPELVTDEM
VKQMRPGSVSLTLLLTKVALSKQLTVQRTMNPSMKNTVFSTMPLPISLVRLLALQPSPPMSLFLISKLWLAKDSHKQSLKMKA
CVKVLLIKVTLTYQLLKDLIVTTLISMI
 
SeqID 189
MKINKKYLAGSVAVLALSVCSYELGRHQAGQVKKESNRVSYIDGDQAGQKAENLTPDEVSKREGINAEQIVIKITDQGYVTSH
GDHYHYYNGKVPYDAIISEELLMKDPNYQLKDSDIVNEIKGGYVIKVDGKYYVYLKDAAHADNIRTKEEIKRQKQEHSHNHGG
GSNDQAVVAARAQGRYTTDDGYIFNASDIIEDTGDAYIVPHGDHYHYIPKNELSASELAAAEAYWNGKQGSRPSSSSSYNANP
AQPRLSENHNLTVTPTYHQNQGENISSLLRELYAKPLSERHVESDGLIFDPAQITSRTARGVAVPHGNHYHFIPYEQMSELEK
RIARIIPLRYRSNHWVPDSRPEQPSPQSTPEPSPSPQPAPNPQPAPSNPIDEKLVKEAVRKVGDGYVFEENGVSRYIPAKDLS
AETAAGIDSKLAKQESLSHKLGAKKTDLPSSDREFYNKAYDLLARIHQDLLDNKGRQVDFEALDNLLERLKDVPSDKVKLVDD
ILAFLAPIRHPERLGKPNAQITYTDDEIQVAKLAGKYTTEDGYIFDPRDITSDEGDAYVTPHMTHSHWIKKDSLSEAERAAAQ
AYAKEKGLTPPSTDHQDSGNTEAKGAEAIYNRVKAAKKVPLDRMPYNLQYTVEVKNGSLIIPHYDHYHNIKFEWFDEGLYEAP
KGYTLEDLLATVKYYVEHPNERPHSDNGFGNASDHVRKNKVDQDSKPDEDKEHDEVSEPTHPESDEKENHAGLNPSADNLYKP
STDTEETEEEAEDTTDEAEIPQVENSVINAKIADAEALLEKVTDPSIRQNAMETLTGLKSSLLLGTKDNNTISAEVDSLLALL
KESQPAPIQ
 
SeqID 190
MKFSKKYIAAGSAVIVSLSLCAYALNQHRSQENKDNNRVSYVDGSQSSQKSENLTPDQVSQKEGIQAEQIVIKITDQGYVTSH
GDHYHYYNGKVPYDALFSEELLMKDPNYQLKDADIVNEVKGGYIIKVDGKYYVYLKDAAHADNVRTKDEINRQKQEHVKDNEK
VNSNVAVARSQGRYTTNDGYVFNPADIIEDTGNAYIVPHGGHYHYIPKSDLSASELAAAKAHLAGKNMQPSQLSYSSTASDNN
TQSVAKGSTSKPANKSENLQSLLKELYDSPSAQRYSESDGLVFDPAKIISRTPNGVAIPHGDHYHFIPYSKLSALEEKIARMV
PISGTGSTVSTNAKPNEVVSSLGSLSSNPSSLTTSKELSSASDGYIFNPKDIVEETATAYIVRHGDHFHYIPKSNQIGQPTL■
NNSLATPSPSLPINPGTSHEKHEEDGYGFDANRIIAEDESGFVMSHGDHNHYFFKKDLTEEQIKAAQKHLEEVKTSHNGLDSL
SSHEQDYPSNAKEMKDLDKKIEEKIAGIMKQYGVKRESIVVNKEKNAIIYPHGDHHHADPIDEHKPVGIGHSHSNYELFKPEE
GVAKKEGNKVYTGEELTNVVNLLKNSTFNNQNFTLANGQKRVSFSFPPELEKKLGINMLVKLITPDGKVLEKVSGKVFGEGVG
NIANFELDQPYLPGQTFKYTIASKDYPEVSYDGTFTVPTSLAYKMASQTIFYPFHAGDTYLRVNPQFAVPKGTDALVRVFDEF
HGNAYLENNYKVGEIKLPIPKLNQGTTRTAGNKIPVTFMANAYLDNQSTYIVEVPILEKENQTDKPSILPQFKRNKAQENLK■
DEKVEEPKTSEKVEKEKLSETGNSTSNSTLEEVPTVDPVQEKVAKFAESYGMKLENVLFNMDGTIELYLPSGEVIKKNMADFT
GEAPQGNGENKPSENGKVSTGTVENQPTENKPADSLPEAPNEKPVKPENSTDNGMLNPEGNVGSDPMLDPALEEAPAVDPVQE
KLEKFTASYGLGLDSVIFNMDGTIELRLPSGEVIKKNLSDLIA
 
SeqID 191
MKILFVAAEGAPFSKTGGLGDVIGALPKSLVKAGHEVAVILPYYDMVEAKFGNQIEDVLHFEVSVGWRRQYCGIKKTVLNGVT
FYFIDNQYYFFRGHVYGDFDDGERFAFFQLAAIEAMERIDFIPDLLHVHDYHTAMIPFLLKEKYRWIQAYEDIETVLTIHNLE
FQGQFSEGMLGDLFGVGFERYADGTLRWNNCLNWMKAGILYANRVSTVSPSYAHEIMTSQFGCNLDQILKMESGKVSGIVNGI
DADLYNPQTDALLDYHFNQEDLSGKAKNKAKLQERVGLPVRADVPLVGIVSRLTRQKGFDVVVESLHHILQEDVQIVLLGTG■
PAFEGAFSWFAQIYPDKLSTNITFDVKLAQEIYAACDLFLMPSRFEPCGLSQMMAMRYGTLPLVHEVGGLRDTVRAFNPIEGS
GTGFSFDNLSPYWLNWTFQTALDLYRNHPDIWRNLQKQAMESDFSWDTACKSYLDLYHSLVN
 
SeqID 192
MEKYFGEKQERFSFRKLSVGLVSATISSLFFMSVLASSSVDAQETAGVHYKYVADSELSSEEKKQLVYDIPTYVENDDETYYI
VYKLNSQNQLAELPNTGSKNERQALVAGASLAAMGILIFAVSKKKVKNKTVLHLVLVAGIGNGVLVSVHALENHLLLNYNTDY
ELTSGEKLPLPKEISGYTYIGYIKEGKTTSESEVSNQKSSVATPTKQQKVDYNVTPNFVDHPSTVQAIQEQTPVSSTKPTEVQ
VVEKPFSTELINPRKEEKQSSDSQEQLAEHKNLETKKEEKISPKEKTGVNTLNPQDEVLSGQLNKPELLYREETMETKIDFQE
EIQENPDLAEGTVRVKQEGKLGKKVEIVRIFSVNKEEVSREIVSTSTTAPSPRIVEKGTKKTQVIKEQPETGVEHKDVQSGAI
VEPAIQPELPEAVVSDKGEPEVQPTLPEAVVTDKGETEVQPESPDTVVSDKGEPEQVAPLPEYKGNIEQVKPETPVEKTKEQG
PEKTEEVPVKPTEETPVNPNEGTTEGTSIQEAENPVQPAEESTTNSEKVSPDTSSKNTGEVSSNPSDSTTSVGESNKPEHNDS
KNENSEKTVEEVPVNPNEGTVEGTSNQETEKPVQPAEETQTNSGKIANENTGEVSNKPSDSKPPVEESNQPEKNGTATKPENS
GNTTSENGQTEPEPSNGNSTEDVSTESNTSNSNGNEEIKQENELDPDKKVEEPEKTLELRNVSDLELYSLSNGTYKQHISLEQ
VPSNPNSYFVKVKSSSFKDVYLPVASISEERKNDKILYKITAKVEKLQQEIESRYKDNFTFYLAKKGTEETTNFTSFSNLVKA
INQNPSGTYHLAASLNANEVELGPDERSYIKDTFTGRLIGEKDGKNYAIYNLKKPLFENLSGATVEKLSLKNVAISGKDDIGS
LANEAQNNTKIKQVHVDGVLAGERGIGGLLAKAEQSSITESSFKGRIINTYETTAAYNIGGMVGHLTGDKALLTKSKATVAIS
SNTNTSDQTVGGLAGLVDRDAQIQDSYAEGDINNVKHFGRVAGVAGNLWDRTSGDVRHAGSLTNVLSDVNVTNGNAITGYHYN
EMKVKDTFSSKANRVYNVTLVKDEVVSKESFEERGTMLDASQIASKKAEINPLILPTVEPLSTSGKKDSDFSKVAYYQAKRN■
TYKNIEKLLPFYNKATIVKYGNLVNENSLLYQKELLSAVMMKDNQVITDIVSNKQTANKLLLHYKDDLSEKLDLKYQNDFAK■
AEYSLGNTGLLYTPNQFLYDQTSIIKQVLPDLQKVDYHSEAIRKTLGISPNVKQTELYLEDQFAKTKQQLEDSLKKLLSADAG
LASANPVTEGYLVDKIKRNKEALLLGLTYLERWYNFSYGQVNVKDLVLYHLDFFGKGNASPLDTLIELGKSGFNNLLAKNNV■
TYGISLASQHGTTDLFSTLEHYRKVFLPNTSNNDWFKSETKAYIVEEKSTIEEVKTKQGLAGTKYSIGVYDRITSATWKYRNM
VLPLLTLPERSVFVISTMSSLGFGAYDRYRSSDHKAGKALNDFVEENARETAKRQRDHYDYWYRILDDNAREKLYRNILLYDA
YKFGDDNTVGKATEVADFDNPNPAMQHFFGPVGNKVGHNQHGAYATGDAVYYMGYRMLDKDGAITYTHEMTHDSDQDIYLGGY
GRRSGLGPEFFAKGLLQAPDHPDDATITINSILKHSKSDSTESRRLQVLDPTTRFNNADDLKQYVHNMFDVVYMLEYLEGNSI
LKLDTNQKQQLLRKVTNEYHPDPDGNKVYATNVVRNLTVEEVERLRSFNDLIDNNILSSREYASGKYERNGYFTIKLFAPIYA
ALSNDIGTPGDLMGRRIAYELLAAKGFKDGMVPYISNQYEEEAKQKGKTINLYGKTRGLVTDDLVLEKVFNNQYHTWSEFKKA
MYQERQDQFDRLNKVTFNDTTQPWQTFAKKTTSSVDELQKLMDVAVRKDAEHNYYHWNNYNPDIDSEVHKLKRAIFKAYLDQT
NDFRSSIFENKK
 
SeqID 193
MKINKKYLAGSVAVLALSVCSYELGRYQAGQDKKESNRVAYIDGDQAGQKAENLTPDEVSKREGINAEQIVIKITDQGYVTSH
GDHYHYYNGKVPYDAIISEELLMKDPNYQLKDSDIVNEIKGGYVIKVNGKYYVYLKDAAHADNIRTKEEIKRQKQERSHNHNS
RADNAVAAARAQGRYTTDDGYIFNASDIIEDTGDAYIVPHGDHYHYIPKNELSASELAAAEAYWNGKQGSRPSSSSSYNANPA
QPRLSENHNLTVTPTYHQNQGENISSLLRELYAKPLSERHVESDGLIFDPAQITSRTARGVAVPHGNHYHFIPYEQMSELEKR
IARIIPLRYRSNHWVPDSRPEEPSPQPTPEPSPSPQPAPSNPIDEKLVKEAVRKVGDGYVFEENGVSRYIPAKDLSAETAAGI
DSKLAKQESLSHKLGTKKTDLPSSDREFYNKAYDLLARIHQDLLDNKGRQVDFEALDNLLERLKDVSSDKVKLVEDILAFLAP
IRHPERLGKPNAQITYTDDEIQVAKLAGKYTTEDGYIFDPRDITSDEGDAYVTPHMTHSHWIKKDSLSEAERAAAQAYAKEKG
LTPPSTDHQDSGNTEAKGAEAIYNRVKAAKKVPLDRMPYNLQYTVEVKNGSLIIPHYDHYHNIKFEWFDEGLYEAPKGYTLED
LLATVKYYVEHPNERPHSDNGFGNASDHVQRNKNGQADTNQTEKPSEEKPQTEKPEEETPREEKPQSEKPESPKPTEEPEESP
EESEEPQVETEKVEEKLREAEDLLGKIQDPIIKSNAKETLTGLKNNLLFGTQDNNTIMAEAEKLLALLKESK
 
SeqID 194
LILSVCSYELGLYQARTVKENNRVSYIDGKQATQKTENLTPDEVSKREGINAEQIVIKITDQGYVTSHGDHYHYYNGKVPYDA
IISEELLMKDPNYKLKDEDIVNEVKGGYVIKVDGKYYVYLKDAAHADNVRTKEEINRQKQEHSQHREGGTPRNDGAVALARSQ
GRYTTDDGYIFNASDIIEDTGDAYIVPHGDHYHYIPKNELSASELAAAEAFLSGRGNLSNSRTYRRQNSDNTSRTNWVPSVSN
PGTTNTNTSNNSNTNSQASQSNDIDSLLKQLYKLPLSQRHVESDGLVFDPAQITSRTARGVAVPHGDHYHFIPYSQMSELEER
IARIIPLRYRSNHWVPDSRPEQPSPQPTPEPSPGPQPAPNLKIDSNSSLVSQLVRKVGEGYVFEEKGISRYVFAKDLPSETVK
NLESKLSKQESVSHTLTAKKENVAPRDQEFYDKAYNLLTEAHKALFENKGRNSDFQALDKLLERLNDESTNKEKLVDDLLAFL
APITHPERLGKPNSQIEYTEDEVRIAQLADKYTTSDGYIFDEHDIISDEGDAYVTPHMGHSHWIGKDSLSDKEKVAAQAYTKE
KGILPPSPDADVKANPTGDSAAAIYNRVKGEKRIPLVRLPYMVEHTVEVKNGNLIIPHKDHYHNIKFAWFDDHTYKAPNGYTL
EDLFATIKYYVEHPDERPHSNDGWGNASEHVLGKKDHSEDPNKNFKADEEPVEETPAEPEVPQVETEKVEAQLKEAEVLLAKV
TDSSLKANATETLAGLRNNLTLQIMDNNSIMAEAEKLLALLKGSNPSSVSKEKIN
 
SeqID 195
MPVEIKTTKEIHPKIYAYTTPTVTSNEGWIKIGYTERDVTQRIKEQTHTAHIATDVLWTGDAAYTEEPDKGKTFKDHDFHHFL
SFHDVERRPKTEWFYFNGTPEKSKNLFDKFVQHDLSGYQPGKGQDYTLRQEQEEAVAKTLAYFQEHAGGKFLWNAKPRFGKTL
STYDLARRMEAVNVLIVTNRPAIANSWYDDFETFIAGQTTYKFVSESDSLKSRPILSRQEFLGILADDVRQLAFISLQDLKGS
VYLGGEHDKLKWVTDLHWDLLVIDEAHEGVDTFKTDQAFNKIRRNFTLHLSGTSFKALAKGDFTEEQIYNWSYADEQAAKYSW
SLEQEEENPYESLPQLNLFTYQMSQMIGEKLEKGAQIDGENIDYVFDLSEFFATDDKGKFIHEHDVRNWLDTLSSNEKYPFST
KELRNELKHTFWLLERVASAKALKALLEEHPIYENYEIVLAAGDGRMSEEDDKVKLKSLDLVRKAIAENDKTITLSVGQLTTG
VTIPEWTGVLMLSNLKSPALYMQAAFRAQNPYSWSDNKGNHFRKERAYVFDFAPERTLILFDEFANNLLLVTAAGRGTSATRE
ENIRELLNFFPIIAEDRAGKMVEIDAKAVLTTPRQIKAREVLKRGFMSNLLFDNISGIFQASQTVLDILNELPVEKEGKVQDS
SDLLDFSDVTVDDEGNAVVDHEIVVNQQMRLFGEKVYGLGESVAELVTKDEERTQKQLVNDLSKTVSSVIVEELKADYSLKTR
ETEQIKKQITATLENEIRKNDIERKISEAHIKQELQQQLKEANDKAQKDKIQEDLEKRLEENKLIHKEKLEQTLKKEVEKMPE
KFIEQVEIKRVEQLKQSAQDEIRDHLRGFARTIPSFIMAYGDQTLTLDNFDAFVPEHVFYEVTGITIDQFRYLRDGGQDFAGH
LFDKATFDEAIQEFLRKKKELADYFKDQKEDIFDYIPPQKTNQIFTPKRVVKRMVDDLEKENPGIFDDPSKTFIDLYMKSGLY
IAELVKRLYNSNGLKEAFPNPEERLKHILEKQVYGFAPSEIIYNISTNFIFGNLSKDISRKNFVLADTIPAAKEGSIQKLVDS
YFENN
 
SeqID 196
MKKILIVDDEKPISDIIKFNMTKEGYEVVTAFNGREALEQFEAEQPDIIILDLMLPEIDGLEVAKTIRKTSSVPILMLSAKDS
EFDKVIGLELGADDYVTKPFSNRELQARVKALLRRSQPMPVDGQEADSKPQPIQIGDLEIVPDAYVAKKYGEELDLTHREFEL
LYHLASHTGQVITREHLLETVWGYDYFGDVRTVDVTVRRLREKIEDTPSRPEYILTRRGVGYYMRNNA
 
SeqID 197
MKKKFLAFLLILFPIFSLGIAKAETIKIVSDTAYAPFEFKDSDQTYKGIDVDIINKVAEIKGWNIQMSYPGFDAAVNAVQAGQ
ADAIMAGMTKTKEREKVFTMSDTYYDTKVVIATTKSHKISKYDQLTGKTVGVKNGTAAQRFLETIKDKYGFTIKTFDTGDLMN
NSLSAGAIDAMMDDKPVIEYAINQGQDLHIEMDGEAVGSFAFGVKKGSKYEHLVTEFNQALSEMKKDGSLDKIIKKWTASSSS
AVPTTTTLAGLKAIPVKAKYIIASDSSFAPFVFQNSSNQYTGIDMELIKAIAKDQGFEIEITNPGFDAAISAVQAGQADGIIA
GMSVTDARKATFDFSESYYTANTILGVKESSNIASYEDLKGKTVGVKNGTASQTFLTENQSKYGYKIKTFADGSSMYDSLNTG
AIDAVMDDEPVLKYSISQGQKLKTPISGTPIGETAFAVKKGANPELIEMFNNGLANLKANGEFQKILDKYLASESSTASTSTV
DETTLWGLLQNNYKQLLSGLGITLALALISFAIAIVIGIIFGMFSVSPYKSLRVISEIFVDVIRGIPLMILAAFIFWGIPNFI
ESITGQQSPINDFVAGTLALSLNAAAYIAEIVRGGIQAVPVGQMEASRSLGISYGKTMRKIILPQATKLMLPNFVNQFVIALK
DTTIVSAIGLVELFQTGKIIIARNYQSFKMYAILAIFYLVIITLLTRLAKRLEKRIR
 
SeqID 198
MAFESLTERLQNVFKNLRKKGKISESDVQEATKEIRLALLEADVALPVVKDFIKKVRERAVGHEVIDTLNPAQQIIKIVDEEL
TAVLGSDTAEIIKSPKIPTIIMMVGLQGAGKTTFAGKLANKLKKEENARPLMIAADIYRPAAIDQLKTLGQQIDVPVFALGTE
VPAVEIVRQGLEQAQTNHNDYVLIDTAGRLQIDELLMNELRDVKALAQPNEILLVVDAMIGQEAANVAREFNAQLEVTGVILT
KIDGDTRGGAALSVRHITGKPIKFTGTGEKITDIETFHPDRMSSRILGMGDMLTLIEKASQEYDEQKALEMAEKMRENTFDFN
DFIDQLDQVQNMGPMEDLLKMIPGMANNPALQNMKVDERQIARKRAIVSSMTPEERENPDLLNPSRRRRIAAGSGNTFVEVNK
FIKDFNQAKQLMQGVMSGDMNKMMKQMGINPNNLPKNMPNMGGMDMSALEGMMGQGGMPDLSALGGAGMPDMSQMFGGGLKGK
IGEFAMKQSMKRMANKMKKAKKKRK
 
SeqID 199
MSQIWTKEKFISQVQGGVIVSCQALPGEALYNEEFSLMPFMAKAALEAGAVGIRANSVRDIKAIQKVVDLPIIGIIKRDYPPQ
EPYITATMKEVDELVECGTTVIAFDATLRPRYDGLVVSEFIKKIKEKYPNQLLMADVSNLDEGLYAFKSGVDFVGTTLSGYTS
TSVQSDEPDFELMKKLADFNIPVIAEGKIHYPEQLKKAYSLGVTSVVIGGAITRPKEIAQRFINVIK
 
SeqID 200
MRYLTAGESHGPRLTAIIEGIPAGLPLTAEDINEDLRRRQGGYGRGGRMKIENDQVVFTSGVRHGKTTGAPITMDVINKDHQK
WLDIMSAEDIEDRLKSKRKITHPRPGHADLVGGIKYRFDDLRNSLERSSARETTMRVAVGAVAKRLLAELDMEIANHVVVFGG
KEIDVPENLTVAEIKQRAAQSEVSIVNQEREQEIKDYIDQIKRDGDTIGGVVETVVGGVPVGLGSYVQWDRKLDARLAQAVVS
INAFKGVEFGLGFEAGYRKGSQVMDEILWSKEDGYTRRTNNLGGFEGGMTNGQPIVVRGVMKPIPTLYKPLMSVDIETHEPYK
ATVERSDPTALPAAGMVMEAVVATVLAQEILEKFSSDNLEELKEAVAKHRDYTKNY
 
SeqID 201
MVVMNRIRVSKRVEKKLAKGLVLLEASDLENVNLKDQEVEVQGQEGNFLGTAYLSQQNKGLGWFISKDKVAFNQAFFETLFRK
AKEKRNAYYQDDLTTAFRLFNQEGDGFGGLTVDLYGDYAVFSWYNSYVYQIRQTISEAFRQVFPEVLGAYEKIRFKGLDYESA
HVYGQEAPDFFNVLENGVLYQVFMNDGLMTGIFLDQHEVRGSLVDGLAMGKSLLNMFSYTAAFSVAAAMGGASHTTSVDLAKR
SRELSQAHFQANGLSTDEHRFIVMDVFEYFKYAKRKDLTYDVIVLDPPSFARNKKQTFSVAKDYHKLISQSLEILNPGGIIIA
STNAANVSRQKFTEQIDKGFAGRSYQILNKYGLPADFAYNKKDESSNYLKVISMKVSK
 
SeqID 202
MTKTLKRPEVLSPAGTLEKLKVAVQYGADAVFIGGQAYGLRSRAGNFTFEQMEEGVQFAAKYGAKVYVAANMVMHEGNEAGAG
EWFRKLRDIGIAAVIVSDPALIMIAVTEAPGLEIHLSTQASATNYETLEFWKELGLTRVVLAREVSMEELAEIRKRTDVEIEA
FVHGAMCISYSGRCTLSNHMSMRDANRGGCSQSCRWKYDLYDMPFGKERKSLQGEIPEEFSMSAVDMSMIDHIPDMIENGVDS
LKIEGRMKSIHYVSTVTNCYKAAVDAYLESPEKFEAIKQDLVDEMWKVAQRELATGFYYGTPSENEQLFGARRKIPEYKFVAE
VVSYDDAAQTATIRQRNVINEGDQVEFYGPGFRHFETYIEDLHDAKGNKIDRAPNPMELLTIKVPQPVQSGDMVRALKEGLIN
LYKEDGTSVTVRA
 
SeqID 203
MNTYQLNNGVEIPVLGFGTFKAKDGEEAYRAVLEALKAGYRHIDTAAIYQNEESVGQAIKDSGVPREEMFVTTKLWNSQQTYE
QTRQALEKSIEKLGLDYLDLYLIHWPNPKPLRENDAWKTRNAEVWRAMEDLYQEGKIRAIGVSNFLPHHLDALLETATIVPAV
NQVRLAPGVYQDQVVAYCREKGILLEAWGPFGQGELFDSKQVQEIAANHGKSVAQIALAWSLAEGFLPLPKSVTTSRIQANLD
CFGIELSHEERETLKTIAVQSGAPRVDDVDF
 
SeqID 204
LSEKSREEEKLSFKEQILRDLEKVKGYDEVLKEDEAVVRTPANEPSTEELMADSLSTVEEIMRKAPTVPTHPSQGVPASPADE
IQRETPGVPSHPSQDVPSSPAEESGSRPGPGPVRPKKLEREYNETPTRVAVSYTTAEKKAEQAGPETPTPATETVDIIRDTSR
RSRREGAKPVKPKKEKKSHVKAFVISFLVFLALLSAGGYFGYQYVLDSLLPIDANSKKYVTVGIPEGSNVQEIGTTLEKAGLV
KHGLIFSFYAKYKNYTDLKAGYYNLQKSMSTEDLLKELQKGGTDEPQEPVLATLTIPEGYTLDQIAQAVGQLQGDFKESLTAE
AFLAKVQDETFISQAVAKYPTLLESLPVKDSGARYRLEGYLFPATYSIKESTTIESLIDEMLAAMDKNLSPYYSTIKSKNLTV
NELLTIASLVEKEGAKTEDRKLIAGVFYNRLNRDMPLQSNIAILYAQGKLGQNISLAEDVAIDTNIDSPYNVYKNVGLMPGPV
DSPSLDAIESSINQTKSDNLYFVADVTEGKVYYANNQEDHDRNVAEHVNSKLN
 
SeqID 205
MKQERFPLVSDDEVMLTEMPVMNLYDESDLISNIKGEYRDKNYLEWAPIAEEKPVKPIEKQVEKPKKAPLGVKKEGKSYAEVA
REEARADLKKKRSANYLTQDFSLARRHSQPSLVRQGNQPTAPFQKENPGEFVKYSQKLTQSHYILAEEVHSIPTKNEEVSAPA
PKKNNYDFLKKSQIYNKKSKQTEQERRVAQELNLTRMTE
 
SeqID 206
MKKSKSKYLTLAGLVLGTGVLLSACGNSSTASKTYNYVYSSDPSSLNYLAENRAATSDIVANLVDGLLENDQYGNIIPSLAED
WTVSQDGLTYTYKLRKDAKWFTSEGEEYAPVTAQDFVTGLQYAADKKSEALYLVQDSVAGLDDYITGKTSDFSTVGVKALDDQ
TVQYTLVKPELYWNSKTLATILFPVNADFLKSKGDDFGKADPSSILYNGPFLMKALVSKSAIEYKKNPNYWDAKNVFVDDVKL
TYYDGSDQESLERNFTAGAYTTARLFPNSSSYEGIKEKYKNNIIYSMQNSTSYFFNFNLDRKSYNYTSKTSDIEKKSTQEAVL
NKNFRQAINFAFDRTSYGAQSEGKEGATKILRNLVVPPNFVSIKGKDFGEVVASKWVNYGKEWQGINFADGQDPYYNPEKAKA
KFAEAKKELEAKSVQFPIHLDKTVEVTDKVGIQGVSSIKQSIESVLGSDNVVIDIQQLTSDEFDSSGYFAQTAAQKDYDLYHG
GWGPDYQDPSTYLDIFNTNSGGFLQNLGLEPGEANDKAKAVGLDVYTQMLEEANKEQDPAKRYEKYADIQAWLIDSSLVLPSV
SRGGTPSLRRTVPFAAAYGLTGTKGVESYKYLKVQDKIVTTDEYAKAREKWLKEKEESNKKAQEELAKHVK
 
SeqID 207
VEQHSDVCYIFYRRERLKTKIGLASICLLGLATSHVAANETEVAKTSQDTTTASSSSEQNQSSNKTQTSAEVQTNAAAHWDGD
YYVKDDGSKAQSEWIFDNYYKAWFYINSDGRYSQNEWHGNYYLKSGGYMAQNEWIYDSNYKSWFYLKSDGAYAHQEWQLIGNK
WYYFKKWGYMAKSQWQGSYFLNGQGAMMQNEWLYDPAYSAYFYLKSDGTYANQEWQKVGGKWYYFKKWGYMARNEWQGNYYLT
GSGAMATDEVIMDGTRYIFAASGELKEKKDLNVGWVHRDGKRYFFNNREEQVGTEHAKKVIDISEHNGRINDWKKVIDENEVD
GVIVRLGYSGKEDKELAHNIKELNRLGIPYGVYLYTYAENETDAESDAKQTIELIKKYNMNLSYPIYYDVENWEYVNKSKRAP
SDTGTWVKIINKYMDTMKQAGYQNVYVYSYRSLLQTRLKHPDILKHVNWVAAYTNALEWENPHYSGKKGWQYTSSEYMKGIQG
RVDVSVWY
 
SeqID 208
MAKEPWQEDIYDQEESRAERRHRNHGGADRMANRILTILASIFFVIVVVMVIVLIYLSSGGSNRTAALKGFHDSDASVVQISS
SSSSQPEQSSEPESTSSSSEEAANPEGTIKVLAGEGEAAIAARAGISIAQLEALNPGHMATGSWFANPGDVIKIK
 
SeqID 209
MPITSLEIKDKTFGTRFRGFDPEEVDEFLDIVVRDYEDLVRANHDKNLRIKSLEERLSYFDEIKDSLSQSVLIAQDTAERVKQ
AAHERSNNIIHQAEQDAQRLLEEAKYKANEILRQATDNAKKVAVETEELKNKSRVFHQRLKSTIESQLAIVESSDWEDILRPT
ATYLQTSDEAFKEVVSEVLGEPIPAPIEEEPIDMTRQFSQAEMAELQARIEVADKELSEFEAQIKQEVEAPTPVVSPQVEEEP
LLIQLAQCMKNQK
 
SeqID 210
MSLKDRFDRFIDYFTEDEDSSLPYEKRDEPVFTSVNSSQEPALPMNQPSQSAGTKENNITRLHARQQELANQSQRATDKVIID
VRYPRKYEDATEIVDLLAGNESILIDFQYMTEVQARRCLDYLDGACHVLAGNLKKVASTMYLLTPVNVIVNVEDIRLPDEDQQ
GEFGFDMKRNRVR
 
SeqID 211
MSDLKKYEGVIPAFYACYDDQGEVSPERTRALVQYFIDKGVQGLYVNGSSGECIYQSVEDRKLILEEVMAVAKGKLTIIAHVA
CNNTKDSMELARHAESLGVDAIATIPPIYFRLPEYSVAKYWNDISSAAPNTDYVIYNIPQLAGVALTPSLYTEMLKNPRVIGV
KNSSMPVQDIQTFVSLGGEDHIVFNGPDEQFLGGRLMGARAGIGGTYGAMPELFLKLNQLIADKDLETARELQYAINAIIGKL
TSAHGNMYGVIKEVLKINEGLNIGSVRSPLTPVTEEDRPVVEAAAALIRETKERFL
 
SeqID 212
MNKRGLYSKLGISVVGISLLMGVPTLIHANELNYGQLSISPIFQGGSYQLNNKSIDISSLLLDKLSGESQTVVMKFKADKPNS
LQALFGLSNSKAGFKNNYFSIFMRDSGEIGVEIRDAQKGINYLFSRPASLWGKHKGQAVENTLVFVSDSKDKTYTMYVNGIEV
FSETVDTFLPISNINGIDKATLGAVNREGKEHYLAKGSIDEISLFNKAISDQEVSTIPLSNPFQLIFQSGDSTQANYFRIPTL
YTLSSGRVLSSIDARYGGTHDSKSKINIATSYSDDNGKTWSEPIFAMKFNDYEEQLVYWPRDNKLKNSQISGSASFIDSSIVE
DKKSGKTILLADVMPAGIGNNNANKADSGFKEINGHYYLKLKKNGDNDFRYTVRENGVVYNETTNKPTNYTINDKYEVLEGGK
SLTVEQYSVDFDSGSLRERHNGKQVPMNVFYKDSLFKVTPTNYIAMTTSQNRGESWEQFKLLPPFLGEKHNGTYLCPGQGLAL
KSSNRLIFATYTSGELTYLISDDSGQTWKKSSASIPFKKATAEAQMVELRDGVIRTFFRTTTGKIAYMTSRDSGETWSKVSYI
DGIQQTSYGTQVSAIKYSQLIDGKEAVILSTPNSRSGRKGGQLVVGLVNKEDDSIDWKYHYDIDLPSYGYAYSAITELPNHHI
GVLFEKYDSWSRNELHLSNVVQYIDLEINDLTK
 
SeqID 213
MNRSVQERKCRYSIRKLSVGAVSMIVGAVVFGTSPVLAQEGASEQPLANETQLSGESSTLTDTEKSQPSSETELSGNKQEQER
KDKQEEKIPRDYYARDLENVETVIEKEDVETNASNGQRVDLSSELDKLKKLENATVHMEFKPDAKAPAFYNLFSVSSATKKDE
YFTMAVYNNTATLEGRGSDGKQFYNNYNDAPLKVKPGQWNSVTFTVEKPTAELPKGRVRLYVNGVLSRTSLRSGNFIKDMPDV
THVQIGATKRANNTVWGSNLQIRNLTVYNRALTPEEVQKRSQLFKRSDLEKKLPEGAALTEKTDIFESGRNGNPNKDGIKSYR
IPALLKTDKGTLIAGADERRLHSSDWGDIGMVIRRSEDNGKTWGDRVTITNLRDNPKASDPSIGSPVNIDMVLVQDPETKRIF
SIYDMFPEGKGIFGMSSQKEEAYKKIDGKTYQILYREGEKGAYTIRENGTVYTPDGKATDYRVVVDPVKPAYSDKGDLYKGDQ
LLGNIYFTTNKTSPFRIAKDSYLWMSYSDDDGKTWSAPQDITPMVKADWMKFLGVGPGTGIVLRNGPHKGRILIPVYTTNNVS
HLDGSQSSRVIYSDDHGKTWHAGEAVNDNRQVDGQKIHSSTMNNRRAQNTESTVVQLNNGDVKLFMRGLTGDLQVATSKDGGV
TWEKDIKRYPQVKDVYVQMSAIHTMHEGKEYIILSNAGGPKRENGMVHLARVEENGELTWLKHNPIQKGEFAYNSLQELGNGE
YGILYEHTEKGQNAYTLSFRKFNWEFLSKNLISPTEANRDGQRRDGQRSYWLGVRLRSIGQQGSNPSIGKWNSDFPNPVQDLV
VCSRGRYRTGNYWYSRKHRKYASSCKSSRCQSSWRSKWQSSGASSRIYRGSWYRASCSNRRVGIFACNSYYKKRLYLQSSSCS
AGTSNRKQGEPPSFTRTNSFLPWSVYAREKERT
 
SeqID 214
MIQIGKIFAGRYRIVKQIGRGGMADVYLAKDLILDGEEVAVKVLRTNYQTDPIAVARFQREARAMADLDHPHIVRITDIGEED
GQQYLAMEYVAGLDLKRYIKEHYPLSNEEAVRIMGQILLAMRLAHTRGIVHRDLKPQNILLTPDGTAKVTDFGIAVAFAETSL
TQTNSMLGSVHYLSPEQARGSKATVQSDIYAMGIIFYEMLTGHIPYDGDSAVTIALQHFQKPLPSVIAENPSVPQALENVIIK
ATAKKLTNRYRSVSEMYVDLSSSLSYNRRNESKLIFDETSKADTKTLPKVSQSTLTSIPKVQAQTEHKSIKNPSQAVTEETYQ
PQAPKKHRFKMRYLILLASLVLVAASLIWILSRTPATIAIPDVAGQTVAEAKATLKKANFEIGEEKTEASEKVEEGRIIRTDP
GAGTGRKEGTKINLVVSSGKQSFQISNYVGRKSSDVIAELKEKKVPDNLIKIEEEESNESEAGTVLKQSLPEGTTYDLSKATQ
IVLTVAKKATTIQLGNYIGRNSTEVISELKQKKVPENLIKIEEEESSESEPGTIMKQSPGAGTTYDVSKPTQIVLTVAKKVTS
VAMPSYIGSSLEFTKNNLIQIVGIKEANIEVVEVTTAPAGSAEGMVVEQSPRAGEKVDLNKTRVKISIYKPKTTSATP
 
SeqID 215
MTKLIFMGTPDFSATVLKGLLTDDRYEILAVVTQPDRAVGRKKVIQETPVKQAAKEAGLSIYQPEKLSGSPEMEDLMKLGADG
IVTAAFGQFLPSKLLDSMDFAVNVHASLLPRHRGGAPIHYALIQGDEEAGVTIMEMVKEMDAGDMISRRSIPITDEDNVGTLF
EKLALVGRDLLLDTLPAYIAGDIKPEPQDTSQVTFSPNIKPEEEKLDWNKTNRQLFNQIRGMNPWPVAHTFLKGDRFKIYEAL
PVEGQGNPGEILSIGKKELIVATAEGALSLKQVQPAGKPKMDIASFLNGVGRTLTVGERFGD
 
SeqID 216
VFRRLGQDFQLRKVKKILKQIKALKGKMSSLSDQELVAKTVEFRQRLSEGESLDDILVEAFAVVREADKRILGMFPYDVQVMG
AIVMHYGNVAEMNTGEGKTLTATMPVYLNAFSGEGVMVVTPNEYLSKRDAEEMGQVYRFLGLTIGVPFTEDPKKEMKAEEKKL
IYASDIIYTTNSNLGFDYLNDNLASNEEGKFLRPFNYVIIDEIDDILLDSAQTPLIIAGSPRVQSNYYAIIDTLVTTLVEGED
YIFKEEKEEVWLTTKGAKSAENFLGIDNLYKEEHASFARHLVYAIRAHKLFTKDKDYIIRGNEMVLVDKGTGRLMEMTKLQGG
LHQAIEAKEHVKLSPETRAMASITYQSLFKMFNKISGMTGTGKVAEKEFIETYNMSVVRIPTNRPRQRIDYPDNLYITLPEKV
YASLEYIKQYHAKGNPLLVFVGSVEMSQLYSSLLFREGIAHNVLNANNAAREAQIISESGQMGAVTVATSMAGRGTDIKLGKG
VAELGGLIVIGTERMESQRIDLQIRGRSGRQGDPGMSKFFVSLEDDVIKKFGPSWVHKKYKDYQVQDMTQPEVLKGRKYRKLV
EKAQHASDSAGRSARRQTLEYAESMNIQRDIVYKERNRLIDGSRDLEDVVVDIIERYTEEVAADHYASRELLFHFIVTNISFH
VKEVPDYIDVTDKTAVRSFMKQVIDKELSEKKELLNQHDLYEQFLRLSLLKAIDDNWVEQVDYLQQLSMAIGGQSASQKNPIV
EYYQEAYAGFEAMKEQIHADMVRNLLMGLVEVTPKGEIVTHFP
 
SeqID 217
MTETVEDKVSHSITGLDILKGIVAAGAVISGTVATQTKVFTNESAVLEKTVEKTDALATNDTVVLGTISTSNSASSTSLSASE
SASTSASESASTSASTSASTSASESASTSASTSISASSTVVGSQTAAATEATAKKVEEDRKKPASDYVASVTNVNLQSYAKRR
KRSVDSIEQLLASIKNAAVFSGNTIVNGAPAINASLNIAKSETKVYTGEGVDSVYRVPIYYKLKVTNDGSKLTFTYTVTYVNP
KTNDLGNISSMRPGYSIYNSGTSTQTMLTLGSDLGKPSGVKNYITDKNGRQVLSYNTSTMTTQGSGYTWGNGAQMNGFFAKKG
YGLTSSWTVPITGTDTSFTFTPYAARTDRIGINYFNGGGKVVESSTTSQSLSQSKSLSVSASQSASASASTSASASASTSASA
SASTSASASASTSASVSASTSASASASTSASASASTSASESASTSASASASTSASASASTSASASASTSASESASTSASASAS
TSASESASTSASASASTSASASASTSASGSASTSTSASASTSASASASTSASASASISASESASTSASESASTSTSASASTSA
SESASTSASASASTSASASASTSASASASTSASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASVSAS
TSASASASTSASASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASASASTSASESASTSASASASTSA
SASASTSASASASTSASASASTSASASASISASESASTSASASASTSASASASTSASASASTSASESASTSASASASTSASAS
ASTSASASASTSASASASTSASASASTSASASASTSASESASTSASASASTSASESASTSASASASTSASASASTSASASAST
SASASASTSASASASTSASASASTSASASTSASESASTSASASASTSASASASTSASASASTSASESASTSASASASTSASAS
ASTSASASASTSASASASTSASASASISASESASTSASASASTSASVSASTSASASASTSASESASTSASASASTSASESAST
SASASASTSASASASISASESASTSASASASTSASASASTSASASASTSASESASTSTSASASTSASESASTSASASASTSAS
ASASTSASASASTSASASASTSASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASAST
SASASASTSASASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASVSASTSASESASTSASASASTSAS
ASASTSASESASTSASASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASA
STSASASASTSASASASTSASASASTSASASASTSASASASTSASASASISASESASTSASASASTSASASASTSASVSASTS
ASASASTSASASASISASESASTSASASASTSASASASTSASASASTSASASASISASESASTSASASASTSASASASTSASA
SASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASESASTSASASASTSASASASTSASASAS
TSASVSASTSASESASTSASASASTSASASASTSASASASTSASESASTSASASASTSASASASTSASESASTSASASASTSA
SASASTSASASASTSASASASASTSASASASTSASASASTSASASASISASESASTSASESASTSTSASASTSASESASTSAS
ASASTSASASASTSASASASTSASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASASASTSASVSAST
SASASASTSASASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASASASTSASESASTSASASASTSAS
ASASTSASASASTSASASASTSASASASISASESASTSASASASTSASASASTSASASASTSASESASTSASASASTSASASA
STSASASASTSASASASTSASASASTSASASASTSASESASTSASASASTSASESASTSASASASTSASASASTSASASASTS
ASASASTSASASASTSASASASTSASASTSASESASTSASASASTSASASASTSASASASTSASESASTSASASASTSASASA
STSASASASTSASASASTSASASASISASESASTSASASASTSASVSASTSASASASTSASESASTSASASASTSASESASTS
ASASASTSASASASISASESASTSASASASTSASASASTSASASASTSASESASTSTSASASTSASESASTSASASASTSASA
SASTSASASASTSASASASTSASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTS
ASASASTSASASASTSASASASTSASASASTSASASASTSASESASTSASASASTSASASASTSASASASTSASVSASTSASE
SASTSASASASTSASASASTSASASASTSASESASTSASASASTSASASASTSASESASTSASASASTSASASASTSASASAS
TSASASASASTSASASASTSASASASTSASASASISASESASTSASASASASTSASASASTSASASASTSASASASISASESA
STSASESASTSTSASASTSASESASTSASASASTSASASASTSASASASTSASASTSASESASTSASASASTSASASASTSAS
ASASTSASASASTSASASASTSASVSASTSASASASTSASASASTSASESASTSASASTSASESASTSASASASTSASASAST
SASASASTSASESASTSASASASTSASASASTSASESASTSASASASTSASASASTSASASASTSASESASTSASASASTSAS
ESASTSASASASTSASASASTSASGSASTSTSASASTSASASASTSASASASISASESASTSASESASTSTSASASTSASESA
STSASASASTSASASASTSASASASTSASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASVSASTSAS
ASASTSASASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASASASTSASESASTSASASASTSASASA
STSASASASTSASASASTSASASASISASESASTSASASASTSASASASTSASASASTSASESASTSASASASTSASASASTS
ASASASTSASASASTSASASASTSASASASTSASESASTSASASASTSASESASTSASASASTSASASASTSASASASTSASA
SASTSASASASTSASASASTSASASTSASESASTSASASASTSASASASTSASASASTSASESASTSASASASTSASASASTS
ASASASTSASASASTSASASASISASESASTSASASASTSASVSASTSASASASTSASESASTSASASASTSASESASTSASA
SASTSASASASISASESASTSASASASTSASASASTSASASASTSASESASTSTSASASTSASESASTSASASASTSASASAS
TSASASASTSASASASTSASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASA
SASTSASASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASVSASTSASESASTSASASASTSASASAS
TSASESASTSASASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSA
SASASTSASASASTSASASASTSASASASTSASASASTSASASASISASESASTSASASASTSASASASTSASVSASTSASAS
ASTSASASASISASESASTSASASASTSASASASTSASASASTSASASASISASESASTSASASASTSASASASTSASASAST
SASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASESASTSASASASTSASASASISASESASTSAS
ASASTSASASASTSASASASTSASESASTSTSASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASAST
SASESASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASESASTSA■
ASASTSASASASTSASASASTSASASASTSASVSASTSASESASTSASASASTSASASASTSASESASTSASASASTSASESA
STSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTS
ASASASTSASASASTSASASASISASESASTSASASASTSASASASTSASVSASTSASASASTSASASASISASESASTSASA
SASTSASASASTSASASASTSASASASISASESASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASAS
TSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSVSNSANHSNSQVGNTS■
STGKSQKELPNTGTESSIGSVLLGVLAAVTGIGLVAKRRKRDEEE
 
SeqID 218
MSNEKNTNTNVEKKDATVVAHEIKGELTYEDKVIQKIIGLSLENVSGLLGIDGGFFSNLKEKIVNSDDVTSGVNVEVGKTQVA
VDLNVIVEYQKNVPALYSEIREIVSSEVAKMTDLEIVEINVNVVDIKTKEQHEADSVSLQDRVSDVAESTGEFTSEQFEKAKS
GLGSGFSTVQEKVSEGVEAVKGAANGVVSHENTRVN
 
SeqID 219
MTKEKNVILTARDIVVEFDVRDKVLTAIRGVSLELVEGEVLALVGESGSGKSVLTKTFTGMLEENGRIAQGSIDYRGQDLTA■
SSHKDWEQIRGAKIATIFQDPMTSLDPIKTIGSQITEVIVKHQGKTAKEAKELAIDYMNKVGIPDADRRFNEYPFQYSGGMR■
RIVIAIALACRPDVLICDEPTTALDVTIQAQIIDLLKSLQNEYHFTTIFITHDLGVVASIADKVAVMYAGEIVEYGTVEEVF■
DPRHPYTWSLLSSLPQLADDKGDLYSIPGTPPSLYTDLKGDAFALRSDYAMQIDFEQKAPQFSVSETHWAKTWLLHEDAPKV■
KPAVIANLHDKIREKMGFAHLAD
 
SeqID 220
MKKNRVFATAGLVLLAAGVLAACSSSKSSDSSAPKAYGYVYTADPETLDYLISSKNSTTVVTSNGIDGLFTNDNYGNLAPAVA
EDWEVSKDGLTYTYKIRKGVKWFTSDGEEYAEVTAKDFVNGLKHAADKKSEAMYLAENSVKGLADYLSGTSTDFSTVGVKAVD
DYTLQYTLNQPEPFWNSKLTYSIFWPLNEEFETSKGSDFAKPTDPTSLLYNGPFLLKGLTAKSSVEFVKNEQYWDKENVHLDT
INLAYYDGSDQESLERNFTSGAYSYARLYPTSSNYSKVAEEYKDNIYYTQSGSGIAGLGVNIDRQSYNYTSKTTDSEKVATKK
ALLNKDFRQALNFALDRSAYSAQINGKDGAALAVRNLFVKPDFVSAGEKTFGDLVAAQLPAYGDEWKGVNLADGQDGLFNADK
AKAEFAKAKKALEADGVQFPIHLDVPVDQASKNYISRIQSFKQSVETVLGVENVVVDIQQMTSDEFLNITYYAANASSEDWDV
SGGVSWGPDYQDPSTYLDILKTTSSETTKTYIGFDNPNSPSVVQVGLKEYDKLVDEAARETSDLNVRYEKYAAAQAWLTDSSL
FIPAMASSGAAPVLSRIVPFTGASAQTGSKGSDVYFKYLKSQDKVVTKEEYEKAREKWLKEKAESNEKAQKELASHVK
 
SeqID 221
MEINVSKLRTDLPQVGVQPYRQVHAHSTGNPHSTVQNEADYHWRKDPELGFFSHIVGNGCIMQVGPVDNGAWDVGGGWNAETY
AAVELIESHSTKEEFMTDYRLYIFLLRNLADEAGLPKTLDTGSLAGIKTHEYCTNNQPNNHSDHVDPYPYLAKWGISREQFKH
DIENGLTIETGWQKNDTGYWYVHSDGSYPKDKFEKINGTWYYFDSSGYMLADRWRKHTDGNWYWFDNSGEMATGWKKIADKWY
YFNEEGAMKTGWVKYKDTWYYLDAKEGAMVSNAFIQSADGTGWYYLKPDGTLADKPEFTVEPDGLITVK
 
SeqID 222
MKKKYWTLAILFFCLFNNSVTAQEIPKNLDGNITHTQTSESFSESDEKQVDYSNKNQEEVDQNKFRIQIDKTELFVTTDKHLE
KNCCKLELEPQINNDIVNSESNNLLGEDNLDNKIKENVSHLDNRGGNIEHDKDNLESSIVRKYEWDIDKVTGGGESYKLYSKS
NSKVSIAILDSGVDLQNTGLLKNLSNHSKNYVPNKGYLGKEEGEEGIISDIQDRLGHGTAVVAQIVGDDNINGVNPHVNINVY
RIFGKSSASPDWIVKAIFDAVDDGNDIINLSTGQYLMIDGEYEDGTNDFETFLKYKKAIDYANQKGVIIVAALGNDSLNVSNQ
SDLLKLISSRKKVRKPGLVVDVPSYFSSTISVGGIDRLGNLSDFSNKGDSDAIYAPAGSTLSLSELGLNNFINAEKYKEDWIF
SATLGGYTYLYGNSFAAPKVSGAIAMIIDKYKLKDQPYNYMFVKKFWKKHYQ
 
SeqID 223
MKKDELFEGFYLIKSADLRQTRAGKNYLAFTFQDDSGEIDGKLWDAQPHNIEAFTAGKVVHMKGRREVYNNTPQVNQITLRLP
QAGEPNDPADFKVKSPVDVKEIRDYMSQMIFKIENPVWQRIVRNLYTKYDKEFYSYPAAKTNHHAFETGLAYHTATMVRLADA
ISEVYPQLNKSLLYAGIMLHDLAKVIELTGPDQTEYTVRGNLLGHIALIDSEITKTVMELGIDDTKEEVVLLRHVILSHHGLL
EYGSPVRPRIMEAEIIHMIDNLDASMMMMSTALALVDKGEMTNKIFAMDNRSFYKPDLD
 
SeqID 224
VTILGKDTVQQSAKGESVTQEATPEYKLENTPGGDKGGNTGSSDANANEGGGSQAGGSAHTGSQNSAQSQASKQLATEKESAK
NAIEKAAKDKQDEIKGAPLSDKEKAELLARVEAEKQAALKEIENAKTMEDVKEAETIGVQAIAMVTVPKRPVAPNAAPKTTSA
PQATAGTMQDVTYQSPAGKQLPNTGSASSAALASLGLVVATSGFALLGRKTRRRK
 
SeqID 225
MNADDTVTIYDVAREAGVSMATVSRVVNGNKNVKENTRKKVLEVIDRLDYRPNAVARGLASKKTTTVGVVIPNITNGYFSSLA
KGIDDIAEMYKYNIVLANSDEDNEKEVSVVNTLFSKQVDGIIYMGYHLTDKIRSEFSRSRTPIVLAGTVDVEHQLPSVNIDYK
QATIDAVSYLAKENERIAFVSGPLVDDINGKVRLVGYKETLKKAGITYSEGLVFESKYSYDDGYALAERLISSNATAAVVTGD
ELAAGVLNGLADKGVSVPEDFEIITSDDSQISRFTRPNLTTIAQPLYDLGAISMRMLTKIMHKEELEEREVLLPHGLTERSST
RKRK
 
SeqID 226
MKKKLVFPNLFWWGAASSGPQTEGQYGKVHENVMDYWFKTHPEDFFDNVGPLVASNFFHTYTEDFHLMKEIGVNSFRTSIQWS
RLIKNLETGEPDPKGIAFYNAIIEEAKKNQMDLVMNLHHFDLPVELLQKYGGWESKHVVELFVKFAKTAFTCFGDKVHYWTTF
NEPWVIPEAGYLYAFHYPNLKGKGKEAVQVIYNLNLASAKVIQLYRSLELDGKIGIILNLTPAYPRSNSPEDLEASRFTDDFF
NKVFLNPAVKGTFPERLVKQLERDGVLWSHTEKELQLMKSNTVDFLGVNYYHPKRVQAQANPEEYQTPWMPDQYFKEYEWLER
RMNPYRGWEIFPKAIYDIAMIVKEEYGNIPWFISENGMGVENEARFIDENGVIDDVYRIEFYEEHLRWLHKAIEEGSHCFGYH
AWTAFDCWSWNNAYKNRYGFISVDLETQKRTIKSSGRWYRKVSDNNGFEVEIEE
 
SeqID 227
VENLTNFYEKYRVYLTRPRLELLAVVTIVFCAVLVFFLNIPGKGVLKLDNGTIVYDGSLVRGKMNGQGTITFQNGDQYTGGFN
NGAFNGKGTFQSKEGWTYEGDFVNGQAEGKGKLTTEQEVVYEGTFKQGVFQQK
 
SeqID 228
MLNKIRDYLDFAGLQYRNPDKAGAEREKMLAFRHKGQEARKVFTELAKAFQASHPEWQLQQTSQWMNQAQRLRPHFWVYLQRD
GQVTEPMMALRLYGTSTDFGISLEVSFIERKKDEQTLGKQAKVLDIPTVKGIYYLTYSNGQSQRWEANEEKRRTLREKVRSQE
VRKVLVKVDVPMTENSSEEEIVEGLLKSYSKILPYYLATRK
 
SeqID 229
MVQNSCWQSKSHKVKAFTLLESLLALIVISGGLLLFQAMSQLLISEVRYQQQSEQKEWLLFVDQLEVELDRSQFEKVEGNRLY
MKQDGKDIAIGKSKSDDFRKTNARGRGYQPMVYGLKSVRITEDNQLVRFHFQFQKGLEREFIYRVEKEKS
 
SeqID 230
MKKMMTFLKKAKVKAFTLVEMLVVLLIISVLFLLFVPNLTKQKEAVNDKGKAAVVKVVESQAELYSLEKNEDASLRKLQADGR
ITEEQAKAYKEYNDKNGGANRKVND
 
SeqID 231
MTSKVRKAVIPAAGLGTRFLPATKALAKEMLPIVDKPTIQFIVEEALKSGIEDILVVTGKSKRSIEDHFDSNFELEYNLKEKG
KTDLLKLVDKTTDMRLHFIRQTHPRGLGDAVLQAKAFVGNEPFVVMLGDDLMDITDEKAVPLTKQLMDDYERTHASTIAVMPV
PHDEVSAYGVIAPQGEGKDGLYSVETFVEKPAPEDAPSDLAIIGRYLLTPEIFEILEKQAPGAGNEIQLTDAIDTLNKTQRVF
AREFKGARYDVGDKFGFMKTSIDYALKHPQVKDDLKNYLIQLGKELTEKE
 
SeqID 232
MQNQLNELKRKMLEFFQQKQKNKKSARPGKKGSSTKKSKTLDKSVIFPAILLSIKALFNLLFVLGFLGGMLGAGIALGYGVAL
FDKVRVPQTEELVNQVKDISSISEITYSDGTVIASIESDLLRTSISSEQISENLKKAIIATEDEHFKEHKGVVPKAVIRATLG
KFVGLGSSSGGSTLTQQLIKQQVVGDAPTLARKAAEIVDALALERAMNKDEILTTYLNVAPFGRNNKGQNIAGARQAAEGIFG
VDASQLTVPQAAFLAGLPQSPITYSPYENTGELKSDEDLEIGLRRAKAVLYSMYRTGALSKDEYSQYKDYDLKQDFLPSGTVT
GISRDYLYFTTLAEAQERMYDYLAQRDNVSAKELKNEATQKFYRDLAAKEIENGGYKITTTIDQKIHSAMQSAVADYGYLLD■
GTGRVEVGNVLMDNQTGAILGFVGGRNYQENQNNHAFDTKRSPASTTKPLLAYGIAIDQGLMGSETILSNYPTNFANGNPIMY
ANSKGTGMMTLGEALNYSWNIPAYWTYRMLREKGVDVKGYMEKMGYEIPEYGIESLPMGGGIEVTVAQHTNGYQTLANNGVYH
QKHVISKIEAADGRVVYEYQDKPVQVYSKATATIMQGLLREVLSSRVTTTFKSNLTSLNPTLANADWIGKTGTTNQDENMWLM
LSTPRLTLGGWIGHDDNHSLSRRAGYSNNSNYMAHLVNAIQQASPSIWGNERFALDPSVVKSEVLKSTGQKPEKVSVEGKEVE
VTGSTVTSYWANKSGAPATSYRFAIGGSDADYQNAWSSIVGSLPTPSSSSSSSSSSSDSSNSSTTRPSSSRARR
 
SeqID 233
MSSKFMKSAAVLGTATLASLLLVACGSKTADKPADSGSSEVKELTVYVDEGYKSYIEEVAKAYEKEAGVKVTLKTGDALGGL■
KLSLDNQSGNVPDVMMAPYDRVGSLGSDGQLSEVKLSDGAKTDDTTKSLVTAANGKVYGAPAVIESLVMYYNKDLVKDAPKTE
ADLENLAKDSKYAFAGEDGKTTAFLADWTNFYYTYGLLAGNGAYVFGQNGKDAKDIGLANDGSIVGINYAKSWYEKWPKGMQ■
TEGAGNLIQTQFQEGKTAAIIDGPWKAQAFKDAKVNYGVATIPTLPNGKEYAAFGGGKAWVIPQAVKNLEASQKFVDFLVATE
QQKVLYDKTNEIPANTEARSYAEGKNDELTTAVIKQFKNTQPLPNISQMSAVWDPAKNMLFDAVSGQKDAKTAANDAVTLIK■
TIKQKFGE
 
SeqID 234
MIDKVVRNLLLTFFFCKMTKIIIFLTTILVKKKKICYNEFKLRNRKQKGVIMWVLGFILFMIFFYSNNSKKIKKLENKIKRL■
RKEKGNAEMSRLLQEMIGKEPIITGVYIGPDNWEVVDVDEEWVKLRRVDNTGKEKFKLQRIEDIQTVEFDGE
 
SeqID 235
MILSKNREDGLRKFATNIRLNTLRTLNHLGFGHYGGSLSIVEVLAVLYGEIMPMTPEIFAARDRDYFILSKGHGGPALYSTLY
LNGFFDKEFLYSLNTNGTKLPSHPDRNLTPGIDMTTGSLGQGISVATGLAYGQRIRKSPFYTYAIVGDGELNEGQCWEAIQFA
SHQQLSNLIVFVDDNKKQLDGFTKDICNPGDFVEKFSAFGFESIRVKGSDIREIYEGIVQLKQSNNSSPKCIVLDTIKGQGVQ
ELEEMKSNHHLRPTVEEKQMLTSVVERLSQELEETE
 
SeqID 236
MKKTTILSLTTAAVILAAYVPNEPILADTPSSEVIKETKVGSIIQQNNIKYKVLTVEGNIGTVQVGNGVTPVEFEAGQDGKP■
TIPTKITVGDKVFTVTEVASQAFSYYPDETGRIVYYPSSITIPSSIKKIQKKGFHGSKAKTIIFDKGSQLEKIEDRAFDFSE■
EEIELPASLEYIGTSAFSFSQKLKKLTFSSSSKLELISHEAFANLSNLEKLTLPKSVKTLGSNLFRLTTSLKHVDVEEGNES■
ASVDGVLFSKDKTQLIYYPSQKNDESYKTPKETKELASYSFNKNSYLKKLELNEGLEKIGTFAFADAIKLEEISLPNSLETI■
RLAFYGNLELKELILPDNVKNFGKHVMNGLPKLKSLTIGNNINSLPSFFLSGVLDSLKEIHIKNKSTEFSVKKDTFAIPETV■
FYVTSEHIKDVLKSNLSTSNDIIVEKVDNIKQETDVAKPKKNSNQGVVGWVKDKGLWYYLNESGSMATGWVKDKGLWYYLNES
GSMATGWVKDKGLWYYLNESGSMATGWVKDKGLWYYLNESGSMATGWVKDKGLWYYLNESGSMATGWVKDKGLWYYLNESGSM
ATGWVTVSGKWYYTYNSGDLLVNTTTPDGYRVNANGEWVG
 
SeqID 237
MVRFTGLSLKQTQAIEVLKGHISLPDVEVAVTQSDQASISIEGEEGHYQLTYRKPHQLYRALSLLVTVLAEADKVEIEEQAAY
EDLAYMVDCSRNAVLNVASAKQMIEILALMGYSTFELYMEDTYQIEGQPYFGYFRGAYSAEELQEIEAYAQQFDVTFVPCIQT
LAHLSAFVKWGVKEVQELRDVEDILLIGEEKVYDLIDGMFATLSKLKTRKVNIGMDEAHLVGLGRYLILNGVVDRSLLMCQH■
ERVLDIADKYGFHCQMWSDMFFKLMSADGQYDRDVEIPEETRVYLDRLKDRVTLVYWDYYQDSEEKYNRNFRNHHKISHDLA■
AGGAWKWIGFTPHNHFSRLVAIEANKACRANQIKEVIVTGWGDNGGETAQFSILPSLQIWAELSYRNDLDGLSAHFKTNTGLT
VEDFMQIDLANLLPDLPGNLSGINPNRYVFYQDILCPILDQHMTPEQDKPHFAQAAETLANIKEKAGNYAYLFETQAQLNAI■
SSKVDVGRRIRQAYQADDKESLQQIARQELPELRSQIEDFHALFSHQWLKENKVFGLDTVDIRMGGLLQRIKRAESRIEVYLA
GQLDRIDELEVEILPFTDFYADKDFAATTANQWHTIATASTIYTT
 
SeqID 238
MSNSFVKLLVSQLFANLADIFFRVTIIANIYIISKSVIATSLVPILIGISSFVASLLVPLVTKRLALNRVLSLSQFGKTILLA
ILVGMFTVMQSVAPLVTYLFVVAISILDGFAAPVSYAIVPRYATDLGKANSALSMTGEAVQLIGWGLGGLLFATIGLLPTTC■
NLVLYIISSFLMLFLPNAEVEVLESETNLEILLKGWKLVARNPRLRLFVSANLLEIFSNTIWVSSIILVFVTELLNKTESYW■
YSNTAYSIGIIISGLIAFRLSEKFLAAKWEPQLFTPNLKTIQNPCLSLDPGWFLFSPNGCFLLDKKEFPLYGISVEKNTKRK■
THMNSLPNHHFQNKSFYQLSFDGGHLTQYGGLIFFQELFSQLKLKERISKYLVTNDQRRYCRYSDSDILVQFLFQLLTGYGT■
YACKELSADAYFPKLLEGGQLASQPTLSRFLSRTDEETVHSLRCLNLELVEFFLQFHQLNQLIVDIDSTHFTTYGKQEGVAVN
AHYRAHGYHPLYAFEGKTGYCFNAQLRPGNRYCSEEADSFITPVLERFNQLLFRMDSGFATPKLYDLIEKTGQYYLIKLKKNT
VLSRLGDLSLPCPQDEDLTILPHSAYSETLYQAGSWSHKRRVCQFSERKEGNLFYDVISLVTNMTSGTSQDQFQLYRGRGQA■
NFIKEMKEGFFGDKTDSSTLIKNEVRMMMSCIAYNLYLFLKHLAGGDFQTLTIKRFRHLFLHVVGKCVRTGRKQLLKLSSLYA
YSELFSALYSRIRKVNLNLPVPYEPPRRKASLMMH
 
SeqID 239
MFASKSERKVHYSIRKFSVGVASVVVASLVMGSVVHATENEGATQVPTSSNRANESQAEQGEQPKKLDSERDKARKEVEEYVK
KIVGESYAKSTKKRHTITVALVNELNNIKNEYLNKIVESTSESQLQILMMESRSKVDEAVSKFEKDSSSSSSSDSSTKPEASD
TAKPNKPTEPGEKVAEAKKKVEEAEKKAKDQKEEDRRNYPTITYKTLELEIAESDVEVKKAELELVKVKANEPRDEQKIKQAE
AEVESKQAEATRLKKIKTDREEAEEEAKRRADAKEQGKPKGRAKRGVPGELATPDKKENDAKSSDSSVGEETLPSPSLKPEKK
VAEAEKKVEEAKKKAEDQKEEDRRNYPTNTYKTLELEIAESDVEVKKAELELVKEEAKEPRNEEKVKQAKAEVESKKAEATRL
EKIKTDRKKAEEEAKRKAAEEDKVKEKPAEQPQPAPAPKAEKPAPAPKPENPAEQPKAEKPADQQAEEDYARRSEEEYNRLTQ
QQPPKTEKPAQPSTPKTGWKQENGMWYFYNTDGSMATGWLQNNGSWYYLNSNGAMATGWLQNNGSWYYLNANGSMATGWLQNN
GSWYYLNANGSMATGWLQYNGSWYYLNANGSMATGWLQYNGSWYYLNANGDMATGWVKDGDTWYYLEASGAMKASQWFKVSDK
WYYVNGSGALAVNTTVDGYGVNANGEWVN
 
SeqID 240
MNYSKALNECIESAYMVAGHFGARYLESWHLLIAMSNHSYSVAGATLNDYPYEMDRLEEVALELTETDYSQDETFTELPFSRR
LQVLFDEAEYVASVVHAKVLGTEHVLYAILHDSNALATRILERAGFSYEDKKDQVKIAALRRNLEERAGWWREDLKALRQRHR
TVADKQNSMANMMGMPQTPSGGLEDYTHDLTEQARSGKLEPVIGRDKEISRMIQILSRKTKNNPVLVGDAGVGKTALALGLAQ
RIASGDVPAEMAKMRVLELDLMNVVAGTRFRGDFEERMNNIIKDIEEDGQVILFIDELHTIMGSGSGIDSTLDAANILKPALA
RGTLRTVGATTQEEYQKHIEKDAALSRRFAKVTIEEPSVADSMTILQGLKATYEKHHRVQITDEAVETAVKMAHRYLTSRHL■
DSAIDLLDEAAATVQNKAKHVKADDSDLSPADKALMDGKWKQAAQLIAKEEEVPVYKDLVTESDILTTLSRLSGIPVQKLTQT
DAKKYLNLEAELHKRVIGQDQAVSSISRAIRRNQSGIRSHKRPIGSFMFLGPTGVGKTELAKALAEVLFDDESALIRFDMSEY
MEKFAASRLNGAPPGYVGYEEGGELTEKVRNKPYSVLLFDEVEKAHPDIFNVLLQVLDDGVLTDSKGRKVDFSVTIIIMTSNI
GATALRDDKTVGFGAKDIRFDQENMEKRMFEELKKAYRPEFINRIDEKVVFHSLSSDHMQEVVKIMVKPLVASLTEKGIDLK■
QASALKLLANQGYDPEMGARPLRRTLQTEVEDKLAELLLKGDLVAGSTLKIGVKAGQLKFDIA
 
SeqID 241
MKILPFIARGTSYYLKMSVKKLVPFLVVGLMLAAGDSVYAYSRGNGSIARGDDYPAYYKNGSQEIDQWRMYSRQCTSFVAFR■
SNVNGFEIPAAYGNANEWGHRARREGYRVDNTPTIGSITWSTAGTYGHVAWVSNVMGDQIEIEEYNYGYTESYNKRVIKANTM
TGFIHFKDLDGGSVGNSQSSTSTGGTHYFKTKSAIKTEPLASGTVIDYYYPGEKVHYDQILEKDGYKWLSYTAYNGSYRYVQ■
EAVNKNPLGNSVLSSTGGTHYFKTKSAIKTEPLVSATVIDYYYPGEKVHYDQILEKDGYKWLSYTAYNGSRRYIQLEGVTSSQ
NYQNQSGNISSYGSHSSSTVGWKKINGSWYHFKSNGSKSTGWLKDGSSWYYLKLSGEMQTGWLKENGLWYYLGSSGAMKTGWY
QVSGKWYYSYSSGALAVNTTVDGYRVNSDGERV
 
SeqID 242
MKVIFLADVKGKGKKGEIKEVPTGYAQNFLIKKNLAKEATAQAVGELRGKQKSEEKAHAEMIAEGKAIKAQLEAEETVVEFV■
KVGPDGRTFGSITNKKIAEELQKQFGIKIDKRHIQVQAPIRAVGLIDVPVKIYQDITSVINLRVKEG
 
SeqID 243
MKKKILASLLLSTVMVSQVAVLTTAHAETTDDKIAAQDNKISNLTAQQQEAQKQVDQIQEQVSAIQAEQSNLQAENDRLQAES
KKLEGEITELSKNIVSRNQSLEKQARSAQTNGAVTSYINTIVNSKSITEAISRVAAMSEIVSANNKMLEQQKADKKAISEKQV
ANNDAINTVIANQQKLADDAQALTTKQAELKAAELSLAAEKATAEGEKASLLEQKAAAEAEARAAAVAEAAYKEKRASQQQSV
LASANTNLTAQVQAVSESAAAPVRAKVRPTYSTNASSYPIGECTWGVKTLAPWAGDYWGNGAQWATSAAAAGFRTGSTPQVGA
IACWNDGGYGHVAVVTAVESTTRIQVSESNYAGNRTIGNHRGWFNPTTTSEGFVTYIYAD
 
SeqID 244
MVKRRIRRGTREPEKVVVPEQSSIPSYPVSVTSNQGTDVAVEPAKAVAPTTDWKQENGMWYFYNTDGSMATGWVQVNSSWYY■
NSNGSMKVNQWFQVGGKWYYVNTSGELAVNTSIDGYRVNDNGEWVR
 
SeqID 245
ELRRLSRLVDQELYFGCGWRLSLEWLPSMRKDSWPSNTAPRTTMVQ
 
SeqID 246
DCIRKQPFTRDEPNKTCRKTKPSKSYCSYRW
 
SeqID 247
GQRNPRRIERVIRMAETKPRISKKEG
 
SeqID 248
QRKLFKIFHLFQKKSGWNQKSSCLKLNLNSLNRKMTQMTKMFRSIFQPKKPLNTNFQAYNSLHQINQKISLKRRKLSEKISKS
 
SeqID 249
LVIIVLKIQSKSETDFIFKTWPFILLSKIIPLMVLDCQVSISWTNRETVAYSKLLAIKTLKGDYHDGQSKKIRLSHASRVRT■
SWYPHDMADSTRIMAFSRKGC
 
SeqID 250
ERLPAFPRSLSGRKLDQGGTKEKGSDGRSP
 
SeqID 251
RNCLSTWKSSSNYHTEIKRGTVRQCLGKGRFKEVYSADYAQQSYENNRKRSVKKSSLTKELKEKILHYHNQKFSPEMMVMAK■
VNVGISTIYYWIHHGKLGLSKQDLLYPRKGKALKKQASTNFKPAGQSIEQRPEAINLRLENGHYEIDTVLLTRSKNYCLIVLT
DRKSRHQIIRLIPNKSAEVVNQALKLILKQHKILSITADNGTEFNRLFDIFSEEHIYYAHPYASWERGTNENHNRLIRR
SeqID 252
PVMTISSPTMKNMDLSTKASPSQPLQGKHGMIWSGK
 
SeqID 253
TSSIRIHTRKSSPNWTTTPHLALSAETN
 
SeqID 254
YFLPHKYARESLSLPSTNKILHRKQGS
 
SeqID 255
AAFKKDQINERVEKLGKLKPITINYNGKSEVIDSKEKLQELMNKAVKDEVAQI
 
SeqID 256
AYAHSKRSAGSGRAGGRQCLCQCQNKCRRDFKY
 
SeqID 257
HGRPYHKPHQPHHHGFPQQSYNLLPPKHKPTLCVRR
 
SeqID 258
KGKILLLPRLTTQRWQRKIRPDSRKSANNKANLDFHNSRCKSSLSDEAPNLHKNPALLVHSLSRVIAVLLELSPLQAYSIVK■
SPKEDDLIHDDAILVRFGILEVHDSPYELLLLYHTHSYRFSCSIYLS
 
SeqID 259
FTVSHVFLLYLSFNPRPKSMSLSFTSSKLLRPRFRTFIISASDFSVKSCTVLIPARFKQLYERTDKSSSSIVRSKIRSSDSVS
ASFITSVDLAISVRFVNKSRCSVKIRAESPKASSGIIVPFVKISRVNLSKPSLLPTRAGST
 
SeqID 260
LVCMKNKGCYKERNNCCH
 
SeqID 261
FHYLSKYFLVSAITTGDKTKRAIKFGRAIKALTISAIIQTISNSINPPNKTMSTKTTR
 
SeqID 262
GKKVFIKYPLSRVSSKTGPMITGRTKDKIVDKKVGCPFEKSTVKYSS
 
SeqID 263
SSPVFPKLVMVSGANKPRERRNFPFSSKMSFHLTFVL
 
SeqID 264
YLTSFSVPKIASSKVKLTRYWRSSPWRGAFGLREEPPPPKKLEKISSKPPKPPAPLKPPKPPAPPKPPLAPAAPYWS
 
SeqID 265
QSWRPIPDSKCYTQEKLTIPIKRRKDIKDFYHNSIQRHKNSHKSHLLDSYRLIITRLAEIVHENKILIVLILYVTNIPSRSR■
YEVNRV
 
SeqID 266
LFRFYRVIVLYRGWHIYLLILVNLQYVQNVFRKDRFLVRGAQPFFHGERSAGHLVLPYVL
 
SeqID 267
ITHPPLNPEHFVSRVFSSLGLKSYQPKDDRFLRKPSDSRHPESGNSGKWQVLNSPLVIVK
 
SeqID 268
TLAKAVGLMYSPPIPPKPFLGRITTDSSSI
 
SeqID 269
PGSPFSEISGAGFFGVAKRIFPRPPRPPWATINSCPCSIKSVKTLPVSASRTVVPCGTRTLRSSAPRPCIPLVIPFSPESAL■
 
SeqID 270
INSLTLATSLSKRRAPRKASKASPRMVSRLRPPDFSSPLPNLINWSNWQSRAKPAKLSSRTIIARSFDRSPSGFLGYFLYRY■
EINNCRTASPKNSKRSLCEIFKRRCSLA
 
SeqID 271
PIGKRNCKAECQSHHLLEKQKTFQSRKTKRYGASPEPRYRESRKPRLSQ
 
SeqID 272
QPLGHSKAEEHETICSHTFDNHTTETIPNQVKGRDMTSSETLPFPSKNQNQGKAKQIP
SeqID 273
PCSLPDYGLVGSGYHSCHYQSNDTRFLESHGNWRTLLYSWSWILCQEKTLFPHDLASLYPSCVRTSIHRYCLLHVKKLRNSIS
TFFFTHIDKVLVQAHIISQFWMKRTYQHIFFLGCNNLIVHCC
 
SeqID 274
RVKDNHLDKLVKALLKRRSSTQYYIHQLLRKMIRLYGHQQLHNNSEILVYSDYGHVDLLLLETNKIPVY
 
SeqID 275
QVIKIDIATTNKTESVKSQSEREKKRLTSSNILKVRGRPI
 
SeqID 276
AFKSSKVPSLDPSSTKTYSISVSKSGSKASRA
 
SeqID 277
DKTDPLARKLPDKSKPSTSFCTKSLSPVNMASLTSAKPSKTKASLGICSPADKRMTSPSTNSSGLRATS
 
SeqID 278
LCRLQTQARPRGSVTNLTKQNKVYRYLNYLRQTQLSAM
 
SeqID 279
CIQSIGNEGQCKGNSCYVGKEIHLAPISDIVGHKGKEEGDDGNDDGRQFYLFLAHLVGSAFLRSFPLLYSKGINEEGDGIGND
GRLISKDIINSTGQNGINNTKVISPFA
 
SeqID 280
TSTKLVIDTTTFMTFCTNNTKSSKFTNTFTKLDVGTTTRHVGCDGNGTTLTSIHDDLGFSIVVFGIQDFVRNTSCNQFLRNVV
TSFNRYCTNQDRLTLLVTSLNVFDNRFKLRFDTCIKKV
 
SeqID 281
ISTGVPTCSMYPLLKTAILSDKVKASS
 
SeqID 282
LSTMSSIKSILCSLPTHTIFSKSAISPKRGSTAI
 
SeqID 283
SCSYSSTNSKACSIVGLSKPTIFICVTPISAAKAISSASRPANSSTFKCVCVSKIISSNLVFYLLLYQKRGGAPNFSVSPPLF
NRELFCYLFYPILPISYSTVRDRRDWLH
 
SeqID 284
VTSCIVPAVACGALVVLGAALGATGLLGTVTMAMACTPIVSASFTSSIVFAFSISLRAACFSASTLAKSSAFSLSESGAPLIS
SCLSLAAFSMAFLADSFSVANCLEACD
 
SeqID 285
YSPFNHSILIRKTTKIINPNPKAPRMNWRSKVWSNQPVNISTNHTKSDRPIKK
 
SeqID 286
DYFKFRTTFTRFSTVKPYSANTFGAGAEAPKVSIPRTAPSRPTYLYQF
 
SeqID 287
RGRRGLCVARIKAPRLVIKPKRTIDPPTKDRYSPPLSATSLSVPKSPIISFPAKMDKNPKRKLNSKVIFNASVT
 
SeqID 288
TPPYTKIPAKTAIIPFISAQDFNQAQRLSG
 
SeqID 289
ATGAAGAAAAAAATCTTAGCGTCACTTTTATTAAGTACAGTAATGGTTTCTCAAGTAGCTGTTTTAACAACTGCGCATGCAGA
AACGACTGATGACAAAATTGCTGCTCAAGATAATAAAATTAGTAACTTAACAGCACAACAACAAGAAGCCCAAAAACAAGTTG
ACCAAATTCAGGAGCAAGTATCAGCTATTCAAGCTGAGCAGTCTAACTTGCAAGCTGAAAATGATAGATTACAAGCAGAATCT
AAGAAACTCGAGGGTGAGATTACAGAACTTTCTAAAAACATTGTTTCTCGTAACCAATCGTTGGAAAAACAAGCTCGTAGTGC
TCAAACAAATGGAGCCGTAACTAGCTATATCAATACCATTGTAAACTCAAAATCAATTACAGAAGCTATTTCACGTGTTGCTG
CAATGAGTGAAATCGTATCTGCAAACAACAAAATGTTAGAACAACAAAAGGCAGATAAAAAAGCTATTTCTGAAAAACAAGTA
GCAAATAATGATGCTATCAATACTGTAATTGCTAATCAACAAAAATTGGCTGATGATGCTCAAGCATTGACTACGAAACAGGC
AGAACTAAAAGCTGCTGAATTAAGTCTTGCTGCTGAGAAAGCGACAGCTGAAGGGGAAAAAGCAAGTCTATTAGAGCAAAAAG
CAGCAGCTGAGGCAGAGGCTCGTGCAGCTGCGGTAGCAGAAGCAGCTTATAAAGAAAAACGAGCTAGCCAACAACAATCAGTA
CTTGCTTCAGCAAACACTAACTTAACAGCTCAAGTGCAAGCAGTATCTGAATCTGCAGCAGCACCTGTCCGTGCAAAAGTTCG
TCCAACATACAGTACAAACGCTTCAAGTTATCCAATTGGAGAATGTACATGGGGAGTAAAAACATTGGCACCTTGGGCTGGAG
ACTACTGGGGTAATGGAGCACAGTGGGCTACAAGTGCAGCAGCAGCAGGTTTCCGTACAGGTTCAACACCTCAAGTTGGAGCA
ATTGCATGTTGGAATGATGGTGGATATGGTCACGTAGCGGTTGTTACAGCTGTTGAATCAACAACACGTATCCAAGTATCAGA
ATCAAATTATGCAGGTAATCGTACAATTGGAAATCACCGTGGATGGTTCAATCCAACAACAACTCCTGAAGGTTTTGTTACAT
ATATTTATGCAGAT
 
SeqID 290
ATGAAGAAAAAAATCTTAGCGTCACTTTTATTAAGTACAGTAATGGTTTCTCAAGTAGCTGTTTTAACAACTGCGCATGCAGA
AACGACTGATGACAAAATTGCTGCTCAAGATAATAAAATTAGTAACTTAACAGCACAACAACAAGAAGCCCAAAAACAAGTTG
ACCAAATTCAGGAGCAAGTATCAGCTATTCAAGCTGAGCAGTCTAACTTGCAAGCTGAAAATGATAGATTACAAGCAGAATCT
AAGAAACTCGAGGGTGAGATTACAGAACTTTCTAAAAACATTGTTTCTCGTAACCAATCGTTGGAAAAACAAGCTCGTAGTGC
TCAAACAAATGGAGCCGTAACTAGCTATATCAATACCATTGTAAACTCAAAATCAATTACAGAAGCTATTTCACGTGTTGCTG
CAATGAGTGAAATCGTATCTGCAAACAACAAAATGTTAGAACAACAAAAGGCAGATAAAAAAGCTATTTCTGAAAAACAAGTA
GCAAATAATGATGCTATCAATACTGTAATTGCTAATCAACAAAAATTGGCTGATGATGCTCAAGCATTGACTACGAAACAGGC
AGAACTAAAAGCTGCTGAATTAAGTCTTGCTGCTGAGAAAGCGACAGCTGAAGGGGAAAAAGCAAGTCTATTAGAGCAAAAAG
CAGCAGCTGAGGCAGAGGCTCGTGCAGCTGCGGTAGCAGAAGCAGCTTATAAAGAAAAACGAGCTGGCCAACAACAATCAGTA
CTTGCTTCAGCAAACACTAACTTAACAGCTCAAGTGCAAGCAGTATCTGAATCTGCAGCAGCACCTGTCCGTGCAAAAGTTCG
TCCAACATACAGTACAAACGCTTCAAGTTATCCAATTGGAGAATGTACATGGGGAGTAAAAACATTGGCACCTTGGGCTGGAG
ACTACTGGGGTAATGGAGCACAGTGGGCTACAAGTGCAGCAGCAGCAGGTTTCCGTACAGGTTCAACACCTCAAGTTGGAGCA
ATTGCATGTTGGAATGATGGTGGATATGGTCACGTAGCGGTTGTTACAGCTGTTGAATCAACAACACGTATCCAAGTATCAGA
ATCAAATTATGCAGGTAATCGTACAATTGGAAATCACCGTGGATGGTTCAATCCAACAACAACTTCTGAAGGTTTTGTTACAT
ATATTTATGCAGAT
 
SeqID 291
ATGATCCAAATCGGCAAGATTTTTGCCGGACGCTATCGGATTGTCAAACAGATTGGTCGAGGAGGTATGGCGGATGTCTACCT
AGCCAAAGACTTAATCTTAGATGGGGAAGAAGTGGCAGTGAAGGTTCTGAGGACCAACTACCAGACGGACCCGATAGCTGTAG
CTCGTTTTCAGCGTGAAGCGAGAGCTATGGCAGATCTAGACCATCCTCATATCGTTCGGATAACAGATATTGGCGAGGAAGAC
GGTCAACAGTACCTAGCTATGGAGTATGTGGCTGGACTGGACCTCAAACGCTATATCAAGGAACATTATCCTCTTTCTAATGA
AGAAGCAGCCCGTATCATGGGACAAATTCTCTTGGCTATGCGCTTGGCCCATACTCGAGGAATTGTTCACAGGGACTTGAAAC
CTCAAAATATCCTCTTGACACCAGATGGGACTGCCAAGGTCACAGACTTTGGGATTGCTGTAGCCTTTGCAGAGACAAGTCTG
ACCCAGACTAACTCGATGTTGGGCTCAGTTCATTACTTGTCACCAGAGCAGGCGGGTGGTTCGAAGGCGACTGTGCAGAGTGA
TATCTATGCCATGGGGATTATTTTCTATGAGATGCTGACAGGCCATATCCCTTATGACGGGGATAGCGCGGTGACCATTGCCC
TCCAGCATTTCCAGAAACCCCTGCCGTCCGTTATTGCAGAAAATCCATCTGTACCTCAGGCTTTAGAAAATGTTATTATCAAG
GCAACTGCTAAAAAGTTGACCAATCGCTACCGCTCGGTTTCAGAGATGTATGTGGACTTGTCTAGTAGCTTGTCCTACAATCG
TAGAAATGAAAGTAAGTTAATCTTTGATGAAACGAGCAAGGCAGATACCAAGACCTTGCCGAAGGTTTCTCAGAGTACCTTGA
CATCTATTCCTAAGGTTCAAGCGCAAACAGAACACAAATCAATCAAAAACCCAAGCCAGGCTGTGACAGAGGAAACTTACCAA
CCACAAGCACCGAAAAAACATAGATTTAAGATGCGTTACCTGATTTTGTTGGCCAGCCTTGTATTGGTGGCAGCTTCTCTTAT
TTGGATACTATCCAGAACTCCTGCAACCATTGCCATTCCAGATGTGGCAGGTCAGACAGTTGCAGAGGCCAAGGCAACGCTCA
AAAAAGCCAATTTTGAGATTGGTGAGGAGAAGACAGAGGCTAGTGAAAAGGTGGAAGAAGGGCGGATTATCCGTACAGATCCT
GGCGCTGGAACTGGTCGAAAAGAAGGAACGAAAATCAATTTGGTTGTCTCATCAGGCAAGCAATCTTTCCAAATTAGTAATTA
TGTCGGTCGGAAATCCTCTGATGTCATTGCGGAATTAAAAGAGAAAAAAGTTCCAGATAATTTGATTAAAATTGAGGAAGAAG
AGTCGAATGAGAGTGAGGCTGGAACGGTCCTGAAGCAAAGTCTACCAGAAGGTACGACCTATGACTTGAGCAAGGCAACTCAA
ATTGTCTTGACAGTAGCTAAAAAAGTTACAAGTGTTGCCATGCCGAGTTACATTGGTTCTAGCTTGGAGTTTACTAAGAACAA
TTTGATTCAAATTGTTGGGATTAAGGAAGCTAATATAGAAGTTGTAGAAGTGACGACAGCGCCTGCAGGTAGTGCAGAAGGCA
TGGTTGTTGAACAAAGTCCTAGAGCAGGTGAAAAGGTAGACCTCAATAAGACTAGAGTCAAGATTTCAATCTACAAACCTAAA
ACAACTTCAGCTACTCCT
 
SeqID 292
ATGATCCAAATCGGCAAGATTTTTGCCGGACGCTATCGGATTGTCAAACAGATTGGTCGAGGAGGCATGGCGGATGTCTACCT
AGCCAAAGACTTAATCTTAGATGGGGAAGAAGTGGCAGTGAAGGTTCTGAGGACCAACTACCAGACGGACCCGATAGCTGTAG
CTCGTTTTCAGCGTGAAGCGAGAGCTATGGCAGATCTAGACCATCCTCATATCGTTCGGATAACAGATATTGGTGAGGAAGAC
GGTCAACAGTATCTTGCAATGGAGTATGTTGCTGGACTAGACCTCAAACGCTATATCAAGGAACATTATCCTCTTTCTAATGA
AGAAGCAGTCCGTATCATGGGACAAATTCTCTTGGCTATGCGCTTGGCCCATACTCGAGGAATTGTTCACAGGGACTTGAAAC
CTCAAAATATCCTTTTGACACCAGATGGGACGGCCAAGGTCACAGACTTTGGGATTGCTGTAGCCTTTGCAGAGACAAGTCTG
ACCCAGACTAACTCGATGTTGGGCTCAGTTCATTACTTGTCACCAGAGCAGGCGCGTGGTTCGAAGGCGACTGTGCAGAGTGA
TATCTATGCCATGGGGATTATTTTCTATGAGATGTTGACAGGCCATATCCCTTATGACGGGGATAGCGCGGTGACCATTGCCC
TCCAGCATTTCCAGAAACCCCTGCCGTCCGTTATTGCAGAAAATCCATCTGTACCTCAGGCTTTAGAAAATGTTATTATCAAG
GCAACTGCTAAAAAGTTGACCAATCGCTACCGCTCGGTTTCAGAGATGTATGTGGACTTGTCTAGTAGCTTGTCCTACAATCG
TAGAAATGAAAGTAAGTTAATCTTTGATGAAACGAGCAAGGCAGATACCAAGACCTTGCCGAAGGTTTCTCAGAGTACCTTGA
CATCTATTCCTAAGGTTCAAGCGCAGACAGAACACAAATCAATCAAAAACCCAAGCCAGGCTGTGACAGAGGAAACTTACCAA
CCACAAGCACCGAAAAAACATAGATTTAAGATGCGTTACCTGATTTTGTTGGCCAGCCTTGTATTGGTGGCAGCTTCTCTTAT
TTGGATACTATCCAGAACTCCTGCAACCATTGCCATTCCAGATGTGGCAGGTCAGACAGTTGCAGAGGCCAAGGCAACGCTCA
AAAAAGCCAATTTTGAGATTGGTGAGGAGAAGACAGAGGCTAGTGAAAAGGTGGAAGAAGGGCGGATTATCCGTACAGATCCT
GGCGCTGGAACTGGTCGAAAAGAAGGAACGAAAATCAATTTGGTTGTCTCATCAGGCAAACAATCCTTCCAAATTAGTAATTA
TGTCGGCCGGAAATCTTCTGATGTTATCGCGGAATTAAAAGAGAAAAAAGTTCCAGATAATTTGATTAAAATTGAGGAAGAAG
AGTCGAATGAGAGTGAGGCTGGAACGGTCCTGAAGCAAAGTCTACCAGAAGGTACGACCTATGACTTGAGCAAGGCAACTCAA
ATTGTTTTGACAGTAGCTAAAAAAGCTACGACGATTCAATTAGGGAACTATATTGGACGGAACTCTACAGAAGTAATCTCAGA
ACTCAAGCAGAAGAAGGTTCCTGAGAATTTGATTAAGATAGAGGAAGAAGAGTCCAGCGAAAGCGAACCAGGAACGATTATGA
AACAAAGTCCAGGTGCCGGAACGACTTATGATGTGAGTAAACCTACTCAAATTGTCTTGACAGTAGCTAAAAAAGTTACAAGT
GTTGCCATGCCGAGTTACATTGGTTCCAGCTTGGAGTTTACTAAGAACAATTTGATTCAAATTGTTGGGATTAAGGAAGCTAA
TATAGAAGTTGTAGAAGTGACGACAGCGCCTGCAGGTAGTGTAGAAGGCATGGTTGTTGAACAAAGTCCTAGAGCAGGTGAAA
AGGTAGACCTAAATAAGACTAGAGTCAAGATTTCAATCTACAAACCTAAAACAACTTCAGCTACTCCT
 
SeqID 293
ATGATCCAAATCGGCAAGATTTTTGCCGGACGCTATCGGATTGTCAAACAGATTGGTCGAGGAGGTATGGCGGATGTCTACCT
AGCCAAAGACTTAATCTTAGATGGGGAAGAAGTGGCAGTGAAGGTTCTGAGGACCAACTACCAGACGGACCCGATAGCTGTAG
CTCGTTTTCAGCGTGAAGCGAGAGCTATGGCAGATCTAGACCATCCTCATATCGTTCGGATAACAGATATTGGTGAGGAAGAC
GGTCAACAGTATCTTGCAATGGAGTATGTTGCTGGACTAGACCTCAAACGCTATATCAAGGAACATTATCCTCTTTCTAATGA
AGAAGCAGTCCGTATCATGGGACAAATCCTCCTAGCCATGCGTTTGGCCCATACCAGAGGAATTGTTCACAGGGACTTGAAAC
CTCAAAATATCCTTTTGACACCAGATGGGACTGCCAAGGTCACAGACTTTGGGATTGCTGTAGCCTTTGCAGAGACAAGTCTG
ACCCAGACTAACTCGATGTTGGGCTCAGTTCATTACTTGTCCCCAGAGCAGGCGCGTGGTTCGAAGGCGACTGTGCAGAGTGA
TATCTATGCTATGGGGATTATTTTCTATGAGATGTTGACAGGCCATATCCCTTATGACGGGGATAGCGCGGTGACCATTGCCC
TCCAGCATTTCCAGAAACCCCTGCCGTCCGTTATTGCAGAAAATCCATCTGTACCTCAGGCTTTAGAAAATGTTATTATCAAG
GCAACTGCTAAAAAGTTGACCAATCGCTACCGCTCGGTTTCAGAGATGTATGTGGACTTGTCTAGTAGCTTGTCCTACAATCG
TAGAAATGAAAGTAAGTTAATCTTTGATGAAACGAGCAAGGCAGATACCAAGACCTTGCCGAAGGTTTCTCAGAGTACCTTGA
CATCTATTCCTAAGGTTCAAGCGCAGACAGAACACAAATCAATCAAAAACCCAAGCCGGGCTGTGACAGAGGAAACTTACCAA
CCACAAGCACCGAAAAAACATAGATTTAAGATGCGTTACCTGATTTTGTTGGCCAGCCTTGTATTGGTGGCAGCTTCTCTTAT
TTGGATACTATCCAGAACTCCTGCAACCATTGCCATTCCAGATGTGGCAGGTCAGACAGTTGCAGAGGCCAAGGCAACGCTCA
AAAAAGCCAATTTTGAGATTGGTGAGGAGAAGACAGAGGCTAGTGAAAAGGTGGAAGAAGGGCGGATTATCCGTACAGATCCT
GGCGCTGGAACTGGTCGAAAAGAAGGAACGAAAATCAATCTGGTTGTCTCATCAGGCAAACAATCCTTCCAAATTAGTAATTA
TGTCGGCCGGAAATCTTCTGATGTTATCGCGGAATTAAAAGAGAAAAAAGTTCCAGATAATTTGATTAAAATTGAGGAAGAAG
AGTCGAATGAGAGTGAGGCTGGAACGGTCCTGAAGCAAAGTCTACCAGAAGGTACGACCTATGACTTGAGCAAGGCAACTCAA
ATTGTTTTGACAGTAGCTAAAAAAGCTACGACGATTCAATTAGGGAACTATATTGGACGGAACTCTACAGAAGTAATCTCAGA
ACTCAAGCAGAAGAAGGTTCCTGAGAATTTGATTAAGATAGAGGAAGAAGAGTCCAGCGAAAGCGAACCAGGAACGATTATGA
AACAAAGTCCAGGTGCCGGAACGACTTATGATGTGAGTAAACCTACTCAAATTGTCTTGACAGTAGCTAAAAAAGTTACAAGT
GTTGCCATGCCGAGTTACATTGGTTCCAGCTTGGAGTTTACTAAGAACAATTTGATTCAAATTGTTGGGATTAAGGAAGCTAA
TATAGAAGTTGTAGAAGTGACGACAGCGCCTGCAGGTAGTGCAGAAGGCATGGTTGTTGAACAAAGTCCTAGAGCAGGTGAAA
AGGTAGACCTCAATAAGACTAGAGTCAAGACTTCAATCTACAAACCTAAAACAACTTCAGCTACTCCT
 
SeqID 294
ATGATCCAAATCGGCAAGATTTTTGCCGGACGCTATCGGATTGTCAAACAGATTGGTCGAGGAGGCATGGCGGATGTCTACCT
AGCCAAAGACTTAATCTTAGATGGGGAAGAAGTGGCAGTGAAGGTTCTGAGGACCAACTACCAGACGGACCCGATAGCTGTA■
CTCGTTTTCAGCGTGAAGCGAGAGCTATGGCAGATCTAGACCATCCTCATATCGTTCGGATAACAGATATTGGTGAGGAAGA■
GGTCAACAGTATCTTGCAATGGAGTATGTTGCTGGACTAGACCTCAAACGCTATATCAAGGAACATTATCCTCTTTCTAATGA
AGAAGCAGTCCGTATCATGGGACAAATTCTCTTGGCTATGCGCTTGGCCCATACTCGAGGAATTGTTCACAGGGACTTGAAA■
CTCAAAATATCCTTTTGACACCAGATGGGACGGCCAAGGTCACAGACTTTGGGATTGCTGTAGCCTTTGCAGAGACAAGTCT■
ACCCAGACTAACTCGATGTTGGGCTCAGTTCATTACTTGTCACCAGAGCAGGCGCGTGGTTCGAAGGCGACTGTGCAGAGTGA
TATCTATGCCATGGGGATTATTTTCTATGAGATGTTGACAGGCCATATCCCTTATGACGGGGATAGCGCGGTGACCATTGCC■
TCCAGCATTTCCAGAAACCCCTGCCGTCCGTTATTGCAGAAAATCCATCTGTACCTCAGGCTTTAGAAAATGTTATTATCAG■
GCAACTGCTAAAAAGTTGACCAATCGCTATCGCTCGGTTTCAGAGATGTATGTAGACTTGTCTAGTAGCTTGTCCTACAATC■
TAGAAATGAAAGTAAGTTAATCTTTGATGAAACGAGCAAGGCAGATACCAAGACCTTGCCGAAGGTTTCTCAGAGTACCTTGA
CATCTATTCCTAAGGTTCAAGCGCAGACAGGACACAAATCAATCAAAAACCCAAGCCAGGCTGTGACAGAGGAAACTTACCAA
CCACAAGCACCGAAAAAACATAGATTTAAGATGCGTTACCTGATTTTGTTGGCCAGCCTTGTATTGGTGGCAGCTTCTCTTAT
TTGGATACTATCCAGAACTCCTGCAACCATTGCCATTCCAGATGTGGCAGGTCAGACAGTTGCAGAGGCCAAGGCAACGCTCA
AAAAAGCCAATTTTGAGATTGGTGAGGAGAAGACAGAGGCTAGTGAAAAGGTGGAAGAAGGGCGGATTATCCGTACAGATCCT
GGCGCTGGAACTGGTCGAAAAGAAGGAACGAAAATTAATCTGGTTGTCTCATCAGGCAAACAATCCTTCCAAATTAGTAATTA
TGTCGGCCGGAAATCTTCTGATGTTATCGCGGAATTAAAAGAGAAAAAAGTTCCAGATAATTTGATTAAAATTGAGGAAGAA■
AGTCGAATGAGAGTGAGGCTGGAACGGTCCTGAAGCAAAGTCTACCAGAAGGTACGACCTATGACTTGAGCAAGGCAACTCAA
ATTATTTTGACAGTAGCTAAAAAAGCTACGACGATTCAATTAGGGAACTATATTGGACGGAACTCTACAGAAGTAATCTCAGA
ACTCAAGCAGAAGAAGGTTCCTGAGAATTTGATTAAGATAGAGGAAGAAGAGTCCAGCGAAAGCGAACCAGGAACGATTATGA
AACAAAGTCCAGGTGCCGGAACGACTTATGATGTGAGTAAACCTACTCAAATTGTCTTGACAGTAGCTAAAAAAGTTACAAGT
GTTGCCATGCCGAGTTACATTGGTTCCAGCTTGGAGTTTACTAAGAACAATTTGATTCAAATTGTTGGGATTAAGGAAGCTAA
TATAGAAGTTGTAGAAGTGACGACAGCGCCTGCAGGTAGTGCAGAAGGCATGGTTGTTGAACAAAGTCCTAGAGCAGGTGAAA
AGGTAGACCTAAATAAGACTAGAGTCAAGATTTCAATCTACAAACCTAAAACAACTTCAGCTACTCCT
 
SeqID 295
ATGATCCAAATCGGCAAGATTTTTGCCGGACGCTATCGGATTGTCAAACAGATTGGTCGAGGAGGCATGGCGGATGTCTACC■
AGCCAAAGACTTAATCTTAGATGGGGAAGAAGTGGCAGTGAAGGTTCTGAGGACCAACTACCAGACGGACCCGATAGCTGTA■
CTCGTTTTCAGCGTGAAGCGAGAGCTATGGCAGATCTAGACCATCCTCATATCGTTCGGATAACAGATATTGGTGAGGAAGA■
GGTCAACAGTATCTTGCAATGGAGTATGTTGCTGGACTAGACCTCAAACGCTATATCAAGGAACATTATCCTCTTTCTAATGA
AGAAGCAGTCCGTATCATGGGACAAATTCTCTTGGCTATGCGCTTGGCCCATACTCGAGGAATTGTTCACAGGGACTTGAAA■
CTCAAAATATCCTTTTGACACCAGATGGGACTGCCAAGGTCACAGACTTTGGGATTGCTGTAGCCTTTGCAGAGACAAGTCT■
ACCCAGACTAACTCGATGTTGGGCTCAGTTCATTACTTGTCACCAGAGCAGGCGCGTGGTTCGAAGGCGACTGTGCAGAGTGA
TATCTATGCCATGGGGATTATTTTCTATGAGATGTTGACAGGCCATATCCCTTATGACGGGGATAGCGCGGTGACCATTGCC■
TCCAGCATTTCCAGAACCCCCTGCCGTCCGTTATTGCAGAAAATTCATCTGTACCTCAGGCTTTAGAAAATGTTATTATCAA■
GCAACTGCTAAAAAGTTGACCAATCGCTATCGCTCGGTTTCAGAGATGTATGTAGACTTGTCTAGTAGCTTGTCCTACAATC■
TAGAAATGAAAGTAAGTTAATCTTTGATGAAACGAGCAAGGCAGATACCAAGACCTTGCCGAAGGTTTCTCAGAGTACCTTGA
CATCTATTCCTAAGGTTCAAGCGCAGACAGAACACAAATCAATCAAAAACCCAAGCCAGGCTGTGACAGAGGAAACTTACCAA
CCACAAGCACCGAAAAAACATAGATTTAAGATGCGTTACCTGATTTTGTTGGCCAGCCTTGTATTGGTGGCAGCTTCTCTTAT
TTGGATACTATCCAGAACTCCTGCAACCATTGCCATTCCAGATGTGGCAGGTCAGACAGTTGCAGAGGCCAAGGCAACGCTCA
AAAAAGCCAATTTTGAGATTGGTGAGGAGAAGACAGAGGCTAGTGAAAAGGTGGAAGAAGGGCGGATTATCCGTACAGATCCT
GGCGCTGGAACTGGTCGAAAAGAAGGAACGAAAATTAATCTGGTTGTCTCATCAGGCAAACAATCCTTCCAAATTAGTAATTA
TGTCGGCCGGAAATCTTCTGATGTTATCGCGGAATTAAAAGAGAAAAAAGTTCCAGATAATTTGATTAAAATTGAGGAAGAAG
AGTCGAATGAAAGTGAGGCTGGAACGGTCCTGAAGCAAAGTCTACCAGAAGGTACGACCTATGACTTGAGCAAGGCAACTCAA
ATTGTTTTGACAGTAGCTAAAAAAGCTACGACGATTCAATTAGGGAACTATATTGGACGGAACTCTACAGAAGTAATCTCAGA
ACTCAAGCAGAAGAAGGTTCCTGAGAATTTGATTAAGATAGAGGAAGAAGAGTCCAGCGAAAGCGAACCAGGAACGATTATGA
AACAAAGTCCAGGTGCCGGAACGACTTATGATGTGAGTAAACCTACTCAAATTGTCTTGACAGTAGCTAAAAAAGTTACAAGT
GTTGCCATGCCGAGTTACATTGGTTCCAGCTTGGAGTTTACTAAGAACAATTTGATTCAAATTGTTGGGATTAAGGAAGCTAA
TATAGAAGTTGTAGAAGTGACGACAGCGCCTGCAGGTAGTGTAGAAGGCATGGTTGTTGAACAAAGTCCTAGAGCAGGTGAAA
AGGTAGACCTAAATAAGACTAGAGTCAAGATTTCAATCTACAAACCTAAAACAACTTCAGCTACTCCTTAA
 
SeqID 296
ATGTTTGCATCAAAAAGCGAAAGAAAAGTACATTATTCAATTCGTAAATTTAGTATTGGAGTAGCTAGTGTAGCTGTTGCCAG
TCTTGTTATGGGAAGTGTGGTTCATGCGACAGAGAACGAGGGAAGTACCCAAGCAGCCACTTCTTCTAATATGGCAAAGACAG
AACATAGGAAAGCTGCTAAACAAGTCGTCGATGAATATATAGAAAAAATGTTGAGGGAGATTCAACTAGATAGAAGAAAACAT
ACCCAAAATGTCGCCTTAAACATAAAGTTGAGCGCAATTAAAACGAAGTATTTGCGTGAATTAAATGTTTTAGAAGAGAAGTC
GAAAGATGAGTTGCCGTCAGAAATAAAAGCAAAGTTAGACGCAGCTTTTGAGAAGTTTAAAAAAGATACATTGAAACCAGGAG
AAAAGGTAGCAGAAGCTAAGAAGAAGGTTGAAGAAGCTAAGAAAAAAGCCGAGGATCAAAAAGAAGAAGATCGTCGTAACTAC
CCAACCAATACTTACAAAACGCTTGAACTTGAAATTGCTGAGTTCGATGTGAAAGTTAAAGAAGCGGAGCTTGAACTAGTAAA
AGAGGAAGCTAAAGAATCTCGAAACGAGGGCACAATTAAGCAAGCAAAAGAGAAAGTTGAGAGTAAAAAAGCTGAGGCTACAA
GGTTAGAAAACATCAAGACAGATCGTAAAAAAGCAGAAGAAGAAGCTAAACGAAAAGCAGATGCTAAGTTGAAGGAAGCTAAT
GTAGCGACTTCAGATCAAGGTAAACCAAAGGGGCGGGCAAAACGAGGAGTTCCTGGAGAGCTAGCAACACCTGATAAAAAAGA
AAATGATGCGAAGTCTTCAGATTCTAGCGTAGGTGAAGAAACTCTTCCAAGCTCATCCCTGAAATCAGGAAAAAAGGTAGCAG
AAGCTGAGAAGAAGGTTGAAGAAGCTGAGAAAAAAGCCAAGGATCAAAAAGAAGAAGATCGCCGTAACTACCCAACCAATACT
TACAAAACGCTTGACCTTGAAATTGCTGAGTCCGATGTGAAAGTTAAAGAAGCGGAGCTTGAACTAGTAAAAGAGGAAGCTAA
GGAACCTCGAGACGAGGAAAAAATTAAGCAAGCAAAAGCGAAAGTTGAGAGTAAAAAAGCTGAGGCTACAAGGTTAGAAAACA
TCAAGACAGATCGTAAAAAAGCAGAAGAAGAAGCTAAACGAAAAGCAGCAGAAGAAGATAAAGTTAAAGAAAAACCAGCTGAA
CAACCACAACCAGCGCCGGCTACTCAACCAGAAAAACCAGCTCCAAAACCAGAGAAGCCAGCTGAACAACCAAAAGCAGAAAA
AACAGATGATCAACAAGCTGAAGAAGACTATGCTCGTAGATCAGAAGAAGAATATAATCGCTTGACTCAACAGCAACCGCCAA
AAACTGAAAAACCAGCACAACCATCTACTCCAAAAACAGGCTGGAAACAAGAAAACGGTATGTGGTACTTCTACAATACTGAT
GGTTCAATGGCAACAGGATGGCTCCAAAACAACGGTTCATGGTACTATCTAAACGCTAATGGTGCTATGGCGACAGGATGGCT
CCAAAACAATGGTTCATGGTACTATCTAAACGCTAATGGTTCAATGGCAACAGGATGGCTCCAAAACAATGGTTCATGGTACT
ACCTAAACGCTAATGGTGCTATGGCGACAGGATGGCTCCAATACAATGGTTCATGGTACTACCTAAACAGCAATGGCGCTAT■
GCGACAGGATGGCTCCAATACAATGGCTCATGGTACTACCTCAACGCTAATGGTGATATGGCGACAGGATGGCTCCAAAACAA
CGGTTCATGGTACTACCTCAACGCTAATGGTGATATGGCGACAGGATGGCTCCAATACAACGGTTCATGGTATTACCTCAAC■
CTAATGGTGATATGGCGACAGGTTGGGTGAAAGATGGAGATACCTGGTACTATCTTGAAGCATCAGGTGCTATGAAAGCAAG■
CAATGGTTCAAAGTATCAGATAAATGGTACTATGTCAATGGCTCAGGTGCCCTTGCAGTCAACACAACTGTAGATGGCTATG■
AGTCAATGCCAATGGTGAATGGGTAAACTAA
 
SeqID 297
ATGTTTGCATCAAAAAGCGAAAGAAAAGTACATTATTCAATTCGTAAATTTAGTGTTGGAGTAGCTAGTGTAGTTGTTGCCA■
TCTTGTTATGGGAAGTGTGGTTCATGCGACAGAGAACGAGGGAGCTACCCAAGTACCCACTTCTTCTAATAGGGCAAATGAAA
GTCAGGCAGAACAAGGAGAACAACCTAAAAAACTCGATTCAGAACGAGATAAGGCAAGGAAAGAGGTCGAGGAATATGTAAAA
AAAATAGTGGGTGAGAGCTATGCAAAATCAACTAAAAAGCGACATACAATTACTGTAGCTCTAGTTAACGAGTTGAACAACAT
TAAGAACGAGTATTTGAATAAAATAGTTGAATCAACCTCAGAAAGCCAACTACAGATACTGATGATGGAGAGTCGATCAAAA■
TAGATGAAGCTGTGTCTAAGTTTGAAAAGGACTCACCTTCTTCGTCAAGTTCAGACTCTTCCACTAAACCGGAAGXXXXXXXX
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXTTGCTGAGTCCGATGTGGAAGTTAAAAAAGCGGAGCTTGAACTAGTAAAA■
AGGAAGCTAAGGAACCTCGAAACGAGGAAAAAGTTAAGCAAGCAAAAGCGGAAGTTGAGAGTAAAAAAGCTGAGGCTACAAG■
TTAGAAAAAATCAAGACAGATCGTAAAAAAGCAGAAGAAGAAGCTAAACGAAAAGCAGCAGAAGAAGATAAAGTTAAAGAAAA
ACCAGCTGAACAACCACAACCAGCGCCGGCTCCAAAAGCAGAAAAACCAGCTCCAGCTCCAAAACCAGAGAATCCAGCTGAA■
AACCAAAAGCAGAAAAACCAGCTGATCAACAAGCTGAAGAAGACTATGCTCGTAGATCAGAAGAAGAATATAATCGCTTGACT
CAACAGCAACCGCCAAAAACTGAAAAACCAGCACAACCATCTACTCCAAAAACAGGCTGGAAACAAGAAAACGGTATGTGGTA
CTTCTACAATACTGATGGTTCAATGGCGACAGGATGGCTCCAAAACAATGGCTCATGGTACTACCTCAACAGCAATGGCGCTA
TGGCGACAGGATGGCTCCAAAACAATGGTTCATGGTACTATCTAAACGCTAATGGTTCAATGGCAACAGGATGGCTCCAAAA■
AATGGTTCATGGTACTACCTAAACGCTAATGGTTCAATGGCGACAGGATGGCTCCAATACAATGGCTCATGGTACTACCTAAA
CGCTAATGGTTCAATGGCGACAGGATGGCTCCAATACAATGGCTCATGGTACTACCTAAACGCTAATGGTGATATGGCGACA■
GTTGGGTGAAAGATGGAGATACCTGGTACTATCTTGAAGCATCAGGTGCTATGAAAGCAAGCCAATGGTTCAAAGTATCAGAT
AAATGGTACTATGTCAATGGCTCAGGTGCCCTTGCAGTCAACACAACTGTAGATGGCTATGGAGTCAATGCCAATGGTGAAT■
GGTAAAC
 
SeqID 298
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXCTTGAAATTGCTGAGTCCGATGTGGAAGTTAAAAAAGCGGAG■
TTGACTAGTAAAGAGGAAGCTAAGAAGCCTTTAAACGAGGGCACAATTAGGCAAGCAAAAGCGGAAGTTGAGAGTAAAAAAG■
TGAGGCTACAAGGTTAGAAAAAATCAAGACAGATCGTAAAAAAGCAGAAGAAGAAGCTAAACGAAGAGCAGCAGAAGAAGATA
AAGTTAAAGAAAAACCAGCTGAACAACCACAACCAGCGCCGGCCCCTCAACCAGAAAAACCAACTGAAGAGCCTGAGAATCC■
GTTCCAGCTCCAAAACCAGAGAAGCCAGCTGAACAACCAAAACCAGAGAAGCCAGCTGAACAACCAAAACCAGAGAAGCCAG■
TGAACAACCAAAAGCAGAAAAAACAGATGATCAACAAGCTGAAGAAGACTATGCTCGTAGATCAGAAGAAGAATATAATCGCT
TGACTCAACAGCAACCGCAAAAACCAGAGCAACCAGCTCCTGCACCAAAAATAGGCTGGAAACAAGAAAACGGTATGTGGTAC
TTCTACAATACTGATGGTTCAATGGCGACAGGATGGCTCCAATACAATGGCTCATGGTATTACCTAAACGCTAACGGTTCAAT
GGCAACAGGTTGGGTGAAAGATGGAGATACCTGGTACTATCTTGAAGCATCAGGTGCTATGAAAGCAAGCCAATGGTTCAAAG
TATCAGATAAATGGTACTATGTCAATGGCTCAGGTGCCCTTGCAGTCAACACAACTGTAGATGGCTATGGAGTCAATGCCAAT
GGTGAATGGGTAAAC
 
SeqID 299
ATGTTTGCATCAAAAAGCGAAAGAAAAGTACATTATTCAATTCGTAAATTTAGTGTTGGAGTAGCTAGTGTAGCTGTTGCCAG
TCTTGTTATGGGAAGTGTGGTTCATGCGACAGAGAACGAGAGAACTACCCAAGTACCCACTTCTTCTAATAGGGGAAAGCCAG
AACGTAGGAAAGCTGCTGAACAATTCGATGAATATATAAACAAAATGATCCAATTAGATAAAAGAAAACATACCCAAAATTTA
GCCTTCAACATACAGTTGAGCAGAATTAAAACGGAGTATTTGAATGGATTAAAAGAGAAGTCGGAAGCTGAGTTGCCGTCAAA
AATAAAAGCAGAGTTAGACGCAGCTTTTAAGCAGTTTAAAAAAGATACATTACCAACAGAACCAGAAAAAAAAGTAGCAGAAG
CTGAGAAGAAGGTTGAAGAAGCTGAGAAGAAGGTAGCAGAAGCTAAGAAAAAAGCCAAGGCTCAAAAAGAAGAAGATCACCGT
AACTACCCAACCATTACTTACAAAACGCTTGACCTTGAAATTGCTGAGTTCGATGTGAAAGTTAAAGAAGCGGAGCTTGAACT
AGTAAAAAAGGAAGCTGACGAATCTCGAAACGAGGGCACAATTAACCAAGCAAAAGCGAAAGTTGAGAGTGAAAAAGCTGAGG
CTACAAGGTTAAAAAAAATCAAGACAGATCGTGAAAAAGCAGAAGAAGAAGAAGCTAAACGAAGAGCAGATGCTAAAGAGCAA
GATGAATCAXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXATTGCTGAGTCCGATGTGAAAGTTAAAGAAGCGG
AGCTTGAACTAGTAAAAGAGGAAGCTAAGGAATCTCGAAACGAGGAAAAAATTAAGCAAGCAAAAGCGAAAGTTGAGAGTAAA
AAAGCTGAGGCTACAAGGTTAGAAAAAATCAAGACAGATCGTAAAAAAGCAGAAGAAGAAGCTAAACGAAAAGCAGCAGAAGA
AGATAAAGTTAAAGAAAAACCAGCTGAACAACCACAACCAGCGCCGGCTCCAAAACCAGAGAATCCAGCTGAAGAGCCTGAGA
ATCCAGTTCCAGCTCCAAAACCAGAGAATCCAGCTGAACAACCAAAAGCAGAAAAACCAGCTGATCAACAAGCTGAAGAAGAC
TATGCTCGTAGATCAGAAGAAGAATATAATCGCTTGACTCAACAGCAACCGCCAAAACCAGAGCAACCAGCTCCTGCACCAAA
AATAGGCTGGAAACAAGAAAACGGTATGTGGTACTTCTACAATACTGATGGTTCAATGGCGACCGGATGGCTCCAAAACAATG
GCTCATGGTACTACCTCAACAGCAATGGCGCTATGGCGACAGGATGGCTCCAAAACAATGGTTCATGGTACTATCTAAACGCT
AATGGTTCAATGGCAACAGGATGGCTCCAAAACAATGGTTCATGGTACTACCTCAACGCTAATGGTGATATGGCGACAGGATG
GCTCCAATACAATGGCTCATGGTACTACCTCAACGCTAATGGTGATATGGCGACAGGATGGCTCCAATACAATGGCTCATGGT
ACTACCTAAACGCTAATGGTGATATGGCGACAGGATGGCTCCAATACAATGGCTCATGGTACTATCTAAACGCTAATGGTGAT
ATGGCGACAGGTTGGGTGAAAGATGGAGATACCTGGTACTATCTTGAAGCATCAGGTGCTATGAAAGCAAGCCAATGGTTCAA
AGTATCAGATAAATGGTACTATGTCAATGGCTCAGGTGCCCTTGCAGTCAACACAACTGTAGACGGCTATGGAGTCAATGCCA
ATGGTGAATGGGTAAAC
 
SeqID 300
ATGTTTGCATCAAAAAGCGAAAGAAAAGTACATTATTCAATTCGTAAATTTAGTATTGGAGTAGCTAGTGTAGCTGTTGCTA■
CTTGTTCTTAGGAGGAGTAGTCCATGCAGAAGGGGTTAGAAGTGAGAATACCCCCAAGGTTACATCTAGTGGGGATGAAGTC■
ATGAATATATAAAAAAAATGTTGAGTGAGATCCAATTAGATAAAAGAAAACATACCCACAATTTCGCCTTAAACCTAAAGTT■
AGCAGAATTAAAACGGAGTATTTGTATAAATTAAAAGTTAATGTTTTAGAAGAAAAGTCAAAAGCTGAGTTGACGTCAAAAA■
AAAAAAAGAGGTAGACGCAGCTTTTGAGAAGTTTAAAAAAGATACATTGAAACTAGGAGAAAAGGTAGCAGAAGCACAGAAGA
AGGTTGAAGAAGCTAAGAAAAAAGCCAAGGATCAAAAAGAAGAAGATCACCGTAACTACCCAACCAATACTTACAAAACGCTT
GAACTTGAAATTGCTGAGTCCGATGTGAAAGTTAAAGAAGCGGAGCTTGAACTATTGAAAGAGGAAGCTAAAACTCGAAACGA
GGACACAATTAACCAAGCAAAAGCGAAAGTTAAGAGTGAACAAGCTGAGGCTACAAGGTTAAAAAAAATCAAGACAGATCGT■
AACAAGCTGAGGCTACAXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXATTGCTGAGTCCGATGTGAAAGTTAA
AGAAGCGGAGCTTGAACTAGTAAAAGAGGAAGCTAAGGAACCTCGAGACGAGGAAAAAATTAAGCAAGCAAAAGCGGAAGTT■
AGAGTAAACAAGCTGAGGCTACAAGGTTAGAAAAAATCAAGACAGATCGTAAAAAAGCAGAAGAAGAAGCTAAACGAAAAGCA
GCAGAAGAAGATAAAGTTAAAGAAAAACCAGCTGAACAACCACAACCAGCGCCGGCTCCTCAACCAGAAAAACCAACTCCAAA
ACCAGAAAAACCAGCTCCAGCTCCAAAACCAGAGAATCCAGCTGAACAACCAAAAGCAGAAAAACCAGCTGATCAACAAGCT■
AAGAAGACTATGCTCGTAGATCAGAAGAAGAATATAATCGCTTGACTCAACAGCAACCGCCAAAAACTGAAAAACCAGCACAA
CCATCTACTCCAAAAACAGGCTGGAAACAAGAAAACGGTATGTGGTACTTCTACAATACTGATGGTTCAATGGCGACAGGAT■
GCTCCAATACAATGGCTCATGGTACTACCTAAACGCTAATGGTGATATGGCGACAGGATGGCTCCAAAACAATGGTTCATGGT
ACTACCTAAACGCTAATGGTGATATGGCGACAGGATGGCTCCAAAACAATGGCTCATGGTACTACCTAAACGCTAATGGTGAT
ATGGCGACAGGATGGCTCCAAAACAATGGCTCATGGTACTACCTAAACGCTAATGGTGATATGGCGACAGGTTGGGTGAAAGA
TGGAGATACCTGGTACTATCTTGAAGCATCAGGTGCTATGAAAGCAAGCCAATGGTTCAAAGCATCAGATAAATGGTACTAT■
TCAATGGCTCAGGTGCCCTTGCAGTCAACACAACTGTAGATGGCTATGGAGTCAATGCCAATGGTGAATGGGTAAAC
 
SeqID 301
ATGTTTGCATCAAAAAGCGAAAGAAAAGTACATTATTCAATTCGTAAATTTAGTATTGGAGTAGCTAGTGTAGCTGTTGCCA■
TCTGTTTATGGGAAGTGTGGTTCATGCGACAGAGAAGGAGGTAACTACCCAAGTACCCACTTATTCTAATATGGCAAAGACA■
AACATAGGAAAGCTGCTAAACAAGTCGTCGATGAATATATAGAAAAAATGTTGAGGGAGATTCAATTAGATAGAAGAAAACAT
ACCCAAAATTTCGCCTTCAACATGAAGTTGAGCGCAATTAAAACGGAGTATTTGTATGGATTAAAAGAGAAGTCGGAAGCTGA
GTTGCCGTCATCGGAAGCTGAGTTGCCGTCAGAAGTAAAAGCAAAGTTAGACGCAGCTTTTGAGCAGTTTAAAAAAGATACAT
TGAAACTAGGAGAAAAGGTAGCAGAAGCTGAGAAGAAGGTTGCAGAAGCTGAGAAAAAAGCCAAGGCTCAAAAAGAAGAAGAT
CGCCGTAACTACCCAACCATTACTTACAAAACGCTTGACCTTGAAATTGCTGAGTCCGATGTGGAAGTTAAAAAAGCGGAGCT
TGAACTATTGAAAGAGGAAGCTAAAACTCGAAACAAGGACACAATTAAGCAAGCAAAAGCGAAAGTTGAGAGTAAAAAAGCT■
AGGCTACAAAGTTAGAAGAAATCAAGACAGATCGTAAAAAAGCAGAAGAAGAAGCTAXXXXXXXXXXXXXXXXXXXXXXXXXX
XXXXXXXXXXXXXXATTGCTGAGTCCGATGTGAAAGTTAAAGAAGCGGAGCTTGAACTAGTAAAAGAGGAAGCTAAGGAATCT
CGAAACGAGGAAAAAGTTAAGCAAGCAAAAGCGAAAGTTGAGAGTAAAAAAGCTGAGGCTACAAGGTTAGAAAAAATCAAGA■
AGATCGTAAAAAAGCAGAAGAAGCTAAACGAAGAGCAGCAGAAGAAGATAAAGTTAAAGAAAAACCAGCTGAACAACCACAA■
CAGCGCCGGCTCCTCAACCAGAAAAACCAACTGAAGAGCCTGAGAATCCAGCTCCAGCTCCAAAACCTGAGAAACCAGCTGAA
CAACCAAAAGCAGAAAAACCAGCTGATCAACAAGCTGAAGAAGACTATGCTCGTAGATCAGAAGAAGAATATAATCGCTTGAC
TCAACAGCAACCGCCAAAAACTGAAAAACCAGCACAACCATCTACTCCAAAAACAGGCTGGAAACAAGAAAACGGTATGTGGT
ACTTCTACAATACTGATGGTTCAATGGCGACAGGATGGCTCCAAAACAATGGCTCATGGTACTACCTCAACAGCAATGGCGCT
ATGGCGACAGGATGGCTCCAATACAATGGTTCATGGTACTACCTCAACGCTAATGGTGATATGGCGACAGGATGGCTCCAAAA
CAATGGTTCATGGTACTACCTCAACGCTAATGGTGATATGGCGACAGGATGGCTCCAATACAATGGTTCATGGTACTACCTCA
ACGCTAATGGTGATATGGCGACAGGATGGCTCCAAAACAATGGCTCATGGTACTACCTAAACGCTAATGGTGATATGGCGACA
GGTTGGGTGAAAGATGGAGATACCTGGTACTATCTTGAAGCATCAGGTGCTATGAAAGCAAGCCAATGGTTCAAAGTATCAGA
TAAATGGTACTATGTCAATGGCTCAGGTGCCCTTGCAGTCAACACAACTGTAGATGGCTATGGAGTCAATGCCAATGGTGAAT
GGGTAACC
 
SeqID 302
ATGTTTGCATCAAAAAGCGAAAGAAAAGTACATTATTCAATTCGTAAATTTAGTATTGGAGTAGCTAGTGTAGCTGTTGCTAG
CTTGTTCTTAGGAGGAGTAGTCCATGCAGAAGGGGTTAGAAGTGAGAATACCCGCAAGGTTACATCTAGTGGGGATGAAGTCG
ATGAATATATAAAAAAAATGTTGAGTGAGATCCAATTAGATAAAAGAAAACATACCCACAATTTCGCCTTAAACCTAAAGTTG
AGCAGAATTAAAACGGAGTATTTGTATAAATTAAAAGTTAATGTTTTAGAAGAAAAGTCAAAAGCTGAGTTGACGTCAAAAAC
AAAAAAAGAGGTAGACGCAGCTTTTGAGAAGTTTAAAAAAGATACATTGAAACTAGGAGAAAAGGTAGCAGAAGCTCAGAAGA
AGGTTGAAGAAGCTAAGAAAAAAGCCAAGGATCAAAAAGAAGAAGATCACCGTAACTACCCAACCAATACTTACAAAACGCTT
GAACTTGAAATTGCTGAGTCCGATGTGAAAGTTAAAGAAGCGGAGCTTGAACTATTGAAAGAGGAAGCTAAAACTCGAAACGA
GGACACAATTAACCAAGCAAAAGCGAAAGTTAAGAGTGAACAAGCTGAGGCTACAAGGTTAAAAAAAATCAAGACAGATCGTG
AACAAGCTGAGGCTACAAGGTTAGAAAACATCAAGACAGATCGTGAAAAAGCAGAAGAAGCTAAACGAAAAGCAGAAXXXXXX
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXCTTGAAATTGCTGAGTCCGATGTGAAAGTTAAAGAAGCGGAGCTTGAAC
TAGTAAAAGAGGAAGCTAAGGAATCTCGAAACGAGGAAAAAGTTAAGCAAGCAAAAGCGAAAGTTGAGAGTAAACAAGCTGAG
GCTACAAGGTTAGAAAAAATCAAGACAGATCGTAAAAAAGCAGAAGAAGAAGCTAAACGAAAAGCAGCAGAAGAAGATAAAGT
TAAAGAAAAACCAGCTGAACAACCACAACCAGCGCCGGCTCCTCAACCAGAAAAACCAGCTCCAGCTCCAAAACCAGAGAAT■
CAGCTGAACAACCAAAAGCAGAAAAACCAGCTGATCAACAAGCTGAAGAAGACTATGCTCGTAGATCAGAAGAAGAATATAAT
CGCTTGACTCAACAGCAACCGCCAAAAACTGAAAAACCAGCACAACCATCTACTCCAAAAACAGGCTGGAAACAAGAAAACGG
TATGTGGTACTTCTACAATACTGATGGTTCAATGGCGACAGGATGGCTCCAATACAATGGCTCATGGTACTACCTAAACGCTA
ATGGTGATATGGCGACAGGATGGCTCCAAAACAATGGTTCATGGTACTACCTAAACGCTAATGGTGATATGGCGACAGGATG■
CTCCAAAACAATGGCTCATGGTACTACCTAAACGCTAATGGTGATATGGCGACAGGATGGCTCCAAAACAATGGCTCATGGTA
CTACCTAAACGCTAATGGTGATATGGCGACAGGTTGGGTGAAAGATGGAGATACCTGGTACTATCTTGAAGCATCAGGTGCTA
TGAAAGCAAGCCAATGGTTCAAAGCATCAGATAAATGGTACTATGTCAATGGCTCAGGTGCCCTTGCAGTCAACACAACTGTA
GATGGCTATGGAGTCAATGCCAATGGTGAATGGGTAAAC
 
SeqID 303
ATGTTTGCATCAAAAAGCGAAAGAAAAGTACATTATTCAATTCGTAAATTTAGTATTGGAGTAGCTAGTGTAGCTGTTGCCA■
TCTTTTTATGGGAAGTGTGGTTCATGCGACAGAGAAGGAGGTAACTACCCAAGTAGCCACTTCTTCTAATAAGGCAAATAAAA
GTCAGACAGAACATATGAAAGCTGCTAAACAAGTCGATGAATATATAAAAAAAAAGCTCCAATTAGATAGAAGAAAACATAC■
CAAAATGTCGGCTTACTCACAAAGTTGGGCGTAATTAAAACGGAGTATTTGCATGGATTAAGTGTTTCAAAAAAGAAGTCGGA
AGCTGAGTTGCCGTCAGAAATAAAAGCAAAGTTAGACGCAGCTTTTGAGCAGTTTAAAAAAGATACATTACCAACAGAACCA■
GAAAAAAGGTAGCAGAAGCTGAGAAGAAGGTTGAAGAAGCTAAGAAAAAAGCCGAGGATCAAAAAGAAAAAGATCTCCGTAA■
TACCCAACCAATACTTACAAAACGCTTGAACTTGACATTGCTGAGTCCGATGTGGAAGTTAAAAAAGCGGAGCTTGAACTAGT
AAAAGGGAGCTACAGGAATCTCGAGACGAGAAAAAAATTAATCAAGCAAAGCGAAAAGTTGAGAATAAAAAAGCTGATGCTA■
AAGGXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXGTCCAAAACGGTATGTGGTACTTCTACAATACTGATGGT
TCAATGGCAACAGGCTGGCTCCAAAACAATGGCTCATGGTACTACCTCAACAGCAATGGCGCTATGGCGACAGGATGGCTCCA
AAACAATGGCTCATGGTACTACCTCAACAGCAATGGCGCTATGGCGACAGGATGGCTCCAATACAATGGTTCATGGTACTAC■
TCAACGCTAATGGTGATATGGCGACAGGATGGTTCCAATACAATGGTTCATGGTACTACCTCAACGCTAATGGTGATATGGC■
ACAGGATGGTTCCAATACAATGGTTCATGGTACTACCTCAACGCTAATGGTGATATGGCGACAGGATGGTTCCAATACAATG■
TTCATGGTACTACCTCAACGCTAATGGTGATATGGCGACAGGATGGCTCCAATACAATGGTTCATGGTACTACCTAAACAGCA
ATGGTGCTATGGTAACAGGATGGCTCCAAAACAATGGCTCATGGTACTACCTAAACGCTAACGGTTCAATGGCAACAGATTG■
GTGAAAGATGGAGATACCTGGTACTATCTTGAAGCATCAGGTGCTATGAAAGCAAGCCAATGGTTCAAAGTATCAGATAAAT■
GTACTATGTCAATGGCTCAGGTGCCCTTGCAGTCAACACAACTGTAGATAGCTATAGAGTCAATGCCAATGGTGAATGGGTAA
AC
 
SeqID 304
MKKKILASLLLSTVMVSQVAVLTTAHAETTDDKIAAQDNKISNLTAQQQEAQKQVDQIQEQVSAIQAEQSNLQAENDRLQAEQ
KKLEGEITELSKNIVSRNQSLEKQARSAQTNGAVTSYINTIVNSKSITEAISRVAAMSEIVSANNKMLEQQKADKKAISEKQ■
ANNDAINTVIANQQKLADDAQALTTKQAELKAAELSLAAEKATAEGEKASLLEQKAAAEAEARAAAVAEAAYKEKRASQQQS■
LASANTNLTAQVQAVSESAAAPVRAKVRPTYSTNASSYPIGECTWGVKTLAPWAGDYWGNGAQWATSAAAAGFRTGSTPQVGA
IACWNDGGYGHVAVVTAVESTTRIQVSESNYAGNRTIGNHRGWFNPTTTPEGFVTYIYAD
 
SeqID 305
MKKKILASLLLSTVMVSQVAVLTTAHAETTDDKIAAQDNKISNLTAQQQEAQKQVDQIQEQVSAIQAEQSNLQAENDRLQAE■
KKLEGEITELSKNIVSRNQSLEKQARSAQTNGAVTSYINTIVNSKSITEAISRVAAMSEIVSANNKMLEQQKADKKAISEKQ■
ANNDAINTVIANQQKLADDAQALTTKQAELKAAELSLAAEKATAEGEKASLLEQKAAAEAEARAAAVAEAAYKEKRAGQQQS■
LASANTNLTAQVQAVSESAAAPVRAKVRPTYSTNASSYPIGECTWGVKTLAPWAGDYWGNGAQWATSAAAAGFRTGSTPQVG■
IACWNDGGYGHVAVVTAVESTTRIQVSESNYAGNRTIGNHRGWFNPTTTSEGFVTYIYAD
 
SeqID 306
MIQIGKIFAGRYRIVKQIGRGGMADVYLAKDLILDGEEVAVKVLRTNYQTDPIAVARFQREARAMADLDHPHIVRITDIGEED
GQQYLAMEYVAGLDLKRYIKEHYPLSNEEAARIMGQILLAMRLAHTRGIVHRDLKPQNILLTPDGTAKVTDFGIAVAFAETSI
TQTNSMLGSVHYLSPEQAGGSKATVQSDIYAMGIIFYEMLTGEIPYDGDSAVTIALQHFQKPLPSVIAENPSVPQALENVIIK
ATAKKLTNRYRSVSEMYVDLSSSLSYNRRNESKLIFDETSKADTKTLPKVSQSTLTSIPKVQAQTEHKSIKNPSQAVTEETYQ
PQAPKKHRFKMRYLILLASLVLVAASLIWILSRTPATIAIPDVAGQTVAEAKATLKKANFEIGEEKTEASEKVEEGRIIRTDP
GAGTGRKEGTKINLVVSSGKQSFQISNYVGRKSSDVIAELKEKKVPDNLIKIEEEESNESEAGTVLKQSLPEGTTYDLSKATQ
IVLTVAKKVTSVAMPSYIGSSLEFTKNNLIQIVGIKEANIEVVEVTTAPAGSAEGMVVEQSPRAGEKVDLNKTRVKISIYKPK
TTSATP
 
SeqID 307
MIQIGKIFAGRYRIVKQIGRGGMADVYLAKDLILDGEEVAVKVLRTNYQTDPIAVARFQREARAMADLDHPHIVRITDIGEE■
GQQYLAMEYVAGLDLKRYIKEHYPLSNEEAVRIMGQILLAMRLAHTRGIVHRDLKPQNILLTPDGTAKVTDFGIAVAFAETS■
TQTNSMLGSVHYLSPEQARGSKATVQSDIYAMGIIFYEMLTGHIPYDGDSAVTIALQHFQKPLPSVIAENPSVPQALENVIIK
ATAKKLTNRYRSVSEMYVDLSSSLSYNRRNESKLIFDETSKADTKTLPKVSQSTLTSIPKVQAQTEHKSIKNPSQAVTEETYQ
PQAPKKHRFKMRYLILLASLVLVAASLIWILSRTPATIAIPDVAGQTVAEAKATLKKANFEIGEEKTEASEKVEEGRIIRTDP
GAGTGRKEGTKINLVVSSGKQSFQISNYVGRKSSDVIAELKEKKVPDNLIKIEEEESNESEAGTVLKQSLPEGTTYDLSKATQ
IVLTVAKKATTIQLGNYIGRNSTEVISELKQKKVPENLIKIEEEESSESEPGTIMKQSPGAGTTYDVSKPTQIVLTVAKKVTS
VAMPSYIGSSLEFTKNNLIQIVGIKEANIEVVEVTTAPAGSVEGMVVEQSPRAGEKVDLNKTRVKISIYKPKTTSATP
 
SeqID 308
MIQIGKIFAGRYRIVKQIGRGGMADVYLAKDLILDGEEVAVKVLRTNYQTDPIAVARFQREARAMADLDHPHIVRITDIGEEI
GQQYLAMEYVAGLDLKRYIKEHYPLSNEEAVRIMGQILLAMRLAHTRGIVHRDLKPQNILLTPDGTAKVTDFGIAVAFAETS■
TQTNSMLGSVHYLSPEQARGSKATVQSDIYAMGIIFYEMLTGHIPYDGDSAVTIALQHFQKPLPSVIAENPSVPQALENVII■
ATAKKLTNRYRSVSEMYVDLSSSLSYNRRNESKLIFDETSKADTKTLPKVSQSTLTSIPKVQAQTEHKSIKNPSRAVTEETYQ
PQAPKKHRFKMRYLILLASLVLVAASLIWILSRTPATIAIPDVAGQTVAEAKATLKKANFEIGEEKTEASEKVEEGRIIRTD■
GAGTGRKEGTKINLVVSSGKQSFQISNYVGRKSSDVIAELKEKKVPDNLIKIEEEESNESEAGTVLKQSLPEGTTYDLSKATQ
IVLTVAKKATTIQLGNYIGRNSTEVISELKQKKVPENLIKIEEEESSESEPGTIMKQSPGAGTTYDVSKPTQIVLTVAKKVTS
VAMPSYIGSSLEFTKNNLIQIVGIKEANIEVVEVTTAPAGSAEGMVVEQSPRAGEKVDLNKTRVKTSIYKPKTTSATP
 
SeqID 309
MIQIGKIFAGRYRIVKQIGRGGMADVYLAKDLILDGEEVAVKVLRTNYQTDPIAVARFQREARAMADLDHPHIVRITDIGEE■
GQQYLAMEYVAGLDLKRYIKEHYPLSNEEAVRIMGQILLAMRLAHTRGIVHRDLKPQNILLTPDGTAKVTDFGIAVAFAETS■
TQTNSMLGSVHYLSPEQARGSKATVQSDIYAMGIIFYEMLTGHIPYDGDSAVTIALQHFQKPLPSVIAENPSVPQALENVII■
ATAKKLTNRYRSVSEMYVDLSSSLSYNRRNESKLIFDETSKADTKTLPKVSQSTLTSIPKVQAQTGHKSIKNPSQAVTEETYQ
PQAPKKHRFKMRYLILLASLVLVAASLIWILSRTPATIAIPDVAGQTVAEAKATLKKANFEIGEEKTEASEKVEEGRIIRTD■
GAGTGRKEGTKINLVVSSGKQSFQISNYVGRKSSDVIAELKEKKVPDNLIKIEEEESNESEAGTVLKQSLPEGTTYDLSKATQ
IILTVAKKATTIQLGNYIGRNSTEVISELKQKKVPENLIKIEEEESSESEPGTIMKQSPGAGTTYDVSKPTQIVLTVAKKVTS
VAMPSYIGSSLEFTKNNLIQIVGIKEANIEVVEVTTAPAGSAEGMVVEQSPRAGEKVDLNKTRVKISIYKPKTTSATP
 
SeqID 310
MIQIGKIFAGRYRIVKQIGRGGMADVYLAKDLILDGEEVAVKVLRTNYQTDPIAVARFQREARAMADLDHPHIVRITDIGEE■
GQQYLAMEYVAGLDLKRYIKEHYPLSNEEAVRIMGQILLAMRLAHTRGIVHRDLKPQNILLTPDGTAKVTDFGIAVAFAETS■
TQTNSMLGSVHYLSPEQARGSKATVQSDIYAMGIIFYEMLTGHIPYDGDSAVTIALQHFQNPLPSVIAENSSVPQALENVII■
ATAKKLTNRYRSVSEMYVDLSSSLSYNRRNESKLIFDETSKADTKTLPKVSQSTLTSIPKVQAQTEHKSIKNPSQAVTEETYQ
PQAPKKHRFKMRYLILLASLVLVAASLIWILSRTPATIAIPDVAGQTVAEAKATLKKANFEIGEEKTEASEKVEEGRIIRTD■
GAGTGRKEGTKINLVVSSGKQSFQISNYVGRKSSDVIAELKEKKVPDNLIKIEEEESNESEAGTVLKQSLPEGTTYDLSKAT■
IVLTVAKKATTIQLGNYIGRNSTEVISELKQKKVPENLIKIEEEESSESEPGTIMKQSPGAGTTYDVSKPTQIVLTVAKKVTS
VAMPSYIGSSLEFTKNNLIQIVGIKEANIEVVEVTTAPAGSVEGMVVEQSPRAGEKVDLNKTRVKISIYKPKTTSATP
 
SeqID 311
MFASKSERKVHYSIRKFSIGVASVAVASLVMGSVVHATENEGSTQAATSSNMAKTEHRKAAKQVVDEYIEKMLREIQLDRRK■
TQNVALNIKLSAIKTKYLRELNVLEEKSKDELPSEIKAKLDAAFEKFKKDTLKPGEKVAEAKKKVEEAKKKAEDQKEEDRRN■
PTNTYKTLELEIAEFDVKVKEAELELVKEEAKESRNEGTIKQAKEKVESKKAEATRLENIKTDRKKAEEEAKRKADAKLKEA■
VATSDQGKPKGRAKRGVPGELATPDKKENDAKSSDSSVGEETLPSSSLKSGKKVAEAEKKVEEAEKKAKDQKEEDRRNYPTN■
YKTLDLEIAESDVKVKEAELELVKEEAKEPRDEEKIKQAKAKVESKKAEATRLENIKTDRKKAEEEAKRKAAEEDKVKEKPA■
QPQPAPATQPEKPAPKPEKPAEQPKAEKTDDQQAEEDYARRSEEEYNRLTQQQPPKTEKPAQPSTPKTGWKQENGMWYFYNT■
GSMATGWLQNNGSWYYLNANGAMATGWLQNNGSWYYLNANGSMATGWLQNNGSWYYLNANGAMATGWLQYNGSWYYLNSNGA■
ATGWLQYNGSWYYLNANGDMATGWLQNNGSWYYLNANGDMATGWLQYNGSWYYLNANGDMATGWVKDGDTWYYLEASGANKAS
QWFKVSDKWYYVNGSGALAVNTTVDGYGVNANGEWVN
 
SeqID 312
MFASKSERKVHYSIRKFSVGVASVVVASLVMGSVVHATENEGATQVPTSSNRANESQAEQGEQPKKLDSERDKARKEVEEYV■
KIVGESYAKSTKKRHTITVALVNELNNIKNEYLNKIVESTSESQLQILMMESRSKVDEAVSKFEKDSPSSSSSDSSTKPEXX■
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXAESDVEVKKAELELVKEEAKEPRNEEKVKQAKAEV■
SKKAEATRLEKIKTDRKKAEEEAKRKAAEEDKVKEKPAEQPQPAPAPKAEKPAPAPKPENPAEQPKAEKPADQQAEEDYARR■
EEEYNRLTQQQPPKTEKPAQPSTPKTGWKQENGMWYFYNTDGSMATGWLQNNGSWYYLNSNGAMATGWLQNNGSWYYLNANG■
MATGWLQNNGSWYYLNANGSMATGWLQYNGSWYYLNANGSMATGWLQYNGSWYYLNANGDMATGWVKDGDTWYYLEASGAMK■
SQWFKVSDKWYYVNGSGALAVNTTVDGYGVNANGEWVN
SeqID 313
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXLKLLSPMWKLKKRSLTSKEEAKKPLNEGTIRQ
AKAEVESKKAEATRLEKIKTDRKKAEEEAKRRAAEEDKVKEKPAEQPQPAPAPQPEKPTEEPENPVPAPKPEKPAEQPKPEKP
AEQPKPEKPAEQPKAEKTDDQQAEEDYARRSEEEYNRLTQQQPQKPEQPAPAPKIGWKQENGMWYFYNTDGSMATGWLQYNGS
WYYLNANGSMATGWVKDGDTWYYLEASGAMKASQWFKVSDKWYYVNGSGALAVNTTVDGYGVNANGEWVN
 
SeqID 314
MFASKSERKVHYSIRKFSVGVASVAVASLVMGSVVHATENERTTQVPTSSNRGKPERRKAAEQFDEYINKMIQLDKRKHTQNL
AFNIQLSRIKTEYLNGLKEKSEAELPSKIKAELDAAFKQFKKDTLPTEPEKKVAEAEKKVEEAEKKVAEAKKKAKAQKEEDHR
NYPTITYKTLDLEIAEFDVKVKEAELELVKKEADESRNEGTINQAKAKVESEKAEATRLKKIKTDREKAEEEEAKRRADAKEQ
DESXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXIAESDVKVKEAELELVKEEAKESRNEEKIK
QAKAKVESKKAEATRLEKIKTDRKKAEEEAKRKAAEEDKVKEKPAEQPQPAPAPKPENPAEEPENPVPAPKPENPAEQPKAEK
PADQQAEEDYARRSEEEYNRLTQQQPPKPEQPAPAPKIGWKQENGMWYFYNTDGSMATGWLQNNGSWYYLNSNGAMATGWLQN
NGSWYYLNANGDMATGWLQYNGSWYYLNANGDMATGWLQYNGSWYYLNANGDMATGWLQYNGSWYYLNANGDMATGWVKDGDT
WYYLEASGAMKASQWFKVSDKWYYVNGSGALAVNTTVDGYGVNANGEWVN
 
SeqID 315
MFFSKSERKVHYSIRKFSIGVASVAVASLFLGGVVHAEGVRSENTPKVTSSGDEVDEYIKKMLSEIQLDKRKHTHNFALNLKL
SRIKTEYLYKLKVNVLEEKSKAELTSKTKKEVDAAFEKFKKDTLKLGEKVAEAQKKVEEAKKKAKDQKEEDHRNYPTNTYKTL
ELEIAESDVKVKEAELELLKEEAKTRNEDTINQAKAKVKSEQAEATRLKKIKTDREQAEATXXXXXXXXXXXXXXXXXXXXXX
XXXXXXXXXXXXXXXXXXXXXXXXXXXXIAESDVKVKEAELELVKEEAKEPRDEEKIKQAKAEVESKQAEATRLEKIKTDRKK
AEEEAKRKAAEEDKVKEKPAEQPQPAPAPQPEKPTPKPEKPAPAPKPENPAEQPKAEKPADQQAEEDYARRSEEEYNRLTQQQ
PPKTEKPAQPSTPKTGWKQENGMWYFYNTDGSMATGWLQYNGSWYYLNANGDMATGWLQNNGSWYYLNANGDMATGWLQNNGS
WYYLNANGDMATGWLQNNGSWYYLNANGDMATGWVKDGDTWYYLEASGAMKASQWFKASDKWYYVNGSGALAVNTTVDGYGVN
ANGEWVN
 
SeqID 316
MFASKSERKVHYSIRKFSIGVASVAVASLVMGSVVHATEKEVTTQVPTYSNMAKTEHRKAAKQVVDEYIEKMLREIQLDRRKH
TQNFAFNMKLSAIKTEYLYGLKEKSEAELPSSEAELPSEVKAKLDAAFEQFKKDTLKLGEKVAEAEKKVAEAEKKAKAQKEE■
RRNYPTITYKTLDLEIAESDVEVKKAELELLKEEAKTRNKDTIKQAKAKVESKKAEATKLEEIKTDRKKAEEEAXXXXXXXXX
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXIAESDVKVKEAELELVKEEAKESRNEEKVKQAKAKVESKKAF
ATRLEKIKTDRKKAEEAKRRAAEEDKVKEKPAEQPQPAPAPQPEKPTEEPENPAPAPKPEKPAEQPKAEKPADQQAEEDYAR■
SEEEYNRLTQQQPPKTEKPAQPSTPKTGWKQENGMWYFYNTDGSMATGWLQNNGSWYYLNSNGAMATGWLQYNGSWYYLNANG
DMATGWLQNNGSWYYLNANGDMATGWLQYNGSWYYLNANGDMATGWLQNNGSWYYLNANGDMATGWVKDGDTWYYLEASGAM■
ASQWFKVSDKWYYVNGSGALAVNTTVDGYGVNANGEWVN
 
SeqID 317
MFASKSERKVHYSIRKFSIGVASVAVASLFLGGVVHAEGVRSENTPKVTSSGDEVDEYIKKMLSEIQLDKRKHTHNFALNLK■
SRIKTEYLYKLKVNVLEEKSKAELTSKTKKEVDAAFEKFKKDTLKLGEKVAEAQKKVEEAKKKAKDQKEEDHRNYPTNTYKT■
ELEIAESDVKVKEAELELLKEEAKTRNEDTINQAKAKVKSEQAEATRLKKIKTDREQAEATRLENIKTDREKAEEAKRKAEXX
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXLEIAESDVKVKEAELELVKEEAKESRNEEKVKQA■
AKVESKQAEATRLEKIKTDRKKAEEEAKRKAAEEDKVKEKPAEQPQPAPAPQPEKPAPAPKPENPAEQPKAEKPADQQAEEDY
ARRSEEEYNRLTQQQPPKTEKPAQPSTPKTGWKQENGMWYFYNTDGSMATGWLQYNGSWYYLNANGDMATGWLQNNGSWYYLM
ANGDMATGWLQNNGSWYYLNANGDMATGWLQNNGSWYYLNANGDMATGWVKDGDTWYYLEASGAMKASQWFKASDKWYYVNGS
GALAVNTTVDGYGVNANGEWVN
 
SeqID 318
MFASKSERKVHYSIRKFSIGVASVAVASLFMGSVVHATEKEVTTQVATSSNKANKSQTEHMKAAKQVDEYIKKKLQLDRRKHT
QNVGLLTKLGVIKTEYLHGLSVSKKKSEAELPSEIKAKLDAAFEQFKKDTLPTEPGKKVAEAEKKVEEAKKKAEDQKEKDLRN
YPTNTYKTLELDIAESDVEVKKAELELVKGSYRNLETRKKLIKQSEKLRIKKLMLQXXXXXXXXXXXXXXXXXXXXXXXXXXX
XXXXXXXXXXXXXXXXXXXXXXXVQNGMWYFYNTDGSMATGWLQNNGSWYYLNSNGAMATGWLQNNGSWYYLNSNGAMATGW■
QYNGSWYYLNANGDMATGWFQYNGSWYYLNANGDMATGWFQYNGSWYYLNANGDMATGWFQYNGSWYYLNANGDMATGWLQYN
GSWYYLNSNGAMVTGWLQNNGSWYYLNANGSMATDWVKDGDTWYYLEASGAMKASQWFKVSDKWYYVNGSGALAVNTTVDSY■
VNANGEWVN
 
注:“X”表示由于未获得的序列信息导致的未定义/缺失的核苷酸或氨基酸

Claims (26)

1.一种超免疫血清反应性肺炎链球菌(S.pneumoniae)抗原,其与来自具有肺炎链球菌感染的人或未感染的健康人的血清具有免疫反应性,所述抗原包括分离的肺炎链球菌多肽或其肽片段,所述多肽是由SEQ ID NO:243表示的氨基酸序列组成的Sp 2216,其中所述多肽或其肽片段适于在接种了所述多肽或其片段的个体中激发免疫反应,所述片段由SEQ ID NO:243的氨基酸1-285组成。
2.一种药物组合物,其包含至少一种按照权利要求1的抗原和任选地药用载体或赋形剂。
3.按照权利要求2的药物组合物,其还包含免疫刺激物质。
4.按照权利要求3的药物组合物,其中所述免疫刺激物质是聚阳离子聚合物,免疫刺激性脱氧核苷酸(ODN),包含至少两个Lys-Leu-Lys基序的肽,神经活性化合物,明矾,或弗氏完全佐剂或弗氏不完全佐剂。
5.按照权利要求4的药物组合物,其中所述聚阳离子聚合物是聚阳离子肽。
6.按照权利要求2,3,4或5的药物组合物,其是疫苗。
7.一种抗体或其免疫活性片段,其对于按照权利要求1的抗原是免疫特异性的。
8.按照权利要求7的抗体,其是单克隆抗体。
9.按照权利要求7的抗体的免疫活性片段,其是F(ab),F(ab)’,F(ab)2或Fv片段。
10.按照权利要求7的抗体,其是人抗体或人源化抗体。
11.一种制备针对按照权利要求1的抗原具有免疫特异性的抗体的方法,所述方法包括用免疫刺激量的所述抗原接种动物,在足以在所述动物中激发抗体的时间后,从所述动物中分离脾细胞,将所述脾细胞与无限增殖化细胞系融合从而产生产抗体的融合细胞,并选择产生对所述抗原具有免疫特异性的抗体的融合细胞的步骤。
12.一种药物组合物,其包括一种或多种按照权利要求7的抗体和任选地药用载体或赋形剂。
13.权利要求7的抗体在制备用于诊断动物中链球菌(Streptococcus)的感染的诊断剂中的应用,所述诊断剂与包括在所述动物的组织或生物体液中的包含多肽或片段的链球菌抗原反应。
14.按照权利要求13的应用,其中所述链球菌感染由肺炎链球菌所导致。
15.一种或多种按照权利要求7的抗体在制备用于治疗或预防动物中链球菌感染的药物中的应用。
16.按照权利要求15的应用,其中所述链球菌感染由肺炎链球菌所导致。
17.按照权利要求1的超免疫血清反应性肺炎链球菌抗原在制备用于针对链球菌感染来免疫动物的药物中的应用。
18.按照权利要求17的应用,其中所述链球菌感染由肺炎链球菌所导致。
19.按照权利要求1的超免疫血清反应性肺炎链球菌抗原在制备用于在动物中诱导针对链球菌的免疫反应的药物中的应用。
20.按照权利要求19的应用,其中动物中的免疫反应是针对肺炎链球菌的。
21.权利要求15-20任一项的应用,其中所述药物还包含免疫刺激物质。
22.权利要求21的应用,其中所述免疫刺激物质是聚阳离子聚合物,免疫刺激性脱氧核苷酸(ODN),包含至少两个Lys-Leu-Lys基序的肽,神经活性化合物,明矾,或弗氏完全佐剂或弗氏不完全佐剂。
23.权利要求22的应用,其中所述聚阳离子聚合物是聚阳离子肽。
24.按照权利要求15-23任一项的应用,其中所述动物是人。
25.按照权利要求1的抗原在制备用于诊断动物中链球菌感染的诊断剂中的应用,所述诊断剂与所述动物的组织或生物体液中的抗体反应,所述抗体对于链球菌抗原具有免疫特异性。
26.按照权利要求25的应用,其中所述链球菌感染是由肺炎链球菌所导致的。
CN200480010200XA 2003-04-15 2004-04-15 肺炎链球菌抗原 Expired - Fee Related CN1774447B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP03450087 2003-04-15
EP03450087.6 2003-04-15
PCT/EP2004/003984 WO2004092209A2 (en) 2003-04-15 2004-04-15 S. pneumoniae antigens

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN2011100423445A Division CN102174534A (zh) 2003-04-15 2004-04-15 肺炎链球菌抗原

Publications (2)

Publication Number Publication Date
CN1774447A CN1774447A (zh) 2006-05-17
CN1774447B true CN1774447B (zh) 2011-04-06

Family

ID=33186037

Family Applications (2)

Application Number Title Priority Date Filing Date
CN2011100423445A Pending CN102174534A (zh) 2003-04-15 2004-04-15 肺炎链球菌抗原
CN200480010200XA Expired - Fee Related CN1774447B (zh) 2003-04-15 2004-04-15 肺炎链球菌抗原

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN2011100423445A Pending CN102174534A (zh) 2003-04-15 2004-04-15 肺炎链球菌抗原

Country Status (8)

Country Link
US (3) US7635487B2 (zh)
EP (11) EP2311989A1 (zh)
JP (3) JP2007525157A (zh)
CN (2) CN102174534A (zh)
AU (1) AU2004230244B2 (zh)
CA (1) CA2522238A1 (zh)
HK (1) HK1084958A1 (zh)
WO (1) WO2004092209A2 (zh)

Families Citing this family (63)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6800744B1 (en) * 1997-07-02 2004-10-05 Genome Therapeutics Corporation Nucleic acid and amino acid sequences relating to Streptococcus pneumoniae for diagnostics and therapeutics
US7128918B1 (en) 1998-12-23 2006-10-31 Id Biomedical Corporation Streptococcus antigens
AU2002351623A1 (en) 2001-12-20 2003-07-09 Shire Biochem Inc. Streptococcus antigens
JP2007512006A (ja) 2003-11-10 2007-05-17 ザ ユーエービー リサーチ ファウンデーション 細菌輸送およびcns侵襲を低減させるための組成物およびこの組成物を使用する方法
CA2660743C (en) * 2006-08-17 2015-11-24 The Uab Research Foundation Immunogenic pcpa polypeptides and uses thereof
WO2008039838A2 (en) 2006-09-27 2008-04-03 St. Jude Children's Research Hospital Synthetic streptococcus pneumoniae vaccine
EP1923069A1 (en) * 2006-11-20 2008-05-21 Intercell AG Peptides protective against S. pneumoniae and compositions, methods and uses relating thereto
EP2164957B1 (en) 2007-05-23 2017-07-12 The UAB Research Foundation Detoxified pneumococcal neuraminidase and uses thereof
ATE550347T1 (de) * 2007-05-25 2012-04-15 Novartis Ag Streptococcus pneumoniae pilus-antigene
BRPI0814127A2 (pt) * 2007-07-23 2015-02-03 Sanofi Pasteur Ltd Polipeptídeos imunegênicos e anticorpos monoclonais
US20160228500A9 (en) * 2007-07-23 2016-08-11 Martina Ochs Immunogenic Polypeptides and Monoclonal Antibodies
GB0714963D0 (en) * 2007-08-01 2007-09-12 Novartis Ag Compositions comprising antigens
KR101667620B1 (ko) * 2008-02-01 2016-10-19 사노피 파스퇴르 리미티드 스트렙토코커스 뉴모니애의 진단을 위한 분석법
CA2716706C (en) 2008-03-03 2014-02-18 Irm Llc Compounds and compositions as tlr activity modulators
CN101977927A (zh) * 2008-03-17 2011-02-16 英特塞尔股份公司 针对肺炎链球菌保护的肽以及与其有关的组合物、方法和用途
EP2108656A1 (en) * 2008-03-19 2009-10-14 Beninati, Concetta Antigenic protein fragments of streptococcus pneumoniae
US8348429B2 (en) 2008-03-27 2013-01-08 Doheny Eye Institute Optical coherence tomography device, method, and system
US11839430B2 (en) 2008-03-27 2023-12-12 Doheny Eye Institute Optical coherence tomography-based ophthalmic testing methods, devices and systems
WO2009143483A2 (en) * 2008-05-22 2009-11-26 The Board Of Regents Of The University Of Texas System PsrP IS A PROTECTIVE ANTIGEN AGAINST PNEUMOCOCCAL INFECTION
WO2010009450A1 (en) 2008-07-18 2010-01-21 Doheny Eye Institute Optical coherence tomography device, method, and system
ES2352704B1 (es) * 2008-08-08 2012-06-14 CONSEJO SUPERIOR DE INVESTIGACIONES CIENTÍFICAS (CSIC)(Titular al 80%) Secuencia de nucleotido y proteina b-galactosidasa de streptococcus mitis, procedimiento de obtencion y sus aplicaciones.
US20110196142A1 (en) * 2008-09-04 2011-08-11 Biotechnology Research Institute The Chinese Academy of Agricultural Sciences DNA molecule for expressing Hairpin RNA, the constructing method and the use thereof
WO2010029546A2 (en) * 2008-09-11 2010-03-18 Ben Gurion University Of The Negev Research And Development Authority Compositions and methods for treating s.pneumoniae infection
EP2218457B1 (en) * 2009-02-16 2011-09-07 Karlsruher Institut für Technologie CD44v6 peptides as inhibitors of bacterial infections
JP5668049B2 (ja) 2009-03-24 2015-02-12 ノバルティス アーゲー 髄膜炎菌h因子結合タンパク質および肺炎球菌糖結合体の組み合わせ
CN102762226A (zh) 2009-06-10 2012-10-31 诺华有限公司 含苯并萘啶的疫苗
CN102548572A (zh) * 2009-06-29 2012-07-04 健诺西生物科学公司 抗肺炎链球菌的疫苗和组合物
TWI445708B (zh) 2009-09-02 2014-07-21 Irm Llc 作為tlr活性調節劑之化合物及組合物
JP5988492B2 (ja) 2009-09-02 2016-09-07 ノバルティス アーゲー Tlr活性モジュレーターを含む免疫原性組成物
BR112012008338A2 (pt) 2009-09-10 2019-09-24 Novartis Ag combinação de vacinas contra doenças do trato respiratório.
WO2011057148A1 (en) 2009-11-05 2011-05-12 Irm Llc Compounds and compositions as tlr-7 activity modulators
EP2512478B1 (en) 2009-12-15 2017-04-19 GlaxoSmithKline Biologicals SA Homogeneous suspension of immunopotentiating compounds and uses thereof
US20130039947A1 (en) * 2010-03-12 2013-02-14 Children's Medical Center Corporation Novel immunogens and methods for discovery and screening thereof
WO2011119759A1 (en) 2010-03-23 2011-09-29 Irm Llc Compounds (cystein based lipopeptides) and compositions as tlr2 agonists used for treating infections, inflammations, respiratory diseases etc.
WO2012072769A1 (en) 2010-12-01 2012-06-07 Novartis Ag Pneumococcal rrgb epitopes and clade combinations
JP6046632B2 (ja) 2010-12-03 2016-12-21 サノフィ パストゥール リミテッドSanofi Pasteur Limited 肺炎球菌に対する免疫用組成物
CN103501809B (zh) * 2011-01-20 2018-08-10 健诺西生物科学公司 针对肺炎链球菌(Streptococcus Pneumoniae)的疫苗和组合物
JP6152378B2 (ja) 2011-05-11 2017-06-21 チルドレンズ メディカル センター コーポレーション 多重抗原提示免疫原性組成物、ならびにその方法および使用
AU2012335208B2 (en) 2011-11-07 2017-08-31 Glaxosmithkline Biologicals S.A. Carrier molecule comprising a spr0096 and a spr2021 antigen
WO2013124473A1 (en) * 2012-02-24 2013-08-29 Novartis Ag Pilus proteins and compositions
CN104519910B (zh) 2012-03-07 2017-05-03 诺华股份有限公司 肺炎链球菌抗原的含佐剂制剂
CA2874210A1 (en) 2012-05-22 2013-11-28 Novartis Ag Meningococcus serogroup x conjugate
RU2510281C2 (ru) 2012-06-22 2014-03-27 Общество с ограниченной ответственностью "Эпитоп" (ООО "Эпитоп") ВАКЦИНА ПРОТИВ ПНЕВМОНИИ, ВЫЗЫВАЕМОЙ Streptococcus pneumoniae, НА ОСНОВЕ ГИБРИДНОГО БЕЛКА
WO2014018904A1 (en) * 2012-07-26 2014-01-30 Genocea Biosciences, Inc. Fused antigen vaccines and compositions against streptococcus pneumoniae
ES2670863T3 (es) 2013-02-01 2018-06-01 Glaxosmithkline Biologicals Sa Administración intradérmica de composiciones inmunológicas que comprenden agonistas del receptor de tipo Toll
JP6494527B2 (ja) 2013-02-07 2019-04-03 ザ チルドレンズ メディカル センター コーポレーション 肺炎球菌のコロニー形成および/または疾患からの保護を提供するタンパク質抗原
US10772497B2 (en) 2014-09-12 2020-09-15 Envision Diagnostics, Inc. Medical interfaces and other medical devices, systems, and methods for performing eye exams
US9226856B2 (en) 2013-03-14 2016-01-05 Envision Diagnostics, Inc. Inflatable medical interfaces and other medical devices, systems, and methods
JPWO2016204265A1 (ja) * 2015-06-18 2018-06-14 一般財団法人阪大微生物病研究会 肺炎球菌補体依存性殺菌能測定方法
US11039741B2 (en) 2015-09-17 2021-06-22 Envision Diagnostics, Inc. Medical interfaces and other medical devices, systems, and methods for performing eye exams
EP3448234A4 (en) 2016-04-30 2019-05-01 Envision Diagnostics, Inc. MEDICAL DEVICES, SYSTEMS AND METHODS FOR OPERATING OCULAR EXAMINATIONS AND OCULOMETRY
US10738338B2 (en) 2016-10-18 2020-08-11 The Research Foundation for the State University Method and composition for biocatalytic protein-oligonucleotide conjugation and protein-oligonucleotide conjugate
WO2018175783A1 (en) * 2017-03-22 2018-09-27 Modernatx, Inc. Rna bacterial vaccines
CN110730670A (zh) 2017-03-28 2020-01-24 儿童医疗中心有限公司 基于多抗原提呈系统(maps)的金黄色葡萄球菌疫苗、免疫原性组合物以及它们的用途
JP2020525540A (ja) 2017-06-23 2020-08-27 ノソコミアル ヴァクスィーン コーポレイション 免疫原性組成物
CN111867623A (zh) 2018-02-12 2020-10-30 英尼穆内公司 Toll样受体配体
GB201807380D0 (en) * 2018-05-04 2018-06-20 Karlsson Roger Biomarkers for detecting microbial infection
EP3849587A4 (en) 2018-09-12 2022-06-29 Affinivax, Inc. Multivalent pneumococcal vaccines
RU2701733C1 (ru) * 2018-12-14 2019-10-01 Федеральное государственное бюджетное научное учреждение "Институт экспериментальной медицины" (ФГБНУ "ИЭМ") Живая вакцина на основе штамма пробиотиков ENTEROCOCCUS FAECIUM L3 для профилактики инфекции, вызванной STREPTOCOCCUS PNEUMONIE
CN111748535B (zh) * 2019-03-28 2022-07-05 安徽华恒生物科技股份有限公司 一种丙氨酸脱氢酶突变体及其在发酵生产l-丙氨酸中的应用
KR20230117105A (ko) 2020-11-04 2023-08-07 엘리고 바이오사이언스 큐티박테리움 아크네스 재조합 파지, 그의 제조 방법 및 용도
GB202100097D0 (en) * 2021-01-05 2021-02-17 Univ Liverpool Novel composition
WO2023236878A1 (zh) * 2022-06-07 2023-12-14 北京大学第一医院 包含IgA蛋白酶截短体的融合蛋白及其用途

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1192241A (zh) * 1995-06-07 1998-09-02 生化疫苗公司 Hsp70家族的链球菌热休克蛋白

Family Cites Families (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US40000A (en) 1863-09-15 Improvement in sewing-machines
US4609231A (en) 1984-12-24 1986-09-02 Perfectdata Corporation Floppy diskette storage container
US4946778A (en) 1987-09-21 1990-08-07 Genex Corporation Single polypeptide chain binding molecules
DE69128350T2 (de) 1990-06-11 1998-03-26 Nexstar Pharmaceuticals Inc Nukleinsäureliganden
DK0835939T3 (da) 1990-06-28 2006-03-13 Sanofi Aventis Deutschland Fusionsproteiner med andele af immunglobulin, deres fremstilling og anvendelse
RO117329B1 (ro) 1991-06-24 2002-01-30 Chiron Corp Emeryville Polipeptide care contin o secventa a virusului hepatitei c
EP1167379A3 (en) 1994-07-15 2004-09-08 University Of Iowa Research Foundation Immunomodulatory oligonucleotides
RS50101B (sr) 1996-02-24 2009-01-22 Boehringer Ingelheim International Gmbh., Farmaceutski preparati za imunomodulaciju
WO1998008856A2 (de) 1996-08-30 1998-03-05 Fuerste Jens Peter Spiegelselektion und spiegelevolution von nucleinsäuren
US5849902A (en) 1996-09-26 1998-12-15 Oligos Etc. Inc. Three component chimeric antisense oligonucleotides
US6958239B2 (en) 1996-11-21 2005-10-25 Oligos Etc Inc. Three component chimeric antisense oligonucleotides
DE69739981D1 (de) * 1996-10-31 2010-10-14 Human Genome Sciences Inc Streptococcus pneumoniae-Antigene und Impfstoffe
JP2001510989A (ja) * 1996-11-01 2001-08-07 スミスクライン・ビーチャム・コーポレイション 新規コーディング配列
US6071724A (en) * 1996-12-13 2000-06-06 Eli Lilly And Company Streptococcus pneumoniaegene sequence era
US6800744B1 (en) * 1997-07-02 2004-10-05 Genome Therapeutics Corporation Nucleic acid and amino acid sequences relating to Streptococcus pneumoniae for diagnostics and therapeutics
DE19742706B4 (de) 1997-09-26 2013-07-25 Pieris Proteolab Ag Lipocalinmuteine
DE19803453A1 (de) 1998-01-30 1999-08-12 Boehringer Ingelheim Int Vakzine
EP1100921B1 (en) * 1998-07-27 2007-05-02 Sanofi Pasteur Limited Streptococcus pneumoniae proteins and nucleic acid molecules
WO2000006738A2 (en) * 1998-07-27 2000-02-10 Microbial Technics Limited NUCLEIC ACIDS AND PROTEINS FROM $i(STREPTOCOCCUS PNEUMONIAE)
US6951652B2 (en) * 1998-07-29 2005-10-04 Biosynth S.R.L. Vaccine for prevention of gram-negative bacterial infections and endotoxin related diseases
WO2000029434A2 (en) * 1998-11-19 2000-05-25 St. Jude Children's Research Hospital PNEUMOCOCCAL CHOLINE BINDING PROTEINS, CbpG AND CbpD, DIAGNOSTIC AND THERAPEUTIC USES THEREOF
TR200200633T2 (tr) * 1998-12-23 2002-06-21 Shire Biochem Inc. Yeni streptococcus antijenleri
AT408721B (de) 1999-10-01 2002-02-25 Cistem Biotechnologies Gmbh Pharmazeutische zusammensetzung enthaltend ein antigen
WO2001049721A2 (en) * 1999-12-30 2001-07-12 Bristol-Myers Squibb Company Bacterial genes and proteins that are essential for cell viability and their uses
AT409085B (de) 2000-01-28 2002-05-27 Cistem Biotechnologies Gmbh Pharmazeutische zusammensetzung zur immunmodulation und herstellung von vakzinen
WO2001078767A2 (en) 2000-04-14 2001-10-25 Cistem Biotechnologies Gmbh Pharmaceutical preparations comprising modified peptides
AT410173B (de) 2000-06-08 2003-02-25 Cistem Biotechnologies Gmbh Antigene zusammensetzung
TR200302015T4 (tr) 2000-06-08 2004-01-21 Intercell Biomedizinische Forschungs-Und Entwicklungs Ag İmüno-uyarıcı oligodeoksinükleotitler
WO2002005448A1 (en) 2000-07-10 2002-01-17 Telefonaktiebolaget Lm Ericsson (Publ) Resource management in uncoordinated frequency hopping system
WO2002013857A2 (en) 2000-08-17 2002-02-21 Intercell Biomedizinische Forschungs- Und Entwicklungs Ag A vaccine which comprises at least one antigen and a cathelididin derived antimicrobial peptide or a derivative thereof
AT410635B (de) 2000-10-18 2003-06-25 Cistem Biotechnologies Gmbh Vakzin-zusammensetzung
IL154853A0 (en) 2000-10-27 2003-10-31 Chiron Spa Nucleic acids and proteins from streptococcus groups a & b
AT410798B (de) 2001-01-26 2003-07-25 Cistem Biotechnologies Gmbh Verfahren zur identifizierung, isolierung und herstellung von antigenen gegen ein spezifisches pathogen
AU2002234455C1 (en) 2001-02-21 2008-08-21 Id Biomedical Corporation Streptococcus pyogenes polypeptides and corresponding DNA fragments
WO2002077183A2 (en) * 2001-03-21 2002-10-03 Elitra Pharmaceuticals, Inc. Identification of essential genes in microorganisms
GB0107658D0 (en) * 2001-03-27 2001-05-16 Chiron Spa Streptococcus pneumoniae
CA2443493A1 (en) 2001-04-13 2002-10-24 Wyeth Surface proteins of streptococcus pyogenes
EP1572868A4 (en) * 2001-04-16 2007-04-04 Wyeth Corp NOVEL OPEN READING FRAMES OF STREPTOCOCCUS PNEUMONIAE ENCODING POLYPEPTIDE ANTIGENS AND USES THEREOF
FR2824074A1 (fr) 2001-04-26 2002-10-31 Pasteur Institut Sequence du genome streptococcus agalactiae, application au developpement de vaccins, d'outils de diagnostic, et a l'identification de cibles therapeutiques
WO2003047602A1 (en) 2001-12-07 2003-06-12 Intercell Ag Immunostimulatory oligodeoxynucleotides
GB0210128D0 (en) 2002-05-02 2002-06-12 Chiron Spa Nucleic acids and proteins from streptococcus groups A & B
EP1648500B1 (en) 2003-07-31 2014-07-09 Novartis Vaccines and Diagnostics, Inc. Immunogenic compositions for streptococcus pyogenes

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1192241A (zh) * 1995-06-07 1998-09-02 生化疫苗公司 Hsp70家族的链球菌热休克蛋白

Also Published As

Publication number Publication date
EP2314718A1 (en) 2011-04-27
EP2311988A1 (en) 2011-04-20
JP2011004753A (ja) 2011-01-13
EP2311987A1 (en) 2011-04-20
EP2314719A1 (en) 2011-04-27
EP2298934A1 (en) 2011-03-23
JP2012184236A (ja) 2012-09-27
US7635487B2 (en) 2009-12-22
US8372411B2 (en) 2013-02-12
CN1774447A (zh) 2006-05-17
CA2522238A1 (en) 2004-10-28
AU2004230244B2 (en) 2011-09-22
US20100260790A1 (en) 2010-10-14
CN102174534A (zh) 2011-09-07
EP2336357A1 (en) 2011-06-22
EP2311990A1 (en) 2011-04-20
EP1615950A2 (en) 2006-01-18
US20130136761A1 (en) 2013-05-30
WO2004092209A2 (en) 2004-10-28
HK1084958A1 (en) 2006-08-11
US20060263846A1 (en) 2006-11-23
JP2007525157A (ja) 2007-09-06
EP2333114A1 (en) 2011-06-15
WO2004092209A3 (en) 2004-12-09
AU2004230244A1 (en) 2004-10-28
EP2311989A1 (en) 2011-04-20
WO2004092209A9 (en) 2008-11-27
EP2311991A1 (en) 2011-04-20

Similar Documents

Publication Publication Date Title
CN1774447B (zh) 肺炎链球菌抗原
CA2413450C (en) Streptococcus antigens
KR20040073287A (ko) 폴리펩티드 항원을 암호화하는 신규한 스트렙토코쿠스뉴모니애 개방형 판독 프레임 및 이의 용도
AU2020218748B2 (en) A genetically modified lactobacillus and uses thereof
CN101864432A (zh) 无乳链球菌抗原ⅰ和ⅱ
CA2525540A1 (en) Enterococcus antigens
CN100579985C (zh) 无乳链球菌抗原ⅰ和ⅱ
AU2021240230B2 (en) Vaccines and vaccine components for inhibition of microbial cells
CN101230099A (zh) 肺炎链球菌的蛋白质和核酸分子
MEINKE et al. Patent 2522238 Summary
MEINKE et al. Sommaire du brevet 2522238
AU710880B2 (en) Nucleic acid and amino acid sequences relating to helicobacter pylori for diagnostics and therapeutics
AU3335101A (en) Streptococcus pneumoniae polynucleotides and sequences
AU2011218655A1 (en) S. Pneumoniae Antigens
AU3795699A (en) Nucleic acid and amino acid sequences relating to helicobacter pylori for therapeutics
AU3796099A (en) Assays using nucleic acid and amino acid sequences relating to helicobacter pylori
AU1546202A (en) Enterococcus faecalis polynucleotides and polypeptides

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1084958

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1084958

Country of ref document: HK

C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110406

Termination date: 20140415