治疗和诊断组合物
本发明总的来说涉及治疗和/或预防动物和鸟中肠道疾病的治疗组合物,所说的疾病是由Lawsonia intracellularis或者类似的或以其它方式相关的微生物引起或加剧的。本发明也涉及治疗和/或预防这样的肠道疾病的方法,并涉及用于检测Lawsonia intracellularis或者类似的或以其它方式相关的微生物的诊断试剂和方法。
在本文描述的末尾,收集了本说明书中以编号提及的出版物的详细目录。在参考书目之后定义了本说明书中提及的核苷酸和氨基酸的序列识别号(SEQ ID Nos.)。
在本说明书全文中,除非上下文有其它需要,“包含”一词将被理解为意指包括所述的组分或整体或者组分或整体组,但不包括任何其它的组分或整体或者组分或整体组。
肉类产业在澳大利亚(实际上在世界上大多数国家)是整个畜牧业的重要方面。然而,由于作用于动物的疾病和公认的由动物携带的人类疾病的影响,肉类产业经历着快速的经济衰退。因此,具有完全确定的可用于处理人和动物中的感染或潜在感染的治疗、预防和诊断方法是很重要的。
猪是肉类产业中的重要组成部分。然而,猪对宽范围的肠道疾病(统称为猪增殖性肠道病(PPE))很敏感。这类肠道疾病以前已知为肠腺瘤病综合症(1),猪肠腺瘤病(PLA),坏死性肠炎(2),增殖性出血性肠道病(3),局部回肠炎(4),出血性肠道综合症(5),猪增殖性肠炎和Campylobacter spp引发的肠炎(6)。
PPE有两种主要形式:非出血性形式(代表是经常导致生长迟缓和轻微腹泻的肠腺瘤病)和出血性形式(通常是致命的,代表是增殖性出血性肠道病(PHE),此时远端小肠腔充血)。PPE在许多动物物种中被报道过,包括猪(14)、仓鼠(7)、雪貂(15)、豚鼠(16)、兔子(17)及鸟类物种(18)。
PPE的病原生物体是类似于弯曲杆菌属的生物体,本文称为“Lawsonia intracellularis”(26)。此生物体以前也称为Ilealsymbiont intracellularis(7)。其它病原体(例如弯曲杆菌属的不同种)也可引起猪的类似于PPE的疾病(8)。
Lawsonia intracellularis是一种细胞内(可能是专性细胞内)细菌。它只能用组织培养细胞进行体外培养(9,26)。患有PPE的猪以多个变态未成熟小囊为特征,L.intracellular位于这些小囊细胞的细胞质中。
猪产业中PPE是花费相当大的组成部分,尤其是家畜损失、药品花费、猪生长率的下降及饲养费用的增长。PPE同样导致一些下游间接花费,比如,用于处理抗生素残余物污染和防止这些生物体传播或携带到其它动物或人的控制方法上的额外的雇工费用和环境费用。
当前控制PPE的策略依赖于抗生素的使用。然而,这一策略被认为是短期的到中期的,尤其是由于政府的政策法规上的压力倾向于指向仅受预防性抗生素支持的畜牧业实践。因此,需要研制出有效、安全和低价的替代品,以替代使用的抗生素。同样需要将这种对抗生素的替代延伸到感染其它动物(例如人)的类似生物体。
在导致本发明的工作中,发明人试图研制出用于预防和治疗动物及鸟类PPE的疫苗。本发明的这些疫苗提供了对使用的抗生素的有效的替代品,具有一定的养殖和医疗利益。
因此,本发明的一个方面提供了一种用于预防或治疗动物或鸟类由Lawsonia intracellularis或者类似的或以其它方式相关的微生物引起的感染的疫苗组合物,该疫苗组合物包含免疫原性的非致病形式的L.intracellularis或相关微生物,或其免疫原性组分,以及适合兽医或制药业用途的一种或多种载体、稀释剂和/或佐剂。
本发明在预防和/或治疗猪L.intracellularis感染中特别有用,这一点以下将被例证。然而,通过了解本发明延伸到预防和治疗所有动物(包括人和鸟类)由L.intracellularis或相关微生物引起的感染,就可以明白这一点。本发明涉及的动物包括但不限于人、灵长类、宠物(如猫、狗)、家养动物(如猪、绵羊、牛、马、驴、山羊)、实验动物(如小鼠、大鼠、豚鼠、兔)和捕获的野生动物(如袋鼠、狐狸、鹿)。本发明也包括鸟类,例如家禽、供娱乐的鸟和笼养鸟。
此外,本发明延伸到L.intracellularis所有分离物和亚型以及Lawsonia属的其它种,或在核苷酸、生化、结构、生理和/或免疫相互作用水平上与其相关的其它微生物。下文涉及到的“Lawsoniaintracellularis”或其缩写“L.intracellularis”包括所有与此微生物类似的或在其它方面相关的微生物。例如,相关微生物在染色体或染色体外水平上可以与L.intracellularis染色体或染色体外因子内的所有或部分核苷酸序列具有至少约60%,优选地至少约70%,更优选地大于至少约80%的核苷酸序列相似性。例如,这些百分相似性可以与SEQ ID NO:5所示的序列有关。这一序列是L.intracellularis染色体的一部分。
因此,本发明的这一方面涉及用于预防或治疗猪因L.intracellularis引起的感染的疫苗组合物,该疫苗组合物包含免疫原性的非致病形式的L.intracellularis或相关微生物,或其免疫原性组分,以及适合兽医或制药业用途的一种或多种载体、稀释剂和/或佐剂。
术语“免疫原性组分”指L.intracellularis(以减毒的非病原体或杀死的形式),或L.intracellularis的组分,包括由得自或来源于L.intracellularis的DNA编码的并且能在猪中诱导保护性免疫反应的肽、多肽或蛋白质。保护性免疫反应可以在体液和/或细胞水平上,并且一般引起猪中PPE症状的实质上的减轻。该疫苗组合物包含有效量的免疫原性成分,例如使得可以诱导保护性免疫反应。
按照本发明的这一方面,本发明提供了用于预防或治疗猪因L.intracellularis引起的感染的疫苗组合物,上述疫苗组合物包含在所说的猪中诱导针对L.intracellularis或相关微生物的保护性免疫反应有效量的至少一种L.intracellularis或相关微生物的免疫原性组分,该疫苗组合物还包含一种或多种适合兽医或制药业用途的载体、佐剂和/或稀释剂。
所说的免疫原性组分可以是从L.intracellularis或其细胞培养物中分离出的天然存在的肽、多肽或蛋白质、碳水化合物、脂类或核酸(如DNA)或它们的任何组合体,或由得自或来源于L.intracellularis的DNA编码的重组形式的肽、多肽或蛋白质,或者是上述肽、多肽或蛋白质的衍生物。
L.intracellularis的分离的组分是经过至少一个纯化步骤,或者从含有L.intracellularis的细胞培养液或从L.intracellularis细胞的裂解制剂经过至少部分浓缩后的组分。在通过分子量、免疫原活性或其它合适的方法测定时,具有所需免疫原性性质的L.intracellularis的这一组分的纯度优选地至少约为40%,优选地至少约为50%,较优选地至少约为70%,更优选地至少约为80-90%或更高(相对于制剂中的其它组分而言)。
所说疫苗的一种特别有用的形式是全细胞疫苗,包括减毒的或其它非致病形式的L.intracellularis或杀灭的细胞或其各种组分。
减毒的或非致病的细胞包括经过各种方法(例如,热、福尔马林或其它化学处理、电击或高压)制备的杀灭的L.intracellularis细胞,而且这些细胞在本发明的实施中非常有用。
按照本发明的这一方面,本发明提供了用于预防和/或治疗猪因L.intracellularis或相关微生物引起的感染的疫苗组合物,该疫苗组合物包含L.intracellularis或相关微生物或者其免疫原性部分杀灭的制剂,以及适合兽医或制药业用途的一种或多种载体、佐剂和/或稀释剂。
在另一个实施方案中,使用了重组疫苗。此重组疫苗可以包含来源于L.intracellularis的一种或多种重组肽、多肽或蛋白质,或者是与来源于L.intracellularis的肽、多肽或蛋白质在免疫上相关的重组分子,或者可以是一种融合分子,该分子既具有包含来源于L.intracellularis的肽、多肽或蛋白质的第一部分,又具有有用(例如,作为载体分子或佐剂或免疫刺激分子,如细胞因子)的第二异源肽、多肽或蛋白质。来源于L.intracellularis的特别有用的重组蛋白质包括来源于L.intracellularis细胞表面或膜的肽、多肽或蛋白质,其是在L.intracellularis代谢途径中的一种酶或是重新折叠和/或热休克蛋白。在优选的实施方案中,所说的蛋白质是重新折叠的/热休克蛋白,例如但不限于GroEL和GroES。其它推定的候选疫苗包括鞭毛基体杆状蛋白、S-腺苷甲硫氨酸:tRNA核糖转移酶-异构酶、烯酰基-(酰基-载体-蛋白)还原酶、N-乙酰胞壁酰-L-丙氨酸酰胺酶(自溶素),UOP-3-0-[3-羟基肉豆蔻酰]葡糖胺N-乙酰转移酶和葡糖二酸转运蛋白。
按照优选的实施方案,本发明涉及用于预防和/或治疗猪因L.intracellularis或相关微生物引起的感染的疫苗组合物,该疫苗组合物包含至少一种来源于L.intracellularis的重组肽、多肽或蛋白质,并且其中所说的重组肽、多肽或蛋白质能够在猪体内诱导抗L.intracellularis的保护性免疫反应,此外,该疫苗组合物还包括一种或多种适合兽医或制药业用途的载体、佐剂和/或稀释剂。
在特别优选的实施方案中,所说的重组蛋白是具有SEQ ID NO:2所示的氨基酸序列的GroEL,或者是一种蛋白质,其具有与SEQ ID NO:2所示的氨基酸序列的全部或部分至少约40%,至少约60%,或较优选的至少约70%和甚至更优选的至少约80-90%或更大的相似性的预定的氨基酸序列。
在另一个实施方案中,所说的重组分子是具有SEQ ID NO:4所示的氨基酸序列的GroES,或者是这样一种分子,其具有与SEQ ID NO:4所示的氨基酸序列的全部或部分至少约40%,至少约60%,或较优选的至少约70%和甚至更优选的至少约80-90%或更大的相似性的氨基酸序列。
本发明的另一个实施方案包括和包含这样的肽、多肽或蛋白质,其由SEQ ID NO:1所示的核苷酸序列或者与该序列具有至少40%的相似形或能够在低严格性条件下与该序列杂交的核苷酸序列(该核苷酸序列编码L.intracellularis或相关微生物的免疫原性组分)编码。
本发明的另一个实施方案包括和包含这样的肽、多肽或蛋白质,其由SEQ ID NO:3所示的核苷酸序列或者与该序列具有至少40%的相似形或能够在低严格性条件下与该序列杂交的核苷酸序列(该核苷酸序列编码L.intracellularis或相关微生物的免疫原性组分)编码。
本发明的另一个实施方案包括和包含这样的肽、多肽或蛋白质,其由SEQ ID NO:5所示的核苷酸序列或者与该序列具有至少40%的相似形或能够在低严格性条件下与该序列杂交的核苷酸序列(该核苷酸序列编码L.intracellularis或相关微生物的免疫原性组分)编码。
本发明的另一个实施方案包括和包含这样的肽、多肽或蛋白质,其由SEQ ID NO:6所示的核苷酸序列或者与该序列具有至少40%的相似形或能够在低严格性条件下与该序列杂交的核苷酸序列(该核苷酸序列编码L.intracellularis或相关微生物的免疫原性组分)编码。
本发明的另一个实施方案包括和包含这样的肽、多肽或蛋白质,其由SEQ ID NO:8所示的核苷酸序列或者与该序列具有至少40%的相似形或能够在低严格性条件下与该序列杂交的核苷酸序列(该核苷酸序列编码L.intracellularis或相关微生物的免疫原性组分)编码。
本发明的另一个实施方案包括和包含这样的肽、多肽或蛋白质,其由SEQ ID NO:11所示的核苷酸序列或者与该序列具有至少40%的相似形或能够在低严格性条件下与该序列杂交的核苷酸序列(该核苷酸序列编码L.intracellularis或相关微生物的免疫原性组分)编码。
本发明的另一个实施方案包括和包含这样的肽、多肽或蛋白质,其由SEQ ID NO:13所示的核苷酸序列或者与该序列具有至少40%的相似形或能够在低严格性条件下与该序列杂交的核苷酸序列(该核苷酸序列编码L.intracellularis或相关微生物的免疫原性组分)编码。
本发明的另一个实施方案包括和包含这样的肽、多肽或蛋白质,其由SEQ ID NO:15所示的核苷酸序列或者与该序列具有至少40%的相似形或能够在低严格性条件下与该序列杂交的核苷酸序列(该核苷酸序列编码L.intracellularis或相关微生物的免疫原性组分)编码。
本发明的另一个实施方案包括和包含这样的肽、多肽或蛋白质,其由SEQ ID NO:17所示的核苷酸序列或者与该序列具有至少40%的相似形或能够在低严格性条件下与该序列杂交的核苷酸序列(该核苷酸序列编码L.intracellularis或相关微生物的免疫原性组分)编码。
本发明的另一个实施方案包括和包含这样的肽、多肽或蛋白质,其由SEQ ID NO:18所示的核苷酸序列或者与该序列具有至少40%的相似形或能够在低严格性条件下与该序列杂交的核苷酸序列(该核苷酸序列编码L.intracellularis或相关微生物的免疫原性组分)编码。
本发明的另一个实施方案包括和包含这样的肽、多肽或蛋白质,其由SEQ ID NO:19所示的核苷酸序列或者与该序列具有至少40%的相似形或能够在低严格性条件下与该序列杂交的核苷酸序列(该核苷酸序列编码L.intracellularis或相关微生物的免疫原性组分)编码。
本发明的另一个实施方案包括和包含这样的肽、多肽或蛋白质,其由SEQ ID NO:20所示的核苷酸序列或者与该序列具有至少40%的相似形或能够在低严格性条件下与该序列杂交的核苷酸序列(该核苷酸序列编码L.intracellularis或相关微生物的免疫原性组分)编码。
本发明的另一个实施方案包括和包含这样的肽、多肽或蛋白质,其由SEQ ID NO:21所示的核苷酸序列或者与该序列具有至少40%的相似形或能够在低严格性条件下与该序列杂交的核苷酸序列(该核苷酸序列编码L.intracellularis或相关微生物的免疫原性组分)编码。
本发明的另一个实施方案包括和包含这样的肽、多肽或蛋白质,其由SEQ ID NO:22所示的核苷酸序列或者与该序列具有至少40%的相似形或能够在低严格性条件下与该序列杂交的核苷酸序列(该核苷酸序列编码L.intracellularis或相关微生物的免疫原性组分)编码。
本发明的另一个实施方案包括和包含这样的肽、多肽或蛋白质,其由SEQ ID NO:23所示的核苷酸序列或者与该序列具有至少40%的相似形或能够在低严格性条件下与该序列杂交的核苷酸序列(该核苷酸序列编码L.intracellularis或相关微生物的免疫原性组分)编码。
优选的百分相似性包括至少约50%或至少约60%或至少约70-90%。
这里提及的在42℃下的低严格条件包括和包含从至少约1%v/v到至少约15%v/v的甲酰胺与从至少约1M到至少约2M的用于杂交的盐,和至少约1M到至少约2M的用于洗涤条件的盐。另一个严格条件可以在需要时采用,比如中等严格条件(它包括和包含从至少约16%v/v到至少约30%v/v的甲酰胺与从至少约0.5M到至少约0.9M用于杂交的盐,和从至少约0.5M到至少约0.9M的用于洗涤条件的盐)或者高严格条件(它包括和包含从至少约31%v/v到至少约50%v/v的甲酰胺与从至少约0.01M到至少约0.15M用于杂交的盐,和从至少约0.01M到至少约0.15M用于洗脱条件的盐)。
本发明也包括肽、多肽或蛋白质,它们具有实质上如SEQ ID NO:7或9或10或12或14或16所示的氨基酸序列或者具有与它们的全部或部分至少40%的相似性的氨基酸序列。优选的百分相似性包括至少约50%或至少约60%或至少约70-90%。
本发明进一步延伸到一种疫苗,该疫苗包含一种重组疫苗载体,所述疫苗载体编码来源于L.intracellularis或以上描述的相关微生物的肽、多肽或蛋白质。该疫苗载体可以来源于病毒、酵母或细菌并能以有效诱导保护性免疫反应的方式表达一段基因序列,该序列编码得自L.intracellularis的肽、多肽或蛋白质。例如,可以制备一种非致病细菌,其包含能够编码来自L.intracellularis的肽、多肽或蛋白质的重组序列。该重组序列是在组成型或诱导性启动子控制下的表达载体形式的。该细菌被允许定居在猪肠的适当位置,并被允许生长和以足够诱导抗L.intracellularis的保护性免疫反应的量产生重组肽、多肽或蛋白质。
在另一个可替的实施方案中,该疫苗可以是DNA疫苗,它包含编码得自L.intracellularis的肽、多肽或蛋白质的DNA分子,其在足够允许上述DNA瞬时表达的条件下注射到猪的肌肉组织或其他适当的组织中,以产生诱导保护性免疫反应有效量的肽、多肽或蛋白质。
本发明的这些疫苗可以含有单一肽、多肽或蛋白质或一系列肽、多肽或蛋白质,其涵盖了不同的或类似的表位。另外或可替地,可以提供具有多表位的单一多肽。后一类型的疫苗被称为多价疫苗。多表位包括两个或多个重复表位。
疫苗的形成方法是本领域公知的,并且可以方便地参考Remington’s药物科学,第17版,Mack出版公司,Easton,宾西法尼亚州,USA。
因此,本发明涉及药物组合物或疫苗组合物,其包含产生免疫有效量的以下一种或多种组分:(i)得自L.intracellularis的免疫原性成分;(ii)得自L.intracellularis的具有免疫原性的重组肽、多肽或蛋白质;和/或;(iii)得自L.intracellularis的全细胞或其成分或组分。
在下文中,上述成分被称为“活性成分”。这里所涉及的疫苗组合物的活性成分在根据特定病情施用一定量时表现出极好的治疗活性,例如在治疗和/或预防PPE中。例如,对于重组分子,可以施用从约0.5微克到约20毫克的量。其他有用的有效量包括1微克到约10毫克,10微克到约5毫克和50微克到约1毫克。其重要特征是施用得足以诱导有效的保护性免疫反应。上述施用量可以固定施用或根据每千克体重计算后施用。剂量可以调整以获得最好的治疗性反应。例如,许多分开的剂量可以每天施用或根据治疗的病情的需要所示按比例缩减剂量。加强施用也可能是需要的。
所述活性成分可以用一种便捷的方式施用,比如通过口头、静脉(此时是水溶性的)、肌肉、皮下、鼻内、皮内或塞药途径或植入(如运用缓释技术)。根据施用途径,活性成分(其包括,例如肽、多肽或蛋白质)可能需要包被在一定的物质中,以保护上述成分免受酶类、酸类和其他可以灭活所说成分的自然条件的作用。
术语“佐剂”以其最广泛的含义使用,包括任何免疫刺激化合物(如干扰素)。本文所谈及的佐剂包括间苯二酚、非离子表面活性剂(如聚氧乙烯油醚和正十六烷基聚乙烯醚、弗氏完全和不完全佐剂。
活性化合物也可以在肠胃外或腹膜内施用。分散剂可以用甘油、液态聚乙二醇和它们的混合物以及油制备。在一般贮存和使用条件下,这些制剂包含有防腐剂,以防止微生物生长。
适用于注射用的药物形式包括无菌水溶液(此时为水溶性的)或分散液和用来即时制备无菌注射液或分散液的无菌粉剂。除非药物形式是固体或半固体的(如在运用缓释技术时),否则所有情况下药物形式都必须是液态的,以便易于注射。在任何情况下,药物必须在生产和贮存条件下保持稳定并必须能防止微生物的污染作用。
载体可以是溶剂或分散介质,包括如:水、酒精、多元醇(如甘油、丙二醇和液态聚乙二醇等)、它们的合适的混合物和植物油。适当的流动性可以保持,例如,通过包衣(如licithin)、通过保持分散液所需的颗粒大小和通过运用superfactants。防止微生物作用则可以通过各种抗细菌和抗真菌剂实现,例如:羟苯甲酸酯、氯丁醇、酚、山梨酸、乙基汞硫代水杨酸钠等。在许多情况中,其中最好包括等渗剂(如糖类或氯化钠)是优选的。延长可注射组合物的吸收可通过运用延迟吸收剂组合物而实现,这些吸收剂如单硬脂酸铝和明胶。
通过将所需量的活性化合物掺入到适当的溶剂中制备无菌的可注射液,溶剂中含有上面列举的各种其他成分。如果需要,接着进行过滤灭菌。一般来说,通过将各种灭菌活性成分掺入到无菌载体中制备分散液,所说的无菌载体包括碱性分散介质和上述列举的所需的其他成分。在用于制备无菌注射液的无菌粉剂的情况下,优选的制备方法是真空干燥和冷冻干燥技术,其产生具有活性成分和任何来自前面的其无菌过滤液的其他所需成分的粉末。
载体和稀释剂包括任何和所有溶剂、分散介质、包衣、抗细菌和抗真菌剂、等渗和吸收延迟剂等。在疫苗中运用这些介质和药剂在本领域中是熟知的。除任何常规介质或药剂不能与活性成分共存外,在治疗组合物中运用它们是可以预期的。补充的活性成分也可以掺入到这些组合物中。
本发明的另一个方面涉及针对来自L.intracellularis的肽、多肽或蛋白质或其重组形式或非蛋白质分子(如碳水化合物)的抗体,这些抗体可以是单克隆的或多克隆的,并可以选自针对L.intracellularis的天然产生的抗体或者是针对特定分子、全细胞或其组分或片段特异性产生的抗体。本发明的抗体在免疫治疗和免疫接种中特别有用,并且也可以用作为感染的诊断工具或用于监测免疫接种或治疗方案的进程。
例如,重组L.intracellularis肽、多肽或蛋白质可以用于筛选针对L.intracellularis的天然产生的抗体。另外,特异性抗体也可以用于筛选L.intracellularis。用于这些测定的技术是本领域公知的,包括,如夹心测定和ELISA。在下文中,免疫原性组分被认为包括L.intracellularis的免疫原性组分并包括重组分子、全细胞和细胞提取物。
按照本发明的这一方面,免疫原性组分在筛选针对L.intracellularis的抗体时特别有用,因此,本发明提供了一种用于检测L.intracellularis感染的诊断方案。另外,采用针对免疫原性组分所产生的抗体,可以直接就L.intracellularis筛选生物样品。
因此,本发明提供了一种用于诊断猪中L.intracellularis感染的方法,该方法包括在足以使免疫原性组分-抗体复合物形成的条件下,将来自所述猪的生物样品与结合免疫原性组分有效量的抗体接触一段时间,并检测所述复合物。
免疫原性组分(或抗体)在猪血液、血清或其他体液中的存在可以通过许多种免疫测定技术检测,例如在美国专利4,016,043、4,424,279和4,018,653中所描述的那些。这包括非竞争型单位点和双位点或“夹心”测定以及传统的竞争结合测定。夹心测定是最有用和最常用的测定方法,也适用于本发明。存在各种类型的测定技术且都可以用于本发明。
简言之,在典型的前述测定方法中,将免疫原性组分特异性抗体固定在固体支持物上,形成第一复合物,将免疫原性组分的待测样品引入其中与结合的分子接触。在温育足以使得可以形成抗体-免疫原性组分第二复合物的一段适当的时间后,接着添加由能产生可检测信号的报道分子标记的第二免疫原性组分抗体并温育使得足以可以形成第三复合物的一段时间。洗掉所有没参加反应的物质,通过对报道分子产生的信号的观察检测结合的标记抗体的存在。结果可以定性或定量,定性是通过简单的可视信号观察而定量则是通过与对照样品比较。本发明涉及一系列主题测定的变化方案,包括采用例如来源于L.intracellularis的重组肽、多肽或蛋白质测定L.intracellularis抗体。
固体支持物典型地是玻璃或聚合物,最常用的聚合物有纤维素、聚丙烯酰胺、尼龙、聚苯乙烯、聚氯乙烯或聚丙烯。固体支持物可以是管、珠、圆盘或微碟状的或任何适于进行免疫测定的其他表面。结合方法是本领域熟知的,一般包括交联共价结合或物理吸附分子到不可溶载体上。
本说明书中使用的“报道分子”意指一种分子,由于其本身的化学特性,其产生分析上可辨认的信号,这种信号使得可以检测抗原结合抗体。检测可以是定性或定量的。在这一类型的测定中最常用的报道分子是酶、荧光团或包含放射性核素的分子(即放射性同位素)。在酶免疫测定的情况下,将酶缀合到第二抗体上,其一般是采用戊二醛或过碘酸盐方法。然而,正如容易想到的,有大量的不同的缀合技术存在,它们是本领域技术人员易于使用的。通常使用的酶包括辣根过氧化物酶、葡糖氧化酶、β-半乳糖苷酶和碱性磷酸酶等。与特定的酶一起使用的底物一般选择来在经相应的酶水解后产生可检测的颜色变化。使用产生荧光的底物也是可能的,它可以产生荧光产物。
另外,荧光复合物(如荧光素和罗丹明)可以经化学方法偶联到抗体上而不改变它们的结合能力。经特定波长光照活化后,荧光团标记的抗体吸收光能,诱导分子的激发状态,然后可发射出特有颜色的光,这种光可以用光学显微镜检测到。如在EIA中,使得荧光标记的抗体可以结合到第一抗体-半抗原复合物上。在洗去未结合的试剂后,将剩下的第三复合物暴露在适当波长的光下,可见荧光即表明存在兴趣半抗原。免疫荧光和EIA技术都是本领域非常成熟的并特别适用于本发明的方法,然而,其他报道分子如放射性同位素、化学发光或生物发光分子也都可以使用。如何变更方法以适应于预期目的对技术人员来说是显而易见的。
可以运用一系列遗传诊断测定,如聚合酶链反应(PCR)测定、杂交测定或蛋白质截短测定。所有这些测定方法在本发明中都适用。
本发明进一步由下列非限制性附图和/或实施例描述。
在附图中:
图1是显示被接种的猪识别的L.intracellularis抗原的Western分析的照片。第1道(395)用来源于已用福尔马林杀灭全L.intracellularis疫苗免疫三次的猪(395)的猪血清探查。第2至5道(Y10,Y12,Y14,Y16)用第0天分别来源于猪Y10,Y12,Y14和Y16获得的血清探查。
图2是第20天从猪Y1获得的小肠的照片。
图3是第20天从猪Y2获得的小肠的照片。
图4是第20天从猪Y4获得的小肠的照片。
下列单和三字母缩写用于表示氨基酸残基:
氨基酸 三字母缩写 单字母符号丙氨酸 Ala A精氨酸 Arg R天冬酰胺 Asn N天冬氨酸 Asp D半胱氨酸 Cys C谷氨酰胺 Gln Q谷氨酸 Glu E甘氨酸 Gly G组氨酸 His H异亮氨酸 Ile I亮氨酸 Leu L赖氨酸 Lys K甲硫氨酸 Met M苯丙氨酸 Phe F脯氨酸 Pro P丝氨酸 Ser S苏氨酸 Thr T色氨酸 Trp W酪氨酸 Tyr Y缬氨酸 Val V任何残基 Xaa X
序列鉴别号概述SEQ ID NO. 描 述1 GroEL的核苷酸序列2 GroEL的氨基酸序列3 GroES的核苷酸序列4 GroES的氨基酸序列5 L.intracellularis组分的核苷酸序列6 L.intracellularis组分的核苷酸序列7 SEQ ID NO:6的氨基酸序列8 L.intracellularis组分的核苷酸序列9 SEQ ID NO:8的氨基酸序列(第一编码序列)10 SEQ ID NO:8的氨基酸序列(第二编码序列)11 L.infracellularis组分的核苷酸序列12 SEQ ID NO:11的氨基酸序列13 L.intracellularis组分的核苷酸序列14 SEQ ID NO:13的氨基酸序列15 L.intracellularis组分的核苷酸序列16 SEQ ID NO:15的氨基酸序列17 L.intracellularis组分的核苷酸序列18 L.intracellularis组分的核苷酸序列19 L.intracellularis组分的核苷酸序列20 L.intracellularis组分的核苷酸序列21 L.intracellularis组分的核苷酸序列22 L.intracellularis组分的核苷酸序列23 L.intracellularis组分的核苷酸序列
实施例1 猪组织的来源
感染的猪肠
从由PPE天然感染的或者经实验感染的猪取得很厚的回肠(ilea)段。采用特异性单克隆抗体的免疫荧光染色(10)证实回肠中L.intracellularis细菌的存在。合适的抗体的例子是可以从英国Edinburgh大学获得的单克隆抗体IG4。
实施例2从感染的猪回肠分离LAWSONIA INTRACELLULARIS细菌
通过过滤直接从PPE损伤抽提Lawsonia intracellularis细菌并在Percoll(Pharmacia,Uppsala,瑞典)梯度上进一步纯化。从猪收集感染的回肠,在于-80℃贮存之前,经组织学检测证实Lawsoniaintracellularis细菌的存在。解冻回肠段,并从肠壁刮削大约8g受感染的粘膜。采用Sorvall综合性混合器(omnimixer)在半速下运行10秒以40ml无菌磷酸盐缓冲盐水(PBS)匀化粘膜。将这一悬浮液在2000xg下离心4分钟。弃去上清液,将细胞沉淀重悬于40ml PBS中并再离心。将这一洗涤步骤重复两次。把细胞沉淀重悬于20ml PBS中,并且在全速下运行1分钟进行匀化,以释放L.intracellularis细菌。
将这一匀浆在1000xg下离心4分钟,给出包含匀化的上皮细胞和肠道细菌的粗混合物的沉淀。采用具有3μm,1.2μm和0.8μm孔径大小的滤膜(Millipore公司,MA,美国)过滤上清液。滤液在8000xg下离心30分钟,产生L.intracellularis细菌的少量沉淀。按照如下方法采用45%自形成珀可梯度进一步纯化L.intracellularis细菌:经倒置将2ml细菌制剂混合进30ml 45%自形成珀可(Pharmacia LKB,Uppsala,瑞典)梯度液(45%v/v珀可,150mM NaCl)。于4℃下在20,000rpm下,在Sorval离心机中用SS34转鼓离心该梯度液30分钟。通常,一些带在梯度液内形成。收集包含L.intracellularis细菌的带(通常位于离管底大约10-20mm处),用PBS使体积达到16ml。然后在8000rpm下离心该溶液15分钟。在重悬于最终体积约1ml中之前用PBS洗涤所形成的沉淀。
实施例3 LAWSONIA INTRACELLULARIS基因组DNA的纯化
通过Anderson等(11)和Sambrook等(12)描述的方法,从珀可-梯度纯化的Lawsonia intracellularis细菌(从受感染的猪回肠刮削回收的(实施例2))提取基因组DNA。
实施例4基因组文库的免疫筛选
以每150mm L-肉汤琼脂平板2,000个噬斑-形成单位(pfu)将λZAPII L.intracellularis基因组文库平板接种到大肠杆菌XLI-Blue(23)细胞菌苔上。用在Protoblot技术手册(Promega,WI,USA)中所描述的方法以兔抗L.intracellularis血清筛选该文库。用包含10mM TrisHCl(pH8.0),150mM NaCl,0.05%吐温20,1%w/w明胶的缓冲液封阻滤膜。挑取在初步筛选中鉴定的阳性噬斑,以较低的密度再接种,并且再筛选,直到单个的阳性噬斑被鉴别。
实施例5 cDNA插入物的分离和测序
通过在由Stratagene(CA,美国)推荐的条件下体内切除pBluescript噬粒分离阳性λZAPII噬菌体克隆的噬粒DNA。如制造厂商(应用生物系统)所推荐的,用Birnboim和Doly的方法提取质粒DNA并由链终止法(21)测序cDNA插入序列,或者用PEG-沉淀法提取质粒DNA并由染料-终止剂法循环-测序。
实施例6 抗血清
在兔和猪中产生针对L.intracellularis的抗血清。用与双-乳剂混合的珀可梯度-纯化的L.intracellularis细菌的制剂肌内注射兔,所说的双乳剂是经与油佐剂(弗氏不完全佐剂,CSL有限公司,墨尔本,澳大利亚),然后与吐温80增强剂一起加工制备的。分开在4周给予两次3ml注射(含有9mg蛋白质)。在免疫前和第二次注射后两周从边际耳静脉收集血样。
通过肌内注射珀可梯度-纯化的L.intracellularis细菌(如用于兔的,用弗氏不完全佐剂制备的)超免疫6-周龄猪(395)。分开在4周施用所制备的抗原的三次注射,在最后一次注射后两周从颈静脉采血。在室温和轻轻搅拌下用100μl大肠杆菌DH5α(24)裂解物预吸收稀释的猪血清(1ml,1∶200)1小时。所说的裂解物是由冻结-解冻大肠杆菌在PBS中的悬浮液制备的。
实施例7 十二烷基硫酸钠-聚丙烯酰胺凝胶电泳(SDS-PAGE)
在于1%w/v SDS-12%w/v PAGE垂直平板凝胶(13)上电泳分离溶解的蛋白质之前,将蛋白质样品重悬于50μl样品缓冲液(62.4mM HCl,2%w/v SDS,10%v/v甘油,5%v/v 20巯基乙醇,0.002%溴酚蓝,pH6.8)中,并且加热至95℃5分钟。
实施例8 Western印迹分析
在含有CAPS(3-[环己氨基]-1-丙烷磺酸,pH11,西格玛,MI,美国)和10%v/v甲醇的缓冲液中,在100V下电泳1小时将蛋白质转移到在Trans-印迹池(BioRad,CA,美国)中的Immobilon-P(Millipore公司,MA,美国)膜上。然后在室温和轻轻摇动下用在PBS中的5%w/vBlotto(Diploma脱脂奶粉,墨尔本,澳大利亚)封阻膜30分钟。接着将滤膜转移到用5%w/v Blotto,PBS稀释的抗血清上。以1∶200稀释预吸收的猪抗血清。将滤膜在猪抗血清中温育1小时,其后用PBS洗涤3次。
在1∶2000稀释度下使用HRP缀合的抗-猪免疫球蛋白(DAKO,CA,美国)。将增强的化学发光(ECL,Amersham,IL,美国)用来区别L.intracellularis蛋白质。在ECL检测之前,将印迹洗涤3次,每次7分钟。在显影之前,使滤膜对放射自显影胶片(Agfa,NJ,美国)曝光不足1分钟。
实施例9 GroEL和GroES的鉴别
采用在实施例5中详细描述的方案测序按照实施例4中所描述的免疫筛选方法发现为阳性的克隆。一个分离的克隆代表GroEL蛋白质。SEQ ID NO:1和SEQ ID NO:2中显示了GroEL的核苷酸序列与对应的氨基酸序列。SEQ ID NO:3和SEQ ID NO:4中显示了GroES的核苷酸序列与对应的氨基酸序列。
实施例10 猪粪便中的LAWSONIA INTRACELLULARIS
细胞的免疫荧光检测
用棉签取粪便,然后将样品涂布到玻片上。在使其风干10分钟之后,通过加热到60℃约10秒钟使涂布物热固定。然后用PBS冲洗玻片。加入30μl量的1/200稀释的含有IG4单克隆抗体(参见实施例1)的小鼠腹水,在玻片上盖上玻璃片,在室温下温育玻片40分钟。移去覆盖的玻璃片,并洗涤玻片(PBST,7分钟,3次)。加入30μl量的1/40稀释的FITC缀合的抗小鼠抗血清(Silenus,墨尔本,澳大利亚),在玻片上盖上玻璃片,在室温下温育玻片40分钟。移去覆盖的玻璃片,并洗涤玻片(PBST,7分钟,3次)。将玻片最终在PBS中冲洗。加入1滴10%v/v甘油PBS,在玻片上盖上玻璃片。使用Lietz laborlux S显微镜在高倍(X1200)下于340nm观察荧光细菌。计数20个区域,结果以每一高倍区域的L.intracellularis细菌的平均数表示。
实施例11 福尔马林-杀灭的L.INTRACELLUSARIS疫苗
将珀可梯度纯化的细菌L.intracellularis沉淀重悬于1%福尔马林盐水中,在4℃温育过夜。然后将珀可梯度-纯化的L.intracellularis细菌混合进双-乳剂中,所说的双乳剂是通过用油佐剂(弗氏不完全佐剂,联邦血清实验室,墨尔本,澳大利亚),然后用吐温80增强剂加工制备的。
实施例12 接种方案
从Pig Improvement公司养猪场购得十二头断奶猪(与LargeWhite杂交的Landrace),用新-土霉素(0.25g/kg)处理5天。七天后(第-40天),如所描述的方法接种猪Y10,Y12,Y14和Y16。在第-34天,用长效土霉素治疗猪Y3,Y11和Y13的脓肿。
将十二头猪分成三组,并按照如下进行处理:第1组 感染的对照
将四头猪(耳签号Y1-Y4)与接种的猪一起圈养。第2组 全细菌疫苗
在第-33和-12天,用福尔马林杀灭的L.intracellularis细菌(用0.5ml PBS/弗氏不完全佐剂乳化的)免疫四头猪(耳签号Y10,Y12,Y14和Y16)。第3组 未感染的对照
四头猪(耳签号Y9,Y11,Y13和Y15)不接受处理,并且在与接种的猪和感染的对照猪分开的区域圈养。
实施例13 感染猪的口头激发
从如实施例1所描述的猪收集感染的回肠,在于-80℃贮存之前,经组织学分析证实L.intracellularis的存在。解冻回肠段,从肠壁刮削下约150g感染的粘膜。采用Sorvall综合性混合器在半速下运行20秒以等体积的无菌PBS匀化粘膜。将这一悬浮液用无菌PBS稀释2倍,以形成激发悬液。
在第0天,以5%w/v碳酸氢钠溶液(10ml/kg)对第1组和第2组的猪用药,接着以30ml激发悬液用药。在第1天和第2天重复此操作。
从第11天起,在各猪粪便中的L.intracellularis的数量用免疫荧光监测。监测猪的疾病征兆和排出的L.intracellularis细菌。由于伦理的原因,宰杀掉排出每个高放大率区域100个细菌和腹泻的猪。
在第22天,采用温和的方式处死存活的猪,回收小肠。从接近回盲肠连接处5cm和17cm除去两段小肠。将这些段在10%v/v福尔马林中固定,进行蜡封,并将它们送到不知情的兽医病理学家进行分析。实施例14 被接种的猪识别的LAWSONIA INTRACELLULARIS蛋白质
通过Western印迹分析,接着通过ECL(Amersham,IL,美国)检测(如实施例8所描述的)分析由猪产生的针对接种后的L.intracellularis蛋白质的抗体。结果在图1中显示。接种猪产生针对一系列L.intracellularis蛋白质的抗体。大多数所识别的免疫显性蛋白质为大约62.7Kda,58.7Kda,57.2Kda,44Kda,36.7Kda和两种来自24-26Kda和22-23.5Kda的涂抹物。次要的免疫活性带大约具有下列分子量:67Kda,52.5Kda,50.5Kda,50Kda,48.2KDa,47.9Kda,44.7Kda,43.5Kda,42.5Kda,41.5Kda,40.5Kda,39Kda,35.3Kda,17Kda,15.5Kda,12Kda和7Kda。所识别的蛋白质的分子量会有高达5%的变化,这取决于用于评价的方法。
实施例15 在试验期间L.INTRACELLULARIS细菌从猪排出
在例号12(Y1,Y2和Y4)中,口头激发后的第19天,1组的3头猪(感染的对照)在其粪便中排出的L.intracellularis细菌每个高放大率区域超过100个(表1)。这些猪的2头(Y2和Y4)具有带血的腹泻。在第20天温和地处死所有三头猪。在感染试验过程中,Y3排出低水平的L.intracellularis细菌。Y3的最大细菌排出量是每个高放大率区域16个细菌。
用实施例12中提出的全细菌接种的3组中的所有猪所排出的L.intracellularis细菌每个高放大率区域都不超过3个。与1组猪比较,通过接种猪,接种福尔马林杀灭的L.infracellularis疫苗降低L.infracellularis细菌的总细菌排出达98.5%。
在试验过程中,3组猪(未感染的对照)没有排出任何L.infracellularis细菌。
每头猪排出的L.infracellulari细菌的结果示于表1中。
实施例16 试验A的肉眼可见的病理特征1组 感染的对照
Y1 约5cm末端回肠非常厚。经肉眼观察,没有其它PPE体征是明显的。研究结果与肠腺瘤病相一致(参见图2)
Y2 发现肠非常厚,绒膜有特征性脑形形式(图3)。涉及肠的2.5米的范围。发现肠内腔含有新鲜血液,并且纤维蛋白的脱落明显。增殖性出血性肠病。
Y3 没有肉眼可见的PPE体征是明显的。
Y4 发现肠具有坏死性肠炎(图4)。粘膜表面由纤维蛋白的假膜代替。肠系膜水肿非常明显。涉及肠的2.0米的范围。2组 全L.intracellularis细胞疫苗
Y10 没有肉眼可见的PPE体征。
Y12 没有内眼可见的PPE体征。
Y13 没有肉眼可见的PPE体征。
Y13 没有肉眼可见的PPE体征。3组 未感染的对照
Y9 没有肉眼可见的PPE体征。
Y11 没有肉眼可见的PPE体征。
Y13 没有肉眼可见的PPE体征。
Y15 没有肉眼可见的PPE体征。
实施例17 试验的病理组织学报告
报告基于Jubb等(20)中所建立的病理组织学描述。1组 感染的对照组
Y1 猪肠腺瘤病(PIA)的许多微病灶/汇合损伤与派伊尔氏淋巴集结相关。
Y2 猪肠腺瘤病的严重的普遍(环形)损伤。
Y3 没有PIA的结论性证据。稀疏的微病灶损伤,暗示非特异性温和反应性(恢复性)增生(而非腺瘤病)。
Y4 PIA严重的普遍(环形)损伤。2组 全L.intracellularis细胞疫苗
Y10 没有PIA的结论性证据。
Y12 没有PIA的结论性证据。
Y14 没有PIA的结论性证据。
Y16 没有PIA的结论性证据。PIA的可能的单一微病灶与派伊尔氏淋巴集结相关。3组 未感染的对照
Y11 没有PIA的结论性证据。
Y9 没有PIA的结论性证据。
Y13 没有回收肠,因为在第15天跛行,猪被宰杀掉。
Y15 不可能诊断,由于差的品质段。实施例18利用实验血清从接种的猪免疫筛选L.INTRACELLULARIS文
库
按照实施例3中的描述纯化L.intracellularis基因组DNA。以限制性核酸内切酶Sau3A(Promega)部分消化DNA,并且连接到λZAP IIExpress(Stratagene)上。将λ文库以每150Mm L-肉汤琼脂平板10,000pfu的密度平板接种到大肠杆菌XLI-Blue细胞菌苔上。如实施例4的描述,用Y12的血清筛选文库。如实施例11和12的描述用福尔马林杀灭的L.intracellularis免疫猪Y12。如实施例14所述,接种的猪产生针对一系列L.intracellularis蛋白质的抗体。鉴别表达L.intracellularis蛋白质的一些噬菌体克隆。
实施例19 L.INTRACELLULARIS表达噬菌体克隆的分析
在制造商(Stratagene)推荐的条件下,经体内切割分离阳性λZAPII Express噬菌体克隆的噬粒DNA。通过碱性裂解(如Sambrook等(12)的描述)抽提供限制性分析的质粒DNA,并且如制造商(BoehringerMannheim)的推荐,用高纯质粒试剂盒自动测序。经自动测序(ABIBiosystems)的染色-终止子法完成插入物的DNA测序。所确定的序列在SEQ ID NOS:5-23中显示(参见实施例20)。
实施例20 L.INTRACELLULARIS组分的鉴定
采用BLAST(27)鉴别DNA分子的序列类似性,所说的DNA分子编码实施例18和19限定的推定的疫苗候选者。核苷酸序列SEQ ID NO:6和其对应的氨基酸序列SEQ ID NO:7具有与鞭毛基体杆状蛋白质的序列相似性。SEQ ID NO:8(核苷酸)和SEQ ID NO:9和10(氨基酸)具有与自溶素的序列相似性。SEQ ID NO:11(核苷酸)和SEQ ID NO:12(氨基酸)具有与S-腺苷甲硫氨酸:tRNA核糖基转移酶-异构酶(queuosine生物合成蛋白质queA)的序列相似性。
SEQ ID NO:13(核苷酸)和SEQ ID NO:14(氨基酸)显示出与烯酰-(酰基-载体-蛋白质)还原酶的序列相似性。SEQ ID NO:15(核苷酸)和SEQ ID NO:16(氨基酸)显示出与葡糖二酸转运蛋白的序列相似性。编码推定的疫苗候选者的其它核苷酸序列是SEQ ID NO:5,SEQ IDNO:17,SEQ ID NO:18,SEQ ID NO:19,SEQ ID NO:20,SEQ IDNO:21,SEQ ID NO:22和SEQ ID NO:23。
本领域技术人员会认识到本文所描述的本发明易于进行变化和修改,而不限于具体描述的那些。应当理解,本发明包括所有这样的变化和修改。本发明也包括被说明书中提及的或暗示的所有步骤、特征、组合物和化合物(单一的或集合的),以及任何两个或多个所说步骤或特征的任何或所有组合。
表1
-40天 -33天 -26天 -12天 0天 1天 2天 11天 12天 13天 14天 15天 16天 17天 18天 19天1感染的 1+ 1+ 0 0 5+ 10+ 50+ 100+ 15对照2感染的 0 1+ 1+ 1+ 3+ 1+ 70+ 100+ 100对照3感染的 0 0 0 0 0 0 1+ 4 16对照4感染的 1+ 0 0 10+ 0 5+ 60+ 200+ 80对照 |
20天 21天 22天5cm的增厚PHE 2.5M1+ 0 1PHE 2.0M |
10全细 1ml杀灭的全细胞1ml杀灭的全细胞 0 0 0 0 0 1+ 1+ 0 0菌接种的猪12全细 1ml杀灭的全细胞1ml杀灭的全细胞 1+ 0 0 0 0 2+ 0 0 0菌接种的猪 |
0 0 00 0 0 |
14全细 1ml杀灭的全细胞1ml杀灭的全细胞 0 0 0 0 0 1+ 0 <1 <1菌接种的猪16全细 1ml杀灭的全细胞1ml杀灭的全细胞 0 0 0 0 0 0 0 3 <1菌接种的猪 |
0 0 00 0 0 |
9未感染 0 0 0 0 0 0 0 0 0的对照11未感 0 0 0 0 0 0 0 0 0染的对照13未感 0 0 0 0 杀灭的道染的对照15未感 0 0 0 0 0 0 0 0 0染的对照 |
0 0 00 0 00 0 0 |
参考文献1. Barker,I.K.和Van Dreumel,A.A.(1985)“家养动物的病理学”,第三版,Vol.2 p.1-2 37,编者K.V.F.Jubb,P.C.Kennedy和N.Palmer.(学院出版社:Orlando)。2. Rowland,A.C.和Lawson,G.H.K.(1976)兽医学档案97:178-180。3. Love,R.J.和Love,D.M.(1977)兽医学档案100:473。4. Jonsson,L.和Martinsson,K.(1976)Veterinaria Scandinavica学报17:223-232。5. O′Neil,I.P.A.(1970)兽医学档案87:742-747。6. Straw,B.E.(1990).美国兽医学会杂志197:355-357。7 Stills,H.F.(1991).感染和免疫学59:3227-3236。8. Gebhert,C.J.,Ward,G.E.,Chang,K.和Kurtz,H.J.(1983).美国兽医学研究杂志44:361-367。9. Lawson,G.H.K.,McOrist,S.,Jansi,S.和Mackie,R.A.(1993)临床微生物学杂志31:1136-1142。10. McOrist,S.,Bold,R.,Lawson,G.H.K.和McConnell,I.(1987)兽医学档案121:421-422。11. Anderson,B.J.,M.M.Bills,J.R.Egerton,和J.S.Mattick.(1984)细菌学杂志160:748-754。12. Sambrook,J.,E.F.Fritsch,和T.Maniatis.(1989)分子克隆,实验室手册,第二版,冷泉港实验室,冷泉港,N.Y。13 .Laemmli,U.K.(1970)自然227:680-685。14. McOrist,S,Jasni,S,Mackie,RA,MacIntyre,N,Neef,N.和Lawson GHK(1993)感染和免疫学61:4286-4292。15. Fox,JG,Murphy,JC,Otto,G Pecquet-Goad,ME,Larson,QHK和Scott JA(1989)兽医病理学26:515-517。16. Elwell,MR,Chapman,AL和Frenkel,JK(1981)兽医病理学18:136-139。17. Schodeb,TR和Fox JG(1990)兽医病理学27:73-80。18. Mason,RW,Monkton,P和Hasse D(1995)澳大利亚兽医学杂志(已出版)。19. Manthorpe,M,Cornefert-Jensen,F.,Hartikka,J.,Felgner,J,Rundell,A,Margalith,M和Dwarki,V.(1993)人类基因治疗4:419-431。20. Jubb KVC,Kennedy,PC和Palmer,NC(1993).家养动物病理学,第四版,San Diego,CA,学院出版社pp 229-233。21. Birnboim,HC和Doly J(1979)核酸研究7:1513。22. Sanger,F,Nicklen,S和Coulson,AR(1977)国家科学院院报74:5463。23. Block,WO,Fernandes,JM和Short,JM(1987)生物技术5:376-79。24. Woodcock,DM等(1989)核酸研究17:3469-78。25. Studier,FW等(1990)酶学方法185:60-89。26. McOrist,S等(1995)国际系统细菌学杂志45:820-825。27. Gish,W和States,D.J.(1993)自然遗传学3:266-272。
序列表(1)一般信息:
(i)申请人:(除美国外)DARATECH PTY LTD和PIG RESEARCH
(仅美国)MICHAEL PANACCIO和DETLEF MASSE
(ii)发明名称:治疗和诊断组合物
(iii)序列数:23
(iv)通讯地址:
(A)收信人:DAVI ESCOLLISON CAVE
(B)街道:1 LITTLE COLLINS街
(C)城市:墨尔本
(D)州:维多利亚
(E)国家:澳大利亚
(F)ZIP:3000
(v)计算机可读形式:
(A)介质类型:软盘
(B)计算机:IBM PC兼容机
(C)操作系统:PC-DOS/MS-DOS
(D)软件:PatentIn Relea se#1.0,版本#1.25
(vi)当前申请的资料:
(A)PCT申请
(B)申请日:1996年11月29日
(vii)在先申请的资料:
(A)申请号:PN6911/95
(B)申请日:1995年11月30日
(A)申请号:PN6910/95
(B)申请日:1995年11月30日
(viii)代理人/代理机构信息:
(A)名称:HUGHES DR,E JOHN L(C)参考/证书号:EJH/AF
(ix)电讯信息:
(A)电话:61 39254 2777
(B)传真:61 39254 2770(2)SEQ ID NO:1的信息:
(i)序列特征:
(A)长度:1647个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ii)分子类型:DNA
(ix)特征:
(A)名称/关键词:CDS
(B)位置:1..1647
(xi)序列描述:SEQ ID NO:1:ATG GCT TCT AAA GAA ATC CTT TTT GAT GCT AAA GCC CGT GAA AAA CTT 48Met Ala Ser Lys Glu Ile Leu Phe Asp Ala Lys Ala Arg Glu Lys Leu1 5 10 15TCA CGA GGT GTA GAT AAA CTT GCA AAT GCT GTT AAA GTA ACA CTT GGA 96Ser Arg Gly Val Asp Lys Leu Ala Asn Ala Val Lys Val Thr Leu Gly
20 25 30CCT AAA GGC CGT AAT GTC GTT ATT GAA AAG TCT TTT GGT TCC CCA GTT 144Pro Lys Gly Arg Asn Val Val Ile Glu Lys Ser Phe Gly Ser Pro Val
35 40 45ATT ACA AAA GAT GGT GTA TCT GTT GCA AAA GAA ATT GAA CTT GAA GAT 192Ile Thr Lys Asp Gly Val Ser Val Ala Lys Glu Ile Glu Leu Glu Asp
50 55 60AAG TTT GAA AAT ATG GGC GCT CAA ATG GTT AAA GAA GTA GCT CCC AAA 240Lys Phe Glu Asn Met Gly Ala Gln Met Val Lys Glu Val Ala Pro Lys65 70 75 80ACT AGC GAT ATT GCT GGT GAT GGA ACT ACA ACA GCA ACA GTC CTT GCA 288Thr Ser Asp Ile Ala Gly Asp Gly Thr Thr Thr Ala Thr Val Leu Ala
85 90 95CAA GCT ATT TAT CGT GAA GGT GTA AAA CTT GTA GCA GCT GGT CGT AAT 336Gln Ala Ile Tyr Arg Glu Gly Val Lys Leu Val Ala Ala Gly Arg Asn
100 105 110CCT ATG GCC ATT AAA CGT GGC ATA GAT AAA GCT GTT GTT GCT GTT ACT 38Pro Met Ala Ile Lys Arg Gly Ile Asp Lys Ala Val Val Ala Val Thr
115 120 125AAA GAA CTA AGC GAC ATT ACA AAG CCT ACT CGT GAC CAA AAA GAA ATA 432Lys Glu Leu Ser Asp Ile Thr Lys Pro Thr Arg Asp Gln Lys Glu Ile
130 135 140GCT CAA GTT GGA ACC ATT TCT GCA AAC TCT GAT ACA ACA ATA GGT AAT 480Ala Gln Val Gly Thr Ile Ser Ala Asn Ser Asp Thr Thr Ile Gly Asn145 150 155 160ATC ATA GCT GAA GCT ATG GCT AAA GTT GGA AAA GGA GGT GTT ATC ACA 528Ile Ile Ala Glu Ala Met Ala Lys Val Gly Lys Gly Gly Val Ile Thr
165 170 175GTT GAG GAA GCT AAA GGT CTT GAA ACT ACA TTA GAT GTG GTT GAA GGA 576Val Glu Glu Ala Lys Gly Leu Glu Thr Thr Leu Asp Val Val Glu Gly
180 185 190ATG AAG TTT GAC CGT GGC TAC CTC TCT CCA TAC TTT GTA ACT AAT CCT 624Met Lys Phe Asp Arg Gly Tyr Leu Ser Pro Tyr Phe Val Thr Asn Pro
195 200 205GAG AAA ATG GTT TGT GAA CTT GAT AAC CCT TAT ATC CTT TGT AAT GAG 672Glu Lys Met Val Cys Glu Leu Asp Asn Pro Tyr Ile Leu Cys Asn Glu
210 215 220AAA AAG ATT ACT AGC ATG AAA GAC ATG CTA CCA ATC TTA GAA CAA GTT 720Lys Lys Ile Thr Ser Met Lys Asp Met Leu Pro Ile Leu Glu Gln Val225 230 235 240GCT AAA GTA AAC CGT CCA CTC CTT ATT ATT GCT GAA GAC GTA GAA GGT 768Ala Lys Val Asn Arg Pro Leu Leu Ile Ile Ala Glu Asp Val Glu Gly
245 250 255GAA GCA CTT GCA ACA CTT GTA GTC AAT AAG CTC CGT GGA GCA CTC CAA 816Glu Ala Leu Ala Thr Leu Val Val Asn Lys Leu Arg Gly Ala Leu Gln
260 265 270GTT GTA GCC GTA AAA GCT CCT GGT TTT GGT GAA CGC CGT AAA GCT ATG 864Val Val Ala Val Lys Ala Pro Gly Phe Gly Glu Arg Arg Lys Ala Met
275 280 285CTT GAA GAT ATT GCT ATC CTT ACT GGA GGA GAA GCA ATA TTT GAA GAT 912Leu Glu Asp Ile Ala Ile Leu Thr Gly Gly Glu Ala Ile Phe Glu Asp
290 295 300CGT GGT ATA AAG CTT GAA AAT GTA AGC TTG TCT TCT TTA GGA ACA GCT 960Arg Gly Ile Lys Leu Glu Asn Val Ser Leu Ser Ser Leu Gly Thr Ala305 310 315 320AAA CGT GTA GTT ATT GAC AAA GAA AAT ACT ACT ATC GTT GAT GGT GCT 1008Lys Arg Val Val Ile Asp Lys Glu Asn Thr Thr Ile Val Asp Gly Ala
325 330 335GGA AAA TCA GAA GAT ATT AAA GCT CGA GTT AAA CAA ATT CGT GCA CAA 1056Gly Lys Ser Glu Asp Ile Lys Ala Arg Val Lys Gln Ile Arg Ala Gln
340 345 350ATT GAA GAA ACA AGC TCA GAT TAT GAT CGT GAA AAA CTT CAA GAA CGT 1104Ile Glu Glu Thr Ser Ser Asp Tyr Asp Arg Glu Lys Leu Gln Glu Arg
355 360 365CTT GCA AAA CTT GTT GGT GGA GTA GCT GTT ATC CAT GTT GGA GCT GCT 1152Leu Ala Lys Leu Val Gly Gly Val Ala Val Ile His Val Gly Ala Ala
370 375 380ACT GAA ACT GAA ATG AAA GAG AAG AAG GAT CGT GTA GAA GAT GCT CTA 1200Thr Glu Thr Glu Met Lys Glu Lys Lys Asp Arg Val Glu Asp Ala Leu385 390 395 400AAT GCA ACA AGA GCT GCG GTT GAA GAA GGT ATT GTC CCT GGT GGT GGT 1248Asn Ala Thr Arg Ala Ala Val Glu Glu Gly Ile Val Pro Gly Gly Gly
405 410 415ACT GCT TTT GTC CGC TCC ATT AAA GTC CTT GAT GAT ATT AAA CCT GCT 1296Thr Ala Phe Val Arg Ser Ile Lys Val Leu Asp Asp Ile Lys Pro Ala
420 425 430GAT GAT GAT GAA CTT GCT GGA CTT AAT ATC ATC CGT CGT TCT CTT GAA 1344Asp Asp Asp Glu Leu Ala Gly Leu Asn Ile Ile Arg Arg Ser Leu Glu
435 440 445GAG CCT TTA CGT CAA ATT GCT GCA AAT GCT GGC TAT GAA GGT TCT ATT 1392Glu Pro Leu Arg Gln Ile Ala Ala Asn Ala Gly Tyr Glu Gly Ser Ile
450 455 460GTT GTA GAA AAA GTT CGT GAA CCA AAA GAT GGT TTT GGA TTT AAT GCT 1440Val Val Glu Lys Val Arg Glu Pro Lys Asp Gly Phe Gly Phe Asn Ala465 470 475 480GCA TCA GGA GAA TAT GAA GAC CTT ATT AAA GCT GGT GTC ATT GAT CCT 1488Ala Ser Gly Glu Tyr Glu Asp Leu Ile Lys Ala Gly Val Ile Asp Pro
485 490 495AAA AAA GTT ACA CGT ATT GCA TTA CAA AAT GCA GCA TCA GTA GCC TCC 1536Lys Lys Val Thr Arg Ile Ala Leu Gln Asn Ala Ala Ser Val Ala Ser
500 505 510TTA CTT CTA ACT ACA GAA TGC GCT ATT GCT GAA AAA CCA GAA CCT AAA 1584Leu Leu Leu Thr Thr Glu Cys Ala Ile Ala Glu Lys Pro Glu Pro Lys
515 520 525AAA GAT ATG CCT ATG CCT GGC GGT GGT ATG GGT GGT ATG GGT GGT ATG 1632Lys Asp Met Pro Met Pro Gly Gly Gly Met Gly Gly Met Gly Gly Met
530 535 540GAC GGT ATG TAC TAG 1647Asp Gly Met Tyr545(2)SEQ ID NO:2的信息:
(i)序列特征:
(A)长度:548个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线性
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:2:Met Ala Ser Lys Glu Ile Leu Phe Asp Ala Lys Ala Arg Glu Lys Leu1 5 10 15Ser Arg Gly Val Asp Lys Leu Ala Asn Ala Val Lys Val Thr Leu Gly
20 25 30Pro Lys Gly Arg Asn Val Val Ile Glu Lys Ser Phe Gly Ser Pro Val
35 40 45Ile Thr Lys Asp Gly Val Ser Val Ala Lys Glu Ile Glu Leu Glu Asp
50 55 60Lys Phe Glu Asn Met Gly Ala Gln Met Val Lys Glu Val Ala Pro Lys65 70 75 80Thr Ser Asp Ile Ala Gly Asp Gly Thr Thr Thr Ala Thr Val Leu Ala
85 90 95Gln Ala Ile Tyr Arg Glu Gly Val Lys Leu Val Ala Ala Gly Arg Asn
100 105 110Pro Met Ala Ile Lys Arg Gly Ile Asp Lys Ala Val Val Ala Val Thr
115 120 125Lys Glu Leu Ser Asp Ile Thr Lys Pro Thr Arg Asp Gln Lys Glu Ile
130 135 140Ala Gln Val Gly Thr Ile Ser Ala Asn Ser Asp Thr ThrIle Gly Asn145 150 155 160Ile Ile Ala Glu Ala Met Ala Lys Val Gly Lys Gly Gly Val Ile Thr
165 170 175Val Glu Glu Ala Lys Gly Leu Glu Thr Thr Leu Asp Val Val Glu Gly
180 185 190Met Lys Phe Asp Arg Gly Tyr Leu Ser Pro Tyr Phe Val Thr Asn Pro
195 200 205Glu Lys Met Val Cys Glu Leu Asp Asn Pro Tyr Ile Leu Cys Asn Glu
210 215 220Lys Lys Ile Thr Ser Met Lys Asp Met Leu Pro Ile Leu Glu Gln Val225 230 235 240Ala Lys Val Asn Arg Pro Leu Leu Ile Ile Ala Glu Asp Val Glu Gly
245 250 255Glu Ala Leu Ala Thr Leu Val Val Asn Lys Leu Arg Gly Ala Leu Gln
260 265 270Val Val Ala Val Lys Ala Pro Gly Phe Gly Glu Arg Arg Lys Ala Met
275 280 285Leu Glu Asp Ile Ala Ile Leu Thr Gly Gly Glu Ala Ile Phe Glu Asp
290 295 300Arg Gly Ile Lys Leu Glu Asn Val Ser Leu Ser Ser Leu Gly Thr Ala305 310 315 320Lys Arg Val Val Ile Asp Lys Glu Asn Thr Thr Ile Val Asp Gly Ala
325 330 335Gly Lys Ser Glu Asp Ile Lys Ala Arg Val Lys Gln Ile Arg Ala Gln
340 345 350Ile Glu Glu Thr Ser Ser Asp Tyr Asp Arg Glu Lys Leu Gln Glu Arg
355 360 365Leu Ala Lys Leu Val Gly Gly Val Ala Val Ile His Val Gly Ala Ala
370 375 380Thr Glu Thr Glu Met Lys Glu Lys Lys Asp Arg Val Glu Asp Ala Leu385 390 395 400Asn Ala Thr Arg Ala Ala Val Glu Glu Gly Ile Val Pro Gly Gly Gly
405 410 415Thr Ala Phe Val Arg Ser Ile Lys Val Leu Asp Asp Ile Lys Pro Ala
420 425 430Asp Asp Asp Glu Leu Ala Gly Leu Asn Ile Ile Arg Arg Ser Leu Glu
435 440 445Glu Pro Leu Arg Gln Ile Ala Ala Asn Ala Gly Tyr Glu Gly Ser Ile
450 455 460Val Val Glu Lys Val Arg Glu Pro Lys Asp Gly Phe Gly Phe Asn Ala465 470 475 480Ala Ser Gly Glu Tyr Glu Asp Leu Ile Lys Ala Gly Val Ile Asp Pro
485 490 495Lys Lys Val Thr Arg Ile Ala Leu Gln Asn Ala Ala Ser Val Ala Ser
500 505 510Leu Leu Leu Thr Thr Glu Cys Ala Ile Ala Glu Lys Pro Glu Pro Lys
515 520 525Lys Asp Met Pro Met Pro Gly Gly Gly Met Gly Gly Met Gly Gly Met
530 535 540Asp Gly Met Tyr545(2)SEQ ID NO:3的信息:
(i)序列特征:
(A)长度:306个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ii)分子类型:DNA
(ix)特征:
(A)名称/关键词:CDS
(B)位置:1..306
(xi)序列描述:SEQ ID NO:3:ATG AAC CTG AAA CCT TTG AAT GAC CGT GTT TTA GTA AAA CGT CTT GAA 48Met Asn Leu Lys Pro Leu Asn Asp Arg Val Leu Val Lys Arg Leu Glu1 5 10 15TCT GAA GAA AAA ACA GCT GGT GGA CTC TAT ATC CCT GAT ACT GCT AAA 96Ser Glu Glu Lys Thr Ala Gly Gly Leu Tyr Ile Pro Asp Thr Ala Lys
20 25 30GAA AAA CCA TCT CGT GGT GAA GTT GTT GCT GTT GGA CCT GGT AAA CAT 144Glu Lys Pro Ser Arg Gly Glu Val Val Ala Val Gly Pro Gly Lys His
35 40 45ACA GAT GAT GGT AAA TTA ATA CCT ATG GCT GTA AAA GCA GGA GAT ACA 192Thr Asp Asp Gly Lys Leu Ile Pro Met Ala Val Lys Ala Gly Asp Thr
50 55 60GTT CTT TTT AAT AAG TAT GCA GGA ACA GAA GTA AAG CTT GAT GGT GTA 240Val Leu Phe Asn Lys Tyr Ala Gly Thr Glu Val Lys Leu Asp Gly Val65 70 75 80GAG CAT CTA GTT ATG CGT GAA GAT GAC ATC CTA GCT GTT ATT ACT GGA 288Glu His Leu Val Met Arg Glu Asp Asp Ile Leu Ala Val Ile Thr Gly
85 90 95GAA ACT GGC CGC AAG TGA 306Glu Thr Gly Arg Lys *
100(2)SEQ ID NO:4的信息:
(i)序列特征:
(A)长度:101个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线性
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:4:Met Asn Leu Lys Pro Leu Asn Asp Arg Val Leu Val Lys Arg Leu Glu1 5 10 15Ser Glu Glu Lys Thr Ala Gly Gly Leu Tyr Ile Pro Asp Thr Ala Lys
20 25 30Glu Lys Pro Ser Arg Gly Glu Val Val Ala Val Gly Pro Gly Lys His
35 40 45Thr Asp Asp Gly Lys Leu Ile Pro Met Ala Val Lys Ala Gly Asp Thr
50 55 60Val Leu Phe Asn Lys Tyr Ala Gly Thr Glu Val Lys Leu Asp Gly Val65 70 75 80Glu His Leu Val Met Arg Glu Asp Asp Ile Leu Ala Val Ile Thr Gly
85 90 95Glu Thr Gly Arg Lys
100(2)SEQ ID NO:5的信息:(i)序列特征:
(A)长度:4972个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性(ii)分子类型:DNA(xi)序列描述:SEQ ID NO:5:AACTCCTGGT CTATCAAGAT CAACTAAAAA ATATTCTTTA TCTAATAGTT 50GCTCAAAAAT AATTGTACCT ACAGGTAAAT GAAGAATCAA ATCTTCCCCT 100TTTTTACCAT GACGCTGGCT CCCTTTACCA CCTTCTCCAT TTTGAGCTCT 150ATAGTGACGT TGCACACGAA AATCATAAAG GGTTAACAAA CGTGAATCAG 200CTTTAAAAAT TATATTACCT CCATCTCCTC CATCCCCTCC ATTAGGTCCA 250CCTTTAGGTA TAAACTTTTC GCGTCTAAAT GAAACACATC CATTTCCACC 300TTTTCCTGCG CTCACGCTAA TAGTTACTTC ATCAACAAAA CGCATGATTA 350TCCTTTCAAT AACAAATATC TATTCAATAC TGTTACTAAC TTGTTTACTG 400TTTTTTCTAG AAAATTACCT GGCTAATTAT TATAGTTATA TCTAGATTAA 450TGAAAAAGGA AGAAGTCATT ACACTCCTTC CTTATTAATA GAATCCTGGA 500ATAATTATTA TACGGTGGGT TGTATATGCA CTCTACTATA TCTTTTACAT 550TTACGAAAAT ATGTTTCATA AGTTACTATA CCATTAACTT TTGCAAATAA 600AGTATAGTCT CTTCCCATTC CAACATTTTC TCCAGGATGA ATTTTTGTAC 650CTAGTTGACG AACAAGGATA TTGCCTGCCA AGACTTTCTG GCCGCCGAAA 700CGCTTTATAC CACGACGTTG TCCTGGACTA TCTCTACCAT TGCGAGAACT 750TCCACCAGCT TTCTTATGGG CCATTTTAAT ATCTCCTTAA AGCTGAATAC 800CTGTTACTTT TAGAGCTGTA TAGTCTTGAC GATGACCTTG GAGTTTACGT 850GAGTCATTTC TTCTCCACTT TTTAAAAACA AGAATTTTTT TATCACGACC 900ATGCTCAAGA ACTTTAGCTA TAACTTTAGC ATTATTAATA TATGGTGTTC 950CAATTTGAGG AGATGAACCA CCAATCATAA AAATTTTATC AAAAAAAATT 1000TCTGTTCCAA CTTCAGCGTC TATTTTAGAA ACAAAAATTT TAGAACCCTC 1050TTCAACACAG AATTGTTTTC CACCAGCTTC AATAATTGCG TACATAAATA 1100ATGTGCCTCC CAAAAAAGAC AAGAAATACT AATTTGATAT TTTCAATATT 1150GTCAAGTAGG AACTTTATCT TTAGAATGTT AGATGTAACA ATTTTTTTAG 1200AAAAAAAATA TTTTCAATAC AATAGGAAAA GAGGAAAAAA AAAAAGATTT 1250TTAGAAAAAA TTTTTATTTC TCCAAAAAAT GCAAAAATAT AAAAAATTCT 1300AATAGGATAG AAGTTATTAC TGTATTGATT TTCAAGACTT ACTTAAAAAT 1350TTTTATAAAA AAATTTGCAT TCCCCTCTTC CCAATTCCCA TAGAGAAGAT 1400TATTTATCCT AACGATTGGT GGACGCTAAG TCCCTGCTGT TTTGATTATA 1450TATCAAATGT TGAAACAAAT TTTGTTTAGT TTCTTTTTGT ACTCTAAAAA 1500GAAGACAAAA AATTCTTTAT AAACTGTACA CTCTAAACAA AATAGTTCAC 1550AATAAACAGC AATACATTAT AATTAATTGG AGGATACTAT TGTCATGAAC 1600CTGAAACCTT TGAATGACCG TGTTTTAGTA AAACGTCTTG AATCTGAAGA 1650AAAAACAGCT GGTGGACTCT ATATCCCTGA TACTGCTAAA GAAAAACCAT 1700CTCGTGGTGA AGTTGTTGCT GTTGGACCTG GTAAACATAC AGATGATGGT 1750AAATTAATAC CTATGGCTGT AAAAGCAGGA GATACAGTTC TTTTTAATAA 1800GTATGCAGGA ACAGAAGTAA AGCTTGATGG TGTAGAGCAT CTAGTTATGC 1850GTGAAGATGA CATCCTAGCT GTTATTACTG GAGAAACTGG CCGCAAGTGA 1900AAAAGGCGTA AATAAAAAGA TCGGTGATCT TTAATAATTT TATTCAGTTA 1950TAATGAAAAC ACTAATTACA CGCACTCTCT GAGAATTTTC TCAGAAAACT 2000ATATTTAACA ATTCTAAAAT CGATATGTTT TTAGGAGGAA AACCCTAATG 2050GCTTCTAAAG AAATCCTTTT TGATGCTAAA GCCCGTGAAA AACTTTCACG 2100AGGTGTAGAT AAACTTGCAA ATGCTGTTAA AGTAACACTT GGACCTAAAG 2150GCCGTAATGT CGTTATTGAA AAGTCTTTTG GTTCCCCAGT TATTACAAAA 2200GATGGTGTAT CTGTTGCAAA AGAAATTGAA CTTGAAGATA AGTTTGAAAA 2250TATGGGCGCT CAAATGGTTA AAGAAGTAGC TCCCAAAACT AGCGATATTG 2300CTGGTGATGG AACTACAACA GCAACAGTCC TTGCACAAGC TATTTATCGT 2350GAAGGTGTAA AACTTGTAGC AGCTGGTCGT AATCCTATGG CCATTAAACG 2400TGGCATAGAT AAAGCTGTTG TTGCTGTTAC TAAAGAACTA AGCGACATTA 2450CAAAGCCTAC TCGTGACCAA AAAGAAATAG CTCAAGTTGG AACCATTTCT 2500GCAAACTCTG ATACAACAAT AGGTAATATC ATAGCTGAAG CTATGGCTAA 2550AGTTGGAAAA GGAGGTGTTA TCACAGTTGA GGAAGCTAAA GGTCTTGAAA 2600CTACATTAGA TGTGGTTGAA GGAATGAAGT TTGACCGTGG CTACCTCTCT 2650CCATACTTTG TAACTAATCC TGAGAAAATG GTTTGTGAAC TTGATAACCC 2700TTATATCCTT TGTAATGAGA AAAAGATTAC TAGCATGAAA GACATGCTAC 2750CAATCTTAGA ACAAGTTGCT AAAGTAAACC GTCCACTCCT TATTATTGCT 2800GAAGACGTAG AAGGTGAAGC ACTTGCAACA CTTGTAGTCA ATAAGCTCCG 2850TGGAGCACTC CAAGTTGTAG CCGTAAAAGC TCCTGGTTTT GGTGAACGCC 2900GTAAAGCTAT GCTTGAAGAT ATTGCTATCC TTACTGGAGG AGAAGCAATA 2950TTTGAAGATC GTGGTATAAA GCTTGAAAAT GTAAGCTTGT CTTCTTTAGG 3000AACAGCTAAA CGTGTAGTTA TTGACAAAGA AAATACTACT ATCGTTGATG 3050GTGCTGGAAA ATCAGAAGAT ATTAAAGCTC GAGTTAAACA AATTCGTGCA 3100CAAATTGAAG AAACAAGCTC AGATTATGAT CGTGAAAAAC TTCAAGAACG 3150TCTTGCAAAA CTTGTTGGTG GAGTAGCTGT TATCCATGTT GGAGCTGCTA 3200CTGAAACTGA AATGAAAGAG AAGAAGGATC GTGTAGAAGA TGCTCTAAAT 3250GCAACAAGAG CTGCGGTTGA AGAAGGTATT GTCCCTGGTG GTGGTACTGC 3300TTTTGTCCGC TCCATTAAAG TCCTTGATGA TATTAAACCT GCTGATGATG 3350ATGAACTTGC TGGACTTAAT ATCATCCGTC GTTCTCTTGA AGAGCCTTTA 3400CGTCAAATTG CTGCAAATGC TGGCTATGAA GGTTCTATTG TTGTAGAAAA 3450AGTTCGTGAA CCAAAAGATG GTTTTGGATT TAATGCTGCA TCAGGAGAAT 3500ATGAAGACCT TATTAAAGCT GGTGTCATTG ATCCTAAAAA AGTTACACGT 3550ATTGCATTAC AAAATGCAGC ATCAGTAGCC TCCTTACTTC TAACTACAGA 3600ATGCGCTATT GCTGAAAAAC CAGAACCTAA AAAAGATATG CCTATGCCTG 3650GCGGTGGTAT GGGTGGTATG GGTGGTATGG ACGGTATGTA CTAGTCCTAT 3700CTTCAGTACA ACTTAGATGT ATAAAAACCC CAGAAGCAAT GCTTCCGGGG 3750TTTTATACTT TCAGCATAAA AAATTAATAT TTAATATACA GACACATTAT 3800TTTGGTATTT ATTATTTATT ATGATCAAAT ATATAGACTG GATACAAAAA 3850ACAACAATGA TGTTTAAAAA GGCAGGGATA GATTCACCAA AACTCTCTGC 3900AGAACTTATA TTAAGTCATG TTTTAAATAT TACACGATTA CAAATAATAA 3950TGACTCCTTT TGAACCTATT CCAACTAATA GCTACTCAAC GCTTAATGAT 4000ATCATGTTAA GAAGACTCCA TGGAGAACCA ATTGCATATC TCACAGGGAA 4050AAAAGAATTT TTTTCACGAG AATTTAAAGT CACTCAAGCC ACACTTATCC 4100CTCGCCCAGA GACAGAGTTA CTTATAGAAT TTGTATTAAA CCATATTAAC 4150CCAACACAAC AAATATACTT TGCAGACTTA GGTACAGGTA GTGGGTGTAT 4200TGCAATTACA CTAGCTGCTG AAAGAAAAAA TTGGTTAGGT ATTGCTACTG 4250ATATCTCTAG TGAAGCATTA AAAATAGCTA AACTTAATAG TTTAAAAAAT 4300AACACTCATA GTCAACTACA GTTTCTTCAA TCAGATTTTA CACAACCACT 4350CTGTCTACCC TCTTCATTAG ACTTATATAT CAGTAATCCT CCATATATAA 4400GTGAAAATGA ACTGACCTCT CTTCCGCATG AAGTAATATC TTTTGAACCT 4450AAAATAGCTC TTACACCACA TAAATGTATT CATCTTGATG AAATAAATAC 4500CGTTTTACAC TGCTATAAAA AAATTATTAC CCAAGCAGAG ATATCCCTTA 4550AGCCTGGAGG AATAATAATT TTAGAACATG GAGCAACACA AGCAGAAGCT 4600ATCTTATTGT TGTTAAAAAA CAACATATGG ACAAATGTAA TAAGTCATAC 4650TGATCTTACA AATAAAAATC GTTTTATTAC AGCATATAAG TATAAAATAT 4700AACTTAATTA TGTTGKagAa AAAACAAAAA ATAAAAATAA GATATtAAaT 4750ATTTtttttA aTAAAATTAA GCAAtTACTA ATATCTTTTT TTGGrTCGtt 4800yaTtGsATwA GAAACTTTGG rGGrTrrCTa TGAACAAACA ACCATnCAAC 4850GGCCAAnTAC ATnnCAGGnT TGGGGTCATA GGGGCCACGC TTTATGTACG 4900TACAACCCCn ACTGAAATTC TGGnTTGnTT TGGGGGGnAA nTGGGTATCG 4950CAACnCTnTC CCCCCCCCCT GG 4972(2)SEQ ID NO:6的信息:(i)序列特征:
(A)长度:569个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性(ii)分子类型:DNA(ix)特征:
(A)名称/关键词:CDS
(B)位置:209..569
(xi)序列描述:SEQ ID NO:6:GGTTAAAAAG TAAGGAGAAA AGGTTGGTTA AACCAAGTTT AAAAAATTAA TTTTTTTTTA 60TTACCCAAAA AAGTTTATTA GATTAAGTAA TATTAATTTG GCCCAAAAAT TTTTTTGGGC 120ATGGGTTTTT TGCTTTTAAA ATAGAGATGT GTAGGTAACA TTTTTTCCTC CATGAAATTA 180TTTTTTAGGA GATGTTATCA TGATGGGG AGT TTG TTT ATT GNT GCG AAC AGG 232
Ser Leu Phe Ile Xaa Ala Asn Arg
1 5TAT GAA AAC CCA TAG NAC AGG GNT GGT ACT GTC TCC AAT AAT ATT GCT 280Tyr Glu Asn Pro * Xaa Arg Xaa Gly Thr Val Ser Asn Asn Ile Ala
10 15 20AAC GCA AAT ACC ATT GGG TAT AAG CAG CAA CAG GTA GTG TTT CAA GAC 328Asn Ala Asn Thr Ile Gly Tyr Lys Gln Gln Gln Val Val Phe Gln Asp25 30 35 40CTG TTT AGT CAA GAT TTA GCA ATA GGT TTT ACT GGA AGT CAG GGG CCA 376Leu Phe Ser Gln Asp Leu Ala Ile Gly Phe Thr Gly Ser Gln Gly Pro
45 50 55AAC CAG GCT GGT ATG GGA GCA CAG GTG GGA AGT GTT CGC ACA ATT TTT 424Asn Gln Ala Gly Met Gly Ala Gln Val Gly Ser Val Arg Thr Ile Phe
60 65 70ACA CAG GGT GCT TTT GAA CCT GGC AAT AGT GTA ACA GAT CCT GCT ATT 472Thr Gln Gly Ala Phe Glu Pro Gly Asn Ser Val Thr Asp Pro Ala Ile
75 80 85GGT GGA AAA GGT TTT TTT CAG GTT ACA TTA GAG GAT AAA GTA CAC TAT 520Gly Gly Lys Gly Phe Phe Gln Val Thr Leu Glu Asp Lys Val His Tyr
90 95 100ACA CGA GCA GGG AAT TTT CGT TTT ACT CAA GAT GGT TTT TTA AAT GAT C 569Thr Arg Ala Gly Asn Phe Arg Phe Thr Gln Asp Gly Phe Leu Asn Asp105 110 115 120(2)SEQ ID NO:7的信息:
(i)序列特征:
(A)长度:123个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线性
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:7:Ser Leu Phe Ile Xaa Ala Asn Arg Tyr Glu Asn Pro * Xaa Arg Xaa1 5 10 15Gly Thr Val Ser Asn Asn Ile Ala Asn Ala Asn Thr Ile Gly Tyr Lys
20 25 30Gln Gln Gln Val Val Phe Gln Asp Leu Phe Ser Gln Asp Leu Ala Ile
35 40 45Gly Phe Thr Gly Ser Gln Gly Pro Asn Gln Ala Gly Met Gly Ala Gln
50 55 60Val Gly Ser Val Arg Thr Ile Phe Thr Gln Gly Ala Phe Glu Pro Gly65 70 75 80Asn Ser Val Thr Asp Pro Ala Ile Gly Gly Lys Gly Phe Phe Gln Val
85 90 95Thr Leu Glu Asp Lys Val His Tyr Thr Arg Ala Gly Asn Phe Arg Phe
100 105 110Thr Gln Asp Gly Phe Leu Asn Asp
115 120(2)SEQ ID NO:8的信息:
(i)序列特征:
(A)长度:1450个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ii)分子类型:DNA
(ix)特征:
(A)名称/关键词:CDS
(B)位置:3..414
(ix)特征:
(A)名称/关键词:CDS
(B)位置:108 3..1450
(xi)序列描述:SEQ ID NO:8:GA TCT AAA GAG TCT ACA TAT ATT GCC CGA ATT GAA AAT TCT ACA AGT 47Ser Lys Glu Ser Thr Tyr Ile Ala Arg Ile Glu Asn Ser Thr Ser
1 5 10 15GAA AAA ACA CTA AAT GAT CTT GAT ATA CTT TTA AAA GAT GTG ATG TTA 95Glu Lys Thr Leu Asn Asp Leu Asp Ile Leu Leu Lys Asp Val Met Leu
20 25 30ACA TCA AAA AAG CAT GAA TCA CGT AGA CTT GCA GAG TCT GTA CAT CAA 143Thr Ser Lys Lys His Glu Ser Arg Arg Leu Ala Glu Ser Val His Gln
35 40 45AAT ATT CTT ACC CAC CTT ATA CAA AAA AAT TAT AAT ACT CAC AAT GGT 191Asn Ile Leu Thr His Leu Ile Gln Lys Asn Tyr Asn Thr His Asn Gly
50 55 60GGG ATA AAA TCT GCA CCT TTT CAT GTT CTT ATA GGA CCC AAA ATA CCA 239Gly Ile Lys Ser Ala Pro Phe His Val Leu Ile Gly Pro Lys Ile Pro
65 70 75AGT ATT CTT GTT GAA GTA GGT TAC TGT AGT AAT AAA GCT GAA GCA CAG 287Ser Ile Leu Val Glu Val Gly Tyr Cys Ser Asn Lys Ala Glu Ala Gln80 85 90 95CGT CTG GCA TCT AGT AAT TAC CAA AAA GCA TTA ATA GAA GGA TTA GCT 335Arg Leu Ala Ser Ser Asn Tyr Gln Lys Ala Leu Ile Glu Gly Leu Ala
100 105 110AAA GGT ATT TTC TGT TAC CTA AAA AAA CTA CAT CAC CTT GAT ATT TAC 383Lys Gly Ile Phe Cys Tyr Leu Lys Lys Leu His His Leu Asp Ile Tyr
115 120 125TCT AGT TTT ATY CTA TCT AAT TGC ACT TAA T AGCTTGGACA ATTATTATAT 434Ser Ser Phe Ile Leu Ser Asn Cys Thr *
130 135GAAGGGTATC CATGTGAAGG TACCTGGTTA AGCTTTTAAA TGTAAAAATT ATGCAACCAT 494ACYTTATTCC TTCAGAGGAG CTTCATTATG AAAGTAAAAA CTCTTTCCAT GGCTATTTTA 554GCTTGTTTAT TAGTAGCTAA CAGTGCATTT TCGGCTGACT TCCCTATTGG TGTCTTTAAT 614TCTCAATCCA TTGCCATGGA GAGTGAAGCA GCTAAGGCCG CTCAAAAAAA ATTACAATCA 674GAATTTGGTA ATGAAAAAAC ACAACTTGAA AACAAGCAAA AGWTTGCMAA CAAAAGCTGA 734TGATTTACAA GCTWAGTCAG CAGCTATGTY TAACCAAGCA CGTGAAGATA AACAAAGAGA 794ATTTCTTGAA CTTCGTCGTA ATTTCGAAGA AAAATYTCGT GACTTTGCAA TACGTGTCGA 854ACAAGCTGAA AACACATTAC GTCAATATNT AGCTGAACAA ATNTATNTTG CTGCTGAAAC 914TATAGCAAAA AAGAAAGGGT TAAACTTGTT TTGATAGTGT TAGGGAAGTG TAATGTACCT 974TGAAAAAAAT TTAGATATTA CAAAGAAATT YTTGAAGCCA TAAATGCTGC ATGGAAAAAA 1034GGTGGAAGTA AACTTCCAGA GATGGCAAAC CGGAAAAAAT AACAG ATG CCC CAG TAT 1091
Met Pro Gln Tyr
1AAA CTT TCA GAA ATT GCT AAA CTT TTA AAC TTA ACA TTA CAA GGT GAT 1139Lys Leu Ser Glu Ile Ala Lys Leu Leu Asn Leu Thr Leu Gln Gly Asp5 10 15 20GAT ATT GAA GTT GTA GGC GTA AAT ACA CTT CAA GAT GCA TCA CCA AAT 1187Asp Ile Glu Val Val Gly Val Asn Thr Leu Gln Asp Ala Ser Pro Asn
25 30 35GAG ATA AGT TTT CTA GCA AAT GCT AAA TAT ATT CAC CAG CTT GTT TTG 1235Glu Ile Ser Phe Leu Ala Asn Ala Lys Tyr Ile His Gln Leu Val Leu
40 45 50TCA CAG GCT GGT GCT ATT ATT CTT TCA AAA GAA TAT GCT AGT CGT GTT 1283Ser Gln Ala Gly Ala Ile Ile Leu Ser Lys Glu Tyr Ala Ser Arg Val
55 60 65CCA CGA GCA CTA ATC AGT ACT GAA CCA TAT AGA GAT TTT GGT AGA GTT 1331Pro Arg Ala Leu Ile Ser Thr Glu Pro Tyr Arg Asp Phe Gly Arg Val
70 75 80CTT TCT TTA TTC TCT ATA CCT CAA GGA TGT TTT GAT GGT ATA AGT CAT 1379Leu Ser Leu Phe Ser Ile Pro Gln Gly Cys Phe Asp Gly Ile Ser His85 90 95 100CAA GCT TAT ATA CAC CCT ACA GCA CAA GTC TCT AAA ACA GCT ACT ATC 1427Gln Ala Tyr Ile His Pro Thr Ala Gln Val Ser Lys Thr Ala Thr Ile
105 110 115TAT CCT TTn GTT TTT ATA GGA TC 1450Tyr Pro Xaa Val Phe Ile Gly
120(2)SEQ ID NO:9的信息:
(i)序列特征:
(A)长度:137个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线性
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:9:Ser Lys Glu Ser Thr Tyr Ile Ala Arg Ile Glu Asn Ser Thr Ser Glu1 5 10 15Lys Thr Leu Asn Asp Leu Asp Ile Leu Leu Lys Asp Val Met Leu Thr
20 25 30Ser Lys Lys His Glu Ser Arg Arg Leu Ala Glu Ser Val His Gln Asn
35 40 45Ile Leu Thr His Leu Ile Gln Lys Asn Tyr Asn Thr His Asn Gly Gly
50 55 60Ile Lys Ser Ala Pro Phe His Val Leu Ile Gly Pro Lys Ile Pro Ser65 70 75 80Ile Leu Val Glu Val Gly Tyr Cys Ser Asn Lys Ala Glu Ala Gln Arg
85 90 95Leu Ala Ser Ser Asn Tyr Gln Lys Ala Leu Ile Glu Gly Leu Ala Lys
100 105 110Gly Ile Phe Cys Tyr Leu Lys Lys Leu His His Leu Asp Ile Tyr Ser
115 120 125Ser Phe Ile Leu Ser Asn Cys Thr
130 135(2)SEQ ID NO:10的信息:
(i)序列特征:
(A)长度:123个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线性
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:10:Pro Gln Tyr Lys Leu Ser Glu Ile Ala Lys Leu Leu Asn Leu Thr Leu1 5 10 15Gln Gly Asp Asp Ile Glu Val Val Gly Val Asn Thr Leu Gln Asp Ala
20 25 30Ser Pro Asn Glu Ile Ser Phe Leu Ala Asn Ala Lys Tyr Ile His Gln
35 40 45Leu Val Leu Ser Gln Ala Gly Ala Ile Ile Leu Ser Lys Glu Tyr Ala
50 55 60Ser Arg Val Pro Arg Ala Leu Ile Ser Thr Glu Pro Tyr Arg Asp Phe65 70 75 80Gly Arg Val Leu Ser Leu Phe Ser Ile Pro Gln Gly Cys Phe Asp Gly
85 90 95Ile Ser His Gln Ala Tyr Ile His Pro Thr Ala Gln Val Ser Lys Thr
100 105 110Ala Thr Ile Tyr Pro * Val Phe Ile Gly
115 120(2)SEQ ID NO:11的信息:
(i)序列特征:
(A)长度:559个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ii)分子类型:DNA
(ix)特征:
(A)名称/关键词:CDS
(B)位置:3..557
(xi)序列描述:SEQ ID NO:11:GA TCA AAG CCG CAT TTA CNG CAA GAG TTA GAA ATT GAA GTT TTG AAA 47Ser Lys Pro His Leu Xaa Gln Glu Leu Glu Ile Glu Val Leu Lys
1 5 10 15AAA GAA GAC TTT GGG CGT CAT ATT GTT AAA TTA TGC TGG AAA GGT TCT 95Lys Glu Asp Phe Gly Arg His Ile Val Lys Leu Cys Trp Lys Gly Ser
20 25 30TTA TCA AAT ATC TTT TTT TCC TAT GGG GAT ATC CCG CAC CCA CCT TAT 143Leu Ser Asn Ile Phe Phe Ser Tyr Gly Asp Ile Pro His Pro Pro Tyr
35 40 45ATA CAT CAA AGT AAT AAG GTT CAG GAT AAG GAA AGA TAT CNT ACN GTA 191Ile His Gln Ser Asn Lys Val Gln Asp Lys Glu Arg Tyr Xaa Xaa Val
50 55 60TAC TCT ATA TTA CAT AAN CTG GGT TCT GTA GCA GCT CCT ACA GCT GGA 239Tyr Ser Ile Leu His Xaa Leu Gly Ser Val Ala Ala Pro Thr Ala Gly
65 70 75TTA CNC TTT TCT GAA ACT AGC CGT NAT AAA TTA CAC AAA NAT GGT ATT 287Leu Xaa Phe Ser Glu Thr Ser Arg Xaa Lys Leu His Lys Xaa Gly Ile80 85 90 95AGT TGG GCA TAA ATC CCT CTT CAC GTG GGA TAT GGA ACA TTC AGT CCC 335Ser Trp Ala * Ile Pro Leu His Val Gly Tyr Gly Thr Phe Ser Pro
100 105 110GTC CTC TGC AAT GAC ATC CCA AAA CAT CTT ATC CNT TCT GAG TTT GTT 383Val Leu Cys Asn Asp Ile Pro Lys His Leu Ile Xaa Ser Glu Phe Val
115 120 125CAC TTT CCT GAA ACT ACN TTT TCC ACT ATA TTA AAT GCA CGG TTT GCA 431His Phe Pro Glu Thr Xaa Phe Ser Thr Ile Leu Asn Ala Arg Phe Ala
130 135 140NGG GAA TAC CTA TGT TCT GCC ATA GGG GAC CCA CTG TTG TCC CCA CCA 479Xaa Glu Tyr Leu Cys Ser Ala Ile Gly Asp Pro Leu Leu Ser Pro Pro
145 150 155TTG GAN GGG TGT TAT CTT ACC CCT TTC GCC CGG GGT TCC CCT CCC CAA 527Leu Xaa Gly Cys Tyr Leu Thr Pro Phe Ala Arg Gly Ser Pro Pro Gln160 165 170 175CCC TAT TCC ATT GNG TTT TCC TCT CAA ATT AT 559Pro Tyr Ser Ile Xaa Phe Ser Ser Gln Ile
180 185(2)SEQ ID NO:12的信息:
(i)序列特征:
(A)长度:185个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线性
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:12:Ser Lys Pro His Leu Xaa Gln Glu Leu Glu Ile Glu Val Leu Lys Lys1 5 10 15Glu Asp Phe Gly Arg His Ile Val Lys Leu Cys Trp Lys Gly Ser Leu
20 25 30Ser Asn Ile Phe Phs Ser Tyr Gly Asp Ile Pro His Pro Pro Tyr Ile
35 40 45His Gln Ser Asn Lys Val Gln Asp Lys Glu Arg Tyr Xaa Xaa Val Tyr
50 55 60Ser Ile Leu His Xaa Leu Gly Ser Val Ala Ala Pro Thr Ala Gly Leu65 70 75 80Xaa Phe Ser Glu Thr Ser Arg Xaa Lys Leu His Lys Xaa Gly Ile Ser
85 90 95Trp Ala * Ile Pro Leu His Val Gly Tyr Gly Thr Phe Ser Pro Val
100 105 110Leu Cys Asn Asp Ile Pro Lys His Leu Ile Xaa Ser Glu Phe Val His
115 120 125Phe Pro Glu Thr Xaa Phe Ser Thr Ile Leu Asn Ala Arg Phe Ala Xaa
130 135 140Glu Tyr Leu Cys Ser Ala Ile Gly Asp Pro Leu Leu Ser Pro Pro Leu145 150 155 160Xaa Gly Cys Tyr Leu Thr Pro Phe Ala Arg Gly Ser Pro Pro Gln Pro
165 170 175Tyr Ser Ile Xaa Phe Ser Ser Gln Ile
180 185(2)SEQ ID NO:13的信息:
(i)序列特征:
(A)长度:477个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ii)分子类型:DNA
(ix)特征:
(A)名称/关键词:CDS
(B)位置:2..294
(xi)序列描述:SEQ ID NO:13:T ATA AAA CAT TAG CGN CTT TNG TAT TTG GAC TTC AAA AAA ATT TTT 46Ile Lys His * * Leu * Tyr Leu Asp Phe Lys Lys Ile Phe
1 5 10 15AAT TAT ATA GGA GAA CAT TCA CCA TTA AAA CGT AAT GTA ANT ATG GAA 94Asn Tyr Ile Gly Glu His Ser Pro Leu Lys Arg Asn Val * Met Glu
20 25 30GAT GTA GGT AAA TCT GCT GTT TTT TTA GCT TCA GAC CTN TCA TCA GGA 142Asp Val Gly Lys Ser Ala Val Phe Leu Ala Ser Asp * Ser Ser Gly
35 40 45GTA ACC GGT GAA TTN TTT TTG TTG ATG CTG GNA CAA TAA TTT AGG TAT 190Val Thr Gly Glu * Phe Leu Leu Met Leu * Gln * Phe Arg Tyr
50 55 60TTA ACC ATA CAT GCT TTA TAC AAC ATA TTG TGA GTT ACA ATA GCC ATA 238Leu Thr Ile His Ala Leu Tyr Asn Ile Leu * Val Thr Ile Ala Ile
65 70 75ACA CAT TTA TAT TCT ATA TAA TAA CAG TAG AAT AAT AAT AGA ATA TTT 286Thr His Leu Tyr Ser Ile * * Gln * Asn Asn Asn Arg Ile Phe80 85 90 95TTT ATG ACC ATTTGTATCT ATACAATAGT AAATAGATTA ATACATATAA GACTATATTC 344Phe Met ThrTTTTTGAGAG CAACTTAAAG GAGCGGTTAT GGCTTTAGTT ACAAAAGAAG AAGTACTTCA 404ATACCATAGT GAACCCCGAC CAGGTAAACT TGAAGTATTT TCTATAAAAC CATGTAAAAC 464ACAAAAAGAT CC 477(2)SEQ ID NO:14的信息:
(i)序列特征:
(A)长度:97个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线性
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:14:Ile Lys His * Xaa Leu Xaa Tyr Leu Asp Phe Lys Lys Ile Phe Asn 1 5 10 15Tyr Ile Gly Glu His Ser Pro Leu Lys Arg Asn Val Xaa Met Glu Asp
20 25 30Val Gly Lys Ser Ala Val Phe Leu Ala Ser Asp Xaa Ser Ser Gly Val
35 40 45Thr Gly Glu Xaa Phe Leu Leu Met Leu Xaa Gln * Phe Arg Tyr Leu
50 55 60Thr Ile His Ala Leu Tyr Asn Ile Leu * Val Thr Ile Ala Ile Thr65 70 75 80His Leu Tyr Ser Ile * * Gln * Asn Asn Asn Arg Ile Phe Phe
85 90 95Met(2)SEQ ID NO:15的信息:(i)序列特征:
(A)长度:525个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性(ii)分子类型:DNA(ix)特征:
(A)名称/关键词:CDS
(B)位置:2..525(xi)序列描述:SEQ ID NO:15:G GAA TTG TTA GTA TTC TCC CAG AAC AGA AGC CAA AAT ATT TGG CTA 46Glu Leu Leu Val Phe Ser Gln Asn Arg Ser Gln Asn Ile Trp Leu
1 5 10 15CTT ACA TTA CCT ATT TTT GTG TTA GGT ATA GCA CAA GGT ATA TCA TTT 94Leu Thr Leu Pro Ile Phe Val Leu Gly Ile Ala Gln Gly Ile Ser Phe
20 25 30CCT TTA GTA AAC AGC CAC ATT ACA TCA CTT GCA CCA ACA TCC AAC AGA 142Pro Leu Val Asn Ser His Ile Thr Ser Leu Ala Pro Thr Ser Asn Arg
35 40 45GCT ATT GTT ATG GCT ATA AAC AGT ACA TTT ATG AGG TTA AGT CAG AGT 190Ala Ile Val Met Ala Ile Asn Ser Thr Phe Met Arg Leu Ser Gln Ser
50 55 60ATT TCG CAA ATG GTT TTT GGT ATT GGA TGG TCA TTT TTT GGT TGG CCT 238Ile Ser Gln Met Val Phe Gly Ile Gly Trp Ser Phe Phe Gly Trp Pro
65 70 75GGT CCT TTT ATA TTT GGT CTT TTT ACT TCT ATT ATA TTA GCC CTC TTA 286Gly Pro Phe Ile Phe Gly Leu Phe Thr Ser Ile Ile Leu Ala Leu Leu80 85 90 95ATT ATG AAG TAT TTT CAA GAT GTA ACC CAA TAT CAC CTA TTT TTG ATA 334Ile Met Lys Tyr Phe Gln Asp Val Thr Gln Tyr His Leu Phe Leu Ile
100 105 110AGT AGT AAA TTT TAT TAT TAA AAA GCT TAG TTA GTT AAG ATT ACA TAT 382Ser Ser Lys Phe Tyr Tyr * Lys Ala * Leu Val Lys Ile Thr Tyr
115 120 125ATT ATA TAC AAT TAC TAT AAC ATT AAC TAA TTA CTA ACT ATT ACT TCC 430Ile Ile Tyr Asn Tyr Tyr Asn Ile Asn * Leu Leu Thr Ile Thr Ser
130 135 140AAT TGA TTA ATT GAT GCT ATT TAA AGA GGA TAT ATT AAT GAT GTC ATG 478Asn * Leu Ile Asp Ala Ile * Arg Gly Tyr Ile Asn Asp Val Met
145 150 155GCT CAC AAT AGG TGT TAT CCT TGG ATT AGT GCA TGG GAT CCA GGT CC 525Ala His Asn Arg Cys Tyr Pro Trp Ile Ser Ala Trp Asp Pro Gly160 165 170(2)SEQ ID NO:16的信息:
(i)序列特征:
(A)长度:174个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线性
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:16:Glu Leu Leu Val Phe Ser Gln Asn Arg Ser Gln Asn Ile Trp Leu Leu1 5 10 15Thr Leu Pro Ile Phe Val Leu Gly Ile Ala Gln Gly Ile Ser Phe Pro
20 25 30Leu Val Asn Ser His Ile Thr Ser Leu Ala Pro Thr Ser Asn Arg Ala
35 40 45Ile Val Met Ala Ile Asn Ser Thr Phe Met Arg Leu Ser Gln Ser Ile
50 55 60Ser Gln Met Val Phe Gly Ile Gly Trp Ser Phe Phe Gly Trp Pro Gly65 70 75 80Pro Phe Ile Phe Gly Leu Phe Thr Ser Ile Ile Leu Ala Leu Leu Ile
85 90 95Met Lys Tyr Phe Gln Asp Val Thr Gln Tyr His Leu Phe Leu Ile Ser
100 105 110Ser Lys Phe Tyr Tyr * Lys Ala * Leu Val Lys Ile Thr Tyr Ile
115 120 125Ile Tyr Asn Tyr Tyr Asn Ile Asn * Leu Leu Thr Ile Thr Ser Asn
130 135 140* Leu Ile Asp Ala Ile * Arg Gly Tyr Ile Asn Asp Val Met Ala145 150 155 160His Asn Arg Cys Tyr Pro Trp Ile Ser Ala Trp Asp Pro Gly
165 170(2)SEQ ID NO:17的信息:
(i)序列特征:
(A)长度:846个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ii)分子类型:DNA
(iii)序列描述:SEQ ID NO:17:TATTTACTCG CGCGGCCGGG CGTCTTACAC AAATGGATCC CTTGCANTAA TCCAAGGATA 60ACNCCTATTG TGANCCATGA ACATCATCAN NATATCCTCT TTANATAGCA TCNANNNNTC 120AANNGGAATT AACAGTTACT ANNTAGTTAA TGTCATAGTA ATTGTCNATA ATATATGTAA 180TCTTAACTAA CTAAGCTNNT TAATAATAAA ATTNACTACT TATCAANAAT AGGTGATATN 240GGGTTACATC TTGAAAATAC TTNCCATAAT TANGAGGGCT AATATAATNG AANTAAAAAG 300ACCANATATA AAAGGACCAG GCCAACCAAA AAATGACCAT CCAATACCNA AAACAATTGG 360CGAAAATACT CTGACTTAAC CTCANAAATG TACTGTTTAT AGCCATATCA ATAGCTCTGT 420TGGATGTNGG NGCAATTGAT GTAATGTGGC TGTNTACTAN ANGAAATGAT NTACCTCGTG 480CTATNCCTAN NACAANAATA NGTAATGTAA GTANCCNAAT ATCTTGGCTT TGTAATGGGA 540GAATAATNNC AAGTCCTTGG GAAATNAANT TACNNCCAGC CAGCTATNNT AAGCAGTTCT 600NTGGTGACTA TACGTCCTAC TNAANTCGTG CCAAAGATTA AATANNCGAT AATCGCNCTN 660CCTAAANCAN GCAATACTAA AATGGTTTCT NCCTANCTTG GNATANGGTG GAAGCNCGGA 720CAGAATTNAN TTCGCNANTT TANANNGGAA NATNCGTNAA NTTANTCGGG GCCCANNCCN 780AAATTCCTNA NTCNATANAN NAACTNNCTN CTNTAAAANG GCCNACTGGA NTNGTTAAAT 840GAAATA 846(2)SEQ ID NO:18的信息:
(i)序列特征:
(A)长度:855个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ii)分子类型:DNA
(iii)序列描述:SEQ ID NO:18:GATTNTTTAT CGATCACTNT AGACGCGATT TGGGNAACAC TTACCTGGTA NCCACCCGGG 60TGGAAAAATC GATGGGCCCG CGGCCGCTCT AGAAGTACTC TCGAGAAGCT TTTTGAATTC 120TTTGGATCCT CAACACAGGG TATGGATTAA AACAACTTTA GCTCTAACAG GAGCATTTTA 180TAATATATTC CCTGGTAGAA CAATATCTAC TCAAGAAAAT CTGTCTATTG GTTTTCAACT 240AAAAAAAACT TTTAAACCTT TTCATTGGAC CATCTTACTC TTAGATGAAC ATTATATGTC 300TTCGCCAAGA ATTGCAGCAG CAATTATGCC TGCACAGCTT GCTGGAGTTA AAAACATTAT 360AGCTGTTTGG ACCAGTAAAA ATAACCGACT GACCGCTGAA AAAATCTCAC CTGCTTTACT 420AACAACATTA GAACTTTCAG GAGTTAACAT AGCCCTAACA CTTACCCACA CTGAAACTGA 480ACTTCTTATT CATCAATTAA TGAAAATAGG TATTGGAAAC CTGTTATATT TTTTAAAAGA 540AGAAGACATA CTACATATAT CTACTATACC TGTACTACCT TTCTGGAAAG AATATACTTC 600TCATCGACTT GTTATAGAAA AAGATGCTGG CNTTAATACA GAAATCCTCC AATGGGCNCA 660TCCTCATTCA ATTATTGAAC AAATAGCAAC AGAACCATAC TCTGAAANAT ATCCCAGATG 720CACTTTACTG TGCTAGCTCA TCCANTAAAA ACTATNCTCA TANAGNATCC CCAGAATTTT 780TCATNATGGA CTTGAACCTA TTTGGATTCA NCCCAACNCT TCCTCCAANC CTCCTTTCTC 840CATACACCAT GGGGA 855(2)SEQ ID NO:19的信息:
(i)序列特征:
(A)长度:1082个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ii)分子类型:DNA
(iii)序列描述:SEQ ID NO:19:TATCTNGTTG ANTCAATAAA ACTTTTGGGG CCCNTNAAAN TTTCATNANN AAAAAAACAA 60NATTNCTGGG GGNCCCNTCC CAAAAAANNC AATCANTNNG AANCTTGNCT TCTTATTNNG 120NTTTTNANAC TATAATATNT NTTATCNATA ATNNATCNNT ATACTNATTT CTNATTCANT 180NACANNGGNN AGNAANNTTA ATCTNAAANA CTNCNAAGGG GGNNNTNATA NTNTTTNTTT 240NTTTNTCCCN TNNAATNNAT AACCNNNCAC CCNNATTANT TNNAATNNAT ACCATANCNN 300CCTTTCAAAC TGTACACATA NTANNNAANN ACACTCNANC NTTTTNCATC CTCTCTANTN 360CCNACTCCNA TNNANCTNTT CCCCCATNCC TATNTNTCNC TGCTTCCCAG NTTNNACNTN 420NCTTNNTTTC ACANTATTCC TATCCAANCT AACATNTNTN NTNTCNTNCT CCTTNTNTNT 480TATNTNTTTC TNNTACCTNN CACTGACANT CTATNANTNA NNTCNNATAC TNNTATANCT 540NTANGCNANT NTATCTANAA NTNTANCNNN NNATCNTNAC NGCCGTNNAT NTNNNNNCAN 600TTANNTANNN CTANCNTNNC CAANNNCNTA TNTATNAATA ACNACTATCC NATATTNNAT 660TNNNTNNTNT CNTANNCAAA TNATTTANGC NCACNNCACT ANGTNATATN ANNATTNTAT 720ATTNTGAANC TTCTNGGCTT CNCNAATANT ACCANTNNNC ANCNTCNNNT NCATCTNNNT 780NTACTTCNTA CCATANCGCT CTCNAGNNTC ACTACTTCTA NTAGTNATCN TCTACTGCCN 840ATGGCNNNNN GCNNNNCGAN AGNTATNCAC NTACANTNNC NTCTACTATN TANATCTANN 900NCNTCCGNNG CCTNCNGTAC GNNTNGGCNA ANTCGNNTAC TTTNCNTNTA TCTAGTCNCA 960TCAGNNNTNG ANTCCTCAAN CNNGCTCTAN TTACATGTNN NNTNATGCNC TANANCGNNA 1020CNTCTATCCT TCNANTCTGC NCTNANTNTA TANACTCTNN NNNATCNNCN AANCTATNTC 1080CC 1082(2)SEQ ID NO:20的信息:
(i)序列特征:
(A)长度:354个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ii)分子类型:DNA
(iii)序列描述:SEQ ID NO:20CTCCCNTNNC NCTAAGTGGA NTCGCGCGCT GCAGGTCGAC ACTAGTGGAT CTTGATATAC 60TTTTAAAAGA TGTGATGTTA ACATCAAAAA AGCATGAATC ACGTTAGACT TGCAGAGTCT 120GTACATCAAA ATATTCTTTA CCCACCTTAA TACGAAAANA AATNNTTATN CNCCNCNATG 180GGTGGGGNTN AAATCCTNGC CCCNTTNCCC TGTTCNTTTA GGGAACCCCC NAATTCCCCN 240NGTTATTCCT CTGTTTGAAA NTTCTGGTTN CCCGGCCCTN TNACCAANAG CTTGANNNCC 300NCCCCGTCCT GGGGCATCCT CNTGTTTATT TTCCCTCNAN CNCCCCCTTN ACTN 354(2)SEQ ID NO:21的信息:
(i)序列特征:
(A)长度:477个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ii)分子类型:DNA
(iii)序列描述:SEQ ID NO:21GGATCTTTTT GTGTTTTACA TGGTTTTATA GGAAATACTT CAAGTTTACC TGGTCGGGGT 60TCACTATGGT ATTGAAGTAC TTCTTCTTTT GTNACTAAAG CCATAACCGC TCCTTTAAGT 120TGTTCTCAAA AAGAATATAG TCTTATATGT ATTAATCTAT TTACTATTGT ATAGATACAA 180TAGGTCATAA AAAATATTCT ATTATTATTC TACTGTTATT ATATAGAATA TAAATGTGTT 240ATGGCTATTG TAACTCACAA TATGTTGTAT AAAGCATGTA TGGTTAAATA CCTAAATTAT 300TGTNCCAGCA TCAACAAAAA NAATTCACCG GTTACTCCTG ATGANAGGTC TGAAGCTAAA 360AAAACAGCAG ATTTACCTAC ATCTTCCATA NTTACATTAC GTTTTAATGG TGAATGTTCT 420CCTATATAAT TAAAAATTTT TTTGAAGTCC AAATACNAAA GNCGCTAATG TTTTATA 477(2)SEQ ID NO:22的信息:
(i)序列特征:
(A)长度:568个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ii)分子类型:DNA
(iii)序列描述:SEQ ID NO:22GATCATTTAA AAAACCATCT TGAGTAAAAC GAAAATTCCC TGCTCGTGTA TAGTGTACTT 60TATCCTCTAA TGTAACCTGA AAAAAACCTT TTCCACCAAT AGCAAGATCT GTTACACTAT 120TGCCAGGTTC AAAAGCACCC TGTGTAAAAA TTGTGCGAAC ACTTCCAACC TGTGCTCCCA 180TACCAGCCTG GTTTGGCCCC TGACTTCCAG TAAAACCTAT TGCTAAATCT TGACTAAACA 240GGTCTTGAAA CACTACCTGT TGCTGCTTAT ACCCAATGGT ATTTGCGTTA GCAATATTAT 300TGGAGACAGT ACCANCCCTG TNCTATGGGT TTTCATACCT GTTGGCANCA ATAAACAAAC 360TCCCCATCAT GATAACATCT CCTAAAAAAT AATTTCATGG NGGNAAAAAT GTTACCTACA 420CATCTCTATT TTNAAAGCAA AAAACCCATG CCCAANAAAA TTTTTGGGCC NAATTAATAT 480ACTTAATCTA ATAAACTTTT TTGGGTAATN AAAAAAAATT AATTTTTTAA ACTTGGTTTN 540ACCAACCTTT TCTCCTTACT TTTTAACC(2)SEQ ID NO:23的信息:
(i)序列特征:
(A)长度:477个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ii)分子类型:DNA
(iii)序列描述:SEQ ID NO:23GGTACCCCAC CCGCGTGGAA AATCGATGGG CCCGCGGCCG CTCTAAAANT 50ACTCTCGAGA AGCTTTTTGA ATTCTTTGGA TCCCCAGGAA TAACTTGTTG 100ACGGAATTTT ACATTTTCTA TCCCTGCAAA TANAAAAACT TTACCTTGTA 150GTTCATTAAT AGGAAAAGAT TGGAGTACTG TGATTCCACC TGATTGCGCC 200ATAGCTTCTA AAATTAGAAC TCCAGGCATG ACAGGAAATC CAGGGGAAAT 250GACCCNGAAA AAATGGTTCA TTAATACTAA CATTTTTATA AGCTTTAATA 300TATTTGCCAG CATTAAATTC AATAACTCTA TCTACAATTA AAAAGGGATA 350ACGGTGGGGA ATTTACTGTA AAATTTCTTG GATATTTTGG AGGTATGGAT 400GGGGACATTA ATTTTCCTAT ATATATGCTC TTTTTCTTTT CNAAAATTTT 450TCAGCTTTTT TATCCCNTAA AAACCTC 467