本发明之目的就在于寻找一种基因及其功能衍生物,其可以编码一种调控金黄担子素敏感性的蛋白质并且在基因工程技术和分析霉菌重要现象方面是有用的,这些霉菌包括隶属于曲霉属的菌株。也就是说,本发明旨在揭示一种可编码调控金黄担子素敏感性的蛋白质或其功能衍生物的基因;提供一种克隆这种基因以及由该基因编码的可以调控金黄担子素敏感性之蛋白质或其功能衍生物的方法;提供该基因的反义DNA和反义RNA;提供一种可与该基因杂交的核酸探针以及使用该核酸探针来检测该基因的方法;提供一种利用该基因来生产可调控金黄担子素敏感性的蛋白质或其功能衍生物。
本发明可综述如下。第一项发明涉及一种基因,其来源于霉菌,可为调控金黄担子素敏感性的蛋白质或其功能衍生物编码。即,它涉及一种可调控金黄担子素敏感性的基因,其来自霉菌或其功能性衍生物。第二项发明涉及一种克隆调控金黄担子素敏感性并来源于霉菌的基因或其功能衍生物的方法,其中,第一项发明中调控金黄担子素敏感性的基因或其功能衍生物被整体或部分地用作探针。第三项发明涉及一种核酸探针,其含有由至少15个碱基组成的序列,可与调控金黄担子素敏感性并来源自霉菌的基因或其功能衍生物杂交。第四项发明涉及可调控金黄担子素敏感性并来源于霉菌的基因或其功能衍生物之反义DNA。第五项发明涉及可调控金黄担子素敏感性并来源于霉菌的基因或其功能衍生物之反义RNA。第六项发明涉及一种重组质粒,其含有可调控金黄担子素并来源于霉菌的基因或其功能衍生物。第七项发明涉及一种转化体,该转化体中引入了第六项发明所述的质粒。第八项发明涉及一种利用上述转化体来生产可调控金黄担子素敏感性的基因或其功能衍生物的方法。第九项发明涉及一种可调控金黄担子素敏感性并来源于霉菌的蛋白质或其功能衍生物。第十项发明涉及一种能够赋予对金黄担子素抗性的蛋白质,其中具金黄担子素敏感性的蛋白质(如序列目录中SEQ ID No.4所示)至少在275位的氨基酸Gly已被另一个氨基酸所取代,或其功能衍生物。第十一项发明涉及一种DNA,其可以为第十项发明中能够赋予对金黄担子素抗性的蛋白质编码。第十二项发明涉及一种通过与第三项发明中的核酸探针杂交检测调控金黄担子素敏感性之基因的方法。
本发明人发现,诸如无冠构巢曲霉及烟曲霉的霉菌都对金黄担子素具敏感性。于是我们把无冠构巢曲霉的敏感性细胞突变为抗性细胞,并成功地从相应的抗性细胞中分离出能够赋予对金黄担子素抗性的基因(一种抗性基因)。另外,我们揭示了由该基因所编码的蛋白质的存在。通过利用上述基因的DNA片段作为探针,我们还从金黄担子素敏感性无冠构巢曲霉及烟曲霉中发现了能调控金黄担子素敏感性的新基因。另外,我们发现,对该基因的检测可以诊断由这些细胞引起的疾病(如由真菌引起的真菌病),反义DNA或反义RNA(可抑制调控这些细胞所特有的金黄担子素敏感性的基因之表达)可用作由这些细胞引起的疾病的治疗剂(例如,真菌病的一种抗真菌剂),从而完成了本发明。
这里所用的术语“调控金黄担子素敏感性的蛋白质”是指霉菌中所含的一种蛋白质,其表现出对金黄担子素敏感性。这种蛋白质是获得对金黄担子素敏感性或抗性所需要的。术语“调控金黄担子素敏感性的基因”是指可为调控金黄担子素敏感性的蛋白质编码的一种基因,敏感性基因和抗性基因都在此范畴之内。有机体对金黄担子素的敏感性因该有机体所携带的可调控金黄担子素敏感性的这种蛋白质或基因的分子结构或数量不同而有所变化。
这里的术语“调控金黄担子素敏感性的蛋白质或基因的功能衍生物”是指其生物学活性与调控金黄担子素敏感性的蛋白质或DNA的生物学活性基本上相似。它包括片段、变异体、突变体、类拟物、同系物及化学衍生物。变异体意味着其在结构和/或功能上与其源于的整体蛋白质或片段大体类似。也就是说,一个在活性上与另一分子基本类似的分子被视为突变体,尽管这两个分子彼此在分子结构或氨基酸序列上并不相同。功能衍生物包括其氨基酸序列具有至少一种选自氨基酸残基的取代,插入及缺失的修饰,并且具有相似的生物学活性的蛋白质和编码这些蛋白质的基因。调控金黄担子素敏感性的蛋白质可通过位点特异性诱变进行氨基酸残基的取代、插入及缺失。所分离出的为可调控金黄担子素敏感性的蛋白质编码的DNA可很容易地发生核旨酸的取代、插入及缺失中至少一种修饰,这样就可以得到编码可调控金黄担子素敏感性的蛋白质及其功能衍生物的新DNA。
对于氨基酸残基的取代、插入和缺失,可通过遗传工程技术转化一种或多种氨基酸并应选择出那些生物学活性未受损害的氨基酸。为了对某一特定位点上的残基适当地进行突变,在靶密码子上随机实施诱变作用,而从这些所表达的突变体中筛选出具所需活性的突变体。由插入而得到的突变体涉及一种融合蛋白质,其中,该调控金黄担子素敏感性的蛋白质或其功能衍生物或其片段通过肽键与另一种蛋白质或多肽在调控金黄担子素敏感性的蛋白质或其功能衍生物或其片段的氨基未端和/或羧基未端结合。为了删除氨基酸残基,可通过位点特异性诱变以终止密码子来取代氨基酸序列中的任意氨基酸密码子。这样,所取代的氨基酸残基羧基未端侧的区域能从氨基酸序列中删除掉。另外,可通过包括降解氨基酸序列氨基未端和/或羧基未端相应区域的编码DNA的缺失方法〔Gene.33.103-119(1985)〕或利用含起始密码子和/或终止密码子的引物的PCR方法得到为其中任意长度的氨基未端和/或羧基未端区域已经缺失的蛋白质编码的DNA。位点特异性诱变的已知实例包括使用寡核苷酸的缺口双链体法〔Methods in Enzymology,154,350-367(1987)〕、利用寡核苷酸的尿嘧啶DNA法〔Methods in Enzymology,154,367-382(1987)〕、亚硝酸突变体〔Proc.Natl.Acad.Sci.USA,79,7258-7262(1982)〕和盒式突变法〔Gene,34,315-323(1985)〕。
第一项发明涉及调节金黄担子素敏感性的基因,其得自霉菌,例如曲霉属菌株或其功能衍生物。为了分离该基因,首先对金黄担子素敏感性细胞进行诱变处理,从中得到一种抗性菌株。而后从该抗性菌株的染色体DNA或CDNA中制备出DNA文库,并由该文库克隆能够赋予该抗体的基因(抗性基因)。类似地,制备出敏感性菌株的DNA文库,并分离和克隆可与该抗性基因杂交的DNA分子。这样可分离出敏感性基因。
诱变可通过例如用化学品如甲磺酸乙酯(EMS)或N-甲基-N′-硝基-N-亚硝基胍(NTG)处理,或利用紫外线或其它幅射来进行。在适当条件下,在合适当浓度的金黄担子素的营养培养基中培养诱变后的细胞,可对已获得此抗性的突变体进行筛选。这样得到的抗性菌株可因诱变处理所选用的方法及条件而有所不同。还可能通过改变筛选时金黄担子素的浓度选择出抗性程度不同的菌株。通过改变筛选温度,亦有可能选择出温度敏感性抗性菌株。由于存在着对金黄担子素抗性的两种或多种机制,就可以通过遗传分类这些抗性菌株而分离出两种或多种抗性基因。
本发明的可调控隶属于曲霉属的霉菌的金黄担子素敏感性的基因包括:分离自无冠构巢曲霉抗性突变体的基因anaurlR,分离自无冠构巢曲霉敏感性菌株的基因anaurlS,以及分离自烟曲霉敏感性菌株的基因afautlS。
附图1表明基因anaurlS的基因组DNA的限制性内切酶图谱,该基因可调控金黄担子素敏感性且来源自曲霉属的霉菌;附图2表明基因anaurlS的CDNA限制性内切酶图谱;图3显示基因afaurlS的CDNA的限制性内切酶图谱。
通过紫外线幅射诱变对金黄担子素敏感的无冠构巢曲霉,如此制备出如上得到的抗性菌株的基因组文库。自该文库中,分离出含抗性基因(anaurlS)及具有图1所示的限制性内切酶图谱的DNA片段。该基因具有序列表中SEQ ID No.1所示的DNA序列。由该基因编码的蛋白质的氨基酸序列(根据该DNA序列所推测)是序列表12中SEQ ID No.2中所示的氨基酸序列。通过与该抗性基因杂交,可以从敏感性菌株的CDNA文库中分离出含敏感性基因(anaurlS)并具有图2所示的限制性内切图谱的CDNA片段。该敏感性基因具有如序列表中SEQ ID No.3所示的DNA序列。由该基因编码的蛋白质的氨基酸序列(根据该碱基序列推测)是序列表中SEQ ID No.4所示的氨基酸序列。对SEQ ID No.3与SEQ ID No.1的序列所进行的比较表明基因组DNA具有一个内含子(间插序列),其范围在SEQ ID No.1中的1508位碱基至1563位碱基。另外,SEQ ID No.1中的1965位的G已突变为T。对SEQ ID No.4与SEQ ID No.2的序列的比较表明,在氨基酸水平上275位的氨基酸甘氨酸已突变为缬氨酸,由此产生了抗性。第一项发明还涉及通过化学或物理方法改变本发明的可调控金黄担子素敏感性并来源于霉菌的部分基因而构建出的基因。
第二项发明涉及一种克隆能调控金黄担子素敏感性并来源于霉菌(如曲霉属菌株之一的基因或其功能衍生物的方法。该方法包括利用第一项发明中可调控金黄担子素并来源于霉菌的基因,其功能衍生物,或其一部分作为探针。也就是说,可以通过杂交法或聚合酶链反应(PCR),利用以上得到的整体或部分基因(至少由15个寡核苷酸组成)作为探针分离出编码具有类似功能的蛋白质的基因。
为了检查可用作上述探针的区域,本发明的发明人将由本发明的基因anaurlS编码的蛋白质的氨基酸序列(序列表中的SEQ ID No.4)和由本发明的基因afaurlS编码的蛋白质的氨基酸序列(序列表中的SEQ IDNo.5)与下列氨基酸序列进行了比较:由来源于酿酒酵母的金黄担子素敏感性基因(scaurlS)编码的蛋白质的氨基酸序列(SEQ ID No.6)、由来源于粟酒裂殖酵母的另一种金黄担子素敏感性基因(spaurlS)编码的蛋白质的氨基酸序列(SEQ ID No.7),以及由来源于白假丝酵母的可调控金黄担子素敏感性的基因(caaurl)编码的蛋白质的氨基酸序列(SEQ ID No.8),均描述于加拿大专利No.2124034。结果,总的来说未观察到同源性。不过,它第一次揭示了在这些可调控金黄担子素敏感性的异源基因中一般都保存着特征性序列。这种保守序列一直保存得十分完好(同源性:80%或更多),由至少8个氨基酸残基组成,其相应于足够用作探针的长度。图4表明由SEQ ID No.4至8所示的氨基酸序列间的比较,其中由发明人命名为“Box序列”的三个序列(Box-1-Box-3)相当于保守序列。这样,可调控金黄担子素敏感性并来源于霉菌的基因或其功能衍生物可以使用分别由Box 1、2或3的氨基酸序列(如序列表中SEQ ID No.9、10或11所示)所构建的引物或探针来克隆。
在图4中用5行给出的氨基酸序列分别相当于SEQ ID No.4(顶行)、SEQ ID No.5(第二行)、SEQ ID No.6(第三行)、SEQ ID No.7(第4行)和SEQ ID No.8(底行)。
编码可调控金黄担子素敏感性的靶基因或其功能衍生物可通过杂交作用,例如通过以下方式获得。首先,将得自靶基因源的染色体DNA或利用逆转录酶由MRNA构建的CDNA,依据传统方法连接到质粒或噬菌体载体上并导入宿主中以制备文库。在平板上培养该文库之后,将这样形成的菌落或噬菌斑转移到硝化纤维素或尼龙膜上,使DNA变性并因而固化在膜上。在含探针(已用放射性同位素32P等预先标记)的溶液中对该膜进行培养。(这里所用的探针可以是编码序列表中SEQ ID No.4所示的氨基酸序列或其一部分的基因。例如,可以使用序列表中SEQ IDNo.3所示的基因或其一部分。使用由至少15个碱基组成的可编码序列表中SEQ ID No.9-11所示的氨基酸序列之一的碱基序列或其一部分是适宜的。这样在膜上的DNA和探针之间形成DNA杂合体。例如,将其上有固定化DNA的膜与溶液中的探针杂交,该溶液含有6×SSC、190的月桂基硫酸钠、100μs/ml的鲑精液DNA和5×Denhardt溶液(含牛血清白蛋白、聚乙烯基吡咯烷酮,以及Ficoll,浓度各自为0.190),反应温度为65℃,时间为20小时。杂交反应完成后,冲洗掉非特异性吸附的物质,利用放射自显影术来鉴定与探针形成杂合体的克隆。在这样得到的克隆中,包括了编码靶蛋白质的基因。
在通过诸如下述方法鉴定所得到的基因的DNA序列之后,进一步证实所得到的基因是否是编码可调控金黄担子素敏感性的靶蛋白质或其功能衍生物的基因。
通过杂交作用得到的克隆可用下述方法测序。当重组体均为大肠杆菌时,将其在试管中进行培养,用常规方法萃取质粒,而后用限制性内切酶切割,将切下的插入体亚克隆至M13噬菌体载体等中。然后,通过双脱氧法鉴定碱基序列。当重组体为噬菌体时,可通过相同步骤对碱基序列进行初步鉴定。从细胞培养到DNA测序所使用的这些初步实验步骤,例如可见“细胞克隆”,实验手册,T.Maniatis等人,冷泉港实验室出版社(1982)。
为了确定所得到的基因是否是编码可调控金黄担子素敏感性的靶蛋白质或其功能衍生物的基因,将这样鉴定的氨基酸序列与序列表中SEQID No.4所示的氨基酸序列进行比较,以此搞清蛋白质结构和氨基酸序列同源性。
为了检验所得到的基因是否保持着对金黄担子素的敏感性或抗性,将所得到的基因转化到敏感性细胞中,确定所得到的转化细胞的金黄担子素敏感性,由此揭示出基因的活性。另外,可通过将所得到的基因转化到已通过破坏或诱变能调节金黄担子素敏感性的基因消除了活性的细胞中而确定活性。上述待转化的基因最好含有在基因上游及/或下游中表达所需的序列(启动子、终止子等),以便能实现在转化的细胞中的表达。
当所得到的基因未含有编码可调控金黄担子素的蛋白质或其功能衍生物的整体区域时,通过在所得到的基因基础上制备合成DNA引物,通过PCR扩增缺失区域或利用得到的基因片段作为探针进一步筛选DNA文库或CDNA文库,可以得到编码可调控金黄担子素敏感性的蛋白质或其功能衍生物的整体区域的碱基序列(其可与本发明中编码可调控金黄担子素敏感性的蛋白质或其功能衍生物的基因杂交)。
例如,通过利用图2中的PstI-EcoRI片段(921bp)的DNA片段作为探针。筛选致病性真菌烟曲霉的CDNA文库可得到具有图3中限制性内切酶图谱的CDNA分子,其含有在功能上与基因anaurlS相似的烟曲霉基因(afaurlS)。该基因具有如序列表中SEQ ID No.12所示的碱基序列,而由该基因编码的蛋白质的氨基酸序列(根据该碱基序列推测)为序列表中SEQ ID No.5所示的序列。当比较基因anaurlS与afaurlS时,发现在氨基酸水平有87%的同源性。另外,利用基因anaurlS的DNA片段作为探针,对由黑曲霉和米曲霉中制备出的基因组DNA进行Southern印迹分析。结果,其揭示出在黑曲霉和米曲霉中存在着调控金黄担子素敏感性的基因。也有可能从那些曲霉属之外的霉菌(例如青霉属的霉菌)中分离出可调控金黄担子素敏感性的基因。
第三项发明涉及上述核酸探针,即至少由15个碱基组成并可与调控金黄担子素敏感性的基因杂交的寡核苷酸,例如具有图1、2或3的限制性内切酶图谱的DNA片段。
该核酸探针可应用于原位杂交、确定表达上述基因的组织,确定基因或MRNA在各种重要组织中的存在等等。通过将上述基因或其片段连接到适当的载体上,将其导入细菌中,然后复制,从破碎细胞的溶液中用酚等萃取,用能识别载体连接位点的限制性内切酶切割,进行电泳并从电泳凝胶中切除可以制备出该核酸探针。另外,也可以通过利用DNA合成仪的化学合成方法或依据序列表中SEQ ID No.1、3和12所示的每一种碱基序列的PCR基因扩增技术制备出该核酸探针。适用作该核酸探针的序列实例包括由至少15个碱基组成并且编码序列表中SEQ ID No.9-11所示的氨基酸序列的碱基序列或其一部分。为了提高检测的灵敏度,可用放射性同位素或荧光物质来标记核酸探针。
第四项发明涉及上述可调控金黄担子素敏感性并来源于霉菌的基因的反义DNA,而第五项发明则涉及其反义RNA。通过把该反义DNA或反义RNA等入细胞中,就可以控制可调控金黄担子素敏感性的基因的表达。
作为将导入的反义DNA,例如可以使用如序列表中SEQ ID No.1、3和12所示的可调控金黄担子素敏感性之基因的相应的反义DNA或其一部分。序列表中SEQ ID No.13显示了这种反义DNA的一个实例,其对应于如序列表中SEQ ID No.1所示的调控金黄担子素敏感性之基因的反义DNA的序列。作为反义DNA,也可以使用通过适当剪切这些反义DNA或依据这些反义DNA序列合成的DNA得到的片段。
作为将导入的反义RNA,例如可以使用如序列表中SEQ ID No.1、3和12中所示的可调控金黄担子素敏感性之基因的相应的反义RNA或其一部分。序列表中SEQ ID No.14显示了这种反义RNA的一个实例,其对应于如序列表中SEQ ID No.1所示的可调控金黄担子素敏感性之基因的反义RNA的序列。作为反义RNA,也可以使用通过适当剪切这些反义RNA或依据这些反义RNA序列合成的RNA得到的片段。例如,可以使用通过使用如序列表中SEQ ID No.1或3所示的可调节金黄担子素敏感性的基因之相应的反义RNA并在离体转录系统中用RNA聚合酶进行处理而制备出的RNA。
可以反义DNA和反义RNA进行化学修饰以使其在活体中很难降解并使其能够通过细胞膜。可将能够使MRNA失活的物质(如核糖体)结合其上。如此制备出的反义DNA和反义RNA可以用于治疗与MRNA(其可编码调节金黄担子素敏感性的基因或其功能衍生物)含量增加相关的各种疾病(如真菌病)。
第六项发明涉及一种重组质粒,其中第一项发明的编码调控金黄担子素敏感性的蛋白质或其功能衍生物并来源于霉菌的基因已被整合到适当的载体中。例如,质粒(其中金黄担子素抗性基因已被整合到适当的酵母载体中)被广泛用作选择性标记基因,因为其使得选择一种表现出金黄担子素药物抗性的转化体变得很容易。
另外,重组质粒可被大肠杆菌等稳定地携带。可使用的载体的实例包括pUC118、pWH5、pAU-PS、Traplex119及pTB118。
也可以通过将第一项发明的编码调控金黄担子素敏感性的蛋白质或其功能衍生物并来源于霉菌的基因连接到适当的载体上而使霉菌转化。当使用诸如pDHG25的质粒〔Gene,98,61-67(1991)〕作为载体时,导入霉菌的DNA可以质粒的状态保持在霉菌中。当使用诸如pSa23的质粒〔Agricultural and Biological Chemistry,51,2549-2555(1987)〕作为载体时,DNA可以稳定地保持在整合到霉菌染色体中的状态下。通过把本发明的基因减化为开放读框(ORF),用适当的限制性内切酶对其进行切割并将其连接到适当的载体上,也有可能给出用于基因表达的重组质粒。为了构建这种用于表达的质粒,可以利用质粒作为载体,诸如pTV118等(当使用大肠杆菌作为宿主时)、pYE2等(当使用酵母作为宿主时)、pMAMne等(当使用哺乳动物细胞作为宿主时)或pTAex3等(当使用霉菌作为宿主时)。
第七项发明涉及通过将上述重组质粒导入适当的宿主而得到的转化体。可以使用大肠杆菌、酵母、霉菌和哺乳动物细胞作为宿主。由质粒pANAR1(其具有整合入的基因anaurlS)转化的大肠杆菌JM109被命名为大肠杆菌JM109pANAR1,已贮存于工业科学技术机构的国立生命科学和人体技术研究所中,注册号为FERMBP-5180。
第八项发明涉及一种生产可调控金黄担子素敏感性的蛋白质或其功能衍生物的方法。该方法包括在适当的营养培养基中培养具第6项发明的重组表达质粒的转化体(其含有编码该蛋白质或其功能衍生物的基因)、回收并提纯从细胞或培养基中表达的蛋白质。为了表达编码该蛋白质的基因,可以使用大肠杆菌、酵母、霉菌或哺乳动物细胞作为宿主。
第九项发明涉及调控金黄担子素敏感性的蛋白质或其功能衍生物。其实例包括由上述基因anaurlR、anaurlS和afaurlS编码并且具有分别由SEQ ID No.2、4和5所示的氨基酸序列的蛋白质。
当然,这些蛋白质可用化学、物理或遗传工程技术进行至少一种选自置换、插入和缺失的修饰。使用具有SEQ ID No.2、4和5所示的氨基酸序列的蛋白质或者相应于这种氨基酸序列一部分的区域的肽片段作为抗原,也有可能构建出针应于可调控金黄担子素敏感性的蛋白质的抗体。
第十项发明涉及能够赋予金黄担子素抗性的蛋白质,其中如序列表中SEQ ID No.4所示的具金黄担子素敏感性的基因中275位的氨基酸Gly已被另一种氨基酸所取代。该发明还涉及上述蛋白质的功能衍生物,该衍生物是通过利用化学、物理或遗传工程技术引入选自置换、插入和缺失的至少一种修饰而丝毫不影响其生物学活性而得到的。编码能够赋予金黄担子素抗性的本发明的蛋白质可以利用编码能够赋予金黄担子素抗性的蛋白质的DNA(如序列表中SEQ ID No.3和12所示)用遗传工程技术适当地制备。可以通过测试其使金黄担子素敏感性细胞转化为金黄担子素抗性细胞的活性来确定它的生物学活性。
第十一项发明涉及编码第九项发明中能够赋予金黄担子素抗性的蛋白质的DNA。它还牵涉到向上述DNA中引入选自核苷酸的置换、插入和缺失的至少一种修饰而得到的DNA。这种修饰可以由位点特异性诱变容易地实现。可以使用这些修饰的DNA来产生突变蛋白质。
第十二项发明涉及利用核酸探针通过杂交作用检测可调控金黄担子素敏感性的基因之方法。在此可使用的核酸探针实例包括由至少15个碱基组成并可与序列表中No.1、3和12所示的DNA选择性杂交的寡核苷酸及其片段。可以适当地使用那些编码序列表中SEQ ID No.9-11所示的氨基酸序列或其一部分并由至少15个碱基组成的碱基序列。利用这种核酸探针,对从靶有机体中萃取的DNA或RNA进行Southern杂交式Northern杂交,以给出靶有机体中可调控金黄担子素敏感性的基因。该核酸探针也可以用于上述基因可在其中表达之组织的确定,或通过原位杂交来确定各种重要组织中基因或MRNA的存在。
通过将上述基因或其片段连接到载体上,将其导入细菌中,随后复制,利用酚等从破碎细胞溶液中萃取,用可识别载体连接位点的限制性内切酶进行剪切,电泳并从凝胶中切除,可以制备这种核酸探针。另外,也可以通过使用DNA合成仪的化学合成或根据序列表中SEQ ID No.1、3和12所示的每种碱基序列的PCR基因扩增技术来制备这种核酸探针。为了提高利用中的检测灵敏度,可以用放射性同位素或荧光物质来标记核酸探针。
为了进一步详述本发明而非限制性地给出以下实施例。实施例1:调控金黄担子素敏感性并来源于无冠构巢曲霉的基因anaurl的克隆1-a)无冠构巢曲霉中金黄担子素抗性突变体的分离
将显示出金黄担子素敏感性的无冠构巢曲霉FGSC89菌株(5μg/ml)接种到SD斜面(含190多胨S、290葡糖和290琼脂)上,在30℃条件下培养7天。将其悬培在5ml的0.1%的Tween80溶液(含0.8%Nacl)中,之后,用玻璃滤器(3G3型)过滤悬浮液,将得到的滤液用作分生孢子悬浮液。将该分生孢子悬浮液用紫外线幅射5分钟,这样进行诱变。在这些条件之下,存活率约为25%。在阻断光线达30分钟或更长时间之后,将分生孢子接种到SD平板上,在30℃条件下培养4天。用玻璃滤器收集所形成的分生孢子,进而接种到含5μg/ml的金黄担子素的Cz+bi培养基〔含4.9%的Czapek溶液琼脂(Difco生产)、200μg/ml的精氨酸和0.02μg/ml的生物素〕中,在30℃下进行培养。两或三天之后,得到8个金黄担子素抗性菌落。虽然这些细胞表现出对80μg/ml金黄担子素的抗性,但在对两性霉素B、放线菌酮和克霉唑的敏感性方面它们和亲本菌株是相同的。因此推测出这样获得的抗性并不是多种药物抗性而是对金黄担子素特异的抗性。1-b)金黄担子素抗性菌株基因组文库的制备
在金黄担子素抗性菌株中表现出特别强抗性的菌株R1中萃取基因组DNA,并用以下方法提纯。在PD培养基〔含2.4%的马铃薯葡糖液体培养液(Difco生产)〕中30℃中震荡培养2天,用玻璃滤器(3G1型)收集菌丝并用蒸馏水冲洗。随后将细胞脱水并悬浮在20ml的原生质体生成溶液〔含20mg/ml的Yatalase(Ozeki Shuzo生产)、0.8M的Nacl和10mM的磷酸钠缓冲液、PH值6.0〕中。而后在30℃条件下将悬浮液缓慢搅拌过夜,以此生成原生质体。用玻璃滤器(3G2型)过滤悬浮液,因而将原生质体收集到滤液中,然后通过离心(2,000rpm,5分钟)进行收集。在用0.8M NaCl冲洗两次后,将原生质体悬浮在2ml的TE溶液(含10mM和Tris-HCl,1mM的EDTA,PH8.0)中并加入2ml的裂解溶液(含2%的SDS、0.1M NaCl、10mM EDTA和50mMTris-HCl。PH7.0)。经缓慢搅拌之后,将混合物在室温下保持15分钟,然后离心(3,500rpm,5分钟)收集上清液。而后加入与等量的酚/氯仿/异戊醇(25/24/1)混合物,将试管中的混合物轻轻混匀,在3,000rpm下离心5分钟,收集液体上层。而后,在-20℃条件下加入2.5倍体积的乙醇。将生成的混合物在-80℃下保持10分钟,然后以3,500rpm离心15分钟。将这样沾淀出的DNA干燥。而后加入0.5ml的TE溶液和2.5ml的RNase A溶液(20mg/ml),将混合物在37℃下保持30分钟。
加入0.5ml的酚/氯仿/异戊醇之后,将得到的混合物轻轻混匀,以10,000rpm离心5分钟以收集上层物。重复此操作一次。加入0.5ml的氯仿/异戊醇(24/l)之后,将所得混合物轻轻混匀,离心(10,000rpm)5分钟收集上清液。然后加入0.05ml的5M NaCl和0.5ml的异丙醇,将混合物在-80℃下保持10分钟,离心(10,000rpm)15分钟来收集DNA。
通过用4U限制性内切酶Bam HI37℃处理15分钟,使纯化的8μg基因组DNA部分消化。在用酚/氯仿脱蛋白后,通过乙醇沉淀来收集DNA。在0.8%琼脂糖凝胶柱上进行DNA电泳,对3-15Kb区的DNA进行萃取并提纯。将所得到的DNA连接到已用BamHI完全消化的载体pDHG25〔Gene,98,61-67(1991)〕上,使用的是DNA连接药盒(Takare Shuzo有限公司生产)。将大肠杆功HB101转化以制备出抗性菌株的基因组文库。将含有该基因组文库的大肠杆菌细胞在50ml的含100μg/ml的氨苄青霉素的LB培养基(含1%的细菌培养用胰化蛋白胨,0.5%的细菌培养用酵母膏和0.5%的NaCl)中37℃下培养过夜。而后,从大肠杆菌细胞中收集质粒并提纯。1-c)金黄担子素抗性基因anaurlR的表达与克隆
用下列方法将来源于得到的金黄担子素抗性菌株基因组库的质粒转化到菌株无冠构巢曲霉FGSC89中。即,将无冠构巢曲霉在PD培养基中30℃震荡培养2天。而后通过用3G1玻璃滤器过滤培养液来收集菌丝并用蒸馏水冲洗。经充分脱水之后,将细胞悬浮在10ml的原生质体生成溶液中。在30℃下经缓慢震荡发生反应3小时之后,使细胞悬浮液通过玻璃滤器3G3。而后将滤液以2,000rpm离心5分钟来收集原生质体。将收集的原生质体用0.8M NaCl冲洗2次并悬浮在S011(含0.8MNaCl、10mM CoCl2及10mM Tris-HCl,PH8.0)中使原生质体浓度达到2×108ml。而后加入2倍体积的S012〔含40%(w/v)的PEG4000、50mM CaCl2和50mM Tris-HCl,PH8.0〕并充分混合。
将来源于基因组文库的质粒10μg加入到0.2ml的原生质体悬浮液中。经充分混合后,使混合物在冰中静置30分钟,然后加入1ml的Sol2。充分混合之后,使混合液在室温下静置15分钟,再加入8.5ml的Sol1。充分混合后,将混合液2,000rpm离心5分钟来收集原生质体。加入0.2ml和Sol1,将生成的混合物置于基本培养基平板(含4.9%的Czapek溶液琼脂、0.8M NaCl和0.02μg/ml生物素)的中心,其中还含有5μg/ml金黄担子素。而后,将5ml的软琼脂培养基(含3.5%的Czapek-Dox液体培养液、0.8M NaCl、0.02mg/ml生物素和0.5%琼脂)涂在上面,而后在30℃下培养3-5天。可以认为在这个平板上生长的菌落携带)含有金黄担子素抗性基因的质粒。
这样,在含金黄担子素的培养基上形成了大约70个菌落。将这些菌落移植到20ml的Cz+Bi培养基中,在30℃下培养2天。而后,根据实施例1-b)中描述的DNA萃取和纯化方法,从增殖的细胞中收集并纯化DNA。用该DNA转化菌株大肠杆菌HB101并涂布在含100μg/ml的氨苄青霉素的LB平板上。从这样形成的大肠杆菌菌落中制备出质粒DNA。该质粒含12kb的DNA,被命名为pR1-1。图5示出了pR1-1中所含的12Kb DNA的限制性内切酶图谱。为了进一步详细确定抗性基因区域,用限制性内切酶将12Kb的DNA片段消化成各种大小的片段。而后,将这些片段克隆到载体pDHG 25中。将含各种DNA的质粒转化到菌株无冠构巢曲霉FGSC89中,以便确定是否能获得金黄担子素抗性。结果表明在片段Bg1II(5.8Kb)中存在着具金黄担子素抗性的活性。这样就证实了基因anaurlR位于该片段中。图1示出了该金黄担子素抗性基因anaurlR的DNA片段的限制性内切酶图谱。将该片段亚克隆到载体pUC118中,并将所得到的质粒命名为pUR1。使用该质粒对DNA的序列进行鉴定。序列表中SEQ ID No.1显示了该碱基序列。正如该DNA序列所表明的那样,基因anaurlR是由两个含有内含子的外显子区组成的基因。其揭示了该基因编码具有如序列表中SEQ ID No.2所示的氨基酸序列的蛋白质。1-d)金黄担子素敏感基因anaurlS的克隆
为了从无冠构巢曲霉的正常细胞中得到金黄担子素敏感性基因的CDNA,首先从菌株无冠构巢曲霉FGSC89中萃取全RNA。即,在200ml的PD培养基中培养该菌株并利用玻璃滤器(3G1型)来收集细胞。经充分脱水之后,用液氮将细胞迅速冷冻。而后将冷冻的细胞在研钵中粉碎,利用RNA萃取药盒(pharmecia生产)来萃取全RNA(2.6mg)并纯化之。从1mg这些RNA中,利用Oligotex-dT30〔Super〕(TakaraShuzo有限公司生产)制备出12.8μg的聚(A)+RNAso利用5μg的聚(A)+RNAs,用Takare CDNA合成药盒(Takara Shuzo有限公司生产)合成出CDNAs。把这样合成出的CDNAs连接到λ噬菌体载体λSHIOXTM(由Novagen公司生产)上,利用Phage MakerTM System,Phage Pack Extract(Novagen公司生产)进行体内包装,以构建CDNA文库。该CDNA文库在宿主菌株大肠杆菌ER1647中被感染。在与顶层琼脂糖(含0.7%琼脂糖的LB培养基)混合之后,将其涂布在LB平板上并在37℃下培养过夜,形成噬菌斑。把这样形成的噬菌斑转移到尼龙膜(Hybond N,由Amersham生产)上并进行噬斑杂交。作为探针,使用了以PstI和SalI切割得自实施例1-c)的质粒pUR1而得到的2.6Kb的DNA片段。利用随机引物DNA标记药盒(由Takare Shuzo有限公司生产),以〔α-32P〕dcTP标记该DNA片段并用作杂交中的探针。作为筛选4×105个噬菌斑的结果,得到了8个可与该探针杂交的噬菌体克隆。接着,将这些噬菌体在大肠杆菌中进行自动亚克隆,以得到具有质粒的大肠杆菌菌株,在这些质粒中含CDNA的区域已被自动亚克隆化了。从这些菌株中提纯质粒并对CDNA进行长度比较。这样选择出具有最长CDNA的PS15(2.9Kb),并亚克隆到pUC118中,而后进行DNA序列的鉴定。将该质粒定命为pANAR1。由pANAR1转化的大肠杆菌菌株被命名为大肠杆菌JM109/pANAR1并已贮存于工业科技机构的国立生命科学和人体技术研究所中,注册号为FERM BP-5180。图2显示了该CDNA的限制性内切酶图谱。其DNA碱基序列如序列表中SEQID No.3所示。正如该碱基序列表明的,基因anaurlS编码具有如序列表中SEQ ID No.4所示氨基酸序列的蛋白质。与抗性基因anaurlR的比较表明了SEQ ID No.3中1218位的碱基G已突变为T并且在氨基酸水平上,275位的氨基酸甘氨酸已转化为缬氨酸。进一步证实了基因组DNA具有一个内含子(56bp)。图5显示了基因组DNA与CDNA之间的关系。实施例2:由烟曲霉携带的基因afaurlS的确定与克隆2-a)利用Nothern杂交来检测基因afaurlS
从菌株烟曲霉TIMM1776中,用与实施例1-d)相同的方法萃取并纯化聚(A)+RNAs。通过在含甲醛的1.2%琼脂糖凝胶上进行电泳而分离出烟曲霉和无冠构巢曲霉中的聚(A)+RNAs(1μg)并转移至尼龙膜上。固定之后,利用以〔α-32P〕dcTP标记的基因anaurlS的CDNAHindIII片段(741bp)作为探针来实现杂交。在60℃下杂交过夜之后,在60℃下用0.5×SSC和0.1%SDS冲洗混合物。在图5中,泳道1和泳道2分别显示了得自无冠构巢曲霉和烟曲霉和聚(A)+RNAs的杂交结果。正如图6清楚显示的,杂交的放射性自显影表明了烟曲霉和无冠构巢曲霉均具有大小相同的金黄担子素敏感性基因。不过,烟曲霉的带很弱,这表明这些基因之间的同源性并非那样高。2-b)烟曲霉携带的基因afaurlS的克隆
通过利用在实施例2-a)中纯化的烟曲霉聚(A)+RNAs,根据实施例1-d)中所述的制备CDNA文库的方法来制备烟曲霉的CDNA文库。利用无冠构巢曲霉CDNA的PstI-EcoRI片段(921bp)作为探针,在与实施例2-a)相同的杂交条件下对上述文库进行筛选。由此得到8个噬菌体克隆。利用如实施例1-d)所述的方法,从这些噬菌体克隆中以质粒的形式回收CDNA。将质粒纯化,进行CDNA长度比较。这样选择出具有最长CDNA的质粒(2.9Kb)。将这个CDNA亚克隆至pUC118中并鉴定DNA序列。这个如序列表中SEQ ID No.12所示的碱基序列表明该基因编码具有序列表中SEQ ID No.5所示氨基酸序列的蛋白质。烟曲霉TIMMI776菌株的afaurlS蛋白质与无冠构巢曲霉FGSC89菌株的anaurlS蛋白质氨基酸序列比较表明它们具有较高的同源性(87%)。实施例3:黑曲霉和米曲霉所携带的可调控金黄担子素敏感性的基因的确定
根据实施例1-b)所述方法从菌株烟曲霉TIMM1776、黑曲霉FGSC805和米曲霉IF05710中提取出基因组DNAs并提纯之。另外,根据P.philippsen等人的方法〔见Methods in Enzymology,194,169-175,(1991)〕,从酵母菌株酿酒酵母DKD-5D和粟酒裂殖酵母JY745中提取出基因组DNAs并纯化之。将无冠构巢曲霉、烟曲霉、黑曲霉、米曲霉、酿酒酵母和粟酒裂殖酵母的基因组DNAs各5μg用限制性内切酶PstI切割,进行0.8%琼脂糖凝胶电泳分离,转移至尼龙膜上并固定。接着,利用以〔α-32P〕dcTP标记的anaurlS基因的CDNA PstI-EcoRI片段作为探针进行Southern杂交。杂交反应条件同实施例2-a)所述。图7表明杂交反应的放射自显影照片。图7清晰地显示出黑曲霉和米曲霉中也存在可调控金黄担子素敏感性的基因。其还揭示出无冠构巢曲霉的DNA不能与酿酒酵母和粟酒裂殖酵母的金黄担子素敏感性基因杂交。在图7中,泳道1、2、3、4、5和6分别示出无冠构巢曲霉、烟曲霉、黑曲霉、米曲霉、酿酒酵母和粟酒裂殖酵母的基因组DNAs的Southern杂交结果。
本发明提供了一种可调控金黄担子素敏感性并来源于曲霉属霉菌的新蛋白质以及编码该蛋白质的基因,即,调控金黄担子素敏感性的基因。这些物质可用于由携带该基因的生物体引起的疾病(如真菌病)的诊断和治疗。本发明还提供了上述基因的反义DNA和反义RNA,一种可与该基因杂交的核酸探针,利用该核酸探针检测基因的方法以及利用具有所导入的该基因的转化体来生产可调控金黄担子素敏感性的蛋白质的方法。这些物质也可用于诸如真菌病等疾病的诊断和治疗。
序列表SEQ ID NO:1序列长度:4140序列类型:核酸链型:双链拓扑学:线性分子类型:基因组DNA序列描述:AGATCTGTGG CTTCCGGTTG GCTACTTGTA ACCAACTGAT GGTCAGATGG ATCTGCCGTC 60TGTTTTGATT TGAATTTTCC CTGCTCATTC TGATTCTGTG AGAGGCTGCA TTCATTATCA 120CATCTCATAC CCGGCGCCTG CGACTTCGGT CACCTCTGCG GTCTGGCGGT TACCGGGGTC 180CGTCTGAGAC TCGTCAGTCA GCCATTCGAG TATGCGAACT CTGACTTTGC TCACCTAAGA 240GTTTGCACGA GATGCCGAAA TCCTCCTCGA GTAGAGTTTG CAAGGCTTGA ACCTTGGTCC 300TTGAAGCCCG AAAGTGGCTC AGTAGTGGGA TCGATAGTCT GGTTGTTGAA GATTTTCTCC 360TCCACCTTAC CTATGGCCGC TGGCCTTCTC CACCTTTCAG GCTTTCAGGC ACCCTCGGCT 420CGGATTCTGT ATCGTCCGGT ACCGAAGCTA GTCCTAGCTA GTCAAAGCTA GTCCAAGCTA 480GTCTCGTCAA GGTTTGGCGC AGCGCGGTTC CGTGTAAAGT ACAAATTTGA AATACGAATA 540CGCAGTACTC GCAGCCGGCA CTTCCGCTCA GCCCAGGCTC AGAGGCTAAG GGTGTTGGCG 600CTTCCTCATC ATCTTCTTCT CGTCGACCTT TTCCTCTTTC TCTCCCTATC GGTGCTTCTC 660TCCAACCTCA TTCTCAGTCG TTCGCCCATC AGGTTTATAC TCCGGCTCCG TGGCCATCTG 720CCTCCCTCAC GACCTCCTCG TTCCAGGTTT TCCTCTCGAC TGCTGCGCCC TTGCACTTCG 780CCTTGCATCA GTGAAACCCC CTGCAACGTG ACGGCTCAAA GACATCCTCG TTTGGCCGCT 840GGAGACCGGA GCGTGCGCTT CGTTTCGTCT TCTTCGAACC GATCTCAATT TCCCCGCTCG 900GGTTGACGCC GTCAGCACCC TGCTCGTTGC CTAACGGCTT GTTATTCAAG ACCCCTTTTC 960TGCCGCTTCC GCGACCGATT TATTCGTCGC CTTCCAACTC TTGTACAATC GGGGGGAAAG 1020AAAGCAGACG GAGTTCGATC TGGAGGAATT ATAGCTGAGT CTTGCCCGCA AGACTCGCCG 1080CAACCATGAA TCAAACACTT CCCACGTGGA AGGACCGCAC GCAGAACCAG TTTGGAAAGC 1140TTCAGATCCA GGTTCCATGG CGGTCCATCC AACTGCTCGT CCCGCATCGC ATGCGGCGGA 1200AGTTAAGGTC CAAATTGCGC AGTAGAGCGT CTCCTACCTC GTCAATAGCC TCTTTACAGA 1260CGTCGTTATC GCCTGCAGAC ACACTACGAT CGCTCCAAAG CCACCGATGG ACGGTTTACG 1320ACTTCCAATA TCTGCTTCTG TTGATCGTGG GCATCTTCTC TTTGACCGTT ATCGAGTCGC 1380CCGGGCCTTT GGGCAAAACG GCCATTTTCT CCATGCTCCT ATTCTCTCTC CTGATCCCTA 1440TGACCCGCCA GTTCTTCCTC CCGTTTCTGC CGATTGCCGG ATGGCTTCTG TTTTTCTACG 1500CCTGCCAGTG AGTTAAAAAC AACCCGCTAC CAGACCCCGT GCAGCAGTTA CTCACATATG 1560CAGGTTCATC CCAAGCGATT GGCGCCCTGC GATTTGGGTT CGTGTCTTGC CTGCACTGGA 1620GAATATTCTC TACGGCGCAA ACATCAGCAA CATCCTATCC GCTCACCAGA ACGTTGTGCT 1680TGACGTGCTG GCGTGGCTAC CCTACGGTAT CTGCCACTAT GGCGCTCCGT TTGTGTGCTC 1740GTTGATCATG TTCATCTTCG GTCCGCCCGG CACTGTTCCC CTTTTCGCGC GCACTTTCGG 1800CTATATCAGT ATGACTGCGG TTACTATTCA GCTGTTTTTC CCTTGCTCTC CACCTTGGTA 1860TGAGAATCGC TATGGTCTAG CTCCGGCAGA CTACTCCATC CAAGGTGATC CCGCAGGGCT 1920TGCCCGCATT GACAAGCTTT TCGGCATCGA CCTTTACACG TCTGTTTTCC ATCAGTCGCC 1980TGTTGTGTTC GGCGCTTTTC CGTCGCTGCA TGCTGCCGAC TCAACCCTGG CCGCACTTTT 2040CATGAGTCAT GTTTTCCCCC GCATGAAGCC CGTCTTCGTG ACCTATACTC TATGGATGTG 2100GTGGGCAACA ATGTACCTCT CACATCACTA TGCGGTCGAT TTGGTTGCGG GTGGTCTCCT 2160GGCCGCCATT GCTTTCTACT TCGCCAAGAC CCGATTCCTT CCCCGTGTCC AGCTCGACAA 2220GACCTTCCGT TGGGACTACG ACTATGTGGA ATTCGGCGAG TCTGCCCTGG AGTATGGGTA 2280TGGTGCAGCT GGCTATGATG GAGACTTCAA TCTCGACAGC GATGAATGGA CTGTTGGTTC 2340TTCATCCTCC GTCTCCTCAG GCTCCTTGAG TCCCGTTGAC GATCATTACT CATGGGAAAC 2400CGAGGCACTG ACCTCCCCAC ATACTGATAT TGAGTCCGGC AGGCATACTT TCAGCCCTTG 2460AGTAGCCACA AACCAAACTC GATACCTGCA TATAGCGATC TCGCTCCTCC TCCACTGCAT 2520CTATTTACGA GACGGCGTTA GAACATTTCA CGACATTCTG GCTTTATTGC ATCGAGCACA 2580TTTCGACACA TATATCTTTA ATACCCTTTC TTCGGTGTCC CAGATCATCG GTTCGACCTT 2640AATGTACCTC GGTCCGAATC CGCCTGGGAT ACTGTTTCTC TTTCCGCCGC ACTTCACTGT 2700ACATTGCTTG ACATTGCGAA ACCGGGTTGG GCTCGAACGT GGGATGGGTT ATCGCTCATC 2760GCTACACGCC GTTGCTCCAT CATAATGTTA ATGGACACAA TGGGGCTACG CATCCTGGTG 2820TTTAGTCCTG GAAGACCATC CGATAACCCC CGTCGGTAAC ACTCGCTTGT CTCGTGTCCA 2880CCCAGACACT ACTTCAATTC TCACTTCTAT CGTCCGCTAT TACCTTGACC TGGTCGAACC 2940CATCCTTATT ATTCGTTTCG ACTATGCTAT ATATTTATTT TTACCATTCG TGTCGATCGC 3000TCATACTCTT GGCGCTTGGG ACTGGAAGCA TTTATATTGG AAAAAATCAC GGAATGGGGC 3060GCCTTTTCTT CTTGCACTTC ACTCGCTGTG CATAGACGGT TTTACATTTC TGCTTTGCAA 3120TGCATCACGA ACTCTGCATT AGCATATAGA AAGAGGGGAA GGATGGACCT TCTTCTTGAT 3180TGCTCGCATG GTTTATCCAT TCGCTCAAAG TGGATTACGT CCACATATTA CCCGGGGGCT 3240ATACACATGG CTACTGTGTT GCTTTCTGAC ATTCGCCGGA CGTGCAAGGT TGGGAGGAGA 3300GTCTGACGCT GACGGGGCTT GTTGAAGGAT GTTCACGCGT CCCGATTTGA CCCGGCTTCG 3360ACTAACCTCA GATTCTCGAC TTGTTGGACG GTGACTTGAC TTGCTTGCTA TGGTCTGACG 3420CTCTCACACC TACCTATCAC ATCCTCCTCA CCTCACAAAT TCCGCTCATG GACACTATCC 3480TCTTCTTTTC GTTTCCCTTG GATAGTGTGT GTGTGTGTGT GGTTGGGGCA AATTATCCAT 3540AGCAGCAGTA TTATTAGTTA TAATCCGGTA GTGTTATGAT TTATGAAGGC AACTTGTATA 3600CTATTGCCAC TTTGTCCATA TCTCTTGCTT GTAATAGAAC TGACATCGCG ACGCTTCGGC 3660CACGATGCAT ATAAAAACTC TAGTCAACAC GATATTAACA AGCGAAACCA TTACGCTGTA 3720AACTATTCAG GATCGCCGCG GGCCCATCTG GGACTTGACT GTACTAAATA TGTCCTAAAG 3780CAAGCAGACT AAATATTTAA CGTGGGATAT TATTCATATA CGCATATGTA TACATAGTCA 3840TAACAAGCCA AGGGGTGGGT AGGGGTGGGT AATTATTATT TTTTTTCGTC GATACAAGTA 3900TCCATCCTTA AATGTCCGTG GTCTACTCTT CATAAATCTT AACCCGCTCC GCATACTCCT 3960TTATCCTCGA GACAAAAGTG TCTTCAATTT CATCGCCACG GCCACCAGCA ACGCGGAGGA 4020TAAGGTCGTT GAGAGAGGCG CGGCCGAGAA TGTCGACATG GTCGCCTTCA TATTGTTAGC 4080ATGCGACGTC AGACTGGAAC CAGGAAGGGA AAGGAGAGAG GTACCTGTAT TTGGACCACC 4140SEQ ID NO:2序列长度439序列类型:氨基酸链型:单链拓扑学:线性分子类型:肽序列描述:
Met Asn Gln Thr Leu Pro Thr Trp Lys Asp Arg Thr Gln Asn Gln
1 5 10 15Phe Gly Lys Leu Gln Ile Gln Val Pro Trp Arg Ser Ile Gln Leu
20 25 30Leu Val Pro His Arg Met Arg Arg Lys Leu Arg Ser Lys Leu Arg
35 40 45Ser Arg Ala Ser Pro Thr Ser Ser Ile Ala Ser Leu Gln Thr Ser
50 55 60Leu Ser Pro Ala Asp Thr Leu Arg Ser Leu Gln Ser His Arg Trp
65 70 75Thr Val Tyr Asp Phe Gln Tyr Leu Leu Leu Leu Ile Val Gly Ile
80 85 90Phe Ser Leu Thr Val Ile Glu Ser Pro Gly Pro Leu Gly Lys Thr
95 100 105Ala Ile Phe Ser Met Leu Leu Phe Ser Leu Leu Ile Pro Met Thr
110 115 120Arg Gln Phe Phe Leu Pro Phe Leu Pro Ile Ala Gly Trp Leu Leu
125 130 135Phe Phe Tyr Ala Cys Gln Phe Ile Pro Ser Asp Trp Arg Pro Ala
140 145 150Ile Trp Val Arg Val Leu Pro Ala Leu Glu Asn Ile Leu Tyr Gly
155 160 165Ala Asn Ile Ser Asn Ile Leu Ser Ala His Gln Asn Val Val Leu
170 175 180Asp Val Leu Ala Trp Leu Pro Tyr Gly Ile Cys His Tyr Gly Ala
185 190 195Pro Phe Val Cys Ser Leu Ile Met Phe Ile Phe Gly Pro Pro Gly
200 205 210Thr Val Pro Leu Phe Ala Arg Thr Phe Gly Tyr Ile Ser Met Thr
215 220 225Ala Val Thr Ile Gln Leu Phe Phe Pro Cys Ser Pro Pro Trp Tyr
230 235 240Glu Asn Arg Tyr Gly Leu Ala Pro Ala Asp Tyr Ser Ile Gln Gly
245 250 255Asp Pro Ala Gly Leu Ala Arg Ile Asp Lys Leu Phe Gly Ile Asp
260 265 270Leu Tyr Thr Ser Val Phe His Gln Ser Pro Val Val Phe Gly Ala
275 280 285Phe Pro Ser Leu His Ala Ala Asp Ser Thr Leu Ala Ala Leu Phe
290 295 300Met Ser His Val Phe Pro Arg Met Lys Pro Val Phe Val Thr Tyr
305 310 315Thr Leu Trp Met Trp Trp Ala Thr Met Tyr Leu Ser His His Tyr
320 325 330Ala Val Asp Leu Val Ala Gly Gly Leu Leu Ala Ala Ile Ala Phe
335 340 345Tyr Phe Ala Lys Thr Arg Phe Leu Pro Arg Val Gln Leu Asp Lys
350 355 360Thr Phe Arg Trp Asp Tyr Asp Tyr Val Glu Phe Gly Glu Ser Ala
365 370 375Leu Glu Tyr Gly Tyr Gly Ala Ala Gly Tyr Asp Gly Asp Phe Asn
380 385 390Leu Asp Ser Asp Glu Trp Thr Val Gly Ser Ser Ser Ser Val Ser
395 400 405Ser Gly Ser Leu Ser Pro Val Asp Asp His Tyr Ser Trp Glu Thr
410 415 420Glu Ala Leu Thr Ser Pro His Thr Asp Ile Glu Ser Gly Arg His
425 430 435Thr Phe Ser ProSEQ ID NO:3序列长度:2856序列类型:核酸链型:双链拓扑学:线性分子类型:cDNA序列描述:GGTTTATACT CCGGCTCCGT GGCCATCTGC CTCCCTCACG ACCTCCTCGT TCCAGGTTTT 60CCTCTCGACT GCTGCGCCCT TGCACTTCGC CTTGCATCAG TGAAACCCCC TGCAACGTGA 120CGGCTCAAAG ACATCCTCGT TTGGCCGCTG GAGACCGGAG CGTGCGCTTC GTTTCGTCTT 180CTTCGAACCG ATCTCAATTT CCCCGCTCGG GTTGACGCCG TCAGCACCCT GCTCGTTGCC 240TAACGGCTTG TTATTCAAGA CCCCTTTTCT GCCGCTTCCG CGACCGATTT ATTCGTCGCC 300TTCCAACTCT TGTACAATCG GGGGGAAAGA AAGCAGACGG AGTTCGATCT GGAGGAATTA 360TAGCTGAGTC TTGCCCGCAA GACTCGCCGC AACCATGAAT CAAACACTTC CCACGTGGAA 420GGACCGCACG CAGAACCAGT TTGGAAAGCT TCAGATCCAG GTTCCATGGC GGTCCATCCA 480ACTGCTCGTC CCGCATCGCA TGCGGCGGAA GTTAAGGTCC AAATTGCGCA GTAGAGCGTC 540TCCTACCTCG TCAATAGCCT CTTTACAGAC GTCGTTATCG CCTGCAGACA CACTACGATC 600GCTCCAAAGC CACCGATGGA CGGTTTACGA CTTCCAATAT CTGCTTCTGT TGATCGTGGG 660CATCTTCTCT TTGACCGTTA TCGAGTCGCC CGGGCCTTTG GGCAAAACGG CCATTTTCTC 720CATGCTCCTA TTCTCTCTCC TGATCCCTAT GACCCGCCAG TTCTTCCTCC CGTTTCTGCC 780GATTGCCGGA TGGCTTCTGT TTTTCTACGC CTGCCAGTTC ATCCCAAGCG ATTGGCGCCC 840TGCGATTTGG GTTCGTGTCT TGCCTGCACT GGAGAATATT CTCTACGGCG CAAACATCAG 900CAACATCCTA TCCGCTCACC AGAACGTTGT GCTTGACGTG CTGGCGTGGC TACCCTACGG 960TATCTGCCAC TATGGCGCTC CGTTTGTGTG CTCGTTGATC ATGTTCATCT TCGGTCCGCC 1020CGGCACTGTT CCCCTTTTCG CGCGCACTTT CGGCTATATC AGTATGACTG CGGTTACTAT 1080TCAGCTGTTT TTCCCTTGCT CTCCACCTTG GTATGAGAAT CGCTATGGTC TAGCTCCGGC 1140AGACTACTCC ATCCAAGGTG ATCCCGCAGG GCTTGCCCGC ATTGACAAGC TTTTCGGCAT 1200CGACCTTTAC ACGTCTGTTT TCCATCAGTC GCCTGTTGTG TTCGGCGCTT TTCCGTCGCT 1260GCATGCTGCC GACTCAACCC TGGCCGCACT TTTCATGAGT CATGTTTTCC CCCGCATGAA 1320GCCCGTCTTC GTGACCTATA CTCTATGGAT GTGGTGGGCA ACAATGTACC TCTCACATCA 1380CTATGCGGTC GATTTGGTTG CGGGTGGTCT CCTGGCCGCC ATTGCTTTCT ACTTCGCCAA 1440GACCCGATTC CTTCCCCGTG TCCAGCTCGA CAAGACCTTC CGTTGGGACT ACGACTATGT 1500GGAATTCGGC GAGTCTGCCC TGGAGTATGG GTATGGTGCA GCTGGCTATG ATGGAGACTT 1560CAATCTCGAC AGCGATGAAT GGACTGTTGG TTCTTCATCC TCCGTCTCCT CAGGCTCCTT 1620GAGTCCCGTT GACGATCATT ACTCATGGGA AACCGAGGCA CTGACCTCCC CACATACTGA 1680TATTGAGTCC GGCAGGCATA CTTTCAGCCC TTGAGTAGCC ACAAACCAAA CTCGATACCT 1740GCATATAGCG ATCTCGCTCC TCCTCCACTG CATCTATTTA CGAGACGGCG TTAGAACATT 1800TCACGACATT CTGGCTTTAT TGCATCGAGC ACATTTCGAC ACATATATCT TTAATACCCT 1860TTCTTCGGTG TCCCAGATCA TCGGTTCGAC CTTAATGTAC CTCGGTCCGA ATCCGCCTGG 1920GATACTGTTT CTCTTTCCGC CGCACTTCAC TGTACATTGC TTGACATTGC GAAACCGGGT 1980TGGGCTCGAA CGTGGGATGG GTTATCGCTC ATCGCTACAC GCCGTTGCTC CATCATAATG 2040TTAATGGACA CAATGGGGCT ACGCATCCTG GTGTTTAGTC CTGGAAGACC ATCCGATAAC 2100CCCCGTCGGT AACACTCGCT TGTCTCGTGT CCACCCAGAC ACTACTTCAA TTCTCACTTC 2160TATCGTCCGC TATTACCTTG ACCTGGTCGA ACCCATCCTT ATTATTCGTT TCGACTATGC 2220TATATATTTA TTTTTACCAT TCGTGTCGAT CGCTCATACT CTTGGCGCTT GGGACTGGAA 2280GCATTTATAT TGGAAAAAAT CACGGAATGG GGCGCCTTTT CTTCTTGCAC TTCACTCGCT 2340GTGCATAGAC GGTTTTACAT TTCTGCTTTG CAATGCATCA CGAACTCTGC ATTAGCATAT 2400AGAAAGAGGG GAAGGATGGA CCTTCTTCTT GATTGCTCGC ATGGTTTATC CATTCGCTCA 2460AAGTGGATTA CGTCCACATA TTACCCGGGG GCTATACACA TGGCTACTGT GTTGCTTTCT 2520GACATTCGCC GGACGTGCAA GGTTGGGAGG AGAGTCTGAC GCTGACGGGG CTTGTTGAAG 2580GATGTTCACG CGTCCCGATT TGACCCGGCT TCGACTAACC TCAGATTCTC GACTTGTTGG 2640ACGGTGACTT GACTTGCTTG CTATGGTCTG ACGCTCTCAC ACCTACCTAT CACATCCTCC 2700TCACCTCACA AATTCCGCTC ATGGACACTA TCCTCTTCTT TTCGTTTCCC TTGGATAGTG 2760TGTGTGTGTG TGTGGTTGGG GCAAATTATC CATAGCAGCA GTATTATTAG TTATAATCCG 2820GTAGTGTTAT GATTTATGAA GGCAACTTGT ATACTA 2856SEQ ID NO:4序列长度:439序列类型:氨基酸链型:单链拓扑学:线性分子类型:肽序列描述:
Met Asn Gln Thr Leu Pro Thr Trp Lys Asp Arg Thr Gln Asn Gln
1 5 10 15
Phe Gly Lys Leu Gln Ile Gln Val Pro Trp Arg Ser Ile Gln Leu
20 25 30
Leu Val Pro His Arg Met Arg Arg Lys Leu Arg Ser Lys Leu Arg
35 40 45
Ser Arg Ala Ser Pro Thr Ser Ser Ile Ala Ser Leu Gln Thr Ser
50 55 60
Leu Ser Pro Ala Asp Thr Leu Arg Ser Leu Gln Ser His Arg Trp
65 70 75
Thr Val Tyr Asp Phe Gln Tyr Leu Leu Leu Leu Ile Val Gly Ile
80 85 90
Phe Ser Leu Thr Val Ile Glu Ser Pro Gly Pro Leu Gly Lys Thr
95 100 105
Ala Ile Phe Ser Met Leu Leu Phe Ser Leu Leu Ile Pro Met Thr
110 115 120
Arg Gln Phe Phe Leu Pro Phe Leu Pro Ile Ala Gly Trp Leu Leu
125 130 135
Phe Phe Tyr Ala Cys Gln Phe Ile Pro Ser Asp Trp Arg Pro Ala
140 145 150
Ile Trp Val Arg Val Leu Pro Ala Leu Glu Asn Ile Leu Tyr Gly
155 160 165
Ala Asn Ile Ser Asn Ile Leu Ser Ala His Gln Asn Val Val Leu
170 175 180Asp Val Leu Ala Trp Leu Pro Tyr Gly Ile Cys His Tyr Gly Ala
185 190 195Pro Phe Val Cys Ser Leu Ile Met Phe Ile Phe Gly Pro Pro Gly
200 205 210Thr Val Pro Leu Phe Ala Arg Thr Phe Gly Tyr Ile Ser Met Thr
215 220 225Ala Val Thr Ile Gln Leu Phe Phe Pro Cys Ser Pro Pro Trp Tyr
230 235 240Glu Asn Arg Tyr Gly Leu Ala Pro Ala Asp Tyr Ser Ile Gln Gly
245 250 255Asp Pro Ala Gly Leu Ala Arg Ile Asp Lys Leu Phe Gly Ile Asp
260 265 270Leu Tyr Thr Ser Gly Phe His Gln Ser Pro Val Val Phe Gly Ala
275 280 285Phe Pro Ser Leu His Ala Ala Asp Ser Thr Leu Ala Ala Leu Phe
290 295 300Met Ser His Val Phe Pro Arg Met Lys Pro Val Phe Val Thr Tyr
305 310 315Thr Leu Trp Met Trp Trp Ala Thr Met Tyr Leu Ser His His Tyr
320 325 330Ala Val Asp Leu Val Ala Gly Gly Leu Leu Ala Ala Ile Ala Phe
335 340 345Tyr Phe Ala Lys Thr Arg Phe Leu Pro Arg Val Gln Leu Asp Lys
350 355 360Thr Phe Arg Trp Asp Tyr Asp Tyr Val Glu Phe Gly Glu Ser Ala
365 370 375Leu Glu Tyr Gly Tyr Gly Ala Ala Gly Tyr Asp Gly Asp Phe Asn
380 385 390Leu Asp Ser Asp Glu Trp Thr Val Gly Ser Ser Ser Ser Val Ser
395 400 405
Ser Gly Ser Leu Ser Pro Val Asp Asp His Tyr Ser Trp Glu Thr
410 415 420
Glu Ala Leu Thr Ser Pro His Thr Asp Ile Glu Ser Gly Arg His
425 430 435
Thr Phe Ser ProSEQ ID NO:5序列长度:436序列类型:氨基酸链型:单链拓扑学:线性分子类型:肽序列描述:
Met Asn Thr Thr Leu Pro Ser Trp Lys Asp Arg Thr Gln Asn Gln
1 5 10 15
Phe Gly Lys Leu Gln Ile Gln Val Pro Trp Arg Thr Ile Gln Leu
20 25 30
Leu Val Pro His Arg Met Arg Arg Lys Ile Arg Ser Lys Leu Arg
35 40 45
Ser Arg Ile Ser Pro Thr Ser Ser Ile Ser Ser Leu Gln Thr Ser
50 55 60
Phe Ser Pro Val Asp Thr Leu Arg Ser Leu Gln Ser His Arg Trp
65 70 75
Thr Leu Tyr Asp Phe Gln Tyr Leu Leu Leu Leu Ile Val Gly Ile
80 85 90
Phe Ser Leu Ser Val Met Glu Ser Pro Gly Pro Leu Ala Lys Thr
95 100 105
Ala Ala Phe Thr Leu Leu Leu Val Ser Leu Leu Leu Pro Ile Thr
110 115 120Arg Gln Phe Phe Leu Pro Phe Leu Pro Ile Ala Gly Trp Leu Ile
125 130 135Phe Phe Tyr Ala Cys Gln Phe Ile Pro Ser Asp Trp Arg Pro Ala
140 145 150Ile Trp Val Arg Val Leu Pro Ala Leu Glu Asn Ile Leu Tyr Gly
155 160 165Ala Asn Ile Ser Asn Ile Leu Ser Ala His Gln Asn Val Val Leu
170 175 180Asp Val Leu Ala Trp Leu Pro Tyr Gly Ile Cys His Tyr Gly Ala
185 190 195Pro Phe Val Cys Ser Ala Ile Met Phe Ile Phe Gly Pro Pro Gly
200 205 210Thr Val Pro Leu Phe Ala Arg Thr Phe Gly Tyr Ile Ser Met Ala
215 220 225Ala Val Thr Ile Gln Leu Phe Phe Pro Cys Ser Pro Pro Trp Tyr
230 235 240Glu Asn Leu Tyr Gly Leu Ala Pro Ala Asp Tyr Ser Met Pro Gly
245 250 255Asn Pro Ala Gly Leu Ala Arg Ile Asp Glu Leu Phe Gly Ile Asp
260 265 270Leu Tyr Thr Ser Gly Phe Arg Gln Ser Pro Val Val Phe Gly Ala
275 280 285Phe Pro Ser Leu His Ala Ala Asp Ser Thr Leu Ala Ala Leu Phe
290 295 300Met Ser Gln Val Phe Pro Arg Leu Lys Pro Leu Phe Val Ile Tyr
305 310 315Thr Leu Trp Met Trp Trp Ala Thr Met Tyr Leu Ser His His Tyr
320 325 330
Ala Val Asp Leu Val Gly Gly Gly Leu Leu Ala Thr Val Ala Phe
335 340 345
Tyr Phe Ala Lys Thr Arg Phe Met Pro Arg Val Gln Asn Asp Lys
350 355 360
Met Phe Arg Trp Asp Tyr Asp Tyr Val Glu Tyr Gly Asp Ser Ala
365 370 375
Leu Asp Tyr Gly Tyr Gly Pro Ala Ser Phe Glu Gly Glu Phe Asn
380 385 390
Leu Asp Ser Asp Glu Trp Thr Val Gly Ser Ser Ser Ser Ile Ser
395 400 405
Ser Gly Ser Leu Ser Pro Val Asp Asp His Tyr Ser Trp Glu Gly
410 415 420
Glu Thr Leu Ala Ser Pro Ala Thr Asp Ile Glu Ser Gly Arg His
425 430 435
PheSEQ ID NO:6序列长度:401序列类型:氨基酸链型:单链拓扑学:线性分子类型:肽序列描述:
Met Ala Asn Pro Phe Ser Arg Trp Phe Leu Ser Glu Arg Pro Pro
1 5 10 15
Asn Cys His Val Ala Asp Leu Glu Thr Ser Leu Asp Pro His Gln
20 25 30
Thr Leu Leu Lys Val Gln Lys Tyr Lys Pro Ala Leu Ser Asp Trp
35 40 45Val His Tyr Ile Phe Leu Gly Ser Ile Met Leu Phe Val Phe Ile
50 55 60Thr Asn Pro Ala Pro Trp Ile Phe Lys Ile Leu Phe Tyr Cys Phe
65 70 75Leu Gly Thr Leu Phe Ile Ile Pro Ala Thr Ser Gln Phe Phe Phe
80 85 90Asn Ala Leu Pro Ile Leu Thr Trp Val Ala Leu Tyr Phe Thr Ser
95 100 105Ser Tyr Phe Pro Asp Asp Arg Arg Pro Pro Ile Thr Val Lys Val
110 115 120Leu Pro Ala Val Glu Thr Ile Leu Tyr Gly Asp Asn Leu Ser Asp
125 130 135Ile Leu Ala Thr Ser Thr Asn Ser Phe Leu Asp Ile Leu Ala Trp
140 145 150Leu Pro Tyr Gly Leu Phe His Phe Gly Ala Pro Phe Val Val Ala
155 160 165Ala Ile Leu Phe Val Phe Gly Pro Pro Thr Val Leu Gln Gly Tyr
170 175 180Ala Phe Ala Phe Gly Tyr Met Asn Leu Phe Gly Val Ile Met Gln
185 190 195Asn Val Phe Pro Ala Ala Pro Pro Trp Tyr Lys Ile Leu Tyr Gly
200 205 210Leu Gln Ser Ala Asn Tyr Asp Met His Gly Ser Pro Gly Gly Leu
215 220 225Ala Arg Ile Asp Lys Leu Leu Gly Ile Asn Met Tyr Thr Thr Ala
230 235 240Phe Ser Asn Ser Ser Val Ile Phe Gly Ala Phe Pro Ser Leu His
245 250 255Ser Gly Cys Ala Thr Met Glu Ala Leu Phe Phe Cys Tyr Cys Phe
260 265 270
Pro Lys Leu Lys Pro Leu Phe Ile Ala Tyr Val Cys Trp Leu Trp
275 280 285
Trp Ser Thr Met Tyr Leu Thr His His Tyr Phe Val Asp Leu Met
290 295 300
Ala Gly Ser Val Leu Ser Tyr Val Ile Phe Gln Tyr Thr Lys Tyr
305 310 315
Thr His Leu Pro Ile Val Asp Thr Ser Leu Phe Cys Arg Trp Ser
320 325 330
Tyr Thr Ser Ile Glu Lys Tyr Asp Ile Ser Lys Ser Asp Pro Leu
335 340 345
Ala Ala Asp Ser Asn Asp Ile Glu Ser Val Pro Leu Ser Asn Leu
350 355 360
Glu Leu Asp Phe Asp Leu Asn Met Thr Asp Glu Pro Ser Val Ser
365 370 375
Pro Ser Leu Phe Asp Gly Ser Thr Ser Val Ser Arg Ser Ser Ala
380 385 390
Thr Ser Ile Thr Ser Leu Gly Val Lys Arg Ala
395 400SEQ ID NO:7序列长度:422序列类型:氨基酸链型:单链拓扑学:线性分子类型:肽序列描述:
Met Ser Ala Leu Ser Thr Leu Lys Lys Arg Leu Ala Ala Cys Asn
1 5 10 15Arg Ala Ser Gln Tyr Lys Leu Glu Thr Ser Leu Asn Pro Met Pro
20 25 30Thr Phe Arg Leu Leu Arg Asn Thr Lys Trp Ser Trp Thr His Leu
35 40 45Gln Tyr Val Phe Leu Ala Gly Asn Leu Ile Phe Ala Cys Ile Val
50 55 60Ile Glu Ser Pro Gly Phe Trp Gly Lys Phe Gly Ile Ala Cys Leu
65 70 75Leu Ala Ile Ala Leu Thr Val Pro Leu Thr Arg Gln Ile Phe Phe
80 85 90Pro Ala Ile Val Ile Ile Thr Trp Ala Ile Leu Phe Tyr Ser Cys
95 100 105Arg Phe Ile Pro Glu Arg Trp Arg Pro Pro Ile Trp Val Arg Val
110 115 120Leu Pro Thr Leu Glu Asn Ile Leu Tyr Gly Ser Asn Leu Ser Ser
125 130 135Leu Leu Ser Lys Thr Thr His Ser Ile Leu Asp Ile Leu Ala Trp
140 145 150Val Pro Tyr Gly Val Met His Tyr Ser Ala Pro Phe Ile Ile Ser
155 160 165Phe Ile Leu Phe Ile Phe Ala Pro Pro Gly Thr Leu Pro Val Trp
170 175 180Ala Arg Thr Phe Gly Tyr Met Asn Leu Phe Gly Val Leu Ile Gln
185 190 195Met Ala Phe Pro Cys Ser Pro Pro Trp Tyr Glu Asn Met Tyr Gly
200 205 210Leu Glu Pro Ala Thr Tyr Ala Val Arg Gly Ser Pro Gly Gly Leu
215 220 225Ala Arg Ile Asp Ala Leu Phe Gly Thr Ser Ile Tyr Thr Asp Gly
230 235 240Phe Ser Asn Ser Pro Val Val Phe Gly Ala Phe Pro Ser Leu His
245 250 255Ala Gly Trp Ala Met Leu Glu Ala Leu Phe Leu Ser His Val Phe
260 265 270Pro Arg Tyr Arg Phe Cys Phe Tyr Gly Tyr Val Leu Trp Leu Cys
275 280 285Trp Cys Thr Met Tyr Leu Thr His His Tyr Phe Val Asp Leu Val
290 295 300Gly Gly Met Cys Leu Ala Ile Ile Cys Phe Val Phe Ala Gln Lys
305 310 315Leu Arg Leu Pro Gln Leu Gln Thr Gly Lys Ile Leu Arg Trp Glu
320 325 330Tyr Glu Phe Val Ile His Gly His Gly Leu Ser Glu Lys Thr Ser
335 340 345Asn Ser Leu Ala Arg Thr Gly Ser Pro Tyr Leu Leu Gly Arg Asp
350 355 360Ser Phe Thr Gln Asn Pro Asn Ala Val Ala Phe Met Ser Gly Leu
365 370 375Asn Asn Met Glu Leu Ala Asn Thr Asp His Glu Trp Ser Val Gly
380 385 390Ser Ser Ser Pro Glu Pro Leu Pro Ser Pro Ala Ala Asp Leu Ile
395 400 405Asp Arg Pro Ala Ser Thr Thr Ser Ser Ile Phe Asp Ala Ser His
410 415 420Leu ProSEQ ID NO:8序列长度:471序列类型:氨基酸链型:单链拓扑学:线性分子类型:肽序列描述:
Met Ala Ser Ser Ile Leu Arg Ser Lys Ile Ile Gln Lys Pro Tyr
1 5 10 15
Gln Leu Phe His Tyr Tyr Phe Leu Ser Glu Lys Ala Pro Gly Ser
20 25 30
Thr Val Ser Asp Leu Asn Phe Asp Thr Asn Ile Gln Thr Ser Leu
35 40 45
Arg Lys Leu Lys His His His Trp Thr Val Gly Glu Ile Phe His
50 55 60
Tyr Gly Phe Leu Val Ser Ile Leu Phe Phe Val Phe Val Val Phe
65 70 75
Pro Ala Ser Phe Phe Ile Lys Leu Pro Ile Ile Leu Ala Phe Ala
80 85 90
Thr Cys Phe Leu Ile Pro Leu Thr Ser Gln Phe Phe Leu Pro Ala
95 100 105
Leu Pro Val Phe Thr Trp Leu Ala Leu Tyr Phe Thr Cys Ala Lys
110 115 120
Ile Pro Gln Glu Trp Lys Pro Ala Ile Thr Val Lys Val Leu Pro
125 130 135
Ala Met Glu Thr Ile Leu Tyr Gly Asp Asn Leu Ser Asn Val Leu
140 145 150
Ala Thr Ile Thr Thr Gly Val Leu Asp Ile Leu Ala Trp Leu Pro
155 160 165
Tyr Gly Ile Ile His Phe Ser Phe Pro Phe Val Leu Ala Ala Ile
170 175 180Ile Phe Leu Phe Gly Pro Pro Thr Ala Leu Arg Ser Phe Gly Phe
185 190 195Ala Phe Gly Tyr Met Asn Leu Leu Gly Val Leu Ile Gln Met Ala
200 205 210Phe Pro Ala Ala Pro Pro Trp Tyr Lys Asn Leu His Gly Leu Glu
215 220 225Pro Ala Ash Tyr Ser Met His Gly Ser Pro Gly Gly Leu Gly Arg
230 235 240Ile Asp Lys Leu Leu Gly Val Asp Met Tyr Thr Thr Gly Phe Ser
245 250 255Asn Ser Ser Ile Ile Phe Gly Ala Phe Pro Ser Leu His Ser Gly
260 265 270Cys Cys Ile Met Glu Val Leu Phe Leu Cys Trp Leu Phe Pro Arg
275 280 285Phe Lys Phe Val Trp Val Thr Tyr Ala Ser Trp Leu Trp Trp Ser
290 295 300Thr Met Tyr Leu Thr His His Tyr Phe Val Asp Leu Ile Gly Gly
305 310 315Ala Met Leu Ser Leu Thr Val Phe Glu Phe Thr Lys Tyr Lys Tyr
320 325 330Leu Pro Lys Asn Lys Glu Gly Leu Phe Cys Arg Trp Ser Tyr Thr
335 340 345Glu Ile Glu Lys Ile Asp Ile Gln Glu Ile Asp Pro Leu Ser Tyr
350 355 360Asn Tyr Ile Pro Val Asn Ser Asn Asp Asn Glu Ser Arg Leu Tyr
365 370 375Thr Arg Val Tyr Gln Glu Ser Gln Val Ser Pro Pro Gln Arg Ala
380 385 390Glu Thr Pro Glu Ala Phe Glu Met Ser Asn Phe Ser Arg Ser Arg
395 400 405
Gln Ser Ser Lys Thr Gln Val Pro Leu Ser Asn Leu Thr Asn Asn
410 415 420
Asp Gln Val Ser Gly Ile Asn Glu Glu Asp Glu Glu Glu Glu Gly
425 430 435
Asp Glu Ile Ser Ser Ser Thr Pro Ser Val Phe Glu Asp Glu Pro
440 445 450
Gln Gly Ser Thr Tyr Ala Ala Ser Ser Ala Thr Ser Val Asp Asp
455 460 465
Leu Asp Ser Lys Arg Asn
470SEQ ID NO:9序列长度:10序列类型:氨基酸链型:单链拓扑学:线性分子类型:肽特征:3位上的Xaa是Val或IIe。7位上的Xaa是Leu或Val。序列描述:
Leu Asp Xaa Leu Ala Trp Xaa Pro Tyr Gly
1 5 10SEQ ID NO:10序列长度:8序列类型:氨基酸链型:单链拓扑学:线性分子类型:肽序列描述:
Phe Gly Ala Phe Pro Ser Leu His
1 5SEQ ID NO:11序列长度:12序列类型:氨基酸链型:单链拓朴学:线性分子类型:肽特征:5位上的Xaa是Ser或Thr。9位上的Xaa是Ala或Phe。序列描述:
Thr Met Tyr Leu Xaa His His Tyr Xaa Val Asp Leu
1 5 10SEQ ID NO:12序列长度:2935序列类型:氨基酸链型:双链拓扑学:线性分子类型::cDNA序列描述:ATTTTCTTCC CCATAACAAC TCTTCTCGCC CTTCCTCCGG CTCCGTGGCC AAATTGTTTT 60ATGCAGCGCC TCCTAGCGAT TTAACCTCGT TCTCGTTGCC CTTGCCTGTC CGCCTTGCGT 120CAGTACGACC CTTGCAACGT GACCTTCCCC AGAGTATCCT CGTTTGGCCG CTGGAGACCG 180GAGCTTGCAC CCTCATAAAC TAGCTCTTCG AAATCAATTC TCCGTTCTCC AGAGATTATC 240GGATCGAATC TCTCCGCTGT CGACACCTTT CGTCTCTCGG TGATCCTCGC CCTTGGAGTC 300TCGTCACGTT GACGCCTTGA ACCCCTGGCC GCCAACTCCA CATAGGAGAC CACACTTCAT 360TCTTCCCCCG CCATAATTGC AGCACCCTCC GTCTCCCTTC GAGCTCCTCC TGGATCATCA 420AGTCCGAAAG GATTAGACTC GTCGCAGCGA TGAATACCAC CCTTCCATCC TGGAAGGATC 480GGACGCAAAA CCAGTTCGGC AAGCTCCAGA TCCAAGTCCC ATGGCGCACC ATACAACTTC 540TCGTGCCGCA CCGTATGCGA CGGAAGATTC GGTCCAAGCT GCGCAGTCGG ATCTCGCCTA 600CCTCATCGAT ATCCTCGTTG CAGACGTCAT TCTCACCTGT CGATACACTC AGGTCGCTGC 660AAAGTCATAG ATGGACGCTC TATGACTTTC AGTATCTTTT GCTGCTGATT GTCGGCATAT 720TCTCGCTGAG CGTTATGGAA TCACCTGGAC CATTGGCAAA GACCGCCGCG TTTACGCTAC 780TTCTCGTCTC TCTCCTTCTC CCGATTACGC GCCAGTTCTT CTTGCCATTC CTCCCGATTG 840CAGGATGGCT TATATTTTTC TACGCTTGCC AGTTCATCCC GAGCGACTGG CGCCCTGCAA 900TCTGGGTTCG CGTGCTGCCG GCTCTGGAAA ACATTCTCTA CGGTGCTAAT ATCAGTAACA 960TCCTTTCCGC TCACCAAAAT GTGGTGCTTG ACGTTTTGGC GTGGCTTCCC TACGGAATCT 1020GCCATTATGG CGCGCCATTT GTGTGCTCAG CGATCATGTT CATCTTTGGT CCTCCCGGCA 1080CCGTCCCCCT TTTCGCTCGA ACTTTTGGAT ACATCAGCAT GGCTGCAGTC ACCATTCAGC 1140TGTTTTTCCC CTGCTCTCCT CCGTGGTACG AAAATCTGTA TGGTTTGGCT CCGGCTGATT 1200ACTCCATGCC GGGTAATCCT GCGGGCCTTG CTCGCATCGA TGAGCTTTTT GGGATAGACT 1260TGTACACATC GGGCTTCAGA CAATCTCCCG TCGTGTTTGG CGCATTTCCT TCCCTACATG 1320CCGCTGATTC GACACTTGCA GCTCTATTTA TGAGCCAAGT GTTCCCACGG TTGAAGCCCT 1380TGTTTGTCAT CTATACTCTC TGGATGTGGT GGGCTACAAT GTATCTTTCG CACCACTACG 1440CTGTTGATCT GGTCGGTGGT GGCCTCTTGG CAACTGTCGC GTTCTACTTT GCTAAAACGC 1500GGTTCATGCC TCGCGTCCAG AATGATAAGA TGTTCCGCTG GGACTACGAT TATGTTGAGT 1560ACGGCGATTC CGCACTCGAC TATGGGTACG GTCCAGCCAG CTTCGAAGGC GAATTCAACC 1620TTGATAGCGA TGAGTGGACC GTTGGTTCTT CGTCATCCAT TTCGTCCGGC TCCCTCAGTC 1680CAGTTGACGA CCACTACTCT TGGGAGGGCG AGACTCTTGC CTCTCCTGCC ACCGACATCG 1740AGTCTGGAAG GCATTTCTGA TCCTGCTCAA TGAGCCTTGA TACGTACTAC ACTGTGTACG 1800TGCTACTGCA TTGACTAATG AGACGGCGTT TTCAAACAAA TTTTAACGAC ATGCTTGGTT 1860ATCGCATTGA GCTGATTTCG ACACATATAT ATGTTTAATA CGTTTTGGGG ACACTCCAGG 1920GATTCATGAC GGTTGCTTCA TATCCCGACC TGGGGATGGA TTGACCTGGT TGTGCCCAAT 1980TTTCTTCTGC CTAACGTTTT GATTATACAT GCATTTTTCA CGAAACCAGC CGGCCCGCCA 2040TGATCGTGAC CTCAATTTGA GCTCGAATCT TCCTGGGGCC TCCAGCGATA ATTCTTAATG 2100CTCGTTCCGA GGGTGCCACA TCGGACATTC GCTTGTACAA CTTTTGCAGA ACGAACATTT 2160TCACCGATTC CAACTTGAGT CATTCGCTTA CTACTTTCAA CTGGTCGAGA AACTTCGCTT 2220CTTTTCAGCT CGGCTAGGTG CATAAATATT TTACATTCGT GTCGATCGCT CACATTTCAC 2280GGCGCCTGGA AACTTGGGGG TTTCGATTTC ATTGGAAAGG ATAAACAACA TGGGCTGGGC 2340GCCTTTTACA CGCACTACAT TCGCTTAGAA AAGTTCTGAT GCTTTTAATG ATTCTTGCAT 2400TGGCATATAG AAAGGGGTCC TCCAGACTCG CTACTGTGGT CCTCTCTCAA CCCCACACTC 2460GCTTGCTTTT AACAGTGGAC ACCCCGTGGA GCTACGTCTC CATCAAATAT TTGGCATCAA 2520CCGGAATCGA TGCCAGGAGG ACTGAGCTTA CTCACGGTGA CCGTCGGGTA AAAGGCGTTC 2580ATACAGAACA TCTCCTCTAT CCTCCTGTCC CATCTCGATT CTCTGGCTGC TGGACGCAAC 2640ACACCTCGCT GCACGTTTTC GACTTCCTAA TACGACCTAA TATCATTCTC GGTTTTCTTT 2700GCTCTGGCTC GCGGCCGCCA TTTATATGGC GTGTCGGCTC GAGTCTGAAG TGAACTTTTT 2760TCTCCTTTCT GGCCTCCACA ACTTTCCGAT CCCTAGCAGC TTCCCGTGCA CAGCGAGGTG 2820TTGTTGGATG ATTGTTCCAT AGCATTATCA TTATTCCTAA TCCGGTAGCG TTATGATTTA 2880TGAAGAACAG TGATGTACAT TATTATGCGG TGATCAAAAA AAAAAAAAAA AAAAA 2935SEQ ID NO:13序列长度:2856序列类型:氨基酸链型:双链拓扑学:线性分子类型:基因组DNA定义:是序列描述:TAGTATACAA GTTGCCTTCA TAAATCATAA CACTACCGGA TTATAACTAA TAATACTGCT 60GCTATGGATA ATTTGCCCCA ACCACACACA CACACACACT ATCCAAGGGA AACGAAAAGA 120AGAGGATAGT GTCCATGAGC GGAATTTGTG AGGTGAGGAG GATGTGATAG GTAGGTGTGA 180GAGCGTCAGA CCATAGCAAG CAAGTCAAGT CACCGTCCAA CAAGTCGAGA ATCTGAGGTT 240AGTCGAAGCC GGGTCAAATC GGGACGCGTG AACATCCTTC AACAAGCCCC GTCAGCGTCA 300GACTCTCCTC CCAACCTTGC ACGTCCGGCG AATGTCAGAA AGCAACACAG TAGCCATGTG 360TATAGCCCCC GGGTAATATG TGGACGTAAT CCACTTTGAG CGAATGGATA AACCATGCGA 420GCAATCAAGA AGAAGGTCCA TCCTTCCCCT CTTTCTATAT GCTAATGCAG AGTTCGTGAT 480GCATTGCAAA GCAGAAATGT AAAACCGTCT ATGCACAGCG AGTGAAGTGC AAGAAGAAAA 540GGCGCCCCAT TCCGTGATTT TTTCCAATAT AAATGCTTCC AGTCCCAAGC GCCAAGAGTA 600TGAGCGATCG ACACGAATGG TAAAAATAAA TATATAGCAT AGTCGAAACG AATAATAAGG 660ATGGGTTCGA CCAGGTCAAG GTAATAGCGG ACGATAGAAG TGAGAATTGA AGTAGTGTCT 720GGGTGGACAC GAGACAAGCG AGTGTTACCG ACGGGGGTTA TCGGATGGTC TTCCAGGACT 780AAACACCAGG ATGCGTAGCC CCATTGTGTC CATTAACATT ATGATGGAGC AACGGCGTGT 840AGCGATGAGC GATAACCCAT CCCACGTTCG AGCCCAACCC GGTTTCGCAA TGTCAAGCAA 900TGTACAGTGA AGTGCGGCGG AAAGAGAAAC AGTATCCCAG GCGGATTCGG ACCGAGGTAC 960ATTAAGGTCG AACCGATGAT CTGGGACACC GAAGAAAGGG TATTAAAGAT ATATGTGTCG l020AAATGTGCTC GATGCAATAA AGCCAGAATG TCGTGAAATG TTCTAACGCC GTCTCGTAAA 1080TAGATGCAGT GGAGGAGGAG CGAGATCGCT ATATGCAGGT ATCGAGTTTG GTTTGTGGCT 1140ACTCAAGGGC TGAAAGTATG CCTGCCGGAC TCAATATCAG TATGTGGGGA GGTCAGTGCC 1200TCGGTTTCCC ATGAGTAATG ATCGTCAACG GGACTCAAGG AGCCTGAGGA GACGGAGGAT 1260GAAGAACCAA CAGTCCATTC ATCGCTGTCG AGATTGAAGT CTCCATCATA GCCAGCTGCA 1320CCATACCCAT ACTCCAGGGC AGACTCGCCG AATTCCACAT AGTCGTAGTC CCAACGGAAG 1380GTCTTGTCGA GCTGGACACG GGGAAGGAAT CGGGTCTTGG CGAAGTAGAA AGCAATGGCG 1440GCCAGGAGAC CACCCGCAAC CAAATCGACC GCATAGTGAT GTGAGAGGTA CATTGTTGCC 1500CACCACATCC ATAGAGTATA GGTCACGAAG ACGGGCTTCA TGCGGGGGAA AACATGACTC 1560ATGAAAAGTG CGGCCAGGGT TGAGTCGGCA GCATGCAGCG ACGGAAAAGC GCCGAACACA 1620ACAGGCGACT GATGGAAAAC AGACGTGTAA AGGTCGATGC CGAAAAGCTT GTCAATGCGG 1680GCAAGCCCTG CGGGATCACC TTGGATGGAG TAGTCTGCCG GAGCTAGACC ATAGCGATTC 1740TCATACCAAG GTGGAGAGCA AGGGAAAAAC AGCTGAATAG TAACCGCAGT CATACTGATA 1800TAGCCGAAAG TGCGCGCGAA AAGGGGAACA GTGCCGGGCG GACCGAAGAT GAACATGATC 1860AACGAGCACA CAAACGGAGC GCCATAGTGG CAGATACCGT AGGGTAGCCA CGCCAGCACG 1920TCAAGCACAA CGTTCTGGTG AGCGGATAGG ATGTTGCTGA TGTTTGCGCC GTAGAGAATA 1980TTCTCCAGTG CAGGCAAGAC ACGAACCCAA ATCGCAGGGC GCCAATCGCT TGGGATGAAC 2040TGGCAGGCGT AGAAAAACAG AAGCCATCCG GCAATCGGCA GAAACGGGAG GAAGAACTGG 2100CGGGTCATAG GGATCAGGAG AGAGAATAGG AGCATGGAGA AAATGGCCGT TTTGCCCAAA 2160GGCCCGGGCG ACTCGATAAC GGTCAAAGAG AAGATGCCCA CGATCAACAG AAGCAGATAT 2220TGGAAGTCGT AAACCGTCCA TCGGTGGCTT TGGAGCGATC GTAGTGTGTC TGCAGGCGAT 2280AACGACGTCT GTAAAGAGGC TATTGACGAG GTAGGAGACG CTCTACTGCG CAATTTGGAC 2340CTTAACTTCC GCCGCATGCG ATGCGGGACG AGCAGTTGGA TGGACCGCCA TGGAACCTGG 2400ATCTGAAGCT TTCCAAACTG GTTCTGCGTG CGGTCCTTCC ACGTGGGAAG TGTTTGATTC 2460ATGGTTGCGG CGAGTCTTGC GGGCAAGACT CAGCTATAAT TCCTCCAGAT CGAACTCCGT 2520CTGCTTTCTT TCCCCCCGAT TGTACAAGAG TTGGAAGGCG ACGAATAAAT CGGTCGCGGA 2580AGCGGCAGAA AAGGGGTCTT GAATAACAAG CCGTTAGGCA ACGAGCAGGG TGCTGACGGC 2640GTCAACCCGA GCGGGGAAAT TGAGATCGGT TCGAAGAAGA CGAAACGAAG CGCACGCTCC 2700GGTCTCCAGC GGCCAAACGA GGATGTCTTT GAGCCGTCAC GTTGCAGGGG GTTTCACTGA 2760TGCAAGGCGA AGTGCAAGGG CGCAGCAGTC GAGAGGAAAA CCTGGAACGA GGAGGTCGTG 2820AGGGAGGCAG ATGGCCACGG AGCCGGAGTA TAAACC 2856SEQ ID NO:14序列长度:2856序列类型:核酸链型:单链拓扑学:线性分子类型:mRNA定义:是序列描述:UAGUAUACAA GUUGCCUUCA UAAAUCAUAA CACUACCGGA UUAUAACUAA UAAUACUGCU 60GCUAUGGAUA AUUUGCCCCA ACCACACACA CACACACACU AUCCAAGGGA AACGAAAAGA 120AGAGGAUAGU GUCCAUGAGC GGAAUUUGUG AGGUGAGGAG GAUGUGAUAG GUAGGUGUGA 180GAGCGUCAGA CCAUAGCAAG CAAGUCAAGU CACCGUCCAA CAAGUCGAGA AUCUGAGGUU 240AGUCGAAGCC GGGUCAAAUC GGGACGCGUG AACAUCCUUC AACAAGCCCC GUCAGCGUCA 300GACUCUCCUC CCAACCUUGC ACGUCCGGCG AAUGUCAGAA AGCAACACAG UAGCCAUGUG 360UAUAGCCCCC GGGUAAUAUG UGGACGUAAU CCACUUUGAG CGAAUGGAUA AACCAUGCGA 420GCAAUCAAGA AGAAGGUCCA UCCUUCCCCU CUUUCUAUAU GCUAAUGCAG AGUUCGUGAU 480GCAUUGCAAA GCAGAAAUGU AAAACCGUCU AUGCACAGCG AGUGAAGUGC AAGAAGAAAA 540GGCGCCCCAU UCCGUGAUUU UUUCCAAUAU AAAUGCUUCC AGUCCCAAGC GCCAAGAGUA 600UGAGCGAUCG ACACGAAUGG UAAAAAUAAA UAUAUAGCAU AGUCGAAACG AAUAAUAAGG 660AUGGGUUCGA CCAGGUCAAG GUAAUAGCGG ACGAUAGAAG UGAGAAUUGA AGUAGUGUCU 720GGGUGGACAC GAGACAAGCG AGUGUUACCG ACGGGGGUUA UCGGAUGGUC UUCCAGGACU 780AAACACCAGG AUGCGUAGCC CCAUUGUGUC CAUUAACAUU AUGAUGGAGC AACGGCGUGU 840AGCGAUGAGC GAUAACCCAU CCCACGUUCG AGCCCAACCC GGUUUCGCAA UGUCAAGCAA 900UGUACAGUGA AGUGCGGCGG AAAGAGAAAC AGUAUCCCAG GCGGAUUCGG ACCGAGGUAC 960AUUAAGGUCG AACCGAUGAU CUGGGACACC GAAGAAAGGG UAUUAAAGAU AUAUGUGUCG 1020AAAUGUGCUC GAUGCAAUAA AGCCAGAAUG UCGUGAAAUG UUCUAACGCC GUCUCGUAAA 1080UAGAUGCAGU GGAGGAGGAG CGAGAUCGCU AUAUGCAGGU AUCGAGUUUG GUUUGUGGCU 1140ACUCAAGGGC UGAAAGUAUG CCUGCCGGAC UCAAUAUCAG UAUGUGGGGA GGUCAGUGCC 1200UCGGUUUCCC AUGAGUAAUG AUCGUCAACG GGACUCAAGG AGCCUGAGGA GACGGAGGAU 1260GAAGAACCAA CAGUCCAUUC AUCGCUGUCG AGAUUGAAGU CUCCAUCAUA GCCAGCUGCA 1320CCAUACCCAU ACUCCAGGGC AGACUCGCCG AAUUCCACAU AGUCGUAGUC CCAACGGAAG 1380GUCUUGUCGA GCUGGACACG GGGAAGGAAU CGGGUCUUGG CGAAGUAGAA AGCAAUGGCG 1440GCCAGGAGAC CACCCGCAAC CAAAUCGACC GCAUAGUGAU GUGAGAGGUA CAUUGUUGCC 1500CACCACAUCC AUAGAGUAUA GGUCACGAAG ACGGGCUUCA UGCGGGGGAA AACAUGACUC 1560AUGAAAAGUG CGGCCAGGGU UGAGUCGGCA GCAUGCAGCG ACGGAAAAGC GCCGAACACA 1620ACAGGCGACU GAUGGAAAAC AGACGUGUAA AGGUCGAUGC CGAAAAGCUU GUCAAUGCGG 1680GCAAGCCCUG CGGGAUCACC UUGGAUGGAG UAGUCUGCCG GAGCUAGACC AUAGCGAUUC 1740UCAUACCAAG GUGGAGAGCA AGGGAAAAAC AGCUGAAUAG UAACCGCAGU CAUACUGAUA 1800UAGCCGAAAG UGCGCGCGAA AAGGGGAACA GUGCCGGGCG GACCGAAGAU GAACAUGAUC 1860AACGAGCACA CAAACGGAGC GCCAUAGUGG CAGAUACCGU AGGGUAGCCA CGCCAGCACG 1920UCAAGCACAA CGUUCUGGUG AGCGGAUAGG AUGUUGCUGA UGUUUGCGCC GUAGAGAAUA 1980UUCUCCAGUG CAGGCAAGAC ACGAACCCAA AUCGCAGGGC GCCAAUCGCU UGGGAUGAAC 2040UGGCAGGCGU AGAAAAACAG AAGCCAUCCG GCAAUCGGCA GAAACGGGAG GAAGAACUGG 2100CGGGUCAUAG GGAUCAGGAG AGAGAAUAGG AGCAUGGAGA AAAUGGCCGU UUUGCCCAAA 2160GGCCCGGGCG ACUCGAUAAC GGUCAAAGAG AAGAUGCCCA CGAUCAACAG AAGCAGAUAU 2220UGGAAGUCGU AAACCGUCCA UCGGUGGCUU UGGAGCGAUC GUAGUGUGUC UGCAGGCGAU 2280AACGACGUCU GUAAAGAGGC UAUUGACGAG GUAGGAGACG CUCUACUGCG CAAUUUGGAC 2340CUUAACUUCC GCCGCAUGCG AUGCGGGACG AGCAGUUGGA UGGACCGCCA UGGAACCUGG 2400AUCUGAAGCU UUCCAAACUG GUUCUGCGUG CGGUCCUUCC ACGUGGGAAG UGUUUGAUUC 2460AUGGUUGCGG CGAGUCUUGC GGGCAAGACU CAGCUAUAAU UCCUCCAGAU CGAACUCCGU 2520CUGCUUUCUU UCCCCCCGAU UGUACAAGAG UUGGAAGGCG ACGAAUAAAU CGGUCGCGGA 2580AGCGGCAGAA AAGGGGUCUU GAAUAACAAG CCGUUAGGCA ACGAGCAGGG UGCUGACGGC 2640GUCAACCCGA GCGGGGAAAU UGAGAUCGGU UCGAAGAAGA CGAAACGAAG CGCACGCUCC 2700GGUCUCCAGC GGCCAAACGA GGAUGUCUUU GAGCCGUCAC GUUGCAGGGG GUUUCACUGA 2760UGCAAGGCGA AGUGCAAGGG CGCAGCAGUC GAGAGGAAAA CCUGGAACGA GGAGGUCGUG 2820AGGGAGGCAG AUGGCCACGG AGCCGGAGUA UAAACC 2856