CN101597608A - 与人g蛋白偶联的孤儿受体 - Google Patents

与人g蛋白偶联的孤儿受体 Download PDF

Info

Publication number
CN101597608A
CN101597608A CNA2009101335181A CN200910133518A CN101597608A CN 101597608 A CN101597608 A CN 101597608A CN A2009101335181 A CNA2009101335181 A CN A2009101335181A CN 200910133518 A CN200910133518 A CN 200910133518A CN 101597608 A CN101597608 A CN 101597608A
Authority
CN
China
Prior art keywords
leu
ala
val
ser
phe
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2009101335181A
Other languages
English (en)
Inventor
陈若平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Arena Pharmaceuticals Inc
Original Assignee
Arena Pharmaceuticals Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Arena Pharmaceuticals Inc filed Critical Arena Pharmaceuticals Inc
Publication of CN101597608A publication Critical patent/CN101597608A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Peptides Or Proteins (AREA)

Abstract

本申请是“与人G蛋白偶联的孤儿受体”。本专利申请文件所公开的发明涉及跨膜受体;具体地讲,涉及与人内源G蛋白偶联的孤儿受体。本发明公开了编码人G蛋白偶联受体的cDNA,及其表达质粒和细胞。

Description

与人G蛋白偶联的孤儿受体
本申请为国际申请日1999年10月13日、国际申请号PCT/US99/23687于2001年4月27日进入中国国家阶段、申请号99812713.2、发明名称“与人G蛋白偶联的孤儿受体”的分案申请。
本专利申请要求下列以美国快件方式在所标日期提交给美国专利商标局的各申请的优先权:1999年2月26日提交的并要求1998年11月20日提交的美国临时申请60/109,213的优先权的美国临时申请60/121,852;1999年2月16日提交的美国临时申请60/120,416;1999年3月12日提交的美国临时申请60/123,946;1999年3月12日提交的美国临时申请60/123,949;1999年5月28日提交的美国临时申请60/136,436;1999年5月28日提交的美国临时申请60/136,439;1999年5月28日提交的美国临时申请60/136,567;1999年5月28日提交的美国临时申请60/137,127;1999年5月28日提交的美国临时申请60/137,131;1999年6月29日提交并要求1999年5月28日提交的美国临时申请60/136,437的优先权的美国临时申请141,448;1999年9月29日提交的美国临时申请No.---(阿瑞那制药公司(Arena Pharmaceuticals,Inc.)的卷宗号为CHN10-1);1999年9月29日提交的美国临时申请60/156,333;1999年9月29日提交的美国临时申请60/156,555;1999年9月29日提交的美国临时申请60/156,634;1999年10月1日提交的美国临时申请No.---(阿瑞那制药公司卷号:RUP6-1);1999年10月1日提交的美国临时申请No.---(阿瑞那制药公司卷号:RUP7-1);1999年10月1日提交的美国临时申请No.---(阿瑞那制药公司卷号:CHN6-1);1999年10月1日提交的美国临时申请No.---(阿瑞那制药公司卷号:RUP5-1)和1999年10月1日提交的美国临时申请(阿瑞那制药公司卷号:CHN9-1)。本申请还涉及1998年10月13日提交的美国专利申请No.09/170496和1999年10月12日提交的美国专利申请No.---(Woodcock,Washburn,Kurtz,Mackiewicz & Norris,LLP公司的卷号AREN-0054)(通过美国快件寄交);两者均引入本文做参考。本申请还涉及1999年7月30日提交的美国专利申请No.09/364,425,将该申请全文引入本文做参考。本申请还要求1999年10月12日提交的美国专利申请No.---(Woodcock,Washburn,Kurtz,Mackiewicz & Norris,LLP公司的卷号AREN-0050)(通过美国快件寄交)的优先权,并将其全文引入本文做参考。前面的每个申请均全文引入本申请做参考。
发明领域
本专利申请文件中所公开的发明涉及跨膜受体,进一步地讲,涉及与人G蛋白偶联的内源孤儿受体(GPCR)。
发明背景
尽管在人体内有很多种类的受体,但到目前为止最丰富和最与治疗有关的是G蛋白偶联受体(GPCR)。据估计,在人类基因组内有大约100,000个基因,它们中的大约2%即2,000个基因被估计用来编码GPCR。包括GPCR在内,其内源配体已被认识的受体被称为“已知”受体,内源配体尚不知晓的受体被称为“孤儿”受体。GPCR代表着药物产品开发的一个重要领域:60%的处方药物开发自100个已知GPCR中的大约20个。这种区别并不仅是语义上的,尤其是对GPCR来说。因此,孤儿GPCR对于制药工业来说就象金子对于19世纪晚期的加利福尼亚州一样,是一个驱动成长、扩张、提高和发展的机会。
GPCR都具有一个相同的基元(motif)。所有这些受体具有七个由22到24个疏水氨基酸组成的序列,它们组成七个α螺旋,每个α螺旋都跨过膜(每个跨度都以数字表示,例如,跨膜-1(TM-1)、跨膜-2(TM-2)等)。跨膜螺旋通过氨基酸链连接,在细胞膜的外部即“细胞外”一边的氨基酸链分别在跨膜-2和跨膜-3、跨膜-4和跨膜-5、跨膜-6和跨膜-7之间(这些分别被称为“细胞外”区1、2和3(EC-1、EC-2和EC-3))。在细胞膜内部即“细胞内”一边,跨膜螺旋也通过氨基酸链进行连接,这些氨基酸链分别在跨膜-1和跨膜-2、跨膜-3和跨膜-4、跨膜-5和跨膜-6之间(这些分别被称为“细胞内”区1、2和3(IC-1、IC-2和IC-3))。受体的“羧基”(“C”)端是在细胞内的区域,受体的“氨基”(“N”)端在细胞外的区域。
一般来说,当内源配体与受体结合时(经常被称为受体的“活化”),细胞内区域的构象发生变化,以容许细胞内区域和细胞内“G-蛋白”进行偶联。据报道,GPCR对于G蛋白而言是“混杂的”,也就是说,可与不只一个G蛋白相互作用。参见,Kenakin,T.,43,生活科学(LifeSciences)1095(1988)。尽管存在其他G蛋白,但当前已被识别的G蛋白是Gq、Gs、Gi和Go。内源配体活化的GPCR与G-蛋白的偶联引发一个信号级联过程(被称为“信号传导”)。在通常情形下,信号传导最终导致细胞活化或细胞抑制。据认为,受体的IC-3环与羧基端都和G蛋白相互作用。
在生理条件下,GPCR存在于细胞膜上,并在“非活化”状态和“活化”状态这两种不同构象之间保持平衡。在非活性状态下的受体不能与细胞内信号传导途径相偶联以产生生物学反应。受体构象向活性状态的转变就使它与传导途径相偶联(通过G-蛋白)并产生生物学反应。可通过内源配体或化合物如药物将受体稳定在其活性状态。
发明概述
这里公开的是人与G蛋白偶联的内源孤儿受体。
附图的简要描述
图1A和1B提供的是本文提供的某些斑点印迹的参照“格栅”(分别参见图2A和2B)。
图2A和2B再现的是从hCHN3和hCHN8得到的某些斑点印迹分析的结果(分别参见图1A和1B)。
图3再现的是hRUP3的RT-PCR分析结果。
图4再现的是hRUP4的RT-PCR分析结果。
图5再现的是hRUP6的RT-PCR分析结果。
详细描述
本科学文献涉及受体并采用一些术语来描述对受体具有不同作用的配体。为了清楚和前后一致,在本发明文献中将由始至终使用下列定义。在这些定义与这些词语的其他定义冲突时,选择下列定义:
在此应用的氨基酸缩写列于下表:
  丙氨酸   ALA   A
  精氨酸   ARG   R
  天冬酰胺   ASN   N
  天冬氨酸   ASP   D
  半胱氨酸   CYS   C
  谷氨酸   GLU   E
  谷氨酰胺   GLN   Q
  甘氨酸   GLY   G
  组氨酸   HIS   H
  异亮氨酸   ILE   I
  亮氨酸   LEU   L
  赖氨酸   LYS   K
  蛋氨酸   MET   M
  苯丙氨酸   PHE   F
  脯氨酸   PRO   P
  丝氨酸   SER   S
  苏氨酸   THR   T
  色氨酸   TRP   W
  酪氨酸   TYR   Y
  缬氨酸   VAL   V
组合物  是指至少包含一种成分的物质。
内源  意味着由物种的基因组天然产生的物质。关于内源的受体,意味着由哺乳动物(例如但不限于人)或病毒天然产生的物质,这些只作为例证但却不是限制。与之相对比,术语“非内源”在本文中意味着不是由哺乳动物(例如但不限于人)或病毒天然产生的。
宿主细胞  意味着能在其中插入质粒和/或载体的细胞。在原核宿主细胞情形下,当宿主细胞复制时质粒典型地以自主分子方式复制(在一般情况下,质粒在复制后被分离出来以被引入真核宿主细胞中);在真核宿主细胞情形下,质粒被整合进宿主细胞的细胞DNA中,因而,当真核细胞复制时,质粒复制。为在此公开的本发明的目的,宿主细胞优选是真核细胞,更优选是哺乳动物细胞,最优选地是从293、293T和COS-7细胞中选择出来的细胞。
配体  意味着对内源的天然产生的受体特异的内源的天然产生的分子。
非孤儿受体  是指天然存在的内源分子,对天然存在的内源配体表现出特异性,配体与受体的结合使胞内信号途经得以活化。
孤儿受体  意味着这样的内源受体,其特异的内源配体尚未被识别或尚未知。
质粒  意味着载体和cDNA的结合体。一般,为cDNA复制和/或表达蛋白质的目的将质粒引进宿主细胞。
针对cDNA的载体  意味着能够将至少一个cDNA掺入其中且能导入到宿主细胞中的环形DNA。
下面部分的顺序安排是为了表达效果,而不能被解释为对下面的公开或权利要求的限制。
人GPCR的确认
人类基因组计划的实施导致位于人类基因组内有关核酸序列的大量信息的识别,经过这种努力,事实上,我们无需了解或认识任何特定的基因组序列是否包含翻译人类蛋白的可读框信息,即可获得遗传序列信息,几种识别人类基因组中核酸序列的方法都是本领域普通技术人员所熟悉的,比如(但不限定),此处公开的大量人类GPCR,即是通过回顾GenBankTM数据库而发现的,并通过应用先前已测序的GPCR核酸序列,检索BLASTTM的EST数据库,发现了其他的GPCR。下面的表A,列出了几个与GPCR各自的同源受体一道被我们发现的内源GPCR。
表A
公开的人类    入藏登记    可读框    与指明的GPCR          参考同源
孤儿GPCR                  (碱基对)  同源性比率            GPCR(编号)
hARE-3        AL033379    1,260bp   52.3%LPA-R           U92642
hARE-4        AC006087    1,119bp   36%P2Y5              AF000546
hARE-5        AC006255    1,104bp   32%Oryzias latipes   D43633
hGPR27        AA775870    1,128bp
hARE-1        AI090920    999bp     43%                  D13626
                                    KIAA001
hARE-2        AA359504    1,122bp   53%GPR27
hPPR1         H67224      1,053bp   39%EBI1              L31581
hG2A          AA754702    1,113bp   31%GPR4              L36148
hRUP3    AL035423    1,005bp    30%果蝇        2133653
hRUP4    AI307658    1,296bp    32%pNPGPR      NP_004876
                                28%斑马鱼Ya    AAC41276和
                                29%斑马鱼Yb,  AAB94616
hRUP5    AC005849    1,413bp    25%DEZ         Q99788
                                23%FMLPR       P21462
hRUP6    AC005871    1,245bp    48%GPR66       NP_006047
hRUP7    AC007922    1,173bp    43%H3R         AF140538
hCHN3    EST36581    1,113bp    53%GPR27
hCHN4    AA804531    1,077bp    32%凝血酶      4503637
hCHN6    EST2134670  1,503bp    36%edg-1       NP_001391
hCHN8    EST764455   1,029bp    47%            D13626
                                KIAA0001
hCHN9    EST1541536  1,077bp    41%LTB4R       NM_000752
hCHN10   EST1365839  1,055bp    35%P2Y         NM_002563
受体同源性对于进一步了解受体在人体中的作用是有用的。另外,这种同源性可以用来洞察可能是本文公开的孤儿GPCR的天然激活剂的可能的内源配体。
B.受体筛选
因为受体的传统研究一直是基于这样的前置假定(基于历史),即内源配体必须首先被识别,然后才能发现可以作用于受体的拮抗剂和其他分子,所以,在过去的几年中,用于进行内源配体识别(该识别主要是为了提供进行受体结合测定(该测定需要受体的内源配体)的各种方法)的技术越来越容易找到。甚至在拮抗剂被首先发现的情况下,搜索的目光也立即延伸到查找内源配体上去。即使在发现组成型活化受体之后,这种思维模式也一直在受体研究中持续。在此之前没有被认识到的是,是受体的活性状态对发现受体的激活剂、部分激活剂和反激活剂是最有用的。对于那些因为受体的过度活化和不够活化而导致的疾病来说,希望得到的治疗药物是能分别用来减少受体的活性状态或增强受体活性的化合物,而并不需要是对抗内源配体的拮抗剂。这是因为,一个降低或增强活化态受体活性的化合物并不需要结合在和内源配体一样的位点上。因而,正如本发明的一个方法所说的那样,对治疗性化合物的任何搜索可通过筛选针对配体非依赖性活性态的化合物而开始。
如在本领域已知的情形,GPCR即使是在没有该受体的内源配体与之结合的情况下,在其内源状态GPCR也可能是“活化的”。这种天然活化的受体可被直接识别(即,不需要受体的内源配体存在)、特别是反激活剂的直接识别所筛选。另外,该受体也可通过例如受体的突变以建立该受体的非内源形式来进行活化,所述非内源形式在没有受体的内源配体存在下也处于活性状态。
对应于此处公开的人孤儿GPCR的内源或非内源组成型活化形式的候选化合物进行筛选,可直接识别在细胞表面受体上起作用的候选化合物,而不需要使用受体的内源配体。通过确定此处公开的人GPCR的内源形式在体内表达或过表达的区域,有可能确定与受体表达或过表达关联的相关疾病/紊乱,这种方法在本专利申请文件中得以公开。
制造可以证明此处公开的人孤儿GPCR组成型活化的突变的技术,是基于与脯氨酸残基的距离,据估计此残基位于GPCR的TM6内部,通常在TM6/IC3交界处附近(该脯氨酸残基看起来非常保守)。通过使距该残基16个氨基酸残基处的氨基酸残基(估计位于受体的IC3区)发生突变,最好是突变为赖氨酸,可以获得这种活化。其他氨基酸在此位置上的突变可用来达到此目的。
C.疾病/紊乱识别和/或选择
优选人孤儿GPCR的DNA序列被用来制作探针,用于进行(a)针对组织mRNA的斑点印迹和(b)组织样品中所述受体表达的RT-PCR识别。在组织或疾病组织中受体的存在,或者与正常组织相比在疾病组织中受体的浓度提高,可被优选地用来识别治疗方法(包括但不限于)与那种疾病的关联。用这种方法也可很好地把受体定位于器官的区域。基于受体被定位于其中的特定组织的已知功能,受体假想的功能性角色可被推导出来。
D.候选化合物的筛选
1.一般GPCR的筛选测定技术
当一种G蛋白受体变为组成型活化(即,在没有内源配体与之结合的情况下活化)时,它与G蛋白(例如,Gq、Gs、Gi、Go)偶联并刺激GTP与G蛋白结合。接着,借助受体在正常情况下失活,G蛋白作为GTP酶慢慢地把GTP水解为GDP,然而,组成型活化的受体继续把GDP转化为GTP。GTP非可水解的类似物[35S]GTPγS,可被用来监测与表达组成型活化受体的膜的结合。据报道,[35S]GTPγS可被用来监测在配体存在或不存在的情形下G蛋白与膜的偶联。在本领域中著名和可行的其他例证中有此种监测的一个例证,它由Traynor和Nahorski在1995年所报道。本测定系统的一个优选的应用是为了初步筛选候选化合物,因为本系统对所有G蛋白-偶联受体一般可行,而不考虑与受体的细胞内结构域相互作用的那一种特别的G蛋白。
2.特定的GPCR筛选测定技术
一旦应用“一般”G蛋白偶联的受体测定方法(即筛选是激活剂、部分激活剂或反激活剂的化合物的方法)识别出候选化合物,优选进一步筛选以确认作用在受体位点的化合物。例如,应用“一般”测定方法识别的化合物可以不与受体结合,但也可以仅仅从细胞内结构域与G蛋白“解偶联”。
a.Gs和Gi
Gs刺激腺苷酸环化酶。另一方面,Gi(和Go)抑制该酶。腺苷酸环化酶催化ATP向cAMP的转化;因此,与Gs蛋白偶联的组成型活化的GPCR与升高的细胞内cAMP水平相关联。在另一方面,与Gi(或Go)蛋白偶联的组成型活化的GPCR与降低的细胞内cAMP水平相关联。一般情况参见“突触传导的非直接机制(Indirect Mechanisms ofSynaptic Transmission)”,第8章,从神经到大脑(From Neuron To Brain)(第三版),Nichols,J.G.等编,Sinauer Associates,Inc.(1992)。因此,检测cAMP的方法可被用来确定一个竞争性的化合物是否是受体的反激活剂(即这样的一个化合物将能降低cAMP的水平)等。本领域已知的测定cAMP的不同方法可以被利用;最优选的方法依赖于在基于ELISA的方法中应用抗-cAMP的抗体。可被应用的另一类测定方法是一种全细胞第二信使报告基因系统测定法。基因上的启动子驱动由一个特别的基因所编码的蛋白质的表达。环AMP通过以下步骤促进基因的表达,即它响应促进cAMP的DNA结合蛋白或转录因子(CREB)的结合,转录因子接着在被称为cAMP效应元件的特别位点与启动子结合并驱动基因表达。报告基因系统可被构建为具有一个启动子,该启动子在报告基因的前面含有多个cAMP效应元件,例如β-半乳糖苷酶或荧光素酶。因而,一个被组成型活化的连接Gs的受体引起cAMP的积累,cAMP接着激活报告蛋白质的基因和表达。β-半乳糖苷酶或荧光素酶等报告蛋白质可用标准生化方法检测到(Chen等,1995)。
b.Go和Gq
Go和Gq与磷脂酶C的活化相联系,磷脂酶随后水解磷酸酯PIP2,并释放两种细胞内信使:二酰甘油(DAG)和肌醇-1,4,5-三磷酸(IP3)。积累增加的IP3与Gq-和Go-关联的受体相关联。一般情况参见“突触传导的非直接机制(Indirect Mechanisms of Synaptic Transmission)”,第8章,从神经到大脑(From Neuron To Brain)(第三版),Nichols,J.G.等编,Sinauer Associates,Inc.(1992)。测定IP3积累的方法可被用来确定一个候选化合物是否是例如针对Gq-或Go-关联受体等的反激活剂(即如此的化合物能降低IP3的水平)。Gq关联受体也可用AP1报告基因测定方法来检测,因为Gq依赖的磷脂酶C引起含有AP1元件的基因活化;因而,活化的Gq关联受体将导致如此基因的表达增高,而其反激活剂将导致如此表达的降低,激活剂将导致如此表达的升高。进行如此测定的商业可得的方法是可得的。
3.GPCR融合蛋白
内源组成型活化的孤儿GPCR或非内源组成型活化的孤儿GPCR,用于筛选候选化合物,直接识别反激活剂、激活剂和部分激活剂,提出了一个独特的筛选难题,确切地说,在没有内源配体结合的情况下,受体仍有活性。因此,使用能加强由该活化的受体获得的信号的方法是经常有用的。优选的办法就是使用GPCR融合蛋白。
一般来讲,应用上述分析技术(还有其它的技术)一旦确定GPCR是或已被组成型活化的,就可能确定与内源GPCR偶联的优势G蛋白,G蛋白与GPCR的偶联提供了可被估计的信号途径。因为最好是使用哺乳动物表达系统进行筛选,就希望在这个系统中有内源G蛋白存在,确切来说,该组成型活化的孤儿GPCR在这个系统中持续产生信号。从这点上,优选使信号得到加强,从而在(例如)受体的反激活剂存在时,很可能更方便地区分与反激活剂接触的不同受体,特别是在筛选的整个过程中。
GPCR融合蛋白的作用是增加G蛋白与非内源GPCR偶联的效应,GPCR融合蛋白优选用于筛选非内源组成型活化的GPCR,因为这种方法增强对这样的筛选技术非常有用的信号,虽然该GPCR融合蛋白也可(而且优选)与内源组成型活化的GPCR一起使用。重要的是有助于产生很大的“信噪”比,这种大信噪比对筛选此处公开的候选化合物是特别优选的。
用于GPCR融合蛋白表达的构建体的构建技术是本领域普通技术人员所熟悉,商业可获得的表达载体和系统为实验者提供了各种可以满足特殊需要的方法,这种GPCR融合蛋白构建体重要的衡量标准,就是内源GPCR序列与G蛋白序列都符合读框(最好是,内源GPCR的序列位于G蛋白序列上游),以及必须去除或替代GPCR的“终止”密码子,从而随着GPCR的表达,G蛋白也能表达。GPCR可以直接连到G蛋白上,或在两者之间存在间隔残基(最好不超过12个,虽然本领域的普通技术人员可以很方便得知这一数字)。我们喜欢使用间隔子(其于方便),表达中不被有效利用的限制位点组成了间隔子。在制造GPCR融合蛋白构建体之前,优选首先确认与GPCR偶联的G蛋白,因为只有很少的G蛋白已被识别,所以优选包含G蛋白序列(如通用G蛋白构建体)的构建体可在其中插入内源GPCR序列,这样可有效地大规模筛选大量具有不同序列的内源GPCR。
E.其他应用
尽管本文公开的人孤儿GPCR的一个优选的应用是为了直接识别作为反激活剂、激活剂或部分激活剂(优选地作为药物使用)的候选化合物,人GPCR的这些形式也可被用于研究之用。例如,带有GPCR的体外或体内系统可被用来阐释和理解这些受体在正常和患病的人体状况中的作用,也可理解当它应用于理解信号级联反应时组成型活化的角色。这些人孤儿GPCR的价值在于它们作为研究工具的用途被强化了,即使在其内源配体被识别之前,由于其能够确定这些受体在人体内的位置,该GPCR可被用来理解这些受体在人体中的作用。此处所公开的受体的其他应用对于本领域的技术人员将是明显的,特别是当他们阅读了本申请文件之后。
实施例
下面提供的实施例,目的是要阐明而不是限制本发明。特异的核酸序列和氨基酸序列在此公开时,本领域的普通技术人员能够对这些序列进行较小的修饰,并且得到与下面报告的相同或基本相似的结果。除非下文另外指明,对于所公开的人内源孤儿GPCR的所有核酸序列均进行了测序并得到了证实。对于受体的等同物,本领域的普通技术人员可以容易地想到的是可对所公开序列进行保守取代以获得功能上等同的受体。
实施例1
内源人GPCR
1.人GPCR的识别
在浏览GenBank数据库信息的基础上,识别了一些已公开的内源人GPCR。在检索数据库的同时,下列cDNA克隆也得以识别,列表如下。
  已公开的人孤儿GPCR   入藏登记号   DNA全序列(碱基对)   可读框(碱基对)   核酸序列SEQ.ID.NO.   氨基酸序列SEQ.ID.NO.
  hARE-3   AL033379   111,389bp   1,260bp   1   2
  hARE-4   AC006087   226,925bp   1,119bp   3   4
  hARE-5   AC006255   127,605bp   1,104bp   5   6
  HRUP3   AL035423   140,094bp   1,005bp   7   8
  HRUP5   AC005849   169,144bp   1,413bp   9   10
  hRUP6   AC005871   218,807bp   1,245bp   11   12
  hRUP7   AC007922   158,858bp   1,173bp   13   14
用下列EST克隆作为询问序列,对EST数据库(dbest)进行BLASTTM检索,识别出其他已公开的人内源GPCR。然后将下列已确认的EST克隆用作探针筛选人的基因组文库。
已公开的人    询问    EST克隆/    可读框    核酸序列    氨基酸序列
孤儿GPCR      (序列)  入藏登记号  (碱基对)  SEQ.ID.NO   SEQ.ID.NO
hGPCR27       鼠      AA775870    1,125bp   15          16
              GPCR27
hARE-1    TDAG      1689643       999bp      17    18
                    AI090920
hARE-2    GPCR27    68530         1,122bp    19    20
                    AA359504
hPPR1     牛        238667        1,053bp    21    22
          PPR1      H67224
hG2A      鼠        参见实施例    1,113bp    23    24
          1179426   2(a)
hCHN3     N.A.      EST 36581     1,113bp    25    26
                    (全长)
hCHN4     TDAG      1184934       1,077bp    27    28
                    AA804531
hCHN6     N.A.      EST2134670    1,503bp    29    30
                    (全长)
hCHN8     KIAA0001  EST 764455    1,029bp    31    32
hCHN9     1365839   EST 1541536   1,077bp    33    34
hCHN10    鼠EST     人1365839     1,005bp    35    36
          1365839
hRUP4     N.A.      AI 307658     1,296bp    37    38
N.A.=“不适用”
2全长克隆
a.hG2A(Seq.Id.No.23 & 24)
利用鼠EST克隆1179426获取包含几乎所有三氨基酸hG2A编码序列的人基因组克隆,该编码序列通过5′RACETM获得,PCR模板为Clontech’s Human Spleen Marathon-ReadyTM cDNA。已被公开的人G2A用PCR扩增,第一和第二轮PCR使用G2A cDNA特异引物,其为SEQ.ID.NO.:39和SEQ.ID.NO.:40如下:
5′-CTGTGTACAGCAGTTCGCAGAGTG-3′(SEQ.ID.NO.:39,第一轮PCR)
5′-GAGTGCCAGGCAGAGCAGGTAGAC-3′(SEQ.ID.NO.:40,第二轮PCR)
用AdvantageTM GC Polymerase试剂盒进行PCR(Clontech:按商家说明进行操作),94℃30秒;94℃5秒,72℃4分钟,5个循环;94℃5秒,70℃4分钟,30个循环。将大约1.3kb PCR片段从琼脂糖凝胶中纯化出来,经Hind III和XbaI酶切,克隆到表达载体pRC/CMV2(Invitrogen)中。被克隆的插入片段用T7SequenaseTM试剂盒(USB Amersham;按商家说明进行操作)进行测序,并将所得序列与已存在的序列进行比较。人G2A的表达通过用P32标记片段与RNA点印迹杂交进行测定(clontech;按商家说明进行操作)。
b.hCHN9(Seq.Id.No.33 & 34)
EST克隆1541536的测序表明,hCHN9为cDNA克隆的一部分,只有起始密码子,即,没有终止密码子。用hCHN9检索数据库进行比较发现,hCHN9的3′端序列与白细胞三烯B4受体cDNA 5′端非翻译区100%同源,该cDNA带有一个与hCHN9编码序列符合读框的终止密码子。为了确定LTB4R cDNA5′端非翻译区是否是hCHN9的3′端序列,进行了PCR扩增,所用引物是以在hCHN9中发现的起始密码子的5′端侧翼序列和在LTB4R 5′端非翻译区中发现的终止密码子的3′端侧翼序列为基础。所用的5′端引物序列如下:
5′-CCCGAATTCCTGCTTGCTCCCAGCTTGGCCC-3′(SEQ.ID.NO.:41,有义)
5′-TGTGGATCCTGCTGTCAAAGGTCCCATTCCGG-3′(SEQ.ID.NO.:42,反义)
以胸腺cDNA为模板,并用商家提供的缓冲液系统及rTth聚合酶(PerkinElmer)进行PCR,每种引物0.25μM,4种核苷酸每种0.2mM。循环条件为94℃1分钟,65℃1分钟,72℃1分10秒,30个循环,由PCR获得了与预计大小一致的1.1kb片段,将该PCR片段亚克隆到pCMV中(参见下文)并测序(参见SEQ.ID.NO.:33)。
c.hRUP4(Seq.Id.No.37 & 38)
以人脑cDNA(clontech)为模板,经RT-PCR克隆了全长hRUP4。
5′-TCACAATGCTAGGTGTGGTC-3′(SEQ.ID.NO.:43,有义)
5′-TGCATAGACAATGGGATTACAG-3′(SEQ.ID.NO.:44,反义)
使用Taqplas PrecisionTM聚合酶(Stratagene:按商家说明)进行PCR,经以下循环:94℃2分钟;94℃30秒;55℃30秒;72℃45秒;72℃10分钟。循环2到循环4重复30次。
PCR产物在1%琼脂糖凝胶上分离,提取500bp PCR片段,并克隆到pCRII-TOPO载体(Invitrogen)中,用T7SequeraseTM试剂盒(Amsham)和SP6/T7引物(Stratagene)进行测序。序列分析表明,该PCR片段确实是AI307658的另一种剪接形式,带有一个与其他GPCR相似的连续的可读框,该PCR片段的全序列如下:
5’-TCACAATGCTAGGTGTGGTCTGGCTGGTGGCAGTCATCGTAGGATCACCCATGTGGCACGTGCAACAACTTGAGATCAAATATGACTTCCTATATGAAAAGGAACACATCTGCTGCTTAGAAGAGTGGACCAGCCCTGTGCACCAGAAGATCTACACCACCTTCATCCTTGTCATCCTCTTCCTCCTGCCTCTTATGGTGATGCTTATTCTGTACGTAAAATTGGTTATGAACTTTGGATAAAGAAAAGAGTTGGGGATGGTTCAGTGCTTCGAACTATTCATGGAAAAGAAATGTCCAAAATAGCCAGGAAGAAGAAACGAGCTGTCATTATGATGGTGACAGTGGTGGCTCTCTTTGCTGTGTGCTGGGCACCATTCCATGTTGTCCATATGATGATTGAATACAGTAATTTTGAAAAGGAATATGATGATGTCACAATCAAGATGATTTTTGCTATCGTGCAAATTATTGGATTTTCCAACTCCATCTGTAATCCCATTGTCTATGCA-3’(SEQ.ID.NO.:45)
以上面的序列为基础,制备两个有义寡核苷酸引物:
5′-CTGCTTAGAAGAGTGGACCAG-3′(SEQ.ID.NO.:46,寡聚核苷酸引物1)
5′-CTGTGCACCAGAAGATCTACAC-3′(SEQ.ID.NO.:47,寡聚核苷酸引物2)
两个反义寡核苷酸引物:
5′-CAAGGATGAAGGTGGTGTAGA-3′(SEQ.ID.NO.:48,寡聚核苷酸引物3)
5′-GTGTAGATCTTCTGGTGCACAGG-3′(SEQ.ID.NO.:49,寡聚核苷酸引物4)
用于3′端和5′端RACE PCR,以人脑Marathon-ReadyTM cDNA(clontech,Cat#7400-1)为模板,按商家说明进行。经RACE PCR产生的DNA片段克隆到pCRII-TOPOTM载体(Invitrogen)中,用SP6/T7引物(Stratagene)和一些中间引物测序,3′端RACE产物带有一个poly(A)尾巴和一个结束于TAA终止密码子的完整的可读框,5′端RACE产物包含不完整的5′端,即,起始密码子ATG没有出现。
基于新的5′端序列,寡聚核苷酸引物3和下列引物:
5′-GCAATGCAGGTCATAGTGAGC-3′(SEQ.ID.NO.:50,寡聚核苷酸引物5)
用于第二轮的5′端RACE PCR,对PCR产物象上面一样进行分析。第三轮的5′端RACE PCR用反义引物进行:
5′-TGGAGC ATGGTGAC GGGAATGCAGAAG-3′(SEQ.ID.NO.:51,寡聚核苷酸引物6)
5′-GTGATGAGCAGGTCACTGAGCGCCAAG-3′(SEQ.ID.NO.:52,寡聚核苷酸引物7)
5′端RACE PCR产物序列显示存在起始密码子ATG,再下一轮的5′RACE PCR没有产生更多的5′序列,通过利用有义引物
5′-GCAATGCAGGCGCTTAACATTAC-3′(SEQ.ID.NO.:53,寡聚核苷酸引物8)和寡聚核苷酸引物4为引物进行的RT-PCR,以及由人脑和心cDNA模板(Clontech、Cat#7404-1)产生的650bp PCR产物的序列分析,证实了上述完整的5′端序列。通过利用寡聚核苷酸引物2和下列反义引物的RT-PCR:
5′-TTGGGTTACAATCTGAAGGGCA3′(SEQ.ID.NO.:54,寡聚核苷酸引物9)
以及由人脑和心cDNA模板(Clontech,Cat#7404-1)产生的670bp PCR产物的序列分析,证实了上述完整的3′端序列。
d.hRUP5(Seq.Id.No.9 & 10)
以人的外周白细胞cDNA(Clontech)为模板,通过RT-PCR克隆了全长的hRUP5,所用引物为在ATG起始密码子上游的有义引物(SEQ.ID.NO.:55),以及包含TCA为终止密码子的反义引物(SEQ.ID.NO.:56),其序列如下:
5′-ACTCCGTGTCCAGCAGGACTCTG-3′(SEQ.ID.NO.:55)
5′-TGCGTGTTCCTGGACCCTCACGTG-3′(SEQ.ID.NO.:56)
Advantage cDNA聚合酶(Clontech)用于50μl反应,经下列循环进行扩增,其中第二步到第四步重复30次:94℃30秒;94℃15秒;69℃40秒;72℃3分钟;72℃6分钟。分离得到1.4kb PCR片段,并克隆到pCRII-TOPOTM载体(Invitrogen),用T7DNA SequenaseTM试剂盒(Amsham)进行全序列测定,参见SEQ.ID.NO.:9。
e.hRUP6(Seq.Id.No.11 & 12)
用下列引物及人的胸腺Marathon-ReadyTMcDNA(Clontech)为模板,通过RT-PCR克隆了全长hRUP6。
5′-CAGGCCTTGGATTTTAATGTCAGGGATGG-3′(SEQ.ID.NO.:57)
5′-GGAGAGTCAGCTCTGAAAGAATTCAGG-3′(SEQ.ID.NO.:58)AdvantageTMcDNA聚合酶(Clontech,按商家说明)用于50μl反应,经下列循环进行扩增:94℃30秒;94℃5秒;66℃40秒;72℃2.5秒和72℃7分钟,循环2到循环4重复30次。分离得到1.3kb PCR片段,并克隆到pCRII-TOPOTM载体(Invitrogen),用ABI Big Dye TerminatorTM试剂盒(P.E.Biosystem)进行全序列测定(参见,SEQ.ID.NO.:11)。
f.hRUP7(Seq.Id.No.13 & 14)
用下列引物及人的外周白细胞cDNA(Clontech)为模板,通过RT-PCR克隆了全长PUP7,
5′-TGATGTGATGCCAGATACTAATAGCAC-3′(SEQ.ID.NO.:59,有义)
5′-CCTGATTCATTTAGGTGAGATTGAGAC-3′(SEQ.ID.NO.:60,反义)
AdvantageTM cDNA聚合酶(Clontech)用于50μl反应,经下列循环进行扩增,其中第二步到第四步重复30次:94℃2分钟;94℃15秒;60℃20秒;72℃2分钟;72℃10分钟。分离得到1.25kb PCR片段,并克隆到pCRII-TOPOTM载体(Invitrogen),用ABI Big Dye TerminatorTM试剂盒(P.E.Biosystem)进行全序列测定。(参见,SEQ.ID.NO.:13)
g.hARE-5(Seq.Id.No.5 & 6)
采用hARE-5特异的引物5′-CAGCGCAGGGTGAAGCCTGAGAGC-3′SEQ.ID.NO.:69(有义,位于起始密码子ATG的5′端)和5′-GGCACCTGCTGTGACCTGTGCAGG-3′SEQ.ID.NO.:70(反义,位于终止密码子TGA的3′端)并用人基因组DNA为模板,通过PCR来克隆全长hARE-5。按照下列循环采用TaqPlus PrecisionTM DNA聚合酶(Stratagene)来扩增,其中第2步至第4步重复35次:96℃2分钟;96℃20秒;58℃30秒;72℃2分钟;72℃10分钟。
分离到预计大小的1.1Kb PCR片段并克隆到pCRII-TOPOTM载体(Invitrogen),用T7DNA SequenaseTM试剂盒(Amsham)进行全序列测定(SEQ.ID.NO.:5)。
h.hARE-4(Seq.Id.No.3 & 4)
采用hARE-4特异的引物5′-CTGGTGTGCTCCATGGCATCCC-3′SEQ.ID.NO.:67(有义,位于起始密码子ATG的5′端)和5′-GTAAGCCTCCCAGAACGAGAGG-3′SEQ.ID.NO.:68(反义,位于终止密码子TGA的3′端)并用人基因组DNA为模板,通过PCR来克隆全长hARE-4。采用Taq DNA聚合酶(Stratagene)和5%DMSO,按照下列循环来扩增,其中第2步至第3步重复35次:94℃3分钟;94℃30秒;59℃2分钟;72℃10分钟。
分离到预计大小的1.12Kb PCR片段并克隆到pCRII-TOPOTM载体(Invitrogen),用T7 DNA SequenaseTM试剂盒(Amsham)进行全序列测定(SEQ.ID.NO.:3)。
i.hARE-3(Seq.Id.No.1 & 2)
采用hARE-3特异的引物5′-gatcaagcttCCATCCTACTGAAACCATGGTC-3′SEQ.ID.NO.:65(有义,小写字母核苷酸代表Hind III突出端,ATG为起始密码子)和5′-gatcagatctCAGTTCCAATATTCACACCACCGTC-3′SEQ.ID.NO.:66(反义,小写字母核苷酸代表Xba I突出端,TCA为终止密码子)并用人基因组DNA为模板,通过PCR来克隆全长hARE-3。采用TaqPlusPrecisionTM DNA聚合酶(Stratagene),按照下列循环来扩增,其中第2步至第4步重复35次:94℃3分钟;94℃1分钟;55℃1分钟;72℃2分钟;72℃10分钟。
分离到预计大小的1.3Kb PCR片段并用Hind III和Xba I消化,克隆到pRC/CMV载体(Invitrogen)的Hind III和Xba I位点,用T7DNASequenaseTM试剂盒(Amsham)进行全序列测定(SEQ.ID.NO.:1)。
j.hRUP3(Seq.Id.No.7 & 8)
采用hRUP3特异的引物5′-GTCCTGCCACTTCGAGACATGG-3′SEQ.ID.NO.:71(有义,ATG  为起始密码子)和5′-GAAACTTCTCTGCCCTTACCGTC-3′SEQ.ID.NO.:72(反义,位于终止密码子TAA的3′端)并用人基因组DNA为模板,通过PCR来克隆全长hRUP3。采用TaqPlus PrecisionTM DNA聚合酶(Stratagene),按照下列循环来扩增,其中第2步至第4步重复35次:94℃3分钟;94℃1分钟;58℃1分钟;72℃2分钟;72℃10分钟。
分离到预计大小的1.0Kb PCR片段并克隆到pCRII-TOPOTM载体(Invitrogen),用T7 DNA SequenaseTM试剂盒(Amsham)进行全序列测定(SEQ.ID.NO.:7)。
实施例2
受体表达
尽管在本领域中有多种细胞可用于蛋白质的表达,但最优选应用的是哺乳动物细胞。据预测,其基本原因是实用性,即例如表达GPCR的酵母细胞的应用,有可能把一种非哺乳动物细胞引入到程序中,此细胞可能不(其实,对于酵母来说,是不)包括偶联受体、遗传机制和分泌途径,而这些是经过进化用于哺乳动物系统的。因此,在非哺乳动物细胞中得到的结果,尽管是可能有用的,但并不如从哺乳动物细胞中得到的结果优选。在哺乳动物细胞中,COS-7、293和293T细胞是特别优选的,尽管应用的特定哺乳动物细胞可按技术人员的特别需要而被判定。用于表达所公开的GPCR的一般步骤如下。
第一天,将1×107个293T细胞接种到150mm的培养板上。第二天,准备两支试管(比例是每板用于一支试管):通过混合20μg DNA(例如pCMV载体、带有受体cDNA的pCMV载体,等)在1.2ml无血清的DMEM(Irvine Scientific,Irvine,CA)来制备试管A;通过混合120μllipofectamine(Gibco BRL)在1.2ml无血清DMEM中制备试管B。把试管A和B互倾混合(几次),然后在室温下温育30-45分钟。组合物被称为“转染组合物”。植出的293T细胞用1X PBS洗涤,然后加入10ml无血清的DMEM。把2.4ml转染组合物加入到细胞中去,然后在37℃/5%CO2下温育4小时。接着通过抽吸移去转染组合物,然后加入25ml的DMEM/10%胎牛血清。接着细胞在37℃/5%CO2温育。72小时后收获细胞并用来进行分析。
实施例3所公开的人GPCR的组织分布
可用几中方法来测定本文所公开的GPCR的组织分布。
1.斑点印迹分析
应用商业可得的人组织斑点印迹系统,探查内源孤儿GPCR以确定这些受体所存在的区域。实施例1的GPCR的cDNA片段(放射标记的)被(或可被)用作探针:按照制造商的指令,应用Prime-It II TM随机引物标记试剂盒(Stratagene,#300385),用完全受体cDNA(从载体中切下)产生(或可产生)放射标记的探针。把人RNA Master BlotTM(Clontech,#7770-1)与内源人GPCR放射标记的探针杂交,并按照制造商的指令在严谨条件下洗涤。印迹曝光于Kodak BioMaxTM放射自显影底片,在-80℃过夜。几种受体的结果在表B和表C中列出(参见图1A和1B,其中分别列出了各种组织和其位置)。用hCHN3和hCHN8得到的结果显示在图2A和2B所示的典型斑点印迹中。
表B
孤儿GPCR                    组织分布
             (在斑点印迹中相对于其它组织的最高水平)
hGPCR27            胎脑、壳、脑下垂体、尾状核
hARE-1             脾、外周血白细胞、胎脾
hPPR1              脑下垂体、心、唾液腺、小肠、睾丸
hRUP3              胰腺
hCHN3              胎脑、壳、枕皮质
hCHN9              胰腺、小肠、肝
hCHN10             肾、甲状腺
表C
孤儿GPCR                    组织分布
            (在斑点印迹中相对于其它组织的最高水平)
hARE-3            左小脑、右小脑、睾丸、Accumbens
hGPCR3            尸体collusum、尾状核、肝、心、心脏室间隔膜
hARE-2            左小脑、右小脑、黑质
hCHN8             左小脑、右小脑、肾、肺
2.RT-PCR
a.hRUP3
为证实hRUP3 mRNA的组织分布,采用hRUP3特异的引物和作为模板的人多组织cDNA板(MTC,Clontech)进行RT-PCR。采用Taq DNA聚合酶(Stratagene)并按照下列循环在40微升反应液中来进行该PCR反应:94℃2分钟;94℃15秒;55℃30秒;72℃1分钟;72℃10分钟。所用引物如下:
5′-GACAGGTACCTTGCCATCAAG-3′(SEQ.ID.NO.:61;有义)
5′-CTGCACAATGCCAGTGATAAGG-3′(SEQ.ID.NO.:62;反义)。
将20微升反应液上样到1%琼脂糖凝胶中,结果如图3所示。
正如图3中的数据所支持的那样,在所使用的cDNA板的16个组织(脑、结肠、心、肾、肺、卵巢、胰腺、胎盘、前列腺、骨、小肠、脾、睾丸、胸腺白细胞和肝)中,只有胰腺显示了一条hRUP3带。hRUP3的蛋白质序列与其它GPCR的进一步的对比分析表明hRUP3与具有小分子内源配体的GPCR有关,由此可以做出这样的预测:hRUP3的内源配体是小分子。
b.hRUP4
采用作为引物的hRUP4的寡聚核苷酸引物8和4和作为模板的人多组织cDNA板(MTC,Clontech)进行RT-PCR。采用Taq DNA聚合酶(Stratagene)并按照下列循环在40微升反应液中来进行扩增:94℃30秒;94℃10秒;55℃30秒;72℃2分钟;72℃5分钟,其中循环2到循环4重量复30次。
将20微升反应液上样到1%琼脂糖凝胶中来分析该RT-PCR的产物,发现hRUP4mRNA在许多人组织中表达,但在心和肾中表达最强。(参见图4)。为证实这些PCR片段的真实性,使用从hRUP4的5′末端产生的300bp片段做探针,进行Souther印迹分析。该探针用32p-dCTP采用Prime-It IITM随机引物标记试剂盒(Stratagore)进行标记,并用ProbeQuantTM G-50微型柱(Amershan)进行纯化。进行12小时的预杂交,然后在42℃杂交过夜。最后,在65℃用0.1×SSC对印迹进行洗涤。该Southern印迹没有证实hRUP4的PCR片段。
c.hRUP5
采用hRUP5的下列特异的引物和作为模板的人多组织cDNA板(MTC,Clontech)进行RT-PCR:
5′-CTGACTTCTTGTTCCTGGCAGCAGCGG-3′(SEQ.ID.NO.:63;有义)
5′-AGACCAGCCAGGGCACGCTGAAGAGTG-3′(SEQ.ID.NO.:64;反义)。
采用Taq DNA聚合酶(Stratagene)并按照下列循环在40微升反应液中来进行扩增:94℃30秒;94℃10秒;62℃1分30秒;72℃5分钟;其中第2步至第3步重复30次。将20微升反应液上样到1.5%琼脂糖凝胶中来分析该RT-PCR的产物,发现hRUP5mRNA仅在外周血白细胞中表达(数据未显示)。
d.hRUP6
采用RT-PCR来证实hRUP6的表达并确定hRUP6的组织分布。基于AC005871和GPR66片断的对齐排比,采用具有下列序列的寡聚核苷酸和作为模板的人多组织cDNA板(MTC,Clontech):
5′-CCAACACCAGCATCCATGGCATCAAG-3′(SEQ.ID.NO.:73;有义)
5′-GGAGAGTCAGCTCTGAAAGAATTCAGG-3′(SEQ.ID.NO.:74;反义)。采用TaqPlus PrecisionTM DNA聚合酶(Stratagene,按照厂商的指令)并按照下列循环在40微升反应液中来进行PCR:94℃30秒;94℃5秒;66℃40秒;72℃2分30秒;和72℃7分钟。其中第2至第4循环重复30次。
将20微升反应液上样到1.2%琼脂糖凝胶中来分析该RT-PCR的产物,代表hRUP6的特异760bp DNA片段主要在胸腺中表达,而在心、肾、肺、前列腺、小肠和睾丸中仅少量表达。(参见图5)。
本专利申请文件中提到的每个专利、申请及印刷出版物以其全文引入本申请作参考。
本领域的普通技术人员将认识到在不背离本发明精神和实质的前提下,可以对本发明的优选实施方案做许多许多改变和修改。这些修改和变化均在本发明的范围之内。
虽然本领域的普通技术人员可以得到许多不同的载体为内源和非内源GPCR的目的使用,但最好是用pCMV载体。按照国际承认用于专利程序的微生物保存布达佩斯条约,该载体于1998年10月13日保存在美国典型培养物保藏中心(American Type Culture Collection)(ATCC)(University Blvd,Manassas,VA20110-2209USA7)。其DNA经ATCC测定并得到确认,ATCC为pCMV给出了下列保藏号ATCC#203351。
序列表
(1)一般资料:
(i)申请人:陈若平;邓杭;廖王蓁;林伊玲
(ii)发明名称:与人G蛋白偶联的孤儿受体
(iii)序列数:74
(iv)通讯地址:
(A)收信人:阿瑞那制药公司
(B)Nancy Ridge大道6166号
(C)城市:圣地亚哥
(D)州:加利福尼亚州
(E)国家:美国
(F)邮编:92121
(v)计算机可读形式:
(A)介质类型:软盘
(B)计算机:IBM个人兼容机
(C)操作系统:PC-DOS/MS-DOS
(D)软件:PatentIn Release#1.0,#1.30版
(vi)本申请资料:
(A)申请号:
(B)申请日:
(C)分类号
(viii)代理人信息
(A)姓名:Burgoon,Richard P.
(B)登记号:34787
(ix)电讯信息:
(A)电话:(858)453-7200
(B)电传:(858)453-7210
(2)SEQ ID NO:1的资料:
(i)序列特征:
(A)长度:1260个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线形
(ii)分子类型:DNA(基因组的)
(xi)SEQ ID NO:1的序列描述:
ATGGTCTTCT CGGCAGTGTT GACTGCGTTC CATACCGGGA CATCCAACAC AACATTTGTC 60
GTGTATGAAA ACACCTACAT GAATATTACA CTCCCTCCAC CATTCCAGCA TCCTGACCTC 120
AGTCCATTGC TTAGATATAG TTTTGAAACC ATGGCTCCCA CTGGTTTGAG TTCCTTGACC 180
GTGAATAGTA CAGCTGTGCC CACAACACCA GCAGCATTTA AGAGCCTAAA CTTGCCTCTT 240
CAGATCACCC TTTCTGCTAT AATGATATTC ATTCTGTTTG TGTCTTTTCT TGGGAACTTG 300
GTTGTTTGCC TCATGGTTTA CCAAAAAGCT GCCATGAGGT CTGCAATTAA CATCCTCCTT 360
GCCAGCCTAG CTTTTGCAGA CATGTTGCTT GCAGTGCTGA ACATGCCCTT TGCCCTGGTA 420
ACTATTCTTA CTACCCGATG GATTTTTGGG AAATTCTTCT GTAGGGTATC TGCTATGTTT 480
TTCTGGTTAT TTGTGATAGA AGGAGTAGCC ATCCTGCTCA TCATTAGCAT AGATAGGTTC 540
CTTATTATAG TCCAGAGGCA GGATAAGCTA AACCCATATA GAGCTAAGGT TCTGATTGCA 600
GTTTCTTGGG CAACTTCCTT TTGTGTAGCT TTTCCTTTAG CCGTAGGAAA CCCCGACCTG 660
CAGATACCTT CCCGAGCTCC CCAGTGTGTG TTTGGGTACA CAACCAATCC AGGCTACCAG 720
GCTTATGTGA TTTTGATTTC TCTCATTTCT TTCTTCATAC CCTTCCTGGT AATACTGTAC 780
TCATTTATGG GCATACTCAA CACCCTTCGG CACAATGCCT TGAGGATCCA TAGCTACCCT 840
GAAGGTATAT GCCTCAGCCA GGCCAGCAAA CTGGGTCTCA TGAGTCTGCA GAGACCTTTC 900
CAGATGAGCA TTGACATGGG CTTTAAAACA CGTGCCTTCA CCACTATTTT GATTCTCTTT 960
GCTGTCTTCA TTGTCTGCTG GGCCCCATTC ACCACTTACA GCCTTGTGGC AACATTCAGT 1020
AAGCACTTTT ACTATCAGCA CAACTTTTTT GAGATTAGCA CCTGGCTACT GTGGCTCTGC 1080
TACCTCAAGT CTGCATTGAA TCCGCTGATC TACTACTGGA GGATTAAGAA ATTCCATGAT 1140
GCTTGCCTGG ACATGATGCC TAAGTCCTTC AAGTTTTTGC CGCAGCTCCC TGGTCACACA 1200
AAGCGACGGA TACGTCCTAG TGCTGTCTAT GTGTGTGGGG AACATCGGAC GGTGGTGTGA 1260
(3)SEQ ID NO:2的资料:
(i)序列特征:
(A)长度:419个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑学:线形
(ii)分子类型:DNA(基因组的)
(xi)SEQ ID NO:2的序列描述:
Met Val Phe Ser Ala Val Leu Thr Ala Phe His Thr Gly Thr Ser Asn
  1               5                  10                  15
Thr Thr Phe Val Val Tyr Glu Asn Thr Tyr Met Asn Ile Thr Leu Pro
             20                  25                  30
Pro Pro Phe Gln His Pro Asp Leu Ser Pro Leu Leu Arg Tyr Ser Phe
         35                  40                  45
Glu Thr Met Ala Pro Thr Gly Leu Ser Ser Leu Thr Val Asn Ser Thr
     50                  55                  60
Ala Val Pro Thr Thr Pro Ala Ala Phe Lys Ser Leu Asn Leu Pro Leu
 65                  70                  75                  80
Gln Ile Thr Leu Ser Ala Ile Met Ile Phe Ile Leu Phe Val Ser Phe
                 85                  90                  95
Leu Gly Asn Leu Val Val Cys Leu Met Val Tyr Gln Lys Ala Ala Met
            100                 105                 110
Arg Ser Ala Ile Asn Ile Leu Leu Ala Ser Leu Ala Phe Ala Asp Met
        115                 120                 125
Leu Leu Ala Val Leu Asn Met Pro Phe Ala Leu Val Thr Ile Leu Thr
    130                 135                 140
Thr Arg Trp Ile Phe Gly Lys Phe Phe Cys Arg Val Ser Ala Met Phe
145                 150                 155                 160
Phe Trp Leu Phe Val Ile Glu Gly Val Ala Ile Leu Leu Ile Ile Ser
                165                 170                 175
Ile Asp Arg Phe Leu Ile Ile Val Gln Arg Gln Asp Lys Leu Asn Pro
            180                 185                 190
Tyr Arg Ala Lys Val Leu Ile Ala Val Ser Trp Ala Thr Ser Phe Cys
        195                 200                 205
Val Ala Phe Pro Leu Ala Val Gly Asn Pro Asp Leu Gln Ile Pro Ser
    210                 215                 220
Arg Ala Pro Gln Cys Val Phe Gly Tyr Thr Thr Asn Pro Gly Tyr Gln
225                 230                 235                 240
Ala Tyr Val Ile Leu Ile Ser Leu Ile Ser Phe Phe Ile Pro Phe Leu
                245                 250                 255
Val Ile Leu Tyr Ser Phe Met Gly Ile Leu Asn Thr Leu Arg His Asn
            260                 265                 270
Ala Leu Arg Ile His Ser Tyr Pro Glu Gly Ile Cys Leu Ser Gln Ala
        275                 280                 285
Ser Lys Leu Gly Leu Met Ser Leu Gln Arg Pro Phe Gln Met Ser Ile
    290                 295                 300
Asp Met Gly Phe Lys Thr Arg Ala Phe Thr Thr Ile Leu Ile Leu Phe
305                 310                 315                 320
Ala Val Phe Ile Val Cys Trp Ala Pro Phe Thr Thr Tyr Ser Leu Val
                325                 330                 335
Ala Thr Phe Ser Lys His Phe Tyr Tyr Gln His Asn Phe Phe Glu Ile
            340                 345                 350
Ser Thr Trp Leu Leu Trp Leu Cys Tyr Leu Lys Ser Ala Leu Asn Pro
        355                 360                 365
Leu Ile Tyr Tyr Trp Arg Ile Lys Lys Phe His Asp Ala Cys Leu Asp
    370                 375                 380
Met Met Pro Lys Ser Phe Lys Phe Leu Pro Gln Leu Pro Gly His Thr
385                 390                 395                 400
Lys Arg Arg Ile Arg Pro Ser Ala Val Tyr Val Cys Gly Glu His Arg
                405                 410                 415
Thr Val Val
(4)SEQ ID NO:3的资料:
(i)序列特征:
(A)长度:1119个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线形
(ii)分子类型:DNA(基因组的)
(xi)SEQ ID NO:3的序列描述:
ATGTTAGCCA ACAGCTCCTC AACCAACAGT TCTGTTCTCC CGTGTCCTGA CTACCGACCT 60
ACCCACCGCC TGCACTTGGT GGTCTACAGC TTGGTGCTGG CTGCCGGGCT CCCCCTCAAC 120
GCGCTAGCCC TCTGGGTCTT CCTGCGCGCG CTGCGCGTGC ACTCGGTGGT GAGCGTGTAC 180
ATGTGTAACC TGGCGGCCAG CGACCTGCTC TTCACCCTCT CGCTGCCCGT TCGTCTCTCC 240
TACTACGCAC TGCACCACTG GCCCTTCCCC GACCTCCTGT GCCAGACGAC GGGCGCCATC 300
TTCCAGATGA ACATGTACGG CAGCTGCATC TTCCTGATGC TCATCAACGT GGACCGCTAC 360
GCCGCCATCG TGCACCCGCT GCGACTGCGC CACCTGCGGC GGCCCCGCGT GGCGCGGCTG 420
CTCTGCCTGG GCGTGTGGGC GCTCATCCTG GTGTTTGCCG TGCCCGCCGC CCGCGTGCAC 480
AGGCCCTCGC GTTGCCGCTA CCGGGACCTC GAGGTGCGCC TATGCTTCGA GAGCTTCAGC 540
GACGAGCTGT GGAAAGGCAG GCTGCTGCCC CTCGTGCTGC TGGCCGAGGC GCTGGGCTTC 600
CTGCTGCCCC TGGCGGCGGT GGTCTACTCG TCGGGCCGAG TCTTCTGGAC GCTGGCGCGC 660
CCCGACGCCA CGCAGAGCCA GCGGCGGCGG AAGACCGTGC GCCTCCTGCT GGCTAACCTC 720
GTCATCTTCC TGCTGTGCTT CGTGCCCTAC AACAGCACGC TGGCGGTCTA CGGGCTGCTG 780
CGGAGCAAGC TGGTGGCGGC CAGCGTGCCT GCCCGCGATC GCGTGCGCGG GGTGCTGATG 840
GTGATGGTGC TGCTGGCCGG CGCCAACTGC GTGCTGGACC CGCTGGTGTA CTACTTTAGC 900
GCCGAGGGCT TCCGCAACAC CCTGCGCGGC CTGGGCACTC CGCACCGGGC CAGGACCTCG 960
GCCACCAACG GGACGCGGGC GGCGCTCGCG CAATCCGAAA GGTCCGCCGT CACCACCGAC 1020
GCCACCAGGC CGGATGCCGC CAGTCAGGGG CTGCTCCGAC CCTCCGACTC CCACTCTCTG 1080
TCTTCCTTCA CACAGTGTCC CCAGGATTCC GCCCTCTGA                        1119
(5)SEQ ID NO:4的资料:
(i)序列特征:
(A)长度:372个氨基酸
(B)类型:氨基酸
(C)链型:
(D)拓扑学:不相关
(ii)分子类型:蛋白质
(xi)SEQ ID NO:4的序列描述:
Met Leu Ala Asn Ser Ser Ser Thr Asn Ser Ser Val Leu Pro Cys Pro
  1               5                  10                  15
Asp Tyr Arg Pro Thr His Arg Leu His Leu Val Val Tyr Ser Leu Val
             20                  25                  30
Leu Ala Ala Gly Leu Pro Leu Asn Ala Leu Ala Leu Trp Val Phe Leu
         35                  40                  45
Arg Ala Leu Arg Val His Ser Val Val Ser Val Tyr Met Cys Asn Leu
     50                  55                  60
Ala Ala Ser Asp Leu Leu Phe Thr Leu Ser Leu Pro Val Arg Leu Ser
 65                  70                  75                  80
Tyr Tyr Ala Leu His His Trp Pro Phe Pro Asp Leu Leu Cys Gln Thr
                 85                  90                  95
Thr Gly Ala Ile Phe Gln Met Asn Met Tyr Gly Ser Cys Ile Phe Leu
            100                 105                 110
Met Leu Ile Asn Val Asp Arg Tyr Ala Ala Ile Val His Pro Leu Arg
        115                 120                 125
Leu Arg His Leu Arg Arg Pro Arg Val Ala Arg Leu Leu Cys Leu Gly
    130                 135                 140
Val Trp Ala Leu Ile Leu Val Phe Ala Val Pro Ala Ala Arg Val His
145                 150                 155                 160
Arg Pro Ser Arg Cys Arg Tyr Arg Asp Leu Glu Val Arg Leu Cys Phe
                165                 170                 175
Glu Ser Phe Ser Asp Glu Leu Trp Lys Gly Arg Leu Leu Pro Leu Val
            180                 185                 190
Leu Leu Ala Glu Ala Leu Gly Phe Leu Leu Pro Leu Ala Ala Val Val
        195                 200                 205
Tyr Ser Ser Gly Arg Val Phe Trp Thr Leu Ala Arg Pro Asp Ala Thr
    210                 215                 220
Gln Ser Gln Arg Arg Arg Lys Thr Val Arg Leu Leu Leu Ala Asn Leu
225                 230                 235                 240
Val Ile Phe Leu Leu Cys Phe Val Pro Tyr Asn Ser Thr Leu Ala Val
                245                 250                 255
Tyr Gly Leu Leu Arg Ser Lys Leu Val Ala Ala Ser Val Pro Ala Arg
            260                 265                 270
Asp Arg Val Arg Gly Val Leu Met Val Met Val Leu Leu Ala Gly Ala
        275                 280                 285
Asn Cys Val Leu Asp Pro Leu Val Tyr Tyr Phe Ser Ala Glu Gly Phe
    290                 295                 300
Arg Asn Thr Leu Arg Gly Leu Gly Thr Pro His Arg Ala Arg Thr Ser
305                 310                 315                 320
Ala Thr Asn Gly Thr Arg Ala Ala Leu Ala Gln Ser Glu Arg Ser Ala
                325                 330                 335
Val Thr Thr Asp Ala Thr Arg Pro Asp Ala Ala Ser Gln Gly Leu Leu
            340                 345                 350
Arg Pro Ser Asp Ser His Ser Leu Ser Ser Phe Thr Gln Cys Pro Gln
        355                 360                 365
Asp Ser Ala Leu
    370
(6)SEQ ID NO:5的资料:
(i)序列特征:
(A)长度:1107个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线形
(ii)分子类型:DNA(基因组的)
(xi)SEQ ID NO:5的序列描述:
ATGGCCAACT CCACAGGGCT GAACGCCTCA GAAGTCGCAG GCTCGTTGGG GTTGATCCTG 60
GCAGCTGTCG TGGAGGTGGG GGCACTGCTG GGCAACGGCG CGCTGCTGGT CGTGGTGCTG 120
CGCACGCCGG GACTGCGCGA CGCGCTCTAC CTGGCGCACC TGTGCGTCGT GGACCTGCTG 180
GCGGCCGCCT CCATCATGCC GCTGGGCCTG CTGGCCGCAC CGCCGCCCGG GCTGGGCCGC 240
GTGCGCCTGG GCCCCGCGCC ATGCCGCGCC GCTCGCTTCC TCTCCGCCGC TCTGCTGCCG 300
GCCTGCACGC TCGGGGTGGC CGCACTTGGC CTGGCACGCT ACCGCCTCAT CGTGCACCCG 360
CTGCGGCCAG GCTCGCGGCC GCCGCCTGTG CTCGTGCTCA CCGCCGTGTG GGCCGCGGCG 420
GGACTGCTGG GCGCGCTCTC CCTGCTCGGC CCGCCGCCCG CACCGCCCCC TGCTCCTGCT 480
CGCTGCTCGG TCCTGGCTGG GGGCCTCGGG CCCTTCCGGC CGCTCTGGGC CCTGCTGGCC 540
TTCGCGCTGC CCGCCCTCCT GCTGCTCGGC GCCTACGGCG GCATCTTCGT GGTGGCGCGT 600
CGCGCTGCCC TGAGGCCCCC ACGGCCGGCG CGCGGGTCCC GACTCCGCTC GGACTCTCTG 660
GATAGCCGCC TTTCCATCTT GCCGCCGCTC CGGCCTCGCC TGCCCGGGGG CAAGGCGGCC 720
CTGGCCCCAG CGCTGGCCGT GGGCCAATTT GCAGCCTGCT GGCTGCCTTA TGGCTGCGCG 780
TGCCTGGCGC CCGCAGCGCG GGCCGCGGAA GCCGAAGCGG CTGTCACCTG GGTCGCCTAC 840
TCGGCCTTCG CGGCTCACCC CTTCCTGTAC GGGCTGCTGC AGCGCCCCGT GCGCTTGGCA 900
CTGGGCCGCC TCTCTCGCCG TGCACTGCCT GGACCTGTGC GGGCCTGCAC TCCGCAAGCC 960
TGGCACCCGC GGGCACTCTT GCAATGCCTC CAGAGACCCC CAGAGGGCCC TGCCGTAGGC 1020
CCTTCTGAGG CTCCAGAACA GACCCCCGAG TTGGCAGGAG GGCGGAGCCC CGCATACCAG 1080
GGGCCACCTG AGAGTTCTCT CTCCTGA                                     1107
(7)SEQ ID NO:6的资料:
(i)序列特征:
(A)长度:368个氨基酸
(B)类型:氨基酸
(C)链型:
(D)拓扑学:不相关
(ii)分子类型:蛋白质
(xi)SEQ ID NO:6的序列描述:
Met Ala Asn Ser Thr Gly Leu Asn Ala Ser Glu Val Ala Gly Ser Leu
  1               5                  10                  15
Gly Leu Ile Leu Ala Ala Val Val Glu Val Gly Ala Leu Leu Gly Asn
             20                  25                  30
Gly Ala Leu Leu Val Val Val Leu Arg Thr Pro Gly Leu Arg Asp Ala
         35                  40                  45
Leu Tyr Leu Ala His Leu Cys Val Val Asp Leu Leu Ala Ala Ala Ser
     50                  55                  60
Ile Met Pro Leu Gly Leu Leu Ala Ala Pro Pro Pro Gly Leu Gly Arg
 65                  70                  75                  80
Val Arg Leu Gly Pro Ala Pro Cys Arg Ala Ala Arg Phe Leu Ser Ala
                 85                  90                  95
Ala Leu Leu Pro Ala Cys Thr Leu Gly Val Ala Ala Leu Gly Leu Ala
            100                 105                 110
Arg Tyr Arg Leu Ile Val His Pro Leu Arg Pro Gly Ser Arg Pro Pro
        115                 120                 125
Pro Val Leu Val Leu Thr Ala Val Trp Ala Ala Ala Gly Leu Leu Gly
    130                 135                 140
Ala Leu Ser Leu Leu Gly Pro Pro Pro Ala Pro Pro Pro Ala Pro Ala
145                 150                 155                 160
Arg Cys Ser Val Leu Ala Gly Gly Leu Gly Pro Phe Arg Pro Leu Trp
                165                 170                 175
Ala Leu Leu Ala Phe Ala Leu Pro Ala Leu Leu Leu Leu Gly Ala Tyr
            180                 185                 190
Gly Gly Ile Phe Val Val Ala Arg Arg Ala Ala Leu Arg Pro Pro Arg
        195                 200                 205
Pro Ala Arg Gly Ser Arg Leu Arg Ser Asp Ser Leu Asp Ser Arg Leu
    210                 215                 220
Ser Ile Leu Pro Pro Leu Arg Pro Arg Leu Pro Gly Gly Lys Ala Ala
225                 230                 235                 240
Leu Ala Pro Ala Leu Ala Val Gly Gln Phe Ala Ala Cys Trp Leu Pro
                245                 250                 255
Tyr Gly Cys Ala Cys Leu Ala Pro Ala Ala Arg Ala Ala Glu Ala Glu
            260                 265                 270
Ala Ala Val Thr Trp Val Ala Tyr Ser Ala Phe Ala Ala His Pro Phe
        275                 280                 285
Leu Tyr Gly Leu Leu Gln Arg Pro Val Arg Leu Ala Leu Gly Arg Leu
    290                 295                 300
Ser Arg Arg Ala Leu Pro Gly Pro Val Arg Ala Cys Thr Pro Gln Ala
305                 310                 315                 320
Trp His Pro Arg Ala Leu Leu Gln Cys Leu Gln Arg Pro Pro Glu Gly
                325                 330                 335
Pro Ala Val Gly Pro Ser Glu Ala Pro Glu Gln Thr Pro Glu Leu Ala
            340                 345                 350
Gly Gly Arg Ser Pro Ala Tyr Gln Gly Pro Pro Glu Ser Ser Leu Ser
        355                 360                 365
(8)SEQ ID NO:7的资料:
(i)序列特征:
(A)长度:1008个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线形
(ii)分子类型:DNA(基因组的)
(xi)SEQ ID NO:7的序列描述:
ATGGAATCAT CTTTCTCATT TGGAGTGATC CTTGCTGTCC TGGCCTCCCT CATCATTGCT 60
ACTAACACAC TAGTGGCTGT GGCTGTGCTG CTGTTGATCC ACAAGAATGA TGGTGTCAGT 120
CTCTGCTTCA CCTTGAATCT GGCTGTGGCT GACACCTTGA TTGGTGTGGC CATCTCTGGC 180
CTACTCACAG ACCAGCTCTC CAGCCCTTCT CGGCCCACAC AGAAGACCCT GTGCAGCCTG 240
CGGATGGCAT TTGTCACTTC CTCCGCAGCT GCCTCTGTCC TCACGGTCAT GCTGATCACC 300
TTTGACAGGT ACCTTGCCAT CAAGCAGCCC TTCCGCTACT TGAAGATCAT GAGTGGGTTC 360
GTGGCCGGGG CCTGCATTGC CGGGCTGTGG TTAGTGTCTT ACCTCATTGG CTTCCTCCCA 420
CTCGGAATCC CCATGTTCCA GCAGACTGCC TACAAAGGGC AGTGCAGCTT CTTTGCTGTA 480
TTTCACCCTC ACTTCGTGCT GACCCTCTCC TGCGTTGGCT TCTTCCCAGC CATGCTCCTC 540
TTTGTCTTCT TCTACTGCGA CATGCTCAAG ATTGCCTCCA TGCACAGCCA GCAGATTCGA 600
AAGATGGAAC ATGCAGGAGC CATGGCTGGA GGTTATCGAT CCCCACGGAC TCCCAGCGAC 660
TTCAAAGCTC TCCGTACTGT GTCTGTTCTC ATTGGGAGCT TTGCTCTATC CTGGACCCCC 720
TTCCTTATCA CTGGCATTGT GCAGGTGGCC TGCCAGGAGT GTCACCTCTA CCTAGTGCTG 780
GAACGGTACC TGTGGCTGCT CGGCGTGGGC AACTCCCTGC TCAACCCACT CATCTATGCC 840
TATTGGCAGA AGGAGGTGCG ACTGCAGCTC TACCACATGG CCCTAGGAGT GAAGAAGGTG 900
CTCACCTCAT TCCTCCTCTT TCTCTCGGCC AGGAATTGTG GCCCAGAGAG GCCCAGGGAA 960
AGTTCCTGTC ACATCGTCAC TATCTCCAGC TCAGAGTTTG ATGGCTAA              1008
(9)SEQ ID NO:8的资料:
(i)序列特征:
(A)长度:335个氨基酸
(B)类型:氨基酸
(C)链型:
(D)拓扑学:不相关
(ii)分子类型:蛋白质
(xi)SEQ ID NO:8的序列描述:
Met Glu Ser Ser Phe Ser Phe Gly Val Ile Leu Ala Val Leu Ala Ser
  1               5                  10                  15
Leu Ile Ile Ala Thr Asn Thr Leu Val Ala Val Ala Val Leu Leu Leu
             20                  25                  30
Ile His Lys Asn Asp Gly Val Ser Leu Cys Phe Thr Leu Asn Leu Ala
         35                  40                  45
Val Ala Asp Thr Leu Ile Gly Val Ala Ile Ser Gly Leu Leu Thr Asp
     50                  55                  60
Gln Leu Ser Ser Pro Ser Arg Pro Thr Gln Lys Thr Leu Cys Ser Leu
 65                  70                  75                  80
Arg Met Ala Phe Val Thr Ser Ser Ala Ala Ala Ser Val Leu Thr Val
                 85                  90                  95
Met Leu Ile Thr Phe Asp Arg Tyr Leu Ala Ile Lys Gln Pro Phe Arg
            100                 105                 110
Tyr Leu Lys Ile Met Ser Gly Phe Val Ala Gly Ala Cys Ile Ala Gly
        115                 120                 125
Leu Trp Leu Val Ser Tyr Leu Ile Gly Phe Leu Pro Leu Gly Ile Pro
    130                 135                 140
Met Phe Gln Gln Thr Ala Tyr Lys Gly Gln Cys Ser Phe Phe Ala Val
145                 150                 155                 160
Phe His Pro His Phe Val Leu Thr Leu Ser Cys Val Gly Phe Phe Pro
                165                 170                 175
Ala Met Leu Leu Phe Val Phe Phe Tyr Cys Asp Met Leu Lys Ile Ala
            180                 185                 190
Ser Met His Ser Gln Gln Ile Arg Lys Met Glu His Ala Gly Ala Met
        195                 200                 205
Ala Gly Gly Tyr Arg Ser Pro Arg Thr Pro Ser Asp Phe Lys Ala Leu
    210                 215                 220
Arg Thr Val Ser Val Leu Ile Gly Ser Phe Ala Leu Ser Trp Thr Pro
225                 230                 235                 240
Phe Leu Ile Thr Gly Ile Val Gln Val Ala Cys Gln Glu Cys His Leu
                245                 250                 255
Tyr Leu Val Leu Glu Arg Tyr Leu Trp Leu Leu Gly Val Gly Asn Ser
            260                 265                 270
Leu Leu Asn Pro Leu Ile Tyr Ala Tyr Trp Gln Lys Glu Val Arg Leu
        275                 280                 285
Gln Leu Tyr His Met Ala Leu Gly Val Lys Lys Val Leu Thr Ser Phe
    290                 295                 300
Leu Leu Phe Leu Ser Ala Arg Asn Cys Gly Pro Glu Arg Pro Arg Glu
305                 310                 315                 320
Ser Ser Cys His Ile Val Thr Ile Ser Ser Ser Glu Phe Asp Gly
                325                 330                 335
(10)SEQ ID NO:9的资料:
(i)序列特征:
(A)长度:1413个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线形
(ii)分子类型:DNA(基因组的)
(xi)SEQ ID NO:9的序列描述:
ATGGACACTA CCATGGAAGC TGACCTGGGT GCCACTGGCC ACAGGCCCCG CACAGAGCTT 60
GATGATGAGG ACTCCTACCC CCAAGGTGGC TGGGACACGG TCTTCCTGGT GGCCCTGCTG 120
CTCCTTGGGC TGCCAGCCAA TGGGTTGATG GCGTGGCTGG CCGGCTCCCA GGCCCGGCAT 180
GGAGCTGGCA CGCGTCTGGC GCTGCTCCTG CTCAGCCTGG CCCTCTCTGA CTTCTTGTTC 240
CTGGCAGCAG CGGCCTTCCA GATCCTAGAG ATCCGGCATG GGGGACACTG GCCGCTGGGG 300
ACAGCTGCCT GCCGCTTCTA CTACTTCCTA TGGGGCGTGT CCTACTCCTC CGGCCTCTTC 360
CTGCTGGCCG CCCTCAGCCT CGACCGCTGC CTGCTGGCGC TGTGCCCACA CTGGTACCCT 420
GGGCACCGCC CAGTCCGCCT GCCCCTCTGG GTCTGCGCCG GTGTCTGGGT GCTGGCCACA 480
CTCTTCAGCG TGCCCTGGCT GGTCTTCCCC GAGGCTGCCG TCTGGTGGTA CGACCTGGTC 540
ATCTGCCTGG ACTTCTGGGA CAGCGAGGAG CTGTCGCTGA GGATGCTGGA GGTCCTGGGG 600
GGCTTCCTGC CTTTCCTCCT GCTGCTCGTC TGCCACGTGC TCACCCAGGC CACAGCCTGT 660
CGCACCTGCC ACCGCCAACA GCAGCCCGCA GCCTGCCGGG GCTTCGCCCG TGTGGCCAGG 720
ACCATTCTGT CAGCCTATGT GGTCCTGAGG CTGCCCTACC AGCTGGCCCA GCTGCTCTAC 780
CTGGCCTTCC TGTGGGACGT CTACTCTGGC TACCTGCTCT GGGAGGCCCT GGTCTACTCC 840
GACTACCTGA TCCTACTCAA CAGCTGCCTC AGCCCCTTCC TCTGCCTCAT GGCCAGTGCC 900
GACCTCCGGA CCCTGCTGCG CTCCGTGCTC TCGTCCTTCG CGGCAGCTCT CTGCGAGGAG 960
CGGCCGGGCA GCTTCACGCC CACTGAGCCA CAGACCCAGC TAGATTCTGA GGGTCCAACT 1020
CTGCCAGAGC CGATGGCAGA GGCCCAGTCA CAGATGGATC CTGTGGCCCA GCCTCAGGTG 1080
AACCCCACAC TCCAGCCACG ATCGGATCCC ACAGCTCAGC CACAGCTGAA CCCTACGGCC 1140
CAGCCACAGT CGGATCCCAC AGCCCAGCCA CAGCTGAACC TCATGGCCCA GCCACAGTCA 1200
GATTCTGTGG CCCAGCCACA GGCAGACACT AACGTCCAGA CCCCTGCACC TGCTGCCAGT 1260
TCTGTGCCCA GTCCCTGTGA TGAAGCTTCC CCAACCCCAT CCTCGCATCC TACCCCAGGG 1320
GCCCTTGAGG ACCCAGCCAC ACCTCCTGCC TCTGAAGGAG AAAGCCCCAG CAGCACCCCG 1380
CCAGAGGCGG CCCCGGGCGC AGGCCCCACG TGA                              1413
(11)SEQ ID NO:10的资料:
(i)序列特征:
(A)长度:468个氨基酸
(B)类型:氨基酸
(C)链型:
(D)拓扑学:不相关
(ii)分子类型:蛋白质
(xi)SEQ ID NO:10的序列描述:
Met Asp Thr Thr Met Glu Ala Asp Leu Gly Ala Thr Gly His Arg Pro
  1               5                  10                  15
Arg Thr Glu Leu Asp Asp Glu Asp Ser Tyr Pro Gln Gly Gly Trp Asp
             20                  25                  30
Thr Val Phe Leu Val Ala Leu Leu Leu Leu Gly Leu Pro Ala Asn Gly
         35                  40                  45
Leu Met Ala Trp Leu Ala Gly Ser Gln Ala Arg His Gly Ala Gly Thr
     50                  55                  60
Arg Leu Ala Leu Leu Leu Leu Ser Leu Ala Leu Ser Asp Phe Leu Phe
 65                  70                  75                  80
Leu Ala Ala Ala Ala Phe Gln Ile Leu Glu Ile Arg His Gly Gly His
                 85                  90                  95
Trp Pro Leu Gly Thr Ala Ala Cys Arg Phe Tyr Tyr Phe Leu Trp Gly
            100                 105                 110
Val Ser Tyr Ser Ser Gly Leu Phe Leu Leu Ala Ala Leu Ser Leu Asp
        115                 120                 125
Arg Cys Leu Leu Ala Leu Cys Pro His Trp Tyr Pro Gly His Arg Pro
    130                 135                 140
Val Arg Leu Pro Leu Trp Val Cys Ala Gly Val Trp Val Leu Ala Thr
145                 150                 155                 160
Leu Phe Ser Val Pro Trp Leu Val Phe Pro Glu Ala Ala Val Trp Trp
                165                 170                 175
Tyr Asp Leu Val Ile Cys Leu Asp Phe Trp Asp Ser Glu Glu Leu Ser
            180                 185                 190
Leu Arg Met Leu Glu Val Leu Gly Gly Phe Leu Pro Phe Leu Leu Leu
        195                 200                 205
Leu Val Cys His Val Leu Thr Gln Ala Thr Arg Thr Cys His Arg Gln
    210                 215                 220
Gln Gln Pro Ala Ala Cys Arg Gly Phe Ala Arg Val Ala Arg Thr Ile
225                 230                 235                 240
Leu Ser Ala Tyr Val Val Leu Arg Leu Pro Tyr Gln Leu Ala Gln Leu
                245                 250                 255
Leu Tyr Leu Ala Phe Leu Trp Asp Val Tyr Ser Gly Tyr Leu Leu Trp
            260                 265                 270
Glu Ala Leu Val Tyr Ser Asp Tyr Leu Ile Leu Leu Asn Ser Cys Leu
        275                 280                 285
Ser Pro Phe Leu Cys Leu Met Ala Ser Ala Asp Leu Arg Thr Leu Leu
    290                 295                 300
Arg Ser Val Leu Ser Ser Phe Ala Ala Ala Leu Cys Glu Glu Arg Pro
305                 310                 315                 320
Gly Ser Phe Thr Pro Thr Glu Pro Gln Thr Gln Leu Asp Ser Glu Gly
                325                 330                 335
Pro Thr Leu Pro Glu Pro Met Ala Glu Ala Gln Ser Gln Met Asp Pro
            340                 345                 350
Val Ala Gln Pro Gln Val Asn Pro Thr Leu Gln Pro Arg Ser Asp Pro
        355                 360                 365
Thr Ala Gln Pro Gln Leu Asn Pro Thr Ala Gln Pro Gln Ser Asp Pro
    370                 375                 380
Thr Ala Gln Pro Gln Leu Asn Leu Met Ala Gln Pro Gln Ser Asp Ser
385                 390                 395                 400
Val Ala Gln Pro Gln Ala Asp Thr Asn Val Gln Thr Pro Ala Pro Ala
                405                 410                 415
Ala Ser Ser Val Pro Ser Pro Cys Asp Glu Ala Ser Pro Thr Pro Ser
            420                 425                 430
Ser His Pro Thr Pro Gly Ala Leu Glu Asp Pro Ala Thr Pro Pro Ala
        435                 440                 445
Ser Glu Gly Glu Ser Pro Ser Ser Thr Pro Pro Glu Ala Ala Pro Gly
    450                 455                 460
Ala Gly Pro Thr
465
(12)SEQ ID NO:11的资料:
(i)序列特征:
(A)长度:1248个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线形
(ii)分子类型:DNA(基因组的)
(xi)SEQ ID NO:11的序列描述:
ATGTCAGGGA TGGAAAAACT TCAGAATGCT TCCTGGATCT ACCAGCAGAA ACTAGAAGAT 60
CCATTCCAGA AACACCTGAA CAGCACCGAG GAGTATCTGG CCTTCCTCTG CGGACCTCGG 120
CGCAGCCACT TCTTCCTCCC CGTGTCTGTG GTGTATGTGC CAATTTTTGT GGTGGGGGTC 180
ATTGGCAATG TCCTGGTGTG CCTGGTGATT CTGCAGCACC AGGCTATGAA GACGCCCACC 240
AACTACTACC TCTTCAGCCT GGCGGTCTCT GACCTCCTGG TCCTGCTCCT TGGAATGCCC 300
CTGGAGGTCT ATGAGATGTG GCGCAACTAC CCTTTCTTGT TCGGGCCCGT GGGCTGCTAC 360
TTCAAGACGG CCCTCTTTGA GACCGTGTGC TTCGCCTCCA TCCTCAGCAT CACCACCGTC 420
AGCGTGGAGC GCTACGTGGC CATCCTACAC CCGTTCCGCG CCAAACTGCA GAGCACCCGG 480
CGCCGGGCCC TCAGGATCCT CGGCATCGTC TGGGGCTTCT CCGTGCTCTT CTCCCTGCCC 540
AACACCAGCA TCCATGGCAT CAAGTTCCAC TACTTCCCCA ATGGGTCCCT GGTCCCAGGT 600
TCGGCCACCT GTACGGTCAT CAAGCCCATG TGGATCTACA ATTTCATCAT CCAGGTCACC 660
TCCTTCCTAT TCTACCTCCT CCCCATGACT GTCATCAGTG TCCTCTACTA CCTCATGGCA 720
CTCAGACTAA AGAAAGACAA ATCTCTTGAG GCAGATGAAG GGAATGCAAA TATTCAAAGA 780
CCCTGCAGAA AATCAGTCAA CAAGATGCTG TTTGTCTTGG TCTTAGTGTT TGCTATCTGT 840
TGGGCCCCGT TCCACATTGA CCGACTCTTC TTCAGCTTTG TGGAGGAGTG GAGTGAATCC 900
CTGGCTGCTG TGTTCAACCT CGTCCATGTG GTGTCAGGTG TCTTCTTCTA CCTGAGCTCA 960
GCTGTCAACC CCATTATCTA TAACCTACTG TCTCGCCGCT TCCAGGCAGC ATTCCAGAAT 1020
GTGATCTCTT CTTTCCACAA ACAGTGGCAC TCCCAGCATG ACCCACAGTT GCCACCTGCC 1080
CAGCGGAACA TCTTCCTGAC AGAATGCCAC TTTGTGGAGC TGACCGAAGA TATAGGTCCC 1140
CAATTCCCAT GTCAGTCATC CATGCACAAC TCTCACCTCC CAACAGCCCT CTCTAGTGAA 1200
CAGATGTCAA GAACAAACTA TCAAAGCTTC CACTTTAACA AAACCTGA              1248
(13)SEQ ID NO:12的资料:
(i)序列特征:
(A)长度:415个氨基酸
(B)类型:氨基酸
(C)链型:
(D)拓扑学:不相关
(ii)分子类型:蛋白质
(xi)SEQ ID NO:12的序列描述:
Met Ser Gly Met Glu Lys Leu Gln Asn Ala Ser Trp Ile Tyr Gln Gln
  1               5                  10                  15
Lys Leu Glu Asp Pro Phe Gln Lys His Leu Asn Ser Thr Glu Glu Tyr
             20                  25                  30
Leu Ala Phe Leu Cys Gly Pro Arg Arg Ser His Phe Phe Leu Pro Val
         35                  40                  45
Ser Val Val Tyr Val Pro Ile Phe Val Val Gly Val Ile Gly Asn Val
     50                  55                  60
Leu Val Cys Leu Val Ile Leu Gln His Gln Ala Met Lys Thr Pro Thr
 65                  70                  75                  80
Asn Tyr Tyr Leu Phe Ser Leu Ala Val Ser Asp Leu Leu Val Leu Leu
                 85                  90                  95
Leu Gly Met Pro Leu Glu Val Tyr Glu Met Trp Arg Asn Tyr Pro Phe
            100                 105                 110
Leu Phe Gly Pro Val Gly Cys Tyr Phe Lys Thr Ala Leu Phe Glu Thr
        115                 120                 125
Val Cys Phe Ala Ser Ile Leu Ser Ile Thr Thr Val Ser Val Glu Arg
    130                 135                 140
Tyr Val Ala Ile Leu His Pro Phe Arg Ala Lys Leu Gln Ser Thr Arg
145                 150                 155                 160
Arg Arg Ala Leu Arg Ile Leu Gly Ile Val Trp Gly Phe Ser Val Leu
                165                 170                 175
Phe Ser Leu Pro Asn Thr Ser Ile His Gly Ile Lys Phe His Tyr Phe
            180                 185                 190
Pro Asn Gly Ser Leu Val Pro Gly Ser Ala Thr Cys Thr Val Ile Lys
        195                 200                 205
Pro Met Trp Ile Tyr Asn Phe Ile Ile Gln Val Thr Ser Phe Leu Phe
    210                 215                 220
Tyr Leu Leu Pro Met Thr Val Ile Ser Val Leu Tyr Tyr Leu Met Ala
225                 230                 235                 240
Leu Arg Leu Lys Lys Asp Lys Ser Leu Glu Ala Asp Glu Gly Asn Ala
                245                 250                 255
Asn Ile Gln Arg Pro Cys Arg Lys Ser Val Asn Lys Met Leu Phe Val
            260                 265                 270
Leu Val Leu Val Phe Ala Ile Cys Trp Ala Pro Phe His Ile Asp Arg
        275                 280                 285
Leu Phe Phe Ser Phe Val Glu Glu Trp Ser Glu Ser Leu Ala Ala Val
    290                 295                 300
Phe Ash Leu Val His Val Val Ser Gly Val Phe Phe Tyr Leu Ser Ser
305                 310                 315                 320
Ala Val Asn Pro Ile Ile Tyr Asn Leu Leu Ser Arg Arg Phe Gln Ala
                325                 330                 335
Ala Phe Gln Asn Val Ile Ser Ser Phe His Lys Gln Trp His Ser Gln
            340                 345                 350
His Asp Pro Gln Leu Pro Pro Ala Gln Arg Asn Ile Phe Leu Thr Glu
        355                 360                 365
Cys His Phe Val Glu Leu Thr Glu Asp Ile Gly Pro Gln Phe Pro Cys
    370                 375                 380
Gln Ser Ser Met His Asn Ser His Leu Pro Thr Ala Leu Ser Ser Glu
385                 390                 395                 400
Gln Met Ser Arg Thr Asn Tyr Gln Ser Phe His Phe Asn Lys Thr
                405                 410                 415
(14)SEQ ID NO:13的资料:
(i)序列特征:
(A)长度:1173个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线形
(ii)分子类型:DNA(基因组的)
(xi)SEQ ID NO:13的序列描述:
ATGCCAGATA CTAATAGCAC AATCAATTTA TCACTAAGCA CTCGTGTTAC TTTAGCATTT 60
TTTATGTCCT TAGTAGCTTT TGCTATAATG CTAGGAAATG CTTTGGTCAT TTTAGCTTTT 120
GTGGTGGACA AAAACCTTAG ACATCGAAGT AGTTATTTTT TTCTTAACTT GGCCATCTCT 180
GACTTCTTTG TGGGTGTGAT CTCCATTCCT TTGTACATCC CTCACACGCT GTTCGAATGG 240
GATTTTGGAA AGGAAATCTG TGTATTTTGG CTCACTACTG ACTATCTGTT ATGTACAGCA 300
TCTGTATATA ACATTGTCCT CATCAGCTAT GATCGATACC TGTCAGTCTC AAATGCTGTG 360
TCTTATAGAA CTCAACATAC TGGGGTCTTG AAGATTGTTA CTCTGATGGT GGCCGTTTGG 420
GTGCTGGCCT TCTTAGTGAA TGGGCCAATG ATTCTAGTTT CAGAGTCTTG GAAGGATGAA 480
GGTAGTGAAT GTGAACCTGG ATTTTTTTCG GAATGGTACA TCCTTGCCAT CACATCATTC 540
TTGGAATTCG TGATCCCAGT CATCTTAGTC GCTTATTTCA ACATGAATAT TTATTGGAGC 600
CTGTGGAAGC GTGATCATCT CAGTAGGTGC CAAAGCCATC CTGGACTGAC TGCTGTCTCT 660
TCCAACATCT GTGGACACTC ATTCAGAGGT AGACTATCTT CAAGGAGATC TCTTTCTGCA 720
TCGACAGAAG TTCCTGCATC CTTTCATTCA GAGAGACAGA GGAGAAAGAG TAGTCTCATG 780
TTTTCCTCAA GAACCAAGAT GAATAGCAAT ACAATTGCTT CCAAAATGGG TTCCTTCTCC 840
CAATCAGATT CTGTAGCTCT TCACCAAAGG GAACATGTTG AACTGCTTAG AGCCAGGAGA 900
TTAGCCAAGT CACTGGCCAT TCTCTTAGGG GTTTTTGCTG TTTGCTGGGC TCCATATTCT 960
CTGTTCACAA TTGTCCTTTC ATTTTATTCC TCAGCAACAG GTCCTAAATC AGTTTGGTAT 1020
AGAATTGCAT TTTGGCTTCA GTGGTTCAAT TCCTTTGTCA ATCCTCTTTT GTATCCATTG 1080
TGTCACAAGC GCTTTCAAAA GGCTTTCTTG AAAATATTTT GTATAAAAAA GCAACCTCTA 1140
CCATCACAAC ACAGTCGGTC AGTATCTTCT TAA                              1173
(15)SEQ ID NO:14的资料:
(i)序列特征:
(A)长度:390个氨基酸
(B)类型:氨基酸
(C)链型:
(D)拓扑学:不相关
(ii)分子类型:蛋白质
(xi)SEQ ID NO:14的序列描述:
Met Pro Asp Thr Asn Ser Thr Ile Asn Leu Ser Leu Ser Thr Arg Val
  1               5                  10                  15
Thr Leu Ala Phe Phe Met Ser Leu Val Ala Phe Ala Ile Met Leu Gly
             20                  25                  30
Asn Ala Leu Val Ile Leu Ala Phe Val Val Asp Lys Asn Leu Arg His
         35                  40                  45
Arg Ser Ser Tyr Phe Phe Leu Asn Leu Ala Ile Ser Asp Phe Phe Val
     50                  55                  60
Gly Val Ile Ser Ile Pro Leu Tyr Ile Pro His Thr Leu Phe Glu Trp
 65                  70                  75                  80
Asp Phe Gly Lys Glu Ile Cys Val Phe Trp Leu Thr Thr Asp Tyr Leu
                 85                  90                  95
Leu Cys Thr Ala Ser Val Tyr Asn Ile Val Leu Ile Ser Tyr Asp Arg
            100                 105                 110
Tyr Leu Ser Val Ser Asn Ala Val Ser Tyr Arg Thr Gln His Thr Gly
        115                 120                 125
Val Leu Lys Ile Val Thr Leu Met Val Ala Val Trp Val Leu Ala Phe
    130                 135                 140
Leu Val Asn Gly Pro Met Ile Leu Val Ser Glu Ser Trp Lys Asp Glu
145                 150                 155                 160
Gly Ser Glu Cys Glu Pro Gly Phe Phe Ser Glu Trp Tyr Ile Leu Ala
                165                 170                 175
Ile Thr Ser Phe Leu Glu Phe Val Ile Pro Val Ile Leu Val Ala Tyr
            180                 185                 190
Phe Asn Met Asn Ile Tyr Trp Ser Leu Trp Lys Arg Asp His Leu Ser
        195                 200                 205
Arg Cys Gln Ser His Pro Gly Leu Thr Ala Val Ser Ser Asn Ile Cys
    210                 215                 220
Gly His Ser Phe Arg Gly Arg Leu Ser Ser Arg Arg Ser Leu Ser Ala
225                 230                 235                 240
Ser Thr Glu Val Pro Ala Ser Phe His Ser Glu Arg Gln Arg Arg Lys
                245                 250                 255
Ser Ser Leu Met Phe Ser Ser Arg Thr Lys Met Asn Ser Asn Thr Ile
            260                 265                 270
Ala Ser Lys Met Gly Ser Phe Ser Gln Ser Asp Ser Val Ala Leu His
        275                 280                 285
Gln Arg Glu His Val Glu Leu Leu Arg Ala Arg Arg Leu Ala Lys Ser
    290                 295                 300
Leu Ala Ile Leu Leu Gly Val Phe Ala Val Cys Trp Ala Pro Tyr Ser
305                 310                 315                 320
Leu Phe Thr Ile Val Leu Ser Phe Tyr Ser Ser Ala Thr Gly Pro Lys
                325                 330                 335
Ser Val Trp Tyr Arg Ile Ala Phe Trp Leu Gln Trp Phe Asn Ser Phe
            340                 345                 350
Val Asn Pro Leu Leu Tyr Pro Leu Cys His Lys Arg Phe Gln Lys Ala
        355                 360                 365
Phe Leu Lys Ile Phe Cys Ile Lys Lys Gln Pro Leu Pro Ser Gln His
    370                 375                 380
Ser Arg Ser Val Ser Ser
385                 390
(16)SEQ ID NO:15的资料:
(i)序列特征:
(A)长度:1128个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线形
(ii)分子类型:DNA(基因组的)
(xi)SEQ ID NO:15的序列描述:
ATGGCGAACG CGAGCGAGCC GGGTGGCAGC GGCGGCGGCG AGGCGGCCGC CCTGGGCCTC 60
AAGCTGGCCA CGCTCAGCCT GCTGCTGTGC GTGAGCCTAG CGGGCAACGT GCTGTTCGCG 120
CTGCTGATCG TGCGGGAGCG CAGCCTGCAC CGCGCCCCGT ACTACCTGCT GCTCGACCTG 180
TGCCTGGCCG ACGGGCTGCG CGCGCTCGCC TGCCTCCCGG CCGTCATGCT GGCGGCGCGG 240
CGTGCGGCGG CCGCGGCGGG GGCGCCGCCG GGCGCGCTGG GCTGCAAGCT GCTCGCCTTC 300
CTGGCCGCGC TCTTCTGCTT CCACGCCGCC TTCCTGCTGC TGGGCGTGGG CGTCACCCGC 360
TACCTGGCCA TCGCGCACCA CCGCTTCTAT GCAGAGCGCC TGGCCGGCTG GCCGTGCGCC 420
GCCATGCTGG TGTGCGCCGC CTGGGCGCTG GCGCTGGCCG CGGCCTTCCC GCCAGTGCTG 480
GACGGCGGTG GCGACGACGA GGACGCGCCG TGCGCCCTGG AGCAGCGGCC CGACGGCGCC 540
CCCGGCGCGC TGGGCTTCCT GCTGCTGCTG GCCGTGGTGG TGGGCGCCAC GCACCTCGTC 600
TACCTCCGCC TGCTCTTCTT CATCCACGAC CGCCGCAAGA TGCGGCCCGC GCGCCTGGTG 660
CCCGCCGTCA GCCACGACTG GACCTTCCAC GGCCCGGGCG CCACCGGCCA GGCGGCCGCC 720
AACTGGACGG CGGGCTTCGG CCGCGGGCCC ACGCCGCCCG CGCTTGTGGG CATCCGGCCC 780
GCAGGGCCGG GCCGCGGCGC GCGCCGCCTC CTCGTGCTGG AAGAATTCAA GACGGAGAAG 840
AGGCTGTGCA AGATGTTCTA CGCCGTCACG CTGCTCTTCC TGCTCCTCTG GGGGCCCTAC 900
GTCGTGGCCA GCTACCTGCG GGTCCTGGTG CGGCCCGGCG CCGTCCCCCA GGCCTACCTG 960
ACGGCCTCCG TGTGGCTGAC CTTCGCGCAG GCCGGCATCA ACCCCGTCGT GTGCTTCCTC 1020
TTCAACAGGG AGCTGAGGGA CTGCTTCAGG GCCCAGTTCC CCTGCTGCCA GAGCCCCCGG 1080
ACCACCCAGG CGACCCATCC CTGCGACCTG AAAGGCATTG GTTTATGA              1128
(17)SEQ ID NO:16的资料:
(i)序列特征:
(A)长度:375个氨基酸
(B)类型:氨基酸
(C)链型:
(D)拓扑学:不相关
(ii)分子类型:蛋白质
(xi)SEQ ID NO:16的序列描述:
Met Ala Asn Ala Ser Glu Pro Gly Gly Ser Gly Gly Gly Glu Ala Ala
  1               5                  10                  15
Ala Leu Gly Leu Lys Leu Ala Thr Leu Ser Leu Leu Leu Cys Val Ser
             20                  25                  30
Leu Ala Gly Asn Val Leu Phe Ala Leu Leu Ile Val Arg Glu Arg Ser
         35                  40                  45
Leu His Arg Ala Pro Tyr Tyr Leu Leu Leu Asp Leu Cys Leu Ala Asp
     50                  55                  60
Gly Leu Arg Ala Leu Ala Cys Leu Pro Ala Val Met Leu Ala Ala Arg
 65                  70                  75                  80
Arg Ala Ala Ala Ala Ala Gly Ala Pro Pro Gly Ala Leu Gly Cys Lys
                 85                  90                  95
Leu Leu Ala Phe Leu Ala Ala Leu Phe Cys Phe His Ala Ala Phe Leu
            100                 105                 110
Leu Leu Gly Val Gly Val Thr Arg Tyr Leu Ala Ile Ala His His Arg
        115                 120                 125
Phe Tyr Ala Glu Arg Leu Ala Gly Trp Pro Cys Ala Ala Met Leu Val
    130                 135                 140
Cys Ala Ala Trp Ala Leu Ala Leu Ala Ala Ala Phe Pro Pro Val Leu
145                 150                 155                 160
Asp Gly Gly Gly Asp Asp Glu Asp Ala Pro Cys Ala Leu Glu Gln Arg
                165                 170                 175
Pro Asp Gly Ala Pro Gly Ala Leu Gly Phe Leu Leu Leu Leu Ala Val
            180                 185                 190
Val Val Gly Ala Thr His Leu Val Tyr Leu Arg Leu Leu Phe Phe Ile
        195                 200                 205
His Asp Arg Arg Lys Met Arg Pro Ala Arg Leu Val Pro Ala Val Ser
    210                 215                 220
His Asp Trp Thr Phe His Gly Pro Gly Ala Thr Gly Gln Ala Ala Ala
225                 230                 235                 240
Asn Trp Thr Ala Gly Phe Gly Arg Gly Pro Thr Pro Pro Ala Leu Val
                245                 250                 255
Gly Ile Arg Pro Ala Gly Pro Gly Arg Gly Ala Arg Arg Leu Leu Val
            260                 265                 270
Leu Glu Glu Phe Lys Thr Glu Lys Arg Leu Cys Lys Met Phe Tyr Ala
        275                 280                 285
Val Thr Leu Leu Phe Leu Leu Leu Trp Gly Pro Tyr Val Val Ala Ser
    290                 295                 300
Tyr Leu Arg Val Leu Val Arg Pro Gly Ala Val Pro Gln Ala Tyr Leu
305                 310                 315                 320
Thr Ala Ser Val Trp Leu Thr Phe Ala Gln Ala Gly Ile Asn Pro Val
                325                 330                 335
Val Cys Phe Leu Phe Asn Arg Glu Leu Arg Asp Cys Phe Arg Ala Gln
            340                 345                 350
Phe Pro Cys Cys Gln Ser Pro Arg Thr Thr Gln Ala Thr His Pro Cys
        355                 360                 365
Asp Leu Lys Gly Ile Gly Leu
    370                 375
(18)SEQ ID NO:17的资料:
(i)序列特征:
(A)长度:1002个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线形
(ii)分子类型:DNA(基因组的)
(xi)SEQ ID NO:17的序列描述:
ATGAACACCA CAGTGATGCA AGGCTTCAAC AGATCTGAGC GGTGCCCCAG AGACACTCGG 60
ATAGTACAGC TGGTATTCCC AGCCCTCTAC ACAGTGGTTT TCTTGACCGG CATCCTGCTG 120
AATACTTTGG CTCTGTGGGT GTTTGTTCAC ATCCCCAGCT CCTCCACCTT CATCATCTAC 180
CTCAAAAACA CTTTGGTGGC CGACTTGATA ATGACACTCA TGCTTCCTTT CAAAATCCTC 240
TCTGACTCAC ACCTGGCACC CTGGCAGCTC AGAGCTTTTG TGTGTCGTTT TTCTTCGGTG 300
ATATTTTATG AGACCATGTA TGTGGGCATC GTGCTGTTAG GGCTCATAGC CTTTGACAGA 360
TTCCTCAAGA TCATCAGACC TTTGAGAAAT ATTTTTCTAA AAAAACCTGT TTTTGCAAAA 420
ACGGTCTCAA TCTTCATCTG GTTCTTTTTG TTCTTCATCT CCCTGCCAAA TACGATCTTG 480
AGCAACAAGG AAGCAACACC ATCGTCTGTG AAAAAGTGTG CTTCCTTAAA GGGGCCTCTG 540
GGGCTGAAAT GGCATCAAAT GGTAAATAAC ATATGCCAGT TTATTTTCTG GACTGTTTTT 600
ATCCTAATGC TTGTGTTTTA TGTGGTTATT GCAAAAAAAG TATATGATTC TTATAGAAAG 660
TCCAAAAGTA AGGACAGAAA AAACAACAAA AAGCTGGAAG GCAAAGTATT TGTTGTCGTG 720
GCTGTCTTCT TTGTGTGTTT TGCTCCATTT CATTTTGCCA GAGTTCCATA TACTCACAGT 780
CAAACCAACA ATAAGACTGA CTGTAGACTG CAAAATCAAC TGTTTATTGC TAAAGAAACA 840
ACTCTCTTTT TGGCAGCAAC TAACATTTGT ATGGATCCCT TAATATACAT ATTCTTATGT 900
AAAAAATTCA CAGAAAAGCT ACCATGTATG CAAGGGAGAA AGACCACAGC ATCAAGCCAA 960
GAAAATCATA GCAGTCAGAC AGACAACATA ACCTTAGGCT GA                    1002
(19)SEQ ID NO:18的资料:
(i)序列特征:
(A)长度:333个氨基酸
(B)类型:氨基酸
(C)链型:
(D)拓扑学:不相关
(ii)分子类型:蛋白质
(xi)SEQ ID NO:18的序列描述:
Met Asn Thr Thr Val Met Gln Gly Phe Asn Arg Ser Glu Arg Cys Pro
  1               5                  10                  15
Arg Asp Thr Arg Ile Val Gln Leu Val Phe Pro Ala Leu Tyr Thr Val
             20                  25                  30
Val Phe Leu Thr Gly Ile Leu Leu Asn Thr Leu Ala Leu Trp Val Phe
         35                  40                  45
Val His Ile Pro Ser Ser Ser Thr Phe Ile Ile Tyr Leu Lys Asn Thr
     50                  55                  60
Leu Val Ala Asp Leu Ile Met Thr Leu Met Leu Pro Phe Lys Ile Leu
 65                  70                  75                  80
Ser Asp Ser His Leu Ala Pro Trp Gln Leu Arg Ala Phe Val Cys Arg
                 85                  90                  95
Phe Ser Ser Val Ile Phe Tyr Glu Thr Met Tyr Val Gly Ile Val Leu
            100                 105                 110
Leu Gly Leu Ile Ala Phe Asp Arg Phe Leu Lys Ile Ile Arg Pro Leu
        115                 120                 125
Arg Asn Ile Phe Leu Lys Lys Pro Val Phe Ala Lys Thr Val Ser Ile
    130                 135                 140
Phe Ile Trp Phe Phe Leu Phe Phe Ile Ser Leu Pro Asn Thr Ile Leu
145                 150                 155                 160
Ser Asn Lys Glu Ala Thr Pro Ser Ser Val Lys Lys Cys Ala Ser Leu
                165                 170                 175
Lys Gly Pro Leu Gly Leu Lys Trp His Gln Met Val Asn Asn Ile Cys
            180                 185                 190
Gln Phe Ile Phe Trp Thr Val Phe Ile Leu Met Leu Val Phe Tyr Val
        195                 200                 205
Val Ile Ala Lys Lys Val Tyr Asp Ser Tyr Arg Lys Ser Lys Ser Lys
    210                 215                 220
Asp Arg Lys Asn Asn Lys Lys Leu Glu Gly Lys Val Phe Val Val Val
225                 230                 235                 240
Ala Val Phe Phe Val Cys Phe Ala Pro Phe His Phe Ala Arg Val Pro
                245                 250                 255
Tyr Thr His Ser Gln Thr Asn Asn Lys Thr Asp Cys Arg Leu Gln Asn
            260                 265                 270
Gln Leu Phe Ile Ala Lys Glu Thr Thr Leu Phe Leu Ala Ala Thr Asn
        275                 280                 285
Ile Cys Met Asp Pro Leu Ile Tyr Ile Phe Leu Cys Lys Lys Phe Thr
    290                 295                 300
Glu Lys Leu Pro Cys Met Gln Gly Arg Lys Thr Thr Ala Ser Ser Gln
305                 310                 315                 320
Glu Asn His Ser Ser Gln Thr Asp Asn Ile Thr Leu Gly
                325                 330
(20)SEQ ID NO:19的资料:
(i)序列特征:
(A)长度:1122个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线形
(ii)分子类型:DNA(基因组的)
(xi)SEQ ID NO:19的序列描述:
ATGGCCAACA CTACCGGAGA GCCTGAGGAG GTGAGCGGCG CTCTGTCCCC ACCGTCCGCA 60
TCAGCTTATG TGAAGCTGGT ACTGCTGGGA CTGATTATGT GCGTGAGCCT GGCGGGTAAC 120
GCCATCTTGT CCCTGCTGGT GCTCAAGGAG CGTGCCCTGC ACAAGGCTCC TTACTACTTC 180
CTGCTGGACC TGTGCCTGGC CGATGGCATA CGCTCTGCCG TCTGCTTCCC CTTTGTGCTG 240
GCTTCTGTGC GCCACGGCTC TTCATGGACC TTCAGTGCAC TCAGCTGCAA GATTGTGGCC 300
TTTATGGCCG TGCTCTTTTG CTTCCATGCG GCCTTCATGC TGTTCTGCAT CAGCGTCACC 360
CGCTACATGG CCATCGCCCA CCACCGCTTC TACGCCAAGC GCATGACACT CTGGACATGC 420
GCGGCTGTCA TCTGCATGGC CTGGACCCTG TCTGTGGCCA TGGCCTTCCC ACCTGTCTTT 480
GACGTGGGCA CCTACAAGTT TATTCGGGAG GAGGACCAGT GCATCTTTGA GCATCGCTAC 540
TTCAAGGCCA ATGACACGCT GGGCTTCATG CTTATGTTGG CTGTGCTCAT GGCAGCTACC 600
CATGCTGTCT ACGGCAAGCT GCTCCTCTTC GAGTATCGTC ACCGCAAGAT GAAGCCAGTG 660
CAGATGGTGC CAGCCATCAG CCAGAACTGG ACATTCCATG GTCCCGGGGC CACCGGCCAG 720
GCTGCTGCCA ACTGGATCGC CGGCTTTGGC CGTGGGCCCA TGCCACCAAC CCTGCTGGGT 780
ATCCGGCAGA ATGGGCATGC AGCCAGCCGG CGGCTACTGG GCATGGACGA GGTCAAGGGT 840
GAAAAGCAGC TGGGCCGCAT GTTCTACGCG ATCACACTGC TCTTTCTGCT CCTCTGGTCA 900
CCCTACATCG TGGCCTGCTA CTGGCGAGTG TTTGTGAAAG CCTGTGCTGT GCCCCACCGC 960
TACCTGGCCA CTGCTGTTTG GATGAGCTTC GCCCAGGCTG CCGTCAACCC AATTGTCTGC 1020
TTCCTGCTCA ACAAGGACCT CAAGAAGTGC CTGACCACTC ACGCCCCCTG CTGGGGCACA 1080
GGAGGTGCCC CGGCTCCCAG AGAACCCTAC TGTGTCATGT GA                    1122
(21)SEQ ID NO:20的资料:
(i)序列特征:
(A)长度:373个氨基酸
(B)类型:氨基酸
(C)链型:
(D)拓扑学:不相关
(ii)分子类型:DNA(基因组)
(xi)SEQ ID NO:20的序列描述:
Met Ala Asn Thr Thr Gly Glu Pro Glu Glu Val Ser Gly Ala Leu Ser
  1               5                  10                  15
Pro Pro Ser Ala Ser Ala Tyr Val Lys Leu Val Leu Leu Gly Leu Ile
             20                  25                  30
Met Cys Val Ser Leu Ala Gly Asn Ala Ile Leu Ser Leu Leu Val Leu
         35                  40                  45
Lys Glu Arg Ala Leu His Lys Ala Pro Tyr Tyr Phe Leu Leu Asp Leu
     50                  55                  60
Cys Leu Ala Asp Gly Ile Arg Ser Ala Val Cys Phe Pro Phe Val Leu
 65                  70                  75                  80
Ala Ser Val Arg His Gly Ser Ser Trp Thr Phe Ser Ala Leu Ser Cys
                 85                  90                  95
Lys Ile Val Ala Phe Met Ala Val Leu Phe Cys Phe His Ala Ala Phe
            100                 105                 110
Met Leu Phe Cys Ile Ser Val Thr Arg Tyr Met Ala Ile Ala His His
        115                 120                 125
Arg Phe Tyr Ala Lys Arg Met Thr Leu Trp Thr Cys Ala Ala Val Ile
    130                 135                 140
Cys Met Ala Trp Thr Leu Ser Val Ala Met Ala Phe Pro Pro Val Phe
145                 150                 155                 160
Asp Val Gly Thr Tyr Lys Phe Ile Arg Glu Glu Asp Gln Cys Ile Phe
                165                 170                 175
Glu His Arg Tyr Phe Lys Ala Asn Asp Thr Leu Gly Phe Met Leu Met
            180                 185                 190
Leu Ala Val Leu Met Ala Ala Thr His Ala Val Tyr Gly Lys Leu Leu
        195                 200                 205
Leu Phe Glu Tyr Arg His Arg Lys Met Lys Pro Val Gln Met Val Pro
    210                 215                 220
Ala Ile Ser Gln Asn Trp Thr Phe His Gly Pro Gly Ala Thr Gly Gln
225                 230                 235                 240
Ala Ala Ala Asn Trp Ile Ala Gly Phe Gly Arg Gly Pro Met Pro Pro
                245                 250                 255
Thr Leu Leu Gly Ile Arg Gln Asn Gly His Ala Ala Ser Arg Arg Leu
            260                 265                 270
Leu Gly Met Asp Glu Val Lys Gly Glu Lys Gln Leu Gly Arg Met Phe
        275                 280                 285
Tyr Ala Ile Thr Leu Leu Phe Leu Leu Leu Trp Ser Pro Tyr Ile Val
    290                 295                 300
Ala Cys Tyr Trp Arg Val Phe Val Lys Ala Cys Ala Val Pro His Arg
305                 310                 315                 320
Tyr Leu Ala Thr Ala Val Trp Met Ser Phe Ala Gln Ala Ala Val Asn
                325                 330                 335
Pro Ile Val Cys Phe Leu Leu Asn Lys Asp Leu Lys Lys Cys Leu Thr
            340                 345                 350
Thr His Ala Pro Cys Trp Gly Thr Gly Gly Ala Pro Ala Pro Arg Glu
        355                 360                 365
Pro Tyr Cys Val Met
    370
(22)SEQ ID NO:21的资料:
(i)序列特征:
(A)长度:1053个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线形
(ii)分子类型:DNA(基因组的)
(xi)SEQ ID NO:21的序列描述:
ATGGCTTTGG AACAGAACCA GTCAACAGAT TATTATTATG AGGAAAATGA AATGAATGGC 60
ACTTATGACT ACAGTCAATA TGAATTGATC TGTATCAAAG AAGATGTCAG AGAATTTGCA 120
AAAGTTTTCC TCCCTGTATT CCTCACAATA GCTTTCGTCA TTGGACTTGC AGGCAATTCC 180
ATGGTAGTGG CAATTTATGC CTATTACAAG AAACAGAGAA CCAAAACAGA TGTGTACATC 240
CTGAATTTGG CTGTAGCAGA TTTACTCCTT CTATTCACTC TGCCTTTTTG GGCTGTTAAT 300
GCAGTTCATG GGTGGGTTTT AGGGAAAATA ATGTGCAAAA TAACTTCAGC CTTGTACACA 360
CTAAACTTTG TCTCTGGAAT GCAGTTTCTG GCTTGCATCA GCATAGACAG ATATGTGGCA 420
GTAACTAATG TCCCCAGCCA ATCAGGAGTG GGAAAACCAT GCTGGATCAT CTGTTTCTGT 480
GTCTGGATGG CTGCCATCTT GCTGAGCATA CCCCAGCTGG TTTTTTATAC AGTAAATGAC 540
AATGCTAGGT GCATTCCCAT TTTCCCCCGC TACCTAGGAA CATCAATGAA AGCATTGATT 600
CAAATGCTAG AGATCTGCAT TGGATTTGTA GTACCCTTTC TTATTATGGG GGTGTGCTAC 660
TTTATCACGG CAAGGACACT CATGAAGATG CCAAACATTA AAATATCTCG ACCCCTAAAA 720
GTTCTGCTCA CAGTCGTTAT AGTTTTCATT GTCACTCAAC TGCCTTATAA CATTGTCAAG 780
TTCTGCCGAG CCATAGACAT CATCTACTCC CTGATCACCA GCTGCAACAT GAGCAAACGC 840
ATGGACATCG CCATCCAAGT CACAGAAAGC ATTGCACTCT TTCACAGCTG CCTCAACCCA 900
ATCCTTTATG TTTTTATGGG AGCATCTTTC AAAAACTACG TTATGAAAGT GGCCAAGAAA 960
TATGGGTCCT GGAGAAGACA GAGACAAAGT GTGGAGGAGT TTCCTTTTGA TTCTGAGGGT 1020
CCTACAGAGC CAACCAGTAC TTTTAGCATT TAA                              1053
(23)SEQ ID NO:22的资料:
(i)序列特征:
(A)长度:350个氨基酸
(B)类型:氨基酸
(C)链型:
(D)拓扑学:不相关
(ii)分子类型:蛋白质
(xi)SEQ ID NO:22的序列描述:
Met Ala Leu Glu Gln Asn Gln Ser Thr Asp Tyr Tyr Tyr Glu Glu Asn
  1               5                  10                  15
Glu Met Asn Gly Thr Tyr Asp Tyr Ser Gln Tyr Glu Leu Ile Cys Ile
             20                  25                  30
Lys Glu Asp Val Arg Glu Phe Ala Lys Val Phe Leu Pro Val Phe Leu
         35                  40                  45
Thr Ile Ala Phe Val Ile Gly Leu Ala Gly Asn Ser Met Val Val Ala
     50                  55                  60
Ile Tyr Ala Tyr Tyr Lys Lys Gln Arg Thr Lys Thr Asp Val Tyr Ile
 65                  70                  75                  80
Leu Asn Leu Ala Val Ala Asp Leu Leu Leu Leu Phe Thr Leu Pro Phe
                 85                  90                  95
Trp Ala Val Asn Ala Val His Gly Trp Val Leu Gly Lys Ile Met Cys
            100                 105                 110
Lys Ile Thr Ser Ala Leu Tyr Thr Leu Asn Phe Val Ser Gly Met Gln
        115                 120                 125
Phe Leu Ala Cys Ile Ser Ile Asp Arg Tyr Val Ala Val Thr Asn Val
    130                 135                 140
Pro Ser Gln Ser Gly Val Gly Lys Pro Cys Trp Ile Ile Cys Phe Cys
145                 150                 155                 160
Val Trp Met Ala Ala Ile Leu Leu Ser Ile Pro Gln Leu Val Phe Tyr
                165                 170                 175
Thr Val Asn Asp Asn Ala Arg Cys Ile Pro Ile Phe Pro Arg Tyr Leu
            180                 185                 190
Gly Thr Ser Met Lys Ala Leu Ile Gln Met Leu Glu Ile Cys Ile Gly
        195                 200                 205
Phe Val Val Pro Phe Leu Ile Met Gly Val Cys Tyr Phe Ile Thr Ala
    210                 215                 220
Arg Thr Leu Met Lys Met Pro Asn Ile Lys Ile Ser Arg Pro Leu Lys
225                 230                 235                 240
Val Leu Leu Thr Val Val Ile Val Phe Ile Val Thr Gln Leu Pro Tyr
                245                 250                 255
Asn Ile Val Lys Phe Cys Arg Ala Ile Asp Ile Ile Tyr Ser Leu Ile
            260                 265                 270
Thr Ser Cys Asn Met Ser Lys Arg Met Asp Ile Ala Ile Gln Val Thr
        275                 280                 285
Glu Ser Ile Ala Leu Phe His Ser Cys Leu Asn Pro Ile Leu Tyr Val
    290                 295                 300
Phe Met Gly Ala Ser Phe Lys Asn Tyr Val Met Lys Val Ala Lys Lys
305                 310                 315                 320
Tyr Gly Ser Trp Arg Arg Gln Arg Gln Ser Val Glu Glu Phe Pro Phe
                325                 330                 335
Asp Ser Glu Gly Pro Thr Glu Pro Thr Ser Thr Phe Ser Ile
            340                 345                 350
(24)SEQ ID NO:23的资料:
(i)序列特征:
(A)长度:1116个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线形
(ii)分子类型:DNA(基因组的)
(xi)SEQ ID NO:23的序列描述:
ATGCCAGGAA ACGCCACCCC AGTGACCACC ACTGCCCCGT GGGCCTCCCT GGGCCTCTCC 60
GCCAAGACCT GCAACAACGT GTCCTTCGAA GAGAGCAGGA TAGTCCTGGT CGTGGTGTAC 120
AGCGCGGTGT GCACGCTGGG GGTGCCGGCC AACTGCCTGA CTGCGTGGCT GGCGCTGCTG 180
CAGGTACTGC AGGGCAACGT GCTGGCCGTC TACCTGCTCT GCCTGGCACT CTGCGAACTG 240
CTGTACACAG GCACGCTGCC ACTCTGGGTC ATCTATATCC GCAACCAGCA CCGCTGGACC 300
CTAGGCCTGC TGGCCTCGAA GGTGACCGCC TACATCTTCT TCTGCAACAT CTACGTCAGC 360
ATCCTCTTCC TGTGCTGCAT CTCCTGCGAC CGCTTCGTGG CCGTGGTGTA CGCGCTGGAG 420
AGTCGGGGCC GCCGCCGCCG GAGGACCGCC ATCCTCATCT CCGCCTGCAT CTTCATCCTC 480
GTCGGGATCG TTCACTACCC GGTGTTCCAG ACGGAAGACA AGGAGACCTG CTTTGACATG 540
CTGCAGATGG ACAGCAGGAT TGCCGGGTAC TACTACGCCA GGTTCACCGT TGGCTTTGCC 600
ATCCCTCTCT CCATCATCGC CTTCACCAAC CACCGGATTT TCAGGAGCAT CAAGCAGAGC 660
ATGGGCTTAA GCGCTGCCCA GAAGGCCAAG GTGAAGCACT CGGCCATCGC GGTGGTTGTC 720
ATCTTCCTAG TCTGCTTCGC CCCGTACCAC CTGGTTCTCC TCGTCAAAGC CGCTGCCTTT 780
TCCTACTACA GAGGAGACAG GAACGCCATG TGCGGCTTGG AGGAAAGGCT GTACACAGCC 840
TCTGTGGTGT TTCTGTGCCT GTCCACGGTG AACGGCGTGG CTGACCCCAT TATCTACGTG 900
CTGGCCACGG ACCATTCCCG CCAAGAAGTG TCCAGAATCC ATAAGGGGTG GAAAGAGTGG 960
TCCATGAAGA CAGACGTCAC CAGGCTCACC CACAGCAGGG ACACCGAGGA GCTGCAGTCG 1020
CCCGTGGCCC TTGCAGACCA CTACACCTTC TCCAGGCCCG TGCACCCACC AGGGTCACCA 1080
TGCCCTGCAA AGAGGCTGAT TGAGGAGTCC TGCTGA                           1116
(25)SEQ ID NO:24的资料:
(i)序列特征:
(A)长度:371个氨基酸
(B)类型:氨基酸
(C)链型:
(D)拓扑学:不相关
(ii)分子类型:蛋白质
(xi)SEQ ID NO:24的序列描述:
Met Pro Gly Asn Ala Thr Pro Val Thr Thr Thr Ala Pro Trp Ala Ser
  1               5                  10                  15
Leu Gly Leu Ser Ala Lys Thr Cys Asn Asn Val Ser Phe Glu Glu Ser
             20                  25                  30
Arg Ile Val Leu Val Val Val Tyr Ser Ala Val Cys Thr Leu Gly Val
         35                  40                  45
Pro Ala Asn Cys Leu Thr Ala Trp Leu Ala Leu Leu Gln Val Leu Gln
     50                  55                  60
Gly Asn Val Leu Ala Val Tyr Leu Leu Cys Leu Ala Leu Cys Glu Leu
 65                  70                  75                  80
Leu Tyr Thr Gly Thr Leu Pro Leu Trp Val Ile Tyr Ile Arg Asn Gln
                 85                  90                  95
His Arg Trp Thr Leu Gly Leu Leu Ala Ser Lys Val Thr Ala Tyr Ile
            100                 105                 110
Phe Phe Cys Asn Ile Tyr Val Ser Ile Leu Phe Leu Cys Cys Ile Ser
        115                 120                 125
Cys Asp Arg Phe Val Ala Val Val Tyr Ala Leu Glu Ser Arg Gly Arg
    130                 135                 140
Arg Arg Arg Arg Thr Ala Ile Leu Ile Ser Ala Cys Ile Phe Ile Leu
145                 150                 155                 160
Val Gly Ile Val His Tyr Pro Val Phe Gln Thr Glu Asp Lys Glu Thr
                165                 170                 175
Cys Phe Asp Met Leu Gln Met Asp Ser Arg Ile Ala Gly Tyr Tyr Tyr
            180                 185                 190
Ala Arg Phe Thr Val Gly Phe Ala Ile Pro Leu Ser Ile Ile Ala Phe
        195                 200                 205
Thr Asn His Arg Ile Phe Arg Ser Ile Lys Gln Ser Met Gly Leu Ser
    210                 215                 220
Ala Ala Gln Lys Ala Lys Val Lys His Ser Ala Ile Ala Val Val Val
225                 230                 235                 240
Ile Phe Leu Val Cys Phe Ala Pro Tyr His Leu Val Leu Leu Val Lys
                245                 250                 255
Ala Ala Ala Phe Ser Tyr Tyr Arg Gly Asp Arg Asn Ala Met Cys Gly
            260                 265                 270
Leu Glu Glu Arg Leu Tyr Thr Ala Ser Val Val Phe Leu Cys Leu Ser
        275                 280                 285
Thr Val Asn Gly Val Ala Asp Pro Ile Ile Tyr Val Leu Ala Thr Asp
    290                 295                 300
His Ser Arg Gln Glu Val Ser Arg Ile His Lys Gly Trp Lys Glu Trp
305                 310                 315                 320
Ser Met Lys Thr Asp Val Thr Arg Leu Thr His Ser Arg Asp Thr Glu
                325                 330                 335
Glu Leu Gln Ser Pro Val Ala Leu Ala Asp His Tyr Thr Phe Ser Arg
            340                 345                 350
Pro Val His Pro Pro Gly Ser Pro Cys Pro Ala Lys Arg Leu Ile Glu
        355                 360                 365
Glu Ser Cys
    370
(26)SEQ ID NO:25的资料:
(i)序列特征:
(A)长度:1113个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线形
(ii)分子类型:DNA(基因组的)
(xi)SEQ ID NO:25的序列描述:
ATGGCGAACT ATAGCCATGC AGCTGACAAC ATTTTGCAAA ATCTCTCGCC TCTAACAGCC 60
TTTCTGAAAC TGACTTCCTT GGGTTTCATA ATAGGAGTCA GCGTGGTGGG CAACCTCCTG 120
ATCTCCATTT TGCTAGTGAA AGATAAGACC TTGCATAGAG CACCTTACTA CTTCCTGTTG 180
GATCTTTGCT GTTCAGATAT CCTCAGATCT GCAATTTGTT TCCCATTTGT GTTCAACTCT 240
GTCAAAAATG GCTCTACCTG GACTTATGGG ACTCTGACTT GCAAAGTGAT TGCCTTTCTG 300
GGGGTTTTGT CCTGTTTCCA CACTGCTTTC ATGCTCTTCT GCATCAGTGT CACCAGATAC 360
TTAGCTATCG CCCATCACCG CTTCTATACA AAGAGGCTGA CCTTTTGGAC GTGTCTGGCT 420
GTGATCTGTA TGGTGTGGAC TCTGTCTGTG GCCATGGCAT TTCCCCCGGT TTTAGACGTG 480
GGCACTTACT CATTCATTAG GGAGGAAGAT CAATGCACCT TCCAACACCG CTCCTTCAGG 540
GCTAATGATT CCTTAGGATT TATGCTGCTT CTTGCTCTCA TCCTCCTAGC CACACAGCTT 600
GTCTACCTCA AGCTGATATT TTTCGTCCAC GATCGAAGAA AAATGAAGCC AGTCCAGTTT 660
GTAGCAGCAG TCAGCCAGAA CTGGACTTTT CATGGTCCTG GAGCCAGTGG CCAGGCAGCT 720
GCCAATTGGC TAGCAGGATT TGGAAGGGGT CCCACACCAC CCACCTTGCT GGGCATCAGG 780
CAAAATGCAA ACACCACAGG CAGAAGAAGG CTATTGGTCT TAGACGAGTT CAAAATGGAG 840
AAAAGAATCA GCAGAATGTT CTATATAATG ACTTTTCTGT TTCTAACCTT GTGGGGCCCC 900
TACCTGGTGG CCTGTTATTG GAGAGTTTTT GCAAGAGGGC CTGTAGTACC AGGGGGATTT 960
CTAACAGCTG CTGTCTGGAT GAGTTTTGCC CAAGCAGGAA TCAATCCTTT TGTCTGCATT 1020
TTCTCAAACA GGGAGCTGAG GCGCTGTTTC AGCACAACCC TTCTTTACTG CAGAAAATCC 1080
AGGTTACCAA GGGAACCTTA CTGTGTTATA TGA                              1113
(27)SEQ ID NO:26的资料:
(i)序列特征:
(A)长度:370个氨基酸
(B)类型:氨基酸
(C)链型:
(D)拓扑学:不相关
(ii)分子类型:蛋白质
(xi)SEQ ID NO:26的序列描述:
Met Ala Asn Tyr Ser His Ala Ala Asp Asn Ile Leu Gln Asn Leu Ser
  1               5                  10                  15
Pro Leu Thr Ala Phe Leu Lys Leu Thr Ser Leu Gly Phe Ile Ile Gly
             20                  25                  30
Val Ser Val Val Gly Asn Leu Leu Ile Ser Ile Leu Leu Val Lys Asp
         35                  40                  45
Lys Thr Leu His Arg Ala Pro Tyr Tyr Phe Leu Leu Asp Leu Cys Cys
     50                  55                  60
Ser Asp Ile Leu Arg Ser Ala Ile Cys Phe Pro Phe Val Phe Asn Ser
 65                  70                  75                  80
Val Lys Asn Gly Ser Thr Trp Thr Tyr Gly Thr Leu Thr Cys Lys Val
                 85                  90                  95
Ile Ala Phe Leu Gly Val Leu Ser Cys Phe His Thr Ala Phe Met Leu
            100                 105                 110
Phe Cys Ile Ser Val Thr Arg Tyr Leu Ala Ile Ala His His Arg Phe
        115                 120                 125
Tyr Thr Lys Arg Leu Thr Phe Trp Thr Cys Leu Ala Val Ile Cys Met
    130                 135                 140
Val Trp Thr Leu Ser Val Ala Met Ala Phe Pro Pro Val Leu Asp Val
145                 150                 155                 160
Gly Thr Tyr Ser Phe Ile Arg Glu Glu Asp Gln Cys Thr Phe Gln His
                165                 170                 175
Arg Ser Phe Arg Ala Asn Asp Ser Leu Gly Phe Met Leu Leu Leu Ala
            180                 185                 190
Leu Ile Leu Leu Ala Thr Gln Leu Val Tyr Leu Lys Leu Ile Phe Phe
        195                 200                 205
Val His Asp Arg Arg Lys Met Lys Pro Val Gln Phe Val Ala Ala Val
    210                 215                 220
Ser Gln Asn Trp Thr Phe His Gly Pro Gly Ala Ser Gly Gln Ala Ala
225                 230                 235                 240
Ala Asn Trp Leu Ala Gly Phe Gly Arg Gly Pro Thr Pro Pro Thr Leu
                245                 250                 255
Leu Gly Ile Arg Gln Asn Ala Asn Thr Thr Gly Arg Arg Arg Leu Leu
            260                 265                 270
Val Leu Asp Glu Phe Lys Met Glu Lys Arg Ile Ser Arg Met Phe Tyr
        275                 280                 285
Ile Met Thr Phe Leu Phe Leu Thr Leu Trp Gly Pro Tyr Leu Val Ala
    290                 295                 300
Cys Tyr Trp Arg Val Phe Ala Arg Gly Pro Val Val Pro Gly Gly Phe
305                 310                 315                 320
Leu Thr Ala Ala Val Trp Met Ser Phe Ala Gln Ala Gly Ile Asn Pro
                325                 330                 335
Phe Val Cys Ile Phe Ser Asn Arg Glu Leu Arg Arg Cys Phe Ser Thr
            340                 345                 350
Thr Leu Leu Tyr Cys Arg Lys Ser Arg Leu Pro Arg Glu Pro Tyr Cys
        355                 360                 365
Val Ile
    370
(28)SEQ ID NO:27的资料:
(i)序列特征:
(A)长度:1080个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线形
(ii)分子类型:DNA(基因组的)
(xi)SEQ ID NO:27的序列描述:
ATGCAGGTCC CGAACAGCAC CGGCCCGGAC AACGCGACGC TGCAGATGCT GCGGAACCCG 60
GCGATCGCGG TGGCCCTGCC CGTGGTGTAC TCGCTGGTGG CGGCGGTCAG CATCCCGGGC 120
AACCTCTTCT CTCTGTGGGT GCTGTGCCGG CGCATGGGGC CCAGATCCCC GTCGGTCATC 180
TTCATGATCA ACCTGAGCGT CACGGACCTG ATGCTGGCCA GCGTGTTGCC TTTCCAAATC 240
TACTACCATT GCAACCGCCA CCACTGGGTA TTCGGGGTGC TGCTTTGCAA CGTGGTGACC 300
GTGGCCTTTT ACGCAAACAT GTATTCCAGC ATCCTCACCA TGACCTGTAT CAGCGTGGAG 360
CGCTTCCTGG GGGTCCTGTA CCCGCTCAGC TCCAAGCGCT GGCGCCGCCG TCGTTACGCG 420
GTGGCCGCGT GTGCAGGGAC CTGGCTGCTG CTCCTGACCG CCCTGTGCCC GCTGGCGCGC 480
ACCGATCTCA CCTACCCGGT GCACGCCCTG GGCATCATCA CCTGCTTCGA CGTCCTCAAG 540
TGGACGATGC TCCCCAGCGT GGCCATGTGG GCCGTGTTCC TCTTCACCAT CTTCATCCTG 600
CTGTTCCTCA TCCCGTTCGT GATCACCGTG GCTTGTTACA CGGCCACCAT CCTCAAGCTG 660
TTGCGCACGG AGGAGGCGCA CGGCCGGGAG CAGCGGAGGC GCGCGGTGGG CCTGGCCGCG 720
GTGGTCTTGC TGGCCTTTGT CACCTGCTTC GCCCCCAACA ACTTCGTGCT CCTGGCGCAC 780
ATCGTGAGCC GCCTGTTCTA CGGCAAGAGC TACTACCACG TGTACAAGCT CACGCTGTGT 840
CTCAGCTGCC TCAACAACTG TCTGGACCCG TTTGTTTATT ACTTTGCGTC CCGGGAATTC 900
CAGCTGCGCC TGCGGGAATA TTTGGGCTGC CGCCGGGTGC CCAGAGACAC CCTGGACACG 960
CGCCGCGAGA GCCTCTTCTC CGCCAGGACC ACGTCCGTGC GCTCCGAGGC CGGTGCGCAC 1020
CCTGAAGGGA TGGAGGGAGC CACCAGGCCC GGCCTCCAGA GGCAGGAGAG TGTGTTCTGA 1080
(29)SEQ ID NO:28的资料:
(i)序列特征:
(A)长度:359个氨基酸
(B)类型:氨基酸
(C)链型:
(D)拓扑学:不相关
(ii)分子类型:蛋白质
(xi)SEQ ID NO:28的序列描述:
Met Gln Val Pro Asn Ser Thr Gly Pro Asp Asn Ala Thr Leu Gln Met
  1               5                  10                  15
Leu Arg Asn Pro Ala Ile Ala Val Ala Leu Pro Val Val Tyr Ser Leu
             20                  25                  30
Val Ala Ala Val Ser Ile Pro Gly Asn Leu Phe Ser Leu Trp Val Leu
         35                  40                  45
Cys Arg Arg Met Gly Pro Arg Ser Pro Ser Val Ile Phe Met Ile Asn
     50                  55                  60
Leu Ser Val Thr Asp Leu Met Leu Ala Ser Val Leu Pro Phe Gln Ile
 65                  70                  75                  80
Tyr Tyr His Cys Asn Arg His His Trp Val Phe Gly Val Leu Leu Cys
                 85                  90                  95
Asn Val Val Thr Val Ala Phe Tyr Ala Asn Met Tyr Ser Ser Ile Leu
            100                 105                 110
Thr Met Thr Cys Ile Ser Val Glu Arg Phe Leu Gly Val Leu Tyr Pro
        115                 120                 125
Leu Ser Ser Lys Arg Trp Arg Arg Arg Arg Tyr Ala Val Ala Ala Cys
    130                 135                 140
Ala Gly Thr Trp Leu Leu Leu Leu Thr Ala Leu Cys Pro Leu Ala Arg
145                 150                 155                 160
Thr Asp Leu Thr Tyr Pro Val His Ala Leu Gly Ile Ile Thr Cys Phe
                165                 170                 175
Asp Val Leu Lys Trp Thr Met Leu Pro Ser Val Ala Met Trp Ala Val
            180                 185                 190
Phe Leu Phe Thr Ile Phe Ile Leu Leu Phe Leu Ile Pro Phe Val Ile
        195                 200                 205
Thr Val Ala Cys Tyr Thr Ala Thr Ile Leu Lys Leu Leu Arg Thr Glu
    210                 215                 220
Glu Ala His Gly Arg Glu Gln Arg Arg Arg Ala Val Gly Leu Ala Ala
225                 230                 235                 240
Val Val Leu Leu Ala Phe Val Thr Cys Phe Ala Pro Asn Asn Phe Val
                245                 250                 255
Leu Leu Ala His Ile Val Ser Arg Leu Phe Tyr Gly Lys Ser Tyr Tyr
            260                 265                 270
His Val Tyr Lys Leu Thr Leu Cys Leu Ser Cys Leu Asn Asn Cys Leu
        275                 280                 285
Asp Pro Phe Val Tyr Tyr Phe Ala Ser Arg Glu Phe Gln Leu Arg Leu
    290                 295                 300
Arg Glu Tyr Leu Gly Cys Arg Arg Val Pro Arg Asp Thr Leu Asp Thr
305                 310                 315                 320
Arg Arg Glu Ser Leu Phe Ser Ala Arg Thr Thr Ser Val Arg Ser Glu
                325                 330                 335
Ala Gly Ala His Pro Glu Gly Met Glu Gly Ala Thr Arg Pro Gly Leu
            340                 345                 350
Gln Arg Gln Glu Ser Val Phe
        355
(30)SEQ ID NO:29的资料:
(i)序列特征:
(A)长度:1503个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线形
(ii)分子类型:DNA(基因组的)
(xi)SEQ ID NO:29的序列描述:
ATGGAGCGTC CCTGGGAGGA CAGCCCAGGC CCGGAGGGGG CAGCTGAGGG CTCGCCTGTG 60
CCAGTCGCCG CCGGGGCGCG CTCCGGTGCC GCGGCGAGTG GCACAGGCTG GCAGCCATGG 120
GCTGAGTGCC CGGGACCCAA GGGGAGGGGG CAACTGCTGG CGACCGCCGG CCCTTTGCGT 180
CGCTGGCCCG CCCCCTCGCC TGCCAGCTCC AGCCCCGCCC CCGGAGCGGC GTCCGCTCAC 240
TCGGTTCAAG GCAGCGCGAC TGCGGGTGGC GCACGACCAG GGCGCAGACC TTGGGGCGCG 300
CGGCCCATGG AGTCGGGGCT GCTGCGGCCG GCGCCGGTGA GCGAGGTCAT CGTCCTGCAT 360
TACAACTACA CCGGCAAGCT CCGCGGTGCG AGCTACCAGC CGGGTGCCGG CCTGCGCGCC 420
GACGCCGTGG TGTGCCTGGC GGTGTGCGCC TTCATCGTGC TAGAGAATCT AGCCGTGTTG 480
TTGGTGCTCG GACGCCACCC GCGCTTCCAC GCTCCCATGT TCCTGCTCCT GGGCAGCCTC 540
ACGTTGTCGG ATCTGCTGGC AGGCGCCGCC TACGCCGCCA ACATCCTACT GTCGGGGCCG 600
CTCACGCTGA AACTGTCCCC CGCGCTCTGG TTCGCACGGG AGGGAGGCGT CTTCGTGGCA 660
CTCACTGCGT CCGTGCTGAG CCTCCTGGCC ATCGCGCTGG AGCGCAGCCT CACCATGGCG 720
CGCAGGGGGC CCGCGCCCGT CTCCAGTCGG GGGCGCACGC TGGCGATGGC AGCCGCGGCC 780
TGGGGCGTGT CGCTGCTCCT CGGGCTCCTG CCAGCGCTGG GCTGGAATTG CCTGGGTCGC 840
CTGGACGCTT GCTCCACTGT CTTGCCGCTC TACGCCAAGG CCTACGTGCT CTTCTGCGTG 900
CTCGCCTTCG TGGGCATCCT GGCCGCGATC TGTGCACTCT ACGCGCGCAT CTACTGCCAG 960
GTACGCGCCA ACGCGCGGCG CCTGCCGGCA CGGCCCGGGA CTGCGGGGAC CACCTCGACC 1020
CGGGCGCGTC GCAAGCCGCG CTCTCTGGCC TTGCTGCGCA CGCTCAGCGT GGTGCTCCTG 1080
GCCTTTGTGG CATGTTGGGG CCCCCTCTTC CTGCTGCTGT TGCTCGACGT GGCGTGCCCG 1140
GCGCGCACCT GTCCTGTACT CCTGCAGGCC GATCCCTTCC TGGGACTGGC CATGGCCAAC 1200
TCACTTCTGA ACCCCATCAT CTACACGCTC ACCAACCGCG ACCTGCGCCA CGCGCTCCTG 1260
CGCCTGGTCT GCTGCGGACG CCACTCCTGC GGCAGAGACC CGAGTGGCTC CCAGCAGTCG 1320
GCGAGCGCGG CTGAGGCTTC CGGGGGCCTG CGCCGCTGCC TGCCCCCGGG CCTTGATGGG 1380
AGCTTCAGCG GCTCGGAGCG CTCATCGCCC CAGCGCGACG GGCTGGACAC CAGCGGCTCC 1440
ACAGGCAGCC CCGGTGCACC CACAGCCGCC CGGACTCTGG TATCAGAACC GGCTGCAGAC 1500
TGA                                                               1503
(31)SEQ ID NO:30的资料:
(i)序列特征:
(A)长度:500个氨基酸
(B)类型:氨基酸
(C)链型:
(D)拓扑学:不相关
(ii)分子类型:蛋白质
(xi)SEQ ID NO:30的序列描述:
Met Glu Arg Pro Trp Glu Asp Ser Pro Gly Pro Glu Gly Ala Ala Glu
  1               5                  10                  15
Gly Ser Pro Val Pro Val Ala Ala Gly Ala Arg Ser Gly Ala Ala Ala
             20                  25                  30
Ser Gly Thr Gly Trp Gln Pro Trp Ala Glu Cys Pro Gly Pro Lys Gly
         35                  40                  45
Arg Gly Gln Leu Leu Ala Thr Ala Gly Pro Leu Arg Arg Trp Pro Ala
     50                  55                  60
Pro Ser Pro Ala Ser Ser Ser Pro Ala Pro Gly Ala Ala Ser Ala His
 65                  70                  75                  80
Ser Val Gln Gly Ser Ala Thr Ala Gly Gly Ala Arg Pro Gly Arg Arg
                 85                  90                  95
Pro Trp Gly Ala Arg Pro Met Glu Ser Gly Leu Leu Arg Pro Ala Pro
            100                 105                 110
Val Ser Glu Val Ile Val Leu His Tyr Asn Tyr Thr Gly Lys Leu Arg
        115                 120                 125
Gly Ala Ser Tyr Gln Pro Gly Ala Gly Leu Arg Ala Asp Ala Val Val
    130                 135                 140
Cys Leu Ala Val Cys Ala Phe Ile Val Leu Glu Asn Leu Ala Val Leu
145                 150                 155                 160
Leu Val Leu Gly Arg His Pro Arg Phe His Ala Pro Met Phe Leu Leu
                165                 170                 175
Leu Gly Ser Leu Thr Leu Ser Asp Leu Leu Ala Gly Ala Ala Tyr Ala
            180                 185                 190
Ala Asn Ile Leu Leu Ser Gly Pro Leu Thr Leu Lys Leu Ser Pro Ala
        195                 200                 205
Leu Trp Phe Ala Arg Glu Gly Gly Val Phe Val Ala Leu Thr Ala Ser
    210                 215                 220
Val Leu Ser Leu Leu Ala Ile Ala Leu Glu Arg Ser Leu Thr Met Ala
225                 230                 235                 240
Arg Arg Gly Pro Ala Pro Val Ser Ser Arg Gly Arg Thr Leu Ala Met
                245                 250                 255
Ala Ala Ala Ala Trp Gly Val Ser Leu Leu Leu Gly Leu Leu Pro Ala
            260                 265                 270
Leu Gly Trp Asn Cys Leu Gly Arg Leu Asp Ala Cys Ser Thr Val Leu
        275                 280                 285
Pro Leu Tyr Ala Lys Ala Tyr Val Leu Phe Cys Val Leu Ala Phe Val
    290                 295                 300
Gly Ile Leu Ala Ala Ile Cys Ala Leu Tyr Ala Arg Ile Tyr Cys Gln
305                 310                 315                 320
Val Arg Ala Asn Ala Arg Arg Leu Pro Ala Arg Pro Gly Thr Ala Gly
                325                 330                 335
Thr Thr Ser Thr Arg Ala Arg Arg Lys Pro Arg Ser Leu Ala Leu Leu
            340                 345                 350
Arg Thr Leu Ser Val Val Leu Leu Ala Phe Val Ala Cys Trp Gly Pro
        355                 360                 365
Leu Phe Leu Leu Leu Leu Leu Asp Val Ala Cys Pro Ala Arg Thr Cys
    370                 375                 380
Pro Val Leu Leu Gln Ala Asp Pro Phe Leu Gly Leu Ala Met Ala Asn
385                 390                 395                 400
Ser Leu Leu Asn Pro Ile Ile Tyr Thr Leu Thr Asn Arg Asp Leu Arg
                405                 410                 415
His Ala Leu Leu Arg Leu Val Cys Cys Gly Arg His Ser Cys Gly Arg
            420                 425                 430
Asp Pro Ser Gly Ser Gln Gln Ser Ala Ser Ala Ala Glu Ala Ser Gly
        435                 440                 445
Gly Leu Arg Arg Cys Leu Pro Pro Gly Leu Asp Gly Ser Phe Ser Gly
    450                 455                 460
Ser Glu Arg Ser Ser Pro Gln Arg Asp Gly Leu Asp Thr Ser Gly Ser
465                 470                 475                 480
Thr Gly Ser Pro Gly Ala Pro Thr Ala Ala Arg Thr Leu Val Ser Glu
                485                 490                 495
Pro Ala Ala Asp
            500
(32)SEQ ID NO:31的资料:
(i)序列特征:
(A)长度:1029个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线形
(ii)分子类型:DNA(基因组的)
(xi)SEQ ID NO:31的序列描述:
ATGCAAGCCG TCGACAATCT CACCTCTGCG CCTGGGAACA CCAGTCTGTG CACCAGAGAC 60
TACAAAATCA CCCAGGTCCT CTTCCCACTG CTCTACACTG TCCTGTTTTT TGTTGGACTT 120
ATCACAAATG GCCTGGCGAT GAGGATTTTC TTTCAAATCC GGAGTAAATC AAACTTTATT 180
ATTTTTCTTA AGAACACAGT CATTTCTGAT CTTCTCATGA TTCTGACTTT TCCATTCAAA 240
ATTCTTAGTG ATGCCAAACT GGGAACAGGA CCACTGAGAA CTTTTGTGTG TCAAGTTACC 300
TCCGTCATAT TTTATTTCAC AATGTATATC AGTATTTCAT TCCTGGGACT GATAACTATC 360
GATCGCTACC AGAAGACCAC CAGGCCATTT AAAACATCCA ACCCCAAAAA TCTCTTGGGG 420
GCTAAGATTC TCTCTGTTGT CATCTGGGCA TTCATGTTCT TACTCTCTTT GCCTAACATG 480
ATTCTGACCA ACAGGCAGCC GAGAGACAAG AATGTGAAGA AATGCTCTTT CCTTAAATCA 540
GAGTTCGGTC TAGTCTGGCA TGAAATAGTA AATTACATCT GTCAAGTCAT TTTCTGGATT 600
AATTTCTTAA TTGTTATTGT ATGTTATACA CTCATTACAA AAGAACTGTA CCGGTCATAC 660
GTAAGAACGA GGGGTGTAGG TAAAGTCCCC AGGAAAAAGG TGAACGTCAA AGTTTTCATT 720
ATCATTGCTG TATTCTTTAT TTGTTTTGTT CCTTTCCATT TTGCCCGAAT TCCTTACACC 780
CTGAGCCAAA CCCGGGATGT CTTTGACTGC ACTGCTGAAA ATACTCTGTT CTATGTGAAA 840
GAGAGCACTC TGTGGTTAAC TTCCTTAAAT GCATGCCTGG ATCCGTTCAT CTATTTTTTC 900
CTTTGCAAGT CCTTCAGAAA TTCCTTGATA AGTATGCTGA AGTGCCCCAA TTCTGCAACA 960
TCTCTGTCCC AGGACAATAG GAAAAAAGAA CAGGATGGTG GTGACCCAAA TGAAGAGACT 1020
CCAATGTAA                                                         1029
(33)SEQ ID NO:32的资料:
(i)序列特征:
(A)长度:342个氨基酸
(B)类型:氨基酸
(C)链型:
(D)拓扑学:不相关
(ii)分子类型:蛋白质
(xi)SEQ ID NO:32的序列描述:
Met Gln Ala Val Asp Asn Leu Thr Ser Ala Pro Gly Asn Thr Ser Leu
  1               5                  10                  15
Cys Thr Arg Asp Tyr Lys Ile Thr Gln Val Leu Phe Pro Leu Leu Tyr
             20                  25                  30
Thr Val Leu Phe Phe Val Gly Leu Ile Thr Asn Gly Leu Ala Met Arg
         35                  40                  45
Ile Phe Phe Gln Ile Arg Ser Lys Ser Asn Phe Ile Ile Phe Leu Lys
     50                  55                  60
Asn Thr Val Ile Ser Asp Leu Leu Met Ile Leu Thr Phe Pro Phe Lys
 65                  70                  75                  80
Ile Leu Ser Asp Ala Lys Leu Gly Thr Gly Pro Leu Arg Thr Phe Val
                 85                  90                  95
Cys Gln Val Thr Ser Val Ile Phe Tyr Phe Thr Met Tyr Ile Ser Ile
            100                 105                 110
Ser Phe Leu Gly Leu Ile Thr Ile Asp Arg Tyr Gln Lys Thr Thr Arg
        115                 120                 125
Pro Phe Lys Thr Ser Asn Pro Lys Asn Leu Leu Gly Ala Lys Ile Leu
    130                 135                 140
Ser Val Val Ile Trp Ala Phe Met Phe Leu Leu Ser Leu Pro Asn Met
145                 150                 155                 160
Ile Leu Thr Asn Arg Gln Pro Arg Asp Lys Asn Val Lys Lys Cys Ser
                165                 170                 175
Phe Leu Lys Ser Glu Phe Gly Leu Val Trp His Glu Ile Val Asn Tyr
            180                 185                 190
Ile Cys Gln Val Ile Phe Trp Ile Asn Phe Leu Ile Val Ile Val Cys
        195                 200                 205
Tyr Thr Leu Ile Thr Lys Glu Leu Tyr Arg Ser Tyr Val Arg Thr Arg
    210                 215                 220
Gly Val Gly Lys Val Pro Arg Lys Lys Val Asn Val Lys Val Phe Ile
225                 230                 235                 240
Ile Ile Ala Val Phe Phe Ile Cys Phe Val Pro Phe His Phe Ala Arg
                245                 250                 255
Ile Pro Tyr Thr Leu Ser Gln Thr Arg Asp Val Phe Asp Cys Thr Ala
            260                 265                 270
Glu Asn Thr Leu Phe Tyr Val Lys Glu Ser Thr Leu Trp Leu Thr Ser
        275                 280                 285
Leu Asn Ala Cys Leu Asp Pro Phe Ile Tyr Phe Phe Leu Cys Lys Ser
    290                 295                 300
Phe Arg Asn Ser Leu Ile Ser Met Leu Lys Cys Pro Asn Ser Ala Thr
305                 310                 315                 320
Ser Leu Ser Gln Asp Asn Arg Lys Lys Glu Gln Asp Gly Gly Asp Pro
                325                 330                 335
Asn Glu Glu Thr Pro Met
            340
(34)SEQ ID NO:33的资料:
(i)序列特征:
(A)长度:1077个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线形
(ii)分子类型:DNA(基因组的)
(xi)SEQ ID NO:33的序列描述:
ATGTCGGTCT GCTACCGTCC CCCAGGGAAC GAGACACTGC TGAGCTGGAA GACTTCGCGG 60
GCCACAGGCA CAGCCTTCCT GCTGCTGGCG GCGCTGCTGG GGCTGCCTGG CAACGGCTTC 120
GTGGTGTGGA GCTTGGCGGG CTGGCGGCCT GCACGGGGGC GACCGCTGGC GGCCACGCTT 180
GTGCTGCACC TGGCGCTGGC CGACGGCGCG GTGCTGCTGC TCACGCCGCT CTTTGTGGCC 240
TTCCTGACCC GGCAGGCCTG GCCGCTGGGC CAGGCGGGCT GCAAGGCGGT GTACTACGTG 300
TGCGCGCTCA GCATGTACGC CAGCGTGCTG CTCACCGGCC TGCTCAGCCT GCAGCGCTGC 360
CTCGCAGTCA CCCGCCCCTT CCTGGCGCCT CGGCTGCGCA GCCCGGCCCT GGCCCGCCGC 420
CTGCTGCTGG CGGTCTGGCT GGCCGCCCTG TTGCTCGCCG TCCCGGCCGC CGTCTACCGC 480
CACCTGTGGA GGGACCGCGT ATGCCAGCTG TGCCACCCGT CGCCGGTCCA CGCCGCCGCC 540
CACCTGAGCC TGGAGACTCT GACCGCTTTC GTGCTTCCTT TCGGGCTGAT GCTCGGCTGC 600
TACAGCGTGA CGCTGGCACG GCTGCGGGGC GCCCGCTGGG GCTCCGGGCG GCACGGGGCG 660
CGGGTGGGCC GGCTGGTGAG CGCCATCGTG CTTGCCTTCG GCTTGCTCTG GGCCCCCTAC 720
CACGCAGTCA ACCTTCTGCA GGCGGTCGCA GCGCTGGCTC CACCGGAAGG GGCCTTGGCG 780
AAGCTGGGCG GAGCCGGCCA GGCGGCGCGA GCGGGAACTA CGGCCTTGGC CTTCTTCAGT 840
TCTAGCGTCA ACCCGGTGCT CTACGTCTTC ACCGCTGGAG ATCTGCTGCC CCGGGCAGGT 900
CCCCGTTTCC TCACGCGGCT CTTCGAAGGC TCTGGGGAGG CCCGAGGGGG CGGCCGCTCT 960
AGGGAAGGGA CCATGGAGCT CCGAACTACC CCTCAGCTGA AAGTGGTGGG GCAGGGCCGC 1020
GGCAATGGAG ACCCGGGGGG TGGGATGGAG AAGGACGGTC CGGAATGGGA CCTTTGA    1077
(35)SEQ ID NO:34的资料:
(i)序列特征:
(A)长度:358个氨基酸
(B)类型:氨基酸
(C)链型:
(D)拓扑学:不相关
(ii)分子类型:蛋白质
(xi)SEQ ID NO:34的序列描述:
Met Ser Val Cys Tyr Arg Pro Pro Gly Asn Glu Thr Leu Leu Ser Trp
  1               5                  10                  15
Lys Thr Ser Arg Ala Thr Gly Thr Ala Phe Leu Leu Leu Ala Ala Leu
             20                  25                  30
Leu Gly Leu Pro Gly Asn Gly Phe Val Val Trp Ser Leu Ala Gly Trp
         35                  40                  45
Arg Pro Ala Arg Gly Arg Pro Leu Ala Ala Thr Leu Val Leu His Leu
     50                  55                  60
Ala Leu Ala Asp Gly Ala Val Leu Leu Leu Thr Pro Leu Phe Val Ala
 65                  70                  75                  80
Phe Leu Thr Arg Gln Ala Trp Pro Leu Gly Gln Ala Gly Cys Lys Ala
                 85                  90                  95
Val Tyr Tyr Val Cys Ala Leu Ser Met Tyr Ala Ser Val Leu Leu Thr
            100                 105                 110
Gly Leu Leu Ser Leu Gln Arg Cys Leu Ala Val Thr Arg Pro Phe Leu
        115                 120                 125
Ala Pro Arg Leu Arg Ser Pro Ala Leu Ala Arg Arg Leu Leu Leu Ala
    130                 135                 140
Val Trp Leu Ala Ala Leu Leu Leu Ala Val Pro Ala Ala Val Tyr Arg
145                 150                 155                 160
His Leu Trp Arg Asp Arg Val Cys Gln Leu Cys His Pro Ser Pro Val
                165                 170                 175
His Ala Ala Ala His Leu Ser Leu Glu Thr Leu Thr Ala Phe Val Leu
            180                 185                 190
Pro Phe Gly Leu Met Leu Gly Cys Tyr Ser Val Thr Leu Ala Arg Leu
        195                 200                 205
Arg Gly Ala Arg Trp Gly Ser Gly Arg His Gly Ala Arg Val Gly Arg
    210                 215                 220
Leu Val Ser Ala Ile Val Leu Ala Phe Gly Leu Leu Trp Ala Pro Tyr
225                 230                 235                 240
His Ala Val Asn Leu Leu Gln Ala Val Ala Ala Leu Ala Pro Pro Glu
                245                 250                 255
Gly Ala Leu Ala Lys Leu Gly Gly Ala Gly Gln Ala Ala Arg Ala Gly
            260                 265                 270
Thr Thr Ala Leu Ala Phe Phe Ser Ser Ser Val Asn Pro Val Leu Tyr
        275                 280                 285
Val Phe Thr Ala Gly Asp Leu Leu Pro Arg Ala Gly Pro Arg Phe Leu
    290                 295                 300
Thr Arg Leu Phe Glu Gly Ser Gly Glu Ala Arg Gly Gly Gly Arg Ser
305                 310                 315                 320
Arg Glu Gly Thr Met Glu Leu Arg Thr Thr Pro Gln Leu Lys Val Val
                325                 330                 335
Gly Gln Gly Arg Gly Asn Gly Asp Pro Gly Gly Gly Met Glu Lys Asp
            340                 345                 350
Gly Pro Glu Trp Asp Leu
        355
(36)SEQ ID NO:35的资料:
(i)序列特征:
(A)长度:1005个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线形
(ii)分子类型:DNA(基因组的)
(xi)SEQ ID NO:35的序列描述:
ATGCTGGGGA TCATGGCATG GAATGCAACT TGCAAAAACT GGCTGGCAGC AGAGGCTGCC 60
CTGGAAAAGT ACTACCTTTC CATTTTTTAT GGGATTGAGT TCGTTGTGGG AGTCCTTGGA 120
AATACCATTG TTGTTTACGG CTACATCTTC TCTCTGAAGA ACTGGAACAG CAGTAATATT 180
TATCTCTTTA ACCTCTCTGT CTCTGACTTA GCTTTTCTGT GCACCCTCCC CATGCTGATA 240
AGGAGTTATG CCAATGGAAA CTGGATATAT GGAGACGTGC TCTGCATAAG CAACCGATAT 300
GTGCTTCATG CCAACCTCTA TACCAGCATT CTCTTTCTCA CTTTTATCAG CATAGATCGA 360
TACTTGATAA TTAAGTATCC TTTCCGAGAA CACCTTCTGC AAAAGAAAGA GTTTGCTATT 420
TTAATCTCCT TGGCCATTTG GGTTTTAGTA ACCTTAGAGT TACTACCCAT ACTTCCCCTT 480
ATAAATCCTG TTATAACTGA CAATGGCACC ACCTGTAATG ATTTTGCAAG TTCTGGAGAC 540
CCCAACTACA ACCTCATTTA CAGCATGTGT CTAACACTGT TGGGGTTCCT TATTCCTCTT 600
TTTGTGATGT GTTTCTTTTA TTACAAGATT GCTCTCTTCC TAAAGCAGAG GAATAGGCAG 660
GTTGCTACTG CTCTGCCCCT TGAAAAGCCT CTCAACTTGG TCATCATGGC AGTGGTAATC 720
TTCTCTGTGC TTTTTACACC CTATCACGTC ATGCGGAATG TGAGGATCGC TTCACGCCTG 780
GGGAGTTGGA AGCAGTATCA GTGCACTCAG GTCGTCATCA ACTCCTTTTA CATTGTGACA 840
CGGCCTTTGG CCTTTCTGAA CAGTGTCATC AACCCTGTCT TCTATTTTCT TTTGGGAGAT 900
CACTTCAGGG ACATGCTGAT GAATCAACTG AGACACAACT TCAAATCCCT TACATCCTTT 960
AGCAGATGGG CTCATGAACT CCTACTTTCA TTCAGAGAAA AGTGA                 1005
(37)SEQ ID NO:36的资料:
(i)序列特征:
(A)长度:334个氨基酸
(B)类型:氨基酸
(C)链型:
(D)拓扑学:不相关
(ii)分子类型:蛋白质
(xi)SEQ ID NO:36的序列描述:
Met Leu Gly Ile Met Ala Trp Asn Ala Thr Cys Lys Asn Trp Leu Ala
  1               5                  10                  15
Ala Glu Ala Ala Leu Glu Lys Tyr Tyr Leu Ser Ile Phe Tyr Gly Ile
             20                  25                  30
Glu Phe Val Val Gly Val Leu Gly Asn Thr Ile Val Val Tyr Gly Tyr
         35                  40                  45
Ile Phe Ser Leu Lys Asn Trp Asn Ser Ser Asn Ile Tyr Leu Phe Asn
     50                  55                  60
Leu Ser Val Ser Asp Leu Ala Phe Leu Cys Thr Leu Pro Met Leu Ile
 65                  70                  75                  80
Arg Ser Tyr Ala Asn Gly Asn Trp Ile Tyr Gly Asp Val Leu Cys Ile
                 85                  90                  95
Ser Asn Arg Tyr Val Leu His Ala Asn Leu Tyr Thr Ser Ile Leu Phe
            100                 105                 110
Leu Thr Phe Ile Ser Ile Asp Arg Tyr Leu Ile Ile Lys Tyr Pro Phe
        115                 120                 125
Arg Glu His Leu Leu Gln Lys Lys Glu Phe Ala Ile Leu Ile Ser Leu
    130                 135                 140
Ala Ile Trp Val Leu Val Thr Leu Glu Leu Leu Pro Ile Leu Pro Leu
145                 150                 155                 160
Ile Asn Pro Val Ile Thr Asp Asn Gly Thr Thr Cys Asn Asp Phe Ala
                165                 170                 175
Ser Ser Gly Asp Pro Asn Tyr Asn Leu Ile Tyr Ser Met Cys Leu Thr
            180                 185                 190
Leu Leu Gly Phe Leu Ile Pro Leu Phe Val Met Cys Phe Phe Tyr Tyr
        195                 200                 205
Lys Ile Ala Leu Phe Leu Lys Gln Arg Asn Arg Gln Val Ala Thr Ala
    210                 215                 220
Leu Pro Leu Glu Lys Pro Leu Asn Leu Val Ile Met Ala Val Val Ile
225                 230                 235                 240
Phe Ser Val Leu Phe Thr Pro Tyr His Val Met Arg Asn Val Arg Ile
                245                 250                 255
Ala Ser Arg Leu Gly Ser Trp Lys Gln Tyr Gln Cys Thr Gln Val Val
            260                 265                 270
Ile Asn Ser Phe Tyr Ile Val Thr Arg Pro Leu Ala Phe Leu Asn Ser
        275                 280                 285
Val Ile Asn Pro Val Phe Tyr Phe Leu Leu Gly Asp His Phe Arg Asp
    290                 295                 300
Met Leu Met Asn Gln Leu Arg His Asn Phe Lys Ser Leu Thr Ser Phe
305                 310                 315                 320
Ser Arg Trp Ala His Glu Leu Leu Leu Ser Phe Arg Glu Lys
                325                 330
(38)SEQ ID NO:37的资料:
(i)序列特征:
(A)长度:1296个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线形
(ii)分子类型:DNA(基因组的)
(xi)SEQ ID NO:37的序列描述:
ATGCAGGCGC TTAACATTAC CCCGGAGCAG TTCTCTCGGC TGCTGCGGGA CCACAACCTG 60
ACGCGGGAGC AGTTCATCGC TCTGTACCGG CTGCGACCGC TCGTCTACAC CCCAGAGCTG 120
CCGGGACGCG CCAAGCTGGC CCTCGTGCTC ACCGGCGTGC TCATCTTCGC CCTGGCGCTC 180
TTTGGCAATG CTCTGGTGTT CTACGTGGTG ACCCGCAGCA AGGCCATGCG CACCGTCACC 240
AACATCTTTA TCTGCTCCTT GGCGCTCAGT GACCTGCTCA TCACCTTCTT CTGCATTCCC 300
GTCACCATGC TCCAGAACAT TTCCGACAAC TGGCTGGGGG GTGCTTTCAT TTGCAAGATG 360
GTGCCATTTG TCCAGTCTAC CGCTGTTGTG ACAGAAATGC TCACTATGAC CTGCATTGCT 420
GTGGAAAGGC ACCAGGGACT TGTGCATCCT TTTAAAATGA AGTGGCAATA CACCAACCGA 480
AGGGCTTTCA CAATGCTAGG TGTGGTCTGG CTGGTGGCAG TCATCGTAGG ATCACCCATG 540
TGGCACGTGC AACAACTTGA GATCAAATAT GACTTCCTAT ATGAAAAGGA ACACATCTGC 600
TGCTTAGAAG AGTGGACCAG CCCTGTGCAC CAGAAGATCT ACACCACCTT CATCCTTGTC 660
ATCCTCTTCC TCCTGCCTCT TATGGTGATG CTTATTCTGT ACAGTAAAAT TGGTTATGAA 720
CTTTGGATAA AGAAAAGAGT TGGGGATGGT TCAGTGCTTC GAACTATTCA TGGAAAAGAA 780
ATGTCCAAAA TAGCCAGGAA GAAGAAACGA GCTGTCATTA TGATGGTGAC AGTGGTGGCT 840
CTCTTTGCTG TGTGCTGGGC ACCATTCCAT GTTGTCCATA TGATGATTGA ATACAGTAAT 900
TTTGAAAAGG AATATGATGA TGTCACAATC AAGATGATTT TTGCTATCGT GCAAATTATT 960
GGATTTTCCA ACTCCATCTG TAATCCCATT GTCTATGCAT TTATGAATGA AAACTTCAAA 1020
AAAAATGTTT TGTCTGCAGT TTGTTATTGC ATAGTAAATA AAACCTTCTC TCCAGCACAA 1080
AGGCATGGAA ATTCAGGAAT TACAATGATG CGGAAGAAAG CAAAGTTTTC CCTCAGAGAG 1140
AATCCAGTGG AGGAAACCAA AGGAGAAGCA TTCAGTGATG GCAACATTGA AGTCAAATTG 1200
TGTGAACAGA CAGAGGAGAA GAAAAAGCTC AAACGACATC TTGCTCTCTT TAGGTCTGAA 1260
CTGGCTGAGA ATTCTCCTTT AGACAGTGGG CATTAA                           1296
(39)SEQ ID NO:38的资料:
(i)序列特征:
(A)长度:431个氨基酸
(B)类型:氨基酸
(C)链型:
(D)拓扑学:不相关
(ii)分子类型:蛋白质
(xi)SEQ ID NO:38的序列描述:
Met Gln Ala Leu Asn Ile Thr Pro Glu Gln Phe Ser Arg Leu Leu Arg
  1               5                  10                  15
Asp His Asn Leu Thr Arg Glu Gln Phe Ile Ala Leu Tyr Arg Leu Arg
             20                  25                  30
Pro Leu Val Tyr Thr Pro Glu Leu Pro Gly Arg Ala Lys Leu Ala Leu
         35                  40                  45
Val Leu Thr Gly Val Leu Ile Phe Ala Leu Ala Leu Phe Gly Asn Ala
     50                  55                  60
Leu Val Phe Tyr Val Val Thr Arg Ser Lys Ala Met Arg Thr Val Thr
 65                  70                  75                  80
Asn Ile Phe Ile Cys Ser Leu Ala Leu Ser Asp Leu Leu Ile Thr Phe
                 85                  90                  95
Phe Cys Ile Pro Val Thr Met Leu Gln Asn Ile Ser Asp Asn Trp Leu
            100                 105                 110
Gly Gly Ala Phe Ile Cys Lys Met Val Pro Phe Val Gln Ser Thr Ala
        115                 120                 125
Val Val Thr Glu Met Leu Thr Met Thr Cys Ile Ala Val Glu Arg His
    130                 135                 140
Gln Gly Leu Val His Pro Phe Lys Met Lys Trp Gln Tyr Thr Asn Arg
145                 150                 155                 160
Arg Ala Phe Thr Met Leu Gly Val Val Trp Leu Val Ala Val Ile Val
                165                 170                 175
Gly Ser Pro Met Trp His Val Gln Gln Leu Glu Ile Lys Tyr Asp Phe
            180                 185                 190
Leu Tyr Glu Lys Glu His Ile Cys Cys Leu Glu Glu Trp Thr Ser Pro
        195                 200                 205
Val His Gln Lys Ile Tyr Thr Thr Phe Ile Leu Val Ile Leu Phe Leu
    210                 215                 220
Leu Pro Leu Met Val Met Leu Ile Leu Tyr Ser Lys Ile Gly Tyr Glu
225                 230                 235                 240
Leu Trp Ile Lys Lys Arg Val Gly Asp Gly Ser Val Leu Arg Thr Ile
                245                 250                 255
His Gly Lys Glu Met Ser Lys Ile Ala Arg Lys Lys Lys Arg Ala Val
            260                 265                 270
Ile Met Met Val Thr Val Val Ala Leu Phe Ala Val Cys Trp Ala Pro
        275                 280                 285
Phe His Val Val His Met Met Ile Glu Tyr Ser Asn Phe Glu Lys Glu
    290                 295                 300
Tyr Asp Asp Val Thr Ile Lys Met Ile Phe Ala Ile Val Gln Ile Ile
305                 310                 315                 320
Gly Phe Ser Asn Ser Ile Cys Asn Pro Ile Val Tyr Ala Phe Met Asn
                325                 330                 335
Glu Asn Phe Lys Lys Asn Val Leu Ser Ala Val Cys Tyr Cys Ile Val
            340                 345                 350
Asn Lys Thr Phe Ser Pro Ala Gln Arg His Gly Asn Ser Gly Ile Thr
        355                 360                 365
Met Met Arg Lys Lys Ala Lys Phe Ser Leu Arg Glu Asn Pro Val Glu
    370                 375                 380
Glu Thr Lys Gly Glu Ala Phe Ser Asp Gly Asn Ile Glu Val Lys Leu
385                 390                 395                 400
Cys Glu Gln Thr Glu Glu Lys Lys Lys Leu Lys Arg His Leu Ala Leu
                405                 410                 415
Phe Arg Ser Glu Leu Ala Glu Asn Ser Pro Leu Asp Ser Gly His
            420                 425                 430
(40)SEQ ID NO:39的资料:
(i)序列特征:
(A)长度:24个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线形
(ii)分子类型:DNA(基因组的)
(xi)SEQ ID NO:39的序列描述:
CTGTGTACAG CAGTTCGCAG AGTG                        24
(41)SEQ ID NO:40的资料:
(i)序列特征:
(A)长度:24个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线形
(ii)分子类型:DNA(基因组的)
(xi)SEQ ID NO:40的序列描述:
GAGTGCCAGG CAGAGCAGGT AGAC                        24
(42)SEQ ID NO:41的资料:
(i)序列特征:
(A)长度:31个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线形
(ii)分子类型:DNA(基因组的)
(iv)反义:否
(xi)SEQ ID NO:41的序列描述:
CCCGAATTCC TGCTTGCTCC CAGCTTGGCC C                31
(43)SEQ ID NO:42的资料:
(i)序列特征:
(A)长度:32个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线形
(ii)分子类型:DNA(基因组的)
(iv)反义:是
(xi)SEQ ID NO:42的序列描述:
TGTGGATCCT GCTGTCAAAG GTCCCATTCC GG               32
(44)SEQ ID NO:43的资料:
(i)序列特征:
(A)长度:20个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线形
(ii)分子类型:DNA(基因组的)
(iv)反义:否
(xi)SEQ ID NO:43的序列描述:
TCACAATGCT AGGTGTGGTC                             20
(45)SEQ ID NO:44的资料:
(i)序列特征:
(A)长度:22个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线形
(ii)分子类型:DNA(基因组的)
(iv)反义:是
(xi)SEQ ID NO:44的序列描述:
TGCATAGACA ATGGGATTAC AG                          22
(46)SEQ ID NO:45的资料:
(i)序列特征:
(A)长度:511个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线形
(ii)分子类型:DNA(基因组的)
(xi)SEQ ID NO:45的序列描述:
TCACAATGCT AGGTGTGGTC TGGCTGGTGG CAGTCATCGT AGGATCACCC ATGTGGCACG 60
TGCAACAACT TGAGATCAAA TATGACTTCC TATATGAAAA GGAACACATC TGCTGCTTAG 120
AAGAGTGGAC CAGCCCTGTG CACCAGAAGA TCTACACCAC CTTCATCCTT GTCATCCTCT 180
TCCTCCTGCC TCTTATGGTG ATGCTTATTC TGTACGTAAA ATTGGTTATG AACTTTGGAT 240
AAAGAAAAGA GTTGGGGATG GTTCAGTGCT TCGAACTATT CATGGAAAAG AAATGTCCAA 300
AATAGCCAGG AAGAAGAAAC GAGCTGTCAT TATGATGGTG ACAGTGGTGG CTCTCTTTGC 360
TGTGTGCTGG GCACCATTCC ATGTTGTCCA TATGATGATT GAATACAGTA ATTTTGAAAA 420
GGAATATGAT GATGTCACAA TCAAGATGAT TTTTGCTATC GTGCAAATTA TTGGATTTTC 480
CAACTCCATC TGTAATCCCA TTGTCTATGC A                                511
(47)SEQ ID NO:46的资料:
(i)序列特征:
(A)长度:21个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线形
(ii)分子类型:DNA(基因组的)
(iv)反义:否
(xi)SEQ ID NO:46的序列描述:
CTGCTTAGAA GAGTGGACCA G                           21
(48)SEQ ID NO:47的资料:
(i)序列特征:
(A)长度:22个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线形
(ii)分子类型:DNA(基因组的)
(iv)反义:否
(xi)SEQ ID NO:47的序列描述:
CTGTGCACCA GAAGATCTAC AC                          22
(49)SEQ ID NO:48的资料:
(i)序列特征:
(A)长度:21个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线形
(ii)分子类型:DNA(基因组的)
(iv)反义:是
(xi)SEQ ID NO:48的序列描述:
CAAGGATGAA GGTGGTGTAG A                           21
(50)SEQ ID NO:49的资料:
(i)序列特征:
(A)长度:23个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线形
(ii)分子类型:DNA(基因组的)
(iv)反义:是
(xi)SEQ ID NO:49的序列描述:
GTGTAGATCT TCTGGTGCAC AGG                         23
(51)SEQ ID NO:50的资料:
(i)序列特征:
(A)长度:21个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线形
(ii)分子类型:DNA(基因组的)
(xi)SEQ ID NO:50的序列描述:
GCAATGCAGG TCATAGTGAG C                           21
(52)SEQ ID NO:51的资料:
(i)序列特征:
(A)长度:27个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线形
(ii)分子类型:DNA(基因组的)
(iii)推定的:是
(iv)反义:是
(xi)SEQ ID NO:51的序列描述:
TGGAGCATGG TGACGGGAAT GCAGAAG                     27
(53)SEQ ID NO:52的资料:
(i)序列特征:
(A)长度:27个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线形
(ii)分子类型:DNA(基因组的)
(iv)反义:是
(xi)SEQ ID NO:52的序列描述:
GTGATGAGCA GGTCACTGAG CGCCAAG                     27
(54)SEQ ID NO:53的资料:
(i)序列特征:
(A)长度:23个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线形
(ii)分子类型:DNA(基因组的)
(iv)反义:否
(xi)SEQ ID NO:53的序列描述:
GCAATGCAGG CGCTTAACAT TAC                         23
(55)SEQ ID NO:54的资料:
(i)序列特征:
(A)长度:22个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线形
(ii)分子类型:DNA(基因组的)
(iv)反义:是
(xi)SEQ ID NO:54的序列描述:
TTGGGTTACA ATCTGAAGGG CA                          22
(56)SEQ ID NO:55的资料:
(i)序列特征:
(A)长度:23个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线形
(ii)分子类型:DNA(基因组的)
(iv)反义:否
(xi)SEQ ID NO:55的序列描述:
ACTCCGTGTC CAGCAGGACT CTG                         23
(57)SEQ ID NO:56的资料:
(i)序列特征:
(A)长度:24个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线形
(ii)分子类型:DNA(基因组的)
(iv)反义:是
(xi)SEQ ID NO:56的序列描述:
TGCGTGTTCC TGGACCCTCA CGTG                        24
(58)SEQ ID NO:57的资料:
(i)序列特征:
(A)长度:29个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线形
(ii)分子类型:DNA(基因组的)
(iv)反义:否
(xi)SEQ ID NO:57的序列描述:
CAGGCCTTGG ATTTTAATGT CAGGGATGG                   29
(59)SEQ ID NO:58的资料:
(i)序列特征:
(A)长度:27个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线形
(ii)分子类型:DNA(基因组的)
(iv)反义:是
(xi)SEQ ID NO:58的序列描述:
GGAGAGTCAG CTCTGAAAGA ATTCAGG                     27
(60)SEQ ID NO:59的资料:
(i)序列特征:
(A)长度:27个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线形
(ii)分子类型:DNA(基因组的)
(iv)反义:否
(xi)SEQ ID NO:59的序列描述:
TGATGTGATG CCAGATACTA ATAGCAC                     27
(61)SEQ ID NO:60的资料:
(i)序列特征:
(A)长度:27个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线形
(ii)分子类型:DNA(基因组的)
(iv)反义:是
(xi)SEQ ID NO:60的序列描述:
CCTGATTCAT TTAGGTGAGA TTGAGAC                     27
(62)SEQ ID NO:61的资料:
(i)序列特征:
(A)长度:22个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线形
(ii)分子类型:DNA(基因组的)
(iv)反义:否
(xi)SEQ ID NO:61的序列描述:
GACAGGTACC TTGCCATCAA G                           21
(63)SEQ ID NO:62的资料:
(i)序列特征:
(A)长度:22个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线形
(ii)分子类型:DNA(基因组的)
(iv)反义:是
(xi)SEQ ID NO:62的序列描述:
CTGCACAATG CCAGTGATAA GG                          22
(64)SEQ ID NO:63的资料:
(i)序列特征:
(A)长度:27个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线形
(ii)分子类型:DNA(基因组的)
(iv)反义:否
(xi)SEQ ID NO:63的序列描述:
CTGACTTCTT GTTCCTGGCA GCAGCGG                     27
(65)SEQ ID NO:64的资料:
(i)序列特征:
(A)长度:27个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线形
(ii)分子类型:DNA(基因组的)
(iv)反义:是
(xi)SEQ ID NO:64的序列描述:
AGACCAGCCA GGGCACGCTG AAGAGTG                     27
(66)SEQ ID NO:65的资料:
(i)序列特征:
(A)长度:32个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线形
(ii)分子类型:DNA(基因组的)
(iv)反义:否
(xi)SEQ ID NO:65的序列描述:
GATCAAGCTT CCATCCTACT GAAACCATGG TC               32
(67)SEQ ID NO:66的资料:
(i)序列特征:
(A)长度:35个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线形
(ii)分子类型:DNA(基因组的)
(iv)反义:是
(xi)SEQ ID NO:66的序列描述:
GATCAGATCT CAGTTCCAAT ATTCACACCA CCGTC            35
(68)SEQ ID NO:67的资料:
(i)序列特征:
(A)长度:22个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线形
(ii)分子类型:DNA(基因组的)
(iv)反义:否
(xi)SEQ ID NO:67的序列描述:
CTGGTGTGCT CCATGGCATC CC                          22
(69)SEQ ID NO:68的资料:
(i)序列特征:
(A)长度:22个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线形
(ii)分子类型:DNA(基因组的)
(iv)反义:是
(xi)SEQ ID NO:68的序列描述:
GTAAGCCTCC CAGAACGAGA GG                          22
(70)SEQ ID NO:69的资料:
(i)序列特征:
(A)长度:24个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线形
(ii)分子类型:DNA(基因组的)
(iv)反义:否
(xi)SEQ ID NO:69的序列描述:
CAGCGCAGGG TGAAGCCTGA GAGC                        24
(71)SEQ ID NO:70的资料:
(i)序列特征:
(A)长度:24个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线形
(ii)分子类型:DNA(基因组的)
(iv)反义:是
(xi)SEQ ID NO:70的序列描述:
GGCACCTGCT GTGACCTGTG CAGG                        24
(72)SEQ ID NO:71的资料:
(i)序列特征:
(A)长度:22个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线形
(ii)分子类型:DNA(基因组的)
(iv)反义:否
(xi)SEQ ID NO:71的序列描述:
GTCCTGCCAC TTCGAGACAT GG                          22
(73)SEQ ID NO:72的资料:
(i)序列特征:
(A)长度:23个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(iv)反义:是
(xi)SEQ ID NO:72的序列描述:
GAAACTTCTC TGCCCTTACC GTC                         23
(74)SEQ ID NO:73的资料:
(i)序列特征:
(A)长度:26个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线形
(ii)分子类型:DNA(基因组的)
(iv)反义:否
(xi)SEQ ID NO:73的序列描述:
CCAACACCAG CATCCATGGC ATCAAG                      26
(75)SEQ ID NO:74的资料:
(i)序列特征:
(A)长度:27个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑学:线形
(ii)分子类型:DNA(基因组)
(iv)反义:是
(xi)SEQ ID NO:74的序列描述:
GGAGAGTCAG CTCTGAAAGA ATTCAGG                     27

Claims (4)

1.编码人G蛋白偶联受体的cDNA,其包含SEQ.ID.NO.:7。
2.由SEQ.ID.NO.:7所示的cDNA编码的人G蛋白偶联受体,其包含SEQ.ID.NO.:8。
3.含有载体和SEQ.ID.NO.:7所示的cDNA的质粒。
4.含有权利要求3所述的质粒的宿主细胞。
CNA2009101335181A 1998-11-20 1999-10-13 与人g蛋白偶联的孤儿受体 Pending CN101597608A (zh)

Applications Claiming Priority (24)

Application Number Priority Date Filing Date Title
US10921398P 1998-11-20 1998-11-20
US60/109,213 1998-11-20
US60/120,416 1999-02-16
US60/121,852 1999-02-26
US60/123,946 1999-03-12
US60/123,949 1999-03-12
US60/136,439 1999-05-28
US60/136,567 1999-05-28
US60/137,127 1999-05-28
US60/137,131 1999-05-28
US60/136,437 1999-05-28
US60/136,436 1999-05-28
US60/141,448 1999-06-29
US60/156,653 1999-09-29
US60/156,633 1999-09-29
US60/156,634 1999-09-29
US60/156,555 1999-09-29
US60/157,280 1999-10-01
US60/157,281 1999-10-01
US60/157,294 1999-10-01
US60/157,282 1999-10-01
US60/157,293 1999-10-01
US09/417,044 1999-10-12
US09/416,760 1999-10-12

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN 99812713 Division CN1344319A (zh) 1998-11-20 1999-10-13 与人g蛋白偶联的孤儿受体

Publications (1)

Publication Number Publication Date
CN101597608A true CN101597608A (zh) 2009-12-09

Family

ID=37608885

Family Applications (5)

Application Number Title Priority Date Filing Date
CNA2009101335181A Pending CN101597608A (zh) 1998-11-20 1999-10-13 与人g蛋白偶联的孤儿受体
CN 200610091125 Pending CN1912117A (zh) 1998-11-20 1999-10-13 与人g蛋白偶联的孤儿受体
CN 200610091126 Pending CN1912122A (zh) 1998-11-20 1999-10-13 与人g蛋白偶联的孤儿受体
CN 200610002292 Pending CN1896237A (zh) 1998-11-20 1999-10-13 与人g蛋白偶联的孤儿受体
CN 200610091124 Pending CN1912121A (zh) 1998-11-20 1999-10-13 与人g蛋白偶联的孤儿受体

Family Applications After (4)

Application Number Title Priority Date Filing Date
CN 200610091125 Pending CN1912117A (zh) 1998-11-20 1999-10-13 与人g蛋白偶联的孤儿受体
CN 200610091126 Pending CN1912122A (zh) 1998-11-20 1999-10-13 与人g蛋白偶联的孤儿受体
CN 200610002292 Pending CN1896237A (zh) 1998-11-20 1999-10-13 与人g蛋白偶联的孤儿受体
CN 200610091124 Pending CN1912121A (zh) 1998-11-20 1999-10-13 与人g蛋白偶联的孤儿受体

Country Status (1)

Country Link
CN (5) CN101597608A (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104351880A (zh) * 2014-12-12 2015-02-18 广西职业技术学院 一种无糖刺梨口服液
CN107794267B (zh) * 2017-03-14 2021-03-26 湖南大学 一种靶向pd1-pdl1的双特异性核酸适体及其衍生物

Also Published As

Publication number Publication date
CN1912122A (zh) 2007-02-14
CN1896237A (zh) 2007-01-17
CN1912117A (zh) 2007-02-14
CN1912121A (zh) 2007-02-14

Similar Documents

Publication Publication Date Title
KR100765039B1 (ko) 사람의 오르판 g 단백질과 커플링된 수용체
US20030017528A1 (en) Human orphan G protein-coupled receptors
CA2348688A1 (en) Non-endogenous, constitutively activated human g protein-coupled receptors
WO1996005302A1 (en) G protein coupled receptor protein, production, and use thereof
CN101597608A (zh) 与人g蛋白偶联的孤儿受体
US8198049B2 (en) Nucleic acids encoding RUP3 and methods of using same
AU770871B2 (en) Non-endogenous, constitutively activated human G protein-coupled receptors
US20030018182A1 (en) Non-endogenous, constitutively activated human G protein-coupled receptors
US20030229216A1 (en) Constitutively activated human G protein coupled receptors
MXPA01005021A (en) Human orphan g protein-coupled receptors
MXPA01003726A (en) Non-endogenous, constitutively activated human g protein-coupled receptors
USRE42190E1 (en) Method of identifying a compound for inhibiting or stimulating human G protein-coupled receptors
CN1439053A (zh) 非内源的被组成型活化的人g蛋白偶联的受体

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20091209