CN1154735C - 哺乳动物的特洛德样基因和蛋白质 - Google Patents

哺乳动物的特洛德样基因和蛋白质 Download PDF

Info

Publication number
CN1154735C
CN1154735C CNB998065471A CN99806547A CN1154735C CN 1154735 C CN1154735 C CN 1154735C CN B998065471 A CNB998065471 A CN B998065471A CN 99806547 A CN99806547 A CN 99806547A CN 1154735 C CN1154735 C CN 1154735C
Authority
CN
China
Prior art keywords
gly
ser
glu
asp
ala
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB998065471A
Other languages
English (en)
Other versions
CN1302332A (zh
Inventor
Ds
D·S·格林斯潘
I·C·斯科特
C·L·托马斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wisconsin Alumni Research Foundation
Original Assignee
Wisconsin Alumni Research Foundation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wisconsin Alumni Research Foundation filed Critical Wisconsin Alumni Research Foundation
Publication of CN1302332A publication Critical patent/CN1302332A/zh
Application granted granted Critical
Publication of CN1154735C publication Critical patent/CN1154735C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/475Growth factors; Growth regulators
    • C07K14/51Bone morphogenetic factor; Osteogenins; Osteogenic factor; Bone-inducing factor
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Toxicology (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Orthopedic Medicine & Surgery (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本发明提供了编码与人或小鼠BMP-1/mTld不同且与人或小鼠mTll-1不同的特洛德样蛋白的哺乳动物基因。该基因在结构上与BMP-1家族成员的基因相似,但是在基因图谱中位于不同的位置,并编码了具有不同活性的不同蛋白。该基因编码的蛋白质可用来筛选抑制BMP-1家族基因活性以防止结疤、纤维变性等疾病的治疗剂。

Description

哺乳动物的特洛德样基因和蛋白质
                     相关申请交叉文献
本申请要求了1998年12月11日提交的美国临时申请No.60/111,873和1998年4月3日提交的美国临时申请No.60/080,550的优先权。各申请均全部纳入本文作参考。
              关于联邦政府赞助的研究或开发的声明
有待决定。
                         发明背景
本发明涉及骨形态生成蛋白领域,更具体地涉及BMP-1/Tld家族中的基因和蛋白质。
哺乳动物如小鼠和人骨骼的形成受到一系列骨形态生成蛋白(BMP)的控制。在参与成骨的7种已知BMP中,6种(称为BPM-2到BMP-7)属于TGF-β超家族。第7种BMP(称为BMP-1)并不象TGF-β,而看来衍生自不同的基因家族。BMP-1基因家族成员通常含有下列结构域:虾红素样金属蛋白酶结构域,一个或多个在其它蛋白中被认为与Ca++结合的EGF样基序,以及多个CUB结构域。CUB结构域是介导补体成分Clr/Cls中蛋白之间相互作用的一种基序,也已明确它存在于各种参与发育过程的蛋白中。Wozney,J.M.等在 Science 242:1528-1534(1988)中描述了BMP-1的核苷酸序列。
其它非哺乳类动物中发现的蛋白质中也具有哺乳动物BMP-1结构域的结构。这些蛋白质包括果蝇属特洛德(tolloid)(Tld)(Shimell,M.J.,Cell 67:469-481(1991))、特洛德样果蝇属基因产物(Tlr-1或tolkin)(Nguyen,T., Dev.Biol.166:569-586(1994)和Finelli,A.L.,等, Genetics 141:271-281(1995))、海胆BMP-1同系物(suBMP-1)(Hwang,S.-P.,等,Development 120:559-568(1994))、两种相关的海胆发育基因产物SpAN和BP10(Reynolds,S.D.,等, Development 114:769-786(1992)和Lepage,T.,等,Development 114:147-164(1992))、爪蟾属(Xenopus)BMP-1(xBMP-1)(Maeno,M.等,Gene 134:257-261(1993)、爪蟾属特洛德(Lin.J.等人,Develop.Growth Differ.39:43-51(1997))、称为索洛德(xolloid)的特洛德样爪蟾属基因产物(Piccolo,S.等人,Cell91:407-416(1997))、分离自斑马鱼的称为斑马鱼特洛德的该家族相关成员(Bladder,P.等人,Science 278:1937-1940(1997))、哺乳动物特洛德(mTld)(Takahara,K.等, J.Biol. Chem.269:32572-32578(1994))和哺乳动物特洛德样基因(mTll-1)(Takahara,K.等人,Genomics 34:157-165(1996))。编码这些蛋白质的基因的一些核酸序列是已知的。哺乳动物BMP1基因既编码BMP-1蛋白,又编码mTld蛋白,尽管靠的是两个不同的可变剪接的mRNA分子。本段中提到的论文均纳入本文作参考。
                         发明概述
本发明概括地描述了一种新的哺乳动物特洛德样基因产物(mTll-2)及其关联的聚核苷酸基因mTLL-2,该基因与mTld以及其它所有已知的与BMP-1有关的基因产物及其关联的聚核苷酸(包括mTll(现在称为mTll-1))不同。本文的SEQ ID NO:1和SEQ ID NO:3分别报道了该基因的人和小鼠版本。其各自编码的氨基酸序列分别显示在SEQ ID NO:2和SEQ ID NO:4中。
本发明的一个目的是提供参与脊椎动物中胞外基质沉积(如成骨)的基因和基因产物。
本发明的另一个目的是为合理地开发出抑制特洛德样基因活性治疗纤维变性、结疤、瘢痕瘤、手术粘连等的药物提供靶分子。
本发明还有一个目的是提供一种重组DNA构建物、以及该构建物所编码的、用来加速伤口和骨折愈合的蛋白质。
本发明还有一个目的是提供对人染色体10的10q24区域以及小鼠染色体19的远端作图谱的标记。
本发明还有一个目的是提供作为探测哺乳动物细胞中非BMP-1骨形态生成蛋白基因的探针的核苷酸序列。
本发明的其它目的、特征和优点在参照附图进行下列详细叙述时将会更为清晰。
                         附图简述
图1A-1C(合称“图1”)比较了本发明公开的mTll-2人基因(htll-2)和鼠基因(mtll-2)的推导氨基酸序列与人mTld(人特洛德)以及人mTll-1(htll)基因的推导氨基酸序列。序列对比用PileUp程序(Genetics Computer Group,Madison,Wisconsin)进行,GAP加权值为12,长度加权值为4。蛋白质结构域的近似终点如临时申请60/080,550中所示,该申请纳入本文作参考。
                         发明详述
哺乳动物特洛德样2(mTll-2)是以骨形态发生蛋白-1(BMP-1)为原型的虾红素样蛋白酶超家族中在基因水平上有所不同的成员。该蛋白酶超家族还包括哺乳动物特洛德(mTld)和哺乳动物特洛德样-1(mTll-1;以前称为mTll),该超家族在发育和稳态过程中在伤口愈合中、以及诸如纤维变性等病理过程中起关键的控制作用。编码mTll-2的基因具有与BMP-1家族其它成员不同的空间上和时间上的表达分布图,经对发育者、成年人和小鼠组织的RNA进行Northern和Master印迹(Clontech)确证,它在成年人和正发育的心脏软组织中表达的水平最高。本文列举的mTll-2基因特别可与BMP-1基因家族其它成员区别之处在于编码序列的3′端(编码mTll-2蛋白质的羧基端17个氨基酸)以及编码蛋白质前区(proregion)的部分。同样,其蛋白质也能与该家族中的其它蛋白质区分开来。
本发明者已经确定,与BMP-1、mTld和mTll-1不同,mTll-2并不是前胶原C-蛋白酶,并且不切割chordin。mTll-2将前赖氨酰氧化酶切割成成熟的活性形式的作用较弱。该蛋白质还可能切割参与基质沉淀、发育、体内平衡、伤口愈合和疾病的其它底物。同样,mTll-2蛋白最优切割的底物子集(subset)也与BMP-1、mTld以及mTll-1最优切割的底物子集不同,尽管这些蛋白的底物特异性有部分重叠。mTll-2是抗纤维变性药的潜在靶标,它可能会促进各种组织的愈合,并且还可用来研究发育和疾病过程和鉴定其功能性抑制剂。mTll-2的抑制可能会抑制纤维变性、过度结疤、或正常愈合或发育的其它紊乱。重组mTll-2(或其关联的核酸)可用于评价发育、疾病过程和治疗性干预的系统。
mTll-2蛋白可通过激活生长因子和形态发生素起作用。因此,如果外源性加入(或如果将其同源核酸加入细胞内,例如在基因治疗中),它可能加速愈合。
编码mTll-2的多核苷酸(例如基因组DNA、信使RNA和对应于信使RNA的cDNA)可用对应于以前报道的虾红素金属蛋白酶催化域保守区的引物,在合适的扩增条件下,从含有哺乳动物多核苷酸的模板文库扩增获得。下列的简并寡核苷酸引物(用标准IUPAC命名法显示)适合获得mTll-2基因的一部分,本发明者认为它们是较佳的:
引物1(正向):
5′-CARGC MATGM GNCAC TGGGAG-3′(SEQ ID NO:5)
引物2(正向):
5′-CARGC MATGMGN CACTG GGAA-3′(SEQ ID NO:6)
引物3(反向):
5′GAADG TGTTVC KNGCRT ARTGC-3′(SEQ ID N0:7)
含有哺乳动物多核苷酸的合适的模板文库宜为性交后7天的小鼠胚胎或人胎盘的未扩增cDNA的合并物。此合并物中的cDNA宜用RT-PCR扩增的RNA来制备。合适的人和小鼠胎盘和胚胎cDNA合并物购自Clontech。模板cDNA的来源并不关键,只要该cDNA合并物包括至少一个能如所述那样扩增的模板序列即可。其它合适的模板包括,但不局限于,器官特异性的或其它类型的cDNA合并物或文库或基因组DNA或文库。
合适的扩增条件在下文实施例中有所描述,但是本领域技术人员能确定与本文报告的那些有所不同的可接受的条件。一旦获得了最初的PCR产物,就可用它来进行平板筛选cDNA或基因组文库。
可能需要分开建立编码mTll-2的cDNA序列的5′或3′端,例如采用只选择性扩增5′或3′端cDNA序列的方法,例如3′简并PCR或cDNA末端的迅速扩增方法(“RACE”),该方法在Frohman,M.A.″迅速扩增互补DNA末端来产生全长互补DNA:加热RACE法″,Methods in Enzymology(Wu,R.编),218卷,340-362页,Academic Press,New York(1991),该文全部纳入本文作参考。
市售的5′和3′RACE扩增系统购自Clontech。适合5′和3′RACE的引物可从上述用简并引物进行最初PCR时获得的扩增cDNA序列,或通过筛选cDNA或基因组DNA文库获得的cDNA克隆序列推导出来。在较佳的实施方案中,根据平板筛选分离出的1.6kb cDNA 5′端设计的嵌套PCR的引物如下:
引物4 5′-TGTGGTGTCT GGGCTGCTCT CAGATGC-3′(SEQ ID NO:8)
引物5 5′-ACTGTCTGCT TGGTCCAGTC TCTGG-3′(SEQ ID NO:9)
对于3′-简并PCR,合适的嵌套引物对应于平板筛选分离的cDNA 3′端序列,合适的简并引物对应于在BMP-1/特洛德样蛋白CUB结构域5中发现的保守序列。合适的引物包括:
引物6 5′-TACCTGGAAG TCCGGGATGG CCCCACG-3′(SEQ ID NO:10)
引物7 5′-GAGGATGTGA AATCGAGCTC CAACAGAC-3′(SEQ ID NO:11)
引物8-11(简并引物)
5′-RAANCCYTTYTTNNNDATNGTRTCRTC-3′(SEQ ID NO:12)
对于3′RACE,对应于用3′-简并PCR扩增的cDNA片段3′端序列的合适的嵌套PCR引物是:
引物12 5′-CAACAACTAC CCGAGCGAGG CCCC-3′(SEQ ID NO:13)
引物13 5′-GAAGCCTACG ACGGCTACGA CAGCTC-3′(SEQ ID NO:14)
本领域技术人员可将分开克隆的序列连接在一起,正如本发明者所做的那样,从人获得完整的全长cDNA,如SEQ ID NO:1所示。SEQ ID NO:1所示的是侧接了5′和3′非翻译序列的一个开放读框。该开放读框编码了称为mTll-2的哺乳动物特洛德样蛋白。该人mTll-2基因的基因图谱位于人染色体10q24。
SEQ ID NO:3显示了从小鼠源获得的第二种mTll-2基因。SEQ ID NO:4中报道了该小鼠mTll-基因编码的对应蛋白。该鼠版本基因与人mTll-2基因对应之处在于两者均具有相似的核酸和氨基酸序列。还不知道鼠mTll-2基因在鼠染色体基因图谱中在何位置。
如果DNA制品中已经除去了90%以上任何有DNA的宿主细胞的细胞物质,则认为任何来源的含有mTll-2基因序列的DNA分子制品是基本上纯的。例如,细胞物质可利用市售纯化试剂盒(如购自Qiagen(Chatsworth,CA)的试剂盒)从核酸制品中除去。较佳的是,核酸制品中超过10%的核酸分子含有全部或部分mTll-2基因。更佳的是,超过50%,甚至还要佳的是超过90%的核酸分子含有mTll-2基因全部或部分序列。
鉴于与其它特洛德样蛋白质的相似性,预计本发明公开的mTll-2基因所编码的产物将在发育以及体内平衡过程(如伤口愈合)中起关键作用。该蛋白参与胞外基质前体成熟为大分子结构(例如通过激活前赖氨酰氧化酶)。该蛋白还可能在体内和体外激活生长因子中起一定作用,当将有效量的蛋白质给予组织时,它可能会促进发育和体内平衡过程。另一方面,如果mTll-2蛋白质功能被抑制,这些过程本身可能被抑制,通过输送有效量的抑制剂就可有利地利用该特性来防止纤维变性和过度结疤或其它伤口愈合的异常情况。通过测试某剂量范围的该蛋白质对所选的认为在生物化学或生理学上类似于人的脊椎动物或模型动物的作用,就容易确定待输送给靶部位以激活发育和体内平衡特性的该蛋白质的有效量。例如,就皮肤或心脏伤口愈合或发育而言,猪皮肤或心脏是人皮肤和心脏的合适模型。大鼠或家兔心脏也是可以接受的系统。
同样,也可确定mTll-2蛋白抑制剂的有效量。有效量是指在给予后能比未治疗动物有效减少纤维变性、结疤或瘢痕瘤发生的用量,其中根据临床或兽医所接受的标准来评估上述病症。这种测试宜在通常被视为与人皮肤、心脏或其它受累组织有关的模型系统中进行。
由于该蛋白质在动物组织中的含量通常非常少,因此BMP系统蛋白质的工作能力受到阻遏。一种以前未知的基因,mTll-2,可以克隆入含有(在合适哺乳动物或昆虫宿主细胞内)有效的转录启动子的合适表达载体中,继而导入合适的(哺乳动物或昆虫)宿主细胞并在其中表达,并以天然构型纯化,所有这些均采用常规方法。可将cDNA插入可整合的(例如pCDNA3.1型)或游离型(例如pCEP4型)载体中,并在合适培养的哺乳动物细胞(如分别为293人胚肾细胞或2930EBNA细胞)中表达。pCDNA3.1和pCEP4载体(以及有关载体)购自Invitrogen。载体序列和载体的限制性图谱均从Invitrogen获得。cDNA还可插入杆状病毒载体(如BacPAK 6,购自Clontech)。
这样表达的蛋白质可保留在宿主细胞内,或可以分泌到胞外生长培养基中(如果构建物有合适的信号序列的话)。该蛋白质可用常规的方法从细胞或生长培养基中纯化获得。重组蛋白(及其同源mRNA)可用于功能试验和高产量筛选抑制剂。重组蛋白和蛋白质的诸部分可从本文公开序列的亚克隆产生,并可作X-线晶体图进行合理的药物设计。可设计出对mTll-2蛋白有特异性的抗体。
合适的转录启动子包括如在pCDNA3.1或pCEP载体中发现的巨细胞病毒立即早期启动子,或是在载体pFASTBacl(该载体可购自Gibco-BRL)上发现的杆状病毒极迟启动子。另一个合适的启动子是杆状病毒立即早期启动子,如在pAcPIEl载体(Novagen,Madison,WI)上发现的启动子。任何其它有利的表达元件如增强子、终止子等本领域已知的元件可包括在合适的表达载体中。
合适的宿主可以是昆虫组织培育细胞,如细胞系Sf21、Sf9、High Five(Invitrogen,san Diego,CA)、或哺乳动物293或293-EBNA细胞。
也可将含有小于全部编码序列的该基因的合适部分克隆入合适的载体中,以形成基因重组构建物。应当理解,根据本发明制得的构建物不必含有整个mTll-2基因座或编码区,但应含有能编码所需功能的一个或多个部分,或含有该基因其它有用性能(如与所需基因组序列互补)的部分。本领域普通技术人员可以理解,mTll-2蛋白质(以及编码mTll-2蛋白质的相应的遗传物质)在大小和序列上的某些变化不会干扰其功能。在构建含有全部或部分mTll-2基因的基因构建物时,这些经修饰的形式可用己知的有利方法进行工程化,并表达在其编码的蛋白质中。
只要蛋白质保留了已知与该蛋白有关的所需功能,认为这些改变、修饰、添加和缺失均在本发明的范围内。如果蛋白质在进行这种切割的标准试验中保留了切断(前赖氨酰氧化酶的)能力,则该蛋白质是感受态蛋白。本领域技术人员对这些试验应伴有的必要的对照是熟悉的。或者,可能希望蛋白质由于这种变化而丧失某些功能,预计这类情况也包括在本发明的范围内。
这样制得的该蛋白质基本纯的制品被确定为一种制品,其中mTll-2蛋白质的特征性活性(例如对前赖氨酰氧化酶的较弱的切割作用)应不受制品中存在的其它蛋白质或分子的影响。根据该蛋白质将投入的用途,mTll-2蛋白质在基本纯的蛋白质制品中的量至少应为10%,至少50%为佳,至少75%为更佳,至少95%为最佳。通过用亲和标记物对该蛋白质作标记,并使制品通过对标记物有亲和性的柱,可增加此蛋白质制品中感兴趣的蛋白质。也可采用一种加工标记物,这样,就可从加有粗品的柱中洗脱获得适当加工形式(缺少切割前区)的该蛋白质。
当将鼠mTll-2蛋白质序列与其它特洛德样基因进行比较时,其与两个哺乳动物蛋白质(mTld和mTll)任一的前区或两个果蝇属蛋白质(Tld或Tlr-1)任一的前区没有广泛的同源性。图1将本发明公开的人和鼠mTll-2基因与人mTld以及人mTll-1基因作了氨基酸序列对比。序列对比用PileUp程序(Genetics Computer Group,Madison,Wisconsin)进行,GAP权值为12,长度权值为4。图1还显示了所示编码序列编码的蛋白质各结构域的大致边界。图1所示的氨基酸序列,从上到下,分别是人mTll-2、小鼠mTll-2、mTld和mTll-1。
mTll-2 mRNA转录物看来并非是可变剪接的,因为只检测到一个转录物,因为在每一种动物中进行cDNA文库筛选和PCR扩增时只分离出一种mTll-2 cDNA。
在胎盘和心脏观察到有相当强的mTll-2 mRNA表达。
具体预计的是,通过用经选择包含所述小鼠基因的mTll-2特异性部分的探针探测适当动物细胞的cDNA文库,或用与上述相似或不同的简并引物进行PCR扩增,可以自其它动物种类分离出mTll-2基因的等价物。通过比较小鼠mTll-2编码区核酸序列与BMP-1/mTld以及mTll-1的序列并选出在此二基因内均没有等价物的mTll-2基因部分,可获得小鼠mTll-2基因的mTll-2特异性部分。作为有效的探针,所选序列不应含有会与众多基因组位点相互杂交的重复序列。探针长度应至少约200个碱基。已经认识到,BMP-1家族基因在编码蛋白质前区和C端17个氨基酸的区域中最为可变,并且预计可以从mTll-2基因的那些区域分离出合适的探针。这样的探针片段可用切口翻译、末端标记或本领域已知的其它合适技术来转变成探针。还应理解,可用分子生物学家熟知的技术来体外合成所需的片段(或实际上是整个基因)。本领域技术人员能设计出对应于mTll-2所独有的区域或BMP-1/mTll-1/mTll-2蛋白家族成员中保守的区域的简并引物。
由于mTll-2中的缺陷可能导致人基因异常,因此如下文实施例所述已确定了人TLL-2基因的染色体位置(10q24)。该位置靠近与人遗传性疾病肌萎缩性痉挛性下身轻瘫有关的基因图位置。在用Trask,B., Methods Cell Biol.35:1-35(1992)的方法伸展的人细胞分裂中期染色体上进行荧光原位杂交(FISH),并通过放射杂交筛选,对TLL基因独立作图谱。
通过选择预计侧接mTll-2基因(或该基因任何部分)的特异性引物,应当也可能用PCR来扩增对应于mTll-2区的基因组部分。该基因的两个mTll-2特异性部分可作为合适的引物。在该基因编码部分之外选择引物可能是无效的,因为非编码部分降低的选择性压力会导致小鼠和人以及其它动物之间在这些区域中出现更大的趋异。特别应注意的是,应对人和模型动物(如小鼠)BMP家族的基因进行特别搜寻,以探知它们与人畸形的关系(参见例如″The Chicken With a Duck′s Feet:It′s All in theBiochemical Signal,″ The New York Times,National Edition,p.B6(1996年5月21日))。
也可特别预计到,可在宿主细胞中表达(或从宿主细胞中分泌)mTll-2基因编码的大量蛋白质,纯化成基本纯的制品,并用于随后的功能试验。在这样的一个功能试验中,将描述表达蛋白质的功能特征。预计该蛋白质的功能将包括金属蛋白酶活性、前赖氨酰氧化酶加工活性,以及激活TGF-β样蛋白的活性,鉴于其总体结构在结构域水平上与已知的蛋白质相似,因此这些预计是合理的。
在另一个试验中,该蛋白质可用来筛选对其有抑制活性的推定试剂。如果mTll-2能拯救BMP-1敲除小鼠,则它对于修饰或消除BMP-1蛋白功能以类似方式改变mTll-2蛋白功能的任何治疗系统是重要的。因此,任何一组这样的试剂都必需以mTll-2蛋白质进行筛选。在这样的试验中,所有支持mTll功能的试验成分可在合适的盐和pH条件下一同加入,并与一组推定的蛋白质功能抑制剂合用。采用已建立的蛋白质功能试验(在纳入本文其它处作为参考的文献中有所描述),将可以确定受测制剂是否能抑制蛋白质活性,从而使其成为以治疗量抑制纤维变性、减少结疤和减少瘢痕瘤的候选制剂。采用BMP-1基因家族的相关蛋白质的这种筛选努力正在进行。
现在也可用本发明所公开的蛋白质或其片段来进行合理的药物设计。在设计时,对该蛋白质或片段进行X-射线晶体图作分析,以确定它们的活性位点和可与推定治疗剂相互作用的位点。
目前表明,BMP-1编码的蛋白质可切割前胶原的C端附近。人们早就认为产生这种胶原所必需的C端-蛋白酶活性存在于一种预测的蛋白质中。因此,利用C端蛋白酶活性作为胶原相关疾病的治疗剂具有很高的商业价值。特别期望的是,mTll-2编码的蛋白质部分可用来产生另一种C端蛋白酶,两者均通过将基因导入重组载体中来体外生产治疗性蛋白,并在遗传疾病治疗中直接给药。人的基因特别适用于这些用途。
在考虑下列非限制性实施例后将能更好地理解本发明。
                         实施例
来自人胎盘cDNA的人mTll-2
用简并引物作PCR扩增。用对应于在BMP-1/特洛德样虾红素金属蛋白酶催化功能域中的一对保守区域的简并引物,从人胎盘Marathon-Ready eDNA文库(Clontech)扩增得到mTll-2基因的一部分(见Bond.J.S.和R.J.Benynon,Protein Science 4:1247-1261在1249页(1995),纳入本文作参考)。为了确定简并引物的合适序列,对人(Wozney等人,1988)、小鼠(Fukagawa等人,1994)和爪蟾属(Mano等人,1993)BMP-1、果蝇属特洛德相关-1(Nguyen等人,1994)和小鼠(Takahara等人,1996)和人mTll-1的对应核苷酸序列作人工序列对比。一对5′(正向)寡核苷酸引物,为引物1:5′-CARGC MATGMGNCAC TGGGAG-3′(SEQ ID NO:5)和引物2:5′-CARGC MATGMGN CACTGGGAA-3′(SEQ ID NO:6),它对应于编码较多氨基端氨基酸保守残基AMRHWE的序列。两个正向引物的不同仅仅在于最3′端的碱基对应于E的密码子的摇摆位置。3′(反向)寡核苷酸引物为引物3:5′GAADG TGTTVC KNGCRT ARTGC-3′(SEQ ID NO:7),它对应于编码较多羧基端氨基酸保守的残基HYARNTF的序列。
PCR这样进行:95℃变性5分钟,然后是30轮的95℃45秒、50℃45秒、72℃2分钟,最后72℃延伸10分钟,采用0.5ng人胎盘cDNA作为模板。
从2%琼脂糖凝胶上切下电泳观察到的异源的375bp PCR产物,然后连接入市售的pCR2.1载体(Invitrogen)中,该载体的核酸序列已公布。连接反应用ApaI来限制,该酶在BMP-1/mTld序列中切割,以降低BMP-1/mTld克隆的本底。克隆的序列分析揭示用引物2和引物3组合获得了约375bp的PCR产物。用引物1和引物3组合没有获得mTll-2或其它新的(例如非BMP-1/mTld或mTll-1)产物。通过对两条链测序,确认本文报告的人mTll-2序列。
cDNA文库筛选。用32P-dCTP(Amersham)通过随机引导对375bp的人mTll-2 PCR片段作放射性标记(Feinberg,A.P.,和Vogelstein,B.(1983),“将DNA限制性内切核酸酶片段放射性标记成高比活的技术”,Anal.Biochem.132:6-13,该文全部纳入本文作参考),并用其来筛选gtll人胎盘cDNA文库(Clontech)的噬斑。杂交在65℃下进行18小时,用2×SSC、0.1%SDS室温洗涤30分钟;用2×SSC、0.1%SDS 65℃洗涤30分钟;并用0.1×SSC、0.1%SDS 65℃洗涤30分钟。
噬斑纯化得到一个强杂交阳性克隆,切下约1.6kb的插入物(大致对应于BMP-1家族基因常见的前区、催化结构域、CUBl和CUB2结构域),亚克隆到pBluescript IIKS+的EcoRI位点内,通过如Lee S.-T.,等人,″编码人前α2(I)胶原的全长cDNA的构建及其在前α2(I)-缺陷型W8大鼠细胞中的表达″,J.Biol.Chem.263;13414-13418(1988)(该文全部纳入本文作参考)中所描述的双脱氧链终止法,从双链模板获得序列。
用T3和T7引物对亚克隆的两末端进行测序,通过引入缺失或采用与插入序列互补的引物使亚克隆的内部部分得以测序。平板筛选的进一步尝试未能产生编码新的mTll-2序列的其它阳性克隆。
用RACE-PCR和采用简并引物的PCR来完成人mTll-2 cDNA序列的5′和3′端。为了获得1.6kb片段(如上所述获得)和mTll-2 cDNA 5′端序列之间的所有序列,用Marathon cDNA扩增试剂盒按照生产商(Clontech)说明书,对0.5ng人胎盘Marathon-Ready cDNA模板进行5′RACE PCR扩增。对应于1.6kb片段5′端附近序列的嵌套引物是引物4:5′-TGTGGTGTCT GGGCTGCTCT CAGATGC-3′(SEQ ID NO:8)和引物5:5′-ACTGTCTGCT TGGTCCAGTC TCTGG-3′(SEQ ID NO:9)。嵌套PCR反应中的其余引物对应于Clontech合成并包括在市售的Marathon cDNA扩增试剂盒(它可用来进行嵌套PCR过程)中的RACE-PCR衔接子部分。
进行嵌套PCR,PCR的第一回合为95℃5分钟,然后是40轮的95℃45秒、60℃45秒、72℃2分钟,最后72℃延伸10分钟。嵌套PCR的第二回合在相同条件下进行,只是进行35轮而不是40轮。将PCR产物克隆到Invitrogen pCR2.1载体中进行序列分析。
获得了前区和所有信号肽的编码部分并含有约360bp 5′非翻译序列的约900bp的mTll-2 5′RACE-cDNA克隆。
最初,3′RACE PCR没有提供人mTll-2基因的附加的3′序列。因此,采用中间PCR扩增步骤,该步骤采用了对应于1.6kb cDNA 3′端序列的两个嵌套引物(引物6:5′-TACCTGGAAG TCCGGGATGG CCCCACG-3′(SEQ ID NO:10))和引物7(5′-GAGGATGTGA AATCGAGCTC CAACAGAC-3′(SEQ ID NO:11)),以及对应于人和小鼠mTld以及mTll-1蛋白的CUB结构域5中保守的氨基酸序列的四个交替简并寡核苷酸引物。简并反向引物8-11都具有序列5′-RAANCCYTTYT TNNNDATNGT-3′,但是各引物中的6个附加的3′端碱基不同。反向引物8-11的末端序列为:引物8,5′-GTCGTC-3′;引物9,5′-ATCATC-3′;引物10,5′-GTCATC-3′;和引物11,5′-ATCGTC-3′。这四个简并引物在SEQ ID NO:12中列成单个简并引物,其中引物8、9、10和11中的变化反映在6个最3′端碱基的简并性上。
用人胎盘Marathon-Ready cDNA作为模板(0.5ng)。第一回合PCR这样进行,95℃5分钟,然后40轮的95℃45秒、60℃45秒、72℃4分钟,最后72℃延伸10分钟。PCR的第二个嵌套回合在相同条件下进行,只是采用35轮而不是40轮。
从0.8%琼脂糖凝胶上切下约1.3kb的特异性产物,克隆到pCR2.1中进行序列分析。1.3kb片段编码了人mTll-2的所有EGF1、CUB3、EGF2和CUB4结构域和大部分CUB5结构域,并且是用简并反向引物10(而不是引物8、9或11)与嵌套正向引物6或7组合获得的。
为了获得其余的人mTll-2 cDNA序列,用对应于1.3kb片段3′端附近序列的两个嵌套引物(引物12:5′-CAACAACTAC CCGAGCGAGG CCCC-3′(SEQ ID NO:13)和引物13:5′-GAAGCCTACG ACGGCTACGA CAGCTC-3′(SEQ ID NO:14)),以人胎盘Marathon-Ready cDNA作为模板(0.5ng),用Marathon cDNA扩增试剂盒根据生产商说明书(Clontech)来进行3′RACE PCR。嵌套PCR如下进行:PCR的第一回合为95℃分钟,然后是40轮的95℃45秒、60℃45秒、72℃4分钟,最后72℃延伸10分钟。PCR的第二嵌套回合在相同条件下进行,只是采用35轮而不是40轮。从0.8%琼脂糖凝胶上切下约1.7kb的特异性产物(编码部分CUB5结构域并含有1.6kb的3′非翻译区,包括聚A尾部),并克隆到pCR2.1中进行序列分析。
鼠mTll-2
用获得最初人375bp片段的相同简并引物和PCR条件(见上文),从小鼠cDNA获得约375bp的异源产物。在这种情况下,所用的模板为0.5ng的性交后7天(dpc)小鼠胚胎Marathon-Ready cDNA(Clontech)。对375bp PCR产物作电泳并从2%琼脂糖凝胶上切下,连接到pCR2.1中,连接反应用ApaI限制,以降低BMP-1/mTld克隆的本底。与人序列相反,375bp mTll-2 PCR产物是用引物1与引物3组合获得的,但用引物2和引物3组合没有获得mTll-2或其它新的产物。
用375bp片段筛选鼠7dpc和17dpc cDNA文库,没有产生任何阳性mTll-2克隆。为了获得375bp片段和鼠mTll-2 cDNA 5′端序列之间的所有序列,用MarathoncDNA扩增试剂盒按照生产商(Clontech)说明书,用简并反向引物3(如上)和对应于375bp片段3′端附近序列的嵌套引物(引物14,5′-GCTTTCCTCATCTGTCCTCTCTACG-3′(SEQ ID NO:15)),以0.5ng 7dpc小鼠胎盘Marathon-Ready cDNA为模板,进行5′RACE PCR。嵌套PCR如下进行:PCR的第一回合为94℃30秒,然后是5轮的94℃5秒、72℃4分钟;5轮的94℃5秒,70℃4分钟;30轮的94℃5秒,68℃4分钟,最后72℃延伸10分钟。PCR的第二个嵌套回合如下进行:94℃30秒,然后是5轮的94℃5秒,72℃4分钟;5轮94℃5秒,70℃4分钟;25轮94℃5秒,68℃4分钟,最后72℃延伸10分钟。
将PCR产物克隆到Invitrogen pCR2.1载体中进行序列分析。获得约900bp的mTll-2 PCR产物,它编码部分蛋白酶结构域、所有的信号肽和前区,并含有约200bp的5′非翻译序列。
为了获得375bp片段和小鼠mTll-2 cDNA序列3′端之间的序列,用简并正向引物1(上述)和对应于375bp片段5′端附近序列的嵌套引物(引物15,CCTGTGTGACCTTCGTAGAGAGG-3′(SEQ ID NO:16))进行3′RACE PCR。PCR条件与用于小鼠mTll-2序列5′RACE的条件(上述)相同。将PCR产物克隆到pCR2.1中作序列分析。获得约1200bp的mTll-2 PCR产物,它编码部分蛋白酶结构域、所有的结构域CUB1、CUB2、EGF1、CUB3、EGF2并终止于CUB3结构域内。用从1200bp片段获得的序列信息所设计出的寡核苷酸引物对编码序列的其余部分作PCR扩增。已经确定小鼠mTll-2基因的全长编码区,其位于bp191和3229之间或SEQ IDNO:3。
染色体排布。用辐射杂交图谱(Walter等人,1994)作TLL2图谱,该方法包括对从Research Genetics获得的4组辐射杂交物作聚合酶链反应(PCR)分析。正向引物5′-TGGGAGCTGAGCAATGCTAACTGC-3′(SEQ ID NO:17)和反向引物5′-GAAGGTGTTCCGGGCGTAGTGCAT-3′(SEQ ID NO:18)分别对应于TLL2内含子6和外显子7中的序列,用人基因组DNA模板得到1.4kb PCR产物,但用对照中国仓鼠基因组DNA模板没有得到产物。PCR用100ng模板DNA和10皮摩尔各引物进行,热循环程序为95℃5分钟,然后是30轮的95℃45秒、65℃45秒、72℃3分钟,最后72℃延伸10分钟。
在0.8%琼脂糖凝胶上对PCR产物作电泳,用溴乙锭显色,将得分提交给Whitehead Institute/MIT Center for Genome Research的WICGR给图服务机构。TLL2在GeneBridge 4 Panel辐射杂交物上清晰地图示位置位于染色体10q,距离标记D10S571 8.66cR,Lod评分为15。另外,Trask(1991)的方法伸展的在雄性中期染色体上进行荧光原位杂交(FISH),图示出TLL2在染色体10上的位置。将含有TLL2外显子的10kb BamHI基因组片段亚克隆到pBluescript II KS+中,并用洋地黄毒苷-11-dUTP(Boehringer Mannheim)通过随机引导作标记。获得可图象并如Takahara等人1994所述作分析。仅发现这两个染色体上的双荧光信号在测定的75%中期伸展体(15/20)中的10q24处,在其它染色体上没能将TLL2定位于该区域(未显示)。
组织切片作原位杂交
将组织切片固定在玻片上进行原位杂交。小鼠组织将如Lyons等人,″发育骨骼肌中肌球蛋白基因的表达″,J.Cell Biol.111:1465-1476(1990)中所述那样固定和包埋。简言之,将组织固定在含4%多聚甲醛的磷酸缓冲盐溶液中,脱水,并用石蜡浸润。将5-7微米厚的系列切片固定在明胶化的玻片上。每个玻片固定1-3个切片,用二甲苯脱去石蜡,并重新水化。用蛋白酶K消化切片,后固定,用三乙醇胺/乙酸酐处理、洗涤并脱水。
原位杂交和洗涤程序
使切片在52℃50%去离子甲酰胺、0.3M NaCl、20mM Tris-HCl、pH7.4、5mMEDTA、10mM NaPO4、10%硫酸葡聚糖、1× Denhardt′s溶液、50μg/ml酵母总RNA、25μmol/ml硫代ATP(Boehringer-Mannheim)和50-75,000cpm/μl 35S标记的cRNA探针中杂交过夜。使组织在65℃的50%甲酰胺、2×SSC、10mM二硫苏糖醇中严格清洗;在磷酸盐缓冲盐水中漂清;并用20μg/ml RNase A 37℃处理30分钟。随后在37℃2×SSC和0.1×SSC中37℃清洗15分钟后,使载玻片脱水,将其浸在KodakNTB-2核示踪乳液中,并在4℃、有干燥剂的不透光箱子中曝光一周。照片在Kodak D-19中显影。用Zeiss Axiophot显微镜的亮视野和暗视野镜片分析载玻片。
mTll-2基因的亚克隆和表达
BMP-1、mTld、mTll-1和mTll-2的成熟活性形式的氨基酸序列是相似的。只是每种蛋白质的C端没有同源性。C端序列的这种独特性已被用来生产一系列能区别这些蛋白质形式的多克隆抗体。在小鼠mTll-2的情况下,使对应于mTll-2最后的17个氨基酸的合成的肽与蛋白质载体钥孔血兰素连接,悬浮在盐水中,与等体积弗氏佐剂混合乳化,注入两只兔子每只背部皮下3-4处。在加强免疫后12周和16周,放血取血清。这些抗体有商业用途,可用于试验显示细胞、组织和哺乳动物生物体(包括但不局限于模型动物体系如啮齿类动物和灵长类动物和人)中mTll-2蛋白质的产生和定位。
应注意,独特的序列存在于蛋白酶、这些蛋白质的CUB和前区内,并能用来检测和区分该家族的各成员。参见Lee,S.J.Biol.Chem.272:19059-19066(1997)。
由于对骨形态生成蛋白的了解进展迅速,因此区别各组分的能力不仅在研究方面重要,而且在监测BMP体系疾病患者的BMP系统组分的水平和分布上也很重要。这些疾病包括,例如,小鼠和人体的纤维变性疾病或心脏病。此外,由于TLL2基因的缺陷,还可能会有遗传性发育异常。采用本文所述的抗体和核酸探针就可确定mTll-2在这些遗传异常中起的作用。显然,mTll-2蛋白质在生物发育中是非常重要的,因为它在胎盘和发育的心脏中表达。
                         序列表
<110>Greenspan,Daniel S.
     Scott,Ian C.
     Thomas,Christina L.
<120>哺乳动物的特洛德样基因和蛋白质
<130>960296.96111
<140>
<141>
<150>60/111873
<151>1998-12-11
<150>60/080550
<151>1998-04-03
<160>18
<170>PatentIn Ver. 2.0
<210>1
<211>5021
<212>DNA
<213>人
<220>
<221>CDS
<222>(365)..(3412)
<400>1
cgcccattgg ctcctcagcc aagcacgtac accaaatgtc tgaacctgcg gttcctctcg 60
tactgagcag gattaccatg gcaacaacac atcatcagta gggtaaaact aacctgtctc 120
acgacggtct aaacccaggc agcctcggcc gccgggcaag tagctccgag cggctgcttc 180
ccggttgcct cgaagaagac agggggcgcc gcgctccgct tgctccgcgc ctgagccatg 240
cccagcagcc ctgtgtaacc accgagtccc ggccggagcc gaccgaccca gtgtgcgccg 300
tctttcggcc gagctgagct ttcgtgcacg caactccctc tgccccagcc ggccccgcgc 360
cacc atg ccc cgg gcg act gca ctt ggg gcc ctg gtg tca ctg ctg ctg  409
     Met Pro Arg Ala Thr Ala Leu Gly Ala Leu Val Ser Leu Leu Leu
       1               5                  10                  15
ctg ctg ccg ctg cct cgc ggc gcc ggg gga ctc ggg gag cgc ccg gac   457
Leu Leu Pro Leu Pro Arg Gly Ala Gly Gly Leu Gly Glu Arg Pro Asp
                 20                  25                  30
gcc acc gca gac tac tca gag ctg gac ggc gag gag ggc acg gag cag   505
Ala Thr Ala Asp Tyr Ser Glu Leu Asp Gly Glu Glu Gly Thr Glu Gln
             35                  40                  45
cag ctg gag cat tac cac gac cct tgc aaa gcc gct gtc ttt tgg gga   553
Gln Leu Glu His Tyr His Asp Pro Cys Lys Ala Ala Val Phe Trp Gly
         50                  55                  60
gac att gcc tta gat gaa gat gac ttg aag ctg ttt cac att gac aaa   601
Asp Ile Ala Leu Asp Glu Asp Asp Leu Lys Leu Phe His Ile Asp Lys
     65                  70                  75
gcc aga gac tgg acc aag cag aca gtg ggg gca aca gga cac agc aca   649
Ala Arg Asp Trp Thr Lys Gln Thr Val Gly Ala Thr Gly His Ser Thr
 80                  85                  90                  95
ggt ggg ctt gaa gag cag gca tct gag agc agc cca gac acc aca gcc   697
Gly Gly Leu Glu Glu Gln Ala Ser Glu Ser Ser Pro Asp Thr Thr Ala
                100                 105                 110
atg gac act ggc acc aag gaa gct gga aag gat ggc cgg gag aat acc   745
Met Asp Thr Gly Thr Lys Glu AIa Gly Lys Asp Gly Arg Glu Asn Thr
            115                 120                 125
aca ctc ctg cac agc cct ggg acc ttg cat gcc gca gcc aag acc ttc   793
Thr Leu Leu His Ser Pro Gly Thr Leu His Ala Ala Ala Lys Thr Phe
        130                 135                 140
tct ccc cgg gtc cga aga gcc aca acc tca agg aca gag agg ata tgg   841
Ser Pro Arg Val Arg Arg Ala Thr Thr Ser Arg Thr Glu Arg Ile Trp
    145                 150                 155
cct gga gga gtc atc ccc tac gtc att gga ggg aac ttc act ggg agc   889
Pro Gly Gly Val Ile Pro Tyr Val Ile Gly Gly Asn Phe Thr Gly Ser
160                 165                 170                 175
cag agg gcc att ttt aag cag gcc atg aga cac tgg gag aag cac acc   937
Gln Arg Ala Ile Phe Lys Gln Ala Met Arg His Trp Glu Lys His Thr
                180                 185                 190
tgt gtg acc ttc ata gaa agg acg gat gag gaa agc ttt att gta ttc   985
Cys Val Thr Phe Ile Glu Arg Thr Asp Glu Glu Ser Phe Ile Val Phe
            195                 200                 205
agt tac aga acc tgt ggc tgt tgc tcc tat gtt ggg cgc cga gga gga   1033
Ser Tyr Arg Thr Cys Gly Cys Cys Ser Tyr Val Gly Arg Arg Gly Gly
        210                 215                 220
ggc cca cag gcc ata tcc att ggg aag aac tgt gac aag ttt ggc att   1081
Gly Pro Gln Ala Ile Ser Ile Gly Lys Asn Cys Asp Lys Phe Gly Ile
    225                 230                 235
gtg gct cac gag ctg ggc cat gtg gtt ggg ttt tgg cat gaa cac acc   1129
Val Ala His Glu Leu Gly His Val Val Gly Phe Trp His Glu His Thr
240                 245                 250                 255
cgg cca gac aga gac caa cat gtc acc atc atc agg gaa aac atc cag   1177
Arg Pro Asp Arg Asp Gln His Val Thr Ile Ile Arg Glu Asn Ile Gln
                260                 265                 270
cca ggt cag gag tat aat ttc tta aaa atg gaa gct ggg gaa gtg agc   1225
Pro Gly Gln Glu Tyr Asn Phe Leu Lys Met Glu Ala Gly Glu Val Ser
            275                 280                 285
tct ctg gga gag aca tac gac ttt gac agc atc atg cac tac gcc cgg   1273
Ser Leu Gly Glu Thr Tyr Asp Phe Asp Ser Ile Met His Tyr Ala Arg
        290                 295                 300
aac acc ttc tca aga gga gtt ttc tta gac acc atc ctt ccc cgt caa   1321
Asn Thr Phe Ser Arg Gly Val Phe Leu Asp Thr Ile Leu Pro Arg Gln
    305                 310                 315
gat gac aat ggc gtc agg cca acc att ggc cag cgc gtg cgg ctc agt   1369
Asp Asp Asn Gly Val Arg Pro Thr Ile Gly Gln Arg Val Arg Leu Ser
320                 325                 330                 335
cag gga gac ata gct caa gcc cgg aag ctg tac aaa tgc cca gcg tgt   1417
Gln GIy Asp Ile Ala Gln Ala Arg Lys Leu Tyr Lys Cys Pro Ala Cys
                340                 345                 350
ggg gag acc ctg cag gac aca acg gga aac ttt tct gca cct ggt ttc   1465
Gly Glu Thr Leu Gln Asp Thr Thr Gly Asn Phe Ser Ala Pro Gly Phe
            355                 360                 365
cca aat ggg tac cca tct tac tcc cac tgc gtc tgg agg atc tcg gtc   1513
Pro Asn Gly Tyr Pro Ser Tyr Ser His Cys Val Trp Arg Ile Ser Val
        370                 375                 380
acc cca ggg gaa aag atc gta tta aac ttc aca tcc atg gat ttg ttt   1561
Thr Pro Gly Glu Lys Ile Val Leu Asn Phe Thr Ser Met Asp Leu Phe
    385                 390                 395
aaa agc cga ctg tgc tgg tat gat tac gtg gag gtc cgg gat ggt tac   1609
Lys Ser Arg Leu Cys Trp Tyr Asp Tyr Val Glu Val Arg Asp Gly Tyr
400                 405                 410                 415
tgg aga aaa gcc ccc ctt ttg ggc agg ttt tgt ggc gat aag atc ccg   1657
Trp Arg Lys Ala Pro Leu Leu Gly Arg Phe Cys Gly Asp Lys Ile Pro
                420                 425                 430
gag ccc ctc gtc tcc acg gac agc cgg ctc tgg gtg gag ttc cgc agc   1705
Glu Pro Leu Val Ser Thr Asp Ser Arg Leu Trp Val Glu Phe Arg Ser
            435                 440                 445
agc agc aac atc ttg ggc aag ggc ttc ttt gca gcg tac gaa gct acc   1753
Ser Ser Asn Ile Leu Gly Lys Gly Phe Phe Ala Ala Tyr Glu Ala Thr
        450                 455                 460
tgc ggg gga gac atg aac aaa gat gcc ggt cag att caa tct ccc aac   1801
Cys Gly Gly Asp Met Asn Lys Asp Ala Gly Gln Ile Gln Ser Pro Asn
    465                 470                 475
tat ccg gat gac tac aga cct tcc aag gaa tgt gtc tgg agg att acg   1849
Tyr Pro Asp Asp Tyr Arg Pro Ser Lys Glu Cys Val Trp Arg Ile Thr
480                 485                 490                 495
gtt tcg gag ggg ttt cac gtg gga ctt acc ttc caa gct ttt gag att   1897
Val Ser Glu Gly Phe His Val Gly Leu Thr Phe Gln Ala Phe Glu Ile
                500                 505                 510
gaa agg cac gac agc tgt gca tat gac tac ctg gaa gtc cgg gat ggc   1945
Glu Arg His Asp Ser Cys Ala Tyr Asp Tyr Leu Glu Val Arg Asp Gly
            515                 520                 525
ccc acg gaa gag agt gcc ctg atc ggc cac ttt tgt ggc tat gag aag   1993
Pro Thr Glu Glu Ser Ala Leu Ile Gly His Phe Cys Gly Tyr Glu Lys
        530                 535                 540
ccg gag gat gtg aaa tcg agc tcc aac aga ctg tgg atg aag ttt gtg   2041
Pro Glu Asp Val Lys Ser Ser Ser Asn Arg Leu Trp Met Lys Phe Val
    545                 550                 555
tcc gat ggc tct atc aat aaa gcg ggc ttt gca gcc aat ttt ttc aag   2089
Ser Asp Gly Ser Ile Asn Lys Ala Gly Phe Ala Ala Asn Phe Phe Lys
560                 565                 570                 575
gag gtg gat gag tgt tcc tgg cca gat cac ggc ggg tgc gaa cat cgc   2137
Glu Val Asp Glu Cys Ser Trp Pro Asp His Gly Gly Cys Glu His Arg
                580                 585                 590
tgt gtg aac acg ctg ggc agc tac aag tgt gcc tgt gac cct ggc tac   2185
Cys Val Asn Thr Leu Gly Ser Tyr Lys Cys Ala Cys Asp Pro Gly Tyr
            595                 600                 605
gag ctg gcc gcc gat aag aag atg tgt gaa gtg gcc tgt ggc ggt ttc   2233
Glu Leu Ala Ala Asp Lys Lys Met Cys Glu Val Ala Cys Gly Gly Phe
        610                 615                 620
att acc aag ctg aat gga acc atc acc agc cct ggg tgg ccg aag gag   2281
Ile Thr Lys Leu Asn Gly Thr Ile Thr Ser Pro Gly Trp Pro Lys Glu
    625                 630                 635
tat ccc aca aac aaa aac tgt gtc tgg cag gtg gtg gcc ccc gct cag   2329
Tyr Pro Thr Asn Lys Asn Cys Val Trp Gln Val Val Ala Pro Ala Gln
640                 645                 650                 655
tac cgg atc tcc ctt cag ttt gaa gtg ttt gaa ctg gaa ggc aat gac   2377
Tyr Arg Ile Ser Leu Gln Phe Glu Val Phe Glu Leu Glu Gly Asn Asp
                660                 665                 670
gtc tgt aag tac gac ttt gta gag gtg cgc agc ggc ctg tcc ccc gac   2425
Val Cys Lys Tyr Asp Phe Val Glu Val Arg Ser Gly Leu Ser Pro Asp
            675                 680                 685
gcc aag ctg cac ggc agg ttc tgc ggc tct gag acg ccg gaa gtc atc   2473
Ala Lys Leu His Gly Arg Phe Cys Gly Ser Glu Thr Pro Glu Val Ile
        690                 695                 700
acc tcg cag agc aac aac atg cgc gtg gag ttc aag tcc gac aac acc   2521
Thr Ser Gln Ser Asn Asn Met Arg Val Glu Phe Lys Ser Asp Asn Thr
    705                 710                 715
gtc tcc aag cgc ggc ttc agg gcc cac ttc ttc tca gat aag gac gag   2569
Val Ser Lys Arg Gly Phe Arg Ala His Phe Phe Ser Asp Lys Asp Glu
720                 725                 730                 735
tgt gcc aag gac aac ggc ggg tgt cag cat gag tgc gtc aac acc ttc   2617
Cys Ala Lys Asp Asn Gly Gly Cys Gln His Glu Cys Val Asn Thr Phe
                740                 745                 750
ggg agc tac ctg tgc agg tgc aga aac ggc tac tgg ctc cac gag aat   2665
Gly Ser Tyr Leu Cys Arg Cys Arg Asn Gly Tyr Trp Leu His Glu Asn
            755                 760                 765
ggg cat gac tgc aaa gag gct ggc tgt gca cac aag atc agc agt gtg   2713
Gly His Asp Cys Lys Glu Ala Gly Cys Ala His Lys Ile Ser Ser Val
        770                 775                 780
gag ggg acc ctg gcg agc ccc aac tgg cct gac aaa tac ccc agc cgg   2761
Glu Gly Thr Leu Ala Ser Pro Asn Trp Pro Asp Lys Tyr Pro Ser Arg
    785                 790                 795
agg gag tgt acc tgg aac atc tct tcg act gca ggc cac aga gtg aaa   2809
Arg Glu Cys Thr Trp Asn Ile Ser Ser Thr Ala Gly His Arg Val Lys
800                 805                 810                 815
ctc acc ttt aat gag ttt gag atc gag cag cac cag gaa tgt gcc tat   2857
Leu Thr Phe Asn Glu Phe Glu Ile Glu Gln His Gln Glu Cys Ala Tyr
                820                 825                 830
gac cac ctg gaa atg tat gac ggg ccg gac agc ctg gcc ccc att ctg   2905
Asp His Leu Glu Met Tyr Asp Gly Pro Asp Ser Leu Ala Pro Ile Leu
            835                 840                 845
ggc cgt ttc tgc ggc agc aag aaa cca gac ccc acg gtg gct tcc ggc   2953
Gly Arg Phe Cys Gly Ser Lys Lys Pro Asp Pro Thr Val Ala Ser Gly
        850                 855                 860
agc agt atg ttt ctc agg ttt tat tcg gat gcc tca gtg cag agg aaa   300l
Ser Ser Met Phe Leu Arg Phe Tyr Ser Asp Ala Ser Val Gln Arg Lys
    865                 870                 875
ggc ttc cag gca gtg cac agc aca gag tgc ggg ggc agg ctg aag gct   3049
Gly Phe Gln Ala Val His Ser Thr Glu Cys Gly Gly Arg Leu Lys Ala
880                 885                 890                 895
gaa gtg cag acc aaa gag ctc tat tcc cac gcc cag ttt ggg gac aac   3097
Glu Val Gln Thr Lys Glu Leu Tyr Ser His Ala Gln Phe Gly Asp Asn
                900                 905                 910
aac tac ccg agc gag gcc cgc tgt gac tgg gtg atc gtg gca gag gac   3145
Asn Tyr Pro Ser Glu Ala Arg Cys Asp Trp Val Ile Val Ala Glu Asp
            915                 920                 925
ggc tac ggc gtg gag ctg aca ttc cgg acc ttt gag gtt gag gag gag   3193
Gly Tyr Gly Val Glu Leu Thr Phe Arg Thr Phe Glu Val Glu Glu Glu
        930                 935                 940
gcc gac tgc ggc tac gac tac atg gaa gcc tac gac ggc tac gac agc   3241
Ala Asp Cys Gly Tyr Asp Tyr Met Glu Ala Tyr Asp Gly Tyr Asp Ser
    945                 950                 955
tca gcg ccc agg ctc ggc cgc ttc tgt ggc tct ggg cca tta gaa gaa   3289
Ser Ala Pro Arg Leu Gly Arg Phe Cys Gly Ser Gly Pro Leu Glu Glu
960                 965                 970                  975
atc tac tct gca ggt gat tcc ctg atg att cga ttc cgc aca gat gac   3337
Ile Tyr Ser Ala Gly Asp Ser Leu Met Ile Arg Phe Arg Thr Asp Asp
                980                 985                 990
acc atc aac aag aaa ggc ttt cat gcc cga tac acc agc acc aag ttc   3385
Thr Ile Asn Lys Lys Gly Phe His Ala Arg Tyr Thr Ser Thr Lys Phe
            995                1000                1005
cag gat gcc ctg cac atg aag aaa tag tgctgatgtt cttgaaagac         3432
Gln Asp Ala Leu His Met Lys Lys
       1010            1015
agaaactgag aatttttttg ttttgttttg tttttaacaa caatagcacc ttgaaaatct 3492
gccctaaaac agtgtacagt atttttctca aacaaaaact cagaatccag ccttagaggt 3552
atatatttga atgaaagtct tgtaagtttg gccaacaagg tggagaaaaa aatgttcttt 3612
tgcttctgtc tgcaatgttg tcattcatga actgttaaag tgttaaagat taggattgga 3672
gtcactgacc attccggcta tgcttcttca taccattctc cttgttgtcc cttgctccta 3732
tgtggcaaaa ggtcagcctt ggggttggcc gttcctctaa tctggacttg cttgcaaagg 3792
tgccaggctg tcttctgtcc atgttgggca taagggatga aaacttggcc gagactaatg 3852
tgtggcccac agctttggct ggaatcattt tctttctctc tgccagggac atgtcaacca 3912
agaaacctga aaatatggat ggatgtcagg actaaaaaaa ggcatcacag tgagcagtga 3972
gcacagaggg agtttcgagt ataagaatca ttgtcatgaa gttaggagac cacaaagcca 4032
tttctcagag tcattcactc tccttgtccc tttggtttcc ccccttcctt aattgcagtg 4092
ggggctaagg tatccattat gaatacagca gaacatttgc tggcgagagt cctgtctgct 4152
gagaagacaa tattgtggct cgtcctgata ttttttcatt cattgacttt gagaagactc 4212
cacctgtgct tggaattcca tgggcttcaa agaacatttc ttcttttagc tttggaggca 4272
cttgccgtgg cacacctgga ctccttgaca tccaattcaa actgcatttg caaaatgtgc 4332
aaagacctct tatgagggac caattcaggt cccttatggg gtgaacactg ttgaagactg 4392
gttaattata agttatgtaa gaatcatcgc cttgtggaac aagtcaatca gtgactagct 4452
tcctgtagcc aatcaggtta aagagggcgt tggtaatttt gttctgattt aactagtatt 4512
caatcaccaa cttgcaaaca gaattcataa cacttggcac ttgttctaga gaagtgtaga 4572
ggatgatgtt aacataattt tagcacttca aggtataatt taaacagtga ggtagttttg 4632
aatggcattt cattaaggca tctatgggca ttatgagcta aaagctgtgg tatgttagct 4692
ttaaaagagt atttatgttg gaataatttt taaataatgt ttacataact gtaagtcctg 4752
tttggttgtt gttggacgca gggcggcaca tgagtgtttt tggttagagc caagatagct 4812
cccatgcacc ggaattcctt tgggatgaat cagcatcatt ttaaacaaag tatatgtaaa 4872
aggtgaaagg ttatattttt tacagatcag aatgtggcac cagaggactg tgtctcatta 4932
aagtgattgc tgggagcaaa aactagaatg atacaaagaa aggtcagaga aatgcatggg 4992
aatatttttt ctttaaaaaa aaaaaaaaa                                   5021
<210>2
<211>1015
<212>蛋白质
<213>人
<400>2
Met Pro Arg Ala Thr Ala Leu Gly Ala Leu Val Ser Leu Leu Leu Leu
  1               5                  10                  15
Leu Pro Leu Pro Arg Gly Ala Gly Gly Leu Gly Glu Arg Pro Asp Ala
             20                  25                  30
Thr Ala Asp Tyr Ser Glu Leu Asp Gly Glu Glu Gly Thr Glu Gln Gln
         35                  40                  45
Leu Glu His Tyr His Asp Pro Cys Lys Ala Ala Val Phe Trp Gly Asp
     50                  55                  60
Ile Ala Leu Asp Glu Asp Asp Leu Lys Leu Phe His Ile Asp Lys Ala
 65                  70                  75                  80
Arg Asp Trp Thr Lys Gln Thr Val Gly Ala Thr Gly His Ser Thr Gly
                 85                  90                  95
Gly Leu Glu Glu Gln Ala Ser Glu Ser Ser Pro Asp Thr Thr Ala Met
            100                 105                 110
Asp Thr Gly Thr Lys Glu Ala Gly Lys Asp Gly Arg Glu Asn Thr Thr
        115                 120                 125
Leu Leu His Ser Pro Gly Thr Leu His Ala Ala Ala Lys Thr Phe Ser
    130                 135                 140
Pro Arg Val Arg Arg Ala Thr Thr Ser Arg Thr Glu Arg Ile Trp Pro
145                 150                 155                 160
Gly Gly Val Ile Pro Tyr Val Ile Gly Gly Asn Phe Thr Gly Ser Gln
                165                 170                 175
Arg Ala Ile Phe Lys Gln Ala Met Arg His Trp Glu Lys His Thr Cys
            180                 185                 190
Val Thr Phe Ile Glu Arg Thr Asp Glu Glu Ser Phe Ile Val Phe Ser
        195                 200                 205
Tyr Arg Thr Cys Gly Cys Cys Ser Tyr Val Gly Arg Arg Gly Gly Gly
    210                 215                 220
Pro Gln Ala Ile Ser Ile Gly Lys Asn Cys Asp Lys Phe Gly Ile Val
225                 230                 235                 240
Ala His Glu Leu Gly His Val Val Gly Phe Trp His Glu His Thr Arg
                245                 250                 255
Pro Asp Arg Asp Gln His Val Thr Ile Ile Arg Glu Asn Ile Gln Pro
            260                 265                 270
Gly Gln Glu Tyr Asn Phe Leu Lys Met Glu Ala Gly Glu Val Ser Ser
        275                 280                 285
Leu Gly Glu Thr Tyr Asp Phe Asp Ser Ile Met His Tyr Ala Arg Asn
    290                 295                 300
Thr Phe Ser Arg Gly Val Phe Leu Asp Thr Ile Leu Pro Arg Gln Asp
305                 310                 315                 320
Asp Asn Gly Val Arg Pro Thr Ile Gly Gln Arg Val Arg Leu Ser Gln
                325                 330                 335
Gly Asp Ile Ala Gln Ala Arg Lys Leu Tyr Lys Cys Pro Ala Cys Gly
            340                 345                 350
Glu Thr Leu Gln Asp Thr Thr Gly Asn Phe Ser Ala Pro Gly Phe Pro
        355                 360                 365
Asn Gly Tyr Pro Ser Tyr Ser His Cys Val Trp Arg Ile Ser Val Thr
    370                 375                 380
Pro Gly Glu Lys Ile Val Leu Asn Phe Thr Ser Met Asp Leu Phe Lys
385                 390                 395                 400
Ser Arg Leu Cys Trp Tyr Asp Tyr Val Glu Val Arg Asp Gly Tyr Trp
                405                 410                 415
Arg Lys Ala Pro Leu Leu Gly Arg Phe Cys Gly Asp Lys Ile Pro Glu
            420                 425                 430
Pro Leu Val Ser Thr Asp Ser Arg Leu Trp Val Glu Phe Arg Ser Ser
        435                 440                 445
Ser Asn Ile Leu Gly Lys Gly Phe Phe Ala Ala Tyr Glu Ala Thr Cys
    450                 455                 460
Gly Gly Asp Met Asn Lys Asp Ala Gly Gln Ile Gln Ser Pro Asn Tyr
465                 470                 475                 480
Pro Asp Asp Tyr Arg Pro Ser Lys Glu Cys Val Trp Arg Ile Thr Val
                485                 490                 495
Ser Glu Gly Phe His Val Gly Leu Thr Phe Gln Ala Phe Glu Ile Glu
            500                 505                 510
Arg His Asp Ser Cys Ala Tyr Asp Tyr Leu Glu Val Arg Asp Gly Pro
        515                 520                 525
Thr Glu Glu Ser Ala Leu Ile Gly His Phe Cys Gly Tyr Glu Lys Pro
    530                 535                 540
Glu Asp Val Lys Ser Ser Ser Asn Arg Leu Trp Met Lys Phe Val Ser
545                 550                 555                 560
Asp Gly Ser Ile Asn Lys Ala Gly Phe Ala Ala Asn Phe Phe Lys Glu
                565                 570                 575
Val Asp Glu Cys Ser Trp Pro Asp His Gly Gly Cys Glu His Arg Cys
            580                 585                 590
Val Asn Thr Leu Gly Ser Tyr Lys Cys Ala Cys Asp Pro Gly Tyr Glu
        595                 600                 605
Leu Ala Ala Asp Lys Lys Met Cys Glu Val Ala Cys Gly Gly Phe Ile
    610                 615                 620
Thr Lys Leu Asn Gly Thr Ile Thr Ser Pro Gly Trp Pro Lys Glu Tyr
625                 630                 635                 640
Pro Thr Asn Lys Asn Cys Val Trp Gln Val Val Ala Pro Ala Gln Tyr
                645                 650                 655
Arg Ile Ser Leu Gln Phe Glu Val Phe Glu Leu Glu Gly Asn Asp Val
            660                 665                 670
Cys Lys Tyr Asp Phe Val Glu Val Arg Ser Gly Leu Ser Pro Asp Ala
        675                 680                 685
Lys Leu His Gly Arg Phe Cys Gly Ser Glu Thr Pro Glu Val Ile Thr
    690                 695                 700
Ser Gln Ser Asn Asn Met Arg Val Glu Phe Lys Ser Asp Asn Thr Val
705                 710                 715                 720
Ser Lys Arg Gly Phe Arg Ala His Phe Phe Ser Asp Lys Asp Glu Cys
                725                 730                 735
Ala Lys Asp Asn Gly Gly Cys Gln His Glu Cys Val Asn Thr Phe Gly
            740                 745                 750
Ser Tyr Leu Cys Arg Cys Arg Asn Gly Tyr Trp Leu His Glu Asn Gly
        755                 760                 765
His Asp Cys Lys Glu Ala Gly Cys Ala His Lys Ile Ser Ser Val Glu
    770                 775                 780
Gly Thr Leu Ala Ser Pro Asn Trp Pro Asp Lys Tyr Pro Ser Arg Arg
785                 790                 795                 800
Glu Cys Thr Trp Asn Ile Ser Ser Thr Ala Gly His Arg Val Lys Leu
                805                 810                 815
Thr Phe Asn Glu Phe Glu Ile Glu Gln His Gln Glu Cys Ala Tyr Asp
            820                 825                 830
His Leu Glu Met Tyr Asp Gly Pro Asp Ser Leu Ala Pro Ile Leu Gly
        835                 840                 845
Arg Phe Cys Gly Ser Lys Lys Pro Asp Pro Thr Val Ala Ser Gly Ser
    850                 855                 860
Ser Met Phe Leu Arg Phe Tyr Ser Asp Ala Ser Val Gln Arg Lys Gly
865                 870                 875                 880
Phe Gln Ala Val His Ser Thr Glu Cys Gly Gly Arg Leu Lys Ala Glu
                885                 890                 895
Val Gln Thr Lys Glu Leu Tyr Ser His Ala Gln Phe Gly Asp Asn Asn
            900                 905                 910
Tyr Pro Ser Glu Ala Arg Cys Asp Trp Val Ile Val Ala Glu Asp Gly
        915                 920                 925
Tyr Gly Val Glu Leu Thr Phe Arg Thr Phe Glu Val Glu Glu Glu Ala
    930                 935                 940
Asp Cys Gly Tyr Asp Tyr Met Glu Ala Tyr Asp Gly Tyr Asp Ser Ser
945                 950                 955                 960
Ala Pro Arg Leu Gly Arg Phe Cys Gly Ser Gly Pro Leu Glu Glu Ile
                965                 970                 975
Tyr Ser Ala Gly Asp Ser Leu Met Ile Arg Phe Arg Thr Asp Asp Thr
            980                 985                 990
Ile Asn Lys Lys Gly Phe His Ala Arg Tyr Thr Ser Thr Lys Phe Gln
        995                1000                1005
Asp Ala Leu His Met Lys Lys
   1010                1015
<210>3
<211>4661
<212>DNA
<213>小鼠
<220>
<221>CDS
<222>(191)..(3229)
<400>3
agtcgtgttt agcagcggct tcccgggtgt ccaggccgga cgagaacgcc ttactgggct 60
tgcttggtac cctaccggtg cctggcagcc aagcagcagc caccacaacc gaccctgtac 120
gtggtgtctc tctggatccg agctttctgt gcaggttaag tccctcgggc cccgccgacc 180
ccttgccact atg ccc ctt gcg acc act ctt ggc acc ctg gtg cta ctg    229
           Met Pro Leu Ala Thr Thr Leu Gly Thr Leu Val Leu Leu
             1               5                  10
ttg ctg cta ccg ctg ccc cgc ggt gct gaa gtg act ggg gac cat tcg   277
Leu Leu Leu Pro Leu Pro Arg Gly Ala Glu Val Thr Gly Asp His Ser
     15                  20                  25
aat gtc gcc ttg gac tac gga gcc ttg gaa ggc gag gag ggc acg gag   325
Asn Val Ala Leu Asp Tyr Gly Ala Leu Glu Gly Glu Glu Gly Thr Glu
 30                  35                  40                  45
cag cag ctg cat tac cac gac ccc tgc aaa gct gct gtc ttc tgg gga   373
Gln Gln Leu His Tyr His Asp Pro Cys Lys Ala Ala Val Phe Trp Gly
                 50                  55                  60
gat att gct ctg gat gaa gat gat ctc aag tta ttt cac atc gac aag   421
Asp Ile Ala Leu Asp Glu Asp Asp Leu Lys Leu Phe His Ile Asp Lys
             65                  70                  75
gct gag gac tgg acc aag cca tcc att gac aaa cca gga cat gac act   469
Ala Glu Asp Trp Thr Lys Pro Ser Ile Asp Lys Pro Gly His Asp Thr
         80                  85                  90
gga ggc ctt gag gag aca tct gca agg tgg cca aac gat aca gcc tct   517
Gly Gly Leu Glu Glu Thr Ser Ala Arg Trp Pro Asn Asp Thr Ala Ser
     95                 100                 105
aac gcc agc atc cag gca cca aga aag gat ggc aag gat gcc acc aca   565
Asn Ala Ser Ile Gln Ala Pro Arg Lys Asp Gly Lys Asp Ala Thr Thr
110                 115                 120                 125
ttt ctg cct aac cct ggg acc tca aac acc acc gct aag acc ttc tct   613
Phe Leu Pro Asn Pro Gly Thr Ser Asn Thr Thr Ala Lys Thr Phe Ser
                130                 135                 140
gct cga gtt cga aga gct aca acc tca agg aca gag cgg att tgg cct   661
Ala Arg Val Arg Arg Ala Thr Thr Ser Arg Thr Glu Arg Ile Trp Pro
            145                 150                 155
gga ggg gtc att cct tat gtc att gga gga aac ttt act ggt acc cag   709
Gly Gly Val Ile Pro Tyr Val Ile Gly Gly Asn Phe Thr Gly Thr Gln
        160                 165                 170
agg gcc att ttc aaa cag gcc atg agg cac tgg gag aag cac acc tgt   757
Arg Ala Ile Phe Lys Gln Ala Met Arg His Trp Glu Lys His Thr Cys
    175                 180                 185
gtg acc ttc gta gag agg aca gat gag gaa agc ttc att gta ttc agt   805
Val Thr Phe Val Glu Arg Thr Asp Glu Glu Ser Phe Ile Val Phe Ser
190                 195                 200                 205
tac agg acc tgt ggt tgt tgt tcc tac gtg gga cgc cga gga ggt ggc   853
Tyr Arg Thr Cys Gly Cys Cys Ser Tyr Val Gly Arg Arg Gly Gly Gly
                210                 215                 220
ccg cag gcc ata tcc atc ggg aaa aac tgt gac aag ttc ggc att gtg   901
Pro Gln Ala Ile Ser Ile Gly Lys Ash Cys Asp Lys Phe Gly Ile Val
            225                 230                 235
gct cac gag ctg ggc cat gtg gtt ggg ttc tgg cat gaa cac act cgg   949
Ala His Glu Leu Gly His Val Val Gly Phe Trp His Glu His Thr Arg
        240                 245                 250
cca gac cga gac caa cat gtc acc atc atc aga gaa aac atc cag cca   997
Pro Asp Arg Asp Gln His Val Thr Ile Ile Arg Glu Asn Ile Gln Pro
    255                 260                 265
ggt cag gag tat aat ttc tta aaa atg gaa gcc ggc gag gtg agc tct   1045
Gly Gln Glu Tyr Asn Phe Leu Lys Met Glu Ala Gly Glu Val Ser Ser
270                 275                 280                 285
ctg gga gag acc tac gac ttc gac agc atc atg cac tat gcc cgg aac   1093
Leu Gly Glu Thr Tyr Asp Phe Asp Ser Ile Met His Tyr Ala Arg Asn
                290                 295                 300
acc ttc tca aga gga gtt ttc tta gac acc atc ctc ccc cgt cga gac   1141
Thr Phe Ser Arg Gly Val Phe Leu Asp Thr Ile Leu Pro Arg Arg Asp
            305                 310                 315
gac aat ggc gtc agg cca acc att ggc caa cgc gtg cgg ctc agt cag   1189
Asp Asn Gly Val Arg Pro Thr Ile Gly Gln Arg Val Arg Leu Ser Gln
        320                 325                 330
gga gat ata gct caa gcc agg aag ctg tac aaa tgc cca gca tgt ggg   1237
Gly Asp Ile Ala Gln Ala Arg Lys Leu Tyr Lys Cys Pro Ala Cys Gly
    335                 340                 345
gag aca cta cag gac acg aca gga aac ttt tcg gca cct ggt ttc cca   1285
Glu Thr Leu Gln Asp Thr Thr Gly Asn Phe Ser Ala Pro Gly Phe Pro
350                 355                 360                 365
aat ggc tac ccc tcc tat tcc cac tgc gtc tgg agg atc tcc gtc acc   1333
Asn Gly Tyr Pro Ser Tyr Ser His Cys Val Trp Arg Ile Ser Val Thr
                370                 375                 380
cca ggg gaa aag atc atc cta aat ttc acc tcc atg gat ttg ttt aag   1381
Pro Gly Glu Lys Ile Ile Leu Asn Phe Thr Ser Met Asp Leu Phe Lys
            385                 390                 395
agc cgc ctg tgc tgg tac gat tac gtg gag atc cgg gat ggt tac tgg   1429
Ser Arg Leu Cys Trp Tyr Asp Tyr Val Glu Ile Arg Asp Gly Tyr Trp
        400                 405                 410
aga aag gcc ccc ctg ttg ggg agg ttc tgt ggc gat aag ata cct gag   1477
Arg Lys Ala Pro Leu Leu Gly Arg Phe Cys Gly Asp Lys Ile Pro Glu
    415                 420                 425
tcc ctt gtc tcc tcg gac agc cgg ctc tgg gtg gaa ttc cgt agc agc   1525
Ser Leu Val Ser Ser Asp Ser Arg Leu Trp Val Glu Phe Arg Ser Ser
430                 435                 440                 445
agc agc agc ctg ggc aaa ggc ttc ttt gct gta tat gaa gcc atg tgt   1573
Ser Ser Ser Leu Gly Lys Gly Phe Phe Ala Val Tyr Glu Ala Met Cys
                450                 455                 460
ggg gga gac ata acc aaa gat gca ggc cag att cag tct ccc aac tac   1621
Gly Gly Asp Ile Thr Lys Asp Ala Gly Gln Ile Gln Ser Pro Asn Tyr
            465                 470                 475
cct gac gac tac aga cct tcc aag gaa tgt gtg tgg agg atc aca gtg   1669
Pro Asp Asp Tyr Arg Pro Ser Lys Glu Cys Val Trp Arg Ile Thr Val
        480                 485                 490
ccc gac ggg ttc cat gtg gga ctt acc ttc cag tcc ttc gag atc gaa   1717
Pro Asp Gly Phe His Val Gly Leu Thr Phe Gln Ser Phe Glu Ile Glu
    495                 500                 505
agg cat gac agt tgt gca tat gac tat ctg gaa atc cga gac ggt ccc   1765
Arg His Asp Ser Cys Ala Tyr Asp Tyr Leu Glu Ile Arg Asp Gly Pro
510                 515                 520                 525
aca gag gac agc acc ctg att ggc cac ttc tgt ggc tac gag aag ccg   1813
Thr Glu Asp Ser Thr Leu Ile Gly His Phe Cys Gly Tyr Glu Lys Pro
                530                 535                 540
gag gcc gtg aaa tcc agc gct aac cga ctg tgg gtg aag ttt gtg tcc   1861
Glu Ala Val Lys Ser Ser Ala Asn Arg Leu Trp Val Lys Phe Val Ser
            545                 550                 555
gac ggc tcc atc aat aaa gcg ggc ttt gca gcc aat ttc ttc aag gag   1909
Asp Gly Ser Ile Asn Lys Ala Gly Phe Ala Ala Asn Phe Phe Lys Glu
        560                 565                 570
gtg gat gag tgc tcc tgg cca gac cat ggt gga tgt gag cag cgc tgt   1957
Val Asp Glu Cys Ser Trp Pro Asp His Gly Gly Cys Glu Gln Arg Cys
    575                 580                 585
gta aac aca ctc ggc agc tac acg tgt gcc tgt gac cct ggc tac gaa   2005
Val Asn Thr Leu Gly Ser Tyr Thr Cys Ala Cys Asp Pro Gly Tyr Glu
590                 595                 600                 605
ctg gct gcc gac aag aag aca tgt gaa gtg gcc tgt ggt ggc ttc att   2053
Leu Ala Ala Asp Lys Lys Thr Cys Glu Val Ala Cys Gly Gly Phe Ile
                610                 615                 620
acc aag cta aac ggc acc atc acc agc cct gga tgg ccg aag gag tat   2101
Thr Lys Leu Asn Gly Thr Ile Thr Ser Pro Gly Trp Pro Lys Glu Tyr
            625                 630                 635
ccc acc aac aag aac tgt gtc tgg cag gtg gtg gct ccc gtg cag tac   2149
Pro Thr Asn Lys Asn Cys Val Trp Gln Val Val Ala Pro Val Gln Tyr
        640                 645                 650
cgc atc tca ctg cag ttc gaa gcc ttt gag ctg gaa ggc aat gac gtc   2197
Arg Ile Ser Leu Gln Phe Glu Ala Phe Glu Leu Glu Gly Asn Asp Val
    655                 660                 665
tgt aag tat gac ttc gta gag gtg cgc agt ggc ctg tcc cca gat gcc   2245
Cys Lys Tyr Asp Phe Val Glu Val Arg Ser Gly Leu Ser Pro Asp Ala
670                 675                 680                 685
aag ctt cac ggc aaa ttc tgt ggc tcc gag acc ccg gag gtc atc aca   2293
Lys Leu His Gly Lys Phe Cys Gly Ser Glu Thr Pro Glu Val Ile Thr
                690                 695                 700
tcg cag agc aac aac atg cga gtg gaa ttc aag tct gac aac acc gtc   2341
Ser Gln Ser Asn Asn Met Arg Val Glu Phe Lys Ser Asp Asn Thr Val
            705                 710                 715
tcc aag cga ggc ttc agg gct cac ttc ttc tca gac aaa gac gag tgt   2389
Ser Lys Arg Gly Phe Arg Ala His Phe Phe Ser Asp Lys Asp Glu Cys
        720                 725                 730
gcc aaa gac aat ggc ggc tgc cag cag gag tgt gtc aac acg ttc ggg   2437
Ala Lys Asp Asn Gly Gly Cys Gln Gln Glu Cys Val Asn Thr Phe Gly
    735                 740                 745
agt tac ctg tgc aga tgc agg aac ggg tac cga ctg cat gag aac gga   2485
Ser Tyr Leu Cys Arg Cys Arg Asn Gly Tyr Arg Leu His Glu Asn Gly
750                 755                 760                 765
cac gac tgc aaa gag gct ggc tgc gcc tac aag atc agc agt gca gag   2533
His Asp Cys Lys Glu Ala Gly Cys Ala Tyr Lys Ile Ser Ser Ala Glu
                770                 775                 780
ggg acc ctg atg agt cct aac tgg cca gac aaa tac ccc agc cgg aag   2581
Gly Thr Leu Met Ser Pro Asn Trp Pro Asp Lys Tyr Pro Ser Arg Lys
            785                 790                 795
gaa tgt acc tgg aac att tca tca acc gca ggc cac agg gtg aaa att   2629
Glu Cys Thr Trp Asn Ile Ser Ser Thr Ala Gly His Arg Val Lys Ile
        800                 805                 810
aca ttc agt gag ttc gag att gag cag cac cag gaa tgt gcc tat gac   2677
Thr Phe Ser Glu Phe Glu Ile Glu Gln His Gln Glu Cys Ala Tyr Asp
    815                 820                 825
cac ctg gaa ctg tac gat ggg aca gac agc ttg gcc ccc atc ctt ggc   2725
His Leu Glu Leu Tyr Asp Gly Thr Asp Ser Leu Ala Pro Ile Leu Gly
830                 835                 840                 845
cgc ttc tgc ggc agc aag aag ccg gat ccc gtg gtg gcg aca ggc agc   2773
Arg Phe Cys Gly Ser Lys Lys Pro Asp Pro Val Val Ala Thr Gly Ser
                850                 855                 860
agc cta ttc ctc agg ttt tac tcg gac gcc tca gtg cag cgg aaa ggc   2821
Ser Leu Phe Leu Arg Phe Tyr Ser Asp Ala Ser Val Gln Arg Lys Gly
            865                 870                 875
ttc cag gct gtg cac agc aca gag tgt ggg ggc agg ctg aag gct gaa   2869
Phe Gln Ala Val His Ser Thr Glu Cys Gly Gly Arg Leu Lys Ala Glu
        880                 885                 890
gta cag acc aaa gag ctc tat tcc cat gcc cag ttt ggg gac aac aac   2917
Val Gln Thr Lys Glu Leu Tyr Ser His Ala Gln Phe Gly Asp Asn Asn
    895                 900                 905
tac ccg agc cag gcc cgc tgt gac tgg gtg ata gtg gca gaa gac ggt   2965
Tyr Pro Ser Gln Ala Arg Cys Asp Trp Val Ile Val Ala Glu Asp Gly
910                 915                 920                 925
tat ggc gtg gag ctg ata ttc cgg acc ttt gaa gtt gag gag gaa gct   3013
Tyr Gly Val Glu Leu Ile Phe Arg Thr Phe Glu Val Glu Glu Glu Ala
                930                 935                 940
gac tgt ggc tac gac ttc atg gag gct tat gat ggg tac gac agc tcg   3061
Asp Cys Gly Tyr Asp Phe Met Glu Ala Tyr Asp Gly Tyr Asp Ser Ser
            945                 950                 955
gca ccc agg ctc ggc cgc ttc tgt ggc tca ggg cca tta gag gaa atc   3109
Ala Pro Arg Leu Gly Arg Phe Cys Gly Ser Gly Pro Leu Glu Glu Ile
        960                 965                 970
tac tcc gcc gga gac tcg cta atg atc cgc ttc cac acg gac gac acc   3157
Tyr Ser Ala Gly Asp Ser Leu Met Ile Arg Phe His Thr Asp Asp Thr
    975                 980                 985
atc aac aag aaa ggc ttt cac gcc cgg tac act agc acc aag ttc caa   3205
Ile Asn Lys Lys Gly Phe His Ala Arg Tyr Thr Ser Thr Lys Phe Gln
990                 995                1000                1005
gac gcc ttg cac atg agg aag tag cgcctcagtt ctggaaaggc agagagactg  3259
Asp Ala Leu His Met Arg Lys
               1010
agggtgtttt aaacacttgc gagtgagcag cctcccatgt acagtgtttt ttctccacaa 3319
caaaaaccca aactatgttc ttgaaactct atatctgggt gacagtacat gcctttggcc 3379
aacgggagga gagagagggg ccgttggttc tggctgtggc gttatcagtc gcagcttctg 3439
gaggaggtca aagtttgatg ttagcgacca aacaggatga cttcttcaca tttgtctcta 3499
agctttgctc ctgtggctcc gaaggccagc ctggggcaaa aggacagctt agggcaaaag 3559
actgcctctc tctcaactct ggcccggctt ccatagatgg catgagccca gtgtgctggt 3619
gacttggctg ccctctgact actgggcatg gaggattata gattggcagc ggcttcgctg 3679
atactcgcag gtgtggctga acgcttctgt gcagttctac cagagtcaag ccaatcaaga 3739
aaccggagac cgtggacacg agagttaagg tggcatccca gggcacaggg agggggctca 3799
acctgggaac cacataatgg cgctggaaga ccttgagcat cttcctctgg ccctgcttgt 3859
ccttgtcacc tctggggagc ccctgtcatc agtctccatt cagaaaggag aacccacggt 3919
cactcctagc agaacattcg ctggcgagca cccccaggtt gctgagagga cgcctagctt 3979
cacccaatat ttctcctctg ctcagaggct tagaagatga tgtcacctgc gctggggttc 4039
ccagatgtca cctgggctgg ggttcccatg ggcttccagg aacctcccag ctgaaggcac 4099
ctgctctggc gaacctcagc cgctggacag ccagttcaaa cagcatctgc gagacgtgtc 4159
aagtcatctc aggaccaatc cacgtctcac tgggagaaaa ctagtaattc cacattatct 4219
aagagccacc gtctctggaa caaggtggtc tgtggtacga ctcatgtaac cagacaggtt 4279
agagtgcgtg gacggctttg ctgggattaa ccgggaccca gccgccctct tgcactcaga 4339
attctcagca cccctgcact tgctctagcg gcgtgttaag ggtgatgttt acataatttt 4399
agcacctcaa ggtataatcg aaatagtgag gtagttttga atggcatttc gttaaggcat 4459
ctctgggcat tatgagctta aaagctgtgg tacgttagct ttctaagagc atttatgttg 4519
gaatactttt aaaataatgt ttacattaac taactgcaag tcctgttggt tgggttggtg 4579
gcaaacgcag ggcggcggca caggagactg ttgctgttag agatggcgta gctcccaagc 4639
accagaatcc ctatgtgatc ta                                          4661
<210>4
<211>1012
<212>蛋白质
<213>小鼠
<400>4
Met Pro Leu Ala Thr Thr Leu Gly Thr Leu Val Leu Leu Leu Leu Leu
  1               5                  10                  15
Pro Leu Pro Arg Gly Ala Glu Val Thr Gly Asp His Ser Asn Val Ala
             20                  25                  30
Leu Asp Tyr Gly Ala Leu Glu Gly Glu Glu Gly Thr Glu Gln Gln Leu
         35                  40                  45
His Tyr His Asp Pro Cys Lys Ala Ala Val Phe Trp Gly Asp Ile Ala
     50                  55                  60
Leu Asp Glu Asp Asp Leu Lys Leu Phe His Ile Asp Lys Ala Glu Asp
 65                  70                  75                  80
Trp Thr Lys Pro Ser Ile Asp Lys Pro Gly His Asp Thr Gly Gly Leu
                 85                  90                  95
Glu Glu Thr Ser Ala Arg Trp Pro Asn Asp Thr Ala Ser Asn Ala Ser
            100                 105                 110
Ile Gln Ala Pro Arg Lys Asp Gly Lys Asp Ala Thr Thr Phe Leu Pro
        115                 120                 125
Asn Pro Gly Thr Ser Asn Thr Thr Ala Lys Thr Phe Ser Ala Arg Val
    130                 135                 140
Arg Arg Ala Thr Thr Ser Arg Thr Glu Arg Ile Trp Pro Gly Gly Val
145                 150                 155                 160
Ile Pro Tyr Val Ile Gly Gly Asn Phe Thr Gly Thr Gln Arg Ala Ile
                165                 170                 175
Phe Lys Gln Ala Met Arg His Trp Glu Lys His Thr Cys Val Thr Phe
            180                 185                 190
Val Glu Arg Thr Asp Glu Glu Ser Phe Ile Val Phe Ser Tyr Arg Thr
        195                 200                 205
Cys Gly Cys Cys Ser Tyr Val Gly Arg Arg Gly Gly Gly Pro Gln Ala
    210                 215                 220
Ile Ser Ile Gly Lys Asn Cys Asp Lys Phe Gly Ile Val Ala His Glu
225                 230                 235                 240
Leu Gly His Val Val Gly Phe Trp His Glu His Thr Arg Pro Asp Arg
                245                 250                 255
Asp Gln His Val Thr Ile Ile Arg Glu Asn Ile Gln Pro Gly Gln Glu
            260                 265                 270
Tyr Asn Phe Leu Lys Met Glu Ala Gly Glu Val Ser Ser Leu Gly Glu
        275                 280                 285
Thr Tyr Asp Phe Asp Ser Ile Met His Tyr Ala Arg Asn Thr Phe Ser
    290                 295                 300
Arg Gly Val Phe Leu Asp Thr Ile Leu Pro Arg Arg Asp Asp Asn Gly
305                 310                 315                 320
Val Arg Pro Thr Ile Gly Gln Arg Val Arg Leu Ser Gln Gly Asp Ile
                325                 330                 335
Ala Gln Ala Arg Lys Leu Tyr Lys Cys Pro Ala Cys Gly Glu Thr Leu
            340                 345                 350
Gln Asp Thr Thr Gly Asn Phe Ser Ala Pro Gly Phe Pro Asn Gly Tyr
        355                 360                 365
Pro Ser Tyr Ser His Cys Val Trp Arg Ile Ser Val Thr Pro Gly Glu
    370                 375                 380
Lys Ile Ile Leu Asn Phe Thr Ser Met Asp Leu Phe Lys Ser Arg Leu
385                 390                 395                 400
Cys Trp Tyr Asp Tyr Val Glu Ile Arg Asp Gly Tyr Trp Arg Lys Ala
                405                 410                 415
Pro Leu Leu Gly Arg Phe Cys Gly Asp Lys Ile Pro Glu Ser Leu Val
            420                 425                 430
Ser Ser Asp Ser Arg Leu Trp Val Glu Phe Arg Ser Ser Ser Ser Ser
        435                 440                 445
Leu Gly Lys Gly Phe Phe Ala Val Tyr Glu Ala Met Cys Gly Gly Asp
    450                 455                 460
Ile Thr Lys Asp Ala Gly Gln Ile Gln Ser Pro Asn Tyr Pro Asp Asp
465                 470                 475                 480
Tyr Arg Pro Ser Lys Glu Cys Val Trp Arg Ile Thr Val Pro Asp Gly
                485                 490                 495
Phe His Val Gly Leu Thr Phe Gln Ser Phe Glu Ile Glu Arg His Asp
            500                 505                 510
Ser Cys Ala Tyr Asp Tyr Leu Glu Ile Arg Asp Gly Pro Thr Glu Asp
        515                 520                 525
Ser Thr Leu Ile Gly His Phe Cys Gly Tyr Glu Lys Pro Glu Ala Val
    530                 535                 540
Lys Ser Ser Ala Asn Arg Leu Trp Val Lys Phe Val Ser Asp Gly Ser
545                 550                 555                 560
Ile Asn Lys Ala Gly Phe Ala Ala Asn Phe Phe Lys Glu Val Asp Glu
                565                 570                 575
Cys Ser Trp Pro Asp His Gly Gly Cys Glu Gln Arg Cys Val Asn Thr
            580                 585                 590
Leu Gly Ser Tyr Thr Cys Ala Cys Asp Pro Gly Tyr Glu Leu Ala Ala
        595                 600                 605
Asp Lys Lys Thr Cys Glu Val Ala Cys Gly Gly Phe lle Thr Lys Leu
    610                 615                 620
Asn Gly Thr Ile Thr Ser Pro Gly Trp Pro Lys Glu Tyr Pro Thr Asn
625                 630                 635                 640
Lys Asn Cys Val Trp Gln Val Val Ala Pro Val Gln Tyr Arg Ile Ser
                645                 650                 655
Leu Gln Phe Glu Ala Phe Glu Leu Glu Gly Asn Asp Val Cys Lys Tyr
            660                 665                 670
Asp Phe Val Glu Val Arg Ser Gly Leu Ser Pro Asp Ala Lys Leu His
        675                 680                 685
Gly Lys Phe Cys Gly Ser Glu Thr Pro Glu Val Ile Thr Ser Gln Ser
    690                 695                 700
Asn Asn Met Arg Val Glu Phe Lys Ser Asp Asn Thr Val Ser Lys Arg
705                 710                 715                 720
Gly Phe Arg Ala His Phe Phe Ser Asp Lys Asp Glu Cys Ala Lys Asp
                725                 730                 735
Asn Gly Gly Cys Gln Gln Glu Cys Val Asn Thr Phe Gly Ser Tyr Leu
            740                 745                 750
Cys Arg Cys Arg Asn Gly Tyr Arg Leu His Glu Asn Gly His Asp Cys
        755                 760                 765
Lys Glu Ala Gly Cys Ala Tyr Lys Ile Ser Ser Ala Glu Gly Thr Leu
    770                 775                 780
Met Ser Pro Asn Trp Pro Asp Lys Tyr Pro Ser Arg Lys Glu Cys Thr
785                 790                 795                 800
Trp Asn Ile Ser Ser Thr Ala Gly His Arg Val Lys Ile Thr Phe Ser
                805                 810                 815
Glu Phe Glu Ile Glu Gln His Gln Glu Cys Ala Tyr Asp His Leu Glu
            820                 825                 830
Leu Tyr Asp Gly Thr Asp Ser Leu Ala Pro Ile Leu Gly Arg Phe Cys
        835                 840                 845
Gly Ser Lys Lys Pro Asp Pro Val Val Ala Thr Gly Ser Ser Leu Phe
    850                 855                 860
Leu Arg Phe Tyr Ser Asp Ala Ser Val Gln Arg Lys Gly Phe Gln Ala
865                 870                 875                 880
Val His Ser Thr Glu Cys Gly Gly Arg Leu Lys Ala Glu Val Gln Thr
                885                 890                 895
Lys Glu Leu Tyr Ser His Ala Gln Phe Gly Asp Asn Asn Tyr Pro Ser
            900                 905                 910
Gln Ala Arg Cys Asp Trp Val Ile Val Ala Glu Asp Gly Tyr Gly Val
        915                 920                 925
Glu Leu Ile Phe Arg Thr Phe Glu Val Glu Glu Glu Ala Asp Cys Gly
    930                 935                 940
Tyr Asp Phe Met Glu Ala Tyr Asp Gly Tyr Asp Ser Ser Ala Pro Arg
945                 950                 955                 960
Leu Gly Arg Phe Cys Gly Ser Gly Pro Leu Glu Glu Ile Tyr Ser Ala
                965                 970                 975
Gly Asp Ser Leu Met Ile Arg Phe His Thr Asp Asp Thr Ile Asn Lys
            980                 985                 990
Lys Gly Phe His Ala Arg Tyr Thr Ser Thr Lys Phe Gln Asp Ala Leu
        995                1000                1005
His Met Arg Lys
   1010
<210>5
<211>20
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:寡核苷酸引物1
<400>5
cargcmatgm gnactgggag                                            20
<210>6
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:寡核苷酸引物2
<400>6
cargcmatgm gncactggga a                                          21
<210>7
<211>22
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:寡核苷酸引物3
<400>7
gaadgtgttv ckngcrtart gc                                         22
<210>8
<211>27
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:寡核苷酸引物4
<400>8
tgtggtgtct gggctgctct cagatgc                                    27
<210>9
<211>25
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:寡核苷酸引物5
<400>9
actgtctgct tggtccagtc tctgg                                      25
<210>10
<211>27
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:寡核苷酸引物6
<400>10
tacctggaag tccgggatgg ccccacg                                    27
<210>11
<2ll>28
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:寡核苷酸引物7
<400>11
gaggatgtga aatcgagctc caacagac                                   28
<210>12
<211>27
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:寡核苷酸引物8-11
<400>12
raanccytty ttnnndatng trtcrtc                                    27
<210>13
<211>24
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:寡核苷酸引物12
<400>13
caacaactac ccgagcgagg cccc                                       24
<210>14
<211>26
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:寡核苷酸引物12
<400>14
gaagcctacg acggctacga cagctc                                     26
<210>15
<21l>25
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:寡核苷酸引物14
<400>15
gctttcctca tctgtcctct ctacg                                      25
<210>16
<211>23
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:寡核苷酸引物15
<400>16
cctgtgtgac cttcgtagag agg                                        23
<210>17
<211>24
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:寡核苷酸引物16
<400>17
tgggagctga gcaatgctaa ctgc                                       24
<210>18
<211>24
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:寡核苷酸引物17
<400>18
gaaggtgttc cgggcgtagt gcat                                       24

Claims (19)

1.一种分离的多核苷酸,它包含编码具有选自SEQ ID NO:2和SEQ ID NO:4的氨基酸序列的切割前赖氨酰氧化酶的多肽的多核苷酸。
2.根据权利要求1所述的多核苷酸,它包含编码SEQ ID NO:2的多核苷酸。
3.根据权利要求1所述的多核苷酸,它包含编码SEQ ID NO:4的多核苷酸。
4.根据权利要求1所述的多核苷酸,它包含SEQ ID NO:1的核苷酸365-3409。
5.根据权利要求1所述的多核苷酸,它包含SEQ ID NO:1。
6.根据权利要求1所述的多核苷酸,它包含SEQ ID NO:3的核苷酸191-3229。
7.根据权利要求1所述的多核苷酸,它包含SEQ ID NO:3。
8.一种表达载体,它包含权利要求1所述的多核苷酸以及与该多核苷酸操作性相连的转录启动子。
9.根据权利要求8所述的表达载体,其中多核苷酸包含SEQ ID NO:1的核苷酸365-3409。
10.根据权利要求8所述的表达载体,其中多核苷酸包含SEQ ID NO:1。
11.根据权利要求8所述的表达载体,其中多核苷酸包含SEQ ID NO:3的核苷酸191-3229。
12.根据权利要求8所述的表达载体,其中多核苷酸包含SEQ ID NO:3。
13.一种分离的多核苷酸,它与权利要求1所述的多核苷酸全长互补。
14.一种宿主细胞,它包含权利要求1所述的多核苷酸。
15.一种宿主细胞,它包含权利要求8所述的表达载体。
16.一种产生多肽的方法,该多肽包含选自SEQ ID NO:2和SEQ ID NO:4的氨基酸序列,该方法包括:
在适合表达该多肽的条件下培养权利要求15所述的宿主细胞;和回收该多肽。
17.一种分离的多核苷酸,它在下列条件下与SEQ ID NO:1或SEQID NO:3的序列杂交:在65℃杂交18小时,然后在室温下用2×SSC、0.1%SDS第一次洗涤30分钟,在65℃用2×SSC、0.1%SDS第二次洗涤30分钟,在65℃用0.1×SSC、0.1%SDS第三次洗涤30分钟。
18.一种分离的多肽,它包含选自SEQ ID NO:2和SEQ ID NO:4的序列,该多肽切割前赖氨酰氧化酶。
19.一种选择调节mTll-2蛋白活性的试剂的方法,该方法包括下列步骤:
在支持mTll-2蛋白功能、有和没有一种或多种推定的调节活性的试剂的条件下,评价mTll-2蛋白的活性;和
从一种或多种推定的试剂中选出与没有试剂时的该蛋白质活性相比能调节该蛋白质活性的试剂。
CNB998065471A 1998-04-03 1999-04-02 哺乳动物的特洛德样基因和蛋白质 Expired - Fee Related CN1154735C (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US8055098P 1998-04-03 1998-04-03
US60/080,550 1998-04-03
US11187398P 1998-12-11 1998-12-11
US60/111,873 1998-12-11

Publications (2)

Publication Number Publication Date
CN1302332A CN1302332A (zh) 2001-07-04
CN1154735C true CN1154735C (zh) 2004-06-23

Family

ID=26763656

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB998065471A Expired - Fee Related CN1154735C (zh) 1998-04-03 1999-04-02 哺乳动物的特洛德样基因和蛋白质

Country Status (7)

Country Link
US (1) US6579702B2 (zh)
EP (1) EP1068337A2 (zh)
JP (1) JP2002510487A (zh)
CN (1) CN1154735C (zh)
AU (1) AU765129B2 (zh)
CA (1) CA2325058C (zh)
WO (1) WO1999051730A2 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2003295600A1 (en) * 2002-11-14 2004-06-15 Dharmacon, Inc. Functional and hyperfunctional sirna
CR20160316A (es) 2014-01-10 2016-09-19 Glaxosmithkline Intellectual Property (No 2) Ltd Compuestos derivados de hidroxiformamida y usos del mismo

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR9709370A (pt) 1996-05-30 1999-10-05 Wisconsin Alumni Res Found Gene semelhante a tolóide de mamìfero e proteìna.
US6008017A (en) 1997-01-02 1999-12-28 Smithkline Beecham Corporation Human cardiac/brain tolloid-like protein

Also Published As

Publication number Publication date
CA2325058C (en) 2011-07-12
WO1999051730A3 (en) 2000-01-06
CN1302332A (zh) 2001-07-04
EP1068337A2 (en) 2001-01-17
US20020150946A1 (en) 2002-10-17
JP2002510487A (ja) 2002-04-09
AU3467999A (en) 1999-10-25
CA2325058A1 (en) 1999-10-14
US6579702B2 (en) 2003-06-17
WO1999051730A2 (en) 1999-10-14
AU765129B2 (en) 2003-09-11

Similar Documents

Publication Publication Date Title
CN1520299A (zh) 具有nep/mp-联合抑制活性的化合物在制备药物中的用途
CN1134172A (zh) 原钙粘着蛋白蛋白质及其应用
CN1091469A (zh) Ptp 1d:一种新蛋白质酪氨酸磷酸
CN1091139A (zh) 蛋白质酪氨酸磷酸酶的ptp-d亚家族
CN1961073A (zh) 切割型dance、dance复合体及其使用方法
CN1592793A (zh) 肝细胞癌-相关基因和多肽,以及检测肝细胞癌的方法
CN1167793C (zh) 人脂酶样基因编码的多肽及利用它的组合物和方法
CN1250717C (zh) 金属蛋白酶家族中的人酶
CN1220608A (zh) 哺乳动物的特洛德样基因和蛋白质
CN1154735C (zh) 哺乳动物的特洛德样基因和蛋白质
CN1283793C (zh) 具有骨骼肌刺激活性和免疫调节作用的趋化素样因子超家族
CN1223608C (zh) 与半胱天冬蛋白酶-8相互作用的蛋白
CN1630708A (zh) 破骨细胞相关受体
CN1170931C (zh) 血管发生相关分子
CN1241940C (zh) 新型胶原蛋白样蛋白clac、其前体和它们的编码基因
CN1390256A (zh) 新型蛋白质及其dna
CN1286973C (zh) 一种组蛋白甲基转移酶及其制备方法
CN1932016A (zh) 影响sre活性的多核苷酸及其编码多肽和用途
CN1177864C (zh) 在肝癌组织中具有表达差异的新的人蛋白及其编码序列
CN1246457C (zh) 人tsc403基因和人ing1l基因
CN1241941C (zh) 一种促进神经分化和抗细胞凋亡的蛋白质及其编码基因
CN1238375C (zh) 钠离子推动的氯离子/碳酸氢根交换蛋白
CN1900279A (zh) 诱导细胞凋亡的多核苷酸及其编码的多肽和用途
CN1500807A (zh) 利用人和鼠Rhor基因及其编码产物诊断和治疗秃发的方法
CN1222616C (zh) 具有抑癌功能的新的人蛋白及其编码序列

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20040623