CN1057096C - 蛋白质pl40多肽及编码该多肽的DNA - Google Patents

蛋白质pl40多肽及编码该多肽的DNA Download PDF

Info

Publication number
CN1057096C
CN1057096C CN94119935A CN94119935A CN1057096C CN 1057096 C CN1057096 C CN 1057096C CN 94119935 A CN94119935 A CN 94119935A CN 94119935 A CN94119935 A CN 94119935A CN 1057096 C CN1057096 C CN 1057096C
Authority
CN
China
Prior art keywords
val
ala
ser
leu
arg
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN94119935A
Other languages
English (en)
Other versions
CN1112127A (zh
Inventor
田岛久男
北川幸一郎
大野博之
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ono Pharmaceutical Co Ltd
Original Assignee
Ono Pharmaceutical Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ono Pharmaceutical Co Ltd filed Critical Ono Pharmaceutical Co Ltd
Publication of CN1112127A publication Critical patent/CN1112127A/zh
Application granted granted Critical
Publication of CN1057096C publication Critical patent/CN1057096C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physics & Mathematics (AREA)
  • Toxicology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Peptides Or Proteins (AREA)
  • Saccharide Compounds (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本发明涉及作为胰岛素信号传递系统关键蛋白的新蛋白质p140多肽;制备该肽的方法;编码该多肽的DNA;由该DNA衍生的载体;该载体转化的宿主细胞;该多肽的抗体;含该多肽或抗体的药物组合物;预防和/或治疗糖尿病的方法,其特征在于使所述蛋白质p140酷氨酸磷酸化;用于该预防和/或治疗方法的预防和/或治疗药剂;预防和/或治疗糖尿病的药剂,其特征在于含有使蛋白质p140酷氨酸磷酸化的化合物作为活性成从;筛选该预防和/或治疗药剂的方法。

Description

蛋白质pl40多肽及编码该多肽的DNA
本发明涉及作为胰岛素信号传递系统之关键性蛋白质的新蛋白质p140多肽;其制备方法;编码所述多肽的DNA;所说DNA衍生的载体;所说载体转化的宿主细胞;所说多肽的抗体;含所说肽或抗体的药物组合物;以所说蛋白质p140之酪氨酸磷酸化(本说明书中以下称为磷酸化)为特征的预防和/或治疗糖尿病的方法;用于上述预防和/或治疗方法的预防和/或治疗药剂;预防和/或治疗糖尿病的药剂,其中含有可使蛋白质p140酪氨酸磷酸化的化合物作为活性成分;以及筛选所说预防和/或治疗剂的方法。
糖尿病是一种因葡萄糖代谢机制缺陷而诱发的异常性代谢疾病。
正常情况下,葡萄糖代谢过程如下:以食物形式吸收的糖类在小肠中被消化成葡萄糖,然后被吸收到循环系统内。胰脏β细胞通过分泌胰岛素对血葡萄糖水平增高发生反应,然后刺激靶外周组织(肌肉和肝),以通过增加组织对血葡萄糖的吸收,然后将葡萄糖转化成糖元储存来降低血葡萄糖水平。
依据病原因素的不同,将糖尿病大致分为两大类:胰岛素依赖型糖尿病(IDDM)和非胰岛素依赖型糖尿病(NIDDM)。IDDM(I型糖尿病)是在胰β细胞在对由食物吸收而诱发的血葡萄糖水平升高发生反应时,不分泌胰岛素或胰岛素分泌不足的病理状态。已经知道,胰腺胰岛的β细胞的破坏会诱发IDDM。目前的治疗方法是经外源补充胰岛素。
NIDDM(II型糖尿病)是一种尽管在活体系统中,分泌正常的胰岛素但由于外周组织的反馈机制功能障碍,并且不能有效地降低血葡萄糖水平的病理条件。在美国,NIDDM被认为是一种常见病;40岁以上的人群中有5%患有NIDDM。已阐明了该疾病的致病因素。
阐明了NIDDM的病因学;即澄清了外周组织细胞中胰岛素诱导的葡萄糖摄入机制,但目前关于胰岛素信息传递机制的知识还很少并且尚不明确。
从胰岛分泌的胰岛素与外周组织细胞细胞膜上的胰岛素受体结合。有关结合后的信息传递、磷酸化酶级联反应和二级信使理论是目前研究的课题。
这两种理论可简要总结如下:
磷酸化酶级联理论:
当胰岛素与胰岛素受体α亚单位结合,存在于细胞内膜上的β亚单位激发磷酸化过程,同时激活受体内的酪氨酸激酶位点。后一种酶使底物磷酸化后产生三种不同的蛋白质。一种相当于胰岛素受体底物-1(IRS-1)且分子量为185KD 1235个氨基酸组成的蛋白质。在IRS-1的酪氨酸磷酸化后,磷酯酰肌醇的磷酸化酶,PI1
-激酶与复合物结合从而将其激活。与涉及位于膜和膜褶皱内的葡萄糖转运体有关的结合后过程已被确认。除IRS-1已证实了另外两种蛋白质底物(Shc和PTP  -1c)的存在。但更深入的机理尚未完全阐明。
二级信使理论
当胰岛素与胰岛素受体结合时,磷酯酶c被特异性地激活以降解磷酯酰肌糖(PIG),经水解产生肌醇聚糖(IG)和二酰基甘油(DAG)。虽然已报导IG表现有多种类似胰岛素的作用,但也已证明了典型的葡萄糖摄入效应。
然而,在DAG激活的蛋白质激酶C过程中,已经知道是位于细胞膜内的蛋白质激酶C被激活。这就意味着DAG可相继使内膜蛋白质磷酸化以最终激发葡萄糖摄入。但这种关系迄今仍不清楚。
虽然迄今这两个学说都在流行,但每种理理论只能部分地解释与信息传递相关的结合后过程的初始阶段的情况。
根据Copper等人(1988年)的报导,从b胰腺细胞释放的激素-糊精与高血糖症时分泌胰岛素的激素相似。基于他们的发现,糊精抑制胰岛素的作用,并表明该激素可被用作胰岛素的拮抗剂。1991年报导的进一步研究结果表明,在转基因小鼠体内过多使用糊精可诱发NIDDM。然而,迄今仍未揭示糊精与胰岛素信息传递的关系。
本发明的发明人注意到糊精的胰岛素拮抗性质。基于对糊精在胰岛素信息传递系统中所发挥的作用进行的长期研究工作,发明人首先鉴定了糊精在调节胰岛素信息传递系统中的抑制位点,并发现了关键性蛋白质,即与这一现象有关的磷酸化蛋白质140和70(pp140和pp70)。本发明明确揭示了所说蛋白质的结构(DNA碱基序列和氨基酸序列),并阐明了它们的功能以全面补充迄今尚未得到完善解释的胰岛素信息传递现象。
图1显示维生素K5(VK5)对链脲菌素(STZ)诱导的糖尿病大鼠体内血萄萄糖含量的影响。
图2显示维生素K5(VK5)对链脲菌素(STZ)诱导的糖尿病大鼠血液中性脂肪含量的影响。
图3显示维生素K5(VK5)对链脲菌素(STZ)诱导的糖尿病大鼠血胆固醇含量的影响。
图4显示本发明的蛋白质p140多肽的疏水性曲线。
图5显示pUCSR a MLZ载体。
本发明涉及由所示SEQ ID No.1构成的所述蛋白质p140之真实氨基酸序列的同源序列及片段序列。另外,编码所说同源序列和片段序列的有关多肽的DNA也包括在本发明范围内。具体的说,所说的DNA是编码和/或具有与SEQ ID No.2和3中所示碱基序列可选择性杂交之片段的DNA。
再者,本发明还涉及以所说的蛋白质p140的酪氨酸磷酸化为特征的预防和/或治疗糖尿病的方法,用于目前所说预防和/或治疗方法的预防和/或治疗药剂预防和/或治疗糖尿病的药剂,其特征在于含有作为活性成分的可使蛋白质p140酪氨酸磷酸化的化合物;以及筛选所说预防和/或治疗剂的方法。
具体地说,本发明包括:
(1)由SEQ ID No.1中所示氨基酸序列构成的多肽。
(2)编码(1)中所述多肽的DNA。
(3)具有SEQ ID No.2中所示碱基序列的DNA。
(4)具有SEQ ID No.3中所示碱基序列的DNA。
(5)预防和/或治疗糖尿病的方法,特征在于蛋白质p140的酪氨酸磷酸化。(6)预防和/或治疗糖尿病的药剂,特征在于蛋白质p140的酪氨酸磷酸化。
(7)糖尿病的预防和/或治疗剂,特征在于其含有作为活性成分的可使蛋白质p140酪氨酸磷酸化的化合物,以及
(8)以使用蛋白质p140的化合物为特征的筛选糖尿病预防和/或治疗剂的方法。
健康大鼠服用糊精(0.1mg/kg,腹腔注射,每日三次)7天后,胰岛素受体群和分泌的胰岛素量均显著降低。这些观察结果伴有葡萄糖转运体4(Glut4)量和合成的糖原含量降低(比对照组降低50%以下),同时使血葡萄糖含量增加1.7倍。另外,在使用大鼠骨骼肌成肌细胞的L6细胞(ATCC菌株CRL-1458)进行的实验中,观到在施用糊精后细胞中的葡萄糖摄入降低。
然后,使用抗磷酸酪氨酸抗体,以Western印迹法研究用糊精处理的骨胳肌成肌细胞中胰岛素诱导的酪氨酸磷酸化级联反应的变化。实验中,如将L6细胞与胰岛素一起保温培养,酪氨酸磷酸化作用提高。然而,在相似条件下用糊精预处理,则进一步证实存在两种不同的抑制磷酸化作用的蛋白质。根据这些蛋白质的分子量,下文中将它们分别称为pp140和pp70。
发明人制备、分离并纯化了pp140和pp70,然后测定了它们的部分氨基酸序列。根据对所说氨基酸序列与在Swiss plot release 2.0中,先前记载的多肽序列进行相似性比较,表明pp70与已知的葡萄糖调节蛋白质70一致。然后,这些结果表明pp140是一种完全未知的新蛋白质。因此,本发明人从大鼠骨胳肌成肌细胞中分离了p140的mRNA,并使用分离的p140的mRNA,构建了cDNA,然后测定了全部的碱基序列及所说蛋白质的全部氨基酸序列。这些结果成功地揭示了一个完整的新多肽和编码该多肽的总DNA链,从而完成了本发明。
根据上述发现,可以了解到糊精可能分别经磷酸化作用抑制p140和p70生成pp140和pp70。相反,若认为糊精抑制胰岛素受体摄入的葡萄糖这一过程时,便会认为产生pp140和pp70的p140和p70磷酸化可能在细胞的葡萄糖摄入机制中起重要作用。
因此本发明人试图阐明p140和p70的作用机理。
当将大鼠骨骼肌成肌细胞(大鼠L6细胞)在胰岛素补充的培养物中培养时,可持续观察到第3天出现的pp140带及在第9天可见有pp140生成。在大约相似的间隔期(第3天),同样观察到Glut4的出现并伴有大鼠L6细胞分裂的逐渐增加。此外,于第7天在同样培养体系中可见大鼠骨骼肌成细胞的多核化改变,并进而分裂形成肌细胞。就pp70来说,从第7天出现细胞到第14天一直显示有该蛋白质的产生。
然而,在检查细胞内pp140的位置后发现,在将胰岛素加入非血清处理的L6细胞中培养后10分钟时,细胞、浆中的微粒体膜(MM)内发现有所说的蛋白质。此后pp140消失。另外,首次发现在培养后1-2小时,细膜可透膜(PM)中有pp140。根据这些发现,推测在胰岛素处理后立即于细胞浆中合成了pp140,并在其后1-2小时该蛋白质转移到了可透膜(PM)内。再者,用相似实验方法研究L6细胞中的pp70定位,第一次确定在开始培养后pp70即直接定位在MM中,在培养后10分钟记录到一个磷酸化量的峰值,并且在培养后3小时逐步接近测不到的水平。此外,发现在开始培养后pp70还直接定位在核内,并且蛋白质含量逐渐增加,在培养后3小时达到峰值。从上述蛋白质定位特征可以看出,在没有胰岛素的情况下pp70存在于MM中,并且在用胰岛素处理后3小时内该蛋白质迁移到核部分。
基于上述结果,可对pp140信息传递机制作如下推测。简单地说,当胰岛素与受体结合时,后者经自动磷酸化被激活。然后通过蛋白质磷酸化酶的磷酸化作用信息,相继经不同的激活步骤,使p140磷酸化生成pp140。被激活的pp140定位在可透膜(PM)表面上,然后p70在经受各种同时发生的蛋白质磷酸化加工过程后,也被磷酸化。磷酸化的pp70被激活后迁移到核内,继而在Glut4表达中于核内激发生物学活性。基于这一信息,在胞浆内产生的Glut4迁移并定位在可透膜(PM)表面上以最终激发葡萄糖摄入。
上述信息传递机制确保追踪实验,以正确地找到建立所说现象的具体证据。在任何情况下,现在均可得出这样的结论,即激活p140是诱导细胞内葡萄糖摄入和继后造成循环系统中低血糖所需的必要步骤。
因此,本发明涉及预防和/或治疗糖尿病,特别是非胰岛素依赖性糖尿病(NIDDM)的方法,其特征在于使蛋白质p140酪氨酸磷酸化。
此外,本发明涉及预防和/或治疗糖尿病特别是非胰岛素依赖性糖尿病(NIDDM)的药剂,其特征在于使蛋白质p140酪氨酸磷酸化。
本发明中,特征在于使蛋白质p140的酪氨酸磷酸化的预防和/或治疗糖尿病的方法和药剂,包括所有或全部用于预防和/或治疗糖尿病的所说的方法和药剂都是以有关蛋白质p140的酪氨酸磷酸化的主要作用机制为基础的。
另外,产生酪氨酸磷酸化蛋白质p140的细胞不仅限于骨骼肌成肌细胞(大鼠L6细胞),而且还包括所有主动引发所说磷酸化作用的其他细胞。总而言之,已证实表现有所说的磷酸化作用的细胞包括大鼠Fao肝细胞、人A673肌细胞和HepG2肝细胞。
已报导肌肉和肝脏以外的器官如心、脑、脾、肺、肾、睾丸、胎盘和胰腺均出现有本发明的p140m RNA。因此,酪氨酸磷酸化效应不只限于肌肉和肝脏,而且可广泛幅射到整个活体系统。根据这一发现,可知本发明的所说的作用机制不只限于肌肉和肝脏细胞,而且还涉及心脏、脑、脾、肺、睾丸、胎盘及胰腺细胞。
将本发明的多肽与由Swiss Prot Release2.0记录的先前已知多肽的氨基酸序列相比较时,尚未鉴定出具有与该多肽的序列相似的完整序列的候选多肽。些外,在GenBanK Release 70中记录的以前已报导之核苷酸序列没有一个是编码本发明完整多肽的cDNA。因此再进一步证实本发明所说的肽是一种完全新的蛋白质。
再者,将此结果与在Swiss Prot Release 2.0中以前记载的多肽中的氨基酸序列相比较后,识别了上皮细胞激酶(ECK)并且它们之间约40%的同一性。因此推测本发明的新蛋白质属于ECK家族。
本发明中,基于呈上纯化形式的SEQ ID No.1的多肽一般包括占总多肽产量90%以上,如占总产量的95%、98%或99%是SEQ ID No.1的多肽。
SEQ ID No.1的多肽同源序列与SEQ ID N0.1多肽至少在20个、较好至少30个,例如40、60或100个以上连续氨基酸区域,至少是70%,较好至少80%或90%,更好至少95%同源。这样一个同源多肽物将被看作是本发明的多肽。
一般说来,SEQ ID No.1的片段或其同源序列片段长度至少为10个,优选至少15个,例如20、25、30、40、50或60个氨基酸,而且也都属于本文所用术语“本发明的多肽”范围。
能够选择性地与SEQ ID No.2或3的DNA杂交的DNA在至少20个,优选至少30个,例如40、60或100个或更多个连续核苷酸区域内,一般至少70%,优选至少80或90%且最好至少95%同源于SEQ ID No.2或3的DNA。这些DNA将包括在术语“本发明的DNA”范围内。
SEQ ID No.2或3的DNA片段至少是10个,优选的至少15、如20、25、30或40个核苷酸长,并且同样包括在本文所用术语“本发明的DNA”中。
本发明进一步的实验方案提供了包含DNA的复制和表达载体。载体例如可以是带有复制原点,任选的适于表达所说DNA的启动子的调节元件的质粒、病毒或噬菌体载体。载体可包含一个或多个可选择标志基因,例如氨苄青霉素抗性基因。载体可在体外使用,例如生产相当于所说DNA的RNA,或用于转染或化宿主细胞。
本发明的进一步的实施方案提供了被用于复制和表达本发明DNA的载体转化或转染的宿主细胞,所说的载体包含DNASEQ ID No.2或3或其开放阅读框架。所选择的细胞与载体相容,并且可以是细菌、酵母、昆虫或哺乳动物细胞。
本发明的进一步的实施方案提供了生产多肽的方法,其包括有效地表达本发明多肽的条件下培养本发明的宿主细胞。此外,较好地是在适于表达并在其后由宿主细胞产生本发明多肽的条件下完成这一方法。
还可以以反意义方向将本发明的DNA插入载体中,以证明反意义RNA的生产。也可以用合成手段生产反意义RNA。这样的可将反义RNA用于控制细胞内多肽水平的方法。
本发明还提供抗本发明多肽的单克隆或多克隆抗体。本发明进一步提供了生产抗本发明多肽之单克隆或多克隆抗体的方法。可使用本发明的多肽或其片段作为免疫原,以常规杂交瘤技术制备单克隆抗体。也可用常规方法制备多克隆抗体,包括用本发明的多肽接种宿主动物例如大鼠或兔,并回收免疫血清。
本发明还提供了药物组合物,它含有与药物学上可接受的稀释剂和/或载体结合的本发明之多肽或其抗体。
本发明的多肽包括其氨基酸序列的一部分缺失的多肽(如只包含SEQ ID No.1中所述氨基酸序列内表现生物学活性的基本序列的多肽)、其氨基酸的一部分被其他氨基酸取代的多肽(例如被具有相似性质之氨基酸取代的多肽),其氨基酸序列的一部分中加入或插入其他氨基酸的多肽,以及具有SEQID No.1中的氨基酸序列的多肽。
如众所周知,可有1至6种密码子编码一种氨基酸(例如有一种密码子编码Met,六种密码子编码Leu)。因此,可以改变DNA的核苷酸序列,以编码具有相同氨基酸序列的多肽。
(2)中指出的本发明的DNA包括一组编码SEQ IDNo.1中所示多肽(1)的核苷酸序列。有可能通过改变核苷酸序列来提高多肽的产率。
(3)中指出的DNA是(2)中所示DNA的实例,并且是天然形成的序列。
(4)中所示的DNA为带非翻译区的(3)中指出的DNA序列。
可按下述方法制备具有SEQ ID No.3中所示核苷酸序列的DNA,即:
i从产生本发明多肽的细胞系(如大鼠骨骼肌成肌细胞L6细胞)中分离mRNA。
ii从由此得到的mRNA制备第一条链(单链DNA),然后制备第二条链(双链DNA)(合成cDNA),
iii将如此制得的cDNA插入到适当的质粒载体中,
iv用如此得到的重组DNA转化宿主细胞(制备cDNA文库),
v从如此得到的cDNA文库进行大规模随机克隆,然后从各克隆5′端测定平均300个碱基序列,以及
vi测定具有新碱基序列之克隆的全长序列。
详细解释如下:可以根据Okayama,H等人的方法(EnzYmology,154,3,(1987)中所述方法),使用对数生长期的大鼠骨骼肌成肌细胞的L6细胞来完成步骤i。生产本发明多肽的这些细胞的例子是大鼠或人的肌肉、肝、心、脑、脾、肺、肾、睾丸、胎盘或胰脏细胞。优选大鼠骨骼肌肉成肌细胞L6细胞(ATCC菌种号CRL-1458),大鼠肝Fao细胞,人肌肉A673细胞或人肝HepG2细胞。步骤ii,iii,和iv是制备cDNA文库的一系列步骤,可以根据Gubler和Hoffman(Gene,Vol.25,pp.263,1983)的方法稍加修改来完成。至于步骤III所使用的质粒载体的例子,许多在E.coli菌株(例如pBR322)及Bacilus subtilis菌株(例如pBR322)及Bacillus sublilis(例如pUB110)中发挥功能的载体是已知的,并可选优用对E.coli起作用的pGEM-3zf(+)(3,199bp由promega Corp公司制造)。作为步骤iv使用的宿主的例子许多细胞是已知的,可以使用任何细胞,优选使用根据Gene,Vol.96,pp23,1990叙述的方法所制备的DH5感受态细胞。步骤v的克隆可按本身已知方法进行,并可根据Maxam-Gilbert的方法或双脱氧末端法来定序。步骤vi可根据Molecular Cloning(由sambrook,J.,Fritsch,E.F.及Maniatis,T.著,由Cold Spring HarborLaboratory Press 1989年出版)所述方法进行。
按下述步骤,有必要检查如此获得的DNA是否编码正确的蛋白质产物,该检查要求:
I将DNA序列转换成为可能框架中的氨基酸序列,
II确证如此获得的DNA是否完全覆盖了完整的mRNA长度。该确证可在前述步骤vi之后进行,于步骤v和步骤vi之间也有效。
步骤II可通过Northern分析进行。
一旦在SEQ ID No.2和3中所示核苷酸被测定,本发明的DNA便可由化学合成,PCR法或使用本发明的DNA片段作为探针的杂交来获得,还可通过用插入有本发明DNA的载体DNA转化宿主接着培养转化体来得到所需量的本发明DNA。
本发明的多肽(示于SEQ ID No.1)可制备如下:
(1)从有机体或培养细胞分离和提纯,
(2)化学合成或
(3)使用生物技术。
(3)所述的方法是优选的,当使用生物技术制备多肽时,其表达系统的例子是如细菌、酵母、昆虫细胞和哺乳动物细胞这类的表达系统。
例如,可通过将起始密码子(ATG)加到SEQ IDNo.3所示核苷酸序列编码DNA5′端,将由此获得的DNA连接到适当的启动子(例如trp启动子,lac启动子、λpl.启动子、T7启动子等)下游,然后将其插入对E.Coli菌株起作用的载体中(例如pBR322,pUC18,pUC19等)而制备成表达载体,从而在完成大肠杆菌中的表达。然后,将由此获得的表达载体转化的E.coli菌株(例如E.Coli DH1菌株,E.Coli JM109菌株,E.Coli HB101菌株,等)在适当的培养基中培养获得所需多肽。若使用细菌信号肽(例如pel B信号肽),也可将所需多肽分泌于周质中。并且容易生产与其它多肽的融合蛋白质。
另外,例如可以通过将SEQ ID No.3中所示DNA插入适当载体(例如还原病毒载体,乳头瘤病毒载体,牛痘病毒载体,SV40载体等)中的适当启动子(例如SV40启动子,LTR启动子,金属硫因启动子等)的下游,获得表达载体,以获得的表达载体转化适当的哺乳动物细胞(例如猴COS-7细胞,中国仓鼠CHO细胞,小鼠L细胞等),然后在适当的培养基中培养转化体,从培养基中得到所需多肽从而完成在哺乳动物细胞中的表达。由此获得的多肽可用常规生化法分离和提纯。
本发明的蛋白质包括磷酸化反应产物和/或糖链接的蛋白。简言之,本发明包含p140键合多糖链及在p140多肽中发现的酪氨酸磷酸化p140(pp140)。
推断蛋白质p140具有上述作用机制。因此若单独使用时,本发明的蛋白质p140多肽不仅可改善高血糖症,而且也可用于预防和/或治疗糖尿病,特别是非胰岛素依赖型糖尿病(NIDDM)。
而且,抗本发明蛋白质p140多肽的多克隆或单克隆抗体,可用于测定生物体内所说多肽的数量,因此可用于研究所述多肽和疾病的关系之目的,或用于诊断疾病之目的等等。可使用所说多肽或其片段作为抗原,通过常规方法来制备其多克隆和单克隆抗体。
本发明的DNA可用作制备本发明多肽的重要的和基本的模板、本发明多肽予期对诊断和治疗基因病(治疗基因缺陷病及通过反义DNA(RNA)等抑制多肽表达来治疗等)有多种用途。而且,可使用本发明DNA作为探针来分离基因组DNA。同样,也可以分离人或其它动物体内与本发明DNA高度同源的基因。
此外,本发明还涉及预防和/或治疗糖尿病的药剂,其特征在于含有使蛋白质p140酪氨酸磷酸化的化合物作为活性成份。
总的来说,酪氨酸磷酸化的蛋白质p140产物不仅包括目前确信具有所述活性的物质而也包括以后将被证实具有所述活性的所有这些物质。目前已确证的具有酪氨酸磷酸化活性的化合物如下:
(1)式(I)的苯或萘衍生物
Figure C9411993500151
其中n个R1的每一个分别是氢原子,C1-4烷基、羟基、氨基或COOR2(其中R2是氢原子或C1-4烷基),n是1-3。以及上述化合物的非毒性盐或其非毒性酸加成盐。
(2)式(II)的苯醌或萘醌衍生物
Figure C9411993500162
其中m个R3的每一个分别是氢原子,C1-12烷基、C1-4烷氧基、C1-4烷硫基、羟基、卤素、苯基或卤素取代的苯基,m是1-4。
(3)式(III)的绕丹宁或噻唑烷衍生物
Figure C9411993500164
其中X是氧或硫原子,R4和R5每个分别是氢原子,苯基或C1-4烷基,C1-8烷氧基,卤原子或硝基取代的苯基,或者R4和R5连在一起代表亚苄基或代表C1-4烷基、C1-8烷氧基、卤素原子或硝基取代的亚苄基或β-甲基亚肉桂基,R6是氢原子,C1-4烷基,以及上述化合物的无毒盐和无毒酸中成盐。
更具体地说,式(I)化合物包括4-氨基-2-羟基苯甲酸、4-氨基-1-萘酚、4-氨基-2-萘酚,1-氨基萘、1、4-二羟基萘、4-氨基-2-甲基-1-萘酚(下文简写为维生素K5)、1、4-二羟基-2-环烷酸等。
式(II)化合物包括2-甲基-1、4-苯醌、2、6-二叔丁基-1、4-苯醌、2、6-二溴-1、4-苯醌、2、3、4、5-四氟-1、4-苯醌、1、4-萘醌、2-甲基-1、4-萘醌(下文简写为维生素K3)、2-羟基-3-甲基-1、4-萘醌、2-(3,7-二甲辛基)-3-羟基-1、4-苯醌、2-甲氧基-3-甲基-1、4-萘醌、2-羟基-1、4-萘醌、3-(4-氯苯基)-2-羟基-1、4-萘醌、2-丙硫基-1、4-萘醌等。
式(III)化合物包括5-苯基绕丹宁,5-苯基-1、3-噻唑烷-2、4-二酮,5-亚苄基绕丹于,5-亚苄基-1、3-噻唑烷-2、4-二酮,5、5-二苯基绕丹宁,5、5-二苯基-1、3-噻唑烷-2、4-二酮、5-(4-异戊氧基亚苄基)绕丹宁、5-(4-异戊氧基亚苄基)-1、3-噻唑烷-2、4-二烯,5-(β-甲基亚肉桂基)绕丹宁-3-乙酸等,以及以上化合物的无毒盐及无毒酸加成盐。
本发明中适当的无毒盐是例如碱金属(例如钾、钠等)盐,碱土金属(例如钙、镁等)盐,铵盐,药物学上可接受的有机胺(例如四甲铵、三乙胺、甲胺、二甲胺、环戊胺、苄胺、苯乙胺、哌啶  ,单乙醇胺,二乙醇胺,三(羟甲基)胺,赖氨酸、精氨酸、N-甲基-D-葡糖胺等)盐。
本发明中适当的酸加成盐包括无机酸盐、例如盐酸、氢溴酸、硫酸、磷酸及硝酸的盐,和有机酸、例如乙酸、三氟乙酸、乳酸、酒石酸、草酸、富马酸、马来酸、苯磺酸、甲苯磺酸、羟乙磺酸、葡糖醛酸和葡糖酸。
式(I)(II)和(III)本身是已知的,或作为其它的初始原料使用,可由已知方法本身很容易制备出。
由于本发明所使用的物质经过了酪氨酸磷化处理,这些药剂不仅能改善糖尿病引起的高血糖症状,而且对治疗和/或预防糖尿病,特别是非胰岛素依赖型糖尿病(NIDDM)也是有用的。
已确证本发明的各种活性成份及其盐的毒性是很低的。因此,可以认为本发明的各种活性成份及其酸加成盐是安全的并适宜于药物使用。
为达上述目的,本发明的多肽,各活性成份及其酸加成盐,可全身性或局部地正常服用,通过口服或非肠道给药。
服用的剂量由年纪,体重,症状,所期治疗效果,给药途径及治疗时间等因素决定。对成年人来说,每人每剂一般是10μg-1000mg之间,通过口服,每天可达数次,而通过非肠道给药的话为10μg-100mg,每天可达数次,或通过连续静脉给药每天1-24小时。
正如上面指出的,所使用的剂量取决于各种条件,因此在某些情况下,可使用低于或高于上述特定范围的剂量。
本发明以化合物在给药时,以固体组合物,液体组合物或其它组合物口服给药,而以注射剂,擦剂或栓剂非肠道给药。
口服给药的固体组合物包括压制的片剂,,丸剂、胶囊、分散性粉末以及颗粒。胶囊包括硬胶囊和软胶囊。
在这些组合物中,一种或多种活性组合物与至少一种惰性稀释剂(例如乳糖、甘露糖醇、葡萄糖、羟丙基纤维素、徽晶纤维素、淀粉、聚乙烯吡咯烷酮、硅酸铝酸镁)混合。该组合物在实际一般情况下,也可加入惰性稀释剂之外的其它添加物:如润滑剂(例如硬脂酸镁)、崩解剂(例如甘醇酸纤维素钙)、稳定剂(例如乳糖)、以及助溶剂(例如谷氨酸、天冬氨酸)。
如果需要,片剂或丸剂可用胃溶或肠溶材料涂复上一层膜(例如用蔗糖、明胶、羟丙基纤维素或邻苯二甲酸羟丙基甲基纤维素),或涂二层以上膜。涂层也可包括用可吸附材料例如明胶形成的胶囊。
口服的液体组合物包括药物学上可接受的溶液、乳剂、悬浮液、糖浆及酏剂。在此类组合物中,一种或多种活性化合物包含在本技术领域常用的惰性稀释剂中(例如纯水,乙醇)。除了惰性稀释剂外,此类组合物也可含赋形剂(例如润湿剂、悬浮剂),甜味剂、香味剂、芳香剂以及防腐剂,
口服的其它组合物包括按已知方法制备的包括一种或多种活性化合物的喷雾组合物,喷雾组合物还包括惰性稀释剂之外的添加物:例如稳定剂(例如硫酸钠)、等渗缓冲液(例如氯化钠、柠檬酸钠、柠檬酸)。
为制备此类喷雾剂,可使用例如美国专利No.2868691或3095355中所述的方法。
非肠道用注射剂包括消毒水液,无水溶液、悬浮液及乳液。在此种组合物中,一种以上的活性化合物与至少一种惰性水稀释剂(如注射用蒸馏水,生理盐水溶液)或惰性非水稀释剂(例如丙二醇、聚乙二醇、橄榄油、乙醇、POLYSORBATE80(注册商标)混合。
注射剂可以包含惰性稀释剂以外的添加物质,例如防腐剂、润湿剂、乳化剂、分散剂、稳定剂(例如乳糖)以及助溶剂(例如谷氨酸,天冬氨酸)。
可以对它们进行消毒处理,例如用阻挡细菌过滤器过滤,在组合物中掺入消毒剂或照射等法。也可将它们制成消毒固体组合物形式,例如用冷冻干燥法,然后在临使用前将之溶解于消毒水中或其它某些消毒稀释剂中供注射用。
其它非肠道给药组合物包括含一种或多种活性化合物,且可由已知方法制备的外用液体,如表皮擦剂,药膏、栓剂和阴道栓剂。
下述实施例详述本发明,但并不限制本发明的内容。
实施例1  pp140的纯化方法
采用细胞盘(225cm2),将大鼠L6细胞于37℃,在5%CO2中保温7-10天。以三天的时间间隔,用Dulbecco改性的Eagle培养基(含10%牛胎血清(BFS))代替培养基。以无血清培养基处理从骨胳肌肉成细胞生成的肌肉细胞二小时后,将500μM钒酸(钒酸盐)加入培养物中,并进一步保温10分钟。然后将细胞悬浮于Tris缓冲液中(400μM加有蛋白酶抑制剂的钒酸盐),溶胞并离心,然后离析出上层清液。
用徽孔膜过滤之前,用辛(乙二醇)醚(C12E6)将上清液的最后浓度调到0.1%。用已过滤样品填充与抗磷酸酪氨酸抗体结合的蛋白质G琼脂糖凝胶。将酪氨酸磷酸化蛋白质(pp140)吸附于凝胶上。用25mmTris缓冲液冲洗脱柱子之后用10mm苯基磷酸酯洗脱pp140。用Centricon30将洗脱液浓缩,之后用丙酮沉淀法沉淀出pp140。
实施例2    不同组织中的p140的酪氨酸磷酸化
使用经Dulbecco改性的Eagle培养基(含10%BFS),将各种细胞(1×105个细胞/皿),在37℃,5%CO2中温育5-8天。细胞为由骨骼肌成肌细胞分化的骨骼肌细胞,将分化的细胞预先在无血清的Dulbecco改性的Eagle培养基中培养4小时,然后在含有糊精(100pm)和不含有糊精的培养基中温育,然后进一步培养24小时。将经胰岛素(100nM)处理的培养物以固定的时间(10或60分钟)温育。
培养物经冰冷的磷酸盐缓冲液冲洗后,以含有0.5%的辛(1、2-乙二醇)醚(C12E6)的磷酸盐缓冲液溶解细胞,用磷酸酪氨酸抗体结合的琼脂珠(Transformation Corp)回收pp140。然后分别以磷酸苯酯和Werstern印迹法淋洗和检测,以纯化的pp140为标准使用一密度计检测pp140的区带含量。结果列于表1表1p140酪氨酸磷酸化对不同组织的作用
      大鼠                 人L6        Fao       A678      HepG2
对照组胰岛素10分钟胰岛素60分钟胰岛素加糊精10分钟胰岛素加糊精60分钟   300       100       300       2502400      2000      2500      21001000      1400      1900      1200180       300       350       300200       100       1000      300
表1中,在加入100nM胰岛素之前,培养物需以100pM的糊精处理24小时。观察结果
在大鼠L6细胞在胰岛素中保温10分钟之内便可观察到pp140的产生受糊精拮抗作用的影响。并且这一现象在大鼠肝细胞、Fao细胞中同样得到证实。而这一现象并非仅限于大鼠,在人肌肉细胞(A673细胞)和肝细胞(HepG2细胞中,也同样证实了这种现象。因此可推断在p140磷酸化被胰岛素的磷酸化信息引发之前,糊精便可抑制某步骤或过程。实施例3  不同的试验化合物对p140磷酸化作用的影响
将大鼠L6细胞(1×105细胞/皿)在Dulbecoo改性的Eagle培养基(含10%BFS)中于37℃5%CO2中温育8天,所用细胞为由骨骼肌成肌细胞分化的肌细胞。将分化的骨骼肌细胞在无血清的Dulbecoo改性的Eagle培养基中处理4小时之后,加入各种试验化合物(10mM;除了胰岛素为1mM),再将培养物保温一固定时间。
培养物以冰冷的磷酸盐缓冲液冲洗,然后将细胞以含0.5%的辛(1、2-乙二醇)醚(C12E6)的磷酸盐缓冲液溶解。pp140以结合有磷酸酪氨酸抗体(TransformationCorp)的cephalobeads珠回收,再分别以磷酸苯酯和Westem印迹法分别洗脱并检测。以纯化的pp140为标准,使用密度计检测pp140区带含量。结果示于表2
     表2    不同试验化合物对p140酪氨酸磷酸化的影响
化合物    酪氨酸磷酸化的p140的含量(个数/细胞)0          3         10        60(分钟)
维生素K3 350       3650      1800        750
维生素K 400       3850      2850        1600
5-苯基绕丹宁 350       1600      1250        650
5-苯亚甲基绕丹宁 400       2650      1900        1350
5-(4-异戊氧基苯亚甲基)绕丹宁 400       3200      2250        1600
   胰岛素(正对照) 350       1850      2600        1650
实施例4    对葡萄糖摄取的增强活性
将大鼠L6细胞(1×105细胞/皿)在Dulbcco改性的Eagle培养基(含10%BFS)中,于37℃5%CO2培养8天,所用细胞为由骨骼肌成肌细胞分化的骨骼肌细胞,以无血清的Dulbecco改性的Eagle培养基中处理分化的骨骼肌细胞2小时,然后加入各种检测化合物(10mM;除了胰岛素为1mM),将培养物再进一步培养2小时。以Crebs Ringer磷酸盐缓冲液(PH7.4)处理培养物20分钟,再将其于5mM3H-2-脱氧葡萄糖(0.05mci/ml)中进一步保温培养,3分钟后,以液体闪烁计数器(Liquid SyntillationCounter)检测细胞摄取的放射物质含量,结果见表3
          表3  对葡萄糖摄取的增强活性
    化合物     对葡萄糖摄取的活性(pmol/mg蛋白质/分)
    对照组          22.6
维生素K3 60.9
    维生素K5          67.5
  5-苯基绕丹宁          76.8
  5-苯亚甲基绕丹宁          84.2
  5-(4-异戊氧苯亚甲基绕丹宁          98.4
    胰岛素(正对照组)         106.8
观察结果
证实所有能促进p140磷酸化的化合物均具有可促进葡萄糖摄取的活性(表2和3)
实施例5  维生素K5对糖尿病的影响
在雄性Wistar大鼠(STZ大鼠)得到以链脲菌素(STZ)建立的糖尿病模型、将维生素K5以不同的日剂量腹膜内给药,使STZ大鼠连续用药3天(每天一次),然后测定血液中葡萄糖、中性脂肪和胆固醇含量。相应地,以同样的日用药速度和间隔期给STZ的立常大鼠服用赋形剂(生理盐水),然后检测与上述相似的血液指标,并且以每天皮下(S.C.)施用胰岛素(8U/kg)(每天一次),连续给药3天的大鼠为正对照。结果示于图1至3。观察结果
连续使用维生素K5。3天可使所有大鼠血液指标的变化得到恢复;也就是使葡萄糖、中性脂肪和胆固醇得到恢复。
实施例6  pp140的部分氨基酸序列分析
电泳分离实施例1中纯化的pp140,然后转录于PVDF膜,经色氨酸处理,再以液相层析进一步分离。将如此得的pp140片段以470A-型自动气相蛋白序列/120A-型PTH分析仪(ABI或Applied BiosystemInc Corp.,美国)进行序列测定,并且进一步使用Edman降解法,然后确定其部分氨基酸序列。序列示于序列表5-7。实施例7  以聚合酶链反应(PCR)方法确定pp140的部分氨基酸序列。
通过各种应用手段,以由此分离出来的部分氨基酸片段中得到各种引物,并且在采用PCR方法之前就已使其分别组合。结果得到一条特定扩增的片段,长度约为400bp。
实施例8  mRNA的分离和纯化
在对数增长期,按Okayama等人的方法(Methodsin Enzymology,154,3(1987))从3×107个成肌细胞L6(ATCC株No.,CRL-1458)中分离mRNA。
简单地说,将细胞以5.5MGTC溶液(5.5m硫氰酸胍,25mM柠檬酸钠和0.5%的月桂肌氨酸钠溶解,溶胞产物在三氟乙酸铯溶液(密度为1.51)分层,在回收微团中的所有RNA之前,以120,000×g速度将溶胞产物离心20小时。将RNA样品通过-Oligo-dT-纤维素柱两次,然后纯化回收106μg的poly(A)+RNA.实施例9  p140mRNA的组织分布
从各个组织,按与实施例8的相同方法纯化Poly(A)+RNA。将从不同组织中得到的Poly(A)+RNA样品(每种样品2μg)通过琼脂糖-凝胶电泳,然后用滤器转移。在进行正常的杂交之前,标记2-Kb的开放阅读框架,并用其做为一内部对照。用一特定结合的探针进行放射自显影,并以图像分析仪经密度分析估值。若将在组织中的β-肌动蛋白的mRNA定为100时,则p140在各组织中的相对含量列于表4
        表4    p140mRNA的组织分布
    大鼠     人
    心脑脾肺肝肌肉肾睾丸胎盘胰     1002407021013040130320--     10060--10010013040-220330
(-):表示未做实验观察结果
在研究的所有不同组织中均检测到mRNA,其影响遍及各种组织,尤其在人的胰腺中发现了高含量的mRNA。
实施例10  建立cDNA文库
按改进的Gubler和Hoffman方法(Gene 25,263,(1983))建立了cDNA文库。
由实施例2得到的Poly(A)+RNA(5μg),通过一反转录酶得到第一条链,然后通过Eco RI连接物连接得到第2条链,再以凝胶滤柱层析(SephacrYl S-500HR柱;Pharmacia Corp.)分离除去过量的连接物和引物。然后回收余下的1,620ng的cDNA馏份。
用λgt10克隆系统盒(Amersham Corp)来完成上述的cDNA文库构建过程。
接着,将λgt10噬菌体(Amersham Corp.)和λZAPII噬菌体(StraTagene Corp.)连接于Ec RI-处理的平均长度为1.8-Kb的片段两端。由此便建立起数目为3×105的噬菌体cDNA文库。
实施例11    克隆和定序
以实施例10构建的噬菌体DNA文库为基础,将克隆复制达到约1×105个噬菌体/平板,将实施例7所得的约400-bp的片段做为探针,然后进行筛选。在质粒载体pGEM-3ZF(+)的EcoRI侧插入(3199bp-Promega Corp.)的长链的亚克隆为正对照。作为引物的T7或SP6被定序,
使用荧光双终端仪(ABI,USA)按环-序列方法完成基于双脱氧末端法的DNA定序列,然后使用DNA定序仪(Model 373A;ABI,USA)读出序列。
由此得到从各克隆的5’末端或3’末端开始的平均300个碱基的核苷酸序列。
实施例12    部分序列分析
使用Lipman和Pearson的FASTA程序,将实施例11中的核苷酸序列与以前登记于数据库(GenBank和EMBL)中的所有核苷酸序列进行同源性检索后,定序的克隆被鉴别为含有新序列的克隆。以三种可能的构建框架为基础,将被鉴别克隆的核苷酸序列转变为氨基序列。
因此,也公开了新的氨基酸序列。
然而,已克隆的cDNA不必包含整个mRNA的长度。在这种情况下,克隆几乎不可能含有N末端的氨基酸序列。
由此,如果要互补所建立的全长克隆。须进行Northern分析。换句话说就是,将从实施例8至实施例9过程电泳分离的poly(A)+RNA在尼龙膜上进行印迹。将亚克隆的cDNA插入片段作为探针杂交,这时约在4400-bp的位置观察到一个谱带。由于克隆的长度约为2200bp,从5′和3′末端进行PCR以便用3′-RACE(BRL Corp)系统和5′-RACE(CLONTECH Corp.)系统盒读取全长的cDNA。
实施例13   测定全长cDNA的序列和开放阅读框架
根据Sambrook等人(Molecular Cloning:ed.Sambrook J.Fritsch EF,ManiatisT;1989,Cold Spring Harbor LaboratorY Press)的方法进行全部长度的cDNA序列的随机定序。
简单地,在连接和切成片段之前,从克隆中回收质粒然后纯化分离的cDNA插入片段。以T4聚合酶使DNA片段终端变平整,并以琼脂糖凝胶电泳回收长度约400-bp的DNA片段。将由此建立的DNA片段克隆至质粒载体和pGEM-3ZF(+)(3199bp;Promega Corp.)的SmaI侧,然后,转化大肠杆菌。随机地推出80个菌落,纯化质粒DNA,然后进行这20个质粒(具有作为插入物的cDNA)的DNA序列测定。按实施例11的方法进行DNA定序和读序。用DNASIS的DNA序列程序将cDNA片段的序列数据连接成一序列。由此建立了Seq.ID No.3中描述的基本序列。从整个长度的cDNA序列数据确定开放阅读框架(ORF)。然后进一步翻译为氨基酸序列,由此建立的序列示于SEQ.No.1。框架之一具有2993-bp ORF,近似于Eck族的全长约3000bp的ORF。因此,可推断本发明所说的多肽全长为2993bp。
基于其疏水性,进一步证明蛋白质p140为典型I型膜蛋白(图4中说明了有高(+)或低(-)疏水性区域。
总之,所说的p140多肽是一种典型的膜蛋白,具有993个氨基酸和长度为2982bp的ORF。此外,估计所述p140多肽的分子量为109,860Da,从其结合的多糖链估计为140KD。实施例14    构建用于制备表达载体的质粒载体
用表达载体,pUC-SRαML-1(在欧州专利公开No.559428中公开了该载体及其制备方法)的衍生物。通过插入下面两种片段而构建出该衍生物:
片段T7          5′GTAATACGACTCACTATAGGGGAGAGCT 3′
                                        (SEQ ID No.8)
            3′ACGTCATTATGCTGAGTGATATCCCCTC  5′
                                        (SEQ ID No.9)在PstI和SacI之间和
片段SP6     5′CTAGTCTATAGTGTCACCTAAATCGTGGGTAC  3′
                                        (SEQ ID No.10)
               3′AGATATCACAGTGGATTTAGCAC  5′
                                        (SEQ ID No.11)分别在SpeI和KpnI之间的多克隆位点
用PstI和SacI消化pUC-SRαML1,将得到的消化产物经琼脂糖凝胶电泳制备并回收得一约4.1Kbp的片段,然后用BAP(细菌碱性磷酸酯酶)除去5’末端的磷酸基团,将磷酸化的DNA片段T7与由此从PUC-SRαMLI制得的约4.1Kbp片段连接使其成环。所得的载体再用Spel和Kpnl消化,消化产物通过琼脂糖凝胶电泳,制备并回收一约4.1Kbp的片段,然后再用BAP(细菌碱性磷酸酯酶)处理除去5′-末端的磷酸基团。磷酸化的DNA片段SP6与如此得到的4.1Kbp片段连接使其成环。通过这种方法构建的质粒载体被称为pUC-SRαML2(见图3)。实施例15  表达载体的构建将大鼠p140cDNA退火合成引物X、Y和YH。引物X、Y和YH序列如下:引物X5′- A ATA TAG TCG ACCACC ATG GAG AAC CCC TAC GTT GGG CGA GCG A -3′
                                               (SEQ ID No.12)引物Y5′- CGG CGG ACT AGT TCA GAC CTG CAC GGG CAG TGT CTG G -3′
                                               (SEQ ID No.13)引物YH5 ′-GCC GCC ACT AGT TCA GTG GTG GTG GTG GTG GTG GAC CTG CAC GGGCAG TGT CTG G    -3′
                                               (SEQ ID No.14)
以如此合成的寡核苷酸X和Y为模板,将含有p140cDNA的质粒进行PCR。如此得到的PCR片段含有一位于5’端与起始密码子邻接的序列,相当于本领域技术人员所知的Cozac序列,编码组成p140蛋白质分子的cDNA。用SalI-SoeI消化PCR片段,消化产物经分离纯化,然后插入在实施例14制得的PUC-SRαML2的SalI-SpeI位点,得到一表达载体PUC-SRαML2-p140-A。
进一步地,以合成的寡核苷酸X和YH为模板将含有含p140cDNA的质粒进行PCR。由此得到的PCR片段含有一位于5’-端与起始密码子邻接的序列,相当于本领域所知的Cozac序列,编码组成p140蛋白质分子和6个接于附加组氨酸(His)残基的cHDNA。SalI-SpeI消化PCR片段所得消化产物经分离提纯,然后插入实施例14所得的pUC-SRαML2的SalI-SpeI位点,得到一表达载体pUC-SRαML2-p140-B。
再合成引物Z和ZH,引物Z和ZH的序列如下:(它们被连接于cDNA中跨膜区域的氨基末端。
引物Z5′- CGG CGG ACT AGT TCA TGA GCC TCT TTCACT CGT GGT CTC AAA CT-3
                                              (SEQ ID No.15)引物ZH5′-GCC GCC ACT AGT TCA GTG GTG GTG GTG GTG GTG TGA GCC TCT TTCACT CGT GGT CTC AAA CT -3′
                                              (SEQ ID No.16)
以如此合成的寡核苷酸X和Z为模板,将含有p140cDNA的质粒进行PCR,由此得到的PCR片段含有一位于5’端与起始密码子邻接的序列,相当于本领域所知的Cozac序列,和编码组成p140蛋白细胞外部分多肽的cDNA。用SalI和NotI消化PCR片段,消化产物经分离纯化,然后插入实施例14得到的pUC-SRαML2-p140-C。
进一步地用合成的寡核苷酸X和ZH为模板,将含有p140cDNA的质粒进行PCR。由此得到的PCR片段含有一位于5’端与起始密码子邻接的序列,相当于本领域人员熟知的Cozac序列,和编码组成p140蛋白的细胞外部分多肽及与其C末端相接的6个附加的组氨酸(His)残基的cDNA。用SalI-SpeI消化PCR片段,所得消化产物经分离纯化然后插入实施例14所得的(pUC-SRαML2的SalI-SpeI位点,得到一表达载体pUC-SRαML2-p140-D。用由此构建的各个质粒pUC-SRαML2-p140-A,pUC-SRαML2-p140-B pUC-SRαML2-p140-C和pUC-SRαML2-p140-D转染E.ColiDH5菌株,从100ml的转化体培养物中回收,再以Cscl密度梯度离心两次进行纯化。
实施例16    在COS细胞中的表达
通过二乙氨基乙基(DEAE)葡聚糖方法(J.Immunology,136,4291(1986))将各个质粒DNA制剂pUC-SRαML2,pUC-SRαML2-p140-A,pUC-SRαML2-p140-B,pUC-SRαML2-p140-C和pUC-SRαML2-p140-D导入COS-7细胞(Cell,23,175(1981))。
将约1.8×106个COS-7细胞与50ml的液体培养基(Dulbecco改性的MEM培养基,补充有10%的去补体的胎牛血清)一起被接种在-225cm2的烧瓶中(由Corning生产),在含有CO2的恒温箱(37℃5%CO2)中保温过夜;然后除去培养物上清液,再向每一烧瓶中加入12ml的-DNA混合液(Dulbecco改性的MEM培养基,用15μg的每一DNA质粒,50mmTris-HCL缓冲液(PH7.4)和400μg/ml的DEAE-葡萄糖补充),培养物在含50%CO2 37℃下培养3小时,然后,用15ml的氯喹溶液(Dulbecco改性的MEM培养基,补充有150μM的氯喹和7%去补体的胎牛血清)代替DNA混合液,再培养3小时。
除去氯喹溶液后,将上面所提及的液体培养基(50ml)加入每一烧瓶中,再于37℃,5%CO2条件下温育72小时,可发现每一瓶中均长有单层细胞。除去培养物上清液,以无血清液体培养基(商品名,SFM-101;可从NiSSUi
       Pharmaceutical Co.Ltd获得)冲洗每一瓶中的细胞,然后再用75ml的同样的无血清液体培养基继续72小时培养。接着,回收所得的培养上清液并将细胞按实施例1的方法溶解,这些上清液和细胞溶解产物通过一滤膜(商品名:STERIVEX-GS;可从MilliporeCorp.获得)过滤,除去细胞碎片,将如此得到的培养物上清液样品保存于4℃条件下备用。用含pUC-SRαML2-p140-A和pUC-SRαML2-p140-B插入片段的质粒转化的COS细胞的溶胞产物中,应含有已表达的相应于p140蛋白的成熟的多肽蛋白部分。由含有pUC-SRαML2-p140-C和pUC-SRαML2-p140-D插入片段的质粒转化的COS细胞培养物上清液应含有相当于p140蛋白细胞外部分的分泌多肽。
实施例17    表达的确定
实施例16所得的转化的COS细胞的培养物上清液各2ml,用离心浓缩过滤器(商品名,Centricon-10;获自Millipore Corp.)将其浓缩至100μl。取如此制备的浓缩样品各1μl,与相同体积的载体缓冲液(0.125M Tris-HCL缓冲液(PH6.8)4%十二烷基磺酸钠和30%的丙三醇)混合以进行SDS-PAGE(十二烷基磺酸钠聚丙烯酰胺凝胶电泳),混合物于90℃下处理3分钟,然后再进行SDS-PAGE。
对于其蛋白质C-末端导入有His六聚体的pUC-SRαML2-p140-B和pUC-SRαML2-p140-D蛋白质,不仅其相应的溶胞产物和COS细胞培养物上清液,而且其已纯化的产品均要进行SDS-PAGE分析。
利用His与各种过渡金属离子形成配合化合物的功能,通过金属螯合亲和层析(Biotechnology,9 273,(1991))法纯化蛋白质。也就是将得自COS细胞的培养物上清液(350ml)或溶胞产物(100ml)与氯化钠水溶液混合至盐的最终浓度为1M,将所得混合物通过一装有4ml的Zn螯合的Sepharose(商品名,ChelatingSepharose Fast-Flow;得自Pharmacia)的柱子以将蛋白质吸附于树脂上。用含有1M氯化钠水溶液(40ml)的50mM磷酸盐缓冲液(PH7.0)洗柱子,留在柱中的蛋白质以含有1M氯化钠水溶液和0.4M的咪唑的50mM磷酸盐缓冲液(PH7.0)洗脱。然后,将洗脱液浓缩至100μl对部分浓缩样品作SDS-PAGE分析。
用SDS 10/20梯度凝胶进行SDS-PAGE分析;在pUC-SRML2-p140-A和p140-B转化的COS细胞样品中,检测到相当于分子量p140的产物。在pUC-SRML2-p140-C和p140-D转化的COS细胞制备的未处理但纯化的上消液,而不是细胞溶解产物中,检测到分子量相当于p140胞外部分的多肽。配方实施例1
用常规方法将下列组分混合,并冲压得到100片,各含5mg的活性成份的片剂。
维生素K5                     500.0mg
羧甲基纤维素钙                200.0mg
硬脂酸镁                      100.0mg
微晶纤维素                    9.2mg
                  序列表(1)一般资料:(i)申请人:
(A)姓名:Ono Pharmaceutical Co.Ltd.
(B)街道:1-5,Doshomachi 2-chome
(C)城市:Chuo-Ku,Osaka-shi
(D)州  :Osaka
(E)国家:Japan
(F)邮编: 541
(G)电话:(06)222-5551
(H)电传:(06)222-5706(ii)发明名称:一种新的蛋白质p140多肽及编码该多肽的DNA(iii)序列数目:16(2)SEQ ID No.1的资料(i)序列特征:
(A)长度:993个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线性(ii)分子类型:蛋白质(vi)来源:
(A)有机体:大鼠
(F)组织类型:骨骼肌成肌细胞
(H)细胞系:L6(xi)序列描写:SEQ ID NO:1:Met Glu Asn Pro Tyr Val Gly Arg Ala Arg Ala Ala Ala Glu Arg Ala1               5                   10                  15Ala Ala Glu Ala Thr Asn Ser Leu Ser Ile Leu Val Arg Pro Thr Ser
        20                  25                  30Glu Gly Ser Arg Ile Asp Ser Glu Phe Val Glu Leu Ala Trp Thr Ser
    35                  40                  45His Pro Glu Ser Gly Trp Glu Glu Val Ser Ala Tyr Asp Glu Ala Met
50                  55                  60Asn Pro Ile Arg Thr Tyr Gln Val Cys Asn Val Arg Glu Ser Ser Gln65                  70                  75                  80Asn Asn Trp Leu Arg Thr Gly Phe Ile Trp Arg Arg Glu Val Gln Arg
            85                  90                  95Val Tyr Val Glu Leu Lys Phe Thr Val Arg Asp Cys Asn Ser Ile Pro
        100                 105                 110Asn Ile Pro Gly Ser Cys Lys Glu Thr Phe Asn Leu Phe Tyr Tyr Glu
    115                 120                 125Ala Asp Ser Asp Val Ala Ser Ala Ser Ser Pro Phe Trp Met Glu Asn
130                 135                 140Pro Tyr Val Lys Val Asp Thr Ile Ala Pro Asp Glu Ser Phe Ser Arg145                 150                 155                 160Leu Asp Ala Gly Arg Val Asn Thr Lys Val Arg Ser Phe Gly Pro Leu
            165                 170                 175Ser Lys Ala Gly Phe Tyr Leu Ala Phe Gln Asp Gln Gly Ala Cys Met
        180                 185                 190Ser Leu Ile Ser Val Arg Ala Phe Tyr Lys Lys Cys Ala Ser Thr Thr
    195                 200                 205Ala Gly Phe Ala Leu Phe Pro Glu Thr Leu Thr Gly Ala Glu Pro Thr
210                 215                 220Ser Leu Val Ile Ala Pro Gly Thr Cys Ile Ala Asn Ala Val Glu Val225                 230                 235                 240Ser Val Pro Leu Lys Leu Tyr Cys Asn Gly Asp Gly Glu Trp Met Val
            245                 250                 255Pro Val Gly Ala Cys Thr Cys Ala Thr Gly His Glu Pro Ala Ala Lys
        260                 265                 270Glu Thr Gln Cys Arg Ala Cys Pro Pro Gly Ser Tyr Lys Ala Lys Gln
    275                 280                 285Gly Glu Gly Pro Cys Leu Pro Cys Pro Pro Asn Ser Arg Thr Thr Ser
290                 295                 300Pro Ala Ala Ser Ile Cys Thr Cys His Asn Asn Phe Tyr Arg Ala Asp305                 310                 315                320Ser Asp Thr Ala Asp Ser Ala Cys Thr Thr Val Pro Ser Pro Pro Arg
            325                 330                 335Gly Val Ile Ser Asn Val Asn Glu Thr Ser Leu Ile Leu Glu Trp Ser
        340                 345                 350Glu Pro Arg Asp Leu Gly Gly Arg Asp Asp Leu Leu Tyr Asn Val Ile
    355                 360                 365Cys Lys Lys Cys Arg Gly Ser Ser Gly Ala Gly Gly Pro Ala Thr Cys
370                 375                 380Ser Arg Cys Asp Asp Asn Val Glu Phe Glu Pro Arg Gln Leu Gly Leu385                 390                 395                 400Thr Glu Arg Arg Val His Ile Ser His Leu Leu Ala His Thr Arg Tyr
            405                 410                 415Thr Phe Glu Val Gln Ala Val Asn Gly Val Ser Gly Lys Ser Pro Leu
        420                 425                 430Pro Pro Arg Tyr Ala Ala Val Asn Ile Thr Thr Asn Gln Ala Ala Pro
    435                 440                 445Ser Glu Val Pro Thr Leu His Leu His Ser Ser Ser Gly Ser Ser Leu
450                 455                 460Thr Leu Ser Trp Ala Pro Pro Glu Arg Pro Asn Gly Val Ile Leu Asp465                 470                 475                 480Tyr Glu Met Lys Tyr Phe Glu Lys Ser Lys Gly Ile Ala Ser Thr Val
            485                 490                 495Thr Ser Gln Lys Asn Ser Val Gln Leu Asp Gly Leu Gln Pro Asp Ala
        500                 505                 510Arg Tyr Val Val Gln Val Arg Ala Arg Thr Val Ala Gly Tyr Gly Gln
    515                 520                 525Tyr Ser Arg Pro Ala Glu Phe Glu Thr Thr Ser Glu Arg Gly Ser Gly
530                 535                 540Ala Gln Gln Leu Gln Glu Gln Leu Pro Leu Ile Val Gly Ser Thr Val545                 550                 555                 560Ala Gly Phe Val Phe Met Val Val Val Val Val Ile Ala Leu Val Cys
            565                 570                 575Leu Arg Lys Gln Arg Gln Gly Pro Asp Ala Glu Tyr Thr Glu Lys Leu
        580                 585                 590Gln Gln Tyr Val Ala Pro Arg Met Lys Val Tyr Ile Asp Pro Phe Thr
    595                 600                 605Tyr Glu Asp Pro Asn Glu Ala Val Arg Glu Phe Ala Lys Glu Ile Asp
610                 615                 620Val Ser Cys Val Lys Ile Glu Glu Val Ile Gly Ala Gly Glu Phe Gly625                 630                 635                 640Glu Val Cys Arg Gly Arg Leu Lys Leu Pro Gly Arg Arg Glu Val Phe
            645                 650                 655Val Ala Ile Lys Thr Leu Lys Val Gly Tyr Thr Glu Arg Gln Arg Arg
        660                 665                 670Asp Phe Leu Ser Glu Ala Ser Ile Met Gly Gln Phe Asp His Pro Asn
    675                 680                 685Ile Ile Arg Leu Glu Gly Val Val Thr Lys Ser Arg Pro Val Met Ile
690                 695                 700Leu Thr Glu Phe Met Glu Asn Cys Ala Leu Asp Ser Phe Leu Arg Leu705                 710                 715                 720Asn Asp Gly Gln Phe Thr Val Ile Gln Leu Val Gly Met Leu Arg Gly
            725                 730                 735Ile Ala Ala Gly Met Lys Tyr Leu Ser Glu Met Asn Tyr Val His Arg
        740                 745                 750Asp Leu Ala Ala Arg Asn Ile Leu Val Asn Ser Asn Leu Val Cys Lys
    755                 760                 765Val Ser Asp Phe Gly Leu Ser Arg Phe Leu Glu Asp Asp Pro Ser Asp
770                 775                 780Pro Thr Tyr Thr Ser Ser Leu Gly Gly Lys Ile Pro Ile Arg Trp Thr785                 790                 795                 800Ala Pro Glu Ala Ile Asp Tyr Arg Lys Phe Thr Ser Ala Ser Asp Val
            805                 810                 815Trp Ser Tyr Gly Ile Val Met Trp Glu Val Met Ser Tyr Gly Glu Arg
        820                 825                 830Pro Tyr Trp Asp Met Ser Asn Gln Asp Val Ile Asn Ala Val Glu Gln
    835                 840                 845Asp Tyr Arg Leu Pro Pro Pro Met Asp Cys Pro Ala Ala Leu His Gln
850                 855                 860Leu Met Leu Asp Cys Trp Val Arg Asp Arg Asn Leu Arg Pro Lys Phe865                 870                 875                 880Ser Gln Ile Val Asn Thr Leu Asp Lys Leu Ile Arg Asn Ala Ala Ser
            885                 890                 895Leu Lys Val Ile Ala Ser Ala Pro Ser Gly Met Ser Gln Pro Leu Leu
        900                 905                 910Asp Arg Thr Val Pro Asp Tyr Thr Thr Phe Thr Thr Val Gly Asp Trp
    915                 920                 925Leu Asp Ala Ile Lys Met Gly Arg Tyr Lys Glu Ser Phe Val Gly Ala
930                 935                 940Gly Phe Ala Ser Phe Asp Leu Val Ala Gln Met Thr Ala Glu Asp Leu945                 950                 955                 960Leu Arg Ile Gly Val Thr Leu Ala Gly His Gln Lys Lys Ile Leu Ser
            965                 970                 975Ser Ile Gln Asp Met Arg Leu Gln Met Asn Gln Thr Leu Pro Val Gln
        980                 985                 990Val(2)SEQ ID No.2的资料:(i)序列特征:
(A)长度:2982个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性(ii)分子类型:cDNA到mRNA(vi)来源:
(A)有机体:大鼠
(F)组织类型:骨骼肌成肌细胞
(H)细胞系:L6(xi)序列描述:SEQ ID No.2:ATGGAGAACC  CCTACGTTGG  GCGAGCGAGA  GCAGCAGCGG  AGCGAGCAGC  GGCAGAAGCC      60ACGAATTCAC  TATCGATCCT  GGTTCGGCCC  ACCTCTGAAG  GTTCCAGAAT  CGATAGTGAA     120TTCGTGGAGC  TGGCATGGAC  ATCTCATCCA  GAGAGTGGGT  GGGAAGAAGT  GAGCGCCTAC     180GATGAAGCCA  TGAATCCTAT  CCGCACGTAT  CAGGTGTGTA  ACGTGCGCGA  GTCCAGCCAG     240AACAACTGGC  TGCGGACCGG  TTTCATCTGG  CGGCGGGAAG  TCCAGCGCGT  CTACGTGGAG     300CTGAAGTTTA  CCGTGAGAGA  TTGCAACAGC  ATCCCCAACA  TCCCTGGCTC  CTGCAAGGAA     360ACCTTCAACC  TTTTTTACTA  CGAGGCTGAT  AGCGATGTGG  CGTCAGCCTC  CTCTCCCTTC     420TGGATGGAGA  ACCCCTACGT  GAAAGTGGAC  ACCATTGCGC  CAGATGAGAG  CTTCTCGCGG     480CTAGACGCTG  GGCGCGTTAA  CACCAAAGTG  CGCAGCTTCG  GGCCGCTTTC  CAAAGCCGGC     540TTCTACTTGG  CCTTCCAGGA  CCAGGGTGCC  TGCATGTCAC  TCATCTCTGT  GCGCGCCTTC     600TACAAGAAGT  GTGCATCCAC  CACTGCAGGC  TTCGCACTCT  TCCCCGAGAC  CCTCACGGGG     660GCTGAGCCCA  CTTCGCTGGT  CATTGCCCCT  GGCACCTGCA  TCGCTAACGC  TGTGGAGGTG     720TCTGTACCGC  TCAAGCTCTA  CTGCAATGGC  GACGGGGAGT  GGATGGTGCC  CGTTGGTGCC     780TGCACCTGCG  CTACTGGCCA  TGAGCCAGCC  GCCAAGGAGA  CCCAGTGCCG  CGCCTGTCCC     840CCTGGGACCT  ACAAGGCAAA  GCAAGGAGAG  GGGCCCTGCC  TCCCCTGTCC  CCCCAATAGC     900CGCACCACCT  CGCCGGCTGC  CAGCATCTGC  ACCTGTCACA  ATAATTTCTA  CCGCGCAGAC     960TCAGACACAG  CGGACAGCGC  CTGCACCACG  GTGCCGTCTC  CCCCCCGGGG  TGTGATCTCC    1020AATGTGAATG  AGACCTCGCT  GATCCTCGAG  TGGAGTGAGC  CCCGGGACCT  TGGCGGACGA    1080GATGACCTCC  TTTATAATGT  TATCTGTAAG  AAGTGCCGTG  GCAGCTCTGG  GGCTGGAGGT    1140CCGGCGACCT  GTTCACGCTG  TGATGACAAC  GTGGAGTTCG  AGCCCCGACA  GCTGGGCCTG    1200ACCGAGCGCC  GGGTCCACAT  CAGCCACCTG  TTGGCCCACA  CCCGCTACAC  CTTTGAGGTG    1260CAGGCTGTCA  ACGGCGTCTC  TGGCAAAAGC  CCTTTGCCGC  CCCGCTATGC  AGCTGTGAAT    1320ATCACCACCA  ACCAGGCCGC  CCCATCAGAA  GTGCCTACGC  TCCACTTGCA  CAGCAGTTCA    1380GGGAGCAGCC  TGACCCTGTC  CTGGGCACCC  CCGGAGCGGC  CTAACGGAGT  CATCTTGGAC    1440TATGAGATGA  AGTACTTTGA  GAAGAGTAAA  GGCATCGCCT  CCACTGTCAC  CAGCCAGAAG    1500AACTCTGTAC  AACTGGACGG  ACTGCAGCCC  GACGCCCGCT  ATGTAGTTCA  GGTCCGGGCT    1560CGCACAGTAG  CAGGTTACGG  ACAGTATAGC  CGCCCAGCTG  AGTTTGAGAC  CACGAGTGAA    1620AGAGGCTCAG  GGGCCCAGCA  GCTTCAAGAG  CAGCTTCCCC  TAATTGTGGG  ATCCACCGTA    1680GCTGGCTTTG  TCTTCATGGT  GGTCGTCGTG  GTCATTGCTC  TTGTCTGCCT  CAGGAAGCAG    1740CGCCAGGGCC  CTGATGCAGA  ATACACGGAG  AAGTTGCAGC  AATACGTTGC  CCCCAGGATG    1800AAAGTTTACA  TTGACCCCTT  TACCTACGAG  GATCCCAATG  AGGCCGTCCG  AGAGTTCGCC    1860AAGGAGATCG  ATGTGTCCTG  CGTCAAGATC  GAGGAGGTGA  TTGGAGCTGG  GGAGTTTGGG    1920GAAGTGTGCC  GGGGTCGGCT  GAAACTGCCC  GGCCGCCGGG  AGGTGTTCGT  GGCCATCAAG    1980ACACTGAAGG  TGGGATACAC  GGAGAGGCAG  CGGCGGGACT  TCCTGAGTGA  GGCTTCCATC    2040ATGGGTCAAT  TTGACCATCC  AAATATAATC  CGTCTAGAGG  GCGTGGTCAC  CAAAAGTCGT    2100CCAGTCATGA  TCCTCACTGA  GTTCATGGAG  AACTGTGCCC  TGGACTCCTT  CCTACGGCTC    2160AATGACGGGC  AGTTCACAGT  CATCCAGCTT  GTGGGCATGT  TGCGTGGCAT  TGCTGCCGGC    2220ATGAAGTACT  TGTCTGAGAT  GAACTACGTG  CACCGTGACC  TCGCTGCCCG  CAACATCCTT    2280GTCAACAGTA  ACTTGGTCTG  CAAAGTATCT  GACTTTGGGC  TCTCCCGCTT  CCTGGAGGAC    2340GACCCCTCAG  ACCCCACCTA  CACCAGCTCC  CTGGGTGGGA  AGATCCCTAT  CCGTTGGACC    2400GCCCCAGAGG  CCATAGACTA  TCGGAAGTTC  ACGTCTGCCA  GCGATGTCTG  GAGCTACGGG    2460ATCGTCATGT  GGGAGGTCAT  GAGCTACGGA  GAGCGACCAT  ACTGGGACAT  GAGCAACCAG    2520GATGTCATCA  ATCCCGTAGA  GCAAGACTAT  CGGTTACCAC  CCCCCATGGA  CTGCCCAGCG    2580GCGCTGCACC  AGCTCATGCT  GGACTGTTGG  GTGCGGGACC  GGAACCTCAG  GCCCAAGTTC    2640TCCCAAATCG  TCAACACGCT  AGACAAGCTT  ATCCGCAATG  CTGCCAGCCT  CAAGGTCATC    2700GCCAGTGCCC  CATCTGGCAT  GTCCCAGCCC  CTCCTAGACC  GCACGGTCCC  AGATTATACG    2760ACCTTCACGA  CGGTGGGCGA  CTGGCTAGAT  GCCATCAAGA  TGGGGAGGTA  TAAAGAGAGC     2820TTCGTCGGTG  CGGGTTTTGC  CTCCTTTGAC  CTGGTGGCCC  AGATGACTGC  AGAAGATCTG     2880CTAAGGATCG  GGGTCACTTT  GGCCGGCCAC  CAGAAGAAGA  TCCTCAGCAG  TATCCAGGAC     2940ATGCGGCTGC  AGATGAACCA  GACACTGCCC  GTGCAGGTCT  GA                         2982(2)SEQ ID No.3的资料:(i)序列特征:
(A)长度:4027个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性(ii)分子类型:cDNA到mRNA(vi)来源:
(A)有机体:大鼠
(F)组织类型:骨骼肌成肌细胞
(H)细胞系:L6(xi)序列描述:SEQ ID No.3:GAAAAATGAA  GATCTATACC  GACAGCAGAT  CAGTGGCTGC  CTGGGGCAAA  GTTGGAGGGA      60CATGTTATTT  TGATTGTGAT  GACATAATAC  ATGCAAACAC  GGCTAATCCT  CTCAAAGCAT     120ACACTTATAC  ATGTGCAGCT  TGGTATACAT  AAATTATCCA  TTACAAAACT  ATGAGAAAGC     180TATCACCACT  ATGAAGCACC  ACTCACAGTA  TGTGAATCTC  CACCCCCCTT  CCACTGCTGA     240GACACAGAAA  TCCTAGACTG  GATGGAGAAC  CCCTACGTTG  GGCGAGCGAG  AGCAGCAGCG     300GAGCGAGCAG  CGGCAGAAGC  CACGAATTCA  CTATCGATCC  TGGTTCGGCC  CACCTCTGAA     360GGTTCCAGAA  TCGATAGTGA  ATTCGTGGAG  CTGGCATGGA  CATCTCATCC  AGAGAGTGGG     420TGGGAAGAAG  TGAGCGCCTA  CGATGAAGCC  ATGAATCCTA  TCCGCACGTA  TCAGGTGTGT     480AACGTGCGCG  AGTCCAGCCA  GAACAACTGG  CTGCGGACCG  GTTTCATCTG  GCGGCGGGAA     540GTCCAGCGCG  TCTACGTGGA  GCTGAAGTTT  ACCGTGAGAG  ATTGCAACAG  CATCCCCAAC     600ATCCCTGGCT  CCTGCAAGGA  AACCTTCAAC  CTTTTTTACT  ACGAGGCTGA  TAGCGATGTG     660GCGTCAGCCT  CCTCTCCCTT  CTGGATGGAG  AACCCCTACG  TGAAAGTGGA  CACCATTGCG     720CCAGATGAGA  GCTTCTCGCG  GCTAGACGCT  GGGCGCGTTA  ACACCAAAGT  GCGCAGCTTC     780GGGCCGCTTT  CCAAAGCCGG  CTTCTACTTG  GCCTTCCAGG  ACCAGGGTGC  CTGCATGTCA     840CTCATCTCTG  TGCGCGCCTT  CTACAAGAAG  TGTGCATCCA  CCACTGCAGG  CTTCGCACTC     900TTCCCCGAGA  CCCTCACGGG  GGCTGAGCCC  ACTTCGCTFF  TCATTGCCCC  TGGCACCTGC     960ATCGCTAACG  CTGTGGAGGT  GTCTGTACCG  CTCAAGCTCT  ACTGCAATFF  CGACGGGGAG    1020TGGATGGTGC  CCGTTGGTGC  CTGCACCTGC  GCTACTGGCC  ATGAGCCAGC  CGCCAAGGAG    1080ACCCAGTGCC  GCGCCTGTCC  CCCTGGGAGC  TACAAGGCAA  AGCAAGGAGA  GGGGCCCTGC    1140CTCCCCTGTC  CCCCCAATAG  CCGCACCACC  TCGCCGGCTG  CCAGCATCTG  CACCTGTCAC    1200AATAATTTCT  ACCGCGCAGA  CTCAGACACA  GCGGACAGCG  CCTGCACCAC  GGTGCCGTCT    1260CCCCCCCGGG  GTGTGATCTC  CAATGTGAAT  GAGACCTCGC  TGATCCTCGA  GTGGAGTGAG    1320CCCCGGGACC  TTGGCGGACG  AGATGACCTC  CTTTATAATG  TTATCTGTAA  GAAGTGCCGT    1380GGCAGCTCTG  GGGCTGGAGG  TCCGGCGACC  TGTTCACGCT  GTGATGACAA  CGTGGAGTTC    1440GAGCCCCGAC  AGCTGGGCCT  GACCGAGCGC  CGGGTCCACA  TCAGCCACCT  GTTGGCCCAC    1500ACCCGCTACA  CCTTTGAGGT  GCAGGCTGTC  AACGGCGTCT  CTGGCAAAAG  CCCTTTGCCG    1560CCCCGCTATG  CAGCTGTGAA  TATCACCACC  AACCAGGCCG  CCCCATCAGA  AGTGCCTACG    1620CTCCACTTGC  ACAGCAGTTC  AGGGAGCAGC  CTGACCCTGT  CCTGGGCACC  CCCGGAGCGG    1680CCTAACGGAG  TCATCTTGGA  CTATGAGATG  AAGTACTTTG  AGAAGAGTAA  AGGCATCGCC    1740TCCACTGTCA  CCAGCCAGAA  GAACTCTGTA  CAACTGGACG  GACTGCAGCC  CGACGCCCGC    1800TATGTAGTTC  AGGTCCGGGC  TCGCACAGTA  GCAGGTTACG  GACAGTATAG  CCGCCCAGCT    1860GAGTTTGAGA  CCACGAGTGA  AAGAGGCTCA  GGGGCCCAGC  AGCTTCAAGA  GCAGCTTCCC    1920CTAATTGTGG  GATCCACCGT  AGCTGGCTTT  GTCTTCATGG  TGGTCGTCGT  GGTCATTGCT    1980CTTGTCTGCC  TCAGGAAGCA  GCGCCAGGGC  CCTGATGCAG  AATACACGGA  GAAGTTGCAG    2040CAATACGTTG  CCCCCAGGAT  GAAAGTTTAC  ATTGACCCCT  TTACCTACGA  GGATCCCAAT    2100GAGGCCGTCC  GAGAGTTCGC  CAAGGAGATC  GATGTGTCCT  GCGTCAAGAT  CGAGGAGGTG    2160ATTGGAGCTG  GGGAGTTTGG  GGAAGTGTGC  CGGGGTCGGC  TGAAACTGCC  CGGCCGCCGG    2220GAGGTGTTCG  TGGCCATCAA  GACACTGAAG  GTGGGATACA  CGGAGAGGCA  GCGGCGGGAC    2280TTCCTGAGTG  AGGCTTCCAT  CATGGGTCAA  TTTGACCATC  CAAATATAAT  CCGTCTAGAG    2340GGCGTGGTCA  CCAAAAGTCG  TCCAGTCATG  ATCCTCACTG  AGTTCATGGA  GAACTGTGCC    2400CTGGACTCCT  TCCTACGGCT  CAATGACGGG  CAGTTCACAG  TCATCCAGCT  TGTGGGCATG    2460TTGCGTGGCA  TTGCTGCCGG  CATGAAGTAC  TTGTCTGAGA  TGAACTACGT  GCACCGTGAC    2520CTCGCTGCCC  GCAACATCCT  TGTCAACAGT  AACTTGGTCT  GCAAAGTATC  TGACTTTGGG    2580CTCTCCCGCT   TCCTGGAGGA   CGACCCCTCA   GACCCCACCT   ACACCAGCTC   CCTGGGTGGG     2640AAGATCCCTA   TCCGTTGGAC   CGCCCCAGAG   GCCATAGACT   ATCGGAAGTT   CACGTCTGCC     2700AGCGATGTCT   GGAGCTACGG   GATCGTCATG   TGGGAGGTCA   TGAGCTACGG   AGAGCGACCA     2760TACTGGGACA   TGAGCAACCA   GGATGTCATC   AATGCCGTAG   AGCAAGACTA   TCGGTTACCA     2820CCCCCCATGG   ACTGCCCAGC   GGCGCTGCAC   CAGCTCATGC   TGGACTGTTG   GGTGCGGGAC     2880CGGAACCTCA   GGCCCAAGTT   CTCCCAAATC   GTCAACACGC   TAGACAAGCT   TATCCGCAAT     2940GCTGCCAGCC   TCAAGGTCAT   CGCCAGTGCC   CCATCTGGCA   TGTCCCAGCC   CCTCCTAGAC     3000CGCACGGTCC   CAGATTATAC   GACCTTCACG   ACGGTGGGCG   ACTGGCTAGA   TGCCATCAAG     3060ATGGGGAGGT   ATAAAGAGAG   CTTCGTCGGT   GCGGGTTTTG   CCTCCTTTGA   CCTGGTGGCC     3120CAGATGACTG   CAGAAGATCT   GCTAAGGATC   GGGGTCACTT   TGGCCGGCCA   CCAGAAGAAG     3180ATCCTCAGCA   GTATCCAGGA   CATGCGGCTG   CAGATGAACC   AGACACTGCC   CGTGCAGGTC     3240TGACGCTCAG   CTCCAGCGAG   GGGCGTGGCC   CCCCGGGACT   GCACAAGGAT   TCTGACCAGC     3300CAGCTGGACT   TTTGGATACC   TGGCCTTTGG   CTGTGGCCCA   GAAGACAGAA   GTTCGGGGGA     3360GAACCCTAGC   TGTGACTTCT   CCAAGCCTGT   GCTCCCTCCC   AGGAAGTGTG   CCCCAAACCT     3420CTTCATATTG   AAGATGGATT   AGAAGAGGGG   GTGATATCCC   CTCCCCAGAT   GCCTCAGGGC     3480CCAGGCCTGC   CTGCTCTCCA   GTCGGGGATC   TTCACAACTC   AGATTTGGTT   GTGCTTCAGT     3540AGTGGAGGTC   CTGGTAGGGT   CGGGTGGGGA   TAAGCCTGGG   TTCTTCAGGC   CCCAGCCCTG     3600GCAGGGGTCT   GACCCCAGCA   GGTAAGCAGA   GAGTACTCCC   TCCCCAGGAA   GTGGAGGAGG     3660GGACTCTGGG   AATGGGGAAA   TATGGTGCCC   CATCCTGAAG   CCAGCTGGTA   CCTCCAGTTT     3720GCACAGGGAC   TTGTTGGGGG   CTGAGGGCCC   TGCCTACCCT   TGGTGCTGTC   ATAAAAGGGC     3780AGGCGGGAGC   GGGCTGAGAA   ACAGCCTGTG   CCTCCCAGAG   ACTGACTCAG   AGAGCCAGAG     3840ACGTGTGTGT   GTGTGTGTGT   GTGTGTGTGT   GTGTGTGTGT   GTGTGTGAAA   GACGGGGGTG     3900GGGTATGTAT   GCGTGTGTTG   TGCACATGCT   TGCCTGCACA   GAGAGCATGA   GTGTGTACAA     3960GCTTAGCCCT   GTGCCCTGTA   GTGGGGCCAG   CTGGGCAGAC   AGCGAAATAA   AAGGCAATAA     4020GTTGAAA                                                                         4027(2)SEQ ID No.4的资料:(i)序列特征:
(A)长度:4027个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性(ii)分子类型:cDNA到mRNA(vi)来源:
(A)有机体:大鼠
(F)组织类型:骨骼肌成肌细胞
(H)细胞系:L6(ix)特点:
(A)名字/关键词:CDS
(B)位置:262..3243
(C)辩别方法:与其它方式相同(xi)序列描述:SEQ ID No.4:GAAAAATGAA GATCTATACC GACAGCAGAT CAGTGGCTGC CTGGGGCAAA GTTGGAGGGA      60CATGTTATTT TGATTGTGAT GACATAATAC ATGCAAACAC GGCTAATCCT CTCAAAGCAT     120ACACTTATAC ATGTGCAGCT TGGTATACAT AAATTATCCA TTACAAAACT ATGAGAAAGC     180TATCACCACT ATGAAGCACC ACTCACAGTA TGTGAATCTC CACCCCCCTT CCACTGCTGA     240GACACAGAAA TCCTAGACTG G ATG GAG AAC CCC TAC GTT GGG CGA GCG AGA       291
                    Met Glu Asn Pro Tyr Val Gly Arg Ala Arg
                      1               5                 10GCA GCA GCG GAG CGA GCA GCG GCA GAA GCC ACG AAT TCA CTA TCG ATC       339Ala Ala Ala Glu Arg Ala Ala Ala Glu Ala Thr Asn Ser Leu Ser Ile
            15                  20                  25CTG GTT CGG CCC ACC TCT GAA GGT TCC AGA ATC GAT AGT GAA TTC GTG       387Leu Val Arg Pro Thr Ser Glu Gly Ser Arg Ile Asp Ser Glu Phe Val
        30                  35                  40GAG CTG GCA TGG ACA TCT CAT CCA GAG AGT GGG TGG GAA GAA GTG AGC       435Glu Leu Ala Trp Thr Ser His Pro Glu Ser Gly Trp Glu Glu Val Ser
    45                  50                  55GCC TAC GAT GAA GCC ATG AAT CCT ATC CGC ACG TAT CAG GTG TGT AAC       483Ala Tyr Asp Glu Ala Met Asn Pro Ile Arg Thr Tyr Gln Val Cys Asn
60                  65                  70GTG CGC GAG TCC AGC CAG AAC AAC TGG CTG CGG ACC GGT TTC ATC TGG       531Val Arg Glu Ser Ser Gln Asn Asn Trp Leu Arg Thr Gly Phe Ile Trp75                  80                  85                  90CGG CGG GAA GTC CAG CGC GTC TAC GTG GAG CTG AAG TTT ACC GTG AGA       579Arg Arg Glu Val Gln Arg Val Tyr Val Glu Leu Lys Phe Thr Val Arg
            95                  100                 105GAT TGC AAC AGC ATC CCC AAC ATC CCT GGC TCC TGC AAG GAA ACC TTC       627Asp Cys Asn Ser Ile Pro Asn Ile Pro Gly Ser Cys Lys Glu Thr Phe
        110                 115                 120AAC CTT TTT TAC TAC GAG GCT GAT AGC GAT GTG GCG TCA GCC TCC TCT       675Asn Leu Phe Tyr Tyr Glu Ala Asp Ser Asp Val Ala Ser Ala Ser Ser
    125                 130                 135CCC TTC TGG ATG GAG AAC CCC TAC GTG AAA GTG GAC ACC ATT GCG CCA       723Pro Phe Trp Met Glu Asn Pro Tyr Val Lys Val Asp Thr Ile Ala Pro
140                 145                 150GAT GAG AGC TTC TCG CGG CTA GAC GCT GGG CGC GTT AAC ACC AAA GTG       771Asp Glu Ser Phe Ser Arg Leu Asp Ala Gly Arg Val Asn Thr Lys Val155                 160                 165                 170CGC AGC TTC GGG CCG CTT TCC AAA GCC GGC TTC TAC TTG GCC TTC CAG       819Arg Ser Phe Gly Pro Leu Ser Lys Ala Gly Phe Tyr Leu Ala Phe Gln
            175                 180                 185GAC CAG GGT GCC TGC ATG TCA CTC ATC TCT GTG CGC GCC TTC TAC AAG       867Asp Gln Gly Ala Cys Met Ser Leu Ile Ser Val Arg Ala Phe Tyr Lys
        190                 195                 200AAG TGT GCA TCC ACC ACT GCA GGC TTC GCA CTC TTC CCC GAG ACC CTC       915Lys Cys Ala Ser Thr Thr Ala Gly Phe Ala Leu Phe Pro Glu Thr Leu
    205                 210                 215ACG GGG GCT GAG CCC ACT TCG CTG GTC ATT GCC CCT GGC ACC TGC ATC       963Thr Gly Ala Glu Pro Thr Ser Leu Val Ile Ala Pro Gly Thr Cys Ile
220                 225                 230GCT AAC GCT GTG GAG GTG TCT GTA CCG CTC AAG CTC TAC TGC AAT GGC      1011Ala Asn Ala Val Glu Val Ser Val Pro Leu Lys Leu Tyr Cys Asn Gly235                 240                 245                 250GAC GGG GAG TGG ATG GTG CCC GTT GGT GCC TGC ACC TGC GCT ACT GGC      1059Asp Gly Glu Trp Met Val Pro Val Gly Ala Cys Thr Cys Ala Thr Gly
            255                 260                 265CAT GAG CCA GCC GCC AAG GAG ACC CAG TGC CGC GCC TGT CCC CCT GGG      1107His Glu Pro Ala Ala Lys Glu Thr Gln Cys Arg Ala Cys Pro Pro Gly
        270                 275                 280AGC TAC AAG GCA AAG CAA GGA GAG GGG CCC TGC CTC CCC TGT CCC CCC      1155Ser Tyr Lys Ala Lys Gln Gly Glu Gly Pro Cys Leu Pro Cys Pro Pro
    285                 290                 295AAT AGC CGC ACC ACC TCG CCG GCT GCC AGC ATC TGC ACC TGT CAC AAT      1203Asn Ser Arg Thr Thr Ser Pro Ala Ala Ser Ile Cys Thr Cys His Asn
300                 305                310AAT TTC TAC CGC GCA GAC TCA GAC ACA GCG GAC AGC GCC TGC ACC ACG      1251Asn Phe Tyr Arg Ala Asp Ser Asp Thr Ala Asp Ser Ala Cys Thr Thr315                 320                 325                 330GTG CCG TCT CCC CCC CGG GGT GTG ATC TCC AAT GTG AAT GAG ACC TCG      1299Val Pro Ser Pro Pro Arg Gly Val Ile Ser Asn Val Asn Glu Thr Ser
            335                 340                 345CTG ATC CTC GAG TGG AGT GAG CCC CGG GAC CTT GGC GGA CGA GAT GAC      1347Leu Ile Leu Glu Trp Ser Glu Pro Arg Asp Leu Gly Gly Arg Asp Asp
        350                 355                 360CTC CTT TAT AAT GTT ATC TGT AAG AAG TGC CGT GGC AGC TCT GGG GCT      1395Leu Leu Tyr Asn Val Ile Cys Lys Lys Cys Arg Gly Ser Ser Gly Ala
    365                 370                 375GGA GGT CCG GCG ACC TGT TCA CGC TGT GAT GAC AAC GTG GAG TTC GAG      1443Gly Gly Pro Ala Thr Cys Ser Arg Cys Asp Asp Asn Val Glu Phe Glu
380                 385                 390CCC CGA CAG CTG GGC CTG ACC GAG CGC CGG GTC CAC ATC AGC CAC CTG      1491Pro Arg Gln Leu Gly Leu Thr Glu Arg Arg Val His Ile Ser His Leu395                 400                 405                 410TTG GCC CAC ACC CGC TAC ACC TTT GAG GTG CAG GCT GTC AAC GGC GTC      1539Leu Ala His Thr Arg Tyr Thr Phe Glu Val Gln Ala Val Asn Gly Val
            415                 420                 425TCT GGC AAA AGC CCT TTG CCG CCC CGC TAT GCA GCT GTG AAT ATC ACC      1587Ser Gly Lys Ser Pro Leu Pro Pro Arg Tyr Ala Ala Val Asn Ile Thr
        430                 435                 440ACC AAC CAG GCC GCC CCA TCA GAA GTG CCT ACG CTC CAC TTG CAC AGC      1635Thr Asn Gln Ala Ala Pro Ser Glu Val Pro Thr Leu His Leu His Ser
    445                 450                 455AGT TCA GGG AGC AGC CTG ACC CTG TCC TGG GCA CCC CCG GAG CGG CCT      1683Ser Ser Gly Ser Ser Leu Thr Leu Ser Trp Ala Pro Pro Glu Arg Pro
460                 465                 470AAC GGA GTC ATC TTG GAC TAT GAG ATG AAG TAC TTT GAG AAG AGT AAA      1731Asn Gly Val Ile Leu Asp Tyr Glu Met Lys Tyr Phe Glu Lys Ser Lys475                 480                 485                 490GGC ATC GCC TCC ACT GTC ACC AGC CAG AAG AAC TCT GTA CAA CTG GAC      1779Gly Ile Ala Ser Thr Val Thr Ser Gln Lys Asn Ser Val Gln Leu Asp
            495                 500                 505GGA CTG CAG CCC GAC GCC CGC TAT GTA GTT CAG GTC CGG GCT CGC ACA      1827Gly Leu Gln Pro Asp Ala Arg Tyr Val Val Gln Val Arg Ala Arg Thr
        510                 515                520GTA GCA GGT TAC GGA CAG TAT AGC CGC CCA GCT GAG TTT GAG ACC ACG      1875Val Ala Gly Tyr Gly Gln Tyr Ser Arg Pro Ala Glu Phe Glu Thr Thr
    525                 530                 535AGT GAA AGA GGC TCA GGG GCC CAG CAG CTT CAA GAG CAG CTT CCC CTA      1923Ser Glu Arg Gly Ser Gly Ala Gln Gln Leu Gln Glu Gln Leu Pro Leu
540                 545                 550ATT GTG GGA TCC ACC GTA GCT GGC TTT GTC TTC ATG GTG GTC GTC GTG      1971Ile Val Gly Ser Thr Val Ala Gly Phe Val Phe Met Val Val Val Val555                 560                 565                 570GTC ATT GCT CTT GTC TGC CTC AGG AAG CAG CGC CAG GGC CCT GAT GCA      2019Val Ile Ala Leu Val Cys Leu Arg Lys Gln Arg Gln Gly Pro Asp Ala
            575                 580                 585GAA TAC ACG GAG AAG TTG CAG CAA TAC GTT GCC CCC AGG ATG AAA GTT      2067Glu Tyr Thr Glu Lys Leu Gln Gln Tyr Val Ala Pro Arg Met Lys Val
        590                 595                 600TAC ATT GAC CCC TTT ACC TAC GAG GAT CCC AAT GAG GCC GTC CGA GAG      2115Tyr Ile Asp Pro Phe Thr Tyr Glu Asp Pro Asn Glu Ala Val Arg Glu
    605                 610                 615TTC GCC AAG GAG ATC GAT GTG TCC TGC GTC AAG ATC GAG GAG GTG ATT      2163Phe Ala Lys Glu Ile Asp Val Ser Cys Val Lys Ile Glu Glu Val Ile
620                 625                 630GGA GCT GGG GAG TTT GGG GAA GTG TGC CGG GGT CGG CTG AAA CTG CCC      2211Gly Ala Gly Glu Phe Gly Glu Val Cys Arg Gly Arg Leu Lys Leu Pro635                 640                 645                 650GGC CGC CGG GAG GTG TTC GTG GCC ATC AAG ACA CTG AAG GTG GGA TAC      2259Gly Arg Arg Glu Val Phe Val Ala Ile Lys Thr Leu Lys Val Gly Tyr
            655                 660                 665ACG GAG AGG CAG CGG CGG GAC TTC CTG AGT GAG GCT TCC ATC ATG GGT      2307Thr Glu Arg Gln Arg Arg Asp Phe Leu Ser Glu Ala Ser Ile Met Gly
        670                 675                 680CAA TTT GAC CAT CCA AAT ATA ATC CGT CTA GAG GGC GTG GTC ACC AAA      2355Gln Phe Asp His Pro Asn Ile Ile Arg Leu Glu Gly Val Val Thr Lys
    685                 690                 695AGT CGT CCA GTC ATG ATC CTC ACT GAG TTC ATG GAG AAC TGT GCC CTG      2403Ser Arg Pro Val Met Ile Leu Thr Glu Phe Met Glu Asn Cys Ala Leu
700                 705                 710GAC TCC TTC CTA CGG CTC AAT GAC GGG CAG TTC ACA GTC ATC CAG CTT      2451Asp Ser Phe Leu Arg Leu Asn Asp Gly Gln Phe Thr Val Ile Gln Leu715                 720                 725                 730GTG GGC ATG TTG CGT GGC ATT GCT GCC GGC ATG AAG TAC TTG TCT GAG      2499Val Gly Met Leu Arg Gly Ile Ala Ala Gly Met Lys Tyr Leu Ser Glu
            735                 740                 745ATG AAC TAC GTG CAC CGT GAC CTC GCT GCC CGC AAC ATC CTT GTC AAC      2547Met Asn Tyr Val His Arg Asp Leu Ala Ala Arg Asn Ile Leu Val Asn
        750                 755                 760AGT AAC TTG GTC TGC AAA GTA TCT GAC TTT GGG CTC TCC CGC TTC CTG      2595Ser Asn Leu Val Cys Lys Val Ser Asp Phe Gly Leu Ser Arg Phe Leu
    765                 770                 775GAG GAC GAC CCC TCA GAC CCC ACC TAC ACC AGC TCC CTG GGT GGG AAG      2643Glu Asp Asp Pro Ser Asp Pro Thr Tyr Thr Ser Ser Leu Gly Gly Lys
780                 785                 790ATC CCT ATC CGT TGG ACC GCC CCA GAG GCC ATA GAC TAT CGG AAG TTC      2691Ile Pro Ile Arg Trp Thr Ala Pro Glu Ala Ile Asp Tyr Arg Lys Phe795                 800                 805                 810ACG TCT GCC AGC GAT GTC TGG AGC TAC GGG ATC GTC ATG TGG GAG GTC      2739Thr Ser Ala Ser Asp Val Trp Ser Tyr Gly Ile Val Met Trp Glu Val
            815                 820                 825ATG AGC TAC GGA GAG CGA CCA TAC TGG GAC ATG AGC AAC CAG GAT GTC      2787Met Ser Tyr Gly Glu Arg Pro Tyr Trp Asp Met Ser Asn Gln Asp Val
        830                 835                 840ATC AAT GCC GTA GAG CAA GAC TAT CGG TTA CCA CCC CCC ATG GAC TGC      2835Ile Asn Ala Val Glu Gln Asp Tyr Arg Leu Pro Pro Pro Met Asp Cys
    845                 850                 855CCA GCG GCG CTG CAC CAG CTC ATG CTG GAC TGT TGG GTG CGG GAC CGG      2883Pro Ala Ala Leu His Gln Leu Met Leu Asp Cys Trp Val Arg Asp Arg
860                 865                 870AAC CTC AGG CCC AAG TTC TCC CAA ATC GTC AAC ACG CTA GAC AAG CTT      2931Asn Leu Arg Pro Lys Phe Ser Gln Ile Val Asn Thr Leu Asp Lys Leu875                 880                 885                 890ATC CGC AAT GCT GCC AGC CTC AAG GTC ATC GCC AGT GCC CCA TCT GGC      2979Ile Arg Asn Ala Ala Ser Leu Lys Val Ile Ala Ser Ala Pro Ser Gly
            895                 900                     905ATG TCC CAG CCC CTC CTA GAC CGC ACG GTC CCA GAT TAT ACG ACC TTC      3027Met Ser Gln Pro Leu Leu Asp Arg Thr Val Pro Asp Tyr Thr Thr Phe
        910                 915                 920ACG ACG GTG GGC GAC TGG CTA GAT GCC ATC AAG ATG GGG AGG TAT AAA      3075Thr Thr Val Gly Asp Trp Leu Asp Ala Ile Lys Met Gly Arg Tyr Lys
    925                 930                 935GAG AGC TTC GTC GGT GCG GGT TTT GCC TCC TTT GAC CTG GTG GCC CAG      3123Glu Ser Phe Val Gly Ala Gly Phe Ala Ser Phe Asp Leu Val Ala Gln
940                 945                 950ATG ACT GCA GAA GAT CTG CTA AGG ATC GGG GTC ACT TTG GCC GGC CAC      3171Met Thr Ala Glu Asp Leu Leu Arg Ile Gly Val Thr Leu Ala Gly His955                 960                 965                 970CAG AAG AAG ATC CTC AGC AGT ATC CAG GAC ATG CGG CTG CAG ATG AAC      3219Gln Lys Lys Ile Leu Ser Ser Ile Gln Asp Met Arg Leu Gln Met Asn
            975                 980                 985CAG ACA CTG CCC GTG CAG GTC TGACGCTCAG CTCCAGCGAG GGGCGTGGCC         3270Gln Thr Leu Pro Val Gln Val
        990CCCCGGGACT GCACAAGGAT TCTGACCAGC CAGCTGGACT TTTGGATACC TGGCCTTTGG    3330CTGTGGCCCA GAAGACAGAA GTTCGGGGGA GAACCCTAGC TGTGACTTCT CCAAGCCTGT    3390GCTCCCTCCC   AGGAAGTGTG   CCCCAAACCT   CTTCATATTG   AAGATGGATT   AGAAGAGGGG     3450GTGATATCCC   CTCCCCAGAT   GCCTCAGGGC   CCAGGCCTGC   CTGCTCTCCA   GTCGGGGATC     3510TTCACAACTC   AGATTTGGTT   GTGCTTCAGT   AGTGGAGGTC   CTGGTAGGGT   CGGGTGGGGA     3570TAAGCCTGGG   TTCTTCAGGC   CCCAGCCCTG   GCAGGGGTCT   GACCCCAGCA   GGTAAGCAGA     3630GAGTACTCCC   TCCCCAGGAA   GTGGAGGAGG   GGACTCTGGG   AATGGGGAAA   TATGGTGCCC     3690CATCCTGAAG   CCAGCTGGTA   CCTCCAGTTT   GCACAGGGAC   TTGTTGGGGG   CTGAGGGCCC     3750TGCCTACCCT   TGGTGCTGTC   ATAAAAGGGC   AGGCGGGAGC   GGGCTGAGAA   ACAGCCTGTG     3810CCTCCCAGAG   ACTGACTCAG   AGAGCCAGAG   ACGTGTGTGT   GTGTGTGTGT   GTGTGTGTGT     3870GTGTGTGTGT   GTGTGTGAAA   GACGGGGGTG   GGGTATGTAT   GCGTGTGTTG   TGCACATGCT     3930TGCCTGCACA   GAGAGCATGA   GTGTGTACAA   GCTTAGCCCT   GTGCCCTGTA   GTGGGGCCAG     3990CTGGGCAGAC   AGCGAAATAA   AAGGCAATAA   GTTGAAA                                  4027(2)SEQ ID No.5的资料:(i)序列特征:(A)长度:11个氨基酸(B)类型:氨基酸(D)拓扑结构:线性(ii)分子类型:蛋白质(vi)来源:(A)有机体:大鼠(F)组织类型:骨骼肌成肌细胞(H)细胞系:L6(xi)序列描述:SEQ ID No.5:
 Val Ile Gly Ala Gly Glu Phe Gly Glu Val cys
 1               5                   10(2)SEQ ID No.6的资料:(i)序列特征:
(A)长度:10个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线性(ii)分子类型:蛋白质(vi)来源:
(A)有机体:大鼠
(F)组织类型:骨骼肌成肌细胞
(H)细胞系:L6(xi)序列描述:SEQ ID No.6
      Asn Ile Leu Val Asn Ser Asn Leu Val Cys
      1               5                   10(2)SEQ ID No.7的资料:(i)序列特征:
(A)长度:5个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线性(ii)分子类型:蛋白质(vi)来源:
(A)有机体:大鼠
(F)组织类型:骨骼肌成肌细胞
(H)细胞系:L6(xi)序列描述:SEQ ID No.7
    Val Glu Gln Asp Tyr
    1               5(2)SEQ ID No.8的资料:(i)序列特征:
(A)长度:28个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性(ii)分子类型:DNA(合成的)(xi)序列描述:SEQ ID No.8:
GTAATACGAC TCACTATAGG GGAGAGCT                    28(2)SEQ ID No.9的资料:(i)序列特征:
(A)长度:28个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性(ii)分子类型:DNA(合成的)(xi)序列描述:SEQ ID No.9:
      CTCCCCTATA GTGAGTCGTA TTACTGCA              28(2)SEQ ID No.10的资料:(i)序列特征:
(A)长度:32个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性(ii)分子类型:DNA(合成的)(xi)序列描述:SEQ ID No.10:
     CTAGTCTATA GTGTCACCTA AATCGTGGGT AC           32(2)SEQ ID No.11的资料:(i)序列特征:
(A)长度:23个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性(ii)分子类型:DNA(合成的)(xi)序列描述:SEQ ID No.11:
        CACGATTTAG GTGACACTAT AGA                  23(2)SEQ ID No.12的资料:(i)序列特征:
(A)长度:44个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性(ii)分子类型:DNA(合成的)(xi)序列描述:SEQ ID No.12:
    AATATAGTCG ACCACCATGG AGAACCCCTA CGTTGGGCGA GCGA     44(2)SEQ ID No.13的资料:(i)序列特征:
(A)长度:37个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性(ii)分子类型:DNA(合成的)(xi)序列描述:SEQ ID No.13:CGGCGGACTA GTTCAGACCT GCACGGGCAG TGTCTGG                 31(2)SEQ ID No.14的资料:(i)序列特征:
(A)长度:55个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性(ii)分子类型:DNA(合成的)(xi)序列描述:SEQ ID No.14:GCCGCCACTA GTTCAGTGGT GGTGGTGGTG GTGGACCTGC ACGGGCAGTG TCTGG
                                                     55(2)SEQ ID No.15的资料:(i)序列特征:
(A)长度:44个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性(ii)分子类型:DNA(合成的)(xi)序列描述:SEQ ID No.15:
  CGGCGGACTA GTTCATGAGC CTCTTTCACT CGTGGTCTCA AACT   44(2)SEQ ID No.16的资料:(i)序列特征:
(A)长度:62个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性(ii)分子类型:DNA(合成的)(xi)序列描述:SEQ ID No.16:GCCGCCACTA GTTCAGTGGT GGTGGTGGTG GTGTGAGCCT CTTTCACTCG TGGTCTCAAA  60CT                                                                 62

Claims (9)

1.一种具有SEQ ID No:1所示氨基酸序列的纯化的蛋白质p140多肽。
2.编码权利要求1的多肽的DNA。
3.根据权利要求2的DNA,其具有SEQ ID No:2所示的核苷酸序列。
4.根据权利要求2的DNA,其具有SEQ ID No:3所示的核苷酸序列。
5.一种复制和表达载体,其含有权利要求2至4任一的DNA。
6.由权利要求5的复制和表达载体转化或转染的宿主细胞。
7.一种生产多肽的方法,其包括将权利要求2,3或4的DNA插入到质粒pBluescript II,pUCSRαML2或λgt10中以生产复制和表达载体,用所述复制和表达载体转化大肠杆菌或导入到COS-7细胞中,然后在有效地表达多肽的条件下培养所得的转化或转染的细胞。
8.一种预防和/或治疗糖尿病的药剂,其含有权利要求1的蛋白质p140多肽作为活性成分。
9.权利要求8的预防和/或治疗糖尿病的药剂,其特征在于蛋白质p140多肽的酪氨酸磷酸化。
CN94119935A 1993-11-24 1994-11-24 蛋白质pl40多肽及编码该多肽的DNA Expired - Fee Related CN1057096C (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP315806/1993 1993-11-24
JP315806/93 1993-11-24
JP31580693 1993-11-24

Publications (2)

Publication Number Publication Date
CN1112127A CN1112127A (zh) 1995-11-22
CN1057096C true CN1057096C (zh) 2000-10-04

Family

ID=18069786

Family Applications (1)

Application Number Title Priority Date Filing Date
CN94119935A Expired - Fee Related CN1057096C (zh) 1993-11-24 1994-11-24 蛋白质pl40多肽及编码该多肽的DNA

Country Status (11)

Country Link
US (5) US5506205A (zh)
EP (1) EP0659883B1 (zh)
KR (1) KR100256664B1 (zh)
CN (1) CN1057096C (zh)
AT (1) ATE237683T1 (zh)
CA (1) CA2136565C (zh)
DE (1) DE69432511T2 (zh)
DK (1) DK0659883T3 (zh)
ES (1) ES2196016T3 (zh)
PT (1) PT659883E (zh)
TW (1) TW311913B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5506205A (en) * 1993-11-24 1996-04-09 Ono Pharmaceutical Co., Ltd. Polypeptide of protein p140 and DNAs encoding it
GB0208089D0 (en) 2002-04-09 2002-05-22 Oxford Glycosciences Uk Ltd Protein
WO2008008033A1 (en) * 2006-07-10 2008-01-17 Glucox Biotech Ab The use of naphtoquinones in the treatment and control of diabetes, insulin resistance and hyperglycemia
EP2517725A1 (en) * 2007-05-01 2012-10-31 Board Of Regents, The University Of Texas Chlamydial antigens as reagents for diagnosis and treatment of chlamydial infection and disease
US7892567B2 (en) * 2007-10-01 2011-02-22 Board Of Regents, The University Of Texas System Methods and compositions for immunization against chlamydial infection and disease
JP4798125B2 (ja) * 2007-12-13 2011-10-19 株式会社デンソー 照度センサ
CN105085630A (zh) * 2015-08-31 2015-11-25 苏州普罗达生物科技有限公司 mTOR抑制多肽及其应用

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5260200A (en) * 1991-01-18 1993-11-09 Joslin Diabetes Center, Inc. Isolated DNA encoding an insulin receptor substrate
US5811396A (en) * 1991-03-14 1998-09-22 The United States Of America As Represented By The Department Of Health And Human Services TRK tyrosine kinase receptor is the physiological receptor for nerve growth factor
US5506205A (en) * 1993-11-24 1996-04-09 Ono Pharmaceutical Co., Ltd. Polypeptide of protein p140 and DNAs encoding it

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
ONCOGENE,8(10) 1993.10.1 Bohme等"PCR mediated detection of a new human receptor-tyrosine-RINASE,hek 2.";ONCOGENE,8(7) 1993.7.1 Sajiadi FG等"Five novel avian Eph-relatedtyro-sine kinases are differentia lly rxpressed *
ONCOGENE,8(10) 1993.10.1 Bohme等"PCR mediated detection of a new human receptor-tyrosine-RINASE,hek 2." *
ONCOGENE,8(7) 1993.7.1 Sajiadi FG等"Five novel avian Eph-relatedtyro-sine kinases are differentia lly rxpressed *

Also Published As

Publication number Publication date
ES2196016T3 (es) 2003-12-16
CA2136565A1 (en) 1995-05-25
CN1112127A (zh) 1995-11-22
PT659883E (pt) 2003-07-31
EP0659883B1 (en) 2003-04-16
CA2136565C (en) 1999-11-09
DK0659883T3 (da) 2003-08-04
ATE237683T1 (de) 2003-05-15
US5506205A (en) 1996-04-09
KR100256664B1 (ko) 2000-05-15
DE69432511D1 (de) 2003-05-22
US6432913B1 (en) 2002-08-13
US5804411A (en) 1998-09-08
DE69432511T2 (de) 2004-04-29
EP0659883A3 (en) 1997-06-25
US6303320B1 (en) 2001-10-16
EP0659883A2 (en) 1995-06-28
KR950014135A (ko) 1995-06-15
US20030170865A1 (en) 2003-09-11
TW311913B (zh) 1997-08-01

Similar Documents

Publication Publication Date Title
CN1197966C (zh) 肿瘤坏死因子受体相关因子的调节剂、及其制备和用途
CN1133049A (zh) 黑素瘤抑制蛋白质
CN1057096C (zh) 蛋白质pl40多肽及编码该多肽的DNA
CN1283793C (zh) 具有骨骼肌刺激活性和免疫调节作用的趋化素样因子超家族
CN1173896A (zh) 新的dna、新的多肽和新的抗体
CN1234728C (zh) 新的人淋巴因子、其编码序列及用途
CN1277844C (zh) 新型人细胞周期蛋白,其编码序列及用途
CN1704426A (zh) 一种癌症基因及其医药用途
CN1290861C (zh) 新型人骨髓基质细胞来源的1型磷酸酶抑制因子,其编码序列及用途
CN1273485C (zh) 新型人树突状细胞来源的免疫球蛋白样受体,其编码序列及用途
CN1277995A (zh) 一种新的多肽——人细胞色素氧化酶相关蛋白37和编码这种多肽的多核苷酸
CN1304568C (zh) 新型人补体C1r样丝氨酸蛋白酶类似物,其编码序列及用途
CN1151251C (zh) 新的人一磷酸鸟苷还原酶、其编码序列及用途
CN1231497C (zh) 具有促进小鼠nih/3t3细胞转化功能的新的人蛋白及其编码序列
CN1296973A (zh) 一种新的多肽——人钙结合蛋白42号和编码这种多肽的多核苷酸
CN1298005A (zh) 一种新的多肽——人唾液酸转移酶27和编码这种多肽的多核苷酸
CN1493583A (zh) 一种新的多肽-人糖蛋白42和编码这种多肽的多核苷酸
CN1361822A (zh) Reg-结合蛋白
CN1464052A (zh) 一种新的多肽--人rna解螺旋酶95和编码这种多肽的多核苷酸
CN1517362A (zh) 一种新的多肽——人含atp/gtp结合结构域的核糖体蛋白s9和编码这种多肽的多核苷酸
CN1618805A (zh) 神经系统发育相关蛋白及其编码序列和用途
CN1570100A (zh) 一种类神经内分泌特异性蛋白,其编码序列,制法和应用
CN1328026A (zh) 一种新的多肽——人基因多效调节物1(plrg1)蛋白9.9和编码这种多肽的多核苷酸
CN1345741A (zh) 一种新的多肽——ef-手型钙结合蛋白9.24和编码这种多肽的多核苷酸
CN1534043A (zh) 人骨髓基质细胞来源的泛素样分子及其编码序列和用途

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee