CN1141061A - 血小板生成素 - Google Patents

血小板生成素 Download PDF

Info

Publication number
CN1141061A
CN1141061A CN94194751A CN94194751A CN1141061A CN 1141061 A CN1141061 A CN 1141061A CN 94194751 A CN94194751 A CN 94194751A CN 94194751 A CN94194751 A CN 94194751A CN 1141061 A CN1141061 A CN 1141061A
Authority
CN
China
Prior art keywords
polypeptide
mpl
seq
sequence
cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN94194751A
Other languages
English (en)
Other versions
CN1134539C (zh
Inventor
D·L·伊顿
F·J·德索瓦热
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Genentech Inc
Original Assignee
Genentech Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US08/196,689 external-priority patent/US8357513B1/en
Priority claimed from US08/249,376 external-priority patent/US8192955B1/en
Priority claimed from US08/348,657 external-priority patent/US6660256B1/en
Application filed by Genentech Inc filed Critical Genentech Inc
Publication of CN1141061A publication Critical patent/CN1141061A/zh
Application granted granted Critical
Publication of CN1134539C publication Critical patent/CN1134539C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/52Cytokines; Lymphokines; Interferons
    • C07K14/524Thrombopoietin, i.e. C-MPL ligand
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P7/00Drugs for disorders of the blood or the extracellular fluid
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P7/00Drugs for disorders of the blood or the extracellular fluid
    • A61P7/02Antithrombotic agents; Anticoagulants; Platelet aggregation inhibitors
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Veterinary Medicine (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Hematology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Diabetes (AREA)
  • Animal Behavior & Ethology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Public Health (AREA)
  • Engineering & Computer Science (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Toxicology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Zoology (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Peptides Or Proteins (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Saccharide Compounds (AREA)
  • Vehicle Body Suspensions (AREA)
  • Information Transfer Systems (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了分离的血小板生成素(TPO)、分离的编码TPO的DNA以及制备和纯化TPO的重组或合成方法。已表明,各种不同形式的TPO会影响血细胞尤其是巨核细胞和巨核细胞远祖细胞的复制、分化或成熟。因此,这些化合物可用于治疗血小板减少。

Description

血小板生成素
本发明领域
本发明涉及影响造血细胞、特别是血小板远祖细胞存活、增殖、分化或成熟的蛋白质的分离、提纯和重组体或化学合成。本发明具体涉及编码能结合并激活细胞因子受体超家族成员mpl的蛋白质配体的核酸的克隆和表达。本发明还涉及应用这些蛋白质单独或结合其他细胞因子以治疗包括血小板减少在内的免疫性或造血性疾病。本发明背景I.造血系统
造血系统产生所有哺乳动物生存必需的高度特化的成熟血细胞。这些成熟细胞包括:专门输送氧气和二氧化碳的红细胞;担负细胞介导和抗体介导的免疫反应的T和B淋巴细胞;专门生成血块的血小板;以及作为清除细胞或辅佐细胞以抵御感染的粒细胞和巨噬细胞。粒细胞进一步分为具有独立功能的特化细胞类型:中性细胞、嗜酸性细胞、嗜碱性细胞和肥大细胞。值得注意的是,所有这些特化的成熟血细胞来自一种最初见于骨髓中的、称作多能(或全能)干细胞的单一共同的原始细胞类型(Dexter等,Ann.Rve.Cell Biol.,3:423-441〔1987〕)。
在哺乳动物的生命全过程中,必须持续、大量地产生高度特化的成熟血细胞。绝大部分特化的血细胞只能维持几小时至几周的功能活性(Cronkite等,Blood,Cells,2:263-284〔1976〕)。因此,为了维持哺乳动物正常的稳态血细胞需求,需要不断更新成熟血细胞、原始干细胞本身,以及在原始细胞和成熟细胞之间的任何中间远祖细胞系或谱系定向的远祖细胞系。
造血系统的核心是多能干细胞。这些细胞相对量少,通过增殖进行自身更新产生子代干细胞,或经一系列分化步骤转化为增多且成熟的谱系限定的远祖细胞,最终形成高度特化的成熟血细胞。
例如,来自干细胞的称作CFC-Mix的某些多能远祖细胞经增殖(自身更新)和发育而产生包含全部不同骨髓细胞的集落:红细胞、中性细胞、巨核细胞(血小板的前身)、巨噬细胞、嗜碱性细胞、嗜酸性细胞和乳大细胞。其它淋巴谱系的远祖细胞增殖和发育成为T细胞和B细胞。
此外,在CFC-Mix远祖细胞和骨髓细胞之间,存在另一组定向于子代的中间远祖细胞。这些谱系限定的远祖细胞按其产生的子代表分类。因此,已知骨髓细胞最接近的前身为:产生红细胞的红细胞集落形成单位(CFU-E)、产生中性细胞和巨噬细胞的粒细胞/巨噬细胞集落形成细胞(GM-CFC)、产生巨核细胞的巨核细胞集落形成细胞(Meg-CFC)、产生嗜酸性细胞的嗜酸性细胞集落形成细胞(Eos-CFC)以及产生肥大细胞的嗜碱性细胞集落形成细胞(Bas-CFC)。其它介于多能干细胞和成熟血细胞之间的中间前身细胞也已知(见下述)或会被发现具有各种程度的谱系限定和自身更新能力。
因为丢失了多能性并且获得了谱系限定和成熟性,所以,正常造血细胞系统中的主细胞似乎降低自身更新的能力。因此,在造血细胞谱的一端,是具有自身更新和分化成所有各种谱系特化的定向远祖细胞能力的多能干细胞。这种能力是骨髓移植治疗的基础,在该治疗中原始干细胞重新注入整个造血细胞系统中。在造血细胞谱的另一端,是高度谱系限定的远祖细胞及其子代,它们失去了自身更新的能力,但获得了成熟的功能活性。
由各种造血生长因子或细胞因子精细地控制着干细胞和谱系限定远祖细胞的增殖和发育。这些生长因子在体内的作用是复杂的,尚未完全被了解。一些生长因子,例如白细胞介素-3(IL-3)能刺激多能干细胞和一些谱系定向的远祖细胞,包括如巨核细胞。其它因子,如粒细胞/巨噬细胞集落刺激因子(GM-CSF)起初被认为其作用限于GM-CFC′s,但后来发现,GM-CSF还影响特别是巨核细胞的增殖和发育。因此,发现IL-3和GM-CSF更有重叠的生物活性,尽管它们具有不同的潜能。最近,发现白细胞介素-6(IL-6)和白细胞介素11(IL-11)单独地对巨核细胞集落形成均无明显影响,而与IL-3协同作用时则刺激巨核细胞的成熟(Yonemura等,Exp.Hematol.,20:1011-1016〔1992〕)。
因此,造血生长因子可影响-个或多个谱系的生长和分化,在影响单个远祖细胞系方面可与其它生长因子重叠,或可与其它生长因子协同作用。
而且,在从全能干细胞通过各种定向的谱系限定远祖细胞到成熟血细胞的细胞发育不同阶段,造血生长因子能够显示出它们的效应。例如,红细胞生成素(epo)似乎仅仅促进成熟红细胞的远祖细胞的增殖。IL-3似乎较早地发挥影响原始于细胞和中间谱系限定远祖细胞的效应。其它生长因子如干细胞因子(SCF)可影响甚至更原始的细胞发育。
综上所述可理解,影响任何血细胞或其前身的存活、增殖、分化或成熟的新的造血生长因子将是有用的,特别有肋于由疾病或放疗或化疗引起的削弱的造血系统的重建。II.巨核细胞生成——血小板产生
巨核细胞生成和血小板产生的调节参见综述Mazur,Exp.Hematol.,15:248〔1987〕Hoffman,Blood,74:1196-1212〔1989〕。简而言之,骨髓多能干细胞分化成巨核细胞、红细胞和髓细胞系。据信,在干细胞和巨核细胞之间有定向巨核细胞远祖细胞这一级。至少鉴定出三类巨核细胞远祖细胞,即爆发集落形成单位巨核细胞(BFU-MK)、集落形成单位巨核细胞(CFU-MK)和低密度巨核细胞远祖细胞(LD-CFU-MK)。巨核细胞成熟本身是发育的延续,可根据标准的形态标准分成若干阶段。巨核细胞(MK或meg)家族最早的可识别成员为成巨核细胞。这些细胞开始时直径为20-30μm,有嗜碱性细胞质和一个略微不规则的核,该核具有疏松的、略呈网状的染色质和几个核仁。此后,成巨核细胞可含有多至32个核多倍体,但细胞质仍维持稀疏和不成熟。在成熟过程中,核变得更呈小叶状且固缩,细胞质的量增加,变得更嗜酸性且呈颗粒状。这一家族的大多数成熟细胞的边缘可有释放血小板的外观。通常,10%以下的巨核细胞处于胚胎细胞阶段,50%以上为成熟细胞。通常用于巨核细胞系列的权威形态学分类是最早期形态的成巨核细胞;中间形态的前巨核细胞或嗜碱性巨核细胞;后期形态的成熟(嗜酸性、颗粒状或产生血小板的)巨核细胞。成熟巨核细胞将细胞质纤丝延伸进血窦腔,在血窦腔中它们碎裂成单个血小板(Williams等,Hematlolgy,1972)。
据信巨核细胞生成涉及一些调节因子(Williams等,Br.J.Haematol.,52:173〔1982〕和Willams等,J.Cell Physiol.,110:101〔1982〕)。巨核细胞生成的早期阶段假定呈有丝分裂,涉及来自CFU-MK的细胞增殖和细胞集落的起始形成,但不受血小板数量的影响(Burstein等,J.Cell Physiol.,109:333〔1981〕和Kimura等,Exp.Hematol.,13:1048〔1985〕)。成熟的后期阶段呈非有丝分裂,涉及核的多倍体化和细胞质成熟,可能通过外周血小板数目以反馈机制进行调节(Odell等,Blood,48:765〔1976〕和Ebbe等,Blood,32:787〔1968〕)。
对独特的、特异性的巨核细胞集落刺激因子(MF-CSF)的存在颇有争议(Mazur,Exp.Hematol.,15:340&350〔1987〕)。但是,多数作者相信,作为血小板产生这一对生存极其重要的过程绝对地受细胞因子的调节。存在巨核细胞/血小板特异性细胞因子这一假说为30多年的研究提供了基础,但至今尚无象单一的MK-CSF(TPO)这样的细胞因子被提纯、测序和分析鉴定。
虽然据报道,MK-CSF′s被从实验性产生的血小板减少(Hill等,Exp.Hematol.,14:752〔1986〕)和人胚肾条件培养基〔CM〕(McDonald等,J.Lab.Clin.Med.,85:59〔1975)以及从可塑性贫血和特发性血小板减少性紫癜尿提取物(Kawakita等,Blood,6:556〔1983〕和血浆(Hoffman等,J.Clin.invest.,75:1174〔1985〕)中部分地提纯,但在大多数病例中,它们的生理功能尚未明了。
商陆促分裂原激活的脾细胞条件培养基(PWM-SpCM)和鼠骨髓单核细胞细胞系WEHI-3(WEHI-3CM)被用作巨核细胞促进剂。PWM-SpCM含有多种促进CFU-MK生长的因子(Met-calf等,Pro.Natl.Acad.Sci.,USA,72:1744&1748〔1975〕;Quesenberry等,Blood,65:2141985:;和lscove,N.N.,inHematopoietic Cell Differentiation,ICN-UCLA Symposia onMolecular and Cellular Biology,Vol.10,Golde等编辑〔NewYork,Academy Press〕pp 37-52〔1978〕),其中一个是白细胞介素-3(IL-3),这是一种多谱系细胞集落刺激因子(multi-CSF〔Burstein,Blood Cells,11:469〔1986〕〕)。这种培养基中的其它因子尚未被鉴定和分离出来。WEHI-3鼠骨髓单核细胞系分泌相对地大量的IL-3和较少量的GM-CSF。现已发现,IL-3促进大范围的造血细胞生长(lhle等,J.lmmunol.,13:282〔1983〕)。还发现,在非常早期的多能前体诱导中以及在非常大量的混合造血细胞集落的形成中,IL-3和很多已知的造血激素或生长因子协同作用,(Bartelmez等,J.Cell Physiol.,122:382&369〔1985〕和Warren等,Cell,46:667&674〔1988〕),包括红细胞生成素(EPO)和白细胞介素-1(IL-1)。
巨核细胞促进剂的其它来源还见于鼠肺、骨、巨噬细胞系、腹膜渗出物细胞和人胚肾细胞的条件培养基中。尽管有某些相抵触的数据(Mazur,Exp.Hematol.,15:340&350〔1987〕),但有一些证据(Geissler等,Br.J.Haematol.,60:233-238〔1985〕)表明,激活的T淋巴细胞而非单核细胞在巨核细胞生成中起促进作用。这些发现提示,激活的T淋巴细胞分泌物如白细胞介素可以是MK发育中的调节因子(Geissler等,Exp.Hematol.,15:845-853〔1987〕)。用纯化的红细胞生成素(EPO)对巨核细胞生成进行的一些研究(Vainchenker等,Blood,54:940〔1979〕;McLeod等,Nature,261:492-4〔1976〕和Williams等,Exp.Hematol.,12:734〔1984〕)表明,该激素对MK集落形成具有促进作用。这在不含血清培养物和含血清培养物中,以及缺乏辅佐细胞的情况下均得到了证明(Williams等,Exp.Hematol.,12:734〔1984〕。与PWM-SpCM的效应相反,EPO被假设为更多地涉及巨核细胞生成的单细胞和双细胞阶段,而PWM-SpCM涉及巨核细胞发育的四细胞阶段。所有这些因子对巨核细胞的早期和晚期的相互作用有待阐明。
从一些实验室得到的资料提示,仅各自具有MK-集落刺激活性的多谱系因子是GM-CSF和IL-3,而在较低程度上,是B细胞刺激因子IL-6(Ikebuchi等,Proc.Natl.Acad.Sci.USA,84:9035〔1987〕。最近,一些作者报道了IL-11和白血病抑制因子(LIF)与IL-3起协同作用,增加巨核细胞体积和倍性(Yonemura等,British Journal of Hematology,84:16-23〔1993〕;Burstein等,J.Cell.Physiol.,153:305-312〔1991〕;Bruno等,Blood,76:50-56〔1990〕;Metcalf等,Blood,77:2150-2153〔1991〕;Bruno等,Exp.Hematol.,19:378-381〔1991〕;和Yonemura等,Exp.Hematol.,20:1011-1016〔1992〕。
其它令人感兴趣的文献包括:Eppstein等,美国专利No.4,962,091;Chong,美国专利NNo.4,879,111;Fernandes等,美国专利No.4,604,377;Wissler等,美国专利No.4,512,971;Got-tlieb,美国专利No.4,468,379;Bennett等,美国专利No.5,215,895;Kogan等,美国专利No.5,250,732;Kimura等,Eur.J.lm-munol.,20(9):1927-1931〔1990〕;Secor等,J.of lmmunol.,144(4):1484-1489〔1990〕;Warren等,J.of lmmunol.,140(1):94-99〔1988〕;Warren等,Exp.Hematol.,17(11):1095-1099〔1989〕;Bruno等,Exp.Hematol.,17(10):1038-1043〔1989〕;Tamikawa等,Exp.Hematol.,17(8):883-888〔1989〕;Koike等,Blood,75(12):2286-2291〔1990〕;Lotem,Blood,75(5):1545-1551〔1989〕;Rennick等,Blood,73(7):1828-1835〔1989〕;和Clutterbuck等,Blood,73(6):1504-1512〔1989〕。III.血小板减少
血小板是血凝机制中的关键要素。称作小血板减少的血小板循环水平的耗竭存在于各种临床状况和疾病中。血小板减少通常定义为血小板计数低于150×109/升。根据血小板寿命,可将血小板减少的主要原因粗略地分为三类,即(1)骨髓引起的血小板产生受损,(2)脾血小板汇集(脾大)或(3)外周循环中血小板破坏增加(例如自身免疫性血小板减少或化疗和放疗)。此外,接受大剂量的快速施用破坏血小板的血制品的患者,可因稀释而发生血小板减少。
血小板减少的临床出血症状依赖于血小板减少的严重性、病因和可能伴有的凝血缺陷。通常,血小板计数在20-100×109/升的患者有外伤后过多出血的危险,而血小板计数低于20×109/升的患者可自发性出血。后一种患者是血小板输液的候选者,伴随有免疫性和病毒性危险。当病因是血小板产生减少而不是破坏增加时,任何一种程度的血小板减少其出血倾向更为严重。在后一种情况,加速的血小板转运导致更新、更多的止血更有效的血小板循环。血小板减少可来自各种疾病,简述如下。更详细的描述可参见Schafner,A.L.,″Thrombocytopenia and Disorders of Platelet Function,″InternalMedicine,第三版,John J.Hutton等,编辑,Litte Brown和Co.,Boston/Toronto/London〔1990〕。
(a)由血小板产生受损造成的血小板减少
先天性血小板减少的病因包括体质性再生障碍性贫血(Fanconi综合症)和先天性无巨核细胞性血小板缺乏,这些可能与骨骼畸形相关。获得性血小板产生疾病是由巨核细胞发育不全或低效血小板生成造成的。有多种情况会导致巨核细胞发育不全,其中包括骨髓发育不全(包括特发性形式或由化疗剂或放疗造成的骨髓抑制)、骨髓纤维变性、白血病和转移肿瘤或肉芽肿对骨髓的侵袭。在有些情况中,毒素、感染原或药物会相对选择性地干扰血小板生成;其实例包括由酒精或某些病毒感染造成的暂发性血小板减少和与服用噻嗪类利尿剂有关的轻度血小板减少。最后,巨成红细胞形成过程(叶酸或B12缺乏)中继发的低效血小板生成也会导致血小板减少,通常伴随以贫血和白细胞减少。
当前对由血小板产生减弱造成的血小板减少的治疗依赖于对存在的骨髓障碍病因的鉴定和逆转。通常只对有严重出血并发症的病人或为了手术过程中的保护而进行血小板输液,因为同种免疫可能导致对继续输入血小板产生不应性。由严重血小板减少导致的粘膜出血可通过口服或静脉注射以抗溶纤维蛋白剂来得到缓解。但是,如果对弥漫性血管内凝血(DIC)病人使用抗溶纤维蛋白剂可能使血栓形成并发症进一步发展。
(b)由脾(血小板)汇集造成的血小板减少
由任何原因造成的脾大都可能与轻度至中度的血小板减少相关。与下文将要论述的在免疫介导的血小板减少中脾对血小板的积极性破坏相比,这是一个很消极的脾血小板汇集过程(脾功能亢进)。虽然脾功能亢进的最常见病因是酒精性肝硬变造成的门静脉高血压引起的充血性脾大,但其它形式的充血性、浸润性或淋巴组织增生性脾大也与血小板减少相关。单由脾功能亢进引起的血小板减少通常计数不低于50×109/升。
(c)由非免疫介导的血小板破坏造成的血小板减少
各种非免疫过程对血小板的加速破坏会导致血小板减少。这种类型的疾病包括弥漫性血管内凝血,血管内假体装置、体外血循环和如血栓形成性血小板性紫癜等血栓形成性微血管病。在所有这些情况中,暴露于假体表面或异常血管内膜的循环中的血小板会在这些位置被消耗或被网状内皮系统破坏,然后在未成熟前将其清除。Braunwald等编辑的Harrison’s Principles of Internal Medicine第11版,P1478,McGraw Hill(1987)中较为详细地叙述了可能导致弥漫性血管内凝血(DIC)的疾病状况。血管内假体装置包括心瓣膜和主动脉内球囊能导致轻度至中度的破坏性血小板减少,而接受心肺分流术或血液透析的病人中的暂发性血小板减少可能是由体外回路中血小板的消耗或破坏造成的。
(d)药物诱导的免疫性血小板减少
有100多种药物与免疫介导的血小板减少有关。但是,只对奎尼丁、奎宁、金、磺胺类药、头孢噻吩和肝素进行了详细的定性。药物诱导的血小板减少通常十分严重而且一般在病人服用了致敏药物后的几天内立即发生。
(e)免疫性(自身免疫性)血小板减少性紫癜(ITP)
成人中的ITP是一种慢性病,其特征在于自身免疫性血小板破坏。这种自身抗体通常是IgG,但对其它免疫球蛋白也有报道。虽然ITP自身抗体已被发现与血小板膜GPIIbIIIa相关,但大多数病例中的血小板抗原特异性仍未鉴定出来。致敏血小板的血管外破坏发生在脾和肝的网状内皮系统中。虽然半数以上的ITP病例是特发性的,但大多数病人患有风湿性或自身免疫性疾病(如系统性红斑狼疮)或淋巴组织增生性疾病(如慢性淋巴细胞性白血病)。
(f)HIV诱导的ITP
ITP是越来越常见的一种HIV感染并发症(Morris等,Ann.Intern.Med.,96:714-717〔1982〕),而且能出现在疾病发展的任何阶段,在已被确诊的获得性免疫缺陷综合症(AIDS)病人、AIDS相关复合症的病人和被HIV感染但无AIDS症状的病人中都有发生。HIV感染是一种传染性疾病,最终表现为细胞免疫功能的深度缺陷和发生机会性感染及病情恶化。由HIV感染引起的最初免疫异常是表达CD4细胞表面糖蛋白的T淋巴细胞的发展性减少和功能性损坏(Lane等,Ann.Rev.Immunol.3:477〔1985〕)。可能是CD4辅助性/诱导性T细胞功能的丧失造成了导致机会性感染和AIDS病情恶化特征的细胞免疫和体液免疫的深度缺陷。(H.Lane同上)。
虽然还不知到HIV相关的ITP机制,但据信不同于与HIV感染不相关的ITP机制(walsh等,N.Eng.J.Med.311:635-639〔1984〕;和Ratner,Am.J.Med.,86:194-198〔1989〕)。IV.当前对血小板减少的治疗方法
对血小板减少病人的治疗方法取决于临床症状的严重性和紧迫性。对HIV相关性和HIV不相关性血小板减少的治疗方法相似,而且,虽然已经使用了多种不同的治疗方法,但这样的治疗仍有争议。
糖皮质素(如强的松龙)疗法成功地提高了确诊患血小板减少症病人的血小板数,但在大多数病人中,这种反应不完全,或者会在减少糖皮质素的剂量或中断服用时出现复发。基于以HIV相关的ITP患者进行的研究,有些研究者提出糖皮质素疗法可能导致易感染AIDS。通常在血小板低于20×109/升以下或在出现自发性出血时服用糖皮质素。
至于对糖皮质素不应的病人,化合物4-(2-氯苯基)-9-甲基-2-〔3-(4-吗啉基)-3-丙酮-1-基〕6H-噻吩并〔3,2,f〕〔1,2,4〕三唑〔4,3,a〕〔1,4〕二氮杂草(WEB2086)已被成功地用于治疗HIV不相关的ITP重病例。用WEB2086治疗一血小板数为37,000-58,000/微升的病人,1-2周的治疗后,血小板数升至140,000-190,000/微升。(EP361,077和Lohman等,Lancet,1147(1988))。
虽然获得性无巨核细胞性血小板减少性紫癜(AATP)的最佳治疗方法还不确定,但抗胸腺细胞球蛋白(ATG)(一种针对人胸腺组织的马抗血清)已被显示可产生长期的、完全的缓解。(Trimble等,Am.J.Hematol.,37:126-127〔1991〕)。但最近的一则报道指出,ATG的造血作用缘于硫柳汞,而蛋白质被假设起着汞载体的作用。(Panella等,Cancer Research,50:4429-4435〔1990〕)。
已有报道称脾摘除具有良好效果。脾摘除在许多病人中消除了大多数血小板破坏位置和大多数自身抗体产生源。该方法可在大量的病人中产生长期的、无需治疗的缓解。但是,缺乏免疫力的病人通常应避免外科手术,所以脾摘除只适用于重症血小板减少病例(如重症HIV相关性ITP)及对2至3周的糖皮质素治疗无反应或中断糖皮质素服用后无法获得持续性反应的病人。基于现有的科学知识,还不清除脾摘除是否会使病人倾向于患AIDS。
除了强的松龙疗法和脾摘除外,某些细胞毒剂,如长春新碱和叠氮胸苷(AZT,zidovudine)也显示出用于治疗HIV诱导的ITP的可能性,但结果都是初试性的。
由此可知,治疗血小板减少的一种方法应是获取一种能加速巨核细胞或其前体分化和成熟成为血小板产生形式的药剂。在鉴定这样一种通常称为“血小板生成素”(TPO)的药剂方面已经花费了大量努力。文献中常见的TPO的其它名称还有:血小板产生刺激因子(TSF)、巨核细胞集落刺激因子(MK-CSF),巨核细胞刺激因子和巨核细胞促进剂。早在1959年,就已经发现了TPO活性(Rak等,Med.Exp.,1:125),对它进行定性和纯化的努力一直持续至今。虽然有TPO-活性多肽的部分纯化的报道(例如参见Tayrien等,J.Biol.Chem.,262:3262〔1987〕和Hoffman等,J.Clin.Invest.75:1174〔1985〕),但其它报道则推测TPO本身并不是一种独立体,而只是某种已知激素的多功能表现形式(IL-3,Sparrow等,Prog.Clin.Biol.Res.,215:123〔1986〕)。不管何种形式和来源,具有血小板生成活性的分子都应具有重要的治疗价值。虽然尚无蛋白质被确切鉴定为TPO,但相当大的兴趣则围绕着最近的一项发现即mpl,一种假定的细胞因子受体,可能转导一个血小板生成信号。V.Mpl是一种巨核细胞生成性细胞因子受体
据信,造血细胞的增殖和成熟受某些因子紧密地调节,这些因子正向或负向调节多能干细胞的增殖和多谱系分化。这些作用是通过细胞外蛋白因子与特异性细胞表面受体的高亲合性结合介导的。这些细胞表面受体具有高度的同源性,而且通常被归类为细胞因子受体超家族的成员。该超家族的成员包括以下物质的受体:IL-2(β和γ链)(Hatakeyama等,Science,244:551-556〔1989);Takeshita等,Science,257:379-382〔1991〕)、IL-3(itoh等,Science,247:324-328〔1990);Gorman等,Proc.Natl.Acad.Sci.USA,87:5459-5463〔1990);Kitamura等,Cell,66:1165-1174〔1991a);Kitamura等,Proc.Natl.Acad.Sci.USA,88:5082-5086〔1991b〕)、IL-4(Mosley等,Cell,59:335-348〔1989〕)、IL-5(Takaki等,EMBO J.,9:4367-4374〔1990);Tavernier等,Cell,66:1175-1184〔1991〕)、IL-6(Yamasaki等,Science,241:825-828〔1988〕;Hibi等,Cell,63:149-1157〔1990I〕、IL-7(Goodwin等,Cell,60:941-951〔1990〕)、IL-9(Renault等,Proc.Natl.A-cad.Sci.USA,89:5690-5694〔1992〕)、粒细胞-巨噬细胞集落刺激因子(GM-CSF)(Gearing等,EMBO J.8:3667-3676〔1991〕);Hayashida等,Proc.Natl.Acad.Sci.USA,244:9655-9659〔1990〕)、粒细胞集落刺激因子(G-CSF)(Fukunaga等,Cell,61:341-350〔1990a〕;Fukunaga等,Proc.Natl.Acad.Sci.USA,87:8702-8706〔1990b〕;Larsen等,J.Exp.Med.,172:1559-1570〔1990〕),EPO(D’Andrea等,Cell,57:277-285〔1989〕;Jones等,Blood,76:31-35〔1990〕)、白血病抑制因子(LIF)(Gearing等,EMBO J.,10:2839-2848〔1991〕)、制癌蛋白M(OSM)(Rose等,Proc.Natl.Acad.Sci.USA,88:8641-8645〔1991〕)和促乳素(Boutin等,Proc.Natl.Acad.Sci.USA,88:7744-7748〔1988〕;Edery等,Proc.Natl.Acad.Sci.USA,86:211 2-2116〔1989〕),生长激素(Leung等,Nature,330:536-543〔1987〕和睫状神经营养因子(CNTF)(GH)(Davis等,Science,253:59-63〔1991〕)的受体。
细胞因子受体超家族中的成员可分为三种功能类别(有关综述可参见Nicola等,Cell,67:1-4〔1991〕)。第一类由单链受体组成,如红细胞生成素受体(EPO-R)或粒细胞集落刺激因子受体(G-CSF-R),它们通过细胞外结构域与配体高亲合性结合并产生一种细胞内信号。第二类受体又称α-亚基,包括白细胞介素-6受体(IL6-R)、粒细胞-巨噬细胞集落刺激因子受体(GM-CSF-R)、白细胞介素-3受体(IL3-Rα)和其它细胞因子受体超家族的成员。这些α-亚基与配体低亲合性结合但不能转导细胞内信号。一种能转导信号的高亲合性受体是由α-亚基和称为β-亚基的第三类细胞因子成员(如βc、IL3-Rα和GM-CSF-R等三种α-亚基的共同β-亚基)之间形成的一种异源二聚体而产生的。
mpl是细胞因子超家族中一员的证据来自于序列同源性(Gear-ing,EMBO J.8:3667-3676〔1988〕;Bazan,Proc.Natl.Sci.USA,87:6834-6938〔1990〕;Davis等,Science,253:59-63〔1991〕和Vigon等,Proc.Natl.Acad.Sci.USA,89:5640-5644〔1992〕)和其转导增殖信号的能力。
由鼠c-mpl的分子克隆推导的蛋白质序列揭示这种蛋白与其它细胞因子受体具有同源性。其胞外结构域含465个氨基酸残基,该结构域由两个亚结构域构成,每个亚结构域有4个高度保守的半胱氨酸和N端亚结构域和C端亚结构域的一段特殊基序。预计结合配体的胞外结构域具有相似的双重β-折叠桶几何结构。这种重复的胞外结构域与IL-3、IL-5和GM-CSF受体共同的信号转导链和LIF的低亲合性结合结构域(Vigon等,Oncogene,8:2607-2615〔1993〕)具有高度的同源性。所以mpl可能属于细胞因子受体超家族的低亲合性配体结合类。
鼠mpl与人成熟mplp比较显示,两种蛋白质表现出81%的序列一致性。尤其是,N端和C端胞外亚结构域分别具有75%和80%的序列一致性。最保守的mpl区是胞质结构域,显示出91%的氨基酸一致性,在跨膜结构域附近有一段在两物种中完全一致的37个残基序列。所以,mpl被报道为细胞因子受体超家族中最保守的成员之一(Vigon,同上)。
mpl是能够转导增殖信号的功能性受体的证据来源于嵌合受体的构建,嵌合受体含有与某已知细胞因子高亲合性的细胞因子受体的胞外结构域和mpl的胞质结构域。由于还没有报道过已知的mpl的配体,所以必须由第一类细胞因子受体如IL-4R或G-CSFR构建嵌合型高亲合性配体结合胞外结构域。Vigon等(同上)将G-CS-FR的胞外结构域与c-mpl的胞质结构域和跨膜结构域融合。用这种G-CSFR/c-mpl嵌合体和作为对照的全长G-CSFR转染IL-3依赖的细胞系BAF/B03(Ba/F3)。用嵌合体转染的细胞在细胞因子IL-3或G-CSF存在时生长良好。同样,用G-CSFR转染的细胞在IL-3或G-CSF中也生长良好。没有生长因子时,所有细胞均死亡。Skoda等(EMBO J.12(7):2645-2653〔1993〕)也进行了类似的实验,实验中将人IL-4受体(hIL-4-R)的胞外结构域和跨膜结构域与鼠mpl的胞质结构域融合,并以此转染鼠的IL-3依赖性Ba/F3细胞系。用野生型hIL-4-R转染的细胞在种特异性IL-4或IL-3存在时均能正常增殖。用hIL-4R/mpl转染的Ba/F3细胞在hIL-4存在时(有或无IL-3时)增殖正常,由此表明在Ba/F3细胞中,mpl的胞质结构域包含了转导增殖信号所必需的全部要素。
这些嵌合实验证明了mpl胞质结构域转导增殖信号的能力,但没有提及mpl的胞外结构域是否能结合配体。这些结果与至少两种可能性相一致,即mpl象EPO-R或G-CSFR一样,是一种单链受体(第一类)或着是需要一个IL-3样α-亚基的信号转导β-亚基(第三类)(Skoda等,同上)。VI.Mpl配体是一种血小板生成素(TPO)
如上所述,有人提出血清中含有一种有时被称为血小板生成素(TPO)的独特因子,它协助各种其它细胞因子促进巨核细胞的生长与成熟。还未曾从血清或其它来源中分离出这种天然因子,虽然许多研究组织为此进行了大量的努力。即使不知道mpl是否能直接结合某种巨核细胞刺激因子,最近的实验仍证明了mpl与来自再生障碍性骨髓患者血清中发现的一种或多种因子的增殖信号的转导有关(Methia等,Blood,82(5):1395-1401〔1993〕)。
有一种独特的不同于IL-1α、IL-3、IL-4、IL-6、IL-11、SCF、EPO、G-CSF和GM-CSF的血清集落形成因子通过mpl来转导增殖信号的证据来自于对原始和定向造血细胞系中c-mpl表达分布的检测和在一种这些细胞系中进行的mpl反义研究。
在免疫纯化的人造血细胞中使用逆转录酶(RT)-PCR(Methia等,同上)表明只在CD34+纯化的细胞、巨核细胞和血小板中发现了强mpl mRNA信息。由骨髓(BM)纯化而得的CD34+细胞约占全部BM细胞的1%,并且富集于所有谱系的原始和定向远祖细胞中(如红细胞、粒巨噬细胞和巨核细胞)。
有报道显示Mpl反义寡脱氧核苷酸抑制来自多能CD34+细胞的巨核细胞集落形成,这些多能CD34+细胞培养于取自再生障碍性骨髓(一种巨核细胞集落刺激活性〔MK-CSA〕的丰富来源)患者的血清中。这些相同的反义寡脱氧核苷酸对红细胞或粒巨噬细胞集落形成都没有作用。
mpl是否直接结合配体和是否血清因子显示能通过mpl作用导致巨核细胞生成仍不清楚。但是曾有人提出,如果mpl确实直接结合配体,其氨基酸序列可能是高度保守的,并由于人和鼠mpl胞外结构域之间的高度序列一致性而具有种间交叉反应性(Vigon等,同上〔1993〕)。VII.目的
综上所述,可以理解,在本领域中存在着一种现时且将持续的要求,即分离和鉴定能促进造血细胞、尤其是用于治疗血小板减少的巨核细胞或其前体增殖、分化和成熟的分子。据信,这类分子是一种mpl配体,所以还进一步需要分离出这种配体以评价它们在细胞生长和分化中的作用。
所以,本发明目的之一是获取一种药学纯的能刺激巨核细胞增殖、分化和/或成熟为成熟的血小板生成形式的分子。
本发明目的之二是提供用于治疗造血性疾病,尤其是血小板减少的治疗形式的分子。
本发明目的之三是分离,纯化,尤其是鉴定能在体内结合被称为mpl的某细胞因子超家族受体的蛋白质配体并转导增殖信号。
本发明目的之四是提供编码这类蛋白质配体的核酸分子和用这些核酸分子在重组细胞培养物中产生用于诊断和治疗的mpl结合配体。
本发明目的之五是提供蛋白质配体的衍生物和修饰形式,包括它们的氨基酸序列变异体、变异糖蛋白形式和它们的共价衍生物。
本发明目的之六是提供mpl配体与某异源蛋白组合而成的融合多肽和它们的共价衍生物。
本发明目的之七是提供mpl配体与氨基酸添加和取代后的EPO序列组合而成的变异多肽,从而生成一种能调节血小板和红细胞远祖细胞增殖和生长的蛋白质。
本发明另一目的是制备用于提高针对mpl配体或其融合形式的抗体的免疫原,以及获取能结合这类配体的抗体。
参照以下说明,本发明的这些及其它目的对本领域一般技术人员来说将是显而易见的。本发明概述
本发明目的是通过提供一种分离的哺乳动物巨核细胞生成性增殖和成熟促进蛋白而达到,该蛋白被命名为“mpl配体”(ML)或“血小板生成素”(TPO),它能刺激巨核细胞增殖、成熟和/或分化成成熟的血小板生成形式。
可以用以下方法从某天然来源纯化这种基本均一的蛋白质:(1)在可使待纯化mpl配体分子选择性吸附于固定化受体多肽上的条件下,将含有待纯化mpl配体分子的某源血浆与某固定化受体多肽,尤其是固定在某载体上的mpl或mpl融合多肽接触,(2)洗涤固定化受体多肽及其载体以去除未吸附物质,(3)用洗脱缓冲液从吸附有mpl配体分子的固定化受体多肽上洗脱mpl配体分子。天然来源最好是含有mpl配体的哺乳动物血浆或尿液。该哺乳动物可患有再生障碍性贫血,而固定化受体是mpl-lgG融合体。
可选的是,优选的巨核细胞生成性增殖和成熟促进蛋白是分离的和基本均一的利用合成或重组方法制得的mpl配体多肽。
本发明的“mpl配体”多肽或“TPO”最好与高度纯化的基本均一的猪mpl配体多肽氨基酸序列至少具有70%的全序列一致性,而与猪mpl体基多肽“EPO结构域”至少具有80%的序列一致性。可选的是,本发明的mpl配体是具有图1所示成熟氨基酸序列(SEQ IDNO:1)的成熟人mpl配体(hML),或其变异体或其转录后修饰形式或具有与成熟人mpl配体约80%序列一致性的蛋白质。mpl配体变异体可以是片段,尤其是成熟的人mpl配体(hML)的氨基端或“EPO结构域”片段。最好,氨基端片段保留有第一至第四半胱氨酸残基之间几乎全部人ML序列,但可以含有该区域外的一般性添加、缺失或取代。根据这种实施方式,片段多肽可由以下结构式表示:
                    X-hML(7-151)-Y
其中hML(7-151)表示Cys7至Cys151之间的人TPO(hML)氨基酸序列(包括Cys7和Cys151);X表示Cys7的氨基或一个或多个成熟hMl的氨基端氨基酸残基或其氨基酸残基延伸至如Met、Tyr或至含有如蛋白酶解位置的引导序列(如Xa因子或凝血酶);Y表示Cys151的羧基或一个或多个成熟hMl的羧基端氨基酸残基或其延伸氨基酸残基。
可选的是,mpl配体多肽或其片段可以与某异源多肽融合(嵌合体)。优选的异源多肽是某种细胞因子、集落刺激因子或白细胞介素或其片段,尤其是成套配体(kit-ligand,KL)、IL-1、IL-3、IL-6、IL-11、EPO、GM-CSF或LIF。一种优选的异源多肽是免疫球蛋白链,尤其是人IgG1、IgG2、IgG3、IgG4、IgA、IgE、IgD、IgM或其片段,尤其是含有IgG重链恒定区。
另一方面,本发明提供了一种含有分离的mpl激动剂的组合物,具有生物活性并最好能刺激标记的核苷酸(如3H-胸苷)掺入用人mpl转染的IL-3依赖的、Ba/F3细胞DNA中。可选的是,该mpl激动剂是有生物活性的mpl配体,并最好能在鼠血小板回跳测定中刺激35S掺入循环的血小板中。合适的mpl激动剂包括hML153、hML(R153A、R154A)、hML2、hML3、hML4、mML、mML2、mML3、pML和pML2或它们的片段。
在其它实施例中,本发明提供了一种分离的能结合mpl配体的抗体。这种分离的能结合mpl配体的抗体可选地与另一种多肽融合,而这种抗体或其融合体可用于从前述来源中分离和纯化用于固定mpl的mpl配体。在该实施例的另一方面内容中,本发明提供了一种用于体内或在体外检测mpl配体的方法,包括使抗体与被疑含有配体的某种样品(尤其是血清样品)接触以及检测是否发生结合。
在其它实施例中,本发明提供了一种分离的编码mpl配体或其片段的核酸分子,该核酸分子可选地用某种可检测成份进行标记;并且提供了一种具有与某mpl配体编码序列的核酸分子互补或在中度至高度严紧条件下能与之杂交的核酸分子。优选的核酸分子是那些人、猪和鼠mpl配体的编码核酸,包括RNA和DNA、为基因组和cDNA。在该实施例的另一方面中,核酸分子是编码mpl配体的DNA并且还含有一可复制载体,其中DNA与可被用该载体转化的宿主识别的调控序列可操作地连接。可选的是,DNA是具有图1中5′-3′(SEQ ID NO:2)或3′-5′序列的cDNA或其片段。这一方面内容还包括用该载体转化的宿主细胞(最好是CHO细胞)和一种使用DNA来产生mpl配体的方法,最好包括在转化后宿主细胞培养物中表达编码mpl配体的cDNA和从宿主细胞或宿主细胞培养物中回收mpl配体。以此方式制备的mpl配体最好是人mpl配体。
本发明还包括一种用于治疗患有某种造血性疾病,尤其是血小板减少的哺乳动物的方法,它包括给哺乳动物服用有效治疗量的某种mpl配体。可选的是,可将这种mpl配体与某种细胞因子,尤其是某种集落刺激因子或白细胞介素联合服用。优选的集落刺激因子或白细胞介素包括:成套配体(KL)、ILF、G-CSF、GM-CSF、M-CSF、EPO、IL-1、IL-3、IL-6和IL-11。
本发明还包括从产生TPO的微生物中分离和纯化TPO(ML)的方法:
(1)裂解或溶解含TPO的细胞,
(2)可选地将可溶性物质与含TPO的不溶性物质分离,
(3)用溶解缓冲液溶解不溶性物质中的TPO,
(4)将溶解的TPO与其它可溶性和不溶性物质分离,
(5)在氧还缓冲液中重折叠TPO,
(6)将正确折叠的TPO与错误折叠的TPO分离。
该方法用离液剂溶解含TPO的不溶性物质,该离液剂选自胍盐、硫氰酸钠或脲。该方法还提出,溶解的TPO是通过离心、凝胶过滤和反相色谱中的一步或多步与其它可溶性和不溶性物质分离。该方法的重折叠步骤提供了一种既含氧化剂又含还原剂的氧化还原缓冲液。通常,氧化剂是氧气或含有至少一个二硫键的化合物,而还原剂是含有至少一个游离巯基的化合物。最好,氧化剂选自已氧化的谷胱甘肽(GSSG)和半胱氨酸,而还原剂选自已还原的谷胱甘肽(GSH)和半胱氨酸。最优选的氧化剂是已氧化的谷胱甘肽(GSSG),而最优选的还原剂是已还原的谷胱甘肽(GSH)。而且,氧化剂的摩尔比最好等于或大于还原剂。另外氧化还原缓冲液还含有去垢剂,最好选自CHAPS和CHAPSO,含量至少为1%。氧化还原缓冲液还含有浓度以约0.1-0.5M为佳的NaCl和浓度以大于15%为佳的甘油。氧化还原缓冲液的pH以pH7.5-pH9.0为佳,重折叠步骤在4℃进行12-48小时。重折叠步骤产生具有生物活性的TPO,其中在最靠近EPO结构域氨基端的Cys和最靠近其羧基端的Cys之间形成一个二硫键。
本发明还包括一种从微生物中纯化具有生物活性TPO的方法,它包括:
(1)至少溶解微生物的胞外膜,
(2)用离液剂处理含TPO的裂解物,
(3)重折叠TPO,
(4)从正确折叠的TPO中分离去杂质和错误折叠的TPO。附图简述
图1显示推断的人mpl配体(hML)cDNA的氨基酸序列(SEQID NO:1)和编码的核苷酸序列(SEQ ID NO:2)。在每一行的开头对核苷酸进行编号。5’和3’非翻译区用小写字母表示。从成熟mpl配体(ML)蛋白序列的Ser1开始,在序列上方对氨基酸残基进行编号。假定的外显子3的边界用箭头标出,并加框标出潜在的N-糖基化位点。以序列上方的黑点标出半胱氨酸残基。划线序列对应于由纯化自猪血浆的mpl配体测得的N端序列。
图2显示用3H-胸苷掺入的实验过程。为了测定各种来源中mpl的存在,mpl P Ba/F3细胞在缺乏IL-3的条件下,在湿度培养箱中37℃、5%CO2和空气下培养24小时。在IL-3饥饿培养后,将细胞铺平在含有或不含有稀释样品的96孔培养板上,在细胞培养箱中培养24小时。将20μl含1μCi3H-胸苷的无血清RPMI培养基加入每一孔中进行最后6-8小时的培养。然后在96孔滤板上收获细胞并用水洗涤。然后对滤板进行计数。
图3显示了链霉蛋白酶、DTT和高温对APP刺激Ba/F3-mpl细胞增殖的效应作用。为了用链霉蛋白酶消化APP,将链霉蛋白酶(Boehringer Mannheim公司)或牛血清白蛋白与Affi-gel10(Bio-rad公司)偶联后,与APP分别在37℃孵育18小时。接着,离心去除树脂而对上清液进行分析。APP还被加热至80℃4分钟或制成100μM的DTT后透析PBS。
图4显示从Phenyl-Toyopearl,Blue-Sepharose和Ultra-lind-mpl柱上的mpl配体活性物洗脱。mpl亲和柱上的洗脱组分4-8是峰值活性部分。
图5显示Ultralink-mpl洗脱组分的SDS-PAGE。200μl每一洗脱组分2-8中分别加入1ml-20℃、含1mM HCl的丙酮。3小时后,样品在-20℃进行离心,然后对所得的沉淀在-20℃用丙酮洗涤两次。接着将丙酮洗涤后的沉淀溶于30μl SDS-溶解缓冲液中,制成100μM DTT并在90℃加热5分钟。然后将样品在4-20%SDS-聚丙烯酰胺凝胶上分离,通过银染色可目测到蛋白质。
图6显示SDS-PAGE上的mpl配体活性物。在非还原条件下,mpl-亲和柱的洗脱组分6在4-20%的SDS-聚丙烯酰胺凝胶上分离。电泳后将凝胶切割成12个等分区,然后如实施例所述进行电洗脱。将电洗脱后的样品透析入PBS,以1/20的稀释液进行分析。用于校准凝胶的分子量(Mr)标准是Novex Mark12标准物。
图7显示已耗尽APP的mpl配体对人巨核细胞生成的影响。将1ml通过1ml mpl-亲和柱(700μg mpl-IgG/ml NHS-superose,Pharmacia公司)来制备已耗尽APP的mpl配体。人外周干细胞被制成10%APP或10%已耗尽APP的mpl的配体并培养12天。如实施例所述定量分析巨核细胞生成。
图8显示通过APP mpl-IgG对人巨核细胞生成刺激作用的影响。人外周干细胞被制成10%APP并培养12天。在第0,2,4天加入mpl-IgG(0.5μg)或ANP-R-IgG(0.5μg)。12天后,如实施例所述定量分析巨核细胞生成。括号中给出实际重复数据表示重复样品的平均值。
图9显示了编码mpl配体的人基因组DNA的390bp片段双链。还显示了“外显子3”的推导氨基酸序列(SEQ ID NO:3),编码序列(SEQ IS NO:4)和它的互补序列(SEQ ID NO:5)。
图10显示了成熟的人mpl配体(hML)(SEQ ID NO:6)和成熟的人红细胞生成素(hEPO)(SEQ ID NO:7)的推导氨基酸序列。将人mpl配体的假定氨基酸序列与人红细胞生成素的序列排齐。加框标出相同的氨基酸,为对齐而引入的空档用虚线表示。用下划线标出潜在的N-糖基化位置,对hML用实线,对hEPO用虚线。对红细胞生成素活性来说是关键性的两个半胱氨酸用大黑点标出。
图11显示成熟的人mpl配体同种型的推导氨基酸序列hML(SEQ ID NO:6)、hML2(SEQ ID NO:8)、hML3(SEQ ID NO:9)和hML4(SEQ ID NO:10)。加框标出相同的氨基酸,为对齐而引入的空档用虚线表示。
图12A,12B和12C显示了人mpl配体对Ba/F3-mpl细胞增殖作用的影响(A),用放射性标记的特异性针对巨核细胞糖蛋白GPIIbIIIa的鼠IgG单克隆抗体定量分析体外人巨核细胞生成(B)和在血小板回跳测定中检测鼠血小板生成(C)。
293细胞利用CaPO4法(Gorman,Cin DNA Cloning:A NewApproach 2:143-190〔1985〕)单独以pRK5载体、以pRK5-hML或以pRK5-ML153(pRK5-ML153是利用PCR在hML的残基153后引入一个终止密码子而产生)转染过夜。然后如实施例1中所述在条件培养基中培养36小时,分析Ba/F3-mpl细胞增殖(A)或体外人巨核细胞生成(B)的刺激作用。利用125I放射性标记的针对巨核细胞特异糖蛋白GPIIbIIIa的鼠IgG单克隆抗体定量分析巨核细胞生成(如Grant等,Blood 69:1334-1339〔1987〕所述)。利用McDon-ald,T.P.在Proc.Soc.Exp.Biol.Med.144:1006-10012(1973)中所述的回跳血小板生成测定分析部分纯化的重组ML(rML)对体内血小板生成的作用(C)。部分纯化的rML是从200ml含重组ML的条件培养基制得。将培养基通过在PBS中平衡的2mlBlue-Separose柱,用PBS洗柱,用含2M脲和2M NaCl的PBS洗脱。将活性洗脱组分透析入PBS,用无内毒素的BSA制成1mg/ml浓度。每ml样品含少于1单位的内毒素。给小鼠注射64,000、32,000或16,000单位的rML或单独的赋形剂。每组6个小鼠。给出每一组的平均值和标准差。利用比较中值的2具尾T-测验测定p值。
图13比较了人mpl配体同种型和变异体在Ba/F3-mpl细胞增殖测定中的作用。如实施例1所述在各种稀释比时对hML,模拟试验、hML2、hML3、hML(R153A、R154A)、和hML153进行了测定。
图14A,14B和14C显示了人mpl配体(hML)或人TPO(hT-PO)的推导氨基酸序列(SEQ ID NO:1)和人基因组DNA编码序列(SEQ ID NO:11)。在每行的开头为核苷酸和氨基酸编号。
图15显示了纯化的293-rhML332和纯化的293-rhML153的SDS-PAGE。
图16显示了核苷酸序列:cDNA编码(SEQ ID NO:12)和某种鼠ML同种型的开放读框的推导氨基酸序列(SEQ ID NO:13)。该成熟鼠mpl配体同种型含331个氨基酸残基,比假定的全长mML少4个,因此表示为mML2。核苷酸编号在每行的开头。从Ser1开始在序列上方为氨基酸残基编号。下划线标出潜在的N-糖基化位点。用序列上方的黑点标出半胱氨酸残基。
图17显示该鼠ML同种型(mML)的cDNA序列(SEQ IDNO:14)和假定的蛋白质序列(SEQ ID NO:15)。核苷酸编号在每行开头。氨基酸编号在序列上方,从Ser1开始。该成熟鼠mpl配体同种型含335个氨基酸残基,并据信是全长mpl配体,标为mML。用虚线标出信号肽序列,用箭头标出可能的切割位点。5′和3′的非翻译区用小写字母表示。可变拼接产生的两处缺失(mML2和mML3)用下划线标出。用一黑点标出4个半胱氨酸残基。7个潜在的N-糖基化位点加框标出。
图18比较了人ML同种型hML3(SEQ ID NO:9)和鼠ML同种型mML3(SEQ ID NO:16)推导的氨基酸序列。将人mpl配体的假定氨基酸序列与鼠mpl配体序列排齐。相同的氨基酸被加框,为对齐引入的空档用虚线标出。在每行开头对氨基酸编号。
图19比较了鼠ML(SEQ ID NO:17),猪ML(SEQ ID NO:18)和人ML(SEQ ID NO:6)的成熟ML同种型的假定氨基酸序列。将氨基酸序列排齐,其中有用虚线标出为对齐而引入的空档。在每行开头给氨基酸编号,加框标出相同的残基。用加阴影的方框标出潜在的N-糖基化位置,用点标出半光氨酸残基。表示潜在的蛋白酶切割位点的保守性双碱性氨基酸基序被加以下划线。在三种类中都出现的4个氨基酸缺失(ML2)用粗体方框标出。
图20显示了某种猪ML同种型(pML)的cDNA序列(SEQ IDNO:19)和假定成熟蛋白序列(SEQ ID NO:18)。该猪mpl配体同种型含332个氨基酸残基,并据信是全长的猪mpl配体,命名为pML。在每行开头为核苷酸编号。在序列上方给氨基酸残基编号,从Ser1开始。
图21显示了某种猪ML同种型(pML2)的cDNA序列(SEQID NO:20)和假定的成熟蛋白序列(SEQ ID NO:21)。该猪mpl配体同种型含328个氨基酸残基,比全长猪mpl配体少4个,命名为pML2。在每行开头给核苷酸编号。在序列上方给氨基酸残基编号,从Ser1开始。
图22比较了全长猪ML同种型pML的推导氨基酸序列(SEQID NO:18)和命名为pML2的猪ML同种型的推导氨基酸序列(SEQ ID NO:21)。将pML的假定氨基酸序列与pML2的序列排齐。给相同的氨基酸残基加框,虚线表示为对齐而引入的空档。在每行开头给氨基酸编号。
图23显示了用于转染宿主CHO-DP12细胞来产生CHO-rhTPO332的质粒pSV15.ID.LL.MLORF(“全长”或TPO332)的有关特性。
图24显示了用于转染宿主CHO-DP12细胞来产生CHO-rhTPO153的质粒pSV15.ID.LL.MLEPO-D(“截短的”或TPO153)的有关特性。
图25A、25B和25C显示了E.coli-rhTPO(Met-1,153)在正常小鼠体内对血小板(A)、红细胞(B)和白细胞(C)的作用。给两组6个一组的雌性C57 B6小鼠每天注射PBS缓冲液或0.3μg E.coli-rhTPO(Met-1,153)(100μl sc.)。在第0天和第3-7天,由眶窦抽取40μl血。该血样被立即稀释在10ml商购稀释剂中并在SerronoBaker Hematology Analyzer 9018上获取全血计数。数据表示为平均值的均值±标准差。
图26A,26B和26C显示了E.coli-rhTPO(Met-1,153)在亚致死照射过的小鼠体内对血小板(A)、红细胞(B)和白细胞(C)的作用。用来自137Cs的750cGyγ射线亚致死照射两组10个雌性C57 B6小鼠,并每天注射PBS缓冲液或0.3μg E.coli-rhTPO(Met-1,153)(100μl sc.)。在第0天和以后的间隔时间点,由眶窦抽取40μl血。该血样被立即稀释在10ml商购稀释剂中并在Serrono BakerHematology Analyzer 9018上获取全血计数。数据表示为平均值的均值±标准差。
图27A、27B和27C显示了CHO-rhTPO332在正常小鼠体内对(A)血小板、(B)红细胞和(C)白细胞的作用。给两组6个一组的雌性C57 B6小鼠每天注射PBS缓冲液或0.3μg CHO-rhTPO332(100μl sc.)。在第0天和第3-7天,由眶窦抽取40μl血。该血样被立即稀释在10ml商购稀释剂中并在Serrono Baker HematologyAnalyzer 9018上获取全血计数。数据表示为平均值的均值±标准差。
图28显示了从各种细胞系获得的各种形式的rhTPO剂量反应曲线。对取自以下细胞系的rhTPO绘制剂量反应曲线:来自CHO(来自中国仓鼠卵巢细胞的全长形式)的hTPO332;hTPOMet -1 153(E-coli衍生的截短形式,有一个N-端甲硫氨酸);hTPO332(来自人293细胞的全长TPO);Met-less 155 E.coli(来自E.coli的截短形式〔rhTPO155〕,无末端甲硫氨酸)。用各种rhTPO分别给各组6个一组的C57B6小鼠注射7天。每天从眶窦抽取40μl血进行全血计数。图上表示的数据是所见出现在第7天的最强作用,只有一个例外(Met153 E-coli)。而在前述的“Met 153 E-coli”组中,最强作用出现在第5天。数据表示为平均值的均值±标准差。
图29显示了比较在CHO细胞中产生的全长和“截短”形式的rhTPO与来自E.coli截短形式的活性的剂量反应曲线。给6个一组的C57B6雌性小鼠每天注射0.3μg的各种类型rhTPO。在第2-7天,由眶窦抽取40μl血进行全血计数。处理组是来自E.coli的截短形式TPO rhTPO153;全长TPO rhTPO332(混合组份)含约80-90%全长和10-20%截短形式;TPO332(30K组份)=从原混合制剂纯化的截短组份;TPO332(70K组份)=从原混合制剂纯化的全长TPO组份。数据表示为平均值的均值±标准差。
图30是表示测定TPO的KIRA ELISA实验的示意图。该图显示了MPL/Rse.gD嵌合体和亲代受体的相关部分以及最终结构(图的右侧)和表示测定的有关步骤流程图(图的左侧)。
图31是表示程序中每一步的KIRA ELISA测定流程图。
图32A-32L提供了在实施例17中用于表达Res.gD的pSVI17.ID.LL表达载体的核苷酸序列(SEQ ID NO:22)。
图33是制备质粒pMP1的图示。
图34是制备质粒pMP21的图示。
图35是制备质粒pMP151的图示。
图36是制备质粒pMP202的图示。
图37是制备质粒pMP172的图示。
图38是制备质粒pMP21O的图示。
图39是来自pMP21O质粒文库中5个最佳TPO表达克隆(SEQ ID NO:23、24、25、26、27和28)的列表。
图40是制备质粒pMP41的图示。
图41是制备质粒pMP57的图示。
图42是制备质粒pMP251的图示。
              本发明的详细描述1.定义
一般情况下,下列词语用于说明书、实施例和权利要求书时,具有以下所述定义。
“离液剂”指一种处于水溶液中并达到适合浓度时,能引起蛋白质空间构型和构象变化的化合物,这种变化是通过至少部分地破坏维系蛋白质正常二级和三级结构的力来实现。这些化合物包括:尿素,盐酸胍和硫氰酸钠等。通常要求这些化合物达到4-9M的高浓度时才能对蛋白质的构象发生作用。
“细胞因子”表示由一个细胞群分泌的蛋白质的一般性术语,该类蛋白质作为胞间介体作用于其他细胞。例如淋巴因子、单核因子和传统的多肽激素等。其中包括:生长激素、胰岛素样生长因子、人生长激素、N-甲硫氨酰人生长激素、牛生长激素、甲状旁腺素、甲状腺素、胰岛素、胰岛素原、松驰素、松弛素原、糖蛋白激素(如促卵泡素[FSH]、促甲状腺素[TSH]、促黄体素[LH])、造血生长因子、肝生长因子、成纤维细胞生长因子、促乳素、胎盘促乳素、α肿瘤坏死因子(TNF-α和TNF-β)、穆勒氏抑制物、鼠促性腺素关联肽、抑制素、活化素、血管内皮生长因子、整联蛋白、神经生长因子(如NGF-β)、血小板生长因子、转化生长因子TGFs(如TGF-α和TGF-β)、胰岛素样生长因子-I和-II、促红细胞生成素(EPO)、骨诱导因子、干扰素(如α、β、γ干扰素)、集落刺激因子(CSFs)(如巨噬细胞集落刺激因子[M-CSF]、粒细胞-巨噬细胞集落刺激因子[GM-CSF]、粒细胞集落刺激因子[G-CSF])、白细胞介素(IL′s)(如IL-1、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IL-10、IL-11、IL-12)和其他多肽因子(如白细胞抑制因子[LIF]、干细胞生长因子[SCF]和成套配体)。本文中的“细胞因子”术语表示各种从自然来源或重组细胞培养物中得到的蛋白质。类似地,这一术语也包括具有生物活性的等价物,例如其氨基酸序列中一个或多个氨基酸不同或糖基化类型及程度不同。
“mpl配体”、“mpl配体多肽”、“ML”、“血小板生成素”或“TPO”在本文中互换使用,并包括任何具有可与mpl结合的特性的多肽。mpl是细胞因子受体超家族中的一员,并具备如下所述的ML的生物学特性。其中一种典型的生物学特性是能促进标记的核苷酸(如3H-胸苷)掺入用人mpl P转染的、依赖IL-3的Ba/F3细胞DNA中。另一种典型的生物学特性是在鼠血小板回跳分析实验中,能促进35S掺入循环的血小板。这个定义主要指某种多肽,这种多肽从mpl配体来源(如发育不全的猪血浆)或其他来源(如包括人在内的其他动物种类)中分离到,或者通过重组或合成方法制备,同时该定义也包含了包括功能性衍生物、片段、等位基因、同种型及其类似物在内的多种形式。
“mpl配体片段”或“TPO片段”指除去了一个或多个氨基酸残基或糖单元的、自然产生成熟全长mpl配体或TPO序列中的一段。其中,氨基酸残基的去除可以发生在肽链上的任何位置,包括N末端、C末端或肽内部。该片段至少具备一种与mpl配体相同的生物学特性。这种mpl配体片段一般有一个至少10、15、20、25、30或40个氨基酸残基的连续序列,与从哺乳动物中分离的mpl配体,包括从发育不全的猪血浆中分离的配体或者人或鼠的mpl配体,尤其是其促红细胞生成素(EPO)结构域,序列完全相同。N末端片段的代表性例子有hML153或TPO(Met-11-153)。
“mpl配体变异体”或“mpl配体序列变异体”在本文中表示下述具有生物活性的mpl配体,它与具有如图1(SEQ ID NO:1)所示推断序列的、从重组细胞培养物或发育不全的猪血浆中分离到的mpl配体或人配体并不100%地有相同的序列。通常,一个具有生物活性的mpl配体变异体应至少有70%的氨基酸序列与从发育不全的猪血浆中分离到的mpl配体或成熟的鼠或人配体及其片段相同(见图1[SEQ ID NO:1]),达到至少约75%则较好,至少约80%则更好,至少约85%还要好,至少约90%甚至还要好,最好至少约95%相同。
“嵌合mpl配体”表示由全长mpl配体或其一个或多个片段融合或结合于一条次要的异源多肽或其一个或多个片段中而组成的一种多肽。这种嵌合体至少有一种生物学特性与mpl配体相同。那条次要的多肽一般为细胞因子、免疫球蛋白或其片段。
“分离的mpl配体”、“高纯度mpl配体”和“基本均一的mpl配体”可互换使用,表示从某个mpl配体源纯化或由重组或合成方法得到的mpl配体,其中基本上不含其他肽或蛋白质。(1)用转杯式测序仪或非常商业化的市售氨基酸测序仪或根据本申请归档后公布的改进方法从N末端或某段内部氨基酸序列中获取至少为15、较好为20个的氨基酸残基,或者(2)用考马斯亮蓝或较佳地用银染法,在非还原或还原条件下,以SDS聚丙烯酰胺凝胶电泳来达到均一性。在这里,均一性表示杂蛋白的污染低于5%。
“生物学特性”一词在与“mpl配体”或“分离的mpl配体”连同使用时,表示具有由mpl配体(无论是自然的还是变性后的构象)或其片段直接或间接地引起或行使的血小板生成素活性或体内效应子功能或抗原性功能或活性。效应子功能包括mpl结合活性和任何载体结合活性、mpl的兴奋作用和拮抗作用尤其是增殖信号的转导,包括复制、DNA调节功能、其他细胞因子生物学活性的调节,受体(尤其是细胞因子)激活、正向或负向调节、细胞生长或分化等。抗原性功能表示拥有一个能与由天然mpl配体得到的抗体起交叉反应的表位或抗原位点。mpl配体多肽的主要抗原性功能是它与由分离自发育不全的猪血浆mpl配体得到的抗体结合,其亲和性至少有106l/mole。通常,该亲和性至少为107l/mole。最佳情况下,具有抗原活性的mpl配体多肽是一种与由具备上述某个效应子功能的mpl配体得到的抗体相结合的多肽。用于确定“生物活性”的抗体是通过以下方法得到的兔多克隆抗体:首先在Freund′s完全佐剂中,制备从重组细胞培养物或发育不全的猪血浆中分离的mpl配体,然后皮下注射制备物,再向腹膜内注射制备物以增强免疫应答,直至mpl配体抗体的效价达到平台区。
“生物活性”一词在与“mpl配体”或“分离的mpl配体”连同使用时,表示本文中所描述的一种mpl配体或多肽,其显示血小板生成素活性或者具备从发育不完全的猪血浆分离的或由重组细胞培养物表达的mpl配体的某个效应子功能。本文中所知的mpl配体或多肽的一个基本功能是与mpl结合并能促进标记的核苷酸(3H-胸苷)掺入用人mpl P转染的、依赖IL-3的Ba/F3细胞DNA中。本文中所知的mpl配体或多肽的另一个效应子功能是在鼠血小板回跳测定中能促进35S掺入循环的血小板。还有一个已知的mpl配体的效应子功能是能促进体外人巨核细胞生成,可用放射性标记的针对巨核细胞糖蛋白GPIIbIIIa的单克隆抗体进行定量。
关于mpl配体序列的“氨基酸序列同一性百分率”,在本文中表示候选序列中的氨基酸残基与具备如图1(SEQ ID NO:1)所示氨基酸推断序列的、从发育不全的猪血浆中分离的或者鼠或人配体的mpl配体序列中的残基完全相同的百分比。为了达到序列同一性的最大百分比,必要时,可在比较前使序列线性化并引入裂口。比较时,任何保守性置换都不作为序列同一性的一部分来分析。mpl配体序列的N末端、C末端或内部的延伸、缺失或插入被认为不影响序列同一性或同源性。因此,一些典型的具有生物活性的mpl配体多肽被认为具有完全相同的序列,包括前mpl配体原、mpl配体原和成熟的mpl配体。
“mpl配体的微量测序”可由任一足够灵敏的合适的标准程序来完成。在一个这样的方法中,由SDS凝胶或者最后的高效液相色谱(HPLC)步骤获得的高纯度多肽用配备了一台120A乙内酰苯硫脲(PTH)氨基酸分析仪的470A型号Applied Biosystems气相测序仪通过自动Edman(异硫氰酸苯酯)降解直接测序。另外,由化学制剂(如溴化氰、羟胺、2-硝基-5-硫氰酸苯酯)或酶(如胰蛋白酶、胶原蛋白酶、葡萄球菌蛋白酶)消化及纯化(如HPLC)后所得到的mpl配体片段也可进行类似的测序。PTH氨基酸的分析使用ChromPerfect数据系统(Justice Innovations,Palo Alto,CA)。序列解译由Henzel等人在J.Chromatography,404:41-52[1987]中提及的VAX 11/785 Digital Equipment Co.的计算机来完成。或者,可将一份HPLC组分在5-20%SDS聚丙烯酰胺凝胶上电泳后,电转移至PVDF膜上(ProBlott,AIB,Foster City,CA),再用考马斯亮蓝染色(Mat-surdiara,J.Biol.Chem.,262:10035-10038[1987])。通过染色鉴别的特异性蛋白从染色斑中切出,并用如上所述的气相测序仪进行N末端测序。对于内部的蛋白质序列,先将HPLC组分在真空(SpeedVac)中干燥,然后在合适的缓冲液中重悬,再用溴化氰、赖氨酸特异的酶Lys-C(Wako Chemicals,Richmond,VA)或天冬氨酸特异的酶Asp-N(Boehringer Mannheim,Indianapolis,IN)进行消化。消化后,对得到的肽链以混合物形式测序或在气相测序以前,在一个0.1%TFA(三氟醋酸)丙醇梯度的C4柱中进行HPLC分离。
“血小板减少”指血液中的血小板数少于150×109/每升。
“血小板生成活性”是指一种能加速巨核细胞或巨核细胞前体增殖、分化和/或成熟成为血小板生成形式的生物活性。这种生物活性可用多种方法测定,如体内鼠血小板回跳合成测定,用针对人白血病成巨核细胞系[CMK]的抗血小板免疫测定[抗GPIIbIIIa]来进行血小板细胞表面抗原诱导分析,以及一个成巨核细胞系(DAMI)的多倍性化诱导。
“血小板生成素”(TPO)是一种具有血小板生成活性或能够增加哺乳动物血清中血小板数的化合物。TPO在较佳情况下能够增加至少10%的内源血小板数,50%则更佳,而在最佳情况下,可使人血液中的血小板数提高到150×109/每升以上。
“分离的mpl配体核酸”是一段RNA或DNA,其中含有不少于16个、较佳地20个或更多序贯的核苷酸碱基,该序列具备如下特点:能编码具有生物活性的mpl配体及其片断,与RNA或DNA互补,或与RNA或DNA杂交并且在温和和严紧条件下都能保持稳定结合。这种RNA或DNA应该至少不被一个在自然源中通常与其结合的污染源核酸所污染,并且较佳地基本上不含其他哺乳动物RNA或DNA。在这里,“至少不被一个通常与其结合的污染源核酸所污染”包含如下情况:核酸存在于源中或自然细胞中但所处染色体位置不同,或者是位于侧翼的、一般地在源细胞中找不到的核酸序列。分离的mpl配体核酸的一个例子是一段RNA或DNA,编码具有生物活性的mpl配体,与人、鼠或猪的mpl配体至少有75%的序列相同,较佳地至少80%,更佳地至少85%,还要佳地为90%,最佳地为95%。
“控制序列”用于涉及表达时,表示在一个特定的宿主有机体中,是一段可操作地连于编码序列且对该编码序列表达所必需的DNA序列。适合于原核细胞的控制序列包括启动子、任选的某个操纵子序列、核糖体结合位点、可能还有一些至今未知的序列。真核细胞已知的控制序列有启动子、聚腺苷酸信号和增强子。
“可操作地连接”涉及核酸时,意味着该核酸与另一个核酸序列处于功能上相关的位置。例如,如果某种DNA表达的前体蛋白参与了多肽的分泌,那么这个表达前序列或分泌前导区的DNA就与表达该多肽的DNA可操作地连接;如果一个启动子或增强子对编码序列的转录有影响,那它与该编码序列是可操作地连接;或者如果一个核糖体结合位点被置于一个编码序列上以促进翻译,那么它们之间也是可操作地连接。通常,“可操作地连接”要求被连接的DNA序列之间相邻近。对于分泌前导区,要求相邻近并处于可读状态。但是,增强子并不一定要求邻近。连接是通过合适的限制性位点相联而完成。如果这样的位点并不存在,则根据常规技术使用合成的寡核苷酸衔接子或接头来完成。
“外源的”指某个元件时,表示来自于细胞外的核苷酸序列,或者与细胞同源,但是在宿主细胞核苷酸的某一位置中,通常不能发现该元件。
“细胞”、“细胞系”和“细胞培养物”在本文中可互换使用,该定义包含了一个细胞或细胞系的所有子代。因此,类似于“转化体”和“转化细胞”的术语包括了原代母细胞及其衍生培养物,而不考虑传代的次数。应该理解,由于诱导或自发突变,并非所有的子代都有完全相同的DNA序列。那些具有与筛选出的原始转化细胞相同功能和生物活性的突变后代同样也包括在内。当试图指某种特殊表示时,该词可根据上下文内容来理解。
“质粒”是一种能自我复制的环状DNA分子,它具有独立的复制起始点。本文中,用“p”后跟大写字母和/或数字来表示。本文中的最初质粒来源是商购获得、在没有限制的情况下从公共途径获得或根据已公开的程序以上述二种质粒为基础进行构建。另外,其他相当的质粒是本领域中已知的,并且对一般的技术人员而言是显而易见的。
“限制酶消化”对DNA而言,表示在一种酶的催化作用下,DNA内部的磷酸二酯键断裂,而酶的作用只限于DNA序列上的特定位点。这种酶称为“限制性内切核酸酶”。每个限制性内切核酸酶识别一段特异的DNA序列,即双重对称的“限制酶切位点”。本文中使用的各种限制酶都可以商购,而且可根据供应商提供的反应条件、辅助因子和其他条件来使用。通常,限制酶用下述的缩写形式来表示:第一个大写字母后跟其他字母表示微生物,从中获得限制酶,然后是一个数字表示特定的酶。限制酶消化的条件通常为,在约20微升缓冲溶液中,1微克质粒或DNA片段加入约1-2单位酶。特定的限制酶作用的合适缓冲液和底物的量由制造商指定。常规的步骤是37℃温育约1小时,但应根据供应商的建议加以改动。温育后,蛋白质和多肽用酚和氯仿抽提来除去,被消化的核酸则用乙醇沉淀的方法从缓冲液中回收。限制酶消化后,可以用细菌碱性磷酸酶对5′末端磷酸进行水解作用,以防止一个DNA片段的两个限制酶切末端“环化”或形成一个闭合环而阻止其他DNA片段在限制酶切位点的插入。除非有另外的要求,否则质粒消化后不需要进行5′末端的去磷酸化。去磷酸化的常规步骤和试剂可参见Sambrook等人所著《分子克隆:实验室手册》中1.56-1.61部分[New York:Cold Spring Har-bor Laboratory Press,1989]。
限制酶消化后,DNA片段的“回收”或“分离”是指通过聚丙烯酰胺或琼脂糖电泳使消化产物分离,根据与已知分子量的标记DNA片段比较电泳迁移率来鉴别目的片段,切出含有目的片段的凝胶块,并将该凝胶块中的DNA分离出来。这个程序已经被广泛地掌握。例如,可参见Lawn等人,Nucleic Acids Res.,9:6103-6114[1981]以及Goeddel等人,Nucleic Acids Res.,8:4057[1980]。
“Southern分析”或“Southern印迹法”是这样一种方法:DNA或含DNA的组合物经限制性内切酶消化后,通过与已知标记的寡核苷酸或DNA片段杂交证实DNA序列的存在。Southern分析的步骤通常依次为:琼脂糖凝胶电泳分离DNA消化产物,电泳分离后使DNA变性,并将得到的DNA转移到硝酸纤维素膜、尼龙膜或其他合适的膜上,分析与射性标记、生物素标记或酶标记探针的杂交情况。参见Sambrook等人著作(同上)中9.37-9.52部分。
“Northern分析”或“Northern印迹法”则是一种通过与一个已知探针如寡核苷酸、DNA片段、cDNA及其片段或RNA片段杂交鉴定RNA序列的方法。探针的标记可用放射性同位素(如32P)、生物素或酶。通常,经琼脂糖或聚丙烯酰胺凝胶电泳分离后,待分析的RNA被转移到硝酸纤维素膜、尼龙膜或其他合适的膜上与探针杂交。使用的标准技术是本领域中广为知道的。参见Sambrook等人著作(同上)中的7.39-7.52部分。
“连接”是二个核酸片段间形成磷酸二酯键的过程。二个片段的连接要求彼此的末端相互匹配。在某些情况下,末端间的匹配可通过内切酶的消化直接实现。但是,在内切酶消化以后,必需将通常产生的交错末端转变为平整末端使之更适合于连接。为产生平整末端,须将DNA在15℃于合适缓冲液中,用10单位DNA聚合酶I Klenow片段或T4 DNA聚合酶并在4种脱氧核糖核苷三磷酸存在下至少作用15分钟。然后,用酚-氯仿抽提和乙醇沉淀来纯化DNA。将用于连接的DNA片段等摩尔数地置于溶液中。溶液中还应含有三磷酸腺苷(ATP)、连接酶缓冲液和一种连接酶如T4 DNA连接酶,其含量约每0.5微克DNA加入约10单位。当DNA与某个载体连接时,先要通过合适限制性内切酶的消化使载体线性化。然后,用细菌磷酸酶或小牛小肠磷酸酶处理线性化片段,以防止在连接过程中发生自身连接。
从细胞中“制备”DNA表示从宿主细胞培养物中分离质粒DNA。大规模和小规模的质粒制备是常用的DNA制备方法,参见Sambrook等人著作(同上)中的1.25-1.33部分。制备后的DNA可用本领域中广为知道的方法来纯化,参见Sambrook等人著作(同上)中的1.40部分。
“寡核苷酸”是用已知化学方法合成的单链或双链多聚脱氧核糖核苷酸短链。已知的化学合成方法有:使用固相技术(参见1988年5月4日发表的EP266,032)或通过脱氧核糖核苷H-膦酸酯中间物(参见Froehler等人,Nucl.Acids Res.,14:5399-5407[1986])的磷酸三酯、亚磷酸盐或亚磷酰胺化学方法。其它方法有:如下所述的聚合酶链反应和其他自动引物法以及固相支持物上的寡核苷酸合成。所有这些方法的叙述见于Engel等人,Agnew.Chem.Int.Ed.Engl.,28:716-734(1989)。如果已知基因的整个核酸序列或者得到了编码链的互补核酸序列,就可以使用上述方法。另一种选择是,如果已知靶氨基酸序列,则可根据每个氨基酸残基对应的最佳密码子来推断潜在的核酸序列。合成后的寡核苷酸通过聚丙烯酰胺凝胶进行纯化。
“聚合酶链反应”或简称“PCR”是一种将微量特定的核酸(RNA和/或DNA)扩增的过程或技术。参见1987年7月28日公布的美国专利号4,683,195。通常,需要从感兴趣区段的末端或末端外侧获得序列情况,以设计出寡核苷酸引物。引物与待扩增的模板的互补链序列完全相同或相似,使得两个引物的5′末端核苷酸能够与扩增物质末端相结合。PCR能够用来扩增特定RNA序列、整个基因组DNA中特定的DNA序列、从总细胞RNA转录得到的cDNA、噬菌体或质粒序列等。参见Mullis等人,Cold Spring Harbor Symp.Quant.Biol.,51:263(1987);Erlich等人编辑,PCR Technology,(Stock-ton Press,NY,1989)。在本文中,PCR被认为是一种(但不是唯一的一种)扩增核酸测试样品的核酸聚合酶反应方法,包括使用已知的核酸作为引物和用一种核酸聚合酶来扩增或产生特定的核酸片段。
“严紧条件”指(1)在低离子强度和高温下进行洗涤,如50℃时0.015M NaCl/0.0015M柠檬酸钠/0.1%十二烷基磺酸钠(SDS),或者(2)在杂交过程中使用甲酰胺等变性剂,如42℃下50%(v/v)的甲酰胺中含有0.1%牛血清白蛋白/0.1%Ficoll/0.1%聚乙烯吡咯烷酮/50mM pH6.5的磷酸钠缓冲液及750mM NaCl、75mM柠檬酸钠;又如42℃下50%甲酰胺、5×SSC(0.75M NaCl,0.075M柠檬酸钠)、50mM磷酸钠(pH6.8)、0.1%焦磷酸钠、5×Denhardt's溶液,超声处理的鲑精DNA(50微克/毫升)、0.1%SD和10%硫酸葡聚糖,并在42℃下使用0.2×SSC和0.1%SDS洗涤。
“中等严紧条件”指使用的洗涤溶液和杂交条件比上述严紧条件低,(如温度、离子强度和SDS百分比浓度),参见Sambrook等人著作(同上)。中等严紧条件的一个例子是在含有以下成份的溶液中37℃温育过夜,20%甲酰胺、5×SSC(150mM NaCl、15mM柠檬酸三钠)、50mM磷酸钠(pH7.6)、5×Denhardt′s溶液、10%硫酸葡聚糖和20微克/毫升变性的剪切鲑精DNA,随后用1×SSC在37-50℃下洗涤滤膜。熟练的技术人员懂得如何根据探针长度等类似因素调整温度、离子强度等条件。
“抗体”(Abs)和“免疫球蛋白(Igs)”是有相同结构特征的糖蛋白。抗体对特定的抗原有特异性结合作用,而免疫球蛋白包括抗体和其他与抗体类似但没有抗原特异性的分子。例如,后者的多肽链由淋巴系统以低水平产生而由骨髓瘤以增强水平产生。
“天然抗体和免疫球蛋白”通常是约150,000道尔顿的异源四聚体糖蛋白。它由两条完全相同的轻链(L)和两条完全相同的重链(H)构成。每条L链都与一条H链通过共价二硫键结合,而不同免疫球蛋白同种型的两条重链之间的二硫键数目不同。每条轻链和重链各自都有规则隔开的链内二硫键桥。每条重链的一端有一个可变区(VH),后跟若干恒定区。每条轻链的一端有一个可变区(VL),另一端有一个恒定区。轻链的恒定区与重链的第一个恒定区并排,而轻链的可变区与重链的可变区并排。相信在轻链和重链的可变区之间有一个由特定氨基酸残基形成的界面。(参见Clothia等人,J.Mol.Bi-ol.,186:651-663[1985];Novotny和Haber,Proc.Natl.Acad.Sci.USA,82:4592-4596[1985])。
术语“可变的”指各种抗体可变区的特定部分序列普遍相异,从而被用作使每种特定抗体和它的特定抗原间产生特异性结合。然而,在抗体的可变区中,序列的可变性并不是平均分布的。可变性集中在每条轻链和重链可变区的三个称作互补决定区(CDRs)或超变区的区段。可变区较高保守性部分则称作构架(FR)。每条天然轻链和重链有四个主要为β-折叠构型的FR区,由三个成环状的或在某些情况下形成部分β-折叠结构的CDRs区连接。每条链的CDRs区通过FR区紧密地聚集在一起,并和其他链的CDRs构成抗体的抗原结合位点(参见Kabat等人所著的Sequneces of Proteins of Immuno-logical Interest,National Institute of Health,Bethesda,MD[1987])。恒定区并不直接参与抗原和抗体的结合,但能表现多种效应子功能,如在抗体依赖的细胞毒中抗体的参与。
经木瓜蛋白酶消化抗体后,产生两个完全相同的抗原结合片段“Fab”和一个残余“Fc”片段。每个Fab片段带有一个抗原结合位点,而Fc片段易于结晶。胃蛋白酶处理抗体则得到一个“F(ab′)2”片段,带有两个抗原结合位点,并仍然能交联抗原。
“Fv”是带有完整抗原识别和结合位点的最小抗体片段。这是一种由一条轻链的可变区和一条重链的可变区通过紧密的非共价结合而形成的二聚体。它的构型中,在VH-VL二聚体的表面,每个可变区的三个CDRs相互作用形成一个抗原结合位点。这六个CDRs共同决定了抗体的抗原结合特异性。但是,甚至单个可变区(或由三个特异于某抗原的CDRs组成的半个Fv)也具有识别和结合抗原的能力,虽然其亲和性低于整个结合位点。
Fab片段还包含了轻链的恒定区和重链的第一个恒定区(CH1)。Fab′片段与Fab片段的不同在于,前者在重链CH1区的羧基末端多了几个残基,包括来自抗体铰链区的一个或多个半胱氨酸。Fab′-SH在本文中表示Fab′恒定区的半胱氨酸上携带一个游离的巯基。F(ab′)2抗体片段最初以一对中间有半胱氨酸铰链的Fab′形式产生。另外,抗体片段间还有一些化学偶联。
根据恒定区的氨基酸序列,可将来自脊椎动物抗体(免疫球蛋白)的“轻链”明确地分为两类:κ型和λ型。
根据重链恒定区的氨基酸序列,可将免疫球蛋白分为不同的类型。主要有五种免疫球蛋白类型:IgA、IgD、IgE、IgG和IgM,其中有的还可以进一步分为亚类(同种型),如IgG-1、IgG-2、IgG-3和IgG-4;IgA-1和IgA-2。不同类型免疫球蛋白重链的恒定区则分别对应地称为:α、δ、ε、γ和μ。不同免疫球蛋白类型的亚基结构和三维构型已经知道得相当清楚。
术语“抗体”从最广义上使用时,其中专门包括专一的单克隆抗体(包括兴奋剂和拮抗剂抗体)、具有多表位特异性的抗体组合物以及抗体片段(如Fab、F(ab′)2和Fv),只要它们具备所要求的生物活性。
术语“单克隆抗体”在本文中指从一个基本同源的抗体群中得到的某种抗体。即除了极少量的自发突变外,构成群体的每个抗体都完全相同。单克隆抗体高度特异地直接对应于专一的抗原位点。而且,不同于常规的(多克隆)抗体制备物,这些制备物一般包括直接针对多个抗原决定簇(表位)的多个抗体,每种单克隆抗体直接针对抗原上的专一决定簇。除了它们的特异性外,单克隆抗体的优越性还体现在能够用杂交瘤培养来合成,而不会被其他免疫球蛋白污染。修饰语“单克隆的”说明了该抗体的特性是来自于基本均一的抗体群,而不表示抗体的获得需要任何特殊的方法。例如,本发明中使用的单克隆抗体可运用杂交瘤技术(首先由Kohler&Milstein在Nature,256:495[1975]中描述)或重组DNA技术进行制备(参见美国专利号4,816,567[Cabilly等人])。
本文中的单克隆抗体还特别地包括“嵌合”抗体(免疫球蛋白)。嵌合抗体重链或/和轻链上的一部分与来自某一特定物种的或者属于某一特定抗体类或亚类的抗体的对应序列完全相同或者同源;而余下的另一部分与来自另一特定物种或者属于另一特定抗体类或亚类的抗体的对应序列完全相同或者同源。嵌合抗体的片段也具有这种情况,只要它们能表现出所需的生物活性。(参见Cabilly等人的美国专利号4,816,567和Morrison等人,Proc.Natl.Acad.Sci.USA,81:6851-6855[1984])。
非人类(如鼠)抗体的“人源化”形式是一种嵌合免疫球蛋白、免疫球蛋白链或其片段(如Fv、Fab、Fab′、F(ab′)2或抗体的其他抗原结合亚序列),其中带有极少的非人类免疫球蛋白序列。通常,人源化抗体是人免疫球蛋白(受体抗体),其中受体的互补决定区(CDR)的残基被其他物种的CDR的残基(供体抗体)所代替,如小鼠、大鼠或兔的CDR的残基,它们具有所需的特异性、亲和性和容量。有时,人免疫球蛋白的Fv构架残基也被相应的非人类残基代替。甚至,人源化抗体也会含有既非来自受体抗体也非来自供体CDR或构架序列的残基。这类修饰可以进一步完善和优化抗体的功能。通常,人源化抗体包括了所有的可变区(至少一个,一般两个),其中全部的或几乎全部的CDR区对应于非人类免疫球蛋白的CDR区,而全部的或几乎全部的FR区是人免疫球蛋白共有序列的FR区。人源化免疫球蛋白最好还带有至少一部分免疫球蛋白恒定区(Fc),一般是人免疫球蛋白恒定区。进一步的细节可参见Jones等人,Nature,321:522-525[1986];Reichman等人,Nature,332:323-329[1988]和Presta,Curr.Op.Struct.Biol.,2:593-596[1992]。
“人体中的非免疫原性”指将存在于药学上可接受的载体中的多肽或将该多肽以有治疗效应的剂量与合适的人体组织接触,经过一段适当的潜伏斯(如8至14天)后,再次施用该多肽,没有出现针对该多肽的过敏性和抗性状态。II.本发明的优选例子
本发明优先选用一些被称为mpl配体或血小板生成素(TPO)的基本同源的多肽。这些多肽与受体细胞因子超家族的一员,mpl,有结合特性,并具有促进标记的核苷酸(3H-胸苷)掺入用人mpl P转染的、IL-3依赖的Ba/F3细胞DNA中的生物特性。更优先选用的mpl配体是被分离的哺乳动物蛋白质,其具有造血,尤其是巨核细胞生成或血小板生成活性;也就是说,能够促进未成熟的巨核细胞或巨核细胞前体增殖、成熟和/或分化为成熟的血小板生成形式。本发明最优先选用的多肽是有造血、巨核细胞生成或血小板生成活性的人mpl配体及其片段。可选择地使这些人mpl配体非糖基化。其他可优先选用的人mpl配体有:被称为hML153或hTPO153的hML“EPO”结构域;被称为hML245或hTPO245的hML截短形式;具有如图1(SEQ ID NO:1)所示氨基酸序列、被称为hML、hML332或hTPO332的成熟全长多肽;以及具有生物活性的置换性变异体hML(R153A、R154A)。
本发明可优先选择的多肽还有具有生物或免疫活性的mpl配体变异体,它们选自hML2、hML3、hML4、mML、mML2、mML3、pML和pML2。
本发明可优先选择的多肽还有具有生物活性的mpl配体变异体,其与以下的mpl配体比较,至少有70%的氨基酸序列完全相同:人mpl配体(见图1[SEQ ID NO:1])、鼠mpl配体(见图16[SEQID NOS:12和13])、重组猪mpl配体(见图19[SEQ ID NO:18])或从发育不全的猪血浆分离的mpl配体。同源性达到至少75%则更好,达到至少80%还要好,达到至少85%又更好,达到至少90%甚至还要好,达到至少95%则最佳。
从发育不全的猪血浆分离的mpl配体有以下特点:
(1)部分纯化的该配体用磷酸盐缓冲液(PBS)从凝胶滤柱中洗脱,其分子量为60,000-70,000,PBS或含0.1%SDS,或含4MMgCl2
(2)该配体的活性可被链霉蛋白酶破坏;
(3)该配体在低pH值(2.5)、0.1%SDS和2M尿素时保持稳定;
(4)基于能与多种凝集素柱结合,该配体是一种糖蛋白;
(5)分子量25,000-35,000的高纯度该配体可从非还原性SDS-聚丙烯酰胺凝胶中洗脱。较少量活性物时,洗脱的分子量约18,000-22,000和60,000;
(6)分子量28,000-31,000的高纯度配体在还原性SDS-聚丙烯酰胺凝胶中以双联体形式分离;
(7)18,000-22,000、28,000和31,000条带的氨基末端序列是一样的:SPAPPACDPRLLNKLLRDDHVLHGR(SEQ ID NO:29);
(8)下列亲和柱可供配体结合和洗脱:
Blue-Sepharose,
CM Blue-Sepharose,
MONO-Q,
MONO-S,
小扁豆凝集素-Sepharose,
麦胚凝集素(WGA)-Sepharose,
伴刀豆球蛋白-Sepharose,
乙醚650m Toyopearl,
丁基650m Toyopearl,
苯基650m Toyopearl,和
苯基-Sepharose。
更可优先选用的mpl配体多肽由人基因组或具有图1(SEQ IDNO:1)所示氨基酸序列的cDNA编码。
本发明优先选用的其他具有天然生物活性的mpl配体多肽包括:前mpl配体原、mpl配体原,成熟的mpl配体,mpl配体片段及其糖基化变异体。
还有一些本发明优选的多肽,包括mpl配体序列变异体和嵌合体。通常,二者都是具有生物活性的mpl配体变异体,其氨基酸序列至少有70%与人mpl配体或从发育不全的猪血浆分离的mpl配体相同。同源序列分别达到至少75%、80%、85%、90%、95%,则优选的级别依次提高。优选mpl配体变异体的一个例子是hML N末端结构域变异体(因其序列与红细胞生成素同源而称为“EPO结构域”)。优选的hML EPO结构域包括成熟hML的前153个氨基酸残基,也被称作hML153。一种可供选择的优选hML序列变异体在C末端结构域有一个或多个碱性或双碱性氨基酸残基被非碱性氨基酸残基(如:疏水的、中性的、酸性的、芳香族的、甘氨酸、脯氨酸等)替代。在一种优选的hML C末端结构域序列变异体中,153和154位置的精氨酸被丙氨酸所替代,这种变异体称作hML332(R153A、R154A)。另一个优选的hML变异体hML332或hML153,其111-114位的残基(QLPP或LPPQ)缺失或被其他四联肽(如AGAG或类似序列)所替代。上述的缺失突变被称作Δ4hML332或Δ4hML153
优先选用的嵌合体是mpl配体及其片段(定义如下)与异源多肽及其片段融合。例如,hML153可以与IgG片段融合以提高血清半衰期,也可以与IL-3、G-CSF或EPO融合得到一个增强的血小板生成活性或嵌合造血活性分子。
另一个可供选择的优选人mpl配体嵌合体是“ML-EPO结构域嵌合体”,它的结构特点是,一个或多个(但不是全部)N末端153-157位的hML残基被人EPO残基(可能的排列如图10所示[SEQ ID NO:7])替代。在本例的约153-166个残基长度的hML嵌合体中,人EPO序列中单个或组合残基被加入或者替换hML序列,替换的位置对应于图10[SEQ ID NO:7]所示的排列。典型的插入hML N端部分的组合序列包括在EPO的24-27、38-40和83-85位置上有一个或多个N-糖基化位点;也包括四个位于EPO的9-22、59-76、90-107和132-152位置的预测的双亲媒性α螺旋管中的一个或多个;以及其他包括高度保守的区域,如N末端区、C末端区和44-52残基位置(EPO)(参考见Wen等人,Blood,82:1507-1516[1993]和Boissel等人,J.Biol.Chem.,268(21):15983-15993[1993])。预期这种“ML-EPO结构域嵌合体”联合有血小板生成一红细胞生成(TEPO)的生物活性。
其他本发明的优选多肽包括mpl配体片段,含有一个至少10、15、20、25、30或40个氨基酸残基长度的连续序列,该序列与在本文中所描述的分离自发育不全的猪血浆mpl配体或人mpl配体的序列完全相同(见表14,实施例24)。一种优选的mpl配体片段是人ML[1-X],其中X代表153、164、205、207、217、229或245(见图1[SEQ ID NO:1]中1-X残基序列部分)。其他优选的mpl配体片段包括那些纯化的mpl配体的化学或酶解或者消化后的产物。
本发明另一个优选方面是纯化mpl配体分子的方法。该方法的原理为:根据待纯化的mpl配体分子能够选择性地吸咐于固定化的受体多肽,使含mpl配体分子的mpl配体源接触mpl或mpl融合多肽等固定化的受体多肽;洗涤固定化支持物以除去非吸咐物质;然后用洗脱缓中液将固定化的受体多肽上的分子洗脱下来达到纯化。mpl配体源也许是血浆,而优选的固定化受体为mpl-IgG融合体。
重组细胞培养物作为mpl配体源,其培养基或细胞裂解物中的mpl配体含量通常要高于血浆或其他天然来源。在这种情况下,使用上述的mpl-IgG免疫亲和方法依然可行,但并非必须,可用本领域中已知的常规蛋白质纯化方法。简而言之,产生基本同源mpl配体的优选纯化方法包括:用离心或超滤方法除去宿主细胞或裂解片段等微小碎片;可选择地使用商购的蛋白质浓缩滤膜来浓缩蛋白质;然后,通过下列一个或多个步骤将mpl配体从其他杂质中分离出来:免疫亲和、离子交换(如DEAE或含羧甲基或磺酸正丙基基团的基质)、Blue-Sepharose、CM Blue-Sepharose、MONO-Q、MONO-S、小扁豆凝集素-Sepharose,麦胚凝集素-Sepharose、伴刀豆球蛋白-Sepharose、乙醚Toypearl、丁基Toypearl、苯基Toypearl、蛋白A-Sepharose,SDS-聚丙烯酰胺凝胶电泳、反相HPLC(如带脂肪族基团的硅胶)或葡聚糖凝胶分子筛大小排阻色谱,以及乙醇或硫酸氨沉淀。上述步骤的任意一个中都可加入氟化甲磺酸等蛋白酶抑制剂,以抑制蛋白水解作用。
在另一个优选例子中,提供了一种能与mpl配体结合的分离抗体。优先选用的mpl配体分离抗体是单克隆的(Kohler和Milstein,Nature,256:495-497[1975];Campbell,Laboratory Techniquesin Biochemistry and Molecular Biology,Burdon等人编辑,13卷,Elisevier Science Publisrers,Amsterdam[1985];和Huse等人,Science,246:1275-1281[1989])。优选的mpl配体分离抗体与mpl配体的亲和性至少应为106升/摩尔。抗体结合的亲和性达到107升/摩尔时,更应优先选用。最为优先的情况是,抗体针对具上述效应子功能的mpl配体而产生。能与mpl配体结合的分离抗体可有选择地与另一条多肽融合,该抗体或其融合体可用作固定化的mpl多肽,将mpl配体从上述的来源中分离纯化到。在本例进一步的优先考虑中,本发明提供了一种检测体外或体内mpl配体的方法:用可疑含配体的样品如血清样品接触抗体,检测是否发生结合。
在进一步的优选例子中,本发明提供了一种编码mpl配体及其片段的分离的核酸分子,该核酸分子可用一个可检测成分作标记或去标记。本发明还提供了一种核酸分子,其序列与含编码mpl配体的核酸分子序列互补或在严紧或中度严紧条件下能与之杂交。优选的mpl配体核酸是编码具有生物活性的mpl配体的RNA或DNA,其编码产物与人mpl配体至少有75%的序列完全相同,相同序列分别达到至少80%、85%、90%、95%,则选用的优先程度依次提高。更优选的分离核酸分子是编码具有生物活性的mpl配体的DNA序列,其来源有:(a)哺乳动物mpl配体基因的编码区DNA(如含有图1[SEQ ID NO:2]所示核苷酸序列的DNA分子及其片段);(b)至少能在中度严紧条件下与(a)所述DNA杂交的DNA;以及(c)因遗传密码的简并性所得到的(a)或(b)所述DNA的简并DNA。我们期望本文中所述新的mpl配体是配体家族或细胞因子家族的一员,具有适当的序列一致性,以至在低于中度严紧条件下,它们的DNA(或其互补链或片段)能与图1(SEQ ID NO:2)所示的DNA杂交。因此,本发明更进一步的方面包括了在低于中度严紧条件下,与编码mpl配体多肽的DNA杂交的DNA。
在本发明一个进一步的优选例子中,核酸分子是编码mpl配体的cDNA,包含在一个可复制的载体上,其中cDNA可操作地结合于用该载体转化的宿主能识别的控制序列。这方面又进一步包括了用该载体转化的宿主细胞和用cDNA产生有效应的mpl配体的一种方法,该方法包括:编码mpl配体的cDNA在转化宿主细胞培养物中的表达及从中回收。用该方法获得的mpl配体为优选地基本同源的人mpl配体。产生mpl配体的优选宿主细胞为中国仓鼠卵巢(CHO)细胞。
本发明还进一步包括了一个治疗免疫性疾病或造血性疾病尤其是血小板生成减少的哺乳动物的方法,包括对该哺乳动物施以有效治疗量的mpl配体。可选择地,mpl配体可以以与细胞因子、尤其是集落刺激因子或白细胞介素结合的形式给药。优选的集落刺激因子或白细胞介素包括:成套配体、LIF、G-CSF、GM-CSF、M-CSF、EPO、IL-1、IL-2、IL-3、IL-5、IL-6、IL-7、IL-8、IL-9或IL-11。III.制备方法
一些作者长期以来认为血小板的产生是由多谱系的特定体液因子控制。假设认为,两种被称为巨核细胞集落刺激因子(meg-CSF)和血小板生成素的不同的活性细胞因子调节了巨核细胞生成和血小板生成作用(参见Williams等人,J.Cell Physiol.,110:101-104[1982];Williams等人,Blood Cell,15:123-133[1989];和Gor-den等人,Blood,80:302-307[1992])。根据这个假设,meg-CSF促进前体巨核细胞的增殖,而血小板生成素主要影响更多分化细胞的成熟和最终的血小板释放。自60年代以来,大量文献记载了出现血小板减少现象后,动物和人类的血浆、血清和尿中会诱发并形成meg-CSF和血小板生成素活性物(如Odell等人,Proc.Soc.Exp.Biol.Med.,108:428-431[1961];Nakeff等人,Acta Haematol.,54:340-344[1975];Specter,Proc.Soc.Exp.Biol.,108:146-149[1961];Schreiner等人,J.Clin.Invest.,49:1709-1713[1970];Ebbe,Blood 44:605-608[1974];Hoffman等人,N.En-gl.J.Med.,305:533[1981];Straneva等人,Exp.Hematol.,17:1122-1127[1988];Mazur等人,Exp.Hematol.,13:1164[1985];Mazur等人,J.Clin.Invest.,68:733-741[1981];Sheiner等人,Blood 56:183-188[1980];Hill等人,Exp.Hema-tol.,20:354-360[1992];以及Hegyi等人,Int.J.Cell Cloning,8:236-244[1990])。根据报道,这两种活性因子所属的谱系不同于已知的细胞因子(参见Hil R.J等人,Blood 80:346[1992];Er-ickson-Miller C.L.等人,Brit.J.Haematol.,84:197-203[1993];Straneva J.E.等人,Exp.Hematol.,20:4750[1992];以及Tsukada J.等人,Blood 81:866-867[1993])。迄今,从血小板减少的血浆或尿中提纯meg-CSF和血小板生成素的工作还未获成功。
与上述从血小板减少血浆中观察到的现象一致,我们发现,从照射处理过的猪得到的发育不全猪血浆(APP)能够在体外刺激人巨核细胞生成。我们发现,这一刺激活性可被c-mpl的可溶性胞外区所终止,从而证实APP是一般所认为的mpl配体(ML)的一个潜在来源。我们已经成功地从APP中纯化出了mpl配体,并且氨基酸序列信息已经被用于分离鼠,猪和人MLcDNA。这些ML有同源于红细胞生成素的序列,并同时具有meg-CSF和血小板生成素样活性。
1.从血浆中鉴定和纯化mpl配体
如上述,有报道显示来自不同物种的发育不全血浆有促进体外血细胞生成的活性;但是,以前的报道中还没有发现从血浆中分离造血刺激因子的例子。发育不全血浆的一个来源是经照射性处理的猪。这种发育不全的猪血浆(APP)可以体外刺激人血细胞生成。判断APP中是否含有mpl配体,可通过测定3H-胸苷掺入用人mpl P转染(步骤见图2)的Ba/F3细胞来分析其效应。APP可促进3H-胸苷掺入Ba/F3-mpl细胞,而不是Ba/F3对照细胞(即未用人mpl P转染)。另外,在正常的猪血浆中,没有发现类似的活性。上述结果说明,APP含有一个或多个因子,能通过mpl受体转导一个增殖信号,也许就是该受体的天然配体。用可溶性mpl-IgG处理可阻断APP对Ba/F3-mpl细胞促进效应的发现进一步地支持了该观点。
APP中活性物是一种蛋白质,因为链霉蛋白酶、DTT或加热都可以破坏APP活性(图3)。这种活性物也是不能透析的。但是,这种活性物在低pH值(pH2.5,2小时)时保持稳定,并在一些凝集素亲和柱上吸附和洗脱,显示出是一种糖蛋白。为进一步明确这种活性物结构及其特性,可以利用mpl-IgG嵌合体从APP中进行亲和纯化。
APP的处理方法可依据实施例1和实施例2中的方案。简而言之,mpl配体可使用疏水作用性色谱(HIC)、固定化染料色谱和mpl-亲和色谱来纯化。回收该活性物的每一个步骤见图4,各步的纯化倍数见表1。通过mpl-亲和柱,该活性物总的回收率约10%。mpl-亲和柱洗脱的活性物峰值组分(F6)有约9.8×106单位/毫克的活性。5升APP纯化约4×106(从0.8单位/毫克到3.3×106单位/毫克),蛋白质含量则稀释了83×106倍(从250克到3微克)。估计从mpl-亲和柱上洗脱的配体特异性活性约为3×106单位/毫克。
                            表1mpl配体的纯化
样品 体积mls 蛋白质毫克/毫升 单位/毫升 单位 特异活性单位/毫克 产量% 纯化倍数
APP 5,000 50 40 200,000 0.8 - 1
苯基 4,700 0.8 40 200,000 50 94 62
Biue-Sep.mpl(升) 640 0.93 400 256,000 430 128 538
(Fxns)5-7) 12 5×10-4 1666 20,000 3,300,000 10 4,100,000
通过Bradford测定确定蛋白质。mpl洗脱物组分5-7的蛋白质浓度的估计是根据银染SDS凝胶中染色的强度。一个单位定义为引起Ba/F3-mpl细胞增殖的最大促进的50%。
在还原条件下通过SDS-聚丙烯酰胺凝胶电泳(4-20%,Novex凝胶)分析mpl-亲和柱中洗脱的组分,可发现存在几种蛋白质(见图5)。用高强度银染显示的蛋白质分子量约66,000、55,000、30,000、28,000和18,000-22,000。为证明哪些蛋白质促进了Ba/F3-mpl细胞培养物的增殖,可如实施例2所述将它们从凝胶中洗脱。
该实验结果显示,绝大多数从含蛋白质的凝胶薄片中洗脱下来的活性物分子量为28,000-32,000,而分子量18,000-22,000(图6)的活性物较少。这些区域中只可见的蛋白质分子量为30,000、28,000和18,000-22,000。为了鉴定和得到这一凝胶区域中分离的蛋白质(即30、28和18-22千道尔顿的条带)的序列,这些蛋白质被电印迹于PVDF上,并以如实施例3所述方法测序。获得的氨基末端序列如表2所示。
                              表2mpl配体氨基末端序列
30 kDa1        5        10        15         20          25(S)P A P P A(C)D P R L L N K L L R D D(H/S)V L H(G) R L (SEQ ID NO:30)
28 kDa1        5        10        15         20        25(S)P A P P A X D P R L L N K L L R D D (H)V L(H)G R (SEQ ID NO:31)
18-22 kDa1         5       10X P A P P A X D P R L X (N)(K) (SEQ ID NO:32)
计算机辅助分析显示,这些氨基酸序列是新发现的。由于所有这三种序列都是相同的,可认为这30千道尔顿,28千道尔顿和18千道尔顿的蛋白质是相关的,也许就是同一种新蛋白质的不同形式。而且,这种蛋白质可能就是一种自然存在的mpl配体。因为,该活性物可以在4-20%的SDS-聚丙烯酰胺凝胶电泳的同一个区域内(28,000-32,000)分离。另外,当用Superose 12(Pharmacia公司)柱作凝胶过滤色谱时,部分纯化的配体与17,000-30,000分子量的物质一起迁移。相信,配体的不同分子量形式只是蛋白水解化或糖基化差异的结果,或者是其他翻译前后的修饰所造成的结果。
如前所述,反义人mplRNA能阻止富集CD34+母细胞的人骨髓培养物中的巨核细胞生成,但不影响其他造血细胞谱系的分化(Methia等人(同上))。这一结果表示,mpl受体也许在巨核细胞的体外增殖和分化过程中发挥作用。为了进一步阐明mpl配体在巨核细胞生成中的作用,可以比较APP和除去mpl配体的APP在体外人巨核细胞生成过程中的效应。APP对于人巨核细胞生成的效应通过液体悬浮巨核细胞生成分析的一个改进方法来测定,方法的描述见实施例4。该分析中,在mpl-IgG亲和色谱的前后用APP处理人外周干细胞(PSC)。GPIIbIIIa对巨核细胞生成的促进作用由抗体125I-anti-IIbIIIa来定量(见图7)。如图7所示,10%的APP能引起约3倍的促进作用,但除去mpl配体的APP没有效应。显然,除去mpl配体的APP不能诱导Ba/F3-mpl细胞的增殖。
在另一个实验中,分别在第0,2,4天将可溶性人mpl-IgG加入含10%APP的培养物中,可以中和APP对人巨核细胞生成的促进作用(见图8)。这些结果显示,mpl配体在人巨核细胞生成的调节中发挥作用,因此也可能对血小板减少症的治疗有用。
2.mpl配体的分子克隆
根据从30千道尔顿,28千道尔顿和18-22千道尔顿蛋白质得到的氨基末端氨基酸序列(见上述表2),已经设计并使用了两个简并寡核苷酸引物集合体用于通过PCR扩增猪基因组DNA。可以很合理地认为,如果氨基末端氨基酸序列由单一外显子编码,那么正确的PCR产物的长度应该为69bp。发现了一个该长度的DNA片段并亚克隆到pGEMT。PCR寡核苷酸引物以及得到的三个克隆序列见于实施例5。由PCR引物之间部分编码的肽的氨基酸序列(PRLLNKLLR[SEQ ID NO:33])完全等同于对猪配体氨基末端蛋白质测序后得到的序列(见上文所示28和30千道尔顿猪蛋白质序列的9-17残基)。
一种根据PCR片段序列合成的寡核苷酸被用于筛选人基因组DNA文库。一个称为pR45的45聚体的寡核苷酸已经根据PCR片段的序列设计并合成出来。该寡核苷酸有以下序列:5′GCC-GTG-AAG-GAC-GTG-GTC-GTC-ACG-AAG-CAG-TTT-ATT-TAG-GAG-TCG 3′(SEQ ID NO:34)
参照实施例6,该脱氧寡核苷酸在低严紧杂交和洗涤条件下被用于筛选构建于λgeml2噬菌体中的人基因组DNA文库。挑出阳性克隆,纯化噬菌斑,用限制性图谱和southern印迹法来分析。一个与45聚体杂交的390bp EcoRl-XBal片段被亚克隆于pBluescriptSK-。这一克隆的DNA测序表明,编码猪mpl配体的人同系物的DNA已经被分离出来。人DNA序列和依此推断的氨基酸序列如图9(SEQ ID NO:3和4)。基因组序列中内含子的预测位置由箭头表示,并标出一个推断的外显子(“外显子3”)。
根据人“外显子3”序列合成了对应于外显子3′端和5′端序列的寡核苷酸。从不同人组织中制备模板DNA,用这两个引物进行PCR反应。所期望的正确PCR产物的大小为140bp。在12%的聚丙烯酰胺凝胶电泳中分析PCR产物后,可以在用成人肾、293胎儿肾细胞构建的cDNA文库中和人胎儿肝制备的cDNA中检测到期望大小的DNA片段。
接着,用同样的45聚体寡核苷酸筛选构建于λDR2噬菌体中的胎儿肝cDNA文库(7×106个克隆),该45聚体寡核苷酸用于在低严紧杂并条件下筛选人基因组文库和胎儿肝cDNA文库。挑选阳性克隆,纯化噬菌斑,并用PCR测定插入片段的大小。选择含1.8kb插入片段的克隆以供进一步分析。运用实施例7所述程序,得到人mpl配体(hML)的核苷酸序列及依此推断的氨基酸序列。这些序列见于图1(SEQ ID NOS:1和2)。
3.人mpl配体(hML)的结构
人mpl配体(hML)cDNA序列(图1[SEQ ID NO:2])由1774个核苷酸构成,并有一个聚腺苷酸尾。它包括215个核苷酸的5′端非翻译序列和498个核苷酸的3′端非翻译区。在核苷酸位置216-218处的假定起始密码子位于真核翻译起始要求的共有序列内。开放读框起始于核苷酸位置220,共有1059个核苷酸,并编码长度为353个氨基酸残基的多肽链。该预测氨基酸序列的氨基末端高度疏水,可能对应于某种信号肽。对预测的氨基酸序列进行计算机分析(vonHeijne等人,Eur.J.Biochem,.133:17-21[1983])显示在残基21和22之间,有一个信号肽酶的潜在切割位点。在这个位置上的切割会产生一个332个氨基酸残基长度的成熟多肽,其起点是纯化自猪血浆的mpl配体的氨基末端序列。预测该332个氨基酸残基长度配体的未经糖基化分子量约38千道尔顿。共有6个潜在的糖基化位点和4个半胱氨酸残基。
将mpl配体序列和Genbank序列数据库比较发现:成熟的人mpl配体和人红细胞生成素(hEPO)氨基末端的153个残基之间有23%完全相同(图10[SEQ ID NOS:6和7])。如果考虑保守性置换,hML和hEPO在这一区域相似性达到50%。hML和hEPO都有4个半胱氨酸。其中,包括第一个和最后一个在内的4个半胱氨酸中的3个在hML中是保守的。定点诱变实验结果显示,红细胞生成素的第一个和最后一个半胱氨酸根据其功能的需要形成一个二硫键(Wang,F.F.等人,Endocrinology 116:2286-2292)。类似地,hML的第一个和最后一个半胱氨酸可能也形成了一个重要的二硫键。在hML中没有保守的糖基化位点。hML多肽所有潜在的N-糖基化位点都位于近羧基末端的一半处。
与hEPO类似,hML mRNA既没有共有聚腺苷酸序列AAUAAA,也没有调节元件AUUUA,AUUUA出现在许多细胞因子的3′端非翻译区,并被认为影响mRNA的稳定性(Shawet等人,Cell,46:659-667[1986])。Northern印迹法分析显示了在胎儿和成人肝中,单一的1.8kb hML RNA转录物水平低。在较长时间曝光之后,可以在成人的肾中检测到相同大小的较弱条带。经比较,人的红细胞生成素在胎儿肝中表达,并且当低氧出现时,在成人的肾和肝中表达(Jacobs等人,Nature,313:804-809[1985]和Bondurant等人,Molec.Cell.Biol.,6:2731-2733[1986])。
hML羧基末端区的重要性还有待进一步阐述。根据6个潜在N-糖基化位点的存在和该配体能与凝集素亲和柱结合的特点,hML的该区域可能被糖基化。在一些凝胶洗脱实验中,我们观察到活性物分辨的分子量约60,000,也许代表了全长的糖基化分子。因此,羧基末端区也许起了稳定和提高循环的hML半衰期的作用。就红细胞生成素而言,其未经糖基化的形式在体外具有完整的生物活性,但与糖基化红细胞生成素相比,血浆的半衰期明显缩短(Takeuchi等人,J.Biol.Chem.,265:12127-12130[1990];Narhi等人,J.Biol.Chem.,266:23022-23026[1991]和Spivack等人,Blood,7:90-99[1989])。hML的羧基末端结构域有两个双碱性的氨基酸序列[在153-154和245-246位置的Arg-Arg基序],可作为潜在的加工位点。在这些位点的切割可能就是分离自APP的ML的30、28、18-22千道尔顿形式的来源。很重要地,Arg153-Arg154序列的出现是紧接着ML的红细胞生成素样结构域。这些现象说明,也许全长的ML是一种前体蛋白,经过有限蛋白酶解产生成熟的配体。
4.人mpl配体的同种型和变异体
人mpl配体的同种型或剪接形式可通过成人肝的PCR检测到。简而言之,合成对应于hML编码序列的两端及选择的内部区域的引物。如实施例10所述,这些引物被用于通过RT-PCR扩增成人肝RNA。除了称为hML的全长形式外,还观察到或推断出其他三种形式,称为hML2、hML3和hML4。推断出的所有这四种同种型的成熟氨基酸序列如图11(SEQ ID NOS:6、8、9和10)所示。hML3在位置700处有116个核苷酸缺失,导致了氨基酸的缺失和移码。cDNA编码一条265个氨基酸长度的成熟多肽,从hML序列的第139个氨基酸残基起趋异。最后,hML4既有在位点618后12个核苷酸缺失(也在鼠和猪序列中发现[见下文]),也有见于hML3的116bp的缺失。虽然在人中还没有分离到只有12bp(紧接核苷酸位点619)缺失的克隆,但这种被称为hML2同种型可能存在,因为在鼠和猪中都鉴定出了这样的的同种型(见下文),也因为已经发现其与缺失116个核苷酸的hML4相连同。
双碱性的Argl53-Arg154被两个丙氨酸残基替代的hML置换变异体和hML的一个“EPO结构域”截短形式被构建以判断全长的ML是否为具有生物活性所必须。称作hML(R153A、R154A)的Arg153-Arg154双碱性序列置换变异体用实施例10所述的PCR方法来构建。“EPO结构域”截短形式hML153,通过在Arg153后引入一个终止密码子,也是用PCR来构建。
5.在瞬时转染的人胚胎肾(293)细胞中重组人mpl配体(rhML)的表达
为了证实克隆的人cDNA编码mpl配体,在巨细胞病毒立即早期启动子的控制下,使用表达载体pRK5-hML或pRK5-hML153,在哺乳动物293细胞中表达配体。已经发现,从瞬时转染的人胚胎肾293细胞得到的上清液能促进3H-胸苷掺入Ba/F3-mpl细胞,但不是亲代Ba/F3细胞(图12A)。只用pRK载体转染的293细胞的培养基则没有这种活性。在培养基中加入mpl-IgG能够消除这种促进作用(数据没有显示)。这些结果显示,克隆的cDNA编码一种功能性的人ML(hML)。
将hML的截短形式hML153在293细胞中表达,可以判断单独“EPO结构域”是否可以结合并激活mpl。转染细胞的上清液与表达全长hML(图12A)的细胞的上清液有相似的活性,表示ML的羧基末端结构域对于c-mpl的结合和激活并不是必须的。
6.mpl配体促进巨核细胞生成和血小板生成
重组hML的两种形式,全长的rhML和截短的rhML153都能在体外促进人巨核细胞生成(图12B)。在不加入其他外源造血生长因子时,可以观察到这种效应。除了IL-3以外,ML是唯一在检测中显示这种活性的造血生长因子。在我们的分析中,IL-11、IL-6、IL-1、红细胞生成素、G-CSF、IL-9、LIF、成套配体(KL)、M-CSF、OSM和GM-CSF在单独检测时对巨核细胞生成都没有效应(数据没有显示)。这个结果显示了ML具有巨核细胞促进活性,也指出了ML在巨核细胞生成调节中的作用。
在鼠血小板增多回跳分析中,患血小板减少症动物的血浆中的血小板生成活性物显示出促进血小板生成(McDonald,Proc.Soc.Exp.Biol.Med.,14:1006-1001[1973]和Mcdonald等人,Scand.J.Haematol.,16:326-334[1976])。在这个模型中,使用特异的抗血小板血清引发鼠急性血小板缺少,来导致预测中的血小板增多回跳。这种免疫血小板增多型鼠对于外源的血小板生成素样活性物比普通的鼠更为敏感(McDonald,Proc.Soc.Exp.Biol.Med.,14:1006-1001[1973]),就如同去除低氧的鼠对红细胞生成素的敏感性比普通的鼠强(McDonald等人,J.Lab.Clin.Med.,77:134-143[1971])。为了判断rML是否在体内刺激血小板生成,将部分纯化的rhML注射入血小板增多回跳的鼠中。然后,计量血小板数以及掺入到血小板中的35S。将64,000或32,000单位的rML注射到鼠体内可显著增加血小板生成,与只注射入赋行剂的对照鼠相比,血小板数增加约20%(对应的p=O.0005和0.0001),掺入血小板的35S增加约40%(p=0.003)(图12C)。这个刺激水平与我们在此模型中使用IL-6观察到的情况相匹比(数据没有显示)。只以16,000单位的rML进行处理不能显著地刺激血小板的生成。这些结果表明,ML以剂量依赖的方式刺激血小板的生成,因此具备了血小板生成素样活性。
用上述hML同种型构建物转染293细胞并用Ba/F3-mpl增殖来测定分析上清液(见图13)。在分析中,hML2,hML3没有显示可测定的活性,但hML(R153A,R154A)的活性类似于hML和hMLl53,这一结果表明,在Arg153-Arg154双碱性位点的加工对于其活性既不是必须的,也不是不利的。
7.巨核细胞生成和mpl配体
已经有假说认为,巨核细胞生成受多重细胞水平的调节(Williams等人,J.Cell Physiol.,110:101-104[1982]和William等人,Blood Cell,15:123-133[1989])。这一假说的主要依据是,某些造血生长因子刺激巨核细胞前体的增殖,而另一些主要影响其成熟。本文中的结果提示ML同时以增殖和成熟因子发挥作用。有一系列证据支持ML对巨核细胞前体增殖的刺激作用。首先,APP能在体外刺激人巨核细胞前体的增殖和成熟,而其刺激作用可以被mpl-IgG完全抑制(图7和图8)。此外,c-mpl反义寡核苷酸对巨核细胞集落形成的抑制(Methia等人,Blood,82:1395-1401[1993])以及c-mpl可将细胞内的增殖信号转导入其被转染对象中的发现(Skoda等人,EMBO,12:2645-2653[1993]和Vigon等人,Oncogene,8:2607-2615[1993])也都表明了ML刺激增殖。在巨核细胞分化的所有时期中,c-mpl显著的表达(Methia等人,Blood,82:1395-1401[1993])以及重组ML在体内迅速刺激血小板生成的能力都表明了ML也影响成熟。由于可获得重组ML,就可以对其在巨核细胞生成和血小板生成调节中的作用进行仔细的评估,以及它对其他造血细胞谱系的潜在影响。
8.人mpl配体(TPO)基因的分离
在低严紧或高严紧条件下,使用一个与编码mpl配体的人cD-NA 3′端一半序列对应的片段,筛选含有pR45的构建于λ-Gem12噬菌体中的人基因组文库,分离到含TPO基因的人基因组DNA克隆。两个跨越35kb的重叠λ克隆被分离出来。对含有完整TPO基因的两个重叠片段(BamH1和EcoRI)进行亚克隆和测序。
人基因的结构为7kb基因组DNA中含有6个外显子。所有外显子和内含子连接边界都与哺乳动物基因的共有基序一致(Shapiro,M.B.等人,Nucl.Acids Res.15:7155[1987])。外显子1和外显子2含有5′端非翻译序列和信号肽的4个起始氨基酸。分泌信号的残基和成熟蛋白质的前26个氨基酸由外显子3编码。整个羧基结构域和3′非翻译区以及红细胞生成素样结构域的约50个氨基酸由外显子6编码。涉及在hML-2(hTPO-2)中观察到的缺失的4个氨基酸由外显子6的5′末端编码。
Southern印迹法分析人基因组DNA显示,TPO基因以单拷贝形式存在。该基因在染色体上的位置由荧光原位杂交(FISH)定位于染色体3q27-28。
9. 293细胞TPO的表达与纯化
实施例19中详细叙述了如何从293细胞制备和纯化ML或TPO。简单来说,就是用pRK5-hmpl I通过PCR来获得对应于TPO整个开放读框的cDNA。PCR产物纯化后克隆入质粒pRK5tkneo(一种衍生自pRK5的载体,经过改造以在胸苷激酶启动子控制下表达新霉素抗性基因)的限制性位点Clal和Xbal之间,以得到载体pRK5tkneo.ORF(一种编码整个开放读框的载体)。
第二种编码EPO同源结构域的载体可用相同的方法制成,但使用不同的PCR引物,最后得到的构建物为pRK5-tkneoEPO-D。
这两种构建物通过CaPO4法转染入人胚胎肾细胞,挑选出新霉素抗性的克隆并使之生长到汇合。在条件培养基中通过Ba/F3-mpl增殖分析来评估这些克隆中ML153或ML332的表达。
rhML332的纯化如实施例19所述。简单来说,将293-rhML332的条件培养基上样于Blue-Sepharose(Pharmacia公司)柱,接着用含2M尿素的缓冲液洗涤。柱的洗脱用含2M尿素和1MNaCl的缓冲液。Blue-Sepharose柱洗脱后的集合体再直接上样于WGA-Sepharose柱,用含2M尿素和1MNaCl的10倍柱体积缓冲液洗涤,洗脱用同样的缓冲液,但含0.5M的N-乙酰-D-葡糖胺。WGA-Sepharose的洗脱物再上样于C4-HPLC柱(Synchrom,Inc.),并以不连续的丙醇梯度来洗脱。通过SDS-PAGE,纯化的293-rhML332在凝胶的68-80千道尔顿区以一个宽带迁移。
rhML153的纯化亦如实施例19所述。简单来说,rhML153的条件培养基如rhML332一样地在Blue-Sepharose柱上分离。Blue-Sepharose柱的洗脱物直接上样于如前文所述的mpl亲和柱。从mpl亲和柱得到的rhML153洗脱物,在与rhML332相同的条件下,用C4-HPLC柱纯化达到均一性。通过SDS-PAGE,纯化的rhML153分离为2个主带和2个次带,分子量约18,000-22,000(见图15)。
10.鼠mpl配体
一个对应于人mpl配体编码区的DNA片段通过PCR而获得、凝胶纯化后用32P-dATP和32P-dCTP标记。这一探针被用来筛选构建于λGT10噬菌体中的鼠肝cDNA文库的106个克隆。一个含有1443个碱基对插入片段的鼠克隆(图16[SEQ ID NOS:12和13])被分离并测序。在核苷酸位置138-141处的假定起始密码子位于真核翻译起始要求的共有序列内(Kozak,M.J.Cell Biol.,108:229-241[1989])。这一序列表明了一个1056个核苷酸的开放读框,预示其能产生主要的长度为352个氨基酸翻译产物。在这个开放读框的两端,有5′端的137个核苷酸和3′端的247个核苷酸的非翻译区。在3′端非翻译区后没有聚腺苷酸尾,表示该克隆可能不完整。预测的氨基酸序列N末端高度疏水可能代表了一个信号肽。计算机分析(von Heijne,G.Eur.J.Biochem.133:17-21[1983])显示,在残基21-22之间有一个信号肽酶的潜在切割断裂位点。在这个位置发生的切割产生一个成熟的331个氨基酸(35千道尔顿)的多肽,称为mML331(由于以下原因也称为mML2)。这一序列有4个半胱氨酸和7个潜在的N-糖基化位点,前者在人的序列中都是保守的,后者中有5个在人的序列中保守。而且,与hML一样,所有7个潜在的N-糖基化位点都位于蛋白质C末端的一半处。
当与人ML相比较时,可以观察到在这些ML的“EPO结构域”中,核苷酸及其推断的氨基酸序列都有很大的相同性。然而,如果将人和鼠ML推断的氨基酸序列排列作比较,可以在鼠序列的111-114残基间发现一个四肽的缺失,对应于在人(见上文)和猪(见下文)cDNA中的核苷酸位置618后的12个核苷酸缺失。相应地,检查其他克隆以检测可能的鼠ML同种型。有一个克隆编码335个氨基酸的推断的多肽,其中含有缺失的四肽LPLQ。这种形式被确信为全长的鼠ML,称为mML或mML335。mML的核苷酸序列及其推断的氨基酸序列见图17(SEQ ID NOS:14和15)。这个cDNA克隆由1443个碱基对构成,后接一个聚腺苷酸尾。它拥有一个1068bp的开放读框,其两侧在5′端和3′端各有134个碱基和241个碱基的非翻译区序列。假定的起始密码子位于核苷酸位置138-140处。开放读框编码356个氨基酸的蛋白质,其中开始的21个高度疏水并有类似分泌信号的功能。
最后,又分离、测序到了第三种克隆,含有对应于bML3的116个核苷酸缺失。这种鼠同种型被定名为mML3。这两种同种型推断的氨基酸序列比较见图18(SEQ ID NOS:9和16)。
人和鼠ML的整个氨基酸序列的相同性为72%(图19[SEQID NOS:6和17]),但这种同源性并不是均匀地分布的。称为“EPO结构域”(人氨基酸序列1-153,鼠氨基酸序列1-149)区域的保守性(同源性86%)要强于蛋白质的羧基末端区域(同源性62%)。这也许进一步表明,只有“EPO结构域”对蛋白质的生物活性是重要的。有趣地,在hML中找到的两个双碱性氨基酸基序中,只有紧接“EPO结构域”的一个双碱性基序(残基位置153-154)在鼠序列中发现。这一现象支持了这样一种可能性:全长的ML也许代表了一个前体蛋白质,经过有限蛋白酶解产生成熟的配体。也有可能,在Arg153-Arg154之间的蛋白酶解有助于分解hML。
如实施例1所述,一个含有mML完整编码序列的表达载体被瞬时转染到293细胞中。这些细胞的条件培养基能刺激3H-胸苷掺入表达鼠或人mpl的Ba/F3细胞。但对亲代(少mpl)细胞系没有效应。这表明,克隆的鼠ML cDNA编码一个能激活鼠和人ML受体的功能性配体(mpl)。
11.猪mpl配体
如实施例13所述,猪ML(pML)cDNA通过RACE PCR分离。已经在肾中发现并亚克隆了一个1342bp的PCR cDNA产物。经过测序,发现有几个克隆能编码一个332个氨基酸残基的猪mpl配体,称为pML或pML332。这些克隆的核苷酸序列及其推导的氨基酸序列如图20(SEQ ID NOS:18和19)所示。
另外,已经鉴定了第二种形式(见图21[SEQ ID NO:21]),称为pML2,它编码的蛋白质有4个氨基酸残基缺失(228个氨基酸残基)。比较pML和pML2可知,除了对应于残基111-114的四肽QLPP缺失外,两种形式完全一样(见图22[SEQ ID NOS:18和21])。在鼠和猪ML cDNA中观察到的4个氨基酸缺失都是精确地发生在假定蛋白质的同一位置。
比较人、鼠和猪的成熟ML假定的氨基酸序列(图19[SEQ IDNOS:6、17和18]),结果显示,在整个序列相同性上,鼠和人之间为72%,鼠和猪之间为68%,而猪和人之间为73%。在ML氨基端的一半处(EPO同源结构域),同源性明显地增大。在以上物种的任何两种之间,这一区域的同源性为80%至84%,而在羧基端的一半处(糖类结构域),相同性仅有57%至67%。在红细胞生成素同源结构域的羧基末端,有一个代表蛋白酶切割位置的双碱性氨基酸基序。这一位置上的该基序在三个物种之间是保守的(图19[SEQ ID NOS:6、17和18])。在人的序列位置245-246处出现的第二个双碱性位点在猪或鼠的序列中没有出现。鼠和猪ML序列有4个半胱氨酸,都保留于人的序列中。在鼠配体和猪ML中,潜在的N-糖基化位点分别有7个和6个,其中5个保留于人的序列中。另外,所有潜在的N-糖基化位点都位于蛋白质羧基端的一半处。
12.中国仓鼠卵巢(CHO)细胞TPO的表达和纯化
用于转染CHO细胞的表达载体称为:pSV15.ID.LL.MLORF(全长或TP0332)和pSV15.ID.LL.MLORF-D(截短的或TP0153)。这些质粒的相关特性见图23和图24。
转染的过程如实施例20所述。简单来说,通过PCR得到对应于TPO整个开放读框的cDNA。PCR产物纯化后克隆入pSV15.ID.LL质粒的两个限制位点(Clal和Sall)之间,从而获得载体pSV15.ID.LL.MLORF。对应于EPO同源结构域的第二种构建物以同样方式产生,但使用不同的反义引物(EPOD.Sal)。编码TPO的EPO同源结构域的载体的最终构建物称为pSV15.ID.LL.MLEPO-D。
这两种构建物以Notl消化使之线性化,并通过电穿孔法转染入中国仓鼠卵巢细胞(CHO-DP12细胞,EP 307,247 1989年3月15日发表)。107个细胞在存在有10、25或50mg DNA时,用BRL电穿孔仪(350伏,330毫法,低电容)作电穿孔,(Andreason,G.L.J.Tissue Cult.Meth.15,56[1993])。转染后第二天,将细胞在DHFR选择培养基(不含甘氨酸的高浓度葡萄糖DMEM-F1250:50、2mM谷氨酰胺、2-5%透析的小牛胚胎血清)中打匀。10至15天后,将单个集落转移到96平板,使之生长至汇合。用Ba/F3-mpl增殖测定来评估来自这些克隆的ML153或ML332在条件培养基中的表达(如实施例1所述)。
从收获的CHO细胞培养液中分离和纯化TPO的步骤见实施例20。简单来说,将收获的CHO细胞培养液(HCCF)上样于Blue-Sepharose柱(Pharmcia公司),上样的比例为每升树脂约100升HCCF。接着,先用3至5倍柱体积的缓冲液洗涤柱,续之以3至5倍柱体积含2.0M尿素的缓冲液洗涤柱。然后,再用3至5倍柱体积含2.0M尿素和1.0MNaCl的缓冲液来洗脱TPO。
将含TPO的Blue-Sepharose洗脱集合物上样于Wheat Germ(麦胚)凝集素-Sepharose柱(Pharmacia公司),按每毫升树脂8至16毫升Blue-Sepharose洗脱液的比例用Blue-Sepharose洗脱缓冲液来平衡柱。柱的洗涤用2至3倍柱体积的平衡缓冲液。TPO的洗脱采用2至5倍柱体积含2.0M尿素和0.5M N-乙酰-D-葡糖胺的缓冲液。
随后,将含TPO的麦胚凝集素洗脱物酸化,并加入C12E8使终浓度为0.04%。再将得到的溶液上样于C4反相柱,用0.1%TFA、0.04%C12E8平衡,装载量为每毫升树脂约0.2至0.5mg蛋白质。
在含0.1%TFA和0.04%C12E8的乙腈双相线性梯度中洗脱蛋白质,并经SDS-PAGE后获得一种集合物。
然后,将C4中的集合物稀释,并在能使之截断为10,000至30,000道尔顿分子量的Amicon YM之类的超滤膜上用6倍体积的缓冲液透滤。得到的透滤液可直接用于以后的操作或经超滤进一步地浓缩。通常,透滤/浓缩液用终浓度为0.01%吐温-80来调节。
接着,将相当于柱体积2%至5%的全部或部分透滤/浓缩液上样于Sephacryl S-300HR柱(Pharmacia公司),平衡用含0.01%吐温-80的缓冲液,然后进行色谱。不含聚合物和蛋白酶解的降解产物的TPO组分随后经SDS-PAGE后获得集合物。得到的集合物经过滤后保存于2-8℃。
13.在微生物中转化和诱导TPO合成的方法以及从中分离、纯化和重折叠合成的TPO
大肠杆菌TPO表达载体的构建在实施例21中有详细的描述。简单来说,设计质粒pMP21、pMP151、pMP41、pMP57和pMP202来表达一个短引导序列下游的TPO前155个氨基酸,该引导序列因不同的构建物而有差异。这个引导序列主要提供高水平的翻译起始和快速纯化。又设计了质粒pMP210-1、-T8、-21、-22、-24、-25来表达TPO起始甲硫氨酸下游的前153个氨基酸,这些质粒的不同仅仅在于针对TPO前6个氨基酸的密码子的使用。pMP210-1中TPO的羧基末端延伸两个氨基酸后,得到pMP251。在色氨酸启动子的诱导下,上述的所有质粒将在大肠杆菌中产生高水平的细胞内TPO表达(Yansura,D.G.等,Methods in Enzymology[Goedded,D.V.,编辑]185:54-60,Academic Press,SanDiego[1990])。质粒pMP1和pMP172是上述TPO细胞内表达质粒构建中的过渡物。
通过CaCl2热休克法,将上述TPO表达质粒转化大肠杆菌(Mandel,M.等,J.Mol.Biol.,53:159-162,[1970]),其他转化过程的描述见实施例21。简单来说,首先将转化细胞在37℃中培养直至培养物光密度达到约2-3。稀释培养物,并在通气条件下生长后,加入酸。然后,让培养物继续在通气条件下生长15小时后,离心法收集细胞。
实施例22和实施例23描述了产生生物活性的、重折叠的人TPO及其片段的分离、纯化和重折叠步骤;这些方法可应用于包括N末端和C末端延伸形式在内的任何TPO变异体的回收。其他适合于重折叠重组体或合成的TPO的步骤可参见下列专利:Builder等,U.S.专利号4,511,502;Jones等,U.S.专利号4,512,922;Olson,U.S.专利号4,518,526和Builder等,U.S.专利号4,620,948;其中大致叙述了以不溶性形式表达于大肠杆菌中的大量重组蛋白的回收和重折叠方法。
A.不溶性TPO的回收
将能表达由任何合适质粒编码的TPO的微生物如大肠杆菌,在一定条件下发酵,要求TPO能够以不溶性的“折射体”沉泥。可选择地首先用细胞裂解缓冲液洗涤细胞。通常,用Polytron匀浆器将约100克的细胞重悬于10倍体积的细胞裂解缓冲液中(如10mMTris、5mM EDTA,pH8),并以5000×g、30分钟的条件离心细胞。然后,使用诸如张力休克、超声处理、压力循环、化学或酶法等常规技术裂解细胞。例如,上述经洗涤的细胞沉淀物可通过匀浆器重悬于10倍体积的另一种细胞裂解缓冲液中,并根据制造商的说明将细胞悬浮液流经LH Cell Disrupter(LH Inceltech公司)或Microflu-idizer(Microfluidics International公司)。含TPO的颗粒物从液相中被分离出来,并可选择地以任何合适的液体洗涤。例如,一种细胞解裂物的悬浮液可以5,000g离心30分钟,重悬后可选择地进行第二次离心,最后得到经洗涤的折射体沉淀。这些经过洗涤的沉淀可立即使用或冰冻保存(如-70℃)。
B.单体TPO的增溶和纯化
折射体沉淀中不溶性TPO用增溶缓冲液来增溶。增溶缓冲液含有离液剂,通常在碱性pH下起缓冲作用,并含有能提高单体TPO产量的还原剂。代表性的离液剂有:尿素、盐酸胍和硫氰酸钠。而优选的离液剂为盐酸胍。离剂的浓度通常为4-9M,优选地为6-8M。增溶缓冲液的pH值由合适的缓冲液维持在7.5-9.5范围内,优选地为8.0-9.0,最为优选地为8.0。优选的增溶缓冲液中还含有还原剂以帮助形成TPO的单体形式。合适的还原剂包括游离的巯基(RSH)等有机化合物。代表性的还原剂包括二硫苏糖醇(DTT)、二硫赤藓糖醇(DTE)、巯基乙醇、谷胱甘肽(GSH)、半胱胺和半胱氨酸。优选的还原剂是二硫苏糖醇(DTT)。可选择地,增溶缓冲液可包含一种温和的氧化剂(如氧分子)和一种亚硫酸盐以通过亚硫酸化形成单体TPO。在这个例子中,得到的TPO-S-磺酸盐以后又在氧化还原缓冲液(如GSH/GSSG)中重折叠以形成合适的折叠TPO。
TPO蛋白质需要进一步纯化,通常的方法如离心、凝胶过滤色谱和反相柱色谱。
以举例的方法,通过下列步骤能得到合适产量的单体TPO。将折射体沉淀重悬于约5倍体积的增溶缓冲液(20mM Tris,pH8,6-8M胍和25mM DTT)中,搅拌1-3小时或4℃过夜,使TPO蛋白质增溶。也可以用高浓度的尿素(6-8M),但与胍相比,产量要低一些。增溶后,溶液在30,000×g离心30分钟,得到含变性单体TPO的透明上清液。然后,将上清液在Superdex 200凝胶柱(Phar-macia公司,2.6×60cm)上进行色谱,设定流速为2毫升/分钟。蛋白质的洗脱条件为,20mM磷酸钠pH6.0、10mMDTT。合并收集含变性单体TPO蛋白质洗脱液160至200毫升之间的组分。TPO蛋白质在半制备的反相柱(2×20cm VYDAC)上进一步纯化。样品以5毫升/分钟上样,柱的平衡用含30%乙腈的0.1%TFA(三氟乙酸)。蛋白质的洗脱采用乙腈的线性梯度(在60分钟内,从30%到60%)。纯化的还原性蛋白质在浓度约为50%乙腈时被洗脱下来。洗脱物用于重折叠以得到具有生物活性的TPO变异体。
C.重折叠TPO以产生生物活性形式
TPO增溶和进一步纯化之后,就要通过变性单体TPO在氧化还原缓冲液中的重折叠来得到生物活性形式。由于TPO的高效价(约3pg/ml时,能在Ba/F3测定中达到最大刺激作用的一半),通过多种不同的缓冲液、去垢剂和氧化还原条件得到生物活性物质是可能的。但是,在大多数情况下,只能得到少量合适的折叠物质(<10%)。用制造商推荐的程序,希望得到的重折叠产物至少为10%,达到30%-50%更好,达到50%以上则最佳。已经发现的至少能产生一定量合适折叠产物的去垢剂有很多:Triton X-100、十二烷基-β-麦芽糖、CHAPS、CHAPSO、SDS、sarkosyl、吐温20、吐温80、Zwittergent及其他。但其中最为优选的去垢剂都属于CHAPS家族(CHAPS和CHAPSO),CHAOS家族去垢剂在重折叠反应中的效果最佳并能限制蛋白质聚集和不适当的二硫键形成。CHAPS最为优选的浓度是大于1%。为得到最高产量,需要最适浓度0.1至0.5M的氯化钠。为了限制在一些制备物中发现的由金属催化的氧化作用(和聚集作用),可在氧化还原缓冲液中加入EDTA(1-5mM)。最适的重折叠条件需要浓度大于15%的甘油。为了得到最高产量,还必须在氧化还原缓冲液中含有一个由氧化和还原有机巯基(RSH)构成的氧化还原对。合适的氧化还原对有:巯基乙醇、谷胱甘肽(GSH)、半胱胺、半胱氨酸以及它们相应的氧化形式。优选的氧化还原对是谷胱甘肽(GSH):氧化谷胱甘肽(GSSH)或半胱胺:半胱氨酸。而最为优选的氧化还原对为谷胱甘肽(GSH):氧化谷胱甘肽(GSSH)。通常,当氧化还原对中氧化物的摩尔比等于或大于还原物时,可以得到更高的产量。这些TPO变异体重折叠的最适pH值在7.5和约9之间。有机溶剂(如乙醇、乙腈,甲醇)的耐受浓度为10-15%或更低。更高浓度的有机溶剂增加了不合适折叠形式的量。Tris和巯酸盐缓冲液通常能起作用。4℃温育也能增加TPO合适折叠的量。
经过第一个C4步骤纯化后,TPO的重折叠产量通常为40-60%(根据用于重折叠反应的还原和变性TPO的量)。虽然因为大量沉淀和在TPO重折叠过程中非TPO蛋白质的干扰产量会减少,但当制备物纯化度较低(例如:直接在Superdex 200柱或最初的折射体抽提之后)时,能够得到活性物质。
因为TPO含有4个半胱氨酸残基,这种个蛋白质可能形成3种不同的二硫键形式:
形式1:二硫键位于半胱氨酸残基1-4和2-3之间
形式2:二硫键位于半胱氨酸残基1-2和3-4之间
形式3:二硫键位于半胱氨酸残基1-3和2-4之间。
在确定重折叠条件的最初实验中,通过C4反相柱色谱得到了几个不同的含TPO蛋白质的峰。在这些峰中,只有一个在Ba/F3测定中表现出明显的生物活性。随后,优化重折叠条件以优先产生这一形式。在这些条件下,从增溶步骤得到的所有单体TPO的错折叠形式低于10-20%。
使用质谱法和蛋白质测序(从氨基末端起,依此给半胱氨酸编号),确定了具有生物活性TPO的二硫键形式为1-4和2-3。这种半胱氨酸的交联形式同已知的相关红细胞生成素分子的二硫键形式一致。
D.重组体、重折叠TPO的生物活性
在体和离体测定中,重折叠并纯化的TPO都有活性。例如在Ba/F3测定中,3.3pg/ml(0.3pm)的TPO(Met-11-153)对胸苷掺入Ba/F3细胞的刺激作用达到最大值的一半。在基于mpl受体的酶联免疫吸附测定(ELISA)中,浓度为1.9ng/ml(120pM)时,活性达到最大值的一半。在正常动物和经过近致死X射线处理的骨髓抑制动物中,重折叠TPO(Met-11-153)高效地刺激新血小板生成(在剂量低达30ng/鼠时,可观察到活性)。经上述步骤重折叠后的TPO的其他形式中,也可以观察到类似的生物活性。
14.测量血小板生成素活性的方法
血小板活性的测量可通过多种方法,例如实施例1所述的Ba/F3mpl配体测定、体内血小板回跳合成测定、以针对人白血病成巨核细胞系(CMK)的抗血小板免疫(抗GPIIbIIIa)测定的血小板细胞表面抗原的诱导测定(参见Sato等,Brit.J.Heamatol.,72:184-190[1989])(亦参见实施例4所述液体悬浮液巨噬细胞生成测定)以及成巨核细胞系(DAMI)中的多倍体化的诱导(参见Ogura等,Blood(1),72:49-60[1988])。从未成熟的、大多没有DNA合成的巨噬细胞成熟为形态可鉴别的巨噬细胞的过程包括:胞质内出现细胞器,获取膜抗原(GPIIbIIIa)及如发明背景中所述的核内复制及释放血小板。需要一个谱系特异的成熟巨核细胞的启动子(如mpl配体)来诱导未成熟巨噬细胞在成熟过程中的至少一部分这样的变化,从而导致释放血小板及缓和血小板减少。因此,已经设计了一些实验来检测未成熟的巨噬细胞系即CMK和DAMI细胞中这些参数的出现。CMK测定(实施例4)检测特异血小板标记GPIIbIIIa以及血小板释放的出现。DAMI测定(实施例15)则检测核内复制,因为倍性的增加是巨噬细胞成熟的标志。可识别的巨噬细胞有2N、4N、8N、16N、32N等倍数值。最后,体内鼠血小板回跳测定(实施例16)可用来证明,施用测试化合物(此处是mpl配体)将导致血小板数的增加。
另外又发展了两种离体测定法来检测TPO活性。第一种是激酶受体激活(KIRA)酶联免疫吸附测定,其中用mpl-Rse嵌合体转染CHO细胞并在将嵌合体的mpl部分暴露于mpl配体以后,用酶联免疫吸附测定检测Rse的酪氨酸磷酸化(参见实施例17)。第二种是基于受体的酶联免疫吸附测定,其中用包被兔抗人IgG的酶联免疫吸附测定板来捕获与待测mpl配体结合的人嵌合受体mpl-IgG。mpl配体的一个生物素标记的免多克隆抗体被用来检测结合的mpl配体,并以实施例18所述链霉抗生物素蛋白-过氧化物酶来测定。
15.用TPO处理的正常鼠和经亚致死辐射的鼠的体内生物反应
正常鼠和经亚致死辐射的鼠都用截短的和全长的TPO来处理,其中TPO从中国仓鼠卵巢(CHO)细胞、大肠杆菌和人胚肾细胞(293)中分离。从这三种宿主中得到的TPO两种形式都能刺激鼠的血小板生成,但是,分离自CHO的全长TPO表现出了最强的体内反应。这些结果表明,最适的体内活性可能需要在羧基末端结构域进行合适的糖基化。
(a)大肠杆菌-rhTPO(Met-1,153)
每天,将大肠杆菌(参见实施例23)产生的EPO结构域的“Met”形式(-1位置的甲硫氨酸加上人TPO的前153个残基)注射入正常的雌性C57 B6鼠,方法如图25A、25B和25C的说明。这些图显示,由大肠杆菌产生并以上述方法重折叠的TPO未糖基化截短形式能够刺激正常鼠中血小板数量增加2倍,而不影响红细胞和白细胞的数量。
如图26A、26B和26C的说明,每天将同样的分子注射入亚致死辐射(137Cs)的雌性C57 B6鼠,可刺激血小板的回复以及提高水平,但对红细胞或白细胞没有效应。
(b)CHO-rhTPO332
如27A、27B和27C的说明,每天将由CHO产生的TPO全长形式注射入雌性C57 B6鼠,能够使正常鼠的血小板数量增加5倍,但对红细胞和白细胞球的数量没有效应。
(c)CHO-rhTPO332;大肠杆菌-rhTPO(Met-1,153);293-rhTPO332和大肠杆菌-rhTPO155
如图28的说明,用rhTPO处理正常鼠构建剂量反应曲线,其中rhTPO来自不同细胞系(CHO-rhTPO332;大肠杆菌-rhTPO(Met-1,153);293-rhTPO332;和大肠杆菌-rhTPO155)。这个图显示,这种分子的所有受测形式都能刺激血小板的生成,但CHO产生的全长形式具有最强的体内活性。
(d)CHO-rhTPO153;CHO-rhTPO“截短的”和CHO-rhT-PO332
同样,如图29的说明,用CHO(CHO-rhTPO153;CHO-rhT-PO“截短的”和CHO-rhTPO332)产生的多种形式的rhTPO处理正常鼠构建剂量反应曲线。这个图显示,该分子的所有受测CHO形式都刺激血小板的生成,但全长的70千道尔顿形式有最强的体内活性。
16.mpl配体及变异体的一般重组制备
优先采用标准重组程序制备mpl配体:培养用表达mpl配体的核酸转染(一般用一种表达载体转化细胞)的细胞,产生mpl配体多肽,从细胞中回收多肽。但是,也可认为,mpl配体的产生是通过同源重组或者重组产生方法,其中后者是将控制元件引入已经含编码mpl配体的DNA的细胞。例如,可将一个强启动子/增强子元件、抑制基因、或外源转录调节元件插入到指定宿主细胞的基因组,插入位置的邻近和方向足以影响编码所需mpl配体多肽的DNA的转录。控制元件不编码mpl配体,而该DNA是宿主细胞原有的。接着,可以根据需要进行筛选以得到产生本发明的受体多肽的细胞,或者得到表达水平增强或减低的细胞。
因此,本发明期待一种产生mpl配体的方法,要求该方法能将一个转录调节元件插入含mpl配体核酸分子的细胞基因组,插入位置的足够邻近和方向对该核酸分子的转录有影响。或者更进一步的步骤还应该包括培养含有转录调节元件和核酸分子的细胞。本发明还期待一种宿主细胞,其中含有的内源mpl配体核酸分子可操作地与被宿主细胞识别的外源控制序列结合。
A.编码mpl配体多肽的DNA的分离
编码mpl配体多肽的DNA可以从任何cDNA文库中得到,该cDNA文库的制备是来自确信含有mpl配体mRNA并能以可检测水平表达的组织。mpl配体基因也可以从某个基因组DNA文库或者通过完整核苷酸或氨基酸序列的体外寡核苷酸合成而获得。
用设计好的探针筛选文库,以获得目标基因及其编码的蛋白质。对于cDNA表达文库,合适的探针包括能识别和特异性结合mpl配体的单克隆或多克隆抗体。对于cDNA文库,合适的探针包括长度约20-80个碱基的寡核苷酸,能编码来自相同或不同物种的mpl配体cDNA的已知或未知部分;也包括编码相同或相似基因的互补或同源cDNA或其片段。筛选基因组DNA文库的合适探针包括(但不限于)编码相同或相似基因的寡核苷酸、cDNA或它们的片段和/或同源基因组DNA或其片段。Sambrook等(同上)的10-12章中所述的标准程序可作为用选定的探针筛选cDNA或基因组文库的指导。
分离编码mpl配体基因的另一个方法是PCR,如Sambrook等(同上)第14部分所述。这个方法需要使用能够与编码mpl配体的DNA杂交的寡核苷酸探针。选择寡核苷酸的策略如下所述。
实践本发明的一个优选方法是,用精心选择的寡核苷酸序列筛选来自多种组织的cDNA文库,较佳地那些组织是人或猪肾(成体或胚胎)或者肝细胞系。例如,人胚肝细胞系cDNA文库用寡核苷酸探针筛选。或者,人基因组文库用寡核苷酸探针筛选。
被选作探针的寡核苷酸序列应有足够的长度,并且要有足够的精确性使假阳性达到最小。通常,实际使用的核苷酸序列是根据mpl配体密码子丰余性最小的区域设计。该寡核苷酸可能在一个或几个位置呈简并性。对于从一个优选的密码子使用是未知的物种中筛选文库来说,简并性寡核苷酸的使用是极其重要的。
该寡核苷酸必须被标记,从而使它能够在与被筛选文库的DNA杂交时被检测出来。标记的优选方法是用ATP(如γ32P)和多聚核苷酸激酶放射性标记寡核苷酸的5′末端。但是,其他方法也可用于标记寡核苷酸,包括(但不限于)生物素或酶标记。
最令人感兴趣的是能编码全长mpl配体多肽的mpl配体核酸。在一些优选例子中,其核酸序列包括了天然mpl配体信号序列。使用推导的氨基酸序列筛选选择的cDNA或基因组文库,可以得到具有所有蛋白质编码序列的核酸。
B.天然mpl配体的氨基酸序列变异体
mpl配体的氨基酸序列变异体的制备方法为:将适当的核苷酸变化引入mpl配体DNA中或通过所需mpl配体多肽的体外合成。例如这类变异体包括猪mpl配体氨基酸序列中残基的缺失、插入或置换。例如可通过在体或离体的蛋白酶解切割作用或者通过克隆并表达一个片段或编码全长mpl配体的DNA来去除成熟全长mpl配体的羧基末端部分,从而得到一个具有生物活性的变异体。只要最终的构建物有所需的生物活性,因此可将缺失、插入和置换任意组合来形成最终的构建物。氨基酸的变化也许还能改变mpl配体的转译后加工过程,例如改变糖基化位点的数量和位置。对于mpl配体氨基酸序列变异体的设计,突变位点和突变性质由将要被改变的mpl配体特性决定。突变位点的改变可每次一个或每次一系列,例如(1)根据需要达到的效果,首先保守地、然后更激进地作出选择来置换;(2)去除靶残基;(3)在指定的位点附近插入同类或不同类的残基,或者将选择1-3的组合。
如Cunningham和Wells,Science,在244:1081-1085[1989]中所述,“丙氨酸扫描诱变”是确定mpl配体多肽的某些残基或区域为诱变的优选位置的一个有用方法。在这里,可以确定一个残基或一组靶残基(如精氨酸、天冬氨酸、组氨酸、赖氨酸和谷氨酸等带电残基)并可被任何氨基酸替换(最好是丙氨酸或聚丙氨酸),但如以中性或带负电荷的氨基酸替换也较好。替换的结果影响了氨基酸与细胞内或细胞外的周围水溶液环境的相互作用。对置换产生功能性敏感这些结构域,可通过在置换位点引入进一步的其他变异来将其精制。因此,当预先决定引入一个氨基酸序列变异的位点时,则突变本身的性质不需要被预定。例如,为了在某个指定位点优化突变行为,在靶密码子或靶区域处实施丙氨酸扫描或随机诱变并筛选出表达的mpl配体变异体以获得所需活性的最佳组合。
在构建氨基酸序列变异体中,有两个主要的变项:突变位点的定位以及突变的性质。例如,mpl配体多肽的变异体包括mpl配体序列的变异体,并可能代表了自然形成的等位基因(不需要mpl配体DNA的操作)或预定的突变体形式(将DNA突变成自然界中未发现的等位基因或变异体)。通常,突变的位置和性质根据待修饰的mpl配体特性来选择。
氨基酸序列缺失通常有约1-30个残基,约1-10个残基更好,而且残基的缺失一般是连续的。或者,mpl配体的氨基酸序列缺失可能包括羧基末端糖基化结构域的一部分或全部。氨基酸序列的缺失也可能包括成熟蛋白质的最初6个氨基末端残基中的一个或几个。可选择的氨基酸缺失包含存在于“螺旋束”之间的一个或多个环区域中的一个或多个残基。连续的缺失通常为偶数残基,但单个或奇数残基的缺失也属于这一范畴。在具有绝大部分序列一致性的mpl配体之间的低同源区可引入缺失以修饰mpl配体的活性。或者,在人mpl配体和具有与人mpl配体绝大部分序列一致性的其他哺乳动物mpl配体多肽之间的低同源区,也可引入缺失。在与另一哺乳动物mpl配体基本同源的某个哺乳动物mpl配体多肽区域引入缺失,更可能使该mpl配体的生物活性发生更显著的变化。要选择好连续缺失的残基数目,以维持mpl配体效应结构域中的三级结构,如β折叠或α螺旋。
氨基酸序列的插入包括氨基和/或羧基末端的融合,其长度可以从一个残基到一百个甚至更多残基的多肽;同时也包括了单个或多个氨基酸残基的序列内插入。序列内插入(即成熟mpl配体序列内的插入)一般有约1至10个残基,1至5个残基更好,最好有1至3个残基。一个典型的融合发生在mpl配体或其片段与另一个细胞因子或其片段之间。末端插入的例子包括具有一个N-末端甲硫氨酰的成熟mpl配体、在重组细胞培养物中成熟mpl配体直接表达的人工构建物以及一个异源N-末端信号序列与成熟mpl配体分子N-末端的融合,后者可促进重组宿主分泌成熟的mpl配体。这种信号序列通常来自指定的宿主细胞种类,并与之同源。合适的序列包括大肠杆菌的STII或Ipp、酵母的α因子和病毒信号如哺乳动物细胞的疱疹gD。
其他mpl配体分子的插入变异体包括mpl配体N-末端或C-末端与具有免疫原性的多肽的融合体(即施用的融合体对宿主而言是外源的),免疫原性多肽有细菌多肽如β乳糖酶或大肠杆菌trp基因座编码的酶或酵母蛋白;还包括半衰期长的蛋白质与C末端的融合体,前者如免疫球蛋白恒定区(或其他免疫球蛋白区)、白蛋白或铁蛋白,参见1989年4月6日发表的WO89/02922。
第三类变异体是氨基酸置换变异体。这些变异体中,至少有一个mpl配体分子的氨基酸残基被去除并在原处插入一个不同的残基。置换诱变最感兴趣的位点包括确认是mpl配体活性位点的部位和下述部位。在这样的部位中,由于侧链的体积、带电或疏水性,与其他类似物中的氨基酸基本不同;但对于选定的位点而言,多种mpl配体种类和/或某个mpl配体成员在多种动物的类似物之间,也存在高度的序列同一性。
在其他感兴趣的位点中,来自多种家族成员或动物种类的mpl配体的特定残基完全相同。这些位点以相对保守的方式进行置换,尤其是那些处于至少含有3个其他完全相同的保守位点的序列部位。这样的保守置换参见表3中标题为优选置换的部分。如果这样的置换导致生物活性的变化,那么将引入更多实质性的变化并筛选出产物,这些实质性变化参见表3中典型置换部分或参考以下对氨基酸类型的进一步描述。
                表3
原来的残基    典型的置换          优选的置换
Ala(A)    Val;Leu;Ile           Val
Arg(R)    Lys;Gln;Asn           Lys
Asn(N)    Gln;His;Lys;Arg      Gln
Asp(D)    Glu                     Glu
Cys(C)    Ser                     Ser
Gln(Q)    Asn                     Asn
Glu(E)    Asp                     Asp
Gly(G)    Pro                     Pro
His(H)    Asn;Gln;Lys;Arg      Arg
Ile(I)    Leu;Val;Met;Ala;Phe;
          正亮氨酸                Leu
Leu(L)    亮氨酸;Ile;Val;
          Met;Ala;Phe           Ile
Lys(K)    Arg;Gln;Asn           Arg
Met(M)    Leu;Phe;Ile           Leu
Phe(F)    Leu;Val;Ile;Ala      Leu
Pro(P)    Gly                     Gly
Ser(S)    Thr                     Thr
Thr(T)    Ser                     Ser
Trp(W)    Tyr                     Tyr
Tyr(Y)    Trp;Phe;Thr;Ser      Phe
Val(V)    Ile;Leu;Met;Phe;
          Ala正亮氨酸             Leu
mpl配体功能或免疫一致性的基本修饰作用通过选择置换来完成,这些置换根据其维持下列情况的效应而有显著的差异:(a)置换区域中多肽主链的结构,例如一个折叠或螺旋构象,(b)靶位点处分子的带电性或疏水性,或(c)侧链的体积。根据一般的侧链特性,天然形成的残基被分成以下类型:
(1)疏水性:正亮氨酸、甲硫氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸
(2)中性亲水性:半胱氨酸、丝氨酸、苏氨酸
(3)酸性:天门冬氨酸、谷氨酸
(4)碱性:天门冬酰胺、谷氨酰胺、组氨酸、赖氨酸、精氨酸
(5)影响链方向的残基:甘氨酸、脯氨酸
(6)芳香族:色氨酸、酪氨酸、苯丙氨酸
非保守的置换必须是由上述类型中的一个残基替换另一个类型中的残基。这样的置换残基也可被引入保守性置换位点或较佳地引入保留的(非保守性)位点。
在本发明的一个例子中,希望能使分子中存在的一个或多个蛋白酶切割位点失活。这些位点通过检查编码的氨基酸序列来确定,例如对于胰蛋白酶,就要寻找赖氨酸或精氨酸残基。在确定了蛋白酶切割位点以后,就通过以下方法使它们对蛋白酶切割没有作用:靶残基的置换,用于置换的残基最好是碱性残基如谷氨酰胺或疏水性残基如丝氨酸;去除该残基;或者紧接该残基后插入一个脯氨酸。
在另一例了中,除了信号序列的起始甲硫氨酸残基以外的任何甲硫氨酸残基以及位于每一该甲硫氨酸残基N-末端或C-末端约3个残基以内的任何残基都被另一个残基置换(最好依照表3)或被去除。或者,在该位点附近插入约1至3个残基。
任何涉及维持mpl配体适当构象的半胱氨酸残基也可以被置换,以提高分子的氧化稳定性和防止异常的交联,用于置换的残基通常为丝氨酸。已经发现,从氨基末端起的epo结构域中第一个和第四个半胱氨酸对于维持适当的构象是必需的,但第二个和第三个非必需。相应地,epo结构域中第二个和第三个半胱氨酸可以被置换。
编码mpl配体变异体的核酸分子可以用本领域已知的多种方法制备。这些方法包括(但不限于)从自然来源分离(对于自然形成的氨基酸序列变异体)或以寡核苷酸介导的(或定位)诱变来制备、PCR诱变、以及对mpl配体多肽的一个已制备的变异体或非变异体形式进行盒式诱变。
寡核苷酸介导的诱变是制备mpl配体DNA的置换、缺失和插入变异体的一个优选方法。参见Adelman等,DNA,2:183[1983],这一技术已经广为人知。简单来说,通过将编码所需突变的寡核苷酸与一个DNA模板杂交使mpl配体DNA发生变化,模板是含有mpl配体的未变或天然DNA序列的质粒或噬菌体的单链形式。杂交之后,使用DNA聚合酶合成完整的互补于模板的第二条链,由此,该链可以掺入寡核苷酸引物,并为mpl配体DNA中选定的变化而进行编码。
通常,要使用长度至少有25个核苷酸的寡核苷酸。最适的寡核苷酸有12至15个核苷酸,并且在编码突变的核苷酸两边,都与模板完全互补。这就确保了该寡核苷酸能与单链DNA模板分子正确地杂交。该寡核苷酸可以使用本领域上已知的技术容易地合成,参见Crea等,Proc.Natl.Acad.Sci.USA,75:5765[1978]。
DNA模板由载体产生,这些载体可以是噬菌体M13载体的衍生物(商购的M13mp18和M13mp19是合适的载体),也可以是经过复制得到的单链噬菌体,参见Viera等,Meth.Enzymol.,153:3[1987]。因此,可将需要突变的DNA插入上述一种载体中,从而产生单链模板。单链模板的产生参见Sambrook等,MolecularCloning:A Laboratory Manual(Cold Spring Harbor LaboratoryPress,NY 1989)中4.21-4.41部分。
或者,单链DNA模板可以用标准技术通过变性双链质粒或其他DNA而得到。
在合适的杂交条件下,将寡核苷酸杂交于单链模板可使天然的DNA序列发生变化(如产生氨基酸序列变异体)。然后,加入某种DNA聚合酶,通常是DNA聚合酶I的Klenow片段,合成模板的互补链,而该寡核苷酸则作为合成的引物。于是,就形成了一个异源双链分子,其中一条DNA链编码mpl配体的突变形式,另一条链(原始模板)则编码mpl配体的天然的、未变序列。再将该异源双链分子转化到合适的宿主细胞,通常是原核细胞如大肠杆菌JM101。细胞经过生长以后,将其涂布于琼脂糖平板,并用32P放射性标记的寡核苷酸引物进行筛选,以鉴定含有突变DNA的菌落。将突变区去除并置入合适的产生蛋白质的载体,通常这类表达载体用作转化合适的宿主。
可将上述方法加以修饰,以产生同源双链分子即质粒的两条链都含有突变。修饰的方式如下所述。将单链寡核苷酸与上述的单链模板一起退火。将脱氧腺苷三磷酸(dATP)、脱氧胸苷三磷酸(dTTP)、脱氧鸟苷三磷酸(dGTP)这三种脱氧核苷酸的混合物与被称为dCTP-(aS)的硫代脱氧胞苷三磷酸(可从Amersham公司获得)相结合。将混合物加入模板-寡核苷酸复合物。在得到的混合物中加入DNA聚合酶以后,就得到了与模板相同的一条DNA链,其中突变碱基除外。另外,在新合成的DNA链中,dCTP-(aS)代替了dCTP,保护其不受限制性内切酶的消化。
使用合适的限制酶在该异源双链的模板链上产生一个缺口,然后,用ExoIII核酸酶或其他不作用于突变位点区域的合适的核酸酶将模板链消化。反应终止后,得到一个部分单链的分子。在加入所有4种脱氧核苷三磷酸、ATP和DNA连接酶以后,使用DNA聚合酶以合成完整的DNA同源双链分子。如上所述,该同源双链分子可被转化入合适的宿主细胞如大肠杆菌JM101。
编码一个以上氨基酸置换的mpl配体突变体的DNA可由几种方法中的某一个来产生。如果置换的氨基酸在多肽链上的位置彼此较近,可以用一个寡核苷酸将它们同时突变,只要该寡核苷酸能编码所有预想被置换的氨基酸。但是,如果这些氨基酸的位置彼此有一定距离(被多于10个氨基酸分开),产生单个能编码所有预想变化的寡核苷酸就更困难。可使用下述两个变通方法中的一个来解决。
第一个方法,产生一个分离的寡核苷酸来对应每一个被置换的氨基酸。将该寡核苷酸与单链模板DNA一起退火,从模板合成的第二条DNA可编码所有预想的氨基酸置换。
第二种方法需要两次或更多的诱变循环以得到预想的突变体。第一次循环过程与上述单突变型相同:野生型DNA作为模板,编码第一个预想氨基酸置换的寡核苷酸与模板一起退火,然后产生异源双链DNA分子。诱变的第二次循环将第一次诱变循环产生的突变DNA作为模板。所以,该模板已经含有一个或多个突变。然后,将编码其他预想氨基酸置换的寡核苷酸与该模板一起退火,于是就得到了一条DNA链能够编码第一次和第二次诱变循环中的突变。这样得到的DNA就可以在第三次循环中作为模板,如此等等。
PCR诱变也适用于产生mpl配体多肽的氨基酸变异体。虽然以下讨论仅指DNA,但应理解该技术同样适用于RNA。PCR技术通常包括以下程序(参见Erlich,同上R.Higuchi所著章节的61至70页):PCR中以少量模板DNA作为起始物质,使用与模板DNA相应区域的序列有轻微差异的引物,能够产生相对大量的特异DNA片段,其序列仅在引物与模板不同的位置与模板有差异。为了将突变引入一个质粒DNA,需要设计一个引物与突变位置重叠并含有该突变;另一个引物的序列必须与质粒互补链的一部分序列完全相同,但该序列可以定位于质粒DNA上的任何位置。但是,第二个引物的序列最好定位于距离第一个引物序列200个核苷酸以内,这样可使最后得到的与引物连接的整个DNA扩增区域能够容易地被测序。正如上文所述,PCR扩增使用一对引物来产生大量的某个DNA片段,该DNA片段的差异可能在引物中特异的突变位置,也有可能在其他位置,因为模板的复制有时产生易错。
如果模板与产物比率非常低,则绝大部分产生的DNA片段掺入了预想的突变。使用标准DNA技术,可将该产物替代作为PCR模板的质粒上的相应区域。在分开位置上的突变可同时引入,引入方法可以是使用一个突变型的第二种引物,也可以是用不同的突变型引物作第二次PCR并通过三步(或更多)连接反应将得到的两个PCR片段同时连接于载体片段。
在PCR诱变的一个特殊例子中,模板质粒DNA(1微克)经限制性内切酶的消化作用而线性化,该限制性内切酶在质粒DNA被扩增区域以外的部分只有单一的识别位点。将100纳克该产物加入含PCR缓冲液的PCR混合物中,在终体积为50微升的PCR混合物中,有GeneAmp配套试剂中(来自Perkin-Elmer Cetus公司,Norwalk,CT和Emeryville,CA)的四种脱氧核苷三磷酸和两种寡核苷酸引物各25皮摩尔。用35微升矿物油覆盖反应混合物。反应混合物在100℃变性5分钟后,放置冰上并在矿物油层下加入1微升栖热水生菌(Taq)DNA聚合酶(每微升5单位,购自Perkin-Elmer Cetus公司)。然后,将反应混合物置于DNA Thermal Cycler仪(购自Perkin-Elmer Cetus公司)中,如下设置程序:
2分钟,55℃
30秒,72℃,然后是以下步骤的19个循环:
30秒,94℃
30秒,55℃和
30秒,72℃。
在以上程序结束以后,反应小瓶取出thermal cycler仪,将水相转移到新的小瓶中,酚/氯仿抽提(体积50∶50),乙醇沉淀,并按标准程序回收DNA。接着,对该产物作适当的处理使之插入载体。
盒式诱变是另一种制备变异体的方法,其技术依据参见Wells等,Gene,34:315[1985]。起始物质为含有将要被突变的mpl配体DNA的质粒(或其他载体)。在mpl配体DNA中,将要被突变的密码子是确定的。在确定的突变位点的每一侧都必须有单一的限制性内切酶位点。如果这样的限制性位点不存在,可使用上述寡核苷酸介导的诱变方法将其引入到mpl配体DNA的合适位置。将限制性位点引入到质粒以后,在这些位点切割质粒使之线性化。用标准程序合成能编码限制性位点之间DNA序列但含有预定突变的双链寡核苷酸。两条链分别合成,并以标准技术使之杂交。该双链寡核苷酸被称为盒。这个盒被设计成含有与线性化质粒末端相容的3′端和5′端,使之能直接与质粒连接。此时,该质粒已经含有mpl配体DNA序列。
C.可复制载体中核酸的插入
将编码天然或变异mpl配体多肽的核酸(如cDNA或基因组DNA)插入可复制的载体用于进一步的克隆(DNA的扩增)或表达。有许多可用载体,而合适载体的选择是根据:(1)是否该载体将用于DNA扩增或表达,(2)被插入载体的核酸大小和(3)将被该载体转化的宿主细胞。每一种载体根据它的功能(DNA的扩增或表达)和与它相适应的宿主细胞可含有多种成份。载体的成份通常包括(但不局限于)下述的一种或几种:一个信号序列、一个复制起始点、一个或多个标记基因、一个增强子元件、一个启动子和转录终止序列。
(i)信号序列成份
本发明的mpl配体不仅能直接表达,而且能以与异源多肽的融合形式表达,该异源多肽最好是一个在成熟蛋白质或多肽的N-末端有一个特异性切割位点的信号序列或其他多肽。通常,该信号序列可以是载体的一个成份,或者是插入载体的mpl配体DNA的一部分。被选择的异源信号序列必须能被宿主细胞识别或属于宿主细胞(即能被一个信号肽酶断裂)。对于不能识别或不具有天然mpl配体信号序列的原核宿主细胞,该信号序列被选定的原核信号序列替代,例如从一组碱性磷酸酶、青霉素酶、Ipp或热稳定肠毒素II前导区中选定信号序列。对于酵母的分泌,可以替代天然信号序列的例子有:酵母转化酶、α因子、酸性磷酸酶前导区、白色念珠菌葡糖淀粉酶(1990年4月4日出版的EP362,179)或1990年11月15日出版的WO90/13646中所述的信号。对于哺乳动物的表达,天然的信号序列(即指导体内天然哺乳动物细胞分泌mpl配体作的mpl配体前导序列)是令人满意的,虽然其他哺乳动物的信号序列也可能是合适的,例如:来自其他mpl配体多肽或来自一个不同动物种类的相同mpl配体的信号序列、来自一个mpl配体的信号序列、来自相同或相关物种的分泌多肽的信号序列、以及病毒分泌前导区如疱疹单显性组合gD信号。
(ii)复制起始点成份
表达和克隆载体都含有一个核酸序列,该序列使载体能在一个或几个选择的宿主细胞中复制。通常,在克隆载体中,该序列使载体独立于宿主染色体细胞DNA而复制,并含有复制起点或自主性复制序列。这个序列广泛分布于细菌、酵母和病毒之中。来自pBR322质粒的复制起始点适合于大多数革兰氏阴性细菌;2μ质粒起始点适合于酵母菌;而多种病毒起始点(SV40、多瘤病毒、腺病毒、VSV或BPV)则对哺乳动物细胞中的克隆载体有用。通常,哺乳动物表达载体不需要复制起始点成份(通常要使用SV40起始点,只是因为它含有早期启动子)。
大多数表达载体是“穿梭”载体,即它们能在至少一类生物体中复制但能被转染到另一种生物体中进行表达。例如,将一个载体在大肠杆菌中克隆,然后将同一个载体转染到酵母菌或哺乳动物细胞中进行表达,即使它不能独立于宿主细胞染色体而复制。
同样可通过插入宿主基因组扩增DNA。这一过程可通过以杆菌作为宿主容易地完成,例如:在载体中加入一个互补于杆菌基因组DNA上某个序列的DNA序列。用该载体转染杆菌,产生杆菌基因组与插入的mpl配体DNA之间同源重组。然而,编码mpl配体的基因组DNA的回收比外源复制载体的回收更复杂,因为需要限制酶的消化作用来切割mpl配体DNA。
(iii)选择基因成份
表达和克隆载体应该含有一个选择基因,亦称选择标记。该基因编码转化宿主细胞在选择培养基上存活和生长所必须的一个蛋白质。未经含选择基因的载体转化的宿主细胞不能在培养基上存活。典型的选择基因编码的蛋白质有:(a)提供对抗生素或其他毒素抗性,如氨苄青霉素、新霉素、氨甲蝶呤或四环素,(b)互补营养缺陷型的缺陷或(c)提供复合培养基中没有的重要营养物,如编码杆菌D丙氨酸消旋酶的基因。
选择计划的一个例子是使用药物以阻止宿主细胞的生长。那些用异源基因成功转化的细胞表达一个药物抗性的蛋白质并能在选择条件下存活。这种优势选择的几个例子使用的药物为新霉素(South-ern等,J.Molec.Appl.Genet.1:327[1982])、霉酚酸(Mullgan等,Science,209:1422[1980])或潮霉素(Sugden等,Mol.Biol.,5:410-413[1985])。上述三个例子在真核控制下,使用细菌基因来表达对适当药物的抗性,相应的药物为G418或新霉素(遗传霉素)、xgpt(霉酚酸)、潮霉素。
其他适合哺乳动物细胞的选择性标记的例子是那些能鉴别细胞成份含有mpl配体核酸的标记,如二氢叶酸(DHFR)或胸苷激酶。哺乳动物细胞转化体处于选择性压力下,只有转化体由于含有标记而适应并存活。在培养基中连续地改变选择试剂的浓度的条件下,对培养的转化体施以选择压力,其结果是导致选择基因和编码mpl配体多肽的DNA都被扩增。在这样的扩增过程中,连续传代的重组细胞染色体中,因生长所必须的一种蛋白质需求量增加的基因以串联形式重复。扩增的DNA使mpl配体合成的量增加。
例如,用DHFR选择基因转化的细胞的鉴定首先通过在含有一种DHFR竞争性拮抗剂氨甲蝶呤(Mtx)的培养物中,培养所有的转化体。当运用野生型DHFR时,缺乏DHFR活性的中国仓鼠卵巢(CHO)细胞系是一种合适的宿主细胞,关于其制备与增殖,参见Urlaub和Chasin,Proc.Natl.Acad.Sci.USA,77:4216[1980]。接着,将转化细胞暴露于浓度增高的Mtx。这导致了多拷贝DHFR基因合成以及随之而来的其他构成表达载体的DNA如编码mpl配体的DNA的拷贝数增加。如果使用了对Mtx有高度抗性的突变型DHFR基因(EP117,060),有内源的DHFR,这一扩增技术也可适用于任何其他合适的宿主,如ATCC No.CCL61 CHO-K1。或者,用编码mpl配体、野生型DHFR蛋白质和另一种选择性标记。如氨基糖苷类3′转磷酸酶的DNA序列转化或共转化的宿主细胞[尤其是含有内源DHFR的野生型宿主],可在含选择剂的培养物中通过细胞生长所选择,其中,用于选择性标记的选择剂为氨基糖苷类抗生素等,如卡那霉素、新霉素或G418。参见U.S.专利号4,965,199。
适合于酵母中使用的一个选择基因是出现于酵母质粒YRp7的trp1基因(Stinchcomb等,Nature,282:39[1979];Kingsman等,Gene,7:141[1979]或Tschemper等,Gene,10:157[1980])。trp1基因将一个选择标记提供给在色氨酸中生长能力缺失的酵母菌突变型株,例如ATCC No.44076或PEP4-1(Jones,Genetics,85:12[1977])。于是,酵母菌宿主细胞基因组中的trp1缺失提供了一种效应环境,用于通过在无色氨酸情况下的生长来检测转化。类似地,Leu2缺陷的酵母菌株(ATCC No.20,622或38,626)与已知的携带Leu2基因的质粒互补。
(iv)启动子成份
表达和克隆载体通常含有一个启动子,可被宿主生物体识别并可操作地连接mpl配体核酸。启动子是非翻译序列,可操作地与一个结构基因(通常在约100至1,000bp之间)连接,并位于控制特定核酸序列如mpl配体核酸序列转录和翻译的结构基因起始密码子的上游(5′)。这种启动子通常分为诱导型和组成型两类。诱导型启动子能够控制DNA转录,使转录水平开始增加,这种作用是随培养条件中的某些变化如一种营养物的存在与否或者温度的变化而出现。现在,已经知道了能被许多潜在的宿主细胞识别的大量启动子。经限制性酶的消化作用将启动子从源DNA上切除下来,将分离的启动子序列插入载体,从而使这些启动子可操作地连接编码mpl配体的DNA。天然的mpl配体启动子和许多异源启动子都能用来指导mpl配体DNA的扩增和/或表达。但是,异源的启动子更好一些,因为与天然的mpl配体启动子相比较,它们通常能容许更强的转录和更高的mpl配体表达产量。
适用于原核宿主的启动子包括β内酰胺酶和乳糖启动子系统(Chang等,Nature,275:615[1978])、碱性磷酸酶、色氨酸(trp)启动子系统(Goeddel,Nucleic Acid Res.,8:4057[1980]和EP36,776)和tac启动子等杂交启动子(deBoer等,Proc.Natl.Acad.Sci.USA,80:21-25[1983])。然而,其他已知的细菌启动子是合适的。它们的核苷酸序列已经发表,因此,使用接头或衔接子提供所需的限制性位点,一个熟练的工作人员可操作地将它们连接编码mpl配体的DNA(siebenlist等,Cell,20:269[1980])。用于细菌系统的启动子也含有一个Shine-Dalgarno(S.D.)序列,可操作地连接编码mpl配体多肽的DNA。
真核细胞也有启动子序列。实际上,所有真核基因转录起始位点上游约25至30个碱基处,都有一个AT富集区。在许多基因转录起始点上游70至80个碱基处,还发现了另一段序列称为CXCAAT区,其中X可以是任何核苷酸。在大多数真核基因的3′末端有AATAAA的序列,也许是在编码序列3′末端加入多聚A尾的信号。所有这些序列可以合适地插入真核表达载体。
酵母菌宿主使用的合适启动序列的例子有:3-磷酸甘油酸激酶(Hitzeman等,J.Biol.Chem.,255:2073[1980])或其他糖酵解酶(Hess等,J.Adv.Enzyme Reg.,7:149[1968]和Holland,Biochemistry,17:4900[1978])的启动子,如烯醇酶、甘油醛-3-磷酸脱氢酶、己糖激酶、丙酮酸脱羧酶、磷酸果糖激酶、葡糖-6-磷酸异构酶、3-磷酸甘油酸变位酶、丙酮酸激酶、磷酸丙糖异构酶、磷酸葡萄糖异构酶和葡萄糖激酶。
其他酵母菌启动子即由生长条件控制并有额外转录优势的诱导型启动子,是下列物质的启动子区域:乙醇脱氢酶2、异构细胞色素C、酸性磷酸酶、与氮代谢相关的降解酶、金属硫蛋白、甘油醛-3-磷酸脱氢酶以及与麦芽糖和半乳糖使用有关的酶。关于酵母菌表达中使用的合适载体和启动子的进一步描述参见Hitzeman等,EP73,657A。酵母菌增强子与酵母菌启动子一起使用也是有利的。
举例来说,哺乳动物宿主细胞中载体的mpl配体转录由启动子控制,这里的启动子来自病毒基因组,如多瘤病毒、禽痘病毒(1989年7月5日出版,UK2,211,504)、腺病毒(如腺病毒2)、牛乳头瘤病毒、禽类肉瘤病毒、巨细胞病毒、一种逆转录病毒、乙型肝炎病毒、最好是猿猴病毒40(V40);来自异源的哺乳动物启动子,如肌动蛋白启动子和免疫球蛋白启动子;来自热休克启动子;也可来自通常与mpl配体相关的mpl配体序列,只要这些启动子与宿主细胞系统相容。
SV40病毒的早期和晚期启动子可以作为一个SV40限制性片段而方便地得到,其中还含有SV40病毒的复制起始(Fiers等,Na-ture,273:113[1978];Mulligan和Berg,Science,209:1422-1427[1980];Pavlakis等,Proc.Natl.Acad.Sci.USA,78:7398-7402[1981])。巨细胞病毒立即早期启动子可以作为HindIIIE限制性片段方便地得到(Greenway等,Gene,18:355-360[1982])。以牛乳头瘤病毒为载体在哺乳动物宿主中表达DNA的一个系统的描述参见U.S.专利号4,419,446。U.S.专利号4,601,978则是该系统的一个改进。其他还可参考Gray等,Nature,295:503-508中关于在猿猴细胞中编码免疫干扰素cDNA的表达;Reyes等,Na-ture,297:598-601[1982]中关于在疱疹单显性组合病毒胸苷激酶启动子的控制下,人β-干扰素cDNA在鼠细胞中的表达;Canaani和Berg,Proc.Natl.Acad.Sci.USA,79:5166-5170[1982]中关于人β1干扰素基因在培养的鼠和兔细胞中的表达;以及Gorman等,Proc.Natl.Sci.USA,79:6777-6781[1982]中关于以Rous肉瘤病毒长末端重复序列为启动子,细菌CAT序列在CV-1猿猴肾细胞、鸡胚成纤维细胞、中国仓鼠卵巢细胞、HeLa细胞和鼠NIH-3T3细胞中的表达。
(v)增强子成份
在本发明中,经常通过在载体中插入一个增强子序列来增加较高等真核细胞中编码mpl配体的DNA的转录。增强子是DNA的顺式作用元件,通常约100至300bp,作用于一个增加其转录的启动子。增强子的位置和方向相对独立,在转录单位的5′端(Laimis等,Proc.Natl.Acad.Sci.USA,78:993[1981])和3′端(Lusky等,Mol.Cell Bio.,3:1108[1983])都有发现,在一个内含子(Banerji等,Cell,33:729[1983])和它本身的编码序列(Osborne等人,Mol.Cell Bio.,4:1293[1984])之中也有发现。已知许多哺乳动物基因的增强子序列(珠蛋白、弹性蛋白酶、白蛋白、α-胎儿球蛋白和胰岛素)。但是,通常使用的增强子来自真核细胞病毒。例如,在复制起点晚期基因一侧的SV40增强子(100-270bp),巨细胞病毒早期启动子增强子,在复制起点晚期基因一侧的多瘤增强子和腺病毒增强子。参见Yaniv,Nature,297:17-18中关于真核启动子活化的增强元件。增强子可以被拼接到位于mpl配体编码序列5′端或3′端的载体中,但优选的位点在启动子的5′端。
(vi)转录终止成份
真核宿主细胞(酵母菌、真菌、昆虫、植物、动物、人或其他多细胞生物的含核细胞)中使用的表达载体也含有终止转录和稳定mRNA所需的序列。通常,这一序列来自5′端,偶尔来自真核细胞或病毒DNA或cDNA的3′端非翻译区。这些区域含有在编码mpl配体mRNA的非翻译部分转录成多聚腺苷酸的核苷酸片段。
(vii)载体的构建和分析
通过标准连接技术,构建含有以上所列成份中一个或多个的适用载体。对分离的质粒或DNA片段进行切割、改编和再连接,以预想的形式生成所需的质粒。
为分析确定构建质粒的正确序列,使用连接混合物转化大肠杆菌K12菌株294(ATCC No.31,446),根据情况以氨苄青霉素或四环素抗性来选择成功的转化体。用限制性内切酶消化制备、分析转化体中的质粒和/或用Messing等,Nucleic Acids Res.,9:309[1981]或Maxam等,Methods in Enzymology,65:499[1980]中的方法测序。
(viii)瞬时表达载体
在本发明的实施中特别有用的表达载体能提供哺乳动物细胞中编码mpl配体多肽的DNA的瞬时表达。通常,瞬时表达要求使用一个能在宿主细胞中有效复制的表达载体,其有效的复制使宿主细胞中积累表达载体的许多拷贝,由此高水平地合成由表达载体编码的所需多肽。参见Sambrook等,同上,pp.16.17-16.22。瞬时表达系统由合适的表达载体和宿主细胞组成,能方便地鉴定克隆DNA编码的多肽并迅速地筛选该多肽以得到所需的生物和生理特性。因此,瞬时表达系统在本发明中对于鉴定具有mpl配体多肽生物活性的mpl配体多肽的类似物和变异体特别有用。
(ix)合适的脊椎动物细胞载体的例子
在重组脊椎动物细胞培养物中,合成mpl配体的其他合适的方法、载体和宿主细胞参见Gething等,Nature,293:620-625[1981];Mantei等,Nature,281:40-46[1979];Levinson等,EP117,060和EP117,058。pRK5(EP307,247 U.S.专利号5,258,287)或pSVl6B(PCT出版号WO91/08291)是哺乳动物细胞培养物表达mpl配体的特别有用的质粒。D.宿主细胞的选择和转化
上文所述的原核细胞、酵母菌或高等真核细胞都是克隆或表达本文中载体的合适宿主细胞。合适的原核细胞包括真细菌如革兰氏阳性或阴性菌,例如大肠杆菌、枯草杆菌等杆菌、绿脓杆菌等假单胞菌、鼠伤寒沙门氏杆菌或粘质沙雷氏杆菌。虽然其他的菌株如大肠杆菌B、大肠杆菌X1776(ATCC No.31,537)和大肠杆菌W3110(ATCC No.27,325)也是合适的,但大肠杆菌294(ATCC No.31,446)是优选的大肠杆菌克隆宿主。这些例子仅是用于说明,并非表示合适的宿主细胞只限于这些。较好地,宿主细胞分泌蛋白水解酶的量最少。另外,体外克隆方法如PCR或其他核酸聚合酶反应也是适用的。
除了原核细胞以外,真核微生物如丝状真菌或酵母菌,是mpl配体编码载体合适的宿主。酿酒酵母或普通的面包酵母在低等真核宿主微生物中是最常用的。但是,通常可得到的一系列其它属、种和菌株可用于本文中,如非洲粟酒裂殖酵母菌(Beach和Nurse,Na-ture,290:140[1981]);1985年5月2日发表的EP139,383)、克鲁维酵母菌属宿主(U.S.专利号4,943,529)如K.lactis(Louven-court等,J.Bacteriol.,737[1983])、K.fragilis、K.bulgaricus、K.耐热菌和K.marxianus、yarrowia(EP402,226)、Pichia pastoris(EP183,070;Sreekrishna等,J.Basic Microbiol.,28:265-278[1988])、白色丝酵母、Trichoderma reesia(木霉菌属)(EP244,234)、链孢霉crassa(Case等,Proc.Natl.Acad.Sci.USA,76:5259-5263[1979])和丝状真菌如链孢酶属、青霉属、Tolypocladi-um(1991年1月10日出版的WO91/00357)和曲霉属宿主如构巢曲霉(Ballance等,Biochem.Biophys.Res.Commun.,112:284-289[1983];tilburn等,Gene,26:205-221[1983];Yelton等,Proc.Sci.USA,81:1470-1474[1984])和黑曲霉(Kelly和Hynes,EMBO J.,4:475-479[1985])。表达糖基化mpl配体的适合宿主细胞来自多细胞生物。这类宿主细胞能完成复杂的加工并具糖基化活性。原则上,无论是来自脊椎动物还是无脊椎动物培养物,任何高等真核细胞培养物是可用的。无脊椎动物细胞的例子有植物和昆虫细胞。已经鉴定到了大量的杆状病毒株和变异体及相应的昆虫允许宿主细胞,如草地夜蛾(毛虫)、埃及伊蚊(蚊子)、白纹伊蚊(蚊子)、黄果蝇(果蝇)和家蚕。参见Luckow等,Bio/Technology,6:47-55[1988];Miller等,Genetic Engineering,Setlow等编辑,Vol.8(Plenum出版,1986),pp277-279和Maeda等,Na-ture,315:592-594[1985]。可以从公共途径获得许多用于转染的病毒株,如苜蓿银纹夜蛾NPV的L-1变异体和家蚕NPV的Bm-5株系,这些病毒可以被本发明所使用,尤其是对于草地夜蛾细胞的转染。
棉花、玉米、土豆、大豆、牵牛花、西红柿和烟草的植物细胞培养物能被用作宿主。通常,植物细胞的转染通过与根瘤土壤杆菌一起温育,其中,后者已经过操作而含有mpl配体DNA。通过植物细胞与根瘤土壤杆菌一起的温育,编码mpl配体的DNA转移到植物细胞宿主中使之受转染,并在合适的条件下表达mpl配体DNA。另外,可得到与植物细胞相容的调节和信号序列,如胭脂碱合成酶启动子和多聚腺苷酸信号序列。参见Depicker等,J.Mol.Appl.Gen.,1:561[1982]。另外,从T-DNA780基因上游区域分离的DNA片段能激活或增加含重组DNA的植物组织中植物可表达基因的转录水平。参见1989年6月21日出版的EP321,196。
但是,最令人感兴趣的是脊椎动物细胞。近年来,脊椎动物细胞在培养基(组织培养物)中的增殖已经成为一种常规操作(TissueCulture,Academic Press,Kruse和Patterson,editors[1973])。有用的哺乳动物宿主细胞系有SV40转化的猴肾CV1细胞系(COS-7,ATCC CRL 1651);人胚肾细胞系(生长于悬浮培养物的293或293亚克隆细胞,参见Graham等,J.Gen virol.,36:59[1977]);幼仓鼠肾细胞(BHK,ATCC CCL 10);中国仓鼠卵巢细胞/-DHFR(CHO,Urlaub和Chasin,Proc.Natl.Acad.Sci.USA,77:4261[1980]);鼠足细胞(TM4,Mather,Biol.Reprod.,23:243-251[1980]);猴肾细胞(CVl ATCC CCL 70);非洲绿猴肾细胞(VERO-76,ATCC CRL-1587);人喉癌细胞(HELA,ATCCCCL 2);犬肾细胞(MDCK,ATCC CCL 34);水牛鼠肝细胞(BRL3A,ATCC CRL 1442);人肺细胞(W1 38,ATCC CCL 75);人肝细胞(Hep G2,HB 8065);鼠乳汁肿瘤(MMT 060562,ATCCCCL51);TRI细胞(Mather等,Annals N.Y.Acad.Sci.383:44-68[1982]);MRC5细胞;FS4细胞和人肝癌细胞系(Hep G2)。
用上述本发明的表达载体或克隆载体转染、最好是转化宿主细胞,在常规的营养培养基中培养并配合诱导性启动子、选择转化体或扩增编码所需序列的基因。无论实际上是否有编码序列表达,转染指宿主细胞取得一个表达载体。对于熟练的技术员来说,有大量转染的方法是已知的,如磷酸钙和电穿孔法。通常,在宿主细胞中发现该载体作用的任何迹象时,可以确认转染成功。
转化表示将DNA引入一种生物,使该DNA能够以染色体外成份或染色体整合形式进行复制。根据被使用的宿主细胞,运用适合该细胞的标准技术来完成转化。如Sambrook等,同上1.82部分所述,通常以氯化钙对原核细胞和其他有细胞壁的细胞进行钙处理。某些植物细胞的转化通过根瘤土壤杆菌进行传染,参见shaw等,Gene,23:315[1983]和1989年6月29日出版的WO89/05859。另外,也可用超声处理转染植物。参见1991年1月10日出版的WO91/00358。对于没有细胞壁的哺乳动物细胞,使用Graham和van derEb在Virology,52:456-457[1978]中的磷酸钙沉淀方法较好。Axel在1983年8月16日颁布的U.S.专利号4,399,216中叙述了哺乳动物细胞宿主系统转化的一般情况。进行酵母菌转化的通常方法参见Van Solingen等,J.Bact.,130:946[1977]和Hsiao等,Proc.Natl.Acad.Sci.(USA),76:3829[1979]。但是,也可用其他方法将DNA引入细胞,如核酸注射、电穿孔法或原生质融合。E.宿主细胞的培养
如Sambrook等,(同上)的概述,本发明中用来产生mpl配体多肽的原核细胞在合适的培养基中培养。
本发明中用来产生mpl配体多肽的哺乳动物宿主细胞可在多种培养基中培养。商购的培养基如Ham′s F10(sigma公司)、基本必需培养基([MEM]sigma公司)、RPMI-1640(sigma公司)和Dul-beccos改进的Eagle′s培养基([MEM]sigma公司)都适合宿主细胞的培养。另外,下列文献中所述的任何培养基可被用作宿主细胞的培养基:Ham和Wallace,Meth.Enz.,58:44[1979],Barnes和Sato.Anal.Biochem.,102:255[1980],美国专利号4,767,704;4,657,866;4,927,762或4,560,655;WO90/03430;WO87/00195;美国专利Re.30,985或1990年10月3日同时归档的copending U.S.S.N.07/592,107或07/592,141,所有的文件在此一并作为参考。根据需要可以在这些培养基的任何一个中补充激素和/或其他生长因子(如胰岛素、转铁蛋白或表皮生长因子)、盐(如氯化钠、钙、镁和磷酸盐)、缓冲液(如HEPES)、核苷(如腺苷和胸苷)、抗生素(如药物庆大霉素)、微量元素(通常终浓度在微摩尔水平的无机物)和葡萄糖或相当的能源。本领域的熟练技术人员知道,还可加入适当浓度的其他任何必需补充物。温度、pH值之类的培养条件与先前用于选择表达宿主细胞的那些条件相同,这对一般的熟练技术人员也是很明显的。
宿主细胞包括体外培养的细胞和宿主动物体内的细胞F.检测基因扩增/表达
在一个样品中,基因扩增和/或表达的测量可直接通过下列方法:定量mRNA转录的常规Southern印迹和Northern印迹法(Thomas,Proc.Natl.Acad.Sci.USA,77:5201-5205[1980]),斑点印迹(DNA分析)或原位杂交,并根据提供的序列使用合适的标记探针。有许多标记可以被使用,大多数是放射性同位素,尤其是32P。但是,也可运用其他技术,如将生物素修饰的核苷酸引入多聚核苷酸。然后,将生物素作为结合抗生物素蛋白或抗体的位点,后者可被许多种标记所标记,如放射性核素、荧光剂、酶或其他类似物。或者,可使用能识别特定双链体的抗体,包括DNA双链体、RNA双链体、DNA-RNA杂交双链体或DNA-蛋白质双链体。反过来,可对抗体进行标记,并在双链体与表面结合处进行分析,当在表面上形成双链体时,可以检测到与双链体结合的抗体。
基因的表达也可用免疫方法测量,如用组织切片的免疫组织化学染色和细胞培养物或体液的分析来直接定量基因产物的表达。在免疫组织化学染色技术中,一般以脱水和固定方法制备细胞样品,接着与特异于偶联基因产物的标记抗体在通常能检测到标记的位置发生反应,使用的标记如酶标记、荧光标记、发光标记和类似物。适用于本发明的一个特别敏感的染色技术见于Hsu等,Am.J.Clin.Path.,75:734-738[1980]。
可用于免疫组织化学染色和/或样品液体分析的抗体可以是单克隆或多克隆,可以在任何哺乳动物中制备。通常,抗体的制备通过针对天然mpl配体多肽或合成肽,其中,后者根据本文中提供的DNA序列而合成,进一步的叙述见下文。G.mpl配体多肽的纯化
虽然在没有分泌信号而直接表达时,也能从宿主细胞裂解物中回收mpl配体,但最好还是以分泌多肽的形式从培养基中回收。
当mpl配体在非人源的重组细胞中被表达时,该mpl配体中完全不含人源蛋白质或多肽。但是,仍然有必要从其他重组细胞蛋白质或多肽中纯化mpl配体,以得到与mpl配体本身基本同源的制备物。第一步,离心培养物或裂解物以除去微小的细胞碎片。然后,分离膜和可溶蛋白质部分。或者,可使用市售的蛋白质浓缩滤膜(如Amicon或Millipore Pellicon超滤单位)。于是,根据mpl配体是否与膜结合,可以从培养裂解物的可溶蛋白质部分和膜部分中提纯到mpl配体。随后,通过盐析和使用多种凝胶基质的交换或色谱法程序,把mpl配体从杂质可溶蛋白质和多肽中提纯出来。这些基质包括:丙烯酰胺、琼脂糖、葡聚糖、纤维素和其他在蛋白质纯化中常用的物质。适用于蛋白质纯化的典型色谱法程序包括:免疫亲和(如抗hmpl配体Mab)、受体亲和(如mpl-IgG或蛋白A Sepharose)、疏水性相互作用色谱(HIC)(如乙醚、丁基或苯基Toyopearl)、植物凝集素色谱法(如伴刀豆球蛋白A Sepharose和小扁豆植物凝集素Sepharose)、大小排阻(如Sephadex G-75)、阳离子和阴离子交换柱(如DEAE或羧甲基和磺丙基纤维素)以及反相高效液相色谱(RP-HPLC)(如参见Urdal等,J.Chromatog.,296:171[1984]中所述,用两个连续的RP-HPLC步骤纯化重组的人IL-2)。其他可选用的纯化步骤包括:乙醇沉淀、硫酸铵沉淀、色谱聚焦法、制备SDS聚丙烯酰胺凝胶电泳和其他类似方法。
考虑到发生的任何性质上的基本变化,有残基缺失、插入和置换的mpl配体变异体可用与天然mpl配体同样的方法回收。例如,一个mpl配体与另一个蛋白质或多肽如细菌或病毒抗原的融合体制备能促进纯化;可用一个免疫亲和柱吸附融合多肽,柱中含有对应该抗原的抗体。通过至少在一个剩余的免疫表位的结合,兔多克隆抗mpl配体柱等免疫亲和柱可用以吸附mpl配体变异体。或者,可用亲和色谱纯化mpl配体,其中使用与固定化(优选)的Affi-Gel 10(Bio-Rad,Richmond,CA)或类似树脂偶联的纯化的mpl-IgG,该方法已经被广为使用。苯甲基硫酸氟(PMSF)等蛋白酶抑制剂可在纯化过程中用于抑制蛋白酶解的降解作用,并且可加入抗生素来防止意外污染物的生长。本领域的熟练技术人员会认识到,适合天然mpl配体的纯化方法也许需要修改以适应重组细胞培养物中表达的,mpl配体及其变异体性质的变化。H.mpl配体多肽的共价修饰
本发明范畴中包括了mpl配体多肽的共价修饰。天然的mpl配体和mpl配体的氨基酸序列变异体都能被共价修饰。mpl配体片段是本发明范畴中共价修饰的一种类型。氨基酸残基多达约40个的变异mpl配体多肽片段能够方便地制备,其方法有化学合成或者酶法或化学切割全长或变异mpl配体多肽。通过mpl配体及其片段的靶氨基酸残基与一种有机衍生剂的反应,将其他类型的mpl配体及其片段的共价修饰引入分子,该试剂能与选择的侧链或N-或C-末端的残基反应。
半胱氨酰残基通常与α卤代乙酸(和相应的胺)如氯代乙酸或氯代乙酰胺反应,以获得羧甲基或羧酰胺甲基衍生物。半胱氨酰残基的衍生来自与下列物质的反应,溴三氟丙酮、α-溴-β-(5-imidozoyl-)丙酸、磷酸氯乙酰、N-烷基马来酰亚胺、3-硝基-2-吡啶基二硫化物、甲基2-吡啶基二硫化物、对-氯汞苯甲酸、2-氯汞-4-硝基酚或氯-7-硝基苯-2-oxa-1,3-二唑。
组氨酰残基的衍生通过在pH5.5-7.0时与焦磷酸二乙酯的反应,因为该试剂对组氨酰侧链有相对的特异性。也可用对溴苯酰甲基溴化物;优选的反应条件为pH6.0时0.1M的卡夫基酸钠。
赖胺酰和氨基末端残基与琥珀酸或其他羧酸的酸酐反应。使用这些试剂进行的衍生作用可起反转赖胺酰残基电荷的效应。其他适用于含氨基残基的衍生试剂有亚氨酸酯如亚基picolinimidate、磷酸吡哆醛、吡哆醛、氯硼氢化物、三硝基苯磺酸、O-甲基异脲、2,4-戊二酮和含乙醛酸盐的转氨酶催化反应。
精胺酰残基的修饰通过与一个或几个常规试剂的反应,如苯基乙醛酰、2,3-丁二酮、1,2-环己二酮和茚三酮。由于胍功能基团的高pKa值,精氨酸残基的衍生需要在反应在碱性条件下进行。另外,这些试剂还可以与赖氨酸的基团和精氨酸的ε氨基反应。
酪氨酰残基的特异性修饰通过与芳香族的重氮化合物或四硝基甲烷的反应,其主要的目的在于将特殊的标记引入到络氨酰残基。在大多数情况下,使用N-乙酰咪唑和四硝基甲烷相应地得到O-乙酰酪氨酰种类和3-硝基衍生物。用125I或131I碘化酪氨酰残基以制备用于放射免疫测定的标记蛋白质,如上所述的氯胺T方法适用于该操作。
天冬氨酰和谷氨酰的羧基侧基通过与碳化二亚胺(R-N=C=N-R′)的反应有选择地修饰,其中,R和R′是不同的烷基,如1-环乙基-3-(2-吗啉基-4-乙基)碳化二亚胺或1-乙基-3-(4-氮阳离子-4,4-二甲基戊基)碳化二亚胺。另外,通过与铵离子的反应,天冬氨酰和谷氨酰残基转化成天冬酰胺酰和谷氨酰胺酰残基。
用双功能试剂进行的衍生可用于将mpl配体交联到抗mpl配体抗体纯化方法中使用的水不溶性支持介质或表面上。反过来也是这样。常用的交联剂包括1,1-二(重氮乙基)-2-苯乙烷、戊二醛、N-羟基琥珀酰亚胺酯如4-叠氮水杨酸酯、同源双功能亚胺酯包括双琥珀酰亚胺酯如3,3′-二硫代bis(琥珀酰亚胺丙酸)、以及双功能的马来酰亚胺如二-N-马来酰亚胺基-1,8-辛烷。衍生试剂如甲基-3-[(p-叠氮苯基)二硫代]propioimidate产生能在光照下形成交联的光敏中间物。或者,反应的不溶于水的介质如溴化氰激活的碳水化合物和反应的底物如美国专利号3,969,287;3,691,016;4,195,128;4,247,642;4,229,537和4,330,440中所述,可用于蛋白质的固定。
天冬酰胺酰和谷氨酰胺酰残基经常脱氨而成为相应的天冬氨酰和谷氨酰残基。这些残基的脱氨是在中性或碱性条件下进行。这些残基的脱氨形式在本发明的范畴之内。
其他修饰包括:脯氨酸和赖氨酸的羟化,丝氨酰或苏氨酰残基羟基的磷酸化,赖氨酸、精氨酸和组氨酸侧链α氨基的甲基化(T.E.Creighton,Proteins:Structure and Molecular Properties,W.H.Freeman&Co.,San Francisco,pp.79-86[1983]),N-末端氨基的乙酰化和任何C-末端羧基的酰胺化。
改变多肽的天然糖基化形式是本发明范畴中另一个类型的mpl配体多肽共价修饰。这里的变化指除去一个或多个天然mpl配体的糖类部分和/或加入一个或多个天然mpl配体中没有的糖基化位点。
多肽的糖基化通常是N-结合或O-结合。N-结合指糖类部分与一个天冬酰胺残基侧链的连接。糖类部分与天冬酰胺侧链的酶催化的结合识别序列为三肽序列:天冬酰胺-X-丝氨酸和天冬酰胺-X-苏氨酸,其中X表示除脯氨酸以外的任何氨基酸。因此,当多肽中出现这些三肽序列中的一个时,同时也就形成了一个潜在的糖基化位点。O结合的糖基化指糖与羟氨基酸的结合,其中,前者如N-乙酰半乳糖胺、半乳糖或木糖,后者一般为丝氨酸或苏氨酸,5-羟脯氨酸或5-羟赖氨酸也可用。
在mpl配体多肽中加入糖基化位点一般是通过改变氨基酸序列,使之含有一个或多个上述的的三肽序列(对于N-结合的糖基化位点)。这种改变也可以通过在天然mpl配体序列中加入或置换入一个或多个丝氨酸或苏氨酸残基(对于O-结合的糖基化位点)。为了方便一些,最好通过DNA水平的变化来改变mpl配体氨基酸序列,尤其是通过使编码mpl配体多肽的DNA在预选的碱基发生突变而得到能翻译出所需氨基酸的密码子。DNA突变的方法可以根据上述标题为“mpl配体的氨基酸序列变异体”的内容进行。
在mpl配体中增加糖类部分数量的另一个方法是通过化学或酶法使糖基与多肽偶联。这些程序的优点在于:它们不要求在一个对N-或O-结合糖基化有能力的宿主细胞中产生多肽。根据偶联的形式,糖类可以被连接于(a)精氨酸和组氨酸,(b)游离的羧基,(c)游离的巯基如半胱氨酸的巯基,(d)游离的羟基如丝氨酸、苏氨酸或羟脯氨酸的羟基,(e)芳香族残基如苯丙氨酸、酪氨酸或色氨酸的芳香族残基,或者(f)谷氨酰胺的酰胺基。这些方法可参见1987年9月11日出版的WO87/05330和in Aplin and Wriston,CRC Crit.Rev.Biochem.,pp.259-306[1981]。
可以用化学或酶法除去mpl配体多肽中的糖类部分。化学的去糖基化需要将多肽置于三氟甲烷磺酸或类似的化合物。这种处理将导致除结合糖类(N-乙酰葡糖胺或N-乙酰半乳糖胺)以外的大多数或全部糖类断裂,但对多肽链没有影响。化学去糖基化的方法可参见Hakimuddin等,Arch.Biochem.Biophy.,259:52[1987]和Edge等,Anal.Biochem.,118:131[1981]。多肽中糖类部分的酶法断裂可使用多种内源或外源糖苷酶,参见Thotakura等,Meth.enzy-mol.,138:350[1987]。
可以用化合物衣霉素来防止潜在糖基化位点的糖基化,参见Buskin等,J.Biol.Chem.,257:3105[1982]。衣霉素能阻止蛋白质-N-糖苷键的形成。
mpl配体共价修饰的另一种类型是通过将mpl配体多肽与多种非蛋白质多聚体中的一个相连,如聚乙二醇、聚丙二醇或聚氧烷,参见美国专利号4,640,835;4,496,689;4,301,144;4,670,417;4,791,192或4,179,337。与上述多聚体共价连接的mpl配体多肽被称作聚合化的mpl配体多肽。
在优选情况下,需要对回收的mpl配体进行一些筛选来选择出最佳的变异体,用以与mpl结合并具有上述的免疫和/或生物活性。可以对下列特性进行筛选:在重组细胞培养物或血浆中的稳定性(如对抗蛋白酶解的断裂作用)、对于一个mpl成员的高亲和性,氧化稳定性,以提高的产量被分泌的能力和其他类似的特性。例如,mpl配体多肽中免疫性质的某个变化,如对指定抗体的亲和性,由竞争性免疫分析来测量。蛋白质或多肽性质的其他潜在变化如氧化还原或热稳定性、疏水性或对蛋白酶解降解作用的敏感性,都可以用本领域已知的方法来分析。17.制备mpl配体的抗体的一般方法抗体制备(i)多克隆抗体
mpl配体多肽或片段的多克隆抗体的制备通常是将mpl配体和一个佐剂多次皮下(sc)或腹膜内(ip)注射到某个动物体内。很有用地是将含有靶氨基酸序列的mpl配体或一个片段共轭于在被免疫的物种中具有免疫原性的蛋白质,如匙孔血蓝蛋白、血清白蛋白、甲状腺球蛋白或大豆胰蛋白酶抑制剂。连接需使用一种双功能或衍生试剂,如顺丁烯二酰亚胺苯甲酰磺基琥珀酰亚胺酯(通过半胱氨酸残基共轭结合)、N-羟基琥珀酰亚胺(通过赖氨酸残基)、glytaralde-hyde、琥珀酸酐、SOCl2或R1N=C=NR,其中R和R1是不同的烷基。
由mpl配体多肽或片段、具有免疫原性的共轭物或衍生物来免疫动物,是通过将1毫克或1微克的肽或共轭物(对应于兔或鼠)与3倍体积的Freund′s完全佐剂混合并将溶液皮内注射于多个部位。一个月以后,将原来量的1/5到1/10肽或共轭物与Freund′s完全佐剂混合在多个部位皮下注射以加强免疫。7至14天后,将动物放血并分析血清中mpl配体抗体的效价。继续加强免疫直至效价曲线到达平台区。优选地,使用相同mpl配体的共轭物加强免疫,但可共轭于一种不同的蛋白质并/或通过一个种同的交联试剂。共轭物也可以作为蛋白质融合体在重组细胞培养物中制成。另外,明矾等聚集剂可用以提高免疫应答。(ii)单克隆抗体
单克隆可以来自一个基本同源抗体的群落,即除了可能存在的出现概率极小的自发突变体外,构成群落的每个抗体都是相同的。因此,修饰词“单克隆”是指抗体的特性,并非指独立抗体的混合物。
例如,本发明中mpl配体单克隆抗体的制备可用杂交瘤方法或重组DNA方法,前者由Kohler和Milstein,Nature,256:495[1975]首先描述,后者参见美国专利号4,816,567(Cabilly等)。
在杂交瘤方法中,用上述方法免疫一个鼠或其他合适的宿主动物如仓鼠,以引出淋巴细胞,这些淋巴细胞产生或能够产生的抗体可以与用作免疫的蛋白质特异性结合。或者,可在体外免疫淋巴细胞。然后,使用一种合适的融合剂如聚乙二醇,将淋巴细胞融合到骨髓瘤细胞中形成杂交瘤细胞(Goding,Monoclonal Antibodies:Princi-ples and Practice,pp.59-103[Academic Press,1986])。
将这样制备好的杂交瘤细胞在合适的培养基中接种并生长,培养基中最好含有能抑制未融合的亲代骨髓瘤细胞的生长或存活的一种或几种物质。例如,如果亲代骨髓瘤细胞缺少次黄嘌呤磷酸核糖转移酶(HGPRT或HPRT),通常就可以使杂交瘤培养基中含有次黄嘌呤、氨喋呤和胸腺嘧啶脱氧核苷(HAT培养基),从而基本抑制了HGPRT缺陷细胞的生长。
优选的骨髓瘤细胞的特点是:能有效地融合、支持选出的抗体生成细胞以稳定的高水平表达抗体和对HAT等培养基敏感。其中,优选的骨髓瘤细胞系是鼠骨髓瘤系,如来自Salk Institute Cell Distri-bution Center,San Diego,California USA的MOPC-21和MPC-11鼠肿瘤细胞和来自American Type Culture Collection,Rockville,Maryland USA的SP-2细胞。也有记载将人骨髓瘤和鼠-人异源骨髓瘤细胞系用于产生人单克隆抗体(Kozbor,J.Im-munol.,133:3001[1984];Brodeur等,Monoclonal AntibodyProduction Techniques and Application,pp.51-63,MarcelDekker,Inc.,New York,1987)。
对杂交瘤细胞生长的培养基进行分析,以确定直接对应mpl配体的单克隆抗体的产量。在优选情况下,杂交瘤细胞产生的单克隆抗体的结合特异性由免疫沉淀法或离体结合分析如放射免疫分析(RIA)或酶联免疫吸附测定(ELISA),来决定。
单克隆抗体的结合亲和性可用例如Scatchard analysis ofMunson&Pollard,Anal.biochem.,107:220[1980]中所述的方法来决定。
在确定了杂交瘤细胞能产生具有所需的特异性、亲和性和/或活性的抗体后,可通过极限稀释程序将克隆亚克隆化并以标准方法使之生长(Goding,同上)。能达到这个目的合适的培养基包括Dulbec-co′s Modified Eagle′s培养基或RPMI-1640培养基。另外,杂交瘤细胞可以在动物体内以腹水肿瘤的形式生长。
将亚克隆分泌的单克隆抗体适当地与培养基、腹水或血清分离,分离采用常规的免疫球蛋白纯化程序如蛋白A Sepharose、羟磷灰石层析、凝胶电泳、透析或亲和层析。
使用常规程序可以方便地分离并测序本发明的编码单克隆抗体的DNA(如通过使用能与编码鼠抗体重链和轻链的基因特异性结合的寡核苷酸探针)。本发明的杂交瘤细胞是作为这种DNA的一个优选来源。一旦被分离,DNA可被置入到表达载体中,然后随载体一起转染宿主细胞如猴肾COS细胞,中国仓鼠卵巢(CHO)细胞或不再产生免疫球蛋白的骨髓瘤细胞,以获得重组宿主细胞中单克隆抗体的合成。还可对DNA进行修饰,如以鼠的同源序列置换编码人重链和轻链恒定区的序列(Cabilly等,同上;Morrison等Proc.Nat.Acad.Sci.,81:6851[1984])或将所有或部分非免疫球蛋白多肽链的编码序列共价结合于免疫球蛋白的编码序列。
通常,这样的非免疫球蛋白多肽链被用来置换本发明的一种抗体的恒定区,或者,被用来置换本发明的一种抗体的一个抗原结合位点的可变区,以形成一个嵌合双价抗体,其中一个抗原结合位点特异于mpl配体,另一个则特异于不同的抗原。
嵌合或杂交抗体也可在体外制备,使用已知的蛋白质合成化学方法,包括那些涉及交联剂的方法。例如,可使用二硫键交换反应或通过形成一个硫酯键来构建一个免疫毒素。为达到这个目的所需的合适的试剂包括亚氨基硫醇盐和甲基-4-mercaptobutyrimidate。
由于诊断的需要,本发明的抗体通常用一个可测部分作标记。对该可测部分的唯一要求是能够直接或间接生成一个可测信号。例如,该可测部分可以是一个放射性同位素,如3H、14C、32P、35S或125I,一个荧光或化学发光化合物,如荧光素异硫氰酸盐、若丹明或虫荧光素,放射性同位素标记,如125I、32P、14C或3H,或者某种酶,如碱性磷酸酶、β半乳糖苷酶或辣根过氧化物酶。
本领域任何已知的可将抗体单个地共轭于可测部分的方法都可使用,包括下列文献中所述的方法:Hunter等,Nature,144:945[1962];David等,Biochemistry,13:1014[1974];Pain等,J.Immunol.Meth.,40:219[1981]和Nygren,J.Hisrochem.andCytochem.,30:407[1982]。
本发明的抗体可用于任何已知的分析方法,如竞争性结合分析、直接或间接夹层分析和免疫沉淀分析。参见Zola,Monoclonal Anti-bodies:A Manual of Techniques,pp.147-158(CRC Press,Inc.,1987)。
竞争性结合分析是依据一个被标记的标准物(可以是mpl配体或其免疫反应部分)与实验样品被分析物(mpl配体)竞争与有限数量的抗体结合的能力。实验样品中mpl配体的量与结合抗体的标准物的量成反比。为了更快决定结合的标准物的量,通常要在竞争之前或之后固化抗体,从而能够方便地将结合抗体的标准物和被分析物从游离的标准物和被分析物中分离出来。
夹层分析涉及两个抗体的使用,每个抗体都能结合至待测蛋白质(mpl配体)的不同致免疫部位,即抗原决定部位。在夹层分析中,实验样品被分析物结合到固定于一个固体支持物的第一个抗体,随后,第二个抗体结合于被分析物,于是就形成了一个不溶性三元复合物。参见David和Greene,美国专利号4,376,110。第二个抗体可以本身可测部分标记(直接夹层分析)或以被可测部分标记的抗免疫球蛋白抗体来测定(间接夹层分析)。例如,ELISA分析是夹层分析的一种类型,其中的可测部分是一种酶(如辣根过氧化物酶)。(iii)人源化抗体和人抗体
人源化非人体抗体的方法是本领域中广为人知的。通常,一个人原化抗体中有引入的一个或多个非人源来源的氨基酸残基。这些非人源的氨基酸残基经常被称作“输入”残基,一般来自一个“输入”可区。人源化过程的基本操作根据Winter及其合作者的方法(Jones等,Nature,321:522-525[1986];Riechmann等,Nature,332:323-327[1988];Verhoeyen等,Science,239:1534-1536[1988]),以鼠CDRs或CDR序列置换相应的人抗体序列。于是,这种“人源化”抗体属于嵌合抗体(Cabilly等,同上),其中,少于一个完整人可变区的序列被来自非人物种的相应序列所置换。实际上,人源化抗体一般是人抗体的一些CDR残基和可能的一些FR残基被来自鼠抗体中类似位点的残基置换。
为减少抗原性,对用于制备人源化抗体重链和轻链的人可变区的选择是非常重要的。根据所谓的“最适”方法,对已知的人可变区序列的完整文库筛选鼠抗体可变区的序列。于是,与鼠序列最接近的人序列被当作了人源化抗体的骨架(FR)(Sims等,J.Immunol.,151:2296[1993];Chothia和Lesk,J.Mol.Biol.,196:901[1987])。另一个方法使用一个特殊的骨架,该骨架来自所有人抗体的共有序列,是重链或轻链的一个特殊亚型。相同的骨架可用于几个不同的人源化抗体(Carter,Proc.Natl.Acad.Sci.USA,89:4285[1992];Presta等,J.Immnol.,151:2623[1993])。
更重要的是,人源化的抗体应保留对抗原的高亲和性和其他优化的生物特性。为了达到这个目标,根据一个优选方法,人源化抗体的制备通过:用亲代和人源化序列的三维模型分析亲代序列和多种概念性的人源化产物。三维免疫球蛋白模型是很常见的,并且对于本领域的技术人员是很熟悉的。可以获得计算机程序来显示选出的候选免疫球蛋白序列的可能的三维构象结构。通过检查这些显示内容就可以对残基在候选免疫球蛋白序列功能中的可能作用进行分析,即对残基对候选免疫球蛋白结合其抗原能力的影响进行分析。通过这个方法,可以从共有和输入序列中选出FR残基,以得到所需的抗体特性,如增加对靶抗原的亲和性。通常,CDR残基直接和在大多数时候基本上影响抗原结合。进一步的细节参见1992年8月21日归档的美国申请系列号07/934,373,而该文件部分延续了1991年7月14日归档的申请系列号07/715,272。
或者,现在已经能产生转基因动物(如鼠),能在免疫接种后,在缺少内源免疫球蛋白产物时,生成一个人抗体的完整库。例如,已经有这样的描述,在嵌合和种系突变鼠中的抗体重链连接区(JH)基因的纯合缺失会导致内源抗体生成的完全抑制。在这种种系突变型鼠中,人种系免疫球蛋白基因排列的转入将根据抗原的攻击导致产生人抗体。参见Jakobovits等,Proc.Natl.Acad.Sci.USA,90:2551-255[1993];Jakobovits等,Natjuer,362:255-258[1993];Bruggermann等,Year in Immune.,7:33[1993]。人抗体也可以在噬菌体显示文库中生成(Hoogenboom和Winter,J.Mol.biol.227,381[1991];Marks等,J.Mol.Biol.222,581[1991])。(iv)双重特异性抗体
双重特异性抗体是单克隆的,最好是人或人源化的抗体,对至少两个不同的抗原有结合特异性。本领域已知制备双重特异性抗体的方法。
传统上,双重特异性抗体的重组产物是基于两个免疫球蛋白重-轻链对的共表达,其中,两个重链有不同的特异性(Millstein和Cuello,Nature,305:537-539[1983])。由于免疫球蛋白重链和轻链的随机组合,这些杂交瘤(四联瘤)产生一个有10个不同抗体分子的潜在混合物,但其中只有一个有正确的双重特异性结构。一般通过亲和色谱步骤来纯化该正确的分子,但纯化过程相当笨重,且得率低。类似的程序参见PCT出版号WO93/08829(1993年5月13日出版)和Traunecker等,EMBO,10:3655-3659[1991]。
依照一个不同的但更好的方法,将带有所需结合特异性的抗体可变区与免疫球蛋白恒定区序列融合。融合的部位最好是免疫球蛋白重链的恒定区,其中至少含有部分铰链区、CH2和CH3区。最好使含有轻链结合所需的位点的第一个重链恒定区在至少一个融合体中出现。编码免疫球蛋白重链融合体以及(如有需要)免疫球蛋白轻链的DNA被插入到独立的表达载体并被共转染到合适的宿主生物中。这样,就提供了在对各例子中三条多肽链相互比例的调节上具有很大的弹性,而结构中这三条多肽链的不相等比例能获得最佳的产量。但是,当至少两条相等比例的多肽链的表达导致高产量或当比例不是特别重要时,就有可能将两条或所有三条多肽链的编码序列插入到一个表达载体中。在本方法的一个优选例子中,双重特异性抗体的构成为,在一条臂上有具备第一个结合特异性的杂交免疫球蛋白重链和在另一条臂上有一个杂交免疫球蛋白重链-轻链对(提供了第二个结合特异性)。已经发现这种不对称结构促进了所需的双重特异性成份从不需要的免疫球蛋白复合链上分离下来,如同只有一半双重特异性分子上有一条免疫球蛋白轻链时,分离更容易一些。本方法参见1992年8月17日归档的copending申请序列号07/931,811。
生成双重特异性抗体的进一步细节参见Suresh等,Methodsin Enzymology,121:210[1986]等。(v)异源共轭抗体
异源共轭抗体也属于本发明范畴之内。异源共轭抗体由两个共价结合的抗体构成。例如这种抗体的作用使免疫系统细胞针对不需要的细胞(美国专利号4,676,980)和治疗HIV感染(PCT出版号WO91/00360和WO92/00373;EP03089)。异源共轭抗体可使用传统的交联方法来制成。合适的交联试剂在本领域广为人知,可参见美国专利号4,676,980,其中还包括有一系列交联技术。IV.巨核细胞生成蛋白mpl配体在治疗上的应用
有造血效应子功能和在这里被称为巨核细胞生成或血小板生成蛋白(TPO)的生物活性mpl配体可用于无菌的药物制备配方,以促进病人的巨核细胞生成和血小板生成活性,该种病人为由血小板生成受损、隔离或破坏增加引起的血小板减少。本发明的合成物可有效地治疗血小板减少相关的骨髓发育不全(如化学治疗或骨髓移植后的发育不全贫血)以及各种病症如弥漫性血管内凝血(DIC)、免疫性血小板减少(包括HIV诱导的或非HIV诱导的ITP)、慢性特发性血小板减少、先天性血小板减少、骨髓发育不良和血栓血小板减少。另外,这些巨核细胞生成蛋白也可用于治疗骨髓增生性血小板疾病以及炎症条件和缺铁血小板情况下的。
本发明的巨核细胞生成和血小板生成蛋白(TPO)的优选用途在于:用于白血病或实体瘤的骨髓毒化学治疗、用于自体或同种异体骨髓移植的化学治疗、骨髓发育不全、特发性发育不全贫血、先天性血小板减少和免疫性血小板减少。
本发明的巨核细胞生成蛋白还能用于一些其他疾病的治疗,如药物、中毒或人工表面活化引起的血小板缺陷或破坏。在这些情况下,迫切需要一种化合物能促进新的“未破坏”血小板的“流出”。一个有效应用的更完整的表参见“背景”(同上),尤其是(a)至(f)部分以及本文提及的参考文献。
本发明的巨核细胞生成蛋白用于治疗上述疾病或状况时,可单独使用,也可与其他的细胞因子、红细胞生成素、白细胞介素、生长因子或抗体结合使用。因此,该迫切需要的化合物可与其他有血小板生成活性的蛋白质或肽结合使用,如G-CSF、GM-CSF、LIF、M-CSF、IL-1、IL-3、红细胞生成素(EPO)、成套配体、IL-6和IL-11。
本发明的巨核细胞生成蛋白的制备在一个含有药学上可接受的载体的混合物中进行。治疗组合物的给药通过静脉注射或经过鼻或肺。根据需要,这些组合物还可胃肠外或皮下给药。当系统地给药时,治疗组合物应该不含热原,并处在pH、等渗性和稳定性都合适的胃肠外可接受溶液中。这些条件是本领域已知的。简而言之,制备本发明的化合物的剂量配方后,将有所需纯度的化合物与生理上可接受的载体、赋行剂或稳定剂混合地储存或给药。在使用的剂量和浓度方面,这些物质对于受体是无毒的,这些物质中还包括缓冲液如磷酸盐、柠檬酸盐、乙酸盐和其他有机酸盐;抗氧化剂如抗坏血酸;低分子量(约少于10个残基)肽如聚精氨酸,蛋白质如血清白蛋白、明胶、或免疫球蛋白;疏水性多聚物如聚乙烯吡咯烷酮;氨基酸如甘氨酸、谷氨酸、天冬氨酸或精氨酸;单糖、二糖和其他糖类如纤维素及其衍生物、葡萄糖、甘露糖或糊精;螯合剂如EDTA;糖醇如甘露醇或山梨糖;平衡离子如钠和/或非离子表面活性剂如吐温、普鲁兰尼克或聚乙二醇。
根据可行的制药实践需要,将约0.5至500毫克的巨核细胞生成蛋白质(以游离酸或碱形式或药学上可接受的盐形式存在)化合物或混合物与生理上可接受的媒介、载体、赋行剂、黏合剂、防腐剂、稳定剂、调味剂等等复合。在这些组合组中,活性成份的量应该能在指定的范围内可得到合适的剂量。
加入注射所需的无菌成份是根据传统的制药实践。例如,也许需要将活性成份在媒介中溶解或悬浮,媒介如水、天然植物油如芝麻、花生或棉籽油或者合成脂肪媒介如乙基油酸或类似物。缓冲液、防腐剂、抗氧化剂和类似物可根据可行的制药实践结合到其中。
缓释制剂的合适例子包括含多肽的固体疏水多聚物的半透性基质,该基质以有形形式存在,如薄膜或微型胶囊。缓释基质的例子包括聚酯、水凝胶[如Langer等,J.biomed.Mater.Res.,15:167-277[1981]和Langer,Chem.Tech.,12:98-105[1982]中所述的聚(2-羟乙基-异丁烯酸)或聚乙烯乙醇]、聚丙交酯(美国专利号3,773,919,EP58,481)、L-谷氨酸和γ乙基-L-谷氨酸的共聚物(Sid-man等,Biopolymers,22:547-556[1983])、不可降解的乙烯-乙烯乙酸(Langer等,同上)、可降解的乳酸-乙二酸共聚物如Lupron De-potTM(由乳酸-乙二酸共聚物和leuprolide乙酸盐组成的可注射微球)和多聚D-(-)-3-羟基丁酸(EP133,988)。
如乙烯-乙烯乙酸和乳酸-乙二酸这样的多聚物能够使分子的释放超过100天,而某些水凝胶在较短的时间内释放蛋白质。如果被装在胶囊中的蛋白质在体内保留一段长时间,这些蛋白质也许会如同37℃时暴露于潮湿条件下一样地变性或聚集,而导致生物活性的丢失和可能的致免疫性变化。根据所涉及的机制,可以设计出合理的策略来维持蛋白质的稳定。例如,如果发现聚集的机制是由于分子间二硫键的互换而形成的S-S键,稳定的实现就可以通过:修饰羟基残基、从酸溶液中冻干、控制湿度、使用合适的附加剂和开发特殊的多聚物基质成份。
缓释巨核细胞生成蛋白组合物也包括了脂质体中的巨核细胞生成蛋白。含有巨核细胞生成蛋白的脂质体的制备方法根据:DE3,218,121;Epstein等,Proc.Natl.Acad.Sci.USA,82:3688-3692[1985];Hwang等,Proc.Natl.Acad.Sci.USA,77:4030-4034[1980];EP52,322;EP36,676;EP88,046;EP143,949;EP142,641;日本专利申请83-118008;美国专利号4,485,045和4,544,545和EP102,324。通常,脂质体是小的(约200-800埃)单层类型,其液体内容物中胆固醇的含量大于约30摩尔%,这是一个被调整到最佳巨核细胞生成蛋白治疗的比例。
剂量的多少由医生根据多种因素的考虑来确定,已知能改变药物作用的因素有:疾病的类型和严重程度、体重、性别、饮食、给药的方式和时间、施用的其他药物以及其他相关的临床因素。通常,每天的用量在每公斤体重0.1至100微克之间。较合适地,用量在每公斤体重0.1至50微克之间。更合适地,初期的用量在1至5微克/公斤/天之间。或者,剂量的范围与其他细胞因子相同,尤其是G-CSF、GM-CSF和EPO。治疗的有效剂量可通过离体或在体方法确定。
                       实施例
在没有进一步说明的情况下,通过使用以下所描述和说明的实施例,可以相信本领域一般技术人员可以最大程度地利用和实现本发明。以下的实施例是本发明极好的具体表现,但本发明的范围并不局限于这些。
                       实施例1
                 猪mpl配体的部分纯化
由正常的或再生障碍性贫血的猪收集缺少血小板的血浆。通过使用4mEV线性加速器对猪进行900cGy的照射使猪发育不全。照射后的猪通过肌肉注射cefazolin继续维持6-8天。然后在一般的麻醉法下取出它们的全部血液,肝素抗凝,并在1800×g下离心30分钟来产生缺少血小板的血浆。巨核细胞刺激活性在照射6天后达到高峰。
取自照射后猪的再生障碍性猪血浆用4M NaCl处理,并于室温下搅拌30分钟。通过在Sorvall RC3B上以3800rpm(转/分)离心以除去所得的沉淀,并将上清液移至一个用含有4M NaCl的10mMNaPO4平衡的Phenyl-Toyoperal柱中(220ml)。该柱用此缓冲液洗涤至A280<0.05并用重蒸水(dH2O)洗脱。洗脱的蛋白峰用重蒸水溶解至传导率15mS并上样至一用PBS平衡的(Blue-Sepharose)柱中(240ml)。然后,柱用分别含有2M尿素的5倍体积PBS和10mM NAPO4(pH7.4)洗涤。用含有2M尿素和1M NaCl的10mMNaPO4(pH7.4)将蛋白质从柱中洗脱。洗脱的蛋白峰用0.01%正辛基葡糖苷(正辛基β-D-葡糖吡喃糖苷)和1mM的EDTA和Pefa-bloc(Boehinges Mannheim公司)处理,然后直接上样于串联的CD4-IgG(Capon,D,.J.等Nature 337:525-531[1989])和mpl-IgG Ultralink(Pierce)柱(见下述)。当样品被装入并且mpl-IgG(4ml)柱被用10倍体积的PBS和含有2M NaCl的PBS洗涤并且用0.1M pH2.25的甘氨酸-HCl洗脱后,去除CD4-IgG柱(2ml)。洗脱组分惧于1/10体积的1M Tris-HCl(pH8.0)中。
通过在还原条件下进行SDS-PAGE(4-10%,Novex胶)电冰来分析由mpl-亲和柱洗脱的蛋白组分。结果显示存在几种蛋白质。蛋白质通过银染法证明了几种蛋白质的分子量为66,000、55,000、30,000、28,000和14,000。为了确定这些蛋白质中哪种能够促进Ba/F3-mpl细胞培养物的增殖,这些蛋白用如下实施例2中描述的方法从胶中洗脱。
               Ultralink亲和柱
10-20mg溶解于PBS的mpl-IgG或CD4-IgG与0.5克的Ul-tralink树脂(Pierce)偶联(根据制造商的说明)。
               mpl-IgG的构建和表达
一种包含人mpl的全部胞外结构域(氨基酸1-491)的人IgG1的Fc区域的嵌合分子在293细胞中表达。一个编码人mpl的氨基酸1-491的cDNA片段通过从人巨核细胞CMK细胞cDNA库中进行PCR而获得并进行测序。在5′端插入一个Cla1位点,3′端插入一个BstEII位点。因为在DNA编码的mpl胞外结构域中有2个BstEII位点,该PCR产物被部分消化后克隆于Bluescropt载体上Cla1和BstEII之间的IgG1Fc编码区域的上游。mpl PCR产物3′端引入的BstE11位点是用于与Fc区域一起位于mpl胞外结构域的框架中。所得的构建物被亚克隆入pRK5-tkneo载体的ClaI和XbaI位点之间并通过磷酸钙法转染入293人胚肾细胞。通过用0.4mg/ml的G418筛选转化细胞并分离单个克隆。通过使用人Fc特异的ELISA来确定分离克隆的mpl-IgG表达。最好的表达克隆具有1-2mg/ml的mpl-IgG表达水平。
                Ba/F3 IgG P表达细胞
一个相应于人mpl P完整编码区域的cDNA被克隆入pRK5-tkneo,然后用NotI使之线性化并通过电穿孔法(1×107细胞,9605F,250伏)将其转染入IL-3依赖的细胞系Ba/F3中,三天后,用2mg/ml G418开始筛选。通过在96孔板中的有限稀释来筛选集合的或单个的克隆。筛选的细胞保持于含有15%FBS、1mg/ml G418、20mM谷氨酰胺、10mM HEPES和100μg/ml Pen-Strep的RPMI中。通过使用抗mpl P兔多克隆抗体进行FACS分析来确定筛选克隆中的mpl P的表达。
                Ba/F3 mpl配体检测
mpl配体的检测如图2所示。为了确定各种来源的mpl配体的存在,mpl P Ba/F3细胞在缺乏IL-3时以5×105细胞/ml的密度在湿度培养箱中(37℃,5%的CO2和空气)培养24小时。IL-3饥饿处理后以每200μl培养基50,000细胞的密度将细胞置于96孔培养板上,其中含有或不含有洗脱的样品,在细胞培养箱中培养24小时。在最后的6-8小时,20μl没有RPMI培养基但含有1μCi3H-胸苷的血清被加于各孔中。然后用96孔GF/C过滤板收集细胞,并用水洗涤5次。过滤物在40μl闪烁液体(Microsciut 20)存在下用PackardTop Count计数仪计数。
                实施例2
          高度纯化的猪mpl配体
               胶洗脱步骤
等体积亲和纯化的mpl配体(洗脱自mpl-IgG柱的组分6)和2倍Laemmli样品缓冲液在没有还原试剂存在的情况下室温混合并尽可能快地上样于Novex 4-2%聚丙烯酰胺凝胶中。样品不用加热。作为对照,没有配体的样品缓冲液在邻近的泳道电泳。凝胶在4-6℃于135伏电泳2小时15分钟。电泳缓冲液开始时为室温。凝胶从凝胶盒中移出并且凝胶板置于移出凝胶的一面。
如下将缔造胶复制于硝酸纤维膜上:一张硝酸纤维素膜被用无菌水湿润后小心置于暴露的凝胶面上,赶走气泡。准标被置于硝酸纤维膜和凝胶板上,以便在染色后准确地进行复制物的重定位。大约2分钟后,小心移去硝酸纤维素膜,用塑料膜包封凝胶并置于冰箱中。硝酸纤维素膜用Biorad′s fold tolal prorcin stain染色,首先将膜在3×10ml 0.1% Tween 20+0.5M NaCl,+0.1M Tris-HCl pH7.5中搅动超过45分钟,接着在3×10ml纯水中超过5分钟。然后加入gold stain直至标准品出现条带。再用水漂洗膜上的复制物,将其置于凝胶的塑料膜上,小心与准标对齐,标记凝胶上Novex标准样品的位置并且划线指示需切割的部分。弃去硝酸纤维膜和塑料膜,用一锋利剃刀沿指示线切割凝胶。所切割的部分应超过样品泳道以便当胶被染色时可以用来确定切割部分位置。当移去切割部分后,剩余的胶进行银染并测量标准样品和切割部分的位置。由Novex标准样品来确定与切割部分相对应的分子量。
12个凝胶部分被置于Biorad型号422的电洗脱仪的槽中。12-14K分子量截断膜盖被用于槽中。50mM碳酸氢铵和0.05%SDS(大约pH7.8)是洗脱缓冲液。一升缓冲液在使用前于冷室中(4-6℃)预冷约1小时。凝胶切割部分在4-6℃冷室中于10ma/槽(初始40伏)进行冼脱。洗脱大约需4小时。小心移去槽并用移液器移去孔上的液体。用移液器移去截断膜盖上的液体并保存,将50微升等分的纯水置于膜盖上,搅动SDS晶体溶解后移去。这些液体与以上所保存的液体一起。每个凝胶部分的全部洗脱样品体积约为300-500μl。样品被置于预先已于纯水中浸泡数小时的10mm Spec-trapor 4 12-14K截断透析管中。它们在4-6℃下每六个样品对600ml磷酸盐缓冲液(PBS大约是4mM钾离子)透析过夜。第二天替换缓冲透析2.5小时,从透析袋中移去样品,并置于微型离心管中,离心管在冰上置放1小时后,于14,000 2pm离心3分钟,小心自SDS沉淀上移出上清,然后将上清在冰上放置约1小时或更长并再次离心4分钟,上清稀释于磷酸盐缓冲液中以进行活力测定,其余的样品冻存于-70℃。
                实施例3
              猪配体微测序
由mpl-IgG亲和柱得到的组分6(2.6ml)在Microcon-10(Amicou)上浓缩。为了防止mpl配体吸附于Microcon,用1%SDS漂洗膜并且将5μl 10%SDS加至组分6中。在Microcon上浓缩后(2μl),将2倍样品缓冲液(20μl)加至组分6中,所有体积(40μl)被加入4-20%丙烯酰胺梯度凝胶(Novex)的单个泳道内。凝胶按Novex程度电泳。然后将凝胶平衡5分钟,于包含10%甲醇的10mM 3-环己基氨基-1-丙磺酸(CAPS)缓冲液(pH11.0)中电印迹。电印迹至Immobilon-PSQ膜(Millipore)进行45分钟,于250mA恒定电流下在Biohad Trans-Blot transfer call中进行。PVDF膜在溶于40%甲醇、0.1%乙酸的0.1%考马斯亮蓝R-250溶液中染色1分钟。然后用溶于50%甲醇中的10%乙酸脱色2-3分钟。唯一可见的在印迹的分子量18,000-35,000范围内的蛋白质分子量为30,000、28,000和22,000。
30、28和22KDa的蛋白条带被进行测序,自动蛋白测序于配备一个PTH分析仪的470型号apploed Biosystem测序仪上。测序仪被改进为注入80-90%的样品(rodrignez,J.Chromatogr.,350:217-225(1985))。丙酮(约12μl/l)被加入溶剂A以平衡紫外(UV)吸收。电印迹的蛋白质于Blott胶片中测序。蛋白峰通过NelsonAnalytical 970界面进入Justice lnnovation软件。序列译解分析于VAX5900上进行(Henzel et al.,J.Chromatogr.,404:41-52(1987))N-末端序列(用一个字母表示括号内不确定残基)和所得材料的数量(方括号内)结果见表2′。
                     表2′
               mpl配体氨基端序列
30 kDa       [1.8pmol]1        5        10        15        20            25(S)P A P P A(C)D P R L L N K L L R D D(H/S)V L H (G)R L (SEQ ID NO:30)
28 kDa       [0.5pmol]1        5        10       15         20          25(S)P A P P A X D P R L L N K L L R D D(H)V L (H) G R (SEQ ID NO:31)
18-22 kDa   [0.5pmol]1       5        10X P A P P A X D P R L X (N)(K) (SEQ ID NO:32)
                实施例4
        液体悬浮巨核细胞生成检测
人外周干细胞(PSC)(取自经同意的病人)用IMDM培养液(Gibco公司)稀释5倍,然后于室温下以800×g离心15分钟,细胞沉淀重新悬浮于IMDM培养基并且铺板于60%的Percoll上(密度为1.077mg/ml)(Pharmacia公司)并于800×g离心30分钟。位于界面的低密度单核细胞被抽出并用IMDM洗二次,然后铺于含30%FBS(终体积为1ml)的IMDM中(密度为1-2×106细胞/ml),置于24孔组织培养板(Costar公司)。App或缺少APP的mpl配体被加至10%,并且培养物于湿度培养箱中(37℃,含5%CO2和空气)培养12-14天。在培养天数0、2、4时在含有0.5μg mpl-IgG的10%APP存在下继续培养。通过mpl-IgG亲和柱来去除mpl配体中的APP。
为了定量分析这些液体悬浮培养物中的巨核细胞生成,采用Solberg等改进的方法以及利用放射性标记的针对GPIIbIIIa的鼠IgG单克隆抗体(HP1-1D)(由Nichols博士提供,Mayo Cilinic)100μg的HP1-1D(参见Grant,B等,Blood 69:1334-1339(1987))用1mCi Na125I根据制造商说明的酶珠法(Enzymobeads)(Biorad,Richmond,CA)进行放射性标记。放射性标记的HP1-1D储存于含0.01%正辛基-葡糖苷的PBS中,存放于-70℃。典型的特异性活力为1-2×6cpm/μg(由12.5%三氯乙酸沉淀时超过95%)。
液体悬浮培养物在每个实验步骤进行三次。12-14天培养后,1ml培养物被转移至1.5ml的Eppendorf管中并于室温下以800×g离心10分钟。所得的细胞沉淀重悬浮于含有0.02%EDTA和20%小牛血清的100μl PBS中。50μl的检测缓冲液(含10ng1251-HP1-1D)被加至重悬浮的培养物中并于室温下孵育60分钟,偶而摇动。然后,通过以800×g在室温下离心10分钟来收集细胞。并用检测缓冲液洗2次。沉淀用γ计数器(Packazd公司)计数1分钟。非特异性结合通过在加入标记的HP1-1D前加入1μg非标记的HP1-1D(60分钟)来确定。特异性结合通过用总的1251-HD1-1D的结合减去在过量非标高HP1-1D存在下的结合来确定。
                实施例5
            寡核苷酸PCR引物
基于由30kDa、28kDa和20kDa所得的氨基-末端的氨基酸顺序,简并性寡核苷酸被设计用于聚合酶链反应(PCR)的引物(见表4)。两个引物集合物被合成,正义10聚体集合物编码氨基酸残基2-8(mpl 1),反义21聚体集合物编码氨基酸18-24(mpl 2)。
                      表4
             简并寡核苷酸引物集合物
mpl 1:5′CCN GCN CCN CCN GCN TGY GA 3′(2.048-倍 简并) (SEQ ID NO:35)
mpl 2:5′NCC RTG NAR NAC RTG RTC RTC 3′(2.048-倍 简并) (SEQ ID NO:36)
由猪外周血液淋巴细胞分离的猪基因组DNA被用做PCR的模板。50μl的反应体系包括:0.8μg溶于10mM Tris-HCl(pH8.3)中的猪基因组DNA、50mM KCl、3mM MgCl2、100μg/ml BSA、400μM dNTPs、1μM各个引物集合物和2.5单位Taq聚合酶。初始模板变性为94℃8分钟,然后35个循环为94℃45秒、55℃1分钟、72℃1分钟。最后一个后接72℃延伸10分钟。PCR产物于12%聚丙烯酰胺凝胶上电泳分离并用溴化乙银染色来鉴别。如果氨基末端的氨基酸由单一密码子来编码,正确的PCR产物应为69碱基。这种大小的一个DNA片段被从胶中洗脱并亚克隆入pGEMT(Promega公司)。三个克隆的序列见下表5。
                          表569bp猪基团组DNA片段
 gemT35′CCAGCGCCGC CAGCCTGTGA CCCCCGACTC CTAAATAAAC TGCCTCGTGA3′GGTCGCGGCG GTCGGACACT GGGGGCTGAG GATTTATTTG ACGGAGCACTTGACCACGTT CAGCACGGC[69bp](SEQ ID NO:37)ACTGGTGCAA GTCGTGCCG      (SEQ ID NO:38)
 gemT75′CCAGCACCTC CGGCATGTGA CCCCCGACTC CTAAATAAAC TGCTTCGTGA3′GGTCGTGGAG GCCGTACACT GGGGGCTGAG GATTTATTTG ACGAAGCACTCGACCACGTC CATCACGGC[69bp](SEQ ID NO:39)GCTGGTGCAG GTAGTGCCG      (SEQ ID NO:40)
 9emT9P  R  L  L  N  K  L  L  R(SEQ IDNO:32)5′CCAGCACCGCCGGCATGTGACCCCCGACTCCTAAATAAACTGCTTCGTGACG3′GGTCGTGGCGGCCGTACACTGGGGGCTGAGGATTTATTTGACGAAGCACTGCATCATGTCTATCACGGT 3′(SEQ ID NO:41)TAGTACAGATAGTGCCA 5′(SEQ ID NO:42)
序列中有下划线的碱基为PCR引物的位置。这些结果证实了对30kDa、29kDa和20kDa蛋白质的氨基酸9-17所得到的N-末端序列并且指出这个序列由猪DNA的单一密码子编码。
                实施例6
             人mpl配体基因
基于实施例5的结果,一个被称为pR45的45聚体的脱氧寡核苷酸被设计和合成用来筛选基团组文库。45聚体具有以下序列:
5′GCC-GTG-AAG-GAC-GTG-GTC-GTC-ACG-AAG-CAG-TTT-ATT-TAG-GAG-TCG 3′
                    (SEQ ID No:28)
这个寡核苷酸用(γ32P)-ATP和T4激酶进行32P-标记并且三物在低严紧杂交和洗涤条件(实施例7)下对人基团组文库进行筛选。阳性克隆被挑选出并且纯化噬菌斑,通过限制酶切图谱和Southern印迹进行分析。克隆#4被选择出以进行进一步的分析。
一个2.8kb的可与45聚体杂并的Bam HI-XbaI片段被亚克隆入pBlupscript sk-。通过使用猪mpl配体DNA序列特异的寡核苷酸引物对这个克隆的DNA序列进行部分测序。所得的序列证明,与猪mpl配体同源的人DNA序列已被分离。序列中的一个EcoRI限制酶切位点被确定,从而可从2.8kb的Bam HI-XbaI片段上分离出来一个390bp的EcoRI-XbaI片段,并亚克隆入pBluescript sk-。
这个片段的双链都已被测序,人DNA序列及推导的氨基酸序列如图9(SEQ ID NOS 3和4)。用剪头指示出基团组序列中预测的内含子位置,并确定了一个假定的外显子(“外显子3”)。
对预测氨基酸序列的检测证实了一个丝氨酸残基是成熟mpl配体的第一个氨基酸,这与由氨基酸直接分析所得结果相同。紧接这个密码子上游序列的预测氨基酸很可能是涉及成熟mpl配体分泌的信号序列。这个信号序列的编码区域可能在核苷酸位置68处被一个内含子中断。
在3′方向上,外显子中止于核苷酸196。这个外显子编码一段42个氨基酸的序列,其中16个可能是信号序列的部分,26个是人成熟mpl配体的部分。
                实施例7
           全长人mpl配体cDNA
基于人的“外显子3”的序列(实施例6),合成2个与“外显子3”序列3′和5′端相对应的非简并寡核苷酸。
                  表6
     人cDNA非简并PCR寡核苷酸引物
正向引物:5′GCTAGCTCTAGAAATTGCTCCTCGTGGTCATGCTTCT 3′ (SEQ ID NO:43)
反向引物:5′CAG TCT GCC GTG AAG GAC ATG G 3′ (SEQ ID NO:44)
这两个引物被用于PCR反应,其中的模板DNA为来自于不同的cDNA文库或通过如实施例5所描述的来源于不同组织的1ngQuick Clone cDNA(Clonefeoh公司)。正确的PCR产物的预期大小为140bp。在12%聚丙烯酰胺凝胶上对PCR产物进行分析之后,一个来源于成人肾cDNA文库的预期大小的DNA片段被确定,该cDNA文库分别来自成人肾、293胎肾细胞和人胎肝(ClonerdchCat.#7171-1)。
筛选人基因组文库的45聚体寡核苷酸被用来筛选一个λDR2中的胎肝cDNA文库。使用T4多聚核苷酸激酶将(γ32-P)-ATP标记寡核苷酸。在低严紧杂交条件下对文库进行筛选。膜首先预杂交2小时,然后在20%甲酰胺、5×SSC、10×Denhardt′s、0.05M磷酸钠(pH6.5)、0.1%焦磷酸钠、50μg/ml鲑鱼精子DNA中于42℃与探针杂交过夜。然后用2×SSC漂洗膜,在42℃下于0.5×SSC、0.1%SDS中洗膜一次。然后膜与kodak X-Ray片曝光过夜。挑选阳性克隆纯化噬菌斑,用λDR2(clonetech cat.#6475-1)克隆中BamHI-XbaI两侧的寡核苷酸进行PCR来确定插入片段的大小。5μl的噬菌体储液用做模板。初始变性为94℃7分钟。然后进行30个循环的扩增(94℃1分钟;52℃1分钟和72℃1.5分钟),最后延伸为72℃15分钟,clone#Fl2b有一个1.8kb的插入片段并被选择出进行进一步的分析。
根据制造商的说明获得包含于λDR2噬菌体臂中的质粒pDR2(clonetech,λDR2和pDR2克隆和表达系统,实验室手册,p42)(clonerech,λDR2和pDR2克隆和表达系统。实验室手册p29-30)。用BamHI和XbaI对质粒pDR2-FL2b进行限制酶分析表明在大约650位置的插入片段中有一个BamHI限制酶切位点。用BanHI-XbaI对质粒进行消化,将插入片段切出2个片段,一个为0.65kb,另一个为1.15kb。对由质粒pDR2-FL2b得到的三种不同的模板进行序列测定,用AB1371(applied Biosystems,Foster City,California)自动荧光DNA测序仪,使用染料标记的双脱氧核苷三磷酸终止子(染料-终止子)的标准方法和传统的合成步移引物(Sanger等,Proc.Natl.Acad,Sci.USA,74:5463-5467(1977));Smith等,Natwre,321:674-679(1986))进行双链质粒DNA测序。质粒的PCR扩增产物的直接测充通过使用传统的引物和染料-终止子反应在AB1373测序仪上进行。单链模板用M13 Janus载体产生(DNASTAR公司,Madison,Wisconsin)(Burland等,Nucl,AcidsRes.,21;3385-3390(1993))。BamHI-XbaI(1.15kb)和BamHI(0.65kb)自段从质粒pDR2-FL2b中分离得到,在脱氧核苷酸存在下,其片段末端用T4 DNA聚合酶填平。然后亚克隆入M13 Janus的SmaI位点。用染料标记的M13的通用和反向引物或步移引物和染料终止子通过标准程序进行测序。使用步移引物和标准的双脱氧终止子化学(Sanger等,Proc.Natl.Acad,Sci,USA,74:5463-5467(1977))、33P标记的α-dATP和测序酶(United States Biochen-ital Corp.,Clevcland,Ohio),通过单链M13 DNA进行人工测序反应。用Sequencher V2.1b12(Gene Codes Corporation,Ann Ar-bor,Michigem)进行DNA序列分布分析。核苷酸和推导的hML序列见图1(SEQ ID NO:1)。
                实施例8
        人mpl配体(TPO)基因的分离
用pR45质粒对λ-Gem12中的人基因组文库进行筛选来分离人TPO基因的基因组DNA克隆,pR45是一个前文已描述过的寡核苷酸探针,它在低严紧条件下(见实施例7)或高度严紧条件下都可与一个对应于人mpl配体cDNA3′一半的片段杂交(从BamHI位点至3′端)。分离出两个跨度为35kb的重叠克隆。亚克隆含整个TPO基因的两个重叠片段(BamHI和EcoRI)并测序。该人基因的结构由7kb基因组DNA内的6个外显子构成(图14A,B和C)。所有外显子/内含子的连接边界都与哺乳动物的共有序列一致(Shapiro,M.B.等,Nucl.Acids Res.15:7155(1987))。外显子1和外显子2含5′非翻译序列和信号肽的最初4个氨基酸。分泌信号的其余部分和成熟蛋白的前26个氨基酸由外显子3编码。完整的羧基结构域和3′非翻译结构域以及红细胞生成素样结构域的~50个氨基酸由外显子6编码。与在ML-2(hTPO-2)中观察到的缺失相关的4个氨基酸由外显子6的5′末端编码。
                实施例9
        人mpl配体(hML)的瞬时表达
为了亚克隆含于pDR2-FL2b内的全长插入片段,用XbaI将质粒消化完全,然后用BamHI部分消化。凝胶电泳纯化对应于1.8kb插入片段的DNA片段并将其亚克隆入pRK5(pRK5-hmpl 1)(有关pRK5的构建参见美国专利No.5,258,287)并使其置于巨细胞病毒立即早期启动子的调控下。来自构建物pRK5-hmpl 1的DNA是通过PEG法制备的,并被转染入人胚肾293细胞,该细胞被培养于补充有F-12营养混合物、20mM Hepes(pH7.4)和10%胎牛血清的Dulbecco改进的Eagle培养基(DMEM)中。用磷酸钙法(Gorman,C.(1985)在DNA Cloning中:A Practical Approach(Glover,D.M.,编)Vol.II,pp.143-190,IRL Press,Woshing-ton,D.C.)转染细胞。转染后36小时,在增殖测定中,分析转染细胞上清液中的活性(实施例1)。只用pRK载体转染的293细胞的上清液对Ba/F3或Ba/F3-mpl细胞无刺激作用(图12A)。用pRK5-hmpl 1转染的细胞的上清液对Ba/F3细胞无作用但极大地刺激了Ba/F3-mpl细胞的增殖(如12A),由此表明该cDNA编码了一种有功能活性的人mpl配体。
                实施例10
      人mpl配体同种型hML2,hML3和hML4
为了鉴定hML的可变剪接形式,合成了对应于hML编码序列各末端的引物。这些引物被用于RT-PCR以扩增成人肝RNA。另外,构建了选定的目标区域侧翼的内引物(如下)并进行同样的使用。PCR产物末端的直接测序揭示了精确对应于分离自人胚肝基因文库cDNA序列的一段单一序列(见图1(SEQ ID NO:1)。但是,靠近EPO结构域C端一段区域(在PCR产物的中部)表现出一种复合序列形式,表明该区域中存在着可能的剪接变异体。为了分离这些剪接变异体,表7中提供的目标区域侧翼的引物在PCR中被用作成人肝cDNA的模板。
                         表7人ML同种型PCR引物
phmpllcdna.3el:5′TGTGGACTTT AGCTTGGGAG AATG3′ (SEQ ID NO:45)
Pbx4.f2:       5′GGTCCAGGGA CCTGGAGGTT TG 3′ (SEQ ID NO:46)
将PCR产物以平末端亚克隆入M13。对各亚克隆的测序揭示至少存在3种ML同种型。其中之一是hML(也称为hML332),它是最长的形式,与分离自胚肝文库的序列精确对应。(图11(SEQ IDNO:6、8、9、10)给出了所列的从最长hML到最短hML-4这4种人mpl配体同种型的序列。
                实施例11
人Mpl配体同种型和取代性变异体的构建和瞬时表达
     hML2、hML3和hML(R153A,R154)
利用重组PCR技术(Russell Higuchi,PCR Protocols,Aguide to Methods and Applications,Acad.Press,M.A.Innis,D.H.Gelfand,J.J.Sninsky&T.J.White编),由hML重建同种型hML2和hML3以及取代性变体hML(R153A,R154)。
在所有的构建中,所用的“外”引物列于表8,“重叠”引物列于表9。
                    表8
                  外引物
Cla.FL.F2:5′ATCGATATCG ATAGCCAGAC ACCCCGGCCA G 3′ (SEQ ID NO:47)
HMPLL-R:5′GCTAGCTCTA GACAGGGAAG GGAGCTGTAC ATGAGA 3′ (SEQ ID NO:48)
                表9
                重叠引物
hML-2:MLΔ4.F:5′CTCCTTGGAA CCCAGGGCAG GACC3′MLΔ4.R:5'GGTCCTGCCC TGGGTTCCAA GGAG3′ (SEQ ID NO:49)(SEQ ID NO:50)
hML-3:MLΔ116+:5′CTGCTCCGAG GAAAGGACTT CTGGATT 3′MLΔ116-:5′AATCCAGAAG TCCTTTCCTC GGAGCAG 3′ (SEQ ID NO:51)(SEQ ID NO:52)
hML(R153A、R154A):RR-KO-F:5′CCCTCTGCGT CGCGGCGGCC CCACCCAC 3′RR-KO-R:5′GTGGGTGGGG CCGCCGCGAC GCAGAGGG 3′ (SEQ ID NO:53)(SEQ ID NO:54)
全部PCR扩增都用克隆的Pfu DNA聚合酶(Stratagene公司),以下列条件进行:最初的模板变性为94℃、7分钟,然后循环30次(94℃,1分钟;55℃,1分钟;72℃,1.5分钟)。最后一轮在72℃延伸10分钟。用ClaI-XbaI消化PCR终产物,凝胶电泳纯化并克隆入pRK5tkneo。用各种构建物如前所述转染293细胞,用Ba/F3-mpl增殖测定分析上清液。在该测定中,hML-2和hML-3没有表现出可测得的活性,但是hML(R153A,R154A)的活性与hML相似表明在该双碱性位置的加工并不是活性所必须的(见图13)。
                实施例12
             鼠mpl配体cDNA
            mML、mML-2和mML-3
             mML cDNA的分离
利用PCR获得一段对应于人mpl配体全编码区域的DNA片段,凝胶电泳纯化并利用有32P-dATP和32P-dCTP存在的随机引物法进行标记。将该探针用于筛选λGT10中的鼠肝cDNA文库的106克隆(Clontech cat# ML3001a)。
取复制的滤膜在35%甲酰胺、5×SSC、10×Denhardt′s、0.1%SDS,0.05M磷酸钠(pH6.5)、0.1%焦磷酸钠、100μg/ml超声波粉碎的鲑精子DNA中与探针杂交过夜。在2×SSC中漂洗滤膜、然后在0.5×SSC、0.1%SDS中42℃洗涤一次。纯化噬菌斑以得到杂交噬菌体,将cDNA插入片段亚克隆入Bluestript SK-质粒的Eco RI位置。挑选出带1.5kb的插入片段的“LD”克隆用于进一步的分析,如前述对人ML cDNA进行双链测序。图14(SEQ ID NO:1和11)提供了LD克隆的核苷酸序列和推导的氨基酸序列。推导的来自该克隆的成熟ML序列长331个氨基酸残基,确定为mML331(或出于下文的某些原因称为mML-2)。在这些ML的EPO样结构域中观察到了核苷酸序列和推导的氨基酸序列的高度一致性。但是,将人和鼠的ML的推导氨基酸序列对齐时,鼠的序列表现出有一个人残基111-114之间的四肽缺失,对应于在人(见上文)和猪(见下文)的cDNA都见到的618位核苷酸后的一段12个核苷酸缺失。所以,检查了另外的克隆以查找可能的鼠ML同种型。克隆“L7”有包含“丢失”四肽LPLQ的一段335氨基酸推导序列的一个1.4kb的插入片段。这种形式据信是全长鼠ML,被称为mML或mML335。图16(SEQ ID NO:12和13)给出了mML的核苷酸和推导的氨基酸序列。最后,分离出克隆“L2”并测序。该克隆有与hML3对应的116个核苷酸的缺失,所以命名为mML3。图16显示了这两者同种型的推导氨基酸序列的比较。重组mML的表达
鼠ML的表达载体的制备与实施例8中所述基本相同。编码mML和mML-2的克隆被亚克隆入pRK5tkneo,这是一个可以在CMV启动子和SV40聚腺苷酸化信号调控下表达的表达载体。利用磷酸钙法将所得的表达载体mML pRK5tkneo和mML2pRK5tkneo瞬时转染入293细胞。瞬时转染后,在条件培养基中培养5天。将细胞维持于补充有10%胎牛血清的高葡萄糖DMEM培养基中。鼠mpl(mmpl)在Ba/F3细胞中的表达
用mmpl pRK5tkneo转染来获取表达c-mpl的稳定细胞系,与实施例1中所述的对人mpl进行的方法基本相同。简而言之,利用电穿孔(5×106个细胞,250V,960μF)将含有鼠mpl的全编码序列(Skoda,R.C.等,EMBO J.12:2645-2653(1993))的表达载体(20μg;线性化的)转染入Ba/F3细胞,然后用2mg/ml G418进行新霉素抗性选择。用兔抗鼠mpl-IgG抗血清,通过流式细胞术分析评价mpl的表达。Ba/F3细胞被维持于来自作为IL-3源的WEHI-3B细胞的RPMI 1640培养基中。如实施例1所述,在转染了mmpl和hmpl的Ba/F3细胞中分析来自用mML和mML-2瞬时转染的293细胞的上清液。
                实施例13
              猪mpl配体cDNA
                pML和pML-2
利用RACE PCR分离猪ML(pML)cDNA。简而言之,根据编码纯化自再生障碍性贫血猪血清ML氨基端的猪ML基因的外显子序列,设计一段寡聚dT引物和2段特异性引物。获取由各种再生障碍性猪组织中制备的cDNA,并扩增。在肾中发现了一种1342bp的PCR cDNA产物并将其亚克隆。对几个克隆进行了测序,发现它们编码成熟的猪mpl配体(不包括完整的分泌信号肽)。该cDNA被发现编码一段具有图18(SEQ ID NO:9和16)所示序列的332氨基酸的成熟蛋白pML332
                方法:pML基因和cDNA的分离
用pR45筛选EMBL3(Clontech Inc)中的猪基因组文库来分离猪ML基因的基因组克隆。基因文库的筛选基本同实施例7所述。分离出几个克隆并对编码相同于得自纯化的ML氨基酸序列的外显子进行了测序。利用RACE PCR改进程序获取猪ML cDNA。根据猪ML基因序列设计两段特异性引物。基本如前所述,由再生障碍性贫血猪的肾分离聚腺苷酸化的mRNA。用与mRNA的聚腺苷酸尾直接相对的BamdT引物逆转录制备cDNA。
(BamdT:5′GACTCGAGGA TCCATCGATT TTTTTTTTTT TTTTT 3′)
                     (SEQ ID NO:55)
用ML特异性的h-正向-1引物
(h-正向-1:5′GCTAGCTCTA GAAATTGCTC CTCGTGGTCA TGCTTCT 3′)
                     (SEQ ID NO:43)
和BAMAD引物
      (BAMAD:5′GACTCGAGGA TCCATCG 3′)
                     (SEQ ID NO:56)在100ml反应体积中(50mM KCl、1.5mM MgCl、10mM Tris pH8.0、0.2mM dNTP,0.05U/ml Amplitaq聚合酶[Perkin ElmerInc.])进行PCR初扩增(循环28次:95℃60秒,58℃60秒,72℃90秒)。然后用ClaI消化PCR产物,用苯酚-氯仿(1∶1)抽提,乙醇沉淀,连接到已用ClaI和KpnI切割的Bluestript SK-载体(StratageneInc.)上。室温下培育2小时后,1/4的连接混合物被直接加入使用第二种特异性的前-1引物:
(正向-1:5′GCTAGCTCTA GAAGCCCGGC TCCTCCTGCC TG 3′)
                     (SEQ ID NO:57)和T3-21(与Bluestript SK-载体内多克隆区域附近的一段序列结合的一段寡核苷酸):
           5′CGAAATTAAC CCTCACTAAA G 3′
                 (SEQ ID NO:58)的第二轮PCR(如前所述循环22次)。得到的PCR产物用XbaI和ClaI消化,并亚克隆入Bluestript SK-。对得自独立PCR反应的几个克隆进行了测序。
又重复了一次,鉴定出第二种形式pML-2,它编码带4氨基酸残基缺失(328个氨基酸残基)的蛋白质(见图21[SEQ ID NO:21])。pML和pML-2氨基酸序列的比较显示,后一种形式除了缺失对应于残基111-114(包括端值)的QLPP四肽外完全一致(见图22[SEQ ID NO:18和21]。在鼠、人和猪中观察到的4氨基酸缺失出现在预测蛋白内完全相同的部分。
                实施例14
     血小板生成素(TPO)对血小板抗原
    GPIIbIIIa表达的诱导作用的CMK测试
CMK细胞被维持于补充有10%胎牛血清和10mM谷氨酰胺的RMPI1640培养基(Sigma公司)中。在测试的准备阶段,收获细胞,洗涤,并将其在补以5mg/l牛胰岛素,10mg/l脱铁运铁蛋白、1×微量元素的无血清GIF培养基中重悬成5×105细胞/ml。在一96孔平底板中,在每一孔中加入按适当比例稀释的100μl TPO标准或实验样品。将100μl CMK细胞悬浮液加入每一孔,将板在37℃、5%CO2的培养箱中培养48小时。培养后,板以100rpm在4℃离心5分钟。弃去上清液,在每一孔中加入FITC共轭的GPIIbIIIa单克隆2D2抗体。在4℃培养1小时后,测试板以1000rpm再离心5分钟。弃去含未结合抗体的上清液,在每一孔中加入200μl0.1%BSA-PBS洗液。0.1%BSA-PBS洗涤步骤重复三次。在FASCAN上利用测定相对荧光强度的单参数分析法分析细胞。
                实施例15
通过在96孔微量滴定板上测定DAMI细胞核内有丝分裂活性进行血小板生成素(TPO)的DAMI测定
DAMI细胞被维持于补充有10mM谷氨酰胺、100ng/ml青霉素G和50μg/ml链霉素的IMDM+10%马血清(Gibco公司)中。在测试准备阶段,收获细胞,洗涤,并在IMDM+1%马血清中重悬成1×106细胞/ml。在一96孔圆底测试板中,将100μl TPO标准或测试样品加入DAMI细胞悬浮液。然后在37℃、5%CO2培养箱中培养48小时。培养后,测试板在Sorvall 6000B离心机上以1000rpm、4℃离心5分钟。弃去上清液,重复200μl PBS-0.1%BSA的洗涤步骤。加入200μl冰冷的70%乙醇-PBS来固定细胞,并利用通气重悬。在4℃培养15分钟后,测试板以2000rpm离心5分钟,在每一孔中加入150μl含0.1mg/ml碘丙锭(propidim iodide)的1mg/mlRNAse(RNA酶)和0.05%Tween-20。在37℃培养1小时后,通过流式细胞术测定DNA含量变化。如下测定和定量多倍性:
正常化的多倍体比(NPR)=加TPO的(>G2+M的细胞%/<G2+M的细胞%)/对照的(>G2+M的细胞%/<G2+M的细胞%)
                实施例16
         血小板生成素的体内测试
            (鼠血小板回跳测试)
     用于血小板生成的体内35S确定的测定
在第一天给C57BL6鼠(得自Charles River)腹膜内(IP)注射1ml羊抗鼠血小板血清(6amps)以产生血小板减少。在第5天和第6天,给鼠IP两次注射因子或作为对照的PBS。在第7天,静脉注射溶于0.1ml生理盐水的30μCiNa2 35SO4,测定得自接受治疗和作为对照的鼠血样中注射剂量中的35S掺入循环血小板中百分比。同时对取自后眶窦血样中的血小板和白细胞进行计数。
                实施例17
通过测定mpl-Rse.gD嵌合受体磷酸化进行血小板生成素(TPO)的KIRA ELISA
Vigon等(PNAS,USA 89:5640-5644(1992))已揭示了人mpl受体。含mpl受体胞外结构域(ECD)和Rse的跨膜结构域(TM)以及胞内结构域(ICD)的嵌合受体(Mark等,J.of Biol.Chem.269(14):10720-10728[1994])与一种羧基端尾(flag)多肽一起被用于此处所述的KIRA ELISA。有关该测试的图示说明可参见图30和31。
(a)俘获剂的制备
用一种取自单纯疱疹病毒糖蛋白D的肽来产生单克隆抗gD(克隆5B6)(Paborsky等,Protein Engineering 3(6):547-553[1990])。将纯化的储备液在磷酸盐缓冲液(PBS)中调至3.0mg/ml、pH7.4,分成1.0ml的等份,保存于-20℃。
(b)抗磷酸酪氨酸抗体的制备
从UBI(Lake Placid,NY)购得单克隆抗磷酸酪氨酸抗体即克隆4G10,并利用长臂生物素-N-羟基琥珀酰胺(Biotin-X-NHS,Research Organics,Cleveland,OH)进行生物素标记。
(c)配体
利用本文所述的重组技术制备mpl配体。将纯化的mpl配体制成储备液保存于4℃。
(d)Rse.gD核酸的制备
合成的双链寡核苷酸被用于重建人Rse C端10个氨基酸(880-890)的编码序列并另外加上21个氨基酸,其中含抗体5B6的抗原决定基和一个终止密码子。表10表示了这种融合基因合成部分的最终序列。
                          表10
                人Rse融合基因的合成双链部分
编码链5′-TGCAGCAAGGGCTACTGCCACACTCGAGCTGCGCAGATGCTAGCCTCAAGATGGCTGATCCAAATCGATTCCGCGGCAAAGATCTTCCGGTCCTGTAGAAGCT-3′ (SEQ IDNO:59)
非编码(反义)链5′-AGCTTCTACAGGACCGGAAGATCTTTGCCGCGGAATCGATTTGGATCAGCCATCTTGAGGCTAGCATCTGCGCAGCTCGAGTGTGGCAGTAGCCCTTGCTGCA-3′ (SEQ IDNO:60)
该合成DNA在PstI与HindIII位置与编码人Rse的1-880氨基酸的cDNA连接,PstI位点起始于公开的人Rse cDNA序列第2644位核苷酸,而HindIII位点则在表达载体pSV17.ID.LL(参见图32,SEQ ID NO:22)的多接头中,连接后构建成表达质粒pSV.ID.Rse.gD。简而言之,该表达质粒含有一个二顺反子原初转录产物,其中含有由5′剪切供体和3′剪切受体内含子剪接位置界定的DHFR编码序列,其后是编码Rse.gD的序列。全长(非剪接的)信使RNA含有作为最初开放读框的DHFR,所以,可产生用于挑选稳定转化体的DHFR蛋白。
(e)mpl-Rse.gD核酸的制备
修饰如上产生的表达质粒pSV.ID.Rse.gD以生成质粒pSV.ID.M.tmRd6,该质粒含有与Rse.gD(氨基酸429-911)跨膜结构域和胞内结构域融合的人mplECD(氨基酸1-491)的编码序列。在Mark等,J.Biol.Chem.267:26166-26171(1992)中所述的两步PCR克隆反应中,用合成有寡核苷酸连接人mpl胞外结构域的一部分编码序列与Rse.gD编码序列。第一步PCR反应对mplcDNA模板所用的引物是M1:
             (5′-TCTCGCTACC GTTTACAG-3′)
                    (SEQ ID NO:61)
和M2:
           (5′-CAGGTACCCA CCAGGCGGTC TCGGT-3′)
                    (SEQ ID NO:62)
对Rse模板所用的引物是R1:
             (5′-GGGCCATGAC ACTGTCAA-3′)
                    (SEQ ID NO:63)
和R2:
(5′-GACCGCCACC GAGACCGCCT GGTGGGTACC TGTGGTCCTT-3′)
                    (SEQ ID NO:64)。
该融合连接体的PvuII-SmaI部分被用于构建全长嵌合受体。
(f)细胞的转化
用已在质粒构架的单一NotI位置打开成线形的pSV.ID.tm-Rd6电穿孔DP12.CHO细胞(1989年3月15日公告的EP307,247)。在酚/氯仿抽提后,乙醇沉淀DNA并重悬在20μl 1/10 TrisEDTA中。然后,在以400V、330μf电穿孔前将10μg DNA与107个CHO DP12细胞在冰上孵育10分钟。在非选择性培养基上铺平板前将细胞重新在冰中放10分钟。24小时后,给细胞补料以无核酸的培养基以挑选稳定的DHFR+克隆。
(g)用于KIRA ELISA的转化细胞的挑选
用检测gD决定基的抗体5B6通过SDS-PAGE对整个细胞裂解液的分离组分进行western印迹来鉴定表达mpl/Rse.gD的克隆。
(h)培养基
细胞在F12/DMEM 50∶50(Gibco/BRL,Life Technologies,Grand Island,NY)中生长。培养基被补以10%透滤过的FBS(Hy-Clone,Logan,Utah)、25mM HEPES和2mM L-谷胺酰胺。
(i)KIRA ELISA
将mpl-Rse.gD转化的DP12.CHO细胞加入平底96孔培养板,各孔为100μl培养基(3×104个/格),在37℃、5%CO2中培养过夜。次日早晨,倾析法去除上清液,将培养板置于纸巾上。每孔加入含实验样品或200、50、12.5、3.12、0.78、0.19、0.048或0ng/ml mpl的50μl培养基。在37℃刺激细胞30分钟,倾析法弃去上清液,再将培养板在纸巾上轻轻压干。为了裂解细胞并溶解嵌合受体,每孔加入100μl裂解缓冲液。裂解缓冲液由含50mM HEPES(Gibco)的150mM NaCl溶液、0.5%Triton-X 100(Gibco)、0.01%硫柳汞、30KIU/ML抑肽酶(ICN Biochemicals,Aurora,OH)、1mM 4-(2-氨基乙基)-苯磺酰基氟化氢(AEBSF;ICN Biochemicals)、50μM亮肽素(ICN Biochemicals)和2mM正钒酸钠(Na3VO4;Sigma Chemi-cal Co.St.Louis,MO)组成,pH7.5。培养板在培养板振荡器(Bell-co Istruments,Vineland,NJ)上室温下温和搅拌60分钟。
溶解细胞的同时,包被有4℃过夜的5B6单克隆抗体(在50mM碳酸盐缓冲液中配成5.0μg/ml,pH9.6,100μl/格)的ELISA微量滴定板(Nunc Maxiscorp,Inter Med,Denmark)倾去上清液,在纸巾上压干,用150μl/孔封闭缓冲液(含0.5%BSA(Intergen Compa-ny,Purchansa,NY)和0.01%硫柳汞的PBS)室温下封闭60分钟,同时温和搅拌。60分钟后,包被有抗gD56的试验板用自动洗板器(ScanWasher300,Skatron Instruments,Inc.Sterling,VA)以洗涤缓冲液(含0.05%Tween-20和0.01%硫柳汞的PBS)洗涤6次。
将含有从细胞培养物微量滴定孔中溶解的MPL/Rse.gD的裂解液(85μl/格)转移至包被有抗gD56且被封闭的ELISA孔中,室温下孵育2小时,同时温和搅拌。用洗涤缓冲液洗去未结合的mpl-Rse.gD,并在每孔中加入100μl按1∶18000稀释在稀释缓冲液(含0.5%BSA,0.05%Tween-20,5mMEDTA和0.01%硫柳汞的PBS)中的生物素标记的4G10(抗磷酸酪氨酸),即每孔加入56ng/ml。室温下孵育2小时后,洗板并每孔加入按1∶60000稀释在稀释缓冲液中的辣根过氧化物酶(HRPO)共轭的链霉亲和素(Zymed实验室,S.San Francisco,CA)。室温下,温和搅拌,孵育30分钟。游离的亲和素共轭物被洗去,每孔加入100μl新制备的底物溶液(N-四甲联苯胺(TMB);2组份底物套配试剂;Kirkegaard和Perry,Gaighersburg,MD)。反应10分钟,然后加入100μl/孔1.0mMH3PO4终止显色反应。参照650nm处的吸光度读出450nm处的值(ABS450/650),使用的是用Macintosh Centris650(Apple计算机,Cupertino,CA)和DeltaSoft软件(BioMetallics,Inc,Princeton,NJ)控制的vmax板读数器(Molecular Divices,Plao Alto CA)。
用200、50、12.5、3.12、0.78、0.19、0.048或0ng/ml mpl配体刺激dp12.trkA、B或C.gD细胞,利用DeltaSoft程序绘制成ng/mlTPO对平均ABS450/650±标准差的标准曲线。利用内插法由吸光度在标准曲线上读取样品浓度,表示为ng/mlTPO活性。
mpl-配体被发现能够以浓度依赖性或配体特异性方式激活mpl-Rse.gD嵌合受体。另外,mpl-Rse.gD KIRA-ELISA被发现能耐受高达100%的人血清(已显示)或100%的血浆(未显示),从而使该测试可用于方便地筛选病人和pK样品。
            293-产生的TPO332标准曲线
Figure A9419475101461
TPO EC50′s的概括
TPO类型(细胞) EC50(wt/v)  EC50(摩尔)
人TPO 322(293) 2.56ng/ml  67.4pM
鼠TPO 322(293) 3.69ng/ml  97.1pM
人TPO 153(293) ~41ng/ml  ~1.08nM
人TPO 155(E.coli) 0.44ng/ml  11.6pM
人TPO 153met(E.coli) 0.829ng/ml  21.8pM
                   实施例18
       用于血小板生成素的基于受体的ELISA
ELISA板包被以于pH9.6碳酸盐缓冲液中的兔F(ab′)2抗人IgG(Fc),于4℃放置过夜。用溶于PBS中的0.5%牛血清白蛋白室温下封闭1小时。在试验板上加含嵌合受体,mpl-IgG,的发酵器收获物并孵育2小时。在试验板中加入标准品(由293细胞产生的TPO332,其浓度由定量氨基酸分析确定)的两倍连续稀释液和在0.5%牛血清白蛋白、0.05%Tween20中连续稀释的样品,孵育2小时。用纯化的蛋白A、在E.coli中产生的TPO155的生物素标记的免抗体检测结合的TPO(孵育1小时),然后加入链霉亲和素-过氧化物酶(孵育30分钟)并以3,3′,5,5′-四甲联苯胺为底物。读取450nm处的吸光度。在每步之间都要洗涤试验板。为了进行数据分析,利用Kaleidagraph的4参数曲线拟合程序拟合一条标准曲线。由标准曲线计算样品的浓度。
                实施例19
        293细胞TPO的表达与纯化1. 293细胞表达载体的制备
通过以下列寡核苷酸为引物的PCR,可以得到相应于TPO整个开放读框的一个cDNA。
                    表11
                 293PCR引物
Cla.FL.F:5′ATC GAT ATC GAT CAG CCA GAC ACC CCG GCC AG 3′ (SEQ IDNO:65)
hmpII-R: 5′GCT AGC TCT AGA CAG GGA AGG GAG CTG TAC ATG AGA 3′ (SEQ IDNO:48)
在加入pfuDNA聚合酶(Stratagene公司)的反应中,PRK5-hmplI(参见实施例9)被用作模板。在最初的94℃7分钟变性之后,续以25个扩增循环(94℃,1分钟;55℃,1分钟和72℃,1分钟)。最后的延伸为72℃,15分钟。纯化PCR产物并在质粒pRK5tkneo的限制性位点Clal和Xbal之间克隆产物以获得载体pRK5tkneo.ORF,pPK5tkneo是修饰pRK5后得到的载体,能在胸苷激酶启动子的控制下表达新霉素抗性。相应于epo同源结构域的第二个构建物由同样的方法生成,但所用的引物正向为Cla.FL.F,反向为:
Arg.STOP.Xba:5′TCT AGA TCT AGA TCA CCT GAC GCA GAG GGT GGA CC 3′
                           (SEQ ID NO:66)
最后的构建物称为pRK5-tkneoEPO-D。这两个构建物的序列参见实施例7。2.人胚肾细胞的转染
用CaPO4方法将这两个构建物转染到人胚肾细胞中,参见实施例9。转染后24小时,在0.4mg/ml的G418中,开始选择对新霉素抗性的克隆。10至15天后,将单个的集落转移到96孔板中并使之生长至汇合。来自这些克隆的ML153和ML332在条件培养基中的表达可通过Ba/F3-mpl增殖测定来评估(参见实施例1)。3.rhML332的纯化
将293-rhML332培养基上样于在10mM磷酸钠pH7.4(缓冲液A)中平衡的Blue-Sepharose(pharmacia公司)柱。随后,各以10倍柱体积的缓冲液A和含2M脲的缓冲液A洗涤柱。然后,用含2M脲和1MNaCl的缓冲液A洗脱柱。接着,将Blue-Sepharose柱的洗脱集合物直接上样于用缓冲液A平衡的麦胚凝集素Sepharose柱。麦胚凝集素Sepharose柱的洗涤用10倍柱体积含2M脲和1MNaCl的缓冲液A,而洗脱用同样的缓冲液但还含有0.5M N-乙酰-D-葡糖胺。麦胚凝集素Sepharose柱的洗脱物上样于在0.1%TFA中平衡的C4高效液相色谱柱(synchrom公司)。C4高效液相色谱柱是用不连续的丙醇梯度来洗脱(0-25%、25-35%、35-70%)。发现rhML332在28-30%丙醇梯度区域被洗脱。通过SDS聚丙烯酰胺凝胶电泳,被提纯的rhML332在凝胶的68-80千道尔顿区域以一条宽带迁移(参见图15)。4.rhML153的纯化
293-rhML153条件培养基以与rhML332相同的方式在Blue-Sepharose上被分离。与上述方法相同,Blue-Sepharose洗脱物被直接上样于一个mpl亲和柱。在与上述rhML332相同的条件下,使用一个C4高效液相色谱柱纯化从mpl亲和柱上洗脱下来的rhML153,使之达到均一性。通过SDS聚丙烯酰胺凝胶电泳,再将被纯化的rhML153分离成两条主带和两条次带,分子量约18,000-21,000(参见图15)。
                实施例20
           CHO的TPO表达与纯化1.CHO表达载体的描述在下述的电穿孔法方案中使用的表达载体已经被指明:
pSV15.ID.LL.MLORF(全长的或hTPO332),和
pSV15.ID.LL.MLEPO-D(截短的或hTPO153)。有关这些质粒的性质见图23和图24。2.CHO表达载体的制备
通过以表12所示的寡核苷酸为引物的PCR,可以得到相应于TPO整个开放读框的一个cDNA。
                    表12
              CHO表达载体PCR引物
Cla.FL.F2 5′ATC GAT ATC GAT AGC CAG ACA CCC CGG CCA G 3′ (SEQ IDNO:47)
ORF.Sal 5′AGT CGA CGT CGA CGT CGG CAG TGT CTG AGA ACC 3′ (SEQ IDNO:67)
在加入pfuDNA聚合酶(Stratagene公司)的反应中,PRK5-hmplI(参见实施例7和9)被用作模板。在最初的94℃、7分钟变性之后,续以25个扩增循环(94℃,1分钟;55℃,1分钟和72℃,1分钟)。最后的延伸为72℃,15分钟。纯化PCR产物并在质粒pSV15.ID.LL的限制性位点Clal和Sall之间克隆产物以获得载体pSV15.ID.LL.MLORF。相应于epo同源结构域的第二个构建物由同样的方法生成,但所用的引物正向为Cla.FL.F2,反向为:
EPOD.Sal 5′AGT CGA CGT CGA CTC ACC TGA CGC AGA GGG TGG ACC 3′
                        (SEQ ID NO:68)最后的构建物被称为pSV15.ID.LL.MLEPO-D。这两个构建物的序列都参见实施例7和9。
本质上,全长和截短配体的编码序列被引入CHO表达载体pSV15.ID.LL的多克隆位点。该质粒含有SV40的早期启动子/增强子区域、一个含有鼠DHFR cDNA的修饰剪接单位、一个引入所需基因的多克隆位点(这里,TPO的序列已被描述)、一个SV40的聚腺苷酸化信号和复制起点,以及细菌中用于质粒选择和扩增的β内酰胺酶基因。3.建立稳定的表达重组人TPO332和TPO153的CHO细胞系的方法
a.CHO亲代细胞系的描述
本文所述用于TPO分子表达的宿主CHO(中国仓鼠卵巢)细胞系已知为CHO-DP12(参见1989年3月15日出版的EP307,247)。为了得到对胰岛素需求降低的克隆,用表达前胰岛素原的一个载体转染亲代系(CHO-K1 DUX-B11(DHFR-)-,经Dr.L.Chasin同意,从斯坦福大学的Dr.Frank Lee处得到),从克隆中选择出这个哺乳动物细胞系。这些细胞也是DHFR缺陷的,且通过在缺少核苷补充(甘氨酸、次黄嘌呤和胸苷)的培养基上的生长,对DHFR cDNA载体序列存在的选择而获得克隆。这一作为稳定表达CHO细胞系的选择系统是通常所使用的。
b.转染方法(电穿孔法)
TPO332和TPO153表达细胞系经电穿孔法转染DP12细胞而产生(参见如Andreason,G.L.J.Tiss.Cult.Meth.,15,56[1993]),并相应地使用线性化质粒pSV15.ID.LL.MLORF或pSV.ID.LL.MLEPO-D。对每一个质粒的切割建立了三个限制性酶反应:10微克、25微克和50微克载体及酶NOTI,并用标准的分子生物学方法。该限制性位点只在载体中发现一次,位于线性化区域3′和TPO配体转录单位以外(参见图23)。建立100微升反应体系并37℃温育过夜。第二天,用酚-氯仿-异戊醇(50∶49∶1)抽提一次并在干冰上用乙醇沉淀约1小时。然后,经15分钟微量离心分离和干燥收集沉淀物。将线性化的DNA重悬于50微升补充了标准抗生素和2mM谷氨酰胺的Ham′s DMEM-F12 1∶1培养基中。
收集悬浮生长的DP12细胞,在用于重悬DNA的培养基中洗涤一次并最终以每750微升107细胞的浓度重悬于同样的培养基中。细胞的等分试样(750微升)和每个线性化DNA混合物一起在室温中温育1小时,然后转移到一个BRL电穿孔槽中。接着,在350伏特、330微法和低电容的标准BRL电穿孔仪中电穿孔每一个反应混合物。在电穿孔之后,可将细胞在仪器中再放置5分钟,然后在冰上再培育10分钟。将电穿孔的细胞转移到60毫米细胞培养皿中,其中含有5毫升用于培养CHO细胞的标准完全培养基(High葡萄糖DMEM-F12 50∶50,不含甘氨酸,补充了1X GHT、2mM谷氨酰胺和5%胎牛血清),并在5%CO2细胞培养恒温箱中生长过夜。
c.选择和筛选方法
第二天,细胞以标准方法从平板上被胰酶消化并被转移到含有DHFR选择培养基的150毫米组织培养皿中(Ham′s DMEM-F12,1∶1培养基,如上所述,补充了2%或5%的透析胎牛血清,但缺少甘氨酸、次黄嘌呤和胸苷,这是我们所使用的标准DHFR选择培养基)。来自每一个60毫米平板的细胞随后被重新涂布到5/150平板。然后,细胞在37℃/5%CO2中温育10至15天(中间换一次培养基)直到克隆出现且达到适合转移到96孔板的大小。在过了4至5天后,用设置为50毫升的无菌移液管将细胞系转移到96孔板上。使细胞生长至汇合后(通常3至5天),胰酶消化培养皿并复制出原来培养皿的两个拷贝。这两个拷贝被短期储存于冷冻器,且每个孔中的细胞都稀释于50微升含10%FCS的DMSO中。通过基于Ba/F3细胞的活性测定,从第三个培养皿中的汇合生长孔测定5天不含血清的条件培养基中样品的TPO表达。基于这一测定的最高表达克隆从储存中复苏,并被扩大到两个汇合生长的150毫米T-烧瓶中,用于为了悬浮适应性、再测定和储存而进行的细胞培养物组的转移。
d.扩增方案
通过上述选择得到的几个最高效价的细胞系随后经标准氨甲喋呤扩增方法而生成更高效价的克隆。CHO细胞克隆被扩展并涂布于10厘米培养皿,其中有4个氨甲喋呤浓度(如50nM、100nM、200nM和400nM),2至3个细胞数量(每皿105、5×105和106个细胞)。然后,将这些培养物37℃/5%CO2温育,直至克隆形成且适合于转移到96孔板进行进一步的分析。从这一选择中得到的几个高效价克隆再被加入到更高浓度(如600nM、800nM、1000nM和1200nM)的氨甲喋呤中并如前所述,抗性克隆可以形成并被转移到96孔板中用于测定。4.培养表达重组人TPO332和TPO153的稳定CHO细胞系
储存的细胞被解冻,且在不含血清或含血清的培养基中,以标准的细胞生长方法将细胞群扩展。在扩展到足够的细胞密度后,洗涤细胞以除去不再使用的细胞培养基。然后,用任何标准方法培养细胞,包括分批培养、补料分批培养或者在25-40℃、中性pH值、溶氧含量不低于5%的条件下连续培养直至组成型分泌的TPO聚集。随后,以离心等机械方法将细胞培养液与细胞分离。5.来自CHO培养液的重组人TPO的纯化
收集到的细胞培养液(HCCL)被直接上样于Blue Sepharose 6Fast Flow柱(Pharmacia公司),柱的平衡用0.01M pH7.4的磷酸钠和0.15M NaCl,在直线流速约50毫升/小时/平方厘米时,按每升树脂约100升HCCL的比率来上样。然后,用3至5倍柱体积平衡液、续以3至5倍柱体积的0.01M磷酸钠pH7.4、2.0M脲和1.0MNaCl来洗涤柱。
然后,将含TPO的Blue Sepharose集合物上样于麦胚凝集素Sepharose 6MB柱(Pharmacia公司),柱的平衡用0.01M磷酸钠pH7.4,2.0M脲和1.0MNaCl,在直线流速约50毫升/小时/平方厘米时,按每毫升树脂约8至16毫升Blue Sepharose集合物的比率来上样。随后,以2至3倍柱体积的平衡缓冲液洗涤柱。接着,TPO的洗脱用2至5倍柱体积的0.01磷酸钠pH7.4、2.0M脲和0.5MN-乙酰-D-葡糖胺。
然后,将麦胚凝集素集合物的终浓度调整到0.04%C12E8和0.1%三氟醋酸(TFA)。得到的集合物被上样于C4反相柱(Vydac214TP1022),柱的平衡用0.1%TFA和0.04%C12E8,在流速为157毫升/小时/平方厘米时,按每毫升树脂约0.2至0.5毫克蛋白质的比率上样。
蛋白质在含0.1%TFA和0.04%C12E8的乙腈双相线性梯度中洗脱。第一相由15分钟内0-30%的乙腈线性梯度构成。第二相由60分钟内30-60%的乙腈线性梯度构成。在乙腈浓度约50%时,TPO被洗脱。在SDS聚丙烯酰胺凝胶电泳的基础上获得一个集合物。
然后,用2倍体积的0.01M磷酸钠pH7.4和0.15M NaCl稀释C4集合物,并以约6倍体积的0.01M磷酸钠pH7.4和0.15M Na-Cl在一个Amicon YM或有一个10,000至30,000道尔顿分子量截断的类透滤膜上透滤。得到的透滤液可随后经超滤进一步浓缩。透滤液/浓缩液被调整到一个0.01%吐温80的终浓度。
随后,等于总和柱体积2-5%的全部或部分透滤液/浓缩液被上样于Sephacryl S-300 HR柱(Phamacia公司),柱的平衡用0.01M磷酸钠、pH7.4、0.15M NaCl和0.01%吐温80,并以17毫升/小时/平方厘米的速率进行色谱分析。含有无聚集体或蛋白水解降解产物组分的TPO通过SDS聚丙烯酰胺凝胶电泳被集合。得到的集合物用0.22μ滤纸、Millex-GV或类似物过滤,并储存于2-8℃。
                实施例21
    大肠杆菌中TPO蛋白合成的转化与诱导1.大肠杆菌TPO表达载体的构建
质粒pMP21、pMP151、pMP41、pMP57和pMP202都被设计成用于表达在一个短前导区下游的,TPO前155个氨基酸,该短前导区因不同的构建物而有变化。这个前导区主要提供高水平的翻译起始和快速纯化。质粒pMP210-1、-T8、-21、-22、-24和-25被设计用于表达在一个起始甲硫氨酸下游的TPO前153个氨基酸,它们的区别仅在于对TPO前6个氨基酸的密码子的用法,其中质粒pMP251是pMP210-1的一个在TPO羧基末端延伸两个氨基酸而得到的衍生物。在色氨酸启动子的诱导下,所有的上述质粒能在大肠杆菌中产生高水平的TPO细胞内表达(Yansura,D.G.等,Method in Enzymology(Goeddel,D.V.,编辑)185:54-60,A-cademic Press,San Diego[1990])。质粒pMP1和pMP172是上述TPO细胞内表达质粒构建中的中间物。
(a)质粒pMP1
质粒pMP1是TPO前155个氨基酸的一个分泌型载体,它的构建是通过如图33所示的将5个DNA片段连接在一起。其中的第一个片段是已经除去短MluI-BamHI片段的pPho21载体。pPho21是phGH1(Chang,C.N.等,Gene 55:189-196[1987])的一个衍生物,其中人生长激素基因已经被大肠杆菌phoA基因替代,且在氨基酸20-21处的STII信号序列的编码序列中,已经插入一个Mlul限制性位点。
接下来的两个片段中,一个是来自pRK5-hmplI(实施例9)的258个碱基对的DNA HinfI-PstI片段,编码TPO氨基酸19-103,另一个是下述的编码氨基酸1-18的合成DNA:5'-CGCGTATGCCAGCCCGGCTCCTCCTGCTTGTGACCTCCGAGTCCTCAGTAAACTGCTTCGTG
     ATACGGTCGGGCCGAGGAGGACGAACACTGGAGGCTCAGGAGTCATTTGACGAAGCACTGA-5′
                        (SEQ ID NO:69)
                        (SEQ ID NO:70)这两个片段以T4 DNA连接酶预先连接,接着以PstI切割。第四个片段是一个来自pRK5hmpl I的152个碱基对的PstI-HaeIII片段,编码TPO的104-155位置的氨基酸。最后一个片段是一个来自pdh108的412个碱基对的StuI-BamHI片段,含有如上述的转录终止子λ(Scholtissek,S.等,NAR 15:3185[1987])。
(b)质粒pMP21
质粒pMP21是为了表达TPO的前155个氨基酸而设计出来的,该表达过程需要一个包含部分STII信号序列的13个氨基酸的前导区的帮助。如图34所示,该质粒的构建是通过将3个DNA片段连接在一起。其中的第一个是除去了短XbaI-SphI片段的载体pVEG31。载体pVEG是pHGH207-1(de Boer,H.A.等,in Pro-moter Structure and Function(Rodriguez,R.L.and Chamber-lain,M.J.,编辑),462,Praeger,New York[1982])的一个衍生物,其中的人生长激素基因被血管内皮生长因子基因所替代(同样的载体片段可以从稍后的质粒获得)。
连接的第二部分是有下述序列的合成DNA双螺旋:5′-CTAGAATTATGAAAAAGAATATCGCATTTCTTCTTAA
       TTAATACTTTTTCTTATAGCGTAAAGAAGAATTGCGC-5′
                   (SEQ ID NO:71)
                   (SEQ ID NO:72)最后一个片段是来自pMP1的1072个碱基对的MluI-SphI片段,编码TPO的155氨基酸。
(c)质粒pMP151
质粒pMP151是为了表达一个前导区下游的TPO前155个氨基酸而设计的,该前导区由STII信号序列的7个氨基酸、8个组氨酸和一个因子Xa断裂位点组成。如图35所示,pMP151通过三个DNA片段的连接而构建。其中的第一个就是上述的除去XbaI-SphI片段的载体pVEG31。第二个是有下列序列的合成DNA双螺旋:5'-CTAGAATTATGAAAAAGAATATCGCATTTCATCACCATCACCATCACCATCACATCGAAGGTCGTAGCC
     TTAATACTTTTTCTTATAGCGTAAAGTAGTGGTAGTGGTAGTGGTAGTGTAGCTTCCAGCAT-5′
                                 (SEQ ID NO:73)
                                 (SEQ ID NO:74)最后一个是来自pMP11的1064个碱基对的BglI-SphI片段,编码TPO的154氨基酸。除了在STII信号序列(该片段可从pMP1中获得)中一些密码子的变化外,质粒pMP11与pMP1完全一样。
(d)质粒pMP202
除了前导区中的因子Xa断裂位点被一个凝血酶断裂位点替代外,质粒pMP202与表达载体pMP151非常相似。如图36所示,pMP202通过连接3个DNA片段而构建。其中的第一个就是上述的除去短XbaI-SphI片段的pVEG31。第二个是有下述序列的DNA双螺旋:5′-CTAGAATTATGAAAAAGAATATCGCATTTCATCACCATCACCATCACCATCACATCGAACCACGTAGCC
    TTAATACTTTTTCTTATAGCGTAAAGTAGTGGTAGTGGTAGTGGTAGTGTAGCTTGGTGCAT-5′                  (SEQ ID NO:75)
                         (SEQ ID NO:76)最后一个片段是来自上述质粒pMP11的1064个碱基对的BglI-SphI片段。
(e)质粒pMP172
质粒pMP172是TPO前153个氨基酸的一个分泌型载体,也是构建pMP210的中间物。如图37所示,pMP172的制备通过将3个DNA片段连接在一起。其中的第一个是除去了短EcoRI-HindIII部分的载体pLS32lamB。第二个是来自上述质粒pMP11的946个碱基对的EcoRI-HgaI片段。最后一个片段是下述的合成DNA双螺旋。5′-TCCACCCTCTGCGTCAGGT          (SEQ ID NO:77)
     GGAGACGCAGTCCATCGA-5′  (SEQ ID NO:78)
(f)质粒pMP210
质粒pMP210是为了表达在一个翻译起始甲硫氨酸后的TPO前153个氨基酸而设计的。该质粒实际上被制成一个质粒库,其中TPO前6个密码子中的每一个都在第三个位置随机变化。如图38所示,该质粒由三个DNA片段通过连接而构建。其中的第一个是如上述的除去短XbaI-SphI片段的载体pVEG31。第二个是合成DNA双螺旋,首先用DNA聚合酶(Klenow)处理,然后用XbaI和HinfI消化,编码起始甲硫氨酸和TPO前6个随机密码子,其序列如下:5′-GCAGCAGTTCTAGAATTATGTCNCCNGCNCCNCCNGCNTGTGACCTCCGA
                                      ACACTGGAGGCT
GTTCTCAGTAAA        (SEQ ID NO:79)
CAAGAGTCATTTGACGAAGCACTGAGGGTACAGGAAG-5′(SEQ ID NO:80)第三个片段是来自pMP172的890个碱基对的HinfI-SphI片段,编码TPO的19-153氨基酸。
约3700个克隆的质粒pMP210库被重新转化到高四环素(50微克/毫升)LB平板上以选出高翻译起始克隆(Yansura,D.G.等,Methods:A Companion to Methods in Enzymology 4:151-158[1992])。在8个培养于高四环素平板的集落中,选出5个TPO表达最好的进行DNA测序,其结果如图39所示(SEQ ID NOS:23、24、25、26、27和28)。
(g)质粒pMP41
质粒pMP41是为了表达TPO前155个氨基酸而设计的,其中TPO已融入了由7个氨基酸的STII信号序列后接一个因子Xa断裂位点而组成的前导区。如图40所示,该质粒通过将3个DNA片段连接在一起而构建。其中的第一个是如上述的切除短XbaI-SphI片段的载体pVEG31。第二个是如下述的合成DNA双螺旋:5′-CTAGAATTATGAAAAAGAATATCGCATTTATCGAAGGT CGTAGCC   (SEQ ID NO:81)
    TTAATACTTTTTCTTATAGCGTAAATAGCTTCCAGCAT       (SEQ ID NO:82)最后的一个片段是来自上述质粒pMP11的1064个碱基对的BglI-SphI片段。
(h)质粒pMP57
质粒pMP57表达由9个氨基酸的STII信号序列和双碱性位点Lys-Arg构成的前导区下游的TPO前155个氨基酸。该双碱性位点提供了一个用蛋白酶ArgC除去前导区的方法。如图41所示,该质粒通过三个DNA片段的连接而构建。其中的第一个是上述的除去短XbaI-SphI片段的载体pVEG31。第二个是如下所示的合成DNA双螺旋:5′-CTAGAATTATGAAAAAGAATATCGCATTTCTTCTTAAA CGTAGCC    (SEQ ID NO:83)
       TTAATACTTTTTCTTATAGCGTAAAGAAGAATTTGCAT-5′ (SEQ ID NO:84)第三个片段是来自上述质粒pMP11的1064个碱基对的BglI-SphI片段。
(i)质粒pMP251
质粒pMP251是pMP210-1的一个衍生物,其中,在TPO的羧基末端加入两个氨基酸。如图42所示,该质粒由两个DNA片段连接而构建。其中的第一个是上述的除去短XbaI-SphI片段的pMP21。连接的第二部分是来自pMP210-1的316个碱基对的XbaI-ApaI片段。2.带有TPO表达载体的大肠杆菌的转化和诱导
使用氯化钙热休克法(Mandel,M.等,J.Mol.Biol.,53:159-162,[1970]),上述的TPO表达质粒可用于转化大肠杆菌菌株44C6(w3110 tonAΔ rpoHts lonΔ clpPΔ galE)。首先,使转化细胞在37℃和含50微克/毫升羧苄青霉素的LB培养基中生长,直到培养物的光密度(600纳米)达到约2至3。然后,在含0.49%酪蛋白氨基酸(w/v)和50微克/毫升羧苄青霉素的M9培养基中将LB培养基稀释20倍。在30℃换气条件下生长1小时后,加入吲哚-3-乙酸使终浓度为50微克/毫升。然后,使培养物在30℃和换气条件下继续生长15小时,最后用离心法收集细胞。
                实施例22
     大肠杆菌中生物活性TPO(Met-1 1-153)的产生
下述产生具有生物活性的重折叠TPO(Met-11-153)的程序可类似地应用于包括N和C末端延伸形式在内的其他TPO变异体的回收(参见实施例23)。A.不溶性TPO(Met-11-153)的回收
以上述方法发酵表达由质粒pMP210-1编码的TPO(Met-11-153)的大肠杆菌。通常,用Polytron匀浆器,使约100克细胞重悬于1升(10倍体积)细胞裂解缓冲液(10mM Tris、5mM EDTA,pH6),并以5,000×g离心细胞30分钟。再次用Polytron匀浆器将经洗涤的细胞沉淀重悬于1升细胞裂解缓冲液,并根据使用手册,使细胞悬浮液通过一台LH Cell Disrupter(LH Inceltech公司)或一台Microfluidizer(Microgluidics International公司)。将悬浮液5,000g离心30分钟后,再次重悬和离心以得到一个经洗涤的折射体沉淀。该经洗涤的沉淀需立即使用或冷冻储存于-70℃。B.单体TPO(Met-11-153)的增溶和纯化
由上述步骤得到的沉淀重悬于5倍体积(按重量计算)的20mMTris pH8,加入6-8M胍和25mM DTT(二硫苏糖醇),并在4℃下,搅拌1至3小时或过夜使TPO蛋白质增溶。也可使用高浓度的脲(6-8M),但与胍相比,通常得到的产量较低。增溶之后,30,000xg离心溶液30分钟以得到含变性单体TPO蛋白质的上清液。然后,将上清液以2毫升/分钟的流速在Superdex×200凝胶过滤柱(Pharmacia公司,2.6×60厘米)上色谱,并用含10mM DTT的200mM磷酸钠pH6.0洗脱。在160和200毫升之间洗脱的含单体变性TPO的组分被收集。TPO蛋白质在半制备的C4反相柱(2×20厘米VYDAC)上被进一步纯化。样品以5毫升/分钟的速率上样于用含30%乙腈的0.1%TFA(三氟醋酸)平衡的柱。以乙腈的线性梯度(60分钟内30-60%)洗脱蛋白质。在约50%乙腈浓度时,纯化的还原蛋白质被洗脱。该产物经重折叠后获得生物活性的TPO变异体。C.生物活性TPO(Met-11-153)的产生
在40毫升0.1%TFA/50%乙腈中的约20毫克单体、还原性和变性TPO蛋白质被稀释于360毫升重折叠缓冲液,其中最好含有下列试剂:50mM Tris0.3M NaCl5mM EDTA2%CHAPS去垢剂25%甘油5mM氧化谷胱甘肽1mM还原谷胱甘肽pH调节到8.3
在混合以后,4℃下温和搅拌重折叠缓冲液12至48小时,从而获得以正确的二硫键形式(参见下文)重折叠的TPO最高产量。然后,以终浓度0.2%TFA使溶液酸性化,经0.45或0.22微米的滤纸过滤溶液,并加入1/10体积的乙腈。该溶液随即被直接泵入C4反相柱并以与上文所述相同的梯度洗脱纯化的重折叠TPO(Met-11-153)。在这些条件下,有生物活性的重折叠TPO在乙腈浓度约45%时被洗脱。不适当的二硫键的TPO形式被较早地洗脱下来。经SDS凝胶和C4反相色谱分析的评估,最终的TPO(Met-11-153)纯度大于95%。对于动物研究,C4纯化的物质被透析入生理性可容缓冲液。使用含150mM NaCl和0.01%吐温80的等渗缓冲液(10mM乙酸钠pH5.5,10mM琥珀酸钠pH5.5或10mM磷酸钠pH7.4)。
由于TPO在Ba/F3测定中的高效价(约3皮克/毫升时达到最大刺激的一半),有可能使用许多不同的缓冲液、去垢剂和氧化还原条件来得到生物活性物质。但是,在大多数情况下,只能得到少量(<10%)适当折叠的物质。对于商业性制造过程,希望重折叠的产量至少10%,30至50%更好,而大于50%则最好。已经评估了许多不同的去垢剂(Triton X-100、十二烷基-β-麦芽苷、CHAPS、CHAPSO、SDS、十二烷基肌氨酸钠、吐温20和吐温80、Zwittergent3-14和其他去垢剂)对支持高重折叠产量的效能。在这些去垢剂中,只发现CHAPS家族(CHAPS和CHAPSO)通常能用于在重折叠反应中限制蛋白质聚集和不适当的二硫键形成。高于1%CHAPS的水平最起作用。最佳的产量需要氯化钠,其最适水平在0.1M和0.5M之间。加入EDTA(1-5mM)能限制某些制备物中的一些金属催化氧化作用(和聚集作用)。大于5%的甘油浓度提供了最适的重折叠条件。为了得到最高的产量,必需同时加入氧化和还原谷胱甘肽或者氧化和还原半胱氨酸作为氧化还原对。通常,在氧化还原对中的氧化剂等于或多于还原剂时,可观察到更高的产量。这些TPO变异体重折叠的最适pH值在7.5和约9之间。浓度为10至15%或更低的有机溶剂(如乙醇、乙腈和甲醇)可以被耐受。更高水平的有机溶剂增加不适当折叠形式的量。Tris和磷酸盐缓冲液通常是有用的。4℃温育也能得到适当折叠的TPO的更高水平。
通过第一个C4步骤纯化的TPO制备物中通常有40至60%的重折叠产量(根据用于重折叠反应的还原和变性TPO量)。在低纯度的制备物中(如直接在Superdex200柱或最初的折射体抽提之后)可以得到活性物质,虽然会因为TPO重折叠过程中过多的沉淀作用和非TPO蛋白质的干扰而使产量减少。
由于TPO(Met-11-153)含有4个半胱氨酸残基,它可能生成该蛋白质的三个不同的二硫键形式:
形式1:二硫键在半胱氨酸残基1-4和2-3之间
形式2:二硫键在半胱氨酸残基1-2和3-4之间
形式3:二硫键在半胱氨酸残基1-3和2-4之间。
在确定重折叠条件的最初尝试中,通过C4反相色谱分离出了几个含TPO蛋白质的不同峰。用Ba/F3测定法确定了其中只有一个峰有显著的生物活性。随后,调整重折叠条件以得到该形式的最高产量。在这些条件下,得到的全部单体TPO中,错误折叠形式低于10-20%。
通过质谱法和蛋白质测序,已经确定生物活性TPO的二硫键形式为1-4和2-3(即形式1)。多种C4分离峰的等分试样(5-10纳摩尔)用胰蛋白酶消化(胰蛋白酶与蛋白质的摩尔比为1∶25)。在DTT还原作用之前或之后,通过基质辅助的激光解吸质谱法,分析消化混合物。在还原作用之后,检测对应于TPO的大多数较大胰酶解肽的团块。在非还原样品中,这些团块中的一些消失了而新的团块可观察到。新峰的团块基本上对应于涉及二硫键对的单个胰酶解肽的数目。因此,有可能明确地确认重折叠、重组、生物活性的TPO的二硫键形式是1-4和2-3。这与相关的红细胞生成素分子已知的二硫键形式是一致的。D.重组、重折叠TPO(Met-11-153)的生物活性
重折叠和纯化的TPO(Met-11-153)在体内和体外的测定中都有活性。在Ba/F3测定中,在3.3皮克/毫升(0.3pM)时,掺入Ba/F3细胞的胸苷的刺激达到最大的一半。在基于mpl受体的ELISA中,1.9纳克/毫升时,达到最大活性的一半。在正常的和用低致死X射线处理的骨髓抑制动物中,TPO(Met-11-153)有刺激新的血小板生成的高潜力(在剂量低达30纳克/鼠时可见到活性)。
                实施例23
     大肠杆菌中其他生物活性TPO变异体的产生
下文提供了在大肠杆菌中产生的被纯化和重折叠成生物活性形式的三种不同TPO变异体。
(1)来自细菌的信号序列STII的MLF-13残基被融入TPO的N-末端结构域(残基1-155)。得到的序列为:
    MKKNIAFLLNAYASPAPPAC……CVRRA
            (SEQ ID NO:85)其中的前导序列为下划线部分,而C……C代表从半胱氨酸7到半胱氨酸151。该变异体的构建提供一个酪氨酸用于受体和生物研究的TPO放射性碘化作用。
(2)由STII序列、8个组氨酸残基和因子Xa酶断裂序列IEGR组成的H8MLF-7残基被融入TPO的N-末端结构域(残基1-155)。其序列为:
MKKNIAFHHHHHHHHIEGRSPAPPAC……CVRRA
           (SEQ ID NO:86)其中的前导序列为下划线部分,而C……C代表从半胱氨酸7到半胱氨酸151。当被纯化和重折叠时,该变异体可用酶因子Xa处理,因子Xa在序列IEGR的精氨酸残基后进行断裂,以产生一个长度为155个残基、有天然丝氨酸N-末端氨基酸的TPO变异体。
(3)除了一个凝血酶敏感序列IEPR被融入TPO的N末端结构域外,T-H8MLF-以与上述变异体(2)相同的方法制备。得到的序列为:
MKKNIAFHHHHHHHHIEPRSPAPPAC……CVRRA
         (SEQ ID NO:87)
其中的前导序列为下划线部分,而C……C代表从半胱氨酸7到半胱氨酸151。在纯化和重折叠之后,可用凝血酶处理该变异体以得到一个155个残基长度的TPO天然N-末端变异体。A.单体的生物活性TPO变异体(1)、(2)和(3)的回收、增溶和纯化
在大肠杆菌中能表达所有的变异体。如关于TPO(Met-11-153)的实施例22中所述,在折射体中发现了大多数变异体。可以用与实施例22所述相同的程序回收、增溶和纯化单体TPO变异体。使用与TPO(Met-11-153)所用相同的重折叠条件可获得30至50%的总产量。在重折叠之后,用如上文所述的乙腈梯度,通过0.1%TFA中的C4反相色谱,提纯TPO变异体。根据Ba/F3测定的评估,所有的TPO变异体(在它们的非蛋白水解形式)有生物活性,2-5pM时达到最大活性的一半。B.产生真N-末端TPO(1-155)的变异体(2)和(3)的蛋白水解过程
上述的变异体(2)和(3)被设计成在TPO的正常N-末端氨基酸残基前带有一个可酶致断裂的前导肽。在上述的变异体(2)和(3)的重折叠和纯化之后,每一个都被合适的酶消化。对于每一个变异体,通过向溶液中吹入缓气流氮来除去C4反相步骤中的乙腈。随后,如下文所述,用因子Xa或凝血酶处理两种变异体。
对于TPO变异体(2),将pH8的1M Tris缓冲液加入不含乙腈的溶液,使终浓度为50mM,且如有必要,将pH调节到8。加入NaCl和CaCl2,使浓度相应为0.1M和2mM。加入因子Xa(New EnglandBiolabs公司)使酶和变异体的摩尔比为1∶25到1∶100。室温温育样品1至2小时使断裂达到最大值,通过表明前导序列丢失的SDS凝胶上的迁移变化可以评估出这个最大值。随后,用与上述正确折叠变异体的纯化相同的梯度和条件,通过C4反相色谱纯化反应混合物。通过这些条件,未断裂的变异体B与断裂的变异体(2)分离。N-末端氨基酸为SPAPP,表示N-末端前导序列被成功地除去。因子Xa也在TPO结构域内产生不同数量的内部断裂;在位置118的精氨酸残基生成一个额外的N-末端序列TTAHKDP(SEQ ID NO:88)后,可以观察到断裂。在非还原SDS凝胶上,对应于因子Xa断裂的变异体,可以观察到约17,000道尔顿的单一条带;在还原SDS凝胶上,对应于在精氨酸118的断裂,可以观察到分子量约12,000和5,000道尔顿的两个条带。这一观察也证实了,该分子的两个部分通过第一和第四个半胱氨酸间的二硫键连在一起,这与上文所述胰酶消化实验结果的推断是一致的。在Ba/F3生物测定中,除去N-末端前导序列和带有内部断裂的纯化TPO(1-155)变异体能在0.2至0.3pM时达到最大活性的一半。
对变异体(3)来说,消化缓冲液含有pH8的50mM Tris、2%CHAPS、0.3M NaCl、5mM EDTA和人或牛凝血酶(Calbiochem公司),其中后者(酶)和TPO变异体蛋白质的重量比为1∶25至1∶50。消化作用为室温下2-6小时。通过上述的因子Xa断裂反应的SDS凝胶来评估消化进程。通常,大于90%的前导区断裂发生在这一时间。得到的TPO用如上所述的C4反相柱提纯并通过氨基酸测序显示出有所需的N-末端。如上述的通过因子Xa在精氨酸-苏氨酸键之间的内部断裂只得到很少量(<5%)。得到的TPO蛋白质有高生物活性,在Ba/F3测定中,0.2-0.4pM蛋白质能达到最高应答值的一半。在基于mpl受体的酶联免疫吸附测定中,2-4纳克/毫升的纯化蛋白质(120-240pM)能达到最高应答值的一半,而含有前导序列的完整变异体在两个测定中的效能都要降低5至10倍。对于动物研究,HPLC纯化的断裂蛋白质被透析入生理性可容的缓冲液,其中含有150mM NaCl、0.01%吐温80和pH5.5的10mM琥珀酸钠、或pH5.5的10mM乙酸钠、或pH7.4的磷酸钠。通过HPLC和SDS凝胶,纯化的蛋白质在4℃保存中可稳定几个星期。在正常的和骨髓抑制的鼠中,这一有真N-末端序列的纯化TPO是具有高度活性的,在低达30纳克/鼠的低剂量下,能促进血小板的生成。
                实施例24
               合成mpl配体
虽然通常用重组方法制备人mpl配体(hML),但是也可以通过合成的肽片段的酶促连接来合成,其方法如下文所述。hML的合成生产允许非天然氨基酸或合成功能物如聚乙二醇的掺入。以前,已经设计出了一个丝氨酸蛋白酶枯草蛋白酶DPN的突变体。构建枯草连接酶(subtiligase)(8221C/P225A),可用以有效地在水溶液中连接肽酯(Abrahmsen等,Biochem.,30:4151-4159[1991])。现在,已经表明,合成肽能够按顺序地被酶促连接并产生具有酶促活性的长肽和蛋白质如核糖核酸酶A(Jackson等,Science,[1994])。该技术使我们得以化学合成长的蛋白质,而在以前,长的蛋白质只能用重组DNA技术来制得。更详细的细节如下文所述。
使用枯草连接酶合成hML153的一般策略如方案1所示。以相应于蛋白质C-末端片段的完全去保护的肽为起点,将一条N-末端已保护的,C-末端激活的酯肽与枯草连接酶一起加入。当反应结束后,通过反相高效液相色谱分离出产物,并将保护基团从N-末端除去。连接下一个肽片段和去保护并使用一系列肽来重复这个过程直至得到全长的蛋白质。这个过程类似于这样的固相方法:一个N-末端被保护的、C-末端被激活的肽连接到前一个肽的N-末端,并使蛋白质按照C→N的方向合成。虽然因为每次配对将导致多达50个残基的加入且产物在每一次连接后被分离,但是较长的高纯度蛋白质能够以一个合理的产量被合成。
方案1.用枯草连接酶合成hML的策略
R-NH-肽2-CO-R′+H2N-肽1-CO2
                 ↓1)枯草连接酶
    R-NH-肽2-CO-NH-肽1-CO2
                 ↓2)Zn/CH3CO2H
    H2N-肽2-CO-NH-肽1-CO2
                 ↓3)重复1+2H2N-肽3-CO-NH-肽2-CO-NH-肽1-CO2
Figure A9419475101671
根据对枯草连接酶序列特异性以及对hML生物活性“EPO结构域”氨基酸序列的认识,我们将hML153分割成长度18至25个残基的7个片段。合成测试的连接四肽用以确定18至25聚体的合适的连接接合点。表13显示了这些测试连接的结果。
                    表13
hML测试连接。在22℃、100mM麦黄酮中,溶解供体和亲核体肽,使浓度为10mM。从1.6mg/ml(约70μM)的储备液中,取出连接酶并加入溶液,使终浓度为10μM。连接过程可过夜。产量根据相对于供体肽水解的连接百分率计算。
位点 供体(glc-K-NH2) 亲核WSG-NH2 水解% 连接%
1(23/24) HVLH(SEQ ID NO:89) SRLS(SEQ ID NO:90) 92 08
(22/23) SHVL(SEQ ID NO:91) HSRL(SEQ ID NO:92) 48 52
2(46/47) AVDF(SEQ ID NO:93) SLGE(SEQ ID NO:94) 22 78
3(69/70) AVTL(SEQ ID NO:95) LLEG(SEQ ID NO:96) 53 47
4(89/90) LSSL(SEQ ID NO:97) LGQL(SEQ ID NO:98) 95 05
(88/89) C(acm)LSS(SEQ ID NO:99) LLGQ(SEQ ID NO:100) 00 00
(90/91) SSLL(SEQ ID NO:101) GQLS(SEQ ID NO:102) 45 55
(88/89) CLSS(SEQ ID NO:103) LLGQ(SEQ ID NO:100) 90 10
5(107/108) LQSL(SEQ ID NO:104) LGTQ(SEQ ID NO:105) 99 01
(106/107) ALQS(SEQ ID NO:106) LLGT(SEQ ID NO:107) 70 30
6(128/129) NAIF(SEQ ID NO:108) LSFQ(SEQ ID NO:109) 60 40
根据这些实验,表14所示的连接肽应该被枯草连接酶有效地连接。对于每个供体酯肽都需要一个合适的N末端保护基团来防止自身连接。我们选择异烟酰(iNOC)保护基团(Veber等,J.Org.Chem.,42:3286-3289[1977]),因为它是水溶性的,能在固相肽合成的最后一步被掺入,并且它在用于去保护和将肽从固相树脂上分离下来的无水HF中能保持稳定。另外,在弱还原条件下(锌/乙酸),它能够在每一次连接之后从肽上被除去,从而生成一个用于随后连接反应的游离N末端。羟乙酸盐-赖氨酰-酰胺(glc-K-NH2)酯被用作激活C-末端,其根据是以前的实验显示它能被枯草连接酶有效地酰化(Abrahmsen等,Biochem.,30:4151-4159[1991])。被iNOC保护和被glc-K-amide激活的肽能使用标准的固相方法来合成,其要点见于方案2。然后,将肽按顺序连接直至生成完整的蛋白质,并且终产物在体外被重折叠。根据与EPO的同源性,相信在半胱氨酸残基7和151以及28和85之间会形成二硫化物对。只需在氧化环境中搅拌该还原物几个小时,就能使二硫化物氧化。重折叠产物随后用高效液相色谱法纯化并将含活性蛋白质的组分合并且冻干保存。另外,可用不同的方法来保护二硫化物以控制在特定的二硫化物对之间的一系列氧化作用。用乙酰胺甲基(acm)基团对半胱氨酸7和151的保护保证了28和85的氧化作用。随后,可将acm基团除去并将残基7和151氧化。反之,在需要一系列氧化作用来使折叠正确时,可将残基28和85用acm保护并氧化。或者,半胱氨酸28和85可被另一个除半胱氨酸以外的天然或非天然氨基酸置换,以保证半胱氨酸7和151的正确氧化。
                    表14.用枯草连接酶进行合成完整hML所使用的肽片段片段
序列1(SEQ ID NO:110)iNOC-HN-SPAPPACDLRVLSKLLRDSHVL-glc-K-NH2(1-22)2(SEQ ID NO:111)  iNOC-HN-HSRLSQCPEVHPLPTPVLLPAVDF-glc-K-NH2(23-46)3(SEQ ID NO:112)iNOC-HN-SLGEWKTQMEETKAQDILGAVTL-glc-K-NH2(47-69)4(SEQ ID NO:113)iNOC-HN-LLEGVMAARGQLGPTCLSSLL-glc-K-NH2(70-90)5(SEQ ID NO:114)iNOC-HN-GQLSGQVRLLLGALQS-glc-K-NH2(90-106)6(SEQ ID NO:115)iNOC-HN-LLGTQLPPQGRTTAHKDPNAIF-glc-K-NH2(107-128)7(SEQ ID NO:116)H2N-LSFQHLLRGKVRFLMLVGGSTLCVR-CO2(129-153)
完成肽连接的条件为25℃,100mM麦黄酮pH8(新鲜制备并经5μM滤纸的真空过滤排气)。通常,C-末端片段被溶解于缓冲液(2-5mM肽)中,且加入枯草连接酶10×储备液(pH8的100mM麦黄酮中,浓度1mg/ml)使最终的酶浓度达到约5μM。3至5摩尔的过量glc-K-NH2激活的供体肽随后以不溶性的固体形式加入并使混合物于25℃静止。连接的监测通过反相C18高效液相色谱分析(0.1%三氟醋酸中的CH3CN/H2O梯度)。连接产物通过制备的高效液相色谱纯化并冻干。异烟酰(iNOC)的去保护通过在乙酸中将由盐酸活化的锌屑与被保护的肽一起搅拌。锌屑通过过滤除去,乙酸则通过真空蒸发。得到的肽能直接用于下一步连接并重复上述过程。合成的hML153能够以类似上文所述的步骤连接于合成的或重组hML154-332,从而产生合成或半合成的全长hML。
合成的hML相对于重组体有很多优势。可以引入非天然的侧链以提高效能或特异性。可以掺入多聚体功能物如聚乙二醇,以增加作用的延续时间。例如,在一步或多步连接完成之前或之后,聚乙二醇可以被连接于个别片段的赖氨酸残基(表14)。蛋白酶敏感肽键可以被除去或改变以提高在体内的稳定性。另外,可以合成重原子衍生物以帮助确定结构。
方案2.用于片段连接的肽片段的固相合成
a)赖氨酰-对甲基苯hydrylamine(MBHA)树脂1(0.63meq./gm.,Advanced ChemTech)在甲基乙酰胺(DMA)溶液中和25℃时,与溴乙酸(5eq.)和二异丙基碳化二亚胺(5eq.)一起搅拌1小时,从而得到溴乙酸衍生物2。b)用DMA大量洗涤树脂并在二甲基甲酰胺(DMF)中和50℃时,与二碳酸钠一起搅拌24小时以酯化单个的Boc保护的氨基酸,从而得到相应的羟乙酸盐-苯丙氨酰-氨酰-树脂3。氨基乙酰化树脂用DMF(3×)和二氯甲烷(CH2Cl2)(3×)洗涤并可在室温保存数月。随后,可将树脂3上样于一台自动肽合成仪(Ap-plied Biosystems 430A)并使用标准固相程序(5)使肽延伸。c)用45%三氟乙酸的CH2Cl2溶液除去N-α-Boc基团。d)随后的Boc保护氨基酸(5eq.)预先用DMA中的苯并三唑-1-yl-oxy-tris-(二甲基氨基)磷鎓六氟磷酸盐(BOP,4eq.)和N-甲基吗啉(NMM,10eq.)激活并偶联1至2小时。e)除去最后的N-α-Boc基团(TFA/CH2Cl2)以得到4,并且如前文所述,通过在DMA中和25℃时与4-异烟酰-2-4-二硝基苯碳酸盐(3eq.)和NMM(6eq.)一起搅拌24小时,引入异烟酰(iNOC)保护基团。f)通过0℃无水HF(5%苯甲醚/5%乙基甲基sufide)处理1小时,使肽断裂和去保护,从而得到iNOC保护的,羟乙酸盐激活的肽5,并用反相C1 8高效液相色谱(CH3CN/水梯度,0.1%TFA)纯化。所有底物的鉴定由质谱法来完成。
* * * * * * * * * * * * * * * * * * * * * *
                 补充的可实现性
根据上述的说明和易获得的参考文献以及起始材料,可以实现权利要求书所提出的本发明内容。不过,申请人已经在AmericanType Culture Collection,Rockville,Md.,USA(ATCC)中保存了下列细胞系:
大肠杆菌,DH10B-pBSK-hmpl I 1.8,ATCC登记号CRL69575,1994年2月24日保存;
质粒,pSV15.ID.LL.MLORF,ATCC登记号75958,1994年12月2日保存;和
CHO DP-12细胞,ML 1/50 MCB(标记#1594),ATCC登记号CRL11770,1994年12月6日保存。
该保存物是在Budapest Treaty的规定下,受到微生物保存的国际性认可,并以专利程序及其规则(Budapest Treaty)为目的而制成的。这保证了自保存之日起,能维持有活力的培养物30年。在Bu-dapest Treaty规定的期限内,依据申请人和ATCC之间的协议,可以从ATCC得到所需的生物,其中ATCC应在有关的美国专利的保证下,确保不受限制的可获得性。被保存菌株的可获得性不能解释为:在违反由任何政府依据其专利法而授予的权利时对本发明的应用。
       * * * * * * * * * * * * * * * * * * *
虽然本发明的描述必然要结合优选例子和特定的操作性实施例,但是在阅读了前述的说明以后,只要不偏离本发明的精神和范畴,一名普通的技术人员将可以实现本文中所述的多种变化、等价物的置换和题材的变更。因此,本发明可以实现的方法不仅仅是本文中所特别描述的那些。因而,希望此处由书面专利赋予的保护只受本文所附权利要求书及其等价物的限制。
所有在本文中被引用的参考内容都籍此一并作为参考。
                    序列表(1)一般信息:(i)申请人:Genetech,Inc.
          Eaton,Dan L.
          de Sauvage,Frederic J.(ii)发明名称:血小板生成素(iii)序列数目:144(iv)通信地址:
   (A)地址:Genentech,Inc.
   (B)街道:460 Point San Bruno Blvd
   (C)城市:South San Francisco
   (D)州:加利福尼亚
   (E)国家:美国
   (F)邮编:94080(v)计算机可读形式:
   (A)记录介质类型:3.5英寸,1.44Mb软盘
   (B)计算机:IBM PC兼容型
   (C)操作系统:PC-DOS/MS-DOS
   (D)软件:WinPatin(Genentech)(vi)本申请数据:
   (A)申请号:08/374540
   (B)申请日:03-5月-1995
   (C)分类:(vii)在先申请数据:
   (A)申请号:PCT/US94/14553
   (B)申请日:28-12月-1994(vii)在先申请数据:
(A)申请号:08/249376
(B)申请日:25-5月-1994(vii)在先申请数据:
(A)申请号:08/223263
(B)申请日:04-4月-1994(vii)在先申请数据:
(A)申请号:08/196689
(B)申请日:15-2月-1994(vii)在先申请数据:
(A)申请号:08/348658
(B)申请日:02-12月-1994(vii)在先申请数据:
(A)申请号:08/185607
(B)申请日:21-1月-1994(vii)在先申请数据:
(A)申请号:08/348657
(B)申请日:02-12月-1994(vii)在先申请数据:
(A)申请号:08/176553
(B)申请日:03-1月-1994(viii)律师/代理人信息:
(A)姓名:Winter,Daryl B.
(B)登记号:32,637
(C)卷宗/档案号:P0871P5(ix)通讯信息:
(A)电话:415/225-1249
(B)传真:415/952-9881
   (C)电传:910/371-7168(2)SEQ ID NO:1的信息:(i)序列特征:
   (A)长度:353个氨基酸
   (B)类型:氨基酸
   (D)拓扑结构:线性(xi)序列描述:SEQ ID NO:1:Met   Glu   Leu   Thr   Glu   Leu   Leu   Leu   Val   Val   Met   Leu   Leu   Leu   Thr1                       5                             10                            15Ala   Arg   Leu   Thr   Leu   Ser   Ser   Pro   Ala   Pro   Pro   Ala   Cys   Asp   Leu
                    20                            25                            30Arg   Val   Leu   Ser   Lys   Leu   Leu   Arg   Asp   Ser   His   Val   Leu   His   Ser
                    35                            40                            45Arg   Leu   Ser   Gln   Cys   Pro   Glu   Val   His   Pro   Leu   Pro   Thr   Pro   Val
                    50                            55                            60Leu   Leu   Pro   Ala   Val   Asp   Phe   Ser   Leu   Gly   Glu   Trp   Lys   Thr   Gln
                    65                            70                            75Met   Glu   Glu   Thr   Lys   Ala   Gln   Asp   Ile   Leu   Gly   Ala   Val   Thr   Leu
                    80                            85                            90Leu   Leu   Glu   Gly   Val   Met   Ala   Ala   Arg   Gly   Gln   Leu   Gly   Pro   Thr
                    95                            100                           105Cys   Leu   Ser   Ser   Leu   Leu   Gly   Gln   Leu   Ser   Gly   Gln   Val   Arg   Leu
                    110                           115                           120Leu   Leu   Gly   Ala   Leu   Gln   Ser   Leu   Leu   Gly   Thr   Gln   Leu   Pro   Pro
                    125                           130                           135Gln   Gly   Arg   Thr   Thr   Ala   His   Lys   Asp   Pro   Asn   Ala   Ile   Phe   Leu
                    140                           145                           150Ser   Phe   Gln   His   Leu   Leu   Arg   Gly   Lys   Val   Arg   Phe   Leu   Met   Leu
                    155                           160                           165Val   Gly   Gly   Ser   Thr   Leu   Cys   Val   Arg   Arg   Ala   Pro   Pro   Thr   Thr
                    170                           175                           180Ala   Val   Pro   Ser   Arg   Thr   Ser   Leu   Val   Leu   Thr   Leu   Asn   Glu   Leu
                    185                           190                           195Pro   Asn   Arg   Thr   Ser   Gly   Leu   Leu   Glu   Thr   Asn   Phe   Thr   Ala   Ser
                    200                           205                           210Ala   Arg   Thr   Thr   Gly   Ser   Gly   Leu   Leu   Lys   Trp   Gln   Gln   Gly   Phe
                    215                           220                           225Arg   Ala   Lys   Ile   Pro   Gly   Leu   Leu   Asn   Gln   Thr   Ser   Arg   Ser   Leu
                    230                           235                           240Asp   Gln   Ile   Pro   Cly   Tyr   Leu   Asn   Arg   Ile   His   Glu   Leu   Leu   Asn
                    245                           250                           255Gly   Thr   Arg   Gly   Leu   Phe   Pro   Gly   Pro   Ser   Arg   Arg   Thr   Leu   Gly
                    260                           265                           270Ala   Pro   Asp   Ile   Ser   Ser   Cly   Thr   Ser   Asp   Thr   Gly   Ser   Leu   Pro
                    275                           280                           285Pro   Asn   Leu   Gln   Pro   Gly   Tyr   Ser   Pro   Ser   Pro   Thr   His   Pro   Pro
                    290                           295                           300Thr   Gly   Gln   Tyr   Thr   Leu   Phe   Pro   Leu   Pro   Pro   Thr   Leu   Pro   Thr
                    305                           310                           315Pro   Val   Val   Gln   Leu   His   Pro   Leu   Leu   Pro   Asp   Pro   Ser   Ala   Pro
                    320                           325                           330Thr   Pro   Thr   Pro   Thr   Ser   Pro   Leu   Leu   Asn   Thr   Ser   Tyr   Thr   His
                    335                           340                           345Ser   Gln   Asn   Leu   Ser   Gln   Glu   Gly
                    350               353(2)SEQ ID NO:2的信息:(i)序列特征:
   (A)长度:1795碱基对
   (B)类型:核酸
   (C)股性:单链   (D)拓扑结构:线性(xi)序列描述:SEQ ID NO:2:TCTTCCTACC  CATCTGCTCC  CCAGAGGGCT  GCCTGCTGTG  CACTTGGGTC  50CTGGAGCCCT  TCTCCACCCG  GATAGATTCC  TCACCCTTGG  CCCGCCTTTG  100CCCCACCCTA  CTCTGCCCAG  AAGTGCAAGA  GCCTAAGCCG  CCTCCATGGC  150CCCAGGAAGG  ATTCAGGGGA  GAGGCCCCAA  ACAGGGAGCC  ACGCCAGCCA  200GACACCCCGG  CCAGAATGGA  GCTGACTGAA  TTGCTCCTCG  TGGTCATGCT  250TCTCCTAACT  GCAAGGCTAA  CGCTGTCCAG  CCCGGCTCCT  CCTGCTTGTG  300ACCTCCGAGT  CCTCAGTAAA  CTGCTTCGTG  ACTCCCATGT  CCTTCACAGC  350AGACTGAGCC  AGTGCCCAGA  GGTTCACCCT  TTGCCTACAC  CTGTCCTGCT  400GCCTGCTGTG  GACTTTAGCT  TGGGAGAATG  GAAAACCCAG  ATGGAGGAGA  450CCAAGGCACA  GGACATTCTG  GGAGCAGTGA  CCCTTCTGCT  GGAGGGAGTG  500ATGGCAGCAC  GGGGACAACT  GGGACCCACT  TGCCTCTCAT  CCCTCCTGGG  550GCAGCTTTCT  GGACAGGTCC  GTCTCCTCCT  TGGGGCCCTG  CAGAGCCTCC  600TTGGAACCCA  GCTTCCTCCA  CAGGGCAGGA  CCACAGCTCA  CAAGGATCCC  650AATGCCATCT  TCCTGAGCTT  CCAACACCTG  CTCCGAGGAA  AGGTGCGTTT  700CCTGATGCTT  GTAGGAGGGT  CCACCCTCTG  CGTCAGGCGG  GCCCCACCCA  750CCACAGCTGT  CCCCAGCAGA  ACCTCTCTAG  TCCTCACACT  GAACGAGCTC  800CCAAACAGGA  CTTCTGGATT  GTTGGAGACA  AACTTCACTG  CCTCAGCCAG  850AACTACTGGC  TCTGGGCTTC  TGAAGTGGCA  GCAGGGATTC  AGAGCCAAGA  900TTCCTGGTCT  GCTGAACCAA  ACCTCCAGGT  CCCTGGACCA  AATCCCCGGA  950TACCTGAACA  GGATACACGA  ACTCTTGAAT  GGAACTCGTG  GACTCTTTCC  1000TGGACCCTCA  CGCAGGACCC  TAGGAGCCCC  GGACATTTCC  TCAGGAACAT  1050CAGACACAGG  CTCCCTGCCA  CCCAACCTCC  AGCCTGGATA  TTCTCCTTCC  1100CCAACCCATC  CTCCTACTGG  ACAGTATACG  CTCTTCCCTC  TTCCACCCAC  1150CTTGCCCACC  CCTGTGGTCC  AGCTCCACCC  CCTGCTTCCT  GACCCTTCTG  1200CTCCAACGCC  CACCCCTACC  AGCCCTCTTC  TAAACACATC  CTACACCCAC  1250TCCCAGAATC  TGTCTCAGGA  AGGGTAAGGT  TCTCAGACAC  TGCCGACATC  1300AGCATTGTCT  CATGTACAGC  TCCCTTCCCT  GCAGGGCGCC  CCTGGGAGAC  1350AACTGGACAA  GATTTCCTAC  TTTCTCCTGA  AACCCAAAGC  CCTGGTAAAA  1400GGGATACACA  GGACTGAAAA  GGGAATCATT  TTTCACTGTA  CATTATAAAC  1450CTTCAGAAGC  TATTTTTTTA  AGCTATCAGC  AATACTCATC  AGAGCAGCTA  1500GCTCTTTGGT  CTATTTTCTG  CAGAAATTTG  CAACTCACTG  ATTCTCTACA  1550TGCTCTTTTT  CTGTGATAAC  TCTGCAAAGG  CCTGGGCTGG  CCTGGCAGTT  1600GAACAGAGGG  AGAGACTAAC  CTTGAGTCAG  AAAACAGAGA  AAGGGTAATT  1650TCCTTTGCTT  CAAATTCAAG  GCCTTCCAAC  GCCCCCATCC  CCTTTACTAT  1700CATTCTCAGT  GGGACTCTGA  TCCCATATTC  TTAACAGATC  TTTACTCTTG  1750AGAAATGAAT  AAGCTTTCTC  TCAGAAAAAA  AAAAAAAAAA  AAAAA       1795(2)SEQ ID NO:3的信息:(i)序列特征:
   (A)长度:42个氨基酸
   (B)类型:氨基酸
   (D)拓扑结构:线性(xi)序列描述:SEQ ID NO:3:Leu   Leu   Leu   Val   Val   Met   Leu   Leu   Leu   Thr   Ala   Arg   Leu   Thr   Leu1                       5                             10                            15Ser   Ser   Pro   Ala   Pro   Pro   Ala   Cys   Asp   Leu   Arg   Val   Leu   Ser   Lys
                    20                            25                            30Leu   Leu   Arg   Asp   Ser   His   Val   Leu   His   Ser   Arg   Leu
                    35                            40          42(2)SEQ ID NO:4的信息:(i)序列特征:
  (A)长度:390碱基对
  (B)类型:核酸
  (C)股性:单链
  (D)拓扑结构:线性(xi)序列描述:SEQ ID NO:4:GAATTCCTGG  AATACCAGCT  GACAATGATT  TCCTCCTCAT  CTTTCAACCT  50CACCTCTCCT  CATCTAAGAA  TTGCTCCTCG  TGGTCATGCT  TCTCCTAACT  100GCAAGGCTAA  CGCTGTCCAG  CCCGGCTCCT  CCTGCTTGTG  ACCTCCGAGT  150CCTCAGTAAA  CTGCTTCGTG  ACTCCCATGT  CCTTCACAGC  AGACTGGTGA  200GAACTCCCAA  CATTATCCCC  TTTATCCGCG  TAACTGGTAA  GACACCCATA  250CTCCCAGGAA  GACACCATCA  CTTCCTCTAA  CTCCTTGACC  CAATGACTAT  300TCTTCCCATA  TTGTCCCCAC  CTACTGATCA  CACTCTCTGA  CAAGAATTAT  350TCTTCACAAT  ACAGCCCGCA  TTTAAAAGCT  CTCGTCTAGA  390(2)SEQ ID NO:5的信息:(i)序列特征:
   (A)长度:390碱基对
   (B)类型:核酸
   (C)股性:单链
   (D)拓扑结构:线性(xi)序列描述:SEQ ID NO:5:TCTAGACGAG  AGCTTTTAAA  TGCGGGCTGT  ATTGTGAAGA  ATAATTCTTG  50TCAGAGAGTG  TGATCAGTAG  GTGGGGACAA  TATGGGAAGA  ATAGTCATTG  100GGTCAAGGAG  TTAGAGGAAG  TGATGGTGTC  TTCCTGGGAG  TATGGGTGTC  150TTACCAGTTA  CGCGGATAAA  GGGGATAATG  TTGGGAGTTC  TCACCAGTCT  200GCTGTGAAGG  ACATGGGAGT  CACGAAGCAG  TTTACTGAGG  ACTCGGAGGT  250CACAAGCAGG  AGGAGCCGGG  CTGGACAGCG  TTAGCCTTGC  AGTTAGGAGA  300AGCATGACCA  CGAGGAGCAA  TTCTTAGATG  AGGAGAGGTG  AGGTTGAAAG  350ATGAGGAGGA  AATCATTGTC  AGCTGGTATT  CCAGGAATTC  390(2)SEQ ID NO:6的信息:(i)序列特征:
   (A)长度:332个氨基酸
   (B)类型:氨基酸
   (D)拓扑结构:线性   (xi)序列描述:SEQ ID NO:6:Ser   Pro   Ala   Pro   Pro   Ala   Cys   Asp   Leu   Arg   Val   Leu   Ser   Lys   Leu1                       5                             10                            15Leu   Arg   Asp   Ser   His   Val   Leu   His   Ser   Arg   Leu   Ser   Gln   Cys   Pro
                    20                            25                            30Glu   Val   His   Pro   Leu   Pro   Thr   Pro   Val   Leu   Leu   Pro   Ala   Val   Asp
                    35                            40                            45Phe   Ser   Leu   Gly   Glu   Trp   Lys   Thr   Gln   Met   Glu   Glu   Thr   Lys   Ala
                    50                            55                            60Gln   Asp   Ile   Leu   Gly   Ala   Val   Thr   Leu   Leu   Leu   Glu   Gly   Val   Met
                    65                            70                            75Ala   Ala   Arg   Gly   Gln   Leu   Gly   Pro   Thr   Cys   Leu   Ser   Ser   Leu   Leu
                    80                            85                            90Gly   Gln   Leu   Ser   Gly   Gln   Val   Arg   Leu   Leu   Leu   Gly   Ala   Leu   Gln
                    95                            100                           105Ser   Leu   Leu   Gly   Thr   Gln   Leu   Pro   Pro   Gln   Gly   Arg   Thr   Thr   Ala
                    110                           115                           120His   Lys   Asp   Pro   Asn   Ala   Ile   Phe   Leu   Ser   Phe   Gln   His   Leu   Leu
                    125                           130                           135Arg   Gly   Lys   Val   Arg   Phe   Leu   Met   Leu   Val   Gly   Gly   Ser   Thr   Leu
                    140                           145                           150Cys   Val   Arg   Arg   Ala   Pro   Pro   Thr   Thr   Ala   Val   Pro   Ser   Arg   Thr
                    155                           160                           165Ser   Leu   Val   Leu   Thr   Leu   Asn   Glu   Leu   Pro   Asn   Arg   Thr   Ser   Gly
                    170                           175                           180Leu   Leu   Glu   Thr   Asn   Phe   Thr   Ala   Ser   Ala   Arg   Thr   Thr   Gly   Ser
                    185                           190                           195Gly   Leu   Leu   Lys   Trp   Gln   Gln   Gly   Phe   Arg   Ala   Lys   Ile   Pro   Gly
                    200                           205                           210Leu   Leu   Asn   Gln   Thr   Ser   Arg   Ser   Leu   Asp   Gln   Ile   Pro   Gly   Tyr
                    215                           220                           225Leu   Asn   Arg   Ile   His   Glu   Leu   Leu   Asn   Gly   Thr   Arg   Gly   Leu   Phe
                    230                           235                           240Pro   Gly   Pro   Ser   Arg   Arg   Thr   Leu   Gly   Ala   Pro   Asp   Ile   Ser   Ser
                    245                           250                           255Gly   Thr   Ser   Asp   Thr   Gly   Ser   Leu   Pro   Pro   Asn   Leu   Gln   Pro   Gly
                    260                           265                           270Tyr   Ser   Pro   Ser   Pro   Thr   His   Pro   Pro   Thr   Gly   Gln   Tyr   Thr   Leu
                    275                           280                           285Phe   Pro   Leu   Pro   Pro   Thr   Leu   Pro   Thr   Pro   Val   Val   Gln   Leu   His
                    290                           295                           300Pro   Leu   Leu   Pro   Asp   Pro   Ser   Ala   Pro   Thr   Pro   Thr   Pro   Thr   Ser
                    305                           310                           315Pro   Leu   Leu   Asn   Thr   Ser   Tyr   Thr   His   Ser   Gln   Asn   Leu   Ser   Gln
                    320                           325                           330Glu  Gly
 332(2)SEQ ID NO:7的信息:(i)序列特征:
   (A)长度:166个氨基酸
   (B)类型:氨基酸
   (D)拓扑结构:线性(xi)序列描述:SEQ ID NO:7:Ala   Pro   Pro   Arg   Leu   Ile   Cys   Asp   Ser   Arg   Val   Leu   Glu   Arg   Tyr1                       5                             10                            15Leu   Leu   Glu   Ala   Lys   Glu   Ala   Glu   Asn   Ile   Thr   Thr   Gly   Cys   Ala
                    20                            25                            30Glu   His   Cys   Ser   Leu   Asn   Glu   Asn   Ile   Thr   Val   Pro   Asp   Thr   Lys
                    35                            40                            45Val   Asn   Phe   Tyr   Ala   Trp   Lys   Arg   Met   Glu   Val   Gly   Gln   Gln   Ala
                    50                            55                            60Val   Glu   Val   Trp   Gln   Gly   Leu   Ala   Leu   Leu   Ser   Glu   Ala   Val   Leu
                    65                            70                            75Arg   Gly   Gln   Ala   Leu   Leu   Val   Asn   Ser   Ser   Gln   Pro   Trp   Glu   Pro
                    80    85                                                    90Leu   Gln   Leu   His   Val   Asp   Lys   Ala   Val   Ser   Gly   Leu   Arg   Ser   Leu
                    95                            100                           105Thr   Thr   Leu   Leu   Arg   Ala   Leu   Gly   Ala   Gln   Lys   Glu   Ala   Ile   Ser
                    110                           115                           120Pro   Pro   Asp   Ala   Ala   Ser   Ala   Ala   Pro   Leu   Arg   Thr   Ile   Thr   Ala
                    125                           130                           135Asp   Thr   Phe   Arg   Lys   Leu   Phe   Arg   Val   Tyr   Ser   Asn   Phe   Leu   Arg
                    140                           145                           150Gly   Lys   Leu   Lys   Leu   Tyr   Thr   Gly   Glu   Ala   Cys   Arg   Thr   Gly   Asp
                    155                           160                           165Arg166(2)SEQ ID NO:8的信息:(i)序列特征:
   (A)长度:328个氨基酸
   (B)类型:氨基酸
   (D)拓扑结构:线性(xi)序列描述:SEQ ID NO:8:Ser   Pro   Ala   Pro   Pro   Ala   Cys   Asp   Leu   Arg   Val   Leu   Ser   Lys   Leu1                       5                             10                            15Leu   Arg   Asp   Ser   His   Val   Leu   His   Ser   Arg   Leu   Ser   Gln   Cys   Pro
                    20                            25                            30Glu   Val   His   Pro   Leu   Pro   Thr   Pro   Val   Leu   Leu   Pro   Ala   Val   Asp
                    35                            40                            45Phe   Ser   Leu   Gly   Glu   Trp   Lys   Thr   Gln   Met   Glu   Glu   Thr   Lys   Ala
                    50                            55                            60Gln   Asp   Ile   Leu   Gly   Ala   Val   Thr   Leu   Leu   Leu   Glu   Gly   Val   Met
                    65                            70                            75Ala   Ala   Arg   Gly   Gln   Leu   Gly   Pro   Thr   Cys   Leu   Ser   Ser   Leu   Leu
                    80                            85                            90Gly   Gln   Leu   Ser   Gly   Gln   Val   Arg   Leu   Leu   Leu   Gly   Ala   Leu   Gln
                    95                            100                           105Ser   Leu   Leu   Gly   Thr   Gln   Gly   Arg   Thr   Thr   Ala   His   Lys   Asp   Pro
                    110                           115                           120Asn   Ala   Ile   Phe   Leu   Ser   Phe   Gln   His   Leu   Leu   Arg   Gly   Lys   Val
                    125                           130                           135Arg   Phe   Leu   Met   Leu   Val   Gly   Gly   Ser   Thr   Leu   Cys   Val   Arg   Arg
                    140                           145                           150Ala   Pro   Pro   Thr   Thr   Ala   Val   Pro   Ser   Arg   Thr   Ser   Leu   Val   Leu
                    155                           160                           165Thr   Leu   Asn   Glu   Leu   Pro   Asn   Arg   Thr   Ser   Gly   Leu   Leu   Glu   Thr
                    170                           175                           180Asn   Phe   Thr   Ala   Ser   Ala   Arg   Thr   Thr   Gly   Ser   Gly   Leu   Leu   Lys
                    185                           190                           195Trp   Gln   Gln   Gly   Phe   Arg   Ala   Lys   Ile   Pro   Gly   Leu   Leu   Asn   Gln
                    200                           205                           210Thr   Ser   Arg   Ser   Leu   Asp   Gln   Ile   Pro   Gly   Tyr   Leu   Asn   Arg   Ile
                    215                           220                           225His   Glu   Leu   Leu   Asn   Gly   Thr   Arg   Gly   Leu   Phe   Pro   Gly   Pro   Ser
                    230                           235                           240Arg   Arg   Thr   Leu   Gly   Ala   Pro   Asp   Ile   Ser   Ser   Gly   Thr   Ser   Asp
                    245                           250                           255Thr   Gly   Ser   Leu   Pro   Pro   Asn   Leu   Gln   Pro   Gly   Tyr   Ser   Pro   Ser
                    260                           265                           270Pro   Thr   His   Pro   Pro   Thr   Cly   Gln   Tyr   Thr   Leu   Phe   Pro   Leu   Pro
                    275                           280                           285Pro   Thr   Leu   Pro   Thr   Pro   Val   Val   Gln   Leu   His   Pro   Leu   Leu   Pro
                    290                           295                           300Asp   Pro   Ser   Ala   Pro   Thr   Pro   Thr   Pro   Thr   Ser   Pro   Leu   Leu   Asn
                    305                           310                           315Thr   Ser   Tyr   Thr   His   Ser   Gln   Asn   Leu   Ser   Gln   Glu   Gly
                    320                           325               328(2)SEQ ID NO:9的信息:(i)序列特征:
   (A)长度:265个氨基酸
   (B)类型:氨基酸
   (D)拓扑结构:线性(xi)序列描述:SEQ ID NO:9:Ser   Pro   Ala   Pro   Pro   Ala   Cys   Asp   Leu   Arg   Val   Leu   Ser   Lys   Leu1                       5                             10                            15Leu   Arg   Asp   Ser   His   Val   Leu   His   Ser   Arg   Leu   Ser   Gln   Cys   Pro
                    20                            25                            30Glu   Val   His   Pro   Leu   Pro   Thr   Pro   Val   Leu   Leu   Pro   Ala   Val   Asp
                    35                            40                            45Phe   Ser   Leu   Gly   Glu   Trp   Lys   Thr   Gln   Met   Glu   Glu   Thr   Lys   Ala
                    50                            55                            60Gln   Asp   Ile   Leu   Gly   Ala   Val   Thr   Leu   Leu   Leu   Glu   Gly   Val   Met
                    65                            70                            75Ala   Ala   Arg   Gly   Gln   Leu   Gly   Pro   Thr   Cys   Leu   Ser   Ser   Leu   Leu
                    80                            85                            90Gly   Gln   Leu   Ser   Gly   Gln   Val   Arg   Leu   Leu   Leu   Gly   Ala   Leu   Gln
                    95                            100                           105Ser   Leu   Leu   Gly   Thr   Gln   Leu   Pro   Pro   Gln   Gly   Arg   Thr   Thr   Ala
                    110                           115                           120His   Lys   Asp   Pro   Asn   Ala   Ile   Phe   Leu   Ser   Phe   Gln   His   Leu   Leu
                    125                           130                           135Arg   Gly   Lys   Asp   Phe   Trp   Ile   Val   Gly   Asp   Lys   Leu   His   Cys   Leu
                    140                           145                           150Ser   Gln   Asn   Tyr   Trp   Leu   Trp   Ala   Ser   Glu   Val   Ala   Ala   Gly   Ile
                    155                           160                           165Gln   Ser   Gln   Asp   Ser   Trp   Ser   Ala   Glu   Pro   Asn   Leu   Gln   Val   Pro
                    170                           175                           180Gly   Pro   Asn   Pro   Arg   Ile   Pro   Glu   Gln   Asp   Thr   Arg   Thr   Leu   Glu
                    185                           190                           195Trp   Asn   Ser   Trp   Thr   Leu   Ser   Trp   Thr   Leu   Thr   Gln   Asp   Pro   Arg
                    200                           205                           210Ser   Pro   Gly   His   Phe   Leu   Arg   Asn   Ile   Arg   His   Arg   Leu   Pro   Ala
                    215                           220                           225Thr   Gln   Pro   Pro   Ala   Trp   Ile   Phe   Ser   Phe   Pro   Asn   Pro   Ser   Ser
                    230                           235                           240Tyr   Trp   Thr   Val   Tyr   Ala   Leu   Pro   Ser   Ser   Thr   His   Leu   Ala   His
                    245                           250                                 255Pro   Cys   Gly   Pro   Ala   Pro   Pro   Pro   Ala   Ser
                    260                           265(2)SEQ ID NO:10的信息:(i)序列特征:
  (A)长度:261个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性(xi)序列描述:SEQ ID NO:10:Ser   Pro   Ala   Pro   Pro   Ala   Cys   Asp   Leu   Arg   Val   Leu   Ser   Lys   Leu1                 5                                   10                            15Leu   Arg   Asp   Ser   His   Val   Leu   His   Ser   Arg   Leu   Ser   Gln   Cys   Pro
                    20                            25                            30Glu   Val   His   Pro   Leu   Pro   Thr   Pro   Val   Leu   Leu   Pro   Ala   Val   Asp
                    35                            40                            45Phe   Ser   Leu   Gly   Glu   Trp   Lys   Thr   Gln   Met   Glu   Glu   Thr   Lys   Ala
                    50                            55                            60Gln   Asp   Ile   Leu   Gly   Ala   Val   Thr   Leu   Leu   Leu   Glu   Gly   Val   Met
                    65                            70                            75Ala   Ala   Arg   Gly   Gln   Leu   Gly   Pro   Thr   Cys   Leu   Ser   Ser   Leu   Leu
                    80                            85                            90Gly   Gln   Leu   Ser   Gly   Gln   Val   Arg   Leu   Leu   Leu   Gly   Ala   Leu   Gln
                    95                            100                           105Ser   Leu   Leu   Gly   Thr   Gln   Gly   Arg   Thr   Thr   Ala   His   Lys   Asp   Pro
                    ll0                           115                           120Asn   Ala   Ile   Phe   Leu   Ser   Phe   Gln   His   Leu   Leu   Arg   Gly   Lys   Asp
                    125                           130                           135Phe   Trp   Ile   Val   Gly   Asp   Lys   Leu   His   Cys   Leu   Ser   Gln   Asn   Tyr
                    140                           145                           150Trp   Leu   Trp   Ala   Ser   Glu   Val   Ala   Ala   Gly   Ile   Gln   Ser   Gln   Asp
                    155                           160                           165Ser   Trp   Ser   Ala   Glu   Pro   Asn   Leu   Gln   Val   Pro   Gly   Pro   Asn   Pro
                    170                           175                           180Arg   Ile   Pro   Glu   Gln   Asp   Thr   Arg   Thr   Leu   Glu   Trp   Asn   Ser   Trp
                    185                           190                           195Thr   Leu   Ser   Trp   Thr   Leu   Thr   Gln   Asp   Pro   Arg   Ser   Pro   Gly   His
                    200                           205                           210Phe   Leu   Arg   Asn   Ile   Arg   His   Arg   Leu   Pro   Ala   Thr   Gln   Pro   Pro
                    215                           220                           225Ala   Trp   Ile   Phe   Ser   Phe   Pro   Asn   Pro   Ser   Ser   Tyr   Trp   Thr   Val
                    230                           235                           240Tyr   Ala   Leu   Pro   Ser   Ser   Thr   His   Leu   Ala   His   Pro   Cys   Gly   Pro
                    245                           250                           255Ala   Pro   Pro   Pro   Ala   Ser
                    260   261(2)SEQ ID NO:11的信息:(i)序列特征:
   (A)长度:7849碱基对
   (B)类型:核酸
   (C)股性:单链
   (D)拓扑结构:线性(xi)序列描述:SEQ ID NO:11:CCCAGCCTCC  TTTCTCTTGT  TCCCTGGTCA  TGCCTGCCTC  CCTGTCTCCT  50GTCTCTCCCT  CCCACACACA  CCCACTATCC  TCCCAGCTAT  CCCTACACCC  100TCCTTCCTAA  TCTTGGGAGA  CATCTCGTCT  GGCTGGACGG  GAAAATTCCA  150GGATCTAGGC  CACACTTCTC  AGCAGACATG  CCCATCCTTG  GGGAGGAGGA  200ACAGGAGAGA  GCCTGAGGAA  GTTCTGGGGG  ACAGGGGGAT  GATGGGATCA  250AGGTCAGGCC  AGGAAGCCCC  TGAGGACAGA  GACTGTGGGG  AGACTGGGAC  300TGGGAAGAAA  GCAAAGGAGC  TAGAGCCAGG  GCCAAAGGAA  AAGGGGGGCC  350AGCAGGGAGG  TATTTGCGGG  GGAGGTCCAG  CAGCTGTCTT  TCCTAAGACA  400GGGACACATG  GGCCTGGTTA  TTCCTCTTGT  CACATGTGGA  ACGGTAGGAG  450ATGGAAGACG  GAGACAGAAC  AAGCAAAGGA  GGGCCCTGGG  CACAGAGGTC  500TGTGTGTGTA  GCCATCCAAG  CCACTGGACC  CCAGCAGACG  AGCACCTAAG  550CTCAGGCTTA  ACCCAGTGCA  CGTGTGCGCA  CATACATGTG  CCCCGCACCT  600GACAGTCCAC  TCAACCCGTC  CAAACCCTTT  CCCCATAACA  CCAACCCATA  650ACAGGAGATT  TCTCTCATGT  GGGCAATATC  CGTGTTCCCA  CTTCGAAAGG  700GGGAATGACA  AGATAGGACT  CCCTAGGGGA  TTACAGAAAG  AAAAGCAGGA  750AAGCAAGCAT  CCTGTTGGAT  TTCAGCAGCA  GGTATGATGT  CCAGGGAAAA  800GAAATTTGGA  TAGCCAGGGA  GTGAAAACCC  CACCAATCTT  AAACAAGACC  850TCTGTGCTTC  TTCCCCAGCA  ACACAAATGT  CCTGCCAGAT  TCCTCCTGGA  900AAAAAACTTC  TGCTCCTGTC  CCCCTCCAGG  TCCCAGGTTG  CCCATGTCCA  950GGAAAAGATG  GATCCCCCTA  TCCAAATCTT  CTCCGTGGTG  TGTGTGGGTG  1000GAGGAGTGGA  CCCTGGTCCA  GGCAGGGGCT  CCAGGGAAGA  GAAGGCGTCA  1050CTTCCGGGGG  CCTTCACCAG  TGTCTGGTGG  CTCCCTTCTC  TGATTGGGCA  1100GAAGTGGCCC  AGGCAGGCGT  ATGACCTGCT  GCTGTGGAGG  GGCTGTGCCC  1150CACCGCCACA  TGTCTTCCTA  CCCATCTGCT  CCCCAGAGGG  CTGCCTGCTG  1200TGCACTTGGG  TCCTGGAGCC  CTTCTCCACC  CGGTGAGTGG  CCAGCAGGGT  1250GTGGGGTTAT  GTGAGGGTAG  AAAGGACAGC  AAAGAGAAAT  GGGCTCCCAG  1300CTGGGGGAGG  GGCAGGCAAA  CTGGAACCTA  CAGGCACTGA  CCTTTGTCGA  1350GAAGAGTGTA  GCCTTCCCAG  AATGGGAGGA  GCAGGGCAGA  GCAGGGGTAG  1400GGGGTGGGGT  GCTGGTTTCT  GAGGGACTGA  TCACTTACTT  GGTGGAATAC  1450AGCACAGCCC  TGGCTGGCCC  TAAGGAAAGG  GGACATGAGC  CCAGGGAGAA  1500AATAAGAGAG  GGAGCTGCAC  TTAGGGCTTA  GCAAACACAG  TAGTAAGATG  1550GACACAGCCC  CAATCCCCAT  TCTTAGCTGG  TCATTCCTCG  TTAGCTTAAG  1600GTTCTGAATC  TGGTGCTGGG  GAAGCTGGGC  CAGGCAAGCC  AGGGCGCAAG  1650GAGAGGGTAA  TGGGAGGAGG  GCCCACTCAT  GTTGACAGAC  CTACAGGAAA  1700TCCCAATATT  GAATCAGGTG  CAAGCCTCTT  TGCACAACTT  GTGAAAGGAG  1750GAGGAAGCCA  TGTGGGGGGT  CCTGTGAAGG  AACCGGAAGG  GGTTCTGCCA  1800AGGGGGCAGG  GAGGCAGGTG  TGAGCTATGA  GACAGATATG  TTAGTGGGCG  1850CCTAAGACAA  GGTAAGCCCC  TAAGGTGGGC  ATCACCCAGC  AGGTGCCCGT  1900TCCTGGGCAG  CTGGTCTCAG  GAAGGAAGTC  CCAGAACTGT  TAGCCCATCT  1950CTTGGCCTCA  GATAATGGAG  TATTTCAGGA  CTTGGAGTCC  AAAGAAAAGC  2000TCCAGTGGCT  TTATGTGTGG  GGGTAGATAG  GGAAAGAATA  GAGGTTAATT  2050TCTCCCATAC  CGCCTTTTAA  TCCTGACCTC  TAGTGGTCCC  AGTTACAGCT  2100TTGTGCAGTT  CCCCTCCCCA  GCCCCACTCC  CCACCGCAGA  AGTTACCCCT  2150CAACATATTG  CGCCCGTTTG  CCAGTTCCTC  ACCCAGGCCC  TGCATCCCAT  2200TTTCCACTCT  CTTCTCCAGG  CTGAAGCCAC  AATACTTTCC  TTCTCTATCC  2250CCATCCCAGA  TTTTCTCTGA  CCTAACAACC  AAGGTTGCTC  AGAATTTAAG  2300GCTAATTAAG  ATATGTGTGT  ATACATATCA  TGTCCTGCTG  CTCTCAGCAG  2350GGGTAGGTGG  CACCAAATCC  GTGTCCGATT  CACTGAGGAG  TCCTGACAAA  2400AAGGAGACAC  CATATGCTTT  CTTGCTTTCT  TTCTTTCTTT  CTTTCTTTTT  2450TTTTTTTTGA  GACGGAGTTT  CACTCTTATT  GCCCAGGCTG  GAGTGCAATG  2500GTGCGATCTC  GGCTCACCAC  AAACCTCCGC  CTCCCAGGTA  CAAGCGATTC  2550TCCTGTCTCA  GCCTCCCAAG  TAGCTTGGAT  TACAGGCATG  AGCCACCACA  2600CCCTGCTAGT  TTTTTTGTAT  TTCGTAGAGC  CGGGGTTTCA  CCATGTTAGT  2650GAGGCTGGTG  GCGAACTCCT  GACCTCAGGT  GATCCACCCG  CCTTGGACTC  2700CCAAAGTGCT  GGGATTACAG  GCATGAGCCA  CTGCACCCGG  CACACCATAT  2750GCTTTCATCA  CAAGAAAATG  TGAGAGAATT  CAGGGCTTTG  GCAGTTCCAG  2800GCTGGTCAGC  ATCTCAAGCC  CTCCCCAGCA  TCTGTTCACC  CTGCCAGGCA  2850GTCTCTTCCT  AGAAACTTGG  TTAAATGTTC  ACTCTTCTTG  CTACTTTCAG  2900GATAGATTCC  TCACCCTTGG  CCCGCCTTTG  CCCCACCCTA  CTCTGCCCAG  2950AAGTGCAAGA  GCCTAAGCCG  CCTCCATGGC  CCCAGGAAGG  ATTCAGGGGA  3000GAGGCCCCAA  ACAGGGAGCC  ACGCCAGCCA  GACACCCCGG  CCAGAATGGA  3050GCTGACTGGT  GAGAACACAC  CTGAGGGGCT  AGGGCCATAT  GGAAACATGA  3100CAGAAGGGGA  GAGAGAAAGG  AGACACGCTG  CAGGGGGCAG  GAAGCTGGGG  3150GAACCCATTC  TCCCAAAAAT  AAGGGGTCTG  AGGGGTGGAT  TCCCTGGGTT  3200TCAGGTCTGG  GTCCTGAATG  GGAATTCCTG  GAATACCAGC  TGACAATGAT  3250TTCCTCCTCA  TCTTTCAACC  TCACCTCTCC  TCATCTAAGA  ATTGCTCCTC  3300GTGGTCATGC  TTCTCCTAAC  TGCAAGGCTA  ACGCTGTCCA  GCCCGGCTCC  3350TCCTGCTTGT  GACCTCCGAG  TCCTCAGTAA  ACTGCTTCGT  GACTCCCATG  3400TCCTTCACAG  CAGACTGGTG  AGAACTCCCA  ACATTATCCC  CTTTATCCGC  3450GTAACTGGTA  AGACACCCAT  ACTCCCAGGA  AGACACCATC  ACTTCCTCTA  3500ACTCCTTGAC  CCAATGACTA  TTCTTCCCAT  ATTGTCCCCA  CCTACTGATC  3550ACACTCTCTG  ACAAGAATTA  TTCTTCACAA  TACAGCCCGC  ATTTAAAAGC  3600TCTCGTCTAG  AGATAGTACT  CATGGAGGAC  TAGCCTGCTT  ATTAGGCTAC  3650CATAGCTCTC  TCTATTTCAG  CTCCCTTCTC  CCCCCACCAA  TCTTTTTCAA  3700CAGAGCCAGT  GCCCAGAGGT  TCACCCTTTG  CCTACACCTG  TCCTGCTGCC  3750TGCTGTGGAC  TTTAGCTTGG  GAGAATGGAA  AACCCAGATG  GTAAGAAAGC  3800CATCCCTAAC  CTTGGCTTCC  CTAAGTCCTG  TCTTCAGTTT  CCCACTGCTT  3850CCCATGGATT  CTCCAACATT  CTTGAGCTTT  TTAAAAATAT  CTCACCTTCA  3900GCTTGGCCAC  CCTAACCCAA  TCTACATTCA  CCTATGATGA  TAGCCTGTGG  3950ATAAGATGAT  GGCTTGCAGG  TCCAATATGT  GAATAGATTT  GAAGCTGAAC  4000ACCATGAAAA  GCTGGAGAGA  AATCGCTCAT  GGCCATGCCT  TTGACCTATT  4050CCYGTTCAGT  CTTCTTAAAT  TGGCATGAAG  AAGCAAGACT  CATATGTCAT  4100CCACAGATGA  CACAAAGCTG  GGAAGTACCA  CTAAAATAAC  AAAAGACTGA  4150ATCAAGATTC  AAATCACTGA  AAGACTAGGT  CAAAAACAAG  GTGAAACAAC  4200AGAGATATAA  ACTTCTACAT  GTGGGCCGGG  GGCTCACGCC  TGTAATCCCA  4250GCACTTTGGG  AGGCCGAGGC  AGGCAGATCA  CCTGAGGGCA  GGAGTTTGAG  4300AGCAGCCTGG  CCAACATGGC  GAAACCCCGT  CTCTACTAAG  AATACAAAAT  4350TAGCCGGGCA  TGGTAGTGCA  TGCCTGTAAT  CCCAGCTACT  TGGAAGGCTG  4400AAGCAGGAGA  ATCCCTTGAA  CCCAGGAGGT  GGAGGTTGTA  GTGAGCTGAG  4450ATCATGCCAA  TGCACTCCAG  CCTGGGTGAC  AAGAGCAAAA  CTCCGTCTCA  4500AAAAGAAAAA  AAAATTCTAC  ATGTGTAAAT  TAATGAGTAA  AGTCCTATTC  4550CAGCTTTCAG  GCCACAATGC  CCTGCTTCCA  TCATTTAAGC  CTCTGGCCCT  4600AGCACTTCCT  ACGAAAAGGA  TCTGAGAGAA  TTAAATTGCC  CCCAAACTTA  4650CCATGTAACA  TTACTGAAGC  TGCTATTCTT  AAAGCTAGTA  ATTCTTGTCT  4700GTTTGATGTT  TAGCATCCCC  ATTGTGGAAA  TGCTCGTACA  GAACTCTATT  4750CCGAGTGGAC  TACACTTAAA  TATACTGGCC  TGAACACCGG  ACATCCCCCT  4800GAAGACATAT  GCTAATTTAT  TAAGAGGGAC  CATATTAAAC  TAACATGTGT  4850CTAGAAAGCA  GCAGCCTGAA  CAGAAAGAGA  CTAGAAGCAT  GTTTTATGGG  4900CAATAGTTTA  AAAAACTAAA  ATCTATCCTC  AAGAACCCTA  GCGTCCCTTC  4950TTCCTTCAGG  ACTGAGTCAG  GGAAGAAGGG  CAGTTCCTAT  GGGTCCCTTC  5000TAGTCCTTTC  TTTTCATCCT  TATGATCATT  ATGGTAGAGT  CTCATACCTA  5050CATTTAGTTT  ATTTATTATT  ATTATTTGAG  ACGGAGTCTC  ACTCTATCCC  5100CCAGGCTGGA  GTGCAGTGGC  ATGATCTCAA  CTCACTGCAA  CCTCAGCCTC  5150CCGGATTCAA  GCGATTCTCC  TGCCTCAGTC  TCCCAAGTAG  CTGGGATTAC  5200AGGTGCCCAC  CACCATGCCC  AGCTAATTTT  TGTATTTTTG  GTAGAGATGG  5250GGTTTCACCA  TGTTGGCCAG  GCTGATCTTG  AACTCCTGAC  CTCAGGTGAT  5300CCACCTGCCT  CAGCCTCCCA  AAGTGCTGGG  ATTACAGGCG  TGAGCCACTG  5350CACCCAGCCT  TCATTCAGTT  TAAAAATCAA  ATGATCCTAA  GGTTTTGCAG  5400CAGAAAGAGT  AAATTTGCAG  CACTAGAACC  AAGAGGTAAA  AGCTGTAACA  5450GGGCAGATTT  CAGCAACGTA  AGAAAAAAGG  AGCTCTTCTC  ACTGAAACCA  5500AGTGTAAGAC  CAGGCTGGAC  TAGAGGACAC  GGGAGTTTTT  GAAGCAGAGG  5550CTGATGACCA  GCTGTCGGGA  GACTGTGAAG  GAATTCCTGC  CCTGGGTGGG  5600ACCTTGGTCC  TGTCCAGTTC  TCAGCCTGTA  TGATTCACTC  TGCTGGCTAC  5650TCCTAAGGCT  CCCCACCCGC  TTTTAGTGTG  CCCTTTGAGG  CAGTGCGCTT  5700CTCTCTTCCA  TCTCTTTCTC  AGGAGGAGAC  CAAGGCACAG  GACATTCTGG  5750GAGCAGTGAC  CCTTCTGCTG  GAGGGAGTGA  TGGCAGCACG  GGGACAACTG  5800GGACCCACTT  GCCTCTCATC  CCTCCTGGGG  CAGCTTTCTG  GACAGGTCCG  5850TCTCCTCCTT  GGGGCCCTGC  AGAGCCTCCT  TGGAACCCAG  GTAAGTCCCC  5900AGTCAAGGGA  TCTGTAGAAA  CTGTTCTTTT  CTGACTCAGT  CCCACTAGAA  5950GACCTGAGGG  AAGAAGGGCT  CTTCCAGGGA  GCTCAAGGGC  AGAAGAGCTG  6000ATCTACTAAG  AGTGCTCCCT  GCCAGCCACA  ATGCCTGGGT  ACTGGCATCC  6050TGTCTTTCCT  ACTTAGACAA  GGGAGGCCTG  AGATCTGGCC  CTGGTGTTTG  6100GCCTCAGGAC  CATCCTCTGC  CCTCAGCTTC  CTCCACAGGG  CAGGACCACA  6150GCTCACAAGG  ATCCCAATGC  CATCTTCCTG  AGTTTCCAAC  ACCTGCTCCG  6200AGGAAAGGTG  CGTTTCCTGA  TGCTTGTAGG  AGGGTCCACC  CTCTGCGTCA  6250GGCGGGCCCC  ACCCACCACA  GCTGTCCCCA  GCAGAACCTC  TCTAGTCCTC  6300ACACTGAACG  AGCTCCCAAA  CAGGACTTCT  GGATTGTTGG  AGACAAACTT  6350CACTGCCTCA  GCCAGAACTA  CTGGCTCTGG  GCTTCTGAAG  TGGCAGCAGG  6400GATTCAGAGC  CAAGATTCCT  GGTCTGCTGA  ACCAAACCTC  CAGGTCCCTG  6450GACCAAATCC  CCGGATACCT  GAACAGGATA  CACGAACTCT  TGAATGGAAC  6500TCGTGGACTC  TTTCCTGGAC  CCTCACGCAG  GACCCTAGGA  GCCCCGGACA  6550TTTCCTCAGG  AACATCAGAC  ACAGGCTCCC  TGCCACCCAA  CCTCCAGCCT  6600GGATATTCTC  CTTCCCCAAC  CCATCCTCCT  ACTGGACAGT  ATACGCTCTT  6650CCCTCTTCCA  CCCACCTTGC  CCACCCCTGT  GGTCCAGCTC  CACCCCCTGC  6700TTCCTGACCC  TTCTGCTCCA  ACGCCCACCC  CTACCAGCCC  TCTTCTAAAC  6750ACATCCTACA  CCCACTCCCA  GAATCTGTCT  CAGGAAGGGT  AAGGTTCTCA  6800GACACTGCCG  ACATCAGCAT  TGTCTCATGT  ACAGCTCCCT  TCCCTGCAGG  6850GCGCCCCTGG  GAGACAACTG  GACAAGATTT  CCTACTTTCT  CCTGAAACCC  6900AAAGCCCTGG  TAAAAGGGAT  ACACAGGACT  GAAAAGGGAA  TCATTTTTCA  6950CTGTACATTA  TAAACCTTCA  GAAGCTATTT  TTTTAAGCTA  TCAGCAATAC  7000TCATCAGAGC  AGCTAGCTCT  TTGGTCTATT  TTCTGCAGAA  ATTTGCAACT  7050CACTGATTCT  CTACATGCTC  TTTTTCTGTG  ATAACTCTGC  AAAGGCCTGG  7100GCTGGCCTGG  CAGTTGAACA  GAGGGAGAGA  CTAACCTTGA  GTCAGAAAAC  7150AGAGAAAGGG  TAATTTCCTT  TGCTTCAAAT  TCAAGGCCTT  CCAACGCCCC  7200CATCCCCTTT  ACTATCATTC  TCAGTGGGAC  TCTGATCCCA  TATTCTTAAC  7250AGATCTTTAC  TCTTGAGAAA  TGAATAAGCT  TTCTCTCAGA  AATGCTGTCC  7300CTATACACTA  GACAAAACTG  AGCCTGTATA  AGGAATAAAT  GGGAGCGCCG  7350AAAAGCTCCC  TAAAAAGCAA  GGGAAAGATG  TTCTTCGAGG  GTGGCAATAG  7400ATCCCCCTCA  CCCTGCCACC  CCAAACAAAA  AAGCTAACAG  GAAGCCTTGG  7450AGAGCCTCAC  ACCCCAGGTA  AGGCTGTGTA  GACAGTTCAG  TAAAGACAGG  7500ACCTGGATGT  GACAGCTGAG  CAAACAGCTA  GAGCTTTGGC  AGCTCAGCAG  7550GAGGCTTTGC  CAGGCATGGA  CGCCTGCCTC  CCTCCTGTGG  AGGTCAGGAG  7600GAAGTGCAGG  AAGTGGCATG  AGTCAGGCTC  CTTGAGCTCA  CACAGCAGGA  7650GAACAAGTAC  AAGTCAAGTA  CAAGTTGAAG  GCTCATTTCC  CAGTTCCCGC  7700AAATGCATCT  AAAAAGCAGC  TCTGTGTGAC  CACCATAAAC  TCTGCTAGGG  7750GATCTCTAAA  AAGGAGTCAG  GCTTATGGGG  CTTTGCAAAT  AAGTGCTGCC  7800TTGGTGCTCA  GGAAAAGGTT  TGTGTTGCAC  AAAACACAAA  TTCCACTGC   7849(2)SEQ ID NO:12的信息:(i)序列特征:
   (A)长度:1443碱基对
   (B)类型:核酸
   (C)股性:单链
   (D)拓扑结构:线性(xi)序列描述:SEQ ID NO:12:GAGTCCTTGG  CCCACCTCTC  TCCCACCCGA  CTCTGCCGAA  AGAAGCACAG  50AAGCTCAAGC  CGCCTCCATG  GCCCCAGGAA  AGATTCAGGG  GAGAGGCCCC  100ATACAGGGAG  CCACTTCAGT  TAGACACCCT  GGCCAGAATG  GAGCTGACTG  150ATTTGCTCCT  GGCGGCCATG  CTTCTTGCAG  TGGCAAGACT  AACTCTGTCC  200AGCCCCGTAG  CTCCTGCCTG  TGACCCCAGA  CTCCTAAATA  AACTGCTGCG  250TGACTCCCAC  CTCCTTCACA  GCCGACTGAG  TCAGTGTCCC  GACGTCGACC  300CTTTGTCTAT  CCCTGTTCTG  CTGCCTGCTG  TGGACTTTAG  CCTGGGAGAA  350TGGAAAACCC  AGACGGAACA  GAGCAAGGCA  CAGGACATTC  TAGGGGCAGT  400GTCCCTTCTA  CTGGAGGGAG  TGATGGCAGC  ACGAGGACAG  TTGGAACCCT  450CCTGCCTCTC  ATCCCTCCTG  GGACAGCTTT  CTGGGCAGGT  TCGCCTCCTC  500TTGGGGGCCC  TGCAGGGCCT  CCTAGGAACC  CAGGGCAGGA  CCACAGCTCA  550CAAGGACCCC  AATGCCCTCT  TCTTGAGCTT  GCAACAACTG  CTTCGGGGAA  600AGGTGCGCTT  CCTGCTTCTG  GTAGAAGGTC  CCACCCTCTG  TGTCAGACGG  650ACCCTGCCAA  CCACAGCTGT  CCCAAGCAGT  ACTTCTCAAC  TCCTCACACT  700AAACAAGTTC  CCAAACAGGA  CTTCTGGATT  GTTGGAGACG  AACTTCAGTG  750TCACAGCCAG  AACTGCTGGC  CCTGGACTTC  TGAGCAGGCT  TCAGGGATTC  800AGAGTCAAGA  TTACTCCTGG  TCAGCTAAAT  CAAACCTCCA  GGTCCCCAGT  850CCAAATCTCT  GGATACCTGA  ACAGGACACA  CGGACCTGTG  AATGGAACTC  900ATGGGCTCTT  TGCTGGAACC  TCACTTCAGA  CCCTGGAAGC  CTCAGACATC  950TCGCCCGGAG  CTTTCAACAA  AGGCTCCCTG  GCATTCAACC  TCCAGGGTGG  1000ACTTCCTCCT  TCTCCAAGCC  TTGCTCCTGA  TGGACACACA  CCCTTCCCTC  1050CTTCACCTGC  CTTGCCCACC  ACCCATGGAT  CTCCACCCCA  GCTCCACCCC  1100CTGTTTCCTG  ACCCTTCCAC  CACCATGCCT  AACTCTACCG  CCCCTCATCC  1150AGTCACAATG  TACCCTCATC  CCAGGAATTT  GTCTCAGGAA  ACATAGCGCG  1200GGCACTGGCC  CAGTGAGCGT  CTGCAGCTTC  TCTCGGGGAC  AAGCTTCCCC  1250AGGAAGGCTG  AGAGGCAGCT  GCATCTGCTC  CAGATGTTCT  GCTTTCACCT  1300AAAAGGCCCT  GGGGAAGGGA  TACACAGCAC  TGGAGATTGT  AAAATTTTAG  1350GAGCTATTTT  TTTTTAACCT  ATCAGCAATA  TTCATCAGAG  CAGCTAGCGA  1400TCTTTGGTCT  ATTTTCGGTA  TAAATTTGAA  AATCACTAAT  TCT 1443(2)SEQ ID NO:13的信息:(i)序列特征:
   (A)长度:352个氨基酸
   (B)类型:氨基酸
   (D)拓扑结构:线性(xi)序列描述:SEQ ID NO:13:Met   Glu   Leu   Thr   Asp   Leu   Leu   Leu   Ala   Ala   Met   Leu   Leu   Ala   Val1                       5                             10                            15Ala   Arg   Leu   Thr   Leu   Ser   Ser   Pro   Val   Ala   Pro   Ala   Cys   Asp   Pro
                    20                            25                            30Arg   Leu   Leu   Asn   Lys   Leu   Leu   Arg   Asp   Ser   His   Leu   Leu   His   Ser
                    35                            40                            45Arg   Leu   Ser   Gln   Cys   Pro   Asp   Val   Asp   Pro   Leu   Ser   Ile   Pro   Val
                    50                            55                            60Leu   Leu   Pro   Ala   Val   Asp   Phe   Ser   Leu   Gly   Glu   Trp   Lys   Thr   Gln
                    65                            70                            75Thr   Glu   Gln   Ser   Lys   Ala   Gln   Asp   Ile   Leu   Gly   Ala   Val   Ser   Leu
                    80                            85                            90Leu   Leu   Glu   Gly   Val   Met   Ala   Ala   Arg   Gly   Gln   Leu   Glu   Pro   Ser
                    95                            100                           105Cys   Leu   Ser   Ser   Leu   Leu   Gly   Gln   Leu   Ser   Gly   Gln   Val   Arg   Leu
                    110                           115                           120Leu   Leu   Gly   Ala   Leu   Gln   Gly   Leu   Leu   Gly   Thr   Gln   Gly   Arg   Thr
                    125                           130                           135Thr   Ala   His   Lys   Asp   Pro   Asn   Ala   Leu   Phe   Leu   Ser   Leu   Gln   Gln
                    140                           145                           150Leu   Leu   Arg   Gly   Lys   Val   Arg   Phe   Leu   Leu   Leu   Val   Glu   Gly   Pro
                    155                           160                           165Thr   Leu   Cys   Val   Arg   Arg   Thr   Leu   Pro   Thr   Thr   Ala   Val   Pro   Ser
                    170                           175                           180Ser   Thr   Ser   Gln   Leu   Leu   Thr   Leu   Asn   Lys   Phe   Pro   Asn   Arg   Thr
                    185                           190                           195Ser   Gly   Leu   Leu   Glu   Thr   Asn   Phe   Ser   Val   Thr   Ala   Arg   Thr   Ala
                    200                           205                           210Gly   Pro   Gly   Leu   Leu   Ser   Arg   Leu   Gln   Gly   Phe   Arg   Val   Lys   Ile
                    215                           220                           225Thr   Pro   Gly   Gln   Leu   Asn   Gln   Thr   Ser   Arg   Ser   Pro   Val   Gln   Ile
                    230                           235                           240Ser   Gly   Tyr   Leu   Asn   Arg   Thr   His   Gly   Pro   Val   Asn   Gly   Thr   His
                    245                           250                           255Gly   Leu   Phe   Ala   Gly   Thr   Ser   Leu   Gln   Thr   Leu   Glu   Ala   Ser   Asp
                    260                           265                           270Ile   Ser   Pro   Gly   Ala   Phe   Asn   Lys   Gly   Ser   Leu   Ala   Phe   Asn   Leu
                    275                           280                           285Gln   Gly   Gly   Leu   Pro   Pro   Ser   Pro   Ser   Leu   Ala   Pro   Asp   Gly   His
                    290                           295                           300Thr   Pro   Phe   Pro   Pro   Ser   Pro   Ala   Leu   Pro   Thr   Thr   His   Gly   Ser
                    305                           310                           315Pro   Pro   Gln   Leu   His   Pro   Leu   Phe   Pro   Asp   Pro   Ser   Thr   Thr   Met
                    320                           325                           330Pro   Asn   Ser   Thr   Ala   Pro   His   Pro   Val   Thr   Met   Tyr   Pro   His   Pro
                    335                           340                           345Arg   Asn   Leu   Ser   Gln   Glu   Thr
                    350         352(2)SEQ ID NO:14的信息:(i)序列特征:
   (A)长度:1536碱基对
   (B)类型:核酸
   (C)股性:单链
   (D)拓扑结构:线性(xi)序列描述:SEQ ID NO:14:GAGTCCTTGG  CCCACCTCTC  TCCCACCCGA  CTCTGCCGAA  AGAAGCACAG  50AAGCTCAAGC  CGCCTCCATG  GCCCCAGGAA  AGATTCAGGG  GAGAGGCCCC  100ATACAGGGAG  CCACTTCAGT  TAGACACCCT  GGCCAGAATG  GAGCTGACTG  150ATTTGCTCCT  GGCGGCCATG  CTTCTTGCAG  TGGCAAGACT  AACTCTGTCC  200AGCCCCGTAG  CTCCTGCCTG  TGACCCCAGA  CTCCTAAATA  AACTGCTGCG  250TGACTCCCAC  CTCCTTCACA  GCCGACTGAG  TCAGTGTCCC  GACGTCGACC  300CTTTGTCTAT  CCCTGTTCTG  CTGCCTGCTG  TGGACTTTAG  CCTGGGAGAA  350TGGAAAACCC  AGACGGAACA  GAGCAAGGCA  CAGGACATTC  TAGGGGCAGT  400GTCCCTTCTA  CTGGAGGGAG  TGATGGCAGC  ACGAGGACAG  TTGGAACCCT  450CCTGCCTCTC  ATCCCTCCTG  GGACAGCTTT  CTGGGCAGGT  TCGCCTCCTC  500TTGGGGGCCC  TGCAGGGCCT  CCTAGGAACC  CAGCTTCCTC  TACAGGGCAG  550GACCACACCT  CACAAGGACC  CCAATGCCCT  CTTCTTGAGC  TTGCAACAAC  600TGCTTCGGGG  AAAGGTGCGC  TTCCTGCTTC  TGGTAGAAGG  TCCCACCCTC  650TGTGTCAGAC  GGACCCTGCC  AACCACAGCT  GTCCCAAGCA  GTACTTCTCA  700ACTCCTCACA  CTAAACAAGT  TCCCAAACAG  GACTTCTGGA  TTGTTGGAGA  750CGAACTTCAG  TGTCACAGCC  AGAACTGCTG  GCCCTGGACT  TCTGAGCAGG  800CTTCAGGGAT  TCAGAGTCAA  GATTACTCCT  GGTCAGCTAA  ATCAAACCTC  850CAGGTCCCCA  GTCCAAATCT  CTGGATACCT  GAACAGGACA  CACGGACCTG  900TGAATGGAAC  TCATGGGCTC  TTTGCTGGAA  CCTCACTTCA  GACCCTGGAA  950GCCTCAGACA  TCTCGCCCGG  AGCTTTCAAC  AAAGGCTCCC  TGGCATTCAA  1000CCTCCAGGGT  GGACTTCCTC  CTTCTCCAAG  CCTTGCTCCT  GATGGACACA  1050CACCCTTCCC  TCCTTCACCT  GCCTTGCCCA  CCACCCATGG  ATCTCCACCC  1100CAGCTCCACC  CCCTGTTTCC  TGACCCTTCC  ACCACCATGC  CTAACTCTAC  1150CGCCCCTCAT  CCAGTCACAA  TGTACCCTCA  TCCCAGGAAT  TTGTCTCAGG  1200AAACATAGCG  CGGGCACTGG  CCCAGTGAGC  GTCTGCAGCT  TCTCTCGGGG  1250ACAAGCTTCC  CCAGGAAGGC  TGAGAGGCAG  CTGCATCTGC  TCCAGATGTT  1300CTGCTTTCAC  CTAAAAGGCC  CTGGGGAAGG  GATACACAGC  ACTGGAGATT  1350GTAAAATTTT  AGGAGCTATT  TTTTTTTAAC  CTATCAGCAA  TATTCATCAG  1400AGCAGCTAGC  GATCTTTGGT  CTATTTTCGG  TATAAATTTG  AAAATCACTA  1450AAAAAAAAAA  AAAAAAAAAA  AAAAAAAAAA  AAAAAAAAAA  AAAAAAAAAA  1500AAAAAAAAAA  AAAAAAAAAA  AAAAAAAAAA  AAAAAA1536(2)SEQ ID NO:15的信息:(i)序列特征:
   (A)长度:356个氨基酸
   (B)类型:氨基酸
   (D)拓扑结构:线性(xi)序列描述:SEQ ID NO:15:Met   Glu   Leu   Thr   Asp   Leu   Leu   Leu   Ala   Ala   Met   Leu   Leu   Ala   Val1                       5                             10                            15Ala   Arg   Leu   Thr   Leu   Ser   Ser   Pro   Val   Ala   Pro   Ala   Cys   Asp   Pro
                    20                            25                            30Arg   Leu   Leu   Asn   Lys   Leu   Leu   Arg   Asp   Ser   His   Leu   Leu   His   Ser
                    35                            40                            45Arg   Leu   Ser   Gln   Cys   Pro   Asp   Val   Asp   Pro   Leu   Ser   Ile   Pro   Val
                    50                            55                            60Leu   Leu   Pro   Ala   Val   Asp   Phe   Ser   Leu   Gly   Gly   Trp   Lys   Thr   Gln
                    65                            70                            75Thr   Glu   Gln   Ser   Lys   Ala   Gln   Asp   Ile   Leu   Gly   Ala   Val   Ser   Leu
                    80                            85                            90Leu   Leu   Glu   Gly   Val   Met   Ala   Ala   Arg   Gly   Gln   Leu   Glu   Pro   Ser
                    95                            100                           105Cys   Leu   Ser   Ser   Leu   Leu   Gly   Gln   Leu   Ser   Gly   Gln   Val   Arg   Leu
                    110                           115                           120Leu   Leu   Gly   Ala   Leu   Gln   Gly   Leu   Leu   Gly   Thr   Gln   Leu   Pro   Leu
                    125                           130                           135Gln   Gly   Arg   Thr   Thr   Ala   His   Lys   Asp   Pro   Asn   Ala   Leu   Phe   Leu
                    140                           145                           150Ser   Leu   Gln   Gln   Leu   Leu   Arg   Gly   Lys   Val   Arg   Phe   Leu   Leu   Leu
                    155                           160                           165Val   Glu   Gly   Pro   Thr   Leu   Cys   Val   Arg   Arg   Thr   Leu   Pro   Thr   Thr
                    170                           175                           180Ala   Val   Pro   Ser   Ser   Thr   Ser   Gln   Leu   Leu   Thr   Leu   Asn   Lys   Phe
                    185                           190                           195Pro   Asn   Arg   Thr   Ser   Gly   Leu   Leu   Glu   Thr   Asn   Phe   Ser   Val   Thr
                    200                           205                           210Ala   Arg   Thr   Ala   Gly   Pro   Gly   Leu   Leu   Ser   Arg   Leu   Gln   Gly   Phe
                    215                           220                           225Arg   Val   Lys   Ile   Thr   Pro   Gly   Gln   Leu   Asn   Gln   Thr   Ser   Arg   Ser
                    230                           235                           240Pro   Val   Gln   Ile   Ser   Gly   Tyr   Leu   Asn   Arg   Thr   His   Gly   Pro   Val
                    245                           250                           255Asn   Gly   Thr   His   Gly   Leu   Phe   Ala   Gly   Thr   Ser   Leu   Gln   Thr   Leu
                    260                           265                           270Glu   Ala   Ser   Asp   Ile   Ser   Pro   Gly   Ala   Phe   Asn   Lys   Gly   Ser   Leu
                    275                           280                           285Ala   Phe   Asn   Leu   Gln   Gly   Gly   Leu   Pro   Pro   Ser   Pro   Ser   Leu   Ala
                    290                           295                           300Pro   Asp   Gly   His   Thr   Pro   Phe   Pro   Pro   Ser   Pro   Ala   Leu   Pro   Thr
                    305                           310                           315Thr   His   Gly   Ser   Pro   Pro   Gln   Leu   His   Pro   Leu   Phe   Pro   Asp   Pro
                    320                           325                           330Ser   Thr   Thr   Met   Pro   Asn   Ser   Thr   Ala   Pro   His   Pro   Val   Thr   Met
                    335                           340                           345Tyr   Pro   His   Pro   Arg   Asn   Leu   Ser   Gln   Glu   Thr
                    350                           355   356(2)SEQ ID NO:16的信息:(i)序列特征:
   (A)长度:241个氨基酸
   (B)类型:氨基酸
   (D)拓扑结构:线性(xi)序列描述:SEQ ID NO:16:Ser   Pro   Val   Ala   Pro   Ala   Cys   Asp   Pro   Arg   Leu   Leu   Asn   Lys   Leu1                       5                             10                            15Leu   Arg   Asp   Ser   His   Leu   Leu   His   Ser   Arg   Leu   Ser   Gln   Cys   Pro
                    20                            25                            30Asp   Val   Asp   Pro   Leu   Ser   Ile   Pro   Val   Leu   Leu   Pro   Ala   Val   Asp
                    35                            40                            45Phe   Ser   Leu   Gly   Glu   Trp   Lys   Thr   Gln   Thr   Glu   Gln   Ser   Lys   Ala
                    50                            55                            60Gln   Asp   Ile   Leu   Gly   Ala   Val   Ser   Leu   Leu   Leu   Glu   Gly   Val   Met
                    65                            70                            75Ala   Ala   Arg   Gly   Gln   Leu   Glu   Pro   Ser   Cys   Leu   Ser   Ser   Leu   Leu
                    80                            85                            90Gly   Gln   Leu   Ser   Gly   Gln   Val   Arg   Leu   Leu   Leu   Gly   Ala   Leu   Gln
                    95                            100                           105Gly   Leu   Leu   Gly   Thr   Gln   Leu   Pro   Leu   Gln   Gly   Arg   Thr   Thr   Ala
                    110                           115                           120His   Lys   Asp   Pro   Asn   Ala   Leu   Phe   Leu   Ser   Leu   Gln   Gln   Leu   Leu
                    125                           130                           135Arg   Gly   Lys   Asp   Phe   Trp   lle   Val   Gly   Asp   Glu   Leu   Gln   Cys   His
                    140                           145                           150Ser   Gln   Asn   Cys   Trp   Pro   Trp   Thr   Ser   Glu   Gln   Ala   Ser   Gly   Ile
                    155                           160                           165Gln   Ser   Gln   Asp   Tyr   Ser   Trp   Ser   Ala   Lys   Ser   Asr   Leu   Gln   Val
                    170                           175                           180Pro   Ser   Pro   Asn   Leu   Trp   Ile   Pro   Glu   Gln   Asp   Thr   Arg   Thr   Cys
                    185                           190                           195Glu   Trp   Asn   Ser   Trp   Ala   Leu   Cys   Trp   Asn   Leu   Thr   Ser   Asp   Pro
                    200                           205                           210Gly   Ser   Leu   Arg   His   Leu   Ala   Arg   Ser   Phe   Gln   Gln   Arg   Leu   Pro
                    215                           220                           225Gly   Ile   Gln   Pro   Pro   Gly   Trp   Thr   Ser   Ser   Phe   Ser   Lys   Pro   Cys
                    230                           235                           240Ser241(2)SEQ ID NO:17的信息:(i)序列特征:
   (A)长度:335个氨基酸
   (B)类型:氨基酸
   (D)拓扑结构:线性(xi)序列描述:SEQ ID NO:17:Ser   Pro   Val   Ala   Pro   Ala   Cys   Asp   Pro   Arg   Leu   Leu   Asn   Lys   Leu1                       5                             10                            15Leu   Arg   Asp   Ser   His   Leu   Leu   His   Ser   Arg   Leu   Ser   Gln   Cys   Pro
                    20                            25                            30Asp   Val   Asp   Pro   Leu   Ser   Ile    Pro   Val   Leu   Leu   Pro   Ala   Val   Asp
                    35                             40                            45Phe   Ser   Leu   Gly   Glu   Trp   Lys    Thr   Gln   Thr   Glu   Gln   Ser   Lys   Ala
                    50                             55                            60Gln   Asp   Ile   Leu   Gly   Ala   Val    Ser   Leu   Leu   Leu   Glu   Gly   Val   Met
                    65                             70                            75Ala   Ala   Arg   Gly   Gln   Leu   Glu   Pro   Ser   Cys   Leu    Ser   Ser   Leu   Leu
                    80                             85                            90Gly   Gln   Leu   Ser   Gly   Gln   Val   Arg   Leu   Leu   Leu    Gly   Ala   Leu   Gln
                    95                            100                            105Gly   Leu   Leu   Gly   Thr   Gln   Leu   Pro   Leu   Gln   Gly    Arg   Thr   Thr   Ala
                    110                           115                            120His   Lys   Asp   Pro   Asn   Ala   Leu   Phe   Leu   Ser   Leu    Gln   Gln   Leu   Leu
                    125                           130                            135Arg   Gly   Lys   Val   Arg   Phe   Leu   Leu   Leu   Val   Glu    Gly   Pro   Thr   Leu
                    140                           145                            150Cys   Val   Arg   Arg   Thr   Leu   Pro   Thr   Thr   Ala   Val    Pro   Ser   Ser   Thr
                    155                           160                            165Ser   Gln   Leu   Leu   Thr   Leu   Asn   Lys   Phe   Pro   Asn    Arg   Thr   Ser   Gly
                    170                           175                            180Leu   Leu   Glu   Thr   Asn   Phe   Ser   Val   Thr   Ala   Arg    Thr   Ala   Gly   Pro
                    185                           190                            195Gly   Leu   Leu   Ser   Arg   Leu   Gln   Gly   Phe   Arg   Val    Lys   Ile   Thr   Pro
                    200                           205                            210Gly   Gln   Leu   Asn   Gln   Thr   Ser   Arg   Ser   Pro   Val    Gln   Ile   Ser   Gly
                    215                           220                            225Tyr   Leu   Asn   Arg   Thr   His   Gly   Pro   Val   Asn   Gly    Thr   His   Gly   Leu
                    230                           235                            240Phe   Ala   Gly   Thr   Ser   Leu   Gln   Thr   Leu   Glu   Ala    Ser   Asp   Ile   Ser
                    245                           250                            255Pro   Gly   Ala   Phe   Asn   Lys   Gly   Ser   Leu   Ala   Phe    Asn   Leu   Gln   Gly
                    260                           265                            270Gly   Leu   Pro   Pro   Ser   Pro   Ser   Leu   Ala   Pro   Asp   Gly   His   Thr   Pro
                    275                           280                           285Phe   Pro   Pro   Ser   Pro   Ala   Leu   Pro   Thr   Thr   His   Gly   Ser   Pro   Pro
                    290                           295                           300Gln   Leu   His   Pro   Leu   Phe   Pro   Asp   Pro   Ser   Thr   Thr   Met   Pro   Asn
                    305                           310                           315Ser   Thr   Ala   Pro   His   Pro   Val   Thr   Met   Tyr   Pro   His   Pro   Arg   Asn
                    320                           325                           330Leu   Ser   Gln   Glu   Thr
                    335(2)SEQ ID NO:18的信息:
(i)序列特征:
  (A)长度:332个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:18:Ser   Pro   Ala   Pro   Pro   Ala   Cys   Asp   Pro   Arg   Leu   Leu   Asn   Lys   Leu1                       5                             10                            15Leu   Arg   Asp   Ser   His   Val   Leu   His   Gly   Arg   Leu   Ser   Gln   Cys   Pro
                    20                            25                            30Asp   Ile   Asn   Pro   Leu   Ser   Thr   Pro   Val   Leu   Leu   Pro   Ala   Val   Asp
                    35                            40                            45Phe   Thr   Leu   Gly   Glu   Trp   Lys   Thr   Gln   Thr   Glu   Gln   Thr   Lys   Ala
                    50                            55                            60Gln   Asp   Val   Leu   Gly   Ala   Thr   Thr   Leu   Leu   Leu   Glu   Ala   Val   Met
                    65                            70                            75Thr   Ala   Arg   Gly   Gln   Val   Gly   Pro   Pro   Cys   Leu   Ser   Ser   Leu   Leu
                    80                            85                            90Val   Gln   Leu   Ser   Gly   Gln   Val   Arg   Leu   Leu   Leu   Gly   Ala   Leu   Gln
                    95                            100                           105Asp   Leu   Leu   Gly   Met   Gln   Leu   Pro   Pro   Gln   Gly   Arg   Thr   Thr   Ala
                    110                           115                           120His   Lys   Asp   Pro   Ser   Ala   Ile   Phe   Leu   Asn   Phe   Gln   Gln   Leu   Leu
                    125                           130                           135Arg   Gly   Lys   Val   Arg   Phe   Leu   Leu   Leu   Val   Val   Gly   Pro   Ser   Leu
                    140                           145                           150Cys   Ala   Lys   Arg   Ala   Pro   Pro   Ala   Ile   Ala   Val   Pro   Ser   Ser   Thr
                    155                           160                           165Ser   Pro   Phe   His   Thr   Leu   Ash   Lys   Leu   Pro   Asn   Arg   Thr   Ser   Gly
                    170                           175                           180Leu   Leu   Glu   Thr   Asn   Ser   Ser   Ile   Ser   Ala   Arg   Thr   Thr   Gly   Ser
                    185                           190                           195Gly   Phe   Leu   Lys   Arg   Leu   Gln   Ala   Phe   Arg   Ala   Lys   Ile   Pro   Gly
                    200                           205                           210Leu   Leu   Asn   Gln   Thr   Ser   Arg   Ser   Leu   Asp   Gln   Ile   Pro   Gly   His
                    215                           220                           225Gln   Asn   Gly   Thr   His   Gly   Pro   Leu   Ser   Gly   Ile   His   Gly   Leu   Phe
                    230                           235                           240Pro   Gly   Pro   Gln   Pro   Gly   Ala   Leu   Gly   Ala   Pro   Asp   Ile   Pro   Pro
                    245                           250                           255Ala   Thr   Ser   Gly   Met   Gly   Ser   Arg   Pro   Thr   Tyr   Leu   Gln   Pro   Gly
                    260                           265                           270Glu   Ser   Pro   Ser   Pro   Ala   His   Pro   Ser   Pro   Gly   Arg   Tyr   Thr   Leu
                    275                           280                           285Phe   Ser   Pro   Ser   Pro   Thr   Ser   Pro   Ser   Pro   Thr   Val   Gln   Leu   Gln
                    290                           295                           300Pro   Leu   Leu   Pro   Asp   Pro   Ser   Ala   lle   Thr   Pro   Asn   Ser   Thr   Ser
                    305                           310                           315Pro   Leu   Leu   Phe   Ala   Ala   His   Pro   His   Phe   Gln   Asn   Leu   Ser   Gln
                    320                           325                           330Glu   Glu   332(2)SEQ ID NO:19的信息:
(i)序列特征:
  (A)长度:1026碱基对
  (B)类型:核酸
  (C)股性:单链
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:19:AGCCCGGCTC       CTCCTGCCTG       TGACCCCCGA      CTCCTAAATA       AACTGCTTCG      50TGACTCCCAT       GTCCTTCACG       GCAGACTGAG      CCAGTGCCCA       GACATTAACC      100CTTTGTCCAC       ACCTGTCCTG       CTGCCTGCTG      TGGACTTCAC       CTTGGGAGAA      150TGGAAAACCC       AGACGGAGCA       GACAAAGGCA      CAGGATGTCC       TGGGAGCCAC      200AACCCTTCTG       CTGGAGGCAG       TGATGACAGC      ACGGGGACAA       GTGGGACCCC      250CTTGCCTCTC       ATCCCTGCTG       GTGCAGCTTT      CTGGACAGGT       TCGCCTCCTC      300CTCGGGGCCC       TGCAGGACCT       CCTTGGAATG      CAGCTTCCTC       CACAGGGAAG      350GACCACAGCT       CACAAGGATC       CCAGTGCCAT      CTTCCTGAAC       TTCCAACAAC      400TGCTCCGAGG       AAAGGTGCGT       TTCCTGCTCC      TTGTAGTGGG       GCCCTCCCTC      450TGTGCCAAGA       GGGCCCCACC       CGCCATAGCT      GTCCCGAGCA       GCACCTCTCC      500ATTCCACACA       CTGAACAAGC       TCCCAAACAG      GACCTCTGGA       TTGTTGGAGA      550CAAACTCCAG       TATCTCAGCC       AGAACTACTG      GCTCTGGATT       TCTCAAGAGG      600CTGCAGGCAT       TCAGAGCCAA       GATTCCTGGT      CTGCTGAACC       AAACCTCCAG      650GTCCCTAGAC       CAAATCCCTG       GACACCAGAA      TGGGACACAC       GGACCCTTGA      700GTGGAATTCA       TGGACTCTTT       CCTGGACCCC      AACCCGGGGC       CCTCGGAGCT      750CCAGACATTC       CTCCAGCAAC       TTCAGGCATG      GGCTCCCGGC       CAACCTACCT      800CCAGCCTGGA       GAGTCTCCTT       CCCCAGCTCA      CCCTTCTCCT       GGACGATACA      850CTCTCTTCTC       TCCTTCACCC       ACCTCGCCCT      CCCCCACAGT       CCAGCTCCAG      900CCTCTGCTTC       CTGACCCCTC       TGCGATCACA      CCCAACTCTA       CCAGTCCTCT      950TCTATTTGCA       GCTCACCCTC       ATTTCCAGAA      CCTGTCTCAG       GAAGAGTAAG      1000GTCCTCAGAC       CCTGCCAACT       TCAGCA1026(2)SEQ ID NO:20的信息:
(i)序列特征:
(A)长度:1014碱基对
(B)类型:核酸
(C)股性:单链
(D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:20:AGCCCGGCTC       CTCCTGCCTG      TGACCCCCGA      CTCCTAAATA       AACTGCTTCG      50TGACTCCCAT       GTCCTTCACG      GCAGACTGAG      CCAGTGCCCA       GACATTAACC      100CTTTGTCCAC       ACCTGTCCTG      CTGCCTGCTG      TGGACTTCAC       CTTGGGAGAA      150TGGAAAACCC       AGACGGAGCA      GACAAAGGCA      CAGGATGTCC       TGGGAGCCAC      200AACCCTTCTG       CTGGAGGCAG      TGATGACAGC      ACGGGGACAA       GTGGGACCCC      250CTTGCCTCTC       ATCCCTGCTG      GTGCAGCTTT      CTGGACAGGT       TCGCCTCCTC      300CTCGGGGCCC       TGCAGGACCT      CCTTGGAATG      CAGGGAAGGA       CCACAGCTCA      350CAAGGATCCC       AGTGCCATCT      TCCTGAACTT      CCAACAACTG       CTCCGAGGAA      400AGGTGCCTTT       CCTGCTCCTT      GTAGTGGGGC      CCTCCCTCTG       TGCCAAGAGG      450CCCCCACCCG       CCATAGCTGT      CCCGAGCAGC      ACCTCTCCAT       TCCACACACT      500GAACAAGCTC       CCAAACAGGA      CCTCTGGATT      GTTGGAGACA       AACTCCAGTA      550TCTCAGCCAG       AACTACTGGC      TCTGGATTTC      TCAAGAGGCT       GCAGGCATTC      600AGAGCCAAGA       TTCCTGGTCT      GCTGAACCAA      ACCTCCAGGT       CCCTAGACCA      650AATCCCTGGA       CACCAGAATG      GGACACACGG      ACCCTTGAGT       GGAATTCATG      700GACTCTTTCC       TGGACCCCAA      CCCGGGGCCC      TCGGAGCTCC       AGACATTCCT      750CCAGCAACTT       CAGGCATGGG      CTCCCGGCCA      ACCTACCTCC       AGCCTGGAGA      800GTCTCCTTCC       CCAGCTCACC      CTTCTCCTGG      ACGATACACT       CTCTTCTCTC      850CTTCACCCAC       CTCGCCCTCC      CCCACAGTCC      AGCTCCAGCC       TCTGCTTCCT      900GACCCCTCTG       CGATCACACC      CAACTCTACC      AGTCCTCTTC       TATTTGCAGC      950TCACCCTCAT       TTCCAGAACC      TGTCTCAGGA      AGAGTAAGGT       GCTCAGACCC      1000TGCCAACTTC       AGCA1014(2)SEQ ID NO:21的信息:
(i)序列特征:
  (A)长度:328个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:21:Ser   Pro   Ala   Pro   Pro   Ala   Cys   Asp   Pro   Arg   Leu   Leu   Asn   Lys   Leu1                       5                             10                            15Leu   Arg   Asp   Ser   His   Val   Leu   His   Gly   Arg   Leu   Ser   Gln   Cys   Pro
                    20                            25                            30Asp   Ile   Asn   Pro   Leu   Ser   Thr   Pro   Val   Leu   Leu   Pro   Ala   Val   Asp
                    35                            40                            45Phe   Thr   Leu   Gly   Glu   Trp   Lys   Thr   Gln   Thr   Glu   Gln   Thr   Lys   Ala
                    50                            55                            60Gln   Asp   Val   Leu   Gly   Ala   Thr   Thr   Leu   Leu   Leu   Glu   Ala   Val   Met
                    65                            70                            75Thr   Ala   Arg   Gly   Gln   Val   Gly   Pro   Pro   Cys   Leu   Ser   Ser   Leu   Leu
                    80                            85                            90Val   Gln   Leu   Ser   Gly   Gln   Val   Arg   Leu   Leu   Leu   Gly   Ala   Leu   Gln
                    95                            100                           105Asp   Leu   Leu   Gly   Met   Gln   Gly   Arg   Thr   Thr   Ala   His   Lys   Asp   Pro
                    110                           115                           120Ser   Ala   Ile   Phe   Leu   Asn   Phe   Gln   Gln   Leu   Leu   Arg   Gly   Lys   Val
                    125                           130                           135Arg   Phe   Leu   Leu   Leu   Val   Val   Gly   Pro   Ser   Leu   Cys   Ala   Lys   Arg
                    140                           145                           150Ala   Pro   Pro   Als   Ile   Ala   Val   Pro   Ser   Ser   Thr   Ser   Pro   Phe   His
                    155                           160                           165Thr   Leu   Asn   Lys   Leu   Pro   Asn   Arg   Thr   Ser   Gly   Leu   Leu   Glu   Thr
                    170                           175                           180Asn   Ser   Ser   Ile   Ser   Ala   Arg   Thr   Thr   Gly   Ser   Gly   Phe   Leu   Lys
                    185                           190                           195Arg   Leu   Gln   Ala   Phe   Arg   Ala   Lys   Ile    Pro   Gly   Leu   Leu   Asn   Gln
                          200                      205                           210Thr   Ser   Arg   Ser   Leu   Asp   Gln   Ile    Pro   Gly   His   Gln   Asn   Gly   Thr
                          215                      220                           225His   Gly   Pro   Leu   Ser   Gly   Ile    His   Gly   Leu   Phe   Pro   Gly   Pro   Gln
                          230                      235                           240Pro   Gly   Ala   Leu   Gly   Ala   Pro   Asp   Ile    Pro   Pro   Als   Thr   Ser   Gly
                          245                      250                           255Met   Gly   Ser   Arg   Pro   Thr   Tyr   Leu   Gln    Pro   Gly   Glu   Ser   Pro   Ser
                          260                      265                           270Pro   Ala   His   Pro   Ser   Pro   Gly   Arg   Tyr    Thr   Leu   Phe   Ser   Pro   Ser
                          275                      280                           285Pro   Thr   Ser   Pro   Ser   Pro   Thr   Val   Gln    Leu   Gln   Pro   Leu   Leu   Pro
                          290                      295                           300Asp   Pro   Ser   Ala   Ile   Thr   Pro   Asn   Ser    Thr   Ser   Pro   Leu   Leu   Phe
                          305                      310                           315Ala   Ala   His   Pro   His   Phe   Gln   Asn   Leu    Ser   Gln   Glu   Glu
                          320                      325               328(2)SEQ ID NO:22的信息:
(i)序列特征:
  (A)长度:5141碱基对
  (B)类型:核酸
  (C)股性:双链
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:22:TTCGAGCTCG      CCCGACATTG       ATTATTGACT      AGAGTCGATC      GACAGCTGTG      50GAATGTGTGT      CAGTTAGGGT       GTGGAAAGTC      CCCAGGCTCC      CCAGCAGGCA      100GAAGTATGCA      AAGCATGCAT       CTCAATTAGT      CAGCAACCAG      GTGTGGAAAG      150TCCCCAGGCT      CCCCAGCAGG       CAGAAGTATG      CAAAGCATGC      ATCTCAATTA      200GTCAGCAACC      ATAGTCCCGC      CCCTAACTCC       GCCCATCCCG      CCCCTAACTC      250CGCCCAGTTC      CGCCCATTCT      CCGCCCCATG       GCTGACTAAT      TTTTTTTATT      300TATGCAGAGG      CCGAGGCCGC      CTCGGCCTCT       GAGCTATTCC      AGAAGTAGTG      350AGGAGCCTTT      TTTGGAGGCC      TAGGCTTTTG       CAAAAAGCTA      GCTTATCCGG      400CCGGGAACGG      TGCATTGGAA      CGCGGATTCC       CCGTGCCAAG      AGTGACGTAA      450GTACCGCCTA      TAGAGCGATA      AGAGGATTTT       ATCCCCGCTG      CCATCATGGT      500TCGACCATTG      AACTGCATCG      TCGCCGTGTC       CCAAAATATG      GGGATTGGCA      550AGAACGGAGA      CCTACCCTGG      CCTCCGCTCA       GGAACGAGTT      CAAGTACTTC      600CAAAGAATGA      CCACAACCTC      TTCAGTGGAA       GGTAAACAGA      ATCTGGTGAT      650TATGGGTAGG      AAAACCTGGT      TCTCCATTCC       TGAGAAGAAT      CGACCTTTAA      700AGGACAGAAT      TAATATAGTT      CTCAGTAGAG       AACTCAAAGA      ACCACCACGA      750GGAGCTCATT      TTCTTGCCAA      AAGTTTGGAT       GATGCCTTAA      GACTTATTGA      800ACAACCGGAA      TTGGCAAGTA      AAGTAGACAT       GGTTTGGATA      GTCGGAGGCA      850GTTCTGTTTA      CCAGGAAGCC      ATGAATCAAC       CAGGCCACCT      TAGACTCTTT      900GTGACAAGGA      TCATGCAGGA      ATTTGAAAGT       GACACGTTTT      TCCCAGAAAT      950TGATTTGGGG      AAATATAAAC      CTCTCCCAGA       ATACCCAGGC      GTCCTCTCTG      1000AGGTCCAGGA      GGAAAAAGGC      ATCAAGTATA       AGTTTGAAGT      CTACGAGAAG      1050AAAGACTAAC      AGGAAGATGC      TTTCAAGTTC       TCTGCTCCCC      TCCTAAAGCT      1100ATGCATTTTT      ATAAGACCAT      GGGACTTTTG       CTGGCTTTAG      ATCCCCTTGG      1150CTTCGTTAGA      ACGCGGCTAC      AATTAATACA       TAACCTTATG      TATCATACAC      1200ATACGATTTA      GGTGACACTA      TAGATAACAT       CCACTTTGCC      TTTCTCTCCA      1250CAGGTGTCCA      CTCCCAGGTC      CAACTGCACC       TCGGTTCTAA      GCTTCTGCAG      1300GTCGACTCTA      GAGGATCCCC      GGGGAATTCA       ATCGATGGCC      GCCATGGCCC      1350AACTTGTTTA      TTGCAGCTTA      TAATGGTTAC       AAATAAAGCA      ATAGCATCAC      1400AAATTTCACA      AATAAAGCAT      TTTTTTCACT       GCATTCTAGT      TGTGGTTTGT      1450CCAAACTCAT      CAATGTATCT      TATCATGTCT       GGATCGATCG      GGAATTAATT      1500CGGCGCAGCA      CCATGGCCTG      AAATAACCTC       TGAAAGAGGA      ACTTGGTTAG      1550GTACCTTCTG      AGGCGGAAAG      AACCAGCTGT       GGAATGTGTG      TCAGTTAGGG      1600TGTGGAAAGT      CCCCAGGCTC      CCCAGCAGGC       AGAAGTATGC      AAAGCATGCA      1650TCTCAATTAG      TCAGCAACCA      GGTGTGGAAA       GTCCCCAGGC      TCCCCAGCAG      1700GCAGAAGTAT      GCAAAGCATG      CATCTCAATT       AGTCAGCAAC      CATAGTCCCG      1750CCCCTAACTC      CGCCCATCCC      GCCCCTAACT       CCGCCCAGTT      CCGCCCATTC      1800TCCGCCCCAT       GGCTGACTAA      TTTTTTTTAT      TTATGCAGAG      GCCGAGGCCG       1850CCTCGGCCTC       TGAGCTATTC      CAGAAGTAGT      GAGGAGGCTT      TTTTGGAGGC       1900CTAGGCTTTT       GCAAAAAGCT      GTTACCTCGA      GCGGCCGCTT      AATTAAGGCG       1950CGCCATTTAA       ATCCTGCAGG      TAACAGCTTG      GCACTGGCCG      TCGTTTTACA       2000ACGTCGTGAC       TGGGAAAACC      CTGGCGTTAC      CCAACTTAAT      CGCCTTGCAG       2050CACATCCCCC       CTTCGCCAGC      TGGCGTAATA      GCGAAGAGGC      CCGCACCGAT       2100CGCCCTTCCC       AACAGTTGCG      TAGCCTGAAT      GGCGAATGGC      GCCTGATGCG       2150GTATTTTCTC       CTTACGCATC      TGTGCGGTAT      TTCACACCGC      ATACGTCAAA       2200GCAACCATAG       TACGCGCCCT      GTAGCGGCGC      ATTAAGCGCG      GCGGGTGTGG       2250TGGTTACGCG       CAGCGTGACC      GCTACACTTG      CCAGCGCCCT      AGCGCCCGCT       2300CCTTTCGCTT       TCTTCCCTTC      CTTTCTCGCC      ACGTTCGCCG      GCTTTCCCCG       2350TCAAGCTCTA       AATCGGGGGC      TCCCTTTAGG      GTTCCGATTT      AGTGCTTTAC       2400GGCACCTCGA       CCCCAAAAAA      CTTGATTTGG      GTGATGGTTC      ACGTAGTGGG       2450CCATCGCCCT       GATAGACGGT      TTTTCGCCCT      TTGACGTTGG      AGTCCACGTT       2500CTTTAATAGT       GGACTCTTGT      TCCAAACTGG      AACAACACTC      AACCCTATCT       2550CGGGCTATTC       TTTTGATTTA      TAAGGGATTT      TGCCGATTTC      GGCCTATTGG       2600TTAAAAAATG       AGCTGATTTA      ACAAAAATTT      AACGCGAATT      TTAACAAAAT       2650ATTAACGTTT       ACAATTTTAT      GGTGCACTCT      CAGTACAATC      TGCTCTGATG       2700CCGCATAGTT       AAGCCAACTC      CGCTATCGCT      ACGTGACTGG      GTCATGGCTG       2750CGCCCGGACA       CCCGCCAACA      CCCGCTGACG      CGCCCTGACG      GGCTTGTCTG       2800CTCCCGGCAT       CCGCTTACAG      ACAAGCTGTG      ACCGTCTCCG      GGAGCTGCAT       2850GTGTCAGAGG       TTTTCACCGT      CATCACCGAA      ACGCGCGAGG      CAGTATTCTT       2900GAAGACGAAA       GGGCCTCGTG       ATACGCCTAT     TTTTATAGGT      TAATGTCATG       2950ATAATAATGG       TTTCTTAGAC      GTCAGGTGGC      ACTTTTCGGG      GAAATGTGCG       3000CGGAACCCCT       ATTTGTTTAT      TTTTCTAAAT      ACATTCAAAT      ATGTATCCGC       3050TCATGAGACA       ATAACCCTGA      TAAATGCTTC      AATAATATTG      AAAAAGGAAG       3100AGTATGAGTA       TTCAACATTT      CCGTGTCGCC      CTTATTCCCT      TTTTTGCGGC       3150ATTTTGCCTT       CCTGTTTTTG      CTCACCCAGA      AACGCTGGTG      AAAGTAAAAG       3200ATGCTGAAGA       TCAGTTGGGT      GCACGAGTGG      GTTACATCGA      ACTGGATCTC       3250AACAGCGGTA       AGATCCTTGA      GAGTTTTCGC      CCCGAAGAAC      GTTTTCCAAT       3300GATGAGCACT       TTTAAAGTTC      TGCTATGTGG      CGCGGTATTA      TCCCGTGATG       3350ACGCCGGGCA       AGAGCAACTC      GGTCGCCGCA      TACACTATTC      TCAGAATGAC       3400TTGGTTGAGT      ACTCACCAGT      CACAGAAAAG      CATCTTACGG      ATGGCATGAC      3450AGTAAGAGAA      TTATGCAGTG      CTGCCATAAC      CATGAGTGAT      AACACTGCGG      3500CCAACTTACT      TCTGACAACG      ATCGGAGGAC      CGAAGGAGCT      AACCGCTTTT      3550TTGCACAACA      TGGGGGATCA      TGTAACTCGC      CTTGATCGTT      GGGAACCGGA      3600GCTGAATGAA      GCCATACCAA      ACGACGAGCG      TGACACCACG      ATGCCAGCAG      3650CAATGGCAAC      AACGTTGCGC      AAACTATTAA      CTGGCGAACT      ACTTACTCTA      3700GCTTCCCGGC      AACAATTAAT      AGACTGGATG      GAGGCGGATA      AAGTTGCAGG      3750ACCACTTCTG      CGCTCGGCCC      TTCCGGCTGG      CTGGTTTATT      GCTGATAAAT      3800CTGGAGCCGG      TGAGCGTGGG      TCTCGCGGTA      TCATTGCAGC      ACTGGGGCCA      3850GATGGTAAGC      CCTCCCGTAT      CGTAGTTATC      TACACGACGG      GGAGTCAGGC      3900AACTATGGAT      GAACGAAATA      GACAGATCGC      TGAGATAGGT      GCCTCACTGA      3950TTAAGCATTG      GTAACTGTCA      GACCAAGTTT      ACTCATATAT      ACTTTAGATT      4000GATTTAAAAC      TTCATTTTTA      ATTTAAAAGG      ATCTAGGTGA      AGATCCTTTT      4050TGATAATCTC      ATGACCAAAA      TCCCTTAACG      TGAGTTTTCG      TTCCACTGAG      4100CGTCAGACCC      CGTAGAAAAG      ATCAAAGGAT      CTTCTTGAGA      TCCTTTTTTT      4150CTGCGCGTAA      TCTGCTGCTT      GCAAACAAAA      AAACCACCGC      TACCAGCGGT      4200GGTTTGTTTG      CCGGATCAAG      AGCTACCAAC      TCTTTTTCCG      AAGGTAACTG      4250GCTTCAGCAG      AGCGCAGATA      CCAAATACTG      TCCTTCTAGT      GTAGCCGTAG      4300TTAGGCCACC      ACTTCAAGAA      CTCTGTAGCA      CCGCCTACAT      ACCTCGCTCT      4350GCTAATCCTG      TTACCAGTGG      CTGCTGCCAG      TGGCGATAAG      TCGTGTCTTA      4400CCGGGTTGGA      CTCAAGACGA      TAGTTACCGG      ATAAGGCGCA      GCGGTCGGGC      4450TGAACGGGGG      GTTCGTGCAC      ACAGCCCAGC      TTGGAGCGAA      CGACCTACAC      4500CGAACTGAGA      TACCTACAGC      GTGAGCATTG      AGAAAGCGCC      ACGCTTCCCG      4550AAGGGAGAAA      GGCGGACAGG      TATCCGGTAA      GCGGCAGGGT      CGGAACAGGA      4600GAGCGCACGA      GGGAGCTTCC      AGGGGGAAAC      GCCTGGTATC      TTTATAGTCC      4650TGTCGGGTTT      CGCCACCTCT      GACTTGAGCG      TCGATTTTTG      TGATGCTCGT      4700CAGGGGGGCG      GAGCCTATGG      AAAAACGCCA      GCAACGCGGC      CTTTTTACGG      4750TTCCTGGCCT      TTTGCTGGCC      TTTTGCTCAC      ATGTTCTTTC      CTGCGTTATC      4800CCCTGATTCT      GTGGATAACC      GTATTACCGC      CTTTGAGTGA      GCTGATACCG      4850CTCGCCCCAG      CCGAACGACC      GAGCGCAGCG      AGTCAGTGAG      CGAGGAAGCG      4900GAAGAGCGCC      CAATACGCAA      ACCGCCTCTC      CCCGCGCGTT      GGCCGATTCA      4950TTAATCCAGC      TGGCACGACA      GGTTTCCCGA      CTGGAAAGCG      GGCAGTGAGC      5000GCAAC GCAAT     TAATGTGAGT      TACCTCACTC      ATTAGGCACC      CCAGGCTTTA      5050CACTTTATGC      TTCCGGCTCG      TATGTTGTGT      GGAATTGTGA      GCGGATAACA      5100ATTTCACACA      GGAAACAGCT      ATGACCATGA      TTACGAATTA      A5141(2)SEQ ID NO:23的信息:
(i)序列特征:
  (A)长度:21碱基对
  (B)类型:核酸
  (C)股性:单链
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:23:ATGTCNCCNG CNCCNCCNGC N 21(2)SEQ ID NO:24的信息:
(i)序列特征:
  (A)长度:21碱基对
  (B)类型:核酸
  (C)股性:单链
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:24:ATGTCTCCAG CGCCGCCAGC G 21(2)SEQ ID NO:25的信息:
(i)序列特征:
  (A)长度:21碱基对
  (B)类型:核酸
  (C)股性:单链
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:25:ATGTCGCCTG CTCCACCTGC T 21(2)SEQ ID NO:26的信息:
(i)序列特征:
  (A)长度:21碱基对
  (B)类型:核酸
  (C)股性:单链
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:26:ATGTCGCCAG CGCCACCAGC C 21(2)SEQ ID NO:27的信息:
(i)序列特征:
  (A)长度:21碱基对
  (B)类型:核酸
  (C)股性:单链
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:27:ATGTCCCCAG CCCCACCCGC A 21(2)SEQ ID NO:28的信息:
(i)序列特征:
  (A)长度:21碱基对
  (B)类型:核酸
  (C)股性:单链
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:28:ATGTCGCCAG CGCCGCCAGC G 21(2)SEQ ID NO:29的信息:
(i)序列特征:
  (A)长度:25个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:29:Ser Pro Ala Pro Pro Ala Cys Asp Pro Arg Leu Leu Asn Lys Leu1               5                   10                  15Leu Arg Asp Asp His Val Leu His Gly Arg
            20                  25(2)SEQ ID NO:30的信息:
(i)序列特征:
  (A)长度:26个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:30:Ser Pro Ala Pro Pro Ala Cys Asp Pro Arg Leu Leu Asn Lys Leu1               5                   10                  15Leu Arg Asp Asp Xaa Val Leu His Gly Arg Leu
            20                  25  26(2)SEQ ID NO:31的信息:
(i)序列特征:
  (A)长度:25个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:31:Ser Pro Ala Pro Pro Ala Xaa Asp Pro Arg Leu Leu Asn Lys Leu1               5                   10                  15Leu Arg Asp Asp His Val Leu His Gly Arg
            20                  25(2)SEQ ID NO:32的信息:
(i)序列特征:
  (A)长度:14个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:32:Xaa Pro Ala Pro Pro Ala Xaa Asp Pro Arg Leu Xaa Asn Lys1               5                   10              14(2)SEQ ID NO:33的信息:
(i)序列特征:
  (A)长度:9个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:33:Pro Arg Leu Leu Asn Lys Leu Leu Arg1               5               9(2)SEQ ID NO:34的信息:
(i)序列特征:
(A)长度:45碱基对
  (B)类型:核酸
  (C)股性:单链
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:34:GCCGTGAAGG ACGTGGTCGT CACGAAGCAG TTTATTTAGG AGTCG 45(2)SEQ ID NO:35的信息:
(i)序列特征:
  (A)长度:20碱基对
  (B)类型:核酸
  (C)股性:单链
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:35:CCNGCNCCNC CNGCNTGYGA 20(2)SEQ ID NO:36的信息:
(i)序列特征:
  (A)长度:21碱基对
  (B)类型:核酸
  (C)股性:单链
(D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:36:NCCRTGNARN ACRTGRTCRT C 21(2)SEQ ID NO:37的信息:
(i)序列特征:
  (A)长度:69碱基对
  (B)类型:核酸
  (C)股性:单链
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:37:CCAGCGCCGC CAGCCTGTGA CCCCCGACTC CTAAATAAAC TGCCTCGTGA 50TGACCACGTT CAGCACGGC    69(2)SEQ ID NO:38的信息:
(i)序列特征:
  (A)长度:69碱基对
  (B)类型:核酸
  (C)股性:单链
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:38:GGTCGCGGCG GTCGGACACT GGGGGCTGAG GATTTATTTG ACGGAGCACT 50ACTGGTGCAA GTCGTGCCG    69(2)SEQ ID NO:39的信息:
(i)序列特征:
  (A)长度:69碱基对
  (B)类型:核酸
  (C)股性:单链
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:39:CCAGCACCTC CGGCATGTGA CCCCCGACTC CTAAATAAAC TGCTTCGTGA 50CGACCACGTC CATCACGGC    69(2)SEQ ID NO:40的信息:
(i)序列特征:
  (A)长度:69碱基对
  (B)类型:核酸
  (C)股性:单链
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:40:GGTCGTGGAG GCCGTACACT GGGGGCTGAG GATTTATTTG ACGAAGCACT 50GCTGGTGCAG GTAGTGCCG  69(2)SEQ ID NO:41的信息:
(i)序列特征:
  (A)长度:69碱基对
  (B)类型:核酸
  (C)股性:单链
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:41:CCAGCACCGC CGGCATGTGA CCCCCGACTC CTAAATAAAC TGCTTCGTGA 50CGATCATGTC TATCACGGT  69(2)SEQ ID NO:42的信息:
(i)序列特征:
  (A)长度:69碱基对
  (B)类型:核酸
  (C)股性:单链
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:42:GGTCGTGGCG GCCGTACACT GGGGGCTGAG GATTTATTTG ACGAAGCACT 50GCTAGTACAG ATAGTGCCA  69(2)SEQ ID NO:43的信息:
(i)序列特征:
   (A)长度:37碱基对
   (B)类型:核酸
   (C)股性:单链
   (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:43:GCTAGCTCTA GAAATTGCTC CTCGTGGTCA TGCTTCT 37(2)SEQ ID NO:44的信息:
(i)序列特征:
   (A)长度:22碱基对
   (B)类型:核酸
   (C)股性:单链
   (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:44:CAGTCTGCCG TGAAGGACAT GG 22(2)SEQ ID NO:45的信息:
(i)序列特征:
   (A)长度:24碱基对
   (B)类型:核酸
   (C)股性:单链
   (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:45:TGTGGACTTT AGCTTGGGAG AATG 24(2)SEQ ID NO:46的信息:
(i)序列特征:
   (A)长度:22碱基对
   (B)类型:核酸
   (C)股性:单链
   (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:46:GGTCCAGGGA CCTGGAGGTT TG 22(2)SEQ ID NO:47的信息:
(i)序列特征:
   (A)长度:31碱基对
  (B)类型:核酸
  (C)股性:单链
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:47:ATCGATATCG ATAGCCAGAC ACCCCGGCCA G 31(2)SEQ ID NO:48的信息:
(i)序列特征:
  (A)长度:36碱基对
  (B)类型:核酸
  (C)股性:单链
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:48:GCTAGCTCTA GACAGGGAAG GGAGCTGTAC ATGAGA 36(2)SEQ ID NO:49的信息:
(i)序列特征:
  (A)长度:24碱基对
  (B)类型:核酸
  (C)股性:单链
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:49:CTCCTTGGAA CCCAGGGCAG GACC 24(2)SEQ ID NO:50的信息:
(i)序列特征:
  (A)长度:24碱基对
  (B)类型:核酸
  (C)股性:单链
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:50:GGTCCTGCCC TGGGTTCCAA GGAG 24(2)SEQ ID NO:51:
(i)序列特征:
  (A)长度:27碱基对
  (B)类型:核酸
  (C)股性:单链
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:51:CTGCTCCGAG GAAAGGACTT CTGGATT 27(2)SEQ ID NO:52:
(i)序列特征:
  (A)长度:27碱基对
  (B)类型:核酸
  (C)股性:单链
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:52:AATCCAGAAG TCCTTTCCTC GGAGCAG 27(2)SEQ ID NO:53:
(i)序列特征:
  (A)长度:28碱基对
  (B)类型:核酸
  (C)股性:单链
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:53:CCCTCTGCGT CGCGGCGGCC CCACCCAC 28(2)SEQ ID NO:54:
(i)序列特征:
  (A)长度:28碱基对
  (B)类型:核酸
  (C)股性:单链
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:54:GTGGGTGGGG CCGCCGCGAC GCAGAGGG 28(2)SEQ ID NO:55:
(i)序列特征:
  (A)长度:35碱基对
  (B)类型:核酸
  (C)股性:单链
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:55:GACTCGAGGA TCCATCGATT TTTTTTTTTT TTTTT 35(2)SEQ ID NO:56:
(i)序列特征:
  (A)长度:17碱基对
  (B)类型:核酸
  (C)股性:单链
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:5 6:GACTCGAGGA TCCATCG 17(2)SEQ ID NO:57:
(i)序列特征:
  (A)长度:32碱基对
  (B)类型:核酸
  (C)股性:单链
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:57:GCTACCTCTA GAAGCCCGGC TCCTCCTGCC TG 32(2)SEQ ID NO:58:
(i)序列特征:
  (A)长度:21碱
  (B)类型:核酸
  (C)股性:单链
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:58:CGAAATTAAC CCTCACTAAA G 21(2)SEQ ID NO:59:
(i)序列特征:
  (A)长度:103碱基对
  (B)类型:核酸
  (C)股性:单链
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:59:TGCAGCAAGG GCTACTGCCA CACTCGAGCT GCGCAGATGC TAGCCTCAAG 50ATGGCTGATC CAAATCGATT CCGCGGCAAA GATCTTCCGG TCCTGTAGAA 100GCT103(2)SEQ ID NO:60:
(i)序列特征:
  (A)长度:103碱基对
  (B)类型:核酸
  (C)股性:单链
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:60:AGCTTCTACA GGACCGGAAG ATCTTTGCCG CGGAATCGAT TTGGATCAGC 50CATCTTGAGG CTAGCATCTG CGCAGCTCGA GTGTGGCAGT AGCCCTTGCT 100GCA 103(2)SEQ ID NO:61:
(i)序列特征:
  (A)长度:18碱基对
  (B)类型:核酸
  (C)股性:单链
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:61:TCTCGCTACC GTTTACAG 18(2)SEQ ID NO:62:
(i)序列特征:
  (A)长度:25碱基对
  (B)类型:核酸
  (C)股性:单链
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:62:CAGGTACCCA CCAGGCGGTC TCGGT 25(2)SEQ ID NO:63:
(i)序列特征:
  (A)长度:18碱基对
  (B)类型:核酸
  (C)股性:单链
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:63:GGGCCATGAC ACTGTCAA 18(2)SEQ ID NO:64:
(i)序列特征:
  (A)长度:40碱基对
  (B)类型:核酸
  (C)股性:单链
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:64:GACCGCCACC GAGACCGCCT GGTGGGTACC TGTGGTCCTT 40(2)SEQ ID NO:65:
(i)序列特征:
  (A)长度:32碱基对
  (B)类型:核酸
  (C)股性:单链
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:65:ATCGATATCG ATCAGCCAGA CACCCCGGCC AG 32(2)SEQ ID NO:66:
(i)序列特征:
  (A)长度:35碱基对
  (B)类型:核酸
  (C)股性:单链
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:66:TCTAGATCTA GATCACCTGA CGCAGAGGGT GGACC 35(2)SEQ ID NO:67:
(i)序列特征:
  (A)长度:33碱基对
  (B)类型:核酸
  (C)股性:单链
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:67:AGTCGACGTC GACGTCGGCA GTGTCTGAGA ACC 33(2)SEQ ID NO:68:
(i)序列特征:
  (A)长度:36碱基对
  (B)类型:核酸
  (C)股性:单链
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:68:AGTCGACGTC GACTCACCTG ACGCAGAGGG TGGACC 36(2)SEQ ID NO:69:
(i)序列特征:
  (A)长度:62碱基对
  (B)类型:核酸
  (C)股性:单链
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:69:CGCGTATGCC AGCCCGGCTC CTCCTGCTTG TGACCTCCGA GTCCTCAGTA 50AACTGCTTCG TG 62(2)SEQ ID NO:70:
(i)序列特征:
  (A)长度:61碱基对
  (B)类型:核酸
  (C)股性:单链
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:70:ATACGGTCGG GCCGAGGAGG ACGAACACTG GAGGCTCAGG AGTCATTTGA 50CGAAGCACTG A 61(2)SEQ ID NO:71:
(i)序列特征:
  (A)长度:37碱基对
  (B)类型:核酸
  (C)股性:单链
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:71:CTAGAATTAT GAAAAAGAAT ATCGCATTTC TTCTTAA 37(2)SEQ ID NO:72:
(i)序列特征:
  (A)长度:37碱基对
  (B)类型:核酸
  (C)股性:单链
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:72:TTAATACTTT TTCTTATAGC GTAAAGAAGA ATTGCGC 37(2)SEQ ID NO:73:
(i)序列特征:
   (A)长度:69碱基对
  (B)类型:核酸
  (C)股性:单链
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:73:CTAGAATTAT GAAAAAGAAT ATCGCATTTC ATCACCATCA CCATCACCAT 50CACATCGAAG GTCGTAGCC    69(2)SEQ ID NO:74:
(i)序列特征:
  (A)长度:62碱基对
  (B)类型:核酸
  (C)股性:单链
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:74:TTAATACTTT TTCTTATAGC GTAAAGTAGT GGTAGTGGTA GTGGTAGTGT 50AGCTTCCAGC AT 62(2)SEQ ID NO:75:
(i)序列特征:
  (A)长度:69碱基对
  (B)类型:核酸
  (C)股性:单链
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:75:CTAGAATTAT GAAAAAGAAT ATCGCATTTC ATCACCATCA CCATCACCAT 50CACATCGAAC CACGTAGCC    69(2)SEQ ID NO:76:
(i)序列特征:
  (A)长度:62碱基对
  (B)类型:核酸
  (C)股性:单链
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:76:TTAATACTTT TTCTTATAGC GTAAAGTAGT GGTAGTGGTA GTGGTAGTGT 50AGCTTGGTGC AT 62(2)SEQ ID NO:77:
(i)序列特征:
  (A)长度:19碱基对
  (B)类型:核酸
  (C)股性:单链
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:77:TCCACCCTCT GCGTCAGGT 19(2)SEQ ID NO:78:
(i)序列特征:
  (A)长度:18碱基对
  (B)类型:核酸
  (C)股性:单链
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:78:GGAGACGCAG TCCATCGA 18(2)SEQ ID NO:79:
(i)序列特征:
  (A)长度:62碱基对
  (B)类型:核酸
  (C)股性:单链
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:79:GCAGCAGTTC TAGAATTATG TCNCCNGCNC CNCCNGCNTG TGACCTCCGA 50GTTCTCAGTA AA 62(2)SEQ ID NO:80:
(i)序列特征:
  (A)长度:49碱基对
  (B)类型:核酸
  (C)股性:单链
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:80:ACACTGGAGG CTCAAGAGTC ATTTGACGAA GCACTGAGGG TACAGGAAG 49(2)SEQ ID NO:81:
(i)序列特征:
  (A)长度:45碱基对
  (B)类型:核酸
  (C)股性:单链
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:81:CTAGAATTAT GAAAAAGAAT ATCGCATTTA TCGAAGGTCG TAGCC 45(2)SEQ ID NO:82:
(i)序列特征:
  (A)长度:38碱基对
  (B)类型:核酸
  (C)股性:单链
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:82:TTAATACTTT TTCTTATAGC GTAAATAGCT TCCAGCAT 38(2)SEQ ID NO:83:
(i)序列特征:
  (A)长度:45碱基对
  (B)类型:核酸
  (C)股性:单链
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:83:CTAGAATTAT GAAAAAGAAT ATCGCATTTC TTCTTAAACG TAGCC 45(2)SEQ ID NO:84:
(i)序列特征:
  (A)长度:38碱基对
  (B)类型:核酸
  (C)股性:单链
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:84:TTAATACTTT TTCTTATAGC GTAAAGAAGA ATTTGCAT 38(2)SEQ ID NO:85:
(i)序列特征:
  (A)长度:25个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:85:Met Lys Lys Asn Ile Ala Phe Leu Leu Asn Ala Tyr Ala Ser Pro1               5                   10                  15Ala Pro Pro Ala Cys Cys Val Arg Arg Ala
            20                  25(2)SEQ ID NO:86:
(i)序列特征:
  (A)长度:31个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:86:Met Lys Lys Asn Ile Ala Phe His His His His His His His His1               5                   10                  15Ile Glu Gly Arg Ser Pro Ala Pro Pro Ala Cys Cys Val Arg Arg
            20                  25                  30Ala31(2)SEQ ID NO:87:
(i)序列特征:
  (A)长度:31个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:87:Met Lys Lys Asn Ile Ala Phe His His His His His His His His1               5                   10                  15Ile Glu Pro Arg Ser Pro Ala Pro Pro Ala Cys Cys Val Arg Arg
            20                  25                  30Ala31(2)SEQ ID NO:88:
(i)序列特征:
  (A)长度:7个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:88:Thr Thr Ala His Lys Asp Pro1               5       7(2)SEQ ID NO:89:
(i)序列特征:
  (A)长度:4个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:89:His Val Leu His1           4(2)SEQ ID NO:90:
(i)序列特征:
  (A)长度:4个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:90:Ser Arg Leu Ser1           4(2)SEQ ID NO:91:
(i)序列特征:
  (A)长度:4个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:91:Ser His Val Leu1           4(2)SEQ ID NO:92:
(i)序列特征:
  (A)长度:4个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:92:His Ser Arg Leu1           4(2)SEQ ID NO:93:
(i)序列特征:
  (A)长度:4个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:93:Ala Val Asp Phe1          4(2)SEQ ID NO:94:
(i)序列特征:
  (A)长度:4个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:94:Ser Leu Gly Glu1           4(2)SEQ ID NO:95:
(i)序列特征:
  (A)长度:4个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:95:Ala Val Thr Leu1           4(2)SEQ ID NO:96:
(i)序列特征:
  (A)长度:4个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:96:Leu Leu Glu Gly1           4(2)SEQ ID NO:97:
(i)序列特征:
  (A)长度:4个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:97:Leu Ser Ser Leu1           4(2)SEQ ID NO:98:
(i)序列特征:
  (A)长度:4个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:98:Leu Gly Gln Leu1           4(2)SEQ ID NO:99:
(i)序列特征:
  (A)长度:5个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:99:Cys Xaa Leu Ser Ser1               5(2)SEQ ID NO:100:
(i)序列特征:
  (A)长度:4个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:100:Leu Leu Gly Gln1           4(2)SEQ ID NO:101:
(i)序列特征:
  (A)长度:4个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:101:Ser Ser Leu Leu1           4(2)SEQ ID NO:102:
(i)序列特征:
  (A)长度:4个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:102:Gly Gln Leu Ser1           4(2)SEQ ID NO:103:
(i)序列特征:
  (A)长度:4个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:103:Cys Leu Ser Ser1           4(2)SEQ ID NO:104:
(i)序列特征:
  (A)长度:4个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:104:Leu Gln Ser Leu1           4(2)SEQ ID NO:105:
(i)序列特征:
  (A)长度:4个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:105:Leu Gly Thr Gln1           4(2)SEQ ID NO:106:
(i)序列特征:
  (A)长度:4个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:106:Ala Leu Gln Ser1           4(2)SEQ ID NO:107:
(i)序列特征:
  (A)长度:4个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:107:Leu Leu Gly Thr1           4(2)SEQ ID NO:108:
(i)序列特征:
  (A)长度:4个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:108:Asn Ala Ile Phe1           4(2)SEQ ID NO:109:
(i)序列特征:
  (A)长度:4个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:109:Leu Ser Phe Gln1           4(2)SEQ ID NO:110:
(i)序列特征:
  (A)长度:22个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:110:Ser Pro Ala Pro Pro Ala Cys Asp Leu Arg Val Leu Ser Lys Leu1               5                   10                  15Leu Arg Asp Ser His Val Leu
            20      22(2)SEQ ID NO:111:
(i)序列特征:
  (A)长度:24个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:111:His Ser Arg Leu Ser Gln Cys Pro Glu Val His Pro Leu Pro Thr1               5                   10                  15Pro Val Leu Leu Pro Ala Val Asp Phe
            20              24(2)SEQ ID NO:112:
(i)序列特征:
  (A)长度:23个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:112:Ser Leu Gly Glu Trp Lys Thr Gln Met Glu Glu Thr Lys Ala Gln1               5                   10                  15Asp Ile Leu Gly Ala Val Thr Leu
            20          23(2)SEQ ID NO:113:
(i)序列特征:
  (A)长度:21个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:113:Leu Leu Glu Gly Val Met Ala Ala Arg Gly Gln Leu Gly Pro Thr1               5                   10                  15Cys Leu Ser Ser Leu Leu
            20  21(2)SEQ ID NO:114:
(i)序列特征:
  (A)长度:16个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:114:Gly Gln Leu Ser Gly Gln Val Arg Leu Leu Leu Gly Ala Leu Gln1               5                   10                  15Ser16(2)SEQ ID NO:115:
(i)序列特征:
  (A)长度:22个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:115:Leu Leu Gly Thr Gln Leu Pro Pro Gln Gly Arg Thr Thr Ala His1               5                   10                  15Lys Asp Pro Asn Ala Ile Phe
            20      22(2)SEQ ID NO:116:
(i)序列特征:
  (A)长度:25个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:116:Leu Ser Phe Gln His Leu Leu Arg Gly Lys Val Arg Phe Leu Met1               5                   10                  15Leu Val Gly Gly Ser Thr Leu Cys Val Arg
            20                  25(2)SEQ ID NO:117:
(i)序列特征:
  (A)长度:4个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:117:Met Pro Pro Ala1           4(2)SEQ ID NO:118:
(i)序列特征:
  (A)长度:5个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:118:Met Ala Pro Pro Ala1               5(2)SEQ ID NO:119:
(i)序列特征:
  (A)长度:6个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:119:Met Pro Ala Pro Pro Ala1               5   6(2)SEQ ID NO:120:
(i)序列特征:
  (A)长度:7个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:120:Met Ser Pro Ala Pro Pro Ala1               5       7(2)SEQ ID NO:121:
(i)序列特征:
  (A)长度:4个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:121:Ala Pro Pro Ala1           4(2)SEQ ID NO:122:
(i)序列特征:
  (A)长度:5个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:122:Pro Ala Pro Pro Ala1               5(2)SEQ ID NO:123:
(i)序列特征:
  (A)长度:6个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:123:Ser Pro Ala Pro Pro Ala1               5    6(2)SEQ ID NO:124:
(i)序列特征:
  (A)长度:4个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:124:Val Arg Arg Ala1           4(2)SEQ ID NO:125:
(i)序列特征:
  (A)长度:5个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:125:Val Arg Arg Ala Pro1               5(2)SEQ ID NO:126:
(i)序列特征:
  (A)长度:6个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:126:Val Arg Arg Ala Pro Pro1               5   6(2)SEQ ID NO:127:
(i)序列特征:
  (A)长度:7个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:127:Val Arg Arg Ala Pro Pro Thr1               5       7(2)SEQ ID NO:128:
(i)序列特征:
  (A)长度:8个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:128:Val Arg Arg Ala Pro Pro Thr Thr1               5           8(2)SEQ ID NO:129:
(i)序列特征:
  (A)长度:9个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:129:Val Arg Arg Ala Pro Pro Thr Thr Ala1               5               9(2)SEQ ID NO:130:
(i)序列特征:
  (A)长度:10个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:130:Val Arg Arg Ala Pro Pro Thr Thr Ala Val1               5                   10(2)SEQ ID NO:131:
(i)序列特征:
  (A)长度:11个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:131:Val Arg Arg Ala Pro Pro Thr Thr Ala Val Pro1               5                   10  11(2)SEQ ID NO:132:
(i)序列特征:
  (A)长度:12个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:132:Val Arg Arg Ala Pro Pro Thr Thr Ala Val Pro Ser1               5                   10      12(2)SEQ ID NO:133:
(i)序列特征:
  (A)长度:13个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:133:Val Arg Arg Ala Pro Pro Thr Thr Ala Val Pro Ser Arg1               5                   10          13(2)SEQ ID NO:134:
(i)序列特征:
  (A)长度:14个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:134:Val Arg Arg Ala Pro Pro Thr Thr Ala Val Pro Ser Arg Thr1               5                   10              14(2)SEQ ID NO:135:
(i)序列特征:
  (A)长度:15个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:135:Val Arg Arg Ala Pro Pro Thr Thr Ala Val Pro Ser Arg Thr Ser1               5                   10                  15(2)SEQ ID NO:136:
(i)序列特征:
  (A)长度:16个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:136:Val Arg Arg Ara Pro Pro Thr Thr Ala Val Pro Ser Arg Thr Ser1               5                   10                  15Leu16(2)SEQ ID NO:137:
(i)序列特征:
  (A)长度:17个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:137:Val Arg Arg Ala Pro Pro Thr Thr Ala Val Pro Ser Arg Thr Ser1               5                   10                  15Leu Val
17(2)SEQ ID NO:138:
(i)序列特征:
  (A)长度:18个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:138:Val Arg Arg Ala Pro Pro Thr Thr Ala Val Pro Ser Arg Thr Ser1               5                   10                  15Leu Val Leu
    18(2)SEQ ID NO:139:
(i)序列特征:
  (A)长度:19个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:139:Val Arg Arg Ala Pro Pro Thr Thr Ala Val Pro Ser Arg Thr Ser1               5                   10                  15Leu Val Leu Thr
        19(2)SEQ ID NO:140:
(i)序列特征:
  (A)长度:20个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:140:Val Arg Arg Ala Pro Pro Thr Thr Ala Val Pro Ser Arg Thr Ser1               5                   10                  15Leu Val Leu Thr Leu
            20(2)SEQ ID NO:141:
(i)序列特征:
  (A)长度:21个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:141:Val Arg Arg Ala Pro Pro Thr Thr Ala Val Pro Ser Arg Thr Ser1               5                   10                  15Leu Val Leu Thr Leu Asn
            20  21(2)SEQ ID NO:142:
(i)序列特征:
  (A)长度:22个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:142:Val Arg Arg Ala Pro Pro Thr Thr Ala Val Pro Ser Arg Thr Ser1               5                   10                  15Leu Val Leu Thr Leu Asn Glu
            20      22(2)SEQ ID NO:143:
(i)序列特征:
  (A)长度:23个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:143:Val Arg Arg Ala Pro Pro Thr Thr Ala Val Pro Ser Arg Thr Ser1               5                   10                  15Leu Val Leu Thr Leu Asn Glu Leu
            20          23(2)SEQ ID NO:144:
(i)序列特征:
  (A)长度:24个氨基酸
  (B)类型:氨基酸
  (D)拓扑结构:线性
(xi)序列描述:SEQ ID NO:144:Val Arg Arg Ala Pro Pro Thr Thr Ala Val Pro Ser Arg Thr Ser1               5                   10                  15Leu Val Leu Thr Leu Asn Glu Leu Pro
            20              24

Claims (39)

1.一种分离的、基本均一的mpl配体多肽。
2.如权利要求1所述的mpl配体多肽,其特征在于,它选自下组:(a)片段多肽;(b)变异多肽;和(c)嵌合多肽。
3.如权利要求1所述的mpl配体多肽,其特征在于,它选自下组:(a)从哺乳动物分离出的多肽;(b)通过重组手段制得的多肽;和(c)通过合成手段制得的多肽。
4.如权利要求1所述的mpl配体多肽,其特征在于,它选自下组:(a)人的多肽;和(b)人的非免疫原性多肽。
5.一种分离的、基本均一的mpl激动剂,其特征在于,(a)该激动剂刺激标记的核苷(3H-胸苷)掺入用人mplP转染的、IL-3依赖型Ba/F3细胞的DNA中;或(b)该激动剂在血小板回跳测定中刺激35S掺入循环的血小板。
6.如权利要求2所述的片段多肽,其特征在于,该片段多肽由以下结构式表示:
             X-hTPO(7-151)-Y
其中的hTPO(7-151)表示人TPO(hML)中Cys7至Cys151之间的氨基酸序列(包括首尾);
X表示Cys7的氨基或选自下组的氨基-末端氨基酸残基M,MA,MPA,MPPA,(SEQ ID NO:117)MAPPA,(SEQ ID NO:118)MPAPPA,(SEQ ID NO:119)MSPAPPA,(SEQ ID NO:120)A,PA,PPA,APPA,(SEQ ID NO:121)PAPPA,(SEQ ID NO:122)SPAPPA,(SEQ ID NO:123)Y表示Cys151的羧基端基团或选自下组的羧基-末端氨基酸残基:V,VR,VRR,VRRA,(SEQ ID NO:124)VRRAP,(SEQ ID NO:125)VRRAPP,(SEQ ID NO:126)VRRAPPT,(SEQ ID NO:127)VRRAPPTT,(SEQ ID NO:128)VRRAPPTTA,(SEQ ID NO:129)VRRAPPTTAV,(SEQ ID NO:130)VRRAPPTTAVP,(SEQ ID NO:131)VRRAPPTTAVPS,(SEQ ID NO:132)VRRAPPTTAVPSR,(SEQ ID NO:133)VRRAPPTTAVPSRT,(SEQ ID NO:134)VRRAPPTTAVPSRTS,(SEQ ID NO:135)VRRAPPTTAVPSRTSL,(SEQ ID NO:136)VRRAPPTTAVPSRTSLV,(SEQ ID NO:137)VRRAPPTTAVPSRTSLVL,(SEQ ID NO:138)VRRAPPTTAVPSRTSLVLT,(SEQ ID NO:139)VRRAPPTTAVPSRTSLVLTL,(SEQ ID NO:140)VRRAPPTTAVPSRTSLVLTLN,(SEQ ID NO:141)VRRAPPTTAVPSRTSLVLTLNE,(SEQ ID NO:142)VRRAPPTTAVPSRTSLVLTLNEL,(SEQ ID NO:143)VRRAPPTTAVPSRTSLVLTLNELP,(SEQ ID NO:144)氨基-末端氨基酸残基延伸物含有图1所示的人ML(SEQ ID NO:1)及其聚合化形式的残基176-332中的一个或多个。
7.如权利要求6所述的片段多肽,其特征在于,该多肽选自TPO(1-153)和TPO(1-245)组成的组。
8.如权利要求2所述的片段多肽,其特征在于,该片段多肽的氨基酸序列含有SPAPPACDLRVLSKLLRDSHVL,(SEQ ID NO:110)HSRLSQCPEVHPLPTPVLLPAVDF,(SEQ ID NO:111)SLGEWKTQMEETKAQDILGAVTL,(SEQ ID NO:112)LLEGVMAARGQLGPTCLSSLL,(SEQ ID NO:113)GQLSGQVRLLLGALQS,(SEQ ID NO:114)LLGTQLPPQGRTTAHKDPNAIF,(SEQ ID NO:115)LSFQHLLRGKVRFLMLVGGSTLCVR,(SEQ ID NO:116)及其组合。
9.如权利要求6所述的多肽,其特征在于,该多肽是未糖基化的。
10.一种分离的多肽,它由核酸编码,其特征在于,该核酸具有能在中度严紧条件下与具有图1所示核酸序列(SEQ ID NO:2)的核酸分子杂交的序列。
11.如权利要求11所述的多肽,其特征在于,它具有生物活性。
12.如权利要求1所述的多肽,其特征在于,它选自下组:hML、hML153、hML(R153A、R154A)、hML2、hML3、hML4、mML、mML2、mML3、pML和pML2。
13.如权利要求2所述的多肽,其特征在于,多肽的氨基酸序列含有图1(SEQ ID NO:1)中的氨基酸残基1至X,其中X选自下组:153、155、164、174、191、205、207、217、229、245和332。
14.一种分离的、基本均一的mpl配体多肽,其特征在于,它与权利要求13所述的多肽至少有80%序列相同。
15.如权利要求13所述的多肽,其特征在于,X为153。
16.一种嵌合体,其特征在于,它含有与异源多肽融合的权利要求13所述的mpl配体。
17.如权利要求16所述的嵌合体,其特征在于,异源多肽是免疫球蛋白多肽。
18.如权利要求16所述的嵌合体,其特征在于,异源多肽是白细胞介素多肽。
19.一种嵌合体,其特征在于,它含有hML的N末端残基1至约153-157,并被一个或多个但不包括全部的人EPO残基取代,其中在对应于图10所示的排列中位置处加入或取代入hML的N-末端残基。
20.一种能够与权利要求13所述的mpl配体多肽结合的抗体。
21.一种产生权利要求20所述的抗体的杂交瘤细胞系。
22.一种分离的、编码权利要求1所述的mpl配体多肽的核酸分子。
23.一种分离的、编码权利要求13所述的mpl配体多肽的核酸分子。
24.一种分离的核酸分子,其特征在于,含有图1所示的开放读框核酸序列(SEQ ID NO:2)。
25.如权利要求24所述的分离的核酸分子,其特征在于,它编码选自下组的mpl配体多肽:hML、hML153、hML(R153AR154A)、hML2、hML3、hML4、mML、mML2、mML3、pML和pML2。
26.一种分离的核酸分子,其特征在于,该分子选自下组:(a)含有mpl配体基因编码区域核苷酸序列的cDNA克隆;(b)能在严紧条件下与(a)克隆杂交的DNA序列;(c)编码具有天然存在的mpl配体多肽生物性能的多肽的任何(a)和(b)DNA序列的基因变异体。
27.一种分离的DNA分子,其特征在于,它具有能够在中度严紧条件下与图1所示DNA序列(SEQ ID NO:2)杂交的序列,而且该DNA分子编码具有生物活性的mpl配体多肽。
28.如权利要求25所述的核酸分子,其特征在于,还含有可操作地连于核酸分子的启动子。
29.一种表达载体,其特征在于,它含有权利要求25所述的核酸序列,该序列可操作地连于被该载体转化的宿主细胞所识别的调控序列。
30.用权利要求29所述的载体转化的宿主细胞。
31.一种用编码mpl配体多肽的核酸分子以产生mpl配体多肽的方法,其特征在于,培养权利要求30所述的宿主细胞。
32.如权利要求31所述的方法,其特征在于,从宿主细胞中回收该mpl配体多肽。
33.如权利要求31所述的方法,其特征在于,从宿主细胞培养基中回收该mpl配体多肽。
34.一种确定mpl配体多肽存在的方法,其特征在于,包括用编码mpl配体多肽的DNA与测试样品核酸进行杂交,以及确定mpl配体多肽DNA的存在。
35.一种扩增核酸测试样品的方法,其特征在于,用编码mpl配体多肽的核酸引发核酸聚合酶链反应。
36.一种组合物,其特征在于,含有权利要求1所述的mpl配体多肽和药物上可接受的载体。
37.一种治疗患有或可能患有血小板减少的哺乳动物的方法,其特征在于,向需要治疗的哺乳动物施用有效治疗量的权利要求36所述的组合物。
38.如权利要求36所述的组合物,其特征在于,还含有有效治疗量的选自下组的试剂:细胞因子、集落刺激因子和白细胞介素。39.如权利要求38所述的组合物,其特征在于,该试剂选自:KL、LIF、G-CSF、GM-CSF、M-CSF、EPO、IL-1、IL-2、IL-3、IL-5、IL-6、IL-7、IL-8、IL-9和IL-11。
40.一种生物合成人mpl配体多肽的方法,该多肽具有一种人mpl配体多肽的氨基酸序列例如图1中所公开的序列,其特征在于,包括:(a)培养含有编码人mpl配体多肽的DNA分离物的宿主细胞培养物,(b)从培养物中回收人mpl配体多肽,和(c)纯化mpl配体多肽从而获得基本均一的、具有生物活性的人mpl配体多肽。
CNB941947513A 1994-01-03 1994-12-28 血小板生成素 Expired - Lifetime CN1134539C (zh)

Applications Claiming Priority (14)

Application Number Priority Date Filing Date Title
US17655394A 1994-01-03 1994-01-03
US08/176,553 1994-01-03
US18560794A 1994-01-21 1994-01-21
US08/185,607 1994-01-21
US08/196,689 US8357513B1 (en) 1994-01-03 1994-02-15 Nucleic acids encoding mpl ligand (thrombopoietin) and fragments thereof
US08/196,689 1994-02-15
US22326394A 1994-04-04 1994-04-04
US08/223,263 1994-04-04
US08/249,376 US8192955B1 (en) 1994-01-03 1994-05-25 Nucleic acids encoding MPL ligand (thrombopoietin), variants, and fragments thereof
US08/249,376 1994-05-25
US34865894A 1994-12-02 1994-12-02
US08/348,658 1994-12-02
US08/348,657 US6660256B1 (en) 1994-01-03 1994-12-02 Porcine mpl ligand
US08/348,657 1994-12-02

Publications (2)

Publication Number Publication Date
CN1141061A true CN1141061A (zh) 1997-01-22
CN1134539C CN1134539C (zh) 2004-01-14

Family

ID=27569151

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB941947513A Expired - Lifetime CN1134539C (zh) 1994-01-03 1994-12-28 血小板生成素

Country Status (28)

Country Link
EP (1) EP0738323A1 (zh)
JP (2) JPH09508262A (zh)
CN (1) CN1134539C (zh)
AU (1) AU704266B2 (zh)
BG (1) BG63639B1 (zh)
CA (1) CA2178482C (zh)
CZ (1) CZ296130B6 (zh)
DK (1) DK149194A (zh)
ES (1) ES2114786B1 (zh)
FI (1) FI121573B (zh)
FR (1) FR2714670B1 (zh)
GB (1) GB2285446B (zh)
HR (1) HRP941020A2 (zh)
HU (1) HUT75657A (zh)
IE (1) IE72517B1 (zh)
IL (1) IL112184A (zh)
IT (1) IT1283770B1 (zh)
LU (1) LU88573A1 (zh)
LV (1) LV11632B (zh)
NL (1) NL9500010A (zh)
NO (1) NO326903B1 (zh)
NZ (1) NZ278726A (zh)
PT (1) PT101627B (zh)
RO (1) RO117110B1 (zh)
SG (1) SG47030A1 (zh)
SI (1) SI9420079A (zh)
SK (1) SK282265B6 (zh)
WO (1) WO1995018858A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101343250B (zh) * 2000-05-25 2011-09-21 葛兰素史密斯克莱有限责任公司 血小板生成素模拟物
CN105101979A (zh) * 2012-12-21 2015-11-25 奥卡塔治疗公司 由多能干细胞制备血小板的方法及其组合物
WO2021052470A1 (zh) * 2019-09-20 2021-03-25 中美瑞康核酸技术(南通)研究院有限公司 用于治疗血小板减少症的核酸分子及其应用

Families Citing this family (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6270989B1 (en) * 1991-11-05 2001-08-07 Transkaryotic Therapies, Inc. Protein production and delivery
US5733761A (en) 1991-11-05 1998-03-31 Transkaryotic Therapies, Inc. Protein production and protein delivery
US5795569A (en) * 1994-03-31 1998-08-18 Amgen Inc. Mono-pegylated proteins that stimulate megakaryocyte growth and differentiation
WO1995026746A1 (en) * 1994-03-31 1995-10-12 Amgen Inc. Compositions and methods for stimulating megakaryocyte growth and differentiation
US5986049A (en) * 1994-12-30 1999-11-16 Zymogenetics, Inc. Purified thrombopoietin and method of making it
TW387940B (en) * 1995-01-17 2000-04-21 Kirin Brewery Anti-tpo monodonal antibody
EP0807181A1 (en) 1995-02-03 1997-11-19 G.D. Searle & Co. NOVEL c-MPL LIGANDS
US5696250A (en) * 1995-02-15 1997-12-09 Amgen Inc. DNA encoding megakaryocyte growth and development factor analogs
US5989538A (en) * 1995-02-15 1999-11-23 Amgen Inc. Mpl ligand analogs
CA2209298C (en) * 1995-02-15 2001-12-18 Amgen Inc. Mpl ligand analogs
TW434020B (en) * 1995-03-15 2001-05-16 Kirin Brewery Methods for preventing adsorption of thrombopoietin (TPO), and stable top-containing compositions
TW434021B (en) * 1995-03-15 2001-05-16 Kirin Brewery Methods for preventing adsorption of thrombopoietin (TPO), and stable TPO-containing compositions
ZA964382B (en) * 1995-06-06 1997-12-01 Genentech Inc Lymphotoxin and thrombopoietin for use in the treatment of cancer.
US5869451A (en) * 1995-06-07 1999-02-09 Glaxo Group Limited Peptides and compounds that bind to a receptor
EP1961760A3 (en) * 1995-06-07 2008-09-03 Glaxo Group Limited Peptides and compounds that bind to a thrombopoietin receptor
US6251864B1 (en) 1995-06-07 2001-06-26 Glaxo Group Limited Peptides and compounds that bind to a receptor
TW497972B (en) * 1995-06-08 2002-08-11 Kirin Brewery Stable thrombopoietin (TPO)-containing lyophilized compositions
US6066318A (en) * 1995-10-05 2000-05-23 G.D. Searle & Co. Multi-functional hematopoietic fusion proteins between sequence rearranged C-MPL receptor agonists and other hematopoietic factors
US6031071A (en) * 1996-01-24 2000-02-29 Biophage, Inc. Methods of generating novel peptides
US5879673A (en) * 1996-01-25 1999-03-09 Genentech, Inc. Administration of thrombopoietin on a single day only
US7091311B2 (en) 1996-06-07 2006-08-15 Smithkline Beecham Corporation Peptides and compounds that bind to a receptor
WO1998006849A1 (en) * 1996-08-13 1998-02-19 Zymogenetics, Inc. Expression vectors, cells, and methods for preparing thrombopoietin polypeptides
AU7589898A (en) * 1997-05-21 1998-12-11 Genentech Inc. Novel administration of thrombopoietin
US5980893A (en) * 1997-07-17 1999-11-09 Beth Israel Deaconess Medical Center, Inc. Agonist murine monoclonal antibody as a stimulant for megakaryocytopoiesis
US6342220B1 (en) 1997-08-25 2002-01-29 Genentech, Inc. Agonist antibodies
KR20000006549A (ko) * 1998-06-30 2000-01-25 윤재승 생체내혈소판증식효능이향상된신규한트롬보포이에틴유도체
US20030228666A1 (en) 1998-06-30 2003-12-11 Daewoong Pharmaceutical Co., Ltd. Novel human thrombopoietin mutein
US6660843B1 (en) 1998-10-23 2003-12-09 Amgen Inc. Modified peptides as therapeutic agents
AU773891C (en) 1998-10-23 2005-02-17 Kirin-Amgen Inc. Dimeric thrombopoietin peptide mimetics binding to MP1 receptor and having thrombopoietic activity
UY26317A1 (es) * 2000-08-30 2000-10-31 Alfonso Cayota Carlos Pritsch Sistema de produccion de trombopoyetina humana por celulas de mamiferos en cultivo
US6673580B2 (en) 2000-10-27 2004-01-06 Genentech, Inc. Identification and modification of immunodominant epitopes in polypeptides
US7332474B2 (en) 2001-10-11 2008-02-19 Amgen Inc. Peptides and related compounds having thrombopoietic activity
EP1452093A4 (en) 2001-11-15 2007-08-15 Kirin Brewery CHIMERIC ANIMALS
KR100467750B1 (ko) * 2001-11-29 2005-01-24 씨제이 주식회사 생체내 에리스로포이에틴 활성이 증진된 융합단백질
US20030191056A1 (en) 2002-04-04 2003-10-09 Kenneth Walker Use of transthyretin peptide/protein fusions to increase the serum half-life of pharmacologically active peptides/proteins
DK1542714T3 (da) 2002-09-18 2014-05-26 Janssen Pharmaceuticals Inc Fremgangsmåder til forøgelse af produktion af blodplader og hæmatopoietiske stamceller
US7723295B2 (en) 2003-08-28 2010-05-25 Ortho-Mcneil Pharmaceutical, Inc. Peptides and compounds that bind to a receptor
CN102241742B (zh) 2003-08-28 2014-04-02 奥索-麦克尼尔药品公司 结合血小板生成素受体的肽和化合物
WO2005116231A1 (en) 2004-05-18 2005-12-08 Intrexon Corporation Methods for dynamic vector assembly of dna cloning vector plasmids
MX2007000216A (es) 2004-07-08 2007-03-15 Amgen Inc Peptidos terapeuticos.
US8008453B2 (en) 2005-08-12 2011-08-30 Amgen Inc. Modified Fc molecules
WO2007102946A2 (en) 2006-01-23 2007-09-13 Amgen Inc. Crystalline polypeptides
WO2007098547A1 (en) * 2006-03-01 2007-09-07 Apollo Life Sciences Limited A molecule and chimeric molecules thereof
US7981425B2 (en) 2006-06-19 2011-07-19 Amgen Inc. Thrombopoietic compounds
US8173427B2 (en) 2006-07-24 2012-05-08 The University Of Queensland Method of producing a population of post-mitotic cells of the neutrophil lineage
TW200902708A (en) 2007-04-23 2009-01-16 Wyeth Corp Methods of protein production using anti-senescence compounds
AU2008262490B2 (en) 2007-05-22 2011-11-17 Amgen Inc. Compositions and methods for producing bioactive fusion proteins
EP2390261A4 (en) 2009-01-20 2012-11-14 Hanall Biopharma Co Ltd MODIFIED HUMAN THROMBOPOIETIN POLYPEPTIDE FRAGMENT AND METHOD FOR THE PRODUCTION THEREOF
WO2014089478A1 (en) * 2012-12-07 2014-06-12 University Of Tennessee Research Foundation Methods of numerical analysis for platelet disorders and computer-readable media and systems for performing the same
CN103555760B (zh) * 2013-10-18 2015-05-20 江苏康禾生物制药有限公司 一种重组人血小板生成素的制备方法及其制剂
RU2694064C1 (ru) * 2015-12-21 2019-07-09 Браинон Инк. Композиция для улучшения памяти, способности к обучению и когнитивных способностей
GB201700621D0 (en) 2017-01-13 2017-03-01 Guest Ryan Dominic Method,device and kit for the aseptic isolation,enrichment and stabilsation of cells from mammalian solid tissue
MX2022007598A (es) 2019-12-20 2022-09-23 Instil Bio Uk Ltd Dispositivos y métodos para el aislamiento de linfocitos infiltrantes de tumores y usos de los mismos.

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5260417A (en) 1989-04-03 1993-11-09 Genetics Institute, Inc. Megakaryocyte growth promoting activity protein
WO1990012877A1 (en) * 1989-04-19 1990-11-01 Cetus Corporation Multifunctional m-csf proteins and genes encoding therefor
US5223408A (en) * 1991-07-11 1993-06-29 Genentech, Inc. Method for making variant secreted proteins with altered properties
DK0616645T3 (da) * 1991-12-06 2001-10-08 Genentech Inc Prohormonconvertasetransformerede celler
IL139335A (en) 1994-01-03 2005-08-31 Genentech Inc Mpl ligand polypeptides, nucleic acids encoding them, vectors and host cells comprising such nucleic acids, processes for producing such polypeptides pharmaceutical compositions containing them and use thereof in the preparation of medicaments for treating thrombocytopenia

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101343250B (zh) * 2000-05-25 2011-09-21 葛兰素史密斯克莱有限责任公司 血小板生成素模拟物
CN105101979A (zh) * 2012-12-21 2015-11-25 奥卡塔治疗公司 由多能干细胞制备血小板的方法及其组合物
US11400118B2 (en) 2012-12-21 2022-08-02 Astellas Institute For Regenerative Medicine Methods for production of platelets from pluripotent stem cells and compositions thereof
US12076347B2 (en) 2012-12-21 2024-09-03 Astellas Institute For Regenerative Medicine Methods for production of platelets from pluripotent stem cells and compositions thereof
WO2021052470A1 (zh) * 2019-09-20 2021-03-25 中美瑞康核酸技术(南通)研究院有限公司 用于治疗血小板减少症的核酸分子及其应用

Also Published As

Publication number Publication date
SG47030A1 (en) 1998-03-20
NO962783L (no) 1996-09-03
JPH09508262A (ja) 1997-08-26
NO962783D0 (no) 1996-07-02
IL112184A (en) 2004-07-25
RO117110B1 (ro) 2001-10-30
SI9420079A (en) 1997-02-28
NO326903B1 (no) 2009-03-16
FR2714670A1 (fr) 1995-07-07
ES2114786B1 (es) 1999-01-01
CA2178482A1 (en) 1995-07-13
GB2285446A (en) 1995-07-12
LU88573A1 (de) 1995-06-01
GB2285446B (en) 1999-07-28
SK282265B6 (sk) 2001-12-03
SK87596A3 (en) 1997-11-05
LV11632A (lv) 1996-12-20
PT101627B (pt) 1996-11-29
NZ278726A (en) 1998-06-26
HUT75657A (en) 1997-05-28
IE72517B1 (en) 1997-04-23
ITTO950002A1 (it) 1995-07-03
HRP941020A2 (en) 1997-04-30
EP0738323A1 (en) 1996-10-23
IE950002A1 (en) 1995-07-12
DK149194A (da) 1995-07-04
ES2114786A1 (es) 1998-06-01
IL112184A0 (en) 1995-03-15
PT101627A (pt) 1995-11-30
CZ296130B6 (cs) 2006-01-11
AU1514695A (en) 1995-08-01
BG100693A (en) 1998-01-30
BG63639B1 (bg) 2002-07-31
HU9601805D0 (en) 1996-08-28
CA2178482C (en) 2012-01-03
CN1134539C (zh) 2004-01-14
LV11632B (en) 1997-04-20
FI962723A (fi) 1996-09-03
GB9425831D0 (en) 1995-02-22
ITTO950002A0 (it) 1995-01-02
CZ192296A3 (en) 1997-05-14
FI121573B (fi) 2011-01-14
FI962723A0 (fi) 1996-07-02
JPH10113186A (ja) 1998-05-06
FR2714670B1 (fr) 1997-01-10
NL9500010A (nl) 1995-08-01
WO1995018858A1 (en) 1995-07-13
IT1283770B1 (it) 1998-04-30
AU704266B2 (en) 1999-04-15

Similar Documents

Publication Publication Date Title
CN1134539C (zh) 血小板生成素
JP7495385B2 (ja) 生体関連の直交性サイトカイン/受容体ペア
CN1823088A (zh) 结合红细胞生成素受体的新肽
CN1192748A (zh) 与红细胞生成素受体结合的化合物和肽
US6287784B1 (en) Kinase receptor activation assay
CN1153780C (zh) 具有血小板生成素活性的蛋白质
AU749175B2 (en) Thrombopoietin
AU782245B2 (en) Thrombopoietin
PL180765B1 (pl) Polipeptyd ligandu mpl, cząsteczka kwasu nukleinowego kodująca polipeptyd ligandu mpl, wektor ekspresyjny, transformowana komórka gospodarza, sposób otrzymywania przeciwciał, sposób otrzymywania polipeptydu ligandu mpl, sposób biosyntezy ludzkiego polipeptydu ligandu mpl, sposób określania obecności genu polipeptydu ligandu mpl oraz kompozycja
KR100607613B1 (ko) 트롬보포이에틴
Freeburn A study of the granulocyte-macrophage colony stimulating factor receptor (GM-CSFR) in leukaemia
Read Production and function of a soluble c-Kit molecule
SA95150635B1 (ar) ثرومبوبواييتين thrombopoietin (عامل مولد للصفائح الدموية )

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CX01 Expiry of patent term

Expiration termination date: 20141228

Granted publication date: 20040114